[go: up one dir, main page]

CN110092835A - 一种glp-1类似物-col3a1融合蛋白 - Google Patents

一种glp-1类似物-col3a1融合蛋白 Download PDF

Info

Publication number
CN110092835A
CN110092835A CN201810089639.XA CN201810089639A CN110092835A CN 110092835 A CN110092835 A CN 110092835A CN 201810089639 A CN201810089639 A CN 201810089639A CN 110092835 A CN110092835 A CN 110092835A
Authority
CN
China
Prior art keywords
gly
pro
ala
glu
ser
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
CN201810089639.XA
Other languages
English (en)
Inventor
陈国友
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shanghai Huidun Yintai Biotechnology Co ltd
Original Assignee
SHANGHAI HUIDUN BIOTECHNOLOGY Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by SHANGHAI HUIDUN BIOTECHNOLOGY Co Ltd filed Critical SHANGHAI HUIDUN BIOTECHNOLOGY Co Ltd
Priority to CN201810089639.XA priority Critical patent/CN110092835A/zh
Publication of CN110092835A publication Critical patent/CN110092835A/zh
Withdrawn legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/575Hormones
    • C07K14/605Glucagons
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/78Connective tissue peptides, e.g. collagen, elastin, laminin, fibronectin, vitronectin or cold insoluble globulin [CIG]
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K38/00Medicinal preparations containing peptides
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide

Landscapes

  • Health & Medical Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Biophysics (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Zoology (AREA)
  • Biochemistry (AREA)
  • Toxicology (AREA)
  • General Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Medicinal Chemistry (AREA)
  • Molecular Biology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Endocrinology (AREA)
  • Peptides Or Proteins (AREA)

Abstract

本发明涉及一种GLP‑1类似物‑COL3A1融合蛋白。具体地,所述融合蛋白包含胰高血糖素样肽1类似物和的人Ⅲ型胶原α1链的融合蛋白,所述融合蛋白具有胰高血糖素样肽1的降低血糖作用,并具有延长的体内半衰期。

Description

一种GLP-1类似物-COL3A1融合蛋白
技术领域
本发明涉及医药领域,具体地涉及一种GLP-1类似物-COL3A1融合蛋白。
背景技术
糖尿病是一种严重的慢性疾病,主要是由高血糖和内源性胰岛素的分泌不足和功能丧失导致。糖尿病会引起多种并发症,比如血管系统、肾脏、视网膜、晶状体、周围神经和皮肤等,进而影响寿命和生活质量。随着世界各国社会经济的发展和居民生活水平的提高,糖尿病的发病率及患病率逐年上升,糖尿病已经成为继肿瘤、心脑血管疾病之后第三位严重危害人类健康的慢性疾病。糖尿病基本分为四类,包括:Ⅰ型(胰岛素依赖型)、Ⅱ型(非胰岛素依赖型)、其他型和妊娠糖尿病。其中,Ⅱ型糖尿病是目前最常见的糖尿病,约占糖尿病患者的90%。Ⅱ型糖尿病是一种病因复杂、以血糖升高为特征的代谢性疾病,中国Ⅱ型糖尿病患者在过去二十多年中呈爆炸式增长。
目前Ⅱ型糖尿病的治疗主要以口服降糖药为主,有磺脲类物如格列本、格列齐特、二甲双胍和胰岛素等。但是长期使用这些药物治疗会产生耐受,无法长期控制血糖和细胞功能的紊乱。因此,研发一种更加安全、有效针对糖尿病发病机制的新型药物尤为重要。
胰高血糖素样肽1(GLP-1)是由位于胃肠道黏膜L细胞分泌的一种肠促胰素,GLP-1的分泌是血糖依赖性的,即当血糖浓度高于正常时,GLP-1呈现促胰岛素分泌作用,而当血糖浓度正常时,GLP-1的促胰岛素分泌作用减弱,因此外源性GLP-1治疗不会增加低血糖风险。此外,GLP-1通过与胰岛α细胞的受体结合,增加胰岛素分泌和生物合成,有效的降低血糖;促进胰岛β细胞增殖、抑制其调凋亡,增加葡萄糖依赖性的胰岛素分泌;能够减弱胃肠道蠕动,延缓胃排空,减少食物摄入;作用于下丘脑,降低食欲,从而减轻体重。基于以上特点,GLP-1已经成为新型Ⅱ型糖尿病治疗药物的开发热点。
天然的GLP-1在体内极不稳定,释放后很容易二肽基肽酶4(DPP-4)快速降解,其在体内的半衰期仅为1~2min,不具备成药性。2005年国际上第一个GLP-1受体激动剂药物艾塞那肽上市,它是一种来源于蜥蜴唾液的GLP-1类似物,与人GLP-1具有50%的同源性。稍后上市的利拉鲁肽,是人工合成的GLP-1类似物,与人GLP-1具有97%的同源性,因此其有效性提升的同时其副作用相比艾塞那肽大大降低。但利拉鲁肽与艾塞那肽一样,都需要每日皮下注射给药,在药物的易用性方面仍存在一定劣势,因此对GLP-1进行结构修饰,在保留其生物学效应的同时延长其体内半衰期已经成为GLP-1药物的研发方向。而与人免疫球蛋白IgG Fc部分结合的人源GLP-1改构体度拉糖肽,利用了IgG长循环半衰期的特点,在效果不劣于利拉鲁肽的同时,可以达到一周一次给药,是目前同类产品中最理想的产品。但是度拉糖肽中的IgG的Fc段可能具有ADCC(Antibody-Dependent Cell Cytotoxicity,抗体依赖细胞介导的细胞毒性作用)作用,具有潜在的免疫原性及副反应。
因此,本领域亟需开发一种新型、安全、并能长期有效治疗糖尿病的药物。
发明内容
本发明的目的是提供一种新型、安全、并能长期有效治疗糖尿病的药物。
本发明的第一方面,提供了一种融合蛋白,所述融合蛋白的结构如下式I所示:
A-L-B (I)
式中,A为GLP-1类似物,B为人Ⅲ型胶原α1链,L为无或连接肽,各“-”独立地为连接肽或肽键;且
所述GLP-1类似物具有SEQ ID NO.:1所示氨基酸序列的多肽,
His-Xaa8-Glu-Gly-Thr-Phe-Thr-Ser-Asp-Val-Ser-Ser-Tyr-Leu-Glu-Xaa22-Gln-Ala-Ala-Lys-Glu-Phe-Ile-Ala-Trp-Leu-Val-Lys-Gly-Arg-Xaa37
其中Xaa8是Gly或Ala,Xaa22是Glu或Gly,Xaa37是Gly或无。
在另一优选例中,所述GLP-1类似物在对应于SEQ ID NO.:6所示的序列中存在选自下组的氨基酸突变:第2位甘氨酸(Ala)、第16位甘氨酸(Gly)、第31位甘氨酸(Gly)、或其组合。
在另一优选例中,所述GLP-1类似物在对应于SEQ ID NO.:6所示的序列中存在选自的突变:A2G、G16E、缺失G31、或其组合。
在另一优选例中,所述GLP-1类似物除所述突变(如第2、16、31位氨基酸)外,其余氨基酸与SEQ ID NO.:6所示的序列相同或基本相同。
在另一优选例中,所述GLP-1类似物具有如SEQ ID NO.:6或12所示的氨基酸序列。
在另一优选例中,所述人Ⅲ型胶原α1链(即COL3A1)为COL3A1蛋白全长或片段,其中所述片段选自下组:COL3A1598-896片段、COL3A1733-896片段、或其组合。
在另一优选例中,所述COL3A1蛋白全长具有SEQ ID NO.:2所示的氨基酸序列。
在另一优选例中,所述COL3A1598-896片段为COL3A1蛋白中第598-896位氨基酸序列。
在另一优选例中,所述COL3A1598-896片段具有SEQ ID NO.:3所示的氨基酸序列。
在另一优选例中,所述COL3A1733-896片段为COL3A1蛋白中第733-896位氨基酸序列。
在另一优选例中,所述COL3A1733-896片段具有SEQ ID NO.:4所示的氨基酸序列。
在另一优选例中,所述人Ⅲ型胶原α1链具有SEQ ID NO.:2、3或4所示的氨基酸序列。
在另一优选例中,所述连接肽为具有n个重复的如SEQ ID NO.:5(Gly-Gly-Gly-Gly-Ser)所示的序列,并且其C端还连接有一个丙氨酸(Ala)的多肽,其中n为2-6,优选地n为2。
在另一优选例中,所述连接肽具有SEQ ID NO.:7所示的氨基酸序列。
在另一优选例中,所述融合蛋白具有SEQ ID NO.:8、9或13所示的氨基酸序列。
本发明的第二方面,提供了一种寡聚体,所述寡聚体包含本发明第一方面所述的融合蛋白。
在另一优选例中,所述寡聚体为二聚体、三聚体、四聚体或五聚体。
在另一优选例中,所述寡聚体为本发明第一方面所述的融合蛋白的二聚体。
本发明的第三方面,提供了一种分离的多核苷酸,所述多核苷酸编码本发明第一方面所述的融合蛋白。
在另一优选例中,所述GLP-1类似物的编码序列如SEQ ID NO.:10中第1-90位所示。
在另一优选例中,所述COL3A1598-896片段的编码序列如SEQ ID NO.:10中第139-1035位所示。
在另一优选例中,所述COL3A1733-896片段的编码序列如SEQ ID NO.:11中第139-630位所示。
在另一优选例中,所述多核苷酸具有如SEQ ID NO.:10或11所示的序列。
本发明的第四方面,提供了一种载体,所述载体包括本发明第三方面所述的多核苷酸。
在另一优选例中,所述的载体选自下组:DNA、RNA、质粒、慢病毒载体、腺病毒载体、逆转录病毒载体、转座子、或其组合。
在另一优选例中,所述载体为质粒,优选地pUC57质粒。
本发明的第五方面,提供了一种宿主细胞,所述的宿主细胞含有本发明第四方面所述的载体、或染色体中整合有外源的本发明第三方面所述的多核苷酸、或表达本发明第一方面所述的融合蛋白、或表达本发明第二方面所述的寡聚体。
在另一优选例中,所述宿主细胞为酵母,优选地毕赤酵母细胞,更优选地毕赤酵母细胞GS115。
本发明的第六方面,提供了一种药物组合物,所述药物组合物包括本发明第一方面所述的融合蛋白或本发明第二方面所述的寡聚体,以及药学上可接受的载体或赋形剂。
在另一优选例中,所述药物组合物用于治疗非胰岛素依赖型糖尿病或其相关疾病。
本发明的第七方面,提供了如本发明第一方面所述的融合蛋白、本发明第二方面所述的寡聚体、本发明第三方面所述的多核苷酸、本发明第四方面所述的载体、本发明第五方面所述的宿主细胞,用于制备预防和/或治疗糖尿病的药物或制剂。
在另一优选例中,所述糖尿病为非胰岛素依赖型糖尿病或其相关疾病。
在本发明的第八方面,提供了一种本发明第一方面所述的融合蛋白、本发明第二方面所述的寡聚体或本发明第六方面所述的药物组合物的用途,用于预防和/或治疗糖尿病,优选地非胰岛素依赖型糖尿病或其相关疾病。
本发明的第九方面,提供了一种治疗疾病的方法,包括给需要治疗的对象施用适量的本发明第一方面所述的融合蛋白、本发明第二方面所述的寡聚体或本发明第六方面所述的药物组合物。
在另一优选例中,所述疾病为非胰岛素依赖型糖尿病或其相关疾病。
应理解,在本发明范围内中,本发明的上述各技术特征和在下文(如实施例)中具体描述的各技术特征之间都可以互相组合,从而构成新的或优选的技术方案。限于篇幅,在此不再一一累述。
附图说明
图1显示了pPic9m-GLP-COL-1表达质粒的构建图。
图2显示了pPic9m-GLP-COL-2质粒结构图。
图3显示了纯化后GLP-1-2L-COL598-896及GLP-1-2L-COL733-896融合蛋白的电泳纯度分析结果。
图4显示了GLP-1-2L-COL598-896及GLP-1-2L-COL733-896融合蛋白的GLP-1R受体激活活性分析。
图5显示了GLP-1-2L-COL598-896及GLP-1-2L-COL733-896融合蛋白的体内半衰期分析结果。
具体实施方式
本发明人经过广泛而深入的研究,意外地获得了一种安全、长期有效治疗非胰岛素依赖型糖尿病的药物。所述药物是一种GLP-1类似物-COL3A1融合蛋白,包含胰高血糖素样肽1类似物和的人Ⅲ型胶原α1链的融合蛋白,所述融合蛋白具有胰高血糖素样肽1的降低血糖作用,并具有延长的体内半衰期。本发明还对胰高血糖素样肽1类似物进行了突变,降低GLP-1类似物对DPP-4水解的敏感性,活性提高,免疫原性降低。本发明还筛选出两种人COL3A1片段(SEQ ID NO.:3和SEQ ID NO.:4所示),保留了人COL3A1形成同源三聚体的能力同时有利于本发明中异源融合蛋白的重组表达,避免过长的氨基酸序列导致重组表达的困难。本发明融合蛋白质可用于治疗Ⅱ型糖尿病和各种相关状况。在此基础上,发明人完成了本发明。
融合蛋白
如本文所用,“本发明融合蛋白”、“重组融合蛋白”或“多肽”均指本发明第一方面所述的融合蛋白。本发明融合蛋白的结构如下式I所示:
A-L-B (I)
式中,A为GLP-1类似物,B为人Ⅲ型胶原α1链,L为无或连接肽,各“-”独立地为连接肽或肽键;且
所述GLP-1类似物具有SEQ ID NO.:1所示氨基酸序列的多肽,
His-Xaa8-Glu-Gly-Thr-Phe-Thr-Ser-Asp-Val-Ser-Ser-Tyr-Leu-Glu-Xaa22-Gln-Ala-Ala-Lys-Glu-Phe-Ile-Ala-Trp-Leu-Val-Lys-Gly-Arg-Xaa37
其中Xaa8是Gly或Ala,Xaa22是Glu或Gly,Xaa37是Gly或无。
如本文所用,术语“融合蛋白”还包括具有上述活性的、SEQ ID NO.:8、9或13序列的变异形式。这些变异形式包括(但并不限于):1-3个(通常为1-2个,更佳地1个)氨基酸的缺失、插入和/或取代,以及在C末端和/或N末端添加或缺失一个或数个(通常为3个以内,较佳地为2个以内,更佳地为1个以内)氨基酸。例如,在本领域中,用性能相近或相似的氨基酸进行取代时,通常不会改变蛋白质的功能。又比如,在C末端和/或N末端添加或缺失一个或数个氨基酸通常也不会改变蛋白质的结构和功能。此外,所述术语还包括单体和多聚体形式的本发明多肽。该术语还包括线性以及非线性的多肽(如环肽)。
本发明还包括上述融合蛋白的活性片段、衍生物和类似物。如本文所用,术语“片段”、“衍生物”和“类似物”是指基本上保持本发明融合蛋白的功能或活性的多肽。本发明的多肽片段、衍生物或类似物可以是(i)有一个或几个保守或非保守性氨基酸残基(优选保守性氨基酸残基)被取代的多肽,或(ii)在一个或多个氨基酸残基中具有取代基团的多肽,或(iii)抗原肽与另一个化合物(比如延长多肽半衰期的化合物,例如聚乙二醇)融合所形成的多肽,或(iv)附加的氨基酸序列融合于此多肽序列而形成的多肽(与前导序列、分泌序列或6His等标签序列融合而形成的融合蛋白)。根据本文的教导,这些片段、衍生物和类似物属于本领域熟练技术人员公知的范围。
一类优选的活性衍生物指与式I的氨基酸序列相比,有至多3个,较佳地至多2个,更佳地至多1个氨基酸被性质相似或相近的氨基酸所替换而形成多肽。这些保守性变异多肽最好根据表A进行氨基酸替换而产生。
表A
最初的残基 代表性的取代 优选的取代
Ala(A) Val;Leu;Ile Val
Arg(R) Lys;Gln;Asn Lys
Asn(N) Gln;His;Lys;Arg Gln
Asp(D) Glu Glu
Cys(C) Ser Ser
Gln(Q) Asn Asn
Glu(E) Asp Asp
Gly(G) Pro;Ala Ala
His(H) Asn;Gln;Lys;Arg Arg
Ile(I) Leu;Val;Met;Ala;Phe Leu
Leu(L) Ile;Val;Met;Ala;Phe Ile
Lys(K) Arg;Gln;Asn Arg
Met(M) Leu;Phe;Ile Leu
Phe(F) Leu;Val;Ile;Ala;Tyr Leu
Pro(P) Ala Ala
Ser(S) Thr Thr
Thr(T) Ser Ser
Trp(W) Tyr;Phe Tyr
Tyr(Y) Trp;Phe;Thr;Ser Phe
Val(V) Ile;Leu;Met;Phe;Ala Leu
本发明还提供本发明融合蛋白的类似物。这些类似物与SEQ ID NO.:8、9或13所示的多肽的差别可以是氨基酸序列上的差异,也可以是不影响序列的修饰形式上的差异,或者兼而有之。类似物还包括具有不同于天然L-氨基酸的残基(如D-氨基酸)的类似物,以及具有非天然存在的或合成的氨基酸(如β、γ-氨基酸)的类似物。应理解,本发明的多肽并不限于上述例举的代表性的多肽。
修饰(通常不改变一级结构)形式包括:体内或体外的多肽的化学衍生形式如乙酰化或羧基化。修饰还包括糖基化,如那些在多肽的合成和加工中或进一步加工步骤中进行糖基化修饰而产生的多肽。这种修饰可以通过将多肽暴露于进行糖基化的酶(如哺乳动物的糖基化酶或去糖基化酶)而完成。修饰形式还包括具有磷酸化氨基酸残基(如磷酸酪氨酸,磷酸丝氨酸,磷酸苏氨酸)的序列。还包括被修饰从而提高了其抗蛋白水解性能或优化了溶解性能的多肽。
本发明的化合物包括一种异源融合蛋白质,其中第一个多肽是GLP-1类似物,其序列选自SEQIDNO.:1,
His-Xaa8-Glu-Gly-Thr-Phe-Thr-Ser-Asp-Val-Ser-Ser-Tyr-Leu-Glu-Xaa22-Gln-Ala-Ala-Lys-Glu-Phe-Ile-Ala-Trp-Leu-Val-Lys-Gly-Arg-Xaa37
其中Xaa8是Gly或Ala;
其中Xaa22是Glu或Gly;
其中Xaa37是Gly或被去除。
第二个多肽是人Ⅲ型胶原α1链(即COL3A1)全长或片段,其序列选自
(a)全长COL3A1(SEQ ID NO.:2)
Met-Met-Ser-Phe-Val-Gln-Lys-Gly-Ser--Trp-Leu-Leu-Leu-Ala-Leu-Leu-His-Pro--Thr-Ile-Ile-Leu-Ala-Gln-Gln-Glu-Ala-Val-Glu-Gly-Gly-Cys-Ser-His-Leu-Gly-Gln-Ser--Tyr-Ala-Asp-Arg-Asp-Val--Trp-Lys-Pro-Glu-Pro-Cys-Gln-Ile-Cys-Val-Cys-Asp-Ser-Gly-Ser-Val-Leu-Cys-Asp-Asp-Ile-Ile-Cys-Asp-Asp-Gln-Glu-Leu-Asp-Cys-Pro-Asn-Pro-Glu-Ile-Pro-Phe-Gly-Glu-Cys-Cys-Ala-Val-Cys-Pro-Gln-Pro-Pro--Thr-Ala-Pro--Thr-Arg-Pro-Pro-Asn-Gly-Gln-Gly-Pro-Gln-Gly-Pro-Lys-Gly-Asp-Pro-Gly-Pro-Pro-Gly-Ile-Pro-Gly-Arg-Asn-Gly-Asp-Pro-Gly-Ile-Pro-Gly-Gln-Pro-Gly-Ser-Pro-Gly-Ser-Pro-Gly-Pro-Pro-Gly-Ile-Cys-Glu-Ser-Cys-Pro--Thr-Gly-Pro-Gln-Asn--Tyr-Ser-Pro-Gln--Tyr-Asp-Ser--Tyr-Asp-Val-Lys-Ser-Gly-Val-Ala-Val-Gly-Gly-Leu-Ala-Gly--Tyr-Pro-Gly-Pro-Ala-Gly-Pro-Pro-Gly-Pro-Pro-Gly-Pro-Pro-Gly--Thr-Ser-Gly-His-Pro-Gly-Ser-Pro-Gly-Ser-Pro-Gly--Tyr-Gln-Gly-Pro-Pro-Gly-Glu-Pro-Gly-Gln-Ala-Gly-Pro-Ser-Gly-Pro-Pro-Gly-Pro-Pro-Gly-Ala-Ile-Gly-Pro-Ser-Gly-Pro-Ala-Gly-Lys-Asp-Gly-Glu-Ser-Gly-Arg-Pro-Gly-Arg-Pro-Gly-Glu-Arg-Gly-Leu-Pro-Gly-Pro-Pro-Gly-Ile-Lys-Gly-Pro-Ala-Gly-Ile-Pro-Gly-Phe-Pro-Gly-Met-Lys-Gly-His-Arg-Gly-Phe-Asp-Gly-Arg-Asn-Gly-Glu-Lys-Gly-Glu--Thr-Gly-Ala-Pro-Gly-Leu-Lys-Gly-Glu-Asn-Gly-Leu-Pro-Gly-Glu-Asn-Gly-Ala-Pro-Gly-Pro-Met-Gly-Pro-Arg-Gly-Ala-Pro-Gly-Glu-Arg-Gly-Arg-Pro-Gly-Leu-Pro-Gly-Ala-Ala-Gly-Ala-Arg-Gly-Asn-Asp-Gly-Ala-Arg-Gly-Ser-Asp-Gly-Gln-Pro-Gly-Pro-Pro-Gly-Pro-Pro-Gly--Thr-Ala-Gly-Phe-Pro-Gly-Ser-Pro-Gly-Ala-Lys-Gly-Glu-Val-Gly-Pro-Ala-Gly-Ser-Pro-Gly-Ser-Asn-Gly-Ala-Pro-Gly-Gln-Arg-Gly-Glu-Pro-Gly-Pro-Gln-Gly-His-Ala-Gly-Ala-Gln-Gly-Pro-Pro-Gly-Pro-Pro-Gly-Ile-Asn-Gly-Ser-Pro-Gly-Gly-Lys-Gly-Glu-Met-Gly-Pro-Ala-Gly-Ile-Pro-Gly-Ala-Pro-Gly-Leu-Met-Gly-Ala-Arg-Gly-Pro-Pro-Gly-Pro-Ala-Gly-Ala-Asn-Gly-Ala-Pro-Gly-Leu-Arg-Gly-Gly-Ala-Gly-Glu-Pro-Gly-Lys-Asn-Gly-Ala-Lys-Gly-Glu-Pro-Gly-Pro-Arg-Gly-Glu-Arg-Gly-Glu-Ala-Gly-Ile-Pro-Gly-Val-Pro-Gly-Ala-Lys-Gly-Glu-Asp-Gly-Lys-Asp-Gly-Ser-Pro-Gly-Glu-Pro-Gly-Ala-Asn-Gly-Leu-Pro-Gly-Ala-Ala-Gly-Glu-Arg-Gly-Ala-Pro-Gly-Phe-Arg-Gly-Pro-Ala-Gly-Pro-Asn-Gly-Ile-Pro-Gly-Glu-Lys-Gly-Pro-Ala-Gly-Glu-Arg-Gly-Ala-Pro-Gly-Pro-Ala-Gly-Pro-Arg-Gly-Ala-Ala-Gly-Glu-Pro-Gly-Arg-Asp-Gly-Val-Pro-Gly-Gly-Pro-Gly-Met-Arg-Gly-Met-Pro-Gly-Ser-Pro-Gly-Gly-Pro-Gly-Ser-Asp-Gly-Lys-Pro-Gly-Pro-Pro-Gly-Ser-Gln-Gly-Glu-Ser-Gly-Arg-Pro-Gly-Pro-Pro-Gly-Pro-Ser-Gly-Pro-Arg-Gly-Gln-Pro-Gly-Val-Met-Gly-Phe-Pro-Gly-Pro-Lys-Gly-Asn-Asp-Gly-Ala-Pro-Gly-Lys-Asn-Gly-Glu-Arg-Gly-Gly-Pro-Gly-Gly-Pro-Gly-Pro-Gln-Gly-Pro-Pro-Gly-Lys-Asn-Gly-Glu--Thr-Gly-Pro-Gln-Gly-Pro-Pro-Gly-Pro--Thr-Gly-Pro-Gly-Gly-Asp-Lys-Gly-Asp--Thr-Gly-Pro-Pro-Gly-Pro-Gln-Gly-Leu-Gln-Gly-Leu-Pro-Gly--Thr-Gly-Gly-Pro-Pro-Gly-Glu-Asn-Gly-Lys-Pro-Gly-Glu-Pro-Gly-Pro-Lys-Gly-Asp-Ala-Gly-Ala-Pro-Gly-Ala-Pro-Gly-Gly-Lys-Gly-Asp-Ala-Gly-Ala-Pro-Gly-Glu-Arg-Gly-Pro-Pro-Gly-Leu-Ala-Gly-Ala-Pro-Gly-Leu-Arg-Gly-Gly-Ala-Gly-Pro-Pro-Gly-Pro-Glu-Gly-Gly-Lys-Gly-Ala-Ala-Gly-Pro-Pro-Gly-Pro-Pro-Gly-Ala-Ala-Gly--Thr-Pro-Gly-Leu-Gln-Gly-Met-Pro-Gly-Glu-Arg-Gly-Gly-Leu-Gly-Ser-Pro-Gly-Pro-Lys-Gly-Asp-Lys-Gly-Glu-Pro-Gly-Gly-Pro-Gly-Ala-Asp-Gly-Val-Pro-Gly-Lys-Asp-Gly-Pro-Arg-Gly-Pro--Thr-Gly-Pro-Ile-Gly-Pro-Pro-Gly-Pro-Ala-Gly-Gln-Pro-Gly-Asp-Lys-Gly-Glu-Gly-Gly-Ala-Pro-Gly-Leu-Pro-Gly-Ile-Ala-Gly-Pro-Arg-Gly-Ser-Pro-Gly-Glu-Arg-Gly-Glu--Thr-Gly-Pro-Pro-Gly-Pro-Ala-Gly-Phe-Pro-Gly-Ala-Pro-Gly-Gln-Asn-Gly-Glu-Pro-Gly-Gly-Lys-Gly-Glu-Arg-Gly-Ala-Pro-Gly-Glu-Lys-Gly-Glu-Gly-Gly-Pro-Pro-Gly-Val-Ala-Gly-Pro-Pro-Gly-Lys-Asp-Gly--Thr-Ser-Gly-His-Pro-Gly-Pro-Ile-Gly-Pro-Pro-Gly-Pro-Arg-Gly-Asn-Arg-Gly-Glu-Arg-Gly-Ser-Glu-Gly-Ser-Pro-Gly-His-Pro-Gly-Gln-Pro-Gly-Pro-Pro-Gly-Pro-Pro-Gly-Ala-Pro-Gly-Pro-Cys-Cys-Gly-Gly-Val-Gly-Ala-Ala-Ala-Ile-Ala-Gly-Ile-Gly-Gly-Glu-Lys-Ala-Gly-Gly-Phe-Ala-Pro--Tyr--Tyr-Gly-Asp-Glu-Pro-Met-Asp-Phe-Lys-Ile-Asn--Thr-Asp-Glu-Ile-Met--Thr-Ser-Leu-Lys-Ser-Val-Asn-Gly-Gln-Ile-Glu-Ser-Leu-Ile-Ser-Pro-Asp-Gly-Ser-Arg-Lys-Asn-Pro-Ala-Arg-Asn-Cys-Arg-Asp-Leu-Lys-Phe-Cys-His-Pro-Glu-Leu-Lys-Ser-Gly-Glu--Tyr--Trp-Val-Asp-Pro-Asn-Gln-Gly-Cys-Lys-Leu-Asp-Ala-Ile-Lys-Val-Phe-Cys-Asn-Met-Glu--Thr-Gly-Glu--Thr-Cys-Ile-Ser-Ala-Asn-Pro-Leu-Asn-Val-Pro-Arg-Lys-His--Trp--Trp--Thr-Asp-Ser-Ser-Ala-Glu-Lys-Lys-His-Val--Trp-Phe-Gly-Glu-Ser-Met-Asp-Gly-Gly-Phe-Gln-Phe-Ser--Tyr-Gly-Asn-Pro-Glu-Leu-Pro-Glu-Asp-Val-Leu-Asp-Val-Gln-Leu-Ala-Phe-Leu-Arg-Leu-Leu-Ser-Ser-Arg-Ala-Ser-Gln-Asn-Ile--Thr--Tyr-His-Cys-Lys-Asn-Ser-Ile-Ala--Tyr-Met-Asp-Gln-Ala-Ser-Gly-Asn-Val-Lys-Lys-Ala-Leu-Lys-Leu-Met-Gly-Ser-Asn-Glu-Gly-Glu-Phe-Lys-Ala-Glu-Gly-Asn-Ser-Lys-Phe--Thr--Tyr--Thr-Val-Leu-Glu-Asp-Gly-Cys--Thr-Lys-His--Thr-Gly-Glu--Trp-Ser-Lys--Thr-Val-Phe-Glu--Tyr-Arg--Thr-Arg-Lys-Ala-Val-Arg-Leu-Pro-Ile-Val-Asp-Ile-Ala-Pro--Tyr-Asp-Ile-Gly-Gly-Pro-Asp-Gln-Glu-Phe-Gly-Val-Asp-Val-Gly-Pro-Val-Cys-Phe-Leu
(b)COL3A1598-896(SEQ ID NO.:3)
Gly-Pro-Gly-Gly-Pro-Gly-Pro-Gln-Gly-Pro-Pro-Gly-Lys-Asn-Gly-Glu-Thr-Gly-Pro-Gln-Gly-Pro-Pro-Gly-Pro-Thr-Gly-Pro-Gly-Gly-Asp-Lys-Gly-Asp-Thr-Gly-Pro-Pro-Gly-Pro-Gln-Gly-Leu-Gln-Gly-Leu-Pro-Gly-Thr-Gly-Gly-Pro-Pro-Gly-Glu-Asn-Gly-Lys-Pro-Gly-Glu-Pro-Gly-Pro-Lys-Gly-Asp-Ala-Gly-Ala-Pro-Gly-Ala-Pro-Gly-Gly-Lys-Gly-Asp-Ala-Gly-Ala-Pro-Gly-Glu-Arg-Gly-Pro-Pro-Gly-Leu-Ala-Gly-Ala-Pro-Gly-Leu-Arg-Gly-Gly-Ala-Gly-Pro-Pro-Gly-Pro-Glu-Gly-Gly-Lys-Gly-Ala-Ala-Gly-Pro-Pro-Gly-Pro-Pro-Gly-Ala-Ala-Gly-Thr-Pro-Gly-Leu-Gln-Gly-Met-Pro-Gly-Glu-Arg-Gly-Gly-Leu-Gly-Ser-Pro-Lys-Gly-Asp-Lys-Gly-Glu-Pro-Gly-Gly-Pro-Gly-Ala-Asp-Gly-Val-Pro-Gly-Lys-Asp-Gly-Pro-Arg-Gly-Pro-Thr-Gly-Pro-Ile-Gly-Pro-Pro-Gly-Pro-Ala-GLy-Gln-Pro-Gly-Asp-Lys-Gly-Glu-Gly-Gly-Ala-Pro-Gly-Leu-Pro-Gly-Ile-Ala-Gly-Pro-Arg-Gly-Ser-Pro-Gly-Glu-Arg-Gly-Glu-Thr-Gly-Pro-Pro-Gly-Pro-Ala-Gly-Phe-Pro-Gly-Ala-Pro-Gly-Gln-Asn-Gly-Glu-Pro-Gly-Gly-Lys-Gly-Glu-Arg-Gly-Ala-Pro-Gly-Glu-Lys-Gly-Glu-Gly-Gly-Pro-Pro-Gly-Val-Ala-Gly-Pro-Pro-Gly-Lys-Asp-Gly-Thr-Ser-Gly-His-Pro-Gly-Pro-I le-Gly-Pro-Pro-Gly-Pro-Arg-Gly-Asn-Arg-Gly-Glu-Arg-Gly-Ser-Glu-Gly-Ser-Pro-Gly-His-Pro-Gly-Gln-Pro-Gly-Pro-Pro-Gly-Pro-Pro-Gly-Ala-Pro-Gly-Pro-Cys-Cys-Gly-Gly
(c)COL3A1733-896(SEQ ID NO.:4)
Gly-Leu-Gly-Ser-Pro-Lys-Gly-Asp-Lys-Gly-Glu-Pro-Gly-Gly-Pro-Gly-Ala-Asp-Gly-Val-Pro-Gly-Lys-Asp-Gly-Pro-Arg-Gly-Pro-Thr-Gly-Pro-Ile-Gly-Pro-Pro-Gly-Pro-Ala-GLy-Gln-Pro-Gly-Asp-Lys-Gly-Glu-Gly-Gly-Ala-Pro-Gly-Leu-Pro-Gly-Ile-Ala-Gly-Pro-Arg-Gly-Ser-Pro-Gly-Glu-Arg-Gly-Glu-Thr-Gly-Pro-Pro-Gly-Pro-Ala-Gly-Phe-Pro-Gly-Ala-Pro-Gly-Gln-Asn-Gly-Glu-Pro-Gly-Gly-Lys-Gly-Glu-Arg-Gly-Ala-Pro-Gly-Glu-Lys-Gly-Glu-Gly-Gly-Pro-Pro-Gly-Val-Ala-Gly-Pro-Pro-Gly-Lys-Asp-Gly-Thr-Ser-Gly-His-Pro-Gly-Pro-Ile-Gly-Pro-Pro-Gly-Pro-Arg-Gly-Asn-Arg-Gly-Glu-Arg-Gly-Ser-Glu-Gly-Ser-Pro-Gly-His-Pro-Gly-Gln-Pro-Gly-Pro-Pro-Gly-Pro-Pro-Gly-Ala-Pro-Gly-Pro-Cys-Cys-Gly-Gly
本发明的异源融合蛋白质GLP-1类似物多肽的C末端和人COL3A1片段的N末端优选通过富含G的肽接头(即连接肽)融合在一起,其中肽接头具有序列[Gly-Gly-Gly-Gly-Ser(SEQ ID NO.:5)]n-Ala的序列,其中n为2-6,优选地为2。
本发明的异源融合蛋白质包括GLP-1类似物部分和人COL3A1片段部分。通过对天然GLP-1序列的部分替换与融合人COL3A1片段,在保留天然GLP-1活性的同时,融合蛋白通过人COL3A1区域形成稳定的寡聚体,增加融合蛋白的体内稳定性。
天然GLP-1在体内经过加工,切割成AA7-AA37具有活性的片段,因此,按照本领域习惯将GLP-1的氨基端指定为7号,羧基端为37号。如SEQ ID NO.:6中所示对该多肽中的其他氨基酸连续编号。
7His-Ala-Glu-10Gly-Thr-Phe-Thr-Ser-15Asp-Val-Ser-Ser-Tyr-20Leu-Glu-Gly-Gln-Ala-25Ala-Lys-Glu-Phe-Ile-30Ala-Trp-Leu-Val-Lys-35Gly-Arg-37Gly
(SEQ ID NO:6)
相对于天然GLP-1(7-37),异源融合蛋白质的GLP-1类似物部分包括第8、22和36位的三个初步替换。内源性二肽基肽酶4(DPP-4)在第8位的Ala及第9位的Glu之间切割天然GLP-1,产生的无活性的GLP-1(9-37)片段,第8位替换为Gly后可以降低GLP-1类似物对DPP-4水解的敏感性。第22位的替换可以提高GLP-1类似物的活性。第37位的去除可降低融合蛋白质得免疫原性。突变后的序列如SEQ ID NO.:12所示。
7His-Gly-Glu-10Gly-Thr-Phe-Thr-Ser-15Asp-Val-Ser-Ser-Tyr-20Leu-Glu-Glu-Gln-Ala-25Ala-Lys-Glu-Phe-Ile-30Ala-Trp-Leu-Val-Lys-35Gly-Arg(SEQ ID NO.:12)
本发明的异源融合蛋白含有人COL3A1及其片段。在分子结构上,Ⅲ型胶原蛋白是由平行线型链组成,每一线型链由三条扭曲左旋的α1链通过链间相互作用紧密结合而形成的一极强的右旋三重螺旋结构。每条Ⅲ型胶原α1链由多达300以上的Gly-X-Y三联体重复构成,该三联体结构是Ⅲ型胶原α1链形成同源三聚体的关键。因此,本发明在采用全长人COL3A1(SEQ ID NO.:2)的基础上,为了避免过长的氨基酸序列导致重组表达的困难,优选了两种人COL3A1片段,序列分别如SEQ ID NO.:3及SEQ ID NO.:4所示。两种片段含有不同长度的Gly-X-Y三联体结构域,保留了人COL3A1形成同源三聚体的能力同时有利于本发明中异源融合蛋白的重组表达。
本发明中的GLP-1类似物部分的C末端氨基酸优选通过富含甘氨酸的接头肽[Gly-Gly-Gly-Gly-Ser(SEQ ID NO.:5)]n-Ala与人COL3A1片段的N末端融合。增加肽接头可以防止潜在的两个结构域之间的相互干扰,提高异源融合蛋白的稳定性。另外,富含甘氨酸的接头提供了一定的结构柔性,使GLP-1类似物部分可以与靶细胞例如胰腺β细胞上的GLP-1受体分子有效地相互作用,有利于发挥其生物活性。本发明中接头肽[Gly-Gly-Gly-Gly-Ser(SEQ ID NO.:5)]n-Ala的重复数n≥2,但过长的接头肽不利于融合蛋白的稳定性并可能增加潜在的免疫原性。因此优选的接头肽包括序列:
Gly-Gly-Gly-Gly-Ser-Gly-Gly-Gly-Gly-Ser-Ala(SEQ ID NO.:7)
因此本发明优选的GLP-1-COL3A1异源融合蛋白质包括下列蛋白质:
(a)GLP-1-2L-COL598-896(SEQ ID NO.:8)
HGEGTFTSDVSSYLEEQAAKEFIAWLVKGRGGGGSGGGGSGGGGSAGPGGPGPQGPPGKNGETGPQGPPGPTGPGGDKGDTGPPGPQGLQGLPGTGGPPGENGKPGEPGPKGDAGAPGAPGGKGDAGAPGERGPPGLAGAPGLRGGAGPPGPEGGKGAAGPPGPPGAAGTPGLQGMPGERGGLGSPGPKGDKGEPGGPGADGVPGKDGPRGPTGPIGPPGPAGQPGDKGEGGAPGLPGIAGPRGSPGERGETGPPGPAGFPGAPGQNGEPGGKGERGAPGEKGEGGPPGVAGPPGKDGTSGHPGPIGPPGPRGNRGERGSEGSPGHPGQPGPPGPPGAPGPCCGG
(b)GLP-1-2L-COL733-896(SEQ ID NO.:9)
HGEGTFTSDVSSYLEEQAAKEFIAWLVKGRGGGGSGGGGSGGGGSAGLGSPGPKGDKGEPGGPGADGVPGKDGPRGPTGPIGPPGPAGQPGDKGEGGAPGLPGIAGPRGSPGERGETGPPGPAGFPGAPGQNGEPGGKGERGAPGEKGEGGPPGVAGPPGKDGTSGHPGPIGPPGPRGNRGERGSEGSPGHPGQPGPPGPPGAPGPCCGG
(c)GLP-1-2L-COL(SEQ ID NO.:13)
HGEGTFTSDVSSYLEEQAAKEFIAWLVKGRGGGGSGGGGSGGGGSAAMMSFVQKGSWLLLALLHPTIILAQQEAVEGGCSHLGQSYADRDVWKPEPCQICVCDSGSVLCDDIICDDQELDCPNPEIPFGECCAVCPQPPTAPTRPPNGQGPQGPKGDPGPPGIPGRNGDPGIPGQPGSPGSPGPPGICESCPTGPQNYSPQYDSYDVKSGVAVGGLAGYPGPAGPPGPPGPPGTSGHPGSPGSPGYQGPPGEPGQAGPSGPPGPPGAIGPSGPAGKDGESGRPGRPGERGLPGPPGIKGPAGIPGFPGMKGHRGFDGRNGEKGETGAPGLKGENGLPGENGAPGPMGPRGAPGERGRPGLPGAAGARGNDGARGSDGQPGPPGPPGTAGFPGSPGAKGEVGPAGSPGSNGAPGQRGEPGPQGHAGAQGPPGPPGINGSPGGKGEMGPAGIPGAPGLMGARGPPGPAGANGAPGLRGGAGEPGKNGAKGEPGPRGERGEAGIPGVPGAKGEDGKDGSPGEPGANGLPGAAGERGAPGFRGPAGPNGIPGEKGPAGERGAPGPAGPRGAAGEPGRDGVPGGPGMRGMPGSPGGPGSDGKPGPPGSQGESGRPGPPGPSGPRGQPGVMGFPGPKGNDGAPGKNGERGGPGGPGPQGPPGKNGETGPQGPPGPTGPGGDKGDTGPPGPQGLQGLPGTGGPPGENGKPGEPGPKGDAGAPGAPGGKGDAGAPGERGPPGLAGAPGLRGGAGPPGPEGGKGAAGPPGPPGAAGTPGLQGMPGERGGLGSPGPKGDKGEPGGPGADGVPGKDGPRGPTGPIGPPGPAGQPGDKGEGGAPGLPGIAGPRGSPGERGETGPPGPAGFPGAPGQNGEPGGKGERGAPGEKGEGGPPGVAGPPGKDGTSGHPGPIGPPGPRGNRGERGSEGSPGHPGQPGPPGPPGAPGPCCGGVGAAAIAGIGGEKAGGFAPYYGDEPMDFKINTDEIMTSLKSVNGQIESLISPDGSRKNPARNCRDLKFCHPELKSGEYWVDPNQGCKLDAIKVFCNMETGETCISANPLNVPRKHWWTDSSAEKKHVWFGESMDGGFQFSYGNPELPEDVLDVQLAFLRLLSSRASQNITYHCKNSIAYMDQASGNVKKALKLMGSNEGEFKAEGNSKFTYTVLEDGCTKHTGEWSKTVFEYRTRKAVRLPIVDIAPYDIGGPDQEFGVDVGPVCFL
此处使用的提及特定异源融合蛋白质的命名法定义如下:融合蛋白质GLP-1部分特指成熟GLP-1(7-37)的类似物,其中第8位的Ala突变为Gly,第22位的Gly突变为Glu,第37位的Gly去除。L指具有序列[Gly-Gly-Gly-Gly-Ser(SEQ ID NO.:5)]n-Ala的接头。直接在L前面的数字指接头肽中n的重复数目。指定为2L的接头肽指序列Gly-Gly-Gly-Gly-Ser-Gly-Gly-Gly-Gly-Ser-Ala(SEQ ID NO.:7)。融合蛋白质COL3A1片段的缩写为COL,其氨基酸序列起始位置以残基编号来表示。COL598-896表示成熟融合蛋白质的COL3A1部分以第598位的Gly开始,以第896位Gly结束;COL733-896表示成熟融合蛋白质的COL3A1部分以第733位的Gly开始,以第896位Gly结束。
本发明涉及人源GLP-1类似物与人Ⅲ型胶原α1链片段相结合的融合蛋白。该融合蛋白与度拉糖肽不同之处在于,IgG的Fc段可能具有ADCC(Antibody-Dependent CellCytotoxicity,抗体依赖细胞介导的细胞毒性作用)作用,具有潜在的免疫原性及副反应。相对的,胶原蛋白是体内含量最多的一种蛋白质,约占蛋白质总量的25%-33%,广泛地存在于人体的骨、腱、软骨和皮肤及其它结缔组织种,是细胞外基质(ECM)的主要成分,具有良好的生物兼容性、生物吸收性。其中,Ⅲ型胶原只占胶原蛋白总量的10%,主要存在于血管中。在分子结构上,Ⅲ型胶原蛋白是由平行线型链组成,每一线型链由三条扭曲左旋的α1链通过链间相互作用紧密结合而形成的一极强的右旋三重螺旋结构。每条Ⅲ型胶原α1链由多达300以上的Gly-X-Y三联体重复构成,该三联体结构是Ⅲ型胶原α1链形成同源三聚体的关键。
核酸编码序列
本发明还包括编码本发明异源融合蛋白质的多核苷酸以及包含这些多核苷酸的载体和宿主细胞。本发明也包括治疗患有非胰岛素依赖型、肥胖及多种其他疾病和病症的患者的方法,其包括应用在此讨论的异源融合蛋白质。
本发明还涉及编码根据本发明的融合蛋白的多核苷酸。
在本发明的一个优选例中,所述核苷酸序列如SEQ ID NO.:10或11所示。
本发明的多核苷酸可以是DNA形式或RNA形式。DNA形式包括cDNA、基因组DNA或人工合成的DNA。DNA可以是单链的或是双链的。DNA可以是编码链或非编码链。编码成熟多肽的编码区序列可以与编码SEQ ID NO.:8、9或13所示的多肽的序列相同或者是简并的变异体。如本文所用,“简并的变异体”在本发明中是指编码具有SEQ ID NO.:8、9或13所示的多肽,但相应编码区序列有差别的核酸序列。
本发明的多肽的核苷酸全长序列或其片段通常可以用PCR扩增法、重组法或人工合成的方法获得。对于PCR扩增法,可根据已公开的有关核苷酸序列,尤其是开放阅读框序列来设计引物,并用市售的cDNA库或按本领域技术人员已知的常规方法所制备的cDNA库作为模板,扩增而得有关序列。当序列较长时,常常需要进行两次或多次PCR扩增,然后再将各次扩增出的片段按正确次序拼接在一起。目前,已经可以完全通过化学合成来得到编码本发明多肽(或其片段,或其衍生物)的DNA序列。然后可将该DNA序列引入本领域中已知的各种现有的DNA分子(或如载体)和细胞中。
本发明也涉及包含本发明的多核苷酸的载体,以及用本发明的载体或多肽编码序列经基因工程产生的宿主细胞。上述多核苷酸、载体或宿主细胞可以是分离的。
如本文所用,“分离的”是指物质从其原始环境中分离出来(如果是天然的物质,原始环境即是天然环境)。如活体细胞内的天然状态下的多核苷酸和多肽是没有分离纯化的,但同样的多核苷酸或多肽如从天然状态中同存在的其他物质中分开,则为分离纯化的。
一旦获得了有关的序列,就可以用重组法来大批量地获得有关序列。这通常是将其克隆入载体,再转入细胞,然后通过常规方法从增殖后的宿主细胞中分离得到有关序列。
此外,还可用人工合成的方法来合成有关序列,尤其是片段长度较短时。通常,通过先合成多个小片段,然后再进行连接可获得序列很长的片段。
应用PCR技术扩增DNA/RNA的方法被优选用于获得本发明的基因。用于PCR的引物可根据本文所公开的本发明的序列信息适当地选择,并可用常规方法合成。可用常规方法如通过凝胶电泳分离和纯化扩增的DNA/RNA片段。
本发明也涉及包含本发明的多核苷酸的载体,以及用本发明的载体或蛋白编码序列经基因工程产生的宿主细胞,以及经重组技术利用所述宿主细胞表达本发明融合蛋白的方法。
通过常规的重组DNA技术,可利用本发明的多核苷酸序列获得表达本发明融合蛋白的宿主细胞。一般来说包括步骤:将本发明第三方面所述的多核苷酸或本发明第四方面所述的载体转导入宿主细胞内。
本领域的技术人员熟知的方法能用于构建含本发明酶的编码DNA序列和合适的转录/翻译控制信号的表达载体。这些方法包括体外重组DNA技术、DNA合成技术、体内重组技术等。所述的DNA序列可有效连接到表达载体中的适当启动子上,以指导mRNA合成。表达载体还包括翻译起始用的核糖体结合位点和转录终止子。
此外,表达载体优选地包含一个或多个选择性标记基因,以提供用于选择转化的宿主细胞的表型性状,如真核细胞培养用的二氢叶酸还原酶、新霉素抗性以及绿色荧光蛋白(GFP),或用于大肠杆菌的四环素或氨苄青霉素抗性。
包含上述的适当DNA序列以及适当启动子或者控制序列的载体,可以用于转化适当的宿主细胞,以使其能够表达蛋白质。
宿主细胞可以是原核细胞,如细菌细胞;或是低等真核细胞,如酵母细胞;或是高等真核细胞,如哺乳动物细胞。代表性例子有:大肠杆菌,枯草芽胞杆菌,链霉菌属的细菌细胞;真菌细胞如毕赤酵母、酿酒酵母细胞;植物细胞;果蝇S2或Sf9的昆虫细胞;CHO、NS0、COS7、或293细胞的动物细胞等。在另一优选例中,所述宿主细胞为毕赤酵母。
用重组DNA转化宿主细胞可用本领域技术人员熟知的常规技术进行。当宿主为原核生物如大肠杆菌时,能吸收DNA的感受态细胞可在指数生长期后收获,用CaCl2法处理,所用的步骤在本领域众所周知。另一种方法是使用MgCl2。如果需要,转化也可用电穿孔的方法进行。当宿主是真核生物,可选用如下的DNA转染方法:磷酸钙共沉淀法,常规机械方法如显微注射、电穿孔、脂质体包装等。
获得的转化子可以用常规方法培养,表达本发明的基因所编码的蛋白质。根据所用的宿主细胞,培养中所用的培养基可选自各种常规培养基。在适于宿主细胞生长的条件下进行培养。当宿主细胞生长到适当的细胞密度后,用合适的方法(如温度转换或化学诱导)诱导选择的启动子,将细胞再培养一段时间。
在上面的方法中的蛋白质可在细胞内、或在细胞膜上表达、或分泌到细胞外。如果需要,可利用其物理的、化学的和其它特性通过各种分离方法分离和纯化蛋白。这些方法是本领域技术人员所熟知的。这些方法的例子包括但并不限于:常规的复性处理、用蛋白沉淀剂处理(盐析方法)、离心、渗透破菌、超处理、超离心、分子筛层析(凝胶过滤)、吸附层析、离子交换层析、高效液相层析(HPLC)和其它各种液相层析技术及这些方法的结合。
可以通过多种不同的方法产生编码本发明的GLP-1类似物的DNA,可以基于天然序列设计引物以产生此处所述的编码GLP-1类似物的DNA,可以在连接前或在编码整个融合蛋白质的cDNA中突变编码野生型GLP-1DNA。从特定文库克隆的全长野生型序列通常可以作为产生本发明COL3A1片段的模板,可以通过设计引物以产生此处所述的编码COL3A1片段的DNA。通过PCR技术及引物设计,可以将编码GLP-1类似物的基因和编码COL3A1类似物蛋白质的基因也通过编码富含G的接头肽的DNA在框内连接。进行全序列的化学合成也是可行的技术。可以使用PCR技术,用经设计与对应于COL3A1片段所需末端的序列杂交的引物产生该片段。也可以设计PCR引物产生限制性酶位点以便于克隆到表达载体中。
在SEQ ID NO.:10中提供编码本发明优选的异源融合蛋白质之一GLP-1-2L-COL598-896的优选DNA序列:
CACGGTGAGGGTACTTTTACCTCTGATGTTTCCTCATACTTGGAAGAACAAGCTGCTAAGGAATTCATTGCCTGGCTGGTCAAAGGCAGAGGAGGTGGCGGATCCGGTGGCGGTGGGTCCGGAGGAGGTGGTTCAGCTGGTCCAGGTGGTCCAGGTCCTCAAGGTCCTCCAGGTAAGAATGGTGAAACTGGTCCTCAGGGACCTCCAGGCCCAACCGGTCCTGGAGGTGATAAGGGTGATACCGGACCACCTGGCCCACAAGGCTTGCAGGGTCTGCCAGGTACAGGGGGTCCACCCGGTGAAAACGGCAAGCCTGGTGAACCAGGCCCAAAAGGTGACGCTGGAGCTCCAGGAGCCCCAGGAGGTAAGGGTGATGCTGGTGCCCCCGGTGAGAGAGGCCCACCAGGTTTGGCCGGTGCTCCCGGTCTGAGAGGGGGAGCTGGTCCACCAGGACCTGAAGGCGGAAAAGGTGCTGCTGGTCCACCTGGACCACCTGGTGCTGCCGGAACTCCAGGACTGCAGGGAATGCCTGGTGAAAGAGGCGGATTGGGATCTCCTGGCCCAAAAGGAGACAAGGGAGAGCCTGGTGGACCAGGGGCAGATGGAGTTCCTGGAAAAGATGGTCCTCGTGGTCCAACAGGACCTATCGGTCCCCCAGGACCTGCTGGTCAACCTGGAGATAAAGGTGAAGGCGGGGCTCCAGGATTGCCTGGTATTGCCGGCCCTAGAGGTTCTCCCGGTGAAAGAGGTGAGACCGGCCCACCTGGTCCAGCTGGCTTCCCTGGAGCACCAGGTCAGAATGGTGAGCCAGGTGGTAAGGGTGAGAGAGGAGCTCCAGGTGAGAAGGGGGAAGGTGGTCCACCTGGTGTTGCTGGTCCACCAGGTAAGGATGGTACATCCGGTCATCCTGGACCAATTGGACCTCCAGGGCCTAGAGGTAACAGGGGTGAAAGGGGATCTGAAGGATCTCCTGGACATCCAGGTCAGCCCGGTCCTCCTGGTCCACCCGGAGCTCCTGGGCCATGCTGTGGTGGC(SEQ ID NO.:10)
在SEQ ID NO.:11中提供编码本发明优选的异源融合蛋白质之一GLP-1-2L-COL733-896的优选DNA序列:
CACGGTGAGGGTACTTTTACCTCTGATGTTTCCTCATACTTGGAAGAACAAGCTGCTAAGGAATTCATTGCCTGGCTGGTCAAAGGCAGAGGAGGTGGCGGATCCGGTGGCGGTGGGTCCGGAGGAGGTGGTTCAGCTGGTTTGGGATCTCCTGGCCCAAAAGGAGACAAGGGAGAGCCTGGTGGACCAGGGGCAGATGGAGTTCCTGGAAAAGATGGTCCTCGTGGTCCAACAGGACCTATCGGTCCCCCAGGACCTGCTGGTCAACCTGGAGATAAAGGTGAAGGCGGGGCTCCAGGATTGCCTGGTATTGCCGGCCCTAGAGGTTCTCCCGGTGAAAGAGGTGAGACCGGCCCACCTGGTCCAGCTGGCTTCCCTGGAGCACCAGGTCAGAATGGTGAGCCAGGTGGTAAGGGTGAGAGAGGAGCTCCAGGTGAGAAGGGGGAAGGTGGTCCACCTGGTGTTGCTGGTCCACCAGGTAAGGATGGTACATCCGGTCATCCTGGACCAATTGGACCTCCAGGGCCTAGAGGTAACAGGGGTGAAAGGGGATCTGAAGGATCTCCTGGACATCCAGGTCAGCCCGGTCCTCCTGGTCCACCCGGAGCTCCTGGGCCATGCTGTGGTGGC(SEQ ID NO.:11)
表达载体和宿主细胞
本发明还提供了一种用于本发明融合蛋白的表达载体。
克隆或表达本发明核酸的宿主细胞可以是原核细胞,更优的宿主细胞包括酵母或高等真核细胞。融合蛋白基因经宿主细胞表达后,从表达产物中进行分离纯化,可用于制备糖尿病及相关疾病的治疗药物。所述相关疾病包括:Ⅱ型糖尿病、Ⅰ型糖尿病、肥胖、Ⅱ型糖尿病患者严重心血管事件和其他严重并发症等。
与现有技术相比,本发明主要具有以下优点:
本发明中涉及的GLP-1-COL3A1融合蛋白,秉着保留GLP-1降糖活性并显著延长其体内半衰期的目标,设计了一种不同于其他GLP-1类似物药物的新型分子,其具有GLP-1R激活活性、形成稳定多聚体及延长的体内半衰期。
(a)相对于天然GLP-1(7-37),本发明融合蛋白质的GLP-1类似物部分包括第8、22和36位的三个替换。内源性二肽基肽酶4(DPP-4)在第8位的Ala及第9位的Glu之间切割天然GLP-1,产生的无活性的GLP-1(9-37)片段,第8位替换为Gly后降低了GLP-1类似物对DPP-4水解的敏感性。第22位的替换提高了GLP-1类似物的活性。第37位的去除降低了融合蛋白质得免疫原性。本发明融合蛋白对DPP-4水解的敏感性低,活性非常高,免疫原性低。
(b)本发明融合蛋白含有人Ⅲ型胶原α1链,首次采用COL3A1片段与GLP-1类似物进行长效GLP-1类似物的构建,生物相容性好、可形成寡聚体、并易于表达。优选的COL3A1有利于表达的优点,构建的融合蛋白适用于毕赤酵母表达系统,生产成本低于其他GLP-1类药物采用的高级真核细胞系统,通过制备工艺的进一步优化及放大,有望得到一种价格较低廉的长效2型糖尿病治疗药物。并且,在保留GLP-1生物学活性的同时,利用融合蛋白通过α1链形成三聚体的特性,获得显著延长的体内半衰期。
(c)为了避免过长的氨基酸序列导致重组表达的困难,本发明优选了两种人COL3A1片段(COL3A1598-896及COL3A1733-8962个片段),序列分别如SEQ ID NO.:3及SEQ IDNO.:4所示。两种片段含有不同长度的Gly-X-Y三联体结构域,保留了人COL3A1形成同源三聚体的能力同时有利于本发明中异源融合蛋白的重组表达,本发明融合蛋白稳定性高。
下面结合具体实施,进一步阐述本发明。应理解,这些实施例仅用于说明本发明而不用于限制本发明的范围。下列实施例中未注明具体条件的实验方法,通常按照常规条件,例如Sambrook等人,分子克隆:实验室手册(New York:Cold SpringHarbor LaboratoryPress,1989)中所述的条件,或按照制造厂商所建议的条件。除非另外说明,否则百分比和份数按重量计算。
实施例1:构建编码GLP-1-COL3A1融合蛋白的DNA
编码本发明所述融合蛋白GLP-1-2L-COL598-896的基因(SEQ ID NO:8)由南京金斯瑞生物科技有限公司合成并克隆至pUC57质粒,融合基因的5’端含有XhoI酶切位点,3’端含有TAA终止密码子及NotI酶切位点,所述pUC57质粒命名为pUC57-GLP-COL-1。
用限制内核酸内切酶XhoI及NotI(购自Fermentas)按照说明书对pUC57-GLP-COLA-1进行双酶切消化,对消化后产生长度为1050bp左右的编码GLP-1-2L-COL598-896融合蛋白的基因片段进行胶回收(胶回收试剂盒购自Axygen)。同时将pPic9m用XhoI及NotI进行双酶切消化,并对消化后长度为9000bp的质粒条带进行胶回收。
上述酶切得到的融合蛋白基因片段及pPic9m质粒片段用T4DNA连接酶(购自Fermentas)进行连接,连接产物用热休克法转化大肠杆菌感受态细胞DH5α,转化产物涂布在具有卡那霉素霉素抗性的LB固体培养基上,挑取单克隆进行基因测序,确定插入基因的序列正确,获得的质粒命名为pPic9m-GLP-COL-1(如图1所示)。
相似的,构建了含有编码GLP-1-2L-COL733-896融合蛋白编码基因的融合蛋白表达载体,命名为pPic9m-GLP-COL-2(图2)。
实施例2:异源融合蛋白的表达
将实施例1中的插入有融合蛋白基因的载体进行抽提,使用电转化的方法转入毕赤酵母GS115感受态细胞。通过营养限制性培养基筛选重组子后,利用G418抗性进行高拷贝重组子的筛选。最终获得适宜进行重组表达的含有异源融合蛋白基因的重组毕赤酵母细胞。
重组毕赤酵母细胞在经过种子扩增后,接种入5L发酵罐内进行小规模制备,发酵持续5天,其中利用甲醇进行异源融合蛋白的诱导表达,诱导持续36h,发酵结束后进行发酵液的收集用于蛋白的纯化。
表1:毕赤酵母GS115种子扩增培养基组成
配方 含量
Yeast Extract 10.0g/L
Peptone 20.0g/L
KH<sub>2</sub>PO<sub>4</sub> 11.8g/L
K<sub>2</sub>HPO<sub>4</sub> 3.0g/L
甘油 10.0ml/L
表2:毕赤酵母GS115发酵培养基组成
配方 含量
YNB 0.67g/L
CaCl<sub>2</sub> 0.4g/L
K<sub>2</sub>SO<sub>4</sub> 10.0g/L
MgSO4.7H<sub>2</sub>O 8.0g/L
(NH<sub>4</sub>)<sub>2</sub>SO<sub>4</sub> 8.0g/L
柠檬酸 5.0g/L
K<sub>2</sub>HPO<sub>4</sub>.3H<sub>2</sub>O 18.0g/L
甘油 40.0ml/L
实施例3:异源融合蛋白的纯化
两种优选的异源融合蛋白GLP-1-2L-COL598-896、GLP-1-2L-COL733-896采用相似的纯化步骤。
4L发酵培养基使用PALL 0.2μm的中空纤维过滤系统进行上清液的收集,得到约4L上清液。上清液再采用PALL 50kDa滤膜的超滤系统进行样品超滤,除去部分杂蛋白。超滤液体最后用Source30Q阴离子交换色谱进行纯化,利用0-500mM NaCl线型梯度进行样品的洗脱,最后得到纯化的异源融合蛋白。使用SDS-PAGE确定了异源融合蛋白的纯度及分子量,纯度>90%,分子量与预期相符(图3)。
实施例4:异源融合蛋白的生物活性及药代动力学研究
实施例4a、融合蛋白的生物活性研究
利用稳定转染有GLP-1R的人骨肉瘤细胞U2OS进行异源融合蛋白的活性测定,异源融合蛋白的GLP-1类似物片段与U2OS细胞上的GLP-1R受体结合会刺激细胞分泌cAMP,通过cAMP酶联测定法来检测cAMP的活性以表征融合蛋白的GLP-1活性。U2OS细胞以1.2×105/孔接种于96孔板中,用含10%FBS的DMEM培养基,在37℃、5%CO2中培养24h。撤去培养基,然后加入基础培养基培养过夜。撤去基础培养基,加入不同浓度的待测样品,包括2种融合蛋白GLP-1-2L-COL598-896、GLP-1-2L-COL733-896及人工合成的GLP-1(7-37)对照品,37℃、5%CO2中培养0.5h。使用cAMP试剂盒(购自R&D)进行细胞cAMP含量的测定,结果如图4所示。
图4的结果显示,经GLP-1-2L-COL598-896、GLP-1-2L-COL733-896刺激U2OS细胞产生的cAMP含量存在明显的剂量效应,且与GLP-1相当,确定GLP-1-2L-COL598-896、GLP-1-2L-COL733-896融合蛋白具有GLP-1相似的GLP-1R激活活性。
实施例4b、融合蛋白的药代动力学研究
在药代动力学试验中使用SD雄性大鼠,设置GLP-1-2L-COL598-896、GLP-1-2L-COL733-896及化学合成GLP-1(7-37)对照组,每组8只。按照1mg/kg剂量静脉注射,分别采集注射前及注射后不同时间点的血样:0h、0.5h、1h、2h、4h、6h、10h、24h、2d、4d、6d、8d、10d、14d、21d。采集的血清放置于-80℃保存。血清中融合蛋白的量使用GLP-1试剂盒进行检测(图5)。由图5结果可知,本发明的融合蛋白可以显著延长GLP-1类似物的体内循环半衰期。
以上所述,仅是本发明的较优实施例,并非对本发明任何形式上的限制。应指出的是,对于本技术领域内的普通技术人员对本发明做出的改进和补充,也应视为本发明的保护范围。
在本发明提及的所有文献都在本申请中引用作为参考,就如同每一篇文献被单独引用作为参考那样。此外应理解,在阅读了本发明的上述讲授内容之后,本领域技术人员可以对本发明作各种改动或修改,这些等价形式同样落于本申请所附权利要求书所限定的范围。
序列表
<110> 上海惠盾生物技术有限公司
<120> 一种GLP-1类似物-COL3A1融合蛋白
<130> P2018-0197
<160> 13
<170> PatentIn version 3.5
<210> 1
<211> 31
<212> PRT
<213> 人工序列(artificial sequence)
<400> 1
His Xaa Glu Gly Thr Phe Thr Ser Asp Val Ser Ser Tyr Leu Glu Xaa
1 5 10 15
Gln Ala Ala Lys Glu Phe Ile Ala Trp Leu Val Lys Gly Arg Xaa
20 25 30
<210> 2
<211> 1163
<212> PRT
<213> 智人(Homo sapiens)
<400> 2
Met Met Ser Phe Val Gln Lys Gly Ser Trp Leu Leu Leu Ala Leu Leu
1 5 10 15
His Pro Thr Ile Ile Leu Ala Gln Gln Glu Ala Val Glu Gly Gly Cys
20 25 30
Ser His Leu Gly Gln Ser Tyr Ala Asp Arg Asp Val Trp Lys Pro Glu
35 40 45
Pro Cys Gln Ile Cys Val Cys Asp Ser Gly Ser Val Leu Cys Asp Asp
50 55 60
Ile Ile Cys Asp Asp Gln Glu Leu Asp Cys Pro Asn Pro Glu Ile Pro
65 70 75 80
Phe Gly Glu Cys Cys Ala Val Cys Pro Gln Pro Pro Thr Ala Pro Thr
85 90 95
Arg Pro Pro Asn Gly Gln Gly Pro Gln Gly Pro Lys Gly Asp Pro Gly
100 105 110
Pro Pro Gly Ile Pro Gly Arg Asn Gly Asp Pro Gly Ile Pro Gly Gln
115 120 125
Pro Gly Ser Pro Gly Ser Pro Gly Pro Pro Gly Ile Cys Glu Ser Cys
130 135 140
Pro Thr Gly Pro Gln Asn Tyr Ser Pro Gln Tyr Asp Ser Tyr Asp Val
145 150 155 160
Lys Ser Gly Val Ala Val Gly Gly Leu Ala Gly Tyr Pro Gly Pro Ala
165 170 175
Gly Pro Pro Gly Pro Pro Gly Pro Pro Gly Thr Ser Gly His Pro Gly
180 185 190
Ser Pro Gly Ser Pro Gly Tyr Gln Gly Pro Pro Gly Glu Pro Gly Gln
195 200 205
Ala Gly Pro Ser Gly Pro Pro Gly Pro Pro Gly Ala Ile Gly Pro Ser
210 215 220
Gly Pro Ala Gly Lys Asp Gly Glu Ser Gly Arg Pro Gly Arg Pro Gly
225 230 235 240
Glu Arg Gly Leu Pro Gly Pro Pro Gly Ile Lys Gly Pro Ala Gly Ile
245 250 255
Pro Gly Phe Pro Gly Met Lys Gly His Arg Gly Phe Asp Gly Arg Asn
260 265 270
Gly Glu Lys Gly Glu Thr Gly Ala Pro Gly Leu Lys Gly Glu Asn Gly
275 280 285
Leu Pro Gly Glu Asn Gly Ala Pro Gly Pro Met Gly Pro Arg Gly Ala
290 295 300
Pro Gly Glu Arg Gly Arg Pro Gly Leu Pro Gly Ala Ala Gly Ala Arg
305 310 315 320
Gly Asn Asp Gly Ala Arg Gly Ser Asp Gly Gln Pro Gly Pro Pro Gly
325 330 335
Pro Pro Gly Thr Ala Gly Phe Pro Gly Ser Pro Gly Ala Lys Gly Glu
340 345 350
Val Gly Pro Ala Gly Ser Pro Gly Ser Asn Gly Ala Pro Gly Gln Arg
355 360 365
Gly Glu Pro Gly Pro Gln Gly His Ala Gly Ala Gln Gly Pro Pro Gly
370 375 380
Pro Pro Gly Ile Asn Gly Ser Pro Gly Gly Lys Gly Glu Met Gly Pro
385 390 395 400
Ala Gly Ile Pro Gly Ala Pro Gly Leu Met Gly Ala Arg Gly Pro Pro
405 410 415
Gly Pro Ala Gly Ala Asn Gly Ala Pro Gly Leu Arg Gly Gly Ala Gly
420 425 430
Glu Pro Gly Lys Asn Gly Ala Lys Gly Glu Pro Gly Pro Arg Gly Glu
435 440 445
Arg Gly Glu Ala Gly Ile Pro Gly Val Pro Gly Ala Lys Gly Glu Asp
450 455 460
Gly Lys Asp Gly Ser Pro Gly Glu Pro Gly Ala Asn Gly Leu Pro Gly
465 470 475 480
Ala Ala Gly Glu Arg Gly Ala Pro Gly Phe Arg Gly Pro Ala Gly Pro
485 490 495
Asn Gly Ile Pro Gly Glu Lys Gly Pro Ala Gly Glu Arg Gly Ala Pro
500 505 510
Gly Pro Ala Gly Pro Arg Gly Ala Ala Gly Glu Pro Gly Arg Asp Gly
515 520 525
Val Pro Gly Gly Pro Gly Met Arg Gly Met Pro Gly Ser Pro Gly Gly
530 535 540
Pro Gly Ser Asp Gly Lys Pro Gly Pro Pro Gly Ser Gln Gly Glu Ser
545 550 555 560
Gly Arg Pro Gly Pro Pro Gly Pro Ser Gly Pro Arg Gly Gln Pro Gly
565 570 575
Val Met Gly Phe Pro Gly Pro Lys Gly Asn Asp Gly Ala Pro Gly Lys
580 585 590
Asn Gly Glu Arg Gly Gly Pro Gly Gly Pro Gly Pro Gln Gly Pro Pro
595 600 605
Gly Lys Asn Gly Glu Thr Gly Pro Gln Gly Pro Pro Gly Pro Thr Gly
610 615 620
Pro Gly Gly Asp Lys Gly Asp Thr Gly Pro Pro Gly Pro Gln Gly Leu
625 630 635 640
Gln Gly Leu Pro Gly Thr Gly Gly Pro Pro Gly Glu Asn Gly Lys Pro
645 650 655
Gly Glu Pro Gly Pro Lys Gly Asp Ala Gly Ala Pro Gly Ala Pro Gly
660 665 670
Gly Lys Gly Asp Ala Gly Ala Pro Gly Glu Arg Gly Pro Pro Gly Leu
675 680 685
Ala Gly Ala Pro Gly Leu Arg Gly Gly Ala Gly Pro Pro Gly Pro Glu
690 695 700
Gly Gly Lys Gly Ala Ala Gly Pro Pro Gly Pro Pro Gly Ala Ala Gly
705 710 715 720
Thr Pro Gly Leu Gln Gly Met Pro Gly Glu Arg Gly Gly Leu Gly Ser
725 730 735
Pro Gly Pro Lys Gly Asp Lys Gly Glu Pro Gly Gly Pro Gly Ala Asp
740 745 750
Gly Val Pro Gly Lys Asp Gly Pro Arg Gly Pro Thr Gly Pro Ile Gly
755 760 765
Pro Pro Gly Pro Ala Gly Gln Pro Gly Asp Lys Gly Glu Gly Gly Ala
770 775 780
Pro Gly Leu Pro Gly Ile Ala Gly Pro Arg Gly Ser Pro Gly Glu Arg
785 790 795 800
Gly Glu Thr Gly Pro Pro Gly Pro Ala Gly Phe Pro Gly Ala Pro Gly
805 810 815
Gln Asn Gly Glu Pro Gly Gly Lys Gly Glu Arg Gly Ala Pro Gly Glu
820 825 830
Lys Gly Glu Gly Gly Pro Pro Gly Val Ala Gly Pro Pro Gly Lys Asp
835 840 845
Gly Thr Ser Gly His Pro Gly Pro Ile Gly Pro Pro Gly Pro Arg Gly
850 855 860
Asn Arg Gly Glu Arg Gly Ser Glu Gly Ser Pro Gly His Pro Gly Gln
865 870 875 880
Pro Gly Pro Pro Gly Pro Pro Gly Ala Pro Gly Pro Cys Cys Gly Gly
885 890 895
Val Gly Ala Ala Ala Ile Ala Gly Ile Gly Gly Glu Lys Ala Gly Gly
900 905 910
Phe Ala Pro Tyr Tyr Gly Asp Glu Pro Met Asp Phe Lys Ile Asn Thr
915 920 925
Asp Glu Ile Met Thr Ser Leu Lys Ser Val Asn Gly Gln Ile Glu Ser
930 935 940
Leu Ile Ser Pro Asp Gly Ser Arg Lys Asn Pro Ala Arg Asn Cys Arg
945 950 955 960
Asp Leu Lys Phe Cys His Pro Glu Leu Lys Ser Gly Glu Tyr Trp Val
965 970 975
Asp Pro Asn Gln Gly Cys Lys Leu Asp Ala Ile Lys Val Phe Cys Asn
980 985 990
Met Glu Thr Gly Glu Thr Cys Ile Ser Ala Asn Pro Leu Asn Val Pro
995 1000 1005
Arg Lys His Trp Trp Thr Asp Ser Ser Ala Glu Lys Lys His Val
1010 1015 1020
Trp Phe Gly Glu Ser Met Asp Gly Gly Phe Gln Phe Ser Tyr Gly
1025 1030 1035
Asn Pro Glu Leu Pro Glu Asp Val Leu Asp Val Gln Leu Ala Phe
1040 1045 1050
Leu Arg Leu Leu Ser Ser Arg Ala Ser Gln Asn Ile Thr Tyr His
1055 1060 1065
Cys Lys Asn Ser Ile Ala Tyr Met Asp Gln Ala Ser Gly Asn Val
1070 1075 1080
Lys Lys Ala Leu Lys Leu Met Gly Ser Asn Glu Gly Glu Phe Lys
1085 1090 1095
Ala Glu Gly Asn Ser Lys Phe Thr Tyr Thr Val Leu Glu Asp Gly
1100 1105 1110
Cys Thr Lys His Thr Gly Glu Trp Ser Lys Thr Val Phe Glu Tyr
1115 1120 1125
Arg Thr Arg Lys Ala Val Arg Leu Pro Ile Val Asp Ile Ala Pro
1130 1135 1140
Tyr Asp Ile Gly Gly Pro Asp Gln Glu Phe Gly Val Asp Val Gly
1145 1150 1155
Pro Val Cys Phe Leu
1160
<210> 3
<211> 297
<212> PRT
<213> 智人(Homo sapiens)
<400> 3
Gly Pro Gly Gly Pro Gly Pro Gln Gly Pro Pro Gly Lys Asn Gly Glu
1 5 10 15
Thr Gly Pro Gln Gly Pro Pro Gly Pro Thr Gly Pro Gly Gly Asp Lys
20 25 30
Gly Asp Thr Gly Pro Pro Gly Pro Gln Gly Leu Gln Gly Leu Pro Gly
35 40 45
Thr Gly Gly Pro Pro Gly Glu Asn Gly Lys Pro Gly Glu Pro Gly Pro
50 55 60
Lys Gly Asp Ala Gly Ala Pro Gly Ala Pro Gly Gly Lys Gly Asp Ala
65 70 75 80
Gly Ala Pro Gly Glu Arg Gly Pro Pro Gly Leu Ala Gly Ala Pro Gly
85 90 95
Leu Arg Gly Gly Ala Gly Pro Pro Gly Pro Glu Gly Gly Lys Gly Ala
100 105 110
Ala Gly Pro Pro Gly Pro Pro Gly Ala Ala Gly Thr Pro Gly Leu Gln
115 120 125
Gly Met Pro Gly Glu Arg Gly Gly Leu Gly Ser Pro Lys Gly Asp Lys
130 135 140
Gly Glu Pro Gly Gly Pro Gly Ala Asp Gly Val Pro Gly Lys Asp Gly
145 150 155 160
Pro Arg Gly Pro Thr Gly Pro Ile Gly Pro Pro Gly Pro Ala Gly Gln
165 170 175
Pro Gly Asp Lys Gly Glu Gly Gly Ala Pro Gly Leu Pro Gly Ile Ala
180 185 190
Gly Pro Arg Gly Ser Pro Gly Glu Arg Gly Glu Thr Gly Pro Pro Gly
195 200 205
Pro Ala Gly Phe Pro Gly Ala Pro Gly Gln Asn Gly Glu Pro Gly Gly
210 215 220
Lys Gly Glu Arg Gly Ala Pro Gly Glu Lys Gly Glu Gly Gly Pro Pro
225 230 235 240
Gly Val Ala Gly Pro Pro Gly Lys Asp Gly Thr Ser Gly His Pro Gly
245 250 255
Pro Ile Gly Pro Pro Gly Pro Arg Gly Asn Arg Gly Glu Arg Gly Ser
260 265 270
Glu Gly Ser Pro Gly His Pro Gly Gln Pro Gly Pro Pro Gly Pro Pro
275 280 285
Gly Ala Pro Gly Pro Cys Cys Gly Gly
290 295
<210> 4
<211> 162
<212> PRT
<213> 智人(Homo sapiens)
<400> 4
Gly Leu Gly Ser Pro Lys Gly Asp Lys Gly Glu Pro Gly Gly Pro Gly
1 5 10 15
Ala Asp Gly Val Pro Gly Lys Asp Gly Pro Arg Gly Pro Thr Gly Pro
20 25 30
Ile Gly Pro Pro Gly Pro Ala Gly Gln Pro Gly Asp Lys Gly Glu Gly
35 40 45
Gly Ala Pro Gly Leu Pro Gly Ile Ala Gly Pro Arg Gly Ser Pro Gly
50 55 60
Glu Arg Gly Glu Thr Gly Pro Pro Gly Pro Ala Gly Phe Pro Gly Ala
65 70 75 80
Pro Gly Gln Asn Gly Glu Pro Gly Gly Lys Gly Glu Arg Gly Ala Pro
85 90 95
Gly Glu Lys Gly Glu Gly Gly Pro Pro Gly Val Ala Gly Pro Pro Gly
100 105 110
Lys Asp Gly Thr Ser Gly His Pro Gly Pro Ile Gly Pro Pro Gly Pro
115 120 125
Arg Gly Asn Arg Gly Glu Arg Gly Ser Glu Gly Ser Pro Gly His Pro
130 135 140
Gly Gln Pro Gly Pro Pro Gly Pro Pro Gly Ala Pro Gly Pro Cys Cys
145 150 155 160
Gly Gly
<210> 5
<211> 5
<212> PRT
<213> 人工序列(artificial sequence)
<400> 5
Gly Gly Gly Gly Ser
1 5
<210> 6
<211> 31
<212> PRT
<213> 人工序列(artificial sequence)
<400> 6
His Ala Glu Gly Thr Phe Thr Ser Asp Val Ser Ser Tyr Leu Glu Gly
1 5 10 15
Gln Ala Ala Lys Glu Phe Ile Ala Trp Leu Val Lys Gly Arg Gly
20 25 30
<210> 7
<211> 11
<212> PRT
<213> 人工序列(artificial sequence)
<400> 7
Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Ala
1 5 10
<210> 8
<211> 345
<212> PRT
<213> 人工序列(artificial sequence)
<400> 8
His Gly Glu Gly Thr Phe Thr Ser Asp Val Ser Ser Tyr Leu Glu Glu
1 5 10 15
Gln Ala Ala Lys Glu Phe Ile Ala Trp Leu Val Lys Gly Arg Gly Gly
20 25 30
Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Ala Gly Pro
35 40 45
Gly Gly Pro Gly Pro Gln Gly Pro Pro Gly Lys Asn Gly Glu Thr Gly
50 55 60
Pro Gln Gly Pro Pro Gly Pro Thr Gly Pro Gly Gly Asp Lys Gly Asp
65 70 75 80
Thr Gly Pro Pro Gly Pro Gln Gly Leu Gln Gly Leu Pro Gly Thr Gly
85 90 95
Gly Pro Pro Gly Glu Asn Gly Lys Pro Gly Glu Pro Gly Pro Lys Gly
100 105 110
Asp Ala Gly Ala Pro Gly Ala Pro Gly Gly Lys Gly Asp Ala Gly Ala
115 120 125
Pro Gly Glu Arg Gly Pro Pro Gly Leu Ala Gly Ala Pro Gly Leu Arg
130 135 140
Gly Gly Ala Gly Pro Pro Gly Pro Glu Gly Gly Lys Gly Ala Ala Gly
145 150 155 160
Pro Pro Gly Pro Pro Gly Ala Ala Gly Thr Pro Gly Leu Gln Gly Met
165 170 175
Pro Gly Glu Arg Gly Gly Leu Gly Ser Pro Gly Pro Lys Gly Asp Lys
180 185 190
Gly Glu Pro Gly Gly Pro Gly Ala Asp Gly Val Pro Gly Lys Asp Gly
195 200 205
Pro Arg Gly Pro Thr Gly Pro Ile Gly Pro Pro Gly Pro Ala Gly Gln
210 215 220
Pro Gly Asp Lys Gly Glu Gly Gly Ala Pro Gly Leu Pro Gly Ile Ala
225 230 235 240
Gly Pro Arg Gly Ser Pro Gly Glu Arg Gly Glu Thr Gly Pro Pro Gly
245 250 255
Pro Ala Gly Phe Pro Gly Ala Pro Gly Gln Asn Gly Glu Pro Gly Gly
260 265 270
Lys Gly Glu Arg Gly Ala Pro Gly Glu Lys Gly Glu Gly Gly Pro Pro
275 280 285
Gly Val Ala Gly Pro Pro Gly Lys Asp Gly Thr Ser Gly His Pro Gly
290 295 300
Pro Ile Gly Pro Pro Gly Pro Arg Gly Asn Arg Gly Glu Arg Gly Ser
305 310 315 320
Glu Gly Ser Pro Gly His Pro Gly Gln Pro Gly Pro Pro Gly Pro Pro
325 330 335
Gly Ala Pro Gly Pro Cys Cys Gly Gly
340 345
<210> 9
<211> 210
<212> PRT
<213> 人工序列(artificial sequence)
<400> 9
His Gly Glu Gly Thr Phe Thr Ser Asp Val Ser Ser Tyr Leu Glu Glu
1 5 10 15
Gln Ala Ala Lys Glu Phe Ile Ala Trp Leu Val Lys Gly Arg Gly Gly
20 25 30
Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Ala Gly Leu
35 40 45
Gly Ser Pro Gly Pro Lys Gly Asp Lys Gly Glu Pro Gly Gly Pro Gly
50 55 60
Ala Asp Gly Val Pro Gly Lys Asp Gly Pro Arg Gly Pro Thr Gly Pro
65 70 75 80
Ile Gly Pro Pro Gly Pro Ala Gly Gln Pro Gly Asp Lys Gly Glu Gly
85 90 95
Gly Ala Pro Gly Leu Pro Gly Ile Ala Gly Pro Arg Gly Ser Pro Gly
100 105 110
Glu Arg Gly Glu Thr Gly Pro Pro Gly Pro Ala Gly Phe Pro Gly Ala
115 120 125
Pro Gly Gln Asn Gly Glu Pro Gly Gly Lys Gly Glu Arg Gly Ala Pro
130 135 140
Gly Glu Lys Gly Glu Gly Gly Pro Pro Gly Val Ala Gly Pro Pro Gly
145 150 155 160
Lys Asp Gly Thr Ser Gly His Pro Gly Pro Ile Gly Pro Pro Gly Pro
165 170 175
Arg Gly Asn Arg Gly Glu Arg Gly Ser Glu Gly Ser Pro Gly His Pro
180 185 190
Gly Gln Pro Gly Pro Pro Gly Pro Pro Gly Ala Pro Gly Pro Cys Cys
195 200 205
Gly Gly
210
<210> 10
<211> 1035
<212> DNA
<213> 人工序列(artificial sequence)
<400> 10
cacggtgagg gtacttttac ctctgatgtt tcctcatact tggaagaaca agctgctaag 60
gaattcattg cctggctggt caaaggcaga ggaggtggcg gatccggtgg cggtgggtcc 120
ggaggaggtg gttcagctgg tccaggtggt ccaggtcctc aaggtcctcc aggtaagaat 180
ggtgaaactg gtcctcaggg acctccaggc ccaaccggtc ctggaggtga taagggtgat 240
accggaccac ctggcccaca aggcttgcag ggtctgccag gtacaggggg tccacccggt 300
gaaaacggca agcctggtga accaggccca aaaggtgacg ctggagctcc aggagcccca 360
ggaggtaagg gtgatgctgg tgcccccggt gagagaggcc caccaggttt ggccggtgct 420
cccggtctga gagggggagc tggtccacca ggacctgaag gcggaaaagg tgctgctggt 480
ccacctggac cacctggtgc tgccggaact ccaggactgc agggaatgcc tggtgaaaga 540
ggcggattgg gatctcctgg cccaaaagga gacaagggag agcctggtgg accaggggca 600
gatggagttc ctggaaaaga tggtcctcgt ggtccaacag gacctatcgg tcccccagga 660
cctgctggtc aacctggaga taaaggtgaa ggcggggctc caggattgcc tggtattgcc 720
ggccctagag gttctcccgg tgaaagaggt gagaccggcc cacctggtcc agctggcttc 780
cctggagcac caggtcagaa tggtgagcca ggtggtaagg gtgagagagg agctccaggt 840
gagaaggggg aaggtggtcc acctggtgtt gctggtccac caggtaagga tggtacatcc 900
ggtcatcctg gaccaattgg acctccaggg cctagaggta acaggggtga aaggggatct 960
gaaggatctc ctggacatcc aggtcagccc ggtcctcctg gtccacccgg agctcctggg 1020
ccatgctgtg gtggc 1035
<210> 11
<211> 630
<212> DNA
<213> 人工序列(artificial sequence)
<400> 11
cacggtgagg gtacttttac ctctgatgtt tcctcatact tggaagaaca agctgctaag 60
gaattcattg cctggctggt caaaggcaga ggaggtggcg gatccggtgg cggtgggtcc 120
ggaggaggtg gttcagctgg tttgggatct cctggcccaa aaggagacaa gggagagcct 180
ggtggaccag gggcagatgg agttcctgga aaagatggtc ctcgtggtcc aacaggacct 240
atcggtcccc caggacctgc tggtcaacct ggagataaag gtgaaggcgg ggctccagga 300
ttgcctggta ttgccggccc tagaggttct cccggtgaaa gaggtgagac cggcccacct 360
ggtccagctg gcttccctgg agcaccaggt cagaatggtg agccaggtgg taagggtgag 420
agaggagctc caggtgagaa gggggaaggt ggtccacctg gtgttgctgg tccaccaggt 480
aaggatggta catccggtca tcctggacca attggacctc cagggcctag aggtaacagg 540
ggtgaaaggg gatctgaagg atctcctgga catccaggtc agcccggtcc tcctggtcca 600
cccggagctc ctgggccatg ctgtggtggc 630
<210> 12
<211> 30
<212> PRT
<213> 人工序列(artificial sequence)
<400> 12
His Gly Glu Gly Thr Phe Thr Ser Asp Val Ser Ser Tyr Leu Glu Glu
1 5 10 15
Gln Ala Ala Lys Glu Phe Ile Ala Trp Leu Val Lys Gly Arg
20 25 30
<210> 13
<211> 1210
<212> PRT
<213> 人工序列(artificial sequence)
<400> 13
His Gly Glu Gly Thr Phe Thr Ser Asp Val Ser Ser Tyr Leu Glu Glu
1 5 10 15
Gln Ala Ala Lys Glu Phe Ile Ala Trp Leu Val Lys Gly Arg Gly Gly
20 25 30
Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Ala Ala Met
35 40 45
Met Ser Phe Val Gln Lys Gly Ser Trp Leu Leu Leu Ala Leu Leu His
50 55 60
Pro Thr Ile Ile Leu Ala Gln Gln Glu Ala Val Glu Gly Gly Cys Ser
65 70 75 80
His Leu Gly Gln Ser Tyr Ala Asp Arg Asp Val Trp Lys Pro Glu Pro
85 90 95
Cys Gln Ile Cys Val Cys Asp Ser Gly Ser Val Leu Cys Asp Asp Ile
100 105 110
Ile Cys Asp Asp Gln Glu Leu Asp Cys Pro Asn Pro Glu Ile Pro Phe
115 120 125
Gly Glu Cys Cys Ala Val Cys Pro Gln Pro Pro Thr Ala Pro Thr Arg
130 135 140
Pro Pro Asn Gly Gln Gly Pro Gln Gly Pro Lys Gly Asp Pro Gly Pro
145 150 155 160
Pro Gly Ile Pro Gly Arg Asn Gly Asp Pro Gly Ile Pro Gly Gln Pro
165 170 175
Gly Ser Pro Gly Ser Pro Gly Pro Pro Gly Ile Cys Glu Ser Cys Pro
180 185 190
Thr Gly Pro Gln Asn Tyr Ser Pro Gln Tyr Asp Ser Tyr Asp Val Lys
195 200 205
Ser Gly Val Ala Val Gly Gly Leu Ala Gly Tyr Pro Gly Pro Ala Gly
210 215 220
Pro Pro Gly Pro Pro Gly Pro Pro Gly Thr Ser Gly His Pro Gly Ser
225 230 235 240
Pro Gly Ser Pro Gly Tyr Gln Gly Pro Pro Gly Glu Pro Gly Gln Ala
245 250 255
Gly Pro Ser Gly Pro Pro Gly Pro Pro Gly Ala Ile Gly Pro Ser Gly
260 265 270
Pro Ala Gly Lys Asp Gly Glu Ser Gly Arg Pro Gly Arg Pro Gly Glu
275 280 285
Arg Gly Leu Pro Gly Pro Pro Gly Ile Lys Gly Pro Ala Gly Ile Pro
290 295 300
Gly Phe Pro Gly Met Lys Gly His Arg Gly Phe Asp Gly Arg Asn Gly
305 310 315 320
Glu Lys Gly Glu Thr Gly Ala Pro Gly Leu Lys Gly Glu Asn Gly Leu
325 330 335
Pro Gly Glu Asn Gly Ala Pro Gly Pro Met Gly Pro Arg Gly Ala Pro
340 345 350
Gly Glu Arg Gly Arg Pro Gly Leu Pro Gly Ala Ala Gly Ala Arg Gly
355 360 365
Asn Asp Gly Ala Arg Gly Ser Asp Gly Gln Pro Gly Pro Pro Gly Pro
370 375 380
Pro Gly Thr Ala Gly Phe Pro Gly Ser Pro Gly Ala Lys Gly Glu Val
385 390 395 400
Gly Pro Ala Gly Ser Pro Gly Ser Asn Gly Ala Pro Gly Gln Arg Gly
405 410 415
Glu Pro Gly Pro Gln Gly His Ala Gly Ala Gln Gly Pro Pro Gly Pro
420 425 430
Pro Gly Ile Asn Gly Ser Pro Gly Gly Lys Gly Glu Met Gly Pro Ala
435 440 445
Gly Ile Pro Gly Ala Pro Gly Leu Met Gly Ala Arg Gly Pro Pro Gly
450 455 460
Pro Ala Gly Ala Asn Gly Ala Pro Gly Leu Arg Gly Gly Ala Gly Glu
465 470 475 480
Pro Gly Lys Asn Gly Ala Lys Gly Glu Pro Gly Pro Arg Gly Glu Arg
485 490 495
Gly Glu Ala Gly Ile Pro Gly Val Pro Gly Ala Lys Gly Glu Asp Gly
500 505 510
Lys Asp Gly Ser Pro Gly Glu Pro Gly Ala Asn Gly Leu Pro Gly Ala
515 520 525
Ala Gly Glu Arg Gly Ala Pro Gly Phe Arg Gly Pro Ala Gly Pro Asn
530 535 540
Gly Ile Pro Gly Glu Lys Gly Pro Ala Gly Glu Arg Gly Ala Pro Gly
545 550 555 560
Pro Ala Gly Pro Arg Gly Ala Ala Gly Glu Pro Gly Arg Asp Gly Val
565 570 575
Pro Gly Gly Pro Gly Met Arg Gly Met Pro Gly Ser Pro Gly Gly Pro
580 585 590
Gly Ser Asp Gly Lys Pro Gly Pro Pro Gly Ser Gln Gly Glu Ser Gly
595 600 605
Arg Pro Gly Pro Pro Gly Pro Ser Gly Pro Arg Gly Gln Pro Gly Val
610 615 620
Met Gly Phe Pro Gly Pro Lys Gly Asn Asp Gly Ala Pro Gly Lys Asn
625 630 635 640
Gly Glu Arg Gly Gly Pro Gly Gly Pro Gly Pro Gln Gly Pro Pro Gly
645 650 655
Lys Asn Gly Glu Thr Gly Pro Gln Gly Pro Pro Gly Pro Thr Gly Pro
660 665 670
Gly Gly Asp Lys Gly Asp Thr Gly Pro Pro Gly Pro Gln Gly Leu Gln
675 680 685
Gly Leu Pro Gly Thr Gly Gly Pro Pro Gly Glu Asn Gly Lys Pro Gly
690 695 700
Glu Pro Gly Pro Lys Gly Asp Ala Gly Ala Pro Gly Ala Pro Gly Gly
705 710 715 720
Lys Gly Asp Ala Gly Ala Pro Gly Glu Arg Gly Pro Pro Gly Leu Ala
725 730 735
Gly Ala Pro Gly Leu Arg Gly Gly Ala Gly Pro Pro Gly Pro Glu Gly
740 745 750
Gly Lys Gly Ala Ala Gly Pro Pro Gly Pro Pro Gly Ala Ala Gly Thr
755 760 765
Pro Gly Leu Gln Gly Met Pro Gly Glu Arg Gly Gly Leu Gly Ser Pro
770 775 780
Gly Pro Lys Gly Asp Lys Gly Glu Pro Gly Gly Pro Gly Ala Asp Gly
785 790 795 800
Val Pro Gly Lys Asp Gly Pro Arg Gly Pro Thr Gly Pro Ile Gly Pro
805 810 815
Pro Gly Pro Ala Gly Gln Pro Gly Asp Lys Gly Glu Gly Gly Ala Pro
820 825 830
Gly Leu Pro Gly Ile Ala Gly Pro Arg Gly Ser Pro Gly Glu Arg Gly
835 840 845
Glu Thr Gly Pro Pro Gly Pro Ala Gly Phe Pro Gly Ala Pro Gly Gln
850 855 860
Asn Gly Glu Pro Gly Gly Lys Gly Glu Arg Gly Ala Pro Gly Glu Lys
865 870 875 880
Gly Glu Gly Gly Pro Pro Gly Val Ala Gly Pro Pro Gly Lys Asp Gly
885 890 895
Thr Ser Gly His Pro Gly Pro Ile Gly Pro Pro Gly Pro Arg Gly Asn
900 905 910
Arg Gly Glu Arg Gly Ser Glu Gly Ser Pro Gly His Pro Gly Gln Pro
915 920 925
Gly Pro Pro Gly Pro Pro Gly Ala Pro Gly Pro Cys Cys Gly Gly Val
930 935 940
Gly Ala Ala Ala Ile Ala Gly Ile Gly Gly Glu Lys Ala Gly Gly Phe
945 950 955 960
Ala Pro Tyr Tyr Gly Asp Glu Pro Met Asp Phe Lys Ile Asn Thr Asp
965 970 975
Glu Ile Met Thr Ser Leu Lys Ser Val Asn Gly Gln Ile Glu Ser Leu
980 985 990
Ile Ser Pro Asp Gly Ser Arg Lys Asn Pro Ala Arg Asn Cys Arg Asp
995 1000 1005
Leu Lys Phe Cys His Pro Glu Leu Lys Ser Gly Glu Tyr Trp Val
1010 1015 1020
Asp Pro Asn Gln Gly Cys Lys Leu Asp Ala Ile Lys Val Phe Cys
1025 1030 1035
Asn Met Glu Thr Gly Glu Thr Cys Ile Ser Ala Asn Pro Leu Asn
1040 1045 1050
Val Pro Arg Lys His Trp Trp Thr Asp Ser Ser Ala Glu Lys Lys
1055 1060 1065
His Val Trp Phe Gly Glu Ser Met Asp Gly Gly Phe Gln Phe Ser
1070 1075 1080
Tyr Gly Asn Pro Glu Leu Pro Glu Asp Val Leu Asp Val Gln Leu
1085 1090 1095
Ala Phe Leu Arg Leu Leu Ser Ser Arg Ala Ser Gln Asn Ile Thr
1100 1105 1110
Tyr His Cys Lys Asn Ser Ile Ala Tyr Met Asp Gln Ala Ser Gly
1115 1120 1125
Asn Val Lys Lys Ala Leu Lys Leu Met Gly Ser Asn Glu Gly Glu
1130 1135 1140
Phe Lys Ala Glu Gly Asn Ser Lys Phe Thr Tyr Thr Val Leu Glu
1145 1150 1155
Asp Gly Cys Thr Lys His Thr Gly Glu Trp Ser Lys Thr Val Phe
1160 1165 1170
Glu Tyr Arg Thr Arg Lys Ala Val Arg Leu Pro Ile Val Asp Ile
1175 1180 1185
Ala Pro Tyr Asp Ile Gly Gly Pro Asp Gln Glu Phe Gly Val Asp
1190 1195 1200
Val Gly Pro Val Cys Phe Leu
1205 1210

Claims (10)

1.一种融合蛋白,其特征在于,所述融合蛋白的结构如下式I所示:
A-L-B (I)
式中,A为GLP-1类似物,B为人Ⅲ型胶原α1链,L为无或连接肽,各“-”独立地为连接肽或肽键;且
所述GLP-1类似物具有SEQ ID NO.:1所示氨基酸序列的多肽,
His-Xaa8-Glu-Gly-Thr-Phe-Thr-Ser-Asp-Val-Ser-Ser-Tyr-Leu-Glu-Xaa22-Gln-Ala-Ala-Lys-Glu-Phe-Ile-Ala-Trp-Leu-Val-Lys-Gly-Arg-Xaa37
其中Xaa8是Gly或Ala,Xaa22是Glu或Gly,Xaa37是Gly或无。
2.如权利要求1所述的融合蛋白,其特征在于,所述GLP-1类似物具有如SEQ ID NO.:6或12所示的氨基酸序列。
3.如权利要求1所述的融合蛋白,其特征在于,所述人Ⅲ型胶原α1链具有SEQ ID NO.:2、3或4所示的氨基酸序列。
4.如权利要求1所述的融合蛋白,其特征在于,所述融合蛋白具有SEQ ID NO.:8、9或13所示的氨基酸序列。
5.一种寡聚体,其特征在于,所述寡聚体包含权利要求1所述的融合蛋白。
6.一种分离的多核苷酸,其特征在于,所述多核苷酸编码权利要求1所述的融合蛋白。
7.一种载体,其特征在于,所述载体包括权利要求6所述的多核苷酸。
8.一种宿主细胞,其特征在于,所述的宿主细胞含有权利要求7所述的载体、或染色体中整合有外源的权利要求6所述的多核苷酸、或表达权利要求1所述的融合蛋白、或表达权利要求5所述的寡聚体。
9.一种药物组合物,其特征在于,所述药物组合物包括权利要求1所述的融合蛋白或权利要求5所述的寡聚体,以及药学上可接受的载体或赋形剂。
10.如权利要求1所述的融合蛋白、权利要求5所述的寡聚体、权利要求6所述的多核苷酸、权利要求7所述的载体、权利要求8所述的宿主细胞,其特征在于,用于制备预防和/或治疗糖尿病的药物或制剂。
CN201810089639.XA 2018-01-30 2018-01-30 一种glp-1类似物-col3a1融合蛋白 Withdrawn CN110092835A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810089639.XA CN110092835A (zh) 2018-01-30 2018-01-30 一种glp-1类似物-col3a1融合蛋白

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810089639.XA CN110092835A (zh) 2018-01-30 2018-01-30 一种glp-1类似物-col3a1融合蛋白

Publications (1)

Publication Number Publication Date
CN110092835A true CN110092835A (zh) 2019-08-06

Family

ID=67442488

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810089639.XA Withdrawn CN110092835A (zh) 2018-01-30 2018-01-30 一种glp-1类似物-col3a1融合蛋白

Country Status (1)

Country Link
CN (1) CN110092835A (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114539390A (zh) * 2022-03-02 2022-05-27 广州美神生物科技有限公司 一种重组ⅲ型人源化胶原蛋白c3及其表达载体、表达菌株、表达方法和应用
CN114805551A (zh) * 2022-06-28 2022-07-29 华熙生物科技股份有限公司 一种重组iii型胶原蛋白及其制备方法
CN116284340A (zh) * 2023-02-01 2023-06-23 美尔健(深圳)生物科技有限公司 基于伴侣肽的透皮增强型重组人源三型胶原蛋白及其应用
CN116813751A (zh) * 2023-08-04 2023-09-29 山西锦波生物医药股份有限公司 自交联重组人源化胶原蛋白高分子生物材料及其制备方法
CN116874590A (zh) * 2023-08-16 2023-10-13 医械妆(广州)技术服务有限公司 一种重组iii型胶原蛋白及其制备方法
CN117384276A (zh) * 2023-12-11 2024-01-12 上海昱菘医药科技有限公司 一种重组胶原蛋白及其制备方法和用途
CN118359703A (zh) * 2024-06-19 2024-07-19 山东福瑞达生物股份有限公司 一种重组透皮类胶原蛋白及其制备方法和应用

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030064436A1 (en) * 1996-10-29 2003-04-03 Vaughan Paul Richard Method for producing, in yeast, a hydroxylated triple helical protein, and yeast host cells useful in said method
CN1483041A (zh) * 2000-12-07 2004-03-17 Glp-1融合蛋白
CN102164949A (zh) * 2009-11-19 2011-08-24 浙江大学 新型重组融合蛋白
CN103641896A (zh) * 2009-11-19 2014-03-19 浙江大学 明胶样单元的用途
CN104870478A (zh) * 2012-12-24 2015-08-26 北京安信怀德生物技术有限公司 具有改善的药代动力学性质的治疗性多肽融合蛋白及其应用
US20160194370A1 (en) * 2012-12-24 2016-07-07 Beijing Anxinhuaide Biotech. Co., Ltd. Fusion protein of therapeutic polypeptide with improved pharmacokinetic profile and use therof

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030064436A1 (en) * 1996-10-29 2003-04-03 Vaughan Paul Richard Method for producing, in yeast, a hydroxylated triple helical protein, and yeast host cells useful in said method
CN1483041A (zh) * 2000-12-07 2004-03-17 Glp-1融合蛋白
CN102164949A (zh) * 2009-11-19 2011-08-24 浙江大学 新型重组融合蛋白
US20130203959A1 (en) * 2009-11-19 2013-08-08 Zhejiang University Nonnatural collagen-like protein and use thereof
CN103641896A (zh) * 2009-11-19 2014-03-19 浙江大学 明胶样单元的用途
CN104870478A (zh) * 2012-12-24 2015-08-26 北京安信怀德生物技术有限公司 具有改善的药代动力学性质的治疗性多肽融合蛋白及其应用
US20160194370A1 (en) * 2012-12-24 2016-07-07 Beijing Anxinhuaide Biotech. Co., Ltd. Fusion protein of therapeutic polypeptide with improved pharmacokinetic profile and use therof

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
"COL3A1 protein [Homo sapiens]" *
LEENA ALA-KOKKO等: "Structure of cDNA clones coding for the entire preproxl(III) chain of human type III procollagen. Differences in protein structure from type I procollagen and conservation of codon preferences" *

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114539390A (zh) * 2022-03-02 2022-05-27 广州美神生物科技有限公司 一种重组ⅲ型人源化胶原蛋白c3及其表达载体、表达菌株、表达方法和应用
CN114805551A (zh) * 2022-06-28 2022-07-29 华熙生物科技股份有限公司 一种重组iii型胶原蛋白及其制备方法
CN116284340A (zh) * 2023-02-01 2023-06-23 美尔健(深圳)生物科技有限公司 基于伴侣肽的透皮增强型重组人源三型胶原蛋白及其应用
CN116284340B (zh) * 2023-02-01 2024-06-25 美尔健(深圳)生物科技有限公司 基于伴侣肽的透皮增强型重组人源三型胶原蛋白及其应用
CN116813751A (zh) * 2023-08-04 2023-09-29 山西锦波生物医药股份有限公司 自交联重组人源化胶原蛋白高分子生物材料及其制备方法
CN116874590A (zh) * 2023-08-16 2023-10-13 医械妆(广州)技术服务有限公司 一种重组iii型胶原蛋白及其制备方法
CN116874590B (zh) * 2023-08-16 2024-06-07 医械妆(广州)技术服务有限公司 一种重组iii型胶原蛋白及其制备方法
CN117384276A (zh) * 2023-12-11 2024-01-12 上海昱菘医药科技有限公司 一种重组胶原蛋白及其制备方法和用途
CN118359703A (zh) * 2024-06-19 2024-07-19 山东福瑞达生物股份有限公司 一种重组透皮类胶原蛋白及其制备方法和应用
CN118359703B (zh) * 2024-06-19 2024-08-16 山东福瑞达生物股份有限公司 一种重组透皮类胶原蛋白及其制备方法和应用

Similar Documents

Publication Publication Date Title
CN110092835A (zh) 一种glp-1类似物-col3a1融合蛋白
CN114805551B (zh) 一种重组iii型胶原蛋白及其制备方法
CN113502296B (zh) 一种表达司美鲁肽前体的重组工程菌及其构建方法
WO2012062078A1 (zh) 人成纤维细胞生长因子21的n末端缺失型变异体及其偶联物
CA2565300A1 (en) Fgf-21 fusion proteins
CN106432509B (zh) 一种治疗代谢疾病的重组人成纤维细胞生长因子21融合蛋白及其制备方法和应用
US20210253662A1 (en) Long-Acting Recombinant GLP1-Fc-CD47 Protein and Preparation and Use Thereof
CN101875700B (zh) 一种增加促胰岛素分泌肽融合蛋白生物活性的方法
CN106397607A (zh) 重组人成纤维细胞生长因子21融合蛋白及其在制备治疗代谢疾病药物中的应用
CN113683680A (zh) 一种重组ⅰ型人源化胶原蛋白c1l1t及其制备方法和用途
CN113683679A (zh) 一种重组i型人源化胶原蛋白c1l6t及其制备方法和用途
CN113278060B (zh) Glp-1/胰高血糖素双重激动剂融合蛋白
CN113265007A (zh) 一种治疗代谢疾病的融合蛋白及其制备方法和应用
CN113583142A (zh) 双靶点融合蛋白、编码基因、载体或宿主细胞及其应用与表达和纯化方法
CN115991793A (zh) 具有多重活性的融合蛋白及其应用
CN110172103B (zh) GLP-1类似物-Fc融合蛋白及其制备方法和用途
CN113105561B (zh) 一种双靶点融合蛋白的制备方法和应用
CN112851791B (zh) 一种新型抗代谢紊乱的fgf类似物及其应用
JP6612360B2 (ja) 薬用作用を有する融合タンパク質複合体および融合タンパク質
CN105884901B (zh) 具持续控制血糖含量功能的重组人血清白蛋白/胰高糖素类肽融合蛋白
CN108794634A (zh) 重组的长效人生长激素融合蛋白及其制备和用途
CN101062948B (zh) 单体速效胰岛素及其制法和用途
CN1692121A (zh) 一种编码鸡ⅱ型胶原蛋白的全长多核苷酸序列及其用途
CN116284441B (zh) 具有三重活性的融合蛋白及其应用
JPH0380096A (ja) モチリン様ポリペプチドの製法並びにそのための組換えdna及び発現用プラスミド

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20210618

Address after: Room 205, West District, 2nd floor, no.707 Zhangyang Road, China (Shanghai) pilot Free Trade Zone, Pudong New Area, Shanghai, 200120

Applicant after: Shanghai Huidun Yintai Biotechnology Co.,Ltd.

Address before: 200433 rooms 309, 311, 313, 316, No. 135, Guowei Road, Yangpu District, Shanghai

Applicant before: SHANGHAI HUIDUN BIOTECHNOLOGY Co.,Ltd.

WW01 Invention patent application withdrawn after publication
WW01 Invention patent application withdrawn after publication

Application publication date: 20190806