CN110092835A

CN110092835A - 一种glp-1类似物-col3a1融合蛋白

Info

Publication number: CN110092835A
Application number: CN201810089639.XA
Authority: CN
Inventors: 陈国友
Original assignee: SHANGHAI HUIDUN BIOTECHNOLOGY Co Ltd
Current assignee: Shanghai Huidun Yintai Biotechnology Co ltd
Priority date: 2018-01-30
Filing date: 2018-01-30
Publication date: 2019-08-06

Abstract

本发明涉及一种GLP‑1类似物‑COL3A1融合蛋白。具体地，所述融合蛋白包含胰高血糖素样肽1类似物和的人Ⅲ型胶原α1链的融合蛋白，所述融合蛋白具有胰高血糖素样肽1的降低血糖作用，并具有延长的体内半衰期。

Description

一种GLP-1类似物-COL3A1融合蛋白

技术领域

本发明涉及医药领域，具体地涉及一种GLP-1类似物-COL3A1融合蛋白。

背景技术

糖尿病是一种严重的慢性疾病，主要是由高血糖和内源性胰岛素的分泌不足和功能丧失导致。糖尿病会引起多种并发症，比如血管系统、肾脏、视网膜、晶状体、周围神经和皮肤等，进而影响寿命和生活质量。随着世界各国社会经济的发展和居民生活水平的提高，糖尿病的发病率及患病率逐年上升，糖尿病已经成为继肿瘤、心脑血管疾病之后第三位严重危害人类健康的慢性疾病。糖尿病基本分为四类，包括：Ⅰ型(胰岛素依赖型)、Ⅱ型(非胰岛素依赖型)、其他型和妊娠糖尿病。其中，Ⅱ型糖尿病是目前最常见的糖尿病，约占糖尿病患者的90％。Ⅱ型糖尿病是一种病因复杂、以血糖升高为特征的代谢性疾病，中国Ⅱ型糖尿病患者在过去二十多年中呈爆炸式增长。

目前Ⅱ型糖尿病的治疗主要以口服降糖药为主，有磺脲类物如格列本、格列齐特、二甲双胍和胰岛素等。但是长期使用这些药物治疗会产生耐受，无法长期控制血糖和细胞功能的紊乱。因此，研发一种更加安全、有效针对糖尿病发病机制的新型药物尤为重要。

胰高血糖素样肽1(GLP-1)是由位于胃肠道黏膜L细胞分泌的一种肠促胰素，GLP-1的分泌是血糖依赖性的，即当血糖浓度高于正常时，GLP-1呈现促胰岛素分泌作用，而当血糖浓度正常时，GLP-1的促胰岛素分泌作用减弱，因此外源性GLP-1治疗不会增加低血糖风险。此外，GLP-1通过与胰岛α细胞的受体结合，增加胰岛素分泌和生物合成，有效的降低血糖；促进胰岛β细胞增殖、抑制其调凋亡，增加葡萄糖依赖性的胰岛素分泌；能够减弱胃肠道蠕动，延缓胃排空，减少食物摄入；作用于下丘脑，降低食欲，从而减轻体重。基于以上特点，GLP-1已经成为新型Ⅱ型糖尿病治疗药物的开发热点。

天然的GLP-1在体内极不稳定，释放后很容易二肽基肽酶4(DPP-4)快速降解，其在体内的半衰期仅为1～2min，不具备成药性。2005年国际上第一个GLP-1受体激动剂药物艾塞那肽上市，它是一种来源于蜥蜴唾液的GLP-1类似物，与人GLP-1具有50％的同源性。稍后上市的利拉鲁肽，是人工合成的GLP-1类似物，与人GLP-1具有97％的同源性，因此其有效性提升的同时其副作用相比艾塞那肽大大降低。但利拉鲁肽与艾塞那肽一样，都需要每日皮下注射给药，在药物的易用性方面仍存在一定劣势，因此对GLP-1进行结构修饰，在保留其生物学效应的同时延长其体内半衰期已经成为GLP-1药物的研发方向。而与人免疫球蛋白IgG Fc部分结合的人源GLP-1改构体度拉糖肽，利用了IgG长循环半衰期的特点，在效果不劣于利拉鲁肽的同时，可以达到一周一次给药，是目前同类产品中最理想的产品。但是度拉糖肽中的IgG的Fc段可能具有ADCC(Antibody-Dependent Cell Cytotoxicity，抗体依赖细胞介导的细胞毒性作用)作用，具有潜在的免疫原性及副反应。

因此，本领域亟需开发一种新型、安全、并能长期有效治疗糖尿病的药物。

发明内容

本发明的目的是提供一种新型、安全、并能长期有效治疗糖尿病的药物。

本发明的第一方面，提供了一种融合蛋白，所述融合蛋白的结构如下式I所示：

A-L-B (I)

式中，A为GLP-1类似物，B为人Ⅲ型胶原α1链，L为无或连接肽，各“-”独立地为连接肽或肽键；且

所述GLP-1类似物具有SEQ ID NO.:1所示氨基酸序列的多肽，

His-Xaa₈-Glu-Gly-Thr-Phe-Thr-Ser-Asp-Val-Ser-Ser-Tyr-Leu-Glu-Xaa₂₂-Gln-Ala-Ala-Lys-Glu-Phe-Ile-Ala-Trp-Leu-Val-Lys-Gly-Arg-Xaa₃₇

其中Xaa₈是Gly或Ala，Xaa₂₂是Glu或Gly，Xaa₃₇是Gly或无。

在另一优选例中，所述GLP-1类似物在对应于SEQ ID NO.:6所示的序列中存在选自下组的氨基酸突变：第2位甘氨酸(Ala)、第16位甘氨酸(Gly)、第31位甘氨酸(Gly)、或其组合。

在另一优选例中，所述GLP-1类似物在对应于SEQ ID NO.:6所示的序列中存在选自的突变：A2G、G16E、缺失G31、或其组合。

在另一优选例中，所述GLP-1类似物除所述突变(如第2、16、31位氨基酸)外，其余氨基酸与SEQ ID NO.:6所示的序列相同或基本相同。

在另一优选例中，所述GLP-1类似物具有如SEQ ID NO.:6或12所示的氨基酸序列。

在另一优选例中，所述人Ⅲ型胶原α1链(即COL3A1)为COL3A1蛋白全长或片段，其中所述片段选自下组：COL3A1_598-896片段、COL3A1_733-896片段、或其组合。

在另一优选例中，所述COL3A1蛋白全长具有SEQ ID NO.:2所示的氨基酸序列。

在另一优选例中，所述COL3A1_598-896片段为COL3A1蛋白中第598-896位氨基酸序列。

在另一优选例中，所述COL3A1_598-896片段具有SEQ ID NO.:3所示的氨基酸序列。

在另一优选例中，所述COL3A1_733-896片段为COL3A1蛋白中第733-896位氨基酸序列。

在另一优选例中，所述COL3A1_733-896片段具有SEQ ID NO.:4所示的氨基酸序列。

在另一优选例中，所述人Ⅲ型胶原α1链具有SEQ ID NO.:2、3或4所示的氨基酸序列。

在另一优选例中，所述连接肽为具有n个重复的如SEQ ID NO.:5(Gly-Gly-Gly-Gly-Ser)所示的序列，并且其C端还连接有一个丙氨酸(Ala)的多肽，其中n为2-6，优选地n为2。

在另一优选例中，所述连接肽具有SEQ ID NO.:7所示的氨基酸序列。

在另一优选例中，所述融合蛋白具有SEQ ID NO.:8、9或13所示的氨基酸序列。

本发明的第二方面，提供了一种寡聚体，所述寡聚体包含本发明第一方面所述的融合蛋白。

在另一优选例中，所述寡聚体为二聚体、三聚体、四聚体或五聚体。

在另一优选例中，所述寡聚体为本发明第一方面所述的融合蛋白的二聚体。

本发明的第三方面，提供了一种分离的多核苷酸，所述多核苷酸编码本发明第一方面所述的融合蛋白。

在另一优选例中，所述GLP-1类似物的编码序列如SEQ ID NO.:10中第1-90位所示。

在另一优选例中，所述COL3A1_598-896片段的编码序列如SEQ ID NO.:10中第139-1035位所示。

在另一优选例中，所述COL3A1_733-896片段的编码序列如SEQ ID NO.:11中第139-630位所示。

在另一优选例中，所述多核苷酸具有如SEQ ID NO.:10或11所示的序列。

本发明的第四方面，提供了一种载体，所述载体包括本发明第三方面所述的多核苷酸。

在另一优选例中，所述的载体选自下组：DNA、RNA、质粒、慢病毒载体、腺病毒载体、逆转录病毒载体、转座子、或其组合。

在另一优选例中，所述载体为质粒，优选地pUC57质粒。

本发明的第五方面，提供了一种宿主细胞，所述的宿主细胞含有本发明第四方面所述的载体、或染色体中整合有外源的本发明第三方面所述的多核苷酸、或表达本发明第一方面所述的融合蛋白、或表达本发明第二方面所述的寡聚体。

在另一优选例中，所述宿主细胞为酵母，优选地毕赤酵母细胞，更优选地毕赤酵母细胞GS115。

本发明的第六方面，提供了一种药物组合物，所述药物组合物包括本发明第一方面所述的融合蛋白或本发明第二方面所述的寡聚体，以及药学上可接受的载体或赋形剂。

在另一优选例中，所述药物组合物用于治疗非胰岛素依赖型糖尿病或其相关疾病。

本发明的第七方面，提供了如本发明第一方面所述的融合蛋白、本发明第二方面所述的寡聚体、本发明第三方面所述的多核苷酸、本发明第四方面所述的载体、本发明第五方面所述的宿主细胞，用于制备预防和/或治疗糖尿病的药物或制剂。

在另一优选例中，所述糖尿病为非胰岛素依赖型糖尿病或其相关疾病。

在本发明的第八方面，提供了一种本发明第一方面所述的融合蛋白、本发明第二方面所述的寡聚体或本发明第六方面所述的药物组合物的用途，用于预防和/或治疗糖尿病，优选地非胰岛素依赖型糖尿病或其相关疾病。

本发明的第九方面，提供了一种治疗疾病的方法，包括给需要治疗的对象施用适量的本发明第一方面所述的融合蛋白、本发明第二方面所述的寡聚体或本发明第六方面所述的药物组合物。

在另一优选例中，所述疾病为非胰岛素依赖型糖尿病或其相关疾病。

应理解，在本发明范围内中，本发明的上述各技术特征和在下文(如实施例)中具体描述的各技术特征之间都可以互相组合，从而构成新的或优选的技术方案。限于篇幅，在此不再一一累述。

附图说明

图1显示了pPic9m-GLP-COL-1表达质粒的构建图。

图2显示了pPic9m-GLP-COL-2质粒结构图。

图3显示了纯化后GLP-1-2L-COL_598-896及GLP-1-2L-COL_733-896融合蛋白的电泳纯度分析结果。

图4显示了GLP-1-2L-COL_598-896及GLP-1-2L-COL_733-896融合蛋白的GLP-1R受体激活活性分析。

图5显示了GLP-1-2L-COL_598-896及GLP-1-2L-COL_733-896融合蛋白的体内半衰期分析结果。

具体实施方式

本发明人经过广泛而深入的研究，意外地获得了一种安全、长期有效治疗非胰岛素依赖型糖尿病的药物。所述药物是一种GLP-1类似物-COL3A1融合蛋白，包含胰高血糖素样肽1类似物和的人Ⅲ型胶原α1链的融合蛋白，所述融合蛋白具有胰高血糖素样肽1的降低血糖作用，并具有延长的体内半衰期。本发明还对胰高血糖素样肽1类似物进行了突变，降低GLP-1类似物对DPP-4水解的敏感性，活性提高，免疫原性降低。本发明还筛选出两种人COL3A1片段(SEQ ID NO.:3和SEQ ID NO.:4所示)，保留了人COL3A1形成同源三聚体的能力同时有利于本发明中异源融合蛋白的重组表达，避免过长的氨基酸序列导致重组表达的困难。本发明融合蛋白质可用于治疗Ⅱ型糖尿病和各种相关状况。在此基础上，发明人完成了本发明。

融合蛋白

如本文所用，“本发明融合蛋白”、“重组融合蛋白”或“多肽”均指本发明第一方面所述的融合蛋白。本发明融合蛋白的结构如下式I所示：

A-L-B (I)

所述GLP-1类似物具有SEQ ID NO.:1所示氨基酸序列的多肽，

其中Xaa₈是Gly或Ala，Xaa₂₂是Glu或Gly，Xaa₃₇是Gly或无。

如本文所用，术语“融合蛋白”还包括具有上述活性的、SEQ ID NO.:8、9或13序列的变异形式。这些变异形式包括(但并不限于)：1-3个(通常为1-2个，更佳地1个)氨基酸的缺失、插入和/或取代，以及在C末端和/或N末端添加或缺失一个或数个(通常为3个以内，较佳地为2个以内，更佳地为1个以内)氨基酸。例如，在本领域中，用性能相近或相似的氨基酸进行取代时，通常不会改变蛋白质的功能。又比如，在C末端和/或N末端添加或缺失一个或数个氨基酸通常也不会改变蛋白质的结构和功能。此外，所述术语还包括单体和多聚体形式的本发明多肽。该术语还包括线性以及非线性的多肽(如环肽)。

本发明还包括上述融合蛋白的活性片段、衍生物和类似物。如本文所用，术语“片段”、“衍生物”和“类似物”是指基本上保持本发明融合蛋白的功能或活性的多肽。本发明的多肽片段、衍生物或类似物可以是(i)有一个或几个保守或非保守性氨基酸残基(优选保守性氨基酸残基)被取代的多肽，或(ii)在一个或多个氨基酸残基中具有取代基团的多肽，或(iii)抗原肽与另一个化合物(比如延长多肽半衰期的化合物，例如聚乙二醇)融合所形成的多肽，或(iv)附加的氨基酸序列融合于此多肽序列而形成的多肽(与前导序列、分泌序列或6His等标签序列融合而形成的融合蛋白)。根据本文的教导，这些片段、衍生物和类似物属于本领域熟练技术人员公知的范围。

一类优选的活性衍生物指与式I的氨基酸序列相比，有至多3个，较佳地至多2个，更佳地至多1个氨基酸被性质相似或相近的氨基酸所替换而形成多肽。这些保守性变异多肽最好根据表A进行氨基酸替换而产生。

表A

最初的残基	代表性的取代	优选的取代
			Ala(A)	Val；Leu；Ile	Val
Arg(R)	Lys；Gln；Asn	Lys
			Asn(N)	Gln；His；Lys；Arg	Gln
Asp(D)	Glu	Glu
			Cys(C)	Ser	Ser
Gln(Q)	Asn	Asn
			Glu(E)	Asp	Asp
Gly(G)	Pro；Ala	Ala
			His(H)	Asn；Gln；Lys；Arg	Arg
Ile(I)	Leu；Val；Met；Ala；Phe	Leu
			Leu(L)	Ile；Val；Met；Ala；Phe	Ile
Lys(K)	Arg；Gln；Asn	Arg
			Met(M)	Leu；Phe；Ile	Leu
Phe(F)	Leu；Val；Ile；Ala；Tyr	Leu
			Pro(P)	Ala	Ala
Ser(S)	Thr	Thr
			Thr(T)	Ser	Ser
Trp(W)	Tyr；Phe	Tyr
			Tyr(Y)	Trp；Phe；Thr；Ser	Phe
Val(V)	Ile；Leu；Met；Phe；Ala	Leu

本发明还提供本发明融合蛋白的类似物。这些类似物与SEQ ID NO.:8、9或13所示的多肽的差别可以是氨基酸序列上的差异，也可以是不影响序列的修饰形式上的差异，或者兼而有之。类似物还包括具有不同于天然L-氨基酸的残基(如D-氨基酸)的类似物，以及具有非天然存在的或合成的氨基酸(如β、γ-氨基酸)的类似物。应理解，本发明的多肽并不限于上述例举的代表性的多肽。

修饰(通常不改变一级结构)形式包括：体内或体外的多肽的化学衍生形式如乙酰化或羧基化。修饰还包括糖基化，如那些在多肽的合成和加工中或进一步加工步骤中进行糖基化修饰而产生的多肽。这种修饰可以通过将多肽暴露于进行糖基化的酶(如哺乳动物的糖基化酶或去糖基化酶)而完成。修饰形式还包括具有磷酸化氨基酸残基(如磷酸酪氨酸，磷酸丝氨酸，磷酸苏氨酸)的序列。还包括被修饰从而提高了其抗蛋白水解性能或优化了溶解性能的多肽。

本发明的化合物包括一种异源融合蛋白质，其中第一个多肽是GLP-1类似物，其序列选自SEQIDNO.:1，

其中Xaa₈是Gly或Ala；

其中Xaa₂₂是Glu或Gly；

其中Xaa₃₇是Gly或被去除。

第二个多肽是人Ⅲ型胶原α1链(即COL3A1)全长或片段，其序列选自

(a)全长COL3A1(SEQ ID NO.:2)

Met-Met-Ser-Phe-Val-Gln-Lys-Gly-Ser--Trp-Leu-Leu-Leu-Ala-Leu-Leu-His-Pro--Thr-Ile-Ile-Leu-Ala-Gln-Gln-Glu-Ala-Val-Glu-Gly-Gly-Cys-Ser-His-Leu-Gly-Gln-Ser--Tyr-Ala-Asp-Arg-Asp-Val--Trp-Lys-Pro-Glu-Pro-Cys-Gln-Ile-Cys-Val-Cys-Asp-Ser-Gly-Ser-Val-Leu-Cys-Asp-Asp-Ile-Ile-Cys-Asp-Asp-Gln-Glu-Leu-Asp-Cys-Pro-Asn-Pro-Glu-Ile-Pro-Phe-Gly-Glu-Cys-Cys-Ala-Val-Cys-Pro-Gln-Pro-Pro--Thr-Ala-Pro--Thr-Arg-Pro-Pro-Asn-Gly-Gln-Gly-Pro-Gln-Gly-Pro-Lys-Gly-Asp-Pro-Gly-Pro-Pro-Gly-Ile-Pro-Gly-Arg-Asn-Gly-Asp-Pro-Gly-Ile-Pro-Gly-Gln-Pro-Gly-Ser-Pro-Gly-Ser-Pro-Gly-Pro-Pro-Gly-Ile-Cys-Glu-Ser-Cys-Pro--Thr-Gly-Pro-Gln-Asn--Tyr-Ser-Pro-Gln--Tyr-Asp-Ser--Tyr-Asp-Val-Lys-Ser-Gly-Val-Ala-Val-Gly-Gly-Leu-Ala-Gly--Tyr-Pro-Gly-Pro-Ala-Gly-Pro-Pro-Gly-Pro-Pro-Gly-Pro-Pro-Gly--Thr-Ser-Gly-His-Pro-Gly-Ser-Pro-Gly-Ser-Pro-Gly--Tyr-Gln-Gly-Pro-Pro-Gly-Glu-Pro-Gly-Gln-Ala-Gly-Pro-Ser-Gly-Pro-Pro-Gly-Pro-Pro-Gly-Ala-Ile-Gly-Pro-Ser-Gly-Pro-Ala-Gly-Lys-Asp-Gly-Glu-Ser-Gly-Arg-Pro-Gly-Arg-Pro-Gly-Glu-Arg-Gly-Leu-Pro-Gly-Pro-Pro-Gly-Ile-Lys-Gly-Pro-Ala-Gly-Ile-Pro-Gly-Phe-Pro-Gly-Met-Lys-Gly-His-Arg-Gly-Phe-Asp-Gly-Arg-Asn-Gly-Glu-Lys-Gly-Glu--Thr-Gly-Ala-Pro-Gly-Leu-Lys-Gly-Glu-Asn-Gly-Leu-Pro-Gly-Glu-Asn-Gly-Ala-Pro-Gly-Pro-Met-Gly-Pro-Arg-Gly-Ala-Pro-Gly-Glu-Arg-Gly-Arg-Pro-Gly-Leu-Pro-Gly-Ala-Ala-Gly-Ala-Arg-Gly-Asn-Asp-Gly-Ala-Arg-Gly-Ser-Asp-Gly-Gln-Pro-Gly-Pro-Pro-Gly-Pro-Pro-Gly--Thr-Ala-Gly-Phe-Pro-Gly-Ser-Pro-Gly-Ala-Lys-Gly-Glu-Val-Gly-Pro-Ala-Gly-Ser-Pro-Gly-Ser-Asn-Gly-Ala-Pro-Gly-Gln-Arg-Gly-Glu-Pro-Gly-Pro-Gln-Gly-His-Ala-Gly-Ala-Gln-Gly-Pro-Pro-Gly-Pro-Pro-Gly-Ile-Asn-Gly-Ser-Pro-Gly-Gly-Lys-Gly-Glu-Met-Gly-Pro-Ala-Gly-Ile-Pro-Gly-Ala-Pro-Gly-Leu-Met-Gly-Ala-Arg-Gly-Pro-Pro-Gly-Pro-Ala-Gly-Ala-Asn-Gly-Ala-Pro-Gly-Leu-Arg-Gly-Gly-Ala-Gly-Glu-Pro-Gly-Lys-Asn-Gly-Ala-Lys-Gly-Glu-Pro-Gly-Pro-Arg-Gly-Glu-Arg-Gly-Glu-Ala-Gly-Ile-Pro-Gly-Val-Pro-Gly-Ala-Lys-Gly-Glu-Asp-Gly-Lys-Asp-Gly-Ser-Pro-Gly-Glu-Pro-Gly-Ala-Asn-Gly-Leu-Pro-Gly-Ala-Ala-Gly-Glu-Arg-Gly-Ala-Pro-Gly-Phe-Arg-Gly-Pro-Ala-Gly-Pro-Asn-Gly-Ile-Pro-Gly-Glu-Lys-Gly-Pro-Ala-Gly-Glu-Arg-Gly-Ala-Pro-Gly-Pro-Ala-Gly-Pro-Arg-Gly-Ala-Ala-Gly-Glu-Pro-Gly-Arg-Asp-Gly-Val-Pro-Gly-Gly-Pro-Gly-Met-Arg-Gly-Met-Pro-Gly-Ser-Pro-Gly-Gly-Pro-Gly-Ser-Asp-Gly-Lys-Pro-Gly-Pro-Pro-Gly-Ser-Gln-Gly-Glu-Ser-Gly-Arg-Pro-Gly-Pro-Pro-Gly-Pro-Ser-Gly-Pro-Arg-Gly-Gln-Pro-Gly-Val-Met-Gly-Phe-Pro-Gly-Pro-Lys-Gly-Asn-Asp-Gly-Ala-Pro-Gly-Lys-Asn-Gly-Glu-Arg-Gly-Gly-Pro-Gly-Gly-Pro-Gly-Pro-Gln-Gly-Pro-Pro-Gly-Lys-Asn-Gly-Glu--Thr-Gly-Pro-Gln-Gly-Pro-Pro-Gly-Pro--Thr-Gly-Pro-Gly-Gly-Asp-Lys-Gly-Asp--Thr-Gly-Pro-Pro-Gly-Pro-Gln-Gly-Leu-Gln-Gly-Leu-Pro-Gly--Thr-Gly-Gly-Pro-Pro-Gly-Glu-Asn-Gly-Lys-Pro-Gly-Glu-Pro-Gly-Pro-Lys-Gly-Asp-Ala-Gly-Ala-Pro-Gly-Ala-Pro-Gly-Gly-Lys-Gly-Asp-Ala-Gly-Ala-Pro-Gly-Glu-Arg-Gly-Pro-Pro-Gly-Leu-Ala-Gly-Ala-Pro-Gly-Leu-Arg-Gly-Gly-Ala-Gly-Pro-Pro-Gly-Pro-Glu-Gly-Gly-Lys-Gly-Ala-Ala-Gly-Pro-Pro-Gly-Pro-Pro-Gly-Ala-Ala-Gly--Thr-Pro-Gly-Leu-Gln-Gly-Met-Pro-Gly-Glu-Arg-Gly-Gly-Leu-Gly-Ser-Pro-Gly-Pro-Lys-Gly-Asp-Lys-Gly-Glu-Pro-Gly-Gly-Pro-Gly-Ala-Asp-Gly-Val-Pro-Gly-Lys-Asp-Gly-Pro-Arg-Gly-Pro--Thr-Gly-Pro-Ile-Gly-Pro-Pro-Gly-Pro-Ala-Gly-Gln-Pro-Gly-Asp-Lys-Gly-Glu-Gly-Gly-Ala-Pro-Gly-Leu-Pro-Gly-Ile-Ala-Gly-Pro-Arg-Gly-Ser-Pro-Gly-Glu-Arg-Gly-Glu--Thr-Gly-Pro-Pro-Gly-Pro-Ala-Gly-Phe-Pro-Gly-Ala-Pro-Gly-Gln-Asn-Gly-Glu-Pro-Gly-Gly-Lys-Gly-Glu-Arg-Gly-Ala-Pro-Gly-Glu-Lys-Gly-Glu-Gly-Gly-Pro-Pro-Gly-Val-Ala-Gly-Pro-Pro-Gly-Lys-Asp-Gly--Thr-Ser-Gly-His-Pro-Gly-Pro-Ile-Gly-Pro-Pro-Gly-Pro-Arg-Gly-Asn-Arg-Gly-Glu-Arg-Gly-Ser-Glu-Gly-Ser-Pro-Gly-His-Pro-Gly-Gln-Pro-Gly-Pro-Pro-Gly-Pro-Pro-Gly-Ala-Pro-Gly-Pro-Cys-Cys-Gly-Gly-Val-Gly-Ala-Ala-Ala-Ile-Ala-Gly-Ile-Gly-Gly-Glu-Lys-Ala-Gly-Gly-Phe-Ala-Pro--Tyr--Tyr-Gly-Asp-Glu-Pro-Met-Asp-Phe-Lys-Ile-Asn--Thr-Asp-Glu-Ile-Met--Thr-Ser-Leu-Lys-Ser-Val-Asn-Gly-Gln-Ile-Glu-Ser-Leu-Ile-Ser-Pro-Asp-Gly-Ser-Arg-Lys-Asn-Pro-Ala-Arg-Asn-Cys-Arg-Asp-Leu-Lys-Phe-Cys-His-Pro-Glu-Leu-Lys-Ser-Gly-Glu--Tyr--Trp-Val-Asp-Pro-Asn-Gln-Gly-Cys-Lys-Leu-Asp-Ala-Ile-Lys-Val-Phe-Cys-Asn-Met-Glu--Thr-Gly-Glu--Thr-Cys-Ile-Ser-Ala-Asn-Pro-Leu-Asn-Val-Pro-Arg-Lys-His--Trp--Trp--Thr-Asp-Ser-Ser-Ala-Glu-Lys-Lys-His-Val--Trp-Phe-Gly-Glu-Ser-Met-Asp-Gly-Gly-Phe-Gln-Phe-Ser--Tyr-Gly-Asn-Pro-Glu-Leu-Pro-Glu-Asp-Val-Leu-Asp-Val-Gln-Leu-Ala-Phe-Leu-Arg-Leu-Leu-Ser-Ser-Arg-Ala-Ser-Gln-Asn-Ile--Thr--Tyr-His-Cys-Lys-Asn-Ser-Ile-Ala--Tyr-Met-Asp-Gln-Ala-Ser-Gly-Asn-Val-Lys-Lys-Ala-Leu-Lys-Leu-Met-Gly-Ser-Asn-Glu-Gly-Glu-Phe-Lys-Ala-Glu-Gly-Asn-Ser-Lys-Phe--Thr--Tyr--Thr-Val-Leu-Glu-Asp-Gly-Cys--Thr-Lys-His--Thr-Gly-Glu--Trp-Ser-Lys--Thr-Val-Phe-Glu--Tyr-Arg--Thr-Arg-Lys-Ala-Val-Arg-Leu-Pro-Ile-Val-Asp-Ile-Ala-Pro--Tyr-Asp-Ile-Gly-Gly-Pro-Asp-Gln-Glu-Phe-Gly-Val-Asp-Val-Gly-Pro-Val-Cys-Phe-Leu

(b)COL3A1_598-896(SEQ ID NO.:3)

Gly-Pro-Gly-Gly-Pro-Gly-Pro-Gln-Gly-Pro-Pro-Gly-Lys-Asn-Gly-Glu-Thr-Gly-Pro-Gln-Gly-Pro-Pro-Gly-Pro-Thr-Gly-Pro-Gly-Gly-Asp-Lys-Gly-Asp-Thr-Gly-Pro-Pro-Gly-Pro-Gln-Gly-Leu-Gln-Gly-Leu-Pro-Gly-Thr-Gly-Gly-Pro-Pro-Gly-Glu-Asn-Gly-Lys-Pro-Gly-Glu-Pro-Gly-Pro-Lys-Gly-Asp-Ala-Gly-Ala-Pro-Gly-Ala-Pro-Gly-Gly-Lys-Gly-Asp-Ala-Gly-Ala-Pro-Gly-Glu-Arg-Gly-Pro-Pro-Gly-Leu-Ala-Gly-Ala-Pro-Gly-Leu-Arg-Gly-Gly-Ala-Gly-Pro-Pro-Gly-Pro-Glu-Gly-Gly-Lys-Gly-Ala-Ala-Gly-Pro-Pro-Gly-Pro-Pro-Gly-Ala-Ala-Gly-Thr-Pro-Gly-Leu-Gln-Gly-Met-Pro-Gly-Glu-Arg-Gly-Gly-Leu-Gly-Ser-Pro-Lys-Gly-Asp-Lys-Gly-Glu-Pro-Gly-Gly-Pro-Gly-Ala-Asp-Gly-Val-Pro-Gly-Lys-Asp-Gly-Pro-Arg-Gly-Pro-Thr-Gly-Pro-Ile-Gly-Pro-Pro-Gly-Pro-Ala-GLy-Gln-Pro-Gly-Asp-Lys-Gly-Glu-Gly-Gly-Ala-Pro-Gly-Leu-Pro-Gly-Ile-Ala-Gly-Pro-Arg-Gly-Ser-Pro-Gly-Glu-Arg-Gly-Glu-Thr-Gly-Pro-Pro-Gly-Pro-Ala-Gly-Phe-Pro-Gly-Ala-Pro-Gly-Gln-Asn-Gly-Glu-Pro-Gly-Gly-Lys-Gly-Glu-Arg-Gly-Ala-Pro-Gly-Glu-Lys-Gly-Glu-Gly-Gly-Pro-Pro-Gly-Val-Ala-Gly-Pro-Pro-Gly-Lys-Asp-Gly-Thr-Ser-Gly-His-Pro-Gly-Pro-I le-Gly-Pro-Pro-Gly-Pro-Arg-Gly-Asn-Arg-Gly-Glu-Arg-Gly-Ser-Glu-Gly-Ser-Pro-Gly-His-Pro-Gly-Gln-Pro-Gly-Pro-Pro-Gly-Pro-Pro-Gly-Ala-Pro-Gly-Pro-Cys-Cys-Gly-Gly

(c)COL3A1_733-896(SEQ ID NO.:4)

Gly-Leu-Gly-Ser-Pro-Lys-Gly-Asp-Lys-Gly-Glu-Pro-Gly-Gly-Pro-Gly-Ala-Asp-Gly-Val-Pro-Gly-Lys-Asp-Gly-Pro-Arg-Gly-Pro-Thr-Gly-Pro-Ile-Gly-Pro-Pro-Gly-Pro-Ala-GLy-Gln-Pro-Gly-Asp-Lys-Gly-Glu-Gly-Gly-Ala-Pro-Gly-Leu-Pro-Gly-Ile-Ala-Gly-Pro-Arg-Gly-Ser-Pro-Gly-Glu-Arg-Gly-Glu-Thr-Gly-Pro-Pro-Gly-Pro-Ala-Gly-Phe-Pro-Gly-Ala-Pro-Gly-Gln-Asn-Gly-Glu-Pro-Gly-Gly-Lys-Gly-Glu-Arg-Gly-Ala-Pro-Gly-Glu-Lys-Gly-Glu-Gly-Gly-Pro-Pro-Gly-Val-Ala-Gly-Pro-Pro-Gly-Lys-Asp-Gly-Thr-Ser-Gly-His-Pro-Gly-Pro-Ile-Gly-Pro-Pro-Gly-Pro-Arg-Gly-Asn-Arg-Gly-Glu-Arg-Gly-Ser-Glu-Gly-Ser-Pro-Gly-His-Pro-Gly-Gln-Pro-Gly-Pro-Pro-Gly-Pro-Pro-Gly-Ala-Pro-Gly-Pro-Cys-Cys-Gly-Gly

本发明的异源融合蛋白质GLP-1类似物多肽的C末端和人COL3A1片段的N末端优选通过富含G的肽接头(即连接肽)融合在一起，其中肽接头具有序列[Gly-Gly-Gly-Gly-Ser(SEQ ID NO.:5)]_n-Ala的序列，其中n为2-6，优选地为2。

本发明的异源融合蛋白质包括GLP-1类似物部分和人COL3A1片段部分。通过对天然GLP-1序列的部分替换与融合人COL3A1片段，在保留天然GLP-1活性的同时，融合蛋白通过人COL3A1区域形成稳定的寡聚体，增加融合蛋白的体内稳定性。

天然GLP-1在体内经过加工，切割成AA7-AA37具有活性的片段，因此，按照本领域习惯将GLP-1的氨基端指定为7号，羧基端为37号。如SEQ ID NO.：6中所示对该多肽中的其他氨基酸连续编号。

⁷His-Ala-Glu-¹⁰Gly-Thr-Phe-Thr-Ser-¹⁵Asp-Val-Ser-Ser-Tyr-²⁰Leu-Glu-Gly-Gln-Ala-²⁵Ala-Lys-Glu-Phe-Ile-³⁰Ala-Trp-Leu-Val-Lys-³⁵Gly-Arg-³⁷Gly

(SEQ ID NO：6)

相对于天然GLP-1(7-37)，异源融合蛋白质的GLP-1类似物部分包括第8、22和36位的三个初步替换。内源性二肽基肽酶4(DPP-4)在第8位的Ala及第9位的Glu之间切割天然GLP-1，产生的无活性的GLP-1(9-37)片段，第8位替换为Gly后可以降低GLP-1类似物对DPP-4水解的敏感性。第22位的替换可以提高GLP-1类似物的活性。第37位的去除可降低融合蛋白质得免疫原性。突变后的序列如SEQ ID NO.:12所示。

⁷His-Gly-Glu-¹⁰Gly-Thr-Phe-Thr-Ser-¹⁵Asp-Val-Ser-Ser-Tyr-²⁰Leu-Glu-Glu-Gln-Ala-²⁵Ala-Lys-Glu-Phe-Ile-³⁰Ala-Trp-Leu-Val-Lys-³⁵Gly-Arg(SEQ ID NO.:12)

本发明的异源融合蛋白含有人COL3A1及其片段。在分子结构上，Ⅲ型胶原蛋白是由平行线型链组成，每一线型链由三条扭曲左旋的α1链通过链间相互作用紧密结合而形成的一极强的右旋三重螺旋结构。每条Ⅲ型胶原α1链由多达300以上的Gly-X-Y三联体重复构成，该三联体结构是Ⅲ型胶原α1链形成同源三聚体的关键。因此，本发明在采用全长人COL3A1(SEQ ID NO.:2)的基础上，为了避免过长的氨基酸序列导致重组表达的困难，优选了两种人COL3A1片段，序列分别如SEQ ID NO.:3及SEQ ID NO.:4所示。两种片段含有不同长度的Gly-X-Y三联体结构域，保留了人COL3A1形成同源三聚体的能力同时有利于本发明中异源融合蛋白的重组表达。

本发明中的GLP-1类似物部分的C末端氨基酸优选通过富含甘氨酸的接头肽[Gly-Gly-Gly-Gly-Ser(SEQ ID NO.:5)]_n-Ala与人COL3A1片段的N末端融合。增加肽接头可以防止潜在的两个结构域之间的相互干扰，提高异源融合蛋白的稳定性。另外，富含甘氨酸的接头提供了一定的结构柔性，使GLP-1类似物部分可以与靶细胞例如胰腺β细胞上的GLP-1受体分子有效地相互作用，有利于发挥其生物活性。本发明中接头肽[Gly-Gly-Gly-Gly-Ser(SEQ ID NO.:5)]_n-Ala的重复数n≥2，但过长的接头肽不利于融合蛋白的稳定性并可能增加潜在的免疫原性。因此优选的接头肽包括序列：

Gly-Gly-Gly-Gly-Ser-Gly-Gly-Gly-Gly-Ser-Ala(SEQ ID NO.:7)

因此本发明优选的GLP-1-COL3A1异源融合蛋白质包括下列蛋白质：

(a)GLP-1-2L-COL_598-896(SEQ ID NO.:8)

HGEGTFTSDVSSYLEEQAAKEFIAWLVKGRGGGGSGGGGSGGGGSAGPGGPGPQGPPGKNGETGPQGPPGPTGPGGDKGDTGPPGPQGLQGLPGTGGPPGENGKPGEPGPKGDAGAPGAPGGKGDAGAPGERGPPGLAGAPGLRGGAGPPGPEGGKGAAGPPGPPGAAGTPGLQGMPGERGGLGSPGPKGDKGEPGGPGADGVPGKDGPRGPTGPIGPPGPAGQPGDKGEGGAPGLPGIAGPRGSPGERGETGPPGPAGFPGAPGQNGEPGGKGERGAPGEKGEGGPPGVAGPPGKDGTSGHPGPIGPPGPRGNRGERGSEGSPGHPGQPGPPGPPGAPGPCCGG

(b)GLP-1-2L-COL_733-896(SEQ ID NO.:9)

HGEGTFTSDVSSYLEEQAAKEFIAWLVKGRGGGGSGGGGSGGGGSAGLGSPGPKGDKGEPGGPGADGVPGKDGPRGPTGPIGPPGPAGQPGDKGEGGAPGLPGIAGPRGSPGERGETGPPGPAGFPGAPGQNGEPGGKGERGAPGEKGEGGPPGVAGPPGKDGTSGHPGPIGPPGPRGNRGERGSEGSPGHPGQPGPPGPPGAPGPCCGG

(c)GLP-1-2L-COL(SEQ ID NO.:13)

HGEGTFTSDVSSYLEEQAAKEFIAWLVKGRGGGGSGGGGSGGGGSAAMMSFVQKGSWLLLALLHPTIILAQQEAVEGGCSHLGQSYADRDVWKPEPCQICVCDSGSVLCDDIICDDQELDCPNPEIPFGECCAVCPQPPTAPTRPPNGQGPQGPKGDPGPPGIPGRNGDPGIPGQPGSPGSPGPPGICESCPTGPQNYSPQYDSYDVKSGVAVGGLAGYPGPAGPPGPPGPPGTSGHPGSPGSPGYQGPPGEPGQAGPSGPPGPPGAIGPSGPAGKDGESGRPGRPGERGLPGPPGIKGPAGIPGFPGMKGHRGFDGRNGEKGETGAPGLKGENGLPGENGAPGPMGPRGAPGERGRPGLPGAAGARGNDGARGSDGQPGPPGPPGTAGFPGSPGAKGEVGPAGSPGSNGAPGQRGEPGPQGHAGAQGPPGPPGINGSPGGKGEMGPAGIPGAPGLMGARGPPGPAGANGAPGLRGGAGEPGKNGAKGEPGPRGERGEAGIPGVPGAKGEDGKDGSPGEPGANGLPGAAGERGAPGFRGPAGPNGIPGEKGPAGERGAPGPAGPRGAAGEPGRDGVPGGPGMRGMPGSPGGPGSDGKPGPPGSQGESGRPGPPGPSGPRGQPGVMGFPGPKGNDGAPGKNGERGGPGGPGPQGPPGKNGETGPQGPPGPTGPGGDKGDTGPPGPQGLQGLPGTGGPPGENGKPGEPGPKGDAGAPGAPGGKGDAGAPGERGPPGLAGAPGLRGGAGPPGPEGGKGAAGPPGPPGAAGTPGLQGMPGERGGLGSPGPKGDKGEPGGPGADGVPGKDGPRGPTGPIGPPGPAGQPGDKGEGGAPGLPGIAGPRGSPGERGETGPPGPAGFPGAPGQNGEPGGKGERGAPGEKGEGGPPGVAGPPGKDGTSGHPGPIGPPGPRGNRGERGSEGSPGHPGQPGPPGPPGAPGPCCGGVGAAAIAGIGGEKAGGFAPYYGDEPMDFKINTDEIMTSLKSVNGQIESLISPDGSRKNPARNCRDLKFCHPELKSGEYWVDPNQGCKLDAIKVFCNMETGETCISANPLNVPRKHWWTDSSAEKKHVWFGESMDGGFQFSYGNPELPEDVLDVQLAFLRLLSSRASQNITYHCKNSIAYMDQASGNVKKALKLMGSNEGEFKAEGNSKFTYTVLEDGCTKHTGEWSKTVFEYRTRKAVRLPIVDIAPYDIGGPDQEFGVDVGPVCFL

此处使用的提及特定异源融合蛋白质的命名法定义如下：融合蛋白质GLP-1部分特指成熟GLP-1(7-37)的类似物，其中第8位的Ala突变为Gly，第22位的Gly突变为Glu，第37位的Gly去除。L指具有序列[Gly-Gly-Gly-Gly-Ser(SEQ ID NO.:5)]_n-Ala的接头。直接在L前面的数字指接头肽中n的重复数目。指定为2L的接头肽指序列Gly-Gly-Gly-Gly-Ser-Gly-Gly-Gly-Gly-Ser-Ala(SEQ ID NO.:7)。融合蛋白质COL3A1片段的缩写为COL，其氨基酸序列起始位置以残基编号来表示。COL_598-896表示成熟融合蛋白质的COL3A1部分以第598位的Gly开始，以第896位Gly结束；COL_733-896表示成熟融合蛋白质的COL3A1部分以第733位的Gly开始，以第896位Gly结束。

本发明涉及人源GLP-1类似物与人Ⅲ型胶原α1链片段相结合的融合蛋白。该融合蛋白与度拉糖肽不同之处在于，IgG的Fc段可能具有ADCC(Antibody-Dependent CellCytotoxicity，抗体依赖细胞介导的细胞毒性作用)作用，具有潜在的免疫原性及副反应。相对的，胶原蛋白是体内含量最多的一种蛋白质，约占蛋白质总量的25％-33％，广泛地存在于人体的骨、腱、软骨和皮肤及其它结缔组织种，是细胞外基质(ECM)的主要成分，具有良好的生物兼容性、生物吸收性。其中，Ⅲ型胶原只占胶原蛋白总量的10％，主要存在于血管中。在分子结构上，Ⅲ型胶原蛋白是由平行线型链组成，每一线型链由三条扭曲左旋的α1链通过链间相互作用紧密结合而形成的一极强的右旋三重螺旋结构。每条Ⅲ型胶原α1链由多达300以上的Gly-X-Y三联体重复构成，该三联体结构是Ⅲ型胶原α1链形成同源三聚体的关键。

核酸编码序列

本发明还包括编码本发明异源融合蛋白质的多核苷酸以及包含这些多核苷酸的载体和宿主细胞。本发明也包括治疗患有非胰岛素依赖型、肥胖及多种其他疾病和病症的患者的方法，其包括应用在此讨论的异源融合蛋白质。

本发明还涉及编码根据本发明的融合蛋白的多核苷酸。

在本发明的一个优选例中，所述核苷酸序列如SEQ ID NO.:10或11所示。

本发明的多核苷酸可以是DNA形式或RNA形式。DNA形式包括cDNA、基因组DNA或人工合成的DNA。DNA可以是单链的或是双链的。DNA可以是编码链或非编码链。编码成熟多肽的编码区序列可以与编码SEQ ID NO.:8、9或13所示的多肽的序列相同或者是简并的变异体。如本文所用，“简并的变异体”在本发明中是指编码具有SEQ ID NO.:8、9或13所示的多肽，但相应编码区序列有差别的核酸序列。

本发明的多肽的核苷酸全长序列或其片段通常可以用PCR扩增法、重组法或人工合成的方法获得。对于PCR扩增法，可根据已公开的有关核苷酸序列，尤其是开放阅读框序列来设计引物，并用市售的cDNA库或按本领域技术人员已知的常规方法所制备的cDNA库作为模板，扩增而得有关序列。当序列较长时，常常需要进行两次或多次PCR扩增，然后再将各次扩增出的片段按正确次序拼接在一起。目前，已经可以完全通过化学合成来得到编码本发明多肽(或其片段，或其衍生物)的DNA序列。然后可将该DNA序列引入本领域中已知的各种现有的DNA分子(或如载体)和细胞中。

本发明也涉及包含本发明的多核苷酸的载体，以及用本发明的载体或多肽编码序列经基因工程产生的宿主细胞。上述多核苷酸、载体或宿主细胞可以是分离的。

如本文所用，“分离的”是指物质从其原始环境中分离出来(如果是天然的物质，原始环境即是天然环境)。如活体细胞内的天然状态下的多核苷酸和多肽是没有分离纯化的，但同样的多核苷酸或多肽如从天然状态中同存在的其他物质中分开，则为分离纯化的。

一旦获得了有关的序列，就可以用重组法来大批量地获得有关序列。这通常是将其克隆入载体，再转入细胞，然后通过常规方法从增殖后的宿主细胞中分离得到有关序列。

此外，还可用人工合成的方法来合成有关序列，尤其是片段长度较短时。通常，通过先合成多个小片段，然后再进行连接可获得序列很长的片段。

应用PCR技术扩增DNA/RNA的方法被优选用于获得本发明的基因。用于PCR的引物可根据本文所公开的本发明的序列信息适当地选择，并可用常规方法合成。可用常规方法如通过凝胶电泳分离和纯化扩增的DNA/RNA片段。

本发明也涉及包含本发明的多核苷酸的载体，以及用本发明的载体或蛋白编码序列经基因工程产生的宿主细胞，以及经重组技术利用所述宿主细胞表达本发明融合蛋白的方法。

通过常规的重组DNA技术，可利用本发明的多核苷酸序列获得表达本发明融合蛋白的宿主细胞。一般来说包括步骤：将本发明第三方面所述的多核苷酸或本发明第四方面所述的载体转导入宿主细胞内。

本领域的技术人员熟知的方法能用于构建含本发明酶的编码DNA序列和合适的转录/翻译控制信号的表达载体。这些方法包括体外重组DNA技术、DNA合成技术、体内重组技术等。所述的DNA序列可有效连接到表达载体中的适当启动子上，以指导mRNA合成。表达载体还包括翻译起始用的核糖体结合位点和转录终止子。

此外，表达载体优选地包含一个或多个选择性标记基因，以提供用于选择转化的宿主细胞的表型性状，如真核细胞培养用的二氢叶酸还原酶、新霉素抗性以及绿色荧光蛋白(GFP)，或用于大肠杆菌的四环素或氨苄青霉素抗性。

包含上述的适当DNA序列以及适当启动子或者控制序列的载体，可以用于转化适当的宿主细胞，以使其能够表达蛋白质。

宿主细胞可以是原核细胞，如细菌细胞；或是低等真核细胞，如酵母细胞；或是高等真核细胞，如哺乳动物细胞。代表性例子有：大肠杆菌，枯草芽胞杆菌，链霉菌属的细菌细胞；真菌细胞如毕赤酵母、酿酒酵母细胞；植物细胞；果蝇S2或Sf9的昆虫细胞；CHO、NS0、COS7、或293细胞的动物细胞等。在另一优选例中，所述宿主细胞为毕赤酵母。

用重组DNA转化宿主细胞可用本领域技术人员熟知的常规技术进行。当宿主为原核生物如大肠杆菌时，能吸收DNA的感受态细胞可在指数生长期后收获，用CaCl₂法处理，所用的步骤在本领域众所周知。另一种方法是使用MgCl₂。如果需要，转化也可用电穿孔的方法进行。当宿主是真核生物，可选用如下的DNA转染方法：磷酸钙共沉淀法，常规机械方法如显微注射、电穿孔、脂质体包装等。

获得的转化子可以用常规方法培养，表达本发明的基因所编码的蛋白质。根据所用的宿主细胞，培养中所用的培养基可选自各种常规培养基。在适于宿主细胞生长的条件下进行培养。当宿主细胞生长到适当的细胞密度后，用合适的方法(如温度转换或化学诱导)诱导选择的启动子，将细胞再培养一段时间。

在上面的方法中的蛋白质可在细胞内、或在细胞膜上表达、或分泌到细胞外。如果需要，可利用其物理的、化学的和其它特性通过各种分离方法分离和纯化蛋白。这些方法是本领域技术人员所熟知的。这些方法的例子包括但并不限于：常规的复性处理、用蛋白沉淀剂处理(盐析方法)、离心、渗透破菌、超处理、超离心、分子筛层析(凝胶过滤)、吸附层析、离子交换层析、高效液相层析(HPLC)和其它各种液相层析技术及这些方法的结合。

可以通过多种不同的方法产生编码本发明的GLP-1类似物的DNA，可以基于天然序列设计引物以产生此处所述的编码GLP-1类似物的DNA，可以在连接前或在编码整个融合蛋白质的cDNA中突变编码野生型GLP-1DNA。从特定文库克隆的全长野生型序列通常可以作为产生本发明COL3A1片段的模板，可以通过设计引物以产生此处所述的编码COL3A1片段的DNA。通过PCR技术及引物设计，可以将编码GLP-1类似物的基因和编码COL3A1类似物蛋白质的基因也通过编码富含G的接头肽的DNA在框内连接。进行全序列的化学合成也是可行的技术。可以使用PCR技术，用经设计与对应于COL3A1片段所需末端的序列杂交的引物产生该片段。也可以设计PCR引物产生限制性酶位点以便于克隆到表达载体中。

在SEQ ID NO.：10中提供编码本发明优选的异源融合蛋白质之一GLP-1-2L-COL_598-896的优选DNA序列：

CACGGTGAGGGTACTTTTACCTCTGATGTTTCCTCATACTTGGAAGAACAAGCTGCTAAGGAATTCATTGCCTGGCTGGTCAAAGGCAGAGGAGGTGGCGGATCCGGTGGCGGTGGGTCCGGAGGAGGTGGTTCAGCTGGTCCAGGTGGTCCAGGTCCTCAAGGTCCTCCAGGTAAGAATGGTGAAACTGGTCCTCAGGGACCTCCAGGCCCAACCGGTCCTGGAGGTGATAAGGGTGATACCGGACCACCTGGCCCACAAGGCTTGCAGGGTCTGCCAGGTACAGGGGGTCCACCCGGTGAAAACGGCAAGCCTGGTGAACCAGGCCCAAAAGGTGACGCTGGAGCTCCAGGAGCCCCAGGAGGTAAGGGTGATGCTGGTGCCCCCGGTGAGAGAGGCCCACCAGGTTTGGCCGGTGCTCCCGGTCTGAGAGGGGGAGCTGGTCCACCAGGACCTGAAGGCGGAAAAGGTGCTGCTGGTCCACCTGGACCACCTGGTGCTGCCGGAACTCCAGGACTGCAGGGAATGCCTGGTGAAAGAGGCGGATTGGGATCTCCTGGCCCAAAAGGAGACAAGGGAGAGCCTGGTGGACCAGGGGCAGATGGAGTTCCTGGAAAAGATGGTCCTCGTGGTCCAACAGGACCTATCGGTCCCCCAGGACCTGCTGGTCAACCTGGAGATAAAGGTGAAGGCGGGGCTCCAGGATTGCCTGGTATTGCCGGCCCTAGAGGTTCTCCCGGTGAAAGAGGTGAGACCGGCCCACCTGGTCCAGCTGGCTTCCCTGGAGCACCAGGTCAGAATGGTGAGCCAGGTGGTAAGGGTGAGAGAGGAGCTCCAGGTGAGAAGGGGGAAGGTGGTCCACCTGGTGTTGCTGGTCCACCAGGTAAGGATGGTACATCCGGTCATCCTGGACCAATTGGACCTCCAGGGCCTAGAGGTAACAGGGGTGAAAGGGGATCTGAAGGATCTCCTGGACATCCAGGTCAGCCCGGTCCTCCTGGTCCACCCGGAGCTCCTGGGCCATGCTGTGGTGGC(SEQ ID NO.:10)

在SEQ ID NO.：11中提供编码本发明优选的异源融合蛋白质之一GLP-1-2L-COL_733-896的优选DNA序列：

CACGGTGAGGGTACTTTTACCTCTGATGTTTCCTCATACTTGGAAGAACAAGCTGCTAAGGAATTCATTGCCTGGCTGGTCAAAGGCAGAGGAGGTGGCGGATCCGGTGGCGGTGGGTCCGGAGGAGGTGGTTCAGCTGGTTTGGGATCTCCTGGCCCAAAAGGAGACAAGGGAGAGCCTGGTGGACCAGGGGCAGATGGAGTTCCTGGAAAAGATGGTCCTCGTGGTCCAACAGGACCTATCGGTCCCCCAGGACCTGCTGGTCAACCTGGAGATAAAGGTGAAGGCGGGGCTCCAGGATTGCCTGGTATTGCCGGCCCTAGAGGTTCTCCCGGTGAAAGAGGTGAGACCGGCCCACCTGGTCCAGCTGGCTTCCCTGGAGCACCAGGTCAGAATGGTGAGCCAGGTGGTAAGGGTGAGAGAGGAGCTCCAGGTGAGAAGGGGGAAGGTGGTCCACCTGGTGTTGCTGGTCCACCAGGTAAGGATGGTACATCCGGTCATCCTGGACCAATTGGACCTCCAGGGCCTAGAGGTAACAGGGGTGAAAGGGGATCTGAAGGATCTCCTGGACATCCAGGTCAGCCCGGTCCTCCTGGTCCACCCGGAGCTCCTGGGCCATGCTGTGGTGGC(SEQ ID NO.：11)

表达载体和宿主细胞

本发明还提供了一种用于本发明融合蛋白的表达载体。

克隆或表达本发明核酸的宿主细胞可以是原核细胞，更优的宿主细胞包括酵母或高等真核细胞。融合蛋白基因经宿主细胞表达后，从表达产物中进行分离纯化，可用于制备糖尿病及相关疾病的治疗药物。所述相关疾病包括：Ⅱ型糖尿病、Ⅰ型糖尿病、肥胖、Ⅱ型糖尿病患者严重心血管事件和其他严重并发症等。

与现有技术相比，本发明主要具有以下优点：

本发明中涉及的GLP-1-COL3A1融合蛋白，秉着保留GLP-1降糖活性并显著延长其体内半衰期的目标，设计了一种不同于其他GLP-1类似物药物的新型分子，其具有GLP-1R激活活性、形成稳定多聚体及延长的体内半衰期。

(a)相对于天然GLP-1(7-37)，本发明融合蛋白质的GLP-1类似物部分包括第8、22和36位的三个替换。内源性二肽基肽酶4(DPP-4)在第8位的Ala及第9位的Glu之间切割天然GLP-1，产生的无活性的GLP-1(9-37)片段，第8位替换为Gly后降低了GLP-1类似物对DPP-4水解的敏感性。第22位的替换提高了GLP-1类似物的活性。第37位的去除降低了融合蛋白质得免疫原性。本发明融合蛋白对DPP-4水解的敏感性低，活性非常高，免疫原性低。

(b)本发明融合蛋白含有人Ⅲ型胶原α1链，首次采用COL3A1片段与GLP-1类似物进行长效GLP-1类似物的构建，生物相容性好、可形成寡聚体、并易于表达。优选的COL3A1有利于表达的优点，构建的融合蛋白适用于毕赤酵母表达系统，生产成本低于其他GLP-1类药物采用的高级真核细胞系统，通过制备工艺的进一步优化及放大，有望得到一种价格较低廉的长效2型糖尿病治疗药物。并且，在保留GLP-1生物学活性的同时，利用融合蛋白通过α1链形成三聚体的特性，获得显著延长的体内半衰期。

(c)为了避免过长的氨基酸序列导致重组表达的困难，本发明优选了两种人COL3A1片段(COL3A1_598-896及COL3A1_733-8962个片段)，序列分别如SEQ ID NO.:3及SEQ IDNO.:4所示。两种片段含有不同长度的Gly-X-Y三联体结构域，保留了人COL3A1形成同源三聚体的能力同时有利于本发明中异源融合蛋白的重组表达，本发明融合蛋白稳定性高。

下面结合具体实施，进一步阐述本发明。应理解，这些实施例仅用于说明本发明而不用于限制本发明的范围。下列实施例中未注明具体条件的实验方法，通常按照常规条件，例如Sambrook等人，分子克隆：实验室手册(New York:Cold SpringHarbor LaboratoryPress,1989)中所述的条件，或按照制造厂商所建议的条件。除非另外说明，否则百分比和份数按重量计算。

实施例1：构建编码GLP-1-COL3A1融合蛋白的DNA

编码本发明所述融合蛋白GLP-1-2L-COL_598-896的基因(SEQ ID NO：8)由南京金斯瑞生物科技有限公司合成并克隆至pUC57质粒，融合基因的5’端含有XhoI酶切位点，3’端含有TAA终止密码子及NotI酶切位点，所述pUC57质粒命名为pUC57-GLP-COL-1。

用限制内核酸内切酶XhoI及NotI(购自Fermentas)按照说明书对pUC57-GLP-COLA-1进行双酶切消化，对消化后产生长度为1050bp左右的编码GLP-1-2L-COL_598-896融合蛋白的基因片段进行胶回收(胶回收试剂盒购自Axygen)。同时将pPic9m用XhoI及NotI进行双酶切消化，并对消化后长度为9000bp的质粒条带进行胶回收。

上述酶切得到的融合蛋白基因片段及pPic9m质粒片段用T4DNA连接酶(购自Fermentas)进行连接，连接产物用热休克法转化大肠杆菌感受态细胞DH5α，转化产物涂布在具有卡那霉素霉素抗性的LB固体培养基上，挑取单克隆进行基因测序，确定插入基因的序列正确，获得的质粒命名为pPic9m-GLP-COL-1(如图1所示)。

相似的，构建了含有编码GLP-1-2L-COL_733-896融合蛋白编码基因的融合蛋白表达载体，命名为pPic9m-GLP-COL-2(图2)。

实施例2：异源融合蛋白的表达

将实施例1中的插入有融合蛋白基因的载体进行抽提，使用电转化的方法转入毕赤酵母GS115感受态细胞。通过营养限制性培养基筛选重组子后，利用G418抗性进行高拷贝重组子的筛选。最终获得适宜进行重组表达的含有异源融合蛋白基因的重组毕赤酵母细胞。

重组毕赤酵母细胞在经过种子扩增后，接种入5L发酵罐内进行小规模制备，发酵持续5天，其中利用甲醇进行异源融合蛋白的诱导表达，诱导持续36h，发酵结束后进行发酵液的收集用于蛋白的纯化。

表1：毕赤酵母GS115种子扩增培养基组成

配方	含量
		Yeast Extract	10.0g/L
Peptone	20.0g/L
		KH<sub>2</sub>PO<sub>4</sub>	11.8g/L
K<sub>2</sub>HPO<sub>4</sub>	3.0g/L
		甘油	10.0ml/L

表2：毕赤酵母GS115发酵培养基组成

配方	含量
		YNB	0.67g/L
CaCl<sub>2</sub>	0.4g/L
		K<sub>2</sub>SO<sub>4</sub>	10.0g/L
MgSO4.7H<sub>2</sub>O	8.0g/L
		(NH<sub>4</sub>)<sub>2</sub>SO<sub>4</sub>	8.0g/L
柠檬酸	5.0g/L
		K<sub>2</sub>HPO<sub>4</sub>.3H<sub>2</sub>O	18.0g/L
甘油	40.0ml/L

实施例3：异源融合蛋白的纯化

两种优选的异源融合蛋白GLP-1-2L-COL_598-896、GLP-1-2L-COL_733-896采用相似的纯化步骤。

4L发酵培养基使用PALL 0.2μm的中空纤维过滤系统进行上清液的收集，得到约4L上清液。上清液再采用PALL 50kDa滤膜的超滤系统进行样品超滤，除去部分杂蛋白。超滤液体最后用Source30Q阴离子交换色谱进行纯化，利用0-500mM NaCl线型梯度进行样品的洗脱，最后得到纯化的异源融合蛋白。使用SDS-PAGE确定了异源融合蛋白的纯度及分子量，纯度>90％，分子量与预期相符(图3)。

实施例4：异源融合蛋白的生物活性及药代动力学研究

实施例4a、融合蛋白的生物活性研究

利用稳定转染有GLP-1R的人骨肉瘤细胞U₂OS进行异源融合蛋白的活性测定，异源融合蛋白的GLP-1类似物片段与U₂OS细胞上的GLP-1R受体结合会刺激细胞分泌cAMP，通过cAMP酶联测定法来检测cAMP的活性以表征融合蛋白的GLP-1活性。U₂OS细胞以1.2×10⁵/孔接种于96孔板中，用含10％FBS的DMEM培养基，在37℃、5％CO₂中培养24h。撤去培养基，然后加入基础培养基培养过夜。撤去基础培养基，加入不同浓度的待测样品，包括2种融合蛋白GLP-1-2L-COL_598-896、GLP-1-2L-COL_733-896及人工合成的GLP-1(7-37)对照品，37℃、5％CO₂中培养0.5h。使用cAMP试剂盒(购自R&D)进行细胞cAMP含量的测定，结果如图4所示。

图4的结果显示，经GLP-1-2L-COL_598-896、GLP-1-2L-COL_733-896刺激U₂OS细胞产生的cAMP含量存在明显的剂量效应，且与GLP-1相当，确定GLP-1-2L-COL_598-896、GLP-1-2L-COL_733-896融合蛋白具有GLP-1相似的GLP-1R激活活性。

实施例4b、融合蛋白的药代动力学研究

在药代动力学试验中使用SD雄性大鼠，设置GLP-1-2L-COL_598-896、GLP-1-2L-COL_733-896及化学合成GLP-1(7-37)对照组，每组8只。按照1mg/kg剂量静脉注射，分别采集注射前及注射后不同时间点的血样：0h、0.5h、1h、2h、4h、6h、10h、24h、2d、4d、6d、8d、10d、14d、21d。采集的血清放置于-80℃保存。血清中融合蛋白的量使用GLP-1试剂盒进行检测(图5)。由图5结果可知，本发明的融合蛋白可以显著延长GLP-1类似物的体内循环半衰期。

以上所述，仅是本发明的较优实施例，并非对本发明任何形式上的限制。应指出的是，对于本技术领域内的普通技术人员对本发明做出的改进和补充，也应视为本发明的保护范围。

在本发明提及的所有文献都在本申请中引用作为参考，就如同每一篇文献被单独引用作为参考那样。此外应理解，在阅读了本发明的上述讲授内容之后，本领域技术人员可以对本发明作各种改动或修改，这些等价形式同样落于本申请所附权利要求书所限定的范围。

序列表

<110> 上海惠盾生物技术有限公司

<120> 一种GLP-1类似物-COL3A1融合蛋白

<130> P2018-0197

<160> 13

<170> PatentIn version 3.5

<210> 1

<211> 31

<212> PRT

<213> 人工序列(artificial sequence)

<400> 1

His Xaa Glu Gly Thr Phe Thr Ser Asp Val Ser Ser Tyr Leu Glu Xaa

1 5 10 15

Gln Ala Ala Lys Glu Phe Ile Ala Trp Leu Val Lys Gly Arg Xaa

20 25 30

<210> 2

<211> 1163

<212> PRT

<213> 智人(Homo sapiens)

<400> 2

Met Met Ser Phe Val Gln Lys Gly Ser Trp Leu Leu Leu Ala Leu Leu

1 5 10 15

His Pro Thr Ile Ile Leu Ala Gln Gln Glu Ala Val Glu Gly Gly Cys

20 25 30

Ser His Leu Gly Gln Ser Tyr Ala Asp Arg Asp Val Trp Lys Pro Glu

35 40 45

Pro Cys Gln Ile Cys Val Cys Asp Ser Gly Ser Val Leu Cys Asp Asp

50 55 60

Ile Ile Cys Asp Asp Gln Glu Leu Asp Cys Pro Asn Pro Glu Ile Pro

65 70 75 80

Phe Gly Glu Cys Cys Ala Val Cys Pro Gln Pro Pro Thr Ala Pro Thr

85 90 95

Arg Pro Pro Asn Gly Gln Gly Pro Gln Gly Pro Lys Gly Asp Pro Gly

100 105 110

Pro Pro Gly Ile Pro Gly Arg Asn Gly Asp Pro Gly Ile Pro Gly Gln

115 120 125

Pro Gly Ser Pro Gly Ser Pro Gly Pro Pro Gly Ile Cys Glu Ser Cys

130 135 140

Pro Thr Gly Pro Gln Asn Tyr Ser Pro Gln Tyr Asp Ser Tyr Asp Val

145 150 155 160

Lys Ser Gly Val Ala Val Gly Gly Leu Ala Gly Tyr Pro Gly Pro Ala

165 170 175

Gly Pro Pro Gly Pro Pro Gly Pro Pro Gly Thr Ser Gly His Pro Gly

180 185 190

Ser Pro Gly Ser Pro Gly Tyr Gln Gly Pro Pro Gly Glu Pro Gly Gln

195 200 205

Ala Gly Pro Ser Gly Pro Pro Gly Pro Pro Gly Ala Ile Gly Pro Ser

210 215 220

Gly Pro Ala Gly Lys Asp Gly Glu Ser Gly Arg Pro Gly Arg Pro Gly

225 230 235 240

Glu Arg Gly Leu Pro Gly Pro Pro Gly Ile Lys Gly Pro Ala Gly Ile

245 250 255

Pro Gly Phe Pro Gly Met Lys Gly His Arg Gly Phe Asp Gly Arg Asn

260 265 270

Gly Glu Lys Gly Glu Thr Gly Ala Pro Gly Leu Lys Gly Glu Asn Gly

275 280 285

Leu Pro Gly Glu Asn Gly Ala Pro Gly Pro Met Gly Pro Arg Gly Ala

290 295 300

Pro Gly Glu Arg Gly Arg Pro Gly Leu Pro Gly Ala Ala Gly Ala Arg

305 310 315 320

Gly Asn Asp Gly Ala Arg Gly Ser Asp Gly Gln Pro Gly Pro Pro Gly

325 330 335

Pro Pro Gly Thr Ala Gly Phe Pro Gly Ser Pro Gly Ala Lys Gly Glu

340 345 350

Val Gly Pro Ala Gly Ser Pro Gly Ser Asn Gly Ala Pro Gly Gln Arg

355 360 365

Gly Glu Pro Gly Pro Gln Gly His Ala Gly Ala Gln Gly Pro Pro Gly

370 375 380

Pro Pro Gly Ile Asn Gly Ser Pro Gly Gly Lys Gly Glu Met Gly Pro

385 390 395 400

Ala Gly Ile Pro Gly Ala Pro Gly Leu Met Gly Ala Arg Gly Pro Pro

405 410 415

Gly Pro Ala Gly Ala Asn Gly Ala Pro Gly Leu Arg Gly Gly Ala Gly

420 425 430

Glu Pro Gly Lys Asn Gly Ala Lys Gly Glu Pro Gly Pro Arg Gly Glu

435 440 445

Arg Gly Glu Ala Gly Ile Pro Gly Val Pro Gly Ala Lys Gly Glu Asp

450 455 460

Gly Lys Asp Gly Ser Pro Gly Glu Pro Gly Ala Asn Gly Leu Pro Gly

465 470 475 480

Ala Ala Gly Glu Arg Gly Ala Pro Gly Phe Arg Gly Pro Ala Gly Pro

485 490 495

Asn Gly Ile Pro Gly Glu Lys Gly Pro Ala Gly Glu Arg Gly Ala Pro

500 505 510

Gly Pro Ala Gly Pro Arg Gly Ala Ala Gly Glu Pro Gly Arg Asp Gly

515 520 525

Val Pro Gly Gly Pro Gly Met Arg Gly Met Pro Gly Ser Pro Gly Gly

530 535 540

Pro Gly Ser Asp Gly Lys Pro Gly Pro Pro Gly Ser Gln Gly Glu Ser

545 550 555 560

Gly Arg Pro Gly Pro Pro Gly Pro Ser Gly Pro Arg Gly Gln Pro Gly

565 570 575

Val Met Gly Phe Pro Gly Pro Lys Gly Asn Asp Gly Ala Pro Gly Lys

580 585 590

Asn Gly Glu Arg Gly Gly Pro Gly Gly Pro Gly Pro Gln Gly Pro Pro

595 600 605

Gly Lys Asn Gly Glu Thr Gly Pro Gln Gly Pro Pro Gly Pro Thr Gly

610 615 620

Pro Gly Gly Asp Lys Gly Asp Thr Gly Pro Pro Gly Pro Gln Gly Leu

625 630 635 640

Gln Gly Leu Pro Gly Thr Gly Gly Pro Pro Gly Glu Asn Gly Lys Pro

645 650 655

Gly Glu Pro Gly Pro Lys Gly Asp Ala Gly Ala Pro Gly Ala Pro Gly

660 665 670

Gly Lys Gly Asp Ala Gly Ala Pro Gly Glu Arg Gly Pro Pro Gly Leu

675 680 685

Ala Gly Ala Pro Gly Leu Arg Gly Gly Ala Gly Pro Pro Gly Pro Glu

690 695 700

Gly Gly Lys Gly Ala Ala Gly Pro Pro Gly Pro Pro Gly Ala Ala Gly

705 710 715 720

Thr Pro Gly Leu Gln Gly Met Pro Gly Glu Arg Gly Gly Leu Gly Ser

725 730 735

Pro Gly Pro Lys Gly Asp Lys Gly Glu Pro Gly Gly Pro Gly Ala Asp

740 745 750

Gly Val Pro Gly Lys Asp Gly Pro Arg Gly Pro Thr Gly Pro Ile Gly

755 760 765

Pro Pro Gly Pro Ala Gly Gln Pro Gly Asp Lys Gly Glu Gly Gly Ala

770 775 780

Pro Gly Leu Pro Gly Ile Ala Gly Pro Arg Gly Ser Pro Gly Glu Arg

785 790 795 800

Gly Glu Thr Gly Pro Pro Gly Pro Ala Gly Phe Pro Gly Ala Pro Gly

805 810 815

Gln Asn Gly Glu Pro Gly Gly Lys Gly Glu Arg Gly Ala Pro Gly Glu

820 825 830

Lys Gly Glu Gly Gly Pro Pro Gly Val Ala Gly Pro Pro Gly Lys Asp

835 840 845

Gly Thr Ser Gly His Pro Gly Pro Ile Gly Pro Pro Gly Pro Arg Gly

850 855 860

Asn Arg Gly Glu Arg Gly Ser Glu Gly Ser Pro Gly His Pro Gly Gln

865 870 875 880

Pro Gly Pro Pro Gly Pro Pro Gly Ala Pro Gly Pro Cys Cys Gly Gly

885 890 895

Val Gly Ala Ala Ala Ile Ala Gly Ile Gly Gly Glu Lys Ala Gly Gly

900 905 910

Phe Ala Pro Tyr Tyr Gly Asp Glu Pro Met Asp Phe Lys Ile Asn Thr

915 920 925

Asp Glu Ile Met Thr Ser Leu Lys Ser Val Asn Gly Gln Ile Glu Ser

930 935 940

Leu Ile Ser Pro Asp Gly Ser Arg Lys Asn Pro Ala Arg Asn Cys Arg

945 950 955 960

Asp Leu Lys Phe Cys His Pro Glu Leu Lys Ser Gly Glu Tyr Trp Val

965 970 975

Asp Pro Asn Gln Gly Cys Lys Leu Asp Ala Ile Lys Val Phe Cys Asn

980 985 990

Met Glu Thr Gly Glu Thr Cys Ile Ser Ala Asn Pro Leu Asn Val Pro

995 1000 1005

Arg Lys His Trp Trp Thr Asp Ser Ser Ala Glu Lys Lys His Val

1010 1015 1020

Trp Phe Gly Glu Ser Met Asp Gly Gly Phe Gln Phe Ser Tyr Gly

1025 1030 1035

Asn Pro Glu Leu Pro Glu Asp Val Leu Asp Val Gln Leu Ala Phe

1040 1045 1050

Leu Arg Leu Leu Ser Ser Arg Ala Ser Gln Asn Ile Thr Tyr His

1055 1060 1065

Cys Lys Asn Ser Ile Ala Tyr Met Asp Gln Ala Ser Gly Asn Val

1070 1075 1080

Lys Lys Ala Leu Lys Leu Met Gly Ser Asn Glu Gly Glu Phe Lys

1085 1090 1095

Ala Glu Gly Asn Ser Lys Phe Thr Tyr Thr Val Leu Glu Asp Gly

1100 1105 1110

Cys Thr Lys His Thr Gly Glu Trp Ser Lys Thr Val Phe Glu Tyr

1115 1120 1125

Arg Thr Arg Lys Ala Val Arg Leu Pro Ile Val Asp Ile Ala Pro

1130 1135 1140

Tyr Asp Ile Gly Gly Pro Asp Gln Glu Phe Gly Val Asp Val Gly

1145 1150 1155

Pro Val Cys Phe Leu

1160

<210> 3

<211> 297

<212> PRT

<213> 智人(Homo sapiens)

<400> 3

Gly Pro Gly Gly Pro Gly Pro Gln Gly Pro Pro Gly Lys Asn Gly Glu

1 5 10 15

Thr Gly Pro Gln Gly Pro Pro Gly Pro Thr Gly Pro Gly Gly Asp Lys

20 25 30

Gly Asp Thr Gly Pro Pro Gly Pro Gln Gly Leu Gln Gly Leu Pro Gly

35 40 45

Thr Gly Gly Pro Pro Gly Glu Asn Gly Lys Pro Gly Glu Pro Gly Pro

50 55 60

Lys Gly Asp Ala Gly Ala Pro Gly Ala Pro Gly Gly Lys Gly Asp Ala

65 70 75 80

Gly Ala Pro Gly Glu Arg Gly Pro Pro Gly Leu Ala Gly Ala Pro Gly

85 90 95

Leu Arg Gly Gly Ala Gly Pro Pro Gly Pro Glu Gly Gly Lys Gly Ala

100 105 110

Ala Gly Pro Pro Gly Pro Pro Gly Ala Ala Gly Thr Pro Gly Leu Gln

115 120 125

Gly Met Pro Gly Glu Arg Gly Gly Leu Gly Ser Pro Lys Gly Asp Lys

130 135 140

Gly Glu Pro Gly Gly Pro Gly Ala Asp Gly Val Pro Gly Lys Asp Gly

145 150 155 160

Pro Arg Gly Pro Thr Gly Pro Ile Gly Pro Pro Gly Pro Ala Gly Gln

165 170 175

Pro Gly Asp Lys Gly Glu Gly Gly Ala Pro Gly Leu Pro Gly Ile Ala

180 185 190

Gly Pro Arg Gly Ser Pro Gly Glu Arg Gly Glu Thr Gly Pro Pro Gly

195 200 205

Pro Ala Gly Phe Pro Gly Ala Pro Gly Gln Asn Gly Glu Pro Gly Gly

210 215 220

Lys Gly Glu Arg Gly Ala Pro Gly Glu Lys Gly Glu Gly Gly Pro Pro

225 230 235 240

Gly Val Ala Gly Pro Pro Gly Lys Asp Gly Thr Ser Gly His Pro Gly

245 250 255

Pro Ile Gly Pro Pro Gly Pro Arg Gly Asn Arg Gly Glu Arg Gly Ser

260 265 270

Glu Gly Ser Pro Gly His Pro Gly Gln Pro Gly Pro Pro Gly Pro Pro

275 280 285

Gly Ala Pro Gly Pro Cys Cys Gly Gly

290 295

<210> 4

<211> 162

<212> PRT

<213> 智人(Homo sapiens)

<400> 4

Gly Leu Gly Ser Pro Lys Gly Asp Lys Gly Glu Pro Gly Gly Pro Gly

1 5 10 15

Ala Asp Gly Val Pro Gly Lys Asp Gly Pro Arg Gly Pro Thr Gly Pro

20 25 30

Ile Gly Pro Pro Gly Pro Ala Gly Gln Pro Gly Asp Lys Gly Glu Gly

35 40 45

Gly Ala Pro Gly Leu Pro Gly Ile Ala Gly Pro Arg Gly Ser Pro Gly

50 55 60

Glu Arg Gly Glu Thr Gly Pro Pro Gly Pro Ala Gly Phe Pro Gly Ala

65 70 75 80

Pro Gly Gln Asn Gly Glu Pro Gly Gly Lys Gly Glu Arg Gly Ala Pro

85 90 95

Gly Glu Lys Gly Glu Gly Gly Pro Pro Gly Val Ala Gly Pro Pro Gly

100 105 110

Lys Asp Gly Thr Ser Gly His Pro Gly Pro Ile Gly Pro Pro Gly Pro

115 120 125

Arg Gly Asn Arg Gly Glu Arg Gly Ser Glu Gly Ser Pro Gly His Pro

130 135 140

Gly Gln Pro Gly Pro Pro Gly Pro Pro Gly Ala Pro Gly Pro Cys Cys

145 150 155 160

Gly Gly

<210> 5

<211> 5

<212> PRT

<213> 人工序列(artificial sequence)

<400> 5

Gly Gly Gly Gly Ser

1 5

<210> 6

<211> 31

<212> PRT

<213> 人工序列(artificial sequence)

<400> 6

His Ala Glu Gly Thr Phe Thr Ser Asp Val Ser Ser Tyr Leu Glu Gly

1 5 10 15

Gln Ala Ala Lys Glu Phe Ile Ala Trp Leu Val Lys Gly Arg Gly

20 25 30

<210> 7

<211> 11

<212> PRT

<213> 人工序列(artificial sequence)

<400> 7

Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Ala

1 5 10

<210> 8

<211> 345

<212> PRT

<213> 人工序列(artificial sequence)

<400> 8

His Gly Glu Gly Thr Phe Thr Ser Asp Val Ser Ser Tyr Leu Glu Glu

1 5 10 15

Gln Ala Ala Lys Glu Phe Ile Ala Trp Leu Val Lys Gly Arg Gly Gly

20 25 30

Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Ala Gly Pro

35 40 45

Gly Gly Pro Gly Pro Gln Gly Pro Pro Gly Lys Asn Gly Glu Thr Gly

50 55 60

Pro Gln Gly Pro Pro Gly Pro Thr Gly Pro Gly Gly Asp Lys Gly Asp

65 70 75 80

Thr Gly Pro Pro Gly Pro Gln Gly Leu Gln Gly Leu Pro Gly Thr Gly

85 90 95

Gly Pro Pro Gly Glu Asn Gly Lys Pro Gly Glu Pro Gly Pro Lys Gly

100 105 110

Asp Ala Gly Ala Pro Gly Ala Pro Gly Gly Lys Gly Asp Ala Gly Ala

115 120 125

Pro Gly Glu Arg Gly Pro Pro Gly Leu Ala Gly Ala Pro Gly Leu Arg

130 135 140

Gly Gly Ala Gly Pro Pro Gly Pro Glu Gly Gly Lys Gly Ala Ala Gly

145 150 155 160

Pro Pro Gly Pro Pro Gly Ala Ala Gly Thr Pro Gly Leu Gln Gly Met

165 170 175

Pro Gly Glu Arg Gly Gly Leu Gly Ser Pro Gly Pro Lys Gly Asp Lys

180 185 190

Gly Glu Pro Gly Gly Pro Gly Ala Asp Gly Val Pro Gly Lys Asp Gly

195 200 205

Pro Arg Gly Pro Thr Gly Pro Ile Gly Pro Pro Gly Pro Ala Gly Gln

210 215 220

Pro Gly Asp Lys Gly Glu Gly Gly Ala Pro Gly Leu Pro Gly Ile Ala

225 230 235 240

Gly Pro Arg Gly Ser Pro Gly Glu Arg Gly Glu Thr Gly Pro Pro Gly

245 250 255

Pro Ala Gly Phe Pro Gly Ala Pro Gly Gln Asn Gly Glu Pro Gly Gly

260 265 270

Lys Gly Glu Arg Gly Ala Pro Gly Glu Lys Gly Glu Gly Gly Pro Pro

275 280 285

Gly Val Ala Gly Pro Pro Gly Lys Asp Gly Thr Ser Gly His Pro Gly

290 295 300

Pro Ile Gly Pro Pro Gly Pro Arg Gly Asn Arg Gly Glu Arg Gly Ser

305 310 315 320

Glu Gly Ser Pro Gly His Pro Gly Gln Pro Gly Pro Pro Gly Pro Pro

325 330 335

Gly Ala Pro Gly Pro Cys Cys Gly Gly

340 345

<210> 9

<211> 210

<212> PRT

<213> 人工序列(artificial sequence)

<400> 9

His Gly Glu Gly Thr Phe Thr Ser Asp Val Ser Ser Tyr Leu Glu Glu

1 5 10 15

Gln Ala Ala Lys Glu Phe Ile Ala Trp Leu Val Lys Gly Arg Gly Gly

20 25 30

Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Ala Gly Leu

35 40 45

Gly Ser Pro Gly Pro Lys Gly Asp Lys Gly Glu Pro Gly Gly Pro Gly

50 55 60

Ala Asp Gly Val Pro Gly Lys Asp Gly Pro Arg Gly Pro Thr Gly Pro

65 70 75 80

Ile Gly Pro Pro Gly Pro Ala Gly Gln Pro Gly Asp Lys Gly Glu Gly

85 90 95

Gly Ala Pro Gly Leu Pro Gly Ile Ala Gly Pro Arg Gly Ser Pro Gly

100 105 110

Glu Arg Gly Glu Thr Gly Pro Pro Gly Pro Ala Gly Phe Pro Gly Ala

115 120 125

Pro Gly Gln Asn Gly Glu Pro Gly Gly Lys Gly Glu Arg Gly Ala Pro

130 135 140

Gly Glu Lys Gly Glu Gly Gly Pro Pro Gly Val Ala Gly Pro Pro Gly

145 150 155 160

Lys Asp Gly Thr Ser Gly His Pro Gly Pro Ile Gly Pro Pro Gly Pro

165 170 175

Arg Gly Asn Arg Gly Glu Arg Gly Ser Glu Gly Ser Pro Gly His Pro

180 185 190

Gly Gln Pro Gly Pro Pro Gly Pro Pro Gly Ala Pro Gly Pro Cys Cys

195 200 205

Gly Gly

210

<210> 10

<211> 1035

<212> DNA

<213> 人工序列(artificial sequence)

<400> 10

cacggtgagg gtacttttac ctctgatgtt tcctcatact tggaagaaca agctgctaag 60

gaattcattg cctggctggt caaaggcaga ggaggtggcg gatccggtgg cggtgggtcc 120

ggaggaggtg gttcagctgg tccaggtggt ccaggtcctc aaggtcctcc aggtaagaat 180

ggtgaaactg gtcctcaggg acctccaggc ccaaccggtc ctggaggtga taagggtgat 240

accggaccac ctggcccaca aggcttgcag ggtctgccag gtacaggggg tccacccggt 300

gaaaacggca agcctggtga accaggccca aaaggtgacg ctggagctcc aggagcccca 360

ggaggtaagg gtgatgctgg tgcccccggt gagagaggcc caccaggttt ggccggtgct 420

cccggtctga gagggggagc tggtccacca ggacctgaag gcggaaaagg tgctgctggt 480

ccacctggac cacctggtgc tgccggaact ccaggactgc agggaatgcc tggtgaaaga 540

ggcggattgg gatctcctgg cccaaaagga gacaagggag agcctggtgg accaggggca 600

gatggagttc ctggaaaaga tggtcctcgt ggtccaacag gacctatcgg tcccccagga 660

cctgctggtc aacctggaga taaaggtgaa ggcggggctc caggattgcc tggtattgcc 720

ggccctagag gttctcccgg tgaaagaggt gagaccggcc cacctggtcc agctggcttc 780

cctggagcac caggtcagaa tggtgagcca ggtggtaagg gtgagagagg agctccaggt 840

gagaaggggg aaggtggtcc acctggtgtt gctggtccac caggtaagga tggtacatcc 900

ggtcatcctg gaccaattgg acctccaggg cctagaggta acaggggtga aaggggatct 960

gaaggatctc ctggacatcc aggtcagccc ggtcctcctg gtccacccgg agctcctggg 1020

ccatgctgtg gtggc 1035

<210> 11

<211> 630

<212> DNA

<213> 人工序列(artificial sequence)

<400> 11

cacggtgagg gtacttttac ctctgatgtt tcctcatact tggaagaaca agctgctaag 60

gaattcattg cctggctggt caaaggcaga ggaggtggcg gatccggtgg cggtgggtcc 120

ggaggaggtg gttcagctgg tttgggatct cctggcccaa aaggagacaa gggagagcct 180

ggtggaccag gggcagatgg agttcctgga aaagatggtc ctcgtggtcc aacaggacct 240

atcggtcccc caggacctgc tggtcaacct ggagataaag gtgaaggcgg ggctccagga 300

ttgcctggta ttgccggccc tagaggttct cccggtgaaa gaggtgagac cggcccacct 360

ggtccagctg gcttccctgg agcaccaggt cagaatggtg agccaggtgg taagggtgag 420

agaggagctc caggtgagaa gggggaaggt ggtccacctg gtgttgctgg tccaccaggt 480

aaggatggta catccggtca tcctggacca attggacctc cagggcctag aggtaacagg 540

ggtgaaaggg gatctgaagg atctcctgga catccaggtc agcccggtcc tcctggtcca 600

cccggagctc ctgggccatg ctgtggtggc 630

<210> 12

<211> 30

<212> PRT

<213> 人工序列(artificial sequence)

<400> 12

His Gly Glu Gly Thr Phe Thr Ser Asp Val Ser Ser Tyr Leu Glu Glu

1 5 10 15

Gln Ala Ala Lys Glu Phe Ile Ala Trp Leu Val Lys Gly Arg

20 25 30

<210> 13

<211> 1210

<212> PRT

<213> 人工序列(artificial sequence)

<400> 13

His Gly Glu Gly Thr Phe Thr Ser Asp Val Ser Ser Tyr Leu Glu Glu

1 5 10 15

Gln Ala Ala Lys Glu Phe Ile Ala Trp Leu Val Lys Gly Arg Gly Gly

20 25 30

Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Ala Ala Met

35 40 45

Met Ser Phe Val Gln Lys Gly Ser Trp Leu Leu Leu Ala Leu Leu His

50 55 60

Pro Thr Ile Ile Leu Ala Gln Gln Glu Ala Val Glu Gly Gly Cys Ser

65 70 75 80

His Leu Gly Gln Ser Tyr Ala Asp Arg Asp Val Trp Lys Pro Glu Pro

85 90 95

Cys Gln Ile Cys Val Cys Asp Ser Gly Ser Val Leu Cys Asp Asp Ile

100 105 110

Ile Cys Asp Asp Gln Glu Leu Asp Cys Pro Asn Pro Glu Ile Pro Phe

115 120 125

Gly Glu Cys Cys Ala Val Cys Pro Gln Pro Pro Thr Ala Pro Thr Arg

130 135 140

Pro Pro Asn Gly Gln Gly Pro Gln Gly Pro Lys Gly Asp Pro Gly Pro

145 150 155 160

Pro Gly Ile Pro Gly Arg Asn Gly Asp Pro Gly Ile Pro Gly Gln Pro

165 170 175

Gly Ser Pro Gly Ser Pro Gly Pro Pro Gly Ile Cys Glu Ser Cys Pro

180 185 190

Thr Gly Pro Gln Asn Tyr Ser Pro Gln Tyr Asp Ser Tyr Asp Val Lys

195 200 205

Ser Gly Val Ala Val Gly Gly Leu Ala Gly Tyr Pro Gly Pro Ala Gly

210 215 220

Pro Pro Gly Pro Pro Gly Pro Pro Gly Thr Ser Gly His Pro Gly Ser

225 230 235 240

Pro Gly Ser Pro Gly Tyr Gln Gly Pro Pro Gly Glu Pro Gly Gln Ala

245 250 255

Gly Pro Ser Gly Pro Pro Gly Pro Pro Gly Ala Ile Gly Pro Ser Gly

260 265 270

Pro Ala Gly Lys Asp Gly Glu Ser Gly Arg Pro Gly Arg Pro Gly Glu

275 280 285

Arg Gly Leu Pro Gly Pro Pro Gly Ile Lys Gly Pro Ala Gly Ile Pro

290 295 300

Gly Phe Pro Gly Met Lys Gly His Arg Gly Phe Asp Gly Arg Asn Gly

305 310 315 320

Glu Lys Gly Glu Thr Gly Ala Pro Gly Leu Lys Gly Glu Asn Gly Leu

325 330 335

Pro Gly Glu Asn Gly Ala Pro Gly Pro Met Gly Pro Arg Gly Ala Pro

340 345 350

Gly Glu Arg Gly Arg Pro Gly Leu Pro Gly Ala Ala Gly Ala Arg Gly

355 360 365

Asn Asp Gly Ala Arg Gly Ser Asp Gly Gln Pro Gly Pro Pro Gly Pro

370 375 380

Pro Gly Thr Ala Gly Phe Pro Gly Ser Pro Gly Ala Lys Gly Glu Val

385 390 395 400

Gly Pro Ala Gly Ser Pro Gly Ser Asn Gly Ala Pro Gly Gln Arg Gly

405 410 415

Glu Pro Gly Pro Gln Gly His Ala Gly Ala Gln Gly Pro Pro Gly Pro

420 425 430

Pro Gly Ile Asn Gly Ser Pro Gly Gly Lys Gly Glu Met Gly Pro Ala

435 440 445

Gly Ile Pro Gly Ala Pro Gly Leu Met Gly Ala Arg Gly Pro Pro Gly

450 455 460

Pro Ala Gly Ala Asn Gly Ala Pro Gly Leu Arg Gly Gly Ala Gly Glu

465 470 475 480

Pro Gly Lys Asn Gly Ala Lys Gly Glu Pro Gly Pro Arg Gly Glu Arg

485 490 495

Gly Glu Ala Gly Ile Pro Gly Val Pro Gly Ala Lys Gly Glu Asp Gly

500 505 510

Lys Asp Gly Ser Pro Gly Glu Pro Gly Ala Asn Gly Leu Pro Gly Ala

515 520 525

Ala Gly Glu Arg Gly Ala Pro Gly Phe Arg Gly Pro Ala Gly Pro Asn

530 535 540

Gly Ile Pro Gly Glu Lys Gly Pro Ala Gly Glu Arg Gly Ala Pro Gly

545 550 555 560

Pro Ala Gly Pro Arg Gly Ala Ala Gly Glu Pro Gly Arg Asp Gly Val

565 570 575

Pro Gly Gly Pro Gly Met Arg Gly Met Pro Gly Ser Pro Gly Gly Pro

580 585 590

Gly Ser Asp Gly Lys Pro Gly Pro Pro Gly Ser Gln Gly Glu Ser Gly

595 600 605

Arg Pro Gly Pro Pro Gly Pro Ser Gly Pro Arg Gly Gln Pro Gly Val

610 615 620

Met Gly Phe Pro Gly Pro Lys Gly Asn Asp Gly Ala Pro Gly Lys Asn

625 630 635 640

Gly Glu Arg Gly Gly Pro Gly Gly Pro Gly Pro Gln Gly Pro Pro Gly

645 650 655

Lys Asn Gly Glu Thr Gly Pro Gln Gly Pro Pro Gly Pro Thr Gly Pro

660 665 670

Gly Gly Asp Lys Gly Asp Thr Gly Pro Pro Gly Pro Gln Gly Leu Gln

675 680 685

Gly Leu Pro Gly Thr Gly Gly Pro Pro Gly Glu Asn Gly Lys Pro Gly

690 695 700

Glu Pro Gly Pro Lys Gly Asp Ala Gly Ala Pro Gly Ala Pro Gly Gly

705 710 715 720

Lys Gly Asp Ala Gly Ala Pro Gly Glu Arg Gly Pro Pro Gly Leu Ala

725 730 735

Gly Ala Pro Gly Leu Arg Gly Gly Ala Gly Pro Pro Gly Pro Glu Gly

740 745 750

Gly Lys Gly Ala Ala Gly Pro Pro Gly Pro Pro Gly Ala Ala Gly Thr

755 760 765

Pro Gly Leu Gln Gly Met Pro Gly Glu Arg Gly Gly Leu Gly Ser Pro

770 775 780

Gly Pro Lys Gly Asp Lys Gly Glu Pro Gly Gly Pro Gly Ala Asp Gly

785 790 795 800

Val Pro Gly Lys Asp Gly Pro Arg Gly Pro Thr Gly Pro Ile Gly Pro

805 810 815

Pro Gly Pro Ala Gly Gln Pro Gly Asp Lys Gly Glu Gly Gly Ala Pro

820 825 830

Gly Leu Pro Gly Ile Ala Gly Pro Arg Gly Ser Pro Gly Glu Arg Gly

835 840 845

Glu Thr Gly Pro Pro Gly Pro Ala Gly Phe Pro Gly Ala Pro Gly Gln

850 855 860

Asn Gly Glu Pro Gly Gly Lys Gly Glu Arg Gly Ala Pro Gly Glu Lys

865 870 875 880

Gly Glu Gly Gly Pro Pro Gly Val Ala Gly Pro Pro Gly Lys Asp Gly

885 890 895

Thr Ser Gly His Pro Gly Pro Ile Gly Pro Pro Gly Pro Arg Gly Asn

900 905 910

Arg Gly Glu Arg Gly Ser Glu Gly Ser Pro Gly His Pro Gly Gln Pro

915 920 925

Gly Pro Pro Gly Pro Pro Gly Ala Pro Gly Pro Cys Cys Gly Gly Val

930 935 940

Gly Ala Ala Ala Ile Ala Gly Ile Gly Gly Glu Lys Ala Gly Gly Phe

945 950 955 960

Ala Pro Tyr Tyr Gly Asp Glu Pro Met Asp Phe Lys Ile Asn Thr Asp

965 970 975

Glu Ile Met Thr Ser Leu Lys Ser Val Asn Gly Gln Ile Glu Ser Leu

980 985 990

Ile Ser Pro Asp Gly Ser Arg Lys Asn Pro Ala Arg Asn Cys Arg Asp

995 1000 1005

Leu Lys Phe Cys His Pro Glu Leu Lys Ser Gly Glu Tyr Trp Val

1010 1015 1020

Asp Pro Asn Gln Gly Cys Lys Leu Asp Ala Ile Lys Val Phe Cys

1025 1030 1035

Asn Met Glu Thr Gly Glu Thr Cys Ile Ser Ala Asn Pro Leu Asn

1040 1045 1050

Val Pro Arg Lys His Trp Trp Thr Asp Ser Ser Ala Glu Lys Lys

1055 1060 1065

His Val Trp Phe Gly Glu Ser Met Asp Gly Gly Phe Gln Phe Ser

1070 1075 1080

Tyr Gly Asn Pro Glu Leu Pro Glu Asp Val Leu Asp Val Gln Leu

1085 1090 1095

Ala Phe Leu Arg Leu Leu Ser Ser Arg Ala Ser Gln Asn Ile Thr

1100 1105 1110

Tyr His Cys Lys Asn Ser Ile Ala Tyr Met Asp Gln Ala Ser Gly

1115 1120 1125

Asn Val Lys Lys Ala Leu Lys Leu Met Gly Ser Asn Glu Gly Glu

1130 1135 1140

Phe Lys Ala Glu Gly Asn Ser Lys Phe Thr Tyr Thr Val Leu Glu

1145 1150 1155

Asp Gly Cys Thr Lys His Thr Gly Glu Trp Ser Lys Thr Val Phe

1160 1165 1170

Glu Tyr Arg Thr Arg Lys Ala Val Arg Leu Pro Ile Val Asp Ile

1175 1180 1185

Ala Pro Tyr Asp Ile Gly Gly Pro Asp Gln Glu Phe Gly Val Asp

1190 1195 1200

Val Gly Pro Val Cys Phe Leu

1205 1210

Claims

1.一种融合蛋白，其特征在于，所述融合蛋白的结构如下式I所示：

A-L-B (I)

所述GLP-1类似物具有SEQ ID NO.:1所示氨基酸序列的多肽，

其中Xaa₈是Gly或Ala，Xaa₂₂是Glu或Gly，Xaa₃₇是Gly或无。

2.如权利要求1所述的融合蛋白，其特征在于，所述GLP-1类似物具有如SEQ ID NO.:6或12所示的氨基酸序列。

3.如权利要求1所述的融合蛋白，其特征在于，所述人Ⅲ型胶原α1链具有SEQ ID NO.:2、3或4所示的氨基酸序列。

4.如权利要求1所述的融合蛋白，其特征在于，所述融合蛋白具有SEQ ID NO.:8、9或13所示的氨基酸序列。

5.一种寡聚体，其特征在于，所述寡聚体包含权利要求1所述的融合蛋白。

6.一种分离的多核苷酸，其特征在于，所述多核苷酸编码权利要求1所述的融合蛋白。

7.一种载体，其特征在于，所述载体包括权利要求6所述的多核苷酸。

8.一种宿主细胞，其特征在于，所述的宿主细胞含有权利要求7所述的载体、或染色体中整合有外源的权利要求6所述的多核苷酸、或表达权利要求1所述的融合蛋白、或表达权利要求5所述的寡聚体。

9.一种药物组合物，其特征在于，所述药物组合物包括权利要求1所述的融合蛋白或权利要求5所述的寡聚体，以及药学上可接受的载体或赋形剂。

10.如权利要求1所述的融合蛋白、权利要求5所述的寡聚体、权利要求6所述的多核苷酸、权利要求7所述的载体、权利要求8所述的宿主细胞，其特征在于，用于制备预防和/或治疗糖尿病的药物或制剂。