[go: up one dir, main page]

CN113573724A - 重组润滑素和组合物以及其使用方法 - Google Patents

重组润滑素和组合物以及其使用方法 Download PDF

Info

Publication number
CN113573724A
CN113573724A CN202080021544.XA CN202080021544A CN113573724A CN 113573724 A CN113573724 A CN 113573724A CN 202080021544 A CN202080021544 A CN 202080021544A CN 113573724 A CN113573724 A CN 113573724A
Authority
CN
China
Prior art keywords
lubricin
sequence
seq
cell
cells
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202080021544.XA
Other languages
English (en)
Inventor
M·帕塞克
H·里辛克
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Cornell University
Original Assignee
Cornell University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Cornell University filed Critical Cornell University
Publication of CN113573724A publication Critical patent/CN113573724A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/46Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates
    • C07K14/47Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals
    • C07K14/4701Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals not used
    • C07K14/4727Mucins, e.g. human intestinal mucin
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61LMETHODS OR APPARATUS FOR STERILISING MATERIALS OR OBJECTS IN GENERAL; DISINFECTION, STERILISATION OR DEODORISATION OF AIR; CHEMICAL ASPECTS OF BANDAGES, DRESSINGS, ABSORBENT PADS OR SURGICAL ARTICLES; MATERIALS FOR BANDAGES, DRESSINGS, ABSORBENT PADS OR SURGICAL ARTICLES
    • A61L12/00Methods or apparatus for disinfecting or sterilising contact lenses; Accessories therefor
    • A61L12/08Methods or apparatus for disinfecting or sterilising contact lenses; Accessories therefor using chemical substances
    • A61L12/14Organic compounds not covered by groups A61L12/10 or A61L12/12
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P19/00Drugs for skeletal disorders
    • A61P19/02Drugs for skeletal disorders for joint disorders, e.g. arthritis, arthrosis
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/46Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates
    • C07K14/47Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/46Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates
    • C07K14/47Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals
    • C07K14/4701Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals not used
    • C07K14/4725Proteoglycans, e.g. aggreccan
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K38/00Medicinal preparations containing peptides
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61LMETHODS OR APPARATUS FOR STERILISING MATERIALS OR OBJECTS IN GENERAL; DISINFECTION, STERILISATION OR DEODORISATION OF AIR; CHEMICAL ASPECTS OF BANDAGES, DRESSINGS, ABSORBENT PADS OR SURGICAL ARTICLES; MATERIALS FOR BANDAGES, DRESSINGS, ABSORBENT PADS OR SURGICAL ARTICLES
    • A61L2101/00Chemical composition of materials used in disinfecting, sterilising or deodorising
    • A61L2101/32Organic compounds
    • A61L2101/46Macromolecular compounds
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/01Fusion polypeptide containing a localisation/targetting motif
    • C07K2319/02Fusion polypeptide containing a localisation/targetting motif containing a signal sequence
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/01Fusion polypeptide containing a localisation/targetting motif
    • C07K2319/03Fusion polypeptide containing a localisation/targetting motif containing a transmembrane segment
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/20Fusion polypeptide containing a tag with affinity for a non-protein ligand
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/20Fusion polypeptide containing a tag with affinity for a non-protein ligand
    • C07K2319/21Fusion polypeptide containing a tag with affinity for a non-protein ligand containing a His-tag
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/60Fusion polypeptide containing spectroscopic/fluorescent detection, e.g. green fluorescent protein [GFP]

Landscapes

  • Health & Medical Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Medicinal Chemistry (AREA)
  • Biochemistry (AREA)
  • Biophysics (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Genetics & Genomics (AREA)
  • Zoology (AREA)
  • Molecular Biology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Toxicology (AREA)
  • Animal Behavior & Ethology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Veterinary Medicine (AREA)
  • Public Health (AREA)
  • General Chemical & Material Sciences (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Physical Education & Sports Medicine (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Orthopedic Medicine & Surgery (AREA)
  • Immunology (AREA)
  • Engineering & Computer Science (AREA)
  • Rheumatology (AREA)
  • Epidemiology (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Peptides Or Proteins (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)

Abstract

提供了与修饰的润滑素相关的组合物和方法,制备所述修饰的润滑素的方法,以及使用所述修饰的润滑素涂布多种无生命物品和预防和/或治疗需要增强人或非人哺乳动物的一个或多个部分的润滑的病症的方法。

Description

重组润滑素和组合物以及其使用方法
相关申请的交叉引用
本申请要求2019年1月15日提交的美国临时专利申请第62/792,660号的优先权,所述申请的全部公开内容以引用的方式并入。
政府资助
本发明是在政府支持下进行的,由美国国立卫生研究院(National Institutesof Health)授予的批准号为1DP2GM119133-01和1U54CA210184-01。政府在本发明中享有某些权利。
发明领域
本公开提供改良的糖蛋白,以及与其相关的组合物和方法。
背景技术
润滑素(Lubricin)是在哺乳动物解剖结构的若干位置中发现的糖基化蛋白。举例来说,润滑素存在于滑液中和软骨表面上。润滑素在润滑关节和维持正确关节环境方面具有重要作用。
先前已尝试提供重组形式的润滑素,但对于可用于各种环境的新润滑素和润滑素样糖蛋白,依然存在持续且未被满足的需求。本公开与此需求相关。
发明内容
本公开提供与修饰的糖蛋白相关的组合物和方法。本公开的各方面涉及修饰的润滑素、含有修饰的润滑素的药物组合物、编码修饰的润滑素的cDNA和表达载体、表达修饰的润滑素的真核细胞,以及出于多种目的使用修饰的润滑素和包含其的组合物的方法。所述方法包括使用此类药剂来预防和/或治疗需要改善人或非人哺乳动物内表面或流体的润滑的多种病状。本公开还包括使用所述组合物为多种无生命物品提供润滑。
在某些实施方案中,修饰的润滑素相对于其天然产生的对应物包含特定氨基酸序列的串联重复数的改变,和/或修饰的润滑素的氨基酸序列的一个或多个改变。在实施方案中,修饰的润滑素包含衍生自人、马或犬润滑素的氨基酸序列,但相对于先前提供的此类序列的重组形式具有不同功能属性。在一个实施方案中,修饰的润滑素具有超过4天的延长的半衰期,例如注射到哺乳动物中时的关节内半衰期。在实施方案中,修饰的润滑素展现超过15天或至少30天的关节内半衰期。在实施方案中,相对于未修饰的润滑素,修饰的润滑素具有修饰的糖基化谱。
在实施方案中,修饰的润滑素包括连续重复序列,其为KEPAPTTP(SEQ ID NO:1)、KEPAPTP(SEQ ID NO:9)和KEPAPTTTP(SEQ ID NO:10)中的一者或组合。在实施方案中,重复序列连续重复10-120次。在一个非限制性实施方案中,重复序列重复59次。
在实施方案中,修饰的润滑素包含由人或非人哺乳动物产生的润滑素的衍生物的氨基酸序列。在实施方案中,连续重复序列在其N和C端区段上侧接与人、马或犬润滑素序列具有至少90%同一性的润滑素氨基酸序列。
在实施方案中,修饰的润滑素包括额外组分,例如来自人或非人哺乳动物或其它合适来源的添加的分泌信号。
附图说明
如下文所描述,本公开的附图和表格分为四个部分(第I部分、第II部分、第III部分和第IV部分)。
第I部分附图
图1:序列特异性粘蛋白的组合遗传编码文库。(a)组合序列特异性粘蛋白的示意图。(b)示意图显示用于完整粘蛋白构建的可交换生物砖(bio-brick)和侧接限制位点。(c)粘蛋白串联重复骨架cDNA的设计和制造的工作流程。(d)文库中密码子加扰(codon-scrambled)粘蛋白骨架的概述。野生型Muc1序列为SEQ ID NO:8。Muc1单突变体(Muc1_S)为SEQ ID NO:5。Muc1双重突变体(Muc1_D)为SEQ ID NO:6。Muc1三重突变体(Muc1_T)为SEQID NO:7。合成物1(Syn1)为DAATPAP,为SEQ ID NO:2。合成物2(Syn2)为SEQ ID NO:3。合成物3(Syn3)为SEQ ID NO:4。润滑素共有序列(Syn4)为SEQ ID NO:1。
图2:序列特异性粘蛋白表达的构建和验证。(a)具有GFP报告子的密码子优化Muc1变异体的组分和特征。(a)中的氨基酸序列为SEQ ID NO:8。(b)多肽骨架的预测分子量。(c)Tn抗原、核心1和核心2聚糖的生物合成,以及用于其检测的相关凝集素的特异性。(d)野生型和核心-1β3-T特异性分子伴侣蛋白(COSMC)敲除MCF10A细胞中天然Muc1表达和糖基化的蛋白质印迹分析。MCF10A细胞经天然Muc1稳定转染。通过高碘酸盐标记用AFDye 568标记表面唾液酸,随后收集溶解产物。印迹用MUC1 TR(CD227 HPMV)Ab-FITC和PNA-CF640或生物素化VVA(二级:中性亲和素(NeutrAvidin)-Dylight 650)以多种颜色染色。(e)瞬时转染的HEK293T细胞的提取物中天然和密码子加扰Muc1的蛋白质印迹分析。(f)瞬时转染的HEK293T细胞的免疫荧光图像,所述细胞表达指定构建体并用PNA凝集素(左)、抗Muc1抗体(中左)、GFP(中右)和Hoescht细胞核染色剂(右)探测(比例尺10μm)。(g)瞬时转染的HEK293T细胞的提取物中,不同大小的粘蛋白的PNA凝集素印迹分析(左)和强度分布(右)。
图3:工程化Muc1聚合物骨架中糖基化位点的频率调节O-聚糖成熟。(a)各自具有21个串联重复的分泌型Muc1和工程化变异体的组分和特征。(b)分泌型粘蛋白突变体的串联重复序列和多肽骨架的分子量。单糖基化、双重糖基化和三重糖基化突变体(sMuc1S、sMuc1D和sMuc1T)每个重复分别具有一个、两个或三个丝氨酸/苏氨酸(S/T)到丙氨酸的取代。sMuc1突变体(21个重复)的序列自上而下为:SEQ ID NO:8、SEQ ID NO:5、SEQ ID NO:6和SEQ ID NO:7。(c)用抗SUMOstar抗体和PNA、s-WGA以及VVA凝集素探测的FreeStyleTM293-F细胞培养基的亲和力纯化的重组分泌型粘蛋白的代表性蛋白质印迹分析(三个独立实验)。凝集素印迹用PNA-Alexa Fluor 568、s-WGA-FITC和生物素化VVA(二级:中性亲和素-Dylight 650)以多种颜色共染色。(d)(c)中印迹的代表性荧光强度电泳图。(e)对于指定粘蛋白和其聚合物骨架中的S/T糖基化位点的相应频率,PNA与VVA信号(上)和s-WGA与VVA信号(下)的比率强度分析。比率荧光强度沿每个泳道定量,并相对于来自具有野生型Muc1串联重复(sMuc1)的分泌型粘蛋白的信号归一化;数据呈现为来自至少三个独立实验的平均值和SEM。*P<0.05**P<0.01***P<0.001(f)左图:来自HEK293T细胞培养基的具有野生型Muc1串联重复(sMuc1)和三重突变体(sMuc1T)的分泌型粘蛋白的全甲基化聚糖糖醇的样品记录的MALDI-TOF质谱。根据检测为钠加合物的分子离子的相对质量(m/z)并通过指配相应核心结构(核心1为红色,核心2为黑色)标注离子信号。右图:分泌型粘蛋白上检测到的O-连接聚糖的示意性表示。
图4:设计者粘蛋白结构域揭示对糖基化的序列特异性效应。图4所示序列为KEPAPTTP(SEQ ID NO:1)、DAATPAP(SEQ ID NO:2)、DAATPAPP(SEQ ID NO:3)和PASTSAPG(SEQ ID NO:4)。(a)设计者粘蛋白的组分和特征。(b)粘蛋白多肽骨架的预测分子量。(c)用抗GFP抗体探测或用PNA和VVA凝集素共染色的瞬时转染的HEK293T细胞的提取物中指定构建体的代表性蛋白质印迹分析(来自三个独立实验)。(d)来自三个独立实验的指定构建体的(c)中蛋白质印迹的代表性荧光强度电泳图。虚线指示PNA印迹中可见的糖型的峰。阴影框指示抗GFP印迹上具有最高和第二高的表观分子量的带之间的区。(e)对于指定粘蛋白和其聚合物骨架中丝氨酸和苏氨酸糖基化位点的相应频率,PNA与VVA染色的比率强度分析。荧光强度沿双重探测的凝集素印迹的每个泳道定量,并将其PNA:VVA比率相对于KEPAPTTP(SEQ ID NO:1)x20粘蛋白的PNA:VVA比率归一化;数据呈现为来自三个独立实验的平均值和SEM。(f)在将指定粘蛋白骨架大小从40个串联重复倍增到80个的情况下,PNA:VVA比率的变化倍数;数据呈现为来自三个独立实验的平均值和SEM。*p<0.05。
图5:通过细胞质尾区工程化调节粘蛋白糖基化。(a)具有合成的21个氨基酸的跨膜锚(TM21)和工程化细胞质基序的细胞表面粘蛋白的组分和特征;天然CT是指从Muc1调适的天然细胞质尾区。(b)来自瞬时转染的HEK293T细胞的指定粘蛋白同工型的凝集素印迹分析,以通过高碘酸盐氧化检测唾液酸化O-聚糖,并通过PNA检测核心-I结构;印迹代表三个独立实验。(c)唾液酸酶处理之前及之后的指定粘蛋白同工型的PNA-凝集素印迹分析;印迹代表三个独立实验。(d)顶部:来自瞬时转染的HEK293T细胞的指定粘蛋白同工型免疫沉淀的代表性MAA和PNA凝集素印迹分析(来自四个独立实验)。底部:唾液酸与核心1聚糖信号的比率强度(MAA:PNA);数据呈现为来自四个独立实验的平均值和SEM。*P<0.05。
图6:用具有天然重复(天然_Muc1)与密码子加扰Muc1 cDNA(Muc1_42)的慢病毒编辑的MCF10A细胞的蛋白质印迹分析。
图7:具有可调大小的粘蛋白。图7中所示的序列为PDTRPAPGSTAPPAHGVTSA(SEQ IDNO:8)。(a)具有GFP报告子、天然Muc1跨膜锚和密码子加扰Muc1串联重复的粘蛋白构建体的组分和特征。(b)来自三个独立实验的瞬时转染的HEK293T细胞的代表性免疫荧光图像,所述细胞表达(a)中所示的加GFP标签的Muc1构建体并用PNA、抗Muc1抗体和Hoechst细胞核染色剂共染色(比例尺10μm)。(c)具有合成的21个氨基酸的跨膜锚(TM21)和密码子加扰Muc1重复的粘蛋白构建体的组分和特征。(d)(c)中所示粘蛋白多肽骨架的预测分子量。(e)来自瞬时转染的HEK293T细胞的提取物,并且用PNA凝集素或抗Muc1抗体探测的如(c)所示TM21构建体的代表性蛋白质印迹分析(三个独立实验)。(f)来自三个独立实验的表达(c)中的指定构建体的HEK293T的代表性相位对比图像(比例尺100μm)。
图8:用抗6×His抗体和VVA凝集素探测的来自FreeStyleTM 293-F细胞培养基的亲和力纯化的重组分泌型粘蛋白的蛋白质印迹图像。
图9:衍生自Muc1串联重复序列的细胞表面粘蛋白突变体。图9所示序列,mMUC1突变体(21个重复)自上而下为PDTRPAPGSTAPPAHGVTSA(SEQ ID NO:8)、PDTRPAPGATAPPAHGVTSA(SEQ ID NO:5)、PDTRPAPGATAPPAHGVTAA(SEQ ID NO:6)和PDARPAPGATAPPAHGVTAA(SEQ ID NO:7)。(a)用21个天然或工程化Muc1重复、GFP报告子和天然Muc1跨膜锚构建的粘蛋白的组分和特征。(b)天然Muc1(mMuc1)或具有单、双重或三重丝氨酸/苏氨酸到丙氨酸取代的工程化变异体(mMuc1S、mMuc1D或mMuc1T)的串联重复和预测骨架分子量。(c)(a)中指定构建体的代表性蛋白质和凝集素印迹分析,其来自瞬时转染的HEK293T细胞的提取物中,并用抗GFP抗体探测或用PNA、VVA和s-WGA凝集素共染色,来自三个独立实验。(d)用21个天然或工程化Muc1重复和合成的21个氨基酸的跨膜锚(TM21)构建的粘蛋白的组分和特征。(e)来自三个独立实验的瞬时转染的HEK293T细胞的代表性免疫荧光图像,所述细胞表达(d)中指定构建体并用PNA凝集素和Hoechst细胞核染色剂共染色(比例尺10μm)。
图10:如细胞O-糖组报告基因/扩增(Cellular O-Glycome Reporter/Amplification,CORA)报告的粘蛋白型O-聚糖的MALDI-TOF_MS谱。HEK293T细胞用指定合成粘蛋白构建体或模拟媒剂瞬时转染。谱相对于m/z=550下的基质峰归一化。
图11:用设计者串联重复构建的粘蛋白。图11所示序列为DAATPAP(SEQ ID NO:2)、DAATPAPP(SEQ ID NO:3)和PPASTSAPG(SEQ ID NO:4)。(a)具有设计者串联重复、GFP报告子和天然Muc1跨膜锚的粘蛋白构建体的组分和特征。(e)来自三个独立实验的瞬时转染的HEK293T细胞的代表性免疫荧光图像,所述细胞表达指定加GFP标签的构建体并用PNA凝集素和Hoescht细胞核染色剂共染色(比例尺10μm)。
第II部分附图
图12:工程化生物聚合物涂布的细胞系。使用基于转座子的方法在多西环素(doxycycline)诱导型启动子下稳定整合编码工程化生物聚合物的DNA。A,用于产生生物聚合物涂布的细胞系的多合一载体的示意性图示,其显示关键元件。为了并入细胞基因组中,载体包括四环素反应性元件(tetO)、最小CMV启动子、Muc1信号序列(Muc1N端)、生物聚合物的串联重复(PDTRPAPGSTAPPAHGVTSA(SEQ ID NO:8)的0、21或42个重复)、Muc1的跨膜结构域(Muc1 TM)、双顺反子绿色荧光蛋白报告基因(IRES GFP)、EF-1α启动子、反向四环素反式激活子(rtTA)以及第二双顺反子新霉素抗性盒(IRES NeoR)。这些元件均侧接转座子介导的并入基因组中所需的5'和3'反向末端重复序列(ITR)。对于细菌中的载体复制和产生,还存在氨苄西林(ampicillin)抗性盒(AmpR)和复制起点(ori)。B,由细胞表达且定位到细胞表面的膜结合生物聚合物的示意性图示。C,工程化生物聚合物细胞外结构域相对尺寸的示意图,其根据以nm为单位的长度分别命名为粘蛋白-0、粘蛋白-135和粘蛋白-270。这些蛋白质的预测分子量分别为42kDa、81kDa和120kDa。
图13:生物聚合物涂层的验证。针对新的工程化293-F细胞系验证生物聚合物涂层的表达和细胞表面定位。A,稳定悬浮适应人胚肾293(293-F)细胞系-野生型(w.t.)或稳定表达粘蛋白-0、粘蛋白-135或粘蛋白-270生物聚合物的代表性共聚焦显微图像。图像显示细胞膜(以蓝色显示,CF633麦胚凝集素,WGA)、与粘蛋白-135和粘蛋白-270生物聚合物共价连接的O-聚糖(以红色显示,CF568花生凝集素,PNA)以及在质粒上与粘蛋白-0、粘蛋白-135和粘蛋白-270生物聚合物共表达的绿色荧光蛋白(以绿色显示,GFP)。B,显示与w.t.细胞相比,表达生物聚合物的细胞系的多分散群的代表性流式细胞直方图,y轴经缩放以显示GFP阳性细胞的群分布。每个直方图>50,000个细胞。C,每种细胞系GFP阳性细胞百分比的定量。图2B中GFP信号在灰色线上方的细胞视为GFP阳性。显示平均值和S.D.,每样品>50,000个细胞,n=4。D,与w.t.细胞相比,每种产生的稳定细胞系的全细胞溶解产物的代表性免疫印迹(左)和凝集素印迹(右),n=3。E,通过血细胞计数器计数用台盼蓝排除确定的活细胞浓度,n=3。F,通过流式细胞测量,在t=0小时诱导表达之后粘蛋白-270细胞的GFP信号,n=3,每样品>15,000个细胞。G,琼脂糖凝胶,其显示粘蛋白-270基因的聚合酶链式反应(PCR)产物,其来自从未经转染的细胞(模拟)、瞬时转染的w.t.细胞(瞬时)或粘蛋白-270基因并入基因组中并在庆大霉素(gentamycin)选择之后培养2个月(2mo.)或12天(12d)的细胞中提取的DNA。星号表示粘蛋白-270PCR产物的预测分子量。#1和#2是生物学重复。显示平均值和S.D.,ns–不显著。
图14:生物聚合物涂层减少细胞聚集。粘蛋白-135和粘蛋白-270大小的遗传编码生物聚合物涂层减少悬浮细胞培养中的细胞聚集。A,w.t.和生物聚合物细胞系的代表性相位对比图像。图像是针对诱导后72小时在3.8±0.7×106个细胞/毫升浓度下生长的细胞。B,例如图3A所示的相位对比图像中各种簇大小的细胞分率的定量,3个生物重复样品,2个技术重复样品,每样品分析3个图像,样品(在材料和方法部分进一步论述所谓重复)。中心线显示中值;框界限指示如由R软件确定的第25和第75百分位;须线从第25和第75百分位延伸1.5倍四分位距,离群值由点表示;十字表示样品平均值。C,例如图3A所示的相位对比图像的各种大小的簇中的细胞分率的定量。显示平均值和S.D.。D,针对从例如图3A所示的相位对比图像获取的细胞分布计算的里普利氏K函数(Ripleys K function)与距离。显示平均值和S.E.M.,图3B中描述重复。ns–不显著;*p<0.05;**p<0.01;***p<0.005。
图15:粘蛋白-270减少高钙培养基中的聚集。粘蛋白-270细胞系在高度聚集条件下优于商业抗结块溶液。A,在含2mM CaCl2(+Ca2+)的培养基中生长的粘蛋白-270和w.t.培养物的图像。粘蛋白-270表达显著减少细胞聚集,即使与市售抗结块试剂(+抗结块剂)相比也是如此。B,悬浮液中w.t.或表达粘蛋白-270的细胞的浓度的定量,用于以下条件的对照培养物,不处理(空)、添加商业抗结块试剂(+抗结块剂)、添加2mM CaCl2(+Ca2+)或具有抗结块试剂和2mM CaCl2两者(+抗结块剂+Ca2+)。统计比较是针对每种细胞系的空条件。显示平均值和S.D.,n=3。ns–不显著;*p<0.05;**p<0.01;***p<0.005。
图16:生物聚合物涂布增强对剪切应力的抗性。稳定并入的生物聚合物的表达保护细胞免于剪切应力。A,剪切细胞的实验设定的示意性图示。简单来说,在1kg重力恒定施加力下流动通过500μm特氟龙(Teflon)管剪切细胞,随后通过流式细胞用活/死细胞染色剂分析细胞。B,对于w.t.和生物聚合物细胞系,剪切细胞后死细胞分率的定量,显示平均值和S.E.M.,每个群测量>50,000个细胞,n=6。ns–不显著;*p<0.05;**p<0.01;***p<0.005。
图17:生物聚合物涂布的细胞可被转染。通过用细胞质红色荧光蛋白(RFP)转染来确定生物聚合物涂布的细胞系的转染。A,用细胞质RFP瞬时转染的w.t.和生物聚合物涂布的细胞的细胞数目的定量。每实验将经转染的细胞的计数相对于转染的w.t.细胞的计数归一化,以考虑重复转染之间的可变转染效率。针对每个群测量>50,000个细胞,n=3。B,代表性流式细胞直方图,其显示经转染的细胞群中的表达分布。以约零为中心的灰色线左侧的峰表示每种细胞系的未经转染的群,其通过未经转染的w.t.细胞(w.t.-空)的重叠直方图进一步验证。C,来自B的阳性转染的细胞的RFP的几何平均值的定量。显示平均值和S.D.,ns–不显著;*p<0.05;**p<0.01;***p<0.005。
图18:粘蛋白-270细胞产生相当水平的重组蛋白表达。分泌重组RFP的定量,其来自用分泌的RFP瞬时转染的w.t.或表达粘蛋白-270的培养物的培养基上清液,n=3。显示平均值和S.D.,ns–不显著;*p<0.05;**p<0.01;***p<0.005。
图19:24小时之前获取的伴随图14的额外数据。A,例如图3A所示的相位对比图像的各种簇大小中的细胞分率的定量。对于所有图,细胞在3.2±0.7×106个细胞/毫升下生长48小时。中心线显示中值;框界限指示如由R软件确定的第25和第75百分位;须线从第25和第75百分位延伸1.5倍四分位距,离群值由点表示;十字表示样品平均值。B,例如图3A中所示的相位对比图像的各种大小的簇中的细胞分率的定量。显示平均值和S.D.。C,针对例如图3A所示的相位对比图像获取的细胞分布计算的里普利氏K函数与距离。显示平均值和S.E.M.,图3B中描述重复,n=3。ns–不显著;*p<0.05;**p<0.01;***p<0.005。
第III部分附图
图20:同义润滑素(SynLubricin)的设计和合成。A)合成的、密码子加扰粘蛋白的设计和产生策略的概览。所需蛋白质产物的DNA序列通过全局优化进行优化,以通过密码子加扰最小化重复DNA序列,接着进行第二优化,其重新分配在宿主细胞系统中不常使用的密码子。B)SynLubricin由侧接天然人PRG4的N和C端的59个KEPAPTTP(SEQ ID NO:1)的完美重复构建。IgK信号序列和SumoStar标签与SynLubricin融合以便分泌和纯化。SynLubricin还保留天然蛋白质的两个生长调节素B结构域(SMB 1和2)和两个血红素结合蛋白结构域。C)编码人PRG4同工型A(PRG4A)和SynLubricin的串联重复的核苷酸的重复评分计算值。D)人PRG4和SynLubricin的氨基酸序列的比对。比对中的PRG4A序列是SEQ ID NO:66的氨基酸347-853。比对中的SynLub序列是SEQ ID NO:68的氨基酸347-818。E)载体图,其示出四环素诱导型启动子、关注的cDNA的多克隆位点(MCS)、双顺反子GFP报告子(IRES2 CopGFP)和rtTA-M2四环素反式激活子和新霉素抗性基因的第二表达盒。
图21:分离产生高水平SynLubricin的稳定多克隆细胞群的分选策略。A)分离表达高水平SynLubricin的稳定细胞群的策略。B)显示未分选和两次分选(2×)细胞群中相对SynLubricin产生的293-F培养基上清液的蛋白质印迹;1和2表示来自两个独立实验的样品;用抗PRG4(MABT401)和SUMO抗体探测。C)B中抗PRG4蛋白质印迹的信号相对强度的定量。D)表达SynLubricin的未分选和两次分选的293-F细胞的相位对比和荧光显微照片。
图22:整合的SynLubricin cDNA在细胞基因组中稳定。连续培养2个月的野生型和稳定整合的293-F细胞的基因组DNA提取物中SynLubricin编码区的PCR扩增。作为阳性对照,显示SynLubricin质粒和来自SynLubricin瞬时转染的293-F细胞(瞬时)的DNA提取物的PCR扩增。全长SynLubricin的预期大小由星号指示。
图23:SynLubricin产生的优化。A)蛋白质印迹,其显示在不存在或存在组蛋白脱乙酰基酶抑制剂丙戊酸(VPA;3.5mM)的情况下,用1μg/mL多西环素诱导指定天数的对照细胞和分选的293-F细胞的培养基中随时间推移的SynLubricin的相对产生。B)A所示印迹的信号相对强度的定量。C)第0天在具有或不具有3.5mM VPA的情况下,用1μg/mL多西环素诱导的分选的293-F细胞中葡萄糖消耗的时间过程。显示平均值和S.D.,n=3。D)蛋白质印迹,其显示从非产生对照细胞(模拟)、用SynLubricin cDNA瞬时转染的细胞(瞬时)和用1μg/mL多西环素和3.5mM VPA诱导三天的分选的293-F细胞的两个连续1-L分批培养物(1号批次和2号批次)收集的培养基中的润滑素;加样马滑液(ESF)作为对照。E)由在第0天1μg/mL多西环素诱导之后在指定时间点收集的稳定地表达293-F细胞产生的SynLubricin的代表性蛋白质印迹。F)B中表示的蛋白质印迹重复的定量,n=3,ns–不显著。
图24:通过阴离子交换色谱纯化SynLubricin。A)Sliver染色和B)蛋白质印迹显示在广泛范围的NaCl浓度(浓度在泳道上方以mM为单位指示)内从Q
Figure BDA0003263651390000091
树脂连续洗脱的SynLubrcin。C)Sliver染色和D)蛋白质印迹,其显示收集的SynLubricin培养基上清液(M)、10倍稀释的SynLubricin培养基上清液(S)、野生型293-F条件培养基(C)、通过流量(FT-1×)、10倍浓缩的通过流量(FT-10×)以及指定盐浓度(在泳道上方以mM为单位显示)下的洗脱级分。
图25:软骨外植体的润滑显示SynLubricin的功能。浸泡在生理盐水(PBS)、牛滑液或SynLubricin中的NaCl提取的软骨外植体的摩擦系数。在润滑分析之前,用DEAE琼脂糖纯化SynLubricin,在无洗涤的情况下或在严格的500mM NaCl洗涤后洗脱。显示平均值和S.D.,指示独立测量。***p<0.001,****p<0.0001;NA:统计检验由于样本大小而不可适用。
图26:SynLubricin的瞬时表达改变贴壁细胞形态。A)模拟转染或经双顺反子SynLubricin IRES copGFP的cDNA转染的293-T细胞的形态。所示图像为相位对比和荧光显微照片的合并重叠图。注意在表达高水平copGFP报告子的细胞附近的细胞-细胞粘附的抑制。B)用针对PRG4串联重复的MABT401抗体探测的马滑液(ESF)和来自经模拟转染和经SynLubricin转染的细胞的培养基上清液的蛋白质印迹。
图27:新的基于转座子的基因递送载体的验证。流式细胞结果显示mCherry2和copGFP报告子的水平的相关性。
图28:图28上显示的序列是PDTRPAPGSTAPPAHGVTSA(未修饰的Muc1重复)(SEQ IDNO:8)。Muc1的密码子加扰策略的应用。A)具有密码子加扰串联重复的SynMuc1的示意图。B)编码人Muc1和SynMuc1的串联重复的核苷酸的重复评分计算值。C)用Muc1抗体探测的用SynMuc1 cDNA转染的293-F细胞(+cDNA)或未经转染的细胞(M)的培养基上清液、His亲和纯化的Ni-NTA树脂通过流量(FT)以及洗脱的蛋白质(洗脱液)的蛋白质印迹。D)C的PNA-凝集素印迹。E)C的蛋白质印迹,用SUMO抗体探测。
图29:SynLubricin对固定化金属亲和力色谱(IMAC)树脂具有低亲和力。A)培养基上清液以及来自Fe3+和Ni2+负载硝基三乙酸(NTA)树脂的IMAC纯化通过流量、洗液和洗脱级分的蛋白质印迹。洗脱在指定NaCl浓度下进行。未观察到唾液酸与多价Fe3+的非特异性结合。B)来自非负载NTA树脂的通过流量、洗液和洗脱级分的蛋白质印迹。
图30:显示SynLubricin体内滞留的图像。图像描绘第0天(注射)、2周和7周时定位的SynLubricin。图显示约40天的时段内两只大鼠的半衰期。对于图,将人SynLubricin注射到成年雄性SD大鼠(Sprague-Dawley rat)(n=2)的左膝中的清除动力学。纯化人SynLubricin用磺基-Cy7.5近红外荧光染料荧光标记,并且将20μL SynLubricin-Cy7.5通过髌腱入路注射到健康左膝中。来自左膝的总润滑素荧光在IVIS Spectrum全动物成像系统上成像、定量,并且报告为总辐射效率。将数据拟合到二指数衰减模型以计算α和β衰减常数。半衰期报告为ln(2)除以β衰减常数。
图31:显示从人SynLubricin释放的O-聚糖的MALDI-MS谱和计算相对百分比的图和图表。
图32:在生理盐水(PBS)或指定浓度下的SynLubricin中浸泡的NaCl提取的软骨外植体的摩擦系数。对于这些实验,通过阳离子交换色谱从293-F培养基上清液纯化SynLubricin。
第IV部分附图
图33:糖萼聚合物诱导膜突出。(A)示意图和表,其示出在整个此工作中构建并使用的遗传编码的生物聚合物。基因文库编码天然和合成粘蛋白,其包含中央多肽核心、与丝氨酸(S)和苏氨酸(T)残基连接的糖侧链以及跨膜锚。(B)上皮细胞中膜管密度的定量,显示与野生型(对照)细胞相比,粘蛋白聚合物诱导剧烈管状化。对于每种条件,分析的细胞数目在x轴上显示。此处和别处框凹槽指示95%置信区间。(C)扫描电子显微法(SEM)图像,其显示表达指定生物聚合物的细胞的膜形态。(D)(左)不同长度的Muc1 GFP-ΔCT聚合物的草图,如由串联重复(TR)的数目所指示。(右)流式细胞数据,其显示使用GFP结合纳米抗体得到的指定粘蛋白的相似细胞表面表达水平,n=3,每群>40,000个细胞。(E)(D)中所描述的细胞的代表性SEM图像。(F)(左)具有膜锚定的低密度足糖萼蛋白(Podocalyxin,Podxl)、低密度人血清白蛋白(HSA)(低HSA)或高密度HSA(高HSA)的巨大单层囊泡(GUV)上相对蛋白质表面密度的定量,n=10-20。所有GUV用10摩尔%Ni-NTA-脂质配制以用于蛋白质锚定。(中)具有或不具有管的GUV的分率的定量;n为针对每种蛋白质分析的GUV的数目。(右)GUV的代表性共聚焦图像。***p<0.001(事后学生双尾t检验)。
图34:组织滑膜细胞的膜形态由糖萼调节。(A)切除的马滑膜组织的实验工作流程。(B)表达初代滑膜细胞的透明质酸合酶3(HAS3)的代表性SEM图像,其显示在透明质酸酶(HyA)处理30分钟以消化透明质酸(HA)之后,膜小管的回缩。(C)定量显示小管密度取决于HA的存在。(D)新切除的滑膜组织的图像,其显示代表性滑膜细胞的细胞核(DAPI)、表面锚定HA(透明质酸结合蛋白,HABP)和组织胶原蛋白(二次谐波产生,SHG)。沿z轴的深度根据颜色条编码。注意从滑膜组织表面突出的富含HA的膜延伸部。右下图显示观察到的组织滑膜细胞的草图表示。(E)新切除的马滑膜组织中,滑膜细胞上的膜小管通过SEM可见。滑膜细胞头以橙色假着色,从滑膜组织突出。消化HA的HyA处理引起滑膜细胞小管的快速回缩(右)。***p<0.001(事后学生双尾t检验)。
图35:糖萼的聚合物刷模型和优选膜形状的产生。(A)膜弯曲的聚合物模型,其示出由细胞糖萼诱导的模拟自发膜曲率。低密度聚合物非相互作用,并且在“蘑菇”体系中采取紧密结构。在“刷”体系中,聚合物重叠(聚合物之间的平均距离D小于回转半径RG的两倍)并且延伸以避开彼此,增加聚合物刷的高度(H)。熵压力是由聚合物蘑菇和刷产生膜曲率的基础。(B)Muc1构建体,其具有侧接聚合物结构域的SUMO和GFP标签以便用膨胀显微法(ExM)对聚合物延伸进行可视化。聚合物延伸与聚合物荧光强度是一种表面密度的比例量度,显示指定的缩放关系。点、方形和三角形指示来自三个样品的测量结果。红线显示通过所有数据点的线性回归。(C)由Muc1聚合物蘑菇和聚合物刷产生的自发曲率的理论预测。蓝色:预计的蘑菇体系(蘑菇);粉色:预计的刷体系(刷)。此处计算模型考虑具有15nm长度(库恩长度(Kuhn length))的单体区段的270nm长度的粘蛋白。这些参数基于天然Muc1-42TR的实验表征,并被选定用于与以下实验进行比较。(D)(左)对于半径=250nm的泡,作为粘蛋白浓度的函数的所需压力(Pa)的理论预测。插图显示接近蘑菇-刷转变的压力最小值。(右)为了维持膜小管,作为粘蛋白浓度的函数的所需点力(pN)的理论预测。
图36:优选膜形状取决于细胞表面生物聚合物浓度。(A)使用荧光激活细胞分选(FACS)将细胞分选到具有不同水平的细胞表面粘蛋白(Muc1-42TR-GFPΔCT)的群中的策略。(B)代表性SEM图像,其显示具有指定粘蛋白表面密度的分选细胞群的膜形态特征转变。选择粘蛋白密度以匹配理论图上的指定点(图3D)。(C)蘑菇体系中测量的泡结构和刷体系中测量的管结构的平均半径。(D)具有指定平均粘蛋白表面密度的分选细胞群上观察到的膜泡密度。在蘑菇体系与刷体系之间(*)或在最低刷体系密度与所有其它刷粘蛋白密度之间(+)确定显著性。(E)具有指定平均粘蛋白表面密度的分选细胞群上观察到的膜管密度。符号如(D)中定义。(F)来自(图3D,右)的预测力倒数与来自(E)的观察到的管密度展现线性关系,且皮尔森相关系数(Pearson correlation coefficient)为0.97。测量的数目在箱线图的x轴上显示。误差线指示95%置信区间。ns–不显著;*/+p<0.05;**/++p<0.01;***/+++p<0.001(事后学生双尾t检验)。
图37:糖萼介导的膜不稳定性和细胞外囊泡生体合成。(A)表达Muc1-42TRΔCT的上皮细胞的代表性共聚焦显微图像,粘蛋白以PNA(花生凝集素染色)、肌动蛋白以鬼笔环肽染色,n=3。(B)来自(A)的荧光强度线迹线(PNA图像,红线)。值相对于鬼笔环肽和PNA染色各自的最大强度归一化。(C)在用DMSO(媒剂)或用10μM拉春库林(Latrunculin)-A(+LatA)处理以干扰肌动蛋白组装之后,表达Muc1-42TRΔCT的细胞中小管的平均直径。(D)媒剂处理或LatA处理的表达Muc1-42TRΔCT的细胞中小管的代表性SEM图像。(E)(左)模拟模型的示意草图,其中肌动蛋白核心抵抗由糖萼刷驱动的自发膜曲率。在肌动蛋白解聚后,膜小管去稳定并且预测松弛为(右)代表最小能量表面的各种珠化结构和/或细管。这些预测的示意图与表达Muc1-42TRΔCT的细胞的代表性假着色SEM图像一起显示。(F)模拟机制的示意草图,其中珠化和囊泡状膜不稳定性(左)被破坏并且导致微囊泡脱落(右)。(G)代表性直方图,其显示野生型(对照)和表达Muc1-42TRΔCT的细胞的细胞外囊泡的平均浓度和大小分布,并且(H)显示用DMSO(媒剂)或拉春库林A(+LatA)处理的Muc1-42TRΔCT细胞。对于每个图,粒子浓度相对于最大峰归一化。阴影区域显示95%置信区间,n分别=5、5、4、7。(I)从表达Muc1-42TRΔCT的细胞收集的囊泡的代表性低温透射电子显微(低温TEM)图像。红色框指示右侧显示的假着色关注区。***p<0.001(事后双尾学生t检验)。
图38.遗传编码的粘蛋白的验证。(A)中的序列自上而下为PDTRPAPGSTAPPAHGVTSA(SEQ ID NO:8)和PPASTSAPG(SEQ ID NO:4)。(A)遗传编码的糖蛋白的草图表示。粘蛋白-1(Muc1)含有PDTRPAPGSTAPPAHGVTSA(SEQ ID NO:8)的42个重复,并且足糖萼蛋白(富S/T)具有用于O-糖基化的富丝氨酸和苏氨酸区。工程化糖蛋白缺乏天然细胞质尾区信号传导结构域(ΔCT),同时保留天然跨膜结构域(TM)或与合成的21个氨基酸的跨膜锚(TM21)交换。合理设计的粘蛋白(合理GFP-ΔCT)含有PPASTSAPG(SEQ ID NO:4)的80个重复,其融合到荧光标记(GFP)以及天然茎和TM,不具有天然细胞质尾区信号传导结构域(ΔCT)。(B)代表性共聚焦显微图像,其显示与野生型(对照)细胞相比,由各种工程化糖蛋白诱导的膜管状化。细胞表面用凝集素WGA(麦胚凝集素)可视化。用凝集素PNA(花生凝集素)进行粘蛋白染色证实糖蛋白O-糖基化和MCF10A细胞上的表面定位,n=3。(C)在0.5或1h处理之后,Alexa Fluor488标记的转铁蛋白(488TNF)的内吞作用的定量。用流式细胞进行定量,报告的中值信号减除背景,每群>10,000个细胞,n=6,误差线为S.D.。(D)在处理0.5h之后,内吞的488TNF的代表性共聚焦显微图像。(E)蛋白质印迹,其显示上皮细胞中表达的聚合物大小,以针对绿色荧光蛋白(GFP)标签的抗体分析,n=2。(F)指定粘蛋白大小的管密度的定量。对于每种条件,分析的细胞数目在x轴上显示。框凹槽指示95%置信区间。统计比较是针对42TR。ns–不显著,*p<0.05,**p<0.01,***p<0.001(事后学生双尾t检验)。
图39:透明质酸定位于细胞表面且诱导细胞表面突出。(A)(左)由跨膜蛋白透明质酸合酶3(HAS3)挤出的透明质酸(HA)的草图。(右)野生型(对照)和表达透明质酸合酶3(HAS3)的人乳腺上皮细胞(MEC,MCF10A)的溶解产物中HA的印迹。应注意,表达的HA是MDa范围内的巨大线性聚合物。(B)由MEC分泌到其培养基中的HA的ELISA定量,相对于样品中的细胞数目和对照细胞的HA分泌归一化,n=3。(C)野生型(对照)或稳定表达HAS3的人MEC的代表性共聚焦显微图像。细胞用Hoescht(细胞核)和Alexa Fluor 568透明质酸结合蛋白(HABP)染色。(D)代表性SEM图像,其显示表达HAS3的人MEC中高度拉长的膜小管(左)和同一细胞上的放大区(右)。**p<0.01(事后学生双尾t检验)。
图40:粘蛋白引起模型脂质膜的管状化。(A)用氟硼荧(Bodipy)-PC标记的DOPC巨大单层囊泡(GUV)的代表性共聚焦图像,Ni-NTA脂质的分率不断增加。重组Alexa Fluor568标记的足糖萼蛋白(Podxl)通过多组氨酸标签与GUV缔合。每个BODIPY-PC图像中的比例尺为5μm。(B)(左)在不同Ni-NTA脂质水平下,GUV上的Alexa Fluor 568标记的人血清白蛋白(HSA)或Podxl的荧光强度(相对表面密度)的定量,n=10-20。使用与粘蛋白表面密度相似的HSA表面密度(低HSA)和高几倍的HSA表面密度(高HSA)来控制蛋白质拥挤效应。(右)对于每种重组蛋白-低HSA、高HSA和Podxl,在不同Ni-NTA脂质水平下的具有管的GUV分率的定量,误差线为标准差,在1-3个实验中n=20-90个GUV。(C)具有高HSA形成小管的GUV的AlexaFluor568-HSA的代表性共聚焦图像。
图41:粘蛋白个体与粘蛋白集合的物理表征的支持信息。(A)与10×组氨酸标签融合的重组Muc1 42串联重复(Muc1-42TR)聚合物的草图表示。(B)重组Muc1-42TR的产生(培养基+Muc1-42TR 10×His)、Ni-NTA树脂结合的蛋白质(通过流量)、非特异性蛋白的洗液(洗液)以及纯化的重组Muc1-42TR聚合物(洗脱液)的蛋白质印迹验证。用抗Muc1和抗His抗体以及结合O-连接聚糖的PNA(花生凝集素)探测样品。(C)B中所描述的样品的SYPRO Ruby蛋白质凝胶染色。(D)对于指定相对粘蛋白表面密度,上皮微绒毛直径的定量。框凹槽指示95%置信区间。(E)(左)粘蛋白构建体(Muc1-42TR),其具有侧接聚合物结构域的SUMO和GFP标签,以便用膨胀显微法(ExM)对聚合物延伸进行可视化。(右)ExM样品工作流程。首先,对样品进行染色和固定。然后,将蛋白质化学连接(锚定)到单体,单体聚合形成凝胶。然后消化蛋白质,并且凝胶膨胀至原始大小的四倍。ns–不显著。
图42:由糖萼中的分子间相互作用产生曲率的额外聚合物刷理论预测。(A)在刷体系中,预测刷厚度作为生物聚合物表面密度的函数的图。刷厚度大致按生物聚合物浓度的幂律比例缩放。(B)显示能量贡献作为生物聚合物密度的函数的曲线。在蘑菇体系中,聚合物仅具有弹性能量,而在延伸的刷中,排除体积和静电相互作用有助于生物聚合物自由能。(C)描绘以生物聚合物密度和分子长度产生的自发曲率变化的曲线。(D)显示自发曲率趋势作为生物聚合物密度和库恩长度的函数的图。库恩长度等于持续长度的两倍,与聚合物抗弯刚度成正比,在本稿中称为单体区段的长度。(A-D)中的曲线呈log-log格式。(A)和(B)中的曲线使用生物聚合物长度,l=270nm,和单体区段长度,la=15nm。曲线(C)采用15nm的聚合物单体区段大小,(D)使用270nm的生物聚合物长度。(E)高密度下自发曲率对生物聚合物长度的预测依赖性。此图使用以50000数目/m2的密度堆积的la=15nm的聚合物。
图43:Muc1表面密度的荧光激活分选和定量。(A)不同Muc1表面密度下的定量实验的扩展工作流程。(B)Alexa Fluor 647标记的纳米抗体的SDS-Page校准。(C)来自纳米抗体稀释系列((B)所示)的荧光信号的积分密度的对数值与负载分子的数目的对数值之间的校准曲线。显示线性回归拟合和R2值。(D)(C)中所示的线性回归拟合的残差。(E)荧光激活细胞分选(FACS)直方图,其显示纳米抗体荧光信号和针对这些实验收集的群‘a’到‘e’。(F)以下的代表性扫描电子显微(SEM)图像:从基质非酶促分离,然后针对SEM成像再粘附的野生型细胞(分离的对照),以及从基质非酶促分离,通过FACS收集,然后再粘附的细胞(FACS对照)。这些图像表明FACS收集方法不影响在Muc1-42TRΔCT表达情况下观察到的膜形状(图2F中所示)。(G)在收集和溶解细胞之后,每个细胞群a-e中荧光纳米抗体信号的SDS-Page分析。(H)表格,其描述如(G)所示的荧光图像的积分密度信号、基于(C)中校准曲线计算出的分子数目以及基于针对每个群用FACS收集的细胞数目(E),蛋白质凝胶中负载的细胞数目(G)。(I)来自FACS的纳米抗体平均值信号的对数与针对每个群计算的分子数目之间的校准曲线。每个样品的分子数目通过负载的细胞数目和每个细胞的大致面积归一化。显示线性回归拟合和R2值。(J)(I)所示线性回归拟合的残差。
图44:管状膜形状含有丝状肌动蛋白核心并且类似微绒毛。(A)表达Muc1-42TRΔCT的上皮细胞的代表性共聚焦显微图像,其显示用抗微管和Alexa Fluor 568标记的二抗的间接微管染色。粘蛋白用Alexa Fluor 647PNA(花生凝集素)标记。底部行显示来自合成图像的关注区域(黄色框),n=3。(B)来自(A)的荧光强度线迹线(底部行,黄线)。值针对其各自的最大强度归一化。(C)表达Muc1-42TRΔCT的上皮细胞的代表性共聚焦显微图像,其显示用Alexa Fluor 568鬼笔环肽染色的肌动蛋白。粘蛋白用Alexa Fluor 647PNA标记。底部行显示来自合成图像的关注区域(黄色框),n=3。此数据在(图5A、B)重复并详述。(D)来自(C)的荧光强度线迹线(底部行,黄线)。值针对其各自的最大强度归一化。(E)已用10μM拉春库林-A(LatA)处理1h的野生型(对照)或Muc1-42TRΔCT细胞的中平面的代表性共聚焦显微图像,n=3。(F)LatA处理的Muc1-42TRΔCT细胞的代表性SEM图像。
具体实施方式
除非有相反的规定,否则本说明书通篇中给出的每个最大数值限制包括每个数值下限,如同此类数值下限在本文中明确写出一样。本说明书通篇中给出的每个最小数值限制将包括每个数值上限,如同此类数值上限在本文中明确写出一样。本说明书通篇中给出的每个数值范围将包括落在此类较宽数值范围内的每个较窄数值范围,如同此类较窄数值范围在本文中全部明确写出一样。
本公开包括本文所描述的每个氨基酸序列,以及编码氨基酸序列的每个多核苷酸序列,包括但不限于cDNA序列和mRNA序列。还包括互补序列和反向互补序列。本公开涵盖包含此类核苷酸序列的表达载体。
本公开大体上涉及改良的糖蛋白、包含蛋白质用于不同应用的组合物以及制备和使用糖蛋白的方法。在实施方案中,糖蛋白为粘蛋白和/或润滑素。
本公开包括表达本文所描述的蛋白质的细胞和细胞培养物。在某些实施方案中,本公开包括细胞培养物,其经改良以便由于细胞的结块、聚集等减少而产生多种蛋白质中的任一者。
在实施方案中,用于表达本公开的蛋白质的细胞为真核细胞。在某些实施方案中,细胞为真核细胞,包括但不限于昆虫和哺乳动物细胞。在实施方案中,哺乳动物细胞不是中国仓鼠卵巢(CHO)细胞,不过在某些情况下可使用CHO细胞。在实施方案中,细胞为哺乳动物上皮细胞。在实施方案中,细胞为人细胞,因此相比非人哺乳动物细胞更适于产生例如人生物制剂。在实施方案中,细胞为人293细胞。在实施方案中,293细胞衍生自293细胞并且稳定表达SV40大T抗原。在实施方案中,细胞为适于在悬浮培养中生长的人293细胞。在实施方案中,细胞为人293-F细胞,其可从多个供应商处商购。
在某些方法,如治疗方法中,本公开包括修饰异源细胞或获自个体的细胞,以表达本文所描述的一种或多种糖蛋白。因此,在实施方案中,可修饰人或非人细胞以例如纠正粘蛋白或粘蛋白样蛋白或其产生过程中的缺陷。在实施方案中,根据本公开修饰的细胞为全能、多能(pluripotent)、寡能干细胞或多潜能(multipotent)干细胞。在实施方案中,细胞为造血细胞。在实施方案中,细胞为软骨细胞。在实施方案中,细胞为间充质干细胞或骨髓基质细胞。在实施方案中,细胞为滑膜细胞。在实施方案中,细胞为软骨形成前体细胞。在实施方案中,细胞内源性产生软骨特异性基因产物,如II型胶原蛋白和/或软骨特异性硫酸软骨素蛋白聚糖(CSPG)。在实施方案中,细胞为上皮细胞或其前体,或为杯状细胞。在实施方案中,细胞为免疫细胞,并且包括但不一定限于T细胞,如CD4+和CD8+T细胞,以及树突状细胞。细胞可根据任何已建立的技术进行修饰,包括但不限于使用病毒表达载体,或通过染色体编辑,如通过任何合适的基于CRISPR的基因编辑方法。修饰的细胞可向有需要的个体施用。在实施方案中,转基因非人动物已被创建以表达本公开的一种或多种修饰的蛋白质,可以产生所述动物并使用其来研究广泛范围的生物功能、病症和病状。
在实施方案中,本文所描述的任何糖蛋白可存在于融合蛋白中。融合蛋白重组产生并且在单一连续多肽中含有不同蛋白质的区段。在实施方案中,本文所描述的融合蛋白包含糖蛋白或其区段,以及不受特别限制的第二蛋白或区段。在实施方案中,第二蛋白产生可检测信号,并且因此包括例如荧光蛋白。
在某些实施方案中,本公开的组合物和方法涉及重组产生的蛋白质,其具有重复氨基酸序列,如串联重复序列。在实施方案中,串联重复序列相对于其天然存在的序列经修饰,并且相对于天然存在的蛋白质中的重复数,其重复数可能已改变。不同重复的组合可包括于本文所描述的多肽中。
在实施方案中,本公开包含将编码本文所描述的一种或多种蛋白质的本文所描述的表达载体(其可为密码子优化的表达载体)引入到合适细胞/细胞培养物中,允许蛋白质表达,并从细胞回收蛋白质。在实施方案中,使用任何合适的表达载体修饰细胞培养物中的细胞以表达至少本文所描述的蛋白质。
表达载体可整合到细胞的染色体中,或可作为表观遗传元件永久或短暂维持。表达载体可配置成以组成性或诱导性方式表达蛋白质。在一个非限制性实施方案中,可使用基于转座子的表达载体,或可使用慢病毒表达系统。在一个非限制性实施方案中,可排除慢病毒系统作为表达本文所描述的蛋白质的工具。在实施方案中,本文所描述的任何蛋白质可包括或可不包括信号序列。在实施方案中,多核苷酸(如编码本文所描述的一种或多种蛋白质的cDNA)随机整合到一个或多个染色体中以产生修饰的细胞。在实施方案中,使用cDNA向基因组中的随机转座。
在实施方案中,密码子优化的表达载体包含阈值数目的改变的密码子,其中改变的密码子不改变特定密码子所编码的氨基酸。因此,优化的密码子可含有例如摆动碱基的变化。在实施方案中,至少一个密码子改变,从一个密码子到编码特定蛋白质中每个氨基酸的所有密码子可以改变。在实施方案中,密码子优化的cDNA降低cDNA序列重复性以提高DNA处理期间核苷酸序列的稳定性,包括但不一定限于复制、转录、逆转录以及对重复核苷酸序列进行的其它核苷酸处理操作期间的滑动,其通常导致cDNA和mRNA的缺失或扩增。在实施方案中,在相关细胞类型中使用频率低于预定阈值的密码子用具有高使用频率的密码子替换。举例来说,在一个实施方案中,可替换在人细胞中具有小于或等于10%使用频率的密码子。
在实施方案中,粘蛋白/润滑素蛋白或需要改良产生的蛋白质可使用任何合适的方法修饰以便回收,包括但不限于包括一种或多种纯化标签,包括但不限于His标签。在一个实施方案中,His标签为n个组氨酸残基的线性序列,其中n典型地为6-10。His标签通过特异性结合镍或钴离子实现纯化,所述镍或钴离子可例如连接到基质,如任何合适的珠子。His标签或任何其它合适的纯化标签可置于蛋白质的N端、蛋白质的C端或蛋白质内部。在实施方案中,FLAG标签或FLAG八肽或FLAG表位可包括于本公开的蛋白质中。合适的FLAG序列是所属领域中已知的。在实施方案中,可包括小泛素相关修饰物(SUMO)标签,如His-SUMO标签。在实施方案中,可包括蛋白酶裂解位点,如用于蛋白质鉴别、分离、纯化等。可将蛋白质纯化到任何所需纯度程度。
在非限制性实施方案中,包括于本公开的蛋白质中的串联重复包含以下氨基酸区段的任何一个或任何组合:KEPAPTTP(SEQ ID NO:1)、KEPAPTP(SEQ ID NO:9)和KEPAPTTTP(SEQ ID NO:10),或其组合。
在实施方案中,本公开的蛋白质中包括2-120个重复。在非限制性实施方案中,包括10、21、40、42、59或80个重复。重复序列可在多肽内完全连续。在实施方案中,本文所描述的任何氨基酸序列可为更长串联重复的区段,并且因此可在其N或C端具有额外氨基酸序列。在实施方案中,本文所描述的串联重复的氨基酸序列包含7-80个氨基酸或由其组成。在实施方案中,本文所描述的串联重复展现大约135nm或270nm的预计长度。在实施方案中,重复为完美重复,意味着相同序列在蛋白质中重复,这不同于天然存在的某些串联重复。
在实施方案中,本公开包括实施例的第I-IV部分中公开的所有cDNA和氨基酸序列,以及如本文所描述的其变异体。不时地,此类代表性序列为方便起见称为“生物砖”。在非限制性实施方案中,本公开提供多肽(如糖蛋白)和编码糖蛋白的密码子优化的表达载体,本文中描述其为SynMuc1和SynLubricin、Syn1_40、Syn1_80、Syn2_40、Syn2_80、Syn3_40,以及如下文进一步描述的供与非人哺乳动物一起使用的其它构建体。
包括包含与这些序列的氨基酸序列具有至少90%同一性的氨基酸序列的多肽。在实施方案中,蛋白质包含相对于内源性蛋白质的突变。“内源性”蛋白质是通常由未修饰的基因编码的蛋白质。同样地,内源性基因或其它多核苷酸包含未如通过重组、基因编辑或其它方法修饰的DNA序列。如下文进一步描述,突变可包括氨基酸插入、缺失和改变,并且还可包括相对于内源性序列的额外重复序列,或更少重复序列。
在实施方案中,串联重复氨基酸序列在糖蛋白的N端、C端、或N端和C端两者处引入其中。在一个示例性实施方案中,通过融合人润滑素或来自非人哺乳动物的润滑素的天然N和C端与KEPAPTTP(SEQ ID NO:1)、KEPAPTP(SEQ ID NO:9)和KEPAPTTTP(SEQ ID NO:10)的重复,产生润滑素样分子。在实施方案中,非人哺乳动物为犬科或马科或猫科动物。下文进一步描述并入修饰的润滑素中的来自马科动物和犬科动物的润滑素的代表性氨基酸序列。在实施方案中,包括10-120个重复。在实施方案中,包括59个重复。在实施方案中,重复序列或其它序列可通过序列,或通过接头序列,如一个到三个氨基酸彼此分离。
在实施方案中,提供重组润滑素多肽,其中下文所描述的连续重复序列位于N端氨基酸序列与C端氨基酸区段之间,所述N端氨基酸序列和C端氨基酸区段与人、犬或马序列具有至少90%序列同一性。因此,本公开包括包含侧接序列的所描述的串联重复。侧接序列可包含人润滑素N端和C端衍生的氨基酸序列;犬润滑素N端和C端衍生的氨基酸序列;或马润滑素N端和C端衍生的氨基酸序列。
在一个非限制性实施方案中,其中连续重复序列位于N端人润滑素衍生的序列与C端人润滑素衍生的氨基酸序列之间,所述N端人润滑素衍生的序列与以下人润滑素序列具有至少90%序列同一性:
QDLSSCAGRCGEGYSRDATCNCDYNCQHYMECCPDFKRVCTAELSCKGRCFESFERGRECDCDAQCKKYDKCCPDYESFCAEVHNPTSPPSSKKAPPPSGASQTIKSTTKRSPKPPNKKKTKKVIESEEITEEHSVSENQESSSSSSSSSSSSTIRKIKSSKNSAANRELQKKLKVKDNKKNRTKKKPTPKPPVVDEAGSGLDNGDFKVTTPDTSTTQHNKVSTSPKITTAKPINPRPSLPPNSDTSKETSLTVNKETTVETKETTTTNKQTSTDGKEKTTSAKETQSIEKTSAKDLAPTSKVLAKPTPKAETTTKGPALTTP(SEQ ID NO:75)
所述C端人润滑素衍生的氨基酸序列与以下人润滑素序列具有至少90%序列同一性:
SEVSTPTTTKEPTTIHKSPDESTPELSAEPTPKALENSPKEPGVPTTKTPAATKPEMTTTAKDKTTERDLRTTPETTTAAPKMTKETATTTEKTTESKITATTTQVTSTTTQDTTPFKITTLKTTTLAPKVTTTKKTITTTEIMNKPEETAKPKDRATNSKATTPKPQKPTKAPKKPTSTKKPKTMPRVRKPKTTPTPRKMTSTMPELNPTSRIAEAMLQTTTRPNQTPNSKLVEVNPKSEDAGGAEGETPHMLLRPHVFMPEVTPDMDYLPRVPNQGIIINPMLSDETNICNGKPVDGLTTLRNGTLVAFRGHYFWMLSPFSPPSPARRITEVWGIPSPIDTVFTRCNCEGKTFFFKDSQYWRFTNDIKDAGYPKPIFKGFGGLTGQIVAALSTAKYKNWPESVYFFKRGGSIQQYIYKQEPVQKCPGRRPALNYPVYGETTQVRRRRFERAIGPSQTHTIRIQYSPARLAYQDKGVLHNEVKVSILWRGLPNVVTSAISLPNIRKPDGYDYYAFSKDQYYNIDVPSRTARAITTRSGQTLSKVWYNCP(SEQ ID NO:76)
在实施方案中,非人动物中侧接连续重复的润滑素序列可包括氨基酸变化,在非限制性实施方案中,所述氨基酸变化为相对于天然序列在以下序列的N或C端的3-7个氨基酸的变化。
在一个实施方案中,连续重复序列位于N端犬源润滑素序列与C端犬润滑素衍生的氨基酸序列之间,所述N端犬源润滑素序列与以下序列具有至少90%序列同一性。QDLPSCAGRCGEGYSRDAICNCDYNCQHYMECCPDFKKACTVELSCKGRCFESFARGRECDCDSDCKKYGKCCPDYEDFCGRVHNPTSPPSSKTAPPSPGASQTIKSTAKRSPKAPNKKKTKKVIESEEITEEHSVSENQESSSSSSSSSSTIRKIKSSKNSAANKELKKKPKVKDNKKERTPKKKPPPEPPVVDEAGSGLDNGDIKLTPTPDIPTTQRNKVTTSPKFTTGKPINPKPSLPPNTDTSKETSSTPNKETTVKSKETLANKETSSKAKEKITSAKETRSAEKTPAKDFVPTTKAPVKSTPKAESTTKGPALTTP(SEQ ID NO:77)(其中例如七个C端氨基酸可改变自天然犬序列,其为SPAPTTP(SEQ ID NO:83));
所述C端犬润滑素衍生的氨基酸序列与以下犬润滑素序列具有至少90%序列同一性:
SEVTTTAKDKTTEKDIIPEITTAVPKITTQETATPTEETTTESKTSTTTQVTSTTSSKNTPKATTLAPKVMTATQKTTTTEETMNKPEETTAVPKDTATSTKVSTPRPRKPTKAPKKPASTKKPNTIPKRKKPKTTPTPPKMTTSTMPKLHPTSSVEAMLQTTTSPNQRPNSEIVEVNPNEDTDAAGKKPHMFPRPPVLTPIFIPGTDILVRGSNQDIAINPMLSDETNLCNGKPVDGLTTLRNGTMVAFRGHYFWMLSPSKPPSPPRKITEVWGIPSPIDTVFTRCNCEGKTFFFKGSQYWRFTNDIKDAGYPKQIVKGFGGLNGRIVAALSIAKYKDRPESVYFFKRGGSVQQYTYKQEPIKKCTGRRPAINYPVYGETTQVRRRRFERAIGPSQTHTIRIHYSPIRVSYQDKGFLHNEVKMSSQWRGFPNVVTSAIALPNIRKPDGYDYYAFSRNQYYNIDVPSRTARVVTTRFGRTLSNIWYNC(SEQ ID NO:78)(其中例如三个N端氨基酸相对于相应犬序列改变,其为PEM)。
在实施方案中,连续重复序列位于N端马源润滑素序列与C端马润滑素衍生的氨基酸序列之间,所述N端马源润滑素序列与以下马润滑素序列具有至少90%序列同一性:QDLSSCAGRCGEGYSRDATCNCDFNCQYYMECCPDFKKVCTSELSCKGRCFESFERGRECDCDADCKKYGKCCSDYESFCEEVHNPTSPPSSKTAPPPPGASQTIKSTAKRSPKSNKKKTKKVIESEEIIEEHSVSENQESSSSSSSSSSTIRKVKSSKNSAANRELKKKPKVKDSKKKRTPKKKPTPEPPVIDEAGSGLDNGDFMLIPTPKIPTTQRNKVTTSPKITTVKPINPKPSLPPNSDTSKETTSTPNKETTVETKETEITNKETSTSANEKTTSARKSTEKTSDKDFAPASEVPAKSTPKAETTTKGPALTTP(SEQ ID NO:79),(其中例如七个C端氨基酸可不同于天然马序列,其为SPSLTT(SEQ ID NO:84));
所述C端马润滑素衍生的氨基酸序列与以下马润滑素序列具有至少90%序列同一性:
SEVSTTTTTMKPPTTPKNLAESTPEFPAEPTPKALENSPKEPAVPTTKAPEVTKPEVTTTAKDKVTGKDIHTIPEITTAAPKITTETATTTEEKTTESKVTSTIMQVTSTTEDTTTSSKITPKATTLAPKVMTATKTTTTQETINKLEETTAIPKDTATHSKVTTPKPKKPTKAPRKPTSTKKPKTPRKRKPKTTPIPPKITTPTTPKSNPTTLAEAMLQTTTSPNQTPNSAMIEVNPKNEDADAAEGEKPLVILRPHVLTPIVIPGPDFLVRGPNLGIGINPMLSDETNLCNGKPVDGLTTLRNGTLVAFRGHYFWMLRPFSPPSPPRRITEVWGIPSPIDTVFTRCNCEGKTFFFKDSQYWRFTNDIKDAGYPKLISKGFGGLSGKIVAALSIATYKNRPESVYFFKRGGRIQQYIYKQEPIRKCPGRRPAIHYSVYGEAPQIRRRRFERAIGPSQTHTIRIHYSPVRVSYQDKVPSTDFLHNEVKVSTLWRGLPDTVTSAISLPNLRKPDGYDYYAFSKDQYYNIDVPSRTARAITTRSGQTLSKVWYNCP(SEQ ID NO:80)(其中例如三个N端氨基酸可不同于天然马序列,其为SEA)。
在实施方案中,本文所描述的重组产生的蛋白质包含具有本文所描述的串联重复序列中的任一者或组合的串联重复的变异体,其中变异体包含此类序列的修饰。包括编码变异体的表达载体。在实施方案中,修饰包含氨基酸区段,其与本文明确描述的连续氨基酸和多核苷酸序列具有90.0-99.9%之间的氨基酸同一性,包括端点,并且包括到第一个小数点的其间的所有数字范围。在实施方案中,本公开的重组产生的蛋白质包含的串联重复在其全长上与本文所描述的氨基酸序列具有90、95、97、98、99或99.5%氨基酸序列同一性。重组蛋白是由引入到细胞中的多核苷酸表达的蛋白质,在引入所述多核苷酸之前,所述细胞不包含所述蛋白质的编码序列。这同样适用于重组cDNA序列。
如所属领域中已知,为了确定两个核苷酸或氨基酸序列的同一性百分比,出于最优比较目的比对序列(例如可引入空位)。然后对相应核苷酸或氨基酸位置的核苷酸或氨基酸进行比较。当第一序列中的位置被与在第二序列中的相应位置相同的氨基酸或核苷酸占据时,则这些分子在所述位置处是相同的。两个序列之间的同一性百分比是序列共有的相同位置的数目的函数(即,同一性%=相同位置的数目/位置总数×100)。
在某些实施方案中,本文所描述的串联重复变异体包含1、2、3、4或5个氨基酸的变化。在实施方案中,可缺失、添加或改变氨基酸。在实施方案中,改变的氨基酸为丝氨酸、苏氨酸,或丝氨酸与苏氨酸残基的组合被改变。在实施方案中,约1-50%的丝氨酸和/或苏氨酸残基被改变。在实施方案中,天然蛋白质序列中存在的丝氨酸或苏氨酸残基改变为丙氨酸,或改变为另一氨基酸。在实施方案中,本公开的蛋白质包含较少或不包含天然物(未修饰和/或内源性蛋白质)中存在的氨基酸。在实施方案中,天然蛋白质包含天冬酰胺、天冬氨酸、甘氨酸、异亮氨酸、亮氨酸和/或丝氨酸中的一者或任意组合,其可从本公开的代表性蛋白质重组工程化而得到。
在实施方案中,引入到本公开蛋白质中的氨基酸改变引起改变的糖基化模式。因此,在实施方案中,本公开提供具有可控糖基化模式的重组蛋白的产生。在实施方案中,本公开的蛋白质上存在的O-连接的寡糖的数目经修饰。在实施方案中,糖基化模式相对于对照,如相应糖基化位点未改变的蛋白质发生改变。在实施方案中,改变蛋白质和或表达蛋白质的细胞的一种或多种特性。在实施方案中,在例如本公开的糖蛋白中改变寡糖相对于蛋白质/氨基酸的化学计量。在实施方案中,本公开的蛋白质包含不同于合适对照的糖苷残基的重量百分比。在实施方案中,本公开的蛋白质展现润滑参数,如动摩擦系数。在实施方案中,摩擦系数可使用任何合适方法确定,如对软骨进行软骨摩擦测试。在实施方案中,本公开的蛋白质展现不同于合适对照的润滑参数。
在实施方案中,如本文所描述的重组产生的蛋白质包含相对于对照,核心1O-聚糖结构、Galβ1-3GalNac和/或Galβ1-3GalNAc的核心1衍生物的量,和/或其中末端取代的唾液酸的量的变化,或GalNAc(N-乙酰基半乳糖胺)单糖糖基化的变化。在实施方案中,本文所描述的蛋白质可包含核心2O-聚糖、GlcNAcβ1-6(Galβ1-3)GalNAc和/或GlcNAcβ1-6(Galβ1-3)GalNAc的核心2衍生物,其包含所有核心1、核心2、核心3、核心4、核心5、核心6、核心7和核心8O-聚糖结构的至少5%。在实施方案中,此类蛋白质由如本文进一步描述培养的人细胞产生。
在实施方案中,本公开的蛋白质可呈单体、二聚体、多聚体及其组合形式。在实施方案中,相对于合适对照,单体/二聚体比率、比例和/或浓度经改变。
在实施方案中,本文所描述的蛋白质区段可由任何合适的连接氨基酸分离。在实施方案中,接头可包含1-20个氨基酸,包括端点,并且包括其间的所有整数和整数范围。一般来说,接头包含甘氨酸、丝氨酸或丝氨酸和甘氨酸。在实施方案中,连接氨基酸不插入串联重复。在实施方案中,提供糖基化突变体的分泌形式。
在实施方案中,修饰的润滑素缺乏细胞质结构域和跨膜结构域中的一者或两者。在实施方案中,本公开的润滑素包含分泌信号,如用于产生修饰的蛋白质。许多合适的分泌信号的氨基酸序列是所属领域中已知的并且可用于此实施方案中。在一个实施方案中,人分泌序列包含MAWKTLPIYLLLLLSVFVIQQVSS(SEQ ID NO:72)或由其组成。在一个实施方案中,犬分泌信号包含MQWKILPIYLLLLSVFLIQQVS(SEQ ID NO:73)或由其组成。在一个实施方案中,马分泌信号包含MEWKILPIYLLLLLSIFSIQEVSS(SEQ ID NO:74)或由其组成,或如本文进一步描述的另一序列,包括对N和C端氨基酸的改变。在实施方案中,天然分泌信号被免疫球蛋白的区段替换,例如来自人或小鼠或另一哺乳动物的IgGκ轻链序列。在实施方案中,分泌序列包含来自以下中的任一者的分泌序列:IL-2、CD33、人IgG2 H、糜蛋白酶原、胰蛋白酶原、长腹水蚤荧光素酶(Gaussia luc)、流感血凝素、人胰岛素或蚕丝蛋白。
在实施方案中,本公开的多肽可具有一个或多个修饰的氨基酸,其例如与另一部分缀合。在实施方案中,本公开的多肽与至少一个叠氮基缀合,使得其可容易地与其它部分缀合,如使用点击化学,如通过用叠氮化物修饰O-聚糖。在实施方案中,本公开的多肽为环化或钉合(stapled)的。
在实施方案中,本文所描述的串联重复序列并入到任何糖蛋白中。在实施方案中,糖蛋白为任何粘蛋白或润滑素蛋白。在实施方案中,糖蛋白为蛋白聚糖4,在所属领域中也称为润滑素,其包含在人中由PRG4基因编码的蛋白质。在非限制性中,本公开提供称为SynMuc1的修饰的粘蛋白,如下文进一步描述。在另一非限制性实施方案中,提供修饰的润滑素作为SynLubricin,如下文进一步描述。
在一个实施方案中,使用本文修饰的细胞增加蛋白质产生,其中细胞存在于细胞培养容器中,包括但不限于任何细胞培养皿和生物反应器。在实施方案中,在生物反应器中使用根据本公开的修饰的细胞以产生任何所需蛋白质或其组合。在非限制性实施方案中,生物反应器包含悬浮细胞生物反应器。在实施方案中,生物反应器的容积为1-25,000升,包括端点,并且包括其间的所有数字和数字范围。
在实施方案中,提供cDNA文库。在实施方案中,本公开包含提供如本文所描述的cDNA文库,和选择所描述的cDNA中的一者或组合,或通过将cDNA和/或编码cDNA的表达载体引入到细胞中来修饰细胞。选择可基于细胞的预期或实际用途,如用于基于任何特定蛋白质和细胞表达系统的蛋白质产生。还包括编码蛋白质的试剂盒。
在实施方案中,本文所描述的一种或多种蛋白质可与其它试剂组合,如可生物降解聚合物、纳米粒子、果胶、海藻酸盐、聚(丙烯酸)的交联衍生物、聚乙烯醇、聚乙烯吡咯烷酮、多糖、羟丙基甲基纤维素、羧甲基纤维素、凝集素、流变改性剂、增塑剂、软骨素、葡糖胺和/或任何透明质酸。
对于预防和/或治疗例如抗粘附剂可具有益处的疾病的用途,本文所描述的组合物可以根据已知技术通过与标准药学上可接受的载体混合而制备的常规剂型施用。药学上可接受的载体的一些实例可见于:《雷明顿:医药科学和实践(Remington:The Science andPractice of Pharmacy)》(2005)第21版,宾夕法尼亚州费城(Philadelphia,PA).利平科特威廉姆斯和维尔金斯出版社(Lippincott Williams&Wilkins),其公开内容以引用的方式并入本文中。在实施方案中,包含本文所描述的蛋白质的药物和其它组合物可以液体、片剂、粉末、喷雾剂、软膏、水凝胶和气雾剂形式提供。
在实施方案中,包含本公开的一种或多种蛋白质的药物组合物可使用任何合适的途径施用于个体,包括但不一定限于局部、口服和肠胃外,并且如下文进一步描述。举例来说,蛋白质可如下施用:静脉内、通过直接注射到滑膜关节或其它滑膜结构(腱鞘或滑囊)中、腹膜内、通过直接注射到心包囊中、通过直接注射到胸膜腔中、真皮下、皮下或通过直接施加到皮肤、粘膜或眼。
在实施方案中,本公开包括施用有效量的本文所描述的一种或多种多肽和/或包含此类多肽的组合物。有效量可根据以下而不同:药物配制方法,施用方法,患者的年龄、体重、性别,施用时间、施用途径和所属领域的技术人员将显而易见的其它因素。组合物可施用一次,或在一系列施用中施用。在实施方案中,本公开包括单次剂量或数次剂量。在非限制性实例中,对于预防和/或治疗接合或类似结构的用途,多肽的合适浓度在250μg/mL到2mg/mL的范围内,包括端点,并且包括其间的所有数字范围,以及所有毫克、微克范围。在实施方案中,大约1到3mL用于哺乳动物关节应用。可在个体基础上调节给药频率。鉴于本公开的出人意料的半衰期多肽,合适的给药频率为每3-6周一次。
在实施方案中,本公开包含用于治疗哺乳动物的眼部疾病、病症或病状的方法、组合物和装置。在实施方案中,如本文所描述的细胞产生的蛋白质用于使用所属领域的普通技术人员已知的任何方法或装置治疗眼疾病或病状。在实施方案中,包含蛋白质的组合物用于前房内、玻璃体内、结膜下、特农氏囊下(sub-Tenon’s)、视网膜下或局部施加到角膜表面。可使用所属领域的技术人员熟知的技术将蛋白质直接递送到眼(例如:局部滴眼剂或软膏;盲管(cul-de-sac)中或植入巩膜附近或眼内的缓释装置)。进一步考虑本文所描述的蛋白质可被配制在眼内插入或植入装置中。
在实施方案中,包含本文所描述的一种或多种蛋白质的药物用于治疗眼病症,其包含一种或多种视网膜疾病或损伤,包括年龄相关性黄斑变性(AMD)、视网膜色素变性(RP)和糖尿病性视网膜病变(DR)。在一个实施方案中,个体患有干性、萎缩性(非渗出性)年龄相关性黄斑变性,定义为与视网膜色素上皮变化相关的(包括萎缩和玻璃膜疣)进行性年龄相关黄斑变性,其为成人视力丧失的常见原因,针对其的疗法有限。在实施方案中,病症包含一种或多种角膜疾病或损伤。在实施方案中,个体患有青光眼,其可包括原发性、继发性和/或先天性青光眼。
在实施方案中,本公开的蛋白质可以滴眼剂的形式提供。在实施方案中,滴眼剂包含以下中的任何一者或多者:类固醇、抗组胺剂、拟交感神经药、β受体阻断剂、拟副交感神经剂、副交感神经药、前列腺素、非甾体抗炎药(NSAID)、抗生素、抗真菌剂或局部麻醉剂。在某些实施方案中,滴眼剂用于任何干眼病状。在实施方案中,滴眼剂用于润滑眼,包括但不一定针对隐形眼镜佩戴者。在实施方案中,提供组合物作为润滑滴眼剂。在实施方案中,润滑滴眼剂包含人工泪液。在实施方案中,滴眼剂可不含药品,并且因此仅充当润滑/泪液替代组合物。在其它实施方案中,滴眼剂可用于治疗眼部过敏反应,并且因此还可包含抗组胺剂和/或血管收缩剂。在实施方案中,滴眼剂制剂包含250μg/mL到2mg/mL,包括端点,并且包括其间的所有数字范围,以及所有毫克、微克范围。此类浓度可以典型滴眼剂体积使用,如1-2滴/眼,大约0.05到0.01mL/眼。
在实施方案中,包含本文所描述的蛋白质的组合物可与隐形眼镜结合使用。在实施方案中,蛋白质用于隐形眼镜护理液。因此,本文所描述的蛋白质可与任何合适的隐形眼镜护理液组分混合,所述组分包括但不一定限于生理盐水、温和磨料、表面活性剂、抗真菌剂和抗细菌剂,其包括但不限于常规微生物剂,或过氧化氢或硼酸,以及防腐剂,如抗坏血酸或依地酸二钠。在包含本文所描述的一种或多种蛋白质的溶液中提供的隐形眼镜包括在本公开的范围内。
在实施方案中,包含本文所描述的蛋白质的组合物可针对粘膜内衬。粘膜内衬包括例如上和下呼吸道、眼、口腔、鼻、直肠、阴道、泌尿生殖道、牙周袋、肠和结肠。在某些实施方案中,组合物可用于口腔吸入。在实施方案中,口腔吸入包含鼻应用,并且因此可包括鼻喷雾剂、滴鼻剂和鼻软膏。在实施方案中,口腔吸入可包含支气管喷雾剂和吸入剂。在实施方案中,蛋白质可用于通过使用喉糖锭、口香糖、漱口水或漱口剂、栓剂或棉条接近粘膜。
在实施方案中,包含本文所描述的蛋白质的组合物用作手术抗粘连剂(腹膜内润滑剂,用以润滑内脏并且防止腹内外科手术/操控期间的术后肠和内脏粘连;胸膜内润滑剂,用以润滑肺并且防止胸腔内外科手术/操控期间的术后胸膜粘连;心包内润滑剂,用以润滑心脏表面并且防止心脏外科手术/操控期间的术后心包粘连)。作为任何关节镜、腱镜或滑囊镜手术后的术后滑液替换,以维持润滑并防止粘连或关节翳形成。在实施方案中,组合物用于治疗本文所描述的任何哺乳动物的关节败血症/感染。在某些实施方案中,组合物可与伤口愈合、伤口感染治疗和全身性败血症治疗结合使用。
在实施方案中,本文所描述的包含修饰的润滑素的组合物所针对的非人哺乳动物需要本文所描述的病症中的任一者或组合。此外,马科动物可能需要治疗马科动物尤其易患的病症中的一者或组合。在一个非限制性实施方案中,马科动物需要治疗剥脱性骨软骨炎(OCD)。可扩展到犬科动物和猫科动物的其它常见马科动物实施方案包括治疗关节内骨折、骨软骨碎裂、半月板损伤、软骨损伤、滑膜炎、关节败血症和创伤后骨关节炎(PTOA)。其它实施方案包括治疗肌腱和韧带损伤,包括但不限于:浅趾屈肌和深趾屈肌腱炎/肌腱病、悬韧带韧带炎/韧带病、腱鞘炎和舟骨滑囊炎。马眼科实施方案包括:角膜溃疡、后弹性层膨出和真菌性角膜炎/角膜病变。在非限制性实施方案中,犬科动物需要治疗颅(cranial)十字韧带断裂(RCCL)(类似于人的前(anterior)十字韧带损伤)、肘关节发育不良、髋关节发育不良、肌腱炎/韧带炎和眼科应用,包括干性角膜结膜炎(KCS)、免疫介导的角膜病变和无痛性溃疡。
在实施方案中,出于治疗或预防目的,可向人和非人动物施用包含修饰的蛋白质(如修饰的润滑素)的组合物。在实施方案中,向犬科动物、猫科动物或马科动物施用修饰的润滑素以预防在体育竞赛中或在动物工作期间易于出现的损伤或限制其严重程度。举例来说,可向马科动物施用组合物以预防或限制在马术比赛期间,或在工作期间,如在警察工作或放牧中的关节/软骨损伤。典型马术比赛包括牛仔竞技表演、盛装舞步、场地障碍赛、马背体操、马球、赛马以及所属领域的技术人员将显而易见的许多其它比赛,其中关节和相关损伤的风险高。此外,认为本公开的组合物将适用于治疗多种其它非人哺乳动物,如在兽医医院和诊所、动物急救设施和动物园中。在实施方案中,本公开的组合物用于预防及和/或治疗禽类动物。
在实施方案中,制品可涂布和/或浸渍有包含本文所描述的蛋白质中的任一者的组合物。在实施方案中,制品涂布在任何多孔或非多孔的表面上。在实施方案中,物品包括医疗装置,包括但不一定限于手术装置、牙齿或矫形外科装置、缝合线、导管、插管装置、麻醉递送设备、敷料、绷带等。在实施方案中,本文所描述的蛋白质用于涂布细胞培养装置,包括但不一定限于细胞培养板、多孔板、生物反应器和任何其它表面,其中抗粘附特性是理想的。
在另一方面,本公开包括补充剂产品,如保健食品产品、膳食补充剂、食品成分等,补充剂产品可以例如液体、胶囊、片剂、软胶囊、粉末等形式提供。
在实施方案中,包含本文所描述的一种或多种蛋白质的药物和/或保健食品产品提供于容器中,如可为无菌的任何合适的封闭或可密封容器。在实施方案中,产品包含印刷材料。印刷材料可以产品插页、标签形式或以包装组件形式提供。印刷材料提供指示,包含多肽的组合物将用于治疗如本文所描述的任何疾病、病症或病状,或出于任何目的用于产生抗粘附作用。在一个实施方案中,本文所描述的多肽用作治疗关节病状的补充剂,关节病状包括但不一定限于关节疼痛,关节炎(包括但不一定限于骨关节炎、类风湿性关节炎),关节、半月板或软骨损伤,如运动损伤,或与关节/韧带修复手术结合。因此,出于改善个体健康或幸福的目的施用本文所描述的组合物包括在本公开内。在实施方案中,本公开的组合物可直接注射到关节和/或滑液中。在实施方案中,组合物直接或间接施用到任何滑膜结构,包括但不限于滑膜关节和腱鞘或滑囊。在实施方案中,本公开的组合物还可用于在肌腱、韧带或滑囊损伤、创伤或感染后直接注射到肌腱、腱鞘、韧带或滑囊中。在实施方案中,组合物可与间皮表面接触:例如施用组合物以使其在腹部或心包接触表面,以便预防和或治疗与一个或多个此类表面相关的病症。
通过参考以下非限制性实施例可更好地理解本公开,所述实施例作为本公开的示例提供,分成四个部分。呈现以下实施例以便更充分说明本公开的实施方案,然而其决不应解释为限制本公开的广泛范围。本公开的参考列表不指示任何特定引用的参考文献对于专利性是重要的。
实施例
第I部分
本公开的此第I部分提供具有可控制糖基化模式的序列特异性粘蛋白的非限制性和代表性的实施例,以及其数据和讨论。
特定来说,此第I部分涉及以下理解,即在本公开之前,存在很少的编码具有可调糖基化模式的定制粘蛋白糖蛋白的设计准则。因此,第I部分提供以下的可交换DNA砖的文库:粘蛋白前导标签、膜锚、细胞质基序和光学报告子,以及密码子优化的天然粘蛋白重复和合成粘蛋白的新的合理设计的结构域。在超过400种可能的cDNA组合中,此第I部分提供超过50种粘蛋白的文库,每种粘蛋白具有独特化学、结构和光学特性。应用文库以开发设计和工程化粘蛋白的一般准则,所述准则形成本公开的一部分。出人意料地,发现不成熟α-GalNAc Tn抗原向核心1和核心2聚糖结构的延伸强烈依赖于沿粘蛋白骨架的O-糖基化位点的频率。根据本公开,对于所属领域的技术人员显而易见的是,易于通过粘蛋白细胞质尾区上的再循环基序调节聚糖结构的唾液酸化。还证明了粘蛋白多肽骨架的总长度可对糖基化具有不可预料的影响。不希望受任何特定理论束缚,预期此处呈现的粘蛋白部分清单以及用于制造新粘蛋白的所描述的设计准则可广泛应用于糖萼研究和基于粘蛋白的生物技术。
第I部分引言
细胞表面粘蛋白是由具有高密度糖侧链的非结构化多肽骨架定义的膜锚定生物聚合物家族(1)。虽然细胞表面粘蛋白在历史上被视为保护细胞表面并且抵抗病理细胞沉积的简单结构分子(2),但目前认识到其在调节细胞生命方面具有更复杂的作用。在细胞糖萼中,粘蛋白集合呈现生物活性聚糖表位,其介导细胞之间及细胞与其外部世界的粘附和通讯。举例来说,粘蛋白唾液酸可通过连接自然杀伤细胞和微环境中的其它细胞类型上的SIGLEC受体来调节免疫细胞功能(3)。粘蛋白还可物理上调节受体激活和信号传导反应的时空动力学(4)。提出糖萼中粘蛋白的密集拥挤控制细胞表面上受体的扩散和激活,并且具有控制可溶性因子从微环境到细胞表面的通过的筛分效应(5)。
粘蛋白的关键特征是其分子架构可通过调节沿多肽骨架附接的聚糖侧链的类型和频率动态改变。举例来说,提出聚糖的电荷、大小和排列控制粘蛋白骨架的延伸和刚性(6,7)。糖基化通常随细胞状态转变(包括分化和转化)而显著改变(8,9)。因此,粘蛋白的化学和物理特征两者与细胞状态紧密相关,促成粘蛋白可在细胞粘附、通讯和信号传导中发挥的不同调节作用。然而,精确骨架序列和糖基化模式如何促成个别粘蛋白的功能和糖萼中粘蛋白的集体行为在很大程度上未解决。
在发展此类理解方面取得进展的主要障碍之一是缺乏用于精确编辑粘蛋白分子结构的工具。靶向糖基转移酶的遗传方法可高效改变粘蛋白糖基化(10),但这些方法典型地影响广泛类别的糖蛋白,使得任何观察到的对细胞行为的影响难以或不可能精确定点到特定粘蛋白。为了克服遗传方法的局限性,已开发具有质膜锚的生物模拟粘蛋白聚合物的文库用于糖萼编辑(6,11)。虽然在阐明粘蛋白功能的一些机制细节方面很成功,但合成聚合物典型地在数小时到数天内从细胞表面清除并且必须通过培养基补充来连续补充(12,13)。因此,在较长持续时间内,尤其在体内的行为研究在很大程度上无法用合成粘蛋白模拟物达成。
在本公开之前,尚未开发将合成化学方法的重要特征(确定的骨架化学、定制的聚糖结构和精确聚糖放置)与基因组编码的能力和长期稳定性组合的粘蛋白工程化和糖萼编辑策略。定制基因合成的进展支持以空前的速度和低成本来构建cDNA序列开发。然而,定制基因合成不容易适用于高度重复的DNA序列,其正是大部分粘蛋白的特征。重复基因序列妨碍定制基因合成中的DNA片段组装,并且由于引物错配而使通过聚合酶链式反应(PCR)扩增具有挑战性(14,15)。
如此第I部分中所描述,一种解决方案是采用密码子冗余来构建具有最小密码子重复性的同义基因序列,这是已成功应用于弹性蛋白样蛋白的方法(16,17)。
在此第I部分中,我们利用密码子冗余来开发设计、遗传编码和制造用于在细胞中合成序列特异性粘蛋白的cDNA的有效策略。本发明描述的粘蛋白部分的组合文库使得能够便捷构建具有可调的大小、侧链间隔和聚糖类型的粘蛋白生物聚合物以用于糖萼编辑。
第I部分-结果
序列特异性粘蛋白的组合遗传编码文库的示意性表示
第I部分结果展现用于组合粘蛋白cDNA构建的模块化分部生物学方法。粘蛋白编码序列中的每个功能基序侧接限制位点,使得粘蛋白前导序列、串联重复、光学报告子、跨膜结构域和细胞质结构域的独特cDNA“砖”可容易地交换以构建改变功能的粘蛋白(图1a、b)。cDNA部分目录包括用于不同大小、骨架化学以及丝氨酸和苏氨酸(S/T)糖基化位点频率的粘蛋白生物聚合物的13个独特串联重复(图1d)。通过在密码子优化之后定制基因合成来制造粘蛋白聚合物结构域的cDNA(图1c)。为了优化,采用密码子冗余来发现以最小密码子重复编码所需多肽的同义基因序列。通过商业供应商提供的标准定制基因合成服务合成“密码子加扰”cDNA序列。
形成粘蛋白聚合物骨架的串联重复是由天然粘蛋白调适或新设计的(图1d)。重复PDTRPAPGSTAPPAHGVTSA(SEQ ID NO:8)和KEPAPTTP(SEQ ID NO:1)分别与天然Muc1和蛋白聚糖4(润滑素)具有相似性。基于以下设计三个重复:对粘蛋白O-糖基化位点的统计分析(PPASTSAPG)(SEQ ID NO:4)或对O-GalNAc转移效率的分析(DAATPAP(SEQ ID NO:2)和DAATPAPP)20。通过丙氨酸取代进一步修饰基础Muc1重复以产生具有改变的S/T潜在糖基化位点频率的Muc1样串联重复(Muc1_21S、D、T)。在整个文库中,粘蛋白骨架中S/T位点的百分比从10%变化到33%(图1d)。
构建和验证序列特异性粘蛋白的表面表达
我们比较了密码子加扰、同义粘蛋白cDNA与天然粘蛋白重复cDNA的表达,并且评估蛋白质产物的糖基化。我们将天然和同义Muc1串联重复的cDNA与信号/前导序列、膜锚和GFP报告子融合(图2a)。每个构建体在HEK293T中瞬时表达。我们通过凝集素印迹分析了粘蛋白的糖基化模式。印迹用花生凝集素(PNA)探测以检测核心1聚糖,用长柔毛野豌豆(Vicia villosa)凝集素(VVA)探测以检测未延伸的Tn抗原(α-GalNAc),并且用Muc1 mAb(克隆HMPV)探测以探测MUC1串联重复肽核心(Muc1TR)21。我们还通过轻度高碘酸盐氧化以在唾液酸上产生醛,接着用羟胺-AF568探针进行苯胺催化肟连接(PAL)以在我们的印迹上标记Muc1唾液酸22。还通过蛋白质印迹探测GFP报告子以检测表达的粘蛋白。为了验证凝集素PNA和VVA的使用(图2c),我们在过表达天然Muc1的MCF10A中敲除核心1β3-T特异性分子伴侣蛋白(COSMC)以抑制初级O-连接的GalNAc的伸长23。我们在野生型和敲除细胞中比较了过表达的天然Muc1(天然_Muc1)的糖基化模式。COSMC敲除细胞中,粘蛋白的PNA反应性降低,而VVA结合显著增加,可能是由于消除了聚糖延伸(图2d)。结果证实PNA可为延伸的核心1聚糖的良好指示物,VVA可为粘蛋白上未延伸的Tn抗原的良好指示物。
天然和密码子加扰粘蛋白的蛋白质印迹分析证实密码子加扰同义Muc1重复(Muc1_42GFP)的分子量和糖基化模式与天然重复Muc1重复(天然_Muc1 GFP)相当(图2e)。粘蛋白在Muc1 TR抗体的SDS-PAGE中运行为几乎连续拖尾(smear),指示糖型的异质混合物(图2e;Muc1 TR)。在GFP印迹上,对于每种表达构建体,观察到表观分子量为大约470、210和170kDa的主导糖型(图2e;GFP)。VVA染色在上部和下部带之间的拖尾区中强烈,而PNA和唾液酸信号在拖尾顶部处460kDa带附近最强(图2e)。基于这些结果,我们推断460kDa带为完全糖基化Muc1,而拖尾代表含有未延伸的O-聚糖结构的Muc1糖型的异质混合物。还在Muc1TR印迹上观察到GFP印迹上的下部带,但在凝集素或唾液酸探针的情况下观察不到,指示这些带可能代表低糖基化全长Muc1。天然和密码子加扰Muc1两者成功地运输到细胞表面并且并入到细胞糖萼中(图2f)。
密码子加扰粘蛋白cDNA的一个优点是在一些DNA处理操作期间提高核苷酸序列的稳定性的潜能。在复制、转录、逆转录以及对重复核苷酸序列进行的其它核苷酸处理操作期间的滑动通常导致cDNA和mRNA的缺失或扩增24。我们进行了慢病毒稳定性分析,其中我们评估了在病毒递送和逆转录之后并入细胞基因组中的cDNA的保真度。在用天然、非优化Muc1cDNA病毒转导的细胞中,Muc1糖蛋白产物的分子量显著低于预期,与截短的cDNA一致。用天然Muc1 cDNA瞬时转染,或用密码子加扰Muc1 cDNA病毒修饰的细胞产生预期大小的糖蛋白(图6)。尽管慢病毒分析不是对基因组稳定性的直接测试,但结果指示至少一些类型的核苷酸处理操作过程中,非重复粘蛋白序列更为稳定。
天然粘蛋白的串联重复在人类中的数目通常具有多态性,引起粘蛋白大小在个体之间的变化25,并且已显示Muc1的短等位基因与胃癌相关26。受此自然变异的启发,并且为进一步验证我们的方法,我们设计并构建了一系列具有可变串联重复数的同义粘蛋白(×42、×21、×10、×0;图2a)。多态性cDNA在细胞表面上良好表达,并且显示大小和糖基化程度的预期差异。如基于先前报道27所预期,较大粘蛋白形成大小足以将上皮细胞从其基质移出的糖萼。
在粘蛋白聚合物骨架中用丙氨酸取代潜在糖基化位点调节O-聚糖成熟
我们接下来测试了具有改变的糖基化模式(包括聚糖延伸的差异)的粘蛋白是否可通过突变掉粘蛋白骨架中的S/T位点来编码。我们的总体策略是产生分泌的Muc1串联重复,其中在每个重复中五个潜在糖基化位点中的一者、两者或三者中用丙氨酸取代S/T(图3a、b)。我们设想然后可从细胞培养基中收集分泌型粘蛋白以用凝集素印迹和质谱进行后续聚糖分析。
具有21个重复的所需Muc1突变体的cDNA各自通过密码子加扰优化并且通过定制基因合成制造。单(Muc1_21S)、双重(Muc1_21D)和三重(Muc1_21T)糖基化突变体分别具有21、42和63个总S/T到丙氨酸取代,并且潜在糖基化频率以20%、15%和10%不同。IgK信号肽和6×-His-SUMOStar标签与野生型Muc1重复或三个突变重复的21个拷贝融合(图3a)。不包括跨膜蛋白锚,因此IgK信号肽将引导重组粘蛋白的分泌。
从HEK293细胞的培养基上清液收集分泌型粘蛋白,并且通过蛋白质和凝集素印迹对其进行分析。野生型和糖基化突变体的表观分子量显著高于未修饰肽骨架的理论分子质量(图3b、c和8)。潜在糖基化位点突变体在SDS-PAGE中迁移较快,指示其具有较少聚糖链或其聚糖较短,并且因此对其电泳迁移造成较少阻碍(图3c)。
我们发现取代S/T调节O-聚糖成熟。分泌型Muc1糖蛋白进行印迹分析并且用VVA探测Tn抗原,用PNA探测核心1聚糖,用s-WGA探测GlcNAc,即核心2、3、4和6聚糖的构建块(图3c)。我们通过沿单一共染色印迹的每个泳道记录聚糖探针的荧光强度来构建电泳图(图3d)。核心1(PNA)和含GlcNAc(s-WGA)聚糖在具有最高表观分子量的粘蛋白糖型中丰富。较低表观分子量糖型含有丰富的VVA反应性聚糖和最少核心1和含GlcNAc聚糖。逐渐丙氨酸取代明显使糖型分布朝向具有较多未延伸VVA反应性聚糖和较少延伸的核心1和含GlcNAc聚糖的粘蛋白偏移(图3d、e)。出人意料地,即使一个丝氨酸的取代(参见sMuc1S)也显著改变糖基化模式,引起较多非完全延伸糖型的产生(图3c、d)。
为了验证我们的凝集素分析并且对粘蛋白上的特定聚糖结构进行分类,我们进行质谱法以对野生型粘蛋白重复(sMuc1)和每个重复具有三个S/T丙氨酸突变的突变体(sMuc1T)上的O-聚糖进行谱分析。我们在两个样品中鉴别出类似核心1和核心2聚糖(图3f)。然而,与三重突变体(sMuc1T)相比,野生型粘蛋白(sMuc1)中的延伸聚糖的信号强得多,与我们的凝集素印迹一致。我们还将糖基化突变cDNA与跨膜锚融合以便细胞表面表达,并且观察到糖基化位点突变体中对聚糖延伸的相似抑制趋势(图9c)。为了确保粘蛋白构建体的过表达不影响糖基转移酶用于聚糖延伸的功能性,我们使用细胞O-糖组报告子/扩增(CORA),一种允许对整体细胞O-糖组进行无蛋白分析的方法28。在野生型和过表达Muc1的HEK293T细胞中检测到类似核心1和核心2聚糖结构,表明T合酶和参与粘蛋白延伸的其它糖基转移酶的活性不受粘蛋白过表达抑制(图10)。总体来说,这些数据证明细胞表面和分泌型粘蛋白两者中聚糖的延伸对沿聚合物骨架的丙氨酸取代敏感。
设计者粘蛋白结构域揭示对糖基化的序列特异性效应
我们接下来测试了是否可产生新类型的序列特异性粘蛋白以用于编辑糖萼。平行目标为进一步探究特定骨架特征,包括糖基化位点频率和脯氨酸数目对粘蛋白糖基化模式的影响。针对我们的三个设计者粘蛋白重复DAATPAP(SEQ ID NO:2)、DAATPAPP(SEQ ID NO:3)和PPASTSAPG以及KEPAPTTP(SEQ ID NO:1)(其与分泌型人蛋白聚糖4具有相似性),构建具有GFP报导子的细胞表面粘蛋白cDNA(图4a)。基于体外结果,预期三种设计者粘蛋白重复将完全糖基化20。骨架的糖基化位点(S/T)频率为12-33%不等。我们还通过PCR扩增串联重复并且与原始cDNA重新组装以将重复数目倍增至80,产生DAATPAP(SEQ ID NO:2)和DAATPAPP(SEQ ID NO:3)粘蛋白的延伸变异体。所有粘蛋白良好表达,适当运输到细胞表面,并且经O-聚糖充分修饰(图4c和图10b)。
我们通过凝集素印迹分析粘蛋白的糖基化模式。在抗GFP印迹上,对于每种粘蛋白可见多个带,揭示细胞上和内部的粘蛋白糖型的复杂分布(图4c)。如由高PNA和VVA反应性指示的高度糖基化粘蛋白典型地运行为抗GFP印迹上最高分子量带与第二高分子量带之间的拖尾(图4c、d)。这些区域在电泳图上加灰色阴影以帮助可视化(图4d)。最高分子量糖型经核心1聚糖高度修饰(图4d;参见PNA)。富含未延伸O-聚糖的糖型在表观分子量方面异质,并且在紧接核心1修饰的粘蛋白下方的拖尾中运行(图4d;比较VVA与PNA)。
然后我们评估了O-糖基化位点的频率是否可影响O-聚糖的成熟和延伸。我们通过对我们的凝集素印迹上整合的PNA和VVA信号的比率分析,对我们的合成粘蛋白中核心1与Tn抗原的相对比率进行定量(图4e)。对于具有20或40个重复的粘蛋白,我们看到与具有较高S/T含量的粘蛋白骨架中的Tn抗原相比,核心1结构显著增加。然而,对于具有较高S/T含量的骨架,糖型分布较宽,如由凝集素印迹上更明显的拖尾和电泳图上PNA和VVA峰增加的宽度所指示(图4c、d)。
我们还考虑了脯氨酸含量是否可影响粘蛋白骨架的糖基化,因为先前已有报道脯氨酸促进糖基转移酶与粘蛋白骨架的相互作用7。我们比较了DAATPAP(SEQ ID NO:2)与DAATPAPP(SEQ ID NO:3)粘蛋白的糖基化,所述粘蛋白的差异仅在于每个串联重复中的单个脯氨酸。对于每个重复有40个拷贝的粘蛋白,核心1聚糖与未延伸Tn抗原的比率在两个粘蛋白之间不显著不同(图4e)。然而,对于重复有80个拷贝的粘蛋白,在每个重复具有一个额外脯氨酸的粘蛋白中,相对核心1聚糖含量显著较低(图4f)。这些结果表明脯氨酸含量可以依赖于粘蛋白骨架的整体大小的方式影响糖基化。
通过细胞质尾区工程化调节粘蛋白糖基化
在细胞表面粘蛋白内吞作用之后,O-聚糖唾液酸化至少部分发生于核内体和反面高尔基体网络中29。尝试采用内吞作用和运输作为改变粘蛋白糖基化的潜在工具时,我们产生了具有不同内吞作用和运输信号的粘蛋白细胞质尾区的cDNA“砖”。我们注意到,Muc1细胞质结构域可发出信号通知网格蛋白介导的内吞作用,而跨膜和细胞质结构域边界处的Muc1序列CQCRRK(SEQ ID NO:11)发出信号通知Muc1再循环回到质膜30。我们采用了合成的21个氨基酸的跨膜锚(TM21),其可在无细胞质尾区的情况下31或在具有我们的文库中的两种不同细胞质尾区的情况下将粘蛋白锚定到质膜。第一细胞质尾区为引导粘蛋白再循环的简单CQC基序。第二细胞质尾区基于含有CQC基序以及额外基序YHPM和YTNP的天然Muc1细胞质尾区,以引导更高效的内吞作用32
为了测试其功能,我们将具有或不具有细胞质尾区的TM21锚与具有10个串联重复的密码子加扰Muc1(Muc1_10)融合(图5a)。将所有粘蛋白cDNA瞬时转染到HEK293T中。我们用PAL标记细胞表面上的唾液酸。在凝集素印迹上,PAL唾液酸信号在大约171kDa处最强,与强PNA信号重叠,表明PNA反应性同工型也富含唾液酸(图5b)。为了确认,我们用唾液酸酶处理细胞溶解产物,随后进行凝集素印迹分析,并且分析PNA染色图案以检测带负电唾液酸的去除导致的电泳迁移率的变化。无论细胞质尾区基序为何,唾液酸酶处理之后粘蛋白中的PNA反应性带更高并且更宽,表明所有构建体中的主要PNA反应性同工型经唾液酸化(图5c)。
为了进一步分析唾液酸化同工型,我们用PNA拉下富核心-1粘蛋白糖型,然后用朝鲜槐(Maackia amurensis)凝集素(MAA)探测,MAA优先以(α-2,3)键结合唾液酸33。出人意料地,我们未看到接近171kDa的任何MAA信号,但注意到对MAA具有反应性的超高分子量糖型(图5d顶部)。通过再循环基序促进MAA反应性、超高分子量糖型。我们发现与仅TM21锚相比,包括CQC基序引起MAA/PNA比率增加2倍,并且基于Muc1的较长细胞质尾区使MAA/PNA比率增加3倍(图5d底部)。
材料和方法
抗体和试剂
使用以下抗体:抗人MUC1(CD227)(克隆HMPV;555925,BD生物科学(BDBiosciences))、小鼠抗β-肌动蛋白(克隆C4;47778,圣克鲁兹(Santa Cruz))、鸡抗SUMO/SUMOstar(AB7002,LifeSensors)、小鼠6×His(552565,BD生物科学)、小鼠抗α-微管蛋白(克隆B-7;5286,圣克鲁兹、小鼠抗GFP(克隆4B10;2955,赛信通技术公司(Cell SignalingTechnology))、m-IgGκ结合蛋白-辣根过氧化物酶(HRP;516102,圣克鲁兹)、山羊抗小鼠IgG(Alexa FluorTM 647缀合,A-21235;Alexa FluorTM 488缀合,A-11001;Alexa FluorTM 568缀合,A-11004;赛默飞世尔(ThermoFisher))以及山羊抗鸡IgY(Alexa Fluor 488TM缀合;A-11039,赛默飞世尔)。使用的凝集素为:未缀合落花生(Arachis hypogaea)凝集素/花生凝集素(PNA;L0881,西格玛(Sigma))、生物素缀合PNA(B-1075,Vector Laboratories)、生物素缀合朝鲜槐凝集素(MAA;BA-7801,EY Lab)、荧光素标记丁二酰化麦胚凝集素(s-WGA;FL-1021S,Vector Lab)以及生物素缀合长柔毛野豌豆凝集素(VVL,VVA;B-1235,Vector Lab)。使用的荧光染料为:Alexa FluorTM 647NHS酯(A20006,英杰(Invitrogen))、Alexa FluorTM568 NHS酯(A20003,英杰)和AFDye 568羟胺。使用ExtrAvidin-过氧化物酶(E2886,西格玛)或中性亲和素蛋白(Dylight 650缀合;84607,赛默飞世尔)检测生物素化凝集素。对于四环素诱导型系统,多西环素用于诱导(204734,圣克鲁兹)。链霉亲和素
Figure BDA0003263651390000361
珠粒(3419,赛信通技术公司)用于免疫沉淀分析。细胞溶解缓冲液(9803)和
Figure BDA0003263651390000362
试剂和过氧化物(7003)来自赛信通技术公司。用于样品封闭的正常山羊血清(S-1000)来自Vector Lab。聚乙烯亚胺(PEI)(25kDa线性PEI,23966,Polysciences)用于FreeStyleTM 293-F细胞转染。
MUC1串联重复结构域的基因设计和组装
产生细胞质尾区缺失人Muc1(Muc1 dCT)和Muc1串联重复与合成膜结构域TM21的融合体(Muc1 TM21)的cDNA,并且克隆到具有嘌呤霉素抗性盒的四环素诱导型piggybac表达载体(pPB tetOn Puro)中,如先前所描述27。还使用BamHI和EcoRI限制位点将Muc1 TM21的cDNA插入到pcDNA3.1载体中。为了产生pPB Muc1 mOxGFP dCT TetOn Puro,将mOxGFP(Addgene#68070)的cDNA首先用引物扩增:5'-GGCAGCTCAGCTATGGTGTCCAAGGGCGAGGAGCTGT-3'(SEQ ID NO:12)(正向)和5'-GGCAGCTGAGCCCTTATACAGCTCGTCCATGCCGTGAGT-3'(反向)(SEQ ID NO:13)。然后将PCR产物克隆到pJET1.2中并且非定向亚克隆到pPB Muc1 dCTTetOn Puro的BlpI位点中。为了制造分泌型粘蛋白(sMuc1)的cDNA,通过定制基因合成(General Biosystems)产生含有IgK信号肽和6×-His-SUMOStar标签的合成寡核苷酸(6×His Sumostar Muc1),并克隆到具有新霉素抗性盒的四环素诱导型piggybac表达载体(pPBtetOn Neo)中。慢病毒载体pLV puro Muc1 dCT如先前报道4制造。
通过在密码子优化之后进行定制基因合成产生突变体和合理设计的粘蛋白串联重复的cDNA。所需粘蛋白重复的最小重复基因序列使用Codon Scrambler(chilkotilab.pratt.duke.edu/codon-scrambler)18发现。通过将在人类中使用频率小于10%的任何密码子交换为随机选择的具有较高使用率的同义密码子,针对人密码子偏倚调节加扰DNA序列。然后通过定制基因合成来合成所需串联重复的合成寡核苷酸(GeneralBiosystems和金斯瑞(Genscript)),克隆以代替Muc1串联重复,在pPB Muc1 mOxGFP dCTTetOn Puro中使用BamHI和Bsu36I限制位点,在pcDNA3.1 Muc1 TM21中使用BsrGI和Bsu36I限制位点,或在pPB 6×His Sumostar Muc1中使用BsrGI和Bsu36I限制位点(参见cDNA序列的支持信息)。为了产生具有42个密码子优化串联重复的Muc1dCT,pLV Muc1_42dCT构建体的慢病毒载体,使用BamHI和Bsu36I限制位点将密码子优化的重复的合成cDNA插入到pLVpuro Muc1 dCT中。通过用5'-TGGAGGAGCCTCAGGCATACTTTATTG-3'(正向)(SEQ ID NO:14)和5'-CCACCGCCGACCGAGGTGACATCCTG-3'(反向)(SEQ ID NO:15)引物进行的Q5定点诱变,来缺失pcDNA3.1 Muc1_10TM21中的串联重复,从而产生具有0个串联重复的Muc1构建体。
通过用5'-CCGAAAGTAGGAATTCGGGCCCGTTTAAACCCGC-3'(正向)(SEQ ID NO:16)和5'-CGGCACTGACATCTAGAGTACCACAACAAAGCCAGGC-3'(反向)(SEQ ID NO:17)引物进行Q5定点诱变,由pcDNA3.1 Muc1_10TM21产生具有再循环基序CQCRRK(SEQ ID NO:11)的cDNApcDNA3.1 Muc1_10TM21 CQC。将天然CT的cDNA亚克隆到pcDNA3.1 Muc1_10TM21 CQC的XbaI和EcoRI位点中。
延伸合成串联重复的PCR和Golden Gate组装
使用Golden Gate组装使pcDNA3.1中DAATPAP(SEQ ID NO:2)和DAATPAPP(SEQ IDNO:3)粘蛋白cDNA的40个串联重复大小倍增至80个重复。用于串联重复和完整粘蛋白载体的两对定制引物设计成以独特4bp突出端连接BsmbI识别位点,使得40个串联重复和完整粘蛋白表达载体的PCR产物将在Golden Gate组装反应中连接以扩增串联重复数目(表S2)。Golden Gate组装反应如先前报道47进行。
细胞系、培养和转染
MCF10A人乳腺上皮细胞和HEK293T SV40转化的人胚肾细胞从ATCC获得。将MCF10A细胞在补充有5%马血清(赛默飞世尔)、20ng/mLEGF(派普泰克(Peprotech))、10μg/ml胰岛素(西格玛)、500ng/mL氢化可的松(西格玛)以及100ng/mL霍乱毒素(西格玛)的DMEM/F12培养基(赛默飞世尔)中培养。将HEK293T细胞在补充有10%胎牛血清(赛默飞世尔)的DMEM(赛默飞世尔)中培养。将细胞维持在37℃、5%CO2和90%相对湿度(RH)下。将FreeStyleTM 293-F细胞在FreeStyleTM 293表达培养基(赛默飞世尔)中悬浮培养。将悬浮培养物在37℃、8%CO2和90%RH下维持在定轨振荡器中。如先前所报道,用表达四环素反式激活子rtTA-M2和新霉素抗性基因的稳定整合基因盒在MCF10A细胞中进行慢病毒转导48。根据标准方案用磷酸钙方法瞬时转染HEK293T细胞。如先前所描述,用PEI瞬时转染FreeStyleTM 293-F细胞49。如先前所报道,在MCF10AMuc1 dCT细胞中产生CRISPR/Cas9介导的COSMC敲除50
蛋白质印迹分析
将HEK293T细胞以55,000个细胞/cm2接种并用磷酸钙转染24-36小时,随后用细胞裂解缓冲液裂解。将MCF10A细胞以20,000个细胞/cm2接种并用0.2μg/mL多西环素诱导24小时,随后用细胞裂解缓冲液裂解。将溶解产物在NuPAGE 3-8%或7%Tris-乙酸凝胶上分离,转移到PVDF膜。在5%BSA TBST中将一抗以1:1000稀释,将荧光团缀合或生物素化凝集素稀释到2μg/mL,并且在4℃下孵育过夜。将二抗ExtrAvidin-HRP或中性亲和素-Dylight 650以1:2000或1μg/mL在5%BSATBST中稀释,室温孵育1小时。在ChemiDoc MP成像系统(伯乐(Bio-Rad))上或在
Figure BDA0003263651390000381
试剂和过氧化物中显影之后使印迹成像。用ImageJ的FIJI分布定量整合印迹强度51,52。使用单因素方差分析(one-way ANOVA)用重复测量或双尾t检验计算数据中差异的统计显著性。
细胞表面唾液酸的高碘酸盐标记
在转染36小时之后收集HEK293T细胞。将细胞用含Ca2+和Mg2+的冷DPBS洗涤,接着与1mM过碘酸钠(西格玛)的DPBS溶液一起孵育10分钟。将高碘酸盐用1mM甘油的冷DPBS溶液淬灭,并且用冷DPBS洗涤。在暗处下伴随轻缓搅拌,在无菌过滤DPBS+5%FBS pH 6.7中在10mM苯胺(西格玛)存在下,用25μM AFDye-568-羟胺(Fluoroprobes)4℃染色样品30分钟。
免疫沉淀
将HEK293T细胞以55,000个细胞/cm2接种并用磷酸钙方法转染24-36小时,随后用细胞裂解缓冲液裂解。将裂解产物与125μg/mL生物素化凝集素PNA在4℃下一起孵育,轻缓摇动过夜。遵循制造商说明书将链霉亲和素
Figure BDA0003263651390000382
珠子添加到细胞裂解产物中,将悬浮液4℃孵育3小时。将珠子用裂解缓冲液洗涤2次,然后重悬浮于4×LDS上样缓冲液中。随后通过蛋白质印迹分析重悬浮液。
HEK293T的唾液酸酶处理
转染24后小时收集HEK293T细胞,将其与产脲节杆菌(Arthrobacterureafaciens)唾液酸酶(罗氏(Roche),10mU,100μl最终体积)37℃下在唾液酸酶缓冲液53中一起孵育30分钟,随后用细胞裂解缓冲液裂解。
免疫荧光
将HEK293T细胞以45,000个细胞/cm2接种并用磷酸钙转染24小时,随后用4%多聚甲醛固定。将抗体在5%正常山羊血清的PBS溶液中以1:100稀释,4℃孵育过夜。将凝集素在5%正常山羊血清的PBS溶液中稀释到2μg/mL,室温孵育2小时。在蔡司(Zeiss)LSM倒置880共聚焦显微镜上使用40×水浸物镜(NA 1.1)使样品成像。
分泌型粘蛋白的表达、纯化
将16.25μg pPB 6×His Sumostar Muc1 DNA转染到10cm培养皿中的HEK293T细胞中48小时。将30μg pPB 6×His Sumostar Muc1 DNA转染到20mLFreeStyleTM 293-F细胞培养物中4天。收集培养基并且通过以2000rpm离心5分钟使其澄清。使澄清培养基在4℃下结合Ni-NTA琼脂糖(凯杰(Qiagen))过夜,洗涤(20mM磷酸钠pH 8.0,0.5M氯化钠(NaCl),20mM咪唑),并用咪唑(20mM磷酸钠pH 8.0,0.5M NaCl,250mM咪唑)洗脱。将洗脱的样品用艾米康(Amicon)Ultra-4离心过滤器(10kDa截止值)透滤到PBS中,然后通过使用ZebaTM纯化脱盐柱(7K MWCO)脱盐。将无盐蛋白质溶液冻干并储存在-80℃下。
分泌型粘蛋白的O-聚糖谱分析
所有试剂除非另外提及均购自西格玛。通过在100℃下加热5分钟使纯化粘蛋白(各自600μg)变性。随后在45℃下用含19mg硼氢化钠(NaBH4)的500μL 50mM氢氧化钠(NaOH)溶液处理变性蛋白18小时54。将样品冷却,用10%乙酸中和,通过Dowex H+树脂柱,并且在氮气流下冻干,去除硼酸盐。使用先前报道的方法55,使聚糖全甲基化以便通过质谱法进行结构表征。简单来说,将干燥洗脱液用二甲亚砜(DMSO)溶解,通过使用碘甲烷和NaOH-DMSO碱(通过混合DMSO与50%w/w NaOH溶液制备)甲基化。将反应用水淬灭,将反应混合物用二氯甲烷萃取并干燥。将全甲基化聚糖溶解于甲醇中,用α-二羟基苯甲酸(DHBA,20mg/mL,在50%v/v甲醇:水中)基质结晶。使用AB SCIEX TOF/TOF 5800(Applied Biosystem MDSAnalytical Technologies)质谱仪,通过MALDI-TOF/TOF-MS以正离子模式对样品中存在的聚糖进行分析。将来自样品的全甲基化聚糖通过具有HCD和CID片段化选项的ESI探针输注到Orbitrap Fusion Tribrid质谱仪上,用于进一步结构确认。通过简单母离子扫描以高分辨率获取聚糖的MS1和MS2谱,手动选择相应离子进行进一步MS/MS扫描。基于片段化模式和常见生物合成路径,手动并通过使用Glycoworkbench软件进行聚糖结构指配。
细胞O-糖组报告子/扩增(CORA)
所有化学品除非指出均购自密理博西格玛(Millipore Sigma)。溶剂为HPLC级或更高,并且在所有色谱步骤中包括0.1%(v/v)三氟乙酸。通过在摩尔过量的33%(v/v)乙酸酐的无水吡啶溶液中在65℃下加热1小时,使苯甲基2-乙酰氨基-2-脱氧-α-D-吡喃半乳糖苷(BnGalNAc)全乙酰化。将产物通过speedvac(赛默科技(Thermo Scientific)SPD1010)干燥,并且不经进一步纯化即使用。通过LC-MS确认全乙酰化(安捷伦(Agilent)1100系列LC和G1956B MS,m/z计算值:438.18,观察值:438.10[M+H]+)。
CORA如先前报道28进行。简单来说,将500,000个HEK293T细胞接种到6cm培养皿中并且如上转染。在转染之后,将培养物在补充有50μM全乙酰化BnGalNAc的完全培养基中孵育。48小时后,抽吸培养基并且通过离心去除松散细胞和碎片。然后过滤上清液(密理博艾米康Ultra 4,10kDa MWCO),通过重力色谱(沃特世(Waters)Sep-Pak C18 3cc)收集苯甲基聚糖。通过speedvac干燥洗脱液,随后进行全甲基化2。新制备DMSO中的氢氧化钠浆料,并且添加200μL到每个干燥样品中,接着添加100μL碘甲烷(ACROS)。将样品连续混合10分钟,接着通过添加600μL去离子水来中止反应。通过用200μL氯仿萃取回收全甲基化苯甲基聚糖,然后将其用800μL去离子水洗涤4次。将样品通过C18重力色谱(沃特世Sep-Pak C18 1cc)进一步纯化,并通过speedvac干燥。将干燥样品溶解于50%甲醇中,并且用10mg/mL 2,5-二氢苯甲酸的50%乙腈溶液的基质1:1(v/v)点样。使用MicroFlex MALDI-TOF-MS(布鲁克(Bruker))以正离子模式分析苯甲基聚糖。包括两个外部标准品全甲基化麦芽四糖(CaymanChemical,m/z计算值:885.43,观察值:885.65[M+Na}+)和麦芽七糖(Cayman Chemical,m/z计算值:1497.73,观察值:1497.90[M+Na}+),以确认仪器性能和校准。基于已知结构的钠加合物([M+Na}+})的预测质量指配苯甲基聚糖组合物。数据使用Mnova(MestrelabResearch)分析,用Prism8(GraphPad)准备演示。
第I部分的讨论
粘蛋白的O-糖基化决定其物理和生物化学特征,并且因此决定其生物功能。此第I部分提供遗传编码系统来编辑粘蛋白生物聚合物,并且可用作糖萼工程化的工具,以及上文所论述的其它重要效用。已知影响粘蛋白糖基化的因素包括糖基转移酶和其底物的细胞谱系1,34、多肽骨架上O-糖基化位点的频率35,36、O-糖基化位点周围的一级肽序列37-39以及糖蛋白的运输32,40,41。在此第I部分中,我们修饰了粘蛋白骨架序列和细胞质尾区中的信号和基序,以编码具有不同物理特征、骨架化学和糖基化模式的粘蛋白。
使用密码子简并来设计具有最小重复的粘蛋白cDNA,我们能够应用定制基因合成来构建13个代表性独特粘蛋白重复,其中的每一者可容易地与用于细胞表面锚定和运输控制的其它功能域组合。所有测试重复序列均制造成功,没有失败。因此,本公开包括使用所描述的设计策略来产生如本文所描述的其它构建体。通过以模块化方式将这些cDNA与其它功能cDNA“砖”组合,鉴于本公开的益处,具有修饰的结构和功能的粘蛋白可容易地用已知分子技术构建,包括Gibson组装、Golden Gate组装以及其它现代DNA组装方法。
此第I部分中的一个观察结果为O-聚糖从Tn抗原到核心1/2聚糖的延伸由沿聚合物骨架的丙氨酸取代所阻止。鉴于在膜缔合和分泌型粘蛋白两者中观察到效果,改变的内吞作用和运输可能不能解释聚糖成熟的差异。也不太可能通过粘蛋白过表达对T合酶和参与早期O-聚糖延伸的其它糖基转移酶的功能的潜在影响来解释糖基化的差异。如细胞O-糖组报告子/扩增分析所示,过表达粘蛋白和野生型HEK293T两者中观察到类似的核心1或核心2聚糖结构(图10)。
此第1部分中的O-糖基化分析部分基于凝集素印迹。使用对照来验证主要基于凝集素的分析。敲除COSMC以消除聚糖延伸引起PNA结合减少和VVA染色提高,表明这些凝集素分别对于检测核心1O-聚糖和Tn抗原的适当性(图2d)。对纯化粘蛋白的O-糖组分析还验证了基于粘蛋白上存在的聚糖结构类型的凝集素分析的结论(图3f)。
我们修饰了粘蛋白细胞质尾区以进行糖工程化。基于唾液酸酶处理之后电泳迁移率的变化,我们推断再循环基序不是粘蛋白唾液酸化所需的。然而,包括再循环基序促进与MAA凝集素反应的超高分子量粘蛋白糖型的产生。认为交换粘蛋白细胞质尾区可为至少部分工程化出现的糖型的可行策略。
表S1:粘蛋白cDNA序列的重复性分析
用Tandem Repeat Finder算法1进行天然和密码子加扰cDNA的重复分析。核苷酸序列匹配则比对评分+2,错配和插入缺失则比对评分-7,以此衡量查询序列与检测到的串联重复之间的一致性。高比对评分指示重复的高水平重复性。
Native_Muc1
索引 周期大小 拷贝数 共有大小 匹配百分比 插入缺失百分比 评分
6-2577 60 42.9 60 99 0 4982
Muc1_42
索引 周期大小 拷贝数 共有大小 匹配百分比 插入缺失百分比 评分
146-468 60 5.4 60 75 3 220
146-468 120 2.7 120 80 2 328
149-513 120 3.0 120 79 5 294
728-897 60 2.8 60 80 1 171
746-984 60 4.0 60 75 4 169
1013-1233 60 3.7 60 77 0 208
794-1200 120 3.4 120 75 4 273
1205-1347 60 2.4 59 74 8 135
1097-1530 180 2.4 180 77 2 379
1304-1521 60 3.6 59 76 2 175
1514-1714 60 3.3 60 78 0 204
1709-1965 120 2.1 120 80 1 273
1781-2067 60 4.8 60 71 5 177
1733-2067 120 2.8 120 77 1 269
2150-2406 60 4.3 60 73 3 140
2222-2439 120 1.8 120 79 2 258
表解释:
●相对于序列开头的重复的索引。
●重复的周期大小。
●与共有模式比对的拷贝数目。
●共有模式的大小(可与周期大小略微不同)。
●整体相邻拷贝之间的匹配百分比。
●整体相邻拷贝之间的插入缺失百分比。
●比对评分。
参考文献:
(1)Benson,G.《Tandem Repeats Finder:分析DNA序列的程序(Tandem RepeatsFinder:A Program to Analyze DNA Sequences)》.《核酸研究》1999,27(2),573-580.
表S2:Golden Gate组装引物。
Figure BDA0003263651390000421
Figure BDA0003263651390000431
如第I部分中所描述的cDNA“生物砖”的概述
如第I部分中所描述的cDNA“生物砖”的概述。
前导标签
1.天然FLAG
氨基酸序列:
MTPGTQSPFFLLLLLTVLTVVTGSGHASSTPGGEKETSATQRSSVPSSTEKNADYKDDDDLY(SEQ IDNO:26)
cDNA序列:
GGATCCATGACACCGGGCACCCAGTCTCCTTTCTTCCTGCTGCTGCTCCTCACAGTGCTTACAGTTGTTACAGGTTCTGGTCATGCAAGCTCTACCCCAGGTGGAGAAAAGGAGACTTCGGCTACCCAGAGAAGTTCAGTGCCCAGCTCTACTGAGAAGAATGCTGATTACAAGGATGACGACGACCTGTACA(SEQ ID NO:27)
2.His-SUMO
氨基酸序列:
METDTLLLWVLLLWVPGSTGDGHHHHHHGSLQDSEVNQEAKPEVKPEVKPETHINLKVSDGSSEIFFKIKKTTPLRRLMEAFAKRQGKEMDSLTFLYDGIEIQADQAPEDLDMEDNDIIEAHREQIGGGSGSGHASSTPGGEKETSATQRSSVPSSTEKNADYKDDDDLY(SEQ ID NO:28)
cDNA序列:
GGATCCGCCACCATGGAGACAGACACACTCCTGCTATGGGTACTGCTGCTCTGGGTTCCAGGTTCCACTGGTGACGGTCATCACCATCATCATCACGGGTCCCTGCAGGACTCAGAAGTCAATCAAGAAGCTAAGCCAGAGGTCAAGCCAGAAGTCAAGCCTGAGACTCACATCAATTTAAAGGTGTCCGATGGATCTTCAGAGATCTTCTTCAAGATCAAAAAGACCACTCCTTTAAGAAGGCTGATGGAAGCGTTCGCTAAAAGACAGGGTAAGGAAATGGACTCCTTAACGTTCTTGTACGACGGTATTGAAATTCAAGCTGATCAGGCCCCTGAAGATTTGGACATGGAGGATAACGATATTATTGAGGCTCACAGAGAACAGATTGGAGGTGGCTCCGGCTCCGGTCATGCAAGCTCTACCCCAGGTGGAGAAAAGGAGACTTCGGCTACCCAGAGAAGTTCAGTGCCCAGCTCTACTGAGAAGAATGCTGATTACAAGGATGACGACGACCTGTACA(SEQ ID NO:29)
在紧接在下方呈现的代表性聚合物骨架区段序列中,重复序列前接以下序列:LYMDMVAVSMTSSVLSSHSPGSGSSTTQGQDVTLAPATEPASGSAATWGQDVTSV(SEQ ID NO:30),相关重复序列用相关SEQ ID指定并且其重复数目在括号中用下标指定,下标指示重复数目。每个序列上方给出的字母数字名称为序列名称,而非序列本身。
聚合物骨架
1.密码子加扰Muc1×42(Muc1_42)
2.氨基酸序列:
3.LYMDMVAVSMTSSVLSSHSPGSGSSTTQGQDVTLAPATEPASGSAATWGQDVTSV[PDTRPAPGSTAPPAHGVTSA]42ASG(SEQ ID NO:30[SEQ ID NO:8]42ASG
cDNA序列:
TGTACATGGACATGGTCGCTGTGAGTATGACCAGCAGCGTACTCTCCAGCCACAGCCCCGGTTCAGGCTCCTCCACCACTCAGGGACAGGATGTCACTCTGGCCCCGGCCACGGAACCAGCTTCAGGTTCAGCTGCCACCTGGGGACAGGATGTCACCTCGGTCCCGGATACGCGACCCGCCCCAGGGTCAACAGCGCCCCCAGCCCACGGCGTTACATCTGCACCTGACACTAGACCTGCGCCAGGATCAACAGCTCCACCGGCTCACGGGGTCACCAGTGCCCCCGACACTCGACCAGCTCCGGGGTCTACCGCTCCCCCGGCTCATGGTGTCACTAGCGCGCCTGACACACGCCCGGCACCAGGGAGTACGGCCCCTCCTGCGCACGGCGTAACTTCAGCCCCAGATACTCGACCTGCTCCGGGCTCAACAGCCCCGCCTGCACATGGAGTTACATCAGCCCCTGATACTAGACCGGCTCCAGGTTCAACTGCTCCGCCAGCACATGGTGTAACGTCTGCGCCCGATACTCGCCCAGCACCTGGGTCCACAGCTCCCCCTGCGCATGGAGTAACATCAGCACCTGATACCAGACCTGCCCCGGGCAGCACTGCACCCCCAGCACATGGCGTAACATCAGCACCAGATACTCGCCCCGCTCCTGGTTCCACGGCTCCCCCCGCGCATGGCGTTACTTCAGCTCCAGATACACGGCCGGCACCCGGCAGTACGGCTCCACCCGCACATGGAGTAACGAGTGCTCCGGACACTCGGCCTGCTCCAGGAAGTACCGCACCTCCGGCCCATGGCGTGACAAGTGCTCCCGACACCAGACCAGCGCCTGGTTCAACAGCACCGCCAGCTCATGGTGTAACCTCAGCTCCCGATACTAGACCCGCGCCAGGTTCCACCGCTCCACCTGCACACGGGGTGACGAGCGCACCTGATACGCGCCCGGCACCGGGAAGCACAGCGCCTCCCGCTCACGGAGTCACTAGCGCCCCGGATACAAGACCCGCACCTGGATCTACAGCTCCTCCAGCTCACGGCGTCACGAGTGCACCCGATACACGACCGGCCCCAGGCTCTACAGCCCCACCAGCACATGGAGTCACGAGTGCACCTGATACTAGGCCCGCTCCGGGTTCCACAGCACCTCCTGCACATGGTGTTACATCCGCTCCTGATACGAGACCCGCTCCAGGCTCTACTGCCCCACCGGCACACGGCGTGACCAGTGCTCCAGATACCCGGCCAGCTCCTGGGAGTACTGCGCCTCCAGCTCATGGCGTCACTAGTGCACCTGATACAAGACCAGCCCCCGGTTCCACTGCTCCACCAGCCCATGGTGTAACAAGTGCACCGGACACAAGGCCAGCCCCTGGTAGTACTGCTCCTCCTGCTCACGGTGTTACTAGTGCTCCTGACACCAGACCTGCCCCTGGAAGTACTGCACCGCCTGCTCATGGAGTCACATCAGCTCCGGATACTCGGCCGGCTCCGGGATCAACCGCTCCTCCGGCTCATGGAGTAACCTCCGCACCGGATACTAGGCCTGCACCGGGGAGTACAGCACCACCTGCTCATGGTGTGACTAGCGCTCCTGACACTCGCCCCGCTCCCGGTAGCACTGCCCCCCCTGCACATGGGGTGACTTCAGCTCCTGATACTCGGCCTGCACCCGGAAGCACAGCCCCCCCAGCTCATGGGGTCACAAGCGCTCCAGATACTAGGCCAGCGCCGGGAAGTACAGCCCCTCCAGCGCACGGTGTAACTTCCGCGCCAGACACACGCCCTGCTCCCGGATCAACGGCACCTCCAGCACACGGTGTGACGTCCGCACCCGACACAAGACCGGCACCTGGTTCTACTGCACCTCCCGCGCACGGAGTTACTTCAGCACCAGATACAAGACCTGCTCCTGGCTCAACTGCCCCTCCGGCGCATGGTGTAACTAGTGCGCCTGATACACGCCCAGCACCGGGTAGTACGGCACCACCAGCTCATGGAGTTACGTCAGCTCCAGATACGCGCCCTGCACCAGGCAGTACAGCTCCGCCGGCCCACGGAGTAACTAGCGCACCAGATACCAGGCCAGCACCCGGTAGTACCGCGCCTCCTGCCCATGGAGTAACTTCCGCCCCCGATACCCGACCTGCACCTGGCAGTACCGCCCCTCCCGCCCACGGGGTAACCAGTGCACCAGACACGCGGCCCGCACCAGGATCTACTGCTCCCCCAGCGCATGGGGTAACTTCTGCACCAGATACGAGGCCTGCCCCAGGTAGTACAGCGCCACCTGCCCACGGTGTCACCTCCGCTCCTGATACAAGGCCTGCGCCTGGATCAACTGCACCACCGGCGCACGGGGTTACAAGTGCCCCTGACACGAGACCAGCACCAGGTTCTACGGCGCCTCCGGCACATGGAGTGACTAGTGCCCCAGACACTAGGCCGGCTCCTGGATCAACCGCACCACCCGCTCATGGAGTGACATCAGCGCCAGATACTAGACCAGCTCCCGGGTCAACTGCGCCGCCCGCCCATGGGGTTACTTCTGCTCCAGACACTCGCCCAGCCCCAGGATCAACGGCTCCTCCCGCACACGGAGTGACCTCTGCTCCTGATACCAGGCCAGCTCCAGGGTCTACAGCACCCCCTGCTCATGGGGTAACATCTGCCGCCTCAGG(SEQ ID NO:50)
4.密码子加扰Muc1×21(Muc1_21)
氨基酸序列:LYMDMVAVSMTSSVLSSHSPGSGSSTTQGQDVTLAPATEPASGSAATWGQDVTSV[PDTRPAPGSTAPPAHGVTSA]21ASG(SEQ ID NO:30)[SEQ ID NO:8]21ASG
cDNA序列:
TGTACATGGACATGGTCGCTGTGAGTATGACCAGCAGCGTACTCTCCAGCCACAGCCCCGGTTCAGGCTCCTCCACCACTCAGGGACAGGATGTCACTCTGGCCCCGGCCACGGAACCAGCTTCAGGTTCAGCTGCCACCTGGGGACAGGATGTCACCTCGGTCCCAGACACTCGGCCTGCACCGGGATCAACCGCCCCACCGGCTCATGGTGTAACTAGTGCGCCTGATACCAGACCAGCACCAGGGAGTACTGCACCTCCTGCTCATGGGGTTACTAGTGCCCCCGATACGCGACCTGCTCCTGGAAGCACAGCACCGCCGGCTCACGGCGTAACGAGTGCTCCTGACACAAGGCCCGCTCCAGGGTCAACTGCACCACCTGCACACGGAGTGACATCAGCGCCAGATACGAGACCTGCACCAGGAAGTACAGCGCCGCCAGCCCACGGAGTAACTTCAGCCCCGGACACTAGGCCAGCACCTGGTTCAACGGCGCCTCCAGCCCATGGAGTAACATCCGCTCCCGATACTCGTCCTGCTCCGGGTTCCACAGCTCCTCCCGCACATGGGGTGACTAGTGCTCCAGATACTCGCCCAGCACCCGGTAGTACCGCTCCTCCTGCACATGGCGTCACTAGTGCACCAGACACGCGTCCGGCTCCTGGGTCTACAGCTCCACCAGCTCACGGAGTTACCAGTGCACCTGACACTAGACCTGCGCCCGGTTCGACGGCTCCGCCCGCCCATGGGGTAACGTCTGCGCCGGATACACGCCCTGCACCTGGATCTACCGCACCTCCGGCCCATGGTGTCACGAGCGCACCTGATACGAGGCCTGCTCCAGGTAGTACTGCTCCCCCCGCTCATGGAGTTACTAGCGCTCCTGATACTCGACCGGCACCTGGCAGCACTGCTCCTCCAGCACATGGTGTTACATCGGCTCCAGACACACGTCCCGCGCCAGGATCGACTGCTCCACCCGCTCACGGGGTCACATCTGCACCCGATACACGGCCAGCTCCCGGTTCCACTGCCCCGCCTGCCCATGGCGTTACTTCGGCACCAGATACCCGACCCGCACCAGGCAGTACAGCACCTCCAGCGCATGGTGTGACAAGCGCCCCTGATACACGACCAGCTCCAGGCTCAACAGCACCACCAGCACACGGTGTAACCTCAGCTCCGGATACCCGTCCAGCTCCTGGTAGTACAGCCCCTCCTGCGCACGGAGTCACAAGTGCTCCCGACACAAGACCAGCCCCAGGTTCTACTGCGCCACCTGCTCACGGTGTTACCTCTGCCCCAGATACAAGACCTGCCCCTGGCTCTACGGCACCCCCGGCACATGGAGTCACTTCCGCACCGGATACTAGACCAGCGCCTGGGAGTACGGCCCCCCCAGCTCATGGCGTGACTTCTGCTGCCTCAGG(SEQID NO:51)
5.密码子加扰Muc1×10(Muc1_10)
氨基酸序列:
LYMDMVAVSMTSSVLSSHSPGSGSSTTQGQDVTLAPATEPASGSAATWGQDVTSV[PDTRPAPGSTAPPAHGVTSA]10ASG(SEQ ID NO:30)[SEQ ID NO:8]10ASG
cDNA序列:
TGTACATGGACATGGTCGCTGTGAGTATGACCAGCAGCGTACTCTCCAGCCACAGCCCCGGTTCAGGCTCCTCCACCACTCAGGGACAGGATGTCACTCTGGCCCCGGCCACGGAACCAGCTTCAGGTTCAGCTGCCACCTGGGGACAGGATGTCACCTCGGTCCCAGATACAAGACCGGCCCCAGGATCTACGGCTCCTCCGGCTCATGGAGTCACTTCTGCTCCAGACACAAGGCCCGCGCCGGGTTCTACAGCACCGCCTGCTCATGGTGTTACTAGCGCACCCGATACGAGACCTGCTCCGGGATCAACGGCACCTCCTGCCCACGGGGTAACATCTGCACCGGACACTCGCCCTGCGCCCGGTTCAACCGCTCCACCCGCACACGGAGTGACAAGCGCTCCTGACACTAGACCAGCACCAGGTTCTACAGCCCCACCAGCCCATGGAGTTACCAGTGCACCAGATACTAGGCCAGCTCCAGGTAGTACTGCACCCCCAGCTCATGGGGTTACATCAGCTCCCGACACGCGACCAGCTCCTGGAAGCACTGCCCCTCCAGCTCACGGTGTGACCTCAGCACCTGATACACGCCCTGCACCTGGCTCTACTGCTCCCCCCGCTCATGGCGTAACTAGTGCCCCGGATACTCGACCCGCCCCTGGTTCCACAGCTCCGCCAGCACATGGTGTAACAAGTGCTCCTGATACCCGACCAGCGCCTGGAAGTACCGCACCACCTGCACATGGAGTAACTTCAGCCGCCTCAGG(SEQ ID NO:52)
6.密码子加扰Muc1×0(Muc1_0)
氨基酸序列:LYMDMVAVSMTSSVLSSHSPGSGSSTTQGQDVTLAPATEPASGSAATWGQDVTSVGGGGGASG(SEQ ID NO:31)
cDNA序列:
TGTACATGGACATGGTCGCTGTGAGTATGACCAGCAGCGTACTCTCCAGCCACAGCCCCGGTTCAGGCTCCTCCACCACTCAGGGACAGGATGTCACTCTGGCCCCGGCCACGGAACCAGCTTCAGGTTCAGCTGCCACCTGGGGACAGGATGTCACCTCGGTCGGCGGTGGTGGAGGAGCCTCAGG(SEQ ID NO:99)
7.密码子加扰Muc1单糖基化突变体×21(Muc1_21S)氨基酸序列:
8.LYMDMVAVSMTSSVLSSHSPGSGSSTTQGQDVTLAPATEPASGSAATWGQDVTSV[PDTRPAPGATAPPAHGVTSA]21ASG(SEQ ID NO:30)[SEQ ID NO:5]21ASG
cDNA序列:TGTACATGGACATGGTCGCTGTGAGTATGACCAGCAGCGTACTCTCCAGCCACAGCCCCGGTTCAGGCTCCTCCACCACTCAGGGACAGGATGTCACTCTGGCCCCGGCCACGGAACCAGCTTCAGGTTCAGCTGCCACCTGGGGACAGGATGTCACCTCGGTCCCAGATACCAGACCTGCGCCTGGAGCCACAGCTCCTCCTGCCCATGGCGTCACAAGTGCCCCTGACACACGCCCAGCTCCCGGGGCTACAGCCCCACCTGCACATGGTGTTACTAGTGCACCAGACACCAGACCGGCTCCGGGAGCCACGGCACCCCCCGCTCATGGTGTCACTTCCGCACCGGATACGAGGCCAGCACCTGGGGCCACTGCGCCGCCGGCACATGGGGTGACTAGTGCGCCAGATACTCGCCCTGCTCCAGGGGCTACTGCCCCTCCAGCTCATGGCGTAACCTCAGCGCCTGATACCCGACCAGCGCCAGGTGCCACTGCACCGCCAGCCCATGGGGTCACTAGTGCTCCTGACACTAGACCTGCACCTGGAGCTACAGCACCTCCAGCGCATGGTGTGACAAGCGCCCCAGACACGAGACCAGCCCCCGGTGCCACCGCTCCTCCCGCACATGGAGTTACTAGCGCTCCGGACACAAGACCGGCACCAGGTGCGACTGCACCACCGGCTCATGGAGTAACTTCAGCACCAGATACACGGCCTGCTCCCGGCGCTACAGCTCCACCAGCACATGGCGTTACCTCCGCACCTGACACGAGGCCCGCTCCAGGAGCCACTGCTCCCCCTGCACACGGTGTTACGTCAGCTCCAGATACGCGGCCAGCTCCGGGCGCAACAGCTCCCCCGGCTCACGGTGTAACCAGTGCTCCCGACACAAGGCCTGCACCCGGAGCAACCGCACCTCCGGCCCATGGTGTAACAAGTGCACCTGATACTAGGCCCGCGCCTGGTGCTACTGCTCCACCTGCTCACGGCGTGACATCAGCCCCTGATACGAGACCTGCCCCAGGGGCAACTGCACCTCCTGCTCATGGGGTAACTAGTGCCCCCGATACAAGACCAGCACCGGGAGCGACCGCCCCCCCAGCACACGGAGTAACGAGCGCACCCGATACTCGACCTGCACCAGGAGCGACGGCTCCACCCGCTCACGGAGTCACGAGTGCTCCAGACACTCGACCTGCTCCTGGCGCGACAGCACCACCAGCTCACGGGGTTACTAGTGCTCCTGATACACGACCCGCACCAGGGGCGACTGCTCCTCCAGCCCACGGAGTTACATCTGCCCCGGATACAAGGCCAGCACCCGGTGCAACTGCTCCGCCCGCCCATGGAGTCACAAGTGCTCCGGATACTAGACCAGCTCCTGGGGCTACGGCGCCTCCTGCGCACGGAGTGACTTCTGCTGCCTCAGG
9.密码子加扰Muc1双重糖基化突变体×21(Muc1_21D)
氨基酸序列:
LYMDMVAVSMTSSVLSSHSPGSGSSTTQGQDVTLAPATEPASGSAATWGQDVTSV[PDTRPAPGATAPPAHGVTAA]21ASG(SEQ ID NO:30)[SEQ ID NO:6]21ASG
cDNA序列:TGTACATGGACATGGTCGCTGTGAGTATGACCAGCAGCGTACTCTCCAGCCACAGCCCCGGTTCAGGCTCCTCCACCACTCAGGGACAGGATGTCACTCTGGCCCCGGCCACGGAACCAGCTTCAGGTTCAGCTGCCACCTGGGGACAGGATGTCACCTCGGTCCCAGACACGCGACCCGCACCAGGCGCGACTGCTCCTCCTGCGCATGGTGTAACAGCGGCCCCTGATACGAGGCCAGCCCCTGGAGCCACCGCACCTCCAGCACACGGAGTGACTGCAGCTCCCGATACTAGACCCGCGCCAGGAGCAACAGCTCCTCCAGCTCATGGTGTGACGGCCGCCCCAGATACCAGACCTGCCCCAGGGGCGACAGCACCCCCCGCTCACGGCGTAACTGCAGCCCCGGATACGAGACCAGCTCCTGGGGCCACTGCACCTCCGGCTCATGGGGTAACAGCTGCCCCCGATACCCGACCTGCACCCGGAGCTACAGCGCCGCCTGCACACGGTGTAACCGCAGCTCCGGATACTAGACCTGCGCCTGGAGCAACGGCGCCTCCTGCACATGGGGTTACTGCTGCGCCAGATACAAGGCCTGCCCCTGGTGCAACAGCACCTCCTGCTCATGGCGTGACAGCTGCACCAGACACAAGACCAGCGCCAGGTGCTACTGCACCACCTGCTCACGGGGTAACTGCTGCTCCAGATACTCGCCCTGCACCGGGAGCGACGGCTCCACCAGCTCACGGAGTAACGGCAGCACCTGACACTAGGCCGGCTCCGGGAGCTACGGCACCGCCCGCACATGGCGTCACTGCGGCTCCTGACACACGACCAGCACCCGGTGCCACAGCTCCGCCAGCACATGGTGTTACGGCTGCTCCCGACACGAGACCCGCTCCTGGAGCTACTGCTCCCCCGGCTCACGGTGTTACTGCAGCGCCTGATACACGCCCAGCACCGGGGGCTACAGCACCACCAGCCCATGGGGTCACAGCAGCTCCAGACACTCGGCCAGCCCCAGGTGCAACTGCTCCACCCGCCCATGGTGTCACTGCTGCACCTGATACCAGGCCGGCACCAGGAGCCACGGCCCCGCCGGCACATGGAGTGACCGCGGCACCCGATACAAGACCTGCTCCGGGCGCTACAGCCCCCCCAGCCCACGGAGTCACCGCTGCTCCTGATACTCGACCGGCACCTGGTGCTACAGCTCCACCGGCCCATGGCGTTACAGCAGCACCAGATACGAGGCCCGCTCCAGGTGCGACCGCTCCTCCCGCTCATGGAGTAACAGCCGCTCCGGACACTAGACCGGCTCCCGGCGCAACTGCGCCCCCTGCCCATGGAGTTACTGCCGCACCGGATACACGCCCTGCCCCGGGAGCAACTGCCCCTCCAGCGCACGGAGTTACAGCTGCTGCCTCAGG(SEQ ID NO:53)
10.密码子加扰Muc1三重糖基化突变体×21(Muc1_21T)氨基酸序列:
11.LYMDMVAVSMTSSVLSSHSPGSGSSTTQGQDVTLAPATEPASGSAATWGQDVTSV[PDARPAPGATAPPAHGVTAA]21ASG(SEQ ID NO:30[SEQ ID NO:7]21ASG
cDNA序列:
TGTACATGGACATGGTCGCTGTGAGTATGACCAGCAGCGTACTCTCCAGCCACAGCCCCGGTTCAGGCTCCTCCACCACTCAGGGACAGGATGTCACTCTGGCCCCGGCCACGGAACCAGCTTCAGGTTCAGCTGCCACCTGGGGACAGGATGTCACCTCGGTCCCAGATGCAAGGCCTGCCCCGGGAGCGACAGCACCACCAGCACATGGAGTGACGGCCGCCCCAGACGCTCGACCGGCACCAGGAGCAACTGCTCCTCCCGCACATGGGGTCACTGCGGCCCCTGATGCGAGGCCGGCACCTGGAGCTACTGCTCCACCGGCCCATGGTGTCACTGCAGCCCCGGATGCTAGACCGGCTCCGGGCGCAACTGCGCCGCCAGCCCATGGAGTTACTGCTGCGCCAGATGCGCGGCCTGCCCCAGGTGCTACAGCCCCCCCTGCCCATGGCGTAACAGCTGCCCCCGATGCTCGCCCTGCACCGGGAGCAACGGCGCCTCCAGCGCACGGAGTAACGGCAGCACCAGATGCTCGGCCAGCACCGGGGGCTACAGCTCCACCTGCTCACGGTGTAACTGCAGCGCCTGATGCACGACCAGCCCCTGGAGCAACAGCTCCGCCTGCACACGGAGTGACTGCTGCACCTGATGCTAGGCCAGCCCCAGGGGCGACTGCACCTCCAGCACACGGTGTTACAGCTGCTCCAGACGCACGCCCAGCACCCGGTGCCACAGCTCCTCCTGCGCATGGTGTGACAGCTGCACCAGACGCCCGACCCGCGCCAGGAGCCACGGCTCCACCAGCTCACGGCGTGACCGCGGCTCCTGACGCTAGGCCAGCTCCTGGAGCCACCGCTCCTCCAGCTCATGGCGTTACAGCAGCTCCCGACGCAAGACCCGCTCCTGGGGCCACTGCTCCCCCCGCTCACGGGGTAACAGCCGCTCCGGATGCAAGACCTGCCCCTGGTGCTACTGCACCACCCGCCCATGGGGTTACTGCAGCTCCGGACGCTAGACCTGCTCCGGGAGCTACAGCGCCCCCAGCCCACGGAGTCACAGCAGCACCTGACGCGAGACCAGCGCCAGGTGCAACTGCCCCTCCTGCACATGGTGTTACTGCCGCACCGGATGCCAGACCTGCACCCGGAGCTACGGCCCCGCCGGCTCATGGGGTAACTGCTGCTCCTGATGCCCGACCCGCTCCAGGCGCGACCGCACCTCCTGCTCATGGAGTAACAGCGGCACCCGATGCACGGCCGGCTCCCGGCGCTACAGCACCTCCGGCACATGGCGTCACCGCAGCTCCAGATGCCAGGCCCGCACCAGGTGCGACGGCACCGCCCGCTCATGGTGTAACCGCTGCTCCCGATGCGAGACCTGCGCCTGGTGCAACAGCACCCCCGGCTCACGGAGTTACGGCTGCTGCCTCAGG(SEQID NO:54)
12.润滑素共有,KEPAPTTP×20(Syn4_20)
氨基酸序列:
13.LYMDMVAVSMTSSVLSSHSPGSGSSTTQGQDVTLAPATEPASGSAATWGQDVTSV[KEPAPTTP]20ASG(SEQ ID NO:30)[SEQ ID NO:1]20ASG
cDNA序列:
TGTACATGGACATGGTCGCTGTGAGTATGACCAGCAGCGTACTCTCCAGCCACAGCCCCGGTTCAGGCTCCTCCACCACTCAGGGACAGGATGTCACTCTGGCCCCGGCCACGGAACCAGCTTCAGGTTCAGCTGCCACCTGGGGACAGGATGTCACCTCGGTCAAGGAACCTGCACCTACAACCCCGAAGGAGCCCGCACCGACCACCCCAAAAGAACCTGCGCCGACAACTCCAAAGGAGCCAGCTCCAACGACGCCAAAGGAACCAGCACCTACGACCCCCAAGGAACCCGCCCCGACGACTCCGAAGGAGCCTGCACCAACAACTCCTAAAGAACCAGCGCCTACTACGCCTAAAGAACCTGCTCCTACTACACCAAAAGAGCCAGCACCCACGACACCGAAAGAACCTGCCCCTACTACCCCTAAAGAACCCGCTCCTACCACACCAAAGGAACCGGCTCCCACTACTCCCAAAGAACCAGCCCCAACTACACCTAAAGAACCGGCCCCCACCACTCCTAAAGAGCCGGCGCCAACTACTCCAAAAGAACCAGCTCCTACAACTCCCAAGGAGCCGGCACCTACTACTCCGAAAGAGCCCGCGCCCACAACACCCAAAGAGCCTGCTCCGACTACTCCTGCCTCAGG(SEQ ID NO:55)
14.合成物1,DAATPAP×40(Syn1_40)
氨基酸序列:
LYMDMVAVSMTSSVLSSHSPGSGSSTTQGQDVTLAPATEPASGSAATWGQDVTSV[DAATPAP]40ASG(SEQ ID NO:30)[SEQ ID NO:2]40ASG
cDNA序列:
TGTACATGGACATGGTCGCTGTGAGTATGACCAGCAGCGTACTCTCCAGCCACAGCCCCGGTTCAGGCTCCTCCACCACTCAGGGACAGGATGTCACTCTGGCCCCGGCCACGGAACCAGCTTCAGGTTCAGCTGCCACCTGGGGACAGGATGTCACCTCGGTCGATGCAGCTACTCCAGCTCCGGACGCCGCAACACCCGCTCCAGACGCCGCCACCCCAGCTCCAGATGCTGCTACACCTGCACCTGATGCCGCAACTCCCGCGCCGGATGCCGCGACTCCAGCACCGGACGCTGCGACGCCAGCCCCTGATGCTGCAACACCGGCTCCTGATGCTGCGACTCCTGCGCCAGATGCAGCTACACCAGCCCCGGATGCTGCAACGCCTGCTCCTGACGCAGCTACTCCGGCCCCCGACGCTGCTACCCCGGCGCCTGATGCTGCTACTCCCGCTCCTGATGCGGCCACTCCAGCCCCAGACGCAGCAACCCCAGCCCCCGATGCTGCTACGCCTGCACCCGACGCGGCCACACCTGCGCCGGACGCAGCGACACCTGCCCCTGACGCTGCCACGCCCGCACCTGATGCAGCTACGCCAGCTCCCGATGCGGCAACACCTGCTCCAGATGCCGCCACTCCTGCTCCGGATGCGGCGACACCAGCGCCTGACGCCGCTACGCCGGCACCTGATGCTGCCACTCCGGCTCCAGATGCAGCGACCCCAGCGCCAGACGCGGCAACTCCAGCGCCCGATGCAGCTACCCCAGCACCAGATGCTGCAACCCCTGCACCGGATGCAGCAACGCCAGCACCTGACGCGGCTACTCCTGCACCAGATGCAGCAACTCCTGCCCCGGACGCGGCGACTCCCGCACCAGACGCTGCAACTCCGGCACCAGATGCGGCTACCCCCGCTCCCGACGCAGCCACTCCCGCCCCAGATGCAGCCACACCAGCTCCTGATGCAGCAACACCAGCACCCGATGCCGCTACCCCTGCTCCCGCCTCAGG(SEQ ID NO:56)
15.合成物1,DAATPAP×80(Syn1_80)
氨基酸序列:
LYMDMVAVSMTSSVLSSHSPGSGSSTTQGQDVTLAPATEPASGSAATWGQDVTSV[DAATPAP]80ASG(SEQ ID NO:30)[SEQ ID NO:2]80ASG
cDNA序列:
TGTACATGGACATGGTCGCTGTGAGTATGACCAGCAGCGTACTCTCCAGCCACAGCCCCGGTTCAGGCTCCTCCACCACTCAGGGACAGGATGTCACTCTGGCCCCGGCCACGGAACCAGCTTCAGGTTCAGCTGCCACCTGGGGACAGGATGTCACCTCGGTCGATGCAGCTACTCCAGCTCCGGACGCCGCAACACCCGCTCCAGACGCCGCCACCCCAGCTCCAGATGCTGCTACACCTGCACCTGATGCCGCAACTCCCGCGCCGGATGCCGCGACTCCAGCACCGGACGCTGCGACGCCAGCCCCTGATGCTGCAACACCGGCTCCTGATGCTGCGACTCCTGCGCCAGATGCAGCTACACCAGCCCCGGATGCTGCAACGCCTGCTCCTGACGCAGCTACTCCGGCCCCCGACGCTGCTACCCCGGCGCCTGATGCTGCTACTCCCGCTCCTGATGCGGCCACTCCAGCCCCAGACGCAGCAACCCCAGCCCCCGATGCTGCTACGCCTGCACCCGACGCGGCCACACCTGCGCCGGACGCAGCGACACCTGCCCCTGACGCTGCCACGCCCGCACCTGATGCAGCTACGCCAGCTCCCGATGCGGCAACACCTGCTCCAGATGCCGCCACTCCTGCTCCGGATGCGGCGACACCAGCGCCTGACGCCGCTACGCCGGCACCTGATGCTGCCACTCCGGCTCCAGATGCAGCGACCCCAGCGCCAGACGCGGCAACTCCAGCGCCCGATGCAGCTACCCCAGCACCAGATGCTGCAACCCCTGCACCGGATGCAGCAACGCCAGCACCTGACGCGGCTACTCCTGCACCAGATGCAGCAACTCCTGCCCCGGACGCGGCGACTCCCGCACCAGACGCTGCAACTCCGGCACCAGATGCGGCTACCCCCGCTCCCGACGCAGCCACTCCCGCCCCAGATGCAGCCACACCAGCTCCTGATGCAGCAACACCAGCACCCGATGCCGCTACCCCTGCTCCCGATGCAGCTACTCCAGCTCCGGACGCCGCAACACCCGCTCCAGACGCCGCCACCCCAGCTCCAGATGCTGCTACACCTGCACCTGATGCCGCAACTCCCGCGCCGGATGCCGCGACTCCAGCACCGGACGCTGCGACGCCAGCCCCTGATGCTGCAACACCGGCTCCTGATGCTGCGACTCCTGCGCCAGATGCAGCTACACCAGCCCCGGATGCTGCAACGCCTGCTCCTGACGCAGCTACTCCGGCCCCCGACGCTGCTACCCCGGCGCCTGATGCTGCTACTCCCGCTCCTGATGCGGCCACTCCAGCCCCAGACGCAGCAACCCCAGCCCCCGATGCTGCTACGCCTGCACCCGACGCGGCCACACCTGCGCCGGACGCAGCGACACCTGCCCCTGACGCTGCCACGCCCGCACCTGATGCAGCTACGCCAGCTCCCGATGCGGCAACACCTGCTCCAGATGCCGCCACTCCTGCTCCGGATGCGGCGACACCAGCGCCTGACGCCGCTACGCCGGCACCTGATGCTGCCACTCCGGCTCCAGATGCAGCGACCCCAGCGCCAGACGCGGCAACTCCAGCGCCCGATGCAGCTACCCCAGCACCAGATGCTGCAACCCCTGCACCGGATGCAGCAACGCCAGCACCTGACGCGGCTACTCCTGCACCAGATGCAGCAACTCCTGCCCCGGACGCGGCGACTCCCGCACCAGACGCTGCAACTCCGGCACCAGATGCGGCTACCCCCGCTCCCGACGCAGCCACTCCCGCCCCAGATGCAGCCACACCAGCTCCTGATGCAGCAACACCAGCACCCGATGCCGCTACCCCTGCTCCCGCCTCAGG(SEQ ID NO:57)
16.合成物2,DAATPAPP×40(Syn2_40)
氨基酸序列:
LYMDMVAVSMTSSVLSSHSPGSGSSTTQGQDVTLAPATEPASGSAATWGQDVTSV[DAATPAPP]40ASG(SEQ ID NO:30)[SEQ ID NO:3]40ASG
cDNA序列:
TGTACATGGACATGGTCGCTGTGAGTATGACCAGCAGCGTACTCTCCAGCCACAGCCCCGGTTCAGGCTCCTCCACCACTCAGGGACAGGATGTCACTCTGGCCCCGGCCACGGAACCAGCTTCAGGTTCAGCTGCCACCTGGGGACAGGATGTCACCTCGGTCGATGCAGCTACCCCGGCTCCACCCGATGCGGCAACACCAGCCCCTCCCGATGCAGCAACACCTGCTCCCCCCGATGCTGCTACCCCTGCTCCGCCTGATGCTGCAACTCCAGCTCCGCCCGATGCCGCTACACCTGCCCCCCCTGACGCCGCCACGCCCGCTCCTCCGGATGCTGCAACCCCAGCACCCCCAGACGCCGCTACCCCAGCTCCACCAGATGCTGCTACACCCGCACCACCTGATGCCGCAACACCGGCGCCTCCTGATGCTGCTACTCCAGCCCCACCTGATGCAGCAACTCCTGCGCCACCAGACGCTGCCACACCTGCACCACCAGATGCAGCCACACCAGCACCGCCAGACGCAGCAACGCCGGCTCCGCCAGATGCAGCGACACCAGCGCCACCTGACGCAGCGACTCCAGCACCACCGGATGCGGCTACCCCCGCTCCGCCGGACGCGGCGACTCCTGCCCCTCCTGACGCGGCAACTCCGGCCCCTCCAGATGCGGCGACCCCAGCCCCGCCGGATGCCGCGACTCCGGCTCCCCCGGACGCTGCAACACCCGCTCCACCTGATGCTGCCACTCCCGCGCCTCCAGATGCTGCAACGCCAGCTCCCCCTGATGCTGCGACGCCTGCTCCTCCAGATGCAGCTACACCGGCTCCTCCTGATGCAGCTACGCCTGCACCGCCTGACGCTGCTACGCCAGCACCTCCCGACGCAGCCACTCCTGCACCTCCTGATGCGGCCACTCCAGCGCCCCCGGATGCAGCTACTCCTGCTCCACCGGACGCCGCAACTCCCGCCCCTCCGGACGCAGCTACTCCCGCTCCCCCAGATGCAGCAACCCCTGCACCCCCCGACGCGGCCACCCCTGCCCCACCAGATGCCGCCACTCCGGCACCACCCGACGCTGCGACTCCCGCACCTCCAGACGCGGCTACACCAGCTCCTCCCGCCTCAGG(SEQ ID NO:58)
17.合成物2,DAATPAPP×80(Syn2_80)
氨基酸序列:
LYMDMVAVSMTSSVLSSHSPGSGSSTTQGQDVTLAPATEPASGSAATWGQDVTSV[DAATPAPP]80ASG(SEQ ID NO:30)[SEQ ID NO:3]80ASG
cDNA序列:
TGTACATGGACATGGTCGCTGTGAGTATGACCAGCAGCGTACTCTCCAGCCACAGCCCCGGTTCAGGCTCCTCCACCACTCAGGGACAGGATGTCACTCTGGCCCCGGCCACGGAACCAGCTTCAGGTTCAGCTGCCACCTGGGGACAGGATGTCACCTCGGTCGATGCAGCTACCCCGGCTCCACCCGATGCGGCAACACCAGCCCCTCCCGATGCAGCAACACCTGCTCCCCCCGATGCTGCTACCCCTGCTCCGCCTGATGCTGCAACTCCAGCTCCGCCCGATGCCGCTACACCTGCCCCCCCTGACGCCGCCACGCCCGCTCCTCCGGATGCTGCAACCCCAGCACCCCCAGACGCCGCTACCCCAGCTCCACCAGATGCTGCTACACCCGCACCACCTGATGCCGCAACACCGGCGCCTCCTGATGCTGCTACTCCAGCCCCACCTGATGCAGCAACTCCTGCGCCACCAGACGCTGCCACACCTGCACCACCAGATGCAGCCACACCAGCACCGCCAGACGCAGCAACGCCGGCTCCGCCAGATGCAGCGACACCAGCGCCACCTGACGCAGCGACTCCAGCACCACCGGATGCGGCTACCCCCGCTCCGCCGGACGCGGCGACTCCTGCCCCTCCTGACGCGGCAACTCCGGCCCCTCCAGATGCGGCGACCCCAGCCCCGCCGGATGCCGCGACTCCGGCTCCCCCGGACGCTGCAACACCCGCTCCACCTGATGCTGCCACTCCCGCGCCTCCAGATGCTGCAACGCCAGCTCCCCCTGATGCTGCGACGCCTGCTCCTCCAGATGCAGCTACACCGGCTCCTCCTGATGCAGCTACGCCTGCACCGCCTGACGCTGCTACGCCAGCACCTCCCGACGCAGCCACTCCTGCACCTCCTGATGCGGCCACTCCAGCGCCCCCGGATGCAGCTACTCCTGCTCCACCGGACGCCGCAACTCCCGCCCCTCCGGACGCAGCTACTCCCGCTCCCCCAGATGCAGCAACCCCTGCACCCCCCGACGCGGCCACCCCTGCCCCACCAGATGCCGCCACTCCGGCACCACCCGACGCTGCGACTCCCGCACCTCCAGACGCGGCTACACCAGCTCCTCCCGATGCAGCTACCCCGGCTCCACCCGATGCGGCAACACCAGCCCCTCCCGATGCAGCAACACCTGCTCCCCCCGATGCTGCTACCCCTGCTCCGCCTGATGCTGCAACTCCAGCTCCGCCCGATGCCGCTACACCTGCCCCCCCTGACGCCGCCACGCCCGCTCCTCCGGATGCTGCAACCCCAGCACCCCCAGACGCCGCTACCCCAGCTCCACCAGATGCTGCTACACCCGCACCACCTGATGCCGCAACACCGGCGCCTCCTGATGCTGCTACTCCAGCCCCACCTGATGCAGCAACTCCTGCGCCACCAGACGCTGCCACACCTGCACCACCAGATGCAGCCACACCAGCACCGCCAGACGCAGCAACGCCGGCTCCGCCAGATGCAGCGACACCAGCGCCACCTGACGCAGCGACTCCAGCACCACCGGATGCGGCTACCCCCGCTCCGCCGGACGCGGCGACTCCTGCCCCTCCTGACGCGGCAACTCCGGCCCCTCCAGATGCGGCGACCCCAGCCCCGCCGGATGCCGCGACTCCGGCTCCCCCGGACGCTGCAACACCCGCTCCACCTGATGCTGCCACTCCCGCGCCTCCAGATGCTGCAACGCCAGCTCCCCCTGATGCTGCGACGCCTGCTCCTCCAGATGCAGCTACACCGGCTCCTCCTGATGCAGCTACGCCTGCACCGCCTGACGCTGCTACGCCAGCACCTCCCGACGCAGCCACTCCTGCACCTCCTGATGCGGCCACTCCAGCGCCCCCGGATGCAGCTACTCCTGCTCCACCGGACGCCGCAACTCCCGCCCCTCCGGACGCAGCTACTCCCGCTCCCCCAGATGCAGCAACCCCTGCACCCCCCGACGCGGCCACCCCTGCCCCACCAGATGCCGCCACTCCGGCACCACCCGACGCTGCGACTCCCGCACCTCCAGACGCGGCTACACCAGCTCCTCCCGCCTCAGG(SEQ ID NO:59)
18.合成物3,PPASTSAPG×40(Syn3_40)
氨基酸序列:
LYMDMVAVSMTSSVLSSHSPGSGSSTTQGQDVTLAPATEPASGSAATWGQDVTSV[PPASTSAPG]40ASG(SEQ ID NO:30)[SEQ ID NO:4]40ASG
cDNA序列:
TGTACATGGACATGGTCGCTGTGAGTATGACCAGCAGCGTACTCTCCAGCCACAGCCCCGGTTCAGGCTCCTCCACCACTCAGGGACAGGATGTCACTCTGGCCCCGGCCACGGAACCAGCTTCAGGTTCAGCTGCCACCTGGGGACAGGATGTCACCTCGGTCCCACCTGCATCTACCAGTGCCCCGGGTCCACCTGCCTCTACTAGCGCCCCAGGACCTCCGGCAAGTACATCAGCGCCAGGACCCCCTGCTTCCACTAGTGCACCCGGTCCCCCGGCATCTACGTCTGCCCCTGGCCCACCTGCTTCAACTTCAGCACCAGGACCACCCGCAAGCACATCAGCCCCAGGCCCTCCCGCCTCTACAAGCGCTCCGGGGCCTCCGGCCTCTACCTCAGCTCCAGGCCCACCAGCCAGCACTTCAGCCCCTGGTCCACCCGCTTCAACCTCAGCACCCGGACCTCCTGCCTCAACTTCCGCTCCCGGTCCACCAGCTAGTACCTCTGCTCCGGGCCCTCCGGCGAGCACGTCAGCACCGGGACCACCTGCGAGTACAAGTGCACCTGGCCCGCCCGCTAGCACAAGTGCCCCCGGTCCTCCAGCATCCACTAGTGCACCAGGGCCTCCAGCCAGCACTAGTGCGCCGGGTCCCCCCGCGAGTACGTCAGCTCCGGGACCTCCAGCTTCTACATCTGCTCCTGGGCCCCCTGCATCAACTAGTGCCCCTGGACCACCGGCTAGTACGTCAGCTCCTGGTCCCCCTGCCAGTACTAGCGCTCCAGGGCCACCAGCAAGTACGAGCGCACCAGGCCCCCCAGCCTCTACGAGTGCACCGGGTCCTCCTGCAAGTACCTCCGCTCCAGGTCCTCCGGCTTCAACGTCCGCACCTGGACCTCCCGCGTCCACATCAGCTCCCGGCCCTCCAGCGAGTACTTCTGCTCCCGGACCACCAGCGTCCACATCTGCGCCTGGTCCTCCCGCTAGTACCTCTGCACCTGGTCCGCCGGCCAGTACAAGTGCTCCCGGGCCTCCCGCATCAACATCTGCACCAGGTCCACCGGCGTCTACTAGTGCCCCAGGTCCCCCAGCTTCAACATCAGCACCTGGGCCGCCTGCTAGTACATCCGCTCCTGGACCCCCAGCAAGTACTTCCGCCCCTGGGCCTCCTGCTTCTACTTCAGCTCCTGGCCCTCCTGCGTCAACTAGTGCTCCAGGACCGCCAGCTAGTACTTCCGCGCCCGGTGCCTCAGG(SEQ ID NO:60)
光学报告子
1.mOxGFP
氨基酸序列:
SGSASGSAMVSKGEELFTGVVPILVELDGDVNGHKFSVRGEGEGDATNGKLTLKFISTTGKLPVPWPTLVTTLTYGVQSFSRYPDHMKRHDFFKSAMPEGYVQERTISFKDDGTYKTRAEVKFEGDTLVNRIELKGIDFKEDGNILGHKLEYNFNSHNVYITADKQKNGIKANFKIRHNVEDGSVQLADHYQQNTPIGDGPVLLPDNHYLSTQSKLSKDPNEKRDHMVLLEFVTAAGITHGMDELYKGSA(SEQ ID NO:31)
cDNA序列:
CCTCAGGCTCTGCATCAGGCTCAGCTATGGTGTCCAAGGGCGAGGAGCTGTTCACCGGGGTGGTGCCCATCCTGGTCGAGCTGGACGGCGACGTAAACGGCCACAAGTTCTCCGTGCGGGGCGAGGGCGAGGGCGATGCCACCAACGGCAAGCTGACCCTGAAGTTCATCAGCACCACCGGCAAGCTGCCCGTGCCCTGGCCCACCCTCGTGACCACCCTGACCTACGGCGTGCAGAGCTTCTCCCGCTACCCCGACCACATGAAGCGCCACGACTTCTTCAAGAGCGCCATGCCCGAAGGCTACGTCCAGGAGCGCACCATCTCCTTCAAGGACGACGGCACCTACAAGACCCGCGCCGAGGTGAAGTTCGAGGGCGACACCCTGGTGAACCGCATCGAGCTGAAGGGCATCGACTTCAAGGAGGACGGCAACATCCTGGGGCACAAGCTGGAGTACAACTTCAACTCCCACAACGTCTATATCACCGCCGACAAGCAGAAGAACGGCATCAAGGCCAACTTCAAGATCCGCCACAACGTGGAGGACGGCTCCGTGCAGCTCGCCGACCACTACCAGCAGAACACCCCCATCGGCGACGGCCCCGTGCTGCTGCCCGACAACCACTACCTGTCCACCCAGTCCAAGCTGTCCAAAGACCCCAACGAGAAGCGCGATCACATGGTCCTTCTGGAATTCGTGACCGCCGCCGGGATCACTCACGGCATGGACGAGCTGTATAAGGGCTC AGC(SEQ ID NO:61)
膜锚
1.天然TM
氨基酸序列:
SASTLVHNGTSARATTTPASKSTPFSIPSHHSDTPTTLASHSTKTDASSTHHSSVPPLTSSNHSTSPQLSTGVSFFFLSFHISNLQFNSSLEDPSTDYYQELQRDISEMFLQIYKQGGFLGLSNIKFRPGSVVVQLTLAFREGTINVHDVETQFNQYKTEAASRYNLTISDVSVSDVPFPFSAQSGAGVPGWGIALLVLVCVLVALAIVYLIALAVCQCRRK*(SEQ ID NO:32)
cDNA序列:
GCTCAGCTTCTACTCTGGTGCACAACGGCACCTCTGCCAGGGCTACCACAACCCCAGCCAGCAAGAGCACTCCATTCTCAATTCCCAGCCACCACTCTGATACTCCTACCACCCTTGCCAGCCATAGCACCAAGACTGATGCCAGTAGCACTCACCATAGCTCGGTACCTCCTCTCACCTCCTCCAATCACAGCACTTCTCCCCAGTTGTCTACTGGGGTCTCTTTCTTTTTCCTGTCTTTTCACATTTCAAACCTCCAGTTTAATTCCTCTCTGGAAGATCCCAGCACCGACTACTACCAAGAGCTGCAGAGAGACATTTCTGAAATGTTTTTGCAGATTTATAAACAAGGGGGTTTTCTGGGCCTCTCCAATATTAAGTTCAGGCCAGGATCTGTGGTGGTACAATTGACTCTGGCCTTCCGAGAAGGTACCATCAATGTCCACGACGTGGAGACACAGTTCAATCAGTATAAAACGGAAGCAGCCTCTCGATATAACCTGACGATCTCAGACGTCAGCGTGAGTGATGTGCCATTTCCTTTCTCTGCCCAGTCTGGGGCTGGGGTGCCAGGCTGGGGCATCGCGCTGCTGGTGCTGGTCTGTGTTCTGGTTGCGCTGGCCATTGTCTATCTCATTGCCTTGGCTGTCTGTCAGTGCCGCCGAAAGTAGGGAATTC(SEQ ID NO:62)
2.合成TM TM21
氨基酸序列:
ASGILYWRNPTESDSIVLAIIVPSLLLLLCLALLWYMRRRSM*(SEQ ID NO:49)cDNA序列:
CCTCAGGCATACTTTATTGGCGAAACCCAACGGAAAGTGATAGCATCGTTTTGGCAATTATCGTCCCCAGTCTGCTCCTCTTGCTCTGCCTGGCTTTGTTGTGGTACATGCGCCGACGAAGTATGTAGGAATTC(SEQ ID NO:63)
细胞质基序
1.天然CT
氨基酸序列:
SRCQCRRKNYGQLDIFPARDTYHPMSEYPTYHTHGRYVPPSSTDRSPYEKVSAGNGGSSLSYTNPAVAAASANL*(SEQ ID NO:33)
cDNA序列:
TCTAGATGTCAGTGCCGCCGAAAGAACTACGGGCAGCTGGACATCTTTCCAGCCCGGGATACCTACCATCCTATGAGCGAGTACCCCACCTACCACACCCATGGGCGCTATGTGCCCCCTAGCAGTACCGATCGTAGCCCCTATGAGAAGGTTTCTGCAGGTAAtGGTGGCAGCAGCCTCTCTTACACAAACCCAGCAGTGGCAGCCGCTTCTGCCAACTTGTAGGAATTC(SEQ ID NO:64)
2.CQC
氨基酸序列:
SRCQCRRK*(SEQ ID NO:34)
cDNA序列:
TCTAGATGTCAGTGCCGCCGAAAGTAGGAATTC(SEQ ID NO:65)
构建体列表
膜缔合粘蛋白
1.pcDNA3.1+_Muc1_0_TM21
2.pcDNA3.1+_Muc1_10_TM21
3.pcDNA3.1+_Muc1_21_TM21
4.pcDNA3.1+_Muc1_42_TM21
5.pcDNA3.1+_Muc1_21S_TM21
6.pcDNA3.1+_Muc1_21D_TM21
7.pcDNA3.1+_Muc1_21T_TM21
8.pcDNA3.1+_Muc1_10_TM21_CT
9.pcDNA3.1+_Muc1_10_TM21_CQC
10.pcDNA3.1+_Muc1_10_dCT
11.pcDNA3.1+_Muc1_10_FL
12.pcDNA3.1+_Muc1_Syn4_20_TM21
13.pcDNA3.1+_Muc1_Syn1_40_TM21
14.pcDNA3.1+_Muc1_Syn2_40_TM21
15.pcDNA3.1+_Muc1_Syn3_40_TM21
16.pcDNA3.1+_Muc1_Syn1_80_TM21
17.pcDNA3.1+_Muc1_Syn2_80_TM21
18.pPB_Tet_Muc1_TM21_IRES2_copGFP_rtTAsM2_IRES_NeoR
19.pPB_Tet_Muc1_42_TM21_IRES2_copGFP_rtTAsM2_IRES_NeoR
20.pPB_Tet_Muc1_21_TM21_IRES2_copGFP_rtTAsM2_IRES_NeoR
21.pPB_Tet_Muc1_10_TM21_IRES2_copGFP_rtTAsM2_IRES_NeoR
22.pPB_Tet_Muc1_0_TM21_IRES2_copGFP_rtTAsM2_IRES_NeoR
23.pPB_Tet_Muc1_21D_TM21_IRES2_copGFP_rtTAsM2_IRES_NeoR
24.pPB_Tet_Muc1_21T_TM21_IRES2_copGFP_rtTAsM2_IRES_NeoR
25.pLV_puro_teton_Muc1_42_dCT
26.pLV_puro_teton_Muc1_dCT
27.pPB_Muc1_mOxGFP_dCT_BlpI
28.pPB_Muc1_42_mOxGFP_dCT_BlpI
29.pPB_Muc1_21_mOxGFP_dCT_BlpI
30.pPB_Muc1_10_mOxGFP_dCT_BlpI
31.pPB_Muc1_0_mOxGFP_dCT_BlpI
32.pPB_Muc1_21S_mOxGFP_dCT_BlpI
33.pPB_Muc1_21D_mOxGFP_dCT_BlpI
34.pPB_Muc1_21T_mOxGFP_dCT_BlpI
35.pPB_Muc1_Syn4_20_mOxGFP_dCT_BlpI
36.pPB_Muc1_Syn1_40_mOxGFP_dCT_BlpI
37.pPB_Muc1_Syn2_40_mOxGFP_dCT_BlpI
38.pPB_Muc1_Syn3_40_mOxGFP_dCT_BlpI
39.pPB_Muc1_Syn1_80_mOxGFP_dCT_BlpI
40.pPB_Muc1_Syn2_80_mOxGFP_dCT_BlpI
分泌型粘蛋白
41.pPB_Tet_SumoStar_Muc1_42_rtTAsM2_IRES_NeoR
42.pPB_Tet_SumoStar_Muc1_21T_rtTAsM2_IRES_NeoR
43.pPB_Tet_SumoStar_Muc1_21D_rtTAsM2_IRES_NeoR
44.pPB_Tet_SumoStar_Muc1_21S_rtTAsM2_IRES_NeoR
45.pPB_Tet_SumoStar_Muc1_21_rtTAsM2_IRES_NeoR
46.pPB_Tet_SumoStar_Muc1_0_rtTAsM2_IRES_NeoR
47.pPB_Tet_SumoStar_Muc1_Syn1_40_rtTAsM2_IRES_NeoR
48.pPB_Tet_SumoStar_Muc1_Syn2_40_rtTAsM2_IRES_NeoR
49.pPB_Tet_SumoStar_Muc1_Syn3_40_rtTAsM2_IRES_NeoR
50.pPB_Tet_SumoStar_Muc1_Syn1_80_rtTAsM2_IRES_NeoR
51.pPB_Tet_SumoStar_Muc1_Syn2_80_rtTAsM2_IRES_NeoR
以下序列为如本文进一步描述的粘蛋白和润滑素构建体的代表性氨基酸序列,以及其完整序列,包括N端信号序列、串联重复结构域、荧光光学报告子(在这些序列中的某一些中是绿色荧光(GFP))、跨膜结构域到细胞质尾区结构域。在实施方案中,修饰的润滑素省略跨膜结构域、细胞质尾区、结构域以及光学报告子。应认识到,GFP序列可省略或被任何其它氨基酸序列取代,包括但不限于如上文所描述的其它可检测蛋白质或第二多肽。每个序列上方给出的字母数字名称为序列名称,而非序列本身。
1.PDTRPAPGSTAPPAHGVTSA_42
Muc1_42_mOxGFP_dCT_BlpI
MTPGTQSPFFLLLLLTVLTVVTGSGHASSTPGGEKETSATQRSSVPSSTEKNADYKDDDDLYMDMVAVSMTSSVLSSHSPGSGSSTTQGQDVTLAPATEPASGSAATWGQDVTSVPDTRPAPGSTAPPAHGVTSAPDTRPAPGSTAPPAHGVTSAPDTRPAPGSTAPPAHGVTSAPDTRPAPGSTAPPAHGVTSAPDTRPAPGSTAPPAHGVTSAPDTRPAPGSTAPPAHGVTSAPDTRPAPGSTAPPAHGVTSAPDTRPAPGSTAPPAHGVTSAPDTRPAPGSTAPPAHGVTSAPDTRPAPGSTAPPAHGVTSAPDTRPAPGSTAPPAHGVTSAPDTRPAPGSTAPPAHGVTSAPDTRPAPGSTAPPAHGVTSAPDTRPAPGSTAPPAHGVTSAPDTRPAPGSTAPPAHGVTSAPDTRPAPGSTAPPAHGVTSAPDTRPAPGSTAPPAHGVTSAPDTRPAPGSTAPPAHGVTSAPDTRPAPGSTAPPAHGVTSAPDTRPAPGSTAPPAHGVTSAPDTRPAPGSTAPPAHGVTSAPDTRPAPGSTAPPAHGVTSAPDTRPAPGSTAPPAHGVTSAPDTRPAPGSTAPPAHGVTSAPDTRPAPGSTAPPAHGVTSAPDTRPAPGSTAPPAHGVTSAPDTRPAPGSTAPPAHGVTSAPDTRPAPGSTAPPAHGVTSAPDTRPAPGSTAPPAHGVTSAPDTRPAPGSTAPPAHGVTSAPDTRPAPGSTAPPAHGVTSAPDTRPAPGSTAPPAHGVTSAPDTRPAPGSTAPPAHGVTSAPDTRPAPGSTAPPAHGVTSAPDTRPAPGSTAPPAHGVTSAPDTRPAPGSTAPPAHGVTSAPDTRPAPGSTAPPAHGVTSAPDTRPAPGSTAPPAHGVTSAPDTRPAPGSTAPPAHGVTSAPDTRPAPGSTAPPAHGVTSAPDTRPAPGSTAPPAHGVTSAPDTRPAPGSTAPPAHGVTSAASGSASGSAMVSKGEELFTGVVPILVELDGDVNGHKFSVRGEGEGDATNGKLTLKFISTTGKLPVPWPTLVTTLTYGVQSFSRYPDHMKRHDFFKSAMPEGYVQERTISFKDDGTYKTRAEVKFEGDTLVNRIELKGIDFKEDGNILGHKLEYNFNSHNVYITADKQKNGIKANFKIRHNVEDGSVQLADHYQQNTPIGDGPVLLPDNHYLSTQSKLSKDPNEKRDHMVLLEFVTAAGITHGMDELYKGSASTLVHNGTSARATTTPASKSTPFSIPSHHSDTPTTLASHSTKTDASSTHHSSVPPLTSSNHSTSPQLSTGVSFFFLSFHISNLQFNSSLEDPSTDYYQELQRDISEMFLQIYKQGGFLGLSNIKFRPGSVVVQLTLAFREGTINVHDVETQFNQYKTEAASRYNLTISDVSVSDVPFPFSAQSGAGVPGWGIALLVLVCVLVALAIVYLIALAVCQCRRK*(SEQ IDNO:35)
2.PDTRPAPGSTAPPAHGVTSA_21
Muc1_21_mOxGFP_dCT_BlpI
MTPGTQSPFFLLLLLTVLTVVTGSGHASSTPGGEKETSATQRSSVPSSTEKNADYKDDDDLYMDMVAVSMTSSVLSSHSPGSGSSTTQGQDVTLAPATEPASGSAATWGQDVTSVPDTRPAPGSTAPPAHGVTSAPDTRPAPGSTAPPAHGVTSAPDTRPAPGSTAPPAHGVTSAPDTRPAPGSTAPPAHGVTSAPDTRPAPGSTAPPAHGVTSAPDTRPAPGSTAPPAHGVTSAPDTRPAPGSTAPPAHGVTSAPDTRPAPGSTAPPAHGVTSAPDTRPAPGSTAPPAHGVTSAPDTRPAPGSTAPPAHGVTSAPDTRPAPGSTAPPAHGVTSAPDTRPAPGSTAPPAHGVTSAPDTRPAPGSTAPPAHGVTSAPDTRPAPGSTAPPAHGVTSAPDTRPAPGSTAPPAHGVTSAPDTRPAPGSTAPPAHGVTSAPDTRPAPGSTAPPAHGVTSAPDTRPAPGSTAPPAHGVTSAPDTRPAPGSTAPPAHGVTSAPDTRPAPGSTAPPAHGVTSAPDTRPAPGSTAPPAHGVTSAASGSASGSAMVSKGEELFTGVVPILVELDGDVNGHKFSVRGEGEGDATNGKLTLKFISTTGKLPVPWPTLVTTLTYGVQSFSRYPDHMKRHDFFKSAMPEGYVQERTISFKDDGTYKTRAEVKFEGDTLVNRIELKGIDFKEDGNILGHKLEYNFNSHNVYITADKQKNGIKANFKIRHNVEDGSVQLADHYQQNTPIGDGPVLLPDNHYLSTQSKLSKDPNEKRDHMVLLEFVTAAGITHGMDELYKGSASTLVHNGTSARATTTPASKSTPFSIPSHHSDTPTTLASHSTKTDASSTHHSSVPPLTSSNHSTSPQLSTGVSFFFLSFHISNLQFNSSLEDPSTDYYQELQRDISEMFLQIYKQGGFLGLSNIKFRPGSVVVQLTLAFREGTINVHDVETQFNQYKTEAASRYNLTISDVSVSDVPFPFSAQSGAGVPGWGIALLVLVCVLVALAIVYLIALAVCQCRRK*(SEQ ID NO:36)
3.PDTRPAPGSTAPPAHGVTSA_10
Muc1_10_TM21_CT
MTPGTQSPFFLLLLLTVLTVVTGSGHASSTPGGEKETSATQRSSVPSSTEKNADYKDDDDLYMDMVAVSMTSSVLSSHSPGSGSSTTQGQDVTLAPATEPASGSAATWGQDVTSVPDTRPAPGSTAPPAHGVTSAPDTRPAPGSTAPPAHGVTSAPDTRPAPGSTAPPAHGVTSAPDTRPAPGSTAPPAHGVTSAPDTRPAPGSTAPPAHGVTSAPDTRPAPGSTAPPAHGVTSAPDTRPAPGSTAPPAHGVTSAPDTRPAPGSTAPPAHGVTSAPDTRPAPGSTAPPAHGVTSAPDTRPAPGSTAPPAHGVTSAASGILYWRNPTESDSIVLAIIVPSLLLLLCLALLWYSRCQCRRKNYGQLDIFPARDTYHPMSEYPTYHTHGRYVPPSSTDRSPYEKVSAGNGGSSLSYTNPAVAAASANL*(SEQ ID NO:37)
4.PDTRPAPGSTAPPAHGVTSA_0
Muc1_0_mOxGFP_dCT_BlpI
MTPGTQSPFFLLLLLTVLTVVTGSGHASSTPGGEKETSATQRSSVPSSTEKNADYKDDDDLYMDMVAVSMTSSVLSSHSPGSGSSTTQGQDVTLAPATEPASGSAATWGQDVTSVGGGGGASGSASGSAMVSKGEELFTGVVPILVELDGDVNGHKFSVRGEGEGDATNGKLTLKFISTTGKLPVPWPTLVTTLTYGVQSFSRYPDHMKRHDFFKSAMPEGYVQERTISFKDDGTYKTRAEVKFEGDTLVNRIELKGIDFKEDGNILGHKLEYNFNSHNVYITADKQKNGIKANFKIRHNVEDGSVQLADHYQQNTPIGDGPVLLPDNHYLSTQSKLSKDPNEKRDHMVLLEFVTAAGITHGMDELYKGSASTLVHNGTSARATTTPASKSTPFSIPSHHSDTPTTLASHSTKTDASSTHHSSVPPLTSSNHSTSPQLSTGVSFFFLSFHISNLQFNSSLEDPSTDYYQELQRDISEMFLQIYKQGGFLGLSNIKFRPGSVVVQLTLAFREGTINVHDVETQFNQYKTEAASRYNLTISDVSVSDVPFPFSAQSGAGVPGWGIALLVLVCVLVALAIVYLIALAVCQCRRK*(SEQ IDNO:38)
5.PDTRPAPGATAPPAHGVTSA_21
Muc1_21S_mOxGFP_dCT_BlpI
MTPGTQSPFFLLLLLTVLTVVTGSGHASSTPGGEKETSATQRSSVPSSTEKNADYKDDDDLYMDMVAVSMTSSVLSSHSPGSGSSTTQGQDVTLAPATEPASGSAATWGQDVTSVPDTRPAPGATAPPAHGVTSAPDTRPAPGATAPPAHGVTSAPDTRPAPGATAPPAHGVTSAPDTRPAPGATAPPAHGVTSAPDTRPAPGATAPPAHGVTSAPDTRPAPGATAPPAHGVTSAPDTRPAPGATAPPAHGVTSAPDTRPAPGATAPPAHGVTSAPDTRPAPGATAPPAHGVTSAPDTRPAPGATAPPAHGVTSAPDTRPAPGATAPPAHGVTSAPDTRPAPGATAPPAHGVTSAPDTRPAPGATAPPAHGVTSAPDTRPAPGATAPPAHGVTSAPDTRPAPGATAPPAHGVTSAPDTRPAPGATAPPAHGVTSAPDTRPAPGATAPPAHGVTSAPDTRPAPGATAPPAHGVTSAPDTRPAPGATAPPAHGVTSAPDTRPAPGATAPPAHGVTSAPDTRPAPGATAPPAHGVTSAASGSASGSAMVSKGEELFTGVVPILVELDGDVNGHKFSVRGEGEGDATNGKLTLKFISTTGKLPVPWPTLVTTLTYGVQSFSRYPDHMKRHDFFKSAMPEGYVQERTISFKDDGTYKTRAEVKFEGDTLVNRIELKGIDFKEDGNILGHKLEYNFNSHNVYITADKQKNGIKANFKIRHNVEDGSVQLADHYQQNTPIGDGPVLLPDNHYLSTQSKLSKDPNEKRDHMVLLEFVTAAGITHGMDELYKGSASTLVHNGTSARATTTPASKSTPFSIPSHHSDTPTTLASHSTKTDASSTHHSSVPPLTSSNHSTSPQLSTGVSFFFLSFHISNLQFNSSLEDPSTDYYQELQRDISEMFLQIYKQGGFLGLSNIKFRPGSVVVQLTLAFREGTINVHDVETQFNQYKTEAASRYNLTISDVSVSDVPFPFSAQSGAGVPGWGIALLVLVCVLVALAIVYLIALAVCQCRRK*(SEQ ID NO:39)
6.PDTRPAPGATAPPAHGVTAA_21
Muc1_21D_mOxGFP_dCT_BlpI
MTPGTQSPFFLLLLLTVLTVVTGSGHASSTPGGEKETSATQRSSVPSSTEKNADYKDDDDLYMDMVAVSMTSSVLSSHSPGSGSSTTQGQDVTLAPATEPASGSAATWGQDVTSVPDTRPAPGATAPPAHGVTAAPDTRPAPGATAPPAHGVTAAPDTRPAPGATAPPAHGVTAAPDTRPAPGATAPPAHGVTAAPDTRPAPGATAPPAHGVTAAPDTRPAPGATAPPAHGVTAAPDTRPAPGATAPPAHGVTAAPDTRPAPGATAPPAHGVTAAPDTRPAPGATAPPAHGVTAAPDTRPAPGATAPPAHGVTAAPDTRPAPGATAPPAHGVTAAPDTRPAPGATAPPAHGVTAAPDTRPAPGATAPPAHGVTAAPDTRPAPGATAPPAHGVTAAPDTRPAPGATAPPAHGVTAAPDTRPAPGATAPPAHGVTAAPDTRPAPGATAPPAHGVTAAPDTRPAPGATAPPAHGVTAAPDTRPAPGATAPPAHGVTAAPDTRPAPGATAPPAHGVTAAPDTRPAPGATAPPAHGVTAAASGSASGSAMVSKGEELFTGVVPILVELDGDVNGHKFSVRGEGEGDATNGKLTLKFISTTGKLPVPWPTLVTTLTYGVQSFSRYPDHMKRHDFFKSAMPEGYVQERTISFKDDGTYKTRAEVKFEGDTLVNRIELKGIDFKEDGNILGHKLEYNFNSHNVYITADKQKNGIKANFKIRHNVEDGSVQLADHYQQNTPIGDGPVLLPDNHYLSTQSKLSKDPNEKRDHMVLLEFVTAAGITHGMDELYKGSASTLVHNGTSARATTTPASKSTPFSIPSHHSDTPTTLASHSTKTDASSTHHSSVPPLTSSNHSTSPQLSTGVSFFFLSFHISNLQFNSSLEDPSTDYYQELQRDISEMFLQIYKQGGFLGLSNIKFRPGSVVVQLTLAFREGTINVHDVETQFNQYKTEAASRYNLTISDVSVSDVPFPFSAQSGAGVPGWGIALLVLVCVLVALAIVYLIALAVCQCRRK*(SEQ ID NO:40)
7.PDARPAPGATAPPAHGVTAA_21
Muc1_21T_mOxGFP_dCT_BlpI
MTPGTQSPFFLLLLLTVLTVVTGSGHASSTPGGEKETSATQRSSVPSSTEKNADYKDDDDLYMDMVAVSMTSSVLSSHSPGSGSSTTQGQDVTLAPATEPASGSAATWGQDVTSVPDARPAPGATAPPAHGVTAAPDARPAPGATAPPAHGVTAAPDARPAPGATAPPAHGVTAAPDARPAPGATAPPAHGVTAAPDARPAPGATAPPAHGVTAAPDARPAPGATAPPAHGVTAAPDARPAPGATAPPAHGVTAAPDARPAPGATAPPAHGVTAAPDARPAPGATAPPAHGVTAAPDARPAPGATAPPAHGVTAAPDARPAPGATAPPAHGVTAAPDARPAPGATAPPAHGVTAAPDARPAPGATAPPAHGVTAAPDARPAPGATAPPAHGVTAAPDARPAPGATAPPAHGVTAAPDARPAPGATAPPAHGVTAAPDARPAPGATAPPAHGVTAAPDARPAPGATAPPAHGVTAAPDARPAPGATAPPAHGVTAAPDARPAPGATAPPAHGVTAAPDARPAPGATAPPAHGVTAAASGSASGSAMVSKGEELFTGVVPILVELDGDVNGHKFSVRGEGEGDATNGKLTLKFISTTGKLPVPWPTLVTTLTYGVQSFSRYPDHMKRHDFFKSAMPEGYVQERTISFKDDGTYKTRAEVKFEGDTLVNRIELKGIDFKEDGNILGHKLEYNFNSHNVYITADKQKNGIKANFKIRHNVEDGSVQLADHYQQNTPIGDGPVLLPDNHYLSTQSKLSKDPNEKRDHMVLLEFVTAAGITHGMDELYKGSASTLVHNGTSARATTTPASKSTPFSIPSHHSDTPTTLASHSTKTDASSTHHSSVPPLTSSNHSTSPQLSTGVSFFFLSFHISNLQFNSSLEDPSTDYYQELQRDISEMFLQIYKQGGFLGLSNIKFRPGSVVVQLTLAFREGTINVHDVETQFNQYKTEAASRYNLTISDVSVSDVPFPFSAQSGAGVPGWGIALLVLVCVLVALAIVYLIALAVCQCRRK*(SEQ ID NO:41)
8.KEPAPTTP_20(Syn4_20)
Muc1_Syn4_20_mOxGFP_dCT_BlpI
MTPGTQSPFFLLLLLTVLTVVTGSGHASSTPGGEKETSATQRSSVPSSTEKNADYKDDDDLYMDMVAVSMTSSVLSSHSPGSGSSTTQGQDVTLAPATEPASGSAATWGQDVTSVKEPAPTTPKEPAPTTPKEPAPTTPKEPAPTTPKEPAPTTPKEPAPTTPKEPAPTTPKEPAPTTPKEPAPTTPKEPAPTTPKEPAPTTPKEPAPTTPKEPAPTTPKEPAPTTPKEPAPTTPKEPAPTTPKEPAPTTPKEPAPTTPKEPAPTTPKEPAPTTPASGSASGSAMVSKGEELFTGVVPILVELDGDVNGHKFSVRGEGEGDATNGKLTLKFISTTGKLPVPWPTLVTTLTYGVQSFSRYPDHMKRHDFFKSAMPEGYVQERTISFKDDGTYKTRAEVKFEGDTLVNRIELKGIDFKEDGNILGHKLEYNFNSHNVYITADKQKNGIKANFKIRHNVEDGSVQLADHYQQNTPIGDGPVLLPDNHYLSTQSKLSKDPNEKRDHMVLLEFVTAAGITHGMDELYKGSASTLVHNGTSARATTTPASKSTPFSIPSHHSDTPTTLASHSTKTDASSTHHSSVPPLTSSNHSTSPQLSTGVSFFFLSFHISNLQFNSSLEDPSTDYYQELQRDISEMFLQIYKQGGFLGLSNIKFRPGSVVVQLTLAFREGTINVHDVETQFNQYKTEAASRYNLTISDVSVSDVPFPFSAQSGAGVPGWGIALLVLVCVLVALAIVYLIALAVCQCRRK*(SEQID NO:42)
9.DAATPAP_40(Syn1_40)
Muc1_Syn1_40_mOxGFP_dCT_BlpI
MTPGTQSPFFLLLLLTVLTVVTGSGHASSTPGGEKETSATQRSSVPSSTEKNADYKDDDDLYMDMVAVSMTSSVLSSHSPGSGSSTTQGQDVTLAPATEPASGSAATWGQDVTSVDAATPAPDAATPAPDAATPAPDAATPAPDAATPAPDAATPAPDAATPAPDAATPAPDAATPAPDAATPAPDAATPAPDAATPAPDAATPAPDAATPAPDAATPAPDAATPAPDAATPAPDAATPAPDAATPAPDAATPAPDAATPAPDAATPAPDAATPAPDAATPAPDAATPAPDAATPAPDAATPAPDAATPAPDAATPAPDAATPAPDAATPAPDAATPAPDAATPAPDAATPAPDAATPAPDAATPAPDAATPAPDAATPAPDAATPAPDAATPAPASGSASGSAMVSKGEELFTGVVPILVELDGDVNGHKFSVRGEGEGDATNGKLTLKFISTTGKLPVPWPTLVTTLTYGVQSFSRYPDHMKRHDFFKSAMPEGYVQERTISFKDDGTYKTRAEVKFEGDTLVNRIELKGIDFKEDGNILGHKLEYNFNSHNVYITADKQKNGIKANFKIRHNVEDGSVQLADHYQQNTPIGDGPVLLPDNHYLSTQSKLSKDPNEKRDHMVLLEFVTAAGITHGMDELYKGSASTLVHNGTSARATTTPASKSTPFSIPSHHSDTPTTLASHSTKTDASSTHHSSVPPLTSSNHSTSPQLSTGVSFFFLSFHISNLQFNSSLEDPSTDYYQELQRDISEMFLQIYKQGGFLGLSNIKFRPGSVVVQLTLAFREGTINVHDVETQFNQYKTEAASRYNLTISDVSVSDVPFPFSAQSGAGVPGWGIALLVLVCVLVALAIVYLIALAVCQCRRK*(SEQ ID NO:43)
10.DAATPAP_80(Syn1_80)
Muc1_Syn1_80_mOxGFP_dCT_BlpI
MTPGTQSPFFLLLLLTVLTVVTGSGHASSTPGGEKETSATQRSSVPSSTEKNADYKDDDDLYMDMVAVSMTSSVLSSHSPGSGSSTTQGQDVTLAPATEPASGSAATWGQDVTSVDAATPAPDAATPAPDAATPAPDAATPAPDAATPAPDAATPAPDAATPAPDAATPAPDAATPAPDAATPAPDAATPAPDAATPAPDAATPAPDAATPAPDAATPAPDAATPAPDAATPAPDAATPAPDAATPAPDAATPAPDAATPAPDAATPAPDAATPAPDAATPAPDAATPAPDAATPAPDAATPAPDAATPAPDAATPAPDAATPAPDAATPAPDAATPAPDAATPAPDAATPAPDAATPAPDAATPAPDAATPAPDAATPAPDAATPAPDAATPAPDAATPAPDAATPAPDAATPAPDAATPAPDAATPAPDAATPAPDAATPAPDAATPAPDAATPAPDAATPAPDAATPAPDAATPAPDAATPAPDAATPAPDAATPAPDAATPAPDAATPAPDAATPAPDAATPAPDAATPAPDAATPAPDAATPAPDAATPAPDAATPAPDAATPAPDAATPAPDAATPAPDAATPAPDAATPAPDAATPAPDAATPAPDAATPAPDAATPAPDAATPAPDAATPAPDAATPAPDAATPAPDAATPAPDAATPAPDAATPAPASGSASGSAMVSKGEELFTGVVPILVELDGDVNGHKFSVRGEGEGDATNGKLTLKFISTTGKLPVPWPTLVTTLTYGVQSFSRYPDHMKRHDFFKSAMPEGYVQERTISFKDDGTYKTRAEVKFEGDTLVNRIELKGIDFKEDGNILGHKLEYNFNSHNVYITADKQKNGIKANFKIRHNVEDGSVQLADHYQQNTPIGDGPVLLPDNHYLSTQSKLSKDPNEKRDHMVLLEFVTAAGITHGMDELYKGSASTLVHNGTSARATTTPASKSTPFSIPSHHSDTPTTLASHSTKTDASSTHHSSVPPLTSSNHSTSPQLSTGVSFFFLSFHISNLQFNSSLEDPSTDYYQELQRDISEMFLQIYKQGGFLGLSNIKFRPGSVVVQLTLAFREGTINVHDVETQFNQYKTEAASRYNLTISDVSVSDVPFPFSAQSGAGVPGWGIALLVLVCVLVALAIVYLIALAVCQCRRK*(SEQID NO:44)
11.DAATPAPP_40(Syn2_40)
Muc1_Syn1_40_mOxGFP_dCT_BlpI
MTPGTQSPFFLLLLLTVLTVVTGSGHASSTPGGEKETSATQRSSVPSSTEKNADYKDDDDLYMDMVAVSMTSSVLSSHSPGSGSSTTQGQDVTLAPATEPASGSAATWGQDVTSVDAATPAPPDAATPAPPDAATPAPPDAATPAPPDAATPAPPDAATPAPPDAATPAPPDAATPAPPDAATPAPPDAATPAPPDAATPAPPDAATPAPPDAATPAPPDAATPAPPDAATPAPPDAATPAPPDAATPAPPDAATPAPPDAATPAPPDAATPAPPDAATPAPPDAATPAPPDAATPAPPDAATPAPPDAATPAPPDAATPAPPDAATPAPPDAATPAPPDAATPAPPDAATPAPPDAATPAPPDAATPAPPDAATPAPPDAATPAPPDAATPAPPDAATPAPPDAATPAPPDAATPAPPDAATPAPPDAATPAPPASGSASGSAMVSKGEELFTGVVPILVELDGDVNGHKFSVRGEGEGDATNGKLTLKFISTTGKLPVPWPTLVTTLTYGVQSFSRYPDHMKRHDFFKSAMPEGYVQERTISFKDDGTYKTRAEVKFEGDTLVNRIELKGIDFKEDGNILGHKLEYNFNSHNVYITADKQKNGIKANFKIRHNVEDGSVQLADHYQQNTPIGDGPVLLPDNHYLSTQSKLSKDPNEKRDHMVLLEFVTAAGITHGMDELYKGSASTLVHNGTSARATTTPASKSTPFSIPSHHSDTPTTLASHSTKTDASSTHHSSVPPLTSSNHSTSPQLSTGVSFFFLSFHISNLQFNSSLEDPSTDYYQELQRDISEMFLQIYKQGGFLGLSNIKFRPGSVVVQLTLAFREGTINVHDVETQFNQYKTEAASRYNLTISDVSVSDVPFPFSAQSGAGVPGWGIALLVLVCVLVALAIVYLIALAVCQCRRK*
(SEQ ID NO:45)
12.DAATPAPP_80(Syn2_80)
Muc1_Syn1_40_mOxGFP_dCT_BlpI
MTPGTQSPFFLLLLLTVLTVVTGSGHASSTPGGEKETSATQRSSVPSSTEKNADYKDDDDLYMDMVAVSMTSSVLSSHSPGSGSSTTQGQDVTLAPATEPASGSAATWGQDVTSVDAATPAPPDAATPAPPDAATPAPPDAATPAPPDAATPAPPDAATPAPPDAATPAPPDAATPAPPDAATPAPPDAATPAPPDAATPAPPDAATPAPPDAATPAPPDAATPAPPDAATPAPPDAATPAPPDAATPAPPDAATPAPPDAATPAPPDAATPAPPDAATPAPPDAATPAPPDAATPAPPDAATPAPPDAATPAPPDAATPAPPDAATPAPPDAATPAPPDAATPAPPDAATPAPPDAATPAPPDAATPAPPDAATPAPPDAATPAPPDAATPAPPDAATPAPPDAATPAPPDAATPAPPDAATPAPPDAATPAPPDAATPAPPDAATPAPPDAATPAPPDAATPAPPDAATPAPPDAATPAPPDAATPAPPDAATPAPPDAATPAPPDAATPAPPDAATPAPPDAATPAPPDAATPAPPDAATPAPPDAATPAPPDAATPAPPDAATPAPPDAATPAPPDAATPAPPDAATPAPPDAATPAPPDAATPAPPDAATPAPPDAATPAPPDAATPAPPDAATPAPPDAATPAPPDAATPAPPDAATPAPPDAATPAPPDAATPAPPDAATPAPPDAATPAPPDAATPAPPDAATPAPPDAATPAPPDAATPAPPDAATPAPPDAATPAPPDAATPAPPASGSASGSAMVSKGEELFTGVVPILVELDGDVNGHKFSVRGEGEGDATNGKLTLKFISTTGKLPVPWPTLVTTLTYGVQSFSRYPDHMKRHDFFKSAMPEGYVQERTISFKDDGTYKTRAEVKFEGDTLVNRIELKGIDFKEDGNILGHKLEYNFNSHNVYITADKQKNGIKANFKIRHNVEDGSVQLADHYQQNTPIGDGPVLLPDNHYLSTQSKLSKDPNEKRDHMVLLEFVTAAGITHGMDELYKGSASTLVHNGTSARATTTPASKSTPFSIPSHHSDTPTTLASHSTKTDASSTHHSSVPPLTSSNHSTSPQLSTGVSFFFLSFHISNLQFNSSLEDPSTDYYQELQRDISEMFLQIYKQGGFLGLSNIKFRPGSVVVQLTLAFREGTINVHDVETQFNQYKTEAASRYNLTISDVSVSDVPFPFSAQSGAGVPGWGIALLVLVCVLVALAIVYLIALAVCQCRRK*(SEQ ID NO:46)
13.PPASTSAPG_40(Syn3_40)
Muc1_Syn1_40_mOxGFP_dCT_BlpI
MTPGTQSPFFLLLLLTVLTVVTGSGHASSTPGGEKETSATQRSSVPSSTEKNADYKDDDDLYMDMVAVSMTSSVLSSHSPGSGSSTTQGQDVTLAPATEPASGSAATWGQDVTSVPPASTSAPGPPASTSAPGPPASTSAPGPPASTSAPGPPASTSAPGPPASTSAPGPPASTSAPGPPASTSAPGPPASTSAPGPPASTSAPGPPASTSAPGPPASTSAPGPPASTSAPGPPASTSAPGPPASTSAPGPPASTSAPGPPASTSAPGPPASTSAPGPPASTSAPGPPASTSAPGPPASTSAPGPPASTSAPGPPASTSAPGPPASTSAPGPPASTSAPGPPASTSAPGPPASTSAPGPPASTSAPGPPASTSAPGPPASTSAPGPPASTSAPGPPASTSAPGPPASTSAPGPPASTSAPGPPASTSAPGPPASTSAPGPPASTSAPGPPASTSAPGPPASTSAPGPPASTSAPGASGSASGSAMVSKGEELFTGVVPILVELDGDVNGHKFSVRGEGEGDATNGKLTLKFISTTGKLPVPWPTLVTTLTYGVQSFSRYPDHMKRHDFFKSAMPEGYVQERTISFKDDGTYKTRAEVKFEGDTLVNRIELKGIDFKEDGNILGHKLEYNFNSHNVYITADKQKNGIKANFKIRHNVEDGSVQLADHYQQNTPIGDGPVLLPDNHYLSTQSKLSKDPNEKRDHMVLLEFVTAAGITHGMDELYKGSASTLVHNGTSARATTTPASKSTPFSIPSHHSDTPTTLASHSTKTDASSTHHSSVPPLTSSNHSTSPQLSTGVSFFFLSFHISNLQFNSSLEDPSTDYYQELQRDISEMFLQIYKQGGFLGLSNIKFRPGSVVVQLTLAFREGTINVHDVETQFNQYKTEAASRYNLTISDVSVSDVPFPFSAQSGAGVPGWGIALLVLVCVLVALAIVYLIALAVCQCRRK*(SEQ ID NO:47)
14.PPASTSAPG_80(Syn3_80)
Muc1_Syn1_40_mOxGFP_dCT_BlpI
MTPGTQSPFFLLLLLTVLTVVTGSGHASSTPGGEKETSATQRSSVPSSTEKNADYKDDDDLYMDMVAVSMTSSVLSSHSPGSGSSTTQGQDVTLAPATEPASGSAATWGQDVTSVPPASTSAPGPPASTSAPGPPASTSAPGPPASTSAPGPPASTSAPGPPASTSAPGPPASTSAPGPPASTSAPGPPASTSAPGPPASTSAPGPPASTSAPGPPASTSAPGPPASTSAPGPPASTSAPGPPASTSAPGPPASTSAPGPPASTSAPGPPASTSAPGPPASTSAPGPPASTSAPGPPASTSAPGPPASTSAPGPPASTSAPGPPASTSAPGPPASTSAPGPPASTSAPGPPASTSAPGPPASTSAPGPPASTSAPGPPASTSAPGPPASTSAPGPPASTSAPGPPASTSAPGPPASTSAPGPPASTSAPGPPASTSAPGPPASTSAPGPPASTSAPGPPASTSAPGPPASTSAPGPPASTSAPGPPASTSAPGPPASTSAPGPPASTSAPGPPASTSAPGPPASTSAPGPPASTSAPGPPASTSAPGPPASTSAPGPPASTSAPGPPASTSAPGPPASTSAPGPPASTSAPGPPASTSAPGPPASTSAPGPPASTSAPGPPASTSAPGPPASTSAPGPPASTSAPGPPASTSAPGPPASTSAPGPPASTSAPGPPASTSAPGPPASTSAPGPPASTSAPGPPASTSAPGPPASTSAPGPPASTSAPGPPASTSAPGPPASTSAPGPPASTSAPGPPASTSAPGPPASTSAPGPPASTSAPGPPASTSAPGPPASTSAPGPPASTSAPGPPASTSAPGPPASTSAPGPPASTSAPGASGSASGSAMVSKGEELFTGVVPILVELDGDVNGHKFSVRGEGEGDATNGKLTLKFISTTGKLPVPWPTLVTTLTYGVQSFSRYPDHMKRHDFFKSAMPEGYVQERTISFKDDGTYKTRAEVKFEGDTLVNRIELKGIDFKEDGNILGHKLEYNFNSHNVYITADKQKNGIKANFKIRHNVEDGSVQLADHYQQNTPIGDGPVLLPDNHYLSTQSKLSKDPNEKRDHMVLLEFVTAAGITHGMDELYKGSASTLVHNGTSARATTTPASKSTPFSIPSHHSDTPTTLASHSTKTDASSTHHSSVPPLTSSNHSTSPQLSTGVSFFFLSFHISNLQFNSSLEDPSTDYYQELQRDISEMFLQIYKQGGFLGLSNIKFRPGSVVVQLTLAFREGTINVHDVETQFNQYKTEAASRYNLTISDVSVSDVPFPFSAQSGAGVPGWGIALLVLVCVLVALAIVYLIALAVCQCRRK(SEQ ID NO:48)
第I部分中使用的构建体的列表
膜缔合粘蛋白
52.pcDNA3.1+_Muc1_0_TM21
53.pcDNA3.1+_Muc1_10_TM21
54.pcDNA3.1+_Muc1_21_TM21
55.pcDNA3.1+_Muc1_42_TM21
56.pcDNA3.1+_Muc1_21S_TM21
57.pcDNA3.1+_Muc1_21D_TM21
58.pcDNA3.1+_Muc1_21T_TM21
59.pcDNA3.1+_Muc1_10_TM21_CT
60.pcDNA3.1+_Muc1_10_TM21_CQC
61.pcDNA3.1+_Muc1_10_dCT
62.pcDNA3.1+_Muc1_10_FL
63.pcDNA3.1+_Muc1_Syn4_20_TM21
64.pcDNA3.1+_Muc1_Syn1_40_TM21
65.pcDNA3.1+_Muc1_Syn2_40_TM21
66.pcDNA3.1+_Muc1_Syn3_40_TM21
67.pcDNA3.1+_Muc1_Syn1_80_TM21
68.pcDNA3.1+_Muc1_Syn2_80_TM21
69.pcDNA3.1+_Muc1_Syn3_80_TM21
70.pPB_Tet_Muc1_TM21_IRES2_copGFP_rtTAsM2_IRES_NeoR
71.pPB_Tet_Muc1_42_TM21_IRES2_copGFP_rtTAsM2_IRES_NeoR
72.pPB_Tet_Muc1_21_TM21_IRES2_copGFP_rtTAsM2_IRES_NeoR
73.pPB_Tet_Muc1_10_TM21_IRES2_copGFP_rtTAsM2_IRES_NeoR
74.pPB_Tet_Muc1_0_TM21_IRES2_copGFP_rtTAsM2_IRES_NeoR
75.pPB_Tet_Muc1_21D_TM21_IRES2_copGFP_rtTAsM2_IRES_NeoR
76.pPB_Tet_Muc1_21T_TM21_IRES2_copGFP_rtTAsM2_IRES_NeoR
77.pLV_puro_teton_Muc1_42_dCT
78.pLV_puro_teton_Muc1_dCT
79.pPB_Muc1_mOxGFP_dCT_BlpI
80.pPB_Muc1_42_mOxGFP_dCT_BlpI
81.pPB_Muc1_21_mOxGFP_dCT_BlpI
82.pPB_Muc1_10_mOxGFP_dCT_BlpI
83.pPB_Muc1_0_mOxGFP_dCT_BlpI
84.pPB_Muc1_21S_mOxGFP_dCT_BlpI
85.pPB_Muc1_21D_mOxGFP_dCT_BlpI
86.pPB_Muc1_21T_mOxGFP_dCT_BlpI
87.pPB_Muc1_Syn4_20_mOxGFP_dCT_BlpI
88.pPB_Muc1_Syn1_40_mOxGFP_dCT_BlpI
89.pPB_Muc1_Syn2_40_mOxGFP_dCT_BlpI
90.pPB_Muc1_Syn3_40_mOxGFP_dCT_BlpI
91.pPB_Muc1_Syn1_80_mOxGFP_dCT_BlpI
92.pPB_Muc1_Syn2_80_mOxGFP_dCT_BlpI
分泌型粘蛋白
93.pPB_Tet_SumoStar_Muc1_42_rtTAsM2_IRES_NeoR
94.pPB_Tet_SumoStar_Muc1_21T_rtTAsM2_IRES_NeoR
95.pPB_Tet_SumoStar_Muc1_21D_rtTAsM2_IRES_NeoR
96.pPB_Tet_SumoStar_Muc1_21S_rtTAsM2_IRES_NeoR
97.pPB_Tet_SumoStar_Muc1_21_rtTAsM2_IRES_NeoR
98.pPB_Tet_SumoStar_Muc1_0_rtTAsM2_IRES_NeoR
99.pPB_Tet_SumoStar_Muc1_Syn1_40_rtTAsM2_IRES_NeoR
100.pPB_Tet_SumoStar_Muc1_Syn2_40_rtTAsM2_IRES_NeoR
101.pPB_Tet_SumoStar_Muc1_Syn3_40_rtTAsM2_IRES_NeoR
102.pPB_Tet_SumoStar_Muc1_Syn1_80_rtTAsM2_IRES_NeoR
103.pPB_Tet_SumoStar_Muc1_Syn2_80_rtTAsM2_IRES_NeoR
第I部分中引用的参考文献-本公开的任何部分中列出的参考文献并非指示其中任何参考文献对于专利性是重要的。
参考文献
(1)Brockhausen,I.;Schachter,H.;Stanley,P.《O-GalNAc聚糖(O-GalNAcGlycans)》.在《糖生物学基础(Essentials of Glycobiology)》中;Varki,A.,Cummings,R.D.,Esko,J.D.,Freeze,H.H.,Stanley,P.,Bertozzi,C.R.,Hart,G.W.,Etzler,M.E.编;冷泉港实验室出版社(Cold Spring Harbor Laboratory Press):冷泉港(Cold SpringHarbor)(纽约州(NY)),2009.
(2)Lichtenberger,L.M.《胃肠粘液的疏水屏障特性(The Hydrophobic BarrierProperties of Gastrointestinal Mucus)》.《生理学年度评论(Annu.Rev.Physiol.)》1995,57(1),565-583.//doi.org/10.1146/annurev.ph.57.030195.003025.
(3)Hudak,J.E.;Canham,S.M.;Bertozzi,C.R.《糖萼工程化揭示基于Siglec的NK细胞免疫逃避机制(Glycocalyx Engineering Reveals a Siglec-Based Mechanism forNK Cell Immunoevasion)》.《自然·化学生物学(Nature Chemical Biology)》2014,10(1),69-75.//doi.org/10.1038/nchembio.1388.
(4)Paszek,M.J.;DuFort,C.C.;Rossier,O.;Bainer,R.;Mouw,J.K.;Godula,K.;Hudak,J.E.;Lakins,J.N.;Wijekoon,A.C.;Cassereau,L.等人《癌症糖萼机械启动整合素介导的生长和存活(The Cancer Glycocalyx Mechanically Primes Integrin-MediatedGrowth and Survival)》.《自然(Nature)》2014,511(7509),319-325.//doi.org/10.1038/nature13535.
(5)Polefka,T.G.;Garrick,R.A.;Redwood,W.R.;Swislocki,N.I.;Chinard,F.P.《Novikoff细胞表面附近溶质排除的体积(Solute-Excluded Volumes near the NovikoffCell Surface)》.《美国生理学杂志-细胞生理学(American Journal of Physiology-CellPhysiology)》1984,247(5),C350-C356.//doi.org/10.1152/ajpcell.1984.247.5.C350.
(6)Kramer,J.R.;Onoa,B.;Bustamante,C.;Bertozzi,C.R.《活细胞上组装的化学可调粘蛋白嵌合体(Chemically Tunable Mucin Chimeras Assembled on LivingCells)》.《美国国家科学院院刊(PNAS)》2015,112(41),12574-12579.//doi.org/10.1073/pnas.1516127112.
(7)Coltart,D.M.;Royyuru,A.K.;Williams,L.J.;Glunz,P.W.;Sames,D.;Kuduk,S.D.;Schwarz,J.B.;Chen,X.-T.;Danishefsky,S.J.;Live,D.H.《粘蛋白架构的原理:对带有簇聚单糖、二糖、三糖和六糖糖结构域的合成糖肽的结构研究(Principles of MucinArchitecture:Structural Studies on Synthetic Glycopeptides Bearing ClusteredMono-,Di-,Tri-,and Hexasaccharide Glycodomains)》.《美国化学会杂志(J.Am.Chem.Soc.)》2002,124(33),9833-9844.//doi.org/10.1021/ja020208f.
(8)Dennis,J.W.;Granovsky,M.;Warren,C.E.《发育和疾病中的蛋白质糖基化(Protein Glycosylation in Development and Disease)》.《生物分析(BioEssays)》1999,21(5),412-421.//doi.org/10.1002/(SICI)1521-1878(199905)21:5<412::AID-BIES8>3.0.CO;2-5.
(9)Reis,C.A.;Osorio,H.;Silva,L.;Gomes,C.;David,L.《作为癌症检测的生物标志物的糖基化改变(Alterations in Glycosylation as Biomarkers for CancerDetection)》.《临床病理学杂志(Journal of Clinical Pathology)》2010,63(4),322-329.//doi.org/10.1136/jcp.2009.071035.
(10)Steentoft,C.;Vakhrushev,S.Y.;Vester-Christensen,M.B.;Schjoldager,K.T.-B.G.;Kong,Y.;Bennett,E.P.;Mandel,U.;Wandall,H.;Levery,S.B.;Clausen,H.《使用锌指核酸酶-糖工程化SimpleCell细胞系挖掘O-糖组(Mining the O-GlycoproteomeUsing Zinc-Finger Nuclease-Glycoengineered SimpleCell Lines)》.《自然·方法(Nature Methods)》2011,8(11),977-982.//doi.org/10.1038/nmeth.1731.
(11)Julien,S.;Adriaenssens,E.;Ottenberg,K.;Furlan,A.;Courtand,G.;Vercoutter-Edouart,A.-S.;Hanisch,F.-G.;Delannoy,P.;Le Bourhis,X.《MDA-MB-231乳腺癌细胞中的ST6GalNAc I表达极大修饰其O-糖基化模式并且增强其肿瘤发生能力(ST6GalNAc I Expression in MDA-MB-231Breast Cancer Cells Greatly ModifiesTheir O-Glycosylation Pattern and Enhances Their Tumourigenicity)》.《糖生物学(Glycobiology)》2006,16(1),54-64.//doi.org/10.1093/glycob/cwj033.
(12)Pérez-Garay,M.;Arteta,B.;Pagès,L.;Llorens,R.de;Bolòs,C.de;Vidal-Vanaclocha,F.;Peracaula,R.《Α2,3-唾液酸转移酶ST3Gal III体外调节胰腺癌细胞运动性和粘附性并且体内增强其转移潜能(Α2,3-Sialyltransferase ST3Gal III ModulatesPancreatic Cancer Cell Motility and Adhesion In Vitro and Enhances ItsMetastatic Potential In Vivo)》.《公共科学图书馆·综合(PLOS ONE)》2010,5(9),e12524.//doi.org/10.1371/journal.pone.0012524.
(13)Parthasarathy,R.;Rabuka,D.;Bertozzi,C.R.;Groves,J.T.《膜锚定粘蛋白糖蛋白模拟物的分子取向(Molecular Orientation of Membrane-Anchored MucinGlycoprotein Mimics)》.《物理化学杂志B(J.Phys.Chem.B)》2007,111(42),12133-12135.//doi.org/10.1021/jp072136q.
(14)Rabuka,D.;Forstner,M.B.;Groves,J.T.;Bertozzi,C.R.《非共价细胞表面工程化:将生物活性合成糖聚合物并入到细胞膜中(Noncovalent Cell SurfaceEngineering:Incorporation of Bioactive Synthetic Glycopolymers into CellularMembranes)》.《美国化学会杂志》2008,130(18),5947-5953.//doi.org/10.1021/ja710644g.
(15)Woods,E.C.;Yee,N.A.;Shen,J.;Bertozzi,C.R.《用增加体内细胞存活的再循环糖聚合物进行糖萼工程化(Glycocalyx Engineering with a RecyclingGlycopolymer That Increases Cell Survival In Vivo)》.《应用化学国际版(Angewandte Chemie International Edition)》2015,54(52),15782-15788.//doi.org/10.1002/anie.201508783.
(16)Brakenhoff,R.H.;Schoenmakers,J.G.;Lubsen,N.H.《嵌合CDNA克隆:新颖PCR制品(Chimeric CDNA Clones:A Novel PCR Artifact)》.《核酸研究》1991,19(8),1949.
(17)Meyerhans,A.;Vartanian,J.-P.;Wain-Hobson,S.《PCR期间的DNA重组(DNARecombination during PCR)》.《核酸研究》1990,18(7),1687-1691.//doi.org/10.1093/nar/18.7.1687.
(18)Tang,N.C.;Chilkoti,A.《组合密码子加扰实现重复蛋白质的可缩放基因合成和扩增(Combinatorial Codon Scrambling Enables Scalable Gene Synthesis andAmplification of Repetitive Proteins)》.《自然·材料(Nat Mater)》2016,15(4),419-424.//doi.org/10.1038/nmat4521.
(19)Ferrari,F.A.;Cappello,J.《蛋白质聚合物的生物合成(Biosynthesis ofProtein Polymers)》.在《基于蛋白质的材料(Protein-Based Materials)》中;《材料的生物工程化(Bioengineering of Materials)》;
Figure BDA0003263651390000671
波士顿(Boston).,1997;第37-60页.//doi.org/10.1007/978-1-4612-4094-5_2.
(20)Yoshida,A.;Suzuki,M.;Ikenaga,H.;Takeuchi,M.《高水平粘蛋白型O-糖基化的最短序列基序的发现(Discovery of the Shortest Sequence Motif for HighLevel Mucin-Type O-Glycosylation)》.《生物化学杂志(J.Biol.Chem.)》1997,272(27),16884-16888.//doi.org/10.1074/jbc.272.27.16884.
(21)Pei-Xiang,X.;Prenzoska,J.;Mckenzie,I.F.C.《抗乳腺和抗卵巢粘蛋白单克隆抗体的表位作图(Epitope Mapping of Anti-Breast and Anti-Ovarian MucinMonoclonal Antibodies)》.《分子免疫学(Molecular Immunology)》1992,29(5),641-650.//doi.org/10.1016/0161-5890(92)90201-8.
(22)Zeng,Y.;Ramya,T.N.C.;Dirksen,A.;Dawson,P.E.;Paulson,J.C.《活细胞上唾液酸化糖蛋白的高效标记(High-Efficiency Labeling of Sialylated Glycoproteinson Living Cells)》.《自然·方法》2009,6(3),207-209.//doi.org/10.1038/nmeth.1305.
(23)Wang,Y.;Ju,T.;Ding,X.;Xia,B.;Wang,W.;Xia,L.;He,M.;Cummings,R.D.《Cosmc是正确蛋白质O-糖基化必需的伴侣蛋白(Cosmc Is an Essential Chaperone forCorrect Protein O-Glycosylation)》.《美国国家科学院院刊(Proc.Natl.Acad.Sci.U.S.A.)》2010,107(20),9228-9233.//doi.org/10.1073/pnas.0914004107.
(24)Bzymek,M.;Lovett,S.T.《重复DNA序列的不稳定性:复制在多个机制中的作用(Instability of Repetitive DNASequences:The Role of Replication in MultipleMechanisms)》.《美国国家科学院院刊》2001,98(15),8319-8325.//doi.org/10.1073/pnas.111008398.
(25)Swallow,D.M.;Gendler,S.;Griffiths,B.;Corney,G.;Taylor-Papadimitriou,J.;Bramwell,M.E.《人肿瘤相关上皮粘蛋白由表达的高变基因座PUM编码(The Human Tumour-Associated Epithelial Mucins Are Coded by an ExpressedHypervariable Gene Locus PUM)》.《自然》1987,328(6125),82-84.//doi.org/10.1038/328082a0.
(26)Carvalho,F.;Seruca,R.;David,L.;Amorim,A.;Seixas,M.;Bennett,E.;Clausen,H.;Sobrinho-Simoes,M.《MUC1基因多态性和胃癌-流行病学研究(MUC1 GenePolymorphism and Gastric Cancer-an Epidemiological Study)》.《糖缀合物杂志(Glycoconj J)》1997,14(1),107-111.//doi.org/10.1023/A:1018573201347.
(27)Shurer,C.R.;Colville,M.J.;Gupta,V.K.;Head,S.E.;Kai,F.;Lakins,J.N.;Paszek,M.J.《糖萼工程化的遗传编码工具箱:对细胞粘附、存活和癌细胞行为的可调控制(Genetically Encoded Toolbox for Glycocalyx Engineering:Tunable Controlof Cell Adhesion,Survival,and Cancer Cell Behaviors)》.《ACS生物材料科学与工程(ACS Biomater.Sci.Eng.)》2017.//doi.org/10.1021/acsbiomaterials.7b00037.
(28)探索活细胞的O-聚糖的细胞O-糖组报告子/扩增(Cellular O-GlycomeReporter/Amplification to explore O-glycans of living cells)|自然·方法//www.nature.com/articles/nmeth.3675(2019年6月1日访问).
(29)Litvinov,S.V.;Hilkens,J.《上皮唾液粘蛋白上皮唾蛋白在再循环期间唾液酸化(The Epithelial Sialomucin,Episialin,Is Sialylated during Recycling)》.《生物化学杂志》1993,268(28),21364-21371.
(30)Kinlough,C.L.;McMahan,R.J.;Poland,P.A.;Bruns,J.B.;Harkleroad,K.L.;Stremple,R.J.;Kashlan,O.B.;Weixel,K.M.;Weisz,O.A.;Hughey,R.P.《MUC1的再循环依赖于其棕榈酰化(Recycling of MUC1 Is Dependent on Its Palmitoylation)》.《生物化学杂志》2006,281(17),12112-12122.//doi.org/10.1074/jbc.M512996200.
(31)Mercanti,V.;Marchetti,A.;Lelong,E.;Perez,F.;Orci,L.;Cosson,P.《跨膜结构域控制膜蛋白从网格蛋白涂布的凹坑排除(Transmembrane Domains ControlExclusion of Membrane Proteins from Clathrin-Coated Pits)》.《细胞科学杂志(JCell Sci)》2010,123(19),3329-3335.//doi.org/10.1242/jcs.073031.
(32)Kinlough,C.L.;Poland,P.A.;Bruns,J.B.;Harkleroad,K.L.;Hughey,R.P.《MUC1膜运输由多种相互作用调节(MUC1 Membrane Trafficking Is Modulated byMultiple Interactions)》.《生物化学杂志》2004,279(51),53071-53077.//doi.org/10.1074/jbc.M409360200.
(33)Geisler,C.;Jarvis,D.L.《致信糖论坛:用朝鲜槐凝集素进行有效糖分析需要对其结合特异性的清楚理解(Letter to the Glyco-Forum:Effective Glycoanalysiswith Maackia Amurensis Lectins Requires a Clear Understanding of TheirBinding Specificities)》.《糖生物学》2011,21(8),988-993.//doi.org/10.1093/glycob/cwr080.
(34)Brockhausen,I.;Yang,J.-M.;Burchell,J.;Whitehouse,C.;Taylor-Papadimitriou,J.《乳腺癌细胞中MUC1粘蛋白的异常糖基化的潜在机制(MechanismsUnderlying Aberrant Glycosylation of MUC1 Mucin in Breast Cancer Cells)》.《欧洲生物化学杂志(European Journal of Biochemistry)》1995,233(2),607-617.//doi.org/10.1111/j.1432-1033.1995.607_2.x.
(35)Gerken,T.A.;Gilmore,M.;Zhang,J.《与猪颌下粘蛋白串联重复连接的O-聚糖的位点特异性寡糖分布的确定,O-聚糖侧链结构由肽序列调节的进一步证据(Determination of the Site-Specific Oligosaccharide Distribution of the O-Glycans Attached to the Porcine Submaxillary Mucin Tandem Repeat FURTHEREVIDENCE FOR THE MODULATION OF O-GLYCAN SIDE CHAIN STRUCTURES BY PEPTIDESEQUENCE)》.《生物化学杂志》2002,277(10),7736-7751.//doi.org/10.1074/jbc.M111690200.
(36)Gerken,T.A.《动力学建模证实粘蛋白核心1(β-Gal(1-3)α-GalNAc-O-Ser/Thr)O-聚糖结构的生物合成由邻近糖基化效应调节(Kinetic Modeling Confirms theBiosynthesis of Mucin Core 1(β-Gal(1-3)α-GalNAc-O-Ser/Thr)O-Glycan StructuresAre Modulated by Neighboring Glycosylation Effects)》.《生物化学(Biochemistry)》2004,43(14),4137-4142.//doi.org/10.1021/bi036306a.
(37)Clausen,H.;Bennett,E.P.《UDP-GalNAc家族:多肽N-乙酰基半乳糖胺基转移酶控制粘蛋白型O-连接糖基化的起始(AFamily of UDP-GalNAc:Polypeptide N-Acetylgalactosaminyl-Transferases Control the Initiation of Mucin-Type O-Linked Glycosylation)》.《糖生物学》1996,6(6),635-646.//doi.org/10.1093/glycob/6.6.635.
(38)Granovsky,M.;Bielfeldt,T.;Peters,S.;Paulsen,H.;Meldal,M.;Brockhausen,J.;Brockhausen,I.《合成O-聚糖核心1的UDP半乳糖:糖蛋白-N-乙酰基-d-半乳糖胺3-β-d-半乳糖基转移酶活性受糖肽底物的氨基酸序列和糖基化控制(UDPgalactose:Glycoprotein-N-Acetyl-d-Galactosamine 3-β-d-Galactosyltransferase Activity Synthesizing O-Glycan Core 1Is Controlled bythe Amino Acid Sequence and Glycosylation of Glycopeptide Substrates)》.《欧洲生物化学杂志》1994,221(3),1039-1046.//doi.org/10.1111/j.1432-1033.1994.tb18822.x.
(39)Brockhausen,I.;Dowler,T.;Paulsen,H.《定点处理:受体糖肽的氨基酸序列和糖基化延伸粘蛋白型O-聚糖核心2的组装中的作用(Site Directed Processing:Roleof Amino Acid Sequences and Glycosylation of Acceptor Glycopeptides in theAssembly of Extended Mucin Type O-Glycan Core 2)》.《生物化学与生物物理学报(BBA)-一般主题(Biochimica et Biophysica Acta(BBA)-General Subjects)》2009,1790(10),1244-1257.//doi.org/10.1016/j.bbagen.2009.05.020.
(40)Huang,K.M.;Snider,M.D.《糖蛋白再循环到高尔基复合体的半乳糖基转移酶隔室(Glycoprotein Recycling to the Galactosyltransferase Compartment of theGolgi Complex)》.《生物化学杂志》1993,268(13),9302-9310.
(41)Engelmann,K.;Kinlough,C.L.;Müller,S.;Razawi,H.;Baldus,S.E.;Hughey,R.P.;Hanisch,F.-G.《跨膜和分泌MUC1探针显示O-聚糖核心概况中的运输依赖性变化(Transmembrane and Secreted MUC1 Probes Show Trafficking-DependentChanges in O-Glycan Core Profiles)》.《糖生物学》2005,15(11),1111-1124.//doi.org/10.1093/glycob/cwi099.
(42)Elhammer,A.P.;Poorman,R.A.;Brown,E.;Maggiora,L.L.;Hoogerheide,J.G.;Kézdy,F.J.《从体内底物数据库和体外蛋白质和肽糖基化推断的UDP-GalNAc:多肽N-乙酰基氨基半乳糖转移酶的特异性(The Specificity of UDP-GalNAc:Polypeptide N-Acetylgalactosaminyltransferase as Inferred from a Database of in VivoSubstrates and from the in Vitro Glycosylation of Proteins and Peptides)》.《生物化学杂志》1993,268(14),10029-10038.
(43)Hema Thanka Christlet,T.;Veluraja,K.《蛋白质中O-糖基化位点的数据库分析(Database Analysis of O-Glycosylation Sites in Proteins)》.《生物物理学杂志(Biophysical Journal)》2001,80(2),952-960.//doi.org/10.1016/S0006-3495(01)76074-2.
(44)Gerken,T.A.;Owens,C.L.;Pasumarthy,M.《猪颌下腺粘蛋白串联重复的位点特异性核心1O-糖基化模式,聚糖长度由肽序列调节的证据(Site-Specific Core 1O-Glycosylation Pattern of the Porcine Submaxillary Gland Mucin Tandem RepeatEVIDENCE FOR THE MODULATION OF GLYCAN LENGTH BY PEPTIDE SEQUENCE)》.《生物化学杂志》1998,273(41),26580-26588.//doi.org/10.1074/jbc.273.41.26580.
(45)Sihlbom,C.;van Dijk
Figure BDA0003263651390000712
I.;Lidell,M.E.;Noll,T.;Hansson,G.C.;
Figure BDA0003263651390000711
M.《使用电子捕获解离片段化质谱法定位MUC1糖蛋白中的O-聚糖(Localization of O-Glycans in MUC1 Glycoproteins Using Electron-CaptureDissociation Fragmentation Mass Spectrometry)》.《糖生物学》2009,19(4),375-381.//doi.org/10.1093/glycob/cwn144.
(46)Nicholls,J.M.;Bourne,A.J.;Chen,H.;Guan,Y.;Peiris,J.M.《人呼吸道的唾液酸受体检测:人和禽流感病毒的潜在结合位点广泛分布的证据(Sialic AcidReceptor Detection in the Human Respiratory Tract:Evidence for WidespreadDistribution of Potential Binding Sites for Human and Avian InfluenzaViruses)》.《呼吸研究(Respir Res)》2007,8(1),73.//doi.org/10.1186/1465-9921-8-73.
(47)Lee,M.E.;DeLoache,W.C.;Cervantes,B.;Dueber,J.E.《用于模块化、多部分组装的高度表征酵母工具包(A Highly Characterized Yeast Toolkit for Modular,Multipart Assembly)》.《ACS合成生物学(ACS Synth.Biol.)》2015,4(9),975-986.//doi.org/10.1021/sb500366v.
(48)Paszek,M.J.;DuFort,C.C.;Rubashkin,M.G.;Davidson,M.W.;Thorn,K.S.;Liphardt,J.T.;Weaver,V.M.《扫描角干涉显微法以纳米尺度展现细胞动力学(ScanningAngle Interference Microscopy Reveals Cell Dynamics at the Nanoscale)》.《自然·方法》2012,9(8),825-827.//doi.org/10.1038/nmeth.2077.
(49)Subedi,G.P.;Johnson,R.W.;Moniz,H.A.;Moremen,K.W.;Barb,A.《利用悬浮液中HEK293细胞的瞬时转染的重组人蛋白质的高产率表达(High Yield Expression ofRecombinant Human Proteins with the Transient Transfection of HEK293 Cells inSuspension)》.《可视化实验杂志(J Vis Exp)》2015,第106期.//doi.org/10.3791/53568.
(50)Shurer,C.R.;Kuo,J.C.-H.;Roberts,L.M.;Gandhi,J.G.;Colville,M.J.;Enoki,T.A.;Pan,H.;Su,J.;Noble,J.M.;Hollander,M.J.;等人《膜形状由糖萼调节的物理原理(Physical Principles of Membrane Shape Regulation by the Glycocalyx)》.《细胞(Cell)》2019,177(7),1757-1770.e21.//doi.org/10.1016/j.cell.2019.04.017.
(51)Schindelin,J.;Arganda-Carreras,I.;Frise,E.;Kaynig,V.;Longair,M.;Pietzsch,T.;Preibisch,S.;Rueden,C.;Saalfeld,S.;Schmid,B.;等人《Fiji:生物图像分析的开源平台(Fiji:An Open-Source Platform for Biological-Image Analysis)》.《自然·方法》2012,9(7),676-682.//doi.org/10.1038/nmeth.2019.
(52)Schneider,C.A.;Rasband,W.S.;Eliceiri,K.W.NIH Image到ImageJ:图像分析的25年(NIH Image to ImageJ:25years of image analysis)//www.nature.com/articles/nmeth.2089(2018年10月31日访问).//doi.org/10.1038/nmeth.2089.
(53)Reichner,J.S.;Whiteheart,S.W.;Hart,G.W.《细胞表面唾液酸糖缀合物的细胞内运输(Intracellular Trafficking of Cell Surface Sialoglycoconjugates)》.《生物化学杂志》1988,263(31),16316-16326.
(54)Fukuda,M.《用于从糖蛋白和糖肽释放O-GalNAc连接寡糖的β-消除(Beta-Elimination for Release of O-GalNAc-Linked Oligosaccharides fromGlycoproteins and Glycopeptides)》.《分子生物学当前方案(Curr Protoc Mol Biol)》2001,第17章,单元17.15B.//doi.org/10.1002/0471142727.mb1715bs31.
(55)Shajahan,A.;Heiss,C.;Ishihara,M.;Azadi,P.《糖蛋白的糖组和糖蛋白组分析教程(Glycomic and Glycoproteomic Analysis of Glycoproteins-a Tutorial)》.《分析化学和生物分析化学(Anal Bioanal Chem)》2017,409(19),4483-4505.//doi.org/10.1007/s00216-017-0406-7.
第II部分
本公开的此第II部分说明用于保护和减少细胞产生系统聚集的粘蛋白涂布技术。
与此第II部分有关,需要优化宿主细胞产生系统,提高产率和产生可靠性,以便满足对具有复杂翻译后修饰的生物制剂不断增加的需求。在本公开之前,悬浮适应的哺乳动物细胞的聚集仍为可能限制生物反应器的细胞密度和单位体积产量的显著问题。此第II部分提供引导细胞表面上抗粘附和保护性涂层的合成的遗传编码技术。我们通过将工程化粘蛋白结构域与合成跨膜锚融合来遗传编码新细胞表面涂层。与适当表达系统组合,粘蛋白涂布技术引导厚的高度水合屏障组装,强有力地减少细胞聚集并且保护悬浮细胞免于流体剪切应力。涂布技术在悬浮适应的人293-F细胞上展现,所述细胞即使在原本将诱导极端细胞聚集的培养基制剂中也抵抗结块,并且显示优于市售抗结块剂的改良性能。稳定生物聚合物涂层不显示对细胞增殖速率、cDNA瞬时转染效率或重组蛋白表达的有害影响。总体来说,本文所描述的粘蛋白涂布技术和工程化细胞系展现改良生物反应器中悬浮细胞的单细胞生长和活力的能力。
此第II部分以及本公开的其它部分涉及所属领域中称为粘蛋白的生物聚合物,其用于减少生物界面处的粘附和污染。粘蛋白的特征在于富含丝氨酸和苏氨酸残基的氨基酸序列,其经O-连接侧接聚糖结构翻译后修饰(Thornton,Rousseau和McGuckin,2008)。粘蛋白的瓶刷分子结构赋予抗粘附特征,其被生物系统用于多种目的,包括防污涂层、润滑和细胞相互作用调节(Jay和Waller,2014;Kuo,Gandhi,Zia和Paszek,2018;Paszek等人,2014)。在粘蛋白家族成员中,粘蛋白-1(Muc1)被认为是可干扰整合素和钙粘蛋白介导的细胞相互作用的抗粘附蛋白(Klinken,Dekker,Buller和Einerhand,1995;Wesseling,Valk和Hilkens,1996;Wesseling,van der Valk,Vos,Sonnenberg和Hilkens,1995)。Mucl的抗粘附特性由其大胞外结构域赋予,在运输到细胞表面的过程中所述胞外结构域是高度O-糖基化的。聚糖的中性和阴离子性糖残基可与水配位,在细胞表面上形成高度水合屏障(Gendler和Spicer,1995)。
在此第II部分中,描述新颖粘蛋白cDNA和其编码的粘蛋白,并且使用其来建立减少人细胞宿主产生系统的聚集的遗传编码技术。特定来说,本发明描述的粘蛋白技术经改良、测试和改进,以用作例如宿主细胞产生系统上的抗粘附涂层。作为非限制性演示,我们开发具有稳定抗粘附涂层的新293-F细胞系,并评估其在增殖速率、细胞聚集、抗剪切应力和质粒DNA转染效率方面的性能。
材料和方法
抗体和试剂
使用以下抗体:人CD227(555925,BD生物科学)(Muc1)、β-肌动蛋白(sc-4778,圣克鲁兹)、山羊抗小鼠IgG-HRP(sc-2005,圣克鲁兹)。使用的凝集素为:生物素化花生凝集素(PNA;B-1075,Vector Laboratories)、CF568 PNA(29061,Biotium)、CF640R PNA(29063,Biotium)、CF633麦胚凝集素(WGA;29024,Biotium)。使用ExtrAvidin-过氧化物酶(E2886,西格玛)检测生物素化凝集素。为了诱导反式激活子细胞系,使用多西环素(sc-204734,圣克鲁兹)。对于庆大霉素选择,使用G418(10131035,赛默飞世尔)。
构建体
具有整合共表达反向四环素反式激活子基因的四环素诱导型、基于转座子的Piggybac表达载体(pPB tet rtTANeoR)用于稳定株系产生。通过插入脑心肌炎病毒内部核糖体进入位点(IRES),接着在NotI和XbaI位点插入荧光蛋白copGFP,来修饰pPB tet rtTANeoR质粒(pPB tet IRES GFP rtTA NeoR)。含有氨基酸序列PDTRPAPGSTAPPAHGVTSA(SEQID NO:8)的21或42个串联重复(TR)的合成cDNA用密码子加扰器(Tang和Chilkoti,2016)进行密码子优化,通过定制基因合成(General Biosystems)产生,并且使用BamHI和Bsu36I限制位点克隆来代替(Paszek等人,2014;Shurer等人,2017)中先前描述的pcDNA3.1 Muc1TM21中的天然串联重复。然后使用BamHI和EcoRI位点将含有工程化21或42个串联重复的Muc1基因克隆到pPB tet IRES GFP rtTA NeoR质粒中,以产生分别用于制造粘蛋白-270和粘蛋白-135生物聚合物细胞系的Muc1 42TR TM21 pPB tet IRES GFP rtTA NeoR和Muc121TR TM21 pPB tet IRES GFP rtTA NeoR质粒。为了产生粘蛋白-0细胞系,通过用5'-TGGAGGAGCCTCAGGCATACTTTATTG-3'(SEQ ID NO:14)正向)和5'-CCACCGCCGACCGAGGTGACATCCTG-3'(SEQ ID NO:15)反向)引物进行Q5定点诱变,从pcDNA3.1Muc1 TM21缺失天然Muc1串联重复。然后从pcDNA3.1 Muc1 0TR TM21切割具有0TR的Muc1基因,并且将其通过BamHI和EcoRI位点克隆到pPB tet IRES GFP rtTA NeoR质粒中。质粒pLVpuro mRuby2用于利用细胞质红色荧光蛋白(RFP)进行的瞬时转染实验。对于分泌型RFP实验,使用SS-mScarlet-I pPB tet IRES GFP rtTANeoR质粒。为了构建此质粒,使用BamHI-HF和EcoRI-HF将骨架线性化。从Integrated DNA Technologies订购编码通过接头(四个甘氨酸后接丝氨酸)与mScarlet-I融合的Muc1信号序列(MTPGTQSPFFLLLLLTVLTVVTGS(SEQ IDNO:26))的dsDNA寡核苷酸。此片段通过NEB HiFi组装插入到线性化骨架中。
细胞系和培养
FreeStyle 293-F细胞获自赛默飞世尔科技。根据制造商指南,在Eppendorf NewBrunswick s41i培育箱中锥形烧瓶中培养并维持细胞。将细胞在FreeStyle 293表达培养基(赛默)中在120rpm、37℃和8%CO2下维持在0.5×106与3×106个细胞/毫升之间。如先前报道(Durocher等人,2002),使用聚乙烯亚胺(PEI)进行转染。遗传编码稳定细胞系通过将上文所描述的pPB tet IRES GFP rtTA NeoR质粒与高度活性转座酶质粒(Shurer等人,2017)共转染来产生,并且随后用750μg/mL庆大霉素选择两周。通过在血细胞计数器上用台盼蓝排除进行细胞计数来定量细胞增殖。
共聚焦显微法
收集样品,在200rcf下沉淀5分钟,并且在室温下在4%多聚甲醛中固定10分钟。用PBS洗涤样品三次。在室温下,在PBS中用针对O-聚糖的1:1000 CF568 PNA和针对细胞膜的1:1000 CF633 WGA标记细胞30分钟。将样品用PBS洗涤三次,在63×水浸物镜的蔡司LSM800上成像。
流式细胞分析
除非另外指示,否则使用活细胞测量所有样品。从悬浮培养物中收集细胞,在200rcf下沉淀5分钟,重悬浮于0.5%BSA PBS中。将样品通过0.22μm滤帽过滤并且在BDFACS Aria Fusion上分析。对于多西环素时程,用1μg/mL多西环素诱导细胞。将来自培养物的细胞样品在指定时间点取出,在200rcf下沉淀5分钟,并且在室温下用4%多聚甲醛固定10分钟。将样品用PBS冲洗三次,并且在4℃下储存直到流式细胞分析。使用FlowJo软件进行所有流式细胞数据的分析。
免疫和凝集素印迹分析
将细胞以0.5×106个细胞/毫升接种并且生长过夜,16-18小时。然后用1μg/mL多西环素诱导生物聚合物表达,再用多西环素生长细胞48小时。48小时后,每种细胞系取出样品,在200rcf下沉淀5分钟,随后分离上清液,通过在RIPA裂解缓冲液(艾博抗(Abcam))中重悬浮来裂解细胞沉淀,涡旋样品30秒,加热到98℃持续10分钟。将裂解产物在液氮上冷冻并且在-80℃下储存。将裂解产物在Nupage 3-8%Tris-乙酸凝胶(英杰)上分离,转移到PVDF膜。将膜用3%BSA TBST封闭2小时。在3%BSATBST中,1:1000稀释一抗并将凝集素稀释到1μg/mL,4℃下在膜上孵育过夜。将二抗或ExtrAvidin在3%BSA TBST中1:2000稀释并且在室温下孵育2小时。印迹在Clarity ECL(伯乐)底物中显影,在ChemiDoc(伯乐)文件系统上成像。
经转染293F细胞中粘蛋白-270转基因的PCR扩增
为了测试293F基因组中稳定整合的粘蛋白-270cDNA的扩增或缺失,用Q5热启动高保真度DNA聚合酶(新英格兰生物实验室公司(New England Biolabs Inc.),马萨诸塞州伊普斯威奇(Ipswich,MA))使用提取的基因组DNA作为模板进行PCR扩增。用GeneJET基因组DNA纯化试剂盒(赛默科技,马萨诸塞州沃尔瑟姆(Waltham,MA))提取基因组DNA。总共60ng基因组DNA用于PCR扩增。引物:粘蛋白-270FWD 5’-ATGACACCGGGCACCCAGTC-3'(SEQ NO:85)和粘蛋白-270REV 5'-CTACATACTTCGTCGGCGCATGTAC-3'(SEQ NO:86)。扩增子的大小为2994bp。
细胞结块分析
将细胞以0.75×106个细胞/毫升接种,并且在过夜生长(16-18小时)后用1μg/mL多西环素诱导。然后在1μ/mL多西环素存在下使细胞生长到高细胞密度持续额外48或72小时。通过收集培养物的样品,充分混合以解离大结块,并且用血细胞计数器和台盼蓝排除对活细胞进行计数来定量细胞密度。对于成像,用宽口径移液管尖端吸取样品以减少大结块解离,在PBS中稀释到大约6.75×104个细胞/cm2以进行2D成像。在10×物镜的奥林巴斯(Olympus)IX81显微镜上获取相位对比图像。Fiji用于图像处理(Schindelin等人,2012)。收集两个独立样品,将其制备为技术重复来成像,每个技术重复三个关注区成像。进行三个生物重复。使用从先前出版物(Shurer等人,2017)调适的定制分析软件进行自动化图像分析。简单来说,分析软件定位每个圆形物体的中心。然后在MATLAB使用每个细胞中心的坐标来计算里普利氏K函数。通过对在19μm内不具有任何邻近细胞的细胞总数进行计数,除以图像中的细胞总数来计算单细胞的百分比。类似地,通过基于19μm内邻近细胞的数目将细胞框并成簇来计算各种簇大小中细胞的百分比。
为了评估对钙诱导的细胞聚集的抗性,将培养物以0.5×106个细胞/毫升接种,过夜生长(16-18小时)后用1μg/mL多西环素诱导。48小时后,将细胞以4×106个细胞/毫升重悬浮。然后用2mM CaCl2、1:300抗结块剂(赛默飞世尔,0010057AE)或两者补充培养基。通过将培养物转移到玻璃试管中,在24小时处理后获取细胞悬浮液的静态图像和视频。通过在使最大聚集体从悬浮液中沉淀出来20秒之后,从每个培养物收集双重复样品来确定悬浮液中的细胞浓度。使用血细胞计数器和台盼蓝测量细胞浓度。
剪切应力实验
将细胞以0.5×106个细胞/毫升接种,生长过夜(16-18小时),并且用1μg/mL多西环素诱导48小时。使用具有连接到6.5英寸1.02mm硅管的16号针头的5mL注射器,通过施加到注射器的1kg质量以重力产生的恒定力流动通过500μm收缩件(特氟龙管)来剪切细胞悬浮液。使样品通过收缩件五次。然后在4℃下用1μg/mL CF640R PNA染色细胞15分钟。用0.5%BSA PBS洗涤细胞三次,然后用乙锭同二聚体-1(死细胞染色剂,赛默飞世尔,L3224)染色。进行三个生物重复,每个生物重复具有两个技术重复。通过在BD FACS Aria Fusion上测量吸收死细胞染色剂的细胞的分率来确定死细胞百分比。无剪切的对照样品用于扣除每种细胞系的背景细胞死亡。对于粘蛋白-135和粘蛋白-270细胞系,仅考虑PNA阳性细胞进行分析。使用FlowJo软件进行数据分析。
转染实验
将细胞以0.5×106个细胞/毫升接种,生长过夜(16-18小时),并且用1μg/mL多西环素诱导48小时。然后将细胞在含有1μg/mL多西环素的新鲜培养基中稀释到2×106个细胞/毫升,用1μg DNA/106个细胞转染。次日(转染后16-18小时),用含有1μg/mL多西环素的新鲜培养基1:1稀释细胞。为了测量转染效率,用pLV puro mRuby2质粒转染细胞,并且通过流式细胞按转染后72小时表达RFP的细胞的分率计算转染效率。对于重组RFP的产生和分泌,用SS-mScarlet-I pPB tet IRES GFP rtTANeoR转染细胞。24小时后,使用帝肯(Tecan)M1000 Pro读板器定量培养基上清液中的分泌RFP荧光。
统计分析
视需要使用Prism(GraphPad)通过普通单因素方差分析或学生t检验(双尾)确定统计显著性。除在R中产生的箱线图以外,所有图在Prism(GraphPad)中产生。
结果
遗传编码的生物聚合物在293-F细胞系表面上表达
此第II部分展现编码具有用于锚定到细胞表面的跨膜结构域的Muc1样生物聚合物的cDNA的产生。生物聚合物结构域由具有PDTRPAPGSTAPPAHGVTSA(SEQ ID NO:8)的0-42个完美重复的非结构化蛋白质骨架组成,其由内质网和高尔基体的O-糖基化机制识别并且在运输到细胞表面时高度糖基化。每种生物聚合物由天然Muc1信号序列靶向到细胞外空间。生物聚合物经21个氨基酸的跨膜结构域锚定到细胞膜(Mercanti等人,2010;C.R.Shurer等人,2017)。通过用工程化的21个氨基酸的跨膜结构域替换Muc1的天然自催化结构域(Levitin等人,2005),我们降低了胞外结构域从细胞表面脱落的风险。所描述的工程化构建体还缺乏细胞质尾区以避免由粘蛋白的生物化学或物理刺激的无意转导。
293-F细胞系的遗传修饰用含有选择和四环素诱导型表达必需的所有元件的“多合一”质粒(图12A)以非病毒方式进行。载体包括用于表达生物聚合物涂层的四环素反应性启动子,和用于组成性表达反向四环素反式激活子(rtTA-M2)和新霉素抗性基因的额外盒(Gossen,Bender,Muller,al和Freundlieb,1995)。还包括双顺反子绿色荧光蛋白(GFP)报告子用于视觉确认粘蛋白cDNA的转录。生物聚合物的cDNA通过转座子介导的整合在随机位置稳定并入基因组中(X.Li等人,2013;Wilson,Coates和George,2007;Woodard和Wilson,2015)。此方法避免使用任何病毒技术,病毒技术在生物制造中引起深切安全性关注(Dumont等人,2016)。我们预测修饰的细胞将在其表面上涂布有致密诱导型粘蛋白生物聚合物层(图12B)。
我们测试了三种不同代表性生物聚合物大小对293-F细胞聚集的影响。构建具有0、21和42个串联重复的粘蛋白样基因。具有21个和42个重复的聚合物的轮廓长度分别预测为135nm和270nm。因此,我们基于生物聚合物的相对长度将生物聚合物命名为粘蛋白-0、粘蛋白-135和粘蛋白-270(图12C)。因为粘蛋白-0构建体缺乏大的糖基化生物聚合物结构域,所以其充当与生物聚合物的跨膜锚的表达相关的任何效果的对照。
我们证实了生物聚合物到细胞表面的表达和定位。荧光显微法显示由双顺反子GFP信号报告的cDNA表达,以及表达粘蛋白-135和粘蛋白-270半合成基因的细胞的膜上O-聚糖的存在(图13A)。我们观察到生物聚合物表达水平的大范围分布,其在不打算受任何特定理论限制的情况下,归因于cDNA随机转座到基因组中(图2B)。尽管分布广泛,但细胞群大部分稳定整合cDNA,如GFP报告子所示(图13A-C)。生物聚合物的表达和大小进一步通过蛋白质印迹验证(图13D)。粘蛋白-135和粘蛋白-270可用针对天然Muc1串联重复的抗体探测(图13D,左)。野生型(w.t.)细胞不具有可检测水平的内源性Muc1表达,并且不具有显著O-连接粘蛋白样糖基化(图13D)。粘蛋白-135和粘蛋白-270在表达时高度糖基化。此由蛋白质带所示,其在用抗Muc1抗体探测时在蛋白质序列分子量上方检测到(图13D,左;粘蛋白-135和粘蛋白-270的预测分子量分别为81kDa和120kDa)。O-糖基化进一步通过用特异性结合O-连接聚糖的PNA(例如Muc1上发现的)来检测生物聚合物来展现(图13D,右)。
对于我们的生物聚合物涂布的细胞系中的任一者,未观察到细胞增殖速率的显著差异(图13E)。我们推断我们的生物聚合物的额外蛋白质负载没有不利地影响亲本293-F细胞的快速生长速率。对于稳定细胞系,我们使用充分表征的反向四环素诱导型启动子(Gossen等人,1995),其在添加多西环素后启动基因转录并且在停用多西环素时中断转录。此细胞系如所预测对多西环素诱导起反应,展现对粘蛋白涂层表达的时间控制(图13F)。
据报道,高度重复cDNA(如粘蛋白)在细胞基因组中具有较高频率的扩增和缺失(Gemayel,Vinces,Legendre和Verstrepen,2010;Oren等人,2016)。我们的粘蛋白-135和粘蛋白-270构建体的cDNA经密码子优化以最小化其重复性。我们发现优化的cDNA在整合到宿主细胞基因组中时稳定。值得注意的是,在细胞培养2个月之后,未观察到稳定整合的粘蛋白-270,即我们的生物聚合物cDNA中的最大并且重复性最高者的明显扩增或缺失(图13G)。
生物聚合物涂层减少细胞聚集
在建立稳定群体之后,我们分析了生物聚合物涂层是否可减少悬浮细胞培养物中的细胞聚集。细胞系的相位对比图像定性显示与粘蛋白-135和粘蛋白-270细胞系中相比,w.t.和粘蛋白-0细胞系中有更多的细胞聚集体(图14A)。样品中单细胞的分率的定量显示,与w.t.细胞相比,粘蛋白-135和粘蛋白-270涂层的单细胞百分比增加,而粘蛋白-0细胞系与w.t.细胞相比未显示差异(图12B、图19A)。对应地,与粘蛋白-135或粘蛋白-270细胞系相比,w.t.和粘蛋白-0涂布的细胞系更有可能形成两个或更多个细胞的簇(图14C、图19B)。
检查我们的经粘蛋白-135或粘蛋白-270工程化的293-F细胞系的相位对比图像,展现大部分细胞为单联体或双联体,可检测的高阶聚集体很少(图14B)。因为不存在高阶聚集体,所以我们推断粘蛋白-135和粘蛋白-270样品中的双联体可能是主动分裂细胞或在细胞质分裂后尚未完全解离的细胞。双联体的外观还可由单细胞引起,所述单细胞从悬浮液中随机沉降出,过于接近彼此而无法在我们的显微镜上形成的图像的2D平面中分辨。为了近似可能以此方式从悬浮液中随机沉降出的单细胞的频率,我们创建随机放置的质心的模拟数据集并进行我们的簇聚分析。平均起来,模拟质心在66%时间算作为单联体。相比而言,57%粘蛋白-270细胞为单联体(图14B)。
为了定量细胞簇聚的程度,我们使用普利氏K函数,一种对在任何给定粒子的给定距离内发现邻近粒子的频率进行计数的空间分布统计,分析了图像中细胞的空间分布。使用此统计工具,我们观察到与w.t.和粘蛋白-0细胞系相比,粘蛋白-135和粘蛋白-270生物聚合物显示减少的簇聚(图14D、图19C)。
粘蛋白-270涂层优于市售抗结块剂
我们发现即使在极端促结块条件下,粘蛋白-270生物聚合物涂层也可减少细胞聚集。先前已显示悬浮适应的细胞系在特定培养基条件,如已知促进钙粘蛋白接合的高钙浓度下显著聚集(Dee等人,1997;Han等人,2006b;Kim,Tai,Mok,Mosser和Schuman,2011;Meissner等人,2001;Peshwa等人,1993;Sjaastad和Nelson,1997;Tolbert等人,1980;Yamamoto等人,2000;Zanghi等人,2000)。当在高钙条件(2mM CaCl2)下培养时,与w.t.细胞相比,粘蛋白-270生物聚合物涂布的细胞定性显示较少聚集(图15A)。值得注意的是,具有粘蛋白-270生物聚合物涂层的培养物在促结块条件下保留其浊度,而未修饰的细胞组装成肉眼容易可见的大簇(图15A)。粘蛋白-270涂布的细胞在钙处理后显示悬浮液中细胞浓度的轻微降低,而w.t.细胞基本上没有保留在悬浮液中的细胞(图15B)。
此外,粘蛋白-270涂层在高度聚集条件下优于市售抗结块剂。在高钙条件下,抗结块剂在减轻细胞结块方面没有可辨别的功效(图15A)。在我们的分析中,将商业抗结块剂添加到粘蛋白-270涂布的细胞中不进一步增强其结块抗性(图15B)。总之,这些结果展现本发明提供的遗传编码的生物聚合物涂层减少悬浮液中细胞聚集的能力。
生物聚合物涂层提供对剪切应力的抗性
悬浮适应的哺乳动物细胞对剪切应力的敏感性对典型生物反应器中混合和质量转移的速率施加限制(Hu,Berdugo和Chalmers,2011)。在高细胞密度下操作的大容量生物反应器需要增加的混合以克服质量转移限制(Hu等人,2011)。因此,细胞对剪切的敏感性对生物反应器产率造成另一限制。因为保护导管上皮细胞免于剪切应力是粘蛋白的生理功能,所以我们考虑作为额外益处,我们的生物聚合物涂层是否保护细胞免于剪切应力。为了测试这一点,由通过窄收缩件剪切悬浮细胞,然后在再引入到培养物中之后分析其活力(图16A)。将1kg质量施加到竖直定向的注射器以产生恒定且受控的压力,其驱动悬浮细胞流动通过7.6cm长度的500μm直径特氟龙管。使用活/死细胞染色剂通过流式细胞分析细胞死亡。我们发现与w.t.和粘蛋白-0细胞系两者相比,粘蛋白-135和粘蛋白-270生物聚合物涂布的细胞系在剪切之后具有显著更大的活力(图16B),表明粘蛋白涂层可允许生物反应器中较高的混合速率。
生物聚合物涂布的细胞系可瞬时转染并产生相当水平的重组蛋白
最近,使用细胞瞬时转染进行重组蛋白产生受到关注,以避免为新药产生进行的选择及分离稳定细胞系开发时间过长(Derouazi等人,2004;Durocher等人,2002;Swiech等人,2011)。鉴于粘多糖涂层对细胞表面的潜在屏障效应,我们测试了本发明提供的生物聚合物的表达是否会影响细胞系的转染效率。为了测试,我们用表达细胞质红色荧光蛋白的质粒瞬时转染细胞系。我们观察到与w.t.细胞相比,粘蛋白-0、粘蛋白-135或粘蛋白-270细胞系的转染效率无统计显著差异(图17A)。单细胞分析揭示跨工程化和亲本细胞群的重组蛋白产生的相似分布(图17B)。此外,经转染细胞的RFP信号中不存在显著差异,指示不同细胞系中瞬时转染蛋白的表达相当(图17C)。我们还测试了工程化细胞产生分泌型重组蛋白的性能。作为非限制性实施例,我们将信号肽与荧光蛋白mScarlet-I融合,并测量来自瞬时转染的培养物的培养基上清液中分泌型蛋白的产生。粘蛋白-270涂布的细胞产生与w.t.细胞相同量的分泌型重组蛋白(图18)。因此,所描述的生物聚合物涂层没有不利地影响293-F细胞系统的转染效率和高蛋白质产生速率。
第II部分讨论
除其它特征之外,此第II部分展现建立的细胞系可经遗传修饰以表达用于抗粘附的工程化粘蛋白生物聚合物。这些生物聚合物的表达不会不利地影响293-F细胞的期望特征,包括其快速增殖速率(图12E)和高转染效率(图15A、B)。此外,生物聚合物的表达显著减少不期望的细胞结块(图14、图15、图19)并且增强细胞对剪切切力的抗性(图6)。粘蛋白-135涂层和更厚的粘蛋白-270涂层在头对头测试中表现类似,并且预期同等地非常适合于本文所描述的应用。
所描述的生物聚合物涂层在无血清培养基制剂中提供显著减少的细胞聚集,无血清培养基制剂典型地用于生物反应器制剂中的生产。值得注意的是,即使在设计成最小化细胞结块的培养基制剂(例如英杰Freestyle 293-F培养基)中,涂层也可进一步减少聚集。本公开包括在历史上因细胞聚集问题而被避开的培养基制剂中,细胞聚集上的生物聚合物表达。举例来说,长期用DNA-磷酸钙沉淀物进行高效瞬时转染(Jordan和Wurm,2004)。然而,在所需高钙浓度下,已知293-F细胞形成大细胞聚集体(Meissner等人,2001;Peshwa等人,1993)。基于此第II部分结果的结果(图15),在改良瞬时转染培养物的蛋白质产生的条件下,使用粘蛋白-135或粘蛋白-270涂层显著减少细胞聚集。
本公开包括所描述的粘蛋白涂层的进一步改良,可通过工程化粘蛋白和其调节表达的额外优化实现。值得注意的是,高度糖基化粘蛋白样蛋白的过度过产生可能与重组糖蛋白竞争细胞糖基化机制和聚糖的核苷酸糖构建块。通过所描述的膜锚选择减少工程化粘蛋白从细胞表面的脱落,所述膜锚缺乏蛋白水解裂解位点。
本文所描述的接近粘蛋白可用作倾向于在生物反应器中聚集的悬浮适应悬浮系统的解决方案。但应认识到,这些组合物保护细胞并且强有力地抵抗结块的能力还可有益于当前生物制造平台,如CHO细胞,其仍然可在非理想反应器条件下或非最优培养基制剂中聚集。由于生物制造在寻求超越CHO系统的降低非人糖缀合物和其它抗原表位的风险的下一代生产平台,因此适于悬浮生长仍然为人、灵长类动物和许多其它哺乳动物细胞系的重大且耗时的挑战(Amaral等人,2016;Rodrigues等人,2013)。通过促进细胞活力和最小化聚集,可预期本发明提供的组合物帮助解决悬浮适应的一些显著障碍。
综合起来,此第II部分呈现一种粘蛋白涂布技术,其用于改良悬浮液中细胞的单细胞生长。所述系统在减少细胞聚集方面取得很大成功。
参考文献
Amaral,R.L.F.do,Bomfim,A.de S.,Abreu-Neto,M.S.de,
Figure BDA0003263651390000822
V.,Russo,E.M.de S.,Covas,D.T.和Swiech,K.(2016).《在无血清悬浮培养物中产生重组人因子IX的方法(Approaches for recombinant human factor IX production in serum-free suspension cultures)》.《生物技术快报(Biotechnology Letters)》,38(3),385-394.//doi.org/10.1007/s10529-015-1991-1
Carter,P.J.(2011).《当前和未来蛋白质治疗剂简介:蛋白质工程观点(Introduction to current and future protein therapeutics:Aprotein engineeringperspective)》.《实验细胞研究(Experimental Cell Research)》,317(9),1261-1269.//doi.org/10.1016/j.yexcr.2011.02.013
Casademunt,E.,Martinelle,K.,Jernberg,M.,Winge,S.,Tiemeyer,M.,Biesert,L.,…
Figure BDA0003263651390000821
C.(2012).《第一种人源重组人凝血因子VIII:人细胞系和制造特征(Thefirst recombinant human coagulation factor VIII of human origin:human cellline and manufacturing characteristics)》.《欧洲血液学杂志(European Journal ofHaematology)》,89(2),165-176.//doi.org/10.1111/j.1600-0609.2012.01804.x
Dee,K.U.,Shuler,M.L.和Wood,H.A.(1997).《诱导BTI-TN5B1-4昆虫细胞的单细胞悬浮液:I.使用硫酸化聚阴离子防止细胞聚集并且增强重组蛋白产生(Inducingsingle-cell suspension of BTI-TN5B1-4 insect cells:I.The use of sulfatedpolyanions to prevent cell aggregation and enhance recombinant proteinproduction)》.《生物技术与生物工程(Biotechnology and Bioengineering)》,54(3),191-205.//doi.org/10.1002/(SICI)1097-0290(19970505)54:3<191::AID-BIT1>3.0.CO;2-A
Derouazi,M.,Girard,P.,Van Tilborgh,F.,Iglesias,K.,Muller,N.,Bertschinger,M.和Wurm,F.M.(2004).《CHO细胞的无血清大规模瞬时转染(Serum-freelarge-scale transient transfection of CHO cells)》.《生物技术与生物工程》,87(4),537-545.//doi.org/10.1002/bit.20161
Dumont,J.,Euwart,D.,Mei,B.,Estes,S.和Kshirsagar,R.(2016).《用于生物医药制造的人细胞系:历史、现状和未来视角(Human cell lines for biopharmaceuticalmanufacturing:history,status,and future perspectives)》.《生物技术关键评论(Critical Reviews in Biotechnology)》,36(6),1110-1122.//doi.org/10.3109/07388551.2015.1084266
Durocher,Y.,Perret,S.和Kamen,A.(2002).《通过瞬时转染悬浮生长人293-EBNA1细胞进行的高水平和高通量重组蛋白产生(High-level and high-throughputrecombinant protein production by transient transfection of suspension-growing human 293-EBNA1 cells)》.《核酸研究》,30(2),e9.
Gemayel,R.,Vinces,M.D.,Legendre,M.和Verstrepen,K.J.(2010).《可变串联重复加速编码和调节序列的进化(Variable tandem repeats accelerate evolution ofcoding and regulatory sequences)》.《遗传学年度评论(Annual Review ofGenetics)》,44,445-477.//doi.org/10.1146/annurev-genet-072610-155046
Gendler,S.J.和Spicer,A.P.(1995).《上皮粘蛋白基因(Epithelial MucinGenes)》.《生理学年度评论(Annual Review of Physiology)》,57(1),607-634.//doi.org/10.1146/annurev.ph.57.030195.003135
Ghaderi,D.,Zhang,M.,Hurtado-Ziola,N.和Varki,A.(2012).《生物治疗性糖蛋白的产生平台。非人唾液酸化的发生、影响和挑战(Production platforms forbiotherapeutic glycoproteins.Occurrence,impact,and challenges of non-humansialylation)》.《生物技术与基因工程评论(Biotechnology&Genetic EngineeringReviews)》,28,147-175.
Gossen,M.,Bender,G.,Muller,G.,al,et和Freundlieb,S.(1995).《四环素在哺乳动物细胞中引起的转录激活(Transcriptional activation by tetracyclines inmammalian cells)》,《科学(Science)》,268(5218),1766.
Han,Y.,Liu,X.-M.,Liu,H.,Li,S.-C.,Wu,B.-C.,Ye,L.-L.,…Chen,Z.-L.(2006a).《在搅拌容器中作为悬浮聚集体生长的重组中国仓鼠卵巢细胞的培养(Cultivation of Recombinant Chinese hamster ovary cells grown as suspendedaggregates in stirred vessels)》.《生命科学和生物工程杂志(Journal of Bioscienceand Bioengineering)》,102(5),430-435.//doi.org/10.1263/jbb.102.430
Han,Y.,Liu,X.-M.,Liu,H.,Li,S.-C.,Wu,B.-C.,Ye,L.-L.,…Chen,Z.-L.(2006b).生命科学和生物工程杂志》,102(5),430-435.//doi.org/10.1263/jbb.102.430
Hu,W.,Berdugo,C.和Chalmers,J.J.(2011).《工业相关的动物细胞的流体动力损伤的潜能:当前理解(The potential of hydrodynamic damage to animal cells ofindustrial relevance:current understanding)》.《细胞技术(Cytotechnology)》,63(5),445-460.//doi.org/10.1007/s10616-011-9368-3
Jay,G.D.和Waller,K.A.(2014).《润滑素的生物学:接近无摩擦的关节运动(Thebiology of Lubricin:Near frictionless joint motion)》.《基质生物学(MatrixBiology)》,39,17-24.//doi.org/10.1016/j.matbio.2014.08.008
Jordan,M.和Wurm,F.(2004).《通过磷酸钙转染贴壁和悬浮细胞(Transfectionof adherent and suspended cells by calcium phosphate)》.《方法(Methods)》,33(2),136-143.//doi.org/10.1016/j.ymeth.2003.11.011
Kim,S.A.,Tai,C.-Y.,Mok,L.-P.,Mosser,E.A.和Schuman,E.M.(2011).《细胞-细胞接合区的钙粘蛋白相互作用的钙依赖性动力学(Calcium-dependent dynamics ofcadherin interactions at cell-cell junctions)》.《美国国家科学院院刊(Proceedings of the National Academy of Sciences)》,108(24),9857-9862.//doi.org/10.1073/pnas.1019003108
Klinken,B.J.V.,Dekker,J.,Buller,H.A.和Einerhand,A.W.(1995).《粘蛋白基因结构和表达:保护与粘附(Mucin gene structure and expression:protectionvs.adhesion)》.《美国生理学杂志-胃肠和肝脏生理学(American Journal ofPhysiology-Gastrointestinal and Liver Physiology)》,269(5),G613-G627.
Kuo,J.C.-H.,Gandhi,J.G.,Zia,R.N.和Paszek,M.J.(2018).《癌细胞糖萼的物理生物学(Physical biology of the cancer cell glycocalyx)》.《自然·物理学(NaturePhysics)》,14(7),658-669.//doi.org/10.1038/s41567-018-0186-9
Leader,B.,Baca,Q.J.和Golan,D.E.(2008).《蛋白质治疗剂:概述和药理学分类(Protein therapeutics:a summary and pharmacological classification)》.《自然综述:药物发现(Nature Reviews Drug Discovery)》,7(1),21-39.//doi.org/10.1038/nrd2399
Levitin,F.,Stern,O.,Weiss,M.,Gil-Henn,C.,Ziv,R.,Prokocimer,Z.,…Wreschner,D.H.(2005).《MUC1 SEA模块为自裂解结构域(The MUC1 SEAmodule is aself-cleaving domain)》.《生物化学杂志(The Journal of Biological Chemistry)》,280(39),33374-33386.//doi.org/10.1074/jbc.M506047200
Li,L.,Qin,J.,Feng,Q.,Tang,H.,Liu,R.,Xu,L.和Chen,Z.(2011).《肝素通过消除细胞聚集促进CHO-TS28细胞的悬浮适应过程(Heparin Promotes SuspensionAdaptation Process of CHO-TS28 Cells by Eliminating Cell Aggregation)》.《分子生物技术(Molecular Biotechnology)》,47(1),9-17.//doi.org/10.1007/s12033-010-9306-1
Li,X.,Burnight,E.R.,Cooney,A.L.,Malani,N.,Brady,T.,Sander,J.D.,…Craig,N.L.(2013).《用于基因组工程化的piggyBac转座酶工具(piggyBac transposasetools for genome engineering).《美国国家科学院院刊》,110(25),E2279-E2287.//doi.org/10.1073/pnas.1305987110
Liu,M.和Goudar,C.T.(2013).《用于机制性理解哺乳动物细胞灌注培养物中细胞聚集的基因表达谱分析(Gene expression profiling for mechanistic understandingof cellular aggregation in mammalian cell perfusion cultures)》.《生物技术与生物工程》,110(2),483-490.//doi.org/10.1002/bit.24730
Meissner,P.,Pick,H.,Kulangara,A.,Chatellard,P.,Friedrich,K.和Wurm,F.M.(2001).《瞬时基因表达:用悬浮适应的HEK293-EBNA细胞产生重组蛋白(Transientgene expression:recombinant protein production with suspension-adaptedHEK293-EBNAcells)》.《生物技术与生物工程》,75(2),197-203.
Mercanti,V.,Marchetti,A.,Lelong,E.,Perez,F.,Orci,L.和Cosson,P.(2010).《跨膜结构域控制膜蛋白从网格蛋白涂布的凹坑排除》.《细胞科学杂志》,123(19),3329-3335.//doi.org/10.1242/jcs.073031
Oren,M.,Barela Hudgell,M.A.,D'Allura,B.,Agronin,J.,Gross,A.,Podini,D.和Smith,L.C.(2016).《快速多样化免疫基因家族中的短串联重复、节段性重复、基因缺失和基因组不稳定性(Short tandem repeats,segmental duplications,gene deletion,and genomic instability in a rapidly diversified immune gene family)》.《BMC基因组学(BMC Genomics)》,17.//doi.org/10.1186/s12864-016-3241-x
Park,J.H.,Lim,M.S.,Woo,J.R.,Kim,J.W.和Lee,G.M.(2016).《硫酸葡聚糖的分子量和浓度影响CHO细胞培养物中的细胞生长和抗体产生(The molecular weight andconcentration of dextran sulfate affect cell growth and antibody productionin CHO cell cultures)》.《生物技术进展(Biotechnology Progress)》,32(5),1113-1122.//doi.org/10.1002/btpr.2287
Paszek,M.J.,DuFort,C.C.,Rossier,O.,Bainer,R.,Mouw,J.K.,Godula,K.,…Weaver,V.M.(2014).《癌症糖萼机械启动整合素介导的生长和存活》.《自然》,511(7509),319-325.//doi.org/10.1038/nature13535
Peshwa,M.V.,Kyung,Y.-S.,McClure,D.B.和Hu,W.-S.(1993).《在生物反应器中培养作为聚集体的哺乳动物细胞:空间分布和活力的钙浓度影响(Cultivation ofmammalian cells as aggregates in bioreactors:Effect of calcium concentrationof spatial distribution of viability)》.《生物技术与生物工程》,41(2),179-187.//doi.org/10.1002/bit.260410203
Rodrigues,M.E.,Costa,A.R.,Henriques,M.,Cunnah,P.,Melton,D.W.,Azeredo,J.和Oliveira,R.(2013).《用于单克隆抗体产生的CHO-K1细胞的无血清培养的适应的进展和缺点(Advances and Drawbacks of the Adaptation to Serum-Free Culture of CHO-K1 Cells for Monoclonal Antibody Production)》.《应用生物化学与生物技术(AppliedBiochemistry and Biotechnology)》,169(4),1279-1291.//doi.org/10.1007/s12010-012-0068-z
Sandberg,H.,Kannicht,C.,Stenlund,P.,Dadaian,M.,Oswaldsson,U.,Cordula,C.和Walter,O.(2012).《新颖人源重组FVIII蛋白质产品人cl rhFVIII的功能特征(Functional characteristics of the novel,human-derived recombinant FVIIIprotein product,human-cl rhFVIII)》.《血栓形成研究(Thrombosis Research)》,130(5),808-817.//doi.org/10.1016/j.thromres.2012.08.311
Schindelin,J.,Arganda-Carreras,I.,Frise,E.,Kaynig,V.,Longair,M.,Pietzsch,T.,…Cardona,A.(2012).《Fiji:生物图像分析的开源平台》.《自然·方法》,9(7),676-682.//doi.org/10.1038/nmeth.2019
Shukla,A.A.和
Figure BDA0003263651390000861
J.(2010).《单克隆抗体和相关蛋白质的大规模产生的最新进展(Recent advances in large-scale production of monoclonal antibodiesand related proteins)》.《生物技术趋势(Trends in Biotechnology)》,28(5),253-261.//doi.org/10.1016/j.tibtech.2010.02.001
Shurer,C.R.,Colville,M.J.,Gupta,V.K.,Head,S.E.,Kai,F.,Lakins,J.N.和Paszek,M.J.(2017).《糖萼工程化的遗传编码工具箱:对细胞粘附、存活和癌细胞行为的可调控制》.《ACS生物材料科学与工程》.//doi.org/10.1021/acsbiomaterials.7b00037
Sjaastad,M.D.和Nelson,W.J.(1997).《整合素介导的钙信号传导和细胞内钙对细胞粘附的调节(Integrin-mediated calcium signaling and regulation of celladhesion by intracellular calcium)》.《生物分析:分子、细胞和发育生物学新闻和评价(BioEssays:News and Reviews in Molecular,Cellular and DevelopmentalBiology)》,19(1),47-55.//doi.org/10.1002/bies.950190109
Swiech,K.,Kamen,A.,Ansorge,S.,Durocher,Y.,
Figure BDA0003263651390000871
V.,Russo-Carbolante,E.M.,…Covas,D.T.(2011).《瞬时转染无血清悬浮HEK293细胞培养物以有效产生人rFVIII(Transient transfection of serum-free suspension HEK 293cellculture for efficient production of human rFVIII)》.《BMC生物技术(BMCBiotechnology)》,11,114.//doi.org/10.1186/1472-6750-11-114
Tang,N.C.和Chilkoti,A.(2016).《组合密码子加扰实现重复蛋白质的可缩放基因合成和扩增》.《自然·材料》,15(4),419-424.//doi.org/10.1038/nmat4521
Thornton,D.J.,Rousseau,K.和McGuckin,M.A.(2008).《呼吸道粘液中聚合粘蛋白的结构和功能(Structure and Function of the Polymeric Mucins in AirwaysMucus)》.《生理学年度评论》,70(1),459-486.//doi.org/10.1146/annurev.physiol.70.113006.100702
Tolbert,W.R.,Hitt,M.M.和Feder,J.(1980).《用于大规模生物分子产生的细胞聚集悬浮培养(Cell aggregate suspension culture for large-scale production ofbiomolecules)》.《体外(In Vitro)》,16(6),486-490.//doi.org/10.1007/BF02626461
Tsao,Y.S.,Condon,R.,Schaefer,E.,Lio,P.和Liu,Z.(2001).《使用HEK293细胞产生重组腺病毒载体的无血清悬浮工艺的开发与改进(Development and improvement ofa serum-free suspension process for the production of recombinant adenoviralvectors using HEK293 cells)》.《细胞技术》,37(3),189-198.//doi.org/10.1023/A:1020555310558
Vink,T.,Oudshoorn-Dickmann,M.,Roza,M.,Reitsma,J.-J.和de Jong,R.N.(2014).《一种用于产生抗体的简单、稳健且高效瞬时表达系统(A simple,robust andhighly efficient transient expression system for producing antibodies)》.《方法》,65(1),5-10.//doi.org/10.1016/j.ymeth.2013.07.018
Wesseling,J.,Valk,S.W.van der和Hilkens,J.(1996).《膜相关粘蛋白上皮唾蛋白/MUC1的E-钙粘蛋白介导的细胞-细胞粘附的抑制机制(Amechanism for inhibition ofE-cadherin-mediated cell-cell adhesion by the membrane-associated mucinepisialin/MUC1)》.《细胞分子生物学(Molecular Biology of the Cell)》,7(4),565-577.//doi.org/10.1091/mbc.7.4.565
Wesseling,J.,van der Valk,S.W.,Vos,H.L.,Sonnenberg,A.和Hilkens,J.(1995).《上皮唾蛋白(MUC1)过表达抑制整合素介导的细胞粘附到细胞外基质组分(Episialin(MUC1)overexpression inhibits integrin-mediated cell adhesion toextracellular matrix components)》.《细胞生物学杂志(The Journal of CellBiology)》129(1),255-265.
Wilson,M.H.,Coates,C.J.和George,A.L.(2007).《PiggyBac转座子介导的人细胞中的基因转移(PiggyBac transposon-mediated gene transfer in human cells)》.《分子疗法:美国基因疗法学会杂志(Molecular Therapy:The Journal of the AmericanSociety of Gene Therapy)》,15(1),139-145.//doi.org/10.1038/sj.mt.6300028
Woodard,L.E.和Wilson,M.H.(2015).《piggyBac-ing模型和新治疗策略(piggyBac-ing models and new therapeutic strategies).《生物技术趋势》,33(9),525-533.//doi.org/10.1016/j.tibtech.2015.06.009
Wurm,F.和Bernard,A.(1999).《用于重组蛋白产生的哺乳动物细胞中的大规模瞬时表达(Large-scale transient expression in mammalian cells for recombinantprotein production)》.《生物技术新见(Current Opinion in Biotechnology)》,10(2),156-159.//doi.org/10.1016/S0958-1669(99)80027-5
Wurm,F.M.(2004).《培育的哺乳动物细胞中重组蛋白治疗剂的产生(Productionof recombinant protein therapeutics in cultivated mammalian cells)》.《自然·生物技术(Nature Biotechnology)》,22(11),1393-1398.//doi.org/10.1038/nbt1026
Yamamoto,S.,Matsuda,H.,Takahashi,T.,Xing,X.-H.,Tanji,Y.和Unno,H.(2000).《在不存在细胞粘附材料的情况下,rCHO细胞的聚集体形成和其在重复分批培养物中的维持(Aggregate formation of rCHO cells and its maintenance in repeatedbatch culture in the absence of cell adhesion materials)》.《生命科学与生物工程杂志》,89(6),534-538.//doi.org/10.1016/S1389-1723(00)80052-3
Zanghi,J.A.,Renner,W.A.,Bailey,J.E.和Fussenegger,M.(2000).《生长因子抑制剂苏拉明减少无蛋白质CHO细胞分批培养物中的凋亡和细胞聚集(The Growth FactorInhibitor Suramin Reduces Apoptosis and Cell Aggregation in Protein-Free CHOCell Batch Cultures)》.《生物技术进展》,16(3),319-325.//doi.org/10.1021/bp0000353
Zhu,J.(2012).《用于生物医药产生的哺乳动物细胞蛋白质表达(Mammalian cellprotein expression for biopharmaceutical production).《生物技术进展》,30(5),1158-1170.//doi.org/10.1016/j.biotechadv.2011.08.022
第III部分
此第III部分提供在人细胞中稳定重组产生密码子加扰润滑素和粘蛋白的代表性且非限制性方法,以及衍生自人、马和犬序列的修饰的润滑素的表征。此第III部分展现利用密码子冗余以编码具有最小核苷酸重复的所需多肽。应用密码子加扰策略来为两个商业关注的代表性粘蛋白产生同义基因或“synDNA”:润滑素和Muc1。对于同义润滑素cDNA(其在本文中不时称为“SynLubricin”),展现在悬浮适应的人293-F细胞中的稳定长期重组产生。在最优条件下,293-F亚群以大于200mg/L培养基产生重组SynLubricin,并且在整个两个月连续培养中稳定。功能性测试证实重组润滑素可有效地抑制细胞粘附和润滑软骨外植体。总之,除其它方面之外,此第III部分为哺乳动物宿主产生系统中的cDNA设计和稳定粘蛋白产生提供可行工作流程。
第III部分引言
如从前述说明将认识到,粘蛋白为膜结合或分泌型糖蛋白,其含有由其密集簇聚的O-糖基化位点限定的可变数目串联重复(Hang和Bertozzi,2005)。此广泛糖基化产生赋予粘蛋白显著物理特性的瓶刷分子结构(Kuo,Gandhi,Zia和Paszek,2018)。生物界面处的粘蛋白可与水分子配位以形成水合层,其保护脆弱细胞或组织结构、阻止生物污染并且抵抗病理细胞沉积(Hattrup和Gendler,2008)。举例来说,跨膜粘蛋白,如Muc1和Muc16密集地接枝于眼表面,在眼表面其维持水合作用、抵抗磨损并且提供对大分子的选择性屏障(Gipson,Spurr-Michaud,Tisdale和Menon,2014;Mauris和Argüeso,2012)。类似地,称作蛋白聚糖4(PRG4)或润滑素的分泌型粘蛋白样糖蛋白可结合细胞和组织界面,包括关节软骨和眼表面,实现低摩擦润滑并且保护免于病理细胞沉积和生物污染(Rhee等人,2005;Schmidt,Sullivan,Knop等人,2013)。
在癌症和炎性肠病到眼部疾病范围内的各种病理病状中观察到粘蛋白表达和糖基化的改变(Dhanisha,Guruvayoorappan,Drishya和Abeesh,2018)。具有阻止功能性润滑素合成的基因突变的患者展现屈曲指-关节病-髋内翻-心包炎(Camptodactyly-Arthropathy-Coxa Vara-Pericarditis,CACP)综合征的症状,包括由关节翳形成和关节润滑减弱引起的早发型多关节病(Bahabri等人,1998;Marcelino等人,1999)。在患有前十字韧带损伤、骨关节炎和类风湿性关节炎的患者中也已观察到滑液润滑素浓度降低(Elsaid等人,2008;Kosinska等人,2015)。因此,对于开发重组润滑素和其它粘蛋白作为骨关节炎和风湿性疾病的可注射治疗剂(Le Graverand-Gastineau,2010)以及作为慢性干眼和需要施加外源润滑剂的其它病状的局部治疗(Schmidt等人,2013)具有相当大的关注。
不管此商业关注如何,已证实对于Muc1、润滑素和含有高串联重复数目的其它粘蛋白来说重组产生是具有挑战性的。尽管大约1/3天然串联重复的截短Muc1已分离出中国仓鼠卵巢(CHO)细胞的高产克隆,但分离全长重组Muc1的克隆的类似尝试是失败的(Backstrom等人,2003)。同样地,具有完整76-78个天然串联重复的重组润滑素的稳定克隆以低水平产生糖蛋白(Jones等人,2007),但仅含有1/3的串联重复的修饰的重组润滑素蛋白质构建体(LUB:1)更适合于大规模产生(Flannery等人,2009)。最近,已报道在悬浮适应的CHO细胞中表达的全长重组人润滑素的产生,并且已展现作为治疗干眼病或水合隐形眼镜的眼润滑剂的潜能(Samsom等人,2014)。对于全长润滑素如何实现重组产生的精确细节仍然未公知,并且在提交本申请或专利时,认为没有就大规模润滑素产生的公开策略。
难以高水平产生粘蛋白的确切生物学仍然不清楚。然而,长重复DNA序列,如粘蛋白串联重复的cDNA中常见的那些在细胞基因组中相对不稳定(Pearson,Edamura和Cleary,2005)。几乎所有DNA加工步骤的保真度可受滑动和与重复序列相关的其它错误损害(LópezCastel,Cleary和Pearson,2010)。因此,与非重复区中的点突变相比,重复可通过添加或损失其单元核苷酸序列而突变的频率高达100,000倍(Oren等人,2016)。人和哺乳动物中Muc1和其它粘蛋白的串联重复数目的变化提供一个进化论点,即这些基因组cDNA为突变热点(Gemayel,Vinces,Legendre和Verstrepen,2010)。还已报道细菌中外源Muc1 cDNA的重组和截短,表明这些重复序列在宿主微生物细胞中的不稳定水平也很高(Backstrom等人,2003)。
既然定制基因合成(CGS)的进展实现长cDNA的快速且有成本效益的合成(Kosuri和Church,2014),本文提供了改良粘蛋白的基因组稳定性的新方法,并且在某些实施方案中利用密码子冗余以鉴别并且使用重复性较低但编码相同所需多肽的同义基因序列。此类密码子优化算法已开发且成功地应用于弹性蛋白样蛋白和一些其它重复蛋白质结构域(Tang和Chilkoti,2016)。然而,据信在本公开之前,尚未设计、合成和测试用于商业关注的大粘蛋白的生物制造的优化合成cDNA。
此外,在本公开之前,大部分生物制剂,包括粘蛋白,在CHO细胞中产生,这是由于其快速生长、对悬浮培养的适应性以及糖基化和其它重要翻译后修饰的能力。然而,CHO细胞可产生现疑似在人中引发不良免疫学反应的聚糖表位(Butler和Spearman,2014)。即,CHO和其它非灵长类动物细胞的α1,3-半乳糖基转移酶产生具有Galα1,3-Gal残基的聚糖,其可能对人、猿和损失α1,3-半乳糖基转移酶活性的其它旧世界猴具有免疫原性(Bosques等人,2010;Brooks,2004)。CHO细胞还可产生Neu5Gc,一种在大部分哺乳动物细胞中常见但在人和灵长类动物中已损失的末端唾液酸(Ghaderi,Zhang,Hurtado-Ziola和Varki,2012)。这些聚糖是重组粘蛋白的特别关注点,其可由75质量%或更多碳水化合物组成并且通常高度唾液酸化(Estrella,Whitelock,Packer和Karlsson,2010)。在人细胞中重组产生糖蛋白将避免Galα1,3-Gal和Neu5Gc残基的风险;但据信在本公开之前,尚未报道在人细胞宿主产生系统中大规模粘蛋白产生的成功尝试。
因此,除其它方面之外,本公开展现通过密码子加扰进行cDNA优化为实现粘蛋白和粘蛋白样糖蛋白稳定重组产生的有效策略,并且此策略在悬浮适应的人293-F细胞中可行。值得注意的是,美国食品和药物管理局(Food and Drug Administration,FDA)最近已批准在293-F细胞中产生的几种生物制剂,将所述细胞平台建立为CHO和用于制造专门治疗剂的其它非人系统的可行替代方案(Dumont,Euwart,Mei,Estes和Kshirsagar,2016)。在本公开中,对于Muc1和润滑素展现密码子加扰方法,并且进一步开发产生策略以实现功能性全长重组润滑素的稳定产生。所属领域的技术人员将认识到,当给出本公开的益处时,本发明描述的方法可用于稳定且稳健表达其它粘蛋白和粘蛋白样蛋白。
第II部分结果
同义润滑素的cDNA的设计和合成
作为重组粘蛋白产生的方法,我们应用密码子加扰和优化策略来在最小密码子重复内设计合成粘蛋白cDNA(图20A)。应用全局密码子优化算法来发现编码所需粘蛋白串联重复的最小重复基因序列(Tang和Chilkoti,2016)。为了定制用于在人宿主系统(如293-F)中产生的序列,进行后续优化以替换在人中使用频率小于10%的任何密码子(图20A)。我们设想可通过CGS的快速且低成本服务合成优化的粘蛋白cDNA(Kosuri和Church,2014;Tang和Chilkoti,2016)。
我们首先针对人润滑素测试此方法,人润滑素具有大约59个串联重复,共有序列为KXPXPTTX(SEQ ID NO:87),KEPAPTTP(SEQ ID NO:1)为最频繁的重复。对于我们的合成润滑素,我们优化KEPAPTTP(SEQ ID NO:1)共有序列的59个完美重复的密码子(图20B)。完美重复的蛋白质序列与天然人PRG4重复具有大约88%相似性(图20C)。合成串联重复侧接编码人PRG4的天然N和C端的额外序列。这些序列包括润滑素的天然生长调节素和血红素结合蛋白结构域。我们还包括IgK前导序列、6×组氨酸标签和N端SumoStar标签以辅助蛋白质分泌和纯化(图20B)。我们将由密码子优化的cDNA编码的新半合成基因命名为“同义润滑素”或“SynLubricin”。
编码SynLubricin的核苷酸的重复性显著低于天然PRG4。我们用比对算法分析核苷酸序列,所述算法检测串联重复并且基于其重复频率和鉴别的共有序列与查询序列的核苷酸的匹配紧密程度对其重复程度进行评分(Benson,1999)。通过史密斯-沃特曼(Smith-Waterman)式局部比对将检测到的重复与查询序列进行比对,并且通过为每个核苷酸匹配指配+2且为每个错配或插入缺失指配-7来对整体重复性进行评分(Benson,1999)。因此,较高评分指示较多核苷酸重复。SynLubricin的串联重复具有168的适中评分,而天然PRG4重复具有1001的高得多的重复评分。本公开涵盖此类序列,其中多核苷酸的整体重复性评分与合适的对照进行比较。
我们还将SynLubricin串联重复的氨基酸与人PRG4同工型A的59个串联重复进行比对(图20D)。我们注意到SynLubricin的完美重复和人PRG4-A的天然重复具有相似丙氨酸、谷氨酸、赖氨酸和苏氨酸组成,而SynLubricin重复中脯氨酸含量略微较高(37%对30.5%;第III部分表S1)。我们还注意到天然重复含有少量天冬酰胺(0.2%)、天冬氨酸(0.4%)、甘氨酸(0.8%)、异亮氨酸(0.2%)、亮氨酸(1.4%)和丝氨酸(2.6%),其不含于SynLubricin中(第III部分补充表1)。因此,除不同编码序列之外,SynLubricin的氨基酸序列不同于人PRG4的氨基酸序列。
SynLubricin基因中核苷酸的低重复使得能够使用可用技术合成所需cDNA。我们还通过商业供应商获得具有天然人润滑素/PRG4序列的cDNA。然而,我们随后将天然PRG4cDNA序列克隆到哺乳动物表达载体中并且在哺乳动物细胞重组表达产物的尝试失败。因此,我们中断了用全长天然cDNA重组产生润滑素的进一步努力。
在瞬时转染的哺乳动物细胞中产生SynLubricin的努力成功。SynLubricin cDNA与双顺反子copGFP报告子融合并瞬时转染到贴壁人胚肾293-T细胞中。视需要,SynLubricin基因的蛋白质产物高度糖基化,并且展现我们预测的抗粘附特性。经转染细胞在单层细胞之间维持大间隙,尤其在可见copGFP荧光报告双顺反子mRNA的高表达水平的位置处(图26A)。我们注意到,这些观察结果与天然润滑素的已知抗粘附功能一致(Rhee等人,2005)。相比之下,模拟转染的细胞在培养物中生长为高度汇合单层(图26A)。来自SynLubricin转染的培养物的培养基上清液的蛋白质印迹展现大约460kDa的高分子量蛋白质,其在大小上类似于我们在马滑液中检测到的天然润滑素(图26B)。SynLubricin的肽骨架的预期分子量为145kDa,指示SynLubricin充分糖基化。
我们接下来开发用于在293-F悬浮培养物中稳定产生合成粘蛋白的策略。在一个实施方案中,我们产生用于粘蛋白“多合一”诱导型表达的非病毒转座子载体。载体含有用于所需基因的诱导型表达的四环素反应性启动子和双顺反子copGFP报告子。载体还含有在EF1α启动子控制下的第二盒,用于表达rtTA-M2四环素反式激活子以及用于选择的双顺反子新霉素抗性基因(图20E)。为了测试表达系统的性能,我们将mCherry2克隆到载体中并且遵循标准方案用阳离子聚乙烯亚胺(PEI)缩合物转染293-F细胞(Boussif等人,1995;delos Milagros Bassani Molinas,Beer,Hesse,Wirth和Wagner,2014;Sonawane,Szoka Jr.和Verkman,2003)。在选择两周之后分离出稳定细胞群,并且通过流式细胞验证mCherry2产生。基于流式细胞分析,我们发现稳定细胞产生高水平mCherry2,而且copGFP报告子的荧光读数一般为重组蛋白产生的良好指示物(图27)。
同义Muc1的cDNA的设计和合成
我们测试所描述的粘蛋白型cDNA的策略是否可泛化并且可应用于其它粘蛋白。我们选择粘蛋白Muc1,其在角膜和其它上皮表面的水合和保护方面是重要的(Mantelli和Argüeso,2008)。我们注意到Muc1的天然串联重复为多态的,42个完美重复在人中是最常见的(Nath和Mukherjee,2014)。我们应用密码子优化策略来设计42个完美Muc1重复的cDNA,PDTRPAPGSTAPPAHGVTSA(SEQ ID NO:8)。优化的序列与人Muc1的天然N端的密码子融合。我们还添加IgK前导序列、6×组氨酸标签和SumoStar标签,类似于SynLubricin(图28A)。我们针对天然人Muc1串联重复的核苷酸编码序列计算出4997的极高重复评分。在我们的合成cDNA中重复评分降低到220,我们将所述cDNA称为SynMuc1(图28B)。
SynMuc1的优化编码序列通过标准CGS服务合成,而合成天然Muc1 cDNA的极重复序列无法通过商业供应商进行。将定制合成的SynMuc1 cDNA转染到293-F细胞中。重组蛋白通过固定化金属亲和色谱(IMAC)从培养基上清液中纯化,并且用针对天然人串联重复的抗体通过蛋白质印迹检测到(图28C)。如花生凝集素(PNA)探测时的强信号指示,重组粘蛋白充分O-糖基化,PNA为对核心-1粘蛋白型二糖具有特异性的凝集素(图28D)。
在纯化期间,我们注意到相当大百分比的粘蛋白未能结合IMAC树脂并且在通过流量中检测到(图28C、D)。蛋白质印迹证实通过流量和洗脱级分中重组蛋白上6×组氨酸SumoStar纯化标签的存在,表明N端和纯化标签存在但固定化IMAC阳离子无法接近,如在此情况下,例如标签埋入粘蛋白生物聚合物的无规卷曲中(图28E)。由于目标为证明重组SynMuc1的产生而不是优化其纯化,因此未探索替代性色谱方法。
重组SynLubricin的稳定宿主产生
使用转座子系统,我们测试了其对于SynLubricin产生的应用(图21A)。出乎意料地,我们发现在用G418选择之后,相对少细胞在多西环素诱导之后展现高copGFP报告子水平(图21B)。为了解决问题,我们使用copGFP报告子应用两轮分选策略来分离以高水平表达SynLubricin的细胞亚群。使稳定细胞扩增并针对前5%copGFP表达者分选,然后将其扩增并且针对前10%表达者第二次分选。我们发现分选策略提高SynLubricin产量15倍并且不影响糖基化蛋白质产物的分子量(图21B、C)。用多西环素诱导之后,分选的细胞群明显地显示较高水平的copGFP报告子,指示成功分离具有较高基因表达水平的多克隆群体。
为了确认整合的SynLubricin基因在我们的稳定293-F细胞中的cDNA稳定性,在连续培养两个月之后从修饰的293-F细胞提取基因组DNA。然后使用对SynLubricin具有特异性的引物通过聚合酶链式反应(PCR)扩增SynLubricin cDNA(图22)。如针对全长润滑素所预期的,扩增基因大约4kb长,并且与使用原始SynLubricin质粒作为模板或从瞬时转染的细胞提取的DNA获得的类似扩增的基因在大小方面不可区分(图22)。即使在培养2个月之后,多克隆细胞群也未展现SynLubricin基因应用或缺失的迹象,指示高水平的基因组稳定性(图22)。
SynLubricin产生的优化
我们分析了是否可通过添加组蛋白脱乙酰基酶抑制剂丙戊酸(VPA)来改良SynLubricin产率,所述抑制剂先前已显示显著增加293-F细胞中一些重组蛋白的产生(Backliwal等人,2008)。将我们的分选细胞群在存在或不存在3.5mM VPA的情况下用多西环素诱导,并且后续每天从分批培养物取样培养基上清液。蛋白质产物的分子量类似,表明VPA不明显影响蛋白质产物的总糖基化程度(图23A)。有趣的是,重组蛋白水平在无VPA的培养物中诱导后大约2-3天达到峰值,其后快速下降(图23B)。在VPA处理的培养物中,培养基中的SynLubricin水平不随时间推移显著下降。我们排除蛋白质降解作为无VPA的培养物中重组蛋白下降的可能解释,因为我们在蛋白质印迹上未看到显著的润滑素降解产物(图23A)。实际上,我们考虑了293-F培养物可能在营养可用性降低的条件下消耗重组蛋白的可能性。与此可能性一致,我们观察到重组蛋白水平的降低与无VPA培养物中葡萄糖的耗乏一致(图23C)。如葡萄糖消耗的急剧下降指示,3天后,在VPA处理的培养物中代谢活动在很大程度上停止(图23C)。因此,VPA可通过减缓293-F细胞代谢来防止分批培养物中重组蛋白的损失。
我们接下来扩大生产为以分批模式操作的1升生物反应器,并且在添加VPA的情况下进行两个独立生产运作。每一生产运作产生丰富重组蛋白,其在分子量方面与从瞬时转染的培养物分离的重组蛋白和在马滑液中检测到的天然润滑素相当(图23D)。使用纯化牛润滑素作为标准品的ELISA报告,在我们的稳定293-F细胞系的分批运作中,有大约200mg/L的SynLubricin。少于50%稳定细胞群在分批生物反应器中显示copGFP报告子的强表达,表明用生产细胞系的克隆扩增可能实现产率提高(图21D)。我们注意到我们的基于ELISA的定量的限制可能是使用牛标准品,其可能过高或过低估计SynLubricin水平。
我们测试了是否可用定期培养基更换来实现稳定的蛋白质产生以避免营养素耗乏。从在不存在VPA的情况下维持连续10天的多西环素诱导的培养物中收集条件培养基。每48小时更换分批培养物中的培养基以补充营养素并且去除代谢废产物。每48小时,活细胞浓度也降低到1×106个细胞/毫升。SynLubricin产生水平在10天培养内稳定,SynLubricin分子量恒定,指示糖基化也稳定(图23E)。尽管似乎潜在存在随时间推移SynLubricin产生的轻微降低,但蛋白质产量无显著差异(图23F)。
SynLubricin为功能性生物润滑剂
使用阴离子交换或阳离子交换色谱,从条件293-F培养基上清液有效纯化重组SynLubricin。阴离子交换色谱遵循我们先前报道的从马滑液分离天然润滑素的策略,进行轻微修改,从使用
Figure BDA0003263651390000951
改为使用Q
Figure BDA0003263651390000952
(Reesink等人,2016)。在POROSTM XS(赛默飞世尔)树脂的柱上,用50mM磷酸盐缓冲液,100mM NaCl,pH 6.8的流动相和0.1到1M NaCl在50mM磷酸盐缓冲液,pH 6.8中的线性洗脱梯度实现利用阳离子交换纯化的成功纯化。我们还尝试了IMAC来纯化天然润滑素,但重组SynLubricin对IMAC树脂的亲和力不良(图29)。至于SynMuc1,我们推断N端组氨酸标签可能埋入SynLubricin串联重复的大型无规卷曲中,故放弃IMAC方法。相比之下,SynLubricin强烈结合阴离子交换树脂并且在大约350mM到1.5M范围内的高盐浓度下连续洗脱(图24A、B)。SynLubricin的连续洗脱可能通过重组SynLubricin的O-聚糖中阴离子唾液酸的不同频率来解释(Estrella等人,2010)。我们发现大约500mM NaCl的严格洗涤步骤可去除大部分可通过银染色检测的蛋白质污染物,不过一些SynLubricin不可避免地由于此高盐洗涤而损失(图24C、D)。
为了确保我们的重组SynLubricin的功能性,我们测试了其润滑软骨和减少摩擦的能力。重组SynLubricin通过阴离子交换色谱纯化,使用严格500mM NaCl洗涤步骤以消除大部分蛋白质污染物(图24D)。在纯化之后,将SynLubricin在生理盐水中透析并且稀释到生理浓度。在牛关节软骨外植体上测试润滑,所述外植体中天然润滑素边界层已使用定制线性往复摩擦计提取(Jones等人,2007)。与生理盐水对照相比,我们发现含SynLubricin溶液以及对照滑液显著减少软骨外植体的边界摩擦(图25;p分别<0.001和0.0001)。
我们还测试了少量第二SynLubricin样品,其在未用500mM NaCl严格洗涤阴离子交换柱的情况下纯化。值得注意的是,与更严格洗涤的SynLubricin制剂测量的摩擦系数中的任一者相比,此SynLubricin制剂的软骨摩擦系数大大降低(图25)。未洗涤的SynLubricin制剂的样品体积低,阻碍了获得足够用于有意义统计比较的独立测量(图25)。然而,鉴于本公开的益处,使用所属领域的技术人员将显而易见的技术进一步优化纯化条件预期产生具有改良生物润滑性能的重组润滑素级分。举例来说,在较低盐浓度(350-500mM NaCl)下洗脱的带较少负电的润滑素级分通过独立作用或与带较多负电的润滑素级分协同作用而对于软骨生物润滑很重要。可替代地,用500mM NaCl洗涤消除的污染物可与润滑素在软骨润滑中协同作用。
此第III部分实施例提供较大规模粘蛋白生物制造的方法。Muc1和润滑素的新半合成基因的设计和合成的成功,以及我们分离了高度稳定的表达润滑素的细胞群,指示此方法可广泛适用于具有长重复结构域的重组粘蛋白。成功证明人细胞系统中的重组产生,其避免免疫原性Galα1,3-Gal和Neu5Gc表位的风险。我们发现我们的SynLubricin基因的重组产物在其抵抗细胞粘附(图26A)和润滑生物表面,如软骨(图25)的能力方面具有功能。因此,可预期SynLubricin适合于用于骨关节炎的可注射剂到用于慢性干眼的局部治疗范围内的不同应用。此外,鉴于CGS的速度和低成本,可预期本文所描述的方法应用于具有新或修饰的功能域的快速原型设计者粘蛋白。
除前述之外,我们测试了SynLubricin的各种特性。
如图30中所示,SynLubricin在体内展现显著且预料不到的半衰期。图30中所示的结果如下获得。特定来说,当注射到哺乳动物中时,SynLubricin展现超过4天的关节内半衰期,所述半衰期为天然润滑素的先前确定值。(参见例如Hurtig等人《二室药代动力学模型描述尤卡坦小型猪ACL横断后rhprg4的关节内递送和滞留(Two compartmentpharmacokinetic model describes the intra-articular delivery and retention ofrhprg4 following ACL transection in the Yucatan mini pig)》.《骨科研究杂志(JOrthop Res)》.2月;37(2):386-396.doi:10.1002/jor.24191.电子版2018年12月17日)。因此,在实施方案中,本公开的重组蛋白展现超过四天的半衰期,并且可持续至少高达30天或更长。在实施方案中,半衰期高达50天、至少50天或更长。
图30中所示的结果如下获得。所有动物方案由康奈尔大学机构动物护理及使用委员会(Cornell University Institutional Animal Care and Use Committee)批准(方案号2017-0084)。雄性SD大鼠在10-12周龄时购自哈兰史泊格-多利公司(Harlan Sprague-Dawley,Inc.)(ENVIGO),并且在6am开始的标准12小时光/暗循环下成对饲养。允许动物在其笼自由移动,饲喂不含苜蓿的商业饮食以最小化背景荧光(ENVIGO Teklad#2918),并且允许获取自来水。在到达后最少3天适应之后,将动物通过剪耳标识并且称重。在异氟醚麻醉(1-1.5L/min含2.5%异氟醚O2)下,使用胡须修剪器从每只大鼠的腹和侧方面剃刮毛发。在无菌聚维酮碘和70%乙醇皮肤准备之后,通过髌腱入路使用27g针头和0.5mL注射器(Becton Dickinson)并且膝以90°角弯曲,用20μLSynLubricin-Cy7.5或20μL葡聚糖500kD-Cy7.5的达尔伯克氏磷酸盐缓冲生理盐水(Dulbecco's phosphate buffered saline,dPBS)溶液注射左膝。注射乙醇去除任何残余聚维酮碘。右膝中不进行注射,使得其可用作背景荧光计算的内部对照。
在注射后0、6和12小时以及1、2、3、5、7、14、21、28天直至56天,使用IVIS Spectrum全动物成像系统(PerkinElmerTM)对每只大鼠进行成像。获得自动和2秒曝光时间两者。在异氟醚麻醉(1-1.5L/min含2.5%异氟醚O2)下麻醉动物,并且在即将成像前以每周间隔剃刮毛发,在注射后7天开始。两只动物经20μLSynLubricin-Cy7.5注射,并且四只动物经20μL葡聚糖500kD-Cy7.5注射作为额外对照。将数据拟合到二指数衰减模型以计算α和β衰减常数。约45天的润滑素半衰期报告为ln(2)除以β衰减常数。相比之下,葡聚糖从大鼠膝快速清除。
如图31中所示,293-F细胞中产生的SynLubricin含有核心I与核心II聚糖的混合物。通过MALDI-TOF/TOF-MS以正离子模式进行聚糖分析,通过使用Glycoworkbench软件手动完成聚糖结构的指配。值得注意的是,核心II聚糖包含20.3%的检测到的核心O-聚糖。大于29%的O-聚糖结构唾液酸化。
我们进行了额外的摩擦学分析以确定软骨-软骨摩擦对SynLubricin浓度的依赖性。如图32中所示,与仅PBS对照相比,少至100μg/mL SynLubricin的PBS溶液有效降低软骨的摩擦系数(滑动速度=0.1mm/s)。用从新生牛腿膝关节的股骨髁收集的圆柱状软骨外植体(6mm直径
Figure BDA0003263651390000981
约2mm厚度)使用定制线性往复摩擦计获得所有数据。在测试之前,使用1.5MNaCl中30分钟孵育,接着在PBS中1小时平衡步骤,从外植体提取内源性软骨结合润滑素。使用阳离子交换色谱用POROSTMXS(赛默飞世尔)树脂从条件293-F培养基纯化用于这些研究的SynLubricin。
材料和方法
抗体和试剂
使用以下抗体:小鼠抗人CD227(555925,BD生物科学)(Muc1)、小鼠抗人润滑素(MABT401,EMD密理博)、山羊抗小鼠IgG-HRP(sc-2005,圣克鲁兹)、小鼠抗SUMO(4G11E9,金斯瑞)。使用的凝集素为生物素化花生凝集素(PNA;B-1075,Vector Laboratories)。使用ExtrAvidin-过氧化物酶(E2886,西格玛)检测生物素化凝集素。为了诱导反式激活子细胞系,使用多西环素(sc-204734,圣克鲁兹)。对于新霉素选择,使用G418(10131035,赛默飞世尔)。丙戊酸(VPA)用作组蛋白脱乙酰基酶抑制剂(西格玛P4543-100G)。
构建体
具有整合共表达反向四环素反式激活子基因的四环素诱导型、基于转座子的Piggybac表达载体(pPB tet rtTANeoR)用于稳定株系产生。通过插入脑心肌炎病毒内部核糖体进入位点(IRES),接着在NotI和XbaI位点插入荧光蛋白copGFP,来修饰pPB tet rtTANeoR质粒(pPB tet IRES copGFP rtTANeoR)。具有KEPAPTTP(SEQ ID NO:1)的59个完美重复、天然N和C端结构域以及N端SumoStar标签(lifesensors)的润滑素类似物的合成cDNA通过定制基因合成(General Biosystems)产生,并且使用BamHI和EcoRI限制位点克隆到pPBtet IRES copGFP rtTANeoR的多克隆位点中。类似地,通过定制基因合成,在pcDNA3质粒中产生具有PDTRPAPGSTAPPAHGVTSA(SEQ ID NO:8)的42个完美重复和天然人Muc1 N端以及SumoStar标签的可溶性密码子加扰Muc1的cDNA。为了构建mCherry2 IRES2 copGFP表达质粒,将mCherry2 cDNA通过EcoRI和NotI消化pmCherry2 N1分离,并且克隆到EcoRI和NotI消化的pPB tet IRES copGFP rtTA NeoR载体中以产生pPB tet mCherry2 IRES copGFPrtTA NeoR。
细胞系和培养
FreeStyle 293-F(293-F)细胞获自赛默飞世尔科技。根据制造商指南在100-mlWheaton Celstir玻璃旋转瓶中培养且维持细胞。将细胞在FreeStyle 293表达培养基(赛默)中在120rpm、37℃和8%CO2下维持在0.5×106与3×106个细胞/毫升之间。如先前报道(Durocher,Perret和Kamen,2002),使用聚乙烯亚胺(PEI)进行293-F转染。稳定细胞系通过将上文所描述的pPB tet IRES copGFP rtTANeoR质粒与高度活性转座酶质粒(Shurer等人,2018)共转染来产生,并且随后用750μg/mL G418选择两周。将用SV40大T抗原转化的人胚肾细胞(293-T;ATCC)维持在补充有10%胎牛血清和青霉素/链霉素的高葡萄糖DMEM中。293-T细胞通过标准磷酸钙转染方案转染。通过在血细胞计数器上用台盼蓝排除进行细胞计数来定量细胞增殖。
细胞分选和SynLubricin产生
扩增稳定并入SynLubricin IRES copGFP或SynLubricin IRES mNeonGreen的293-F细胞并用1μg/mL多西环素在1×106个细胞/毫升下诱导24小时。在FACSAria Fusion(BD生物科学)上通过荧光激活细胞分选(FACS)收集前5%表达GFP的细胞。在需要时,第二次分选细胞,收集前10%表达GFP的细胞。对于SynLubricin产生,将细胞转移到1LProCulture玻璃旋转瓶(康宁(Corning))中并用1μg/mL多西环素和3.5mM VPA在2×106个细胞/毫升下诱导。还在100-ml Wheaton Celstir玻璃旋转瓶中进行较小规模的润滑素产生,以便测量在存在或不存在VPA的情况下的润滑素产生速率和葡萄糖消耗速率。用GlucCell葡萄糖监控系统(CESCO BioProducts)记录葡萄糖水平。
免疫和凝集素印迹分析
将培养上清液或纯化样品中的蛋白质在NuPAGE 3-8%Tris-乙酸凝胶(英杰)上分离并且转移到PVDF膜。将膜用3%BSA TBST封闭2小时。在3%BSA TBST中将一抗1:1000稀释,并凝集素稀释到1μg/mL,4℃膜上孵育过夜。将二抗或ExtrAvidin在3%BSA TBST中1:2000稀释并且在室温下孵育2小时。将印迹在Clarity ECL(伯乐)底物中显影,并且在ChemiDoc(伯乐)文件系统上成像。Fiji用于图像处理(Schindelin等人,2012)。
酶联免疫吸附分析(ELISA)
类似于先前描述,使用定制夹层ELISA来评定SynLubricin浓度。将96孔板(Costar)用10μg/mL花生凝集素(西格玛)的50mM碳酸氢钠缓冲液,pH 9.5溶液在4℃下孵育过夜。将板在室温下用3%BSA PBS封闭1小时。FPLC纯化的牛滑液润滑素的连续稀释液用作标准品。将样品在室温下以1:200稀释度加载到DPBS中1小时,接着在PBS+0.1%吐温(Tween)20中洗涤三次。使用的一抗(密理博MABT401)结合人和牛润滑素的天然PRG4串联重复,其与SynLubricin的重复具有大约90%序列相似性。一抗和二抗(密理博AP126P)分别1:5000和1:2000稀释,并且各自在室温下孵育1小时,在抗体孵育之间和二抗孵育之后用PBS-T洗涤三次。在室温下用1步超TMB(赛默飞世尔)使ELISA显色9-12分钟,或直到呈现宝蓝色,此时用2N H2SO4停止反应。在帝肯
Figure BDA0003263651390001001
3M微板读数仪上用540nm背景减除测量450nm下的吸光度,并且使用Magellan软件用四参数马夸特(Marquardt)拟合计算浓度。
重组SynMuc1的纯化
使用先前描述的PEI方案瞬时转染293-F细胞。24小时后,收集培养基上清液。将培养基上清液在20mM磷酸钠,0.5M NaCl,pH 7.4中1:4稀释,并与100μL Ni Sepharose excel树脂(17371201,GE)一起在4℃下孵育过夜。使用重力柱(29922,赛默)收集样品通过流量。用5mL 20mM磷酸钠,0.5M NaCl,5mM咪唑,pH 7.4洗涤树脂。用5mL 20mM磷酸钠,0.5M NaCl,500mM咪唑,pH 7.4洗脱SynMuc1。使用Zeba纯化脱盐柱(87766,赛默)将SynMuc1脱盐到PBS中。
重组SynLubricin的纯化
通过快速蛋白质液相色谱(FPLC)用Q
Figure BDA0003263651390001002
树脂(GE)或POROSTM XS(赛默飞世尔)树脂从SynLubricin IRES copGFP或SynLubricin IRES mNeonGreen阳性293-F细胞培养上清液纯化SynLubricin。对于阴离子交换,将上清液用50mM Tri-HCl缓冲液,pH 7.5 1:10稀释,并且负载到柱上。用50mM Tris-HCl,525mM NaCl,pH 7.5洗涤柱。通过用50mMTris-HCl,1M NaCl,pH 7.5洗脱收集纯化的SynLubricin。使用Tube-O-Dialyzer(G-Biosciences)将纯化的SynLubricin透析到PBS中4℃过夜。通过用SpeedVac以低设定浓缩获得最终纯化产物。对于阳离子交换,首先使来自SynLubricin IRES mNeonGreen阳性293-F悬浮细胞培养物的上清液通过0.8μm孔隙大小乙酸纤维素过滤器(赛多利斯(Sartorius)),接着脱盐并且通过快速蛋白质液相色谱(FPLC)捕获。在葡聚糖凝胶(Sephadex)G-25(GE)细树脂上用50mM磷酸盐缓冲液,100mM NaCl,pH 6.8的流动相进行脱盐操作。对于捕获操作,将脱盐样品注射到POROSTMXS(赛默飞世尔)树脂柱上,并且用0.1到1M NaCl的50mM磷酸盐缓冲液,pH 6.8线性梯度洗脱。在0.46与0.64M NaCl之间洗脱的级分中鉴别出SynLubricin,并且将这些级分合并且不经进一步纯化即使用。
SynLubricin的聚糖谱分析
除非另外提及,否则所有试剂购自西格玛。通过在100℃下加热5分钟使重组SynLubricin变性。随后在45℃下用含19mg硼氢化钠(NaBH4)的500μL50mM氢氧化钠(NaOH)溶液处理变性蛋白18小时。将样品冷却,用10%乙酸中和,通过Dowex H+树脂柱,在氮气流下冻干,去除硼酸盐。使用先前报道的方法,使聚糖全甲基化以便通过质谱法进行结构表征。简单来说,将干燥洗脱液用二甲亚砜(DMSO)溶解,并且通过使用碘甲烷和NaOH-DMSO碱(通过混合DMSO与50%w/w NaOH溶液制备)甲基化。将反应用水淬灭,并且将反应混合物用二氯甲烷萃取并干燥。将全甲基化聚糖溶解于甲醇中并且用α-二羟基苯甲酸(DHBA,20mg/mL,在50%v/v甲醇:水中)基质结晶。使用AB SCIEX TOF/TOF 5800(Applied BiosystemMDS Analytical Technologies)质谱仪,通过MALDI-TOF/TOF-MS以正离子模式对样品中存在的聚糖进行分析。将来自样品的全甲基化聚糖通过具有HCD和CID片段化选项的ESI探针输注到Orbitrap Fusion Tribrid质谱仪上,用于进一步结构确认。通过简单母离子扫描以高分辨率获取聚糖的MS1和MS2谱,并且手动选择相应离子进行进一步MS/MS扫描。基于片段化模式和常见生物合成路径,手动并且通过使用Glycoworkbench软件进行聚糖结构指配。
摩擦学
使用如先前所描述的定制线性往复摩擦计(Gleghorn和Bonassar,2008)评定SynLubricin作为边界润滑剂的性能。简单来说,从新生牛腿膝关节的股骨髁收集圆柱状软骨外植体(6mm直径×2mm厚度)。使用1.5M NaCl中30分钟孵育,接着在PBS中1小时平衡步骤提取内源性软骨结合润滑素。将外植体在PBS、SynLubricin或牛滑液中孵育15-20分钟,随后在1mL相应流体浴中负载到摩擦计上。外植体抵靠玻璃相对面压缩到大约30%应变,并且允许在一小时的过程中减压。达到平衡法向负载之后,相对面以0.3mm/s的速度线性往复运动三个循环。同时,双轴负载记录法向和剪切负载。对于正向和反向以及在每个速度下,摩擦系数计算为滑动时的平均剪切力除以平衡法向负载。
统计分析
视需要使用Prism(GraphPad)通过单因素方差分析或学生t检验(双尾)确定统计显著性。对于润滑数据,进行单因素方差分析以及图基事后检验(Turkey’s post-hoctests)来比较所有润滑剂的平均摩擦系数。在Prism(GraphPad,加利福尼亚州拉荷亚(LaJolla,CA))中产生所有图。
第III部分补充表1:人PRG4同工型A和SynLubricin中串联重复的氨基酸组成。
Figure BDA0003263651390001021
以下序列为人SynLubricin、犬SynLubricin和马SynLubricin。斜体字表示分泌信号。加粗核苷酸前导与SynLubricin序列之间的GS。
DNA:
Figure BDA0003263651390001031
Figure BDA0003263651390001041
氨基酸:
Figure BDA0003263651390001042
Figure BDA0003263651390001051
犬SynLubricin
斜体字=犬分泌肽序列
DNA:
Figure BDA0003263651390001052
Figure BDA0003263651390001061
氨基酸:
Figure BDA0003263651390001062
(1)马SynLubricin
红色=马分泌肽序列
DNA:
Figure BDA0003263651390001063
Figure BDA0003263651390001071
氨基酸:
Figure BDA0003263651390001072
Figure BDA0003263651390001081
参考文献
Backliwal,G.,Hildinger,M.,Kuettel,I.,Delegrange,F.,Hacker,D.L.和Wurm,F.M.(2008).《丙戊酸:用于增强哺乳动物细胞培养物中蛋白质表达的丁酸钠的可行替代物(Valproic acid:a viable alternative to sodium butyrate for enhancing proteinexpression in mammalian cell cultures)》.《生物技术与生物工程》,101(1),182-189.//doi.org/10.1002/bit.21882
Backstrom,M.,Link,T.,Olson,F.J.,Karlsson,H.,Graham,R.,Picco,G.,…Hansson,G.C.(2003).《在中国仓鼠卵巢细胞中大量产生的具有乳腺癌样O-糖基化的重组MUC1粘蛋白(Recombinant MUC1 mucin with a breast cancer-like O-glycosylationproduced in large amounts in Chinese-hamster ovary cells)》.《生物化学杂志(Biochem J)》,376(第3部分),677-686.//doi.org/10.1042/bj20031130
Bahabri,S.A.,Suwairi,W.M.,Laxer,R.M.,Polinkovsky,A.,Dalaan,A.A.和Warman,M.L.(1998).《屈曲指-关节病-髋内翻-心包炎综合征:临床特征和人染色体1的基因定位(The camptodactyly-arthropathy-coxa vara-pericarditis syndrome:Clinicalfeatures and genetic mapping to human chromosome 1)》.《关节炎与风湿(Arthritis&Rheumatism)》,41(4),730-735.//doi.org/10.1002/1529-0131(199804)41:4<730::AID-ART22>3.0.CO;2-Y
Benson,G.(1999).《Tandem repeats finder:分析DNA序列的程序(Tandemrepeats finder:a program to analyze DNA sequences)》.《核酸研究》,27(2),573-580.//doi.org/10.1093/nar/27.2.573
Bosques,C.J.,Collins,B.E.,Meador,J.W.,Sarvaiya,H.,Murphy,J.L.,DelloRusso,G.,…Venkataraman,G.(2010).《中国仓鼠卵巢细胞可在蛋白质上产生半乳糖-α-1,3-半乳糖抗原(Chinese hamster ovary cells can produce galactose-α-1,3-galactose antigens on proteins)》.《自然·生物技术》,28(11),1153-1156.//doi.org/10.1038/nbt1110-1153
Boussif,O.,Lezoualc'h,F.,Zanta,M.A.,Mergny,M.D.,Scherman,D.,Demeneix,B.和Behr,J.P.(1995).《用于在培养物中和体内将基因和寡核苷酸转移到细胞中的多功能载体:聚乙烯亚胺(A versatile vector for gene and oligonucleotide transfer intocells in culture and in vivo:polyethylenimine)》.《美国国家科学院院刊》,92(16),7297-7301.//doi.org/10.1073/pnas.92.16.7297
Brooks,S.A.(2004).《用于人用途的重组蛋白的适当糖基化(Appropriateglycosylation of recombinant proteins for human use)》.《分子生物技术》,28(3),241-255.//doi.org/10.1385/MB:28:3:241
Butler,M.和Spearman,M.(2014).《哺乳动物细胞宿主的选择和糖基化工程的可能性(The choice of mammalian cell host and possibilities for glycosylationengineering)》.《生物技术新见》,30,107-112.//doi.org/10.1016/j.copbio.2014.06.010
de los Milagros Bassani Molinas,M.,Beer,C.,Hesse,F.,Wirth,M.和Wagner,R.(2014).《通过核苷酸比率监测优化用于蛋白质产生的HEK-293悬浮细胞的瞬时转染过程(Optimizing the transient transfection process of HEK-293suspension cells forprotein production by nucleotide ratio monitoring)》.《细胞技术》,66(3),493-514.//doi.org/10.1007/s10616-013-9601-3
Dhanisha,S.S.,Guruvayoorappan,C.,Drishya,S.和Abeesh,P.(2018).《粘蛋白:结构多样性、生物合成、其在致病机制中的作用以及可能治疗靶标(Mucins:Structuraldiversity,biosynthesis,its role in pathogenesis and as possible therapeutictargets)》.《肿瘤学/血液学关键评论(Critical Reviews in Oncology/Hematology)》,122,98-122.//doi.org/10.1016/j.critrevonc.2017.12.006
Dumont,J.,Euwart,D.,Mei,B.,Estes,S.和Kshirsagar,R.(2016).《用于生物医药制造的人细胞系:历史、现状和未来视角》.《生物技术关键评论》,36(6),1110-1122.//doi.org/10.3109/07388551.2015.1084266
Durocher,Y.,Perret,S.和Kamen,A.(2002).《通过瞬时转染悬浮生长人293-EBNA1细胞进行的高水平和高通量重组蛋白产生》.《核酸研究》,30(2),E9.
Elsaid,K.A.,Fleming,B.C.,Oksendahl,H.L.,Machan,J.T.,Fadale,P.D.,Hulstyn,M.J.,…Jay,G.D.(2008).《前十字韧带损伤患者的滑液中降低的润滑素浓度和关节炎症标志物(Decreased lubricin concentrations and markers of jointinflammation in the synovial fluid of patients with anterior cruciateligament injury)》.《关节炎与风湿》,58(6),1707-1715.//doi.org/10.1002/art.23495
Estrella,R.P.,Whitelock,J.M.,Packer,N.H.和Karlsson,N.G.(2010).《人滑膜润滑素的糖基化:其在炎症中的作用的推论(The glycosylation of human synoviallubricin:implications for its role in inflammation)》.《生物化学杂志(Biochemical Journal)》,429(2),359-367.//doi.org/10.1042/bj20100360
Flannery,C.R.,Zollner,R.,Corcoran,C.,Jones,A.R.,Root,A.,Rivera-Bermudez,M.A.,…Glasson,S.S.(2009).《通过用重组润滑素进行关节内治疗预防骨关节炎大鼠模型中的软骨退变(Prevention of cartilage degeneration in a rat model ofosteoarthritis by intraarticular treatment with recombinant lubricin)》.《关节炎与风湿病(Arthritis Rheum)》,60(3),840-847.//doi.org/10.1002/art.24304
Gemayel,R.,Vinces,M.D.,Legendre,M.和Verstrepen,K.J.(2010).《可变串联重复加速编码和调节序列的进化》.《遗传学年度评论》,44(1),445-477.//doi.org/10.1146/annurev-genet-072610-155046
Ghaderi,D.,Zhang,M.,Hurtado-Ziola,N.和Varki,A.(2012).《生物治疗性糖蛋白的产生平台。非人唾液酸化的发生、影响和挑战》.《生物技术与基因工程评论》,28,147-175.//doi.org/10.5661/bger-28-147
Gipson,I.K.,Spurr-Michaud,S.,Tisdale,A.和Menon,B.B.(2014).《跨膜粘蛋白MUC1和MUC16在上皮屏障功能中的比较(Comparison of the Transmembrane Mucins MUC1and MUC16 in Epithelial Barrier Function).《公共科学图书馆·综合》,9(6),e100393.//doi.org/10.1371/journal.pone.0100393
Gleghorn,J.P.和Bonassar,L.J.(2008).《使用斯特里贝克表面的关节软骨润滑模式分析(Lubrication mode analysis of articular cartilage using Stribecksurfaces)》.《生物力学杂志(J Biomech)》,41(9),1910-1918.//doi.org/10.1016/j.jbiomech.2008.03.043
Hang,H.C.和Bertozzi,C.R.(2005).《粘蛋白型O-连接糖基化的化学和生物学(The chemistry and biology of mucin-type O-linked glycosylation)》.《生物有机化学与医药化学(Bioorganic&Medicinal Chemistry)》,13(17),5021-5034.//doi.org/10.1016/j.bmc.2005.04.085
Hattrup,C.L.和Gendler,S.J.(2008).《细胞表面(系栓)粘蛋白的结构和功能(Structure and Function of the Cell Surface(Tethered)Mucins)》.《生理学年度评论》,70(1),431-457.//doi.org/10.1146/annurev.physiol.70.113006.100659
Jones,A.R.C.,Gleghorn,J.P.,Hughes,C.E.,Fitz,L.J.,Zollner,R.,Wainwright,S.D.,…Flannery,C.R.(2007).《重组润滑素与关节软骨表面的结合和定位(Binding and localization of recombinant lubricin to articular cartilagesurfaces)》.《矫形外科研究杂志(Journal of Orthopaedic Research)》,25(3),283-292.//doi.org/doi:10.1002/jor.20325
Kosinska,M.K.,Ludwig,T.E.,Liebisch,G.,Zhang,R.,Siebert,H.-C.,Wilhelm,J.,…Steinmeyer,J.(2015).《在骨关节炎和类风湿性关节炎期间的关节润滑剂显示改变水平和分子物种(Articular Joint Lubricants during Osteoarthritis andRheumatoid Arthritis Display Altered Levels and Molecular Species)》.《公共科学图书馆·综合》,10(5),e0125192.//doi.org/10.1371/journal.pone.0125192
Kosuri,S.和Church,G.M.(2014).《大规模从头DNA合成:技术和应用(Large-scale de novo DNA synthesis:technologies and applications)》.《自然·方法》,11,499.//doi.org/10.1038/nmeth.2918
Kuo,J.C.-H.,Gandhi,J.G.,Zia,R.N.和Paszek,M.J.(2018).《癌细胞糖萼的物理生物学》.《自然·物理学》,14(7),658-669.//doi.org/10.1038/s41567-018-0186-9
Le Graverand-Gastineau,M.P.(2010).《疾病修改骨关节炎药物:面临开发挑战和挑选分子靶标(Disease modifying osteoarthritis drugs:facing developmentchallenges and choosing molecular targets)》.《当前药物靶标(Curr DrugTargets)》,11(5),528-535.//doi.org/10.2174/138945010791011893
López Castel,A.,Cleary,J.D.和Pearson,C.E.(2010).《作为人疾病基础和疗法潜在靶标的重复不稳定性(Repeat instability as the basis for human diseases andas a potential target for therapy)》.《自然综述·分子细胞生物学(Nature ReviewsMolecular Cell Biology)》,11,165.//doi.org/10.1038/nrm2854
Mantelli,F.和Argüeso,P.(2008).《眼表面粘蛋白在健康和疾病中的作用(Functions of ocular surface mucins in health and disease)》.《过敏和临床免疫学当前观点(Current Opinion in Allergy and Clinical Immunology)》,8(5),477-483.//doi.org/10.1097/ACI.0b013e32830e6b04
Marcelino,J.,Carpten,J.D.,Suwairi,W.M.,Gutierrez,O.M.,Schwartz,S.,Robbins,C.,…Warman,M.L.(1999).《编码分泌型蛋白聚糖的CACP在屈曲指-关节病-髋内翻-心包炎综合征中突变(CACP,encoding a secreted proteoglycan,is mutated incamptodactyly-arthropathy-coxa vara-pericarditis syndrome)》.《自然·遗传学(Nature Genetics)》,23,319.//doi.org/10.1038/15496
Mauris,J.和Argüeso,P.(2012).《眼表面健康和疾病中的粘蛋白和半乳糖凝集素-3(Mucins and Galectin-3in Ocular Surface Health and Disease)》.在《靶向治疗剂的半乳糖凝集素和疾病推论(Galectins and Disease Implications for TargetedTherapeutics)》(第1115卷,第409-414页)中.美国化学会(American ChemicalSociety).//doi.org/10.1021/bk-2012-1115.ch025
Nath,S.和Mukherjee,P.(2014).《Muc1:在癌症进展中具有关键作用的多方面癌蛋白(Muc1:a multifaceted oncoprotein with a key role in cancer progression)》.《分子医学趋势(Trends in Molecular Medicine)》,20(6),332-342.//doi.org/10.1016/j.molmed.2014.02.007
Oren,M.,Barela Hudgell,M.A.,D'Allura,B.,Agronin,J.,Gross,A.,Podini,D.和Smith,L.C.(2016).《快速多样化免疫基因家族中的短串联重复、节段性重复、基因缺失和基因组不稳定性》.《BMC基因组学》,17,900.//doi.org/10.1186/s12864-016-3241-x
Pearson,C.E.,Edamura,K.N.和Cleary,J.D.(2005).《重复不稳定性:动态突变的机制(Repeat instability:mechanisms of dynamic mutations)》.《自然综述·遗传学(Nature Reviews Genetics)》,6,729.//doi.org/10.1038/nrg1689
Reesink,H.L.,Bonnevie,E.D.,Liu,S.,Shurer,C.R.,Hollander,M.J.,Bonassar,L.J.和Nixon,A.J.(2016).《半乳糖凝集素-3结合润滑素并且加强关节软骨的润滑边界层(Galectin-3Binds to Lubricin and Reinforces the Lubricating BoundaryLayer of Articular Cartilage)》.《科学报告(Scientific Reports)》,6,25463.//doi.org/10.1038/srep25463
Rhee,D.K.,Marcelino,J.,Baker,M.,Gong,Y.,Smits,P.,Lefebvre,V.,…Carpten,J.D.(2005).《分泌型糖蛋白润滑素保护软骨表面并且抑制滑膜细胞过度生长(The secreted glycoprotein lubricin protects cartilage surfaces and inhibitssynovial cell overgrowth)》.《临床研究杂志(J Clin Invest)》,115(3),622-631.//doi.org/10.1172/jci22263
Samsom,M.L.,Morrison,S.,Masala,N.,Sullivan,B.D.,Sullivan,D.A.,Sheardown,H.和Schmidt,T.A.(2014).《全长重组人蛋白聚糖4表征为眼表面边界润滑剂(Characterization of full-length recombinant human Proteoglycan 4as an ocularsurface boundary lubricant)》.《实验眼科研究(Experimental Eye Research)》,127,14-19.//doi.org/10.1016/j.exer.2014.06.015
Schindelin,J.,Arganda-Carreras,I.,Frise,E.,Kaynig,V.,Longair,M.,Pietzsch,T.,…Cardona,A.(2012).《Fiji:生物图像分析的开源平台》.《自然·方法》.//doi.org/10.1038/nmeth.2019
Schmidt,T.A.,Sullivan,D.A.,Knop,E.等人(2013).《边界润滑剂润滑素在眼表面的转录、翻译和功能(Transcription,translation,and function of lubricin,aboundary lubricant,at the ocular surface)》.《美国医学会杂志·眼科学(JAMAOphthalmology)》,131(6),766-776.//doi.org/10.1001/jamaophthalmol.2013.2385
Shurer,C.R.,Colville,M.J.,Gupta,V.K.,Head,S.E.,Kai,F.,Lakins,J.N.和Paszek,M.J.(2018).《糖萼工程化的遗传编码工具箱:对细胞粘附、存活和癌细胞行为的可调控制》.《ACS生物材料科学与工程》,4(2),388-399.//doi.org/10.1021/acsbiomaterials.7b00037
Sonawane,N.D.,Szoka Jr.,F.C.和Verkman,A.S.(2003).《内体中氯化物积聚和膨胀增强通过聚胺-DNA聚合复合物进行的DNA转移(Chloride accumulation andswelling in endosomes enhances DNA transfer by polyamine-DNA polyplexes)》.《生物化学杂志》,278(45),44826-44831.//doi.org/10.1074/jbc.M308643200
Tang,N.C.和Chilkoti,A.(2016).《组合密码子加扰实现重复蛋白质的可缩放基因合成和扩增》.《自然·材料》,15(4),419-424.//doi.org/10.1038/nmat4521
第IV部分
除其它方面之外,此第IV部分提供由糖萼进行膜形状调节的物理原理的描述。
与此第IV部分有关,众所周知细胞将其质膜弯曲为高度弯曲形式以与局部环境相互作用,但如何调节形状产生未完全解决。此第IV部分描述细胞内部的形状产生过程与细胞表面糖萼的外部组织和组成之间的广泛协同作用。糖萼内的粘蛋白生物聚合物和长链多糖可产生熵力,其有利于或不利于球形和指状延伸部从细胞表面突出。糖萼的聚合物刷模型成功地预测聚合物大小和细胞表面密度对膜形态的影响。特定糖萼组成也可诱导质膜不稳定性,以产生更多外来波状和珠化膜结构并且驱动细胞外囊泡分泌。总之,此第IV部分中呈现的结果表明糖萼在调节弯曲膜特征方面的根本作用,所述特征在细胞之间和与细胞外基质的不同通讯模式中发挥作用。
第IV部分引言
质膜的管状和球形延伸部在人发育和日常细胞功能中起关键作用。虽然长期以来认识到弯曲膜突出部分增加细胞表面积用于分泌、吸收和受体介导的通讯,但现代研究已提供更多样且复杂功能的令人信服的实例(Marshall,2012)。举例来说,适应性免疫系统的T细胞产生高密度管状微绒毛以接合抗原呈递细胞,并且此类结构对于工程化免疫细胞疗法识别肿瘤细胞可能同样重要(D'Aloia等人,2018;Jung等人,2016)。膜突出还实现长范围内和组织中精确三维位置处的细胞间通讯。在发育期间,称作细胞导管(cytoneme)的长且细的膜突出部将形态发生素从‘发送者’细胞精确递送到长达40微米外的特定‘接收者’细胞(Bischoff等人,2013;Kornberg和Roy,2014)。还已知干细胞、免疫细胞和许多其它细胞类型将其质膜弯曲成直接脱落并且可远距离递送大分子货物的球形微囊泡(Tricarico等人,2017)。此外,弯曲膜特征在物理细胞行为,包括迁移和力传导中普遍存在。举例来说,称作泡的球形膜膨胀由原始生殖细胞、肿瘤细胞和其它细胞类型产生,用于在迁移期间突出和与组织基质摩擦耦合(Paluch和Raz,2013)。
膜形状产生过程失调可直接促进疾病进展。作为一个值得注意的实例,侵袭性肿瘤细胞频繁延伸大量微绒毛以便在血管中粘附和滚动(Kramer和Nicolson,1979;Liu等人,2018)。侵袭性肿瘤细胞还可突出泡以便进行变形虫状迁移(Bergert等人,2015;Friedl和Wolf,2010)。微囊泡通常以异常高速率从肿瘤细胞质膜出芽(Antonyak等人,2011;Becker等人,2016)。目前认识到这些粒子携带的货物具有不同调节作用,包括对基质中的其它细胞类型进行重编程和用于定殖的远处转移生态位的准备(Becker等人,2016)。
断定源自细胞骨架动力学的力产生细胞表面上不同球形和管状结构的膜曲率。设想聚合细胞骨架微丝沿质膜在离散点推出以便延伸微绒毛、鞭毛、丝状伪足和其它指状突出部(Footer等人,2007;Gupton和Gertler,2007;Peskin等人,1993)。在泡形成期间,细胞骨架的收缩产生膜的球形膨胀的流体静压力(Charras等人,2005)。将质膜子区弯曲成微囊泡的物理动力学仍未充分理解;然而,报道已暗示其生物合成中的肌动蛋白细胞骨架(Tricarico等人,2017)。
虽然细胞表面糖萼未在典型膜形状调节模型中突出显示,但在正常状态和疾病状态两者下,糖萼组成与细胞表面形态之间的相关性很高。在正常细胞生理中,称作粘蛋白的多肽和糖共聚物以高密度频繁锚定在上皮微绒毛(Hattrup和Gendler,2008;Kesavan等人,2009;Kesimer等人,2013)、鞭毛(Button等人,2012)和丝状伪足(Bennett等人,2001)表面上;而透明质酸聚合物密集地涂布卵母细胞和间皮的微绒毛(Evanko等人,2007;MakabeSayoko等人,2006);并且唾液酸和透明质酸的长链修饰神经元轴突的高度弯曲表面(Fowke等人,2017;van den Pol和Kim,1993;Zhang等人,1992)。T细胞和树突状细胞在激活或成熟后表达细胞表面粘蛋白,激活或成熟通常与膜管状化和微绒毛产生的剧烈变化一致(Agrawal等人,1998;Cloosen等人,2004;Jung等人,2016;Pilon等人,2009)。侵袭性肿瘤细胞经常在其细胞表面产生大量粘蛋白和透明质酸(Kufe,2009;Turley等人,2016),并且有传闻这些聚合物的表达与其独特膜特征,如广泛微绒毛有关(Polefka等人,1984)。粘蛋白和透明质酸聚合物还密集地排列在肠细胞、反应性星形胶质细胞、树突状细胞和已知分泌高水平微囊泡的肿瘤细胞的表面上(Cloosen等人,2004,2004;Gangoda等人;McConnell等人,2009;Paszek等人,2014;Pelaseyed等人;Tricarico等人,2017)。虽然这些相关性的普遍存在表明糖萼聚合物组成与质膜形态之间的可能因果关系,但尚未描述特定作用机制。本公开有助于理解此作用机制。
粘蛋白和长链多糖锚定于膜,其方式为使得长聚合物链或环预期从细胞表面延伸(Hattrup和Gendler,2008;Lee等人,1993)。该集合类似聚合物物理中称作刷的充分研究的结构,其中聚合物在一端接枝到表面(Chen等人,2017)。聚合物刷理论早已认识到密集拥挤的刷的空间相互作用限制每种聚合物可探索的分子构型的数目,从而通过减少的熵来增加系统的自由能(de Gennes,1980)。类似于气体压力的热力学基础,与分子拥挤相关的熵惩罚理论上可产生足以使柔性表面,如膜变形的压力(Hiergeist和Lipowsky,1996;Lipowsky,1995)。
结果
糖萼聚合物和膜形态:
在此第IV部分中,我们分析了糖萼聚合物是否可产生熵弯曲力以促进特定膜形式的形成。作为对此的推论,我们测试了是否可通过合理操纵糖萼来调节出现的膜结构。
为了对此进行测试,我们构建了不同大小、骨架序列和膜锚定的天然、半合成和合理设计的粘蛋白聚合物的遗传编码文库(图33A和图36A)。每种构建体编码粘蛋白聚合物结构域,其由具有高密度的用于O-糖基化的丝氨酸和苏氨酸位点的非结构化多肽骨架组成。当在细胞中表达时,粘蛋白结构域经O-连接糖侧链翻译后修饰,以形成限定粘蛋白的瓶刷分子结构(图38A、B)。
文库中的聚合物结构域包括粘蛋白-1的42个天然串联重复(TR)(Muc1-42TR)、足糖萼蛋白的富含丝氨酸和苏氨酸的聚合物结构域(Podxl;富S/T)、以及我们通过80个完美重复的串联融合合理设计和构建的新合成粘蛋白,重复基于粘蛋白O-糖基化序列的共有序列PPASTSAPGA(合理)(图33A和图38A)。每个聚合物结构域融合到缺失细胞质尾区的天然Muc1跨膜锚(ΔCT),或21个氨基酸的合成跨膜锚(TM21),或具有用于成像的膜近端绿色荧光蛋白的天然粘蛋白锚(GFP-ΔCT)(图33A和图38A)。
当在上皮细胞表面上以高水平表达和组装时,如通过扫描电子显微(SEM)观察到的,我们的文库中的每种粘蛋白聚合物触发质膜的剧烈管状化(图33B、C和图38B)。不希望受任何特定理论束缚,我们推断此管状化可能为聚合物锚定于质膜的一般结果,并且不需要特定生物聚合物序列或跨膜锚。值得注意的是,除细胞质尾区以外,Muc1-42TRΔCT与天然粘蛋白-1相同,指示除我们的合理设计的聚合物之外,天然糖萼组分可影响质膜形态。粘蛋白表达对内吞作用无显著影响,反驳了脂质再循环和膜张力调节作为形态变化的主要机制(图38C、D)。
管状化现象对粘蛋白聚合物结构域的长度相对不敏感,其条件是聚合物以中到高密度在细胞表面上表达。0、10或42个Muc1重复的cDNA与加GFP标签的跨膜锚融合,以编码预期轮廓长度分别为0、65和270nm的细胞表面粘蛋白(图33D和图38E)。使用探测细胞表面GFP的纳米抗体将表达构建体的细胞系分选到具有相似粘蛋白表面密度的群体中(图33D)。柔性聚合物结构域是有效膜管状化所需的,并且尽管10和42-TR粘蛋白大小有差异,但其诱导相当水平的膜管状化(图33E和图38F)。我们比较了相似扩散面积的细胞,以排除膜表面张力和与细胞扩散相关的其它效应的变化可解释形态差异的可能性(图33E)。
类似于粘蛋白,我们发现富含大型线性多糖的糖萼也可触发质膜形态的剧烈变化。值得注意的是,透明质酸合酶3(HAS3)表达提高了细胞表面上高分子量透明质酸(HA)聚合物的密度,并且引起许多指状膜延伸部突出(图36A-D),与其他人的先前观察结果(Koistinen等人,2015)一致。总之,这些结果表明不同糖萼聚合物类型和大小可影响细胞形态状态。
我们接下来测试了糖萼生物聚合物是否可在独立于细胞内机制的模型膜中诱导自发曲率。当锚定于巨大单层囊泡(GUV)的表面时,我们发现Podxl的富S/T聚合物结构域触发球形和管状膜结构的自发产生(图33F和图37A、B)。还在极高密度折叠蛋白质(人血清白蛋白(HSA))中观察到小管,与折叠或本质无序蛋白质的大量群集可诱导GUV中的自发膜曲率的先前研究结果(Stachowiak等人,2010)一致(图33F和图37B、C)。然而,与HSA相比,Podxl粘蛋白诱导自发管状化所需的表面密度显著较低(图33F和图37B)。
体内特化细胞:
受这些体外观察结果推动,我们考虑了糖萼聚合物是否可在体内特化细胞类型的形态成形中起作用。我们选择评估滑膜细胞,因为已知这些分泌细胞产生大量用于关节润滑的HA,并且因此预期在其表面上显示高密度HA聚合物。我们从马膝头分离滑膜组织(图34A),发现表达HAS3的初代滑膜细胞高度小管化,但用透明质酸酶(HyA)处理以降解HA引起快速去稳定和膜小管消失(图34B、C)。我们还评估了新提取并且简短离体培养(<1小时)的组织中的滑膜细胞形态。天然滑膜组织中的滑膜细胞显示富HA头部,其呈现高度小管化并且从组织基质突出(图34D、E)。离体用HyA短暂处理组织引起滑膜细胞小管剧烈回缩,表明糖萼在体内维持膜突出中的作用(图34E)。
聚合物刷框架:
我们考虑了观察到的膜形状和其频率是否可通过聚合物刷理论的框架来合理化。我们注意到聚合物物理中针对端接枝聚合物经典地描述了两种限制体系:“蘑菇”体系,其中低接枝密度下的聚合物彼此具有有限相互作用,以及“刷”体系,其中拥挤的聚合物可彼此空间和静电相互作用以对锚定表面施加较大压力(Milner,1991)(图38A)。对于粘蛋白,我们预期蘑菇到刷体系的转变以如下表面密度发生,其中聚合物之间的平均距离为其在溶液中回转半径的大约两倍(图38A)。
为了测量个体粘蛋白的回转半径和柔性,我们产生了末端纯化标签代替跨膜锚的重组Muc1-42TR(图41A-C)。尺寸排阻色谱联合多角度光散射(SEC-MALS)报告生理缓冲液中粘蛋白回转半径为32nm±0.4%。基于大约270nm的估计Muc1-42TR轮廓长度,并且同样不希望受任何特定理论束缚,我们推断粘蛋白具有大约7.5nm的持续长度并且在溶液中采取半柔性聚合物预期的延伸无规卷曲构型。
我们接下来测试了聚合物刷理论是否可捕获细胞表面上粘蛋白集合的物理行为。我们测试了粘蛋白是否随其逐渐变得更拥挤而以可预测方式拉伸和延伸,这是Alexander和de Gennes在其关于聚合物刷的开创性理论中最初描述的特征物理行为(Alexander,1977;Milner,1991)。我们选择评估类似于微绒毛的含肌动蛋白小管上的粘蛋白延伸,因为这些结构的曲率高度均匀并且基本上独立于粘蛋白表面密度(图41D)。因此,我们能够将小管表面近似为固定半径的刚性圆柱体以便与经典理论直接比较。构建具有侧接粘蛋白聚合物结构域的互补表位标签的Muc1-42TR的cDNA。在细胞表达之后,将编码标签用荧光团缀合探针标记,并且使用称作膨胀显微法(ExM)的超分辨率光学技术在微绒毛横截面上分辨(图35B和图41E)。我们发现粘蛋白延伸与荧光强度和因此的表面密度具有指数依赖性,或‘标度’,指数为0.48±0.10(图35B)。对于在生理盐浓度下接枝于刚性圆柱形表面上的聚电解质,此值与理论推导的0.33与0.5之间的幂律指数相当(Zhulina和Borisov,1996)。
我们创建了聚合物刷模型以描述质膜上组装的富粘蛋白糖萼的物理行为。由粘蛋白刷贡献的熵压力产生自发膜曲率,其随聚合物密度强烈按比例调整并且随聚合物链长度微弱按比例调整(Hiergeist和Lipowsky,1996)(图35C和图42)。对聚合物长度的弱依赖性与以下研究结果一致:具有10和42个重复的粘蛋白对细胞表面形态的影响相当,尽管其大小相差4倍(图33E和图38F)。对于这两种粘蛋白,我们的刷模型预测在自发膜曲率的诱导方面仅有约20%差异(图42)。
优选的膜形状:
我们测试了聚合物模型是否可解释来自细胞表面的指状和球形突出部分的频率。我们推断,当需要高细胞内力来延伸或维持突出时特定膜特征的突出是不利的,并且当这些力要求最小时突出是有利的。使具有诱导自发曲率的膜的标准赫尔弗里赫(Helfrich)自由能函数最小化,我们计算了维持球形膜泡所需的平衡胞质压力和维持膜小管所需的点力(图36D)。对于实验比较,我们评估了作为粘蛋白细胞表面密度的函数的质膜特征的类型、大小和频率。将表达Muc1-42TR GFP的细胞用抗GFP纳米抗体标记,并且分选到不同粘蛋白表面水平的群体中(图36A)。通过使用纳米抗体标准曲线内插,通过SDS-PAGE预估每个群体中的平均粘蛋白表面密度(图43)。分选群体中的分子表面密度在180到约50,000个粘蛋白/μm2的范围内。为参考,基于溶液中重组Muc1-42TR的测量的回转半径,我们预期蘑菇到刷的转变发生在大约250个粘蛋白/μm2
最初,我们评估了膜泡。使用针对Muc1-42TR测量的物理参数,我们预测维持具有250nm的典型半径的泡所需的压力将在接近蘑菇-刷转变的中度粘蛋白密度下最小(图35D)。出人意料的模型预测为所需维持压力将在较高粘蛋白密度下急剧上升,快速达到超过细胞的收缩机制已知限度的压力(Charras等人,2008)。因此,理论表明起泡将受高度密集糖萼抑制(图35D)。我们的实验观察结果显示与这些预测的良好定性一致。粘蛋白密度接近所估计的蘑菇-刷转变的细胞显示相当大数目的大型泡样形式,平均半径为260±100nm(图36B-D;180个粘蛋白/μm2)。在交换到刷体系中之后,泡频率突然地下降,与必需泡维持压力的二次上升的模型预测一致(图36B、D)。
糖萼聚合物模型预测小管突出对粘蛋白密度的非常不同的依赖性。维持延伸小管所需的预测点力随高粘蛋白密度逐渐地减小,且未展现急剧转变(图35D)。因此,我们的分选细胞群中观察到的细胞表面小管的频率在整个蘑菇和刷体系中随粘蛋白密度不断提高,直到细胞在极高粘蛋白密度下完全被管饱和(图36B-E)。值得注意的是,理论预测在这些高密度下,小管延伸所需的力与单一细胞骨架微丝的聚合力相当,约1pN(Footer等人,2007)。基于以实验方式测量的粘蛋白密度,我们估计维持小管所需的理论点力f。值得注意地,以实验方式观察到的管频率与理论点力几乎完美逆相关(图36F)。描述管密度与1/f之间关系的皮尔森相关系数为0.97。
聚合物模型还预测由高粘蛋白表面密度产生的自发曲率超过我们在细胞表面上观察到的指状突出部分的曲率。我们注意到我们的细胞上的管状膜突出部分典型地含有丝状肌动蛋白(F-肌动蛋白)核心并且不含微管(图37A、B,图44A-D)。用药物拉春库林A(LatA)破坏F-肌动蛋白组装引起小管直径减小大约30nm(图37C、D和图44E、F),指示粘蛋白诱导的自发曲率超过稳定肌动蛋白填充的突出部分的曲率。应注意,我们对LatA处理的细胞的测量可能排除了极细且脆弱的膜小管,其难以在整个SEM样品制备中保存。尽管如此,这些结果清楚地指示由糖萼产生的自发曲率可满足或超过特征直径为大约100-200nm的细指状突出部分,如微管、鞭毛、丝状伪足、轴突和细胞导管的曲率需求。
膜不稳定性和细胞外囊泡产生:
我们接下来考虑了是否可通过糖萼的作用产生其它功能性膜形状。我们注意到已知自发曲率的逐渐增加触发膜不稳定性和膜囊泡的形态变化(Campelo和Hernández-Machado,2007;Tsafrir等人,2001)。因此,我们推断如果生理学上抵抗粘蛋白自发曲率的F-肌动蛋白核心被破坏,则可产生膜不稳定性。实际上,我们的模型表明约400个粘蛋白/μm2或更多将足以驱动小管中的膜不稳定性。因此,我们观察到LatA处理触发作为膜不稳定性的特征的珠化和波状结构形成(图37D)。
Deuling、Helfrich和其他人在理论上考虑了体积与面积比λ的膜小管中的不稳定性,并且发现对于某些自发曲率c0,膜弯曲能量通过采用三个“狄洛尼(Delaunay)”形状之一消失:对于c0=1/2λ,圆柱形(形状1);对于1/2λ<c0<2/3λ,一组平滑变化的波状体(形状2);以及对于c0=2/3λ,一组相等大小的“珠”(形状3)(Campelo和Hernández-Machado,2007;Tsafrir等人,2001)。对于超过2/3λ的自发曲率,发现满足体积和表面积约束的最低能量形状包括一组具有优选曲率的小珠,以及一个或多个保持过量体积所需的大珠(形状4)和一组梯度大小的珠(形状5)(Campelo和Hernández-Machado,2007;Tsafrir等人,2001)。我们评估了最小能量表面形状1-5是否将在无外源处理的情况下形成于表达中到高水平粘蛋白的细胞上,并且发现每种预期形状的常见实例(图37E)。这些形状的观察结果为膜不稳定性可由糖萼的特定组成驱动提供令人信服的论点。
值得注意地,我们发现膜珠化是朝向直接从质膜分泌细胞外囊泡的中间步骤(图37F)。与对照相比,来自表达Muc1-42TR的细胞的条件培养基含有高浓度的大小在大约100-nm到400-nm范围内的粒子(图5G),这是微囊泡的特征(Pol等人,2016)。通过LatA处理以破坏表面突出部分的支持F-肌动蛋白核心并且使质膜局部去稳定,进一步增强粒子产生(图37H)。低温透射电子显微法(低温TEM)证实分泌的粒子实际上为膜囊泡并且在其表面上接枝有明显的糖萼超微结构(图37I)。在先报道显示囊泡产生自肠细胞和其它表达粘蛋白的细胞中的微绒毛(McConnell等人,2009),本发明的这些观察结果与此一致。然而,并且不希望受任何特定理论束缚,我们的结果目前暗示微囊泡产生的可能三步机制:(1)细胞骨架微丝帮助以糖萼依赖性方式延伸且稳定来自质膜的长且细的突出部分;(2)在细胞骨架核心分解之后,糖萼施加的自发曲率诱导小管的膜不稳定性;以及(3)膜珠夹断以释放囊泡(图5E、F)。
讨论
此第IV部分中呈现的描述暗示熵机制,糖萼通过此可强烈影响不同质膜形状和突出部分的偏好度。由糖萼调节的形态变化原则上可对膜过程具有广泛影响,从吸收和分泌到细胞通讯、信号传导和运动(Lange,2011;Paluch和Raz,2013;Sauvanet等人,2015;Schmick和Bastiaens,2014)。鉴于糖基化变化显著且与细胞命运转变联合变化(Buck等人,1971;Freeze,2013;Satomaa等人,2009),并且用于构建糖萼聚合物的单体库与特定代谢程序紧密相关(Dennis等人,2009;Koistinen等人,2015;Ying等人,2012),此第IV部分提高了令人感兴趣的可能性,即糖萼可充当将物理形态与特定细胞状态相关联的管道。
用于理解膜形状调节的当代框架在很大程度上缺乏对糖萼的物理描述。然而,几乎普遍地发现糖萼中的长链生物聚合物锚定于弯曲膜特征和细胞表面细胞器的表面(Bennett等人,2001;Button等人,2012;Evanko等人,2007;Fowke等人,2017;Hattrup和Gendler,2008;Kesavan等人,2009;Kesimer等人,2013;Makabe Sayoko等人,2006;van denPol和Kim,1993;Zhang等人,1992)。此第IV部分中的结果表明可采用聚合物物理的原理和理论来理解(至少首先近似)糖萼对膜形状产生的物理调节。端锚定的聚合物蘑菇和聚合物刷的模型是糖萼的简单物理表示。实际糖萼架构可包括交联、缠结和分子不均匀性的额外层次结构(Tammi等人,2002)。然而,如使用相对简单的糖萼模型估计的,膜延伸的力需求与以实验方式观察到的这些延伸的频率之间的几乎完美逆关系证明,糖萼的至少一些物理行为可使用聚合物网络模型捕获。实际上,根据由de Gennes和其他人针对聚合物刷开发的经典标度律(Gennes,1979;Zhulina和Borisov,1996),我们发现糖萼聚合物延伸与细胞表面密度相关。
糖萼和细胞内形状产生过程如何在空间和时间上协调以控制膜突出未得到完全解决。特定来说,Rho家族GTP酶为细胞骨架动力学和细胞表面形态的主调节子(Hall,1998)。此第IV部分中的描述表明通过调节对膜弯曲的屏障,糖萼使膜准备膨胀成经受RhoGTP酶调节的特定类型的球形或管状形式。此整合观点表明可通过细胞内形状产生过程、糖萼聚合物组装或两者的失调来实现对正常细胞表面形态的干扰。举例来说,Rho GTP酶信号传导、细胞骨架动力学和糖萼组装的失调均为癌细胞的常见标志(Paszek等人,2014;Pinho和Reis,2015;Porter等人,2016;Yamaguchi和Condeelis,2007),并且各自可促成独特细胞表面动力学,其促成转移性癌细胞的致命性。
锚定聚合物使表面弯曲为一般物理现象。因此,糖萼对膜形状的调节可为所有细胞类型中相关的通用特征。未来努力可阐明糖萼在特定膜细胞器和信号传导结构,包括鞭毛、轴突、细胞导管和微绒毛的生物合成中的物理功能。尽管如此,此第IV部分中的描述支持膜形状调节的更整体模型,其包括对质膜的细胞内面和细胞外面两者上的力的考虑。
方法
抗体和试剂。使用以下抗体:FITC-人CD227(Muc1)(559774,BD生物科学)、人CD227(555925,BD生物科学)(Muc1)、Alexa Flour 488人足糖萼蛋白(222328,安迪生物公司(R&DSystems))、肌动蛋白(sc1615,圣克鲁兹)、GFP(4B10,2955S,Cell Signaling)、6×His(9000012,BD生物科学)、山羊抗小鼠IgG-HRP(sc-2005,圣克鲁兹)、小鼠抗山羊IgG-HRP(sc-2354,圣克鲁兹)。使用的凝集素为:生物素化花生凝集素(PNA;B-1075,VectorLaboratories)、CF568 PNA(29061,Biotium)、CF640R PNA(29063,Biotium)、CF633麦胚凝集素(WGA;29024,Biotium)。使用ExtrAvidin-过氧化物酶(E2886,西格玛)检测生物素化凝集素。透明质酸(HA)在印迹中用荧光标记或生物素化牛鼻透明质酸结合蛋白(HABP,密理博)探测。生物素-HABP用辣根过氧化物酶缀合链霉亲和素(HRP-链霉亲和素;安迪生物公司)检测。对于HA ELISA,DuoSet透明质酸试剂盒来自安迪生物公司。肌动蛋白解聚通过用拉春库林A(LatA;76343-93-6;Cayman Chemicals)处理诱导。
对于形成巨大单层囊泡(GUV),1,2-二油酰基-sn-甘油-3-磷酸胆碱(DOPC)和1,2-二油酰基-sn-甘油-3-((N-(5-氨基-1-羧基戊基)亚氨基二乙酸)丁二酰基),含镍盐(DOGS-NTA-Ni)购自Avanti Polar Lipids;2-(4,4-二氟-5,7-二甲基-4-硼-3a,4a-二氮杂-s-吲哒生-3-戊酰基)-1-十六酰基-sn-甘油-2-磷酸胆碱(氟硼荧-PC)购自英杰;加His标签的重组人足糖萼蛋白(Ser23-Arg427;登录号AAB61574.1)来自安迪生物公司;加His标签的人血清白蛋白(登录号NP_000468)来自ACROBiosystems。
GFP结合蛋白(纳米抗体)来自Chromotek。Alexa Fluor 488、Alexa Fluor 568和Alexa Fluor 647的NHS酯来自英杰。用于扫描电子显微法(SEM)的电子显微级16%多聚甲醛、10%戊二醛和2%OsO4获自Electron Microscopy Sciences。
克隆和构建体。产生具有42个串联重复的细胞质尾区缺失的人Muc1(Muc1-42TRΔCT)、Muc1-42TR聚合物结构域与TM21合成膜结构域的融合体(Muc1-42TR TM21)、细胞质尾区缺失的人足糖萼蛋白(富S/TΔCT)的cDNA,并且将其克隆到四环素诱导型PiggyBac表达载体(pPB TetOn Puro)或哺乳动物表达载体pcDNA3.1中,如先前所描述(Paszek等人,2014;Shurer等人)。为了制备慢病毒载体pLV Hygro TetOn HAS3,人HAS3(登录号NP_005320)的cDNA获自安迪生物公司,并且用正向引物5'-GGCACCTCGAGGATGCCGGTGCAGCTGACGACA-3'(SEQ ID NO:88)和反向引物5'-GGCAGAATTCTTACACCTCAGCAAAAGCCAAGCT-3'(SEQID NO:89)通过PCR扩增。根据制造商方案,将PCR产物克隆到pJET1.2(赛默飞世尔)中,并且亚克隆到pLV Hygro TetOn的AbsI和EcoRI位点中(Paszek等人,2012)。为了产生具有不同串联重复数目的pPB Muc1 GFPΔCT TetOn Puro,用以下引物扩增mOxGFP(Addgene#68070;此前mOxGFP称为GFP)的cDNA:5'-GGCAGCTCAGCTATGGTGTCCAAGGGCGAGGAGCTGT-3'((SEQ IDNO:90)正向)和5'-GGCAGCTGAGCCCTTATACAGCTCGTCCATGCCGTGAGT-3'((SEQ ID NO:91)反向)。将PCR产物克隆到pJET1.2中并且非定向亚克隆到pPB Muc1-42TRΔCT TetOn Puro的BlpI位点中。对于具有10和42个天然串联重复(PDTRPAPGSTAPPAHGVTSA((SEQ ID NO:8))的构建体,通过定制基因合成(General Biosystems)产生所需重复单元的合成cDNA,并且使用BamHI和Bsu36I限制位点将其克隆到pPB Muc1 GFPΔCT TetOn Puro中代替串联重复。用5'-TGGAGGAGCCTCAGGCATACTTTATTG-3'(SEQ ID NO:92)正向)和5'-CCACCGCCGACCGAGGTGACATCCTG-3'(SEQ ID NO:93)反向)引物通过Q5诱变定点缺失Muc1串联重复,以产生pPB Muc1 0TR GFPΔCT TetOn Puro。为了将SumoStar标签添加到Muc1-42TR GFPΔCT N端,通过定制基因合成(General Biosystems)产生编码IgGκ前导序列、SumoStar标签和Muc1 N端的cDNA,并且使用BamHI和BsrGI限制位点将其插入pPB Muc1 GFPTetOn Puro中代替Muc1 N端。对于粘蛋白聚合物结构域的重组产生,将来自Muc1的42个串联重复与N端S6标签(GDSLSWLLRLLN)和C端10×组氨酸纯化标签融合以制备Muc1-42TR 10×His。为了插入S6标签,使用5'-GTTGCGACTGCTTAACGGACAGATCTCGATGGTGAGC-3'(SEQ IDNO:94)正向)和5'-AGCCAGCTCAGGGAATCCCCAGCATTCTTCTCAGTAGAG-3'(SEQ ID NO:95)反向)对含有来自pPB Muc1-42TRΔCT TetOn Puro的Muc1 N端的pcDNA3.1质粒在BamHI和BglII位点之间进行Q5定点诱变。随后在这些位点处切割S6标签,在pPB Muc1-42TRΔCT TetOnPuro中的Muc1-42TRΔCT N端替换。通过粘接寡核苷酸5'-TCAGGCCACCACCACCATCACCATCATCACCACCATTAGGG-3'(SEQ ID NO:96)和3'-CCGGTGGTGGTGGTAGTGGTAGTAGTGGTGGTAATCCCTTAA-5'(SEQ ID NO:97),并且使用Bsu36I和EcoRI限制位点插入pPB Muc1-42TRΔCT TetOnPuro中代替Muc1-42TRΔCT C端,添加10×组氨酸标签。
细胞系和培养。MCF10A和HEK293T细胞获自ATCC。将MCF10A细胞在补充有5%马血清、20ng/mL EGF、10μg/ml胰岛素、500ng/mL氢化可的松、100ng/mL霍乱毒素和青霉素/链霉素的DMEM/F12培养基中培养。将HEK293T细胞在补充有10%胎牛血清和青霉素/链霉素的DMEM高葡萄糖中培养。将马滑膜细胞在补充有40mM HEPES、4mM L-谷氨酰胺、110mg/L丙酮酸钠、10%胎牛血清和青霉素/链霉素的低葡萄糖(1.0g/L)DMEM培养基中培养。每3-4天进行滑膜细胞的继代培养。将所有贴壁细胞维持在37℃、5%CO2和90%RH下。悬浮适应的293F细胞获自赛默飞世尔(R79007),并且根据制造商方案在37℃、8%CO2、120RPM和80%RH下维持在旋转瓶中的Freestyle293F表达培养基(赛默飞世尔,12338018)中。通过使用pLVrtTA-NeoR质粒进行慢病毒转导,制备表达rtTA-M2四环素反式激活子的稳定MCF10A、初代马滑膜细胞和293F细胞,如先前所描述(Paszek等人,2012)。对于表达粘蛋白的细胞系的制备,根据制造商方案使用核转染试剂盒V(龙沙(Lonza))或FreeStyle Max试剂(赛默飞世尔)将具有ITR侧接表达盒的质粒(即PiggyBac载体)与PiggyBac高活性转座酶共转染,并且用1μg/ml嘌呤霉素或200μg/mL湿霉素选择。
马滑膜组织切除和初代滑膜细胞分离。初代马滑膜细胞获自一岁马(家马(Equuscaballus))的肩关节、膝关节、腕关节、跗关节和球关节。为了分离成纤维细胞样B型滑膜细胞(滑膜细胞),将滑膜组织在37℃下在汉姆氏(Ham's)F12培养基中用补充有0.015%DNA酶I(罗氏,印第安纳州印第安纳波利斯(Indianapolis,IN))的0.15%胶原酶(WorthingtonBiochemical,新泽西州雷克伍德(Lakewood,NJ))消化3小时,接着过滤且以250×g离心10分钟,如先前所描述(Saxer等人,2001)。
将新切除的滑膜组织在含或不含1U/mL透明质酸酶(西格玛)的汉姆氏F12培养基中孵育30分钟且用4%多聚甲醛和1%戊二醛的PBS溶液固定,或立即固定24小时。然后将组织处理用于SEM或在冰上用0.1mg/mL NaBH4还原20分钟,并且进一步处理用于共聚焦成像。
扫描电子显微法(SEM)和分析。将所有样品用4%多聚甲醛和1%戊二醛的PBS溶液固定24小时,用1%四氧化锇的dH2O溶液后固定45分钟,洗涤并且随后在25%、50%、70%、95%、100%、100%乙醇中逐步脱水,随后在临界点干燥器(CPD 030,Bal-Tec)中干燥。将样品在Desk V溅射系统(Denton Vacuum)中用金钯涂布,并且在场发射扫描电子显微镜(Mira3 FE-SEM,Tescan或FE-SEM LEO 1550,卡尔蔡司公司(Carl Zeiss Inc.))上成像。对于肌动蛋白解聚研究,在指定时将细胞用10μM LatA处理60分钟,随后固定。
在ImageJ Fiji(Schindelin等人,2012)中分析细胞管密度、直径和长度。为了定量单位面积的管密度,绘制约2μm×2μm的关注区并且手动计数涵盖的管。通过绘制穿过管横截面中点处的应变线来测量管直径。使用ImageJ线段工具测量如通过目视检查鉴别的大致平行于图像平面延伸的管的管长度。
细胞和组织的共聚焦显微法。将细胞以5,000个细胞/cm2接种并且随后用0.2μg/mL多西环素诱导24小时,随后用4%多聚甲醛固定。将抗体在5%正常山羊血清PBS中1:200稀释,并且在4℃下孵育过夜。将凝集素在5%正常山羊血清PBS中稀释到1μg/mL,并且在室温下孵育2小时。对于细胞和组织的透明质酸染色,将HABP在0.5%正常山羊血清的PBS溶液中稀释到0.125μg/ml,并且在样品上孵育24小时。在蔡司LSM倒置880共聚焦显微镜上使用40×水浸物镜(NA1.1)使细胞样品成像。除HABP之外,将NaBH4处理的组织用1μg/mLHoechst染色10分钟,并且在具有40×水浸透镜的蔡司880正置式共聚焦显微镜上成像。使用非去扫描检测器用二次谐波产生使未染色组织胶原蛋白可视化。
免疫和凝集素印迹分析。将细胞以20,000个细胞/cm2接种并且用0.2μg/mL多西环素诱导24小时,随后用Tris-Triton裂解缓冲液(艾博抗)裂解。将裂解产物在Nupage 4-12%Bis-Tris或3-8%Tris-乙酸凝胶上分离,并转移到PVDF膜。在3%BSA TBST中将一抗1:1000稀释且凝集素稀释到1μg/mL,室温下孵育4小时或4℃下孵育过夜。将二抗或ExtrAvidin在3%BSA TBST中1:2000稀释,室温下孵育2小时。将印迹在Clarity ECL(伯乐)底物上显色,在ChemiDoc(伯乐)文件系统上成像,并且在ImageJ Fiji(Schindelin等人,2012)中定量。
流式细胞术。将细胞以20,000个细胞/cm2接种,生长24小时。然后用0.2μg/mL多西环素诱导细胞24小时。通过在37℃下与1mM EGTA的PBS溶液一起孵育20分钟非酶促分离贴壁细胞,并且将其添加到浮动细胞的群体(如果存在)中。在0.5%BSA PBS中将抗体1:200稀释且凝集素稀释到1μg/mL,4℃下与细胞一起孵育30分钟。BD Accuri C6流式细胞仪用于分析。
HA合成和分子大小的分析。将对照和慢病毒转导的MCF10A和初代马滑膜细胞接种并且用0.2μg/mL多西环素诱导24小时。遵循制造商方案,通过DuoSet透明质酸ELISA试剂盒测量分泌到细胞培养基中的HA的总水平。简单来说,用重组人聚集蛋白聚糖(Aggrecan)涂布96孔微量板。细胞培养基中的HA由涂布的聚集蛋白聚糖捕获,并且用生物素-HABP/HRP-链霉亲和素检测。使用化脓性链球菌(S.pyogenes)HA标准品(安迪生物公司)测量HA浓度。基本上如所描述(Yuan等人,2013)通过电泳和印迹分析来分析HA分子质量,使用琼脂糖替代聚丙烯酰胺进行凝胶电泳。简单来说,将含有HA的细胞培养基负载到TBE缓冲液中的0.6%琼脂糖凝胶中。在电泳之后,将样品转移到HyBond N+膜(通用电气医疗集团(GEHealthcare))。HA用生物素-HABP(0.125μg/ml,在0.1%BSA-PBS中,1小时)探测,并且随后用HRP-链霉亲和素(0.025μg/ml,在0.1%BSA-PBS中,1小时)检测。将印迹在ECL底物(Amresco)上显色,在ChemiDoc(伯乐)文件系统上成像,并且在ImageJ Fiji(Schindelin等人,2012)中定量。
粘蛋白回转半径的分析。具有42个串联重复的Muc1聚合物结构域(S6 Muc1-42TR10×His)重组产生于悬浮适应的Freestyle 293F细胞中。如上文所描述,用pPB Muc1-42TR 10×His Puro TetOn Puro载体制备稳定293F细胞系。在Freestyle 293F培养基中的30mL悬浮培养物中,用1μg/mL多西环素诱导Muc1生物聚合物产生。24小时后收集诱导的培养基并且根据标准方案在HisPur Ni-NTA树脂(赛默飞世尔)上纯化。简单来说,将1mL床体积的Ni-NTA树脂用平衡缓冲液(20mM磷酸钠,0.5M NaCl,pH=7.4)冲洗。将平衡树脂在4℃下与稀释于30mL平衡缓冲液中的10mL收集的293F培养基一起孵育过夜。将珠粒在含5mM咪唑的平衡缓冲液中洗涤,并且在含500mM咪唑的平衡缓冲液中洗脱。将洗脱的蛋白质相对于PBS透析并且通过SDS-PAGE分析。根据制造商说明书用Sypro Ruby(赛默飞世尔)染色凝胶以确认蛋白质大小和纯度。对凝胶进行印迹并且用Muc1和His抗体探测以确认粘蛋白本身,且用PNA凝集素探测以确认粘蛋白O-糖基化。将纯化的重组Muc1相对于PBS透析以去除咪唑。
用尺寸排阻色谱联合多角度光散射(SEC-MALS)测量重组Muc1聚合物结构域的回转半径。使用在MALS缓冲液(20mM磷酸钠,0.5M NaCl,pH 7.4)中平衡的Superdex200Increase 10/300柱(通用电气医疗集团)对纯化蛋白质(40μL Muc1,浓度为5μg/μL)进行SEC。SEC与静态18角度光散射检测器(DAWN HELEOS-II)和折射率检测器(Optilab T-rEX,Wyatt Technology)耦合。以0.7mL/min的流动速率每秒收集数据。使用ASTRA VI进行数据分析,得到样品的摩尔质量、质量分布(多分散性)和回转半径(32.0nm±0.4%)。对于光散射检测器的标准化和数据质量控制,使用单体BSA(西格玛)。
粘蛋白长度和细胞表面密度的变化。粘蛋白长度:在BD FACs Aria II上针对相似水平GFP分选表达具有0、10或42个串联重复的Muc1 mOxGFP的MCF10A。从这些分选的细胞系产生稳定群体。将细胞以10,000个细胞/cm2接种到8mm盖玻片上16-18小时,然后用0.2μg/mL多西环素诱导24小时,并且固定用于SEM分析。
粘蛋白细胞表面密度:从ChromoTech获得估计大小为2nm(15kDa)且对GFP具有皮摩尔亲和力的纳米抗体,并且根据制造商方案将其用NHS-Alexa Fluor 647标记。将表达具有42个串联重复的Muc1 mOxGFP的MCF10A细胞在冰上在5μg/ml 647纳米抗体中标记20分钟以仅标记细胞表面粘蛋白。将细胞以5,000到10,000个细胞/cm2分选到聚-l-赖氨酸处理的8mm盖玻片上用于SEM,使其在37℃下粘附4小时,固定用于SEM成像。可替代地,将细胞分选到1.7mL Eppendorf管中,再悬浮于100μL 0.5%BSA PBS中,并且用100μL2×RIPA裂解缓冲液裂解,以便通过SDS-PAGE估计粘蛋白表面密度。裂解样品与已知分子浓度的Alexa Fluor647纳米抗体标准品同时跑电泳。裂解样品和标准品中的纳米抗体荧光在Typhoon 9400成像系统(通用电气医疗集团)上成像。每种样品或标准品中的总荧光在ImageJ Fiji(Schindelin等人,2012)中定量。通过使来自纳米抗体标准品的荧光与其已知浓度相关来构建标准曲线。基于标准曲线估计每种裂解产物中经标记粘蛋白的数目。通过将粘蛋白的总数目除以每个样品中的已知细胞数目,和基于悬浮液中20μm平均半径和球形野生型细胞得到的其5,000μm2的平均表面积,预估粘蛋白表面密度。基于单位面积的粘蛋白数目和来自FACS收集的群体的已知平均荧光信号构建标准曲线。然后应用此标准曲线以计算随后收集的群体单位面积的粘蛋白数目。
巨大单层囊泡。制备。巨大单层囊泡通过电形成制备,如先前所描述(Angelova和Dimitrov,1986)。简单来说,将溶解于氯仿中的脂质和染料扩散在涂布有氧化铟锡(ITO)的载玻片上。将载玻片放置在真空下2小时以去除所有痕量的有机溶剂。脂质膜在120mM蔗糖中在55℃下水合并溶胀。通过施加1.4V(峰-峰)和12Hz振荡电位3小时电形成GUV(Busch等人,2015)。用DOPC和逐渐增加的摩尔分率的DOGS-Ni-NTA脂质(5、10、15和20mol%)制备GUV组合物。氟硼荧-PC用于以1/2500的染料/脂质比标记脂质。将重组加His标签的足糖萼蛋白和人血清白蛋白(HSA)与NHS-Alexa Fluor 568缀合,并且根据制造商方案定量标记程度。将GUV稀释于20mM HEPES,50mM NaCl,pH=7.4(120mOsm)中,并且然后与经标记足糖萼蛋白(约2μM)或HSA(0.125或0.375μM)混合至少20分钟,随后成像(按体积计,GUV/蛋白质=1/1)。
成像和分析。使用60×水浸物镜(NA1.2)在尼康(Nikon)C2plus共聚焦显微镜上使GUV成像。脂质和(氟硼荧-PC)和蛋白质(Alexa Fluor 568)分别通过在波长λ=488和561nm下激发成像。通过在ImageJ Fiji(Schindelin等人,2012)中取得跨GUV的5个不同线扫描来测量染料荧光强度。使用Mathematica 10.3分析每条线的强度分布,其中对于每GUV的5条不同线,计算强度峰值的积分并平均。
膨胀显微法。膨胀显微法(ExM)如先前所描述(Tillberg等人,2016)进行,并且包括锚定荧光染料和蛋白质、胶凝、消化和膨胀的步骤以实现染料滞留和分离。简单来说,将固定且染色的细胞在RT下用0.1mg/ml丙烯酰基-X,SE(6-((丙烯酰基)氨基)己酸,丁二酰亚胺酯(赛默飞世尔)的PBS溶液锚定16小时,洗涤两次,并且在37℃下在与过硫酸铵0.2%(w/w)引发剂和四甲基乙二胺0.2%(w/w)胶凝促进剂混合的单体溶液(1×PBS,2M NaCl,8.625%(w/w)丙烯酸钠,2.5%(w/w)丙烯酰胺,0.15%(w/w)N,N′-亚甲基双丙烯酰胺)中进一步孵育1小时。对于消化,将胶凝化样品轻缓地转移到6孔玻璃底板(Cellvis)中,并且在室温下用消化缓冲液(50mM Tris(pH 8),1mM EDTA,0.5%Triton X-100,1M NaCl)中8单位/毫升蛋白酶K(新英格兰生物实验室)处理16小时。对于膨胀,将消化的凝胶在大过量体积ddH2O中洗涤1小时。此重复4-6次,直到膨胀达到平稳状态。将样品在蔡司LSM倒置880共聚焦显微镜上使用40×水浸物镜(NA1.1)以Airyscan模式成像以优化分辨率。
细胞外囊泡的分离。将细胞以10,000个细胞/cm2接种于适当培养皿中。在用1μg/ml多西环素诱导18小时之后,将细胞用PBS冲洗两次,然后用1μg/mL多西环素处理血清饥饿另外6小时。通过以600×g进行两个连续离心5分钟,通过使细胞碎片沉淀来澄清来自血清饥饿细胞的条件培养基。
纳米粒子追踪分析。使用马尔文(Malvern)NS300 NanoSight分析澄清培养基中的细胞外囊泡。成像进行60秒,每样品五个捕获。使用马尔文纳米粒子追踪分析软件进行粒子分析。
速冻玻璃化。从澄清培养基中将3-5μl样品移吸到孔大小为约2μm的多孔碳涂布200目铜栅格(Quantifoil Micro Tools,德国耶拿(Jena,Germany))上。栅格从反向侧吸干并且立即使用定制构建的玻璃化装置(MPI,德国马丁斯瑞德(Martinsried,Germany))插入到冷却到液氮温度的液体乙烷/丙烷混合物中。将速冻栅格储存在液氮中的密封低温盒中直到使用。
低温透射电子显微法。低温透射电子显微法(低温TEM)在300kV下以能量过滤模式操作的Titan Themis(赛默飞世尔科技,马萨诸塞州沃尔瑟姆)上进行,Titan Themis配备有场发射枪和在计数、剂量分级模式下操作的3838×3710像素Gatan K2 Summit直接探测器相机(Gatan,加利福尼亚州普莱森顿(Pleasanton,CA))。在-1μm与-3μm之间散焦下收集图像。图像以2合并,产生0.72-1.1nm的像素大小。
统计数据。在Graphpad Prism中计算统计数据。在适当时,使用单因素方差分析和事后双尾学生t检验,如由图例指示。对于箱线图,中心线显示中值;框界限指示如由R软件确定的第25和第75百分位;须线从第25和第75百分位延伸1.5倍四分位距,并且凹槽在显示时指示95%置信区间。
参考文献
Agrawal,B.,Krantz,M.J.,Parker,J.和Longenecker,B.M.(1998).《MUC1粘蛋白在激活的人T细胞上的表达:暗示MUC1在正常免疫调节中的作用(Expression of MUC1Mucin on Activated Human T Cells:Implications for a Role of MUC1 in NormalImmune Regulation)》.《癌症研究(Cancer Res)》.58,4079-4081.
Alexander,S.(1977).《具有极性头部的链分子的吸附的按比例调整描述(Adsorption of chain molecules with a polar head a scaling description)》.《物理学杂志(J.Phys.)》38,983-987.
Angelova,M.I.和Dimitrov,D.S.(1986).《脂质体电形成(Liposomeelectroformation)》.《化学会法拉第讨论(Faraday Discuss.Chem.Soc)》81,303-311.
Antonyak,M.A.,Li,B.,Boroughs,L.K.,Johnson,J.L.,Druso,J.E.,Bryant,K.L.,Holowka,D.A.和Cerione,R.A.(2011).《癌细胞衍生的微囊泡通过将组织型谷氨酰胺转氨酶和纤维结合蛋白转移到接受者细胞诱导转化(Cancer cell-derivedmicrovesicles induce transformation by transferring tissue transglutaminaseand fibronectin to recipient cells)》.《美国国家科学院院刊》108,4852-4857.
Becker,A.,Thakur,B.K.,Weiss,J.M.,Kim,H.S.,Peinado,H.和Lyden,D.(2016).《癌症中的细胞外囊泡:转移的细胞间介体(Extracellular Vesicles in Cancer:Cell-to-Cell Mediators of Metastasis)》.《癌细胞(Cancer Cell)》30,836-848.
Bennett,R.,
Figure BDA0003263651390001291
T.,Engelhardt,P.,Kostamovaara,L.,Sparks,P.,Carpén,O.,Turunen,O.和Vaheri,A.(2001).《粘蛋白MUC1在免疫电子断层扫描中与埃兹蛋白一起出现在细胞表面突出部分中,并且集中在MCF-7乳腺癌细胞的丝状伪足突出部分的尖端(Mucin MUC1 is seen in cell surface protrusions together with ezrin inimmunoelectron tomography and is concentrated at tips of filopodialprotrusions in MCF-7breast carcinoma cells)》.《组织化学与细胞化学杂志:组织化学会官方杂志(J.Histochem.Cytochem.Off.J.Histochem.Soc.)》49,67-77.
Bergert,M.,Erzberger,A.,Desai,R.A.,Aspalter,I.M.,Oates,A.C.,Charras,G.,Salbreux,G.和Paluch,E.K.(2015).《非粘附依赖性迁移期间的力传递(Forcetransmission during adhesion-independent migration)》.《自然·细胞生物学(Nat.Cell Biol.)》17,524-529.
Bischoff,M.,Gradilla,A.-C.,Seijo,I.,Andrés,G.,Rodríguez-Navas,C.,González-Méndez,L.和Guerrero,I.(2013).《在果蝇上皮中建立正常刺猬成形素梯度需要细胞导管(Cytonemes are required for the establishment of a normal Hedgehogmorphogen gradient in Drosophila epithelia)》.《自然·细胞生物学》15,1269-1281.
Buck,C.A.,Glick,M.C.和Warren,L.(1971).《来自对照和病毒转化细胞的表面的糖肽(Glycopeptides from the surface of control and virus-transformed cells)》.《科学》172,169-171.
Busch,D.J.,Houser,J.R.,Hayden,C.C.,Sherman,M.B.,Lafer,E.M.和Stachowiak,J.C.(2015).《本征无序蛋白质驱动膜曲率(Intrinsically disorderedproteins drive membrane curvature)》.《自然·通讯(Nat.Commun.)》6,7875.
Button,B.,Cai,L.-H.,Ehre,C.,Kesimer,M.,Hill,D.B.,Sheehan,J.K.,Boucher,R.C.和Rubinstein,M.(2012).《纤毛刷通过分离粘液层与气道上皮促进肺健康(Apericiliary brush promotes the lung health by separating the mucus layerfrom airway epithelia)》.《科学》337,937-941.
Campelo,F.和Hernández-Machado,A.(2007).《膜中曲率驱动珠化不稳定性的模型(Model for Curvature-Driven Pearling Instability in Membranes)》.《物理学评论快报(Phys.Rev.Lett.)》99,088101.
Charras,G.T.,Yarrow,J.C.,Horton,M.A.,Mahadevan,L.和Mitchison,T.J.(2005).《起泡细胞中流体静压力的非平衡(Non-equilibration of hydrostaticpressure in blebbing cells)》.《自然》435,365-369.
Charras,G.T.,Coughlin,M.,Mitchison,T.J.和Mahadevan,L.(2008).《细胞泡的生命和时间(Life and Times of a Cellular Bleb)》.《生物物理学杂志(Biophys.J.)》94,1836-1853.
Chen,W.-L.,Cordero,R.,Tran,H.和Ober,C.K.(2017).《50周年展望:聚合物刷:未来材料的新颖表面(50th Anniversary Perspective:Polymer Brushes:NovelSurfaces for Future Materials)》.《大分子(Macromolecules)》50,4089-4113.
Cloosen,S.,Thio,M.,Vanclée,A.,Leeuwen,V.,M,E.B.,Senden-Gijsbers,B.L.M.G.,Oving,E.B.H.,Germeraad,W.T.V.和Bos,G.M.J.(2004).《粘蛋白-1在体外且在体内在树突状细胞上表达(Mucin-1is expressed on dendritic cells,both in vitroand in vivo)》.《国际免疫学(Int.Immunol.)》16,1561-1571.
D'Aloia,M.M.,Zizzari,I.G.,Sacchetti,B.,Pierelli,L.和Alimandi,M.(2018).《CAR-T细胞:到实体肿瘤的漫长且曲折的道路(CAR-T cells:the long andwinding road to solid tumors)》.《细胞死亡与疾病(Cell Death Dis.)》9,282.
Dennis,J.W.,Nabi,I.R.和Demetriou,M.(2009).《代谢、细胞表面组织和疾病(Metabolism,Cell Surface Organization,and Disease)》.《细胞(Cell)》139,1229-1241.
Evanko,S.P.,Tammi,M.I.,Tammi,R.H.和Wight,T.N.(2007).《透明质酸依赖性细胞周基质(Hyaluronan-Dependent Pericellular Matrix)》.《先进药物递送评论(Adv.Drug Deliv.Rev.)》59,1351-1365.
Footer,M.J.,Kerssemakers,J.W.J.,Theriot,J.A.和Dogterom,M.(2007).《使用光阱直接测量肌动蛋白微丝聚合的力产生(Direct measurement of force generationby actin filament polymerization using an optical trap)》.《美国国家科学院院刊》104,2181-2186.
Fowke,T.M.,Karunasinghe,R.N.,Bai,J.-Z.,Jordan,S.,Gunn,A.J.和Dean,J.M.(2017).《通过体外发育皮质神经元进行透明质酸合成(Hyaluronan synthesis bydeveloping cortical neurons in vitro)》.《科学报告(Sci.Rep.)》7,44135.
Freeze,H.H.(2013).《理解人糖基化病症:生物化学带头(Understanding HumanGlycosylation Disorders:Biochemistry Leads the Charge)》.《生物化学杂志》288,6936-6945.
Friedl,P.和Wolf,K.(2010).《细胞迁移的可塑性:多尺度调节模型(Plasticityof cell migration:a multiscale tuning model)》.《细胞生物学杂志》188,11-19.
Gangoda,L.,Boukouris,S.,Liem,M.,Kalra,H.和Mathivanan,S.《包括胞外体的细胞外囊泡为信号转导的介体:其为保护性还是致病性?(Extracellular vesiclesincluding exosomes are mediators of signal transduction:Are they protectiveor pathogenic?)》《蛋白质组学(PROTEOMICS)》15,260-271.
Gennes,P.-G.(1979).《聚合物物理中的标度概念(Scaling Concepts inPolymer Physics)》(纽约州伊萨卡(Ithaca,NY):康奈尔大学出版社(Cornell UniversityPress))。.
de Gennes,P.(1980).《连接到界面的聚合物的构象(Conformations ofpolymers attached to an interace)》.《大分子》1069-1075.
Gupton,S.L.和Gertler,F.B.(2007).《丝状伪足:进行行走的指(Filopodia:thefingers that do the walking)》.《科学STKE:信号转导知识环境(Sci.STKE SignalTransduct.Knowl.Environ.)》2007,re5.
Hall,A.(1998).《Rho GTP酶和肌动蛋白细胞骨架(Rho GTPases and the actincytoskeleton)》.《科学》279,509-514.
Hattrup,C.L.和Gendler,S.J.(2008).《细胞表面(系栓)粘蛋白的结构和功能》.《生理学年度评论》70,431-457.
Hiergeist,C.和Lipowsky,R.(1996).《聚合物修饰的膜的弹性特性(ElasticProperties of Polymer-Decorated Membranes)》.《物理学杂志II(J.Phys.II)》6,1465-1481.
Jung,Y.,Riven,I.,Feigelson,S.W.,Kartvelishvily,E.,Tohya,K.,Miyasaka,M.,Alon,R.和Haran,G.(2016).《使用超分辨率显微镜的组合相对于微绒毛进行T细胞受体三维定位(Three-dimensional localization of T-cell receptors in relation tomicrovilli using a combination of superresolution microscopies)》.《美国国家科学院院刊》113,E5916-E5924.
Kesavan,G.,Sand,F.W.,Greiner,T.U.,Johansson,J.K.,Kobberup,S.,Wu,X.,Brakebusch,C.和Semb,H.(2009).《Cdc42介导的小管形成控制细胞规格(Cdc42-mediatedtubulogenesis controls cell specification)》.《细胞》139,791-801.
Kesimer,M.,Ehre,C.,Burns,K.A.,Davis,C.W.,Sheehan,J.K.和Pickles,R.J.(2013).《气道粘膜表面上方粘液运输下的粘蛋白和糖萼的分子组织(Molecularorganization of the mucins and glycocalyx underlying mucus transport overmucosal surfaces of the airways)》.《粘膜免疫学(Mucosal Immunol.)》6,379-392.
Koistinen,V.,
Figure BDA0003263651390001321
R.,Koistinen,A.,Arjonen,A.,Tammi,M.和Rilla,K.(2015).《由透明质酸合酶3(HAS3)诱导的细胞突出部分类似间皮微绒毛并且共有丝状伪足的细胞骨架特征(Cell protrusions induced by hyaluronan synthase 3(HAS3)resemble mesothelial microvilli and share cytoskeletal features offilopodia)》.《实验细胞研究(Exp.Cell Res.)》337,179-191.
Kornberg,T.B.和Roy,S.(2014).《作为专门信号传导丝状伪足的细胞导管(Cytonemes as specialized signaling filopodia)》.《发育(Development)》141,729-736.
Kramer,R.H.和Nicolson,G.L.(1979).《肿瘤细胞与血管内皮细胞单层的相互作用:转移性侵入的模型(Interactions of tumor cells with vascular endothelialcell monolayers:a model for metastatic invasion)》.《美国国家科学院院刊》76,5704-5708.
Kufe,D.W.(2009).《癌症中的粘蛋白:功能、预后和疗法(Mucins in cancer:function,prognosis and therapy)》.《自然综述·癌症(Nat.Rev.Cancer)》9,nrc2761.
Lange,K.(2011).《微绒毛在分化细胞主要功能中的基本作用:细胞周边通用调节和信号传导系统的概述(Fundamental role of microvilli in the main functions ofdifferentiated cells:Outline of an universal regulating and signaling systemat the cell periphery)》.《细胞生理学杂志(J.Cell.Physiol.)》226,896-927.
Lee,G.M.,Johnstone,B.,Jacobson,K.和Caterson,B.(1993).《活细胞上细胞周基质的动态结构(The dynamic structure of the pericellular matrix on livingcells)》.《细胞生物学杂志》123,1899-1907.
Lipowsky,R.(1995).《锚定聚合物使膜弯曲(Bending of Membranes byAnchored Polymers)》.《EPL欧洲物理快报(EPLEurophys.Lett.)》30,197.
Liu,T.-L.,Upadhyayula,S.,Milkie,D.E.,Singh,V.,Wang,K.,Swinburne,I.A.,Mosaliganti,K.R.,Collins,Z.M.,Hiscock,T.W.,Shea,J.等人(2018).《观察天然状态下的细胞:在多细胞生物体中成像亚细胞动力学(Observing the cell in its nativestate:Imaging subcellular dynamics in multicellular organisms)》.《科学》360,eaaq1392.
Makabe Sayoko,Naguro Tomonori和Stallone Tiziana(2006).《卵巢滤泡发育期间的卵母细胞-滤泡细胞相互作用,如通过高分辨率扫描和透射电子显微法在人中发现(Oocyte-follicle cell interactions during ovarian follicle development,asseen by high resolution scanning and transmission electron microscopy inhumans)》.《显微法研究与技术(Microsc.Res.Tech.)》69,436-449.
Marshall,W.F.(2012).《细胞器大小控制系统:从细胞几何到细胞器导向医药(Organelle Size Control Systems:From Cell Geometry to Organelle-DirectedMedicine)》.《生物分析:分子、细胞和发育生物学的新闻和评论(BioEssays NewsRev.Mol.Cell.Dev.Biol.)》34,721-724.
McConnell,R.E.,Higginbotham,J.N.,Shifrin,D.A.,Tabb,D.L.,Coffey,R.J.和Tyska,M.J.(2009).《肠上皮细胞微绒毛是产生囊泡的细胞器(The enterocytemicrovillus is a vesicle-generating organelle)》.《细胞生物学杂志》185,1285-1298.
Milner,S.T.(1991).《聚合物刷(Polymer brushes)》.《科学》251,905-914.
Paluch,E.K.和Raz,E.(2013).《泡在细胞迁移中的作用和调节(The role andregulation of blebs in cell migration)》.《细胞生物学新见(Curr.Opin.CellBiol.)》25,582-590.
Paszek,M.J.,DuFort,C.C.,Rubashkin,M.G.,Davidson,M.W.,Thorn,K.S.,Liphardt,J.T.和Weaver,V.M.(2012).《扫描角干涉显微法以纳米尺度展现细胞动力学》.《自然·方法》9,825-827.
Paszek,M.J.,DuFort,C.C.,Rossier,O.,Bainer,R.,Mouw,J.K.,Godula,K.,Hudak,J.E.,Lakins,J.N.,Wijekoon,A.C.,Cassereau,L.等人(2014).《癌症糖萼机械启动整合素介导的生长和存活》.《自然》511,319-325.
Pelaseyed,T.,
Figure BDA0003263651390001341
J.H.,Gustafsson,J.K.,Ermund,A.,Birchenough,G.M.H.,Schütte,A.,Post,S.van der,Svensson,F.,
Figure BDA0003263651390001342
A.M.,
Figure BDA0003263651390001343
E.E.L.等人.《杯状细胞和肠细胞的粘液和粘蛋白提供胃肠道的第一道防线并且与免疫系统相互作用(The mucus and mucins of the goblet cells and enterocytes providethe first defense line of the gastrointestinal tract and interact with theimmune system)》.《免疫学评论(Immunol.Rev.)》260,8-20.
Peskin,C.S.,Odell,G.M.和Oster,G.F.(1993).《细胞运动和热波动:布朗棘轮(Cellular motions and thermal fluctuations:the Brownian ratchet)》.《生物物理学杂志》65,316-324.
Pilon,C.,Levast,B.,Meurens,F.,Le Vern,Y.,Kerboeuf,D.,Salmon,H.,Velge-Roussel,F.,Lebranchu,Y.和Baron,C.(2009).《CD40接合强烈诱导猪树突状细胞上的CD25表达并且使T细胞免疫反应朝向Th1极化(CD40 engagement strongly induces CD25expression on porcine dendritic cells and polarizes the T cell immuneresponse toward Th1)》.《分子免疫学(Mol.Immunol.)》46,437-447.
Pinho,S.S.和Reis,C.A.(2015).《癌症中的糖基化:机制和临床意义(Glycosylation in cancer:mechanisms and clinical implications)》.《自然综述·癌症》15,540-555.
Pol,E.van der,
Figure BDA0003263651390001351
A.N.,Gool,E.L.和Nieuwland,R.(2016).《细胞外囊泡的命名法、存在、分离、检测和临床影响的最新发展(Recent developments in thenomenclature,presence,isolation,detection and clinical impact ofextracellular vesicles)》.《血栓形成与止血杂志(J.Thromb.Haemost.)》14,48-56.
van den Pol,A.N.和Kim,W.T.(1993).《分离神经元的生长轴突上的NILE/L1和NCAM-多唾液酸表达(NILE/L1 and NCAM-polysialic acid expression on growingaxons of isolated neurons)》.《比较神经学杂志(J.Comp.Neurol.)》332,237-257.
Polefka,T.G.,Garrick,R.A.,Redwood,W.R.,Swislocki,N.I.和Chinard,F.P.(1984).《Novikoff细胞表面附近溶质排除的体积》.《美国生理学杂志-细胞生理学》247,C350-C356.
Porter,A.P.,Papaioannou,A.和Malliri,A.(2016).《癌症中Rho GTP酶失调(Deregulation of Rho GTPases in cancer)》.《小GTP酶(Small GTPases)》7,123-138.
Satomaa,T.,Heiskanen,A.,Mikkola,M.,Olsson,C.,Blomqvist,M.,Tiittanen,M.,Jaatinen,T.,Aitio,O.,Olonen,A.,Helin,J.等人(2009).《人胚胎干细胞的N-糖组(The N-glycome of human embryonic stem cells)》.《BMC细胞生物学(BMC CellBiol.)》10,42.
Sauvanet,C.,Wayt,J.,Pelaseyed,T.和Bretscher,A.(2015).《上皮细胞顶端域上微绒毛的结构、调节和功能多样性(Structure,Regulation,and Functional Diversityof Microvilli on the Apical Domain of Epithelial Cells)》.《细胞与发育生物学年度评论(Annu.Rev.Cell Dev.Biol.)》31,593-621.
Saxer,R.A.,Bent,S.J.,Brower-Toland,B.D.,Mi,Z.,Robbins,P.D.,Evans,C.H.和Nixon,A.J.(2001).《基因介导的胰岛素样生长因子I递送到滑膜(Gene mediatedinsulin-like growth factor-I delivery to the synovium)》.《骨科研究杂志:骨科研究学会官方出版物(J.Orthop.Res.Off.Publ.Orthop.Res.Soc.)》19,759-767.
Schindelin,J.,Arganda-Carreras,I.,Frise,E.,Kaynig,V.,Longair,M.,Pietzsch,T.,Preibisch,S.,Rueden,C.,Saalfeld,S.,Schmid,B.等人(2012).《Fiji:生物图像分析的开源平台》.《自然·方法》9,676-682.
Schmick,M.和Bastiaens,P.I.H.(2014).《膜形状与细胞信号处理的互相依赖(The Interdependence of Membrane Shape and Cellular Signal Processing)》.《细胞》156,1132-1138.
Shurer,C.,Colville,M.,Gupta,V.,Head,S.,Kai,F.,Lakins,J.和Paszek,M.《糖萼工程化的遗传编码工具箱:对细胞粘附、存活和癌细胞行为的可调控制》.《ACS生物材料科学与工程》
Stachowiak,J.C.,Hayden,C.C.和Sasaki,D.Y.(2010).《脂质膜上蛋白质的空间约束可驱动曲率和小管化(Steric confinement of proteins on lipid membranes candrive curvature and tubulation)》.《美国国家科学院院刊》107,7781-7786.
Tammi,M.I.,Day,A.J.和Turley,E.A.(2002).《透明质酸和稳态:平衡作用(Hyaluronan and Homeostasis:A Balancing Act)》.《生物化学杂志》277,4581-4584.
Tillberg,P.W.,Chen,F.,Piatkevich,K.D.,Zhao,Y.,Yu,C.-C.(Jay),English,B.P.,Gao,L.,Martorell,A.,Suk,H.-J.,Yoshida,F.等人(2016).《使用标准荧光蛋白和抗体标记的细胞和组织的蛋白质滞留膨胀显微法(Protein-retention expansionmicroscopy of cells and tissues labeled using standard fluorescent proteinsand antibodies)》.《自然·生物技术》34,987-992.
Tricarico,C.,Clancy,J.和D'Souza-Schorey,C.(2017).《脱落微囊泡的生物学和生体合成(Biology and biogenesis of shed microvesicles)》.《小GTP酶》8,220-232.
Tsafrir,I.,Sagi,D.,Arzi,T.,Guedeau-Boudeville,M.-A.,Frette,V.,Kandel,D.和Stavans,J.(2001).《具有锚定聚合物的膜管的珠化不稳定性(PearlingInstabilities of Membrane Tubes with Anchored Polymers)》.《物理学评论快报》86,1138-1141.
Turley,E.A.,Wood,D.K.和McCarthy,J.B.(2016).《作为“便携式”癌化前转移微环境的癌细胞透明质酸(Carcinoma Cell Hyaluronan as a“Portable”CancerizedPrometastatic Microenvironment)》.《癌症研究》76,2507-2512.
Yamaguchi,H.和Condeelis,J.(2007).《癌细胞迁移和侵入中肌动蛋白细胞骨架的调节(Regulation of the actin cytoskeleton in cancer cell migration andinvasion.Biochim)》.《生物化学与生物物理学报BBA-分子细胞研究(Biophys.Acta BBA-Mol.Cell Res.)》1773,642-652.
Ying,H.,Kimmelman,A.C.,Lyssiotis,C.A.,Hua,S.,Chu,G.C.,Fletcher-Sananikone,E.,Locasale,J.W.,Son,J.,Zhang,H.,Coloff,J.L.等人(2012).《致癌Kras通过调节合成代谢葡萄糖代谢维持胰腺肿瘤(Oncogenic Kras Maintains PancreaticTumors through Regulation of Anabolic Glucose Metabolism)》.《细胞》149,656-670.
Yuan,H.,Tank,M.,Alsofyani,A.,Shah,N.,Talati,N.,LoBello,J.C.,Kim,J.R.,Oonuki,Y.,de la Motte,C.A.和Cowman,M.K.(2013).《通过夹层ELISA样分析和膜印迹使用生物素化透明质酸结合蛋白进行的透明质酸检测的分子质量依赖性(Molecular massdependence of hyaluronan detection by sandwich ELISA-like assay and membraneblotting using biotinylated hyaluronan binding protein)》.《糖生物学》23,1270-1280.
Zhang,H.,Miller,R.H.和Rutishauser,U.(1992).《神经元底物上轴突的最优生长需要多唾液酸(Polysialic acid is required for optimal growth of axons on aneuronal substrate)》.《神经科学杂志:神经科学会官方杂志(J.Neurosci.Off.J.Soc.Neurosci.)》12,3107-3114.
Zhulina,E.B.和Borisov,O.V.(1996).《接枝到曲面的聚电解质(Polyelectrolytes Grafted to Curved Surfaces)》.《大分子》29,2618-2626.
第IV部分补充信息
理论考虑
糖萼聚合物刷模型
在不希望受任何特定理论约束的情况下,本公开提供阐明糖萼中的生物聚合物如何可产生膜曲率的熵驱动力的模型。所述模型考虑锚定于质膜的一端上长链聚合物。糖萼中长链聚合物的常见实例包括粘蛋白和透明质酸(HA),此处我们对其具体建模。建模框架可类似地应用于其它类型的糖萼聚合物,包括多唾液酸和其它糖胺聚糖。透明质酸为包含葡萄糖醛酸和N-乙酰氨基葡萄糖的重复单元的半柔性线性多糖。粘蛋白具有更复杂的瓶刷结构,其包含中央多肽骨架和沿骨架密集地簇聚的聚糖侧链。尽管瓶刷聚合物的结构复杂,但可将其模型化为单体大小近似侧链的有效线性聚合物(Paturej等人,2016)。因此,我们将我们的模型中的所有糖萼聚合物视为线性或有效线性的。
糖萼中的生物聚合物以若干方式锚定于细胞表面,包括通过跨膜锚、与整合膜蛋白共价缀合和非共价到特定跨膜受体。细胞表面粘蛋白通过单一跨膜结构域直接锚定在其羧基端附近。透明质酸通过细胞表面上的特定跨膜受体锚定于细胞表面。尽管透明质酸有可能锚定于沿聚合物骨架的多个点,但为简单起见,我们考虑所有糖萼聚合物在一端具有单一膜锚。
细胞表面还修饰有许多类型的整合和外周膜蛋白。这些分子还可促成细胞膜上的熵压力,类似于2D气体压力。为了分离糖萼聚合物对膜的影响,我们不包括来自其它细胞表面蛋白质以及胞内力的可能贡献。然而,模型可延伸以包括这些对系统能量的额外贡献。
生物聚合物排除考虑同一聚合物上单体之间以及相邻分子上单体之间的空间相互作用的体积(de Gennes,1980)。酸性糖,如葡萄糖醛酸和唾液酸上的大负电荷引起分子内和分子间静电相互作用(Israels等人,1994)。最后,聚合物和刷具有归因于弹性能量的熵贡献,所述弹性能量捕获分子的拉伸(de Gennes,1980)。嵌入于可变形脂膜中,此聚合物糖萼和能量和膜的能量可最小化以得到平衡构型(Lipowsky,1995;Stachowiak等人,2012)。因此,在以下本发明模型中,我们进行糖萼和下面的膜的能量最小化以描述表面曲率。
视表面密度而定,系栓到表面的聚合物展现两种特定体系的物理行为-蘑菇和刷。弗洛里(Flory)半径估算整个聚合物的大小,并且通过
Figure BDA0003263651390001381
给出,其中Na为聚合物中的单体数目,la为每个单体或有效单体的大小,l为聚合物链的完全延伸长度,并且v称为弗洛里(Flory)指数。对于如水等良好溶剂中的亲水生物聚合物,
Figure BDA0003263651390001383
在低密度下,使得分子间间距大于聚合物弗洛里半径,即CG<1/(RF)2,其中CG为生物聚合物浓度,生物聚合物采取独立于邻近相互作用的优选构象。在此体系中,柔性分子可卷绕以展现蘑菇样结构。另一方面,在高表面浓度下,当分子间间距小于弗洛里半径时,分子间相互作用可占主导并且使生物聚合物向外拉伸成刷样结构。聚合物层延伸或厚度、储存的能量和产生的膜曲率在这些体系中展现不同标度律,如下文所描述。
在蘑菇体系中,生物聚合物连接到平坦的不可渗透表面减少可接近的分子构象数目,减少穿透表面的聚合物形状。使不可渗透接枝表面弯曲可稍微增加可容许的构型,并且增加聚合物的熵。因此,系栓到可变形膜的柔性生物聚合物可产生曲率,如Lipowsky(Lipowsky,1995)所描述。然而,归因于膜曲率的额外熵小,并且因此,相对于由聚合物刷中分子间相互作用引发的变形,由聚合物蘑菇产生的曲率也小。在此蘑菇体系中,归因于系栓到弯曲膜的每个蘑菇聚合物的熵贡献的自由能为:
Figure BDA0003263651390001382
其中参考构型为系栓到平坦表面的聚合物,S蘑菇为相应熵贡献,R蘑菇为蘑菇形生物聚合物的弗洛里半径,并且R为下面的膜的曲率半径。在蘑菇体系中,我们考虑球形膜结构的形成。弯曲膜的弯曲能量为:
Figure BDA0003263651390001391
其中κ为膜双层的弯曲刚度,CG为生物聚合物的表面密度,并且1/CG为每种聚合物的可用面积。最小化总能量,F=F蘑菇+F相对于曲率R,因为θF/θR=0,我们得到R的以下标度率:
Figure BDA0003263651390001392
其中la为单体区段的大小,并且Na为聚合物分子中此类单体的数目。
在高表面密度下,使得邻近聚合物分子彼此相互作用,接枝聚合物展现刷样结构(de Gennes,1980)。在此体系中,我们考虑管状结构从膜形成并且预测细胞表面上由分子间拥挤效应产生的小管曲率。能量最小化方法阐明平衡曲率和刷延伸如下。对于具有半径R的小管,每小管长度的糖萼能量含有弹性、排除体积和静电组分(Borisov和Zhulina,2002;Bracha等人,2013;Zhulina等人,2006):
F=F弹性+F排除体积+F静电, (4)
Figure BDA0003263651390001393
其中R为小管的半径,H为糖萼刷的高度,la为形成生物聚合物的单体区段的大小,cp为单体浓度,并且s为每聚合物的面积。在小管表面处,每聚合物的面积s(r=R)与生物聚合物表面密度CG相关,因为s(r=R)=1/CG。w为单体区段的排除体积,αb为单体的电离度,Φ离子为本体溶液中的离子浓度,并且r为径向坐标。
Zhulina等人(Zhulina等人,2006)提供cp的表达式。鉴于单体长度和直径类似(Paturej等人,2016),我们将单体区段视为纵横比接近1的圆柱体。弯曲成管状结构的下面的膜的单位长度能量为(Helfrich,2014):
Figure BDA0003263651390001394
其中κ为膜弯曲模量。因此,单位小管长度的总能量为:
Figure BDA0003263651390001401
最小化与小管半径相关的总能量(dF/dR=0)揭示自发曲率对糖萼和细胞膜特性,包括生物聚合物的表面密度的依赖性。
我们考虑此理论对作为示例粘蛋白的天然Muc1的影响。我们将瓶刷生物聚合物粗粒化成Na个大小la,eff的有效单体(Paturej等人,2016)。在这项工作中,我们测量Muc1的回转半径RG为32nm。我们基于从人HEp-2上皮细胞纯化的Muc1的电子显微照片,估计总拉伸长度l为270nm(Bramwell等人,1986)。回转半径与弗洛里半径的关系为
Figure BDA0003263651390001402
使用RG=32nm,l=270nm和v=0.6的估计值,我们估计由Na=18个有效单体区段描述的粘蛋白,每个区段的大小为la,eff=15nm。我们注意到此有效单体大小与基于粘蛋白侧链大小为5-10nm的估计的预期良好一致(Kesimer等人,2013;McMaster等人,1999)。我们假设粘蛋白上的唾液酸促成每20个氨基酸串联重复大约5e-的电荷密度。我们的假设基于大部分粘蛋白O-糖基化位点被唾液酸化聚糖占据(
Figure BDA0003263651390001403
等人,2003;Müller等人,1999)。
粘蛋白蘑菇体系的标度率预测低生物聚合物密度的小自发曲率(图35C)。预测自发曲率与表达低表面密度粘蛋白(如图36B中所示,180个粘蛋白/um2)的细胞中观察到的泡样突出部分的曲率相当。对于较高密度,其中生物聚合物形成刷,以上相应模型预测与图36B的52000个粘蛋白/μm2的细胞上小管中观察到曲率产生相比,相似或更大的曲率产生。预测此类小管的曲率随生物聚合物密度按指数律增加。值得注意的是,蘑菇与刷体系之间的连续转变预测约250数目/μm2的生物聚合物密度伴随细胞表面形态从泡样到小管状的变化(图36B、D、E)。
类似地,HA分子与线性聚合物链紧密类似。举例来说,1MDa HA分子在向外拉伸时具有2.5μm的长度,并且可建模为大约10nm长的250个单体单元的链(Cleland Robert L.,2004;Hayashi等人,1995)。聚合物理论预测此种聚合物具有约1μm的大弗洛里半径,这比Muc1的弗洛里半径大超过一个数量级。因此,与Muc1相比,预期HA在细胞表面上具有大得多的有效体积和物理存在。因此,HA中更强的分子内和分子间相互作用应使在弯曲膜方面其比Muc1显著更有效。此外,预期HA的显著较低表面密度产生与密集地拥挤Muc1的表面相同的膜曲率。
我们还对HA的具体示例进行数值计算。采用Bracha等人对DNA(也是线性聚电解质)的方法,我们将透明质酸粗粒化成Na个长度la且直径d的圆柱形区段,以允许应用聚合物刷理论标度率(Bracha等人,2013)。生物聚合物的库恩长度la为分子直链时持续长度和长度标度的两倍。透明质酸为半刚性的,这是由于由糖环单体本质上较大的大小和围绕糖苷键的受阻旋转引起的局部刚度(Day和Sheehan,2001)。持续长度的测量值在5到9nm的范围内。透明质酸链的直径为约0.6nm(Cowman等人,2005)。在此工作中,我们测量由透明质酸合酶3(HAS3)产生的透明质酸的分子量为大约3MDa。此较大的大小对应于大约10μm的完全拉伸长度,假设二糖大小为1nm。
细胞表面泡和管的力要求
为了预测细胞表面上泡和管的相对频率,我们对细胞膜进行能量计算。糖聚合物的拥挤压力有效地增加细胞膜的天然曲率。因此,我们将糖萼的拥挤效应归并在一起成自发膜曲率c0
将细胞膜推出,例如肌动蛋白聚合的细胞内力可产生圆柱形管(Weichsel和Geissler,2016)。此处,我们考虑由于力f产生的长为L且半径为R的管。另一方面,细胞内外的流体静压差p可形成半径为R的球形泡(Charras和Paluch,2008)。这些构型中的膜能量包括弯曲能量、表面张力和来自压力p或力f的贡献(Derényi等人,2002;Helfrich,2014;Seifer等人,1991):
Figure BDA0003263651390001411
其中κ为膜的弯曲刚度,c1和c2为主曲率,c0为由于生物聚合物的拥挤压力而产生的膜的自发曲率,A为膜的面积,并且σ为膜的表面张力。对于管,p=0,f≠0,并且L为管的长度,而对于泡,f=0,p≠0,并且V为泡体积。
半径为R的圆柱形管具有c1=0和c2=1/R管,其简化能量:
Figure BDA0003263651390001412
具有细颈部的球形泡的情况提供了泡能量的上限。对于半径为R的泡,c1=c2=1/R,并且
Figure BDA0003263651390001421
在平衡时,这些能量相对于泡和管的半径最小化(Derényi等人,2002)。管能量还相对于稳定状态下的管长度E最小化(Derényi等人,2002)。即,平衡时
Figure BDA0003263651390001422
并且
Figure BDA0003263651390001423
管的平衡方程(方程11)暗示:
Figure BDA0003263651390001424
并且
Figure BDA0003263651390001425
这些平衡计算预测管半径完全由脂质双层的机械特性和自发曲率支配。这些计算不考虑加宽管的肌动蛋白微丝的结构支撑。
泡能量最小化(方程12)得到给定大小的泡的压力要求:
Figure BDA0003263651390001426
方程13-15涉及维持具有由生物聚合物产生的自发曲率的管或泡所需的力或压力。图35C详述自发曲率对生物聚合物浓度的依赖性。因此,我们相对于生物聚合物浓度绘制力和压力要求(图35D)。与来自肌动蛋白聚合和流体静压力的典型观察到的力的比较解释管和泡的相对密度作为生物聚合物密度的函数。
参考文献
Figure BDA0003263651390001427
M.,Link,T.,Olson,F.J.,Karlsson,H.,Graham,R.,Picco,G.,Burchell,J.,Taylor-Papadimitriou,J.,Noll,T.和Hansson,G.C.(2003).《在中国仓鼠卵巢细胞中大量产生的具有乳腺癌样O-糖基化的重组MUC1粘蛋白》.《生物化学杂志》376,677-686.
Borisov,O.V.和Zhulina,E.B.(2002).《盐对带电嵌段共聚物胶束中自组装的影响(Effect of Salt on Self-Assembly in Charged Block Copolymer Micelles)》.《大分子》35,4472-4480.
Bracha,D.,Karzbrun,E.,Shemer,G.,Pincus,P.A.和Bar-Ziv,R.H.(2013).《生物芯片上DNA刷中熵驱动的集体相互作用(Entropy-driven collective interactions inDNA brushes on a biochip)》.《美国国家科学院院刊》110,4534-4538.
Bramwell,M.E.,Wiseman,G.和Shotton,D.M.(1986).《CA抗原上皮肿瘤蛋白的电子显微研究(Electron-microscopic studies of the CAantigen,epitectin)》.《细胞科学杂志(J.Cell Sci.)》86,249-261.
Charras,G.和Paluch,E.(2008).《泡引领:如何在无片足的情况下迁移(Blebslead the way:how to migrate without lamellipodia)》.《自然综述·分子细胞生物学(Nat.Rev.Mol.Cell Biol.)》9,730-736.
Cleland Robert L.(2004).《部分水解透明质酸盐的粘度测定和沉降平衡:与蠕虫状链的理论模型的比较(Viscometry and sedimentation equilibrium of partiallyhydrolyzed hyaluronate:Comparison with theoretical models of wormlikechains)》.《生物聚合物(Biopolymers)》23,647-666.
Cowman,M.K.,Spagnoli,C.,Kudasheva,D.,Li,M.,Dyal,A.,Kanai,S.和Balazs,E.A.(2005).《通过原子力显微法观察到的透明质酸的延伸、松弛和缩合构象(Extended,relaxed,and condensed conformations of hyaluronan observed by atomic forcemicroscopy)》.《生物物理学杂志》88,590-602.
Day,A.J.和Sheehan,J.K.(2001).《透明质酸:对于蛋白质机构的多糖混乱(Hyaluronan:polysaccharide chaos to protein organisation)》.《结构生物学当前观点(Curr.Opin.Struct.Biol.)》11,617-622.
Derényi,I.,Jülicher,F.和Prost,J.(2002).《膜管的形成和相互作用(Formation and interaction of membrane tubes)》.《物理学评论快报》88,238101.
de Gennes,P.(1980).《连接到界面的聚合物的构象》.《大分子》1069-1075.
Hayashi,K.,Tsutsumi,K.,Nakajima,F.,Norisuye,T.和Teramoto,A.(1995).《高离子强度下透明质酸钠溶液中的链刚度和排除体积效应(Chain-stiffness andexcluded-volume effects in solutions of sodium hyaluronate at high ionicstrength)》.《大分子》28,3824-3830.
Helfrich,W.(2014).《脂质双层的弹性特性:理论和可能实验(ElasticProperties of Lipid Bilayers:Theory and Possible Experiments)》.《自然研究杂志C(Z.Für Naturforschung C)》28,693-703.
Israels,R.,Leermakers,F.A.M.,Fleer,G.J.和Zhulina,E.B.(1994).《带电聚合刷:结构和比例调整关系(Charged Polymeric Brushes:Structure and ScalingRelations)》.《大分子》27,3249-3261.
Kesimer,M.,Ehre,C.,Burns,K.A.,Davis,C.W.,Sheehan,J.K.和Pickles,R.J.(2013).《气道粘膜表面上方粘液运输下的粘蛋白和糖萼的分子组织》.《粘膜免疫学》6,379-392.
Lipowsky,R.(1995).《锚定聚合物使膜弯曲》.《EPL欧洲物理快报》30,197.
McMaster,T.J.,Berry,M.,Corfield,A.P.和Miles,M.J.(1999).《水合眼粘蛋白的亚分子架构的原子力显微法(Atomic force microscopy of the submoleculararchitecture of hydrated ocular mucins)》.《生物物理学杂志》77,533-541.
Müller,S.,Alving,K.,Peter-Katalinic,J.,Zachara,N.,Gooley,A.A.和Hanisch,F.G.(1999).《来自T47D乳腺癌细胞的分泌性MUC1的串联重复肽上的高密度O-糖基化(High density O-glycosylation on tandem repeat peptide from secretoryMUC1 of T47D breast cancer cells)》.《生物化学杂志》274,18165-18172.
Paturej,J.,Sheiko,S.S.,Panyukov,S.和Rubinstein,M.(2016).《熔体中瓶刷聚合物的分子结构(Molecular structure of bottlebrush polymers in melts)》.《科学进展(Sci.Adv.)》2,e1601478.
Seifert,U.,Berndl,K.和Lipowsky,R.(1991).《囊泡的形状变换:自发曲率和双层偶合模型的相图(Shape transformations of vesicles:Phase diagram forspontaneous-curvature and bilayer-coupling models)》.《物理学评论A辑(Phys.Rev.A)》44,1182-1202.
Stachowiak,J.C.,Schmid,E.M.,Ryan,C.J.,Ann,H.S.,Sasaki,D.Y.,Sherman,M.B.,Geissler,P.L.,Fletcher,D.A.和Hayden,C.C.(2012).《蛋白质-蛋白质拥挤引起的膜弯曲(Membrane bending by protein-protein crowding)》.《自然·细胞生物学》14,944-949.
Weichsel,J.和Geissler,P.L.(2016).《越多则越呈管状:膜管形成的肌动蛋白微丝的动态捆绑(The More the Tubular:Dynamic Bundling of Actin Filaments forMembrane Tube Formation)》.《公共科学图书馆·计算生物学(PLOS Comput.Biol)》12,e1004982.
Zhulina,E.B.,Birshtein,T.M.和Borisov,O.V.(2006).《Daoud-Cotton模型之外的弯曲聚合物和聚电解质刷(Curved polymer and polyelectrolyte brushes beyondthe Daoud-Cotton model)》.《欧洲物理学杂志E辑(Eur.Phys.J.E)》20,243-256.
序列表
<110> 康奈尔大学
<120> 重组润滑素和组合物以及其使用方法
<130> 018617.01142
<150> 62/792,660
<151> 2019-01-15
<160> 99
<170> PatentIn 3.5版
<210> 1
<211> 8
<212> PRT
<213> 人工序列
<220>
<223> 修饰的润滑素重复
<400> 1
Lys Glu Pro Ala Pro Thr Thr Pro
1 5
<210> 2
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 修饰的粘蛋白重复
<400> 2
Asp Ala Ala Thr Pro Ala Pro
1 5
<210> 3
<211> 8
<212> PRT
<213> 人工序列
<220>
<223> 修饰的粘蛋白重复
<400> 3
Asp Ala Ala Thr Pro Ala Pro Pro
1 5
<210> 4
<211> 9
<212> PRT
<213> 人工序列
<220>
<223> 修饰的粘蛋白重复
<400> 4
Pro Pro Ala Ser Thr Ser Ala Pro Gly
1 5
<210> 5
<211> 20
<212> PRT
<213> 人工序列
<220>
<223> 修饰的粘蛋白重复
<400> 5
Pro Asp Thr Arg Pro Ala Pro Gly Ala Thr Ala Pro Pro Ala His Gly
1 5 10 15
Val Thr Ser Ala
20
<210> 6
<211> 20
<212> PRT
<213> 人工序列
<220>
<223> 修饰的粘蛋白重复
<400> 6
Pro Asp Thr Arg Pro Ala Pro Gly Ala Thr Ala Pro Pro Ala His Gly
1 5 10 15
Val Thr Ala Ala
20
<210> 7
<211> 20
<212> PRT
<213> 人工序列
<220>
<223> 修饰的粘蛋白重复
<400> 7
Pro Asp Ala Arg Pro Ala Pro Gly Ala Thr Ala Pro Pro Ala His Gly
1 5 10 15
Val Thr Ala Ala
20
<210> 8
<211> 20
<212> PRT
<213> 人工序列
<220>
<223> 未修饰的粘蛋白重复
<400> 8
Pro Asp Thr Arg Pro Ala Pro Gly Ser Thr Ala Pro Pro Ala His Gly
1 5 10 15
Val Thr Ser Ala
20
<210> 9
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 修饰的粘蛋白重复
<400> 9
Lys Glu Pro Ala Pro Thr Pro
1 5
<210> 10
<211> 9
<212> PRT
<213> 人工序列
<220>
<223> 修饰的粘蛋白重复
<400> 10
Lys Glu Pro Ala Pro Thr Thr Thr Pro
1 5
<210> 11
<211> 6
<212> PRT
<213> 智人
<400> 11
Cys Gln Cys Arg Arg Lys
1 5
<210> 12
<211> 37
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 12
ggcagctcag ctatggtgtc caagggcgag gagctgt 37
<210> 13
<211> 39
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 13
ggcagctgag cccttataca gctcgtccat gccgtgagt 39
<210> 14
<211> 27
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 14
tggaggagcc tcaggcatac tttattg 27
<210> 15
<211> 26
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 15
ccaccgccga ccgaggtgac atcctg 26
<210> 16
<211> 34
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 16
ccgaaagtag gaattcgggc ccgtttaaac ccgc 34
<210> 17
<211> 37
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 17
cggcactgac atctagagta ccacaacaaa gccaggc 37
<210> 18
<211> 37
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 18
aggtagcgtc tcgtcccgcc tcaggcatac tttattg 37
<210> 19
<211> 31
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 19
aggtagcgtc tcgtcgggag caggggtagc g 31
<210> 20
<211> 42
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 20
ggtagcgtct cgccgatgca gctactccag ctccggacag cc 42
<210> 21
<211> 29
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 21
aggtagcgtc tcggggagca ggggtagcg 29
<210> 22
<211> 41
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 22
cttctgcgtc tcgtcccgcc tcaggcatac tttattggcg a 41
<210> 23
<211> 37
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 23
cttctgcgtc tcgtcgggag gagctggtgt agccgcg 37
<210> 24
<211> 39
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 24
cttctgcgtc tccccgatgc agctaccccg gctccaccc 39
<210> 25
<211> 35
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 25
cttctgcgtc tccgggagga gctggtgtag ccgcg 35
<210> 26
<211> 62
<212> PRT
<213> 人工序列
<220>
<223> Flag标签
<400> 26
Met Thr Pro Gly Thr Gln Ser Pro Phe Phe Leu Leu Leu Leu Leu Thr
1 5 10 15
Val Leu Thr Val Val Thr Gly Ser Gly His Ala Ser Ser Thr Pro Gly
20 25 30
Gly Glu Lys Glu Thr Ser Ala Thr Gln Arg Ser Ser Val Pro Ser Ser
35 40 45
Thr Glu Lys Asn Ala Asp Tyr Lys Asp Asp Asp Asp Leu Tyr
50 55 60
<210> 27
<211> 193
<212> DNA
<213> 人工序列
<220>
<223> Flag标签cDNA
<400> 27
ggatccatga caccgggcac ccagtctcct ttcttcctgc tgctgctcct cacagtgctt 60
acagttgtta caggttctgg tcatgcaagc tctaccccag gtggagaaaa ggagacttcg 120
gctacccaga gaagttcagt gcccagctct actgagaaga atgctgatta caaggatgac 180
gacgacctgt aca 193
<210> 28
<211> 170
<212> PRT
<213> 人工序列
<220>
<223> His-SUMO蛋白质
<400> 28
Met Glu Thr Asp Thr Leu Leu Leu Trp Val Leu Leu Leu Trp Val Pro
1 5 10 15
Gly Ser Thr Gly Asp Gly His His His His His His Gly Ser Leu Gln
20 25 30
Asp Ser Glu Val Asn Gln Glu Ala Lys Pro Glu Val Lys Pro Glu Val
35 40 45
Lys Pro Glu Thr His Ile Asn Leu Lys Val Ser Asp Gly Ser Ser Glu
50 55 60
Ile Phe Phe Lys Ile Lys Lys Thr Thr Pro Leu Arg Arg Leu Met Glu
65 70 75 80
Ala Phe Ala Lys Arg Gln Gly Lys Glu Met Asp Ser Leu Thr Phe Leu
85 90 95
Tyr Asp Gly Ile Glu Ile Gln Ala Asp Gln Ala Pro Glu Asp Leu Asp
100 105 110
Met Glu Asp Asn Asp Ile Ile Glu Ala His Arg Glu Gln Ile Gly Gly
115 120 125
Gly Ser Gly Ser Gly His Ala Ser Ser Thr Pro Gly Gly Glu Lys Glu
130 135 140
Thr Ser Ala Thr Gln Arg Ser Ser Val Pro Ser Ser Thr Glu Lys Asn
145 150 155 160
Ala Asp Tyr Lys Asp Asp Asp Asp Leu Tyr
165 170
<210> 29
<211> 522
<212> DNA
<213> 人工序列
<220>
<223> His-SUMO cDNA
<400> 29
gatccgccac catggagaca gacacactcc tgctatgggt actgctgctc tgggttccag 60
gttccactgg tgacggtcat caccatcatc atcacgggtc cctgcaggac tcagaagtca 120
atcaagaagc taagccagag gtcaagccag aagtcaagcc tgagactcac atcaatttaa 180
aggtgtccga tggatcttca gagatcttct tcaagatcaa aaagaccact cctttaagaa 240
ggctgatgga agcgttcgct aaaagacagg gtaaggaaat ggactcctta acgttcttgt 300
acgacggtat tgaaattcaa gctgatcagg cccctgaaga tttggacatg gaggataacg 360
atattattga ggctcacaga gaacagattg gaggtggctc cggctccggt catgcaagct 420
ctaccccagg tggagaaaag gagacttcgg ctacccagag aagttcagtg cccagctcta 480
ctgagaagaa tgctgattac aaggatgacg acgacctgta ca 522
<210> 30
<211> 55
<212> PRT
<213> 人工序列
<220>
<223> 合成聚合物骨架
<400> 30
Leu Tyr Met Asp Met Val Ala Val Ser Met Thr Ser Ser Val Leu Ser
1 5 10 15
Ser His Ser Pro Gly Ser Gly Ser Ser Thr Thr Gln Gly Gln Asp Val
20 25 30
Thr Leu Ala Pro Ala Thr Glu Pro Ala Ser Gly Ser Ala Ala Thr Trp
35 40 45
Gly Gln Asp Val Thr Ser Val
50 55
<210> 31
<211> 63
<212> PRT
<213> 人工序列
<220>
<223> 合成粘蛋白
<400> 31
Leu Tyr Met Asp Met Val Ala Val Ser Met Thr Ser Ser Val Leu Ser
1 5 10 15
Ser His Ser Pro Gly Ser Gly Ser Ser Thr Thr Gln Gly Gln Asp Val
20 25 30
Thr Leu Ala Pro Ala Thr Glu Pro Ala Ser Gly Ser Ala Ala Thr Trp
35 40 45
Gly Gln Asp Val Thr Ser Val Gly Gly Gly Gly Gly Ala Ser Gly
50 55 60
<210> 32
<211> 250
<212> PRT
<213> 人工序列
<220>
<223> 重组绿色荧光蛋白
<400> 32
Ser Gly Ser Ala Ser Gly Ser Ala Met Val Ser Lys Gly Glu Glu Leu
1 5 10 15
Phe Thr Gly Val Val Pro Ile Leu Val Glu Leu Asp Gly Asp Val Asn
20 25 30
Gly His Lys Phe Ser Val Arg Gly Glu Gly Glu Gly Asp Ala Thr Asn
35 40 45
Gly Lys Leu Thr Leu Lys Phe Ile Ser Thr Thr Gly Lys Leu Pro Val
50 55 60
Pro Trp Pro Thr Leu Val Thr Thr Leu Thr Tyr Gly Val Gln Ser Phe
65 70 75 80
Ser Arg Tyr Pro Asp His Met Lys Arg His Asp Phe Phe Lys Ser Ala
85 90 95
Met Pro Glu Gly Tyr Val Gln Glu Arg Thr Ile Ser Phe Lys Asp Asp
100 105 110
Gly Thr Tyr Lys Thr Arg Ala Glu Val Lys Phe Glu Gly Asp Thr Leu
115 120 125
Val Asn Arg Ile Glu Leu Lys Gly Ile Asp Phe Lys Glu Asp Gly Asn
130 135 140
Ile Leu Gly His Lys Leu Glu Tyr Asn Phe Asn Ser His Asn Val Tyr
145 150 155 160
Ile Thr Ala Asp Lys Gln Lys Asn Gly Ile Lys Ala Asn Phe Lys Ile
165 170 175
Arg His Asn Val Glu Asp Gly Ser Val Gln Leu Ala Asp His Tyr Gln
180 185 190
Gln Asn Thr Pro Ile Gly Asp Gly Pro Val Leu Leu Pro Asp Asn His
195 200 205
Tyr Leu Ser Thr Gln Ser Lys Leu Ser Lys Asp Pro Asn Glu Lys Arg
210 215 220
Asp His Met Val Leu Leu Glu Phe Val Thr Ala Ala Gly Ile Thr His
225 230 235 240
Gly Met Asp Glu Leu Tyr Lys Gly Ser Ala
245 250
<210> 33
<211> 222
<212> PRT
<213> 人工序列
<220>
<223> 重组跨膜结构域
<400> 33
Ser Ala Ser Thr Leu Val His Asn Gly Thr Ser Ala Arg Ala Thr Thr
1 5 10 15
Thr Pro Ala Ser Lys Ser Thr Pro Phe Ser Ile Pro Ser His His Ser
20 25 30
Asp Thr Pro Thr Thr Leu Ala Ser His Ser Thr Lys Thr Asp Ala Ser
35 40 45
Ser Thr His His Ser Ser Val Pro Pro Leu Thr Ser Ser Asn His Ser
50 55 60
Thr Ser Pro Gln Leu Ser Thr Gly Val Ser Phe Phe Phe Leu Ser Phe
65 70 75 80
His Ile Ser Asn Leu Gln Phe Asn Ser Ser Leu Glu Asp Pro Ser Thr
85 90 95
Asp Tyr Tyr Gln Glu Leu Gln Arg Asp Ile Ser Glu Met Phe Leu Gln
100 105 110
Ile Tyr Lys Gln Gly Gly Phe Leu Gly Leu Ser Asn Ile Lys Phe Arg
115 120 125
Pro Gly Ser Val Val Val Gln Leu Thr Leu Ala Phe Arg Glu Gly Thr
130 135 140
Ile Asn Val His Asp Val Glu Thr Gln Phe Asn Gln Tyr Lys Thr Glu
145 150 155 160
Ala Ala Ser Arg Tyr Asn Leu Thr Ile Ser Asp Val Ser Val Ser Asp
165 170 175
Val Pro Phe Pro Phe Ser Ala Gln Ser Gly Ala Gly Val Pro Gly Trp
180 185 190
Gly Ile Ala Leu Leu Val Leu Val Cys Val Leu Val Ala Leu Ala Ile
195 200 205
Val Tyr Leu Ile Ala Leu Ala Val Cys Gln Cys Arg Arg Lys
210 215 220
<210> 34
<211> 74
<212> PRT
<213> 人工序列
<220>
<223> 重组细胞质结构域
<400> 34
Ser Arg Cys Gln Cys Arg Arg Lys Asn Tyr Gly Gln Leu Asp Ile Phe
1 5 10 15
Pro Ala Arg Asp Thr Tyr His Pro Met Ser Glu Tyr Pro Thr Tyr His
20 25 30
Thr His Gly Arg Tyr Val Pro Pro Ser Ser Thr Asp Arg Ser Pro Tyr
35 40 45
Glu Lys Val Ser Ala Gly Asn Gly Gly Ser Ser Leu Ser Tyr Thr Asn
50 55 60
Pro Ala Val Ala Ala Ala Ser Ala Asn Leu
65 70
<210> 35
<211> 8
<212> PRT
<213> 人工序列
<220>
<223> 重组细胞质结构域
<400> 35
Ser Arg Cys Gln Cys Arg Arg Lys
1 5
<210> 36
<211> 1426
<212> PRT
<213> 人工序列
<220>
<223> 重组粘蛋白
<400> 36
Met Thr Pro Gly Thr Gln Ser Pro Phe Phe Leu Leu Leu Leu Leu Thr
1 5 10 15
Val Leu Thr Val Val Thr Gly Ser Gly His Ala Ser Ser Thr Pro Gly
20 25 30
Gly Glu Lys Glu Thr Ser Ala Thr Gln Arg Ser Ser Val Pro Ser Ser
35 40 45
Thr Glu Lys Asn Ala Asp Tyr Lys Asp Asp Asp Asp Leu Tyr Met Asp
50 55 60
Met Val Ala Val Ser Met Thr Ser Ser Val Leu Ser Ser His Ser Pro
65 70 75 80
Gly Ser Gly Ser Ser Thr Thr Gln Gly Gln Asp Val Thr Leu Ala Pro
85 90 95
Ala Thr Glu Pro Ala Ser Gly Ser Ala Ala Thr Trp Gly Gln Asp Val
100 105 110
Thr Ser Val Pro Asp Thr Arg Pro Ala Pro Gly Ser Thr Ala Pro Pro
115 120 125
Ala His Gly Val Thr Ser Ala Pro Asp Thr Arg Pro Ala Pro Gly Ser
130 135 140
Thr Ala Pro Pro Ala His Gly Val Thr Ser Ala Pro Asp Thr Arg Pro
145 150 155 160
Ala Pro Gly Ser Thr Ala Pro Pro Ala His Gly Val Thr Ser Ala Pro
165 170 175
Asp Thr Arg Pro Ala Pro Gly Ser Thr Ala Pro Pro Ala His Gly Val
180 185 190
Thr Ser Ala Pro Asp Thr Arg Pro Ala Pro Gly Ser Thr Ala Pro Pro
195 200 205
Ala His Gly Val Thr Ser Ala Pro Asp Thr Arg Pro Ala Pro Gly Ser
210 215 220
Thr Ala Pro Pro Ala His Gly Val Thr Ser Ala Pro Asp Thr Arg Pro
225 230 235 240
Ala Pro Gly Ser Thr Ala Pro Pro Ala His Gly Val Thr Ser Ala Pro
245 250 255
Asp Thr Arg Pro Ala Pro Gly Ser Thr Ala Pro Pro Ala His Gly Val
260 265 270
Thr Ser Ala Pro Asp Thr Arg Pro Ala Pro Gly Ser Thr Ala Pro Pro
275 280 285
Ala His Gly Val Thr Ser Ala Pro Asp Thr Arg Pro Ala Pro Gly Ser
290 295 300
Thr Ala Pro Pro Ala His Gly Val Thr Ser Ala Pro Asp Thr Arg Pro
305 310 315 320
Ala Pro Gly Ser Thr Ala Pro Pro Ala His Gly Val Thr Ser Ala Pro
325 330 335
Asp Thr Arg Pro Ala Pro Gly Ser Thr Ala Pro Pro Ala His Gly Val
340 345 350
Thr Ser Ala Pro Asp Thr Arg Pro Ala Pro Gly Ser Thr Ala Pro Pro
355 360 365
Ala His Gly Val Thr Ser Ala Pro Asp Thr Arg Pro Ala Pro Gly Ser
370 375 380
Thr Ala Pro Pro Ala His Gly Val Thr Ser Ala Pro Asp Thr Arg Pro
385 390 395 400
Ala Pro Gly Ser Thr Ala Pro Pro Ala His Gly Val Thr Ser Ala Pro
405 410 415
Asp Thr Arg Pro Ala Pro Gly Ser Thr Ala Pro Pro Ala His Gly Val
420 425 430
Thr Ser Ala Pro Asp Thr Arg Pro Ala Pro Gly Ser Thr Ala Pro Pro
435 440 445
Ala His Gly Val Thr Ser Ala Pro Asp Thr Arg Pro Ala Pro Gly Ser
450 455 460
Thr Ala Pro Pro Ala His Gly Val Thr Ser Ala Pro Asp Thr Arg Pro
465 470 475 480
Ala Pro Gly Ser Thr Ala Pro Pro Ala His Gly Val Thr Ser Ala Pro
485 490 495
Asp Thr Arg Pro Ala Pro Gly Ser Thr Ala Pro Pro Ala His Gly Val
500 505 510
Thr Ser Ala Pro Asp Thr Arg Pro Ala Pro Gly Ser Thr Ala Pro Pro
515 520 525
Ala His Gly Val Thr Ser Ala Pro Asp Thr Arg Pro Ala Pro Gly Ser
530 535 540
Thr Ala Pro Pro Ala His Gly Val Thr Ser Ala Pro Asp Thr Arg Pro
545 550 555 560
Ala Pro Gly Ser Thr Ala Pro Pro Ala His Gly Val Thr Ser Ala Pro
565 570 575
Asp Thr Arg Pro Ala Pro Gly Ser Thr Ala Pro Pro Ala His Gly Val
580 585 590
Thr Ser Ala Pro Asp Thr Arg Pro Ala Pro Gly Ser Thr Ala Pro Pro
595 600 605
Ala His Gly Val Thr Ser Ala Pro Asp Thr Arg Pro Ala Pro Gly Ser
610 615 620
Thr Ala Pro Pro Ala His Gly Val Thr Ser Ala Pro Asp Thr Arg Pro
625 630 635 640
Ala Pro Gly Ser Thr Ala Pro Pro Ala His Gly Val Thr Ser Ala Pro
645 650 655
Asp Thr Arg Pro Ala Pro Gly Ser Thr Ala Pro Pro Ala His Gly Val
660 665 670
Thr Ser Ala Pro Asp Thr Arg Pro Ala Pro Gly Ser Thr Ala Pro Pro
675 680 685
Ala His Gly Val Thr Ser Ala Pro Asp Thr Arg Pro Ala Pro Gly Ser
690 695 700
Thr Ala Pro Pro Ala His Gly Val Thr Ser Ala Pro Asp Thr Arg Pro
705 710 715 720
Ala Pro Gly Ser Thr Ala Pro Pro Ala His Gly Val Thr Ser Ala Pro
725 730 735
Asp Thr Arg Pro Ala Pro Gly Ser Thr Ala Pro Pro Ala His Gly Val
740 745 750
Thr Ser Ala Pro Asp Thr Arg Pro Ala Pro Gly Ser Thr Ala Pro Pro
755 760 765
Ala His Gly Val Thr Ser Ala Pro Asp Thr Arg Pro Ala Pro Gly Ser
770 775 780
Thr Ala Pro Pro Ala His Gly Val Thr Ser Ala Pro Asp Thr Arg Pro
785 790 795 800
Ala Pro Gly Ser Thr Ala Pro Pro Ala His Gly Val Thr Ser Ala Pro
805 810 815
Asp Thr Arg Pro Ala Pro Gly Ser Thr Ala Pro Pro Ala His Gly Val
820 825 830
Thr Ser Ala Pro Asp Thr Arg Pro Ala Pro Gly Ser Thr Ala Pro Pro
835 840 845
Ala His Gly Val Thr Ser Ala Pro Asp Thr Arg Pro Ala Pro Gly Ser
850 855 860
Thr Ala Pro Pro Ala His Gly Val Thr Ser Ala Pro Asp Thr Arg Pro
865 870 875 880
Ala Pro Gly Ser Thr Ala Pro Pro Ala His Gly Val Thr Ser Ala Pro
885 890 895
Asp Thr Arg Pro Ala Pro Gly Ser Thr Ala Pro Pro Ala His Gly Val
900 905 910
Thr Ser Ala Pro Asp Thr Arg Pro Ala Pro Gly Ser Thr Ala Pro Pro
915 920 925
Ala His Gly Val Thr Ser Ala Pro Asp Thr Arg Pro Ala Pro Gly Ser
930 935 940
Thr Ala Pro Pro Ala His Gly Val Thr Ser Ala Ala Ser Gly Ser Ala
945 950 955 960
Ser Gly Ser Ala Met Val Ser Lys Gly Glu Glu Leu Phe Thr Gly Val
965 970 975
Val Pro Ile Leu Val Glu Leu Asp Gly Asp Val Asn Gly His Lys Phe
980 985 990
Ser Val Arg Gly Glu Gly Glu Gly Asp Ala Thr Asn Gly Lys Leu Thr
995 1000 1005
Leu Lys Phe Ile Ser Thr Thr Gly Lys Leu Pro Val Pro Trp Pro
1010 1015 1020
Thr Leu Val Thr Thr Leu Thr Tyr Gly Val Gln Ser Phe Ser Arg
1025 1030 1035
Tyr Pro Asp His Met Lys Arg His Asp Phe Phe Lys Ser Ala Met
1040 1045 1050
Pro Glu Gly Tyr Val Gln Glu Arg Thr Ile Ser Phe Lys Asp Asp
1055 1060 1065
Gly Thr Tyr Lys Thr Arg Ala Glu Val Lys Phe Glu Gly Asp Thr
1070 1075 1080
Leu Val Asn Arg Ile Glu Leu Lys Gly Ile Asp Phe Lys Glu Asp
1085 1090 1095
Gly Asn Ile Leu Gly His Lys Leu Glu Tyr Asn Phe Asn Ser His
1100 1105 1110
Asn Val Tyr Ile Thr Ala Asp Lys Gln Lys Asn Gly Ile Lys Ala
1115 1120 1125
Asn Phe Lys Ile Arg His Asn Val Glu Asp Gly Ser Val Gln Leu
1130 1135 1140
Ala Asp His Tyr Gln Gln Asn Thr Pro Ile Gly Asp Gly Pro Val
1145 1150 1155
Leu Leu Pro Asp Asn His Tyr Leu Ser Thr Gln Ser Lys Leu Ser
1160 1165 1170
Lys Asp Pro Asn Glu Lys Arg Asp His Met Val Leu Leu Glu Phe
1175 1180 1185
Val Thr Ala Ala Gly Ile Thr His Gly Met Asp Glu Leu Tyr Lys
1190 1195 1200
Gly Ser Ala Ser Thr Leu Val His Asn Gly Thr Ser Ala Arg Ala
1205 1210 1215
Thr Thr Thr Pro Ala Ser Lys Ser Thr Pro Phe Ser Ile Pro Ser
1220 1225 1230
His His Ser Asp Thr Pro Thr Thr Leu Ala Ser His Ser Thr Lys
1235 1240 1245
Thr Asp Ala Ser Ser Thr His His Ser Ser Val Pro Pro Leu Thr
1250 1255 1260
Ser Ser Asn His Ser Thr Ser Pro Gln Leu Ser Thr Gly Val Ser
1265 1270 1275
Phe Phe Phe Leu Ser Phe His Ile Ser Asn Leu Gln Phe Asn Ser
1280 1285 1290
Ser Leu Glu Asp Pro Ser Thr Asp Tyr Tyr Gln Glu Leu Gln Arg
1295 1300 1305
Asp Ile Ser Glu Met Phe Leu Gln Ile Tyr Lys Gln Gly Gly Phe
1310 1315 1320
Leu Gly Leu Ser Asn Ile Lys Phe Arg Pro Gly Ser Val Val Val
1325 1330 1335
Gln Leu Thr Leu Ala Phe Arg Glu Gly Thr Ile Asn Val His Asp
1340 1345 1350
Val Glu Thr Gln Phe Asn Gln Tyr Lys Thr Glu Ala Ala Ser Arg
1355 1360 1365
Tyr Asn Leu Thr Ile Ser Asp Val Ser Val Ser Asp Val Pro Phe
1370 1375 1380
Pro Phe Ser Ala Gln Ser Gly Ala Gly Val Pro Gly Trp Gly Ile
1385 1390 1395
Ala Leu Leu Val Leu Val Cys Val Leu Val Ala Leu Ala Ile Val
1400 1405 1410
Tyr Leu Ile Ala Leu Ala Val Cys Gln Cys Arg Arg Lys
1415 1420 1425
<210> 37
<211> 1005
<212> PRT
<213> 人工序列
<220>
<223> 重组粘蛋白
<400> 37
Met Thr Pro Gly Thr Gln Ser Pro Phe Phe Leu Leu Leu Leu Leu Thr
1 5 10 15
Val Leu Thr Val Val Thr Gly Ser Gly His Ala Ser Ser Thr Pro Gly
20 25 30
Gly Glu Lys Glu Thr Ser Ala Thr Gln Arg Ser Ser Val Pro Ser Ser
35 40 45
Thr Glu Lys Asn Ala Asp Tyr Lys Asp Asp Asp Asp Leu Tyr Met Asp
50 55 60
Met Val Ala Val Ser Met Thr Ser Ser Val Leu Ser Ser His Ser Pro
65 70 75 80
Gly Ser Gly Ser Ser Thr Thr Gln Gly Gln Asp Val Thr Leu Ala Pro
85 90 95
Ala Thr Glu Pro Ala Ser Gly Ser Ala Ala Thr Trp Gly Gln Asp Val
100 105 110
Thr Ser Val Pro Asp Thr Arg Pro Ala Pro Gly Ser Thr Ala Pro Pro
115 120 125
Ala His Gly Val Thr Ser Ala Pro Asp Thr Arg Pro Ala Pro Gly Ser
130 135 140
Thr Ala Pro Pro Ala His Gly Val Thr Ser Ala Pro Asp Thr Arg Pro
145 150 155 160
Ala Pro Gly Ser Thr Ala Pro Pro Ala His Gly Val Thr Ser Ala Pro
165 170 175
Asp Thr Arg Pro Ala Pro Gly Ser Thr Ala Pro Pro Ala His Gly Val
180 185 190
Thr Ser Ala Pro Asp Thr Arg Pro Ala Pro Gly Ser Thr Ala Pro Pro
195 200 205
Ala His Gly Val Thr Ser Ala Pro Asp Thr Arg Pro Ala Pro Gly Ser
210 215 220
Thr Ala Pro Pro Ala His Gly Val Thr Ser Ala Pro Asp Thr Arg Pro
225 230 235 240
Ala Pro Gly Ser Thr Ala Pro Pro Ala His Gly Val Thr Ser Ala Pro
245 250 255
Asp Thr Arg Pro Ala Pro Gly Ser Thr Ala Pro Pro Ala His Gly Val
260 265 270
Thr Ser Ala Pro Asp Thr Arg Pro Ala Pro Gly Ser Thr Ala Pro Pro
275 280 285
Ala His Gly Val Thr Ser Ala Pro Asp Thr Arg Pro Ala Pro Gly Ser
290 295 300
Thr Ala Pro Pro Ala His Gly Val Thr Ser Ala Pro Asp Thr Arg Pro
305 310 315 320
Ala Pro Gly Ser Thr Ala Pro Pro Ala His Gly Val Thr Ser Ala Pro
325 330 335
Asp Thr Arg Pro Ala Pro Gly Ser Thr Ala Pro Pro Ala His Gly Val
340 345 350
Thr Ser Ala Pro Asp Thr Arg Pro Ala Pro Gly Ser Thr Ala Pro Pro
355 360 365
Ala His Gly Val Thr Ser Ala Pro Asp Thr Arg Pro Ala Pro Gly Ser
370 375 380
Thr Ala Pro Pro Ala His Gly Val Thr Ser Ala Pro Asp Thr Arg Pro
385 390 395 400
Ala Pro Gly Ser Thr Ala Pro Pro Ala His Gly Val Thr Ser Ala Pro
405 410 415
Asp Thr Arg Pro Ala Pro Gly Ser Thr Ala Pro Pro Ala His Gly Val
420 425 430
Thr Ser Ala Pro Asp Thr Arg Pro Ala Pro Gly Ser Thr Ala Pro Pro
435 440 445
Ala His Gly Val Thr Ser Ala Pro Asp Thr Arg Pro Ala Pro Gly Ser
450 455 460
Thr Ala Pro Pro Ala His Gly Val Thr Ser Ala Pro Asp Thr Arg Pro
465 470 475 480
Ala Pro Gly Ser Thr Ala Pro Pro Ala His Gly Val Thr Ser Ala Pro
485 490 495
Asp Thr Arg Pro Ala Pro Gly Ser Thr Ala Pro Pro Ala His Gly Val
500 505 510
Thr Ser Ala Pro Asp Thr Arg Pro Ala Pro Gly Ser Thr Ala Pro Pro
515 520 525
Ala His Gly Val Thr Ser Ala Ala Ser Gly Ser Ala Ser Gly Ser Ala
530 535 540
Met Val Ser Lys Gly Glu Glu Leu Phe Thr Gly Val Val Pro Ile Leu
545 550 555 560
Val Glu Leu Asp Gly Asp Val Asn Gly His Lys Phe Ser Val Arg Gly
565 570 575
Glu Gly Glu Gly Asp Ala Thr Asn Gly Lys Leu Thr Leu Lys Phe Ile
580 585 590
Ser Thr Thr Gly Lys Leu Pro Val Pro Trp Pro Thr Leu Val Thr Thr
595 600 605
Leu Thr Tyr Gly Val Gln Ser Phe Ser Arg Tyr Pro Asp His Met Lys
610 615 620
Arg His Asp Phe Phe Lys Ser Ala Met Pro Glu Gly Tyr Val Gln Glu
625 630 635 640
Arg Thr Ile Ser Phe Lys Asp Asp Gly Thr Tyr Lys Thr Arg Ala Glu
645 650 655
Val Lys Phe Glu Gly Asp Thr Leu Val Asn Arg Ile Glu Leu Lys Gly
660 665 670
Ile Asp Phe Lys Glu Asp Gly Asn Ile Leu Gly His Lys Leu Glu Tyr
675 680 685
Asn Phe Asn Ser His Asn Val Tyr Ile Thr Ala Asp Lys Gln Lys Asn
690 695 700
Gly Ile Lys Ala Asn Phe Lys Ile Arg His Asn Val Glu Asp Gly Ser
705 710 715 720
Val Gln Leu Ala Asp His Tyr Gln Gln Asn Thr Pro Ile Gly Asp Gly
725 730 735
Pro Val Leu Leu Pro Asp Asn His Tyr Leu Ser Thr Gln Ser Lys Leu
740 745 750
Ser Lys Asp Pro Asn Glu Lys Arg Asp His Met Val Leu Leu Glu Phe
755 760 765
Val Thr Ala Ala Gly Ile Thr His Gly Met Asp Glu Leu Tyr Lys Gly
770 775 780
Ser Ala Ser Thr Leu Val His Asn Gly Thr Ser Ala Arg Ala Thr Thr
785 790 795 800
Thr Pro Ala Ser Lys Ser Thr Pro Phe Ser Ile Pro Ser His His Ser
805 810 815
Asp Thr Pro Thr Thr Leu Ala Ser His Ser Thr Lys Thr Asp Ala Ser
820 825 830
Ser Thr His His Ser Ser Val Pro Pro Leu Thr Ser Ser Asn His Ser
835 840 845
Thr Ser Pro Gln Leu Ser Thr Gly Val Ser Phe Phe Phe Leu Ser Phe
850 855 860
His Ile Ser Asn Leu Gln Phe Asn Ser Ser Leu Glu Asp Pro Ser Thr
865 870 875 880
Asp Tyr Tyr Gln Glu Leu Gln Arg Asp Ile Ser Glu Met Phe Leu Gln
885 890 895
Ile Tyr Lys Gln Gly Gly Phe Leu Gly Leu Ser Asn Ile Lys Phe Arg
900 905 910
Pro Gly Ser Val Val Val Gln Leu Thr Leu Ala Phe Arg Glu Gly Thr
915 920 925
Ile Asn Val His Asp Val Glu Thr Gln Phe Asn Gln Tyr Lys Thr Glu
930 935 940
Ala Ala Ser Arg Tyr Asn Leu Thr Ile Ser Asp Val Ser Val Ser Asp
945 950 955 960
Val Pro Phe Pro Phe Ser Ala Gln Ser Gly Ala Gly Val Pro Gly Trp
965 970 975
Gly Ile Ala Leu Leu Val Leu Val Cys Val Leu Val Ala Leu Ala Ile
980 985 990
Val Tyr Leu Ile Ala Leu Ala Val Cys Gln Cys Arg Arg
995 1000 1005
<210> 38
<211> 591
<212> PRT
<213> 人工序列
<220>
<223> 重组粘蛋白
<400> 38
Met Thr Pro Gly Thr Gln Ser Pro Phe Phe Leu Leu Leu Leu Leu Thr
1 5 10 15
Val Leu Thr Val Val Thr Gly Ser Gly His Ala Ser Ser Thr Pro Gly
20 25 30
Gly Glu Lys Glu Thr Ser Ala Thr Gln Arg Ser Ser Val Pro Ser Ser
35 40 45
Thr Glu Lys Asn Ala Asp Tyr Lys Asp Asp Asp Asp Leu Tyr Met Asp
50 55 60
Met Val Ala Val Ser Met Thr Ser Ser Val Leu Ser Ser His Ser Pro
65 70 75 80
Gly Ser Gly Ser Ser Thr Thr Gln Gly Gln Asp Val Thr Leu Ala Pro
85 90 95
Ala Thr Glu Pro Ala Ser Gly Ser Ala Ala Thr Trp Gly Gln Asp Val
100 105 110
Thr Ser Val Gly Gly Gly Gly Gly Ala Ser Gly Ser Ala Ser Gly Ser
115 120 125
Ala Met Val Ser Lys Gly Glu Glu Leu Phe Thr Gly Val Val Pro Ile
130 135 140
Leu Val Glu Leu Asp Gly Asp Val Asn Gly His Lys Phe Ser Val Arg
145 150 155 160
Gly Glu Gly Glu Gly Asp Ala Thr Asn Gly Lys Leu Thr Leu Lys Phe
165 170 175
Ile Ser Thr Thr Gly Lys Leu Pro Val Pro Trp Pro Thr Leu Val Thr
180 185 190
Thr Leu Thr Tyr Gly Val Gln Ser Phe Ser Arg Tyr Pro Asp His Met
195 200 205
Lys Arg His Asp Phe Phe Lys Ser Ala Met Pro Glu Gly Tyr Val Gln
210 215 220
Glu Arg Thr Ile Ser Phe Lys Asp Asp Gly Thr Tyr Lys Thr Arg Ala
225 230 235 240
Glu Val Lys Phe Glu Gly Asp Thr Leu Val Asn Arg Ile Glu Leu Lys
245 250 255
Gly Ile Asp Phe Lys Glu Asp Gly Asn Ile Leu Gly His Lys Leu Glu
260 265 270
Tyr Asn Phe Asn Ser His Asn Val Tyr Ile Thr Ala Asp Lys Gln Lys
275 280 285
Asn Gly Ile Lys Ala Asn Phe Lys Ile Arg His Asn Val Glu Asp Gly
290 295 300
Ser Val Gln Leu Ala Asp His Tyr Gln Gln Asn Thr Pro Ile Gly Asp
305 310 315 320
Gly Pro Val Leu Leu Pro Asp Asn His Tyr Leu Ser Thr Gln Ser Lys
325 330 335
Leu Ser Lys Asp Pro Asn Glu Lys Arg Asp His Met Val Leu Leu Glu
340 345 350
Phe Val Thr Ala Ala Gly Ile Thr His Gly Met Asp Glu Leu Tyr Lys
355 360 365
Gly Ser Ala Ser Thr Leu Val His Asn Gly Thr Ser Ala Arg Ala Thr
370 375 380
Thr Thr Pro Ala Ser Lys Ser Thr Pro Phe Ser Ile Pro Ser His His
385 390 395 400
Ser Asp Thr Pro Thr Thr Leu Ala Ser His Ser Thr Lys Thr Asp Ala
405 410 415
Ser Ser Thr His His Ser Ser Val Pro Pro Leu Thr Ser Ser Asn His
420 425 430
Ser Thr Ser Pro Gln Leu Ser Thr Gly Val Ser Phe Phe Phe Leu Ser
435 440 445
Phe His Ile Ser Asn Leu Gln Phe Asn Ser Ser Leu Glu Asp Pro Ser
450 455 460
Thr Asp Tyr Tyr Gln Glu Leu Gln Arg Asp Ile Ser Glu Met Phe Leu
465 470 475 480
Gln Ile Tyr Lys Gln Gly Gly Phe Leu Gly Leu Ser Asn Ile Lys Phe
485 490 495
Arg Pro Gly Ser Val Val Val Gln Leu Thr Leu Ala Phe Arg Glu Gly
500 505 510
Thr Ile Asn Val His Asp Val Glu Thr Gln Phe Asn Gln Tyr Lys Thr
515 520 525
Glu Ala Ala Ser Arg Tyr Asn Leu Thr Ile Ser Asp Val Ser Val Ser
530 535 540
Asp Val Pro Phe Pro Phe Ser Ala Gln Ser Gly Ala Gly Val Pro Gly
545 550 555 560
Trp Gly Ile Ala Leu Leu Val Leu Val Cys Val Leu Val Ala Leu Ala
565 570 575
Ile Val Tyr Leu Ile Ala Leu Ala Val Cys Gln Cys Arg Arg Lys
580 585 590
<210> 39
<211> 1005
<212> PRT
<213> 人工序列
<220>
<223> 重组粘蛋白
<400> 39
Met Thr Pro Gly Thr Gln Ser Pro Phe Phe Leu Leu Leu Leu Leu Thr
1 5 10 15
Val Leu Thr Val Val Thr Gly Ser Gly His Ala Ser Ser Thr Pro Gly
20 25 30
Gly Glu Lys Glu Thr Ser Ala Thr Gln Arg Ser Ser Val Pro Ser Ser
35 40 45
Thr Glu Lys Asn Ala Asp Tyr Lys Asp Asp Asp Asp Leu Tyr Met Asp
50 55 60
Met Val Ala Val Ser Met Thr Ser Ser Val Leu Ser Ser His Ser Pro
65 70 75 80
Gly Ser Gly Ser Ser Thr Thr Gln Gly Gln Asp Val Thr Leu Ala Pro
85 90 95
Ala Thr Glu Pro Ala Ser Gly Ser Ala Ala Thr Trp Gly Gln Asp Val
100 105 110
Thr Ser Val Pro Asp Thr Arg Pro Ala Pro Gly Ala Thr Ala Pro Pro
115 120 125
Ala His Gly Val Thr Ser Ala Pro Asp Thr Arg Pro Ala Pro Gly Ala
130 135 140
Thr Ala Pro Pro Ala His Gly Val Thr Ser Ala Pro Asp Thr Arg Pro
145 150 155 160
Ala Pro Gly Ala Thr Ala Pro Pro Ala His Gly Val Thr Ser Ala Pro
165 170 175
Asp Thr Arg Pro Ala Pro Gly Ala Thr Ala Pro Pro Ala His Gly Val
180 185 190
Thr Ser Ala Pro Asp Thr Arg Pro Ala Pro Gly Ala Thr Ala Pro Pro
195 200 205
Ala His Gly Val Thr Ser Ala Pro Asp Thr Arg Pro Ala Pro Gly Ala
210 215 220
Thr Ala Pro Pro Ala His Gly Val Thr Ser Ala Pro Asp Thr Arg Pro
225 230 235 240
Ala Pro Gly Ala Thr Ala Pro Pro Ala His Gly Val Thr Ser Ala Pro
245 250 255
Asp Thr Arg Pro Ala Pro Gly Ala Thr Ala Pro Pro Ala His Gly Val
260 265 270
Thr Ser Ala Pro Asp Thr Arg Pro Ala Pro Gly Ala Thr Ala Pro Pro
275 280 285
Ala His Gly Val Thr Ser Ala Pro Asp Thr Arg Pro Ala Pro Gly Ala
290 295 300
Thr Ala Pro Pro Ala His Gly Val Thr Ser Ala Pro Asp Thr Arg Pro
305 310 315 320
Ala Pro Gly Ala Thr Ala Pro Pro Ala His Gly Val Thr Ser Ala Pro
325 330 335
Asp Thr Arg Pro Ala Pro Gly Ala Thr Ala Pro Pro Ala His Gly Val
340 345 350
Thr Ser Ala Pro Asp Thr Arg Pro Ala Pro Gly Ala Thr Ala Pro Pro
355 360 365
Ala His Gly Val Thr Ser Ala Pro Asp Thr Arg Pro Ala Pro Gly Ala
370 375 380
Thr Ala Pro Pro Ala His Gly Val Thr Ser Ala Pro Asp Thr Arg Pro
385 390 395 400
Ala Pro Gly Ala Thr Ala Pro Pro Ala His Gly Val Thr Ser Ala Pro
405 410 415
Asp Thr Arg Pro Ala Pro Gly Ala Thr Ala Pro Pro Ala His Gly Val
420 425 430
Thr Ser Ala Pro Asp Thr Arg Pro Ala Pro Gly Ala Thr Ala Pro Pro
435 440 445
Ala His Gly Val Thr Ser Ala Pro Asp Thr Arg Pro Ala Pro Gly Ala
450 455 460
Thr Ala Pro Pro Ala His Gly Val Thr Ser Ala Pro Asp Thr Arg Pro
465 470 475 480
Ala Pro Gly Ala Thr Ala Pro Pro Ala His Gly Val Thr Ser Ala Pro
485 490 495
Asp Thr Arg Pro Ala Pro Gly Ala Thr Ala Pro Pro Ala His Gly Val
500 505 510
Thr Ser Ala Pro Asp Thr Arg Pro Ala Pro Gly Ala Thr Ala Pro Pro
515 520 525
Ala His Gly Val Thr Ser Ala Ala Ser Gly Ser Ala Ser Gly Ser Ala
530 535 540
Met Val Ser Lys Gly Glu Glu Leu Phe Thr Gly Val Val Pro Ile Leu
545 550 555 560
Val Glu Leu Asp Gly Asp Val Asn Gly His Lys Phe Ser Val Arg Gly
565 570 575
Glu Gly Glu Gly Asp Ala Thr Asn Gly Lys Leu Thr Leu Lys Phe Ile
580 585 590
Ser Thr Thr Gly Lys Leu Pro Val Pro Trp Pro Thr Leu Val Thr Thr
595 600 605
Leu Thr Tyr Gly Val Gln Ser Phe Ser Arg Tyr Pro Asp His Met Lys
610 615 620
Arg His Asp Phe Phe Lys Ser Ala Met Pro Glu Gly Tyr Val Gln Glu
625 630 635 640
Arg Thr Ile Ser Phe Lys Asp Asp Gly Thr Tyr Lys Thr Arg Ala Glu
645 650 655
Val Lys Phe Glu Gly Asp Thr Leu Val Asn Arg Ile Glu Leu Lys Gly
660 665 670
Ile Asp Phe Lys Glu Asp Gly Asn Ile Leu Gly His Lys Leu Glu Tyr
675 680 685
Asn Phe Asn Ser His Asn Val Tyr Ile Thr Ala Asp Lys Gln Lys Asn
690 695 700
Gly Ile Lys Ala Asn Phe Lys Ile Arg His Asn Val Glu Asp Gly Ser
705 710 715 720
Val Gln Leu Ala Asp His Tyr Gln Gln Asn Thr Pro Ile Gly Asp Gly
725 730 735
Pro Val Leu Leu Pro Asp Asn His Tyr Leu Ser Thr Gln Ser Lys Leu
740 745 750
Ser Lys Asp Pro Asn Glu Lys Arg Asp His Met Val Leu Leu Glu Phe
755 760 765
Val Thr Ala Ala Gly Ile Thr His Gly Met Asp Glu Leu Tyr Lys Gly
770 775 780
Ser Ala Ser Thr Leu Val His Asn Gly Thr Ser Ala Arg Ala Thr Thr
785 790 795 800
Thr Pro Ala Ser Lys Ser Thr Pro Phe Ser Ile Pro Ser His His Ser
805 810 815
Asp Thr Pro Thr Thr Leu Ala Ser His Ser Thr Lys Thr Asp Ala Ser
820 825 830
Ser Thr His His Ser Ser Val Pro Pro Leu Thr Ser Ser Asn His Ser
835 840 845
Thr Ser Pro Gln Leu Ser Thr Gly Val Ser Phe Phe Phe Leu Ser Phe
850 855 860
His Ile Ser Asn Leu Gln Phe Asn Ser Ser Leu Glu Asp Pro Ser Thr
865 870 875 880
Asp Tyr Tyr Gln Glu Leu Gln Arg Asp Ile Ser Glu Met Phe Leu Gln
885 890 895
Ile Tyr Lys Gln Gly Gly Phe Leu Gly Leu Ser Asn Ile Lys Phe Arg
900 905 910
Pro Gly Ser Val Val Val Gln Leu Thr Leu Ala Phe Arg Glu Gly Thr
915 920 925
Ile Asn Val His Asp Val Glu Thr Gln Phe Asn Gln Tyr Lys Thr Glu
930 935 940
Ala Ala Ser Arg Tyr Asn Leu Thr Ile Ser Asp Val Ser Val Ser Asp
945 950 955 960
Val Pro Phe Pro Phe Ser Ala Gln Ser Gly Ala Gly Val Pro Gly Trp
965 970 975
Gly Ile Ala Leu Leu Val Leu Val Cys Val Leu Val Ala Leu Ala Ile
980 985 990
Val Tyr Leu Ile Ala Leu Ala Val Cys Gln Cys Arg Arg
995 1000 1005
<210> 40
<211> 1005
<212> PRT
<213> 人工序列
<220>
<223> 重组粘蛋白
<400> 40
Met Thr Pro Gly Thr Gln Ser Pro Phe Phe Leu Leu Leu Leu Leu Thr
1 5 10 15
Val Leu Thr Val Val Thr Gly Ser Gly His Ala Ser Ser Thr Pro Gly
20 25 30
Gly Glu Lys Glu Thr Ser Ala Thr Gln Arg Ser Ser Val Pro Ser Ser
35 40 45
Thr Glu Lys Asn Ala Asp Tyr Lys Asp Asp Asp Asp Leu Tyr Met Asp
50 55 60
Met Val Ala Val Ser Met Thr Ser Ser Val Leu Ser Ser His Ser Pro
65 70 75 80
Gly Ser Gly Ser Ser Thr Thr Gln Gly Gln Asp Val Thr Leu Ala Pro
85 90 95
Ala Thr Glu Pro Ala Ser Gly Ser Ala Ala Thr Trp Gly Gln Asp Val
100 105 110
Thr Ser Val Pro Asp Thr Arg Pro Ala Pro Gly Ala Thr Ala Pro Pro
115 120 125
Ala His Gly Val Thr Ala Ala Pro Asp Thr Arg Pro Ala Pro Gly Ala
130 135 140
Thr Ala Pro Pro Ala His Gly Val Thr Ala Ala Pro Asp Thr Arg Pro
145 150 155 160
Ala Pro Gly Ala Thr Ala Pro Pro Ala His Gly Val Thr Ala Ala Pro
165 170 175
Asp Thr Arg Pro Ala Pro Gly Ala Thr Ala Pro Pro Ala His Gly Val
180 185 190
Thr Ala Ala Pro Asp Thr Arg Pro Ala Pro Gly Ala Thr Ala Pro Pro
195 200 205
Ala His Gly Val Thr Ala Ala Pro Asp Thr Arg Pro Ala Pro Gly Ala
210 215 220
Thr Ala Pro Pro Ala His Gly Val Thr Ala Ala Pro Asp Thr Arg Pro
225 230 235 240
Ala Pro Gly Ala Thr Ala Pro Pro Ala His Gly Val Thr Ala Ala Pro
245 250 255
Asp Thr Arg Pro Ala Pro Gly Ala Thr Ala Pro Pro Ala His Gly Val
260 265 270
Thr Ala Ala Pro Asp Thr Arg Pro Ala Pro Gly Ala Thr Ala Pro Pro
275 280 285
Ala His Gly Val Thr Ala Ala Pro Asp Thr Arg Pro Ala Pro Gly Ala
290 295 300
Thr Ala Pro Pro Ala His Gly Val Thr Ala Ala Pro Asp Thr Arg Pro
305 310 315 320
Ala Pro Gly Ala Thr Ala Pro Pro Ala His Gly Val Thr Ala Ala Pro
325 330 335
Asp Thr Arg Pro Ala Pro Gly Ala Thr Ala Pro Pro Ala His Gly Val
340 345 350
Thr Ala Ala Pro Asp Thr Arg Pro Ala Pro Gly Ala Thr Ala Pro Pro
355 360 365
Ala His Gly Val Thr Ala Ala Pro Asp Thr Arg Pro Ala Pro Gly Ala
370 375 380
Thr Ala Pro Pro Ala His Gly Val Thr Ala Ala Pro Asp Thr Arg Pro
385 390 395 400
Ala Pro Gly Ala Thr Ala Pro Pro Ala His Gly Val Thr Ala Ala Pro
405 410 415
Asp Thr Arg Pro Ala Pro Gly Ala Thr Ala Pro Pro Ala His Gly Val
420 425 430
Thr Ala Ala Pro Asp Thr Arg Pro Ala Pro Gly Ala Thr Ala Pro Pro
435 440 445
Ala His Gly Val Thr Ala Ala Pro Asp Thr Arg Pro Ala Pro Gly Ala
450 455 460
Thr Ala Pro Pro Ala His Gly Val Thr Ala Ala Pro Asp Thr Arg Pro
465 470 475 480
Ala Pro Gly Ala Thr Ala Pro Pro Ala His Gly Val Thr Ala Ala Pro
485 490 495
Asp Thr Arg Pro Ala Pro Gly Ala Thr Ala Pro Pro Ala His Gly Val
500 505 510
Thr Ala Ala Pro Asp Thr Arg Pro Ala Pro Gly Ala Thr Ala Pro Pro
515 520 525
Ala His Gly Val Thr Ala Ala Ala Ser Gly Ser Ala Ser Gly Ser Ala
530 535 540
Met Val Ser Lys Gly Glu Glu Leu Phe Thr Gly Val Val Pro Ile Leu
545 550 555 560
Val Glu Leu Asp Gly Asp Val Asn Gly His Lys Phe Ser Val Arg Gly
565 570 575
Glu Gly Glu Gly Asp Ala Thr Asn Gly Lys Leu Thr Leu Lys Phe Ile
580 585 590
Ser Thr Thr Gly Lys Leu Pro Val Pro Trp Pro Thr Leu Val Thr Thr
595 600 605
Leu Thr Tyr Gly Val Gln Ser Phe Ser Arg Tyr Pro Asp His Met Lys
610 615 620
Arg His Asp Phe Phe Lys Ser Ala Met Pro Glu Gly Tyr Val Gln Glu
625 630 635 640
Arg Thr Ile Ser Phe Lys Asp Asp Gly Thr Tyr Lys Thr Arg Ala Glu
645 650 655
Val Lys Phe Glu Gly Asp Thr Leu Val Asn Arg Ile Glu Leu Lys Gly
660 665 670
Ile Asp Phe Lys Glu Asp Gly Asn Ile Leu Gly His Lys Leu Glu Tyr
675 680 685
Asn Phe Asn Ser His Asn Val Tyr Ile Thr Ala Asp Lys Gln Lys Asn
690 695 700
Gly Ile Lys Ala Asn Phe Lys Ile Arg His Asn Val Glu Asp Gly Ser
705 710 715 720
Val Gln Leu Ala Asp His Tyr Gln Gln Asn Thr Pro Ile Gly Asp Gly
725 730 735
Pro Val Leu Leu Pro Asp Asn His Tyr Leu Ser Thr Gln Ser Lys Leu
740 745 750
Ser Lys Asp Pro Asn Glu Lys Arg Asp His Met Val Leu Leu Glu Phe
755 760 765
Val Thr Ala Ala Gly Ile Thr His Gly Met Asp Glu Leu Tyr Lys Gly
770 775 780
Ser Ala Ser Thr Leu Val His Asn Gly Thr Ser Ala Arg Ala Thr Thr
785 790 795 800
Thr Pro Ala Ser Lys Ser Thr Pro Phe Ser Ile Pro Ser His His Ser
805 810 815
Asp Thr Pro Thr Thr Leu Ala Ser His Ser Thr Lys Thr Asp Ala Ser
820 825 830
Ser Thr His His Ser Ser Val Pro Pro Leu Thr Ser Ser Asn His Ser
835 840 845
Thr Ser Pro Gln Leu Ser Thr Gly Val Ser Phe Phe Phe Leu Ser Phe
850 855 860
His Ile Ser Asn Leu Gln Phe Asn Ser Ser Leu Glu Asp Pro Ser Thr
865 870 875 880
Asp Tyr Tyr Gln Glu Leu Gln Arg Asp Ile Ser Glu Met Phe Leu Gln
885 890 895
Ile Tyr Lys Gln Gly Gly Phe Leu Gly Leu Ser Asn Ile Lys Phe Arg
900 905 910
Pro Gly Ser Val Val Val Gln Leu Thr Leu Ala Phe Arg Glu Gly Thr
915 920 925
Ile Asn Val His Asp Val Glu Thr Gln Phe Asn Gln Tyr Lys Thr Glu
930 935 940
Ala Ala Ser Arg Tyr Asn Leu Thr Ile Ser Asp Val Ser Val Ser Asp
945 950 955 960
Val Pro Phe Pro Phe Ser Ala Gln Ser Gly Ala Gly Val Pro Gly Trp
965 970 975
Gly Ile Ala Leu Leu Val Leu Val Cys Val Leu Val Ala Leu Ala Ile
980 985 990
Val Tyr Leu Ile Ala Leu Ala Val Cys Gln Cys Arg Arg
995 1000 1005
<210> 41
<211> 1006
<212> PRT
<213> 人工序列
<220>
<223> 重组粘蛋白
<400> 41
Met Thr Pro Gly Thr Gln Ser Pro Phe Phe Leu Leu Leu Leu Leu Thr
1 5 10 15
Val Leu Thr Val Val Thr Gly Ser Gly His Ala Ser Ser Thr Pro Gly
20 25 30
Gly Glu Lys Glu Thr Ser Ala Thr Gln Arg Ser Ser Val Pro Ser Ser
35 40 45
Thr Glu Lys Asn Ala Asp Tyr Lys Asp Asp Asp Asp Leu Tyr Met Asp
50 55 60
Met Val Ala Val Ser Met Thr Ser Ser Val Leu Ser Ser His Ser Pro
65 70 75 80
Gly Ser Gly Ser Ser Thr Thr Gln Gly Gln Asp Val Thr Leu Ala Pro
85 90 95
Ala Thr Glu Pro Ala Ser Gly Ser Ala Ala Thr Trp Gly Gln Asp Val
100 105 110
Thr Ser Val Pro Asp Ala Arg Pro Ala Pro Gly Ala Thr Ala Pro Pro
115 120 125
Ala His Gly Val Thr Ala Ala Pro Asp Ala Arg Pro Ala Pro Gly Ala
130 135 140
Thr Ala Pro Pro Ala His Gly Val Thr Ala Ala Pro Asp Ala Arg Pro
145 150 155 160
Ala Pro Gly Ala Thr Ala Pro Pro Ala His Gly Val Thr Ala Ala Pro
165 170 175
Asp Ala Arg Pro Ala Pro Gly Ala Thr Ala Pro Pro Ala His Gly Val
180 185 190
Thr Ala Ala Pro Asp Ala Arg Pro Ala Pro Gly Ala Thr Ala Pro Pro
195 200 205
Ala His Gly Val Thr Ala Ala Pro Asp Ala Arg Pro Ala Pro Gly Ala
210 215 220
Thr Ala Pro Pro Ala His Gly Val Thr Ala Ala Pro Asp Ala Arg Pro
225 230 235 240
Ala Pro Gly Ala Thr Ala Pro Pro Ala His Gly Val Thr Ala Ala Pro
245 250 255
Asp Ala Arg Pro Ala Pro Gly Ala Thr Ala Pro Pro Ala His Gly Val
260 265 270
Thr Ala Ala Pro Asp Ala Arg Pro Ala Pro Gly Ala Thr Ala Pro Pro
275 280 285
Ala His Gly Val Thr Ala Ala Pro Asp Ala Arg Pro Ala Pro Gly Ala
290 295 300
Thr Ala Pro Pro Ala His Gly Val Thr Ala Ala Pro Asp Ala Arg Pro
305 310 315 320
Ala Pro Gly Ala Thr Ala Pro Pro Ala His Gly Val Thr Ala Ala Pro
325 330 335
Asp Ala Arg Pro Ala Pro Gly Ala Thr Ala Pro Pro Ala His Gly Val
340 345 350
Thr Ala Ala Pro Asp Ala Arg Pro Ala Pro Gly Ala Thr Ala Pro Pro
355 360 365
Ala His Gly Val Thr Ala Ala Pro Asp Ala Arg Pro Ala Pro Gly Ala
370 375 380
Thr Ala Pro Pro Ala His Gly Val Thr Ala Ala Pro Asp Ala Arg Pro
385 390 395 400
Ala Pro Gly Ala Thr Ala Pro Pro Ala His Gly Val Thr Ala Ala Pro
405 410 415
Asp Ala Arg Pro Ala Pro Gly Ala Thr Ala Pro Pro Ala His Gly Val
420 425 430
Thr Ala Ala Pro Asp Ala Arg Pro Ala Pro Gly Ala Thr Ala Pro Pro
435 440 445
Ala His Gly Val Thr Ala Ala Pro Asp Ala Arg Pro Ala Pro Gly Ala
450 455 460
Thr Ala Pro Pro Ala His Gly Val Thr Ala Ala Pro Asp Ala Arg Pro
465 470 475 480
Ala Pro Gly Ala Thr Ala Pro Pro Ala His Gly Val Thr Ala Ala Pro
485 490 495
Asp Ala Arg Pro Ala Pro Gly Ala Thr Ala Pro Pro Ala His Gly Val
500 505 510
Thr Ala Ala Pro Asp Ala Arg Pro Ala Pro Gly Ala Thr Ala Pro Pro
515 520 525
Ala His Gly Val Thr Ala Ala Ala Ser Gly Ser Ala Ser Gly Ser Ala
530 535 540
Met Val Ser Lys Gly Glu Glu Leu Phe Thr Gly Val Val Pro Ile Leu
545 550 555 560
Val Glu Leu Asp Gly Asp Val Asn Gly His Lys Phe Ser Val Arg Gly
565 570 575
Glu Gly Glu Gly Asp Ala Thr Asn Gly Lys Leu Thr Leu Lys Phe Ile
580 585 590
Ser Thr Thr Gly Lys Leu Pro Val Pro Trp Pro Thr Leu Val Thr Thr
595 600 605
Leu Thr Tyr Gly Val Gln Ser Phe Ser Arg Tyr Pro Asp His Met Lys
610 615 620
Arg His Asp Phe Phe Lys Ser Ala Met Pro Glu Gly Tyr Val Gln Glu
625 630 635 640
Arg Thr Ile Ser Phe Lys Asp Asp Gly Thr Tyr Lys Thr Arg Ala Glu
645 650 655
Val Lys Phe Glu Gly Asp Thr Leu Val Asn Arg Ile Glu Leu Lys Gly
660 665 670
Ile Asp Phe Lys Glu Asp Gly Asn Ile Leu Gly His Lys Leu Glu Tyr
675 680 685
Asn Phe Asn Ser His Asn Val Tyr Ile Thr Ala Asp Lys Gln Lys Asn
690 695 700
Gly Ile Lys Ala Asn Phe Lys Ile Arg His Asn Val Glu Asp Gly Ser
705 710 715 720
Val Gln Leu Ala Asp His Tyr Gln Gln Asn Thr Pro Ile Gly Asp Gly
725 730 735
Pro Val Leu Leu Pro Asp Asn His Tyr Leu Ser Thr Gln Ser Lys Leu
740 745 750
Ser Lys Asp Pro Asn Glu Lys Arg Asp His Met Val Leu Leu Glu Phe
755 760 765
Val Thr Ala Ala Gly Ile Thr His Gly Met Asp Glu Leu Tyr Lys Gly
770 775 780
Ser Ala Ser Thr Leu Val His Asn Gly Thr Ser Ala Arg Ala Thr Thr
785 790 795 800
Thr Pro Ala Ser Lys Ser Thr Pro Phe Ser Ile Pro Ser His His Ser
805 810 815
Asp Thr Pro Thr Thr Leu Ala Ser His Ser Thr Lys Thr Asp Ala Ser
820 825 830
Ser Thr His His Ser Ser Val Pro Pro Leu Thr Ser Ser Asn His Ser
835 840 845
Thr Ser Pro Gln Leu Ser Thr Gly Val Ser Phe Phe Phe Leu Ser Phe
850 855 860
His Ile Ser Asn Leu Gln Phe Asn Ser Ser Leu Glu Asp Pro Ser Thr
865 870 875 880
Asp Tyr Tyr Gln Glu Leu Gln Arg Asp Ile Ser Glu Met Phe Leu Gln
885 890 895
Ile Tyr Lys Gln Gly Gly Phe Leu Gly Leu Ser Asn Ile Lys Phe Arg
900 905 910
Pro Gly Ser Val Val Val Gln Leu Thr Leu Ala Phe Arg Glu Gly Thr
915 920 925
Ile Asn Val His Asp Val Glu Thr Gln Phe Asn Gln Tyr Lys Thr Glu
930 935 940
Ala Ala Ser Arg Tyr Asn Leu Thr Ile Ser Asp Val Ser Val Ser Asp
945 950 955 960
Val Pro Phe Pro Phe Ser Ala Gln Ser Gly Ala Gly Val Pro Gly Trp
965 970 975
Gly Ile Ala Leu Leu Val Leu Val Cys Val Leu Val Ala Leu Ala Ile
980 985 990
Val Tyr Leu Ile Ala Leu Ala Val Cys Gln Cys Arg Arg Lys
995 1000 1005
<210> 42
<211> 746
<212> PRT
<213> 人工序列
<220>
<223> 重组润滑素
<400> 42
Met Thr Pro Gly Thr Gln Ser Pro Phe Phe Leu Leu Leu Leu Leu Thr
1 5 10 15
Val Leu Thr Val Val Thr Gly Ser Gly His Ala Ser Ser Thr Pro Gly
20 25 30
Gly Glu Lys Glu Thr Ser Ala Thr Gln Arg Ser Ser Val Pro Ser Ser
35 40 45
Thr Glu Lys Asn Ala Asp Tyr Lys Asp Asp Asp Asp Leu Tyr Met Asp
50 55 60
Met Val Ala Val Ser Met Thr Ser Ser Val Leu Ser Ser His Ser Pro
65 70 75 80
Gly Ser Gly Ser Ser Thr Thr Gln Gly Gln Asp Val Thr Leu Ala Pro
85 90 95
Ala Thr Glu Pro Ala Ser Gly Ser Ala Ala Thr Trp Gly Gln Asp Val
100 105 110
Thr Ser Val Lys Glu Pro Ala Pro Thr Thr Pro Lys Glu Pro Ala Pro
115 120 125
Thr Thr Pro Lys Glu Pro Ala Pro Thr Thr Pro Lys Glu Pro Ala Pro
130 135 140
Thr Thr Pro Lys Glu Pro Ala Pro Thr Thr Pro Lys Glu Pro Ala Pro
145 150 155 160
Thr Thr Pro Lys Glu Pro Ala Pro Thr Thr Pro Lys Glu Pro Ala Pro
165 170 175
Thr Thr Pro Lys Glu Pro Ala Pro Thr Thr Pro Lys Glu Pro Ala Pro
180 185 190
Thr Thr Pro Lys Glu Pro Ala Pro Thr Thr Pro Lys Glu Pro Ala Pro
195 200 205
Thr Thr Pro Lys Glu Pro Ala Pro Thr Thr Pro Lys Glu Pro Ala Pro
210 215 220
Thr Thr Pro Lys Glu Pro Ala Pro Thr Thr Pro Lys Glu Pro Ala Pro
225 230 235 240
Thr Thr Pro Lys Glu Pro Ala Pro Thr Thr Pro Lys Glu Pro Ala Pro
245 250 255
Thr Thr Pro Lys Glu Pro Ala Pro Thr Thr Pro Lys Glu Pro Ala Pro
260 265 270
Thr Thr Pro Ala Ser Gly Ser Ala Ser Gly Ser Ala Met Val Ser Lys
275 280 285
Gly Glu Glu Leu Phe Thr Gly Val Val Pro Ile Leu Val Glu Leu Asp
290 295 300
Gly Asp Val Asn Gly His Lys Phe Ser Val Arg Gly Glu Gly Glu Gly
305 310 315 320
Asp Ala Thr Asn Gly Lys Leu Thr Leu Lys Phe Ile Ser Thr Thr Gly
325 330 335
Lys Leu Pro Val Pro Trp Pro Thr Leu Val Thr Thr Leu Thr Tyr Gly
340 345 350
Val Gln Ser Phe Ser Arg Tyr Pro Asp His Met Lys Arg His Asp Phe
355 360 365
Phe Lys Ser Ala Met Pro Glu Gly Tyr Val Gln Glu Arg Thr Ile Ser
370 375 380
Phe Lys Asp Asp Gly Thr Tyr Lys Thr Arg Ala Glu Val Lys Phe Glu
385 390 395 400
Gly Asp Thr Leu Val Asn Arg Ile Glu Leu Lys Gly Ile Asp Phe Lys
405 410 415
Glu Asp Gly Asn Ile Leu Gly His Lys Leu Glu Tyr Asn Phe Asn Ser
420 425 430
His Asn Val Tyr Ile Thr Ala Asp Lys Gln Lys Asn Gly Ile Lys Ala
435 440 445
Asn Phe Lys Ile Arg His Asn Val Glu Asp Gly Ser Val Gln Leu Ala
450 455 460
Asp His Tyr Gln Gln Asn Thr Pro Ile Gly Asp Gly Pro Val Leu Leu
465 470 475 480
Pro Asp Asn His Tyr Leu Ser Thr Gln Ser Lys Leu Ser Lys Asp Pro
485 490 495
Asn Glu Lys Arg Asp His Met Val Leu Leu Glu Phe Val Thr Ala Ala
500 505 510
Gly Ile Thr His Gly Met Asp Glu Leu Tyr Lys Gly Ser Ala Ser Thr
515 520 525
Leu Val His Asn Gly Thr Ser Ala Arg Ala Thr Thr Thr Pro Ala Ser
530 535 540
Lys Ser Thr Pro Phe Ser Ile Pro Ser His His Ser Asp Thr Pro Thr
545 550 555 560
Thr Leu Ala Ser His Ser Thr Lys Thr Asp Ala Ser Ser Thr His His
565 570 575
Ser Ser Val Pro Pro Leu Thr Ser Ser Asn His Ser Thr Ser Pro Gln
580 585 590
Leu Ser Thr Gly Val Ser Phe Phe Phe Leu Ser Phe His Ile Ser Asn
595 600 605
Leu Gln Phe Asn Ser Ser Leu Glu Asp Pro Ser Thr Asp Tyr Tyr Gln
610 615 620
Glu Leu Gln Arg Asp Ile Ser Glu Met Phe Leu Gln Ile Tyr Lys Gln
625 630 635 640
Gly Gly Phe Leu Gly Leu Ser Asn Ile Lys Phe Arg Pro Gly Ser Val
645 650 655
Val Val Gln Leu Thr Leu Ala Phe Arg Glu Gly Thr Ile Asn Val His
660 665 670
Asp Val Glu Thr Gln Phe Asn Gln Tyr Lys Thr Glu Ala Ala Ser Arg
675 680 685
Tyr Asn Leu Thr Ile Ser Asp Val Ser Val Ser Asp Val Pro Phe Pro
690 695 700
Phe Ser Ala Gln Ser Gly Ala Gly Val Pro Gly Trp Gly Ile Ala Leu
705 710 715 720
Leu Val Leu Val Cys Val Leu Val Ala Leu Ala Ile Val Tyr Leu Ile
725 730 735
Ala Leu Ala Val Cys Gln Cys Arg Arg Lys
740 745
<210> 43
<211> 866
<212> PRT
<213> 人工序列
<220>
<223> 重组润滑素
<400> 43
Met Thr Pro Gly Thr Gln Ser Pro Phe Phe Leu Leu Leu Leu Leu Thr
1 5 10 15
Val Leu Thr Val Val Thr Gly Ser Gly His Ala Ser Ser Thr Pro Gly
20 25 30
Gly Glu Lys Glu Thr Ser Ala Thr Gln Arg Ser Ser Val Pro Ser Ser
35 40 45
Thr Glu Lys Asn Ala Asp Tyr Lys Asp Asp Asp Asp Leu Tyr Met Asp
50 55 60
Met Val Ala Val Ser Met Thr Ser Ser Val Leu Ser Ser His Ser Pro
65 70 75 80
Gly Ser Gly Ser Ser Thr Thr Gln Gly Gln Asp Val Thr Leu Ala Pro
85 90 95
Ala Thr Glu Pro Ala Ser Gly Ser Ala Ala Thr Trp Gly Gln Asp Val
100 105 110
Thr Ser Val Asp Ala Ala Thr Pro Ala Pro Asp Ala Ala Thr Pro Ala
115 120 125
Pro Asp Ala Ala Thr Pro Ala Pro Asp Ala Ala Thr Pro Ala Pro Asp
130 135 140
Ala Ala Thr Pro Ala Pro Asp Ala Ala Thr Pro Ala Pro Asp Ala Ala
145 150 155 160
Thr Pro Ala Pro Asp Ala Ala Thr Pro Ala Pro Asp Ala Ala Thr Pro
165 170 175
Ala Pro Asp Ala Ala Thr Pro Ala Pro Asp Ala Ala Thr Pro Ala Pro
180 185 190
Asp Ala Ala Thr Pro Ala Pro Asp Ala Ala Thr Pro Ala Pro Asp Ala
195 200 205
Ala Thr Pro Ala Pro Asp Ala Ala Thr Pro Ala Pro Asp Ala Ala Thr
210 215 220
Pro Ala Pro Asp Ala Ala Thr Pro Ala Pro Asp Ala Ala Thr Pro Ala
225 230 235 240
Pro Asp Ala Ala Thr Pro Ala Pro Asp Ala Ala Thr Pro Ala Pro Asp
245 250 255
Ala Ala Thr Pro Ala Pro Asp Ala Ala Thr Pro Ala Pro Asp Ala Ala
260 265 270
Thr Pro Ala Pro Asp Ala Ala Thr Pro Ala Pro Asp Ala Ala Thr Pro
275 280 285
Ala Pro Asp Ala Ala Thr Pro Ala Pro Asp Ala Ala Thr Pro Ala Pro
290 295 300
Asp Ala Ala Thr Pro Ala Pro Asp Ala Ala Thr Pro Ala Pro Asp Ala
305 310 315 320
Ala Thr Pro Ala Pro Asp Ala Ala Thr Pro Ala Pro Asp Ala Ala Thr
325 330 335
Pro Ala Pro Asp Ala Ala Thr Pro Ala Pro Asp Ala Ala Thr Pro Ala
340 345 350
Pro Asp Ala Ala Thr Pro Ala Pro Asp Ala Ala Thr Pro Ala Pro Asp
355 360 365
Ala Ala Thr Pro Ala Pro Asp Ala Ala Thr Pro Ala Pro Asp Ala Ala
370 375 380
Thr Pro Ala Pro Asp Ala Ala Thr Pro Ala Pro Ala Ser Gly Ser Ala
385 390 395 400
Ser Gly Ser Ala Met Val Ser Lys Gly Glu Glu Leu Phe Thr Gly Val
405 410 415
Val Pro Ile Leu Val Glu Leu Asp Gly Asp Val Asn Gly His Lys Phe
420 425 430
Ser Val Arg Gly Glu Gly Glu Gly Asp Ala Thr Asn Gly Lys Leu Thr
435 440 445
Leu Lys Phe Ile Ser Thr Thr Gly Lys Leu Pro Val Pro Trp Pro Thr
450 455 460
Leu Val Thr Thr Leu Thr Tyr Gly Val Gln Ser Phe Ser Arg Tyr Pro
465 470 475 480
Asp His Met Lys Arg His Asp Phe Phe Lys Ser Ala Met Pro Glu Gly
485 490 495
Tyr Val Gln Glu Arg Thr Ile Ser Phe Lys Asp Asp Gly Thr Tyr Lys
500 505 510
Thr Arg Ala Glu Val Lys Phe Glu Gly Asp Thr Leu Val Asn Arg Ile
515 520 525
Glu Leu Lys Gly Ile Asp Phe Lys Glu Asp Gly Asn Ile Leu Gly His
530 535 540
Lys Leu Glu Tyr Asn Phe Asn Ser His Asn Val Tyr Ile Thr Ala Asp
545 550 555 560
Lys Gln Lys Asn Gly Ile Lys Ala Asn Phe Lys Ile Arg His Asn Val
565 570 575
Glu Asp Gly Ser Val Gln Leu Ala Asp His Tyr Gln Gln Asn Thr Pro
580 585 590
Ile Gly Asp Gly Pro Val Leu Leu Pro Asp Asn His Tyr Leu Ser Thr
595 600 605
Gln Ser Lys Leu Ser Lys Asp Pro Asn Glu Lys Arg Asp His Met Val
610 615 620
Leu Leu Glu Phe Val Thr Ala Ala Gly Ile Thr His Gly Met Asp Glu
625 630 635 640
Leu Tyr Lys Gly Ser Ala Ser Thr Leu Val His Asn Gly Thr Ser Ala
645 650 655
Arg Ala Thr Thr Thr Pro Ala Ser Lys Ser Thr Pro Phe Ser Ile Pro
660 665 670
Ser His His Ser Asp Thr Pro Thr Thr Leu Ala Ser His Ser Thr Lys
675 680 685
Thr Asp Ala Ser Ser Thr His His Ser Ser Val Pro Pro Leu Thr Ser
690 695 700
Ser Asn His Ser Thr Ser Pro Gln Leu Ser Thr Gly Val Ser Phe Phe
705 710 715 720
Phe Leu Ser Phe His Ile Ser Asn Leu Gln Phe Asn Ser Ser Leu Glu
725 730 735
Asp Pro Ser Thr Asp Tyr Tyr Gln Glu Leu Gln Arg Asp Ile Ser Glu
740 745 750
Met Phe Leu Gln Ile Tyr Lys Gln Gly Gly Phe Leu Gly Leu Ser Asn
755 760 765
Ile Lys Phe Arg Pro Gly Ser Val Val Val Gln Leu Thr Leu Ala Phe
770 775 780
Arg Glu Gly Thr Ile Asn Val His Asp Val Glu Thr Gln Phe Asn Gln
785 790 795 800
Tyr Lys Thr Glu Ala Ala Ser Arg Tyr Asn Leu Thr Ile Ser Asp Val
805 810 815
Ser Val Ser Asp Val Pro Phe Pro Phe Ser Ala Gln Ser Gly Ala Gly
820 825 830
Val Pro Gly Trp Gly Ile Ala Leu Leu Val Leu Val Cys Val Leu Val
835 840 845
Ala Leu Ala Ile Val Tyr Leu Ile Ala Leu Ala Val Cys Gln Cys Arg
850 855 860
Arg Lys
865
<210> 44
<211> 1146
<212> PRT
<213> 人工序列
<220>
<223> 重组粘蛋白
<400> 44
Met Thr Pro Gly Thr Gln Ser Pro Phe Phe Leu Leu Leu Leu Leu Thr
1 5 10 15
Val Leu Thr Val Val Thr Gly Ser Gly His Ala Ser Ser Thr Pro Gly
20 25 30
Gly Glu Lys Glu Thr Ser Ala Thr Gln Arg Ser Ser Val Pro Ser Ser
35 40 45
Thr Glu Lys Asn Ala Asp Tyr Lys Asp Asp Asp Asp Leu Tyr Met Asp
50 55 60
Met Val Ala Val Ser Met Thr Ser Ser Val Leu Ser Ser His Ser Pro
65 70 75 80
Gly Ser Gly Ser Ser Thr Thr Gln Gly Gln Asp Val Thr Leu Ala Pro
85 90 95
Ala Thr Glu Pro Ala Ser Gly Ser Ala Ala Thr Trp Gly Gln Asp Val
100 105 110
Thr Ser Val Asp Ala Ala Thr Pro Ala Pro Asp Ala Ala Thr Pro Ala
115 120 125
Pro Asp Ala Ala Thr Pro Ala Pro Asp Ala Ala Thr Pro Ala Pro Asp
130 135 140
Ala Ala Thr Pro Ala Pro Asp Ala Ala Thr Pro Ala Pro Asp Ala Ala
145 150 155 160
Thr Pro Ala Pro Asp Ala Ala Thr Pro Ala Pro Asp Ala Ala Thr Pro
165 170 175
Ala Pro Asp Ala Ala Thr Pro Ala Pro Asp Ala Ala Thr Pro Ala Pro
180 185 190
Asp Ala Ala Thr Pro Ala Pro Asp Ala Ala Thr Pro Ala Pro Asp Ala
195 200 205
Ala Thr Pro Ala Pro Asp Ala Ala Thr Pro Ala Pro Asp Ala Ala Thr
210 215 220
Pro Ala Pro Asp Ala Ala Thr Pro Ala Pro Asp Ala Ala Thr Pro Ala
225 230 235 240
Pro Asp Ala Ala Thr Pro Ala Pro Asp Ala Ala Thr Pro Ala Pro Asp
245 250 255
Ala Ala Thr Pro Ala Pro Asp Ala Ala Thr Pro Ala Pro Asp Ala Ala
260 265 270
Thr Pro Ala Pro Asp Ala Ala Thr Pro Ala Pro Asp Ala Ala Thr Pro
275 280 285
Ala Pro Asp Ala Ala Thr Pro Ala Pro Asp Ala Ala Thr Pro Ala Pro
290 295 300
Asp Ala Ala Thr Pro Ala Pro Asp Ala Ala Thr Pro Ala Pro Asp Ala
305 310 315 320
Ala Thr Pro Ala Pro Asp Ala Ala Thr Pro Ala Pro Asp Ala Ala Thr
325 330 335
Pro Ala Pro Asp Ala Ala Thr Pro Ala Pro Asp Ala Ala Thr Pro Ala
340 345 350
Pro Asp Ala Ala Thr Pro Ala Pro Asp Ala Ala Thr Pro Ala Pro Asp
355 360 365
Ala Ala Thr Pro Ala Pro Asp Ala Ala Thr Pro Ala Pro Asp Ala Ala
370 375 380
Thr Pro Ala Pro Asp Ala Ala Thr Pro Ala Pro Asp Ala Ala Thr Pro
385 390 395 400
Ala Pro Asp Ala Ala Thr Pro Ala Pro Asp Ala Ala Thr Pro Ala Pro
405 410 415
Asp Ala Ala Thr Pro Ala Pro Asp Ala Ala Thr Pro Ala Pro Asp Ala
420 425 430
Ala Thr Pro Ala Pro Asp Ala Ala Thr Pro Ala Pro Asp Ala Ala Thr
435 440 445
Pro Ala Pro Asp Ala Ala Thr Pro Ala Pro Asp Ala Ala Thr Pro Ala
450 455 460
Pro Asp Ala Ala Thr Pro Ala Pro Asp Ala Ala Thr Pro Ala Pro Asp
465 470 475 480
Ala Ala Thr Pro Ala Pro Asp Ala Ala Thr Pro Ala Pro Asp Ala Ala
485 490 495
Thr Pro Ala Pro Asp Ala Ala Thr Pro Ala Pro Asp Ala Ala Thr Pro
500 505 510
Ala Pro Asp Ala Ala Thr Pro Ala Pro Asp Ala Ala Thr Pro Ala Pro
515 520 525
Asp Ala Ala Thr Pro Ala Pro Asp Ala Ala Thr Pro Ala Pro Asp Ala
530 535 540
Ala Thr Pro Ala Pro Asp Ala Ala Thr Pro Ala Pro Asp Ala Ala Thr
545 550 555 560
Pro Ala Pro Asp Ala Ala Thr Pro Ala Pro Asp Ala Ala Thr Pro Ala
565 570 575
Pro Asp Ala Ala Thr Pro Ala Pro Asp Ala Ala Thr Pro Ala Pro Asp
580 585 590
Ala Ala Thr Pro Ala Pro Asp Ala Ala Thr Pro Ala Pro Asp Ala Ala
595 600 605
Thr Pro Ala Pro Asp Ala Ala Thr Pro Ala Pro Asp Ala Ala Thr Pro
610 615 620
Ala Pro Asp Ala Ala Thr Pro Ala Pro Asp Ala Ala Thr Pro Ala Pro
625 630 635 640
Asp Ala Ala Thr Pro Ala Pro Asp Ala Ala Thr Pro Ala Pro Asp Ala
645 650 655
Ala Thr Pro Ala Pro Asp Ala Ala Thr Pro Ala Pro Asp Ala Ala Thr
660 665 670
Pro Ala Pro Ala Ser Gly Ser Ala Ser Gly Ser Ala Met Val Ser Lys
675 680 685
Gly Glu Glu Leu Phe Thr Gly Val Val Pro Ile Leu Val Glu Leu Asp
690 695 700
Gly Asp Val Asn Gly His Lys Phe Ser Val Arg Gly Glu Gly Glu Gly
705 710 715 720
Asp Ala Thr Asn Gly Lys Leu Thr Leu Lys Phe Ile Ser Thr Thr Gly
725 730 735
Lys Leu Pro Val Pro Trp Pro Thr Leu Val Thr Thr Leu Thr Tyr Gly
740 745 750
Val Gln Ser Phe Ser Arg Tyr Pro Asp His Met Lys Arg His Asp Phe
755 760 765
Phe Lys Ser Ala Met Pro Glu Gly Tyr Val Gln Glu Arg Thr Ile Ser
770 775 780
Phe Lys Asp Asp Gly Thr Tyr Lys Thr Arg Ala Glu Val Lys Phe Glu
785 790 795 800
Gly Asp Thr Leu Val Asn Arg Ile Glu Leu Lys Gly Ile Asp Phe Lys
805 810 815
Glu Asp Gly Asn Ile Leu Gly His Lys Leu Glu Tyr Asn Phe Asn Ser
820 825 830
His Asn Val Tyr Ile Thr Ala Asp Lys Gln Lys Asn Gly Ile Lys Ala
835 840 845
Asn Phe Lys Ile Arg His Asn Val Glu Asp Gly Ser Val Gln Leu Ala
850 855 860
Asp His Tyr Gln Gln Asn Thr Pro Ile Gly Asp Gly Pro Val Leu Leu
865 870 875 880
Pro Asp Asn His Tyr Leu Ser Thr Gln Ser Lys Leu Ser Lys Asp Pro
885 890 895
Asn Glu Lys Arg Asp His Met Val Leu Leu Glu Phe Val Thr Ala Ala
900 905 910
Gly Ile Thr His Gly Met Asp Glu Leu Tyr Lys Gly Ser Ala Ser Thr
915 920 925
Leu Val His Asn Gly Thr Ser Ala Arg Ala Thr Thr Thr Pro Ala Ser
930 935 940
Lys Ser Thr Pro Phe Ser Ile Pro Ser His His Ser Asp Thr Pro Thr
945 950 955 960
Thr Leu Ala Ser His Ser Thr Lys Thr Asp Ala Ser Ser Thr His His
965 970 975
Ser Ser Val Pro Pro Leu Thr Ser Ser Asn His Ser Thr Ser Pro Gln
980 985 990
Leu Ser Thr Gly Val Ser Phe Phe Phe Leu Ser Phe His Ile Ser Asn
995 1000 1005
Leu Gln Phe Asn Ser Ser Leu Glu Asp Pro Ser Thr Asp Tyr Tyr
1010 1015 1020
Gln Glu Leu Gln Arg Asp Ile Ser Glu Met Phe Leu Gln Ile Tyr
1025 1030 1035
Lys Gln Gly Gly Phe Leu Gly Leu Ser Asn Ile Lys Phe Arg Pro
1040 1045 1050
Gly Ser Val Val Val Gln Leu Thr Leu Ala Phe Arg Glu Gly Thr
1055 1060 1065
Ile Asn Val His Asp Val Glu Thr Gln Phe Asn Gln Tyr Lys Thr
1070 1075 1080
Glu Ala Ala Ser Arg Tyr Asn Leu Thr Ile Ser Asp Val Ser Val
1085 1090 1095
Ser Asp Val Pro Phe Pro Phe Ser Ala Gln Ser Gly Ala Gly Val
1100 1105 1110
Pro Gly Trp Gly Ile Ala Leu Leu Val Leu Val Cys Val Leu Val
1115 1120 1125
Ala Leu Ala Ile Val Tyr Leu Ile Ala Leu Ala Val Cys Gln Cys
1130 1135 1140
Arg Arg Lys
1145
<210> 45
<211> 906
<212> PRT
<213> 人工序列
<220>
<223> 重组粘蛋白
<400> 45
Met Thr Pro Gly Thr Gln Ser Pro Phe Phe Leu Leu Leu Leu Leu Thr
1 5 10 15
Val Leu Thr Val Val Thr Gly Ser Gly His Ala Ser Ser Thr Pro Gly
20 25 30
Gly Glu Lys Glu Thr Ser Ala Thr Gln Arg Ser Ser Val Pro Ser Ser
35 40 45
Thr Glu Lys Asn Ala Asp Tyr Lys Asp Asp Asp Asp Leu Tyr Met Asp
50 55 60
Met Val Ala Val Ser Met Thr Ser Ser Val Leu Ser Ser His Ser Pro
65 70 75 80
Gly Ser Gly Ser Ser Thr Thr Gln Gly Gln Asp Val Thr Leu Ala Pro
85 90 95
Ala Thr Glu Pro Ala Ser Gly Ser Ala Ala Thr Trp Gly Gln Asp Val
100 105 110
Thr Ser Val Asp Ala Ala Thr Pro Ala Pro Pro Asp Ala Ala Thr Pro
115 120 125
Ala Pro Pro Asp Ala Ala Thr Pro Ala Pro Pro Asp Ala Ala Thr Pro
130 135 140
Ala Pro Pro Asp Ala Ala Thr Pro Ala Pro Pro Asp Ala Ala Thr Pro
145 150 155 160
Ala Pro Pro Asp Ala Ala Thr Pro Ala Pro Pro Asp Ala Ala Thr Pro
165 170 175
Ala Pro Pro Asp Ala Ala Thr Pro Ala Pro Pro Asp Ala Ala Thr Pro
180 185 190
Ala Pro Pro Asp Ala Ala Thr Pro Ala Pro Pro Asp Ala Ala Thr Pro
195 200 205
Ala Pro Pro Asp Ala Ala Thr Pro Ala Pro Pro Asp Ala Ala Thr Pro
210 215 220
Ala Pro Pro Asp Ala Ala Thr Pro Ala Pro Pro Asp Ala Ala Thr Pro
225 230 235 240
Ala Pro Pro Asp Ala Ala Thr Pro Ala Pro Pro Asp Ala Ala Thr Pro
245 250 255
Ala Pro Pro Asp Ala Ala Thr Pro Ala Pro Pro Asp Ala Ala Thr Pro
260 265 270
Ala Pro Pro Asp Ala Ala Thr Pro Ala Pro Pro Asp Ala Ala Thr Pro
275 280 285
Ala Pro Pro Asp Ala Ala Thr Pro Ala Pro Pro Asp Ala Ala Thr Pro
290 295 300
Ala Pro Pro Asp Ala Ala Thr Pro Ala Pro Pro Asp Ala Ala Thr Pro
305 310 315 320
Ala Pro Pro Asp Ala Ala Thr Pro Ala Pro Pro Asp Ala Ala Thr Pro
325 330 335
Ala Pro Pro Asp Ala Ala Thr Pro Ala Pro Pro Asp Ala Ala Thr Pro
340 345 350
Ala Pro Pro Asp Ala Ala Thr Pro Ala Pro Pro Asp Ala Ala Thr Pro
355 360 365
Ala Pro Pro Asp Ala Ala Thr Pro Ala Pro Pro Asp Ala Ala Thr Pro
370 375 380
Ala Pro Pro Asp Ala Ala Thr Pro Ala Pro Pro Asp Ala Ala Thr Pro
385 390 395 400
Ala Pro Pro Asp Ala Ala Thr Pro Ala Pro Pro Asp Ala Ala Thr Pro
405 410 415
Ala Pro Pro Asp Ala Ala Thr Pro Ala Pro Pro Asp Ala Ala Thr Pro
420 425 430
Ala Pro Pro Ala Ser Gly Ser Ala Ser Gly Ser Ala Met Val Ser Lys
435 440 445
Gly Glu Glu Leu Phe Thr Gly Val Val Pro Ile Leu Val Glu Leu Asp
450 455 460
Gly Asp Val Asn Gly His Lys Phe Ser Val Arg Gly Glu Gly Glu Gly
465 470 475 480
Asp Ala Thr Asn Gly Lys Leu Thr Leu Lys Phe Ile Ser Thr Thr Gly
485 490 495
Lys Leu Pro Val Pro Trp Pro Thr Leu Val Thr Thr Leu Thr Tyr Gly
500 505 510
Val Gln Ser Phe Ser Arg Tyr Pro Asp His Met Lys Arg His Asp Phe
515 520 525
Phe Lys Ser Ala Met Pro Glu Gly Tyr Val Gln Glu Arg Thr Ile Ser
530 535 540
Phe Lys Asp Asp Gly Thr Tyr Lys Thr Arg Ala Glu Val Lys Phe Glu
545 550 555 560
Gly Asp Thr Leu Val Asn Arg Ile Glu Leu Lys Gly Ile Asp Phe Lys
565 570 575
Glu Asp Gly Asn Ile Leu Gly His Lys Leu Glu Tyr Asn Phe Asn Ser
580 585 590
His Asn Val Tyr Ile Thr Ala Asp Lys Gln Lys Asn Gly Ile Lys Ala
595 600 605
Asn Phe Lys Ile Arg His Asn Val Glu Asp Gly Ser Val Gln Leu Ala
610 615 620
Asp His Tyr Gln Gln Asn Thr Pro Ile Gly Asp Gly Pro Val Leu Leu
625 630 635 640
Pro Asp Asn His Tyr Leu Ser Thr Gln Ser Lys Leu Ser Lys Asp Pro
645 650 655
Asn Glu Lys Arg Asp His Met Val Leu Leu Glu Phe Val Thr Ala Ala
660 665 670
Gly Ile Thr His Gly Met Asp Glu Leu Tyr Lys Gly Ser Ala Ser Thr
675 680 685
Leu Val His Asn Gly Thr Ser Ala Arg Ala Thr Thr Thr Pro Ala Ser
690 695 700
Lys Ser Thr Pro Phe Ser Ile Pro Ser His His Ser Asp Thr Pro Thr
705 710 715 720
Thr Leu Ala Ser His Ser Thr Lys Thr Asp Ala Ser Ser Thr His His
725 730 735
Ser Ser Val Pro Pro Leu Thr Ser Ser Asn His Ser Thr Ser Pro Gln
740 745 750
Leu Ser Thr Gly Val Ser Phe Phe Phe Leu Ser Phe His Ile Ser Asn
755 760 765
Leu Gln Phe Asn Ser Ser Leu Glu Asp Pro Ser Thr Asp Tyr Tyr Gln
770 775 780
Glu Leu Gln Arg Asp Ile Ser Glu Met Phe Leu Gln Ile Tyr Lys Gln
785 790 795 800
Gly Gly Phe Leu Gly Leu Ser Asn Ile Lys Phe Arg Pro Gly Ser Val
805 810 815
Val Val Gln Leu Thr Leu Ala Phe Arg Glu Gly Thr Ile Asn Val His
820 825 830
Asp Val Glu Thr Gln Phe Asn Gln Tyr Lys Thr Glu Ala Ala Ser Arg
835 840 845
Tyr Asn Leu Thr Ile Ser Asp Val Ser Val Ser Asp Val Pro Phe Pro
850 855 860
Phe Ser Ala Gln Ser Gly Ala Gly Val Pro Gly Trp Gly Ile Ala Leu
865 870 875 880
Leu Val Leu Val Cys Val Leu Val Ala Leu Ala Ile Val Tyr Leu Ile
885 890 895
Ala Leu Ala Val Cys Gln Cys Arg Arg Lys
900 905
<210> 46
<211> 1226
<212> PRT
<213> 人工序列
<220>
<223> 重组粘蛋白
<400> 46
Met Thr Pro Gly Thr Gln Ser Pro Phe Phe Leu Leu Leu Leu Leu Thr
1 5 10 15
Val Leu Thr Val Val Thr Gly Ser Gly His Ala Ser Ser Thr Pro Gly
20 25 30
Gly Glu Lys Glu Thr Ser Ala Thr Gln Arg Ser Ser Val Pro Ser Ser
35 40 45
Thr Glu Lys Asn Ala Asp Tyr Lys Asp Asp Asp Asp Leu Tyr Met Asp
50 55 60
Met Val Ala Val Ser Met Thr Ser Ser Val Leu Ser Ser His Ser Pro
65 70 75 80
Gly Ser Gly Ser Ser Thr Thr Gln Gly Gln Asp Val Thr Leu Ala Pro
85 90 95
Ala Thr Glu Pro Ala Ser Gly Ser Ala Ala Thr Trp Gly Gln Asp Val
100 105 110
Thr Ser Val Asp Ala Ala Thr Pro Ala Pro Pro Asp Ala Ala Thr Pro
115 120 125
Ala Pro Pro Asp Ala Ala Thr Pro Ala Pro Pro Asp Ala Ala Thr Pro
130 135 140
Ala Pro Pro Asp Ala Ala Thr Pro Ala Pro Pro Asp Ala Ala Thr Pro
145 150 155 160
Ala Pro Pro Asp Ala Ala Thr Pro Ala Pro Pro Asp Ala Ala Thr Pro
165 170 175
Ala Pro Pro Asp Ala Ala Thr Pro Ala Pro Pro Asp Ala Ala Thr Pro
180 185 190
Ala Pro Pro Asp Ala Ala Thr Pro Ala Pro Pro Asp Ala Ala Thr Pro
195 200 205
Ala Pro Pro Asp Ala Ala Thr Pro Ala Pro Pro Asp Ala Ala Thr Pro
210 215 220
Ala Pro Pro Asp Ala Ala Thr Pro Ala Pro Pro Asp Ala Ala Thr Pro
225 230 235 240
Ala Pro Pro Asp Ala Ala Thr Pro Ala Pro Pro Asp Ala Ala Thr Pro
245 250 255
Ala Pro Pro Asp Ala Ala Thr Pro Ala Pro Pro Asp Ala Ala Thr Pro
260 265 270
Ala Pro Pro Asp Ala Ala Thr Pro Ala Pro Pro Asp Ala Ala Thr Pro
275 280 285
Ala Pro Pro Asp Ala Ala Thr Pro Ala Pro Pro Asp Ala Ala Thr Pro
290 295 300
Ala Pro Pro Asp Ala Ala Thr Pro Ala Pro Pro Asp Ala Ala Thr Pro
305 310 315 320
Ala Pro Pro Asp Ala Ala Thr Pro Ala Pro Pro Asp Ala Ala Thr Pro
325 330 335
Ala Pro Pro Asp Ala Ala Thr Pro Ala Pro Pro Asp Ala Ala Thr Pro
340 345 350
Ala Pro Pro Asp Ala Ala Thr Pro Ala Pro Pro Asp Ala Ala Thr Pro
355 360 365
Ala Pro Pro Asp Ala Ala Thr Pro Ala Pro Pro Asp Ala Ala Thr Pro
370 375 380
Ala Pro Pro Asp Ala Ala Thr Pro Ala Pro Pro Asp Ala Ala Thr Pro
385 390 395 400
Ala Pro Pro Asp Ala Ala Thr Pro Ala Pro Pro Asp Ala Ala Thr Pro
405 410 415
Ala Pro Pro Asp Ala Ala Thr Pro Ala Pro Pro Asp Ala Ala Thr Pro
420 425 430
Ala Pro Pro Asp Ala Ala Thr Pro Ala Pro Pro Asp Ala Ala Thr Pro
435 440 445
Ala Pro Pro Asp Ala Ala Thr Pro Ala Pro Pro Asp Ala Ala Thr Pro
450 455 460
Ala Pro Pro Asp Ala Ala Thr Pro Ala Pro Pro Asp Ala Ala Thr Pro
465 470 475 480
Ala Pro Pro Asp Ala Ala Thr Pro Ala Pro Pro Asp Ala Ala Thr Pro
485 490 495
Ala Pro Pro Asp Ala Ala Thr Pro Ala Pro Pro Asp Ala Ala Thr Pro
500 505 510
Ala Pro Pro Asp Ala Ala Thr Pro Ala Pro Pro Asp Ala Ala Thr Pro
515 520 525
Ala Pro Pro Asp Ala Ala Thr Pro Ala Pro Pro Asp Ala Ala Thr Pro
530 535 540
Ala Pro Pro Asp Ala Ala Thr Pro Ala Pro Pro Asp Ala Ala Thr Pro
545 550 555 560
Ala Pro Pro Asp Ala Ala Thr Pro Ala Pro Pro Asp Ala Ala Thr Pro
565 570 575
Ala Pro Pro Asp Ala Ala Thr Pro Ala Pro Pro Asp Ala Ala Thr Pro
580 585 590
Ala Pro Pro Asp Ala Ala Thr Pro Ala Pro Pro Asp Ala Ala Thr Pro
595 600 605
Ala Pro Pro Asp Ala Ala Thr Pro Ala Pro Pro Asp Ala Ala Thr Pro
610 615 620
Ala Pro Pro Asp Ala Ala Thr Pro Ala Pro Pro Asp Ala Ala Thr Pro
625 630 635 640
Ala Pro Pro Asp Ala Ala Thr Pro Ala Pro Pro Asp Ala Ala Thr Pro
645 650 655
Ala Pro Pro Asp Ala Ala Thr Pro Ala Pro Pro Asp Ala Ala Thr Pro
660 665 670
Ala Pro Pro Asp Ala Ala Thr Pro Ala Pro Pro Asp Ala Ala Thr Pro
675 680 685
Ala Pro Pro Asp Ala Ala Thr Pro Ala Pro Pro Asp Ala Ala Thr Pro
690 695 700
Ala Pro Pro Asp Ala Ala Thr Pro Ala Pro Pro Asp Ala Ala Thr Pro
705 710 715 720
Ala Pro Pro Asp Ala Ala Thr Pro Ala Pro Pro Asp Ala Ala Thr Pro
725 730 735
Ala Pro Pro Asp Ala Ala Thr Pro Ala Pro Pro Asp Ala Ala Thr Pro
740 745 750
Ala Pro Pro Ala Ser Gly Ser Ala Ser Gly Ser Ala Met Val Ser Lys
755 760 765
Gly Glu Glu Leu Phe Thr Gly Val Val Pro Ile Leu Val Glu Leu Asp
770 775 780
Gly Asp Val Asn Gly His Lys Phe Ser Val Arg Gly Glu Gly Glu Gly
785 790 795 800
Asp Ala Thr Asn Gly Lys Leu Thr Leu Lys Phe Ile Ser Thr Thr Gly
805 810 815
Lys Leu Pro Val Pro Trp Pro Thr Leu Val Thr Thr Leu Thr Tyr Gly
820 825 830
Val Gln Ser Phe Ser Arg Tyr Pro Asp His Met Lys Arg His Asp Phe
835 840 845
Phe Lys Ser Ala Met Pro Glu Gly Tyr Val Gln Glu Arg Thr Ile Ser
850 855 860
Phe Lys Asp Asp Gly Thr Tyr Lys Thr Arg Ala Glu Val Lys Phe Glu
865 870 875 880
Gly Asp Thr Leu Val Asn Arg Ile Glu Leu Lys Gly Ile Asp Phe Lys
885 890 895
Glu Asp Gly Asn Ile Leu Gly His Lys Leu Glu Tyr Asn Phe Asn Ser
900 905 910
His Asn Val Tyr Ile Thr Ala Asp Lys Gln Lys Asn Gly Ile Lys Ala
915 920 925
Asn Phe Lys Ile Arg His Asn Val Glu Asp Gly Ser Val Gln Leu Ala
930 935 940
Asp His Tyr Gln Gln Asn Thr Pro Ile Gly Asp Gly Pro Val Leu Leu
945 950 955 960
Pro Asp Asn His Tyr Leu Ser Thr Gln Ser Lys Leu Ser Lys Asp Pro
965 970 975
Asn Glu Lys Arg Asp His Met Val Leu Leu Glu Phe Val Thr Ala Ala
980 985 990
Gly Ile Thr His Gly Met Asp Glu Leu Tyr Lys Gly Ser Ala Ser Thr
995 1000 1005
Leu Val His Asn Gly Thr Ser Ala Arg Ala Thr Thr Thr Pro Ala
1010 1015 1020
Ser Lys Ser Thr Pro Phe Ser Ile Pro Ser His His Ser Asp Thr
1025 1030 1035
Pro Thr Thr Leu Ala Ser His Ser Thr Lys Thr Asp Ala Ser Ser
1040 1045 1050
Thr His His Ser Ser Val Pro Pro Leu Thr Ser Ser Asn His Ser
1055 1060 1065
Thr Ser Pro Gln Leu Ser Thr Gly Val Ser Phe Phe Phe Leu Ser
1070 1075 1080
Phe His Ile Ser Asn Leu Gln Phe Asn Ser Ser Leu Glu Asp Pro
1085 1090 1095
Ser Thr Asp Tyr Tyr Gln Glu Leu Gln Arg Asp Ile Ser Glu Met
1100 1105 1110
Phe Leu Gln Ile Tyr Lys Gln Gly Gly Phe Leu Gly Leu Ser Asn
1115 1120 1125
Ile Lys Phe Arg Pro Gly Ser Val Val Val Gln Leu Thr Leu Ala
1130 1135 1140
Phe Arg Glu Gly Thr Ile Asn Val His Asp Val Glu Thr Gln Phe
1145 1150 1155
Asn Gln Tyr Lys Thr Glu Ala Ala Ser Arg Tyr Asn Leu Thr Ile
1160 1165 1170
Ser Asp Val Ser Val Ser Asp Val Pro Phe Pro Phe Ser Ala Gln
1175 1180 1185
Ser Gly Ala Gly Val Pro Gly Trp Gly Ile Ala Leu Leu Val Leu
1190 1195 1200
Val Cys Val Leu Val Ala Leu Ala Ile Val Tyr Leu Ile Ala Leu
1205 1210 1215
Ala Val Cys Gln Cys Arg Arg Lys
1220 1225
<210> 47
<211> 946
<212> PRT
<213> 人工序列
<220>
<223> 重组粘蛋白
<400> 47
Met Thr Pro Gly Thr Gln Ser Pro Phe Phe Leu Leu Leu Leu Leu Thr
1 5 10 15
Val Leu Thr Val Val Thr Gly Ser Gly His Ala Ser Ser Thr Pro Gly
20 25 30
Gly Glu Lys Glu Thr Ser Ala Thr Gln Arg Ser Ser Val Pro Ser Ser
35 40 45
Thr Glu Lys Asn Ala Asp Tyr Lys Asp Asp Asp Asp Leu Tyr Met Asp
50 55 60
Met Val Ala Val Ser Met Thr Ser Ser Val Leu Ser Ser His Ser Pro
65 70 75 80
Gly Ser Gly Ser Ser Thr Thr Gln Gly Gln Asp Val Thr Leu Ala Pro
85 90 95
Ala Thr Glu Pro Ala Ser Gly Ser Ala Ala Thr Trp Gly Gln Asp Val
100 105 110
Thr Ser Val Pro Pro Ala Ser Thr Ser Ala Pro Gly Pro Pro Ala Ser
115 120 125
Thr Ser Ala Pro Gly Pro Pro Ala Ser Thr Ser Ala Pro Gly Pro Pro
130 135 140
Ala Ser Thr Ser Ala Pro Gly Pro Pro Ala Ser Thr Ser Ala Pro Gly
145 150 155 160
Pro Pro Ala Ser Thr Ser Ala Pro Gly Pro Pro Ala Ser Thr Ser Ala
165 170 175
Pro Gly Pro Pro Ala Ser Thr Ser Ala Pro Gly Pro Pro Ala Ser Thr
180 185 190
Ser Ala Pro Gly Pro Pro Ala Ser Thr Ser Ala Pro Gly Pro Pro Ala
195 200 205
Ser Thr Ser Ala Pro Gly Pro Pro Ala Ser Thr Ser Ala Pro Gly Pro
210 215 220
Pro Ala Ser Thr Ser Ala Pro Gly Pro Pro Ala Ser Thr Ser Ala Pro
225 230 235 240
Gly Pro Pro Ala Ser Thr Ser Ala Pro Gly Pro Pro Ala Ser Thr Ser
245 250 255
Ala Pro Gly Pro Pro Ala Ser Thr Ser Ala Pro Gly Pro Pro Ala Ser
260 265 270
Thr Ser Ala Pro Gly Pro Pro Ala Ser Thr Ser Ala Pro Gly Pro Pro
275 280 285
Ala Ser Thr Ser Ala Pro Gly Pro Pro Ala Ser Thr Ser Ala Pro Gly
290 295 300
Pro Pro Ala Ser Thr Ser Ala Pro Gly Pro Pro Ala Ser Thr Ser Ala
305 310 315 320
Pro Gly Pro Pro Ala Ser Thr Ser Ala Pro Gly Pro Pro Ala Ser Thr
325 330 335
Ser Ala Pro Gly Pro Pro Ala Ser Thr Ser Ala Pro Gly Pro Pro Ala
340 345 350
Ser Thr Ser Ala Pro Gly Pro Pro Ala Ser Thr Ser Ala Pro Gly Pro
355 360 365
Pro Ala Ser Thr Ser Ala Pro Gly Pro Pro Ala Ser Thr Ser Ala Pro
370 375 380
Gly Pro Pro Ala Ser Thr Ser Ala Pro Gly Pro Pro Ala Ser Thr Ser
385 390 395 400
Ala Pro Gly Pro Pro Ala Ser Thr Ser Ala Pro Gly Pro Pro Ala Ser
405 410 415
Thr Ser Ala Pro Gly Pro Pro Ala Ser Thr Ser Ala Pro Gly Pro Pro
420 425 430
Ala Ser Thr Ser Ala Pro Gly Pro Pro Ala Ser Thr Ser Ala Pro Gly
435 440 445
Pro Pro Ala Ser Thr Ser Ala Pro Gly Pro Pro Ala Ser Thr Ser Ala
450 455 460
Pro Gly Pro Pro Ala Ser Thr Ser Ala Pro Gly Ala Ser Gly Ser Ala
465 470 475 480
Ser Gly Ser Ala Met Val Ser Lys Gly Glu Glu Leu Phe Thr Gly Val
485 490 495
Val Pro Ile Leu Val Glu Leu Asp Gly Asp Val Asn Gly His Lys Phe
500 505 510
Ser Val Arg Gly Glu Gly Glu Gly Asp Ala Thr Asn Gly Lys Leu Thr
515 520 525
Leu Lys Phe Ile Ser Thr Thr Gly Lys Leu Pro Val Pro Trp Pro Thr
530 535 540
Leu Val Thr Thr Leu Thr Tyr Gly Val Gln Ser Phe Ser Arg Tyr Pro
545 550 555 560
Asp His Met Lys Arg His Asp Phe Phe Lys Ser Ala Met Pro Glu Gly
565 570 575
Tyr Val Gln Glu Arg Thr Ile Ser Phe Lys Asp Asp Gly Thr Tyr Lys
580 585 590
Thr Arg Ala Glu Val Lys Phe Glu Gly Asp Thr Leu Val Asn Arg Ile
595 600 605
Glu Leu Lys Gly Ile Asp Phe Lys Glu Asp Gly Asn Ile Leu Gly His
610 615 620
Lys Leu Glu Tyr Asn Phe Asn Ser His Asn Val Tyr Ile Thr Ala Asp
625 630 635 640
Lys Gln Lys Asn Gly Ile Lys Ala Asn Phe Lys Ile Arg His Asn Val
645 650 655
Glu Asp Gly Ser Val Gln Leu Ala Asp His Tyr Gln Gln Asn Thr Pro
660 665 670
Ile Gly Asp Gly Pro Val Leu Leu Pro Asp Asn His Tyr Leu Ser Thr
675 680 685
Gln Ser Lys Leu Ser Lys Asp Pro Asn Glu Lys Arg Asp His Met Val
690 695 700
Leu Leu Glu Phe Val Thr Ala Ala Gly Ile Thr His Gly Met Asp Glu
705 710 715 720
Leu Tyr Lys Gly Ser Ala Ser Thr Leu Val His Asn Gly Thr Ser Ala
725 730 735
Arg Ala Thr Thr Thr Pro Ala Ser Lys Ser Thr Pro Phe Ser Ile Pro
740 745 750
Ser His His Ser Asp Thr Pro Thr Thr Leu Ala Ser His Ser Thr Lys
755 760 765
Thr Asp Ala Ser Ser Thr His His Ser Ser Val Pro Pro Leu Thr Ser
770 775 780
Ser Asn His Ser Thr Ser Pro Gln Leu Ser Thr Gly Val Ser Phe Phe
785 790 795 800
Phe Leu Ser Phe His Ile Ser Asn Leu Gln Phe Asn Ser Ser Leu Glu
805 810 815
Asp Pro Ser Thr Asp Tyr Tyr Gln Glu Leu Gln Arg Asp Ile Ser Glu
820 825 830
Met Phe Leu Gln Ile Tyr Lys Gln Gly Gly Phe Leu Gly Leu Ser Asn
835 840 845
Ile Lys Phe Arg Pro Gly Ser Val Val Val Gln Leu Thr Leu Ala Phe
850 855 860
Arg Glu Gly Thr Ile Asn Val His Asp Val Glu Thr Gln Phe Asn Gln
865 870 875 880
Tyr Lys Thr Glu Ala Ala Ser Arg Tyr Asn Leu Thr Ile Ser Asp Val
885 890 895
Ser Val Ser Asp Val Pro Phe Pro Phe Ser Ala Gln Ser Gly Ala Gly
900 905 910
Val Pro Gly Trp Gly Ile Ala Leu Leu Val Leu Val Cys Val Leu Val
915 920 925
Ala Leu Ala Ile Val Tyr Leu Ile Ala Leu Ala Val Cys Gln Cys Arg
930 935 940
Arg Lys
945
<210> 48
<211> 1306
<212> PRT
<213> 人工序列
<220>
<223> 重组粘蛋白
<400> 48
Met Thr Pro Gly Thr Gln Ser Pro Phe Phe Leu Leu Leu Leu Leu Thr
1 5 10 15
Val Leu Thr Val Val Thr Gly Ser Gly His Ala Ser Ser Thr Pro Gly
20 25 30
Gly Glu Lys Glu Thr Ser Ala Thr Gln Arg Ser Ser Val Pro Ser Ser
35 40 45
Thr Glu Lys Asn Ala Asp Tyr Lys Asp Asp Asp Asp Leu Tyr Met Asp
50 55 60
Met Val Ala Val Ser Met Thr Ser Ser Val Leu Ser Ser His Ser Pro
65 70 75 80
Gly Ser Gly Ser Ser Thr Thr Gln Gly Gln Asp Val Thr Leu Ala Pro
85 90 95
Ala Thr Glu Pro Ala Ser Gly Ser Ala Ala Thr Trp Gly Gln Asp Val
100 105 110
Thr Ser Val Pro Pro Ala Ser Thr Ser Ala Pro Gly Pro Pro Ala Ser
115 120 125
Thr Ser Ala Pro Gly Pro Pro Ala Ser Thr Ser Ala Pro Gly Pro Pro
130 135 140
Ala Ser Thr Ser Ala Pro Gly Pro Pro Ala Ser Thr Ser Ala Pro Gly
145 150 155 160
Pro Pro Ala Ser Thr Ser Ala Pro Gly Pro Pro Ala Ser Thr Ser Ala
165 170 175
Pro Gly Pro Pro Ala Ser Thr Ser Ala Pro Gly Pro Pro Ala Ser Thr
180 185 190
Ser Ala Pro Gly Pro Pro Ala Ser Thr Ser Ala Pro Gly Pro Pro Ala
195 200 205
Ser Thr Ser Ala Pro Gly Pro Pro Ala Ser Thr Ser Ala Pro Gly Pro
210 215 220
Pro Ala Ser Thr Ser Ala Pro Gly Pro Pro Ala Ser Thr Ser Ala Pro
225 230 235 240
Gly Pro Pro Ala Ser Thr Ser Ala Pro Gly Pro Pro Ala Ser Thr Ser
245 250 255
Ala Pro Gly Pro Pro Ala Ser Thr Ser Ala Pro Gly Pro Pro Ala Ser
260 265 270
Thr Ser Ala Pro Gly Pro Pro Ala Ser Thr Ser Ala Pro Gly Pro Pro
275 280 285
Ala Ser Thr Ser Ala Pro Gly Pro Pro Ala Ser Thr Ser Ala Pro Gly
290 295 300
Pro Pro Ala Ser Thr Ser Ala Pro Gly Pro Pro Ala Ser Thr Ser Ala
305 310 315 320
Pro Gly Pro Pro Ala Ser Thr Ser Ala Pro Gly Pro Pro Ala Ser Thr
325 330 335
Ser Ala Pro Gly Pro Pro Ala Ser Thr Ser Ala Pro Gly Pro Pro Ala
340 345 350
Ser Thr Ser Ala Pro Gly Pro Pro Ala Ser Thr Ser Ala Pro Gly Pro
355 360 365
Pro Ala Ser Thr Ser Ala Pro Gly Pro Pro Ala Ser Thr Ser Ala Pro
370 375 380
Gly Pro Pro Ala Ser Thr Ser Ala Pro Gly Pro Pro Ala Ser Thr Ser
385 390 395 400
Ala Pro Gly Pro Pro Ala Ser Thr Ser Ala Pro Gly Pro Pro Ala Ser
405 410 415
Thr Ser Ala Pro Gly Pro Pro Ala Ser Thr Ser Ala Pro Gly Pro Pro
420 425 430
Ala Ser Thr Ser Ala Pro Gly Pro Pro Ala Ser Thr Ser Ala Pro Gly
435 440 445
Pro Pro Ala Ser Thr Ser Ala Pro Gly Pro Pro Ala Ser Thr Ser Ala
450 455 460
Pro Gly Pro Pro Ala Ser Thr Ser Ala Pro Gly Pro Pro Ala Ser Thr
465 470 475 480
Ser Ala Pro Gly Pro Pro Ala Ser Thr Ser Ala Pro Gly Pro Pro Ala
485 490 495
Ser Thr Ser Ala Pro Gly Pro Pro Ala Ser Thr Ser Ala Pro Gly Pro
500 505 510
Pro Ala Ser Thr Ser Ala Pro Gly Pro Pro Ala Ser Thr Ser Ala Pro
515 520 525
Gly Pro Pro Ala Ser Thr Ser Ala Pro Gly Pro Pro Ala Ser Thr Ser
530 535 540
Ala Pro Gly Pro Pro Ala Ser Thr Ser Ala Pro Gly Pro Pro Ala Ser
545 550 555 560
Thr Ser Ala Pro Gly Pro Pro Ala Ser Thr Ser Ala Pro Gly Pro Pro
565 570 575
Ala Ser Thr Ser Ala Pro Gly Pro Pro Ala Ser Thr Ser Ala Pro Gly
580 585 590
Pro Pro Ala Ser Thr Ser Ala Pro Gly Pro Pro Ala Ser Thr Ser Ala
595 600 605
Pro Gly Pro Pro Ala Ser Thr Ser Ala Pro Gly Pro Pro Ala Ser Thr
610 615 620
Ser Ala Pro Gly Pro Pro Ala Ser Thr Ser Ala Pro Gly Pro Pro Ala
625 630 635 640
Ser Thr Ser Ala Pro Gly Pro Pro Ala Ser Thr Ser Ala Pro Gly Pro
645 650 655
Pro Ala Ser Thr Ser Ala Pro Gly Pro Pro Ala Ser Thr Ser Ala Pro
660 665 670
Gly Pro Pro Ala Ser Thr Ser Ala Pro Gly Pro Pro Ala Ser Thr Ser
675 680 685
Ala Pro Gly Pro Pro Ala Ser Thr Ser Ala Pro Gly Pro Pro Ala Ser
690 695 700
Thr Ser Ala Pro Gly Pro Pro Ala Ser Thr Ser Ala Pro Gly Pro Pro
705 710 715 720
Ala Ser Thr Ser Ala Pro Gly Pro Pro Ala Ser Thr Ser Ala Pro Gly
725 730 735
Pro Pro Ala Ser Thr Ser Ala Pro Gly Pro Pro Ala Ser Thr Ser Ala
740 745 750
Pro Gly Pro Pro Ala Ser Thr Ser Ala Pro Gly Pro Pro Ala Ser Thr
755 760 765
Ser Ala Pro Gly Pro Pro Ala Ser Thr Ser Ala Pro Gly Pro Pro Ala
770 775 780
Ser Thr Ser Ala Pro Gly Pro Pro Ala Ser Thr Ser Ala Pro Gly Pro
785 790 795 800
Pro Ala Ser Thr Ser Ala Pro Gly Pro Pro Ala Ser Thr Ser Ala Pro
805 810 815
Gly Pro Pro Ala Ser Thr Ser Ala Pro Gly Pro Pro Ala Ser Thr Ser
820 825 830
Ala Pro Gly Ala Ser Gly Ser Ala Ser Gly Ser Ala Met Val Ser Lys
835 840 845
Gly Glu Glu Leu Phe Thr Gly Val Val Pro Ile Leu Val Glu Leu Asp
850 855 860
Gly Asp Val Asn Gly His Lys Phe Ser Val Arg Gly Glu Gly Glu Gly
865 870 875 880
Asp Ala Thr Asn Gly Lys Leu Thr Leu Lys Phe Ile Ser Thr Thr Gly
885 890 895
Lys Leu Pro Val Pro Trp Pro Thr Leu Val Thr Thr Leu Thr Tyr Gly
900 905 910
Val Gln Ser Phe Ser Arg Tyr Pro Asp His Met Lys Arg His Asp Phe
915 920 925
Phe Lys Ser Ala Met Pro Glu Gly Tyr Val Gln Glu Arg Thr Ile Ser
930 935 940
Phe Lys Asp Asp Gly Thr Tyr Lys Thr Arg Ala Glu Val Lys Phe Glu
945 950 955 960
Gly Asp Thr Leu Val Asn Arg Ile Glu Leu Lys Gly Ile Asp Phe Lys
965 970 975
Glu Asp Gly Asn Ile Leu Gly His Lys Leu Glu Tyr Asn Phe Asn Ser
980 985 990
His Asn Val Tyr Ile Thr Ala Asp Lys Gln Lys Asn Gly Ile Lys Ala
995 1000 1005
Asn Phe Lys Ile Arg His Asn Val Glu Asp Gly Ser Val Gln Leu
1010 1015 1020
Ala Asp His Tyr Gln Gln Asn Thr Pro Ile Gly Asp Gly Pro Val
1025 1030 1035
Leu Leu Pro Asp Asn His Tyr Leu Ser Thr Gln Ser Lys Leu Ser
1040 1045 1050
Lys Asp Pro Asn Glu Lys Arg Asp His Met Val Leu Leu Glu Phe
1055 1060 1065
Val Thr Ala Ala Gly Ile Thr His Gly Met Asp Glu Leu Tyr Lys
1070 1075 1080
Gly Ser Ala Ser Thr Leu Val His Asn Gly Thr Ser Ala Arg Ala
1085 1090 1095
Thr Thr Thr Pro Ala Ser Lys Ser Thr Pro Phe Ser Ile Pro Ser
1100 1105 1110
His His Ser Asp Thr Pro Thr Thr Leu Ala Ser His Ser Thr Lys
1115 1120 1125
Thr Asp Ala Ser Ser Thr His His Ser Ser Val Pro Pro Leu Thr
1130 1135 1140
Ser Ser Asn His Ser Thr Ser Pro Gln Leu Ser Thr Gly Val Ser
1145 1150 1155
Phe Phe Phe Leu Ser Phe His Ile Ser Asn Leu Gln Phe Asn Ser
1160 1165 1170
Ser Leu Glu Asp Pro Ser Thr Asp Tyr Tyr Gln Glu Leu Gln Arg
1175 1180 1185
Asp Ile Ser Glu Met Phe Leu Gln Ile Tyr Lys Gln Gly Gly Phe
1190 1195 1200
Leu Gly Leu Ser Asn Ile Lys Phe Arg Pro Gly Ser Val Val Val
1205 1210 1215
Gln Leu Thr Leu Ala Phe Arg Glu Gly Thr Ile Asn Val His Asp
1220 1225 1230
Val Glu Thr Gln Phe Asn Gln Tyr Lys Thr Glu Ala Ala Ser Arg
1235 1240 1245
Tyr Asn Leu Thr Ile Ser Asp Val Ser Val Ser Asp Val Pro Phe
1250 1255 1260
Pro Phe Ser Ala Gln Ser Gly Ala Gly Val Pro Gly Trp Gly Ile
1265 1270 1275
Ala Leu Leu Val Leu Val Cys Val Leu Val Ala Leu Ala Ile Val
1280 1285 1290
Tyr Leu Ile Ala Leu Ala Val Cys Gln Cys Arg Arg Lys
1295 1300 1305
<210> 49
<211> 42
<212> PRT
<213> 人工序列
<220>
<223> 合成跨膜结构域
<400> 49
Ala Ser Gly Ile Leu Tyr Trp Arg Asn Pro Thr Glu Ser Asp Ser Ile
1 5 10 15
Val Leu Ala Ile Ile Val Pro Ser Leu Leu Leu Leu Leu Cys Leu Ala
20 25 30
Leu Leu Trp Tyr Met Arg Arg Arg Ser Met
35 40
<210> 50
<211> 2692
<212> DNA
<213> 人工序列
<220>
<223> cDNA
<400> 50
tgtacatgga catggtcgct gtgagtatga ccagcagcgt actctccagc cacagccccg 60
gttcaggctc ctccaccact cagggacagg atgtcactct ggccccggcc acggaaccag 120
cttcaggttc agctgccacc tggggacagg atgtcacctc ggtcccggat acgcgacccg 180
ccccagggtc aacagcgccc ccagcccacg gcgttacatc tgcacctgac actagacctg 240
cgccaggatc aacagctcca ccggctcacg gggtcaccag tgcccccgac actcgaccag 300
ctccggggtc taccgctccc ccggctcatg gtgtcactag cgcgcctgac acacgcccgg 360
caccagggag tacggcccct cctgcgcacg gcgtaacttc agccccagat actcgacctg 420
ctccgggctc aacagccccg cctgcacatg gagttacatc agcccctgat actagaccgg 480
ctccaggttc aactgctccg ccagcacatg gtgtaacgtc tgcgcccgat actcgcccag 540
cacctgggtc cacagctccc cctgcgcatg gagtaacatc agcacctgat accagacctg 600
ccccgggcag cactgcaccc ccagcacatg gcgtaacatc agcaccagat actcgccccg 660
ctcctggttc cacggctccc cccgcgcatg gcgttacttc agctccagat acacggccgg 720
cacccggcag tacggctcca cccgcacatg gagtaacgag tgctccggac actcggcctg 780
ctccaggaag taccgcacct ccggcccatg gcgtgacaag tgctcccgac accagaccag 840
cgcctggttc aacagcaccg ccagctcatg gtgtaacctc agctcccgat actagacccg 900
cgccaggttc caccgctcca cctgcacacg gggtgacgag cgcacctgat acgcgcccgg 960
caccgggaag cacagcgcct cccgctcacg gagtcactag cgccccggat acaagacccg 1020
cacctggatc tacagctcct ccagctcacg gcgtcacgag tgcacccgat acacgaccgg 1080
ccccaggctc tacagcccca ccagcacatg gagtcacgag tgcacctgat actaggcccg 1140
ctccgggttc cacagcacct cctgcacatg gtgttacatc cgctcctgat acgagacccg 1200
ctccaggctc tactgcccca ccggcacacg gcgtgaccag tgctccagat acccggccag 1260
ctcctgggag tactgcgcct ccagctcatg gcgtcactag tgcacctgat acaagaccag 1320
cccccggttc cactgctcca ccagcccatg gtgtaacaag tgcaccggac acaaggccag 1380
cccctggtag tactgctcct cctgctcacg gtgttactag tgctcctgac accagacctg 1440
cccctggaag tactgcaccg cctgctcatg gagtcacatc agctccggat actcggccgg 1500
ctccgggatc aaccgctcct ccggctcatg gagtaacctc cgcaccggat actaggcctg 1560
caccggggag tacagcacca cctgctcatg gtgtgactag cgctcctgac actcgccccg 1620
ctcccggtag cactgccccc cctgcacatg gggtgacttc agctcctgat actcggcctg 1680
cacccggaag cacagccccc ccagctcatg gggtcacaag cgctccagat actaggccag 1740
cgccgggaag tacagcccct ccagcgcacg gtgtaacttc cgcgccagac acacgccctg 1800
ctcccggatc aacggcacct ccagcacacg gtgtgacgtc cgcacccgac acaagaccgg 1860
cacctggttc tactgcacct cccgcgcacg gagttacttc agcaccagat acaagacctg 1920
ctcctggctc aactgcccct ccggcgcatg gtgtaactag tgcgcctgat acacgcccag 1980
caccgggtag tacggcacca ccagctcatg gagttacgtc agctccagat acgcgccctg 2040
caccaggcag tacagctccg ccggcccacg gagtaactag cgcaccagat accaggccag 2100
cacccggtag taccgcgcct cctgcccatg gagtaacttc cgcccccgat acccgacctg 2160
cacctggcag taccgcccct cccgcccacg gggtaaccag tgcaccagac acgcggcccg 2220
caccaggatc tactgctccc ccagcgcatg gggtaacttc tgcaccagat acgaggcctg 2280
ccccaggtag tacagcgcca cctgcccacg gtgtcacctc cgctcctgat acaaggcctg 2340
cgcctggatc aactgcacca ccggcgcacg gggttacaag tgcccctgac acgagaccag 2400
caccaggttc tacggcgcct ccggcacatg gagtgactag tgccccagac actaggccgg 2460
ctcctggatc aaccgcacca cccgctcatg gagtgacatc agcgccagat actagaccag 2520
ctcccgggtc aactgcgccg cccgcccatg gggttacttc tgctccagac actcgcccag 2580
ccccaggatc aacggctcct cccgcacacg gagtgacctc tgctcctgat accaggccag 2640
ctccagggtc tacagcaccc cctgctcatg gggtaacatc tgccgcctca gg 2692
<210> 51
<211> 1432
<212> DNA
<213> 人工序列
<220>
<223> cDNA
<400> 51
tgtacatgga catggtcgct gtgagtatga ccagcagcgt actctccagc cacagccccg 60
gttcaggctc ctccaccact cagggacagg atgtcactct ggccccggcc acggaaccag 120
cttcaggttc agctgccacc tggggacagg atgtcacctc ggtcccagac actcggcctg 180
caccgggatc aaccgcccca ccggctcatg gtgtaactag tgcgcctgat accagaccag 240
caccagggag tactgcacct cctgctcatg gggttactag tgcccccgat acgcgacctg 300
ctcctggaag cacagcaccg ccggctcacg gcgtaacgag tgctcctgac acaaggcccg 360
ctccagggtc aactgcacca cctgcacacg gagtgacatc agcgccagat acgagacctg 420
caccaggaag tacagcgccg ccagcccacg gagtaacttc agccccggac actaggccag 480
cacctggttc aacggcgcct ccagcccatg gagtaacatc cgctcccgat actcgtcctg 540
ctccgggttc cacagctcct cccgcacatg gggtgactag tgctccagat actcgcccag 600
cacccggtag taccgctcct cctgcacatg gcgtcactag tgcaccagac acgcgtccgg 660
ctcctgggtc tacagctcca ccagctcacg gagttaccag tgcacctgac actagacctg 720
cgcccggttc gacggctccg cccgcccatg gggtaacgtc tgcgccggat acacgccctg 780
cacctggatc taccgcacct ccggcccatg gtgtcacgag cgcacctgat acgaggcctg 840
ctccaggtag tactgctccc cccgctcatg gagttactag cgctcctgat actcgaccgg 900
cacctggcag cactgctcct ccagcacatg gtgttacatc ggctccagac acacgtcccg 960
cgccaggatc gactgctcca cccgctcacg gggtcacatc tgcacccgat acacggccag 1020
ctcccggttc cactgccccg cctgcccatg gcgttacttc ggcaccagat acccgacccg 1080
caccaggcag tacagcacct ccagcgcatg gtgtgacaag cgcccctgat acacgaccag 1140
ctccaggctc aacagcacca ccagcacacg gtgtaacctc agctccggat acccgtccag 1200
ctcctggtag tacagcccct cctgcgcacg gagtcacaag tgctcccgac acaagaccag 1260
ccccaggttc tactgcgcca cctgctcacg gtgttacctc tgccccagat acaagacctg 1320
cccctggctc tacggcaccc ccggcacatg gagtcacttc cgcaccggat actagaccag 1380
cgcctgggag tacggccccc ccagctcatg gcgtgacttc tgctgcctca gg 1432
<210> 52
<211> 772
<212> DNA
<213> 人工序列
<220>
<223> cDNA
<400> 52
tgtacatgga catggtcgct gtgagtatga ccagcagcgt actctccagc cacagccccg 60
gttcaggctc ctccaccact cagggacagg atgtcactct ggccccggcc acggaaccag 120
cttcaggttc agctgccacc tggggacagg atgtcacctc ggtcccagat acaagaccgg 180
ccccaggatc tacggctcct ccggctcatg gagtcacttc tgctccagac acaaggcccg 240
cgccgggttc tacagcaccg cctgctcatg gtgttactag cgcacccgat acgagacctg 300
ctccgggatc aacggcacct cctgcccacg gggtaacatc tgcaccggac actcgccctg 360
cgcccggttc aaccgctcca cccgcacacg gagtgacaag cgctcctgac actagaccag 420
caccaggttc tacagcccca ccagcccatg gagttaccag tgcaccagat actaggccag 480
ctccaggtag tactgcaccc ccagctcatg gggttacatc agctcccgac acgcgaccag 540
ctcctggaag cactgcccct ccagctcacg gtgtgacctc agcacctgat acacgccctg 600
cacctggctc tactgctccc cccgctcatg gcgtaactag tgccccggat actcgacccg 660
cccctggttc cacagctccg ccagcacatg gtgtaacaag tgctcctgat acccgaccag 720
cgcctggaag taccgcacca cctgcacatg gagtaacttc agccgcctca gg 772
<210> 53
<211> 1432
<212> DNA
<213> 人工序列
<220>
<223> cDNA
<400> 53
tgtacatgga catggtcgct gtgagtatga ccagcagcgt actctccagc cacagccccg 60
gttcaggctc ctccaccact cagggacagg atgtcactct ggccccggcc acggaaccag 120
cttcaggttc agctgccacc tggggacagg atgtcacctc ggtcccagat accagacctg 180
cgcctggagc cacagctcct cctgcccatg gcgtcacaag tgcccctgac acacgcccag 240
ctcccggggc tacagcccca cctgcacatg gtgttactag tgcaccagac accagaccgg 300
ctccgggagc cacggcaccc cccgctcatg gtgtcacttc cgcaccggat acgaggccag 360
cacctggggc cactgcgccg ccggcacatg gggtgactag tgcgccagat actcgccctg 420
ctccaggggc tactgcccct ccagctcatg gcgtaacctc agcgcctgat acccgaccag 480
cgccaggtgc cactgcaccg ccagcccatg gggtcactag tgctcctgac actagacctg 540
cacctggagc tacagcacct ccagcgcatg gtgtgacaag cgccccagac acgagaccag 600
cccccggtgc caccgctcct cccgcacatg gagttactag cgctccggac acaagaccgg 660
caccaggtgc gactgcacca ccggctcatg gagtaacttc agcaccagat acacggcctg 720
ctcccggcgc tacagctcca ccagcacatg gcgttacctc cgcacctgac acgaggcccg 780
ctccaggagc cactgctccc cctgcacacg gtgttacgtc agctccagat acgcggccag 840
ctccgggcgc aacagctccc ccggctcacg gtgtaaccag tgctcccgac acaaggcctg 900
cacccggagc aaccgcacct ccggcccatg gtgtaacaag tgcacctgat actaggcccg 960
cgcctggtgc tactgctcca cctgctcacg gcgtgacatc agcccctgat acgagacctg 1020
ccccaggggc aactgcacct cctgctcatg gggtaactag tgcccccgat acaagaccag 1080
caccgggagc gaccgccccc ccagcacacg gagtaacgag cgcacccgat actcgacctg 1140
caccaggagc gacggctcca cccgctcacg gagtcacgag tgctccagac actcgacctg 1200
ctcctggcgc gacagcacca ccagctcacg gggttactag tgctcctgat acacgacccg 1260
caccaggggc gactgctcct ccagcccacg gagttacatc tgccccggat acaaggccag 1320
cacccggtgc aactgctccg cccgcccatg gagtcacaag tgctccggat actagaccag 1380
ctcctggggc tacggcgcct cctgcgcacg gagtgacttc tgctgcctca gg 1432
<210> 54
<211> 1432
<212> DNA
<213> 人工序列
<220>
<223> cDNA
<400> 54
tgtacatgga catggtcgct gtgagtatga ccagcagcgt actctccagc cacagccccg 60
gttcaggctc ctccaccact cagggacagg atgtcactct ggccccggcc acggaaccag 120
cttcaggttc agctgccacc tggggacagg atgtcacctc ggtcccagat gcaaggcctg 180
ccccgggagc gacagcacca ccagcacatg gagtgacggc cgccccagac gctcgaccgg 240
caccaggagc aactgctcct cccgcacatg gggtcactgc ggcccctgat gcgaggccgg 300
cacctggagc tactgctcca ccggcccatg gtgtcactgc agccccggat gctagaccgg 360
ctccgggcgc aactgcgccg ccagcccatg gagttactgc tgcgccagat gcgcggcctg 420
ccccaggtgc tacagccccc cctgcccatg gcgtaacagc tgcccccgat gctcgccctg 480
caccgggagc aacggcgcct ccagcgcacg gagtaacggc agcaccagat gctcggccag 540
caccgggggc tacagctcca cctgctcacg gtgtaactgc agcgcctgat gcacgaccag 600
cccctggagc aacagctccg cctgcacacg gagtgactgc tgcacctgat gctaggccag 660
ccccaggggc gactgcacct ccagcacacg gtgttacagc tgctccagac gcacgcccag 720
cacccggtgc cacagctcct cctgcgcatg gtgtgacagc tgcaccagac gcccgacccg 780
cgccaggagc cacggctcca ccagctcacg gcgtgaccgc ggctcctgac gctaggccag 840
ctcctggagc caccgctcct ccagctcatg gcgttacagc agctcccgac gcaagacccg 900
ctcctggggc cactgctccc cccgctcacg gggtaacagc cgctccggat gcaagacctg 960
cccctggtgc tactgcacca cccgcccatg gggttactgc agctccggac gctagacctg 1020
ctccgggagc tacagcgccc ccagcccacg gagtcacagc agcacctgac gcgagaccag 1080
cgccaggtgc aactgcccct cctgcacatg gtgttactgc cgcaccggat gccagacctg 1140
cacccggagc tacggccccg ccggctcatg gggtaactgc tgctcctgat gcccgacccg 1200
ctccaggcgc gaccgcacct cctgctcatg gagtaacagc ggcacccgat gcacggccgg 1260
ctcccggcgc tacagcacct ccggcacatg gcgtcaccgc agctccagat gccaggcccg 1320
caccaggtgc gacggcaccg cccgctcatg gtgtaaccgc tgctcccgat gcgagacctg 1380
cgcctggtgc aacagcaccc ccggctcacg gagttacggc tgctgcctca gg 1432
<210> 55
<211> 652
<212> DNA
<213> 人工序列
<220>
<223> 重新计数的粘蛋白共有
<400> 55
tgtacatgga catggtcgct gtgagtatga ccagcagcgt actctccagc cacagccccg 60
gttcaggctc ctccaccact cagggacagg atgtcactct ggccccggcc acggaaccag 120
cttcaggttc agctgccacc tggggacagg atgtcacctc ggtcaaggaa cctgcaccta 180
caaccccgaa ggagcccgca ccgaccaccc caaaagaacc tgcgccgaca actccaaagg 240
agccagctcc aacgacgcca aaggaaccag cacctacgac ccccaaggaa cccgccccga 300
cgactccgaa ggagcctgca ccaacaactc ctaaagaacc agcgcctact acgcctaaag 360
aacctgctcc tactacacca aaagagccag cacccacgac accgaaagaa cctgccccta 420
ctacccctaa agaacccgct cctaccacac caaaggaacc ggctcccact actcccaaag 480
aaccagcccc aactacacct aaagaaccgg cccccaccac tcctaaagag ccggcgccaa 540
ctactccaaa agaaccagct cctacaactc ccaaggagcc ggcacctact actccgaaag 600
agcccgcgcc cacaacaccc aaagagcctg ctccgactac tcctgcctca gg 652
<210> 56
<211> 1012
<212> DNA
<213> 人工序列
<220>
<223> 重组润滑素序列
<400> 56
tgtacatgga catggtcgct gtgagtatga ccagcagcgt actctccagc cacagccccg 60
gttcaggctc ctccaccact cagggacagg atgtcactct ggccccggcc acggaaccag 120
cttcaggttc agctgccacc tggggacagg atgtcacctc ggtcgatgca gctactccag 180
ctccggacgc cgcaacaccc gctccagacg ccgccacccc agctccagat gctgctacac 240
ctgcacctga tgccgcaact cccgcgccgg atgccgcgac tccagcaccg gacgctgcga 300
cgccagcccc tgatgctgca acaccggctc ctgatgctgc gactcctgcg ccagatgcag 360
ctacaccagc cccggatgct gcaacgcctg ctcctgacgc agctactccg gcccccgacg 420
ctgctacccc ggcgcctgat gctgctactc ccgctcctga tgcggccact ccagccccag 480
acgcagcaac cccagccccc gatgctgcta cgcctgcacc cgacgcggcc acacctgcgc 540
cggacgcagc gacacctgcc cctgacgctg ccacgcccgc acctgatgca gctacgccag 600
ctcccgatgc ggcaacacct gctccagatg ccgccactcc tgctccggat gcggcgacac 660
cagcgcctga cgccgctacg ccggcacctg atgctgccac tccggctcca gatgcagcga 720
ccccagcgcc agacgcggca actccagcgc ccgatgcagc taccccagca ccagatgctg 780
caacccctgc accggatgca gcaacgccag cacctgacgc ggctactcct gcaccagatg 840
cagcaactcc tgccccggac gcggcgactc ccgcaccaga cgctgcaact ccggcaccag 900
atgcggctac ccccgctccc gacgcagcca ctcccgcccc agatgcagcc acaccagctc 960
ctgatgcagc aacaccagca cccgatgccg ctacccctgc tcccgcctca gg 1012
<210> 57
<211> 1852
<212> DNA
<213> 人工序列
<220>
<223> 重组润滑素序列
<400> 57
tgtacatgga catggtcgct gtgagtatga ccagcagcgt actctccagc cacagccccg 60
gttcaggctc ctccaccact cagggacagg atgtcactct ggccccggcc acggaaccag 120
cttcaggttc agctgccacc tggggacagg atgtcacctc ggtcgatgca gctactccag 180
ctccggacgc cgcaacaccc gctccagacg ccgccacccc agctccagat gctgctacac 240
ctgcacctga tgccgcaact cccgcgccgg atgccgcgac tccagcaccg gacgctgcga 300
cgccagcccc tgatgctgca acaccggctc ctgatgctgc gactcctgcg ccagatgcag 360
ctacaccagc cccggatgct gcaacgcctg ctcctgacgc agctactccg gcccccgacg 420
ctgctacccc ggcgcctgat gctgctactc ccgctcctga tgcggccact ccagccccag 480
acgcagcaac cccagccccc gatgctgcta cgcctgcacc cgacgcggcc acacctgcgc 540
cggacgcagc gacacctgcc cctgacgctg ccacgcccgc acctgatgca gctacgccag 600
ctcccgatgc ggcaacacct gctccagatg ccgccactcc tgctccggat gcggcgacac 660
cagcgcctga cgccgctacg ccggcacctg atgctgccac tccggctcca gatgcagcga 720
ccccagcgcc agacgcggca actccagcgc ccgatgcagc taccccagca ccagatgctg 780
caacccctgc accggatgca gcaacgccag cacctgacgc ggctactcct gcaccagatg 840
cagcaactcc tgccccggac gcggcgactc ccgcaccaga cgctgcaact ccggcaccag 900
atgcggctac ccccgctccc gacgcagcca ctcccgcccc agatgcagcc acaccagctc 960
ctgatgcagc aacaccagca cccgatgccg ctacccctgc tcccgatgca gctactccag 1020
ctccggacgc cgcaacaccc gctccagacg ccgccacccc agctccagat gctgctacac 1080
ctgcacctga tgccgcaact cccgcgccgg atgccgcgac tccagcaccg gacgctgcga 1140
cgccagcccc tgatgctgca acaccggctc ctgatgctgc gactcctgcg ccagatgcag 1200
ctacaccagc cccggatgct gcaacgcctg ctcctgacgc agctactccg gcccccgacg 1260
ctgctacccc ggcgcctgat gctgctactc ccgctcctga tgcggccact ccagccccag 1320
acgcagcaac cccagccccc gatgctgcta cgcctgcacc cgacgcggcc acacctgcgc 1380
cggacgcagc gacacctgcc cctgacgctg ccacgcccgc acctgatgca gctacgccag 1440
ctcccgatgc ggcaacacct gctccagatg ccgccactcc tgctccggat gcggcgacac 1500
cagcgcctga cgccgctacg ccggcacctg atgctgccac tccggctcca gatgcagcga 1560
ccccagcgcc agacgcggca actccagcgc ccgatgcagc taccccagca ccagatgctg 1620
caacccctgc accggatgca gcaacgccag cacctgacgc ggctactcct gcaccagatg 1680
cagcaactcc tgccccggac gcggcgactc ccgcaccaga cgctgcaact ccggcaccag 1740
atgcggctac ccccgctccc gacgcagcca ctcccgcccc agatgcagcc acaccagctc 1800
ctgatgcagc aacaccagca cccgatgccg ctacccctgc tcccgcctca gg 1852
<210> 58
<211> 1132
<212> DNA
<213> 人工序列
<220>
<223> 重组润滑素序列
<400> 58
tgtacatgga catggtcgct gtgagtatga ccagcagcgt actctccagc cacagccccg 60
gttcaggctc ctccaccact cagggacagg atgtcactct ggccccggcc acggaaccag 120
cttcaggttc agctgccacc tggggacagg atgtcacctc ggtcgatgca gctaccccgg 180
ctccacccga tgcggcaaca ccagcccctc ccgatgcagc aacacctgct ccccccgatg 240
ctgctacccc tgctccgcct gatgctgcaa ctccagctcc gcccgatgcc gctacacctg 300
ccccccctga cgccgccacg cccgctcctc cggatgctgc aaccccagca cccccagacg 360
ccgctacccc agctccacca gatgctgcta cacccgcacc acctgatgcc gcaacaccgg 420
cgcctcctga tgctgctact ccagccccac ctgatgcagc aactcctgcg ccaccagacg 480
ctgccacacc tgcaccacca gatgcagcca caccagcacc gccagacgca gcaacgccgg 540
ctccgccaga tgcagcgaca ccagcgccac ctgacgcagc gactccagca ccaccggatg 600
cggctacccc cgctccgccg gacgcggcga ctcctgcccc tcctgacgcg gcaactccgg 660
cccctccaga tgcggcgacc ccagccccgc cggatgccgc gactccggct cccccggacg 720
ctgcaacacc cgctccacct gatgctgcca ctcccgcgcc tccagatgct gcaacgccag 780
ctccccctga tgctgcgacg cctgctcctc cagatgcagc tacaccggct cctcctgatg 840
cagctacgcc tgcaccgcct gacgctgcta cgccagcacc tcccgacgca gccactcctg 900
cacctcctga tgcggccact ccagcgcccc cggatgcagc tactcctgct ccaccggacg 960
ccgcaactcc cgcccctccg gacgcagcta ctcccgctcc cccagatgca gcaacccctg 1020
caccccccga cgcggccacc cctgccccac cagatgccgc cactccggca ccacccgacg 1080
ctgcgactcc cgcacctcca gacgcggcta caccagctcc tcccgcctca gg 1132
<210> 59
<211> 2092
<212> DNA
<213> 人工序列
<220>
<223> 重组润滑素序列
<400> 59
tgtacatgga catggtcgct gtgagtatga ccagcagcgt actctccagc cacagccccg 60
gttcaggctc ctccaccact cagggacagg atgtcactct ggccccggcc acggaaccag 120
cttcaggttc agctgccacc tggggacagg atgtcacctc ggtcgatgca gctaccccgg 180
ctccacccga tgcggcaaca ccagcccctc ccgatgcagc aacacctgct ccccccgatg 240
ctgctacccc tgctccgcct gatgctgcaa ctccagctcc gcccgatgcc gctacacctg 300
ccccccctga cgccgccacg cccgctcctc cggatgctgc aaccccagca cccccagacg 360
ccgctacccc agctccacca gatgctgcta cacccgcacc acctgatgcc gcaacaccgg 420
cgcctcctga tgctgctact ccagccccac ctgatgcagc aactcctgcg ccaccagacg 480
ctgccacacc tgcaccacca gatgcagcca caccagcacc gccagacgca gcaacgccgg 540
ctccgccaga tgcagcgaca ccagcgccac ctgacgcagc gactccagca ccaccggatg 600
cggctacccc cgctccgccg gacgcggcga ctcctgcccc tcctgacgcg gcaactccgg 660
cccctccaga tgcggcgacc ccagccccgc cggatgccgc gactccggct cccccggacg 720
ctgcaacacc cgctccacct gatgctgcca ctcccgcgcc tccagatgct gcaacgccag 780
ctccccctga tgctgcgacg cctgctcctc cagatgcagc tacaccggct cctcctgatg 840
cagctacgcc tgcaccgcct gacgctgcta cgccagcacc tcccgacgca gccactcctg 900
cacctcctga tgcggccact ccagcgcccc cggatgcagc tactcctgct ccaccggacg 960
ccgcaactcc cgcccctccg gacgcagcta ctcccgctcc cccagatgca gcaacccctg 1020
caccccccga cgcggccacc cctgccccac cagatgccgc cactccggca ccacccgacg 1080
ctgcgactcc cgcacctcca gacgcggcta caccagctcc tcccgatgca gctaccccgg 1140
ctccacccga tgcggcaaca ccagcccctc ccgatgcagc aacacctgct ccccccgatg 1200
ctgctacccc tgctccgcct gatgctgcaa ctccagctcc gcccgatgcc gctacacctg 1260
ccccccctga cgccgccacg cccgctcctc cggatgctgc aaccccagca cccccagacg 1320
ccgctacccc agctccacca gatgctgcta cacccgcacc acctgatgcc gcaacaccgg 1380
cgcctcctga tgctgctact ccagccccac ctgatgcagc aactcctgcg ccaccagacg 1440
ctgccacacc tgcaccacca gatgcagcca caccagcacc gccagacgca gcaacgccgg 1500
ctccgccaga tgcagcgaca ccagcgccac ctgacgcagc gactccagca ccaccggatg 1560
cggctacccc cgctccgccg gacgcggcga ctcctgcccc tcctgacgcg gcaactccgg 1620
cccctccaga tgcggcgacc ccagccccgc cggatgccgc gactccggct cccccggacg 1680
ctgcaacacc cgctccacct gatgctgcca ctcccgcgcc tccagatgct gcaacgccag 1740
ctccccctga tgctgcgacg cctgctcctc cagatgcagc tacaccggct cctcctgatg 1800
cagctacgcc tgcaccgcct gacgctgcta cgccagcacc tcccgacgca gccactcctg 1860
cacctcctga tgcggccact ccagcgcccc cggatgcagc tactcctgct ccaccggacg 1920
ccgcaactcc cgcccctccg gacgcagcta ctcccgctcc cccagatgca gcaacccctg 1980
caccccccga cgcggccacc cctgccccac cagatgccgc cactccggca ccacccgacg 2040
ctgcgactcc cgcacctcca gacgcggcta caccagctcc tcccgcctca gg 2092
<210> 60
<211> 1252
<212> DNA
<213> 人工序列
<220>
<223> 重组粘蛋白序列
<400> 60
tgtacatgga catggtcgct gtgagtatga ccagcagcgt actctccagc cacagccccg 60
gttcaggctc ctccaccact cagggacagg atgtcactct ggccccggcc acggaaccag 120
cttcaggttc agctgccacc tggggacagg atgtcacctc ggtcccacct gcatctacca 180
gtgccccggg tccacctgcc tctactagcg ccccaggacc tccggcaagt acatcagcgc 240
caggaccccc tgcttccact agtgcacccg gtcccccggc atctacgtct gcccctggcc 300
cacctgcttc aacttcagca ccaggaccac ccgcaagcac atcagcccca ggccctcccg 360
cctctacaag cgctccgggg cctccggcct ctacctcagc tccaggccca ccagccagca 420
cttcagcccc tggtccaccc gcttcaacct cagcacccgg acctcctgcc tcaacttccg 480
ctcccggtcc accagctagt acctctgctc cgggccctcc ggcgagcacg tcagcaccgg 540
gaccacctgc gagtacaagt gcacctggcc cgcccgctag cacaagtgcc cccggtcctc 600
cagcatccac tagtgcacca gggcctccag ccagcactag tgcgccgggt ccccccgcga 660
gtacgtcagc tccgggacct ccagcttcta catctgctcc tgggccccct gcatcaacta 720
gtgcccctgg accaccggct agtacgtcag ctcctggtcc ccctgccagt actagcgctc 780
cagggccacc agcaagtacg agcgcaccag gccccccagc ctctacgagt gcaccgggtc 840
ctcctgcaag tacctccgct ccaggtcctc cggcttcaac gtccgcacct ggacctcccg 900
cgtccacatc agctcccggc cctccagcga gtacttctgc tcccggacca ccagcgtcca 960
catctgcgcc tggtcctccc gctagtacct ctgcacctgg tccgccggcc agtacaagtg 1020
ctcccgggcc tcccgcatca acatctgcac caggtccacc ggcgtctact agtgccccag 1080
gtcccccagc ttcaacatca gcacctgggc cgcctgctag tacatccgct cctggacccc 1140
cagcaagtac ttccgcccct gggcctcctg cttctacttc agctcctggc cctcctgcgt 1200
caactagtgc tccaggaccg ccagctagta cttccgcgcc cggtgcctca gg 1252
<210> 61
<211> 751
<212> DNA
<213> 人工序列
<220>
<223> cDNA
<400> 61
cctcaggctc tgcatcaggc tcagctatgg tgtccaaggg cgaggagctg ttcaccgggg 60
tggtgcccat cctggtcgag ctggacggcg acgtaaacgg ccacaagttc tccgtgcggg 120
gcgagggcga gggcgatgcc accaacggca agctgaccct gaagttcatc agcaccaccg 180
gcaagctgcc cgtgccctgg cccaccctcg tgaccaccct gacctacggc gtgcagagct 240
tctcccgcta ccccgaccac atgaagcgcc acgacttctt caagagcgcc atgcccgaag 300
gctacgtcca ggagcgcacc atctccttca aggacgacgg cacctacaag acccgcgccg 360
aggtgaagtt cgagggcgac accctggtga accgcatcga gctgaagggc atcgacttca 420
aggaggacgg caacatcctg gggcacaagc tggagtacaa cttcaactcc cacaacgtct 480
atatcaccgc cgacaagcag aagaacggca tcaaggccaa cttcaagatc cgccacaacg 540
tggaggacgg ctccgtgcag ctcgccgacc actaccagca gaacaccccc atcggcgacg 600
gccccgtgct gctgcccgac aaccactacc tgtccaccca gtccaagctg tccaaagacc 660
ccaacgagaa gcgcgatcac atggtccttc tggaattcgt gaccgccgcc gggatcactc 720
acggcatgga cgagctgtat aagggctcag c 751
<210> 62
<211> 678
<212> DNA
<213> 人工序列
<220>
<223> 重组膜锚cDNA
<400> 62
gctcagcttc tactctggtg cacaacggca cctctgccag ggctaccaca accccagcca 60
gcaagagcac tccattctca attcccagcc accactctga tactcctacc acccttgcca 120
gccatagcac caagactgat gccagtagca ctcaccatag ctcggtacct cctctcacct 180
cctccaatca cagcacttct ccccagttgt ctactggggt ctctttcttt ttcctgtctt 240
ttcacatttc aaacctccag tttaattcct ctctggaaga tcccagcacc gactactacc 300
aagagctgca gagagacatt tctgaaatgt ttttgcagat ttataaacaa gggggttttc 360
tgggcctctc caatattaag ttcaggccag gatctgtggt ggtacaattg actctggcct 420
tccgagaagg taccatcaat gtccacgacg tggagacaca gttcaatcag tataaaacgg 480
aagcagcctc tcgatataac ctgacgatct cagacgtcag cgtgagtgat gtgccatttc 540
ctttctctgc ccagtctggg gctggggtgc caggctgggg catcgcgctg ctggtgctgg 600
tctgtgttct ggttgcgctg gccattgtct atctcattgc cttggctgtc tgtcagtgcc 660
gccgaaagta gggaattc 678
<210> 63
<211> 134
<212> DNA
<213> 人工序列
<220>
<223> 跨膜cDNA
<400> 63
cctcaggcat actttattgg cgaaacccaa cggaaagtga tagcatcgtt ttggcaatta 60
tcgtccccag tctgctcctc ttgctctgcc tggctttgtt gtggtacatg cgccgacgaa 120
gtatgtagga attc 134
<210> 64
<211> 231
<212> DNA
<213> 人工序列
<220>
<223> 细胞质基序cDNA
<400> 64
tctagatgtc agtgccgccg aaagaactac gggcagctgg acatctttcc agcccgggat 60
acctaccatc ctatgagcga gtaccccacc taccacaccc atgggcgcta tgtgccccct 120
agcagtaccg atcgtagccc ctatgagaag gtttctgcag gtaatggtgg cagcagcctc 180
tcttacacaa acccagcagt ggcagccgct tctgccaact tgtaggaatt c 231
<210> 65
<211> 33
<212> DNA
<213> 人工序列
<220>
<223> 细胞质基序cDNA
<400> 65
tctagatgtc agtgccgccg aaagtaggaa ttc 33
<210> 66
<211> 1404
<212> PRT
<213> 智人
<400> 66
Met Ala Trp Lys Thr Leu Pro Ile Tyr Leu Leu Leu Leu Leu Ser Val
1 5 10 15
Phe Val Ile Gln Gln Val Ser Ser Gln Asp Leu Ser Ser Cys Ala Gly
20 25 30
Arg Cys Gly Glu Gly Tyr Ser Arg Asp Ala Thr Cys Asn Cys Asp Tyr
35 40 45
Asn Cys Gln His Tyr Met Glu Cys Cys Pro Asp Phe Lys Arg Val Cys
50 55 60
Thr Ala Glu Leu Ser Cys Lys Gly Arg Cys Phe Glu Ser Phe Glu Arg
65 70 75 80
Gly Arg Glu Cys Asp Cys Asp Ala Gln Cys Lys Lys Tyr Asp Lys Cys
85 90 95
Cys Pro Asp Tyr Glu Ser Phe Cys Ala Glu Val His Asn Pro Thr Ser
100 105 110
Pro Pro Ser Ser Lys Lys Ala Pro Pro Pro Ser Gly Ala Ser Gln Thr
115 120 125
Ile Lys Ser Thr Thr Lys Arg Ser Pro Lys Pro Pro Asn Lys Lys Lys
130 135 140
Thr Lys Lys Val Ile Glu Ser Glu Glu Ile Thr Glu Glu His Ser Val
145 150 155 160
Ser Glu Asn Gln Glu Ser Ser Ser Ser Ser Ser Ser Ser Ser Ser Ser
165 170 175
Ser Thr Ile Arg Lys Ile Lys Ser Ser Lys Asn Ser Ala Ala Asn Arg
180 185 190
Glu Leu Gln Lys Lys Leu Lys Val Lys Asp Asn Lys Lys Asn Arg Thr
195 200 205
Lys Lys Lys Pro Thr Pro Lys Pro Pro Val Val Asp Glu Ala Gly Ser
210 215 220
Gly Leu Asp Asn Gly Asp Phe Lys Val Thr Thr Pro Asp Thr Ser Thr
225 230 235 240
Thr Gln His Asn Lys Val Ser Thr Ser Pro Lys Ile Thr Thr Ala Lys
245 250 255
Pro Ile Asn Pro Arg Pro Ser Leu Pro Pro Asn Ser Asp Thr Ser Lys
260 265 270
Glu Thr Ser Leu Thr Val Asn Lys Glu Thr Thr Val Glu Thr Lys Glu
275 280 285
Thr Thr Thr Thr Asn Lys Gln Thr Ser Thr Asp Gly Lys Glu Lys Thr
290 295 300
Thr Ser Ala Lys Glu Thr Gln Ser Ile Glu Lys Thr Ser Ala Lys Asp
305 310 315 320
Leu Ala Pro Thr Ser Lys Val Leu Ala Lys Pro Thr Pro Lys Ala Glu
325 330 335
Thr Thr Thr Lys Gly Pro Ala Leu Thr Thr Pro Lys Glu Pro Thr Pro
340 345 350
Thr Thr Pro Lys Glu Pro Ala Ser Thr Thr Pro Lys Glu Pro Thr Pro
355 360 365
Thr Thr Ile Lys Ser Ala Pro Thr Thr Pro Lys Glu Pro Ala Pro Thr
370 375 380
Thr Thr Lys Ser Ala Pro Thr Thr Pro Lys Glu Pro Ala Pro Thr Thr
385 390 395 400
Thr Lys Glu Pro Ala Pro Thr Thr Pro Lys Glu Pro Ala Pro Thr Thr
405 410 415
Thr Lys Glu Pro Ala Pro Thr Thr Thr Lys Ser Ala Pro Thr Thr Pro
420 425 430
Lys Glu Pro Ala Pro Thr Thr Pro Lys Lys Pro Ala Pro Thr Thr Pro
435 440 445
Lys Glu Pro Ala Pro Thr Thr Pro Lys Glu Pro Thr Pro Thr Thr Pro
450 455 460
Lys Glu Pro Ala Pro Thr Thr Lys Glu Pro Ala Pro Thr Thr Pro Lys
465 470 475 480
Glu Pro Ala Pro Thr Ala Pro Lys Lys Pro Ala Pro Thr Thr Pro Lys
485 490 495
Glu Pro Ala Pro Thr Thr Pro Lys Glu Pro Ala Pro Thr Thr Thr Lys
500 505 510
Glu Pro Ser Pro Thr Thr Pro Lys Glu Pro Ala Pro Thr Thr Thr Lys
515 520 525
Ser Ala Pro Thr Thr Thr Lys Glu Pro Ala Pro Thr Thr Thr Lys Ser
530 535 540
Ala Pro Thr Thr Pro Lys Glu Pro Ser Pro Thr Thr Thr Lys Glu Pro
545 550 555 560
Ala Pro Thr Thr Pro Lys Glu Pro Ala Pro Thr Thr Pro Lys Lys Pro
565 570 575
Ala Pro Thr Thr Pro Lys Glu Pro Ala Pro Thr Thr Pro Lys Glu Pro
580 585 590
Ala Pro Thr Thr Thr Lys Lys Pro Ala Pro Thr Thr Pro Lys Glu Pro
595 600 605
Ala Pro Thr Thr Pro Lys Glu Thr Ala Pro Thr Thr Pro Lys Lys Leu
610 615 620
Thr Pro Thr Thr Pro Glu Lys Leu Ala Pro Thr Thr Pro Glu Lys Pro
625 630 635 640
Ala Pro Thr Thr Pro Glu Glu Leu Ala Pro Thr Thr Pro Glu Glu Pro
645 650 655
Thr Pro Thr Thr Pro Glu Glu Pro Ala Pro Thr Thr Pro Lys Ala Ala
660 665 670
Ala Pro Asn Thr Pro Lys Glu Pro Ala Pro Thr Thr Pro Lys Glu Pro
675 680 685
Ala Pro Thr Thr Pro Lys Glu Pro Ala Pro Thr Thr Pro Lys Glu Thr
690 695 700
Ala Pro Thr Thr Pro Lys Gly Thr Ala Pro Thr Thr Leu Lys Glu Pro
705 710 715 720
Ala Pro Thr Thr Pro Lys Lys Pro Ala Pro Lys Glu Leu Ala Pro Thr
725 730 735
Thr Thr Lys Glu Pro Thr Ser Thr Thr Ser Asp Lys Pro Ala Pro Thr
740 745 750
Thr Pro Lys Gly Thr Ala Pro Thr Thr Pro Lys Glu Pro Ala Pro Thr
755 760 765
Thr Pro Lys Glu Pro Ala Pro Thr Thr Pro Lys Gly Thr Ala Pro Thr
770 775 780
Thr Leu Lys Glu Pro Ala Pro Thr Thr Pro Lys Lys Pro Ala Pro Lys
785 790 795 800
Glu Leu Ala Pro Thr Thr Thr Lys Gly Pro Thr Ser Thr Thr Ser Asp
805 810 815
Lys Pro Ala Pro Thr Thr Pro Lys Glu Thr Ala Pro Thr Thr Pro Lys
820 825 830
Glu Pro Ala Pro Thr Thr Pro Lys Lys Pro Ala Pro Thr Thr Pro Glu
835 840 845
Thr Pro Pro Pro Thr Thr Ser Glu Val Ser Thr Pro Thr Thr Thr Lys
850 855 860
Glu Pro Thr Thr Ile His Lys Ser Pro Asp Glu Ser Thr Pro Glu Leu
865 870 875 880
Ser Ala Glu Pro Thr Pro Lys Ala Leu Glu Asn Ser Pro Lys Glu Pro
885 890 895
Gly Val Pro Thr Thr Lys Thr Pro Ala Ala Thr Lys Pro Glu Met Thr
900 905 910
Thr Thr Ala Lys Asp Lys Thr Thr Glu Arg Asp Leu Arg Thr Thr Pro
915 920 925
Glu Thr Thr Thr Ala Ala Pro Lys Met Thr Lys Glu Thr Ala Thr Thr
930 935 940
Thr Glu Lys Thr Thr Glu Ser Lys Ile Thr Ala Thr Thr Thr Gln Val
945 950 955 960
Thr Ser Thr Thr Thr Gln Asp Thr Thr Pro Phe Lys Ile Thr Thr Leu
965 970 975
Lys Thr Thr Thr Leu Ala Pro Lys Val Thr Thr Thr Lys Lys Thr Ile
980 985 990
Thr Thr Thr Glu Ile Met Asn Lys Pro Glu Glu Thr Ala Lys Pro Lys
995 1000 1005
Asp Arg Ala Thr Asn Ser Lys Ala Thr Thr Pro Lys Pro Gln Lys
1010 1015 1020
Pro Thr Lys Ala Pro Lys Lys Pro Thr Ser Thr Lys Lys Pro Lys
1025 1030 1035
Thr Met Pro Arg Val Arg Lys Pro Lys Thr Thr Pro Thr Pro Arg
1040 1045 1050
Lys Met Thr Ser Thr Met Pro Glu Leu Asn Pro Thr Ser Arg Ile
1055 1060 1065
Ala Glu Ala Met Leu Gln Thr Thr Thr Arg Pro Asn Gln Thr Pro
1070 1075 1080
Asn Ser Lys Leu Val Glu Val Asn Pro Lys Ser Glu Asp Ala Gly
1085 1090 1095
Gly Ala Glu Gly Glu Thr Pro His Met Leu Leu Arg Pro His Val
1100 1105 1110
Phe Met Pro Glu Val Thr Pro Asp Met Asp Tyr Leu Pro Arg Val
1115 1120 1125
Pro Asn Gln Gly Ile Ile Ile Asn Pro Met Leu Ser Asp Glu Thr
1130 1135 1140
Asn Ile Cys Asn Gly Lys Pro Val Asp Gly Leu Thr Thr Leu Arg
1145 1150 1155
Asn Gly Thr Leu Val Ala Phe Arg Gly His Tyr Phe Trp Met Leu
1160 1165 1170
Ser Pro Phe Ser Pro Pro Ser Pro Ala Arg Arg Ile Thr Glu Val
1175 1180 1185
Trp Gly Ile Pro Ser Pro Ile Asp Thr Val Phe Thr Arg Cys Asn
1190 1195 1200
Cys Glu Gly Lys Thr Phe Phe Phe Lys Asp Ser Gln Tyr Trp Arg
1205 1210 1215
Phe Thr Asn Asp Ile Lys Asp Ala Gly Tyr Pro Lys Pro Ile Phe
1220 1225 1230
Lys Gly Phe Gly Gly Leu Thr Gly Gln Ile Val Ala Ala Leu Ser
1235 1240 1245
Thr Ala Lys Tyr Lys Asn Trp Pro Glu Ser Val Tyr Phe Phe Lys
1250 1255 1260
Arg Gly Gly Ser Ile Gln Gln Tyr Ile Tyr Lys Gln Glu Pro Val
1265 1270 1275
Gln Lys Cys Pro Gly Arg Arg Pro Ala Leu Asn Tyr Pro Val Tyr
1280 1285 1290
Gly Glu Thr Thr Gln Val Arg Arg Arg Arg Phe Glu Arg Ala Ile
1295 1300 1305
Gly Pro Ser Gln Thr His Thr Ile Arg Ile Gln Tyr Ser Pro Ala
1310 1315 1320
Arg Leu Ala Tyr Gln Asp Lys Gly Val Leu His Asn Glu Val Lys
1325 1330 1335
Val Ser Ile Leu Trp Arg Gly Leu Pro Asn Val Val Thr Ser Ala
1340 1345 1350
Ile Ser Leu Pro Asn Ile Arg Lys Pro Asp Gly Tyr Asp Tyr Tyr
1355 1360 1365
Ala Phe Ser Lys Asp Gln Tyr Tyr Asn Ile Asp Val Pro Ser Arg
1370 1375 1380
Thr Ala Arg Ala Ile Thr Thr Arg Ser Gly Gln Thr Leu Ser Lys
1385 1390 1395
Val Trp Tyr Asn Cys Pro
1400
<210> 67
<211> 4107
<212> DNA
<213> 人工序列
<220>
<223> cDNA
<400> 67
atggagacag acacactcct gctatgggta ctgctgctct gggttccagg ttccactggt 60
gacggctccc aggacctgtc tagctgtgcc ggaagatgtg gcgagggcta cagcagagat 120
gccacctgta actgcgacta caactgccag cactacatgg aatgctgccc cgacttcaag 180
agagtgtgca cagccgagct gagctgcaag ggcagatgct tcgagtcctt cgagaggggc 240
agagagtgcg attgcgacgc ccagtgcaag aaatacgaca agtgctgccc tgactacgag 300
agcttctgtg ccgaggtgca caaccccaca tctccaccta gcagcaagaa ggcccctcca 360
ccttctggcg cctctcagac aatcaagagc accaccaagc ggagccccaa gcctcctaac 420
aagaaaaaga ccaagaaagt gatcgagagc gaggaaatca ccgaggaaca cagcgtgtcc 480
gagaatcaag agagcagctc cagcagcagc tcctccagct ctagctccac catccggaag 540
atcaagtcca gcaagaacag cgccgccaac agagagctgc agaaaaagct gaaagtgaag 600
gacaacaaga agaaccggac caagaagaag cccacaccta agcctccagt ggtggatgag 660
gctggcagcg gactggacaa cggcgacttc aaagtgacca cacctgacac cagcaccaca 720
cagcacaaca aggtgtccac ctctcctaag atcaccaccg ccaagcctat caaccccaga 780
cctagcctgc ctccaaacag cgacacctcc aaagaaacca gcctgaccgt gaacaaagag 840
acaaccgtcg agacaaaaga gactaccacc accaacaagc agactagtac cgacggcaaa 900
gagaaaacca ccagcgccaa agagactcag agcatcgaaa agacctccgc caaggatctg 960
gcccctacct ctaaggtgct ggccaagcca acaccaaagg ccgagacaac cacaaagggc 1020
cctgctctga caacccctaa ggagccagca cccacaacgc cgaaggaacc agcgcccacg 1080
acccctaaag aaccagctcc tacaacgccc aaggaaccgg cgccaacaac gcctaaggaa 1140
ccggcaccaa caacacccaa agagcccgcc cccactactc ctaaagaacc ggctccaact 1200
acaccgaagg aacctgcccc gacaacccca aaggaaccag cccctacaac ccctaaagag 1260
ccagcgccaa ccacgcccaa agaacctgcg ccgactaccc cgaaagagcc ggcacccact 1320
acgcccaaag agccggcccc cacaaccccg aaggaaccgg ctccgacgac accaaaggag 1380
cctgcgccca ctacacccaa ggagcctgca ccaaccactc ccaaggagcc agctcccaca 1440
acaccaaagg aacccgcgcc caccacgcca aaagagccag cacctacaac acctaaggaa 1500
cctgctccaa ccaccccaaa ggagcccgca cctacgactc ccaaggaacc cgctccaacg 1560
acgcctaagg agccggcacc taccactcca aaggagccag ccccgactac tccgaaggag 1620
cctgccccaa ctactcccaa agagccagcc cccacgactc ctaaggaacc agcaccaacg 1680
acaccgaaag aacccgctcc cacgacgccg aaagaacctg cccctacgac acccaaagaa 1740
ccagccccaa caactcctaa agagccggct cccactaccc ctaaggagcc agcgcctacg 1800
accccaaaag agcctgcacc gacaacgcca aaggaacctg cacccaccac ccctaaggaa 1860
cccgcaccaa ctaccccaaa agaacctgca cctactactc caaaggaacc ggcccctacc 1920
acccccaagg aacctgcgcc aactacgccg aaagagcccg cgccaacgac tccgaaagaa 1980
ccagcgccga caactccaaa agagcccgct ccgaccacac cgaaagagcc tgctcccacc 2040
acaccaaaag aaccagcacc gaccactcct aaggagcctg ctcctactac gcctaaagaa 2100
cctgctccga ctacacctaa agaacccgcg cctaccacgc ctaaagagcc tgcgcctaca 2160
actcccaaag aacccgcacc gactacgcca aaagaaccgg ccccaacgac cccgaaagaa 2220
ccggcaccga cgactccaaa agaacccgcc ccaaccacac ctaaagagcc cgcacccacg 2280
acacctaagg agcccgctcc taccacaccc aaggaaccag ctccaacaac ccccaaagag 2340
cctgccccca ccactccgaa ggaacccgcc cctactacac caaaagagcc ggcgcctact 2400
acccccaaag aaccggcgcc cacaactccg aaagagccag ctccgacaac accgagcgaa 2460
gtgtctaccc ctacaaccac caaagagcca accaccatcc acaagagccc cgacgagtct 2520
acacctgagc tgtctgccga gcctactcct aaggctctgg aaaacagccc caaagaaccc 2580
ggggtgccca ccacaaaaac accagccgcc acaaagcccg agatgaccac cacagccaag 2640
gacaagacca ccgagcggga cctgagaaca acccctgaaa ccacaaccgc cgctccaaag 2700
atgacaaaag aaaccgccac aaccaccgag aaaacaaccg agagcaagat caccgccacc 2760
acaacacaag tgacctccac caccactcag gacaccacac ctttcaagat cacaaccctc 2820
aagaccacta cactggcccc aaaagtgacg accacaaaga aaaccatcac cacgaccgag 2880
atcatgaaca agcccgagga aaccgctaag cccaaggaca gggccaccaa cagcaaggcc 2940
accacaccaa agccacagaa gcctacaaag gcccctaaga agccaaccag cacaaaaaag 3000
cccaagacca tgcctagagt gcggaagcct aagacaaccc caacacctcg gaagatgacc 3060
agcactatgc ccgagctgaa ccccacctct agaatcgccg aagccatgct gcagaccacc 3120
actagaccca atcagacccc taacagcaag ctggtggaag tgaaccccaa gtccgaagat 3180
gccggcggag ctgaaggcga gacacctcat atgctgctga ggccccacgt gttcatgccc 3240
gaagtgaccc ctgacatgga ctacctgcca agagtgccca accagggcat catcatcaac 3300
cctatgctga gcgacgagac aaacatctgc aacggcaagc ccgtggacgg cctgaccaca 3360
ctgagaaatg gaaccctggt ggctttccgg ggccactact tttggatgct gagccctttc 3420
agccctccat ctcctgccag acggatcaca gaagtgtggg gcatcccttc tccaatcgac 3480
accgtgttca cccggtgcaa ctgcgagggc aagacattct tcttcaagga cagccagtat 3540
tggcggttca ccaacgacat caaggacgcc ggctatccca agccaatctt caaaggcttc 3600
ggaggcctga ccggccagat tgtggctgct ctgtctaccg ccaagtacaa gaactggccc 3660
gagagcgtgt acttctttaa gagaggcggc tccatccagc agtacatcta caagcaagag 3720
cccgtgcaga agtgccccgg aagaaggcca gctctgaatt accccgtgta cggcgagact 3780
acccaagtgc ggagaagaag attcgagaga gccatcggac ccagccagac acacaccatc 3840
agaatccagt acagccccgc cagactggcc taccaggata agggcgtgct gcacaacgaa 3900
gtgaaagtgt ccatcctgtg gcggggactg cccaatgtgg tcacaagcgc catcagcctg 3960
cctaacatca gaaagcccga cggctacgac tactacgcct ttagcaagga ccagtactac 4020
aacatcgacg tgcccagcag aaccgccaga gccatcacaa caagatccgg ccagacactg 4080
agcaaagtgt ggtacaactg tccttga 4107
<210> 68
<211> 1368
<212> PRT
<213> 人工序列
<220>
<223> 重组蛋白
<400> 68
Met Glu Thr Asp Thr Leu Leu Leu Trp Val Leu Leu Leu Trp Val Pro
1 5 10 15
Gly Ser Thr Gly Asp Gly Ser Gln Asp Leu Ser Ser Cys Ala Gly Arg
20 25 30
Cys Gly Glu Gly Tyr Ser Arg Asp Ala Thr Cys Asn Cys Asp Tyr Asn
35 40 45
Cys Gln His Tyr Met Glu Cys Cys Pro Asp Phe Lys Arg Val Cys Thr
50 55 60
Ala Glu Leu Ser Cys Lys Gly Arg Cys Phe Glu Ser Phe Glu Arg Gly
65 70 75 80
Arg Glu Cys Asp Cys Asp Ala Gln Cys Lys Lys Tyr Asp Lys Cys Cys
85 90 95
Pro Asp Tyr Glu Ser Phe Cys Ala Glu Val His Asn Pro Thr Ser Pro
100 105 110
Pro Ser Ser Lys Lys Ala Pro Pro Pro Ser Gly Ala Ser Gln Thr Ile
115 120 125
Lys Ser Thr Thr Lys Arg Ser Pro Lys Pro Pro Asn Lys Lys Lys Thr
130 135 140
Lys Lys Val Ile Glu Ser Glu Glu Ile Thr Glu Glu His Ser Val Ser
145 150 155 160
Glu Asn Gln Glu Ser Ser Ser Ser Ser Ser Ser Ser Ser Ser Ser Ser
165 170 175
Thr Ile Arg Lys Ile Lys Ser Ser Lys Asn Ser Ala Ala Asn Arg Glu
180 185 190
Leu Gln Lys Lys Leu Lys Val Lys Asp Asn Lys Lys Asn Arg Thr Lys
195 200 205
Lys Lys Pro Thr Pro Lys Pro Pro Val Val Asp Glu Ala Gly Ser Gly
210 215 220
Leu Asp Asn Gly Asp Phe Lys Val Thr Thr Pro Asp Thr Ser Thr Thr
225 230 235 240
Gln His Asn Lys Val Ser Thr Ser Pro Lys Ile Thr Thr Ala Lys Pro
245 250 255
Ile Asn Pro Arg Pro Ser Leu Pro Pro Asn Ser Asp Thr Ser Lys Glu
260 265 270
Thr Ser Leu Thr Val Asn Lys Glu Thr Thr Val Glu Thr Lys Glu Thr
275 280 285
Thr Thr Thr Asn Lys Gln Thr Ser Thr Asp Gly Lys Glu Lys Thr Thr
290 295 300
Ser Ala Lys Glu Thr Gln Ser Ile Glu Lys Thr Ser Ala Lys Asp Leu
305 310 315 320
Ala Pro Thr Ser Lys Val Leu Ala Lys Pro Thr Pro Lys Ala Glu Thr
325 330 335
Thr Thr Lys Gly Pro Ala Leu Thr Thr Pro Lys Glu Pro Ala Pro Thr
340 345 350
Thr Pro Lys Glu Pro Ala Pro Thr Thr Pro Lys Glu Pro Ala Pro Thr
355 360 365
Thr Pro Lys Glu Pro Ala Pro Thr Thr Pro Lys Glu Pro Ala Pro Thr
370 375 380
Thr Pro Lys Glu Pro Ala Pro Thr Thr Pro Lys Glu Pro Ala Pro Thr
385 390 395 400
Thr Pro Lys Glu Pro Ala Pro Thr Thr Pro Lys Glu Pro Ala Pro Thr
405 410 415
Thr Pro Lys Glu Pro Ala Pro Thr Thr Pro Lys Glu Pro Ala Pro Thr
420 425 430
Thr Pro Lys Glu Pro Ala Pro Thr Thr Pro Lys Glu Pro Ala Pro Thr
435 440 445
Thr Pro Lys Glu Pro Ala Pro Thr Thr Pro Lys Glu Pro Ala Pro Thr
450 455 460
Thr Pro Lys Glu Pro Ala Pro Thr Thr Pro Lys Glu Pro Ala Pro Thr
465 470 475 480
Thr Pro Lys Glu Pro Ala Pro Thr Thr Pro Lys Glu Pro Ala Pro Thr
485 490 495
Thr Pro Lys Glu Pro Ala Pro Thr Thr Pro Lys Glu Pro Ala Pro Thr
500 505 510
Thr Pro Lys Glu Pro Ala Pro Thr Thr Pro Lys Glu Pro Ala Pro Thr
515 520 525
Thr Pro Lys Glu Pro Ala Pro Thr Thr Pro Lys Glu Pro Ala Pro Thr
530 535 540
Thr Pro Lys Glu Pro Ala Pro Thr Thr Pro Lys Glu Pro Ala Pro Thr
545 550 555 560
Thr Pro Lys Glu Pro Ala Pro Thr Thr Pro Lys Glu Pro Ala Pro Thr
565 570 575
Thr Pro Lys Glu Pro Ala Pro Thr Thr Pro Lys Glu Pro Ala Pro Thr
580 585 590
Thr Pro Lys Glu Pro Ala Pro Thr Thr Pro Lys Glu Pro Ala Pro Thr
595 600 605
Thr Pro Lys Glu Pro Ala Pro Thr Thr Pro Lys Glu Pro Ala Pro Thr
610 615 620
Thr Pro Lys Glu Pro Ala Pro Thr Thr Pro Lys Glu Pro Ala Pro Thr
625 630 635 640
Thr Pro Lys Glu Pro Ala Pro Thr Thr Pro Lys Glu Pro Ala Pro Thr
645 650 655
Thr Pro Lys Glu Pro Ala Pro Thr Thr Pro Lys Glu Pro Ala Pro Thr
660 665 670
Thr Pro Lys Glu Pro Ala Pro Thr Thr Pro Lys Glu Pro Ala Pro Thr
675 680 685
Thr Pro Lys Glu Pro Ala Pro Thr Thr Pro Lys Glu Pro Ala Pro Thr
690 695 700
Thr Pro Lys Glu Pro Ala Pro Thr Thr Pro Lys Glu Pro Ala Pro Thr
705 710 715 720
Thr Pro Lys Glu Pro Ala Pro Thr Thr Pro Lys Glu Pro Ala Pro Thr
725 730 735
Thr Pro Lys Glu Pro Ala Pro Thr Thr Pro Lys Glu Pro Ala Pro Thr
740 745 750
Thr Pro Lys Glu Pro Ala Pro Thr Thr Pro Lys Glu Pro Ala Pro Thr
755 760 765
Thr Pro Lys Glu Pro Ala Pro Thr Thr Pro Lys Glu Pro Ala Pro Thr
770 775 780
Thr Pro Lys Glu Pro Ala Pro Thr Thr Pro Lys Glu Pro Ala Pro Thr
785 790 795 800
Thr Pro Lys Glu Pro Ala Pro Thr Thr Pro Lys Glu Pro Ala Pro Thr
805 810 815
Thr Pro Ser Glu Val Ser Thr Pro Thr Thr Thr Lys Glu Pro Thr Thr
820 825 830
Ile His Lys Ser Pro Asp Glu Ser Thr Pro Glu Leu Ser Ala Glu Pro
835 840 845
Thr Pro Lys Ala Leu Glu Asn Ser Pro Lys Glu Pro Gly Val Pro Thr
850 855 860
Thr Lys Thr Pro Ala Ala Thr Lys Pro Glu Met Thr Thr Thr Ala Lys
865 870 875 880
Asp Lys Thr Thr Glu Arg Asp Leu Arg Thr Thr Pro Glu Thr Thr Thr
885 890 895
Ala Ala Pro Lys Met Thr Lys Glu Thr Ala Thr Thr Thr Glu Lys Thr
900 905 910
Thr Glu Ser Lys Ile Thr Ala Thr Thr Thr Gln Val Thr Ser Thr Thr
915 920 925
Thr Gln Asp Thr Thr Pro Phe Lys Ile Thr Thr Leu Lys Thr Thr Thr
930 935 940
Leu Ala Pro Lys Val Thr Thr Thr Lys Lys Thr Ile Thr Thr Thr Glu
945 950 955 960
Ile Met Asn Lys Pro Glu Glu Thr Ala Lys Pro Lys Asp Arg Ala Thr
965 970 975
Asn Ser Lys Ala Thr Thr Pro Lys Pro Gln Lys Pro Thr Lys Ala Pro
980 985 990
Lys Lys Pro Thr Ser Thr Lys Lys Pro Lys Thr Met Pro Arg Val Arg
995 1000 1005
Lys Pro Lys Thr Thr Pro Thr Pro Arg Lys Met Thr Ser Thr Met
1010 1015 1020
Pro Glu Leu Asn Pro Thr Ser Arg Ile Ala Glu Ala Met Leu Gln
1025 1030 1035
Thr Thr Thr Arg Pro Asn Gln Thr Pro Asn Ser Lys Leu Val Glu
1040 1045 1050
Val Asn Pro Lys Ser Glu Asp Ala Gly Gly Ala Glu Gly Glu Thr
1055 1060 1065
Pro His Met Leu Leu Arg Pro His Val Phe Met Pro Glu Val Thr
1070 1075 1080
Pro Asp Met Asp Tyr Leu Pro Arg Val Pro Asn Gln Gly Ile Ile
1085 1090 1095
Ile Asn Pro Met Leu Ser Asp Glu Thr Asn Ile Cys Asn Gly Lys
1100 1105 1110
Pro Val Asp Gly Leu Thr Thr Leu Arg Asn Gly Thr Leu Val Ala
1115 1120 1125
Phe Arg Gly His Tyr Phe Trp Met Leu Ser Pro Phe Ser Pro Pro
1130 1135 1140
Ser Pro Ala Arg Arg Ile Thr Glu Val Trp Gly Ile Pro Ser Pro
1145 1150 1155
Ile Asp Thr Val Phe Thr Arg Cys Asn Cys Glu Gly Lys Thr Phe
1160 1165 1170
Phe Phe Lys Asp Ser Gln Tyr Trp Arg Phe Thr Asn Asp Ile Lys
1175 1180 1185
Asp Ala Gly Tyr Pro Lys Pro Ile Phe Lys Gly Phe Gly Gly Leu
1190 1195 1200
Thr Gly Gln Ile Val Ala Ala Leu Ser Thr Ala Lys Tyr Lys Asn
1205 1210 1215
Trp Pro Glu Ser Val Tyr Phe Phe Lys Arg Gly Gly Ser Ile Gln
1220 1225 1230
Gln Tyr Ile Tyr Lys Gln Glu Pro Val Gln Lys Cys Pro Gly Arg
1235 1240 1245
Arg Pro Ala Leu Asn Tyr Pro Val Tyr Gly Glu Thr Thr Gln Val
1250 1255 1260
Arg Arg Arg Arg Phe Glu Arg Ala Ile Gly Pro Ser Gln Thr His
1265 1270 1275
Thr Ile Arg Ile Gln Tyr Ser Pro Ala Arg Leu Ala Tyr Gln Asp
1280 1285 1290
Lys Gly Val Leu His Asn Glu Val Lys Val Ser Ile Leu Trp Arg
1295 1300 1305
Gly Leu Pro Asn Val Val Thr Ser Ala Ile Ser Leu Pro Asn Ile
1310 1315 1320
Arg Lys Pro Asp Gly Tyr Asp Tyr Tyr Ala Phe Ser Lys Asp Gln
1325 1330 1335
Tyr Tyr Asn Ile Asp Val Pro Ser Arg Thr Ala Arg Ala Ile Thr
1340 1345 1350
Thr Arg Ser Gly Gln Thr Leu Ser Lys Val Trp Tyr Asn Cys Pro
1355 1360 1365
<210> 69
<211> 3921
<212> DNA
<213> 人工序列
<220>
<223> cDNA
<400> 69
atgcaatgga agattctccc catatacttg ttgctgctca gtgtattcct catccaacaa 60
gtaagtagtc aagatctccc ttcttgtgca ggcaggtgtg gagaaggcta tagtcgggat 120
gcgatttgta attgtgatta taactgccaa cattacatgg agtgctgtcc ggactttaag 180
aaagcatgta cggtcgagct cagttgtaaa gggcgctgtt tcgaatcttt cgctagaggc 240
cgagaatgtg actgcgacag tgactgcaaa aagtacggaa agtgttgccc agattacgag 300
gacttttgcg ggagagtaca caaccctact tcaccacctt cttccaaaac tgcaccacct 360
tccccggggg cctctcagac aattaagtca acggccaaac gctcacccaa ggctccgaac 420
aaaaaaaaga ctaagaaggt aatagagagt gaggaaatca ccgaggagca ctctgtgtca 480
gaaaaccaag aaagttcttc atcatcaagc tcttcttcat ccactattcg caaaataaag 540
tcatctaaga actctgcggc gaataaagag cttaaaaaga agccaaaagt aaaggataat 600
aaaaaggagc gaacaccgaa gaaaaagcca ccacctgaac cccccgtagt tgatgaggcg 660
gggtcaggct tggacaatgg agacattaaa ttgacaccca cgcctgacat tcctacgact 720
caacgaaata aggttactac aagtcccaaa ttcaccacag gtaagcccat caacccaaaa 780
cctagtctcc caccgaacac cgatacgtca aaggagacgt catccactcc caacaaggaa 840
acaactgtca aaagtaaaga gacacttgct aacaaggaaa ccagcagtaa agcgaaggag 900
aaaattacgt ctgctaaaga gactcggtct gcggagaaga ccccagcgaa ggactttgtg 960
cctacgacga aagcccctgt caaatctact ccgaaggcgg aaagcactac taagggccct 1020
gctctgacaa cccctaagga gccagcaccc acaacgccga aggaaccagc gcccacgacc 1080
cctaaagaac cagctcctac aacgcccaag gaaccggcgc caacaacgcc taaggaaccg 1140
gcaccaacaa cacccaaaga gcccgccccc actactccta aagaaccggc tccaactaca 1200
ccgaaggaac ctgccccgac aaccccaaag gaaccagccc ctacaacccc taaagagcca 1260
gcgccaacca cgcccaaaga acctgcgccg actaccccga aagagccggc acccactacg 1320
cccaaagagc cggcccccac aaccccgaag gaaccggctc cgacgacacc aaaggagcct 1380
gcgcccacta cacccaagga gcctgcacca accactccca aggagccagc tcccacaaca 1440
ccaaaggaac ccgcgcccac cacgccaaaa gagccagcac ctacaacacc taaggaacct 1500
gctccaacca ccccaaagga gcccgcacct acgactccca aggaacccgc tccaacgacg 1560
cctaaggagc cggcacctac cactccaaag gagccagccc cgactactcc gaaggagcct 1620
gccccaacta ctcccaaaga gccagccccc acgactccta aggaaccagc accaacgaca 1680
ccgaaagaac ccgctcccac gacgccgaaa gaacctgccc ctacgacacc caaagaacca 1740
gccccaacaa ctcctaaaga gccggctccc actaccccta aggagccagc gcctacgacc 1800
ccaaaagagc ctgcaccgac aacgccaaag gaacctgcac ccaccacccc taaggaaccc 1860
gcaccaacta ccccaaaaga acctgcacct actactccaa aggaaccggc ccctaccacc 1920
cccaaggaac ctgcgccaac tacgccgaaa gagcccgcgc caacgactcc gaaagaacca 1980
gcgccgacaa ctccaaaaga gcccgctccg accacaccga aagagcctgc tcccaccaca 2040
ccaaaagaac cagcaccgac cactcctaag gagcctgctc ctactacgcc taaagaacct 2100
gctccgacta cacctaaaga acccgcgcct accacgccta aagagcctgc gcctacaact 2160
cccaaagaac ccgcaccgac tacgccaaaa gaaccggccc caacgacccc gaaagaaccg 2220
gcaccgacga ctccaaaaga acccgcccca accacaccta aagagcccgc acccacgaca 2280
cctaaggagc ccgctcctac cacacccaag gaaccagctc caacaacccc caaagagcct 2340
gcccccacca ctccgaagga acccgcccct actacaccaa aagagccggc gcctactacc 2400
cccaaagaac cggcgcccac aactccgaaa gagccagctc cgacaacacc gagcgaagtg 2460
acaacgacgg ctaaagataa aacgaccgag aaagacataa ttccagagat taccactgct 2520
gttcccaaga tcacaactca agaaactgct acgccaaccg aggagacgac tacggaatct 2580
aagacctcaa ctacgaccca agtcacttct actactagta gcaaaaacac tccaaaagcc 2640
acgaccctcg cgcccaaggt gatgacagca acacaaaaaa ccacgactac tgaagagacc 2700
atgaacaagc ccgaagagac gacggcagtg cctaaagata ctgcaacatc aacgaaggta 2760
agcaccccgc gaccccgaaa gccaaccaaa gcaccaaaga aacccgcaag tacaaagaaa 2820
cccaacacga tccctaaacg aaaaaaacca aaaactacac ctaccccgcc aaagatgact 2880
acgagcacta tgcctaaact ccatcctacc tcctccgttg aggcaatgct gcaaactaca 2940
acgtccccca atcaacgacc taattctgag atagtagagg tcaaccccaa cgaggatacg 3000
gacgcggctg gaaagaaacc ccatatgttc ccgcgacctc ctgttttgac ccccatattt 3060
atccctggaa ccgacattct tgtgcggggg tccaatcaag atattgccat aaatcccatg 3120
ctttccgacg agacaaatct ctgtaatgga aaacctgtcg acggattgac aaccctccga 3180
aatggtacta tggtggcgtt ccgcggccat tatttctgga tgttgagtcc ttccaaaccc 3240
ccgagtcctc cccggaagat tacagaggtt tggggcatcc cctctcccat agataccgtt 3300
tttacgcgat gcaattgtga gggtaaaaca ttcttcttca agggcagtca gtactggcga 3360
ttcactaacg acatcaagga cgcaggctac cccaaacaga tcgtcaaggg tttcggaggc 3420
ttgaatggtc gaattgtcgc tgccctgtct atagctaagt acaaggaccg gccagagtct 3480
gtctattttt tcaagcgcgg cggctcagtg caacaatata cttacaagca agagccgata 3540
aaaaaatgta cagggcgccg gccggcgatt aactaccctg tatatggtga gactacacaa 3600
gtgaggcgga gacgctttga gagggcgata ggcccttctc agacgcatac catccggata 3660
cactactccc ctattcgggt tagctaccag gacaagggtt tcttgcacaa tgaagtaaaa 3720
atgtccagtc aatggagagg tttcccgaac gttgttacct cagcaattgc gctgcctaac 3780
atcaggaagc ctgatggtta cgactattac gcgttttctc gcaatcaata ttataacatt 3840
gatgttccct cccgcactgc cagagttgtg actacaagat ttggacgaac cctctccaat 3900
atatggtaca attgccccta g 3921
<210> 70
<211> 1306
<212> PRT
<213> 人工序列
<220>
<223> 重组蛋白
<400> 70
Met Gln Trp Lys Ile Leu Pro Ile Tyr Leu Leu Leu Leu Ser Val Phe
1 5 10 15
Leu Ile Gln Gln Val Ser Ser Gln Asp Leu Pro Ser Cys Ala Gly Arg
20 25 30
Cys Gly Glu Gly Tyr Ser Arg Asp Ala Ile Cys Asn Cys Asp Tyr Asn
35 40 45
Cys Gln His Tyr Met Glu Cys Cys Pro Asp Phe Lys Lys Ala Cys Thr
50 55 60
Val Glu Leu Ser Cys Lys Gly Arg Cys Phe Glu Ser Phe Ala Arg Gly
65 70 75 80
Arg Glu Cys Asp Cys Asp Ser Asp Cys Lys Lys Tyr Gly Lys Cys Cys
85 90 95
Pro Asp Tyr Glu Asp Phe Cys Gly Arg Val His Asn Pro Thr Ser Pro
100 105 110
Pro Ser Ser Lys Thr Ala Pro Pro Ser Pro Gly Ala Ser Gln Thr Ile
115 120 125
Lys Ser Thr Ala Lys Arg Ser Pro Lys Ala Pro Asn Lys Lys Lys Thr
130 135 140
Lys Lys Val Ile Glu Ser Glu Glu Ile Thr Glu Glu His Ser Val Ser
145 150 155 160
Glu Asn Gln Glu Ser Ser Ser Ser Ser Ser Ser Ser Ser Ser Thr Ile
165 170 175
Arg Lys Ile Lys Ser Ser Lys Asn Ser Ala Ala Asn Lys Glu Leu Lys
180 185 190
Lys Lys Pro Lys Val Lys Asp Asn Lys Lys Glu Arg Thr Pro Lys Lys
195 200 205
Lys Pro Pro Pro Glu Pro Pro Val Val Asp Glu Ala Gly Ser Gly Leu
210 215 220
Asp Asn Gly Asp Ile Lys Leu Thr Pro Thr Pro Asp Ile Pro Thr Thr
225 230 235 240
Gln Arg Asn Lys Val Thr Thr Ser Pro Lys Phe Thr Thr Gly Lys Pro
245 250 255
Ile Asn Pro Lys Pro Ser Leu Pro Pro Asn Thr Asp Thr Ser Lys Glu
260 265 270
Thr Ser Ser Thr Pro Asn Lys Glu Thr Thr Val Lys Ser Lys Glu Thr
275 280 285
Leu Ala Asn Lys Glu Thr Ser Ser Lys Ala Lys Glu Lys Ile Thr Ser
290 295 300
Ala Lys Glu Thr Arg Ser Ala Glu Lys Thr Pro Ala Lys Asp Phe Val
305 310 315 320
Pro Thr Thr Lys Ala Pro Val Lys Ser Thr Pro Lys Ala Glu Ser Thr
325 330 335
Thr Lys Gly Pro Ala Leu Thr Thr Pro Lys Glu Pro Ala Pro Thr Thr
340 345 350
Pro Lys Glu Pro Ala Pro Thr Thr Pro Lys Glu Pro Ala Pro Thr Thr
355 360 365
Pro Lys Glu Pro Ala Pro Thr Thr Pro Lys Glu Pro Ala Pro Thr Thr
370 375 380
Pro Lys Glu Pro Ala Pro Thr Thr Pro Lys Glu Pro Ala Pro Thr Thr
385 390 395 400
Pro Lys Glu Pro Ala Pro Thr Thr Pro Lys Glu Pro Ala Pro Thr Thr
405 410 415
Pro Lys Glu Pro Ala Pro Thr Thr Pro Lys Glu Pro Ala Pro Thr Thr
420 425 430
Pro Lys Glu Pro Ala Pro Thr Thr Pro Lys Glu Pro Ala Pro Thr Thr
435 440 445
Pro Lys Glu Pro Ala Pro Thr Thr Pro Lys Glu Pro Ala Pro Thr Thr
450 455 460
Pro Lys Glu Pro Ala Pro Thr Thr Pro Lys Glu Pro Ala Pro Thr Thr
465 470 475 480
Pro Lys Glu Pro Ala Pro Thr Thr Pro Lys Glu Pro Ala Pro Thr Thr
485 490 495
Pro Lys Glu Pro Ala Pro Thr Thr Pro Lys Glu Pro Ala Pro Thr Thr
500 505 510
Pro Lys Glu Pro Ala Pro Thr Thr Pro Lys Glu Pro Ala Pro Thr Thr
515 520 525
Pro Lys Glu Pro Ala Pro Thr Thr Pro Lys Glu Pro Ala Pro Thr Thr
530 535 540
Pro Lys Glu Pro Ala Pro Thr Thr Pro Lys Glu Pro Ala Pro Thr Thr
545 550 555 560
Pro Lys Glu Pro Ala Pro Thr Thr Pro Lys Glu Pro Ala Pro Thr Thr
565 570 575
Pro Lys Glu Pro Ala Pro Thr Thr Pro Lys Glu Pro Ala Pro Thr Thr
580 585 590
Pro Lys Glu Pro Ala Pro Thr Thr Pro Lys Glu Pro Ala Pro Thr Thr
595 600 605
Pro Lys Glu Pro Ala Pro Thr Thr Pro Lys Glu Pro Ala Pro Thr Thr
610 615 620
Pro Lys Glu Pro Ala Pro Thr Thr Pro Lys Glu Pro Ala Pro Thr Thr
625 630 635 640
Pro Lys Glu Pro Ala Pro Thr Thr Pro Lys Glu Pro Ala Pro Thr Thr
645 650 655
Pro Lys Glu Pro Ala Pro Thr Thr Pro Lys Glu Pro Ala Pro Thr Thr
660 665 670
Pro Lys Glu Pro Ala Pro Thr Thr Pro Lys Glu Pro Ala Pro Thr Thr
675 680 685
Pro Lys Glu Pro Ala Pro Thr Thr Pro Lys Glu Pro Ala Pro Thr Thr
690 695 700
Pro Lys Glu Pro Ala Pro Thr Thr Pro Lys Glu Pro Ala Pro Thr Thr
705 710 715 720
Pro Lys Glu Pro Ala Pro Thr Thr Pro Lys Glu Pro Ala Pro Thr Thr
725 730 735
Pro Lys Glu Pro Ala Pro Thr Thr Pro Lys Glu Pro Ala Pro Thr Thr
740 745 750
Pro Lys Glu Pro Ala Pro Thr Thr Pro Lys Glu Pro Ala Pro Thr Thr
755 760 765
Pro Lys Glu Pro Ala Pro Thr Thr Pro Lys Glu Pro Ala Pro Thr Thr
770 775 780
Pro Lys Glu Pro Ala Pro Thr Thr Pro Lys Glu Pro Ala Pro Thr Thr
785 790 795 800
Pro Lys Glu Pro Ala Pro Thr Thr Pro Lys Glu Pro Ala Pro Thr Thr
805 810 815
Pro Ser Glu Val Thr Thr Thr Ala Lys Asp Lys Thr Thr Glu Lys Asp
820 825 830
Ile Ile Pro Glu Ile Thr Thr Ala Val Pro Lys Ile Thr Thr Gln Glu
835 840 845
Thr Ala Thr Pro Thr Glu Glu Thr Thr Thr Glu Ser Lys Thr Ser Thr
850 855 860
Thr Thr Gln Val Thr Ser Thr Thr Ser Ser Lys Asn Thr Pro Lys Ala
865 870 875 880
Thr Thr Leu Ala Pro Lys Val Met Thr Ala Thr Gln Lys Thr Thr Thr
885 890 895
Thr Glu Glu Thr Met Asn Lys Pro Glu Glu Thr Thr Ala Val Pro Lys
900 905 910
Asp Thr Ala Thr Ser Thr Lys Val Ser Thr Pro Arg Pro Arg Lys Pro
915 920 925
Thr Lys Ala Pro Lys Lys Pro Ala Ser Thr Lys Lys Pro Asn Thr Ile
930 935 940
Pro Lys Arg Lys Lys Pro Lys Thr Thr Pro Thr Pro Pro Lys Met Thr
945 950 955 960
Thr Ser Thr Met Pro Lys Leu His Pro Thr Ser Ser Val Glu Ala Met
965 970 975
Leu Gln Thr Thr Thr Ser Pro Asn Gln Arg Pro Asn Ser Glu Ile Val
980 985 990
Glu Val Asn Pro Asn Glu Asp Thr Asp Ala Ala Gly Lys Lys Pro His
995 1000 1005
Met Phe Pro Arg Pro Pro Val Leu Thr Pro Ile Phe Ile Pro Gly
1010 1015 1020
Thr Asp Ile Leu Val Arg Gly Ser Asn Gln Asp Ile Ala Ile Asn
1025 1030 1035
Pro Met Leu Ser Asp Glu Thr Asn Leu Cys Asn Gly Lys Pro Val
1040 1045 1050
Asp Gly Leu Thr Thr Leu Arg Asn Gly Thr Met Val Ala Phe Arg
1055 1060 1065
Gly His Tyr Phe Trp Met Leu Ser Pro Ser Lys Pro Pro Ser Pro
1070 1075 1080
Pro Arg Lys Ile Thr Glu Val Trp Gly Ile Pro Ser Pro Ile Asp
1085 1090 1095
Thr Val Phe Thr Arg Cys Asn Cys Glu Gly Lys Thr Phe Phe Phe
1100 1105 1110
Lys Gly Ser Gln Tyr Trp Arg Phe Thr Asn Asp Ile Lys Asp Ala
1115 1120 1125
Gly Tyr Pro Lys Gln Ile Val Lys Gly Phe Gly Gly Leu Asn Gly
1130 1135 1140
Arg Ile Val Ala Ala Leu Ser Ile Ala Lys Tyr Lys Asp Arg Pro
1145 1150 1155
Glu Ser Val Tyr Phe Phe Lys Arg Gly Gly Ser Val Gln Gln Tyr
1160 1165 1170
Thr Tyr Lys Gln Glu Pro Ile Lys Lys Cys Thr Gly Arg Arg Pro
1175 1180 1185
Ala Ile Asn Tyr Pro Val Tyr Gly Glu Thr Thr Gln Val Arg Arg
1190 1195 1200
Arg Arg Phe Glu Arg Ala Ile Gly Pro Ser Gln Thr His Thr Ile
1205 1210 1215
Arg Ile His Tyr Ser Pro Ile Arg Val Ser Tyr Gln Asp Lys Gly
1220 1225 1230
Phe Leu His Asn Glu Val Lys Met Ser Ser Gln Trp Arg Gly Phe
1235 1240 1245
Pro Asn Val Val Thr Ser Ala Ile Ala Leu Pro Asn Ile Arg Lys
1250 1255 1260
Pro Asp Gly Tyr Asp Tyr Tyr Ala Phe Ser Arg Asn Gln Tyr Tyr
1265 1270 1275
Asn Ile Asp Val Pro Ser Arg Thr Ala Arg Val Val Thr Thr Arg
1280 1285 1290
Phe Gly Arg Thr Leu Ser Asn Ile Trp Tyr Asn Cys Pro
1295 1300 1305
<210> 71
<211> 4113
<212> DNA
<213> 人工序列
<220>
<223> cDNA
<400> 71
atggagtgga aaatcctgcc tatttacctt ctcctgttgc tgagtatatt ctccatccag 60
gaggtttcaa gccaagacct ttctagttgc gctggtcggt gtggggaggg atactctcgg 120
gatgcgactt gcaactgcga ttttaattgt caatactaca tggaatgttg tccggacttt 180
aagaaagtct gtacatctga attgtcttgt aaaggccgct gtttcgagag tttcgaaagg 240
gggcgagaat gcgattgcga tgctgactgt aagaaatacg gtaagtgttg ttcagattat 300
gaaagcttct gcgaggaagt ccataatcct acgtctccgc cgagttccaa gacagctccc 360
ccgcctccag gggccagcca gactatcaag agtacagcta aacggtcacc aaagtcaaat 420
aagaaaaaaa ctaaaaaagt tatcgagagt gaagagatca tagaagaaca cagtgtgtcc 480
gagaatcagg agtcatcttc cagctctagc tcaagttcat ctaccatccg caaggttaag 540
tctagcaaaa actcagcagc gaacagagaa ctcaaaaaga agcctaaggt caaggattct 600
aaaaaaaaac gaaccccgaa aaaaaaaccg acgcctgagc caccagtcat agacgaggcc 660
gggagtggtt tggataacgg agacttcatg ttgattccca ccccgaaaat tccaaccacg 720
caaagaaata aggtgacgac atcaccaaag attacaacgg taaaaccaat taaccccaag 780
ccttcccttc ctcccaattc cgacacgtca aaagagacca ctagcacacc taataaagaa 840
actacggtcg agaccaagga gaccgagatc acaaacaagg agacttctac aagcgccaat 900
gaaaagacta cgagcgccag gaagagtaca gagaaaacat ccgacaaaga ttttgctccg 960
gccagcgaag tacctgcaaa aagtacccct aaggctgaaa ccaccacaaa gggccctgct 1020
ctgacaaccc ctaaggagcc agcacccaca acgccgaagg aaccagcgcc cacgacccct 1080
aaagaaccag ctcctacaac gcccaaggaa ccggcgccaa caacgcctaa ggaaccggca 1140
ccaacaacac ccaaagagcc cgcccccact actcctaaag aaccggctcc aactacaccg 1200
aaggaacctg ccccgacaac cccaaaggaa ccagccccta caacccctaa agagccagcg 1260
ccaaccacgc ccaaagaacc tgcgccgact accccgaaag agccggcacc cactacgccc 1320
aaagagccgg cccccacaac cccgaaggaa ccggctccga cgacaccaaa ggagcctgcg 1380
cccactacac ccaaggagcc tgcaccaacc actcccaagg agccagctcc cacaacacca 1440
aaggaacccg cgcccaccac gccaaaagag ccagcaccta caacacctaa ggaacctgct 1500
ccaaccaccc caaaggagcc cgcacctacg actcccaagg aacccgctcc aacgacgcct 1560
aaggagccgg cacctaccac tccaaaggag ccagccccga ctactccgaa ggagcctgcc 1620
ccaactactc ccaaagagcc agcccccacg actcctaagg aaccagcacc aacgacaccg 1680
aaagaacccg ctcccacgac gccgaaagaa cctgccccta cgacacccaa agaaccagcc 1740
ccaacaactc ctaaagagcc ggctcccact acccctaagg agccagcgcc tacgacccca 1800
aaagagcctg caccgacaac gccaaaggaa cctgcaccca ccacccctaa ggaacccgca 1860
ccaactaccc caaaagaacc tgcacctact actccaaagg aaccggcccc taccaccccc 1920
aaggaacctg cgccaactac gccgaaagag cccgcgccaa cgactccgaa agaaccagcg 1980
ccgacaactc caaaagagcc cgctccgacc acaccgaaag agcctgctcc caccacacca 2040
aaagaaccag caccgaccac tcctaaggag cctgctccta ctacgcctaa agaacctgct 2100
ccgactacac ctaaagaacc cgcgcctacc acgcctaaag agcctgcgcc tacaactccc 2160
aaagaacccg caccgactac gccaaaagaa ccggccccaa cgaccccgaa agaaccggca 2220
ccgacgactc caaaagaacc cgccccaacc acacctaaag agcccgcacc cacgacacct 2280
aaggagcccg ctcctaccac acccaaggaa ccagctccaa caacccccaa agagcctgcc 2340
cccaccactc cgaaggaacc cgcccctact acaccaaaag agccggcgcc tactaccccc 2400
aaagaaccgg cgcccacaac tccgaaagag ccagctccga caacaccgag cgaagtgtct 2460
accacgacga ctaccatgaa acctccgacg acacccaaaa atcttgctga aagcacccca 2520
gagttcccag cggagccaac acccaaagca ctggagaact cacccaaaga accggctgta 2580
ccgactacga aggcccctga agtaaccaaa ccagaagtca caacaaccgc taaagacaag 2640
gttacgggaa aggatattca cacgattccc gagataacta cagcggcacc taagataacg 2700
accgaaacgg ccacgacaac tgaagagaaa acaacggaaa gtaaggtgac ctctactata 2760
atgcaagtga cctccacgac cgaggatacg acgacaagct ccaagataac gcctaaagca 2820
acgacattgg caccgaaagt gatgaccgca acaaaaacta ccacaacaca ggaaacgata 2880
aacaagctgg aggagacgac ggctattcct aaggatacgg cgacgcacag caaagtgact 2940
acgccaaagc cgaagaagcc gaccaaagcg cctcgaaagc cgacatccac aaagaaaccg 3000
aaaacgccgc gcaagcgcaa accaaagaca acaccgattc ccccgaaaat caccaccccg 3060
accactccta aaagtaaccc tacgactttg gcggaagcca tgcttcagac tacaacttca 3120
cctaaccaga ctccaaattc cgctatgata gaggtcaacc cgaaaaacga ggacgcggac 3180
gctgcggaag gggaaaagcc gctcgtgata cttcgaccac acgtccttac tccaatcgtc 3240
ataccgggtc cggactttct tgtccgcggt ccaaacttgg gaatcggaat taaccccatg 3300
cttagcgacg agacgaactt gtgtaacggt aaaccagtgg acggactcac caccctgaga 3360
aatggaactc tcgtggcttt caggggccac tatttctgga tgctccgacc atttagtccc 3420
ccgagtccgc cgaggagaat caccgaggta tgggggattc cctctcctat tgataccgtc 3480
ttcactcgct gcaactgcga gggaaagaca tttttcttca aggactcaca gtattggcga 3540
ttcaccaacg acataaagga tgctggatac cctaaattga ttagcaaggg ctttgggggg 3600
cttagtggca aaatcgtggc cgctctttca atagcaacgt acaagaacag gccagagagc 3660
gtttattttt ttaagcgagg ggggcgaata cagcaataca tctacaagca agaacccata 3720
agaaagtgtc caggacgccg accagctata cattattcag tttacggaga ggctcctcag 3780
attcggagga gaaggttcga acgggccata ggcccgtctc agacgcacac catccgcatt 3840
cactactccc ccgtacgcgt atcataccaa gacaaagtgc cgtccactga ctttctccac 3900
aacgaggtca aagtaagcac cctgtggcgc ggacttccag acaccgttac atccgccatt 3960
tcccttccta acttgcggaa accagacgga tacgactatt atgctttttc aaaagaccaa 4020
tattataata ttgacgtccc gagccgaact gctcgcgcaa taactacccg aagtggccag 4080
acattgagta aggtctggta taactgtccc tag 4113
<210> 72
<211> 24
<212> PRT
<213> 智人
<400> 72
Met Ala Trp Lys Thr Leu Pro Ile Tyr Leu Leu Leu Leu Leu Ser Val
1 5 10 15
Phe Val Ile Gln Gln Val Ser Ser
20
<210> 73
<211> 22
<212> PRT
<213> 家犬
<400> 73
Met Gln Trp Lys Ile Leu Pro Ile Tyr Leu Leu Leu Leu Ser Val Phe
1 5 10 15
Leu Ile Gln Gln Val Ser
20
<210> 74
<211> 24
<212> PRT
<213> 家马
<400> 74
Met Glu Trp Lys Ile Leu Pro Ile Tyr Leu Leu Leu Leu Leu Ser Ile
1 5 10 15
Phe Ser Ile Gln Glu Val Ser Ser
20
<210> 75
<211> 323
<212> PRT
<213> 智人
<400> 75
Gln Asp Leu Ser Ser Cys Ala Gly Arg Cys Gly Glu Gly Tyr Ser Arg
1 5 10 15
Asp Ala Thr Cys Asn Cys Asp Tyr Asn Cys Gln His Tyr Met Glu Cys
20 25 30
Cys Pro Asp Phe Lys Arg Val Cys Thr Ala Glu Leu Ser Cys Lys Gly
35 40 45
Arg Cys Phe Glu Ser Phe Glu Arg Gly Arg Glu Cys Asp Cys Asp Ala
50 55 60
Gln Cys Lys Lys Tyr Asp Lys Cys Cys Pro Asp Tyr Glu Ser Phe Cys
65 70 75 80
Ala Glu Val His Asn Pro Thr Ser Pro Pro Ser Ser Lys Lys Ala Pro
85 90 95
Pro Pro Ser Gly Ala Ser Gln Thr Ile Lys Ser Thr Thr Lys Arg Ser
100 105 110
Pro Lys Pro Pro Asn Lys Lys Lys Thr Lys Lys Val Ile Glu Ser Glu
115 120 125
Glu Ile Thr Glu Glu His Ser Val Ser Glu Asn Gln Glu Ser Ser Ser
130 135 140
Ser Ser Ser Ser Ser Ser Ser Ser Ser Thr Ile Arg Lys Ile Lys Ser
145 150 155 160
Ser Lys Asn Ser Ala Ala Asn Arg Glu Leu Gln Lys Lys Leu Lys Val
165 170 175
Lys Asp Asn Lys Lys Asn Arg Thr Lys Lys Lys Pro Thr Pro Lys Pro
180 185 190
Pro Val Val Asp Glu Ala Gly Ser Gly Leu Asp Asn Gly Asp Phe Lys
195 200 205
Val Thr Thr Pro Asp Thr Ser Thr Thr Gln His Asn Lys Val Ser Thr
210 215 220
Ser Pro Lys Ile Thr Thr Ala Lys Pro Ile Asn Pro Arg Pro Ser Leu
225 230 235 240
Pro Pro Asn Ser Asp Thr Ser Lys Glu Thr Ser Leu Thr Val Asn Lys
245 250 255
Glu Thr Thr Val Glu Thr Lys Glu Thr Thr Thr Thr Asn Lys Gln Thr
260 265 270
Ser Thr Asp Gly Lys Glu Lys Thr Thr Ser Ala Lys Glu Thr Gln Ser
275 280 285
Ile Glu Lys Thr Ser Ala Lys Asp Leu Ala Pro Thr Ser Lys Val Leu
290 295 300
Ala Lys Pro Thr Pro Lys Ala Glu Thr Thr Thr Lys Gly Pro Ala Leu
305 310 315 320
Thr Thr Pro
<210> 76
<211> 550
<212> PRT
<213> 智人
<400> 76
Ser Glu Val Ser Thr Pro Thr Thr Thr Lys Glu Pro Thr Thr Ile His
1 5 10 15
Lys Ser Pro Asp Glu Ser Thr Pro Glu Leu Ser Ala Glu Pro Thr Pro
20 25 30
Lys Ala Leu Glu Asn Ser Pro Lys Glu Pro Gly Val Pro Thr Thr Lys
35 40 45
Thr Pro Ala Ala Thr Lys Pro Glu Met Thr Thr Thr Ala Lys Asp Lys
50 55 60
Thr Thr Glu Arg Asp Leu Arg Thr Thr Pro Glu Thr Thr Thr Ala Ala
65 70 75 80
Pro Lys Met Thr Lys Glu Thr Ala Thr Thr Thr Glu Lys Thr Thr Glu
85 90 95
Ser Lys Ile Thr Ala Thr Thr Thr Gln Val Thr Ser Thr Thr Thr Gln
100 105 110
Asp Thr Thr Pro Phe Lys Ile Thr Thr Leu Lys Thr Thr Thr Leu Ala
115 120 125
Pro Lys Val Thr Thr Thr Lys Lys Thr Ile Thr Thr Thr Glu Ile Met
130 135 140
Asn Lys Pro Glu Glu Thr Ala Lys Pro Lys Asp Arg Ala Thr Asn Ser
145 150 155 160
Lys Ala Thr Thr Pro Lys Pro Gln Lys Pro Thr Lys Ala Pro Lys Lys
165 170 175
Pro Thr Ser Thr Lys Lys Pro Lys Thr Met Pro Arg Val Arg Lys Pro
180 185 190
Lys Thr Thr Pro Thr Pro Arg Lys Met Thr Ser Thr Met Pro Glu Leu
195 200 205
Asn Pro Thr Ser Arg Ile Ala Glu Ala Met Leu Gln Thr Thr Thr Arg
210 215 220
Pro Asn Gln Thr Pro Asn Ser Lys Leu Val Glu Val Asn Pro Lys Ser
225 230 235 240
Glu Asp Ala Gly Gly Ala Glu Gly Glu Thr Pro His Met Leu Leu Arg
245 250 255
Pro His Val Phe Met Pro Glu Val Thr Pro Asp Met Asp Tyr Leu Pro
260 265 270
Arg Val Pro Asn Gln Gly Ile Ile Ile Asn Pro Met Leu Ser Asp Glu
275 280 285
Thr Asn Ile Cys Asn Gly Lys Pro Val Asp Gly Leu Thr Thr Leu Arg
290 295 300
Asn Gly Thr Leu Val Ala Phe Arg Gly His Tyr Phe Trp Met Leu Ser
305 310 315 320
Pro Phe Ser Pro Pro Ser Pro Ala Arg Arg Ile Thr Glu Val Trp Gly
325 330 335
Ile Pro Ser Pro Ile Asp Thr Val Phe Thr Arg Cys Asn Cys Glu Gly
340 345 350
Lys Thr Phe Phe Phe Lys Asp Ser Gln Tyr Trp Arg Phe Thr Asn Asp
355 360 365
Ile Lys Asp Ala Gly Tyr Pro Lys Pro Ile Phe Lys Gly Phe Gly Gly
370 375 380
Leu Thr Gly Gln Ile Val Ala Ala Leu Ser Thr Ala Lys Tyr Lys Asn
385 390 395 400
Trp Pro Glu Ser Val Tyr Phe Phe Lys Arg Gly Gly Ser Ile Gln Gln
405 410 415
Tyr Ile Tyr Lys Gln Glu Pro Val Gln Lys Cys Pro Gly Arg Arg Pro
420 425 430
Ala Leu Asn Tyr Pro Val Tyr Gly Glu Thr Thr Gln Val Arg Arg Arg
435 440 445
Arg Phe Glu Arg Ala Ile Gly Pro Ser Gln Thr His Thr Ile Arg Ile
450 455 460
Gln Tyr Ser Pro Ala Arg Leu Ala Tyr Gln Asp Lys Gly Val Leu His
465 470 475 480
Asn Glu Val Lys Val Ser Ile Leu Trp Arg Gly Leu Pro Asn Val Val
485 490 495
Thr Ser Ala Ile Ser Leu Pro Asn Ile Arg Lys Pro Asp Gly Tyr Asp
500 505 510
Tyr Tyr Ala Phe Ser Lys Asp Gln Tyr Tyr Asn Ile Asp Val Pro Ser
515 520 525
Arg Thr Ala Arg Ala Ile Thr Thr Arg Ser Gly Gln Thr Leu Ser Lys
530 535 540
Val Trp Tyr Asn Cys Pro
545 550
<210> 77
<211> 322
<212> PRT
<213> 家犬
<400> 77
Gln Asp Leu Pro Ser Cys Ala Gly Arg Cys Gly Glu Gly Tyr Ser Arg
1 5 10 15
Asp Ala Ile Cys Asn Cys Asp Tyr Asn Cys Gln His Tyr Met Glu Cys
20 25 30
Cys Pro Asp Phe Lys Lys Ala Cys Thr Val Glu Leu Ser Cys Lys Gly
35 40 45
Arg Cys Phe Glu Ser Phe Ala Arg Gly Arg Glu Cys Asp Cys Asp Ser
50 55 60
Asp Cys Lys Lys Tyr Gly Lys Cys Cys Pro Asp Tyr Glu Asp Phe Cys
65 70 75 80
Gly Arg Val His Asn Pro Thr Ser Pro Pro Ser Ser Lys Thr Ala Pro
85 90 95
Pro Ser Pro Gly Ala Ser Gln Thr Ile Lys Ser Thr Ala Lys Arg Ser
100 105 110
Pro Lys Ala Pro Asn Lys Lys Lys Thr Lys Lys Val Ile Glu Ser Glu
115 120 125
Glu Ile Thr Glu Glu His Ser Val Ser Glu Asn Gln Glu Ser Ser Ser
130 135 140
Ser Ser Ser Ser Ser Ser Ser Thr Ile Arg Lys Ile Lys Ser Ser Lys
145 150 155 160
Asn Ser Ala Ala Asn Lys Glu Leu Lys Lys Lys Pro Lys Val Lys Asp
165 170 175
Asn Lys Lys Glu Arg Thr Pro Lys Lys Lys Pro Pro Pro Glu Pro Pro
180 185 190
Val Val Asp Glu Ala Gly Ser Gly Leu Asp Asn Gly Asp Ile Lys Leu
195 200 205
Thr Pro Thr Pro Asp Ile Pro Thr Thr Gln Arg Asn Lys Val Thr Thr
210 215 220
Ser Pro Lys Phe Thr Thr Gly Lys Pro Ile Asn Pro Lys Pro Ser Leu
225 230 235 240
Pro Pro Asn Thr Asp Thr Ser Lys Glu Thr Ser Ser Thr Pro Asn Lys
245 250 255
Glu Thr Thr Val Lys Ser Lys Glu Thr Leu Ala Asn Lys Glu Thr Ser
260 265 270
Ser Lys Ala Lys Glu Lys Ile Thr Ser Ala Lys Glu Thr Arg Ser Ala
275 280 285
Glu Lys Thr Pro Ala Lys Asp Phe Val Pro Thr Thr Lys Ala Pro Val
290 295 300
Lys Ser Thr Pro Lys Ala Glu Ser Thr Thr Lys Gly Pro Ala Leu Thr
305 310 315 320
Thr Pro
<210> 78
<211> 488
<212> PRT
<213> 家犬
<400> 78
Ser Glu Val Thr Thr Thr Ala Lys Asp Lys Thr Thr Glu Lys Asp Ile
1 5 10 15
Ile Pro Glu Ile Thr Thr Ala Val Pro Lys Ile Thr Thr Gln Glu Thr
20 25 30
Ala Thr Pro Thr Glu Glu Thr Thr Thr Glu Ser Lys Thr Ser Thr Thr
35 40 45
Thr Gln Val Thr Ser Thr Thr Ser Ser Lys Asn Thr Pro Lys Ala Thr
50 55 60
Thr Leu Ala Pro Lys Val Met Thr Ala Thr Gln Lys Thr Thr Thr Thr
65 70 75 80
Glu Glu Thr Met Asn Lys Pro Glu Glu Thr Thr Ala Val Pro Lys Asp
85 90 95
Thr Ala Thr Ser Thr Lys Val Ser Thr Pro Arg Pro Arg Lys Pro Thr
100 105 110
Lys Ala Pro Lys Lys Pro Ala Ser Thr Lys Lys Pro Asn Thr Ile Pro
115 120 125
Lys Arg Lys Lys Pro Lys Thr Thr Pro Thr Pro Pro Lys Met Thr Thr
130 135 140
Ser Thr Met Pro Lys Leu His Pro Thr Ser Ser Val Glu Ala Met Leu
145 150 155 160
Gln Thr Thr Thr Ser Pro Asn Gln Arg Pro Asn Ser Glu Ile Val Glu
165 170 175
Val Asn Pro Asn Glu Asp Thr Asp Ala Ala Gly Lys Lys Pro His Met
180 185 190
Phe Pro Arg Pro Pro Val Leu Thr Pro Ile Phe Ile Pro Gly Thr Asp
195 200 205
Ile Leu Val Arg Gly Ser Asn Gln Asp Ile Ala Ile Asn Pro Met Leu
210 215 220
Ser Asp Glu Thr Asn Leu Cys Asn Gly Lys Pro Val Asp Gly Leu Thr
225 230 235 240
Thr Leu Arg Asn Gly Thr Met Val Ala Phe Arg Gly His Tyr Phe Trp
245 250 255
Met Leu Ser Pro Ser Lys Pro Pro Ser Pro Pro Arg Lys Ile Thr Glu
260 265 270
Val Trp Gly Ile Pro Ser Pro Ile Asp Thr Val Phe Thr Arg Cys Asn
275 280 285
Cys Glu Gly Lys Thr Phe Phe Phe Lys Gly Ser Gln Tyr Trp Arg Phe
290 295 300
Thr Asn Asp Ile Lys Asp Ala Gly Tyr Pro Lys Gln Ile Val Lys Gly
305 310 315 320
Phe Gly Gly Leu Asn Gly Arg Ile Val Ala Ala Leu Ser Ile Ala Lys
325 330 335
Tyr Lys Asp Arg Pro Glu Ser Val Tyr Phe Phe Lys Arg Gly Gly Ser
340 345 350
Val Gln Gln Tyr Thr Tyr Lys Gln Glu Pro Ile Lys Lys Cys Thr Gly
355 360 365
Arg Arg Pro Ala Ile Asn Tyr Pro Val Tyr Gly Glu Thr Thr Gln Val
370 375 380
Arg Arg Arg Arg Phe Glu Arg Ala Ile Gly Pro Ser Gln Thr His Thr
385 390 395 400
Ile Arg Ile His Tyr Ser Pro Ile Arg Val Ser Tyr Gln Asp Lys Gly
405 410 415
Phe Leu His Asn Glu Val Lys Met Ser Ser Gln Trp Arg Gly Phe Pro
420 425 430
Asn Val Val Thr Ser Ala Ile Ala Leu Pro Asn Ile Arg Lys Pro Asp
435 440 445
Gly Tyr Asp Tyr Tyr Ala Phe Ser Arg Asn Gln Tyr Tyr Asn Ile Asp
450 455 460
Val Pro Ser Arg Thr Ala Arg Val Val Thr Thr Arg Phe Gly Arg Thr
465 470 475 480
Leu Ser Asn Ile Trp Tyr Asn Cys
485
<210> 79
<211> 320
<212> PRT
<213> 家马
<400> 79
Gln Asp Leu Ser Ser Cys Ala Gly Arg Cys Gly Glu Gly Tyr Ser Arg
1 5 10 15
Asp Ala Thr Cys Asn Cys Asp Phe Asn Cys Gln Tyr Tyr Met Glu Cys
20 25 30
Cys Pro Asp Phe Lys Lys Val Cys Thr Ser Glu Leu Ser Cys Lys Gly
35 40 45
Arg Cys Phe Glu Ser Phe Glu Arg Gly Arg Glu Cys Asp Cys Asp Ala
50 55 60
Asp Cys Lys Lys Tyr Gly Lys Cys Cys Ser Asp Tyr Glu Ser Phe Cys
65 70 75 80
Glu Glu Val His Asn Pro Thr Ser Pro Pro Ser Ser Lys Thr Ala Pro
85 90 95
Pro Pro Pro Gly Ala Ser Gln Thr Ile Lys Ser Thr Ala Lys Arg Ser
100 105 110
Pro Lys Ser Asn Lys Lys Lys Thr Lys Lys Val Ile Glu Ser Glu Glu
115 120 125
Ile Ile Glu Glu His Ser Val Ser Glu Asn Gln Glu Ser Ser Ser Ser
130 135 140
Ser Ser Ser Ser Ser Ser Thr Ile Arg Lys Val Lys Ser Ser Lys Asn
145 150 155 160
Ser Ala Ala Asn Arg Glu Leu Lys Lys Lys Pro Lys Val Lys Asp Ser
165 170 175
Lys Lys Lys Arg Thr Pro Lys Lys Lys Pro Thr Pro Glu Pro Pro Val
180 185 190
Ile Asp Glu Ala Gly Ser Gly Leu Asp Asn Gly Asp Phe Met Leu Ile
195 200 205
Pro Thr Pro Lys Ile Pro Thr Thr Gln Arg Asn Lys Val Thr Thr Ser
210 215 220
Pro Lys Ile Thr Thr Val Lys Pro Ile Asn Pro Lys Pro Ser Leu Pro
225 230 235 240
Pro Asn Ser Asp Thr Ser Lys Glu Thr Thr Ser Thr Pro Asn Lys Glu
245 250 255
Thr Thr Val Glu Thr Lys Glu Thr Glu Ile Thr Asn Lys Glu Thr Ser
260 265 270
Thr Ser Ala Asn Glu Lys Thr Thr Ser Ala Arg Lys Ser Thr Glu Lys
275 280 285
Thr Ser Asp Lys Asp Phe Ala Pro Ala Ser Glu Val Pro Ala Lys Ser
290 295 300
Thr Pro Lys Ala Glu Thr Thr Thr Lys Gly Pro Ala Leu Thr Thr Pro
305 310 315 320
<210> 80
<211> 554
<212> PRT
<213> 家马
<400> 80
Ser Glu Val Ser Thr Thr Thr Thr Thr Met Lys Pro Pro Thr Thr Pro
1 5 10 15
Lys Asn Leu Ala Glu Ser Thr Pro Glu Phe Pro Ala Glu Pro Thr Pro
20 25 30
Lys Ala Leu Glu Asn Ser Pro Lys Glu Pro Ala Val Pro Thr Thr Lys
35 40 45
Ala Pro Glu Val Thr Lys Pro Glu Val Thr Thr Thr Ala Lys Asp Lys
50 55 60
Val Thr Gly Lys Asp Ile His Thr Ile Pro Glu Ile Thr Thr Ala Ala
65 70 75 80
Pro Lys Ile Thr Thr Glu Thr Ala Thr Thr Thr Glu Glu Lys Thr Thr
85 90 95
Glu Ser Lys Val Thr Ser Thr Ile Met Gln Val Thr Ser Thr Thr Glu
100 105 110
Asp Thr Thr Thr Ser Ser Lys Ile Thr Pro Lys Ala Thr Thr Leu Ala
115 120 125
Pro Lys Val Met Thr Ala Thr Lys Thr Thr Thr Thr Gln Glu Thr Ile
130 135 140
Asn Lys Leu Glu Glu Thr Thr Ala Ile Pro Lys Asp Thr Ala Thr His
145 150 155 160
Ser Lys Val Thr Thr Pro Lys Pro Lys Lys Pro Thr Lys Ala Pro Arg
165 170 175
Lys Pro Thr Ser Thr Lys Lys Pro Lys Thr Pro Arg Lys Arg Lys Pro
180 185 190
Lys Thr Thr Pro Ile Pro Pro Lys Ile Thr Thr Pro Thr Thr Pro Lys
195 200 205
Ser Asn Pro Thr Thr Leu Ala Glu Ala Met Leu Gln Thr Thr Thr Ser
210 215 220
Pro Asn Gln Thr Pro Asn Ser Ala Met Ile Glu Val Asn Pro Lys Asn
225 230 235 240
Glu Asp Ala Asp Ala Ala Glu Gly Glu Lys Pro Leu Val Ile Leu Arg
245 250 255
Pro His Val Leu Thr Pro Ile Val Ile Pro Gly Pro Asp Phe Leu Val
260 265 270
Arg Gly Pro Asn Leu Gly Ile Gly Ile Asn Pro Met Leu Ser Asp Glu
275 280 285
Thr Asn Leu Cys Asn Gly Lys Pro Val Asp Gly Leu Thr Thr Leu Arg
290 295 300
Asn Gly Thr Leu Val Ala Phe Arg Gly His Tyr Phe Trp Met Leu Arg
305 310 315 320
Pro Phe Ser Pro Pro Ser Pro Pro Arg Arg Ile Thr Glu Val Trp Gly
325 330 335
Ile Pro Ser Pro Ile Asp Thr Val Phe Thr Arg Cys Asn Cys Glu Gly
340 345 350
Lys Thr Phe Phe Phe Lys Asp Ser Gln Tyr Trp Arg Phe Thr Asn Asp
355 360 365
Ile Lys Asp Ala Gly Tyr Pro Lys Leu Ile Ser Lys Gly Phe Gly Gly
370 375 380
Leu Ser Gly Lys Ile Val Ala Ala Leu Ser Ile Ala Thr Tyr Lys Asn
385 390 395 400
Arg Pro Glu Ser Val Tyr Phe Phe Lys Arg Gly Gly Arg Ile Gln Gln
405 410 415
Tyr Ile Tyr Lys Gln Glu Pro Ile Arg Lys Cys Pro Gly Arg Arg Pro
420 425 430
Ala Ile His Tyr Ser Val Tyr Gly Glu Ala Pro Gln Ile Arg Arg Arg
435 440 445
Arg Phe Glu Arg Ala Ile Gly Pro Ser Gln Thr His Thr Ile Arg Ile
450 455 460
His Tyr Ser Pro Val Arg Val Ser Tyr Gln Asp Lys Val Pro Ser Thr
465 470 475 480
Asp Phe Leu His Asn Glu Val Lys Val Ser Thr Leu Trp Arg Gly Leu
485 490 495
Pro Asp Thr Val Thr Ser Ala Ile Ser Leu Pro Asn Leu Arg Lys Pro
500 505 510
Asp Gly Tyr Asp Tyr Tyr Ala Phe Ser Lys Asp Gln Tyr Tyr Asn Ile
515 520 525
Asp Val Pro Ser Arg Thr Ala Arg Ala Ile Thr Thr Arg Ser Gly Gln
530 535 540
Thr Leu Ser Lys Val Trp Tyr Asn Cys Pro
545 550
<210> 81
<211> 21
<212> PRT
<213> 人工序列
<220>
<223> 重组分泌信号
<400> 81
Met Glu Thr Asp Thr Leu Leu Leu Trp Val Leu Leu Leu Trp Val Pro
1 5 10 15
Gly Ser Thr Gly Asp
20
<210> 82
<211> 23
<212> PRT
<213> 人工序列
<220>
<223> 重组分泌信号
<400> 82
Met Gln Trp Lys Ile Leu Pro Ile Tyr Leu Leu Leu Leu Ser Val Phe
1 5 10 15
Leu Ile Gln Gln Val Ser Ser
20
<210> 83
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> 改变的犬序列
<400> 83
Ser Pro Ala Pro Thr Thr Pro
1 5
<210> 84
<211> 6
<212> PRT
<213> 人工序列
<220>
<223> 修饰的马序列
<400> 84
Ser Pro Ser Leu Thr Thr
1 5
<210> 85
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 85
atgacaccgg gcacccagtc 20
<210> 86
<211> 25
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 86
ctacatactt cgtcggcgca tgtac 25
<210> 87
<211> 8
<212> PRT
<213> 人工序列
<220>
<223> 共有序列
<220>
<221> misc_feature
<222> (2)..(2)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> misc_feature
<222> (4)..(4)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> misc_feature
<222> (8)..(8)
<223> Xaa可以是任何天然存在的氨基酸
<400> 87
Lys Xaa Pro Xaa Pro Thr Thr Xaa
1 5
<210> 88
<211> 33
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 88
ggcacctcga ggatgccggt gcagctgacg aca 33
<210> 89
<211> 34
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 89
ggcagaattc ttacacctca gcaaaagcca agct 34
<210> 90
<211> 37
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 90
ggcagctcag ctatggtgtc caagggcgag gagctgt 37
<210> 91
<211> 39
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 91
ggcagctgag cccttataca gctcgtccat gccgtgagt 39
<210> 92
<211> 27
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 92
tggaggagcc tcaggcatac tttattg 27
<210> 93
<211> 26
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 93
ccaccgccga ccgaggtgac atcctg 26
<210> 94
<211> 37
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 94
gttgcgactg cttaacggac agatctcgat ggtgagc 37
<210> 95
<211> 39
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 95
agccagctca gggaatcccc agcattcttc tcagtagag 39
<210> 96
<211> 41
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 96
tcaggccacc accaccatca ccatcatcac caccattagg g 41
<210> 97
<211> 42
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 97
ccggtggtgg tggtagtggt agtagtggtg gtaatccctt aa 42
<210> 98
<211> 1369
<212> PRT
<213> 人工序列
<220>
<223> 重组马SynLubricin
<400> 98
Glu Trp Lys Ile Leu Pro Ile Tyr Leu Leu Leu Leu Leu Ser Ile Phe
1 5 10 15
Ser Ile Gln Glu Val Ser Ser Gln Asp Leu Ser Ser Cys Ala Gly Arg
20 25 30
Cys Gly Glu Gly Tyr Ser Arg Asp Ala Thr Cys Asn Cys Asp Phe Asn
35 40 45
Cys Gln Tyr Tyr Met Glu Cys Cys Pro Asp Phe Lys Lys Val Cys Thr
50 55 60
Ser Glu Leu Ser Cys Lys Gly Arg Cys Phe Glu Ser Phe Glu Arg Gly
65 70 75 80
Arg Glu Cys Asp Cys Asp Ala Asp Cys Lys Lys Tyr Gly Lys Cys Cys
85 90 95
Ser Asp Tyr Glu Ser Phe Cys Glu Glu Val His Asn Pro Thr Ser Pro
100 105 110
Pro Ser Ser Lys Thr Ala Pro Pro Pro Pro Gly Ala Ser Gln Thr Ile
115 120 125
Lys Ser Thr Ala Lys Arg Ser Pro Lys Ser Asn Lys Lys Lys Thr Lys
130 135 140
Lys Val Ile Glu Ser Glu Glu Ile Ile Glu Glu His Ser Val Ser Glu
145 150 155 160
Asn Gln Glu Ser Ser Ser Ser Ser Ser Ser Ser Ser Ser Thr Ile Arg
165 170 175
Lys Val Lys Ser Ser Lys Asn Ser Ala Ala Asn Arg Glu Leu Lys Lys
180 185 190
Lys Pro Lys Val Lys Asp Ser Lys Lys Lys Arg Thr Pro Lys Lys Lys
195 200 205
Pro Thr Pro Glu Pro Pro Val Ile Asp Glu Ala Gly Ser Gly Leu Asp
210 215 220
Asn Gly Asp Phe Met Leu Ile Pro Thr Pro Lys Ile Pro Thr Thr Gln
225 230 235 240
Arg Asn Lys Val Thr Thr Ser Pro Lys Ile Thr Thr Val Lys Pro Ile
245 250 255
Asn Pro Lys Pro Ser Leu Pro Pro Asn Ser Asp Thr Ser Lys Glu Thr
260 265 270
Thr Ser Thr Pro Asn Lys Glu Thr Thr Val Glu Thr Lys Glu Thr Glu
275 280 285
Ile Thr Asn Lys Glu Thr Ser Thr Ser Ala Asn Glu Lys Thr Thr Ser
290 295 300
Ala Arg Lys Ser Thr Glu Lys Thr Ser Asp Lys Asp Phe Ala Pro Ala
305 310 315 320
Ser Glu Val Pro Ala Lys Ser Thr Pro Lys Ala Glu Thr Thr Thr Lys
325 330 335
Gly Pro Ala Leu Thr Thr Pro Lys Glu Pro Ala Pro Thr Thr Pro Lys
340 345 350
Glu Pro Ala Pro Thr Thr Pro Lys Glu Pro Ala Pro Thr Thr Pro Lys
355 360 365
Glu Pro Ala Pro Thr Thr Pro Lys Glu Pro Ala Pro Thr Thr Pro Lys
370 375 380
Glu Pro Ala Pro Thr Thr Pro Lys Glu Pro Ala Pro Thr Thr Pro Lys
385 390 395 400
Glu Pro Ala Pro Thr Thr Pro Lys Glu Pro Ala Pro Thr Thr Pro Lys
405 410 415
Glu Pro Ala Pro Thr Thr Pro Lys Glu Pro Ala Pro Thr Thr Pro Lys
420 425 430
Glu Pro Ala Pro Thr Thr Pro Lys Glu Pro Ala Pro Thr Thr Pro Lys
435 440 445
Glu Pro Ala Pro Thr Thr Pro Lys Glu Pro Ala Pro Thr Thr Pro Lys
450 455 460
Glu Pro Ala Pro Thr Thr Pro Lys Glu Pro Ala Pro Thr Thr Pro Lys
465 470 475 480
Glu Pro Ala Pro Thr Thr Pro Lys Glu Pro Ala Pro Thr Thr Pro Lys
485 490 495
Glu Pro Ala Pro Thr Thr Pro Lys Glu Pro Ala Pro Thr Thr Pro Lys
500 505 510
Glu Pro Ala Pro Thr Thr Pro Lys Glu Pro Ala Pro Thr Thr Pro Lys
515 520 525
Glu Pro Ala Pro Thr Thr Pro Lys Glu Pro Ala Pro Thr Thr Pro Lys
530 535 540
Glu Pro Ala Pro Thr Thr Pro Lys Glu Pro Ala Pro Thr Thr Pro Lys
545 550 555 560
Glu Pro Ala Pro Thr Thr Pro Lys Glu Pro Ala Pro Thr Thr Pro Lys
565 570 575
Glu Pro Ala Pro Thr Thr Pro Lys Glu Pro Ala Pro Thr Thr Pro Lys
580 585 590
Glu Pro Ala Pro Thr Thr Pro Lys Glu Pro Ala Pro Thr Thr Pro Lys
595 600 605
Glu Pro Ala Pro Thr Thr Pro Lys Glu Pro Ala Pro Thr Thr Pro Lys
610 615 620
Glu Pro Ala Pro Thr Thr Pro Lys Glu Pro Ala Pro Thr Thr Pro Lys
625 630 635 640
Glu Pro Ala Pro Thr Thr Pro Lys Glu Pro Ala Pro Thr Thr Pro Lys
645 650 655
Glu Pro Ala Pro Thr Thr Pro Lys Glu Pro Ala Pro Thr Thr Pro Lys
660 665 670
Glu Pro Ala Pro Thr Thr Pro Lys Glu Pro Ala Pro Thr Thr Pro Lys
675 680 685
Glu Pro Ala Pro Thr Thr Pro Lys Glu Pro Ala Pro Thr Thr Pro Lys
690 695 700
Glu Pro Ala Pro Thr Thr Pro Lys Glu Pro Ala Pro Thr Thr Pro Lys
705 710 715 720
Glu Pro Ala Pro Thr Thr Pro Lys Glu Pro Ala Pro Thr Thr Pro Lys
725 730 735
Glu Pro Ala Pro Thr Thr Pro Lys Glu Pro Ala Pro Thr Thr Pro Lys
740 745 750
Glu Pro Ala Pro Thr Thr Pro Lys Glu Pro Ala Pro Thr Thr Pro Lys
755 760 765
Glu Pro Ala Pro Thr Thr Pro Lys Glu Pro Ala Pro Thr Thr Pro Lys
770 775 780
Glu Pro Ala Pro Thr Thr Pro Lys Glu Pro Ala Pro Thr Thr Pro Lys
785 790 795 800
Glu Pro Ala Pro Thr Thr Pro Lys Glu Pro Ala Pro Thr Thr Pro Ser
805 810 815
Glu Val Ser Thr Thr Thr Thr Thr Met Lys Pro Pro Thr Thr Pro Lys
820 825 830
Asn Leu Ala Glu Ser Thr Pro Glu Phe Pro Ala Glu Pro Thr Pro Lys
835 840 845
Ala Leu Glu Asn Ser Pro Lys Glu Pro Ala Val Pro Thr Thr Lys Ala
850 855 860
Pro Glu Val Thr Lys Pro Glu Val Thr Thr Thr Ala Lys Asp Lys Val
865 870 875 880
Thr Gly Lys Asp Ile His Thr Ile Pro Glu Ile Thr Thr Ala Ala Pro
885 890 895
Lys Ile Thr Thr Glu Thr Ala Thr Thr Thr Glu Glu Lys Thr Thr Glu
900 905 910
Ser Lys Val Thr Ser Thr Ile Met Gln Val Thr Ser Thr Thr Glu Asp
915 920 925
Thr Thr Thr Ser Ser Lys Ile Thr Pro Lys Ala Thr Thr Leu Ala Pro
930 935 940
Lys Val Met Thr Ala Thr Lys Thr Thr Thr Thr Gln Glu Thr Ile Asn
945 950 955 960
Lys Leu Glu Glu Thr Thr Ala Ile Pro Lys Asp Thr Ala Thr His Ser
965 970 975
Lys Val Thr Thr Pro Lys Pro Lys Lys Pro Thr Lys Ala Pro Arg Lys
980 985 990
Pro Thr Ser Thr Lys Lys Pro Lys Thr Pro Arg Lys Arg Lys Pro Lys
995 1000 1005
Thr Thr Pro Ile Pro Pro Lys Ile Thr Thr Pro Thr Thr Pro Lys
1010 1015 1020
Ser Asn Pro Thr Thr Leu Ala Glu Ala Met Leu Gln Thr Thr Thr
1025 1030 1035
Ser Pro Asn Gln Thr Pro Asn Ser Ala Met Ile Glu Val Asn Pro
1040 1045 1050
Lys Asn Glu Asp Ala Asp Ala Ala Glu Gly Glu Lys Pro Leu Val
1055 1060 1065
Ile Leu Arg Pro His Val Leu Thr Pro Ile Val Ile Pro Gly Pro
1070 1075 1080
Asp Phe Leu Val Arg Gly Pro Asn Leu Gly Ile Gly Ile Asn Pro
1085 1090 1095
Met Leu Ser Asp Glu Thr Asn Leu Cys Asn Gly Lys Pro Val Asp
1100 1105 1110
Gly Leu Thr Thr Leu Arg Asn Gly Thr Leu Val Ala Phe Arg Gly
1115 1120 1125
His Tyr Phe Trp Met Leu Arg Pro Phe Ser Pro Pro Ser Pro Pro
1130 1135 1140
Arg Arg Ile Thr Glu Val Trp Gly Ile Pro Ser Pro Ile Asp Thr
1145 1150 1155
Val Phe Thr Arg Cys Asn Cys Glu Gly Lys Thr Phe Phe Phe Lys
1160 1165 1170
Asp Ser Gln Tyr Trp Arg Phe Thr Asn Asp Ile Lys Asp Ala Gly
1175 1180 1185
Tyr Pro Lys Leu Ile Ser Lys Gly Phe Gly Gly Leu Ser Gly Lys
1190 1195 1200
Ile Val Ala Ala Leu Ser Ile Ala Thr Tyr Lys Asn Arg Pro Glu
1205 1210 1215
Ser Val Tyr Phe Phe Lys Arg Gly Gly Arg Ile Gln Gln Tyr Ile
1220 1225 1230
Tyr Lys Gln Glu Pro Ile Arg Lys Cys Pro Gly Arg Arg Pro Ala
1235 1240 1245
Ile His Tyr Ser Val Tyr Gly Glu Ala Pro Gln Ile Arg Arg Arg
1250 1255 1260
Arg Phe Glu Arg Ala Ile Gly Pro Ser Gln Thr His Thr Ile Arg
1265 1270 1275
Ile His Tyr Ser Pro Val Arg Val Ser Tyr Gln Asp Lys Val Pro
1280 1285 1290
Ser Thr Asp Phe Leu His Asn Glu Val Lys Val Ser Thr Leu Trp
1295 1300 1305
Arg Gly Leu Pro Asp Thr Val Thr Ser Ala Ile Ser Leu Pro Asn
1310 1315 1320
Leu Arg Lys Pro Asp Gly Tyr Asp Tyr Tyr Ala Phe Ser Lys Asp
1325 1330 1335
Gln Tyr Tyr Asn Ile Asp Val Pro Ser Arg Thr Ala Arg Ala Ile
1340 1345 1350
Thr Thr Arg Ser Gly Gln Thr Leu Ser Lys Val Trp Tyr Asn Cys
1355 1360 1365
Pro
<210> 99
<211> 187
<212> DNA
<213> 人工序列
<220>
<223> cDNA
<400> 99
tgtacatgga catggtcgct gtgagtatga ccagcagcgt actctccagc cacagccccg 60
gttcaggctc ctccaccact cagggacagg atgtcactct ggccccggcc acggaaccag 120
cttcaggttc agctgccacc tggggacagg atgtcacctc ggtcggcggt ggtggaggag 180
cctcagg 187

Claims (44)

1.一种重组润滑素(lubricin)多肽,其包含重复序列,所述重复序列包含以下或由以下组成:
KEPAPTTP(SEQ ID NO:1)
KEPAPTP(SEQ ID NO:9)
KEPAPTTTP(SEQ ID NO:10),或其组合。
2.根据权利要求1所述的重组润滑素多肽,其中所述重复序列连续重复10-120次。
3.根据权利要求2所述的重组润滑素多肽,其中所述重复序列连续重复59次。
4.根据权利要求1所述的重组润滑素多肽,其中连续重复序列位于分别与以下中的一者具有至少90%序列同一性的N端氨基酸序列与C端氨基酸区段之间:
人润滑素N端和C端衍生的氨基酸序列;
犬润滑素N端和C端衍生的氨基酸序列;或
马润滑素N端和C端衍生的氨基酸序列。
5.根据权利要求4所述的重组润滑素多肽,其中连续重复序列位于N端人润滑素衍生的序列与C端人润滑素衍生的氨基酸序列之间,所述N端人润滑素衍生的序列与以下人润滑素序列具有至少90%序列同一性:
QDLSSCAGRCGEGYSRDATCNCDYNCQHYMECCPDFKRVCTAELSCKGRCFESFERGRECDCDAQCKKYDKCCPDYESFCAEVHNPTSPPSSKKAPPPSGASQTIKSTTKRSPKPPNKKKTKKVIESEEITEEHSVSENQESSSSSSSSSSSSTIRKIKSSKNSAANRELQKKLKVKDNKKNRTKKKPTPKPPVVDEAGSGLDNGDFKVTTPDTSTTQHNKVSTSPKITTAKPINPRPSLPPNSDTSKETSLTVNKETTVETKETTTTNKQTSTDGKEKTTSAKETQSIEKTSAKDLAPTSKVLAKPTPKAETTTKGPALTTP(SEQ ID NO:75)
所述C端人润滑素衍生的氨基酸序列与以下人润滑素序列具有至少90%序列同一性:
SEVSTPTTTKEPTTIHKSPDESTPELSAEPTPKALENSPKEPGVPTTKTPAATKPEMTTTAKDKTTERDLRTTPETTTAAPKMTKETATTTEKTTESKITATTTQVTSTTTQDTTPFKITTLKTTTLAPKVTTTKKTITTTEIMNKPEETAKPKDRATNSKATTPKPQKPTKAPKKPTSTKKPKTMPRVRKPKTTPTPRKMTSTMPELNPTSRIAEAMLQTTTRPNQTPNSKLVEVNPKSEDAGGAEGETPHMLLRPHVFMPEVTPDMDYLPRVPNQGIIINPMLSDETNICNGKPVDGLTTLRNGTLVAFRGHYFWMLSPFSPPSPARRITEVWGIPSPIDTVFTRCNCEGKTFFFKDSQYWRFTNDIKDAGYPKPIFKGFGGLTGQIVAALSTAKYKNWPESVYFFKRGGSIQQYIYKQEPVQKCPGRRPALNYPVYGETTQVRRRRFERAIGPSQTHTIRIQYSPARLAYQDKGVLHNEVKVSILWRGLPNVVTSAISLPNIRKPDGYDYYAFSKDQYYNIDVPSRTARAITTRSGQTLSKVWYNCP(SEQ ID NO:76)。
6.根据权利要求5所述的重组润滑素,其中所述重复序列为KEPAPTTP(SEQ ID NO:1)。
7.根据权利要求4所述的重组润滑素多肽,其中连续重复序列位于N端犬源润滑素序列与C端犬润滑素衍生的氨基酸序列之间,所述N端犬源润滑素序列与以下犬润滑素序列具有至少90%序列同一性:
QDLPSCAGRCGEGYSRDAICNCDYNCQHYMECCPDFKKACTVELSCKGRCFESFARGRECDCDSDCKKYGKCCPDYEDFCGRVHNPTSPPSSKTAPPSPGASQTIKSTAKRSPKAPNKKKTKKVIESEEITEEHSVSENQESSSSSSSSSSTIRKIKSSKNSAANKELKKKPKVKDNKKERTPKKKPPPEPPVVDEAGSGLDNGDIKLTPTPDIPTTQRNKVTTSPKFTTGKPINPKPSLPPNTDTSKETSSTPNKETTVKSKETLANKETSSKAKEKITSAKETRSAEKTPAKDFVPTTKAPVKSTPKAESTTKGPALTTP
(SEQ ID NO:77)
所述C端犬润滑素衍生的氨基酸序列与以下犬润滑素序列具有至少90%序列同一性:
SEVTTTAKDKTTEKDIIPEITTAVPKITTQETATPTEETTTESKTSTTTQVTSTTSSKNTPKATTLAPKVMTATQKTTTTEETMNKPEETTAVPKDTATSTKVSTPRPRKPTKAPKKPASTKKPNTIPKRKKPKTTPTPPKMTTSTMPKLHPTSSVEAMLQTTTSPNQRPNSEIVEVNPNEDTDAAGKKPHMFPRPPVLTPIFIPGTDILVRGSNQDIAINPMLSDETNLCNGKPVDGLTTLRNGTMVAFRGHYFWMLSPSKPPSPPRKITEVWGIPSPIDTVFTRCNCEGKTFFFKGSQYWRFTNDIKDAGYPKQIVKGFGGLNGRIVAALSIAKYKDRPESVYFFKRGGSVQQYTYKQEPIKKCTGRRPAINYPVYGETTQVRRRRFERAIGPSQTHTIRIHYSPIRVSYQDKGFLHNEVKMSSQWRGFPNVVTSAIALPNIRKPDGYDYYAFSRNQYYNIDVPSRTARVVTTRFGRTLSNIWYNC(SEQ ID NO:78)。
8.根据权利要求7所述的重组润滑素,其中所述重复序列为KEPAPTTP(SEQ ID NO:1)。
9.根据权利要求4所述的重组润滑素多肽,其中连续重复序列位于N端马源润滑素序列与C端马润滑素衍生的氨基酸序列之间,所述N端马源润滑素序列与以下马润滑素序列具有至少90%序列同一性:
QDLSSCAGRCGEGYSRDATCNCDFNCQYYMECCPDFKKVCTSELSCKGRCFESFERGRECDCDADCKKYGKCCSDYESFCEEVHNPTSPPSSKTAPPPPGASQTIKSTAKRSPKSNKKKTKKVIESEEIIEEHSVSENQESSSSSSSSSSTIRKVKSSKNSAANRELKKKPKVKDSKKKRTPKKKPTPEPPVIDEAGSGLDNGDFMLIPTPKIPTTQRNKVTTSPKITTVKPINPKPSLPPNSDTSKETTSTPNKETTVETKETEITNKETSTSANEKTTSARKSTEKTSDKDFAPASEVPAKSTPKAETTTKGPALTTP(SEQ IDNO:79)
所述C端马润滑素衍生的氨基酸序列与以下马润滑素序列具有至少90%序列同一性:
SEVSTTTTTMKPPTTPKNLAESTPEFPAEPTPKALENSPKEPAVPTTKAPEVTKPEVTTTAKDKVTGKDIHTIPEITTAAPKITTETATTTEEKTTESKVTSTIMQVTSTTEDTTTSSKITPKATTLAPKVMTATKTTTTQETINKLEETTAIPKDTATHSKVTTPKPKKPTKAPRKPTSTKKPKTPRKRKPKTTPIPPKITTPTTPKSNPTTLAEAMLQTTTSPNQTPNSAMIEVNPKNEDADAAEGEKPLVILRPHVLTPIVIPGPDFLVRGPNLGIGINPMLSDETNLCNGKPVDGLTTLRNGTLVAFRGHYFWMLRPFSPPSPPRRITEVWGIPSPIDTVFTRCNCEGKTFFFKDSQYWRFTNDIKDAGYPKLISKGFGGLSGKIVAALSIATYKNRPESVYFFKRGGRIQQYIYKQEPIRKCPGRRPAIHYSVYGEAPQIRRRRFERAIGPSQTHTIRIHYSPVRVSYQDKVPSTDFLHNEVKVSTLWRGLPDTVTSAISLPNLRKPDGYDYYAFSKDQYYNIDVPSRTARAITTRSGQTLSKVWYNCP(SEQ ID NO:80)。
10.根据权利要求9所述的重组润滑素,其中所述重复序列为KEPAPTTP(SEQ ID NO:1)。
11.根据权利要求4所述的重组润滑素,其进一步包含分泌信号,所述分泌信号可选的为MAWKTLPIYLLLLLSVFVIQQVSS(SEQ ID NO:72)。
12.根据权利要求5所述的重组润滑素,其进一步包含分泌信号,所述分泌信号为METDTLLLWVLLLWVPGSTGD(SEQ ID NO:81)。
13.根据权利要求6所述的重组润滑素,其进一步包含分泌信号,所述分泌信号为METDTLLLWVLLLWVPGSTGD(SEQ ID NO:81)。
14.根据权利要求7所述的重组润滑素,其进一步包含分泌信号,所述分泌信号为MQWKILPIYLLLLSVFLIQQVSS(SEQ ID NO:82)。
15.根据权利要求8所述的重组润滑素,其进一步包含分泌信号,所述分泌信号为MQWKILPIYLLLLSVFLIQQVSS(SEQ ID NO:82)。
16.根据权利要求9所述的重组润滑素,其进一步包含分泌信号,所述分泌信号为MEWKILPIYLLLLLSIFSIQEVSS(SEQ ID NO:74)。
17.根据权利要求10所述的重组润滑素,其进一步包含分泌序列,所述分泌序列为MEWKILPIYLLLLLSIFSIQEVSS(SEQ ID NO:74)。
18.根据权利要求1至17中任一项所述的重组润滑素,其中所述重组润滑素在注射到哺乳动物中时具有大于4天的关节内半衰期。
19.根据权利要求17所述的重组润滑素,其中所述重组润滑素在注射到哺乳动物中时具有至少15天的关节内半衰期。
20.根据权利要求19所述的重组润滑素,其中所述重组润滑素在注射到哺乳动物中时具有至少30天的关节内半衰期。
21.一种组合物,其包含根据权利要求1至17中任一项所述的重组润滑素。
22.根据权利要求22所述的组合物,其中所述组合物选自药物制剂、滴眼剂和隐形眼镜护理液。
23.根据权利要求22所述的组合物,其用于治疗有需要的人。
24.根据权利要求22所述的组合物,其用于治疗有需要的非人哺乳动物。
25.根据权利要求24所述的组合物,其中所述组合物用于治疗有需要的犬科或马科动物。
26.一种或多种哺乳动物细胞,其包含根据权利要求1至17中任一项所述的重组润滑素。
27.根据权利要求26所述的一种或多种哺乳动物细胞,其中所述细胞处于悬浮培养物中。
28.一种分离的多核苷酸和/或表达载体,其编码根据权利要求1至17中任一项所述的重组润滑素。
29.一种或多种哺乳动物细胞,其包含根据权利要求28所述的分离的多核苷酸,其中所述一种或多种哺乳动物细胞可选的适于在悬浮培养物中生长。
30.一种悬浮培养物,其包含表达根据权利要求1至17中任一项所述的重组润滑素的哺乳动物细胞。
31.一种制备根据权利要求1至17中任一项所述的重组润滑素的方法,所述方法包括将编码所述重组润滑素的多核苷酸引入到哺乳动物细胞中,使得所述细胞表达所述重组润滑素。
32.根据权利要求31所述的方法,其进一步包括从所述哺乳动物细胞中分离所述重组润滑素。
33.一种无生命物品,其完全或部分涂布有包含根据权利要求1至17中任一项所述的重组润滑素的组合物。
34.根据权利要求33所述的无生命物品,其中所述无生命物品包括隐形眼镜。
35.一种用于治疗有需要的个体的方法,所述方法包括将包含根据权利要求1至17中任一项所述的重组润滑素的组合物引入到所述个体中。
36.根据权利要求35所述的方法,其中所述重组润滑素在所述个体中持续大于四天的时间段。
37.根据权利要求36所述的方法,其中所述重组润滑素在所述个体中持续大于30天的时间段。
38.根据权利要求37所述的方法,其中所述重组润滑素在所述个体中持续至少30天的时间段。
39.根据权利要求35所述的方法,其中所述个体需要治疗滑膜关节、腱鞘或滑囊的病症。
40.根据权利要求39所述的方法,其包括将所述组合物引入到所述滑膜关节中。
41.根据权利要求35所述的方法,其中所述个体需要治疗眼病症。
42.根据权利要求41所述的方法,其包括将所述组合物引入到所述个体的眼中。
43.根据权利要求35所述的方法,其中所述个体需要治疗粘膜表面的病症。
44.根据权利要求43所述的方法,其中使所述组合物与所述粘膜表面接触。
CN202080021544.XA 2019-01-15 2020-01-15 重组润滑素和组合物以及其使用方法 Pending CN113573724A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201962792660P 2019-01-15 2019-01-15
US62/792,660 2019-01-15
PCT/US2020/013752 WO2020150396A1 (en) 2019-01-15 2020-01-15 Recombinant lubricins, and compositions and methods for using the same

Publications (1)

Publication Number Publication Date
CN113573724A true CN113573724A (zh) 2021-10-29

Family

ID=71614494

Family Applications (2)

Application Number Title Priority Date Filing Date
CN202080021615.6A Pending CN113905753A (zh) 2019-01-15 2020-01-15 重组粘蛋白和组合物以及其使用方法
CN202080021544.XA Pending CN113573724A (zh) 2019-01-15 2020-01-15 重组润滑素和组合物以及其使用方法

Family Applications Before (1)

Application Number Title Priority Date Filing Date
CN202080021615.6A Pending CN113905753A (zh) 2019-01-15 2020-01-15 重组粘蛋白和组合物以及其使用方法

Country Status (5)

Country Link
US (2) US20220127318A1 (zh)
EP (1) EP3911355A4 (zh)
JP (1) JP2022522965A (zh)
CN (2) CN113905753A (zh)
WO (2) WO2020150390A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114107437A (zh) * 2021-11-30 2022-03-01 南通大学 一种基于荧光素酶亚基互补的主蛋白酶抑制剂活性检测系统及在药物筛选中的应用

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110205281A (zh) * 2016-09-14 2019-09-06 四川蓝光英诺生物科技股份有限公司 人工组织前体及制备其的方法
US20220127318A1 (en) * 2019-01-15 2022-04-28 Cornell University Recombinant lubricins, and compositions and methods for using the same
CN117106024B (zh) * 2022-10-21 2024-05-24 南京市妇幼保健院 一种人血清多肽agdmp1及其在改善胰岛素抵抗中的应用

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1867350A (zh) * 2003-08-14 2006-11-22 惠氏公司 重组润滑素分子及其用途
WO2011019963A2 (en) * 2009-08-13 2011-02-17 Singularis, Inc. Prg4 treatment for interstitial cystitis
US20180125926A1 (en) * 2013-09-25 2018-05-10 Axcella Health Inc. Compositions and Formulations and Methods of Production and Use Thereof
CN109055426A (zh) * 2018-08-06 2018-12-21 苏州迈缔姆生物技术有限公司 一种在中华仓鼠卵巢细胞中表达生产类人润滑素的方法
CN113905753A (zh) * 2019-01-15 2022-01-07 康奈尔大学 重组粘蛋白和组合物以及其使用方法

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7309760B2 (en) * 2001-04-17 2007-12-18 The Board Of Trustees Of The University Of Arkansas Repeat sequences of the CA125 gene and their use for diagnostic and therapeutic interventions
US20060173171A1 (en) * 2003-08-26 2006-08-03 Bamdad Cynthia C Techniques and compositions for diagnosis and treatment of cancer (muci)
CA2618791C (en) * 2005-08-12 2014-05-13 Riken Novel mucin-type glycoprotein and use thereof
WO2008133928A2 (en) * 2007-04-27 2008-11-06 The Gi Company, Inc. Mucin glycoproteins and their use for treatment of epithelial lesions and mucin dependent disorders
EP2915529B1 (en) * 2008-05-07 2017-06-14 The Regents of The University of California Therapeutic replenishment and enrichment of ocular surface lubrication
US20140187474A1 (en) * 2011-02-16 2014-07-03 The Board Of Trustees Of The Leland Stanford Junior University Therapeutic use of mucin glycans
EP3978030A1 (en) * 2012-04-02 2022-04-06 ModernaTX, Inc. Modified polynucleotides for the production of proteins associated with human disease
US20150010606A1 (en) * 2013-07-08 2015-01-08 Arthrex, Inc. Intra-articular injection and implant attachment of molecule consisting of lubricin and extracellular superoxide dismutase or hyaluronic acid and extracellular superoxide dismutase
WO2015081121A1 (en) * 2013-11-26 2015-06-04 Lubris Llc Compositions and methods for inhibiting intercellular interactions
KR20170123619A (ko) * 2015-01-26 2017-11-08 루브리스 엘엘씨 항염증제로서의 prg4의 용도
US20160280767A1 (en) * 2015-03-23 2016-09-29 Lonza Ltd. Methods for controlling protein glycosylation
PT3300482T (pt) * 2015-05-19 2021-10-15 Lubris Llc Uso de prg4 para melhorar a acuidade visual dinâmica e as aberrações de ordem superior
BR112017024797A2 (pt) * 2015-05-20 2018-08-07 The Broad Institute Inc. neoantígenos partilhados
CN118048321A (zh) * 2016-01-13 2024-05-17 建新公司 用于治疗哺乳动物内骨关节炎和相关关节病症的表达骨保护性基因、包括has2和润滑素的重组aav载体
WO2017165674A1 (en) * 2016-03-23 2017-09-28 International Aids Vaccine Initiative Immunogenic trimers
CA3029426A1 (en) * 2016-06-30 2018-01-04 Oncorus, Inc. Pseudotyped oncolytic viral delivery of therapeutic polypeptides

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1867350A (zh) * 2003-08-14 2006-11-22 惠氏公司 重组润滑素分子及其用途
CN102924584A (zh) * 2003-08-14 2013-02-13 惠氏公司 重组润滑素分子及其用途
US20130196930A1 (en) * 2003-08-14 2013-08-01 Wyeth Llc Polynucleotides encoding recombinant lubricin molecules and uses thereof
WO2011019963A2 (en) * 2009-08-13 2011-02-17 Singularis, Inc. Prg4 treatment for interstitial cystitis
US20180125926A1 (en) * 2013-09-25 2018-05-10 Axcella Health Inc. Compositions and Formulations and Methods of Production and Use Thereof
CN109055426A (zh) * 2018-08-06 2018-12-21 苏州迈缔姆生物技术有限公司 一种在中华仓鼠卵巢细胞中表达生产类人润滑素的方法
CN113905753A (zh) * 2019-01-15 2022-01-07 康奈尔大学 重组粘蛋白和组合物以及其使用方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
CARL R.FLANNERY等,: "Articular Cartilage Superficial Zone Protein (SZP) Is Homologous to Megakaryocyte Stimulating Factor Precursor and Is a Multifunctional Proteoglycan with Potential Growth-Promoting, Cytoprotective, and Lubricating Properties in Cartilage Metabolism", BIOCHEMICAL AND BIOPHYSICAL RESEARCH COMMUNICATIONS, vol. 254, 27 January 1999 (1999-01-27), pages 1 *
CAROLYN R. SHURER 等: "Stable recombinant production of codon-scrambled lubricin and mucin in human cells", BIOTECHNOLOGY AND BIOENGINEERING, 1 May 2019 (2019-05-01), pages 1 *
EMBL DATABASE: "Q92954.PRG4_HUMAN", EMBL DATABASE, 28 March 2018 (2018-03-28) *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114107437A (zh) * 2021-11-30 2022-03-01 南通大学 一种基于荧光素酶亚基互补的主蛋白酶抑制剂活性检测系统及在药物筛选中的应用

Also Published As

Publication number Publication date
WO2020150396A1 (en) 2020-07-23
EP3911355A1 (en) 2021-11-24
US20220127319A1 (en) 2022-04-28
EP3911355A4 (en) 2022-06-01
WO2020150390A1 (en) 2020-07-23
CN113905753A (zh) 2022-01-07
JP2022522965A (ja) 2022-04-21
US20220127318A1 (en) 2022-04-28

Similar Documents

Publication Publication Date Title
Shurer et al. Physical principles of membrane shape regulation by the glycocalyx
CN113573724A (zh) 重组润滑素和组合物以及其使用方法
Perez-Vilar et al. C-Mannosylation of MUC5AC and MUC5B Cys subdomains
Shurer et al. Genetically encoded toolbox for glycocalyx engineering: Tunable control of cell adhesion, survival, and cancer cell behaviors
Baranova et al. Inter-α-inhibitor impairs TSG-6-induced hyaluronan cross-linking
CA2764461C (en) Serum amyloid p derivatives and their preparation and use
Hsieh et al. Synthesis of the bacteriocin glycopeptide sublancin 168 and S-glycosylated variants
Pérez-Vilar et al. Gel-forming mucins. Notions from in vitro studies
Pan et al. Sequence-specific mucins for glycocalyx engineering
Saraswat et al. N-glycoproteomics of human seminal plasma glycoproteins
Seifried et al. Glycoprotein mimics with tunable functionalization through global amino acid substitution and copper click chemistry
Littlechild et al. Keratan sulfate phenotype in the β-1, 3-N-acetylglucosaminyltransferase-7–null mouse cornea
JP2017513488A (ja) 炭水化物結合タンパク質
CN101516907A (zh) 泪液脂质运载蛋白的突变蛋白及其获得方法
Hütte et al. A bacterial mannose binding lectin as a tool for the enrichment of C-and O-mannosylated peptides
Vijayakumar et al. Galectin-3 mediates oligomerization of secreted hensin using its carbohydrate-recognition domain
Matsushita et al. Functional neoglycopeptides: synthesis and characterization of a new class of MUC1 glycoprotein models having core 2-based O-glycan and complex-type N-glycan chains
Quintana et al. The impact of glycosylation on the structure, function, and interactions of CD14
Jaroentomeechai et al. Mammalian cell-based production of glycans, glycopeptides and glycomodules
Flowers et al. Deciphering isomers with a multiple reaction monitoring method for the complete detectable O-glycan repertoire of the candidate therapeutic, lubricin
CN111479820B (zh) 重组多肽中的工程化o-糖基化及其用途
Wang et al. Surface Shave: Revealing the Apical-Restricted Uroglycome
Flowers et al. Core-2 O-glycans are required for galectin-3 interaction with the osteoarthritis related protein lubricin
US20190315817A1 (en) Multimeric and multivalent polymer comprising multimerization peptide domain
Shurer The Biophysical Role of the Cellular Glycocalyx: Engineering Glycoproteins to Control Cell-Surface Properties

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination