[go: up one dir, main page]

CN108699580A - 在氨基葡萄糖残基中具有高3-o-硫酸化比率的硫酸乙酰肝素 - Google Patents

在氨基葡萄糖残基中具有高3-o-硫酸化比率的硫酸乙酰肝素 Download PDF

Info

Publication number
CN108699580A
CN108699580A CN201680082662.5A CN201680082662A CN108699580A CN 108699580 A CN108699580 A CN 108699580A CN 201680082662 A CN201680082662 A CN 201680082662A CN 108699580 A CN108699580 A CN 108699580A
Authority
CN
China
Prior art keywords
polysaccharide
leu
lys
ile
ser
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201680082662.5A
Other languages
English (en)
Other versions
CN108699580B (zh
Inventor
森健
森健一
土仓友梨子
山崎俊介
清水朋子
三原康博
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ajinomoto Co Inc
Original Assignee
Ajinomoto Co Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ajinomoto Co Inc filed Critical Ajinomoto Co Inc
Publication of CN108699580A publication Critical patent/CN108699580A/zh
Application granted granted Critical
Publication of CN108699580B publication Critical patent/CN108699580B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C08ORGANIC MACROMOLECULAR COMPOUNDS; THEIR PREPARATION OR CHEMICAL WORKING-UP; COMPOSITIONS BASED THEREON
    • C08BPOLYSACCHARIDES; DERIVATIVES THEREOF
    • C08B37/00Preparation of polysaccharides not provided for in groups C08B1/00 - C08B35/00; Derivatives thereof
    • C08B37/006Heteroglycans, i.e. polysaccharides having more than one sugar residue in the main chain in either alternating or less regular sequence; Gellans; Succinoglycans; Arabinogalactans; Tragacanth or gum tragacanth or traganth from Astragalus; Gum Karaya from Sterculia urens; Gum Ghatti from Anogeissus latifolia; Derivatives thereof
    • C08B37/0063Glycosaminoglycans or mucopolysaccharides, e.g. keratan sulfate; Derivatives thereof, e.g. fucoidan
    • C08B37/0075Heparin; Heparan sulfate; Derivatives thereof, e.g. heparosan; Purification or extraction methods thereof
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K31/00Medicinal preparations containing organic active ingredients
    • A61K31/70Carbohydrates; Sugars; Derivatives thereof
    • A61K31/715Polysaccharides, i.e. having more than five saccharide radicals attached to each other by glycosidic linkages; Derivatives thereof, e.g. ethers, esters
    • A61K31/726Glycosaminoglycans, i.e. mucopolysaccharides
    • A61K31/727Heparin; Heparan
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P7/00Drugs for disorders of the blood or the extracellular fluid
    • A61P7/02Antithrombotic agents; Anticoagulants; Platelet aggregation inhibitors
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P19/00Preparation of compounds containing saccharide radicals
    • C12P19/04Polysaccharides, i.e. compounds containing more than five saccharide radicals attached to each other by glycosidic bonds
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology

Landscapes

  • Health & Medical Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Medicinal Chemistry (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Veterinary Medicine (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Animal Behavior & Ethology (AREA)
  • Public Health (AREA)
  • General Chemical & Material Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Molecular Biology (AREA)
  • Biochemistry (AREA)
  • Dermatology (AREA)
  • Diabetes (AREA)
  • Hematology (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Epidemiology (AREA)
  • Biotechnology (AREA)
  • Microbiology (AREA)
  • General Engineering & Computer Science (AREA)
  • Genetics & Genomics (AREA)
  • Materials Engineering (AREA)
  • Polymers & Plastics (AREA)
  • Pharmaceuticals Containing Other Organic And Inorganic Compounds (AREA)
  • Polysaccharides And Polysaccharide Derivatives (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Saccharide Compounds (AREA)
  • Enzymes And Modification Thereof (AREA)

Abstract

本发明提供了具有抗凝血活性的新型硫酸化多糖。具体而言,本发明提供了包含由己糖醛酸(HexA)残基和α‑D‑氨基葡萄糖(GlcN)残基组成的二糖单元的重复结构并且在GlcN残基中具有13%或更高的3‑O‑硫酸化比率的多糖。

Description

在氨基葡萄糖残基中具有高3-O-硫酸化比率的硫酸乙酰肝素
技术领域
本发明涉及具有抗凝血活性的新型硫酸化多糖。具有抗凝血活性的硫酸化多糖在例如医学领域有用。
背景技术
例如,已知各种硫酸乙酰肝素例如肝素(heparin)为具有抗凝血活性的硫酸化多糖。也就是说,肝素是一种抗凝血剂,并且用于血栓栓塞和弥散性血管内凝血(DIC)的治疗以及在人工透析或体外循环中血液凝固的预防。
肝素通过激活作为抗凝血因子的抗凝血酶III的展现出抗凝血作用。抗凝血酶III通过与其活性丝氨酸位点结合来抑制凝血酶、因子Xa(因子X的活性形式)和其他丝氨酸蛋白酶。凝血酶是血液凝固因子,因子Xa是参与凝血酶成熟的因子。肝素与抗凝血酶III结合以改变它的结构并激活它的抑制作用。凝血酶对肝素-抗凝血酶III复合物具有比对因子Xa更高的亲和力。
通过酶/化学处理和肝素的分馏获得的具有平均分子量为4000至6000Da的低分子量肝素具有较少的出血副作用并且近年来使用得更加频繁。低分子量肝素由于它的短糖链而可以与抗凝血酶III结合,但几乎不与凝血酶结合。这里,在通过肝素-抗凝血酶III复合物的凝血酶的抑制中凝血酶需要与肝素结合,然而在通过肝素-抗凝血酶III复合物的因子Xa的抑制中因子Xa不需要与肝素结合。因此,低分子量肝素几乎不抑制凝血酶的作用,然而它可以抑制因子Xa的作用。
目前,大多数肝素制剂是来自猪肠粘膜的提取产物。然而,2008年发生了由污染引起的致死性事故,因此已经研究了质量控制的非动物源肝素的生产的开发。
已经报道了许多生产非动物源肝素的方法,所述方法大致分为两种类型。在第一种方法中,肝素前体(heparosan)是肝素的糖链骨架,通过使用微生物例如大肠杆菌K5菌株的发酵方法生产,并且使用化学或酶技术转化为抗凝血多糖例如肝素,随后使用化学、酶或物理技术将其低分子化(非专利文献1和2)。在第二种方法中,仅通过化学合成方法连接糖链(专利文献1)。
作为使用肝素前体作为起始原料生产肝素的方法,已经报道了主要涉及化学转化的方法和主要涉及酶转化的方法。生产的肝素类似多糖在结构特征和抗凝血活性强度方面是不同的(专利文献2和3)。
在主要涉及化学转化的方法中生产的肝素类似多糖中,氨基葡萄糖残基中3-O-硫酸化比率很高,而葡萄糖醛酸残基的一部分也是3-O-硫酸化的。该3-O-硫酸化葡萄糖醛酸残基是动物源肝素中不存在的结构,并且它在体内的副反应受到了关注。
另一方面,虽然在主要涉及酶转化的方法中生产的肝素类似多糖具有与动物源肝素相同的硫酸化模式,它的抗凝血活性约为动物源产物的一半。
从上述先前的发现,尚未知道具有与动物源肝素相同的硫酸化模式并展现出高抗凝血活性的肝素类似多糖。
现有技术参考文献
专利文献
专利文献1:US20120116066
专利文献2:US8227449
专利文献3:US20120322114
非专利文献
非专利文献1:Lindahl U.et al.(2005),J.Med.Chem.,48(2):349-352
非专利文献2:Zhang Z.et al.(2008),Journal of the American ChemicalSociety,130(39):12998-13007
发明内容
本发明要解决的问题
本发明的目标是提供具有抗凝血活性的新型硫酸化多糖。
解决问题的手段
作为广泛研究的结果,本发明人发现了包含由己糖醛酸(HexA)残基和α-D-氨基葡萄糖(GlcN)残基组成的二糖单元的重复结构,在GlcN残基中展现出高3-O-硫酸化比率并且具有抗凝血活性的新型硫酸化多糖,并完成了本发明。
也就是说,本发明可以如下例示。
[1]具有抗凝血活性的多糖,所述多糖包含以下通式(I)中所示的二糖单元的重复结构:
R1至R5满足以下条件;
R1、R2、R4和R5各自独立表示氢或硫酸基团;
R3表示氢、硫酸基团或乙酰基团;
R3的至少一部分是硫酸基团;
R4中硫酸基团的比率是13%或更多;并且
R5中硫酸基团的比率是50%或更多。
[2]根据[1]的多糖,其中所述二糖单元的含有率是90%或更多。
[3]根据[1]或[2]的多糖,其中构成所述多糖的糖链总数中的50%或更多糖链由以下通式(II)中所示的结构构成:
其中
R1至R5与所述通式(I)中的R1至R5相同;并且
n以平均值计为3至30。
[4]根据[1]至[3]中任一项的多糖,其中构成所述多糖的糖链总数中的50%或更多糖链由以下通式(II)中所示的结构构成:
其中
R1至R5与所述通式(I)中的R1至R5相同;并且
n以平均值计为3至15。
[5]根据[1]至[4]中任一项的多糖,其中连接的糖残基的平均数目为6至60。
[6]根据[1]至[5]中任一项的多糖,其中连接的糖残基的平均数目为6至30。
[7]根据[1]至[6]中任一项的多糖,其中通过使用普鲁兰多糖作为标准的凝胶渗透色谱测量的数均分子量为8000至60000。
[8]根据[1]至[7]中任一项的多糖,其中通过使用普鲁兰多糖作为标准的凝胶渗透色谱测量的数均分子量为12000至40000。
[9]根据[1]至[8]中任一项的多糖,其中通过使用普鲁兰多糖作为标准的凝胶渗透色谱测量的重均分子量为10000至100000。
[10]根据[1]至[9]中任一项的多糖,其中通过使用普鲁兰多糖作为标准的凝胶渗透色谱测量的重均分子量为15000至50000。
[11]根据[1]至[10]中任一项的多糖,其中在所述二糖单元的己糖醛酸残基中,艾杜糖醛酸残基的比率为0%至70%。
[12]根据[1]至[11]中任一项的多糖,其中R1中硫酸基团的比率为0%至80%。
[13]根据[1]至[12]中任一项的多糖,其中在艾杜糖醛酸残基的R1中,硫酸基团的比率为0%至100%。
[14]根据[1]至[13]中任一项的多糖,其中在葡萄糖醛酸残基的R1中,硫酸基团的比率为0%至50%。
[15]根据[1]至[14]中任一项的多糖,其中R2中硫酸基团的比率少于1%。
[16]根据[1]至[15]中任一项的多糖,其中R3中硫酸基团的比率为70%至100%。
[17]根据[1]至[16]中任一项的多糖,其中R3中乙酰基团的比率为0%至33%。
[18]根据[1]至[17]中任一项的多糖,其中R4中硫酸基团的比率为45%或更少。
[19]根据[1]至[18]中任一项的多糖,其中R5中硫酸基团的比率为70%至100%。
[20]根据[1]至[19]中任一项的多糖,所述多糖包含总含有率为50%或更多的选自GlcA-GlcN(NS3S6S)、GlcA(2S)-GlcN(NS6S)、IdoA(2S)-GlcN(NS6S)、GlcA-GlcN(NS6S)、IdoA(2S)-GlcN(NS)、IdoA(2S)-GlcN(NS3S)、IdoA-GlcN(NS6S)和GlcA-GlcN(NS)的一种或多种二糖单元。
[21]根据[1]至[20]中任一项的多糖,其中抗因子Xa活性/抗因子IIa活性的比值为1.5或更多。
[22]根据[1]至[21]中任一项的多糖,其中通过使用普鲁兰多糖作为标准的凝胶渗透色谱测量的重均分子量(Mw)与数均分子量(Mn)的比值(Mw/Mn)为1.5或更少。
[23]根据[1]至[22]中任一项的多糖,所述多糖为游离形式或药理学上可接受的盐,或它们的混合物。
[24]根据[1]至[23]中任一项的多糖,该所述盐选自铵盐、钠盐、锂盐和钙盐。
[25]药物组合物,所述药物组合物包含根据[1]至[24]中任一项的多糖。
[26]根据[25]的组合物,其用于预防、改善和/或治疗归因于血液凝固的症状。
[27]根据[26]的组合物,其中所述症状是弥散性血管内凝血综合征、血栓栓塞、人工透析中的血液凝固或体外循环中的血液凝固。
本发明的效果
本发明可以提供具有抗凝血活性的新型硫酸化多糖。
具体实施方式
以下,将详细解释本发明。
<1>本发明中的多糖
本发明的多糖是具有抗凝血活性的新型硫酸化多糖。本发明的多糖任选地称为“硫酸乙酰肝素”。本发明的多糖可以由单一类型的糖链组成或者可以是多种类型的糖链的混合物。本发明的多糖通常作为多种类型糖链的混合物获得。“多种类型的糖链的混合物”是指在结构上(连接的糖的数目、分子量以及取代基的类型和位置等)不同的两种或更多种类型的糖链的组合。当本发明的多糖由单一类型的糖链组成时,除非另有说明,否则鉴定本发明的多糖的每个参数对应于所述糖链中的参数。当本发明的多糖是多种类型糖链的混合物时,除非另有说明,否则鉴定本发明的多糖的每个参数对应于整个混合物中参数的平均值。同样适用于其他多糖例如生产本发明的多糖时的中间体。
可以通过用于化合物例如多糖的检测和鉴定的已知技术来确定鉴定本发明的多糖的每个参数。此类技术的实例包括二糖分析、分子量分析(例如凝胶渗透色谱;GPC)、使用紫外和可见光吸收检测器(UV)和折射率检测器(RI)的水性尺寸排阻色谱(SEC)(SEC-RI/UV法),以及HPLC、LC/MS、NMR。可以单独使用或者适当地组合使用这些技术。可以根据要确定的参数的类型适当地选择这些技术。例如,可以通过二糖分析确定二糖结构或它的含有率。可以通过标准方法实施二糖分析。可以根据先前报道(T.Imanari,et.al.,"High-performance liquid chromatographic analysis of glycosaminoglycan-derivedoligosaccharides."J.O.Chromato.A,720,275-293(1996))中的条件实施二糖分析。也就是说,例如,可以根据需要通过使用肝素酶将N-硫酸化的多糖分解成不饱和二糖并分离和定量分解产物来定量成分二糖的量。肝素酶的实例包括肝素酶I、肝素酶II和肝素酶III。可以单独使用或者适当地组合使用肝素酶。可以根据各种条件例如多糖中含有的己糖醛酸(HexA)残基的类型来适当地选择要使用的肝素酶。例如,肝素酶II和III的组合可以用于包含β-D-葡萄糖醛酸(GlcA)残基的多糖的二糖分析。另外例如,肝素酶I和II的组合可以用于包含α-L-艾杜糖醛酸(IdoA)残基的多糖的二糖分析。可以通过用亚硝酸分解多糖并分离和定量分解产物来定量每种成分二糖的量。可以通过用于化合物鉴定的已知方法例如HPLC、LC/MS实施分解产物的分离和定量。二糖分析的条件具体包括例如实施例中描述的条件。可以基于每种成分二糖的量计算目标二糖单元的含有率。当使用肝素酶例如肝素酶III切割多糖时,通常,在由此产生的未还原末端的HexA残基中C4和C5之间的连接变为双键。在具有C4和C5之间的双键的HexA残基中不可以区分IdoA残基和GlcA残基。因此当有必要区分IdoA残基和GlcA残基时,可以通过可以区分IdoA残基和GlcA残基的技术例如亚硝酸分解方法实施二糖分析。也可以确定鉴定其他多糖例如生产本发明的多糖时的中间体的每个参数。
在本发明中,除非另有说明,可以使用普鲁兰多糖作为标准直接确定平均分子量(数均分子量(Mn)和重均分子量(Mw))。或者,可以通过基于具有已知真实平均分子量的分子(例如依诺肝素钠)的比例计算间接计算硫酸乙酰肝素的真实平均分子量。在本发明中,硫酸乙酰肝素的平均分子量可以如上直接或间接测量,并且优选直接测量。
本发明的多糖具体是具有抗凝血活性的多糖,所述多糖包含以下通式(I)中所示的二糖单元的重复结构:
在式中,R1、R2、R4和R5各自独立表示氢(-H)或硫酸基团(-SO3H),R3表示氢(-H)、硫酸基团(-SO3H)或乙酰基团(-COCH3)。在每个重复单元和每个糖链中独立选择R1至R5。在每个重复单元和每个糖链中也独立选择己糖醛酸(HexA)残基的类型。
本发明的多糖可以包含上述重复结构作为主要构成元件。该“本发明的多糖可以包含上述重复结构作为主要构成元件”可以是本发明的多糖的90%或更多、95%或更多、97%或更多、99%或更多或100%(全部)部分由上述重复结构组成。该“本发明的多糖可以包含上述重复结构作为主要构成元件”可以实质上是本发明的多糖的90%或更多、95%或更多、97%或更多、99%或更多或100%(全部)部分由上述二糖单元(通式(I)中所示的二糖单元)组成。由上述二糖单元组成的部分的百分比也称为“上述二糖单元的含有率”。也就是说,在本发明的多糖中上述二糖单元的含有率可以是例如90%或更多、95%或更多、97%或更多、99%或更多或100%。可以通过例如二糖分析测量上述二糖单元的含有率。也就是说,当对本发明的多糖进行二糖分析时,上述二糖单元的含有率可以计算为例如上述二糖单元的总量相对于的二糖的总量的百分比(摩尔比率)。
可以适当地配置本发明的多糖中上述二糖单元的平均重复数目、连接的糖的平均数目、数均分子量(Mn)和重均分子量(Mw)。上述二糖单元的平均重复数目可以是例如3或更多、4或更多、5或更多、或6或更多、50或更少、30或更少、20或更少、15或更少、12或更少、或9或更少,或它们的组合。具体而言,上述二糖单元的平均重复数目可以是3至15,或6至9。连接的糖的平均数目(残基的数目)可以是例如6或更多、8或更多、10或更多、或12或更多、100或更少、60或更少、40或更少、30或更少、24或更少、或18或更少,或它们的组合。具体而言,连接的糖的平均数目可以是例如6至60、6至30或12至18个残基。可以通过用于以上例示的化合物的检测或鉴定的技术来确定平均重复数目和连接的糖的平均数目。具体而言,可以例如基于分子量确定平均重复数目和连接的糖的平均数目。可以通过标准方法测量分子量。测量分子量的方法包括凝胶渗透色谱(GPC),以及使用紫外和可见光吸收检测器(UV)和折射率检测器(RI)的水性尺寸排阻色谱(SEC)(SEC-RI/UV法;依照欧洲药典(EP))。具体而言,通过GPC测量分子量的条件包括例如在实施例中描述的条件。作为通过使用普鲁兰多糖作为标准的GPC测量的值,数均分子量(Mn)可以是例如7000或更多、8000或更多、10000或更多、12000或更多、15000或更多、或18000或更多、150000或更少、100000或更少、60000或更少、50000或更少、43000或更少或40000或更少,或它们的组合。具体而言,作为通过使用普鲁兰多糖作为标准的GPC测量的值,数均分子量(Mn)可以是例如8000至60000、或12000至40000、或18000至43000。作为通过使用普鲁兰多糖作为标准的GPC测量的值,重均分子量(Mw)可以是例如9000或更多、10000或更多、12000或更多、15000或更多、21000或更多、或25000或更多、200000或更少、150000或更少、100000或更少、80000或更少、60000或更少、或50000或更少,或它们的组合。具体而言,作为通过使用普鲁兰多糖作为标准的GPC测量的值,重均分子量(Mw)可以是例如10000至100000或15000至50000、或25000至60000。作为通过使用普鲁兰多糖作为标准的GPC测量的值,重均分子量(Mw)与数均分子量(Mn)的比值(Mw/Mn)可以是例如1或更多、2.0或更少、1.9或更少、1.8或更少、1.7或更少、1.6或更少、1.55或更少、1.5或更少、1.45或更少、1.4或更少、1.35或更少、1.3或更少、1.25或更少、或1.2或更少,或它们的组合。具体而言,作为通过使用普鲁兰多糖作为标准的GPC测量的值,重均分子量与数均分子量的比值(Mw/Mn)可以是例如1至1.6、1至1.5或1至1.4。
上述二糖单元由己糖醛酸(HexA)残基(式子中左边的糖残基)和α-D-氨基葡萄糖(GlcN)残基(式子中右边的糖残基)组成。在上述二糖单元中,HexA残基(左侧)和GlcN残基(右侧)也分别称为“非还原末端侧”和“还原末端侧”。己糖醛酸残基为β-D-葡萄糖醛酸(GlcA)残基或α-L-艾杜糖醛酸(IdoA)残基。也就是说,在本发明中,术语“己糖醛酸(HexA)”用作β-D-葡萄糖醛酸(GlcA)和α-L-艾杜糖醛酸(IdoA)的包括性术语。除非另有说明,术语“己糖醛酸(HexA)”,即术语“β-D-葡萄糖醛酸(GlcA)”和“α-L-艾杜糖醛酸(IdoA)”包括取决于R1和R2的选择的所有可能的衍生物。除非另有说明,术语“α-D-氨基葡萄糖(GlcN)”包括取决于R3R4和R5的选择的潜在所有衍生物。
本发明的多糖可以具有上述重复结构使得上述二糖单元存在于非还原末端的一部分或全部。例如,在本发明的多糖的非还原末端,90%或更多、95%或更多、97%或更多、99%或更多或100%的二糖单元可以是上述二糖单元。也就是说,例如,在本发明的多糖的非还原末端,90%或更多、95%或更多、97%或更多、99%或更多或100%的糖残基可以是HexA残基。另外本发明的多糖可以具有上述重复结构使得上述二糖单元存在于还原末端的一部分或全部。例如,在本发明的多糖的还原末端,90%或更多、95%或更多、97%或更多、99%或更多或100%的二糖单元可以是上述二糖单元。也就是说,例如,在本发明的多糖的还原末端,90%或更多、95%或更多、97%或更多、99%或更多或100%的糖残基可以是GlcN残基。当上述二糖单元存在于糖链的末端时,可以用适当的结构作为末端适当地替换末端糖苷键。也就是说,可以用羟基(-OH)或用C-4和C-5之间的双键替换在非还原末端的HexA残基的C-4位的糖苷键。在具有C-4和C-5之间双键的HexA残基中,不区分IdoA残基和GlcA残基。因此,当计算鉴定多糖例如本发明的多糖的每个参数时,除非另有说明,否则认为此类HexA残基是对应于HexA残基但既不对应于IdoA残基也不对应于GlcA残基的残基。另外,可以用例如羟基(-OH)替换在还原末端的GlcN残基的C-1位的糖苷键。
更具体地,本发明的多糖可以包含以下通式(II)中所示的结构。例如,本发明的多糖的一部分或全部(即,构成本发明的多糖的糖链的一部分或全部)可以由以下通式(II)中所示的结构组成。例如,构成本发明的多糖的糖链总数中的50%或更多、70%或更多、80%或更多、90%或更多、95%或更多、97%或更多、99%或更多、或100%的糖链可以由以下通式(II)中所示的结构组成。在式子中,R1至R5如上所述。在式子中,数字“n”表示在式子中上述二糖单元的重复数目。可以配置数字“n”使得本发明的多糖可以实现如上所述的上述二糖单元的平均重复数目、连接的糖链的平均数目、数均分子量(Mn)、重均分子量(Mw)或它们的组合。可以通过使用低分子量肝素配制剂依诺肝素钠(Sanofi-Aventis,France)的分子量进一步转换以普鲁兰多糖计的重均分子量来计算数字“n”。具体而言,通过将基于GPC方法的依诺肝素钠的测量值数值16215除以基于依照EP的SEC-RI/UV方法的测量值数值4325计算得到的数值3.75用作换算系数,并且可以通过将以本发明的多糖的普鲁兰多糖计的重均分子量除以换算系数3.75和肝素二糖平均分子量665.4来计算数字“n”。在每个糖链中,数字“n”可以是例如3至200、3至100或3至50。另外,数字“n”可以具体是例如在本发明的多糖中上述二糖单元的平均重复数目(例如,3至30、3至15、或6至9),作为糖链的整个混合物的平均值。
在HexA残基中IdoA残基的百分比(也称为“差向异构化比率”)可以是例如0%或更多、10%或更多、20%或更多、30%或更多、40%或更多、或50%或更多、100%或更少、90%或更少、80%或更少、70%或更少、或60%或更少,或它们的组合。具体而言,差向异构化比率可以是例如0%至70%、20%至70%或30%至60%。在这种情况下,计算差向异构化比率时的“HexA残基”是指IdoA残基和GlcA残基,条件是排除在C-4和C-5之间具有双键的HexA残基。可以例如通过二糖分析测量差向异构化比率。也就是说,当对本发明的多糖进行二糖分析时,差向异构化比率可以计算为当HexA残基是IdoA残基时上述二糖单元的量相对于当HexA残基是IdoA残基或GlcA残基时上述二糖单元的总量的百分比(摩尔比率)。HexA残基的C-4和C-5之间的连接可以是双键。在C-4和C-5之间具有双键的HexA残基的位置没有特别限制。例如具体而言,C-4和C-5之间的连接可以是在非还原末端的HexA残基中的双键。也就是说,例如50%或更多、70%或更多、80%或更多、90%或更多、95%或更多、97%或更多、99%或更多、或100%的在C-4和C-5之间具有双键的HexA残基可以存在于非还原末端。另外,例如50%或更多、70%或更多、80%或更多、90%或更多、95%或更多、97%或更多、99%或更多、或100%的在C-4和C-5之间不具有双键的HexA残基可以存在于非还原末端以外的位置。另外,例如在非还原末端的50%或更多、70%或更多、80%或更多、90%或更多、95%或更多、97%或更多、99%或更多、或100%的HexA残基中C-4和C-5之间的连接可以是双键。另外,例如在非还原末端以外的位置的50%或更多、70%或更多、80%或更多、90%或更多、95%或更多、97%或更多、99%或更多、或100%的HexA残基中C-4和C-5之间的连接可以不是双键。
R1表示氢(-H)或硫酸基团(-SO3H)。在R1中硫酸基团的百分比可以与或者可以不与在IdoA残基和GlcA残基中的相同。在整个HexA残基的R1中硫酸基团的百分比(也称为“HexA残基的2-O-硫酸化比率”)、在IdoA残基的R1中硫酸基团的百分比(也称为“IdoA残基的2-O-硫酸化比率”)以及在GlcA残基的R1中硫酸基团的百分比(也称为“GlcA残基的2-O-硫酸化比率”)各自可以是例如0%或更多、5%或更多、10%或更多、15%或更多、20%或更多、30%或更多、40%或更多、50%或更多、60%或更多、70%或更多、80%或更多、或90%或更多、100%或更少、95%或更少、90%或更少、85%或更少、80%或更少、70%或更少、60%或更少、50%或更少、40%或更少、或30%或更少、或它们的一致的组合。具体而言,HexA残基的2-O-硫酸化比率可以是例如0%至80%、10%至70%或15%至70%。具体而言,IdoA残基的2-O-硫酸化比率可以是例如0%至100%、15%至100%或30%至100%。具体而言,GlcA残基的2-O-硫酸化比率可以是例如0%至50%、0%至40%或0%至30%。可以通过例如二糖分析测量在R1中硫酸基团的百分比。也就是说,当对本发明的多糖进行二糖分析时,HexA残基的2-O-硫酸化比率可以计算为当HexA残基是2-O-硫酸化HexA残基时上述二糖单元的量相对于上述二糖单元的总量的百分比(摩尔比率)。另外,当对本发明的多糖进行二糖分析时,IdoA残基的2-O-硫酸化比率可以计算为当HexA残基是2-O-硫酸化IdoA残基时上述二糖单元的量相对于当HexA残基是IdoA残基时上述二糖单元的总量的百分比(摩尔比率)。另外,当对本发明的多糖进行二糖分析时,GlcA残基的2-O-硫酸化比率可以计算为当HexA残基是2-O-硫酸化GlcA残基时上述二糖单元的量相对于当HexA残基是GlcA残基时上述二糖单元的总量的百分比(摩尔比率)。
R2表示氢(-H)或硫酸基团(-SO3H)。在R2中硫酸基团的百分比可以与或者可以不与在IdoA残基和GlcA残基中的相同。R2的硫酸基团不存在于天然肝素中。因此,例如,考虑到体内副反应,可以潜在优选R2中硫酸基团的百分比低。在整个HexA残基的R2中硫酸基团的百分比(也称为“HexA残基的3-O-硫酸化比率”)、在IdoA残基的R2中硫酸基团的百分比(也称为“IdoA残基的3-O-硫酸化比率”)以及在GlcA残基的R2中硫酸基团的百分比(也称为“GlcA残基的3-O-硫酸化比率”)各自可以是例如少于15%、少于10%、少于5%、少于3%、少于1%、少于0.5%、少于0.1%或0%。可以例如通过二糖分析测量在R2中硫酸基团的百分比。也就是说,当对本发明的多糖进行二糖分析时,HexA残基中的3-O-硫酸化比率可以计算为当HexA残基是3-O-硫酸化HexA残基时上述二糖单元的量相对于上述二糖单元的总量的百分比(摩尔比率)。另外,当对本发明的多糖进行二糖分析时,IdoA残基中的3-O-硫酸化比率可以计算为当HexA残基是3-O-硫酸化IdoA残基时上述二糖单元的量相对于当HexA残基是IdoA残基时上述二糖单元的总量的百分比(摩尔比率)。另外,当对本发明的多糖进行二糖分析时,GlcA残基中的3-O-硫酸化比率可以计算为当HexA残基是3-O-硫酸化GlcA残基时上述二糖单元的量相对于当HexA残基是GlcA残基时上述二糖单元的总量的百分比(摩尔比率)。
R3表示氢(-H)、硫酸基团(-SO3H)或乙酰基团(-COCH3)。R3的至少一部分是硫酸基团。在R3中硫酸基团的百分比(也称为“N-硫酸化比率”)可以是例如60%或更多、70%或更多、或80%或更多、100%或更少、95%或更少、或90%或更少,或它们的组合。具体而言,N-硫酸化比率可以是例如70%至100%或80%至95%。在R3中乙酰基团的百分比(也称为“N-乙酰化比率”)可以是例如0%或更多、1%或更多、1.5%或更多、3%或更多、5%或更多、7%或更多、9%或更多、或11%或更多、50%或更少、45%或更少、40%或更少、35%或更少、33%或更少、30%或更少、25%或更少、20%或更少、或17%或更少,或它们的组合。具体而言,N-乙酰化比率可以是例如0%至33%、1%至33%、7%至33%、7%至30%、或11%至17%。可以例如通过二糖分析测量N-硫酸化比率和N-乙酰化比率。也就是说,当对本发明的多糖进行二糖分析时,N-硫酸化比率可以计算为当GlcN残基是N-硫酸化GlcN残基时上述二糖单元的量相对于上述二糖单元的总量的百分比(摩尔比率)。另外,当对本发明的多糖进行二糖分析时,N-乙酰化比率可以计算为当GlcN残基是N-去乙酰化GlcN残基时上述二糖单元的量相对于上述二糖单元的总量的百分比(摩尔比率)。其中R3是氢、硫酸基团或乙酰基团的GlcN残基的位置没有特别限制。例如具体地,在还原端的GlcN残基中R3可以是氢或乙酰基团。也就是说,例如,50%或更多、70%或更多、80%或更多、90%或更多、95%或更多、97%或更多、99%或更多、或100%的其中R3是氢或乙酰基团的GlcN残基可以存在于还原末端。
R4表示氢(-H)或硫酸基团(-SO3H)。在R4中硫酸基团的百分比(也称为“GlcN残基中的3-O-硫酸化比率”或简称为“3-O-硫酸化比率”)为13%或更多。GlcN残基中的3-O-硫酸化比率可以是例如45%或更少、40%或更少或33%或更少。具体而言,GlcN残基中的3-O-硫酸化比率可以是例如13%至45%、13%至40%、或13%至33%。可以例如通过二糖分析测量GlcN残基的N-硫酸化比率。也就是说,当对本发明的多糖进行二糖分析时,GlcN残基的N-硫酸化比率可以计算为当GlcN是N-硫酸化GlcN时上述二糖单元的量相对于上述二糖单元的总量的百分比(摩尔比率)。
R5表示氢(-H)或硫酸基团(-SO3H)。R5的至少一部分是硫酸基团。在R5中硫酸基团的百分比(也称为“GlcN的6-O-硫酸化比率”或简称为“6-O-硫酸化比率”)可以是例如50%或更多、60%或更多、70%或更多、80%或更多、或90%或更多、100%或更少、或95%或更少,或它们的组合。具体而言,6-O-硫酸化比率可以是例如50至100%、60至100%、或70至100%。可以例如通过二糖分析测量6-O-硫酸化比率。也就是说,当对本发明的多糖进行二糖分析时,6-O-硫酸化比率可以计算为当GlcN残基是6-O-硫酸化GlcN残基时上述二糖单元的量相对于上述二糖单元的总量的百分比(摩尔比率)。
具体而言,本发明的多糖可以包含选自GlcA-GlcN(NS3S6S)、GlcA(2S)-GlcN(NS6S)、IdoA(2S)-GlcN(NS6S)、GlcA-GlcN(NS6S)、IdoA(2S)-GlcN(NS)、IdoA(2S)-GlcN(NS3S)、IdoA-GlcN(NS6S)和GlcA-GlcN(NS)的例如一种或多种,例如所有二糖单元。在本发明的多糖中GlcA-GlcN(NS3S6S)、GlcA(2S)-GlcN(NS6S)、IdoA(2S)-GlcN(NS6S)、GlcA-GlcN(NS6S)、IdoA(2S)-GlcN(NS)、IdoA(2S)-GlcN(NS3S)、IdoA-GlcN(NS6S)和GlcA-GlcN(NS)的总含有率可以是例如50%或更多、60%或更多、70%或更多、80%或更多、或90%或更多。可以例如通过二糖分析测量上述总含有率。也就是说,当对本发明的多糖进行二糖分析时,上述总含有率可以计算为GlcA-GlcN(NS3S6S)、GlcA(2S)-GlcN(NS6S)、IdoA(2S)-GlcN(NS6S)、GlcA-GlcN(NS6S)、IdoA(2S)-GlcN(NS)、IdoA(2S)-GlcN(NS3S)、IdoA-GlcN(NS6S)和GlcA-GlcN(NS)的总量相对于所述二糖的总量的百分比(摩尔比率)。在此类二糖单元的描述中,取代基的位置和类型写在括号中,并且未写在括号中的R1至R5表示氢(-H)。
本发明的多糖具有抗凝血活性。抗凝血活性具体指抗血液凝固活性。抗凝血活性包括抗因子Xa活性和抗因子IIa活性。本发明的多糖可以至少具有抗因子Xa活性。在本发明的多糖中抗因子Xa活性可以是例如100IU/mg或更多、200IU/mg或更多、300IU/mg或更多、或400IU/mg或更多。在本发明的多糖中抗因子Xa活性没有上限,并且可以是例如5000IU/mg或更少、2000IU/mg或更少、或1000IU/mg或更少。另外本发明的多糖可以具有高比率的抗因子Xa活性/抗因子IIa活性。在本发明的多糖中抗因子Xa活性/抗因子IIa活性的比率可以是例如1.5或更多、2或更多、2.5或更多、或3或更多。另外,在本发明的多糖中抗因子Xa活性/抗因子IIa活性的比率没有特别上限,并且可以是例如50或更少、20或更少、或10或更少。可以通过标准方法测量抗因子Xa活性和抗因子IIa活性两者。测量抗因子Xa活性和抗因子IIa活性的方法包括例如在实施例中描述的方法。
本发明的多糖可以是游离形式,盐形式或它们的混合物。也就是说,除非另有说明,术语“本发明的多糖(即硫酸乙酰肝素)”是指多糖的游离形式,或它的盐形式,或它们的混合物。也就是说,除非另有说明,存在于本发明的多糖中并可以形成盐的任何官能团可以是游离形式,可以形成盐,或者可以是它们的组合。具体而言例如,除非另有说明,在通式(I)和通式(II)中能够形成盐的任何官能团可以是游离形式,可以形成盐,或者可以是它们的组合。在通式(I)和通式(II)中能够形成盐的官能团包括当R1至R5是硫酸基团(-SO3H)和R3是氢(-H)时GlcN残基的氨基(-NH2)和HexA残基的羧基(-COOH)。也就是说,术语“硫酸基团”是指硫酸基团的游离形式,或形成盐的硫酸基团,或它们的组合。硫酸基团的说明可以应用于能够形成盐的其他官能团。盐包括药理学上可接受的盐。可以根据各种条件例如本发明的多糖的利用方面适当地选择药理学上可接受的盐。药理学上可接受的盐包括以下。酸性基团例如硫酸基团的盐的实例具体包括铵盐,含碱金属例如钠、钾和锂的盐,含碱土金属例如钙和镁的盐,铝盐,锌盐,含有机胺例如三乙胺、乙醇胺、吗啉、吡咯烷、哌啶、哌嗪和二环己基胺的盐,以及含碱性氨基酸例如精氨酸和赖氨酸的盐。另外,碱性基团例如氨基的盐的实例具体包括含无机酸例如盐酸、硫酸、磷酸、硝酸和氢溴酸的盐,含有机羧酸例如乙酸、柠檬酸、苯甲酸、马来酸、富马酸、酒石酸、琥珀酸、单宁酸、丁酸、羟苄基苯甲酸、双羟萘酸、庚酸、癸酸、teoclic acid、水杨酸、乳酸、草酸、扁桃酸和苹果酸的盐,以及含有机磺酸例如甲磺酸、苯磺酸和对甲苯磺酸的盐。盐可以选自例如铵盐、钠盐、锂盐和钙盐。作为盐,可以使用一种盐,或者可以组合使用两种或更多种盐。
<2>生产本发明的多糖的方法
生产本发明的多糖的技术没有特别限制。可以通过从其他多糖衍生(即使用其他多糖作为原材料)生产本发明的多糖。其他多糖包括糖胺聚糖(GAG)。GAG包括N-乙酰肝素前体(也简称为“肝素前体”)和除了本发明的多糖之外的硫酸乙酰肝素。肝素前体是由葡萄糖醛酸(GlcA)残基和N-乙酰-D-氨基葡萄糖(GlcNAc)残基组成的二糖的重复结构[→4)-β-GlcA-(1→4)-α-GlcNAc-(1→]组成的多糖。可以通过例如物理技术、化学技术、酶技术或它们的组合实施使用其他多糖作为原材料的本发明的多糖的生产。具体而言,使用其他多糖作为原材料,可以通过调节到预定的分子量、以预定比率进行异构化、以预定比率进行官能团的导入或去除,或它们的组合生产本发明的多糖。可以完全由单糖等作为原材料合成本发明的多糖。
以下说明由肝素前体生产本发明的多糖的方法的一个实例。
可以例如通过将肝素前体部分去乙酰化,随后用肝素酶III处理以进行低分子化,然后将生成的低分子产物转化为本发明的多糖来生产本发明的多糖。也就是说,生产本发明的多糖的方法包括以下方法,所述方法包含将肝素前体部分去乙酰化的(A)步骤,用肝素酶III处理步骤(A)中的产物以进行低分子化的(B)步骤,以及从步骤(B)中的产物生产本发明的多糖的(C)步骤。步骤(A)、(B)和(C)也分别称为“N-去乙酰化步骤”、“低分子化步骤”和“硫酸乙酰肝素生产步骤”。根据该方法,特别地,可以有效地生产具有所期望的平均分子量的本发明的多糖。
<2-1>肝素前体的生产
可以通过利用具有生产肝素前体能力的细菌(也称为“肝素前体生产细菌”)的发酵方法生产肝素前体(WO2015/050184)。
在本发明中,所述“具有生产肝素前体能力的细菌(肝素前体生产细菌)”是指具有在培养基中培养时生产肝素前体并且在培养基中积累肝素前体至可以回收肝素前体的程度的能力的细菌。具有生产肝素前体能力的细菌可以是能够在培养基中以50mg/L或更多、100mg/L或更多、200mg/L或更多、或300mg/L或更多的量积累肝素前体的细菌。
细菌的类型没有特别限制。细菌包括属于埃希氏菌属的细菌。属于埃希氏菌属的细菌没有特别限制,并且包括通过微生物学专家已知的分类法分类为埃希氏菌属的细菌。属于埃希氏菌属的细菌包括例如由Neidhardt等人的文献(Backmann,B.J.1996.Derivations and Genotypes of some mutant derivatives of Escherichiacoli K-12,p.2460-2488.Table 1.In F.D.Neidhardt(ed.),Escherichia coli andSalmonella Cellular and Molecular Biology/Second Edition,American Society forMicrobiology Press,Washington,D.C.)中描述的那些。属于埃希氏菌属的细菌的实例包括大肠杆菌。大肠杆菌的实例包括大肠杆菌K-12菌株例如W3110菌株(ATCC 27325)和MG1655菌株(ATCC 47076);大肠杆菌K5菌株(ATCC 23506);大肠杆菌B菌株例如BL21(DE3)菌株,以及它们的衍生菌株。
这些细菌菌株可以从美国典型培养物保藏中心(地址:12301Parklawn Drive,Rockville,Maryland 20852P.O.Box 1549,Manassas,VA 20108,United States ofAmerica)购买。也就是说,已经将登录号分配给每个细菌菌株,并且可以利用该登录号购买细菌菌株(参见http://www.atcc.org/)。美国典型培养物保藏中心的目录上已经列出对应于每个细菌菌株的登录号。可从例如Life Technologies获得BL21(DE3)菌株(产品编号C6000-03)。
具有生产肝素前体能力的细菌可以是固有具有生产肝素前体能力的细菌或经修饰以具有生产肝素前体能力的细菌。固有具有生产肝素前体能力的细菌包括大肠杆菌K5菌株(ATCC 23506)。可以通过赋予如上所述的细菌生产肝素前体的能力以获得具有生产肝素前体能力的细菌。可以修饰固有具有生产肝素前体能力的细菌以增加生产肝素前体的能力并使用。
可以通过导入编码参与肝素前体生产的蛋白质的基因来赋予生产肝素前体的能力。参与肝素前体生产的蛋白质包括糖基转移酶和肝素前体外排载体蛋白。在本发明中,可以导入一个基因,或者可以导入两个或更多个基因。可以和下述用于增加基因的拷贝数的技术的情况一样地实施基因的导入。
这里提到的“糖基转移酶”是指具有催化以下反应的活性的蛋白质,在所述反应中将N-乙酰-D-氨基葡萄糖(GlcNAc)和/或葡萄糖醛酸(GlcA)添加到糖链的非还原末端以延伸肝素前体链。该活性也称为“糖基转移酶活性”。编码糖基转移酶的基因包括kfiA基因、kfiC基因和pmHS1基因。
kfiA基因和kfiC基因包括大肠杆菌K5菌株中的kfiA基因和kfiC基因。在大肠杆菌K5菌株中由kfiA基因编码的KfiA蛋白使用UDP-GlcNAc作为底物,将GlcNAc添加至糖链的非还原末端。在大肠杆菌K5菌株中由kfiC基因编码的KfiC蛋白使用UDP-GlcA作为底物将GlcA添加至糖链的非还原末端。在大肠杆菌K5菌株中kfiA基因和kfiC基因与kfiB和kfiD基因一起构成KfiABCD操纵子(也称为区域2)。在大肠杆菌K5菌株中包括KfiABCD操纵子的区域的核苷酸序列如SEQ ID NO:1中所示。在SEQ ID NO:1中所示的核苷酸序列中,kfiA、kfiB、kfiC和kfiD基因分别对应于445至1164位的序列、1593至3284位的序列、4576至6138位的序列和6180至7358位的序列。KfiA、KfiB、KfiC和KfiD蛋白的氨基酸序列如SEQ ID NO:2至5中所示。
pmHS1基因包括在多杀巴斯德氏菌(Pasteurella multocida)D型菌株中的pmHS1基因。在多杀巴斯德氏菌D型菌株中由pmHS1基因编码的PmHS1蛋白使用UDP-GlcNAc和UDP-GlcA两者作为底物,将GlcNAc和GlcA交替添加至糖链的非还原末端。
这里提到的“肝素前体外排载体蛋白”是指具有通过细胞膜将肝素前体链带出细胞的活性的蛋白质。该活性也称为“肝素前体外排活性”。编码肝素前体外排载体蛋白的基因包括kpsC、kpsD、kpsE、kpsM、kpsS和kpsT基因。kpsC、kpsD、kpsE、kpsM、kpsS和kpsT基因包括在大肠杆菌K5菌株和大肠杆菌B菌株中的kpsC、kpsD、kpsE、kpsM、kpsS和kpsT基因。在这些菌株中KpsC、kpsD、kpsE和KpsS基因与kpsF和kpsU基因一起构成kpsFEDUCS操纵子(也称为区域1)。另外,kpsM和kpsT基因构成kpsMT操纵子(也称为区域3)。
可以根据要使用的细菌的类型适当地选择要导入的基因。也就是说,可以通过修饰细菌以具有编码糖基转移酶的基因和编码肝素前体外排载体蛋白的基因两者来赋予细菌生产肝素前体的能力。例如,大肠杆菌B菌株具有编码肝素前体外排载体蛋白的基因,但不具有编码糖基转移酶的基因。因此,可以通过导入编码糖基转移酶的基因赋予大肠杆菌B菌株生产肝素前体的能力。另外,例如大肠杆菌K-12菌株既不具有编码糖基转移酶的基因也不具有编码肝素前体外排载体蛋白的基因。因此,可以通过导入编码糖基转移酶的基因和编码肝素前体外排载体蛋白的基因两者赋予大肠杆菌K-12菌株生产肝素前体的能力。
也就是说,具有生产肝素前体的能力的埃希氏菌属细菌的实例包括大肠杆菌K5菌株;通过将源自大肠杆菌K5菌株的kfiA基因和kfiC基因导入大肠杆菌B菌株例如BL21(DE3)中获得的菌株;通过将源自大肠杆菌K5菌株的kfiA基因和kfiC基因以及源自大肠杆菌K5菌株或大肠杆菌B菌株的kpsC、kpsD、kpsE、kpsM、kpsS和kpsT基因导入大肠杆菌K-12菌株例如W3110菌株和MG1655菌株中获得的菌株;以及它们的衍生菌株。通过将源自大肠杆菌K5菌株的kfiA基因和kfiC基因导入大肠杆菌B菌株中获得的菌株的实例具体包括大肠杆菌BL21(DE3)/pVK9-kfiABCD(WO2015/050184)。
另外,可以修饰具有生产肝素前体能力的细菌以提高细菌最初具有的编码参与肝素前体生产的蛋白质的基因中的基因的表达。也就是说,例如,可以修饰大肠杆菌K5菌株使得编码参与肝素前体生产的蛋白质的一个或多个基因的表达得到提高。另外,例如,可以修饰大肠杆菌B菌株使得编码肝素前体外排载体蛋白的一个或多个基因的表达得到提高。
另外,只要不损害生产肝素前体的能力,可以对具有生产肝素前体能力的细菌进行其他修饰。例如,可以修饰具有生产肝素前体能力的细菌使得选自kfiB、kfiD、kpsF和kpsU基因的一个或多个基因的表达得到提高。也就是说,例如,当导入编码糖基转移酶的基因时,可以共同导入区域2,而当导入编码糖基转移酶的基因和编码肝素前体外排载体蛋白的基因时,可以共同导入区域1至3。kfiB基因和kfiD基因包括大肠杆菌K5菌株中的kfiB基因和kfiD基因。kpsF基因和kpsU基因包括大肠杆菌K5菌株和大肠杆菌B菌株中的kpsF基因和kpsU基因。
可以修饰具有生产肝素前体能力的细菌使得选自rbsR、rbsK、rbsB、hsrA、glgB、lgX、micF、rcsD、rcsB、ybiX、ybiI、ybiJ、ybiC、ybiB、rfaH、nusG、pcoR、pcoS、pcoE、yhcN、yhcO、aaeB、aaeA、aaeX、g1455、alpA、g1453、yrbA、mlaB、mlaC、mlaD、mlaE、mlaF、yrbG、norW、ybjI、ybjJ、ybjK、rybB、yjjY、yjtD、thrL、thrA、thrB、fruA、psuK、ytfT、yjfF、fbp、yagU、paoA、paoB、gsiC、gsiD、yliE、irp2、irp1、bhsA、ycfS、lepB、rnc、era、dapA、gcvR、bcp、hyfA、rpoE、nadB、yfiC、srmB、g1414、g1413、nuoE、nuoF、nuoG、glmZ、hemY、hemX、hemD、rlmL、artQ、artM、artJ、rlmC、ybjO、yejO、yejM、yejL、rpoS、ygbN、ygbM、ygbL、g3798、g3797、g3796、g3795、g3794、g3793、g3792、ryjA、soxR、soxS、yjcC、yjcB、efeU、efeO、slyA、hns、pgm、galF、ugd、glmU、glmS、glmM和rcsA的一个或多个基因的表达得到提高(WO2015/050184、Journalof Technical Disclosure No.2015-501775)。这些基因包括在大肠杆菌例如大肠杆菌K-12MG1655菌株、BL21(DE3)菌株和K5菌株中的基因,以及在其他各种细菌中的基因。
“基因的表达得到提高”不仅涵盖增加最初表达目标基因的细菌菌株中的目标基因的表达量,而且涵盖在最初不表达目标基因的细菌菌株中表达目标基因。也就是说,“基因的表达得到提高”涵盖例如将目标基因导入最初不表达目标基因的细菌菌株中并表达目标基因。可以通过例如增加基因的拷贝数和增加基因的转录和翻译来提高基因的表达。可以通过将其中已经安装了基因的载体导入到宿主中或将基因导入到宿主的染色体上来增加基因的拷贝数。可以通过从具有基因的生物体克隆或化学合成来获得要导入的基因。可以以原始状态或以适当的修饰利用获得的基因。可以通过修饰基因的表达调控序列例如启动子和SD序列来增加基因的转录和翻译。
可以从公共数据库例如NCBI(http://www.ncbi.nlm.nih.gov/)和参考文献例如WO2015/050184和Journal of Technical Disclosure No.2015-501775获得用于细菌修饰例如赋予生产肝素前体能力的基因的核苷酸序列和由此类基因编码的蛋白质的氨基酸序列。
用于细菌修饰例如赋予生产肝素前体能力的基因不限于以上例示的基因和具有已知核苷酸序列的基因,并且可以是它们的变体,只要所述基因编码保持原始功能的蛋白质。变体包括已知基因的同源物和人工修饰的基因。短语“保持原始功能”是指就糖基转移酶的功能而言具有糖基转移酶活性的蛋白质变体,以及就肝素前体外排载体蛋白的功能而言具有肝素前体外排载体活性的蛋白质变体。例如,用于细菌的修饰例如赋予生产肝素前体能力的基因可以是编码具有在已知蛋白质的氨基酸序列中一个或几个位置的一个或几个(例如1至50、1至40、1至30、优选1至20、更优选1至10、仍优选1至5、特别优选1至3)氨基酸的取代、缺失、插入或添加的氨基酸序列的蛋白质的基因。例如,用于细菌的修饰例如赋予生产肝素前体能力的基因可以是编码与已知蛋白质的氨基酸序列具有例如50%或更多、65%或更多、80%或更多、优选90%或更多、更优选95%或更多、仍优选97%或更多以及特别优选99%或更多同一性的蛋白质的基因。此类变体的描述可以应用于其他蛋白质例如肝素酶III和编码它们的基因。
通过培养肝素前体生产细菌在培养基中积累肝素前体。肝素前体生产细菌的培养条件没有特别限制,只要获得所期望的肝素前体的量。可以根据各种条件例如参与肝素前体生产的基因的表达系统的配置和宿主的类型来适当地配置肝素前体生产细菌的培养条件。培养可以在有氧条件下,例如使用含有各种有机成分和无机成分例如碳源、氮源和微量营养的液体培养基于30至37℃实施16至72小时(WO2015/050184)。
可以在包含在培养液中时对肝素前体进行N-去乙酰化步骤,或者可以从培养液中回收肝素前体随后进行N-去乙酰化步骤。从培养液中回收肝素前体的规程没有特别限制。回收肝素前体的规程包括用于分离和纯化化合物的已知技术例如膜处理法和沉淀法。例如,可以沉淀在培养上清液中的肝素前体并通过从培养液中分离上清液然后添加与水混溶的有机溶剂例如乙醇或甲醇来回收(WO2015/050184)。要添加的有机溶剂的量可以是上清液的量的2.5至3.5倍。可以适当地对肝素前体进行处理例如纯化、稀释、浓缩、干燥和溶解,随后进行N-去乙酰化步骤。可以实施纯化至所期望的程度。可以单独或以适当组合来实施这些处理。
<2-2>N-去乙酰化步骤
N-去乙酰化步骤是其中肝素前体部分N-去乙酰化的步骤。N-去乙酰化步骤的产物(部分N-去乙酰化的肝素前体)也称为“N-去乙酰化肝素前体”。“肝素前体部分N-去乙酰化”是指N-去乙酰化肝素前体使得肝素前体的一部分N-乙酰基团保留。通过允许肝素前体的一部分N-乙酰基团保留,可以在低分子化步骤中优先切割具有N-乙酰基团的氨基葡萄糖残基的位点,从而可以有效地生产具有所期望的平均分子量的本发明的多糖。N-去乙酰化的程度没有特别限制,只要可以生产本发明的多糖。可以实施N-去乙酰化步骤使得N-乙酰基团的残留率变为以下值。也就是说,N-乙酰基团的残留率可以是例如1%或更多、1.5%或更多、3%或更多、5%或更多、7%或更多、9%或更多、或11%或更多、50%或更少、45%或更少、40%或更少、35%或更少、33%或更少、30%或更少、25%或更少、20%或更少、或17%或更少,或它们的组合。具体而言,N-乙酰基团的残留率可以是例如1%至33%、7%至33%、7%至30%、或11%至17%。例如,N-乙酰基团的残留率为7%至30%大约对应于N-乙酰基团以每6至28个糖残基一个N-乙酰基团的比率存在的状态(每3至14个作为二糖单元的单元一个)。另外例如,N-乙酰基团的残留率为11%至17%大约对应于N-乙酰基团以每12至18个糖残基一个N-乙酰基团的比率存在的状态(每6至9个作为二糖单元的单元一个)。可以例如通过二糖分析证实N-去乙酰化的程度(即N-乙酰基团的残留率)。可以作为前述的N-乙酰化比率测量N-乙酰基团的残留率。
在低分子化步骤后可以适当地除去残留的N-乙酰基团。例如,在低分子化步骤后的任何时间可以实施进一步的N-去乙酰化,或者可以实施进一步的N-去乙酰化和N-硫酸化。
实施N-去乙酰化步骤的规程没有特别限制,只要获得所期望的N-去乙酰化的程度。可以使用去乙酰化试剂以化学方式实施去乙酰化步骤。去乙酰化试剂包括氢氧化钠和肼。
作为利用氢氧化钠N-去乙酰化的条件,例如,可以参考先前报道的条件(KuberanB.et al.,(2003)"Chemoenzymatic Synthesis of Classical and Non-classicalAnticoagulant Heparan Sulfate Polysaccharides."J.Biol.Chem.,278(52):52613-52621.和US2011281820A1)。也就是说,可以通过将肝素前体溶解在氢氧化钠水溶液中并加热来实施N-去乙酰化。可以适当地配置其反应体系中各组分的浓度、反应温度和反应时间使得获得所期望的N-去乙酰化的程度。肝素前体的浓度可以是例如0.05%(w/v)至50%(w/v)。氢氧化钠的浓度可以是例如1M至5M。反应温度可以是例如40至80℃。反应时间可以是例如5分钟至30小时。
作为利用肼N-去乙酰化的条件,例如,可以参考先前报道的条件([1]Glycobiology,10(2000)159-171,[2]Carbohydrate Research,290(1996)87-96,[3]Biochem.J.217(1984)187-197)。另外利用肼N-去乙酰化的条件具体包括例如在实施例中描述的条件。也就是说,可以例如通过将肝素前体溶解在含有硫酸或硫酸肼的肼的水溶液中,用惰性气体例如氮气替换气相并加热来实施N-去乙酰化。肼包括无水肼和一水合肼。例如,一水合肼可以直接地或通过适当地稀释用作肼的水溶液。加热后,可以用冰冷却终止反应。然后可以用碘还原糖链的末端。可以适当地配置其反应体系中各组分的浓度、反应温度和反应时间使得获得所期望的N-去乙酰化的程度。肝素前体的浓度可以是例如0.05%(w/v)至50%(w/v)。肼的浓度可以是例如10%(w/v)至70%(w/v)。硫酸或硫酸肼的浓度可以是例如0.01M至0.1M。反应温度可以是例如60至118℃。反应时间可以是例如5分钟至20小时。具体例如,当在实施例中描述的条件下实施N-去乙酰化时,反应时间可以是例如4至5小时。
通过以这种方式实施N-去乙酰化来生产N-去乙酰化肝素前体。可以在N-去乙酰化步骤中包含在反应溶液中时对N-去乙酰化肝素前体进行低分子化步骤,或者可以从反应溶液中回收N-去乙酰化肝素前体随后进行低分子化步骤。从反应溶液中回收N-去乙酰化肝素前体的规程没有特别限制。回收N-去乙酰化肝素前体的规程包括用于分离和纯化化合物的已知技术例如膜处理法和沉淀法。可以适当地对N-去乙酰化肝素前体进行处理例如纯化、中和、脱盐、稀释、浓缩、干燥和溶解,随后进行低分子化步骤。可以实施纯化至所期望的程度。可以单独或以适当组合来实施这些处理。
<2-3>低分子化步骤
低分子化步骤是用肝素酶III切割N-去乙酰化肝素前体以制备小分子的步骤。通过低分子化步骤生产低分子化的N-去乙酰化肝素前体。低分子化步骤的产物(低分子化的N-去乙酰化肝素前体)也称为“低分子量N-去乙酰化肝素前体”。低分子化的程度没有特别限制,只要可以生产本发明的多糖。可以实施低分子化步骤例如使得低分子量N-去乙酰化肝素前体的平均分子量变为如后所述的本发明的多糖的平均分子量(例如,作为通过使用普鲁兰多糖作为标准的GPC测量的值为1000至150000、优选8000至60000的数均分子量(Mn),以及2000至300000、优选10000至100000的重均分子量(Mw))。
可以例如通过测量其分子量证实低分子化的程度。可以通过标准方法实施分子量的测量。测量分子量的方法包括凝胶渗透色谱(GPC),以及使用紫外和可见光吸收检测器(UV)和折射率检测器(RI)的水性尺寸排阻色谱(SEC)(SEC-RI/UV法;依照欧洲药典(EP))。具体而言,通过GPC测量分子量的条件包括例如在实施例中描述的条件。作为通过使用普鲁兰多糖作为标准的GPC测量的值,低分子化的N-去乙酰化肝素前体的数均分子量(Mn)可以是例如1000至150000、3000至36000、或4000至26000、或5000至36000、或12000至26000。作为通过使用普鲁兰多糖作为标准的GPC测量的值,低分子化的N-去乙酰化肝素前体的重均分子量(Mw)可以是例如2000至300000、5000至60000、6000至70000、或9000至35000,或可以是7000至60000、或17000至35000。可以在实施一部分或全部生产硫酸乙酰肝素的步骤例如下述的硫酸化步骤后测量分子量以证实低分子化的程度。当在实施一部分或全部生产硫酸乙酰肝素的步骤后测量分子量,可以考虑取决于所实施的步骤的分子量的变化。当在实施一部分或全部生产硫酸乙酰肝素的步骤后测量产物的分子量,作为通过使用普鲁兰多糖作为标准的GPC测量的值,产物的数均分子量(Mn)可以是1000至150000、2000至100000、4000至80000、7000至42000或15000至30000,并且产物的重均分子量(Mw)可以是2000至300000、5000至150000、5000至100000、8000至70000、8000至41000、或21000至41000。
“肝素酶III”是指切割糖胺聚糖例如肝素前体的N-硫酸化或N-去乙酰化氨基葡萄糖残基的位点的酶(通常为EC 4.2.2.8)。在本发明中要使用的肝素酶III没有特别限制,只要它可以优先切割N-去乙酰化肝素前体中具有N-乙酰基团的氨基葡萄糖残基的位点。“优先切割具有N-乙酰基团的氨基葡萄糖残基的位点”是指相比不具有N-乙酰基团的氨基葡萄糖残基的位点,更优先切割具有N-乙酰基团的氨基葡萄糖残基的位点。“优先切割具有N-乙酰基团的氨基葡萄糖残基的位点”可以指切割具有N-乙酰基团的氨基葡萄糖残基的位点但基本上不切割不具有N-乙酰基团的氨基葡萄糖残基的位点。“切割氨基葡萄糖残基的位点”是指切割氨基葡萄糖残基与其下游(在还原末端侧)的葡萄糖醛酸(GlcA)残基间的α-1,4-糖苷键。
肝素酶III的来源没有特别限制,并且肝素酶可以源自任何微生物、动物和植物。已知肝素酶III的变体例如同源物和人工修饰酶可以用作肝素酶III。具体而言,肝素酶III包括源自肝素黄杆菌(Flavobacterium heparinum)、多形拟杆菌(Bacteroidesthetaiotaomicron)、埃氏拟杆菌(Bacteroides eggerthii)等的细菌肝素酶III。编码肝素黄杆菌ATCC 13125中肝素酶III的hepC基因的核苷酸序列和肝素酶III(HepC)的氨基酸序列分别如SEQ ID NO:16和17所示。
可以通过允许具有编码肝素酶III的基因(肝素酶III基因)的宿主表达所述基因来生产肝素酶III。具有肝素酶III基因的宿主也称为具有肝素酶III的宿主。具有肝素酶III基因的宿主可以是固有具有肝素酶III基因的宿主或经修饰以具有肝素酶III基因的宿主。固有具有肝素酶III基因的宿主包括上述肝素酶III源自其中的细菌。经修饰以具有肝素酶III基因的宿主包括其中已经导入肝素酶III基因的宿主。已经导入肝素酶III基因的宿主没有特别限制,只要它可以表达功能性肝素酶III。宿主包括细菌、放线菌、酵母、真菌、植物细胞、昆虫细胞和动物细胞。细菌包括肠杆菌科细菌和棒状细菌群。肠杆菌科细菌包括埃希氏菌属细菌例如大肠杆菌。棒状细菌群包括棒状杆菌属细菌例如谷氨酸棒杆菌。可以以提高肝素酶III基因的表达的方式修饰并使用固有具有肝素酶III基因的宿主。可以通过培养具有肝素酶III基因的宿主表达肝素酶III基因并且获得含有肝素酶III的培养物。可以根据各种条件例如肝素酶III基因的表达系统的构成和宿主的类型适当地配置培养宿主的条件。
也可以通过在无细胞蛋白质合成系统中表达肝素酶III基因来生产肝素酶III。
另外,市售产品可以用作肝素酶III。
可以直接使用培养液等中含有的肝素酶III或者可以在从培养液等中回收它后使用肝素酶III。也就是说,可以使用纯化的肝素酶III(纯化酶),或者可以使用含有肝素酶III的任何级分作为肝素酶III。可以通过用于分离和纯化蛋白质的已知技术实施肝素酶III的回收。可以纯化肝素酶III至所期望的程度。可以以游离状态或者以酶固定化于固相例如树脂的状态利用肝素酶III。含有肝素酶III的级分没有特别限制,只要含有的肝素酶III能够作用于N-去乙酰化肝素前体。含有肝素酶III的级分包括具有肝素酶III基因的宿主的培养物、收集自所述培养物的微生物细胞(培养的微生物细胞)、所述微生物细胞的破碎产物、所述微生物细胞的裂解产物、所述微生物细胞的提取产物(无细胞提取液)、经处理的微生物细胞例如通过将微生物细胞固定化于载体例如丙烯酰胺或卡拉胶获得的固定化的微生物细胞、收集自所述培养物的培养上清液以及它们的部分纯化的产物(粗纯化产物)。这些级分各自可以单独或与纯化的肝素酶III组合利用。
可以通过允许肝素酶III作用于N-去乙酰化肝素前体来实施低分子化步骤。具体而言,可以通过允许肝素酶III和N-去乙酰化肝素前体在反应溶液中共存来实现允许肝素酶III作用于N-去乙酰化肝素前体。也就是说,可以在适当的反应溶液中实施低分子化步骤。可以通过分批系统或柱系统实施低分子化步骤。在分批系统中,例如,可以通过将肝素酶III和N-去乙酰化肝素前体在反应容器中的反应溶液中混合来实施低分子化步骤。可以在静置下实施或者在搅拌或振荡下实施低分子化步骤。在柱系统中,例如,可以通过使含有N-去乙酰化肝素前体的反应溶液通过填充有固定化微生物细胞或固定化酶的柱子来实施低分子化步骤。所述反应溶液包括水性介质(水性溶剂)例如水和水性缓冲液。
除了N-去乙酰化肝素前体外,如有必要,反应溶液可以含有除N-去乙酰化肝素前体外的组分。除N-去乙酰化肝素前体外的组分包括金属离子和pH缓冲剂。可以根据各种条件例如要使用的肝素酶III的性质适当地配置反应溶液中含有的组分的类型和浓度。
条件(反应溶液的pH、反应温度、反应时间、各组分的浓度等)没有特别限制,只要获得所期望的低分子化的程度。也就是说,可以适当地配置反应条件使得获得所期望的低分子化的程度。具体而言,反应条件包括例如在实施例中描述的条件。在反应溶液中N-去乙酰化肝素前体的浓度可以是例如,0.05%(w/v)至50%(w/v)。在反应溶液中肝素酶III的浓度可以是例如,6.3IU/L至6.3×104IU/L或6.3×101IU/L至6.3×103IU/L。在反应溶液中pH值可以通常是例如,6.0至10.0,优选6.5至9.0。反应温度可以通常是例如,15至50℃,优选15至45℃,更优选20至40℃。反应时间可以通常是例如,5分钟至20小时,优选10分钟至10小时。具体例如,当在实施例中描述的条件下实施低分子化,反应时间可以是5至10小时。在柱系统的情况下,反应溶液的液体通过速度可以是例如,使得反应时间在以上例示的反应时间内的速度。
可以例如基于在pH 7.0和37℃下使用肝素前体为底物实施的酶促反应中,以对酶和底物依赖的方式的不饱和己糖醛酸的产生来测量肝素酶III的活性。不饱和己糖醛酸的产生可以作为A232nm的增加来测量。将每分钟产生1μmol不饱和己糖醛酸的酶的量定义为一个国际单位(IU)。
在低分子化步骤的过程中,可以单独或以任何组合将肝素酶III、N-去乙酰化肝素前体和其他组分另外供应给反应溶液。这些组分可以供应一次或多次,或者可以连续供应。
另外,反应条件可以从低分子化步骤的开始至结束是一致的,或者可以在低分子化步骤的过程中改变。该“反应条件在低分子化步骤的过程中改变”不仅包括反应条件在时间上改变,也包括反应条件在空间上改变。该“反应条件在空间上改变”是指例如,当在柱系统中实施低分子化步骤时,反应条件例如反应温度和酶浓度等根据流路上的位置而不同。
通过以这种方式实施低分子化步骤来生产低分子化的N-去乙酰化肝素前体。对低分子化步骤的反应溶液中的低分子化的N-去乙酰化肝素前体可以直接进行硫酸乙酰肝素生产步骤,或者可以从反应溶液中回收然后进行硫酸乙酰肝素生产步骤。回收低分子化的N-去乙酰化肝素前体的规程没有特别限制。回收低分子化的N-去乙酰化肝素前体的规程包括用于分离和纯化化合物的已知技术例如膜处理法和沉淀法。可以适当地对低分子化的N-去乙酰化肝素前体进行处理例如纯化、稀释、浓缩、干燥和溶解,然后进行硫酸乙酰肝素生产步骤。可以实施纯化至所期望的程度。可以单独或以适当组合来实施这些处理。
<2-4>硫酸乙酰肝素生产步骤
硫酸乙酰肝素生产步骤是从低分子化的N-去乙酰化肝素前体生产本发明的多糖的步骤。硫酸乙酰肝素生产步骤可以包含一个或多个,例如所有选自以下的步骤:N-硫酸化、C5-差向异构化、2-O-硫酸化、GlcN残基中的3-O-硫酸化,和低分子化的N-去乙酰化肝素前体的6-O-硫酸化步骤。在硫酸乙酰肝素生产步骤中包括的步骤的类型没有特别限制,只要获得本发明的多糖。也就是说,可以根据本发明的多糖的结构适当地配置在硫酸乙酰肝素生产步骤中包括的步骤的类型。硫酸乙酰肝素生产步骤可以包含例如,至少N-硫酸化、GlcN残基中的3-O-硫酸化,和6-O-硫酸化步骤。
实施硫酸乙酰肝素生产步骤中包括的各步骤的顺序没有特别限制,只要获得本发明的多糖。可以根据各种条件例如实施各步骤的规程和在各步骤中使用的酶的底物特异性来适当地配置实施硫酸乙酰肝素生产步骤中包括的各步骤的顺序。硫酸乙酰肝素生产步骤中包括的步骤可以各自独立实施或者不独立实施。也就是说,可以在一部分或全部时期中同时实施硫酸乙酰肝素生产步骤中包括的步骤的一部分或全部。
可以按照以下步骤C1和C3的顺序实施硫酸乙酰肝素生产步骤。
(C1)N-硫酸化
(C3)GlcN残基中的3-O-硫酸化和6-O-硫酸化
可以按照以下步骤C1、C2和C3的顺序实施硫酸乙酰肝素生产步骤。
(C1)N-硫酸化
(C2)C5-差向异构化和2-O-硫酸化
(C3)GlcN残基中的3-O-硫酸化和6-O-硫酸化
步骤C2可以按照C5-差向异构化和2-O-硫酸化的顺序实施,或者可以按照2-O-硫酸化和C5-差向异构化的顺序实施。在步骤C2中,可以在一部分或全部反应时期中同时实施C5-差向异构化和2-O-硫酸化。
步骤C3可以按照GlcN残基中的3-O-硫酸化和6-O-硫酸化的顺序实施,或者可以按照6-O-硫酸化和GlcN残基中的3-O-硫酸化的顺序实施。
以下,除非另有说明,否则以按照N-硫酸化、C5-差向异构化、2-O-硫酸化、GlcN残基中的3-O-硫酸化和6-O-硫酸化的顺序实施硫酸乙酰肝素生产步骤的假设说明各步骤。当硫酸乙酰肝素生产步骤中包括的步骤的类型和实施各步骤的顺序与上述不同,可以根据所选择的步骤的类型和配置的实施步骤的顺序适当地解读该说明。
N-硫酸化是对低分子化的N-去乙酰化肝素前体中的氨基硫酸化的步骤。可以使用硫酸化试剂以化学方式实施N-硫酸化。硫酸化试剂包括三氧化硫复合物例如三氧化硫吡啶复合物(PySO3)和三氧化硫三甲胺复合物(TMASO3)。本领域技术人员可以适当地配置N-硫酸化的反应条件。作为N-硫酸化的反应条件,可以参考先前报道的条件(Kuberan B.et al.,(2003)"Chemoenzymatic Synthesis of Classical and Non-classical AnticoagulantHeparan Sulfate Polysaccharides."J.Biol.Chem.,278(52):52613-52621.;US8227449B2(Jul.24,2012))。具体而言,N-硫酸化的反应条件包括例如实施例中描述的条件。N-硫酸化的程度没有特别限制,只要获得本发明的多糖。也就是说,可以实施N-硫酸化以获得以上例示的N-硫酸化比率。另外,可以实施N-硫酸化使得N-硫酸化90%或更多、95%或更多、99%或更多或全部N-去乙酰化的氨基葡萄糖残基。可以例如通过二糖分析证实N-硫酸化的程度(即N-硫酸化比率)。
C5-差向异构化是将N-硫酸化产物中的葡萄糖醛酸(GlcA)残基异构化为艾杜糖醛酸(IdoA)残基的步骤。可以利用C5-差向异构酶以酶促方式实施C5-差向异构化。C5-差向异构酶没有特别限制,只要它可以催化葡萄糖醛酸(GlcA)残基向艾杜糖醛酸(IdoA)残基的异构化。另外,根据C5-差向异构化和其他步骤的顺序,可以选择和使用具有适当的底物特异性的C5-差向异构酶。C5-差向异构酶可以源自任何动物、植物、微生物等。例如,人C5-差向异构酶可以用作C5-差向异构酶。另外,已知C5-差向异构酶的变体例如同源物和人工修饰酶可以用作C5-差向异构酶。对于肝素酶III的生产方法和利用方面的描述可以应用于C5-差向异构酶的生产方法和利用方面。本领域技术人员可以适当地配置C5-差向异构化的反应条件。作为C5-差向异构化的反应条件,可以参考先前报道的条件(Chen J,et al.,"Enzymatic redesigning of biologically active heparan sulfate."J.Biol.Chem.2005Dec 30;280(52):42817-25)。具体而言,C5-差向异构化的反应条件包括例如实施例中描述的条件。C5-差向异构化的程度没有特别限制,只要获得本发明的多糖。也就是说,可以实施C5-差向异构化使得获得以上例示的差向异构化比率。
2-O-硫酸化是对C5-差向异构化的产物中的IdoA残基中2-O位硫酸化的步骤。可以利用2-O-硫酸化酶(2-OST)以酶促方式实施2-O-硫酸化。2-OST没有特别限制,只要它可以催化IdoA残基的2-O位的硫酸化。2-OST可以进一步能够催化GlcA残基的2-O位的硫酸化。2-OST可以进一步能够催化其中C4和C5之间的连接是双键的HexA残基的2-O位的硫酸化。另外,根据2-O-硫酸化和其他步骤的顺序,可以选择和使用具有适当的底物特异性的2-OST。2-OST可以源自任何动物、植物、微生物等。例如,仓鼠2-OST可以用作2-OST。另外,已知2-OST的变体例如同源物和人工修饰酶可以用作2-OST。对于肝素酶III的生产方法和利用方面的描述可以应用于2-OST的生产方法和利用方面。本领域技术人员可以适当地配置2-O-硫酸化的反应条件。作为2-O-硫酸化的反应条件,可以参考先前报道的条件(Chen J,etal.,"Enzymatic redesigning of biologically active heparan sulfate."J.Biol.Chem.2005Dec 30;280(52):42817-25.)。具体而言,2-O-硫酸化的反应条件包括例如实施例中描述的条件。2-O-硫酸化的程度没有特别限制,只要获得本发明的多糖。也就是说,可以实施2-O-硫酸化使得获得以上例示的2-O-硫酸化比率。
GlcA残基通过C5-差向异构酶向IdoA残基的异构化是可逆的平衡反应。也就是说,当利用C5-差向异构酶实施C5-差向异构化时,由C5-差向异构化产生的IdoA残基的一部分可以再次转化为GlcA残基。另一方面,2-O-硫酸化的己糖醛酸(HexA)残基一般不是C5-差向异构酶的底物。因此,例如,通过偶联实施C5-差向异构化和2-O-硫酸化,C5-差向异构化产生的IdoA残基可以顺序地2-O-硫酸化,从而可以防止IdoA残基再次转化为GlcA残基。因此,可以通过偶联实施C5-差向异构化和2-O-硫酸化来提高C5-差向异构化比率。如此,可以在一部分或全部反应时期同时实施C5-差向异构化和2-O-硫酸化。例如,可以通过允许N-硫酸化的产物、C5-差向异构酶和2-OST在反应系统中共存来共同实施C5-差向异构化和2-O-硫酸化。具体而言,C5-差向异构化和2-O-硫酸化的偶联反应的条件包括实施例中描述的条件。
6-O-硫酸化是对2-O-硫酸化生产的产物中N-硫酸化氨基葡萄糖(GlcNS)残基的6-O位硫酸化的步骤。
可以利用例如6-O-硫酸化酶(6-OST)以酶促方式实施6-O-硫酸化。6-OST没有特别限制,只要它可以催化N-硫酸化氨基葡萄糖(GlcNS)残基中O-6位的硫酸化。根据6-O-硫酸化和其他步骤的顺序,可以选择和使用具有适当的底物特异性的6-OST。6-OST可以源自任何动物、植物、微生物等。6-OST包括6-OST-1、6-OST-2和6-OST-3。例如,仓鼠6-OST-1和小鼠6-OST-3可以用作6-OST。另外,已知6-OST的变体例如同源物和人工修饰酶可以用作6-OST。对于肝素酶III的生产方法和利用方面的描述可以应用于6-OST的生产方法和利用方面。本领域技术人员可以适当地配置6-O-硫酸化的反应条件。作为6-O-硫酸化的反应条件,可以参考先前报道的条件(Chen J,et al.,"Enzymatic redesigning of biologicallyactive heparan sulfate."J.Biol.Chem.2005Dec 30;280(52):42817-25.)。
可以通过利用硫酸化试剂以化学方式实施6-O-硫酸化。硫酸化试剂包括三氧化硫复合物例如三氧化硫吡啶复合物(PySO3)和三氧化硫三甲胺复合物(TMASO3)。本领域技术人员可以适当地配置6-O-硫酸化的反应条件。作为利用硫酸化试剂的6-O-硫酸化的反应条件,可以参考先前报道的条件(US8227449B2(Jul.24,2012))。具体而言,利用硫酸化试剂的6-O-硫酸化的反应条件包括例如实施例中描述的条件。可以在有机溶剂例如N,N-二甲基甲酰胺(DMF)中实施利用硫酸化试剂的6-O-硫酸化。6-O-硫酸化中的反应温度可以是例如,-20℃至5℃,优选-20℃至0℃。用于6-O-硫酸化的硫酸化试剂的量可以是例如,相对于6-O-硫酸化的目标羟基的量,1.5至10摩尔当量,优选2至5摩尔当量。
6-O-硫酸化的程度没有特别限制,只要获得本发明的多糖。也就是说,可以实施6-O-硫酸化使得获得以上例示的6-O-硫酸化比率。
GlcN残基中的3-O-硫酸化是对6-O-硫酸化的产物中N-硫酸化并6-O-硫酸化的氨基葡萄糖残基的3-O位硫酸化的步骤。可以利用例如3-O-硫酸化酶(3-OST)以酶促方式实施GlcN残基中的3-O-硫酸化。3-OST没有特别限制,只要它可以催化N-硫酸化6-O-硫酸化氨基葡萄糖残基的O-3位的硫酸化。根据GlcN残基中的3-O-硫酸化和其他步骤的顺序,可以选择和使用具有适当的底物特异性的3-OST。3-OST可以源自任何动物、植物、微生物等。3-OST包括3-OST-1、3-OST-2、3-OST-3、3-OST-4和3-OST-5。例如,来自小鼠的3-OST-1可以用作3-OST。另外,已知3-OST的变体例如同源物和人工修饰酶可以用作3-OST。对于肝素酶III的生产方法和利用方面的描述可以应用于3-OST的生产方法和利用方面。本领域技术人员可以适当地配置GlcN残基中的3-O-硫酸化的反应条件。作为GlcN残基的6-O-硫酸化的反应条件,可以参考先前报道的条件(Chen J,et al.,"Enzymatic redesigning ofbiologically active heparan sulfate."J.Biol.Chem.2005Dec 30;280(52):42817-25.)。具体而言,GlcN残基中的3-O-硫酸化的反应条件包括例如实施例中描述的条件。GlcN残基中的3-O-硫酸化的程度没有特别限制,只要获得本发明的多糖。也就是说,可以实施GlcN残基中的3-O-硫酸化使得获得以上例示的GlcN残基中的3-O-硫酸化比率。
对各步骤的反应溶液中含有的各步骤的产物可以直接进行后续步骤,或者可以从反应溶液中回收然后进行后续步骤。从反应溶液中回收各产物的规程没有特别限制。回收各产物的规程包括用于分离和纯化化合物的已知技术例如膜处理法和沉淀法。可以适当地对各步骤中的产物进行处理例如纯化、稀释、浓缩、干燥、溶解以及酶的失活,然后进行后续步骤。可以实施纯化至所期望的程度。可以单独或以适当组合来实施这些处理。
通过实施如上所述的硫酸乙酰肝素生产步骤来生产本发明的多糖。可以从反应溶液中适当地回收本发明的多糖。可以通过用于分离和纯化化合物的已知技术回收本发明的多糖。此类技术的实例包括离子交换树脂法、膜处理法、沉淀法和结晶法。可以以适当组合使用这些技术。回收的本发明的多糖除了本发明的多糖外可以包含组分例如水以及当生产本发明的多糖时使用的组分。也就是说,本发明的多糖可以例如作为含有本发明的多糖的混合物提供。本发明的多糖可以纯化至所期望的程度。可以根据各种条件例如本发明的多糖的利用方面适当地配置本发明的多糖。例如,本发明的多糖可以作为纯化至药理学上可接受的程度提供,用于作为药物组合物的活性成分混合并利用。具体而言,本发明的多糖的纯度可以是例如,30%(w/w)或更多、50%(w/w)或更多、70%(w/w)或更多、80%(w/w)或更多、90%(w/w)或更多、或95%(w/w)或更多。
<3>本发明的多糖的利用
可以作为组合物中的活性成分混合并利用本发明的多糖。也就是说,本发明提供了含有本发明的多糖的化合物。该组合物也称为“本发明的组合物”。所述组合物包括药物组合物。本发明的组合物可以是例如,用于预防、改善和/或治疗归因于血液凝固的症状。也就是说,本发明的组合物可以是例如,用于归因于血液凝固的症状的预防剂、改善剂和/或治疗剂。归因于血液凝固的症状包括弥散性血管内凝血(DIC)、血栓栓塞(静脉血栓形成、心肌梗死、肺栓塞、脑栓塞、肢体动脉血栓栓塞、术中和术后血栓栓塞等)、人工透析中的血液凝固和体外循环中的血液凝固。
本发明的组合物含有本发明的多糖。本发明的组合物可以仅由本发明的多糖组成,或者可以包含其他组分。所述“其他组分”没有特别限制,只要它是药理学上可接受的。所述“其他组分”包括例如,在药物组合物中混合并利用的组分。
例如,可以将本发明的组合物配制成任何剂型。剂型的实例包括液体制剂、悬浮液、粉末制剂、片剂、丸剂、胶囊和注射剂。在配制时,例如,可以使用药理学上可接受的添加剂例如赋形剂、粘合剂、崩解剂、润滑剂、稳定剂、调味剂、气味改善剂、香料、稀释剂、表面活性剂等。
在本发明的组合物中的本发明的多糖的浓度没有特别限制,只要它是根据本发明的组合物的用途的有效量。也就是说,在本发明的组合物中的本发明的多糖的浓度可以是对预防、改善和/或治疗归因于血液凝固的症状有效的浓度。可以根据各种条件例如本发明的多糖的抗凝血活性、本发明的组合物的剂型和本发明的组合物的用途方面来适当地配置在本发明的组合物中的本发明的多糖的浓度。在本发明的组合物中的本发明的多糖的浓度没有特别限制,并且可以是例如0.01%或更多、0.1%或更多、或1%或更多、100%或更少、10%或更少、或1%或更少,或它们的组合。
可以通过向受试者施用本发明的组合物来预防、改善和/或治疗受试者的归因于血液凝固的症状。也就是说,本发明提供了预防、改善和/或治疗归因于血液凝固的症状的方法,包括向受试者施用本发明的组合物。另外例如,为了预防人工透析或体外循环中的血液凝固,可以将本发明的组合物体外添加到血液中。“向受试者施用本发明的组合物”不仅包括向生物体例如人施用的情况,也包括向非生物材料例如血液中添加的情况。也就是说,这里提到的“受试者”可以是生物体例如人或非生物材料例如血液。
本发明的组合物可以直接向受试者施用,或者可以使用药理学上可接受的溶剂例如水、盐水或缓冲液稀释、溶解或分散以向受试者施用。不言而喻,以这种方式稀释、溶解或分散的情况包括在本发明的组合物的范围内。施用的方法没有特别限制,并且包括例如,口服、侵入性施用例如注射和经皮施用。可以根据各种条件例如本发明的组合物的使用来适当地配置施用的方法。可以根据各种条件例如本发明的多糖的抗凝血活性、本发明的多糖的浓度、施用的方法、年龄、性别和症状的水平来适当地配置本发明的组合物的剂量。
实施例
以下,将基于实施例更具体地说明本发明。
实施例1:肝素前体的制备
(1)肝素前体发酵
使用肝素前体生产细菌(大肠杆菌BL21(DE3)/pVK9-kfiABCD菌株)和WO2015/050184的实施例1中描述的培养条件获得含有肝素前体的培养液。
(2)肝素前体的纯化
通过离心从培养液中收集培养上清液。为了去除培养基成分,使用UF膜用Milli-Q水清洗1mL培养上清液,并浓缩至250μL。将500μL的100%乙醇添加到用UF膜浓缩的250μL溶液中,并通过离心沉淀肝素前体。将所得的沉淀物在空气中干燥以获得肝素前体。另外从剩余的培养上清液中,通过相同的规程纯化肝素前体。获得总共10g的肝素前体。
实施例2:肝素前体的N-去乙酰化
1)将61mL的肼·H2O和4.7mL的1N硫酸添加到1.22g的肝素前体中,并且在用氮气替换气相后,将混合物加热至100℃并反应4.75小时。
2)在通过冰冷却终止反应后,添加61mL的16%NaCl水溶液和610mL的MeOH,并将混合物离心。去除上清液。将所得的沉淀物在50mL的H2O中溶解,然后使用Amicon UF膜(3kDa)脱盐并浓缩。
3)将两倍体积的H2O和等体积的1M NaHCO3添加到所得的浓缩溶液中,然后滴加0.2M I2/0.4M KI溶液直至呈黄色。随后,滴加肼·H2O以将过多的碘还原为碘离子,然后再次使用Amicon UF膜(3kDa)脱盐并浓缩溶液。将浓缩的溶液在减压下干燥以获得N-去乙酰化肝素前体。在获得的N-去乙酰化肝素前体中乙酰基团的残留率为14.9%(稍后描述)。
实施例3:N-去乙酰化肝素前体的低分子化
(1)肝素酶III的制备
<肝素黄杆菌来源的hepC基因表达质粒的构建>
将源自肝素黄杆菌的编码肝素酶III的hepC基因克隆到pMIV-Pnlp0载体(美国专利申请公开20050196846)中以构建hepC基因表达质粒pMIV-Pnlp0-hepC。pMIV-Pnlp0-ter包括强效的nlp0启动子(Pnlp0)和rrnB终止子,并且可以通过在启动子和终止子之间插入目的基因作为表达单元发挥作用。“Pnlp0”表示源自大肠杆菌K-12的野生型nlpD基因的启动子。
表达质粒的构建的细节如下所示。通过使用引物P1(SEQ ID NO:6)和引物P2(SEQID NO:7)的用来自大肠杆菌MG1655的染色体DNA作为模板的PCR获得包含约300bp的nlpD基因的启动子区域(Pnlp0)的DNA片段。已经在这些引物的每个5’末端设计了限制酶SalI和PaeI的位点。PCR循环如下。首先,95℃3分钟,然后两个循环的95℃60秒、50℃30秒和72℃40秒,随后25个循环的94℃20秒、55℃20秒和72℃15秒,最后72℃5分钟。用SalI和PaeI处理所得的片段,并将其插入到pMIV-5JS(日本专利申请公开号2008-99668)的SalI-PaeI位点中以获得质粒pMIV-Pnlp0。插入到pMIV-Pnlp0质粒中的Pnlp0启动子的PaeI-SalI片段的核苷酸序列如SEQ ID NO:8中所示。
随后,通过使用引物P3(SEQ ID NO:9)和引物P4(SEQ ID NO:10)的用来自MG1655的染色体DNA作为模板的PCR获得包含约300bp的rrnB基因的终止子区域的DNA片段(SEQ IDNO:11)。已经在这些引物的每个5’末端设计了限制酶XbaI和BamHI的位点。PCR循环如下。首先,95℃3分钟,然后两个循环的95℃60秒、50℃30秒和72℃40秒,随后25个循环的94℃20秒、59℃20秒和72℃15秒,最后72℃5分钟。用XbaI和BamHI处理所得的片段,并将其插入到pMIV-Pnlp0的XbaI-BamHI位点中以获得质粒pMIV-Pnlp0-ter。
随后,人工合成包含源自肝素黄杆菌(ATCC 13125)(Su H.et.al.,Appl.Environ.Microbiol.,1996,62:2723-2734)的hepC基因的ORF的DNA链。通过使用引物P5(SEQ ID NO:12)和引物P6(SEQ ID NO:13)的用该DNA链作为模板的PCR扩增hepC基因的DNA片段。以方案中描述的反应组成使用PrimeStar聚合酶(TaKaRa)实施PCR。PCR循环如下。首先,94℃5分钟,然后30个循环的98℃5秒、55℃10秒和72℃8分钟,最后保持在4℃。另外,通过使用引物7(SEQ ID NO:14)和引物8(SEQ ID NO:15)的寡核苷酸作为引物的用pMIV-Pnlp0作为模板DNA的PCR获得pMIV-Pnlp0的DNA片段。使用PrimeStar聚合酶(TaKaRa)和方案中描述的反应组成来实施PCR。PCR循环如下。首先,94℃5分钟,然后30个循环的98℃5秒、55℃10秒和72℃6分钟,最后保持在4℃。使用In-Fusion(注册商标)HD克隆试剂盒(Clontech)连接所得的两个DNA片段以构建hepC基因表达质粒pMIV-Pnlp0-hepC。克隆的hepC基因的核苷酸序列和由它编码的肝素酶III(HepC)的氨基酸序列分别如SEQ ID NO:16和17中所示。
<表达hepC基因的大肠杆菌BL21(DE3)菌株的构建和肝素酶III酶溶液的制备>
通过电穿孔(Cell;80μL,200Ω,25μF,1.8kV,比色皿;0.1mL)将hepC基因表达质粒pMIV-Pnlp0-hepC导入到大肠杆菌BL21(DE3)菌株(Life Technologies)中以获得大肠杆菌BL21(DE3)/pMIV-Pnlp0-hepC菌株作为肝素酶III生产菌株。该菌株在25μg/mL添加氯霉素的LB培养基中于37℃预培养过夜。随后,将培养液接种到Sakaguchi烧瓶中的300mL LB培养基中,终浓度为2%v/v。于37℃实施振荡培养4小时,然后终止培养。离心后,用0.85%NaCl清洗微生物细胞两次,并在30mL的50mM HEPES缓冲液(pH 7.0)中悬浮。对悬浮液进行超声波破碎以破碎微生物细胞。将破碎的微生物细胞溶液离心以制备肝素酶III酶溶液作为上清液(无细胞提取液)。
(2)通过肝素酶III反应的低分子化
将1g实施例2中获得的N-乙酰基团残留率为14.9%的N-去乙酰化肝素前体与2mL的31.3mIU/μL肝素酶III溶液溶解于100mL含有100mM NaCl和1.5mM CaCl2的Tris缓冲溶液(pH 8.0)中,并且于37℃反应5.3小时。将100mL的16%NaCl水溶液和900mL的EtOH添加到反应溶液中并混合,离心以去除上清液并获得低分子化的N-去乙酰化肝素前体。
实施例4:低分子化的N-去乙酰化肝素前体的N-硫酸化
1)将1g实施例3中获得的低分子化的N-去乙酰化肝素前体溶解于50mL的MilliQ水中,并将50mL的20mg/mL NaHCO3/20mg/mL三甲胺·SO3的水溶液添加到其中,并且混合物于55℃反应过夜。
2)将1L的EtOH添加到混合物中,然后离心以去除上清液以获得N-硫酸化的低分子化肝素前体。
3)将获得的N-硫酸化的低分子化肝素前体溶解于MilliQ水中至500μL,并实施二糖分析以计算相对于N-去乙酰化肝素前体的产率。另外对它进行GPC以计算分子量分布。规程如下所示。
<二糖分析>
根据先前报道的条件(T.Imanari,et.al.,"High-performance liquidchromatographic analysis of glycosaminoglycan-derived oligosaccharides."J.O.Chromato.A,720,275-293(1996))实施N-硫酸化的低分子化肝素前体的二糖分析。也就是说,可以通过使用肝素酶II和III将N-硫酸化的低分子化肝素前体分解成不饱和二糖并通过HPLC分析各分解产物来定量各成分二糖的量。
同样地,实施N-去乙酰化肝素前体的二糖分析。在N-硫酸化N-去乙酰化肝素前体后实施N-去乙酰化肝素前体的二糖分析。也就是说,通过N-硫酸化N-去乙酰化肝素前体,随后使用肝素酶II和III将其分解成不饱和二糖并通过HPLC分析各分解产物来定量各成分二糖的量。以与低分子化的N-去乙酰化肝素前体的N-硫酸化相同地实施N-去乙酰化肝素前体的N-硫酸化。
通过以下规程具体实施二糖分析。
1)将0.2U的肝素酶II(Sigma)、0.02至0.03mIU的肝素酶III、5μg的多糖样品和10μL的用于酶促消化的缓冲液(100mM CH3COONa,10mM(CH3COO)2Ca,pH 7.0)混合并用Milli-Q水稀释至100μL的测量体积以用作反应溶液。
2)反应溶液于37℃反应16小时或更长,随后于100℃煮沸2分钟以终止反应。
3)通过0.45μm滤膜去除杂质以获得随后用作二糖分析样品的溶液。
4)在以下条件下使用具有5μm粒径的Inertsil ODS-3 150mm×2.1mm的柱子进行分析,所述条件为50℃的温度、0.25mL/分钟的流速和230nm的检测波长,并且使用4%乙腈和1.2mM三丁胺作为溶液A以及4%乙腈和0.1M CsCl作为溶液B的洗脱液组成,其中溶液B的梯度为从1至90%。
从各多糖样品生产的成分二糖的量的总和计算产率。也就是说,产率计算为从N-硫酸化的低分子化肝素前体生产的二糖的总量相对于从N-去乙酰化肝素前体生产的二糖的总量的百分比(摩尔比率)。另外,此时,证实了在获得的N-硫酸化的低分子化肝素前体中,N-乙酰化生产的99%或更多的氨基被N-硫酸化。
另外,基于从N-去乙酰化肝素前体生产的各成分二糖的量计算N-去乙酰化肝素前体中N-乙酰基团的残留率。也就是说,乙酰基团的残留率计算为具有乙酰基团的二糖的量相对于二糖的总量的百分比(摩尔比率)。乙酰基团的残留率为14.9%。
<GPC分析>
通过HPLC对N-硫酸化的低分子化肝素前体和硫酸乙酰肝素(在MilliQ水中以1mg/mL溶解)进行凝胶过滤(GPC分析)。使用GS520(Shodex,Asahipak GS-520HQ,7.5mm×300mm,7μm的粒径)作为柱子,使用100mM磷酸二氢钾水溶液作为洗脱液,并且以0.6mL/分钟的流速、以40℃的柱温和以200nm的检测波长实施分析。使用普鲁兰多糖的分子量标记组(Shodex,STANDARD P-82,分子量范围从5900至708000)作为标准计算平均分子量(Mn和Mw)。
实施例5:C5-差向异构化和2-O-硫酸化的偶联反应
(1)C5-差向异构酶的表达和纯化
源自人的5-差向异构酶的催化位点(Gln29至Asn617)和麦芽糖结合蛋白(MBP)的融合蛋白(MBP-C5-差向异构酶)用作C5-差向异构酶。因此,将编码该催化位点的核苷酸序列克隆到pMAL-c2x载体(New England Biolabs)中以构建MBP-C5-差向异构酶表达质粒pMAL-c2x-MBP-C5epi。根据pMAL-c2x载体,克隆的基因作为与MBP的融合蛋白得到表达。
构建表达质粒的细节如下所示。参考Jin-ping Li等的报道(Li J.et.al.,Jour.Biol.Chem.1997,272:28158-28163),通过人工基因合成(Thermo FisherScientific)制备源自人的C5-差向异构酶的cDNA。通过使用C5-epi fw(SEQ ID NO:18)和C5-epi rv(SEQ ID NO:19)作为引物的用该cDNA作为模板的PCR获得包含编码C5-差向异构酶催化位点(Gln29至Asn617)的核苷酸序列的DNA片段。以方案中描述的反应组成使用PrimeStar聚合酶(TaKaRa)实施PCR。PCR循环如下。首先,94℃5分钟,随后30个循环的98℃5秒、55℃10秒和72℃2分钟,最后保持在4℃。另外,通过使用SEQ ID NO:21和22的寡核苷酸作为引物的用pMAL-c2x(SEQ ID NO:20,New England Biolabs)作为模板的PCR获得pMAL-c2x的DNA片段。以方案中描述的反应组成使用PrimeStar聚合酶实施PCR。PCR循环如下。首先,94℃5分钟,随后30个循环的98℃5秒、55℃10秒和72℃6分钟,最后保持在4℃。使用In-Fusion(注册商标)HD克隆试剂盒(Clontech)连接两个所得的DNA片段以构建MBP-C5-差向异构酶表达质粒pMAL-c2x-MBP-C5epi,其中编码C5-差向异构酶催化位点的核苷酸序列与最初包括在pMAL-c2x中的MBP基因融合。C5-差向异构酶插入片段的核苷酸序列(编码C5-差向异构酶催化位点的核苷酸序列)和由其编码的氨基酸序列分别如SEQ ID NO:23和24所示。
通过电穿孔(Cell;80μL,200Ω,25μF,1.8kV,比色皿;0.1mL)将MBP-C5-差向异构酶表达质粒pMAL-c2x-MBP-C5epi和伴侣蛋白表达质粒pGro7(TaKaRa)导入到大肠杆菌Origami B(DE3)菌株(Novagen)中以获得Origami B(DE3)/pMAL-c2x-MBP-C5epi/pGro7菌株。将该菌株接种到添加100μg/mL氨苄青霉素和25μg/mL氯霉素的LB培养基(0.1%(w/v)蛋白胨、0.5%(w/v)酵母提取物、1.0%(w/v)NaCl)中,并于37℃预培养过夜。随后,将所得的培养液以1%的终浓度接种到Sakaguchi烧瓶中100mL的LB培养基中。于37℃振荡培养3小时后,将终浓度为0.5mM的异丙基-β-D-硫代半乳糖苷(IPTG)(Nacalai Tesque)和终浓度为0.2%的阿拉伯糖(Wako Pure Chemical)添加到其中,并于22℃继续培养过夜。
培养液离心后,收集微生物细胞,用清洗溶液(20mM Tris-HCl,pH 7.5,200mMNaCl)清洗一次,并在清洗溶液中悬浮。将FastBreak(Promega)添加到所得的悬浮液中,然后将其于30℃温育10分钟至1小时,随后以9,100g离心10分钟。将所得的上清液用作微生物细胞提取液。
(2)2-O-硫酸化酶(2-OST)的表达和纯化
源自中国仓鼠的用异亮氨酸残基取代94位酪氨酸残基的2-OST的突变体的催化位点(Arg51至Asn356)和麦芽糖结合蛋白(MBP)的融合蛋白(MBP-2-OST)用作2-O-硫酸化酶(2-OST)。因此,将编码该催化位点的核苷酸序列克隆到pMAL-c2x载体(New EnglandBiolabs)中以构建MBP-2-OST表达质粒pMAL-c2x-MBP-2OST。
构建表达质粒的细节如下所示。参考Kobayashi等的报道(Kobayashi M.et.al.,Jour.Biol.Chem.1997,272:13980-13985),通过人工基因合成(Thermo FisherScientific)制备源自中国仓鼠的用异亮氨酸残基取代94位酪氨酸残基的2-OST的突变体的cDNA。通过使用2-OST fw(SEQ ID NO:25)和2-OST rv(SEQ ID NO:26)作为引物的用该cDNA作为模板的PCR获得包含编码2-OST突变体的催化位点(Arg51至Asn356)的核苷酸序列的DNA片段。以方案中描述的反应组成使用PrimeStar聚合酶(TaKaRa)实施PCR。PCR循环如下。首先,94℃5分钟,随后30个循环的98℃5秒、55℃10秒和72℃2分钟,最后保持在4℃。另外,通过使用SEQ ID NO:21和22的寡核苷酸作为引物的用pMAL-c2x作为模板的PCR获得pMAL-c2x的DNA片段。以方案中描述的反应组成使用PrimeStar聚合酶实施PCR。PCR循环如下。首先,94℃5分钟,随后30个循环的98℃5秒、55℃10秒和72℃6分钟,最后保持在4℃。使用In-Fusion(注册商标)HD克隆试剂盒(Clontech)连接所得的两个DNA片段以构建MBP-2-OST表达质粒pMAL-c2x-MBP-2OST,其中编码2-OST突变体的催化位点的核苷酸序列与最初包括在pMAL-c2x中的MBP基因融合。2-OST插入片段的核苷酸序列(编码2-OST突变体的催化位点的核苷酸序列)和由其编码的氨基酸序列分别如SEQ ID NO:27和28所示。
依照与实施例5(1)中相同的技术将MBP-2OST表达质粒pMAL-c2x-MBP-2OST和伴侣蛋白表达质粒pGro7(TaKaRa)导入到大肠杆菌Origami B(DE3)菌株(Novagen)中以获得Origami B(DE3)/pMAL-c2x-MBP-2OST/pGro7菌株。将该菌株接种到添加100μg/mL氨苄青霉素和25μg/mL氯霉素的LB培养基中,并于37℃预培养过夜。随后,将所得的培养液以1%的终浓度接种到Sakaguchi烧瓶中100mL的LB培养基中。于37℃振荡培养3小时后,将终浓度为0.5mM的异丙基-β-D-硫代半乳糖苷(IPTG)(Nacalai Tesque)和终浓度为0.2%的阿拉伯糖(Wako Pure Chemical)添加到其中,并于22℃继续培养过夜。
通过以下规程从培养液中制备纯化的MBP-2-OST。首先,将培养液离心以收集微生物细胞。然后,通过超声波破碎微生物细胞以获得微生物细胞提取液。然后,将微生物细胞提取液与用20mM Tris(pH 7.5)和200mM NaCl平衡的直链淀粉树脂(New EnglandBiolabs)混合,以将MBP-2-OST吸附到树脂上。随后,以4倍树脂的量的平衡缓冲液清洗树脂,并且添加已经添加了10mM麦芽糖的平衡缓冲液(洗脱缓冲液)。将含有MBP-2-OST的级分分级以用作纯化的MBP-2-OST。
(3)酶促反应(C5-差向异构化和2-O-硫酸化的偶联反应)
使用制备的MBP-C5-差向异构酶微生物细胞提取液和纯化的MBP-2-OST来实施C5-差向异构化和2-O-硫酸化。将50mM MES(pH 7.0)、100mM NaCl和1mM PAPS、108mL终浓度为0.9mg/mL的表达C5-差向异构酶的微生物细胞的提取液以及16.9mL终浓度为0.5mg/mL的纯化的MBP-2-OST添加到实施例4中获得的166mg的N-硫酸化的低分子化肝素前体的703mL的混合溶液中,以制备总量为828mL的反应溶液。该反应溶液于37℃反应24小时。
(4)转化率的定量
通过使用亚硝酸分解的二糖组成分析定量转化率(C5-差向异构化比率和2-O-硫酸化比率)。
<试剂>
NaNO2(CAS No.:7632-00-0,MW:69.01)
柠檬酸(CAS No.:77-92-9,MW:192.1)
2,4-二硝基苯肼(CAS No.:119-26-6,MW:198.1),50%含水产品(缩写:DNPH)
肝素(由Aldrich制造)
<试验溶液>
肝素标准溶液:1mg/mL
NaNO2水溶液:将49.5mg的试剂溶解于1mL的H2O中。
柠檬酸水溶液:将384.2mg的试剂溶解于1mL的H2O中。
DNPH溶液:20.4mg(50%含水)的试剂溶解于1mL的乙腈中。
<LC-MS分析条件>
<LC条件>
柱子:由Sumika Chemical Analysis Service制造的ODS Z-CLUE 3μm 2.0mm×250mm
柱温箱温度:50℃
洗脱液流速:0.3mL/分钟
检测:UV 365nm
注射量:5μL
洗脱液组成:溶液A:50mM HCOONH4(pH 4.5)
溶液B:MeCN
表1:LC的梯度条件
<MS条件>
离子化法:电喷雾电离(ESI(+/-))
DL温度:250℃
加热块:250℃
雾化器气体流速:1.5L/分钟
干燥气体流速:15L/分钟
表2
<分析规程和结果>
将20μL的肝素标准溶液、20μL的柠檬酸缓冲水溶液和10μL的NaNO2水溶液以该顺序添加到1.5mL微管(Eppendorf)中,并于65℃搅拌混合溶液2小时(1000rpm)以获得亚硝酸分解溶液。将20μL的DNPH溶液添加到40μL所得的亚硝酸分解溶液中,并于45℃搅拌2小时(1000rpm)以获得衍生化溶液。通过LC-MS分析所得的衍生化溶液的组成。从通过分析肝素标准溶液获得的IdoA(2S)-GlcN(NS6S)的峰计算换算系数[1mg×IdoA(2S)-GlcN(NS6S)的面积纯度/IdoA(2S)-GlcN(NS6S)的面积值]。从受试溶液中各二糖衍生物的面积值计算浓度。计算的二糖结构和它们的比率如表3中所示。在表格中,省略了认为包括具有N-乙酰基团的二糖衍生物等的未鉴定峰的数据,并假设GlcA(2S)-GlcN(NS)、IdoA(2S)-GlcN(NS)、GlcA-GlcN(NS)和IdoA-GlcN(NS)的总量为100%。分别证实了C5-差向异构化比率(IdoA(2S)-GlcN(NS)和IdoA-GlcN(NS)的比率的总和)和2-O-硫酸化比率(GlcA(2S)-GlcN(NS)和IdoA(2S)-GlcN(NS)的比率的总和)为58%和65%。
表3:C5-差向异构化和2-O-硫酸化的偶联反应的反应产物中的二糖组成
实施例6:6-O-硫酸化
将实施例5中获得的30mL的酶促反应溶液(C5-差向异构化和2-O-硫酸化的偶联反应后的反应溶液)离心(7000G,30分钟),并通过0.45μm滤膜过滤上清液。将过滤的溶液(27.3g)施加到15g填充在由Pharmacia制造的柱子(型号XK26)中的弱阴离子交换树脂(由Mitsubishi Chemical制造的DIAION WA-30,用25.6mM NaH2PO4预先调节至pH 5.5)上以将多糖组分吸附到树脂上,并使480mL的清洗溶液(0.5M NaCl+25.6mM NaH2PO4(pH 5.5))通过柱子(流速:6.4mL/分钟)。随后,使230mL的洗脱液(2M NaCl+25.6mM NaH2PO4(pH 5.5))通过柱子(流速:6.4mL/分钟)以获得含有多糖组分的洗脱液。将获得的洗脱液注入Amicon-3K(由Merck Millipore制造),然后将其离心(4000G)。再将100mL的水添加到所得的浓缩溶液中,然后将其再次离心。将该清洗操作重复三次以获得11g的经清洗的浓缩溶液。
<离子交换>
使11g的经清洗的浓缩溶液通过3mL的强阳离子交换树脂(由MitsubishiChemical制造的DIAION UBK550,用1M盐酸预先更换为H型)(pH 2.25),并随后通过添加1.8mL的2.36mg三丁胺/10μL乙醇的混合溶液将其中和(pH8.36)。将获得的中和溶液冻干。
<6-O-硫酸化反应>
在氩气流下,将1.92mL的DMF和76.4mg(0.48mmol)的三氧化硫硫吡啶复合物添加到全部量的冻干物中,并于-10℃搅拌混合物48小时。反应后,添加2.8mL的5M醋酸钠水溶液和31mL的水并于室温搅拌1小时以终止反应。通过0.2μm滤膜过滤反应终止溶液,并将它的滤液注入Amicon-3K(由Merck Millipore制造),然后将其离心(4000G)。进一步,将20mL的水添加到所得的浓缩溶液中,然后将其再次离心。将该操作重复两次以获得3.92g的经清洗的浓缩溶液。对获得的经清洗的浓缩溶液取样并依照与实施例5中相同的规程通过亚硝酸分解进行二糖分析。结果,证实了3.92g的经清洗的浓缩溶液中含有以二糖单元的量计为76.5mg的量的反应产物(多糖)。
实施例7:GlcN残基中的3-O-硫酸化反应
(1)表达3-O-硫酸化酶(3-OST)的菌株的制备
从KEGG(Kyoto Encyclopedia of Genes and Genomes)数据库获得源自小鼠的3-OST-1的氨基酸序列(NCBI-Protein ID:NP_034604:SEQ ID NO:29)。参考先前的报道(Edavettal S.C.et al.,J.Biol.Chem.2004;279(24)25789-97)合成包含编码3-OST-1的催化位点(Gly48至His311)的核苷酸序列(SEQ ID NO:30)并基于大肠杆菌中密码子使用优化的DNA片段。将所得的DNA片段插入到pETDuet-1载体(Novagen)的EcoRI-SalI位点中以构建3-OST-1表达质粒pETDuet-3-OST-1。根据该质粒,N末端侧添加有His标签的3-OST-1得到表达,并且因此,使用该His标签纯化3-OST-1变为可能。依照与实施例5(1)中相同的技术将该表达质粒导入到大肠杆菌BL21(DE3)菌株中以获得3-OST-1表达菌株pETDuet-3-OST-1/BL21(DE3)菌株。
(2)3-OST-1的表达和纯化
将大肠杆菌pETDuet-3-OST-1/BL21(DE3)菌株接种到含有100μg/mL的氨苄青霉素的LB琼脂培养基(1.0%(w/v)蛋白胨、0.5%(w/v)酵母提取物、1.0%(w/v)NaCl、1.5%(w/v)琼脂)中,并于37℃静置培养过夜。随后,将在琼脂培养基上生长的20μL的微生物细胞悬浮在1mL的LB培养基中,并将其中50μL添加到Sakaguchi烧瓶中的50mL的OvernightExpress TB培养基(Merck,含有100μg/mL的氨苄青霉素)中。将16个Sakaguchi烧瓶中的微生物细胞于22℃以120往复/分钟振荡培养24至26小时,然后通过离心收集(4℃,8,000rpm,5分钟)。将作为沉淀获得的微生物细胞悬浮在160mL的平衡缓冲液(50mM磷酸钠,300mMNaCl,pH 7.0)中并再次离心(4℃,8,000rpm,5分钟)以清洗微生物细胞。在将该清洗操作重复两次后,将作为沉淀获得的微生物细胞重悬在160mL的平衡缓冲液中,然后对其用冰冷却超声波(190W,20分钟)进行破碎。将破碎细胞溶液离心(4℃,8,000rpm,10分钟),并将所得的上清液用作无细胞提取液。
将所得的无细胞提取液施加到由连接的三个用平衡缓冲液预先平衡的5mLHisTALON Superflow Cartridge柱(由Clontech制造)组成的柱子中以吸附3-OST-1。用清洗缓冲液(50mM磷酸钠,300mM NaCl,10mM咪唑,pH 7.0)清洗柱子,然后用洗脱缓冲液(50mM磷酸钠,300mM NaCl,150mM咪唑,pH 7.0)洗脱3-OST-1以获得3-OST-1的活性级分。依照方案,使用PD-10柱(由GE Healthcare制造)用缓冲液(50mM磷酸钠,300mM NaCl,pH 7.0)更换获得的活性级分中的缓冲液。将缓冲液更换后的酶溶液在随后的实验中用作纯化的3-OST-1。
(3)酶促反应(GlcN残基中的3-O-硫酸化反应)
制备含有实施例6中获得的全部量的反应产物、50mM HEPES(pH 7.5)和221μMPAPS的量为326.5mL的混合溶液。将56mL的纯化的3-OST-1以234mg/L的终浓度添加到在水浴中预温至37℃的该混合溶液中以制备总量为382.5mL的反应溶液,并开始反应。在温和搅拌下推进反应,并在过了24小时后,通过于90℃加热20分钟使酶失活。
(4)GlcN残基中3-O-硫酸化比率的定量
依照与实施例5中相同的规程通过亚硝酸分解实施反应产物的二糖组成分析。计算的二糖结构和它的比率如表4中所示。
表4:GlcN残基中3-O-硫酸化反应前后的反应产物的二糖组成
实施例8:反应产物的纯化
将实施例7中获得的371g的酶促反应溶液(GlcN残基中3-O-硫酸化反应后的反应溶液)离心(8000G,30分钟),并通过0.45μm滤膜过滤它的上清液。将该滤液注入Amicon-3K(由Merck Millipore制造),然后将其离心(4000G)。进一步,将200mL的水添加到所得的浓缩溶液中,然后将其再次离心。将该清洗操作重复三次以获得11.6g的经清洗的浓缩溶液。将该经清洗的浓缩溶液施加到7.5g填充在由Pharmacia制造的柱子(型号XK26)中的弱阴离子交换树脂(由Mitsubishi Chemical制造的DIAION WA-30,用25.6mM NaH2PO4预先调节至pH 5.5)上以将多糖组分吸附到树脂上,并使500mL的清洗溶液(0.5M NaCl+25.6mM NaH2PO4(pH 5.5))通过柱子(流速:3.0mL/分钟)。随后,使500mL的洗脱液(2M NaCl+25.6mM NaH2PO4(pH 5.5))通过柱子(流速:3.0mL/分钟)以获得含有多糖组分的洗脱液。将171g获得的洗脱液注入Amicon-50K(由Merck Millipore制造),然后将其离心(4000G)。将所得的渗透溶液进一步注入Amicon-3K(由Merck Millipore制造),然后将其离心(4000G)。再将100mL的水添加到所得的浓缩溶液中,然后将其再次离心。将该清洗操作重复三次以获得8.58g的经清洗的浓缩溶液。将获得的经清洗的浓缩溶液冻干以获得41mg的经纯化的多糖。
实施例9:经纯化的多糖的质量分析
对于实施例8中获得的经纯化的多糖,测量了表5中所示的项目。稍后描述测量方法。结果如表5中所示。
表5:经纯化的多糖的质量
项目 单位 测量值
抗因子Xa IU/mg 211
抗因子IIa IU/mg 168
LPS EU/mg 0.1
蛋白质(以BSA计) μg/mg 9
GlcA-GlcN(NS3S6S) 13
Mw 34000
Mn 23000
实施例10:具有不同结构的硫酸化多糖的制备
制备在参数例如差向异构化比率、2-O-硫酸化比率和GlcN残基中的3-O-硫酸化比率不同的多种类型硫酸化多糖,并评估抗凝血活性。
(1)C5-差向异构化和2-O-硫酸化的偶联反应
制备总共100mL的具有与实施例5(3)中相同的反应溶液组成的反应溶液,并于37℃反应0小时、4小时和8小时。依照与实施例5中相同的规程通过亚硝酸分解分析反应产物中含有的二糖的组成。计算的二糖结构和它们的比率如表6中所示。在表格中,省略了认为包括具有N-乙酰基团的二糖衍生物等的未鉴定峰的数据,并假设GlcA(2S)-GlcN(NS)、IdoA(2S)-GlcN(NS)、GlcA-GlcN(NS)和IdoA-GlcN(NS)的总量为100%。
表6:C5-差向异构化和2-O-硫酸化的偶联反应的反应产物中的二糖组成
(2)6-O-硫酸化反应
将每100mL的获得的酶促反应溶液(C5-差向异构化和2-O-硫酸化的偶联反应后的反应溶液)进行纯化,并依照与实施例6中相同的规程进行6-O-硫酸化以获得经清洗的浓缩溶液。对所得的经清洗的浓缩溶液取样并依照与实施例5中相同的规程通过亚硝酸分解分析样品中的二糖组成。结果,证实了每个样品含有以经清洗的浓缩溶液中二糖单元的量计约为80μg的量的反应产物(多糖)。
(3)GlcN残基中的3-O-硫酸化反应
对于获得的6-O-硫酸化反应的反应产物,以与实施例7中相同的反应溶液组成制备总量为300μL的反应溶液,并于37℃反应24小时。依照与实施例5中相同的规程通过亚硝酸分解分析反应产物的二糖组成。计算的二糖结构和它们的比率如表7中所示。在表格中,对于4小时和8小时的样品,省略了未鉴定峰的数据,并假设表格中所示的二糖单元的总量为100%。
表7:GlcN残基中3-O-硫酸化反应的反应产物的二糖组成
在表格中,时间表示C5-差向异构化和2-O-硫酸化的偶联反应时间。
(4)经纯化的多糖的抗凝血活性
将来自GlcN残基中3-O-硫酸化反应的反应产物依照与实施例8中相同的规程进行纯化,并测量抗凝血活性。结果如表8中所示。
表8:经纯化的多糖的质量
在表格中,时间表示C5-差向异构化和2-O-硫酸化的偶联反应时间。
<测量方法>
依据如下所示规程测量实施例9和10中的各项目。
<抗因子Xa>
使用的试剂盒:Test Team Heparin S(由Shimizu Medical制造)
低分子量肝素标准制剂:日本药典标准制剂(由日本制药和医疗器械监管科学学会制造,抗因子Xa:1750IU)
使用的仪器:
混合器和培养箱:Thermomixer compact(由Eppendorf制造)
UV吸收光谱仪:PD-303S(由APEL制造)
UV池:丙烯酸正方形池(光路长度:10mm)
试剂的制备
底物溶液:将一小瓶底物试剂溶解于20mL的MilliQ水中。
抗凝血酶III溶液:将一小瓶抗凝血酶III试剂溶解于10mL的MilliQ水中。
因子Xa溶液:将一小瓶因子Xa试剂溶解于10mL的MilliQ水中。
缓冲液:直接使用提供的小瓶。
正常血浆:将一小瓶正常血浆产品溶解于0.1mL的MilliQ水中。
反应终止溶液:将MilliQ水添加到20mL的冰醋酸(特级),使总体积为40mL。
肝素标准溶液:
一次稀释肝素溶液(35IU/mL):将肝素1750IU溶解于50mL的MilliQ水中。
二次稀释肝素溶液(0.175IU/mL):将900μL的缓冲液精确添加到100μL的一次稀释肝素溶液中并混合。进一步地,将950μL的缓冲液精确添加到50μL的该混合物中并与其混合。
肝素标准溶液:如表9中所示稀释并混合二次稀释肝素溶液。
表9:稀释系列
ST*:标准溶液
试样(测量样品)的制备
用MilliQ水稀释或溶解经纯化的多糖使得底物浓度为2μg/mL,以获得稀释溶液A。将试剂以表10中所示的比例添加到稀释溶液A中以制备试样。
表10
测量规程
将200μL试样分别精确地收集在用于测量和试样空白的微管中,并且于37℃温育并搅拌4分钟。将100μL的因子Xa溶液添加到用于测量的微管中,彻底混合,静置30秒,然后于37℃精确温育30秒。将200μL预先于37℃温育的底物溶液添加到用于测量的微管中,彻底混合,静置30秒,然后于37℃精确温育180秒。将300μL的反应终止溶液添加到每个微管中并立即混合。将800μL的反应溶液分配到UV池中,并测量波长为405nm处的吸光度。同样地,对在稀释系列的肝素标准溶液实施测量,并从肝素标准溶液计算标准曲线。基于标准曲线获得试样中的抗因子Xa活性。将抑制1mL血液凝固1小时的浓度定义为1IU/mL。
<抗因子IIa>
使用的试剂和试剂盒
由Sysmex制造的用于测量活化部分凝血活酶时间(aPTT)的氯化钙溶液(0.025mol/L,GMY-300A)
由Sysmex制造的活化部分凝血活酶时间试剂盒Actin FSL GAC-200A
由Sysmex制造的正常对照血浆Dade Citrol level 1,GCA-110A
低分子量肝素标准制剂:日本药典标准制剂(由日本制药和医疗器械监管科学学会制造,抗因子IIa:670IU)
使用的仪器
半自动血液凝固测量仪(由Sysmex制造的CA-104)
测量规程
将10μL的标准溶液(低分子量肝素标准制剂的稀释系列)或受试溶液(经纯化的多糖的溶液)、50μL的肌动蛋白和50μL的对照血浆添加到比色皿中,将比色皿立即插入检测单元中,并关闭遮光盖。搅拌3分钟后,从导入单元添加50μL的氯化钙溶液。自动显示凝血时间。基于从标准溶液计算的标准曲线获得受试溶液中的抗因子IIa活性。将抑制1mL血液凝固1小时的浓度定义为1IU/mL。
<LPS方法>
使用的仪器:Toxinometer ET-6000(由Wako Pure Chemical制造)
使用的试剂:裂解试剂(limulus ES-11Single Test Wako)
标准LPS(JPSE10000)
LPS标准溶液(EU/mL):0.01、0.1、1
测量规程
将20μL的LPS标准溶液或受试溶液(经纯化的多糖的溶液)分配到ES-11SingleTest Wako中,使用混合器将其搅拌5秒。在证实管中没有大气泡后,将管插入到Toxinometer中的位置1中(自动开始测量)。获得透射率达到94.9%的时间,以及基于从LPS标准溶液计算的标准曲线获得受试溶液中LPS的浓度。
<蛋白质分析>
使用的仪器
酶标仪(SPECTRA NAX190,由Molecular Devices制造)
使用的试剂
NaOH/Na2CO3溶液:将2g的NaOH和10g的Na2CO3溶解于水中,使总体积为500mL。
硫酸铜/酒石酸钠溶液:将2.5g的硫酸铜五水合物和5.96g的酒石酸钠二水合物溶解于水中,使总体积为500mL。
硫酸铜碱性溶液:将5mL的NaOH/Na2CO3溶液和1mL的硫酸铜/酒石酸钠溶液混合(新鲜制备)。
Folin水溶液:用水将由Aldrich制造的Folin试剂(F9252-100mL)稀释两倍。
白蛋白标准溶液:使用由Thermo Scientific制造的标准溶液(2mg/mL)并稀释至0.125、0.25、0.5和1mg/mL。
测量规程
将20μL的白蛋白标准溶液或受试溶液(经纯化的多糖的溶液)以及300μL的硫酸铜碱性溶液分配到1.5mL微管中,用混合器搅拌混合物,并随后静置10分钟。进一步地,添加30μL的Folin水溶液,搅拌混合物并随后静置30分钟。将300μL所得的显色溶液置于96孔板中,并获得750nm处的吸光度。基于从白蛋白标准溶液计算的标准曲线获得受试溶液中的蛋白质浓度。
<二糖分析>
依照与实施例5中相同的规程通过亚硝酸分解分析二糖组成以计算GlcA-GlcN(NS3S6S)的含有率。
<平均分子量的测量>
依照与实施例4中相同的规程使用普鲁兰多糖的分子量标记物作为标准实施GPC分析以计算平均分子量(Mn和Mw)。
实施例11:具有高乙酰基团残留率的N-硫酸化肝素前体的分子量的减少(1)肝素前体的N-去乙酰化
1)将6mL的2M NaOH添加到120mg的肝素前体,将混合物加热至48℃并反应4.1小时。
2)在通过添加12mL的6N HCl终止反应后,添加45mL的MeOH,然后将混合物离心,并去除上清液。将所得的沉淀溶解于8mL的0.25M NaHCO3,随后使用Amicon UF膜(3kDa)脱盐并浓缩溶液以获得6mL的N-去乙酰化肝素前体溶液。获得的N-去乙酰化肝素前体中乙酰基团的残留率为27.6%(稍后描述)。
(2)通过肝素酶III的低分子化
将6mL上述(1)获得的具有27.6%的N-乙酰基团残留率的N-去乙酰化肝素前体溶液和221μL的10mIU/μL肝素酶III溶液与0.6mL的含有1M NaCl和15mM CaCl2的Tris缓冲溶液(pH 8.0)混合,然后将MilliQ水添加到其中,使总体积为12mL,并且混合物于37℃反应8小时。将86mL的EtOH添加到反应溶液中并混合,将溶液离心,并去除上清液以获得低分子化的N-去乙酰化肝素前体。
(3)低分子化的N-去乙酰化肝素前体的N-硫酸化
1)将全部量的上述(2)获得的低分子化的N-去乙酰化肝素前体溶解于6mL的MilliQ水中,并将6mL的20mg/mL的NaHCO3/20mg/mL的三甲胺·SO3的水溶液添加到其中,并且混合物于55℃反应过夜。
2)将86mL的EtOH添加到其中并混合,将混合物离心,并去除上清液以获得N-硫酸化的低分子化肝素前体。
3)依照与实施例4中相同的技术计算获得的N-硫酸化的低分子化肝素前体的平均分子量。
实施例12:取决于N-乙酰基团残留率的低分子化的N-硫酸化肝素前体的分子量的控制
(1)肝素前体的N-去乙酰化
以与实施例11中相同的方式对肝素前体进行N-去乙酰化,并通过控制反应时间获得具有2.6%至29.6%的N-乙酰基团残留率的N-去乙酰化肝素前体。
(2)通过肝素酶III的低分子化
将上述(1)中获得的N-去乙酰化肝素前体与肝素酶III在与实施例11中相同的条件下反应以获得低分子化的N-去乙酰化肝素前体。
(3)低分子化的N-去乙酰化肝素前体的N-硫酸化
对上述(2)中获得的低分子化的N-去乙酰化肝素前体在与实施例11中相同的条件下进行N-硫酸化反应以获得N-硫酸化的低分子化肝素前体。
(4)平均分子量的总结
依照与实施例4中相同的技术计算获得的N-硫酸化的低分子化肝素前体的平均分子量。所得的产率和平均分子量(以普鲁兰多糖计)如表11中所示。
从表11中的结果,显示出可以通过增加N-乙酰基团的残留率控制分子量的减少。
表11
实施例13:用于检查由于分子量差异引起的活性差异的低分子化的N-硫酸化肝素前体的制备
由于N-乙酰基团的残留量影响硫酸乙酰肝素的活性,为了检查分子量的差异对活性的作用,制备具有相同N-乙酰基团残留量和不同分子量的低分子化的N-硫酸化肝素前体的试样。通过低分子化反应的反应时间控制分子量。
(1)肝素前体的N-去乙酰化
以与实施例11中相同的方式对肝素前体进行N-去乙酰化以获得具有29.4%的N-乙酰基团残留率的N-去乙酰化肝素前体。
(2)通过肝素酶III反应的低分子化
通过在与实施例11中相同的条件下与肝素酶III反应来实施上述(1)中获得的N-去乙酰化肝素前体的低分子化。通过改变氧的添加量和反应时间来控制分子量以获得四种低分子化的N-去乙酰化肝素前体。
(3)低分子化的N-去乙酰化肝素前体的N-硫酸化
对上述(2)中获得的四种低分子化的N-去乙酰化肝素前体在与实施例11中相同的条件下进行N-硫酸化反应以获得N-硫酸化的低分子化肝素前体。
(4)依照与实施例4中相同的技术计算获得的N-硫酸化的低分子化肝素前体的产率和分子量分布。
表12
实施例14:具有不同分子量的硫酸化多糖的制备
(1)C5-差向异构酶的表达和纯化
作为C5-差向异构酶,利用源自人的C5-差向异构酶的催化位点(Gly101至Asn617)和在C末端具有取代的三个氨基酸的麦芽糖结合蛋白(MBP*,先前报道(Rob J.Center,et.al.,"Cristallization of a trimeric human T cell leukemia virus type1gp21ectodomain fragment as a chimera with maltose-binding protein."ProteinScience,7,1612-1619(1998)))的融合蛋白(MBP*-C5-差向异构酶(G101))。
构建表达质粒的细节如下所示。首先,通过使用SEQ ID NO:31和32的寡核苷酸作为引物的用pMAL-c2x(SEQ ID NO:20,New England BioLabs)作为模板DNA的PCR获得MBP*的C末端区域的DNA片段。在上述PCR反应中,将限制酶BglII的识别位点添加到5’末端,并将限制酶HindIII、BamHI、SacI、XhoI和NotI的识别位点添加到3’末端。用BglII和HindIII切割pMAL-c2x质粒DNA和MBP*的C末端区域的DNA片段,并连接以获得pMAL-MBP*质粒。pMAL-MBP*质粒的核苷酸序列如SEQ ID NO:33中所示。
通过使用SEQ ID NO:34和35的寡核苷酸作为引物的用在实施例5中制备的pMAL-c2x-MBP-C5epi质粒作为模板DNA的PCR获得C5-差向异构酶(G101)的DNA片段。在该PCR中,将限制酶NotI的识别位点添加到5’末端,并将限制酶XhoI的识别位点添加到3’末端。用NotI和XhoI切割pMAL-c2x-MBP-C5epi质粒DNA和C5-差向异构酶(G101)的DNA片段,并连接以获得pMAL-MBP*-C5epi(G101)质粒。插入片段的核苷酸序列(编码C5-差向异构酶的催化位点(Gly101至Asn617)的核苷酸序列)和由其编码的氨基酸序列分别如SEQ ID NO:36和37中所示。以与实施例5中相同的方法将表达质粒pMAL-MBP*-C5epi(G101)和伴侣蛋白表达质粒pGro7(TaKaRa)导入到大肠杆菌Origami B(DE3)菌株(Novagen)中以获得Origami B(DE3)/pMAL-MBP*-C5epi(G101)/pGro7菌株。依照与实施例5中相同的方法使用该菌株制备微生物细胞提取液。
(2)2-O-硫酸化酶(2-OST)的表达和纯化
作为2-O-硫酸化酶(2-OST),利用源自中国仓鼠的具有用异亮氨酸取代94位的酪氨酸残基的2-OST的突变体的催化位点(Asp68至Asn356)和MBP*的融合蛋白(MBP*-2-OST(D68))。
构建表达质粒的细节如下所示。通过使用SEQ ID NO:38和39的寡核苷酸作为引物的用在实施例5中制备的pMAL-c2x-MBP-2OST质粒作为模板DNA的PCR获得2-OST(D68)的DNA片段。在该PCR中,将限制酶NotI和XhoI的识别位点分别添加到5’末端和3’末端。用NotI和XhoI切割pMAL-c2x-MBP-2OST质粒DNA和2-OST(D68)的DNA片段,并连接以获得pMAL-MBP*-2OST(D68)质粒。插入片段的核苷酸序列(编码2-OST的催化位点(Asp68至Asn356)的核苷酸序列)和由其编码的氨基酸序列分别如SEQ ID NO:40和41中所示。依照与实施例5中相同的方法将MBP*-2OST(D68)表达质粒pMAL-MBP*-2OST(D68)和伴侣蛋白表达质粒pGro7(TaKaRa)导入到大肠杆菌Origami B(DE3)菌株(Novagen)中以获得Origami B(DE3)/pMAL-MBP*-2OST(D68)/pGro7菌株。以与实施例5中相同的方法使用该菌株制备纯化的2-OST蛋白。
(3)C5-差向异构化和2-O-硫酸化的偶联反应
将作为反应溶液的组成的50mM MES(pH 7.0)、100mM NaCl和0.5mM PAPS,0.7mL的终浓度为0.09mg/mL的表达C5-差向异构酶的微生物细胞的提取液以及0.4mL的终浓度为0.07mg/mL的纯化的2-OST蛋白添加到68.9mL的含有14mg的实施例13中制备的N-硫酸化肝素前体No.1、No.2或No.3的混合溶液中,以各自制备总体积为70mL的反应溶液,然后将其于37℃反应10小时。
依照与实施例5中相同的规程通过亚硝酸分解分析反应产物中含有的二糖的组成。计算的二糖结构和它们的比率如表13中所示。在表格中,省略了认为包括具有N-乙酰基团的二糖衍生物等的未鉴定峰的数据,并假设GlcA(2S)-GlcN(NS)、IdoA(2S)-GlcN(NS)、GlcA-GlcN(NS)和IdoA-GlcN(NS)的总量为100%。
表13:C5-差向异构化和2-O-硫酸化的偶联反应的反应产物中二糖组成的含有率(%)
(4)C5-差向异构化反应
将作为反应溶液的组成的50mM MES(pH 7.0)和100mM NaCl,0.6mL的终浓度为1.0mg/mL的表达C5-差向异构酶的微生物细胞的提取液添加到5.4mL的含有14mg实施例13中制备的N-硫酸化肝素前体No.1、No.2或No.3的混合溶液中,以各自制备总体积为5mL的反应溶液,然后将其于37℃反应24小时。使用与实施例14(1)中使用的相同的C5-差向异构酶。依照与实施例5中相同的规程通过亚硝酸分解分析反应产物中含有的二糖的组成。计算的二糖结构和它的比率如表14中所示。
表14:C5-差向异构化反应的反应产物中二糖组成的含有率(%)
(5)6-O-硫酸化反应
将获得的酶反应溶液No.4至No.9(C5-差向异构化和2-O-硫酸化的偶联反应后的反应溶液,或单独的C5-差向异构化反应后的反应溶液)进行纯化,并依照与实施例6中相同的规程进行6-O-硫酸化以获得经清洗的浓缩溶液。
(6)3-O-硫酸化反应
制备以与实施例7中相同的反应溶液组成并包括每个80μg的从6-O-硫酸化反应获得的反应产物的反应溶液,并于37℃反应24小时。依照与实施例5中相同的规程通过亚硝酸分解分析反应产物中二糖的组成。计算的二糖结构和它们的比率如表15中所示。省略了未鉴定峰的数据,并假设表格中所示的二糖单元的总量为100%。
表15:3-O-硫酸化反应的反应产物中的二糖组成
(7)经纯化的多糖的抗凝血活性
将3-O-硫酸化反应的反应产物依照与实施例8中相同的规程进行纯化,并测量它们的抗凝血活性。结果如表16中所示。
表16:经纯化的多糖的质量
序列表说明
SEQ ID NO:1 来自大肠杆菌K5菌株的kfiABCD操纵子的核苷酸序列
SEQ ID NO:2 来自大肠杆菌K5菌株的KfiA蛋白的氨基酸序列
SEQ ID NO:3 来自大肠杆菌K5菌株的KfiB蛋白的氨基酸序列
SEQ ID NO:4 来自大肠杆菌K5菌株的KfiC蛋白的氨基酸序列
SEQ ID NO:5 来自大肠杆菌K5菌株的KfiD蛋白的氨基酸序列
SEQ ID NO:6和7 引物
SEQ ID NO:8 包括野生型nlpD启动子(Pnlp0)的PaeI-SalI片段的核苷酸序列
SEQ ID NO:9和10 引物
SEQ ID NO:11 rrnB终止子的核苷酸序列
SEQ ID NO:12至15 引物
SEQ ID NO:16 来自肝素黄杆菌ATCC 13125的hepC基因的核苷酸序列
SEQ ID NO:17 来自肝素黄杆菌ATCC 13125的HepC蛋白的氨基酸序列
SEQ ID NO:18和19 引物
SEQ ID NO:20 pMAL-c2x
SEQ ID NO:21和22 引物
SEQ ID NO:23 C5-差向异构酶插入片段的核苷酸序列(编码源自人的C5-差向异构酶的催化位点的核苷酸序列)
SEQ ID NO:24 源自人的C5-差向异构酶的催化位点的氨基酸序列
SEQ ID NO:25和26 引物
SEQ ID NO:27 2-OST插入片段的核苷酸序列(编码源自中国仓鼠的2-OST突变体的催化位点的核苷酸序列)
SEQ ID NO:28 源自中国仓鼠的2-OST突变体的催化位点的氨基酸序列
SEQ ID NO:29 源自小鼠的3-OST-1的氨基酸序列
SEQ ID NO:30 针对大肠杆菌中密码子使用进行优化并编码源自小鼠的3-OST-1的催化位点(Gly48至His311)的核苷酸序列
SEQ ID NO:31和32 引物
SEQ ID NO:33 pMAL-MBP*
SEQ ID NO:34和35 引物
SEQ ID NO:36 C5-差向异构酶(G101)插入片段的核苷酸序列(编码源自人的C5-差向异构酶的催化位点(Gly101至Asn617)的核苷酸序列)
SEQ ID NO:37 源自人的C5-差向异构酶的催化位点(Gly101至Asn617)的氨基酸序列
SEQ ID NO:38和39 引物
SEQ ID NO:40 2-OST(D68)插入片段的核苷酸序列(编码源自中国仓鼠的2-OST突变体的催化位点(Asp68至Asn356)的核苷酸序列)
SEQ ID NO:41 源自中国仓鼠的2-OST突变体的催化位点(Asp68至Asn356)的氨基酸序列
序列表
<110> 味之素株式会社
<120> 在氨基葡萄糖残基中具有高3-O-硫酸化比率的硫酸乙酰肝素
<130> PAMA-18135
<150> JP 2015-257022
<151> 2015-12-28
<160> 41
<170> PatentIn version 3.5
<210> 1
<211> 7467
<212> DNA
<213> 大肠杆菌
<220>
<221> CDS
<222> (445)..(1164)
<220>
<221> CDS
<222> (1593)..(3284)
<220>
<221> CDS
<222> (4576)..(6138)
<220>
<221> CDS
<222> (6180)..(7358)
<400> 1
ggaggcctga ttactgttgc actaacagtg tcattgccgg agattgtaat cacactctat 60
ataattatat aaactctatt gtatttagtg tatgaggagg atggacagta tactttgaac 120
taggtaatta tgaatttgat cgtgatctcg taatacgttg ctgttattct ttaattaatt 180
atctgccaat ttatttttag atagttacag gaaatgttta tgcaaagagt ggtttgatat 240
ggtaagagta ataatttaga tgaagataaa tatatcaaac gtacacccta gtagttattt 300
ttaattaaac atatcgtcca tgaggtgcgg agtcattcta atcaacttaa tgtgttctgt 360
ttattaagca tttcctataa ataaacgact atcaatacgt tgatagtttt cattaacatg 420
caatattaat taaaatatta cccc atg att gtt gca aat atg tca tca tac 471
Met Ile Val Ala Asn Met Ser Ser Tyr
1 5
cca cct cga aaa aaa gag ttg gtg cat tct ata caa agt tta cat gct 519
Pro Pro Arg Lys Lys Glu Leu Val His Ser Ile Gln Ser Leu His Ala
10 15 20 25
caa gta gat aaa att aat ctt tgc ctg aat gag ttt gaa gaa att cct 567
Gln Val Asp Lys Ile Asn Leu Cys Leu Asn Glu Phe Glu Glu Ile Pro
30 35 40
gag gaa tta gat ggt ttt tca aaa tta aat cca gtt att cca gat aaa 615
Glu Glu Leu Asp Gly Phe Ser Lys Leu Asn Pro Val Ile Pro Asp Lys
45 50 55
gat tat aag gat gtg ggc aaa ttt ata ttt cct tgc gct aaa aat gat 663
Asp Tyr Lys Asp Val Gly Lys Phe Ile Phe Pro Cys Ala Lys Asn Asp
60 65 70
atg atc gta ctt aca gat gat gat att att tac cct ccc gat tat gta 711
Met Ile Val Leu Thr Asp Asp Asp Ile Ile Tyr Pro Pro Asp Tyr Val
75 80 85
gaa aaa atg ctc aat ttt tat aat tcc ttt gca ata ttc aat tgc att 759
Glu Lys Met Leu Asn Phe Tyr Asn Ser Phe Ala Ile Phe Asn Cys Ile
90 95 100 105
gtt ggg att cat ggc tgt ata tac ata gat gca ttt gat gga gat cag 807
Val Gly Ile His Gly Cys Ile Tyr Ile Asp Ala Phe Asp Gly Asp Gln
110 115 120
tct aaa aga aaa gta ttt tca ttt act caa ggg cta ttg cga ccg aga 855
Ser Lys Arg Lys Val Phe Ser Phe Thr Gln Gly Leu Leu Arg Pro Arg
125 130 135
gtt gta aat caa tta ggt aca ggg act gtt ttt ctt aag gca gat caa 903
Val Val Asn Gln Leu Gly Thr Gly Thr Val Phe Leu Lys Ala Asp Gln
140 145 150
tta cca tct tta aaa tat atg gat ggt tct caa cga ttc gtc gat gtt 951
Leu Pro Ser Leu Lys Tyr Met Asp Gly Ser Gln Arg Phe Val Asp Val
155 160 165
aga ttt tct cgc tat atg tta gag aat gaa att ggt atg ata tgt gtt 999
Arg Phe Ser Arg Tyr Met Leu Glu Asn Glu Ile Gly Met Ile Cys Val
170 175 180 185
ccc aga gaa aaa aac tgg cta aga gag gtc tca tca ggt tca atg gaa 1047
Pro Arg Glu Lys Asn Trp Leu Arg Glu Val Ser Ser Gly Ser Met Glu
190 195 200
gga ctt tgg aac aca ttt aca aaa aaa tgg cct tta gac atc ata aaa 1095
Gly Leu Trp Asn Thr Phe Thr Lys Lys Trp Pro Leu Asp Ile Ile Lys
205 210 215
gaa aca caa gca atc gca gga tat tca aaa ctt aac ctc gaa tta gtg 1143
Glu Thr Gln Ala Ile Ala Gly Tyr Ser Lys Leu Asn Leu Glu Leu Val
220 225 230
tat aat gtg gaa ggg taa aaa cttacttttt tattcacatt cctgtatttt 1194
Tyr Asn Val Glu Gly Lys
235
gtgttggttt ctgaagttta tagtataaat acttgtttta aatagttgta cgttgatatt 1254
ttgttatata cttatttaaa ccatttgttt tatgattttg aaaaatatca gcgttagttt 1314
ggtagagttt ataattaaga tttttgtcta aaagaaggtg gtaacgcaat atgtcaatta 1374
ttaggaggtg ctctgagtta tattgatatt gtttattgat gaatggctat accaaataaa 1434
tcagatgtgc tattgagata tagatagttt catttagtat tatcacataa cgccacctaa 1494
attacattac agatttgaaa tatatgtctg caatatcacc attacgataa acgacagtgt 1554
ttaaaataaa gtaatcttgt agataataaa gaggaaatat gatgaataaa ttagtg 1610
Met Met Asn Lys Leu Val
240 245
cta gtc gga cat cct ggc tca aag tat cag ata gtt gaa cat ttt ttg 1658
Leu Val Gly His Pro Gly Ser Lys Tyr Gln Ile Val Glu His Phe Leu
250 255 260
aaa gaa att ggc atg aac tca cca aat tat tct aca agt aat aaa att 1706
Lys Glu Ile Gly Met Asn Ser Pro Asn Tyr Ser Thr Ser Asn Lys Ile
265 270 275
tcc cca gaa tat atc acc gct tca tta tgt caa ttt tat caa aca cca 1754
Ser Pro Glu Tyr Ile Thr Ala Ser Leu Cys Gln Phe Tyr Gln Thr Pro
280 285 290
gaa gtt aat gat gta gta gat gag aga gaa ttc tca gct gtt caa gtc 1802
Glu Val Asn Asp Val Val Asp Glu Arg Glu Phe Ser Ala Val Gln Val
295 300 305
tca acc atg tgg gat agc atg gtt ctt gaa cta atg atg aac aat cta 1850
Ser Thr Met Trp Asp Ser Met Val Leu Glu Leu Met Met Asn Asn Leu
310 315 320 325
aat aac aaa ctt tgg ggg tgg gca gat cca tct ata ata ttt ttt ctt 1898
Asn Asn Lys Leu Trp Gly Trp Ala Asp Pro Ser Ile Ile Phe Phe Leu
330 335 340
gat ttt tgg aaa aat ata gat aaa agc ata aaa ttc atc atg ata tat 1946
Asp Phe Trp Lys Asn Ile Asp Lys Ser Ile Lys Phe Ile Met Ile Tyr
345 350 355
gat cac cct aaa tat aat tta atg cgt tca gta aat aat gcc cct ctc 1994
Asp His Pro Lys Tyr Asn Leu Met Arg Ser Val Asn Asn Ala Pro Leu
360 365 370
tct tta aat ata aat aat agt gta gat aac tgg att gca tat aat aaa 2042
Ser Leu Asn Ile Asn Asn Ser Val Asp Asn Trp Ile Ala Tyr Asn Lys
375 380 385
aga ttg ctt gat ttt ttt ttg gag aat aaa gaa cga tgt gtg ttg att 2090
Arg Leu Leu Asp Phe Phe Leu Glu Asn Lys Glu Arg Cys Val Leu Ile
390 395 400 405
aat ttt gag gcg ttt caa agc aat aag aaa aat att ata aag cca ttg 2138
Asn Phe Glu Ala Phe Gln Ser Asn Lys Lys Asn Ile Ile Lys Pro Leu
410 415 420
agt aat att ata aaa ata gat aat cta atg tct gcg cat tac aaa aat 2186
Ser Asn Ile Ile Lys Ile Asp Asn Leu Met Ser Ala His Tyr Lys Asn
425 430 435
tca ata ttg ttt gat gtg gtt gag aat aat gat tat aca aaa tca aat 2234
Ser Ile Leu Phe Asp Val Val Glu Asn Asn Asp Tyr Thr Lys Ser Asn
440 445 450
gaa att gcc ctg ctt gaa aaa tat aca act tta ttt tct tta agt gca 2282
Glu Ile Ala Leu Leu Glu Lys Tyr Thr Thr Leu Phe Ser Leu Ser Ala
455 460 465
aat gag act gaa att aca ttt aat gat aca aag gtt agt gag tac tta 2330
Asn Glu Thr Glu Ile Thr Phe Asn Asp Thr Lys Val Ser Glu Tyr Leu
470 475 480 485
gta tct gaa tta ata aaa gaa aga acc gag gtt ctg aag ctt tat aat 2378
Val Ser Glu Leu Ile Lys Glu Arg Thr Glu Val Leu Lys Leu Tyr Asn
490 495 500
gag tta caa gcc tat gca aac cta cct tat ata gaa aca tcg aaa gat 2426
Glu Leu Gln Ala Tyr Ala Asn Leu Pro Tyr Ile Glu Thr Ser Lys Asp
505 510 515
aac gtt tcg gct gag gct gca tta tgg gag gta gtc gaa gag aga aat 2474
Asn Val Ser Ala Glu Ala Ala Leu Trp Glu Val Val Glu Glu Arg Asn
520 525 530
tct atc ttc aat att gta tct cat ttg gtg caa gag tca aaa aag aag 2522
Ser Ile Phe Asn Ile Val Ser His Leu Val Gln Glu Ser Lys Lys Lys
535 540 545
gat gca gat att gaa ttg act aaa tct ata ttt aag aaa aga caa ttt 2570
Asp Ala Asp Ile Glu Leu Thr Lys Ser Ile Phe Lys Lys Arg Gln Phe
550 555 560 565
tta tta ttg aac agg att aat gag cta aaa aaa gaa aag gaa gag gta 2618
Leu Leu Leu Asn Arg Ile Asn Glu Leu Lys Lys Glu Lys Glu Glu Val
570 575 580
att aaa ctt tca aaa ata aat cac aac gat gtt gtg aga caa gaa aaa 2666
Ile Lys Leu Ser Lys Ile Asn His Asn Asp Val Val Arg Gln Glu Lys
585 590 595
tat cca gat gat att gaa aaa aaa ata aat gac ata cag aaa tat gaa 2714
Tyr Pro Asp Asp Ile Glu Lys Lys Ile Asn Asp Ile Gln Lys Tyr Glu
600 605 610
gaa gag ata agc gaa aaa gaa tca aaa ctc act cag gca ata tca gaa 2762
Glu Glu Ile Ser Glu Lys Glu Ser Lys Leu Thr Gln Ala Ile Ser Glu
615 620 625
aaa gaa cag att tta aaa caa ttg cat aaa tat gaa gaa gag ata agc 2810
Lys Glu Gln Ile Leu Lys Gln Leu His Lys Tyr Glu Glu Glu Ile Ser
630 635 640 645
gaa aaa gaa tca aaa ctc act cag gca ata tca gaa aaa gaa cag att 2858
Glu Lys Glu Ser Lys Leu Thr Gln Ala Ile Ser Glu Lys Glu Gln Ile
650 655 660
tta aaa caa ttg cat ata gtg caa gag cag ttg gaa cac tat ttt ata 2906
Leu Lys Gln Leu His Ile Val Gln Glu Gln Leu Glu His Tyr Phe Ile
665 670 675
gaa aat cag gaa att aaa aag aaa ctt cca cct gtg cta tat gga gca 2954
Glu Asn Gln Glu Ile Lys Lys Lys Leu Pro Pro Val Leu Tyr Gly Ala
680 685 690
gct gag cag ata aaa caa gag tta ggt tat cga ctt ggt tat att ata 3002
Ala Glu Gln Ile Lys Gln Glu Leu Gly Tyr Arg Leu Gly Tyr Ile Ile
695 700 705
gtc tcg tat tct aaa tcc ctc aag ggg att att acc atg cca ttt gca 3050
Val Ser Tyr Ser Lys Ser Leu Lys Gly Ile Ile Thr Met Pro Phe Ala
710 715 720 725
ctt atc cgt gag tgt gtt ttt gaa aaa aaa cgt aag aag agt tat ggc 3098
Leu Ile Arg Glu Cys Val Phe Glu Lys Lys Arg Lys Lys Ser Tyr Gly
730 735 740
gtt gat gtg cca ctc tat tta tat gct gat gct gat aag gct gaa aga 3146
Val Asp Val Pro Leu Tyr Leu Tyr Ala Asp Ala Asp Lys Ala Glu Arg
745 750 755
gtt aag aaa cat tta tct tat caa tta ggg cag gct att atc tcc agt 3194
Val Lys Lys His Leu Ser Tyr Gln Leu Gly Gln Ala Ile Ile Ser Ser
760 765 770
gct aat tcg ata ttt gga ttc att acc ctt cca ttt aag tta att gtt 3242
Ala Asn Ser Ile Phe Gly Phe Ile Thr Leu Pro Phe Lys Leu Ile Val
775 780 785
gtt gtt tat aaa tat agg aga gct aaa atc aag ggc tgt taa 3284
Val Val Tyr Lys Tyr Arg Arg Ala Lys Ile Lys Gly Cys
790 795 800
aaatgtgaac cctaatgaga tatattgcaa attttatttt tctctttgtg gtgttttgct 3344
ttcgttaaaa tagttagtta ttttatttat ataatatcac gcattataat accaatttat 3404
acttttgcaa gtgaccgtat agattcgcca catattgcaa attttgttct ctcgtaaaat 3464
attttcttct ggtgtcagta attcgagcac ttcatgctgt cttttactgc agtatagtac 3524
taggttttca gctagtttct gattaaatat gtttagctct ttaaagagtc tatttattta 3584
aattcaatga actgttcttt cggcgttcgc ttaaaacgtt cagaggtgcg ttctaggcgt 3644
aaaggggtag gtccataggg cttgctagcg gattcctgcg gtgctttgtc gaagtttcct 3704
gggaactctt tcccgttatc tgcgatgccc tggttgatat cgatagggaa tagccggtct 3764
gcacggcaaa agaagagttt gatgatatca cagttaagtg acggcacggc ctgtgccaga 3824
gcgtagttgc tgtgttcgtc gatcatggta atgacataac agcgcagctc gcccattctg 3884
agctcaatag catctatacc aacgagctca ctgctcttta ccgggcgata gcgttttgat 3944
ctgcgggttg gaggattgta ttttttatga acagtgtttt tccttgggga ggcagtcaca 4004
tcggtatcag tcgcatttta tcgtgtgcgg ccgtgaacat cctgccgatg gttgaaatgc 4064
tcggacagac caggcggtgc tgttcactcc acggcttcaa gcaaacaaaa atctgttctt 4124
ctaggttggg aagctctatt ctcagtcgac gtatttctta cagaattacg agatgccatt 4184
gctttgtgcg atgtactagc ggagctttgc tacgcgaaat aggtgcctct gggccataat 4244
acagcgttcg tgtggataca gcaaaaactt ccgcaactgt attgatctca tgtttctccc 4304
agaagtatat tttttcatcc ttaattttgt aatctcaggt ataacaaagt gtttcatcac 4364
atagatgttg gcatggtaat gcctcaaata tccgccgcag atacgttgca tcaacttagc 4424
atttccctcg cttgtccgga gataattgca atatctctgt gagcttacac tgtgacattc 4484
gttgagtttt agtgatgttt ttaaagattt atatttataa tatttagtaa atgcagtttt 4544
attctcattt tatttatcat taagtgaatg t atg aac gca gaa tat ata aat 4596
Met Asn Ala Glu Tyr Ile Asn
805
tta gtt gaa cgt aaa aag aaa tta ggg aca aat att ggt gct ctt gat 4644
Leu Val Glu Arg Lys Lys Lys Leu Gly Thr Asn Ile Gly Ala Leu Asp
810 815 820 825
ttt tta tta tca att cat aag gag aaa gtt gat ctt caa cat aaa aac 4692
Phe Leu Leu Ser Ile His Lys Glu Lys Val Asp Leu Gln His Lys Asn
830 835 840
tcg cct tta aaa ggt aac gat aac ctt att cac aaa aga ata aac gaa 4740
Ser Pro Leu Lys Gly Asn Asp Asn Leu Ile His Lys Arg Ile Asn Glu
845 850 855
tac gac aat gta ctt gaa cta tct aag aat gta tca gct cag aat tct 4788
Tyr Asp Asn Val Leu Glu Leu Ser Lys Asn Val Ser Ala Gln Asn Ser
860 865 870
ggc aat gag ttt tct tat tta ttg gga tat gca gat tct ctt aga aaa 4836
Gly Asn Glu Phe Ser Tyr Leu Leu Gly Tyr Ala Asp Ser Leu Arg Lys
875 880 885
gtt ggt atg ttg gat act tat att aaa att gtt tgt tat cta aca att 4884
Val Gly Met Leu Asp Thr Tyr Ile Lys Ile Val Cys Tyr Leu Thr Ile
890 895 900 905
caa tct cgt tat ttt aaa aat ggc gaa cga gtt aag ctt ttt gaa cat 4932
Gln Ser Arg Tyr Phe Lys Asn Gly Glu Arg Val Lys Leu Phe Glu His
910 915 920
ata agt aac gct cta cgg tat tca agg agt gat ttt ctc att aat ctt 4980
Ile Ser Asn Ala Leu Arg Tyr Ser Arg Ser Asp Phe Leu Ile Asn Leu
925 930 935
att ttt gaa cga tat atc gaa tat ata aac cat cta aaa ttg tcg ccc 5028
Ile Phe Glu Arg Tyr Ile Glu Tyr Ile Asn His Leu Lys Leu Ser Pro
940 945 950
aaa caa aaa gat ttt tat ttt tgt acg aag ttt tca aaa ttt cat gat 5076
Lys Gln Lys Asp Phe Tyr Phe Cys Thr Lys Phe Ser Lys Phe His Asp
955 960 965
tat act aaa aat gga tat aaa tat tta gca ttt gat aat caa gcc gat 5124
Tyr Thr Lys Asn Gly Tyr Lys Tyr Leu Ala Phe Asp Asn Gln Ala Asp
970 975 980 985
gca ggg tat ggc ctg act tta tta tta aat gca aac gat gat atg caa 5172
Ala Gly Tyr Gly Leu Thr Leu Leu Leu Asn Ala Asn Asp Asp Met Gln
990 995 1000
gat agt tat aat cta ctc cct gag caa gaa ctt ttt att tgt aat 5217
Asp Ser Tyr Asn Leu Leu Pro Glu Gln Glu Leu Phe Ile Cys Asn
1005 1010 1015
gct gta ata gat aat atg aat att tat agg agt caa ttt aac aaa 5262
Ala Val Ile Asp Asn Met Asn Ile Tyr Arg Ser Gln Phe Asn Lys
1020 1025 1030
tgt cta cga aaa tac gat tta tca gaa ata act gat ata tac cca 5307
Cys Leu Arg Lys Tyr Asp Leu Ser Glu Ile Thr Asp Ile Tyr Pro
1035 1040 1045
aat aaa att ata ttg caa gga att aag ttc gat aag aaa aaa aat 5352
Asn Lys Ile Ile Leu Gln Gly Ile Lys Phe Asp Lys Lys Lys Asn
1050 1055 1060
gtt tat gga aaa gat ctt gtt agt ata ata atg tca gta ttc aat 5397
Val Tyr Gly Lys Asp Leu Val Ser Ile Ile Met Ser Val Phe Asn
1065 1070 1075
tca gaa gat act att gca tac tca tta cat tca ttg ttg aat caa 5442
Ser Glu Asp Thr Ile Ala Tyr Ser Leu His Ser Leu Leu Asn Gln
1080 1085 1090
aca tat gaa aat att gaa att ctc gtg tgc gat gat tgt tca tcg 5487
Thr Tyr Glu Asn Ile Glu Ile Leu Val Cys Asp Asp Cys Ser Ser
1095 1100 1105
gac aaa agc ctt gaa ata att aag agc ata gct tat tct gat tca 5532
Asp Lys Ser Leu Glu Ile Ile Lys Ser Ile Ala Tyr Ser Asp Ser
1110 1115 1120
aga gtg aaa gta tat agc tca cga aaa aac caa ggc cct tat aat 5577
Arg Val Lys Val Tyr Ser Ser Arg Lys Asn Gln Gly Pro Tyr Asn
1125 1130 1135
ata aga aat gag cta ata aaa aaa gca cac ggt aat ttc atc acc 5622
Ile Arg Asn Glu Leu Ile Lys Lys Ala His Gly Asn Phe Ile Thr
1140 1145 1150
ttt caa gat gca gat gat ctt tct cat ccg gag aga ata caa aga 5667
Phe Gln Asp Ala Asp Asp Leu Ser His Pro Glu Arg Ile Gln Arg
1155 1160 1165
caa gtt gag gtt ctt cgc aat aat aag gct gta atc tgt atg gct 5712
Gln Val Glu Val Leu Arg Asn Asn Lys Ala Val Ile Cys Met Ala
1170 1175 1180
aac tgg atc cgt gtt gcg tca aat gga aaa att caa ttc ttc tat 5757
Asn Trp Ile Arg Val Ala Ser Asn Gly Lys Ile Gln Phe Phe Tyr
1185 1190 1195
gat gat aaa gcc aca aga atg tct gtt gta tcg tca atg ata aaa 5802
Asp Asp Lys Ala Thr Arg Met Ser Val Val Ser Ser Met Ile Lys
1200 1205 1210
aaa gat att ttt gcg aca gtt ggt ggc tat aga caa tct tta att 5847
Lys Asp Ile Phe Ala Thr Val Gly Gly Tyr Arg Gln Ser Leu Ile
1215 1220 1225
ggt gca gat acg gag ttt tat gaa aca gta ata atg cgt tat ggg 5892
Gly Ala Asp Thr Glu Phe Tyr Glu Thr Val Ile Met Arg Tyr Gly
1230 1235 1240
cga gaa agt att gta aga tta ctg cag cca ttg ata ttg ggg tta 5937
Arg Glu Ser Ile Val Arg Leu Leu Gln Pro Leu Ile Leu Gly Leu
1245 1250 1255
tgg gga gac tcc gga ctt acc agg aat aaa gga aca gaa gct cta 5982
Trp Gly Asp Ser Gly Leu Thr Arg Asn Lys Gly Thr Glu Ala Leu
1260 1265 1270
cct gat gga tat ata tca caa tct cga aga gaa tat agt gat atc 6027
Pro Asp Gly Tyr Ile Ser Gln Ser Arg Arg Glu Tyr Ser Asp Ile
1275 1280 1285
gcg gca aga caa cga gtg tta ggg aaa agt atc gta agt gat aaa 6072
Ala Ala Arg Gln Arg Val Leu Gly Lys Ser Ile Val Ser Asp Lys
1290 1295 1300
gat gta cgt ggt tta tta tct cgc tat ggt ttg ttt aaa gat gta 6117
Asp Val Arg Gly Leu Leu Ser Arg Tyr Gly Leu Phe Lys Asp Val
1305 1310 1315
tca gga ata att gaa caa tag tttgttattc tatatatatt aaatttttgg 6168
Ser Gly Ile Ile Glu Gln
1320
ggctatataa a atg ttc gga aca cta aaa ata act gtt tca ggc gct 6215
Met Phe Gly Thr Leu Lys Ile Thr Val Ser Gly Ala
1325 1330
ggt tac gtt ggg ctt tca aat gga att cta atg gct caa aat cat 6260
Gly Tyr Val Gly Leu Ser Asn Gly Ile Leu Met Ala Gln Asn His
1335 1340 1345
gaa gtg gtt gca ttt gat acc cat caa aaa aaa gtt gac tta ctt 6305
Glu Val Val Ala Phe Asp Thr His Gln Lys Lys Val Asp Leu Leu
1350 1355 1360
aat gat aaa ctc tct cct ata gag gat aag gaa att gaa aat tat 6350
Asn Asp Lys Leu Ser Pro Ile Glu Asp Lys Glu Ile Glu Asn Tyr
1365 1370 1375
ctt tca act aaa ata ctt aat ttt cgc gca act act aac aaa tat 6395
Leu Ser Thr Lys Ile Leu Asn Phe Arg Ala Thr Thr Asn Lys Tyr
1380 1385 1390
gaa gcc tat aaa aat gcc aat tac gtt att att gct aca cca acg 6440
Glu Ala Tyr Lys Asn Ala Asn Tyr Val Ile Ile Ala Thr Pro Thr
1395 1400 1405
aat tat gac cca ggt tca aat tac ttt gat aca tca agc gtt gaa 6485
Asn Tyr Asp Pro Gly Ser Asn Tyr Phe Asp Thr Ser Ser Val Glu
1410 1415 1420
gct gtc att cgt gac gta acg gaa atc aac cca aac gca att atg 6530
Ala Val Ile Arg Asp Val Thr Glu Ile Asn Pro Asn Ala Ile Met
1425 1430 1435
gtg gtt aaa tct acg gtc cca gta ggt ttc aca aaa aca att aaa 6575
Val Val Lys Ser Thr Val Pro Val Gly Phe Thr Lys Thr Ile Lys
1440 1445 1450
gaa cat tta ggt att aat aat att atc ttc tct cca gaa ttt tta 6620
Glu His Leu Gly Ile Asn Asn Ile Ile Phe Ser Pro Glu Phe Leu
1455 1460 1465
cga gaa gga aga gcc cta tac gat aat ctc cat cca tct cgc att 6665
Arg Glu Gly Arg Ala Leu Tyr Asp Asn Leu His Pro Ser Arg Ile
1470 1475 1480
att atc ggt gaa tgt tct gaa cgg gca gaa cgt ttg gca gtg tta 6710
Ile Ile Gly Glu Cys Ser Glu Arg Ala Glu Arg Leu Ala Val Leu
1485 1490 1495
ttt cag gaa gga gcg att aaa caa aat ata ccc gtt tta ttt aca 6755
Phe Gln Glu Gly Ala Ile Lys Gln Asn Ile Pro Val Leu Phe Thr
1500 1505 1510
gat tct acg gaa gcg gaa gcg att aag tta ttt tca aat act tat 6800
Asp Ser Thr Glu Ala Glu Ala Ile Lys Leu Phe Ser Asn Thr Tyr
1515 1520 1525
ttg gct atg cga gtt gca ttt ttt aat gaa ttg gat agt tac gca 6845
Leu Ala Met Arg Val Ala Phe Phe Asn Glu Leu Asp Ser Tyr Ala
1530 1535 1540
gaa agt ttt ggt ctg aat acg cgt cag att att gac ggt gtt tgt 6890
Glu Ser Phe Gly Leu Asn Thr Arg Gln Ile Ile Asp Gly Val Cys
1545 1550 1555
ttg gat ccg cgc att ggt aat tac tac aat aat cct tct ttt ggt 6935
Leu Asp Pro Arg Ile Gly Asn Tyr Tyr Asn Asn Pro Ser Phe Gly
1560 1565 1570
tat ggt ggc tac tgt ttg cca aaa gat acc aag caa tta tta gcc 6980
Tyr Gly Gly Tyr Cys Leu Pro Lys Asp Thr Lys Gln Leu Leu Ala
1575 1580 1585
aac tat cag tct gtt ccg aat aaa ctt ata tct gca att gtt gat 7025
Asn Tyr Gln Ser Val Pro Asn Lys Leu Ile Ser Ala Ile Val Asp
1590 1595 1600
gct aac cgt aca cgt aag gac ttt atc act aat gtt att ttg aaa 7070
Ala Asn Arg Thr Arg Lys Asp Phe Ile Thr Asn Val Ile Leu Lys
1605 1610 1615
cat aga cca caa gtt gtg ggg gtt tat cgt ttg att atg aaa agt 7115
His Arg Pro Gln Val Val Gly Val Tyr Arg Leu Ile Met Lys Ser
1620 1625 1630
ggt tca gat aat ttt aga gat tct tct att ctt ggt att ata aag 7160
Gly Ser Asp Asn Phe Arg Asp Ser Ser Ile Leu Gly Ile Ile Lys
1635 1640 1645
cgt atc aag aaa aaa ggc gtg aaa gta att att tat gag ccg ctt 7205
Arg Ile Lys Lys Lys Gly Val Lys Val Ile Ile Tyr Glu Pro Leu
1650 1655 1660
att tct gga gat aca ttc ttt aac tca cct ttg gaa cgg gag ctg 7250
Ile Ser Gly Asp Thr Phe Phe Asn Ser Pro Leu Glu Arg Glu Leu
1665 1670 1675
gcg atc ttt aaa ggg aaa gct gat att att atc act aac cga atg 7295
Ala Ile Phe Lys Gly Lys Ala Asp Ile Ile Ile Thr Asn Arg Met
1680 1685 1690
tca gag gag ttg aac gat gtg gtc gac aaa gtc tat agt cgc gat 7340
Ser Glu Glu Leu Asn Asp Val Val Asp Lys Val Tyr Ser Arg Asp
1695 1700 1705
ttg ttt aaa tgt gac taa tgtattgtta tatactatta actattaaga 7388
Leu Phe Lys Cys Asp
1710
gaaggaaatg cattatttaa tccgttaaaa atatgcctcg ttggtatgtt ctttattaat 7448
cctcgatcgt aaaataaga 7467
<210> 2
<211> 238
<212> PRT
<213> 大肠杆菌
<400> 2
Met Ile Val Ala Asn Met Ser Ser Tyr Pro Pro Arg Lys Lys Glu Leu
1 5 10 15
Val His Ser Ile Gln Ser Leu His Ala Gln Val Asp Lys Ile Asn Leu
20 25 30
Cys Leu Asn Glu Phe Glu Glu Ile Pro Glu Glu Leu Asp Gly Phe Ser
35 40 45
Lys Leu Asn Pro Val Ile Pro Asp Lys Asp Tyr Lys Asp Val Gly Lys
50 55 60
Phe Ile Phe Pro Cys Ala Lys Asn Asp Met Ile Val Leu Thr Asp Asp
65 70 75 80
Asp Ile Ile Tyr Pro Pro Asp Tyr Val Glu Lys Met Leu Asn Phe Tyr
85 90 95
Asn Ser Phe Ala Ile Phe Asn Cys Ile Val Gly Ile His Gly Cys Ile
100 105 110
Tyr Ile Asp Ala Phe Asp Gly Asp Gln Ser Lys Arg Lys Val Phe Ser
115 120 125
Phe Thr Gln Gly Leu Leu Arg Pro Arg Val Val Asn Gln Leu Gly Thr
130 135 140
Gly Thr Val Phe Leu Lys Ala Asp Gln Leu Pro Ser Leu Lys Tyr Met
145 150 155 160
Asp Gly Ser Gln Arg Phe Val Asp Val Arg Phe Ser Arg Tyr Met Leu
165 170 175
Glu Asn Glu Ile Gly Met Ile Cys Val Pro Arg Glu Lys Asn Trp Leu
180 185 190
Arg Glu Val Ser Ser Gly Ser Met Glu Gly Leu Trp Asn Thr Phe Thr
195 200 205
Lys Lys Trp Pro Leu Asp Ile Ile Lys Glu Thr Gln Ala Ile Ala Gly
210 215 220
Tyr Ser Lys Leu Asn Leu Glu Leu Val Tyr Asn Val Glu Gly
225 230 235
<210> 3
<211> 563
<212> PRT
<213> 大肠杆菌
<400> 3
Met Met Asn Lys Leu Val Leu Val Gly His Pro Gly Ser Lys Tyr Gln
1 5 10 15
Ile Val Glu His Phe Leu Lys Glu Ile Gly Met Asn Ser Pro Asn Tyr
20 25 30
Ser Thr Ser Asn Lys Ile Ser Pro Glu Tyr Ile Thr Ala Ser Leu Cys
35 40 45
Gln Phe Tyr Gln Thr Pro Glu Val Asn Asp Val Val Asp Glu Arg Glu
50 55 60
Phe Ser Ala Val Gln Val Ser Thr Met Trp Asp Ser Met Val Leu Glu
65 70 75 80
Leu Met Met Asn Asn Leu Asn Asn Lys Leu Trp Gly Trp Ala Asp Pro
85 90 95
Ser Ile Ile Phe Phe Leu Asp Phe Trp Lys Asn Ile Asp Lys Ser Ile
100 105 110
Lys Phe Ile Met Ile Tyr Asp His Pro Lys Tyr Asn Leu Met Arg Ser
115 120 125
Val Asn Asn Ala Pro Leu Ser Leu Asn Ile Asn Asn Ser Val Asp Asn
130 135 140
Trp Ile Ala Tyr Asn Lys Arg Leu Leu Asp Phe Phe Leu Glu Asn Lys
145 150 155 160
Glu Arg Cys Val Leu Ile Asn Phe Glu Ala Phe Gln Ser Asn Lys Lys
165 170 175
Asn Ile Ile Lys Pro Leu Ser Asn Ile Ile Lys Ile Asp Asn Leu Met
180 185 190
Ser Ala His Tyr Lys Asn Ser Ile Leu Phe Asp Val Val Glu Asn Asn
195 200 205
Asp Tyr Thr Lys Ser Asn Glu Ile Ala Leu Leu Glu Lys Tyr Thr Thr
210 215 220
Leu Phe Ser Leu Ser Ala Asn Glu Thr Glu Ile Thr Phe Asn Asp Thr
225 230 235 240
Lys Val Ser Glu Tyr Leu Val Ser Glu Leu Ile Lys Glu Arg Thr Glu
245 250 255
Val Leu Lys Leu Tyr Asn Glu Leu Gln Ala Tyr Ala Asn Leu Pro Tyr
260 265 270
Ile Glu Thr Ser Lys Asp Asn Val Ser Ala Glu Ala Ala Leu Trp Glu
275 280 285
Val Val Glu Glu Arg Asn Ser Ile Phe Asn Ile Val Ser His Leu Val
290 295 300
Gln Glu Ser Lys Lys Lys Asp Ala Asp Ile Glu Leu Thr Lys Ser Ile
305 310 315 320
Phe Lys Lys Arg Gln Phe Leu Leu Leu Asn Arg Ile Asn Glu Leu Lys
325 330 335
Lys Glu Lys Glu Glu Val Ile Lys Leu Ser Lys Ile Asn His Asn Asp
340 345 350
Val Val Arg Gln Glu Lys Tyr Pro Asp Asp Ile Glu Lys Lys Ile Asn
355 360 365
Asp Ile Gln Lys Tyr Glu Glu Glu Ile Ser Glu Lys Glu Ser Lys Leu
370 375 380
Thr Gln Ala Ile Ser Glu Lys Glu Gln Ile Leu Lys Gln Leu His Lys
385 390 395 400
Tyr Glu Glu Glu Ile Ser Glu Lys Glu Ser Lys Leu Thr Gln Ala Ile
405 410 415
Ser Glu Lys Glu Gln Ile Leu Lys Gln Leu His Ile Val Gln Glu Gln
420 425 430
Leu Glu His Tyr Phe Ile Glu Asn Gln Glu Ile Lys Lys Lys Leu Pro
435 440 445
Pro Val Leu Tyr Gly Ala Ala Glu Gln Ile Lys Gln Glu Leu Gly Tyr
450 455 460
Arg Leu Gly Tyr Ile Ile Val Ser Tyr Ser Lys Ser Leu Lys Gly Ile
465 470 475 480
Ile Thr Met Pro Phe Ala Leu Ile Arg Glu Cys Val Phe Glu Lys Lys
485 490 495
Arg Lys Lys Ser Tyr Gly Val Asp Val Pro Leu Tyr Leu Tyr Ala Asp
500 505 510
Ala Asp Lys Ala Glu Arg Val Lys Lys His Leu Ser Tyr Gln Leu Gly
515 520 525
Gln Ala Ile Ile Ser Ser Ala Asn Ser Ile Phe Gly Phe Ile Thr Leu
530 535 540
Pro Phe Lys Leu Ile Val Val Val Tyr Lys Tyr Arg Arg Ala Lys Ile
545 550 555 560
Lys Gly Cys
<210> 4
<211> 520
<212> PRT
<213> 大肠杆菌
<400> 4
Met Asn Ala Glu Tyr Ile Asn Leu Val Glu Arg Lys Lys Lys Leu Gly
1 5 10 15
Thr Asn Ile Gly Ala Leu Asp Phe Leu Leu Ser Ile His Lys Glu Lys
20 25 30
Val Asp Leu Gln His Lys Asn Ser Pro Leu Lys Gly Asn Asp Asn Leu
35 40 45
Ile His Lys Arg Ile Asn Glu Tyr Asp Asn Val Leu Glu Leu Ser Lys
50 55 60
Asn Val Ser Ala Gln Asn Ser Gly Asn Glu Phe Ser Tyr Leu Leu Gly
65 70 75 80
Tyr Ala Asp Ser Leu Arg Lys Val Gly Met Leu Asp Thr Tyr Ile Lys
85 90 95
Ile Val Cys Tyr Leu Thr Ile Gln Ser Arg Tyr Phe Lys Asn Gly Glu
100 105 110
Arg Val Lys Leu Phe Glu His Ile Ser Asn Ala Leu Arg Tyr Ser Arg
115 120 125
Ser Asp Phe Leu Ile Asn Leu Ile Phe Glu Arg Tyr Ile Glu Tyr Ile
130 135 140
Asn His Leu Lys Leu Ser Pro Lys Gln Lys Asp Phe Tyr Phe Cys Thr
145 150 155 160
Lys Phe Ser Lys Phe His Asp Tyr Thr Lys Asn Gly Tyr Lys Tyr Leu
165 170 175
Ala Phe Asp Asn Gln Ala Asp Ala Gly Tyr Gly Leu Thr Leu Leu Leu
180 185 190
Asn Ala Asn Asp Asp Met Gln Asp Ser Tyr Asn Leu Leu Pro Glu Gln
195 200 205
Glu Leu Phe Ile Cys Asn Ala Val Ile Asp Asn Met Asn Ile Tyr Arg
210 215 220
Ser Gln Phe Asn Lys Cys Leu Arg Lys Tyr Asp Leu Ser Glu Ile Thr
225 230 235 240
Asp Ile Tyr Pro Asn Lys Ile Ile Leu Gln Gly Ile Lys Phe Asp Lys
245 250 255
Lys Lys Asn Val Tyr Gly Lys Asp Leu Val Ser Ile Ile Met Ser Val
260 265 270
Phe Asn Ser Glu Asp Thr Ile Ala Tyr Ser Leu His Ser Leu Leu Asn
275 280 285
Gln Thr Tyr Glu Asn Ile Glu Ile Leu Val Cys Asp Asp Cys Ser Ser
290 295 300
Asp Lys Ser Leu Glu Ile Ile Lys Ser Ile Ala Tyr Ser Asp Ser Arg
305 310 315 320
Val Lys Val Tyr Ser Ser Arg Lys Asn Gln Gly Pro Tyr Asn Ile Arg
325 330 335
Asn Glu Leu Ile Lys Lys Ala His Gly Asn Phe Ile Thr Phe Gln Asp
340 345 350
Ala Asp Asp Leu Ser His Pro Glu Arg Ile Gln Arg Gln Val Glu Val
355 360 365
Leu Arg Asn Asn Lys Ala Val Ile Cys Met Ala Asn Trp Ile Arg Val
370 375 380
Ala Ser Asn Gly Lys Ile Gln Phe Phe Tyr Asp Asp Lys Ala Thr Arg
385 390 395 400
Met Ser Val Val Ser Ser Met Ile Lys Lys Asp Ile Phe Ala Thr Val
405 410 415
Gly Gly Tyr Arg Gln Ser Leu Ile Gly Ala Asp Thr Glu Phe Tyr Glu
420 425 430
Thr Val Ile Met Arg Tyr Gly Arg Glu Ser Ile Val Arg Leu Leu Gln
435 440 445
Pro Leu Ile Leu Gly Leu Trp Gly Asp Ser Gly Leu Thr Arg Asn Lys
450 455 460
Gly Thr Glu Ala Leu Pro Asp Gly Tyr Ile Ser Gln Ser Arg Arg Glu
465 470 475 480
Tyr Ser Asp Ile Ala Ala Arg Gln Arg Val Leu Gly Lys Ser Ile Val
485 490 495
Ser Asp Lys Asp Val Arg Gly Leu Leu Ser Arg Tyr Gly Leu Phe Lys
500 505 510
Asp Val Ser Gly Ile Ile Glu Gln
515 520
<210> 5
<211> 392
<212> PRT
<213> 大肠杆菌
<400> 5
Met Phe Gly Thr Leu Lys Ile Thr Val Ser Gly Ala Gly Tyr Val Gly
1 5 10 15
Leu Ser Asn Gly Ile Leu Met Ala Gln Asn His Glu Val Val Ala Phe
20 25 30
Asp Thr His Gln Lys Lys Val Asp Leu Leu Asn Asp Lys Leu Ser Pro
35 40 45
Ile Glu Asp Lys Glu Ile Glu Asn Tyr Leu Ser Thr Lys Ile Leu Asn
50 55 60
Phe Arg Ala Thr Thr Asn Lys Tyr Glu Ala Tyr Lys Asn Ala Asn Tyr
65 70 75 80
Val Ile Ile Ala Thr Pro Thr Asn Tyr Asp Pro Gly Ser Asn Tyr Phe
85 90 95
Asp Thr Ser Ser Val Glu Ala Val Ile Arg Asp Val Thr Glu Ile Asn
100 105 110
Pro Asn Ala Ile Met Val Val Lys Ser Thr Val Pro Val Gly Phe Thr
115 120 125
Lys Thr Ile Lys Glu His Leu Gly Ile Asn Asn Ile Ile Phe Ser Pro
130 135 140
Glu Phe Leu Arg Glu Gly Arg Ala Leu Tyr Asp Asn Leu His Pro Ser
145 150 155 160
Arg Ile Ile Ile Gly Glu Cys Ser Glu Arg Ala Glu Arg Leu Ala Val
165 170 175
Leu Phe Gln Glu Gly Ala Ile Lys Gln Asn Ile Pro Val Leu Phe Thr
180 185 190
Asp Ser Thr Glu Ala Glu Ala Ile Lys Leu Phe Ser Asn Thr Tyr Leu
195 200 205
Ala Met Arg Val Ala Phe Phe Asn Glu Leu Asp Ser Tyr Ala Glu Ser
210 215 220
Phe Gly Leu Asn Thr Arg Gln Ile Ile Asp Gly Val Cys Leu Asp Pro
225 230 235 240
Arg Ile Gly Asn Tyr Tyr Asn Asn Pro Ser Phe Gly Tyr Gly Gly Tyr
245 250 255
Cys Leu Pro Lys Asp Thr Lys Gln Leu Leu Ala Asn Tyr Gln Ser Val
260 265 270
Pro Asn Lys Leu Ile Ser Ala Ile Val Asp Ala Asn Arg Thr Arg Lys
275 280 285
Asp Phe Ile Thr Asn Val Ile Leu Lys His Arg Pro Gln Val Val Gly
290 295 300
Val Tyr Arg Leu Ile Met Lys Ser Gly Ser Asp Asn Phe Arg Asp Ser
305 310 315 320
Ser Ile Leu Gly Ile Ile Lys Arg Ile Lys Lys Lys Gly Val Lys Val
325 330 335
Ile Ile Tyr Glu Pro Leu Ile Ser Gly Asp Thr Phe Phe Asn Ser Pro
340 345 350
Leu Glu Arg Glu Leu Ala Ile Phe Lys Gly Lys Ala Asp Ile Ile Ile
355 360 365
Thr Asn Arg Met Ser Glu Glu Leu Asn Asp Val Val Asp Lys Val Tyr
370 375 380
Ser Arg Asp Leu Phe Lys Cys Asp
385 390
<210> 6
<211> 36
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 6
agctgagtcg acccccagga aaaattggtt aataac 36
<210> 7
<211> 33
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 7
agctgagcat gcttccaact gcgctaatga cgc 33
<210> 8
<211> 313
<212> DNA
<213> 人工序列
<220>
<223> promoter
<400> 8
gcatgcttcc aactgcgcta atgacgcagc tggacgaagg cgggattctc gtcttacccg 60
taggggagga gcaccagtat ttgaaacggg tgcgtcgtcg gggaggcgaa tttattatcg 120
ataccgtgga ggccgtgcgc tttgtccctt tagtgaaggg tgagctggct taaaacgtga 180
ggaaatacct ggatttttcc tggttatttt gccgcaggtc agcgtatcgt gaacatcttt 240
tccagtgttc agtagggtgc cttgcacggt aattatgtca ctggttatta accaattttt 300
cctgggggtc gac 313
<210> 9
<211> 33
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 9
agctgatcta gaaaacagaa tttgcctggc ggc 33
<210> 10
<211> 33
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 10
agctgaggat ccaggaagag tttgtagaaa cgc 33
<210> 11
<211> 369
<212> DNA
<213> 人工序列
<220>
<223> terminator
<400> 11
tctagaaaca gaatttgcct ggcggcagta gcgcggtggt cccacctgac cccatgccga 60
actcagaagt gaaacgccgt agcgccgatg gtagtgtggg gtctccccat gcgagagtag 120
ggaactgcca ggcatcaaat aaaacgaaag gctcagtcga aagactgggc ctttcgtttt 180
atctgttgtt tgtcggtgaa cgctctcctg agtaggacaa atccgccggg agcggatttg 240
aacgttgcga agcaacggcc cggagggtgg cgggcaggac gcccgccata aactgccagg 300
catcaaatta agcagaaggc catcctgacg gatggccttt ttgcgtttct acaaactctt 360
cctggatcc 369
<210> 12
<211> 35
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 12
ttcctggggg tcgacatgac tacgaaaatt tttaa 35
<210> 13
<211> 35
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 13
attctgtttt ctagactaag gaaccaacac aagct 35
<210> 14
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 14
gtcgaccccc aggaaaaatt ggttaataac 30
<210> 15
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 15
tctagaaaac agaatttgcc tggcggcagt 30
<210> 16
<211> 1980
<212> DNA
<213> 肝素黄杆菌
<400> 16
atgactacga aaatttttaa aaggatcatt gtatttgctg taattgccct atcgtcggga 60
aatatacttg cacaaagctc ttccattacc aggaaagatt ttgaccacat caaccttgag 120
tattccggac tggaaaaggt taataaagca gttgctgccg gcaactatga cgatgcggcc 180
aaagcattac tggcatacta cagggaaaaa agtaaggcca gggaacctga tttcagtaat 240
gcagaaaagc ctgccgatat acgccagccc atagataagg ttacgcgtga aatggccgac 300
aaggctttgg tccaccagtt tcaaccgcac aaaggctacg gctattttga ttatggtaaa 360
gacatcaact ggcagatgtg gccggtaaaa gacaatgaag tacgctggca gttgcaccgt 420
gtaaaatggt ggcaggctat ggccctggtt tatcacgcta cgggcgatga aaaatatgca 480
agagaatggg tatatcagta cagcgattgg gccagaaaaa acccattggg cctgtcgcag 540
gataatgata aatttgtgtg gcggcccctt gaagtgtcgg acagggtaca aagtcttccc 600
ccaaccttca gcttatttgt aaactcgcca gcctttaccc cagccttttt aatggaattt 660
ttaaacagtt accaccaaca ggccgattat ttatctacgc attatgccga acagggaaac 720
caccgtttat ttgaagccca acgcaacttg tttgcagggg tatctttccc tgaatttaaa 780
gattcaccaa gatggaggca aaccggcata tcggtgctga acaccgagat caaaaaacag 840
gtttatgccg atgggatgca gtttgaactt tcaccaattt accatgtagc tgccatcgat 900
atcttcttaa aggcctatgg ttctgcaaaa cgagttaacc ttgaaaaaga atttccgcaa 960
tcttatgtac aaactgtaga aaatatgatt atggcgctga tcagtatttc actgccagat 1020
tataacaccc ctatgtttgg agattcatgg attacagata aaaatttcag gatggcacag 1080
tttgccagct gggcccgggt tttcccggca aaccaggcca taaaatattt tgctacagat 1140
ggcaaacaag gtaaggcgcc taacttttta tccaaagcat tgagcaatgc aggcttttat 1200
acgtttagaa gcggatggga taaaaatgca accgttatgg tattaaaagc cagtcctccc 1260
ggagaatttc atgcccagcc ggataacggg acttttgaac tttttataaa gggcagaaac 1320
tttaccccag acgccggggt atttgtgtat agcggcgacg aagccatcat gaaactgcgg 1380
aactggtacc gtcaaacccg catacacagc acgcttacac tcgacaatca aaatatggtc 1440
attaccaaag cccggcaaaa caaatgggaa acaggaaata accttgatgt gcttacctat 1500
accaacccaa gctatccgaa tctggaccat cagcgcagtg tacttttcat caacaaaaaa 1560
tactttctgg tcatcgatag ggcaataggc gaagctaccg gaaacctggg cgtacactgg 1620
cagcttaaag aagacagcaa ccctgttttc gataagacaa agaaccgggt ttacaccact 1680
tacagagatg gtaacaacct gatgatccaa tcgttgaatg cggacaggac cagcctcaat 1740
gaagaagaag gaaaggtatc ttatgtttac aataaggagc tgaaaagacc tgctttcgta 1800
tttgaaaagc ctaaaaagaa tgccggcaca caaaattttg tcagtatagt ttatccatac 1860
gacggccaga aggctccaga gatcagcata cgggaaaaca agggcaatga ttttgagaaa 1920
ggcaagctta atctaaccct taccattaac ggaaaacaac agcttgtgtt ggttccttag 1980
<210> 17
<211> 659
<212> PRT
<213> 肝素黄杆菌
<400> 17
Met Thr Thr Lys Ile Phe Lys Arg Ile Ile Val Phe Ala Val Ile Ala
1 5 10 15
Leu Ser Ser Gly Asn Ile Leu Ala Gln Ser Ser Ser Ile Thr Arg Lys
20 25 30
Asp Phe Asp His Ile Asn Leu Glu Tyr Ser Gly Leu Glu Lys Val Asn
35 40 45
Lys Ala Val Ala Ala Gly Asn Tyr Asp Asp Ala Ala Lys Ala Leu Leu
50 55 60
Ala Tyr Tyr Arg Glu Lys Ser Lys Ala Arg Glu Pro Asp Phe Ser Asn
65 70 75 80
Ala Glu Lys Pro Ala Asp Ile Arg Gln Pro Ile Asp Lys Val Thr Arg
85 90 95
Glu Met Ala Asp Lys Ala Leu Val His Gln Phe Gln Pro His Lys Gly
100 105 110
Tyr Gly Tyr Phe Asp Tyr Gly Lys Asp Ile Asn Trp Gln Met Trp Pro
115 120 125
Val Lys Asp Asn Glu Val Arg Trp Gln Leu His Arg Val Lys Trp Trp
130 135 140
Gln Ala Met Ala Leu Val Tyr His Ala Thr Gly Asp Glu Lys Tyr Ala
145 150 155 160
Arg Glu Trp Val Tyr Gln Tyr Ser Asp Trp Ala Arg Lys Asn Pro Leu
165 170 175
Gly Leu Ser Gln Asp Asn Asp Lys Phe Val Trp Arg Pro Leu Glu Val
180 185 190
Ser Asp Arg Val Gln Ser Leu Pro Pro Thr Phe Ser Leu Phe Val Asn
195 200 205
Ser Pro Ala Phe Thr Pro Ala Phe Leu Met Glu Phe Leu Asn Ser Tyr
210 215 220
His Gln Gln Ala Asp Tyr Leu Ser Thr His Tyr Ala Glu Gln Gly Asn
225 230 235 240
His Arg Leu Phe Glu Ala Gln Arg Asn Leu Phe Ala Gly Val Ser Phe
245 250 255
Pro Glu Phe Lys Asp Ser Pro Arg Trp Arg Gln Thr Gly Ile Ser Val
260 265 270
Leu Asn Thr Glu Ile Lys Lys Gln Val Tyr Ala Asp Gly Met Gln Phe
275 280 285
Glu Leu Ser Pro Ile Tyr His Val Ala Ala Ile Asp Ile Phe Leu Lys
290 295 300
Ala Tyr Gly Ser Ala Lys Arg Val Asn Leu Glu Lys Glu Phe Pro Gln
305 310 315 320
Ser Tyr Val Gln Thr Val Glu Asn Met Ile Met Ala Leu Ile Ser Ile
325 330 335
Ser Leu Pro Asp Tyr Asn Thr Pro Met Phe Gly Asp Ser Trp Ile Thr
340 345 350
Asp Lys Asn Phe Arg Met Ala Gln Phe Ala Ser Trp Ala Arg Val Phe
355 360 365
Pro Ala Asn Gln Ala Ile Lys Tyr Phe Ala Thr Asp Gly Lys Gln Gly
370 375 380
Lys Ala Pro Asn Phe Leu Ser Lys Ala Leu Ser Asn Ala Gly Phe Tyr
385 390 395 400
Thr Phe Arg Ser Gly Trp Asp Lys Asn Ala Thr Val Met Val Leu Lys
405 410 415
Ala Ser Pro Pro Gly Glu Phe His Ala Gln Pro Asp Asn Gly Thr Phe
420 425 430
Glu Leu Phe Ile Lys Gly Arg Asn Phe Thr Pro Asp Ala Gly Val Phe
435 440 445
Val Tyr Ser Gly Asp Glu Ala Ile Met Lys Leu Arg Asn Trp Tyr Arg
450 455 460
Gln Thr Arg Ile His Ser Thr Leu Thr Leu Asp Asn Gln Asn Met Val
465 470 475 480
Ile Thr Lys Ala Arg Gln Asn Lys Trp Glu Thr Gly Asn Asn Leu Asp
485 490 495
Val Leu Thr Tyr Thr Asn Pro Ser Tyr Pro Asn Leu Asp His Gln Arg
500 505 510
Ser Val Leu Phe Ile Asn Lys Lys Tyr Phe Leu Val Ile Asp Arg Ala
515 520 525
Ile Gly Glu Ala Thr Gly Asn Leu Gly Val His Trp Gln Leu Lys Glu
530 535 540
Asp Ser Asn Pro Val Phe Asp Lys Thr Lys Asn Arg Val Tyr Thr Thr
545 550 555 560
Tyr Arg Asp Gly Asn Asn Leu Met Ile Gln Ser Leu Asn Ala Asp Arg
565 570 575
Thr Ser Leu Asn Glu Glu Glu Gly Lys Val Ser Tyr Val Tyr Asn Lys
580 585 590
Glu Leu Lys Arg Pro Ala Phe Val Phe Glu Lys Pro Lys Lys Asn Ala
595 600 605
Gly Thr Gln Asn Phe Val Ser Ile Val Tyr Pro Tyr Asp Gly Gln Lys
610 615 620
Ala Pro Glu Ile Ser Ile Arg Glu Asn Lys Gly Asn Asp Phe Glu Lys
625 630 635 640
Gly Lys Leu Asn Leu Thr Leu Thr Ile Asn Gly Lys Gln Gln Leu Val
645 650 655
Leu Val Pro
<210> 18
<211> 44
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 18
ttcagaattc ggatccaata aatgtagcag cgataaagca attc 44
<210> 19
<211> 44
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 19
ggccagtgcc aagcttttaa ttgtgttttg cacggctacc tttc 44
<210> 20
<211> 6646
<212> DNA
<213> 人工序列
<220>
<223> 质粒
<400> 20
ccgacaccat cgaatggtgc aaaacctttc gcggtatggc atgatagcgc ccggaagaga 60
gtcaattcag ggtggtgaat gtgaaaccag taacgttata cgatgtcgca gagtatgccg 120
gtgtctctta tcagaccgtt tcccgcgtgg tgaaccaggc cagccacgtt tctgcgaaaa 180
cgcgggaaaa agtggaagcg gcgatggcgg agctgaatta cattcccaac cgcgtggcac 240
aacaactggc gggcaaacag tcgttgctga ttggcgttgc cacctccagt ctggccctgc 300
acgcgccgtc gcaaattgtc gcggcgatta aatctcgcgc cgatcaactg ggtgccagcg 360
tggtggtgtc gatggtagaa cgaagcggcg tcgaagcctg taaagcggcg gtgcacaatc 420
ttctcgcgca acgcgtcagt gggctgatca ttaactatcc gctggatgac caggatgcca 480
ttgctgtgga agctgcctgc actaatgttc cggcgttatt tcttgatgtc tctgaccaga 540
cacccatcaa cagtattatt ttctcccatg aagacggtac gcgactgggc gtggagcatc 600
tggtcgcatt gggtcaccag caaatcgcgc tgttagcggg cccattaagt tctgtctcgg 660
cgcgtctgcg tctggctggc tggcataaat atctcactcg caatcaaatt cagccgatag 720
cggaacggga aggcgactgg agtgccatgt ccggttttca acaaaccatg caaatgctga 780
atgagggcat cgttcccact gcgatgctgg ttgccaacga tcagatggcg ctgggcgcaa 840
tgcgcgccat taccgagtcc gggctgcgcg ttggtgcgga tatctcggta gtgggatacg 900
acgataccga agacagctca tgttatatcc cgccgttaac caccatcaaa caggattttc 960
gcctgctggg gcaaaccagc gtggaccgct tgctgcaact ctctcagggc caggcggtga 1020
agggcaatca gctgttgccc gtctcactgg tgaaaagaaa aaccaccctg gcgcccaata 1080
cgcaaaccgc ctctccccgc gcgttggccg attcattaat gcagctggca cgacaggttt 1140
cccgactgga aagcgggcag tgagcgcaac gcaattaatg taagttagct cactcattag 1200
gcacaattct catgtttgac agcttatcat cgactgcacg gtgcaccaat gcttctggcg 1260
tcaggcagcc atcggaagct gtggtatggc tgtgcaggtc gtaaatcact gcataattcg 1320
tgtcgctcaa ggcgcactcc cgttctggat aatgtttttt gcgccgacat cataacggtt 1380
ctggcaaata ttctgaaatg agctgttgac aattaatcat cggctcgtat aatgtgtgga 1440
attgtgagcg gataacaatt tcacacagga aacagccagt ccgtttaggt gttttcacga 1500
gcacttcacc aacaaggacc atagcatatg aaaatcgaag aaggtaaact ggtaatctgg 1560
attaacggcg ataaaggcta taacggtctc gctgaagtcg gtaagaaatt cgagaaagat 1620
accggaatta aagtcaccgt tgagcatccg gataaactgg aagagaaatt cccacaggtt 1680
gcggcaactg gcgatggccc tgacattatc ttctgggcac acgaccgctt tggtggctac 1740
gctcaatctg gcctgttggc tgaaatcacc ccggacaaag cgttccagga caagctgtat 1800
ccgtttacct gggatgccgt acgttacaac ggcaagctga ttgcttaccc gatcgctgtt 1860
gaagcgttat cgctgattta taacaaagat ctgctgccga acccgccaaa aacctgggaa 1920
gagatcccgg cgctggataa agaactgaaa gcgaaaggta agagcgcgct gatgttcaac 1980
ctgcaagaac cgtacttcac ctggccgctg attgctgctg acgggggtta tgcgttcaag 2040
tatgaaaacg gcaagtacga cattaaagac gtgggcgtgg ataacgctgg cgcgaaagcg 2100
ggtctgacct tcctggttga cctgattaaa aacaaacaca tgaatgcaga caccgattac 2160
tccatcgcag aagctgcctt taataaaggc gaaacagcga tgaccatcaa cggcccgtgg 2220
gcatggtcca acatcgacac cagcaaagtg aattatggtg taacggtact gccgaccttc 2280
aagggtcaac catccaaacc gttcgttggc gtgctgagcg caggtattaa cgccgccagt 2340
ccgaacaaag agctggcaaa agagttcctc gaaaactatc tgctgactga tgaaggtctg 2400
gaagcggtta ataaagacaa accgctgggt gccgtagcgc tgaagtctta cgaggaagag 2460
ttggcgaaag atccacgtat tgccgccact atggaaaacg cccagaaagg tgaaatcatg 2520
ccgaacatcc cgcagatgtc cgctttctgg tatgccgtgc gtactgcggt gatcaacgcc 2580
gccagcggtc gtcagactgt cgatgaagcc ctgaaagacg cgcagactaa ttcgagctcg 2640
aacaacaaca acaataacaa taacaacaac ctcgggatcg agggaaggat ttcagaattc 2700
ggatcctcta gagtcgacct gcaggcaagc ttggcactgg ccgtcgtttt acaacgtcgt 2760
gactgggaaa accctggcgt tacccaactt aatcgccttg cagcacatcc ccctttcgcc 2820
agctggcgta atagcgaaga ggcccgcacc gatcgccctt cccaacagtt gcgcagcctg 2880
aatggcgaat ggcagcttgg ctgttttggc ggatgagata agattttcag cctgatacag 2940
attaaatcag aacgcagaag cggtctgata aaacagaatt tgcctggcgg cagtagcgcg 3000
gtggtcccac ctgaccccat gccgaactca gaagtgaaac gccgtagcgc cgatggtagt 3060
gtggggtctc cccatgcgag agtagggaac tgccaggcat caaataaaac gaaaggctca 3120
gtcgaaagac tgggcctttc gttttatctg ttgtttgtcg gtgaacgctc tcctgagtag 3180
gacaaatccg ccgggagcgg atttgaacgt tgcgaagcaa cggcccggag ggtggcgggc 3240
aggacgcccg ccataaactg ccaggcatca aattaagcag aaggccatcc tgacggatgg 3300
cctttttgcg tttctacaaa ctctttttgt ttatttttct aaatacattc aaatatgtat 3360
ccgctcatga gacaataacc ctgataaatg cttcaataat attgaaaaag gaagagtatg 3420
agtattcaac atttccgtgt cgcccttatt cccttttttg cggcattttg ccttcctgtt 3480
tttgctcacc cagaaacgct ggtgaaagta aaagatgctg aagatcagtt gggtgcacga 3540
gtgggttaca tcgaactgga tctcaacagc ggtaagatcc ttgagagttt tcgccccgaa 3600
gaacgttctc caatgatgag cacttttaaa gttctgctat gtggcgcggt attatcccgt 3660
gttgacgccg ggcaagagca actcggtcgc cgcatacact attctcagaa tgacttggtt 3720
gagtactcac cagtcacaga aaagcatctt acggatggca tgacagtaag agaattatgc 3780
agtgctgcca taaccatgag tgataacact gcggccaact tacttctgac aacgatcgga 3840
ggaccgaagg agctaaccgc ttttttgcac aacatggggg atcatgtaac tcgccttgat 3900
cgttgggaac cggagctgaa tgaagccata ccaaacgacg agcgtgacac cacgatgcct 3960
gtagcaatgg caacaacgtt gcgcaaacta ttaactggcg aactacttac tctagcttcc 4020
cggcaacaat taatagactg gatggaggcg gataaagttg caggaccact tctgcgctcg 4080
gcccttccgg ctggctggtt tattgctgat aaatctggag ccggtgagcg tgggtctcgc 4140
ggtatcattg cagcactggg gccagatggt aagccctccc gtatcgtagt tatctacacg 4200
acggggagtc aggcaactat ggatgaacga aatagacaga tcgctgagat aggtgcctca 4260
ctgattaagc attggtaact gtcagaccaa gtttactcat atatacttta gattgattta 4320
ccccggttga taatcagaaa agccccaaaa acaggaagat tgtataagca aatatttaaa 4380
ttgtaaacgt taatattttg ttaaaattcg cgttaaattt ttgttaaatc agctcatttt 4440
ttaaccaata ggccgaaatc ggcaaaatcc cttataaatc aaaagaatag accgagatag 4500
ggttgagtgt tgttccagtt tggaacaaga gtccactatt aaagaacgtg gactccaacg 4560
tcaaagggcg aaaaaccgtc tatcagggcg atggcccact acgtgaacca tcacccaaat 4620
caagtttttt ggggtcgagg tgccgtaaag cactaaatcg gaaccctaaa gggagccccc 4680
gatttagagc ttgacgggga aagccggcga acgtggcgag aaaggaaggg aagaaagcga 4740
aaggagcggg cgctagggcg ctggcaagtg tagcggtcac gctgcgcgta accaccacac 4800
ccgccgcgct taatgcgccg ctacagggcg cgtaaaagga tctaggtgaa gatccttttt 4860
gataatctca tgaccaaaat cccttaacgt gagttttcgt tccactgagc gtcagacccc 4920
gtagaaaaga tcaaaggatc ttcttgagat cctttttttc tgcgcgtaat ctgctgcttg 4980
caaacaaaaa aaccaccgct accagcggtg gtttgtttgc cggatcaaga gctaccaact 5040
ctttttccga aggtaactgg cttcagcaga gcgcagatac caaatactgt ccttctagtg 5100
tagccgtagt taggccacca cttcaagaac tctgtagcac cgcctacata cctcgctctg 5160
ctaatcctgt taccagtggc tgctgccagt ggcgataagt cgtgtcttac cgggttggac 5220
tcaagacgat agttaccgga taaggcgcag cggtcgggct gaacgggggg ttcgtgcaca 5280
cagcccagct tggagcgaac gacctacacc gaactgagat acctacagcg tgagctatga 5340
gaaagcgcca cgcttcccga agggagaaag gcggacaggt atccggtaag cggcagggtc 5400
ggaacaggag agcgcacgag ggagcttcca gggggaaacg cctggtatct ttatagtcct 5460
gtcgggtttc gccacctctg acttgagcgt cgatttttgt gatgctcgtc aggggggcgg 5520
agcctatgga aaaacgccag caacgcggcc tttttacggt tcctggcctt ttgctggcct 5580
tttgctcaca tgttctttcc tgcgttatcc cctgattctg tggataaccg tattaccgcc 5640
tttgagtgag ctgataccgc tcgccgcagc cgaacgaccg agcgcagcga gtcagtgagc 5700
gaggaagcgg aagagcgcct gatgcggtat tttctcctta cgcatctgtg cggtatttca 5760
caccgcatat atggtgcact ctcagtacaa tctgctctga tgccgcatag ttaagccagt 5820
atacactccg ctatcgctac gtgactgggt catggctgcg ccccgacacc cgccaacacc 5880
cgctgacgcg ccctgacggg cttgtctgct cccggcatcc gcttacagac aagctgtgac 5940
cgtctccggg agctgcatgt gtcagaggtt ttcaccgtca tcaccgaaac gcgcgaggca 6000
gctgcggtaa agctcatcag cgtggtcgtg cagcgattca cagatgtctg cctgttcatc 6060
cgcgtccagc tcgttgagtt tctccagaag cgttaatgtc tggcttctga taaagcgggc 6120
catgttaagg gcggtttttt cctgtttggt cactgatgcc tccgtgtaag ggggatttct 6180
gttcatgggg gtaatgatac cgatgaaacg agagaggatg ctcacgatac gggttactga 6240
tgatgaacat gcccggttac tggaacgttg tgagggtaaa caactggcgg tatggatgcg 6300
gcgggaccag agaaaaatca ctcagggtca atgccagcgc ttcgttaata cagatgtagg 6360
tgttccacag ggtagccagc agcatcctgc gatgcagatc cggaacataa tggtgcaggg 6420
cgctgacttc cgcgtttcca gactttacga aacacggaaa ccgaagacca ttcatgttgt 6480
tgctcaggtc gcagacgttt tgcagcagca gtcgcttcac gttcgctcgc gtatcggtga 6540
ttcattctgc taaccagtaa ggcaaccccg ccagcctagc cgggtcctca acgacaggag 6600
cacgatcatg cgcacccgtg gccaggaccc aacgctgccc gaaatt 6646
<210> 21
<211> 35
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 21
aagcttggca ctggccgtcg ttttacaacg tcgtg 35
<210> 22
<211> 35
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 22
ggatccgaat tctgaaatcc ttccctcgat cccga 35
<210> 23
<211> 1770
<212> DNA
<213> 人
<400> 23
aataaatgta gcagcgataa agcaattcag tttccgcgtc gtagcagcag cggttttcgt 60
gttgatggtt ttgaaaaacg tgcagcagcc agcgaaagca ataactatat gaatcatgtt 120
gccaaacagc agagcgaaga agcatttccg caagaacagc agaaagcacc gcctgttgtt 180
ggtggtttta atagcaatgt tggtagcaaa gttctgggcc tgaaatatga agaaattgac 240
tgcctgatca acgatgagca taccattaaa ggtcgtcgtg aaggtaatga agtttttctg 300
ccgtttacct gggtggagaa atactttgat gtttatggta aagtggtgca gtatgatggc 360
tatgatcgtt ttgaatttag ccatagctac agcaaagttt atgcacagcg tgcaccgtat 420
catcctgatg gtgtttttat gagctttgag ggctataatg ttgaagttcg tgatcgcgtt 480
aaatgcatta gcggtgttga aggtgttccg ctgagcaccc agtggggtcc gcagggttat 540
ttctatccga ttcagattgc acagtatggc ctgagccatt atagcaaaaa tctgaccgaa 600
aaaccgcctc acattgaagt ttatgaaacc gcagaagatc gcgacaaaaa caaaccgaat 660
gattggaccg ttccgaaagg ttgttttatg gcaaatgttg cagataaaag ccgcttcacc 720
aatgtgaaac agtttattgc accggaaacc agcgaaggtg ttagcctgca gctgggtaat 780
accaaagatt ttatcattag cttcgatctg aaatttctga ccaatggtag cgttagcgtt 840
gttctggaaa ccaccgaaaa aaatcagctg tttaccatcc attatgtgag caatgcccag 900
ctgattgcat ttaaagaacg cgatatctat tatggcattg gtccgcgtac cagttggagc 960
accgttaccc gtgatctggt taccgatctg cgtaaaggtg ttggtctgag caatacaaaa 1020
gcagttaaac cgaccaaaat tatgccgaaa aaagttgttc gtctgatcgc caaaggtaaa 1080
ggttttctgg ataacattac cattagcacc accgcacata tggcagcatt ttttgcagca 1140
agcgattggc tggttcgtaa ccaggatgaa aaaggtggtt ggccgattat ggttacccgt 1200
aaactgggtg aaggttttaa aagcctggaa ccgggttggt atagcgcaat ggcacagggt 1260
caggcaatta gcaccctggt tcgtgcatat ctgctgacca aagatcatat ttttctgaat 1320
agcgcactgc gtgcaaccgc accgtacaaa tttctgtcag aacagcatgg tgttaaagcc 1380
gtgtttatga acaaacacga ttggtatgaa gaatatccga ccaccccgag cagctttgtt 1440
ctgaatggtt ttatgtatag cctgatcggt ctgtacgacc tgaaagaaac agccggtgaa 1500
aaactgggta aagaagcacg tagcctgtac gaacgtggta tggaaagcct gaaagcaatg 1560
ctgccgctgt atgataccgg tagcggcacc atttatgatc tgcgtcattt tatgctgggt 1620
atcgcaccga atctggcacg ttgggattat cataccaccc atattaatca gctgcaactg 1680
ctgagtacca ttgatgaaag tccggtgttt aaagaatttg tgaaacgctg gaaaagctac 1740
ctgaaaggta gccgtgcaaa acacaattaa 1770
<210> 24
<211> 589
<212> PRT
<213> 人
<400> 24
Asn Lys Cys Ser Ser Asp Lys Ala Ile Gln Phe Pro Arg Arg Ser Ser
1 5 10 15
Ser Gly Phe Arg Val Asp Gly Phe Glu Lys Arg Ala Ala Ala Ser Glu
20 25 30
Ser Asn Asn Tyr Met Asn His Val Ala Lys Gln Gln Ser Glu Glu Ala
35 40 45
Phe Pro Gln Glu Gln Gln Lys Ala Pro Pro Val Val Gly Gly Phe Asn
50 55 60
Ser Asn Val Gly Ser Lys Val Leu Gly Leu Lys Tyr Glu Glu Ile Asp
65 70 75 80
Cys Leu Ile Asn Asp Glu His Thr Ile Lys Gly Arg Arg Glu Gly Asn
85 90 95
Glu Val Phe Leu Pro Phe Thr Trp Val Glu Lys Tyr Phe Asp Val Tyr
100 105 110
Gly Lys Val Val Gln Tyr Asp Gly Tyr Asp Arg Phe Glu Phe Ser His
115 120 125
Ser Tyr Ser Lys Val Tyr Ala Gln Arg Ala Pro Tyr His Pro Asp Gly
130 135 140
Val Phe Met Ser Phe Glu Gly Tyr Asn Val Glu Val Arg Asp Arg Val
145 150 155 160
Lys Cys Ile Ser Gly Val Glu Gly Val Pro Leu Ser Thr Gln Trp Gly
165 170 175
Pro Gln Gly Tyr Phe Tyr Pro Ile Gln Ile Ala Gln Tyr Gly Leu Ser
180 185 190
His Tyr Ser Lys Asn Leu Thr Glu Lys Pro Pro His Ile Glu Val Tyr
195 200 205
Glu Thr Ala Glu Asp Arg Asp Lys Asn Lys Pro Asn Asp Trp Thr Val
210 215 220
Pro Lys Gly Cys Phe Met Ala Asn Val Ala Asp Lys Ser Arg Phe Thr
225 230 235 240
Asn Val Lys Gln Phe Ile Ala Pro Glu Thr Ser Glu Gly Val Ser Leu
245 250 255
Gln Leu Gly Asn Thr Lys Asp Phe Ile Ile Ser Phe Asp Leu Lys Phe
260 265 270
Leu Thr Asn Gly Ser Val Ser Val Val Leu Glu Thr Thr Glu Lys Asn
275 280 285
Gln Leu Phe Thr Ile His Tyr Val Ser Asn Ala Gln Leu Ile Ala Phe
290 295 300
Lys Glu Arg Asp Ile Tyr Tyr Gly Ile Gly Pro Arg Thr Ser Trp Ser
305 310 315 320
Thr Val Thr Arg Asp Leu Val Thr Asp Leu Arg Lys Gly Val Gly Leu
325 330 335
Ser Asn Thr Lys Ala Val Lys Pro Thr Lys Ile Met Pro Lys Lys Val
340 345 350
Val Arg Leu Ile Ala Lys Gly Lys Gly Phe Leu Asp Asn Ile Thr Ile
355 360 365
Ser Thr Thr Ala His Met Ala Ala Phe Phe Ala Ala Ser Asp Trp Leu
370 375 380
Val Arg Asn Gln Asp Glu Lys Gly Gly Trp Pro Ile Met Val Thr Arg
385 390 395 400
Lys Leu Gly Glu Gly Phe Lys Ser Leu Glu Pro Gly Trp Tyr Ser Ala
405 410 415
Met Ala Gln Gly Gln Ala Ile Ser Thr Leu Val Arg Ala Tyr Leu Leu
420 425 430
Thr Lys Asp His Ile Phe Leu Asn Ser Ala Leu Arg Ala Thr Ala Pro
435 440 445
Tyr Lys Phe Leu Ser Glu Gln His Gly Val Lys Ala Val Phe Met Asn
450 455 460
Lys His Asp Trp Tyr Glu Glu Tyr Pro Thr Thr Pro Ser Ser Phe Val
465 470 475 480
Leu Asn Gly Phe Met Tyr Ser Leu Ile Gly Leu Tyr Asp Leu Lys Glu
485 490 495
Thr Ala Gly Glu Lys Leu Gly Lys Glu Ala Arg Ser Leu Tyr Glu Arg
500 505 510
Gly Met Glu Ser Leu Lys Ala Met Leu Pro Leu Tyr Asp Thr Gly Ser
515 520 525
Gly Thr Ile Tyr Asp Leu Arg His Phe Met Leu Gly Ile Ala Pro Asn
530 535 540
Leu Ala Arg Trp Asp Tyr His Thr Thr His Ile Asn Gln Leu Gln Leu
545 550 555 560
Leu Ser Thr Ile Asp Glu Ser Pro Val Phe Lys Glu Phe Val Lys Arg
565 570 575
Trp Lys Ser Tyr Leu Lys Gly Ser Arg Ala Lys His Asn
580 585
<210> 25
<211> 36
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 25
ttcagaattc ggatcccgtg aaattgaaca gcgtca 36
<210> 26
<211> 36
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 26
ggccagtgcc aagcttttaa ttgcttttcg gataga 36
<210> 27
<211> 918
<212> DNA
<213> Cricetulus griseus
<400> 27
cgtgaaattg aacagcgtca taccatggat ggtccgcgtc aggatgcagc agttgatgaa 60
gaagaagata tcgtcattat ctataaccgt gttccgaaaa ccgcaagcac cagctttacc 120
aatattgcaa ttgatctgtg cgccaaaaat cgctatcatg tgctgcatat caacaccacc 180
aaaaataacc cggttatgag cctgcaggat caggttcgtt ttgttaaaaa cattaccacc 240
tggaacgaaa tgaaaccggg tttttatcat ggccatatca gctatctgga ttttgcgaaa 300
tttggcgtga aaaaaaaacc gatctacatc aacgttattc gcgatccgat tgaacgtctg 360
gttagctatt attactttct gcgcttcggt gatgattatc gtccgggtct gcgtcgtcgt 420
aaacagggcg acaaaaaaac ctttgatgaa tgtgttgccg aaggtggtag cgattgtgca 480
ccggaaaaac tgtggctgca gattccgttt ttttgcggtc atagcagcga atgttggaat 540
gttggtagcc gttgggcaat ggatcaggcc aaatataacc tgatcaacga atattttctg 600
gtgggtgtga ccgaagaact ggaagatttc attatgctgc tggaagcagc actgcctcgt 660
ttttttcgtg gtgcaaccga tctgtatcgt accggtaaaa aaagccatct gcgtaaaacg 720
acggaaaaaa aactgccgac caaacagacc attgcaaaac tgcagcagag cgatatttgg 780
aaaatggaaa acgagtttta tgaatttgcc ctggaacagt ttcagtttat tcgtgcacat 840
gcagttcgtg aaaaagatgg tgatctgtat attctggccc agaacttctt ctacgaaaaa 900
atctatccga aaagcaat 918
<210> 28
<211> 306
<212> PRT
<213> 中国仓鼠
<400> 28
Arg Glu Ile Glu Gln Arg His Thr Met Asp Gly Pro Arg Gln Asp Ala
1 5 10 15
Ala Val Asp Glu Glu Glu Asp Ile Val Ile Ile Tyr Asn Arg Val Pro
20 25 30
Lys Thr Ala Ser Thr Ser Phe Thr Asn Ile Ala Ile Asp Leu Cys Ala
35 40 45
Lys Asn Arg Tyr His Val Leu His Ile Asn Thr Thr Lys Asn Asn Pro
50 55 60
Val Met Ser Leu Gln Asp Gln Val Arg Phe Val Lys Asn Ile Thr Thr
65 70 75 80
Trp Asn Glu Met Lys Pro Gly Phe Tyr His Gly His Ile Ser Tyr Leu
85 90 95
Asp Phe Ala Lys Phe Gly Val Lys Lys Lys Pro Ile Tyr Ile Asn Val
100 105 110
Ile Arg Asp Pro Ile Glu Arg Leu Val Ser Tyr Tyr Tyr Phe Leu Arg
115 120 125
Phe Gly Asp Asp Tyr Arg Pro Gly Leu Arg Arg Arg Lys Gln Gly Asp
130 135 140
Lys Lys Thr Phe Asp Glu Cys Val Ala Glu Gly Gly Ser Asp Cys Ala
145 150 155 160
Pro Glu Lys Leu Trp Leu Gln Ile Pro Phe Phe Cys Gly His Ser Ser
165 170 175
Glu Cys Trp Asn Val Gly Ser Arg Trp Ala Met Asp Gln Ala Lys Tyr
180 185 190
Asn Leu Ile Asn Glu Tyr Phe Leu Val Gly Val Thr Glu Glu Leu Glu
195 200 205
Asp Phe Ile Met Leu Leu Glu Ala Ala Leu Pro Arg Phe Phe Arg Gly
210 215 220
Ala Thr Asp Leu Tyr Arg Thr Gly Lys Lys Ser His Leu Arg Lys Thr
225 230 235 240
Thr Glu Lys Lys Leu Pro Thr Lys Gln Thr Ile Ala Lys Leu Gln Gln
245 250 255
Ser Asp Ile Trp Lys Met Glu Asn Glu Phe Tyr Glu Phe Ala Leu Glu
260 265 270
Gln Phe Gln Phe Ile Arg Ala His Ala Val Arg Glu Lys Asp Gly Asp
275 280 285
Leu Tyr Ile Leu Ala Gln Asn Phe Phe Tyr Glu Lys Ile Tyr Pro Lys
290 295 300
Ser Asn
305
<210> 29
<211> 311
<212> PRT
<213> 小鼠
<400> 29
Met Thr Leu Leu Leu Leu Gly Ala Val Leu Leu Val Ala Gln Pro Gln
1 5 10 15
Leu Val His Ser His Pro Ala Ala Pro Gly Pro Gly Leu Lys Gln Gln
20 25 30
Glu Leu Leu Arg Lys Val Ile Ile Leu Pro Glu Asp Thr Gly Glu Gly
35 40 45
Thr Ala Ser Asn Gly Ser Thr Gln Gln Leu Pro Gln Thr Ile Ile Ile
50 55 60
Gly Val Arg Lys Gly Gly Thr Arg Ala Leu Leu Glu Met Leu Ser Leu
65 70 75 80
His Pro Asp Val Ala Ala Ala Glu Asn Glu Val His Phe Phe Asp Trp
85 90 95
Glu Glu His Tyr Ser Gln Gly Leu Gly Trp Tyr Leu Thr Gln Met Pro
100 105 110
Phe Ser Ser Pro His Gln Leu Thr Val Glu Lys Thr Pro Ala Tyr Phe
115 120 125
Thr Ser Pro Lys Val Pro Glu Arg Ile His Ser Met Asn Pro Thr Ile
130 135 140
Arg Leu Leu Leu Ile Leu Arg Asp Pro Ser Glu Arg Val Leu Ser Asp
145 150 155 160
Tyr Thr Gln Val Leu Tyr Asn His Leu Gln Lys His Lys Pro Tyr Pro
165 170 175
Pro Ile Glu Asp Leu Leu Met Arg Asp Gly Arg Leu Asn Leu Asp Tyr
180 185 190
Lys Ala Leu Asn Arg Ser Leu Tyr His Ala His Met Leu Asn Trp Leu
195 200 205
Arg Phe Phe Pro Leu Gly His Ile His Ile Val Asp Gly Asp Arg Leu
210 215 220
Ile Arg Asp Pro Phe Pro Glu Ile Gln Lys Val Glu Arg Phe Leu Lys
225 230 235 240
Leu Ser Pro Gln Ile Asn Ala Ser Asn Phe Tyr Phe Asn Lys Thr Lys
245 250 255
Gly Phe Tyr Cys Leu Arg Asp Ser Gly Lys Asp Arg Cys Leu His Glu
260 265 270
Ser Lys Gly Arg Ala His Pro Gln Val Asp Pro Lys Leu Leu Asp Lys
275 280 285
Leu His Glu Tyr Phe His Glu Pro Asn Lys Lys Phe Phe Lys Leu Val
290 295 300
Gly Arg Thr Phe Asp Trp His
305 310
<210> 30
<211> 808
<212> DNA
<213> 人工序列
<220>
<223> 3-OST-1 gene optimized for expression of E. coli
<400> 30
gaattcgggc accgcaagca atggtagcac ccagcagctg ccgcagacca ttattatcgg 60
tgttcgtaaa ggtggcaccc gtgcactgct ggaaatgctg agcctgcatc ctgatgttgc 120
agcagcagaa aatgaagtgc atttttttga ttgggaggaa cattatagcc agggtctggg 180
ttggtatctg acccagatgc cgtttagcag tccgcatcag ctgaccgttg aaaaaacacc 240
ggcatatttc accagcccga aagtgccgga acgtattcat agcatgaatc cgaccattcg 300
cctgctgctg attctgcgtg atccgagcga acgtgttctg agcgattata cccaggttct 360
gtataatcat ctgcagaaac ataaaccgta tccgcctatt gaagatctgc tgatgcgtga 420
tggtcgtctg aatctggatt ataaagcact gaatcgtagc ctgtatcatg cccatatgct 480
gaattggctg cgtttttttc cgctgggtca tattcatatt gttgatggtg atcgtctgat 540
tcgtgatccg tttcctgaaa ttcagaaagt ggaacgtttt ctgaaactga gtccgcagat 600
taatgccagc aacttctatt ttaacaaaac caaaggcttc tattgcctgc gtgatagcgg 660
taaagatcgt tgtctgcatg aaagcaaagg tcgtgcacat ccgcaggttg atccgaaact 720
gctggataaa ctgcatgaat attttcatga accgaacaaa aaattcttta aactggtggg 780
tcgtaccttc gattggcatt aagtcgac 808
<210> 31
<211> 26
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 31
ataagatctg ctgccgaacc cgccaa 26
<210> 32
<211> 59
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 32
ataaagcttg gatccgagct cgaggcggcc gccagggctg catcgacagt ctgacgacc 59
<210> 33
<211> 6556
<212> DNA
<213> 人工序列
<220>
<223> 质粒
<400> 33
ccgacaccat cgaatggtgc aaaacctttc gcggtatggc atgatagcgc ccggaagaga 60
gtcaattcag ggtggtgaat gtgaaaccag taacgttata cgatgtcgca gagtatgccg 120
gtgtctctta tcagaccgtt tcccgcgtgg tgaaccaggc cagccacgtt tctgcgaaaa 180
cgcgggaaaa agtggaagcg gcgatggcgg agctgaatta cattcccaac cgcgtggcac 240
aacaactggc gggcaaacag tcgttgctga ttggcgttgc cacctccagt ctggccctgc 300
acgcgccgtc gcaaattgtc gcggcgatta aatctcgcgc cgatcaactg ggtgccagcg 360
tggtggtgtc gatggtagaa cgaagcggcg tcgaagcctg taaagcggcg gtgcacaatc 420
ttctcgcgca acgcgtcagt gggctgatca ttaactatcc gctggatgac caggatgcca 480
ttgctgtgga agctgcctgc actaatgttc cggcgttatt tcttgatgtc tctgaccaga 540
cacccatcaa cagtattatt ttctcccatg aagacggtac gcgactgggc gtggagcatc 600
tggtcgcatt gggtcaccag caaatcgcgc tgttagcggg cccattaagt tctgtctcgg 660
cgcgtctgcg tctggctggc tggcataaat atctcactcg caatcaaatt cagccgatag 720
cggaacggga aggcgactgg agtgccatgt ccggttttca acaaaccatg caaatgctga 780
atgagggcat cgttcccact gcgatgctgg ttgccaacga tcagatggcg ctgggcgcaa 840
tgcgcgccat taccgagtcc gggctgcgcg ttggtgcgga tatctcggta gtgggatacg 900
acgataccga agacagctca tgttatatcc cgccgttaac caccatcaaa caggattttc 960
gcctgctggg gcaaaccagc gtggaccgct tgctgcaact ctctcagggc caggcggtga 1020
agggcaatca gctgttgccc gtctcactgg tgaaaagaaa aaccaccctg gcgcccaata 1080
cgcaaaccgc ctctccccgc gcgttggccg attcattaat gcagctggca cgacaggttt 1140
cccgactgga aagcgggcag tgagcgcaac gcaattaatg taagttagct cactcattag 1200
gcacaattct catgtttgac agcttatcat cgactgcacg gtgcaccaat gcttctggcg 1260
tcaggcagcc atcggaagct gtggtatggc tgtgcaggtc gtaaatcact gcataattcg 1320
tgtcgctcaa ggcgcactcc cgttctggat aatgtttttt gcgccgacat cataacggtt 1380
ctggcaaata ttctgaaatg agctgttgac aattaatcat cggctcgtat aatgtgtgga 1440
attgtgagcg gataacaatt tcacacagga aacagccagt ccgtttaggt gttttcacga 1500
gcacttcacc aacaaggacc atagcatatg aaaatcgaag aaggtaaact ggtaatctgg 1560
attaacggcg ataaaggcta taacggtctc gctgaagtcg gtaagaaatt cgagaaagat 1620
accggaatta aagtcaccgt tgagcatccg gataaactgg aagagaaatt cccacaggtt 1680
gcggcaactg gcgatggccc tgacattatc ttctgggcac acgaccgctt tggtggctac 1740
gctcaatctg gcctgttggc tgaaatcacc ccggacaaag cgttccagga caagctgtat 1800
ccgtttacct gggatgccgt acgttacaac ggcaagctga ttgcttaccc gatcgctgtt 1860
gaagcgttat cgctgattta taacaaagat ctgctgccga acccgccaaa aacctgggaa 1920
gagatcccgg cgctggataa agaactgaaa gcgaaaggta agagcgcgct gatgttcaac 1980
ctgcaagaac cgtacttcac ctggccgctg attgctgctg acgggggtta tgcgttcaag 2040
tatgaaaacg gcaagtacga cattaaagac gtgggcgtgg ataacgctgg cgcgaaagcg 2100
ggtctgacct tcctggttga cctgattaaa aacaaacaca tgaatgcaga caccgattac 2160
tccatcgcag aagctgcctt taataaaggc gaaacagcga tgaccatcaa cggcccgtgg 2220
gcatggtcca acatcgacac cagcaaagtg aattatggtg taacggtact gccgaccttc 2280
aagggtcaac catccaaacc gttcgttggc gtgctgagcg caggtattaa cgccgccagt 2340
ccgaacaaag agctggcaaa agagttcctc gaaaactatc tgctgactga tgaaggtctg 2400
gaagcggtta ataaagacaa accgctgggt gccgtagcgc tgaagtctta cgaggaagag 2460
ttggcgaaag atccacgtat tgccgccact atggaaaacg cccagaaagg tgaaatcatg 2520
ccgaacatcc cgcagatgtc cgctttctgg tatgccgtgc gtactgcggt gatcaacgcc 2580
gccagcggtc gtcagactgt cgatgcagcc ctggcggccg cctcgagctc ggatccaagc 2640
ttggcactgg ccgtcgtttt acaacgtcgt gactgggaaa accctggcgt tacccaactt 2700
aatcgccttg cagcacatcc ccctttcgcc agctggcgta atagcgaaga ggcccgcacc 2760
gatcgccctt cccaacagtt gcgcagcctg aatggcgaat ggcagcttgg ctgttttggc 2820
ggatgagata agattttcag cctgatacag attaaatcag aacgcagaag cggtctgata 2880
aaacagaatt tgcctggcgg cagtagcgcg gtggtcccac ctgaccccat gccgaactca 2940
gaagtgaaac gccgtagcgc cgatggtagt gtggggtctc cccatgcgag agtagggaac 3000
tgccaggcat caaataaaac gaaaggctca gtcgaaagac tgggcctttc gttttatctg 3060
ttgtttgtcg gtgaacgctc tcctgagtag gacaaatccg ccgggagcgg atttgaacgt 3120
tgcgaagcaa cggcccggag ggtggcgggc aggacgcccg ccataaactg ccaggcatca 3180
aattaagcag aaggccatcc tgacggatgg cctttttgcg tttctacaaa ctctttttgt 3240
ttatttttct aaatacattc aaatatgtat ccgctcatga gacaataacc ctgataaatg 3300
cttcaataat attgaaaaag gaagagtatg agtattcaac atttccgtgt cgcccttatt 3360
cccttttttg cggcattttg ccttcctgtt tttgctcacc cagaaacgct ggtgaaagta 3420
aaagatgctg aagatcagtt gggtgcacga gtgggttaca tcgaactgga tctcaacagc 3480
ggtaagatcc ttgagagttt tcgccccgaa gaacgttctc caatgatgag cacttttaaa 3540
gttctgctat gtggcgcggt attatcccgt gttgacgccg ggcaagagca actcggtcgc 3600
cgcatacact attctcagaa tgacttggtt gagtactcac cagtcacaga aaagcatctt 3660
acggatggca tgacagtaag agaattatgc agtgctgcca taaccatgag tgataacact 3720
gcggccaact tacttctgac aacgatcgga ggaccgaagg agctaaccgc ttttttgcac 3780
aacatggggg atcatgtaac tcgccttgat cgttgggaac cggagctgaa tgaagccata 3840
ccaaacgacg agcgtgacac cacgatgcct gtagcaatgg caacaacgtt gcgcaaacta 3900
ttaactggcg aactacttac tctagcttcc cggcaacaat taatagactg gatggaggcg 3960
gataaagttg caggaccact tctgcgctcg gcccttccgg ctggctggtt tattgctgat 4020
aaatctggag ccggtgagcg tgggtctcgc ggtatcattg cagcactggg gccagatggt 4080
aagccctccc gtatcgtagt tatctacacg acggggagtc aggcaactat ggatgaacga 4140
aatagacaga tcgctgagat aggtgcctca ctgattaagc attggtaact gtcagaccaa 4200
gtttactcat atatacttta gattgattta ccccggttga taatcagaaa agccccaaaa 4260
acaggaagat tgtataagca aatatttaaa ttgtaaacgt taatattttg ttaaaattcg 4320
cgttaaattt ttgttaaatc agctcatttt ttaaccaata ggccgaaatc ggcaaaatcc 4380
cttataaatc aaaagaatag accgagatag ggttgagtgt tgttccagtt tggaacaaga 4440
gtccactatt aaagaacgtg gactccaacg tcaaagggcg aaaaaccgtc tatcagggcg 4500
atggcccact acgtgaacca tcacccaaat caagtttttt ggggtcgagg tgccgtaaag 4560
cactaaatcg gaaccctaaa gggagccccc gatttagagc ttgacgggga aagccggcga 4620
acgtggcgag aaaggaaggg aagaaagcga aaggagcggg cgctagggcg ctggcaagtg 4680
tagcggtcac gctgcgcgta accaccacac ccgccgcgct taatgcgccg ctacagggcg 4740
cgtaaaagga tctaggtgaa gatccttttt gataatctca tgaccaaaat cccttaacgt 4800
gagttttcgt tccactgagc gtcagacccc gtagaaaaga tcaaaggatc ttcttgagat 4860
cctttttttc tgcgcgtaat ctgctgcttg caaacaaaaa aaccaccgct accagcggtg 4920
gtttgtttgc cggatcaaga gctaccaact ctttttccga aggtaactgg cttcagcaga 4980
gcgcagatac caaatactgt ccttctagtg tagccgtagt taggccacca cttcaagaac 5040
tctgtagcac cgcctacata cctcgctctg ctaatcctgt taccagtggc tgctgccagt 5100
ggcgataagt cgtgtcttac cgggttggac tcaagacgat agttaccgga taaggcgcag 5160
cggtcgggct gaacgggggg ttcgtgcaca cagcccagct tggagcgaac gacctacacc 5220
gaactgagat acctacagcg tgagctatga gaaagcgcca cgcttcccga agggagaaag 5280
gcggacaggt atccggtaag cggcagggtc ggaacaggag agcgcacgag ggagcttcca 5340
gggggaaacg cctggtatct ttatagtcct gtcgggtttc gccacctctg acttgagcgt 5400
cgatttttgt gatgctcgtc aggggggcgg agcctatgga aaaacgccag caacgcggcc 5460
tttttacggt tcctggcctt ttgctggcct tttgctcaca tgttctttcc tgcgttatcc 5520
cctgattctg tggataaccg tattaccgcc tttgagtgag ctgataccgc tcgccgcagc 5580
cgaacgaccg agcgcagcga gtcagtgagc gaggaagcgg aagagcgcct gatgcggtat 5640
tttctcctta cgcatctgtg cggtatttca caccgcatat atggtgcact ctcagtacaa 5700
tctgctctga tgccgcatag ttaagccagt atacactccg ctatcgctac gtgactgggt 5760
catggctgcg ccccgacacc cgccaacacc cgctgacgcg ccctgacggg cttgtctgct 5820
cccggcatcc gcttacagac aagctgtgac cgtctccggg agctgcatgt gtcagaggtt 5880
ttcaccgtca tcaccgaaac gcgcgaggca gctgcggtaa agctcatcag cgtggtcgtg 5940
cagcgattca cagatgtctg cctgttcatc cgcgtccagc tcgttgagtt tctccagaag 6000
cgttaatgtc tggcttctga taaagcgggc catgttaagg gcggtttttt cctgtttggt 6060
cactgatgcc tccgtgtaag ggggatttct gttcatgggg gtaatgatac cgatgaaacg 6120
agagaggatg ctcacgatac gggttactga tgatgaacat gcccggttac tggaacgttg 6180
tgagggtaaa caactggcgg tatggatgcg gcgggaccag agaaaaatca ctcagggtca 6240
atgccagcgc ttcgttaata cagatgtagg tgttccacag ggtagccagc agcatcctgc 6300
gatgcagatc cggaacataa tggtgcaggg cgctgacttc cgcgtttcca gactttacga 6360
aacacggaaa ccgaagacca ttcatgttgt tgctcaggtc gcagacgttt tgcagcagca 6420
gtcgcttcac gttcgctcgc gtatcggtga ttcattctgc taaccagtaa ggcaaccccg 6480
ccagcctagc cgggtcctca acgacaggag cacgatcatg cgcacccgtg gccaggaccc 6540
aacgctgccc gaaatt 6556
<210> 34
<211> 48
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 34
atagcggccg cgtcttctgg aggcctgaaa tatgaagaaa ttgactgc 48
<210> 35
<211> 31
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 35
atactcgagt taattgtgtt ttgcacggct a 31
<210> 36
<211> 1575
<212> DNA
<213> 人
<400> 36
ggccgcgtct tctggaggcc tgaaatatga agaaattgac tgcctgatca acgatgagca 60
taccattaaa ggtcgtcgtg aaggtaatga agtttttctg ccgtttacct gggtggagaa 120
atactttgat gtttatggta aagtggtgca gtatgatggc tatgatcgtt ttgaatttag 180
ccatagctac agcaaagttt atgcacagcg tgcaccgtat catcctgatg gtgtttttat 240
gagctttgag ggctataatg ttgaagttcg tgatcgcgtt aaatgcatta gcggtgttga 300
aggtgttccg ctgagcaccc agtggggtcc gcagggttat ttctatccga ttcagattgc 360
acagtatggc ctgagccatt atagcaaaaa tctgaccgaa aaaccgcctc acattgaagt 420
ttatgaaacc gcagaagatc gcgacaaaaa caaaccgaat gattggaccg ttccgaaagg 480
ttgttttatg gcaaatgttg cagataaaag ccgcttcacc aatgtgaaac agtttattgc 540
accggaaacc agcgaaggtg ttagcctgca gctgggtaat accaaagatt ttatcattag 600
cttcgatctg aaatttctga ccaatggtag cgttagcgtt gttctggaaa ccaccgaaaa 660
aaatcagctg tttaccatcc attatgtgag caatgcccag ctgattgcat ttaaagaacg 720
cgatatctat tatggcattg gtccgcgtac cagttggagc accgttaccc gtgatctggt 780
taccgatctg cgtaaaggtg ttggtctgag caatacaaaa gcagttaaac cgaccaaaat 840
tatgccgaaa aaagttgttc gtctgatcgc caaaggtaaa ggttttctgg ataacattac 900
cattagcacc accgcacata tggcagcatt ttttgcagca agcgattggc tggttcgtaa 960
ccaggatgaa aaaggtggtt ggccgattat ggttacccgt aaactgggtg aaggttttaa 1020
aagcctggaa ccgggttggt atagcgcaat ggcacagggt caggcaatta gcaccctggt 1080
tcgtgcatat ctgctgacca aagatcatat ttttctgaat agcgcactgc gtgcaaccgc 1140
accgtacaaa tttctgtcag aacagcatgg tgttaaagcc gtgtttatga acaaacacga 1200
ttggtatgaa gaatatccga ccaccccgag cagctttgtt ctgaatggtt ttatgtatag 1260
cctgatcggt ctgtacgacc tgaaagaaac agccggtgaa aaactgggta aagaagcacg 1320
tagcctgtac gaacgtggta tggaaagcct gaaagcaatg ctgccgctgt atgataccgg 1380
tagcggcacc atttatgatc tgcgtcattt tatgctgggt atcgcaccga atctggcacg 1440
ttgggattat cataccaccc atattaatca gctgcaactg ctgagtacca ttgatgaaag 1500
tccggtgttt aaagaatttg tgaaacgctg gaaaagctac ctgaaaggta gccgtgcaaa 1560
acacaattaa ctcga 1575
<210> 37
<211> 517
<212> PRT
<213> 人
<400> 37
Gly Leu Lys Tyr Glu Glu Ile Asp Cys Leu Ile Asn Asp Glu His Thr
1 5 10 15
Ile Lys Gly Arg Arg Glu Gly Asn Glu Val Phe Leu Pro Phe Thr Trp
20 25 30
Val Glu Lys Tyr Phe Asp Val Tyr Gly Lys Val Val Gln Tyr Asp Gly
35 40 45
Tyr Asp Arg Phe Glu Phe Ser His Ser Tyr Ser Lys Val Tyr Ala Gln
50 55 60
Arg Ala Pro Tyr His Pro Asp Gly Val Phe Met Ser Phe Glu Gly Tyr
65 70 75 80
Asn Val Glu Val Arg Asp Arg Val Lys Cys Ile Ser Gly Val Glu Gly
85 90 95
Val Pro Leu Ser Thr Gln Trp Gly Pro Gln Gly Tyr Phe Tyr Pro Ile
100 105 110
Gln Ile Ala Gln Tyr Gly Leu Ser His Tyr Ser Lys Asn Leu Thr Glu
115 120 125
Lys Pro Pro His Ile Glu Val Tyr Glu Thr Ala Glu Asp Arg Asp Lys
130 135 140
Asn Lys Pro Asn Asp Trp Thr Val Pro Lys Gly Cys Phe Met Ala Asn
145 150 155 160
Val Ala Asp Lys Ser Arg Phe Thr Asn Val Lys Gln Phe Ile Ala Pro
165 170 175
Glu Thr Ser Glu Gly Val Ser Leu Gln Leu Gly Asn Thr Lys Asp Phe
180 185 190
Ile Ile Ser Phe Asp Leu Lys Phe Leu Thr Asn Gly Ser Val Ser Val
195 200 205
Val Leu Glu Thr Thr Glu Lys Asn Gln Leu Phe Thr Ile His Tyr Val
210 215 220
Ser Asn Ala Gln Leu Ile Ala Phe Lys Glu Arg Asp Ile Tyr Tyr Gly
225 230 235 240
Ile Gly Pro Arg Thr Ser Trp Ser Thr Val Thr Arg Asp Leu Val Thr
245 250 255
Asp Leu Arg Lys Gly Val Gly Leu Ser Asn Thr Lys Ala Val Lys Pro
260 265 270
Thr Lys Ile Met Pro Lys Lys Val Val Arg Leu Ile Ala Lys Gly Lys
275 280 285
Gly Phe Leu Asp Asn Ile Thr Ile Ser Thr Thr Ala His Met Ala Ala
290 295 300
Phe Phe Ala Ala Ser Asp Trp Leu Val Arg Asn Gln Asp Glu Lys Gly
305 310 315 320
Gly Trp Pro Ile Met Val Thr Arg Lys Leu Gly Glu Gly Phe Lys Ser
325 330 335
Leu Glu Pro Gly Trp Tyr Ser Ala Met Ala Gln Gly Gln Ala Ile Ser
340 345 350
Thr Leu Val Arg Ala Tyr Leu Leu Thr Lys Asp His Ile Phe Leu Asn
355 360 365
Ser Ala Leu Arg Ala Thr Ala Pro Tyr Lys Phe Leu Ser Glu Gln His
370 375 380
Gly Val Lys Ala Val Phe Met Asn Lys His Asp Trp Tyr Glu Glu Tyr
385 390 395 400
Pro Thr Thr Pro Ser Ser Phe Val Leu Asn Gly Phe Met Tyr Ser Leu
405 410 415
Ile Gly Leu Tyr Asp Leu Lys Glu Thr Ala Gly Glu Lys Leu Gly Lys
420 425 430
Glu Ala Arg Ser Leu Tyr Glu Arg Gly Met Glu Ser Leu Lys Ala Met
435 440 445
Leu Pro Leu Tyr Asp Thr Gly Ser Gly Thr Ile Tyr Asp Leu Arg His
450 455 460
Phe Met Leu Gly Ile Ala Pro Asn Leu Ala Arg Trp Asp Tyr His Thr
465 470 475 480
Thr His Ile Asn Gln Leu Gln Leu Leu Ser Thr Ile Asp Glu Ser Pro
485 490 495
Val Phe Lys Glu Phe Val Lys Arg Trp Lys Ser Tyr Leu Lys Gly Ser
500 505 510
Arg Ala Lys His Asn
515
<210> 38
<211> 63
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 38
atagcggccg cgcagactaa tgcagcagcg gatgaagaag aagatatcgt cattatctat 60
aac 63
<210> 39
<211> 36
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 39
atactcgagt taattgcttt tcggatagat tttttc 36
<210> 40
<211> 897
<212> DNA
<213> 中国仓鼠
<400> 40
ggccgcgcag actaatgcag cagcggatga agaagaagat atcgtcatta tctataaccg 60
tgttccgaaa accgcaagca ccagctttac caatattgca tatgatctgt gcgccaaaaa 120
tcgctatcat gtgctgcata ttaacaccac caaaaataac ccggttatga gcctgcagga 180
tcaggttcgt tttgttaaaa acattaccac ctggaacgaa atgaaaccgg gtttttatca 240
tggccatatc agctatctgg attttgcgaa atttggcgtg aaaaaaaaac cgatctacat 300
caacgttatt cgcgatccga ttgaacgtct ggttagctat tattactttc tgcgcttcgg 360
tgatgattat cgtccgggtc tgcgtcgtcg taaacagggc gacaaaaaaa cctttgatga 420
atgtgttgcc gaaggtggta gcgattgtgc accggaaaaa ctgtggctgc agattccgtt 480
tttttgcggt catagcagcg aatgttggaa tgttggtagc cgttgggcaa tggatcaggc 540
caaatataac ctgatcaacg aatattttct ggtgggtgtg accgaagaac tggaagattt 600
cattatgctg ctggaagcag cactgcctcg tttttttcgt ggtgcaaccg atctgtatcg 660
taccggtaaa aaaagccatc tgcgtaaaac gacggaaaaa aaactgccga ccaaacagac 720
cattgcaaaa ctgcagcaga gcgatatttg gaaaatggaa aacgagtttt atgaatttgc 780
cctggaacag tttcagttta ttcgtgcaca tgcagttcgt gaaaaagatg gtgatctgta 840
tattctggcc cagaacttct tctacgaaaa aatctatccg aaaagcaatt aactcga 897
<210> 41
<211> 288
<212> PRT
<213> 中国仓鼠
<400> 41
Asp Glu Glu Glu Asp Ile Val Ile Ile Tyr Asn Arg Val Pro Lys Thr
1 5 10 15
Ala Ser Thr Ser Phe Thr Asn Ile Ala Tyr Asp Leu Cys Ala Lys Asn
20 25 30
Arg Tyr His Val Leu His Ile Asn Thr Thr Lys Asn Asn Pro Val Met
35 40 45
Ser Leu Gln Asp Gln Val Arg Phe Val Lys Asn Ile Thr Thr Trp Asn
50 55 60
Glu Met Lys Pro Gly Phe Tyr His Gly His Ile Ser Tyr Leu Asp Phe
65 70 75 80
Ala Lys Phe Gly Val Lys Lys Lys Pro Ile Tyr Ile Asn Val Ile Arg
85 90 95
Asp Pro Ile Glu Arg Leu Val Ser Tyr Tyr Tyr Phe Leu Arg Phe Gly
100 105 110
Asp Asp Tyr Arg Pro Gly Leu Arg Arg Arg Lys Gln Gly Asp Lys Lys
115 120 125
Thr Phe Asp Glu Cys Val Ala Glu Gly Gly Ser Asp Cys Ala Pro Glu
130 135 140
Lys Leu Trp Leu Gln Ile Pro Phe Phe Cys Gly His Ser Ser Glu Cys
145 150 155 160
Trp Asn Val Gly Ser Arg Trp Ala Met Asp Gln Ala Lys Tyr Asn Leu
165 170 175
Ile Asn Glu Tyr Phe Leu Val Gly Val Thr Glu Glu Leu Glu Asp Phe
180 185 190
Ile Met Leu Leu Glu Ala Ala Leu Pro Arg Phe Phe Arg Gly Ala Thr
195 200 205
Asp Leu Tyr Arg Thr Gly Lys Lys Ser His Leu Arg Lys Thr Thr Glu
210 215 220
Lys Lys Leu Pro Thr Lys Gln Thr Ile Ala Lys Leu Gln Gln Ser Asp
225 230 235 240
Ile Trp Lys Met Glu Asn Glu Phe Tyr Glu Phe Ala Leu Glu Gln Phe
245 250 255
Gln Phe Ile Arg Ala His Ala Val Arg Glu Lys Asp Gly Asp Leu Tyr
260 265 270
Ile Leu Ala Gln Asn Phe Phe Tyr Glu Lys Ile Tyr Pro Lys Ser Asn
275 280 285

Claims (27)

1.具有抗凝血活性的多糖,所述多糖包含以下通式(I)中所示的二糖单元的重复结构:
其中
R1至R5满足以下条件;
R1、R2、R4和R5各自独立表示氢或硫酸基团;
R3表示氢、硫酸基团或乙酰基团;
R3的至少一部分是硫酸基团;
R4中硫酸基团的比率是13%或更多;并且
R5中硫酸基团的比率是50%或更多。
2.根据权利要求1的多糖,其中所述二糖单元的含有率是90%或更多。
3.根据权利要求1或2的多糖,其中构成所述多糖的糖链总数中的50%或更多糖链由以下通式(II)中所示的结构构成:
其中
R1至R5与所述通式(I)中的R1至R5相同;并且
n以平均值计为3至30。
4.根据权利要求1至3中任一项的多糖,其中构成所述多糖的糖链总数中的50%或更多糖链由以下通式(II)中所示的结构构成:
其中
R1至R5与所述通式(I)中的R1至R5相同;并且
n以平均值计为3至15。
5.根据权利要求1至4中任一项的多糖,其中连接的糖残基的平均数目为6至60。
6.根据权利要求1至5中任一项的多糖,其中连接的糖残基的平均数目为6至30。
7.根据权利要求1至6中任一项的多糖,其中通过使用普鲁兰多糖作为标准的凝胶渗透色谱测量的数均分子量为8000至60000。
8.根据权利要求1至7中任一项的多糖,其中通过使用普鲁兰多糖作为标准的凝胶渗透色谱测量的数均分子量为12000至40000。
9.根据权利要求1至8中任一项的多糖,其中通过使用普鲁兰多糖作为标准的凝胶渗透色谱测量的重均分子量为10000至100000。
10.根据权利要求1至9中任一项的多糖,其中通过使用普鲁兰多糖作为标准的凝胶渗透色谱测量的重均分子量为15000至50000。
11.根据权利要求1至10中任一项的多糖,其中在所述二糖单元的己糖醛酸残基中,艾杜糖醛酸残基的比率为0%至70%。
12.根据权利要求1至11中任一项的多糖,其中R1中硫酸基团的比率为0%至80%。
13.根据权利要求1至12中任一项的多糖,其中在艾杜糖醛酸残基的R1中,硫酸基团的比率为0%至100%。
14.根据权利要求1至13中任一项的多糖,其中在葡萄糖醛酸残基的R1中,硫酸基团的比率为0%至50%。
15.根据权利要求1至14中任一项的多糖,其中R2中硫酸基团的比率少于1%。
16.根据权利要求1至15中任一项的多糖,其中R3中硫酸基团的比率为70%至100%。
17.根据权利要求1至16中任一项的多糖,其中R3中乙酰基团的比率为0%至33%。
18.根据权利要求1至17中任一项的多糖,其中R4中硫酸基团的比率为45%或更少。
19.根据权利要求1至18中任一项的多糖,其中R5中硫酸基团的比率为70%至100%。
20.根据权利要求1至19中任一项的多糖,所述多糖包含总含有率为50%或更多的选自GlcA-GlcN(NS3S6S)、GlcA(2S)-GlcN(NS6S)、IdoA(2S)-GlcN(NS6S)、GlcA-GlcN(NS6S)、IdoA(2S)-GlcN(NS)、IdoA(2S)-GlcN(NS3S)、IdoA-GlcN(NS6S)和GlcA-GlcN(NS)的一种或多种二糖单元。
21.根据权利要求1至20中任一项的多糖,其中抗因子Xa活性/抗因子IIa活性的比值为1.5或更多。
22.根据权利要求1至21中任一项的多糖,其中通过使用普鲁兰多糖作为标准的凝胶渗透色谱测量的重均分子量(Mw)与数均分子量(Mn)的比值(Mw/Mn)为1.5或更少。
23.根据权利要求1至22中任一项的多糖,所述多糖为游离形式或药理学上可接受的盐,或它们的混合物。
24.根据权利要求1至23中任一项的多糖,该所述盐选自铵盐、钠盐、锂盐和钙盐。
25.药物组合物,所述药物组合物包含根据权利要求1至24中任一项的多糖。
26.根据权利要求25的组合物,其用于预防、改善和/或治疗归因于血液凝固的症状。
27.根据权利要求26的组合物,其中所述症状是弥散性血管内凝血综合征、血栓栓塞、人工透析中的血液凝固或体外循环中的血液凝固。
CN201680082662.5A 2015-12-28 2016-12-16 在氨基葡萄糖残基中具有高3-o-硫酸化比率的硫酸乙酰肝素 Active CN108699580B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2015-257022 2015-12-28
JP2015257022 2015-12-28
PCT/JP2016/087689 WO2017115675A1 (ja) 2015-12-28 2016-12-16 グルコサミン残基の3-o-硫酸化率が高いヘパラン硫酸

Publications (2)

Publication Number Publication Date
CN108699580A true CN108699580A (zh) 2018-10-23
CN108699580B CN108699580B (zh) 2022-09-23

Family

ID=59225733

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201680082662.5A Active CN108699580B (zh) 2015-12-28 2016-12-16 在氨基葡萄糖残基中具有高3-o-硫酸化比率的硫酸乙酰肝素

Country Status (8)

Country Link
US (1) US10889656B2 (zh)
EP (1) EP3399045B9 (zh)
JP (2) JP7006275B2 (zh)
CN (1) CN108699580B (zh)
ES (1) ES2947291T3 (zh)
HR (1) HRP20230820T1 (zh)
HU (1) HUE062293T2 (zh)
WO (1) WO2017115675A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116103275A (zh) * 2022-12-01 2023-05-12 上海兴糖生物技术有限公司 一种葡萄糖醛酸c5-差向异构酶、其核苷酸序列、表达载体、细胞株及其构建方法

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
ES2992871T3 (en) * 2017-09-05 2024-12-19 Ajinomoto Kk 2-o-sulfation enzyme mutant and 3-o-sulfation enzyme mutant, and method for using same
CN112313329A (zh) 2018-06-27 2021-02-02 味之素株式会社 干细胞培养用添加物和培养用培养基、以及培养方法
CN109321508B (zh) * 2018-10-12 2022-12-27 北京化工大学 产heparosan的基因工程菌及其应用
JP7540168B2 (ja) 2019-04-16 2024-08-27 東ソー株式会社 強酸性陽イオン交換体及びその製造方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050027117A1 (en) * 2000-12-18 2005-02-03 Pasqua Oreste Anticoagulant and antithrombotic LMW-glycosaminoglycans derived from K5 polysaccharide and process for their preparation
WO2015050184A1 (ja) * 2013-10-02 2015-04-09 味の素株式会社 ヘパロサン生産細菌及びヘパロサンの製造法

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4396762A (en) * 1981-08-24 1983-08-02 Massachusetts Institute Of Technology Heparinase derived anticoagulants
US8227449B2 (en) * 2000-03-30 2012-07-24 Glycores 2000 S.R.L. Glycosaminoglycans derived from K5 polysaccharide having high anticoagulant and antithrombotic activities and process for their preparation
ITMI20032498A1 (it) * 2003-12-17 2005-06-18 Pasqua Anna Oreste Polisaccaridi antitrombotici a basso peso molecolare e
US20080207895A1 (en) * 2002-11-27 2008-08-28 Rosenberg Robert D Methods for synthesizing polysaccharides
IN2014DN02837A (zh) 2005-05-12 2015-07-10 Univ North Carolina
CN101531723A (zh) 2009-02-27 2009-09-16 江南大学 一种用生物酶对肝素进行选择性结构修饰制备肝素衍生物的方法
US8420790B2 (en) 2009-10-30 2013-04-16 Reliable Biopharmaceutical Corporation Efficient and scalable process for the manufacture of Fondaparinux sodium
EP2655421B1 (en) * 2010-12-23 2022-02-09 The University of North Carolina At Chapel Hill Chemoenzymatic synthesis of structurally homogeneous ultra-low molecular weight heparins

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050027117A1 (en) * 2000-12-18 2005-02-03 Pasqua Oreste Anticoagulant and antithrombotic LMW-glycosaminoglycans derived from K5 polysaccharide and process for their preparation
WO2015050184A1 (ja) * 2013-10-02 2015-04-09 味の素株式会社 ヘパロサン生産細菌及びヘパロサンの製造法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116103275A (zh) * 2022-12-01 2023-05-12 上海兴糖生物技术有限公司 一种葡萄糖醛酸c5-差向异构酶、其核苷酸序列、表达载体、细胞株及其构建方法
CN116103275B (zh) * 2022-12-01 2024-03-08 上海兴糖生物技术有限公司 一种葡萄糖醛酸c5-差向异构酶、其核苷酸序列、表达载体、细胞株及其构建方法

Also Published As

Publication number Publication date
HRP20230820T1 (hr) 2023-11-10
US10889656B2 (en) 2021-01-12
ES2947291T3 (es) 2023-08-04
EP3399045B1 (en) 2023-06-07
EP3399045A1 (en) 2018-11-07
HUE062293T2 (hu) 2023-10-28
EP3399045C0 (en) 2023-06-07
WO2017115675A1 (ja) 2017-07-06
US20180298117A1 (en) 2018-10-18
EP3399045A4 (en) 2019-08-28
JP2022003136A (ja) 2022-01-11
CN108699580B (zh) 2022-09-23
JP7006275B2 (ja) 2022-02-10
JPWO2017115675A1 (ja) 2018-10-18
EP3399045B9 (en) 2023-10-04

Similar Documents

Publication Publication Date Title
CN108699580A (zh) 在氨基葡萄糖残基中具有高3-o-硫酸化比率的硫酸乙酰肝素
CN111065740B (zh) 2-o-硫酸化酶突变体和3-o-硫酸化酶突变体及其使用方法
ES2820429T3 (es) Diversificación de los oligosacáridos de la leche humana (HMO) o sus precursores
TWI730972B (zh) 新穎EndoS變異酵素及使用其之經糖鏈重塑之含Fc區域的分子之製造方法
CA3098403C (en) Biosynthesis of human milk oligosaccharides in engineered bacteria
JP6165872B2 (ja) 単糖類の製造方法
JP2017527311A (ja) フコシル化オリゴ糖の生産において使用するためのα(1,3)フコシルトランスフェラーゼ
RU2746739C1 (ru) Ферментативный способ производства моносахаридов в свободной форме из сахаров, активированных нуклеотидами
Kenyon et al. K17 capsular polysaccharide produced by Acinetobacter baumannii isolate G7 contains an amide of 2-acetamido-2-deoxy-D-galacturonic acid with D-alanine
KR20210126019A (ko) 엔지니어링된 아릴 설페이트-의존 효소
Saburi et al. Practical preparation of epilactose produced with cellobiose 2-epimerase from Ruminococcus albus NE1
CN110191958B (zh) 生产具有经异构化的己糖醛酸残基的肝素前体化合物的方法
WO2004113525A1 (ja) α−グルカンホスホリラーゼ(GP)の耐熱化方法
US20060223140A1 (en) Transglycosylation method and protein having transglycosylation activity
US20240026406A1 (en) Enzymes and microbes for xanthan gum processing
Yamamoto Modification and application of glycosidases to create homogeneous glycoconjugates
Herlihey Biochemical characterization of the activity and control of the autolysins involved in flagella assembly in Gram-negative bacteria
Li Enzyme-Catalyzed Synthesis of Oligosaccharides, Polysaccharides and Glycoconjugates
Claverie GH70 dextransucases: Insights on the molecular determinants of dextran molar mass control
Bell et al. https://www. jbc. org/cgi/doi/10.1074/jbc. RA120. 014454 The latest version is at
US20060068461A1 (en) Transglycosylation method and protein having transglycosylation activity
Lim Synthesis of O-Linked glycopeptides using enzymatic catalysis.
Freiberger Structure-function relations and application of the neisserial polysialyltransferase of serogroup B
Marks Structural analyses of the putative mannosylphosphate transferase, Ktr6p from «Saccharomyces cerevisiae»
Joseph Mechanistic and Evolutionary Analyses of the Sialic Acid Synthase Family

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant