[go: up one dir, main page]

CN102725396A - 在缺乏二肽基氨肽酶活性的巴斯德毕赤酵母中生产治疗性蛋白的方法 - Google Patents

在缺乏二肽基氨肽酶活性的巴斯德毕赤酵母中生产治疗性蛋白的方法 Download PDF

Info

Publication number
CN102725396A
CN102725396A CN2010800603314A CN201080060331A CN102725396A CN 102725396 A CN102725396 A CN 102725396A CN 2010800603314 A CN2010800603314 A CN 2010800603314A CN 201080060331 A CN201080060331 A CN 201080060331A CN 102725396 A CN102725396 A CN 102725396A
Authority
CN
China
Prior art keywords
glcnac
ser
leu
val
glycan
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN2010800603314A
Other languages
English (en)
Inventor
S.R.哈密尔顿
T.A.施塔黑姆
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Merck Sharp and Dohme LLC
Original Assignee
Schering Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Schering Corp filed Critical Schering Corp
Publication of CN102725396A publication Critical patent/CN102725396A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/80Vectors or expression systems specially adapted for eukaryotic hosts for fungi
    • C12N15/81Vectors or expression systems specially adapted for eukaryotic hosts for fungi for yeasts
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/48Hydrolases (3) acting on peptide bonds (3.4)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P21/00Preparation of peptides or proteins
    • C12P21/005Glycopeptides, glycoproteins
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P21/00Preparation of peptides or proteins
    • C12P21/02Preparation of peptides or proteins having a known sequence of two or more amino acids, e.g. glutathione
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P20/00Technologies relating to chemical industry
    • Y02P20/50Improvements relating to the production of bulk chemicals
    • Y02P20/52Improvements relating to the production of bulk chemicals using catalysts, e.g. selective catalysts

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Organic Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Genetics & Genomics (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Biotechnology (AREA)
  • Microbiology (AREA)
  • Molecular Biology (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • General Chemical & Material Sciences (AREA)
  • Mycology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Medicinal Chemistry (AREA)
  • Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Plant Pathology (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)

Abstract

本发明涉及在缺乏二肽基氨肽酶(DAP)活性的酵母细胞系中、尤其是巴斯德毕赤酵母中产生治疗性蛋白的方法和组合物。DAP活性已通过基因修饰巴斯德毕赤酵母细胞系使得STE13和DAP2缺失而去除。

Description

在缺乏二肽基氨肽酶活性的巴斯德毕赤酵母中生产治疗性蛋白的方法
发明领域
本发明涉及在无二肽基氨基肽酶(DAP)活性的酵母细胞系中产生糖蛋白的方法和组合物,该糖蛋白用作人或动物的治疗剂。
发明背景
酵母是重要的制备重组蛋白的生产平台。由于酵母是真核生物,它们和更高等真核生物具有共同的进化过程,包括许多存在于分泌途径中的翻译后修饰过程。糖工程学中的最新进展产生了具有遗传修饰的糖基化途径(允许酵母进行一系列酶促反应)的酵母菌株细胞株巴斯德毕赤酵母(Pichia pastoris)细胞系,其模拟了人类中的糖蛋白的加工,见例如,US Pat. Nos. 7,029,872和7,326,681,其中描述了在与其人类对应物基本相同的较低等真核宿主细胞中产生重组糖蛋白的方法。如前述方法在巴斯德毕赤酵母(Pichia pastoris)中产生的人样唾液酸化双触角复合物N-连接聚糖已经显示了产生治疗性糖蛋白的用途。
和更高等真核生物相似,酵母也表达许多蛋白酶,其中许多或定位于分泌途径、或通过其传递至它们的最终目的地。结果,一些重组蛋白的不期望的蛋白水解作用与依赖于参与的蛋白酶的种类的特异性切割同时发生。二肽基氨肽酶(DAPs)是一类从蛋白的N-末端去除两个氨基酸肽的蛋白水解酶。在酿酒酵母中(Saccharomyces cerevisiae),已经鉴定了具有DAP活性的酶STE13和DAP2的基因,见Julius等人Cell 32:839- 852,1983;Rendueles等人,J. Bacteriology,169:4041-4048,1987。申请人在本发明中开发了用于去除巴斯德毕赤酵母(Pichia pastoris)中DAP活性的方法,其允许产生全长的治疗性蛋白。
发明概述
在一个实施方式中,本发明是用于在缺乏二肽基氨肽酶(DAP)活性的酵母细胞系中产生治疗性蛋白的方法。该实施方式包括用编码治疗性蛋白的多核苷酸转化其中DAP活性已经被去除的基因修饰的巴斯德毕赤酵母细胞系、并培养已转化的宿主细胞以产生治疗性蛋白。可以通过修饰巴斯德毕赤酵母细胞系而使STE13、DAP2和DPPIII删除或破坏而去除DAP活性。在另一个实施方式中,通过修饰巴斯德毕赤酵母细胞系而使STE13和DAP2删除或破坏而去除DAP活性。
在一个实施方式中,本发明是可用于产生治疗性蛋白的缺乏DAP活性的基因修饰的酵母细胞系,包括通过删除STE13和DAP2而重组修饰的巴斯德毕赤酵母细胞系。
在另一个实施方式中,本发明是用于从巴斯德毕赤酵母(Pichia pastoris)产生治疗性蛋白(如TNFRII-Fc,一种包含融合至IgG1 Fc结构域的肿瘤坏死因子受体2(TNFRII)的胞外结构域的重组融合蛋白(TNFRII-Fc),或包含GCSF的分泌血浆形式的重组粒细胞集落刺激因子(GCSF)多肽)的方法。
附图简要说明
图1是本发明方法中所用载体的示意图。Ura5标记的PpSTE13和PpDAP2敲除载体在图1A和1B中分别表示为pGLY4520和pGLY4521。PpSTE13和PpDAP2诺尔丝菌素标记的载体在图1C和1D中分别表示为pGLY5018和pGLY5019。用于切除转化中所用的敲除片段的SfiI限制性酶切位点下面划线表示。PpSTE13和PpDAP2侧翼区用黑色突出。
图2是与酵母中DAP活性相关的TNFRII-Fc的 N-末端切割的图示。图2A显示完整的分泌的TNFRII-Fc(SEQ ID NO:3)的7个N-末端氨基酸(SEQ ID NO:1),图2B显示截短产物的5个N-末端氨基酸(SEQ ID NO:2)。箭头表示被二肽基氨肽酶Dap2p和Ste13p都识别的切割位点。
图3是融合蛋白TNFRII-Fc的氨基酸序列,包含肿瘤坏死因子受体2 (TNFRII)和IgGl Fc区(Fc)(SEQ ID NO:3)。
图4是与酵母中DAP活性相关的GCSF的 N-末端切割的图示。图4A显示完整的分泌的GCSF (SEQ ID NO:6)的7个N-末端氨基酸(SEQ ID NO:4),图4B显示截短产物的5个N-末端氨基酸(SEQ ID NO:5)。箭头表示被二肽基氨肽酶Dap2p和Ste13p都识别的切割位点。
图5是重组粒细胞集落刺激因子(GCSF)蛋白的氨基酸序列(SEQ ID NO:6)。
图6是巴斯德毕赤酵母菌株中产生的GCSF的Western印迹的图示,菌株中或STE13或DAP2基因被删除或破坏,即与Ste13p和Dap2活性被去除的巴斯德毕赤酵母菌株中产生的完整更高分子量的GCSF相比(第32-34道),由于DAP切割而导致的更低分子量的GCSF(第27-29道)。
图7A-7C表示用于产生STE 13和DAP 2敲除(实施例3)的糖工程菌株YGLY7406的流程图。图7C表示单一敲除糖工程菌株ste13(YGLY8084)和dap2(YGLY8090)以及随后的双敲除菌株(YGLY8096)的流程图。
图8A和8B是巴斯德毕赤酵母DAP2的cDNA (SEQ ID NO:37)和氨基酸(SEQ ID NO:38)序列。ORF用黑体字显示,+/-约1 kb侧翼序列。
图9A和9B是巴斯德毕赤酵母STE13的cDNA (SEQ ID NO:39)和氨基酸(SEQ ID NO:40)序列。ORF用黑体字显示,+/-约1 kb侧翼序列。
图10A和10B是分别扩增用于产生pGLY4511和pGLY4512的PpSTE13的5'(SEQ ID NO:41)和3' (SEQ ID NO:42)DNA侧翼区。
侧翼区(下划线)本身侧翼为构成PpSTE13 5'侧翼区的EcoRI限制性酶切位点的核苷酸或构成PpSTE13 3'侧翼区的HindIIII限制性酶切位点的核苷酸。
图11A和11B是分别扩增用于产生pGLY4513和pGLY4514的PpDAP2的5' (SEQ ID NO:43)和3' (SEQ ID NO:44)DNA侧翼区。侧翼区(下划线)本身侧翼为构成PpDAP2 5'侧翼区的EcoRI限制性酶切位点的核苷酸或构成PpDAP2 3'侧翼区的HindIIII限制性酶切位点的核苷酸。
图12是从pAG25扩增的诺尔丝菌素标记盒的cDNA序列(SEQ ID NO:45),ORF用黑体字显示。
图13是巴斯德毕赤酵母DPP III的cDNA(SEQ ID NO:54)序列,ORF用黑体字显示,+/-约1 kb侧翼序列。
发明的详细说明
定义
本发明所用的术语“二肽基氨肽酶活性”或“DAP活性”是指由名为STE13、DAP2或DPPIII的基因产生的多肽的酶切割。
本发明所用的术语“二肽基氨肽酶活性的去除”或“DAP活性的去除”是指由名为STE13、DAP2和DPPIII的基因产生的酶活性的缺失。
本发明所用的术语“治疗性蛋白”是指可被用于在动物或人类中治疗性地治疗疾病或状况的全长、即非截短形式的生物活性多肽。本发明所用的该术语的例子是包含肿瘤坏死因子受体2(TNFRII)和IgG1的Fc区(Fc)的融合蛋白TNFRII-Fc以及重组粒细胞集落刺激因子(GCSF)蛋白。
本发明所用的术语“N-末端识别位点”是指具有基序X-Pro或X-Ala的N-末端序列的多肽,其中X是任何氨基酸,相对于N-末端的第二位是脯氨酸或丙氨酸。
本发明所用的术语“糖工程化的巴斯德毕赤酵母菌株”是指被工程化以表达人糖蛋白的巴斯德毕赤酵母菌株。代表性菌株包括YJN201(Choi等人,PNAS,100 (9):5022-5027,2003);YSH44 (Hamilton等人,Science,301 (5637):1244-1246,2003);RDP36-1 (Davidson等人,Glycobiology,14 (4):1-9,2004);PBP6-5 (Bobrowicz等人,Glycobiology.14 (9):757-766,2004);YSH597 (Hamilton等人,Science,313 (5792):1441-1443,2006)。
本发明所用的术语“野生型菌株”是指其中基因STE13、DAP 2或DPPIII没有被改变、破坏或从基因组中删除的糖工程化的巴斯德毕赤酵母菌株。
本发明所用的术语“删除型菌株”是指其中一种、两种或所有DAP基因的巴斯德毕赤酵母同源物、即STE13、DAP 2和DPPIII在基因组水平上被修饰而去除了功能性DAP活性的糖工程化的巴斯德毕赤酵母菌株。这包括,但不限于基因(包括启动子、开放阅读框和终止子)的完全或部分删除;分别改变基因的转录或编码的mRNA的转录或翻译的一种或更多种突变的引入;以及使蛋白活性失活的一种或更多种突变的引入。这种删除型菌株的例子是YGLY8084。
本发明所用的术语“删除的或破坏的”和“删除或破坏”是指酶活性的抑制,所述酶由酵母细胞基因组产生,其中酶活性的抑制为到底物蛋白具有完整的N-末端的程度。其中酶活性可以被去除或破坏的酵母宿主细胞的例子包括、但不限于1)控制基因表达的上游或下游调控序列的删除或破坏;2) 编码酶活性基因的突变而使基因无功能,其中“突变”包括删除、替代、插入或加入基因中而使之没有酶活性;3)通过化学、肽或蛋白抑制剂的方式去除或破坏酶活性;4) 通过基于核酸表达抑制剂、如反义DNA和siRNA去除或破坏酶活性;5) 通过转录抑制剂或控制或调控编码酶活性的基因的表达的调控因子的表达或活性的抑制剂去除或破坏酶活性;以及6) 通过任何方式,其中获得的产物,即使表达,不同于分泌蛋白,而且其功能变弱。
缩写
下列缩写贯穿本说明书使用:
URA5 乳清酸磷酸核糖转移酶(OPRTase)同工酶
ScSUC2 酿酒酵母(S. cerevisiae)转化酶
OCH1 α-1,6-甘露糖基转移酶
KIGlcNAcTr 乳酸克鲁维酵母(K. Lactis)UDP-GlcNAc转运蛋白
BMT2 β-甘露糖-转移(β-甘露糖去除)
MNN4B: MNN4A样基因(电荷去除)
MmGlcNAcTr UDP-GlcNAc转运蛋白的小鼠同源物
PNO1: N-聚糖的磷酸甘露糖化(电荷去除)
MNN4A 甘露糖基转移酶(电荷去除)
ADE1 N-琥珀酰-5-氨基咪唑-4-甲酰胺核苷酸合成酶
MNS1 融合至ScSEC12前导区的小鼠甘露糖苷酶IA催化结构域
GnTI 融合至PpSEC12前导区的人GlcNAc转移酶I催化结构域
HIS1 ATP磷酸核糖转移酶
GalTI 融合至ScKRE2前导区的截短的人半乳糖基转移酶1催化结构域
GalE 酿酒酵母(S. cerevisiae)UDP-葡萄糖4-表异构酶
UDP-GalTr UDP-半乳糖转运蛋白
ARG1 精氨酸琥珀酸盐合成酶
MNSII 融合至ScMNN2前导区的果蝇(Drosophila)甘露糖苷酶II催化结构域
GnTII 融合至ScMNN2前导区的大鼠GlcNAc转移酶II催化结构域
PRO1 γ-谷氨酰激酶
TrMNS1 融合至ScαMAT的分泌的里氏木霉(T. reesei)甘露糖苷酶I催化结构域
AOX1 醇氧化酶I
TNFRII-Fc 融合至IgGl的Fc结构域的人肿瘤坏死因子受体II
Zeo Zeocin抗性标记
STE13 二肽基氨肽酶
DAP2 二肽基氨肽酶
DPPIII 二肽基氨肽酶
Nat 诺尔丝霉素抗性标记
在酵母中生产治疗性蛋白
相当大部分的从人或其它动物中分离的蛋白是糖基化的。治疗用的蛋白中,约70%是糖基化的。如果治疗性蛋白在微生物宿主如酵母中产生并用内源途径糖基化,其疗效通常大大降低。尽管这种糖蛋白在人类中具有免疫原性,但是却在体内给药后表现出降低的半衰期,Takeuehi,Trends in Glycoscience and Glycotechnology.9:S29-S35,1997。
人和动物中的特异性受体可以识别末端甘露糖残基并促使蛋白从血流中迅速清除。其它的副作用可能包括蛋白折叠、可溶性、对蛋白酶的敏感性、转运、运输、区室化、分泌、被其它蛋白或因子的识别、免疫原性或变应原性的改变。
因此,有必要在动物宿主系统中产生治疗性糖蛋白,以便糖基化模式与人或目的受体种中存在的相同或至少相似。在大部分情况下,使用哺乳动物宿主系统,如哺乳动物细胞培养。所用系统包括中国仓鼠卵巢细胞(CHO)、转基因动物、植物或昆虫细胞。这种系统中表达的重组人蛋白仍可能包括非人类糖形式,如Raju等人,Annals Biochem.,283(2):123-132,2000。所有这些系统都具有显著的缺点,包括但不限于,仅有某种治疗性蛋白适用于动物或植物系统中表达,细胞培养系统通常非常慢,蛋白产量相对于微生物发酵过程要低以及可能需要复杂和昂贵的营养物或添加剂或这种系统可能易于被污染。
因此,缺乏适宜的表达是任何治疗性糖蛋白生产的障碍。通过微生物发酵生产糖蛋白可能提供相对于现有系统的优势,包括但不限于快速生产高浓度蛋白、能使用无菌、良好控制的生产条件或化学成分明确的生长培养基、能表达种类广泛的蛋白以及易于回收治疗性蛋白。然而,正如上面指出的,细菌系统不能产生像真核生物一样的糖基化治疗性蛋白。为此,开发了具有能产生人糖蛋白的基因修饰的糖基化途径的酵母细胞系、尤其是巴斯德毕赤酵母。例如,见US Pat.No.7,029,872和7,326,681以及US 2006-0286637,其中记载了用于在较低等真核宿主细胞中产生与其人相应物基本相同的重组糖蛋白。如前述方法在巴斯德毕赤酵母中产生的人样唾液酸化双触角复合物N-连接聚糖已经显示了产生治疗性糖蛋白的用途。
尽管前述巴斯德毕赤酵母细胞系可以产生具有使之适用于治疗的人样糖基化模式的蛋白,然而在巴斯德毕赤酵母中表达治疗性蛋白并不必然导致全长多肽的产生。为了有效地使用酵母表达系统,需要去除不期望的酶活性,如使治疗性蛋白截短的蛋白水解作用。
在缺乏二肽氨肽酶活性的巴斯德毕赤酵母中生产治疗性蛋白的方法
对从酵母细胞系巴斯德毕赤酵母分泌的重组融合蛋白TNFRII-Fc(其序列如图3所示(SEQ ID NO:3))的肽序列的分析表明所有产生的肽在N-末端都有两个氨基酸被截短。申请人在本发明中鉴定了在巴斯德毕赤酵母细胞系中两个基因STE13和DAP2的删除去除了所有的DAP活性,导致了全长TNFRII-Fc的产生。申请人也鉴定了巴斯德毕赤酵母具有第三种二肽基氨肽酶,DPPIII。因此,在一个实施方式中,本发明是用于在缺乏DAP活性的酵母细胞系中产生治疗性蛋白的方法。该实施方式包括用编码治疗性蛋白的多核苷酸载体转化其中DAP活性已经被去除的基因修饰的巴斯德毕赤酵母细胞系、并培养已转化的宿主细胞以产生治疗性蛋白。可以通过修饰巴斯德毕赤酵母细胞系而使STE13、DAP2和/或DPPIII删除或破坏而去除DAP活性。在本发明一个特定实施方式中,通过修饰巴斯德毕赤酵母细胞系而使STE13和DAP2删除或破坏而去除DAP活性。
在另一个实施方式中,本发明是可用于产生治疗性蛋白的酵母细胞株,其包括被重组修饰使得STE13和DAP2基因被删除或破坏并且所有产生的DAP活性都被去除的巴斯德毕赤酵母细胞系。
在其它实施方式中,本发明是从巴斯德毕赤酵母中产生在相对于多肽的N-末端的第二位具有氨基酸脯氨酸或丙氨酸的治疗性蛋白,如此处所述的TNFRII-Fc融合蛋白或GCSF蛋白的方法。
二肽基氨肽酶活性
已经在酵母中鉴定了与已知从多肽的氨基末端截短两个氨基酸的蛋白酶亚类二肽基氨肽酶(DAP)活性相关的基因。已经表征了酿酒酵母的非交配型α细胞突变体,二肽基氨肽酶基因STE13的突变归因于α交配因子信息素(pheromone)的不完全加工,见Julius等人,Cell,32(3),839-52,1983。而且,通过筛选Ste13p活性缺陷的酿酒酵母突变菌株,鉴定了第二种二肽基氨肽酶Dap2p,见Suarez Rendueles和Wolf,Journal of Bacteriology,169 (9),4041-48,1987。已经报道了酿酒酵母STE13 的巴斯德毕赤酵母同源物的敲除防止了在N-末端具有氨基酸HG (His-Gly)的蛋白在体内的蛋白水解性切割,允许全长促胰岛素肽的产生,见Melarkode等人,WO 2007/148345;Prabha等人,Protein Expression and Purification,64,155-161,2009。相反,酿酒酵母的DAP2巴斯德毕赤酵母同源物的破坏不能阻止N-末端蛋白水解切割,见Melarkode等人,WO 2007/148345;Prabha等人,Protein Expression and Purification 64,155-161,2009。
Ste13p和Dap2p各自表明能切割具有基序X-P/A的N-末端肽,其中X是任何氨基酸,第二位是脯氨酸(P)或丙氨酸(A),见Misumi和Ikehara,Handbook of Proteolytic Enzymes,2nd edition,pp.1910- 1911,Elsevier,London,2004。本发明所用的用于说明本发明的TNFRII-Fc和GCSF蛋白也遵循保守的X-Pro的Ste13p和Dap2p基序,表明对于在巴斯德毕赤酵母中生产治疗性蛋白,必须去除Ste13p或Dap2p的DAP活性。相反,Melarkode等人,WO 2007/148345的促胰岛素肽具有含仅被Ste13p识别的His-Gly基序的新的不保守N-末端。
正如申请人此处所展示的,巴斯德毕赤酵母Ste13p活性的去除仅导致TNFRII-Fc蛋白的DAP活性的部分降低,比产生的具有全长序列的TNFRII-Fc蛋白活性的一半稍高。申请人惊讶地发现对于DAP活性的完全去除,即对于全长TNFRII-Fc蛋白的100%存在,Ste13p和Dap2p的活性都必须从巴斯德毕赤酵母细胞系中去除。类似地,仅仅当两种DAP基因都从巴斯德毕赤酵母中去除时,申请人才观察到重组GCSF蛋白的完整产生。因此,本领域技术人员能够意识和理解本发明不同于现有技术之处在于,对于产生具有N-末端X-P/A基序的全长蛋白,要求巴斯德毕赤酵母中Ste13p和Dap2p活性都被去除。
根据已知DAP基因中的同源物,本领域技术人员可能设计PCR引物(其例子如表1所示),或使用基因或基因片段作为探针从而在目标生物的DNA文库中鉴定同源物。申请人为了鉴定具有DAP活性的同源物而对巴斯德毕赤酵母基因组的分析导致鉴定了STE 13和DAP2的同源物,分别命名为PpSTE13和PpDAP2,(图8A和8B,SEQ ID NOS:37和38,以及图9A和9B,SEQ ID NOS:39和40)。Melarkode等人,WO 2007/148345描述了巴斯德毕赤酵母STE13同源物的DNA序列,而Prabha等人,Protein Expression and Purification,64:155-161,2009描述了巴斯德毕赤酵母Ste13p和Dap2p同源物的蛋白序列。申请人在本发明中制备的Ste13p同源物似乎与Melarkode等人前面报道的一致。尽管申请人在本发明中制备的Dap2p蛋白的主要部分与Prabha等人报道的一致,但是本发明鉴定的Dap2p同源物在C-末端不同。申请人的同源物包含下列C-末端序列: (SEQ ID NO:46)。然而Prabha等人的同源物具有下列C-末端序列:
Figure 185600DEST_PATH_IMAGE002
(SEQ ID NO:47)。直到并包括上述C-末端序列的下划线部分的N-末端序列在两种同源物中都是保守的。
表1列出了用于在巴斯德毕赤酵母中产生敲除载体的代表性引物的序列。引物序列中下划线的区域代表被引入以帮助生成基因敲除片段的限制性酶识别位点。引入的特异性限制性酶识别位点在相邻的引物描述栏中命名。表2列出了用于验证将用表1的引物产生的敲除载体转化后巴斯德毕赤酵母STE13和DAP2从基因组中的敲除。当5'和3'引物组产生期望大小的PCR产物并且敲除引物组不产生产物时,即验证了删除成功。
表1
Figure 282781DEST_PATH_IMAGE003
Figure 554679DEST_PATH_IMAGE005
表2
Figure 190191DEST_PATH_IMAGE006
* 野生型位点存在即获得1 Kb产物。
为了评价这些基因中每一个在观察到的TNFRII-Fc的N-末端截短中的作用,设计了包含URA5基因并具有将载体靶向而使基因组中DAP2或STE13位点破坏的巴斯德毕赤酵母DAP 2或STE 13基因的5'和3'区的敲除载体(图1A和1B)。将这些敲除载体转化进表达重组融合蛋白TNFRII-Fc的相同的ura阴性亲本菌株(YGLY7406)。在PCR筛选转化物之后,鉴定了Ppste13和Ppdap2敲除菌株,分别为YGLY8084和YGLY8090。为了产生双敲除菌株,即在相同的菌株中PpSTEJ3和PpDAP2都被敲除,以PpDAP2诺尔丝菌素显性标记敲除载体pGLY5019转化Ppste13删除菌株YGLY8084(图1D)。在PCR筛选转化物之后,在Ppste13::URA5背景亲本菌株中获得了数个Ppdap2敲除株。将代表性的Ppste13/Ppdap2双敲除菌株命名为YGLY8096。
从这些菌株中的每一种分泌的TNFRII-Fc的肽分析表明,尽管Ste13p在该多肽的蛋白水解中起主要作用,两种DAP基因都删除对于去除DAP活性是必要的。对于野生型菌株,100%产生的蛋白在N-末端被截短两个氨基酸。STE 13的单一删除产生59%的具有完整N-末端的肽群,而DAP 2的删除产生完整的TNFRII-Fc,但其程度低得多,仅15%的分泌多肽具有全长序列。从双敲除菌株YGLY8096分泌的TNFRII-Fc的分析表明100%的肽群具有完整的N-末端。表3是该分析获得的数据的摘要,显示了相对于分离的全长肽的截短体的摩尔百分比。数据代表了每种菌株的三次重复样品。由于ura阴性菌株分泌重组蛋白的能力较弱,用原养型亲本菌株YGLY7406、YGLY6646产生来自PpSTE13和PpDAP2基因都未被破坏的菌株的物质。该菌株的表型如表3中野生型所述,是指具有完整的PpSTE13和PpDAP2位点。
表3
基于该分析,申请人确定了PpSte13p和PpDap2p是仅有的参与巴斯德毕赤酵母中表达的重组TNFRII-Fc的N-蛋白水解的蛋白酶,两者的删除对于去除DAP活性都是需要的。相似地,当野生型粒细胞集落刺激因子(GCSF)多肽(图5中的蛋白序列;SEQ ID NO:6)在巴斯德毕赤酵母中表达时,其N-末端是截短的。该物质的N-末端测序显示其在N-末端删除两个氨基酸(分别为图4A和4B,SEQ ID NOS:4和5)。通过在Δpste13/Ppdap2双敲除背景中产生GCSF,GCSF的这种截短形式的产生也被完全去除了(图6)。在两个例子中,这些重组蛋白(TNFRII-Fc和CSF)的切割发生在多肽的C-末端至第二位(相对于N-末端)的脯氨酸。如此处所示,在巴斯德毕赤酵母中两种DAP相关基因的双删除防止了在多肽的N-末端第二位具有脯氨酸的治疗性蛋白的截短,PpSTE 13和PpDAP2的双删除对于去除DAP活性是需要的。
上面所述的治疗性蛋白的例子都具有N-末端基序Xaa-Pro,其中X可以是任何氨基酸。如上所述,Ste13p和Dap2p各自表明能切割也具有基序Xaa-Ala的N-末端肽,其中Xaa是任何氨基酸,丙氨酸(Ala)是第二位氨基酸,见Misumi和Ikehara,Handbook of Proteolytic Enzymes,2nd edition,pp.1910-1911,Elsevier,London,2004。为了显示PpSTE13和Pp DAP 2的双敲除对于防止具有Xaa-Ala基序的蛋白的截短是需要的,本领域技术人员可以将TNFR-Fc的分泌形式的第二位氨基酸从脯氨酸突变为丙氨酸。基于此处的结果,似乎PpSTE13或PpDAP2其中之一能降低观察到的N-末端切割的百分比。DAP活性的完全去除和获得100%完整蛋白仅仅在Δpste13/Ppdap2双敲除宿主菌株,即STE 13和DAP2都敲除的突变时观察到。
尽管PpSte13p和PpDap2p的组合去除导致具有完整N-末端的治疗性蛋白的产生,但是申请人发现巴斯德毕赤酵母具有第三种二肽基氨肽酶,此处被称为PpDPPIII。这种酶通过注释巴斯德毕赤酵母基因组而被鉴定,与人的酶二肽基肽酶III (DppIIIp)具有43% 序列同一性。巴斯德毕赤酵母的DppIIIp同源物已经被表征,但在序列水平上不同于PpSte13p和PpDap2p,分别仅具有10%和12%序列同一性。尽管这种DAP基因没有被完全表征,申请人相信当在适当条件下表达时,PpDppIIIp会产生截短的蛋白,尽管在此处评价的条件下没有观察到活性。本领域技术人员可以认识并理解,在其它生长条件下或通过与其它报告蛋白的表达,PpDppIIIp活性可能被证明。因此,在其它合适条件或报告子条件下,为了在巴斯德毕赤酵母中完全去除DAP活性,PpDppIII 可能需要或单独或与PpSte13p和/或PpDap2p活性共同被删除或破坏。本领域技术人员根据本发明实施例中所述方法、具体为实施例5中的方法,能够删除或破坏PpDPPIII。
用于去除DAP活性的巴斯德毕赤酵母菌株
尽管任何商业可获得的巴斯德毕赤酵母菌株可用于本发明、如NRRL-Y11430 (美国标准培养物保藏中心(ATCC),Manassas,VA,Catalog No. 76273),在一个优选实施方式中,用于本发明的菌株为糖工程化的巴斯德毕赤酵母菌株,例如,实施例3中所述的GS5.0菌株或下述的糖工程化菌株,其包含了能在表达时产生人样糖基化模式的修饰。例如,就实施例3中的GS5.0菌株而言,这种修饰包括针对Δoch1、Δpno1、Δmnn4B、Δbmt2和Δura5删除、乳酸克鲁维酵母(K. Lactis)和小鼠UDP-GlcNAc转运蛋白、小鼠(M. musculus )α-1,2-MnsI、智人(H. sapiens)β-1,2,-GlcNAc转移酶1活性、褐鼠(R. norvegicus )β-l,2-GlcNAc 转移酶II活性、黑腹果蝇(D. melanogaster)MnsII活性、粟酒裂殖酵母(S. Pombe)半乳糖表异构酶、黑腹果蝇UDP-半乳糖基转运蛋白和智人β-1,4-半乳糖基转移酶活性的插入。GS5.0菌株能够产生具有半乳糖末端化的N-聚糖的糖蛋白,例如GalGlcNAc2Man3GlcNAC2、Gal2GlcNAc2Man3GlcNAc2或其混合物。其它代表性糖工程化菌株包括YJN201 (Choi等人,PNAS,100 (9):5022-5027,2003);YSH44 (Hamilton等人,Science,301 (5637):1244-1246,2003);RDP36-1 (Davidson等人,Glycobiology,14 (4):1-9,2004);PBP6-5 (Bobrowicz等人,Glycobiology,14 (9):757-766,2004);YSH597 (Hamilton等人,Science,313 (5792):1441-1443,2006)。
除了巴斯德毕赤酵母,本发明中可用的宿主细胞包括表达毕赤酵母DAP2和STE13基因的同源物的酵母。这种酵母可能选自于Pichia finlandica、喜海藻糖毕赤酵母(Pichia trehalophila)、Pichia koclamae、膜醭毕赤酵母(Pichia membranaefaciens)、微小毕赤酵母(Pichia minula)(Ogataea minuta,Pichia lindneri)、Pichia opuntiae、Pichia thermotolerans、柳毕赤酵母(Pichia salictaria)、Pichia guercuum、皮杰普毕赤酵母(Pichia pijperi)、树干毕赤酵母(Pichia stiptis)、甲醇毕赤酵母(Pichia methanolica)、毕赤酵母属(Pichia sp.)、酿酒酵母(Saccharomyces cerevisiae)、酵母属(Saccharomyces sp.)、多形汉逊酵母(Hansenula polymorpha)、克鲁维酵母属(Kluyveromyces sp.)、乳酸克鲁维酵母(Kluyveromyces lactis)、白色念珠菌(Candida albicans.)。各种酵母、如乳酸克鲁维酵母,巴斯德毕赤酵母、甲醇毕赤酵母和多形汉逊酵母尤其适合用于细胞培养,因为它们能够生长至高细胞密度并分泌大量的重组蛋白。
可以将酵母基因修饰以便它们表达其中糖基化模式为人样或人源化的糖蛋白。这样,可以产生组合物中特定需要糖形式为主要成分的糖蛋白组合物。这可以通过去除选择的内源糖基化酶和/或基因工程化的宿主细胞和/或提供外源酶以模拟如US 2004/0018590中所述的全部或部分哺乳动物糖基化途径而实现。如果需要,可以进行糖基化的额外的基因工程化,以便产生有或没有核心岩藻糖基化的糖蛋白。使用较低等真核宿主细胞更有利,因为这些细胞能够产生糖蛋白的高度均一的组合物,以便存在的糖蛋白的主要糖形式为高于30%摩尔的组合物中的糖蛋白。在特定方面,存在的主要糖形式可能高于40%摩尔、50%摩尔、60%摩尔、70%摩尔、最优选地高于80%摩尔的组合物中存在的糖蛋白。
可以将酵母基因修饰以便它们表达其中糖基化模式为人样或人源化的糖蛋白。人样或人源化N-聚糖既包括杂合N-聚糖又包括复合N-聚糖。这可以通过如Gerngross等人,US 20040018590所述的去除选择的内源糖基化酶和/或提供外源酶而实现。例如,可以选择或工程化宿主细胞以剔除1,6-甘露糖转移酶活性,否则该酶可能将甘露糖残基加至糖蛋白的N-聚糖上。
在一个实施方式中,宿主细胞进一步包括融合至通常与催化结构域无关的细胞靶向信号肽的αl ,2-甘露糖苷酶催化结构域,其被选择以将αl,2-甘露糖苷酶活性靶向至宿主细胞的ER或高尔基体(Golgi apparatus)。重组糖蛋白通过宿主细胞的ER或高尔基体产生了包含Man5GlcNAc2糖形式的重组糖蛋白,例如主要包含Man5GlcNAc2糖形式的重组糖蛋白组合物。例如,美国专利No,7,029,872和美国公开的专利申请Nos.2004/0018590和2005/0170452公开了能够产生包含MansGlcNAc2糖形式的糖蛋白的较低等的真核宿主细胞。
在一个进一步的实施方式中,刚刚前面的宿主细胞进一步包括融合至通常与催化结构域无关的细胞靶向信号肽的GlcNAc转移酶I(GnT I)催化结构域,其被选择以将GlcNAc转移酶I活性靶向至宿主细胞的ER或高尔基体。重组糖蛋白经过宿主细胞的ER或高尔基体产生了包含GlcNAcMan5GlcNAc2糖形式的重组糖蛋白,例如主要包含杂合GlcNAcMan5GlcNAc2糖形式的重组糖蛋白组合物。美国专利No,7,029,872和美国公开的专利申请Nos.2004/0018590和2005/0170452公开了能够产生包含GlcNAcMan5GlcNAc2糖形式的糖蛋白的较低等的真核宿主细胞。可以在体外用氨基己糖苷酶处理上面细胞中产生的糖蛋白以产生包含Man5GlcNAc2糖形式的重组糖蛋白。
在一个进一步的实施方式中,刚刚前面的宿主细胞进一步包括融合至通常与催化结构域无关的细胞靶向信号肽的甘露糖苷酶II催化结构域,其被选择以将甘露糖苷酶II活性靶向宿主细胞的ER或高尔基体。重组糖蛋白通过宿主细胞的ER或高尔基体产生了包含GlcNAcMan3GlcNAc2糖形式的重组糖蛋白,例如主要包含复合GlcNAcMan3GlcNAc2糖形式的重组糖蛋白组合物。美国专利No,7,029,872和美国公开的专利申请Nos.2004/0230042公开了表达甘露糖苷酶II的较低等的真核宿主细胞,其能够产生主要具有GlcNAc2Man3GlcNAc2糖形式的糖蛋白。可以在体外用氨基己糖苷酶处理上面细胞中产生的糖蛋白以产生包含Man3GlcNAc2糖形式的重组糖蛋白。
在一个进一步的实施方式中,刚刚前面的宿主细胞进一步包括融合至通常与催化结构域无关的细胞靶向信号肽的GlcNAc转移酶II(GnT II)催化结构域,其被选择以将GlcNAc转移酶II活性靶向至宿主细胞的ER或高尔基体。重组糖蛋白经过宿主细胞的ER或高尔基体产生了包含GlcNAc2Man3GlcNAc2糖形式的重组糖蛋白,例如主要包含复合GlcNAc2Man3GlcNAc2糖形式的重组糖蛋白组合物。美国专利No,7,029,872和美国公开的专利申请Nos.2004/0018590和2005/0170452公开了能够产生包含GlcNAc2Man3GlcNAc2糖形式的糖蛋白的较低等的真核宿主细胞。可以在体外用氨基己糖苷酶处理上面细胞中产生的糖蛋白以产生包含Man3GlcNAc2糖形式的重组糖蛋白。
在一个进一步的实施方式中,刚刚前面的宿主细胞进一步包括融合至通常与催化结构域无关的细胞靶向信号肽的半乳糖基转移酶催化结构域,其被选择以将半乳糖基转移酶活性靶向至宿主细胞的ER或高尔基体。重组糖蛋白经过宿主细胞的ER或高尔基体产生了包含复合GalGlcNAc2Man3GlcNAc2(G1)或复合Gal2GlcNAc2Man3GlcNAc2(G2)糖形式或其混合物的重组糖蛋白,例如主要包含GalGlcNAc2Man3GlcNAc2糖形式或Gal2GlcNAc2Man3GlcNAc2糖形式或其混合物的重组糖蛋白组合物。美国专利No,7,029,872和美国公开的专利申请No.2006/0040353公开了能够产生包含Gal2GlcNAc2Man3GlcNAc2糖形式的糖蛋白的较低等的真核宿主细胞。可以在体外用半乳糖苷酶处理上面细胞中产生的糖蛋白以产生包含GlcNAc2Man3GlcNAc2糖形式的重组糖蛋白,例如主要包含GlcNAc2Man3GlcNAc2糖形式的重组糖蛋白组合物。
在一个进一步的实施方式中,刚刚前面的宿主细胞进一步包括融合至通常与催化结构域无关的细胞靶向信号肽的唾液酸转移酶催化结构域,其被选择以将唾液酸转移酶活性靶向至宿主细胞的ER或高尔基体。重组糖蛋白经过宿主细胞的ER或高尔基体产生了主要包含复合NANA2Gal2GlcNAc2Man3GlcNAc2糖形式或复合NANAGal2GlcNAc2Man3GlcNAc2糖形式或其混合物的重组糖蛋白。宿主细胞进一步包括提供用于转移至N-聚糖的CMP-唾液酸是有用的。美国公开的专利申请No.2005/0260729公开了用于基因工程化较低等真核生物以具有CMP-唾液酸合成途径的方法,美国公开的专利申请No.2006/0286637公开了用于基因工程化较低等真核生物以产生唾液酸化糖蛋白的方法。可以在体外用神经氨酸酶处理上面细胞中产生的糖蛋白以产生主要包含Gal2GlcNAc2Man3GlcNAc2糖形式的重组糖蛋白。
前面宿主细胞中任一种进一步包括一种或更多种选自GnT III、GnT IV、GnT V、GnT VI和GnT IX的GlcNAc转移酶,以产生具有如美国公开的专利申请Nos.2004/074458和2007/0037248所公开的二分的(GnT III)和/或多触角的(GnT IV、V、VI和IX)N-聚糖结构的糖蛋白。
在一个进一步的实施方式中,产生主要具有杂合的GlcNAcMan5GlcNAc2N-聚糖的糖蛋白的宿主细胞进一步包括融合至通常与催化结构域无关的细胞靶向信号肽的半乳糖基转移酶催化结构域,其被选择以将唾液酸转移酶活性靶向至宿主细胞的ER或高尔基体。重组糖蛋白经过宿主细胞的ER或高尔基体产生了主要包含杂合的GalGlcNAcMan5GlcNAc2糖形式的重组糖蛋白。
在一个进一步的实施方式中,刚刚前面的产生主要具有GalGlcNAcMan5GlcNAc2 N-聚糖的糖蛋白的宿主细胞进一步包括融合至通常与催化结构域无关的细胞靶向信号肽的唾液酸转移酶催化结构域,其被选择以将唾液酸转移酶活性靶向至宿主细胞的ER或高尔基体。重组糖蛋白经过宿主细胞的ER或高尔基体产生了包含杂合的NANAGalGlcNAcMan5GlcNAc2糖形式的重组糖蛋白。
前面的各种宿主细胞进一步包括一种或更多种糖转运蛋白,如UDP-GlcNAc转运蛋白(例如乳酸克鲁维酵母(Kluyveromyces lactis)和小鼠(Mus musculus)UDP-GlcNAc转运蛋白),UDP-半乳糖转运蛋白(例如黑腹果蝇(Drosophila melanogaster )UDP-半乳糖转运蛋白)和CMP-唾液酸转运蛋白(例如人唾液酸转运蛋白)。因为较低等真核宿主细胞如酵母和丝状真菌缺乏上述转运蛋白,优选将较低等真核宿主细胞如酵母和丝状真菌进行基因工程化以包含上述转运蛋白。
宿主细胞进一步包括较低等真核细胞(例如酵母如巴斯德毕赤酵母),该真核细胞被基因工程化,通过删除或破坏一种或更多种β-甘露糖转移酶基因(例如BMT1,BMT2,BMT3和BMT4)而去除具有α-甘露糖苷酶抗性的N-聚糖的糖蛋白(见美国公开的专利申请No.2006/0211085),和通过删除或破坏一种或两种磷酸甘露糖基转移酶基因PNO1和MNN4B(例如见美国专利Nos.7,198,921和7,259,007)而去除具有磷酸甘露糖残基的糖蛋白,其进一方面可以包括删除或破坏MNN4A基因。破坏包括破坏编码特定酶的开放阅读框或破坏开放阅读框的表达或用干扰RNA、反义RNA或其类似物废除编码一种或更多种β-甘露糖转移酶和/或磷酸甘露糖基转移酶的RNA的翻译。宿主细胞进一步包括任何一种被修饰用于产生特定N-聚糖结构的前面提及的宿主细胞。
宿主细胞进一步包括这样的较低等真核细胞(例如,酵母,例如巴斯德毕赤酵母),其被基因修饰以通过删除或破坏一种或更多种蛋白O-甘露糖转移酶(Dol-P-Man:蛋白(Ser/Thr)甘露糖转移酶基因)(PMTs)(参见美国专利No. 5,714,377)而控制糖蛋白的O-糖基化,或如公开的国际申请No. WO 2007061631所述生长于存在Pmtp抑制剂和/或α-甘露糖苷酶的条件下,或两者共同。破坏包括破坏编码Pmtp的开放阅读框或破坏开放阅读框的表达或用干扰RNA、反义RNA或其类似物废除编码一种或更多种Pmtp的RNA的翻译。宿主细胞进一步包括任何一种被修饰用于产生特定N-聚糖结构的前面提及的宿主细胞。
Pmtp抑制剂包括但不限于苯亚甲基噻唑烷二酮(benzylidene thiazolidinediones)。可用的苯亚甲基噻唑烷二酮的例子可以是5-[[3,4-双(苯甲氧基) 苯基]亚甲基]-4-氧代-2-硫代-3-噻唑烷羧酸;5-[[3-(l-苯乙氧基)-4-(2- 苯乙氧基)]苯基]亚甲基]-4-氧代-2-硫代-3-噻唑烷乙酸;和5-[[3-(l-苯基- 2-羟基)乙氧基)-4-(2-苯乙氧基)]苯基]亚甲基]-4-氧代-2-硫代-3-噻唑烷乙酸。
在一个实施方式中,至少一种内源的PMT基因的功能或表达被降低、破坏或删除。例如,在具体实施方式中,选自PMT1、PMT2、PMT3和PMT4 基因的至少一种内源的PMT基因的功能或表达被降低、破坏或删除;或宿主细胞在一种或更多种PMT抑制剂存在条件下培养。在进一步的实施方式中,宿主细胞包括一种或更多种PMT基因删除或破坏,以及宿主细胞在一种或更多种Pmtp抑制剂存在条件下培养。在这些实施方式的具体方面,宿主细胞也表达分泌的α-1,2-甘露糖苷酶。
PMT删除或破坏和/或Pmtp抑制剂通过降低O-糖基化占用,也就是说,通过降低被糖基化的糖蛋白上的O-糖基化位点的总数而控制O-糖基化。进一步增加细胞分泌的α-1,2-甘露糖苷酶通过降低糖蛋白上的O-聚糖的甘露糖链长度而控制O-糖基化。因此,将PMT删除或破坏和/或Pmtp抑制剂与分泌的α-1,2-甘露糖苷酶的表达相结合通过降低占有和链长度而控制O-糖基化。在特定环境下,PMT删除或破坏、Pmtp抑制剂和α-1,2-甘露糖苷酶的组合在经验上被确定,因为特定的异种糖蛋白(例如抗体)可被表达并以不同的效率转运经过高尔基体,因此可能需要PMT删除或破坏、Pmtp抑制剂和α-1,2-甘露糖苷酶的特定组合。在另一方面,编码一种或更多种内源甘露糖转移酶的基因删除。这种删除可以与提供分泌的α-1,2-甘露糖苷酶和/或PMT抑制剂相结合,或者可以取代提供分泌的α-1,2-甘露糖苷酶和/或PMT抑制剂。
因此,宿主细胞可以是任何被基因修饰以产生糖蛋白的宿主细胞,其中主要N-聚糖选自复合N-聚糖、杂合N-聚糖和高甘露糖N-聚糖,其中复合N-聚糖选自Man3GlcNAc2、GlcNAc(1-4)Man3GlcNAc2、Gal(1-4)GlcNAc(1-4)Man3GlcNAc2和NANA(1-4)Gal(1-4)Man3 GlcNAc2;杂合的N-聚糖选自Man5GlcNAc2、GlcNAcMan5GlcNAc2、 GalGlcNAcMan5GlcNAc2和NANAGalGlcNAcMan5GlcNAc2;高甘露糖N-聚糖选自Man6GlcNAc2、 Man7GlcNAc2、 Man8GlcNAc2和Man9GlcNAc2。N-聚糖结构的例子包括但不限于Man5GlcNAc2、 GlcNAcMan5GlcNAc2、 GlcNAcMan3GlcNAc2、 GlcNAc2Man3GlcNAc2、 GlcNAc3Man3GlcNAc2、 GlcNAc4Man3GlcNAc2、 GalGlcNAc2Man3GlcNAc2、 Gal2GlcNAc2Man3GlcNAc2、 Gal2GlcNAc3Man3GlcNAc2、 Gal2GlcNAc4Man3GlcNAc2、 Gal3GlcNAc3Man3GlcNAc2、Gal3GlcNAc4Man3GlcNAc2、Gal4GlcNAc4Man3GlcNAc2、 NANAGal2GlcNAc2Man3GlcNAc2、NANA2Gal2GlcNAc2Man3GlcNAc2、 NANA3Gal3GlcNAc3Man3GlcNAc2和NANA4Gal4GlcNAc4Man3GlcNAc2。
在随后的实施例中,糖工程化的巴斯德毕赤酵母菌株被修饰以去除Ste13p和Dap2p二肽基氨肽酶活性。通常,只要用于筛选的标记可被用于菌株,可以用此处所述的方法将Ste13p和/或Dap2p活性从巴斯德毕赤酵母中去除。另外,另一种营养缺陷型或显性标记(可通过其进行筛选)可以被替代。例如,可以用载体pGLY5018 (实施例2C)和作为筛选标记的诺尔丝菌素从商业可获得的菌株NRRL-Y11430将STE13删除。因为用于任一种下面所述(实施例2B)的DAP2敲除载体的标记与NRRL-Y11430是不相容的,可以用对应于引物SH806和SH807 (表1) 的斜体片段的引物(分别为SEQ ID NO:48 和SEQ ID NO:49)来从pAG32中扩增1654bp潮霉素标记而从pAG32中产生潮霉素标记的载体(Goldstein等人,Yeast 15(6):507-511,1999;Erratum:Yeast 15(12):1297,1999)。然后可以如实施例2C中所述将后一片段融合于DAP2 5'和DAP2 3'侧翼区以产生pGLY5019。用SfiI(New England BioLabs,Ipswich,MA)消化后,可以将载体转化进NRRL-Y11430或其ste13敲除衍生物中,在包含潮霉素的平板上筛选以分别产生单一dap2Δ或Δste13/dap2双敲除菌株。也提供了关于本领域技术人员如何能使用已经用此处描述的方法被修饰而去除DppIIIp二肽基氨肽酶活性的糖工程化的巴斯德毕赤酵母菌株的实施例。
实施例1
菌株、培养条件和试剂。
大肠杆菌(Escherichia coli)菌株TOP 10 (Invitrogen,Carlsbad,CA)或XL10-Gold(Stratagene,Santa Clara,CA)被用于重组DNA实验。限制酶和修饰酶从New England BioLabs,Ipswich,MA获得,如厂商指导使用。寡核苷酸从Integrated DNA Technologies,Coralville,LA获得。盐和缓冲试剂来自Sigma,St. Louis,MO。本发明所用的基本培养基包含1.4% 酵母氮基、2%葡萄糖、1.5%琼脂和4X 10-5%生物素和适量添加的氨基酸。YMD丰富培养基为1%酵母提取物、2%martone、2%葡萄糖和用于平板的1.5%琼脂。诺尔丝菌素从US Biologicals,Swampscott,MA (Catalogue number N5375-74)获得,加入YMD丰富培养基中至终浓度为100μg/ml。
实施例2
制备敲除载体
A. 制备ste13::URA5敲除载体
用PfuUltra™ DNA聚合酶(Stratagene,Santa Clara,CA)、来自巴斯德毕赤酵母菌株NRRL-Y11430的基因组DNA为模板扩增对应于STE13开放阅读框(SEQ ID NO:41 和42)的5'和3'侧翼区域的DNA片段。表1中所示的引物对SH774 (SEQ ID NO:13)和SH775 (SEQ ID NO:14)和SH776 (SEQ ID NO:15)和SH777(SEQ ID NO:16)分别用于扩增STE13 5'和3'的771bp和949bp片段。与ExTaq™ (TaKaRa,Bio.Inc.,Japan)在72℃孵育10分钟后,将扩增的片段克隆进pCR2.1 (Invitrogen,Carlsbad,CA)并转化进TOP 10感受态细胞。DNA测序验证了STE13 5'和STE13 3' 侧翼区是正确的,获得的载体被分别命名为pGLY4511和pGLY4512。
用EcoRI从pGLY4511中消化出763bp STE13 5'侧翼区域片段(图10A的下划线区域表示,SEQ ID NO:50)并亚克隆进与pJN396(Nett and Gerngross, Yeast, 20, 1279-1290, 2003)相似的预先用同样的限制性酶消化并用小牛肠碱性磷酸酶(CIAP)处理的巴斯德毕赤酵母URA5-blaster载体pGLY13b。URA5-blaster载体具有pUC19载体骨架,包含侧翼为LacZ正向重复以帮助通过在5-氟乳清酸(5- fluoroorotic acid)上反选择来恢复URA5标记的毕赤酵母URA5基因的功能性基因片段。将新连接的载体转化进XL 10 Gold感受态细胞并以限制性分析验证后,获得的载体被命名为pGLY4518。载体pGLY4512用HindIII消化,释放出编码STE13 3'侧翼区的940bp (图10B的下划线区域表示,SEQ ID NO:51)片段并亚克隆进先前用同样的酶消化并用CIAP处理的pGLY4518。将连接产物转化进XL 10 Gold感受态细胞,限制性分析后被命名为pGLY4520。这种最终的ste13::Ura5敲除载体在图1 A中图示。
B. 制备 dap2::URA5敲除载体
如上所述用表1中所示的引物组SH782 (SEQ ID NO:21)和SH783 (SEQ ID NO:22)和SH784 (SEQ ID NO:23)和SH785 (SEQ ID NO:24)从巴斯德毕赤酵母基因组DNA中分别扩增DAP2 5'和3'侧翼区,以产生1003bp和1142bp片段。克隆进pCR2.1并测序后,载体被命名为pGLY4513和pGLY4514,分别编码DAP2 5'和DAP2 3'区。进行与上面实施例2A中所述相似的方法后,995bp的DAP2 5'区(图11 A的下划线区表示,SEQ ID NO:52)被亚克隆进Ura5-blaster载体pGLY13b中的EcoRI位点,获得中间构建体pGLY4519。随后,1133bp的DAP2 3'区(图11 B的下划线区表示,SEQ ID NO:53)被亚克隆进pGLY4519的HindIII位点,获得dap2::URA5敲除载体pGLY4521,如图1 B所示。
C. 制备显性标记STE 13和DAP2敲除载体
使用PCR融合以制备STE 13和DAP2的共敲除载体。用表1中所示的引物对SH774 (SEQ ID NO:13)和SH801 (SEQ ID NO:29)和SH804 (SEQ ID NO:32)和SH777 (SEQ ID NO:16),利用PfuUltra™ DNA聚合酶从pGLY4520中扩增STE13 5'和3'片段。用引物SH802 (SEQ ID NO:30)和SH803 (SEQ ID NO:31)从pAG25 (Goldstein和McCusker,Yeast,15,1541-1553,1999)中扩增诺尔丝菌素(NATR)标记盒(SEQ ID NO:45),其包含在棉阿舒囊霉(Ashbya gossypii)转录延伸因子(TEF)启动子和终止子(图12的普通文字表示,分别在突出显示的开放阅读框的5'和3')的表达控制下的源自诺尔丝链霉菌(Streptomyces noursei)的诺尔丝菌素乙酰转移酶(图12的粗体文字表示,SEQ ID NO:54)的开放阅读框。PCR反应物在DNA琼脂糖凝胶上迁移,分离分别对应于STE 13 5'、STE 13 3'和Nat标记的779bp、958bp和1249bp片段。随后将每种20 ng混合并用PfuUltra™ DNA聚合酶和引物对SH774 (SEQ ID NO:13)和SH777 (SEQ ID NO:16)融合。与ExTaq™DNA聚合酶(TaKaRa,Bio.Inc.,Japan)在72℃孵育10分钟后,将扩增的(2896bp)片段克隆进pCR2.1并转化进TOP 10感受态细胞。DNA测序验证了ste13::NATR融合体是正确的,获得的载体被命名为pGLY5018。该载体如图1C所示。
类似地,用表1中所示的引物组SH782 (SEQ ID NO:21)和SH805 (SEQ ID NO:33)、SH808 (SEQ ID NO:36)和SH785 (SEQ ID NO:24)以及SH806 (SEQ ID NO:34)和SH807 (SEQ ID NO:35)从pGLY4521和pAG25中扩增对应于DAP2 5'、DAP2 3'和NATR标记的1011 bp、1151bp和1248bp片段。分离后,用每种片段20 ng和引物对SH782 (SEQ ID NO:21)和SH785 (SEQ ID NO:24)产生3321bp片段,克隆进pCR2.1,测序,命名为pGLY5019。该载体如图1D中图示。
实施例3
制备STE 13和DAP2敲除菌株
表达GS5.0聚糖(例如参见Bobrowicz等人,Glycobiology 14(9):757-766,2004;Hamilton等人,Science,313 (5792):14411-1443,2006);美国公开的申请No. 20060040353)的巴斯德毕赤酵母营养缺陷型糖工程化细胞系YGLY7406[Δock1、Δpno1、Δmnn4B、Δbmt2、Δura5,克鲁氏乳酸酵母和小鼠UDP-GlcNAc转运蛋白,小鼠α-1,2-MnsI、智人 β-1,2,-GlcNAc转移酶I、褐鼠(R. norvegicus )β-l,2-GlcNAc转移酶II、黑腹果蝇MnsII、粟酒裂殖酵母半乳糖表异构酶、黑腹果蝇UDP-半乳糖基转运蛋白和智人β-1,4-半乳糖基转移酶]被用作所有操作的起始菌株。
从图7 (A-C)可见这种菌株和随后的菌株是如何产生的流程图。GS5.0菌株可以产生具有在一个或两个末端的非还原末端上终止于β-1,4半乳糖残基的双触角非岩藻糖化的N-连接聚糖的糖蛋白(Bobrowicz等人,Glycobiology.14(9):757-766,2004;Hamilton等人,Science,313 (5792):14411-1443,2006)。菌株YGLY7406表达融合至IgGl的Fc结构域的全长人肿瘤坏死因子受体II(TNFRII-Fc),其将被用作二肽基肽酶活性的报告蛋白。
对于转化,用限制性酶SfiI(New England Biolabs,Ipswich,MA)消化20μg载体pGLY4520和pGLY4521以释放4091bp STE13::Ura5敲除片段或4516bp DAP2::URA5敲除片段,其用电穿孔发转化进YGLY7406以分别删除STE13或DAP2,然后在ura阴性基础平板上筛选。用表2中所示的5'、3'和敲除引物组验证每个基因的成功敲除。ste13Δ和dap2Δ敲除菌株分别被命名为YGLY8084和YGLY8090。随后,通过用先前用SfiI消化以释放3290 bp DAP2::Nat敲除片段的pGLY5019转化ste13Δ敲除菌株YGLY8084而产生Δste13/dap2双敲除菌株。将转化体涂布于100 μg/ml Nat YMD平板上,用用表2中所示的5'、3'和敲除引物组验证成功的双敲除。代表性的双敲除菌株命名为YGLY8096。尽管该菌株通过首先敲除STE13随后敲除DAP2而产生,我们在实验显示了如果首先敲除DAP2基因随后再敲除STE13基因可以获得具有同样期望表型的菌株。为了获得这种菌株,用SfiI消化pGLY5018,可以将产生的2865bp的 ste13::NATR敲除片段转化进其中DAP2基因已经被敲除的菌株如YGLY8090。
实施例4
报告蛋白的产生、分离和分析
在200ml缓冲的甘油复合物培养基(BMGY)(包含1 %酵母提取物、2%蛋白胨、100mM磷酸钾缓冲液、pH 6.0、1.34%酵母氮基、0.00004%生物素和作为生长培养基的1%甘油)中26℃进行蛋白纯化72小时。在20 ml缓冲的甲醇复合物培养基(BMMY)(BMGY中含1.5%甲醇而不是甘油)进行诱导48小时。
表达后,通过2000 rpm离心15分钟去除细胞。用GE Healthcare (Chalfont St. Giles,UK,Cat #17-1281-01)的Streamliner蛋白A树脂以亲和色谱法从上清中捕获TNFRII-Fc融合蛋白。无细胞的上清培养基加入至Streamliner蛋白A柱(XK 16/20 1.6cm x 10.0 cm),以5.0 ml/min的流速用3倍柱体积的20 mM 25 Tris-HCl pH 7.0预平衡。
以3倍柱体积的相同缓冲液洗柱,以7倍柱体积的40 mM pH 3.5柠檬酸钠洗脱TNFRII-Fc融合蛋白。立刻用1M Tris- HCl pH 8.0中和洗脱的融合蛋白。CHT® 羟磷石灰I型40 μm树脂(Bio-Rad Laboratories,Hercules,CA,Cat #157-0040)用作第二个纯化步骤。以3倍柱体积的5 mM pH 6.5磷酸钠平衡羟磷灰石柱,将Streamliner蛋白A纯化的TNFRII-Fc融合蛋白缓冲液更换为平衡缓冲液并上样于柱中。上样后,以3倍柱体积的平衡缓冲液洗柱,以20倍柱体积0-1000 mM氯化钠范围的梯度进行洗脱。TNFRII-Fc融合蛋白在约550-650 mM氯化钠时洗脱。用0.2μm的聚醚砜(PES)薄膜滤器无菌过滤集合的TNFRII-Fc融合蛋白并储存于4℃。
将两种柱纯化的TNFRII-Fc融合蛋白组分进行SDS-PAGE (4-20% Tris-HCl凝胶,Bio-Rad Laboratories,Hercules,CA,Cat.#161-1123),在55伏30分钟转移至聚偏氟乙烯(PVDF)膜上(ProBlott™ Membranes,Applied Biosystems,Foster City,CA,Cat # 400994),用ProBlott染料(Applied Biosystems,Foster City,CA)染色。将对应于TNFRII-Fc融合蛋白的条带从PVDF膜上切出并送至Tufts Core Facility,Boston,MA进行N-末端测序。
以类似的方式进行全长重组粒细胞集落刺激因子(GCSF)蛋白的表达。然而,与上面用来表达TNFRII-Fc的GS5.0宿主细胞不同,用于表达GCSF的宿主细胞是巴斯德毕赤酵母GS2.0宿主细胞,其中STE13和DAP2基因已经根据实施例3中所述的方法被破坏了。GS2.0宿主细胞是已经被基因工程化以产生包含Man5GlcNAc2 N-聚糖的糖蛋白的宿主细胞。这些菌株不能产生具有半乳糖末端化的N-聚糖的糖蛋白。这些菌株的例子已经在Nett和Gemgross,Yeast 20:1279 (2003);Choi等人,Proc. Natl. Acad. Sci. USA 100:5022 (2003);以及Hamilton等人,Science 301:1244 (2003)中被公开了。图6显示,当STE13和DAP2基因如上述为了表达TNFRII-Fc的GS5.0菌株被破坏时,这些宿主细胞能够产生完整的GCSF(将表明STE13/DAP2菌株中产生的GCSF的第27-29道与表明ste13/dap2敲除菌株中产生的GCSF的第32-34道进行比较)。
实施例5
PpDppIIIp的删除
相似地,上述实施例中用于去除PpSte13p和PpDap2p的方法可以用于去除PpDppIIIp。一种这样的方法可以是以与实施例2中对于PpSTE13 and PpDAP2提供的相似的方法设计敲除载体。
可设计引物用于扩增PpDPPIII基因的5'和3'侧翼区(图13,SEQ ID NO:54),对于基因组序列的重要区域,例如,对于功能性PpDppIIIp活性所需的区域被剔除。可以通过将这些侧翼区域和选择性标记结合而去除PpDppIIIp活性。结合相容的筛选标记,PpDppIIIp活性可以单独或与PpSte13p和/或PpDap2活性的去除相结合而去除。其中PpSte13p、PpDap2p和PpDppIIIp活性已经被去除的菌株可以产生缺乏任何潜在二肽基氨肽酶活性的菌株。
本发明不被实施例中公开的特定实施方式限制的,所述特定实施方式意图例示本发明的一些方面,任何功能上等同的实施方式都在本发明的范围内。事实上,除此处显示和描述的之外,本发明的各种改变对于本领域技术人员而言是显而易见的,也意图落在所附权利要求的范围之内。
序列表
<110> Stephen Hamilton
Terrance Stadheim
<120> 在缺乏二肽基氨肽酶活性的巴斯德毕赤酵母中生产治疗性蛋白的方法
<130> GFI-MIS-00001
<160> 54
<170> FastSEQ for Windows Version 4.0
<210> 1
<211> 7
<212> PRT
<213> 合成的
<400> 1
Leu Pro Ala Gln Val Ala Phe
1 5
<210> 2
<211> 5
<212> PRT
<213> 合成的
<400> 2
Ala Gln Val Ala Phe
1 5
<210> 3
<211> 466
<212> PRT
<213> 合成的
<400> 3
Leu Pro Ala Gln Val Ala Phe Thr Pro Tyr Ala Pro Glu Pro Gly Ser
1 5 10 15
Thr Cys Arg Leu Arg Glu Tyr Tyr Asp Gln Thr Ala Gln Met Cys Cys
20 25 30
Ser Lys Cys Ser Pro Gly Gln His Ala Lys Val Phe Cys Thr Lys Thr
35 40 45
Ser Asp Thr Val Cys Asp Ser Cys Glu Asp Ser Thr Tyr Thr Gln Leu
50 55 60
Trp Asn Trp Val Pro Glu Cys Leu Ser Cys Gly Ser Arg Cys Ser Ser
65 70 75 80
Asp Gln Val Glu Thr Gln Ala Cys Thr Arg Glu Gln Asn Arg Ile Cys
85 90 95
Thr Cys Arg Pro Gly Trp Tyr Cys Ala Leu Ser Lys Gln Glu Gly Cys
100 105 110
Arg Leu Cys Ala Pro Leu Arg Lys Cys Arg Pro Gly Phe Gly Val Ala
115 120 125
Arg Pro Gly Thr Glu Thr Ser Asp Val Val Cys Lys Pro Cys Ala Pro
130 135 140
Gly Thr Phe Ser Asn Thr Thr Ser Ser Thr Asp Ile Cys Arg Pro His
145 150 155 160
Gln Ile Cys Asn Val Val Ala Ile Pro Gly Asn Ala Ser Met Asp Ala
165 170 175
Val Cys Thr Ser Thr Ser Pro Thr Arg Ser Met Ala Pro Gly Ala Val
180 185 190
His Leu Pro Gln Pro Val Ser Thr Arg Ser Gln His Thr Gln Pro Thr
195 200 205
Pro Glu Pro Ser Thr Ala Pro Ser Thr Ser Phe Leu Leu Pro Met Gly
210 215 220
Pro Ser Pro Pro Ala Glu Gly Ser Thr Gly Asp Glu Pro Lys Ser Cys
225 230 235 240
Asp Lys Thr His Thr Cys Pro Pro Cys Pro Ala Pro Glu Leu Leu Gly
245 250 255
Gly Pro Ser Val Phe Leu Phe Pro Pro Lys Pro Lys Asp Thr Leu Met
260 265 270
Ile Ser Arg Thr Pro Glu Val Thr Cys Val Val Val Asp Val Ser His
275 280 285
Glu Asp Pro Val Lys Phe Asn Trp Tyr Val Asp Gly Val Glu Val His
290 295 300
Asn Ala Lys Thr Lys Pro Arg Glu Glu Gln Tyr Asn Ser Thr Tyr Arg
305 310 315 320
Val Val Ser Val Leu Thr Val Leu His Gln Asp Trp Leu Asn Gly Lys
325 330 335
Glu Tyr Lys Cys Lys Val Ser Asn Lys Ala Leu Pro Ala Pro Ile Glu
340 345 350
Lys Thr Ile Ser Lys Ala Lys Gly Gln Pro Arg Glu Pro Gln Val Tyr
355 360 365
Thr Leu Pro Pro Ser Arg Glu Glu Met Thr Lys Asn Gln Val Ser Leu
370 375 380
Thr Cys Leu Val Lys Gly Phe Tyr Pro Ser Asp Ile Ala Val Glu Trp
385 390 395 400
Glu Ser Asn Gly Gln Pro Glu Asn Asn Tyr Lys Thr Thr Pro Pro Val
405 410 415
Leu Asp Ser Asp Gly Ser Phe Phe Leu Tyr Ser Lys Leu Thr Val Asp
420 425 430
Lys Ser Arg Trp Gln Gln Gly Asn Val Phe Ser Cys Ser Val Met His
435 440 445
Glu Ala Leu His Asn His Tyr Thr Gln Lys Ser Leu Ser Leu Ser Pro
450 455 460
Gly Lys
465
<210> 4
<211> 7
<212> PRT
<213> 合成的
<400> 4
Thr Pro Leu Gly Pro Ala Ser
1 5
<210> 5
<211> 5
<212> PRT
<213> 合成的
<400> 5
Leu Gly Pro Ala Ser
1 5
<210> 6
<211> 173
<212> PRT
<213> 合成的
<400> 6
Thr Pro Leu Gly Pro Ala Ser Ser Leu Pro Gln Ser Phe Leu Leu Cys
1 5 10 15
Leu Glu Gln Val Arg Lys Ile Gln Gly Asp Gly Ala Ala Leu Gln Glu
20 25 30
Lys Leu Cys Ala Thr Tyr Lys Leu Cys His Pro Glu Glu Leu Val Leu
35 40 45
Leu Gly His Ser Leu Gly Ile Pro Trp Ala Pro Leu Ser Ser Cys Pro
50 55 60
Ser Gln Ala Leu Gln Leu Ala Gly Cys Leu Ser Gln Leu His Ser Gly
65 70 75 80
Leu Phe Leu Tyr Gln Gly Leu Leu Gln Ala Leu Glu Gly Ile Ser Pro
85 90 95
Glu Leu Gly Pro Thr Leu Asp Thr Leu Gln Leu Asp Val Ala Asp Phe
100 105 110
Ala Thr Thr Ile Trp Gln Gln Met Glu Glu Leu Gly Met Ala Pro Ala
115 120 125
Leu Gln Pro Thr Gln Gly Ala Met Pro Ala Phe Ala Ser Ala Phe Gln
130 135 140
Arg Arg Ala Gly Gly Val Leu Val Ala Ser His Leu Gln Ser Phe Leu
145 150 155 160
Glu Val Ser Tyr Arg Val Leu Arg His Leu Ala Gln Pro
165 170
<210> 7
<211> 31
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 7
ggctcgagga tctgtttagc ttgcctcgtc c 31
<210> 8
<211> 33
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 8
ggctcgaggg agctcgtttt cgacactgga tgg 33
<210> 9
<211> 26
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 9
catgcccctg agctgcgcac gtcaag 26
<210> 10
<211> 26
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 10
cagaaagtaa tatcatgcgt caatcg 26
<210> 11
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 11
ggcgattacc gttgatgttg aagtggcgag 30
<210> 12
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 12
catccagagg cacttcaccg cttgccagcg 30
<210> 13
<211> 34
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 13
ggaattcggc cttgggggcc tccaggactt gctg 34
<210> 14
<211> 37
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 14
ggaattcctc gagctgtttg aatctggaac gtactcg 37
<210> 15
<211> 37
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 15
gaagcttctc gagctactgg gaaccacgag acatcac 37
<210> 16
<211> 38
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 16
gcaagcttgg cccattaggc ccacctacaa tcattacc 38
<210> 17
<211> 27
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 17
caaggcacat taaaagtccg ccaaagg 27
<210> 18
<211> 29
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 18
gtggcccttg tattgataga agtattcag 29
<210> 19
<211> 27
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 19
cacgtctatc gttgaaccaa aacagac 27
<210> 20
<211> 26
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 20
gtaaccaatg gtatctccaa cgacag 26
<210> 21
<211> 37
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 21
ggaattcggc cacctgggcc tgttgctgct ggtactg 37
<210> 22
<211> 36
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 22
cgaattcctc gagcgttgta agtgattgta gactcg 36
<210> 23
<211> 33
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 23
gaagcttctc gagggcagca aagccttacg ttg 33
<210> 24
<211> 37
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 24
gcaagcttgg cctaggtggc cgacccattt ttagagg 37
<210> 25
<211> 28
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 25
cactttcatc ctgaggatct tggtcctg 28
<210> 26
<211> 28
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 26
catataccaa agcaattgat atctggtc 28
<210> 27
<211> 28
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 27
cggataagag acataattgg cgccattc 28
<210> 28
<211> 28
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 28
ctttctattg aggatttctt ggttgctg 28
<210> 29
<211> 44
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 29
cgccatccag tgtcgaaaac gctgtttgaa tctggaacgt actc 44
<210> 30
<211> 44
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 30
gagtacgttc cagattcaaa cagcgttttc gacactggat ggcg 44
<210> 31
<211> 46
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 31
gtgatgtctc gtggttccca gtagtgttta gcttgcctcg tccccg 46
<210> 32
<211> 46
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 32
cggggacgag gcaagctaaa cactactggg aaccacgaga catcac 46
<210> 33
<211> 47
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 33
cgccatccag tgtcgaaaac gcgttgtaag tgattgtaga ctcgttg 47
<210> 34
<211> 47
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 34
caacgagtct acaatcactt acaacgcgtt ttcgacactg gatggcg 47
<210> 35
<211> 42
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 35
caacgtaagg ctttgctgcc tgtttagctt gcctcgtccc cg 42
<210> 36
<211> 42
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 36
cggggacgag gcaagctaaa caggcagcaa agccttacgt tg 42
<210> 37
<211> 4460
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 37
gtgaagtaga tagctttgtt gttggagtga gcgatggcaa taccaaactc gttacgttta 60
gcaaactctt tcacaaactg gcgcaattca gtaacgtcat cgaattcctt ctcttggatc 120
catggcgtca caaaaactgc ttcatcgtcc tcaggtagaa ttggaatatc cttaggtcct 180
cctggggtgg caggaataac atagtgttgc acgtgactgg gaactctcat agtgtttaca 240
tggctatgac cgtgaaggac atgctgatgg cttgccgcag tcggttgatg gtgatactcg 300
atgtttaagt gtgacaaatc gttactggca gctgctgtgt acttcggtat aagatgctgg 360
atctttgcct cggcactttc atcctgagga tcttggtcct gaccgggctg gtggtggtca 420
atgtgaacct gggcctgttg ctgctggtac tgctgttgga actgttggta ttgttgctga 480
tctaaggccg cctgttccac accgtgtgta tcgaatgctt gggcaaaatc atcgcctgcc 540
ggaggcccca ctaccgcttg ttcctcctgc tcttgtttgt tttgctcatt gatgatatcg 600
gcgtcaatga attgatcctc aatcgtgtgg tggtggtgtc gtgatcctct tctttcttga 660
gtgccttatc catattccta tcttagtgta ccaataattt tgttaaacac acgctgttgt 720
tatgaaaagt cgtcaaaagg ttaaaaattc tacttggtgt gtgtcagaga aagtagtgca 780
gacccccagt ttgttgacta gttgagaagg cggctcacta ttgcgcgaat agcatgagaa 840
atttgcaaac atctggcaaa gtggtcaata cctgccaacc tgccaatctt cgcgacggag 900
gctgttaagc gggttgggtt cccaaagtga atggatatta cgggcaggaa aaacagcccc 960
ttccacacta gtctttgcta ctgacatctt ccctctcatg tatcccgaac acaagtatcg 1020
ggagtatcaa cggagggtgc ccttatggca gtactccctg ttggtgattg tactgctata 1080
cgggtctcat ttgcttatca gcaccatcaa cttgatacac tataaccaca aaaattatca 1140
tgcacaccca gtcaatagtg gtatcgttct taatgagttt gctgatgacg attcattctc 1200
tttgaatggc actctgaact tggagaactg gagaaatggt accttttccc ctaaatttca 1260
ttccattcag tggaccgaaa taggtcagga agatgaccag ggatattaca ttctctcttc 1320
caattcctct tacatagtaa agtctttatc cgacccagac tttgaatctg ttctattcaa 1380
cgagtctaca atcacttaca acggtgaaga acatcatgtg gaagacgtca tagtgtccaa 1440
taatcttcaa tatgcattgg tagttacgga taagagacat aattggcgcc attctttttt 1500
tgcgaattac tggctgtata aagtcaacaa tcctgaacag gttcagcctt tgtttgatac 1560
agatctatcg ttgaatggtc ttattagcct tgtccattgg tctccggatt cttcccaagt 1620
tgcatttgtg ttggaaaata acatatattt gaagcatctt aacaactttt ctgattcaag 1680
gattgatcaa ctaacttatg atggaggcga aaacatattt tatggcaaac cagattgggt 1740
ttatgaagaa gaagtgtttg aaagcaactc tgctatgtgg tggtctccaa atggaaagtt 1800
tttatcaata ttgcgaacta atgacaccca agtgcctgtc tatcctattc catattttgt 1860
tcagtctgat gctgaaacag ctatcgatga ataccctctt ctgaaacaca taaaataccc 1920
aaaggcagga tttcccaatc cagttgttga tgtgattgta tacgatgttc aacgccagca 1980
catatctagg ttacctgctg gtgatccttt ctacaacgat gagaacatta ccaatgagga 2040
cagacttatc actgagatca tctgggttgg tgattcacgg ttcctgacca agattacgaa 2100
cagggaaagt gacttgttag cattttatct ggtagacgct gaggctaaca atagtaagct 2160
ggtaagattc caagatgcta agagcaccaa gtcttggttt gaaattgaac acaacacatt 2220
gtatattcct aaggatactt cagtgggaag ggcacaagat ggctacatcg acaccataga 2280
tgttaacggc tacaaccatt tagcctattt ctcaccacca gacaacccag accccaaggt 2340
cattcttacg cgtggtgatt gggaagtcgt tgacagtcca tctgcatttg acttcaaaag 2400
aaatttggtt tactttacag caaccaagaa atcctcaata gaaagacatg tttattgtgt 2460
tgggatagac gggaaacaat tcaacaatgt aactgatgtt tcatcagatg gatactacag 2520
tacaagcttt tcccctggag caagatatgt attgctatca caccaaggtc cccgtgtacc 2580
ttatcaaaag atgatagatc ttgtcaaagg caccgaagaa ataatcgaat ctaacgaaga 2640
tttgaaagac tccgttgctt tatttgattt acctgatgtc aagtacggcg aaatcgagct 2700
tgaaaaaggt gtcaagtcaa actacgttga gatcaggcct aagaacttcg atgaaagcaa 2760
aaagtatccg gttttatttt ttgtgtatgg ggggccaggt tcccaattgg taacaaagac 2820
attttctaag agtttccagc atgttgtatc ctctgagctt gacgtcattg ttgtcacggt 2880
ggatggaaga gggactggat ttaaaggtag aaaatataga tccatagtgc gggacaactt 2940
gggtcattat gaatccctgg accaaatcac ggcaggaaaa atttgggcag caaagcctta 3000
cgttgatgag aatagactgg ccatttgggg ttggtcttat ggaggttaca tgacgctaaa 3060
ggttttagaa caggataaag gtgaaacatt caaatatgga atgtctgttg cccctgtgac 3120
gaattggaaa ttctatgatt ctatctacac agaaagatac atgcacactc ctcaggacaa 3180
tccaaactat tataattcgt caatccatga gattgataat ttgaagggag tgaagaggtt 3240
cttgctaatg cacggaactg gtgacgacaa tgttcacttc caaaatacac tcaaagttct 3300
agatttattt gatttacatg gtcttgaaaa ctatgatatc cacgtgttcc ctgatagtga 3360
tcacagtatt agatatcaca acggtaatgt tatagtgtat gataagctat tccattggat 3420
taggcgtgca ttcaaggctg gcaaataaat aggtgcaaaa atattattag actttttttt 3480
tcgttcgcaa gttattactg tgtaccatac cgatccaatc cgtattgtaa ttcatgttct 3540
agatccaaaa tttgggactc taattcatga ggtctaggaa gatgatcatc tctatagttt 3600
tcagcggggg gctcgatttg cggttggtca aagctaacat caaaatgttt gtcaggttca 3660
gtgaatggta actgctgctc ttgaattggt cgtctgacaa attctctaag tgatagcact 3720
tcatctacaa tcatttgctt catcgtttct atatcgtcca cgacctcaaa cgagaaatcg 3780
aatttggaag aacagacggg ctcatcgtta ggatcatgcc aaaccttgag atatggatgc 3840
tctaaagcct cagtaactgt aattctgtga gtgggatcta ccgtgagcat tcgatccagt 3900
aagtctatcg cttcagggtt ggcaccggga aataactggc tgaatgggat cttgggcatg 3960
aatggcaggg agcgaacata atcctgggca cgctctgatc tgatagactg aagtgtctct 4020
tccgaaacag tacccagcgt actcaaaatc aagttcaatt gatccacata gtctcttcct 4080
ctaaaaatgg gtgggccacc taagagttcg gccaatatac atccaactga ccagatatca 4140
attgctttgg tatatgtctg aaaactaaga attatctccg gtgcccgata ccacctggta 4200
gcaacatatt ccgtaagaaa gccagcattc ttctctgcat cactactata acctcttgca 4260
agtccaaagt cacaaatctt aagttcgcaa tctgagttca ccaatagatt gacgggttta 4320
agatctctat gcagcacatc tgctgaatgg atatacttta agcccccgag aatttggtag 4380
ataaagctct gatagtggct gtcagtcaaa ggttgttttg atttgattat atgatgcaag 4440
tcacattcca tcaattcttc 4460
<210> 38
<211> 816
<212> PRT
<213> 合成的
<400> 38
Met Tyr Pro Glu His Lys Tyr Arg Glu Tyr Gln Arg Arg Val Pro Leu
1 5 10 15
Trp Gln Tyr Ser Leu Leu Val Ile Val Leu Leu Tyr Gly Ser His Leu
20 25 30
Leu Ile Ser Thr Ile Asn Leu Ile His Tyr Asn His Lys Asn Tyr His
35 40 45
Ala His Pro Val Asn Ser Gly Ile Val Leu Asn Glu Phe Ala Asp Asp
50 55 60
Asp Ser Phe Ser Leu Asn Gly Thr Leu Asn Leu Glu Asn Trp Arg Asn
65 70 75 80
Gly Thr Phe Ser Pro Lys Phe His Ser Ile Gln Trp Thr Glu Ile Gly
85 90 95
Gln Glu Asp Asp Gln Gly Tyr Tyr Ile Leu Ser Ser Asn Ser Ser Tyr
100 105 110
Ile Val Lys Ser Leu Ser Asp Pro Asp Phe Glu Ser Val Leu Phe Asn
115 120 125
Glu Ser Thr Ile Thr Tyr Asn Gly Glu Glu His His Val Glu Asp Val
130 135 140
Ile Val Ser Asn Asn Leu Gln Tyr Ala Leu Val Val Thr Asp Lys Arg
145 150 155 160
His Asn Trp Arg His Ser Phe Phe Ala Asn Tyr Trp Leu Tyr Lys Val
165 170 175
Asn Asn Pro Glu Gln Val Gln Pro Leu Phe Asp Thr Asp Leu Ser Leu
180 185 190
Asn Gly Leu Ile Ser Leu Val His Trp Ser Pro Asp Ser Ser Gln Val
195 200 205
Ala Phe Val Leu Glu Asn Asn Ile Tyr Leu Lys His Leu Asn Asn Phe
210 215 220
Ser Asp Ser Arg Ile Asp Gln Leu Thr Tyr Asp Gly Gly Glu Asn Ile
225 230 235 240
Phe Tyr Gly Lys Pro Asp Trp Val Tyr Glu Glu Glu Val Phe Glu Ser
245 250 255
Asn Ser Ala Met Trp Trp Ser Pro Asn Gly Lys Phe Leu Ser Ile Leu
260 265 270
Arg Thr Asn Asp Thr Gln Val Pro Val Tyr Pro Ile Pro Tyr Phe Val
275 280 285
Gln Ser Asp Ala Glu Thr Ala Ile Asp Glu Tyr Pro Leu Leu Lys His
290 295 300
Ile Lys Tyr Pro Lys Ala Gly Phe Pro Asn Pro Val Val Asp Val Ile
305 310 315 320
Val Tyr Asp Val Gln Arg Gln His Ile Ser Arg Leu Pro Ala Gly Asp
325 330 335
Pro Phe Tyr Asn Asp Glu Asn Ile Thr Asn Glu Asp Arg Leu Ile Thr
340 345 350
Glu Ile Ile Trp Val Gly Asp Ser Arg Phe Leu Thr Lys Ile Thr Asn
355 360 365
Arg Glu Ser Asp Leu Leu Ala Phe Tyr Leu Val Asp Ala Glu Ala Asn
370 375 380
Asn Ser Lys Leu Val Arg Phe Gln Asp Ala Lys Ser Thr Lys Ser Trp
385 390 395 400
Phe Glu Ile Glu His Asn Thr Leu Tyr Ile Pro Lys Asp Thr Ser Val
405 410 415
Gly Arg Ala Gln Asp Gly Tyr Ile Asp Thr Ile Asp Val Asn Gly Tyr
420 425 430
Asn His Leu Ala Tyr Phe Ser Pro Pro Asp Asn Pro Asp Pro Lys Val
435 440 445
Ile Leu Thr Arg Gly Asp Trp Glu Val Val Asp Ser Pro Ser Ala Phe
450 455 460
Asp Phe Lys Arg Asn Leu Val Tyr Phe Thr Ala Thr Lys Lys Ser Ser
465 470 475 480
Ile Glu Arg His Val Tyr Cys Val Gly Ile Asp Gly Lys Gln Phe Asn
485 490 495
Asn Val Thr Asp Val Ser Ser Asp Gly Tyr Tyr Ser Thr Ser Phe Ser
500 505 510
Pro Gly Ala Arg Tyr Val Leu Leu Ser His Gln Gly Pro Arg Val Pro
515 520 525
Tyr Gln Lys Met Ile Asp Leu Val Lys Gly Thr Glu Glu Ile Ile Glu
530 535 540
Ser Asn Glu Asp Leu Lys Asp Ser Val Ala Leu Phe Asp Leu Pro Asp
545 550 555 560
Val Lys Tyr Gly Glu Ile Glu Leu Glu Lys Gly Val Lys Ser Asn Tyr
565 570 575
Val Glu Ile Arg Pro Lys Asn Phe Asp Glu Ser Lys Lys Tyr Pro Val
580 585 590
Leu Phe Phe Val Tyr Gly Gly Pro Gly Ser Gln Leu Val Thr Lys Thr
595 600 605
Phe Ser Lys Ser Phe Gln His Val Val Ser Ser Glu Leu Asp Val Ile
610 615 620
Val Val Thr Val Asp Gly Arg Gly Thr Gly Phe Lys Gly Arg Lys Tyr
625 630 635 640
Arg Ser Ile Val Arg Asp Asn Leu Gly His Tyr Glu Ser Leu Asp Gln
645 650 655
Ile Thr Ala Gly Lys Ile Trp Ala Ala Lys Pro Tyr Val Asp Glu Asn
660 665 670
Arg Leu Ala Ile Trp Gly Trp Ser Tyr Gly Gly Tyr Met Thr Leu Lys
675 680 685
Val Leu Glu Gln Asp Lys Gly Glu Thr Phe Lys Tyr Gly Met Ser Val
690 695 700
Ala Pro Val Thr Asn Trp Lys Phe Tyr Asp Ser Ile Tyr Thr Glu Arg
705 710 715 720
Tyr Met His Thr Pro Gln Asp Asn Pro Asn Tyr Tyr Asn Ser Ser Ile
725 730 735
His Glu Ile Asp Asn Leu Lys Gly Val Lys Arg Phe Leu Leu Met His
740 745 750
Gly Thr Gly Asp Asp Asn Val His Phe Gln Asn Thr Leu Lys Val Leu
755 760 765
Asp Leu Phe Asp Leu His Gly Leu Glu Asn Tyr Asp Ile His Val Phe
770 775 780
Pro Asp Ser Asp His Ser Ile Arg Tyr His Asn Gly Asn Val Ile Val
785 790 795 800
Tyr Asp Lys Leu Phe His Trp Ile Arg Arg Ala Phe Lys Ala Gly Lys
805 810 815
<210> 39
<211> 4615
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 39
gacattgcta gttgcagtat tcaacgaatc atcagatatc aggctcaggt cattatatga 60
ggcctctgtc tctattttca gtagctcttt aggggatatt tgattaagaa aaccatccaa 120
aagtagggat tgcatgggcc ttgtggggtt ctaggtaaag aattagaaat tactcaccgc 180
gattctaggg ctcctagata gtgaatgaag aggcaggaca gaacttcaag aagaagagca 240
gaaagatgtt cgataggttc caaggaggtt taatctactt ttacagttgc tgtttagcat 300
tactcaaagt tccgtgtcgg tggagggtca actaattgta ttatctagta cgttaccaag 360
cactaactgt tttgccaaac gttaccagtt ttctctctaa cgacggatca gtatatacaa 420
gttatcttgc ttcaaagaag caagggactt gtagccaccc tcaaggcaca ttaaaagtcc 480
gccaaaggaa acgtacactt ttattttatc ctcatctcct tcctcaaact tataaacagt 540
cccaaacata acgtaatcgt agtcgtcagc caaagatttg tcagttggct ttgggggcct 600
ccaggacttg ctgaaatttg ctgactcatc ttcgccatcc aaggataatg agttagctaa 660
tgtgacagtt aatgagtcgt cttgactaac ggggaacatt tcattattta tatccagagt 720
caatttgata gcagagtttg tggttgaaat acctatgatt cgggagactt tgttgtaacg 780
accattatcc acagtttgga ccgtgaaaat gtcatcgaag agagcagacg acatattatc 840
tattgtggta agtgatagtt ggaagtccga ctaaggcatg aaaatgagaa gactgaaaat 900
ttaaagtttt tgaaaacact aatcgggtaa taacttggaa attacgttta cgtgccttta 960
gctcttgtcc ttacccctga taatctatcc atttcccgag agacaatgac atctcggaca 1020
gctgagaacc cgttcgatat agagcttcaa gagaatctaa gtccacgttc ttccaattcg 1080
tccatattgg aaaacattaa tgagtatgct agaagacatc gcaatgattc gctttcccaa 1140
gaatgtgata atgaagatga gaacgaaaat ctcaattata ctgataactt ggccaagttt 1200
tcaaagtctg gagtatcaag aaagagctgt atgctaatat ttggtatttg ctttgttatc 1260
tggctgtttc tctttgcctt gtatgcgagg gacaatcgat tttccaattt gaacgagtac 1320
gttccagatt caaacagcca cggaactgct tctgccacca cgtctatcgt tgaaccaaaa 1380
cagactgaat tacctgaaag caaagattct aacactgatt atcaaaaagg agctaaattg 1440
agccttagcg gctggagatc aggtctgtac aatgtctatc caaaactgat ctctcgtggt 1500
gaagatgaca tatactatga acacagtttt catcgtatag atgaaaagag gattacagac 1560
tctcaacacg gtcgaactgt atttaactat gagaaaattg aagtaaatgg aatcacgtat 1620
acagtgtcat ttgtcaccat ttctccttac gattctgcca aattcttagt cgcatgcgac 1680
tatgaaaaac actggagaca ttctacgttt gcaaaatatt tcatatatga taaggaaagc 1740
gaccaagagg atagctttgt acctgtctac gatgacaagg cattgagctt cgttgaatgg 1800
tcgccctcag gtgatcatgt agtattcgtt tttgaaaaca atgtatacct caaacaactc 1860
tcaactttag aggttaagca ggtaactttt gatggtgatg agagtattta caatggtaag 1920
cctgactgga tctatgaaga ggaagtttta agtagcgaca gagccatatg gtggaatgac 1980
gatggatcgt actttacgtt cttgagactt gatgacagca atgtcccaac cttcaacttg 2040
cagcattttt ttgaagaaac aggctctgtg tcgaaatatc cggtcattga tcgattgaaa 2100
tatccaaaac caggatttga caaccccctg gtttctttgt ttagttacaa cgttgccaag 2160
caaaagttag aaaagctaaa tattggagca gcagtttctt tgggagaaga cttcgtgctt 2220
tacagtttaa aatggataga caattctttt ttcttgtcga agttcacaga ccgcacttcg 2280
aaaaaaatgg aagttactct agtggacatt gaagccaatt ctgcttcggt ggtgagaaaa 2340
catgatgcaa ctgagtataa cggctggttc actggagaat tttctgttta tcctgtcgtt 2400
ggagatacca ttggttacat tgatgtaatc tattatgagg actacgatca cttggcttat 2460
tatccagact gcacatccga taagtatatt gtgcttacag atggttcatg gaatgttgtt 2520
ggacctggag ttttagaagt gcttgaagat agagtctact ttatcggcac caaagaatca 2580
tcaatggaac atcacttgta ttatacatca ttaacgggac ccaaggttaa ggctgttatg 2640
gatatcaaag aacctgggta ctttgatgta aacattaagg gaaaatatgc tttactatct 2700
tacagaggcc ccaaactccc ataccagaaa tttattgatc tttctgaccc tagtacaaca 2760
agtcttgatg acattttatc gtctaataga ggaattgtcg aggttagttt agcaactcac 2820
agcgttcctg tttctaccta tactaatgta acacttgagg acggcgtcac actgaacatg 2880
attgaagtgt tgcctgccaa ttttaatcct agcaagaagt acccactgtt ggtcaacatt 2940
tatggtggac cgggctccca gaagttagat gtgcagttca acattgggtt tgagcatatt 3000
atttcttcgt cactggatgc aatagtgctt tacatagatc cgagaggtac tggaggtaaa 3060
agctgggctt ttaaatctta cgctacagag aaaataggct actgggaacc acgagacatc 3120
actgcagtag tttccaagtg gatttcagat cactcatttg tgaatcctga caaaactgcg 3180
atatgggggt ggtcttacgg tgggttcact acgcttaaga cattggaata tgattctgga 3240
gaggttttca aatatggtat ggctgttgct ccagtaacta attggctttt gtatgactcc 3300
atctacactg aaagatacat gaaccttcca aaggacaatg ttgaaggcta cagtgaacac 3360
agcgtcatta agaaggtttc caattttaag aatgtaaacc gattcttggt ttgtcacggg 3420
actactgatg ataacgtgca ttttcagaac acactaacct tactggacca gttcaatatt 3480
aatggtgttg tgaattacga tcttcaggtg tatcccgaca gtgaacatag cattgcccat 3540
cacaacgcaa ataaagtgat ctacgagagg ttattcaagt ggttagagcg ggcatttaac 3600
gatagatttt tgtaacattc cgtacttcat gccatactat atatcctgca aggtttccct 3660
ttcagacaca ataattgctt tgcaatttta cataccacca attggcaaaa ataatctctt 3720
cagtaagttg aatgcttttc aagccagcac cgtgagaaat tgctacagcg cgcattctaa 3780
catcacttta aaattccctc gccggtgctc actggagttt ccaaccctta gcttatcaaa 3840
atcgggtgat aactctgagt tttttttttc acttctattc ctaaaccttc gcccaatgct 3900
accacctcca atcaacatcc cgaaatggat agaagagaat ggacatctct tgcaacctcc 3960
ggttaataat tactgtctcc acagaggagg atttacggta atgattgtag gtgggcctaa 4020
tgagagaacc gattatcatg ttaatcagac acctgaatac ttctatcaat acaagggcca 4080
catgtgtctt aaagtcgtgg atgatggtga atttaaggac attattatca atgaaggaga 4140
atcgtttttg ctaccaggta atacgccaca tagtccagtg aggtttgctg atactattgg 4200
cttagtggtt gaacaggatc gtcctcaggg actgaatgac cgtattagat ggtattgtct 4260
gaattgcaag gaaatagtgc atgaaactga gttttactgc tctgatttgg gaacgcaagt 4320
gaaggacgca atcgtttcct ttgaaacgga tttagagaaa aggacatgca aaaattgtgg 4380
aacactgaac tattccaggc caaaataaaa cttttacggt aatattacgt tatgatttat 4440
gcaattaatg agttaagtag ctttatattt ctttcttatt tgattagttt cagctcaaca 4500
gctgactatt gaaccatttt tctaggccct tctccctaat ctcaatgtgg ctaagactat 4560
ccaacttgat gatgacatta aagatcttga ggtaccgcag actggggaat ttgag 4615
<210> 40
<211> 869
<212> PRT
<213> 人工序列
<220>
<223> 合成的
<400> 40
Met Thr Ser Arg Thr Ala Glu Asn Pro Phe Asp Ile Glu Leu Gln Glu
1 5 10 15
Asn Leu Ser Pro Arg Ser Ser Asn Ser Ser Ile Leu Glu Asn Ile Asn
20 25 30
Glu Tyr Ala Arg Arg His Arg Asn Asp Ser Leu Ser Gln Glu Cys Asp
35 40 45
Asn Glu Asp Glu Asn Glu Asn Leu Asn Tyr Thr Asp Asn Leu Ala Lys
50 55 60
Phe Ser Lys Ser Gly Val Ser Arg Lys Ser Cys Met Leu Ile Phe Gly
65 70 75 80
Ile Cys Phe Val Ile Trp Leu Phe Leu Phe Ala Leu Tyr Ala Arg Asp
85 90 95
Asn Arg Phe Ser Asn Leu Asn Glu Tyr Val Pro Asp Ser Asn Ser His
100 105 110
Gly Thr Ala Ser Ala Thr Thr Ser Ile Val Glu Pro Lys Gln Thr Glu
115 120 125
Leu Pro Glu Ser Lys Asp Ser Asn Thr Asp Tyr Gln Lys Gly Ala Lys
130 135 140
Leu Ser Leu Ser Gly Trp Arg Ser Gly Leu Tyr Asn Val Tyr Pro Lys
145 150 155 160
Leu Ile Ser Arg Gly Glu Asp Asp Ile Tyr Tyr Glu His Ser Phe His
165 170 175
Arg Ile Asp Glu Lys Arg Ile Thr Asp Ser Gln His Gly Arg Thr Val
180 185 190
Phe Asn Tyr Glu Lys Ile Glu Val Asn Gly Ile Thr Tyr Thr Val Ser
195 200 205
Phe Val Thr Ile Ser Pro Tyr Asp Ser Ala Lys Phe Leu Val Ala Cys
210 215 220
Asp Tyr Glu Lys His Trp Arg His Ser Thr Phe Ala Lys Tyr Phe Ile
225 230 235 240
Tyr Asp Lys Glu Ser Asp Gln Glu Asp Ser Phe Val Pro Val Tyr Asp
245 250 255
Asp Lys Ala Leu Ser Phe Val Glu Trp Ser Pro Ser Gly Asp His Val
260 265 270
Val Phe Val Phe Glu Asn Asn Val Tyr Leu Lys Gln Leu Ser Thr Leu
275 280 285
Glu Val Lys Gln Val Thr Phe Asp Gly Asp Glu Ser Ile Tyr Asn Gly
290 295 300
Lys Pro Asp Trp Ile Tyr Glu Glu Glu Val Leu Ser Ser Asp Arg Ala
305 310 315 320
Ile Trp Trp Asn Asp Asp Gly Ser Tyr Phe Thr Phe Leu Arg Leu Asp
325 330 335
Asp Ser Asn Val Pro Thr Phe Asn Leu Gln His Phe Phe Glu Glu Thr
340 345 350
Gly Ser Val Ser Lys Tyr Pro Val Ile Asp Arg Leu Lys Tyr Pro Lys
355 360 365
Pro Gly Phe Asp Asn Pro Leu Val Ser Leu Phe Ser Tyr Asn Val Ala
370 375 380
Lys Gln Lys Leu Glu Lys Leu Asn Ile Gly Ala Ala Val Ser Leu Gly
385 390 395 400
Glu Asp Phe Val Leu Tyr Ser Leu Lys Trp Ile Asp Asn Ser Phe Phe
405 410 415
Leu Ser Lys Phe Thr Asp Arg Thr Ser Lys Lys Met Glu Val Thr Leu
420 425 430
Val Asp Ile Glu Ala Asn Ser Ala Ser Val Val Arg Lys His Asp Ala
435 440 445
Thr Glu Tyr Asn Gly Trp Phe Thr Gly Glu Phe Ser Val Tyr Pro Val
450 455 460
Val Gly Asp Thr Ile Gly Tyr Ile Asp Val Ile Tyr Tyr Glu Asp Tyr
465 470 475 480
Asp His Leu Ala Tyr Tyr Pro Asp Cys Thr Ser Asp Lys Tyr Ile Val
485 490 495
Leu Thr Asp Gly Ser Trp Asn Val Val Gly Pro Gly Val Leu Glu Val
500 505 510
Leu Glu Asp Arg Val Tyr Phe Ile Gly Thr Lys Glu Ser Ser Met Glu
515 520 525
His His Leu Tyr Tyr Thr Ser Leu Thr Gly Pro Lys Val Lys Ala Val
530 535 540
Met Asp Ile Lys Glu Pro Gly Tyr Phe Asp Val Asn Ile Lys Gly Lys
545 550 555 560
Tyr Ala Leu Leu Ser Tyr Arg Gly Pro Lys Leu Pro Tyr Gln Lys Phe
565 570 575
Ile Asp Leu Ser Asp Pro Ser Thr Thr Ser Leu Asp Asp Ile Leu Ser
580 585 590
Ser Asn Arg Gly Ile Val Glu Val Ser Leu Ala Thr His Ser Val Pro
595 600 605
Val Ser Thr Tyr Thr Asn Val Thr Leu Glu Asp Gly Val Thr Leu Asn
610 615 620
Met Ile Glu Val Leu Pro Ala Asn Phe Asn Pro Ser Lys Lys Tyr Pro
625 630 635 640
Leu Leu Val Asn Ile Tyr Gly Gly Pro Gly Ser Gln Lys Leu Asp Val
645 650 655
Gln Phe Asn Ile Gly Phe Glu His Ile Ile Ser Ser Ser Leu Asp Ala
660 665 670
Ile Val Leu Tyr Ile Asp Pro Arg Gly Thr Gly Gly Lys Ser Trp Ala
675 680 685
Phe Lys Ser Tyr Ala Thr Glu Lys Ile Gly Tyr Trp Glu Pro Arg Asp
690 695 700
Ile Thr Ala Val Val Ser Lys Trp Ile Ser Asp His Ser Phe Val Asn
705 710 715 720
Pro Asp Lys Thr Ala Ile Trp Gly Trp Ser Tyr Gly Gly Phe Thr Thr
725 730 735
Leu Lys Thr Leu Glu Tyr Asp Ser Gly Glu Val Phe Lys Tyr Gly Met
740 745 750
Ala Val Ala Pro Val Thr Asn Trp Leu Leu Tyr Asp Ser Ile Tyr Thr
755 760 765
Glu Arg Tyr Met Asn Leu Pro Lys Asp Asn Val Glu Gly Tyr Ser Glu
770 775 780
His Ser Val Ile Lys Lys Val Ser Asn Phe Lys Asn Val Asn Arg Phe
785 790 795 800
Leu Val Cys His Gly Thr Thr Asp Asp Asn Val His Phe Gln Asn Thr
805 810 815
Leu Thr Leu Leu Asp Gln Phe Asn Ile Asn Gly Val Val Asn Tyr Asp
820 825 830
Leu Gln Val Tyr Pro Asp Ser Glu His Ser Ile Ala His His Asn Ala
835 840 845
Asn Lys Val Ile Tyr Glu Arg Leu Phe Lys Trp Leu Glu Arg Ala Phe
850 855 860
Asn Asp Arg Phe Leu
865
<210> 41
<211> 771
<212> DNA
<213> 合成的
<400> 41
ggaattcggc cttgggggcc tccaggactt gctgaaattt gctgactcat cttcgccatc 60
caaggataat gagttagcta atgtgacagt taatgagtcg tcttgactaa cggggaacat 120
ttcattattt atatccagag tcaatttgat agcagagttt gtggttgaaa tacctatgat 180
tcgggagact ttgttgtaac gaccattatc cacagtttgg accgtgaaaa tgtcatcgaa 240
gagagcagac gacatattat ctattgtggt aagtgatagt tggaagtccg actaaggcat 300
gaaaatgaga agactgaaaa tttaaagttt ttgaaaacac taatcgggta ataacttgga 360
aattacgttt acgtgccttt agctcttgtc cttacccctg ataatctatc catttcccga 420
gagacaatga catctcggac agctgagaac ccgttcgata tagagcttca agagaatcta 480
agtccacgtt cttccaattc gtccatattg gaaaacatta atgagtatgc tagaagacat 540
cgcaatgatt cgctttccca agaatgtgat aatgaagatg agaacgaaaa tctcaattat 600
actgataact tggccaagtt ttcaaagtct ggagtatcaa gaaagagctg tatgctaata 660
tttggtattt gctttgttat ctggctgttt ctctttgcct tgtatgcgag ggacaatcga 720
ttttccaatt tgaacgagta cgttccagat tcaaacagct cgaggaattc c 771
<210> 42
<211> 949
<212> DNA
<213> 合成的
<400> 42
gaagcttctc gagctactgg gaaccacgag acatcactgc agtagtttcc aagtggattt 60
cagatcactc atttgtgaat cctgacaaaa ctgcgatatg ggggtggtct tacggtgggt 120
tcactacgct taagacattg gaatatgatt ctggagaggt tttcaaatat ggtatggctg 180
ttgctccagt aactaattgg cttttgtatg actccatcta cactgaaaga tacatgaacc 240
ttccaaagga caatgttgaa ggctacagtg aacacagcgt cattaagaag gtttccaatt 300
ttaagaatgt aaaccgattc ttggtttgtc acgggactac tgatgataac gtgcattttc 360
agaacacact aaccttactg gaccagttca atattaatgg tgttgtgaat tacgatcttc 420
aggtgtatcc cgacagtgaa catagcattg cccatcacaa cgcaaataaa gtgatctacg 480
agaggttatt caagtggtta gagcgggcat ttaacgatag atttttgtaa cattccgtac 540
ttcatgccat actatatatc ctgcaaggtt tccctttcag acacaataat tgctttgcaa 600
ttttacatac caccaattgg caaaaataat ctcttcagta agttgaatgc ttttcaagcc 660
agcaccgtga gaaattgcta cagcgcgcat tctaacatca ctttaaaatt ccctcgccgg 720
tgctcactgg agtttccaac ccttagctta tcaaaatcgg gtgataactc tgagtttttt 780
ttttcacttc tattcctaaa ccttcgccca atgctaccac ctccaatcaa catcccgaaa 840
tggatagaag agaatggaca tctcttgcaa cctccggtta ataattactg tctccacaga 900
ggaggattta cggtaatgat tgtaggtggg cctaatgggc caagcttgc 949
<210> 43
<211> 1003
<212> DNA
<213> 合成的
<400> 43
ggaattcggc cacctgggcc tgttgctgct ggtactgctg ttggaactgt tggtattgtt 60
gctgatctaa ggccgcctgt tccacaccgt gtgtatcgaa tgcttgggca aaatcatcgc 120
ctgccggagg ccccactacc gcttgttcct cctgctcttg tttgttttgc tcattgatga 180
tatcggcgtc aatgaattga tcctcaatcg tgtggtggtg gtgtcgtgat tcctcttctt 240
tcttgagtgc cttatccata ttcctatctt agtgtaccaa taattttgtt aaacacacgc 300
tgttgtttat gaaaagtcgt caaaaggtta aaaattctac ttggtgtgtg tcagagaaag 360
tagtgcagac ccccagtttg ttgactagtt gagaaggcgg ctcactattg cgcgaatagc 420
atgagaaatt tgcaaacatc tggcaaagtg gtcaatacct gccaacctgc caatcttcgc 480
gacggaggct gttaagcggg ttgggttccc aaagtgaatg gatattacgg gcaggaaaaa 540
cagccccttc cacactagtc tttgctactg acatcttccc tctcatgtat cccgaacaca 600
agtatcggga gtatcaacgg agggtgccct tatggcagta ctccctgttg gtgattgtac 660
tgctatacgg gtctcatttg cttatcagca ccatcaactt gatacactat aaccacaaaa 720
attatcatgc acacccagtc aatagtggta tcgttcttaa tgagtttgct gatgacgatt 780
cattctcttt gaatggcact ctgaacttgg agaactggag aaatggtacc ttttccccta 840
aatttcattc cattcagtgg accgaaatag gtcaggaaga tgaccaggga tattacattc 900
tctcttccaa ttcctcttac atagtaaagt ctttatccga cccagacttt gaatctgttc 960
tattcaacga gtctacaatc acttacaacg ctcgaggaat tcg 1003
<210> 44
<211> 1142
<212> DNA
<213> 合成的
<400> 44
gaagcttctc gagggcagca aagccttacg ttgatgagaa tagactggcc atttggggtt 60
ggtcttatgg aggttacatg acgctaaagg ttttagaaca ggataaaggt gaaacattca 120
aatatggaat gtctgttgcc cctgtgacga attggaaatt ctatgattct atctacacag 180
aaagatacat gcacactcct caggacaatc caaactatta taattcgtca atccatgaga 240
ttgataattt gaagggagtg aagaggttct tgctaatgca cggaactggt gacgacaatg 300
ttcacttcca aaatacactc aaagttctag atttatttga tttacatggt cttgaaaact 360
atgatatcca cgtgttccct gatagtgatc acagtattag atatcacaac ggtaatgtta 420
tagtgtatga taagctattc cattggatta ggcgtgcatt caaggctggc aaataaatag 480
gtgcaaaaat attattagac tttttttttc gttcgcaagt tattactgtg taccataccg 540
atccaatccg tattgtaatt catgttctag atccaaaatt tgggactcta attcatgagg 600
tctaggaaga tgatcatctc tatagttttc agcggggggc tcgatttgcg gttggtcaaa 660
gctaacatca aaatgtttgt caggttcagt gaatggtaac tgctgctctt gaattggtcg 720
tctgacaaat tctctaagtg atagcacttc atctacaatc atttgcttca tcgtttctat 780
atcgtccacg acctcaaacg agaaatcgaa tttggaagaa cagacgggct catcgttagg 840
atcatgccaa accttgagat atggatgctc taaagcctca gtaactgtaa ttctgtgagt 900
gggatctacc gtgagcattc gatccagtaa gtctatcgct tcagggttgg caccgggaaa 960
taactggctg aatgggatct tgggcatgaa tggcagggag cgaacataat cctgggcacg 1020
ctctgatctg atagactgaa gtgtctcttc cgaaacagta cccagcgtac tcaaaatcaa 1080
gttcaattga tccacatagt ctcttcctct aaaaatgggt cggccaccta ggccaagctt 1140
gc 1142
<210> 45
<211> 1202
<212> DNA
<213> 合成的
<400> 45
tgtttagctt gcctcgtccc cgccgggtca cccggccagc gacatggagg cccagaatac 60
cctccttgac agtcttgacg tgcgcagctc aggggcatga tgtgactgtc gcccgtacat 120
ttagcccata catccccatg tataatcatt tgcatccata cattttgatg gccgcacggc 180
gcgaagcaaa aattacggct cctcgctgca gacctgcgag cagggaaacg ctcccctcac 240
agacgcgttg aattgtcccc acgccgcgcc cctgtagaga aatataaaag gttaggattt 300
gccactgagg ttcttctttc atatacttcc ttttaaaatc ttgctaggat acagttctca 360
catcacatcc gaacataaac aaccatgggt accactcttg acgacacggc ttaccggtac 420
cgcaccagtg tcccggggga cgccgaggcc atcgaggcac tggatgggtc cttcaccacc 480
gacaccgtct tccgcgtcac cgccaccggg gacggcttca ccctgcggga ggtgccggtg 540
gacccgcccc tgaccaaggt gttccccgac gacgaatcgg acgacgaatc ggacgacggg 600
gaggacggcg acccggactc ccggacgttc gtcgcgtacg gggacgacgg cgacctggcg 660
ggcttcgtgg tcgtctcgta ctccggctgg aaccgccggc tgaccgtcga ggacatcgag 720
gtcgccccgg agcaccgggg gcacggggtc gggcgcgcgt tgatggggct cgcgacggag 780
ttcgcccgcg agcggggcgc cgggcacctc tggctggagg tcaccaacgt caacgcaccg 840
gcgatccacg cgtaccggcg gatggggttc accctctgcg gcctggacac cgccctgtac 900
gacggcaccg cctcggacgg cgagcaggcg ctctacatga gcatgccctg cccctaatca 960
gtactgacaa taaaaagatt cttgttttca agaacttgtc atttgtatag tttttttata 1020
ttgtagttgt tctattttaa tcaaatgtta gcgtgattta tatttttttt cgcctcgaca 1080
tcatctgccc agatgcgaag ttaagtgcgc agaaagtaat atcatgcgtc aatcgtatgt 1140
gaatgctggt cgctatactg ctgtcgattc gatactaacg ccgccatcca gtgtcgaaaa 1200
cg 1202
<210> 46
<211> 42
<212> PRT
<213> 合成的
<220>
<223> 合成的
<400> 46
Gly Leu Glu Asn Tyr Asp Ile His Val Phe Pro Asp Ser Asp His Ser
1 5 10 15
Ile Arg Tyr His Asn Gly Asn Val Ile Val Tyr Asp Lys Leu Phe His
20 25 30
Trp Ile Arg Arg Ala Phe Lys Ala Gly Lys
35 40
<210> 47
<211> 17
<212> PRT
<213> 合成的
<400> 47
Gly Leu Glu Asn Tyr Asp Ile His Val Phe Pro Asp Thr Ile Pro Leu
1 5 10 15
Asp
<210> 48
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 48
cgttttcgac actggatggc g 21
<210> 49
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 49
tgtttagctt gcctcgtccc cg 22
<210> 50
<211> 940
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 50
agcttctcga gctactggga accacgagac atcactgcag tagtttccaa gtggatttca 60
gatcactcat ttgtgaatcc tgacaaaact gcgatatggg ggtggtctta cggtgggttc 120
actacgctta agacattgga atatgattct ggagaggttt tcaaatatgg tatggctgtt 180
gctccagtaa ctaattggct tttgtatgac tccatctaca ctgaaagata catgaacctt 240
ccaaaggaca atgttgaagg ctacagtgaa cacagcgtca ttaagaaggt ttccaatttt 300
aagaatgtaa accgattctt ggtttgtcac gggactactg atgataacgt gcattttcag 360
aacacactaa ccttactgga ccagttcaat attaatggtg ttgtgaatta cgatcttcag 420
gtgtatcccg acagtgaaca tagcattgcc catcacaacg caaataaagt gatctacgag 480
aggttattca agtggttaga gcgggcattt aacgatagat ttttgtaaca ttccgtactt 540
catgccatac tatatatcct gcaaggtttc cctttcagac acaataattg ctttgcaatt 600
ttacatacca ccaattggca aaaataatct cttcagtaag ttgaatgctt ttcaagccag 660
caccgtgaga aattgctaca gcgcgcattc taacatcact ttaaaattcc ctcgccggtg 720
ctcactggag tttccaaccc ttagcttatc aaaatcgggt gataactctg agtttttttt 780
ttcacttcta ttcctaaacc ttcgcccaat gctaccacct ccaatcaaca tcccgaaatg 840
gatagaagag aatggacatc tcttgcaacc tccggttaat aattactgtc tccacagagg 900
aggatttacg gtaatgattg taggtgggcc taatgggcca 940
<210> 51
<211> 995
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 51
aattcggcca cctgggcctg ttgctgctgg tactgctgtt ggaactgttg gtattgttgc 60
tgatctaagg ccgcctgttc cacaccgtgt gtatcgaatg cttgggcaaa atcatcgcct 120
gccggaggcc ccactaccgc ttgttcctcc tgctcttgtt tgttttgctc attgatgata 180
tcggcgtcaa tgaattgatc ctcaatcgtg tggtggtggt gtcgtgattc ctcttctttc 240
ttgagtgcct tatccatatt cctatcttag tgtaccaata attttgttaa acacacgctg 300
ttgtttatga aaagtcgtca aaaggttaaa aattctactt ggtgtgtgtc agagaaagta 360
gtgcagaccc ccagtttgtt gactagttga gaaggcggct cactattgcg cgaatagcat 420
gagaaatttg caaacatctg gcaaagtggt caatacctgc caacctgcca atcttcgcga 480
cggaggctgt taagcgggtt gggttcccaa agtgaatgga tattacgggc aggaaaaaca 540
gccccttcca cactagtctt tgctactgac atcttccctc tcatgtatcc cgaacacaag 600
tatcgggagt atcaacggag ggtgccctta tggcagtact ccctgttggt gattgtactg 660
ctatacgggt ctcatttgct tatcagcacc atcaacttga tacactataa ccacaaaaat 720
tatcatgcac acccagtcaa tagtggtatc gttcttaatg agtttgctga tgacgattca 780
ttctctttga atggcactct gaacttggag aactggagaa atggtacctt ttcccctaaa 840
tttcattcca ttcagtggac cgaaataggt caggaagatg accagggata ttacattctc 900
tcttccaatt cctcttacat agtaaagtct ttatccgacc cagactttga atctgttcta 960
ttcaacgagt ctacaatcac ttacaacgct cgagg 995
<210> 52
<211> 1133
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 52
agcttctcga gggcagcaaa gccttacgtt gatgagaata gactggccat ttggggttgg 60
tcttatggag gttacatgac gctaaaggtt ttagaacagg ataaaggtga aacattcaaa 120
tatggaatgt ctgttgcccc tgtgacgaat tggaaattct atgattctat ctacacagaa 180
agatacatgc acactcctca ggacaatcca aactattata attcgtcaat ccatgagatt 240
gataatttga agggagtgaa gaggttcttg ctaatgcacg gaactggtga cgacaatgtt 300
cacttccaaa atacactcaa agttctagat ttatttgatt tacatggtct tgaaaactat 360
gatatccacg tgttccctga tagtgatcac agtattagat atcacaacgg taatgttata 420
gtgtatgata agctattcca ttggattagg cgtgcattca aggctggcaa ataaataggt 480
gcaaaaatat tattagactt tttttttcgt tcgcaagtta ttactgtgta ccataccgat 540
ccaatccgta ttgtaattca tgttctagat ccaaaatttg ggactctaat tcatgaggtc 600
taggaagatg atcatctcta tagttttcag cggggggctc gatttgcggt tggtcaaagc 660
taacatcaaa atgtttgtca ggttcagtga atggtaactg ctgctcttga attggtcgtc 720
tgacaaattc tctaagtgat agcacttcat ctacaatcat ttgcttcatc gtttctatat 780
cgtccacgac ctcaaacgag aaatcgaatt tggaagaaca gacgggctca tcgttaggat 840
catgccaaac cttgagatat ggatgctcta aagcctcagt aactgtaatt ctgtgagtgg 900
gatctaccgt gagcattcga tccagtaagt ctatcgcttc agggttggca ccgggaaata 960
actggctgaa tgggatcttg ggcatgaatg gcagggagcg aacataatcc tgggcacgct 1020
ctgatctgat agactgaagt gtctcttccg aaacagtacc cagcgtactc aaaatcaagt 1080
tcaattgatc cacatagtct cttcctctaa aaatgggtcg gccacctagg cca 1133
<210> 53
<211> 573
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 53
atgggtacca ctcttgacga cacggcttac cggtaccgca ccagtgtccc gggggacgcc 60
gaggccatcg aggcactgga tgggtccttc accaccgaca ccgtcttccg cgtcaccgcc 120
accggggacg gcttcaccct gcgggaggtg ccggtggacc cgcccctgac caaggtgttc 180
cccgacgacg aatcggacga cgaatcggac gacggggagg acggcgaccc ggactcccgg 240
acgttcgtcg cgtacgggga cgacggcgac ctggcgggct tcgtggtcgt ctcgtactcc 300
ggctggaacc gccggctgac cgtcgaggac atcgaggtcg ccccggagca ccgggggcac 360
ggggtcgggc gcgcgttgat ggggctcgcg acggagttcg cccgcgagcg gggcgccggg 420
cacctctggc tggaggtcac caacgtcaac gcaccggcga tccacgcgta ccggcggatg 480
gggttcaccc tctgcggcct ggacaccgcc ctgtacgacg gcaccgcctc ggacggcgag 540
caggcgctct acatgagcat gccctgcccc taa 573
<210> 54
<211> 1914
<212> DNA
<213> 人工序列
<220>
<223> 合成的
<400> 54
tttgtgccaa atataacagt aaacctgtcg ttctgtgaac taccagacca aacaaagtca 60
aaagaggtgt tgacaccaaa gattgttcaa gcagtaaatc cgcagttata tctaagggat 120
gcttcagcaa tgcagctgaa agaacaagcg gtgactcact atagttagtg atatcatagc 180
ctttagattt aggcgtcacc aatgcatccc ttaaagcgta tgccatatga attgggtaac 240
caatattcta atcacaaggt agtgctgata gggtaccttt tttcacagta atcgcgtctg 300
attatgtcat cacaaaataa tgtgtggtta agtgaaggac cagtgcccag ttcaacgaaa 360
gcattgcgtt gagttacgtc tcatgcctaa tgaaaagcta aaatgagatt gaattgtttt 420
gtgaatgtcc attggtctgt tgggagtcgc tattagtgtc attcagactt ctacaaggac 480
aacaaaacac ttgcttatgt aagttcatgc tccaacaatt tatggtctaa cggctagaca 540
gtgctgtgta atgccagccc aaatctgaat tggctaacaa tgaaaaccag attgcctcat 600
ttggccttct cgtgtcctct ggcccttttg ttcaaagttg aaactcacca aattgatttc 660
gactcaagat tgcttccttt tcgttcccca tacaaaattc caaaaattat ataaaagctc 720
tccgccgctc ctatcctatg ctctcccgtt tacaacacta cagatctgca attggctcaa 780
cgcttatacg taatcatatc agaatgagct ccatcaagat tgagaattac tacgctgatg 840
ccaaggcccc tatagtatct ttgtcggcca aatcccattt caatgaattg acctctcagg 900
aaagaaagta cgcccattac atgtccaggg cttcccattg gggaactagg gttgttctta 960
gatcagtttc tccagaatct gaagtaatat atgacttaat catcagtatt cataaacatg 1020
tcaatagtga ctacagcgac ttaactaagc atttggggga agtggcagta cagcaatatc 1080
tggaatttgc ttcgcagttt ttgtcgaact taggaaatta taaatctttt ggcgatgtca 1140
agtttattcc aagattgccc agacctgatt ttgagaccct agtcgaatgg accaatagtg 1200
agactgttct tcaattgttt gaacttgtaa aggatgactt atactcatta gatgagaaga 1260
acatacttct tggatggaat actgatggtc atgtcagttc ttactacttg aacaaagtct 1320
caaaggtaga ggctgaagtt gttaacgcag cacttgcttc taaggggatt atgcctgaga 1380
atacacgtgt tgaaaagttg tctgactcag aatacagggt tcatgttgca agtgctgata 1440
tttctaacaa cacaggttac tatccagatt caattgatta caaagatgct gatggaaagt 1500
catatacaat cactttcaaa tttggagacc atgctgcaga attctctcaa attgtcagca 1560
accttgtcga agctaaaaag tatgccgcca atgaaactca agtgaagttg ttagagcact 1620
atatccagtc tttcaccact ggttctatga acgctcacaa agattctcaa attgaatggg 1680
taagagacat tggtccatct gtcgagacca acattggttt cattgaaacg tacagagatc 1740
caagcggtgt cagaggtgaa tgggagggtc ttgttgcaat ggtgaataaa gaaagaaccg 1800
aaaaatttca aaagcttgtc agtagtgcca aacacttcat ccagctgctg ccttggccca 1860
aagcctttga gaaagatgtc tttactcctc ctgacttcac ctccttggag gtac 1914

Claims (20)

1.一种在酵母宿主细胞中产生重组蛋白的方法,其中所述宿主酵母细胞缺乏二肽基氨肽酶(DAP)活性,所述方法包括:a. 用编码蛋白的多核苷酸载体转化其中DAP活性已经被去除的基因修饰的酵母细胞;b. 在诱导蛋白表达的条件下在培养基中培养被转化的宿主细胞;和c. 从转化的宿主细胞或培养基中分离蛋白。
2.权利要求1的方法,其中酵母细胞是巴斯德毕赤酵母(Pichia pastoris)。
3.权利要求1或2的方法,其中通过从酵母细胞基因组中删除或破坏STE 13和DAP2基因而去除DAP活性。
4.权利要求1的酵母,其中宿主细胞已经被基因工程化以产生包含人样N-聚糖的糖蛋白。
5.权利要求4的酵母,其中人样N-聚糖选自杂合和复合的N-聚糖。
6.权利要求1的酵母,其中宿主细胞被基因工程化以产生主要具有N-聚糖的糖蛋白,所述N-聚糖选自Man5GlcNAc2、GlcNAcMan5GlcNAc2、GalGlcNAcMan5GlcNAc2、NANAGalGlcNAcMan5GlcNAc2、GlcNAcMan3GlcNAc2、GlcNAc(1-4 Man3GlcNAc2、Gal(1-4 G1cNAc(1-4 Man3GlcNAc2和 NANA(1-4 Gal(1-4 GlcNAc(1-4 Man3GlcNAc2
7.权利要求1的方法,其中酵母进一步表达人糖蛋白。
8.一种缺乏二肽基氨肽酶(DAP)活性的基因修饰的酵母细胞,包括其中编码STE13和DAP2的基因组DNA已被从酵母细胞基因组中删除或破坏的酵母细胞系。
9.权利要求8的酵母细胞,其中酵母细胞是巴斯德毕赤酵母。
10.权利要求6的方法,其中宿主细胞已被基因工程化以产生包含人样N-聚糖的糖蛋白。
11.权利要求10的方法,其中人样N-聚糖选自杂合和复合的N-聚糖。
12.权利要求6的方法,其中宿主细胞被基因工程化以产生主要具有N-聚糖的糖蛋白,所述N-聚糖选自Man5GlcNAc2、GlcNAcMan5GlcNAc2、GalGlcNAcMan5GlcNAc2、NANAGalGlcNAcMan5GlcNAc2、GlcNAcMan3GlcNAc2、GlcNAc(1-4 Man3GlcNAc2、Gal(1-4 GlcNAc(1-4 Man3GlcNAc2和NANA(1-4 Gal(1-4 GlcNAc(1-4 Man3GlcNAc2
13.权利要求6的方法,其中所述蛋白是人糖蛋白。
14.一种在酵母细胞中产生具有N-末端识别位点Xaa-Pro或Xaa-Ala的治疗性蛋白的方法,其中Xaa代表任何一种氨基酸,所述方法包括:a. 用编码具有选自Xaa-Pro和Xaa-Ala的N-末端识别位点的治疗性蛋白的多核苷酸载体转化其中DAP活性已经被去除的基因修饰的酵母细胞;b. 在诱导治疗性蛋白表达的条件下培养被转化的宿主细胞;以及c. 从转化的宿主细胞中分离治疗性蛋白。
15.权利要求8的方法,其中酵母细胞是巴斯德毕赤酵母。
16.权利要求14或15的方法,其中通过从酵母细胞基因组中删除或破坏STE 13和DAP2而去除DAP活性。
17.权利要求14的方法,其中宿主细胞被基因工程化以产生包含人样N-聚糖的糖蛋白。
18.权利要求17的酵母,其中人样N-聚糖选自杂合和复合的N-聚糖。
19.权利要求14的方法,其中宿主细胞被基因工程化以产生主要具有N-聚糖的糖蛋白,所述N-聚糖选自Man5GlcNAc2、GlcNAcMan5GlcNAc2、GalGlcNAcMan5GlcNAc2、NANAGalGlcNAcMan5GlcNAc2、GlcNAcMan3GlcNAc2、GlcNAc(1-4 Man3GlcNAc2、Gal(1-4 GlcNAc(1-4 Man3GlcNAc2和NANA(1-4 Gal(1-4 GlcNAc(1-4 Man3GlcNAc2
20.权利要求14的方法,其中所述蛋白是人糖蛋白。
CN2010800603314A 2009-10-30 2010-10-27 在缺乏二肽基氨肽酶活性的巴斯德毕赤酵母中生产治疗性蛋白的方法 Pending CN102725396A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US25636909P 2009-10-30 2009-10-30
US61/256369 2009-10-30
PCT/US2010/054183 WO2011053612A1 (en) 2009-10-30 2010-10-27 Method for producing therapeutic proteins in pichia pastoris lacking dipeptidyl aminopeptidase activity

Publications (1)

Publication Number Publication Date
CN102725396A true CN102725396A (zh) 2012-10-10

Family

ID=43922503

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2010800603314A Pending CN102725396A (zh) 2009-10-30 2010-10-27 在缺乏二肽基氨肽酶活性的巴斯德毕赤酵母中生产治疗性蛋白的方法

Country Status (8)

Country Link
US (1) US9528116B2 (zh)
EP (1) EP2494030A4 (zh)
JP (1) JP2013509181A (zh)
CN (1) CN102725396A (zh)
AU (1) AU2010313492B2 (zh)
CA (1) CA2778526A1 (zh)
MX (1) MX2012004994A (zh)
WO (1) WO2011053612A1 (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110564634A (zh) * 2018-06-06 2019-12-13 江苏师范大学 一株胞外分泌表达桦褐孔菌二肽酶的工程菌
WO2021213489A1 (zh) * 2020-04-24 2021-10-28 中国人民解放军军事科学院军事医学研究院 一种用于糖蛋白制备的工程化酵母构建方法及其菌株
CN117778445A (zh) * 2023-12-31 2024-03-29 云南师范大学 毕赤酵母基因在提高毕赤酵母植酸酶酶活或表达量中的应用
CN119040163A (zh) * 2024-09-13 2024-11-29 态创生物科技(广州)有限公司 一种可高效表达胶原蛋白的毕赤酵母工程菌及其构建方法

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104245938B (zh) * 2011-06-10 2018-06-01 淡马锡生命科学研究院有限公司 用于柄锈菌亚门和黑粉菌亚门的基因操作和表达系统
WO2013066685A1 (en) * 2011-10-31 2013-05-10 Merck Sharp & Dohme Corp. Engineered pichia strains with improved fermentation yield and n-glycosylation quality
EP3358000A3 (en) 2012-01-05 2018-12-19 Glykos Finland Oy Protease deficient filamentous fungal cells and methods of use thereof
WO2013174927A1 (en) 2012-05-23 2013-11-28 Novartis International Pharmaceutical Limited Production of fucosylated glycoproteins
RU2016104064A (ru) 2013-07-10 2017-08-15 Новартис Аг Клетки мицелиальных грибов с множественной недостаточностью протеаз и способы их использования
CN108064266A (zh) 2014-07-21 2018-05-22 格利科斯芬兰公司 在丝状真菌中具有哺乳动物样n-聚糖的糖蛋白的制备
EP3911667A4 (en) * 2019-01-16 2023-01-18 Northwestern University RECOMBINANT STRAINS AND MEDIUM FORMULATION FOR ENHANCEMENT OF SECRETION TITER USING A TYPE III SECRETION SYSTEM

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060110747A1 (en) * 2004-07-26 2006-05-25 Dow Global Technologies Inc. Process for improved protein expression by strain engineering
CN101484585A (zh) * 2006-05-05 2009-07-15 格利科菲公司 在低等真核生物中生产唾液酸化n-聚糖
CN101501209A (zh) * 2006-06-21 2009-08-05 百奥勤有限公司 具有促胰岛素活性的生物活性多肽的制备方法

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE4226971C2 (de) 1992-08-14 1997-01-16 Widmar Prof Dr Tanner Modifizierte Pilzzellen und Verfahren zur Herstellung rekombinanter Produkte
AT411474B (de) 1999-11-26 2004-01-26 Evg Entwicklung Verwert Ges Verfahren und vorrichtung zum herstellen eines fertigteilelementes aus gussbeton
AU2001256762A1 (en) 2000-05-17 2001-11-26 Mitsubishi Pharma Corporation Process for producing protein with reduction of acidic sugar chain and glycoprotein produced thereby
EP2119793A1 (en) 2000-06-28 2009-11-18 Glycofi, Inc. Methods for producing modified glycoproteins
US20050260729A1 (en) 2004-03-17 2005-11-24 Hamilton Stephen R Method of engineering a cytidine monophosphate-sialic acid synthetic pathway in fungi and yeast
US7449308B2 (en) 2000-06-28 2008-11-11 Glycofi, Inc. Combinatorial DNA library for producing modified N-glycans in lower eukaryotes
US7625756B2 (en) 2000-06-28 2009-12-01 GycoFi, Inc. Expression of class 2 mannosidase and class III mannosidase in lower eukaryotic cells
US7795002B2 (en) 2000-06-28 2010-09-14 Glycofi, Inc. Production of galactosylated glycoproteins in lower eukaryotes
JP4820055B2 (ja) 2001-12-27 2011-11-24 グライコフィ, インコーポレイテッド 哺乳動物型糖質構造を操作するための方法
DE10390418D2 (de) * 2002-02-06 2005-01-13 N Zyme Biotec Gmbh Verfahren zur Herstellung von rekombinanten Proteinen in Mikroorganismen
JP2005525798A (ja) * 2002-02-06 2005-09-02 トロムスドルフ ゲーエムベーハー ウント コー.カーゲー アルツナイミッテル 微生物内での組み換えタンパク質の生産方法
WO2004027067A2 (en) * 2002-09-20 2004-04-01 Cym1P A/S Methods for increasing the production of a recombinant polypeptide from a host cell
ES2528739T3 (es) 2003-12-24 2015-02-12 Glycofi, Inc. Métodos para eliminar la manosilfosforilación de glucanos en la producción de glucoproteínas
US7465577B2 (en) 2004-04-29 2008-12-16 Glycofi, Inc. Methods for reducing or eliminating α-mannosidase resistant glycans for the production of glycoproteins
CA2628725A1 (en) 2005-11-15 2007-05-31 Glycofi, Inc. Production of glycoproteins with reduced o-glycosylation

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20060110747A1 (en) * 2004-07-26 2006-05-25 Dow Global Technologies Inc. Process for improved protein expression by strain engineering
CN101484585A (zh) * 2006-05-05 2009-07-15 格利科菲公司 在低等真核生物中生产唾液酸化n-聚糖
CN101501209A (zh) * 2006-06-21 2009-08-05 百奥勤有限公司 具有促胰岛素活性的生物活性多肽的制备方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
MISUMI等: "Dipeptidyl-peptidases A and B", 《HANDBOOK OF PROTEOLYTIC ENZYMES》 *

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110564634A (zh) * 2018-06-06 2019-12-13 江苏师范大学 一株胞外分泌表达桦褐孔菌二肽酶的工程菌
CN110564634B (zh) * 2018-06-06 2021-04-27 江苏师范大学 一株胞外分泌表达桦褐孔菌二肽酶的工程菌
WO2021213489A1 (zh) * 2020-04-24 2021-10-28 中国人民解放军军事科学院军事医学研究院 一种用于糖蛋白制备的工程化酵母构建方法及其菌株
CN117778445A (zh) * 2023-12-31 2024-03-29 云南师范大学 毕赤酵母基因在提高毕赤酵母植酸酶酶活或表达量中的应用
CN119040163A (zh) * 2024-09-13 2024-11-29 态创生物科技(广州)有限公司 一种可高效表达胶原蛋白的毕赤酵母工程菌及其构建方法

Also Published As

Publication number Publication date
US9528116B2 (en) 2016-12-27
WO2011053612A1 (en) 2011-05-05
AU2010313492B2 (en) 2014-05-29
MX2012004994A (es) 2012-06-12
EP2494030A1 (en) 2012-09-05
EP2494030A4 (en) 2013-03-27
CA2778526A1 (en) 2011-05-05
US20120231502A1 (en) 2012-09-13
AU2010313492A1 (en) 2012-05-17
JP2013509181A (ja) 2013-03-14

Similar Documents

Publication Publication Date Title
CN102725396A (zh) 在缺乏二肽基氨肽酶活性的巴斯德毕赤酵母中生产治疗性蛋白的方法
CN101365783B (zh) 具有降低的o-糖基化的糖蛋白的产生
EP1505149B1 (en) Methylotroph yeast producing mammalian type sugar chain
AU2015293949B2 (en) Production of glycoproteins with mammalian-like N-glycans in filamentous fungi
JP2012506710A (ja) 宿主細胞中での糖鎖付加タンパク質の産生のための新規ツール
EP2134834B1 (en) Production of glycoproteins with modified fucosylation
AU2011247333A1 (en) Improved glycosylation of proteins in host cells
CA2677154A1 (fr) Levures genetiquement modifiees pour la production de glycoproteines homogenes
CN102177247A (zh) 用于蛋白生产: ca2+ atp酶过表达的改良的载体和酵母菌株
US8936918B2 (en) Yeast strain for the production of proteins with modified O-glycosylation
CN113549560A (zh) 一种用于糖蛋白制备的工程化酵母构建方法及其菌株
US9416389B2 (en) Methods for reducing mannosyltransferase activity in lower eukaryotes
JPH09266792A (ja) 酵母のマンノース−1−リン酸転移を正に制御する遺伝子ならびにこの遺伝子の欠損変異株を利用する高マンノース型中性糖鎖の製造方法
KR101419266B1 (ko) 한세눌라 폴리모르파 유래의 단백질 o-만노실 전이효소의 신규 유전자 및 이 유전자가 결손된 한세눌라 폴리모르파 변이주
JP2025504024A (ja) Thermothelomyces heterothallicaの糖鎖工学
EP2563902A1 (en) Improved glycosylation of proteins in host cells

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
ASS Succession or assignment of patent right

Owner name: SCHERING CORP (US)

Free format text: FORMER OWNER: MSD CORP.

Effective date: 20121031

C41 Transfer of patent application or patent right or utility model
C53 Correction of patent of invention or patent application
CB02 Change of applicant information

Address after: New jersey, USA

Applicant after: MERCK SHARP & DOHME Corp.

Address before: New jersey, USA

Applicant before: SCHERING Corp.

COR Change of bibliographic data

Free format text: CORRECT: APPLICANT; FROM: SCHERING CORP (US) TO: MSD CORP.

TA01 Transfer of patent application right

Effective date of registration: 20121031

Address after: New jersey, USA

Applicant after: SCHERING Corp.

Address before: New jersey, USA

Applicant before: MERCK SHARP & DOHME Corp.

C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20121010