[go: up one dir, main page]

CN101605887A - 蛋白的高分泌生产方法 - Google Patents

蛋白的高分泌生产方法 Download PDF

Info

Publication number
CN101605887A
CN101605887A CNA2007800268649A CN200780026864A CN101605887A CN 101605887 A CN101605887 A CN 101605887A CN A2007800268649 A CNA2007800268649 A CN A2007800268649A CN 200780026864 A CN200780026864 A CN 200780026864A CN 101605887 A CN101605887 A CN 101605887A
Authority
CN
China
Prior art keywords
gene
ala
glu
protein
lys
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CNA2007800268649A
Other languages
English (en)
Other versions
CN101605887B (zh
Inventor
千叶靖典
地神芳文
黑田康介
小林和男
市川公久
野中浩一
铃木健之
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sankyo Co Ltd
Kyowa Kirin Co Ltd
Original Assignee
Sankyo Co Ltd
Kyowa Hakko Kirin Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sankyo Co Ltd, Kyowa Hakko Kirin Co Ltd filed Critical Sankyo Co Ltd
Publication of CN101605887A publication Critical patent/CN101605887A/zh
Application granted granted Critical
Publication of CN101605887B publication Critical patent/CN101605887B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N1/00Microorganisms, e.g. protozoa; Compositions thereof; Processes of propagating, maintaining or preserving microorganisms or compositions thereof; Processes of preparing or isolating a composition containing a microorganism; Culture media therefor
    • C12N1/20Bacteria; Culture media therefor
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K16/00Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies
    • C07K16/18Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies against material from animals or humans
    • C07K16/28Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies against material from animals or humans against receptors, cell surface antigens or cell surface determinants
    • C07K16/2875Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies against material from animals or humans against receptors, cell surface antigens or cell surface determinants against the NGF/TNF superfamily, e.g. CD70, CD95L, CD153, CD154
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K16/00Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P21/00Preparation of peptides or proteins
    • C12P21/02Preparation of peptides or proteins having a known sequence of two or more amino acids, e.g. glutathione

Landscapes

  • Chemical & Material Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Wood Science & Technology (AREA)
  • Molecular Biology (AREA)
  • Zoology (AREA)
  • Biochemistry (AREA)
  • Biotechnology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • General Engineering & Computer Science (AREA)
  • Immunology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Medicinal Chemistry (AREA)
  • Microbiology (AREA)
  • Physics & Mathematics (AREA)
  • Plant Pathology (AREA)
  • General Chemical & Material Sciences (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Tropical Medicine & Parasitology (AREA)
  • Virology (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)

Abstract

本发明提供了在宿主细胞例如酵母中高分泌生产蛋白、尤其具有复杂结构的蛋白例如抗体的方法。根据本发明,提供了具有激活的HAC1基因和RRBP1基因的转化的酵母,和外源蛋白的高分泌生产方法,其中使用转化的酵母细胞,并且提供了对宿主细胞如酵母特异的O-型糖链。

Description

蛋白的高分泌生产方法
技术领域
本发明涉及高水平分泌生产蛋白的方法,主要在酵母中实现。
背景技术
迄今为止,通过基因重组技术生产药用蛋白主要包括将动物细胞或大肠杆菌细胞用作宿主。大肠杆菌细胞能低成本地生产靶蛋白;但是,大肠杆菌细胞不能进行以糖链修饰为代表的修饰,且以包涵体的形式生成无活性的蛋白。这需要溶解过程,因而大肠杆菌细胞不适合复杂的蛋白生产过程。相反,动物细胞能生产靶蛋白作为活性蛋白。但是,不利地,由于动物细胞繁殖和培养的费时操作,动物细胞的使用会显著增加在设备和材料成本方面的生产成本。
在蛋白中,抗体已经长时间地用作药物产品。由于它们源自人以外的来源,会新产生抗施用的抗体的抗体。因而,这样的抗体不能施用超过一次,其使用受到限制。近年来,已经可以生产人源化的抗体,其中抗原结合位点以外的氨基酸序列已经被置换为源自人抗体的序列。此外,可以生产其中已经导入人抗体基因的人抗体生产小鼠。因而,抗体作为药物产品的用途变得广泛。现在,这样的抗体由培养的、已经导入编码杂交瘤或抗体的基因的细胞如CHO细胞生产。但是,这样的生产在成本、生产力、安全性等方面存在问题。
近年来,为了弥补上述缺点,已经尝试用使用酵母来生产药用蛋白。但是,这样的尝试基本上都没有付诸实际应用。更具体地,关于具有复杂结构的抗体,存在表达Fab(一种单链抗体(ScFv))等的实例(Biosci.Biotechnol.Biochem.,64:2138-2144,2000)。但是,在全长抗体方面生产力非常低(Proc.Natl.Acad.Sci.U.S.A.,85:8678-8682,1988)。最近报道了使用生产哺乳动物N-结合糖链的酵母(巴斯德毕赤氏酵母)来生产抗体的实例(Nature Biotechnology,24:210-215,2006),尽管该报道没有提及产率。因而,在酵母中高水平生产抗体是困难的。认为其原因是,酵母的分泌能力不足,由蛋白酶造成的降解等。
作为解决这些问题的一种手段,提出了包含使用蛋白酶缺陷菌株的方法(Enzyme and Microbial Technology,26:671-677,2000,Protein Expr.Purif.,20:485-491,2000,Biosci.Biotechnol.Biochem.,66:628-631,2002)。发明人还已经开发了使用蛋白酶(它是蛋白酶A(PEP4)、蛋白酶B(PRB1)或酵母天冬酶(YPS1))基因缺陷菌株来抑制抗体的降解的方法(WO 2003/091431)。作为通过基因导入来提高蛋白生产力的一种方法,报道了通过共表达分子伴侣的部分来提高ScFv生产力的方法,所述分子伴侣的部分会辅助内质网上的蛋白如BiP(KAR2)/PDI的三维结构的形成(Nat.Biotechnol.16:773-777,1998),尽管该方法仅仅生产单链抗体的片段。
另外,已经开发了许多诱导型或组成型启动子,且已经用于生产外源蛋白。但是,当使用有效启动子使编码外源蛋白的基因在细胞中高水平表达时,或当生产不太可能折叠的蛋白时,在内质网(ER)中会发生聚集,产生的蛋白有时可能在细胞中积累。此外,分泌型蛋白和膜蛋白会翻译成蛋白,此后立即掺入内质网,进行特定修饰,然后转移至高尔基体。在该情况下,未折叠的蛋白有时可能由于某种原因在内质网中积累。这称作“内质网应激”。这样的内质网应激的原因的实例包括,在内质网中发生的修饰(例如添加糖链或二硫键)的干扰,和从内质网运输的恶化。哺乳动物细胞具有“解折叠蛋白应答(UPR)”机制,作为反抗这样的内质网应激的一种手段。例如,转录抑制、分子伴侣诱导的折叠加速、变性蛋白的降解或经细胞凋亡的细胞死亡会保护在内质网中积累的蛋白。
作为调节UPR的基因,已知IRE1α-XBP1、PERK-eIF-2α和ATF6动物细胞的基因。在酵母的情况下,Ire1p-Hac1p是已知为这样的基因的唯一基因,Ire1p-Hac1p基因通过下述机制与UPR相关(参见图1)。首先,Ire1p通常结合抗体重链结合蛋白(BiP)。但是,当生产解折叠的蛋白(UFP)时,BiP会结合这样的UFP。与BiP解离的Ire1p通过自磷酸化或二聚化而激活,且它表现出内切核酸酶活性。尽管HAC1基因通常以未激活状态存在,具有内切核酸酶活性的Ire1p使从HAC1基因转录的mRNA发生剪接,并生成有活性的Hac1p(Cell,87:405-413,1996;Cell,90:1031-1039,1997;the EMBO Journal,18:3119-3132,1999)。这种有活性的Hac1p迁移至细胞核,起转录因子的作用,并促进编码与称作UPR的一系列反应有关的多种蛋白的基因的表达,所述反应例如有关的糖链添加、蛋白折叠、蛋白降解(ER-相关的降解:ERAD)、蛋白分选、脂类代谢等(Cell,101:249-258,2000)。
关于使用激活的Hac1p来提高外源蛋白的生产力的尝试,有一个实例,其中将编码丝状菌即里氏木霉(Trichoderma reesei))的激活的Hac1p的基因导入啤酒糖酵母中来提高异源蛋白α-淀粉酶和内源蛋白即转化酶的分泌(Appl.Environ.Microbiol.69:2065-2072,2003)。但是,已知单一蛋白,即α-淀粉酶或转化酶是容易分泌的蛋白,产量的提高低至提高以前的产量的约2倍。近年来,已经报道在已经单独导入激活的HAC1基因的菌株中,使用巴斯德毕赤氏酵母生产抗体片段Fab(Biotechnologyand Bioengineering,94:353-361)。通过导入激活的HAC1基因实现的生产力提高低至约1.3倍。
同时,已知这样一个实例,其中将哺乳动物来源的RRBP1(核糖体结合蛋白1,核糖体受体,p180蛋白)基因单独地导入酵母菌株中,从而使分泌的蛋白(牛胰腺胰蛋白酶抑制剂(BPTI))的量变成5倍(TheJournal of Cell Biology,146:273-284,1999)。最初,从狗分离出RRBP1基因,作为编码核糖体结合蛋白的基因(Nature,346:540-544,1990)。RRBP1具有180kDa的分子量和特殊结构,使得在N-末端侧包含10个氨基酸残基的序列重复54次,且该区域结合核糖体。已知RRBP1参与膜结构的扩大和mRNA的稳定化(the Journal of Cell Biology,130:29-39,1995;the Journal of Cell Biology,156:993-1001,2002)。前述BPTI的一个成功实例具有6,500的分子量,它代表非常小的肽。这样的结果不能总是适用于其它高分子量蛋白或由不同蛋白(例如抗体的轻链或重链)组成的蛋白聚集体。
已知蛋白O-甘露糖基转移酶(PMT)基因与酵母或霉菌固有的O-糖链的形成有关。PMT基因产物位于内质网膜上,且具有将甘露糖添加至分泌型蛋白的丝氨酸(Ser)或苏氨酸(Thr)的羟基残基上的活性(在下文中,这样的活性称作PMT活性)。有些已经被PMT添加糖链的蛋白用作酵母菌株壁的基本组分,作为甘露糖蛋白。当PMT活性非常低时,已知细胞壁会变脆,并影响细胞的生长。
关于PMT基因,已知在啤酒糖酵母(Saccharomyces cerevisiae)中存在7种基因,即,PMT1,2,3,4,5,6,和7(Biochim.Biophys.Acta.,1426:297-307,1999)。将PMT基因分成3类;即,PMT1家族,PMT2家族,和PMT4家族。已知PMT1p和PMT2p在形成异二聚体后表现出活性,PMT4p在形成同二聚体后表现出活性。因为氨基酸序列同源性等,据称PMT5p与PMT1p互补,PMT3p与PMT2p互补。PMT6p与PMT2p和PMT3p高度同源,尽管不知道表现出活性的组分的类型。还已知每种PMT蛋白具有对底物蛋白的选择性。
作为芽殖酵母的其它类型的PMT基因,已经发现了在白念珠菌的情况下与啤酒糖酵母的PMT1,2,4,5,和6基因高度同源的5种基因(Mol.Microbiol.,55:546-560,2005),在新型隐球菌的情况下至少与啤酒糖酵母的PMT4基因高度同源的一种基因(Eukaryot.Cell,6:222-234,2007)和在裂殖酵母即粟酒裂殖酵母的情况下与PMT1,2,和4基因高度同源的3种基因(oma1,2,和4)(Mol.Microbiol.,57:156-170,2005)。此外,在甲醇同化酵母Ogataea minuta(O.minuta)中观察到与啤酒糖酵母的PMT1,2,4,5,和6基因高度同源的5种基因的存在。
也在霉菌中发现了PMT基因。在构巢曲霉中发现了PmtA基和2种其它的基因,在里氏木霉中发现了与啤酒糖酵母的PMT2基因高度同源的Pmt1基因(Curr.Genet.,43:11-16,2003)。
据称PMT活性具有影响肽疏水区、增强肽亲水性、和抑制内质网腔中的肽聚集的作用。但是,当生产外源蛋白时,PMT活性有时会添加不必要的O-糖链,这可能导致蛋白组分的不充分形成、降低的活性等。对于多聚体蛋白,例如抗体,具体而言,可以抑制其聚集体的形成(在抗体的情况下,这是指轻链和重链聚集体的形成)。
日本专利号3630424和日本专利公开(kohyo)号H08-509867(A)(1996)提出了通过抑制由PMT基因的修饰导致的O-糖链添加,生产重组蛋白的方法。但是,这些专利文件没有描述抗体的轻链和重链的聚集体的形成。
在WO 2002/046437中提供了一个实例,其中将与O-糖链的形成有关的PMT1和PMT2基因缺陷型菌株用于抑制O-糖链的添加,使抗体轻链和重链分子的聚集提高了约1.5倍。该数据是使用RI-标记的氨基酸的脉冲标记实验的结果,但不是观察整个培养过程的结果。另外,进一步降低了糖链添加的抑制程度,并恶化了抗体生产力。
尽管HAC1基因会诱导UPR,已知有些UPR诱导型基因是添加酵母特异性的O-糖链的PMT基因(Cell,101:249-258,2000)。因此,HAC1基因的导入可能不足以生产高质量的多聚体蛋白,例如抗体。
如上所述,已经提出许多种方法来作为在酵母中高水平分泌生产蛋白的方法。但是,基本上所有方法在实践水平都是不充分的。还没有发现有效生产蛋白、尤其是高分子量蛋白或蛋白聚集体(包括抗体)的方法。当通过基因导入、基因破坏等将性状导入细胞中时,一般而言,细胞会经历某种应激。因而,可以提供其它修饰,或可能发生相反作用。当希望高水平蛋白表达时,例如,激活UPR时,这会导致不利因素例如糖链修饰、蛋白酶体的降解、或ER-相关的降解(ERAD)。因此,通过单一过程例如导入单个基因,不能实现具有复杂结构的蛋白例如抗体的高水平分泌生产。另外,仅有几种常规方法的组合不总是会产生协同效应。
因此,本发明意在提供在酵母或其它宿主细胞中高水平分泌生产蛋白(更具体地,具有复杂结构的蛋白,例如抗体)的方法。
发明内容
为了实现上述目的,发明人已经进行了集中的研究。结果,他们发现,与蛋白的高水平分泌生产有关的基因,即激活的HAC1(Hac1蛋白,它是在应用内质网应激后由Ire1p剪接mRNA诱导的转录因子)基因和RRBP1(核糖体结合蛋白1,核糖体受体,p180蛋白)基因在甲醇同化酵母,即Ogataea minuta中共表达,且抗体分泌生产的量可以增加约10倍。此外,他们发现,可以抑制与给酵母特异性蛋白添加O-糖链有关的蛋白O-甘露糖基转移酶(PMT)的活性(该活性抑制异多聚体例如抗体的聚集),以进一步提高生产力。
他们也发现,可以表达与蛋白的高水平分泌生产有关的基因,即激活的HAC1基因,且可以抑制与给酵母特异性蛋白添加O-糖链有关的蛋白O-甘露糖基转移酶(PMT)的活性(该活性抑制异多聚体例如抗体的聚集),以实现生产力的协同提高。
在这样的发现后,已经完成了本发明(参见图2)。
具体而言,本发明包括下述发明。
[1]一种转化的宿主细胞,其包含激活的HAC1基因和RRBP1基因。
[2]根据[1]的转化的宿主细胞,其包含以下激活的HAC1基因(1)和RRBP1基因(2):
(1)选自下面(a)至(d)的激活的HAC1基因:
(a)编码由SEQ ID NO:23所示的氨基酸序列组成的蛋白的基因;
(b)编码由与SEQ ID NO:23所示的氨基酸序列具有至少70%同源性的氨基酸序列组成、且具有激活解折叠蛋白应答(UPR)的功能的蛋白的基因;
(c)编码由通过缺失、置换和/或添加一个或几个氨基酸从SEQ ID NO:23所示氨基酸序列衍生的氨基酸序列组成、且具有激活UPR的功能的蛋白的基因;和
(d)在严格条件下与由SEQ ID NO:22所示核苷酸序列或其互补核苷酸序列组成的DNA杂交、且编码具有激活UPR的功能的蛋白的基因;和
(2)选自下面(e)至(h)的RRBP1基因:
(e)编码人或狗来源的RRBP1的基因;
(f)编码由与人或狗来源的RRBP1的氨基酸序列具有至少70%同源性的氨基酸序列组成、且具有核糖体结合活性的蛋白的基因;
(g)编码由通过缺失、置换和/或添加一个或几个氨基酸从人或狗来源的RRBP1的氨基酸序列衍生的氨基酸序列组成、且具有核糖体结合活性的蛋白的基因;和
(h)在严格条件下与由人或狗来源的RRBP1基因的核苷酸序列或其互补核苷酸序列组成的基因杂交、且编码具有核糖体结合活性的蛋白的基因。
[3]根据[1]的转化的细胞,其包含以下激活的HAC1基因(1)和RRBP1基因(2):
(1)选自下面(i)至(l)的激活的HAC1基因:
(i)编码啤酒糖酵母、里氏木霉或构巢曲霉的激活的HAC1蛋白的基因;
(j)编码由与啤酒糖酵母、里氏木霉或构巢曲霉的激活的HAC1蛋白的氨基酸序列具有至少70%同源性的氨基酸序列组成、且具有激活UPR的功能的蛋白的基因;
(k)编码由通过缺失、置换和/或添加一个或几个氨基酸从啤酒糖酵母、里氏木霉或构巢曲霉的激活的HAC1蛋白的氨基酸序列衍生的氨基酸序列组成、且具有激活UPR的功能的蛋白的基因;和
(l)在严格条件下与由编码啤酒糖酵母、里氏木霉或构巢曲霉的激活的HAC1蛋白的基因的核苷酸序列或其互补核苷酸序列组成的基因杂交、且编码具有激活UPR的功能的蛋白的基因;和
(2)选自下面(e)至(h)的RRBP1基因:
(e)编码人或狗来源的RRBP1的基因;
(f)编码由与人或狗来源的RRBP1的氨基酸序列具有至少70%同源性的氨基酸序列组成、且具有核糖体结合活性的蛋白的基因;
(g)编码由通过缺失、置换和/或添加一个或几个氨基酸从人或狗来源的RRBP1的氨基酸序列衍生的氨基酸序列组成、且具有核糖体结合活性的蛋白的基因;和
(h)在严格条件下与由人或狗来源的RRBP1基因的核苷酸序列或其互补核苷酸序列组成的基因杂交、且编码具有核糖体结合活性的蛋白的基因。
[4]根据[1]至[3]中任一项的转化的宿主细胞,其中所述宿主细胞是真核细胞。
[5]根据[4]的转化的宿主细胞,其中所述真核细胞是酵母。
[6]根据[5]的转化的宿主细胞,其中所述酵母是甲醇同化酵母。
[7]根据[6]的转化的宿主细胞,其中所述甲醇同化酵母是Ogataeaminuta。
[8]根据[5]的转化的宿主细胞,其中所述酵母是啤酒糖酵母。
[9]根据[1]至[8]中任一项的转化的宿主细胞,其包含导入其中的编码外源蛋白的基因。
[10]根据[9]的转化的宿主细胞,其中所述外源蛋白是多聚体蛋白。
[11]根据[10]的转化的宿主细胞,其中所述多聚体蛋白是异多聚体。
[12]根据[11]的转化的宿主细胞,其中所述异多聚体是抗体或其功能片段。
[13]一种生产蛋白的方法,其包含,在培养基中培养根据[9]至[12]中任一项的转化的宿主细胞,和从培养产物进行靶蛋白取样。
[14]根据[13]的方法,其中在抑制蛋白O-甘露糖基转移酶(PMT)活性的条件下进行培养。
[15]根据[14]的方法,其中通过向培养基中添加蛋白O-甘露糖基转移酶(PMT)活性的抑制剂,抑制PMT活性。
[16]编码甲醇同化酵母的激活的HAC1蛋白的基因。
[17]选自下面(a)至(d)的基因:
(a)编码由SEQ ID NO:23所示的氨基酸序列组成的蛋白的基因;
(b)编码由与SEQ ID NO:23所示的氨基酸序列具有至少70%同源性的氨基酸序列组成、且具有激活解折叠蛋白应答(UPR)的功能的蛋白的基因;
(c)编码由通过缺失、置换和/或添加一个或几个氨基酸从SEQID NO:23所示氨基酸序列衍生的氨基酸序列组成、且具有激活UPR的功能的蛋白的基因;和
(d)在严格条件下与由SEQ ID NO:22所示核苷酸序列或其互补核苷酸序列组成的DNA杂交、且编码具有激活UPR的功能的蛋白的基因。
[18]包含根据[17]的基因的表达载体。
[19]根据[18]的表达载体,它是pOMexPGHy/Hac1。
[20]包含激活的HAC1基因和RRBP1基因的表达载体。
[21]根据[20]的表达载体,其中所述激活的HAC1基因是根据[17]的基因。
[22]根据[20]的表达载体,其中所述激活的HAC1基因是编码啤酒糖酵母、里氏木霉或构巢曲霉的激活的HAC1蛋白的基因或其同源基因。
[23]根据[20]的表达载体,它是YEp351GAP-II-aHAC1/p180。
[24]根据[20]的表达载体,其中所述RRBP1基因是人或狗来源的RRBP1基因或其同源基因。
[25]一种转化的宿主细胞,其中已经导入了根据[18]至[24]中的任一项的表达载体。
[26]一种转化的宿主细胞,其中已经导入了包含激活的HAC1基因的表达载体和包含RRBP1基因的表达载体。
[27]根据[26]的转化的宿主细胞,其中所述包含激活的HAC1基因的表达载体是根据[18]或[19]的表达载体。
[28]根据[26]的转化的宿主细胞,其中所述激活的HAC1基因是编码啤酒糖酵母、里氏木霉或构巢曲霉的激活的HAC1蛋白的基因或其同源基因。
[29]根据[26]的转化的宿主细胞,其中所述RRBP1基因是人或狗来源的RRBP1基因或其同源基因。
[30]一种生产转化的宿主细胞的方法,其包含下述步骤:
(A)向宿主细胞中导入激活的HAC1基因;和
(B)向宿主细胞中导入RRBP1基因。
[31]根据[30]的方法,其中所述激活的HAC1基因是下述基因中的任一个:
(1)根据[17]的基因;
(2)编码啤酒糖酵母、里氏木霉或构巢曲霉的激活的HAC1蛋白的基因;
(3)编码由与啤酒糖酵母、里氏木霉或构巢曲霉的激活的HAC1蛋白的氨基酸序列具有至少70%同源性的氨基酸序列组成、且具有激活UPR的功能的蛋白的基因;
(4)编码由通过缺失、置换和/或添加一个或几个氨基酸从啤酒糖酵母、里氏木霉或构巢曲霉的激活的HAC1蛋白的氨基酸序列衍生的氨基酸序列组成、且具有激活UPR的功能的蛋白的基因;和
(5)在严格条件下与由编码啤酒糖酵母、里氏木霉或构巢曲霉的激活的HAC1蛋白的基因的核苷酸序列或其互补核苷酸序列组成的基因杂交、且编码具有激活UPR的功能的蛋白的基因。
[32]根据[30]的方法,其中所述RRBP1基因是下述基因中的任一个:
(1)编码人或狗来源的RRBP1的基因;
(2)编码由与人或狗来源的RRBP1的氨基酸序列具有至少70%同源性的氨基酸序列组成、且具有核糖体结合活性的蛋白的基因;
(3)编码由通过缺失、置换和/或添加一个或几个氨基酸从人或狗来源的RRBP1的氨基酸序列衍生的氨基酸序列组成、且具有核糖体结合活性的蛋白的基因;和
(4)在严格条件下与由人或狗来源的RRBP1基因的核苷酸序列或其互补核苷酸序列组成的基因杂交、且编码具有核糖体结合活性的蛋白的基因。
[33]根据[30]至[32]中的任一项的方法,其中所述宿主细胞是真核细胞。
[34]根据[33]的方法,其中所述真核细胞是酵母。
[35]根据[34]的方法,其中所述酵母是甲醇同化酵母。
[36]根据[35]的方法,其中所述甲醇同化酵母是Ogataea minuta。
[37]根据[34]的方法,其中所述酵母是啤酒糖酵母。
[38]选自下面(a)至(d)的基因:
(a)编码由SEQ ID NO:70所示氨基酸序列组成的蛋白的基因;
(b)编码由与SEQ ID NO:70所示氨基酸序列具有至少70%同源性的氨基酸序列组成、且具有激活解折叠蛋白应答(UPR)的功能的蛋白的基因;
(c)编码由通过缺失、置换和/或添加一个或几个氨基酸从SEQID NO:70所示氨基酸序列衍生的氨基酸序列组成、且具有激活UPR的功能的蛋白的基因;和
(d)在严格条件下与由SEQ ID NO:69所示核苷酸序列或其互补核苷酸序列组成的DNA杂交、且编码具有激活UPR的功能的蛋白的基因。
[39]包含根据[38]的基因的表达载体。
[40]根据[39]的表达载体,它是pOMexPGHy/PpHac1。
[41]一种生产蛋白的方法,其包含,在抑制O-糖链合成的条件下,在培养基中培养已经导入激活的HAC1基因和/或RRBP1基因和编码外源蛋白的基因的转化细胞,和从培养产物进行靶蛋白取样。
[42]根据[41]的生产蛋白的方法,其中通过插入灭活PMT基因来抑制O-糖链合成。
[43]根据[41]的生产蛋白的方法,其中通过向培养基中添加PMT活性的抑制剂来抑制O-糖链合成。
[44]根据[41]的生产蛋白的方法,其中通过插入灭活PMT基因和向培养基中添加PMT活性的抑制剂来抑制O-糖链合成。
[45]根据[43]或[44]的生产蛋白的方法,其中所述PMT活性的抑制剂是5-[[3,4-(1-苯基甲氧基)苯基]亚甲基]-4-氧代-2-硫代-3-噻唑烷乙酸或{(5Z)-4-氧代-5-[3-(1-苯基乙氧基)-4-(2-苯基乙氧基)亚苄基]-2-硫代-1,3-噻唑烷-3-基}乙酸。
[46]一种转化的宿主细胞,其具有插入灭活的PMT基因和导入其中的激活的HAC1基因。
[47]根据[46]的转化细胞,其中所述宿主细胞是Ogataea minuta。
附图简述
图1显示了得到O.minuta的激活的HAC1基因的方法和其结构。
图2概要显示了本发明的技术范围。
图3显示了O.minuta的激活的HAC1基因的表达载体(pOMexPGHy/Hac1)、人RRBP1基因的表达载体(pOMexGP1A/p180)和人抗体基因的表达载体(pOMexGAT-G/Ab)的结构。
图4显示了在已经导入O.minuta的激活的HAC1基因和人RRBP1基因的产抗体酵母菌株的培养上清液中分泌的抗体的蛋白印迹分析结果。
图5中的图显示了测量已经导入O.minuta的激活的HAC1基因和人RRBP1基因的产抗体酵母菌株分泌的抗体的量的结果。
图6显示了在已经导入O.minuta的激活的HAC1基因和人RRBP1基因的产抗体酵母菌株的培养上清液中分泌的抗体的蛋白印迹分析结果,所述菌株已经在抑制O-糖链形成的条件下培养。
图7显示了啤酒糖酵母的活性HAC1的表达载体(YEp351GAP-II-aHAC1)、人RRBP1基因的的表达载体(YEp351GAP-II-p180)、人抗体基因的表达载体(YEp352GAP-II-alfHc/alfLc)和激活的HAC1基因和RRBP1基因的共表达载体(YEp351GAP-II-aHAC1/p180)。
图8A的图显示了已经导入啤酒糖酵母的激活的HAC1基因的表达载体和人RRBP1基因的表达载体的产抗体酵母菌株的抗体分泌生产能力的对比结果。图8B的图显示了在抑制O-糖链形成的条件下已经导入啤酒糖酵母的激活的HAC1基因的表达载体和人RRBP1基因的表达载体的产抗体酵母菌株的抗体分泌生产能力的对比结果。图8C的图显示了在添加或不添加PMT抑制剂的情况下已经导入啤酒糖酵母的激活的HAC1基因的表达载体和人RRBP1基因的表达载体的产抗体酵母菌株的抗体分泌生产能力(绝对值)的对比结果。
图9显示了已经导入合成抗体基因(其中密码子已经被置换)的产抗体菌株中抗体生产的蛋白印迹分析结果。
图10显示了已经导入酵母菌株来源的激活的HAC1基因的产抗体菌株的培养上清液的蛋白印迹分析结果。
图11显示了已经导入酵母菌株来源的激活的HAC1基因的产抗体菌株的抗体分泌生产量。
图12显示了具有插入灭活的PMT1基因-或PMT2基因的产抗体菌株的培养上清液的蛋白印迹分析结果,和已经导入激活的HAC1基因的产抗体菌株的培养上清液的蛋白印迹分析结果。
图13显示了具有插入灭活的PMT1基因-或PMT2基因的产抗体菌株的抗体分泌生产量,和已经导入激活的HAC1基因的产抗体菌株的抗体分泌生产量。
图14显示了具有插入灭活的PMT4基因的产抗体菌株的培养上清液的蛋白印迹分析结果,和已经导入激活的HAC1基因的产抗体菌株的培养上清液的蛋白印迹分析结果。
图15显示了具有插入灭活的PMT4基因的产抗体菌株的抗体分泌生产量,和已经导入激活的HAC1基因的产抗体菌株的抗体分泌生产量。
图16A显示了PMT5基因-或PMT6基因-缺陷型产抗体菌株的培养上清液的蛋白印迹分析结果。图16B显示了PMT5基因-或PMT6基因-缺陷型产抗体菌株的抗体分泌生产量。
图17显示了在添加PMT抑制剂(1c)的情况下,通过培养具有插入灭活的PMT2或PMT4基因和导入其中的激活的HAC1基因的产抗体菌株得到的培养上清液的蛋白印迹分析结果。
图18A显示了在添加PMT抑制剂(1c)的情况下,通过培养具有插入灭活的PMT2和导入其中的激活的HAC1基因的产抗体菌株得到的培养上清液的抗体分泌生产量。图18B显示了在添加PMT抑制剂(1c)的情况下,通过培养具有插入灭活的PMT4和导入其中的激活的HAC1基因的产抗体菌株得到的培养上清液的抗体分泌生产量。
图19显示了已经在添加多种PMT抑制剂(绕丹宁-3-乙酸衍生物)的情况下培养的培养上清液的蛋白印迹分析结果。
图20显示了已经在添加多种PMT抑制剂(绕丹宁-3-乙酸衍生物)的情况下培养的培养上清液的抗体分泌生产量。
下面详细描述本发明。本专利申请要求2006年5月16日提交的日本专利申请号2006-136993的优先权,且包括在其说明书中公开的全部或部分内容。
本发明由下述两部分组成。具体而言,(A)与蛋白的高水平分泌生产有关的基因的导入和(B)酵母(和霉菌)固有的O-糖链添加的抑制的组合,可以在蛋白的高水平分泌生产方面产生协同效应。
下面详细描述本发明。
本发明提供了用于蛋白的高水平分泌生产的基因,包含这样的基因的表达载体,导入了这样的表达载体的转化的宿主细胞,和使用这样的转化的宿主细胞生产蛋白的方法。
1.用于蛋白的高水平分泌生产的基因
(1)HAC1基因
在本发明中,用于蛋白的高水平分泌生产的基因是HAC1基因。HAC1基因作为无活性的HAC1基因存在于基因组上;但是,在内质网应激应用后由HAC1基因转录的mRNA会被Ire1p剪接,转化成编码转录因子HAC1蛋白(Hac1p)的mRNA。翻译的Hac1p然后激活解折叠蛋白应答(UPR)。在本发明中,将激活的HAC1基因定义为编码HAC1蛋白(Hac1p)的cDNA(即,与mRNA互补)。
因此,优选使用激活的HAC1基因,以便进一步提高本发明的效应。特定程度的效应也可以通过导入灭活的HAC1基因来实现。
在下文中,描述了编码实际上造成UPR起作用的Hac1p的激活的HAC1基因。HAC1p的组分是,从N末端开始,在生物体中高度保守的DNA-结合域、亮氨酸拉链区和在其中剪接mRNA且被Ire1p新添加在C末端的未知活性区。
在本发明中使用的激活的HAC1基因没有特别限制,只要这样的基因会编码激活的HAC1蛋白即可。实例包括在本发明中新获得的编码由源自Ogataea minuta(O.minuta)的SEQ ID NO:23所示的氨基酸序列组成的蛋白的DNA,和编码由SEQ ID NO:70所示的源自巴斯德毕赤氏酵母的氨基酸序列组成的蛋白的DNA。可以采用与其同源的功能等价DNA。
术语“同源DNA”是指,例如,编码由与SEQ ID NO:23或70所示的氨基酸序列具有至少70%同源性的氨基酸序列组成、且具有激活解折叠蛋白应答(UPR)的功能的蛋白的基因,编码由通过缺失、置换和/或添加一个或几个氨基酸从SEQ ID NO:23或70所示的氨基酸序列衍生的氨基酸序列组成、且具有激活UPR的功能的蛋白的基因,和在严格条件下与由SEQ ID NO:22或69所示核苷酸序列或其互补核苷酸序列组成的DNA杂交、且编码具有激活UPR的功能的蛋白的基因。
术语“与SEQ ID NO:23或70所示的氨基酸序列具有至少70%同源性的氨基酸序列”是指具有优选至少80%、更优选至少90%和最优选至少95%同源性的氨基酸序列。使用例如日本的DNA数据库(DDBJ),通过FASTA、BLAST或其它程序,可以进行蛋白同源性搜索。
前述“SEQ ID NO:23或70所示氨基酸序列中的一个或几个氨基酸”中的术语“几个”指示的数目没有特别限制。例如,术语“几个”大约指20或更少,优选10或更少,更优选7或更少,和进一步优选5或更少。
在前述的“严格条件”下,形成所谓的特异性杂交体,但是不形成非特异性杂交体。在这样的条件下,例如,高度同源的DNA,即由与SEQID NO:22或69所示核苷酸序列具有至少80%、优选至少90%、更优选至少95%同源性的核苷酸序列组成的DNA的互补链,会经历杂交,但是具有更低同源性水平的DNA的互补链不会经历杂交。更具体而言,钠浓度是150至900mM,优选600至900mM,温度是60℃至68℃,优选65℃。
通过本领域已知的技术,例如Kunkel方法或有缺口的双链体方法,或根据它们的技术,可以导入上述突变,例如缺失、置换和/或添加。例如,可以使用定点诱变的诱变试剂盒,例如Mutant-K(Takara Bio),Mutant-G(Takara Bio),或LA PCR体外诱变系列试剂盒(Takara Bio)。
术语“激活UPR的功能”是指,激活内质网(ER)的抗解折叠的蛋白积累的防御反应(例如转录的抑制,分子伴侣诱导的折叠加速,变性蛋白的降解或细胞凋亡造成的细胞死亡)的功能。激活UPR的功能基本上等同于编码由SEQ ID NO:23或70所示的氨基酸序列组成的蛋白的基因的功能。
激活的HAC1基因可以是O.minuta、巴斯德毕赤氏酵母或另一种甲醇同化酵母的基因。其实例包括,编码源自多形汉逊酵母(安格斯毕赤氏酵母)、甲醇毕赤氏酵母和博伊丁假丝酵母的激活的HAC1蛋白的基因。也可以是源自另一个生物物种的激活的HAC1基因,例如其它类型的酵母或霉菌。其实例包括,编码源自啤酒糖酵母的激活的HAC1蛋白(GenBank登记号:NP_116622)的基因(YFL031W,GenBank登记号:由Ire1p从D26506剪接的DNA),编码源自里氏木霉激活的HAC1蛋白(GenBank登记号:CAC88374)的基因(GenBank登记号:AJ413272),和编码源自构巢曲霉活性HacA蛋白(GenBank登记号:CAC88375)的基因(GenBank登记号:AJ413273)。
编码源自啤酒糖酵母、里氏木霉和构巢曲霉的激活的HAC1蛋白的基因的核苷酸序列如SEQ ID NO:39,41,和43所示,对应的氨基酸序列如SEQ ID NO:40,42,和44所示。
本文分离的源自Ogataea minuta和巴斯德毕赤氏酵母的激活的HAC1基因是从啤酒糖酵母以外的酵母菌株分离的首个基因。这强烈暗示着,目标基因普遍存在于酵母菌株中,例如甲醇同化酵母菌株。因此,这些基因是在本发明使用的激活的HAC1基因的范围内。
此外,激活UPR的转录因子可以用作前述激活的HAC1基因的替代方案。一个实例是,来自XBP-1基因(例如具有GenBank登记号:NM_005080的人-来源的基因)的、在被Ire1p剪接后激活的基因,它是从动物细胞或其它物种来源的HAC1同源物。也激活HAC1(XBP-1)的Ire1的人工激活,也对应着UPR的激活。因此,认为与导入激活的HAC1基因等价。此外,认为未激活的HAC1基因的强制表达会产生与导入上述激活的HAC1等价的作用。
可以通过任意方法来得到激活的HAC1基因,只要会诱导UPR即可。例如,mRNA可以从下述细胞得到:在其中高水平表达编码难以折叠的蛋白的基因的细胞,或用糖链修饰抑制剂例如衣霉素、氧化还原剂例如DTT或过氧化氢、或UPR诱导物处理过,此后由其合成cDNA的细胞。通过使用DNA合成仪合成其一部分或全长,也可以从已经公开的序列得到mRNA。
(2)RRBP1基因
在本发明中,用于蛋白的高水平分泌生产的另一个基因的实例是RRBP1基因。RRBP1基因是编码称作核糖体结合蛋白1的蛋白的基因,它也称作hES,ES130,ES/130,或DKFZp586A1420基因。哺乳动物RRBP1基因由N-末端跨膜区、富含碱性氨基酸的后续区域、包含10个氨基酸残基的序列的54个重复序列、和C-末端区组成。
在本发明中使用的RRBP1基因没有特殊限制,只要它编码核糖体结合蛋白1即可。实例包括人-来源的RRBP1基因(编码KIAA1398蛋白;GenBank登记号:AB037819)和狗-来源的RRBP1基因(编码核糖体受体p180;GenBank登记号:X87224)。只要与前述基因在功能上等价,可以使用其同源基因。人-来源的RRBP1基因和狗-来源的RRBP1基因的核苷酸序列如SEQ ID NO:45和47所示,对应的氨基酸序列如SEQ ID NO:46和48所示。
同源基因的实例包括:编码由与人或狗来源的RRBP1的氨基酸序列具有至少70%同源性的氨基酸序列组成、且具有核糖体结合活性的蛋白的基因;编码由通过缺失、置换和/或添加一个或几个氨基酸从人或狗来源的RRBP1的氨基酸序列衍生的氨基酸序列组成、且具有核糖体结合活性的蛋白的基因;和在严格条件下与由人或狗来源的RRBP1基因的核苷酸序列或其互补核苷酸序列组成的基因杂交、且编码具有核糖体结合活性的蛋白的基因。同源性程度、严格条件和诱变方法如上所述。
这样的同源基因的具体实例包括源自小鼠(登记号:XM_622097,XM_91338,和XM_991888)、大鼠(登记号:XM_230637)、非洲爪蟾(登记号:NM_001005671)和斑马鱼(zebra danio)(登记号:NM_199431)的RRBP1基因。
RRBP1基因也可以通过普遍已知的技术来得到。例如,可以从在其中表达RRBP1基因的细胞制备mRNA,且可以进一步合成cDNA。
在本发明中,通过制备mRNA和使用反转录酶合成cDNA的一般技术,可以得到用于蛋白的高水平分泌生产的前述基因和编码作为下述高水平分泌生产的靶的外源蛋白的基因(这些基因在下文中称作“靶基因”)。作为前述一般技术的一个实例,使用从靶基因片段合成的DNA探针,筛选源自在其中表达靶基因的细胞或组织的cDNA文库,以便分离目标基因。通过本领域普遍使用的技术,可以制备mRNA。例如,可以用胍试剂或苯酚试剂处理前述细胞或组织,以得到总RNA,然后通过亲和柱方法,使用寡(dT)纤维素柱或聚尿苷酸-琼脂糖凝胶,使用琼脂糖凝胶2B作为载体,或批式技术,得到聚腺苷酸+RNA(mRNA)。此外,通过蔗糖密度梯度离心或通过其它方式,可以分离聚腺苷酸+RNA。随后,将得到的mRNA用作模板,使用寡dT引物和反转录酶合成单链cDNA,使用DNA合成酶I、DNA连接酶、RNA酶H等从单链cDNA合成双链cDNA。使用T4 DNA合成酶,将合成的双链cDNA平端化,进行衔接子(例如EcoRI衔接子)的连接、磷酸化等,掺入λ噬菌体例如λgt11,然后体外包装,以制备cDNA文库。除了λ噬菌体以外,可以使用质粒载体来制备cDNA文库。此后,可以从cDNA文库选择具有目标DNA的菌株(即,阳性克隆)。
当从基因组DNA分离靶基因时,或当分离含有启动子区域和终止子区域的片段时,从源生物的细胞菌株提取基因组DNA,并根据普通技术选择靶基因(Molecular Cloning,1989;Methods in enzymology 194,1991)。例如通过Cryer等人的方法(Methods in Cell Biology,12,39-44,1975)或P.Philippsen等人的方法(Methods Enzymol.,194,169-182,1991),可以提取基因组DNA。当来源是酵母菌株时,例如,制备酵母原生质体,然后对酵母原生质体进行常规技术,例如已知的DNA提取技术、在高盐浓度去除细胞残余物后的醇沉淀技术或在苯酚或氯仿提取后的醇沉淀技术。
通过例如PCR(PCR Technology,Henry A.Erlich,Stockton Press,1989),可以得到靶基因。当通过PCR扩增靶基因时,将合成的20聚体至30聚体单链DNA用作引物,将基因组DNA用作模板。证实扩增的基因的核苷酸序列,然后使用。
通过下述方法可以得到含有序列未知的靶基因的片段:(a)通过常规技术制备基因文库,和(b)从得到的要扩增的基因文库选择目标克隆。通过下述方法可以制备基因文库:通过常规技术从源生物的细胞系得到染色体DNA,用适当的断裂限制酶部分地消化染色体DNA,将得到的片段连接至适当的载体,然后将该载体导入适当的宿主细胞。或者,可以从细胞提取mRNA,可以从其合成cDNA,可以将合成的cDNA连接至适当的载体,并且可以将该载体导入适当的宿主细胞,从而可以制备基因文库。在该情况下,可以使用已知是基因文库制备的常规载体的质粒,可以广泛地使用噬菌体、粘粒或其它载体。根据载体类型,可以选择进行转化或转导的宿主细胞。
通过菌落杂交、噬斑杂交或包含使用含有靶基因特异性序列的标记探针的其它方式,可以从上面的基因文库选择携带靶基因片段的克隆。
也可以对靶基因进行化学全合成。例如,制备2对互补的寡核苷酸,然后退火,在DNA连接酶的辅助下连接几个退火的DNA链,或制备几个部分互补的寡核苷酸,通过PCR填充缺口。从而,可以合成基因。
通过常规技术,例如双脱氧方法(Sanger等人,Proc.Natl.Acad.Sci.,U.S.A.,74,5463-5467,1977),可以测定基因的DNA序列。此外,使用可商业得到的测序试剂盒等,可以容易地测定上述DNA核苷酸序列。
2.表达载体
本发明提供了包含激活的HAC1基因或RRBP1基因的载体,或包含激活的HAC1基因和RRBP1基因两者的载体。为了在宿主细胞中表达激活的HAC1基因和RRBP1基因,可以将包含激活的HAC1基因或RRBP1基因的载体用于实现转化。或者,包含这两个基因的载体可以用于实现转化。这样的表达载体也可以包含编码外源蛋白的基因。或者,可以分别制备包含编码外源蛋白的基因的表达载体。在该情况下,将载体共转染进宿主细胞。
编码外源蛋白的基因没有特别限制。实例包括:各种酶基因,例如α-淀粉酶基因和α-半乳糖苷酶基因;可药用的各种干扰素基因和生理活性蛋白,例如干扰素α和干扰素γ;各种白介素基因,例如IL1和IL2;各种细胞因子基因,例如促红细胞生成素(EPO)基因和粒细胞集落刺激因子(G-CSF)基因;和生长因子基因。这些基因可以通过任意方式来得到。
本发明对于高度疏水的蛋白和由于组分形成而分泌生产不足的蛋白是特别有效的。因而,前述的外源蛋白包括多聚体蛋白,例如抗体或它的功能片段,即,异多聚体。
可以将表达调节区适当地添加到激活的HAC1基因、RRBP1基因或编码外源蛋白的基因,以将表达载体构成蛋白表达单元。蛋白表达单元按照转录读码框的方向包含至少一个启动子区、上述基因和转录终止子区。这里可以使用的启动子可以是诱导型表达启动子或组成型表达启动子。诱导型表达启动子的实例包括参与甲醇同化酵母的甲醇代谢的启动子,例如醇氧化酶(AOX)基因启动子,二羟基丙酮合酶(DAS)基因启动子,和甲酸脱氢酶(FDH)启动子。可以使用的另一种诱导型启动子的实例是铜-诱导型(CUP)启动子。组成型表达启动子的实例包括甘油醛-3-磷酸脱氢酶(TDH,GAP)基因、磷酸甘油激酶(PGK)基因、磷酸丙糖异构酶(TPI)基因、烯醇酶(ENO)基因、肌动蛋白(ACT)基因、细胞色素c(CYC)基因、海藻糖合酶(TPS)基因和醇脱氢酶(ADH)基因的启动子。转录终止子也可以是具有终止启动子的转录的活性的序列。它可以是启动子的相同或不同基因的序列。
为了实现外源蛋白的高水平分泌生产,必须使用有效的启动子。当尝试使用高活性启动子来生产不容易折叠或不容易分泌的蛋白时,可能不利地发生分泌过少。这样的分泌过少因为下述原因而发生。也就是说,蛋白生产超过了在其中进行翻译的核糖体的容量和在其中进行折叠和分泌的内质网的容量。这造成大量生产的蛋白在细胞中变性、积累、遍在蛋白化,和被蛋白体降解。因此,可以适当选择达到下述程度的表达水平的启动子:得到的蛋白会变性,且不会发生聚集,或得到的蛋白不会超过分泌容量。或者,可以减弱启动子的活性,然后可以使用感兴趣的启动子。可以如上在多聚体蛋白中所述,影响形成异多聚体的分子。更具体地,分子例如抗体是包含2个分子的异四聚体,所述2个分子各自是要聚集的重链和轻链。因而,表达水平是实现适当足够的重要因素。当激活的HAC1基因的表达强度非常强时,过度应激会施加于细胞,这可能不利地抑制生长。因而,如上所述需要启动子活性的调节和优化。
本发明的表达载体可以包含用于选择转化体的选择标记。例如,酵母的表达载体可以包含选自下述的营养缺陷型标记基因:His1,His2,His3,His4,His5,His6,Leu2,Alg1,Alg2,Alg3,Trp1,Lys2,Ade1,Ade2,Ura3,和Ura5基因。
作为选择标记,除了前述的营养缺陷型标记以外,可以使用赋予对药物的抗性的抗药标记,所述药物例如浅蓝菌素,金担子素,Zeocin,刀豆氨酸,环己酰亚胺,潮霉素,杀稻瘟素,四环素,卡那霉素,氨苄西林,四环素,和新霉素。从而,可以选择转化体。也可以将赋予对乙醇的溶剂抗性、对甘油或盐的渗透抗性、对铜的金属离子抗性等的基因用作标记,从而选择转化体。
3.转化的宿主细胞
本发明的转化的宿主细胞包含导入其中的上面1所述的基因或上面2所述的表达载体。
要转化的宿主细胞的一个实例是真核细胞,优选酵母菌株。酵母菌株的实例包括甲醇同化酵母菌株,例如Ogataea minuta,巴斯德毕赤氏酵母,多形汉逊酵母(安格斯毕赤氏酵母),和博伊丁假丝酵母和酵母菌株,例如啤酒糖酵母,乳酸克鲁维酵母,解脂耶氏酵母,和粟酒裂殖酵母。更具体地,Ogataea minuta YK3菌株(Δoch1Δpep4Δprb1Δyps1Δura3Δade1)可以用作Ogataea minuta菌株,啤酒糖酵母BY4741菌株(MATa Δhis3Δ leu2Δmet15Δ ura3)可以用作啤酒糖酵母菌株,尽管酵母菌株不限于此。
此外,本发明意在获得其中增强了分泌必需的内质网的宿主细胞。因此,本发明适用于动物细胞或其它细胞。
在本发明中,可以通过任意方法将表达载体导入宿主细胞中,只要导入的基因在宿主中稳定存在且充分表达即可。常用的这样的方法的实例包括磷酸钙方法(Ito等人,Agric.Biol.Chem.,48,341,1984),电穿孔(Becker,D.M.等人,1990;Methods.Enzymol.,194,182-187),使用原生质球(Creggh等人,Mol.Cell.Biol.,5,3376,1985),乙酸锂方法(Itoh,H.,1983;J.Bacteriol.153,163-168),和脂转染。
4.生产蛋白的方法
在本发明中,可以如下生产蛋白:通过常规技术培养转化的宿主细胞,从培养产物进行蛋白取样,随后纯化。本文使用的术语“培养产物”是指培养细胞、培养的菌株或破碎的细胞或细菌,以及培养上清液。
根据用于培养宿主细胞的常规方法,可以在培养基中培养转化的宿主细胞。
当转化的宿主细胞是微生物例如酵母时,可以将天然的或合成的培养基用作培养基,只要它含有可被微生物同化的碳源、氮源和无机盐且能有效培养转化体即可。可以使用可被微生物同化的任意碳源,其实例包括:碳水化合物例如葡萄糖,果糖,蔗糖,和淀粉;有机酸例如乙酸和丙酸;和醇例如乙醇和丙醇。氮源的实例包括:氨;无机酸或有机酸的铵盐例如氯化铵,硫酸铵,乙酸铵,和磷酸铵;其它含氮化合物;蛋白胨;肉膏;和玉米浆。无机盐的实例包括:磷酸二氢钾,磷酸氢二钾,磷酸镁,硫酸镁,氯化钠,硫酸铁(I),硫酸锰,硫酸铜,和碳酸钙。根据选择标记的类型,可以向培养基中适当添加抗生素试剂,例如金担子素,氨苄西林,或四环素。或者,可以去除可由补充辅源营养(例如Leu,Ura,或Trp)的基因提供的氨基酸。
当培养转化的宿主细胞时,在酵母的情况下,例如,优选将培养基的pH水平调节至4-7。培养温度是15℃至32℃,优选约28℃。当表达具有复杂空间结构的蛋白作为抗体时,优选在低温进行培养,以便在细胞中更有效地折叠这样的蛋白。培养持续时间通常是约24至1,000小时,培养可以通过批式培养(例如静止、摇动、搅拌或通气培养)或通过连续培养来实现。
通过SDS-PAGE,蛋白印迹,ELISA等,可以证实来自培养产物(即,培养液或培养的细胞)的外源蛋白的基因的表达产物。
通过常规的蛋白分离和纯化技术,可以分离和纯化生产的蛋白。当在培养后在细菌或细胞中生产靶蛋白时,使用例如超声粉碎机、弗氏细胞压碎器、Manton-Gaulin匀浆器、Dinomil等,可以将细菌或细胞粉碎,以获得靶蛋白。当在细菌或细胞外生产靶蛋白时,原样使用培养液,或通过离心等去除细菌或细胞。此后,根据需要如下收集靶蛋白:使用有机溶剂萃取,进行各种色谱技术(例如疏水、反相、亲和、或离子交换色谱),使用分子筛进行凝胶过滤,使用聚丙烯酰胺凝胶进行电泳等。这些技术可以单独地或两种或多种组合地使用。从而,可以分离和纯化靶蛋白。
上述培养和纯化技术是实例,方法不限于此。通过常规的氨基酸分析方法,例如通过Edman降解技术实现的自动化氨基酸测序,可以证实纯化的基因产物的氨基酸序列。
5.抑制O-糖链的方法(或抑制PMT活性的方法)
在本发明中,当酵母用作宿主细胞时,前述的培养优选在抑制蛋白O-甘露糖基转移酶(PMT)活性的条件下进行。
在通过肽O-GalNAc转移酶(主要存在于高尔基体中)添加GalNAc后,在哺乳动物细胞中形成O-糖链。这样的糖链添加发生在蛋白折叠之后。相反,酵母和霉菌细胞中的O-糖链形成是在通过由蛋白-O-甘露糖基转移酶(PMT)基因编码的PMT向蛋白的丝氨酸或苏氨酸残基添加甘露糖之后才启动。这样的添加称作PMT活性。甘露糖的添加与细胞内质网(ER)中的蛋白折叠并行进行。从而,不必要的糖链可能不利地添加到在表达哺乳动物蛋白的情况下不应发生这样的添加的部位。结果,这样的不必要的修饰会造成聚集体的不充分形成和更低的活性。
因此,通过在抑制蛋白O-甘露糖基转移酶(PMT)活性的条件下进行培养,可以抑制不必要的O糖链的形成。这也会加速蛋白聚集,并维持蛋白的天然物理性质和活性。在本发明中,通过导入激活的HAC1基因和/或RRBP基因来实现蛋白的高水平分泌生产作用,可以进一步产生协同效应,这通过抑制PMT活性来调节URP增强的O-糖链形成来实现。
通过例如下述的两种方法,可以抑制酵母或霉菌特有的O-糖链的添加。这些方法可以组合进行。
(1)在其抑制参与酵母或霉菌特有的O-糖链的添加的PMT活性的条件下,进行培养和生产。
(2)使用其中抑制参与酵母或霉菌特有的O-糖链的添加的PMT活性的细胞。
通过例如向培养基中加入PMT活性的抑制剂(即,PMT抑制剂),可以抑制上面(1)的蛋白O-甘露糖基转移酶(PMT)活性。可以使用的PMT活性的抑制剂的一个实例是绕丹宁-3-乙酸衍生物(Bioorganic &Medicinal Chemistry Letters 14,pp.3975-3978,2004)。绕丹宁-3-乙酸衍生物的具体实例包括5-[[3,4-(1-苯基甲氧基)苯基]亚甲基]-4-氧代-2-硫代-3-噻唑烷乙酸(在Bioorganic & Medicinal Chemistry Letters,Vol.14,p.3975,2004中所述的化合物(1c))和{(5Z)-4-氧代-5-[3-(1-苯基乙氧基)-4-(2-苯基乙氧基)亚苄基]-2-硫代-1,3-噻唑烷-3-基}乙酸(在Bioorganic &Medicinal Chemistry Letters,Vol.14,p.3975,2004中所述的化合物(5a))。这样的PMT活性的抑制剂(绕丹宁-3-乙酸衍生物)最初被视作抗细菌剂,没有为提高蛋白质量或生产力目的而检查它。在本发明中首次发现了该作用。PMT对于构成酵母菌株壁的甘露糖蛋白的产生而言是重要的。非常低的PMT活性会不利地影响酵母的生长。因此,当使用诱导型表达系统时,随着细胞生长在表达外源蛋白的基因时添加PMT活性抑制剂是更有效的。从而,可以在最高水平生产其中抑制了O-糖链修饰的高质量靶蛋白。
通过破坏PMT基因或抑制该基因的表达,可以抑制上面(2)所述的蛋白O-甘露糖基转移酶(PMT)活性。在啤酒糖酵母中,PMT由至少6个基因编码;即,PMT1基因(GenBank:L19169),PMT2基因(GenBank:L05146),PMT3基因(GenBank:X83797),PMT4基因(GenBank:X83798),PMT5基因(GenBank:X95644),和PMT6基因(GenBank:Z72984),这些基因独立地形成同二聚体(PMT4p)或异二聚体(PMT1p/PMT2p),且表现出活性。已知效应PMT随糖蛋白而异。在本发明中,发现PMT蛋白在向抗体添加O-糖链方面具有选择性。具体而言,在PMT5或PMT6基因缺陷型菌株中没有发现抑制O-糖链添加的作用,如实施例所述。
因而,PMT对于酵母的生长而言是重要的基因。当消除或极端降低活性、例如破坏PMT基因时,细胞壁会变脆。因而,PMT基因缺陷型菌株的使用需要注意。在WO 2002/046437中公开的PMT基因的破坏不总是有效的。它有时由于生长抑制而不利地影响外源蛋白的生长,希望抑制具有最佳PMT活性的PMT基因的破坏或表达,这可以使对靶蛋白的O-糖链添加和修饰最小化。抑制PMT基因的方法的实例包括,涉及使用反义RNA或RNAi的方法,和减弱启动子的方法。在本发明中,证实了在其中将DNA片段插入PMT结构基因部分和启动子区来切割基因的方法(在下文中,这样的方法可以称作“基因的插入灭活”,用于基因的插入灭活的质粒载体称作“插入灭活载体”)是减弱启动子的方式的一个实例。也可以采用这样的方法,其中导入不具有PMT活性但是作为蛋白产生的PMT基因片段或其活性相关氨基酸残基已经突变的基因,以抑制PMT活性(即,显性失活方法)。
实现本发明的最佳模式
在下文中,参考实施例详细描述本发明,尽管本发明的技术范围不限于实施例。在本发明的实施例中使用的质粒、限制酶、DNA修饰酶等是可商业得到的产品,这些产品可以根据常规技术使用。DNA克隆、核苷酸测序、宿主细胞转化、转化的宿主细胞的培养、从培养产物取样和纯化酶等的操作也是本领域众所周知的,可以从现有的出版物获知。
[实施例1]表达外源基因的质粒的构建
(1)构建表达外源基因的串联载体,其包含具有作为标记的G418-抗性基因的AOX1基因启动子、终止子盒和GAP基因启动子和终止子盒
在WO 2003/091431中公开的pOMex3G和pOMexGP1U用作材料。用XbaI切割pOMex3G,平端化,然后导入SpeI接头。得到的载体称作pOMex3GXS。单独地,用EcoT22I切割pOMexGP1U,并平端化,然后导入ApaI接头。得到的载体称作pOMexGP1UTA。用HindIII和KpnI消化pOMexGP1UTA,并平端化。此后,用ApaI消化分离的含有GAP启动子和终止子的约2.0kb的片段,然后导入平端化的pOMex3GXS。得到的载体称作pOMexGAT-G。pOMexGAT-G是包含AOX1表达盒内的SpeI-BamHI位点和GAP表达盒内的SalI-ApaI位点的串联载体。
(2)使用ADE1基因作为选择标记,使用GAP基因启动子和终止子构建表达外源基因的载体
在WO 2003/091431中公开的pOMex4A用作材料。用EcoT22I处理前述的pOMexGP1U,并平端化,然后导入BamHI接头。得到的载体称作pOMexGP2U。用SalI处理pOMexGP2U,并平端化,然后导入SpeI接头。得到的载体称作pOMexGP3U。用HindIII和KpnI消化pOMexGP3U,分离含有GAP表达盒的约2.0kb的片段。将得到的片段连接至包含通过用HindIII-KpnI处理pOMex4A分离的ADE1标记的约5.0kb片段。得到的载体称作pOMexGP1A。pOMexGP1A是包含GAP表达盒内的SpeI-BamHI位点的表达外源基因的载体。
(3)使用潮霉素B-抗性基因作为选择标记,使用磷酸甘油激酶(PGK1)启动子和终止子构建表达外源基因的载体
从Ogataea minuta IFO10746菌株得到编码磷酸甘油激酶的PGK1基因,并测定其核苷酸序列。
(3-1)探针的制备
以下述方式合成包含与源自啤酒糖酵母(GenBank登记号:P00560)和麦芽糖假丝酵母(GenBank登记号:P41757)的保守氨基酸序列即RVDFNVPLD和EGKELPGVA相对应的核苷酸序列的DNA简并引物。
PPG5:5′-GN GTN GAY TTY AAY GTN CCN TTR GA-3′(SEQ IDNO:1)
PPG3:5′-GY NAC DCC NGG YAA YTC YTT DCC YTC-3′(SEQ IDNO:2)
PPG5引物(SEQ ID NO:1)与氨基酸序列RVDFNVPLD相对应,PPG3引物(SEQ ID NO:2)是与氨基酸序列EGKELPGVA相对应的核苷酸序列的互补链的序列。O.minuta IFO10746菌株的染色体DNA用作模板,使用PPG5和PPG3引物进行PCR,该PCR在94℃进行30秒,在50℃进行1分钟,在72℃进行1分钟,该循环重复25次。回收扩增的DNA片段(约1.2kb),并使用TOPO TA克隆试剂盒克隆。从得到的克隆分离质粒DNA,并测定核苷酸序列。从而,选择在质粒插入的DNA片段中含有编码与源自啤酒糖酵母和麦芽糖假丝酵母的PGK1基因的氨基酸序列具有高度同源性的氨基酸序列的核苷酸序列的克隆。在用EcoRI切割质粒后,回收1.2-kb插入DNA的片段,随后进行琼脂糖凝胶电泳。
(3-2)文库的制备和筛选
用不同的限制酶切割O.minuta IFO10746菌株的染色体DNA,并进行0.8%琼脂糖凝胶电泳。将分离的DNA转移到Hybond N+尼龙膜(Amersham)上。使用AlkPhos DIRECT(Amersham)标记在上面(1-3-1)中得到的DNA片段,随后进行DNA印迹杂交。根据常规技术(Molecularcloning第2版,Sambrook,J.,等人编,Cold Spring Harbor LaboratoryU.S.A.,1989)进行杂交。结果,认为PGK1基因存在于约9.0kb的BamHI片段中。为了克隆该DNA片段,制备了基因组文库。用BamHI切割O.minuta的染色体DNA,并进行琼脂糖电泳,从凝胶回收约9.0kb的DNA片段。将回收的DNA片段连接至BamHI-切割的pUC118,并根据Hanahan的方法(Gene,10,63,1980)转化进大肠杆菌DH5α菌株,以制备文库。使用前述的DNA片段作为探针,通过菌落杂交筛选约4,000个克隆。从得到的阳性克隆中,选择携带PGK1基因的pOMPGK1质粒。
(3-3)核苷酸测序
通过引物步移方法,测定pOMPGK1质粒的BamHI区域的核苷酸序列,发现测定的序列具有SEQ ID NO:3所示的核苷酸序列。SEQ IDNO:3所示的核苷酸序列包括一个可读框,后者包含从核苷酸4,766至6,016的1,254个碱基对。检查基于可读框推导出的SEQ ID NO:4所示的氨基酸序列与源自啤酒糖酵母和麦芽糖假丝酵母的和磷酸甘油激酶之间的同源性。结果,发现前一种同源性是74%,后一种同源性是81%。
(3-4)使用PGK1基因启动子和终止子构建外源基因表达盒
制备表达盒,其将外源基因导入含有PGK1基因启动子的片段和含有O.minuta的终止子的片段之间。为了在PGK1基因启动子和终止子之间导入SpeI、BglII和BamHI位点,合成了下述引物。
OPGK-P-F:
5′-AAGCTTGACAATGTAGGAGATCATAAACACATCGTGCGCGTC-3′(SEQ ID NO:5)
OPGK-P-R:
5′-GGATCCAGATCTCATATGACTAGTTGCTAGTTCTATGCGGCGTTAGTGTTTACACTACGACAGCT-3′(SEQ ID NO:6)
OPGK-T-F:
5′-GGATCCGTGGGATTTGCGTGATCTACGTAGTGGTTATTTT-3′(SEQID NO:7)
OPGK-T-R:
5′-GGTACCGCAGTGAAAGGCGATGCCACCATGTGCAAGGAGTTC-3′(SEQ ID NO:8)
使用上述pOMPGK1作为模板,使用OPGK-P-F引物(SEQ ID NO:5)和OPGK-P-R引物(SEQ ID NO:6)进行PCR,在94℃进行30秒,在55℃进行1分钟,在72℃进行1分钟,该循环重复20次。还使用OPGK-T-F引物(SEQ ID NO:7)和OPGK-T-R引物(SEQ ID NO:8)进行PCR,该PCR在94℃进行30秒,在55℃进行1分钟,在72℃进行1分钟,该循环重复20次。回收扩增的1.5-kb和1.0-kb DNA片段,并使用TOPO TA克隆试剂盒克隆。测定插入DNA片段的核苷酸序列,以选择具有正确核苷酸序列的克隆。将1.5-kb和1.0-kb插入DNA片段分别分离为HindIII-BamHI片段和BamHI-KpnI片段。
将前述的1.0-kb BamHI-KpnI片段导入WO 2003/091431所述的pOMex5H的BamHI和KpnI之间。此后,将前述的1.5-kb HindIII-BamHI片段导入得到的质粒的HindIII和BamHI之间。得到的质粒称作pOMexPGHy。pOMexPGHy是表达外源基因的载体,其包含PGK1基因表达盒内的SpeI,BglII,和BamHI。
[实施例2]抗体基因表达载体的构建
为了克隆源自啤酒糖酵母的MF α1(GenBank登记号:P01149)的分泌信号(下文称作“aMF分泌信号”),合成了下述引物。
Sp-aMFs-F:5′-ACTAGTATGAGATTTCCTTCAATTT-3′(SEQ ID NO:9)
Sl-aMFs-F:5′-GTCGACATGAGATTTCCTTCAATTT-3′(SEQ ID NO:10)
Xb-aMFs-R:5′-AGCTTCAGCCTCTCTTTTATCTAGAGA-3′(SEQ IDNO:11)
以与上述相同的方式得到的啤酒糖酵母的基因组DNA用作模板,使用Sp-aMFs-F引物(SEQ ID NO:9)和Xb-aMFs-R引物(SEQ ID NO:11)进行PCR,该PCR在94℃进行30秒,在55℃进行1分钟,在72℃进行30秒,该循环重复20次。也使用Sl-aMFs-F引物(SEQ ID NO:10)和Xb-aMFs-R引物(SEQ ID NO:11)进行PCR,该PCR在94℃进行30秒,在55℃进行1分钟在72℃进行30秒,该循环重复20次。回收在每个PCR中的约0.3kb的扩增的DNA片段,并使用TOPO TA克隆试剂盒进行克隆。证实插入DNA序列的核苷酸序列,得到的质粒分别称作TOPOaMFsSP和TOPOaMFsSL。
将抗-TRAIL受体抗体基因(WO 2002/094880)用作抗体基因。为了将限制酶位点导入在轻链和重链基因的两端处的位点,合成了下述引物。
Xb-KREAEA-Hc-F:
5′-TCTCTAGATAAAAGAGAGGCTGAAGCTCAGCTGCAGCTGCAGGAGTC-3′(SEQ ID NO:12)
Hc-R-Bg:
5′-CCAGATCTGGATCCTCATTTACCCGGAGACAGGGAGAGG-3′(SEQID NO:13)
Xb-KREAEA-Lc-F:
5′-TCTCTAGATAAAAGAGAGGCTGAAGCTGAAATTGTGTTGACACAGTC-3′(SEQ ID NO:14)
Lc-R-Ap:
5′-AAAGGGCCCTCAACACTCTCCCCTGTTGAAGCTCT-3′(SEQ ID NO:15)
使用这些DNA引物进行PCR,经下述的20个循环扩增轻链:在94℃进行30秒,在55℃进行1分钟,在72℃进行1分钟,并经下述的20个循环扩增重链:在94℃进行30秒,在55℃进行1分钟,在72℃进行1分钟30秒,并将扩增的产物克隆进pCR2.1-TOPO。证实插入DNA序列的核苷酸序列,得到的质粒分别称作TOPOHc-Trail和TOPOLc-Trail。经3片段连接,将通过SalI和XbaI消化从TOPOaMFsSL分离的aMF分泌信号和通过XbaI和ApaI消化从TOPOLc-Trail分离的抗体轻链导入SalI-ApaI-消化的pOMexGAT-G。得到的质粒称作pOMexGAT-G/L。随后,经3片段连接,将通过SpeI和XbaI消化从TOPOaMFsSP分离的aMF分泌信号和通过XbaI和BglII消化从TOPOHc-Trail分离的抗体重链导入SpeI-BamHI-消化的pOMexGAT-G/L。得到的载体称作pOMexGAT-G/Ab(图3)。pOMexGAT-G/Ab是包含抗体重链和轻链表达单元的抗体表达载体。
[实施例3]O.Minuta的激活的HAC1基因表达载体的构建
如下得到激活的HAC1基因:在27℃在YPD培养基中培养细胞(O.minuta YK2-3菌株)12小时,在培养基中加入衣霉素至10μg/ml的浓度,以便诱导UPR。在含有衣霉素的培养基中培养另外12小时。收集细胞后,使用Yeastar RNA试剂盒(ZYMO research)制备mRNA。
使用DNA酶I Amplification Grade(Invitrogen),对得到的mRNA进行DNA酶处理。使用Super script III用于RT的第一链合成(Invitrogen),从mRNA合成cDNA。使用下述的HAC1-1 DNA引物(SEQID NO:16)和HAC1-12引物(SEQ ID NO:17),通过PCR扩增得到的cDNA:在94℃进行30秒,在52℃进行30秒,在72℃进行1分钟,该循环重复30次。将扩增的产物克隆进pCR2.1-TOPO(Invitrogen)。此后,证实两类PCR-扩增的基因片段的核苷酸序列(SEQ ID NO:18和19)。
HAC1-1:5′-ATGACTTCCTTTTCAGCACCGCATC-3′(SEQ ID NO:16)
HAC1-12:5′-CAAAATTGCAAGCAAGTTAACCG-3′(SEQ ID NO:17)
得到的两类cDNA片段之一与基因组序列相一致;但是,另一个片段是缺少其一部分的缩短的序列,即,由UPR激活的Ire1p剪接的cDNA片段。为了得到激活的HAC1的cDNA,使用cDNA合并物重复在94℃进行30秒、在55℃进行1分钟和在72℃进行30秒的PCR循环20次,推导出它含有speHAC1F DNA引物(SEQ ID NO:20)、bglHAC1R引物(SEQ ID NO:21)和激活的HAC1的cDNA。
speHAC1F:5′-gactagtATGACTTCCTTTTCAGCACCG-3′(SEQ IDNO:20)
bglHAC1R:5′-cagatctTCATGACAAGAAATCATCGAAT-3′(SEQ IDNO:21)
得到的约1kb的片段包含从激活的HAC1基因的起始密码子至终止密码子的序列(SEQ ID NO:22),它等同于包含320个氨基酸残基的激活的Hac1p的氨基酸序列(SEQ ID NO:23)。用SpeI和BglII处理该序列,分离,然后导入SpeI-BglII-处理过的pOMexPGHy。得到的载体称作pOMexPGHy/Hac1(图3)。该载体包含激活的HAC1基因表达单元。
[实施例4]人RRBP1基因表达载体的构建
使用由Kazusa DNA研究机构提供的人RRBP1基因(KIAA1398,GenBank登记号AB037819)。为了在该基因的两个末端部导入限制酶位点,使用下述DNA引物,即p180 MSp-F和p180 UBg-R(SEQ ID NO:24和25)和人RRBP1基因,经20个在94℃进行30秒、在55℃进行1分钟和在72℃进行5分钟的循环,通过PCR扩增目标基因。
p180                                    MSp-F:
5′-ATACAATACAAAGTCGAGACTAGTATGGATATTTACGACACTCAAACCTT-3′(SEQ ID NO:24)
p180                                    UBg-R:
5′-TCTATCCACACGGATCAGATCTTCAGACAGAGGTGCCCTCCTTTGAGCTG-3′(SEQ ID NO:25)
使用BD In-Fusion Dry-Down PCR克隆试剂盒(BD Science),将得到的约4.5kb的片段导入SpeI-BamHI-消化的pOMexGP1A。从SpeI位点确定包含编码人RRBP1基因起始密码子的区域的约500bp序列,并从BamHI位点确定包含编码人RRBP1基因终止密码子的区域的约500bp片段。得到的载体称作pOMexGP1A/p180PCR。用NdeI和AscI消化pOMexGP1A/p180PCR,从质粒去除包含人RRBP1基因的ORF中从110bp至4541bp的区域的片段。单独地,用NdeI和AscI消化由Kazusa DNA研究机构提供的人RRBP1基因,分离包含ORF的110bp至4541bp的区域的片段,将分离的片段导入前述的NdeI-AscI-消化的pOMexGP1A/p180PCR。得到的载体称作pOMexGP1A/p180(图3)。pOMexGP1A/p180是人RRBP1基因表达载体。
[实施例5]表达抗体的酵母菌株(O.minuta)的制备
使用NotI-消化的pOMexGAT-G/Ab载体,通过电穿孔转化O.minuta YK-3菌株(在WO 2003/091431中所述的Δoch1Δpep4Δprb1Δyps1Δura3Δade1)。采用在WO 2003/091431中所述的电穿孔条件。在含有50μg/ml G418的YPD琼脂平板培养基中选择转化的细胞,并培养。此后,提取基因组,使用前述的Xb-KREAEA-Hc DNA引物(SEQ ID NO:12)和Hc-R-Bg引物(SEQ ID NO:13),通过PCR证实重链的导入,并使用前述的Xb-KREAEA-Lc-F引物(SEQ ID NO:14)和Lc-R-Ap引物(SEQ ID NO:15),通过PCR证实轻链的导入。已经观察到重链和轻链基因的导入的菌株,称作产抗体的O.minuta AO1菌株。
[实施例6]表达激活的HAC1基因和RRBP1基因的产抗体酵母菌株(O.minuta)的制备
通过电穿孔,将Sse8783I-消化的pOMexGP1A/p180导入在实施例5中生长的产抗体的O.minuta AO1菌株。如下得到转化的菌株:在SD琼脂平板培养基中选择ADE+菌株,培养该菌株,提取基因组,使用上述的p180 MSp-F(SEQ ID NO:24)和p180 UBg-R(SEQ ID NO:25),通过PCR证实RRBP1基因的导入。得到的转化菌株称作O.minuta AK2R菌株。同时,使用Sse8783I-消化的pOMexGP1A进行转化,得到O.minutaAK2A菌株作为对照。此外,通过电穿孔,将Aor51HI-消化的pOMexPGHy-Hac1导入O.minuta AK2R菌株和O.minuta AK2A菌株。如下证实激活的HAC1基因向转化菌株中的导入:在包含50μg/ml潮霉素的YPD琼脂平板培养基中选择菌株,培养该菌株,提取基因组,并使用speHAC1F DNA引物(SEQ ID NO:20)和bglHAC1R引物(SEQ IDNO:21),通过PCR确认。得到的菌株分别称作O.minuta AK3RH菌株和O.minuta AK3AH菌株。同时,将Aor51HI-消化的pOMexPGHy导入O.minuta AK2R菌株和O.minuta AK2A菌株,以得到O.minutaAK3RHy菌株和O.minuta AK3AHy菌株作为对照。
[实施例7]转化的酵母菌株(O.minuta)分泌抗体的证实
在28℃,在BYPMG培养基(1%酵母提取物(Difco),2%多聚胨(Difco),1.5%甲醇,0.5%甘油,和0.1M磷酸盐缓冲液(pH 6.0))中培养O.minuta AK3RH、O.minuta AK3AH、O.minuta AK3RHy、和O.minutaAK3AHy菌株4天。从培养液制备培养上清液,并进行SDS-PAGE。将分离的蛋白在PVDF膜上印迹,使用标记的抗-人抗体(抗-人Fc抗体和抗-人κ抗体),进行蛋白印迹分析。结果,发现已经导入RRBP1基因和激活的HAC1基因的菌株会分泌比其它菌株明显更大量的抗体,如图4所示。
[实施例8]转化的酵母菌株(O.minuta)的分泌抗体的生产力
使用蛋白A柱(Poros A 50um 4.6mm D/50mml,AppliedBiosystems),对在实施例7中制备的培养液进行HPLC,以测量抗体产量(分离条件:平衡缓冲液:10mM磷酸盐缓冲液(pH 6.0);洗脱缓冲液:10mM磷酸盐缓冲液(pH 3.4);流速:4ml/min;检测:210nm)。使用在动物细胞(CHO)中生产的抗体作为标准样品。图5显示了按照OD 600=1的抗体生产力。与对照菌株即O.minuta AK3AHy菌株中的量相比,在仅导入RRBP1基因的O.minuta AK3RHy菌株中和在仅导入激活的HAC1基因的O.minuta AK3AH菌株中,分泌的抗体的量趋向增加。但是,在表达激活的HAC1基因和RRBP1基因两者的O.minuta AK3RH菌株中的抗体生产量,显著大于对照菌株即O.minuta AK3AHy菌株和已经单独导入激活的HAC1基因或RRBP1基因的菌株。因而证实了,激活的HAC1基因和RRBP1基因的共表达会对抗体生产力产生超过协同效应的作用。
[实施例9]在抑制O-糖链形成的条件下使用转化的酵母菌株(O.minuta)生产抗体
在BYPG培养基(1%酵母提取物(Difco),2%聚胨(Difco),0.5%甘油,和0.1M磷酸盐缓冲液(pH 6.0))中培养O.minuta AK3RH和O.minutaAK3AHy 2天,在28℃在BYPM培养基[1%酵母提取物(Difco),2%聚胨(Difco),1.5%甲醇,和0.1M磷酸盐缓冲液(pH 6.0)]中培养这些菌株2天,所述BYPM培养基中已经加入了0μM,1μM,5μM,10μM,20μM,和50μM PMT抑制剂(绕丹宁-3-乙酸衍生物:5-[[3,4-(1-苯基甲氧基)苯基]亚甲基]-4-氧代-2-硫代-3-噻唑烷乙酸(在Bioorganic & MedicinalChemistry Letters,Vol.14,p.3975,2004中所述的化合物(1c)))。从培养液制备培养上清液,并进行SDS-PAGE。此后,将分离的蛋白在PVDF膜上印迹,使用标记的抗-人抗体(抗-人Fc抗体)进行蛋白印迹分析。图6显示了结果。要加入的PMT抑制剂的适当浓度是5μM。在该情况下,抗体分泌量和聚集体形成百分比都增加。
[实施例10]抗体基因表达载体的构建
为了表达源自啤酒糖酵母的MF α1(GenBank登记号:P01149)的分泌信号(下文称作“aMF分泌信号”)、抗-TRAIL受体抗体的轻链和其重链的融合蛋白,使用下述寡核苷酸引物,通过重叠延伸PCR,将aMF分泌信号基因连接至抗-TRAIL受体抗体基因(WO 2001/083560)。
对于aMF分泌信号-抗TRAIL受体抗体的重链
EcoALF:5′-GGAATTCATGAGATTTCCTTCAAT-3′(SEQ ID NO:26)
AlfH02:5′-CTCCACCAGCTGTACTTCTCTTTTCTCGAGAGATA-3′(SEQ ID NO:27)
AlfH03:
5′-TATCTCTCGAGAAAAGAGAAGTACAGCTGGTGGAG-3′(SEQ IDNO:28)
AlfH04:5′-GGTCGACTCATTTACCCGGGGACAG-3′(SEQ ID NO:29)
对于aMF分泌信号-抗TRAIL受体抗体的轻链
EcoALF:5′-GGAATTCATGAGATTTCCTTCAAT-3′(SEQ  ID NO:26)
AlfL02:5′-TGGGTCATCTGAATGTCTCTTTTCTCGAGAGATA-3′(SEQ ID NO:30)
AlfL03:5′-TATCTCTCGAGAAAAGAGACATTCAGATGACCCA-3′(SEQ ID NO:31)
AlfL04:5′-GGTCGACCTAACACTCTCCCCTGT-3′(SEQ ID NO:32)
使用用Y-DER酵母DNA提取试剂(PIERCE)制备的啤酒糖酵母的基因组DNA作为模板,扩增aMF分泌信号基因区。使用EcoALF引物(SEQ ID NO:26)和AlfH02引物(SEQ ID NO:27),通过PCR得到重链的aMF分泌信号,所述PCR在95℃进行10秒,在55℃进行30秒,在68℃进行60秒,该循环重复30次。使用EcoALF引物(SEQ ID NO:26)和AlfL02引物(SEQ ID NO:30),通过PCR得到轻链的aMF分泌信号,所述PCR在95℃进行10秒,在55℃进行30秒,在68℃进行60秒,该循环重复30次。回收约0.26kb的扩增的靶DNA片段。
使用抗-TRAIL受体抗体的cDNA(WO2001/083560)作为模板,扩增抗体基因区。使用AlfH03引物(SEQ ID NO:28)和AlfH04引物(SEQ IDNO:29),通过PCR得到重链片段,所述PCR在95℃进行10秒,在55℃进行30秒,在68℃进行90秒,该循环重复30次。使用AlfL03引物(SEQ ID NO:31)和AlfL04引物(SEQ ID NO:32),通过PCR得到轻链片段,所述PCR在95℃进行10秒,在55℃进行30秒,在68℃进行90秒,该循环重复30次。回收约1.35kb的扩增的重链区域的靶DNA片段和约0.65kb的轻链区域的靶DNA片段。
随后,将重链的aMF分泌信号区域和约1.35kb的重链区域用作模板,使用EcoALF引物(SEQ ID NO:26)和AlfH04引物(SEQ ID NO:29),进行PCR,该PCR在95℃进行10秒,在55℃进行30秒,在68℃进行90秒,该循环重复30次。回收约1.6kb的扩增的靶DNA片段。还将轻链的aMF分泌信号区域和约0.65kb的轻链区域用作模板,使用EcoALF引物(SEQ ID NO:26)和AlfL04引物(SEQ ID NO:32),进行PCR,该PCR在95℃进行10秒,在55℃进行30秒,在68℃进行60秒,该循环重复30次。回收约0.9kb的扩增的靶DNA片段。将回收的DNA片段克隆进pCR2.1-TOPO。基于插入DNA片段的核苷酸序列,发现这些序列具有这样的基因,其中aMF分泌信号已经框内融合于抗体重链,aMF分泌信号已经框内融合于抗体轻链。得到的质粒分别称作TOPO-alfHc和TOPO-alfLc。将导入EcoALF引物(SEQ ID NO:26)的EcoRI限制酶位点和导入AlfH04引物(SEQ ID NO:29)和AlfL04引物(SEQ ID NO:32)的SalI限制酶位点,用于通过TOPO-alfHc和TOPO-alfLc的EcoRI-SalI消化,回收编码aMF分泌信号和抗体重链的融合产物和aMF分泌信号和抗体轻链的融合产物的DNA片段。
为了在啤酒糖酵母中表达抗体重链和抗体轻链,将通过EcoRI-SalI消化回收的编码aMF分泌信号和抗体重链的融合产物和aMF分泌信号和抗体轻链的融合产物的DNA片段连接至甘油醛-3-磷酸脱氢酶基因(TDH3,GAP)启动子-终止子盒中的EcoRI-SalI位点,该盒已经导入YEp352大肠杆菌-酵母穿梭载体(Yeast 2,p.163-167,1986)。得到的质粒分别称作YEp352GAP-II-alfHc和YEp352GAP-II-alfLc。随后,将在GAP启动子-终止子盒的2个末端的BamHI限制酶位点用于分别从YEp352GAP-II-alfHc和YEp352GAP-II-alfLc回收编码BamHI-GAP启动子-aMF分泌信号-抗体重链-GAP终止子-BamHI的基因片段(片段1)和编码BamHI-GAP启动子-aMF分泌信号-抗体轻链-GAP终止子-BamHI的基因片段(片段2)。通过3片段连接,将片段1和2导入YEp352GAP-II-alfHc或Ep352GAP-II-alfLc的BamHI位点,从中切割片段1或2。得到的载体称作YEp352 GAP-II-alfHc/alfLc(图7)。基于限制酶切割图谱,证实了片段1和2以正向在YEp352 GAP-II-alfHc/alfLc中的串联导入。YEp352 GAP-II-alfHc/alfLc是携带抗体重链和轻链表达单元的抗体表达载体。
[实施例11]啤酒糖酵母激活的HAC1基因表达载体的构建
激活的IRE1的RNA酶活性从啤酒糖酵母的HAC1前体mRNA去除252个核苷酸,形成成熟的HAC1 mRNA。该成熟的HAC1 mRNA翻译成激活的HAC1,从其C末端去除10个氨基酸残基,并新添加18个氨基酸残基(PNAS 97,pp.4660-4665,2000)。从而,使用下述寡核苷酸引物,通过重叠延伸PCR,构建编码激活的HAC1的基因。
HAC-Sac-ATG:5′-GGAGCTCATGGAAATGACTGATTTTG-3′(SEQID NO:33)
HAC-内部R:
5′-GAATTCAAACCTGACTGCGCTTCTGGATTACGCCAATTGTCAAG-3′(SEQ ID NO:34)
HAC-内部F:
5′-CTTGACAATTGGCGTAATCCAGAAGCGCAGTCAGGTTTGAATTC-3′(SEQ ID NO:35)
HAC-Sma-STOP:5′-GCCCGGGTCATGAAGTGATGAAGAAATC-3′(SEQ ID NO:36)
将使用Y-DER酵母DNA提取试剂(PIERCE)制备的啤酒糖酵母基因组DNA用作模板。使用HAC-Sac-ATG引物(SEQ ID NO:33)和HAC-内部R引物(SEQ ID NO:34)进行PCR,该PCR在95℃进行10秒,在55℃进行30秒,在68℃进行60秒,该循环重复30次。单独地,使用HAC-内部F引物(SEQ ID NO:35)和HAC-Sma-STOP引物(SEQ ID NO:36)进行PCR,该PCR在95℃进行10秒,在55℃进行30秒,在68℃进行60秒,该循环重复30次。回收约0.66kb(片段A)和约0.06kb(片段B)的扩增的靶DNA片段。
随后,将扩增的片段A和片段B用作模板,使用HAC-Sac-ATG引物(SEQ ID NO:33)和HAC-Sma-STOP引物(SEQ ID NO:36)进行PCR,该PCR在95℃进行10秒,在55℃进行30秒,在68℃进行60秒,该循环重复30次,以得到约0.7kb的扩增的靶DNA片段。将回收的DNA片段克隆进pCR2.1-TOPO。基于插入DNA片段的核苷酸序列,发现该片段具有编码含有238个氨基酸残基的激活的HAC1的基因。该质粒称作TOPO-aHac1。使用已经导入HAC-Sac-ATG引物(SEQ ID NO:33)中的SacI限制酶位点和已经导入HAC-Sma-STOP引物(SEQ ID NO:36)中的SmaI限制酶位点,通过SacI-SmaI消化来回收编码激活的HAC1的基因。
为了在啤酒糖酵母中表达激活的HAC1,将通过SacI-SmaI消化回收的编码激活的HAC1的基因连接至甘油醛-3-磷酸脱氢酶基因(TDH3,GAP)启动子-终止子盒中的SacI-SmaI位点位点,该盒已经导入YEp351大肠杆菌-酵母穿梭载体(Yeast 2,pp.163-167,1986)。得到的质粒称作YEp351GAP-II-aHAC1(图7)。该载体包含激活的HAC1基因表达单元。
[实施例12]人RRBP1基因表达载体的构建
使用由Kazusa DNA研究机构提供的人RRBP1基因(KIAA1398,GenBank登记号:AB037819)。为了在上述基因的两端都导入限制酶位点,使用下述寡核苷酸引物P180kpnatg和P180xbastop(SEQ ID NO:37和38)和人RRBP1基因,通过PCR扩增基因,该PCR在95℃进行10秒,在55℃进行30秒,在68℃进行6分钟,该循环重复30次。
P180kpnatg:5′-GGGTACCATGGATATTTACGACACTC-3′(SEQ IDNO:37)
P180xbastop:5′-GTCTAGATCAGACAGAGGTGCCCTCC-3′(SEQ IDNO:38)
回收得到的约4.7kb的片段,克隆进pCR2.1-TOPO。基于插入DNA片段的核苷酸序列,证实在插入片段的两端的约600bp的区域都适当地包含目标核苷酸序列。得到的质粒称作TOPO-P180。随后,用NdeI和HpaI限制酶消化TOPO-P180,回收含有与KIAA1398的110bp至4524bp之间的区域等同的区域的片段。向取出的区域中导入KIAA1398的约4.4kb的NdeI-HpaI片段,以构建TOPO-P180N,使用大肠杆菌SCS110菌株(Stratagene)使XbaI限制酶位点去甲基化。使用已经导入P180kpnatg引物(SEQ ID NO:37)和P180xbastop引物(SEQ ID NO:38)中的KpnI-XbaI限制酶位点,回收包含编码RRBP1的基因的KpnI-XbaI片段。
为了在啤酒糖酵母中表达RRBP1,将上面回收的KpnI-XbaI片段连接至甘油醛-3-磷酸脱氢酶基因(TDH3,GAP)启动子-终止子盒中的KpnI-XbaI位点,该盒已经导入YEp352大肠杆菌-酵母穿梭载体(Yeast 2,pp.163-167,1986)。得到的质粒称作YEp352GAP-II-p180。随后,用PvuI限制酶消化YEp352GAP-II-p180,回收含有GAP启动子-RRBP1基因-GAP终止子的PvuI片段。将PvuI片段连接至包含标记基因的PvuI片段,即YEp351大肠杆菌-酵母穿梭载体(Yeast 2,pp.163-167,1986)的复制必需的区域,以构建YEp351GAP-II-p180(图7)。该载体包含RRBP1基因表达单元。
[实施例13]激活的HAC1基因和RRBP1基因的共表达载体的构建
为了使用单一载体将激活的HAC1基因和RRBP1基因导入啤酒糖酵母,构建了激活的HAC1基因和RRBP1基因的共表达载体。用HpaI限制酶消化在实施例11中构建的YEp351GAP-II-aHAC1。随后,从在实施例12中构建的YEp352GAP-II-p180回收含有GAP启动子-RRBP1基因-GAP终止子的BamHI片段,使用T4DNA聚合酶(Takara Bio)将两个末端平端化,将产物导入YEp351GAP-II-aHAC1的HpaI位点。得到的质粒称作YEp351GAP-II-aHAC1/p180(图7)。分析核苷酸序列,以确定导入含有导入的GAP启动子-RRBP1基因-GAP终止子的BamHI片段的方向。该载体包含激活的HAC1基因和RRBP1基因的表达单元。
[实施例14]构建表达抗体的酵母菌株和表达激活的HAC1基因和RRBP1基因的表达抗体的酵母菌株(啤酒糖酵母)
使用Frozen-EZ酵母转化II试剂盒(ZYMO RESARCH),制备啤酒糖酵母BY4741菌株的感受态细胞(MATa Δhis3Δ leu2Δmet15Δ ura3)。将啤酒糖酵母BY4741菌株接种进5ml YPAD培养基(含有0.04%腺嘌呤(Sigma)的YPD培养基),使用通过过夜培养(30℃,在310rpm)得到的酵母细胞。使用Frozen-EZ酵母转化II试剂盒(ZYMO RESARCH),将在实施例10至实施例13中构建的表达载体导入啤酒糖酵母BY4741菌株。选择在含有2%琼脂的ST琼脂培养基(酵母氮基和包含2%葡萄糖、0.04%腺嘌呤和0.3M KCl且缺少尿嘧啶和亮氨酸的硫酸铵培养基(Sigma))上生长的转化体作为表达抗体的酵母菌株。
包含抗体重链和轻链表达单元的YEp352 GAP-II-alfHc/alfLc具有补充宿主的需尿嘧啶的突变的URA3标记基因。YEp351 GAP-II(其中没有导入基因的对照载体),YEp351GAP-II-aHAC1(激活的HAC1表达载体),YEp351GAP-II-p180(RRBP1表达载体),和YEp351GAP-II-aHAC1/p180(激活的HAC1基因和RRBP1的共表达载体)各自包含补充宿主的需亮氨酸的突变的LEU2标记基因。从而,将这些载体转化进宿主,使得仅在如下所示联合导入两种载体时基因才生长,以构建4类表达抗体的酵母菌株。
啤酒糖酵母T2K01 YEp352 GAP-II-alfHc/alfLc(URA3)YEp351GAP-II(LEU2)
啤酒糖酵母T2K02 YEp352 GAP-II-alfHc/alfLc(URA3)YEp351GAP-II-aHAC1(LEU2)
啤酒糖酵母T2K03 YEp352 GAP-II-alfHc/alfLc(URA3)YEp351GAP-II-p180(LEU2)
啤酒糖酵母T2K04 YEp352 GAP-II-alfHc/alfLc(URA3)YEp351GAP-II-aHAC1/p180(LEU2)
[实施例15]转化的酵母菌株(啤酒糖酵母)的抗体生产力
在30℃,使用ST培养基培养在实施例14中制备的啤酒糖酵母T2K01、啤酒糖酵母T2K02、啤酒糖酵母T2K03、和啤酒糖酵母T2K04菌株3天。将培养液接种进YPAD培养基,在其中达到5%终浓度,在30℃培养3天。从培养液制备培养上清液,产物称作含有酵母分泌和生产的抗体的样品。通过夹心ELISA,对分泌和生产的抗体进行定量测定。将作为抗-TRAIL受体抗体的抗原的TRAIL受体蛋白吸附到96孔平板上,加入酵母样品,使用过氧化物酶-标记的人IgG特异性的Fc抗体(过氧化物酶标记的亲和纯化的抗人IgG(Fc)抗体(KPL))和ABTS过氧化物酶底物(KPL)进行检测。在动物细胞中生成的抗体(NS0)用作标准样品。
如图8A所示,其中仅导入RRBP1基因的啤酒糖酵母T2K03菌株在生产力方面没有显著不同于对照菌株即啤酒糖酵母T2K01菌株。但是,在仅导入激活的HAC1基因的啤酒糖酵母T2K02菌株的情况下,生产力是对照菌株即啤酒糖酵母T2K01菌株的约2倍。此外,在共表达激活的HAC1基因和RRBP1基因的啤酒糖酵母T2K04菌株的抗体生产力,显著高于对照菌株即啤酒糖酵母T2K01菌株和单独导入激活的HAC1基因或RRBP1基因的菌株(即,比对照高约7倍)。这表明,激活的HAC1基因和RRBP1基因的共表达会对抗体生产力产生等于或大于协同效应的作用。
[实施例16]使用转化的酵母菌株(啤酒糖酵母)在抑制O-糖链形成的条件下的抗体生产力
在30℃,使用ST培养基培养在实施例14中制备的啤酒糖酵母T2K01、啤酒糖酵母T2K02、啤酒糖酵母T2K03、和啤酒糖酵母T2K04菌株3天。以5%终浓度,将培养液接种进在开始已经加入10μM PMT抑制剂(绕丹宁-3-乙酸衍生物:5-[[3,4-(1-苯基甲氧基)苯基]亚甲基]-4-氧代-2-硫代-3-噻唑烷乙酸(在Bioorganic & Medicinal Chemistry Letters,Vol.14,p.3975,2004中所述的化合物(1c))的YPAD培养基,在30℃培养3天。从培养液制备培养上清液,产物称作含有酵母分泌和生产的抗体的样品。以与实施例15相同的方式,使用在动物细胞中生成的抗体(NS0)作为标准样品,通过夹心ELISA对样品进行定量测定。
如图8B所示,导入激活的HAC1基因的啤酒糖酵母T2K02菌株和导入RRBP1基因的啤酒糖酵母T2K03菌株的抗体生产力明显高于对照菌株即啤酒糖酵母T2K01菌株。此外,共表达激活的HAC基因和RRBP1基因的啤酒糖酵母T2K04菌株的抗体产量,显著高于对照菌株即啤酒糖酵母T2K01菌株和单独导入激活的HAC1基因或RRBP1基因的菌株(即,比对照高约8倍)。通过抑制O-糖链形成,进一步增强了激活的HAC1基因和RRBP1基因的共表达对抗体生产的协同效应。
[实施例17]Ogataea minuta蛋白酶YPS1基因缺陷型菌株(Δoch1Δyps1Δura3Δade1)的制备
用BamHI和ClaI切割在WO 2003/091431中公开的YPS1基因-缺陷型载体pDOMYP1,通过电脉冲方法转化进WO 2003/091431中公开的O.minuta TK5-3菌株(Δoch1Δura3Δade1)。为了确认破坏了该基因的YPS1基因,合成了下述引物。
DY5;5’-CTCAAGGGCCTGGAGACTACG-3’(SEQ ID NO:49)
DY3;5’-CGGGATTCCCGAGTCGCTCACC-3’(SEQ ID NO:50)
从转化菌株分离的染色体DNA用作模板,使用DY5和DY3引物进行PCR,该PCR在94℃进行30秒,在60℃进行1分钟,在72℃进行2分钟,该循环重复25次。从已经将质粒导入YPS1基因座中的菌株,检测扩增的3.7-kb DNA片段。选择的菌株称作O.minuta YK4菌株(Δoch1Δura3Δade1Δyps1::URA3)。在YPD培养基中培养O.minuta YK4菌株至稳定期后,获得表现出对5-氟乳清酸(5-FOA)的抗性的菌株。将5-FOA抗性菌株的染色体DNA用作模板,使用DY5和DY3引物进行PCR,该PCR在94℃进行30秒,在60℃进行1分钟,在72℃进行3分钟,该循环重复25次。从缺少URA3的菌株检测扩增的1.2-kb DNA片段。该Δoch1Δura3Δade1Δyps1菌株称作O.minuta YK5菌株。
[实施例18]合成抗体基因生产菌株(O.minuta)的制备和抗体生产
(1)合成抗体基因表达载体的构建
用SpeI切割在WO 2003/091431中公开的pOMexGP1U,平端化,然后连接。将得到的质粒的SalI位点和EcoT22I位点分别用SpeI位点和BamHI位点进行接头变化。得到的质粒称作pOMexGP1UΔSp。
从抗-TRAIL受体抗体基因的氨基酸序列(WO2002/094880)设计基因,同时考虑O.minuta的密码子使用频率,从而人工合成抗体基因(Takara Bio)。将啤酒糖酵母SUC2信号或鸡溶菌酶信号添加到轻链和重链基因的N末端,将限制酶位点(在5’侧上的XbaI位点和在3’侧上的BamHI位点)的核苷酸序列添加到2个末端(核苷酸序列:SEQ ID NO:51,53,55,和57;氨基酸序列:SEQ ID NO:52,54,56,和58)。将已经用XbaI和BamHI消化的具有不同信号的两类轻链基因片段导入在实施例1(2)中制备的pOMexGP1A载体。得到的载体分别称作pOMexGPA/AbSUC和pOMexGPA/AbLys。将已经用XbaI和BamH消化的发出不同信号的两类重链基因片段导入pOMexGP1UΔSp载体的SpeI-BamHI位点。得到的载体称作pOMexGPUΔSp/AbSUC和pOMexGPUΔSp/AbLys。
将pOMexPGHy(实施例1(3-4))用作模板,使用PGKHy-F DNA引物(SEQ ID NO:59)和PGKHy-R DNA引物(SEQ ID NO:60)进行PCR,该PCR在94℃进行30秒,在55℃进行30秒,在72℃进行1分钟,该循环重复20次。从而,扩增潮霉素B-抗性基因。
PGKHy-F:
5’-ATAGAACTAGCAACTAGATGAAAAAGCCTGAACTCAC-3’(SEQID NO:59)
PGKHy-R:
5’-CAAATCCCACGGATCACTATTCCTTTGCCCTCGGAC-3’(SEQ IDNO:60)
使用in-fusion试剂盒(BD Bioscience),将扩增的基因片段导入SpeI-BglII-消化的pOMexPGHy,并测定插入片段的核苷酸序列。得到的质粒用作模板,使用PGKpUC-p DNA引物(SEQ ID NO:61)和PGKpUC-tDNA引物(SEQ ID NO:62)进行PCR,该PCR在94℃进行30秒,在55℃进行30秒,在72℃进行2分钟,该循环重复20次。从而,扩增含有PGK启动子-潮霉素B抗性基因-PGK终止子的基因片段。
PGKpUC-p:
5’-AATTCGAGCTCGGTACAGGGATACATGGGATACCAAAG-3’(SEQID NO:61)
PGKpUC-t:
5’-GAGGATCCCCGGGTACCAGGGTCGATTTTCTTGGTCGA-3’(SEQID NO:62)
使用in-fusion试剂盒(BD Bioscience),将扩增的基因片段导入Asp718I-消化的pUC118(Takara Bio),并测定插入片段的核苷酸序列。得到的质粒称作PGKHyg/pUC118。用HindIII和KpnI消化pOMexGP1UΔSp,分离包含GAP启动子-终止子的盒,将分离的盒插入HindIII-KpnI消化的PGKHyg/pUC118。得到的质粒称作GAP/HyG/pUC118。随后,用NdeI和EcoRI消化pUC19(Takara Bio),平端化,然后连接,以去除在pUC19内的NdeI-EcoRI区域。用HindIII-SacI消化该质粒,导入包含通过HindIII-SacI消化从GAP/HyG/pUC118分离的GAP启动子-终止子和PGK启动子-潮霉素B抗性基因-PGK终止子的基因片段。得到的质粒称作pOMexHy。
将已经添加XbaI-BamH消化的鸡溶菌酶信号的抗体重链基因片段导入SpeI-BamHI处理过的pOMexHy,得到的载体称作pOMexHy/AbLys。
(2)表达抗体基因的酵母菌株的制备
通过电穿孔,使用NotI-消化的抗体表达载体即pOMexGPA/AbLys和pOMexGPUΔSp/AbLys来转化O.minuta YK5菌株(Δoch1Δyps1Δura3Δade1)。使用在WO 2003/091431中描述的电穿孔条件。在SD琼脂平板培养基(2%葡萄糖,0.67%酵母氮基(Difco))中选择转化的细胞。在27℃在B2YP4G培养基(1.34%酵母氮基(Difco),2%酵母提取物(Difco),4%聚胨(Difco),4%甘油,和0.1M磷酸盐缓冲液(pH6.0))中培养单个菌落4天。从培养液制备培养上清液,按照实施例7所述的方式进行蛋白印迹分析,以选择其中已经导入抗体轻链和重链基因的生产抗体的菌株,得到的菌株称作O.minuta AA1菌株。如图9所示,O.minuta AA1菌株分泌的抗体的量显著大于在实施例5中制备的O.minuta AO1菌株分泌的量。
将NotI消化的抗体表达载体即pOMexGPA/AbSUC和pOMexGPUΔSp/AbSUC导入在WO 2003/091431中所述的O.minutaTK5-3菌株(Δoch1Δura3Δade1),以得到表达抗体的O.minuta YY1菌株。采用上述的电穿孔和菌株选择方法。
[实施例19]巴斯德毕赤氏酵母的激活的HAC1基因的获取和表达载体的构建
以与实施例3相同的方式,从细胞(巴斯德毕赤氏酵母的GS115菌株)获得巴斯德毕赤氏酵母的激活的HAC1基因。以与实施例3相同的方式,从巴斯德毕赤氏酵母的GS115菌株合成cDNA。使用下示的HACp1-1DNA引物(SEQ ID NO:63)和HACp1-12引物(SEQ ID NO:64),通过PCR扩增该cDNA,该PCR在94℃进行30秒,52℃进行30秒,在72℃进行1分钟,该循环重复30次。将扩增的产物克隆进pCR2.1-TOPO(Invitrogen),证实从两类PCR扩增的基因片段衍生的核苷酸序列(SEQID NO:65和66)。
HACp1-1:5′-ATGCCCGTAGATTCTTCTCATAAGACAGC-3′(SEQID NO:63)
HACp1-12:5′-CAAAGTCATTTAAATCAAATGCATTAGCGG-3′(SEQ ID NO:64)
得到的两类cDNA片段的核苷酸序列之一(SEQ ID NO:65)与基因组序列相一致;但是,另一个序列(SEQ ID NO:66)是部分缺陷的,且缩短。这表明,这样的缺陷序列是已经被UPR激活的Ire1p剪接的cDNA片段。为了得到激活的HAC1的全长cDNA,进行PCR,该PCR在94℃进行30秒,在55℃进行30秒,在72℃进行1分钟,其中使用下示的speHACp1F DNA引物(SEQ ID NO:67)和bglHACp1R DNA引物(SEQID NO:68)和被认为含有上述HAC1的激活的cDNA的cDNA合并物,该循环重复20次。
speHACp1F:5′-gactagtATGCCCGTAGATTCTTCTCATA-3′(SEQ IDNO:67)
bglHACp1R:5′-cagatctCTATTCCTGGAAGAATACAAAGT-3′(SEQID NO:68)
得到的约1kb的片段含有位于巴斯德毕赤氏酵母的激活的HAC1基因的起始密码子和终止密码子之间的区域(SEQ ID NO:69),它等同于包含304个氨基酸残基的激活的Hac1p的氨基酸序列(SEQ ID NO:70)。用SpeI和BglII处理产物,分离,然后导入SpeI-BglII处理过的pOMexPGHy(实施例1(3-4))。得到的载体称作pOMexPGHy/PpHac1。该载体包含源自巴斯德毕赤氏酵母的激活的HAC1基因表达单元。
[实施例20]啤酒糖酵母激活的HAC1基因表达载体的构建
将在实施例11中制备的含有啤酒糖酵母的激活的HAC1基因的TOPO-aHac1用作模板,使用ScHAC-XbaF DNA引物(SEQ ID NO:71)和ScHAC-BamR DNA引物(SEQ ID NO:72)进行PCR,该PCR在94℃进行30秒,在55℃进行30秒,在72℃进行1分钟,该循环重复20次。从而,扩增啤酒糖酵母的激活的HAC1基因。
ScHAC-XbaF:5′-gtctagaATGGAAATGACTGATTTTGAACT-3′(SEQID NO:71)
ScHAC-BamR:5′-cggatccTCATGAAGTGATGAAGAAATCAT-3′(SEQ ID NO:72)
用XbaI和BamHI消化产物,回收编码源自啤酒糖酵母的激活的HAC1的基因。分离后,将基因导入SpeI-BglII处理过的pOMexPGHy(实施例1(3-4))。得到的载体称作pOMexPGHy/ScHac1。该载体包含源自啤酒糖酵母的激活的HAC1基因表达单元。
[实施例21]已经导入O.minuta、巴斯德毕赤氏酵母和啤酒糖酵母的激活的HAC1基因的O.minuta菌株对抗体的生产
(1)已经导入O.minuta、巴斯德毕赤氏酵母和啤酒糖酵母激活的HAC1基因的O.minuta菌株的制备
通过电穿孔,将Aor51HI消化的O.minuta来源的激活的HAC1基因表达载体即pOMexPGHy/Hac1、巴斯德毕赤氏酵母来源的激活的HAC1基因表达载体即pOMexPGHy/PpHac1、和啤酒糖酵母来源的激活的HAC1基因表达载体即pOMexPGHy/ScHac1导入在实施例18中生长的产抗体的O.minuta AA1菌株。如下证实激活的HAC1基因向转化菌株中的导入:在已经加入浓度为50μg/ml的潮霉素B的YPD琼脂平板培养基中选择菌株,培养它们,然后提取基因组。使用实施例3所述的speHAC1F DNA引物(SEQ ID NO:20)和bglHAC1R DNA引物(SEQ IDNO:21),对其中已经导入O.minuta来源的激活的HAC1基因表达载体pOMexPGHy/Hac1的菌株进行PCR。使用speHACp1F DNA引物(SEQ IDNO:67)和bglHACp1R引物(SEQ ID NO:68),对其中已经导入巴斯德毕赤氏酵母来源的激活的HAC1基因的菌株进行PCR,该PCR在94℃进行30秒,在55℃进行30秒,在72℃进行1分钟,该循环重复30次。除了使用ScHAC-XbaF DNA引物(SEQ ID NO:71)和ScHAC-BamR引物(SEQ ID NO:72)以外,在相同条件下,对其中已经导入啤酒糖酵母来源的激活的HAC1基因的菌株进行PCR。得到的菌株分别称作O.minutaAA2omH菌株,O.minuta AA2ppH菌株,和O.minuta AA2scH菌株。同时,将Aor51HI-消化的pOMexPGHy导入O.minuta AA1菌株,以得到O.minuta AA2Hy菌株作为对照。
(2)已经导入HAC1基因的生产抗体的菌株分泌抗体的证实
以实施例18(2)所述的方式,培养在上面(1)中制备的已经导入HAC1基因的生产抗体的菌株,即O.minuta AA2omH菌株、O.minutaAA2ppH菌株、O.minuta AA2scH菌株和O.minuta AA2Hy菌株,并在非还原条件下进行蛋白印迹分析。结果如图10所示。也就是说,与在上面(1)制备的对照O.minuta AA2Hy菌株相比,在O.minutaAA2omH菌株、O.minuta AA2ppH菌株和O.minuta AA2scH菌株中观察到更显著的糖链向抗体分子的添加,但是没有观察到抗体-H2L2聚集体分泌的显著加速作用。从而,通过导入源自不同于宿主的物种的HAC1基因,可以预见到类似的生产效应。
(3)已经导入HAC1基因的产抗体的O.minuta菌株的分泌抗体的生产力(通过基于TR-FRET的均质分析定量)
将包含12μl 0.97μg/ml LANCE Eu-W1024标记的抗-人IgG(PerkinElmer)、8.3ug/ml生物素缀合的小鼠抗-人IgG(BD Bioscience)、16.7ug/ml Surelight APC链霉抗生物素(PerkinElmer)和10%Block Ace(Dainippon Pharmaceutical)的20mM Tris-HCl缓冲液(pH 7.2)应用于96-孔半区域平板(Corning),向其中引入如下制备的2μl样品溶液:用含有10%Block Ace的20mM Tris-HCl缓冲液(pH 7.2)充分稀释在上面(2)制备的培养液,然后搅拌。使样品溶液在室温在黑暗中反应1小时,然后使用EnVision(PerkinElmer)测定荧光。基于在665nm/615nm的值,测定生成的聚集的抗体的量。在动物细胞(CHO)中生产的抗体用作标准样品。如图11所示,与O.minuta AA2Hy菌株相比,在已经导入激活的HAC1基因的O.minuta AA2omH菌株、O.minuta AA2ppH菌株和O.minuta AA2scH菌株中,观察到抗体分泌的显著加速。但是,甚至通过导入源自不同于宿主的物种的HAC1基因,也可以预见到类似的生产效应。
(4)使用PMT抑制剂(1c),已经导入HAC1基因的O.minuta菌株的抗体生产
将一铂环量的O.minuta AA2omH菌株、O.minuta AA2ppH菌株、O.minuta AA2scH菌株和O.minuta AA2Hy菌株接种进5ml B2YP4G培养基,在27℃培养1天,然后用B2YP4G培养基稀释,调节OD600=10。向其中加入在实施例9所述的PMT抑制剂(1c:母液浓度:10mM),至2μM的浓度。在27℃培养另外3天,每隔24小时测定OD600,OD600值每增加1,各加入0.04μM PMT抑制剂(1c)。从培养液制备培养上清液,通过实施例21(3)所述的方法,测量抗体生产量。结果如图11所示。发现与对照O.minuta AA2Hy菌株相比,通过在加入PMT抑制剂的情况下培养,已经导入激活的HAC1基因的O.minuta AA2omH菌株、O.minuta AA2ppH菌株和O.minuta AA2scH菌株可以表现出更显著的加速抗体分泌的作用。
从而,发现使用不同物种的HAC1基因,可以达到加速抗体分泌的作用。
[实施例22]源自O.minuta的PMT基因的分离
使用O.minuta IFO10746菌株的染色体DNA作为模板,使用PM1-5DNA引物(SEQ ID NO:73)和PM1-3 DNA引物(SEQ ID NO:74),通过PCR得到源自O.minuta的PMT1基因,该PCR在94℃进行30秒,在55℃进行1分钟,在72℃进行2分钟,该循环重复25次。
PM1-5:5′-ATGGCGGGCAAAAATCAGAAATCTAGCGCG-3′(SEQID NO:73)
PM1-3:5′-TTACAACTCGTCTTTGACTAGAGGCGGGGA-3′(SEQID NO:74)
回收扩增的约2.4kb的DNA片段,使用TOPO TA克隆试剂盒进行克隆。从得到的克隆分离质粒DNA,测定插入片段的核苷酸序列(SEQID NO:75)。从而,从质粒的插入DNA片段,选择具有编码氨基酸序列(SEQ ID NO:76)的核苷酸序列的克隆,所述氨基酸序列与源自啤酒糖酵母的PMT1基因的氨基酸序列高度同源。分离的质粒称作pOmPM1。
以与在PMT1基因的情况下相同的方式,使用PM2-5 DNA引物(SEQ ID NO:77)和PM2-3 DNA引物(SEQ ID NO:78)得到源自O.minuta的PMT2基因,使用PM4-5 DNA引物(SEQ ID NO:79)和PM4-3 DNA引物(SEQ ID NO:80)得到PMT4基因,使用PM5-5 DNA引物(SEQ ID NO:81)和PM5-3 DNA引物(SEQ ID NO:82)得到PMT5基因,使用PM6-5DNA引物(SEQ ID NO:83)和PM6-3 DNA引物(SEQ ID NO:84)得到PMT6基因。包含PMT2基因(核苷酸序列:SEQ ID NO:85;氨基酸序列:SEQ ID NO:86)、PMT4基因(核苷酸序列:SEQ ID NO:87;氨基酸序列:SEQ ID NO:88)、PMT5基因(核苷酸序列:SEQ ID NO:89;氨基酸序列:SEQ ID NO:90)和PMT6基因(核苷酸序列:SEQ ID NO:91;氨基酸序列:SEQ ID NO:92)的质粒分别称作pOmPM2,pOmPM4,pOmPM5,和pOmPM6。
PM2-5:5′-ATGGGCGAACGTACGGGCAAAAGTGCGCTC-3′(SEQID NO:77)
PM2-3:5′-CTAATCGGAAATTCTCCACGTGCTCAAGAG-3′(SEQID NO:78)
PM4-5:5′-ATGGGGCCCAAAATAAAGACCGGCAAGAAA-3′(SEQID NO:79)
PM4-3:5′-CTATTTAGCAAAATGCAGTTTGATGTTGAG-3′(SEQ IDNO:80)
PM5-5:5′-ATGGACGAGAAAAACATCTCTGGCTTAGAA-3′(SEQID NO:81)
PM5-3:5′-CTACTCACTATAGACGGAGCAGTCGATCGA-3′(SEQID NO:82)
PM6-5:5′-ATGTCCGAGTCAGAGCTGAGAAACCGCAAA-3′(SEQID NO:83)
PM6-3:5′-CTAAGCTATACGCCAGGTGGAAACCCAGTT-3′(SEQID NO:84)
[实施例23]O.minuta的PMT基因插入灭活或破坏载体的制备
(1)PMT基因插入灭活载体的制备
(1-1)PMT1基因插入灭活载体的制备
为了使用在实施例22中得到的pOmPM1分离PMT1基因的部分序列,使用下述的PMT1hIII DNA引物(SEQ ID NO:93)和PMT1Kp DNA引物(SEQ ID NO:94)进行PCR,该PCR在94℃进行30秒,在55℃进行30秒,在72℃进行2分钟,该循环重复15次。
PMT1hIII:5′-caagcttGGACCTACAACACGTCCGAAGAA-3′(SEQ IDNO:93)
PMT1Kp:5′-cggtaccGGTTTGATACCTTGGGTGGCACA-3′(SEQ IDNO:94)
用HindIII和KpnI消化扩增的约1.6kb的DNA片段,并回收。随后,用BglII消化pPICZα(Invitrogen),并平端化。将HindIII接头插入其中,用BamHI进一步消化,并平端化,随后插入KpnI接头。得到的质粒称作pZ-Hd-Kp。用HindIII和KpnI消化pZ-Hd-Kp,分离含有zeocine抗性基因的2.0-kb DNA片段,将PCR扩增的PMT1基因的部分序列插入其中。测定插入的PMT1基因的部分序列的核苷酸序列,然后将得到的质粒命名为pOmPM1dZ。pOmPM1dZ能插入灭活O.minuta PMT1基因的结构基因(CDS)区和启动子区,并抑制PMT1基因的转录。单独地,用HindIII和KpnI消化在实施例18中制备的HindIII和KpnI,回收含有GAP启动子和终止子的基因片段,将回收的片段插入HindIII-KpnI-消化的含有zeocine抗性基因的2.0-kb DNA片段。得到的质粒称作GAP/Z。
(1-2)PMT2基因插入灭活载体的制备
为了使用在实施例22中得到的pOmPM2分离PMT2基因的部分序列,使用下述的PMT2hIII DNA引物(SEQ ID NO:95)和PMT2Kp DNA引物(SEQ ID NO:96)进行PCR,该PCR在94℃进行30秒,在55℃进行30秒,在72℃进行2分钟,该循环重复15次。
PMT2hIII:5′-gaagcttACTACATAATTCGTGTACGTGTTC-3′(SEQID NO:95)
PMT2Kp:5′-cggtaccGTCGCCGTATTGGTCAGCAATCTC-3′(SEQID NO:96)
回收扩增的约1.5kb的DNA片段,用HindIII和KpnI消化,然后回收消化的片段。将得到的DNA片段插入通过用HindIII和KpnI消化从pZ-Hd-Kp分离的、含有zeocine-抗性基因的2.0-kb DNA片段,测定插入的PMT2基因的部分序列的核苷酸序列。将得到的质粒命名为pOmPM2dZ。pOmPM2dZ能插入灭活O.minuta PMT2基因的结构基因(CDS)区和启动子区,并抑制PMT2基因的转录。
(1-3)PMT4基因插入灭活载体的制备
为了使用在实施例22中得到的pOmPM4分离PMT4基因的部分序列,使用下述的PMT4FHdinf DNA引物(SEQ ID NO:97)和PMT4RKpinfDNA引物(SEQ ID NO:98)进行PCR,该PCR在94℃进行30秒,在55℃进行30秒,在72℃进行2分钟,该循环重复15次。
PMT4FHdinf:
5′-GTCATGAGATCCaagctGATCCCTCAATGGAGATCTACT-3′(SEQ IDNO:97)
PMT4RKpinf:
5′-GGTGTGTGGGGGATCgGGATGCAAATGGATGGCTCGAAC-3′(SEQID NO:98)
使用in-fusion试剂盒(BD Bioscience),将得到的约1.5kb的DNA片段插入通过用HindIII和KpnI消化从pZ-Hd-Kp分离的、含有zeocine-抗性基因的2.0-kb DNA片段。测定插入的PMT4基因的部分序列的核苷酸序列,然后将得到的质粒命名为pOmPM4dZ。
(2)PMT基因破坏载体的制备
(2-1)PMT5基因破坏载体的制备
用HindIII消化pROMU1,后者含有具有在WO 2003/091431中公开的在O.minuta的URA3结构基因上游和下游的约0.8kb的重复序列的基因片段,并平端化,随后插入BamHI接头。用BamHI和BglII消化得到的载体,将含有O.minuta的重复序列和URA3基因的约3.3kb片段导入BamHI消化的pBluescript KS-(Stratagene)。得到的载体称作rURApBKS。
将O.minuta IFO10746菌株的染色体DNA用作模板,使用PMT5maeF2 DNA引物(SEQ ID NO:99)和PMT5maeR DNA引物(SEQ IDN0:100)进行PCR,该PCR在94℃进行30秒,在55℃进行1分钟,在72℃进行2分钟,该循环重复25次。回收扩增的约1.5kb的DNA片段,使用in-fusion试剂盒(BD Bioscience)导入BamHI-HindIII-消化的rURApBKS。测定插入的基因片段的核苷酸序列。得到的载体称作PMT5K/O/rURA3pre。
将O.minuta IFO10746菌株的染色体DNA用作模板,使用PMT5ushiroF DNA引物(SEQ ID NO:101)和PMT5ushiroR DNA引物(SEQ ID NO:102)进行PCR,该PCR在94℃进行30秒,在55℃进行1分钟,在72℃进行2分钟,该循环重复25次。回收扩增的约1.5kb的DNA片段,使用in-fusion试剂盒(BD Bioscience)导入NotI消化的PMT5K/O/rURA3pre。测定插入的基因片段的核苷酸序列。得到的载体称作PMT5K/O/rURA3。
PMT5maeF2:
5′-GACGGTATCGATAAGCTTGATGCGCGGCCTTCCGACCTT-3′(SEQID NO:99)
PMT5maeR:
5′-CTGGGGAAGCTCGGATCCGGCTCGAGGTCTTCGTTCAGA-3′(SEQID NO:100)
PMT5ushiroF:
5′-CTAGTTCTAGAGCGGCCCAGGTCGCTTTCAGGCAGCAG-3′(SEQID NO:101)
PMT5ushiroR:
5′-CACCGCGGTGGCGGCCAAGCTTGGGTACCGGCTCGCGTAG-3′(SEQ ID NO:102)
(2-2)PMT6基因破坏载体的制备
将O.minuta IFO10746菌株的染色体DNA用作模板,使用PMT6inf5′armF DNA引物(SEQ ID NO:103)和PMT6inf5′armR DNA引物(SEQ ID NO:104)进行PCR,该PCR在94℃进行30秒,在55℃进行2分钟,在72℃进行2分钟,该循环重复25次。回收扩增的约2.8kb的DNA片段,使用in-fusion试剂盒(BD Bioscience)导入BamHI消化的rURApBKS。测定插入的基因片段的核苷酸序列。得到的载体称作PMT6K/O/rURA3pre。
将O.minuta IFO10746菌株的染色体DNA用作模板,使用PMT6inf3′armF DNA引物(SEQ ID NO:105)和PMT6inf3′armR2 DNA引物(SEQ ID NO:106)进行PCR,该PCR在94℃进行30秒,在55℃进行2分钟,在72℃进行2分钟,该循环重复25次。回收扩增的约2.5kb的DNA片段,使用in-fusion试剂盒(BD Bioscience)导入NotI-SacII消化的PMT6K/O/rURA3pre。测定插入的基因片段的核苷酸序列。得到的载体称作PMT6K/O/rURA3。
PMT6inf5′armF:
5′-GCAGCCCGGGGgatccACGAAACCACGTCCTACT-3′(SEQ ID NO:103)
PMT6inf5′armR:
5′-GGGGAAGCTcggatcGACTCATCTTGAAACGCA-3′(SEQ ID NO:104)
PMT6inf3′armF:
5′-AGTTCTAGAGCGGCCTTACCACCATTACATGCC-3′(SEQ ID NO:105)
PMT6inf3′armR2:
5′-AATTGGAGCTCCACCGCGGCCGCAACTTACTCGACGCTAA-3′(SEQ ID NO:106)
[实施例24]用插入灭活的或破坏的PMT基因制备产抗体的O.minuta菌株及其评价
(1)用插入灭活的PMT基因制备产抗体的O.minuta菌株
对于在实施例23中制备的PMT基因插入灭活载体,用PstI消化PMT1基因插入灭活载体,用XhoI消化PMT2基因插入灭活载体,并用HindIII消化PMT4基因插入灭活载体。通过电穿孔,将这些消化产物导入在实施例18中生长的产抗体的O.minuta YY1菌株。以下述方式证实转化菌株中PMT基因的中断。在已经加入浓度为50μg/ml的zeocine的YPD琼脂平板培养基中选择菌株,并培养,随后提取基因组。对PMT1基因进行PCR,该PCR在94℃进行30秒,在55℃进行30秒,在72℃进行1分钟,该循环重复30次,其中使用DNA引物对Zeo1(SEQ IDNO:107)和PMT1zeo1(SEQ ID NO:109)和DNA引物对Zeo2(SEQ IDNO:108)和PMT1zeo2(SEQ ID NO:110)。在相同条件下对PMT2基因进行PCR,其中使用DNA引物对Zeo1(SEQ ID NO:107)和PMT2zeo1(SEQID NO:111)和DNA引物对Zeo2(SEQ ID NO:108)和PMT2zeo2(SEQ IDNO:112)。在相同条件下对PMT4基因进行PCR,其中使用DNA引物对Zeo1(SEQ ID NO:107)和PMT4PCR3′armF(SEQ ID NO:113)和DNA引物对Zeo2(SEQ ID NO:108)和PMT4PCR5′armR3(SEQ ID NO:114)。从而,证实了在导入插入灭活载体后PMT基因的插入灭活。
Zeo1:5′-GAACGGCACTGGTCAACTTGGCCAT-3′(SEQ ID NO:107)
Zeo2:5′-CTTCGTGGCCGAGGAGCAGGACTGA-3′(SEQ ID NO:108)
PMT1zeo1:5′-GAATTCTAGCCGAGCATGAGCTA-3′(SEQ ID NO:109)
PMT1zeo2:5′-CGTTCAGACTCTTGTTGATTTTCCAC-3′(SEQ IDNO:110)
PMT2zeo1:5′-GCTGTGCCACTGCACGCCTCGACTC-3′(SEQ IDNO:111)
PMT2zeo2:5′-CTTGTCCCTCTTGAATGGCGAGTG-3′(SEQ ID NO:112)
PMT4PCR3′armF:5′-GGAACACGCCAAACATCATG-3′(SEQ ID NO:113)
PMT4PCR5′armR3:5′-CACAAGCAGAATCAGGCAC-3′(SEQ IDNO:114)
得到的菌株分别称作O.minuta YY2P1菌株(含有插入灭活的PMT1基因的菌株)、O.minuta YY2P2菌株(含有插入灭活的PMT2基因的菌株)和O.minuta YY2P4菌株(含有插入灭活的PMT4基因的菌株)。也将Sse8387I-消化的GAP/Z导入O.minuta YY1菌株,选择zeocine-抗性菌株,以得到O.minuta YY2Z菌株作为对照菌株。
(2)含有插入灭活的PMT基因的产抗体的O.minuta菌株的分泌抗体的生产力
以实施例18(2)所述的方式,培养在上面(1)制备的含有插入灭活的PMT基因的产抗体菌株,然后进行蛋白印迹分析。结果如图12和图14所示。也就是说,与在上面(1)制备的O.minuta YY2Z菌株相比,含有插入灭活的PMT1基因的O.minuta YY2P1菌株、含有插入灭活的PMT2基因的O.minuta YY2P2菌株和含有插入灭活的PMT4基因的O.minutaYY2P4菌株达到的抗体聚集体的分泌量略有增加(图12:泳道3和泳道6;图14:泳道3)。
(3)含有插入灭活的PMT基因的产抗体的O.minuta菌株的分泌抗体的生产力(通过基于TR-FRET的均质分析定量)
通过在实施例21(3)中所述的方法,测量在上面(2)中制备的培养液中生成的抗体的量。使用在动物细胞(CHO)中生产的抗体作为标准样品。如图13和图15所示,与在上面(1)制备的O.minuta YY2Z菌株相比,含有插入灭活的PMT1基因的O.minuta YY2P1菌株、含有插入灭活的PMT2基因的O.minuta YY2P2菌株和含有插入灭活的PMT4基因的O.minuta YY2P4菌株分泌的抗体聚集体的量略有增加(图13:YY2P1和YY2P2;图15:YY2P4)。
(4)PMT5和PMT6缺陷型菌株的制备及其评价
(4-1)O.minuta PMT5基因缺陷型菌株(Δoch1Δyps1Δura3Δade1Δpmt5)的制备
用HindIII消化在实施例23(2-1)中制备的PMT5基因破坏载体PMT5K/O/rURA3,并通过电脉冲方法转化进在实施例17中制备的Ogataea minuta YK5菌株(Δoch1Δura3Δade1Δyps1)。为了证实已经破坏了这些菌株的PMT5基因,合成了下述引物。
gPMT5-5:5′-CGGTGACGACTTCGACTAGTCGAG-3′(SEQ ID NO:115)
gPMT5-2:5′-CGGTGCTGTTGGCGTCGTCATGGGTG-3′(SEQ IDNO:116)
gPMT5-3:5′-GGCGCGTTCCAATTCCACTCTGCTG-3′(SEQ ID NO:117)
gPMT5-4:5′-CGACGAGTCCTCTCACCAGGAGGTTG-3′(SEQ IDNO:118)
将从转化菌株分离的染色体DNA用作模板,使用gPMT5-5引物(SEQ ID NO:115)和gPMT5-2引物(SEQ ID NO:116)进行PCR,该PCR在94℃进行30秒,在60℃进行1分钟,在72℃进行2分钟,该循环重复25次。从已经将质粒掺入PMT5基因座中的菌株,检测4.9kb的扩增的DNA片段。类似地,将从转化菌株分离的染色体DNA用作模板,使用gPMT5-3引物(SEQ ID NO:117)和gPMT5-4引物(SEQ ID NO:118)进行PCR,该PCR在94℃进行30秒,在60℃进行1分钟,在72℃进行2分钟,该循环重复25次。从已经将质粒掺入PMT5基因座中的菌株,检测4.9kb的扩增的DNA片段。选择的菌株称作O.minuta YK6菌株(Δoch1Δura3Δade1Δyps1Δpmt5::URA3)。
(4-2)O.minuta PMT6基因缺陷菌株(Δoch1Δyps1Δura3Δade1Δpmt6)的制备
用BamHI和NotI消化在实施例23(2-2)中制备的PMT6基因破坏载体PMT6K/O/rURA3,然后通过电脉冲方法转化进在实施例17中制备的O.minuta YK5菌株(Δoch1Δura3Δade1Δyps1)。为了证实已经破坏了这些菌株的PMT6基因,合成了下述引物。
PMT6 PCR3′armF:5′-TGTGGGTGCGATCCTGAG-3′(SEQ ID NO:119)
PMT6 PCR3′armR:5′-GCCGTCGTTGGAGCAAAACT-3′(SEQ ID NO:120)
PMT6 PCR5′armF:5′-GCATGTGCCACTGCTAAA-3′(SEQ ID NO:121)
PMT6 PCR5′armR:5′-GACCAACTTTCCCGTGTAA-3′(SEQ ID NO:122)
将从转化菌株分离的染色体DNA用作模板,使用PMT6 PCR3′armF引物(SEQ ID NO:119)和PMT6 PCR3′armR引物(SEQ ID NO:120)进行PCR,该PCR在94℃进行30秒,在60℃进行1分钟,在72℃进行2分钟,该循环重复25次。从已经将质粒掺入PMT6基因座中的菌株,检测5.8kb的扩增的DNA片段。类似地,将从转化菌株分离的染色体DNA用作模板,使用PMT6 PCR5′armF引物(SEQ ID NO:121)和PMT6PCR5′armR引物(SEQ ID NO:122)进行PCR,该PCR在94℃进行30秒,在60℃进行1分钟,在72℃进行2分钟,该循环重复25次。从已经将质粒掺入PMT6基因座中的菌株,检测6.3kb的扩增的DNA片段。选择的菌株称作O.minuta YK7菌株(Δoch1Δura3Δade1Δyps1Δpmt6::URA3)。
(5)其中的PMT5和PMT6基因已经被破坏的产抗体的O.minuta菌株的制备
通过电穿孔,使用NotI消化的抗体表达载体pOMexGPA/AbLys(在实施例18(1)中制备)和Sse8387I消化的抗体表达载体pOMexHy/AbLys,(在实施例18(1)中制备)来转化O.minuta YK6菌株(Δoch1Δyps1Δura3Δade1Δpmt5::rURA3)和O.minuta YK7菌株(Δoch1Δyps1Δura3Δade1Δpmt6::rURA3)。在已经加入浓度为50μg/ml的潮霉素B的SD琼脂平板培养基(2%葡萄糖,0.67%酵母氮基(Difco))中选择转化的细胞。在27℃在B2YP4G培养基(1.34%酵母氮基(Difco),2%酵母提取物(Difco),4%聚胨(Difco),4%甘油,0.1M磷酸盐缓冲液(pH 6.0))中培养单个菌落4天。从培养液制备培养上清液,按照实施例7所述的方法进行蛋白印迹分析,选择其中已经导入抗体轻链和重链基因的生产抗体的菌株,得到的菌株分别称作O.minuta AP5菌株(the PMT5基因缺陷型菌株)和O.minuta AP6菌株(the PMT6基因缺陷型菌株)。单独地,通过电穿孔,将NotI消化的抗体表达载体pOMexGPA/AbLys和Sse8387I消化的pOMexHy/AbLys导入O.minutaYK4菌株(Δoch1Δura3Δade1Δyps1::rURA3),以上述方式制备和选择生产抗体的菌株为对照菌株。得到的菌株称作O.minuta Acon菌株。
(6)其中的PMT5和PMT6基因已经被破坏的产抗体的O.minuta菌株的的分泌抗体的生产力
以实施例18(2)所述的方式,培养其中的PMT5基因已经被破坏的O.minuta AP5菌株和其中的PMT6基因已经被破坏的O.minuta AP6菌株和O.minuta Acon菌株,并进行非还原蛋白印迹分析。以实施例21(3)所述的方式,测量在培养液中生产的抗体的量。使用在动物细胞(CHO)中生产的抗体作为标准样品。结果如图16所示。也就是说,O.minuta AP5菌株或O.minuta AP6菌株和对照O.minuta Acon菌株之间的抗体聚集体的生产力没有显著差异。
[实施例25]含有插入灭活的PMT基因和导入其中的HAC1基因的O.minuta菌株的制备及其评价
(1)含有插入灭活的PMT基因和导入其中的HAC1基因的O.minuta菌株的制备
用Aor51HI消化在实施例3中制备的源自O.minuta的激活的HAC1基因表达载体pOMexPGHy/Hac1,并通过电穿孔,导入已经在实施例24(1)中制备的O.minutaYY2P2菌株(含有插入灭活的PMT2基因的菌株)、O.minuta YY2P4菌株(含有插入灭活的PMT4基因的菌株)和O.minutaYY2Z菌株(对照菌株)。为了证实激活的HAC1基因已经导入转化的菌株,在已经加入浓度为50μg/ml的潮霉素B的YPD琼脂平板培养基中选择菌株,培养菌株,提取基因组,根据实施例6的方法进行PCR。得到的菌株分别称作O.minuta YY3P2omH菌株(含有插入灭活的PMT2基因且含有导入其中的HAC1基因的菌株)、O.minuta YY3P4omH菌株(含有插入灭活的PMT4基因且含有导入其中的HAC1基因的菌株)和O.minuta YY3ZomH菌株(其中已经导入HAC1基因的对照菌株)。同时,将Aor51HI消化的pOMexPGHy导入O.minuta YY2Z菌株,获得O.minuta YY3ZHy菌株(其中已经导入载体的对照菌株)作为对照菌株。
(2)含有插入灭活的PMT基因且含有导入其中的HAC1基因的O.minuta菌株的分泌抗体的生产力
通过实施例18(2)所述的方法,培养在上面(1)制备的含有插入灭活的PMT基因且含有导入其中的HAC1基因的生产抗体的菌株,并进行蛋白印迹分析。结果如图12和图14所示。发现含有插入灭活的PMT2基因且含有导入其中的HAC1基因的O.minuta YY3P2omH菌株会分泌比仅导入HAC1基因的O.minuta YY3ZomH菌株和含有插入灭活的PMT2基因的O.minuta YY2P2菌株明显更大量的抗体(图12:泳道7)。发现含有插入灭活的PMT4基因且含有导入其中的HAC1基因的O.minuta YY3P4omH菌株会分泌比仅导入HAC1基因的O.minutaYY3ZomH菌株和含有插入灭活的PMT4基因的O.minuta YY2P4菌株明显更大量的抗体(图14:泳道6)。
通过实施例8和实施例21(3)所述的方法,测量在培养液中生产的抗体的量。使用在动物细胞(CHO)中生产的抗体作为标准样品。结果如图13和图15所示。发现含有插入灭活的PMT2基因且含有导入其中的HAC1基因的O.minuta YY3P2omH菌株会分泌比对照菌株即O.minutaYY3ZomH菌株(其中仅导入HAC1基因的菌株)、O.minuta YY2P2菌株(含有插入灭活的PMT2基因的菌株)和O.minuta YY3ZHy菌株(其中导入载体的对照菌株)明显更大量的抗体聚集体(图13:O.minutaYY3P2omH菌株)。也发现,含有插入灭活的PMT4基因且含有导入其中的HAC1基因的O.minuta YY3P4omH菌株会分泌比对照菌株即O.minuta YY3ZomH菌株(其中仅导入HAC1基因的菌株)、O.minutaYY2P4菌株(含有插入灭活的PMT4基因的菌株)和O.minuta YY3ZHy菌株(其中导入载体的对照菌株)明显更大量的抗体(图15:O.minutaYY3P4omH菌株)。
[实施例26]使用PMT抑制剂(1c),由含有插入灭活的PMT基因且含有导入其中的HAC1基因的O.minuta菌株生产抗体
将一铂环量的在实施例25(1)中制备的含有插入灭活的PMT基因且含有导入其中的HAC1基因的产抗体菌株接种进5ml B2YP4G培养基,在27℃培养1天,然后用B2YP4G培养基稀释,调节OD600=10。向产物加入在实施例9所述的PMT抑制剂(1c:母液浓度:0.1mM,0.5mM,2.5mM,和10mM),分别至0.016μM,0.08μM,0.4μM,和2.0μM的浓度。在27℃培养另外3天,每隔24小时测定OD600,OD600值每增加1,分别加入量为0.00032μM,0.0016μM,0.008μM,和0.04μM的PMT抑制剂(1c)。从培养液制备培养上清液,通过实施例18(2)所述的方法,进行蛋白印迹分析。结果如图17所示。此外,通过实施例21(3)所述的方法,对分泌抗体的生产力定量。结果如图18所示。当随着OD600值增加1而加入约0.008μM PMT抑制剂(母液浓度:2.5mM)时,达到O.minuta YY3P2omH菌株(含有插入灭活的PMT2基因的菌株且含有导入其中的HAC1基因)的最高抗体生产力。当随着OD600值增加1而加入约0.04μM PMT抑制剂(母液浓度:10mM)时,达到O.minutaYY3P4omH菌株(含有插入灭活的PMT4基因且含有导入其中的HAC1基因的菌株)的最高抗体生产力。可以推论,PMT基因表达的抑制和PMT抑制剂的联合使用,会强烈抑制糖链添加。对于其中已经导入HAC1的菌株,为了抑制糖链添加,通过PMT基因表达的抑制和PMT抑制剂的联合使用来抑制PMT蛋白活性,可以预见到更高的聚集抗体的生产力。
[实施例27]PMT抑制剂(5a)的评价
将一铂环量的已经导入抗体基因的O.minuta YY1菌株接种进5mlB2YP4G培养基,在27℃培养1天,然后用B2YP4G培养基稀释,调节OD600=10。向其中加入不同于实施例9所述的PMT抑制剂(1c)的PMT抑制剂({(5Z)-4-氧代-5-[3-(1-苯基乙氧基)-4-(2-苯基乙氧基)亚苄基]-2-硫代-1,3-噻唑烷-3-基}乙酸(在Bioorganic & Medicinal ChemistryLetters,Vol.14,p.3975,2004中所述的化合物5a),达到1μm的浓度。在27℃培养另外3天,每隔24小时测定OD600,OD600值每增加1,加入量为0.02μM的PMT抑制剂。从培养液制备培养上清液,通过实施例18(2)所述的方法进行蛋白印迹分析,通过实施例21(3)所述的方法对分泌抗体的生产力定量。结果如图19和图20所示。通过加入新检查的PMT抑制剂(5a),认为抗体聚集体的生产力倾向于增加。从而,认为PMT抑制剂(5a)具有与实施例9所述的PMT抑制剂(1c)等效的作用。
工业实用性
本发明实现了在酵母中高水平分泌生产具有复杂结构的蛋白,例如抗体,以及普通蛋白。
序列表
<110>Kyowa Hakko Kirin Co.,Ltd.
<110>DAIICHI SANKYO COMPANY,LIMITED
<110>National Institute of Advanced Industrial Science and Technology
<120>蛋白的高分泌生产方法
<130>PH-3149-PCT
<150>JP2006-136993
<151>2006-05-16
<160>122
<170>PatentIn Ver.2.1
<210>1
<211>25
<212>DNA
<213>人工序列
<220>
<223> 人工序列的描述:引物
<400>1
gngtngaytt yaaygtnccn ttrga                                        25
<210>2
<211>26
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:引物
<400>2
gynacdccng gyaaytcytt dccytc                                       26
<210>3
<211>9046
<212>DNA
<213>Ogataea minuta
<220>
<221>CDS
<222>(4766)..(6016)
<400>3
ggatcccgcc ctcgacggtt gttggtgcgg gataatgttc gttgatgagc caacttcgat  60
ttttgctgaa acgactgaga cagatccgac agacgaggtg tagttgcgga tcagattttg 120
catcactctg ctgtttcttt tgatgtgtct ttcgtcgtcc tggaaccccc aactcgatag 180
cagcgaaagg actttgtcgt ctcgctccac aagcgatagt tttggacgag ctagatatgg 240
attgacgtag cttcttgtcg aggtggcgga ctcttttttg atgtgggttt cggtaacgga 300
ttccgacttg gcatgtgatt caatcactcc ctcgtagtgg gacgacacca cgctcatgtt 360
gtcgtcgtcc tgttgtccgc tgaagtcaaa cggattgctt tttctgtcaa cggtgtcgac  420
gacagcgtca acgctcaaca gatctgagtc cacagtctcg acgctggaga cgtccgactc  480
atgaacagga tacctgaaat tcatctgggt cccaagaaac gtgtctgtgt gtgtctttct  540
gtgctgtctt ttcgtcattg cttgatattc cccctaaata gttatcacgt acggaactct  600
ggtaaaaaaa cctgatccgt ttcagatcaa ctacatttaa aatcaggttg ttcctccagc  660
cccggcggaa gctaaagatg gctggttttt tcaatcagat ggtgaaatat taattttttt  720
gagccgcaac ccagccccag atccgaggct gtgcagcaga ttcggtcgat aaatgtacaa  780
cgactatgct aaatagggag tgaaaagcag caaaaaaaat gtcttagagg tagtaccttg  840
gttcttcaaa gacatggaat ttgtggtctc tgaccccatc tccatagaac atcgatggga  900
atcggaggtc tggatcaacg gtttcctcgt ctatccgctg ttgcgagtag ctttcgtcgt  960
agtctccatt ggagggtatg ataaatttac ccacctgaac ctcagtgtcg gtgatggacc 1020
cacgactgat ccgagcatac ccggttcttt tgagtttctt gtacaagatg tactcgcacc 1080
aacgatcgtc atcagtagcg tcgatatcgt gcattcctga cttgtcgctc acgtaggtgt 1140
tgtaattccc cttgaggggt tcggtcacca agtagctcaa caggatcatt ggcctttctg 1200
aactgcccat aatttcggaa acaccgagag attgtaaacg gcggtcctca acgtcctctt 1260
cttgtcccga atggaaaacg acaacgtcca cgagctctcc gtaacagtcc agagtagcgt 1320
ggatggcagg agccaattcg cccacaggag acggaagcaa gtgatgcgtg gaattgatga 1380
tcggaaactt ggacaaaagg gccgcacccc aggtatgttt cgttgggttc ggaccgaaat 1440
cggcgtacat gccgagttct tcggcaattc tttgggtgag atctctgttt cccatgatga 1500
ttctttgagt gtccgattct aataaaccca caacgtccaa ctccaggtct ttgatcaggt 1560
ctctcattct gtgctcagat gcccacatgt cgttatcgag accaaagtga atggtccaaa 1620
taccagccgt gacaagtctg gactggggat ggtagggtct tggtttttcg aactggaatc 1680
tgttgaaagc gataaatccc gagagcagtg taaagaaaat gaggtaattt gtgatttttt 1740
tcaacgacga cttcagtcgc tttgaatgcg aaacttcaga ctgcttgtag ttgaaaacaa 1800
gaccgcaaat catcagaact gaaacagaca ggatgatatc tgttctttct ctcaacaatg 1860
gtccaccggg aacaaaggca tatgcgacaa cccagacgtg agccaaagag agcactatgt 1920
caaacaggaa cgaaagacca aacactagag ccacgccgtc cactttggaa acctgatcaa 1980
aacaaacagg agtgatgaaa cacagccaga aagcgtatgc cagcccacca gcgtaactga 2040
tccagccgtt gaaatagtac aggaacaaag ctccgagaac tcccgcataa gtgacagact 2100
tgtaggaact ggaccggtag aatccgaaaa aggctcctag acacatgaaa atcaccgtca 2160
ccgcaccgtg gggaacaggg atcggcccgt tgataggata gccctcccat gtccacagaa 2220
caatggtaga agagtcggta agcatggcac taatcgagaa aatcagagat ccaaaaccca 2280
tggctgacag cataagagaa ggcttttgag tcttaagtgg gcctttctca gatacagtcc 2340
cctgtggtag ctttgtgaaa gctgcagctg tcaatccgac aactagaccg gtgaggttcc 2400
acccaccggt gtcgctgttc atgatgggcc aaataggatt attggtccag aacgcaaact 2460
tggcgagact ggacagaatg agccccattg taaacgaggt tgcaaacgtt ttcgtagcca 2520
gttgatcatt cagtttgcca atggcagcca cttcggtact taaggcaatg gttgcgaacg 2580
aaacagccgc gccaataacc atcaatctgc aggcagggtc taccaccaag taagccccca 2640
caccgaacaa acaggtgagc gttctagcga cttgaggacg ttttgtgaaa aacagcttca 2700
cctttggaac tgccaagaca aacggagtca atagaaggac acagactgcc tcgtatcccg 2760
agattcccat gtaccacagc gggaagtacc agatacagag gaacaatgag gagtagacag 2820
accagaaaac gaaccaattg atggtgtcga cagtgagttg ccagaaagag ctgctgaact 2880
gagtcgactt cggtaatagc ttcccgctgg aggttggggc cgaggaactt gaagtgccgt 2940
ttattctgtc ttgaatgagc ttgatgtcga aattggcact gaaaaattcg tctcttgttg 3000
ctgaaggtct gagctcgatg atcaggtctt tgaagtccaa gatggaccag gcatcaaagc 3060
caacatcaag aaagatcaac gcccattcgc agtatgcgta gtaagaataa gctcccttga 3120
cgtgatgaac cttgtgctgg ataaaaagat acaccagagg gacaagtgca ccaaaaaatg 3180
tccatgcggt gtacttcctg gctcttctga tcctggaccg tggtggggac agcttggtga 3240
tagcgaggtc ccacgggata gtcaggacaa tgtaggagat cataaacaca tcgtgcgcgt 3300
cgtgatcatc cgtagaagta atataaaccc agcctccaca cgtgatggtt ctgatgaagc 3360
ccgatatcag ggcaagttta gggtacactg aattggcctt gtgcagacga acatacgtta 3420
gtagcagtag taagaaccga ggaccagctg taagcgcgat caaaatctgg aagattgacc 3480
gttcaggata tctgtcacca atggtggccg agacactcgg gaaccactcg tctggatacc 3540
cataatactc gttctcaacg attttgtaaa aatggagcca gcacccaaca gccaaggcag 3600
ctaaaaaggc agagagcgag cacacagagt gtgcgatcgc aatggcctgt gagttcaacc 3660
gcactagagg ctgcgagttg ggcccgtctg gaactgccat gatgataaat tgcgagcaaa 3720
ttgggtgaac atcagcacta aagcgacttg ttcccatcag aatctttaaa aacaacacct 3780
gaaatggacg ttttcagaga tcaggtgtaa gggtgtttgc ttggaaaaac acgaggaaaa 3840
gagcttgggc tgggaacacc cgtacaccgg atctagctcc tggctgcggg atctggattt 3900
aggaaaaaaa caaaacgcac gaatgagctt tgtcgccttt agcagagggt agaggtgata 3960
cactagacag caagagattg gaaaatggcg ggtaagtcgg ctgttgatga aatcttgatg 4020
acaactactg acatggaaca gaaatcaaag agaaacctga atttagaaag tcgccagacg 4080
tttcgttcga cgagattgat tacagagacc cgcttgctct aaaaaaggca caggagtcga 4140
tgctgagaga gcagttcatc agaattgagg ttctgaaggt ggtgagaaaa gcgctagaga 4200
attgctggag ggtgaacggg cccaacggac acgaagagtg ccgggacctg gccgacaagt 4260
acctagacat gctgccaaac tcccgggccc agggatacat gggataccaa agaaacgacc 4320
cgtccaaata ggctggctgc ggctggctgc ggctggctgc agaccgaccg caaaccaact 4380
gcaggcttgt tgtaggctga ttatttattg actatttatt gaatatttat tgcaccactt 4440
gtgtgttccc cttgaccatg cgtcgatcga cgcgcgaggc ttaggaagcc cggagcgggg 4500
aattcacgtg gtgtacgggt gtggaggtct agcacccgag ttttcggaga ggcagatgat 4560
gcatctccgg ggagtgtcag gcaaggagga atgggcagat cgacggaaga aagggatata 4620
aaatgttata tttgcacttg tttttgtgaa tatcagcacc caaacaaaat aagacaactt 4680
atcagtttct taagtattac aagtgagtaa ttgtcaacca gcacagctgt cgtagtgtaa 4740
acactaacgc cgcatagaac tagca atg tcg tta tcc agc aag ctg tca gtt   4792
                            Met Ser Leu Ser Ser Lys Leu Ser Val
                              1               5
aag gac ttg gac gtc tcg ggc aag aga gtg ttc ata aga gtg gac ttc   4840
Lys Asp Leu Asp Val Ser Gly Lys Arg Val Phe Ile Arg Val Asp Phe
 10                  15                  20                  25
aat gtt cca ttg gac gga gac aag atc acc aac aac caa aga att gtc   4888
Asn Val Pro Leu Asp Gly Asp Lys Ile Thr Asn Asn Gln Arg Ile Val
                 30                  35                  40
gct gct ttg cca acc att cag tac gtt ctt gag aac aag cca aag gtg   4936
Ala Ala Leu Pro Thr Ile Gln Tyr Val Leu Glu Asn Lys Pro Lys Val
             45                  50                  55
gtt gtt ttg gcc tcc cac ttg ggc aga ccc aac gga gag aag aac ctc   4984
Val Val Leu Ala Ser His Leu Gly Arg Pro Asn Gly Glu Lys Asn Leu
         60                  65                  70
aag tac aca ttg aag cct gtc gcc aag gaa ctg gag act ctt ttg ggc   5032
Lys Tyr Thr Leu Lys Pro Val Ala Lys Glu Leu Glu Thr Leu Leu Gly
     75                  80                  85
cag aaa gtg acc ttc ttg gac gac tgt gtt ggt tct gag gtc gaa tct   5080
Gln Lys Val Thr Phe Leu Asp Asp Cys Val Gly Ser Glu Val Glu Ser
 90                  95                 100                 105
acc gtc aac tct gcc cct gct ggc tcg gtg att ttg cta gaa aat ttg    5128
Thr Val Asn Ser Ala Pro Ala Gly Ser Val Ile Leu Leu Glu Asn Leu
                110                 115                 120
aga ttc cac att gag gag gaa ggc tcg aaa aag act tca gag gga aaa    5176
Arg Phe His Ile Glu Glu Glu Gly Ser Lys Lys Thr Ser Glu Gly Lys
            125                 130                 135
gtt aag gct tcc aaa gag gac gtt gaa aaa ttc aga aag caa ctc act    5224
Val Lys Ala Ser Lys Glu Asp Val Glu Lys Phe Arg Lys Gln Leu Thr
        140                 145                 150
gct ctg gct gat gtc tac gtt aac gac gct ttc ggt act gct cac aga    5272
Ala Leu Ala Asp Val Tyr Val Asn Asp Ala Phe Gly Thr Ala His Arg
    155                 160                 165
gcc cac tcc tcc atg gtc ggt ttc gag ctc gag gac aga gct gct ggc    5320
Ala His Ser Ser Met Val Gly Phe Glu Leu Glu Asp Arg Ala Ala Gly
170                 175                 180                 185
ttc ctg atg gcc aag gag ctg gag tac ttc tcc aag gct ctg gag aac    5368
Phe Leu Met Ala Lys Glu Leu Glu Tyr Phe Ser Lys Ala Leu Glu Asn
                190                 195                 200
ccg gtg aga ccg ttt ttg gct atc ctt ggt ggt gca aag gtg tct gac    5416
Pro Val Arg Pro Phe Leu Ala Ile Leu Gly Gly Ala Lys Val Ser Asp
            205                 210                 215
aaa att cag ctg att gac aat ttg ctc gac aag gtc gat ctc ttg att    5464
Lys Ile Gln Leu Ile Asp Asn Leu Leu Asp Lys Val Asp Leu Leu Ile
        220                 225                 230
gtc ggt gga gga atg gcc ttc act ttc aac aag gtg ttg aac gac atg    5512
Val Gly Gly Gly Met Ala Phe Thr Phe Asn Lys Val Leu Asn Asp Met
    235                 240                 245
aag atc ggt aag tct ttg ttc gac gag act gga gct gag att gtt cca    5560
Lys Ile Gly Lys Ser Leu Phe Asp Glu Thr Gly Ala Glu Ile Val Pro
250                 255                 260                 265
aag ctc gtg gag aag gcc aag aag aac ggc gtc aag atc gtt ttg cca    5608
Lys Leu Val Glu Lys Ala Lys Lys Asn Gly Val Lys Ile Val Leu Pro
                270                 275                 280
gtg gac ttt gtc act gcc gat gcg ttc tcg cca gat gcc aag gtt ggc    5656
Val Asp Phe Val Thr Ala Asp Ala Phe Ser Pro Asp Ala Lys Val Gly
            285                 290                 295
tac gcc acc ctt gag gag ggt att gcc gac gat ttg caa ggt ctg gac    5704
Tyr Ala Thr Leu Glu Glu Gly Ile Ala Asp Asp Leu Gln Gly Leu Asp
        300                 305                 310
ggt ggt gaa aag acc cgt aag ctg ttt gcc gac acc atc gcg cag gcc    5752
Gly Gly Glu Lys Thr Arg Lys Leu Phe Ala Asp Thr Ile Ala Gln Ala
    315                 320                 325
aag acc atc gtc tgg aac ggt cca cct ggt gtg ttt gag ttc gag agc    5800
Lys Thr Ile Val Trp Asn Gly Pro Pro Gly Val Phe Glu Phe Glu Ser
330                 335                 340                 345
ttt gcc agc ggt acc aag tcg atg ttg caa gct tgt gtc gag tct gcc    5848
Phe Ala Ser Gly Thr Lys Ser Met Leu Gln Ala Cys Val Glu Ser Ala
                350                 355                 360
cag gcc gga aac acc gtt att atc ggt ggt gga gac act gcc acc gtg    5896
Gln Ala Gly Asn Thr Val Ile Ile Gly Gly Gly Asp Thr Ala Thr Val
            365                 370                 375
gca aag aag ttt ggc ggt gcc gac aag ctg tcc cac gtt tcc act gga    5944
Ala Lys Lys Phe Gly Gly Ala Asp Lys Leu Ser His Val Ser Thr Gly
        380                 385                 390
gga ggt gct tcc ctg gaa ttg ttg gag ggt aag gag ctt cct ggt gtt    5992
Gly Gly Ala Ser Leu Glu Leu Leu Glu Gly Lys Glu Leu Pro Gly Val
    395                 400                 405
gct gct ttg aag agc aag act gct taggtgggat ttgcgtgatc tacgtagtgg   6046
Ala Ala Leu Lys Ser Lys Thr Ala
410                 415
ttatttttgt agttagtttg actgtctaga aatactcttt gcacagcccc aaataaatta  6106
cactgccgtg aaattcatga gaaaaaagta ccaaagataa acaggggaga aagtgatcgg  6166
gtgttccctc ttgtgtgatc cagtcgtgaa cagtactgat caccacccca gatgactaaa  6226
cacaggcgca aaaacattcc actgacttac atcacacaga gcctagacaa ttccaggacc  6286
aatcagggtt cttcgtttga taaggctcta gtgaacaaac acaaacaaca cagatcaaag  6346
actcacaatt ctgtcaaatt ggccagtcta accaagtctt acttgtctgc caagccggtc  6406
caggcaacaa agagcccaac agttgacaaa atcaccaaaa ggatcaaccg aaagtcccac  6466
tcgaccaaga aaatcgaccc tgtcgcctct ttctcagggc cctgggggct tcttaccggc  6526
caacttaacg actatttaac gtcgattcgc tcaatgaact ctgttttgga ttacgaccag  6586
cccttgacca cggctcagaa gtcgtcgtcg tcgattttgg acatcaaacc gatttcagac  6646
catttgaacg tggtcaggtt cgcagagctc gatagcgtga tgctgggctc gttccaaaac  6706
cacccagtca gactcaaggc tggcgaccaa attcacattg gagacgatta ctacaatgtt  6766
ccgtacaacg gaaagtatct cagatgttac tatcgatggt ttaaagtgat atgaggtata  6826
tacaggatgc cgactagacg gtgaactgtt cgcgcagttg agagtactgg ctggaacggt  6886
ccggatcaca cttttccaac agttgcgaca caaatggtcc gtgcacagtt ttttccagag  6946
tgtttgaaat actcaacaaa ggcatgtact cgtccaggaa ctccttgcac atggtggcat  7006
cgcctttcac tgccaggaat tgaagagcaa ccagcgacgg ggtcaaatct tcccgtttca  7066
atgcaccgtc aaggactttc ttcatgtaca cccagttgtt gcggttggca aaaatggtga  7126
ggaaaacaac atccaatctg gaacgaaatt gggcagcagc caggtcgtgt tcgaacattc 7186
gggtggacag ttggtacagc ttgtgaacca ttggagagta cttgaagctg taattagggt 7246
ctgcagttag cgaaccgatc gtaaggaagt tttcgttatc gatctgcgag cccgagatga 7306
ctaatagagg tattagtttt tgaacgtcct ccgttgacaa aacagggtta taagtgttga 7366
gaatccggaa gatacgtgcg tatctcttgt tgaacacctc cgcctctgtc tctactgatt 7426
tgtgaaattc agacgactgt agcacgagat caatatatct gaacacctcg tcaacagtaa 7486
cgggtttccc gttggcttgc atggctttga aatggttctc gatcttgttc agagggtaag 7546
tggctgggtc cttcaaatgc agtgttttta aagcctcaaa tcgctggttg tagttctccg 7606
aggttaagag ttccggtcta aaagcgctcg agctcgcttg ggtggtgtag agatgtagcc 7666
ggttcagctg caaaatagtt tgaagattcg agatcctcgg ccgggcagtg tgatagtatc 7726
tgatcccggc aaagatatcg tcgttgtagc cacggtcact tctggctgga tactttgtct 7786
tctctttcga ccacaggttc tccaagcaca tgacttctct tctctccgcg gtcagaaagt 7846
ggacgtaaat gttatcgatt ttgcagtcca tcatcatcca ggtatttgct gaggccccgt 7906
aatcattgct ggcgtacgaa ggggctctct tacccttttt caacagtctt ctgtgatact 7966
tggctagctg gccactgctc agaagacctt ctgccagagg gatggttttc agagtgtgtt 8026
tgatgaaaag attgagctcc gccgtagctt tctggagatg cttcgaactc tttcctgttc 8086
caatgatcat gaagtcggcg atctcttggg ctccttcgtt gacctctgcc ccggtgctat 8146
cgcgcaagtc gaacagggcc agatcggtca ttcccagctt ctccgcgata aactcgagaa 8206
ctggctgcaa gctggccgga gagttgggcg gaagatccgg aatctgaatc tgtctaggct 8266
gcgaggccaa atccgcagac tcttcagctc tcatgtacca cgggagagct gccgttttga 8326
cttcttggtg gctgactgga actgacgaga agtcggcgac cagttgctgg gaactggcag 8386
cgttgtgagg gaagaagccg ctccgaaggg cgcggggcac aggacgcgac accggacaca 8446
accgacaccg tctccacatt atggctgtat ttggaaaaga ttgagtagtc gatagtttct 8506
gcaaaagctt tagcaaacaa caaacacgcg acgtttgaag acagtttttt ggcagcttcg 8566
atctgtcgat agttcagtgg tgatctcagt ggtcgtttcg tctaccttga atctctcacc 8626
ccagatgttg tctctgtgtg aagtttttgt gaatttttca tctttctttt tactcgattt 8686
tttcctcttc cacgtcgata gtcgcgagac gccttgcgac gcgccgtttt aatttcccaa 8746
aatttgcaca aacaaaagat aaaaacagga ctgtcgattt gggttttgtg ggaacagaaa 8806
agaggaaccg tttgaacaat aaagcaacgg tcctccaaaa tcatcctcta ccactcattc 8866
tcaacacgtg accatcggga acaagttctg gagctctctt caaaccgcga ctcaacatag 8926
tgttttgtgc caggcccgta ttttactata aaggtgccct caagaaccat tagttcgtgc 8986
tacttgcctc cgatttgtgc ttcctaacgg tgtttcaaca atcatgacag gccgggatcc 9046
<210>4
<211>417
<212>PRT
<213>Ogataea minuta
<400>4
Met Ser Leu Ser Ser Lys Leu Ser Val Lys Asp Leu Asp Val Ser Gly
  1               5                   10                 15
Lys Arg Val Phe Ile Arg Val Asp Phe Asn Val Pro Leu Asp Gly Asp
             20                  25                  30
Lys Ile Thr Asn Asn Gln Arg Ile Val Ala Ala Leu Pro Thr Ile Gln
         35                  40                  45
Tyr Val Leu Glu Asn Lys Pro Lys Val Val Val Leu Ala Ser His Leu
     50                  55                  60
Gly Arg Pro Asn Gly Glu Lys Asn Leu Lys Tyr Thr Leu Lys Pro Val
 65                  70                  75                  80
Ala Lys Glu Leu Glu Thr Leu Leu Gly Gln Lys Val Thr Phe Leu Asp
                 85                  90                  95
Asp Cys Val Gly Ser Glu Val Glu Ser Thr Val Asn Ser Ala Pro Ala
            100                 105                 110
Gly Ser Val Ile Leu Leu Glu Asn Leu Arg Phe His Ile Glu Glu Glu
        115                 120                 125
Gly Ser Lys Lys Thr Ser Glu Gly Lys Val Lys Ala Ser Lys Glu Asp
    130                 135                 140
Val Glu Lys Phe Arg Lys Gln Leu Thr Ala Leu Ala Asp Val Tyr Val
145                 150                 155                 160
Asn Asp Ala Phe Gly Thr Ala His Arg Ala His Ser Ser Met Val Gly
                165                 170                 175
Phe Glu Leu Glu Asp Arg Ala Ala Gly Phe Leu Met Ala Lys Glu Leu
            180                 185                 190
Glu Tyr Phe Ser Lys Ala Leu Glu Asn Pro Val Arg Pro Phe Leu Ala
        195                 200                 205
Ile Leu Gly Gly Ala Lys Val Ser Asp Lys Ile Gln Leu Ile Asp Asn
    210                 215                 220
Leu Leu Asp Lys Val Asp Leu Leu Ile Val Gly Gly Gly Met Ala Phe
225                 230                 235                 240
Thr Phe Asn Lys Val Leu Asn Asp Met Lys Ile Gly Lys Ser Leu Phe
                245                 250                 255
Asp Glu Thr Gly Ala Glu Ile Val Pro Lys Leu Val Glu Lys Ala Lys
            260                 265                 270
Lys Asn Gly Val Lys Ile Val Leu Pro Val Asp Phe Val Thr Ala Asp
        275                 280                 285
Ala Phe Ser Pro Asp Ala Lys Val Gly Tyr Ala Thr Leu Glu Glu Gly
    290                 295                 300
Ile Ala Asp Asp Leu Gln Gly Leu Asp Gly Gly Glu Lys Thr Arg Lys
305                 310                 315                 320
Leu Phe Ala Asp Thr Ile Ala Gln Ala Lys Thr Ile Val Trp Asn Gly
                325                 330                 335
Pro Pro Gly Val Phe Glu Phe Glu Ser Phe Ala Ser Gly Thr Lys Ser
            340                 345                 350
Met Leu Gln Ala Cys Val Glu Ser Ala Gln Ala Gly Asn Thr Val Ile
        355                 360                 365
Ile Gly Gly Gly Asp Thr Ala Thr Val Ala Lys Lys Phe Gly Gly Ala
    370                 375                 380
Asp Lys Leu Ser His Val Ser Thr Gly Gly Gly Ala Ser Leu Glu Leu
385                 390                 395                 400
Leu Glu Gly Lys Glu Leu Pro Gly Val Ala Ala Leu Lys Ser Lys Thr
                405                 410                 415
Ala
<210>5
<211>42
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:引物
<400>5
aagcttgaca atgtaggaga tcataaacac atcgtgcgcg tc                    42
<210>6
<211>65
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:引物
<400>6
ggatccagat ctcatatgac tagttgctag ttctatgcgg cgttagtgtt tacactacga 60
cagct                                                             65
<210>7
<211>40
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:引物
<400>7
ggatccgtgg gatttgcgtg atctacgtag tggttatttt                       40
<210>8
<211>42
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:引物
<400>8
ggtaccgcag tgaaaggcga tgccaccatg tgcaaggagt tc                    42
<210>9
<211>25
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:引物
<400>9
actagtatga gatttccttc aattt                                       25
<210>10
<211>25
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:引物
<400>10
gtcgacatga gatttccttc aattt                                       25
<210>11
<211>27
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:引物
<400>11
agcttcagcc tctcttttat ctagaga                                     27
<210>12
<211>47
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:引物
<400>12
tctctagata aaagagaggc tgaagctcag ctgcagctgc aggagtc               47
<210>13
<211>39
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:引物
<400>13
ccagatctgg atcctcattt acccggagac agggagagg                        39
<210>14
<211>47
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:引物
<400>14
tctctagata aaagagaggc tgaagctgaa attgtgttga cacagtc               47
<210>15
<211>35
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:引物
<400>15
aaagggccct caacactctc ccctgttgaa gctct                            35
<210>16
<211>25
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:引物
<400>16
atgacttcct tttcagcacc gcatc                                       25
<210>17
<211>23
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:引物
<400>17
caaaattgca agcaagttaa ccg                                           23
<210>18
<211>1431
<212>DNA
<213>Ogataea minuta
<400>18
atgacttcct tttcagcacc gcatcaacac cagtctattc cgtcggatgt tcctgtcgga   60
acgcttcctc ctagaaagag ggcgaagacc gacgaagaga aggagcaacg cagggttgag  120
cggattctca gaaataggag agccgcccac gcgtcgaggg aaaagaaaag aagacatgtt  180
gaacatctcg agacgtatgt gagtggcctg gagtcctcgc ttgcgattta cgagttgaat  240
caatccaaac tgcaaacgat acagtcgact ctcatatctt tgttgacgga gcacgggatc  300
gaatactctg gtattgactt ctcaatccaa gcaacaacaa aagtcagcaa gcctgacggg  360
ctcgacttga cacagacgaa tcctaccaaa aaacaaaaga gtttctcaaa gtcactttca  420
aaaaaaatgg gttcttcctc tagcatgaag atgtcggaac tcccatctcc tagcttcgac  480
gaggacgtct cttcggatga agacgacgat cttgaagatg acgagggagc agaaattgtc  540
gaggaatcgc caatgacgta tttggacctt ccggatccaa aagcgaacta caaaaagaga  600
aaggctgaag aagcttatat ttctccacct ggctcgacct ccccttccaa attgaagttg  660
gaggaagacg agctgatttt gaagcaagag tacagcaatt tgtttgacga cacggaagac  720
tttttctcta ctgagaagtc ttgcagtttg gagttgttca aacaaggcga ctctccttcg  780
gaatcattca tcaaacagga agacgatata ctgaaaatac ctgaggctgt tttcaactca  840
gaagaatatc atttgaatcc agtggaggac ctctgtgctt ttaatagcgt gcatcatcca  900
gcagtgatga ttgtatgatt tattgaaaag gcatctcaat aacattgaaa cagtgagatt  960
tccaaacaag aattgtacaa acgtgacatc atcaaaggta aaatcagaaa aaagttcttt 1020
tttcaggggt atttgtttgt tcttctttct gattttaccg tagttacgtt ttgtctgttt 1080
tttgaggaag tccaagctct tcgagcgttt catgtcggtt tattgcagat gttcgttttg 1140
gtccgcagca ccattatcag cgggggtcgt taacacttca tttgaattcg atgatttctt 1200
gtcatgagga agatagtcta cttggtttta tttagttgga atttggtgtc attgtttgat 1260
gagggggatg gaggtttgat caatcggttt caagttctct ttcgatgaga ttaatttgtt 1320
accgtctatg agttagatcc tgacccttgg tgagcttcgg aaaaaagttt gaagttcagc 1380
ctggttccat gccacgcgtg tttggttacg gttaacttgc ttgcaatttt g          1431
<210>19
<211>1187
<212>DNA
<213>Ogataea minuta
<400>19
atgacttcct tttcagcacc gcatcaacac cagtctattc cgtcggatgt tcctgtcgga   60
acgcttcctc ctagaaagag ggcgaagacc gacgaagaga aggagcaacg cagggttgag  120
cggattctca gaaataggag agccgcccac gcgtcgaggg aaaagaaaag aagacatgtt  180
gaacatctcg agacgtatgt gagtggcctg gagtcctcgc ttgcgattta cgagttgaat  240
caatccaaac tgcaaacgat acagtcgact ctcatatctt tgttgacgga gcacgggatc  300
gaatactctg gtattgactt ctcaatccaa gcaacaacaa aagtcagcaa gcctgacggg  360
ctcgacttga cacagacgaa tcctaccaaa aaacaaaaga gtttctcaaa gtcactttca  420
aaaaaaatgg gttcttcctc tagcatgaag atgtcggaac tcccatctcc tagcttcgac  480
gaggacgtct cttcggatga agacgacgat cttgaagatg acgagggagc agaaattgtc  540
gaggaatcgc caatgacgta tttggacctt ccggatccaa aagcgaacta caaaaagaga  600
aaggctgaag aagcttatat ttctccacct ggctcgacct ccccttccaa attgaagttg  660
gaggaagacg agctgatttt gaagcaagag tacagcaatt tgtttgacga cacggaagac  720
tttttctcta ctgagaagtc ttgcagtttg gagttgttca aacaaggcga ctctccttcg  780
gaatcattca tcaaacagga agacgatata ctgaaaatac ctgaggctgt tttcaactca  840
gaagaatatc atttgaatcc agtggaggac ctctgtgctt ttaatagcgt gcatcatcca  900
gcagcaccat tatcagcggg ggtcgttaac acttcatttg aattcgatga tttcttgtca   960
tgaggaagat agtctacttg gttttattta gttggaattt ggtgtcattg tttgatgagg  1020
gggatggagg tttgatcaat cggtttcaag ttctctttcg atgagattaa tttgttaccg  1080
tctatgagtt agatcctgac ccttggtgag cttcggaaaa aagtttgaag ttcagcctgg  1140
ttccatgcca cgcgtgtttg gttacggtta acttgcttgc aattttg                1187
<210>20
<211>28
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:引物
<400>20
gactagtatg acttcctttt cagcaccg                                      28
<210>21
<211>29
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:引物
<400>21
cagatcttca tgacaagaaa tcatcgaat                                     29
<210>22
<211>963
<212>DNA
<213>Ogataea minuta
<220>
<221>CDS
<222>(1)..(963)
<400>22
atg act tcc ttt tca gca ccg cat caa cac cag tct att ccg tcg gat     48
Met Thr Ser Phe Ser Ala Pro His Gln His Gln Ser Ile Pro Ser Asp
  1               5                  10                  15
gtt cct gtc gga acg ctt cct cct aga aag agg gcg aag acc gac gaa     96
Val Pro Val Gly Thr Leu Pro Pro Arg Lys Arg Ala Lys Thr Asp Glu
             20                  25                  30
gag aag gag caa cgc agg gtt gag cgg att ctc aga aat agg aga gcc    144
Glu Lys Glu Gln Arg Arg Val Glu Arg Ile Leu Arg Asn Arg Arg Ala
         35                  40                  45
gcc cac gcg tcg agg gaa aag aaa aga aga cat gtt gaa cat ctc gag    192
Ala His Ala Ser Arg Glu Lys Lys Arg Arg His Val Glu His Leu Glu
     50                  55                  60
acg tat gtg agt ggc ctg gag tcc tcg ctt gcg att tac gag ttg aat    240
Thr Tyr Val Ser Gly Leu Glu Ser Ser Leu Ala Ile Tyr Glu Leu Asn
 65                  70                  75                  80
caa tcc aaa ctg caa acg ata cag tcg act ctc ata tct ttg ttg acg    288
Gln Ser Lys Leu Gln Thr Ile Gln Ser Thr Leu Ile Ser Leu Leu Thr
                 85                  90                  95
gag cac ggg atc gaa tac tct ggt att gac ttc tca atc caa gca aca    336
Glu His Gly Ile Glu Tyr Ser Gly Ile Asp Phe Ser Ile Gln Ala Thr
            100                 105                 110
aca aaa gtc agc aag cct gac ggg ctc gac ttg aca cag acg aat cct    384
Thr Lys Val Ser Lys Pro Asp Gly Leu Asp Leu Thr Gln Thr Asn Pro
        115                 120                 125
acc aaa aaa caa aag agt ttc tca aag tca ctt tca aaa aaa atg ggt    432
Thr Lys Lys Gln Lys Ser Phe Ser Lys Ser Leu Ser Lys Lys Met Gly
    130                 135                 140
tct tcc tct agc atg aag atg tcg gaa ctc cca tct cct agc ttc gac    480
Ser Ser Ser Ser Met Lys Met Ser Glu Leu Pro Ser Pro Ser Phe Asp
145                 150                 155                 160
gag gac gtc tct tcg gat gaa gac gac gat ctt gaa gat gac gag gga    528
Glu Asp Val Ser Ser Asp Glu Asp Asp Asp Leu Glu Asp Asp Glu Gly
                165                 170                 175
gca gaa att gtc gag gaa tcg cca atg acg tat ttg gac ctt ccg gat    576
Ala Glu Ile Val Glu Glu Ser Pro Met Thr Tyr Leu Asp Leu Pro Asp
            180                 185                 190
cca aaa gcg aac tac aaa aag aga aag gct gaa gaa gct tat att tct    624
Pro Lys Ala Asn Tyr Lys Lys Arg Lys Ala Glu Glu Ala Tyr Ile Ser
        195                 200                 205
cca cct ggc tcg acc tcc cct tcc aaa ttg aag ttg gag gaa gac gag    672
Pro Pro Gly Ser Thr Ser Pro Ser Lys Leu Lys Leu Glu Glu Asp Glu
    210                 215                 220
ctg att ttg aag caa gag tac agc aat ttg ttt gac gac acg gaa gac    720
Leu Ile Leu Lys Gln Glu Tyr Ser Asn Leu Phe Asp Asp Thr Glu Asp
225                 230                 235                 240
ttt ttc tct act gag aag tct tgc agt ttg gag ttg ttc aaa caa ggc    768
Phe Phe Ser Thr Glu Lys Ser Cys Ser Leu Glu Leu Phe Lys Gln Gly
                245                 250                 255
gac tct cct tcg gaa tca ttc atc aaa cag gaa gac gat ata ctg aaa    816
Asp Ser Pro Ser Glu Ser Phe Ile Lys Gln Glu Asp Asp Ile Leu Lys
            260                 265                 270
ata cct gag gct gtt ttc aac tca gaa gaa tat cat ttg aat cca gtg    864
Ile Pro Glu Ala Val Phe Asn Ser Glu Glu Tyr His Leu Asn Pro Val
        275                 280                 285
gag gac ctc tgt gct ttt aat agc gtg cat cat cca gca gca cca tta    912
Glu Asp Leu Cys Ala Phe Asn Ser Val His His Pro Ala Ala Pro Leu
    290                 295                 300
tca gcg ggg gtc gtt aac act tca ttt gaa ttc gat gat ttc ttg tca    960
Ser Ala Gly Val Val Asn Thr Ser Phe Glu Phe Asp Asp Phe Leu Ser
305                 310                 315                 320
tga                                                                963
<210>23
<211>320
<212>PRT
<213>Ogataea minuta
<400>23
Met Thr Ser Phe Ser Ala Pro His Gln His Gln Ser Ile Pro Ser Asp
  1               5                  10                  15
Val Pro Val Gly Thr Leu Pro Pro Arg Lys Arg Ala Lys Thr Asp Glu
             20                  25                  30
Glu Lys Glu Gln Arg Arg Val Glu Arg Ile Leu Arg Asn Arg Arg Ala
         35                  40                  45
Ala His Ala Ser Arg Glu Lys Lys Arg Arg His Val Glu His Leu Glu
     50                  55                  60
Thr Tyr Val Ser Gly Leu Glu Ser Ser Leu Ala Ile Tyr Glu Leu Asn
 65                  70                  75                  80
Gln Ser Lys Leu Gln Thr Ile Gln Ser Thr Leu Ile Ser Leu Leu Thr
                 85                  90                  95
Glu His Gly Ile Glu Tyr Ser Gly Ile Asp Phe Ser Ile Gln Ala Thr
            100                 105                 110
Thr Lys Val Ser Lys Pro Asp Gly Leu Asp Leu Thr Gln Thr Asn Pro
        115                 120                 125
Thr Lys Lys Gln Lys Ser Phe Ser Lys Ser Leu Ser Lys Lys Met Gly
    130                 135                 140
Ser Ser Ser Ser Met Lys Met Ser Glu Leu Pro Ser Pro Ser Phe Asp
145                 150                 155                 160
Glu Asp Val Ser Ser Asp Glu Asp Asp Asp Leu Glu Asp Asp Glu Gly
                165                 170                 175
Ala Glu Ile Val Glu Glu Ser Pro Met Thr Tyr Leu Asp Leu Pro Asp
            180                 185                 190
Pro Lys Ala Asn Tyr Lys Lys Arg Lys Ala Glu Glu Ala Tyr Ile Ser
        195                 200                 205
Pro Pro Gly Ser Thr Ser Pro Ser Lys Leu Lys Leu Glu Glu Asp Glu
    210                 215                 220
Leu Ile Leu Lys Gln Glu Tyr Ser Asn Leu Phe Asp Asp Thr Glu Asp
225                 230                 235                 240
Phe Phe Ser Thr Glu Lys Ser Cys Ser Leu Glu Leu Phe Lys Gln Gly
                245                 250                 255
Asp Ser Pro Ser Glu Ser Phe Ile Lys Gln Glu Asp Asp Ile Leu Lys
            260                 265                 270
Ile Pro Glu Ala Val Phe Asn Ser Glu Glu Tyr His Leu Asn Pro Val
        275                 280                 285
Glu Asp Leu Cys Ala Phe Asn Ser Val His His Pro Ala Ala Pro Leu
    290                 295                 300
Ser Ala Gly Val Val Asn Thr Ser Phe Glu Phe Asp Asp Phe Leu Ser
305                 310                 315                 320
<210>24
<211>50
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:引物
<400>24
atacaataca aagtcgagac tagtatggat atttacgaca ctcaaacctt            50
<210>25
<211>50
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:引物
<400>25
tctatccaca cggatcagat cttcagacag aggtgccctc ctttgagctg            50
<210>26
<211>24
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:引物
<400>26
ggaattcatg agatttcctt caat                                        24
<210>27
<211>35
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:引物
<400>27
ctccaccagc tgtacttctc ttttctcgag agata                            35
<210>28
<211>35
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:引物
<400>28
tatctctcga gaaaagagaa gtacagctgg tggag                            35
<210>29
<211>25
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:引物
<400>29
ggtcgactca tttacccggg gacag                                      25
<210>30
<211>34
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:引物
<400>30
tgggtcatct gaatgtctct tttctcgaga gata                            34
<210>31
<211>34
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:引物
<400>31
tatctctcga gaaaagagac attcagatga ccca                            34
<210>32
<211>24
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:引物
<400>32
ggtcgaccta acactctccc ctgt                                       24
<210>33
<211>26
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:引物
<400>33
ggagctcatg gaaatgactg attttg                                     26
<210>34
<211>44
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:引物
<400>34
gaattcaaac ctgactgcgc ttctggatta cgccaattgt caag                 44
<210>35
<211>44
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:引物
<400>35
cttgacaatt ggcgtaatcc agaagcgcag tcaggtttga attc                  44
<210>36
<211>28
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:引物
<400>36
gcccgggtca tgaagtgatg aagaaatc                                    28
<210>37
<211>26
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:引物
<400>37
gggtaccatg gatatttacg acactc                                      26
<210>38
<211>26
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:引物
<400>38
gtctagatca gacagaggtg ccctcc                                      26
<210>39
<211>717
<212>DNA
<213>啤酒糖酵母
<220>
<221>CDS
<222>(1)..(717)
<400>39
atg gaa atg act gat ttt gaa cta act agt aat tcg caa tcg aac ttg   48
Met Glu Met Thr Asp Phe Glu Leu Thr Ser Asn Ser Gln Ser Asn Leu
  1               5                  10                  15
gct atc cct acc aac ttc aag tcg act ctg cct cca agg aaa aga gcc   96
Ala Ile Pro Thr Asn Phe Lys Ser Thr Leu Pro Pro Arg Lys Arg Ala
             20                  25                  30
aag aca aaa gag gaa aag gaa cag cga agg atc gag cgt att ttg aga   144
Lys Thr Lys Glu Glu Lys Glu Gln Arg Arg Ile Glu Arg Ile Leu Arg
         35                  40                  45
aac aga aga gct gct cac cag agc aga gag aaa aaa aga cta cat ctg   192
Asn Arg Arg Ala Ala His Gln Ser Arg Glu Lys Lys Arg Leu His Leu
     50                  55                  60
cag tat ctc gag aga aaa tgt tct ctt ttg gaa aat tta ctg aac agc   240
Gln Tyr Leu Glu Arg Lys Cys Ser Leu Leu Glu Asn Leu Leu Asn Ser
 65                  70                  75                  80
gtc aac ctt gaa aaa ctg gct gac cac gaa gac gcg ttg act tgc agc   288
Val Asn Leu Glu Lys Leu Ala Asp His Glu Asp Ala Leu Thr Cys Ser
                 85                  90                  95
cac gac gct ttt gtt gct tct ctt gac gag tac agg gat ttc cag agc   336
His Asp Ala Phe Val Ala Ser Leu Asp Glu Tyr Arg Asp Phe Gln Ser
            100                 105                 110
acg agg ggc gct tca ctg gac acc agg gcc agt tcg cac tcg tcg tct   384
Thr Arg Gly Ala Ser Leu Asp Thr Arg Ala Ser Ser His Ser Ser Ser
        115                 120                 125
gat acg ttc aca cct tca cct ctg aac tgt aca atg gag cct gcg act   432
Asp Thr Phe Thr Pro Ser Pro Leu Asn Cys Thr Met Glu Pro Ala Thr
    130                 135                 140
ttg tcg ccc aag agt atg cgc gat tcc gcg tcg gac caa gag act tca   480
Leu Ser Pro Lys Ser Met Arg Asp Ser Ala Ser Asp Gln Glu Thr Ser
145                 150                 155                 160
tgg gag ctg cag atg ttt aag acg gaa aat gta cca gag tcg acg acg   528
Trp Glu Leu Gln Met Phe Lys Thr Glu Asn Val Pro Glu Ser Thr Thr
                165                 170                 175
cta cct gcc gta gac aac aac aat ttg ttt gat gcg gtg gcc tcg ccg   576
Leu Pro Ala Val Asp Asn Asn Asn Leu Phe Asp Ala Val Ala Ser Pro
            180                 185                 190
ttg gca gac cca ctc tgc gac gat ata gcg gga aac agt cta ccc ttt   624
Leu Ala Asp Pro Leu Cys Asp Asp Ile Ala Gly Asn Ser Leu Pro Phe
        195                 200                 205
gac aat tca att gat ctt gac aat tgg cgt aat cca gaa gcg cag tca   672
Asp Asn Ser Ile Asp Leu Asp Asn Trp Arg Asn Pro Glu Ala Gln Ser
    210                 215                 220
ggt ttg aat tca ttt gaa ttg aat gat ttc ttc atc act tca tga       717
Gly Leu Asn Ser Phe Glu Leu Asn Asp Phe Phe Ile Thr Ser
225                 230                 235
<210>40
<211>238
<212>PRT
<213>啤酒糖酵母
<400>40
Met Glu Met Thr Asp Phe Glu Leu Thr Ser Asn Ser Gln Ser Asn Leu
  1               5                  10                  15
Ala Ile Pro Thr Asn Phe Lys Ser Thr Leu Pro Pro Arg Lys Arg Ala
             20                  25                  30
Lys Thr Lys Glu Glu Lys Glu Gln Arg Arg Ile Glu Arg Ile Leu Arg
         35                  40                  45
Asn Arg Arg Ala Ala His Gln Ser Arg Glu Lys Lys Arg Leu His Leu
     50                  55                  60
Gln Tyr Leu Glu Arg Lys Cys Ser Leu Leu Glu Asn Leu Leu Asn Ser
 65                  70                  75                  80
Val Asn Leu Glu Lys Leu Ala Asp His Glu Asp Ala Leu Thr Cys Ser
                 85                  90                  95
His Asp Ala Phe Val Ala Ser Leu Asp Glu Tyr Arg Asp Phe Gln Ser
            100                 105                 110
Thr Arg Gly Ala Ser Leu Asp Thr Arg Ala Ser Ser His Ser Ser Ser
        115                 120                 125
Asp Thr Phe Thr Pro Ser Pro Leu Asn Cys Thr Met Glu Pro Ala Thr
    130                 135                 140
Leu Ser Pro Lys Ser Met Arg Asp Ser Ala Ser Asp Gln Glu Thr Ser
145                 150                 155                 160
Trp Glu Leu Gln Met Phe Lys Thr Glu Asn Val Pro Glu Ser Thr Thr
                165                 170                 175
Leu Pro Ala Val Asp Asn Asn Asn Leu Phe Asp Ala Val Ala Ser Pro
            180                 185                 190
Leu Ala Asp Pro Leu Cys Asp Asp Ile Ala Gly Asn Ser Leu Pro Phe
        195                 200                 205
Asp Asn Ser Ile Asp Leu Asp Asn Trp Arg Asn Pro Glu Ala Gln Ser
    210                 215                 220
Gly Leu Asn Ser Phe Glu Leu Asn Asp Phe Phe Ile Thr Ser
225                 230                 235
<210>41
<211>1356
<212>DNA
<213>里氏木霉
<220>
<221>CDS
<222>(1)..(1356)
<400>41
atg gcg ttc cag cag tcg tct ccc ctc gtc aag ttt gag gcc tct ccc    48
Met Ala Phe Gln Gln Ser Ser Pro Leu Val Lys Phe Glu Ala Ser Pro
  1               5                  10                  15
gcc gaa tcc ttc ctc tcc gcc ccc ggc gac aac ttc aca tcc ctc ttc    96
Ala Glu Ser Phe Leu Ser Ala Pro Gly Asp Asn Phe Thr Ser Leu Phe
             20                  25                  30
gcc gac tca aca ccc tca aca ctt aac cct cgg gac atg atg acc cct   144
Ala Asp Ser Thr Pro Ser Thr Leu Asn Pro Arg Asp Met Met Thr Pro
         35                  40                  45
gac agc gtc gcc gac atc gac tct cgc ctg tcc gtc atc ccc gaa tca   192
Asp Ser Val Ala Asp Ile Asp Ser Arg Leu Ser Val Ile Pro Glu Ser
     50                  55                  60
cag gac gcg gaa gat gac gaa tca cac tcc aca tcc gct acc gca ccc    240
Gln Asp Ala Glu Asp Asp Glu Ser His Ser Thr Ser Ala Thr Ala Pro
 65                  70                  75                  80
tct acc tca gaa aag aag ccc gtc aag aag agg aaa tca tgg ggc cag    288
Ser Thr Ser Glu Lys Lys Pro Val Lys Lys Arg Lys Ser Trp Gly Gln
                 85                  90                  95
gtt ctt cct gag ccc aag acc aac ctc cct cct cga aaa cgt gca aag    336
Val Leu Pro Glu Pro Lys Thr Asn Leu Pro Pro Arg Lys Arg Ala Lys
            100                 105                 110
acg gaa gat gaa aag gag cag cgc cgc gtc gag cgt gtt ctc cgc aac    384
Thr Glu Asp Glu Lys Glu Gln Arg Arg Val Glu Arg Val Leu Arg Asn
        115                 120                 125
cgc cgc gcc gcg cag tcc tcg cgc gag cgc aag agg ctc gag gtc gag    432
Arg Arg Ala Ala Gln Ser Ser Arg Glu Arg Lys Arg Leu Glu Val Glu
    130                 135                 140
gct ctc gag aag cgc aac aag gag ctc gag acg ctc ctc atc aac gtc    480
Ala Leu Glu Lys Arg Asn Lys Glu Leu Glu Thr Leu Leu Ile Asn Val
145                 150                 155                 160
cag aag acc aac ctg atc ctc gtc gag gag ctc aac cgc ttc cga cgc    528
Gln Lys Thr Asn Leu Ile Leu Val Glu Glu Leu Asn Arg Phe Arg Arg
                165                 170                 175
agc tca ggc gtc gtc acc cgc tcg tcc tcc ccc ctc gac tct ctc cag    576
Ser Ser Gly Val Val Thr Arg Ser Ser Ser Pro Leu Asp Ser Leu Gln
            180                 185                 190
gac agc atc act ctc tcc cag caa ctc ttt ggc tcg cgg gat ggc caa    624
Asp Ser Ile Thr Leu Ser Gln Gln Leu Phe Gly Ser Arg Asp Gly Gln
        195                 200                 205
acc atg tcc aac ccc gag cag tcc ttg atg gac cag atc atg aga tct    672
Thr Met Ser Asn Pro Glu Gln Ser Leu Met Asp Gln Ile Met Arg Ser
    210                 215                 220
gcc gct aac cct acc gtt aac ccg gcc tct ctt tcc ccc tcc ctc ccc    720
Ala Ala Asn Pro Thr Val Asn Pro Ala Ser Leu Ser Pro Ser Leu Pro
225                 230                 235                 240
ccc atc tcg gac aag gag ttc cag acc aag gag gag gac gag gaa cag    768
Pro Ile Ser Asp Lys Glu Phe Gln Thr Lys Glu Glu Asp Glu Glu Gln
                245                 250                 255
gcc gac gaa gat gaa gag atg gag cag aca tgg cac gag acc aaa gaa    816
Ala Asp Glu Asp Glu Glu Met Glu Gln Thr Trp His Glu Thr Lys Glu
            260                 265                 270
gcc gcc gcc gcc aag gag aag aac agc aag cag tcc cgc gtc tcc act    864
Ala Ala Ala Ala Lys Glu Lys Asn Ser Lys Gln Ser Arg Val Ser Thr
        275                 280                 285
gat tcg aca caa cgt cct gca gtg tca atc ggt gga gat gcc gct gtc    912
Asp Ser Thr Gln Arg Pro Ala Val Ser Ile Gly Gly Asp Ala Ala Val
    290                 295                 300
cct gtc ttc tca gac gac gcc ggc gca aac tgc ctt ggc ctg gac cct    960
Pro Val Phe Ser Asp Asp Ala Gly Ala Asn Cys Leu Gly Leu Asp Pro
305                 310                 315                 320
gtt cat cag gat gat ggt cct ttc agc atc ggc cat tct ttc ggc ctg   1008
Val His Gln Asp Asp Gly Pro Phe Ser Ile Gly His Ser Phe Gly Leu
                325                 330                 335
tca gcg gcc ctt gat gca gat cgc tat ctc ctc gaa agc caa ctt ctc   1056
Ser Ala Ala Leu Asp Ala Asp Arg Tyr Leu Leu Glu Ser Gln Leu Leu
            340                 345                 350
gct tcg ccc aac gcc tca act gtt gac gac gat tat ctg gct ggt gac   1104
Ala Ser Pro Asn Ala Ser Thr Val Asp Asp Asp Tyr Leu Ala Gly Asp
        355                 360                 365
tct gcc gcc tgc ttc acg aat cct ctc ccc tcc gac tac gac ttc gac   1152
Ser Ala Ala Cys Phe Thr Asn Pro Leu Pro Ser Asp Tyr Asp Phe Asp
    370                 375                 380
atc aac gac ttc ctc aca gac gac gca aac cac gcc gcc tat gac att   1200
Ile Asn Asp Phe Leu Thr Asp Asp Ala Asn His Ala Ala Tyr Asp Ile
385                 390                 395                 400
gtg gca gcg agc aac tat gcc gct gcg gac cgc gag ctc gac ctc gag   1248
Val Ala Ala Ser Asn Tyr Ala Ala Ala Asp Arg Glu Leu Asp Leu Glu
                405                 410                 415
atc cac gac cct gag aat cag atc cct tcg cga cat tct atc cag cag   1296
Ile His Asp Pro Glu Asn Gln Ile Pro Ser Arg His Ser Ile Gln Gln
            420                 425                 430
ccc cag tct ggc gcg tcc tct cat gga tgc gac gat ggc ggc att gcg   1344
Pro Gln Ser Gly Ala Ser Ser His Gly Cys Asp Asp Gly Gly Ile Ala
        435                 440                 445
gtt ggt gtc tga                                                   1356
Val Gly Val
    450
<210>42
<211>451
<212>PRT
<213>里氏木霉
<400>42
Met Ala Phe Gln Gln Ser Ser Pro Leu Val Lys Phe Glu Ala Ser Pro
  1               5                  10                  15
Ala Glu Ser Phe Leu Ser Ala Pro Gly Asp Asn Phe Thr Ser Leu Phe
             20                  25                  30
Ala Asp Ser Thr Pro Ser Thr Leu Asn Pro Arg Asp Met Met Thr Pro
         35                  40                  45
Asp Ser Val Ala Asp Ile Asp Ser Arg Leu Ser Val Ile Pro Glu Ser
     50                  55                  60
Gln Asp Ala Glu Asp Asp Glu Ser His Ser Thr Ser Ala Thr Ala Pro
 65                  70                  75                  80
Ser Thr Ser Glu Lys Lys Pro Val Lys Lys Arg Lys Ser Trp Gly Gln
                 85                  90                  95
Val Leu Pro Glu Pro Lys Thr Asn Leu Pro Pro Arg Lys Arg Ala Lys
            100                 105                 110
Thr Glu Asp Glu Lys Glu Gln Arg Arg Val Glu Arg Val Leu Arg Asn
        115                 120                 125
Arg Arg Ala Ala Gln Ser Ser Arg Glu Arg Lys Arg Leu Glu Val Glu
    130                 135                 140
Ala Leu Glu Lys Arg Asn Lys Glu Leu Glu Thr Leu Leu Ile Asn Val
145                 150                 155                 160
Gln Lys Thr Asn Leu Ile Leu Val Glu Glu Leu Asn Arg Phe Arg Arg
                165                 170                 175
Ser Ser Gly Val Val Thr Arg Ser Ser Ser Pro Leu Asp Ser Leu Gln
            180                 185                 190
Asp Ser Ile Thr Leu Ser Gln Gln Leu Phe Gly Ser Arg Asp Gly Gln
        195                 200                 205
Thr Met Ser Asn Pro Glu Gln Ser Leu Met Asp Gln Ile Met Arg Ser
    210                 215                 220
Ala Ala Asn Pro Thr Val Asn Pro Ala Ser Leu Ser Pro Ser Leu Pro
225                 230                 235                 240
Pro IIe Ser Asp Lys Glu Phe Gln Thr Lys Glu Glu Asp Glu Glu Gln
                245                 250                 255
Ala Asp Glu Asp Glu Glu Met Glu Gln Thr Trp His Glu Thr Lys Glu
            260                 265                 270
Ala Ala Ala Ala Lys Glu Lys Asn Ser Lys Gln Ser Arg Val Ser Thr
        275                 280                 285
Asp Ser Thr Gln Arg Pro Ala Val Ser Ile Gly Gly Asp Ala Ala Val
    290                 295                 300
Pro Val Phe Ser Asp Asp Ala Gly Ala Asn Cys Leu Gly Leu Asp Pro
305                 310                 315                 320
Val His Gln Asp Asp Gly Pro Phe Ser Ile Gly His Ser Phe Gly Leu
                325                 330                 335
Ser Ala Ala Leu Asp Ala Asp Arg Tyr Leu Leu Glu Ser Gln Leu Leu
            340                 345                 350
Ala Ser Pro Asn Ala Ser Thr Val Asp Asp Asp Tyr Leu Ala Gly Asp
        355                 360                 365
Ser Ala Ala Cys Phe Thr Asn Pro Leu Pro Ser Asp Tyr Asp Phe Asp
    370                 375                 380
Ile Asn Asp Phe Leu Thr Asp Asp Ala Asn His Ala Ala Tyr Asp Ile
385                 390                 395                 400
Val Ala Ala Ser Asn Tyr Ala Ala Ala Asp Arg Glu Leu Asp Leu Glu
                405                 410                 415
Ile His Asp Pro Glu Asn Gln Ile Pro Ser Arg His Ser Ile Gln Gln
            420                 425                 430
Pro Gln Ser Gly Ala Ser Ser His Gly Cys Asp Asp Gly Gly Ile Ala
        435                 440                 445
Val Gly Val
    450
<210>43
<211>1053
<212>DNA
<213>构巢曲霉
<220>
<221>CDS
<222>(1)..(1053)
<400>43
atg aaa tca gca gac cgg ttt tcg cca gtg aaa atg gag gac gct ttc     48
Met Lys Ser Ala Asp Arg Phe Ser Pro Val Lys Met Glu Asp Ala Phe
  1               5                  10                  15
gca aac tct ttg cct act acc ccg tca ttg gag gtt cct gtg ctc act     96
Ala Asn Ser Leu Pro Thr Thr Pro Ser Leu Glu Val Pro Val Leu Thr
             20                  25                  30
gtc tcc ccg gct gac aca tct ctt cgg acg aag aat gtg gtg gct cag    144
Val Ser Pro Ala Asp Thr Ser Leu Arg Thr Lys Asn Val Val Ala Gln
         35                  40                  45
aca aag cct gag gag aag aag cca gcg aag aaa aga aag tcc tgg ggc    192
Thr Lys Pro Glu Glu Lys Lys Pro Ala Lys Lys Arg Lys Ser Trp Gly
     50                  55                  60
cag gaa tta cca gtt ccc aag aca aac tta cct cca aga aaa cgc gct    240
Gln Glu Leu Pro Val Pro Lys Thr Asn Leu Pro Pro Arg Lys Arg Ala
 65                  70                  75                  80
aag aca gaa gat gag aaa gag cag cgc cgg att gag cga gtt ctt cgc    288
Lys Thr Glu Asp Glu Lys Glu Gln Arg Arg Ile Glu Arg Val Leu Arg
                 85                  90                  95
aac cgc gca gcc gca caa acc tct cgc gag cgc aag aga ctt gaa atg    336
Asn Arg Ala Ala Ala Gln Thr Ser Arg Glu Arg Lys Arg Leu Glu Met
            100                 105                 110
gag aag tta gaa agc gag aag att gat atg gaa caa caa aac cag ttc    384
Glu Lys Leu Glu Ser Glu Lys Ile Asp Met Glu Gln Gln Asn Gln Phe
        115                 120                 125
ctt ctt cag cgt ctc gcc cag atg gag gct gag aac aac cgt tta agt    432
Leu Leu Gln Arg Leu Ala Gln Met Glu Ala Glu Asn Asn Arg Leu Ser
    130                 135                 140
cag caa gtt gct cag cta tcc gcg gag gtt cgg gga tcc cgc cac agc    480
Gln Gln Val Ala Gln Leu Ser Ala Glu Val Arg Gly Ser Arg His Ser
145                 150                 155                 160
act cca act tcc agt tcc ccc gcg tca gtt tcg cca act ctc aca ccg    528
Thr Pro Thr Ser Ser Ser Pro Ala Ser Val Ser Pro Thr Leu Thr Pro
                 165                 170                 175
act ctt ttt aag cag gaa ggg gat gag gtt cct ctg gac cgc atc cct    576
Thr Leu Phe Lys Gln Glu Gly Asp Glu Val Pro Leu Asp Arg Ile Pro
            180                 185                 190
ttt cca act ccc tcc gtg acc gac tac tcc cca act ctt aag cct tca    624
Phe Pro Thr Pro Ser Val Thr Asp Tyr Ser Pro Thr Leu Lys Pro Ser
        195                 200                 205
tct ctg gct gag tcc ccc gat ttg aca caa cat cct gca gtg tca gtc    672
Ser Leu Ala Glu Ser Pro Asp Leu Thr Gln His Pro Ala Val Ser Val
    210                 215                 220
ggc ggg ctc gaa gga gat gaa agt gcc ctc acg ctt ttc gac ctc gga   720
Gly Gly Leu Glu Gly Asp Glu Ser Ala Leu Thr Leu Phe Asp Leu Gly
225                 230                 235                 240
gcc agc att aag cat gag cct aca cat gac ctt aca gct cct ctt tct   768
Ala Ser Ile Lys His Glu Pro Thr His Asp Leu Thr Ala Pro Leu Ser
                245                 250                 255
gac gat gac ttc cgc cgc cta ttc aac ggt gat tca tcc ctt gag tca   816
Asp Asp Asp Phe Arg Arg Leu Phe Asn Gly Asp Ser Ser Leu Glu Ser
            260                 265                 270
gat tct tca ctc ctt gaa gac ggg ttc gcc ttt gac gtt ctc gac tca   864
Asp Ser Ser Leu Leu Glu Asp Gly Phe Ala Phe Asp Val Leu Asp Ser
        275                 280                 285
gga gat tta tca gca ttt cca ttt gat tct atg gtt gat ttt gac acc   912
Gly Asp Leu Ser Ala Phe Pro Phe Asp Ser Met Val Asp Phe Asp Thr
    290                 295                 300
gag cct gtc acc ctc gaa gat ctc gag caa acc aac ggc ctt tcg gat   960
Glu Pro Val Thr Leu Glu Asp Leu Glu Gln Thr Asn Gly Leu Ser Asp
305                 310                 315                 320
tca gct tct tgc aag gct gct agc ttg caa ccc agc cat ggc gcg tcc  1008
Ser Ala Ser Cys Lys Ala Ala Ser Leu Gln Pro Ser His Gly Ala Ser
                325                 330                 335
act tcg cga tgc gac ggg cag ggc att gca gct ggc agt gcg tga      1053
Thr Ser Arg Cys Asp Gly Gln Gly Ile Ala Ala Gly Ser Ala
            340                 345                 350
<210>44
<211>350
<212>PRT
<213>构巢曲霉
<400>44
Met Lys Ser Ala Asp Arg Phe Ser Pro Val Lys Met Glu Asp Ala Phe
  1               5                  10                  15
Ala Asn Ser Leu Pro Thr Thr Pro Ser Leu Glu Val Pro Val Leu Thr
             20                  25                  30
Val Ser Pro Ala Asp Thr Ser Leu Arg Thr Lys Asn Val Val Ala Gln
         35                  40                  45
Thr Lys Pro Glu Glu Lys Lys Pro Ala Lys Lys Arg Lys Ser Trp Gly
     50                  55                  60
Gln Glu Leu Pro Val Pro Lys Thr Asn Leu Pro Pro Arg Lys Arg Ala
 65                  70                  75                  80
Lys Thr Glu Asp Glu Lys Glu Gln Arg Arg Ile Glu Arg Val Leu Arg
                 85                  90                  95
Asn Arg Ala Ala Ala Gln Thr Ser Arg Glu Arg Lys Arg Leu Glu Met
            100                 105                 110
Glu Lys Leu Glu Ser Glu Lys Ile Asp Met Glu Gln Gln Ash Gln Phe
        115                 120                 125
Leu Leu Gln Arg Leu Ala Gln Met Glu Ala Glu Asn Asn Arg Leu Ser
    130                 135                 140
Gln Gln Val Ala Gln Leu Ser Ala Glu Val Arg Gly Ser Arg His Ser
145                 150                 155                 160
Thr Pro Thr Ser Ser Ser Pro Ala Ser Val Ser Pro Thr Leu Thr Pro
                165                 170                 175
Thr Leu Phe Lys Gln Glu Gly Asp Glu Val Pro Leu Asp Arg Ile Pro
            180                 185                 190
Phe Pro Thr Pro Ser Val Thr Asp Tyr Ser Pro Thr Leu Lys Pro Ser
        195                 200                 205
Ser Leu Ala Glu Ser Pro Asp Leu Thr Gln His Pro Ala Val Ser Val
    210                 215                 220
Gly Gly Leu Glu Gly Asp Glu Ser Ala Leu Thr Leu Phe Asp Leu Gly
225                 230                 235                 240
Ala Ser Ile Lys His Glu Pro Thr His Asp Leu Thr Ala Pro Leu Ser
                245                 250                 255
Asp Asp Asp Phe Arg Arg Leu Phe Asn Gly Asp Ser Ser Leu Glu Ser
            260                 265                 270
Asp Ser Ser Leu Leu Glu Asp Gly Phe Ala Phe Asp Val Leu Asp Ser
        275                 280                 285
Gly Asp Leu Ser Ala Phe Pro Phe Asp Ser Met Val Asp Phe Asp Thr
    290                 295                 300
Glu Pro Val Thr Leu Glu Asp Leu Glu Gln Thr Asn Gly Leu Ser Asp
305                 310                 315                 320
Ser Ala Ser Cys Lys Ala Ala Ser Leu Gln Pro Ser His Gly Ala Ser
                325                 330                 335
Thr Ser Arg Cys Asp Gly Gln Gly Ile Ala Ala Gly Ser Ala
            340                 345                 350
<210>45
<211>5468
<212>DNA
<213>人
<220>
<221>CDS
<222>(285)..(4967)
<400>45
ggtatcgata agcttgatgg agcggacggc agacggggcg ggcggcgtca gggtcgcagc  60
gtctacagct gctcgggggc ggtttcttgg cggaggcttg gccggctcct ctctcccggc 120
tcagcggcgg ctgcgaaggc ggcggctcct gccctctcgc tttccctctc gcgtctctgg 180
ctgcagaaag aagcttccgg ttctgaggtc ctggaggtgc catttccctc tctgttgaag 240
caaaggccgg ggcagacctc ctagtgaaag gaaagcaagc cagg atg gat att tac  296
                                                 Met Asp Ile Tyr
                                                   1
gac act caa acc ttg ggg gtt gtg gtc ttt gga gga ttc atg gtt gtt   344
Asp Thr Gln Thr Leu Gly Val Val Val Phe Gly Gly Phe Met Val Val
  5                  10                  15                  20
tct gcc att ggc atc ttc ctg gtg tcg act ttc tcc atg aag gaa acg   392
Ser Ala Ile Gly Ile Phe Leu Val Ser Thr Phe Ser Met Lys Glu Thr
                 25                  30                  35
tca tat gaa gaa gcc cta gcc aac cag cgc aag gag atg gcg aaa act   440
Ser Tyr Glu Glu Ala Leu Ala Asn Gln Arg Lys Glu Met Ala Lys Thr
             40                  45                  50
cac cac cag aaa gtc gag aag aaa aag aag gag aaa aca gtg gag aag    488
His His Gln Lys Val Glu Lys Lys Lys Lys Glu Lys Thr Val Glu Lys
         55                  60                  65
aaa gga aag acc aag aaa aag gaa gag aaa cct aat ggg aag ata cct    536
Lys Gly Lys Thr Lys Lys Lys Glu Glu Lys Pro Asn Gly Lys Ile Pro
     70                  75                  80
gat cat gat cca gcc ccc aat gtg act gtc ctc ctt cga gaa cca gtg    584
Asp His Asp Pro Ala Pro Asn Val Thr Val Leu Leu Arg Glu Pro Val
 85                  90                  95                 100
cgg gct cct gct gtg gct gtg gct cca acc cca gtg cag ccc ccc att    632
Arg Ala Pro Ala Val Ala Val Ala Pro Thr Pro Val Gln Pro Pro Ile
                105                 110                 115
atc gtt gct cct gtc gcc aca gtt cca gcc atg ccc cag gag aag ctg    680
Ile Val Ala Pro Val Ala Thr Val Pro Ala Met Pro Gln Glu Lys Leu
            120                 125                 130
gcc tcc tcc ccc aag gac aaa aag aag aag gag aaa aaa gtg gca aaa    728
Ala Ser Ser Pro Lys Asp Lys Lys Lys Lys Glu Lys Lys Val Ala Lys
        135                 140                 145
gtg gaa cca gct gtc agc tct gta gtg aat tcc atc cag gtt ctc act    776
Val Glu Pro Ala Val Ser Ser Val Val Asn Ser Ile Gln Val Leu Thr
    150                 155                 160
tcg aag gct gcc atc ttg gaa act gct ccc aag gag gtg ccg atg gtg    824
Ser Lys Ala Ala Ile Leu Glu Thr Ala Pro Lys Glu Val Pro Met Val
165                 170                 175                 180
gtg gtg ccc cca gtg ggt gcc aag ggc aac aca cca gcc act ggc act    872
Val Val Pro Pro Val Gly Ala Lys Gly Asn Thr Pro Ala Thr Gly Thr
                185                 190                 195
act cag ggc aaa aag gcg gag ggg act cag aat caa agc aaa aag gct    920
Thr Gln Gly Lys Lys Ala Glu Gly Thr Gln Asn Gln Ser Lys Lys Ala
            200                 205                 210
gaa gga gcc cca aac cag ggc aga aag gca gag gga acc cca aac cag    968
Glu Gly Ala Pro Asn Gln Gly Arg Lys Ala Glu Gly Thr Pro Asn Gln
        215                 220                 225
ggc aaa aag aca gag gga acc cca aac caa ggg aaa aag gca gag gga   1016
Gly Lys Lys Thr Glu Gly Thr Pro Asn Gln Gly Lys Lys Ala Glu Gly
    230                 235                 240
acc cca aac caa ggc aaa aag gca gaa gga acc cca aac caa ggc aaa   1064
Thr Pro Asn Gln Gly Lys Lys Ala Glu Gly Thr Pro Asn Gln Gly Lys
245                 250                 255                 260
aag gcg gag ggg gcc cag aac cag ggt aaa aag gta gat aca acc cca   1112
Lys Ala Glu Gly Ala Gln Asn Gln Gly Lys Lys Val Asp Thr Thr Pro
                265                 270                 275
aac cag ggg aaa aag gtg gag ggg gcc cca acc cag ggc aga aag gcc    1160
Asn Gln Gly Lys Lys Val Glu Gly Ala Pro Thr Gln Gly Arg Lys Ala
            280                 285                 290
gag ggg gct cag aac cag gcc aaa aag gta gaa ggg gcc cag aac cag    1208
Glu Gly Ala Gln Asn Gln Ala Lys Lys Val Glu Gly Ala Gln Asn Gln
        295                 300                 305
ggc aaa aag gca gag ggg gcc cag aat cag ggc aaa aag gga gag ggg    1256
Gly Lys Lys Ala Glu Gly Ala Gln Asn Gln Gly Lys Lys Gly Glu Gly
    310                 315                 320
gcc cag aac cag ggc aag aag gcc gag ggg gcc cag aat cag ggc aag    1304
Ala Gln Asn Gln Gly Lys Lys Ala Glu Gly Ala Gln Asn Gln Gly Lys
325                 330                 335                 340
aag gcc gag ggg gcc cag aat cag ggc aag aag gcc gag ggg gcc cag    1352
Lys Ala Glu Gly Ala Gln Asn Gln Gly Lys Lys Ala Glu Gly Ala Gln
                345                 350                 355
aat cag ggc aag aag gcc gag ggg gcc cag aat cag ggc aag aag gct    1400
Asn Gln Gly Lys Lys Ala Glu Gly Ala Gln Asn Gln Gly Lys Lys Ala
            360                 365                 370
gag ggg gct cag aac cag ggc aaa aag gcc gag ggg gct cag aac cag    1448
Glu Gly Ala Gln Asn Gln Gly Lys Lys Ala Glu Gly Ala Gln Asn Gln
        375                 380                 385
ggc aaa aaa gta gaa ggg gcc cag aac cag ggc aag aag gct gag ggt    1496
Gly Lys Lys Val Glu Gly Ala Gln Asn Gln Gly Lys Lys Ala Glu Gly
    390                 395                 400
gcc cag aac cag ggc aaa aag gcc gag ggg gcc cag aat cag ggc aaa    1544
Ala Gln Asn Gln Gly Lys Lys Ala Glu Gly Ala Gln Asn Gln Gly Lys
405                 410                 415                 420
aag gcc gag ggg gcc cag aac cag ggc aag aag gca gag ggg gcc cag    1592
Lys Ala Glu Gly Ala Gln Asn Gln Gly Lys Lys Ala Glu Gly Ala Gln
                425                 430                 435
aac cag ggc aag aag gcc gag ggg gcc cag aac cag gac aag aag gcc    1640
Asn Gln Gly Lys Lys Ala Glu Gly Ala Gln Asn Gln Asp Lys Lys Ala
            440                 445                 450
gag ggg gcc cag aac cag ggc agg aag gcc gag ggg gcc cag aac cag    1688
Glu Gly Ala Gln Asn Gln Gly Arg Lys Ala Glu Gly Ala Gln Asn Gln
        455                 460                 465
ggc agg aag gcc gag ggg gcc cag aac cag ggc aag aag gcc gag ggg    1736
Gly Arg Lys Ala Glu Gly Ala Gln Asn Gln Gly Lys Lys Ala Glu Gly
    470                 475                 480
gcc ccg aac cag ggc aag aag gcc gag ggg gcc ccg aac cag ggc aag    1784
Ala Pro Asn Gln Gly Lys Lys Ala Glu Gly Ala Pro Asn Gln Gly Lys
485                 490                 495                 500
aag gcc gag ggg acc ccg aac cag ggc aag aag gcc gag ggg acc ccg    1832
Lys Ala Glu Gly Thr Pro Asn Gln Gly Lys Lys Ala Glu Gly Thr Pro
                505                 510                 515
aac cag ggc aag aag gcc gag ggg acc ccg aac cag ggc aag aag gcc    1880
Asn Gln Gly Lys Lys Ala Glu Gly Thr Pro Asn Gln Gly Lys Lys Ala
            520                 525                 530
gag ggg gcc cag aac cag ggc aag aag gcc gag ggg gcc cag aac cag    1928
Glu Gly Ala Gln Asn Gln Gly Lys Lys Ala Glu Gly Ala Gln Asn Gln
        535                 540                 545
ggc aag aag gcc gag ggg acc ccg aac cag ggc aag aag gcc gag ggg    1976
Gly Lys Lys Ala Glu Gly Thr Pro Asn Gln Gly Lys Lys Ala Glu Gly
    550                 555                 560
gcc cag aac cag ggc aag aag gcc gag ggg gcc cag aac cag ggc aag    2024
Ala Gln Asn Gln Gly Lys Lys Ala Glu Gly Ala Gln Asn Gln Gly Lys
565                 570                 575                 580
aag gcc gag ggg gcc cag aac cag ggc aag aag gcc gag ggg gcc cag    2072
Lys Ala Glu Gly Ala Gln Asn Gln Gly Lys Lys Ala Glu Gly Ala Gln
                585                 590                 595
aac cag ggc aag aag gcc gag ggg gcc cag aac cag ggc aag aag gcc    2120
Asn Gln Gly Lys Lys Ala Glu Gly Ala Gln Asn Gln Gly Lys Lys Ala
            600                 605                 610
gag ggt gct cag aac cag ggc aaa aaa gta gaa ggg gcc cag aac cag    2168
Glu Gly Ala Gln Asn Gln Gly Lys Lys Val Glu Gly Ala Gln Asn Gln
        615                 620                 625
ggc aag aag gct gag ggg gcc cag aac cag ggc aag aag gcc gag ggg    2216
Gly Lys Lys Ala Glu Gly Ala Gln Asn Gln Gly Lys Lys Ala Glu Gly
    630                 635                 640
gct cag aac cag ggc aaa aag gcc gag gga gcc cag aac cag ggc caa    2264
Ala Gln Asn Gln Gly Lys Lys Ala Glu Gly Ala Gln Asn Gln Gly Gln
645                 650                 655                 660
aaa gga gag gga gcc cag aat cag ggt aaa aag aca gaa ggg gct cag    2312
Lys Gly Glu Gly Ala Gln Asn Gln Gly Lys Lys Thr Glu Gly Ala Gln
                665                 670                 675
ggc aaa aag gca gaa agg agt ccc aac caa ggc aaa aaa gga gag gga    2360
Gly Lys Lys Ala Glu Arg Ser Pro Asn Gln Gly Lys Lys Gly Glu Gly
            680                 685                 690
gct ccc atc cag ggc aaa aag gca gat tcg gtt gct aat cag ggc aca    2408
Ala Pro Ile Gln Gly Lys Lys Ala Asp Ser Val Ala Asn Gln Gly Thr
        695                 700                 705
aag gta gag ggt att aca aac cag ggg aaa aaa gca gaa ggg tcc ccc    2456
Lys Val Glu Gly Ile Thr Asn Gln Gly Lys Lys Ala Glu Gly Ser Pro
    710                 715                 720
agt gaa ggc aaa aag gca gaa ggg tcc ccc aac caa ggc aaa aag gca    2504
Ser Glu Gly Lys Lys Ala Glu Gly Ser Pro Asn Gln Gly Lys Lys Ala
725                 730                 735                 740
gac gca gct gcc aat cag ggt aaa aag aca gag tca gct tct gtc cag    2552
Asp Ala Ala Ala Asn Gln Gly Lys Lys Thr Glu Ser Ala Ser Val Gln
                745                 750                 755
ggc aga aat aca gat gtg gcc cag agc cca gag gca cca aag caa gag    2600
Gly Arg Asn Thr Asp Val Ala Gln Ser Pro Glu Ala Pro Lys Gln Glu
            760                 765                 770
gct cct gcc aag aag aag tct ggt tca aag aaa aaa ggt gag cct ggg    2648
Ala Pro Ala Lys Lys Lys Ser Gly Ser Lys Lys Lys Gly Glu Pro Gly
        775                 780                 785
ccc cca gat gcc gac ggc cct ctc tac ctc ccc tac aag acg ctg gtc    2696
Pro Pro Asp Ala Asp Gly Pro Leu Tyr Leu Pro Tyr Lys Thr Leu Val
    790                 795                 800
tcc acg gtt ggg agc atg gtg ttc aac gag ggc gag gcc cag cgg ctc    2744
Ser Thr Val Gly Ser Met Val Phe Asn Glu Gly Glu Ala Gln Arg Leu
805                 810                 815                 820
atc gag atc ctg tct gag aag gct ggc atc att cag gac acc tgg cac    2792
Ile Glu Ile Leu Ser Glu Lys Ala Gly Ile Ile Gln Asp Thr Trp His
                825                 830                 835
aag gcc act cag aag ggt gac cct gtg gcg att ctg aaa cgc cag ctg    2840
Lys Ala Thr Gln Lys Gly Asp Pro Val Ala Ile Leu Lys Arg Gln Leu
            840                 845                 850
gaa gag aag gaa aaa ctg ctg gcc aca gaa cag gaa gat gcg gct gtc    2888
Glu Glu Lys Glu Lys Leu Leu Ala Thr Glu Gln Glu Asp Ala Ala Val
        855                 860                 865
gcc aag agc aaa ctg agg gag ctc aac aag gag atg gca gca gaa aag    2936
Ala Lys Ser Lys Leu Arg Glu Leu Asn Lys Glu Met Ala Ala Glu Lys
    870                 875                 880
gcc aaa gca gca gcc ggg gag gcc aaa gtg aaa aag cag ctg gtg gcc    2984
Ala Lys Ala Ala Ala Gly Glu Ala Lys Val Lys Lys Gln Leu Val Ala
885                 890                 895                 900
cgg gag cag gag atc acg gct gtg cag gca cgc atg cag gcc agc tac    3032
Arg Glu Gln Glu Ile Thr Ala Val Gln Ala Arg Met Gln Ala Ser Tyr
                905                 910                 915
cgg gag cac gtg aag gag gtg cag cag ctg cag ggc aag atc cgg act    3080
Arg Glu His Val Lys Glu Val Gln Gln Leu Gln Gly Lys Ile Arg Thr
            920                 925                 930
ctt cag gag cag ctg gag aat ggc ccc aac acg cag ctg gcc cgc ctg    3128
Leu Gln Glu Gln Leu Glu Asn Gly Pro Asn Thr Gln Leu Ala Arg Leu
        935                 940                 945
cag cag gag aac tcc atc ctg cgg gat gcc ttg aac cag gcc acg agc    3176
Gln Gln Glu Asn Ser Ile Leu Arg Asp Ala Leu Asn Gln Ala Thr Ser
    950                 955                 960
cag gtg gag agc aag cag aac gca gag ctg gcc aag ctt cgg cag gag    3224
Gln Val Glu Ser Lys Gln Asn Ala Glu Leu Ala Lys Leu Arg Gln Glu
965                 970                 975                 980
ctc agc aag gtc agc aaa gag ctg gtg gag aag tca gag gct gtg cgg    3272
Leu Ser Lys Val Ser Lys Glu Leu Val Glu Lys Ser Glu Ala Val Arg
                985                 990                 995
caa gat gag cag cag cgg aaa gct ctg gaa gcc aag gca gct gcc ttc    3320
Gln Asp Glu Gln Gln Arg Lys Ala Leu Glu Ala Lys Ala Ala Ala Phe
           1000                1005                1010
gag aag cag gtc ctg cag ctg cag gcg tcc cac agg gag agt gag gag    3368
Glu Lys Gln Val Leu Gln Leu Gln Ala Ser His Arg Glu Ser Glu Glu
       1015                1020                1025
gcc ctg cag aag cgc ctg gac gag gtc agc cgg gag ctg tgc cac acg    3416
Ala Leu Gln Lys Arg Leu Asp Glu Val Ser Arg Glu Leu Cys His Thr
   1030                1035                1040
cag agc agc cac gcc agc ctc cgg gcg gat gcc gag aag gcc cag gag    3464
Gln Ser Ser His Ala Ser Leu Arg Ala Asp Ala Glu Lys Ala Gln Glu
1045               1050                1055                1060
caa cag cag cag atg gcc gag ctg cac agc aag tta cag tcc tcc gag    3512
Gln Gln Gln Gln Met Ala Glu Leu His Ser Lys Leu Gln Ser Ser Glu
               1065                1070                1075
gcg gag gtg cgc agc aaa tgc gag gag ctg agt ggc ctc cac ggg cag    3560
Ala Glu Val Arg Ser Lys Cys Glu Glu Leu Ser Gly Leu His Gly Gln
           1080                1085                1090
ctc cag gag gcc agg gcg gag aac tcc cag ctc aca gag aga atc cgt    3608
Leu Gln Glu Ala Arg Ala Glu Asn Ser Gln Leu Thr Glu Arg Ile Arg
       1095                1100                1105
tcc att gag gcc ctg ctg gag gcg ggc cag gcg cgg gat gcc cag gac    3656
Ser Ile Glu Ala Leu Leu Glu Ala Gly Gln Ala Arg Asp Ala Gln Asp
   1110                1115                1120
gtc cag gcc agc cag gcg gag gct gac cag cag cag act cgc ctc aag    3704
Val Gln Ala Ser Gln Ala Glu Ala Asp Gln Gln Gln Thr Arg Leu Lys
1125               1130                1135                1140
gag ctg gag tcc cag gtg tcg ggt ctg gag aag gag gcc atc gag ctc    3752
Glu Leu Glu Ser Gln Val Ser Gly Leu Glu Lys Glu Ala Ile Glu Leu
               1145                1150                1155
agg gag gcc gtc gag cag cag aaa gtg aag aac aat gac ctc cgg gag    3800
Arg Glu Ala Val Glu Gln Gln Lys Val Lys Asn Asn Asp Leu Arg Glu
           1160                1165                1170
aag aac tgg aag gcc atg gag gca ctg gcc acg gcc gag cag gcc tgc    3848
Lys Asn Trp Lys Ala Met Glu Ala Leu Ala Thr Ala Glu Gln Ala Cys
       1175                1180                1185
aag gag aag ctg cac tcc ctg acc cag gcc aag gag gaa tcg gag aag    3896
Lys Glu Lys Leu His Ser Leu Thr Gln Ala Lys Glu Glu Ser Glu Lys
   1190                1195                1200
cag ctc tgt ctg att gag gcg cag acc atg gag gcc ctg ctg gct ctg    3944
Gln Leu Cys Leu Ile Glu Ala Gln Thr Met Glu Ala Leu Leu Ala Leu
1205               1210                1215                1220
ctc cca gaa ctc tct gtc ttg gca caa cag aat tac acc gag tgg ctg    3992
Leu Pro Glu Leu Ser Val Leu Ala Gln Gln Asn Tyr Thr Glu Trp Leu
               1225                1230                1235
cag gat ctc aaa gag aaa ggc ccc acg ctg ctg aag cac ccg cca gct    4040
Gln Asp Leu Lys Glu Lys Gly Pro Thr Leu Leu Lys His Pro Pro Ala
           1240                1245                1250
ccc gcg gag ccc tcc tcg gac ctg gcc tcc aag ttg agg gag gcc gag    4088
Pro Ala Glu Pro Ser Ser Asp Leu Ala Ser Lys Leu Arg Glu Ala Glu
       1255                1260                1265
gag acg cag agc aca ctg cag gcc gag tgt gac cag tac cgc agc atc    4136
Glu Thr Gln Ser Thr Leu Gln Ala Glu Cys Asp Gln Tyr Arg Ser Ile
   1270                1275                1280
ctg gcg gag acg gag ggc atg ctc aga gac ctg cag aag agc gtg gag    4184
Leu Ala Glu Thr Glu Gly Met Leu Arg Asp Leu Gln Lys Ser Val Glu
1285               1290                1295                1300
gag gag gag cag gtg tgg agg gcc aag gtg ggc gcc gca gag gag gag    4232
Glu Glu Glu Gln Val Trp Arg Ala Lys Val Gly Ala Ala Glu Glu Glu
               1305                1310                1315
ctc cag aag tcc cgg gtc aca gtg aag cat ctc gaa gag att gta gag    4280
Leu Gln Lys Ser Arg Val Thr Val Lys His Leu Glu Glu Ile Val Glu
           1320                1325                1330
aag cta aaa gga gaa ctt gaa agt tcg gac cag gtg agg gag cac acg    4328
Lys Leu Lys Gly Glu Leu Glu Ser Ser Asp Gln Val Arg Glu His Thr
       1335                1340                1345
ttg cat ttg gag gca gag ctg gaa aag cac atg gcg gcc gcc agc gcc    4376
Leu His Leu Glu Ala Glu Leu Glu Lys His Met Ala Ala Ala Ser Ala
   1350                1355                1360
gag tgc cag aac tac gcc aag gag gtg gca ggg ctg agg caa ctt ctc    4424
Glu Cys Gln Asn Tyr Ala Lys Glu Val Ala Gly Leu Arg Gln Leu Leu
1365                1370               1375                1380
cta gaa tct caa tct cag ctc gat gcc gcc aag agc gaa gcc cag aaa    4472
Leu Glu Ser Gln Ser Gln Leu Asp Ala Ala Lys Ser Glu Ala Gln Lys
               1385                1390                1395
cag agc gat gag ctt gcc ctg gtc agg cag cag ttg agt gaa atg aag    4520
Gln Ser Asp Glu Leu Ala Leu Val Arg Gln Gln Leu Ser Glu Met Lys
           1400                1405                1410
agc cac gta gag gat ggt gac ata gct ggg gcc cca gct tcc tcc cca    4568
Ser His Val Glu Asp Gly Asp Ile Ala Gly Ala Pro Ala Ser Ser Pro
       1415                1420                1425
gag gcg ccc cca gcc gag cag gac ccc gtt cag ctg aag acg cag ctg    4616
Glu Ala Pro Pro Ala Glu Gln Asp Pro Val Gln Leu Lys Thr Gln Leu
   1430                 1435                1440
gag tgg aca gaa gcc atc ctg gag gat gag cag aca cag cgg cag aag   4664
Glu Trp Thr Glu Ala Ile Leu Glu Asp Glu Gln Thr Gln Arg Gln Lys
1445               1450                1455                1460
ctc acg gcc gag ttt gag gag gct cag acc tcg gca tgt cgg tta caa   4712
Leu Thr Ala Glu Phe Glu Glu Ala Gln Thr Ser Ala Cys Arg Leu Gln
               1465                1470                1475
gaa gaa ttg gag aag ctc cgc aca gcc ggc ccc cta gag tct tca gaa   4760
Glu Glu Leu Glu Lys Leu Arg Thr Ala Gly Pro Leu Glu Ser Ser Glu
           1480                1485                1490
aca gag gag gcc tca cag ctg aag gag aga cta gaa aaa gag aag aag   4808
Thr Glu Glu Ala Ser Gln Leu Lys Glu Arg Leu Glu Lys Glu Lys Lys
       1495                1500                1505
tta aca agt gac ctg ggg cgc gcc gcc acg aga ctg cag gag ctt ctg   4856
Leu Thr Ser Asp Leu Gly Arg Ala Ala Thr Arg Leu Gln Glu Leu Leu
   1510                1515                1520
aag acg acc cag gag cag ctg gca agg gag aag gac acg gtg aag aag   4904
Lys Thr Thr Gln Glu Gln Leu Ala Arg Glu Lys Asp Thr Val Lys Lys
1525               1530                1535                1540
ctg cag gaa cag ctg gaa aag gca gag gac ggc agc agc tca aag gag   4952
Leu Gln Glu Gln Leu Glu Lys Ala Glu Asp Gly Ser Ser Ser Lys Glu
               1545                1550                1555
ggc acc tct gtc tga gtttcctctt tggaaaaaga agttactgtt caacttacca   5007
Gly Thr Ser Val
           1560
aaatgcctta cacattcctt acaaataaac caaccaacct acacagcgtt atccaggccc 5067
aacttccggt actccgagag aagccatgag agacaagtct cttagagcca cagaagtaga 5127
ccttccagag ccccagtttg taaatgaacc tgtgtcacat ttgataaaca ctatcctggg 5187
cgcagccccg ggccaccgcc gagtgacgcc aaagccctgg ttgactctga cagccccgtg 5247
ggtgtgtggg aggccgggcg ctctggggtc tgtctgtcag tgcaatcgtt tagtgttttt 5307
tcagtggggc ggggcgggaa gcgggtggga ccgggcagcc agttctcaaa ggctgtgggg 5367
ccgactggag gccacagccc ctcaccccta gacgttgcca accagaactg acgtgtgacc 5427
tcctgggtgt tgatgccatt aaaaccaacg ttggtgcccg g                     5468
<210>46
<211>1560
<212>PRT
<213>人
<400>46
Met Asp Ile Tyr Asp Thr Gln Thr Leu Gly Val Val Val Phe Gly Gly
  1               5                  10                  15
Phe Met Val Val Ser Ala Ile Gly Ile Phe Leu Val Ser Thr Phe Ser
             20                  25                  30
Met Lys Glu Thr Ser Tyr Glu Glu Ala Leu Ala Asn Gln Arg Lys Glu
         35                  40                  45
Met Ala Lys Thr His His Gln Lys Val Glu Lys Lys Lys Lys Glu Lys
     50                  55                  60
Thr Val Glu Lys Lys Gly Lys Thr Lys Lys Lys Glu Glu Lys Pro Asn
 65                  70                  75                  80
Gly Lys Ile Pro Asp His Asp Pro Ala Pro Asn Val Thr Val Leu Leu
                 85                  90                  95
Arg Glu Pro Val Arg Ala Pro Ala Val Ala Val Ala Pro Thr Pro Val
            100                 105                 110
Gln Pro Pro Ile Ile Val Ala Pro Val Ala Thr Val Pro Ala Met Pro
        115                 120                 125
Gln Glu Lys Leu Ala Ser Ser Pro Lys Asp Lys Lys Lys Lys Glu Lys
    130                 135                 140
Lys Val Ala Lys Val Glu Pro Ala Val Ser Ser Val Val Asn Ser Ile
145                 150                 155                 160
Gln Val Leu Thr Ser Lys Ala Ala Ile Leu Glu Thr Ala Pro Lys Glu
                165                 170                 175
Val Pro Met Val Val Val Pro Pro Val Gly Ala Lys Gly Asn Thr Pro
            180                 185                 190
Ala Thr Gly Thr Thr Gln Gly Lys Lys Ala Glu Gly Thr Gln Asn Gln
        195                 200                 205
Ser Lys Lys Ala Glu Gly Ala Pro Asn Gln Gly Arg Lys Ala Glu Gly
    210                 215                 220
Thr Pro Asn Gln Gly Lys Lys Thr Glu Gly Thr Pro Asn Gln Gly Lys
225                 230                 235                 240
Lys Ala Glu Gly Thr Pro Asn Gln Gly Lys Lys Ala Glu Gly Thr Pro
                245                 250                 255
Asn Gln Gly Lys Lys Ala Glu Gly Ala Gln Asn Gln Gly Lys Lys Val
            260                 265                 270
Asp Thr Thr Pro Asn Gln Gly Lys Lys Val Glu Gly Ala Pro Thr Gln
        275                 280                 285
Gly Arg Lys Ala Glu Gly Ala Gln Asn Gln Ala Lys Lys Val Glu Gly
    290                 295                 300
Ala Gln Asn Gln Gly Lys Lys Ala Glu Gly Ala Gln Asn Gln Gly Lys
305                 310                 315                 320
Lys Gly Glu Gly Ala Gln Asn Gln Gly Lys Lys Ala Glu Gly Ala Gln
                325                 330                 335
Asn Gln Gly Lys Lys Ala Glu Gly Ala Gln Asn Gln Gly Lys Lys Ala
            340                 345                 350
Glu Gly Ala Gln Asn Gln Gly Lys Lys Ala Glu Gly Ala Gln Asn Gln
        355                 360                 365
Gly Lys Lys Ala Glu Gly Ala Gln Asn Gln Gly Lys Lys Ala Glu Gly
    370                 375                 380
Ala Gln Asn Gln Gly Lys Lys Val Glu Gly Ala Gln Asn Gln Gly Lys
385                 390                 395                 400
Lys Ala Glu Gly Ala Gln Asn Gln Gly Lys Lys Ala Glu Gly Ala Gln
                405                 410                 415
Asn Gln Gly Lys Lys Ala Glu Gly Ala Gln Asn Gln Gly Lys Lys Ala
            420                 425                 430
Glu Gly Ala Gln Asn Gln Gly Lys Lys Ala Glu Gly Ala Gln Asn Gln
        435                 440                 445
Asp Lys Lys Ala Glu Gly Ala Gln Asn Gln Gly Arg Lys Ala Glu Gly
    450                 455                 460
Ala Gln Asn Gln Gly Arg Lys Ala Glu Gly Ala Gln Asn Gln Gly Lys
465                 470                 475                 480
Lys Ala Glu Gly Ala Pro Asn Gln Gly Lys Lys Ala Glu Gly Ala Pro
                485                 490                 495
Asn Gln Gly Lys Lys Ala Glu Gly Thr Pro Asn Gln Gly Lys Lys Ala
            500                 505                 510
Glu Gly Thr Pro Asn Gln Gly Lys Lys Ala Glu Gly Thr Pro Asn Gln
        515                 520                 525
Gly Lys Lys Ala Glu Gly Ala Gln Asn Gln Gly Lys Lys Ala Glu Gly
    530                 535                 540
Ala Gln Asn Gln Gly Lys Lys Ala Glu Gly Thr Pro Asn Gln Gly Lys
545                 550                 555                 560
Lys Ala Glu Gly Ala Gln Asn Gln Gly Lys Lys Ala Glu Gly Ala Gln
                565                 570                 575
Asn Gln Gly Lys Lys Ala Glu Gly Ala Gln Asn Gln Gly Lys Lys Ala
            580                 585                 590
Glu Gly Ala Gln Asn Gln Gly Lys Lys Ala Glu Gly Ala Gln Asn Gln
        595                 600                 605
Gly Lys Lys Ala Glu Gly Ala Gln Asn Gln Gly Lys Lys Val Glu Gly
    610                 615                 620
Ala Gln Asn Gln Gly Lys Lys Ala Glu Gly Ala Gln Asn Gln Gly Lys
625                 630                 635                 640
Lys Ala Glu Gly Ala Gln Asn Gln Gly Lys Lys Ala Glu Gly Ala Gln
                645                 650                 655
Asn Gln Gly Gln Lys Gly Glu Gly Ala Gln Asn Gln Gly Lys Lys Thr
            660                 665                 670
Glu Gly Ala Gln Gly Lys Lys Ala Glu Arg Ser Pro Asn Gln Gly Lys
        675                 680                 685
Lys Gly Glu Gly Ala Pro Ile Gln Gly Lys Lys Ala Asp Ser Val Ala
    690                 695                 700
Asn Gln Gly Thr Lys Val Glu Gly Ile Thr Asn Gln Gly Lys Lys Ala
705                 710                 715                 720
Glu Gly Ser Pro Ser Glu Gly Lys Lys Ala Glu Gly Ser Pro Asn Gln
                725                 730                 735
Gly Lys Lys Ala Asp Ala Ala Ala Asn Gln Gly Lys Lys Thr Glu Ser
            740                 745                 750
Ala Ser Val Gln Gly Arg Asn Thr Asp Val Ala Gln Ser Pro Glu Ala
        755                 760                 765
Pro Lys Gln Glu Ala Pro Ala Lys Lys Lys Ser Gly Ser Lys Lys Lys
    770                 775                 780
Gly Glu Pro Gly Pro Pro Asp Ala Asp Gly Pro Leu Tyr Leu Pro Tyr
785                 790                 795                 800
Lys Thr Leu Val Ser Thr Val Gly Ser Met Val Phe Asn Glu Gly Glu
                805                 810                 815
Ala Gln Arg Leu Ile Glu Ile Leu Ser Glu Lys Ala Gly Ile Ile Gln
            820                 825                 830
Asp Thr Trp His Lys Ala Thr Gln Lys Gly Asp Pro Val Ala Ile Leu
        835                 840                 845
Lys Arg Gln Leu Glu Glu Lys Glu Lys Leu Leu Ala Thr Glu Gln Glu
    850                 855                 860
Asp Ala Ala Val Ala Lys Ser Lys Leu Arg Glu Leu Asn Lys Glu Met
865                 870                 875                 880
Ala Ala Glu Lys Ala Lys Ala Ala Ala Gly Glu Ala Lys Val Lys Lys
                885                 890                 895
Gln Leu Val Ala Arg Glu Gln Glu Ile Thr Ala Val Gln Ala Arg Met
            900                 905                 910
Gln Ala Ser Tyr Arg Glu His Val Lys Glu Val Gln Gln Leu Gln Gly
        915                 920                 925
Lys Ile Arg Thr Leu Gln Glu Gln Leu Glu Asn Gly Pro Asn Thr Gln
    930                 935                 940
Leu Ala Arg Leu Gln Gln Glu Asn Ser Ile Leu Arg Asp Ala Leu Asn
945                 950                 955                 960
Gln Ala Thr Ser Gln Val Glu Ser Lys Gln Asn Ala Glu Leu Ala Lys
                965                 970                 975
Leu Arg Gln Glu Leu Ser Lys Val Ser Lys Glu Leu Val Glu Lys Ser
            980                 985                 990
Glu Ala Val Arg Gln Asp Glu Gln Gln Arg Lys Ala Leu Glu Ala Lys
        995                1000                1005
Ala Ala Ala Phe Glu Lys Gln Val Leu Gln Leu Gln Ala Ser His Arg
   1010                1015                1020
Glu Ser Glu Glu Ala Leu Gln Lys Arg Leu Asp Glu Val Ser Arg Glu
1025               1030                1035                1040
Leu Cys His Thr Gln Ser Ser His Ala Ser Leu Arg Ala Asp Ala Glu
               1045                1050                1055
Lys Ala Gln Glu Gln Gln Gln Gln Met Ala Glu Leu His Ser Lys Leu
           1060                1065                1070
Gln Ser Ser Glu Ala Glu Val Arg Ser Lys Cys Glu Glu Leu Ser Gly
       1075                1080                1085
Leu His Gly Gln Leu Gln Glu Ala Arg Ala Glu Asn Ser Gln Leu Thr
   1090                1095                1100
Glu Arg Ile Arg Ser Ile Glu Ala Leu Leu Glu Ala Gly Gln Ala Arg
1105               1110                1115                1120
Asp Ala Gln Asp Val Gln Ala Ser Gln Ala Glu Ala Asp Gln Gln Gln
               1125                1130                1135
Thr Arg Leu Lys Glu Leu Glu Ser Gln Val Ser Gly Leu Glu Lys Glu
           1140                1145                1150
Ala Ile Glu Leu Arg Glu Ala Val Glu Gln Gln Lys Val Lys Asn Asn
       1155                1160                1165
Asp Leu Arg Glu Lys Asn Trp Lys Ala Met Glu Ala Leu Ala Thr Ala
   1170                1175                1180
Glu Gln Ala Cys Lys Glu Lys Leu His Ser Leu Thr Gln Ala Lys Glu
1185               1190                1195                1200
Glu Ser Glu Lys Gln Leu Cys Leu Ile Glu Ala Gln Thr Met Glu Ala
               1205                1210                1215
Leu Leu Ala Leu Leu Pro Glu Leu Ser Val Leu Ala Gln Gln Asn Tyr
           1220                1225                1230
Thr Glu Trp Leu Gln Asp Leu Lys Glu Lys Gly Pro Thr Leu Leu Lys
       1235                1240                1245
His Pro Pro Ala Pro Ala Glu Pro Ser Ser Asp Leu Ala Ser Lys Leu
   1250                1255                1260
Arg Glu Ala Glu Glu Thr Gln Ser Thr Leu Gln Ala Glu Cys Asp Gln
1265               1270                1275                1280
Tyr Arg Ser Ile Leu Ala Glu Thr Glu Gly Met Leu Arg Asp Leu Gln
               1285                1290                1295
Lys Ser Val Glu Glu Glu Glu Gln Val Trp Arg Ala Lys Val Gly Ala
           1300                1305                1310
Ala Glu Glu Glu Leu Gln Lys Ser Arg Val Thr Val Lys His Leu Glu
       1315                1320                1325
Glu Ile Val Glu Lys Leu Lys Gly Glu Leu Glu Ser Ser Asp Gln Val
   1330                1335                1340
Arg Glu His Thr Leu His Leu Glu Ala Glu Leu Glu Lys His Met Ala
1345               1350                1355                1360
Ala Ala Ser Ala Glu Cys Gln Asn Tyr Ala Lys Glu Val Ala Gly Leu
               1365                1370                1375
Arg Gln Leu Leu Leu Glu Ser Gln Ser Gln Leu Asp Ala Ala Lys Ser
           1380                1385                1390
Glu Ala Gln Lys Gln Ser Asp Glu Leu Ala Leu Val Arg Gln Gln Leu
       1395                1400                1405
Ser Glu Met Lys Ser His Val Glu Asp Gly Asp Ile Ala Gly Ala Pro
   1410                1415                1420
Ala Ser Ser Pro Glu Ala Pro Pro Ala Glu Gln Asp Pro Val Gln Leu
1425               1430                1435                1440
Lys Thr Gln Leu Glu Trp Thr Glu Ala Ile Leu Glu Asp Glu Gln Thr
               1445                1450                1455
Gln Arg Gln Lys Leu Thr Ala Glu Phe Glu Glu Ala Gln Thr Ser Ala
           1460                1465                1470
Cys Arg Leu Gln Glu Glu Leu Glu Lys Leu Arg Thr Ala Gly Pro Leu
       1475                1480                1485
Glu Ser Ser Glu Thr Glu Glu Ala Ser Gln Leu Lys Glu Arg Leu Glu
   1490                1495                1500
Lys Glu Lys Lys Leu Thr Ser Asp Leu Gly Arg Ala Ala Thr Arg Leu
1505               1510                1515                1520
Gln Glu Leu Leu Lys Thr Thr Gln Glu Gln Leu Ala Arg Glu Lys Asp
               1525                1530                1535
Thr Val Lys Lys Leu Gln Glu Gln Leu Glu Lys Ala Glu Asp Gly Ser
           1540                1545                1550
Ser Ser Lys Glu Gly Thr Ser Val
       1555                1560
<210>47
<211>5425
<212>DNA
<213>家犬
<220>
<221>CDS
<222>(244)..(4848)
<400>47
gaggcagaaa gtgccacgac tccacacgcg cgcacgcagc cagcgagcgg ccggagcgga  60
cggcggacgg ggcggacggc ggtggggtcg cggcgcctgc agctgctcgg ggcggcttct 120
cggcggaggc tcggccggct cctctctccc ggctccgcgg cggcggcggc ggcggcggcg 180
gctcctgccc tttcgctctc cctcccgcgt ctccggctgc aggtaaaggg aaagcaagcc 240
agg atg gat att tac gac act cag acc ttg ggg gtt atg gta ttc ggt   288
    Met Asp Ile Tyr Asp Thr Gln Thr Leu Gly Val Met Val Phe Gly
      1               5                  10                  15
gga ttc atg gtc gtt tct gcc atc ggc atc ttc ctg gtg tca acc ttt   336
Gly Phe Met Val Val Ser Ala Ile Gly Ile Phe Leu Val Ser Thr Phe
                 20                  25                  30
tcc atg aag gag acg tca tat gaa gaa gcc cta gcc aac cag cgc aag   384
Ser Met Lys Glu Thr Ser Tyr Glu Glu Ala Leu Ala Asn Gln Arg Lys
             35                  40                  45
gag atg gca aaa act cac cac cag aaa gta gag aag aaa aag aag gag   432
Glu Met Ala Lys Thr His His Gln Lys Val Glu Lys Lys Lys Lys Glu
         50                  55                  60
aaa aca gtg gag aag aaa gga aaa acc aag aaa aag gaa gag aaa cct   480
Lys Thr Val Glu Lys Lys Gly Lys Thr Lys Lys Lys Glu Glu Lys Pro
     65                  70                  75
aac ggg aag ata cct gac cat gag cca gcc ccc aat gtg acc atc ctt    528
Asn Gly Lys Ile Pro Asp His Glu Pro Ala Pro Asn Val Thr Ile Leu
 80                  85                  90                  95
ctc aaa gac cca gtg agg gca ccc gca gtg ccc gtg gct cca act ccg    576
Leu Lys Asp Pro Val Arg Ala Pro Ala Val Pro Val Ala Pro Thr Pro
                100                 105                 110
gtc cag cct cct gtg gtc att gcc cct gta gcc aca gta cca gcc atg    624
Val Gln Pro Pro Val Val Ile Ala Pro Val Ala Thr Val Pro Ala Met
            115                 120                 125
ccc caa gag aag ttg gcc cct tct cct aag gac aaa aag aaa aag gag    672
Pro Gln Glu Lys Leu Ala Pro Ser Pro Lys Asp Lys Lys Lys Lys Glu
        130                 135                 140
aaa aaa gtg gca aag gtg gaa cca gca gtc agt tct gta gtg aat tcc    720
Lys Lys Val Ala Lys Val Glu Pro Ala Val Ser Ser Val Val Asn Ser
    145                 150                 155
gtc caa gtt ctt gcc tcc aag gct gcc atc tta gaa act gct ccc aag    768
Val Gln Val Leu Ala Ser Lys Ala Ala Ile Leu Glu Thr Ala Pro Lys
160                 165                 170                 175
gag gtg cct atg gtg gtt gtg ccc cca gtg ggt gcc aag gcc ggt acc    816
Glu Val Pro Met Val Val Val Pro Pro Val Gly Ala Lys Ala Gly Thr
                180                 185                 190
cca gcc acc agc act gca cag ggc aaa aag gca gag gga gcc cag aac    864
Pro Ala Thr Ser Thr Ala Gln Gly Lys Lys Ala Glu Gly Ala Gln Asn
            195                 200                 205
cag agc aga aag gca gag gga gcc ccc aac cag ggc aaa aag gca gag    912
Gln Ser Arg Lys Ala Glu Gly Ala Pro Asn Gln Gly Lys Lys Ala Glu
        210                 215                 220
ggg gcc ctc aac caa ggc aaa aag gca gag ggg gcc cag aat cag ggc    960
Gly Ala Leu Asn Gln Gly Lys Lys Ala Glu Gly Ala Gln Asn Gln Gly
    225                 230                 235
aaa aag gta gaa gtg gcc cca aac caa ggc aaa aag gca gag ggg ggc   1008
Lys Lys Val Glu Val Ala Pro Asn Gln Gly Lys Lys Ala Glu Gly Gly
240                 245                 250                 255
cag aat cag ggc aaa aag gta gaa ggg gcc cag aat cag ggc aaa aag   1056
Gln Asn Gln Gly Lys Lys Val Glu Gly Ala Gln Asn Gln Gly Lys Lys
                260                 265                 270
gca gaa gga acc cca aac cag ggc aaa aag gca gaa ggg gcc ccc aac   1104
Ala Glu Gly Thr Pro Asn Gln Gly Lys Lys Ala Glu Gly Ala Pro Asn
            275                 280                 285
caa ggc aaa aag aca gat ggg gct ccc aac cag ggc aaa aag tca gaa   1152
Gln Gly Lys Lys Thr Asp Gly Ala Pro Asn Gln Gly Lys Lys Ser Glu
        290                 295                 300
gga gct cca aac cag ggc aaa aag gca gag ggg gcc cag aat cag ggc    1200
Gly Ala Pro Asn Gln Gly Lys Lys Ala Glu Gly Ala Gln Asn Gln Gly
    305                 310                 315
aaa aag gta gaa gtg gcc cca aac caa ggc aaa aag gca gag ggg ggc    1248
Lys Lys Val Glu Val Ala Pro Asn Gln Gly Lys Lys Ala Glu Gly Gly
320                 325                 330                 335
cag aat cag ggc aaa aag gta gaa ggg gcc cag aat cag ggc aaa aag    1296
Gln Asn Gln Gly Lys Lys Val Glu Gly Ala Gln Asn Gln Gly Lys Lys
                340                 345                 350
gca gaa gga acc cca aac cag ggc aaa aag gca gaa ggg gcc ccc aac    1344
Ala Glu Gly Thr Pro Asn Gln Gly Lys Lys Ala Glu Gly Ala Pro Asn
            355                 360                 365
caa ggc aaa aag aca gat ggg gct ccc aac cag ggc aaa aag tca gaa    1392
Gln Gly Lys Lys Thr Asp Gly Ala Pro Asn Gln Gly Lys Lys Ser Glu
        370                 375                 380
gga gct cca aac cag ggc aaa aaa gta gag ggg gcc cag aat caa ggc    1440
Gly Ala Pro Asn Gln Gly Lys Lys Val Glu Gly Ala Gln Asn Gln Gly
    385                 390                 395
aaa aag gta gag ggg gtg cag aat cag ggc aaa aaa gcc gaa gga gca    1488
Lys Lys Val Glu Gly Val Gln Asn Gln Gly Lys Lys Ala Glu Gly Ala
400                 405                 410                 415
cag aat cag ggc aaa aag gca gaa ggg acc tcc agc cag ggt aga aaa    1536
Gln Asn Gln Gly Lys Lys Ala Glu Gly Thr Ser Ser Gln Gly Arg Lys
                420                 425                 430
gag gag ggg acc cca aac ctg ggc aaa aag gca gag ggg agc ccc aat    1584
Glu Glu Gly Thr Pro Asn Leu Gly Lys Lys Ala Glu Gly Ser Pro Asn
            435                 440                 445
cag ggc aaa aag gtg gaa gtg gtt cag aac cag agc aaa aag gta gag    1632
Gln Gly Lys Lys Val Glu Val Val Gln Asn Gln Ser Lys Lys Val Glu
        450                 455                 460
gga gcc ccc aac cag ggc aaa aaa gca gag ggg tct cag aac cag ggc    1680
Gly Ala Pro Asn Gln Gly Lys Lys Ala Glu Gly Ser Gln Asn Gln Gly
    465                 470                 475
aaa aag aca gaa ggg gcc tcc aac caa ggc aaa aag gtg gat ggg gct    1728
Lys Lys Thr Glu Gly Ala Ser Asn Gln Gly Lys Lys Val Asp Gly Ala
480                 485                 490                 495
cag aac cag ggc aaa aag gca gag gga gcc ccc aac cag ggt aaa aag    1776
Gln Asn Gln Gly Lys Lys Ala Glu Gly Ala Pro Asn Gln Gly Lys Lys
                500                 505                 510
gta gag ggg gct cag aac cag ggc aaa aag gca gag ggg acc ccc aac    1824
Val Glu Gly Ala Gln Asn Gln Gly Lys Lys Ala Glu Gly Thr Pro Asn
            515                 520                 525
cag ggt aaa aag gca gag ggg gct cag aac cag ggc aaa aag gca gag    1872
Gln Gly Lys Lys Ala Glu Gly Ala Gln Asn Gln Gly Lys Lys Ala Glu
        530                 535                 540
ggg gct ccc aac cag ggc aaa aag gca gag ggg gct ccc aac cag ggc    1920
Gly Ala Pro Asn Gln Gly Lys Lys Ala Glu Gly Ala Pro Asn Gln Gly
    545                 550                 555
aaa aag gca gag ggg gct ccc aac cag ggc aaa aag gca gag ggg gct    1968
Lys Lys Ala Glu Gly Ala Pro Asn Gln Gly Lys Lys Ala Glu Gly Ala
560                 565                 570                 575
ccc aac cag ggc aaa aag gca gag gcg gct ccc aac cag ggc aaa aag    2016
Pro Asn Gln Gly Lys Lys Ala Glu Ala Ala Pro Asn Gln Gly Lys Lys
                580                 585                 590
gca gag ggg gct ccc aac cag ggc aaa aag gca gag ggg gct ccc aac    2064
Ala Glu Gly Ala Pro Asn Gln Gly Lys Lys Ala Glu Gly Ala Pro Asn
            595                 600                 605
cag ggc aaa aag gca gag gcg gct ccc aac cag ggc aaa aag gca gag    2112
Gln Gly Lys Lys Ala Glu Ala Ala Pro Asn Gln Gly Lys Lys Ala Glu
        610                 615                 620
ggg gct ccc aac cag ggc aaa aag gca gag ggg gct ccc aac cag ggc    2160
Gly Ala Pro Asn Gln Gly Lys Lys Ala Glu Gly Ala Pro Asn Gln Gly
    625                 630                 635
aaa aag gca gag ggg gct ccc aac cag ggc aaa aag gca gag ggg gcc    2208
Lys Lys Ala Glu Gly Ala Pro Asn Gln Gly Lys Lys Ala Glu Gly Ala
640                 645                 650                 655
cag aat cag ggc aaa aag gca gag ggg gct ccc aac cag ggt aaa aag    2256
Gln Asn Gln Gly Lys Lys Ala Glu Gly Ala Pro Asn Gln Gly Lys Lys
                660                 665                 670
gca gat ttg gtt gct aat caa ggc aca aag gca gag ggt gtt gca ggc    2304
Ala Asp Leu Val Ala Asn Gln Gly Thr Lys Ala Glu Gly Val Ala Gly
            675                 680                 685
cag ggg aaa aaa gca gag ggg gcc ccc aat caa ggc aaa aag gga gaa    2352
Gln Gly Lys Lys Ala Glu Gly Ala Pro Asn Gln Gly Lys Lys Gly Glu
        690                 695                 700
gga acc cca aac cag ggc aaa aag tca gaa gga tct ccc aac cag ggc    2400
Gly Thr Pro Asn Gln Gly Lys Lys Ser Glu Gly Ser Pro Asn Gln Gly
    705                 710                 715
aaa aag gtg gat gcg tct gcc aat cag agt aaa agg gca gag tca gct    2448
Lys Lys Val Asp Ala Ser Ala Asn Gln Ser Lys Arg Ala Glu Ser Ala
720                 725                 730                 735
cct atc caa ggc aaa aat gca gat atg gtc cag agc caa gag gca cca    2496
Pro Ile Gln Gly Lys Asn Ala Asp Met Val Gln Ser Gln Glu Ala Pro
                740                 745                 750
aag caa gag gct cct gca aag aag aaa tct ggt tca aag aag aaa ggt    2544
Lys Gln Glu Ala Pro Ala Lys Lys Lys Ser Gly Ser Lys Lys Lys Gly
            755                 760                 765
gag cct ggg cct cca gac tct gac agc cct ctc tac ctc ccc tac aag    2592
Glu Pro Gly Pro Pro Asp Ser Asp Ser Pro Leu Tyr Leu Pro Tyr Lys
        770                 775                 780
acg ctg gtc tcc aca gtt gga agc atg gta ttc aac gag ggt gag gcc    2640
Thr Leu Val Ser Thr Val Gly Ser Met Val Phe Asn Glu Gly Glu Ala
    785                 790                 795
cag cgg ctc att gag atc ctg tcc gag aag gct ggt gtc att caa gac    2688
Gln Arg Leu Ile Glu Ile Leu Ser Glu Lys Ala Gly Val Ile Gln Asp
800                 805                 810                 815
acc tgg cat aag gct act cag aag ggt gac ccc gtg gcg att ctg aag    2736
Thr Trp His Lys Ala Thr Gln Lys Gly Asp Pro Val Ala Ile Leu Lys
                820                 825                 830
cgc cag cta gaa gag aag gag aag ctg ctg gcc aca gag cag gag gac    2784
Arg Gln Leu Glu Glu Lys Glu Lys Leu Leu Ala Thr Glu Gln Glu Asp
            835                 840                 845
gcg gct gtt gcg aag agc aaa ctg agg gag gtg aat aag gag ctg gca    2832
Ala Ala Val Ala Lys Ser Lys Leu Arg Glu Val Asn Lys Glu Leu Ala
        850                 855                 860
gca gaa aag gct aag gca gca gcg ggg gag gcc aag gtg aag aag cag    2880
Ala Glu Lys Ala Lys Ala Ala Ala Gly Glu Ala Lys Val Lys Lys Gln
    865                 870                 875
ctg gtg gcc cgg gag cag gag atc aca gcc gtg cag gcg cgc atc gaa    2928
Leu Val Ala Arg Glu Gln Glu Ile Thr Ala Val Gln Ala Arg Ile Glu
880                 885                 890                 895
gcc agc tac cgg gag cat gtg aag gag gtg cag cag ctg cag ggc aag    2976
Ala Ser Tyr Arg Glu His Val Lys Glu Val Gln Gln Leu Gln Gly Lys
                900                 905                 910
atc cgg acc ctt cag gag cag ttg gag aac ggc ccc aac aca cag ctg    3024
Ile Arg Thr Leu Gln Glu Gln Leu Glu Asn Gly Pro Asn Thr Gln Leu
            915                 920                 925
gcc cgt ctg cag cag gaa aat tcc atc ctg agg gat gcc ttg aac cag    3072
Ala Arg Leu Gln Gln Glu Asn Ser Ile Leu Arg Asp Ala Leu Asn Gln
        930                 935                 940
gcc acg agc cag gtg gag agc aag cag aac acc gag ctg gcc aag ctc    3120
Ala Thr Ser Gln Val Glu Ser Lys Gln Asn Thr Glu Leu Ala Lys Leu
    945                 950                 955
cgg cag gag ctc agc aag gtc agc aag gag ctg gtg gag aaa tca gag    3168
Arg Gln Glu Leu Ser Lys Val Ser Lys Glu Leu Val Glu Lys Ser Glu
960                 965                 970                 975
gct gcg cgg cag gag gaa cag cag cga aag gcc ctg gag acc aaa aca    3216
Ala Ala Arg Gln Glu Glu Gln Gln Arg Lys Ala Leu Glu Thr Lys Thr
                980                 985                 990
gcc gcc ttg gag aag cag gtc cta cag ctg caa gca tct cac aag gag    3264
Ala Ala Leu Glu Lys Gln Val Leu Gln Leu Gln Ala Ser His Lys Glu
            995                1000                1005
agt gag gag gcc ctg cag aag cgc ctg gac gag gtc agc cgg gag cta    3312
Ser Glu Glu Ala Leu Gln Lys Arg Leu Asp Glu Val Ser Arg Glu Leu
       1010                1015                1020
tgc cgc tcc cag acc agc cat gcc agc ctg cgg gcg gat gcc gag aag    3360
Cys Arg Ser Gln Thr Ser His Ala Ser Leu Arg Ala Asp Ala Glu Lys
   1025                1030                1035
gcc cag gag cag cag cag cag atg gct gag ctg cac agc aaa ctt cag    3408
Ala Gln Glu Gln Gln Gln Gln Met Ala Glu Leu His Ser Lys Leu Gln
1040               1045                1050                1055
tcc tcc gag gcg gag gtg aaa agc aag tct gag gag ctg agt ggt ctc    3456
Ser Ser Glu Ala Glu Val Lys Ser Lys Ser Glu Glu Leu Ser Gly Leu
               1060                1065                1070
cat ggg cag ctc aag gag gcc agg gcc gag aac tca cag ctc atg gag    3504
His Gly Gln Leu Lys Glu Ala Arg Ala Glu Asn Ser Gln Leu Met Glu
           1075                1080                1085
aga atc cgg tcc atc gag gcc ctg ctg gag gcg ggc cag gcc cgg gac    3552
Arg Ile Arg Ser Ile Glu Ala Leu Leu Glu Ala Gly Gln Ala Arg Asp
       1090                1095                1100
acc cag gat gcc cag gcc agc cga gcg gag cat cag gcc cgc ctc aag    3600
Thr Gln Asp Ala Gln Ala Ser Arg Ala Glu His Gln Ala Arg Leu Lys
   1105                1110                1115
gag cta gag tcc cag gtg tgg tgc ctg gag aag gag gcc acc gag ctc    3648
Glu Leu Glu Ser Gln Val Trp Cys Leu Glu Lys Glu Ala Thr Glu Leu
1120               1125                1130                1135
aag gag gct gtt gag cag cag aaa gtg aag aac aac gac ctc cga gag    3696
Lys Glu Ala Val Glu Gln Gln Lys Val Lys Asn Asn Asp Leu Arg Glu
               1140                1145                1150
aag aac tgg aag gcc atg gag gct ctg gcc tcg gcc gag aga gcc tgc    3744
Lys Asn Trp Lys Ala Met Glu Ala Leu Ala Ser Ala Glu Arg Ala Cys
           1155                1160                1165
gag gag aag ctc cgc tcc tta acc cag gcc aag gag gaa tcc gag aag    3792
Glu Glu Lys Leu Arg Ser Leu Thr Gln Ala Lys Glu Glu Ser Glu Lys
       1170                1175                1180
cag ctc agc ctg acg gag gcc cag acc aag gag gcc ctg ctg gcc ctg    3840
Gln Leu Ser Leu Thr Glu Ala Gln Thr Lys Glu Ala Leu Leu Ala Leu
   1185                1190                1195
ttg ccg gct ctc tcc agc tca gcc ccc cag agt tac acc gag tgg ctg    3888
Leu Pro Ala Leu Ser Ser Ser Ala Pro Gln Ser Tyr Thr Glu Trp Leu
1200               1205                1210                1215
cag gaa ctc cga gag aag ggc ccg gag ctg ctg aag cag cgg ccg gct    3936
Gln Glu Leu Arg Glu Lys Gly Pro Glu Leu Leu Lys Gln Arg Pro Ala
               1220                1225                1230
gac aca gat ccg tcc tcg gac ctg gct tcc aag ctg agg gag gct gag    3984
Asp Thr Asp Pro Ser Ser Asp Leu Ala Ser Lys Leu Arg Glu Ala Glu
           1235                1240                1245
gag acc cag aac aat ctg cag gcc gag tgt gac cag tac cgc acc atc    4032
Glu Thr Gln Asn Asn Leu Gln Ala Glu Cys Asp Gln Tyr Arg Thr Ile
       1250                1255                1260
ctg gca gag acg gag ggc atg ctc aaa gac ctg cag aag agt gtg gag    4080
Leu Ala Glu Thr Glu Gly Met Leu Lys Asp Leu Gln Lys Ser Val Glu
   1265                1270                1275
gag gag gag cag gtg tgg aag gcc aaa gtg agc gcc acg gag gag gag    4128
Glu Glu Glu Gln Val Trp Lys Ala Lys Val Ser Ala Thr Glu Glu Glu
1280               1285                1290                1295
ctt cag aag tca cgg gtc aca gtg aaa cat ctc gaa gac att gta gag    4176
Leu Gln Lys Ser Arg Val Thr Val Lys His Leu Glu Asp Ile Val Glu
               1300                1305                1310
aag cta aaa gga gaa ctt gaa agt tca gag cag gtg agg gag cac acc    4224
Lys Leu Lys Gly Glu Leu Glu Ser Ser Glu Gln Val Arg Glu His Thr
           1315                1320                1325
tca cat ctg gaa gca gag ctg gag aag cac atg gca gct gcc agc gct    4272
Ser His Leu Glu Ala Glu Leu Glu Lys His Met Ala Ala Ala Ser Ala
       1330                1335                1340
gag tgc cag agc tac gcc aag gag gtg gcg ggg ttg agg caa ctt tta    4320
Glu Cys Gln Ser Tyr Ala Lys Glu Val Ala Gly Leu Arg Gln Leu Leu
   1345                1350                1355
tta gag tct cag tct cag ctg gat gca gcc aag agt gaa gcc cag aaa    4368
Leu Glu Ser Gln Ser Gln Leu Asp Ala Ala Lys Ser Glu Ala Gln Lys
1360               1365                1370                1375
caa agc aat gag ctc gcc ctg gtc agg cag cag ttg agt gag atg aag    4416
Gln Ser Asn Glu Leu Ala Leu Val Arg Gln Gln Leu Ser Glu Met Lys
               1380                1385                1390
agc cac gta gag gat ggt gac gta gct ggg tcc cca gct gcc ccc cca    4464
Ser His Val Glu Asp Gly Asp Val Ala Gly Ser Pro Ala Ala Pro Pro
           1395                1400                1405
gca gag cag gac cct gtc gag ctg aag gcg cag ctg gag cgg aca gag    4512
Ala Glu Gln Asp Pro Val Glu Leu Lys Ala Gln Leu Glu Arg Thr Glu
       1410                1415                1420
gcc acc ctg gag gac gag cag gcg ctg cgg agg aag ctc acg gcc gag    4560
Ala Thr Leu Glu Asp Glu Gln Ala Leu Arg Arg Lys Leu Thr Ala Glu
   1425                1430                1435
ttc cag gag gct cag agc tct gcg tgc cgg ctc cag gcc gag ctg gag    4608
Phe Gln Glu Ala Gln Ser Ser Ala Cys Arg Leu Gln Ala Glu Leu Glu
1440               1445                1450                1455
aag ctc cgc agc aca ggg ccc ctg gag tct tca gca gca gag gag gcc    4656
Lys Leu Arg Ser Thr Gly Pro Leu Glu Ser Ser Ala Ala Glu Glu Ala
               1460                1465                1470
aca cag ctg aag gag aga cta gaa aaa gag aag aaa cta acc agt gac   4704
Thr Gln Leu Lys Glu Arg Leu Glu Lys Glu Lys Lys Leu Thr Ser Asp
           1475                1480                1485
ctg gga cat gct gcc acc aaa ttg cag gag ctt ttg aag acc acc cag   4752
Leu Gly His Ala Ala Thr Lys Leu Gln Glu Leu Leu Lys Thr Thr Gln
       1490                1495                1500
gag cag ctg gca aag gag aga gac aca gtg aag aag ttg cag gag cag   4800
Glu Gln Leu Ala Lys Glu Arg Asp Thr Val Lys Lys Leu Gln Glu Gln
   1505                1510                1515
ttg gac aaa aca gac gac agc agc tca aag gag ggc act tct gtc tga   4848
Leu Asp Lys Thr Asp Asp Ser Ser Ser Lys Glu Gly Thr Ser Val
1520               1525                1530                1535
gtctgctctt cgggaaaaga agttcccatt caacttacca aaatgcctta cacattcctt 4908
acaaataaat aaaccaacca acacaccgtt atccaggccc aacctccagt agctctgaga 4968
gaagccatga gagactctta gaatcacaga aatagacctt ccagacccct tgtttgtaaa 5028
agaacctttg tcacatttga taaacactat tccccaggac cagccctgga ccaccaccga 5088
gcagacgcca aagcccttac cagctctgtg acagacccca gggtatgtgc tggggaggcc 5148
gggacgctgg gtatctgtat gtcaatcagt gcaattgttt tcttcccctg ggttgggggt 5208
caggaggcga gcggcctggt ggtgagtctc cagggctgtg gagcagactg gaggggccca 5268
gccagccggg gaggcagcag cctctcaccc ccgggggaag ttgccagcaa gaactgatgt 5328
gtgacttcct ggatgttaat gccattaaaa ccaacattgt tgcccggcaa aaaaaaaaaa 5388
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaa                          5425
<210>48
<211>1534
<212>PRT
<213>家犬
<400>48
Met Asp Ile Tyr Asp Thr Gln Thr Leu Gly Val Met Val Phe Gly Gly
  1               5                  10                  15
Phe Met Val Val Ser Ala Ile Gly Ile Phe Leu Val Ser Thr Phe Ser
             20                  25                  30
Met Lys Glu Thr Ser Tyr Glu Glu Ala Leu Ala Asn Gln Arg Lys Glu
         35                  40                  45
Met Ala Lys Thr His His Gln Lys Val Glu Lys Lys Lys Lys Glu Lys
     50                  55                  60
Thr Val Glu Lys Lys Gly Lys Thr Lys Lys Lys Glu Glu Lys Pro Asn
 65                  70                  75                  80
Gly Lys Ile Pro Asp His Glu Pro Ala Pro Asn Val Thr Ile Leu Leu
                 85                  90                  95
Lys Asp Pro Val Arg Ala Pro Ala Val Pro Val Ala Pro Thr Pro Val
            100                 105                 110
Gln Pro Pro Val Val Ile Ala Pro Val Ala Thr Val Pro Ala Met Pro
        115                 120                 125
Gln Glu Lys Leu Ala Pro Ser Pro Lys Asp Lys Lys Lys Lys Glu Lys
    130                 135                 140
Lys Val Ala Lys Val Glu Pro Ala Val Ser Ser Val Val Asn Ser Val
145                 150                 155                 160
Gln Val Leu Ala Ser Lys Ala Ala Ile Leu Glu Thr Ala Pro Lys Glu
                165                 170                 175
Val Pro Met Val Val Val Pro Pro Val Gly Ala Lys Ala Gly Thr Pro
            180                 185                 190
Ala Thr Ser Thr Ala Gln Gly Lys Lys Ala Glu Gly Ala Gln Asn Gln
        195                 200                 205
Ser Arg Lys Ala Glu Gly Ala Pro Asn Gln Gly Lys Lys Ala Glu Gly
    210                 215                 220
Ala Leu Asn Gln Gly Lys Lys Ala Glu Gly Ala Gln Asn Gln Gly Lys
225                 230                 235                 240
Lys Val Glu Val Ala Pro Asn Gln Gly Lys Lys Ala Glu Gly Gly Gln
                245                 250                 255
Asn Gln Gly Lys Lys Val Glu Gly Ala Gln Asn Gln Gly Lys Lys Ala
            260                 265                 270
Glu Gly Thr Pro Asn Gln Gly Lys Lys Ala Glu Gly Ala Pro Asn Gln
        275                 280                 285
Gly Lys Lys Thr Asp Gly Ala Pro Asn Gln Gly Lys Lys Ser Glu Gly
    290                 295                 300
Ala Pro Asn Gln Gly Lys Lys Ala Glu Gly Ala Gln Asn Gln Gly Lys
305                 310                 315                 320
Lys Val Glu Val Ala Pro Asn Gln Gly Lys Lys Ala Glu Gly Gly Gln
                325                 330                 335
Asn Gln Gly Lys Lys Val Glu Gly Ala Gln Asn Gln Gly Lys Lys Ala
            340                 345                 350
Glu Gly Thr Pro Asn Gln Gly Lys Lys Ala Glu Gly Ala Pro Asn Gln
        355                 360                 365
Gly Lys Lys Thr Asp Gly Ala Pro Asn Gln Gly Lys Lys Ser Glu Gly
    370                 375                 380
Ala Pro Asn Gln Gly Lys Lys Val Glu Gly Ala Gln Asn Gln Gly Lys
385                 390                 395                 400
Lys Val Glu Gly Val Gln Asn Gln Gly Lys Lys Ala Glu Gly Ala Gln
                405                 410                 415
Asn Gln Gly Lys Lys Ala Glu Gly Thr Ser Ser Gln Gly Arg Lys Glu
            420                 425                 430
Glu Gly Thr Pro Asn Leu Gly Lys Lys Ala Glu Gly Ser Pro Asn Gln
        435                 440                 445
Gly Lys Lys Val Glu Val Val Gln Asn Gln Ser Lys Lys Val Glu Gly
    450                 455                 460
Ala Pro Asn Gln Gly Lys Lys Ala Glu Gly Ser Gln Asn Gln Gly Lys
465                 470                 475                 480
Lys Thr Glu Gly Ala Ser Asn Gln Gly Lys Lys Val Asp Gly Ala Gln
                485                 490                 495
Asn Gln Gly Lys Lys Ala Glu Gly Ala Pro Asn Gln Gly Lys Lys Val
            500                 505                 510
Glu Gly Ala Gln Asn Gln Gly Lys Lys Ala Glu Gly Thr Pro Asn Gln
        515                 520                 525
Gly Lys Lys Ala Glu Gly Ala Gln Asn Gln Gly Lys Lys Ala Glu Gly
    530                 535                 540
Ala Pro Asn Gln Gly Lys Lys Ala Glu Gly Ala Pro Asn Gln Gly Lys
545                 550                 555                 560
Lys Ala Glu Gly Ala Pro Asn Gln Gly Lys Lys Ala Glu Gly Ala Pro
                565                 570                 575
Asn Gln Gly Lys Lys Ala Glu Ala Ala Pro Asn Gln Gly Lys Lys Ala
            580                 585                 590
Glu Gly Ala Pro Asn Gln Gly Lys Lys Ala Glu Gly Ala Pro Asn Gln
        595                 600                 605
Gly Lys Lys Ala Glu Ala Ala Pro Asn Gln Gly Lys Lys Ala Glu Gly
    610                 615                 620
Ala Pro Asn Gln Gly Lys Lys Ala Glu Gly Ala Pro Asn Gln Gly Lys
625                 630                 635                 640
Lys Ala Glu Gly Ala Pro Asn Gln Gly Lys Lys Ala Glu Gly Ala Gln
                645                 650                 655
Asn Gln Gly Lys Lys Ala Glu Gly Ala Pro Asn Gln Gly Lys Lys Ala
            660                 665                 670
Asp Leu Val Ala Asn Gln Gly Thr Lys Ala Glu Gly Val Ala Gly Gln
        675                 680                 685
Gly Lys Lys Ala Glu Gly Ala Pro Asn Gln Gly Lys Lys Gly Glu Gly
    690                 695                 700
Thr Pro Asn Gln Gly Lys Lys Ser Glu Gly Ser Pro Asn Gln Gly Lys
705                 710                 715                 720
Lys Val Asp Ala Ser Ala Asn Gln Ser Lys Arg Ala Glu Ser Ala Pro
                725                 730                 735
Ile Gln Gly Lys Asn Ala Asp Met Val Gln Ser Gln Glu Ala Pro Lys
            740                 745                 750
Gln Glu Ala Pro Ala Lys Lys Lys Ser Gly Ser Lys Lys Lys Gly Glu
        755                 760                 765
Pro Gly Pro Pro Asp Ser Asp Ser Pro Leu Tyr Leu Pro Tyr Lys Thr
    770                 775                 780
Leu Val Ser Thr Val Gly Ser Met Val Phe Asn Glu Gly Glu Ala Gln
785                 790                 795                 800
Arg Leu Ile Glu Ile Leu Ser Glu Lys Ala Gly Val Ile Gln Asp Thr
                805                 810                 815
Trp His Lys Ala Thr Gln Lys Gly Asp Pro Val Ala Ile Leu Lys Arg
            820                 825                 830
Gln Leu Glu Glu Lys Glu Lys Leu Leu Ala Thr Glu Gln Glu Asp Ala
        835                 840                 845
Ala Val Ala Lys Ser Lys Leu Arg Glu Val Asn Lys Glu Leu Ala Ala
    850                 855                 860
Glu Lys Ala Lys Ala Ala Ala Gly Glu Ala Lys Val Lys Lys Gln Leu
865                 870                 875                 880
Val Ala Arg Glu Gln Glu Ile Thr Ala Val Gln Ala Arg Ile Glu Ala
                885                 890                 895
Ser Tyr Arg Glu His Val Lys Glu Val Gln Gln Leu Gln Gly Lys Ile
            900                 905                 910
Arg Thr Leu Gln Glu Gln Leu Glu Asn Gly Pro Asn Thr Gln Leu Ala
        915                 920                 925
Arg Leu Gln Gln Glu Asn Ser Ile Leu Arg Asp Ala Leu Asn Gln Ala
    930                 935                 940
Thr Ser Gln Val Glu Ser Lys Gln Asn Thr Glu Leu Ala Lys Leu Arg
945                 950                 955                 960
Gln Glu Leu Ser Lys Val Ser Lys Glu Leu Val Glu Lys Ser Glu Ala
                965                 970                 975
Ala Arg Gln Glu Glu Gln Gln Arg Lys Ala Leu Glu Thr Lys Thr Ala
            980                 985                 990
Ala Leu Glu Lys Gln Val Leu Gln Leu Gln Ala Ser His Lys Glu Ser
        995                1000                1005
Glu Glu Ala Leu Gln Lys Arg Leu Asp Glu Val Ser Arg Glu Leu Cys
   1010                1015                1020
Arg Ser Gln Thr Ser His Ala Ser Leu Arg Ala Asp Ala Glu Lys Ala
1025               1030                1035                1040
Gln Glu Gln Gln Gln Gln Met Ala Glu Leu His Ser Lys Leu Gln Ser
               1045                1050                1055
Ser Glu Ala Glu Val Lys Ser Lys Ser Glu Glu Leu Ser Gly Leu His
           1060                1065                1070
Gly Gln Leu Lys Glu Ala Arg Ala Glu Asn Ser Gln Leu Met Glu Arg
       1075                1080                1085
Ile Arg Ser Ile Glu Ala Leu Leu Glu Ala Gly Gln Ala Arg Asp Thr
   1090                1095                1100
Gln Asp Ala Gln Ala Ser Arg Ala Glu His Gln Ala Arg Leu Lys Glu
1105               1110                1115                1120
Leu Glu Ser Gln Val Trp Cys Leu Glu Lys Glu Ala Thr Glu Leu Lys
               1125                1130                1135
Glu Ala Val Glu Gln Gln Lys Val Lys Asn Asn Asp Leu Arg Glu Lys
           1140                1145                1150
Asn Trp Lys Ala Met Glu Ala Leu Ala Ser Ala Glu Arg Ala Cys Glu
       1155                1160                1165
Glu Lys Leu Arg Ser Leu Thr Gln Ala Lys Glu Glu Ser Glu Lys Gln
   1170                1175                1180
Leu Ser Leu Thr Glu Ala Gln Thr Lys Glu Ala Leu Leu Ala Leu Leu
1185               1190                1195                1200
Pro Ala Leu Ser Ser Ser Ala Pro Gln Ser Tyr Thr Glu Trp Leu Gln
               1205                1210                1215
Glu Leu Arg Glu Lys Gly Pro Glu Leu Leu Lys Gln Arg Pro Ala Asp
           1220                1225                1230
Thr Asp Pro Ser Ser Asp Leu Ala Ser Lys Leu Arg Glu Ala Glu Glu
       1235                1240                1245
Thr Gln Asn Asn Leu Gln Ala Glu Cys Asp Gln Tyr Arg Thr Ile Leu
   1250                1255                1260
Ala Glu Thr Glu Gly Met Leu Lys Asp Leu Gln Lys Ser Val Glu Glu
1265               1270                1275                1280
Glu Glu Gln Val Trp Lys Ala Lys Val Ser Ala Thr Glu Glu Glu Leu
               1285                1290                1295
Gln Lys Ser Arg Val Thr Val Lys His Leu Glu Asp Ile Val Glu Lys
           1300                1305                1310
Leu Lys Gly Glu Leu Glu Ser Ser Glu Gln Val Arg Glu His Thr Ser
       1315                1320                1325
His Leu Glu Ala Glu Leu Glu Lys His Met Ala Ala Ala Ser Ala Glu
   1330                1335                1340
Cys Gln Ser Tyr Ala Lys Glu Val Ala Gly Leu Arg Gln Leu Leu Leu
1345               1350                1355                1360
Glu Ser Gln Ser Gln Leu Asp Ala Ala Lys Ser Glu Ala Gln Lys Gln
               1365                1370                1375
Ser Asn Glu Leu Ala Leu Val Arg Gln Gln Leu Ser Glu Met Lys Ser
           1380                1385                1390
His Val Glu Asp Gly Asp Val Ala Gly Ser Pro Ala Ala Pro Pro Ala
       1395                1400                1405
Glu Gln Asp Pro Val Glu Leu Lys Ala Gln Leu Glu Arg Thr Glu Ala
   1410                1415                1420
Thr Leu Glu Asp Glu Gln Ala Leu Arg Arg Lys Leu Thr Ala Glu Phe
1425               1430                1435                1440
Gln Glu Ala Gln Ser Ser Ala Cys Arg Leu Gln Ala Glu Leu Glu Lys
               1445                1450                1455
Leu Arg Ser Thr Gly Pro Leu Glu Ser Ser Ala Ala Glu Glu Ala Thr
           1460                1465                1470
Gln Leu Lys Glu Arg Leu Glu Lys Glu Lys Lys Leu Thr Ser Asp Leu
       1475                1480                1485
Gly His Ala Ala Thr Lys Leu Gln Glu Leu Leu Lys Thr Thr Gln Glu
   1490                1495                1500
Gln Leu Ala Lys Glu Arg Asp Thr Val Lys Lys Leu Gln Glu Gln Leu
1505               1510                1515                1520
Asp Lys Thr Asp Asp Ser Ser Ser Lys Glu Gly Thr Ser Val
               1525                1530
<210>49
<211>21
<212>DNA
<213>人工序列
<220>
<223>引物
<400>49
ctcaagggcc tggagactac g                                               21
<210>50
<211>22
<212>DNA
<213>人工序列
<220>
<223>引物
<400>50
cgggattccc gagtcgctca cc                                              22
<210>51
<211>1416
<212>DNA
<213>人工序列
<220>
<223>合成核苷酸
<400>51
tctagaatgt tgttgcaagc cttcttgttc ttgttggctg gtttcgctgc taagatttcc     60
gctcaattgc agttgcaaga gtccggtcca ggattggtta agccatccga gaccttgtcc    120
ttgacctgta ccgtttccgg tggttccatc atctccaagt cctcctactg gggatggatc    180
agacaaccac caggaaaggg tttggagtgg atcggttcca tctactactc cggttccacc    240
ttctacaacc catccttgaa gtccagagtt accatctccg ttgacacctc caagaaccaa    300
ttctccttga agttgtcctc cgttaccgct gctgacaccg ctgtttacta ctgtgctaga    360
ttgaccgttg ctgagttcga ctactggggt caaggaacct tggttaccgt ttcctccgct    420
tccaccaagg gtccatccgt tttcccattg gctccatcct ccaagtccac ctccggtgga    480
accgctgctt tgggttgttt ggtcaaggac tacttcccag agccagtcac cgtttcctgg    540
aactccggtg ctttgacctc cggtgttcac accttcccag ctgttttgca atcctccggt   600
ttgtactcct tgtcctccgt cgttaccgtt ccatcctcct ccttgggtac tcaaacctac   660
atctgcaacg tcaaccacaa gccatccaac accaaggttg acaagaaggt tgagccaaag   720
tcctgtgaca agacccacac ctgtccacca tgtccagctc cagagttgtt gggtggtcct   780
tctgttttct tgttcccacc aaagccaaag gacaccttga tgatctccag aaccccagag   840
gttacctgtg ttgtcgttga cgtttcccac gaggacccag aggttaagtt caactggtac   900
gttgacggtg ttgaggttca caacgctaag accaagccaa gagaggagca atacaactcc   960
acctacagag ttgtttccgt cttgaccgtt ttgcaccaag actggttgaa cggaaaggag  1020
tacaagtgca aggtttccaa caaggctttg ccagctccaa tcgaaaagac catctccaag  1080
gctaagggtc aaccaagaga gccacaagtt tacaccttgc caccatccag agatgagttg  1140
accaagaacc aagtttcctt gacctgcttg gtcaagggtt tctacccatc cgacatcgct  1200
gttgagtggg agtccaacgg tcaaccagag aacaactaca agaccacccc accagttttg  1260
gactccgacg gttccttctt cttgtactcc aagttgaccg ttgacaagtc cagatggcaa  1320
caaggtaacg ttttctcctg ctccgttatg cacgaggctt tgcacaacca ctacacccaa  1380
aagtccttgt ccttgtcccc aggtaagtaa ggatcc                            1416
<210>52
<211>1416
<212>DNA
<213>人工序列
<220>
<223>合成核苷酸
<220>
<221>CDS
<222>(7)..(1410)
<400>52
tctaga atg ttg ttg caa gcc ttc ttg ttc ttg ttg gct ggt ttc gct       48
       Met Leu Leu Gln Ala Phe Leu Phe Leu Leu Ala Gly Phe Ala
       1               5                   10
gct aag att tcc gct caa ttg cag ttg caa gag tcc ggt cca gga ttg      96
Ala Lys Ile Ser Ala Gln Leu Gln Leu Gln Glu Ser Gly Pro Gly Leu
15                  20                  25                  30
gtt aag cca tcc gag acc ttg tcc ttg acc tgt acc gtt tcc ggt ggt     144
Val Lys Pro Ser Glu Thr Leu Ser Leu Thr Cys Thr Val Ser Gly Gly
                35                  40                  45
tcc atc atc tcc aag tcc tcc tac tgg gga tgg atc aga caa cca cca    192
Ser Ile Ile Ser Lys Ser Ser Tyr Trp Gly Trp Ile Arg Gln Pro Pro
            50                  55                  60
gga aag ggt ttg gag tgg atc ggt tcc atc tac tac tcc ggt tcc acc    240
Gly Lys Gly Leu Glu Trp Ile Gly Ser Ile Tyr Tyr Ser Gly Ser Thr
        65                  70                  75
ttc tac aac cca tcc ttg aag tcc aga gtt acc atc tcc gtt gac acc    288
Phe Tyr Asn Pro Ser Leu Lys Ser Arg Val Thr Ile Ser Val Asp Thr
    80                  85                  90
tcc aag aac caa ttc tcc ttg aag ttg tcc tcc gtt acc gct gct gac    336
Ser Lys Asn Gln Phe Ser Leu Lys Leu Ser Ser Val Thr Ala Ala Asp
95                  100                 105                 110
acc gct gtt tac tac tgt gct aga ttg acc gtt gct gag ttc gac tac    384
Thr Ala Val Tyr Tyr Cys Ala Arg Leu Thr Val Ala Glu Phe Asp Tyr
                115                 120                 125
tgg ggt caa gga acc ttg gtt acc gtt tcc tcc gct tcc acc aag ggt    432
Trp Gly Gln Gly Thr Leu Val Thr Val Ser Ser Ala Ser Thr Lys Gly
            130                 135                 140
cca tcc gtt ttc cca ttg gct cca tcc tcc aag tcc acc tcc ggt gga    480
Pro Ser Val Phe Pro Leu Ala Pro Ser Ser Lys Ser Thr Ser Gly Gly
        145                 150                 155
acc gct gct ttg ggt tgt ttg gtc aag gac tac ttc cca gag cca gtc    528
Thr Ala Ala Leu Gly Cys Leu Val Lys Asp Tyr Phe Pro Glu Pro Val
    160                 165                 170
acc gtt tcc tgg aac tcc ggt gct ttg acc tcc ggt gtt cac acc ttc    576
Thr Val Ser Trp Asn Ser Gly Ala Leu Thr Ser Gly Val His Thr Phe
175                 180                 185                 190
cca gct gtt ttg caa tcc tcc ggt ttg tac tcc ttg tcc tcc gtc gtt    624
Pro Ala Val Leu Gln Ser Ser Gly Leu Tyr Ser Leu Ser Ser Val Val
                195                 200                 205
acc gtt cca tcc tcc tcc ttg ggt act caa acc tac atc tgc aac gtc    672
Thr Val Pro Ser Ser Ser Leu Gly Thr Gln Thr Tyr Ile Cys Asn Val
            210                 215                 220
aac cac aag cca tcc aac acc aag gtt gac aag aag gtt gag cca aag    720
Asn His Lys Pro Ser Asn Thr Lys Val Asp Lys Lys Val Glu Pro Lys
        225                 230                 235
tcc tgt gac aag acc cac acc tgt cca cca tgt cca gct cca gag ttg    768
Ser Cys Asp Lys Thr His Thr Cys Pro Pro Cys Pro Ala Pro Glu Leu
    240                 245                 250
ttg ggt ggt cct tct gtt ttc ttg ttc cca cca aag cca aag gac acc    816
Leu Gly Gly Pro Ser Val Phe Leu Phe Pro Pro Lys Pro Lys Asp Thr
255                 260                 265                 270
ttg atg atc tcc aga acc cca gag gtt acc tgt gtt gtc gtt gac gtt    864
Leu Met Ile Ser Arg Thr Pro Glu Val Thr Cys Val Val Val Asp Val
                275                 280                 285
tcc cac gag gac cca gag gtt aag ttc aac tgg tac gtt gac ggt gtt     912
Ser His Glu Asp Pro Glu Val Lys Phe Asn Trp Tyr Val Asp Gly Val
            290                 295                 300
gag gtt cac aac gct aag acc aag cca aga gag gag caa tac aac tcc     960
Glu Val His Asn Ala Lys Thr Lys Pro Arg Glu Glu Gln Tyr Asn Ser
        305                 310                 315
acc tac aga gtt gtt tcc gtc ttg acc gtt ttg cac caa gac tgg ttg    1008
Thr Tyr Arg Val Val Ser Val Leu Thr Val Leu His Gln Asp Trp Leu
    320                 325                 330
aac gga aag gag tac aag tgc aag gtt tcc aac aag gct ttg cca gct    1056
Asn Gly Lys Glu Tyr Lys Cys Lys Val Ser Asn Lys Ala Leu Pro Ala
335                 340                 345                 350
cca atc gaa aag acc atc tcc aag gct aag ggt caa cca aga gag cca    1104
Pro Ile Glu Lys Thr Ile Ser Lys Ala Lys Gly Gln Pro Arg Glu Pro
                355                 360                 365
caa gtt tac acc ttg cca cca tcc aga gat gag ttg acc aag aac caa    1152
Gln Val Tyr Thr Leu Pro Pro Ser Arg Asp Glu Leu Thr Lys Asn Gln
            370                 375                 380
gtt tcc ttg acc tgc ttg gtc aag ggt ttc tac cca tcc gac atc gct    1200
Val Ser Leu Thr Cys Leu Val Lys Gly Phe Tyr Pro Ser Asp Ile Ala
        385                 390                 395
gtt gag tgg gag tcc aac ggt caa cca gag aac aac tac aag acc acc    1248
Val Glu Trp Glu Ser Asn Gly Gln Pro Glu Asn Asn Tyr Lys Thr Thr
    400                 405                 410
cca cca gtt ttg gac tcc gac ggt tcc ttc ttc ttg tac tcc aag ttg    1296
Pro Pro Val Leu Asp Ser Asp Gly Ser Phe Phe Leu Tyr Ser Lys Leu
415                 420                 425                 430
acc gtt gac aag tcc aga tgg caa caa ggt aac gtt ttc tcc tgc tcc    1344
Thr Val Asp Lys Ser Arg Trp Gln Gln Gly Asn Val Phe Ser Cys Ser
                435                 440                 445
gtt atg cac gag gct ttg cac aac cac tac acc caa aag tcc ttg tcc    1392
Val Met His Glu Ala Leu His Asn His Tyr Thr Gln Lys Ser Leu Ser
            450                 455                 460
ttg tcc cca ggt aag taa ggatcc                                     1416
Leu Ser Pro Gly Lys
        465
<210>53
<211>714
<212>DNA
<213>人工序列
<220>
<223>合成核苷酸
<400>53
tctagaatgt tgttgcaagc cttcttgttc ttgttggctg gtttcgctgc taagatttcc     60
gctgagatcg ttttgaccca atccccagct accttgtcct tgtccccagg tgagagagcc    120
accttgtcct gtagagcttc ccaatccgtt tcctccttct tggcttggta ccaacaaaag    180
ccaggtcaag ccccaagatt gttgatctac gacgcttcca acagagctac cggtatccca    240
gctagattct ccggttccgg ttccggaacc gacttcacct tgaccatctc ctccttggag    300
ccagaggact tcgctgttta ctactgccaa caaagatcca actggccatt gaccttcggt    360
ccaggtacta aggttgacat caagagaacc gttgctgctc catccgtttt catcttccca    420
ccatccgacg agcaattgaa gtccggtact gcttccgttg tttgcttgtt gaacaacttc    480
tacccaagag aggctaaggt tcaatggaag gttgacaacg ctttgcaatc cggtaactcc    540
caagagtccg ttaccgagca agactccaag gactccacct actccttgtc ctccaccttg    600
accttgtcca aggctgacta cgagaagcac aaggtttacg cttgtgaggt tacccaccaa    660
ggtttgtcct ccccagttac caagtccttc aacagaggtg agtgctaagg atcc          714
<210>54
<211>714
<212>DNA
<213>人工序列
<220>
<223>合成核苷酸
<220>
<221>CDS
<222>(7)..(708)
<400>54
tctaga atg ttg ttg caa gcc ttc ttg ttc ttg ttg gct ggt ttc gct        48
       Met Leu Leu Gln Ala Phe Leu Phe Leu Leu Ala Gly Phe Ala
       1               5                   10
gct aag att tcc gct gag atc gtt ttg acc caa tcc cca gct acc ttg       96
Ala Lys Ile Ser Ala Glu Ile Val Leu Thr Gln Ser Pro Ala Thr Leu
15                  20                  25                  30
tcc ttg tcc cca ggt gag aga gcc acc ttg tcc tgt aga gct tcc caa      144
Ser Leu Ser Pro Gly Glu Arg Ala Thr Leu Ser Cys Arg Ala Ser Gln
                35                  40                  45
tcc gtt tcc tcc ttc ttg gct tgg tac caa caa aag cca ggt caa gcc      192
Ser Val Ser Ser Phe Leu Ala Trp Tyr Gln Gln Lys Pro Gly Gln Ala
            50                  55                  60
cca aga ttg ttg atc tac gac gct tcc aac aga gct acc ggt atc cca      240
Pro Arg Leu Leu Ile Tyr Asp Ala Ser Asn Arg Ala Thr Gly Ile Pro
        65                  70                  75
gct aga ttc tcc ggt tcc ggt tcc gga acc gac ttc acc ttg acc atc    288
Ala Arg Phe Ser Gly Ser Gly Ser Gly Thr Asp Phe Thr Leu Thr Ile
    80                  85                  90
tcc tcc ttg gag cca gag gac ttc gct gtt tac tac tgc aaa caa aga    336
Ser Ser Leu Glu Pro Glu Asp Phe Ala Val Tyr Tyr Cys Gln Gln Arg
95                  100                 105                 110
tcc aac tgg cca ttg acc ttc ggt cca ggt act aag gtt gac atc aag    384
Ser Asn Trp Pro Leu Thr Phe Gly Pro Gly Thr Lys Val Asp Ile Lys
                115                 120                 125
aga acc gtt gct gct cca tcc gtt ttc atc ttc cca cca tcc gac gag    432
Arg Thr Val Ala Ala Pro Ser Val Phe Ile Phe Pro Pro Ser Asp Glu
            130                 135                 140
caa ttg aag tcc ggt act gct tcc gtt gtt tgc ttg ttg aac aac ttc    480
Gln Leu Lys Ser Gly Thr Ala Ser Val Val Cys Leu Leu Asn Asn Phe
        145                 150                 155
tac cca aga gag gct aag gtt caa tgg aag gtt gac aac gct ttg caa    528
Tyr Pro Arg Glu Ala Lys Val Gln Trp Lys Val Asp Asn Ala Leu Gln
    160                 165                 170
tcc ggt aac tcc caa gag tcc gtt acc gag caa gac tcc aag gac tcc    576
Ser Gly Asn Ser Gln Glu Ser Val Thr Glu Gln Asp Ser Lys Asp Ser
175                 180                 185                 190
acc tac tcc ttg tcc tcc acc ttg acc ttg tcc aag gct gac tac gag    624
Thr Tyr Ser Leu Ser Ser Thr Leu Thr Leu Ser Lys Ala Asp Tyr Glu
                195                 200                 205
aag cac aag gtt tac gct tgt gag gtt acc cac caa ggt ttg tcc tcc    672
Lys His Lys Val Tyr Ala Cys Glu Val Thr His Gln Gly Leu Ser Ser
            210                 215                 220
cca gtt acc aag tcc ttc aac aga ggt gag tgc taa ggatcc             714
Pro Val Thr Lys Ser Phe Asn Arg Gly Glu Cys
        225                 230
<210>55
<211>1437
<212>DNA
<213>人工序列
<220>
<223>合成核苷酸
<400>55
tctagaatgt tgggtaagaa cgacccaatg tgcttggtct tggtcttgtt gggtttgacc   60
gctttgttgg gtatctgtca aggacaattg cagttgcaag agtccggtcc aggattggtt  120
aagccatccg agaccttgtc cttgacctgt accgtttccg gtggttccat catctccaag  180
tcctcctact ggggatggat cagacaacca ccaggaaagg gtttggagtg gatcggttcc   240
atctactact ccggttccac cttctacaac ccatccttga agtccagagt taccatctcc   300
gttgacacct ccaagaacca attctccttg aagttgtcct ccgttaccgc tgctgacacc   360
gctgtttact actgtgctag attgaccgtt gctgagttcg actactgggg tcaaggaacc   420
ttggttaccg tttcctccgc ttccaccaag ggtccatccg ttttcccatt ggctccatcc   480
tccaagtcca cctccggtgg aaccgctgct ttgggttgtt tggtcaagga ctacttccca   540
gagccagtca ccgtttcctg gaactccggt gctttgacct ccggtgttca caccttccca   600
gctgttttgc aatcctccgg tttgtactcc ttgtcctccg tcgttaccgt tccatcctcc   660
tccttgggta ctcaaaccta catctgcaac gtcaaccaca agccatccaa caccaaggtt   720
gacaagaagg ttgagccaaa gtcctgtgac aagacccaca cctgtccacc atgtccagct   780
ccagagttgt tgggtggtcc ttctgttttc ttgttcccac caaagccaaa ggacaccttg   840
atgatctcca gaaccccaga ggttacctgt gttgtcgttg acgtttccca cgaggaccca   900
gaggttaagt tcaactggta cgttgacggt gttgaggttc acaacgctaa gaccaagcca   960
agagaggagc aatacaactc cacctacaga gttgtttccg tcttgaccgt tttgcaccaa  1020
gactggttga acggaaagga gtacaagtgc aaggtttcca acaaggcttt gccagctcca  1080
atcgaaaaga ccatctccaa ggctaagggt caaccaagag agccacaagt ttacaccttg  1140
ccaccatcca gagatgagtt gaccaagaac caagtttcct tgacctgctt ggtcaagggt  1200
ttctacccat ccgacatcgc tgttgagtgg gagtccaacg gtcaaccaga gaacaactac  1260
aagaccaccc caccagtttt ggactccgac ggttccttct tcttgtactc caagttgacc  1320
gttgacaagt ccagatggca acaaggtaac gttttctcct gctccgttat gcacgaggct  1380
ttgcacaacc actacaccca aaagtccttg tccttgtccc caggtaagta aggatcc     1437
<210>56
<211>1437
<212>DNA
<213>人工序列
<220>
<223>合成核苷酸
<220>
<221>CDS
<222>(7)..(1431)
<400>56
tctaga atg ttg ggt aag aac gac cca atg tgc ttg gtc ttg gtc ttg      48
       Met Leu Gly Lys Asn Asp Pro Met Cys Leu Val Leu Val Leu
       1               5                   10
ttg ggt ttg acc gct ttg ttg ggt atc tgt caa gga caa ttg cag ttg     96
Leu Gly Leu Thr Ala Leu Leu Gly Ile Cys Gln Gly Gln Leu Gln Leu
15                  20                  25                  30
caa gag tcc ggt cca gga ttg gtt aag cca tcc gag acc ttg tcc ttg    144
Gln Glu Ser Gly Pro Gly Leu Val Lys Pro Ser Glu Thr Leu Ser Leu
                35                  40                  45
acc tgt acc gtt tcc ggt ggt tcc atc atc tcc aag tcc tcc tac tgg    192
Thr Cys Thr Val Ser Gly Gly Ser Ile Ile Ser Lys Ser Ser Tyr Trp
            50                  55                  60
gga tgg atc aga caa cca cca gga aag ggt ttg gag tgg atc ggt tcc    240
Gly Trp Ile Arg Gln Pro Pro Gly Lys Gly Leu Glu Trp Ile Gly Ser
        65                  70                  75
atc tac tac tcc ggt tcc acc ttc tac aac cca tcc ttg aag tcc aga    288
Ile Tyr Tyr Ser Gly Ser Thr Phe Tyr Asn Pro Ser Leu Lys Ser Arg
    80                  85                  90
gtt acc atc tcc gtt gac acc tcc aag aac caa ttc tcc ttg aag ttg    336
Val Thr Ile Ser Val Asp Thr Ser Lys Asn Gln Phe Ser Leu Lys Leu
95                  100                 105                 110
tcc tcc gtt acc gct gct gac acc gct gtt tac tac tgt gct aga ttg    384
Ser Ser Val Thr Ala Ala Asp Thr Ala Val Tyr Tyr Cys Ala Arg Leu
                115                 120                 125
acc gtt gct gag ttc gac tac tgg ggt caa gga acc ttg gtt acc gtt    432
Thr Val Ala Glu Phe Asp Tyr Trp Gly Gln Gly Thr Leu Val Thr Val
            130                 135                 140
tcc tcc gct tcc acc aag ggt cca tcc gtt ttc cca ttg gct cca tcc    480
Ser Ser Ala Ser Thr Lys Gly Pro Ser Val Phe Pro Leu Ala Pro Ser
        145                 150                 155
tcc aag tcc acc tcc ggt gga acc gct gct ttg ggt tgt ttg gtc aag    528
Ser Lys Ser Thr Ser Gly Gly Thr Ala Ala Leu Gly Cys Leu Val Lys
    160                 165                 170
gac tac ttc cca gag cca gtc acc gtt tcc tgg aac tcc ggt gct ttg    576
Asp Tyr Phe Pro Glu Pro Val Thr Val Ser Trp Asn Ser Gly Ala Leu
175                 180                 185                 190
acc tcc ggt gtt cac acc ttc cca gct gtt ttg caa tcc tcc ggt ttg    624
Thr Ser Gly Val His Thr Phe Pro Ala Val Leu Gln Ser Ser Gly Leu
                195                 200                 205
tac tcc ttg tcc tcc gtc gtt acc gtt cca tcc tcc tcc ttg ggt act    672
Tyr Ser Leu Ser Ser Val Val Thr Val Pro Ser Ser Ser Leu Gly Thr
            210                 215                 220
caa acc tac atc tgc aac gtc aac cac aag cca tcc aac acc aag gtt    720
Gln Thr Tyr Ile Cys Asn Val Asn His Lys Pro Ser Asn Thr Lys Val
        225                 230                 235
gac aag aag gtt gag cca aag tcc tgt gac aag acc cac acc tgt cca    768
Asp Lys Lys Val Glu Pro Lys Ser Cys Asp Lys Thr His Thr Cys Pro
    240                 245                 250
cca tgt cca gct cca gag ttg ttg ggt ggt cct tct gtt ttc ttg ttc    816
Pro Cys Pro Ala Pro Glu Leu Leu Gly Gly Pro Ser Val Phe Leu Phe
255                 260                 265                 270
cca cca aag cca aag gac acc ttg atg atc tcc aga acc cca gag gtt    864
Pro Pro Lys Pro Lys Asp Thr Leu Met Ile Ser Arg Thr Pro Glu Val
                275                 280                 285
acc tgt gtt gtc gtt gac gtt tcc cac gag gac cca gag gtt aag ttc    912
Thr Cys Val Val Val Asp Val Ser His Glu Asp Pro Glu Val Lys Phe
            290                 295                 300
aac tgg tac gtt gac ggt gtt gag gtt cac aac gct aag acc aag cca    960
Asn Trp Tyr Val Asp Gly Val Glu Val His Asn Ala Lys Thr Lys Pro
        305                 310                 315
aga gag gag caa tac aac tcc acc tac aga gtt gtt tcc gtc ttg acc   1008
Arg Glu Glu Gln Tyr Asn Ser Thr Tyr Arg Val Val Ser Val Leu Thr
    320                 325                 330
gtt ttg cac caa gac tgg ttg aac gga aag gag tac aag tgc aag gtt   1056
Val Leu His Gln Asp Trp Leu Asn Gly Lys Glu Tyr Lys Cys Lys Val
335                 340                 345                 350
tcc aac aag gct ttg cca gct cca atc gaa aag acc atc tcc aag gct   1104
Ser Asn Lys Ala Leu Pro Ala Pro Ile Glu Lys Thr Ile Ser Lys Ala
                355                 360                 365
aag ggt caa cca aga gag cca caa gtt tac acc ttg cca cca tcc aga   1152
Lys Gly Gln Pro Arg Glu Pro Gln Val Tyr Thr Leu Pro Pro Ser Arg
            370                 375                 380
gat gag ttg acc aag aac caa gtt tcc ttg acc tgc ttg gtc aag ggt   1200
Asp Glu Leu Thr Lys Asn Gln Val Ser Leu Thr Cys Leu Val Lys Gly
        385                 390                 395
ttc tac cca tcc gac atc gct gtt gag tgg gag tcc aac ggt caa cca   1248
Phe Tyr Pro Ser Asp Ile Ala Val Glu Trp Glu Ser Asn Gly Gln Pro
    400                 405                 410
gag aac aac tac aag acc acc cca cca gtt ttg gac tcc gac ggt tcc   1296
Glu Asn Asn Tyr Lys Thr Thr Pro Pro Val Leu Asp Ser Asp Gly Ser
415                 420                 425                 430
ttc ttc ttg tac tcc aag ttg acc gtt gac aag tcc aga tgg caa caa   1344
Phe Phe Leu Tyr Ser Lys Leu Thr Val Asp Lys Ser Arg Trp Gln Gln
                435                 440                 445
ggt aac gtt ttc tcc tgc tcc gtt atg cac gag gct ttg cac aac cac   1392
Gly Asn Val Phe Ser Cys Ser Val Met His Glu Ala Leu His Asn His
            450                 455                 460
tac acc caa aag tcc ttg tcc ttg tcc cca ggt aag taa ggatcc        1437
Tyr Thr Gln Lys Ser Leu Ser Leu Ser Pro Gly Lys
        465                 470
<2l0>57
<211>735
<212>DNA
<213>人工序列
<220>
<223>合成核苷酸
<400>57
tctagaatgt tgggtaagaa cgacccaatg tgcttggtct tggtcttgtt gggtttgacc   60
gctttgttgg gtatctgtca aggagagatc gttttgaccc aatccccagc taccttgtcc  120
ttgtccccag gtgagagagc caccttgtcc tgtagagctt cccaatccgt ttcctccttc  180
ttggcttggt accaacaaaa gccaggtcaa gccccaagat tgttgatcta cgacgcttcc  240
aacagagcta ccggtatccc agctagattc tccggttccg gttccggaac cgacttcacc  300
ttgaccatct cctccttgga gccagaggac ttcgctgttt actactgcca acaaagatcc  360
aactggccat tgaccttcgg tccaggtact aaggttgaca tcaagagaac cgttgctgct  420
ccatccgttt tcatcttccc accatccgac gagcaattga agtccggtac tgcttccgtt  480
gtttgcttgt tgaacaactt ctacccaaga gaggctaagg ttcaatggaa ggttgacaac  540
gctttgcaat ccggtaactc ccaagagtcc gttaccgagc aagactccaa ggactccacc  600
tactccttgt cctccacctt gaccttgtcc aaggctgact acgagaagca caaggtttac  660
gcttgtgagg ttacccacca aggtttgtcc tccccagtta ccaagtcctt caacagaggt  720
gagtgctaag gatcc                                                   735
<210>58
<211>735
<212>DNA
<213>人工序列
<220>
<223>合成核苷酸
<220>
<221>CDS
<222>(7)..(729)
<400>58
tctaga atg ttg ggt aag aac gac cca atg tgc ttg gtc ttg gtc ttg      48
       Met Leu Gly Lys Asn Asp Pro Met Cys Leu Val Leu Val Leu
       1               5                   10
ttg ggt ttg acc gct ttg ttg ggt atc tgt caa gga gag atc gtt ttg     96
Leu Gly Leu Thr Ala Leu Leu Gly Ile Cys Gln Gly Glu Ile Val Leu
15                  20                  25                  30
acc caa tcc cca gct acc ttg tcc ttg tcc cca ggt gag aga gcc acc    144
Thr Gln Ser Pro Ala Thr Leu Ser Leu Ser Pro Gly Glu Arg Ala Thr
                35                  40                  45
ttg tcc tgt aga gct tcc caa tcc gtt tcc tcc ttc ttg gct tgg tac    192
Leu Ser Cys Arg Ala Ser Gln Ser Val Ser Ser Phe Leu Ala Trp Tyr
            50                  55                  60
caa caa aag cca ggt caa gcc cca aga ttg ttg atc tac gac gct tcc    240
Gln Gln Lys Pro Gly Gln Ala Pro Arg Leu Leu Ile Tyr Asp Ala Ser
        65                  70                  75
aac aga gct acc ggt atc cca gct aga ttc tcc ggt tcc ggt tcc gga    288
Asn Arg Ala Thr Gly Ile Pro Ala Arg Phe Ser Gly Ser Gly Ser Gly
    80                  85                  90
acc gac ttc acc ttg acc atc tcc tcc ttg gag cca gag gac ttc gct    336
Thr Asp Phe Thr Leu Thr Ile Ser Ser Leu Glu Pro Glu Asp Phe Ala
95                  100                 105                 110
gtt tac tac tgc caa caa aga tcc aac tgg cca ttg acc ttc ggt cca    384
Val Tyr Tyr Cys Gln Gln Arg Ser Asn Trp Pro Leu Thr Phe Gly Pro
                115                 120                 125
ggt act aag gtt gac atc aag aga acc gtt gct gct cca tcc gtt ttc    432
Gly Thr Lys Val Asp Ile Lys Arg Thr Val Ala Ala Pro Ser Val Phe
            130                 135                 140
atc ttc cca cca tcc gac gag caa ttg aag tcc ggt act gct tcc gtt    480
Ile Phe Pro Pro Ser Asp Glu Gln Leu Lys Ser Gly Thr Ala Ser Val
        145                 150                 155
gtt tgc ttg ttg aac aac ttc tac cca aga gag gct aag gtt caa tgg    528
Val Cys Leu Leu Asn Asn Phe Tyr Pro Arg Glu Ala Lys Val Gln Trp
    160                 165                 170
aag gtt gac aac gct ttg caa tcc ggt aac tcc caa gag tcc gtt acc    576
Lys Val Asp Asn Ala Leu Gln Ser Gly Asn Ser Gln Glu Ser Val Thr
175                 180                 185                 190
gag caa gac tcc aag gac tcc acc tac tcc ttg tcc tcc acc ttg acc    624
Glu Gln Asp Ser Lys Asp Ser Thr Tyr Ser Leu Ser Ser Thr Leu Thr
                195                 200                 205
ttg tcc aag gct gac tac gag aag cac aag gtt tac gct tgt gag gtt    672
Leu Ser Lys Ala Asp Tyr Glu Lys His Lys Val Tyr Ala Cys Glu Val
            210                 215                 220
acc cac caa ggt ttg tcc tcc cca gtt acc aag tcc ttc aac aga ggt    720
Thr His Gln Gly Leu Ser Ser Pro Val Thr Lys Ser Phe Asn Arg Gly
        225                 230                 235
gag tgc taa ggatcc                                                 735
Glu Cys
    240
<210>59
<211>37
<212>DNA
<213>人工序列
<220>
<223>引物
<400>59
atagaactag caactagatg aaaaagcctg aactcac                              37
<210>60
<211>36
<212>DNA
<213>人工序列
<220>
<223>引物
<400>60
caaatcccac ggatcactat tcctttgccc tcggac                               36
<210>61
<211>38
<212>DNA
<213>人工序列
<220>
<223>引物
<400>61
aattcgagct cggtacaggg atacatggga taccaaag                             38
<210>62
<211>38
<212>DNA
<213>人工序列
<220>
<223>引物
<400>62
gaggatcccc gggtaccagg gtcgattttc ttggtcga                             38
<210>63
<211>29
<212>DNA
<213>人工序列
<220>
<223>引物
<400>63
atgcccgtag attcttctca taagacagc                                       29
<210>64
<211>30
<212>DNA
<213>人工序列
<220>
<223>引物
<400>64
caaagtcatt taaatcaaat gcattagcgg                                     30
<210>65
<211>1220
<212>DNA
<213>巴斯德毕赤氏酵母
<400>65
atgcccgtag attcttctca taagacagct agcccacttc cacctcgtaa aagagcaaag    60
acggaagaag aaaaggagca gcgtcgagtg gaacgtatcc tacgtaatag gagagcggcc   120
catgcttcca gagagaagaa acgaagacac gttgaatttc tggaaaacca cgtcgtcgac   180
ctggaatctg cacttcaaga atcagccaaa gccactaaca agttgaaaga aatacaagat   240
atcattgttt caaggttgga agccttaggt ggtaccgtct cagatttgga tttaacagtt   300
ccggaagtcg attttcccaa atcttctgat ttggaaccca tgtctgatct ctcaacttct   360
tcgaaatcgg agaaagcatc tacatccact cgcagatctt tgactgagga tctggacgaa   420
gatgacgtcg ctgaatatga cgacgaagaa gaggacgaag agttacccag gaaaatgaaa   480
gtcttaaacg acaaaaacaa gagcacatct atcaagcagg agaagttgaa tgaacttcca   540
tctcctttgt catccgattt ttcagacgta gatgaagaaa agtcaactct cacacattta   600
aagttgcaac agcaacaaca acaaccagta gacaattatg tttctactcc tttgagtctt   660
ccggaggatt cagttgattt tattaaccca ggtaacttaa aaatagagtc cgatgagaac   720
ttcttgttga gttcaaatac tttacaaata aaacacgaaa atgacaccga ctacattact   780
acagctccat caggttccat caatgatttt tttaattctt atgacattag cgagtcgaat   840
cggttgcatc atccagcagt gatgacggat tcatctttac acattacagc aggctccatc   900
ggctttttct ctttgattgg ggggggggaa agttctgtag cagggaggcg cagttcagtt   960
ggcacatatc agttgacatg catagcgatc aggtgattgc tcttgttaac tggtatgcca  1020
agtcaaccgt tttcggcgta cctactactc tactttaact cttgaattga gatgaaacaa  1080
tcgcccttgt tcgagacgcg tagttaattt aagatgaatc aatttgcaac aaaagaacaa  1140
acgaaaaaga taacagcaaa cttaagtttc gtggtctgca gcaccattta ccgctaatgc  1200
atttgattta aatgactttg    1220
<210>66
<211>898
<212>DNA
<213>巴斯德毕赤氏酵母
<400>66
atgcccgtag attcttctca taagacagct agcccacttc cacctcgtaa aagagcaaag    60
acggaagaag aaaaggagca gcgtcgagtg gaacgtatcc tacgtaatag gagagcggcc   120
catgcttcca gagagaagaa acgaagacac gttgaatttc tggaaaacca cgtcgtcgac   180
ctggaatctg cacttcaaga atcagccaaa gccactaaca agttgaaaga aatacaagat   240
atcattgttt caaggttgga agccttaggt ggtaccgtct cagatttgga tttaacagtt   300
ccggaagtcg attttcccaa atcttctgat ttggaaccca tgtctgatct ctcaacttct   360
tcgaaatcgg agaaagcatc tacatccact cgcagatctt tgactgagga tctggacgaa   420
gatgacgtcg ctgaatatga cgacgaagaa gaggacgaag agttacccag gaaaatgaaa   480
gtcttaaacg acaaaaacaa gagcacatct atcaagcagg agaagttgaa tgaacttcca   540
tctcctttgt catccgattt ttcagacgta gatgaagaaa agtcaactct cacacattta   600
aagttgcaac agcaacaaca acaaccagta gacaattatg tttctactcc tttgagtctt   660
ccggaggatt cagttgattt tattaaccca ggtaacttaa aaatagagtc cgatgagaac   720
ttcttgttga gttcaaatac tttacaaata aaacacgaaa atgacaccga ctacattact   780
acagctccat caggttccat caatgatttt tttaattctt atgacattag cgagtcgaat   840
cggttgcatc atccagcagc accatttacc gctaatgcat ttgatttaaa tgactttg     898
<210>67
<211>29
<212>DNA
<213>人工序列
<220>
<223>引物
<400>67
gactagtatg cccgtagatt cttctcata                                      29
<210>68
<211>30
<212>DNA
<213>人工序列
<220>
<223>引物
<400>68
cagatctcta ttcctggaag aatacaaagt                                     30
<210>69
<211>915
<212>DNA
<213>巴斯德毕赤氏酵母
<400>69
atgcccgtag attcttctca taagacagct agcccacttc cacctcgtaa aagagcaaag    60
acggaagaag aaaaggagca gcgtcgagtg gaacgtatcc tacgtaatag gagagcggcc   120
catgcttcca gagagaagaa acgaagacac gttgaatttc tggaaaacca cgtcgtcgac   180
ctggaatctg cacttcaaga atcagccaaa gccactaaca agttgaaaga aatacaagat   240
atcattgttt caaggttgga agccttaggt ggtaccgtct cagatttgga tttaacagtt   300
ccggaagtcg attttcccaa atcttctgat ttggaaccca tgtctgatct ctcaacttct   360
tcgaaatcgg agaaagcatc tacatccact cgcagatctt tgactgagga tctggacgaa   420
gatgacgtcg ctgaatatga cgacgaagaa gaggacgaag agttacccag gaaaatgaaa   480
gtcttaaacg acaaaaacaa gagcacatct atcaagcagg agaagttgaa tgaacttcca   540
tctcctttgt catccgattt ttcagacgta gatgaagaaa agtcaactct cacacattta   600
aagttgcaac agcaacaaca acaaccagta gacaattatg tttctactcc tttgagtctt   660
ccggaggatt cagttgattt tattaaccca ggtaacttaa aaatagagtc cgatgagaac   720
ttcttgttga gttcaaatac tttacaaata aaacacgaaa atgacaccga ctacattact   780
acagctccat caggttccat caatgatttt tttaattctt atgacattag cgagtcgaat   840
cggttgcatc atccagcagc accatttacc gctaatgcat ttgatttaaa tgactttgta   900
ttcttccagg aatag                                                    915
<210>70
<211>304
<212>PRT
<213>巴斯德毕赤氏酵母
<400>70
Met Pro Val Asp Ser Ser His Lys Thr Ala Ser Pro Leu Pro Pro Arg
1               5                   10                  15
Lys Arg Ala Lys Thr Glu Glu Glu Lys Glu Gln Arg Arg Val Glu Arg
            20                  25                  30
Ile Leu Arg Asn Arg Arg Ala Ala His Ala Ser Arg Glu Lys Lys Arg
        35                  40                  45
Arg His Val Glu Phe Leu Glu Asn His Val Val Asp Leu Glu Ser Ala
    50                  55                  60
Leu Gln Glu Ser Ala Lys Ala Thr Asn Lys Leu Lys Glu Ile Gln Asp
65                  70                  75                  80
Ile Ile Val Ser Arg Leu Glu Ala Leu Gly Gly Thr Val Ser Asp Leu
                85                  90                  95
Asp Leu Thr Val Pro Glu Val Asp Phe Pro Lys Ser Ser Asp Leu Glu
            100                 105                 110
Pro Met Ser Asp Leu Ser Thr Ser Ser Lys Ser Glu Lys Ala Ser Thr
        115                 120                 125
Ser Thr Arg Arg Ser Leu Thr Glu Asp Leu Asp Glu Asp Asp Val Ala
    130                 135                 140
Glu Tyr Asp Asp Glu Glu Glu Asp Glu Glu Leu Pro Arg Lys Met Lys
145                 150                 155                 160
Val Leu Asn Asp Lys Asn Lys Ser Thr Ser Ile Lys Gln Glu Lys Leu
                165                 170                 175
Asn Glu Leu Pro Ser Pro Leu Ser Ser Asp Phe Ser Asp Val Asp Glu
            180                 185                 190
Glu Lys Ser Thr Leu Thr His Leu Lys Leu Gln Gln Gln Gln Gln Gln
        195                 200                 205
Pro Val Asp Asn Tyr Val Ser Thr Pro Leu Ser Leu Pro Glu Asp Ser
    210                 215                 220
Val Asp Phe Ile Asn Pro Gly Asn Leu Lys Ile Glu Ser Asp Glu Asn
225                 230                 235                 240
Phe Leu Leu Ser Ser Asn Thr Leu Gln Ile Lys His Glu Asn Asp Thr
                245                 250                 255
Asp Tyr Ile Thr Thr Ala Pro Ser Gly Ser Ile Asn Asp Phe Phe Asn
            260                 265                 270
Ser Tyr Asp Ile Ser Glu Ser Asn Arg Leu His His Pro Ala Ala Pro
        275                 280                 285
Phe Thr Ala Asn Ala Phe Asp Leu Asn Asp Phe Val Phe Phe Gln Glu
    290                 295                 300
<210>71
<211>30
<212>DNA
<213>人工序列
<220>
<223>引物
<400>71
gtctagaatg gaaatgactg attttgaact                                      30
<210>72
<211>30
<212>DNA
<213>人工序列
<220>
<223>引物
<400>72
cggatcctca tgaagtgatg aagaaatcat                                      30
<210>73
<211>30
<212>DNA
<213>人工序列
<220>
<223>引物
<400>73
atggcgggca aaaatcagaa atctagcgcg                                      30
<210>74
<211>30
<212>DNA
<213>人工序列
<220>
<223>引物
<400>74
ttacaactcg tctttgacta gaggcgggga                                      30
<210>75
<211>2520
<212>DNA
<213>0gataea minuta
<400>75
atggcgggca aaaatcagaa atctagcgcg accaccgctc agtcgttgag gggcgacacc     60
acaacagaac tcgtgttgca aaaggggaagt tgaggacct atatcaaaac agagttgtca    120
gaggacacat tgagccacag ggtactgaac acgacgagcg agaagttgtt gttggtgttg    180
ctgacagttt ttgctgccgt gattcgtttc cgcagtctca gcttccctga ctcagtggta    240
tttgacgagg ttcactttgg aggatttgcc agaaaataca tcctgggaaa cttcttcatg    300
gatgttcatc cgccattggc caaactgtta tttgctgcgg ttggatacct aggcggattc    360
aagggtgatt ttgagtttgc gtctattggt gacaagttcc cgacctctgt tccatatgtt    420
ctgatgagag aaatgagtgc gctcctcagt gttggaacag tggttctcat gtacttaacc    480
ttgcgggcct cgggctgcaa gccaatcgtc tcgtttctca ccgcctcttt gctggtggtc    540
gagagtgcca atgtgaccat ctccagatac attctgctgg actctccttt gatctttttc    600
attgctggct cagtctactc cttgaagaag gtccagatct acaaaccata ctcgttcgag    660
tggatcaaat ccctgtttgc aacaggagtt tgcctgggac ttgcgttctc gtccaaatgg    720
gttggtctat tcactgtggc ctgggtcggt gcctgcagcg tgatcagtct gtggtttcag    780
attggcgatc tgtccgtcaa gcccaagtca attgttaccc aggcggtcgc caaggtgtcc    840
gttttgctcg gagtccctgc cattttgtac ttggttttct tctacctcca cctctcgttc    900
ctcaaccacg agggagacgg tgctgccttc ctctcttctg ccttcagagt gtccttcgac    960
gacactaatg tccctgtgtc caccttggca gacgttggag ttggctcggt cgtcactatc   1020
agacatctca acaccaacgg aggctacttg cactcccaca accatttgta tgaaggagga   1080
tcgggacaac agcaaatcac tctgtaccca catctggacg agaacaataa atggaagatt   1140
gagctctaca acgttactga ggaacctacc gaatttgagc caattacaga cggaacaaag   1200
atcagattga aacacacatt cacctccaga agattgcatt cccacgacgt gagaccggca   1260
gtcagcgaga tagactggca aaatgaggct tcctgctacg ggtacgagga ctttgaagga   1320
gatgccaacg acgatttcgt tgttgagatt gtggacagtt tgtctgctcc tggcgactcc    1380
agaacacaag tgaaagccat ccataccgtg ttcagattga ggcacgcaat gaccggttgt    1440
tatctgttct cccacgagac caagttgcca aaatggggat ttgaacaaca ggaggtcaca    1500
tgtgccaccc aaggtatcaa acctctctcc tactggtacg tggagcaaaa tgagaaccca    1560
ttccttgatg cggaaaccgc tgaaatcgcc gcttatccgc agctcacttt ccttcaaaaa    1620
ttcactgaat tgcacaagag gatgtggaaa atcaacaaga gtctgaacgc tccacacact    1680
tacgagtcga gaccagagtc ctggcctgtt ctgtccagag gtatttctta ctggagagat    1740
ggagacagac aggtctattt gcttggaaac ccaattgtgt ggtggctagc ctcttttatc    1800
ttccttccgt tcggcttcta cgttatcgct cagcttttga gatggcaatt gggtgctgac    1860
ttgggggata actcggctgt tttcaattac agtatcacca catttgagtt ccttttggga    1920
tggttcattc attactatcc atccttcctc atggagagac agctcttttt gcaccactac    1980
atcccagccc tctactttgg tattttggca ttgggacaaa cgttcgaggt gctgtactct    2040
cacgtcctca aaggcaagaa attcctctcg atggccctct tcggcttgct cttcgccagc    2100
gcaggataca tgtttgttca gagatcctcc atcatctacg gatccgcctg ggacaaacag    2160
agctgtgagg cttccaagct gctttcaagc tgggactatg attgcagcat ctacccagag    2220
actttgtttg cttcttccgc atcaattgcg gagccaaagc agactcaggc gccaaagatc    2280
aactttgacg aggcattgaa cgtggacctg gaacccggct acgacaattc acagtttgtt    2340
gagagcattt atgaaacgtc taacgacgaa aaaaaccaag cagagaacgt tgttcaagag    2400
acccctcgtg acaacggcgc cgactccgtt tccagcgacg attcaacagt cggtgaggcc    2460
gtccctgacg atctcaagac aaatggagag tccccgcctc tagtcaaaga cgagttgtaa    2520
<210>76
<211>839
<212>PRT
<213>Ogataea minuta
<400>76
Met Ala Gly Lys Asn Gln Lys Ser Ser Ala Thr Thr Ala Gln Ser Leu
1               5                   10                  15
Arg Gly Asp Thr Thr Thr Glu Leu Val Leu Gln Lys Gly Lys Leu Arg
            20                  25                  30
Thr Tyr Ile Lys Thr Glu Leu Ser Glu Asp Thr Leu Ser His Arg Val
        35                  40                  45
Leu Asn Thr Thr Ser Glu Lys Leu Leu Leu Val Leu Leu Thr Val Phe
    50                  55                  60
Ala Ala Val Ile Arg Phe Arg Ser Leu Ser Phe Pro Asp Ser Val Val
65                  70                  75                  80
Phe Asp Glu Val His Phe Gly Gly Phe Ala Arg Lys Tyr Ile Leu Gly
                85                  90                  95
Asn Phe Phe Met Asp Val His Pro Pro Leu Ala Lys Leu Leu Phe Ala
            100                 105                 110
Ala Val Gly Tyr Leu Gly Gly Phe Lys Gly Asp Phe Glu Phe Ala Ser
        115                 120                 125
Ile Gly Asp Lys Phe Pro Thr Ser Val Pro Tyr Val Leu Met Arg Glu
    130                 135                 140
Met Ser Ala Leu Leu Ser Val Gly Thr Val Val Leu Met Tyr Leu Thr
145                 150                 155                 160
Leu Arg Ala Ser Gly Cys Lys Pro Ile Val Ser Phe Leu Thr Ala Ser
                165                 170                 175
Leu Leu Val Val Glu Ser Ala Asn Val Thr Ile Ser Arg Tyr Ile Leu
            180                 185                 190
Leu Asp Ser Pro Leu Ile Phe Phe Ile Ala Gly Ser Val Tyr Ser Leu
        195                 200                 205
Lys Lys Val Gln Ile Tyr Lys Pro Tyr Ser Phe Glu Trp Ile Lys Ser
    210                 215                 220
Leu Phe Ala Thr Gly Val Cys Leu Gly Leu Ala Phe Ser Ser Lys Trp
225                 230                 235                 240
Val Gly Leu Phe Thr Val Ala Trp Val Gly Ala Cys Ser Val Ile Ser
                245                 250                 255
Leu Trp Phe Gln Ile Gly Asp Leu Ser Val Lys Pro Lys Ser Ile Val
            260                 265                 270
Thr Gln Ala Val Ala Lys Val Ser Val Leu Leu Gly Val Pro Ala Ile
        275                 280                 285
Leu Tyr Leu Val Phe Phe Tyr Leu His Leu Ser Phe Leu Asn His Glu
    290                 295                 300
Gly Asp Gly Ala Ala Phe Leu Ser Ser Ala Phe Arg Val Ser Phe Asp
305                 310                 315                 320
Asp Thr Asn Val Pro Val Ser Thr Leu Ala Asp Val Gly Val Gly Ser
                325                 330                 335
Val Val Thr Ile Arg His Leu Asn Thr Asn Gly Gly Tyr Leu His Ser
            340                 345                 350
His Asn His Leu Tyr Glu Gly Gly Ser Gly Gln Gln Gln Ile Thr Leu
        355                 360                 365
Tyr Pro His Leu Asp Glu Asn Asn Lys Trp Lys Ile Glu Leu Tyr Asn
    370                 375                 380
Val Thr Glu Glu Pro Thr Glu Phe Glu Pro Ile Thr Asp Gly Thr Lys
385                 390                 395                 400
Ile Arg Leu Lys His Thr Phe Thr Ser Arg Arg Leu His Ser His Asp
                405                 410                 415
Val Arg Pro Ala Val Ser Glu Ile Asp Trp Gln Asn Glu Ala Ser Cys
            420                 425                 430
Tyr Gly Tyr Glu Asp Phe Glu Gly Asp Ala Asn Asp Asp Phe Val Val
        435                 440                 445
Glu Ile Val Asp Ser Leu Ser Ala Pro Gly Asp Ser Arg Thr Gln Val
    450                 455                 460
Lys Ala Ile His Thr Val Phe Arg Leu Arg His Ala Met Thr Gly Cys
465                 470                 475                 480
Tyr Leu Phe Ser His Glu Thr Lys Leu Pro Lys Trp Gly Phe Glu Gln
                485                 490                 495
Gln Glu Val Thr Cys Ala Thr Gln Gly Ile Lys Pro Leu Ser Tyr Trp
            500                 505                 510
Tyr Val Glu Gln Asn Glu Asn Pro Phe Leu Asp Ala Glu Thr Ala Glu
        515                 520                 525
Ile Ala Ala Tyr Pro Gln Leu Thr Phe Leu Gln Lys Phe Thr Glu Leu
    530                 535                 540
His Lys Arg Met Trp Lys Ile Asn Lys Ser Leu Asn Ala Pro His Thr
545                 550                 555                 560
Tyr Glu Ser Arg Pro Glu Ser Trp Pro Val Leu Ser Arg Gly Ile Ser
                565                 570                 575
Tyr Trp Arg Asp Gly Asp Arg Gln Val Tyr Leu Leu Gly Asn Pro Ile
            580                 585                 590
Val Trp Trp Leu Ala Ser Phe Ile Phe Leu Pro Phe Gly Phe Tyr Val
        595                 600                 605
Ile Ala Gln Leu Leu Arg Trp Gln Leu Gly Ala Asp Leu Gly Asp Asn
    610                 615                 620
Ser Ala Val Phe Asn Tyr Ser Ile Thr Thr Phe Glu Phe Leu Leu Gly
625                 630                 635                 640
Trp Phe Ile His Tyr Tyr Pro Ser Phe Leu Met Glu Arg Gln Leu Phe
                645                 650                 655
Leu His His Tyr Ile Pro Ala Leu Tyr Phe Gly Ile Leu Ala Leu Gly
            660                 665                 670
Gln Thr Phe Glu Val Leu Tyr Ser His Val Leu Lys Gly Lys Lys Phe
        675                 680                 685
Leu Ser Met Ala Leu Phe Gly Leu Leu Phe Ala Ser Ala Gly Tyr Met
    690                 695                 700
Phe Val Gln Arg Ser Ser Ile Ile Tyr Gly Ser Ala Trp Asp Lys Gln
705                 710                 715                 720
Ser Cys Glu Ala Ser Lys Leu Leu Ser Ser Trp Asp Tyr Asp Cys Ser
                725                 730                 735
Ile Tyr Pro Glu Thr Leu Phe Ala Ser Ser Ala Ser Ile Ala Glu Pro
            740                 745                 750
Lys Gln Thr Gln Ala Pro Lys Ile Asn Phe Asp Glu Ala Leu Asn Val
        755                 760                 765
Asp Leu Glu Pro Gly Tyr Asp Asn Ser Gln Phe Val Glu Ser Ile Tyr
    770                 775                 780
Glu Thr Ser Asn Asp Glu Lys Asn Gln Ala Glu Asn Val Val Gln Glu
785                 790                 795                 800
Thr Pro Arg Asp Asn Gly Ala Asp Ser Val Ser Ser Asp Asp Ser Thr
                805                 810                 815
Val Gly Glu Ala Val Pro Asp Asp Leu Lys Thr Asn Gly Glu Ser Pro
            820                 825                 830
Pro Leu Val Lys Asp Glu Leu
        835
<210>77
<211>30
<212>DNA
<213>人工序列
<220>
<223>引物
<400>77
atgggcgaac gtacgggcaa aagtgcgctc                                     30
<210>78
<211>30
<212>DNA
<213>人工序列
<220>
<223>引物
<400>78
ctaatcggaa attctccacg tgctcaagag                                     30
<210>79
<211>30
<212>DNA
<213>人工序列
<220>
<223>引物
<400>79
atggggccca aaataaagac cggcaagaaa                                     30
<210>80
<211>30
<212>DNA
<213>人工序列
<220>
<223>引物
<400>80
ctatttagca aaatgcagtt tgatgttgag                                     30
<210>81
<211>30
<212>DNA
<213>人工序列
<220>
<223>引物
<400>81
atggacgaga aaaacatctc tggcttagaa                                     30
<210>82
<211>30
<212>DNA
<213>人工序列
<220>
<223>引物
<400>82
ctactcacta tagacggagc agtcgatcga                                     30
<210>83
<211>30
<212>DNA
<213>人工序列
<220>
<223>引物
<400>83
atgtccgagt cagagctgag aaaccgcaaa                                     30
<210>84
<211>30
<212>DNA
<213>人工序列
<220>
<223>引物
<400>84
ctaagctata cgccaggtgg aaacccagtt                                      30
<210>85
<211>2259
<212>DNA
<213>Ogataea minuta
<400>85
atgggcgaac gtacgggcaa aagtgcgctc gaaaaggaac ccttgttgga aaacgatgag     60
tttacagaag atgaagtgaa ggcgaaacta gttgaattgg ccaccaagcc agagccggag    120
tccgaaatta cctctgtttg tcagtggtgg ttccgcaccg agacctggct ggcgccaatc    180
ttgttcactc ttctttcttt ctttgtcaga atgtacaaaa tcggaatcaa tcctcacgtt    240
gtttgggatg aagcccattt cggtaagttt ggatcctact atttgagaca cgaattttac    300
cacgatgtcc accctcctct tggaaaaatg cttgttggtc tctcaggata ccttgctgga    360
tacaatggtt cgtgggactt cccatctggc caggaatacc cggactacat tgactttgtc    420
aaaatgagat tattcaacgc gactttcagt gctctttgtg ttccaatcgc ctacttcacc    480
atgaaagaat ttggcttcaa cagaaaaacg acatggctct tcactttgat ggtgactttg    540
gaaacttcgt acactacgct tgccagattc attctgctgg actcgatgct tcttcttttt    600
accgtggcta ccgtgttctg tttcgccaga ttccacaacc aaaacagagt tgaatcaaac    660
tccttctcga gaaaatggtg gaaatggatt ttgttgactg gtatcaacat cggatgcacc    720
tgttcggtga aaatggttgg tcttttcgtc accaccttgg ttggtatcta cacggttgtc    780
gatctgtgga ctaagttcgg ccagctgagg aagaccatct ctgtaaagag atacattttc    840
cactgggcca ccagaatctt tgctctcatt atcattccat ttgctgtttt tttgatctct    900
ttcaaagtcc acttcgacct gcttttcgga tccggtccag gagacgcgaa catgtcctcg    960
ttgttccagg ccaacctggt tggatccacc ctcatttccg ggccaagaga cgtcatgact   1020
ctcaactctg tcgtgactct caaaagtcag ggattgaccg gtggtttgct ccattcccac   1080
gtgcagacct atcccgaagg ctcgaaccaa cagcaagtga ccacttactc gcacaaagat   1140
gcgaacaacg actggacttt tgagctggtc agagaagacg tcagaaactc cttcaccgaa   1200
cctcactacg tcgttgacgg aatggccgtc agacttgttc acaaatctac gggaagaaac   1260
ttgcacaccc acgagatccc tgctccagtg tccagttccc aatacgaagt ctccggttac   1320
ggtaacttga ccgttggcga ccgcaaagac aactggattg tggagattgc tgaccaatac    1380
ggcgacgagg acaagatcag attgcatccg ctgacctctt cattcagact cagatcggag    1440
ttgatgggtt gttacttggc cacaaccggt gtctctctgc cacagtgggg attcagacaa    1500
ggagaggttg tctgtatgca ctcgccattc aagagggaca agagaacatg gtggaacatt    1560
gaaaaccacg agaatccaga actgccaaac ccaccagaag acttcaaatt gccaaaaaca    1620
tctttcatca aggactttgt ccagctcaac atcgccatga tggccaccaa caacgcactg    1680
gtcccagatc cggaaaaaca ggacgatttg gcttctaaat tctggcaatg gccttcgttg    1740
aacgtcggta tcagactctg tggttgggga gacgacaatg tcaagtactt cttgattggt    1800
tctccggcca ctacttggac ctcgtcggtt tccatcgtgg tgtttgttgc aatggttgcc    1860
ttctacctgg tcagatggca gagacagatc gaggatttcc catccgactc gaagacacac    1920
tacaagagcg acaaactcaa cctgttcttg atgggaggag tctatccgtt cctgggttgg    1980
ttcctgcatt acatgccgtt ctgtatcatg ggcagagtca cttacgttca ccattacctc    2040
cctgcattgt actttgctat gattgtgatg tgctacactg ttcagtcctt cacgtccttc    2100
gccaacaaca aatacctcac cgctgttgtc tacttgtctc tctatgcact tgtgattggg    2160
ttctttgtgt ttttgcttcc tgtttcgttc ggtatggacg gtccgaacgc agacttcaag    2220
tatctcagcc tcttgagcac gtggagaatt tccgattag                           2259
<210>86
<211>752
<212>PRT
<213>Ogataea minuta
<400>86
Met Gly Glu Arg Thr Gly Lys Ser Ala Leu Glu Lys Glu Pro Leu Leu
1               5                   10                 15
Glu Asn Asp Glu Phe Thr Glu Asp Glu Val Lys Ala Lys Leu Val Glu
            20                  25                  30
Leu Ala Thr Lys Pro Glu Pro Glu Ser Glu Ile Thr Ser Val Cys Gln
        35                  40                  45
Trp Trp Phe Arg Thr Glu Thr Trp Leu Ala Pro Ile Leu Phe Thr Leu
    50                  55                  60
Leu Ser Phe Phe Val Arg Met Tyr Lys Ile Gly Ile Asn Pro His Val
65                  70                  75                  80
Val Trp Asp Glu Ala His Phe Gly Lys Phe Gly Ser Tyr Tyr Leu Arg
                85                  90                  95
His Glu Phe Tyr His Asp Val His Pro Pro Leu Gly Lys Met Leu Val
            100                 105                 110
Gly Leu Ser Gly Tyr Leu Ala Gly Tyr Asn Gly Ser Trp Asp Phe Pro
        115                 120                 125
Ser Gly Gln Glu Tyr Pro Asp Tyr Ile Asp Phe Val Lys Met Arg Leu
    130                 135                 140
Phe Asn Ala Thr Phe Ser Ala Leu Cys Val Pro Ile Ala Tyr Phe Thr
145                 150                 155                 160
Met Lys Glu Phe Gly Phe Asn Arg Lys Thr Thr Trp Leu Phe Thr Leu
                165                 170                 175
Met Val Thr Leu Glu Thr Ser Tyr Thr Thr Leu Ala Arg Phe Ile Leu
            180                 185                 190
Leu Asp Ser Met Leu Leu Leu Phe Thr Val Ala Thr Val Phe Cys Phe
        195                 200                 205
Ala Arg Phe His Asn Gln Asn Arg Val Glu Ser Asn Ser Phe Ser Arg
    210                 215                 220
Lys Trp Trp Lys Trp Ile Leu Leu Thr Gly Ile Asn Ile Gly Cys Thr
225                 230                 235                 240
Cys Ser Val Lys Met Val Gly Leu Phe Val Thr Thr Leu Val Gly Ile
                245                 250                 255
Tyr Thr Val Val Asp Leu Trp Thr Lys Phe Gly Gln Leu Arg Lys Thr
            260                 265                 270
Ile Ser Val Lys Arg Tyr Ile Phe His Trp Ala Thr Arg Ile Phe Ala
        275                 280                 285
Leu Ile Ile Ile Pro Phe Ala Val Phe Leu Ile Ser Phe Lys Val His
    290                 295                 300
Phe Asp Leu Leu Phe Gly Ser Gly Pro Gly Asp Ala Asn Met Ser Ser
305                 310                 315                 320
Leu Phe Gln Ala Asn Leu Val Gly Ser Thr Leu Ile Ser Gly Pro Arg
                325                 330                 335
Asp Val Met Thr Leu Asn Ser Val Val Thr Leu Lys Ser Gln Gly Leu
            340                 345                 350
Thr Gly Gly Leu Leu His Ser His Val Gln Thr Tyr Pro Glu Gly Ser
        355                 360                 365
Asn Gln Gln Gln Val Thr Thr Tyr Ser His Lys Asp Ala Asn Asn Asp
    370                 375                 380
Trp Thr Phe Glu Leu Val Arg Glu Asp Val Arg Asn Ser Phe Thr Glu
385                 390                 395                 400
Pro His Tyr Val Val Asp Gly Met Ala Val Arg Leu Val His Lys Ser
                405                 410                 415
Thr Gly Arg Asn Leu His Thr His Glu Ile Pro Ala Pro Val Ser Ser
            420                 425                 430
Ser Gln Tyr Glu Val Ser Gly Tyr Gly Asn Leu Thr Val Gly Asp Arg
        435                 440                 445
Lys Asp Asn Trp Ile Val Glu Ile Ala Asp Gln Tyr Gly Asp Glu Asp
    450                 455                 460
Lys Ile Arg Leu His Pro Leu Thr Ser Ser Phe Arg Leu Arg Ser Glu
465                 470                 475                 480
Leu Met Gly Cys Tyr Leu Ala Thr Thr Gly Val Ser Leu Pro Gln Trp
                485                 490                 495
Gly Phe Arg Gln Gly Glu Val Val Cys Met His Ser Pro Phe Lys Arg
            500                 505                 510
Asp Lys Arg Thr Trp Trp Asn Ile Glu Asn His Glu Asn Pro Glu Leu
        515                 520                 525
Pro Asn Pro Pro Glu Asp Phe Lys Leu Pro Lys Thr Ser Phe Ile Lys
    530                 535                 540
Asp Phe Val Gln Leu Asn Ile Ala Met Met Ala Thr Asn Asn Ala Leu
545                 550                 555                 560
Val Pro Asp Pro Glu Lys Gln Asp Asp Leu Ala Ser Lys Phe Trp Gln
                565                 570                 575
Trp Pro Ser Leu Asn Val Gly Ile Arg Leu Cys Gly Trp Gly Asp Asp
            580                 585                 590
Asn Val Lys Tyr Phe Leu Ile Gly Ser Pro Ala Thr Thr Trp Thr Ser
        595                 600                 605
Ser Val Ser Ile Val Val Phe Val Ala Met Val Ala Phe Tyr Leu Val
    610                 615                 620
Arg Trp Gln Arg Gln Ile Glu Asp Phe Pro Ser Asp Ser Lys Thr His
625                 630                 635                 640
Tyr Lys Ser Asp Lys Leu Asn Leu Phe Leu Met Gly Gly Val Tyr Pro
                645                 650                 655
Phe Leu Gly Trp Phe Leu His Tyr Met Pro Phe Cys Ile Met Gly Arg
            660                 665                 670
Val Thr Tyr Val His His Tyr Leu Pro Ala Leu Tyr Phe Ala Met Ile
        675                 680                 685
Val Met Cys Tyr Thr Val Gln Ser Phe Thr Ser Phe Ala Asn Asn Lys
    690                 695                 700
Tyr Leu Thr Ala Val Val Tyr Leu Ser Leu Tyr Ala Leu Val Ile Gly
705                 710                 715                 720
Phe Phe Val Phe Leu Leu Pro Val Ser Phe Gly Met Asp Gly Pro Asn
                725                 730                 735
Ala Asp Phe Lys Tyr Leu Ser Leu Leu Ser Thr Trp Arg Ile Ser Asp
            740                 745                 750
<210>87
<211>2265
<212>DNA
<213>Ogataea minuta
<400>87
atggggccca aaataaagac cggcaagaaa cccaatgcgg tggaatcagt ggttgttgac     60
aaaaagggga gtgtctcgtt ggagggcaag attgacaccc cagtcaagaa ctcctcgatc    120
gatccctcaa tggagatcta ctacaagctg acgaatacaa tgttgacgct tctggctttg    180
gccactagat tctactacat ctggtacccc aacgaggtgg tgttcgatga agttcacttt    240
ggaaagtttg cctcgtacta cttggagaga acctatttct tcgatctcca ccctccattc    300
gccaagctcc tcattgcctt cgttggctat ctggttggtt tcagtgggaa attcaagttt    360
gacaacatcg gggacagcta tatcacccac tctattccat acatcccgtt gcgtgcgctt    420
tctgctgttc tgggatccct gaccgtgccg ctcatgttct ccacgttgca agagtgtggt    480
tactcaattc caacgtgcgc ttttggtgcc ctgctggttg tgtttgacaa cgctcatgct    540
gccgagacta gattgattct gctcgacgct acgctgatct tctcggttgc agcttctgtg    600
tactgctacg tgagattcac aaagcaaaga caccagcctt ttaccgcaac ctggtacaag    660
tggttggttt tgaccggtgt ctcgttgtcc tgtgtcattt ccaccaaata cgtgggtgtt    720
ttcacctttg cctgcgttgg tgtggctgtg gtttgggact tgtgggagct tttggatatt    780
aagaagggcc tcacaattag agttttggct agacattttg tccacagagc catcggcctc    840
attttgctgc cgttcattat ttacttgggc tggttttaca tccactttgc cattctgacc    900
aaatcgggac cgggagatcc tttcatgagc gcagacttcc aagaaacttt gggagactct    960
cctctcacaa gagaagcaag agaggtcaac taccatgata tcataacggt caaacacaaa   1020
gacactgagt gtttattgca ctcgcatcct ttcaactatc cactacgtta cgatgacgga   1080
agaatttctt cgcaaggcca gcaggtgact tgtatgaaag attacacaga cgttaacaac   1140
tactgggaaa ttcttcctgc taaagcttct gacgaaactg tgaacctcgg tctcgctgtc   1200
aaacaaggag acactttcag attgagacac gttgagacag gcggattttt actcactcat   1260
gacgttgctt ctcccctttt cccgaccaac gaggagttta ctgtcatgag cgctgaagaa   1320
gcggattcta caaggttcaa cgacactttg ttcagatttg atccgttcga caagaggaag   1380
aacgacgtgc tcaagaccaa ggcatccgtg gtcaaagttt tccacgttcc taccattgtc   1440
actatgtgga ctcacgatga tcagctactt ccagaatggg gcttcaacca acaggaggtc   1500
aacggaaaca aaaaggttgc ggactccgat aactactgga ctattgactc tatcattggt   1560
ttgtctggcg aaagagccaa gtacgttcca aaagaagtga aacgtttgcc attccttacc   1620
aaatggaaag agctgcaact cactatgttt gaacaaaaca acaaattgag ttcgagccat   1680
ccatttgcat cccaacctga gtcatggcct ttgtcgttgt ccggtgtctc gttctggact    1740
aagaatgata cccgcgaaca aatctacttc attggaaatc ttttcggctg gtggttagaa    1800
gccggactgc ttctgtgtta cctaggaata ttgctggcag accaactcac gagacgcaga    1860
aatgtgactg ttttgagcac tagagccaga gctaggttgt acaaaaacat cggatttttc    1920
ttctgcggat gggccaccca ctacttccca ttcttcctca tgtcaagaca aaagttcctg    1980
catcattatt tgcctgcgca cctgctggct gcgctgtttt cggcgtcctt gttggaattc    2040
attttcaccg ataacagaca cgaggagctc agggatccaa aagataagtc tgagccagga    2100
aaggtcaact ggatcctata cctgtcgtgc ctgattctgc ttgtgacagt cttagttgga    2160
ttctacgtct tccttgctcc gttgacctac ggaaacgttt cattgacccc tgaagaagtc    2220
atcaagagac aaattctcaa catcaaactg cattttgcta aatag                    2265
<210>88
<211>754
<212>PRT
<213>Ogataea minuta
<400>88
Met Gly Pro Lys Ile Lys Thr Gly Lys Lys Pro Asn Ala Val Glu Ser
1               5                   10                  15
Val Val Val Asp Lys Lys Gly Ser Val Ser Leu Glu Gly Lys Ile Asp
            20                  25                  30
Thr Pro Val Lys Asn Ser Ser Ile Asp Pro Ser Met Glu Ile Tyr Tyr
        35                  40                  45
Lys Leu Thr Asn Thr Met Leu Thr Leu Leu Ala Leu Ala Thr Arg Phe
    50                  55                  60
Tyr Tyr Ile Trp Tyr Pro Asn Glu Val Val Phe Asp Glu Val His Phe
65                  70                  75                  80
Gly Lys Phe Ala Ser Tyr Tyr Leu Glu Arg Thr Tyr Phe Phe Asp Leu
                85                  90                  95
His Pro Pro Phe Ala Lys Leu Leu Ile Ala Phe Val Gly Tyr Leu Val
            100                 105                 110
Gly Phe Ser Gly Lys Phe Lys Phe Asp Asn Ile Gly Asp Ser Tyr Ile
        115                 120                 125
Thr His Ser Ile Pro Tyr Ile Pro Leu Arg Ala Leu Ser Ala Val Leu
    130                 135                 140
Gly Ser Leu Thr Val Pro Leu Met Phe Ser Thr Leu Gln Glu Cys Gly
145                 150                 155                 160
Tyr Ser Ile Pro Thr Cys Ala Phe Gly Ala Leu Leu Val Val Phe Asp
                165                 170                 175
Asn Ala His Ala Ala Glu Thr Arg Leu Ile Leu Leu Asp Ala Thr Leu
            180                 185                 190
Ile Phe Ser Val Ala Ala Ser Val Tyr Cys Tyr Val Arg Phe Thr Lys
        195                 200                 205
Gln Arg His Gln Pro Phe Thr Ala Thr Trp Tyr Lys Trp Leu Val Leu
    2l0                 215                 220
Thr Gly Val Ser Leu Ser Cys Val Ile Ser Thr Lys Tyr Val Gly Val
225                 230                 235                 240
Phe Thr Phe Ala Cys Val Gly Val Ala Val Val Trp Asp Leu Trp Glu
                245                 250                 255
Leu Leu Asp Ile Lys Lys Gly Leu Thr Ile Arg Val Leu Ala Arg His
            260                 265                 270
Phe Val His Arg Ala Ile Gly Leu Ile Leu Leu Pro Phe Ile Ile Tyr
        275                 280                 285
Leu Gly Trp Phe Tyr Ile His Phe Ala Ile Leu Thr Lys Ser Gly Pro
    290                 295                 300
Gly Asp Pro Phe Met Ser Ala Asp Phe Gln Glu Thr Leu Gly Asp Ser
305                 310                 315                 320
Pro Leu Thr Arg Glu Ala Arg Glu Val Asn Tyr His Asp Ile Ile Thr
                325                 330                 335
Val Lys His Lys Asp Thr Glu Cys Leu Leu His Ser His Pro Phe Asn
            340                 345                 350
Tyr Pro Leu Arg Tyr Asp Asp Gly Arg Ile Ser Ser Gln Gly Gln Gln
        355                 360                 365
Val Thr Cys Met Lys Asp Tyr Thr Asp Val Asn Asn Tyr Trp Glu Ile
    370                 375                 380
Leu Pro Ala Lys Ala Ser Asp Glu Thr Val Asn Leu Gly Leu Ala Val
385                 390                 395                 400
Lys Gln Gly Asp Thr Phe Arg Leu Arg His Val Glu Thr Gly Gly Phe
                405                 410                 415
Leu Leu Thr His Asp Val Ala Ser Pro Leu Phe Pro Thr Asn Glu Glu
            420                 425                 430
Phe Thr Val Met Ser Ala Glu Glu Ala Asp Ser Thr Arg Phe Asn Asp
        435                 440                 445
Thr Leu Phe Arg Phe Asp Pro Phe Asp Lys Arg Lys Asn Asp Val Leu
    450                 455                 460
Lys Thr Lys Ala Ser Val Val Lys Val Phe His Val Pro Thr Ile Val
465                 470                 475                 480
Thr Met Trp Thr His Asp Asp Gln Leu Leu Pro Glu Trp Gly Phe Asn
                485                 490                 495
Gln Gln Glu Val Asn Gly Asn Lys Lys Val Ala Asp Ser Asp Asn Tyr
            500                 505                 510
Trp Thr Ile Asp Ser Ile Ile Gly Leu Ser Gly Glu Arg Ala Lys Tyr
        515                 520                 525
Val Pro Lys Glu Val Lys Arg Leu Pro Phe Leu Thr Lys Trp Lys Glu
    530                 535                 540
Leu Gln Leu Thr Met Phe Glu Gln Asn Asn Lys Leu Ser Ser Ser His
545                 550                 555                 560
Pro Phe Ala Ser Gln Pro Glu Ser Trp Pro Leu Ser Leu Ser Gly Val
                565                 570                 575
Ser Phe Trp Thr Lys Asn Asp Thr Arg Glu Gln Ile Tyr Phe Ile Gly
            580                 585                 590
Asn Leu Phe Gly Trp Trp Leu Glu Ala Gly Leu Leu Leu Cys Tyr Leu
        595                 600                 605
Gly Ile Leu Leu Ala Asp Gln Leu Thr Arg Arg Arg Asn Val Thr Val
    610                 615                 620
Leu Ser Thr Arg Ala Arg Ala Arg Leu Tyr Lys Asn Ile Gly Phe Phe
625                 630                 635                 640
Phe Cys Gly Trp Ala Thr His Tyr Phe Pro Phe Phe Leu Met Ser Arg
                645                 650                 655
Gln Lys Phe Leu His His Tyr Leu Pro Ala His Leu Leu Ala Ala Leu
            660                 665                 670
Phe Ser Ala Ser Leu Leu Glu Phe Ile Phe Thr Asp Asn Arg His Glu
        675                 680                 685
Glu Leu Arg Asp Pro Lys Asp Lys Ser Glu Pro Gly Lys Val Asn Trp
    690                 695                 700
Ile Leu Tyr Leu Ser Cys Leu Ile Leu Leu Val Thr Val Leu Val Gly
705                 710                 715                 720
Phe Tyr Val Phe Leu Ala Pro Leu Thr Tyr Gly Asn Val Ser Leu Thr
                725                 730                 735
Pro Glu Glu Val Ile Lys Arg Gln Ile Leu Asn Ile Lys Leu His Phe
            740                 745                 750
Ala Lys
<210>89
<211>2199
<212>DNA
<213>Ogataea minuta
<400>89
atggacgaga aaaacatctc tggcttagaa cgcctaggca ccggcccaga gttcacactc     60
gtgcagggcc cgagacgcaa ctacctccgt ctgccggaaa aggcggggct tccaagccgc    120
actagaaagg agaagctcca ggttctgtgc gtcattctgc tcgcgctcac cacgagactc    180
gtctctctga accatccgtc gtcggtcgtc tacgacgagc taactaccgg aaacatcgtc    240
aacaactacc tccatggaca ctattttgtc gatgcagatc ctccttttgt caaaattcta    300
tacactgctg tcgcccaaat atcgcagtac acgggcgcgt tccaattcca ctctgctggc    360
cagtcgtatc tgaacgaaga cctcgagccg gagttcccat acgtggcact ccgggtgttc    420
agcggcctct gcagcgtggc aaccgttctc ctggcataca aaactctcag agccacggga    480
gtcagacacc tgattgctct gttcggcgcc tttctgattg cactagaagg ctcgatgatt    540
acgcaatcaa gatttttcat gcaaacggct cacgtcgtgt tcttcaccgg cttggccgtt    600
ggaatgtcca aaacgtcaga cctgtttgaa ccctcgagcg caaaatggct caaacacacc    660
gcagcggccg gcctcggcgt ggcgtttcta atttcgtccg cgtggtcggg tcttttcacg    720
gctgtttggt tggttctcgt caccctgaga agagtctggt acctcaccgg cgacgttacg    780
acaaatccaa gaaccacgtt cctcagatac gcgcttcccc gctttgctct tattgttgcg    840
gcgccagtgg ccttctacct gtgggtgttc aaagtgcatc tggacttgct tccagtggct    900
ggtcccggct acccgttcat gtccgcggag ttccagcacg ggctggtcgg cacccatctc    960
aacaacattt ctgccgaagt ctcgtatggc tccacagttt ccattagaca cttgcacacg   1020
gggaagtacc tgcactccga gaacaaaacg taccctaaaa caggacacca gcgggtcacc   1080
acattcggcg accaggactt caacaacctg ttttacgtcg agatgagggt caagtccgaa   1140
cgcggcgagc tcgcacggaa agtcaaagct gtcgagagcg gcagacaaat acgtcttttc   1200
cacaatgcca cccagaagta cctgtttatc gacccggaca acaagcctcc tctctccgag   1260
acagactata acaaggaagt gagcacgttt ggaaacgctt cctgggtggg cgagaactac   1320
ctcaacttcg agcttctgct tgccccgggc ttctccaaga ccgaggtggg caagaaaaga   1380
gtgcgggccg tcgagtctgt cttccagctg tacaacgtca agaacaagtg ctatctgctg   1440
gggaccgaga acaggcttcc gagctgggca gacggggaaa acgaggtcgt ttgcatcgag   1500
aaacctattt tcgaaagatc gttgtggtac tttgaaacca atctccacga caagttcacc   1560
cccgcacggg cccaggtcgc tttcaggcag cagacgttct gggacaagat tctcgaaatt   1620
cacaaagtca tggcagatct gctcgcacaa aacacccatg acgacgccaa cagcaccgct   1680
cctcgggatt ggttcttctt cagaaaggga atcaggtact gggcagaaag tcaggccatg   1740
gtatatctca ctgggaaccc ggttgtctac tcgttgacgg cgctaggcac tgtgggattc   1800
ttggtgttca aactcggtca tctatgttcg ttcaacccga ataagtcgcc agactactcc   1860
agcgacttcc tcaagttcga ctaccacgct caggaatttc ttctcggata cctgctgaac   1920
tggcttcctc acgcgctttc aaagacaaac acatacgtgt tcgagtacca gccggcgttg    1980
tacttcggtg ttcttctgtc ctgtcagtcg ctagagtacc tggcctccaa gaacctgaag    2040
ctgtgctatg tgtttgcggc cgcggttgca ctgctcacag cagctttctt ccgtttgtcg    2100
gcaccgttga tgtacggact gaagtggcag gagttgtact gcgtcgctgt ttcaacagct    2160
gccagacagt cgatcgactg ctccgtctat agtgagtag                           2199
<210>90
<211>732
<212>PRT
<213>Ogataea minuta
<400>90
Met Asp Glu Lys Asn Ile Ser Gly Leu Glu Arg Leu Gly Thr Gly Pro
1               5                   10                  15
Glu Phe Thr Leu Val Gln Gly Pro Arg Arg Asn Tyr Leu Arg Leu Pro
            20                  25                  30
Glu Lys Ala Gly Leu Pro Ser Arg Thr Arg Lys Glu Lys Leu Gln Val
        35                  40                  45
Leu Cys Val Ile Leu Leu Ala Leu Thr Thr Arg Leu Val Ser Leu Asn
    50                  55                  60
His Pro Ser Ser Val Val Tyr Asp Glu Leu Thr Thr Gly Asn Ile Val
65                  70                  75                  80
Asn Asn Tyr Leu His Gly His Tyr Phe Val Asp Ala Asp Pro Pro Phe
                85                  90                  95
Val Lys Ile Leu Tyr Thr Ala Val Ala Gln Ile Ser Gln Tyr Thr Gly
            100                 105                 110
Ala Phe Gln Phe His Ser Ala Gly Gln Ser Tyr Leu Asn Glu Asp Leu
        115                 120                 125
Glu Pro Glu Phe Pro Tyr Val Ala Leu Arg Val Phe Ser Gly Leu Cys
    130                 135                 140
Ser Val Ala Thr Val Leu Leu Ala Tyr Lys Thr Leu Arg Ala Thr Gly
145                 150                 155                 160
Val Arg His Leu Ile Ala Leu Phe Gly Ala Phe Leu Ile Ala Leu Glu
                165                 170                 175
Gly Ser Met Ile Thr Gln Ser Arg Phe Phe Met Gln Thr Ala His Val
            180                 185                 190
Val Phe Phe Thr Gly Leu Ala Val Gly Met Ser Lys Thr Ser Asp Leu
        195                 200                 205
Phe Glu Pro Ser Ser A la Lys Trp Leu Lys His Thr Ala Ala Ala Gly
    210                 215                 220
Leu Gly Val Ala Phe Leu Ile Ser Ser Ala Trp Ser Gly Leu Phe Thr
225                 230                 235                 240
Ala Val Trp Leu Val Leu Val Thr Leu Arg Arg Val Trp Tyr Leu Thr
                245                 250                 255
Gly Asp Val Thr Thr Asn Pro Arg Thr Thr Phe Leu Arg Tyr Ala Leu
            260                 265                 270
Pro Arg Phe Ala Leu Ile Val Ala Ala Pro Val Ala Phe Tyr Leu Trp
        275                 280                 285
Val Phe Lys Val His Leu Asp Leu Leu Pro Val Ala Gly Pro Gly Tyr
    290                 295                 300
Pro Phe Met Ser Ala Glu Phe Gln His Gly Leu Val Gly Thr His Leu
305                 310                 315                 320
Asn Asn Ile Ser Ala Glu Val Ser Tyr Gly Ser Thr Val Ser Ile Arg
                325                 330                 335
His Leu His Thr Gly Lys Tyr Leu His Ser Glu Asn Lys Thr Tyr Pro
            340                 345                 350
Lys Thr Gly His Gln Arg Val Thr Thr Phe Gly Asp Gln Asp Phe Asn
        355                 360                 365
Asn Leu Phe Tyr Val Glu Met Arg Val Lys Ser Glu Arg Gly Glu Leu
    370                 375                 380
Ala Arg Lys Val Lys Ala Val Glu Ser Gly Arg Gln Ile Arg Leu Phe
385                 390                 395                 400
His Asn Ala Thr Gln Lys Tyr Leu Phe Ile Asp Pro Asp Asn Lys Pro
                405                 410                 415
Pro Leu Ser Glu Thr Asp Tyr Asn Lys Glu Val Ser Thr Phe Gly Asn
            420                 425                 430
Ala Ser Trp Val Gly Glu Asn Tyr Leu Asn Phe Glu Leu Leu Leu Ala
        435                 440                 445
Pro Gly Phe Ser Lys Thr Glu Val Gly Lys Lys Arg Val Arg Ala Val
    450                 455                 460
Glu Ser Val Phe Gln Leu Tyr Asn Val Lys Asn Lys Cys Tyr Leu Leu
465                 470                 475                 480
Gly Thr Glu Asn Arg Leu Pro Ser Trp Ala Asp Gly Glu Asn Glu Val
               485                 490                 495
Val Cys Ile Glu Lys Pro Ile Phe Glu Arg Ser Leu Trp Tyr Phe Glu
            500                 505                 510
Thr Asn Leu His Asp Lys Phe Thr Pro Ala Arg Ala Gln Val Ala Phe
        515                 520                 525
Arg Gln Gln Thr Phe Trp Asp Lys Ile Leu Glu Ile His Lys Val Met
    530                 535                 540
Ala Asp Leu Leu Ala Gln Asn Thr His Asp Asp Ala Asn Ser Thr Ala
545                 550                 555                 560
Pro Arg Asp Trp Phe Phe Phe Arg Lys Gly Ile Arg Tyr Trp Ala Glu
                565                 570                 575
Ser Gln Ala Met Val Tyr Leu Thr Gly Asn Pro Val Val Tyr Ser Leu
            580                 585                 590
Thr Ala Leu Gly Thr Val Gly Phe Leu Val Phe Lys Leu Gly His Leu
        595                 600                 605
Cys Ser Phe Asn Pro Asn Lys Ser Pro Asp Tyr Ser Ser Asp Phe Leu
    610                 615                 620
Lys Phe Asp Tyr His Ala Gln Glu Phe Leu Leu Gly Tyr Leu Leu Asn
625                 630                 635                 640
Trp Leu Pro His Ala Leu Ser Lys Thr Asn Thr Tyr Val Phe Glu Tyr
                645                 650                 655
Gln Pro Ala Leu Tyr Phe Gly Val Leu Leu Ser Cys Gln Ser Leu Glu
            660                 665                 670
Tyr Leu Ala Ser Lys Asn Leu Lys Leu Cys Tyr Val Phe Ala Ala Ala
        675                 680                 685
Val Ala Leu Leu Thr Ala Ala Phe Phe Arg Leu Ser Ala Pro Leu Met
    690                 695                 700
Tyr Gly Leu Lys Trp Gln Glu Leu Tyr Cys Val Ala Val Ser Thr Ala
705                 710                 715                 720
Ala Arg Gln Ser Ile Asp Cys Ser Val Tyr Ser Glu
                725                 730
<210>91
<211>2241
<212>DNA
<213>Ogataea minuta
<400>91
atgtccgagt cagagctgag aaaccgcaaa gctactctgg gaactgcgtt tcaagatgag     60
tcgactggac cgaaagaaga gagtcacttg gatcaaaaat cgttagccag aagagggtgg    120
gtccaactga tcaccacgta tgttgaacca gtggcaggtc cccttttctt cactgtcctg    180
gctgcgtatc tgagactcta tgatctcaaa gccaacaatc gagtggtctg ggacgaggct    240
cattttggca aatttggagc ccagtacttg agacacgaat tttaccacga cgtccatccg    300
ccgctgggga aaatgctgtg cggactgagc gagtatctgg caggctacaa tggcagttct    360
gagggtttca atttcgagag cggaaaagaa tatccggatc accttgacta tgcctcgatg    420
agatcgttcg ggacttggtt cagcactctg gtcattcctg tctgctattt cacatgcaaa    480
tcgctcaatt tcaacctaca gaccacctat ctagtttcga caatgtgctg tctggagaac    540
tcgtacattg cgctgggaaa gttcatactg ctggactcca tgctgatgtt gttcacgggg    600
actacgtttt tctgtctcgt caaaacccac acgctgcggg cgcaggagtt ctccaccaga    660
tggactcttt ggatgtgtct gaccggagtt tcaactggct gtgtttgctc ggtgaaatgg    720
gtcggtctgt ttgtcacgct acttgttgga gcatacacgg tgctagagct atggctgaaa    780
ttctggtcca aggagttcaa gacagccagg tacttgaaaa gctgggtttt cagagcagtg    840
agtctgatct tcatcccagc tctcgtttat ttgatattct tcaaggtaca tttctcgctc    900
ctgacccgga ccgggacggg agcgggctct ttgtcgtctc tttaccaggc cagcatggag    960
gacgcggaca tcctggatta cccgagaaac gttgctattg gctcgcgcat cactctcaga   1020
tctcaaggcc cctcgcccag tcttttgcac tcgcaccagt ctgtctatcc cgcaggatcg   1080
gaacagtacc aggtgacaac ctacgggttc aaagactcca acaacaactt tctggtgaaa   1140
aaagcccgga cacctttcaa atatggagag ttcgtctcca acggcgacct gattcgactt   1200
cagcacgagc taacccgagg aaacctccat tctcacgcca tcaacggaca tgtttccaag   1260
cagttctggg aggtgagcgg gtacggaaac gaggaaatcg gggacgacaa ggatgattgg   1320
gaggtgatta ttgcggagca gctcaaatct cctaactcga cctattcagc gctgcacgag   1380
tcgtccccag aattctaccg cacggtccac ccgatctcca ctagcttcaa gttgcgccac   1440
aaggttttag gctgctacct ggccaccaca gggcactcgt atccgacatg gggctttaaa   1500
caaggcgagg tgatctgtaa accggcggag tcgctcttga acccgctgga caaatcgacc   1560
tggtggaacg tcgagcttca cgacaacagc ggtctgaaag tagacccagg ctaccaatac   1620
ccccgtcccc ggttcttttg ggactttctc tcgattcaaa tggccatgat ggcctcgaac   1680
aacgctttgg ttccagaccc gcacaaacag gacgatatag cctccagttg gtgggagtgg   1740
ccgacgttga aacaggggct gaggatgtgc tcttggtctc acggggtggt gcggtactac   1800
ctcctgggaa atccgttttc tacgtggttc agcacttttt gcattggcgc tctgctggtg   1860
ctgatggctc gctggacgct cctctggcaa agacagatcc tcgttctcac cgaaaaccag   1920
gcctggactt taaccatgaa agccgttgtt ccgctcatgg ggtgggcttt ccactacctt   1980
ccattcgtcg tgatgggaag ggtgacgtat taccaccatt acatgccggc tttgtacttt   2040
gctttcttcg tgacgggctt tgtagtcgaa cattcggtcg ctcgtttcgg aggggtttac   2100
acgggaaagt tggtctatct agtactttgg ggctgtgtgt gctacagctt ctggctgttc   2160
agtccgcttt gtttggggat gcacggaatg acgtcgctct atcgtcatct caactgggtt   2220
tccacctggc gtatagctta g                                             2241
<210>92
<211>746
<212>PRT
<213>Ogataea minuta
<400>92
Met Ser Glu Ser Glu Leu Arg Asn Arg Lys Ala Thr Leu Gly Thr Ala
1               5                   10                  15
Phe Gln Asp Glu Ser Thr Gly Pro Lys Glu Glu Ser His Leu Asp Gln
            20                  25                  30
Lys Ser Leu Ala Arg Arg Gly Trp Val Gln Leu Ile Thr Thr Tyr Val
        35                  40                  45
Glu Pro Val Ala Gly Pro Leu Phe Phe Thr Val Leu Ala Ala Tyr Leu
    50                  55                  60
Arg Leu Tyr Asp Leu Lys Ala Asn Asn Arg Val Val Trp Asp Glu Ala
65                  70                  75                  80
His Phe Gly Lys Phe Gly Ala Gln Tyr Leu Arg His Glu Phe Tyr His
                85                  90                  95
Asp Val His Pro Pro Leu Gly Lys Met Leu Cys Gly Leu Ser Glu Tyr
            100                 105                 110
Leu Ala Gly Tyr Asn Gly Ser Ser Glu Gly Phe Asn Phe Glu Ser Gly
        115                 120                 125
Lys Glu Tyr Pro Asp His Leu Asp Tyr Ala Ser Met Arg Ser Phe Gly
    130                 135                 140
Thr Trp Phe Ser Thr Leu Val Ile Pro Val Cys Tyr Phe Thr Cys Lys
145                 150                 155                 160
Ser Leu Asn Phe Asn Leu Gln Thr Thr Tyr Leu Val Ser Thr Met Cys
                165                 170                 175
Cys Leu Glu Asn Ser Tyr Ile Ala Leu Gly Lys Phe Ile Leu Leu Asp
            180                 185                 190
Ser Met Leu Met Leu Phe Thr Gly Thr Thr Phe Phe Cys Leu Val Lys
        195                 200                 205
Thr His Thr Leu Arg Ala Gln Glu Phe Ser Thr Arg Trp Thr Leu Trp
    210                 215                 220
Met Cys Leu Thr Gly Val Ser Thr Gly Cys Val Cys Ser Val Lys Trp
225                 230                 235                 240
Val Gly Leu Phe Val Thr Leu Leu Val Gly Ala Tyr Thr Val Leu Glu
                245                 250                 255
Leu Trp Leu Lys Phe Trp Ser Lys Glu Phe Lys Thr Ala Arg Tyr Leu
            260                 265                 270
Lys Ser Trp Val Phe Arg Ala Val Ser Leu Ile Phe Ile Pro Ala Leu
        275                 280                 285
Val Tyr Leu Ile Phe Phe Lys Val His Phe Ser Leu Leu Thr Arg Thr
    290                 295                 300
Gly Thr Gly Ala Gly Ser Leu Ser Ser Leu Tyr Gln Ala Ser Met Glu
305                 310                 315                 320
Asp Ala Asp Ile Leu Asp Tyr Pro Arg Asn Val Ala Ile Gly Ser Arg
                325                 330                 335
Ile Thr Leu Arg Ser Gln Gly Pro Ser Pro Ser Leu Leu His Ser His
            340                 345                 350
Gln Ser Val Tyr Pro Ala Gly Ser Glu Gln Tyr Gln Val Thr Thr Tyr
        355                 360                 365
Gly Phe Lys Asp Ser Asn Asn Asn Phe Leu Val Lys Lys Ala Arg Thr
    370                 375                 380
Pro Phe Lys Tyr Gly Glu Phe Val Ser Asn Gly Asp Leu Ile Arg Leu
385                 390                 395                 400
Gln His Glu Leu Thr Arg Gly Asn Leu His Ser His Ala Ile Asn Gly
                405                 410                 415
His Val Ser Lys Gln Phe Trp Glu Val Ser Gly Tyr Gly Asn Glu Glu
            420                 425                 430
Ile Gly Asp Asp Lys Asp Asp Trp Glu Val Ile Ile Ala Glu Gln Leu
        435                 440                 445
Lys Ser Pro Asn Ser Thr Tyr Ser Ala Leu His Glu Ser Ser Pro Glu
    450                 455                 460
Phe Tyr Arg Thr Val His Pro Ile Ser Thr Ser Phe Lys Leu Arg His
465                 470                 475                 480
Lys Val Leu Gly Cys Tyr Leu Ala Thr Thr Gly His Ser Tyr Pro Thr
                485                 490                 495
Trp Gly Phe Lys Gln Gly Glu Val Ile Cys Lys Pro Ala Glu Ser Leu
            500                 505                 510
Leu Asn Pro Leu Asp Lys Ser Thr Trp Trp Asn Val Glu Leu His Asp
        515                 520                 525
Asn Ser Gly Leu Lys Val Asp Pro Gly Tyr Gln Tyr Pro Arg Pro Arg
    530                 535                 540
Phe Phe Trp Asp Phe Leu Ser Ile Gln Met Ala Met Met Ala Ser Asn
545                 550                 555                 560
Asn Ala Leu Val Pro Asp Pro His Lys Gln Asp Asp Ile Ala Ser Ser
                565                 570                 575
Trp Trp Glu Trp Pro Thr Leu Lys Gln Gly Leu Arg Met Cys Ser Trp
            580                 585                 590
Ser His Gly Val Val Arg Tyr Tyr Leu Leu Gly Asn Pro Phe Ser Thr
        595                 600                 605
Trp Phe Ser Thr Phe Cys Ile Gly Ala Leu Leu Val Leu Met Ala Arg
    610                 615                 620
Trp Thr Leu Leu Trp Gln Arg Gln Ile Leu Val Leu Thr Glu Asn Gln
625                 630                 635                 640
Ala Trp Thr Leu Thr Met Lys Ala Val Val Pro Leu Met Gly Trp Ala
                645                 650                 655
Phe His Tyr Leu Pro Phe Val Val Met Gly Arg Val Thr Tyr Tyr His
            660                 665                 670
His Tyr Met Pro Ala Leu Tyr Phe Ala Phe Phe Val Thr Gly Phe Val
        675                 680                 685
Val Glu His Ser Val Ala Arg Phe Gly Gly Val Tyr Thr Gly Lys Leu
    690                 695                 700
Val Tyr Leu Val Leu Trp Gly Cys Val Cys Tyr Ser Phe Trp Leu Phe
705                 710                 715                 720
Ser Pro Leu Cys Leu Gly Met His Gly Met Thr Ser Leu Tyr Arg His
                725                 730                 735
Leu Asn Trp Val Ser Thr Trp Arg Ile Ala
            740                 745
<210>93
<211>30
<212>DNA
<213>人工序列
<220>
<223>引物
<400>93
caagcttgga cctacaacac gtccgaagaa                                      30
<210>94
<211>30
<212>DNA
<213>人工序列
<220>
<223>引物
<400>94
cggtaccggt ttgatacctt gggtggcaca                                      30
<210>95
<211>31
<212>DNA
<213>人工序列
<220>
<223>引物
<400>95
gaagcttact acataattcg tgtacgtgtt c                                    31
<210>96
<211>31
<212>DNA
<213>人工序列
<220>
<223>引物
<400>96
cggtaccgtc gccgtattgg tcagcaatct c                                    31
<210>97
<211>39
<212>DNA
<213>人工序列
<220>
<223>引物
<400>97
gtcatgagat ccaagctgat ccctcaatgg agatctact                            39
<210>98
<211>39
<212>DNA
<213>人工序列
<220>
<223>引物
<400>98
ggtgtgtggg ggatcgggat gcaaatggat ggctcgaac                            39
<210>99
<211>39
<212>DNA
<213>人工序列
<220>
<223>引物
<400>99
gacggtatcg ataagcttga tgcgcggcct tccgacctt                            39
<210>100
<211>39
<212>DNA
<213>人工序列
<220>
<223>引物
<400>100
ctggggaagc tcggatccgg ctcgaggtct tcgttcaga                            39
<210>101
<211>38
<212>DNA
<213>人工序列
<220>
<223>引物
<400>101
ctagttctag agcggcccag gtcgctttca ggcagcag                             38
<210>102
<211>40
<212>DNA
<213>人工序列
<220>
<223>引物
<400>102
caccgcggtg gcggccaagc ttgggtaccg gctcgcgtag                           40
<210>103
<211>34
<212>DNA
<213>人工序列
<220>
<223>引物
<400>103
gcagcccggg ggatccacga aaccacgtcc tact                                 34
<210>104
<211>33
<212>DNA
<213>人工序列
<220>
<223>引物
<400>104
ggggaagctc ggatcgactc atcttgaaac gca                                  33
<210>105
<211>33
<212>DNA
<213>人工序列
<220>
<223>引物
<400>105
agttctagag cggccttacc accattacat gcc                                  33
<210>106
<211>40
<212>DNA
<213>人工序列
<220>
<223>引物
<400>106
aattggagct ccaccgcggc cgcaacttac tcgacgctaa                      40
<210>107
<211>25
<212>DNA
<213>人工序列
<220>
<223>引物
<400>107
gaacggcact ggtcaacttg gccat                                      25
<210>108
<211>25
<212>DNA
<213>人工序列
<220>
<223>引物
<400>108
cttcgtggcc gaggagcagg actga                                      25
<210>109
<211>23
<212>DNA
<213>人工序列
<220>
<223>引物
<400>109
gaattctagc cgagcatgag cta                                        23
<210>110
<211>26
<212>DNA
<213>人工序列
<220>
<223>引物
<400>110
cgttcagact cttgttgatt ttccac                                     26
<210>111
<211>25
<212>DNA
<213>人工序列
<220>
<223>引物
<400>111
gctgtgccac tgcacgcctc gactc                                       25
<210>112
<211>24
<212>DNA
<213>人工序列
<220>
<223>引物
<400>112
cttgtccctc ttgaatggcg agtg                                        24
<210>113
<211>20
<212>DNA
<213>人工序列
<220>
<223>引物
<400>113
ggaacacgcc aaacatcatg                                             20
<210>114
<211>19
<212>DNA
<213>人工序列
<220>
<223>引物
<400>114
cacaagcaga atcaggcac                                              19
<210>115
<211>24
<212>DNA
<213>人工序列
<220>
<223>引物
<400>115
cggtgacgac ttcgactagt cgag                                        24
<210>116
<211>26
<212>DNA
<213>人工序列
<220>
<223>引物
<400>116
cggtgctgtt ggcgtcgtca tgggtg                                         26
<210>117
<211>25
<212>DNA
<213>人工序列
<220>
<223>引物
<400>117
ggcgcgttcc aattccactc tgctg                                          25
<210>118
<211>26
<212>DNA
<213>人工序列
<220>
<223>引物
<400>118
cgacgagtcc tctcaccagg aggttg                                         26
<210>119
<211>18
<212>DNA
<213>人工序列
<220>
<223>引物
<400>119
tgtgggtgcg atcctgag                                                  18
<210>120
<211>20
<212>DNA
<213>人工序列
<220>
<223>引物
<400>120
gccgtcgttg gagcaaaact                                                 20
<210>121
<211>18
<212>DNA
<213>人工序列
<220>
<223>引物
<400>121
gcatgtgcca ctgctaaa                                                   18
<210>122
<211>19
<212>DNA
<213>人工序列
<220>
<223>引物
<400>122
gaccaacttt cccgtgtaa                                                  19

Claims (46)

1.一种转化的宿主细胞,其包含激活的HAC1基因和RRBP1基因。
2.根据权利要求1的转化的宿主细胞,其包含以下激活的HAC1基因(1)和RRBP1基因(2):
(1)选自下面(a)至(d)的激活的HAC1基因:
(a)编码由SEQ ID NO:23所示的氨基酸序列组成的蛋白的基因;
(b)编码由与SEQ ID NO:23所示的氨基酸序列具有至少70%同源性的氨基酸序列组成、且具有激活解折叠蛋白应答(UPR)的功能的蛋白的基因;
(c)编码由通过缺失、置换和/或添加一个或几个氨基酸从SEQ ID NO:23所示氨基酸序列衍生的氨基酸序列组成、且具有激活UPR的功能的蛋白的基因;和
(d)在严格条件下与由SEQ ID NO:22所示核苷酸序列或其互补核苷酸序列组成的DNA杂交、且编码具有激活UPR的功能的蛋白的基因;和
(2)选自下面(e)至(h)的RRBP1基因:
(e)编码人或狗来源的RRBP1的基因;
(f)编码由与人或狗来源的RRBP1的氨基酸序列具有至少70%同源性的氨基酸序列组成、且具有核糖体结合活性的蛋白的基因;
(g)编码由通过缺失、置换和/或添加一个或几个氨基酸从人或狗来源的RRBP1的氨基酸序列衍生的氨基酸序列组成、且具有核糖体结合活性的蛋白的基因;和
(h)在严格条件下与由人或狗来源的RRBP1基因的核苷酸序列或其互补核苷酸序列组成的基因杂交、且编码具有核糖体结合活性的蛋白的基因。
3.根据权利要求1的转化细胞,其包含以下激活的HAC1基因(1)和RRBP1基因(2):
(1)选自下面(i)至(1)的激活的HAC1基因:
(i)编码啤酒糖酵母、里氏木霉或构巢曲霉的激活的HAC1蛋白的基因;
(j)编码由与啤酒糖酵母、里氏木霉或构巢曲霉的激活的HAC1蛋白的氨基酸序列具有至少70%同源性的氨基酸序列组成、且具有激活UPR的功能的蛋白的基因;
(k)编码由通过缺失、置换和/或添加一个或几个氨基酸从啤酒糖酵母、里氏木霉或构巢曲霉的激活的HAC1蛋白的氨基酸序列衍生的氨基酸序列组成、且具有激活UPR的功能的蛋白的基因;和
(l)在严格条件下与由编码啤酒糖酵母、里氏木霉或构巢曲霉的激活的HAC1蛋白的基因的核苷酸序列或其互补核苷酸序列组成的基因杂交、且编码具有激活UPR的功能的蛋白的基因;和
(2)选自下面(e)至(h)的RRBP1基因:
(e)编码人或狗来源的RRBP1的基因;
(f)编码由与人或狗来源的RRBP1的氨基酸序列具有至少70%同源性的氨基酸序列组成、且具有核糖体结合活性的蛋白的基因;
(g)编码由通过缺失、置换和/或添加一个或几个氨基酸从人或狗来源的RRBP1的氨基酸序列衍生的氨基酸序列组成、且具有核糖体结合活性的蛋白的基因;和
(h)在严格条件下与由人或狗来源的RRBP1基因的核苷酸序列或其互补核苷酸序列组成的基因杂交、且编码具有核糖体结合活性的蛋白的基因。
4.根据权利要求1-3中任一项的转化的宿主细胞,其中所述宿主细胞是真核细胞。
5.根据权利要求4的转化的宿主细胞,其中所述真核细胞是酵母。
6.根据权利要求5的转化的宿主细胞,其中所述酵母是甲醇同化酵母。
7.根据权利要求6的转化的宿主细胞,其中所述甲醇同化酵母是Ogataea minuta。
8.根据权利要求5的转化的宿主细胞,其中所述酵母是啤酒糖酵母。
9.根据权利要求1-8中任一项的转化的宿主细胞,其包含导入其中的编码外源蛋白的基因。
10.根据权利要求9的转化的宿主细胞,其中所述外源蛋白是多聚体蛋白。
11.根据权利要求10的转化的宿主细胞,其中所述多聚体蛋白是异多聚体。
12.根据权利要求11的转化的宿主细胞,其中所述异多聚体是抗体或其功能片段。
13.一种生产蛋白的方法,其包含,在培养基中培养根据权利要求9-12中任一项的转化的宿主细胞,和从培养产物进行靶蛋白取样。
14.根据权利要求13的方法,其中在抑制蛋白O-甘露糖基转移酶(PMT)活性的条件下进行培养。
15.根据权利要求14的方法,其中通过向培养基中添加蛋白O-甘露糖基转移酶(PMT)活性的抑制剂,抑制PMT活性。
16.编码甲醇同化酵母的激活的HAC1蛋白的基因。
17.选自下面(a)至(d)的基因:
(a)编码由SEQ ID NO:23所示的氨基酸序列组成的蛋白的基因;
(b)编码由与SEQ ID NO:23所示的氨基酸序列具有至少70%同源性的氨基酸序列组成、且具有激活解折叠蛋白应答(UPR)的功能的蛋白的基因;
(c)编码由通过缺失、置换和/或添加一个或几个氨基酸从SEQID NO:23所示氨基酸序列衍生的氨基酸序列组成、且具有激活UPR的功能的蛋白的基因;和
(d)在严格条件下与由SEQ ID NO:22所示核苷酸序列或其互补核苷酸序列组成的DNA杂交、且编码具有激活UPR的功能的蛋白的基因。
18.包含根据权利要求17的基因的表达载体。
19.根据权利要求18的表达载体,它是pOMexPGHy/Hac1。
20包含激活的HAC1基因和RRBP1基因的表达载体。
21.根据权利要求20的表达载体,其中所述激活的HAC1基因是根据权利要求17的基因。
22.根据权利要求20的表达载体,其中所述激活的HAC1基因是编码啤酒糖酵母、里氏木霉或构巢曲霉的激活的HAC1蛋白的基因或其同源基因。
23.根据权利要求20的载体,它是YEp351GAP-II-aHAC1/p180。
24.根据权利要求20的表达载体,其中所述RRBP1基因是人或狗来源的RRBP1基因或其同源基因。
25.一种转化的宿主细胞,其中已经导入了根据权利要求18-24中的任一项的表达载体。
26.一种转化的宿主细胞,其中已经导入了包含激活的HAC1基因的表达载体和包含RRBP1基因的表达载体。
27.根据权利要求26的转化的宿主细胞,其中所述包含激活的HAC1基因的表达载体是根据权利要求18或19的表达载体。
28.根据权利要求26的转化的宿主细胞,其中所述激活的HAC1基因是编码啤酒糖酵母、里氏木霉或构巢曲霉的激活的HAC1蛋白的基因或其同源基因。
29.根据权利要求26的转化细胞,其中所述RRBP1基因是人或狗来源的RRBP1基因或其同源基因。
30.一种生产转化的宿主细胞的方法,其包含下述步骤:
(A)向宿主细胞中导入激活的HAC1基因;和
(B)向宿主细胞中导入RRBP1基因。
31.根据权利要求30的方法,其中所述激活的HAC1基因是下述基因中的任一个:
(1)根据权利要求17的基因;
(2)编码啤酒糖酵母、里氏木霉或构巢曲霉的激活的HAC1蛋白的基因;
(3)编码由与啤酒糖酵母、里氏木霉或构巢曲霉的激活的HAC1蛋白的氨基酸序列具有至少70%同源性的氨基酸序列组成、且具有激活UPR的功能的蛋白的基因;
(4)编码由通过缺失、置换和/或添加一个或几个氨基酸从啤酒糖酵母、里氏木霉或构巢曲霉的激活的HAC1蛋白的氨基酸序列衍生的氨基酸序列组成、且具有激活UPR的功能的蛋白的基因;和
(5)在严格条件下与由编码啤酒糖酵母、里氏木霉或构巢曲霉的激活的HAC1蛋白的基因的核苷酸序列或其互补核苷酸序列组成的基因杂交、且编码具有激活UPR的功能的蛋白的基因。
32.根据权利要求30的方法,其中所述RRBP1基因是下述基因中的任一个:
(1)编码人或狗来源的RRBP1的基因;
(2)编码由与人或狗来源的RRBP1的氨基酸序列具有至少70%同源性的氨基酸序列组成、且具有核糖体结合活性的蛋白的基因;
(3)编码由通过缺失、置换和/或添加一个或几个氨基酸从人或狗来源的RRBP1的氨基酸序列衍生的氨基酸序列组成、且具有核糖体结合活性的蛋白的基因;和
(4)在严格条件下与由人或狗来源的RRBP1基因的核苷酸序列或其互补核苷酸序列组成的基因杂交、且编码具有核糖体结合活性的蛋白的基因。
33.根据权利要求30-32中的任一项的方法,其中所述宿主细胞是真核细胞。
34.根据权利要求33的方法,其中所述真核细胞是酵母。
35.根据权利要求34的方法,其中所述酵母是甲醇同化酵母。
36.根据权利要求35的方法,其中所述甲醇同化酵母是Ogataeaminuta。
37.根据权利要求34的方法,其中所述酵母是啤酒糖酵母。
38.选自下面(a)至(d)的基因:
(a)编码由SEQ ID NO:70所示氨基酸序列组成的蛋白的基因;
(b)编码由与SEQ ID NO:70所示氨基酸序列具有至少70%同源性的氨基酸序列组成、且具有激活解折叠蛋白应答(UPR)的功能的蛋白的基因;
(c)编码由通过缺失、置换和/或添加一个或几个氨基酸从SEQID NO:70所示氨基酸序列衍生的氨基酸序列组成、且具有激活UPR的功能的蛋白的基因;和
(d)在严格条件下与由SEQ ID NO:69所示核苷酸序列或其互补核苷酸序列组成的DNA杂交、且编码具有激活UPR的功能的蛋白的基因。
39.包含根据权利要求38的基因的表达载体。
40.根据权利要求39的表达载体,它是pOMexPGHy/PpHac1。
41.一种生产蛋白的方法,其包含,在抑制O-糖链合成的条件下,在培养基中培养已经导入激活的HAC1基因和/或RRBP1基因和编码外源蛋白的基因的转化细胞,和从培养产物进行靶蛋白取样。
42.根据权利要求41的生产蛋白的方法,其中通过插入灭活PMT基因来抑制O-糖链合成。
43.根据权利要求41的生产蛋白的方法,其中通过向培养基中添加PMT活性的抑制剂来抑制O-糖链合成。
44.根据权利要求41的生产蛋白的方法,其中通过插入灭活PMT基因和向培养基中添加PMT活性的抑制剂来抑制O-糖链合成。
45.根据权利要求43或44的生产蛋白的方法,其中所述PMT活性的抑制剂是5-[[3,4-(1-苯基甲氧基)苯基]亚甲基]-4-氧代-2-硫代-3-噻唑烷乙酸或{(5Z)-4-氧代-5-3-(1-苯基乙氧基)-4-(2-苯基乙氧基)亚苄基]-2-硫代-1,3-噻唑烷-3-基}乙酸。
46.一种转化的宿主细胞,其具有插入灭活的PMT基因和导入其中的激活的HAC1基因。
47.根据权利要求46的转化细胞,其中所述宿主细胞是Ogataeaminuta。
CN2007800268649A 2006-05-16 2007-05-16 蛋白的高分泌生产方法 Expired - Fee Related CN101605887B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP136993/2006 2006-05-16
JP2006136993 2006-05-16
PCT/JP2007/060478 WO2007132949A1 (ja) 2006-05-16 2007-05-16 タンパク質の高分泌生産方法

Publications (2)

Publication Number Publication Date
CN101605887A true CN101605887A (zh) 2009-12-16
CN101605887B CN101605887B (zh) 2012-09-05

Family

ID=38694030

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2007800268649A Expired - Fee Related CN101605887B (zh) 2006-05-16 2007-05-16 蛋白的高分泌生产方法

Country Status (8)

Country Link
US (1) US8232377B2 (zh)
EP (1) EP2022855B1 (zh)
JP (1) JP5131666B2 (zh)
KR (1) KR20090031359A (zh)
CN (1) CN101605887B (zh)
AU (1) AU2007250735A1 (zh)
ES (1) ES2553162T3 (zh)
WO (1) WO2007132949A1 (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102965292A (zh) * 2012-12-10 2013-03-13 江南大学 一种葡萄糖氧化酶分泌增强型菌株及其应用
CN105358682A (zh) * 2013-03-26 2016-02-24 日本皮革株式会社 蛋白质的制造方法
CN110484572A (zh) * 2019-08-30 2019-11-22 浙江工业大学 一种提高酿酒酵母橙花叔醇产量的方法
CN110612352A (zh) * 2017-03-29 2019-12-24 贝林格尔·英格海姆Rcv两合公司 具有改变的膜脂组成的重组宿主细胞
CN113439087A (zh) * 2019-01-31 2021-09-24 丝芭博株式会社 重组蛋白的制备方法

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5967861B2 (ja) * 2007-04-03 2016-08-10 オキシレイン ユーケー リミテッド 分子のグリコシル化
US8409825B2 (en) 2007-10-31 2013-04-02 National Institute Of Advanced Industrial Science And Technology Method for high-level secretory production of protein
US8309325B2 (en) * 2008-05-20 2012-11-13 Merck Sharp & Dohme Corp. Efficient production of heterologous proteins using mannosyl transferase inhibitors
WO2010128143A1 (en) * 2009-05-07 2010-11-11 Novozymes Biopharma Dk A/S Method of controlling o-linked glycosylation of antibodies
EP2427488A1 (en) * 2009-05-07 2012-03-14 Novozymes Biopharma DK A/S Method of controlling o-linked glycosylation of antibodies
JP5885191B2 (ja) * 2011-01-04 2016-03-15 国立研究開発法人産業技術総合研究所 糖鎖改変酵母及びそれを用いた糖タンパク質の製造方法
JP2013085498A (ja) * 2011-10-14 2013-05-13 Nippi:Kk 細胞の分泌活性化方法
EP2771477A4 (en) * 2011-10-27 2015-04-22 Merck Sharp & Dohme O-GLYCOSYLATION IN LOW EUKARYOTES
US20160376570A1 (en) 2013-07-04 2016-12-29 Novartis Ag O-Mannosyltransferase Deficient Filamentous Fungal Cells and Methods of Use Thereof
US10513724B2 (en) 2014-07-21 2019-12-24 Glykos Finland Oy Production of glycoproteins with mammalian-like N-glycans in filamentous fungi
CA3014443A1 (en) * 2016-02-12 2017-08-17 Ablynx Nv Method for the production of immunoglobulin single variable domains
WO2020188021A1 (en) 2019-03-19 2020-09-24 Sanofi Novel selection marker-comprising cell line and uses thereof for protein production
CN113512550B (zh) * 2021-06-11 2022-03-15 中国科学院华南植物园 茶树CsHAC1基因和蛋白及其应用

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE4244915C2 (de) 1992-08-14 1998-12-03 Widmar Prof Dr Tanner DNA-Moleküle codierend Proteine, die an der O-Glykosylierung von Proteinen beteiligt sind
SE9301583D0 (sv) 1993-05-07 1993-05-07 Kabi Pharmacia Ab Yeast strain and methods for expressing heterologous proteins in yeast
JP2002507894A (ja) * 1997-07-03 2002-03-12 ザ リージェンツ オブ ザ ユニバーシティ オブ カリフォルニア 真核生物宿主細胞においてタンパク質の分泌を増加するための方法
EP1266018B1 (en) * 2000-03-24 2008-05-07 Genencor International, Inc. Production of secreted proteins by recombinant eukaryotic cells
TWI318983B (en) 2000-05-02 2010-01-01 Uab Research Foundation An antibody selective for a tumor necrosis factor-related apoptosis-inducing ligand receptor and uses thereof
EP1379667A2 (en) 2000-12-05 2004-01-14 The Penn State Research Foundation Methods and compositions for highly efficient production of heterologous proteins in yeast
CN100475848C (zh) 2001-05-18 2009-04-08 麒麟麦酒株式会社 抗trail-r抗体
WO2003091431A1 (fr) 2002-04-26 2003-11-06 Kirin Beer Kabushiki Kaisha Methylotrophe produisant une chaine de sucre de type mammifere
CA2528418A1 (en) * 2003-06-11 2004-12-23 Biogen Idec Ma Inc. Method to increase protein production in culture
WO2005089047A2 (en) * 2004-03-18 2005-09-29 Glycofi, Inc. Glycosylated glucocerebrosidase expression in fungal hosts
CN101084233B (zh) * 2004-04-29 2012-08-15 格利科菲公司 用于在糖蛋白产生中减少或消除α-甘露糖苷酶抗性聚糖的方法
JP2006136993A (ja) 2004-11-15 2006-06-01 Sanyo Special Steel Co Ltd 長尺材切断機定寸装置

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102965292A (zh) * 2012-12-10 2013-03-13 江南大学 一种葡萄糖氧化酶分泌增强型菌株及其应用
CN105358682A (zh) * 2013-03-26 2016-02-24 日本皮革株式会社 蛋白质的制造方法
CN110612352A (zh) * 2017-03-29 2019-12-24 贝林格尔·英格海姆Rcv两合公司 具有改变的膜脂组成的重组宿主细胞
CN113439087A (zh) * 2019-01-31 2021-09-24 丝芭博株式会社 重组蛋白的制备方法
CN110484572A (zh) * 2019-08-30 2019-11-22 浙江工业大学 一种提高酿酒酵母橙花叔醇产量的方法

Also Published As

Publication number Publication date
JP5131666B2 (ja) 2013-01-30
KR20090031359A (ko) 2009-03-25
CN101605887B (zh) 2012-09-05
EP2022855A4 (en) 2009-12-02
EP2022855B1 (en) 2015-08-19
WO2007132949A1 (ja) 2007-11-22
EP2022855A1 (en) 2009-02-11
US20090191587A1 (en) 2009-07-30
ES2553162T3 (es) 2015-12-04
US8232377B2 (en) 2012-07-31
JPWO2007132949A1 (ja) 2009-09-24
AU2007250735A1 (en) 2007-11-22

Similar Documents

Publication Publication Date Title
CN101605887A (zh) 蛋白的高分泌生产方法
JP5288379B2 (ja) タンパク質の高分泌生産方法
KR101930961B1 (ko) 피키아 파스토리스에서 생산된 치료 당단백질 상의 n-글리코실화 부위 점유를 증가시키는 방법
CA2551484C (en) Methods for eliminating mannosylphosphorylation of glycans in the production of glycoproteins
KR101262682B1 (ko) 유전자 발현 기술
DE69332893T2 (de) Methode zur erhöhung der produktion von rekombinanten disulfidverknüpften-proteinen in (saccharomyces cerevisiae)
KR20140015137A (ko) 분비 효율이 개선된 재조합 단백질의 생산 방법
CN113423836B (zh) 重组宿主细胞中碳源调节的蛋白的产生
KR20210032972A (ko) 전사인자를 사용하여 단백질 발현을 증가시키는 수단 및 방법
KR20140091017A (ko) Alg3 발현이 결핍된 피키아 파스토리스 균주에서 n-글리칸 점유율을 증가시키고 하이브리드 n-글리칸의 생산을 감소시키는 방법
WO2013066765A1 (en) Mutation of tup1 in glycoengineered yeast
WO1999000504A1 (en) Improved protein expression strains
KR20140091018A (ko) 재조합 단백질 발현을 위한 조작된 하등 진핵 숙주 균주
Wu et al. High level expression, efficient purification, and bioactivity of recombinant human metallothionein 3 (rhMT3) from methylotrophic yeast Pichia pastoris
KR0180081B1 (ko) 효모에서 지씨에스에프를 제조하는 방법
HK40054115A (zh) 重组宿主细胞中碳源调节的蛋白的产生
HK40054115B (zh) 重组宿主细胞中碳源调节的蛋白的产生
HK40062436A (zh) Mut-甲醇營養型酵母
CN114026239A (zh) Mut-甲醇营养型酵母
JPH04335883A (ja) 抗菌性ポリペプチドの製造方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
C17 Cessation of patent right
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20120905

Termination date: 20140516