CN101605887A - 蛋白的高分泌生产方法 - Google Patents
蛋白的高分泌生产方法 Download PDFInfo
- Publication number
- CN101605887A CN101605887A CNA2007800268649A CN200780026864A CN101605887A CN 101605887 A CN101605887 A CN 101605887A CN A2007800268649 A CNA2007800268649 A CN A2007800268649A CN 200780026864 A CN200780026864 A CN 200780026864A CN 101605887 A CN101605887 A CN 101605887A
- Authority
- CN
- China
- Prior art keywords
- gene
- ala
- glu
- protein
- lys
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N1/00—Microorganisms, e.g. protozoa; Compositions thereof; Processes of propagating, maintaining or preserving microorganisms or compositions thereof; Processes of preparing or isolating a composition containing a microorganism; Culture media therefor
- C12N1/20—Bacteria; Culture media therefor
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K16/00—Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies
- C07K16/18—Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies against material from animals or humans
- C07K16/28—Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies against material from animals or humans against receptors, cell surface antigens or cell surface determinants
- C07K16/2875—Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies against material from animals or humans against receptors, cell surface antigens or cell surface determinants against the NGF/TNF superfamily, e.g. CD70, CD95L, CD153, CD154
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K16/00—Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P21/00—Preparation of peptides or proteins
- C12P21/02—Preparation of peptides or proteins having a known sequence of two or more amino acids, e.g. glutathione
Landscapes
- Chemical & Material Sciences (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Organic Chemistry (AREA)
- Genetics & Genomics (AREA)
- Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Wood Science & Technology (AREA)
- Molecular Biology (AREA)
- Zoology (AREA)
- Biochemistry (AREA)
- Biotechnology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- General Engineering & Computer Science (AREA)
- Immunology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Medicinal Chemistry (AREA)
- Microbiology (AREA)
- Physics & Mathematics (AREA)
- Plant Pathology (AREA)
- General Chemical & Material Sciences (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Tropical Medicine & Parasitology (AREA)
- Virology (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
Abstract
本发明提供了在宿主细胞例如酵母中高分泌生产蛋白、尤其具有复杂结构的蛋白例如抗体的方法。根据本发明,提供了具有激活的HAC1基因和RRBP1基因的转化的酵母,和外源蛋白的高分泌生产方法,其中使用转化的酵母细胞,并且提供了对宿主细胞如酵母特异的O-型糖链。
Description
技术领域
本发明涉及高水平分泌生产蛋白的方法,主要在酵母中实现。
背景技术
迄今为止,通过基因重组技术生产药用蛋白主要包括将动物细胞或大肠杆菌细胞用作宿主。大肠杆菌细胞能低成本地生产靶蛋白;但是,大肠杆菌细胞不能进行以糖链修饰为代表的修饰,且以包涵体的形式生成无活性的蛋白。这需要溶解过程,因而大肠杆菌细胞不适合复杂的蛋白生产过程。相反,动物细胞能生产靶蛋白作为活性蛋白。但是,不利地,由于动物细胞繁殖和培养的费时操作,动物细胞的使用会显著增加在设备和材料成本方面的生产成本。
在蛋白中,抗体已经长时间地用作药物产品。由于它们源自人以外的来源,会新产生抗施用的抗体的抗体。因而,这样的抗体不能施用超过一次,其使用受到限制。近年来,已经可以生产人源化的抗体,其中抗原结合位点以外的氨基酸序列已经被置换为源自人抗体的序列。此外,可以生产其中已经导入人抗体基因的人抗体生产小鼠。因而,抗体作为药物产品的用途变得广泛。现在,这样的抗体由培养的、已经导入编码杂交瘤或抗体的基因的细胞如CHO细胞生产。但是,这样的生产在成本、生产力、安全性等方面存在问题。
近年来,为了弥补上述缺点,已经尝试用使用酵母来生产药用蛋白。但是,这样的尝试基本上都没有付诸实际应用。更具体地,关于具有复杂结构的抗体,存在表达Fab(一种单链抗体(ScFv))等的实例(Biosci.Biotechnol.Biochem.,64:2138-2144,2000)。但是,在全长抗体方面生产力非常低(Proc.Natl.Acad.Sci.U.S.A.,85:8678-8682,1988)。最近报道了使用生产哺乳动物N-结合糖链的酵母(巴斯德毕赤氏酵母)来生产抗体的实例(Nature Biotechnology,24:210-215,2006),尽管该报道没有提及产率。因而,在酵母中高水平生产抗体是困难的。认为其原因是,酵母的分泌能力不足,由蛋白酶造成的降解等。
作为解决这些问题的一种手段,提出了包含使用蛋白酶缺陷菌株的方法(Enzyme and Microbial Technology,26:671-677,2000,Protein Expr.Purif.,20:485-491,2000,Biosci.Biotechnol.Biochem.,66:628-631,2002)。发明人还已经开发了使用蛋白酶(它是蛋白酶A(PEP4)、蛋白酶B(PRB1)或酵母天冬酶(YPS1))基因缺陷菌株来抑制抗体的降解的方法(WO 2003/091431)。作为通过基因导入来提高蛋白生产力的一种方法,报道了通过共表达分子伴侣的部分来提高ScFv生产力的方法,所述分子伴侣的部分会辅助内质网上的蛋白如BiP(KAR2)/PDI的三维结构的形成(Nat.Biotechnol.16:773-777,1998),尽管该方法仅仅生产单链抗体的片段。
另外,已经开发了许多诱导型或组成型启动子,且已经用于生产外源蛋白。但是,当使用有效启动子使编码外源蛋白的基因在细胞中高水平表达时,或当生产不太可能折叠的蛋白时,在内质网(ER)中会发生聚集,产生的蛋白有时可能在细胞中积累。此外,分泌型蛋白和膜蛋白会翻译成蛋白,此后立即掺入内质网,进行特定修饰,然后转移至高尔基体。在该情况下,未折叠的蛋白有时可能由于某种原因在内质网中积累。这称作“内质网应激”。这样的内质网应激的原因的实例包括,在内质网中发生的修饰(例如添加糖链或二硫键)的干扰,和从内质网运输的恶化。哺乳动物细胞具有“解折叠蛋白应答(UPR)”机制,作为反抗这样的内质网应激的一种手段。例如,转录抑制、分子伴侣诱导的折叠加速、变性蛋白的降解或经细胞凋亡的细胞死亡会保护在内质网中积累的蛋白。
作为调节UPR的基因,已知IRE1α-XBP1、PERK-eIF-2α和ATF6动物细胞的基因。在酵母的情况下,Ire1p-Hac1p是已知为这样的基因的唯一基因,Ire1p-Hac1p基因通过下述机制与UPR相关(参见图1)。首先,Ire1p通常结合抗体重链结合蛋白(BiP)。但是,当生产解折叠的蛋白(UFP)时,BiP会结合这样的UFP。与BiP解离的Ire1p通过自磷酸化或二聚化而激活,且它表现出内切核酸酶活性。尽管HAC1基因通常以未激活状态存在,具有内切核酸酶活性的Ire1p使从HAC1基因转录的mRNA发生剪接,并生成有活性的Hac1p(Cell,87:405-413,1996;Cell,90:1031-1039,1997;the EMBO Journal,18:3119-3132,1999)。这种有活性的Hac1p迁移至细胞核,起转录因子的作用,并促进编码与称作UPR的一系列反应有关的多种蛋白的基因的表达,所述反应例如有关的糖链添加、蛋白折叠、蛋白降解(ER-相关的降解:ERAD)、蛋白分选、脂类代谢等(Cell,101:249-258,2000)。
关于使用激活的Hac1p来提高外源蛋白的生产力的尝试,有一个实例,其中将编码丝状菌即里氏木霉(Trichoderma reesei))的激活的Hac1p的基因导入啤酒糖酵母中来提高异源蛋白α-淀粉酶和内源蛋白即转化酶的分泌(Appl.Environ.Microbiol.69:2065-2072,2003)。但是,已知单一蛋白,即α-淀粉酶或转化酶是容易分泌的蛋白,产量的提高低至提高以前的产量的约2倍。近年来,已经报道在已经单独导入激活的HAC1基因的菌株中,使用巴斯德毕赤氏酵母生产抗体片段Fab(Biotechnologyand Bioengineering,94:353-361)。通过导入激活的HAC1基因实现的生产力提高低至约1.3倍。
同时,已知这样一个实例,其中将哺乳动物来源的RRBP1(核糖体结合蛋白1,核糖体受体,p180蛋白)基因单独地导入酵母菌株中,从而使分泌的蛋白(牛胰腺胰蛋白酶抑制剂(BPTI))的量变成5倍(TheJournal of Cell Biology,146:273-284,1999)。最初,从狗分离出RRBP1基因,作为编码核糖体结合蛋白的基因(Nature,346:540-544,1990)。RRBP1具有180kDa的分子量和特殊结构,使得在N-末端侧包含10个氨基酸残基的序列重复54次,且该区域结合核糖体。已知RRBP1参与膜结构的扩大和mRNA的稳定化(the Journal of Cell Biology,130:29-39,1995;the Journal of Cell Biology,156:993-1001,2002)。前述BPTI的一个成功实例具有6,500的分子量,它代表非常小的肽。这样的结果不能总是适用于其它高分子量蛋白或由不同蛋白(例如抗体的轻链或重链)组成的蛋白聚集体。
已知蛋白O-甘露糖基转移酶(PMT)基因与酵母或霉菌固有的O-糖链的形成有关。PMT基因产物位于内质网膜上,且具有将甘露糖添加至分泌型蛋白的丝氨酸(Ser)或苏氨酸(Thr)的羟基残基上的活性(在下文中,这样的活性称作PMT活性)。有些已经被PMT添加糖链的蛋白用作酵母菌株壁的基本组分,作为甘露糖蛋白。当PMT活性非常低时,已知细胞壁会变脆,并影响细胞的生长。
关于PMT基因,已知在啤酒糖酵母(Saccharomyces cerevisiae)中存在7种基因,即,PMT1,2,3,4,5,6,和7(Biochim.Biophys.Acta.,1426:297-307,1999)。将PMT基因分成3类;即,PMT1家族,PMT2家族,和PMT4家族。已知PMT1p和PMT2p在形成异二聚体后表现出活性,PMT4p在形成同二聚体后表现出活性。因为氨基酸序列同源性等,据称PMT5p与PMT1p互补,PMT3p与PMT2p互补。PMT6p与PMT2p和PMT3p高度同源,尽管不知道表现出活性的组分的类型。还已知每种PMT蛋白具有对底物蛋白的选择性。
作为芽殖酵母的其它类型的PMT基因,已经发现了在白念珠菌的情况下与啤酒糖酵母的PMT1,2,4,5,和6基因高度同源的5种基因(Mol.Microbiol.,55:546-560,2005),在新型隐球菌的情况下至少与啤酒糖酵母的PMT4基因高度同源的一种基因(Eukaryot.Cell,6:222-234,2007)和在裂殖酵母即粟酒裂殖酵母的情况下与PMT1,2,和4基因高度同源的3种基因(oma1,2,和4)(Mol.Microbiol.,57:156-170,2005)。此外,在甲醇同化酵母Ogataea minuta(O.minuta)中观察到与啤酒糖酵母的PMT1,2,4,5,和6基因高度同源的5种基因的存在。
也在霉菌中发现了PMT基因。在构巢曲霉中发现了PmtA基和2种其它的基因,在里氏木霉中发现了与啤酒糖酵母的PMT2基因高度同源的Pmt1基因(Curr.Genet.,43:11-16,2003)。
据称PMT活性具有影响肽疏水区、增强肽亲水性、和抑制内质网腔中的肽聚集的作用。但是,当生产外源蛋白时,PMT活性有时会添加不必要的O-糖链,这可能导致蛋白组分的不充分形成、降低的活性等。对于多聚体蛋白,例如抗体,具体而言,可以抑制其聚集体的形成(在抗体的情况下,这是指轻链和重链聚集体的形成)。
日本专利号3630424和日本专利公开(kohyo)号H08-509867(A)(1996)提出了通过抑制由PMT基因的修饰导致的O-糖链添加,生产重组蛋白的方法。但是,这些专利文件没有描述抗体的轻链和重链的聚集体的形成。
在WO 2002/046437中提供了一个实例,其中将与O-糖链的形成有关的PMT1和PMT2基因缺陷型菌株用于抑制O-糖链的添加,使抗体轻链和重链分子的聚集提高了约1.5倍。该数据是使用RI-标记的氨基酸的脉冲标记实验的结果,但不是观察整个培养过程的结果。另外,进一步降低了糖链添加的抑制程度,并恶化了抗体生产力。
尽管HAC1基因会诱导UPR,已知有些UPR诱导型基因是添加酵母特异性的O-糖链的PMT基因(Cell,101:249-258,2000)。因此,HAC1基因的导入可能不足以生产高质量的多聚体蛋白,例如抗体。
如上所述,已经提出许多种方法来作为在酵母中高水平分泌生产蛋白的方法。但是,基本上所有方法在实践水平都是不充分的。还没有发现有效生产蛋白、尤其是高分子量蛋白或蛋白聚集体(包括抗体)的方法。当通过基因导入、基因破坏等将性状导入细胞中时,一般而言,细胞会经历某种应激。因而,可以提供其它修饰,或可能发生相反作用。当希望高水平蛋白表达时,例如,激活UPR时,这会导致不利因素例如糖链修饰、蛋白酶体的降解、或ER-相关的降解(ERAD)。因此,通过单一过程例如导入单个基因,不能实现具有复杂结构的蛋白例如抗体的高水平分泌生产。另外,仅有几种常规方法的组合不总是会产生协同效应。
因此,本发明意在提供在酵母或其它宿主细胞中高水平分泌生产蛋白(更具体地,具有复杂结构的蛋白,例如抗体)的方法。
发明内容
为了实现上述目的,发明人已经进行了集中的研究。结果,他们发现,与蛋白的高水平分泌生产有关的基因,即激活的HAC1(Hac1蛋白,它是在应用内质网应激后由Ire1p剪接mRNA诱导的转录因子)基因和RRBP1(核糖体结合蛋白1,核糖体受体,p180蛋白)基因在甲醇同化酵母,即Ogataea minuta中共表达,且抗体分泌生产的量可以增加约10倍。此外,他们发现,可以抑制与给酵母特异性蛋白添加O-糖链有关的蛋白O-甘露糖基转移酶(PMT)的活性(该活性抑制异多聚体例如抗体的聚集),以进一步提高生产力。
他们也发现,可以表达与蛋白的高水平分泌生产有关的基因,即激活的HAC1基因,且可以抑制与给酵母特异性蛋白添加O-糖链有关的蛋白O-甘露糖基转移酶(PMT)的活性(该活性抑制异多聚体例如抗体的聚集),以实现生产力的协同提高。
在这样的发现后,已经完成了本发明(参见图2)。
具体而言,本发明包括下述发明。
[1]一种转化的宿主细胞,其包含激活的HAC1基因和RRBP1基因。
[2]根据[1]的转化的宿主细胞,其包含以下激活的HAC1基因(1)和RRBP1基因(2):
(1)选自下面(a)至(d)的激活的HAC1基因:
(a)编码由SEQ ID NO:23所示的氨基酸序列组成的蛋白的基因;
(b)编码由与SEQ ID NO:23所示的氨基酸序列具有至少70%同源性的氨基酸序列组成、且具有激活解折叠蛋白应答(UPR)的功能的蛋白的基因;
(c)编码由通过缺失、置换和/或添加一个或几个氨基酸从SEQ ID NO:23所示氨基酸序列衍生的氨基酸序列组成、且具有激活UPR的功能的蛋白的基因;和
(d)在严格条件下与由SEQ ID NO:22所示核苷酸序列或其互补核苷酸序列组成的DNA杂交、且编码具有激活UPR的功能的蛋白的基因;和
(2)选自下面(e)至(h)的RRBP1基因:
(e)编码人或狗来源的RRBP1的基因;
(f)编码由与人或狗来源的RRBP1的氨基酸序列具有至少70%同源性的氨基酸序列组成、且具有核糖体结合活性的蛋白的基因;
(g)编码由通过缺失、置换和/或添加一个或几个氨基酸从人或狗来源的RRBP1的氨基酸序列衍生的氨基酸序列组成、且具有核糖体结合活性的蛋白的基因;和
(h)在严格条件下与由人或狗来源的RRBP1基因的核苷酸序列或其互补核苷酸序列组成的基因杂交、且编码具有核糖体结合活性的蛋白的基因。
[3]根据[1]的转化的细胞,其包含以下激活的HAC1基因(1)和RRBP1基因(2):
(1)选自下面(i)至(l)的激活的HAC1基因:
(i)编码啤酒糖酵母、里氏木霉或构巢曲霉的激活的HAC1蛋白的基因;
(j)编码由与啤酒糖酵母、里氏木霉或构巢曲霉的激活的HAC1蛋白的氨基酸序列具有至少70%同源性的氨基酸序列组成、且具有激活UPR的功能的蛋白的基因;
(k)编码由通过缺失、置换和/或添加一个或几个氨基酸从啤酒糖酵母、里氏木霉或构巢曲霉的激活的HAC1蛋白的氨基酸序列衍生的氨基酸序列组成、且具有激活UPR的功能的蛋白的基因;和
(l)在严格条件下与由编码啤酒糖酵母、里氏木霉或构巢曲霉的激活的HAC1蛋白的基因的核苷酸序列或其互补核苷酸序列组成的基因杂交、且编码具有激活UPR的功能的蛋白的基因;和
(2)选自下面(e)至(h)的RRBP1基因:
(e)编码人或狗来源的RRBP1的基因;
(f)编码由与人或狗来源的RRBP1的氨基酸序列具有至少70%同源性的氨基酸序列组成、且具有核糖体结合活性的蛋白的基因;
(g)编码由通过缺失、置换和/或添加一个或几个氨基酸从人或狗来源的RRBP1的氨基酸序列衍生的氨基酸序列组成、且具有核糖体结合活性的蛋白的基因;和
(h)在严格条件下与由人或狗来源的RRBP1基因的核苷酸序列或其互补核苷酸序列组成的基因杂交、且编码具有核糖体结合活性的蛋白的基因。
[4]根据[1]至[3]中任一项的转化的宿主细胞,其中所述宿主细胞是真核细胞。
[5]根据[4]的转化的宿主细胞,其中所述真核细胞是酵母。
[6]根据[5]的转化的宿主细胞,其中所述酵母是甲醇同化酵母。
[7]根据[6]的转化的宿主细胞,其中所述甲醇同化酵母是Ogataeaminuta。
[8]根据[5]的转化的宿主细胞,其中所述酵母是啤酒糖酵母。
[9]根据[1]至[8]中任一项的转化的宿主细胞,其包含导入其中的编码外源蛋白的基因。
[10]根据[9]的转化的宿主细胞,其中所述外源蛋白是多聚体蛋白。
[11]根据[10]的转化的宿主细胞,其中所述多聚体蛋白是异多聚体。
[12]根据[11]的转化的宿主细胞,其中所述异多聚体是抗体或其功能片段。
[13]一种生产蛋白的方法,其包含,在培养基中培养根据[9]至[12]中任一项的转化的宿主细胞,和从培养产物进行靶蛋白取样。
[14]根据[13]的方法,其中在抑制蛋白O-甘露糖基转移酶(PMT)活性的条件下进行培养。
[15]根据[14]的方法,其中通过向培养基中添加蛋白O-甘露糖基转移酶(PMT)活性的抑制剂,抑制PMT活性。
[16]编码甲醇同化酵母的激活的HAC1蛋白的基因。
[17]选自下面(a)至(d)的基因:
(a)编码由SEQ ID NO:23所示的氨基酸序列组成的蛋白的基因;
(b)编码由与SEQ ID NO:23所示的氨基酸序列具有至少70%同源性的氨基酸序列组成、且具有激活解折叠蛋白应答(UPR)的功能的蛋白的基因;
(c)编码由通过缺失、置换和/或添加一个或几个氨基酸从SEQID NO:23所示氨基酸序列衍生的氨基酸序列组成、且具有激活UPR的功能的蛋白的基因;和
(d)在严格条件下与由SEQ ID NO:22所示核苷酸序列或其互补核苷酸序列组成的DNA杂交、且编码具有激活UPR的功能的蛋白的基因。
[18]包含根据[17]的基因的表达载体。
[19]根据[18]的表达载体,它是pOMexPGHy/Hac1。
[20]包含激活的HAC1基因和RRBP1基因的表达载体。
[21]根据[20]的表达载体,其中所述激活的HAC1基因是根据[17]的基因。
[22]根据[20]的表达载体,其中所述激活的HAC1基因是编码啤酒糖酵母、里氏木霉或构巢曲霉的激活的HAC1蛋白的基因或其同源基因。
[23]根据[20]的表达载体,它是YEp351GAP-II-aHAC1/p180。
[24]根据[20]的表达载体,其中所述RRBP1基因是人或狗来源的RRBP1基因或其同源基因。
[25]一种转化的宿主细胞,其中已经导入了根据[18]至[24]中的任一项的表达载体。
[26]一种转化的宿主细胞,其中已经导入了包含激活的HAC1基因的表达载体和包含RRBP1基因的表达载体。
[27]根据[26]的转化的宿主细胞,其中所述包含激活的HAC1基因的表达载体是根据[18]或[19]的表达载体。
[28]根据[26]的转化的宿主细胞,其中所述激活的HAC1基因是编码啤酒糖酵母、里氏木霉或构巢曲霉的激活的HAC1蛋白的基因或其同源基因。
[29]根据[26]的转化的宿主细胞,其中所述RRBP1基因是人或狗来源的RRBP1基因或其同源基因。
[30]一种生产转化的宿主细胞的方法,其包含下述步骤:
(A)向宿主细胞中导入激活的HAC1基因;和
(B)向宿主细胞中导入RRBP1基因。
[31]根据[30]的方法,其中所述激活的HAC1基因是下述基因中的任一个:
(1)根据[17]的基因;
(2)编码啤酒糖酵母、里氏木霉或构巢曲霉的激活的HAC1蛋白的基因;
(3)编码由与啤酒糖酵母、里氏木霉或构巢曲霉的激活的HAC1蛋白的氨基酸序列具有至少70%同源性的氨基酸序列组成、且具有激活UPR的功能的蛋白的基因;
(4)编码由通过缺失、置换和/或添加一个或几个氨基酸从啤酒糖酵母、里氏木霉或构巢曲霉的激活的HAC1蛋白的氨基酸序列衍生的氨基酸序列组成、且具有激活UPR的功能的蛋白的基因;和
(5)在严格条件下与由编码啤酒糖酵母、里氏木霉或构巢曲霉的激活的HAC1蛋白的基因的核苷酸序列或其互补核苷酸序列组成的基因杂交、且编码具有激活UPR的功能的蛋白的基因。
[32]根据[30]的方法,其中所述RRBP1基因是下述基因中的任一个:
(1)编码人或狗来源的RRBP1的基因;
(2)编码由与人或狗来源的RRBP1的氨基酸序列具有至少70%同源性的氨基酸序列组成、且具有核糖体结合活性的蛋白的基因;
(3)编码由通过缺失、置换和/或添加一个或几个氨基酸从人或狗来源的RRBP1的氨基酸序列衍生的氨基酸序列组成、且具有核糖体结合活性的蛋白的基因;和
(4)在严格条件下与由人或狗来源的RRBP1基因的核苷酸序列或其互补核苷酸序列组成的基因杂交、且编码具有核糖体结合活性的蛋白的基因。
[33]根据[30]至[32]中的任一项的方法,其中所述宿主细胞是真核细胞。
[34]根据[33]的方法,其中所述真核细胞是酵母。
[35]根据[34]的方法,其中所述酵母是甲醇同化酵母。
[36]根据[35]的方法,其中所述甲醇同化酵母是Ogataea minuta。
[37]根据[34]的方法,其中所述酵母是啤酒糖酵母。
[38]选自下面(a)至(d)的基因:
(a)编码由SEQ ID NO:70所示氨基酸序列组成的蛋白的基因;
(b)编码由与SEQ ID NO:70所示氨基酸序列具有至少70%同源性的氨基酸序列组成、且具有激活解折叠蛋白应答(UPR)的功能的蛋白的基因;
(c)编码由通过缺失、置换和/或添加一个或几个氨基酸从SEQID NO:70所示氨基酸序列衍生的氨基酸序列组成、且具有激活UPR的功能的蛋白的基因;和
(d)在严格条件下与由SEQ ID NO:69所示核苷酸序列或其互补核苷酸序列组成的DNA杂交、且编码具有激活UPR的功能的蛋白的基因。
[39]包含根据[38]的基因的表达载体。
[40]根据[39]的表达载体,它是pOMexPGHy/PpHac1。
[41]一种生产蛋白的方法,其包含,在抑制O-糖链合成的条件下,在培养基中培养已经导入激活的HAC1基因和/或RRBP1基因和编码外源蛋白的基因的转化细胞,和从培养产物进行靶蛋白取样。
[42]根据[41]的生产蛋白的方法,其中通过插入灭活PMT基因来抑制O-糖链合成。
[43]根据[41]的生产蛋白的方法,其中通过向培养基中添加PMT活性的抑制剂来抑制O-糖链合成。
[44]根据[41]的生产蛋白的方法,其中通过插入灭活PMT基因和向培养基中添加PMT活性的抑制剂来抑制O-糖链合成。
[45]根据[43]或[44]的生产蛋白的方法,其中所述PMT活性的抑制剂是5-[[3,4-(1-苯基甲氧基)苯基]亚甲基]-4-氧代-2-硫代-3-噻唑烷乙酸或{(5Z)-4-氧代-5-[3-(1-苯基乙氧基)-4-(2-苯基乙氧基)亚苄基]-2-硫代-1,3-噻唑烷-3-基}乙酸。
[46]一种转化的宿主细胞,其具有插入灭活的PMT基因和导入其中的激活的HAC1基因。
[47]根据[46]的转化细胞,其中所述宿主细胞是Ogataea minuta。
附图简述
图1显示了得到O.minuta的激活的HAC1基因的方法和其结构。
图2概要显示了本发明的技术范围。
图3显示了O.minuta的激活的HAC1基因的表达载体(pOMexPGHy/Hac1)、人RRBP1基因的表达载体(pOMexGP1A/p180)和人抗体基因的表达载体(pOMexGAT-G/Ab)的结构。
图4显示了在已经导入O.minuta的激活的HAC1基因和人RRBP1基因的产抗体酵母菌株的培养上清液中分泌的抗体的蛋白印迹分析结果。
图5中的图显示了测量已经导入O.minuta的激活的HAC1基因和人RRBP1基因的产抗体酵母菌株分泌的抗体的量的结果。
图6显示了在已经导入O.minuta的激活的HAC1基因和人RRBP1基因的产抗体酵母菌株的培养上清液中分泌的抗体的蛋白印迹分析结果,所述菌株已经在抑制O-糖链形成的条件下培养。
图7显示了啤酒糖酵母的活性HAC1的表达载体(YEp351GAP-II-aHAC1)、人RRBP1基因的的表达载体(YEp351GAP-II-p180)、人抗体基因的表达载体(YEp352GAP-II-alfHc/alfLc)和激活的HAC1基因和RRBP1基因的共表达载体(YEp351GAP-II-aHAC1/p180)。
图8A的图显示了已经导入啤酒糖酵母的激活的HAC1基因的表达载体和人RRBP1基因的表达载体的产抗体酵母菌株的抗体分泌生产能力的对比结果。图8B的图显示了在抑制O-糖链形成的条件下已经导入啤酒糖酵母的激活的HAC1基因的表达载体和人RRBP1基因的表达载体的产抗体酵母菌株的抗体分泌生产能力的对比结果。图8C的图显示了在添加或不添加PMT抑制剂的情况下已经导入啤酒糖酵母的激活的HAC1基因的表达载体和人RRBP1基因的表达载体的产抗体酵母菌株的抗体分泌生产能力(绝对值)的对比结果。
图9显示了已经导入合成抗体基因(其中密码子已经被置换)的产抗体菌株中抗体生产的蛋白印迹分析结果。
图10显示了已经导入酵母菌株来源的激活的HAC1基因的产抗体菌株的培养上清液的蛋白印迹分析结果。
图11显示了已经导入酵母菌株来源的激活的HAC1基因的产抗体菌株的抗体分泌生产量。
图12显示了具有插入灭活的PMT1基因-或PMT2基因的产抗体菌株的培养上清液的蛋白印迹分析结果,和已经导入激活的HAC1基因的产抗体菌株的培养上清液的蛋白印迹分析结果。
图13显示了具有插入灭活的PMT1基因-或PMT2基因的产抗体菌株的抗体分泌生产量,和已经导入激活的HAC1基因的产抗体菌株的抗体分泌生产量。
图14显示了具有插入灭活的PMT4基因的产抗体菌株的培养上清液的蛋白印迹分析结果,和已经导入激活的HAC1基因的产抗体菌株的培养上清液的蛋白印迹分析结果。
图15显示了具有插入灭活的PMT4基因的产抗体菌株的抗体分泌生产量,和已经导入激活的HAC1基因的产抗体菌株的抗体分泌生产量。
图16A显示了PMT5基因-或PMT6基因-缺陷型产抗体菌株的培养上清液的蛋白印迹分析结果。图16B显示了PMT5基因-或PMT6基因-缺陷型产抗体菌株的抗体分泌生产量。
图17显示了在添加PMT抑制剂(1c)的情况下,通过培养具有插入灭活的PMT2或PMT4基因和导入其中的激活的HAC1基因的产抗体菌株得到的培养上清液的蛋白印迹分析结果。
图18A显示了在添加PMT抑制剂(1c)的情况下,通过培养具有插入灭活的PMT2和导入其中的激活的HAC1基因的产抗体菌株得到的培养上清液的抗体分泌生产量。图18B显示了在添加PMT抑制剂(1c)的情况下,通过培养具有插入灭活的PMT4和导入其中的激活的HAC1基因的产抗体菌株得到的培养上清液的抗体分泌生产量。
图19显示了已经在添加多种PMT抑制剂(绕丹宁-3-乙酸衍生物)的情况下培养的培养上清液的蛋白印迹分析结果。
图20显示了已经在添加多种PMT抑制剂(绕丹宁-3-乙酸衍生物)的情况下培养的培养上清液的抗体分泌生产量。
下面详细描述本发明。本专利申请要求2006年5月16日提交的日本专利申请号2006-136993的优先权,且包括在其说明书中公开的全部或部分内容。
本发明由下述两部分组成。具体而言,(A)与蛋白的高水平分泌生产有关的基因的导入和(B)酵母(和霉菌)固有的O-糖链添加的抑制的组合,可以在蛋白的高水平分泌生产方面产生协同效应。
下面详细描述本发明。
本发明提供了用于蛋白的高水平分泌生产的基因,包含这样的基因的表达载体,导入了这样的表达载体的转化的宿主细胞,和使用这样的转化的宿主细胞生产蛋白的方法。
1.用于蛋白的高水平分泌生产的基因
(1)HAC1基因
在本发明中,用于蛋白的高水平分泌生产的基因是HAC1基因。HAC1基因作为无活性的HAC1基因存在于基因组上;但是,在内质网应激应用后由HAC1基因转录的mRNA会被Ire1p剪接,转化成编码转录因子HAC1蛋白(Hac1p)的mRNA。翻译的Hac1p然后激活解折叠蛋白应答(UPR)。在本发明中,将激活的HAC1基因定义为编码HAC1蛋白(Hac1p)的cDNA(即,与mRNA互补)。
因此,优选使用激活的HAC1基因,以便进一步提高本发明的效应。特定程度的效应也可以通过导入灭活的HAC1基因来实现。
在下文中,描述了编码实际上造成UPR起作用的Hac1p的激活的HAC1基因。HAC1p的组分是,从N末端开始,在生物体中高度保守的DNA-结合域、亮氨酸拉链区和在其中剪接mRNA且被Ire1p新添加在C末端的未知活性区。
在本发明中使用的激活的HAC1基因没有特别限制,只要这样的基因会编码激活的HAC1蛋白即可。实例包括在本发明中新获得的编码由源自Ogataea minuta(O.minuta)的SEQ ID NO:23所示的氨基酸序列组成的蛋白的DNA,和编码由SEQ ID NO:70所示的源自巴斯德毕赤氏酵母的氨基酸序列组成的蛋白的DNA。可以采用与其同源的功能等价DNA。
术语“同源DNA”是指,例如,编码由与SEQ ID NO:23或70所示的氨基酸序列具有至少70%同源性的氨基酸序列组成、且具有激活解折叠蛋白应答(UPR)的功能的蛋白的基因,编码由通过缺失、置换和/或添加一个或几个氨基酸从SEQ ID NO:23或70所示的氨基酸序列衍生的氨基酸序列组成、且具有激活UPR的功能的蛋白的基因,和在严格条件下与由SEQ ID NO:22或69所示核苷酸序列或其互补核苷酸序列组成的DNA杂交、且编码具有激活UPR的功能的蛋白的基因。
术语“与SEQ ID NO:23或70所示的氨基酸序列具有至少70%同源性的氨基酸序列”是指具有优选至少80%、更优选至少90%和最优选至少95%同源性的氨基酸序列。使用例如日本的DNA数据库(DDBJ),通过FASTA、BLAST或其它程序,可以进行蛋白同源性搜索。
前述“SEQ ID NO:23或70所示氨基酸序列中的一个或几个氨基酸”中的术语“几个”指示的数目没有特别限制。例如,术语“几个”大约指20或更少,优选10或更少,更优选7或更少,和进一步优选5或更少。
在前述的“严格条件”下,形成所谓的特异性杂交体,但是不形成非特异性杂交体。在这样的条件下,例如,高度同源的DNA,即由与SEQID NO:22或69所示核苷酸序列具有至少80%、优选至少90%、更优选至少95%同源性的核苷酸序列组成的DNA的互补链,会经历杂交,但是具有更低同源性水平的DNA的互补链不会经历杂交。更具体而言,钠浓度是150至900mM,优选600至900mM,温度是60℃至68℃,优选65℃。
通过本领域已知的技术,例如Kunkel方法或有缺口的双链体方法,或根据它们的技术,可以导入上述突变,例如缺失、置换和/或添加。例如,可以使用定点诱变的诱变试剂盒,例如Mutant-K(Takara Bio),Mutant-G(Takara Bio),或LA PCR体外诱变系列试剂盒(Takara Bio)。
术语“激活UPR的功能”是指,激活内质网(ER)的抗解折叠的蛋白积累的防御反应(例如转录的抑制,分子伴侣诱导的折叠加速,变性蛋白的降解或细胞凋亡造成的细胞死亡)的功能。激活UPR的功能基本上等同于编码由SEQ ID NO:23或70所示的氨基酸序列组成的蛋白的基因的功能。
激活的HAC1基因可以是O.minuta、巴斯德毕赤氏酵母或另一种甲醇同化酵母的基因。其实例包括,编码源自多形汉逊酵母(安格斯毕赤氏酵母)、甲醇毕赤氏酵母和博伊丁假丝酵母的激活的HAC1蛋白的基因。也可以是源自另一个生物物种的激活的HAC1基因,例如其它类型的酵母或霉菌。其实例包括,编码源自啤酒糖酵母的激活的HAC1蛋白(GenBank登记号:NP_116622)的基因(YFL031W,GenBank登记号:由Ire1p从D26506剪接的DNA),编码源自里氏木霉激活的HAC1蛋白(GenBank登记号:CAC88374)的基因(GenBank登记号:AJ413272),和编码源自构巢曲霉活性HacA蛋白(GenBank登记号:CAC88375)的基因(GenBank登记号:AJ413273)。
编码源自啤酒糖酵母、里氏木霉和构巢曲霉的激活的HAC1蛋白的基因的核苷酸序列如SEQ ID NO:39,41,和43所示,对应的氨基酸序列如SEQ ID NO:40,42,和44所示。
本文分离的源自Ogataea minuta和巴斯德毕赤氏酵母的激活的HAC1基因是从啤酒糖酵母以外的酵母菌株分离的首个基因。这强烈暗示着,目标基因普遍存在于酵母菌株中,例如甲醇同化酵母菌株。因此,这些基因是在本发明使用的激活的HAC1基因的范围内。
此外,激活UPR的转录因子可以用作前述激活的HAC1基因的替代方案。一个实例是,来自XBP-1基因(例如具有GenBank登记号:NM_005080的人-来源的基因)的、在被Ire1p剪接后激活的基因,它是从动物细胞或其它物种来源的HAC1同源物。也激活HAC1(XBP-1)的Ire1的人工激活,也对应着UPR的激活。因此,认为与导入激活的HAC1基因等价。此外,认为未激活的HAC1基因的强制表达会产生与导入上述激活的HAC1等价的作用。
可以通过任意方法来得到激活的HAC1基因,只要会诱导UPR即可。例如,mRNA可以从下述细胞得到:在其中高水平表达编码难以折叠的蛋白的基因的细胞,或用糖链修饰抑制剂例如衣霉素、氧化还原剂例如DTT或过氧化氢、或UPR诱导物处理过,此后由其合成cDNA的细胞。通过使用DNA合成仪合成其一部分或全长,也可以从已经公开的序列得到mRNA。
(2)RRBP1基因
在本发明中,用于蛋白的高水平分泌生产的另一个基因的实例是RRBP1基因。RRBP1基因是编码称作核糖体结合蛋白1的蛋白的基因,它也称作hES,ES130,ES/130,或DKFZp586A1420基因。哺乳动物RRBP1基因由N-末端跨膜区、富含碱性氨基酸的后续区域、包含10个氨基酸残基的序列的54个重复序列、和C-末端区组成。
在本发明中使用的RRBP1基因没有特殊限制,只要它编码核糖体结合蛋白1即可。实例包括人-来源的RRBP1基因(编码KIAA1398蛋白;GenBank登记号:AB037819)和狗-来源的RRBP1基因(编码核糖体受体p180;GenBank登记号:X87224)。只要与前述基因在功能上等价,可以使用其同源基因。人-来源的RRBP1基因和狗-来源的RRBP1基因的核苷酸序列如SEQ ID NO:45和47所示,对应的氨基酸序列如SEQ ID NO:46和48所示。
同源基因的实例包括:编码由与人或狗来源的RRBP1的氨基酸序列具有至少70%同源性的氨基酸序列组成、且具有核糖体结合活性的蛋白的基因;编码由通过缺失、置换和/或添加一个或几个氨基酸从人或狗来源的RRBP1的氨基酸序列衍生的氨基酸序列组成、且具有核糖体结合活性的蛋白的基因;和在严格条件下与由人或狗来源的RRBP1基因的核苷酸序列或其互补核苷酸序列组成的基因杂交、且编码具有核糖体结合活性的蛋白的基因。同源性程度、严格条件和诱变方法如上所述。
这样的同源基因的具体实例包括源自小鼠(登记号:XM_622097,XM_91338,和XM_991888)、大鼠(登记号:XM_230637)、非洲爪蟾(登记号:NM_001005671)和斑马鱼(zebra danio)(登记号:NM_199431)的RRBP1基因。
RRBP1基因也可以通过普遍已知的技术来得到。例如,可以从在其中表达RRBP1基因的细胞制备mRNA,且可以进一步合成cDNA。
在本发明中,通过制备mRNA和使用反转录酶合成cDNA的一般技术,可以得到用于蛋白的高水平分泌生产的前述基因和编码作为下述高水平分泌生产的靶的外源蛋白的基因(这些基因在下文中称作“靶基因”)。作为前述一般技术的一个实例,使用从靶基因片段合成的DNA探针,筛选源自在其中表达靶基因的细胞或组织的cDNA文库,以便分离目标基因。通过本领域普遍使用的技术,可以制备mRNA。例如,可以用胍试剂或苯酚试剂处理前述细胞或组织,以得到总RNA,然后通过亲和柱方法,使用寡(dT)纤维素柱或聚尿苷酸-琼脂糖凝胶,使用琼脂糖凝胶2B作为载体,或批式技术,得到聚腺苷酸+RNA(mRNA)。此外,通过蔗糖密度梯度离心或通过其它方式,可以分离聚腺苷酸+RNA。随后,将得到的mRNA用作模板,使用寡dT引物和反转录酶合成单链cDNA,使用DNA合成酶I、DNA连接酶、RNA酶H等从单链cDNA合成双链cDNA。使用T4 DNA合成酶,将合成的双链cDNA平端化,进行衔接子(例如EcoRI衔接子)的连接、磷酸化等,掺入λ噬菌体例如λgt11,然后体外包装,以制备cDNA文库。除了λ噬菌体以外,可以使用质粒载体来制备cDNA文库。此后,可以从cDNA文库选择具有目标DNA的菌株(即,阳性克隆)。
当从基因组DNA分离靶基因时,或当分离含有启动子区域和终止子区域的片段时,从源生物的细胞菌株提取基因组DNA,并根据普通技术选择靶基因(Molecular Cloning,1989;Methods in enzymology 194,1991)。例如通过Cryer等人的方法(Methods in Cell Biology,12,39-44,1975)或P.Philippsen等人的方法(Methods Enzymol.,194,169-182,1991),可以提取基因组DNA。当来源是酵母菌株时,例如,制备酵母原生质体,然后对酵母原生质体进行常规技术,例如已知的DNA提取技术、在高盐浓度去除细胞残余物后的醇沉淀技术或在苯酚或氯仿提取后的醇沉淀技术。
通过例如PCR(PCR Technology,Henry A.Erlich,Stockton Press,1989),可以得到靶基因。当通过PCR扩增靶基因时,将合成的20聚体至30聚体单链DNA用作引物,将基因组DNA用作模板。证实扩增的基因的核苷酸序列,然后使用。
通过下述方法可以得到含有序列未知的靶基因的片段:(a)通过常规技术制备基因文库,和(b)从得到的要扩增的基因文库选择目标克隆。通过下述方法可以制备基因文库:通过常规技术从源生物的细胞系得到染色体DNA,用适当的断裂限制酶部分地消化染色体DNA,将得到的片段连接至适当的载体,然后将该载体导入适当的宿主细胞。或者,可以从细胞提取mRNA,可以从其合成cDNA,可以将合成的cDNA连接至适当的载体,并且可以将该载体导入适当的宿主细胞,从而可以制备基因文库。在该情况下,可以使用已知是基因文库制备的常规载体的质粒,可以广泛地使用噬菌体、粘粒或其它载体。根据载体类型,可以选择进行转化或转导的宿主细胞。
通过菌落杂交、噬斑杂交或包含使用含有靶基因特异性序列的标记探针的其它方式,可以从上面的基因文库选择携带靶基因片段的克隆。
也可以对靶基因进行化学全合成。例如,制备2对互补的寡核苷酸,然后退火,在DNA连接酶的辅助下连接几个退火的DNA链,或制备几个部分互补的寡核苷酸,通过PCR填充缺口。从而,可以合成基因。
通过常规技术,例如双脱氧方法(Sanger等人,Proc.Natl.Acad.Sci.,U.S.A.,74,5463-5467,1977),可以测定基因的DNA序列。此外,使用可商业得到的测序试剂盒等,可以容易地测定上述DNA核苷酸序列。
2.表达载体
本发明提供了包含激活的HAC1基因或RRBP1基因的载体,或包含激活的HAC1基因和RRBP1基因两者的载体。为了在宿主细胞中表达激活的HAC1基因和RRBP1基因,可以将包含激活的HAC1基因或RRBP1基因的载体用于实现转化。或者,包含这两个基因的载体可以用于实现转化。这样的表达载体也可以包含编码外源蛋白的基因。或者,可以分别制备包含编码外源蛋白的基因的表达载体。在该情况下,将载体共转染进宿主细胞。
编码外源蛋白的基因没有特别限制。实例包括:各种酶基因,例如α-淀粉酶基因和α-半乳糖苷酶基因;可药用的各种干扰素基因和生理活性蛋白,例如干扰素α和干扰素γ;各种白介素基因,例如IL1和IL2;各种细胞因子基因,例如促红细胞生成素(EPO)基因和粒细胞集落刺激因子(G-CSF)基因;和生长因子基因。这些基因可以通过任意方式来得到。
本发明对于高度疏水的蛋白和由于组分形成而分泌生产不足的蛋白是特别有效的。因而,前述的外源蛋白包括多聚体蛋白,例如抗体或它的功能片段,即,异多聚体。
可以将表达调节区适当地添加到激活的HAC1基因、RRBP1基因或编码外源蛋白的基因,以将表达载体构成蛋白表达单元。蛋白表达单元按照转录读码框的方向包含至少一个启动子区、上述基因和转录终止子区。这里可以使用的启动子可以是诱导型表达启动子或组成型表达启动子。诱导型表达启动子的实例包括参与甲醇同化酵母的甲醇代谢的启动子,例如醇氧化酶(AOX)基因启动子,二羟基丙酮合酶(DAS)基因启动子,和甲酸脱氢酶(FDH)启动子。可以使用的另一种诱导型启动子的实例是铜-诱导型(CUP)启动子。组成型表达启动子的实例包括甘油醛-3-磷酸脱氢酶(TDH,GAP)基因、磷酸甘油激酶(PGK)基因、磷酸丙糖异构酶(TPI)基因、烯醇酶(ENO)基因、肌动蛋白(ACT)基因、细胞色素c(CYC)基因、海藻糖合酶(TPS)基因和醇脱氢酶(ADH)基因的启动子。转录终止子也可以是具有终止启动子的转录的活性的序列。它可以是启动子的相同或不同基因的序列。
为了实现外源蛋白的高水平分泌生产,必须使用有效的启动子。当尝试使用高活性启动子来生产不容易折叠或不容易分泌的蛋白时,可能不利地发生分泌过少。这样的分泌过少因为下述原因而发生。也就是说,蛋白生产超过了在其中进行翻译的核糖体的容量和在其中进行折叠和分泌的内质网的容量。这造成大量生产的蛋白在细胞中变性、积累、遍在蛋白化,和被蛋白体降解。因此,可以适当选择达到下述程度的表达水平的启动子:得到的蛋白会变性,且不会发生聚集,或得到的蛋白不会超过分泌容量。或者,可以减弱启动子的活性,然后可以使用感兴趣的启动子。可以如上在多聚体蛋白中所述,影响形成异多聚体的分子。更具体地,分子例如抗体是包含2个分子的异四聚体,所述2个分子各自是要聚集的重链和轻链。因而,表达水平是实现适当足够的重要因素。当激活的HAC1基因的表达强度非常强时,过度应激会施加于细胞,这可能不利地抑制生长。因而,如上所述需要启动子活性的调节和优化。
本发明的表达载体可以包含用于选择转化体的选择标记。例如,酵母的表达载体可以包含选自下述的营养缺陷型标记基因:His1,His2,His3,His4,His5,His6,Leu2,Alg1,Alg2,Alg3,Trp1,Lys2,Ade1,Ade2,Ura3,和Ura5基因。
作为选择标记,除了前述的营养缺陷型标记以外,可以使用赋予对药物的抗性的抗药标记,所述药物例如浅蓝菌素,金担子素,Zeocin,刀豆氨酸,环己酰亚胺,潮霉素,杀稻瘟素,四环素,卡那霉素,氨苄西林,四环素,和新霉素。从而,可以选择转化体。也可以将赋予对乙醇的溶剂抗性、对甘油或盐的渗透抗性、对铜的金属离子抗性等的基因用作标记,从而选择转化体。
3.转化的宿主细胞
本发明的转化的宿主细胞包含导入其中的上面1所述的基因或上面2所述的表达载体。
要转化的宿主细胞的一个实例是真核细胞,优选酵母菌株。酵母菌株的实例包括甲醇同化酵母菌株,例如Ogataea minuta,巴斯德毕赤氏酵母,多形汉逊酵母(安格斯毕赤氏酵母),和博伊丁假丝酵母和酵母菌株,例如啤酒糖酵母,乳酸克鲁维酵母,解脂耶氏酵母,和粟酒裂殖酵母。更具体地,Ogataea minuta YK3菌株(Δoch1Δpep4Δprb1Δyps1Δura3Δade1)可以用作Ogataea minuta菌株,啤酒糖酵母BY4741菌株(MATa Δhis3Δ leu2Δmet15Δ ura3)可以用作啤酒糖酵母菌株,尽管酵母菌株不限于此。
此外,本发明意在获得其中增强了分泌必需的内质网的宿主细胞。因此,本发明适用于动物细胞或其它细胞。
在本发明中,可以通过任意方法将表达载体导入宿主细胞中,只要导入的基因在宿主中稳定存在且充分表达即可。常用的这样的方法的实例包括磷酸钙方法(Ito等人,Agric.Biol.Chem.,48,341,1984),电穿孔(Becker,D.M.等人,1990;Methods.Enzymol.,194,182-187),使用原生质球(Creggh等人,Mol.Cell.Biol.,5,3376,1985),乙酸锂方法(Itoh,H.,1983;J.Bacteriol.153,163-168),和脂转染。
4.生产蛋白的方法
在本发明中,可以如下生产蛋白:通过常规技术培养转化的宿主细胞,从培养产物进行蛋白取样,随后纯化。本文使用的术语“培养产物”是指培养细胞、培养的菌株或破碎的细胞或细菌,以及培养上清液。
根据用于培养宿主细胞的常规方法,可以在培养基中培养转化的宿主细胞。
当转化的宿主细胞是微生物例如酵母时,可以将天然的或合成的培养基用作培养基,只要它含有可被微生物同化的碳源、氮源和无机盐且能有效培养转化体即可。可以使用可被微生物同化的任意碳源,其实例包括:碳水化合物例如葡萄糖,果糖,蔗糖,和淀粉;有机酸例如乙酸和丙酸;和醇例如乙醇和丙醇。氮源的实例包括:氨;无机酸或有机酸的铵盐例如氯化铵,硫酸铵,乙酸铵,和磷酸铵;其它含氮化合物;蛋白胨;肉膏;和玉米浆。无机盐的实例包括:磷酸二氢钾,磷酸氢二钾,磷酸镁,硫酸镁,氯化钠,硫酸铁(I),硫酸锰,硫酸铜,和碳酸钙。根据选择标记的类型,可以向培养基中适当添加抗生素试剂,例如金担子素,氨苄西林,或四环素。或者,可以去除可由补充辅源营养(例如Leu,Ura,或Trp)的基因提供的氨基酸。
当培养转化的宿主细胞时,在酵母的情况下,例如,优选将培养基的pH水平调节至4-7。培养温度是15℃至32℃,优选约28℃。当表达具有复杂空间结构的蛋白作为抗体时,优选在低温进行培养,以便在细胞中更有效地折叠这样的蛋白。培养持续时间通常是约24至1,000小时,培养可以通过批式培养(例如静止、摇动、搅拌或通气培养)或通过连续培养来实现。
通过SDS-PAGE,蛋白印迹,ELISA等,可以证实来自培养产物(即,培养液或培养的细胞)的外源蛋白的基因的表达产物。
通过常规的蛋白分离和纯化技术,可以分离和纯化生产的蛋白。当在培养后在细菌或细胞中生产靶蛋白时,使用例如超声粉碎机、弗氏细胞压碎器、Manton-Gaulin匀浆器、Dinomil等,可以将细菌或细胞粉碎,以获得靶蛋白。当在细菌或细胞外生产靶蛋白时,原样使用培养液,或通过离心等去除细菌或细胞。此后,根据需要如下收集靶蛋白:使用有机溶剂萃取,进行各种色谱技术(例如疏水、反相、亲和、或离子交换色谱),使用分子筛进行凝胶过滤,使用聚丙烯酰胺凝胶进行电泳等。这些技术可以单独地或两种或多种组合地使用。从而,可以分离和纯化靶蛋白。
上述培养和纯化技术是实例,方法不限于此。通过常规的氨基酸分析方法,例如通过Edman降解技术实现的自动化氨基酸测序,可以证实纯化的基因产物的氨基酸序列。
5.抑制O-糖链的方法(或抑制PMT活性的方法)
在本发明中,当酵母用作宿主细胞时,前述的培养优选在抑制蛋白O-甘露糖基转移酶(PMT)活性的条件下进行。
在通过肽O-GalNAc转移酶(主要存在于高尔基体中)添加GalNAc后,在哺乳动物细胞中形成O-糖链。这样的糖链添加发生在蛋白折叠之后。相反,酵母和霉菌细胞中的O-糖链形成是在通过由蛋白-O-甘露糖基转移酶(PMT)基因编码的PMT向蛋白的丝氨酸或苏氨酸残基添加甘露糖之后才启动。这样的添加称作PMT活性。甘露糖的添加与细胞内质网(ER)中的蛋白折叠并行进行。从而,不必要的糖链可能不利地添加到在表达哺乳动物蛋白的情况下不应发生这样的添加的部位。结果,这样的不必要的修饰会造成聚集体的不充分形成和更低的活性。
因此,通过在抑制蛋白O-甘露糖基转移酶(PMT)活性的条件下进行培养,可以抑制不必要的O糖链的形成。这也会加速蛋白聚集,并维持蛋白的天然物理性质和活性。在本发明中,通过导入激活的HAC1基因和/或RRBP基因来实现蛋白的高水平分泌生产作用,可以进一步产生协同效应,这通过抑制PMT活性来调节URP增强的O-糖链形成来实现。
通过例如下述的两种方法,可以抑制酵母或霉菌特有的O-糖链的添加。这些方法可以组合进行。
(1)在其抑制参与酵母或霉菌特有的O-糖链的添加的PMT活性的条件下,进行培养和生产。
(2)使用其中抑制参与酵母或霉菌特有的O-糖链的添加的PMT活性的细胞。
通过例如向培养基中加入PMT活性的抑制剂(即,PMT抑制剂),可以抑制上面(1)的蛋白O-甘露糖基转移酶(PMT)活性。可以使用的PMT活性的抑制剂的一个实例是绕丹宁-3-乙酸衍生物(Bioorganic &Medicinal Chemistry Letters 14,pp.3975-3978,2004)。绕丹宁-3-乙酸衍生物的具体实例包括5-[[3,4-(1-苯基甲氧基)苯基]亚甲基]-4-氧代-2-硫代-3-噻唑烷乙酸(在Bioorganic & Medicinal Chemistry Letters,Vol.14,p.3975,2004中所述的化合物(1c))和{(5Z)-4-氧代-5-[3-(1-苯基乙氧基)-4-(2-苯基乙氧基)亚苄基]-2-硫代-1,3-噻唑烷-3-基}乙酸(在Bioorganic &Medicinal Chemistry Letters,Vol.14,p.3975,2004中所述的化合物(5a))。这样的PMT活性的抑制剂(绕丹宁-3-乙酸衍生物)最初被视作抗细菌剂,没有为提高蛋白质量或生产力目的而检查它。在本发明中首次发现了该作用。PMT对于构成酵母菌株壁的甘露糖蛋白的产生而言是重要的。非常低的PMT活性会不利地影响酵母的生长。因此,当使用诱导型表达系统时,随着细胞生长在表达外源蛋白的基因时添加PMT活性抑制剂是更有效的。从而,可以在最高水平生产其中抑制了O-糖链修饰的高质量靶蛋白。
通过破坏PMT基因或抑制该基因的表达,可以抑制上面(2)所述的蛋白O-甘露糖基转移酶(PMT)活性。在啤酒糖酵母中,PMT由至少6个基因编码;即,PMT1基因(GenBank:L19169),PMT2基因(GenBank:L05146),PMT3基因(GenBank:X83797),PMT4基因(GenBank:X83798),PMT5基因(GenBank:X95644),和PMT6基因(GenBank:Z72984),这些基因独立地形成同二聚体(PMT4p)或异二聚体(PMT1p/PMT2p),且表现出活性。已知效应PMT随糖蛋白而异。在本发明中,发现PMT蛋白在向抗体添加O-糖链方面具有选择性。具体而言,在PMT5或PMT6基因缺陷型菌株中没有发现抑制O-糖链添加的作用,如实施例所述。
因而,PMT对于酵母的生长而言是重要的基因。当消除或极端降低活性、例如破坏PMT基因时,细胞壁会变脆。因而,PMT基因缺陷型菌株的使用需要注意。在WO 2002/046437中公开的PMT基因的破坏不总是有效的。它有时由于生长抑制而不利地影响外源蛋白的生长,希望抑制具有最佳PMT活性的PMT基因的破坏或表达,这可以使对靶蛋白的O-糖链添加和修饰最小化。抑制PMT基因的方法的实例包括,涉及使用反义RNA或RNAi的方法,和减弱启动子的方法。在本发明中,证实了在其中将DNA片段插入PMT结构基因部分和启动子区来切割基因的方法(在下文中,这样的方法可以称作“基因的插入灭活”,用于基因的插入灭活的质粒载体称作“插入灭活载体”)是减弱启动子的方式的一个实例。也可以采用这样的方法,其中导入不具有PMT活性但是作为蛋白产生的PMT基因片段或其活性相关氨基酸残基已经突变的基因,以抑制PMT活性(即,显性失活方法)。
实现本发明的最佳模式
在下文中,参考实施例详细描述本发明,尽管本发明的技术范围不限于实施例。在本发明的实施例中使用的质粒、限制酶、DNA修饰酶等是可商业得到的产品,这些产品可以根据常规技术使用。DNA克隆、核苷酸测序、宿主细胞转化、转化的宿主细胞的培养、从培养产物取样和纯化酶等的操作也是本领域众所周知的,可以从现有的出版物获知。
[实施例1]表达外源基因的质粒的构建
(1)构建表达外源基因的串联载体,其包含具有作为标记的G418-抗性基因的AOX1基因启动子、终止子盒和GAP基因启动子和终止子盒
在WO 2003/091431中公开的pOMex3G和pOMexGP1U用作材料。用XbaI切割pOMex3G,平端化,然后导入SpeI接头。得到的载体称作pOMex3GXS。单独地,用EcoT22I切割pOMexGP1U,并平端化,然后导入ApaI接头。得到的载体称作pOMexGP1UTA。用HindIII和KpnI消化pOMexGP1UTA,并平端化。此后,用ApaI消化分离的含有GAP启动子和终止子的约2.0kb的片段,然后导入平端化的pOMex3GXS。得到的载体称作pOMexGAT-G。pOMexGAT-G是包含AOX1表达盒内的SpeI-BamHI位点和GAP表达盒内的SalI-ApaI位点的串联载体。
(2)使用ADE1基因作为选择标记,使用GAP基因启动子和终止子构建表达外源基因的载体
在WO 2003/091431中公开的pOMex4A用作材料。用EcoT22I处理前述的pOMexGP1U,并平端化,然后导入BamHI接头。得到的载体称作pOMexGP2U。用SalI处理pOMexGP2U,并平端化,然后导入SpeI接头。得到的载体称作pOMexGP3U。用HindIII和KpnI消化pOMexGP3U,分离含有GAP表达盒的约2.0kb的片段。将得到的片段连接至包含通过用HindIII-KpnI处理pOMex4A分离的ADE1标记的约5.0kb片段。得到的载体称作pOMexGP1A。pOMexGP1A是包含GAP表达盒内的SpeI-BamHI位点的表达外源基因的载体。
(3)使用潮霉素B-抗性基因作为选择标记,使用磷酸甘油激酶(PGK1)启动子和终止子构建表达外源基因的载体
从Ogataea minuta IFO10746菌株得到编码磷酸甘油激酶的PGK1基因,并测定其核苷酸序列。
(3-1)探针的制备
以下述方式合成包含与源自啤酒糖酵母(GenBank登记号:P00560)和麦芽糖假丝酵母(GenBank登记号:P41757)的保守氨基酸序列即RVDFNVPLD和EGKELPGVA相对应的核苷酸序列的DNA简并引物。
PPG5:5′-GN GTN GAY TTY AAY GTN CCN TTR GA-3′(SEQ IDNO:1)
PPG3:5′-GY NAC DCC NGG YAA YTC YTT DCC YTC-3′(SEQ IDNO:2)
PPG5引物(SEQ ID NO:1)与氨基酸序列RVDFNVPLD相对应,PPG3引物(SEQ ID NO:2)是与氨基酸序列EGKELPGVA相对应的核苷酸序列的互补链的序列。O.minuta IFO10746菌株的染色体DNA用作模板,使用PPG5和PPG3引物进行PCR,该PCR在94℃进行30秒,在50℃进行1分钟,在72℃进行1分钟,该循环重复25次。回收扩增的DNA片段(约1.2kb),并使用TOPO TA克隆试剂盒克隆。从得到的克隆分离质粒DNA,并测定核苷酸序列。从而,选择在质粒插入的DNA片段中含有编码与源自啤酒糖酵母和麦芽糖假丝酵母的PGK1基因的氨基酸序列具有高度同源性的氨基酸序列的核苷酸序列的克隆。在用EcoRI切割质粒后,回收1.2-kb插入DNA的片段,随后进行琼脂糖凝胶电泳。
(3-2)文库的制备和筛选
用不同的限制酶切割O.minuta IFO10746菌株的染色体DNA,并进行0.8%琼脂糖凝胶电泳。将分离的DNA转移到Hybond N+尼龙膜(Amersham)上。使用AlkPhos DIRECT(Amersham)标记在上面(1-3-1)中得到的DNA片段,随后进行DNA印迹杂交。根据常规技术(Molecularcloning第2版,Sambrook,J.,等人编,Cold Spring Harbor LaboratoryU.S.A.,1989)进行杂交。结果,认为PGK1基因存在于约9.0kb的BamHI片段中。为了克隆该DNA片段,制备了基因组文库。用BamHI切割O.minuta的染色体DNA,并进行琼脂糖电泳,从凝胶回收约9.0kb的DNA片段。将回收的DNA片段连接至BamHI-切割的pUC118,并根据Hanahan的方法(Gene,10,63,1980)转化进大肠杆菌DH5α菌株,以制备文库。使用前述的DNA片段作为探针,通过菌落杂交筛选约4,000个克隆。从得到的阳性克隆中,选择携带PGK1基因的pOMPGK1质粒。
(3-3)核苷酸测序
通过引物步移方法,测定pOMPGK1质粒的BamHI区域的核苷酸序列,发现测定的序列具有SEQ ID NO:3所示的核苷酸序列。SEQ IDNO:3所示的核苷酸序列包括一个可读框,后者包含从核苷酸4,766至6,016的1,254个碱基对。检查基于可读框推导出的SEQ ID NO:4所示的氨基酸序列与源自啤酒糖酵母和麦芽糖假丝酵母的和磷酸甘油激酶之间的同源性。结果,发现前一种同源性是74%,后一种同源性是81%。
(3-4)使用PGK1基因启动子和终止子构建外源基因表达盒
制备表达盒,其将外源基因导入含有PGK1基因启动子的片段和含有O.minuta的终止子的片段之间。为了在PGK1基因启动子和终止子之间导入SpeI、BglII和BamHI位点,合成了下述引物。
OPGK-P-F:
5′-AAGCTTGACAATGTAGGAGATCATAAACACATCGTGCGCGTC-3′(SEQ ID NO:5)
OPGK-P-R:
5′-GGATCCAGATCTCATATGACTAGTTGCTAGTTCTATGCGGCGTTAGTGTTTACACTACGACAGCT-3′(SEQ ID NO:6)
OPGK-T-F:
5′-GGATCCGTGGGATTTGCGTGATCTACGTAGTGGTTATTTT-3′(SEQID NO:7)
OPGK-T-R:
5′-GGTACCGCAGTGAAAGGCGATGCCACCATGTGCAAGGAGTTC-3′(SEQ ID NO:8)
使用上述pOMPGK1作为模板,使用OPGK-P-F引物(SEQ ID NO:5)和OPGK-P-R引物(SEQ ID NO:6)进行PCR,在94℃进行30秒,在55℃进行1分钟,在72℃进行1分钟,该循环重复20次。还使用OPGK-T-F引物(SEQ ID NO:7)和OPGK-T-R引物(SEQ ID NO:8)进行PCR,该PCR在94℃进行30秒,在55℃进行1分钟,在72℃进行1分钟,该循环重复20次。回收扩增的1.5-kb和1.0-kb DNA片段,并使用TOPO TA克隆试剂盒克隆。测定插入DNA片段的核苷酸序列,以选择具有正确核苷酸序列的克隆。将1.5-kb和1.0-kb插入DNA片段分别分离为HindIII-BamHI片段和BamHI-KpnI片段。
将前述的1.0-kb BamHI-KpnI片段导入WO 2003/091431所述的pOMex5H的BamHI和KpnI之间。此后,将前述的1.5-kb HindIII-BamHI片段导入得到的质粒的HindIII和BamHI之间。得到的质粒称作pOMexPGHy。pOMexPGHy是表达外源基因的载体,其包含PGK1基因表达盒内的SpeI,BglII,和BamHI。
[实施例2]抗体基因表达载体的构建
为了克隆源自啤酒糖酵母的MF α1(GenBank登记号:P01149)的分泌信号(下文称作“aMF分泌信号”),合成了下述引物。
Sp-aMFs-F:5′-ACTAGTATGAGATTTCCTTCAATTT-3′(SEQ ID NO:9)
Sl-aMFs-F:5′-GTCGACATGAGATTTCCTTCAATTT-3′(SEQ ID NO:10)
Xb-aMFs-R:5′-AGCTTCAGCCTCTCTTTTATCTAGAGA-3′(SEQ IDNO:11)
以与上述相同的方式得到的啤酒糖酵母的基因组DNA用作模板,使用Sp-aMFs-F引物(SEQ ID NO:9)和Xb-aMFs-R引物(SEQ ID NO:11)进行PCR,该PCR在94℃进行30秒,在55℃进行1分钟,在72℃进行30秒,该循环重复20次。也使用Sl-aMFs-F引物(SEQ ID NO:10)和Xb-aMFs-R引物(SEQ ID NO:11)进行PCR,该PCR在94℃进行30秒,在55℃进行1分钟在72℃进行30秒,该循环重复20次。回收在每个PCR中的约0.3kb的扩增的DNA片段,并使用TOPO TA克隆试剂盒进行克隆。证实插入DNA序列的核苷酸序列,得到的质粒分别称作TOPOaMFsSP和TOPOaMFsSL。
将抗-TRAIL受体抗体基因(WO 2002/094880)用作抗体基因。为了将限制酶位点导入在轻链和重链基因的两端处的位点,合成了下述引物。
Xb-KREAEA-Hc-F:
5′-TCTCTAGATAAAAGAGAGGCTGAAGCTCAGCTGCAGCTGCAGGAGTC-3′(SEQ ID NO:12)
Hc-R-Bg:
5′-CCAGATCTGGATCCTCATTTACCCGGAGACAGGGAGAGG-3′(SEQID NO:13)
Xb-KREAEA-Lc-F:
5′-TCTCTAGATAAAAGAGAGGCTGAAGCTGAAATTGTGTTGACACAGTC-3′(SEQ ID NO:14)
Lc-R-Ap:
5′-AAAGGGCCCTCAACACTCTCCCCTGTTGAAGCTCT-3′(SEQ ID NO:15)
使用这些DNA引物进行PCR,经下述的20个循环扩增轻链:在94℃进行30秒,在55℃进行1分钟,在72℃进行1分钟,并经下述的20个循环扩增重链:在94℃进行30秒,在55℃进行1分钟,在72℃进行1分钟30秒,并将扩增的产物克隆进pCR2.1-TOPO。证实插入DNA序列的核苷酸序列,得到的质粒分别称作TOPOHc-Trail和TOPOLc-Trail。经3片段连接,将通过SalI和XbaI消化从TOPOaMFsSL分离的aMF分泌信号和通过XbaI和ApaI消化从TOPOLc-Trail分离的抗体轻链导入SalI-ApaI-消化的pOMexGAT-G。得到的质粒称作pOMexGAT-G/L。随后,经3片段连接,将通过SpeI和XbaI消化从TOPOaMFsSP分离的aMF分泌信号和通过XbaI和BglII消化从TOPOHc-Trail分离的抗体重链导入SpeI-BamHI-消化的pOMexGAT-G/L。得到的载体称作pOMexGAT-G/Ab(图3)。pOMexGAT-G/Ab是包含抗体重链和轻链表达单元的抗体表达载体。
[实施例3]O.Minuta的激活的HAC1基因表达载体的构建
如下得到激活的HAC1基因:在27℃在YPD培养基中培养细胞(O.minuta YK2-3菌株)12小时,在培养基中加入衣霉素至10μg/ml的浓度,以便诱导UPR。在含有衣霉素的培养基中培养另外12小时。收集细胞后,使用Yeastar RNA试剂盒(ZYMO research)制备mRNA。
使用DNA酶I Amplification Grade(Invitrogen),对得到的mRNA进行DNA酶处理。使用Super script III用于RT的第一链合成(Invitrogen),从mRNA合成cDNA。使用下述的HAC1-1 DNA引物(SEQID NO:16)和HAC1-12引物(SEQ ID NO:17),通过PCR扩增得到的cDNA:在94℃进行30秒,在52℃进行30秒,在72℃进行1分钟,该循环重复30次。将扩增的产物克隆进pCR2.1-TOPO(Invitrogen)。此后,证实两类PCR-扩增的基因片段的核苷酸序列(SEQ ID NO:18和19)。
HAC1-1:5′-ATGACTTCCTTTTCAGCACCGCATC-3′(SEQ ID NO:16)
HAC1-12:5′-CAAAATTGCAAGCAAGTTAACCG-3′(SEQ ID NO:17)
得到的两类cDNA片段之一与基因组序列相一致;但是,另一个片段是缺少其一部分的缩短的序列,即,由UPR激活的Ire1p剪接的cDNA片段。为了得到激活的HAC1的cDNA,使用cDNA合并物重复在94℃进行30秒、在55℃进行1分钟和在72℃进行30秒的PCR循环20次,推导出它含有speHAC1F DNA引物(SEQ ID NO:20)、bglHAC1R引物(SEQ ID NO:21)和激活的HAC1的cDNA。
speHAC1F:5′-gactagtATGACTTCCTTTTCAGCACCG-3′(SEQ IDNO:20)
bglHAC1R:5′-cagatctTCATGACAAGAAATCATCGAAT-3′(SEQ IDNO:21)
得到的约1kb的片段包含从激活的HAC1基因的起始密码子至终止密码子的序列(SEQ ID NO:22),它等同于包含320个氨基酸残基的激活的Hac1p的氨基酸序列(SEQ ID NO:23)。用SpeI和BglII处理该序列,分离,然后导入SpeI-BglII-处理过的pOMexPGHy。得到的载体称作pOMexPGHy/Hac1(图3)。该载体包含激活的HAC1基因表达单元。
[实施例4]人RRBP1基因表达载体的构建
使用由Kazusa DNA研究机构提供的人RRBP1基因(KIAA1398,GenBank登记号AB037819)。为了在该基因的两个末端部导入限制酶位点,使用下述DNA引物,即p180 MSp-F和p180 UBg-R(SEQ ID NO:24和25)和人RRBP1基因,经20个在94℃进行30秒、在55℃进行1分钟和在72℃进行5分钟的循环,通过PCR扩增目标基因。
p180 MSp-F:
5′-ATACAATACAAAGTCGAGACTAGTATGGATATTTACGACACTCAAACCTT-3′(SEQ ID NO:24)
p180 UBg-R:
5′-TCTATCCACACGGATCAGATCTTCAGACAGAGGTGCCCTCCTTTGAGCTG-3′(SEQ ID NO:25)
使用BD In-Fusion Dry-Down PCR克隆试剂盒(BD Science),将得到的约4.5kb的片段导入SpeI-BamHI-消化的pOMexGP1A。从SpeI位点确定包含编码人RRBP1基因起始密码子的区域的约500bp序列,并从BamHI位点确定包含编码人RRBP1基因终止密码子的区域的约500bp片段。得到的载体称作pOMexGP1A/p180PCR。用NdeI和AscI消化pOMexGP1A/p180PCR,从质粒去除包含人RRBP1基因的ORF中从110bp至4541bp的区域的片段。单独地,用NdeI和AscI消化由Kazusa DNA研究机构提供的人RRBP1基因,分离包含ORF的110bp至4541bp的区域的片段,将分离的片段导入前述的NdeI-AscI-消化的pOMexGP1A/p180PCR。得到的载体称作pOMexGP1A/p180(图3)。pOMexGP1A/p180是人RRBP1基因表达载体。
[实施例5]表达抗体的酵母菌株(O.minuta)的制备
使用NotI-消化的pOMexGAT-G/Ab载体,通过电穿孔转化O.minuta YK-3菌株(在WO 2003/091431中所述的Δoch1Δpep4Δprb1Δyps1Δura3Δade1)。采用在WO 2003/091431中所述的电穿孔条件。在含有50μg/ml G418的YPD琼脂平板培养基中选择转化的细胞,并培养。此后,提取基因组,使用前述的Xb-KREAEA-Hc DNA引物(SEQ ID NO:12)和Hc-R-Bg引物(SEQ ID NO:13),通过PCR证实重链的导入,并使用前述的Xb-KREAEA-Lc-F引物(SEQ ID NO:14)和Lc-R-Ap引物(SEQ ID NO:15),通过PCR证实轻链的导入。已经观察到重链和轻链基因的导入的菌株,称作产抗体的O.minuta AO1菌株。
[实施例6]表达激活的HAC1基因和RRBP1基因的产抗体酵母菌株(O.minuta)的制备
通过电穿孔,将Sse8783I-消化的pOMexGP1A/p180导入在实施例5中生长的产抗体的O.minuta AO1菌株。如下得到转化的菌株:在SD琼脂平板培养基中选择ADE+菌株,培养该菌株,提取基因组,使用上述的p180 MSp-F(SEQ ID NO:24)和p180 UBg-R(SEQ ID NO:25),通过PCR证实RRBP1基因的导入。得到的转化菌株称作O.minuta AK2R菌株。同时,使用Sse8783I-消化的pOMexGP1A进行转化,得到O.minutaAK2A菌株作为对照。此外,通过电穿孔,将Aor51HI-消化的pOMexPGHy-Hac1导入O.minuta AK2R菌株和O.minuta AK2A菌株。如下证实激活的HAC1基因向转化菌株中的导入:在包含50μg/ml潮霉素的YPD琼脂平板培养基中选择菌株,培养该菌株,提取基因组,并使用speHAC1F DNA引物(SEQ ID NO:20)和bglHAC1R引物(SEQ IDNO:21),通过PCR确认。得到的菌株分别称作O.minuta AK3RH菌株和O.minuta AK3AH菌株。同时,将Aor51HI-消化的pOMexPGHy导入O.minuta AK2R菌株和O.minuta AK2A菌株,以得到O.minutaAK3RHy菌株和O.minuta AK3AHy菌株作为对照。
[实施例7]转化的酵母菌株(O.minuta)分泌抗体的证实
在28℃,在BYPMG培养基(1%酵母提取物(Difco),2%多聚胨(Difco),1.5%甲醇,0.5%甘油,和0.1M磷酸盐缓冲液(pH 6.0))中培养O.minuta AK3RH、O.minuta AK3AH、O.minuta AK3RHy、和O.minutaAK3AHy菌株4天。从培养液制备培养上清液,并进行SDS-PAGE。将分离的蛋白在PVDF膜上印迹,使用标记的抗-人抗体(抗-人Fc抗体和抗-人κ抗体),进行蛋白印迹分析。结果,发现已经导入RRBP1基因和激活的HAC1基因的菌株会分泌比其它菌株明显更大量的抗体,如图4所示。
[实施例8]转化的酵母菌株(O.minuta)的分泌抗体的生产力
使用蛋白A柱(Poros A 50um 4.6mm D/50mml,AppliedBiosystems),对在实施例7中制备的培养液进行HPLC,以测量抗体产量(分离条件:平衡缓冲液:10mM磷酸盐缓冲液(pH 6.0);洗脱缓冲液:10mM磷酸盐缓冲液(pH 3.4);流速:4ml/min;检测:210nm)。使用在动物细胞(CHO)中生产的抗体作为标准样品。图5显示了按照OD 600=1的抗体生产力。与对照菌株即O.minuta AK3AHy菌株中的量相比,在仅导入RRBP1基因的O.minuta AK3RHy菌株中和在仅导入激活的HAC1基因的O.minuta AK3AH菌株中,分泌的抗体的量趋向增加。但是,在表达激活的HAC1基因和RRBP1基因两者的O.minuta AK3RH菌株中的抗体生产量,显著大于对照菌株即O.minuta AK3AHy菌株和已经单独导入激活的HAC1基因或RRBP1基因的菌株。因而证实了,激活的HAC1基因和RRBP1基因的共表达会对抗体生产力产生超过协同效应的作用。
[实施例9]在抑制O-糖链形成的条件下使用转化的酵母菌株(O.minuta)生产抗体
在BYPG培养基(1%酵母提取物(Difco),2%聚胨(Difco),0.5%甘油,和0.1M磷酸盐缓冲液(pH 6.0))中培养O.minuta AK3RH和O.minutaAK3AHy 2天,在28℃在BYPM培养基[1%酵母提取物(Difco),2%聚胨(Difco),1.5%甲醇,和0.1M磷酸盐缓冲液(pH 6.0)]中培养这些菌株2天,所述BYPM培养基中已经加入了0μM,1μM,5μM,10μM,20μM,和50μM PMT抑制剂(绕丹宁-3-乙酸衍生物:5-[[3,4-(1-苯基甲氧基)苯基]亚甲基]-4-氧代-2-硫代-3-噻唑烷乙酸(在Bioorganic & MedicinalChemistry Letters,Vol.14,p.3975,2004中所述的化合物(1c)))。从培养液制备培养上清液,并进行SDS-PAGE。此后,将分离的蛋白在PVDF膜上印迹,使用标记的抗-人抗体(抗-人Fc抗体)进行蛋白印迹分析。图6显示了结果。要加入的PMT抑制剂的适当浓度是5μM。在该情况下,抗体分泌量和聚集体形成百分比都增加。
[实施例10]抗体基因表达载体的构建
为了表达源自啤酒糖酵母的MF α1(GenBank登记号:P01149)的分泌信号(下文称作“aMF分泌信号”)、抗-TRAIL受体抗体的轻链和其重链的融合蛋白,使用下述寡核苷酸引物,通过重叠延伸PCR,将aMF分泌信号基因连接至抗-TRAIL受体抗体基因(WO 2001/083560)。
对于aMF分泌信号-抗TRAIL受体抗体的重链
EcoALF:5′-GGAATTCATGAGATTTCCTTCAAT-3′(SEQ ID NO:26)
AlfH02:5′-CTCCACCAGCTGTACTTCTCTTTTCTCGAGAGATA-3′(SEQ ID NO:27)
AlfH03:
5′-TATCTCTCGAGAAAAGAGAAGTACAGCTGGTGGAG-3′(SEQ IDNO:28)
AlfH04:5′-GGTCGACTCATTTACCCGGGGACAG-3′(SEQ ID NO:29)
对于aMF分泌信号-抗TRAIL受体抗体的轻链
EcoALF:5′-GGAATTCATGAGATTTCCTTCAAT-3′(SEQ ID NO:26)
AlfL02:5′-TGGGTCATCTGAATGTCTCTTTTCTCGAGAGATA-3′(SEQ ID NO:30)
AlfL03:5′-TATCTCTCGAGAAAAGAGACATTCAGATGACCCA-3′(SEQ ID NO:31)
AlfL04:5′-GGTCGACCTAACACTCTCCCCTGT-3′(SEQ ID NO:32)
使用用Y-DER酵母DNA提取试剂(PIERCE)制备的啤酒糖酵母的基因组DNA作为模板,扩增aMF分泌信号基因区。使用EcoALF引物(SEQ ID NO:26)和AlfH02引物(SEQ ID NO:27),通过PCR得到重链的aMF分泌信号,所述PCR在95℃进行10秒,在55℃进行30秒,在68℃进行60秒,该循环重复30次。使用EcoALF引物(SEQ ID NO:26)和AlfL02引物(SEQ ID NO:30),通过PCR得到轻链的aMF分泌信号,所述PCR在95℃进行10秒,在55℃进行30秒,在68℃进行60秒,该循环重复30次。回收约0.26kb的扩增的靶DNA片段。
使用抗-TRAIL受体抗体的cDNA(WO2001/083560)作为模板,扩增抗体基因区。使用AlfH03引物(SEQ ID NO:28)和AlfH04引物(SEQ IDNO:29),通过PCR得到重链片段,所述PCR在95℃进行10秒,在55℃进行30秒,在68℃进行90秒,该循环重复30次。使用AlfL03引物(SEQ ID NO:31)和AlfL04引物(SEQ ID NO:32),通过PCR得到轻链片段,所述PCR在95℃进行10秒,在55℃进行30秒,在68℃进行90秒,该循环重复30次。回收约1.35kb的扩增的重链区域的靶DNA片段和约0.65kb的轻链区域的靶DNA片段。
随后,将重链的aMF分泌信号区域和约1.35kb的重链区域用作模板,使用EcoALF引物(SEQ ID NO:26)和AlfH04引物(SEQ ID NO:29),进行PCR,该PCR在95℃进行10秒,在55℃进行30秒,在68℃进行90秒,该循环重复30次。回收约1.6kb的扩增的靶DNA片段。还将轻链的aMF分泌信号区域和约0.65kb的轻链区域用作模板,使用EcoALF引物(SEQ ID NO:26)和AlfL04引物(SEQ ID NO:32),进行PCR,该PCR在95℃进行10秒,在55℃进行30秒,在68℃进行60秒,该循环重复30次。回收约0.9kb的扩增的靶DNA片段。将回收的DNA片段克隆进pCR2.1-TOPO。基于插入DNA片段的核苷酸序列,发现这些序列具有这样的基因,其中aMF分泌信号已经框内融合于抗体重链,aMF分泌信号已经框内融合于抗体轻链。得到的质粒分别称作TOPO-alfHc和TOPO-alfLc。将导入EcoALF引物(SEQ ID NO:26)的EcoRI限制酶位点和导入AlfH04引物(SEQ ID NO:29)和AlfL04引物(SEQ ID NO:32)的SalI限制酶位点,用于通过TOPO-alfHc和TOPO-alfLc的EcoRI-SalI消化,回收编码aMF分泌信号和抗体重链的融合产物和aMF分泌信号和抗体轻链的融合产物的DNA片段。
为了在啤酒糖酵母中表达抗体重链和抗体轻链,将通过EcoRI-SalI消化回收的编码aMF分泌信号和抗体重链的融合产物和aMF分泌信号和抗体轻链的融合产物的DNA片段连接至甘油醛-3-磷酸脱氢酶基因(TDH3,GAP)启动子-终止子盒中的EcoRI-SalI位点,该盒已经导入YEp352大肠杆菌-酵母穿梭载体(Yeast 2,p.163-167,1986)。得到的质粒分别称作YEp352GAP-II-alfHc和YEp352GAP-II-alfLc。随后,将在GAP启动子-终止子盒的2个末端的BamHI限制酶位点用于分别从YEp352GAP-II-alfHc和YEp352GAP-II-alfLc回收编码BamHI-GAP启动子-aMF分泌信号-抗体重链-GAP终止子-BamHI的基因片段(片段1)和编码BamHI-GAP启动子-aMF分泌信号-抗体轻链-GAP终止子-BamHI的基因片段(片段2)。通过3片段连接,将片段1和2导入YEp352GAP-II-alfHc或Ep352GAP-II-alfLc的BamHI位点,从中切割片段1或2。得到的载体称作YEp352 GAP-II-alfHc/alfLc(图7)。基于限制酶切割图谱,证实了片段1和2以正向在YEp352 GAP-II-alfHc/alfLc中的串联导入。YEp352 GAP-II-alfHc/alfLc是携带抗体重链和轻链表达单元的抗体表达载体。
[实施例11]啤酒糖酵母激活的HAC1基因表达载体的构建
激活的IRE1的RNA酶活性从啤酒糖酵母的HAC1前体mRNA去除252个核苷酸,形成成熟的HAC1 mRNA。该成熟的HAC1 mRNA翻译成激活的HAC1,从其C末端去除10个氨基酸残基,并新添加18个氨基酸残基(PNAS 97,pp.4660-4665,2000)。从而,使用下述寡核苷酸引物,通过重叠延伸PCR,构建编码激活的HAC1的基因。
HAC-Sac-ATG:5′-GGAGCTCATGGAAATGACTGATTTTG-3′(SEQID NO:33)
HAC-内部R:
5′-GAATTCAAACCTGACTGCGCTTCTGGATTACGCCAATTGTCAAG-3′(SEQ ID NO:34)
HAC-内部F:
5′-CTTGACAATTGGCGTAATCCAGAAGCGCAGTCAGGTTTGAATTC-3′(SEQ ID NO:35)
HAC-Sma-STOP:5′-GCCCGGGTCATGAAGTGATGAAGAAATC-3′(SEQ ID NO:36)
将使用Y-DER酵母DNA提取试剂(PIERCE)制备的啤酒糖酵母基因组DNA用作模板。使用HAC-Sac-ATG引物(SEQ ID NO:33)和HAC-内部R引物(SEQ ID NO:34)进行PCR,该PCR在95℃进行10秒,在55℃进行30秒,在68℃进行60秒,该循环重复30次。单独地,使用HAC-内部F引物(SEQ ID NO:35)和HAC-Sma-STOP引物(SEQ ID NO:36)进行PCR,该PCR在95℃进行10秒,在55℃进行30秒,在68℃进行60秒,该循环重复30次。回收约0.66kb(片段A)和约0.06kb(片段B)的扩增的靶DNA片段。
随后,将扩增的片段A和片段B用作模板,使用HAC-Sac-ATG引物(SEQ ID NO:33)和HAC-Sma-STOP引物(SEQ ID NO:36)进行PCR,该PCR在95℃进行10秒,在55℃进行30秒,在68℃进行60秒,该循环重复30次,以得到约0.7kb的扩增的靶DNA片段。将回收的DNA片段克隆进pCR2.1-TOPO。基于插入DNA片段的核苷酸序列,发现该片段具有编码含有238个氨基酸残基的激活的HAC1的基因。该质粒称作TOPO-aHac1。使用已经导入HAC-Sac-ATG引物(SEQ ID NO:33)中的SacI限制酶位点和已经导入HAC-Sma-STOP引物(SEQ ID NO:36)中的SmaI限制酶位点,通过SacI-SmaI消化来回收编码激活的HAC1的基因。
为了在啤酒糖酵母中表达激活的HAC1,将通过SacI-SmaI消化回收的编码激活的HAC1的基因连接至甘油醛-3-磷酸脱氢酶基因(TDH3,GAP)启动子-终止子盒中的SacI-SmaI位点位点,该盒已经导入YEp351大肠杆菌-酵母穿梭载体(Yeast 2,pp.163-167,1986)。得到的质粒称作YEp351GAP-II-aHAC1(图7)。该载体包含激活的HAC1基因表达单元。
[实施例12]人RRBP1基因表达载体的构建
使用由Kazusa DNA研究机构提供的人RRBP1基因(KIAA1398,GenBank登记号:AB037819)。为了在上述基因的两端都导入限制酶位点,使用下述寡核苷酸引物P180kpnatg和P180xbastop(SEQ ID NO:37和38)和人RRBP1基因,通过PCR扩增基因,该PCR在95℃进行10秒,在55℃进行30秒,在68℃进行6分钟,该循环重复30次。
P180kpnatg:5′-GGGTACCATGGATATTTACGACACTC-3′(SEQ IDNO:37)
P180xbastop:5′-GTCTAGATCAGACAGAGGTGCCCTCC-3′(SEQ IDNO:38)
回收得到的约4.7kb的片段,克隆进pCR2.1-TOPO。基于插入DNA片段的核苷酸序列,证实在插入片段的两端的约600bp的区域都适当地包含目标核苷酸序列。得到的质粒称作TOPO-P180。随后,用NdeI和HpaI限制酶消化TOPO-P180,回收含有与KIAA1398的110bp至4524bp之间的区域等同的区域的片段。向取出的区域中导入KIAA1398的约4.4kb的NdeI-HpaI片段,以构建TOPO-P180N,使用大肠杆菌SCS110菌株(Stratagene)使XbaI限制酶位点去甲基化。使用已经导入P180kpnatg引物(SEQ ID NO:37)和P180xbastop引物(SEQ ID NO:38)中的KpnI-XbaI限制酶位点,回收包含编码RRBP1的基因的KpnI-XbaI片段。
为了在啤酒糖酵母中表达RRBP1,将上面回收的KpnI-XbaI片段连接至甘油醛-3-磷酸脱氢酶基因(TDH3,GAP)启动子-终止子盒中的KpnI-XbaI位点,该盒已经导入YEp352大肠杆菌-酵母穿梭载体(Yeast 2,pp.163-167,1986)。得到的质粒称作YEp352GAP-II-p180。随后,用PvuI限制酶消化YEp352GAP-II-p180,回收含有GAP启动子-RRBP1基因-GAP终止子的PvuI片段。将PvuI片段连接至包含标记基因的PvuI片段,即YEp351大肠杆菌-酵母穿梭载体(Yeast 2,pp.163-167,1986)的复制必需的区域,以构建YEp351GAP-II-p180(图7)。该载体包含RRBP1基因表达单元。
[实施例13]激活的HAC1基因和RRBP1基因的共表达载体的构建
为了使用单一载体将激活的HAC1基因和RRBP1基因导入啤酒糖酵母,构建了激活的HAC1基因和RRBP1基因的共表达载体。用HpaI限制酶消化在实施例11中构建的YEp351GAP-II-aHAC1。随后,从在实施例12中构建的YEp352GAP-II-p180回收含有GAP启动子-RRBP1基因-GAP终止子的BamHI片段,使用T4DNA聚合酶(Takara Bio)将两个末端平端化,将产物导入YEp351GAP-II-aHAC1的HpaI位点。得到的质粒称作YEp351GAP-II-aHAC1/p180(图7)。分析核苷酸序列,以确定导入含有导入的GAP启动子-RRBP1基因-GAP终止子的BamHI片段的方向。该载体包含激活的HAC1基因和RRBP1基因的表达单元。
[实施例14]构建表达抗体的酵母菌株和表达激活的HAC1基因和RRBP1基因的表达抗体的酵母菌株(啤酒糖酵母)
使用Frozen-EZ酵母转化II试剂盒(ZYMO RESARCH),制备啤酒糖酵母BY4741菌株的感受态细胞(MATa Δhis3Δ leu2Δmet15Δ ura3)。将啤酒糖酵母BY4741菌株接种进5ml YPAD培养基(含有0.04%腺嘌呤(Sigma)的YPD培养基),使用通过过夜培养(30℃,在310rpm)得到的酵母细胞。使用Frozen-EZ酵母转化II试剂盒(ZYMO RESARCH),将在实施例10至实施例13中构建的表达载体导入啤酒糖酵母BY4741菌株。选择在含有2%琼脂的ST琼脂培养基(酵母氮基和包含2%葡萄糖、0.04%腺嘌呤和0.3M KCl且缺少尿嘧啶和亮氨酸的硫酸铵培养基(Sigma))上生长的转化体作为表达抗体的酵母菌株。
包含抗体重链和轻链表达单元的YEp352 GAP-II-alfHc/alfLc具有补充宿主的需尿嘧啶的突变的URA3标记基因。YEp351 GAP-II(其中没有导入基因的对照载体),YEp351GAP-II-aHAC1(激活的HAC1表达载体),YEp351GAP-II-p180(RRBP1表达载体),和YEp351GAP-II-aHAC1/p180(激活的HAC1基因和RRBP1的共表达载体)各自包含补充宿主的需亮氨酸的突变的LEU2标记基因。从而,将这些载体转化进宿主,使得仅在如下所示联合导入两种载体时基因才生长,以构建4类表达抗体的酵母菌株。
啤酒糖酵母T2K01 YEp352 GAP-II-alfHc/alfLc(URA3)YEp351GAP-II(LEU2)
啤酒糖酵母T2K02 YEp352 GAP-II-alfHc/alfLc(URA3)YEp351GAP-II-aHAC1(LEU2)
啤酒糖酵母T2K03 YEp352 GAP-II-alfHc/alfLc(URA3)YEp351GAP-II-p180(LEU2)
啤酒糖酵母T2K04 YEp352 GAP-II-alfHc/alfLc(URA3)YEp351GAP-II-aHAC1/p180(LEU2)
[实施例15]转化的酵母菌株(啤酒糖酵母)的抗体生产力
在30℃,使用ST培养基培养在实施例14中制备的啤酒糖酵母T2K01、啤酒糖酵母T2K02、啤酒糖酵母T2K03、和啤酒糖酵母T2K04菌株3天。将培养液接种进YPAD培养基,在其中达到5%终浓度,在30℃培养3天。从培养液制备培养上清液,产物称作含有酵母分泌和生产的抗体的样品。通过夹心ELISA,对分泌和生产的抗体进行定量测定。将作为抗-TRAIL受体抗体的抗原的TRAIL受体蛋白吸附到96孔平板上,加入酵母样品,使用过氧化物酶-标记的人IgG特异性的Fc抗体(过氧化物酶标记的亲和纯化的抗人IgG(Fc)抗体(KPL))和ABTS过氧化物酶底物(KPL)进行检测。在动物细胞中生成的抗体(NS0)用作标准样品。
如图8A所示,其中仅导入RRBP1基因的啤酒糖酵母T2K03菌株在生产力方面没有显著不同于对照菌株即啤酒糖酵母T2K01菌株。但是,在仅导入激活的HAC1基因的啤酒糖酵母T2K02菌株的情况下,生产力是对照菌株即啤酒糖酵母T2K01菌株的约2倍。此外,在共表达激活的HAC1基因和RRBP1基因的啤酒糖酵母T2K04菌株的抗体生产力,显著高于对照菌株即啤酒糖酵母T2K01菌株和单独导入激活的HAC1基因或RRBP1基因的菌株(即,比对照高约7倍)。这表明,激活的HAC1基因和RRBP1基因的共表达会对抗体生产力产生等于或大于协同效应的作用。
[实施例16]使用转化的酵母菌株(啤酒糖酵母)在抑制O-糖链形成的条件下的抗体生产力
在30℃,使用ST培养基培养在实施例14中制备的啤酒糖酵母T2K01、啤酒糖酵母T2K02、啤酒糖酵母T2K03、和啤酒糖酵母T2K04菌株3天。以5%终浓度,将培养液接种进在开始已经加入10μM PMT抑制剂(绕丹宁-3-乙酸衍生物:5-[[3,4-(1-苯基甲氧基)苯基]亚甲基]-4-氧代-2-硫代-3-噻唑烷乙酸(在Bioorganic & Medicinal Chemistry Letters,Vol.14,p.3975,2004中所述的化合物(1c))的YPAD培养基,在30℃培养3天。从培养液制备培养上清液,产物称作含有酵母分泌和生产的抗体的样品。以与实施例15相同的方式,使用在动物细胞中生成的抗体(NS0)作为标准样品,通过夹心ELISA对样品进行定量测定。
如图8B所示,导入激活的HAC1基因的啤酒糖酵母T2K02菌株和导入RRBP1基因的啤酒糖酵母T2K03菌株的抗体生产力明显高于对照菌株即啤酒糖酵母T2K01菌株。此外,共表达激活的HAC基因和RRBP1基因的啤酒糖酵母T2K04菌株的抗体产量,显著高于对照菌株即啤酒糖酵母T2K01菌株和单独导入激活的HAC1基因或RRBP1基因的菌株(即,比对照高约8倍)。通过抑制O-糖链形成,进一步增强了激活的HAC1基因和RRBP1基因的共表达对抗体生产的协同效应。
[实施例17]Ogataea minuta蛋白酶YPS1基因缺陷型菌株(Δoch1Δyps1Δura3Δade1)的制备
用BamHI和ClaI切割在WO 2003/091431中公开的YPS1基因-缺陷型载体pDOMYP1,通过电脉冲方法转化进WO 2003/091431中公开的O.minuta TK5-3菌株(Δoch1Δura3Δade1)。为了确认破坏了该基因的YPS1基因,合成了下述引物。
DY5;5’-CTCAAGGGCCTGGAGACTACG-3’(SEQ ID NO:49)
DY3;5’-CGGGATTCCCGAGTCGCTCACC-3’(SEQ ID NO:50)
从转化菌株分离的染色体DNA用作模板,使用DY5和DY3引物进行PCR,该PCR在94℃进行30秒,在60℃进行1分钟,在72℃进行2分钟,该循环重复25次。从已经将质粒导入YPS1基因座中的菌株,检测扩增的3.7-kb DNA片段。选择的菌株称作O.minuta YK4菌株(Δoch1Δura3Δade1Δyps1::URA3)。在YPD培养基中培养O.minuta YK4菌株至稳定期后,获得表现出对5-氟乳清酸(5-FOA)的抗性的菌株。将5-FOA抗性菌株的染色体DNA用作模板,使用DY5和DY3引物进行PCR,该PCR在94℃进行30秒,在60℃进行1分钟,在72℃进行3分钟,该循环重复25次。从缺少URA3的菌株检测扩增的1.2-kb DNA片段。该Δoch1Δura3Δade1Δyps1菌株称作O.minuta YK5菌株。
[实施例18]合成抗体基因生产菌株(O.minuta)的制备和抗体生产
(1)合成抗体基因表达载体的构建
用SpeI切割在WO 2003/091431中公开的pOMexGP1U,平端化,然后连接。将得到的质粒的SalI位点和EcoT22I位点分别用SpeI位点和BamHI位点进行接头变化。得到的质粒称作pOMexGP1UΔSp。
从抗-TRAIL受体抗体基因的氨基酸序列(WO2002/094880)设计基因,同时考虑O.minuta的密码子使用频率,从而人工合成抗体基因(Takara Bio)。将啤酒糖酵母SUC2信号或鸡溶菌酶信号添加到轻链和重链基因的N末端,将限制酶位点(在5’侧上的XbaI位点和在3’侧上的BamHI位点)的核苷酸序列添加到2个末端(核苷酸序列:SEQ ID NO:51,53,55,和57;氨基酸序列:SEQ ID NO:52,54,56,和58)。将已经用XbaI和BamHI消化的具有不同信号的两类轻链基因片段导入在实施例1(2)中制备的pOMexGP1A载体。得到的载体分别称作pOMexGPA/AbSUC和pOMexGPA/AbLys。将已经用XbaI和BamH消化的发出不同信号的两类重链基因片段导入pOMexGP1UΔSp载体的SpeI-BamHI位点。得到的载体称作pOMexGPUΔSp/AbSUC和pOMexGPUΔSp/AbLys。
将pOMexPGHy(实施例1(3-4))用作模板,使用PGKHy-F DNA引物(SEQ ID NO:59)和PGKHy-R DNA引物(SEQ ID NO:60)进行PCR,该PCR在94℃进行30秒,在55℃进行30秒,在72℃进行1分钟,该循环重复20次。从而,扩增潮霉素B-抗性基因。
PGKHy-F:
5’-ATAGAACTAGCAACTAGATGAAAAAGCCTGAACTCAC-3’(SEQID NO:59)
PGKHy-R:
5’-CAAATCCCACGGATCACTATTCCTTTGCCCTCGGAC-3’(SEQ IDNO:60)
使用in-fusion试剂盒(BD Bioscience),将扩增的基因片段导入SpeI-BglII-消化的pOMexPGHy,并测定插入片段的核苷酸序列。得到的质粒用作模板,使用PGKpUC-p DNA引物(SEQ ID NO:61)和PGKpUC-tDNA引物(SEQ ID NO:62)进行PCR,该PCR在94℃进行30秒,在55℃进行30秒,在72℃进行2分钟,该循环重复20次。从而,扩增含有PGK启动子-潮霉素B抗性基因-PGK终止子的基因片段。
PGKpUC-p:
5’-AATTCGAGCTCGGTACAGGGATACATGGGATACCAAAG-3’(SEQID NO:61)
PGKpUC-t:
5’-GAGGATCCCCGGGTACCAGGGTCGATTTTCTTGGTCGA-3’(SEQID NO:62)
使用in-fusion试剂盒(BD Bioscience),将扩增的基因片段导入Asp718I-消化的pUC118(Takara Bio),并测定插入片段的核苷酸序列。得到的质粒称作PGKHyg/pUC118。用HindIII和KpnI消化pOMexGP1UΔSp,分离包含GAP启动子-终止子的盒,将分离的盒插入HindIII-KpnI消化的PGKHyg/pUC118。得到的质粒称作GAP/HyG/pUC118。随后,用NdeI和EcoRI消化pUC19(Takara Bio),平端化,然后连接,以去除在pUC19内的NdeI-EcoRI区域。用HindIII-SacI消化该质粒,导入包含通过HindIII-SacI消化从GAP/HyG/pUC118分离的GAP启动子-终止子和PGK启动子-潮霉素B抗性基因-PGK终止子的基因片段。得到的质粒称作pOMexHy。
将已经添加XbaI-BamH消化的鸡溶菌酶信号的抗体重链基因片段导入SpeI-BamHI处理过的pOMexHy,得到的载体称作pOMexHy/AbLys。
(2)表达抗体基因的酵母菌株的制备
通过电穿孔,使用NotI-消化的抗体表达载体即pOMexGPA/AbLys和pOMexGPUΔSp/AbLys来转化O.minuta YK5菌株(Δoch1Δyps1Δura3Δade1)。使用在WO 2003/091431中描述的电穿孔条件。在SD琼脂平板培养基(2%葡萄糖,0.67%酵母氮基(Difco))中选择转化的细胞。在27℃在B2YP4G培养基(1.34%酵母氮基(Difco),2%酵母提取物(Difco),4%聚胨(Difco),4%甘油,和0.1M磷酸盐缓冲液(pH6.0))中培养单个菌落4天。从培养液制备培养上清液,按照实施例7所述的方式进行蛋白印迹分析,以选择其中已经导入抗体轻链和重链基因的生产抗体的菌株,得到的菌株称作O.minuta AA1菌株。如图9所示,O.minuta AA1菌株分泌的抗体的量显著大于在实施例5中制备的O.minuta AO1菌株分泌的量。
将NotI消化的抗体表达载体即pOMexGPA/AbSUC和pOMexGPUΔSp/AbSUC导入在WO 2003/091431中所述的O.minutaTK5-3菌株(Δoch1Δura3Δade1),以得到表达抗体的O.minuta YY1菌株。采用上述的电穿孔和菌株选择方法。
[实施例19]巴斯德毕赤氏酵母的激活的HAC1基因的获取和表达载体的构建
以与实施例3相同的方式,从细胞(巴斯德毕赤氏酵母的GS115菌株)获得巴斯德毕赤氏酵母的激活的HAC1基因。以与实施例3相同的方式,从巴斯德毕赤氏酵母的GS115菌株合成cDNA。使用下示的HACp1-1DNA引物(SEQ ID NO:63)和HACp1-12引物(SEQ ID NO:64),通过PCR扩增该cDNA,该PCR在94℃进行30秒,52℃进行30秒,在72℃进行1分钟,该循环重复30次。将扩增的产物克隆进pCR2.1-TOPO(Invitrogen),证实从两类PCR扩增的基因片段衍生的核苷酸序列(SEQID NO:65和66)。
HACp1-1:5′-ATGCCCGTAGATTCTTCTCATAAGACAGC-3′(SEQID NO:63)
HACp1-12:5′-CAAAGTCATTTAAATCAAATGCATTAGCGG-3′(SEQ ID NO:64)
得到的两类cDNA片段的核苷酸序列之一(SEQ ID NO:65)与基因组序列相一致;但是,另一个序列(SEQ ID NO:66)是部分缺陷的,且缩短。这表明,这样的缺陷序列是已经被UPR激活的Ire1p剪接的cDNA片段。为了得到激活的HAC1的全长cDNA,进行PCR,该PCR在94℃进行30秒,在55℃进行30秒,在72℃进行1分钟,其中使用下示的speHACp1F DNA引物(SEQ ID NO:67)和bglHACp1R DNA引物(SEQID NO:68)和被认为含有上述HAC1的激活的cDNA的cDNA合并物,该循环重复20次。
speHACp1F:5′-gactagtATGCCCGTAGATTCTTCTCATA-3′(SEQ IDNO:67)
bglHACp1R:5′-cagatctCTATTCCTGGAAGAATACAAAGT-3′(SEQID NO:68)
得到的约1kb的片段含有位于巴斯德毕赤氏酵母的激活的HAC1基因的起始密码子和终止密码子之间的区域(SEQ ID NO:69),它等同于包含304个氨基酸残基的激活的Hac1p的氨基酸序列(SEQ ID NO:70)。用SpeI和BglII处理产物,分离,然后导入SpeI-BglII处理过的pOMexPGHy(实施例1(3-4))。得到的载体称作pOMexPGHy/PpHac1。该载体包含源自巴斯德毕赤氏酵母的激活的HAC1基因表达单元。
[实施例20]啤酒糖酵母激活的HAC1基因表达载体的构建
将在实施例11中制备的含有啤酒糖酵母的激活的HAC1基因的TOPO-aHac1用作模板,使用ScHAC-XbaF DNA引物(SEQ ID NO:71)和ScHAC-BamR DNA引物(SEQ ID NO:72)进行PCR,该PCR在94℃进行30秒,在55℃进行30秒,在72℃进行1分钟,该循环重复20次。从而,扩增啤酒糖酵母的激活的HAC1基因。
ScHAC-XbaF:5′-gtctagaATGGAAATGACTGATTTTGAACT-3′(SEQID NO:71)
ScHAC-BamR:5′-cggatccTCATGAAGTGATGAAGAAATCAT-3′(SEQ ID NO:72)
用XbaI和BamHI消化产物,回收编码源自啤酒糖酵母的激活的HAC1的基因。分离后,将基因导入SpeI-BglII处理过的pOMexPGHy(实施例1(3-4))。得到的载体称作pOMexPGHy/ScHac1。该载体包含源自啤酒糖酵母的激活的HAC1基因表达单元。
[实施例21]已经导入O.minuta、巴斯德毕赤氏酵母和啤酒糖酵母的激活的HAC1基因的O.minuta菌株对抗体的生产
(1)已经导入O.minuta、巴斯德毕赤氏酵母和啤酒糖酵母激活的HAC1基因的O.minuta菌株的制备
通过电穿孔,将Aor51HI消化的O.minuta来源的激活的HAC1基因表达载体即pOMexPGHy/Hac1、巴斯德毕赤氏酵母来源的激活的HAC1基因表达载体即pOMexPGHy/PpHac1、和啤酒糖酵母来源的激活的HAC1基因表达载体即pOMexPGHy/ScHac1导入在实施例18中生长的产抗体的O.minuta AA1菌株。如下证实激活的HAC1基因向转化菌株中的导入:在已经加入浓度为50μg/ml的潮霉素B的YPD琼脂平板培养基中选择菌株,培养它们,然后提取基因组。使用实施例3所述的speHAC1F DNA引物(SEQ ID NO:20)和bglHAC1R DNA引物(SEQ IDNO:21),对其中已经导入O.minuta来源的激活的HAC1基因表达载体pOMexPGHy/Hac1的菌株进行PCR。使用speHACp1F DNA引物(SEQ IDNO:67)和bglHACp1R引物(SEQ ID NO:68),对其中已经导入巴斯德毕赤氏酵母来源的激活的HAC1基因的菌株进行PCR,该PCR在94℃进行30秒,在55℃进行30秒,在72℃进行1分钟,该循环重复30次。除了使用ScHAC-XbaF DNA引物(SEQ ID NO:71)和ScHAC-BamR引物(SEQ ID NO:72)以外,在相同条件下,对其中已经导入啤酒糖酵母来源的激活的HAC1基因的菌株进行PCR。得到的菌株分别称作O.minutaAA2omH菌株,O.minuta AA2ppH菌株,和O.minuta AA2scH菌株。同时,将Aor51HI-消化的pOMexPGHy导入O.minuta AA1菌株,以得到O.minuta AA2Hy菌株作为对照。
(2)已经导入HAC1基因的生产抗体的菌株分泌抗体的证实
以实施例18(2)所述的方式,培养在上面(1)中制备的已经导入HAC1基因的生产抗体的菌株,即O.minuta AA2omH菌株、O.minutaAA2ppH菌株、O.minuta AA2scH菌株和O.minuta AA2Hy菌株,并在非还原条件下进行蛋白印迹分析。结果如图10所示。也就是说,与在上面(1)制备的对照O.minuta AA2Hy菌株相比,在O.minutaAA2omH菌株、O.minuta AA2ppH菌株和O.minuta AA2scH菌株中观察到更显著的糖链向抗体分子的添加,但是没有观察到抗体-H2L2聚集体分泌的显著加速作用。从而,通过导入源自不同于宿主的物种的HAC1基因,可以预见到类似的生产效应。
(3)已经导入HAC1基因的产抗体的O.minuta菌株的分泌抗体的生产力(通过基于TR-FRET的均质分析定量)
将包含12μl 0.97μg/ml LANCE Eu-W1024标记的抗-人IgG(PerkinElmer)、8.3ug/ml生物素缀合的小鼠抗-人IgG(BD Bioscience)、16.7ug/ml Surelight APC链霉抗生物素(PerkinElmer)和10%Block Ace(Dainippon Pharmaceutical)的20mM Tris-HCl缓冲液(pH 7.2)应用于96-孔半区域平板(Corning),向其中引入如下制备的2μl样品溶液:用含有10%Block Ace的20mM Tris-HCl缓冲液(pH 7.2)充分稀释在上面(2)制备的培养液,然后搅拌。使样品溶液在室温在黑暗中反应1小时,然后使用EnVision(PerkinElmer)测定荧光。基于在665nm/615nm的值,测定生成的聚集的抗体的量。在动物细胞(CHO)中生产的抗体用作标准样品。如图11所示,与O.minuta AA2Hy菌株相比,在已经导入激活的HAC1基因的O.minuta AA2omH菌株、O.minuta AA2ppH菌株和O.minuta AA2scH菌株中,观察到抗体分泌的显著加速。但是,甚至通过导入源自不同于宿主的物种的HAC1基因,也可以预见到类似的生产效应。
(4)使用PMT抑制剂(1c),已经导入HAC1基因的O.minuta菌株的抗体生产
将一铂环量的O.minuta AA2omH菌株、O.minuta AA2ppH菌株、O.minuta AA2scH菌株和O.minuta AA2Hy菌株接种进5ml B2YP4G培养基,在27℃培养1天,然后用B2YP4G培养基稀释,调节OD600=10。向其中加入在实施例9所述的PMT抑制剂(1c:母液浓度:10mM),至2μM的浓度。在27℃培养另外3天,每隔24小时测定OD600,OD600值每增加1,各加入0.04μM PMT抑制剂(1c)。从培养液制备培养上清液,通过实施例21(3)所述的方法,测量抗体生产量。结果如图11所示。发现与对照O.minuta AA2Hy菌株相比,通过在加入PMT抑制剂的情况下培养,已经导入激活的HAC1基因的O.minuta AA2omH菌株、O.minuta AA2ppH菌株和O.minuta AA2scH菌株可以表现出更显著的加速抗体分泌的作用。
从而,发现使用不同物种的HAC1基因,可以达到加速抗体分泌的作用。
[实施例22]源自O.minuta的PMT基因的分离
使用O.minuta IFO10746菌株的染色体DNA作为模板,使用PM1-5DNA引物(SEQ ID NO:73)和PM1-3 DNA引物(SEQ ID NO:74),通过PCR得到源自O.minuta的PMT1基因,该PCR在94℃进行30秒,在55℃进行1分钟,在72℃进行2分钟,该循环重复25次。
PM1-5:5′-ATGGCGGGCAAAAATCAGAAATCTAGCGCG-3′(SEQID NO:73)
PM1-3:5′-TTACAACTCGTCTTTGACTAGAGGCGGGGA-3′(SEQID NO:74)
回收扩增的约2.4kb的DNA片段,使用TOPO TA克隆试剂盒进行克隆。从得到的克隆分离质粒DNA,测定插入片段的核苷酸序列(SEQID NO:75)。从而,从质粒的插入DNA片段,选择具有编码氨基酸序列(SEQ ID NO:76)的核苷酸序列的克隆,所述氨基酸序列与源自啤酒糖酵母的PMT1基因的氨基酸序列高度同源。分离的质粒称作pOmPM1。
以与在PMT1基因的情况下相同的方式,使用PM2-5 DNA引物(SEQ ID NO:77)和PM2-3 DNA引物(SEQ ID NO:78)得到源自O.minuta的PMT2基因,使用PM4-5 DNA引物(SEQ ID NO:79)和PM4-3 DNA引物(SEQ ID NO:80)得到PMT4基因,使用PM5-5 DNA引物(SEQ ID NO:81)和PM5-3 DNA引物(SEQ ID NO:82)得到PMT5基因,使用PM6-5DNA引物(SEQ ID NO:83)和PM6-3 DNA引物(SEQ ID NO:84)得到PMT6基因。包含PMT2基因(核苷酸序列:SEQ ID NO:85;氨基酸序列:SEQ ID NO:86)、PMT4基因(核苷酸序列:SEQ ID NO:87;氨基酸序列:SEQ ID NO:88)、PMT5基因(核苷酸序列:SEQ ID NO:89;氨基酸序列:SEQ ID NO:90)和PMT6基因(核苷酸序列:SEQ ID NO:91;氨基酸序列:SEQ ID NO:92)的质粒分别称作pOmPM2,pOmPM4,pOmPM5,和pOmPM6。
PM2-5:5′-ATGGGCGAACGTACGGGCAAAAGTGCGCTC-3′(SEQID NO:77)
PM2-3:5′-CTAATCGGAAATTCTCCACGTGCTCAAGAG-3′(SEQID NO:78)
PM4-5:5′-ATGGGGCCCAAAATAAAGACCGGCAAGAAA-3′(SEQID NO:79)
PM4-3:5′-CTATTTAGCAAAATGCAGTTTGATGTTGAG-3′(SEQ IDNO:80)
PM5-5:5′-ATGGACGAGAAAAACATCTCTGGCTTAGAA-3′(SEQID NO:81)
PM5-3:5′-CTACTCACTATAGACGGAGCAGTCGATCGA-3′(SEQID NO:82)
PM6-5:5′-ATGTCCGAGTCAGAGCTGAGAAACCGCAAA-3′(SEQID NO:83)
PM6-3:5′-CTAAGCTATACGCCAGGTGGAAACCCAGTT-3′(SEQID NO:84)
[实施例23]O.minuta的PMT基因插入灭活或破坏载体的制备
(1)PMT基因插入灭活载体的制备
(1-1)PMT1基因插入灭活载体的制备
为了使用在实施例22中得到的pOmPM1分离PMT1基因的部分序列,使用下述的PMT1hIII DNA引物(SEQ ID NO:93)和PMT1Kp DNA引物(SEQ ID NO:94)进行PCR,该PCR在94℃进行30秒,在55℃进行30秒,在72℃进行2分钟,该循环重复15次。
PMT1hIII:5′-caagcttGGACCTACAACACGTCCGAAGAA-3′(SEQ IDNO:93)
PMT1Kp:5′-cggtaccGGTTTGATACCTTGGGTGGCACA-3′(SEQ IDNO:94)
用HindIII和KpnI消化扩增的约1.6kb的DNA片段,并回收。随后,用BglII消化pPICZα(Invitrogen),并平端化。将HindIII接头插入其中,用BamHI进一步消化,并平端化,随后插入KpnI接头。得到的质粒称作pZ-Hd-Kp。用HindIII和KpnI消化pZ-Hd-Kp,分离含有zeocine抗性基因的2.0-kb DNA片段,将PCR扩增的PMT1基因的部分序列插入其中。测定插入的PMT1基因的部分序列的核苷酸序列,然后将得到的质粒命名为pOmPM1dZ。pOmPM1dZ能插入灭活O.minuta PMT1基因的结构基因(CDS)区和启动子区,并抑制PMT1基因的转录。单独地,用HindIII和KpnI消化在实施例18中制备的HindIII和KpnI,回收含有GAP启动子和终止子的基因片段,将回收的片段插入HindIII-KpnI-消化的含有zeocine抗性基因的2.0-kb DNA片段。得到的质粒称作GAP/Z。
(1-2)PMT2基因插入灭活载体的制备
为了使用在实施例22中得到的pOmPM2分离PMT2基因的部分序列,使用下述的PMT2hIII DNA引物(SEQ ID NO:95)和PMT2Kp DNA引物(SEQ ID NO:96)进行PCR,该PCR在94℃进行30秒,在55℃进行30秒,在72℃进行2分钟,该循环重复15次。
PMT2hIII:5′-gaagcttACTACATAATTCGTGTACGTGTTC-3′(SEQID NO:95)
PMT2Kp:5′-cggtaccGTCGCCGTATTGGTCAGCAATCTC-3′(SEQID NO:96)
回收扩增的约1.5kb的DNA片段,用HindIII和KpnI消化,然后回收消化的片段。将得到的DNA片段插入通过用HindIII和KpnI消化从pZ-Hd-Kp分离的、含有zeocine-抗性基因的2.0-kb DNA片段,测定插入的PMT2基因的部分序列的核苷酸序列。将得到的质粒命名为pOmPM2dZ。pOmPM2dZ能插入灭活O.minuta PMT2基因的结构基因(CDS)区和启动子区,并抑制PMT2基因的转录。
(1-3)PMT4基因插入灭活载体的制备
为了使用在实施例22中得到的pOmPM4分离PMT4基因的部分序列,使用下述的PMT4FHdinf DNA引物(SEQ ID NO:97)和PMT4RKpinfDNA引物(SEQ ID NO:98)进行PCR,该PCR在94℃进行30秒,在55℃进行30秒,在72℃进行2分钟,该循环重复15次。
PMT4FHdinf:
5′-GTCATGAGATCCaagctGATCCCTCAATGGAGATCTACT-3′(SEQ IDNO:97)
PMT4RKpinf:
5′-GGTGTGTGGGGGATCgGGATGCAAATGGATGGCTCGAAC-3′(SEQID NO:98)
使用in-fusion试剂盒(BD Bioscience),将得到的约1.5kb的DNA片段插入通过用HindIII和KpnI消化从pZ-Hd-Kp分离的、含有zeocine-抗性基因的2.0-kb DNA片段。测定插入的PMT4基因的部分序列的核苷酸序列,然后将得到的质粒命名为pOmPM4dZ。
(2)PMT基因破坏载体的制备
(2-1)PMT5基因破坏载体的制备
用HindIII消化pROMU1,后者含有具有在WO 2003/091431中公开的在O.minuta的URA3结构基因上游和下游的约0.8kb的重复序列的基因片段,并平端化,随后插入BamHI接头。用BamHI和BglII消化得到的载体,将含有O.minuta的重复序列和URA3基因的约3.3kb片段导入BamHI消化的pBluescript KS-(Stratagene)。得到的载体称作rURApBKS。
将O.minuta IFO10746菌株的染色体DNA用作模板,使用PMT5maeF2 DNA引物(SEQ ID NO:99)和PMT5maeR DNA引物(SEQ IDN0:100)进行PCR,该PCR在94℃进行30秒,在55℃进行1分钟,在72℃进行2分钟,该循环重复25次。回收扩增的约1.5kb的DNA片段,使用in-fusion试剂盒(BD Bioscience)导入BamHI-HindIII-消化的rURApBKS。测定插入的基因片段的核苷酸序列。得到的载体称作PMT5K/O/rURA3pre。
将O.minuta IFO10746菌株的染色体DNA用作模板,使用PMT5ushiroF DNA引物(SEQ ID NO:101)和PMT5ushiroR DNA引物(SEQ ID NO:102)进行PCR,该PCR在94℃进行30秒,在55℃进行1分钟,在72℃进行2分钟,该循环重复25次。回收扩增的约1.5kb的DNA片段,使用in-fusion试剂盒(BD Bioscience)导入NotI消化的PMT5K/O/rURA3pre。测定插入的基因片段的核苷酸序列。得到的载体称作PMT5K/O/rURA3。
PMT5maeF2:
5′-GACGGTATCGATAAGCTTGATGCGCGGCCTTCCGACCTT-3′(SEQID NO:99)
PMT5maeR:
5′-CTGGGGAAGCTCGGATCCGGCTCGAGGTCTTCGTTCAGA-3′(SEQID NO:100)
PMT5ushiroF:
5′-CTAGTTCTAGAGCGGCCCAGGTCGCTTTCAGGCAGCAG-3′(SEQID NO:101)
PMT5ushiroR:
5′-CACCGCGGTGGCGGCCAAGCTTGGGTACCGGCTCGCGTAG-3′(SEQ ID NO:102)
(2-2)PMT6基因破坏载体的制备
将O.minuta IFO10746菌株的染色体DNA用作模板,使用PMT6inf5′armF DNA引物(SEQ ID NO:103)和PMT6inf5′armR DNA引物(SEQ ID NO:104)进行PCR,该PCR在94℃进行30秒,在55℃进行2分钟,在72℃进行2分钟,该循环重复25次。回收扩增的约2.8kb的DNA片段,使用in-fusion试剂盒(BD Bioscience)导入BamHI消化的rURApBKS。测定插入的基因片段的核苷酸序列。得到的载体称作PMT6K/O/rURA3pre。
将O.minuta IFO10746菌株的染色体DNA用作模板,使用PMT6inf3′armF DNA引物(SEQ ID NO:105)和PMT6inf3′armR2 DNA引物(SEQ ID NO:106)进行PCR,该PCR在94℃进行30秒,在55℃进行2分钟,在72℃进行2分钟,该循环重复25次。回收扩增的约2.5kb的DNA片段,使用in-fusion试剂盒(BD Bioscience)导入NotI-SacII消化的PMT6K/O/rURA3pre。测定插入的基因片段的核苷酸序列。得到的载体称作PMT6K/O/rURA3。
PMT6inf5′armF:
5′-GCAGCCCGGGGgatccACGAAACCACGTCCTACT-3′(SEQ ID NO:103)
PMT6inf5′armR:
5′-GGGGAAGCTcggatcGACTCATCTTGAAACGCA-3′(SEQ ID NO:104)
PMT6inf3′armF:
5′-AGTTCTAGAGCGGCCTTACCACCATTACATGCC-3′(SEQ ID NO:105)
PMT6inf3′armR2:
5′-AATTGGAGCTCCACCGCGGCCGCAACTTACTCGACGCTAA-3′(SEQ ID NO:106)
[实施例24]用插入灭活的或破坏的PMT基因制备产抗体的O.minuta菌株及其评价
(1)用插入灭活的PMT基因制备产抗体的O.minuta菌株
对于在实施例23中制备的PMT基因插入灭活载体,用PstI消化PMT1基因插入灭活载体,用XhoI消化PMT2基因插入灭活载体,并用HindIII消化PMT4基因插入灭活载体。通过电穿孔,将这些消化产物导入在实施例18中生长的产抗体的O.minuta YY1菌株。以下述方式证实转化菌株中PMT基因的中断。在已经加入浓度为50μg/ml的zeocine的YPD琼脂平板培养基中选择菌株,并培养,随后提取基因组。对PMT1基因进行PCR,该PCR在94℃进行30秒,在55℃进行30秒,在72℃进行1分钟,该循环重复30次,其中使用DNA引物对Zeo1(SEQ IDNO:107)和PMT1zeo1(SEQ ID NO:109)和DNA引物对Zeo2(SEQ IDNO:108)和PMT1zeo2(SEQ ID NO:110)。在相同条件下对PMT2基因进行PCR,其中使用DNA引物对Zeo1(SEQ ID NO:107)和PMT2zeo1(SEQID NO:111)和DNA引物对Zeo2(SEQ ID NO:108)和PMT2zeo2(SEQ IDNO:112)。在相同条件下对PMT4基因进行PCR,其中使用DNA引物对Zeo1(SEQ ID NO:107)和PMT4PCR3′armF(SEQ ID NO:113)和DNA引物对Zeo2(SEQ ID NO:108)和PMT4PCR5′armR3(SEQ ID NO:114)。从而,证实了在导入插入灭活载体后PMT基因的插入灭活。
Zeo1:5′-GAACGGCACTGGTCAACTTGGCCAT-3′(SEQ ID NO:107)
Zeo2:5′-CTTCGTGGCCGAGGAGCAGGACTGA-3′(SEQ ID NO:108)
PMT1zeo1:5′-GAATTCTAGCCGAGCATGAGCTA-3′(SEQ ID NO:109)
PMT1zeo2:5′-CGTTCAGACTCTTGTTGATTTTCCAC-3′(SEQ IDNO:110)
PMT2zeo1:5′-GCTGTGCCACTGCACGCCTCGACTC-3′(SEQ IDNO:111)
PMT2zeo2:5′-CTTGTCCCTCTTGAATGGCGAGTG-3′(SEQ ID NO:112)
PMT4PCR3′armF:5′-GGAACACGCCAAACATCATG-3′(SEQ ID NO:113)
PMT4PCR5′armR3:5′-CACAAGCAGAATCAGGCAC-3′(SEQ IDNO:114)
得到的菌株分别称作O.minuta YY2P1菌株(含有插入灭活的PMT1基因的菌株)、O.minuta YY2P2菌株(含有插入灭活的PMT2基因的菌株)和O.minuta YY2P4菌株(含有插入灭活的PMT4基因的菌株)。也将Sse8387I-消化的GAP/Z导入O.minuta YY1菌株,选择zeocine-抗性菌株,以得到O.minuta YY2Z菌株作为对照菌株。
(2)含有插入灭活的PMT基因的产抗体的O.minuta菌株的分泌抗体的生产力
以实施例18(2)所述的方式,培养在上面(1)制备的含有插入灭活的PMT基因的产抗体菌株,然后进行蛋白印迹分析。结果如图12和图14所示。也就是说,与在上面(1)制备的O.minuta YY2Z菌株相比,含有插入灭活的PMT1基因的O.minuta YY2P1菌株、含有插入灭活的PMT2基因的O.minuta YY2P2菌株和含有插入灭活的PMT4基因的O.minutaYY2P4菌株达到的抗体聚集体的分泌量略有增加(图12:泳道3和泳道6;图14:泳道3)。
(3)含有插入灭活的PMT基因的产抗体的O.minuta菌株的分泌抗体的生产力(通过基于TR-FRET的均质分析定量)
通过在实施例21(3)中所述的方法,测量在上面(2)中制备的培养液中生成的抗体的量。使用在动物细胞(CHO)中生产的抗体作为标准样品。如图13和图15所示,与在上面(1)制备的O.minuta YY2Z菌株相比,含有插入灭活的PMT1基因的O.minuta YY2P1菌株、含有插入灭活的PMT2基因的O.minuta YY2P2菌株和含有插入灭活的PMT4基因的O.minuta YY2P4菌株分泌的抗体聚集体的量略有增加(图13:YY2P1和YY2P2;图15:YY2P4)。
(4)PMT5和PMT6缺陷型菌株的制备及其评价
(4-1)O.minuta PMT5基因缺陷型菌株(Δoch1Δyps1Δura3Δade1Δpmt5)的制备
用HindIII消化在实施例23(2-1)中制备的PMT5基因破坏载体PMT5K/O/rURA3,并通过电脉冲方法转化进在实施例17中制备的Ogataea minuta YK5菌株(Δoch1Δura3Δade1Δyps1)。为了证实已经破坏了这些菌株的PMT5基因,合成了下述引物。
gPMT5-5:5′-CGGTGACGACTTCGACTAGTCGAG-3′(SEQ ID NO:115)
gPMT5-2:5′-CGGTGCTGTTGGCGTCGTCATGGGTG-3′(SEQ IDNO:116)
gPMT5-3:5′-GGCGCGTTCCAATTCCACTCTGCTG-3′(SEQ ID NO:117)
gPMT5-4:5′-CGACGAGTCCTCTCACCAGGAGGTTG-3′(SEQ IDNO:118)
将从转化菌株分离的染色体DNA用作模板,使用gPMT5-5引物(SEQ ID NO:115)和gPMT5-2引物(SEQ ID NO:116)进行PCR,该PCR在94℃进行30秒,在60℃进行1分钟,在72℃进行2分钟,该循环重复25次。从已经将质粒掺入PMT5基因座中的菌株,检测4.9kb的扩增的DNA片段。类似地,将从转化菌株分离的染色体DNA用作模板,使用gPMT5-3引物(SEQ ID NO:117)和gPMT5-4引物(SEQ ID NO:118)进行PCR,该PCR在94℃进行30秒,在60℃进行1分钟,在72℃进行2分钟,该循环重复25次。从已经将质粒掺入PMT5基因座中的菌株,检测4.9kb的扩增的DNA片段。选择的菌株称作O.minuta YK6菌株(Δoch1Δura3Δade1Δyps1Δpmt5::URA3)。
(4-2)O.minuta PMT6基因缺陷菌株(Δoch1Δyps1Δura3Δade1Δpmt6)的制备
用BamHI和NotI消化在实施例23(2-2)中制备的PMT6基因破坏载体PMT6K/O/rURA3,然后通过电脉冲方法转化进在实施例17中制备的O.minuta YK5菌株(Δoch1Δura3Δade1Δyps1)。为了证实已经破坏了这些菌株的PMT6基因,合成了下述引物。
PMT6 PCR3′armF:5′-TGTGGGTGCGATCCTGAG-3′(SEQ ID NO:119)
PMT6 PCR3′armR:5′-GCCGTCGTTGGAGCAAAACT-3′(SEQ ID NO:120)
PMT6 PCR5′armF:5′-GCATGTGCCACTGCTAAA-3′(SEQ ID NO:121)
PMT6 PCR5′armR:5′-GACCAACTTTCCCGTGTAA-3′(SEQ ID NO:122)
将从转化菌株分离的染色体DNA用作模板,使用PMT6 PCR3′armF引物(SEQ ID NO:119)和PMT6 PCR3′armR引物(SEQ ID NO:120)进行PCR,该PCR在94℃进行30秒,在60℃进行1分钟,在72℃进行2分钟,该循环重复25次。从已经将质粒掺入PMT6基因座中的菌株,检测5.8kb的扩增的DNA片段。类似地,将从转化菌株分离的染色体DNA用作模板,使用PMT6 PCR5′armF引物(SEQ ID NO:121)和PMT6PCR5′armR引物(SEQ ID NO:122)进行PCR,该PCR在94℃进行30秒,在60℃进行1分钟,在72℃进行2分钟,该循环重复25次。从已经将质粒掺入PMT6基因座中的菌株,检测6.3kb的扩增的DNA片段。选择的菌株称作O.minuta YK7菌株(Δoch1Δura3Δade1Δyps1Δpmt6::URA3)。
(5)其中的PMT5和PMT6基因已经被破坏的产抗体的O.minuta菌株的制备
通过电穿孔,使用NotI消化的抗体表达载体pOMexGPA/AbLys(在实施例18(1)中制备)和Sse8387I消化的抗体表达载体pOMexHy/AbLys,(在实施例18(1)中制备)来转化O.minuta YK6菌株(Δoch1Δyps1Δura3Δade1Δpmt5::rURA3)和O.minuta YK7菌株(Δoch1Δyps1Δura3Δade1Δpmt6::rURA3)。在已经加入浓度为50μg/ml的潮霉素B的SD琼脂平板培养基(2%葡萄糖,0.67%酵母氮基(Difco))中选择转化的细胞。在27℃在B2YP4G培养基(1.34%酵母氮基(Difco),2%酵母提取物(Difco),4%聚胨(Difco),4%甘油,0.1M磷酸盐缓冲液(pH 6.0))中培养单个菌落4天。从培养液制备培养上清液,按照实施例7所述的方法进行蛋白印迹分析,选择其中已经导入抗体轻链和重链基因的生产抗体的菌株,得到的菌株分别称作O.minuta AP5菌株(the PMT5基因缺陷型菌株)和O.minuta AP6菌株(the PMT6基因缺陷型菌株)。单独地,通过电穿孔,将NotI消化的抗体表达载体pOMexGPA/AbLys和Sse8387I消化的pOMexHy/AbLys导入O.minutaYK4菌株(Δoch1Δura3Δade1Δyps1::rURA3),以上述方式制备和选择生产抗体的菌株为对照菌株。得到的菌株称作O.minuta Acon菌株。
(6)其中的PMT5和PMT6基因已经被破坏的产抗体的O.minuta菌株的的分泌抗体的生产力
以实施例18(2)所述的方式,培养其中的PMT5基因已经被破坏的O.minuta AP5菌株和其中的PMT6基因已经被破坏的O.minuta AP6菌株和O.minuta Acon菌株,并进行非还原蛋白印迹分析。以实施例21(3)所述的方式,测量在培养液中生产的抗体的量。使用在动物细胞(CHO)中生产的抗体作为标准样品。结果如图16所示。也就是说,O.minuta AP5菌株或O.minuta AP6菌株和对照O.minuta Acon菌株之间的抗体聚集体的生产力没有显著差异。
[实施例25]含有插入灭活的PMT基因和导入其中的HAC1基因的O.minuta菌株的制备及其评价
(1)含有插入灭活的PMT基因和导入其中的HAC1基因的O.minuta菌株的制备
用Aor51HI消化在实施例3中制备的源自O.minuta的激活的HAC1基因表达载体pOMexPGHy/Hac1,并通过电穿孔,导入已经在实施例24(1)中制备的O.minutaYY2P2菌株(含有插入灭活的PMT2基因的菌株)、O.minuta YY2P4菌株(含有插入灭活的PMT4基因的菌株)和O.minutaYY2Z菌株(对照菌株)。为了证实激活的HAC1基因已经导入转化的菌株,在已经加入浓度为50μg/ml的潮霉素B的YPD琼脂平板培养基中选择菌株,培养菌株,提取基因组,根据实施例6的方法进行PCR。得到的菌株分别称作O.minuta YY3P2omH菌株(含有插入灭活的PMT2基因且含有导入其中的HAC1基因的菌株)、O.minuta YY3P4omH菌株(含有插入灭活的PMT4基因且含有导入其中的HAC1基因的菌株)和O.minuta YY3ZomH菌株(其中已经导入HAC1基因的对照菌株)。同时,将Aor51HI消化的pOMexPGHy导入O.minuta YY2Z菌株,获得O.minuta YY3ZHy菌株(其中已经导入载体的对照菌株)作为对照菌株。
(2)含有插入灭活的PMT基因且含有导入其中的HAC1基因的O.minuta菌株的分泌抗体的生产力
通过实施例18(2)所述的方法,培养在上面(1)制备的含有插入灭活的PMT基因且含有导入其中的HAC1基因的生产抗体的菌株,并进行蛋白印迹分析。结果如图12和图14所示。发现含有插入灭活的PMT2基因且含有导入其中的HAC1基因的O.minuta YY3P2omH菌株会分泌比仅导入HAC1基因的O.minuta YY3ZomH菌株和含有插入灭活的PMT2基因的O.minuta YY2P2菌株明显更大量的抗体(图12:泳道7)。发现含有插入灭活的PMT4基因且含有导入其中的HAC1基因的O.minuta YY3P4omH菌株会分泌比仅导入HAC1基因的O.minutaYY3ZomH菌株和含有插入灭活的PMT4基因的O.minuta YY2P4菌株明显更大量的抗体(图14:泳道6)。
通过实施例8和实施例21(3)所述的方法,测量在培养液中生产的抗体的量。使用在动物细胞(CHO)中生产的抗体作为标准样品。结果如图13和图15所示。发现含有插入灭活的PMT2基因且含有导入其中的HAC1基因的O.minuta YY3P2omH菌株会分泌比对照菌株即O.minutaYY3ZomH菌株(其中仅导入HAC1基因的菌株)、O.minuta YY2P2菌株(含有插入灭活的PMT2基因的菌株)和O.minuta YY3ZHy菌株(其中导入载体的对照菌株)明显更大量的抗体聚集体(图13:O.minutaYY3P2omH菌株)。也发现,含有插入灭活的PMT4基因且含有导入其中的HAC1基因的O.minuta YY3P4omH菌株会分泌比对照菌株即O.minuta YY3ZomH菌株(其中仅导入HAC1基因的菌株)、O.minutaYY2P4菌株(含有插入灭活的PMT4基因的菌株)和O.minuta YY3ZHy菌株(其中导入载体的对照菌株)明显更大量的抗体(图15:O.minutaYY3P4omH菌株)。
[实施例26]使用PMT抑制剂(1c),由含有插入灭活的PMT基因且含有导入其中的HAC1基因的O.minuta菌株生产抗体
将一铂环量的在实施例25(1)中制备的含有插入灭活的PMT基因且含有导入其中的HAC1基因的产抗体菌株接种进5ml B2YP4G培养基,在27℃培养1天,然后用B2YP4G培养基稀释,调节OD600=10。向产物加入在实施例9所述的PMT抑制剂(1c:母液浓度:0.1mM,0.5mM,2.5mM,和10mM),分别至0.016μM,0.08μM,0.4μM,和2.0μM的浓度。在27℃培养另外3天,每隔24小时测定OD600,OD600值每增加1,分别加入量为0.00032μM,0.0016μM,0.008μM,和0.04μM的PMT抑制剂(1c)。从培养液制备培养上清液,通过实施例18(2)所述的方法,进行蛋白印迹分析。结果如图17所示。此外,通过实施例21(3)所述的方法,对分泌抗体的生产力定量。结果如图18所示。当随着OD600值增加1而加入约0.008μM PMT抑制剂(母液浓度:2.5mM)时,达到O.minuta YY3P2omH菌株(含有插入灭活的PMT2基因的菌株且含有导入其中的HAC1基因)的最高抗体生产力。当随着OD600值增加1而加入约0.04μM PMT抑制剂(母液浓度:10mM)时,达到O.minutaYY3P4omH菌株(含有插入灭活的PMT4基因且含有导入其中的HAC1基因的菌株)的最高抗体生产力。可以推论,PMT基因表达的抑制和PMT抑制剂的联合使用,会强烈抑制糖链添加。对于其中已经导入HAC1的菌株,为了抑制糖链添加,通过PMT基因表达的抑制和PMT抑制剂的联合使用来抑制PMT蛋白活性,可以预见到更高的聚集抗体的生产力。
[实施例27]PMT抑制剂(5a)的评价
将一铂环量的已经导入抗体基因的O.minuta YY1菌株接种进5mlB2YP4G培养基,在27℃培养1天,然后用B2YP4G培养基稀释,调节OD600=10。向其中加入不同于实施例9所述的PMT抑制剂(1c)的PMT抑制剂({(5Z)-4-氧代-5-[3-(1-苯基乙氧基)-4-(2-苯基乙氧基)亚苄基]-2-硫代-1,3-噻唑烷-3-基}乙酸(在Bioorganic & Medicinal ChemistryLetters,Vol.14,p.3975,2004中所述的化合物5a),达到1μm的浓度。在27℃培养另外3天,每隔24小时测定OD600,OD600值每增加1,加入量为0.02μM的PMT抑制剂。从培养液制备培养上清液,通过实施例18(2)所述的方法进行蛋白印迹分析,通过实施例21(3)所述的方法对分泌抗体的生产力定量。结果如图19和图20所示。通过加入新检查的PMT抑制剂(5a),认为抗体聚集体的生产力倾向于增加。从而,认为PMT抑制剂(5a)具有与实施例9所述的PMT抑制剂(1c)等效的作用。
工业实用性
本发明实现了在酵母中高水平分泌生产具有复杂结构的蛋白,例如抗体,以及普通蛋白。
序列表
<110>Kyowa Hakko Kirin Co.,Ltd.
<110>DAIICHI SANKYO COMPANY,LIMITED
<110>National Institute of Advanced Industrial Science and Technology
<120>蛋白的高分泌生产方法
<130>PH-3149-PCT
<150>JP2006-136993
<151>2006-05-16
<160>122
<170>PatentIn Ver.2.1
<210>1
<211>25
<212>DNA
<213>人工序列
<220>
<223> 人工序列的描述:引物
<400>1
gngtngaytt yaaygtnccn ttrga 25
<210>2
<211>26
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:引物
<400>2
gynacdccng gyaaytcytt dccytc 26
<210>3
<211>9046
<212>DNA
<213>Ogataea minuta
<220>
<221>CDS
<222>(4766)..(6016)
<400>3
ggatcccgcc ctcgacggtt gttggtgcgg gataatgttc gttgatgagc caacttcgat 60
ttttgctgaa acgactgaga cagatccgac agacgaggtg tagttgcgga tcagattttg 120
catcactctg ctgtttcttt tgatgtgtct ttcgtcgtcc tggaaccccc aactcgatag 180
cagcgaaagg actttgtcgt ctcgctccac aagcgatagt tttggacgag ctagatatgg 240
attgacgtag cttcttgtcg aggtggcgga ctcttttttg atgtgggttt cggtaacgga 300
ttccgacttg gcatgtgatt caatcactcc ctcgtagtgg gacgacacca cgctcatgtt 360
gtcgtcgtcc tgttgtccgc tgaagtcaaa cggattgctt tttctgtcaa cggtgtcgac 420
gacagcgtca acgctcaaca gatctgagtc cacagtctcg acgctggaga cgtccgactc 480
atgaacagga tacctgaaat tcatctgggt cccaagaaac gtgtctgtgt gtgtctttct 540
gtgctgtctt ttcgtcattg cttgatattc cccctaaata gttatcacgt acggaactct 600
ggtaaaaaaa cctgatccgt ttcagatcaa ctacatttaa aatcaggttg ttcctccagc 660
cccggcggaa gctaaagatg gctggttttt tcaatcagat ggtgaaatat taattttttt 720
gagccgcaac ccagccccag atccgaggct gtgcagcaga ttcggtcgat aaatgtacaa 780
cgactatgct aaatagggag tgaaaagcag caaaaaaaat gtcttagagg tagtaccttg 840
gttcttcaaa gacatggaat ttgtggtctc tgaccccatc tccatagaac atcgatggga 900
atcggaggtc tggatcaacg gtttcctcgt ctatccgctg ttgcgagtag ctttcgtcgt 960
agtctccatt ggagggtatg ataaatttac ccacctgaac ctcagtgtcg gtgatggacc 1020
cacgactgat ccgagcatac ccggttcttt tgagtttctt gtacaagatg tactcgcacc 1080
aacgatcgtc atcagtagcg tcgatatcgt gcattcctga cttgtcgctc acgtaggtgt 1140
tgtaattccc cttgaggggt tcggtcacca agtagctcaa caggatcatt ggcctttctg 1200
aactgcccat aatttcggaa acaccgagag attgtaaacg gcggtcctca acgtcctctt 1260
cttgtcccga atggaaaacg acaacgtcca cgagctctcc gtaacagtcc agagtagcgt 1320
ggatggcagg agccaattcg cccacaggag acggaagcaa gtgatgcgtg gaattgatga 1380
tcggaaactt ggacaaaagg gccgcacccc aggtatgttt cgttgggttc ggaccgaaat 1440
cggcgtacat gccgagttct tcggcaattc tttgggtgag atctctgttt cccatgatga 1500
ttctttgagt gtccgattct aataaaccca caacgtccaa ctccaggtct ttgatcaggt 1560
ctctcattct gtgctcagat gcccacatgt cgttatcgag accaaagtga atggtccaaa 1620
taccagccgt gacaagtctg gactggggat ggtagggtct tggtttttcg aactggaatc 1680
tgttgaaagc gataaatccc gagagcagtg taaagaaaat gaggtaattt gtgatttttt 1740
tcaacgacga cttcagtcgc tttgaatgcg aaacttcaga ctgcttgtag ttgaaaacaa 1800
gaccgcaaat catcagaact gaaacagaca ggatgatatc tgttctttct ctcaacaatg 1860
gtccaccggg aacaaaggca tatgcgacaa cccagacgtg agccaaagag agcactatgt 1920
caaacaggaa cgaaagacca aacactagag ccacgccgtc cactttggaa acctgatcaa 1980
aacaaacagg agtgatgaaa cacagccaga aagcgtatgc cagcccacca gcgtaactga 2040
tccagccgtt gaaatagtac aggaacaaag ctccgagaac tcccgcataa gtgacagact 2100
tgtaggaact ggaccggtag aatccgaaaa aggctcctag acacatgaaa atcaccgtca 2160
ccgcaccgtg gggaacaggg atcggcccgt tgataggata gccctcccat gtccacagaa 2220
caatggtaga agagtcggta agcatggcac taatcgagaa aatcagagat ccaaaaccca 2280
tggctgacag cataagagaa ggcttttgag tcttaagtgg gcctttctca gatacagtcc 2340
cctgtggtag ctttgtgaaa gctgcagctg tcaatccgac aactagaccg gtgaggttcc 2400
acccaccggt gtcgctgttc atgatgggcc aaataggatt attggtccag aacgcaaact 2460
tggcgagact ggacagaatg agccccattg taaacgaggt tgcaaacgtt ttcgtagcca 2520
gttgatcatt cagtttgcca atggcagcca cttcggtact taaggcaatg gttgcgaacg 2580
aaacagccgc gccaataacc atcaatctgc aggcagggtc taccaccaag taagccccca 2640
caccgaacaa acaggtgagc gttctagcga cttgaggacg ttttgtgaaa aacagcttca 2700
cctttggaac tgccaagaca aacggagtca atagaaggac acagactgcc tcgtatcccg 2760
agattcccat gtaccacagc gggaagtacc agatacagag gaacaatgag gagtagacag 2820
accagaaaac gaaccaattg atggtgtcga cagtgagttg ccagaaagag ctgctgaact 2880
gagtcgactt cggtaatagc ttcccgctgg aggttggggc cgaggaactt gaagtgccgt 2940
ttattctgtc ttgaatgagc ttgatgtcga aattggcact gaaaaattcg tctcttgttg 3000
ctgaaggtct gagctcgatg atcaggtctt tgaagtccaa gatggaccag gcatcaaagc 3060
caacatcaag aaagatcaac gcccattcgc agtatgcgta gtaagaataa gctcccttga 3120
cgtgatgaac cttgtgctgg ataaaaagat acaccagagg gacaagtgca ccaaaaaatg 3180
tccatgcggt gtacttcctg gctcttctga tcctggaccg tggtggggac agcttggtga 3240
tagcgaggtc ccacgggata gtcaggacaa tgtaggagat cataaacaca tcgtgcgcgt 3300
cgtgatcatc cgtagaagta atataaaccc agcctccaca cgtgatggtt ctgatgaagc 3360
ccgatatcag ggcaagttta gggtacactg aattggcctt gtgcagacga acatacgtta 3420
gtagcagtag taagaaccga ggaccagctg taagcgcgat caaaatctgg aagattgacc 3480
gttcaggata tctgtcacca atggtggccg agacactcgg gaaccactcg tctggatacc 3540
cataatactc gttctcaacg attttgtaaa aatggagcca gcacccaaca gccaaggcag 3600
ctaaaaaggc agagagcgag cacacagagt gtgcgatcgc aatggcctgt gagttcaacc 3660
gcactagagg ctgcgagttg ggcccgtctg gaactgccat gatgataaat tgcgagcaaa 3720
ttgggtgaac atcagcacta aagcgacttg ttcccatcag aatctttaaa aacaacacct 3780
gaaatggacg ttttcagaga tcaggtgtaa gggtgtttgc ttggaaaaac acgaggaaaa 3840
gagcttgggc tgggaacacc cgtacaccgg atctagctcc tggctgcggg atctggattt 3900
aggaaaaaaa caaaacgcac gaatgagctt tgtcgccttt agcagagggt agaggtgata 3960
cactagacag caagagattg gaaaatggcg ggtaagtcgg ctgttgatga aatcttgatg 4020
acaactactg acatggaaca gaaatcaaag agaaacctga atttagaaag tcgccagacg 4080
tttcgttcga cgagattgat tacagagacc cgcttgctct aaaaaaggca caggagtcga 4140
tgctgagaga gcagttcatc agaattgagg ttctgaaggt ggtgagaaaa gcgctagaga 4200
attgctggag ggtgaacggg cccaacggac acgaagagtg ccgggacctg gccgacaagt 4260
acctagacat gctgccaaac tcccgggccc agggatacat gggataccaa agaaacgacc 4320
cgtccaaata ggctggctgc ggctggctgc ggctggctgc agaccgaccg caaaccaact 4380
gcaggcttgt tgtaggctga ttatttattg actatttatt gaatatttat tgcaccactt 4440
gtgtgttccc cttgaccatg cgtcgatcga cgcgcgaggc ttaggaagcc cggagcgggg 4500
aattcacgtg gtgtacgggt gtggaggtct agcacccgag ttttcggaga ggcagatgat 4560
gcatctccgg ggagtgtcag gcaaggagga atgggcagat cgacggaaga aagggatata 4620
aaatgttata tttgcacttg tttttgtgaa tatcagcacc caaacaaaat aagacaactt 4680
atcagtttct taagtattac aagtgagtaa ttgtcaacca gcacagctgt cgtagtgtaa 4740
acactaacgc cgcatagaac tagca atg tcg tta tcc agc aag ctg tca gtt 4792
Met Ser Leu Ser Ser Lys Leu Ser Val
1 5
aag gac ttg gac gtc tcg ggc aag aga gtg ttc ata aga gtg gac ttc 4840
Lys Asp Leu Asp Val Ser Gly Lys Arg Val Phe Ile Arg Val Asp Phe
10 15 20 25
aat gtt cca ttg gac gga gac aag atc acc aac aac caa aga att gtc 4888
Asn Val Pro Leu Asp Gly Asp Lys Ile Thr Asn Asn Gln Arg Ile Val
30 35 40
gct gct ttg cca acc att cag tac gtt ctt gag aac aag cca aag gtg 4936
Ala Ala Leu Pro Thr Ile Gln Tyr Val Leu Glu Asn Lys Pro Lys Val
45 50 55
gtt gtt ttg gcc tcc cac ttg ggc aga ccc aac gga gag aag aac ctc 4984
Val Val Leu Ala Ser His Leu Gly Arg Pro Asn Gly Glu Lys Asn Leu
60 65 70
aag tac aca ttg aag cct gtc gcc aag gaa ctg gag act ctt ttg ggc 5032
Lys Tyr Thr Leu Lys Pro Val Ala Lys Glu Leu Glu Thr Leu Leu Gly
75 80 85
cag aaa gtg acc ttc ttg gac gac tgt gtt ggt tct gag gtc gaa tct 5080
Gln Lys Val Thr Phe Leu Asp Asp Cys Val Gly Ser Glu Val Glu Ser
90 95 100 105
acc gtc aac tct gcc cct gct ggc tcg gtg att ttg cta gaa aat ttg 5128
Thr Val Asn Ser Ala Pro Ala Gly Ser Val Ile Leu Leu Glu Asn Leu
110 115 120
aga ttc cac att gag gag gaa ggc tcg aaa aag act tca gag gga aaa 5176
Arg Phe His Ile Glu Glu Glu Gly Ser Lys Lys Thr Ser Glu Gly Lys
125 130 135
gtt aag gct tcc aaa gag gac gtt gaa aaa ttc aga aag caa ctc act 5224
Val Lys Ala Ser Lys Glu Asp Val Glu Lys Phe Arg Lys Gln Leu Thr
140 145 150
gct ctg gct gat gtc tac gtt aac gac gct ttc ggt act gct cac aga 5272
Ala Leu Ala Asp Val Tyr Val Asn Asp Ala Phe Gly Thr Ala His Arg
155 160 165
gcc cac tcc tcc atg gtc ggt ttc gag ctc gag gac aga gct gct ggc 5320
Ala His Ser Ser Met Val Gly Phe Glu Leu Glu Asp Arg Ala Ala Gly
170 175 180 185
ttc ctg atg gcc aag gag ctg gag tac ttc tcc aag gct ctg gag aac 5368
Phe Leu Met Ala Lys Glu Leu Glu Tyr Phe Ser Lys Ala Leu Glu Asn
190 195 200
ccg gtg aga ccg ttt ttg gct atc ctt ggt ggt gca aag gtg tct gac 5416
Pro Val Arg Pro Phe Leu Ala Ile Leu Gly Gly Ala Lys Val Ser Asp
205 210 215
aaa att cag ctg att gac aat ttg ctc gac aag gtc gat ctc ttg att 5464
Lys Ile Gln Leu Ile Asp Asn Leu Leu Asp Lys Val Asp Leu Leu Ile
220 225 230
gtc ggt gga gga atg gcc ttc act ttc aac aag gtg ttg aac gac atg 5512
Val Gly Gly Gly Met Ala Phe Thr Phe Asn Lys Val Leu Asn Asp Met
235 240 245
aag atc ggt aag tct ttg ttc gac gag act gga gct gag att gtt cca 5560
Lys Ile Gly Lys Ser Leu Phe Asp Glu Thr Gly Ala Glu Ile Val Pro
250 255 260 265
aag ctc gtg gag aag gcc aag aag aac ggc gtc aag atc gtt ttg cca 5608
Lys Leu Val Glu Lys Ala Lys Lys Asn Gly Val Lys Ile Val Leu Pro
270 275 280
gtg gac ttt gtc act gcc gat gcg ttc tcg cca gat gcc aag gtt ggc 5656
Val Asp Phe Val Thr Ala Asp Ala Phe Ser Pro Asp Ala Lys Val Gly
285 290 295
tac gcc acc ctt gag gag ggt att gcc gac gat ttg caa ggt ctg gac 5704
Tyr Ala Thr Leu Glu Glu Gly Ile Ala Asp Asp Leu Gln Gly Leu Asp
300 305 310
ggt ggt gaa aag acc cgt aag ctg ttt gcc gac acc atc gcg cag gcc 5752
Gly Gly Glu Lys Thr Arg Lys Leu Phe Ala Asp Thr Ile Ala Gln Ala
315 320 325
aag acc atc gtc tgg aac ggt cca cct ggt gtg ttt gag ttc gag agc 5800
Lys Thr Ile Val Trp Asn Gly Pro Pro Gly Val Phe Glu Phe Glu Ser
330 335 340 345
ttt gcc agc ggt acc aag tcg atg ttg caa gct tgt gtc gag tct gcc 5848
Phe Ala Ser Gly Thr Lys Ser Met Leu Gln Ala Cys Val Glu Ser Ala
350 355 360
cag gcc gga aac acc gtt att atc ggt ggt gga gac act gcc acc gtg 5896
Gln Ala Gly Asn Thr Val Ile Ile Gly Gly Gly Asp Thr Ala Thr Val
365 370 375
gca aag aag ttt ggc ggt gcc gac aag ctg tcc cac gtt tcc act gga 5944
Ala Lys Lys Phe Gly Gly Ala Asp Lys Leu Ser His Val Ser Thr Gly
380 385 390
gga ggt gct tcc ctg gaa ttg ttg gag ggt aag gag ctt cct ggt gtt 5992
Gly Gly Ala Ser Leu Glu Leu Leu Glu Gly Lys Glu Leu Pro Gly Val
395 400 405
gct gct ttg aag agc aag act gct taggtgggat ttgcgtgatc tacgtagtgg 6046
Ala Ala Leu Lys Ser Lys Thr Ala
410 415
ttatttttgt agttagtttg actgtctaga aatactcttt gcacagcccc aaataaatta 6106
cactgccgtg aaattcatga gaaaaaagta ccaaagataa acaggggaga aagtgatcgg 6166
gtgttccctc ttgtgtgatc cagtcgtgaa cagtactgat caccacccca gatgactaaa 6226
cacaggcgca aaaacattcc actgacttac atcacacaga gcctagacaa ttccaggacc 6286
aatcagggtt cttcgtttga taaggctcta gtgaacaaac acaaacaaca cagatcaaag 6346
actcacaatt ctgtcaaatt ggccagtcta accaagtctt acttgtctgc caagccggtc 6406
caggcaacaa agagcccaac agttgacaaa atcaccaaaa ggatcaaccg aaagtcccac 6466
tcgaccaaga aaatcgaccc tgtcgcctct ttctcagggc cctgggggct tcttaccggc 6526
caacttaacg actatttaac gtcgattcgc tcaatgaact ctgttttgga ttacgaccag 6586
cccttgacca cggctcagaa gtcgtcgtcg tcgattttgg acatcaaacc gatttcagac 6646
catttgaacg tggtcaggtt cgcagagctc gatagcgtga tgctgggctc gttccaaaac 6706
cacccagtca gactcaaggc tggcgaccaa attcacattg gagacgatta ctacaatgtt 6766
ccgtacaacg gaaagtatct cagatgttac tatcgatggt ttaaagtgat atgaggtata 6826
tacaggatgc cgactagacg gtgaactgtt cgcgcagttg agagtactgg ctggaacggt 6886
ccggatcaca cttttccaac agttgcgaca caaatggtcc gtgcacagtt ttttccagag 6946
tgtttgaaat actcaacaaa ggcatgtact cgtccaggaa ctccttgcac atggtggcat 7006
cgcctttcac tgccaggaat tgaagagcaa ccagcgacgg ggtcaaatct tcccgtttca 7066
atgcaccgtc aaggactttc ttcatgtaca cccagttgtt gcggttggca aaaatggtga 7126
ggaaaacaac atccaatctg gaacgaaatt gggcagcagc caggtcgtgt tcgaacattc 7186
gggtggacag ttggtacagc ttgtgaacca ttggagagta cttgaagctg taattagggt 7246
ctgcagttag cgaaccgatc gtaaggaagt tttcgttatc gatctgcgag cccgagatga 7306
ctaatagagg tattagtttt tgaacgtcct ccgttgacaa aacagggtta taagtgttga 7366
gaatccggaa gatacgtgcg tatctcttgt tgaacacctc cgcctctgtc tctactgatt 7426
tgtgaaattc agacgactgt agcacgagat caatatatct gaacacctcg tcaacagtaa 7486
cgggtttccc gttggcttgc atggctttga aatggttctc gatcttgttc agagggtaag 7546
tggctgggtc cttcaaatgc agtgttttta aagcctcaaa tcgctggttg tagttctccg 7606
aggttaagag ttccggtcta aaagcgctcg agctcgcttg ggtggtgtag agatgtagcc 7666
ggttcagctg caaaatagtt tgaagattcg agatcctcgg ccgggcagtg tgatagtatc 7726
tgatcccggc aaagatatcg tcgttgtagc cacggtcact tctggctgga tactttgtct 7786
tctctttcga ccacaggttc tccaagcaca tgacttctct tctctccgcg gtcagaaagt 7846
ggacgtaaat gttatcgatt ttgcagtcca tcatcatcca ggtatttgct gaggccccgt 7906
aatcattgct ggcgtacgaa ggggctctct tacccttttt caacagtctt ctgtgatact 7966
tggctagctg gccactgctc agaagacctt ctgccagagg gatggttttc agagtgtgtt 8026
tgatgaaaag attgagctcc gccgtagctt tctggagatg cttcgaactc tttcctgttc 8086
caatgatcat gaagtcggcg atctcttggg ctccttcgtt gacctctgcc ccggtgctat 8146
cgcgcaagtc gaacagggcc agatcggtca ttcccagctt ctccgcgata aactcgagaa 8206
ctggctgcaa gctggccgga gagttgggcg gaagatccgg aatctgaatc tgtctaggct 8266
gcgaggccaa atccgcagac tcttcagctc tcatgtacca cgggagagct gccgttttga 8326
cttcttggtg gctgactgga actgacgaga agtcggcgac cagttgctgg gaactggcag 8386
cgttgtgagg gaagaagccg ctccgaaggg cgcggggcac aggacgcgac accggacaca 8446
accgacaccg tctccacatt atggctgtat ttggaaaaga ttgagtagtc gatagtttct 8506
gcaaaagctt tagcaaacaa caaacacgcg acgtttgaag acagtttttt ggcagcttcg 8566
atctgtcgat agttcagtgg tgatctcagt ggtcgtttcg tctaccttga atctctcacc 8626
ccagatgttg tctctgtgtg aagtttttgt gaatttttca tctttctttt tactcgattt 8686
tttcctcttc cacgtcgata gtcgcgagac gccttgcgac gcgccgtttt aatttcccaa 8746
aatttgcaca aacaaaagat aaaaacagga ctgtcgattt gggttttgtg ggaacagaaa 8806
agaggaaccg tttgaacaat aaagcaacgg tcctccaaaa tcatcctcta ccactcattc 8866
tcaacacgtg accatcggga acaagttctg gagctctctt caaaccgcga ctcaacatag 8926
tgttttgtgc caggcccgta ttttactata aaggtgccct caagaaccat tagttcgtgc 8986
tacttgcctc cgatttgtgc ttcctaacgg tgtttcaaca atcatgacag gccgggatcc 9046
<210>4
<211>417
<212>PRT
<213>Ogataea minuta
<400>4
Met Ser Leu Ser Ser Lys Leu Ser Val Lys Asp Leu Asp Val Ser Gly
1 5 10 15
Lys Arg Val Phe Ile Arg Val Asp Phe Asn Val Pro Leu Asp Gly Asp
20 25 30
Lys Ile Thr Asn Asn Gln Arg Ile Val Ala Ala Leu Pro Thr Ile Gln
35 40 45
Tyr Val Leu Glu Asn Lys Pro Lys Val Val Val Leu Ala Ser His Leu
50 55 60
Gly Arg Pro Asn Gly Glu Lys Asn Leu Lys Tyr Thr Leu Lys Pro Val
65 70 75 80
Ala Lys Glu Leu Glu Thr Leu Leu Gly Gln Lys Val Thr Phe Leu Asp
85 90 95
Asp Cys Val Gly Ser Glu Val Glu Ser Thr Val Asn Ser Ala Pro Ala
100 105 110
Gly Ser Val Ile Leu Leu Glu Asn Leu Arg Phe His Ile Glu Glu Glu
115 120 125
Gly Ser Lys Lys Thr Ser Glu Gly Lys Val Lys Ala Ser Lys Glu Asp
130 135 140
Val Glu Lys Phe Arg Lys Gln Leu Thr Ala Leu Ala Asp Val Tyr Val
145 150 155 160
Asn Asp Ala Phe Gly Thr Ala His Arg Ala His Ser Ser Met Val Gly
165 170 175
Phe Glu Leu Glu Asp Arg Ala Ala Gly Phe Leu Met Ala Lys Glu Leu
180 185 190
Glu Tyr Phe Ser Lys Ala Leu Glu Asn Pro Val Arg Pro Phe Leu Ala
195 200 205
Ile Leu Gly Gly Ala Lys Val Ser Asp Lys Ile Gln Leu Ile Asp Asn
210 215 220
Leu Leu Asp Lys Val Asp Leu Leu Ile Val Gly Gly Gly Met Ala Phe
225 230 235 240
Thr Phe Asn Lys Val Leu Asn Asp Met Lys Ile Gly Lys Ser Leu Phe
245 250 255
Asp Glu Thr Gly Ala Glu Ile Val Pro Lys Leu Val Glu Lys Ala Lys
260 265 270
Lys Asn Gly Val Lys Ile Val Leu Pro Val Asp Phe Val Thr Ala Asp
275 280 285
Ala Phe Ser Pro Asp Ala Lys Val Gly Tyr Ala Thr Leu Glu Glu Gly
290 295 300
Ile Ala Asp Asp Leu Gln Gly Leu Asp Gly Gly Glu Lys Thr Arg Lys
305 310 315 320
Leu Phe Ala Asp Thr Ile Ala Gln Ala Lys Thr Ile Val Trp Asn Gly
325 330 335
Pro Pro Gly Val Phe Glu Phe Glu Ser Phe Ala Ser Gly Thr Lys Ser
340 345 350
Met Leu Gln Ala Cys Val Glu Ser Ala Gln Ala Gly Asn Thr Val Ile
355 360 365
Ile Gly Gly Gly Asp Thr Ala Thr Val Ala Lys Lys Phe Gly Gly Ala
370 375 380
Asp Lys Leu Ser His Val Ser Thr Gly Gly Gly Ala Ser Leu Glu Leu
385 390 395 400
Leu Glu Gly Lys Glu Leu Pro Gly Val Ala Ala Leu Lys Ser Lys Thr
405 410 415
Ala
<210>5
<211>42
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:引物
<400>5
aagcttgaca atgtaggaga tcataaacac atcgtgcgcg tc 42
<210>6
<211>65
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:引物
<400>6
ggatccagat ctcatatgac tagttgctag ttctatgcgg cgttagtgtt tacactacga 60
cagct 65
<210>7
<211>40
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:引物
<400>7
ggatccgtgg gatttgcgtg atctacgtag tggttatttt 40
<210>8
<211>42
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:引物
<400>8
ggtaccgcag tgaaaggcga tgccaccatg tgcaaggagt tc 42
<210>9
<211>25
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:引物
<400>9
actagtatga gatttccttc aattt 25
<210>10
<211>25
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:引物
<400>10
gtcgacatga gatttccttc aattt 25
<210>11
<211>27
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:引物
<400>11
agcttcagcc tctcttttat ctagaga 27
<210>12
<211>47
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:引物
<400>12
tctctagata aaagagaggc tgaagctcag ctgcagctgc aggagtc 47
<210>13
<211>39
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:引物
<400>13
ccagatctgg atcctcattt acccggagac agggagagg 39
<210>14
<211>47
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:引物
<400>14
tctctagata aaagagaggc tgaagctgaa attgtgttga cacagtc 47
<210>15
<211>35
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:引物
<400>15
aaagggccct caacactctc ccctgttgaa gctct 35
<210>16
<211>25
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:引物
<400>16
atgacttcct tttcagcacc gcatc 25
<210>17
<211>23
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:引物
<400>17
caaaattgca agcaagttaa ccg 23
<210>18
<211>1431
<212>DNA
<213>Ogataea minuta
<400>18
atgacttcct tttcagcacc gcatcaacac cagtctattc cgtcggatgt tcctgtcgga 60
acgcttcctc ctagaaagag ggcgaagacc gacgaagaga aggagcaacg cagggttgag 120
cggattctca gaaataggag agccgcccac gcgtcgaggg aaaagaaaag aagacatgtt 180
gaacatctcg agacgtatgt gagtggcctg gagtcctcgc ttgcgattta cgagttgaat 240
caatccaaac tgcaaacgat acagtcgact ctcatatctt tgttgacgga gcacgggatc 300
gaatactctg gtattgactt ctcaatccaa gcaacaacaa aagtcagcaa gcctgacggg 360
ctcgacttga cacagacgaa tcctaccaaa aaacaaaaga gtttctcaaa gtcactttca 420
aaaaaaatgg gttcttcctc tagcatgaag atgtcggaac tcccatctcc tagcttcgac 480
gaggacgtct cttcggatga agacgacgat cttgaagatg acgagggagc agaaattgtc 540
gaggaatcgc caatgacgta tttggacctt ccggatccaa aagcgaacta caaaaagaga 600
aaggctgaag aagcttatat ttctccacct ggctcgacct ccccttccaa attgaagttg 660
gaggaagacg agctgatttt gaagcaagag tacagcaatt tgtttgacga cacggaagac 720
tttttctcta ctgagaagtc ttgcagtttg gagttgttca aacaaggcga ctctccttcg 780
gaatcattca tcaaacagga agacgatata ctgaaaatac ctgaggctgt tttcaactca 840
gaagaatatc atttgaatcc agtggaggac ctctgtgctt ttaatagcgt gcatcatcca 900
gcagtgatga ttgtatgatt tattgaaaag gcatctcaat aacattgaaa cagtgagatt 960
tccaaacaag aattgtacaa acgtgacatc atcaaaggta aaatcagaaa aaagttcttt 1020
tttcaggggt atttgtttgt tcttctttct gattttaccg tagttacgtt ttgtctgttt 1080
tttgaggaag tccaagctct tcgagcgttt catgtcggtt tattgcagat gttcgttttg 1140
gtccgcagca ccattatcag cgggggtcgt taacacttca tttgaattcg atgatttctt 1200
gtcatgagga agatagtcta cttggtttta tttagttgga atttggtgtc attgtttgat 1260
gagggggatg gaggtttgat caatcggttt caagttctct ttcgatgaga ttaatttgtt 1320
accgtctatg agttagatcc tgacccttgg tgagcttcgg aaaaaagttt gaagttcagc 1380
ctggttccat gccacgcgtg tttggttacg gttaacttgc ttgcaatttt g 1431
<210>19
<211>1187
<212>DNA
<213>Ogataea minuta
<400>19
atgacttcct tttcagcacc gcatcaacac cagtctattc cgtcggatgt tcctgtcgga 60
acgcttcctc ctagaaagag ggcgaagacc gacgaagaga aggagcaacg cagggttgag 120
cggattctca gaaataggag agccgcccac gcgtcgaggg aaaagaaaag aagacatgtt 180
gaacatctcg agacgtatgt gagtggcctg gagtcctcgc ttgcgattta cgagttgaat 240
caatccaaac tgcaaacgat acagtcgact ctcatatctt tgttgacgga gcacgggatc 300
gaatactctg gtattgactt ctcaatccaa gcaacaacaa aagtcagcaa gcctgacggg 360
ctcgacttga cacagacgaa tcctaccaaa aaacaaaaga gtttctcaaa gtcactttca 420
aaaaaaatgg gttcttcctc tagcatgaag atgtcggaac tcccatctcc tagcttcgac 480
gaggacgtct cttcggatga agacgacgat cttgaagatg acgagggagc agaaattgtc 540
gaggaatcgc caatgacgta tttggacctt ccggatccaa aagcgaacta caaaaagaga 600
aaggctgaag aagcttatat ttctccacct ggctcgacct ccccttccaa attgaagttg 660
gaggaagacg agctgatttt gaagcaagag tacagcaatt tgtttgacga cacggaagac 720
tttttctcta ctgagaagtc ttgcagtttg gagttgttca aacaaggcga ctctccttcg 780
gaatcattca tcaaacagga agacgatata ctgaaaatac ctgaggctgt tttcaactca 840
gaagaatatc atttgaatcc agtggaggac ctctgtgctt ttaatagcgt gcatcatcca 900
gcagcaccat tatcagcggg ggtcgttaac acttcatttg aattcgatga tttcttgtca 960
tgaggaagat agtctacttg gttttattta gttggaattt ggtgtcattg tttgatgagg 1020
gggatggagg tttgatcaat cggtttcaag ttctctttcg atgagattaa tttgttaccg 1080
tctatgagtt agatcctgac ccttggtgag cttcggaaaa aagtttgaag ttcagcctgg 1140
ttccatgcca cgcgtgtttg gttacggtta acttgcttgc aattttg 1187
<210>20
<211>28
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:引物
<400>20
gactagtatg acttcctttt cagcaccg 28
<210>21
<211>29
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:引物
<400>21
cagatcttca tgacaagaaa tcatcgaat 29
<210>22
<211>963
<212>DNA
<213>Ogataea minuta
<220>
<221>CDS
<222>(1)..(963)
<400>22
atg act tcc ttt tca gca ccg cat caa cac cag tct att ccg tcg gat 48
Met Thr Ser Phe Ser Ala Pro His Gln His Gln Ser Ile Pro Ser Asp
1 5 10 15
gtt cct gtc gga acg ctt cct cct aga aag agg gcg aag acc gac gaa 96
Val Pro Val Gly Thr Leu Pro Pro Arg Lys Arg Ala Lys Thr Asp Glu
20 25 30
gag aag gag caa cgc agg gtt gag cgg att ctc aga aat agg aga gcc 144
Glu Lys Glu Gln Arg Arg Val Glu Arg Ile Leu Arg Asn Arg Arg Ala
35 40 45
gcc cac gcg tcg agg gaa aag aaa aga aga cat gtt gaa cat ctc gag 192
Ala His Ala Ser Arg Glu Lys Lys Arg Arg His Val Glu His Leu Glu
50 55 60
acg tat gtg agt ggc ctg gag tcc tcg ctt gcg att tac gag ttg aat 240
Thr Tyr Val Ser Gly Leu Glu Ser Ser Leu Ala Ile Tyr Glu Leu Asn
65 70 75 80
caa tcc aaa ctg caa acg ata cag tcg act ctc ata tct ttg ttg acg 288
Gln Ser Lys Leu Gln Thr Ile Gln Ser Thr Leu Ile Ser Leu Leu Thr
85 90 95
gag cac ggg atc gaa tac tct ggt att gac ttc tca atc caa gca aca 336
Glu His Gly Ile Glu Tyr Ser Gly Ile Asp Phe Ser Ile Gln Ala Thr
100 105 110
aca aaa gtc agc aag cct gac ggg ctc gac ttg aca cag acg aat cct 384
Thr Lys Val Ser Lys Pro Asp Gly Leu Asp Leu Thr Gln Thr Asn Pro
115 120 125
acc aaa aaa caa aag agt ttc tca aag tca ctt tca aaa aaa atg ggt 432
Thr Lys Lys Gln Lys Ser Phe Ser Lys Ser Leu Ser Lys Lys Met Gly
130 135 140
tct tcc tct agc atg aag atg tcg gaa ctc cca tct cct agc ttc gac 480
Ser Ser Ser Ser Met Lys Met Ser Glu Leu Pro Ser Pro Ser Phe Asp
145 150 155 160
gag gac gtc tct tcg gat gaa gac gac gat ctt gaa gat gac gag gga 528
Glu Asp Val Ser Ser Asp Glu Asp Asp Asp Leu Glu Asp Asp Glu Gly
165 170 175
gca gaa att gtc gag gaa tcg cca atg acg tat ttg gac ctt ccg gat 576
Ala Glu Ile Val Glu Glu Ser Pro Met Thr Tyr Leu Asp Leu Pro Asp
180 185 190
cca aaa gcg aac tac aaa aag aga aag gct gaa gaa gct tat att tct 624
Pro Lys Ala Asn Tyr Lys Lys Arg Lys Ala Glu Glu Ala Tyr Ile Ser
195 200 205
cca cct ggc tcg acc tcc cct tcc aaa ttg aag ttg gag gaa gac gag 672
Pro Pro Gly Ser Thr Ser Pro Ser Lys Leu Lys Leu Glu Glu Asp Glu
210 215 220
ctg att ttg aag caa gag tac agc aat ttg ttt gac gac acg gaa gac 720
Leu Ile Leu Lys Gln Glu Tyr Ser Asn Leu Phe Asp Asp Thr Glu Asp
225 230 235 240
ttt ttc tct act gag aag tct tgc agt ttg gag ttg ttc aaa caa ggc 768
Phe Phe Ser Thr Glu Lys Ser Cys Ser Leu Glu Leu Phe Lys Gln Gly
245 250 255
gac tct cct tcg gaa tca ttc atc aaa cag gaa gac gat ata ctg aaa 816
Asp Ser Pro Ser Glu Ser Phe Ile Lys Gln Glu Asp Asp Ile Leu Lys
260 265 270
ata cct gag gct gtt ttc aac tca gaa gaa tat cat ttg aat cca gtg 864
Ile Pro Glu Ala Val Phe Asn Ser Glu Glu Tyr His Leu Asn Pro Val
275 280 285
gag gac ctc tgt gct ttt aat agc gtg cat cat cca gca gca cca tta 912
Glu Asp Leu Cys Ala Phe Asn Ser Val His His Pro Ala Ala Pro Leu
290 295 300
tca gcg ggg gtc gtt aac act tca ttt gaa ttc gat gat ttc ttg tca 960
Ser Ala Gly Val Val Asn Thr Ser Phe Glu Phe Asp Asp Phe Leu Ser
305 310 315 320
tga 963
<210>23
<211>320
<212>PRT
<213>Ogataea minuta
<400>23
Met Thr Ser Phe Ser Ala Pro His Gln His Gln Ser Ile Pro Ser Asp
1 5 10 15
Val Pro Val Gly Thr Leu Pro Pro Arg Lys Arg Ala Lys Thr Asp Glu
20 25 30
Glu Lys Glu Gln Arg Arg Val Glu Arg Ile Leu Arg Asn Arg Arg Ala
35 40 45
Ala His Ala Ser Arg Glu Lys Lys Arg Arg His Val Glu His Leu Glu
50 55 60
Thr Tyr Val Ser Gly Leu Glu Ser Ser Leu Ala Ile Tyr Glu Leu Asn
65 70 75 80
Gln Ser Lys Leu Gln Thr Ile Gln Ser Thr Leu Ile Ser Leu Leu Thr
85 90 95
Glu His Gly Ile Glu Tyr Ser Gly Ile Asp Phe Ser Ile Gln Ala Thr
100 105 110
Thr Lys Val Ser Lys Pro Asp Gly Leu Asp Leu Thr Gln Thr Asn Pro
115 120 125
Thr Lys Lys Gln Lys Ser Phe Ser Lys Ser Leu Ser Lys Lys Met Gly
130 135 140
Ser Ser Ser Ser Met Lys Met Ser Glu Leu Pro Ser Pro Ser Phe Asp
145 150 155 160
Glu Asp Val Ser Ser Asp Glu Asp Asp Asp Leu Glu Asp Asp Glu Gly
165 170 175
Ala Glu Ile Val Glu Glu Ser Pro Met Thr Tyr Leu Asp Leu Pro Asp
180 185 190
Pro Lys Ala Asn Tyr Lys Lys Arg Lys Ala Glu Glu Ala Tyr Ile Ser
195 200 205
Pro Pro Gly Ser Thr Ser Pro Ser Lys Leu Lys Leu Glu Glu Asp Glu
210 215 220
Leu Ile Leu Lys Gln Glu Tyr Ser Asn Leu Phe Asp Asp Thr Glu Asp
225 230 235 240
Phe Phe Ser Thr Glu Lys Ser Cys Ser Leu Glu Leu Phe Lys Gln Gly
245 250 255
Asp Ser Pro Ser Glu Ser Phe Ile Lys Gln Glu Asp Asp Ile Leu Lys
260 265 270
Ile Pro Glu Ala Val Phe Asn Ser Glu Glu Tyr His Leu Asn Pro Val
275 280 285
Glu Asp Leu Cys Ala Phe Asn Ser Val His His Pro Ala Ala Pro Leu
290 295 300
Ser Ala Gly Val Val Asn Thr Ser Phe Glu Phe Asp Asp Phe Leu Ser
305 310 315 320
<210>24
<211>50
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:引物
<400>24
atacaataca aagtcgagac tagtatggat atttacgaca ctcaaacctt 50
<210>25
<211>50
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:引物
<400>25
tctatccaca cggatcagat cttcagacag aggtgccctc ctttgagctg 50
<210>26
<211>24
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:引物
<400>26
ggaattcatg agatttcctt caat 24
<210>27
<211>35
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:引物
<400>27
ctccaccagc tgtacttctc ttttctcgag agata 35
<210>28
<211>35
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:引物
<400>28
tatctctcga gaaaagagaa gtacagctgg tggag 35
<210>29
<211>25
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:引物
<400>29
ggtcgactca tttacccggg gacag 25
<210>30
<211>34
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:引物
<400>30
tgggtcatct gaatgtctct tttctcgaga gata 34
<210>31
<211>34
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:引物
<400>31
tatctctcga gaaaagagac attcagatga ccca 34
<210>32
<211>24
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:引物
<400>32
ggtcgaccta acactctccc ctgt 24
<210>33
<211>26
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:引物
<400>33
ggagctcatg gaaatgactg attttg 26
<210>34
<211>44
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:引物
<400>34
gaattcaaac ctgactgcgc ttctggatta cgccaattgt caag 44
<210>35
<211>44
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:引物
<400>35
cttgacaatt ggcgtaatcc agaagcgcag tcaggtttga attc 44
<210>36
<211>28
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:引物
<400>36
gcccgggtca tgaagtgatg aagaaatc 28
<210>37
<211>26
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:引物
<400>37
gggtaccatg gatatttacg acactc 26
<210>38
<211>26
<212>DNA
<213>人工序列
<220>
<223>人工序列的描述:引物
<400>38
gtctagatca gacagaggtg ccctcc 26
<210>39
<211>717
<212>DNA
<213>啤酒糖酵母
<220>
<221>CDS
<222>(1)..(717)
<400>39
atg gaa atg act gat ttt gaa cta act agt aat tcg caa tcg aac ttg 48
Met Glu Met Thr Asp Phe Glu Leu Thr Ser Asn Ser Gln Ser Asn Leu
1 5 10 15
gct atc cct acc aac ttc aag tcg act ctg cct cca agg aaa aga gcc 96
Ala Ile Pro Thr Asn Phe Lys Ser Thr Leu Pro Pro Arg Lys Arg Ala
20 25 30
aag aca aaa gag gaa aag gaa cag cga agg atc gag cgt att ttg aga 144
Lys Thr Lys Glu Glu Lys Glu Gln Arg Arg Ile Glu Arg Ile Leu Arg
35 40 45
aac aga aga gct gct cac cag agc aga gag aaa aaa aga cta cat ctg 192
Asn Arg Arg Ala Ala His Gln Ser Arg Glu Lys Lys Arg Leu His Leu
50 55 60
cag tat ctc gag aga aaa tgt tct ctt ttg gaa aat tta ctg aac agc 240
Gln Tyr Leu Glu Arg Lys Cys Ser Leu Leu Glu Asn Leu Leu Asn Ser
65 70 75 80
gtc aac ctt gaa aaa ctg gct gac cac gaa gac gcg ttg act tgc agc 288
Val Asn Leu Glu Lys Leu Ala Asp His Glu Asp Ala Leu Thr Cys Ser
85 90 95
cac gac gct ttt gtt gct tct ctt gac gag tac agg gat ttc cag agc 336
His Asp Ala Phe Val Ala Ser Leu Asp Glu Tyr Arg Asp Phe Gln Ser
100 105 110
acg agg ggc gct tca ctg gac acc agg gcc agt tcg cac tcg tcg tct 384
Thr Arg Gly Ala Ser Leu Asp Thr Arg Ala Ser Ser His Ser Ser Ser
115 120 125
gat acg ttc aca cct tca cct ctg aac tgt aca atg gag cct gcg act 432
Asp Thr Phe Thr Pro Ser Pro Leu Asn Cys Thr Met Glu Pro Ala Thr
130 135 140
ttg tcg ccc aag agt atg cgc gat tcc gcg tcg gac caa gag act tca 480
Leu Ser Pro Lys Ser Met Arg Asp Ser Ala Ser Asp Gln Glu Thr Ser
145 150 155 160
tgg gag ctg cag atg ttt aag acg gaa aat gta cca gag tcg acg acg 528
Trp Glu Leu Gln Met Phe Lys Thr Glu Asn Val Pro Glu Ser Thr Thr
165 170 175
cta cct gcc gta gac aac aac aat ttg ttt gat gcg gtg gcc tcg ccg 576
Leu Pro Ala Val Asp Asn Asn Asn Leu Phe Asp Ala Val Ala Ser Pro
180 185 190
ttg gca gac cca ctc tgc gac gat ata gcg gga aac agt cta ccc ttt 624
Leu Ala Asp Pro Leu Cys Asp Asp Ile Ala Gly Asn Ser Leu Pro Phe
195 200 205
gac aat tca att gat ctt gac aat tgg cgt aat cca gaa gcg cag tca 672
Asp Asn Ser Ile Asp Leu Asp Asn Trp Arg Asn Pro Glu Ala Gln Ser
210 215 220
ggt ttg aat tca ttt gaa ttg aat gat ttc ttc atc act tca tga 717
Gly Leu Asn Ser Phe Glu Leu Asn Asp Phe Phe Ile Thr Ser
225 230 235
<210>40
<211>238
<212>PRT
<213>啤酒糖酵母
<400>40
Met Glu Met Thr Asp Phe Glu Leu Thr Ser Asn Ser Gln Ser Asn Leu
1 5 10 15
Ala Ile Pro Thr Asn Phe Lys Ser Thr Leu Pro Pro Arg Lys Arg Ala
20 25 30
Lys Thr Lys Glu Glu Lys Glu Gln Arg Arg Ile Glu Arg Ile Leu Arg
35 40 45
Asn Arg Arg Ala Ala His Gln Ser Arg Glu Lys Lys Arg Leu His Leu
50 55 60
Gln Tyr Leu Glu Arg Lys Cys Ser Leu Leu Glu Asn Leu Leu Asn Ser
65 70 75 80
Val Asn Leu Glu Lys Leu Ala Asp His Glu Asp Ala Leu Thr Cys Ser
85 90 95
His Asp Ala Phe Val Ala Ser Leu Asp Glu Tyr Arg Asp Phe Gln Ser
100 105 110
Thr Arg Gly Ala Ser Leu Asp Thr Arg Ala Ser Ser His Ser Ser Ser
115 120 125
Asp Thr Phe Thr Pro Ser Pro Leu Asn Cys Thr Met Glu Pro Ala Thr
130 135 140
Leu Ser Pro Lys Ser Met Arg Asp Ser Ala Ser Asp Gln Glu Thr Ser
145 150 155 160
Trp Glu Leu Gln Met Phe Lys Thr Glu Asn Val Pro Glu Ser Thr Thr
165 170 175
Leu Pro Ala Val Asp Asn Asn Asn Leu Phe Asp Ala Val Ala Ser Pro
180 185 190
Leu Ala Asp Pro Leu Cys Asp Asp Ile Ala Gly Asn Ser Leu Pro Phe
195 200 205
Asp Asn Ser Ile Asp Leu Asp Asn Trp Arg Asn Pro Glu Ala Gln Ser
210 215 220
Gly Leu Asn Ser Phe Glu Leu Asn Asp Phe Phe Ile Thr Ser
225 230 235
<210>41
<211>1356
<212>DNA
<213>里氏木霉
<220>
<221>CDS
<222>(1)..(1356)
<400>41
atg gcg ttc cag cag tcg tct ccc ctc gtc aag ttt gag gcc tct ccc 48
Met Ala Phe Gln Gln Ser Ser Pro Leu Val Lys Phe Glu Ala Ser Pro
1 5 10 15
gcc gaa tcc ttc ctc tcc gcc ccc ggc gac aac ttc aca tcc ctc ttc 96
Ala Glu Ser Phe Leu Ser Ala Pro Gly Asp Asn Phe Thr Ser Leu Phe
20 25 30
gcc gac tca aca ccc tca aca ctt aac cct cgg gac atg atg acc cct 144
Ala Asp Ser Thr Pro Ser Thr Leu Asn Pro Arg Asp Met Met Thr Pro
35 40 45
gac agc gtc gcc gac atc gac tct cgc ctg tcc gtc atc ccc gaa tca 192
Asp Ser Val Ala Asp Ile Asp Ser Arg Leu Ser Val Ile Pro Glu Ser
50 55 60
cag gac gcg gaa gat gac gaa tca cac tcc aca tcc gct acc gca ccc 240
Gln Asp Ala Glu Asp Asp Glu Ser His Ser Thr Ser Ala Thr Ala Pro
65 70 75 80
tct acc tca gaa aag aag ccc gtc aag aag agg aaa tca tgg ggc cag 288
Ser Thr Ser Glu Lys Lys Pro Val Lys Lys Arg Lys Ser Trp Gly Gln
85 90 95
gtt ctt cct gag ccc aag acc aac ctc cct cct cga aaa cgt gca aag 336
Val Leu Pro Glu Pro Lys Thr Asn Leu Pro Pro Arg Lys Arg Ala Lys
100 105 110
acg gaa gat gaa aag gag cag cgc cgc gtc gag cgt gtt ctc cgc aac 384
Thr Glu Asp Glu Lys Glu Gln Arg Arg Val Glu Arg Val Leu Arg Asn
115 120 125
cgc cgc gcc gcg cag tcc tcg cgc gag cgc aag agg ctc gag gtc gag 432
Arg Arg Ala Ala Gln Ser Ser Arg Glu Arg Lys Arg Leu Glu Val Glu
130 135 140
gct ctc gag aag cgc aac aag gag ctc gag acg ctc ctc atc aac gtc 480
Ala Leu Glu Lys Arg Asn Lys Glu Leu Glu Thr Leu Leu Ile Asn Val
145 150 155 160
cag aag acc aac ctg atc ctc gtc gag gag ctc aac cgc ttc cga cgc 528
Gln Lys Thr Asn Leu Ile Leu Val Glu Glu Leu Asn Arg Phe Arg Arg
165 170 175
agc tca ggc gtc gtc acc cgc tcg tcc tcc ccc ctc gac tct ctc cag 576
Ser Ser Gly Val Val Thr Arg Ser Ser Ser Pro Leu Asp Ser Leu Gln
180 185 190
gac agc atc act ctc tcc cag caa ctc ttt ggc tcg cgg gat ggc caa 624
Asp Ser Ile Thr Leu Ser Gln Gln Leu Phe Gly Ser Arg Asp Gly Gln
195 200 205
acc atg tcc aac ccc gag cag tcc ttg atg gac cag atc atg aga tct 672
Thr Met Ser Asn Pro Glu Gln Ser Leu Met Asp Gln Ile Met Arg Ser
210 215 220
gcc gct aac cct acc gtt aac ccg gcc tct ctt tcc ccc tcc ctc ccc 720
Ala Ala Asn Pro Thr Val Asn Pro Ala Ser Leu Ser Pro Ser Leu Pro
225 230 235 240
ccc atc tcg gac aag gag ttc cag acc aag gag gag gac gag gaa cag 768
Pro Ile Ser Asp Lys Glu Phe Gln Thr Lys Glu Glu Asp Glu Glu Gln
245 250 255
gcc gac gaa gat gaa gag atg gag cag aca tgg cac gag acc aaa gaa 816
Ala Asp Glu Asp Glu Glu Met Glu Gln Thr Trp His Glu Thr Lys Glu
260 265 270
gcc gcc gcc gcc aag gag aag aac agc aag cag tcc cgc gtc tcc act 864
Ala Ala Ala Ala Lys Glu Lys Asn Ser Lys Gln Ser Arg Val Ser Thr
275 280 285
gat tcg aca caa cgt cct gca gtg tca atc ggt gga gat gcc gct gtc 912
Asp Ser Thr Gln Arg Pro Ala Val Ser Ile Gly Gly Asp Ala Ala Val
290 295 300
cct gtc ttc tca gac gac gcc ggc gca aac tgc ctt ggc ctg gac cct 960
Pro Val Phe Ser Asp Asp Ala Gly Ala Asn Cys Leu Gly Leu Asp Pro
305 310 315 320
gtt cat cag gat gat ggt cct ttc agc atc ggc cat tct ttc ggc ctg 1008
Val His Gln Asp Asp Gly Pro Phe Ser Ile Gly His Ser Phe Gly Leu
325 330 335
tca gcg gcc ctt gat gca gat cgc tat ctc ctc gaa agc caa ctt ctc 1056
Ser Ala Ala Leu Asp Ala Asp Arg Tyr Leu Leu Glu Ser Gln Leu Leu
340 345 350
gct tcg ccc aac gcc tca act gtt gac gac gat tat ctg gct ggt gac 1104
Ala Ser Pro Asn Ala Ser Thr Val Asp Asp Asp Tyr Leu Ala Gly Asp
355 360 365
tct gcc gcc tgc ttc acg aat cct ctc ccc tcc gac tac gac ttc gac 1152
Ser Ala Ala Cys Phe Thr Asn Pro Leu Pro Ser Asp Tyr Asp Phe Asp
370 375 380
atc aac gac ttc ctc aca gac gac gca aac cac gcc gcc tat gac att 1200
Ile Asn Asp Phe Leu Thr Asp Asp Ala Asn His Ala Ala Tyr Asp Ile
385 390 395 400
gtg gca gcg agc aac tat gcc gct gcg gac cgc gag ctc gac ctc gag 1248
Val Ala Ala Ser Asn Tyr Ala Ala Ala Asp Arg Glu Leu Asp Leu Glu
405 410 415
atc cac gac cct gag aat cag atc cct tcg cga cat tct atc cag cag 1296
Ile His Asp Pro Glu Asn Gln Ile Pro Ser Arg His Ser Ile Gln Gln
420 425 430
ccc cag tct ggc gcg tcc tct cat gga tgc gac gat ggc ggc att gcg 1344
Pro Gln Ser Gly Ala Ser Ser His Gly Cys Asp Asp Gly Gly Ile Ala
435 440 445
gtt ggt gtc tga 1356
Val Gly Val
450
<210>42
<211>451
<212>PRT
<213>里氏木霉
<400>42
Met Ala Phe Gln Gln Ser Ser Pro Leu Val Lys Phe Glu Ala Ser Pro
1 5 10 15
Ala Glu Ser Phe Leu Ser Ala Pro Gly Asp Asn Phe Thr Ser Leu Phe
20 25 30
Ala Asp Ser Thr Pro Ser Thr Leu Asn Pro Arg Asp Met Met Thr Pro
35 40 45
Asp Ser Val Ala Asp Ile Asp Ser Arg Leu Ser Val Ile Pro Glu Ser
50 55 60
Gln Asp Ala Glu Asp Asp Glu Ser His Ser Thr Ser Ala Thr Ala Pro
65 70 75 80
Ser Thr Ser Glu Lys Lys Pro Val Lys Lys Arg Lys Ser Trp Gly Gln
85 90 95
Val Leu Pro Glu Pro Lys Thr Asn Leu Pro Pro Arg Lys Arg Ala Lys
100 105 110
Thr Glu Asp Glu Lys Glu Gln Arg Arg Val Glu Arg Val Leu Arg Asn
115 120 125
Arg Arg Ala Ala Gln Ser Ser Arg Glu Arg Lys Arg Leu Glu Val Glu
130 135 140
Ala Leu Glu Lys Arg Asn Lys Glu Leu Glu Thr Leu Leu Ile Asn Val
145 150 155 160
Gln Lys Thr Asn Leu Ile Leu Val Glu Glu Leu Asn Arg Phe Arg Arg
165 170 175
Ser Ser Gly Val Val Thr Arg Ser Ser Ser Pro Leu Asp Ser Leu Gln
180 185 190
Asp Ser Ile Thr Leu Ser Gln Gln Leu Phe Gly Ser Arg Asp Gly Gln
195 200 205
Thr Met Ser Asn Pro Glu Gln Ser Leu Met Asp Gln Ile Met Arg Ser
210 215 220
Ala Ala Asn Pro Thr Val Asn Pro Ala Ser Leu Ser Pro Ser Leu Pro
225 230 235 240
Pro IIe Ser Asp Lys Glu Phe Gln Thr Lys Glu Glu Asp Glu Glu Gln
245 250 255
Ala Asp Glu Asp Glu Glu Met Glu Gln Thr Trp His Glu Thr Lys Glu
260 265 270
Ala Ala Ala Ala Lys Glu Lys Asn Ser Lys Gln Ser Arg Val Ser Thr
275 280 285
Asp Ser Thr Gln Arg Pro Ala Val Ser Ile Gly Gly Asp Ala Ala Val
290 295 300
Pro Val Phe Ser Asp Asp Ala Gly Ala Asn Cys Leu Gly Leu Asp Pro
305 310 315 320
Val His Gln Asp Asp Gly Pro Phe Ser Ile Gly His Ser Phe Gly Leu
325 330 335
Ser Ala Ala Leu Asp Ala Asp Arg Tyr Leu Leu Glu Ser Gln Leu Leu
340 345 350
Ala Ser Pro Asn Ala Ser Thr Val Asp Asp Asp Tyr Leu Ala Gly Asp
355 360 365
Ser Ala Ala Cys Phe Thr Asn Pro Leu Pro Ser Asp Tyr Asp Phe Asp
370 375 380
Ile Asn Asp Phe Leu Thr Asp Asp Ala Asn His Ala Ala Tyr Asp Ile
385 390 395 400
Val Ala Ala Ser Asn Tyr Ala Ala Ala Asp Arg Glu Leu Asp Leu Glu
405 410 415
Ile His Asp Pro Glu Asn Gln Ile Pro Ser Arg His Ser Ile Gln Gln
420 425 430
Pro Gln Ser Gly Ala Ser Ser His Gly Cys Asp Asp Gly Gly Ile Ala
435 440 445
Val Gly Val
450
<210>43
<211>1053
<212>DNA
<213>构巢曲霉
<220>
<221>CDS
<222>(1)..(1053)
<400>43
atg aaa tca gca gac cgg ttt tcg cca gtg aaa atg gag gac gct ttc 48
Met Lys Ser Ala Asp Arg Phe Ser Pro Val Lys Met Glu Asp Ala Phe
1 5 10 15
gca aac tct ttg cct act acc ccg tca ttg gag gtt cct gtg ctc act 96
Ala Asn Ser Leu Pro Thr Thr Pro Ser Leu Glu Val Pro Val Leu Thr
20 25 30
gtc tcc ccg gct gac aca tct ctt cgg acg aag aat gtg gtg gct cag 144
Val Ser Pro Ala Asp Thr Ser Leu Arg Thr Lys Asn Val Val Ala Gln
35 40 45
aca aag cct gag gag aag aag cca gcg aag aaa aga aag tcc tgg ggc 192
Thr Lys Pro Glu Glu Lys Lys Pro Ala Lys Lys Arg Lys Ser Trp Gly
50 55 60
cag gaa tta cca gtt ccc aag aca aac tta cct cca aga aaa cgc gct 240
Gln Glu Leu Pro Val Pro Lys Thr Asn Leu Pro Pro Arg Lys Arg Ala
65 70 75 80
aag aca gaa gat gag aaa gag cag cgc cgg att gag cga gtt ctt cgc 288
Lys Thr Glu Asp Glu Lys Glu Gln Arg Arg Ile Glu Arg Val Leu Arg
85 90 95
aac cgc gca gcc gca caa acc tct cgc gag cgc aag aga ctt gaa atg 336
Asn Arg Ala Ala Ala Gln Thr Ser Arg Glu Arg Lys Arg Leu Glu Met
100 105 110
gag aag tta gaa agc gag aag att gat atg gaa caa caa aac cag ttc 384
Glu Lys Leu Glu Ser Glu Lys Ile Asp Met Glu Gln Gln Asn Gln Phe
115 120 125
ctt ctt cag cgt ctc gcc cag atg gag gct gag aac aac cgt tta agt 432
Leu Leu Gln Arg Leu Ala Gln Met Glu Ala Glu Asn Asn Arg Leu Ser
130 135 140
cag caa gtt gct cag cta tcc gcg gag gtt cgg gga tcc cgc cac agc 480
Gln Gln Val Ala Gln Leu Ser Ala Glu Val Arg Gly Ser Arg His Ser
145 150 155 160
act cca act tcc agt tcc ccc gcg tca gtt tcg cca act ctc aca ccg 528
Thr Pro Thr Ser Ser Ser Pro Ala Ser Val Ser Pro Thr Leu Thr Pro
165 170 175
act ctt ttt aag cag gaa ggg gat gag gtt cct ctg gac cgc atc cct 576
Thr Leu Phe Lys Gln Glu Gly Asp Glu Val Pro Leu Asp Arg Ile Pro
180 185 190
ttt cca act ccc tcc gtg acc gac tac tcc cca act ctt aag cct tca 624
Phe Pro Thr Pro Ser Val Thr Asp Tyr Ser Pro Thr Leu Lys Pro Ser
195 200 205
tct ctg gct gag tcc ccc gat ttg aca caa cat cct gca gtg tca gtc 672
Ser Leu Ala Glu Ser Pro Asp Leu Thr Gln His Pro Ala Val Ser Val
210 215 220
ggc ggg ctc gaa gga gat gaa agt gcc ctc acg ctt ttc gac ctc gga 720
Gly Gly Leu Glu Gly Asp Glu Ser Ala Leu Thr Leu Phe Asp Leu Gly
225 230 235 240
gcc agc att aag cat gag cct aca cat gac ctt aca gct cct ctt tct 768
Ala Ser Ile Lys His Glu Pro Thr His Asp Leu Thr Ala Pro Leu Ser
245 250 255
gac gat gac ttc cgc cgc cta ttc aac ggt gat tca tcc ctt gag tca 816
Asp Asp Asp Phe Arg Arg Leu Phe Asn Gly Asp Ser Ser Leu Glu Ser
260 265 270
gat tct tca ctc ctt gaa gac ggg ttc gcc ttt gac gtt ctc gac tca 864
Asp Ser Ser Leu Leu Glu Asp Gly Phe Ala Phe Asp Val Leu Asp Ser
275 280 285
gga gat tta tca gca ttt cca ttt gat tct atg gtt gat ttt gac acc 912
Gly Asp Leu Ser Ala Phe Pro Phe Asp Ser Met Val Asp Phe Asp Thr
290 295 300
gag cct gtc acc ctc gaa gat ctc gag caa acc aac ggc ctt tcg gat 960
Glu Pro Val Thr Leu Glu Asp Leu Glu Gln Thr Asn Gly Leu Ser Asp
305 310 315 320
tca gct tct tgc aag gct gct agc ttg caa ccc agc cat ggc gcg tcc 1008
Ser Ala Ser Cys Lys Ala Ala Ser Leu Gln Pro Ser His Gly Ala Ser
325 330 335
act tcg cga tgc gac ggg cag ggc att gca gct ggc agt gcg tga 1053
Thr Ser Arg Cys Asp Gly Gln Gly Ile Ala Ala Gly Ser Ala
340 345 350
<210>44
<211>350
<212>PRT
<213>构巢曲霉
<400>44
Met Lys Ser Ala Asp Arg Phe Ser Pro Val Lys Met Glu Asp Ala Phe
1 5 10 15
Ala Asn Ser Leu Pro Thr Thr Pro Ser Leu Glu Val Pro Val Leu Thr
20 25 30
Val Ser Pro Ala Asp Thr Ser Leu Arg Thr Lys Asn Val Val Ala Gln
35 40 45
Thr Lys Pro Glu Glu Lys Lys Pro Ala Lys Lys Arg Lys Ser Trp Gly
50 55 60
Gln Glu Leu Pro Val Pro Lys Thr Asn Leu Pro Pro Arg Lys Arg Ala
65 70 75 80
Lys Thr Glu Asp Glu Lys Glu Gln Arg Arg Ile Glu Arg Val Leu Arg
85 90 95
Asn Arg Ala Ala Ala Gln Thr Ser Arg Glu Arg Lys Arg Leu Glu Met
100 105 110
Glu Lys Leu Glu Ser Glu Lys Ile Asp Met Glu Gln Gln Ash Gln Phe
115 120 125
Leu Leu Gln Arg Leu Ala Gln Met Glu Ala Glu Asn Asn Arg Leu Ser
130 135 140
Gln Gln Val Ala Gln Leu Ser Ala Glu Val Arg Gly Ser Arg His Ser
145 150 155 160
Thr Pro Thr Ser Ser Ser Pro Ala Ser Val Ser Pro Thr Leu Thr Pro
165 170 175
Thr Leu Phe Lys Gln Glu Gly Asp Glu Val Pro Leu Asp Arg Ile Pro
180 185 190
Phe Pro Thr Pro Ser Val Thr Asp Tyr Ser Pro Thr Leu Lys Pro Ser
195 200 205
Ser Leu Ala Glu Ser Pro Asp Leu Thr Gln His Pro Ala Val Ser Val
210 215 220
Gly Gly Leu Glu Gly Asp Glu Ser Ala Leu Thr Leu Phe Asp Leu Gly
225 230 235 240
Ala Ser Ile Lys His Glu Pro Thr His Asp Leu Thr Ala Pro Leu Ser
245 250 255
Asp Asp Asp Phe Arg Arg Leu Phe Asn Gly Asp Ser Ser Leu Glu Ser
260 265 270
Asp Ser Ser Leu Leu Glu Asp Gly Phe Ala Phe Asp Val Leu Asp Ser
275 280 285
Gly Asp Leu Ser Ala Phe Pro Phe Asp Ser Met Val Asp Phe Asp Thr
290 295 300
Glu Pro Val Thr Leu Glu Asp Leu Glu Gln Thr Asn Gly Leu Ser Asp
305 310 315 320
Ser Ala Ser Cys Lys Ala Ala Ser Leu Gln Pro Ser His Gly Ala Ser
325 330 335
Thr Ser Arg Cys Asp Gly Gln Gly Ile Ala Ala Gly Ser Ala
340 345 350
<210>45
<211>5468
<212>DNA
<213>人
<220>
<221>CDS
<222>(285)..(4967)
<400>45
ggtatcgata agcttgatgg agcggacggc agacggggcg ggcggcgtca gggtcgcagc 60
gtctacagct gctcgggggc ggtttcttgg cggaggcttg gccggctcct ctctcccggc 120
tcagcggcgg ctgcgaaggc ggcggctcct gccctctcgc tttccctctc gcgtctctgg 180
ctgcagaaag aagcttccgg ttctgaggtc ctggaggtgc catttccctc tctgttgaag 240
caaaggccgg ggcagacctc ctagtgaaag gaaagcaagc cagg atg gat att tac 296
Met Asp Ile Tyr
1
gac act caa acc ttg ggg gtt gtg gtc ttt gga gga ttc atg gtt gtt 344
Asp Thr Gln Thr Leu Gly Val Val Val Phe Gly Gly Phe Met Val Val
5 10 15 20
tct gcc att ggc atc ttc ctg gtg tcg act ttc tcc atg aag gaa acg 392
Ser Ala Ile Gly Ile Phe Leu Val Ser Thr Phe Ser Met Lys Glu Thr
25 30 35
tca tat gaa gaa gcc cta gcc aac cag cgc aag gag atg gcg aaa act 440
Ser Tyr Glu Glu Ala Leu Ala Asn Gln Arg Lys Glu Met Ala Lys Thr
40 45 50
cac cac cag aaa gtc gag aag aaa aag aag gag aaa aca gtg gag aag 488
His His Gln Lys Val Glu Lys Lys Lys Lys Glu Lys Thr Val Glu Lys
55 60 65
aaa gga aag acc aag aaa aag gaa gag aaa cct aat ggg aag ata cct 536
Lys Gly Lys Thr Lys Lys Lys Glu Glu Lys Pro Asn Gly Lys Ile Pro
70 75 80
gat cat gat cca gcc ccc aat gtg act gtc ctc ctt cga gaa cca gtg 584
Asp His Asp Pro Ala Pro Asn Val Thr Val Leu Leu Arg Glu Pro Val
85 90 95 100
cgg gct cct gct gtg gct gtg gct cca acc cca gtg cag ccc ccc att 632
Arg Ala Pro Ala Val Ala Val Ala Pro Thr Pro Val Gln Pro Pro Ile
105 110 115
atc gtt gct cct gtc gcc aca gtt cca gcc atg ccc cag gag aag ctg 680
Ile Val Ala Pro Val Ala Thr Val Pro Ala Met Pro Gln Glu Lys Leu
120 125 130
gcc tcc tcc ccc aag gac aaa aag aag aag gag aaa aaa gtg gca aaa 728
Ala Ser Ser Pro Lys Asp Lys Lys Lys Lys Glu Lys Lys Val Ala Lys
135 140 145
gtg gaa cca gct gtc agc tct gta gtg aat tcc atc cag gtt ctc act 776
Val Glu Pro Ala Val Ser Ser Val Val Asn Ser Ile Gln Val Leu Thr
150 155 160
tcg aag gct gcc atc ttg gaa act gct ccc aag gag gtg ccg atg gtg 824
Ser Lys Ala Ala Ile Leu Glu Thr Ala Pro Lys Glu Val Pro Met Val
165 170 175 180
gtg gtg ccc cca gtg ggt gcc aag ggc aac aca cca gcc act ggc act 872
Val Val Pro Pro Val Gly Ala Lys Gly Asn Thr Pro Ala Thr Gly Thr
185 190 195
act cag ggc aaa aag gcg gag ggg act cag aat caa agc aaa aag gct 920
Thr Gln Gly Lys Lys Ala Glu Gly Thr Gln Asn Gln Ser Lys Lys Ala
200 205 210
gaa gga gcc cca aac cag ggc aga aag gca gag gga acc cca aac cag 968
Glu Gly Ala Pro Asn Gln Gly Arg Lys Ala Glu Gly Thr Pro Asn Gln
215 220 225
ggc aaa aag aca gag gga acc cca aac caa ggg aaa aag gca gag gga 1016
Gly Lys Lys Thr Glu Gly Thr Pro Asn Gln Gly Lys Lys Ala Glu Gly
230 235 240
acc cca aac caa ggc aaa aag gca gaa gga acc cca aac caa ggc aaa 1064
Thr Pro Asn Gln Gly Lys Lys Ala Glu Gly Thr Pro Asn Gln Gly Lys
245 250 255 260
aag gcg gag ggg gcc cag aac cag ggt aaa aag gta gat aca acc cca 1112
Lys Ala Glu Gly Ala Gln Asn Gln Gly Lys Lys Val Asp Thr Thr Pro
265 270 275
aac cag ggg aaa aag gtg gag ggg gcc cca acc cag ggc aga aag gcc 1160
Asn Gln Gly Lys Lys Val Glu Gly Ala Pro Thr Gln Gly Arg Lys Ala
280 285 290
gag ggg gct cag aac cag gcc aaa aag gta gaa ggg gcc cag aac cag 1208
Glu Gly Ala Gln Asn Gln Ala Lys Lys Val Glu Gly Ala Gln Asn Gln
295 300 305
ggc aaa aag gca gag ggg gcc cag aat cag ggc aaa aag gga gag ggg 1256
Gly Lys Lys Ala Glu Gly Ala Gln Asn Gln Gly Lys Lys Gly Glu Gly
310 315 320
gcc cag aac cag ggc aag aag gcc gag ggg gcc cag aat cag ggc aag 1304
Ala Gln Asn Gln Gly Lys Lys Ala Glu Gly Ala Gln Asn Gln Gly Lys
325 330 335 340
aag gcc gag ggg gcc cag aat cag ggc aag aag gcc gag ggg gcc cag 1352
Lys Ala Glu Gly Ala Gln Asn Gln Gly Lys Lys Ala Glu Gly Ala Gln
345 350 355
aat cag ggc aag aag gcc gag ggg gcc cag aat cag ggc aag aag gct 1400
Asn Gln Gly Lys Lys Ala Glu Gly Ala Gln Asn Gln Gly Lys Lys Ala
360 365 370
gag ggg gct cag aac cag ggc aaa aag gcc gag ggg gct cag aac cag 1448
Glu Gly Ala Gln Asn Gln Gly Lys Lys Ala Glu Gly Ala Gln Asn Gln
375 380 385
ggc aaa aaa gta gaa ggg gcc cag aac cag ggc aag aag gct gag ggt 1496
Gly Lys Lys Val Glu Gly Ala Gln Asn Gln Gly Lys Lys Ala Glu Gly
390 395 400
gcc cag aac cag ggc aaa aag gcc gag ggg gcc cag aat cag ggc aaa 1544
Ala Gln Asn Gln Gly Lys Lys Ala Glu Gly Ala Gln Asn Gln Gly Lys
405 410 415 420
aag gcc gag ggg gcc cag aac cag ggc aag aag gca gag ggg gcc cag 1592
Lys Ala Glu Gly Ala Gln Asn Gln Gly Lys Lys Ala Glu Gly Ala Gln
425 430 435
aac cag ggc aag aag gcc gag ggg gcc cag aac cag gac aag aag gcc 1640
Asn Gln Gly Lys Lys Ala Glu Gly Ala Gln Asn Gln Asp Lys Lys Ala
440 445 450
gag ggg gcc cag aac cag ggc agg aag gcc gag ggg gcc cag aac cag 1688
Glu Gly Ala Gln Asn Gln Gly Arg Lys Ala Glu Gly Ala Gln Asn Gln
455 460 465
ggc agg aag gcc gag ggg gcc cag aac cag ggc aag aag gcc gag ggg 1736
Gly Arg Lys Ala Glu Gly Ala Gln Asn Gln Gly Lys Lys Ala Glu Gly
470 475 480
gcc ccg aac cag ggc aag aag gcc gag ggg gcc ccg aac cag ggc aag 1784
Ala Pro Asn Gln Gly Lys Lys Ala Glu Gly Ala Pro Asn Gln Gly Lys
485 490 495 500
aag gcc gag ggg acc ccg aac cag ggc aag aag gcc gag ggg acc ccg 1832
Lys Ala Glu Gly Thr Pro Asn Gln Gly Lys Lys Ala Glu Gly Thr Pro
505 510 515
aac cag ggc aag aag gcc gag ggg acc ccg aac cag ggc aag aag gcc 1880
Asn Gln Gly Lys Lys Ala Glu Gly Thr Pro Asn Gln Gly Lys Lys Ala
520 525 530
gag ggg gcc cag aac cag ggc aag aag gcc gag ggg gcc cag aac cag 1928
Glu Gly Ala Gln Asn Gln Gly Lys Lys Ala Glu Gly Ala Gln Asn Gln
535 540 545
ggc aag aag gcc gag ggg acc ccg aac cag ggc aag aag gcc gag ggg 1976
Gly Lys Lys Ala Glu Gly Thr Pro Asn Gln Gly Lys Lys Ala Glu Gly
550 555 560
gcc cag aac cag ggc aag aag gcc gag ggg gcc cag aac cag ggc aag 2024
Ala Gln Asn Gln Gly Lys Lys Ala Glu Gly Ala Gln Asn Gln Gly Lys
565 570 575 580
aag gcc gag ggg gcc cag aac cag ggc aag aag gcc gag ggg gcc cag 2072
Lys Ala Glu Gly Ala Gln Asn Gln Gly Lys Lys Ala Glu Gly Ala Gln
585 590 595
aac cag ggc aag aag gcc gag ggg gcc cag aac cag ggc aag aag gcc 2120
Asn Gln Gly Lys Lys Ala Glu Gly Ala Gln Asn Gln Gly Lys Lys Ala
600 605 610
gag ggt gct cag aac cag ggc aaa aaa gta gaa ggg gcc cag aac cag 2168
Glu Gly Ala Gln Asn Gln Gly Lys Lys Val Glu Gly Ala Gln Asn Gln
615 620 625
ggc aag aag gct gag ggg gcc cag aac cag ggc aag aag gcc gag ggg 2216
Gly Lys Lys Ala Glu Gly Ala Gln Asn Gln Gly Lys Lys Ala Glu Gly
630 635 640
gct cag aac cag ggc aaa aag gcc gag gga gcc cag aac cag ggc caa 2264
Ala Gln Asn Gln Gly Lys Lys Ala Glu Gly Ala Gln Asn Gln Gly Gln
645 650 655 660
aaa gga gag gga gcc cag aat cag ggt aaa aag aca gaa ggg gct cag 2312
Lys Gly Glu Gly Ala Gln Asn Gln Gly Lys Lys Thr Glu Gly Ala Gln
665 670 675
ggc aaa aag gca gaa agg agt ccc aac caa ggc aaa aaa gga gag gga 2360
Gly Lys Lys Ala Glu Arg Ser Pro Asn Gln Gly Lys Lys Gly Glu Gly
680 685 690
gct ccc atc cag ggc aaa aag gca gat tcg gtt gct aat cag ggc aca 2408
Ala Pro Ile Gln Gly Lys Lys Ala Asp Ser Val Ala Asn Gln Gly Thr
695 700 705
aag gta gag ggt att aca aac cag ggg aaa aaa gca gaa ggg tcc ccc 2456
Lys Val Glu Gly Ile Thr Asn Gln Gly Lys Lys Ala Glu Gly Ser Pro
710 715 720
agt gaa ggc aaa aag gca gaa ggg tcc ccc aac caa ggc aaa aag gca 2504
Ser Glu Gly Lys Lys Ala Glu Gly Ser Pro Asn Gln Gly Lys Lys Ala
725 730 735 740
gac gca gct gcc aat cag ggt aaa aag aca gag tca gct tct gtc cag 2552
Asp Ala Ala Ala Asn Gln Gly Lys Lys Thr Glu Ser Ala Ser Val Gln
745 750 755
ggc aga aat aca gat gtg gcc cag agc cca gag gca cca aag caa gag 2600
Gly Arg Asn Thr Asp Val Ala Gln Ser Pro Glu Ala Pro Lys Gln Glu
760 765 770
gct cct gcc aag aag aag tct ggt tca aag aaa aaa ggt gag cct ggg 2648
Ala Pro Ala Lys Lys Lys Ser Gly Ser Lys Lys Lys Gly Glu Pro Gly
775 780 785
ccc cca gat gcc gac ggc cct ctc tac ctc ccc tac aag acg ctg gtc 2696
Pro Pro Asp Ala Asp Gly Pro Leu Tyr Leu Pro Tyr Lys Thr Leu Val
790 795 800
tcc acg gtt ggg agc atg gtg ttc aac gag ggc gag gcc cag cgg ctc 2744
Ser Thr Val Gly Ser Met Val Phe Asn Glu Gly Glu Ala Gln Arg Leu
805 810 815 820
atc gag atc ctg tct gag aag gct ggc atc att cag gac acc tgg cac 2792
Ile Glu Ile Leu Ser Glu Lys Ala Gly Ile Ile Gln Asp Thr Trp His
825 830 835
aag gcc act cag aag ggt gac cct gtg gcg att ctg aaa cgc cag ctg 2840
Lys Ala Thr Gln Lys Gly Asp Pro Val Ala Ile Leu Lys Arg Gln Leu
840 845 850
gaa gag aag gaa aaa ctg ctg gcc aca gaa cag gaa gat gcg gct gtc 2888
Glu Glu Lys Glu Lys Leu Leu Ala Thr Glu Gln Glu Asp Ala Ala Val
855 860 865
gcc aag agc aaa ctg agg gag ctc aac aag gag atg gca gca gaa aag 2936
Ala Lys Ser Lys Leu Arg Glu Leu Asn Lys Glu Met Ala Ala Glu Lys
870 875 880
gcc aaa gca gca gcc ggg gag gcc aaa gtg aaa aag cag ctg gtg gcc 2984
Ala Lys Ala Ala Ala Gly Glu Ala Lys Val Lys Lys Gln Leu Val Ala
885 890 895 900
cgg gag cag gag atc acg gct gtg cag gca cgc atg cag gcc agc tac 3032
Arg Glu Gln Glu Ile Thr Ala Val Gln Ala Arg Met Gln Ala Ser Tyr
905 910 915
cgg gag cac gtg aag gag gtg cag cag ctg cag ggc aag atc cgg act 3080
Arg Glu His Val Lys Glu Val Gln Gln Leu Gln Gly Lys Ile Arg Thr
920 925 930
ctt cag gag cag ctg gag aat ggc ccc aac acg cag ctg gcc cgc ctg 3128
Leu Gln Glu Gln Leu Glu Asn Gly Pro Asn Thr Gln Leu Ala Arg Leu
935 940 945
cag cag gag aac tcc atc ctg cgg gat gcc ttg aac cag gcc acg agc 3176
Gln Gln Glu Asn Ser Ile Leu Arg Asp Ala Leu Asn Gln Ala Thr Ser
950 955 960
cag gtg gag agc aag cag aac gca gag ctg gcc aag ctt cgg cag gag 3224
Gln Val Glu Ser Lys Gln Asn Ala Glu Leu Ala Lys Leu Arg Gln Glu
965 970 975 980
ctc agc aag gtc agc aaa gag ctg gtg gag aag tca gag gct gtg cgg 3272
Leu Ser Lys Val Ser Lys Glu Leu Val Glu Lys Ser Glu Ala Val Arg
985 990 995
caa gat gag cag cag cgg aaa gct ctg gaa gcc aag gca gct gcc ttc 3320
Gln Asp Glu Gln Gln Arg Lys Ala Leu Glu Ala Lys Ala Ala Ala Phe
1000 1005 1010
gag aag cag gtc ctg cag ctg cag gcg tcc cac agg gag agt gag gag 3368
Glu Lys Gln Val Leu Gln Leu Gln Ala Ser His Arg Glu Ser Glu Glu
1015 1020 1025
gcc ctg cag aag cgc ctg gac gag gtc agc cgg gag ctg tgc cac acg 3416
Ala Leu Gln Lys Arg Leu Asp Glu Val Ser Arg Glu Leu Cys His Thr
1030 1035 1040
cag agc agc cac gcc agc ctc cgg gcg gat gcc gag aag gcc cag gag 3464
Gln Ser Ser His Ala Ser Leu Arg Ala Asp Ala Glu Lys Ala Gln Glu
1045 1050 1055 1060
caa cag cag cag atg gcc gag ctg cac agc aag tta cag tcc tcc gag 3512
Gln Gln Gln Gln Met Ala Glu Leu His Ser Lys Leu Gln Ser Ser Glu
1065 1070 1075
gcg gag gtg cgc agc aaa tgc gag gag ctg agt ggc ctc cac ggg cag 3560
Ala Glu Val Arg Ser Lys Cys Glu Glu Leu Ser Gly Leu His Gly Gln
1080 1085 1090
ctc cag gag gcc agg gcg gag aac tcc cag ctc aca gag aga atc cgt 3608
Leu Gln Glu Ala Arg Ala Glu Asn Ser Gln Leu Thr Glu Arg Ile Arg
1095 1100 1105
tcc att gag gcc ctg ctg gag gcg ggc cag gcg cgg gat gcc cag gac 3656
Ser Ile Glu Ala Leu Leu Glu Ala Gly Gln Ala Arg Asp Ala Gln Asp
1110 1115 1120
gtc cag gcc agc cag gcg gag gct gac cag cag cag act cgc ctc aag 3704
Val Gln Ala Ser Gln Ala Glu Ala Asp Gln Gln Gln Thr Arg Leu Lys
1125 1130 1135 1140
gag ctg gag tcc cag gtg tcg ggt ctg gag aag gag gcc atc gag ctc 3752
Glu Leu Glu Ser Gln Val Ser Gly Leu Glu Lys Glu Ala Ile Glu Leu
1145 1150 1155
agg gag gcc gtc gag cag cag aaa gtg aag aac aat gac ctc cgg gag 3800
Arg Glu Ala Val Glu Gln Gln Lys Val Lys Asn Asn Asp Leu Arg Glu
1160 1165 1170
aag aac tgg aag gcc atg gag gca ctg gcc acg gcc gag cag gcc tgc 3848
Lys Asn Trp Lys Ala Met Glu Ala Leu Ala Thr Ala Glu Gln Ala Cys
1175 1180 1185
aag gag aag ctg cac tcc ctg acc cag gcc aag gag gaa tcg gag aag 3896
Lys Glu Lys Leu His Ser Leu Thr Gln Ala Lys Glu Glu Ser Glu Lys
1190 1195 1200
cag ctc tgt ctg att gag gcg cag acc atg gag gcc ctg ctg gct ctg 3944
Gln Leu Cys Leu Ile Glu Ala Gln Thr Met Glu Ala Leu Leu Ala Leu
1205 1210 1215 1220
ctc cca gaa ctc tct gtc ttg gca caa cag aat tac acc gag tgg ctg 3992
Leu Pro Glu Leu Ser Val Leu Ala Gln Gln Asn Tyr Thr Glu Trp Leu
1225 1230 1235
cag gat ctc aaa gag aaa ggc ccc acg ctg ctg aag cac ccg cca gct 4040
Gln Asp Leu Lys Glu Lys Gly Pro Thr Leu Leu Lys His Pro Pro Ala
1240 1245 1250
ccc gcg gag ccc tcc tcg gac ctg gcc tcc aag ttg agg gag gcc gag 4088
Pro Ala Glu Pro Ser Ser Asp Leu Ala Ser Lys Leu Arg Glu Ala Glu
1255 1260 1265
gag acg cag agc aca ctg cag gcc gag tgt gac cag tac cgc agc atc 4136
Glu Thr Gln Ser Thr Leu Gln Ala Glu Cys Asp Gln Tyr Arg Ser Ile
1270 1275 1280
ctg gcg gag acg gag ggc atg ctc aga gac ctg cag aag agc gtg gag 4184
Leu Ala Glu Thr Glu Gly Met Leu Arg Asp Leu Gln Lys Ser Val Glu
1285 1290 1295 1300
gag gag gag cag gtg tgg agg gcc aag gtg ggc gcc gca gag gag gag 4232
Glu Glu Glu Gln Val Trp Arg Ala Lys Val Gly Ala Ala Glu Glu Glu
1305 1310 1315
ctc cag aag tcc cgg gtc aca gtg aag cat ctc gaa gag att gta gag 4280
Leu Gln Lys Ser Arg Val Thr Val Lys His Leu Glu Glu Ile Val Glu
1320 1325 1330
aag cta aaa gga gaa ctt gaa agt tcg gac cag gtg agg gag cac acg 4328
Lys Leu Lys Gly Glu Leu Glu Ser Ser Asp Gln Val Arg Glu His Thr
1335 1340 1345
ttg cat ttg gag gca gag ctg gaa aag cac atg gcg gcc gcc agc gcc 4376
Leu His Leu Glu Ala Glu Leu Glu Lys His Met Ala Ala Ala Ser Ala
1350 1355 1360
gag tgc cag aac tac gcc aag gag gtg gca ggg ctg agg caa ctt ctc 4424
Glu Cys Gln Asn Tyr Ala Lys Glu Val Ala Gly Leu Arg Gln Leu Leu
1365 1370 1375 1380
cta gaa tct caa tct cag ctc gat gcc gcc aag agc gaa gcc cag aaa 4472
Leu Glu Ser Gln Ser Gln Leu Asp Ala Ala Lys Ser Glu Ala Gln Lys
1385 1390 1395
cag agc gat gag ctt gcc ctg gtc agg cag cag ttg agt gaa atg aag 4520
Gln Ser Asp Glu Leu Ala Leu Val Arg Gln Gln Leu Ser Glu Met Lys
1400 1405 1410
agc cac gta gag gat ggt gac ata gct ggg gcc cca gct tcc tcc cca 4568
Ser His Val Glu Asp Gly Asp Ile Ala Gly Ala Pro Ala Ser Ser Pro
1415 1420 1425
gag gcg ccc cca gcc gag cag gac ccc gtt cag ctg aag acg cag ctg 4616
Glu Ala Pro Pro Ala Glu Gln Asp Pro Val Gln Leu Lys Thr Gln Leu
1430 1435 1440
gag tgg aca gaa gcc atc ctg gag gat gag cag aca cag cgg cag aag 4664
Glu Trp Thr Glu Ala Ile Leu Glu Asp Glu Gln Thr Gln Arg Gln Lys
1445 1450 1455 1460
ctc acg gcc gag ttt gag gag gct cag acc tcg gca tgt cgg tta caa 4712
Leu Thr Ala Glu Phe Glu Glu Ala Gln Thr Ser Ala Cys Arg Leu Gln
1465 1470 1475
gaa gaa ttg gag aag ctc cgc aca gcc ggc ccc cta gag tct tca gaa 4760
Glu Glu Leu Glu Lys Leu Arg Thr Ala Gly Pro Leu Glu Ser Ser Glu
1480 1485 1490
aca gag gag gcc tca cag ctg aag gag aga cta gaa aaa gag aag aag 4808
Thr Glu Glu Ala Ser Gln Leu Lys Glu Arg Leu Glu Lys Glu Lys Lys
1495 1500 1505
tta aca agt gac ctg ggg cgc gcc gcc acg aga ctg cag gag ctt ctg 4856
Leu Thr Ser Asp Leu Gly Arg Ala Ala Thr Arg Leu Gln Glu Leu Leu
1510 1515 1520
aag acg acc cag gag cag ctg gca agg gag aag gac acg gtg aag aag 4904
Lys Thr Thr Gln Glu Gln Leu Ala Arg Glu Lys Asp Thr Val Lys Lys
1525 1530 1535 1540
ctg cag gaa cag ctg gaa aag gca gag gac ggc agc agc tca aag gag 4952
Leu Gln Glu Gln Leu Glu Lys Ala Glu Asp Gly Ser Ser Ser Lys Glu
1545 1550 1555
ggc acc tct gtc tga gtttcctctt tggaaaaaga agttactgtt caacttacca 5007
Gly Thr Ser Val
1560
aaatgcctta cacattcctt acaaataaac caaccaacct acacagcgtt atccaggccc 5067
aacttccggt actccgagag aagccatgag agacaagtct cttagagcca cagaagtaga 5127
ccttccagag ccccagtttg taaatgaacc tgtgtcacat ttgataaaca ctatcctggg 5187
cgcagccccg ggccaccgcc gagtgacgcc aaagccctgg ttgactctga cagccccgtg 5247
ggtgtgtggg aggccgggcg ctctggggtc tgtctgtcag tgcaatcgtt tagtgttttt 5307
tcagtggggc ggggcgggaa gcgggtggga ccgggcagcc agttctcaaa ggctgtgggg 5367
ccgactggag gccacagccc ctcaccccta gacgttgcca accagaactg acgtgtgacc 5427
tcctgggtgt tgatgccatt aaaaccaacg ttggtgcccg g 5468
<210>46
<211>1560
<212>PRT
<213>人
<400>46
Met Asp Ile Tyr Asp Thr Gln Thr Leu Gly Val Val Val Phe Gly Gly
1 5 10 15
Phe Met Val Val Ser Ala Ile Gly Ile Phe Leu Val Ser Thr Phe Ser
20 25 30
Met Lys Glu Thr Ser Tyr Glu Glu Ala Leu Ala Asn Gln Arg Lys Glu
35 40 45
Met Ala Lys Thr His His Gln Lys Val Glu Lys Lys Lys Lys Glu Lys
50 55 60
Thr Val Glu Lys Lys Gly Lys Thr Lys Lys Lys Glu Glu Lys Pro Asn
65 70 75 80
Gly Lys Ile Pro Asp His Asp Pro Ala Pro Asn Val Thr Val Leu Leu
85 90 95
Arg Glu Pro Val Arg Ala Pro Ala Val Ala Val Ala Pro Thr Pro Val
100 105 110
Gln Pro Pro Ile Ile Val Ala Pro Val Ala Thr Val Pro Ala Met Pro
115 120 125
Gln Glu Lys Leu Ala Ser Ser Pro Lys Asp Lys Lys Lys Lys Glu Lys
130 135 140
Lys Val Ala Lys Val Glu Pro Ala Val Ser Ser Val Val Asn Ser Ile
145 150 155 160
Gln Val Leu Thr Ser Lys Ala Ala Ile Leu Glu Thr Ala Pro Lys Glu
165 170 175
Val Pro Met Val Val Val Pro Pro Val Gly Ala Lys Gly Asn Thr Pro
180 185 190
Ala Thr Gly Thr Thr Gln Gly Lys Lys Ala Glu Gly Thr Gln Asn Gln
195 200 205
Ser Lys Lys Ala Glu Gly Ala Pro Asn Gln Gly Arg Lys Ala Glu Gly
210 215 220
Thr Pro Asn Gln Gly Lys Lys Thr Glu Gly Thr Pro Asn Gln Gly Lys
225 230 235 240
Lys Ala Glu Gly Thr Pro Asn Gln Gly Lys Lys Ala Glu Gly Thr Pro
245 250 255
Asn Gln Gly Lys Lys Ala Glu Gly Ala Gln Asn Gln Gly Lys Lys Val
260 265 270
Asp Thr Thr Pro Asn Gln Gly Lys Lys Val Glu Gly Ala Pro Thr Gln
275 280 285
Gly Arg Lys Ala Glu Gly Ala Gln Asn Gln Ala Lys Lys Val Glu Gly
290 295 300
Ala Gln Asn Gln Gly Lys Lys Ala Glu Gly Ala Gln Asn Gln Gly Lys
305 310 315 320
Lys Gly Glu Gly Ala Gln Asn Gln Gly Lys Lys Ala Glu Gly Ala Gln
325 330 335
Asn Gln Gly Lys Lys Ala Glu Gly Ala Gln Asn Gln Gly Lys Lys Ala
340 345 350
Glu Gly Ala Gln Asn Gln Gly Lys Lys Ala Glu Gly Ala Gln Asn Gln
355 360 365
Gly Lys Lys Ala Glu Gly Ala Gln Asn Gln Gly Lys Lys Ala Glu Gly
370 375 380
Ala Gln Asn Gln Gly Lys Lys Val Glu Gly Ala Gln Asn Gln Gly Lys
385 390 395 400
Lys Ala Glu Gly Ala Gln Asn Gln Gly Lys Lys Ala Glu Gly Ala Gln
405 410 415
Asn Gln Gly Lys Lys Ala Glu Gly Ala Gln Asn Gln Gly Lys Lys Ala
420 425 430
Glu Gly Ala Gln Asn Gln Gly Lys Lys Ala Glu Gly Ala Gln Asn Gln
435 440 445
Asp Lys Lys Ala Glu Gly Ala Gln Asn Gln Gly Arg Lys Ala Glu Gly
450 455 460
Ala Gln Asn Gln Gly Arg Lys Ala Glu Gly Ala Gln Asn Gln Gly Lys
465 470 475 480
Lys Ala Glu Gly Ala Pro Asn Gln Gly Lys Lys Ala Glu Gly Ala Pro
485 490 495
Asn Gln Gly Lys Lys Ala Glu Gly Thr Pro Asn Gln Gly Lys Lys Ala
500 505 510
Glu Gly Thr Pro Asn Gln Gly Lys Lys Ala Glu Gly Thr Pro Asn Gln
515 520 525
Gly Lys Lys Ala Glu Gly Ala Gln Asn Gln Gly Lys Lys Ala Glu Gly
530 535 540
Ala Gln Asn Gln Gly Lys Lys Ala Glu Gly Thr Pro Asn Gln Gly Lys
545 550 555 560
Lys Ala Glu Gly Ala Gln Asn Gln Gly Lys Lys Ala Glu Gly Ala Gln
565 570 575
Asn Gln Gly Lys Lys Ala Glu Gly Ala Gln Asn Gln Gly Lys Lys Ala
580 585 590
Glu Gly Ala Gln Asn Gln Gly Lys Lys Ala Glu Gly Ala Gln Asn Gln
595 600 605
Gly Lys Lys Ala Glu Gly Ala Gln Asn Gln Gly Lys Lys Val Glu Gly
610 615 620
Ala Gln Asn Gln Gly Lys Lys Ala Glu Gly Ala Gln Asn Gln Gly Lys
625 630 635 640
Lys Ala Glu Gly Ala Gln Asn Gln Gly Lys Lys Ala Glu Gly Ala Gln
645 650 655
Asn Gln Gly Gln Lys Gly Glu Gly Ala Gln Asn Gln Gly Lys Lys Thr
660 665 670
Glu Gly Ala Gln Gly Lys Lys Ala Glu Arg Ser Pro Asn Gln Gly Lys
675 680 685
Lys Gly Glu Gly Ala Pro Ile Gln Gly Lys Lys Ala Asp Ser Val Ala
690 695 700
Asn Gln Gly Thr Lys Val Glu Gly Ile Thr Asn Gln Gly Lys Lys Ala
705 710 715 720
Glu Gly Ser Pro Ser Glu Gly Lys Lys Ala Glu Gly Ser Pro Asn Gln
725 730 735
Gly Lys Lys Ala Asp Ala Ala Ala Asn Gln Gly Lys Lys Thr Glu Ser
740 745 750
Ala Ser Val Gln Gly Arg Asn Thr Asp Val Ala Gln Ser Pro Glu Ala
755 760 765
Pro Lys Gln Glu Ala Pro Ala Lys Lys Lys Ser Gly Ser Lys Lys Lys
770 775 780
Gly Glu Pro Gly Pro Pro Asp Ala Asp Gly Pro Leu Tyr Leu Pro Tyr
785 790 795 800
Lys Thr Leu Val Ser Thr Val Gly Ser Met Val Phe Asn Glu Gly Glu
805 810 815
Ala Gln Arg Leu Ile Glu Ile Leu Ser Glu Lys Ala Gly Ile Ile Gln
820 825 830
Asp Thr Trp His Lys Ala Thr Gln Lys Gly Asp Pro Val Ala Ile Leu
835 840 845
Lys Arg Gln Leu Glu Glu Lys Glu Lys Leu Leu Ala Thr Glu Gln Glu
850 855 860
Asp Ala Ala Val Ala Lys Ser Lys Leu Arg Glu Leu Asn Lys Glu Met
865 870 875 880
Ala Ala Glu Lys Ala Lys Ala Ala Ala Gly Glu Ala Lys Val Lys Lys
885 890 895
Gln Leu Val Ala Arg Glu Gln Glu Ile Thr Ala Val Gln Ala Arg Met
900 905 910
Gln Ala Ser Tyr Arg Glu His Val Lys Glu Val Gln Gln Leu Gln Gly
915 920 925
Lys Ile Arg Thr Leu Gln Glu Gln Leu Glu Asn Gly Pro Asn Thr Gln
930 935 940
Leu Ala Arg Leu Gln Gln Glu Asn Ser Ile Leu Arg Asp Ala Leu Asn
945 950 955 960
Gln Ala Thr Ser Gln Val Glu Ser Lys Gln Asn Ala Glu Leu Ala Lys
965 970 975
Leu Arg Gln Glu Leu Ser Lys Val Ser Lys Glu Leu Val Glu Lys Ser
980 985 990
Glu Ala Val Arg Gln Asp Glu Gln Gln Arg Lys Ala Leu Glu Ala Lys
995 1000 1005
Ala Ala Ala Phe Glu Lys Gln Val Leu Gln Leu Gln Ala Ser His Arg
1010 1015 1020
Glu Ser Glu Glu Ala Leu Gln Lys Arg Leu Asp Glu Val Ser Arg Glu
1025 1030 1035 1040
Leu Cys His Thr Gln Ser Ser His Ala Ser Leu Arg Ala Asp Ala Glu
1045 1050 1055
Lys Ala Gln Glu Gln Gln Gln Gln Met Ala Glu Leu His Ser Lys Leu
1060 1065 1070
Gln Ser Ser Glu Ala Glu Val Arg Ser Lys Cys Glu Glu Leu Ser Gly
1075 1080 1085
Leu His Gly Gln Leu Gln Glu Ala Arg Ala Glu Asn Ser Gln Leu Thr
1090 1095 1100
Glu Arg Ile Arg Ser Ile Glu Ala Leu Leu Glu Ala Gly Gln Ala Arg
1105 1110 1115 1120
Asp Ala Gln Asp Val Gln Ala Ser Gln Ala Glu Ala Asp Gln Gln Gln
1125 1130 1135
Thr Arg Leu Lys Glu Leu Glu Ser Gln Val Ser Gly Leu Glu Lys Glu
1140 1145 1150
Ala Ile Glu Leu Arg Glu Ala Val Glu Gln Gln Lys Val Lys Asn Asn
1155 1160 1165
Asp Leu Arg Glu Lys Asn Trp Lys Ala Met Glu Ala Leu Ala Thr Ala
1170 1175 1180
Glu Gln Ala Cys Lys Glu Lys Leu His Ser Leu Thr Gln Ala Lys Glu
1185 1190 1195 1200
Glu Ser Glu Lys Gln Leu Cys Leu Ile Glu Ala Gln Thr Met Glu Ala
1205 1210 1215
Leu Leu Ala Leu Leu Pro Glu Leu Ser Val Leu Ala Gln Gln Asn Tyr
1220 1225 1230
Thr Glu Trp Leu Gln Asp Leu Lys Glu Lys Gly Pro Thr Leu Leu Lys
1235 1240 1245
His Pro Pro Ala Pro Ala Glu Pro Ser Ser Asp Leu Ala Ser Lys Leu
1250 1255 1260
Arg Glu Ala Glu Glu Thr Gln Ser Thr Leu Gln Ala Glu Cys Asp Gln
1265 1270 1275 1280
Tyr Arg Ser Ile Leu Ala Glu Thr Glu Gly Met Leu Arg Asp Leu Gln
1285 1290 1295
Lys Ser Val Glu Glu Glu Glu Gln Val Trp Arg Ala Lys Val Gly Ala
1300 1305 1310
Ala Glu Glu Glu Leu Gln Lys Ser Arg Val Thr Val Lys His Leu Glu
1315 1320 1325
Glu Ile Val Glu Lys Leu Lys Gly Glu Leu Glu Ser Ser Asp Gln Val
1330 1335 1340
Arg Glu His Thr Leu His Leu Glu Ala Glu Leu Glu Lys His Met Ala
1345 1350 1355 1360
Ala Ala Ser Ala Glu Cys Gln Asn Tyr Ala Lys Glu Val Ala Gly Leu
1365 1370 1375
Arg Gln Leu Leu Leu Glu Ser Gln Ser Gln Leu Asp Ala Ala Lys Ser
1380 1385 1390
Glu Ala Gln Lys Gln Ser Asp Glu Leu Ala Leu Val Arg Gln Gln Leu
1395 1400 1405
Ser Glu Met Lys Ser His Val Glu Asp Gly Asp Ile Ala Gly Ala Pro
1410 1415 1420
Ala Ser Ser Pro Glu Ala Pro Pro Ala Glu Gln Asp Pro Val Gln Leu
1425 1430 1435 1440
Lys Thr Gln Leu Glu Trp Thr Glu Ala Ile Leu Glu Asp Glu Gln Thr
1445 1450 1455
Gln Arg Gln Lys Leu Thr Ala Glu Phe Glu Glu Ala Gln Thr Ser Ala
1460 1465 1470
Cys Arg Leu Gln Glu Glu Leu Glu Lys Leu Arg Thr Ala Gly Pro Leu
1475 1480 1485
Glu Ser Ser Glu Thr Glu Glu Ala Ser Gln Leu Lys Glu Arg Leu Glu
1490 1495 1500
Lys Glu Lys Lys Leu Thr Ser Asp Leu Gly Arg Ala Ala Thr Arg Leu
1505 1510 1515 1520
Gln Glu Leu Leu Lys Thr Thr Gln Glu Gln Leu Ala Arg Glu Lys Asp
1525 1530 1535
Thr Val Lys Lys Leu Gln Glu Gln Leu Glu Lys Ala Glu Asp Gly Ser
1540 1545 1550
Ser Ser Lys Glu Gly Thr Ser Val
1555 1560
<210>47
<211>5425
<212>DNA
<213>家犬
<220>
<221>CDS
<222>(244)..(4848)
<400>47
gaggcagaaa gtgccacgac tccacacgcg cgcacgcagc cagcgagcgg ccggagcgga 60
cggcggacgg ggcggacggc ggtggggtcg cggcgcctgc agctgctcgg ggcggcttct 120
cggcggaggc tcggccggct cctctctccc ggctccgcgg cggcggcggc ggcggcggcg 180
gctcctgccc tttcgctctc cctcccgcgt ctccggctgc aggtaaaggg aaagcaagcc 240
agg atg gat att tac gac act cag acc ttg ggg gtt atg gta ttc ggt 288
Met Asp Ile Tyr Asp Thr Gln Thr Leu Gly Val Met Val Phe Gly
1 5 10 15
gga ttc atg gtc gtt tct gcc atc ggc atc ttc ctg gtg tca acc ttt 336
Gly Phe Met Val Val Ser Ala Ile Gly Ile Phe Leu Val Ser Thr Phe
20 25 30
tcc atg aag gag acg tca tat gaa gaa gcc cta gcc aac cag cgc aag 384
Ser Met Lys Glu Thr Ser Tyr Glu Glu Ala Leu Ala Asn Gln Arg Lys
35 40 45
gag atg gca aaa act cac cac cag aaa gta gag aag aaa aag aag gag 432
Glu Met Ala Lys Thr His His Gln Lys Val Glu Lys Lys Lys Lys Glu
50 55 60
aaa aca gtg gag aag aaa gga aaa acc aag aaa aag gaa gag aaa cct 480
Lys Thr Val Glu Lys Lys Gly Lys Thr Lys Lys Lys Glu Glu Lys Pro
65 70 75
aac ggg aag ata cct gac cat gag cca gcc ccc aat gtg acc atc ctt 528
Asn Gly Lys Ile Pro Asp His Glu Pro Ala Pro Asn Val Thr Ile Leu
80 85 90 95
ctc aaa gac cca gtg agg gca ccc gca gtg ccc gtg gct cca act ccg 576
Leu Lys Asp Pro Val Arg Ala Pro Ala Val Pro Val Ala Pro Thr Pro
100 105 110
gtc cag cct cct gtg gtc att gcc cct gta gcc aca gta cca gcc atg 624
Val Gln Pro Pro Val Val Ile Ala Pro Val Ala Thr Val Pro Ala Met
115 120 125
ccc caa gag aag ttg gcc cct tct cct aag gac aaa aag aaa aag gag 672
Pro Gln Glu Lys Leu Ala Pro Ser Pro Lys Asp Lys Lys Lys Lys Glu
130 135 140
aaa aaa gtg gca aag gtg gaa cca gca gtc agt tct gta gtg aat tcc 720
Lys Lys Val Ala Lys Val Glu Pro Ala Val Ser Ser Val Val Asn Ser
145 150 155
gtc caa gtt ctt gcc tcc aag gct gcc atc tta gaa act gct ccc aag 768
Val Gln Val Leu Ala Ser Lys Ala Ala Ile Leu Glu Thr Ala Pro Lys
160 165 170 175
gag gtg cct atg gtg gtt gtg ccc cca gtg ggt gcc aag gcc ggt acc 816
Glu Val Pro Met Val Val Val Pro Pro Val Gly Ala Lys Ala Gly Thr
180 185 190
cca gcc acc agc act gca cag ggc aaa aag gca gag gga gcc cag aac 864
Pro Ala Thr Ser Thr Ala Gln Gly Lys Lys Ala Glu Gly Ala Gln Asn
195 200 205
cag agc aga aag gca gag gga gcc ccc aac cag ggc aaa aag gca gag 912
Gln Ser Arg Lys Ala Glu Gly Ala Pro Asn Gln Gly Lys Lys Ala Glu
210 215 220
ggg gcc ctc aac caa ggc aaa aag gca gag ggg gcc cag aat cag ggc 960
Gly Ala Leu Asn Gln Gly Lys Lys Ala Glu Gly Ala Gln Asn Gln Gly
225 230 235
aaa aag gta gaa gtg gcc cca aac caa ggc aaa aag gca gag ggg ggc 1008
Lys Lys Val Glu Val Ala Pro Asn Gln Gly Lys Lys Ala Glu Gly Gly
240 245 250 255
cag aat cag ggc aaa aag gta gaa ggg gcc cag aat cag ggc aaa aag 1056
Gln Asn Gln Gly Lys Lys Val Glu Gly Ala Gln Asn Gln Gly Lys Lys
260 265 270
gca gaa gga acc cca aac cag ggc aaa aag gca gaa ggg gcc ccc aac 1104
Ala Glu Gly Thr Pro Asn Gln Gly Lys Lys Ala Glu Gly Ala Pro Asn
275 280 285
caa ggc aaa aag aca gat ggg gct ccc aac cag ggc aaa aag tca gaa 1152
Gln Gly Lys Lys Thr Asp Gly Ala Pro Asn Gln Gly Lys Lys Ser Glu
290 295 300
gga gct cca aac cag ggc aaa aag gca gag ggg gcc cag aat cag ggc 1200
Gly Ala Pro Asn Gln Gly Lys Lys Ala Glu Gly Ala Gln Asn Gln Gly
305 310 315
aaa aag gta gaa gtg gcc cca aac caa ggc aaa aag gca gag ggg ggc 1248
Lys Lys Val Glu Val Ala Pro Asn Gln Gly Lys Lys Ala Glu Gly Gly
320 325 330 335
cag aat cag ggc aaa aag gta gaa ggg gcc cag aat cag ggc aaa aag 1296
Gln Asn Gln Gly Lys Lys Val Glu Gly Ala Gln Asn Gln Gly Lys Lys
340 345 350
gca gaa gga acc cca aac cag ggc aaa aag gca gaa ggg gcc ccc aac 1344
Ala Glu Gly Thr Pro Asn Gln Gly Lys Lys Ala Glu Gly Ala Pro Asn
355 360 365
caa ggc aaa aag aca gat ggg gct ccc aac cag ggc aaa aag tca gaa 1392
Gln Gly Lys Lys Thr Asp Gly Ala Pro Asn Gln Gly Lys Lys Ser Glu
370 375 380
gga gct cca aac cag ggc aaa aaa gta gag ggg gcc cag aat caa ggc 1440
Gly Ala Pro Asn Gln Gly Lys Lys Val Glu Gly Ala Gln Asn Gln Gly
385 390 395
aaa aag gta gag ggg gtg cag aat cag ggc aaa aaa gcc gaa gga gca 1488
Lys Lys Val Glu Gly Val Gln Asn Gln Gly Lys Lys Ala Glu Gly Ala
400 405 410 415
cag aat cag ggc aaa aag gca gaa ggg acc tcc agc cag ggt aga aaa 1536
Gln Asn Gln Gly Lys Lys Ala Glu Gly Thr Ser Ser Gln Gly Arg Lys
420 425 430
gag gag ggg acc cca aac ctg ggc aaa aag gca gag ggg agc ccc aat 1584
Glu Glu Gly Thr Pro Asn Leu Gly Lys Lys Ala Glu Gly Ser Pro Asn
435 440 445
cag ggc aaa aag gtg gaa gtg gtt cag aac cag agc aaa aag gta gag 1632
Gln Gly Lys Lys Val Glu Val Val Gln Asn Gln Ser Lys Lys Val Glu
450 455 460
gga gcc ccc aac cag ggc aaa aaa gca gag ggg tct cag aac cag ggc 1680
Gly Ala Pro Asn Gln Gly Lys Lys Ala Glu Gly Ser Gln Asn Gln Gly
465 470 475
aaa aag aca gaa ggg gcc tcc aac caa ggc aaa aag gtg gat ggg gct 1728
Lys Lys Thr Glu Gly Ala Ser Asn Gln Gly Lys Lys Val Asp Gly Ala
480 485 490 495
cag aac cag ggc aaa aag gca gag gga gcc ccc aac cag ggt aaa aag 1776
Gln Asn Gln Gly Lys Lys Ala Glu Gly Ala Pro Asn Gln Gly Lys Lys
500 505 510
gta gag ggg gct cag aac cag ggc aaa aag gca gag ggg acc ccc aac 1824
Val Glu Gly Ala Gln Asn Gln Gly Lys Lys Ala Glu Gly Thr Pro Asn
515 520 525
cag ggt aaa aag gca gag ggg gct cag aac cag ggc aaa aag gca gag 1872
Gln Gly Lys Lys Ala Glu Gly Ala Gln Asn Gln Gly Lys Lys Ala Glu
530 535 540
ggg gct ccc aac cag ggc aaa aag gca gag ggg gct ccc aac cag ggc 1920
Gly Ala Pro Asn Gln Gly Lys Lys Ala Glu Gly Ala Pro Asn Gln Gly
545 550 555
aaa aag gca gag ggg gct ccc aac cag ggc aaa aag gca gag ggg gct 1968
Lys Lys Ala Glu Gly Ala Pro Asn Gln Gly Lys Lys Ala Glu Gly Ala
560 565 570 575
ccc aac cag ggc aaa aag gca gag gcg gct ccc aac cag ggc aaa aag 2016
Pro Asn Gln Gly Lys Lys Ala Glu Ala Ala Pro Asn Gln Gly Lys Lys
580 585 590
gca gag ggg gct ccc aac cag ggc aaa aag gca gag ggg gct ccc aac 2064
Ala Glu Gly Ala Pro Asn Gln Gly Lys Lys Ala Glu Gly Ala Pro Asn
595 600 605
cag ggc aaa aag gca gag gcg gct ccc aac cag ggc aaa aag gca gag 2112
Gln Gly Lys Lys Ala Glu Ala Ala Pro Asn Gln Gly Lys Lys Ala Glu
610 615 620
ggg gct ccc aac cag ggc aaa aag gca gag ggg gct ccc aac cag ggc 2160
Gly Ala Pro Asn Gln Gly Lys Lys Ala Glu Gly Ala Pro Asn Gln Gly
625 630 635
aaa aag gca gag ggg gct ccc aac cag ggc aaa aag gca gag ggg gcc 2208
Lys Lys Ala Glu Gly Ala Pro Asn Gln Gly Lys Lys Ala Glu Gly Ala
640 645 650 655
cag aat cag ggc aaa aag gca gag ggg gct ccc aac cag ggt aaa aag 2256
Gln Asn Gln Gly Lys Lys Ala Glu Gly Ala Pro Asn Gln Gly Lys Lys
660 665 670
gca gat ttg gtt gct aat caa ggc aca aag gca gag ggt gtt gca ggc 2304
Ala Asp Leu Val Ala Asn Gln Gly Thr Lys Ala Glu Gly Val Ala Gly
675 680 685
cag ggg aaa aaa gca gag ggg gcc ccc aat caa ggc aaa aag gga gaa 2352
Gln Gly Lys Lys Ala Glu Gly Ala Pro Asn Gln Gly Lys Lys Gly Glu
690 695 700
gga acc cca aac cag ggc aaa aag tca gaa gga tct ccc aac cag ggc 2400
Gly Thr Pro Asn Gln Gly Lys Lys Ser Glu Gly Ser Pro Asn Gln Gly
705 710 715
aaa aag gtg gat gcg tct gcc aat cag agt aaa agg gca gag tca gct 2448
Lys Lys Val Asp Ala Ser Ala Asn Gln Ser Lys Arg Ala Glu Ser Ala
720 725 730 735
cct atc caa ggc aaa aat gca gat atg gtc cag agc caa gag gca cca 2496
Pro Ile Gln Gly Lys Asn Ala Asp Met Val Gln Ser Gln Glu Ala Pro
740 745 750
aag caa gag gct cct gca aag aag aaa tct ggt tca aag aag aaa ggt 2544
Lys Gln Glu Ala Pro Ala Lys Lys Lys Ser Gly Ser Lys Lys Lys Gly
755 760 765
gag cct ggg cct cca gac tct gac agc cct ctc tac ctc ccc tac aag 2592
Glu Pro Gly Pro Pro Asp Ser Asp Ser Pro Leu Tyr Leu Pro Tyr Lys
770 775 780
acg ctg gtc tcc aca gtt gga agc atg gta ttc aac gag ggt gag gcc 2640
Thr Leu Val Ser Thr Val Gly Ser Met Val Phe Asn Glu Gly Glu Ala
785 790 795
cag cgg ctc att gag atc ctg tcc gag aag gct ggt gtc att caa gac 2688
Gln Arg Leu Ile Glu Ile Leu Ser Glu Lys Ala Gly Val Ile Gln Asp
800 805 810 815
acc tgg cat aag gct act cag aag ggt gac ccc gtg gcg att ctg aag 2736
Thr Trp His Lys Ala Thr Gln Lys Gly Asp Pro Val Ala Ile Leu Lys
820 825 830
cgc cag cta gaa gag aag gag aag ctg ctg gcc aca gag cag gag gac 2784
Arg Gln Leu Glu Glu Lys Glu Lys Leu Leu Ala Thr Glu Gln Glu Asp
835 840 845
gcg gct gtt gcg aag agc aaa ctg agg gag gtg aat aag gag ctg gca 2832
Ala Ala Val Ala Lys Ser Lys Leu Arg Glu Val Asn Lys Glu Leu Ala
850 855 860
gca gaa aag gct aag gca gca gcg ggg gag gcc aag gtg aag aag cag 2880
Ala Glu Lys Ala Lys Ala Ala Ala Gly Glu Ala Lys Val Lys Lys Gln
865 870 875
ctg gtg gcc cgg gag cag gag atc aca gcc gtg cag gcg cgc atc gaa 2928
Leu Val Ala Arg Glu Gln Glu Ile Thr Ala Val Gln Ala Arg Ile Glu
880 885 890 895
gcc agc tac cgg gag cat gtg aag gag gtg cag cag ctg cag ggc aag 2976
Ala Ser Tyr Arg Glu His Val Lys Glu Val Gln Gln Leu Gln Gly Lys
900 905 910
atc cgg acc ctt cag gag cag ttg gag aac ggc ccc aac aca cag ctg 3024
Ile Arg Thr Leu Gln Glu Gln Leu Glu Asn Gly Pro Asn Thr Gln Leu
915 920 925
gcc cgt ctg cag cag gaa aat tcc atc ctg agg gat gcc ttg aac cag 3072
Ala Arg Leu Gln Gln Glu Asn Ser Ile Leu Arg Asp Ala Leu Asn Gln
930 935 940
gcc acg agc cag gtg gag agc aag cag aac acc gag ctg gcc aag ctc 3120
Ala Thr Ser Gln Val Glu Ser Lys Gln Asn Thr Glu Leu Ala Lys Leu
945 950 955
cgg cag gag ctc agc aag gtc agc aag gag ctg gtg gag aaa tca gag 3168
Arg Gln Glu Leu Ser Lys Val Ser Lys Glu Leu Val Glu Lys Ser Glu
960 965 970 975
gct gcg cgg cag gag gaa cag cag cga aag gcc ctg gag acc aaa aca 3216
Ala Ala Arg Gln Glu Glu Gln Gln Arg Lys Ala Leu Glu Thr Lys Thr
980 985 990
gcc gcc ttg gag aag cag gtc cta cag ctg caa gca tct cac aag gag 3264
Ala Ala Leu Glu Lys Gln Val Leu Gln Leu Gln Ala Ser His Lys Glu
995 1000 1005
agt gag gag gcc ctg cag aag cgc ctg gac gag gtc agc cgg gag cta 3312
Ser Glu Glu Ala Leu Gln Lys Arg Leu Asp Glu Val Ser Arg Glu Leu
1010 1015 1020
tgc cgc tcc cag acc agc cat gcc agc ctg cgg gcg gat gcc gag aag 3360
Cys Arg Ser Gln Thr Ser His Ala Ser Leu Arg Ala Asp Ala Glu Lys
1025 1030 1035
gcc cag gag cag cag cag cag atg gct gag ctg cac agc aaa ctt cag 3408
Ala Gln Glu Gln Gln Gln Gln Met Ala Glu Leu His Ser Lys Leu Gln
1040 1045 1050 1055
tcc tcc gag gcg gag gtg aaa agc aag tct gag gag ctg agt ggt ctc 3456
Ser Ser Glu Ala Glu Val Lys Ser Lys Ser Glu Glu Leu Ser Gly Leu
1060 1065 1070
cat ggg cag ctc aag gag gcc agg gcc gag aac tca cag ctc atg gag 3504
His Gly Gln Leu Lys Glu Ala Arg Ala Glu Asn Ser Gln Leu Met Glu
1075 1080 1085
aga atc cgg tcc atc gag gcc ctg ctg gag gcg ggc cag gcc cgg gac 3552
Arg Ile Arg Ser Ile Glu Ala Leu Leu Glu Ala Gly Gln Ala Arg Asp
1090 1095 1100
acc cag gat gcc cag gcc agc cga gcg gag cat cag gcc cgc ctc aag 3600
Thr Gln Asp Ala Gln Ala Ser Arg Ala Glu His Gln Ala Arg Leu Lys
1105 1110 1115
gag cta gag tcc cag gtg tgg tgc ctg gag aag gag gcc acc gag ctc 3648
Glu Leu Glu Ser Gln Val Trp Cys Leu Glu Lys Glu Ala Thr Glu Leu
1120 1125 1130 1135
aag gag gct gtt gag cag cag aaa gtg aag aac aac gac ctc cga gag 3696
Lys Glu Ala Val Glu Gln Gln Lys Val Lys Asn Asn Asp Leu Arg Glu
1140 1145 1150
aag aac tgg aag gcc atg gag gct ctg gcc tcg gcc gag aga gcc tgc 3744
Lys Asn Trp Lys Ala Met Glu Ala Leu Ala Ser Ala Glu Arg Ala Cys
1155 1160 1165
gag gag aag ctc cgc tcc tta acc cag gcc aag gag gaa tcc gag aag 3792
Glu Glu Lys Leu Arg Ser Leu Thr Gln Ala Lys Glu Glu Ser Glu Lys
1170 1175 1180
cag ctc agc ctg acg gag gcc cag acc aag gag gcc ctg ctg gcc ctg 3840
Gln Leu Ser Leu Thr Glu Ala Gln Thr Lys Glu Ala Leu Leu Ala Leu
1185 1190 1195
ttg ccg gct ctc tcc agc tca gcc ccc cag agt tac acc gag tgg ctg 3888
Leu Pro Ala Leu Ser Ser Ser Ala Pro Gln Ser Tyr Thr Glu Trp Leu
1200 1205 1210 1215
cag gaa ctc cga gag aag ggc ccg gag ctg ctg aag cag cgg ccg gct 3936
Gln Glu Leu Arg Glu Lys Gly Pro Glu Leu Leu Lys Gln Arg Pro Ala
1220 1225 1230
gac aca gat ccg tcc tcg gac ctg gct tcc aag ctg agg gag gct gag 3984
Asp Thr Asp Pro Ser Ser Asp Leu Ala Ser Lys Leu Arg Glu Ala Glu
1235 1240 1245
gag acc cag aac aat ctg cag gcc gag tgt gac cag tac cgc acc atc 4032
Glu Thr Gln Asn Asn Leu Gln Ala Glu Cys Asp Gln Tyr Arg Thr Ile
1250 1255 1260
ctg gca gag acg gag ggc atg ctc aaa gac ctg cag aag agt gtg gag 4080
Leu Ala Glu Thr Glu Gly Met Leu Lys Asp Leu Gln Lys Ser Val Glu
1265 1270 1275
gag gag gag cag gtg tgg aag gcc aaa gtg agc gcc acg gag gag gag 4128
Glu Glu Glu Gln Val Trp Lys Ala Lys Val Ser Ala Thr Glu Glu Glu
1280 1285 1290 1295
ctt cag aag tca cgg gtc aca gtg aaa cat ctc gaa gac att gta gag 4176
Leu Gln Lys Ser Arg Val Thr Val Lys His Leu Glu Asp Ile Val Glu
1300 1305 1310
aag cta aaa gga gaa ctt gaa agt tca gag cag gtg agg gag cac acc 4224
Lys Leu Lys Gly Glu Leu Glu Ser Ser Glu Gln Val Arg Glu His Thr
1315 1320 1325
tca cat ctg gaa gca gag ctg gag aag cac atg gca gct gcc agc gct 4272
Ser His Leu Glu Ala Glu Leu Glu Lys His Met Ala Ala Ala Ser Ala
1330 1335 1340
gag tgc cag agc tac gcc aag gag gtg gcg ggg ttg agg caa ctt tta 4320
Glu Cys Gln Ser Tyr Ala Lys Glu Val Ala Gly Leu Arg Gln Leu Leu
1345 1350 1355
tta gag tct cag tct cag ctg gat gca gcc aag agt gaa gcc cag aaa 4368
Leu Glu Ser Gln Ser Gln Leu Asp Ala Ala Lys Ser Glu Ala Gln Lys
1360 1365 1370 1375
caa agc aat gag ctc gcc ctg gtc agg cag cag ttg agt gag atg aag 4416
Gln Ser Asn Glu Leu Ala Leu Val Arg Gln Gln Leu Ser Glu Met Lys
1380 1385 1390
agc cac gta gag gat ggt gac gta gct ggg tcc cca gct gcc ccc cca 4464
Ser His Val Glu Asp Gly Asp Val Ala Gly Ser Pro Ala Ala Pro Pro
1395 1400 1405
gca gag cag gac cct gtc gag ctg aag gcg cag ctg gag cgg aca gag 4512
Ala Glu Gln Asp Pro Val Glu Leu Lys Ala Gln Leu Glu Arg Thr Glu
1410 1415 1420
gcc acc ctg gag gac gag cag gcg ctg cgg agg aag ctc acg gcc gag 4560
Ala Thr Leu Glu Asp Glu Gln Ala Leu Arg Arg Lys Leu Thr Ala Glu
1425 1430 1435
ttc cag gag gct cag agc tct gcg tgc cgg ctc cag gcc gag ctg gag 4608
Phe Gln Glu Ala Gln Ser Ser Ala Cys Arg Leu Gln Ala Glu Leu Glu
1440 1445 1450 1455
aag ctc cgc agc aca ggg ccc ctg gag tct tca gca gca gag gag gcc 4656
Lys Leu Arg Ser Thr Gly Pro Leu Glu Ser Ser Ala Ala Glu Glu Ala
1460 1465 1470
aca cag ctg aag gag aga cta gaa aaa gag aag aaa cta acc agt gac 4704
Thr Gln Leu Lys Glu Arg Leu Glu Lys Glu Lys Lys Leu Thr Ser Asp
1475 1480 1485
ctg gga cat gct gcc acc aaa ttg cag gag ctt ttg aag acc acc cag 4752
Leu Gly His Ala Ala Thr Lys Leu Gln Glu Leu Leu Lys Thr Thr Gln
1490 1495 1500
gag cag ctg gca aag gag aga gac aca gtg aag aag ttg cag gag cag 4800
Glu Gln Leu Ala Lys Glu Arg Asp Thr Val Lys Lys Leu Gln Glu Gln
1505 1510 1515
ttg gac aaa aca gac gac agc agc tca aag gag ggc act tct gtc tga 4848
Leu Asp Lys Thr Asp Asp Ser Ser Ser Lys Glu Gly Thr Ser Val
1520 1525 1530 1535
gtctgctctt cgggaaaaga agttcccatt caacttacca aaatgcctta cacattcctt 4908
acaaataaat aaaccaacca acacaccgtt atccaggccc aacctccagt agctctgaga 4968
gaagccatga gagactctta gaatcacaga aatagacctt ccagacccct tgtttgtaaa 5028
agaacctttg tcacatttga taaacactat tccccaggac cagccctgga ccaccaccga 5088
gcagacgcca aagcccttac cagctctgtg acagacccca gggtatgtgc tggggaggcc 5148
gggacgctgg gtatctgtat gtcaatcagt gcaattgttt tcttcccctg ggttgggggt 5208
caggaggcga gcggcctggt ggtgagtctc cagggctgtg gagcagactg gaggggccca 5268
gccagccggg gaggcagcag cctctcaccc ccgggggaag ttgccagcaa gaactgatgt 5328
gtgacttcct ggatgttaat gccattaaaa ccaacattgt tgcccggcaa aaaaaaaaaa 5388
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaa 5425
<210>48
<211>1534
<212>PRT
<213>家犬
<400>48
Met Asp Ile Tyr Asp Thr Gln Thr Leu Gly Val Met Val Phe Gly Gly
1 5 10 15
Phe Met Val Val Ser Ala Ile Gly Ile Phe Leu Val Ser Thr Phe Ser
20 25 30
Met Lys Glu Thr Ser Tyr Glu Glu Ala Leu Ala Asn Gln Arg Lys Glu
35 40 45
Met Ala Lys Thr His His Gln Lys Val Glu Lys Lys Lys Lys Glu Lys
50 55 60
Thr Val Glu Lys Lys Gly Lys Thr Lys Lys Lys Glu Glu Lys Pro Asn
65 70 75 80
Gly Lys Ile Pro Asp His Glu Pro Ala Pro Asn Val Thr Ile Leu Leu
85 90 95
Lys Asp Pro Val Arg Ala Pro Ala Val Pro Val Ala Pro Thr Pro Val
100 105 110
Gln Pro Pro Val Val Ile Ala Pro Val Ala Thr Val Pro Ala Met Pro
115 120 125
Gln Glu Lys Leu Ala Pro Ser Pro Lys Asp Lys Lys Lys Lys Glu Lys
130 135 140
Lys Val Ala Lys Val Glu Pro Ala Val Ser Ser Val Val Asn Ser Val
145 150 155 160
Gln Val Leu Ala Ser Lys Ala Ala Ile Leu Glu Thr Ala Pro Lys Glu
165 170 175
Val Pro Met Val Val Val Pro Pro Val Gly Ala Lys Ala Gly Thr Pro
180 185 190
Ala Thr Ser Thr Ala Gln Gly Lys Lys Ala Glu Gly Ala Gln Asn Gln
195 200 205
Ser Arg Lys Ala Glu Gly Ala Pro Asn Gln Gly Lys Lys Ala Glu Gly
210 215 220
Ala Leu Asn Gln Gly Lys Lys Ala Glu Gly Ala Gln Asn Gln Gly Lys
225 230 235 240
Lys Val Glu Val Ala Pro Asn Gln Gly Lys Lys Ala Glu Gly Gly Gln
245 250 255
Asn Gln Gly Lys Lys Val Glu Gly Ala Gln Asn Gln Gly Lys Lys Ala
260 265 270
Glu Gly Thr Pro Asn Gln Gly Lys Lys Ala Glu Gly Ala Pro Asn Gln
275 280 285
Gly Lys Lys Thr Asp Gly Ala Pro Asn Gln Gly Lys Lys Ser Glu Gly
290 295 300
Ala Pro Asn Gln Gly Lys Lys Ala Glu Gly Ala Gln Asn Gln Gly Lys
305 310 315 320
Lys Val Glu Val Ala Pro Asn Gln Gly Lys Lys Ala Glu Gly Gly Gln
325 330 335
Asn Gln Gly Lys Lys Val Glu Gly Ala Gln Asn Gln Gly Lys Lys Ala
340 345 350
Glu Gly Thr Pro Asn Gln Gly Lys Lys Ala Glu Gly Ala Pro Asn Gln
355 360 365
Gly Lys Lys Thr Asp Gly Ala Pro Asn Gln Gly Lys Lys Ser Glu Gly
370 375 380
Ala Pro Asn Gln Gly Lys Lys Val Glu Gly Ala Gln Asn Gln Gly Lys
385 390 395 400
Lys Val Glu Gly Val Gln Asn Gln Gly Lys Lys Ala Glu Gly Ala Gln
405 410 415
Asn Gln Gly Lys Lys Ala Glu Gly Thr Ser Ser Gln Gly Arg Lys Glu
420 425 430
Glu Gly Thr Pro Asn Leu Gly Lys Lys Ala Glu Gly Ser Pro Asn Gln
435 440 445
Gly Lys Lys Val Glu Val Val Gln Asn Gln Ser Lys Lys Val Glu Gly
450 455 460
Ala Pro Asn Gln Gly Lys Lys Ala Glu Gly Ser Gln Asn Gln Gly Lys
465 470 475 480
Lys Thr Glu Gly Ala Ser Asn Gln Gly Lys Lys Val Asp Gly Ala Gln
485 490 495
Asn Gln Gly Lys Lys Ala Glu Gly Ala Pro Asn Gln Gly Lys Lys Val
500 505 510
Glu Gly Ala Gln Asn Gln Gly Lys Lys Ala Glu Gly Thr Pro Asn Gln
515 520 525
Gly Lys Lys Ala Glu Gly Ala Gln Asn Gln Gly Lys Lys Ala Glu Gly
530 535 540
Ala Pro Asn Gln Gly Lys Lys Ala Glu Gly Ala Pro Asn Gln Gly Lys
545 550 555 560
Lys Ala Glu Gly Ala Pro Asn Gln Gly Lys Lys Ala Glu Gly Ala Pro
565 570 575
Asn Gln Gly Lys Lys Ala Glu Ala Ala Pro Asn Gln Gly Lys Lys Ala
580 585 590
Glu Gly Ala Pro Asn Gln Gly Lys Lys Ala Glu Gly Ala Pro Asn Gln
595 600 605
Gly Lys Lys Ala Glu Ala Ala Pro Asn Gln Gly Lys Lys Ala Glu Gly
610 615 620
Ala Pro Asn Gln Gly Lys Lys Ala Glu Gly Ala Pro Asn Gln Gly Lys
625 630 635 640
Lys Ala Glu Gly Ala Pro Asn Gln Gly Lys Lys Ala Glu Gly Ala Gln
645 650 655
Asn Gln Gly Lys Lys Ala Glu Gly Ala Pro Asn Gln Gly Lys Lys Ala
660 665 670
Asp Leu Val Ala Asn Gln Gly Thr Lys Ala Glu Gly Val Ala Gly Gln
675 680 685
Gly Lys Lys Ala Glu Gly Ala Pro Asn Gln Gly Lys Lys Gly Glu Gly
690 695 700
Thr Pro Asn Gln Gly Lys Lys Ser Glu Gly Ser Pro Asn Gln Gly Lys
705 710 715 720
Lys Val Asp Ala Ser Ala Asn Gln Ser Lys Arg Ala Glu Ser Ala Pro
725 730 735
Ile Gln Gly Lys Asn Ala Asp Met Val Gln Ser Gln Glu Ala Pro Lys
740 745 750
Gln Glu Ala Pro Ala Lys Lys Lys Ser Gly Ser Lys Lys Lys Gly Glu
755 760 765
Pro Gly Pro Pro Asp Ser Asp Ser Pro Leu Tyr Leu Pro Tyr Lys Thr
770 775 780
Leu Val Ser Thr Val Gly Ser Met Val Phe Asn Glu Gly Glu Ala Gln
785 790 795 800
Arg Leu Ile Glu Ile Leu Ser Glu Lys Ala Gly Val Ile Gln Asp Thr
805 810 815
Trp His Lys Ala Thr Gln Lys Gly Asp Pro Val Ala Ile Leu Lys Arg
820 825 830
Gln Leu Glu Glu Lys Glu Lys Leu Leu Ala Thr Glu Gln Glu Asp Ala
835 840 845
Ala Val Ala Lys Ser Lys Leu Arg Glu Val Asn Lys Glu Leu Ala Ala
850 855 860
Glu Lys Ala Lys Ala Ala Ala Gly Glu Ala Lys Val Lys Lys Gln Leu
865 870 875 880
Val Ala Arg Glu Gln Glu Ile Thr Ala Val Gln Ala Arg Ile Glu Ala
885 890 895
Ser Tyr Arg Glu His Val Lys Glu Val Gln Gln Leu Gln Gly Lys Ile
900 905 910
Arg Thr Leu Gln Glu Gln Leu Glu Asn Gly Pro Asn Thr Gln Leu Ala
915 920 925
Arg Leu Gln Gln Glu Asn Ser Ile Leu Arg Asp Ala Leu Asn Gln Ala
930 935 940
Thr Ser Gln Val Glu Ser Lys Gln Asn Thr Glu Leu Ala Lys Leu Arg
945 950 955 960
Gln Glu Leu Ser Lys Val Ser Lys Glu Leu Val Glu Lys Ser Glu Ala
965 970 975
Ala Arg Gln Glu Glu Gln Gln Arg Lys Ala Leu Glu Thr Lys Thr Ala
980 985 990
Ala Leu Glu Lys Gln Val Leu Gln Leu Gln Ala Ser His Lys Glu Ser
995 1000 1005
Glu Glu Ala Leu Gln Lys Arg Leu Asp Glu Val Ser Arg Glu Leu Cys
1010 1015 1020
Arg Ser Gln Thr Ser His Ala Ser Leu Arg Ala Asp Ala Glu Lys Ala
1025 1030 1035 1040
Gln Glu Gln Gln Gln Gln Met Ala Glu Leu His Ser Lys Leu Gln Ser
1045 1050 1055
Ser Glu Ala Glu Val Lys Ser Lys Ser Glu Glu Leu Ser Gly Leu His
1060 1065 1070
Gly Gln Leu Lys Glu Ala Arg Ala Glu Asn Ser Gln Leu Met Glu Arg
1075 1080 1085
Ile Arg Ser Ile Glu Ala Leu Leu Glu Ala Gly Gln Ala Arg Asp Thr
1090 1095 1100
Gln Asp Ala Gln Ala Ser Arg Ala Glu His Gln Ala Arg Leu Lys Glu
1105 1110 1115 1120
Leu Glu Ser Gln Val Trp Cys Leu Glu Lys Glu Ala Thr Glu Leu Lys
1125 1130 1135
Glu Ala Val Glu Gln Gln Lys Val Lys Asn Asn Asp Leu Arg Glu Lys
1140 1145 1150
Asn Trp Lys Ala Met Glu Ala Leu Ala Ser Ala Glu Arg Ala Cys Glu
1155 1160 1165
Glu Lys Leu Arg Ser Leu Thr Gln Ala Lys Glu Glu Ser Glu Lys Gln
1170 1175 1180
Leu Ser Leu Thr Glu Ala Gln Thr Lys Glu Ala Leu Leu Ala Leu Leu
1185 1190 1195 1200
Pro Ala Leu Ser Ser Ser Ala Pro Gln Ser Tyr Thr Glu Trp Leu Gln
1205 1210 1215
Glu Leu Arg Glu Lys Gly Pro Glu Leu Leu Lys Gln Arg Pro Ala Asp
1220 1225 1230
Thr Asp Pro Ser Ser Asp Leu Ala Ser Lys Leu Arg Glu Ala Glu Glu
1235 1240 1245
Thr Gln Asn Asn Leu Gln Ala Glu Cys Asp Gln Tyr Arg Thr Ile Leu
1250 1255 1260
Ala Glu Thr Glu Gly Met Leu Lys Asp Leu Gln Lys Ser Val Glu Glu
1265 1270 1275 1280
Glu Glu Gln Val Trp Lys Ala Lys Val Ser Ala Thr Glu Glu Glu Leu
1285 1290 1295
Gln Lys Ser Arg Val Thr Val Lys His Leu Glu Asp Ile Val Glu Lys
1300 1305 1310
Leu Lys Gly Glu Leu Glu Ser Ser Glu Gln Val Arg Glu His Thr Ser
1315 1320 1325
His Leu Glu Ala Glu Leu Glu Lys His Met Ala Ala Ala Ser Ala Glu
1330 1335 1340
Cys Gln Ser Tyr Ala Lys Glu Val Ala Gly Leu Arg Gln Leu Leu Leu
1345 1350 1355 1360
Glu Ser Gln Ser Gln Leu Asp Ala Ala Lys Ser Glu Ala Gln Lys Gln
1365 1370 1375
Ser Asn Glu Leu Ala Leu Val Arg Gln Gln Leu Ser Glu Met Lys Ser
1380 1385 1390
His Val Glu Asp Gly Asp Val Ala Gly Ser Pro Ala Ala Pro Pro Ala
1395 1400 1405
Glu Gln Asp Pro Val Glu Leu Lys Ala Gln Leu Glu Arg Thr Glu Ala
1410 1415 1420
Thr Leu Glu Asp Glu Gln Ala Leu Arg Arg Lys Leu Thr Ala Glu Phe
1425 1430 1435 1440
Gln Glu Ala Gln Ser Ser Ala Cys Arg Leu Gln Ala Glu Leu Glu Lys
1445 1450 1455
Leu Arg Ser Thr Gly Pro Leu Glu Ser Ser Ala Ala Glu Glu Ala Thr
1460 1465 1470
Gln Leu Lys Glu Arg Leu Glu Lys Glu Lys Lys Leu Thr Ser Asp Leu
1475 1480 1485
Gly His Ala Ala Thr Lys Leu Gln Glu Leu Leu Lys Thr Thr Gln Glu
1490 1495 1500
Gln Leu Ala Lys Glu Arg Asp Thr Val Lys Lys Leu Gln Glu Gln Leu
1505 1510 1515 1520
Asp Lys Thr Asp Asp Ser Ser Ser Lys Glu Gly Thr Ser Val
1525 1530
<210>49
<211>21
<212>DNA
<213>人工序列
<220>
<223>引物
<400>49
ctcaagggcc tggagactac g 21
<210>50
<211>22
<212>DNA
<213>人工序列
<220>
<223>引物
<400>50
cgggattccc gagtcgctca cc 22
<210>51
<211>1416
<212>DNA
<213>人工序列
<220>
<223>合成核苷酸
<400>51
tctagaatgt tgttgcaagc cttcttgttc ttgttggctg gtttcgctgc taagatttcc 60
gctcaattgc agttgcaaga gtccggtcca ggattggtta agccatccga gaccttgtcc 120
ttgacctgta ccgtttccgg tggttccatc atctccaagt cctcctactg gggatggatc 180
agacaaccac caggaaaggg tttggagtgg atcggttcca tctactactc cggttccacc 240
ttctacaacc catccttgaa gtccagagtt accatctccg ttgacacctc caagaaccaa 300
ttctccttga agttgtcctc cgttaccgct gctgacaccg ctgtttacta ctgtgctaga 360
ttgaccgttg ctgagttcga ctactggggt caaggaacct tggttaccgt ttcctccgct 420
tccaccaagg gtccatccgt tttcccattg gctccatcct ccaagtccac ctccggtgga 480
accgctgctt tgggttgttt ggtcaaggac tacttcccag agccagtcac cgtttcctgg 540
aactccggtg ctttgacctc cggtgttcac accttcccag ctgttttgca atcctccggt 600
ttgtactcct tgtcctccgt cgttaccgtt ccatcctcct ccttgggtac tcaaacctac 660
atctgcaacg tcaaccacaa gccatccaac accaaggttg acaagaaggt tgagccaaag 720
tcctgtgaca agacccacac ctgtccacca tgtccagctc cagagttgtt gggtggtcct 780
tctgttttct tgttcccacc aaagccaaag gacaccttga tgatctccag aaccccagag 840
gttacctgtg ttgtcgttga cgtttcccac gaggacccag aggttaagtt caactggtac 900
gttgacggtg ttgaggttca caacgctaag accaagccaa gagaggagca atacaactcc 960
acctacagag ttgtttccgt cttgaccgtt ttgcaccaag actggttgaa cggaaaggag 1020
tacaagtgca aggtttccaa caaggctttg ccagctccaa tcgaaaagac catctccaag 1080
gctaagggtc aaccaagaga gccacaagtt tacaccttgc caccatccag agatgagttg 1140
accaagaacc aagtttcctt gacctgcttg gtcaagggtt tctacccatc cgacatcgct 1200
gttgagtggg agtccaacgg tcaaccagag aacaactaca agaccacccc accagttttg 1260
gactccgacg gttccttctt cttgtactcc aagttgaccg ttgacaagtc cagatggcaa 1320
caaggtaacg ttttctcctg ctccgttatg cacgaggctt tgcacaacca ctacacccaa 1380
aagtccttgt ccttgtcccc aggtaagtaa ggatcc 1416
<210>52
<211>1416
<212>DNA
<213>人工序列
<220>
<223>合成核苷酸
<220>
<221>CDS
<222>(7)..(1410)
<400>52
tctaga atg ttg ttg caa gcc ttc ttg ttc ttg ttg gct ggt ttc gct 48
Met Leu Leu Gln Ala Phe Leu Phe Leu Leu Ala Gly Phe Ala
1 5 10
gct aag att tcc gct caa ttg cag ttg caa gag tcc ggt cca gga ttg 96
Ala Lys Ile Ser Ala Gln Leu Gln Leu Gln Glu Ser Gly Pro Gly Leu
15 20 25 30
gtt aag cca tcc gag acc ttg tcc ttg acc tgt acc gtt tcc ggt ggt 144
Val Lys Pro Ser Glu Thr Leu Ser Leu Thr Cys Thr Val Ser Gly Gly
35 40 45
tcc atc atc tcc aag tcc tcc tac tgg gga tgg atc aga caa cca cca 192
Ser Ile Ile Ser Lys Ser Ser Tyr Trp Gly Trp Ile Arg Gln Pro Pro
50 55 60
gga aag ggt ttg gag tgg atc ggt tcc atc tac tac tcc ggt tcc acc 240
Gly Lys Gly Leu Glu Trp Ile Gly Ser Ile Tyr Tyr Ser Gly Ser Thr
65 70 75
ttc tac aac cca tcc ttg aag tcc aga gtt acc atc tcc gtt gac acc 288
Phe Tyr Asn Pro Ser Leu Lys Ser Arg Val Thr Ile Ser Val Asp Thr
80 85 90
tcc aag aac caa ttc tcc ttg aag ttg tcc tcc gtt acc gct gct gac 336
Ser Lys Asn Gln Phe Ser Leu Lys Leu Ser Ser Val Thr Ala Ala Asp
95 100 105 110
acc gct gtt tac tac tgt gct aga ttg acc gtt gct gag ttc gac tac 384
Thr Ala Val Tyr Tyr Cys Ala Arg Leu Thr Val Ala Glu Phe Asp Tyr
115 120 125
tgg ggt caa gga acc ttg gtt acc gtt tcc tcc gct tcc acc aag ggt 432
Trp Gly Gln Gly Thr Leu Val Thr Val Ser Ser Ala Ser Thr Lys Gly
130 135 140
cca tcc gtt ttc cca ttg gct cca tcc tcc aag tcc acc tcc ggt gga 480
Pro Ser Val Phe Pro Leu Ala Pro Ser Ser Lys Ser Thr Ser Gly Gly
145 150 155
acc gct gct ttg ggt tgt ttg gtc aag gac tac ttc cca gag cca gtc 528
Thr Ala Ala Leu Gly Cys Leu Val Lys Asp Tyr Phe Pro Glu Pro Val
160 165 170
acc gtt tcc tgg aac tcc ggt gct ttg acc tcc ggt gtt cac acc ttc 576
Thr Val Ser Trp Asn Ser Gly Ala Leu Thr Ser Gly Val His Thr Phe
175 180 185 190
cca gct gtt ttg caa tcc tcc ggt ttg tac tcc ttg tcc tcc gtc gtt 624
Pro Ala Val Leu Gln Ser Ser Gly Leu Tyr Ser Leu Ser Ser Val Val
195 200 205
acc gtt cca tcc tcc tcc ttg ggt act caa acc tac atc tgc aac gtc 672
Thr Val Pro Ser Ser Ser Leu Gly Thr Gln Thr Tyr Ile Cys Asn Val
210 215 220
aac cac aag cca tcc aac acc aag gtt gac aag aag gtt gag cca aag 720
Asn His Lys Pro Ser Asn Thr Lys Val Asp Lys Lys Val Glu Pro Lys
225 230 235
tcc tgt gac aag acc cac acc tgt cca cca tgt cca gct cca gag ttg 768
Ser Cys Asp Lys Thr His Thr Cys Pro Pro Cys Pro Ala Pro Glu Leu
240 245 250
ttg ggt ggt cct tct gtt ttc ttg ttc cca cca aag cca aag gac acc 816
Leu Gly Gly Pro Ser Val Phe Leu Phe Pro Pro Lys Pro Lys Asp Thr
255 260 265 270
ttg atg atc tcc aga acc cca gag gtt acc tgt gtt gtc gtt gac gtt 864
Leu Met Ile Ser Arg Thr Pro Glu Val Thr Cys Val Val Val Asp Val
275 280 285
tcc cac gag gac cca gag gtt aag ttc aac tgg tac gtt gac ggt gtt 912
Ser His Glu Asp Pro Glu Val Lys Phe Asn Trp Tyr Val Asp Gly Val
290 295 300
gag gtt cac aac gct aag acc aag cca aga gag gag caa tac aac tcc 960
Glu Val His Asn Ala Lys Thr Lys Pro Arg Glu Glu Gln Tyr Asn Ser
305 310 315
acc tac aga gtt gtt tcc gtc ttg acc gtt ttg cac caa gac tgg ttg 1008
Thr Tyr Arg Val Val Ser Val Leu Thr Val Leu His Gln Asp Trp Leu
320 325 330
aac gga aag gag tac aag tgc aag gtt tcc aac aag gct ttg cca gct 1056
Asn Gly Lys Glu Tyr Lys Cys Lys Val Ser Asn Lys Ala Leu Pro Ala
335 340 345 350
cca atc gaa aag acc atc tcc aag gct aag ggt caa cca aga gag cca 1104
Pro Ile Glu Lys Thr Ile Ser Lys Ala Lys Gly Gln Pro Arg Glu Pro
355 360 365
caa gtt tac acc ttg cca cca tcc aga gat gag ttg acc aag aac caa 1152
Gln Val Tyr Thr Leu Pro Pro Ser Arg Asp Glu Leu Thr Lys Asn Gln
370 375 380
gtt tcc ttg acc tgc ttg gtc aag ggt ttc tac cca tcc gac atc gct 1200
Val Ser Leu Thr Cys Leu Val Lys Gly Phe Tyr Pro Ser Asp Ile Ala
385 390 395
gtt gag tgg gag tcc aac ggt caa cca gag aac aac tac aag acc acc 1248
Val Glu Trp Glu Ser Asn Gly Gln Pro Glu Asn Asn Tyr Lys Thr Thr
400 405 410
cca cca gtt ttg gac tcc gac ggt tcc ttc ttc ttg tac tcc aag ttg 1296
Pro Pro Val Leu Asp Ser Asp Gly Ser Phe Phe Leu Tyr Ser Lys Leu
415 420 425 430
acc gtt gac aag tcc aga tgg caa caa ggt aac gtt ttc tcc tgc tcc 1344
Thr Val Asp Lys Ser Arg Trp Gln Gln Gly Asn Val Phe Ser Cys Ser
435 440 445
gtt atg cac gag gct ttg cac aac cac tac acc caa aag tcc ttg tcc 1392
Val Met His Glu Ala Leu His Asn His Tyr Thr Gln Lys Ser Leu Ser
450 455 460
ttg tcc cca ggt aag taa ggatcc 1416
Leu Ser Pro Gly Lys
465
<210>53
<211>714
<212>DNA
<213>人工序列
<220>
<223>合成核苷酸
<400>53
tctagaatgt tgttgcaagc cttcttgttc ttgttggctg gtttcgctgc taagatttcc 60
gctgagatcg ttttgaccca atccccagct accttgtcct tgtccccagg tgagagagcc 120
accttgtcct gtagagcttc ccaatccgtt tcctccttct tggcttggta ccaacaaaag 180
ccaggtcaag ccccaagatt gttgatctac gacgcttcca acagagctac cggtatccca 240
gctagattct ccggttccgg ttccggaacc gacttcacct tgaccatctc ctccttggag 300
ccagaggact tcgctgttta ctactgccaa caaagatcca actggccatt gaccttcggt 360
ccaggtacta aggttgacat caagagaacc gttgctgctc catccgtttt catcttccca 420
ccatccgacg agcaattgaa gtccggtact gcttccgttg tttgcttgtt gaacaacttc 480
tacccaagag aggctaaggt tcaatggaag gttgacaacg ctttgcaatc cggtaactcc 540
caagagtccg ttaccgagca agactccaag gactccacct actccttgtc ctccaccttg 600
accttgtcca aggctgacta cgagaagcac aaggtttacg cttgtgaggt tacccaccaa 660
ggtttgtcct ccccagttac caagtccttc aacagaggtg agtgctaagg atcc 714
<210>54
<211>714
<212>DNA
<213>人工序列
<220>
<223>合成核苷酸
<220>
<221>CDS
<222>(7)..(708)
<400>54
tctaga atg ttg ttg caa gcc ttc ttg ttc ttg ttg gct ggt ttc gct 48
Met Leu Leu Gln Ala Phe Leu Phe Leu Leu Ala Gly Phe Ala
1 5 10
gct aag att tcc gct gag atc gtt ttg acc caa tcc cca gct acc ttg 96
Ala Lys Ile Ser Ala Glu Ile Val Leu Thr Gln Ser Pro Ala Thr Leu
15 20 25 30
tcc ttg tcc cca ggt gag aga gcc acc ttg tcc tgt aga gct tcc caa 144
Ser Leu Ser Pro Gly Glu Arg Ala Thr Leu Ser Cys Arg Ala Ser Gln
35 40 45
tcc gtt tcc tcc ttc ttg gct tgg tac caa caa aag cca ggt caa gcc 192
Ser Val Ser Ser Phe Leu Ala Trp Tyr Gln Gln Lys Pro Gly Gln Ala
50 55 60
cca aga ttg ttg atc tac gac gct tcc aac aga gct acc ggt atc cca 240
Pro Arg Leu Leu Ile Tyr Asp Ala Ser Asn Arg Ala Thr Gly Ile Pro
65 70 75
gct aga ttc tcc ggt tcc ggt tcc gga acc gac ttc acc ttg acc atc 288
Ala Arg Phe Ser Gly Ser Gly Ser Gly Thr Asp Phe Thr Leu Thr Ile
80 85 90
tcc tcc ttg gag cca gag gac ttc gct gtt tac tac tgc aaa caa aga 336
Ser Ser Leu Glu Pro Glu Asp Phe Ala Val Tyr Tyr Cys Gln Gln Arg
95 100 105 110
tcc aac tgg cca ttg acc ttc ggt cca ggt act aag gtt gac atc aag 384
Ser Asn Trp Pro Leu Thr Phe Gly Pro Gly Thr Lys Val Asp Ile Lys
115 120 125
aga acc gtt gct gct cca tcc gtt ttc atc ttc cca cca tcc gac gag 432
Arg Thr Val Ala Ala Pro Ser Val Phe Ile Phe Pro Pro Ser Asp Glu
130 135 140
caa ttg aag tcc ggt act gct tcc gtt gtt tgc ttg ttg aac aac ttc 480
Gln Leu Lys Ser Gly Thr Ala Ser Val Val Cys Leu Leu Asn Asn Phe
145 150 155
tac cca aga gag gct aag gtt caa tgg aag gtt gac aac gct ttg caa 528
Tyr Pro Arg Glu Ala Lys Val Gln Trp Lys Val Asp Asn Ala Leu Gln
160 165 170
tcc ggt aac tcc caa gag tcc gtt acc gag caa gac tcc aag gac tcc 576
Ser Gly Asn Ser Gln Glu Ser Val Thr Glu Gln Asp Ser Lys Asp Ser
175 180 185 190
acc tac tcc ttg tcc tcc acc ttg acc ttg tcc aag gct gac tac gag 624
Thr Tyr Ser Leu Ser Ser Thr Leu Thr Leu Ser Lys Ala Asp Tyr Glu
195 200 205
aag cac aag gtt tac gct tgt gag gtt acc cac caa ggt ttg tcc tcc 672
Lys His Lys Val Tyr Ala Cys Glu Val Thr His Gln Gly Leu Ser Ser
210 215 220
cca gtt acc aag tcc ttc aac aga ggt gag tgc taa ggatcc 714
Pro Val Thr Lys Ser Phe Asn Arg Gly Glu Cys
225 230
<210>55
<211>1437
<212>DNA
<213>人工序列
<220>
<223>合成核苷酸
<400>55
tctagaatgt tgggtaagaa cgacccaatg tgcttggtct tggtcttgtt gggtttgacc 60
gctttgttgg gtatctgtca aggacaattg cagttgcaag agtccggtcc aggattggtt 120
aagccatccg agaccttgtc cttgacctgt accgtttccg gtggttccat catctccaag 180
tcctcctact ggggatggat cagacaacca ccaggaaagg gtttggagtg gatcggttcc 240
atctactact ccggttccac cttctacaac ccatccttga agtccagagt taccatctcc 300
gttgacacct ccaagaacca attctccttg aagttgtcct ccgttaccgc tgctgacacc 360
gctgtttact actgtgctag attgaccgtt gctgagttcg actactgggg tcaaggaacc 420
ttggttaccg tttcctccgc ttccaccaag ggtccatccg ttttcccatt ggctccatcc 480
tccaagtcca cctccggtgg aaccgctgct ttgggttgtt tggtcaagga ctacttccca 540
gagccagtca ccgtttcctg gaactccggt gctttgacct ccggtgttca caccttccca 600
gctgttttgc aatcctccgg tttgtactcc ttgtcctccg tcgttaccgt tccatcctcc 660
tccttgggta ctcaaaccta catctgcaac gtcaaccaca agccatccaa caccaaggtt 720
gacaagaagg ttgagccaaa gtcctgtgac aagacccaca cctgtccacc atgtccagct 780
ccagagttgt tgggtggtcc ttctgttttc ttgttcccac caaagccaaa ggacaccttg 840
atgatctcca gaaccccaga ggttacctgt gttgtcgttg acgtttccca cgaggaccca 900
gaggttaagt tcaactggta cgttgacggt gttgaggttc acaacgctaa gaccaagcca 960
agagaggagc aatacaactc cacctacaga gttgtttccg tcttgaccgt tttgcaccaa 1020
gactggttga acggaaagga gtacaagtgc aaggtttcca acaaggcttt gccagctcca 1080
atcgaaaaga ccatctccaa ggctaagggt caaccaagag agccacaagt ttacaccttg 1140
ccaccatcca gagatgagtt gaccaagaac caagtttcct tgacctgctt ggtcaagggt 1200
ttctacccat ccgacatcgc tgttgagtgg gagtccaacg gtcaaccaga gaacaactac 1260
aagaccaccc caccagtttt ggactccgac ggttccttct tcttgtactc caagttgacc 1320
gttgacaagt ccagatggca acaaggtaac gttttctcct gctccgttat gcacgaggct 1380
ttgcacaacc actacaccca aaagtccttg tccttgtccc caggtaagta aggatcc 1437
<210>56
<211>1437
<212>DNA
<213>人工序列
<220>
<223>合成核苷酸
<220>
<221>CDS
<222>(7)..(1431)
<400>56
tctaga atg ttg ggt aag aac gac cca atg tgc ttg gtc ttg gtc ttg 48
Met Leu Gly Lys Asn Asp Pro Met Cys Leu Val Leu Val Leu
1 5 10
ttg ggt ttg acc gct ttg ttg ggt atc tgt caa gga caa ttg cag ttg 96
Leu Gly Leu Thr Ala Leu Leu Gly Ile Cys Gln Gly Gln Leu Gln Leu
15 20 25 30
caa gag tcc ggt cca gga ttg gtt aag cca tcc gag acc ttg tcc ttg 144
Gln Glu Ser Gly Pro Gly Leu Val Lys Pro Ser Glu Thr Leu Ser Leu
35 40 45
acc tgt acc gtt tcc ggt ggt tcc atc atc tcc aag tcc tcc tac tgg 192
Thr Cys Thr Val Ser Gly Gly Ser Ile Ile Ser Lys Ser Ser Tyr Trp
50 55 60
gga tgg atc aga caa cca cca gga aag ggt ttg gag tgg atc ggt tcc 240
Gly Trp Ile Arg Gln Pro Pro Gly Lys Gly Leu Glu Trp Ile Gly Ser
65 70 75
atc tac tac tcc ggt tcc acc ttc tac aac cca tcc ttg aag tcc aga 288
Ile Tyr Tyr Ser Gly Ser Thr Phe Tyr Asn Pro Ser Leu Lys Ser Arg
80 85 90
gtt acc atc tcc gtt gac acc tcc aag aac caa ttc tcc ttg aag ttg 336
Val Thr Ile Ser Val Asp Thr Ser Lys Asn Gln Phe Ser Leu Lys Leu
95 100 105 110
tcc tcc gtt acc gct gct gac acc gct gtt tac tac tgt gct aga ttg 384
Ser Ser Val Thr Ala Ala Asp Thr Ala Val Tyr Tyr Cys Ala Arg Leu
115 120 125
acc gtt gct gag ttc gac tac tgg ggt caa gga acc ttg gtt acc gtt 432
Thr Val Ala Glu Phe Asp Tyr Trp Gly Gln Gly Thr Leu Val Thr Val
130 135 140
tcc tcc gct tcc acc aag ggt cca tcc gtt ttc cca ttg gct cca tcc 480
Ser Ser Ala Ser Thr Lys Gly Pro Ser Val Phe Pro Leu Ala Pro Ser
145 150 155
tcc aag tcc acc tcc ggt gga acc gct gct ttg ggt tgt ttg gtc aag 528
Ser Lys Ser Thr Ser Gly Gly Thr Ala Ala Leu Gly Cys Leu Val Lys
160 165 170
gac tac ttc cca gag cca gtc acc gtt tcc tgg aac tcc ggt gct ttg 576
Asp Tyr Phe Pro Glu Pro Val Thr Val Ser Trp Asn Ser Gly Ala Leu
175 180 185 190
acc tcc ggt gtt cac acc ttc cca gct gtt ttg caa tcc tcc ggt ttg 624
Thr Ser Gly Val His Thr Phe Pro Ala Val Leu Gln Ser Ser Gly Leu
195 200 205
tac tcc ttg tcc tcc gtc gtt acc gtt cca tcc tcc tcc ttg ggt act 672
Tyr Ser Leu Ser Ser Val Val Thr Val Pro Ser Ser Ser Leu Gly Thr
210 215 220
caa acc tac atc tgc aac gtc aac cac aag cca tcc aac acc aag gtt 720
Gln Thr Tyr Ile Cys Asn Val Asn His Lys Pro Ser Asn Thr Lys Val
225 230 235
gac aag aag gtt gag cca aag tcc tgt gac aag acc cac acc tgt cca 768
Asp Lys Lys Val Glu Pro Lys Ser Cys Asp Lys Thr His Thr Cys Pro
240 245 250
cca tgt cca gct cca gag ttg ttg ggt ggt cct tct gtt ttc ttg ttc 816
Pro Cys Pro Ala Pro Glu Leu Leu Gly Gly Pro Ser Val Phe Leu Phe
255 260 265 270
cca cca aag cca aag gac acc ttg atg atc tcc aga acc cca gag gtt 864
Pro Pro Lys Pro Lys Asp Thr Leu Met Ile Ser Arg Thr Pro Glu Val
275 280 285
acc tgt gtt gtc gtt gac gtt tcc cac gag gac cca gag gtt aag ttc 912
Thr Cys Val Val Val Asp Val Ser His Glu Asp Pro Glu Val Lys Phe
290 295 300
aac tgg tac gtt gac ggt gtt gag gtt cac aac gct aag acc aag cca 960
Asn Trp Tyr Val Asp Gly Val Glu Val His Asn Ala Lys Thr Lys Pro
305 310 315
aga gag gag caa tac aac tcc acc tac aga gtt gtt tcc gtc ttg acc 1008
Arg Glu Glu Gln Tyr Asn Ser Thr Tyr Arg Val Val Ser Val Leu Thr
320 325 330
gtt ttg cac caa gac tgg ttg aac gga aag gag tac aag tgc aag gtt 1056
Val Leu His Gln Asp Trp Leu Asn Gly Lys Glu Tyr Lys Cys Lys Val
335 340 345 350
tcc aac aag gct ttg cca gct cca atc gaa aag acc atc tcc aag gct 1104
Ser Asn Lys Ala Leu Pro Ala Pro Ile Glu Lys Thr Ile Ser Lys Ala
355 360 365
aag ggt caa cca aga gag cca caa gtt tac acc ttg cca cca tcc aga 1152
Lys Gly Gln Pro Arg Glu Pro Gln Val Tyr Thr Leu Pro Pro Ser Arg
370 375 380
gat gag ttg acc aag aac caa gtt tcc ttg acc tgc ttg gtc aag ggt 1200
Asp Glu Leu Thr Lys Asn Gln Val Ser Leu Thr Cys Leu Val Lys Gly
385 390 395
ttc tac cca tcc gac atc gct gtt gag tgg gag tcc aac ggt caa cca 1248
Phe Tyr Pro Ser Asp Ile Ala Val Glu Trp Glu Ser Asn Gly Gln Pro
400 405 410
gag aac aac tac aag acc acc cca cca gtt ttg gac tcc gac ggt tcc 1296
Glu Asn Asn Tyr Lys Thr Thr Pro Pro Val Leu Asp Ser Asp Gly Ser
415 420 425 430
ttc ttc ttg tac tcc aag ttg acc gtt gac aag tcc aga tgg caa caa 1344
Phe Phe Leu Tyr Ser Lys Leu Thr Val Asp Lys Ser Arg Trp Gln Gln
435 440 445
ggt aac gtt ttc tcc tgc tcc gtt atg cac gag gct ttg cac aac cac 1392
Gly Asn Val Phe Ser Cys Ser Val Met His Glu Ala Leu His Asn His
450 455 460
tac acc caa aag tcc ttg tcc ttg tcc cca ggt aag taa ggatcc 1437
Tyr Thr Gln Lys Ser Leu Ser Leu Ser Pro Gly Lys
465 470
<2l0>57
<211>735
<212>DNA
<213>人工序列
<220>
<223>合成核苷酸
<400>57
tctagaatgt tgggtaagaa cgacccaatg tgcttggtct tggtcttgtt gggtttgacc 60
gctttgttgg gtatctgtca aggagagatc gttttgaccc aatccccagc taccttgtcc 120
ttgtccccag gtgagagagc caccttgtcc tgtagagctt cccaatccgt ttcctccttc 180
ttggcttggt accaacaaaa gccaggtcaa gccccaagat tgttgatcta cgacgcttcc 240
aacagagcta ccggtatccc agctagattc tccggttccg gttccggaac cgacttcacc 300
ttgaccatct cctccttgga gccagaggac ttcgctgttt actactgcca acaaagatcc 360
aactggccat tgaccttcgg tccaggtact aaggttgaca tcaagagaac cgttgctgct 420
ccatccgttt tcatcttccc accatccgac gagcaattga agtccggtac tgcttccgtt 480
gtttgcttgt tgaacaactt ctacccaaga gaggctaagg ttcaatggaa ggttgacaac 540
gctttgcaat ccggtaactc ccaagagtcc gttaccgagc aagactccaa ggactccacc 600
tactccttgt cctccacctt gaccttgtcc aaggctgact acgagaagca caaggtttac 660
gcttgtgagg ttacccacca aggtttgtcc tccccagtta ccaagtcctt caacagaggt 720
gagtgctaag gatcc 735
<210>58
<211>735
<212>DNA
<213>人工序列
<220>
<223>合成核苷酸
<220>
<221>CDS
<222>(7)..(729)
<400>58
tctaga atg ttg ggt aag aac gac cca atg tgc ttg gtc ttg gtc ttg 48
Met Leu Gly Lys Asn Asp Pro Met Cys Leu Val Leu Val Leu
1 5 10
ttg ggt ttg acc gct ttg ttg ggt atc tgt caa gga gag atc gtt ttg 96
Leu Gly Leu Thr Ala Leu Leu Gly Ile Cys Gln Gly Glu Ile Val Leu
15 20 25 30
acc caa tcc cca gct acc ttg tcc ttg tcc cca ggt gag aga gcc acc 144
Thr Gln Ser Pro Ala Thr Leu Ser Leu Ser Pro Gly Glu Arg Ala Thr
35 40 45
ttg tcc tgt aga gct tcc caa tcc gtt tcc tcc ttc ttg gct tgg tac 192
Leu Ser Cys Arg Ala Ser Gln Ser Val Ser Ser Phe Leu Ala Trp Tyr
50 55 60
caa caa aag cca ggt caa gcc cca aga ttg ttg atc tac gac gct tcc 240
Gln Gln Lys Pro Gly Gln Ala Pro Arg Leu Leu Ile Tyr Asp Ala Ser
65 70 75
aac aga gct acc ggt atc cca gct aga ttc tcc ggt tcc ggt tcc gga 288
Asn Arg Ala Thr Gly Ile Pro Ala Arg Phe Ser Gly Ser Gly Ser Gly
80 85 90
acc gac ttc acc ttg acc atc tcc tcc ttg gag cca gag gac ttc gct 336
Thr Asp Phe Thr Leu Thr Ile Ser Ser Leu Glu Pro Glu Asp Phe Ala
95 100 105 110
gtt tac tac tgc caa caa aga tcc aac tgg cca ttg acc ttc ggt cca 384
Val Tyr Tyr Cys Gln Gln Arg Ser Asn Trp Pro Leu Thr Phe Gly Pro
115 120 125
ggt act aag gtt gac atc aag aga acc gtt gct gct cca tcc gtt ttc 432
Gly Thr Lys Val Asp Ile Lys Arg Thr Val Ala Ala Pro Ser Val Phe
130 135 140
atc ttc cca cca tcc gac gag caa ttg aag tcc ggt act gct tcc gtt 480
Ile Phe Pro Pro Ser Asp Glu Gln Leu Lys Ser Gly Thr Ala Ser Val
145 150 155
gtt tgc ttg ttg aac aac ttc tac cca aga gag gct aag gtt caa tgg 528
Val Cys Leu Leu Asn Asn Phe Tyr Pro Arg Glu Ala Lys Val Gln Trp
160 165 170
aag gtt gac aac gct ttg caa tcc ggt aac tcc caa gag tcc gtt acc 576
Lys Val Asp Asn Ala Leu Gln Ser Gly Asn Ser Gln Glu Ser Val Thr
175 180 185 190
gag caa gac tcc aag gac tcc acc tac tcc ttg tcc tcc acc ttg acc 624
Glu Gln Asp Ser Lys Asp Ser Thr Tyr Ser Leu Ser Ser Thr Leu Thr
195 200 205
ttg tcc aag gct gac tac gag aag cac aag gtt tac gct tgt gag gtt 672
Leu Ser Lys Ala Asp Tyr Glu Lys His Lys Val Tyr Ala Cys Glu Val
210 215 220
acc cac caa ggt ttg tcc tcc cca gtt acc aag tcc ttc aac aga ggt 720
Thr His Gln Gly Leu Ser Ser Pro Val Thr Lys Ser Phe Asn Arg Gly
225 230 235
gag tgc taa ggatcc 735
Glu Cys
240
<210>59
<211>37
<212>DNA
<213>人工序列
<220>
<223>引物
<400>59
atagaactag caactagatg aaaaagcctg aactcac 37
<210>60
<211>36
<212>DNA
<213>人工序列
<220>
<223>引物
<400>60
caaatcccac ggatcactat tcctttgccc tcggac 36
<210>61
<211>38
<212>DNA
<213>人工序列
<220>
<223>引物
<400>61
aattcgagct cggtacaggg atacatggga taccaaag 38
<210>62
<211>38
<212>DNA
<213>人工序列
<220>
<223>引物
<400>62
gaggatcccc gggtaccagg gtcgattttc ttggtcga 38
<210>63
<211>29
<212>DNA
<213>人工序列
<220>
<223>引物
<400>63
atgcccgtag attcttctca taagacagc 29
<210>64
<211>30
<212>DNA
<213>人工序列
<220>
<223>引物
<400>64
caaagtcatt taaatcaaat gcattagcgg 30
<210>65
<211>1220
<212>DNA
<213>巴斯德毕赤氏酵母
<400>65
atgcccgtag attcttctca taagacagct agcccacttc cacctcgtaa aagagcaaag 60
acggaagaag aaaaggagca gcgtcgagtg gaacgtatcc tacgtaatag gagagcggcc 120
catgcttcca gagagaagaa acgaagacac gttgaatttc tggaaaacca cgtcgtcgac 180
ctggaatctg cacttcaaga atcagccaaa gccactaaca agttgaaaga aatacaagat 240
atcattgttt caaggttgga agccttaggt ggtaccgtct cagatttgga tttaacagtt 300
ccggaagtcg attttcccaa atcttctgat ttggaaccca tgtctgatct ctcaacttct 360
tcgaaatcgg agaaagcatc tacatccact cgcagatctt tgactgagga tctggacgaa 420
gatgacgtcg ctgaatatga cgacgaagaa gaggacgaag agttacccag gaaaatgaaa 480
gtcttaaacg acaaaaacaa gagcacatct atcaagcagg agaagttgaa tgaacttcca 540
tctcctttgt catccgattt ttcagacgta gatgaagaaa agtcaactct cacacattta 600
aagttgcaac agcaacaaca acaaccagta gacaattatg tttctactcc tttgagtctt 660
ccggaggatt cagttgattt tattaaccca ggtaacttaa aaatagagtc cgatgagaac 720
ttcttgttga gttcaaatac tttacaaata aaacacgaaa atgacaccga ctacattact 780
acagctccat caggttccat caatgatttt tttaattctt atgacattag cgagtcgaat 840
cggttgcatc atccagcagt gatgacggat tcatctttac acattacagc aggctccatc 900
ggctttttct ctttgattgg ggggggggaa agttctgtag cagggaggcg cagttcagtt 960
ggcacatatc agttgacatg catagcgatc aggtgattgc tcttgttaac tggtatgcca 1020
agtcaaccgt tttcggcgta cctactactc tactttaact cttgaattga gatgaaacaa 1080
tcgcccttgt tcgagacgcg tagttaattt aagatgaatc aatttgcaac aaaagaacaa 1140
acgaaaaaga taacagcaaa cttaagtttc gtggtctgca gcaccattta ccgctaatgc 1200
atttgattta aatgactttg 1220
<210>66
<211>898
<212>DNA
<213>巴斯德毕赤氏酵母
<400>66
atgcccgtag attcttctca taagacagct agcccacttc cacctcgtaa aagagcaaag 60
acggaagaag aaaaggagca gcgtcgagtg gaacgtatcc tacgtaatag gagagcggcc 120
catgcttcca gagagaagaa acgaagacac gttgaatttc tggaaaacca cgtcgtcgac 180
ctggaatctg cacttcaaga atcagccaaa gccactaaca agttgaaaga aatacaagat 240
atcattgttt caaggttgga agccttaggt ggtaccgtct cagatttgga tttaacagtt 300
ccggaagtcg attttcccaa atcttctgat ttggaaccca tgtctgatct ctcaacttct 360
tcgaaatcgg agaaagcatc tacatccact cgcagatctt tgactgagga tctggacgaa 420
gatgacgtcg ctgaatatga cgacgaagaa gaggacgaag agttacccag gaaaatgaaa 480
gtcttaaacg acaaaaacaa gagcacatct atcaagcagg agaagttgaa tgaacttcca 540
tctcctttgt catccgattt ttcagacgta gatgaagaaa agtcaactct cacacattta 600
aagttgcaac agcaacaaca acaaccagta gacaattatg tttctactcc tttgagtctt 660
ccggaggatt cagttgattt tattaaccca ggtaacttaa aaatagagtc cgatgagaac 720
ttcttgttga gttcaaatac tttacaaata aaacacgaaa atgacaccga ctacattact 780
acagctccat caggttccat caatgatttt tttaattctt atgacattag cgagtcgaat 840
cggttgcatc atccagcagc accatttacc gctaatgcat ttgatttaaa tgactttg 898
<210>67
<211>29
<212>DNA
<213>人工序列
<220>
<223>引物
<400>67
gactagtatg cccgtagatt cttctcata 29
<210>68
<211>30
<212>DNA
<213>人工序列
<220>
<223>引物
<400>68
cagatctcta ttcctggaag aatacaaagt 30
<210>69
<211>915
<212>DNA
<213>巴斯德毕赤氏酵母
<400>69
atgcccgtag attcttctca taagacagct agcccacttc cacctcgtaa aagagcaaag 60
acggaagaag aaaaggagca gcgtcgagtg gaacgtatcc tacgtaatag gagagcggcc 120
catgcttcca gagagaagaa acgaagacac gttgaatttc tggaaaacca cgtcgtcgac 180
ctggaatctg cacttcaaga atcagccaaa gccactaaca agttgaaaga aatacaagat 240
atcattgttt caaggttgga agccttaggt ggtaccgtct cagatttgga tttaacagtt 300
ccggaagtcg attttcccaa atcttctgat ttggaaccca tgtctgatct ctcaacttct 360
tcgaaatcgg agaaagcatc tacatccact cgcagatctt tgactgagga tctggacgaa 420
gatgacgtcg ctgaatatga cgacgaagaa gaggacgaag agttacccag gaaaatgaaa 480
gtcttaaacg acaaaaacaa gagcacatct atcaagcagg agaagttgaa tgaacttcca 540
tctcctttgt catccgattt ttcagacgta gatgaagaaa agtcaactct cacacattta 600
aagttgcaac agcaacaaca acaaccagta gacaattatg tttctactcc tttgagtctt 660
ccggaggatt cagttgattt tattaaccca ggtaacttaa aaatagagtc cgatgagaac 720
ttcttgttga gttcaaatac tttacaaata aaacacgaaa atgacaccga ctacattact 780
acagctccat caggttccat caatgatttt tttaattctt atgacattag cgagtcgaat 840
cggttgcatc atccagcagc accatttacc gctaatgcat ttgatttaaa tgactttgta 900
ttcttccagg aatag 915
<210>70
<211>304
<212>PRT
<213>巴斯德毕赤氏酵母
<400>70
Met Pro Val Asp Ser Ser His Lys Thr Ala Ser Pro Leu Pro Pro Arg
1 5 10 15
Lys Arg Ala Lys Thr Glu Glu Glu Lys Glu Gln Arg Arg Val Glu Arg
20 25 30
Ile Leu Arg Asn Arg Arg Ala Ala His Ala Ser Arg Glu Lys Lys Arg
35 40 45
Arg His Val Glu Phe Leu Glu Asn His Val Val Asp Leu Glu Ser Ala
50 55 60
Leu Gln Glu Ser Ala Lys Ala Thr Asn Lys Leu Lys Glu Ile Gln Asp
65 70 75 80
Ile Ile Val Ser Arg Leu Glu Ala Leu Gly Gly Thr Val Ser Asp Leu
85 90 95
Asp Leu Thr Val Pro Glu Val Asp Phe Pro Lys Ser Ser Asp Leu Glu
100 105 110
Pro Met Ser Asp Leu Ser Thr Ser Ser Lys Ser Glu Lys Ala Ser Thr
115 120 125
Ser Thr Arg Arg Ser Leu Thr Glu Asp Leu Asp Glu Asp Asp Val Ala
130 135 140
Glu Tyr Asp Asp Glu Glu Glu Asp Glu Glu Leu Pro Arg Lys Met Lys
145 150 155 160
Val Leu Asn Asp Lys Asn Lys Ser Thr Ser Ile Lys Gln Glu Lys Leu
165 170 175
Asn Glu Leu Pro Ser Pro Leu Ser Ser Asp Phe Ser Asp Val Asp Glu
180 185 190
Glu Lys Ser Thr Leu Thr His Leu Lys Leu Gln Gln Gln Gln Gln Gln
195 200 205
Pro Val Asp Asn Tyr Val Ser Thr Pro Leu Ser Leu Pro Glu Asp Ser
210 215 220
Val Asp Phe Ile Asn Pro Gly Asn Leu Lys Ile Glu Ser Asp Glu Asn
225 230 235 240
Phe Leu Leu Ser Ser Asn Thr Leu Gln Ile Lys His Glu Asn Asp Thr
245 250 255
Asp Tyr Ile Thr Thr Ala Pro Ser Gly Ser Ile Asn Asp Phe Phe Asn
260 265 270
Ser Tyr Asp Ile Ser Glu Ser Asn Arg Leu His His Pro Ala Ala Pro
275 280 285
Phe Thr Ala Asn Ala Phe Asp Leu Asn Asp Phe Val Phe Phe Gln Glu
290 295 300
<210>71
<211>30
<212>DNA
<213>人工序列
<220>
<223>引物
<400>71
gtctagaatg gaaatgactg attttgaact 30
<210>72
<211>30
<212>DNA
<213>人工序列
<220>
<223>引物
<400>72
cggatcctca tgaagtgatg aagaaatcat 30
<210>73
<211>30
<212>DNA
<213>人工序列
<220>
<223>引物
<400>73
atggcgggca aaaatcagaa atctagcgcg 30
<210>74
<211>30
<212>DNA
<213>人工序列
<220>
<223>引物
<400>74
ttacaactcg tctttgacta gaggcgggga 30
<210>75
<211>2520
<212>DNA
<213>0gataea minuta
<400>75
atggcgggca aaaatcagaa atctagcgcg accaccgctc agtcgttgag gggcgacacc 60
acaacagaac tcgtgttgca aaaggggaagt tgaggacct atatcaaaac agagttgtca 120
gaggacacat tgagccacag ggtactgaac acgacgagcg agaagttgtt gttggtgttg 180
ctgacagttt ttgctgccgt gattcgtttc cgcagtctca gcttccctga ctcagtggta 240
tttgacgagg ttcactttgg aggatttgcc agaaaataca tcctgggaaa cttcttcatg 300
gatgttcatc cgccattggc caaactgtta tttgctgcgg ttggatacct aggcggattc 360
aagggtgatt ttgagtttgc gtctattggt gacaagttcc cgacctctgt tccatatgtt 420
ctgatgagag aaatgagtgc gctcctcagt gttggaacag tggttctcat gtacttaacc 480
ttgcgggcct cgggctgcaa gccaatcgtc tcgtttctca ccgcctcttt gctggtggtc 540
gagagtgcca atgtgaccat ctccagatac attctgctgg actctccttt gatctttttc 600
attgctggct cagtctactc cttgaagaag gtccagatct acaaaccata ctcgttcgag 660
tggatcaaat ccctgtttgc aacaggagtt tgcctgggac ttgcgttctc gtccaaatgg 720
gttggtctat tcactgtggc ctgggtcggt gcctgcagcg tgatcagtct gtggtttcag 780
attggcgatc tgtccgtcaa gcccaagtca attgttaccc aggcggtcgc caaggtgtcc 840
gttttgctcg gagtccctgc cattttgtac ttggttttct tctacctcca cctctcgttc 900
ctcaaccacg agggagacgg tgctgccttc ctctcttctg ccttcagagt gtccttcgac 960
gacactaatg tccctgtgtc caccttggca gacgttggag ttggctcggt cgtcactatc 1020
agacatctca acaccaacgg aggctacttg cactcccaca accatttgta tgaaggagga 1080
tcgggacaac agcaaatcac tctgtaccca catctggacg agaacaataa atggaagatt 1140
gagctctaca acgttactga ggaacctacc gaatttgagc caattacaga cggaacaaag 1200
atcagattga aacacacatt cacctccaga agattgcatt cccacgacgt gagaccggca 1260
gtcagcgaga tagactggca aaatgaggct tcctgctacg ggtacgagga ctttgaagga 1320
gatgccaacg acgatttcgt tgttgagatt gtggacagtt tgtctgctcc tggcgactcc 1380
agaacacaag tgaaagccat ccataccgtg ttcagattga ggcacgcaat gaccggttgt 1440
tatctgttct cccacgagac caagttgcca aaatggggat ttgaacaaca ggaggtcaca 1500
tgtgccaccc aaggtatcaa acctctctcc tactggtacg tggagcaaaa tgagaaccca 1560
ttccttgatg cggaaaccgc tgaaatcgcc gcttatccgc agctcacttt ccttcaaaaa 1620
ttcactgaat tgcacaagag gatgtggaaa atcaacaaga gtctgaacgc tccacacact 1680
tacgagtcga gaccagagtc ctggcctgtt ctgtccagag gtatttctta ctggagagat 1740
ggagacagac aggtctattt gcttggaaac ccaattgtgt ggtggctagc ctcttttatc 1800
ttccttccgt tcggcttcta cgttatcgct cagcttttga gatggcaatt gggtgctgac 1860
ttgggggata actcggctgt tttcaattac agtatcacca catttgagtt ccttttggga 1920
tggttcattc attactatcc atccttcctc atggagagac agctcttttt gcaccactac 1980
atcccagccc tctactttgg tattttggca ttgggacaaa cgttcgaggt gctgtactct 2040
cacgtcctca aaggcaagaa attcctctcg atggccctct tcggcttgct cttcgccagc 2100
gcaggataca tgtttgttca gagatcctcc atcatctacg gatccgcctg ggacaaacag 2160
agctgtgagg cttccaagct gctttcaagc tgggactatg attgcagcat ctacccagag 2220
actttgtttg cttcttccgc atcaattgcg gagccaaagc agactcaggc gccaaagatc 2280
aactttgacg aggcattgaa cgtggacctg gaacccggct acgacaattc acagtttgtt 2340
gagagcattt atgaaacgtc taacgacgaa aaaaaccaag cagagaacgt tgttcaagag 2400
acccctcgtg acaacggcgc cgactccgtt tccagcgacg attcaacagt cggtgaggcc 2460
gtccctgacg atctcaagac aaatggagag tccccgcctc tagtcaaaga cgagttgtaa 2520
<210>76
<211>839
<212>PRT
<213>Ogataea minuta
<400>76
Met Ala Gly Lys Asn Gln Lys Ser Ser Ala Thr Thr Ala Gln Ser Leu
1 5 10 15
Arg Gly Asp Thr Thr Thr Glu Leu Val Leu Gln Lys Gly Lys Leu Arg
20 25 30
Thr Tyr Ile Lys Thr Glu Leu Ser Glu Asp Thr Leu Ser His Arg Val
35 40 45
Leu Asn Thr Thr Ser Glu Lys Leu Leu Leu Val Leu Leu Thr Val Phe
50 55 60
Ala Ala Val Ile Arg Phe Arg Ser Leu Ser Phe Pro Asp Ser Val Val
65 70 75 80
Phe Asp Glu Val His Phe Gly Gly Phe Ala Arg Lys Tyr Ile Leu Gly
85 90 95
Asn Phe Phe Met Asp Val His Pro Pro Leu Ala Lys Leu Leu Phe Ala
100 105 110
Ala Val Gly Tyr Leu Gly Gly Phe Lys Gly Asp Phe Glu Phe Ala Ser
115 120 125
Ile Gly Asp Lys Phe Pro Thr Ser Val Pro Tyr Val Leu Met Arg Glu
130 135 140
Met Ser Ala Leu Leu Ser Val Gly Thr Val Val Leu Met Tyr Leu Thr
145 150 155 160
Leu Arg Ala Ser Gly Cys Lys Pro Ile Val Ser Phe Leu Thr Ala Ser
165 170 175
Leu Leu Val Val Glu Ser Ala Asn Val Thr Ile Ser Arg Tyr Ile Leu
180 185 190
Leu Asp Ser Pro Leu Ile Phe Phe Ile Ala Gly Ser Val Tyr Ser Leu
195 200 205
Lys Lys Val Gln Ile Tyr Lys Pro Tyr Ser Phe Glu Trp Ile Lys Ser
210 215 220
Leu Phe Ala Thr Gly Val Cys Leu Gly Leu Ala Phe Ser Ser Lys Trp
225 230 235 240
Val Gly Leu Phe Thr Val Ala Trp Val Gly Ala Cys Ser Val Ile Ser
245 250 255
Leu Trp Phe Gln Ile Gly Asp Leu Ser Val Lys Pro Lys Ser Ile Val
260 265 270
Thr Gln Ala Val Ala Lys Val Ser Val Leu Leu Gly Val Pro Ala Ile
275 280 285
Leu Tyr Leu Val Phe Phe Tyr Leu His Leu Ser Phe Leu Asn His Glu
290 295 300
Gly Asp Gly Ala Ala Phe Leu Ser Ser Ala Phe Arg Val Ser Phe Asp
305 310 315 320
Asp Thr Asn Val Pro Val Ser Thr Leu Ala Asp Val Gly Val Gly Ser
325 330 335
Val Val Thr Ile Arg His Leu Asn Thr Asn Gly Gly Tyr Leu His Ser
340 345 350
His Asn His Leu Tyr Glu Gly Gly Ser Gly Gln Gln Gln Ile Thr Leu
355 360 365
Tyr Pro His Leu Asp Glu Asn Asn Lys Trp Lys Ile Glu Leu Tyr Asn
370 375 380
Val Thr Glu Glu Pro Thr Glu Phe Glu Pro Ile Thr Asp Gly Thr Lys
385 390 395 400
Ile Arg Leu Lys His Thr Phe Thr Ser Arg Arg Leu His Ser His Asp
405 410 415
Val Arg Pro Ala Val Ser Glu Ile Asp Trp Gln Asn Glu Ala Ser Cys
420 425 430
Tyr Gly Tyr Glu Asp Phe Glu Gly Asp Ala Asn Asp Asp Phe Val Val
435 440 445
Glu Ile Val Asp Ser Leu Ser Ala Pro Gly Asp Ser Arg Thr Gln Val
450 455 460
Lys Ala Ile His Thr Val Phe Arg Leu Arg His Ala Met Thr Gly Cys
465 470 475 480
Tyr Leu Phe Ser His Glu Thr Lys Leu Pro Lys Trp Gly Phe Glu Gln
485 490 495
Gln Glu Val Thr Cys Ala Thr Gln Gly Ile Lys Pro Leu Ser Tyr Trp
500 505 510
Tyr Val Glu Gln Asn Glu Asn Pro Phe Leu Asp Ala Glu Thr Ala Glu
515 520 525
Ile Ala Ala Tyr Pro Gln Leu Thr Phe Leu Gln Lys Phe Thr Glu Leu
530 535 540
His Lys Arg Met Trp Lys Ile Asn Lys Ser Leu Asn Ala Pro His Thr
545 550 555 560
Tyr Glu Ser Arg Pro Glu Ser Trp Pro Val Leu Ser Arg Gly Ile Ser
565 570 575
Tyr Trp Arg Asp Gly Asp Arg Gln Val Tyr Leu Leu Gly Asn Pro Ile
580 585 590
Val Trp Trp Leu Ala Ser Phe Ile Phe Leu Pro Phe Gly Phe Tyr Val
595 600 605
Ile Ala Gln Leu Leu Arg Trp Gln Leu Gly Ala Asp Leu Gly Asp Asn
610 615 620
Ser Ala Val Phe Asn Tyr Ser Ile Thr Thr Phe Glu Phe Leu Leu Gly
625 630 635 640
Trp Phe Ile His Tyr Tyr Pro Ser Phe Leu Met Glu Arg Gln Leu Phe
645 650 655
Leu His His Tyr Ile Pro Ala Leu Tyr Phe Gly Ile Leu Ala Leu Gly
660 665 670
Gln Thr Phe Glu Val Leu Tyr Ser His Val Leu Lys Gly Lys Lys Phe
675 680 685
Leu Ser Met Ala Leu Phe Gly Leu Leu Phe Ala Ser Ala Gly Tyr Met
690 695 700
Phe Val Gln Arg Ser Ser Ile Ile Tyr Gly Ser Ala Trp Asp Lys Gln
705 710 715 720
Ser Cys Glu Ala Ser Lys Leu Leu Ser Ser Trp Asp Tyr Asp Cys Ser
725 730 735
Ile Tyr Pro Glu Thr Leu Phe Ala Ser Ser Ala Ser Ile Ala Glu Pro
740 745 750
Lys Gln Thr Gln Ala Pro Lys Ile Asn Phe Asp Glu Ala Leu Asn Val
755 760 765
Asp Leu Glu Pro Gly Tyr Asp Asn Ser Gln Phe Val Glu Ser Ile Tyr
770 775 780
Glu Thr Ser Asn Asp Glu Lys Asn Gln Ala Glu Asn Val Val Gln Glu
785 790 795 800
Thr Pro Arg Asp Asn Gly Ala Asp Ser Val Ser Ser Asp Asp Ser Thr
805 810 815
Val Gly Glu Ala Val Pro Asp Asp Leu Lys Thr Asn Gly Glu Ser Pro
820 825 830
Pro Leu Val Lys Asp Glu Leu
835
<210>77
<211>30
<212>DNA
<213>人工序列
<220>
<223>引物
<400>77
atgggcgaac gtacgggcaa aagtgcgctc 30
<210>78
<211>30
<212>DNA
<213>人工序列
<220>
<223>引物
<400>78
ctaatcggaa attctccacg tgctcaagag 30
<210>79
<211>30
<212>DNA
<213>人工序列
<220>
<223>引物
<400>79
atggggccca aaataaagac cggcaagaaa 30
<210>80
<211>30
<212>DNA
<213>人工序列
<220>
<223>引物
<400>80
ctatttagca aaatgcagtt tgatgttgag 30
<210>81
<211>30
<212>DNA
<213>人工序列
<220>
<223>引物
<400>81
atggacgaga aaaacatctc tggcttagaa 30
<210>82
<211>30
<212>DNA
<213>人工序列
<220>
<223>引物
<400>82
ctactcacta tagacggagc agtcgatcga 30
<210>83
<211>30
<212>DNA
<213>人工序列
<220>
<223>引物
<400>83
atgtccgagt cagagctgag aaaccgcaaa 30
<210>84
<211>30
<212>DNA
<213>人工序列
<220>
<223>引物
<400>84
ctaagctata cgccaggtgg aaacccagtt 30
<210>85
<211>2259
<212>DNA
<213>Ogataea minuta
<400>85
atgggcgaac gtacgggcaa aagtgcgctc gaaaaggaac ccttgttgga aaacgatgag 60
tttacagaag atgaagtgaa ggcgaaacta gttgaattgg ccaccaagcc agagccggag 120
tccgaaatta cctctgtttg tcagtggtgg ttccgcaccg agacctggct ggcgccaatc 180
ttgttcactc ttctttcttt ctttgtcaga atgtacaaaa tcggaatcaa tcctcacgtt 240
gtttgggatg aagcccattt cggtaagttt ggatcctact atttgagaca cgaattttac 300
cacgatgtcc accctcctct tggaaaaatg cttgttggtc tctcaggata ccttgctgga 360
tacaatggtt cgtgggactt cccatctggc caggaatacc cggactacat tgactttgtc 420
aaaatgagat tattcaacgc gactttcagt gctctttgtg ttccaatcgc ctacttcacc 480
atgaaagaat ttggcttcaa cagaaaaacg acatggctct tcactttgat ggtgactttg 540
gaaacttcgt acactacgct tgccagattc attctgctgg actcgatgct tcttcttttt 600
accgtggcta ccgtgttctg tttcgccaga ttccacaacc aaaacagagt tgaatcaaac 660
tccttctcga gaaaatggtg gaaatggatt ttgttgactg gtatcaacat cggatgcacc 720
tgttcggtga aaatggttgg tcttttcgtc accaccttgg ttggtatcta cacggttgtc 780
gatctgtgga ctaagttcgg ccagctgagg aagaccatct ctgtaaagag atacattttc 840
cactgggcca ccagaatctt tgctctcatt atcattccat ttgctgtttt tttgatctct 900
ttcaaagtcc acttcgacct gcttttcgga tccggtccag gagacgcgaa catgtcctcg 960
ttgttccagg ccaacctggt tggatccacc ctcatttccg ggccaagaga cgtcatgact 1020
ctcaactctg tcgtgactct caaaagtcag ggattgaccg gtggtttgct ccattcccac 1080
gtgcagacct atcccgaagg ctcgaaccaa cagcaagtga ccacttactc gcacaaagat 1140
gcgaacaacg actggacttt tgagctggtc agagaagacg tcagaaactc cttcaccgaa 1200
cctcactacg tcgttgacgg aatggccgtc agacttgttc acaaatctac gggaagaaac 1260
ttgcacaccc acgagatccc tgctccagtg tccagttccc aatacgaagt ctccggttac 1320
ggtaacttga ccgttggcga ccgcaaagac aactggattg tggagattgc tgaccaatac 1380
ggcgacgagg acaagatcag attgcatccg ctgacctctt cattcagact cagatcggag 1440
ttgatgggtt gttacttggc cacaaccggt gtctctctgc cacagtgggg attcagacaa 1500
ggagaggttg tctgtatgca ctcgccattc aagagggaca agagaacatg gtggaacatt 1560
gaaaaccacg agaatccaga actgccaaac ccaccagaag acttcaaatt gccaaaaaca 1620
tctttcatca aggactttgt ccagctcaac atcgccatga tggccaccaa caacgcactg 1680
gtcccagatc cggaaaaaca ggacgatttg gcttctaaat tctggcaatg gccttcgttg 1740
aacgtcggta tcagactctg tggttgggga gacgacaatg tcaagtactt cttgattggt 1800
tctccggcca ctacttggac ctcgtcggtt tccatcgtgg tgtttgttgc aatggttgcc 1860
ttctacctgg tcagatggca gagacagatc gaggatttcc catccgactc gaagacacac 1920
tacaagagcg acaaactcaa cctgttcttg atgggaggag tctatccgtt cctgggttgg 1980
ttcctgcatt acatgccgtt ctgtatcatg ggcagagtca cttacgttca ccattacctc 2040
cctgcattgt actttgctat gattgtgatg tgctacactg ttcagtcctt cacgtccttc 2100
gccaacaaca aatacctcac cgctgttgtc tacttgtctc tctatgcact tgtgattggg 2160
ttctttgtgt ttttgcttcc tgtttcgttc ggtatggacg gtccgaacgc agacttcaag 2220
tatctcagcc tcttgagcac gtggagaatt tccgattag 2259
<210>86
<211>752
<212>PRT
<213>Ogataea minuta
<400>86
Met Gly Glu Arg Thr Gly Lys Ser Ala Leu Glu Lys Glu Pro Leu Leu
1 5 10 15
Glu Asn Asp Glu Phe Thr Glu Asp Glu Val Lys Ala Lys Leu Val Glu
20 25 30
Leu Ala Thr Lys Pro Glu Pro Glu Ser Glu Ile Thr Ser Val Cys Gln
35 40 45
Trp Trp Phe Arg Thr Glu Thr Trp Leu Ala Pro Ile Leu Phe Thr Leu
50 55 60
Leu Ser Phe Phe Val Arg Met Tyr Lys Ile Gly Ile Asn Pro His Val
65 70 75 80
Val Trp Asp Glu Ala His Phe Gly Lys Phe Gly Ser Tyr Tyr Leu Arg
85 90 95
His Glu Phe Tyr His Asp Val His Pro Pro Leu Gly Lys Met Leu Val
100 105 110
Gly Leu Ser Gly Tyr Leu Ala Gly Tyr Asn Gly Ser Trp Asp Phe Pro
115 120 125
Ser Gly Gln Glu Tyr Pro Asp Tyr Ile Asp Phe Val Lys Met Arg Leu
130 135 140
Phe Asn Ala Thr Phe Ser Ala Leu Cys Val Pro Ile Ala Tyr Phe Thr
145 150 155 160
Met Lys Glu Phe Gly Phe Asn Arg Lys Thr Thr Trp Leu Phe Thr Leu
165 170 175
Met Val Thr Leu Glu Thr Ser Tyr Thr Thr Leu Ala Arg Phe Ile Leu
180 185 190
Leu Asp Ser Met Leu Leu Leu Phe Thr Val Ala Thr Val Phe Cys Phe
195 200 205
Ala Arg Phe His Asn Gln Asn Arg Val Glu Ser Asn Ser Phe Ser Arg
210 215 220
Lys Trp Trp Lys Trp Ile Leu Leu Thr Gly Ile Asn Ile Gly Cys Thr
225 230 235 240
Cys Ser Val Lys Met Val Gly Leu Phe Val Thr Thr Leu Val Gly Ile
245 250 255
Tyr Thr Val Val Asp Leu Trp Thr Lys Phe Gly Gln Leu Arg Lys Thr
260 265 270
Ile Ser Val Lys Arg Tyr Ile Phe His Trp Ala Thr Arg Ile Phe Ala
275 280 285
Leu Ile Ile Ile Pro Phe Ala Val Phe Leu Ile Ser Phe Lys Val His
290 295 300
Phe Asp Leu Leu Phe Gly Ser Gly Pro Gly Asp Ala Asn Met Ser Ser
305 310 315 320
Leu Phe Gln Ala Asn Leu Val Gly Ser Thr Leu Ile Ser Gly Pro Arg
325 330 335
Asp Val Met Thr Leu Asn Ser Val Val Thr Leu Lys Ser Gln Gly Leu
340 345 350
Thr Gly Gly Leu Leu His Ser His Val Gln Thr Tyr Pro Glu Gly Ser
355 360 365
Asn Gln Gln Gln Val Thr Thr Tyr Ser His Lys Asp Ala Asn Asn Asp
370 375 380
Trp Thr Phe Glu Leu Val Arg Glu Asp Val Arg Asn Ser Phe Thr Glu
385 390 395 400
Pro His Tyr Val Val Asp Gly Met Ala Val Arg Leu Val His Lys Ser
405 410 415
Thr Gly Arg Asn Leu His Thr His Glu Ile Pro Ala Pro Val Ser Ser
420 425 430
Ser Gln Tyr Glu Val Ser Gly Tyr Gly Asn Leu Thr Val Gly Asp Arg
435 440 445
Lys Asp Asn Trp Ile Val Glu Ile Ala Asp Gln Tyr Gly Asp Glu Asp
450 455 460
Lys Ile Arg Leu His Pro Leu Thr Ser Ser Phe Arg Leu Arg Ser Glu
465 470 475 480
Leu Met Gly Cys Tyr Leu Ala Thr Thr Gly Val Ser Leu Pro Gln Trp
485 490 495
Gly Phe Arg Gln Gly Glu Val Val Cys Met His Ser Pro Phe Lys Arg
500 505 510
Asp Lys Arg Thr Trp Trp Asn Ile Glu Asn His Glu Asn Pro Glu Leu
515 520 525
Pro Asn Pro Pro Glu Asp Phe Lys Leu Pro Lys Thr Ser Phe Ile Lys
530 535 540
Asp Phe Val Gln Leu Asn Ile Ala Met Met Ala Thr Asn Asn Ala Leu
545 550 555 560
Val Pro Asp Pro Glu Lys Gln Asp Asp Leu Ala Ser Lys Phe Trp Gln
565 570 575
Trp Pro Ser Leu Asn Val Gly Ile Arg Leu Cys Gly Trp Gly Asp Asp
580 585 590
Asn Val Lys Tyr Phe Leu Ile Gly Ser Pro Ala Thr Thr Trp Thr Ser
595 600 605
Ser Val Ser Ile Val Val Phe Val Ala Met Val Ala Phe Tyr Leu Val
610 615 620
Arg Trp Gln Arg Gln Ile Glu Asp Phe Pro Ser Asp Ser Lys Thr His
625 630 635 640
Tyr Lys Ser Asp Lys Leu Asn Leu Phe Leu Met Gly Gly Val Tyr Pro
645 650 655
Phe Leu Gly Trp Phe Leu His Tyr Met Pro Phe Cys Ile Met Gly Arg
660 665 670
Val Thr Tyr Val His His Tyr Leu Pro Ala Leu Tyr Phe Ala Met Ile
675 680 685
Val Met Cys Tyr Thr Val Gln Ser Phe Thr Ser Phe Ala Asn Asn Lys
690 695 700
Tyr Leu Thr Ala Val Val Tyr Leu Ser Leu Tyr Ala Leu Val Ile Gly
705 710 715 720
Phe Phe Val Phe Leu Leu Pro Val Ser Phe Gly Met Asp Gly Pro Asn
725 730 735
Ala Asp Phe Lys Tyr Leu Ser Leu Leu Ser Thr Trp Arg Ile Ser Asp
740 745 750
<210>87
<211>2265
<212>DNA
<213>Ogataea minuta
<400>87
atggggccca aaataaagac cggcaagaaa cccaatgcgg tggaatcagt ggttgttgac 60
aaaaagggga gtgtctcgtt ggagggcaag attgacaccc cagtcaagaa ctcctcgatc 120
gatccctcaa tggagatcta ctacaagctg acgaatacaa tgttgacgct tctggctttg 180
gccactagat tctactacat ctggtacccc aacgaggtgg tgttcgatga agttcacttt 240
ggaaagtttg cctcgtacta cttggagaga acctatttct tcgatctcca ccctccattc 300
gccaagctcc tcattgcctt cgttggctat ctggttggtt tcagtgggaa attcaagttt 360
gacaacatcg gggacagcta tatcacccac tctattccat acatcccgtt gcgtgcgctt 420
tctgctgttc tgggatccct gaccgtgccg ctcatgttct ccacgttgca agagtgtggt 480
tactcaattc caacgtgcgc ttttggtgcc ctgctggttg tgtttgacaa cgctcatgct 540
gccgagacta gattgattct gctcgacgct acgctgatct tctcggttgc agcttctgtg 600
tactgctacg tgagattcac aaagcaaaga caccagcctt ttaccgcaac ctggtacaag 660
tggttggttt tgaccggtgt ctcgttgtcc tgtgtcattt ccaccaaata cgtgggtgtt 720
ttcacctttg cctgcgttgg tgtggctgtg gtttgggact tgtgggagct tttggatatt 780
aagaagggcc tcacaattag agttttggct agacattttg tccacagagc catcggcctc 840
attttgctgc cgttcattat ttacttgggc tggttttaca tccactttgc cattctgacc 900
aaatcgggac cgggagatcc tttcatgagc gcagacttcc aagaaacttt gggagactct 960
cctctcacaa gagaagcaag agaggtcaac taccatgata tcataacggt caaacacaaa 1020
gacactgagt gtttattgca ctcgcatcct ttcaactatc cactacgtta cgatgacgga 1080
agaatttctt cgcaaggcca gcaggtgact tgtatgaaag attacacaga cgttaacaac 1140
tactgggaaa ttcttcctgc taaagcttct gacgaaactg tgaacctcgg tctcgctgtc 1200
aaacaaggag acactttcag attgagacac gttgagacag gcggattttt actcactcat 1260
gacgttgctt ctcccctttt cccgaccaac gaggagttta ctgtcatgag cgctgaagaa 1320
gcggattcta caaggttcaa cgacactttg ttcagatttg atccgttcga caagaggaag 1380
aacgacgtgc tcaagaccaa ggcatccgtg gtcaaagttt tccacgttcc taccattgtc 1440
actatgtgga ctcacgatga tcagctactt ccagaatggg gcttcaacca acaggaggtc 1500
aacggaaaca aaaaggttgc ggactccgat aactactgga ctattgactc tatcattggt 1560
ttgtctggcg aaagagccaa gtacgttcca aaagaagtga aacgtttgcc attccttacc 1620
aaatggaaag agctgcaact cactatgttt gaacaaaaca acaaattgag ttcgagccat 1680
ccatttgcat cccaacctga gtcatggcct ttgtcgttgt ccggtgtctc gttctggact 1740
aagaatgata cccgcgaaca aatctacttc attggaaatc ttttcggctg gtggttagaa 1800
gccggactgc ttctgtgtta cctaggaata ttgctggcag accaactcac gagacgcaga 1860
aatgtgactg ttttgagcac tagagccaga gctaggttgt acaaaaacat cggatttttc 1920
ttctgcggat gggccaccca ctacttccca ttcttcctca tgtcaagaca aaagttcctg 1980
catcattatt tgcctgcgca cctgctggct gcgctgtttt cggcgtcctt gttggaattc 2040
attttcaccg ataacagaca cgaggagctc agggatccaa aagataagtc tgagccagga 2100
aaggtcaact ggatcctata cctgtcgtgc ctgattctgc ttgtgacagt cttagttgga 2160
ttctacgtct tccttgctcc gttgacctac ggaaacgttt cattgacccc tgaagaagtc 2220
atcaagagac aaattctcaa catcaaactg cattttgcta aatag 2265
<210>88
<211>754
<212>PRT
<213>Ogataea minuta
<400>88
Met Gly Pro Lys Ile Lys Thr Gly Lys Lys Pro Asn Ala Val Glu Ser
1 5 10 15
Val Val Val Asp Lys Lys Gly Ser Val Ser Leu Glu Gly Lys Ile Asp
20 25 30
Thr Pro Val Lys Asn Ser Ser Ile Asp Pro Ser Met Glu Ile Tyr Tyr
35 40 45
Lys Leu Thr Asn Thr Met Leu Thr Leu Leu Ala Leu Ala Thr Arg Phe
50 55 60
Tyr Tyr Ile Trp Tyr Pro Asn Glu Val Val Phe Asp Glu Val His Phe
65 70 75 80
Gly Lys Phe Ala Ser Tyr Tyr Leu Glu Arg Thr Tyr Phe Phe Asp Leu
85 90 95
His Pro Pro Phe Ala Lys Leu Leu Ile Ala Phe Val Gly Tyr Leu Val
100 105 110
Gly Phe Ser Gly Lys Phe Lys Phe Asp Asn Ile Gly Asp Ser Tyr Ile
115 120 125
Thr His Ser Ile Pro Tyr Ile Pro Leu Arg Ala Leu Ser Ala Val Leu
130 135 140
Gly Ser Leu Thr Val Pro Leu Met Phe Ser Thr Leu Gln Glu Cys Gly
145 150 155 160
Tyr Ser Ile Pro Thr Cys Ala Phe Gly Ala Leu Leu Val Val Phe Asp
165 170 175
Asn Ala His Ala Ala Glu Thr Arg Leu Ile Leu Leu Asp Ala Thr Leu
180 185 190
Ile Phe Ser Val Ala Ala Ser Val Tyr Cys Tyr Val Arg Phe Thr Lys
195 200 205
Gln Arg His Gln Pro Phe Thr Ala Thr Trp Tyr Lys Trp Leu Val Leu
2l0 215 220
Thr Gly Val Ser Leu Ser Cys Val Ile Ser Thr Lys Tyr Val Gly Val
225 230 235 240
Phe Thr Phe Ala Cys Val Gly Val Ala Val Val Trp Asp Leu Trp Glu
245 250 255
Leu Leu Asp Ile Lys Lys Gly Leu Thr Ile Arg Val Leu Ala Arg His
260 265 270
Phe Val His Arg Ala Ile Gly Leu Ile Leu Leu Pro Phe Ile Ile Tyr
275 280 285
Leu Gly Trp Phe Tyr Ile His Phe Ala Ile Leu Thr Lys Ser Gly Pro
290 295 300
Gly Asp Pro Phe Met Ser Ala Asp Phe Gln Glu Thr Leu Gly Asp Ser
305 310 315 320
Pro Leu Thr Arg Glu Ala Arg Glu Val Asn Tyr His Asp Ile Ile Thr
325 330 335
Val Lys His Lys Asp Thr Glu Cys Leu Leu His Ser His Pro Phe Asn
340 345 350
Tyr Pro Leu Arg Tyr Asp Asp Gly Arg Ile Ser Ser Gln Gly Gln Gln
355 360 365
Val Thr Cys Met Lys Asp Tyr Thr Asp Val Asn Asn Tyr Trp Glu Ile
370 375 380
Leu Pro Ala Lys Ala Ser Asp Glu Thr Val Asn Leu Gly Leu Ala Val
385 390 395 400
Lys Gln Gly Asp Thr Phe Arg Leu Arg His Val Glu Thr Gly Gly Phe
405 410 415
Leu Leu Thr His Asp Val Ala Ser Pro Leu Phe Pro Thr Asn Glu Glu
420 425 430
Phe Thr Val Met Ser Ala Glu Glu Ala Asp Ser Thr Arg Phe Asn Asp
435 440 445
Thr Leu Phe Arg Phe Asp Pro Phe Asp Lys Arg Lys Asn Asp Val Leu
450 455 460
Lys Thr Lys Ala Ser Val Val Lys Val Phe His Val Pro Thr Ile Val
465 470 475 480
Thr Met Trp Thr His Asp Asp Gln Leu Leu Pro Glu Trp Gly Phe Asn
485 490 495
Gln Gln Glu Val Asn Gly Asn Lys Lys Val Ala Asp Ser Asp Asn Tyr
500 505 510
Trp Thr Ile Asp Ser Ile Ile Gly Leu Ser Gly Glu Arg Ala Lys Tyr
515 520 525
Val Pro Lys Glu Val Lys Arg Leu Pro Phe Leu Thr Lys Trp Lys Glu
530 535 540
Leu Gln Leu Thr Met Phe Glu Gln Asn Asn Lys Leu Ser Ser Ser His
545 550 555 560
Pro Phe Ala Ser Gln Pro Glu Ser Trp Pro Leu Ser Leu Ser Gly Val
565 570 575
Ser Phe Trp Thr Lys Asn Asp Thr Arg Glu Gln Ile Tyr Phe Ile Gly
580 585 590
Asn Leu Phe Gly Trp Trp Leu Glu Ala Gly Leu Leu Leu Cys Tyr Leu
595 600 605
Gly Ile Leu Leu Ala Asp Gln Leu Thr Arg Arg Arg Asn Val Thr Val
610 615 620
Leu Ser Thr Arg Ala Arg Ala Arg Leu Tyr Lys Asn Ile Gly Phe Phe
625 630 635 640
Phe Cys Gly Trp Ala Thr His Tyr Phe Pro Phe Phe Leu Met Ser Arg
645 650 655
Gln Lys Phe Leu His His Tyr Leu Pro Ala His Leu Leu Ala Ala Leu
660 665 670
Phe Ser Ala Ser Leu Leu Glu Phe Ile Phe Thr Asp Asn Arg His Glu
675 680 685
Glu Leu Arg Asp Pro Lys Asp Lys Ser Glu Pro Gly Lys Val Asn Trp
690 695 700
Ile Leu Tyr Leu Ser Cys Leu Ile Leu Leu Val Thr Val Leu Val Gly
705 710 715 720
Phe Tyr Val Phe Leu Ala Pro Leu Thr Tyr Gly Asn Val Ser Leu Thr
725 730 735
Pro Glu Glu Val Ile Lys Arg Gln Ile Leu Asn Ile Lys Leu His Phe
740 745 750
Ala Lys
<210>89
<211>2199
<212>DNA
<213>Ogataea minuta
<400>89
atggacgaga aaaacatctc tggcttagaa cgcctaggca ccggcccaga gttcacactc 60
gtgcagggcc cgagacgcaa ctacctccgt ctgccggaaa aggcggggct tccaagccgc 120
actagaaagg agaagctcca ggttctgtgc gtcattctgc tcgcgctcac cacgagactc 180
gtctctctga accatccgtc gtcggtcgtc tacgacgagc taactaccgg aaacatcgtc 240
aacaactacc tccatggaca ctattttgtc gatgcagatc ctccttttgt caaaattcta 300
tacactgctg tcgcccaaat atcgcagtac acgggcgcgt tccaattcca ctctgctggc 360
cagtcgtatc tgaacgaaga cctcgagccg gagttcccat acgtggcact ccgggtgttc 420
agcggcctct gcagcgtggc aaccgttctc ctggcataca aaactctcag agccacggga 480
gtcagacacc tgattgctct gttcggcgcc tttctgattg cactagaagg ctcgatgatt 540
acgcaatcaa gatttttcat gcaaacggct cacgtcgtgt tcttcaccgg cttggccgtt 600
ggaatgtcca aaacgtcaga cctgtttgaa ccctcgagcg caaaatggct caaacacacc 660
gcagcggccg gcctcggcgt ggcgtttcta atttcgtccg cgtggtcggg tcttttcacg 720
gctgtttggt tggttctcgt caccctgaga agagtctggt acctcaccgg cgacgttacg 780
acaaatccaa gaaccacgtt cctcagatac gcgcttcccc gctttgctct tattgttgcg 840
gcgccagtgg ccttctacct gtgggtgttc aaagtgcatc tggacttgct tccagtggct 900
ggtcccggct acccgttcat gtccgcggag ttccagcacg ggctggtcgg cacccatctc 960
aacaacattt ctgccgaagt ctcgtatggc tccacagttt ccattagaca cttgcacacg 1020
gggaagtacc tgcactccga gaacaaaacg taccctaaaa caggacacca gcgggtcacc 1080
acattcggcg accaggactt caacaacctg ttttacgtcg agatgagggt caagtccgaa 1140
cgcggcgagc tcgcacggaa agtcaaagct gtcgagagcg gcagacaaat acgtcttttc 1200
cacaatgcca cccagaagta cctgtttatc gacccggaca acaagcctcc tctctccgag 1260
acagactata acaaggaagt gagcacgttt ggaaacgctt cctgggtggg cgagaactac 1320
ctcaacttcg agcttctgct tgccccgggc ttctccaaga ccgaggtggg caagaaaaga 1380
gtgcgggccg tcgagtctgt cttccagctg tacaacgtca agaacaagtg ctatctgctg 1440
gggaccgaga acaggcttcc gagctgggca gacggggaaa acgaggtcgt ttgcatcgag 1500
aaacctattt tcgaaagatc gttgtggtac tttgaaacca atctccacga caagttcacc 1560
cccgcacggg cccaggtcgc tttcaggcag cagacgttct gggacaagat tctcgaaatt 1620
cacaaagtca tggcagatct gctcgcacaa aacacccatg acgacgccaa cagcaccgct 1680
cctcgggatt ggttcttctt cagaaaggga atcaggtact gggcagaaag tcaggccatg 1740
gtatatctca ctgggaaccc ggttgtctac tcgttgacgg cgctaggcac tgtgggattc 1800
ttggtgttca aactcggtca tctatgttcg ttcaacccga ataagtcgcc agactactcc 1860
agcgacttcc tcaagttcga ctaccacgct caggaatttc ttctcggata cctgctgaac 1920
tggcttcctc acgcgctttc aaagacaaac acatacgtgt tcgagtacca gccggcgttg 1980
tacttcggtg ttcttctgtc ctgtcagtcg ctagagtacc tggcctccaa gaacctgaag 2040
ctgtgctatg tgtttgcggc cgcggttgca ctgctcacag cagctttctt ccgtttgtcg 2100
gcaccgttga tgtacggact gaagtggcag gagttgtact gcgtcgctgt ttcaacagct 2160
gccagacagt cgatcgactg ctccgtctat agtgagtag 2199
<210>90
<211>732
<212>PRT
<213>Ogataea minuta
<400>90
Met Asp Glu Lys Asn Ile Ser Gly Leu Glu Arg Leu Gly Thr Gly Pro
1 5 10 15
Glu Phe Thr Leu Val Gln Gly Pro Arg Arg Asn Tyr Leu Arg Leu Pro
20 25 30
Glu Lys Ala Gly Leu Pro Ser Arg Thr Arg Lys Glu Lys Leu Gln Val
35 40 45
Leu Cys Val Ile Leu Leu Ala Leu Thr Thr Arg Leu Val Ser Leu Asn
50 55 60
His Pro Ser Ser Val Val Tyr Asp Glu Leu Thr Thr Gly Asn Ile Val
65 70 75 80
Asn Asn Tyr Leu His Gly His Tyr Phe Val Asp Ala Asp Pro Pro Phe
85 90 95
Val Lys Ile Leu Tyr Thr Ala Val Ala Gln Ile Ser Gln Tyr Thr Gly
100 105 110
Ala Phe Gln Phe His Ser Ala Gly Gln Ser Tyr Leu Asn Glu Asp Leu
115 120 125
Glu Pro Glu Phe Pro Tyr Val Ala Leu Arg Val Phe Ser Gly Leu Cys
130 135 140
Ser Val Ala Thr Val Leu Leu Ala Tyr Lys Thr Leu Arg Ala Thr Gly
145 150 155 160
Val Arg His Leu Ile Ala Leu Phe Gly Ala Phe Leu Ile Ala Leu Glu
165 170 175
Gly Ser Met Ile Thr Gln Ser Arg Phe Phe Met Gln Thr Ala His Val
180 185 190
Val Phe Phe Thr Gly Leu Ala Val Gly Met Ser Lys Thr Ser Asp Leu
195 200 205
Phe Glu Pro Ser Ser A la Lys Trp Leu Lys His Thr Ala Ala Ala Gly
210 215 220
Leu Gly Val Ala Phe Leu Ile Ser Ser Ala Trp Ser Gly Leu Phe Thr
225 230 235 240
Ala Val Trp Leu Val Leu Val Thr Leu Arg Arg Val Trp Tyr Leu Thr
245 250 255
Gly Asp Val Thr Thr Asn Pro Arg Thr Thr Phe Leu Arg Tyr Ala Leu
260 265 270
Pro Arg Phe Ala Leu Ile Val Ala Ala Pro Val Ala Phe Tyr Leu Trp
275 280 285
Val Phe Lys Val His Leu Asp Leu Leu Pro Val Ala Gly Pro Gly Tyr
290 295 300
Pro Phe Met Ser Ala Glu Phe Gln His Gly Leu Val Gly Thr His Leu
305 310 315 320
Asn Asn Ile Ser Ala Glu Val Ser Tyr Gly Ser Thr Val Ser Ile Arg
325 330 335
His Leu His Thr Gly Lys Tyr Leu His Ser Glu Asn Lys Thr Tyr Pro
340 345 350
Lys Thr Gly His Gln Arg Val Thr Thr Phe Gly Asp Gln Asp Phe Asn
355 360 365
Asn Leu Phe Tyr Val Glu Met Arg Val Lys Ser Glu Arg Gly Glu Leu
370 375 380
Ala Arg Lys Val Lys Ala Val Glu Ser Gly Arg Gln Ile Arg Leu Phe
385 390 395 400
His Asn Ala Thr Gln Lys Tyr Leu Phe Ile Asp Pro Asp Asn Lys Pro
405 410 415
Pro Leu Ser Glu Thr Asp Tyr Asn Lys Glu Val Ser Thr Phe Gly Asn
420 425 430
Ala Ser Trp Val Gly Glu Asn Tyr Leu Asn Phe Glu Leu Leu Leu Ala
435 440 445
Pro Gly Phe Ser Lys Thr Glu Val Gly Lys Lys Arg Val Arg Ala Val
450 455 460
Glu Ser Val Phe Gln Leu Tyr Asn Val Lys Asn Lys Cys Tyr Leu Leu
465 470 475 480
Gly Thr Glu Asn Arg Leu Pro Ser Trp Ala Asp Gly Glu Asn Glu Val
485 490 495
Val Cys Ile Glu Lys Pro Ile Phe Glu Arg Ser Leu Trp Tyr Phe Glu
500 505 510
Thr Asn Leu His Asp Lys Phe Thr Pro Ala Arg Ala Gln Val Ala Phe
515 520 525
Arg Gln Gln Thr Phe Trp Asp Lys Ile Leu Glu Ile His Lys Val Met
530 535 540
Ala Asp Leu Leu Ala Gln Asn Thr His Asp Asp Ala Asn Ser Thr Ala
545 550 555 560
Pro Arg Asp Trp Phe Phe Phe Arg Lys Gly Ile Arg Tyr Trp Ala Glu
565 570 575
Ser Gln Ala Met Val Tyr Leu Thr Gly Asn Pro Val Val Tyr Ser Leu
580 585 590
Thr Ala Leu Gly Thr Val Gly Phe Leu Val Phe Lys Leu Gly His Leu
595 600 605
Cys Ser Phe Asn Pro Asn Lys Ser Pro Asp Tyr Ser Ser Asp Phe Leu
610 615 620
Lys Phe Asp Tyr His Ala Gln Glu Phe Leu Leu Gly Tyr Leu Leu Asn
625 630 635 640
Trp Leu Pro His Ala Leu Ser Lys Thr Asn Thr Tyr Val Phe Glu Tyr
645 650 655
Gln Pro Ala Leu Tyr Phe Gly Val Leu Leu Ser Cys Gln Ser Leu Glu
660 665 670
Tyr Leu Ala Ser Lys Asn Leu Lys Leu Cys Tyr Val Phe Ala Ala Ala
675 680 685
Val Ala Leu Leu Thr Ala Ala Phe Phe Arg Leu Ser Ala Pro Leu Met
690 695 700
Tyr Gly Leu Lys Trp Gln Glu Leu Tyr Cys Val Ala Val Ser Thr Ala
705 710 715 720
Ala Arg Gln Ser Ile Asp Cys Ser Val Tyr Ser Glu
725 730
<210>91
<211>2241
<212>DNA
<213>Ogataea minuta
<400>91
atgtccgagt cagagctgag aaaccgcaaa gctactctgg gaactgcgtt tcaagatgag 60
tcgactggac cgaaagaaga gagtcacttg gatcaaaaat cgttagccag aagagggtgg 120
gtccaactga tcaccacgta tgttgaacca gtggcaggtc cccttttctt cactgtcctg 180
gctgcgtatc tgagactcta tgatctcaaa gccaacaatc gagtggtctg ggacgaggct 240
cattttggca aatttggagc ccagtacttg agacacgaat tttaccacga cgtccatccg 300
ccgctgggga aaatgctgtg cggactgagc gagtatctgg caggctacaa tggcagttct 360
gagggtttca atttcgagag cggaaaagaa tatccggatc accttgacta tgcctcgatg 420
agatcgttcg ggacttggtt cagcactctg gtcattcctg tctgctattt cacatgcaaa 480
tcgctcaatt tcaacctaca gaccacctat ctagtttcga caatgtgctg tctggagaac 540
tcgtacattg cgctgggaaa gttcatactg ctggactcca tgctgatgtt gttcacgggg 600
actacgtttt tctgtctcgt caaaacccac acgctgcggg cgcaggagtt ctccaccaga 660
tggactcttt ggatgtgtct gaccggagtt tcaactggct gtgtttgctc ggtgaaatgg 720
gtcggtctgt ttgtcacgct acttgttgga gcatacacgg tgctagagct atggctgaaa 780
ttctggtcca aggagttcaa gacagccagg tacttgaaaa gctgggtttt cagagcagtg 840
agtctgatct tcatcccagc tctcgtttat ttgatattct tcaaggtaca tttctcgctc 900
ctgacccgga ccgggacggg agcgggctct ttgtcgtctc tttaccaggc cagcatggag 960
gacgcggaca tcctggatta cccgagaaac gttgctattg gctcgcgcat cactctcaga 1020
tctcaaggcc cctcgcccag tcttttgcac tcgcaccagt ctgtctatcc cgcaggatcg 1080
gaacagtacc aggtgacaac ctacgggttc aaagactcca acaacaactt tctggtgaaa 1140
aaagcccgga cacctttcaa atatggagag ttcgtctcca acggcgacct gattcgactt 1200
cagcacgagc taacccgagg aaacctccat tctcacgcca tcaacggaca tgtttccaag 1260
cagttctggg aggtgagcgg gtacggaaac gaggaaatcg gggacgacaa ggatgattgg 1320
gaggtgatta ttgcggagca gctcaaatct cctaactcga cctattcagc gctgcacgag 1380
tcgtccccag aattctaccg cacggtccac ccgatctcca ctagcttcaa gttgcgccac 1440
aaggttttag gctgctacct ggccaccaca gggcactcgt atccgacatg gggctttaaa 1500
caaggcgagg tgatctgtaa accggcggag tcgctcttga acccgctgga caaatcgacc 1560
tggtggaacg tcgagcttca cgacaacagc ggtctgaaag tagacccagg ctaccaatac 1620
ccccgtcccc ggttcttttg ggactttctc tcgattcaaa tggccatgat ggcctcgaac 1680
aacgctttgg ttccagaccc gcacaaacag gacgatatag cctccagttg gtgggagtgg 1740
ccgacgttga aacaggggct gaggatgtgc tcttggtctc acggggtggt gcggtactac 1800
ctcctgggaa atccgttttc tacgtggttc agcacttttt gcattggcgc tctgctggtg 1860
ctgatggctc gctggacgct cctctggcaa agacagatcc tcgttctcac cgaaaaccag 1920
gcctggactt taaccatgaa agccgttgtt ccgctcatgg ggtgggcttt ccactacctt 1980
ccattcgtcg tgatgggaag ggtgacgtat taccaccatt acatgccggc tttgtacttt 2040
gctttcttcg tgacgggctt tgtagtcgaa cattcggtcg ctcgtttcgg aggggtttac 2100
acgggaaagt tggtctatct agtactttgg ggctgtgtgt gctacagctt ctggctgttc 2160
agtccgcttt gtttggggat gcacggaatg acgtcgctct atcgtcatct caactgggtt 2220
tccacctggc gtatagctta g 2241
<210>92
<211>746
<212>PRT
<213>Ogataea minuta
<400>92
Met Ser Glu Ser Glu Leu Arg Asn Arg Lys Ala Thr Leu Gly Thr Ala
1 5 10 15
Phe Gln Asp Glu Ser Thr Gly Pro Lys Glu Glu Ser His Leu Asp Gln
20 25 30
Lys Ser Leu Ala Arg Arg Gly Trp Val Gln Leu Ile Thr Thr Tyr Val
35 40 45
Glu Pro Val Ala Gly Pro Leu Phe Phe Thr Val Leu Ala Ala Tyr Leu
50 55 60
Arg Leu Tyr Asp Leu Lys Ala Asn Asn Arg Val Val Trp Asp Glu Ala
65 70 75 80
His Phe Gly Lys Phe Gly Ala Gln Tyr Leu Arg His Glu Phe Tyr His
85 90 95
Asp Val His Pro Pro Leu Gly Lys Met Leu Cys Gly Leu Ser Glu Tyr
100 105 110
Leu Ala Gly Tyr Asn Gly Ser Ser Glu Gly Phe Asn Phe Glu Ser Gly
115 120 125
Lys Glu Tyr Pro Asp His Leu Asp Tyr Ala Ser Met Arg Ser Phe Gly
130 135 140
Thr Trp Phe Ser Thr Leu Val Ile Pro Val Cys Tyr Phe Thr Cys Lys
145 150 155 160
Ser Leu Asn Phe Asn Leu Gln Thr Thr Tyr Leu Val Ser Thr Met Cys
165 170 175
Cys Leu Glu Asn Ser Tyr Ile Ala Leu Gly Lys Phe Ile Leu Leu Asp
180 185 190
Ser Met Leu Met Leu Phe Thr Gly Thr Thr Phe Phe Cys Leu Val Lys
195 200 205
Thr His Thr Leu Arg Ala Gln Glu Phe Ser Thr Arg Trp Thr Leu Trp
210 215 220
Met Cys Leu Thr Gly Val Ser Thr Gly Cys Val Cys Ser Val Lys Trp
225 230 235 240
Val Gly Leu Phe Val Thr Leu Leu Val Gly Ala Tyr Thr Val Leu Glu
245 250 255
Leu Trp Leu Lys Phe Trp Ser Lys Glu Phe Lys Thr Ala Arg Tyr Leu
260 265 270
Lys Ser Trp Val Phe Arg Ala Val Ser Leu Ile Phe Ile Pro Ala Leu
275 280 285
Val Tyr Leu Ile Phe Phe Lys Val His Phe Ser Leu Leu Thr Arg Thr
290 295 300
Gly Thr Gly Ala Gly Ser Leu Ser Ser Leu Tyr Gln Ala Ser Met Glu
305 310 315 320
Asp Ala Asp Ile Leu Asp Tyr Pro Arg Asn Val Ala Ile Gly Ser Arg
325 330 335
Ile Thr Leu Arg Ser Gln Gly Pro Ser Pro Ser Leu Leu His Ser His
340 345 350
Gln Ser Val Tyr Pro Ala Gly Ser Glu Gln Tyr Gln Val Thr Thr Tyr
355 360 365
Gly Phe Lys Asp Ser Asn Asn Asn Phe Leu Val Lys Lys Ala Arg Thr
370 375 380
Pro Phe Lys Tyr Gly Glu Phe Val Ser Asn Gly Asp Leu Ile Arg Leu
385 390 395 400
Gln His Glu Leu Thr Arg Gly Asn Leu His Ser His Ala Ile Asn Gly
405 410 415
His Val Ser Lys Gln Phe Trp Glu Val Ser Gly Tyr Gly Asn Glu Glu
420 425 430
Ile Gly Asp Asp Lys Asp Asp Trp Glu Val Ile Ile Ala Glu Gln Leu
435 440 445
Lys Ser Pro Asn Ser Thr Tyr Ser Ala Leu His Glu Ser Ser Pro Glu
450 455 460
Phe Tyr Arg Thr Val His Pro Ile Ser Thr Ser Phe Lys Leu Arg His
465 470 475 480
Lys Val Leu Gly Cys Tyr Leu Ala Thr Thr Gly His Ser Tyr Pro Thr
485 490 495
Trp Gly Phe Lys Gln Gly Glu Val Ile Cys Lys Pro Ala Glu Ser Leu
500 505 510
Leu Asn Pro Leu Asp Lys Ser Thr Trp Trp Asn Val Glu Leu His Asp
515 520 525
Asn Ser Gly Leu Lys Val Asp Pro Gly Tyr Gln Tyr Pro Arg Pro Arg
530 535 540
Phe Phe Trp Asp Phe Leu Ser Ile Gln Met Ala Met Met Ala Ser Asn
545 550 555 560
Asn Ala Leu Val Pro Asp Pro His Lys Gln Asp Asp Ile Ala Ser Ser
565 570 575
Trp Trp Glu Trp Pro Thr Leu Lys Gln Gly Leu Arg Met Cys Ser Trp
580 585 590
Ser His Gly Val Val Arg Tyr Tyr Leu Leu Gly Asn Pro Phe Ser Thr
595 600 605
Trp Phe Ser Thr Phe Cys Ile Gly Ala Leu Leu Val Leu Met Ala Arg
610 615 620
Trp Thr Leu Leu Trp Gln Arg Gln Ile Leu Val Leu Thr Glu Asn Gln
625 630 635 640
Ala Trp Thr Leu Thr Met Lys Ala Val Val Pro Leu Met Gly Trp Ala
645 650 655
Phe His Tyr Leu Pro Phe Val Val Met Gly Arg Val Thr Tyr Tyr His
660 665 670
His Tyr Met Pro Ala Leu Tyr Phe Ala Phe Phe Val Thr Gly Phe Val
675 680 685
Val Glu His Ser Val Ala Arg Phe Gly Gly Val Tyr Thr Gly Lys Leu
690 695 700
Val Tyr Leu Val Leu Trp Gly Cys Val Cys Tyr Ser Phe Trp Leu Phe
705 710 715 720
Ser Pro Leu Cys Leu Gly Met His Gly Met Thr Ser Leu Tyr Arg His
725 730 735
Leu Asn Trp Val Ser Thr Trp Arg Ile Ala
740 745
<210>93
<211>30
<212>DNA
<213>人工序列
<220>
<223>引物
<400>93
caagcttgga cctacaacac gtccgaagaa 30
<210>94
<211>30
<212>DNA
<213>人工序列
<220>
<223>引物
<400>94
cggtaccggt ttgatacctt gggtggcaca 30
<210>95
<211>31
<212>DNA
<213>人工序列
<220>
<223>引物
<400>95
gaagcttact acataattcg tgtacgtgtt c 31
<210>96
<211>31
<212>DNA
<213>人工序列
<220>
<223>引物
<400>96
cggtaccgtc gccgtattgg tcagcaatct c 31
<210>97
<211>39
<212>DNA
<213>人工序列
<220>
<223>引物
<400>97
gtcatgagat ccaagctgat ccctcaatgg agatctact 39
<210>98
<211>39
<212>DNA
<213>人工序列
<220>
<223>引物
<400>98
ggtgtgtggg ggatcgggat gcaaatggat ggctcgaac 39
<210>99
<211>39
<212>DNA
<213>人工序列
<220>
<223>引物
<400>99
gacggtatcg ataagcttga tgcgcggcct tccgacctt 39
<210>100
<211>39
<212>DNA
<213>人工序列
<220>
<223>引物
<400>100
ctggggaagc tcggatccgg ctcgaggtct tcgttcaga 39
<210>101
<211>38
<212>DNA
<213>人工序列
<220>
<223>引物
<400>101
ctagttctag agcggcccag gtcgctttca ggcagcag 38
<210>102
<211>40
<212>DNA
<213>人工序列
<220>
<223>引物
<400>102
caccgcggtg gcggccaagc ttgggtaccg gctcgcgtag 40
<210>103
<211>34
<212>DNA
<213>人工序列
<220>
<223>引物
<400>103
gcagcccggg ggatccacga aaccacgtcc tact 34
<210>104
<211>33
<212>DNA
<213>人工序列
<220>
<223>引物
<400>104
ggggaagctc ggatcgactc atcttgaaac gca 33
<210>105
<211>33
<212>DNA
<213>人工序列
<220>
<223>引物
<400>105
agttctagag cggccttacc accattacat gcc 33
<210>106
<211>40
<212>DNA
<213>人工序列
<220>
<223>引物
<400>106
aattggagct ccaccgcggc cgcaacttac tcgacgctaa 40
<210>107
<211>25
<212>DNA
<213>人工序列
<220>
<223>引物
<400>107
gaacggcact ggtcaacttg gccat 25
<210>108
<211>25
<212>DNA
<213>人工序列
<220>
<223>引物
<400>108
cttcgtggcc gaggagcagg actga 25
<210>109
<211>23
<212>DNA
<213>人工序列
<220>
<223>引物
<400>109
gaattctagc cgagcatgag cta 23
<210>110
<211>26
<212>DNA
<213>人工序列
<220>
<223>引物
<400>110
cgttcagact cttgttgatt ttccac 26
<210>111
<211>25
<212>DNA
<213>人工序列
<220>
<223>引物
<400>111
gctgtgccac tgcacgcctc gactc 25
<210>112
<211>24
<212>DNA
<213>人工序列
<220>
<223>引物
<400>112
cttgtccctc ttgaatggcg agtg 24
<210>113
<211>20
<212>DNA
<213>人工序列
<220>
<223>引物
<400>113
ggaacacgcc aaacatcatg 20
<210>114
<211>19
<212>DNA
<213>人工序列
<220>
<223>引物
<400>114
cacaagcaga atcaggcac 19
<210>115
<211>24
<212>DNA
<213>人工序列
<220>
<223>引物
<400>115
cggtgacgac ttcgactagt cgag 24
<210>116
<211>26
<212>DNA
<213>人工序列
<220>
<223>引物
<400>116
cggtgctgtt ggcgtcgtca tgggtg 26
<210>117
<211>25
<212>DNA
<213>人工序列
<220>
<223>引物
<400>117
ggcgcgttcc aattccactc tgctg 25
<210>118
<211>26
<212>DNA
<213>人工序列
<220>
<223>引物
<400>118
cgacgagtcc tctcaccagg aggttg 26
<210>119
<211>18
<212>DNA
<213>人工序列
<220>
<223>引物
<400>119
tgtgggtgcg atcctgag 18
<210>120
<211>20
<212>DNA
<213>人工序列
<220>
<223>引物
<400>120
gccgtcgttg gagcaaaact 20
<210>121
<211>18
<212>DNA
<213>人工序列
<220>
<223>引物
<400>121
gcatgtgcca ctgctaaa 18
<210>122
<211>19
<212>DNA
<213>人工序列
<220>
<223>引物
<400>122
gaccaacttt cccgtgtaa 19
Claims (46)
1.一种转化的宿主细胞,其包含激活的HAC1基因和RRBP1基因。
2.根据权利要求1的转化的宿主细胞,其包含以下激活的HAC1基因(1)和RRBP1基因(2):
(1)选自下面(a)至(d)的激活的HAC1基因:
(a)编码由SEQ ID NO:23所示的氨基酸序列组成的蛋白的基因;
(b)编码由与SEQ ID NO:23所示的氨基酸序列具有至少70%同源性的氨基酸序列组成、且具有激活解折叠蛋白应答(UPR)的功能的蛋白的基因;
(c)编码由通过缺失、置换和/或添加一个或几个氨基酸从SEQ ID NO:23所示氨基酸序列衍生的氨基酸序列组成、且具有激活UPR的功能的蛋白的基因;和
(d)在严格条件下与由SEQ ID NO:22所示核苷酸序列或其互补核苷酸序列组成的DNA杂交、且编码具有激活UPR的功能的蛋白的基因;和
(2)选自下面(e)至(h)的RRBP1基因:
(e)编码人或狗来源的RRBP1的基因;
(f)编码由与人或狗来源的RRBP1的氨基酸序列具有至少70%同源性的氨基酸序列组成、且具有核糖体结合活性的蛋白的基因;
(g)编码由通过缺失、置换和/或添加一个或几个氨基酸从人或狗来源的RRBP1的氨基酸序列衍生的氨基酸序列组成、且具有核糖体结合活性的蛋白的基因;和
(h)在严格条件下与由人或狗来源的RRBP1基因的核苷酸序列或其互补核苷酸序列组成的基因杂交、且编码具有核糖体结合活性的蛋白的基因。
3.根据权利要求1的转化细胞,其包含以下激活的HAC1基因(1)和RRBP1基因(2):
(1)选自下面(i)至(1)的激活的HAC1基因:
(i)编码啤酒糖酵母、里氏木霉或构巢曲霉的激活的HAC1蛋白的基因;
(j)编码由与啤酒糖酵母、里氏木霉或构巢曲霉的激活的HAC1蛋白的氨基酸序列具有至少70%同源性的氨基酸序列组成、且具有激活UPR的功能的蛋白的基因;
(k)编码由通过缺失、置换和/或添加一个或几个氨基酸从啤酒糖酵母、里氏木霉或构巢曲霉的激活的HAC1蛋白的氨基酸序列衍生的氨基酸序列组成、且具有激活UPR的功能的蛋白的基因;和
(l)在严格条件下与由编码啤酒糖酵母、里氏木霉或构巢曲霉的激活的HAC1蛋白的基因的核苷酸序列或其互补核苷酸序列组成的基因杂交、且编码具有激活UPR的功能的蛋白的基因;和
(2)选自下面(e)至(h)的RRBP1基因:
(e)编码人或狗来源的RRBP1的基因;
(f)编码由与人或狗来源的RRBP1的氨基酸序列具有至少70%同源性的氨基酸序列组成、且具有核糖体结合活性的蛋白的基因;
(g)编码由通过缺失、置换和/或添加一个或几个氨基酸从人或狗来源的RRBP1的氨基酸序列衍生的氨基酸序列组成、且具有核糖体结合活性的蛋白的基因;和
(h)在严格条件下与由人或狗来源的RRBP1基因的核苷酸序列或其互补核苷酸序列组成的基因杂交、且编码具有核糖体结合活性的蛋白的基因。
4.根据权利要求1-3中任一项的转化的宿主细胞,其中所述宿主细胞是真核细胞。
5.根据权利要求4的转化的宿主细胞,其中所述真核细胞是酵母。
6.根据权利要求5的转化的宿主细胞,其中所述酵母是甲醇同化酵母。
7.根据权利要求6的转化的宿主细胞,其中所述甲醇同化酵母是Ogataea minuta。
8.根据权利要求5的转化的宿主细胞,其中所述酵母是啤酒糖酵母。
9.根据权利要求1-8中任一项的转化的宿主细胞,其包含导入其中的编码外源蛋白的基因。
10.根据权利要求9的转化的宿主细胞,其中所述外源蛋白是多聚体蛋白。
11.根据权利要求10的转化的宿主细胞,其中所述多聚体蛋白是异多聚体。
12.根据权利要求11的转化的宿主细胞,其中所述异多聚体是抗体或其功能片段。
13.一种生产蛋白的方法,其包含,在培养基中培养根据权利要求9-12中任一项的转化的宿主细胞,和从培养产物进行靶蛋白取样。
14.根据权利要求13的方法,其中在抑制蛋白O-甘露糖基转移酶(PMT)活性的条件下进行培养。
15.根据权利要求14的方法,其中通过向培养基中添加蛋白O-甘露糖基转移酶(PMT)活性的抑制剂,抑制PMT活性。
16.编码甲醇同化酵母的激活的HAC1蛋白的基因。
17.选自下面(a)至(d)的基因:
(a)编码由SEQ ID NO:23所示的氨基酸序列组成的蛋白的基因;
(b)编码由与SEQ ID NO:23所示的氨基酸序列具有至少70%同源性的氨基酸序列组成、且具有激活解折叠蛋白应答(UPR)的功能的蛋白的基因;
(c)编码由通过缺失、置换和/或添加一个或几个氨基酸从SEQID NO:23所示氨基酸序列衍生的氨基酸序列组成、且具有激活UPR的功能的蛋白的基因;和
(d)在严格条件下与由SEQ ID NO:22所示核苷酸序列或其互补核苷酸序列组成的DNA杂交、且编码具有激活UPR的功能的蛋白的基因。
18.包含根据权利要求17的基因的表达载体。
19.根据权利要求18的表达载体,它是pOMexPGHy/Hac1。
20包含激活的HAC1基因和RRBP1基因的表达载体。
21.根据权利要求20的表达载体,其中所述激活的HAC1基因是根据权利要求17的基因。
22.根据权利要求20的表达载体,其中所述激活的HAC1基因是编码啤酒糖酵母、里氏木霉或构巢曲霉的激活的HAC1蛋白的基因或其同源基因。
23.根据权利要求20的载体,它是YEp351GAP-II-aHAC1/p180。
24.根据权利要求20的表达载体,其中所述RRBP1基因是人或狗来源的RRBP1基因或其同源基因。
25.一种转化的宿主细胞,其中已经导入了根据权利要求18-24中的任一项的表达载体。
26.一种转化的宿主细胞,其中已经导入了包含激活的HAC1基因的表达载体和包含RRBP1基因的表达载体。
27.根据权利要求26的转化的宿主细胞,其中所述包含激活的HAC1基因的表达载体是根据权利要求18或19的表达载体。
28.根据权利要求26的转化的宿主细胞,其中所述激活的HAC1基因是编码啤酒糖酵母、里氏木霉或构巢曲霉的激活的HAC1蛋白的基因或其同源基因。
29.根据权利要求26的转化细胞,其中所述RRBP1基因是人或狗来源的RRBP1基因或其同源基因。
30.一种生产转化的宿主细胞的方法,其包含下述步骤:
(A)向宿主细胞中导入激活的HAC1基因;和
(B)向宿主细胞中导入RRBP1基因。
31.根据权利要求30的方法,其中所述激活的HAC1基因是下述基因中的任一个:
(1)根据权利要求17的基因;
(2)编码啤酒糖酵母、里氏木霉或构巢曲霉的激活的HAC1蛋白的基因;
(3)编码由与啤酒糖酵母、里氏木霉或构巢曲霉的激活的HAC1蛋白的氨基酸序列具有至少70%同源性的氨基酸序列组成、且具有激活UPR的功能的蛋白的基因;
(4)编码由通过缺失、置换和/或添加一个或几个氨基酸从啤酒糖酵母、里氏木霉或构巢曲霉的激活的HAC1蛋白的氨基酸序列衍生的氨基酸序列组成、且具有激活UPR的功能的蛋白的基因;和
(5)在严格条件下与由编码啤酒糖酵母、里氏木霉或构巢曲霉的激活的HAC1蛋白的基因的核苷酸序列或其互补核苷酸序列组成的基因杂交、且编码具有激活UPR的功能的蛋白的基因。
32.根据权利要求30的方法,其中所述RRBP1基因是下述基因中的任一个:
(1)编码人或狗来源的RRBP1的基因;
(2)编码由与人或狗来源的RRBP1的氨基酸序列具有至少70%同源性的氨基酸序列组成、且具有核糖体结合活性的蛋白的基因;
(3)编码由通过缺失、置换和/或添加一个或几个氨基酸从人或狗来源的RRBP1的氨基酸序列衍生的氨基酸序列组成、且具有核糖体结合活性的蛋白的基因;和
(4)在严格条件下与由人或狗来源的RRBP1基因的核苷酸序列或其互补核苷酸序列组成的基因杂交、且编码具有核糖体结合活性的蛋白的基因。
33.根据权利要求30-32中的任一项的方法,其中所述宿主细胞是真核细胞。
34.根据权利要求33的方法,其中所述真核细胞是酵母。
35.根据权利要求34的方法,其中所述酵母是甲醇同化酵母。
36.根据权利要求35的方法,其中所述甲醇同化酵母是Ogataeaminuta。
37.根据权利要求34的方法,其中所述酵母是啤酒糖酵母。
38.选自下面(a)至(d)的基因:
(a)编码由SEQ ID NO:70所示氨基酸序列组成的蛋白的基因;
(b)编码由与SEQ ID NO:70所示氨基酸序列具有至少70%同源性的氨基酸序列组成、且具有激活解折叠蛋白应答(UPR)的功能的蛋白的基因;
(c)编码由通过缺失、置换和/或添加一个或几个氨基酸从SEQID NO:70所示氨基酸序列衍生的氨基酸序列组成、且具有激活UPR的功能的蛋白的基因;和
(d)在严格条件下与由SEQ ID NO:69所示核苷酸序列或其互补核苷酸序列组成的DNA杂交、且编码具有激活UPR的功能的蛋白的基因。
39.包含根据权利要求38的基因的表达载体。
40.根据权利要求39的表达载体,它是pOMexPGHy/PpHac1。
41.一种生产蛋白的方法,其包含,在抑制O-糖链合成的条件下,在培养基中培养已经导入激活的HAC1基因和/或RRBP1基因和编码外源蛋白的基因的转化细胞,和从培养产物进行靶蛋白取样。
42.根据权利要求41的生产蛋白的方法,其中通过插入灭活PMT基因来抑制O-糖链合成。
43.根据权利要求41的生产蛋白的方法,其中通过向培养基中添加PMT活性的抑制剂来抑制O-糖链合成。
44.根据权利要求41的生产蛋白的方法,其中通过插入灭活PMT基因和向培养基中添加PMT活性的抑制剂来抑制O-糖链合成。
45.根据权利要求43或44的生产蛋白的方法,其中所述PMT活性的抑制剂是5-[[3,4-(1-苯基甲氧基)苯基]亚甲基]-4-氧代-2-硫代-3-噻唑烷乙酸或{(5Z)-4-氧代-5-3-(1-苯基乙氧基)-4-(2-苯基乙氧基)亚苄基]-2-硫代-1,3-噻唑烷-3-基}乙酸。
46.一种转化的宿主细胞,其具有插入灭活的PMT基因和导入其中的激活的HAC1基因。
47.根据权利要求46的转化细胞,其中所述宿主细胞是Ogataeaminuta。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP136993/2006 | 2006-05-16 | ||
JP2006136993 | 2006-05-16 | ||
PCT/JP2007/060478 WO2007132949A1 (ja) | 2006-05-16 | 2007-05-16 | タンパク質の高分泌生産方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN101605887A true CN101605887A (zh) | 2009-12-16 |
CN101605887B CN101605887B (zh) | 2012-09-05 |
Family
ID=38694030
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2007800268649A Expired - Fee Related CN101605887B (zh) | 2006-05-16 | 2007-05-16 | 蛋白的高分泌生产方法 |
Country Status (8)
Country | Link |
---|---|
US (1) | US8232377B2 (zh) |
EP (1) | EP2022855B1 (zh) |
JP (1) | JP5131666B2 (zh) |
KR (1) | KR20090031359A (zh) |
CN (1) | CN101605887B (zh) |
AU (1) | AU2007250735A1 (zh) |
ES (1) | ES2553162T3 (zh) |
WO (1) | WO2007132949A1 (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102965292A (zh) * | 2012-12-10 | 2013-03-13 | 江南大学 | 一种葡萄糖氧化酶分泌增强型菌株及其应用 |
CN105358682A (zh) * | 2013-03-26 | 2016-02-24 | 日本皮革株式会社 | 蛋白质的制造方法 |
CN110484572A (zh) * | 2019-08-30 | 2019-11-22 | 浙江工业大学 | 一种提高酿酒酵母橙花叔醇产量的方法 |
CN110612352A (zh) * | 2017-03-29 | 2019-12-24 | 贝林格尔·英格海姆Rcv两合公司 | 具有改变的膜脂组成的重组宿主细胞 |
CN113439087A (zh) * | 2019-01-31 | 2021-09-24 | 丝芭博株式会社 | 重组蛋白的制备方法 |
Families Citing this family (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5967861B2 (ja) * | 2007-04-03 | 2016-08-10 | オキシレイン ユーケー リミテッド | 分子のグリコシル化 |
US8409825B2 (en) | 2007-10-31 | 2013-04-02 | National Institute Of Advanced Industrial Science And Technology | Method for high-level secretory production of protein |
US8309325B2 (en) * | 2008-05-20 | 2012-11-13 | Merck Sharp & Dohme Corp. | Efficient production of heterologous proteins using mannosyl transferase inhibitors |
WO2010128143A1 (en) * | 2009-05-07 | 2010-11-11 | Novozymes Biopharma Dk A/S | Method of controlling o-linked glycosylation of antibodies |
EP2427488A1 (en) * | 2009-05-07 | 2012-03-14 | Novozymes Biopharma DK A/S | Method of controlling o-linked glycosylation of antibodies |
JP5885191B2 (ja) * | 2011-01-04 | 2016-03-15 | 国立研究開発法人産業技術総合研究所 | 糖鎖改変酵母及びそれを用いた糖タンパク質の製造方法 |
JP2013085498A (ja) * | 2011-10-14 | 2013-05-13 | Nippi:Kk | 細胞の分泌活性化方法 |
EP2771477A4 (en) * | 2011-10-27 | 2015-04-22 | Merck Sharp & Dohme | O-GLYCOSYLATION IN LOW EUKARYOTES |
US20160376570A1 (en) | 2013-07-04 | 2016-12-29 | Novartis Ag | O-Mannosyltransferase Deficient Filamentous Fungal Cells and Methods of Use Thereof |
US10513724B2 (en) | 2014-07-21 | 2019-12-24 | Glykos Finland Oy | Production of glycoproteins with mammalian-like N-glycans in filamentous fungi |
CA3014443A1 (en) * | 2016-02-12 | 2017-08-17 | Ablynx Nv | Method for the production of immunoglobulin single variable domains |
WO2020188021A1 (en) | 2019-03-19 | 2020-09-24 | Sanofi | Novel selection marker-comprising cell line and uses thereof for protein production |
CN113512550B (zh) * | 2021-06-11 | 2022-03-15 | 中国科学院华南植物园 | 茶树CsHAC1基因和蛋白及其应用 |
Family Cites Families (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE4244915C2 (de) | 1992-08-14 | 1998-12-03 | Widmar Prof Dr Tanner | DNA-Moleküle codierend Proteine, die an der O-Glykosylierung von Proteinen beteiligt sind |
SE9301583D0 (sv) | 1993-05-07 | 1993-05-07 | Kabi Pharmacia Ab | Yeast strain and methods for expressing heterologous proteins in yeast |
JP2002507894A (ja) * | 1997-07-03 | 2002-03-12 | ザ リージェンツ オブ ザ ユニバーシティ オブ カリフォルニア | 真核生物宿主細胞においてタンパク質の分泌を増加するための方法 |
EP1266018B1 (en) * | 2000-03-24 | 2008-05-07 | Genencor International, Inc. | Production of secreted proteins by recombinant eukaryotic cells |
TWI318983B (en) | 2000-05-02 | 2010-01-01 | Uab Research Foundation | An antibody selective for a tumor necrosis factor-related apoptosis-inducing ligand receptor and uses thereof |
EP1379667A2 (en) | 2000-12-05 | 2004-01-14 | The Penn State Research Foundation | Methods and compositions for highly efficient production of heterologous proteins in yeast |
CN100475848C (zh) | 2001-05-18 | 2009-04-08 | 麒麟麦酒株式会社 | 抗trail-r抗体 |
WO2003091431A1 (fr) | 2002-04-26 | 2003-11-06 | Kirin Beer Kabushiki Kaisha | Methylotrophe produisant une chaine de sucre de type mammifere |
CA2528418A1 (en) * | 2003-06-11 | 2004-12-23 | Biogen Idec Ma Inc. | Method to increase protein production in culture |
WO2005089047A2 (en) * | 2004-03-18 | 2005-09-29 | Glycofi, Inc. | Glycosylated glucocerebrosidase expression in fungal hosts |
CN101084233B (zh) * | 2004-04-29 | 2012-08-15 | 格利科菲公司 | 用于在糖蛋白产生中减少或消除α-甘露糖苷酶抗性聚糖的方法 |
JP2006136993A (ja) | 2004-11-15 | 2006-06-01 | Sanyo Special Steel Co Ltd | 長尺材切断機定寸装置 |
-
2007
- 2007-05-16 AU AU2007250735A patent/AU2007250735A1/en not_active Abandoned
- 2007-05-16 US US12/300,926 patent/US8232377B2/en active Active
- 2007-05-16 CN CN2007800268649A patent/CN101605887B/zh not_active Expired - Fee Related
- 2007-05-16 WO PCT/JP2007/060478 patent/WO2007132949A1/ja active Application Filing
- 2007-05-16 ES ES07743912.3T patent/ES2553162T3/es active Active
- 2007-05-16 EP EP07743912.3A patent/EP2022855B1/en not_active Not-in-force
- 2007-05-16 JP JP2008515609A patent/JP5131666B2/ja active Active
- 2007-05-16 KR KR1020087030534A patent/KR20090031359A/ko not_active Ceased
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102965292A (zh) * | 2012-12-10 | 2013-03-13 | 江南大学 | 一种葡萄糖氧化酶分泌增强型菌株及其应用 |
CN105358682A (zh) * | 2013-03-26 | 2016-02-24 | 日本皮革株式会社 | 蛋白质的制造方法 |
CN110612352A (zh) * | 2017-03-29 | 2019-12-24 | 贝林格尔·英格海姆Rcv两合公司 | 具有改变的膜脂组成的重组宿主细胞 |
CN113439087A (zh) * | 2019-01-31 | 2021-09-24 | 丝芭博株式会社 | 重组蛋白的制备方法 |
CN110484572A (zh) * | 2019-08-30 | 2019-11-22 | 浙江工业大学 | 一种提高酿酒酵母橙花叔醇产量的方法 |
Also Published As
Publication number | Publication date |
---|---|
JP5131666B2 (ja) | 2013-01-30 |
KR20090031359A (ko) | 2009-03-25 |
CN101605887B (zh) | 2012-09-05 |
EP2022855A4 (en) | 2009-12-02 |
EP2022855B1 (en) | 2015-08-19 |
WO2007132949A1 (ja) | 2007-11-22 |
EP2022855A1 (en) | 2009-02-11 |
US20090191587A1 (en) | 2009-07-30 |
ES2553162T3 (es) | 2015-12-04 |
US8232377B2 (en) | 2012-07-31 |
JPWO2007132949A1 (ja) | 2009-09-24 |
AU2007250735A1 (en) | 2007-11-22 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101605887A (zh) | 蛋白的高分泌生产方法 | |
JP5288379B2 (ja) | タンパク質の高分泌生産方法 | |
KR101930961B1 (ko) | 피키아 파스토리스에서 생산된 치료 당단백질 상의 n-글리코실화 부위 점유를 증가시키는 방법 | |
CA2551484C (en) | Methods for eliminating mannosylphosphorylation of glycans in the production of glycoproteins | |
KR101262682B1 (ko) | 유전자 발현 기술 | |
DE69332893T2 (de) | Methode zur erhöhung der produktion von rekombinanten disulfidverknüpften-proteinen in (saccharomyces cerevisiae) | |
KR20140015137A (ko) | 분비 효율이 개선된 재조합 단백질의 생산 방법 | |
CN113423836B (zh) | 重组宿主细胞中碳源调节的蛋白的产生 | |
KR20210032972A (ko) | 전사인자를 사용하여 단백질 발현을 증가시키는 수단 및 방법 | |
KR20140091017A (ko) | Alg3 발현이 결핍된 피키아 파스토리스 균주에서 n-글리칸 점유율을 증가시키고 하이브리드 n-글리칸의 생산을 감소시키는 방법 | |
WO2013066765A1 (en) | Mutation of tup1 in glycoengineered yeast | |
WO1999000504A1 (en) | Improved protein expression strains | |
KR20140091018A (ko) | 재조합 단백질 발현을 위한 조작된 하등 진핵 숙주 균주 | |
Wu et al. | High level expression, efficient purification, and bioactivity of recombinant human metallothionein 3 (rhMT3) from methylotrophic yeast Pichia pastoris | |
KR0180081B1 (ko) | 효모에서 지씨에스에프를 제조하는 방법 | |
HK40054115A (zh) | 重组宿主细胞中碳源调节的蛋白的产生 | |
HK40054115B (zh) | 重组宿主细胞中碳源调节的蛋白的产生 | |
HK40062436A (zh) | Mut-甲醇營養型酵母 | |
CN114026239A (zh) | Mut-甲醇营养型酵母 | |
JPH04335883A (ja) | 抗菌性ポリペプチドの製造方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
C17 | Cessation of patent right | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20120905 Termination date: 20140516 |