CN101605887A

CN101605887A - 蛋白的高分泌生产方法

Info

Publication number: CN101605887A
Application number: CNA2007800268649A
Authority: CN
Inventors: 千叶靖典; 地神芳文; 黑田康介; 小林和男; 市川公久; 野中浩一; 铃木健之
Original assignee: Sankyo Co Ltd; Kyowa Hakko Kirin Co Ltd
Current assignee: Sankyo Co Ltd; Kyowa Kirin Co Ltd
Priority date: 2006-05-16
Filing date: 2007-05-16
Publication date: 2009-12-16
Anticipated expiration: 2027-05-16
Also published as: JP5131666B2; KR20090031359A; CN101605887B; EP2022855A4; EP2022855B1; WO2007132949A1; EP2022855A1; US20090191587A1; ES2553162T3; US8232377B2; JPWO2007132949A1; AU2007250735A1

Abstract

本发明提供了在宿主细胞例如酵母中高分泌生产蛋白、尤其具有复杂结构的蛋白例如抗体的方法。根据本发明，提供了具有激活的HAC1基因和RRBP1基因的转化的酵母，和外源蛋白的高分泌生产方法，其中使用转化的酵母细胞，并且提供了对宿主细胞如酵母特异的O－型糖链。

Description

蛋白的高分泌生产方法

技术领域

本发明涉及高水平分泌生产蛋白的方法，主要在酵母中实现。

背景技术

迄今为止，通过基因重组技术生产药用蛋白主要包括将动物细胞或大肠杆菌细胞用作宿主。大肠杆菌细胞能低成本地生产靶蛋白；但是，大肠杆菌细胞不能进行以糖链修饰为代表的修饰，且以包涵体的形式生成无活性的蛋白。这需要溶解过程，因而大肠杆菌细胞不适合复杂的蛋白生产过程。相反，动物细胞能生产靶蛋白作为活性蛋白。但是，不利地，由于动物细胞繁殖和培养的费时操作，动物细胞的使用会显著增加在设备和材料成本方面的生产成本。

在蛋白中，抗体已经长时间地用作药物产品。由于它们源自人以外的来源，会新产生抗施用的抗体的抗体。因而，这样的抗体不能施用超过一次，其使用受到限制。近年来，已经可以生产人源化的抗体，其中抗原结合位点以外的氨基酸序列已经被置换为源自人抗体的序列。此外，可以生产其中已经导入人抗体基因的人抗体生产小鼠。因而，抗体作为药物产品的用途变得广泛。现在，这样的抗体由培养的、已经导入编码杂交瘤或抗体的基因的细胞如CHO细胞生产。但是，这样的生产在成本、生产力、安全性等方面存在问题。

近年来，为了弥补上述缺点，已经尝试用使用酵母来生产药用蛋白。但是，这样的尝试基本上都没有付诸实际应用。更具体地，关于具有复杂结构的抗体，存在表达Fab(一种单链抗体(ScFv))等的实例(Biosci.Biotechnol.Biochem.，64：2138-2144，2000)。但是，在全长抗体方面生产力非常低(Proc.Natl.Acad.Sci.U.S.A.，85：8678-8682，1988)。最近报道了使用生产哺乳动物N-结合糖链的酵母(巴斯德毕赤氏酵母)来生产抗体的实例(Nature Biotechnology，24：210-215，2006)，尽管该报道没有提及产率。因而，在酵母中高水平生产抗体是困难的。认为其原因是，酵母的分泌能力不足，由蛋白酶造成的降解等。

作为解决这些问题的一种手段，提出了包含使用蛋白酶缺陷菌株的方法(Enzyme and Microbial Technology，26：671-677，2000，Protein Expr.Purif.，20：485-491，2000，Biosci.Biotechnol.Biochem.，66：628-631，2002)。发明人还已经开发了使用蛋白酶(它是蛋白酶A(PEP4)、蛋白酶B(PRB1)或酵母天冬酶(YPS1))基因缺陷菌株来抑制抗体的降解的方法(WO 2003/091431)。作为通过基因导入来提高蛋白生产力的一种方法，报道了通过共表达分子伴侣的部分来提高ScFv生产力的方法，所述分子伴侣的部分会辅助内质网上的蛋白如BiP(KAR2)/PDI的三维结构的形成(Nat.Biotechnol.16：773-777，1998)，尽管该方法仅仅生产单链抗体的片段。

另外，已经开发了许多诱导型或组成型启动子，且已经用于生产外源蛋白。但是，当使用有效启动子使编码外源蛋白的基因在细胞中高水平表达时，或当生产不太可能折叠的蛋白时，在内质网(ER)中会发生聚集，产生的蛋白有时可能在细胞中积累。此外，分泌型蛋白和膜蛋白会翻译成蛋白，此后立即掺入内质网，进行特定修饰，然后转移至高尔基体。在该情况下，未折叠的蛋白有时可能由于某种原因在内质网中积累。这称作“内质网应激”。这样的内质网应激的原因的实例包括，在内质网中发生的修饰(例如添加糖链或二硫键)的干扰，和从内质网运输的恶化。哺乳动物细胞具有“解折叠蛋白应答(UPR)”机制，作为反抗这样的内质网应激的一种手段。例如，转录抑制、分子伴侣诱导的折叠加速、变性蛋白的降解或经细胞凋亡的细胞死亡会保护在内质网中积累的蛋白。

作为调节UPR的基因，已知IRE1α-XBP1、PERK-eIF-2α和ATF6动物细胞的基因。在酵母的情况下，Ire1p-Hac1p是已知为这样的基因的唯一基因，Ire1p-Hac1p基因通过下述机制与UPR相关(参见图1)。首先，Ire1p通常结合抗体重链结合蛋白(BiP)。但是，当生产解折叠的蛋白(UFP)时，BiP会结合这样的UFP。与BiP解离的Ire1p通过自磷酸化或二聚化而激活，且它表现出内切核酸酶活性。尽管HAC1基因通常以未激活状态存在，具有内切核酸酶活性的Ire1p使从HAC1基因转录的mRNA发生剪接，并生成有活性的Hac1p(Cell，87：405-413，1996；Cell，90：1031-1039，1997；the EMBO Journal，18：3119-3132，1999)。这种有活性的Hac1p迁移至细胞核，起转录因子的作用，并促进编码与称作UPR的一系列反应有关的多种蛋白的基因的表达，所述反应例如有关的糖链添加、蛋白折叠、蛋白降解(ER-相关的降解：ERAD)、蛋白分选、脂类代谢等(Cell，101：249-258，2000)。

关于使用激活的Hac1p来提高外源蛋白的生产力的尝试，有一个实例，其中将编码丝状菌即里氏木霉(Trichoderma reesei))的激活的Hac1p的基因导入啤酒糖酵母中来提高异源蛋白α-淀粉酶和内源蛋白即转化酶的分泌(Appl.Environ.Microbiol.69：2065-2072，2003)。但是，已知单一蛋白，即α-淀粉酶或转化酶是容易分泌的蛋白，产量的提高低至提高以前的产量的约2倍。近年来，已经报道在已经单独导入激活的HAC1基因的菌株中，使用巴斯德毕赤氏酵母生产抗体片段Fab(Biotechnologyand Bioengineering，94：353-361)。通过导入激活的HAC1基因实现的生产力提高低至约1.3倍。

同时，已知这样一个实例，其中将哺乳动物来源的RRBP1(核糖体结合蛋白1，核糖体受体，p180蛋白)基因单独地导入酵母菌株中，从而使分泌的蛋白(牛胰腺胰蛋白酶抑制剂(BPTI))的量变成5倍(TheJournal of Cell Biology，146：273-284，1999)。最初，从狗分离出RRBP1基因，作为编码核糖体结合蛋白的基因(Nature，346：540-544，1990)。RRBP1具有180kDa的分子量和特殊结构，使得在N-末端侧包含10个氨基酸残基的序列重复54次，且该区域结合核糖体。已知RRBP1参与膜结构的扩大和mRNA的稳定化(the Journal of Cell Biology，130：29-39，1995；the Journal of Cell Biology，156：993-1001，2002)。前述BPTI的一个成功实例具有6,500的分子量，它代表非常小的肽。这样的结果不能总是适用于其它高分子量蛋白或由不同蛋白(例如抗体的轻链或重链)组成的蛋白聚集体。

已知蛋白O-甘露糖基转移酶(PMT)基因与酵母或霉菌固有的O-糖链的形成有关。PMT基因产物位于内质网膜上，且具有将甘露糖添加至分泌型蛋白的丝氨酸(Ser)或苏氨酸(Thr)的羟基残基上的活性(在下文中，这样的活性称作PMT活性)。有些已经被PMT添加糖链的蛋白用作酵母菌株壁的基本组分，作为甘露糖蛋白。当PMT活性非常低时，已知细胞壁会变脆，并影响细胞的生长。

关于PMT基因，已知在啤酒糖酵母(Saccharomyces cerevisiae)中存在7种基因，即，PMT1，2，3，4，5，6，和7(Biochim.Biophys.Acta.，1426：297-307，1999)。将PMT基因分成3类；即，PMT1家族，PMT2家族，和PMT4家族。已知PMT1p和PMT2p在形成异二聚体后表现出活性，PMT4p在形成同二聚体后表现出活性。因为氨基酸序列同源性等，据称PMT5p与PMT1p互补，PMT3p与PMT2p互补。PMT6p与PMT2p和PMT3p高度同源，尽管不知道表现出活性的组分的类型。还已知每种PMT蛋白具有对底物蛋白的选择性。

作为芽殖酵母的其它类型的PMT基因，已经发现了在白念珠菌的情况下与啤酒糖酵母的PMT1，2，4，5，和6基因高度同源的5种基因(Mol.Microbiol.，55：546-560，2005)，在新型隐球菌的情况下至少与啤酒糖酵母的PMT4基因高度同源的一种基因(Eukaryot.Cell，6：222-234，2007)和在裂殖酵母即粟酒裂殖酵母的情况下与PMT1，2，和4基因高度同源的3种基因(oma1，2，和4)(Mol.Microbiol.，57：156-170，2005)。此外，在甲醇同化酵母Ogataea minuta(O.minuta)中观察到与啤酒糖酵母的PMT1，2，4，5，和6基因高度同源的5种基因的存在。

也在霉菌中发现了PMT基因。在构巢曲霉中发现了PmtA基和2种其它的基因，在里氏木霉中发现了与啤酒糖酵母的PMT2基因高度同源的Pmt1基因(Curr.Genet.，43：11-16，2003)。

据称PMT活性具有影响肽疏水区、增强肽亲水性、和抑制内质网腔中的肽聚集的作用。但是，当生产外源蛋白时，PMT活性有时会添加不必要的O-糖链，这可能导致蛋白组分的不充分形成、降低的活性等。对于多聚体蛋白，例如抗体，具体而言，可以抑制其聚集体的形成(在抗体的情况下，这是指轻链和重链聚集体的形成)。

日本专利号3630424和日本专利公开(kohyo)号H08-509867(A)(1996)提出了通过抑制由PMT基因的修饰导致的O-糖链添加，生产重组蛋白的方法。但是，这些专利文件没有描述抗体的轻链和重链的聚集体的形成。

在WO 2002/046437中提供了一个实例，其中将与O-糖链的形成有关的PMT1和PMT2基因缺陷型菌株用于抑制O-糖链的添加，使抗体轻链和重链分子的聚集提高了约1.5倍。该数据是使用RI-标记的氨基酸的脉冲标记实验的结果，但不是观察整个培养过程的结果。另外，进一步降低了糖链添加的抑制程度，并恶化了抗体生产力。

尽管HAC1基因会诱导UPR，已知有些UPR诱导型基因是添加酵母特异性的O-糖链的PMT基因(Cell，101：249-258，2000)。因此，HAC1基因的导入可能不足以生产高质量的多聚体蛋白，例如抗体。

如上所述，已经提出许多种方法来作为在酵母中高水平分泌生产蛋白的方法。但是，基本上所有方法在实践水平都是不充分的。还没有发现有效生产蛋白、尤其是高分子量蛋白或蛋白聚集体(包括抗体)的方法。当通过基因导入、基因破坏等将性状导入细胞中时，一般而言，细胞会经历某种应激。因而，可以提供其它修饰，或可能发生相反作用。当希望高水平蛋白表达时，例如，激活UPR时，这会导致不利因素例如糖链修饰、蛋白酶体的降解、或ER-相关的降解(ERAD)。因此，通过单一过程例如导入单个基因，不能实现具有复杂结构的蛋白例如抗体的高水平分泌生产。另外，仅有几种常规方法的组合不总是会产生协同效应。

因此，本发明意在提供在酵母或其它宿主细胞中高水平分泌生产蛋白(更具体地，具有复杂结构的蛋白，例如抗体)的方法。

发明内容

为了实现上述目的，发明人已经进行了集中的研究。结果，他们发现，与蛋白的高水平分泌生产有关的基因，即激活的HAC1(Hac1蛋白，它是在应用内质网应激后由Ire1p剪接mRNA诱导的转录因子)基因和RRBP1(核糖体结合蛋白1，核糖体受体，p180蛋白)基因在甲醇同化酵母，即Ogataea minuta中共表达，且抗体分泌生产的量可以增加约10倍。此外，他们发现，可以抑制与给酵母特异性蛋白添加O-糖链有关的蛋白O-甘露糖基转移酶(PMT)的活性(该活性抑制异多聚体例如抗体的聚集)，以进一步提高生产力。

他们也发现，可以表达与蛋白的高水平分泌生产有关的基因，即激活的HAC1基因，且可以抑制与给酵母特异性蛋白添加O-糖链有关的蛋白O-甘露糖基转移酶(PMT)的活性(该活性抑制异多聚体例如抗体的聚集)，以实现生产力的协同提高。

在这样的发现后，已经完成了本发明(参见图2)。

具体而言，本发明包括下述发明。

[1]一种转化的宿主细胞，其包含激活的HAC1基因和RRBP1基因。

[2]根据[1]的转化的宿主细胞，其包含以下激活的HAC1基因(1)和RRBP1基因(2)：

(1)选自下面(a)至(d)的激活的HAC1基因：

(a)编码由SEQ ID NO：23所示的氨基酸序列组成的蛋白的基因；

(b)编码由与SEQ ID NO：23所示的氨基酸序列具有至少70％同源性的氨基酸序列组成、且具有激活解折叠蛋白应答(UPR)的功能的蛋白的基因；

(c)编码由通过缺失、置换和/或添加一个或几个氨基酸从SEQ ID NO：23所示氨基酸序列衍生的氨基酸序列组成、且具有激活UPR的功能的蛋白的基因；和

(d)在严格条件下与由SEQ ID NO：22所示核苷酸序列或其互补核苷酸序列组成的DNA杂交、且编码具有激活UPR的功能的蛋白的基因；和

(2)选自下面(e)至(h)的RRBP1基因：

(e)编码人或狗来源的RRBP1的基因；

(f)编码由与人或狗来源的RRBP1的氨基酸序列具有至少70％同源性的氨基酸序列组成、且具有核糖体结合活性的蛋白的基因；

(g)编码由通过缺失、置换和/或添加一个或几个氨基酸从人或狗来源的RRBP1的氨基酸序列衍生的氨基酸序列组成、且具有核糖体结合活性的蛋白的基因；和

(h)在严格条件下与由人或狗来源的RRBP1基因的核苷酸序列或其互补核苷酸序列组成的基因杂交、且编码具有核糖体结合活性的蛋白的基因。

[3]根据[1]的转化的细胞，其包含以下激活的HAC1基因(1)和RRBP1基因(2)：

(1)选自下面(i)至(l)的激活的HAC1基因：

(i)编码啤酒糖酵母、里氏木霉或构巢曲霉的激活的HAC1蛋白的基因；

(j)编码由与啤酒糖酵母、里氏木霉或构巢曲霉的激活的HAC1蛋白的氨基酸序列具有至少70％同源性的氨基酸序列组成、且具有激活UPR的功能的蛋白的基因；

(k)编码由通过缺失、置换和/或添加一个或几个氨基酸从啤酒糖酵母、里氏木霉或构巢曲霉的激活的HAC1蛋白的氨基酸序列衍生的氨基酸序列组成、且具有激活UPR的功能的蛋白的基因；和

(l)在严格条件下与由编码啤酒糖酵母、里氏木霉或构巢曲霉的激活的HAC1蛋白的基因的核苷酸序列或其互补核苷酸序列组成的基因杂交、且编码具有激活UPR的功能的蛋白的基因；和

(2)选自下面(e)至(h)的RRBP1基因：

(e)编码人或狗来源的RRBP1的基因；

[4]根据[1]至[3]中任一项的转化的宿主细胞，其中所述宿主细胞是真核细胞。

[5]根据[4]的转化的宿主细胞，其中所述真核细胞是酵母。

[6]根据[5]的转化的宿主细胞，其中所述酵母是甲醇同化酵母。

[7]根据[6]的转化的宿主细胞，其中所述甲醇同化酵母是Ogataeaminuta。

[8]根据[5]的转化的宿主细胞，其中所述酵母是啤酒糖酵母。

[9]根据[1]至[8]中任一项的转化的宿主细胞，其包含导入其中的编码外源蛋白的基因。

[10]根据[9]的转化的宿主细胞，其中所述外源蛋白是多聚体蛋白。

[11]根据[10]的转化的宿主细胞，其中所述多聚体蛋白是异多聚体。

[12]根据[11]的转化的宿主细胞，其中所述异多聚体是抗体或其功能片段。

[13]一种生产蛋白的方法，其包含，在培养基中培养根据[9]至[12]中任一项的转化的宿主细胞，和从培养产物进行靶蛋白取样。

[14]根据[13]的方法，其中在抑制蛋白O-甘露糖基转移酶(PMT)活性的条件下进行培养。

[15]根据[14]的方法，其中通过向培养基中添加蛋白O-甘露糖基转移酶(PMT)活性的抑制剂，抑制PMT活性。

[16]编码甲醇同化酵母的激活的HAC1蛋白的基因。

[17]选自下面(a)至(d)的基因：

(a)编码由SEQ ID NO：23所示的氨基酸序列组成的蛋白的基因；

(c)编码由通过缺失、置换和/或添加一个或几个氨基酸从SEQID NO：23所示氨基酸序列衍生的氨基酸序列组成、且具有激活UPR的功能的蛋白的基因；和

(d)在严格条件下与由SEQ ID NO：22所示核苷酸序列或其互补核苷酸序列组成的DNA杂交、且编码具有激活UPR的功能的蛋白的基因。

[18]包含根据[17]的基因的表达载体。

[19]根据[18]的表达载体，它是pOMexPGHy/Hac1。

[20]包含激活的HAC1基因和RRBP1基因的表达载体。

[21]根据[20]的表达载体，其中所述激活的HAC1基因是根据[17]的基因。

[22]根据[20]的表达载体，其中所述激活的HAC1基因是编码啤酒糖酵母、里氏木霉或构巢曲霉的激活的HAC1蛋白的基因或其同源基因。

[23]根据[20]的表达载体，它是YEp351GAP-II-aHAC1/p180。

[24]根据[20]的表达载体，其中所述RRBP1基因是人或狗来源的RRBP1基因或其同源基因。

[25]一种转化的宿主细胞，其中已经导入了根据[18]至[24]中的任一项的表达载体。

[26]一种转化的宿主细胞，其中已经导入了包含激活的HAC1基因的表达载体和包含RRBP1基因的表达载体。

[27]根据[26]的转化的宿主细胞，其中所述包含激活的HAC1基因的表达载体是根据[18]或[19]的表达载体。

[28]根据[26]的转化的宿主细胞，其中所述激活的HAC1基因是编码啤酒糖酵母、里氏木霉或构巢曲霉的激活的HAC1蛋白的基因或其同源基因。

[29]根据[26]的转化的宿主细胞，其中所述RRBP1基因是人或狗来源的RRBP1基因或其同源基因。

[30]一种生产转化的宿主细胞的方法，其包含下述步骤：

(A)向宿主细胞中导入激活的HAC1基因；和

(B)向宿主细胞中导入RRBP1基因。

[31]根据[30]的方法，其中所述激活的HAC1基因是下述基因中的任一个：

(1)根据[17]的基因；

(2)编码啤酒糖酵母、里氏木霉或构巢曲霉的激活的HAC1蛋白的基因；

(3)编码由与啤酒糖酵母、里氏木霉或构巢曲霉的激活的HAC1蛋白的氨基酸序列具有至少70％同源性的氨基酸序列组成、且具有激活UPR的功能的蛋白的基因；

(4)编码由通过缺失、置换和/或添加一个或几个氨基酸从啤酒糖酵母、里氏木霉或构巢曲霉的激活的HAC1蛋白的氨基酸序列衍生的氨基酸序列组成、且具有激活UPR的功能的蛋白的基因；和

(5)在严格条件下与由编码啤酒糖酵母、里氏木霉或构巢曲霉的激活的HAC1蛋白的基因的核苷酸序列或其互补核苷酸序列组成的基因杂交、且编码具有激活UPR的功能的蛋白的基因。

[32]根据[30]的方法，其中所述RRBP1基因是下述基因中的任一个：

(1)编码人或狗来源的RRBP1的基因；

(2)编码由与人或狗来源的RRBP1的氨基酸序列具有至少70％同源性的氨基酸序列组成、且具有核糖体结合活性的蛋白的基因；

(3)编码由通过缺失、置换和/或添加一个或几个氨基酸从人或狗来源的RRBP1的氨基酸序列衍生的氨基酸序列组成、且具有核糖体结合活性的蛋白的基因；和

(4)在严格条件下与由人或狗来源的RRBP1基因的核苷酸序列或其互补核苷酸序列组成的基因杂交、且编码具有核糖体结合活性的蛋白的基因。

[33]根据[30]至[32]中的任一项的方法，其中所述宿主细胞是真核细胞。

[34]根据[33]的方法，其中所述真核细胞是酵母。

[35]根据[34]的方法，其中所述酵母是甲醇同化酵母。

[36]根据[35]的方法，其中所述甲醇同化酵母是Ogataea minuta。

[37]根据[34]的方法，其中所述酵母是啤酒糖酵母。

[38]选自下面(a)至(d)的基因：

(a)编码由SEQ ID NO：70所示氨基酸序列组成的蛋白的基因；

(b)编码由与SEQ ID NO：70所示氨基酸序列具有至少70％同源性的氨基酸序列组成、且具有激活解折叠蛋白应答(UPR)的功能的蛋白的基因；

(c)编码由通过缺失、置换和/或添加一个或几个氨基酸从SEQID NO：70所示氨基酸序列衍生的氨基酸序列组成、且具有激活UPR的功能的蛋白的基因；和

(d)在严格条件下与由SEQ ID NO：69所示核苷酸序列或其互补核苷酸序列组成的DNA杂交、且编码具有激活UPR的功能的蛋白的基因。

[39]包含根据[38]的基因的表达载体。

[40]根据[39]的表达载体，它是pOMexPGHy/PpHac1。

[41]一种生产蛋白的方法，其包含，在抑制O-糖链合成的条件下，在培养基中培养已经导入激活的HAC1基因和/或RRBP1基因和编码外源蛋白的基因的转化细胞，和从培养产物进行靶蛋白取样。

[42]根据[41]的生产蛋白的方法，其中通过插入灭活PMT基因来抑制O-糖链合成。

[43]根据[41]的生产蛋白的方法，其中通过向培养基中添加PMT活性的抑制剂来抑制O-糖链合成。

[44]根据[41]的生产蛋白的方法，其中通过插入灭活PMT基因和向培养基中添加PMT活性的抑制剂来抑制O-糖链合成。

[45]根据[43]或[44]的生产蛋白的方法，其中所述PMT活性的抑制剂是5-[[3，4-(1-苯基甲氧基)苯基]亚甲基]-4-氧代-2-硫代-3-噻唑烷乙酸或{(5Z)-4-氧代-5-[3-(1-苯基乙氧基)-4-(2-苯基乙氧基)亚苄基]-2-硫代-1，3-噻唑烷-3-基}乙酸。

[46]一种转化的宿主细胞，其具有插入灭活的PMT基因和导入其中的激活的HAC1基因。

[47]根据[46]的转化细胞，其中所述宿主细胞是Ogataea minuta。

附图简述

图1显示了得到O.minuta的激活的HAC1基因的方法和其结构。

图2概要显示了本发明的技术范围。

图3显示了O.minuta的激活的HAC1基因的表达载体(pOMexPGHy/Hac1)、人RRBP1基因的表达载体(pOMexGP1A/p180)和人抗体基因的表达载体(pOMexGAT-G/Ab)的结构。

图4显示了在已经导入O.minuta的激活的HAC1基因和人RRBP1基因的产抗体酵母菌株的培养上清液中分泌的抗体的蛋白印迹分析结果。

图5中的图显示了测量已经导入O.minuta的激活的HAC1基因和人RRBP1基因的产抗体酵母菌株分泌的抗体的量的结果。

图6显示了在已经导入O.minuta的激活的HAC1基因和人RRBP1基因的产抗体酵母菌株的培养上清液中分泌的抗体的蛋白印迹分析结果，所述菌株已经在抑制O-糖链形成的条件下培养。

图7显示了啤酒糖酵母的活性HAC1的表达载体(YEp351GAP-II-aHAC1)、人RRBP1基因的的表达载体(YEp351GAP-II-p180)、人抗体基因的表达载体(YEp352GAP-II-alfHc/alfLc)和激活的HAC1基因和RRBP1基因的共表达载体(YEp351GAP-II-aHAC1/p180)。

图8A的图显示了已经导入啤酒糖酵母的激活的HAC1基因的表达载体和人RRBP1基因的表达载体的产抗体酵母菌株的抗体分泌生产能力的对比结果。图8B的图显示了在抑制O-糖链形成的条件下已经导入啤酒糖酵母的激活的HAC1基因的表达载体和人RRBP1基因的表达载体的产抗体酵母菌株的抗体分泌生产能力的对比结果。图8C的图显示了在添加或不添加PMT抑制剂的情况下已经导入啤酒糖酵母的激活的HAC1基因的表达载体和人RRBP1基因的表达载体的产抗体酵母菌株的抗体分泌生产能力(绝对值)的对比结果。

图9显示了已经导入合成抗体基因(其中密码子已经被置换)的产抗体菌株中抗体生产的蛋白印迹分析结果。

图10显示了已经导入酵母菌株来源的激活的HAC1基因的产抗体菌株的培养上清液的蛋白印迹分析结果。

图11显示了已经导入酵母菌株来源的激活的HAC1基因的产抗体菌株的抗体分泌生产量。

图12显示了具有插入灭活的PMT1基因-或PMT2基因的产抗体菌株的培养上清液的蛋白印迹分析结果，和已经导入激活的HAC1基因的产抗体菌株的培养上清液的蛋白印迹分析结果。

图13显示了具有插入灭活的PMT1基因-或PMT2基因的产抗体菌株的抗体分泌生产量，和已经导入激活的HAC1基因的产抗体菌株的抗体分泌生产量。

图14显示了具有插入灭活的PMT4基因的产抗体菌株的培养上清液的蛋白印迹分析结果，和已经导入激活的HAC1基因的产抗体菌株的培养上清液的蛋白印迹分析结果。

图15显示了具有插入灭活的PMT4基因的产抗体菌株的抗体分泌生产量，和已经导入激活的HAC1基因的产抗体菌株的抗体分泌生产量。

图16A显示了PMT5基因-或PMT6基因-缺陷型产抗体菌株的培养上清液的蛋白印迹分析结果。图16B显示了PMT5基因-或PMT6基因-缺陷型产抗体菌株的抗体分泌生产量。

图17显示了在添加PMT抑制剂(1c)的情况下，通过培养具有插入灭活的PMT2或PMT4基因和导入其中的激活的HAC1基因的产抗体菌株得到的培养上清液的蛋白印迹分析结果。

图18A显示了在添加PMT抑制剂(1c)的情况下，通过培养具有插入灭活的PMT2和导入其中的激活的HAC1基因的产抗体菌株得到的培养上清液的抗体分泌生产量。图18B显示了在添加PMT抑制剂(1c)的情况下，通过培养具有插入灭活的PMT4和导入其中的激活的HAC1基因的产抗体菌株得到的培养上清液的抗体分泌生产量。

图19显示了已经在添加多种PMT抑制剂(绕丹宁-3-乙酸衍生物)的情况下培养的培养上清液的蛋白印迹分析结果。

图20显示了已经在添加多种PMT抑制剂(绕丹宁-3-乙酸衍生物)的情况下培养的培养上清液的抗体分泌生产量。

下面详细描述本发明。本专利申请要求2006年5月16日提交的日本专利申请号2006-136993的优先权，且包括在其说明书中公开的全部或部分内容。

本发明由下述两部分组成。具体而言，(A)与蛋白的高水平分泌生产有关的基因的导入和(B)酵母(和霉菌)固有的O-糖链添加的抑制的组合，可以在蛋白的高水平分泌生产方面产生协同效应。

下面详细描述本发明。

本发明提供了用于蛋白的高水平分泌生产的基因，包含这样的基因的表达载体，导入了这样的表达载体的转化的宿主细胞，和使用这样的转化的宿主细胞生产蛋白的方法。

1.用于蛋白的高水平分泌生产的基因

(1)HAC1基因

在本发明中，用于蛋白的高水平分泌生产的基因是HAC1基因。HAC1基因作为无活性的HAC1基因存在于基因组上；但是，在内质网应激应用后由HAC1基因转录的mRNA会被Ire1p剪接，转化成编码转录因子HAC1蛋白(Hac1p)的mRNA。翻译的Hac1p然后激活解折叠蛋白应答(UPR)。在本发明中，将激活的HAC1基因定义为编码HAC1蛋白(Hac1p)的cDNA(即，与mRNA互补)。

因此，优选使用激活的HAC1基因，以便进一步提高本发明的效应。特定程度的效应也可以通过导入灭活的HAC1基因来实现。

在下文中，描述了编码实际上造成UPR起作用的Hac1p的激活的HAC1基因。HAC1p的组分是，从N末端开始，在生物体中高度保守的DNA-结合域、亮氨酸拉链区和在其中剪接mRNA且被Ire1p新添加在C末端的未知活性区。

在本发明中使用的激活的HAC1基因没有特别限制，只要这样的基因会编码激活的HAC1蛋白即可。实例包括在本发明中新获得的编码由源自Ogataea minuta(O.minuta)的SEQ ID NO：23所示的氨基酸序列组成的蛋白的DNA，和编码由SEQ ID NO：70所示的源自巴斯德毕赤氏酵母的氨基酸序列组成的蛋白的DNA。可以采用与其同源的功能等价DNA。

术语“同源DNA”是指，例如，编码由与SEQ ID NO：23或70所示的氨基酸序列具有至少70％同源性的氨基酸序列组成、且具有激活解折叠蛋白应答(UPR)的功能的蛋白的基因，编码由通过缺失、置换和/或添加一个或几个氨基酸从SEQ ID NO：23或70所示的氨基酸序列衍生的氨基酸序列组成、且具有激活UPR的功能的蛋白的基因，和在严格条件下与由SEQ ID NO：22或69所示核苷酸序列或其互补核苷酸序列组成的DNA杂交、且编码具有激活UPR的功能的蛋白的基因。

术语“与SEQ ID NO：23或70所示的氨基酸序列具有至少70％同源性的氨基酸序列”是指具有优选至少80％、更优选至少90％和最优选至少95％同源性的氨基酸序列。使用例如日本的DNA数据库(DDBJ)，通过FASTA、BLAST或其它程序，可以进行蛋白同源性搜索。

前述“SEQ ID NO：23或70所示氨基酸序列中的一个或几个氨基酸”中的术语“几个”指示的数目没有特别限制。例如，术语“几个”大约指20或更少，优选10或更少，更优选7或更少，和进一步优选5或更少。

在前述的“严格条件”下，形成所谓的特异性杂交体，但是不形成非特异性杂交体。在这样的条件下，例如，高度同源的DNA，即由与SEQID NO：22或69所示核苷酸序列具有至少80％、优选至少90％、更优选至少95％同源性的核苷酸序列组成的DNA的互补链，会经历杂交，但是具有更低同源性水平的DNA的互补链不会经历杂交。更具体而言，钠浓度是150至900mM，优选600至900mM，温度是60℃至68℃，优选65℃。

通过本领域已知的技术，例如Kunkel方法或有缺口的双链体方法，或根据它们的技术，可以导入上述突变，例如缺失、置换和/或添加。例如，可以使用定点诱变的诱变试剂盒，例如Mutant-K(Takara Bio)，Mutant-G(Takara Bio)，或LA PCR体外诱变系列试剂盒(Takara Bio)。

术语“激活UPR的功能”是指，激活内质网(ER)的抗解折叠的蛋白积累的防御反应(例如转录的抑制，分子伴侣诱导的折叠加速，变性蛋白的降解或细胞凋亡造成的细胞死亡)的功能。激活UPR的功能基本上等同于编码由SEQ ID NO：23或70所示的氨基酸序列组成的蛋白的基因的功能。

激活的HAC1基因可以是O.minuta、巴斯德毕赤氏酵母或另一种甲醇同化酵母的基因。其实例包括，编码源自多形汉逊酵母(安格斯毕赤氏酵母)、甲醇毕赤氏酵母和博伊丁假丝酵母的激活的HAC1蛋白的基因。也可以是源自另一个生物物种的激活的HAC1基因，例如其它类型的酵母或霉菌。其实例包括，编码源自啤酒糖酵母的激活的HAC1蛋白(GenBank登记号：NP_116622)的基因(YFL031W，GenBank登记号：由Ire1p从D26506剪接的DNA)，编码源自里氏木霉激活的HAC1蛋白(GenBank登记号：CAC88374)的基因(GenBank登记号：AJ413272)，和编码源自构巢曲霉活性HacA蛋白(GenBank登记号：CAC88375)的基因(GenBank登记号：AJ413273)。

编码源自啤酒糖酵母、里氏木霉和构巢曲霉的激活的HAC1蛋白的基因的核苷酸序列如SEQ ID NO：39，41，和43所示，对应的氨基酸序列如SEQ ID NO：40，42，和44所示。

本文分离的源自Ogataea minuta和巴斯德毕赤氏酵母的激活的HAC1基因是从啤酒糖酵母以外的酵母菌株分离的首个基因。这强烈暗示着，目标基因普遍存在于酵母菌株中，例如甲醇同化酵母菌株。因此，这些基因是在本发明使用的激活的HAC1基因的范围内。

此外，激活UPR的转录因子可以用作前述激活的HAC1基因的替代方案。一个实例是，来自XBP-1基因(例如具有GenBank登记号：NM_005080的人-来源的基因)的、在被Ire1p剪接后激活的基因，它是从动物细胞或其它物种来源的HAC1同源物。也激活HAC1(XBP-1)的Ire1的人工激活，也对应着UPR的激活。因此，认为与导入激活的HAC1基因等价。此外，认为未激活的HAC1基因的强制表达会产生与导入上述激活的HAC1等价的作用。

可以通过任意方法来得到激活的HAC1基因，只要会诱导UPR即可。例如，mRNA可以从下述细胞得到：在其中高水平表达编码难以折叠的蛋白的基因的细胞，或用糖链修饰抑制剂例如衣霉素、氧化还原剂例如DTT或过氧化氢、或UPR诱导物处理过，此后由其合成cDNA的细胞。通过使用DNA合成仪合成其一部分或全长，也可以从已经公开的序列得到mRNA。

(2)RRBP1基因

在本发明中，用于蛋白的高水平分泌生产的另一个基因的实例是RRBP1基因。RRBP1基因是编码称作核糖体结合蛋白1的蛋白的基因，它也称作hES，ES130，ES/130，或DKFZp586A1420基因。哺乳动物RRBP1基因由N-末端跨膜区、富含碱性氨基酸的后续区域、包含10个氨基酸残基的序列的54个重复序列、和C-末端区组成。

在本发明中使用的RRBP1基因没有特殊限制，只要它编码核糖体结合蛋白1即可。实例包括人-来源的RRBP1基因(编码KIAA1398蛋白；GenBank登记号：AB037819)和狗-来源的RRBP1基因(编码核糖体受体p180；GenBank登记号：X87224)。只要与前述基因在功能上等价，可以使用其同源基因。人-来源的RRBP1基因和狗-来源的RRBP1基因的核苷酸序列如SEQ ID NO：45和47所示，对应的氨基酸序列如SEQ ID NO：46和48所示。

同源基因的实例包括：编码由与人或狗来源的RRBP1的氨基酸序列具有至少70％同源性的氨基酸序列组成、且具有核糖体结合活性的蛋白的基因；编码由通过缺失、置换和/或添加一个或几个氨基酸从人或狗来源的RRBP1的氨基酸序列衍生的氨基酸序列组成、且具有核糖体结合活性的蛋白的基因；和在严格条件下与由人或狗来源的RRBP1基因的核苷酸序列或其互补核苷酸序列组成的基因杂交、且编码具有核糖体结合活性的蛋白的基因。同源性程度、严格条件和诱变方法如上所述。

这样的同源基因的具体实例包括源自小鼠(登记号：XM_622097，XM_91338，和XM_991888)、大鼠(登记号：XM_230637)、非洲爪蟾(登记号：NM_001005671)和斑马鱼(zebra danio)(登记号：NM_199431)的RRBP1基因。

RRBP1基因也可以通过普遍已知的技术来得到。例如，可以从在其中表达RRBP1基因的细胞制备mRNA，且可以进一步合成cDNA。

在本发明中，通过制备mRNA和使用反转录酶合成cDNA的一般技术，可以得到用于蛋白的高水平分泌生产的前述基因和编码作为下述高水平分泌生产的靶的外源蛋白的基因(这些基因在下文中称作“靶基因”)。作为前述一般技术的一个实例，使用从靶基因片段合成的DNA探针，筛选源自在其中表达靶基因的细胞或组织的cDNA文库，以便分离目标基因。通过本领域普遍使用的技术，可以制备mRNA。例如，可以用胍试剂或苯酚试剂处理前述细胞或组织，以得到总RNA，然后通过亲和柱方法，使用寡(dT)纤维素柱或聚尿苷酸-琼脂糖凝胶，使用琼脂糖凝胶2B作为载体，或批式技术，得到聚腺苷酸+RNA(mRNA)。此外，通过蔗糖密度梯度离心或通过其它方式，可以分离聚腺苷酸+RNA。随后，将得到的mRNA用作模板，使用寡dT引物和反转录酶合成单链cDNA，使用DNA合成酶I、DNA连接酶、RNA酶H等从单链cDNA合成双链cDNA。使用T4 DNA合成酶，将合成的双链cDNA平端化，进行衔接子(例如EcoRI衔接子)的连接、磷酸化等，掺入λ噬菌体例如λgt11，然后体外包装，以制备cDNA文库。除了λ噬菌体以外，可以使用质粒载体来制备cDNA文库。此后，可以从cDNA文库选择具有目标DNA的菌株(即，阳性克隆)。

当从基因组DNA分离靶基因时，或当分离含有启动子区域和终止子区域的片段时，从源生物的细胞菌株提取基因组DNA，并根据普通技术选择靶基因(Molecular Cloning，1989；Methods in enzymology 194，1991)。例如通过Cryer等人的方法(Methods in Cell Biology，12，39-44，1975)或P.Philippsen等人的方法(Methods Enzymol.，194，169-182，1991)，可以提取基因组DNA。当来源是酵母菌株时，例如，制备酵母原生质体，然后对酵母原生质体进行常规技术，例如已知的DNA提取技术、在高盐浓度去除细胞残余物后的醇沉淀技术或在苯酚或氯仿提取后的醇沉淀技术。

通过例如PCR(PCR Technology，Henry A.Erlich，Stockton Press，1989)，可以得到靶基因。当通过PCR扩增靶基因时，将合成的20聚体至30聚体单链DNA用作引物，将基因组DNA用作模板。证实扩增的基因的核苷酸序列，然后使用。

通过下述方法可以得到含有序列未知的靶基因的片段：(a)通过常规技术制备基因文库，和(b)从得到的要扩增的基因文库选择目标克隆。通过下述方法可以制备基因文库：通过常规技术从源生物的细胞系得到染色体DNA，用适当的断裂限制酶部分地消化染色体DNA，将得到的片段连接至适当的载体，然后将该载体导入适当的宿主细胞。或者，可以从细胞提取mRNA，可以从其合成cDNA，可以将合成的cDNA连接至适当的载体，并且可以将该载体导入适当的宿主细胞，从而可以制备基因文库。在该情况下，可以使用已知是基因文库制备的常规载体的质粒，可以广泛地使用噬菌体、粘粒或其它载体。根据载体类型，可以选择进行转化或转导的宿主细胞。

通过菌落杂交、噬斑杂交或包含使用含有靶基因特异性序列的标记探针的其它方式，可以从上面的基因文库选择携带靶基因片段的克隆。

也可以对靶基因进行化学全合成。例如，制备2对互补的寡核苷酸，然后退火，在DNA连接酶的辅助下连接几个退火的DNA链，或制备几个部分互补的寡核苷酸，通过PCR填充缺口。从而，可以合成基因。

通过常规技术，例如双脱氧方法(Sanger等人，Proc.Natl.Acad.Sci.，U.S.A.，74，5463-5467，1977)，可以测定基因的DNA序列。此外，使用可商业得到的测序试剂盒等，可以容易地测定上述DNA核苷酸序列。

2.表达载体

本发明提供了包含激活的HAC1基因或RRBP1基因的载体，或包含激活的HAC1基因和RRBP1基因两者的载体。为了在宿主细胞中表达激活的HAC1基因和RRBP1基因，可以将包含激活的HAC1基因或RRBP1基因的载体用于实现转化。或者，包含这两个基因的载体可以用于实现转化。这样的表达载体也可以包含编码外源蛋白的基因。或者，可以分别制备包含编码外源蛋白的基因的表达载体。在该情况下，将载体共转染进宿主细胞。

编码外源蛋白的基因没有特别限制。实例包括：各种酶基因，例如α-淀粉酶基因和α-半乳糖苷酶基因；可药用的各种干扰素基因和生理活性蛋白，例如干扰素α和干扰素γ；各种白介素基因，例如IL1和IL2；各种细胞因子基因，例如促红细胞生成素(EPO)基因和粒细胞集落刺激因子(G-CSF)基因；和生长因子基因。这些基因可以通过任意方式来得到。

本发明对于高度疏水的蛋白和由于组分形成而分泌生产不足的蛋白是特别有效的。因而，前述的外源蛋白包括多聚体蛋白，例如抗体或它的功能片段，即，异多聚体。

可以将表达调节区适当地添加到激活的HAC1基因、RRBP1基因或编码外源蛋白的基因，以将表达载体构成蛋白表达单元。蛋白表达单元按照转录读码框的方向包含至少一个启动子区、上述基因和转录终止子区。这里可以使用的启动子可以是诱导型表达启动子或组成型表达启动子。诱导型表达启动子的实例包括参与甲醇同化酵母的甲醇代谢的启动子，例如醇氧化酶(AOX)基因启动子，二羟基丙酮合酶(DAS)基因启动子，和甲酸脱氢酶(FDH)启动子。可以使用的另一种诱导型启动子的实例是铜-诱导型(CUP)启动子。组成型表达启动子的实例包括甘油醛-3-磷酸脱氢酶(TDH，GAP)基因、磷酸甘油激酶(PGK)基因、磷酸丙糖异构酶(TPI)基因、烯醇酶(ENO)基因、肌动蛋白(ACT)基因、细胞色素c(CYC)基因、海藻糖合酶(TPS)基因和醇脱氢酶(ADH)基因的启动子。转录终止子也可以是具有终止启动子的转录的活性的序列。它可以是启动子的相同或不同基因的序列。

为了实现外源蛋白的高水平分泌生产，必须使用有效的启动子。当尝试使用高活性启动子来生产不容易折叠或不容易分泌的蛋白时，可能不利地发生分泌过少。这样的分泌过少因为下述原因而发生。也就是说，蛋白生产超过了在其中进行翻译的核糖体的容量和在其中进行折叠和分泌的内质网的容量。这造成大量生产的蛋白在细胞中变性、积累、遍在蛋白化，和被蛋白体降解。因此，可以适当选择达到下述程度的表达水平的启动子：得到的蛋白会变性，且不会发生聚集，或得到的蛋白不会超过分泌容量。或者，可以减弱启动子的活性，然后可以使用感兴趣的启动子。可以如上在多聚体蛋白中所述，影响形成异多聚体的分子。更具体地，分子例如抗体是包含2个分子的异四聚体，所述2个分子各自是要聚集的重链和轻链。因而，表达水平是实现适当足够的重要因素。当激活的HAC1基因的表达强度非常强时，过度应激会施加于细胞，这可能不利地抑制生长。因而，如上所述需要启动子活性的调节和优化。

本发明的表达载体可以包含用于选择转化体的选择标记。例如，酵母的表达载体可以包含选自下述的营养缺陷型标记基因：His1，His2，His3，His4，His5，His6，Leu2，Alg1，Alg2，Alg3，Trp1，Lys2，Ade1，Ade2，Ura3，和Ura5基因。

作为选择标记，除了前述的营养缺陷型标记以外，可以使用赋予对药物的抗性的抗药标记，所述药物例如浅蓝菌素，金担子素，Zeocin，刀豆氨酸，环己酰亚胺，潮霉素，杀稻瘟素，四环素，卡那霉素，氨苄西林，四环素，和新霉素。从而，可以选择转化体。也可以将赋予对乙醇的溶剂抗性、对甘油或盐的渗透抗性、对铜的金属离子抗性等的基因用作标记，从而选择转化体。

3.转化的宿主细胞

本发明的转化的宿主细胞包含导入其中的上面1所述的基因或上面2所述的表达载体。

要转化的宿主细胞的一个实例是真核细胞，优选酵母菌株。酵母菌株的实例包括甲醇同化酵母菌株，例如Ogataea minuta，巴斯德毕赤氏酵母，多形汉逊酵母(安格斯毕赤氏酵母)，和博伊丁假丝酵母和酵母菌株，例如啤酒糖酵母，乳酸克鲁维酵母，解脂耶氏酵母，和粟酒裂殖酵母。更具体地，Ogataea minuta YK3菌株(Δoch1Δpep4Δprb1Δyps1Δura3Δade1)可以用作Ogataea minuta菌株，啤酒糖酵母BY4741菌株(MATa Δhis3Δ leu2Δmet15Δ ura3)可以用作啤酒糖酵母菌株，尽管酵母菌株不限于此。

此外，本发明意在获得其中增强了分泌必需的内质网的宿主细胞。因此，本发明适用于动物细胞或其它细胞。

在本发明中，可以通过任意方法将表达载体导入宿主细胞中，只要导入的基因在宿主中稳定存在且充分表达即可。常用的这样的方法的实例包括磷酸钙方法(Ito等人，Agric.Biol.Chem.，48，341，1984)，电穿孔(Becker，D.M.等人，1990；Methods.Enzymol.，194，182-187)，使用原生质球(Creggh等人，Mol.Cell.Biol.，5，3376，1985)，乙酸锂方法(Itoh，H.，1983；J.Bacteriol.153，163-168)，和脂转染。

4.生产蛋白的方法

在本发明中，可以如下生产蛋白：通过常规技术培养转化的宿主细胞，从培养产物进行蛋白取样，随后纯化。本文使用的术语“培养产物”是指培养细胞、培养的菌株或破碎的细胞或细菌，以及培养上清液。

根据用于培养宿主细胞的常规方法，可以在培养基中培养转化的宿主细胞。

当转化的宿主细胞是微生物例如酵母时，可以将天然的或合成的培养基用作培养基，只要它含有可被微生物同化的碳源、氮源和无机盐且能有效培养转化体即可。可以使用可被微生物同化的任意碳源，其实例包括：碳水化合物例如葡萄糖，果糖，蔗糖，和淀粉；有机酸例如乙酸和丙酸；和醇例如乙醇和丙醇。氮源的实例包括：氨；无机酸或有机酸的铵盐例如氯化铵，硫酸铵，乙酸铵，和磷酸铵；其它含氮化合物；蛋白胨；肉膏；和玉米浆。无机盐的实例包括：磷酸二氢钾，磷酸氢二钾，磷酸镁，硫酸镁，氯化钠，硫酸铁(I)，硫酸锰，硫酸铜，和碳酸钙。根据选择标记的类型，可以向培养基中适当添加抗生素试剂，例如金担子素，氨苄西林，或四环素。或者，可以去除可由补充辅源营养(例如Leu，Ura，或Trp)的基因提供的氨基酸。

当培养转化的宿主细胞时，在酵母的情况下，例如，优选将培养基的pH水平调节至4-7。培养温度是15℃至32℃，优选约28℃。当表达具有复杂空间结构的蛋白作为抗体时，优选在低温进行培养，以便在细胞中更有效地折叠这样的蛋白。培养持续时间通常是约24至1,000小时，培养可以通过批式培养(例如静止、摇动、搅拌或通气培养)或通过连续培养来实现。

通过SDS-PAGE，蛋白印迹，ELISA等，可以证实来自培养产物(即，培养液或培养的细胞)的外源蛋白的基因的表达产物。

通过常规的蛋白分离和纯化技术，可以分离和纯化生产的蛋白。当在培养后在细菌或细胞中生产靶蛋白时，使用例如超声粉碎机、弗氏细胞压碎器、Manton-Gaulin匀浆器、Dinomil等，可以将细菌或细胞粉碎，以获得靶蛋白。当在细菌或细胞外生产靶蛋白时，原样使用培养液，或通过离心等去除细菌或细胞。此后，根据需要如下收集靶蛋白：使用有机溶剂萃取，进行各种色谱技术(例如疏水、反相、亲和、或离子交换色谱)，使用分子筛进行凝胶过滤，使用聚丙烯酰胺凝胶进行电泳等。这些技术可以单独地或两种或多种组合地使用。从而，可以分离和纯化靶蛋白。

上述培养和纯化技术是实例，方法不限于此。通过常规的氨基酸分析方法，例如通过Edman降解技术实现的自动化氨基酸测序，可以证实纯化的基因产物的氨基酸序列。

5.抑制O-糖链的方法(或抑制PMT活性的方法)

在本发明中，当酵母用作宿主细胞时，前述的培养优选在抑制蛋白O-甘露糖基转移酶(PMT)活性的条件下进行。

在通过肽O-GalNAc转移酶(主要存在于高尔基体中)添加GalNAc后，在哺乳动物细胞中形成O-糖链。这样的糖链添加发生在蛋白折叠之后。相反，酵母和霉菌细胞中的O-糖链形成是在通过由蛋白-O-甘露糖基转移酶(PMT)基因编码的PMT向蛋白的丝氨酸或苏氨酸残基添加甘露糖之后才启动。这样的添加称作PMT活性。甘露糖的添加与细胞内质网(ER)中的蛋白折叠并行进行。从而，不必要的糖链可能不利地添加到在表达哺乳动物蛋白的情况下不应发生这样的添加的部位。结果，这样的不必要的修饰会造成聚集体的不充分形成和更低的活性。

因此，通过在抑制蛋白O-甘露糖基转移酶(PMT)活性的条件下进行培养，可以抑制不必要的O糖链的形成。这也会加速蛋白聚集，并维持蛋白的天然物理性质和活性。在本发明中，通过导入激活的HAC1基因和/或RRBP基因来实现蛋白的高水平分泌生产作用，可以进一步产生协同效应，这通过抑制PMT活性来调节URP增强的O-糖链形成来实现。

通过例如下述的两种方法，可以抑制酵母或霉菌特有的O-糖链的添加。这些方法可以组合进行。

(1)在其抑制参与酵母或霉菌特有的O-糖链的添加的PMT活性的条件下，进行培养和生产。

(2)使用其中抑制参与酵母或霉菌特有的O-糖链的添加的PMT活性的细胞。

通过例如向培养基中加入PMT活性的抑制剂(即，PMT抑制剂)，可以抑制上面(1)的蛋白O-甘露糖基转移酶(PMT)活性。可以使用的PMT活性的抑制剂的一个实例是绕丹宁-3-乙酸衍生物(Bioorganic &Medicinal Chemistry Letters 14，pp.3975-3978，2004)。绕丹宁-3-乙酸衍生物的具体实例包括5-[[3，4-(1-苯基甲氧基)苯基]亚甲基]-4-氧代-2-硫代-3-噻唑烷乙酸(在Bioorganic & Medicinal Chemistry Letters，Vol.14，p.3975，2004中所述的化合物(1c))和{(5Z)-4-氧代-5-[3-(1-苯基乙氧基)-4-(2-苯基乙氧基)亚苄基]-2-硫代-1，3-噻唑烷-3-基}乙酸(在Bioorganic &Medicinal Chemistry Letters，Vol.14，p.3975，2004中所述的化合物(5a))。这样的PMT活性的抑制剂(绕丹宁-3-乙酸衍生物)最初被视作抗细菌剂，没有为提高蛋白质量或生产力目的而检查它。在本发明中首次发现了该作用。PMT对于构成酵母菌株壁的甘露糖蛋白的产生而言是重要的。非常低的PMT活性会不利地影响酵母的生长。因此，当使用诱导型表达系统时，随着细胞生长在表达外源蛋白的基因时添加PMT活性抑制剂是更有效的。从而，可以在最高水平生产其中抑制了O-糖链修饰的高质量靶蛋白。

通过破坏PMT基因或抑制该基因的表达，可以抑制上面(2)所述的蛋白O-甘露糖基转移酶(PMT)活性。在啤酒糖酵母中，PMT由至少6个基因编码；即，PMT1基因(GenBank：L19169)，PMT2基因(GenBank：L05146)，PMT3基因(GenBank：X83797)，PMT4基因(GenBank：X83798)，PMT5基因(GenBank：X95644)，和PMT6基因(GenBank：Z72984)，这些基因独立地形成同二聚体(PMT4p)或异二聚体(PMT1p/PMT2p)，且表现出活性。已知效应PMT随糖蛋白而异。在本发明中，发现PMT蛋白在向抗体添加O-糖链方面具有选择性。具体而言，在PMT5或PMT6基因缺陷型菌株中没有发现抑制O-糖链添加的作用，如实施例所述。

因而，PMT对于酵母的生长而言是重要的基因。当消除或极端降低活性、例如破坏PMT基因时，细胞壁会变脆。因而，PMT基因缺陷型菌株的使用需要注意。在WO 2002/046437中公开的PMT基因的破坏不总是有效的。它有时由于生长抑制而不利地影响外源蛋白的生长，希望抑制具有最佳PMT活性的PMT基因的破坏或表达，这可以使对靶蛋白的O-糖链添加和修饰最小化。抑制PMT基因的方法的实例包括，涉及使用反义RNA或RNAi的方法，和减弱启动子的方法。在本发明中，证实了在其中将DNA片段插入PMT结构基因部分和启动子区来切割基因的方法(在下文中，这样的方法可以称作“基因的插入灭活”，用于基因的插入灭活的质粒载体称作“插入灭活载体”)是减弱启动子的方式的一个实例。也可以采用这样的方法，其中导入不具有PMT活性但是作为蛋白产生的PMT基因片段或其活性相关氨基酸残基已经突变的基因，以抑制PMT活性(即，显性失活方法)。

实现本发明的最佳模式

在下文中，参考实施例详细描述本发明，尽管本发明的技术范围不限于实施例。在本发明的实施例中使用的质粒、限制酶、DNA修饰酶等是可商业得到的产品，这些产品可以根据常规技术使用。DNA克隆、核苷酸测序、宿主细胞转化、转化的宿主细胞的培养、从培养产物取样和纯化酶等的操作也是本领域众所周知的，可以从现有的出版物获知。

[实施例1]表达外源基因的质粒的构建

(1)构建表达外源基因的串联载体，其包含具有作为标记的G418-抗性基因的AOX1基因启动子、终止子盒和GAP基因启动子和终止子盒

在WO 2003/091431中公开的pOMex3G和pOMexGP1U用作材料。用XbaI切割pOMex3G，平端化，然后导入SpeI接头。得到的载体称作pOMex3GXS。单独地，用EcoT22I切割pOMexGP1U，并平端化，然后导入ApaI接头。得到的载体称作pOMexGP1UTA。用HindIII和KpnI消化pOMexGP1UTA，并平端化。此后，用ApaI消化分离的含有GAP启动子和终止子的约2.0kb的片段，然后导入平端化的pOMex3GXS。得到的载体称作pOMexGAT-G。pOMexGAT-G是包含AOX1表达盒内的SpeI-BamHI位点和GAP表达盒内的SalI-ApaI位点的串联载体。

(2)使用ADE1基因作为选择标记，使用GAP基因启动子和终止子构建表达外源基因的载体

在WO 2003/091431中公开的pOMex4A用作材料。用EcoT22I处理前述的pOMexGP1U，并平端化，然后导入BamHI接头。得到的载体称作pOMexGP2U。用SalI处理pOMexGP2U，并平端化，然后导入SpeI接头。得到的载体称作pOMexGP3U。用HindIII和KpnI消化pOMexGP3U，分离含有GAP表达盒的约2.0kb的片段。将得到的片段连接至包含通过用HindIII-KpnI处理pOMex4A分离的ADE1标记的约5.0kb片段。得到的载体称作pOMexGP1A。pOMexGP1A是包含GAP表达盒内的SpeI-BamHI位点的表达外源基因的载体。

(3)使用潮霉素B-抗性基因作为选择标记，使用磷酸甘油激酶(PGK1)启动子和终止子构建表达外源基因的载体

从Ogataea minuta IFO10746菌株得到编码磷酸甘油激酶的PGK1基因，并测定其核苷酸序列。

(3-1)探针的制备

以下述方式合成包含与源自啤酒糖酵母(GenBank登记号：P00560)和麦芽糖假丝酵母(GenBank登记号：P41757)的保守氨基酸序列即RVDFNVPLD和EGKELPGVA相对应的核苷酸序列的DNA简并引物。

PPG5：5′-GN GTN GAY TTY AAY GTN CCN TTR GA-3′(SEQ IDNO：1)

PPG3：5′-GY NAC DCC NGG YAA YTC YTT DCC YTC-3′(SEQ IDNO：2)

PPG5引物(SEQ ID NO：1)与氨基酸序列RVDFNVPLD相对应，PPG3引物(SEQ ID NO：2)是与氨基酸序列EGKELPGVA相对应的核苷酸序列的互补链的序列。O.minuta IFO10746菌株的染色体DNA用作模板，使用PPG5和PPG3引物进行PCR，该PCR在94℃进行30秒，在50℃进行1分钟，在72℃进行1分钟，该循环重复25次。回收扩增的DNA片段(约1.2kb)，并使用TOPO TA克隆试剂盒克隆。从得到的克隆分离质粒DNA，并测定核苷酸序列。从而，选择在质粒插入的DNA片段中含有编码与源自啤酒糖酵母和麦芽糖假丝酵母的PGK1基因的氨基酸序列具有高度同源性的氨基酸序列的核苷酸序列的克隆。在用EcoRI切割质粒后，回收1.2-kb插入DNA的片段，随后进行琼脂糖凝胶电泳。

(3-2)文库的制备和筛选

用不同的限制酶切割O.minuta IFO10746菌株的染色体DNA，并进行0.8％琼脂糖凝胶电泳。将分离的DNA转移到Hybond N+尼龙膜(Amersham)上。使用AlkPhos DIRECT(Amersham)标记在上面(1-3-1)中得到的DNA片段，随后进行DNA印迹杂交。根据常规技术(Molecularcloning第2版，Sambrook，J.，等人编，Cold Spring Harbor LaboratoryU.S.A.，1989)进行杂交。结果，认为PGK1基因存在于约9.0kb的BamHI片段中。为了克隆该DNA片段，制备了基因组文库。用BamHI切割O.minuta的染色体DNA，并进行琼脂糖电泳，从凝胶回收约9.0kb的DNA片段。将回收的DNA片段连接至BamHI-切割的pUC118，并根据Hanahan的方法(Gene，10，63，1980)转化进大肠杆菌DH5α菌株，以制备文库。使用前述的DNA片段作为探针，通过菌落杂交筛选约4,000个克隆。从得到的阳性克隆中，选择携带PGK1基因的pOMPGK1质粒。

(3-3)核苷酸测序

通过引物步移方法，测定pOMPGK1质粒的BamHI区域的核苷酸序列，发现测定的序列具有SEQ ID NO：3所示的核苷酸序列。SEQ IDNO：3所示的核苷酸序列包括一个可读框，后者包含从核苷酸4,766至6,016的1,254个碱基对。检查基于可读框推导出的SEQ ID NO：4所示的氨基酸序列与源自啤酒糖酵母和麦芽糖假丝酵母的和磷酸甘油激酶之间的同源性。结果，发现前一种同源性是74％，后一种同源性是81％。

(3-4)使用PGK1基因启动子和终止子构建外源基因表达盒

制备表达盒，其将外源基因导入含有PGK1基因启动子的片段和含有O.minuta的终止子的片段之间。为了在PGK1基因启动子和终止子之间导入SpeI、BglII和BamHI位点，合成了下述引物。

OPGK-P-F：

5′-AAGCTTGACAATGTAGGAGATCATAAACACATCGTGCGCGTC-3′(SEQ ID NO：5)

OPGK-P-R：

5′-GGATCCAGATCTCATATGACTAGTTGCTAGTTCTATGCGGCGTTAGTGTTTACACTACGACAGCT-3′(SEQ ID NO：6)

OPGK-T-F：

5′-GGATCCGTGGGATTTGCGTGATCTACGTAGTGGTTATTTT-3′(SEQID NO：7)

OPGK-T-R：

5′-GGTACCGCAGTGAAAGGCGATGCCACCATGTGCAAGGAGTTC-3′(SEQ ID NO：8)

使用上述pOMPGK1作为模板，使用OPGK-P-F引物(SEQ ID NO：5)和OPGK-P-R引物(SEQ ID NO：6)进行PCR，在94℃进行30秒，在55℃进行1分钟，在72℃进行1分钟，该循环重复20次。还使用OPGK-T-F引物(SEQ ID NO：7)和OPGK-T-R引物(SEQ ID NO：8)进行PCR，该PCR在94℃进行30秒，在55℃进行1分钟，在72℃进行1分钟，该循环重复20次。回收扩增的1.5-kb和1.0-kb DNA片段，并使用TOPO TA克隆试剂盒克隆。测定插入DNA片段的核苷酸序列，以选择具有正确核苷酸序列的克隆。将1.5-kb和1.0-kb插入DNA片段分别分离为HindIII-BamHI片段和BamHI-KpnI片段。

将前述的1.0-kb BamHI-KpnI片段导入WO 2003/091431所述的pOMex5H的BamHI和KpnI之间。此后，将前述的1.5-kb HindIII-BamHI片段导入得到的质粒的HindIII和BamHI之间。得到的质粒称作pOMexPGHy。pOMexPGHy是表达外源基因的载体，其包含PGK1基因表达盒内的SpeI，BglII，和BamHI。

[实施例2]抗体基因表达载体的构建

为了克隆源自啤酒糖酵母的MF α1(GenBank登记号：P01149)的分泌信号(下文称作“aMF分泌信号”)，合成了下述引物。

Sp-aMFs-F：5′-ACTAGTATGAGATTTCCTTCAATTT-3′(SEQ ID NO：9)

Sl-aMFs-F：5′-GTCGACATGAGATTTCCTTCAATTT-3′(SEQ ID NO：10)

Xb-aMFs-R：5′-AGCTTCAGCCTCTCTTTTATCTAGAGA-3′(SEQ IDNO：11)

以与上述相同的方式得到的啤酒糖酵母的基因组DNA用作模板，使用Sp-aMFs-F引物(SEQ ID NO：9)和Xb-aMFs-R引物(SEQ ID NO：11)进行PCR，该PCR在94℃进行30秒，在55℃进行1分钟，在72℃进行30秒，该循环重复20次。也使用Sl-aMFs-F引物(SEQ ID NO：10)和Xb-aMFs-R引物(SEQ ID NO：11)进行PCR，该PCR在94℃进行30秒，在55℃进行1分钟在72℃进行30秒，该循环重复20次。回收在每个PCR中的约0.3kb的扩增的DNA片段，并使用TOPO TA克隆试剂盒进行克隆。证实插入DNA序列的核苷酸序列，得到的质粒分别称作TOPOaMFsSP和TOPOaMFsSL。

将抗-TRAIL受体抗体基因(WO 2002/094880)用作抗体基因。为了将限制酶位点导入在轻链和重链基因的两端处的位点，合成了下述引物。

Xb-KREAEA-Hc-F：

5′-TCTCTAGATAAAAGAGAGGCTGAAGCTCAGCTGCAGCTGCAGGAGTC-3′(SEQ ID NO：12)

Hc-R-Bg：

5′-CCAGATCTGGATCCTCATTTACCCGGAGACAGGGAGAGG-3′(SEQID NO：13)

Xb-KREAEA-Lc-F：

5′-TCTCTAGATAAAAGAGAGGCTGAAGCTGAAATTGTGTTGACACAGTC-3′(SEQ ID NO：14)

Lc-R-Ap：

5′-AAAGGGCCCTCAACACTCTCCCCTGTTGAAGCTCT-3′(SEQ ID NO：15)

使用这些DNA引物进行PCR，经下述的20个循环扩增轻链：在94℃进行30秒，在55℃进行1分钟，在72℃进行1分钟，并经下述的20个循环扩增重链：在94℃进行30秒，在55℃进行1分钟，在72℃进行1分钟30秒，并将扩增的产物克隆进pCR2.1-TOPO。证实插入DNA序列的核苷酸序列，得到的质粒分别称作TOPOHc-Trail和TOPOLc-Trail。经3片段连接，将通过SalI和XbaI消化从TOPOaMFsSL分离的aMF分泌信号和通过XbaI和ApaI消化从TOPOLc-Trail分离的抗体轻链导入SalI-ApaI-消化的pOMexGAT-G。得到的质粒称作pOMexGAT-G/L。随后，经3片段连接，将通过SpeI和XbaI消化从TOPOaMFsSP分离的aMF分泌信号和通过XbaI和BglII消化从TOPOHc-Trail分离的抗体重链导入SpeI-BamHI-消化的pOMexGAT-G/L。得到的载体称作pOMexGAT-G/Ab(图3)。pOMexGAT-G/Ab是包含抗体重链和轻链表达单元的抗体表达载体。

[实施例3]O.Minuta的激活的HAC1基因表达载体的构建

如下得到激活的HAC1基因：在27℃在YPD培养基中培养细胞(O.minuta YK2-3菌株)12小时，在培养基中加入衣霉素至10μg/ml的浓度，以便诱导UPR。在含有衣霉素的培养基中培养另外12小时。收集细胞后，使用Yeastar RNA试剂盒(ZYMO research)制备mRNA。

使用DNA酶I Amplification Grade(Invitrogen)，对得到的mRNA进行DNA酶处理。使用Super script III用于RT的第一链合成(Invitrogen)，从mRNA合成cDNA。使用下述的HAC1-1 DNA引物(SEQID NO：16)和HAC1-12引物(SEQ ID NO：17)，通过PCR扩增得到的cDNA：在94℃进行30秒，在52℃进行30秒，在72℃进行1分钟，该循环重复30次。将扩增的产物克隆进pCR2.1-TOPO(Invitrogen)。此后，证实两类PCR-扩增的基因片段的核苷酸序列(SEQ ID NO：18和19)。

HAC1-1：5′-ATGACTTCCTTTTCAGCACCGCATC-3′(SEQ ID NO：16)

HAC1-12：5′-CAAAATTGCAAGCAAGTTAACCG-3′(SEQ ID NO：17)

得到的两类cDNA片段之一与基因组序列相一致；但是，另一个片段是缺少其一部分的缩短的序列，即，由UPR激活的Ire1p剪接的cDNA片段。为了得到激活的HAC1的cDNA，使用cDNA合并物重复在94℃进行30秒、在55℃进行1分钟和在72℃进行30秒的PCR循环20次，推导出它含有speHAC1F DNA引物(SEQ ID NO：20)、bglHAC1R引物(SEQ ID NO：21)和激活的HAC1的cDNA。

speHAC1F：5′-gactagtATGACTTCCTTTTCAGCACCG-3′(SEQ IDNO：20)

bglHAC1R：5′-cagatctTCATGACAAGAAATCATCGAAT-3′(SEQ IDNO：21)

得到的约1kb的片段包含从激活的HAC1基因的起始密码子至终止密码子的序列(SEQ ID NO：22)，它等同于包含320个氨基酸残基的激活的Hac1p的氨基酸序列(SEQ ID NO：23)。用SpeI和BglII处理该序列，分离，然后导入SpeI-BglII-处理过的pOMexPGHy。得到的载体称作pOMexPGHy/Hac1(图3)。该载体包含激活的HAC1基因表达单元。

[实施例4]人RRBP1基因表达载体的构建

使用由Kazusa DNA研究机构提供的人RRBP1基因(KIAA1398，GenBank登记号AB037819)。为了在该基因的两个末端部导入限制酶位点，使用下述DNA引物，即p180 MSp-F和p180 UBg-R(SEQ ID NO：24和25)和人RRBP1基因，经20个在94℃进行30秒、在55℃进行1分钟和在72℃进行5分钟的循环，通过PCR扩增目标基因。

p180 MSp-F：

5′-ATACAATACAAAGTCGAGACTAGTATGGATATTTACGACACTCAAACCTT-3′(SEQ ID NO：24)

p180 UBg-R：

5′-TCTATCCACACGGATCAGATCTTCAGACAGAGGTGCCCTCCTTTGAGCTG-3′(SEQ ID NO：25)

使用BD In-Fusion Dry-Down PCR克隆试剂盒(BD Science)，将得到的约4.5kb的片段导入SpeI-BamHI-消化的pOMexGP1A。从SpeI位点确定包含编码人RRBP1基因起始密码子的区域的约500bp序列，并从BamHI位点确定包含编码人RRBP1基因终止密码子的区域的约500bp片段。得到的载体称作pOMexGP1A/p180PCR。用NdeI和AscI消化pOMexGP1A/p180PCR，从质粒去除包含人RRBP1基因的ORF中从110bp至4541bp的区域的片段。单独地，用NdeI和AscI消化由Kazusa DNA研究机构提供的人RRBP1基因，分离包含ORF的110bp至4541bp的区域的片段，将分离的片段导入前述的NdeI-AscI-消化的pOMexGP1A/p180PCR。得到的载体称作pOMexGP1A/p180(图3)。pOMexGP1A/p180是人RRBP1基因表达载体。

[实施例5]表达抗体的酵母菌株(O.minuta)的制备

使用NotI-消化的pOMexGAT-G/Ab载体，通过电穿孔转化O.minuta YK-3菌株(在WO 2003/091431中所述的Δoch1Δpep4Δprb1Δyps1Δura3Δade1)。采用在WO 2003/091431中所述的电穿孔条件。在含有50μg/ml G418的YPD琼脂平板培养基中选择转化的细胞，并培养。此后，提取基因组，使用前述的Xb-KREAEA-Hc DNA引物(SEQ ID NO：12)和Hc-R-Bg引物(SEQ ID NO：13)，通过PCR证实重链的导入，并使用前述的Xb-KREAEA-Lc-F引物(SEQ ID NO：14)和Lc-R-Ap引物(SEQ ID NO：15)，通过PCR证实轻链的导入。已经观察到重链和轻链基因的导入的菌株，称作产抗体的O.minuta AO1菌株。

[实施例6]表达激活的HAC1基因和RRBP1基因的产抗体酵母菌株(O.minuta)的制备

通过电穿孔，将Sse8783I-消化的pOMexGP1A/p180导入在实施例5中生长的产抗体的O.minuta AO1菌株。如下得到转化的菌株：在SD琼脂平板培养基中选择ADE+菌株，培养该菌株，提取基因组，使用上述的p180 MSp-F(SEQ ID NO：24)和p180 UBg-R(SEQ ID NO：25)，通过PCR证实RRBP1基因的导入。得到的转化菌株称作O.minuta AK2R菌株。同时，使用Sse8783I-消化的pOMexGP1A进行转化，得到O.minutaAK2A菌株作为对照。此外，通过电穿孔，将Aor51HI-消化的pOMexPGHy-Hac1导入O.minuta AK2R菌株和O.minuta AK2A菌株。如下证实激活的HAC1基因向转化菌株中的导入：在包含50μg/ml潮霉素的YPD琼脂平板培养基中选择菌株，培养该菌株，提取基因组，并使用speHAC1F DNA引物(SEQ ID NO：20)和bglHAC1R引物(SEQ IDNO：21)，通过PCR确认。得到的菌株分别称作O.minuta AK3RH菌株和O.minuta AK3AH菌株。同时，将Aor51HI-消化的pOMexPGHy导入O.minuta AK2R菌株和O.minuta AK2A菌株，以得到O.minutaAK3RHy菌株和O.minuta AK3AHy菌株作为对照。

[实施例7]转化的酵母菌株(O.minuta)分泌抗体的证实

在28℃，在BYPMG培养基(1％酵母提取物(Difco)，2％多聚胨(Difco)，1.5％甲醇，0.5％甘油，和0.1M磷酸盐缓冲液(pH 6.0))中培养O.minuta AK3RH、O.minuta AK3AH、O.minuta AK3RHy、和O.minutaAK3AHy菌株4天。从培养液制备培养上清液，并进行SDS-PAGE。将分离的蛋白在PVDF膜上印迹，使用标记的抗-人抗体(抗-人Fc抗体和抗-人κ抗体)，进行蛋白印迹分析。结果，发现已经导入RRBP1基因和激活的HAC1基因的菌株会分泌比其它菌株明显更大量的抗体，如图4所示。

[实施例8]转化的酵母菌株(O.minuta)的分泌抗体的生产力

使用蛋白A柱(Poros A 50um 4.6mm D/50mml，AppliedBiosystems)，对在实施例7中制备的培养液进行HPLC，以测量抗体产量(分离条件：平衡缓冲液：10mM磷酸盐缓冲液(pH 6.0)；洗脱缓冲液：10mM磷酸盐缓冲液(pH 3.4)；流速：4ml/min；检测：210nm)。使用在动物细胞(CHO)中生产的抗体作为标准样品。图5显示了按照OD 600＝1的抗体生产力。与对照菌株即O.minuta AK3AHy菌株中的量相比，在仅导入RRBP1基因的O.minuta AK3RHy菌株中和在仅导入激活的HAC1基因的O.minuta AK3AH菌株中，分泌的抗体的量趋向增加。但是，在表达激活的HAC1基因和RRBP1基因两者的O.minuta AK3RH菌株中的抗体生产量，显著大于对照菌株即O.minuta AK3AHy菌株和已经单独导入激活的HAC1基因或RRBP1基因的菌株。因而证实了，激活的HAC1基因和RRBP1基因的共表达会对抗体生产力产生超过协同效应的作用。

[实施例9]在抑制O-糖链形成的条件下使用转化的酵母菌株(O.minuta)生产抗体

在BYPG培养基(1％酵母提取物(Difco)，2％聚胨(Difco)，0.5％甘油，和0.1M磷酸盐缓冲液(pH 6.0))中培养O.minuta AK3RH和O.minutaAK3AHy 2天，在28℃在BYPM培养基[1％酵母提取物(Difco)，2％聚胨(Difco)，1.5％甲醇，和0.1M磷酸盐缓冲液(pH 6.0)]中培养这些菌株2天，所述BYPM培养基中已经加入了0μM，1μM，5μM，10μM，20μM，和50μM PMT抑制剂(绕丹宁-3-乙酸衍生物：5-[[3，4-(1-苯基甲氧基)苯基]亚甲基]-4-氧代-2-硫代-3-噻唑烷乙酸(在Bioorganic & MedicinalChemistry Letters，Vol.14，p.3975，2004中所述的化合物(1c)))。从培养液制备培养上清液，并进行SDS-PAGE。此后，将分离的蛋白在PVDF膜上印迹，使用标记的抗-人抗体(抗-人Fc抗体)进行蛋白印迹分析。图6显示了结果。要加入的PMT抑制剂的适当浓度是5μM。在该情况下，抗体分泌量和聚集体形成百分比都增加。

[实施例10]抗体基因表达载体的构建

为了表达源自啤酒糖酵母的MF α1(GenBank登记号：P01149)的分泌信号(下文称作“aMF分泌信号”)、抗-TRAIL受体抗体的轻链和其重链的融合蛋白，使用下述寡核苷酸引物，通过重叠延伸PCR，将aMF分泌信号基因连接至抗-TRAIL受体抗体基因(WO 2001/083560)。

对于aMF分泌信号-抗TRAIL受体抗体的重链

EcoALF：5′-GGAATTCATGAGATTTCCTTCAAT-3′(SEQ ID NO：26)

AlfH02：5′-CTCCACCAGCTGTACTTCTCTTTTCTCGAGAGATA-3′(SEQ ID NO：27)

AlfH03：

5′-TATCTCTCGAGAAAAGAGAAGTACAGCTGGTGGAG-3′(SEQ IDNO：28)

AlfH04：5′-GGTCGACTCATTTACCCGGGGACAG-3′(SEQ ID NO：29)

对于aMF分泌信号-抗TRAIL受体抗体的轻链

EcoALF：5′-GGAATTCATGAGATTTCCTTCAAT-3′(SEQ ID NO：26)

AlfL02：5′-TGGGTCATCTGAATGTCTCTTTTCTCGAGAGATA-3′(SEQ ID NO：30)

AlfL03：5′-TATCTCTCGAGAAAAGAGACATTCAGATGACCCA-3′(SEQ ID NO：31)

AlfL04：5′-GGTCGACCTAACACTCTCCCCTGT-3′(SEQ ID NO：32)

使用用Y-DER酵母DNA提取试剂(PIERCE)制备的啤酒糖酵母的基因组DNA作为模板，扩增aMF分泌信号基因区。使用EcoALF引物(SEQ ID NO：26)和AlfH02引物(SEQ ID NO：27)，通过PCR得到重链的aMF分泌信号，所述PCR在95℃进行10秒，在55℃进行30秒，在68℃进行60秒，该循环重复30次。使用EcoALF引物(SEQ ID NO：26)和AlfL02引物(SEQ ID NO：30)，通过PCR得到轻链的aMF分泌信号，所述PCR在95℃进行10秒，在55℃进行30秒，在68℃进行60秒，该循环重复30次。回收约0.26kb的扩增的靶DNA片段。

使用抗-TRAIL受体抗体的cDNA(WO2001/083560)作为模板，扩增抗体基因区。使用AlfH03引物(SEQ ID NO：28)和AlfH04引物(SEQ IDNO：29)，通过PCR得到重链片段，所述PCR在95℃进行10秒，在55℃进行30秒，在68℃进行90秒，该循环重复30次。使用AlfL03引物(SEQ ID NO：31)和AlfL04引物(SEQ ID NO：32)，通过PCR得到轻链片段，所述PCR在95℃进行10秒，在55℃进行30秒，在68℃进行90秒，该循环重复30次。回收约1.35kb的扩增的重链区域的靶DNA片段和约0.65kb的轻链区域的靶DNA片段。

随后，将重链的aMF分泌信号区域和约1.35kb的重链区域用作模板，使用EcoALF引物(SEQ ID NO：26)和AlfH04引物(SEQ ID NO：29)，进行PCR，该PCR在95℃进行10秒，在55℃进行30秒，在68℃进行90秒，该循环重复30次。回收约1.6kb的扩增的靶DNA片段。还将轻链的aMF分泌信号区域和约0.65kb的轻链区域用作模板，使用EcoALF引物(SEQ ID NO：26)和AlfL04引物(SEQ ID NO：32)，进行PCR，该PCR在95℃进行10秒，在55℃进行30秒，在68℃进行60秒，该循环重复30次。回收约0.9kb的扩增的靶DNA片段。将回收的DNA片段克隆进pCR2.1-TOPO。基于插入DNA片段的核苷酸序列，发现这些序列具有这样的基因，其中aMF分泌信号已经框内融合于抗体重链，aMF分泌信号已经框内融合于抗体轻链。得到的质粒分别称作TOPO-alfHc和TOPO-alfLc。将导入EcoALF引物(SEQ ID NO：26)的EcoRI限制酶位点和导入AlfH04引物(SEQ ID NO：29)和AlfL04引物(SEQ ID NO：32)的SalI限制酶位点，用于通过TOPO-alfHc和TOPO-alfLc的EcoRI-SalI消化，回收编码aMF分泌信号和抗体重链的融合产物和aMF分泌信号和抗体轻链的融合产物的DNA片段。

为了在啤酒糖酵母中表达抗体重链和抗体轻链，将通过EcoRI-SalI消化回收的编码aMF分泌信号和抗体重链的融合产物和aMF分泌信号和抗体轻链的融合产物的DNA片段连接至甘油醛-3-磷酸脱氢酶基因(TDH3，GAP)启动子-终止子盒中的EcoRI-SalI位点，该盒已经导入YEp352大肠杆菌-酵母穿梭载体(Yeast 2，p.163-167，1986)。得到的质粒分别称作YEp352GAP-II-alfHc和YEp352GAP-II-alfLc。随后，将在GAP启动子-终止子盒的2个末端的BamHI限制酶位点用于分别从YEp352GAP-II-alfHc和YEp352GAP-II-alfLc回收编码BamHI-GAP启动子-aMF分泌信号-抗体重链-GAP终止子-BamHI的基因片段(片段1)和编码BamHI-GAP启动子-aMF分泌信号-抗体轻链-GAP终止子-BamHI的基因片段(片段2)。通过3片段连接，将片段1和2导入YEp352GAP-II-alfHc或Ep352GAP-II-alfLc的BamHI位点，从中切割片段1或2。得到的载体称作YEp352 GAP-II-alfHc/alfLc(图7)。基于限制酶切割图谱，证实了片段1和2以正向在YEp352 GAP-II-alfHc/alfLc中的串联导入。YEp352 GAP-II-alfHc/alfLc是携带抗体重链和轻链表达单元的抗体表达载体。

[实施例11]啤酒糖酵母激活的HAC1基因表达载体的构建

激活的IRE1的RNA酶活性从啤酒糖酵母的HAC1前体mRNA去除252个核苷酸，形成成熟的HAC1 mRNA。该成熟的HAC1 mRNA翻译成激活的HAC1，从其C末端去除10个氨基酸残基，并新添加18个氨基酸残基(PNAS 97，pp.4660-4665，2000)。从而，使用下述寡核苷酸引物，通过重叠延伸PCR，构建编码激活的HAC1的基因。

HAC-Sac-ATG：5′-GGAGCTCATGGAAATGACTGATTTTG-3′(SEQID NO：33)

HAC-内部R：

5′-GAATTCAAACCTGACTGCGCTTCTGGATTACGCCAATTGTCAAG-3′(SEQ ID NO：34)

HAC-内部F：

5′-CTTGACAATTGGCGTAATCCAGAAGCGCAGTCAGGTTTGAATTC-3′(SEQ ID NO：35)

HAC-Sma-STOP：5′-GCCCGGGTCATGAAGTGATGAAGAAATC-3′(SEQ ID NO：36)

将使用Y-DER酵母DNA提取试剂(PIERCE)制备的啤酒糖酵母基因组DNA用作模板。使用HAC-Sac-ATG引物(SEQ ID NO：33)和HAC-内部R引物(SEQ ID NO：34)进行PCR，该PCR在95℃进行10秒，在55℃进行30秒，在68℃进行60秒，该循环重复30次。单独地，使用HAC-内部F引物(SEQ ID NO：35)和HAC-Sma-STOP引物(SEQ ID NO：36)进行PCR，该PCR在95℃进行10秒，在55℃进行30秒，在68℃进行60秒，该循环重复30次。回收约0.66kb(片段A)和约0.06kb(片段B)的扩增的靶DNA片段。

随后，将扩增的片段A和片段B用作模板，使用HAC-Sac-ATG引物(SEQ ID NO：33)和HAC-Sma-STOP引物(SEQ ID NO：36)进行PCR，该PCR在95℃进行10秒，在55℃进行30秒，在68℃进行60秒，该循环重复30次，以得到约0.7kb的扩增的靶DNA片段。将回收的DNA片段克隆进pCR2.1-TOPO。基于插入DNA片段的核苷酸序列，发现该片段具有编码含有238个氨基酸残基的激活的HAC1的基因。该质粒称作TOPO-aHac1。使用已经导入HAC-Sac-ATG引物(SEQ ID NO：33)中的SacI限制酶位点和已经导入HAC-Sma-STOP引物(SEQ ID NO：36)中的SmaI限制酶位点，通过SacI-SmaI消化来回收编码激活的HAC1的基因。

为了在啤酒糖酵母中表达激活的HAC1，将通过SacI-SmaI消化回收的编码激活的HAC1的基因连接至甘油醛-3-磷酸脱氢酶基因(TDH3，GAP)启动子-终止子盒中的SacI-SmaI位点位点，该盒已经导入YEp351大肠杆菌-酵母穿梭载体(Yeast 2，pp.163-167，1986)。得到的质粒称作YEp351GAP-II-aHAC1(图7)。该载体包含激活的HAC1基因表达单元。

[实施例12]人RRBP1基因表达载体的构建

使用由Kazusa DNA研究机构提供的人RRBP1基因(KIAA1398，GenBank登记号：AB037819)。为了在上述基因的两端都导入限制酶位点，使用下述寡核苷酸引物P180kpnatg和P180xbastop(SEQ ID NO：37和38)和人RRBP1基因，通过PCR扩增基因，该PCR在95℃进行10秒，在55℃进行30秒，在68℃进行6分钟，该循环重复30次。

P180kpnatg：5′-GGGTACCATGGATATTTACGACACTC-3′(SEQ IDNO：37)

P180xbastop：5′-GTCTAGATCAGACAGAGGTGCCCTCC-3′(SEQ IDNO：38)

回收得到的约4.7kb的片段，克隆进pCR2.1-TOPO。基于插入DNA片段的核苷酸序列，证实在插入片段的两端的约600bp的区域都适当地包含目标核苷酸序列。得到的质粒称作TOPO-P180。随后，用NdeI和HpaI限制酶消化TOPO-P180，回收含有与KIAA1398的110bp至4524bp之间的区域等同的区域的片段。向取出的区域中导入KIAA1398的约4.4kb的NdeI-HpaI片段，以构建TOPO-P180N，使用大肠杆菌SCS110菌株(Stratagene)使XbaI限制酶位点去甲基化。使用已经导入P180kpnatg引物(SEQ ID NO：37)和P180xbastop引物(SEQ ID NO：38)中的KpnI-XbaI限制酶位点，回收包含编码RRBP1的基因的KpnI-XbaI片段。

为了在啤酒糖酵母中表达RRBP1，将上面回收的KpnI-XbaI片段连接至甘油醛-3-磷酸脱氢酶基因(TDH3，GAP)启动子-终止子盒中的KpnI-XbaI位点，该盒已经导入YEp352大肠杆菌-酵母穿梭载体(Yeast 2，pp.163-167，1986)。得到的质粒称作YEp352GAP-II-p180。随后，用PvuI限制酶消化YEp352GAP-II-p180，回收含有GAP启动子-RRBP1基因-GAP终止子的PvuI片段。将PvuI片段连接至包含标记基因的PvuI片段，即YEp351大肠杆菌-酵母穿梭载体(Yeast 2，pp.163-167，1986)的复制必需的区域，以构建YEp351GAP-II-p180(图7)。该载体包含RRBP1基因表达单元。

[实施例13]激活的HAC1基因和RRBP1基因的共表达载体的构建

为了使用单一载体将激活的HAC1基因和RRBP1基因导入啤酒糖酵母，构建了激活的HAC1基因和RRBP1基因的共表达载体。用HpaI限制酶消化在实施例11中构建的YEp351GAP-II-aHAC1。随后，从在实施例12中构建的YEp352GAP-II-p180回收含有GAP启动子-RRBP1基因-GAP终止子的BamHI片段，使用T4DNA聚合酶(Takara Bio)将两个末端平端化，将产物导入YEp351GAP-II-aHAC1的HpaI位点。得到的质粒称作YEp351GAP-II-aHAC1/p180(图7)。分析核苷酸序列，以确定导入含有导入的GAP启动子-RRBP1基因-GAP终止子的BamHI片段的方向。该载体包含激活的HAC1基因和RRBP1基因的表达单元。

[实施例14]构建表达抗体的酵母菌株和表达激活的HAC1基因和RRBP1基因的表达抗体的酵母菌株(啤酒糖酵母)

使用Frozen-EZ酵母转化II试剂盒(ZYMO RESARCH)，制备啤酒糖酵母BY4741菌株的感受态细胞(MATa Δhis3Δ leu2Δmet15Δ ura3)。将啤酒糖酵母BY4741菌株接种进5ml YPAD培养基(含有0.04％腺嘌呤(Sigma)的YPD培养基)，使用通过过夜培养(30℃，在310rpm)得到的酵母细胞。使用Frozen-EZ酵母转化II试剂盒(ZYMO RESARCH)，将在实施例10至实施例13中构建的表达载体导入啤酒糖酵母BY4741菌株。选择在含有2％琼脂的ST琼脂培养基(酵母氮基和包含2％葡萄糖、0.04％腺嘌呤和0.3M KCl且缺少尿嘧啶和亮氨酸的硫酸铵培养基(Sigma))上生长的转化体作为表达抗体的酵母菌株。

包含抗体重链和轻链表达单元的YEp352 GAP-II-alfHc/alfLc具有补充宿主的需尿嘧啶的突变的URA3标记基因。YEp351 GAP-II(其中没有导入基因的对照载体)，YEp351GAP-II-aHAC1(激活的HAC1表达载体)，YEp351GAP-II-p180(RRBP1表达载体)，和YEp351GAP-II-aHAC1/p180(激活的HAC1基因和RRBP1的共表达载体)各自包含补充宿主的需亮氨酸的突变的LEU2标记基因。从而，将这些载体转化进宿主，使得仅在如下所示联合导入两种载体时基因才生长，以构建4类表达抗体的酵母菌株。

啤酒糖酵母T2K01 YEp352 GAP-II-alfHc/alfLc(URA3)YEp351GAP-II(LEU2)

啤酒糖酵母T2K02 YEp352 GAP-II-alfHc/alfLc(URA3)YEp351GAP-II-aHAC1(LEU2)

啤酒糖酵母T2K03 YEp352 GAP-II-alfHc/alfLc(URA3)YEp351GAP-II-p180(LEU2)

啤酒糖酵母T2K04 YEp352 GAP-II-alfHc/alfLc(URA3)YEp351GAP-II-aHAC1/p180(LEU2)

[实施例15]转化的酵母菌株(啤酒糖酵母)的抗体生产力

在30℃，使用ST培养基培养在实施例14中制备的啤酒糖酵母T2K01、啤酒糖酵母T2K02、啤酒糖酵母T2K03、和啤酒糖酵母T2K04菌株3天。将培养液接种进YPAD培养基，在其中达到5％终浓度，在30℃培养3天。从培养液制备培养上清液，产物称作含有酵母分泌和生产的抗体的样品。通过夹心ELISA，对分泌和生产的抗体进行定量测定。将作为抗-TRAIL受体抗体的抗原的TRAIL受体蛋白吸附到96孔平板上，加入酵母样品，使用过氧化物酶-标记的人IgG特异性的Fc抗体(过氧化物酶标记的亲和纯化的抗人IgG(Fc)抗体(KPL))和ABTS过氧化物酶底物(KPL)进行检测。在动物细胞中生成的抗体(NS0)用作标准样品。

如图8A所示，其中仅导入RRBP1基因的啤酒糖酵母T2K03菌株在生产力方面没有显著不同于对照菌株即啤酒糖酵母T2K01菌株。但是，在仅导入激活的HAC1基因的啤酒糖酵母T2K02菌株的情况下，生产力是对照菌株即啤酒糖酵母T2K01菌株的约2倍。此外，在共表达激活的HAC1基因和RRBP1基因的啤酒糖酵母T2K04菌株的抗体生产力，显著高于对照菌株即啤酒糖酵母T2K01菌株和单独导入激活的HAC1基因或RRBP1基因的菌株(即，比对照高约7倍)。这表明，激活的HAC1基因和RRBP1基因的共表达会对抗体生产力产生等于或大于协同效应的作用。

[实施例16]使用转化的酵母菌株(啤酒糖酵母)在抑制O-糖链形成的条件下的抗体生产力

在30℃，使用ST培养基培养在实施例14中制备的啤酒糖酵母T2K01、啤酒糖酵母T2K02、啤酒糖酵母T2K03、和啤酒糖酵母T2K04菌株3天。以5％终浓度，将培养液接种进在开始已经加入10μM PMT抑制剂(绕丹宁-3-乙酸衍生物：5-[[3，4-(1-苯基甲氧基)苯基]亚甲基]-4-氧代-2-硫代-3-噻唑烷乙酸(在Bioorganic & Medicinal Chemistry Letters，Vol.14，p.3975，2004中所述的化合物(1c))的YPAD培养基，在30℃培养3天。从培养液制备培养上清液，产物称作含有酵母分泌和生产的抗体的样品。以与实施例15相同的方式，使用在动物细胞中生成的抗体(NS0)作为标准样品，通过夹心ELISA对样品进行定量测定。

如图8B所示，导入激活的HAC1基因的啤酒糖酵母T2K02菌株和导入RRBP1基因的啤酒糖酵母T2K03菌株的抗体生产力明显高于对照菌株即啤酒糖酵母T2K01菌株。此外，共表达激活的HAC基因和RRBP1基因的啤酒糖酵母T2K04菌株的抗体产量，显著高于对照菌株即啤酒糖酵母T2K01菌株和单独导入激活的HAC1基因或RRBP1基因的菌株(即，比对照高约8倍)。通过抑制O-糖链形成，进一步增强了激活的HAC1基因和RRBP1基因的共表达对抗体生产的协同效应。

[实施例17]Ogataea minuta蛋白酶YPS1基因缺陷型菌株(Δoch1Δyps1Δura3Δade1)的制备

用BamHI和ClaI切割在WO 2003/091431中公开的YPS1基因-缺陷型载体pDOMYP1，通过电脉冲方法转化进WO 2003/091431中公开的O.minuta TK5-3菌株(Δoch1Δura3Δade1)。为了确认破坏了该基因的YPS1基因，合成了下述引物。

DY5；5’-CTCAAGGGCCTGGAGACTACG-3’(SEQ ID NO：49)

DY3；5’-CGGGATTCCCGAGTCGCTCACC-3’(SEQ ID NO：50)

从转化菌株分离的染色体DNA用作模板，使用DY5和DY3引物进行PCR，该PCR在94℃进行30秒，在60℃进行1分钟，在72℃进行2分钟，该循环重复25次。从已经将质粒导入YPS1基因座中的菌株，检测扩增的3.7-kb DNA片段。选择的菌株称作O.minuta YK4菌株(Δoch1Δura3Δade1Δyps1::URA3)。在YPD培养基中培养O.minuta YK4菌株至稳定期后，获得表现出对5-氟乳清酸(5-FOA)的抗性的菌株。将5-FOA抗性菌株的染色体DNA用作模板，使用DY5和DY3引物进行PCR，该PCR在94℃进行30秒，在60℃进行1分钟，在72℃进行3分钟，该循环重复25次。从缺少URA3的菌株检测扩增的1.2-kb DNA片段。该Δoch1Δura3Δade1Δyps1菌株称作O.minuta YK5菌株。

[实施例18]合成抗体基因生产菌株(O.minuta)的制备和抗体生产

(1)合成抗体基因表达载体的构建

用SpeI切割在WO 2003/091431中公开的pOMexGP1U，平端化，然后连接。将得到的质粒的SalI位点和EcoT22I位点分别用SpeI位点和BamHI位点进行接头变化。得到的质粒称作pOMexGP1UΔSp。

从抗-TRAIL受体抗体基因的氨基酸序列(WO2002/094880)设计基因，同时考虑O.minuta的密码子使用频率，从而人工合成抗体基因(Takara Bio)。将啤酒糖酵母SUC2信号或鸡溶菌酶信号添加到轻链和重链基因的N末端，将限制酶位点(在5’侧上的XbaI位点和在3’侧上的BamHI位点)的核苷酸序列添加到2个末端(核苷酸序列：SEQ ID NO：51，53，55，和57；氨基酸序列：SEQ ID NO：52，54，56，和58)。将已经用XbaI和BamHI消化的具有不同信号的两类轻链基因片段导入在实施例1(2)中制备的pOMexGP1A载体。得到的载体分别称作pOMexGPA/AbSUC和pOMexGPA/AbLys。将已经用XbaI和BamH消化的发出不同信号的两类重链基因片段导入pOMexGP1UΔSp载体的SpeI-BamHI位点。得到的载体称作pOMexGPUΔSp/AbSUC和pOMexGPUΔSp/AbLys。

将pOMexPGHy(实施例1(3-4))用作模板，使用PGKHy-F DNA引物(SEQ ID NO：59)和PGKHy-R DNA引物(SEQ ID NO：60)进行PCR，该PCR在94℃进行30秒，在55℃进行30秒，在72℃进行1分钟，该循环重复20次。从而，扩增潮霉素B-抗性基因。

PGKHy-F：

5’-ATAGAACTAGCAACTAGATGAAAAAGCCTGAACTCAC-3’(SEQID NO：59)

PGKHy-R：

5’-CAAATCCCACGGATCACTATTCCTTTGCCCTCGGAC-3’(SEQ IDNO：60)

使用in-fusion试剂盒(BD Bioscience)，将扩增的基因片段导入SpeI-BglII-消化的pOMexPGHy，并测定插入片段的核苷酸序列。得到的质粒用作模板，使用PGKpUC-p DNA引物(SEQ ID NO：61)和PGKpUC-tDNA引物(SEQ ID NO：62)进行PCR，该PCR在94℃进行30秒，在55℃进行30秒，在72℃进行2分钟，该循环重复20次。从而，扩增含有PGK启动子-潮霉素B抗性基因-PGK终止子的基因片段。

PGKpUC-p：

5’-AATTCGAGCTCGGTACAGGGATACATGGGATACCAAAG-3’(SEQID NO：61)

PGKpUC-t：

5’-GAGGATCCCCGGGTACCAGGGTCGATTTTCTTGGTCGA-3’(SEQID NO：62)

使用in-fusion试剂盒(BD Bioscience)，将扩增的基因片段导入Asp718I-消化的pUC118(Takara Bio)，并测定插入片段的核苷酸序列。得到的质粒称作PGKHyg/pUC118。用HindIII和KpnI消化pOMexGP1UΔSp，分离包含GAP启动子-终止子的盒，将分离的盒插入HindIII-KpnI消化的PGKHyg/pUC118。得到的质粒称作GAP/HyG/pUC118。随后，用NdeI和EcoRI消化pUC19(Takara Bio)，平端化，然后连接，以去除在pUC19内的NdeI-EcoRI区域。用HindIII-SacI消化该质粒，导入包含通过HindIII-SacI消化从GAP/HyG/pUC118分离的GAP启动子-终止子和PGK启动子-潮霉素B抗性基因-PGK终止子的基因片段。得到的质粒称作pOMexHy。

将已经添加XbaI-BamH消化的鸡溶菌酶信号的抗体重链基因片段导入SpeI-BamHI处理过的pOMexHy，得到的载体称作pOMexHy/AbLys。

(2)表达抗体基因的酵母菌株的制备

通过电穿孔，使用NotI-消化的抗体表达载体即pOMexGPA/AbLys和pOMexGPUΔSp/AbLys来转化O.minuta YK5菌株(Δoch1Δyps1Δura3Δade1)。使用在WO 2003/091431中描述的电穿孔条件。在SD琼脂平板培养基(2％葡萄糖，0.67％酵母氮基(Difco))中选择转化的细胞。在27℃在B2YP4G培养基(1.34％酵母氮基(Difco)，2％酵母提取物(Difco)，4％聚胨(Difco)，4％甘油，和0.1M磷酸盐缓冲液(pH6.0))中培养单个菌落4天。从培养液制备培养上清液，按照实施例7所述的方式进行蛋白印迹分析，以选择其中已经导入抗体轻链和重链基因的生产抗体的菌株，得到的菌株称作O.minuta AA1菌株。如图9所示，O.minuta AA1菌株分泌的抗体的量显著大于在实施例5中制备的O.minuta AO1菌株分泌的量。

将NotI消化的抗体表达载体即pOMexGPA/AbSUC和pOMexGPUΔSp/AbSUC导入在WO 2003/091431中所述的O.minutaTK5-3菌株(Δoch1Δura3Δade1)，以得到表达抗体的O.minuta YY1菌株。采用上述的电穿孔和菌株选择方法。

[实施例19]巴斯德毕赤氏酵母的激活的HAC1基因的获取和表达载体的构建

以与实施例3相同的方式，从细胞(巴斯德毕赤氏酵母的GS115菌株)获得巴斯德毕赤氏酵母的激活的HAC1基因。以与实施例3相同的方式，从巴斯德毕赤氏酵母的GS115菌株合成cDNA。使用下示的HACp1-1DNA引物(SEQ ID NO：63)和HACp1-12引物(SEQ ID NO：64)，通过PCR扩增该cDNA，该PCR在94℃进行30秒，52℃进行30秒，在72℃进行1分钟，该循环重复30次。将扩增的产物克隆进pCR2.1-TOPO(Invitrogen)，证实从两类PCR扩增的基因片段衍生的核苷酸序列(SEQID NO：65和66)。

HACp1-1：5′-ATGCCCGTAGATTCTTCTCATAAGACAGC-3′(SEQID NO：63)

HACp1-12：5′-CAAAGTCATTTAAATCAAATGCATTAGCGG-3′(SEQ ID NO：64)

得到的两类cDNA片段的核苷酸序列之一(SEQ ID NO：65)与基因组序列相一致；但是，另一个序列(SEQ ID NO：66)是部分缺陷的，且缩短。这表明，这样的缺陷序列是已经被UPR激活的Ire1p剪接的cDNA片段。为了得到激活的HAC1的全长cDNA，进行PCR，该PCR在94℃进行30秒，在55℃进行30秒，在72℃进行1分钟，其中使用下示的speHACp1F DNA引物(SEQ ID NO：67)和bglHACp1R DNA引物(SEQID NO：68)和被认为含有上述HAC1的激活的cDNA的cDNA合并物，该循环重复20次。

speHACp1F：5′-gactagtATGCCCGTAGATTCTTCTCATA-3′(SEQ IDNO：67)

bglHACp1R：5′-cagatctCTATTCCTGGAAGAATACAAAGT-3′(SEQID NO：68)

得到的约1kb的片段含有位于巴斯德毕赤氏酵母的激活的HAC1基因的起始密码子和终止密码子之间的区域(SEQ ID NO：69)，它等同于包含304个氨基酸残基的激活的Hac1p的氨基酸序列(SEQ ID NO：70)。用SpeI和BglII处理产物，分离，然后导入SpeI-BglII处理过的pOMexPGHy(实施例1(3-4))。得到的载体称作pOMexPGHy/PpHac1。该载体包含源自巴斯德毕赤氏酵母的激活的HAC1基因表达单元。

[实施例20]啤酒糖酵母激活的HAC1基因表达载体的构建

将在实施例11中制备的含有啤酒糖酵母的激活的HAC1基因的TOPO-aHac1用作模板，使用ScHAC-XbaF DNA引物(SEQ ID NO：71)和ScHAC-BamR DNA引物(SEQ ID NO：72)进行PCR，该PCR在94℃进行30秒，在55℃进行30秒，在72℃进行1分钟，该循环重复20次。从而，扩增啤酒糖酵母的激活的HAC1基因。

ScHAC-XbaF：5′-gtctagaATGGAAATGACTGATTTTGAACT-3′(SEQID NO：71)

ScHAC-BamR：5′-cggatccTCATGAAGTGATGAAGAAATCAT-3′(SEQ ID NO：72)

用XbaI和BamHI消化产物，回收编码源自啤酒糖酵母的激活的HAC1的基因。分离后，将基因导入SpeI-BglII处理过的pOMexPGHy(实施例1(3-4))。得到的载体称作pOMexPGHy/ScHac1。该载体包含源自啤酒糖酵母的激活的HAC1基因表达单元。

[实施例21]已经导入O.minuta、巴斯德毕赤氏酵母和啤酒糖酵母的激活的HAC1基因的O.minuta菌株对抗体的生产

(1)已经导入O.minuta、巴斯德毕赤氏酵母和啤酒糖酵母激活的HAC1基因的O.minuta菌株的制备

通过电穿孔，将Aor51HI消化的O.minuta来源的激活的HAC1基因表达载体即pOMexPGHy/Hac1、巴斯德毕赤氏酵母来源的激活的HAC1基因表达载体即pOMexPGHy/PpHac1、和啤酒糖酵母来源的激活的HAC1基因表达载体即pOMexPGHy/ScHac1导入在实施例18中生长的产抗体的O.minuta AA1菌株。如下证实激活的HAC1基因向转化菌株中的导入：在已经加入浓度为50μg/ml的潮霉素B的YPD琼脂平板培养基中选择菌株，培养它们，然后提取基因组。使用实施例3所述的speHAC1F DNA引物(SEQ ID NO：20)和bglHAC1R DNA引物(SEQ IDNO：21)，对其中已经导入O.minuta来源的激活的HAC1基因表达载体pOMexPGHy/Hac1的菌株进行PCR。使用speHACp1F DNA引物(SEQ IDNO：67)和bglHACp1R引物(SEQ ID NO：68)，对其中已经导入巴斯德毕赤氏酵母来源的激活的HAC1基因的菌株进行PCR，该PCR在94℃进行30秒，在55℃进行30秒，在72℃进行1分钟，该循环重复30次。除了使用ScHAC-XbaF DNA引物(SEQ ID NO：71)和ScHAC-BamR引物(SEQ ID NO：72)以外，在相同条件下，对其中已经导入啤酒糖酵母来源的激活的HAC1基因的菌株进行PCR。得到的菌株分别称作O.minutaAA2omH菌株，O.minuta AA2ppH菌株，和O.minuta AA2scH菌株。同时，将Aor51HI-消化的pOMexPGHy导入O.minuta AA1菌株，以得到O.minuta AA2Hy菌株作为对照。

(2)已经导入HAC1基因的生产抗体的菌株分泌抗体的证实

以实施例18(2)所述的方式，培养在上面(1)中制备的已经导入HAC1基因的生产抗体的菌株，即O.minuta AA2omH菌株、O.minutaAA2ppH菌株、O.minuta AA2scH菌株和O.minuta AA2Hy菌株，并在非还原条件下进行蛋白印迹分析。结果如图10所示。也就是说，与在上面(1)制备的对照O.minuta AA2Hy菌株相比，在O.minutaAA2omH菌株、O.minuta AA2ppH菌株和O.minuta AA2scH菌株中观察到更显著的糖链向抗体分子的添加，但是没有观察到抗体-H2L2聚集体分泌的显著加速作用。从而，通过导入源自不同于宿主的物种的HAC1基因，可以预见到类似的生产效应。

(3)已经导入HAC1基因的产抗体的O.minuta菌株的分泌抗体的生产力(通过基于TR-FRET的均质分析定量)

将包含12μl 0.97μg/ml LANCE Eu-W1024标记的抗-人IgG(PerkinElmer)、8.3ug/ml生物素缀合的小鼠抗-人IgG(BD Bioscience)、16.7ug/ml Surelight APC链霉抗生物素(PerkinElmer)和10％Block Ace(Dainippon Pharmaceutical)的20mM Tris-HCl缓冲液(pH 7.2)应用于96-孔半区域平板(Corning)，向其中引入如下制备的2μl样品溶液：用含有10％Block Ace的20mM Tris-HCl缓冲液(pH 7.2)充分稀释在上面(2)制备的培养液，然后搅拌。使样品溶液在室温在黑暗中反应1小时，然后使用EnVision(PerkinElmer)测定荧光。基于在665nm/615nm的值，测定生成的聚集的抗体的量。在动物细胞(CHO)中生产的抗体用作标准样品。如图11所示，与O.minuta AA2Hy菌株相比，在已经导入激活的HAC1基因的O.minuta AA2omH菌株、O.minuta AA2ppH菌株和O.minuta AA2scH菌株中，观察到抗体分泌的显著加速。但是，甚至通过导入源自不同于宿主的物种的HAC1基因，也可以预见到类似的生产效应。

(4)使用PMT抑制剂(1c)，已经导入HAC1基因的O.minuta菌株的抗体生产

将一铂环量的O.minuta AA2omH菌株、O.minuta AA2ppH菌株、O.minuta AA2scH菌株和O.minuta AA2Hy菌株接种进5ml B2YP4G培养基，在27℃培养1天，然后用B2YP4G培养基稀释，调节OD600＝10。向其中加入在实施例9所述的PMT抑制剂(1c：母液浓度：10mM)，至2μM的浓度。在27℃培养另外3天，每隔24小时测定OD600，OD600值每增加1，各加入0.04μM PMT抑制剂(1c)。从培养液制备培养上清液，通过实施例21(3)所述的方法，测量抗体生产量。结果如图11所示。发现与对照O.minuta AA2Hy菌株相比，通过在加入PMT抑制剂的情况下培养，已经导入激活的HAC1基因的O.minuta AA2omH菌株、O.minuta AA2ppH菌株和O.minuta AA2scH菌株可以表现出更显著的加速抗体分泌的作用。

从而，发现使用不同物种的HAC1基因，可以达到加速抗体分泌的作用。

[实施例22]源自O.minuta的PMT基因的分离

使用O.minuta IFO10746菌株的染色体DNA作为模板，使用PM1-5DNA引物(SEQ ID NO：73)和PM1-3 DNA引物(SEQ ID NO：74)，通过PCR得到源自O.minuta的PMT1基因，该PCR在94℃进行30秒，在55℃进行1分钟，在72℃进行2分钟，该循环重复25次。

PM1-5：5′-ATGGCGGGCAAAAATCAGAAATCTAGCGCG-3′(SEQID NO：73)

PM1-3：5′-TTACAACTCGTCTTTGACTAGAGGCGGGGA-3′(SEQID NO：74)

回收扩增的约2.4kb的DNA片段，使用TOPO TA克隆试剂盒进行克隆。从得到的克隆分离质粒DNA，测定插入片段的核苷酸序列(SEQID NO：75)。从而，从质粒的插入DNA片段，选择具有编码氨基酸序列(SEQ ID NO：76)的核苷酸序列的克隆，所述氨基酸序列与源自啤酒糖酵母的PMT1基因的氨基酸序列高度同源。分离的质粒称作pOmPM1。

以与在PMT1基因的情况下相同的方式，使用PM2-5 DNA引物(SEQ ID NO：77)和PM2-3 DNA引物(SEQ ID NO：78)得到源自O.minuta的PMT2基因，使用PM4-5 DNA引物(SEQ ID NO：79)和PM4-3 DNA引物(SEQ ID NO：80)得到PMT4基因，使用PM5-5 DNA引物(SEQ ID NO：81)和PM5-3 DNA引物(SEQ ID NO：82)得到PMT5基因，使用PM6-5DNA引物(SEQ ID NO：83)和PM6-3 DNA引物(SEQ ID NO：84)得到PMT6基因。包含PMT2基因(核苷酸序列：SEQ ID NO：85；氨基酸序列：SEQ ID NO：86)、PMT4基因(核苷酸序列：SEQ ID NO：87；氨基酸序列：SEQ ID NO：88)、PMT5基因(核苷酸序列：SEQ ID NO：89；氨基酸序列：SEQ ID NO：90)和PMT6基因(核苷酸序列：SEQ ID NO：91；氨基酸序列：SEQ ID NO：92)的质粒分别称作pOmPM2，pOmPM4，pOmPM5，和pOmPM6。

PM2-5：5′-ATGGGCGAACGTACGGGCAAAAGTGCGCTC-3′(SEQID NO：77)

PM2-3：5′-CTAATCGGAAATTCTCCACGTGCTCAAGAG-3′(SEQID NO：78)

PM4-5：5′-ATGGGGCCCAAAATAAAGACCGGCAAGAAA-3′(SEQID NO：79)

PM4-3：5′-CTATTTAGCAAAATGCAGTTTGATGTTGAG-3′(SEQ IDNO：80)

PM5-5：5′-ATGGACGAGAAAAACATCTCTGGCTTAGAA-3′(SEQID NO：81)

PM5-3：5′-CTACTCACTATAGACGGAGCAGTCGATCGA-3′(SEQID NO：82)

PM6-5：5′-ATGTCCGAGTCAGAGCTGAGAAACCGCAAA-3′(SEQID NO：83)

PM6-3：5′-CTAAGCTATACGCCAGGTGGAAACCCAGTT-3′(SEQID NO：84)

[实施例23]O.minuta的PMT基因插入灭活或破坏载体的制备

(1)PMT基因插入灭活载体的制备

(1-1)PMT1基因插入灭活载体的制备

为了使用在实施例22中得到的pOmPM1分离PMT1基因的部分序列，使用下述的PMT1hIII DNA引物(SEQ ID NO：93)和PMT1Kp DNA引物(SEQ ID NO：94)进行PCR，该PCR在94℃进行30秒，在55℃进行30秒，在72℃进行2分钟，该循环重复15次。

PMT1hIII：5′-caagcttGGACCTACAACACGTCCGAAGAA-3′(SEQ IDNO：93)

PMT1Kp：5′-cggtaccGGTTTGATACCTTGGGTGGCACA-3′(SEQ IDNO：94)

用HindIII和KpnI消化扩增的约1.6kb的DNA片段，并回收。随后，用BglII消化pPICZα(Invitrogen)，并平端化。将HindIII接头插入其中，用BamHI进一步消化，并平端化，随后插入KpnI接头。得到的质粒称作pZ-Hd-Kp。用HindIII和KpnI消化pZ-Hd-Kp，分离含有zeocine抗性基因的2.0-kb DNA片段，将PCR扩增的PMT1基因的部分序列插入其中。测定插入的PMT1基因的部分序列的核苷酸序列，然后将得到的质粒命名为pOmPM1dZ。pOmPM1dZ能插入灭活O.minuta PMT1基因的结构基因(CDS)区和启动子区，并抑制PMT1基因的转录。单独地，用HindIII和KpnI消化在实施例18中制备的HindIII和KpnI，回收含有GAP启动子和终止子的基因片段，将回收的片段插入HindIII-KpnI-消化的含有zeocine抗性基因的2.0-kb DNA片段。得到的质粒称作GAP/Z。

(1-2)PMT2基因插入灭活载体的制备

为了使用在实施例22中得到的pOmPM2分离PMT2基因的部分序列，使用下述的PMT2hIII DNA引物(SEQ ID NO：95)和PMT2Kp DNA引物(SEQ ID NO：96)进行PCR，该PCR在94℃进行30秒，在55℃进行30秒，在72℃进行2分钟，该循环重复15次。

PMT2hIII：5′-gaagcttACTACATAATTCGTGTACGTGTTC-3′(SEQID NO：95)

PMT2Kp：5′-cggtaccGTCGCCGTATTGGTCAGCAATCTC-3′(SEQID NO：96)

回收扩增的约1.5kb的DNA片段，用HindIII和KpnI消化，然后回收消化的片段。将得到的DNA片段插入通过用HindIII和KpnI消化从pZ-Hd-Kp分离的、含有zeocine-抗性基因的2.0-kb DNA片段，测定插入的PMT2基因的部分序列的核苷酸序列。将得到的质粒命名为pOmPM2dZ。pOmPM2dZ能插入灭活O.minuta PMT2基因的结构基因(CDS)区和启动子区，并抑制PMT2基因的转录。

(1-3)PMT4基因插入灭活载体的制备

为了使用在实施例22中得到的pOmPM4分离PMT4基因的部分序列，使用下述的PMT4FHdinf DNA引物(SEQ ID NO：97)和PMT4RKpinfDNA引物(SEQ ID NO：98)进行PCR，该PCR在94℃进行30秒，在55℃进行30秒，在72℃进行2分钟，该循环重复15次。

PMT4FHdinf：

5′-GTCATGAGATCCaagctGATCCCTCAATGGAGATCTACT-3′(SEQ IDNO：97)

PMT4RKpinf：

5′-GGTGTGTGGGGGATCgGGATGCAAATGGATGGCTCGAAC-3′(SEQID NO：98)

使用in-fusion试剂盒(BD Bioscience)，将得到的约1.5kb的DNA片段插入通过用HindIII和KpnI消化从pZ-Hd-Kp分离的、含有zeocine-抗性基因的2.0-kb DNA片段。测定插入的PMT4基因的部分序列的核苷酸序列，然后将得到的质粒命名为pOmPM4dZ。

(2)PMT基因破坏载体的制备

(2-1)PMT5基因破坏载体的制备

用HindIII消化pROMU1，后者含有具有在WO 2003/091431中公开的在O.minuta的URA3结构基因上游和下游的约0.8kb的重复序列的基因片段，并平端化，随后插入BamHI接头。用BamHI和BglII消化得到的载体，将含有O.minuta的重复序列和URA3基因的约3.3kb片段导入BamHI消化的pBluescript KS-(Stratagene)。得到的载体称作rURApBKS。

将O.minuta IFO10746菌株的染色体DNA用作模板，使用PMT5maeF2 DNA引物(SEQ ID NO：99)和PMT5maeR DNA引物(SEQ IDN0：100)进行PCR，该PCR在94℃进行30秒，在55℃进行1分钟，在72℃进行2分钟，该循环重复25次。回收扩增的约1.5kb的DNA片段，使用in-fusion试剂盒(BD Bioscience)导入BamHI-HindIII-消化的rURApBKS。测定插入的基因片段的核苷酸序列。得到的载体称作PMT5K/O/rURA3pre。

将O.minuta IFO10746菌株的染色体DNA用作模板，使用PMT5ushiroF DNA引物(SEQ ID NO：101)和PMT5ushiroR DNA引物(SEQ ID NO：102)进行PCR，该PCR在94℃进行30秒，在55℃进行1分钟，在72℃进行2分钟，该循环重复25次。回收扩增的约1.5kb的DNA片段，使用in-fusion试剂盒(BD Bioscience)导入NotI消化的PMT5K/O/rURA3pre。测定插入的基因片段的核苷酸序列。得到的载体称作PMT5K/O/rURA3。

PMT5maeF2：

5′-GACGGTATCGATAAGCTTGATGCGCGGCCTTCCGACCTT-3′(SEQID NO：99)

PMT5maeR：

5′-CTGGGGAAGCTCGGATCCGGCTCGAGGTCTTCGTTCAGA-3′(SEQID NO：100)

PMT5ushiroF：

5′-CTAGTTCTAGAGCGGCCCAGGTCGCTTTCAGGCAGCAG-3′(SEQID NO：101)

PMT5ushiroR：

5′-CACCGCGGTGGCGGCCAAGCTTGGGTACCGGCTCGCGTAG-3′(SEQ ID NO：102)

(2-2)PMT6基因破坏载体的制备

将O.minuta IFO10746菌株的染色体DNA用作模板，使用PMT6inf5′armF DNA引物(SEQ ID NO：103)和PMT6inf5′armR DNA引物(SEQ ID NO：104)进行PCR，该PCR在94℃进行30秒，在55℃进行2分钟，在72℃进行2分钟，该循环重复25次。回收扩增的约2.8kb的DNA片段，使用in-fusion试剂盒(BD Bioscience)导入BamHI消化的rURApBKS。测定插入的基因片段的核苷酸序列。得到的载体称作PMT6K/O/rURA3pre。

将O.minuta IFO10746菌株的染色体DNA用作模板，使用PMT6inf3′armF DNA引物(SEQ ID NO：105)和PMT6inf3′armR2 DNA引物(SEQ ID NO：106)进行PCR，该PCR在94℃进行30秒，在55℃进行2分钟，在72℃进行2分钟，该循环重复25次。回收扩增的约2.5kb的DNA片段，使用in-fusion试剂盒(BD Bioscience)导入NotI-SacII消化的PMT6K/O/rURA3pre。测定插入的基因片段的核苷酸序列。得到的载体称作PMT6K/O/rURA3。

PMT6inf5′armF：

5′-GCAGCCCGGGGgatccACGAAACCACGTCCTACT-3′(SEQ ID NO：103)

PMT6inf5′armR：

5′-GGGGAAGCTcggatcGACTCATCTTGAAACGCA-3′(SEQ ID NO：104)

PMT6inf3′armF：

5′-AGTTCTAGAGCGGCCTTACCACCATTACATGCC-3′(SEQ ID NO：105)

PMT6inf3′armR2：

5′-AATTGGAGCTCCACCGCGGCCGCAACTTACTCGACGCTAA-3′(SEQ ID NO：106)

[实施例24]用插入灭活的或破坏的PMT基因制备产抗体的O.minuta菌株及其评价

(1)用插入灭活的PMT基因制备产抗体的O.minuta菌株

对于在实施例23中制备的PMT基因插入灭活载体，用PstI消化PMT1基因插入灭活载体，用XhoI消化PMT2基因插入灭活载体，并用HindIII消化PMT4基因插入灭活载体。通过电穿孔，将这些消化产物导入在实施例18中生长的产抗体的O.minuta YY1菌株。以下述方式证实转化菌株中PMT基因的中断。在已经加入浓度为50μg/ml的zeocine的YPD琼脂平板培养基中选择菌株，并培养，随后提取基因组。对PMT1基因进行PCR，该PCR在94℃进行30秒，在55℃进行30秒，在72℃进行1分钟，该循环重复30次，其中使用DNA引物对Zeo1(SEQ IDNO：107)和PMT1zeo1(SEQ ID NO：109)和DNA引物对Zeo2(SEQ IDNO：108)和PMT1zeo2(SEQ ID NO：110)。在相同条件下对PMT2基因进行PCR，其中使用DNA引物对Zeo1(SEQ ID NO：107)和PMT2zeo1(SEQID NO：111)和DNA引物对Zeo2(SEQ ID NO：108)和PMT2zeo2(SEQ IDNO：112)。在相同条件下对PMT4基因进行PCR，其中使用DNA引物对Zeo1(SEQ ID NO：107)和PMT4PCR3′armF(SEQ ID NO：113)和DNA引物对Zeo2(SEQ ID NO：108)和PMT4PCR5′armR3(SEQ ID NO：114)。从而，证实了在导入插入灭活载体后PMT基因的插入灭活。

Zeo1：5′-GAACGGCACTGGTCAACTTGGCCAT-3′(SEQ ID NO：107)

Zeo2：5′-CTTCGTGGCCGAGGAGCAGGACTGA-3′(SEQ ID NO：108)

PMT1zeo1：5′-GAATTCTAGCCGAGCATGAGCTA-3′(SEQ ID NO：109)

PMT1zeo2：5′-CGTTCAGACTCTTGTTGATTTTCCAC-3′(SEQ IDNO：110)

PMT2zeo1：5′-GCTGTGCCACTGCACGCCTCGACTC-3′(SEQ IDNO：111)

PMT2zeo2：5′-CTTGTCCCTCTTGAATGGCGAGTG-3′(SEQ ID NO：112)

PMT4PCR3′armF：5′-GGAACACGCCAAACATCATG-3′(SEQ ID NO：113)

PMT4PCR5′armR3：5′-CACAAGCAGAATCAGGCAC-3′(SEQ IDNO：114)

得到的菌株分别称作O.minuta YY2P1菌株(含有插入灭活的PMT1基因的菌株)、O.minuta YY2P2菌株(含有插入灭活的PMT2基因的菌株)和O.minuta YY2P4菌株(含有插入灭活的PMT4基因的菌株)。也将Sse8387I-消化的GAP/Z导入O.minuta YY1菌株，选择zeocine-抗性菌株，以得到O.minuta YY2Z菌株作为对照菌株。

(2)含有插入灭活的PMT基因的产抗体的O.minuta菌株的分泌抗体的生产力

以实施例18(2)所述的方式，培养在上面(1)制备的含有插入灭活的PMT基因的产抗体菌株，然后进行蛋白印迹分析。结果如图12和图14所示。也就是说，与在上面(1)制备的O.minuta YY2Z菌株相比，含有插入灭活的PMT1基因的O.minuta YY2P1菌株、含有插入灭活的PMT2基因的O.minuta YY2P2菌株和含有插入灭活的PMT4基因的O.minutaYY2P4菌株达到的抗体聚集体的分泌量略有增加(图12：泳道3和泳道6；图14：泳道3)。

(3)含有插入灭活的PMT基因的产抗体的O.minuta菌株的分泌抗体的生产力(通过基于TR-FRET的均质分析定量)

通过在实施例21(3)中所述的方法，测量在上面(2)中制备的培养液中生成的抗体的量。使用在动物细胞(CHO)中生产的抗体作为标准样品。如图13和图15所示，与在上面(1)制备的O.minuta YY2Z菌株相比，含有插入灭活的PMT1基因的O.minuta YY2P1菌株、含有插入灭活的PMT2基因的O.minuta YY2P2菌株和含有插入灭活的PMT4基因的O.minuta YY2P4菌株分泌的抗体聚集体的量略有增加(图13：YY2P1和YY2P2；图15：YY2P4)。

(4)PMT5和PMT6缺陷型菌株的制备及其评价

(4-1)O.minuta PMT5基因缺陷型菌株(Δoch1Δyps1Δura3Δade1Δpmt5)的制备

用HindIII消化在实施例23(2-1)中制备的PMT5基因破坏载体PMT5K/O/rURA3，并通过电脉冲方法转化进在实施例17中制备的Ogataea minuta YK5菌株(Δoch1Δura3Δade1Δyps1)。为了证实已经破坏了这些菌株的PMT5基因，合成了下述引物。

gPMT5-5：5′-CGGTGACGACTTCGACTAGTCGAG-3′(SEQ ID NO：115)

gPMT5-2：5′-CGGTGCTGTTGGCGTCGTCATGGGTG-3′(SEQ IDNO：116)

gPMT5-3：5′-GGCGCGTTCCAATTCCACTCTGCTG-3′(SEQ ID NO：117)

gPMT5-4：5′-CGACGAGTCCTCTCACCAGGAGGTTG-3′(SEQ IDNO：118)

将从转化菌株分离的染色体DNA用作模板，使用gPMT5-5引物(SEQ ID NO：115)和gPMT5-2引物(SEQ ID NO：116)进行PCR，该PCR在94℃进行30秒，在60℃进行1分钟，在72℃进行2分钟，该循环重复25次。从已经将质粒掺入PMT5基因座中的菌株，检测4.9kb的扩增的DNA片段。类似地，将从转化菌株分离的染色体DNA用作模板，使用gPMT5-3引物(SEQ ID NO：117)和gPMT5-4引物(SEQ ID NO：118)进行PCR，该PCR在94℃进行30秒，在60℃进行1分钟，在72℃进行2分钟，该循环重复25次。从已经将质粒掺入PMT5基因座中的菌株，检测4.9kb的扩增的DNA片段。选择的菌株称作O.minuta YK6菌株(Δoch1Δura3Δade1Δyps1Δpmt5::URA3)。

(4-2)O.minuta PMT6基因缺陷菌株(Δoch1Δyps1Δura3Δade1Δpmt6)的制备

用BamHI和NotI消化在实施例23(2-2)中制备的PMT6基因破坏载体PMT6K/O/rURA3，然后通过电脉冲方法转化进在实施例17中制备的O.minuta YK5菌株(Δoch1Δura3Δade1Δyps1)。为了证实已经破坏了这些菌株的PMT6基因，合成了下述引物。

PMT6 PCR3′armF：5′-TGTGGGTGCGATCCTGAG-3′(SEQ ID NO：119)

PMT6 PCR3′armR：5′-GCCGTCGTTGGAGCAAAACT-3′(SEQ ID NO：120)

PMT6 PCR5′armF：5′-GCATGTGCCACTGCTAAA-3′(SEQ ID NO：121)

PMT6 PCR5′armR：5′-GACCAACTTTCCCGTGTAA-3′(SEQ ID NO：122)

将从转化菌株分离的染色体DNA用作模板，使用PMT6 PCR3′armF引物(SEQ ID NO：119)和PMT6 PCR3′armR引物(SEQ ID NO：120)进行PCR，该PCR在94℃进行30秒，在60℃进行1分钟，在72℃进行2分钟，该循环重复25次。从已经将质粒掺入PMT6基因座中的菌株，检测5.8kb的扩增的DNA片段。类似地，将从转化菌株分离的染色体DNA用作模板，使用PMT6 PCR5′armF引物(SEQ ID NO：121)和PMT6PCR5′armR引物(SEQ ID NO：122)进行PCR，该PCR在94℃进行30秒，在60℃进行1分钟，在72℃进行2分钟，该循环重复25次。从已经将质粒掺入PMT6基因座中的菌株，检测6.3kb的扩增的DNA片段。选择的菌株称作O.minuta YK7菌株(Δoch1Δura3Δade1Δyps1Δpmt6::URA3)。

(5)其中的PMT5和PMT6基因已经被破坏的产抗体的O.minuta菌株的制备

通过电穿孔，使用NotI消化的抗体表达载体pOMexGPA/AbLys(在实施例18(1)中制备)和Sse8387I消化的抗体表达载体pOMexHy/AbLys，(在实施例18(1)中制备)来转化O.minuta YK6菌株(Δoch1Δyps1Δura3Δade1Δpmt5::rURA3)和O.minuta YK7菌株(Δoch1Δyps1Δura3Δade1Δpmt6::rURA3)。在已经加入浓度为50μg/ml的潮霉素B的SD琼脂平板培养基(2％葡萄糖，0.67％酵母氮基(Difco))中选择转化的细胞。在27℃在B2YP4G培养基(1.34％酵母氮基(Difco)，2％酵母提取物(Difco)，4％聚胨(Difco)，4％甘油，0.1M磷酸盐缓冲液(pH 6.0))中培养单个菌落4天。从培养液制备培养上清液，按照实施例7所述的方法进行蛋白印迹分析，选择其中已经导入抗体轻链和重链基因的生产抗体的菌株，得到的菌株分别称作O.minuta AP5菌株(the PMT5基因缺陷型菌株)和O.minuta AP6菌株(the PMT6基因缺陷型菌株)。单独地，通过电穿孔，将NotI消化的抗体表达载体pOMexGPA/AbLys和Sse8387I消化的pOMexHy/AbLys导入O.minutaYK4菌株(Δoch1Δura3Δade1Δyps1::rURA3)，以上述方式制备和选择生产抗体的菌株为对照菌株。得到的菌株称作O.minuta Acon菌株。

(6)其中的PMT5和PMT6基因已经被破坏的产抗体的O.minuta菌株的的分泌抗体的生产力

以实施例18(2)所述的方式，培养其中的PMT5基因已经被破坏的O.minuta AP5菌株和其中的PMT6基因已经被破坏的O.minuta AP6菌株和O.minuta Acon菌株，并进行非还原蛋白印迹分析。以实施例21(3)所述的方式，测量在培养液中生产的抗体的量。使用在动物细胞(CHO)中生产的抗体作为标准样品。结果如图16所示。也就是说，O.minuta AP5菌株或O.minuta AP6菌株和对照O.minuta Acon菌株之间的抗体聚集体的生产力没有显著差异。

[实施例25]含有插入灭活的PMT基因和导入其中的HAC1基因的O.minuta菌株的制备及其评价

(1)含有插入灭活的PMT基因和导入其中的HAC1基因的O.minuta菌株的制备

用Aor51HI消化在实施例3中制备的源自O.minuta的激活的HAC1基因表达载体pOMexPGHy/Hac1，并通过电穿孔，导入已经在实施例24(1)中制备的O.minutaYY2P2菌株(含有插入灭活的PMT2基因的菌株)、O.minuta YY2P4菌株(含有插入灭活的PMT4基因的菌株)和O.minutaYY2Z菌株(对照菌株)。为了证实激活的HAC1基因已经导入转化的菌株，在已经加入浓度为50μg/ml的潮霉素B的YPD琼脂平板培养基中选择菌株，培养菌株，提取基因组，根据实施例6的方法进行PCR。得到的菌株分别称作O.minuta YY3P2omH菌株(含有插入灭活的PMT2基因且含有导入其中的HAC1基因的菌株)、O.minuta YY3P4omH菌株(含有插入灭活的PMT4基因且含有导入其中的HAC1基因的菌株)和O.minuta YY3ZomH菌株(其中已经导入HAC1基因的对照菌株)。同时，将Aor51HI消化的pOMexPGHy导入O.minuta YY2Z菌株，获得O.minuta YY3ZHy菌株(其中已经导入载体的对照菌株)作为对照菌株。

(2)含有插入灭活的PMT基因且含有导入其中的HAC1基因的O.minuta菌株的分泌抗体的生产力

通过实施例18(2)所述的方法，培养在上面(1)制备的含有插入灭活的PMT基因且含有导入其中的HAC1基因的生产抗体的菌株，并进行蛋白印迹分析。结果如图12和图14所示。发现含有插入灭活的PMT2基因且含有导入其中的HAC1基因的O.minuta YY3P2omH菌株会分泌比仅导入HAC1基因的O.minuta YY3ZomH菌株和含有插入灭活的PMT2基因的O.minuta YY2P2菌株明显更大量的抗体(图12：泳道7)。发现含有插入灭活的PMT4基因且含有导入其中的HAC1基因的O.minuta YY3P4omH菌株会分泌比仅导入HAC1基因的O.minutaYY3ZomH菌株和含有插入灭活的PMT4基因的O.minuta YY2P4菌株明显更大量的抗体(图14：泳道6)。

通过实施例8和实施例21(3)所述的方法，测量在培养液中生产的抗体的量。使用在动物细胞(CHO)中生产的抗体作为标准样品。结果如图13和图15所示。发现含有插入灭活的PMT2基因且含有导入其中的HAC1基因的O.minuta YY3P2omH菌株会分泌比对照菌株即O.minutaYY3ZomH菌株(其中仅导入HAC1基因的菌株)、O.minuta YY2P2菌株(含有插入灭活的PMT2基因的菌株)和O.minuta YY3ZHy菌株(其中导入载体的对照菌株)明显更大量的抗体聚集体(图13：O.minutaYY3P2omH菌株)。也发现，含有插入灭活的PMT4基因且含有导入其中的HAC1基因的O.minuta YY3P4omH菌株会分泌比对照菌株即O.minuta YY3ZomH菌株(其中仅导入HAC1基因的菌株)、O.minutaYY2P4菌株(含有插入灭活的PMT4基因的菌株)和O.minuta YY3ZHy菌株(其中导入载体的对照菌株)明显更大量的抗体(图15：O.minutaYY3P4omH菌株)。

[实施例26]使用PMT抑制剂(1c)，由含有插入灭活的PMT基因且含有导入其中的HAC1基因的O.minuta菌株生产抗体

将一铂环量的在实施例25(1)中制备的含有插入灭活的PMT基因且含有导入其中的HAC1基因的产抗体菌株接种进5ml B2YP4G培养基，在27℃培养1天，然后用B2YP4G培养基稀释，调节OD600＝10。向产物加入在实施例9所述的PMT抑制剂(1c：母液浓度：0.1mM，0.5mM，2.5mM，和10mM)，分别至0.016μM，0.08μM，0.4μM，和2.0μM的浓度。在27℃培养另外3天，每隔24小时测定OD600，OD600值每增加1，分别加入量为0.00032μM，0.0016μM，0.008μM，和0.04μM的PMT抑制剂(1c)。从培养液制备培养上清液，通过实施例18(2)所述的方法，进行蛋白印迹分析。结果如图17所示。此外，通过实施例21(3)所述的方法，对分泌抗体的生产力定量。结果如图18所示。当随着OD600值增加1而加入约0.008μM PMT抑制剂(母液浓度：2.5mM)时，达到O.minuta YY3P2omH菌株(含有插入灭活的PMT2基因的菌株且含有导入其中的HAC1基因)的最高抗体生产力。当随着OD600值增加1而加入约0.04μM PMT抑制剂(母液浓度：10mM)时，达到O.minutaYY3P4omH菌株(含有插入灭活的PMT4基因且含有导入其中的HAC1基因的菌株)的最高抗体生产力。可以推论，PMT基因表达的抑制和PMT抑制剂的联合使用，会强烈抑制糖链添加。对于其中已经导入HAC1的菌株，为了抑制糖链添加，通过PMT基因表达的抑制和PMT抑制剂的联合使用来抑制PMT蛋白活性，可以预见到更高的聚集抗体的生产力。

[实施例27]PMT抑制剂(5a)的评价

将一铂环量的已经导入抗体基因的O.minuta YY1菌株接种进5mlB2YP4G培养基，在27℃培养1天，然后用B2YP4G培养基稀释，调节OD600＝10。向其中加入不同于实施例9所述的PMT抑制剂(1c)的PMT抑制剂({(5Z)-4-氧代-5-[3-(1-苯基乙氧基)-4-(2-苯基乙氧基)亚苄基]-2-硫代-1，3-噻唑烷-3-基}乙酸(在Bioorganic & Medicinal ChemistryLetters，Vol.14，p.3975，2004中所述的化合物5a)，达到1μm的浓度。在27℃培养另外3天，每隔24小时测定OD600，OD600值每增加1，加入量为0.02μM的PMT抑制剂。从培养液制备培养上清液，通过实施例18(2)所述的方法进行蛋白印迹分析，通过实施例21(3)所述的方法对分泌抗体的生产力定量。结果如图19和图20所示。通过加入新检查的PMT抑制剂(5a)，认为抗体聚集体的生产力倾向于增加。从而，认为PMT抑制剂(5a)具有与实施例9所述的PMT抑制剂(1c)等效的作用。

工业实用性

本发明实现了在酵母中高水平分泌生产具有复杂结构的蛋白，例如抗体，以及普通蛋白。

序列表

<110>Kyowa Hakko Kirin Co.，Ltd.

<110>DAIICHI SANKYO COMPANY，LIMITED

<110>National Institute of Advanced Industrial Science and Technology

<120>蛋白的高分泌生产方法

<130>PH-3149-PCT

<150>JP2006-136993

<151>2006-05-16

<160>122

<170>PatentIn Ver.2.1

<210>1

<211>25

<212>DNA

<213>人工序列

<220>

<223> 人工序列的描述：引物

<400>1

gngtngaytt yaaygtnccn ttrga 25

<210>2

<211>26

<212>DNA

<213>人工序列

<220>

<223>人工序列的描述：引物

<400>2

gynacdccng gyaaytcytt dccytc 26

<210>3

<211>9046

<212>DNA

<213>Ogataea minuta

<220>

<221>CDS

<222>(4766)..(6016)

<400>3

ggatcccgcc ctcgacggtt gttggtgcgg gataatgttc gttgatgagc caacttcgat 60

ttttgctgaa acgactgaga cagatccgac agacgaggtg tagttgcgga tcagattttg 120

catcactctg ctgtttcttt tgatgtgtct ttcgtcgtcc tggaaccccc aactcgatag 180

cagcgaaagg actttgtcgt ctcgctccac aagcgatagt tttggacgag ctagatatgg 240

attgacgtag cttcttgtcg aggtggcgga ctcttttttg atgtgggttt cggtaacgga 300

ttccgacttg gcatgtgatt caatcactcc ctcgtagtgg gacgacacca cgctcatgtt 360

gtcgtcgtcc tgttgtccgc tgaagtcaaa cggattgctt tttctgtcaa cggtgtcgac 420

gacagcgtca acgctcaaca gatctgagtc cacagtctcg acgctggaga cgtccgactc 480

atgaacagga tacctgaaat tcatctgggt cccaagaaac gtgtctgtgt gtgtctttct 540

gtgctgtctt ttcgtcattg cttgatattc cccctaaata gttatcacgt acggaactct 600

ggtaaaaaaa cctgatccgt ttcagatcaa ctacatttaa aatcaggttg ttcctccagc 660

cccggcggaa gctaaagatg gctggttttt tcaatcagat ggtgaaatat taattttttt 720

gagccgcaac ccagccccag atccgaggct gtgcagcaga ttcggtcgat aaatgtacaa 780

cgactatgct aaatagggag tgaaaagcag caaaaaaaat gtcttagagg tagtaccttg 840

gttcttcaaa gacatggaat ttgtggtctc tgaccccatc tccatagaac atcgatggga 900

atcggaggtc tggatcaacg gtttcctcgt ctatccgctg ttgcgagtag ctttcgtcgt 960

agtctccatt ggagggtatg ataaatttac ccacctgaac ctcagtgtcg gtgatggacc 1020

cacgactgat ccgagcatac ccggttcttt tgagtttctt gtacaagatg tactcgcacc 1080

aacgatcgtc atcagtagcg tcgatatcgt gcattcctga cttgtcgctc acgtaggtgt 1140

tgtaattccc cttgaggggt tcggtcacca agtagctcaa caggatcatt ggcctttctg 1200

aactgcccat aatttcggaa acaccgagag attgtaaacg gcggtcctca acgtcctctt 1260

cttgtcccga atggaaaacg acaacgtcca cgagctctcc gtaacagtcc agagtagcgt 1320

ggatggcagg agccaattcg cccacaggag acggaagcaa gtgatgcgtg gaattgatga 1380

tcggaaactt ggacaaaagg gccgcacccc aggtatgttt cgttgggttc ggaccgaaat 1440

cggcgtacat gccgagttct tcggcaattc tttgggtgag atctctgttt cccatgatga 1500

ttctttgagt gtccgattct aataaaccca caacgtccaa ctccaggtct ttgatcaggt 1560

ctctcattct gtgctcagat gcccacatgt cgttatcgag accaaagtga atggtccaaa 1620

taccagccgt gacaagtctg gactggggat ggtagggtct tggtttttcg aactggaatc 1680

tgttgaaagc gataaatccc gagagcagtg taaagaaaat gaggtaattt gtgatttttt 1740

tcaacgacga cttcagtcgc tttgaatgcg aaacttcaga ctgcttgtag ttgaaaacaa 1800

gaccgcaaat catcagaact gaaacagaca ggatgatatc tgttctttct ctcaacaatg 1860

gtccaccggg aacaaaggca tatgcgacaa cccagacgtg agccaaagag agcactatgt 1920

caaacaggaa cgaaagacca aacactagag ccacgccgtc cactttggaa acctgatcaa 1980

aacaaacagg agtgatgaaa cacagccaga aagcgtatgc cagcccacca gcgtaactga 2040

tccagccgtt gaaatagtac aggaacaaag ctccgagaac tcccgcataa gtgacagact 2100

tgtaggaact ggaccggtag aatccgaaaa aggctcctag acacatgaaa atcaccgtca 2160

ccgcaccgtg gggaacaggg atcggcccgt tgataggata gccctcccat gtccacagaa 2220

caatggtaga agagtcggta agcatggcac taatcgagaa aatcagagat ccaaaaccca 2280

tggctgacag cataagagaa ggcttttgag tcttaagtgg gcctttctca gatacagtcc 2340

cctgtggtag ctttgtgaaa gctgcagctg tcaatccgac aactagaccg gtgaggttcc 2400

acccaccggt gtcgctgttc atgatgggcc aaataggatt attggtccag aacgcaaact 2460

tggcgagact ggacagaatg agccccattg taaacgaggt tgcaaacgtt ttcgtagcca 2520

gttgatcatt cagtttgcca atggcagcca cttcggtact taaggcaatg gttgcgaacg 2580

aaacagccgc gccaataacc atcaatctgc aggcagggtc taccaccaag taagccccca 2640

caccgaacaa acaggtgagc gttctagcga cttgaggacg ttttgtgaaa aacagcttca 2700

cctttggaac tgccaagaca aacggagtca atagaaggac acagactgcc tcgtatcccg 2760

agattcccat gtaccacagc gggaagtacc agatacagag gaacaatgag gagtagacag 2820

accagaaaac gaaccaattg atggtgtcga cagtgagttg ccagaaagag ctgctgaact 2880

gagtcgactt cggtaatagc ttcccgctgg aggttggggc cgaggaactt gaagtgccgt 2940

ttattctgtc ttgaatgagc ttgatgtcga aattggcact gaaaaattcg tctcttgttg 3000

ctgaaggtct gagctcgatg atcaggtctt tgaagtccaa gatggaccag gcatcaaagc 3060

caacatcaag aaagatcaac gcccattcgc agtatgcgta gtaagaataa gctcccttga 3120

cgtgatgaac cttgtgctgg ataaaaagat acaccagagg gacaagtgca ccaaaaaatg 3180

tccatgcggt gtacttcctg gctcttctga tcctggaccg tggtggggac agcttggtga 3240

tagcgaggtc ccacgggata gtcaggacaa tgtaggagat cataaacaca tcgtgcgcgt 3300

cgtgatcatc cgtagaagta atataaaccc agcctccaca cgtgatggtt ctgatgaagc 3360

ccgatatcag ggcaagttta gggtacactg aattggcctt gtgcagacga acatacgtta 3420

gtagcagtag taagaaccga ggaccagctg taagcgcgat caaaatctgg aagattgacc 3480

gttcaggata tctgtcacca atggtggccg agacactcgg gaaccactcg tctggatacc 3540

cataatactc gttctcaacg attttgtaaa aatggagcca gcacccaaca gccaaggcag 3600

ctaaaaaggc agagagcgag cacacagagt gtgcgatcgc aatggcctgt gagttcaacc 3660

gcactagagg ctgcgagttg ggcccgtctg gaactgccat gatgataaat tgcgagcaaa 3720

ttgggtgaac atcagcacta aagcgacttg ttcccatcag aatctttaaa aacaacacct 3780

gaaatggacg ttttcagaga tcaggtgtaa gggtgtttgc ttggaaaaac acgaggaaaa 3840

gagcttgggc tgggaacacc cgtacaccgg atctagctcc tggctgcggg atctggattt 3900

aggaaaaaaa caaaacgcac gaatgagctt tgtcgccttt agcagagggt agaggtgata 3960

cactagacag caagagattg gaaaatggcg ggtaagtcgg ctgttgatga aatcttgatg 4020

acaactactg acatggaaca gaaatcaaag agaaacctga atttagaaag tcgccagacg 4080

tttcgttcga cgagattgat tacagagacc cgcttgctct aaaaaaggca caggagtcga 4140

tgctgagaga gcagttcatc agaattgagg ttctgaaggt ggtgagaaaa gcgctagaga 4200

attgctggag ggtgaacggg cccaacggac acgaagagtg ccgggacctg gccgacaagt 4260

acctagacat gctgccaaac tcccgggccc agggatacat gggataccaa agaaacgacc 4320

cgtccaaata ggctggctgc ggctggctgc ggctggctgc agaccgaccg caaaccaact 4380

gcaggcttgt tgtaggctga ttatttattg actatttatt gaatatttat tgcaccactt 4440

gtgtgttccc cttgaccatg cgtcgatcga cgcgcgaggc ttaggaagcc cggagcgggg 4500

aattcacgtg gtgtacgggt gtggaggtct agcacccgag ttttcggaga ggcagatgat 4560

gcatctccgg ggagtgtcag gcaaggagga atgggcagat cgacggaaga aagggatata 4620

aaatgttata tttgcacttg tttttgtgaa tatcagcacc caaacaaaat aagacaactt 4680

atcagtttct taagtattac aagtgagtaa ttgtcaacca gcacagctgt cgtagtgtaa 4740

acactaacgc cgcatagaac tagca atg tcg tta tcc agc aag ctg tca gtt 4792

Met Ser Leu Ser Ser Lys Leu Ser Val

1 5

aag gac ttg gac gtc tcg ggc aag aga gtg ttc ata aga gtg gac ttc 4840

Lys Asp Leu Asp Val Ser Gly Lys Arg Val Phe Ile Arg Val Asp Phe

10 15 20 25

aat gtt cca ttg gac gga gac aag atc acc aac aac caa aga att gtc 4888

Asn Val Pro Leu Asp Gly Asp Lys Ile Thr Asn Asn Gln Arg Ile Val

30 35 40

gct gct ttg cca acc att cag tac gtt ctt gag aac aag cca aag gtg 4936

Ala Ala Leu Pro Thr Ile Gln Tyr Val Leu Glu Asn Lys Pro Lys Val

45 50 55

gtt gtt ttg gcc tcc cac ttg ggc aga ccc aac gga gag aag aac ctc 4984

Val Val Leu Ala Ser His Leu Gly Arg Pro Asn Gly Glu Lys Asn Leu

60 65 70

aag tac aca ttg aag cct gtc gcc aag gaa ctg gag act ctt ttg ggc 5032

Lys Tyr Thr Leu Lys Pro Val Ala Lys Glu Leu Glu Thr Leu Leu Gly

75 80 85

cag aaa gtg acc ttc ttg gac gac tgt gtt ggt tct gag gtc gaa tct 5080

Gln Lys Val Thr Phe Leu Asp Asp Cys Val Gly Ser Glu Val Glu Ser

90 95 100 105

acc gtc aac tct gcc cct gct ggc tcg gtg att ttg cta gaa aat ttg 5128

Thr Val Asn Ser Ala Pro Ala Gly Ser Val Ile Leu Leu Glu Asn Leu

110 115 120

aga ttc cac att gag gag gaa ggc tcg aaa aag act tca gag gga aaa 5176

Arg Phe His Ile Glu Glu Glu Gly Ser Lys Lys Thr Ser Glu Gly Lys

125 130 135

gtt aag gct tcc aaa gag gac gtt gaa aaa ttc aga aag caa ctc act 5224

Val Lys Ala Ser Lys Glu Asp Val Glu Lys Phe Arg Lys Gln Leu Thr

140 145 150

gct ctg gct gat gtc tac gtt aac gac gct ttc ggt act gct cac aga 5272

Ala Leu Ala Asp Val Tyr Val Asn Asp Ala Phe Gly Thr Ala His Arg

155 160 165

gcc cac tcc tcc atg gtc ggt ttc gag ctc gag gac aga gct gct ggc 5320

Ala His Ser Ser Met Val Gly Phe Glu Leu Glu Asp Arg Ala Ala Gly

170 175 180 185

ttc ctg atg gcc aag gag ctg gag tac ttc tcc aag gct ctg gag aac 5368

Phe Leu Met Ala Lys Glu Leu Glu Tyr Phe Ser Lys Ala Leu Glu Asn

190 195 200

ccg gtg aga ccg ttt ttg gct atc ctt ggt ggt gca aag gtg tct gac 5416

Pro Val Arg Pro Phe Leu Ala Ile Leu Gly Gly Ala Lys Val Ser Asp

205 210 215

aaa att cag ctg att gac aat ttg ctc gac aag gtc gat ctc ttg att 5464

Lys Ile Gln Leu Ile Asp Asn Leu Leu Asp Lys Val Asp Leu Leu Ile

220 225 230

gtc ggt gga gga atg gcc ttc act ttc aac aag gtg ttg aac gac atg 5512

Val Gly Gly Gly Met Ala Phe Thr Phe Asn Lys Val Leu Asn Asp Met

235 240 245

aag atc ggt aag tct ttg ttc gac gag act gga gct gag att gtt cca 5560

Lys Ile Gly Lys Ser Leu Phe Asp Glu Thr Gly Ala Glu Ile Val Pro

250 255 260 265

aag ctc gtg gag aag gcc aag aag aac ggc gtc aag atc gtt ttg cca 5608

Lys Leu Val Glu Lys Ala Lys Lys Asn Gly Val Lys Ile Val Leu Pro

270 275 280

gtg gac ttt gtc act gcc gat gcg ttc tcg cca gat gcc aag gtt ggc 5656

Val Asp Phe Val Thr Ala Asp Ala Phe Ser Pro Asp Ala Lys Val Gly

285 290 295

tac gcc acc ctt gag gag ggt att gcc gac gat ttg caa ggt ctg gac 5704

Tyr Ala Thr Leu Glu Glu Gly Ile Ala Asp Asp Leu Gln Gly Leu Asp

300 305 310

ggt ggt gaa aag acc cgt aag ctg ttt gcc gac acc atc gcg cag gcc 5752

Gly Gly Glu Lys Thr Arg Lys Leu Phe Ala Asp Thr Ile Ala Gln Ala

315 320 325

aag acc atc gtc tgg aac ggt cca cct ggt gtg ttt gag ttc gag agc 5800

Lys Thr Ile Val Trp Asn Gly Pro Pro Gly Val Phe Glu Phe Glu Ser

330 335 340 345

ttt gcc agc ggt acc aag tcg atg ttg caa gct tgt gtc gag tct gcc 5848

Phe Ala Ser Gly Thr Lys Ser Met Leu Gln Ala Cys Val Glu Ser Ala

350 355 360

cag gcc gga aac acc gtt att atc ggt ggt gga gac act gcc acc gtg 5896

Gln Ala Gly Asn Thr Val Ile Ile Gly Gly Gly Asp Thr Ala Thr Val

365 370 375

gca aag aag ttt ggc ggt gcc gac aag ctg tcc cac gtt tcc act gga 5944

Ala Lys Lys Phe Gly Gly Ala Asp Lys Leu Ser His Val Ser Thr Gly

380 385 390

gga ggt gct tcc ctg gaa ttg ttg gag ggt aag gag ctt cct ggt gtt 5992

Gly Gly Ala Ser Leu Glu Leu Leu Glu Gly Lys Glu Leu Pro Gly Val

395 400 405

gct gct ttg aag agc aag act gct taggtgggat ttgcgtgatc tacgtagtgg 6046

Ala Ala Leu Lys Ser Lys Thr Ala

410 415

ttatttttgt agttagtttg actgtctaga aatactcttt gcacagcccc aaataaatta 6106

cactgccgtg aaattcatga gaaaaaagta ccaaagataa acaggggaga aagtgatcgg 6166

gtgttccctc ttgtgtgatc cagtcgtgaa cagtactgat caccacccca gatgactaaa 6226

cacaggcgca aaaacattcc actgacttac atcacacaga gcctagacaa ttccaggacc 6286

aatcagggtt cttcgtttga taaggctcta gtgaacaaac acaaacaaca cagatcaaag 6346

actcacaatt ctgtcaaatt ggccagtcta accaagtctt acttgtctgc caagccggtc 6406

caggcaacaa agagcccaac agttgacaaa atcaccaaaa ggatcaaccg aaagtcccac 6466

tcgaccaaga aaatcgaccc tgtcgcctct ttctcagggc cctgggggct tcttaccggc 6526

caacttaacg actatttaac gtcgattcgc tcaatgaact ctgttttgga ttacgaccag 6586

cccttgacca cggctcagaa gtcgtcgtcg tcgattttgg acatcaaacc gatttcagac 6646

catttgaacg tggtcaggtt cgcagagctc gatagcgtga tgctgggctc gttccaaaac 6706

cacccagtca gactcaaggc tggcgaccaa attcacattg gagacgatta ctacaatgtt 6766

ccgtacaacg gaaagtatct cagatgttac tatcgatggt ttaaagtgat atgaggtata 6826

tacaggatgc cgactagacg gtgaactgtt cgcgcagttg agagtactgg ctggaacggt 6886

ccggatcaca cttttccaac agttgcgaca caaatggtcc gtgcacagtt ttttccagag 6946

tgtttgaaat actcaacaaa ggcatgtact cgtccaggaa ctccttgcac atggtggcat 7006

cgcctttcac tgccaggaat tgaagagcaa ccagcgacgg ggtcaaatct tcccgtttca 7066

atgcaccgtc aaggactttc ttcatgtaca cccagttgtt gcggttggca aaaatggtga 7126

ggaaaacaac atccaatctg gaacgaaatt gggcagcagc caggtcgtgt tcgaacattc 7186

gggtggacag ttggtacagc ttgtgaacca ttggagagta cttgaagctg taattagggt 7246

ctgcagttag cgaaccgatc gtaaggaagt tttcgttatc gatctgcgag cccgagatga 7306

ctaatagagg tattagtttt tgaacgtcct ccgttgacaa aacagggtta taagtgttga 7366

gaatccggaa gatacgtgcg tatctcttgt tgaacacctc cgcctctgtc tctactgatt 7426

tgtgaaattc agacgactgt agcacgagat caatatatct gaacacctcg tcaacagtaa 7486

cgggtttccc gttggcttgc atggctttga aatggttctc gatcttgttc agagggtaag 7546

tggctgggtc cttcaaatgc agtgttttta aagcctcaaa tcgctggttg tagttctccg 7606

aggttaagag ttccggtcta aaagcgctcg agctcgcttg ggtggtgtag agatgtagcc 7666

ggttcagctg caaaatagtt tgaagattcg agatcctcgg ccgggcagtg tgatagtatc 7726

tgatcccggc aaagatatcg tcgttgtagc cacggtcact tctggctgga tactttgtct 7786

tctctttcga ccacaggttc tccaagcaca tgacttctct tctctccgcg gtcagaaagt 7846

ggacgtaaat gttatcgatt ttgcagtcca tcatcatcca ggtatttgct gaggccccgt 7906

aatcattgct ggcgtacgaa ggggctctct tacccttttt caacagtctt ctgtgatact 7966

tggctagctg gccactgctc agaagacctt ctgccagagg gatggttttc agagtgtgtt 8026

tgatgaaaag attgagctcc gccgtagctt tctggagatg cttcgaactc tttcctgttc 8086

caatgatcat gaagtcggcg atctcttggg ctccttcgtt gacctctgcc ccggtgctat 8146

cgcgcaagtc gaacagggcc agatcggtca ttcccagctt ctccgcgata aactcgagaa 8206

ctggctgcaa gctggccgga gagttgggcg gaagatccgg aatctgaatc tgtctaggct 8266

gcgaggccaa atccgcagac tcttcagctc tcatgtacca cgggagagct gccgttttga 8326

cttcttggtg gctgactgga actgacgaga agtcggcgac cagttgctgg gaactggcag 8386

cgttgtgagg gaagaagccg ctccgaaggg cgcggggcac aggacgcgac accggacaca 8446

accgacaccg tctccacatt atggctgtat ttggaaaaga ttgagtagtc gatagtttct 8506

gcaaaagctt tagcaaacaa caaacacgcg acgtttgaag acagtttttt ggcagcttcg 8566

atctgtcgat agttcagtgg tgatctcagt ggtcgtttcg tctaccttga atctctcacc 8626

ccagatgttg tctctgtgtg aagtttttgt gaatttttca tctttctttt tactcgattt 8686

tttcctcttc cacgtcgata gtcgcgagac gccttgcgac gcgccgtttt aatttcccaa 8746

aatttgcaca aacaaaagat aaaaacagga ctgtcgattt gggttttgtg ggaacagaaa 8806

agaggaaccg tttgaacaat aaagcaacgg tcctccaaaa tcatcctcta ccactcattc 8866

tcaacacgtg accatcggga acaagttctg gagctctctt caaaccgcga ctcaacatag 8926

tgttttgtgc caggcccgta ttttactata aaggtgccct caagaaccat tagttcgtgc 8986

tacttgcctc cgatttgtgc ttcctaacgg tgtttcaaca atcatgacag gccgggatcc 9046

<210>4

<211>417

<212>PRT

<213>Ogataea minuta

<400>4

Met Ser Leu Ser Ser Lys Leu Ser Val Lys Asp Leu Asp Val Ser Gly

1 5 10 15

Lys Arg Val Phe Ile Arg Val Asp Phe Asn Val Pro Leu Asp Gly Asp

20 25 30

Lys Ile Thr Asn Asn Gln Arg Ile Val Ala Ala Leu Pro Thr Ile Gln

35 40 45

Tyr Val Leu Glu Asn Lys Pro Lys Val Val Val Leu Ala Ser His Leu

50 55 60

Gly Arg Pro Asn Gly Glu Lys Asn Leu Lys Tyr Thr Leu Lys Pro Val

65 70 75 80

Ala Lys Glu Leu Glu Thr Leu Leu Gly Gln Lys Val Thr Phe Leu Asp

85 90 95

Asp Cys Val Gly Ser Glu Val Glu Ser Thr Val Asn Ser Ala Pro Ala

100 105 110

Gly Ser Val Ile Leu Leu Glu Asn Leu Arg Phe His Ile Glu Glu Glu

115 120 125

Gly Ser Lys Lys Thr Ser Glu Gly Lys Val Lys Ala Ser Lys Glu Asp

130 135 140

Val Glu Lys Phe Arg Lys Gln Leu Thr Ala Leu Ala Asp Val Tyr Val

145 150 155 160

Asn Asp Ala Phe Gly Thr Ala His Arg Ala His Ser Ser Met Val Gly

165 170 175

Phe Glu Leu Glu Asp Arg Ala Ala Gly Phe Leu Met Ala Lys Glu Leu

180 185 190

Glu Tyr Phe Ser Lys Ala Leu Glu Asn Pro Val Arg Pro Phe Leu Ala

195 200 205

Ile Leu Gly Gly Ala Lys Val Ser Asp Lys Ile Gln Leu Ile Asp Asn

210 215 220

Leu Leu Asp Lys Val Asp Leu Leu Ile Val Gly Gly Gly Met Ala Phe

225 230 235 240

Thr Phe Asn Lys Val Leu Asn Asp Met Lys Ile Gly Lys Ser Leu Phe

245 250 255

Asp Glu Thr Gly Ala Glu Ile Val Pro Lys Leu Val Glu Lys Ala Lys

260 265 270

Lys Asn Gly Val Lys Ile Val Leu Pro Val Asp Phe Val Thr Ala Asp

275 280 285

Ala Phe Ser Pro Asp Ala Lys Val Gly Tyr Ala Thr Leu Glu Glu Gly

290 295 300

Ile Ala Asp Asp Leu Gln Gly Leu Asp Gly Gly Glu Lys Thr Arg Lys

305 310 315 320

Leu Phe Ala Asp Thr Ile Ala Gln Ala Lys Thr Ile Val Trp Asn Gly

325 330 335

Pro Pro Gly Val Phe Glu Phe Glu Ser Phe Ala Ser Gly Thr Lys Ser

340 345 350

Met Leu Gln Ala Cys Val Glu Ser Ala Gln Ala Gly Asn Thr Val Ile

355 360 365

Ile Gly Gly Gly Asp Thr Ala Thr Val Ala Lys Lys Phe Gly Gly Ala

370 375 380

Asp Lys Leu Ser His Val Ser Thr Gly Gly Gly Ala Ser Leu Glu Leu

385 390 395 400

Leu Glu Gly Lys Glu Leu Pro Gly Val Ala Ala Leu Lys Ser Lys Thr

405 410 415

Ala

<210>5

<211>42

<212>DNA

<213>人工序列

<220>

<223>人工序列的描述：引物

<400>5

aagcttgaca atgtaggaga tcataaacac atcgtgcgcg tc 42

<210>6

<211>65

<212>DNA

<213>人工序列

<220>

<223>人工序列的描述：引物

<400>6

ggatccagat ctcatatgac tagttgctag ttctatgcgg cgttagtgtt tacactacga 60

cagct 65

<210>7

<211>40

<212>DNA

<213>人工序列

<220>

<223>人工序列的描述：引物

<400>7

ggatccgtgg gatttgcgtg atctacgtag tggttatttt 40

<210>8

<211>42

<212>DNA

<213>人工序列

<220>

<223>人工序列的描述：引物

<400>8

ggtaccgcag tgaaaggcga tgccaccatg tgcaaggagt tc 42

<210>9

<211>25

<212>DNA

<213>人工序列

<220>

<223>人工序列的描述：引物

<400>9

actagtatga gatttccttc aattt 25

<210>10

<211>25

<212>DNA

<213>人工序列

<220>

<223>人工序列的描述：引物

<400>10

gtcgacatga gatttccttc aattt 25

<210>11

<211>27

<212>DNA

<213>人工序列

<220>

<223>人工序列的描述：引物

<400>11

agcttcagcc tctcttttat ctagaga 27

<210>12

<211>47

<212>DNA

<213>人工序列

<220>

<223>人工序列的描述：引物

<400>12

tctctagata aaagagaggc tgaagctcag ctgcagctgc aggagtc 47

<210>13

<211>39

<212>DNA

<213>人工序列

<220>

<223>人工序列的描述：引物

<400>13

ccagatctgg atcctcattt acccggagac agggagagg 39

<210>14

<211>47

<212>DNA

<213>人工序列

<220>

<223>人工序列的描述：引物

<400>14

tctctagata aaagagaggc tgaagctgaa attgtgttga cacagtc 47

<210>15

<211>35

<212>DNA

<213>人工序列

<220>

<223>人工序列的描述：引物

<400>15

aaagggccct caacactctc ccctgttgaa gctct 35

<210>16

<211>25

<212>DNA

<213>人工序列

<220>

<223>人工序列的描述：引物

<400>16

atgacttcct tttcagcacc gcatc 25

<210>17

<211>23

<212>DNA

<213>人工序列

<220>

<223>人工序列的描述：引物

<400>17

caaaattgca agcaagttaa ccg 23

<210>18

<211>1431

<212>DNA

<213>Ogataea minuta

<400>18

atgacttcct tttcagcacc gcatcaacac cagtctattc cgtcggatgt tcctgtcgga 60

acgcttcctc ctagaaagag ggcgaagacc gacgaagaga aggagcaacg cagggttgag 120

cggattctca gaaataggag agccgcccac gcgtcgaggg aaaagaaaag aagacatgtt 180

gaacatctcg agacgtatgt gagtggcctg gagtcctcgc ttgcgattta cgagttgaat 240

caatccaaac tgcaaacgat acagtcgact ctcatatctt tgttgacgga gcacgggatc 300

gaatactctg gtattgactt ctcaatccaa gcaacaacaa aagtcagcaa gcctgacggg 360

ctcgacttga cacagacgaa tcctaccaaa aaacaaaaga gtttctcaaa gtcactttca 420

aaaaaaatgg gttcttcctc tagcatgaag atgtcggaac tcccatctcc tagcttcgac 480

gaggacgtct cttcggatga agacgacgat cttgaagatg acgagggagc agaaattgtc 540

gaggaatcgc caatgacgta tttggacctt ccggatccaa aagcgaacta caaaaagaga 600

aaggctgaag aagcttatat ttctccacct ggctcgacct ccccttccaa attgaagttg 660

gaggaagacg agctgatttt gaagcaagag tacagcaatt tgtttgacga cacggaagac 720

tttttctcta ctgagaagtc ttgcagtttg gagttgttca aacaaggcga ctctccttcg 780

gaatcattca tcaaacagga agacgatata ctgaaaatac ctgaggctgt tttcaactca 840

gaagaatatc atttgaatcc agtggaggac ctctgtgctt ttaatagcgt gcatcatcca 900

gcagtgatga ttgtatgatt tattgaaaag gcatctcaat aacattgaaa cagtgagatt 960

tccaaacaag aattgtacaa acgtgacatc atcaaaggta aaatcagaaa aaagttcttt 1020

tttcaggggt atttgtttgt tcttctttct gattttaccg tagttacgtt ttgtctgttt 1080

tttgaggaag tccaagctct tcgagcgttt catgtcggtt tattgcagat gttcgttttg 1140

gtccgcagca ccattatcag cgggggtcgt taacacttca tttgaattcg atgatttctt 1200

gtcatgagga agatagtcta cttggtttta tttagttgga atttggtgtc attgtttgat 1260

gagggggatg gaggtttgat caatcggttt caagttctct ttcgatgaga ttaatttgtt 1320

accgtctatg agttagatcc tgacccttgg tgagcttcgg aaaaaagttt gaagttcagc 1380

ctggttccat gccacgcgtg tttggttacg gttaacttgc ttgcaatttt g 1431

<210>19

<211>1187

<212>DNA

<213>Ogataea minuta

<400>19

atgacttcct tttcagcacc gcatcaacac cagtctattc cgtcggatgt tcctgtcgga 60

acgcttcctc ctagaaagag ggcgaagacc gacgaagaga aggagcaacg cagggttgag 120

cggattctca gaaataggag agccgcccac gcgtcgaggg aaaagaaaag aagacatgtt 180

gaacatctcg agacgtatgt gagtggcctg gagtcctcgc ttgcgattta cgagttgaat 240

caatccaaac tgcaaacgat acagtcgact ctcatatctt tgttgacgga gcacgggatc 300

gaatactctg gtattgactt ctcaatccaa gcaacaacaa aagtcagcaa gcctgacggg 360

ctcgacttga cacagacgaa tcctaccaaa aaacaaaaga gtttctcaaa gtcactttca 420

aaaaaaatgg gttcttcctc tagcatgaag atgtcggaac tcccatctcc tagcttcgac 480

gaggacgtct cttcggatga agacgacgat cttgaagatg acgagggagc agaaattgtc 540

gaggaatcgc caatgacgta tttggacctt ccggatccaa aagcgaacta caaaaagaga 600

aaggctgaag aagcttatat ttctccacct ggctcgacct ccccttccaa attgaagttg 660

gaggaagacg agctgatttt gaagcaagag tacagcaatt tgtttgacga cacggaagac 720

tttttctcta ctgagaagtc ttgcagtttg gagttgttca aacaaggcga ctctccttcg 780

gaatcattca tcaaacagga agacgatata ctgaaaatac ctgaggctgt tttcaactca 840

gaagaatatc atttgaatcc agtggaggac ctctgtgctt ttaatagcgt gcatcatcca 900

gcagcaccat tatcagcggg ggtcgttaac acttcatttg aattcgatga tttcttgtca 960

tgaggaagat agtctacttg gttttattta gttggaattt ggtgtcattg tttgatgagg 1020

gggatggagg tttgatcaat cggtttcaag ttctctttcg atgagattaa tttgttaccg 1080

tctatgagtt agatcctgac ccttggtgag cttcggaaaa aagtttgaag ttcagcctgg 1140

ttccatgcca cgcgtgtttg gttacggtta acttgcttgc aattttg 1187

<210>20

<211>28

<212>DNA

<213>人工序列

<220>

<223>人工序列的描述：引物

<400>20

gactagtatg acttcctttt cagcaccg 28

<210>21

<211>29

<212>DNA

<213>人工序列

<220>

<223>人工序列的描述：引物

<400>21

cagatcttca tgacaagaaa tcatcgaat 29

<210>22

<211>963

<212>DNA

<213>Ogataea minuta

<220>

<221>CDS

<222>(1)..(963)

<400>22

atg act tcc ttt tca gca ccg cat caa cac cag tct att ccg tcg gat 48

Met Thr Ser Phe Ser Ala Pro His Gln His Gln Ser Ile Pro Ser Asp

1 5 10 15

gtt cct gtc gga acg ctt cct cct aga aag agg gcg aag acc gac gaa 96

Val Pro Val Gly Thr Leu Pro Pro Arg Lys Arg Ala Lys Thr Asp Glu

20 25 30

gag aag gag caa cgc agg gtt gag cgg att ctc aga aat agg aga gcc 144

Glu Lys Glu Gln Arg Arg Val Glu Arg Ile Leu Arg Asn Arg Arg Ala

35 40 45

gcc cac gcg tcg agg gaa aag aaa aga aga cat gtt gaa cat ctc gag 192

Ala His Ala Ser Arg Glu Lys Lys Arg Arg His Val Glu His Leu Glu

50 55 60

acg tat gtg agt ggc ctg gag tcc tcg ctt gcg att tac gag ttg aat 240

Thr Tyr Val Ser Gly Leu Glu Ser Ser Leu Ala Ile Tyr Glu Leu Asn

65 70 75 80

caa tcc aaa ctg caa acg ata cag tcg act ctc ata tct ttg ttg acg 288

Gln Ser Lys Leu Gln Thr Ile Gln Ser Thr Leu Ile Ser Leu Leu Thr

85 90 95

gag cac ggg atc gaa tac tct ggt att gac ttc tca atc caa gca aca 336

Glu His Gly Ile Glu Tyr Ser Gly Ile Asp Phe Ser Ile Gln Ala Thr

100 105 110

aca aaa gtc agc aag cct gac ggg ctc gac ttg aca cag acg aat cct 384

Thr Lys Val Ser Lys Pro Asp Gly Leu Asp Leu Thr Gln Thr Asn Pro

115 120 125

acc aaa aaa caa aag agt ttc tca aag tca ctt tca aaa aaa atg ggt 432

Thr Lys Lys Gln Lys Ser Phe Ser Lys Ser Leu Ser Lys Lys Met Gly

130 135 140

tct tcc tct agc atg aag atg tcg gaa ctc cca tct cct agc ttc gac 480

Ser Ser Ser Ser Met Lys Met Ser Glu Leu Pro Ser Pro Ser Phe Asp

145 150 155 160

gag gac gtc tct tcg gat gaa gac gac gat ctt gaa gat gac gag gga 528

Glu Asp Val Ser Ser Asp Glu Asp Asp Asp Leu Glu Asp Asp Glu Gly

165 170 175

gca gaa att gtc gag gaa tcg cca atg acg tat ttg gac ctt ccg gat 576

Ala Glu Ile Val Glu Glu Ser Pro Met Thr Tyr Leu Asp Leu Pro Asp

180 185 190

cca aaa gcg aac tac aaa aag aga aag gct gaa gaa gct tat att tct 624

Pro Lys Ala Asn Tyr Lys Lys Arg Lys Ala Glu Glu Ala Tyr Ile Ser

195 200 205

cca cct ggc tcg acc tcc cct tcc aaa ttg aag ttg gag gaa gac gag 672

Pro Pro Gly Ser Thr Ser Pro Ser Lys Leu Lys Leu Glu Glu Asp Glu

210 215 220

ctg att ttg aag caa gag tac agc aat ttg ttt gac gac acg gaa gac 720

Leu Ile Leu Lys Gln Glu Tyr Ser Asn Leu Phe Asp Asp Thr Glu Asp

225 230 235 240

ttt ttc tct act gag aag tct tgc agt ttg gag ttg ttc aaa caa ggc 768

Phe Phe Ser Thr Glu Lys Ser Cys Ser Leu Glu Leu Phe Lys Gln Gly

245 250 255

gac tct cct tcg gaa tca ttc atc aaa cag gaa gac gat ata ctg aaa 816

Asp Ser Pro Ser Glu Ser Phe Ile Lys Gln Glu Asp Asp Ile Leu Lys

260 265 270

ata cct gag gct gtt ttc aac tca gaa gaa tat cat ttg aat cca gtg 864

Ile Pro Glu Ala Val Phe Asn Ser Glu Glu Tyr His Leu Asn Pro Val

275 280 285

gag gac ctc tgt gct ttt aat agc gtg cat cat cca gca gca cca tta 912

Glu Asp Leu Cys Ala Phe Asn Ser Val His His Pro Ala Ala Pro Leu

290 295 300

tca gcg ggg gtc gtt aac act tca ttt gaa ttc gat gat ttc ttg tca 960

Ser Ala Gly Val Val Asn Thr Ser Phe Glu Phe Asp Asp Phe Leu Ser

305 310 315 320

tga 963

<210>23

<211>320

<212>PRT

<213>Ogataea minuta

<400>23

Met Thr Ser Phe Ser Ala Pro His Gln His Gln Ser Ile Pro Ser Asp

1 5 10 15

Val Pro Val Gly Thr Leu Pro Pro Arg Lys Arg Ala Lys Thr Asp Glu

20 25 30

Glu Lys Glu Gln Arg Arg Val Glu Arg Ile Leu Arg Asn Arg Arg Ala

35 40 45

Ala His Ala Ser Arg Glu Lys Lys Arg Arg His Val Glu His Leu Glu

50 55 60

Thr Tyr Val Ser Gly Leu Glu Ser Ser Leu Ala Ile Tyr Glu Leu Asn

65 70 75 80

Gln Ser Lys Leu Gln Thr Ile Gln Ser Thr Leu Ile Ser Leu Leu Thr

85 90 95

Glu His Gly Ile Glu Tyr Ser Gly Ile Asp Phe Ser Ile Gln Ala Thr

100 105 110

Thr Lys Val Ser Lys Pro Asp Gly Leu Asp Leu Thr Gln Thr Asn Pro

115 120 125

Thr Lys Lys Gln Lys Ser Phe Ser Lys Ser Leu Ser Lys Lys Met Gly

130 135 140

Ser Ser Ser Ser Met Lys Met Ser Glu Leu Pro Ser Pro Ser Phe Asp

145 150 155 160

Glu Asp Val Ser Ser Asp Glu Asp Asp Asp Leu Glu Asp Asp Glu Gly

165 170 175

Ala Glu Ile Val Glu Glu Ser Pro Met Thr Tyr Leu Asp Leu Pro Asp

180 185 190

Pro Lys Ala Asn Tyr Lys Lys Arg Lys Ala Glu Glu Ala Tyr Ile Ser

195 200 205

Pro Pro Gly Ser Thr Ser Pro Ser Lys Leu Lys Leu Glu Glu Asp Glu

210 215 220

Leu Ile Leu Lys Gln Glu Tyr Ser Asn Leu Phe Asp Asp Thr Glu Asp

225 230 235 240

Phe Phe Ser Thr Glu Lys Ser Cys Ser Leu Glu Leu Phe Lys Gln Gly

245 250 255

Asp Ser Pro Ser Glu Ser Phe Ile Lys Gln Glu Asp Asp Ile Leu Lys

260 265 270

Ile Pro Glu Ala Val Phe Asn Ser Glu Glu Tyr His Leu Asn Pro Val

275 280 285

Glu Asp Leu Cys Ala Phe Asn Ser Val His His Pro Ala Ala Pro Leu

290 295 300

Ser Ala Gly Val Val Asn Thr Ser Phe Glu Phe Asp Asp Phe Leu Ser

305 310 315 320

<210>24

<211>50

<212>DNA

<213>人工序列

<220>

<223>人工序列的描述：引物

<400>24

atacaataca aagtcgagac tagtatggat atttacgaca ctcaaacctt 50

<210>25

<211>50

<212>DNA

<213>人工序列

<220>

<223>人工序列的描述：引物

<400>25

tctatccaca cggatcagat cttcagacag aggtgccctc ctttgagctg 50

<210>26

<211>24

<212>DNA

<213>人工序列

<220>

<223>人工序列的描述：引物

<400>26

ggaattcatg agatttcctt caat 24

<210>27

<211>35

<212>DNA

<213>人工序列

<220>

<223>人工序列的描述：引物

<400>27

ctccaccagc tgtacttctc ttttctcgag agata 35

<210>28

<211>35

<212>DNA

<213>人工序列

<220>

<223>人工序列的描述：引物

<400>28

tatctctcga gaaaagagaa gtacagctgg tggag 35

<210>29

<211>25

<212>DNA

<213>人工序列

<220>

<223>人工序列的描述：引物

<400>29

ggtcgactca tttacccggg gacag 25

<210>30

<211>34

<212>DNA

<213>人工序列

<220>

<223>人工序列的描述：引物

<400>30

tgggtcatct gaatgtctct tttctcgaga gata 34

<210>31

<211>34

<212>DNA

<213>人工序列

<220>

<223>人工序列的描述：引物

<400>31

tatctctcga gaaaagagac attcagatga ccca 34

<210>32

<211>24

<212>DNA

<213>人工序列

<220>

<223>人工序列的描述：引物

<400>32

ggtcgaccta acactctccc ctgt 24

<210>33

<211>26

<212>DNA

<213>人工序列

<220>

<223>人工序列的描述：引物

<400>33

ggagctcatg gaaatgactg attttg 26

<210>34

<211>44

<212>DNA

<213>人工序列

<220>

<223>人工序列的描述：引物

<400>34

gaattcaaac ctgactgcgc ttctggatta cgccaattgt caag 44

<210>35

<211>44

<212>DNA

<213>人工序列

<220>

<223>人工序列的描述：引物

<400>35

cttgacaatt ggcgtaatcc agaagcgcag tcaggtttga attc 44

<210>36

<211>28

<212>DNA

<213>人工序列

<220>

<223>人工序列的描述：引物

<400>36

gcccgggtca tgaagtgatg aagaaatc 28

<210>37

<211>26

<212>DNA

<213>人工序列

<220>

<223>人工序列的描述：引物

<400>37

gggtaccatg gatatttacg acactc 26

<210>38

<211>26

<212>DNA

<213>人工序列

<220>

<223>人工序列的描述：引物

<400>38

gtctagatca gacagaggtg ccctcc 26

<210>39

<211>717

<212>DNA

<213>啤酒糖酵母

<220>

<221>CDS

<222>(1)..(717)

<400>39

atg gaa atg act gat ttt gaa cta act agt aat tcg caa tcg aac ttg 48

Met Glu Met Thr Asp Phe Glu Leu Thr Ser Asn Ser Gln Ser Asn Leu

1 5 10 15

gct atc cct acc aac ttc aag tcg act ctg cct cca agg aaa aga gcc 96

Ala Ile Pro Thr Asn Phe Lys Ser Thr Leu Pro Pro Arg Lys Arg Ala

20 25 30

aag aca aaa gag gaa aag gaa cag cga agg atc gag cgt att ttg aga 144

Lys Thr Lys Glu Glu Lys Glu Gln Arg Arg Ile Glu Arg Ile Leu Arg

35 40 45

aac aga aga gct gct cac cag agc aga gag aaa aaa aga cta cat ctg 192

Asn Arg Arg Ala Ala His Gln Ser Arg Glu Lys Lys Arg Leu His Leu

50 55 60

cag tat ctc gag aga aaa tgt tct ctt ttg gaa aat tta ctg aac agc 240

Gln Tyr Leu Glu Arg Lys Cys Ser Leu Leu Glu Asn Leu Leu Asn Ser

65 70 75 80

gtc aac ctt gaa aaa ctg gct gac cac gaa gac gcg ttg act tgc agc 288

Val Asn Leu Glu Lys Leu Ala Asp His Glu Asp Ala Leu Thr Cys Ser

85 90 95

cac gac gct ttt gtt gct tct ctt gac gag tac agg gat ttc cag agc 336

His Asp Ala Phe Val Ala Ser Leu Asp Glu Tyr Arg Asp Phe Gln Ser

100 105 110

acg agg ggc gct tca ctg gac acc agg gcc agt tcg cac tcg tcg tct 384

Thr Arg Gly Ala Ser Leu Asp Thr Arg Ala Ser Ser His Ser Ser Ser

115 120 125

gat acg ttc aca cct tca cct ctg aac tgt aca atg gag cct gcg act 432

Asp Thr Phe Thr Pro Ser Pro Leu Asn Cys Thr Met Glu Pro Ala Thr

130 135 140

ttg tcg ccc aag agt atg cgc gat tcc gcg tcg gac caa gag act tca 480

Leu Ser Pro Lys Ser Met Arg Asp Ser Ala Ser Asp Gln Glu Thr Ser

145 150 155 160

tgg gag ctg cag atg ttt aag acg gaa aat gta cca gag tcg acg acg 528

Trp Glu Leu Gln Met Phe Lys Thr Glu Asn Val Pro Glu Ser Thr Thr

165 170 175

cta cct gcc gta gac aac aac aat ttg ttt gat gcg gtg gcc tcg ccg 576

Leu Pro Ala Val Asp Asn Asn Asn Leu Phe Asp Ala Val Ala Ser Pro

180 185 190

ttg gca gac cca ctc tgc gac gat ata gcg gga aac agt cta ccc ttt 624

Leu Ala Asp Pro Leu Cys Asp Asp Ile Ala Gly Asn Ser Leu Pro Phe

195 200 205

gac aat tca att gat ctt gac aat tgg cgt aat cca gaa gcg cag tca 672

Asp Asn Ser Ile Asp Leu Asp Asn Trp Arg Asn Pro Glu Ala Gln Ser

210 215 220

ggt ttg aat tca ttt gaa ttg aat gat ttc ttc atc act tca tga 717

Gly Leu Asn Ser Phe Glu Leu Asn Asp Phe Phe Ile Thr Ser

225 230 235

<210>40

<211>238

<212>PRT

<213>啤酒糖酵母

<400>40

Met Glu Met Thr Asp Phe Glu Leu Thr Ser Asn Ser Gln Ser Asn Leu

1 5 10 15

Ala Ile Pro Thr Asn Phe Lys Ser Thr Leu Pro Pro Arg Lys Arg Ala

20 25 30

Lys Thr Lys Glu Glu Lys Glu Gln Arg Arg Ile Glu Arg Ile Leu Arg

35 40 45

Asn Arg Arg Ala Ala His Gln Ser Arg Glu Lys Lys Arg Leu His Leu

50 55 60

Gln Tyr Leu Glu Arg Lys Cys Ser Leu Leu Glu Asn Leu Leu Asn Ser

65 70 75 80

Val Asn Leu Glu Lys Leu Ala Asp His Glu Asp Ala Leu Thr Cys Ser

85 90 95

His Asp Ala Phe Val Ala Ser Leu Asp Glu Tyr Arg Asp Phe Gln Ser

100 105 110

Thr Arg Gly Ala Ser Leu Asp Thr Arg Ala Ser Ser His Ser Ser Ser

115 120 125

Asp Thr Phe Thr Pro Ser Pro Leu Asn Cys Thr Met Glu Pro Ala Thr

130 135 140

Leu Ser Pro Lys Ser Met Arg Asp Ser Ala Ser Asp Gln Glu Thr Ser

145 150 155 160

Trp Glu Leu Gln Met Phe Lys Thr Glu Asn Val Pro Glu Ser Thr Thr

165 170 175

Leu Pro Ala Val Asp Asn Asn Asn Leu Phe Asp Ala Val Ala Ser Pro

180 185 190

Leu Ala Asp Pro Leu Cys Asp Asp Ile Ala Gly Asn Ser Leu Pro Phe

195 200 205

Asp Asn Ser Ile Asp Leu Asp Asn Trp Arg Asn Pro Glu Ala Gln Ser

210 215 220

Gly Leu Asn Ser Phe Glu Leu Asn Asp Phe Phe Ile Thr Ser

225 230 235

<210>41

<211>1356

<212>DNA

<213>里氏木霉

<220>

<221>CDS

<222>(1)..(1356)

<400>41

atg gcg ttc cag cag tcg tct ccc ctc gtc aag ttt gag gcc tct ccc 48

Met Ala Phe Gln Gln Ser Ser Pro Leu Val Lys Phe Glu Ala Ser Pro

1 5 10 15

gcc gaa tcc ttc ctc tcc gcc ccc ggc gac aac ttc aca tcc ctc ttc 96

Ala Glu Ser Phe Leu Ser Ala Pro Gly Asp Asn Phe Thr Ser Leu Phe

20 25 30

gcc gac tca aca ccc tca aca ctt aac cct cgg gac atg atg acc cct 144

Ala Asp Ser Thr Pro Ser Thr Leu Asn Pro Arg Asp Met Met Thr Pro

35 40 45

gac agc gtc gcc gac atc gac tct cgc ctg tcc gtc atc ccc gaa tca 192

Asp Ser Val Ala Asp Ile Asp Ser Arg Leu Ser Val Ile Pro Glu Ser

50 55 60

cag gac gcg gaa gat gac gaa tca cac tcc aca tcc gct acc gca ccc 240

Gln Asp Ala Glu Asp Asp Glu Ser His Ser Thr Ser Ala Thr Ala Pro

65 70 75 80

tct acc tca gaa aag aag ccc gtc aag aag agg aaa tca tgg ggc cag 288

Ser Thr Ser Glu Lys Lys Pro Val Lys Lys Arg Lys Ser Trp Gly Gln

85 90 95

gtt ctt cct gag ccc aag acc aac ctc cct cct cga aaa cgt gca aag 336

Val Leu Pro Glu Pro Lys Thr Asn Leu Pro Pro Arg Lys Arg Ala Lys

100 105 110

acg gaa gat gaa aag gag cag cgc cgc gtc gag cgt gtt ctc cgc aac 384

Thr Glu Asp Glu Lys Glu Gln Arg Arg Val Glu Arg Val Leu Arg Asn

115 120 125

cgc cgc gcc gcg cag tcc tcg cgc gag cgc aag agg ctc gag gtc gag 432

Arg Arg Ala Ala Gln Ser Ser Arg Glu Arg Lys Arg Leu Glu Val Glu

130 135 140

gct ctc gag aag cgc aac aag gag ctc gag acg ctc ctc atc aac gtc 480

Ala Leu Glu Lys Arg Asn Lys Glu Leu Glu Thr Leu Leu Ile Asn Val

145 150 155 160

cag aag acc aac ctg atc ctc gtc gag gag ctc aac cgc ttc cga cgc 528

Gln Lys Thr Asn Leu Ile Leu Val Glu Glu Leu Asn Arg Phe Arg Arg

165 170 175

agc tca ggc gtc gtc acc cgc tcg tcc tcc ccc ctc gac tct ctc cag 576

Ser Ser Gly Val Val Thr Arg Ser Ser Ser Pro Leu Asp Ser Leu Gln

180 185 190

gac agc atc act ctc tcc cag caa ctc ttt ggc tcg cgg gat ggc caa 624

Asp Ser Ile Thr Leu Ser Gln Gln Leu Phe Gly Ser Arg Asp Gly Gln

195 200 205

acc atg tcc aac ccc gag cag tcc ttg atg gac cag atc atg aga tct 672

Thr Met Ser Asn Pro Glu Gln Ser Leu Met Asp Gln Ile Met Arg Ser

210 215 220

gcc gct aac cct acc gtt aac ccg gcc tct ctt tcc ccc tcc ctc ccc 720

Ala Ala Asn Pro Thr Val Asn Pro Ala Ser Leu Ser Pro Ser Leu Pro

225 230 235 240

ccc atc tcg gac aag gag ttc cag acc aag gag gag gac gag gaa cag 768

Pro Ile Ser Asp Lys Glu Phe Gln Thr Lys Glu Glu Asp Glu Glu Gln

245 250 255

gcc gac gaa gat gaa gag atg gag cag aca tgg cac gag acc aaa gaa 816

Ala Asp Glu Asp Glu Glu Met Glu Gln Thr Trp His Glu Thr Lys Glu

260 265 270

gcc gcc gcc gcc aag gag aag aac agc aag cag tcc cgc gtc tcc act 864

Ala Ala Ala Ala Lys Glu Lys Asn Ser Lys Gln Ser Arg Val Ser Thr

275 280 285

gat tcg aca caa cgt cct gca gtg tca atc ggt gga gat gcc gct gtc 912

Asp Ser Thr Gln Arg Pro Ala Val Ser Ile Gly Gly Asp Ala Ala Val

290 295 300

cct gtc ttc tca gac gac gcc ggc gca aac tgc ctt ggc ctg gac cct 960

Pro Val Phe Ser Asp Asp Ala Gly Ala Asn Cys Leu Gly Leu Asp Pro

305 310 315 320

gtt cat cag gat gat ggt cct ttc agc atc ggc cat tct ttc ggc ctg 1008

Val His Gln Asp Asp Gly Pro Phe Ser Ile Gly His Ser Phe Gly Leu

325 330 335

tca gcg gcc ctt gat gca gat cgc tat ctc ctc gaa agc caa ctt ctc 1056

Ser Ala Ala Leu Asp Ala Asp Arg Tyr Leu Leu Glu Ser Gln Leu Leu

340 345 350

gct tcg ccc aac gcc tca act gtt gac gac gat tat ctg gct ggt gac 1104

Ala Ser Pro Asn Ala Ser Thr Val Asp Asp Asp Tyr Leu Ala Gly Asp

355 360 365

tct gcc gcc tgc ttc acg aat cct ctc ccc tcc gac tac gac ttc gac 1152

Ser Ala Ala Cys Phe Thr Asn Pro Leu Pro Ser Asp Tyr Asp Phe Asp

370 375 380

atc aac gac ttc ctc aca gac gac gca aac cac gcc gcc tat gac att 1200

Ile Asn Asp Phe Leu Thr Asp Asp Ala Asn His Ala Ala Tyr Asp Ile

385 390 395 400

gtg gca gcg agc aac tat gcc gct gcg gac cgc gag ctc gac ctc gag 1248

Val Ala Ala Ser Asn Tyr Ala Ala Ala Asp Arg Glu Leu Asp Leu Glu

405 410 415

atc cac gac cct gag aat cag atc cct tcg cga cat tct atc cag cag 1296

Ile His Asp Pro Glu Asn Gln Ile Pro Ser Arg His Ser Ile Gln Gln

420 425 430

ccc cag tct ggc gcg tcc tct cat gga tgc gac gat ggc ggc att gcg 1344

Pro Gln Ser Gly Ala Ser Ser His Gly Cys Asp Asp Gly Gly Ile Ala

435 440 445

gtt ggt gtc tga 1356

Val Gly Val

450

<210>42

<211>451

<212>PRT

<213>里氏木霉

<400>42

Met Ala Phe Gln Gln Ser Ser Pro Leu Val Lys Phe Glu Ala Ser Pro

1 5 10 15

Ala Glu Ser Phe Leu Ser Ala Pro Gly Asp Asn Phe Thr Ser Leu Phe

20 25 30

Ala Asp Ser Thr Pro Ser Thr Leu Asn Pro Arg Asp Met Met Thr Pro

35 40 45

Asp Ser Val Ala Asp Ile Asp Ser Arg Leu Ser Val Ile Pro Glu Ser

50 55 60

Gln Asp Ala Glu Asp Asp Glu Ser His Ser Thr Ser Ala Thr Ala Pro

65 70 75 80

Ser Thr Ser Glu Lys Lys Pro Val Lys Lys Arg Lys Ser Trp Gly Gln

85 90 95

Val Leu Pro Glu Pro Lys Thr Asn Leu Pro Pro Arg Lys Arg Ala Lys

100 105 110

Thr Glu Asp Glu Lys Glu Gln Arg Arg Val Glu Arg Val Leu Arg Asn

115 120 125

Arg Arg Ala Ala Gln Ser Ser Arg Glu Arg Lys Arg Leu Glu Val Glu

130 135 140

Ala Leu Glu Lys Arg Asn Lys Glu Leu Glu Thr Leu Leu Ile Asn Val

145 150 155 160

Gln Lys Thr Asn Leu Ile Leu Val Glu Glu Leu Asn Arg Phe Arg Arg

165 170 175

Ser Ser Gly Val Val Thr Arg Ser Ser Ser Pro Leu Asp Ser Leu Gln

180 185 190

Asp Ser Ile Thr Leu Ser Gln Gln Leu Phe Gly Ser Arg Asp Gly Gln

195 200 205

Thr Met Ser Asn Pro Glu Gln Ser Leu Met Asp Gln Ile Met Arg Ser

210 215 220

Ala Ala Asn Pro Thr Val Asn Pro Ala Ser Leu Ser Pro Ser Leu Pro

225 230 235 240

Pro IIe Ser Asp Lys Glu Phe Gln Thr Lys Glu Glu Asp Glu Glu Gln

245 250 255

Ala Asp Glu Asp Glu Glu Met Glu Gln Thr Trp His Glu Thr Lys Glu

260 265 270

Ala Ala Ala Ala Lys Glu Lys Asn Ser Lys Gln Ser Arg Val Ser Thr

275 280 285

Asp Ser Thr Gln Arg Pro Ala Val Ser Ile Gly Gly Asp Ala Ala Val

290 295 300

Pro Val Phe Ser Asp Asp Ala Gly Ala Asn Cys Leu Gly Leu Asp Pro

305 310 315 320

Val His Gln Asp Asp Gly Pro Phe Ser Ile Gly His Ser Phe Gly Leu

325 330 335

Ser Ala Ala Leu Asp Ala Asp Arg Tyr Leu Leu Glu Ser Gln Leu Leu

340 345 350

Ala Ser Pro Asn Ala Ser Thr Val Asp Asp Asp Tyr Leu Ala Gly Asp

355 360 365

Ser Ala Ala Cys Phe Thr Asn Pro Leu Pro Ser Asp Tyr Asp Phe Asp

370 375 380

Ile Asn Asp Phe Leu Thr Asp Asp Ala Asn His Ala Ala Tyr Asp Ile

385 390 395 400

Val Ala Ala Ser Asn Tyr Ala Ala Ala Asp Arg Glu Leu Asp Leu Glu

405 410 415

Ile His Asp Pro Glu Asn Gln Ile Pro Ser Arg His Ser Ile Gln Gln

420 425 430

Pro Gln Ser Gly Ala Ser Ser His Gly Cys Asp Asp Gly Gly Ile Ala

435 440 445

Val Gly Val

450

<210>43

<211>1053

<212>DNA

<213>构巢曲霉

<220>

<221>CDS

<222>(1)..(1053)

<400>43

atg aaa tca gca gac cgg ttt tcg cca gtg aaa atg gag gac gct ttc 48

Met Lys Ser Ala Asp Arg Phe Ser Pro Val Lys Met Glu Asp Ala Phe

1 5 10 15

gca aac tct ttg cct act acc ccg tca ttg gag gtt cct gtg ctc act 96

Ala Asn Ser Leu Pro Thr Thr Pro Ser Leu Glu Val Pro Val Leu Thr

20 25 30

gtc tcc ccg gct gac aca tct ctt cgg acg aag aat gtg gtg gct cag 144

Val Ser Pro Ala Asp Thr Ser Leu Arg Thr Lys Asn Val Val Ala Gln

35 40 45

aca aag cct gag gag aag aag cca gcg aag aaa aga aag tcc tgg ggc 192

Thr Lys Pro Glu Glu Lys Lys Pro Ala Lys Lys Arg Lys Ser Trp Gly

50 55 60

cag gaa tta cca gtt ccc aag aca aac tta cct cca aga aaa cgc gct 240

Gln Glu Leu Pro Val Pro Lys Thr Asn Leu Pro Pro Arg Lys Arg Ala

65 70 75 80

aag aca gaa gat gag aaa gag cag cgc cgg att gag cga gtt ctt cgc 288

Lys Thr Glu Asp Glu Lys Glu Gln Arg Arg Ile Glu Arg Val Leu Arg

85 90 95

aac cgc gca gcc gca caa acc tct cgc gag cgc aag aga ctt gaa atg 336

Asn Arg Ala Ala Ala Gln Thr Ser Arg Glu Arg Lys Arg Leu Glu Met

100 105 110

gag aag tta gaa agc gag aag att gat atg gaa caa caa aac cag ttc 384

Glu Lys Leu Glu Ser Glu Lys Ile Asp Met Glu Gln Gln Asn Gln Phe

115 120 125

ctt ctt cag cgt ctc gcc cag atg gag gct gag aac aac cgt tta agt 432

Leu Leu Gln Arg Leu Ala Gln Met Glu Ala Glu Asn Asn Arg Leu Ser

130 135 140

cag caa gtt gct cag cta tcc gcg gag gtt cgg gga tcc cgc cac agc 480

Gln Gln Val Ala Gln Leu Ser Ala Glu Val Arg Gly Ser Arg His Ser

145 150 155 160

act cca act tcc agt tcc ccc gcg tca gtt tcg cca act ctc aca ccg 528

Thr Pro Thr Ser Ser Ser Pro Ala Ser Val Ser Pro Thr Leu Thr Pro

165 170 175

act ctt ttt aag cag gaa ggg gat gag gtt cct ctg gac cgc atc cct 576

Thr Leu Phe Lys Gln Glu Gly Asp Glu Val Pro Leu Asp Arg Ile Pro

180 185 190

ttt cca act ccc tcc gtg acc gac tac tcc cca act ctt aag cct tca 624

Phe Pro Thr Pro Ser Val Thr Asp Tyr Ser Pro Thr Leu Lys Pro Ser

195 200 205

tct ctg gct gag tcc ccc gat ttg aca caa cat cct gca gtg tca gtc 672

Ser Leu Ala Glu Ser Pro Asp Leu Thr Gln His Pro Ala Val Ser Val

210 215 220

ggc ggg ctc gaa gga gat gaa agt gcc ctc acg ctt ttc gac ctc gga 720

Gly Gly Leu Glu Gly Asp Glu Ser Ala Leu Thr Leu Phe Asp Leu Gly

225 230 235 240

gcc agc att aag cat gag cct aca cat gac ctt aca gct cct ctt tct 768

Ala Ser Ile Lys His Glu Pro Thr His Asp Leu Thr Ala Pro Leu Ser

245 250 255

gac gat gac ttc cgc cgc cta ttc aac ggt gat tca tcc ctt gag tca 816

Asp Asp Asp Phe Arg Arg Leu Phe Asn Gly Asp Ser Ser Leu Glu Ser

260 265 270

gat tct tca ctc ctt gaa gac ggg ttc gcc ttt gac gtt ctc gac tca 864

Asp Ser Ser Leu Leu Glu Asp Gly Phe Ala Phe Asp Val Leu Asp Ser

275 280 285

gga gat tta tca gca ttt cca ttt gat tct atg gtt gat ttt gac acc 912

Gly Asp Leu Ser Ala Phe Pro Phe Asp Ser Met Val Asp Phe Asp Thr

290 295 300

gag cct gtc acc ctc gaa gat ctc gag caa acc aac ggc ctt tcg gat 960

Glu Pro Val Thr Leu Glu Asp Leu Glu Gln Thr Asn Gly Leu Ser Asp

305 310 315 320

tca gct tct tgc aag gct gct agc ttg caa ccc agc cat ggc gcg tcc 1008

Ser Ala Ser Cys Lys Ala Ala Ser Leu Gln Pro Ser His Gly Ala Ser

325 330 335

act tcg cga tgc gac ggg cag ggc att gca gct ggc agt gcg tga 1053

Thr Ser Arg Cys Asp Gly Gln Gly Ile Ala Ala Gly Ser Ala

340 345 350

<210>44

<211>350

<212>PRT

<213>构巢曲霉

<400>44

Met Lys Ser Ala Asp Arg Phe Ser Pro Val Lys Met Glu Asp Ala Phe

1 5 10 15

Ala Asn Ser Leu Pro Thr Thr Pro Ser Leu Glu Val Pro Val Leu Thr

20 25 30

Val Ser Pro Ala Asp Thr Ser Leu Arg Thr Lys Asn Val Val Ala Gln

35 40 45

Thr Lys Pro Glu Glu Lys Lys Pro Ala Lys Lys Arg Lys Ser Trp Gly

50 55 60

Gln Glu Leu Pro Val Pro Lys Thr Asn Leu Pro Pro Arg Lys Arg Ala

65 70 75 80

Lys Thr Glu Asp Glu Lys Glu Gln Arg Arg Ile Glu Arg Val Leu Arg

85 90 95

Asn Arg Ala Ala Ala Gln Thr Ser Arg Glu Arg Lys Arg Leu Glu Met

100 105 110

Glu Lys Leu Glu Ser Glu Lys Ile Asp Met Glu Gln Gln Ash Gln Phe

115 120 125

Leu Leu Gln Arg Leu Ala Gln Met Glu Ala Glu Asn Asn Arg Leu Ser

130 135 140

Gln Gln Val Ala Gln Leu Ser Ala Glu Val Arg Gly Ser Arg His Ser

145 150 155 160

Thr Pro Thr Ser Ser Ser Pro Ala Ser Val Ser Pro Thr Leu Thr Pro

165 170 175

Thr Leu Phe Lys Gln Glu Gly Asp Glu Val Pro Leu Asp Arg Ile Pro

180 185 190

Phe Pro Thr Pro Ser Val Thr Asp Tyr Ser Pro Thr Leu Lys Pro Ser

195 200 205

Ser Leu Ala Glu Ser Pro Asp Leu Thr Gln His Pro Ala Val Ser Val

210 215 220

Gly Gly Leu Glu Gly Asp Glu Ser Ala Leu Thr Leu Phe Asp Leu Gly

225 230 235 240

Ala Ser Ile Lys His Glu Pro Thr His Asp Leu Thr Ala Pro Leu Ser

245 250 255

Asp Asp Asp Phe Arg Arg Leu Phe Asn Gly Asp Ser Ser Leu Glu Ser

260 265 270

Asp Ser Ser Leu Leu Glu Asp Gly Phe Ala Phe Asp Val Leu Asp Ser

275 280 285

Gly Asp Leu Ser Ala Phe Pro Phe Asp Ser Met Val Asp Phe Asp Thr

290 295 300

Glu Pro Val Thr Leu Glu Asp Leu Glu Gln Thr Asn Gly Leu Ser Asp

305 310 315 320

Ser Ala Ser Cys Lys Ala Ala Ser Leu Gln Pro Ser His Gly Ala Ser

325 330 335

Thr Ser Arg Cys Asp Gly Gln Gly Ile Ala Ala Gly Ser Ala

340 345 350

<210>45

<211>5468

<212>DNA

<213>人

<220>

<221>CDS

<222>(285)..(4967)

<400>45

ggtatcgata agcttgatgg agcggacggc agacggggcg ggcggcgtca gggtcgcagc 60

gtctacagct gctcgggggc ggtttcttgg cggaggcttg gccggctcct ctctcccggc 120

tcagcggcgg ctgcgaaggc ggcggctcct gccctctcgc tttccctctc gcgtctctgg 180

ctgcagaaag aagcttccgg ttctgaggtc ctggaggtgc catttccctc tctgttgaag 240

caaaggccgg ggcagacctc ctagtgaaag gaaagcaagc cagg atg gat att tac 296

Met Asp Ile Tyr

1

gac act caa acc ttg ggg gtt gtg gtc ttt gga gga ttc atg gtt gtt 344

Asp Thr Gln Thr Leu Gly Val Val Val Phe Gly Gly Phe Met Val Val

5 10 15 20

tct gcc att ggc atc ttc ctg gtg tcg act ttc tcc atg aag gaa acg 392

Ser Ala Ile Gly Ile Phe Leu Val Ser Thr Phe Ser Met Lys Glu Thr

25 30 35

tca tat gaa gaa gcc cta gcc aac cag cgc aag gag atg gcg aaa act 440

Ser Tyr Glu Glu Ala Leu Ala Asn Gln Arg Lys Glu Met Ala Lys Thr

40 45 50

cac cac cag aaa gtc gag aag aaa aag aag gag aaa aca gtg gag aag 488

His His Gln Lys Val Glu Lys Lys Lys Lys Glu Lys Thr Val Glu Lys

55 60 65

aaa gga aag acc aag aaa aag gaa gag aaa cct aat ggg aag ata cct 536

Lys Gly Lys Thr Lys Lys Lys Glu Glu Lys Pro Asn Gly Lys Ile Pro

70 75 80

gat cat gat cca gcc ccc aat gtg act gtc ctc ctt cga gaa cca gtg 584

Asp His Asp Pro Ala Pro Asn Val Thr Val Leu Leu Arg Glu Pro Val

85 90 95 100

cgg gct cct gct gtg gct gtg gct cca acc cca gtg cag ccc ccc att 632

Arg Ala Pro Ala Val Ala Val Ala Pro Thr Pro Val Gln Pro Pro Ile

105 110 115

atc gtt gct cct gtc gcc aca gtt cca gcc atg ccc cag gag aag ctg 680

Ile Val Ala Pro Val Ala Thr Val Pro Ala Met Pro Gln Glu Lys Leu

120 125 130

gcc tcc tcc ccc aag gac aaa aag aag aag gag aaa aaa gtg gca aaa 728

Ala Ser Ser Pro Lys Asp Lys Lys Lys Lys Glu Lys Lys Val Ala Lys

135 140 145

gtg gaa cca gct gtc agc tct gta gtg aat tcc atc cag gtt ctc act 776

Val Glu Pro Ala Val Ser Ser Val Val Asn Ser Ile Gln Val Leu Thr

150 155 160

tcg aag gct gcc atc ttg gaa act gct ccc aag gag gtg ccg atg gtg 824

Ser Lys Ala Ala Ile Leu Glu Thr Ala Pro Lys Glu Val Pro Met Val

165 170 175 180

gtg gtg ccc cca gtg ggt gcc aag ggc aac aca cca gcc act ggc act 872

Val Val Pro Pro Val Gly Ala Lys Gly Asn Thr Pro Ala Thr Gly Thr

185 190 195

act cag ggc aaa aag gcg gag ggg act cag aat caa agc aaa aag gct 920

Thr Gln Gly Lys Lys Ala Glu Gly Thr Gln Asn Gln Ser Lys Lys Ala

200 205 210

gaa gga gcc cca aac cag ggc aga aag gca gag gga acc cca aac cag 968

Glu Gly Ala Pro Asn Gln Gly Arg Lys Ala Glu Gly Thr Pro Asn Gln

215 220 225

ggc aaa aag aca gag gga acc cca aac caa ggg aaa aag gca gag gga 1016

Gly Lys Lys Thr Glu Gly Thr Pro Asn Gln Gly Lys Lys Ala Glu Gly

230 235 240

acc cca aac caa ggc aaa aag gca gaa gga acc cca aac caa ggc aaa 1064

Thr Pro Asn Gln Gly Lys Lys Ala Glu Gly Thr Pro Asn Gln Gly Lys

245 250 255 260

aag gcg gag ggg gcc cag aac cag ggt aaa aag gta gat aca acc cca 1112

Lys Ala Glu Gly Ala Gln Asn Gln Gly Lys Lys Val Asp Thr Thr Pro

265 270 275

aac cag ggg aaa aag gtg gag ggg gcc cca acc cag ggc aga aag gcc 1160

Asn Gln Gly Lys Lys Val Glu Gly Ala Pro Thr Gln Gly Arg Lys Ala

280 285 290

gag ggg gct cag aac cag gcc aaa aag gta gaa ggg gcc cag aac cag 1208

Glu Gly Ala Gln Asn Gln Ala Lys Lys Val Glu Gly Ala Gln Asn Gln

295 300 305

ggc aaa aag gca gag ggg gcc cag aat cag ggc aaa aag gga gag ggg 1256

Gly Lys Lys Ala Glu Gly Ala Gln Asn Gln Gly Lys Lys Gly Glu Gly

310 315 320

gcc cag aac cag ggc aag aag gcc gag ggg gcc cag aat cag ggc aag 1304

Ala Gln Asn Gln Gly Lys Lys Ala Glu Gly Ala Gln Asn Gln Gly Lys

325 330 335 340

aag gcc gag ggg gcc cag aat cag ggc aag aag gcc gag ggg gcc cag 1352

Lys Ala Glu Gly Ala Gln Asn Gln Gly Lys Lys Ala Glu Gly Ala Gln

345 350 355

aat cag ggc aag aag gcc gag ggg gcc cag aat cag ggc aag aag gct 1400

Asn Gln Gly Lys Lys Ala Glu Gly Ala Gln Asn Gln Gly Lys Lys Ala

360 365 370

gag ggg gct cag aac cag ggc aaa aag gcc gag ggg gct cag aac cag 1448

Glu Gly Ala Gln Asn Gln Gly Lys Lys Ala Glu Gly Ala Gln Asn Gln

375 380 385

ggc aaa aaa gta gaa ggg gcc cag aac cag ggc aag aag gct gag ggt 1496

Gly Lys Lys Val Glu Gly Ala Gln Asn Gln Gly Lys Lys Ala Glu Gly

390 395 400

gcc cag aac cag ggc aaa aag gcc gag ggg gcc cag aat cag ggc aaa 1544

Ala Gln Asn Gln Gly Lys Lys Ala Glu Gly Ala Gln Asn Gln Gly Lys

405 410 415 420

aag gcc gag ggg gcc cag aac cag ggc aag aag gca gag ggg gcc cag 1592

Lys Ala Glu Gly Ala Gln Asn Gln Gly Lys Lys Ala Glu Gly Ala Gln

425 430 435

aac cag ggc aag aag gcc gag ggg gcc cag aac cag gac aag aag gcc 1640

Asn Gln Gly Lys Lys Ala Glu Gly Ala Gln Asn Gln Asp Lys Lys Ala

440 445 450

gag ggg gcc cag aac cag ggc agg aag gcc gag ggg gcc cag aac cag 1688

Glu Gly Ala Gln Asn Gln Gly Arg Lys Ala Glu Gly Ala Gln Asn Gln

455 460 465

ggc agg aag gcc gag ggg gcc cag aac cag ggc aag aag gcc gag ggg 1736

Gly Arg Lys Ala Glu Gly Ala Gln Asn Gln Gly Lys Lys Ala Glu Gly

470 475 480

gcc ccg aac cag ggc aag aag gcc gag ggg gcc ccg aac cag ggc aag 1784

Ala Pro Asn Gln Gly Lys Lys Ala Glu Gly Ala Pro Asn Gln Gly Lys

485 490 495 500

aag gcc gag ggg acc ccg aac cag ggc aag aag gcc gag ggg acc ccg 1832

Lys Ala Glu Gly Thr Pro Asn Gln Gly Lys Lys Ala Glu Gly Thr Pro

505 510 515

aac cag ggc aag aag gcc gag ggg acc ccg aac cag ggc aag aag gcc 1880

Asn Gln Gly Lys Lys Ala Glu Gly Thr Pro Asn Gln Gly Lys Lys Ala

520 525 530

gag ggg gcc cag aac cag ggc aag aag gcc gag ggg gcc cag aac cag 1928

Glu Gly Ala Gln Asn Gln Gly Lys Lys Ala Glu Gly Ala Gln Asn Gln

535 540 545

ggc aag aag gcc gag ggg acc ccg aac cag ggc aag aag gcc gag ggg 1976

Gly Lys Lys Ala Glu Gly Thr Pro Asn Gln Gly Lys Lys Ala Glu Gly

550 555 560

gcc cag aac cag ggc aag aag gcc gag ggg gcc cag aac cag ggc aag 2024

Ala Gln Asn Gln Gly Lys Lys Ala Glu Gly Ala Gln Asn Gln Gly Lys

565 570 575 580

aag gcc gag ggg gcc cag aac cag ggc aag aag gcc gag ggg gcc cag 2072

Lys Ala Glu Gly Ala Gln Asn Gln Gly Lys Lys Ala Glu Gly Ala Gln

585 590 595

aac cag ggc aag aag gcc gag ggg gcc cag aac cag ggc aag aag gcc 2120

Asn Gln Gly Lys Lys Ala Glu Gly Ala Gln Asn Gln Gly Lys Lys Ala

600 605 610

gag ggt gct cag aac cag ggc aaa aaa gta gaa ggg gcc cag aac cag 2168

Glu Gly Ala Gln Asn Gln Gly Lys Lys Val Glu Gly Ala Gln Asn Gln

615 620 625

ggc aag aag gct gag ggg gcc cag aac cag ggc aag aag gcc gag ggg 2216

Gly Lys Lys Ala Glu Gly Ala Gln Asn Gln Gly Lys Lys Ala Glu Gly

630 635 640

gct cag aac cag ggc aaa aag gcc gag gga gcc cag aac cag ggc caa 2264

Ala Gln Asn Gln Gly Lys Lys Ala Glu Gly Ala Gln Asn Gln Gly Gln

645 650 655 660

aaa gga gag gga gcc cag aat cag ggt aaa aag aca gaa ggg gct cag 2312

Lys Gly Glu Gly Ala Gln Asn Gln Gly Lys Lys Thr Glu Gly Ala Gln

665 670 675

ggc aaa aag gca gaa agg agt ccc aac caa ggc aaa aaa gga gag gga 2360

Gly Lys Lys Ala Glu Arg Ser Pro Asn Gln Gly Lys Lys Gly Glu Gly

680 685 690

gct ccc atc cag ggc aaa aag gca gat tcg gtt gct aat cag ggc aca 2408

Ala Pro Ile Gln Gly Lys Lys Ala Asp Ser Val Ala Asn Gln Gly Thr

695 700 705

aag gta gag ggt att aca aac cag ggg aaa aaa gca gaa ggg tcc ccc 2456

Lys Val Glu Gly Ile Thr Asn Gln Gly Lys Lys Ala Glu Gly Ser Pro

710 715 720

agt gaa ggc aaa aag gca gaa ggg tcc ccc aac caa ggc aaa aag gca 2504

Ser Glu Gly Lys Lys Ala Glu Gly Ser Pro Asn Gln Gly Lys Lys Ala

725 730 735 740

gac gca gct gcc aat cag ggt aaa aag aca gag tca gct tct gtc cag 2552

Asp Ala Ala Ala Asn Gln Gly Lys Lys Thr Glu Ser Ala Ser Val Gln

745 750 755

ggc aga aat aca gat gtg gcc cag agc cca gag gca cca aag caa gag 2600

Gly Arg Asn Thr Asp Val Ala Gln Ser Pro Glu Ala Pro Lys Gln Glu

760 765 770

gct cct gcc aag aag aag tct ggt tca aag aaa aaa ggt gag cct ggg 2648

Ala Pro Ala Lys Lys Lys Ser Gly Ser Lys Lys Lys Gly Glu Pro Gly

775 780 785

ccc cca gat gcc gac ggc cct ctc tac ctc ccc tac aag acg ctg gtc 2696

Pro Pro Asp Ala Asp Gly Pro Leu Tyr Leu Pro Tyr Lys Thr Leu Val

790 795 800

tcc acg gtt ggg agc atg gtg ttc aac gag ggc gag gcc cag cgg ctc 2744

Ser Thr Val Gly Ser Met Val Phe Asn Glu Gly Glu Ala Gln Arg Leu

805 810 815 820

atc gag atc ctg tct gag aag gct ggc atc att cag gac acc tgg cac 2792

Ile Glu Ile Leu Ser Glu Lys Ala Gly Ile Ile Gln Asp Thr Trp His

825 830 835

aag gcc act cag aag ggt gac cct gtg gcg att ctg aaa cgc cag ctg 2840

Lys Ala Thr Gln Lys Gly Asp Pro Val Ala Ile Leu Lys Arg Gln Leu

840 845 850

gaa gag aag gaa aaa ctg ctg gcc aca gaa cag gaa gat gcg gct gtc 2888

Glu Glu Lys Glu Lys Leu Leu Ala Thr Glu Gln Glu Asp Ala Ala Val

855 860 865

gcc aag agc aaa ctg agg gag ctc aac aag gag atg gca gca gaa aag 2936

Ala Lys Ser Lys Leu Arg Glu Leu Asn Lys Glu Met Ala Ala Glu Lys

870 875 880

gcc aaa gca gca gcc ggg gag gcc aaa gtg aaa aag cag ctg gtg gcc 2984

Ala Lys Ala Ala Ala Gly Glu Ala Lys Val Lys Lys Gln Leu Val Ala

885 890 895 900

cgg gag cag gag atc acg gct gtg cag gca cgc atg cag gcc agc tac 3032

Arg Glu Gln Glu Ile Thr Ala Val Gln Ala Arg Met Gln Ala Ser Tyr

905 910 915

cgg gag cac gtg aag gag gtg cag cag ctg cag ggc aag atc cgg act 3080

Arg Glu His Val Lys Glu Val Gln Gln Leu Gln Gly Lys Ile Arg Thr

920 925 930

ctt cag gag cag ctg gag aat ggc ccc aac acg cag ctg gcc cgc ctg 3128

Leu Gln Glu Gln Leu Glu Asn Gly Pro Asn Thr Gln Leu Ala Arg Leu

935 940 945

cag cag gag aac tcc atc ctg cgg gat gcc ttg aac cag gcc acg agc 3176

Gln Gln Glu Asn Ser Ile Leu Arg Asp Ala Leu Asn Gln Ala Thr Ser

950 955 960

cag gtg gag agc aag cag aac gca gag ctg gcc aag ctt cgg cag gag 3224

Gln Val Glu Ser Lys Gln Asn Ala Glu Leu Ala Lys Leu Arg Gln Glu

965 970 975 980

ctc agc aag gtc agc aaa gag ctg gtg gag aag tca gag gct gtg cgg 3272

Leu Ser Lys Val Ser Lys Glu Leu Val Glu Lys Ser Glu Ala Val Arg

985 990 995

caa gat gag cag cag cgg aaa gct ctg gaa gcc aag gca gct gcc ttc 3320

Gln Asp Glu Gln Gln Arg Lys Ala Leu Glu Ala Lys Ala Ala Ala Phe

1000 1005 1010

gag aag cag gtc ctg cag ctg cag gcg tcc cac agg gag agt gag gag 3368

Glu Lys Gln Val Leu Gln Leu Gln Ala Ser His Arg Glu Ser Glu Glu

1015 1020 1025

gcc ctg cag aag cgc ctg gac gag gtc agc cgg gag ctg tgc cac acg 3416

Ala Leu Gln Lys Arg Leu Asp Glu Val Ser Arg Glu Leu Cys His Thr

1030 1035 1040

cag agc agc cac gcc agc ctc cgg gcg gat gcc gag aag gcc cag gag 3464

Gln Ser Ser His Ala Ser Leu Arg Ala Asp Ala Glu Lys Ala Gln Glu

1045 1050 1055 1060

caa cag cag cag atg gcc gag ctg cac agc aag tta cag tcc tcc gag 3512

Gln Gln Gln Gln Met Ala Glu Leu His Ser Lys Leu Gln Ser Ser Glu

1065 1070 1075

gcg gag gtg cgc agc aaa tgc gag gag ctg agt ggc ctc cac ggg cag 3560

Ala Glu Val Arg Ser Lys Cys Glu Glu Leu Ser Gly Leu His Gly Gln

1080 1085 1090

ctc cag gag gcc agg gcg gag aac tcc cag ctc aca gag aga atc cgt 3608

Leu Gln Glu Ala Arg Ala Glu Asn Ser Gln Leu Thr Glu Arg Ile Arg

1095 1100 1105

tcc att gag gcc ctg ctg gag gcg ggc cag gcg cgg gat gcc cag gac 3656

Ser Ile Glu Ala Leu Leu Glu Ala Gly Gln Ala Arg Asp Ala Gln Asp

1110 1115 1120

gtc cag gcc agc cag gcg gag gct gac cag cag cag act cgc ctc aag 3704

Val Gln Ala Ser Gln Ala Glu Ala Asp Gln Gln Gln Thr Arg Leu Lys

1125 1130 1135 1140

gag ctg gag tcc cag gtg tcg ggt ctg gag aag gag gcc atc gag ctc 3752

Glu Leu Glu Ser Gln Val Ser Gly Leu Glu Lys Glu Ala Ile Glu Leu

1145 1150 1155

agg gag gcc gtc gag cag cag aaa gtg aag aac aat gac ctc cgg gag 3800

Arg Glu Ala Val Glu Gln Gln Lys Val Lys Asn Asn Asp Leu Arg Glu

1160 1165 1170

aag aac tgg aag gcc atg gag gca ctg gcc acg gcc gag cag gcc tgc 3848

Lys Asn Trp Lys Ala Met Glu Ala Leu Ala Thr Ala Glu Gln Ala Cys

1175 1180 1185

aag gag aag ctg cac tcc ctg acc cag gcc aag gag gaa tcg gag aag 3896

Lys Glu Lys Leu His Ser Leu Thr Gln Ala Lys Glu Glu Ser Glu Lys

1190 1195 1200

cag ctc tgt ctg att gag gcg cag acc atg gag gcc ctg ctg gct ctg 3944

Gln Leu Cys Leu Ile Glu Ala Gln Thr Met Glu Ala Leu Leu Ala Leu

1205 1210 1215 1220

ctc cca gaa ctc tct gtc ttg gca caa cag aat tac acc gag tgg ctg 3992

Leu Pro Glu Leu Ser Val Leu Ala Gln Gln Asn Tyr Thr Glu Trp Leu

1225 1230 1235

cag gat ctc aaa gag aaa ggc ccc acg ctg ctg aag cac ccg cca gct 4040

Gln Asp Leu Lys Glu Lys Gly Pro Thr Leu Leu Lys His Pro Pro Ala

1240 1245 1250

ccc gcg gag ccc tcc tcg gac ctg gcc tcc aag ttg agg gag gcc gag 4088

Pro Ala Glu Pro Ser Ser Asp Leu Ala Ser Lys Leu Arg Glu Ala Glu

1255 1260 1265

gag acg cag agc aca ctg cag gcc gag tgt gac cag tac cgc agc atc 4136

Glu Thr Gln Ser Thr Leu Gln Ala Glu Cys Asp Gln Tyr Arg Ser Ile

1270 1275 1280

ctg gcg gag acg gag ggc atg ctc aga gac ctg cag aag agc gtg gag 4184

Leu Ala Glu Thr Glu Gly Met Leu Arg Asp Leu Gln Lys Ser Val Glu

1285 1290 1295 1300

gag gag gag cag gtg tgg agg gcc aag gtg ggc gcc gca gag gag gag 4232

Glu Glu Glu Gln Val Trp Arg Ala Lys Val Gly Ala Ala Glu Glu Glu

1305 1310 1315

ctc cag aag tcc cgg gtc aca gtg aag cat ctc gaa gag att gta gag 4280

Leu Gln Lys Ser Arg Val Thr Val Lys His Leu Glu Glu Ile Val Glu

1320 1325 1330

aag cta aaa gga gaa ctt gaa agt tcg gac cag gtg agg gag cac acg 4328

Lys Leu Lys Gly Glu Leu Glu Ser Ser Asp Gln Val Arg Glu His Thr

1335 1340 1345

ttg cat ttg gag gca gag ctg gaa aag cac atg gcg gcc gcc agc gcc 4376

Leu His Leu Glu Ala Glu Leu Glu Lys His Met Ala Ala Ala Ser Ala

1350 1355 1360

gag tgc cag aac tac gcc aag gag gtg gca ggg ctg agg caa ctt ctc 4424

Glu Cys Gln Asn Tyr Ala Lys Glu Val Ala Gly Leu Arg Gln Leu Leu

1365 1370 1375 1380

cta gaa tct caa tct cag ctc gat gcc gcc aag agc gaa gcc cag aaa 4472

Leu Glu Ser Gln Ser Gln Leu Asp Ala Ala Lys Ser Glu Ala Gln Lys

1385 1390 1395

cag agc gat gag ctt gcc ctg gtc agg cag cag ttg agt gaa atg aag 4520

Gln Ser Asp Glu Leu Ala Leu Val Arg Gln Gln Leu Ser Glu Met Lys

1400 1405 1410

agc cac gta gag gat ggt gac ata gct ggg gcc cca gct tcc tcc cca 4568

Ser His Val Glu Asp Gly Asp Ile Ala Gly Ala Pro Ala Ser Ser Pro

1415 1420 1425

gag gcg ccc cca gcc gag cag gac ccc gtt cag ctg aag acg cag ctg 4616

Glu Ala Pro Pro Ala Glu Gln Asp Pro Val Gln Leu Lys Thr Gln Leu

1430 1435 1440

gag tgg aca gaa gcc atc ctg gag gat gag cag aca cag cgg cag aag 4664

Glu Trp Thr Glu Ala Ile Leu Glu Asp Glu Gln Thr Gln Arg Gln Lys

1445 1450 1455 1460

ctc acg gcc gag ttt gag gag gct cag acc tcg gca tgt cgg tta caa 4712

Leu Thr Ala Glu Phe Glu Glu Ala Gln Thr Ser Ala Cys Arg Leu Gln

1465 1470 1475

gaa gaa ttg gag aag ctc cgc aca gcc ggc ccc cta gag tct tca gaa 4760

Glu Glu Leu Glu Lys Leu Arg Thr Ala Gly Pro Leu Glu Ser Ser Glu

1480 1485 1490

aca gag gag gcc tca cag ctg aag gag aga cta gaa aaa gag aag aag 4808

Thr Glu Glu Ala Ser Gln Leu Lys Glu Arg Leu Glu Lys Glu Lys Lys

1495 1500 1505

tta aca agt gac ctg ggg cgc gcc gcc acg aga ctg cag gag ctt ctg 4856

Leu Thr Ser Asp Leu Gly Arg Ala Ala Thr Arg Leu Gln Glu Leu Leu

1510 1515 1520

aag acg acc cag gag cag ctg gca agg gag aag gac acg gtg aag aag 4904

Lys Thr Thr Gln Glu Gln Leu Ala Arg Glu Lys Asp Thr Val Lys Lys

1525 1530 1535 1540

ctg cag gaa cag ctg gaa aag gca gag gac ggc agc agc tca aag gag 4952

Leu Gln Glu Gln Leu Glu Lys Ala Glu Asp Gly Ser Ser Ser Lys Glu

1545 1550 1555

ggc acc tct gtc tga gtttcctctt tggaaaaaga agttactgtt caacttacca 5007

Gly Thr Ser Val

1560

aaatgcctta cacattcctt acaaataaac caaccaacct acacagcgtt atccaggccc 5067

aacttccggt actccgagag aagccatgag agacaagtct cttagagcca cagaagtaga 5127

ccttccagag ccccagtttg taaatgaacc tgtgtcacat ttgataaaca ctatcctggg 5187

cgcagccccg ggccaccgcc gagtgacgcc aaagccctgg ttgactctga cagccccgtg 5247

ggtgtgtggg aggccgggcg ctctggggtc tgtctgtcag tgcaatcgtt tagtgttttt 5307

tcagtggggc ggggcgggaa gcgggtggga ccgggcagcc agttctcaaa ggctgtgggg 5367

ccgactggag gccacagccc ctcaccccta gacgttgcca accagaactg acgtgtgacc 5427

tcctgggtgt tgatgccatt aaaaccaacg ttggtgcccg g 5468

<210>46

<211>1560

<212>PRT

<213>人

<400>46

Met Asp Ile Tyr Asp Thr Gln Thr Leu Gly Val Val Val Phe Gly Gly

1 5 10 15

Phe Met Val Val Ser Ala Ile Gly Ile Phe Leu Val Ser Thr Phe Ser

20 25 30

Met Lys Glu Thr Ser Tyr Glu Glu Ala Leu Ala Asn Gln Arg Lys Glu

35 40 45

Met Ala Lys Thr His His Gln Lys Val Glu Lys Lys Lys Lys Glu Lys

50 55 60

Thr Val Glu Lys Lys Gly Lys Thr Lys Lys Lys Glu Glu Lys Pro Asn

65 70 75 80

Gly Lys Ile Pro Asp His Asp Pro Ala Pro Asn Val Thr Val Leu Leu

85 90 95

Arg Glu Pro Val Arg Ala Pro Ala Val Ala Val Ala Pro Thr Pro Val

100 105 110

Gln Pro Pro Ile Ile Val Ala Pro Val Ala Thr Val Pro Ala Met Pro

115 120 125

Gln Glu Lys Leu Ala Ser Ser Pro Lys Asp Lys Lys Lys Lys Glu Lys

130 135 140

Lys Val Ala Lys Val Glu Pro Ala Val Ser Ser Val Val Asn Ser Ile

145 150 155 160

Gln Val Leu Thr Ser Lys Ala Ala Ile Leu Glu Thr Ala Pro Lys Glu

165 170 175

Val Pro Met Val Val Val Pro Pro Val Gly Ala Lys Gly Asn Thr Pro

180 185 190

Ala Thr Gly Thr Thr Gln Gly Lys Lys Ala Glu Gly Thr Gln Asn Gln

195 200 205

Ser Lys Lys Ala Glu Gly Ala Pro Asn Gln Gly Arg Lys Ala Glu Gly

210 215 220

Thr Pro Asn Gln Gly Lys Lys Thr Glu Gly Thr Pro Asn Gln Gly Lys

225 230 235 240

Lys Ala Glu Gly Thr Pro Asn Gln Gly Lys Lys Ala Glu Gly Thr Pro

245 250 255

Asn Gln Gly Lys Lys Ala Glu Gly Ala Gln Asn Gln Gly Lys Lys Val

260 265 270

Asp Thr Thr Pro Asn Gln Gly Lys Lys Val Glu Gly Ala Pro Thr Gln

275 280 285

Gly Arg Lys Ala Glu Gly Ala Gln Asn Gln Ala Lys Lys Val Glu Gly

290 295 300

Ala Gln Asn Gln Gly Lys Lys Ala Glu Gly Ala Gln Asn Gln Gly Lys

305 310 315 320

Lys Gly Glu Gly Ala Gln Asn Gln Gly Lys Lys Ala Glu Gly Ala Gln

325 330 335

Asn Gln Gly Lys Lys Ala Glu Gly Ala Gln Asn Gln Gly Lys Lys Ala

340 345 350

Glu Gly Ala Gln Asn Gln Gly Lys Lys Ala Glu Gly Ala Gln Asn Gln

355 360 365

Gly Lys Lys Ala Glu Gly Ala Gln Asn Gln Gly Lys Lys Ala Glu Gly

370 375 380

Ala Gln Asn Gln Gly Lys Lys Val Glu Gly Ala Gln Asn Gln Gly Lys

385 390 395 400

Lys Ala Glu Gly Ala Gln Asn Gln Gly Lys Lys Ala Glu Gly Ala Gln

405 410 415

Asn Gln Gly Lys Lys Ala Glu Gly Ala Gln Asn Gln Gly Lys Lys Ala

420 425 430

Glu Gly Ala Gln Asn Gln Gly Lys Lys Ala Glu Gly Ala Gln Asn Gln

435 440 445

Asp Lys Lys Ala Glu Gly Ala Gln Asn Gln Gly Arg Lys Ala Glu Gly

450 455 460

Ala Gln Asn Gln Gly Arg Lys Ala Glu Gly Ala Gln Asn Gln Gly Lys

465 470 475 480

Lys Ala Glu Gly Ala Pro Asn Gln Gly Lys Lys Ala Glu Gly Ala Pro

485 490 495

Asn Gln Gly Lys Lys Ala Glu Gly Thr Pro Asn Gln Gly Lys Lys Ala

500 505 510

Glu Gly Thr Pro Asn Gln Gly Lys Lys Ala Glu Gly Thr Pro Asn Gln

515 520 525

Gly Lys Lys Ala Glu Gly Ala Gln Asn Gln Gly Lys Lys Ala Glu Gly

530 535 540

Ala Gln Asn Gln Gly Lys Lys Ala Glu Gly Thr Pro Asn Gln Gly Lys

545 550 555 560

Lys Ala Glu Gly Ala Gln Asn Gln Gly Lys Lys Ala Glu Gly Ala Gln

565 570 575

Asn Gln Gly Lys Lys Ala Glu Gly Ala Gln Asn Gln Gly Lys Lys Ala

580 585 590

Glu Gly Ala Gln Asn Gln Gly Lys Lys Ala Glu Gly Ala Gln Asn Gln

595 600 605

Gly Lys Lys Ala Glu Gly Ala Gln Asn Gln Gly Lys Lys Val Glu Gly

610 615 620

Ala Gln Asn Gln Gly Lys Lys Ala Glu Gly Ala Gln Asn Gln Gly Lys

625 630 635 640

Lys Ala Glu Gly Ala Gln Asn Gln Gly Lys Lys Ala Glu Gly Ala Gln

645 650 655

Asn Gln Gly Gln Lys Gly Glu Gly Ala Gln Asn Gln Gly Lys Lys Thr

660 665 670

Glu Gly Ala Gln Gly Lys Lys Ala Glu Arg Ser Pro Asn Gln Gly Lys

675 680 685

Lys Gly Glu Gly Ala Pro Ile Gln Gly Lys Lys Ala Asp Ser Val Ala

690 695 700

Asn Gln Gly Thr Lys Val Glu Gly Ile Thr Asn Gln Gly Lys Lys Ala

705 710 715 720

Glu Gly Ser Pro Ser Glu Gly Lys Lys Ala Glu Gly Ser Pro Asn Gln

725 730 735

Gly Lys Lys Ala Asp Ala Ala Ala Asn Gln Gly Lys Lys Thr Glu Ser

740 745 750

Ala Ser Val Gln Gly Arg Asn Thr Asp Val Ala Gln Ser Pro Glu Ala

755 760 765

Pro Lys Gln Glu Ala Pro Ala Lys Lys Lys Ser Gly Ser Lys Lys Lys

770 775 780

Gly Glu Pro Gly Pro Pro Asp Ala Asp Gly Pro Leu Tyr Leu Pro Tyr

785 790 795 800

Lys Thr Leu Val Ser Thr Val Gly Ser Met Val Phe Asn Glu Gly Glu

805 810 815

Ala Gln Arg Leu Ile Glu Ile Leu Ser Glu Lys Ala Gly Ile Ile Gln

820 825 830

Asp Thr Trp His Lys Ala Thr Gln Lys Gly Asp Pro Val Ala Ile Leu

835 840 845

Lys Arg Gln Leu Glu Glu Lys Glu Lys Leu Leu Ala Thr Glu Gln Glu

850 855 860

Asp Ala Ala Val Ala Lys Ser Lys Leu Arg Glu Leu Asn Lys Glu Met

865 870 875 880

Ala Ala Glu Lys Ala Lys Ala Ala Ala Gly Glu Ala Lys Val Lys Lys

885 890 895

Gln Leu Val Ala Arg Glu Gln Glu Ile Thr Ala Val Gln Ala Arg Met

900 905 910

Gln Ala Ser Tyr Arg Glu His Val Lys Glu Val Gln Gln Leu Gln Gly

915 920 925

Lys Ile Arg Thr Leu Gln Glu Gln Leu Glu Asn Gly Pro Asn Thr Gln

930 935 940

Leu Ala Arg Leu Gln Gln Glu Asn Ser Ile Leu Arg Asp Ala Leu Asn

945 950 955 960

Gln Ala Thr Ser Gln Val Glu Ser Lys Gln Asn Ala Glu Leu Ala Lys

965 970 975

Leu Arg Gln Glu Leu Ser Lys Val Ser Lys Glu Leu Val Glu Lys Ser

980 985 990

Glu Ala Val Arg Gln Asp Glu Gln Gln Arg Lys Ala Leu Glu Ala Lys

995 1000 1005

Ala Ala Ala Phe Glu Lys Gln Val Leu Gln Leu Gln Ala Ser His Arg

1010 1015 1020

Glu Ser Glu Glu Ala Leu Gln Lys Arg Leu Asp Glu Val Ser Arg Glu

1025 1030 1035 1040

Leu Cys His Thr Gln Ser Ser His Ala Ser Leu Arg Ala Asp Ala Glu

1045 1050 1055

Lys Ala Gln Glu Gln Gln Gln Gln Met Ala Glu Leu His Ser Lys Leu

1060 1065 1070

Gln Ser Ser Glu Ala Glu Val Arg Ser Lys Cys Glu Glu Leu Ser Gly

1075 1080 1085

Leu His Gly Gln Leu Gln Glu Ala Arg Ala Glu Asn Ser Gln Leu Thr

1090 1095 1100

Glu Arg Ile Arg Ser Ile Glu Ala Leu Leu Glu Ala Gly Gln Ala Arg

1105 1110 1115 1120

Asp Ala Gln Asp Val Gln Ala Ser Gln Ala Glu Ala Asp Gln Gln Gln

1125 1130 1135

Thr Arg Leu Lys Glu Leu Glu Ser Gln Val Ser Gly Leu Glu Lys Glu

1140 1145 1150

Ala Ile Glu Leu Arg Glu Ala Val Glu Gln Gln Lys Val Lys Asn Asn

1155 1160 1165

Asp Leu Arg Glu Lys Asn Trp Lys Ala Met Glu Ala Leu Ala Thr Ala

1170 1175 1180

Glu Gln Ala Cys Lys Glu Lys Leu His Ser Leu Thr Gln Ala Lys Glu

1185 1190 1195 1200

Glu Ser Glu Lys Gln Leu Cys Leu Ile Glu Ala Gln Thr Met Glu Ala

1205 1210 1215

Leu Leu Ala Leu Leu Pro Glu Leu Ser Val Leu Ala Gln Gln Asn Tyr

1220 1225 1230

Thr Glu Trp Leu Gln Asp Leu Lys Glu Lys Gly Pro Thr Leu Leu Lys

1235 1240 1245

His Pro Pro Ala Pro Ala Glu Pro Ser Ser Asp Leu Ala Ser Lys Leu

1250 1255 1260

Arg Glu Ala Glu Glu Thr Gln Ser Thr Leu Gln Ala Glu Cys Asp Gln

1265 1270 1275 1280

Tyr Arg Ser Ile Leu Ala Glu Thr Glu Gly Met Leu Arg Asp Leu Gln

1285 1290 1295

Lys Ser Val Glu Glu Glu Glu Gln Val Trp Arg Ala Lys Val Gly Ala

1300 1305 1310

Ala Glu Glu Glu Leu Gln Lys Ser Arg Val Thr Val Lys His Leu Glu

1315 1320 1325

Glu Ile Val Glu Lys Leu Lys Gly Glu Leu Glu Ser Ser Asp Gln Val

1330 1335 1340

Arg Glu His Thr Leu His Leu Glu Ala Glu Leu Glu Lys His Met Ala

1345 1350 1355 1360

Ala Ala Ser Ala Glu Cys Gln Asn Tyr Ala Lys Glu Val Ala Gly Leu

1365 1370 1375

Arg Gln Leu Leu Leu Glu Ser Gln Ser Gln Leu Asp Ala Ala Lys Ser

1380 1385 1390

Glu Ala Gln Lys Gln Ser Asp Glu Leu Ala Leu Val Arg Gln Gln Leu

1395 1400 1405

Ser Glu Met Lys Ser His Val Glu Asp Gly Asp Ile Ala Gly Ala Pro

1410 1415 1420

Ala Ser Ser Pro Glu Ala Pro Pro Ala Glu Gln Asp Pro Val Gln Leu

1425 1430 1435 1440

Lys Thr Gln Leu Glu Trp Thr Glu Ala Ile Leu Glu Asp Glu Gln Thr

1445 1450 1455

Gln Arg Gln Lys Leu Thr Ala Glu Phe Glu Glu Ala Gln Thr Ser Ala

1460 1465 1470

Cys Arg Leu Gln Glu Glu Leu Glu Lys Leu Arg Thr Ala Gly Pro Leu

1475 1480 1485

Glu Ser Ser Glu Thr Glu Glu Ala Ser Gln Leu Lys Glu Arg Leu Glu

1490 1495 1500

Lys Glu Lys Lys Leu Thr Ser Asp Leu Gly Arg Ala Ala Thr Arg Leu

1505 1510 1515 1520

Gln Glu Leu Leu Lys Thr Thr Gln Glu Gln Leu Ala Arg Glu Lys Asp

1525 1530 1535

Thr Val Lys Lys Leu Gln Glu Gln Leu Glu Lys Ala Glu Asp Gly Ser

1540 1545 1550

Ser Ser Lys Glu Gly Thr Ser Val

1555 1560

<210>47

<211>5425

<212>DNA

<213>家犬

<220>

<221>CDS

<222>(244)..(4848)

<400>47

gaggcagaaa gtgccacgac tccacacgcg cgcacgcagc cagcgagcgg ccggagcgga 60

cggcggacgg ggcggacggc ggtggggtcg cggcgcctgc agctgctcgg ggcggcttct 120

cggcggaggc tcggccggct cctctctccc ggctccgcgg cggcggcggc ggcggcggcg 180

gctcctgccc tttcgctctc cctcccgcgt ctccggctgc aggtaaaggg aaagcaagcc 240

agg atg gat att tac gac act cag acc ttg ggg gtt atg gta ttc ggt 288

Met Asp Ile Tyr Asp Thr Gln Thr Leu Gly Val Met Val Phe Gly

1 5 10 15

gga ttc atg gtc gtt tct gcc atc ggc atc ttc ctg gtg tca acc ttt 336

Gly Phe Met Val Val Ser Ala Ile Gly Ile Phe Leu Val Ser Thr Phe

20 25 30

tcc atg aag gag acg tca tat gaa gaa gcc cta gcc aac cag cgc aag 384

Ser Met Lys Glu Thr Ser Tyr Glu Glu Ala Leu Ala Asn Gln Arg Lys

35 40 45

gag atg gca aaa act cac cac cag aaa gta gag aag aaa aag aag gag 432

Glu Met Ala Lys Thr His His Gln Lys Val Glu Lys Lys Lys Lys Glu

50 55 60

aaa aca gtg gag aag aaa gga aaa acc aag aaa aag gaa gag aaa cct 480

Lys Thr Val Glu Lys Lys Gly Lys Thr Lys Lys Lys Glu Glu Lys Pro

65 70 75

aac ggg aag ata cct gac cat gag cca gcc ccc aat gtg acc atc ctt 528

Asn Gly Lys Ile Pro Asp His Glu Pro Ala Pro Asn Val Thr Ile Leu

80 85 90 95

ctc aaa gac cca gtg agg gca ccc gca gtg ccc gtg gct cca act ccg 576

Leu Lys Asp Pro Val Arg Ala Pro Ala Val Pro Val Ala Pro Thr Pro

100 105 110

gtc cag cct cct gtg gtc att gcc cct gta gcc aca gta cca gcc atg 624

Val Gln Pro Pro Val Val Ile Ala Pro Val Ala Thr Val Pro Ala Met

115 120 125

ccc caa gag aag ttg gcc cct tct cct aag gac aaa aag aaa aag gag 672

Pro Gln Glu Lys Leu Ala Pro Ser Pro Lys Asp Lys Lys Lys Lys Glu

130 135 140

aaa aaa gtg gca aag gtg gaa cca gca gtc agt tct gta gtg aat tcc 720

Lys Lys Val Ala Lys Val Glu Pro Ala Val Ser Ser Val Val Asn Ser

145 150 155

gtc caa gtt ctt gcc tcc aag gct gcc atc tta gaa act gct ccc aag 768

Val Gln Val Leu Ala Ser Lys Ala Ala Ile Leu Glu Thr Ala Pro Lys

160 165 170 175

gag gtg cct atg gtg gtt gtg ccc cca gtg ggt gcc aag gcc ggt acc 816

Glu Val Pro Met Val Val Val Pro Pro Val Gly Ala Lys Ala Gly Thr

180 185 190

cca gcc acc agc act gca cag ggc aaa aag gca gag gga gcc cag aac 864

Pro Ala Thr Ser Thr Ala Gln Gly Lys Lys Ala Glu Gly Ala Gln Asn

195 200 205

cag agc aga aag gca gag gga gcc ccc aac cag ggc aaa aag gca gag 912

Gln Ser Arg Lys Ala Glu Gly Ala Pro Asn Gln Gly Lys Lys Ala Glu

210 215 220

ggg gcc ctc aac caa ggc aaa aag gca gag ggg gcc cag aat cag ggc 960

Gly Ala Leu Asn Gln Gly Lys Lys Ala Glu Gly Ala Gln Asn Gln Gly

225 230 235

aaa aag gta gaa gtg gcc cca aac caa ggc aaa aag gca gag ggg ggc 1008

Lys Lys Val Glu Val Ala Pro Asn Gln Gly Lys Lys Ala Glu Gly Gly

240 245 250 255

cag aat cag ggc aaa aag gta gaa ggg gcc cag aat cag ggc aaa aag 1056

Gln Asn Gln Gly Lys Lys Val Glu Gly Ala Gln Asn Gln Gly Lys Lys

260 265 270

gca gaa gga acc cca aac cag ggc aaa aag gca gaa ggg gcc ccc aac 1104

Ala Glu Gly Thr Pro Asn Gln Gly Lys Lys Ala Glu Gly Ala Pro Asn

275 280 285

caa ggc aaa aag aca gat ggg gct ccc aac cag ggc aaa aag tca gaa 1152

Gln Gly Lys Lys Thr Asp Gly Ala Pro Asn Gln Gly Lys Lys Ser Glu

290 295 300

gga gct cca aac cag ggc aaa aag gca gag ggg gcc cag aat cag ggc 1200

Gly Ala Pro Asn Gln Gly Lys Lys Ala Glu Gly Ala Gln Asn Gln Gly

305 310 315

aaa aag gta gaa gtg gcc cca aac caa ggc aaa aag gca gag ggg ggc 1248

Lys Lys Val Glu Val Ala Pro Asn Gln Gly Lys Lys Ala Glu Gly Gly

320 325 330 335

cag aat cag ggc aaa aag gta gaa ggg gcc cag aat cag ggc aaa aag 1296

Gln Asn Gln Gly Lys Lys Val Glu Gly Ala Gln Asn Gln Gly Lys Lys

340 345 350

gca gaa gga acc cca aac cag ggc aaa aag gca gaa ggg gcc ccc aac 1344

Ala Glu Gly Thr Pro Asn Gln Gly Lys Lys Ala Glu Gly Ala Pro Asn

355 360 365

caa ggc aaa aag aca gat ggg gct ccc aac cag ggc aaa aag tca gaa 1392

Gln Gly Lys Lys Thr Asp Gly Ala Pro Asn Gln Gly Lys Lys Ser Glu

370 375 380

gga gct cca aac cag ggc aaa aaa gta gag ggg gcc cag aat caa ggc 1440

Gly Ala Pro Asn Gln Gly Lys Lys Val Glu Gly Ala Gln Asn Gln Gly

385 390 395

aaa aag gta gag ggg gtg cag aat cag ggc aaa aaa gcc gaa gga gca 1488

Lys Lys Val Glu Gly Val Gln Asn Gln Gly Lys Lys Ala Glu Gly Ala

400 405 410 415

cag aat cag ggc aaa aag gca gaa ggg acc tcc agc cag ggt aga aaa 1536

Gln Asn Gln Gly Lys Lys Ala Glu Gly Thr Ser Ser Gln Gly Arg Lys

420 425 430

gag gag ggg acc cca aac ctg ggc aaa aag gca gag ggg agc ccc aat 1584

Glu Glu Gly Thr Pro Asn Leu Gly Lys Lys Ala Glu Gly Ser Pro Asn

435 440 445

cag ggc aaa aag gtg gaa gtg gtt cag aac cag agc aaa aag gta gag 1632

Gln Gly Lys Lys Val Glu Val Val Gln Asn Gln Ser Lys Lys Val Glu

450 455 460

gga gcc ccc aac cag ggc aaa aaa gca gag ggg tct cag aac cag ggc 1680

Gly Ala Pro Asn Gln Gly Lys Lys Ala Glu Gly Ser Gln Asn Gln Gly

465 470 475

aaa aag aca gaa ggg gcc tcc aac caa ggc aaa aag gtg gat ggg gct 1728

Lys Lys Thr Glu Gly Ala Ser Asn Gln Gly Lys Lys Val Asp Gly Ala

480 485 490 495

cag aac cag ggc aaa aag gca gag gga gcc ccc aac cag ggt aaa aag 1776

Gln Asn Gln Gly Lys Lys Ala Glu Gly Ala Pro Asn Gln Gly Lys Lys

500 505 510

gta gag ggg gct cag aac cag ggc aaa aag gca gag ggg acc ccc aac 1824

Val Glu Gly Ala Gln Asn Gln Gly Lys Lys Ala Glu Gly Thr Pro Asn

515 520 525

cag ggt aaa aag gca gag ggg gct cag aac cag ggc aaa aag gca gag 1872

Gln Gly Lys Lys Ala Glu Gly Ala Gln Asn Gln Gly Lys Lys Ala Glu

530 535 540

ggg gct ccc aac cag ggc aaa aag gca gag ggg gct ccc aac cag ggc 1920

Gly Ala Pro Asn Gln Gly Lys Lys Ala Glu Gly Ala Pro Asn Gln Gly

545 550 555

aaa aag gca gag ggg gct ccc aac cag ggc aaa aag gca gag ggg gct 1968

Lys Lys Ala Glu Gly Ala Pro Asn Gln Gly Lys Lys Ala Glu Gly Ala

560 565 570 575

ccc aac cag ggc aaa aag gca gag gcg gct ccc aac cag ggc aaa aag 2016

Pro Asn Gln Gly Lys Lys Ala Glu Ala Ala Pro Asn Gln Gly Lys Lys

580 585 590

gca gag ggg gct ccc aac cag ggc aaa aag gca gag ggg gct ccc aac 2064

Ala Glu Gly Ala Pro Asn Gln Gly Lys Lys Ala Glu Gly Ala Pro Asn

595 600 605

cag ggc aaa aag gca gag gcg gct ccc aac cag ggc aaa aag gca gag 2112

Gln Gly Lys Lys Ala Glu Ala Ala Pro Asn Gln Gly Lys Lys Ala Glu

610 615 620

ggg gct ccc aac cag ggc aaa aag gca gag ggg gct ccc aac cag ggc 2160

Gly Ala Pro Asn Gln Gly Lys Lys Ala Glu Gly Ala Pro Asn Gln Gly

625 630 635

aaa aag gca gag ggg gct ccc aac cag ggc aaa aag gca gag ggg gcc 2208

Lys Lys Ala Glu Gly Ala Pro Asn Gln Gly Lys Lys Ala Glu Gly Ala

640 645 650 655

cag aat cag ggc aaa aag gca gag ggg gct ccc aac cag ggt aaa aag 2256

Gln Asn Gln Gly Lys Lys Ala Glu Gly Ala Pro Asn Gln Gly Lys Lys

660 665 670

gca gat ttg gtt gct aat caa ggc aca aag gca gag ggt gtt gca ggc 2304

Ala Asp Leu Val Ala Asn Gln Gly Thr Lys Ala Glu Gly Val Ala Gly

675 680 685

cag ggg aaa aaa gca gag ggg gcc ccc aat caa ggc aaa aag gga gaa 2352

Gln Gly Lys Lys Ala Glu Gly Ala Pro Asn Gln Gly Lys Lys Gly Glu

690 695 700

gga acc cca aac cag ggc aaa aag tca gaa gga tct ccc aac cag ggc 2400

Gly Thr Pro Asn Gln Gly Lys Lys Ser Glu Gly Ser Pro Asn Gln Gly

705 710 715

aaa aag gtg gat gcg tct gcc aat cag agt aaa agg gca gag tca gct 2448

Lys Lys Val Asp Ala Ser Ala Asn Gln Ser Lys Arg Ala Glu Ser Ala

720 725 730 735

cct atc caa ggc aaa aat gca gat atg gtc cag agc caa gag gca cca 2496

Pro Ile Gln Gly Lys Asn Ala Asp Met Val Gln Ser Gln Glu Ala Pro

740 745 750

aag caa gag gct cct gca aag aag aaa tct ggt tca aag aag aaa ggt 2544

Lys Gln Glu Ala Pro Ala Lys Lys Lys Ser Gly Ser Lys Lys Lys Gly

755 760 765

gag cct ggg cct cca gac tct gac agc cct ctc tac ctc ccc tac aag 2592

Glu Pro Gly Pro Pro Asp Ser Asp Ser Pro Leu Tyr Leu Pro Tyr Lys

770 775 780

acg ctg gtc tcc aca gtt gga agc atg gta ttc aac gag ggt gag gcc 2640

Thr Leu Val Ser Thr Val Gly Ser Met Val Phe Asn Glu Gly Glu Ala

785 790 795

cag cgg ctc att gag atc ctg tcc gag aag gct ggt gtc att caa gac 2688

Gln Arg Leu Ile Glu Ile Leu Ser Glu Lys Ala Gly Val Ile Gln Asp

800 805 810 815

acc tgg cat aag gct act cag aag ggt gac ccc gtg gcg att ctg aag 2736

Thr Trp His Lys Ala Thr Gln Lys Gly Asp Pro Val Ala Ile Leu Lys

820 825 830

cgc cag cta gaa gag aag gag aag ctg ctg gcc aca gag cag gag gac 2784

Arg Gln Leu Glu Glu Lys Glu Lys Leu Leu Ala Thr Glu Gln Glu Asp

835 840 845

gcg gct gtt gcg aag agc aaa ctg agg gag gtg aat aag gag ctg gca 2832

Ala Ala Val Ala Lys Ser Lys Leu Arg Glu Val Asn Lys Glu Leu Ala

850 855 860

gca gaa aag gct aag gca gca gcg ggg gag gcc aag gtg aag aag cag 2880

Ala Glu Lys Ala Lys Ala Ala Ala Gly Glu Ala Lys Val Lys Lys Gln

865 870 875

ctg gtg gcc cgg gag cag gag atc aca gcc gtg cag gcg cgc atc gaa 2928

Leu Val Ala Arg Glu Gln Glu Ile Thr Ala Val Gln Ala Arg Ile Glu

880 885 890 895

gcc agc tac cgg gag cat gtg aag gag gtg cag cag ctg cag ggc aag 2976

Ala Ser Tyr Arg Glu His Val Lys Glu Val Gln Gln Leu Gln Gly Lys

900 905 910

atc cgg acc ctt cag gag cag ttg gag aac ggc ccc aac aca cag ctg 3024

Ile Arg Thr Leu Gln Glu Gln Leu Glu Asn Gly Pro Asn Thr Gln Leu

915 920 925

gcc cgt ctg cag cag gaa aat tcc atc ctg agg gat gcc ttg aac cag 3072

Ala Arg Leu Gln Gln Glu Asn Ser Ile Leu Arg Asp Ala Leu Asn Gln

930 935 940

gcc acg agc cag gtg gag agc aag cag aac acc gag ctg gcc aag ctc 3120

Ala Thr Ser Gln Val Glu Ser Lys Gln Asn Thr Glu Leu Ala Lys Leu

945 950 955

cgg cag gag ctc agc aag gtc agc aag gag ctg gtg gag aaa tca gag 3168

Arg Gln Glu Leu Ser Lys Val Ser Lys Glu Leu Val Glu Lys Ser Glu

960 965 970 975

gct gcg cgg cag gag gaa cag cag cga aag gcc ctg gag acc aaa aca 3216

Ala Ala Arg Gln Glu Glu Gln Gln Arg Lys Ala Leu Glu Thr Lys Thr

980 985 990

gcc gcc ttg gag aag cag gtc cta cag ctg caa gca tct cac aag gag 3264

Ala Ala Leu Glu Lys Gln Val Leu Gln Leu Gln Ala Ser His Lys Glu

995 1000 1005

agt gag gag gcc ctg cag aag cgc ctg gac gag gtc agc cgg gag cta 3312

Ser Glu Glu Ala Leu Gln Lys Arg Leu Asp Glu Val Ser Arg Glu Leu

1010 1015 1020

tgc cgc tcc cag acc agc cat gcc agc ctg cgg gcg gat gcc gag aag 3360

Cys Arg Ser Gln Thr Ser His Ala Ser Leu Arg Ala Asp Ala Glu Lys

1025 1030 1035

gcc cag gag cag cag cag cag atg gct gag ctg cac agc aaa ctt cag 3408

Ala Gln Glu Gln Gln Gln Gln Met Ala Glu Leu His Ser Lys Leu Gln

1040 1045 1050 1055

tcc tcc gag gcg gag gtg aaa agc aag tct gag gag ctg agt ggt ctc 3456

Ser Ser Glu Ala Glu Val Lys Ser Lys Ser Glu Glu Leu Ser Gly Leu

1060 1065 1070

cat ggg cag ctc aag gag gcc agg gcc gag aac tca cag ctc atg gag 3504

His Gly Gln Leu Lys Glu Ala Arg Ala Glu Asn Ser Gln Leu Met Glu

1075 1080 1085

aga atc cgg tcc atc gag gcc ctg ctg gag gcg ggc cag gcc cgg gac 3552

Arg Ile Arg Ser Ile Glu Ala Leu Leu Glu Ala Gly Gln Ala Arg Asp

1090 1095 1100

acc cag gat gcc cag gcc agc cga gcg gag cat cag gcc cgc ctc aag 3600

Thr Gln Asp Ala Gln Ala Ser Arg Ala Glu His Gln Ala Arg Leu Lys

1105 1110 1115

gag cta gag tcc cag gtg tgg tgc ctg gag aag gag gcc acc gag ctc 3648

Glu Leu Glu Ser Gln Val Trp Cys Leu Glu Lys Glu Ala Thr Glu Leu

1120 1125 1130 1135

aag gag gct gtt gag cag cag aaa gtg aag aac aac gac ctc cga gag 3696

Lys Glu Ala Val Glu Gln Gln Lys Val Lys Asn Asn Asp Leu Arg Glu

1140 1145 1150

aag aac tgg aag gcc atg gag gct ctg gcc tcg gcc gag aga gcc tgc 3744

Lys Asn Trp Lys Ala Met Glu Ala Leu Ala Ser Ala Glu Arg Ala Cys

1155 1160 1165

gag gag aag ctc cgc tcc tta acc cag gcc aag gag gaa tcc gag aag 3792

Glu Glu Lys Leu Arg Ser Leu Thr Gln Ala Lys Glu Glu Ser Glu Lys

1170 1175 1180

cag ctc agc ctg acg gag gcc cag acc aag gag gcc ctg ctg gcc ctg 3840

Gln Leu Ser Leu Thr Glu Ala Gln Thr Lys Glu Ala Leu Leu Ala Leu

1185 1190 1195

ttg ccg gct ctc tcc agc tca gcc ccc cag agt tac acc gag tgg ctg 3888

Leu Pro Ala Leu Ser Ser Ser Ala Pro Gln Ser Tyr Thr Glu Trp Leu

1200 1205 1210 1215

cag gaa ctc cga gag aag ggc ccg gag ctg ctg aag cag cgg ccg gct 3936

Gln Glu Leu Arg Glu Lys Gly Pro Glu Leu Leu Lys Gln Arg Pro Ala

1220 1225 1230

gac aca gat ccg tcc tcg gac ctg gct tcc aag ctg agg gag gct gag 3984

Asp Thr Asp Pro Ser Ser Asp Leu Ala Ser Lys Leu Arg Glu Ala Glu

1235 1240 1245

gag acc cag aac aat ctg cag gcc gag tgt gac cag tac cgc acc atc 4032

Glu Thr Gln Asn Asn Leu Gln Ala Glu Cys Asp Gln Tyr Arg Thr Ile

1250 1255 1260

ctg gca gag acg gag ggc atg ctc aaa gac ctg cag aag agt gtg gag 4080

Leu Ala Glu Thr Glu Gly Met Leu Lys Asp Leu Gln Lys Ser Val Glu

1265 1270 1275

gag gag gag cag gtg tgg aag gcc aaa gtg agc gcc acg gag gag gag 4128

Glu Glu Glu Gln Val Trp Lys Ala Lys Val Ser Ala Thr Glu Glu Glu

1280 1285 1290 1295

ctt cag aag tca cgg gtc aca gtg aaa cat ctc gaa gac att gta gag 4176

Leu Gln Lys Ser Arg Val Thr Val Lys His Leu Glu Asp Ile Val Glu

1300 1305 1310

aag cta aaa gga gaa ctt gaa agt tca gag cag gtg agg gag cac acc 4224

Lys Leu Lys Gly Glu Leu Glu Ser Ser Glu Gln Val Arg Glu His Thr

1315 1320 1325

tca cat ctg gaa gca gag ctg gag aag cac atg gca gct gcc agc gct 4272

Ser His Leu Glu Ala Glu Leu Glu Lys His Met Ala Ala Ala Ser Ala

1330 1335 1340

gag tgc cag agc tac gcc aag gag gtg gcg ggg ttg agg caa ctt tta 4320

Glu Cys Gln Ser Tyr Ala Lys Glu Val Ala Gly Leu Arg Gln Leu Leu

1345 1350 1355

tta gag tct cag tct cag ctg gat gca gcc aag agt gaa gcc cag aaa 4368

Leu Glu Ser Gln Ser Gln Leu Asp Ala Ala Lys Ser Glu Ala Gln Lys

1360 1365 1370 1375

caa agc aat gag ctc gcc ctg gtc agg cag cag ttg agt gag atg aag 4416

Gln Ser Asn Glu Leu Ala Leu Val Arg Gln Gln Leu Ser Glu Met Lys

1380 1385 1390

agc cac gta gag gat ggt gac gta gct ggg tcc cca gct gcc ccc cca 4464

Ser His Val Glu Asp Gly Asp Val Ala Gly Ser Pro Ala Ala Pro Pro

1395 1400 1405

gca gag cag gac cct gtc gag ctg aag gcg cag ctg gag cgg aca gag 4512

Ala Glu Gln Asp Pro Val Glu Leu Lys Ala Gln Leu Glu Arg Thr Glu

1410 1415 1420

gcc acc ctg gag gac gag cag gcg ctg cgg agg aag ctc acg gcc gag 4560

Ala Thr Leu Glu Asp Glu Gln Ala Leu Arg Arg Lys Leu Thr Ala Glu

1425 1430 1435

ttc cag gag gct cag agc tct gcg tgc cgg ctc cag gcc gag ctg gag 4608

Phe Gln Glu Ala Gln Ser Ser Ala Cys Arg Leu Gln Ala Glu Leu Glu

1440 1445 1450 1455

aag ctc cgc agc aca ggg ccc ctg gag tct tca gca gca gag gag gcc 4656

Lys Leu Arg Ser Thr Gly Pro Leu Glu Ser Ser Ala Ala Glu Glu Ala

1460 1465 1470

aca cag ctg aag gag aga cta gaa aaa gag aag aaa cta acc agt gac 4704

Thr Gln Leu Lys Glu Arg Leu Glu Lys Glu Lys Lys Leu Thr Ser Asp

1475 1480 1485

ctg gga cat gct gcc acc aaa ttg cag gag ctt ttg aag acc acc cag 4752

Leu Gly His Ala Ala Thr Lys Leu Gln Glu Leu Leu Lys Thr Thr Gln

1490 1495 1500

gag cag ctg gca aag gag aga gac aca gtg aag aag ttg cag gag cag 4800

Glu Gln Leu Ala Lys Glu Arg Asp Thr Val Lys Lys Leu Gln Glu Gln

1505 1510 1515

ttg gac aaa aca gac gac agc agc tca aag gag ggc act tct gtc tga 4848

Leu Asp Lys Thr Asp Asp Ser Ser Ser Lys Glu Gly Thr Ser Val

1520 1525 1530 1535

gtctgctctt cgggaaaaga agttcccatt caacttacca aaatgcctta cacattcctt 4908

acaaataaat aaaccaacca acacaccgtt atccaggccc aacctccagt agctctgaga 4968

gaagccatga gagactctta gaatcacaga aatagacctt ccagacccct tgtttgtaaa 5028

agaacctttg tcacatttga taaacactat tccccaggac cagccctgga ccaccaccga 5088

gcagacgcca aagcccttac cagctctgtg acagacccca gggtatgtgc tggggaggcc 5148

gggacgctgg gtatctgtat gtcaatcagt gcaattgttt tcttcccctg ggttgggggt 5208

caggaggcga gcggcctggt ggtgagtctc cagggctgtg gagcagactg gaggggccca 5268

gccagccggg gaggcagcag cctctcaccc ccgggggaag ttgccagcaa gaactgatgt 5328

gtgacttcct ggatgttaat gccattaaaa ccaacattgt tgcccggcaa aaaaaaaaaa 5388

aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaa 5425

<210>48

<211>1534

<212>PRT

<213>家犬

<400>48

Met Asp Ile Tyr Asp Thr Gln Thr Leu Gly Val Met Val Phe Gly Gly

1 5 10 15

Phe Met Val Val Ser Ala Ile Gly Ile Phe Leu Val Ser Thr Phe Ser

20 25 30

Met Lys Glu Thr Ser Tyr Glu Glu Ala Leu Ala Asn Gln Arg Lys Glu

35 40 45

Met Ala Lys Thr His His Gln Lys Val Glu Lys Lys Lys Lys Glu Lys

50 55 60

Thr Val Glu Lys Lys Gly Lys Thr Lys Lys Lys Glu Glu Lys Pro Asn

65 70 75 80

Gly Lys Ile Pro Asp His Glu Pro Ala Pro Asn Val Thr Ile Leu Leu

85 90 95

Lys Asp Pro Val Arg Ala Pro Ala Val Pro Val Ala Pro Thr Pro Val

100 105 110

Gln Pro Pro Val Val Ile Ala Pro Val Ala Thr Val Pro Ala Met Pro

115 120 125

Gln Glu Lys Leu Ala Pro Ser Pro Lys Asp Lys Lys Lys Lys Glu Lys

130 135 140

Lys Val Ala Lys Val Glu Pro Ala Val Ser Ser Val Val Asn Ser Val

145 150 155 160

Gln Val Leu Ala Ser Lys Ala Ala Ile Leu Glu Thr Ala Pro Lys Glu

165 170 175

Val Pro Met Val Val Val Pro Pro Val Gly Ala Lys Ala Gly Thr Pro

180 185 190

Ala Thr Ser Thr Ala Gln Gly Lys Lys Ala Glu Gly Ala Gln Asn Gln

195 200 205

Ser Arg Lys Ala Glu Gly Ala Pro Asn Gln Gly Lys Lys Ala Glu Gly

210 215 220

Ala Leu Asn Gln Gly Lys Lys Ala Glu Gly Ala Gln Asn Gln Gly Lys

225 230 235 240

Lys Val Glu Val Ala Pro Asn Gln Gly Lys Lys Ala Glu Gly Gly Gln

245 250 255

Asn Gln Gly Lys Lys Val Glu Gly Ala Gln Asn Gln Gly Lys Lys Ala

260 265 270

Glu Gly Thr Pro Asn Gln Gly Lys Lys Ala Glu Gly Ala Pro Asn Gln

275 280 285

Gly Lys Lys Thr Asp Gly Ala Pro Asn Gln Gly Lys Lys Ser Glu Gly

290 295 300

Ala Pro Asn Gln Gly Lys Lys Ala Glu Gly Ala Gln Asn Gln Gly Lys

305 310 315 320

Lys Val Glu Val Ala Pro Asn Gln Gly Lys Lys Ala Glu Gly Gly Gln

325 330 335

Asn Gln Gly Lys Lys Val Glu Gly Ala Gln Asn Gln Gly Lys Lys Ala

340 345 350

Glu Gly Thr Pro Asn Gln Gly Lys Lys Ala Glu Gly Ala Pro Asn Gln

355 360 365

Gly Lys Lys Thr Asp Gly Ala Pro Asn Gln Gly Lys Lys Ser Glu Gly

370 375 380

Ala Pro Asn Gln Gly Lys Lys Val Glu Gly Ala Gln Asn Gln Gly Lys

385 390 395 400

Lys Val Glu Gly Val Gln Asn Gln Gly Lys Lys Ala Glu Gly Ala Gln

405 410 415

Asn Gln Gly Lys Lys Ala Glu Gly Thr Ser Ser Gln Gly Arg Lys Glu

420 425 430

Glu Gly Thr Pro Asn Leu Gly Lys Lys Ala Glu Gly Ser Pro Asn Gln

435 440 445

Gly Lys Lys Val Glu Val Val Gln Asn Gln Ser Lys Lys Val Glu Gly

450 455 460

Ala Pro Asn Gln Gly Lys Lys Ala Glu Gly Ser Gln Asn Gln Gly Lys

465 470 475 480

Lys Thr Glu Gly Ala Ser Asn Gln Gly Lys Lys Val Asp Gly Ala Gln

485 490 495

Asn Gln Gly Lys Lys Ala Glu Gly Ala Pro Asn Gln Gly Lys Lys Val

500 505 510

Glu Gly Ala Gln Asn Gln Gly Lys Lys Ala Glu Gly Thr Pro Asn Gln

515 520 525

Gly Lys Lys Ala Glu Gly Ala Gln Asn Gln Gly Lys Lys Ala Glu Gly

530 535 540

Ala Pro Asn Gln Gly Lys Lys Ala Glu Gly Ala Pro Asn Gln Gly Lys

545 550 555 560

Lys Ala Glu Gly Ala Pro Asn Gln Gly Lys Lys Ala Glu Gly Ala Pro

565 570 575

Asn Gln Gly Lys Lys Ala Glu Ala Ala Pro Asn Gln Gly Lys Lys Ala

580 585 590

Glu Gly Ala Pro Asn Gln Gly Lys Lys Ala Glu Gly Ala Pro Asn Gln

595 600 605

Gly Lys Lys Ala Glu Ala Ala Pro Asn Gln Gly Lys Lys Ala Glu Gly

610 615 620

Ala Pro Asn Gln Gly Lys Lys Ala Glu Gly Ala Pro Asn Gln Gly Lys

625 630 635 640

Lys Ala Glu Gly Ala Pro Asn Gln Gly Lys Lys Ala Glu Gly Ala Gln

645 650 655

Asn Gln Gly Lys Lys Ala Glu Gly Ala Pro Asn Gln Gly Lys Lys Ala

660 665 670

Asp Leu Val Ala Asn Gln Gly Thr Lys Ala Glu Gly Val Ala Gly Gln

675 680 685

Gly Lys Lys Ala Glu Gly Ala Pro Asn Gln Gly Lys Lys Gly Glu Gly

690 695 700

Thr Pro Asn Gln Gly Lys Lys Ser Glu Gly Ser Pro Asn Gln Gly Lys

705 710 715 720

Lys Val Asp Ala Ser Ala Asn Gln Ser Lys Arg Ala Glu Ser Ala Pro

725 730 735

Ile Gln Gly Lys Asn Ala Asp Met Val Gln Ser Gln Glu Ala Pro Lys

740 745 750

Gln Glu Ala Pro Ala Lys Lys Lys Ser Gly Ser Lys Lys Lys Gly Glu

755 760 765

Pro Gly Pro Pro Asp Ser Asp Ser Pro Leu Tyr Leu Pro Tyr Lys Thr

770 775 780

Leu Val Ser Thr Val Gly Ser Met Val Phe Asn Glu Gly Glu Ala Gln

785 790 795 800

Arg Leu Ile Glu Ile Leu Ser Glu Lys Ala Gly Val Ile Gln Asp Thr

805 810 815

Trp His Lys Ala Thr Gln Lys Gly Asp Pro Val Ala Ile Leu Lys Arg

820 825 830

Gln Leu Glu Glu Lys Glu Lys Leu Leu Ala Thr Glu Gln Glu Asp Ala

835 840 845

Ala Val Ala Lys Ser Lys Leu Arg Glu Val Asn Lys Glu Leu Ala Ala

850 855 860

Glu Lys Ala Lys Ala Ala Ala Gly Glu Ala Lys Val Lys Lys Gln Leu

865 870 875 880

Val Ala Arg Glu Gln Glu Ile Thr Ala Val Gln Ala Arg Ile Glu Ala

885 890 895

Ser Tyr Arg Glu His Val Lys Glu Val Gln Gln Leu Gln Gly Lys Ile

900 905 910

Arg Thr Leu Gln Glu Gln Leu Glu Asn Gly Pro Asn Thr Gln Leu Ala

915 920 925

Arg Leu Gln Gln Glu Asn Ser Ile Leu Arg Asp Ala Leu Asn Gln Ala

930 935 940

Thr Ser Gln Val Glu Ser Lys Gln Asn Thr Glu Leu Ala Lys Leu Arg

945 950 955 960

Gln Glu Leu Ser Lys Val Ser Lys Glu Leu Val Glu Lys Ser Glu Ala

965 970 975

Ala Arg Gln Glu Glu Gln Gln Arg Lys Ala Leu Glu Thr Lys Thr Ala

980 985 990

Ala Leu Glu Lys Gln Val Leu Gln Leu Gln Ala Ser His Lys Glu Ser

995 1000 1005

Glu Glu Ala Leu Gln Lys Arg Leu Asp Glu Val Ser Arg Glu Leu Cys

1010 1015 1020

Arg Ser Gln Thr Ser His Ala Ser Leu Arg Ala Asp Ala Glu Lys Ala

1025 1030 1035 1040

Gln Glu Gln Gln Gln Gln Met Ala Glu Leu His Ser Lys Leu Gln Ser

1045 1050 1055

Ser Glu Ala Glu Val Lys Ser Lys Ser Glu Glu Leu Ser Gly Leu His

1060 1065 1070

Gly Gln Leu Lys Glu Ala Arg Ala Glu Asn Ser Gln Leu Met Glu Arg

1075 1080 1085

Ile Arg Ser Ile Glu Ala Leu Leu Glu Ala Gly Gln Ala Arg Asp Thr

1090 1095 1100

Gln Asp Ala Gln Ala Ser Arg Ala Glu His Gln Ala Arg Leu Lys Glu

1105 1110 1115 1120

Leu Glu Ser Gln Val Trp Cys Leu Glu Lys Glu Ala Thr Glu Leu Lys

1125 1130 1135

Glu Ala Val Glu Gln Gln Lys Val Lys Asn Asn Asp Leu Arg Glu Lys

1140 1145 1150

Asn Trp Lys Ala Met Glu Ala Leu Ala Ser Ala Glu Arg Ala Cys Glu

1155 1160 1165

Glu Lys Leu Arg Ser Leu Thr Gln Ala Lys Glu Glu Ser Glu Lys Gln

1170 1175 1180

Leu Ser Leu Thr Glu Ala Gln Thr Lys Glu Ala Leu Leu Ala Leu Leu

1185 1190 1195 1200

Pro Ala Leu Ser Ser Ser Ala Pro Gln Ser Tyr Thr Glu Trp Leu Gln

1205 1210 1215

Glu Leu Arg Glu Lys Gly Pro Glu Leu Leu Lys Gln Arg Pro Ala Asp

1220 1225 1230

Thr Asp Pro Ser Ser Asp Leu Ala Ser Lys Leu Arg Glu Ala Glu Glu

1235 1240 1245

Thr Gln Asn Asn Leu Gln Ala Glu Cys Asp Gln Tyr Arg Thr Ile Leu

1250 1255 1260

Ala Glu Thr Glu Gly Met Leu Lys Asp Leu Gln Lys Ser Val Glu Glu

1265 1270 1275 1280

Glu Glu Gln Val Trp Lys Ala Lys Val Ser Ala Thr Glu Glu Glu Leu

1285 1290 1295

Gln Lys Ser Arg Val Thr Val Lys His Leu Glu Asp Ile Val Glu Lys

1300 1305 1310

Leu Lys Gly Glu Leu Glu Ser Ser Glu Gln Val Arg Glu His Thr Ser

1315 1320 1325

His Leu Glu Ala Glu Leu Glu Lys His Met Ala Ala Ala Ser Ala Glu

1330 1335 1340

Cys Gln Ser Tyr Ala Lys Glu Val Ala Gly Leu Arg Gln Leu Leu Leu

1345 1350 1355 1360

Glu Ser Gln Ser Gln Leu Asp Ala Ala Lys Ser Glu Ala Gln Lys Gln

1365 1370 1375

Ser Asn Glu Leu Ala Leu Val Arg Gln Gln Leu Ser Glu Met Lys Ser

1380 1385 1390

His Val Glu Asp Gly Asp Val Ala Gly Ser Pro Ala Ala Pro Pro Ala

1395 1400 1405

Glu Gln Asp Pro Val Glu Leu Lys Ala Gln Leu Glu Arg Thr Glu Ala

1410 1415 1420

Thr Leu Glu Asp Glu Gln Ala Leu Arg Arg Lys Leu Thr Ala Glu Phe

1425 1430 1435 1440

Gln Glu Ala Gln Ser Ser Ala Cys Arg Leu Gln Ala Glu Leu Glu Lys

1445 1450 1455

Leu Arg Ser Thr Gly Pro Leu Glu Ser Ser Ala Ala Glu Glu Ala Thr

1460 1465 1470

Gln Leu Lys Glu Arg Leu Glu Lys Glu Lys Lys Leu Thr Ser Asp Leu

1475 1480 1485

Gly His Ala Ala Thr Lys Leu Gln Glu Leu Leu Lys Thr Thr Gln Glu

1490 1495 1500

Gln Leu Ala Lys Glu Arg Asp Thr Val Lys Lys Leu Gln Glu Gln Leu

1505 1510 1515 1520

Asp Lys Thr Asp Asp Ser Ser Ser Lys Glu Gly Thr Ser Val

1525 1530

<210>49

<211>21

<212>DNA

<213>人工序列

<220>

<223>引物

<400>49

ctcaagggcc tggagactac g 21

<210>50

<211>22

<212>DNA

<213>人工序列

<220>

<223>引物

<400>50

cgggattccc gagtcgctca cc 22

<210>51

<211>1416

<212>DNA

<213>人工序列

<220>

<223>合成核苷酸

<400>51

tctagaatgt tgttgcaagc cttcttgttc ttgttggctg gtttcgctgc taagatttcc 60

gctcaattgc agttgcaaga gtccggtcca ggattggtta agccatccga gaccttgtcc 120

ttgacctgta ccgtttccgg tggttccatc atctccaagt cctcctactg gggatggatc 180

agacaaccac caggaaaggg tttggagtgg atcggttcca tctactactc cggttccacc 240

ttctacaacc catccttgaa gtccagagtt accatctccg ttgacacctc caagaaccaa 300

ttctccttga agttgtcctc cgttaccgct gctgacaccg ctgtttacta ctgtgctaga 360

ttgaccgttg ctgagttcga ctactggggt caaggaacct tggttaccgt ttcctccgct 420

tccaccaagg gtccatccgt tttcccattg gctccatcct ccaagtccac ctccggtgga 480

accgctgctt tgggttgttt ggtcaaggac tacttcccag agccagtcac cgtttcctgg 540

aactccggtg ctttgacctc cggtgttcac accttcccag ctgttttgca atcctccggt 600

ttgtactcct tgtcctccgt cgttaccgtt ccatcctcct ccttgggtac tcaaacctac 660

atctgcaacg tcaaccacaa gccatccaac accaaggttg acaagaaggt tgagccaaag 720

tcctgtgaca agacccacac ctgtccacca tgtccagctc cagagttgtt gggtggtcct 780

tctgttttct tgttcccacc aaagccaaag gacaccttga tgatctccag aaccccagag 840

gttacctgtg ttgtcgttga cgtttcccac gaggacccag aggttaagtt caactggtac 900

gttgacggtg ttgaggttca caacgctaag accaagccaa gagaggagca atacaactcc 960

acctacagag ttgtttccgt cttgaccgtt ttgcaccaag actggttgaa cggaaaggag 1020

tacaagtgca aggtttccaa caaggctttg ccagctccaa tcgaaaagac catctccaag 1080

gctaagggtc aaccaagaga gccacaagtt tacaccttgc caccatccag agatgagttg 1140

accaagaacc aagtttcctt gacctgcttg gtcaagggtt tctacccatc cgacatcgct 1200

gttgagtggg agtccaacgg tcaaccagag aacaactaca agaccacccc accagttttg 1260

gactccgacg gttccttctt cttgtactcc aagttgaccg ttgacaagtc cagatggcaa 1320

caaggtaacg ttttctcctg ctccgttatg cacgaggctt tgcacaacca ctacacccaa 1380

aagtccttgt ccttgtcccc aggtaagtaa ggatcc 1416

<210>52

<211>1416

<212>DNA

<213>人工序列

<220>

<223>合成核苷酸

<220>

<221>CDS

<222>(7)..(1410)

<400>52

tctaga atg ttg ttg caa gcc ttc ttg ttc ttg ttg gct ggt ttc gct 48

Met Leu Leu Gln Ala Phe Leu Phe Leu Leu Ala Gly Phe Ala

1 5 10

gct aag att tcc gct caa ttg cag ttg caa gag tcc ggt cca gga ttg 96

Ala Lys Ile Ser Ala Gln Leu Gln Leu Gln Glu Ser Gly Pro Gly Leu

15 20 25 30

gtt aag cca tcc gag acc ttg tcc ttg acc tgt acc gtt tcc ggt ggt 144

Val Lys Pro Ser Glu Thr Leu Ser Leu Thr Cys Thr Val Ser Gly Gly

35 40 45

tcc atc atc tcc aag tcc tcc tac tgg gga tgg atc aga caa cca cca 192

Ser Ile Ile Ser Lys Ser Ser Tyr Trp Gly Trp Ile Arg Gln Pro Pro

50 55 60

gga aag ggt ttg gag tgg atc ggt tcc atc tac tac tcc ggt tcc acc 240

Gly Lys Gly Leu Glu Trp Ile Gly Ser Ile Tyr Tyr Ser Gly Ser Thr

65 70 75

ttc tac aac cca tcc ttg aag tcc aga gtt acc atc tcc gtt gac acc 288

Phe Tyr Asn Pro Ser Leu Lys Ser Arg Val Thr Ile Ser Val Asp Thr

80 85 90

tcc aag aac caa ttc tcc ttg aag ttg tcc tcc gtt acc gct gct gac 336

Ser Lys Asn Gln Phe Ser Leu Lys Leu Ser Ser Val Thr Ala Ala Asp

95 100 105 110

acc gct gtt tac tac tgt gct aga ttg acc gtt gct gag ttc gac tac 384

Thr Ala Val Tyr Tyr Cys Ala Arg Leu Thr Val Ala Glu Phe Asp Tyr

115 120 125

tgg ggt caa gga acc ttg gtt acc gtt tcc tcc gct tcc acc aag ggt 432

Trp Gly Gln Gly Thr Leu Val Thr Val Ser Ser Ala Ser Thr Lys Gly

130 135 140

cca tcc gtt ttc cca ttg gct cca tcc tcc aag tcc acc tcc ggt gga 480

Pro Ser Val Phe Pro Leu Ala Pro Ser Ser Lys Ser Thr Ser Gly Gly

145 150 155

acc gct gct ttg ggt tgt ttg gtc aag gac tac ttc cca gag cca gtc 528

Thr Ala Ala Leu Gly Cys Leu Val Lys Asp Tyr Phe Pro Glu Pro Val

160 165 170

acc gtt tcc tgg aac tcc ggt gct ttg acc tcc ggt gtt cac acc ttc 576

Thr Val Ser Trp Asn Ser Gly Ala Leu Thr Ser Gly Val His Thr Phe

175 180 185 190

cca gct gtt ttg caa tcc tcc ggt ttg tac tcc ttg tcc tcc gtc gtt 624

Pro Ala Val Leu Gln Ser Ser Gly Leu Tyr Ser Leu Ser Ser Val Val

195 200 205

acc gtt cca tcc tcc tcc ttg ggt act caa acc tac atc tgc aac gtc 672

Thr Val Pro Ser Ser Ser Leu Gly Thr Gln Thr Tyr Ile Cys Asn Val

210 215 220

aac cac aag cca tcc aac acc aag gtt gac aag aag gtt gag cca aag 720

Asn His Lys Pro Ser Asn Thr Lys Val Asp Lys Lys Val Glu Pro Lys

225 230 235

tcc tgt gac aag acc cac acc tgt cca cca tgt cca gct cca gag ttg 768

Ser Cys Asp Lys Thr His Thr Cys Pro Pro Cys Pro Ala Pro Glu Leu

240 245 250

ttg ggt ggt cct tct gtt ttc ttg ttc cca cca aag cca aag gac acc 816

Leu Gly Gly Pro Ser Val Phe Leu Phe Pro Pro Lys Pro Lys Asp Thr

255 260 265 270

ttg atg atc tcc aga acc cca gag gtt acc tgt gtt gtc gtt gac gtt 864

Leu Met Ile Ser Arg Thr Pro Glu Val Thr Cys Val Val Val Asp Val

275 280 285

tcc cac gag gac cca gag gtt aag ttc aac tgg tac gtt gac ggt gtt 912

Ser His Glu Asp Pro Glu Val Lys Phe Asn Trp Tyr Val Asp Gly Val

290 295 300

gag gtt cac aac gct aag acc aag cca aga gag gag caa tac aac tcc 960

Glu Val His Asn Ala Lys Thr Lys Pro Arg Glu Glu Gln Tyr Asn Ser

305 310 315

acc tac aga gtt gtt tcc gtc ttg acc gtt ttg cac caa gac tgg ttg 1008

Thr Tyr Arg Val Val Ser Val Leu Thr Val Leu His Gln Asp Trp Leu

320 325 330

aac gga aag gag tac aag tgc aag gtt tcc aac aag gct ttg cca gct 1056

Asn Gly Lys Glu Tyr Lys Cys Lys Val Ser Asn Lys Ala Leu Pro Ala

335 340 345 350

cca atc gaa aag acc atc tcc aag gct aag ggt caa cca aga gag cca 1104

Pro Ile Glu Lys Thr Ile Ser Lys Ala Lys Gly Gln Pro Arg Glu Pro

355 360 365

caa gtt tac acc ttg cca cca tcc aga gat gag ttg acc aag aac caa 1152

Gln Val Tyr Thr Leu Pro Pro Ser Arg Asp Glu Leu Thr Lys Asn Gln

370 375 380

gtt tcc ttg acc tgc ttg gtc aag ggt ttc tac cca tcc gac atc gct 1200

Val Ser Leu Thr Cys Leu Val Lys Gly Phe Tyr Pro Ser Asp Ile Ala

385 390 395

gtt gag tgg gag tcc aac ggt caa cca gag aac aac tac aag acc acc 1248

Val Glu Trp Glu Ser Asn Gly Gln Pro Glu Asn Asn Tyr Lys Thr Thr

400 405 410

cca cca gtt ttg gac tcc gac ggt tcc ttc ttc ttg tac tcc aag ttg 1296

Pro Pro Val Leu Asp Ser Asp Gly Ser Phe Phe Leu Tyr Ser Lys Leu

415 420 425 430

acc gtt gac aag tcc aga tgg caa caa ggt aac gtt ttc tcc tgc tcc 1344

Thr Val Asp Lys Ser Arg Trp Gln Gln Gly Asn Val Phe Ser Cys Ser

435 440 445

gtt atg cac gag gct ttg cac aac cac tac acc caa aag tcc ttg tcc 1392

Val Met His Glu Ala Leu His Asn His Tyr Thr Gln Lys Ser Leu Ser

450 455 460

ttg tcc cca ggt aag taa ggatcc 1416

Leu Ser Pro Gly Lys

465

<210>53

<211>714

<212>DNA

<213>人工序列

<220>

<223>合成核苷酸

<400>53

tctagaatgt tgttgcaagc cttcttgttc ttgttggctg gtttcgctgc taagatttcc 60

gctgagatcg ttttgaccca atccccagct accttgtcct tgtccccagg tgagagagcc 120

accttgtcct gtagagcttc ccaatccgtt tcctccttct tggcttggta ccaacaaaag 180

ccaggtcaag ccccaagatt gttgatctac gacgcttcca acagagctac cggtatccca 240

gctagattct ccggttccgg ttccggaacc gacttcacct tgaccatctc ctccttggag 300

ccagaggact tcgctgttta ctactgccaa caaagatcca actggccatt gaccttcggt 360

ccaggtacta aggttgacat caagagaacc gttgctgctc catccgtttt catcttccca 420

ccatccgacg agcaattgaa gtccggtact gcttccgttg tttgcttgtt gaacaacttc 480

tacccaagag aggctaaggt tcaatggaag gttgacaacg ctttgcaatc cggtaactcc 540

caagagtccg ttaccgagca agactccaag gactccacct actccttgtc ctccaccttg 600

accttgtcca aggctgacta cgagaagcac aaggtttacg cttgtgaggt tacccaccaa 660

ggtttgtcct ccccagttac caagtccttc aacagaggtg agtgctaagg atcc 714

<210>54

<211>714

<212>DNA

<213>人工序列

<220>

<223>合成核苷酸

<220>

<221>CDS

<222>(7)..(708)

<400>54

tctaga atg ttg ttg caa gcc ttc ttg ttc ttg ttg gct ggt ttc gct 48

Met Leu Leu Gln Ala Phe Leu Phe Leu Leu Ala Gly Phe Ala

1 5 10

gct aag att tcc gct gag atc gtt ttg acc caa tcc cca gct acc ttg 96

Ala Lys Ile Ser Ala Glu Ile Val Leu Thr Gln Ser Pro Ala Thr Leu

15 20 25 30

tcc ttg tcc cca ggt gag aga gcc acc ttg tcc tgt aga gct tcc caa 144

Ser Leu Ser Pro Gly Glu Arg Ala Thr Leu Ser Cys Arg Ala Ser Gln

35 40 45

tcc gtt tcc tcc ttc ttg gct tgg tac caa caa aag cca ggt caa gcc 192

Ser Val Ser Ser Phe Leu Ala Trp Tyr Gln Gln Lys Pro Gly Gln Ala

50 55 60

cca aga ttg ttg atc tac gac gct tcc aac aga gct acc ggt atc cca 240

Pro Arg Leu Leu Ile Tyr Asp Ala Ser Asn Arg Ala Thr Gly Ile Pro

65 70 75

gct aga ttc tcc ggt tcc ggt tcc gga acc gac ttc acc ttg acc atc 288

Ala Arg Phe Ser Gly Ser Gly Ser Gly Thr Asp Phe Thr Leu Thr Ile

80 85 90

tcc tcc ttg gag cca gag gac ttc gct gtt tac tac tgc aaa caa aga 336

Ser Ser Leu Glu Pro Glu Asp Phe Ala Val Tyr Tyr Cys Gln Gln Arg

95 100 105 110

tcc aac tgg cca ttg acc ttc ggt cca ggt act aag gtt gac atc aag 384

Ser Asn Trp Pro Leu Thr Phe Gly Pro Gly Thr Lys Val Asp Ile Lys

115 120 125

aga acc gtt gct gct cca tcc gtt ttc atc ttc cca cca tcc gac gag 432

Arg Thr Val Ala Ala Pro Ser Val Phe Ile Phe Pro Pro Ser Asp Glu

130 135 140

caa ttg aag tcc ggt act gct tcc gtt gtt tgc ttg ttg aac aac ttc 480

Gln Leu Lys Ser Gly Thr Ala Ser Val Val Cys Leu Leu Asn Asn Phe

145 150 155

tac cca aga gag gct aag gtt caa tgg aag gtt gac aac gct ttg caa 528

Tyr Pro Arg Glu Ala Lys Val Gln Trp Lys Val Asp Asn Ala Leu Gln

160 165 170

tcc ggt aac tcc caa gag tcc gtt acc gag caa gac tcc aag gac tcc 576

Ser Gly Asn Ser Gln Glu Ser Val Thr Glu Gln Asp Ser Lys Asp Ser

175 180 185 190

acc tac tcc ttg tcc tcc acc ttg acc ttg tcc aag gct gac tac gag 624

Thr Tyr Ser Leu Ser Ser Thr Leu Thr Leu Ser Lys Ala Asp Tyr Glu

195 200 205

aag cac aag gtt tac gct tgt gag gtt acc cac caa ggt ttg tcc tcc 672

Lys His Lys Val Tyr Ala Cys Glu Val Thr His Gln Gly Leu Ser Ser

210 215 220

cca gtt acc aag tcc ttc aac aga ggt gag tgc taa ggatcc 714

Pro Val Thr Lys Ser Phe Asn Arg Gly Glu Cys

225 230

<210>55

<211>1437

<212>DNA

<213>人工序列

<220>

<223>合成核苷酸

<400>55

tctagaatgt tgggtaagaa cgacccaatg tgcttggtct tggtcttgtt gggtttgacc 60

gctttgttgg gtatctgtca aggacaattg cagttgcaag agtccggtcc aggattggtt 120

aagccatccg agaccttgtc cttgacctgt accgtttccg gtggttccat catctccaag 180

tcctcctact ggggatggat cagacaacca ccaggaaagg gtttggagtg gatcggttcc 240

atctactact ccggttccac cttctacaac ccatccttga agtccagagt taccatctcc 300

gttgacacct ccaagaacca attctccttg aagttgtcct ccgttaccgc tgctgacacc 360

gctgtttact actgtgctag attgaccgtt gctgagttcg actactgggg tcaaggaacc 420

ttggttaccg tttcctccgc ttccaccaag ggtccatccg ttttcccatt ggctccatcc 480

tccaagtcca cctccggtgg aaccgctgct ttgggttgtt tggtcaagga ctacttccca 540

gagccagtca ccgtttcctg gaactccggt gctttgacct ccggtgttca caccttccca 600

gctgttttgc aatcctccgg tttgtactcc ttgtcctccg tcgttaccgt tccatcctcc 660

tccttgggta ctcaaaccta catctgcaac gtcaaccaca agccatccaa caccaaggtt 720

gacaagaagg ttgagccaaa gtcctgtgac aagacccaca cctgtccacc atgtccagct 780

ccagagttgt tgggtggtcc ttctgttttc ttgttcccac caaagccaaa ggacaccttg 840

atgatctcca gaaccccaga ggttacctgt gttgtcgttg acgtttccca cgaggaccca 900

gaggttaagt tcaactggta cgttgacggt gttgaggttc acaacgctaa gaccaagcca 960

agagaggagc aatacaactc cacctacaga gttgtttccg tcttgaccgt tttgcaccaa 1020

gactggttga acggaaagga gtacaagtgc aaggtttcca acaaggcttt gccagctcca 1080

atcgaaaaga ccatctccaa ggctaagggt caaccaagag agccacaagt ttacaccttg 1140

ccaccatcca gagatgagtt gaccaagaac caagtttcct tgacctgctt ggtcaagggt 1200

ttctacccat ccgacatcgc tgttgagtgg gagtccaacg gtcaaccaga gaacaactac 1260

aagaccaccc caccagtttt ggactccgac ggttccttct tcttgtactc caagttgacc 1320

gttgacaagt ccagatggca acaaggtaac gttttctcct gctccgttat gcacgaggct 1380

ttgcacaacc actacaccca aaagtccttg tccttgtccc caggtaagta aggatcc 1437

<210>56

<211>1437

<212>DNA

<213>人工序列

<220>

<223>合成核苷酸

<220>

<221>CDS

<222>(7)..(1431)

<400>56

tctaga atg ttg ggt aag aac gac cca atg tgc ttg gtc ttg gtc ttg 48

Met Leu Gly Lys Asn Asp Pro Met Cys Leu Val Leu Val Leu

1 5 10

ttg ggt ttg acc gct ttg ttg ggt atc tgt caa gga caa ttg cag ttg 96

Leu Gly Leu Thr Ala Leu Leu Gly Ile Cys Gln Gly Gln Leu Gln Leu

15 20 25 30

caa gag tcc ggt cca gga ttg gtt aag cca tcc gag acc ttg tcc ttg 144

Gln Glu Ser Gly Pro Gly Leu Val Lys Pro Ser Glu Thr Leu Ser Leu

35 40 45

acc tgt acc gtt tcc ggt ggt tcc atc atc tcc aag tcc tcc tac tgg 192

Thr Cys Thr Val Ser Gly Gly Ser Ile Ile Ser Lys Ser Ser Tyr Trp

50 55 60

gga tgg atc aga caa cca cca gga aag ggt ttg gag tgg atc ggt tcc 240

Gly Trp Ile Arg Gln Pro Pro Gly Lys Gly Leu Glu Trp Ile Gly Ser

65 70 75

atc tac tac tcc ggt tcc acc ttc tac aac cca tcc ttg aag tcc aga 288

Ile Tyr Tyr Ser Gly Ser Thr Phe Tyr Asn Pro Ser Leu Lys Ser Arg

80 85 90

gtt acc atc tcc gtt gac acc tcc aag aac caa ttc tcc ttg aag ttg 336

Val Thr Ile Ser Val Asp Thr Ser Lys Asn Gln Phe Ser Leu Lys Leu

95 100 105 110

tcc tcc gtt acc gct gct gac acc gct gtt tac tac tgt gct aga ttg 384

Ser Ser Val Thr Ala Ala Asp Thr Ala Val Tyr Tyr Cys Ala Arg Leu

115 120 125

acc gtt gct gag ttc gac tac tgg ggt caa gga acc ttg gtt acc gtt 432

Thr Val Ala Glu Phe Asp Tyr Trp Gly Gln Gly Thr Leu Val Thr Val

130 135 140

tcc tcc gct tcc acc aag ggt cca tcc gtt ttc cca ttg gct cca tcc 480

Ser Ser Ala Ser Thr Lys Gly Pro Ser Val Phe Pro Leu Ala Pro Ser

145 150 155

tcc aag tcc acc tcc ggt gga acc gct gct ttg ggt tgt ttg gtc aag 528

Ser Lys Ser Thr Ser Gly Gly Thr Ala Ala Leu Gly Cys Leu Val Lys

160 165 170

gac tac ttc cca gag cca gtc acc gtt tcc tgg aac tcc ggt gct ttg 576

Asp Tyr Phe Pro Glu Pro Val Thr Val Ser Trp Asn Ser Gly Ala Leu

175 180 185 190

acc tcc ggt gtt cac acc ttc cca gct gtt ttg caa tcc tcc ggt ttg 624

Thr Ser Gly Val His Thr Phe Pro Ala Val Leu Gln Ser Ser Gly Leu

195 200 205

tac tcc ttg tcc tcc gtc gtt acc gtt cca tcc tcc tcc ttg ggt act 672

Tyr Ser Leu Ser Ser Val Val Thr Val Pro Ser Ser Ser Leu Gly Thr

210 215 220

caa acc tac atc tgc aac gtc aac cac aag cca tcc aac acc aag gtt 720

Gln Thr Tyr Ile Cys Asn Val Asn His Lys Pro Ser Asn Thr Lys Val

225 230 235

gac aag aag gtt gag cca aag tcc tgt gac aag acc cac acc tgt cca 768

Asp Lys Lys Val Glu Pro Lys Ser Cys Asp Lys Thr His Thr Cys Pro

240 245 250

cca tgt cca gct cca gag ttg ttg ggt ggt cct tct gtt ttc ttg ttc 816

Pro Cys Pro Ala Pro Glu Leu Leu Gly Gly Pro Ser Val Phe Leu Phe

255 260 265 270

cca cca aag cca aag gac acc ttg atg atc tcc aga acc cca gag gtt 864

Pro Pro Lys Pro Lys Asp Thr Leu Met Ile Ser Arg Thr Pro Glu Val

275 280 285

acc tgt gtt gtc gtt gac gtt tcc cac gag gac cca gag gtt aag ttc 912

Thr Cys Val Val Val Asp Val Ser His Glu Asp Pro Glu Val Lys Phe

290 295 300

aac tgg tac gtt gac ggt gtt gag gtt cac aac gct aag acc aag cca 960

Asn Trp Tyr Val Asp Gly Val Glu Val His Asn Ala Lys Thr Lys Pro

305 310 315

aga gag gag caa tac aac tcc acc tac aga gtt gtt tcc gtc ttg acc 1008

Arg Glu Glu Gln Tyr Asn Ser Thr Tyr Arg Val Val Ser Val Leu Thr

320 325 330

gtt ttg cac caa gac tgg ttg aac gga aag gag tac aag tgc aag gtt 1056

Val Leu His Gln Asp Trp Leu Asn Gly Lys Glu Tyr Lys Cys Lys Val

335 340 345 350

tcc aac aag gct ttg cca gct cca atc gaa aag acc atc tcc aag gct 1104

Ser Asn Lys Ala Leu Pro Ala Pro Ile Glu Lys Thr Ile Ser Lys Ala

355 360 365

aag ggt caa cca aga gag cca caa gtt tac acc ttg cca cca tcc aga 1152

Lys Gly Gln Pro Arg Glu Pro Gln Val Tyr Thr Leu Pro Pro Ser Arg

370 375 380

gat gag ttg acc aag aac caa gtt tcc ttg acc tgc ttg gtc aag ggt 1200

Asp Glu Leu Thr Lys Asn Gln Val Ser Leu Thr Cys Leu Val Lys Gly

385 390 395

ttc tac cca tcc gac atc gct gtt gag tgg gag tcc aac ggt caa cca 1248

Phe Tyr Pro Ser Asp Ile Ala Val Glu Trp Glu Ser Asn Gly Gln Pro

400 405 410

gag aac aac tac aag acc acc cca cca gtt ttg gac tcc gac ggt tcc 1296

Glu Asn Asn Tyr Lys Thr Thr Pro Pro Val Leu Asp Ser Asp Gly Ser

415 420 425 430

ttc ttc ttg tac tcc aag ttg acc gtt gac aag tcc aga tgg caa caa 1344

Phe Phe Leu Tyr Ser Lys Leu Thr Val Asp Lys Ser Arg Trp Gln Gln

435 440 445

ggt aac gtt ttc tcc tgc tcc gtt atg cac gag gct ttg cac aac cac 1392

Gly Asn Val Phe Ser Cys Ser Val Met His Glu Ala Leu His Asn His

450 455 460

tac acc caa aag tcc ttg tcc ttg tcc cca ggt aag taa ggatcc 1437

Tyr Thr Gln Lys Ser Leu Ser Leu Ser Pro Gly Lys

465 470

<2l0>57

<211>735

<212>DNA

<213>人工序列

<220>

<223>合成核苷酸

<400>57

tctagaatgt tgggtaagaa cgacccaatg tgcttggtct tggtcttgtt gggtttgacc 60

gctttgttgg gtatctgtca aggagagatc gttttgaccc aatccccagc taccttgtcc 120

ttgtccccag gtgagagagc caccttgtcc tgtagagctt cccaatccgt ttcctccttc 180

ttggcttggt accaacaaaa gccaggtcaa gccccaagat tgttgatcta cgacgcttcc 240

aacagagcta ccggtatccc agctagattc tccggttccg gttccggaac cgacttcacc 300

ttgaccatct cctccttgga gccagaggac ttcgctgttt actactgcca acaaagatcc 360

aactggccat tgaccttcgg tccaggtact aaggttgaca tcaagagaac cgttgctgct 420

ccatccgttt tcatcttccc accatccgac gagcaattga agtccggtac tgcttccgtt 480

gtttgcttgt tgaacaactt ctacccaaga gaggctaagg ttcaatggaa ggttgacaac 540

gctttgcaat ccggtaactc ccaagagtcc gttaccgagc aagactccaa ggactccacc 600

tactccttgt cctccacctt gaccttgtcc aaggctgact acgagaagca caaggtttac 660

gcttgtgagg ttacccacca aggtttgtcc tccccagtta ccaagtcctt caacagaggt 720

gagtgctaag gatcc 735

<210>58

<211>735

<212>DNA

<213>人工序列

<220>

<223>合成核苷酸

<220>

<221>CDS

<222>(7)..(729)

<400>58

tctaga atg ttg ggt aag aac gac cca atg tgc ttg gtc ttg gtc ttg 48

Met Leu Gly Lys Asn Asp Pro Met Cys Leu Val Leu Val Leu

1 5 10

ttg ggt ttg acc gct ttg ttg ggt atc tgt caa gga gag atc gtt ttg 96

Leu Gly Leu Thr Ala Leu Leu Gly Ile Cys Gln Gly Glu Ile Val Leu

15 20 25 30

acc caa tcc cca gct acc ttg tcc ttg tcc cca ggt gag aga gcc acc 144

Thr Gln Ser Pro Ala Thr Leu Ser Leu Ser Pro Gly Glu Arg Ala Thr

35 40 45

ttg tcc tgt aga gct tcc caa tcc gtt tcc tcc ttc ttg gct tgg tac 192

Leu Ser Cys Arg Ala Ser Gln Ser Val Ser Ser Phe Leu Ala Trp Tyr

50 55 60

caa caa aag cca ggt caa gcc cca aga ttg ttg atc tac gac gct tcc 240

Gln Gln Lys Pro Gly Gln Ala Pro Arg Leu Leu Ile Tyr Asp Ala Ser

65 70 75

aac aga gct acc ggt atc cca gct aga ttc tcc ggt tcc ggt tcc gga 288

Asn Arg Ala Thr Gly Ile Pro Ala Arg Phe Ser Gly Ser Gly Ser Gly

80 85 90

acc gac ttc acc ttg acc atc tcc tcc ttg gag cca gag gac ttc gct 336

Thr Asp Phe Thr Leu Thr Ile Ser Ser Leu Glu Pro Glu Asp Phe Ala

95 100 105 110

gtt tac tac tgc caa caa aga tcc aac tgg cca ttg acc ttc ggt cca 384

Val Tyr Tyr Cys Gln Gln Arg Ser Asn Trp Pro Leu Thr Phe Gly Pro

115 120 125

ggt act aag gtt gac atc aag aga acc gtt gct gct cca tcc gtt ttc 432

Gly Thr Lys Val Asp Ile Lys Arg Thr Val Ala Ala Pro Ser Val Phe

130 135 140

atc ttc cca cca tcc gac gag caa ttg aag tcc ggt act gct tcc gtt 480

Ile Phe Pro Pro Ser Asp Glu Gln Leu Lys Ser Gly Thr Ala Ser Val

145 150 155

gtt tgc ttg ttg aac aac ttc tac cca aga gag gct aag gtt caa tgg 528

Val Cys Leu Leu Asn Asn Phe Tyr Pro Arg Glu Ala Lys Val Gln Trp

160 165 170

aag gtt gac aac gct ttg caa tcc ggt aac tcc caa gag tcc gtt acc 576

Lys Val Asp Asn Ala Leu Gln Ser Gly Asn Ser Gln Glu Ser Val Thr

175 180 185 190

gag caa gac tcc aag gac tcc acc tac tcc ttg tcc tcc acc ttg acc 624

Glu Gln Asp Ser Lys Asp Ser Thr Tyr Ser Leu Ser Ser Thr Leu Thr

195 200 205

ttg tcc aag gct gac tac gag aag cac aag gtt tac gct tgt gag gtt 672

Leu Ser Lys Ala Asp Tyr Glu Lys His Lys Val Tyr Ala Cys Glu Val

210 215 220

acc cac caa ggt ttg tcc tcc cca gtt acc aag tcc ttc aac aga ggt 720

Thr His Gln Gly Leu Ser Ser Pro Val Thr Lys Ser Phe Asn Arg Gly

225 230 235

gag tgc taa ggatcc 735

Glu Cys

240

<210>59

<211>37

<212>DNA

<213>人工序列

<220>

<223>引物

<400>59

atagaactag caactagatg aaaaagcctg aactcac 37

<210>60

<211>36

<212>DNA

<213>人工序列

<220>

<223>引物

<400>60

caaatcccac ggatcactat tcctttgccc tcggac 36

<210>61

<211>38

<212>DNA

<213>人工序列

<220>

<223>引物

<400>61

aattcgagct cggtacaggg atacatggga taccaaag 38

<210>62

<211>38

<212>DNA

<213>人工序列

<220>

<223>引物

<400>62

gaggatcccc gggtaccagg gtcgattttc ttggtcga 38

<210>63

<211>29

<212>DNA

<213>人工序列

<220>

<223>引物

<400>63

atgcccgtag attcttctca taagacagc 29

<210>64

<211>30

<212>DNA

<213>人工序列

<220>

<223>引物

<400>64

caaagtcatt taaatcaaat gcattagcgg 30

<210>65

<211>1220

<212>DNA

<213>巴斯德毕赤氏酵母

<400>65

atgcccgtag attcttctca taagacagct agcccacttc cacctcgtaa aagagcaaag 60

acggaagaag aaaaggagca gcgtcgagtg gaacgtatcc tacgtaatag gagagcggcc 120

catgcttcca gagagaagaa acgaagacac gttgaatttc tggaaaacca cgtcgtcgac 180

ctggaatctg cacttcaaga atcagccaaa gccactaaca agttgaaaga aatacaagat 240

atcattgttt caaggttgga agccttaggt ggtaccgtct cagatttgga tttaacagtt 300

ccggaagtcg attttcccaa atcttctgat ttggaaccca tgtctgatct ctcaacttct 360

tcgaaatcgg agaaagcatc tacatccact cgcagatctt tgactgagga tctggacgaa 420

gatgacgtcg ctgaatatga cgacgaagaa gaggacgaag agttacccag gaaaatgaaa 480

gtcttaaacg acaaaaacaa gagcacatct atcaagcagg agaagttgaa tgaacttcca 540

tctcctttgt catccgattt ttcagacgta gatgaagaaa agtcaactct cacacattta 600

aagttgcaac agcaacaaca acaaccagta gacaattatg tttctactcc tttgagtctt 660

ccggaggatt cagttgattt tattaaccca ggtaacttaa aaatagagtc cgatgagaac 720

ttcttgttga gttcaaatac tttacaaata aaacacgaaa atgacaccga ctacattact 780

acagctccat caggttccat caatgatttt tttaattctt atgacattag cgagtcgaat 840

cggttgcatc atccagcagt gatgacggat tcatctttac acattacagc aggctccatc 900

ggctttttct ctttgattgg ggggggggaa agttctgtag cagggaggcg cagttcagtt 960

ggcacatatc agttgacatg catagcgatc aggtgattgc tcttgttaac tggtatgcca 1020

agtcaaccgt tttcggcgta cctactactc tactttaact cttgaattga gatgaaacaa 1080

tcgcccttgt tcgagacgcg tagttaattt aagatgaatc aatttgcaac aaaagaacaa 1140

acgaaaaaga taacagcaaa cttaagtttc gtggtctgca gcaccattta ccgctaatgc 1200

atttgattta aatgactttg 1220

<210>66

<211>898

<212>DNA

<213>巴斯德毕赤氏酵母

<400>66

atgcccgtag attcttctca taagacagct agcccacttc cacctcgtaa aagagcaaag 60

acggaagaag aaaaggagca gcgtcgagtg gaacgtatcc tacgtaatag gagagcggcc 120

catgcttcca gagagaagaa acgaagacac gttgaatttc tggaaaacca cgtcgtcgac 180

ctggaatctg cacttcaaga atcagccaaa gccactaaca agttgaaaga aatacaagat 240

atcattgttt caaggttgga agccttaggt ggtaccgtct cagatttgga tttaacagtt 300

ccggaagtcg attttcccaa atcttctgat ttggaaccca tgtctgatct ctcaacttct 360

tcgaaatcgg agaaagcatc tacatccact cgcagatctt tgactgagga tctggacgaa 420

gatgacgtcg ctgaatatga cgacgaagaa gaggacgaag agttacccag gaaaatgaaa 480

gtcttaaacg acaaaaacaa gagcacatct atcaagcagg agaagttgaa tgaacttcca 540

tctcctttgt catccgattt ttcagacgta gatgaagaaa agtcaactct cacacattta 600

aagttgcaac agcaacaaca acaaccagta gacaattatg tttctactcc tttgagtctt 660

ccggaggatt cagttgattt tattaaccca ggtaacttaa aaatagagtc cgatgagaac 720

ttcttgttga gttcaaatac tttacaaata aaacacgaaa atgacaccga ctacattact 780

acagctccat caggttccat caatgatttt tttaattctt atgacattag cgagtcgaat 840

cggttgcatc atccagcagc accatttacc gctaatgcat ttgatttaaa tgactttg 898

<210>67

<211>29

<212>DNA

<213>人工序列

<220>

<223>引物

<400>67

gactagtatg cccgtagatt cttctcata 29

<210>68

<211>30

<212>DNA

<213>人工序列

<220>

<223>引物

<400>68

cagatctcta ttcctggaag aatacaaagt 30

<210>69

<211>915

<212>DNA

<213>巴斯德毕赤氏酵母

<400>69

atgcccgtag attcttctca taagacagct agcccacttc cacctcgtaa aagagcaaag 60

acggaagaag aaaaggagca gcgtcgagtg gaacgtatcc tacgtaatag gagagcggcc 120

catgcttcca gagagaagaa acgaagacac gttgaatttc tggaaaacca cgtcgtcgac 180

ctggaatctg cacttcaaga atcagccaaa gccactaaca agttgaaaga aatacaagat 240

atcattgttt caaggttgga agccttaggt ggtaccgtct cagatttgga tttaacagtt 300

ccggaagtcg attttcccaa atcttctgat ttggaaccca tgtctgatct ctcaacttct 360

tcgaaatcgg agaaagcatc tacatccact cgcagatctt tgactgagga tctggacgaa 420

gatgacgtcg ctgaatatga cgacgaagaa gaggacgaag agttacccag gaaaatgaaa 480

gtcttaaacg acaaaaacaa gagcacatct atcaagcagg agaagttgaa tgaacttcca 540

tctcctttgt catccgattt ttcagacgta gatgaagaaa agtcaactct cacacattta 600

aagttgcaac agcaacaaca acaaccagta gacaattatg tttctactcc tttgagtctt 660

ccggaggatt cagttgattt tattaaccca ggtaacttaa aaatagagtc cgatgagaac 720

ttcttgttga gttcaaatac tttacaaata aaacacgaaa atgacaccga ctacattact 780

acagctccat caggttccat caatgatttt tttaattctt atgacattag cgagtcgaat 840

cggttgcatc atccagcagc accatttacc gctaatgcat ttgatttaaa tgactttgta 900

ttcttccagg aatag 915

<210>70

<211>304

<212>PRT

<213>巴斯德毕赤氏酵母

<400>70

Met Pro Val Asp Ser Ser His Lys Thr Ala Ser Pro Leu Pro Pro Arg

1 5 10 15

Lys Arg Ala Lys Thr Glu Glu Glu Lys Glu Gln Arg Arg Val Glu Arg

20 25 30

Ile Leu Arg Asn Arg Arg Ala Ala His Ala Ser Arg Glu Lys Lys Arg

35 40 45

Arg His Val Glu Phe Leu Glu Asn His Val Val Asp Leu Glu Ser Ala

50 55 60

Leu Gln Glu Ser Ala Lys Ala Thr Asn Lys Leu Lys Glu Ile Gln Asp

65 70 75 80

Ile Ile Val Ser Arg Leu Glu Ala Leu Gly Gly Thr Val Ser Asp Leu

85 90 95

Asp Leu Thr Val Pro Glu Val Asp Phe Pro Lys Ser Ser Asp Leu Glu

100 105 110

Pro Met Ser Asp Leu Ser Thr Ser Ser Lys Ser Glu Lys Ala Ser Thr

115 120 125

Ser Thr Arg Arg Ser Leu Thr Glu Asp Leu Asp Glu Asp Asp Val Ala

130 135 140

Glu Tyr Asp Asp Glu Glu Glu Asp Glu Glu Leu Pro Arg Lys Met Lys

145 150 155 160

Val Leu Asn Asp Lys Asn Lys Ser Thr Ser Ile Lys Gln Glu Lys Leu

165 170 175

Asn Glu Leu Pro Ser Pro Leu Ser Ser Asp Phe Ser Asp Val Asp Glu

180 185 190

Glu Lys Ser Thr Leu Thr His Leu Lys Leu Gln Gln Gln Gln Gln Gln

195 200 205

Pro Val Asp Asn Tyr Val Ser Thr Pro Leu Ser Leu Pro Glu Asp Ser

210 215 220

Val Asp Phe Ile Asn Pro Gly Asn Leu Lys Ile Glu Ser Asp Glu Asn

225 230 235 240

Phe Leu Leu Ser Ser Asn Thr Leu Gln Ile Lys His Glu Asn Asp Thr

245 250 255

Asp Tyr Ile Thr Thr Ala Pro Ser Gly Ser Ile Asn Asp Phe Phe Asn

260 265 270

Ser Tyr Asp Ile Ser Glu Ser Asn Arg Leu His His Pro Ala Ala Pro

275 280 285

Phe Thr Ala Asn Ala Phe Asp Leu Asn Asp Phe Val Phe Phe Gln Glu

290 295 300

<210>71

<211>30

<212>DNA

<213>人工序列

<220>

<223>引物

<400>71

gtctagaatg gaaatgactg attttgaact 30

<210>72

<211>30

<212>DNA

<213>人工序列

<220>

<223>引物

<400>72

cggatcctca tgaagtgatg aagaaatcat 30

<210>73

<211>30

<212>DNA

<213>人工序列

<220>

<223>引物

<400>73

atggcgggca aaaatcagaa atctagcgcg 30

<210>74

<211>30

<212>DNA

<213>人工序列

<220>

<223>引物

<400>74

ttacaactcg tctttgacta gaggcgggga 30

<210>75

<211>2520

<212>DNA

<213>0gataea minuta

<400>75

atggcgggca aaaatcagaa atctagcgcg accaccgctc agtcgttgag gggcgacacc 60

acaacagaac tcgtgttgca aaaggggaagt tgaggacct atatcaaaac agagttgtca 120

gaggacacat tgagccacag ggtactgaac acgacgagcg agaagttgtt gttggtgttg 180

ctgacagttt ttgctgccgt gattcgtttc cgcagtctca gcttccctga ctcagtggta 240

tttgacgagg ttcactttgg aggatttgcc agaaaataca tcctgggaaa cttcttcatg 300

gatgttcatc cgccattggc caaactgtta tttgctgcgg ttggatacct aggcggattc 360

aagggtgatt ttgagtttgc gtctattggt gacaagttcc cgacctctgt tccatatgtt 420

ctgatgagag aaatgagtgc gctcctcagt gttggaacag tggttctcat gtacttaacc 480

ttgcgggcct cgggctgcaa gccaatcgtc tcgtttctca ccgcctcttt gctggtggtc 540

gagagtgcca atgtgaccat ctccagatac attctgctgg actctccttt gatctttttc 600

attgctggct cagtctactc cttgaagaag gtccagatct acaaaccata ctcgttcgag 660

tggatcaaat ccctgtttgc aacaggagtt tgcctgggac ttgcgttctc gtccaaatgg 720

gttggtctat tcactgtggc ctgggtcggt gcctgcagcg tgatcagtct gtggtttcag 780

attggcgatc tgtccgtcaa gcccaagtca attgttaccc aggcggtcgc caaggtgtcc 840

gttttgctcg gagtccctgc cattttgtac ttggttttct tctacctcca cctctcgttc 900

ctcaaccacg agggagacgg tgctgccttc ctctcttctg ccttcagagt gtccttcgac 960

gacactaatg tccctgtgtc caccttggca gacgttggag ttggctcggt cgtcactatc 1020

agacatctca acaccaacgg aggctacttg cactcccaca accatttgta tgaaggagga 1080

tcgggacaac agcaaatcac tctgtaccca catctggacg agaacaataa atggaagatt 1140

gagctctaca acgttactga ggaacctacc gaatttgagc caattacaga cggaacaaag 1200

atcagattga aacacacatt cacctccaga agattgcatt cccacgacgt gagaccggca 1260

gtcagcgaga tagactggca aaatgaggct tcctgctacg ggtacgagga ctttgaagga 1320

gatgccaacg acgatttcgt tgttgagatt gtggacagtt tgtctgctcc tggcgactcc 1380

agaacacaag tgaaagccat ccataccgtg ttcagattga ggcacgcaat gaccggttgt 1440

tatctgttct cccacgagac caagttgcca aaatggggat ttgaacaaca ggaggtcaca 1500

tgtgccaccc aaggtatcaa acctctctcc tactggtacg tggagcaaaa tgagaaccca 1560

ttccttgatg cggaaaccgc tgaaatcgcc gcttatccgc agctcacttt ccttcaaaaa 1620

ttcactgaat tgcacaagag gatgtggaaa atcaacaaga gtctgaacgc tccacacact 1680

tacgagtcga gaccagagtc ctggcctgtt ctgtccagag gtatttctta ctggagagat 1740

ggagacagac aggtctattt gcttggaaac ccaattgtgt ggtggctagc ctcttttatc 1800

ttccttccgt tcggcttcta cgttatcgct cagcttttga gatggcaatt gggtgctgac 1860

ttgggggata actcggctgt tttcaattac agtatcacca catttgagtt ccttttggga 1920

tggttcattc attactatcc atccttcctc atggagagac agctcttttt gcaccactac 1980

atcccagccc tctactttgg tattttggca ttgggacaaa cgttcgaggt gctgtactct 2040

cacgtcctca aaggcaagaa attcctctcg atggccctct tcggcttgct cttcgccagc 2100

gcaggataca tgtttgttca gagatcctcc atcatctacg gatccgcctg ggacaaacag 2160

agctgtgagg cttccaagct gctttcaagc tgggactatg attgcagcat ctacccagag 2220

actttgtttg cttcttccgc atcaattgcg gagccaaagc agactcaggc gccaaagatc 2280

aactttgacg aggcattgaa cgtggacctg gaacccggct acgacaattc acagtttgtt 2340

gagagcattt atgaaacgtc taacgacgaa aaaaaccaag cagagaacgt tgttcaagag 2400

acccctcgtg acaacggcgc cgactccgtt tccagcgacg attcaacagt cggtgaggcc 2460

gtccctgacg atctcaagac aaatggagag tccccgcctc tagtcaaaga cgagttgtaa 2520

<210>76

<211>839

<212>PRT

<213>Ogataea minuta

<400>76

Met Ala Gly Lys Asn Gln Lys Ser Ser Ala Thr Thr Ala Gln Ser Leu

1 5 10 15

Arg Gly Asp Thr Thr Thr Glu Leu Val Leu Gln Lys Gly Lys Leu Arg

20 25 30

Thr Tyr Ile Lys Thr Glu Leu Ser Glu Asp Thr Leu Ser His Arg Val

35 40 45

Leu Asn Thr Thr Ser Glu Lys Leu Leu Leu Val Leu Leu Thr Val Phe

50 55 60

Ala Ala Val Ile Arg Phe Arg Ser Leu Ser Phe Pro Asp Ser Val Val

65 70 75 80

Phe Asp Glu Val His Phe Gly Gly Phe Ala Arg Lys Tyr Ile Leu Gly

85 90 95

Asn Phe Phe Met Asp Val His Pro Pro Leu Ala Lys Leu Leu Phe Ala

100 105 110

Ala Val Gly Tyr Leu Gly Gly Phe Lys Gly Asp Phe Glu Phe Ala Ser

115 120 125

Ile Gly Asp Lys Phe Pro Thr Ser Val Pro Tyr Val Leu Met Arg Glu

130 135 140

Met Ser Ala Leu Leu Ser Val Gly Thr Val Val Leu Met Tyr Leu Thr

145 150 155 160

Leu Arg Ala Ser Gly Cys Lys Pro Ile Val Ser Phe Leu Thr Ala Ser

165 170 175

Leu Leu Val Val Glu Ser Ala Asn Val Thr Ile Ser Arg Tyr Ile Leu

180 185 190

Leu Asp Ser Pro Leu Ile Phe Phe Ile Ala Gly Ser Val Tyr Ser Leu

195 200 205

Lys Lys Val Gln Ile Tyr Lys Pro Tyr Ser Phe Glu Trp Ile Lys Ser

210 215 220

Leu Phe Ala Thr Gly Val Cys Leu Gly Leu Ala Phe Ser Ser Lys Trp

225 230 235 240

Val Gly Leu Phe Thr Val Ala Trp Val Gly Ala Cys Ser Val Ile Ser

245 250 255

Leu Trp Phe Gln Ile Gly Asp Leu Ser Val Lys Pro Lys Ser Ile Val

260 265 270

Thr Gln Ala Val Ala Lys Val Ser Val Leu Leu Gly Val Pro Ala Ile

275 280 285

Leu Tyr Leu Val Phe Phe Tyr Leu His Leu Ser Phe Leu Asn His Glu

290 295 300

Gly Asp Gly Ala Ala Phe Leu Ser Ser Ala Phe Arg Val Ser Phe Asp

305 310 315 320

Asp Thr Asn Val Pro Val Ser Thr Leu Ala Asp Val Gly Val Gly Ser

325 330 335

Val Val Thr Ile Arg His Leu Asn Thr Asn Gly Gly Tyr Leu His Ser

340 345 350

His Asn His Leu Tyr Glu Gly Gly Ser Gly Gln Gln Gln Ile Thr Leu

355 360 365

Tyr Pro His Leu Asp Glu Asn Asn Lys Trp Lys Ile Glu Leu Tyr Asn

370 375 380

Val Thr Glu Glu Pro Thr Glu Phe Glu Pro Ile Thr Asp Gly Thr Lys

385 390 395 400

Ile Arg Leu Lys His Thr Phe Thr Ser Arg Arg Leu His Ser His Asp

405 410 415

Val Arg Pro Ala Val Ser Glu Ile Asp Trp Gln Asn Glu Ala Ser Cys

420 425 430

Tyr Gly Tyr Glu Asp Phe Glu Gly Asp Ala Asn Asp Asp Phe Val Val

435 440 445

Glu Ile Val Asp Ser Leu Ser Ala Pro Gly Asp Ser Arg Thr Gln Val

450 455 460

Lys Ala Ile His Thr Val Phe Arg Leu Arg His Ala Met Thr Gly Cys

465 470 475 480

Tyr Leu Phe Ser His Glu Thr Lys Leu Pro Lys Trp Gly Phe Glu Gln

485 490 495

Gln Glu Val Thr Cys Ala Thr Gln Gly Ile Lys Pro Leu Ser Tyr Trp

500 505 510

Tyr Val Glu Gln Asn Glu Asn Pro Phe Leu Asp Ala Glu Thr Ala Glu

515 520 525

Ile Ala Ala Tyr Pro Gln Leu Thr Phe Leu Gln Lys Phe Thr Glu Leu

530 535 540

His Lys Arg Met Trp Lys Ile Asn Lys Ser Leu Asn Ala Pro His Thr

545 550 555 560

Tyr Glu Ser Arg Pro Glu Ser Trp Pro Val Leu Ser Arg Gly Ile Ser

565 570 575

Tyr Trp Arg Asp Gly Asp Arg Gln Val Tyr Leu Leu Gly Asn Pro Ile

580 585 590

Val Trp Trp Leu Ala Ser Phe Ile Phe Leu Pro Phe Gly Phe Tyr Val

595 600 605

Ile Ala Gln Leu Leu Arg Trp Gln Leu Gly Ala Asp Leu Gly Asp Asn

610 615 620

Ser Ala Val Phe Asn Tyr Ser Ile Thr Thr Phe Glu Phe Leu Leu Gly

625 630 635 640

Trp Phe Ile His Tyr Tyr Pro Ser Phe Leu Met Glu Arg Gln Leu Phe

645 650 655

Leu His His Tyr Ile Pro Ala Leu Tyr Phe Gly Ile Leu Ala Leu Gly

660 665 670

Gln Thr Phe Glu Val Leu Tyr Ser His Val Leu Lys Gly Lys Lys Phe

675 680 685

Leu Ser Met Ala Leu Phe Gly Leu Leu Phe Ala Ser Ala Gly Tyr Met

690 695 700

Phe Val Gln Arg Ser Ser Ile Ile Tyr Gly Ser Ala Trp Asp Lys Gln

705 710 715 720

Ser Cys Glu Ala Ser Lys Leu Leu Ser Ser Trp Asp Tyr Asp Cys Ser

725 730 735

Ile Tyr Pro Glu Thr Leu Phe Ala Ser Ser Ala Ser Ile Ala Glu Pro

740 745 750

Lys Gln Thr Gln Ala Pro Lys Ile Asn Phe Asp Glu Ala Leu Asn Val

755 760 765

Asp Leu Glu Pro Gly Tyr Asp Asn Ser Gln Phe Val Glu Ser Ile Tyr

770 775 780

Glu Thr Ser Asn Asp Glu Lys Asn Gln Ala Glu Asn Val Val Gln Glu

785 790 795 800

Thr Pro Arg Asp Asn Gly Ala Asp Ser Val Ser Ser Asp Asp Ser Thr

805 810 815

Val Gly Glu Ala Val Pro Asp Asp Leu Lys Thr Asn Gly Glu Ser Pro

820 825 830

Pro Leu Val Lys Asp Glu Leu

835

<210>77

<211>30

<212>DNA

<213>人工序列

<220>

<223>引物

<400>77

atgggcgaac gtacgggcaa aagtgcgctc 30

<210>78

<211>30

<212>DNA

<213>人工序列

<220>

<223>引物

<400>78

ctaatcggaa attctccacg tgctcaagag 30

<210>79

<211>30

<212>DNA

<213>人工序列

<220>

<223>引物

<400>79

atggggccca aaataaagac cggcaagaaa 30

<210>80

<211>30

<212>DNA

<213>人工序列

<220>

<223>引物

<400>80

ctatttagca aaatgcagtt tgatgttgag 30

<210>81

<211>30

<212>DNA

<213>人工序列

<220>

<223>引物

<400>81

atggacgaga aaaacatctc tggcttagaa 30

<210>82

<211>30

<212>DNA

<213>人工序列

<220>

<223>引物

<400>82

ctactcacta tagacggagc agtcgatcga 30

<210>83

<211>30

<212>DNA

<213>人工序列

<220>

<223>引物

<400>83

atgtccgagt cagagctgag aaaccgcaaa 30

<210>84

<211>30

<212>DNA

<213>人工序列

<220>

<223>引物

<400>84

ctaagctata cgccaggtgg aaacccagtt 30

<210>85

<211>2259

<212>DNA

<213>Ogataea minuta

<400>85

atgggcgaac gtacgggcaa aagtgcgctc gaaaaggaac ccttgttgga aaacgatgag 60

tttacagaag atgaagtgaa ggcgaaacta gttgaattgg ccaccaagcc agagccggag 120

tccgaaatta cctctgtttg tcagtggtgg ttccgcaccg agacctggct ggcgccaatc 180

ttgttcactc ttctttcttt ctttgtcaga atgtacaaaa tcggaatcaa tcctcacgtt 240

gtttgggatg aagcccattt cggtaagttt ggatcctact atttgagaca cgaattttac 300

cacgatgtcc accctcctct tggaaaaatg cttgttggtc tctcaggata ccttgctgga 360

tacaatggtt cgtgggactt cccatctggc caggaatacc cggactacat tgactttgtc 420

aaaatgagat tattcaacgc gactttcagt gctctttgtg ttccaatcgc ctacttcacc 480

atgaaagaat ttggcttcaa cagaaaaacg acatggctct tcactttgat ggtgactttg 540

gaaacttcgt acactacgct tgccagattc attctgctgg actcgatgct tcttcttttt 600

accgtggcta ccgtgttctg tttcgccaga ttccacaacc aaaacagagt tgaatcaaac 660

tccttctcga gaaaatggtg gaaatggatt ttgttgactg gtatcaacat cggatgcacc 720

tgttcggtga aaatggttgg tcttttcgtc accaccttgg ttggtatcta cacggttgtc 780

gatctgtgga ctaagttcgg ccagctgagg aagaccatct ctgtaaagag atacattttc 840

cactgggcca ccagaatctt tgctctcatt atcattccat ttgctgtttt tttgatctct 900

ttcaaagtcc acttcgacct gcttttcgga tccggtccag gagacgcgaa catgtcctcg 960

ttgttccagg ccaacctggt tggatccacc ctcatttccg ggccaagaga cgtcatgact 1020

ctcaactctg tcgtgactct caaaagtcag ggattgaccg gtggtttgct ccattcccac 1080

gtgcagacct atcccgaagg ctcgaaccaa cagcaagtga ccacttactc gcacaaagat 1140

gcgaacaacg actggacttt tgagctggtc agagaagacg tcagaaactc cttcaccgaa 1200

cctcactacg tcgttgacgg aatggccgtc agacttgttc acaaatctac gggaagaaac 1260

ttgcacaccc acgagatccc tgctccagtg tccagttccc aatacgaagt ctccggttac 1320

ggtaacttga ccgttggcga ccgcaaagac aactggattg tggagattgc tgaccaatac 1380

ggcgacgagg acaagatcag attgcatccg ctgacctctt cattcagact cagatcggag 1440

ttgatgggtt gttacttggc cacaaccggt gtctctctgc cacagtgggg attcagacaa 1500

ggagaggttg tctgtatgca ctcgccattc aagagggaca agagaacatg gtggaacatt 1560

gaaaaccacg agaatccaga actgccaaac ccaccagaag acttcaaatt gccaaaaaca 1620

tctttcatca aggactttgt ccagctcaac atcgccatga tggccaccaa caacgcactg 1680

gtcccagatc cggaaaaaca ggacgatttg gcttctaaat tctggcaatg gccttcgttg 1740

aacgtcggta tcagactctg tggttgggga gacgacaatg tcaagtactt cttgattggt 1800

tctccggcca ctacttggac ctcgtcggtt tccatcgtgg tgtttgttgc aatggttgcc 1860

ttctacctgg tcagatggca gagacagatc gaggatttcc catccgactc gaagacacac 1920

tacaagagcg acaaactcaa cctgttcttg atgggaggag tctatccgtt cctgggttgg 1980

ttcctgcatt acatgccgtt ctgtatcatg ggcagagtca cttacgttca ccattacctc 2040

cctgcattgt actttgctat gattgtgatg tgctacactg ttcagtcctt cacgtccttc 2100

gccaacaaca aatacctcac cgctgttgtc tacttgtctc tctatgcact tgtgattggg 2160

ttctttgtgt ttttgcttcc tgtttcgttc ggtatggacg gtccgaacgc agacttcaag 2220

tatctcagcc tcttgagcac gtggagaatt tccgattag 2259

<210>86

<211>752

<212>PRT

<213>Ogataea minuta

<400>86

Met Gly Glu Arg Thr Gly Lys Ser Ala Leu Glu Lys Glu Pro Leu Leu

1 5 10 15

Glu Asn Asp Glu Phe Thr Glu Asp Glu Val Lys Ala Lys Leu Val Glu

20 25 30

Leu Ala Thr Lys Pro Glu Pro Glu Ser Glu Ile Thr Ser Val Cys Gln

35 40 45

Trp Trp Phe Arg Thr Glu Thr Trp Leu Ala Pro Ile Leu Phe Thr Leu

50 55 60

Leu Ser Phe Phe Val Arg Met Tyr Lys Ile Gly Ile Asn Pro His Val

65 70 75 80

Val Trp Asp Glu Ala His Phe Gly Lys Phe Gly Ser Tyr Tyr Leu Arg

85 90 95

His Glu Phe Tyr His Asp Val His Pro Pro Leu Gly Lys Met Leu Val

100 105 110

Gly Leu Ser Gly Tyr Leu Ala Gly Tyr Asn Gly Ser Trp Asp Phe Pro

115 120 125

Ser Gly Gln Glu Tyr Pro Asp Tyr Ile Asp Phe Val Lys Met Arg Leu

130 135 140

Phe Asn Ala Thr Phe Ser Ala Leu Cys Val Pro Ile Ala Tyr Phe Thr

145 150 155 160

Met Lys Glu Phe Gly Phe Asn Arg Lys Thr Thr Trp Leu Phe Thr Leu

165 170 175

Met Val Thr Leu Glu Thr Ser Tyr Thr Thr Leu Ala Arg Phe Ile Leu

180 185 190

Leu Asp Ser Met Leu Leu Leu Phe Thr Val Ala Thr Val Phe Cys Phe

195 200 205

Ala Arg Phe His Asn Gln Asn Arg Val Glu Ser Asn Ser Phe Ser Arg

210 215 220

Lys Trp Trp Lys Trp Ile Leu Leu Thr Gly Ile Asn Ile Gly Cys Thr

225 230 235 240

Cys Ser Val Lys Met Val Gly Leu Phe Val Thr Thr Leu Val Gly Ile

245 250 255

Tyr Thr Val Val Asp Leu Trp Thr Lys Phe Gly Gln Leu Arg Lys Thr

260 265 270

Ile Ser Val Lys Arg Tyr Ile Phe His Trp Ala Thr Arg Ile Phe Ala

275 280 285

Leu Ile Ile Ile Pro Phe Ala Val Phe Leu Ile Ser Phe Lys Val His

290 295 300

Phe Asp Leu Leu Phe Gly Ser Gly Pro Gly Asp Ala Asn Met Ser Ser

305 310 315 320

Leu Phe Gln Ala Asn Leu Val Gly Ser Thr Leu Ile Ser Gly Pro Arg

325 330 335

Asp Val Met Thr Leu Asn Ser Val Val Thr Leu Lys Ser Gln Gly Leu

340 345 350

Thr Gly Gly Leu Leu His Ser His Val Gln Thr Tyr Pro Glu Gly Ser

355 360 365

Asn Gln Gln Gln Val Thr Thr Tyr Ser His Lys Asp Ala Asn Asn Asp

370 375 380

Trp Thr Phe Glu Leu Val Arg Glu Asp Val Arg Asn Ser Phe Thr Glu

385 390 395 400

Pro His Tyr Val Val Asp Gly Met Ala Val Arg Leu Val His Lys Ser

405 410 415

Thr Gly Arg Asn Leu His Thr His Glu Ile Pro Ala Pro Val Ser Ser

420 425 430

Ser Gln Tyr Glu Val Ser Gly Tyr Gly Asn Leu Thr Val Gly Asp Arg

435 440 445

Lys Asp Asn Trp Ile Val Glu Ile Ala Asp Gln Tyr Gly Asp Glu Asp

450 455 460

Lys Ile Arg Leu His Pro Leu Thr Ser Ser Phe Arg Leu Arg Ser Glu

465 470 475 480

Leu Met Gly Cys Tyr Leu Ala Thr Thr Gly Val Ser Leu Pro Gln Trp

485 490 495

Gly Phe Arg Gln Gly Glu Val Val Cys Met His Ser Pro Phe Lys Arg

500 505 510

Asp Lys Arg Thr Trp Trp Asn Ile Glu Asn His Glu Asn Pro Glu Leu

515 520 525

Pro Asn Pro Pro Glu Asp Phe Lys Leu Pro Lys Thr Ser Phe Ile Lys

530 535 540

Asp Phe Val Gln Leu Asn Ile Ala Met Met Ala Thr Asn Asn Ala Leu

545 550 555 560

Val Pro Asp Pro Glu Lys Gln Asp Asp Leu Ala Ser Lys Phe Trp Gln

565 570 575

Trp Pro Ser Leu Asn Val Gly Ile Arg Leu Cys Gly Trp Gly Asp Asp

580 585 590

Asn Val Lys Tyr Phe Leu Ile Gly Ser Pro Ala Thr Thr Trp Thr Ser

595 600 605

Ser Val Ser Ile Val Val Phe Val Ala Met Val Ala Phe Tyr Leu Val

610 615 620

Arg Trp Gln Arg Gln Ile Glu Asp Phe Pro Ser Asp Ser Lys Thr His

625 630 635 640

Tyr Lys Ser Asp Lys Leu Asn Leu Phe Leu Met Gly Gly Val Tyr Pro

645 650 655

Phe Leu Gly Trp Phe Leu His Tyr Met Pro Phe Cys Ile Met Gly Arg

660 665 670

Val Thr Tyr Val His His Tyr Leu Pro Ala Leu Tyr Phe Ala Met Ile

675 680 685

Val Met Cys Tyr Thr Val Gln Ser Phe Thr Ser Phe Ala Asn Asn Lys

690 695 700

Tyr Leu Thr Ala Val Val Tyr Leu Ser Leu Tyr Ala Leu Val Ile Gly

705 710 715 720

Phe Phe Val Phe Leu Leu Pro Val Ser Phe Gly Met Asp Gly Pro Asn

725 730 735

Ala Asp Phe Lys Tyr Leu Ser Leu Leu Ser Thr Trp Arg Ile Ser Asp

740 745 750

<210>87

<211>2265

<212>DNA

<213>Ogataea minuta

<400>87

atggggccca aaataaagac cggcaagaaa cccaatgcgg tggaatcagt ggttgttgac 60

aaaaagggga gtgtctcgtt ggagggcaag attgacaccc cagtcaagaa ctcctcgatc 120

gatccctcaa tggagatcta ctacaagctg acgaatacaa tgttgacgct tctggctttg 180

gccactagat tctactacat ctggtacccc aacgaggtgg tgttcgatga agttcacttt 240

ggaaagtttg cctcgtacta cttggagaga acctatttct tcgatctcca ccctccattc 300

gccaagctcc tcattgcctt cgttggctat ctggttggtt tcagtgggaa attcaagttt 360

gacaacatcg gggacagcta tatcacccac tctattccat acatcccgtt gcgtgcgctt 420

tctgctgttc tgggatccct gaccgtgccg ctcatgttct ccacgttgca agagtgtggt 480

tactcaattc caacgtgcgc ttttggtgcc ctgctggttg tgtttgacaa cgctcatgct 540

gccgagacta gattgattct gctcgacgct acgctgatct tctcggttgc agcttctgtg 600

tactgctacg tgagattcac aaagcaaaga caccagcctt ttaccgcaac ctggtacaag 660

tggttggttt tgaccggtgt ctcgttgtcc tgtgtcattt ccaccaaata cgtgggtgtt 720

ttcacctttg cctgcgttgg tgtggctgtg gtttgggact tgtgggagct tttggatatt 780

aagaagggcc tcacaattag agttttggct agacattttg tccacagagc catcggcctc 840

attttgctgc cgttcattat ttacttgggc tggttttaca tccactttgc cattctgacc 900

aaatcgggac cgggagatcc tttcatgagc gcagacttcc aagaaacttt gggagactct 960

cctctcacaa gagaagcaag agaggtcaac taccatgata tcataacggt caaacacaaa 1020

gacactgagt gtttattgca ctcgcatcct ttcaactatc cactacgtta cgatgacgga 1080

agaatttctt cgcaaggcca gcaggtgact tgtatgaaag attacacaga cgttaacaac 1140

tactgggaaa ttcttcctgc taaagcttct gacgaaactg tgaacctcgg tctcgctgtc 1200

aaacaaggag acactttcag attgagacac gttgagacag gcggattttt actcactcat 1260

gacgttgctt ctcccctttt cccgaccaac gaggagttta ctgtcatgag cgctgaagaa 1320

gcggattcta caaggttcaa cgacactttg ttcagatttg atccgttcga caagaggaag 1380

aacgacgtgc tcaagaccaa ggcatccgtg gtcaaagttt tccacgttcc taccattgtc 1440

actatgtgga ctcacgatga tcagctactt ccagaatggg gcttcaacca acaggaggtc 1500

aacggaaaca aaaaggttgc ggactccgat aactactgga ctattgactc tatcattggt 1560

ttgtctggcg aaagagccaa gtacgttcca aaagaagtga aacgtttgcc attccttacc 1620

aaatggaaag agctgcaact cactatgttt gaacaaaaca acaaattgag ttcgagccat 1680

ccatttgcat cccaacctga gtcatggcct ttgtcgttgt ccggtgtctc gttctggact 1740

aagaatgata cccgcgaaca aatctacttc attggaaatc ttttcggctg gtggttagaa 1800

gccggactgc ttctgtgtta cctaggaata ttgctggcag accaactcac gagacgcaga 1860

aatgtgactg ttttgagcac tagagccaga gctaggttgt acaaaaacat cggatttttc 1920

ttctgcggat gggccaccca ctacttccca ttcttcctca tgtcaagaca aaagttcctg 1980

catcattatt tgcctgcgca cctgctggct gcgctgtttt cggcgtcctt gttggaattc 2040

attttcaccg ataacagaca cgaggagctc agggatccaa aagataagtc tgagccagga 2100

aaggtcaact ggatcctata cctgtcgtgc ctgattctgc ttgtgacagt cttagttgga 2160

ttctacgtct tccttgctcc gttgacctac ggaaacgttt cattgacccc tgaagaagtc 2220

atcaagagac aaattctcaa catcaaactg cattttgcta aatag 2265

<210>88

<211>754

<212>PRT

<213>Ogataea minuta

<400>88

Met Gly Pro Lys Ile Lys Thr Gly Lys Lys Pro Asn Ala Val Glu Ser

1 5 10 15

Val Val Val Asp Lys Lys Gly Ser Val Ser Leu Glu Gly Lys Ile Asp

20 25 30

Thr Pro Val Lys Asn Ser Ser Ile Asp Pro Ser Met Glu Ile Tyr Tyr

35 40 45

Lys Leu Thr Asn Thr Met Leu Thr Leu Leu Ala Leu Ala Thr Arg Phe

50 55 60

Tyr Tyr Ile Trp Tyr Pro Asn Glu Val Val Phe Asp Glu Val His Phe

65 70 75 80

Gly Lys Phe Ala Ser Tyr Tyr Leu Glu Arg Thr Tyr Phe Phe Asp Leu

85 90 95

His Pro Pro Phe Ala Lys Leu Leu Ile Ala Phe Val Gly Tyr Leu Val

100 105 110

Gly Phe Ser Gly Lys Phe Lys Phe Asp Asn Ile Gly Asp Ser Tyr Ile

115 120 125

Thr His Ser Ile Pro Tyr Ile Pro Leu Arg Ala Leu Ser Ala Val Leu

130 135 140

Gly Ser Leu Thr Val Pro Leu Met Phe Ser Thr Leu Gln Glu Cys Gly

145 150 155 160

Tyr Ser Ile Pro Thr Cys Ala Phe Gly Ala Leu Leu Val Val Phe Asp

165 170 175

Asn Ala His Ala Ala Glu Thr Arg Leu Ile Leu Leu Asp Ala Thr Leu

180 185 190

Ile Phe Ser Val Ala Ala Ser Val Tyr Cys Tyr Val Arg Phe Thr Lys

195 200 205

Gln Arg His Gln Pro Phe Thr Ala Thr Trp Tyr Lys Trp Leu Val Leu

2l0 215 220

Thr Gly Val Ser Leu Ser Cys Val Ile Ser Thr Lys Tyr Val Gly Val

225 230 235 240

Phe Thr Phe Ala Cys Val Gly Val Ala Val Val Trp Asp Leu Trp Glu

245 250 255

Leu Leu Asp Ile Lys Lys Gly Leu Thr Ile Arg Val Leu Ala Arg His

260 265 270

Phe Val His Arg Ala Ile Gly Leu Ile Leu Leu Pro Phe Ile Ile Tyr

275 280 285

Leu Gly Trp Phe Tyr Ile His Phe Ala Ile Leu Thr Lys Ser Gly Pro

290 295 300

Gly Asp Pro Phe Met Ser Ala Asp Phe Gln Glu Thr Leu Gly Asp Ser

305 310 315 320

Pro Leu Thr Arg Glu Ala Arg Glu Val Asn Tyr His Asp Ile Ile Thr

325 330 335

Val Lys His Lys Asp Thr Glu Cys Leu Leu His Ser His Pro Phe Asn

340 345 350

Tyr Pro Leu Arg Tyr Asp Asp Gly Arg Ile Ser Ser Gln Gly Gln Gln

355 360 365

Val Thr Cys Met Lys Asp Tyr Thr Asp Val Asn Asn Tyr Trp Glu Ile

370 375 380

Leu Pro Ala Lys Ala Ser Asp Glu Thr Val Asn Leu Gly Leu Ala Val

385 390 395 400

Lys Gln Gly Asp Thr Phe Arg Leu Arg His Val Glu Thr Gly Gly Phe

405 410 415

Leu Leu Thr His Asp Val Ala Ser Pro Leu Phe Pro Thr Asn Glu Glu

420 425 430

Phe Thr Val Met Ser Ala Glu Glu Ala Asp Ser Thr Arg Phe Asn Asp

435 440 445

Thr Leu Phe Arg Phe Asp Pro Phe Asp Lys Arg Lys Asn Asp Val Leu

450 455 460

Lys Thr Lys Ala Ser Val Val Lys Val Phe His Val Pro Thr Ile Val

465 470 475 480

Thr Met Trp Thr His Asp Asp Gln Leu Leu Pro Glu Trp Gly Phe Asn

485 490 495

Gln Gln Glu Val Asn Gly Asn Lys Lys Val Ala Asp Ser Asp Asn Tyr

500 505 510

Trp Thr Ile Asp Ser Ile Ile Gly Leu Ser Gly Glu Arg Ala Lys Tyr

515 520 525

Val Pro Lys Glu Val Lys Arg Leu Pro Phe Leu Thr Lys Trp Lys Glu

530 535 540

Leu Gln Leu Thr Met Phe Glu Gln Asn Asn Lys Leu Ser Ser Ser His

545 550 555 560

Pro Phe Ala Ser Gln Pro Glu Ser Trp Pro Leu Ser Leu Ser Gly Val

565 570 575

Ser Phe Trp Thr Lys Asn Asp Thr Arg Glu Gln Ile Tyr Phe Ile Gly

580 585 590

Asn Leu Phe Gly Trp Trp Leu Glu Ala Gly Leu Leu Leu Cys Tyr Leu

595 600 605

Gly Ile Leu Leu Ala Asp Gln Leu Thr Arg Arg Arg Asn Val Thr Val

610 615 620

Leu Ser Thr Arg Ala Arg Ala Arg Leu Tyr Lys Asn Ile Gly Phe Phe

625 630 635 640

Phe Cys Gly Trp Ala Thr His Tyr Phe Pro Phe Phe Leu Met Ser Arg

645 650 655

Gln Lys Phe Leu His His Tyr Leu Pro Ala His Leu Leu Ala Ala Leu

660 665 670

Phe Ser Ala Ser Leu Leu Glu Phe Ile Phe Thr Asp Asn Arg His Glu

675 680 685

Glu Leu Arg Asp Pro Lys Asp Lys Ser Glu Pro Gly Lys Val Asn Trp

690 695 700

Ile Leu Tyr Leu Ser Cys Leu Ile Leu Leu Val Thr Val Leu Val Gly

705 710 715 720

Phe Tyr Val Phe Leu Ala Pro Leu Thr Tyr Gly Asn Val Ser Leu Thr

725 730 735

Pro Glu Glu Val Ile Lys Arg Gln Ile Leu Asn Ile Lys Leu His Phe

740 745 750

Ala Lys

<210>89

<211>2199

<212>DNA

<213>Ogataea minuta

<400>89

atggacgaga aaaacatctc tggcttagaa cgcctaggca ccggcccaga gttcacactc 60

gtgcagggcc cgagacgcaa ctacctccgt ctgccggaaa aggcggggct tccaagccgc 120

actagaaagg agaagctcca ggttctgtgc gtcattctgc tcgcgctcac cacgagactc 180

gtctctctga accatccgtc gtcggtcgtc tacgacgagc taactaccgg aaacatcgtc 240

aacaactacc tccatggaca ctattttgtc gatgcagatc ctccttttgt caaaattcta 300

tacactgctg tcgcccaaat atcgcagtac acgggcgcgt tccaattcca ctctgctggc 360

cagtcgtatc tgaacgaaga cctcgagccg gagttcccat acgtggcact ccgggtgttc 420

agcggcctct gcagcgtggc aaccgttctc ctggcataca aaactctcag agccacggga 480

gtcagacacc tgattgctct gttcggcgcc tttctgattg cactagaagg ctcgatgatt 540

acgcaatcaa gatttttcat gcaaacggct cacgtcgtgt tcttcaccgg cttggccgtt 600

ggaatgtcca aaacgtcaga cctgtttgaa ccctcgagcg caaaatggct caaacacacc 660

gcagcggccg gcctcggcgt ggcgtttcta atttcgtccg cgtggtcggg tcttttcacg 720

gctgtttggt tggttctcgt caccctgaga agagtctggt acctcaccgg cgacgttacg 780

acaaatccaa gaaccacgtt cctcagatac gcgcttcccc gctttgctct tattgttgcg 840

gcgccagtgg ccttctacct gtgggtgttc aaagtgcatc tggacttgct tccagtggct 900

ggtcccggct acccgttcat gtccgcggag ttccagcacg ggctggtcgg cacccatctc 960

aacaacattt ctgccgaagt ctcgtatggc tccacagttt ccattagaca cttgcacacg 1020

gggaagtacc tgcactccga gaacaaaacg taccctaaaa caggacacca gcgggtcacc 1080

acattcggcg accaggactt caacaacctg ttttacgtcg agatgagggt caagtccgaa 1140

cgcggcgagc tcgcacggaa agtcaaagct gtcgagagcg gcagacaaat acgtcttttc 1200

cacaatgcca cccagaagta cctgtttatc gacccggaca acaagcctcc tctctccgag 1260

acagactata acaaggaagt gagcacgttt ggaaacgctt cctgggtggg cgagaactac 1320

ctcaacttcg agcttctgct tgccccgggc ttctccaaga ccgaggtggg caagaaaaga 1380

gtgcgggccg tcgagtctgt cttccagctg tacaacgtca agaacaagtg ctatctgctg 1440

gggaccgaga acaggcttcc gagctgggca gacggggaaa acgaggtcgt ttgcatcgag 1500

aaacctattt tcgaaagatc gttgtggtac tttgaaacca atctccacga caagttcacc 1560

cccgcacggg cccaggtcgc tttcaggcag cagacgttct gggacaagat tctcgaaatt 1620

cacaaagtca tggcagatct gctcgcacaa aacacccatg acgacgccaa cagcaccgct 1680

cctcgggatt ggttcttctt cagaaaggga atcaggtact gggcagaaag tcaggccatg 1740

gtatatctca ctgggaaccc ggttgtctac tcgttgacgg cgctaggcac tgtgggattc 1800

ttggtgttca aactcggtca tctatgttcg ttcaacccga ataagtcgcc agactactcc 1860

agcgacttcc tcaagttcga ctaccacgct caggaatttc ttctcggata cctgctgaac 1920

tggcttcctc acgcgctttc aaagacaaac acatacgtgt tcgagtacca gccggcgttg 1980

tacttcggtg ttcttctgtc ctgtcagtcg ctagagtacc tggcctccaa gaacctgaag 2040

ctgtgctatg tgtttgcggc cgcggttgca ctgctcacag cagctttctt ccgtttgtcg 2100

gcaccgttga tgtacggact gaagtggcag gagttgtact gcgtcgctgt ttcaacagct 2160

gccagacagt cgatcgactg ctccgtctat agtgagtag 2199

<210>90

<211>732

<212>PRT

<213>Ogataea minuta

<400>90

Met Asp Glu Lys Asn Ile Ser Gly Leu Glu Arg Leu Gly Thr Gly Pro

1 5 10 15

Glu Phe Thr Leu Val Gln Gly Pro Arg Arg Asn Tyr Leu Arg Leu Pro

20 25 30

Glu Lys Ala Gly Leu Pro Ser Arg Thr Arg Lys Glu Lys Leu Gln Val

35 40 45

Leu Cys Val Ile Leu Leu Ala Leu Thr Thr Arg Leu Val Ser Leu Asn

50 55 60

His Pro Ser Ser Val Val Tyr Asp Glu Leu Thr Thr Gly Asn Ile Val

65 70 75 80

Asn Asn Tyr Leu His Gly His Tyr Phe Val Asp Ala Asp Pro Pro Phe

85 90 95

Val Lys Ile Leu Tyr Thr Ala Val Ala Gln Ile Ser Gln Tyr Thr Gly

100 105 110

Ala Phe Gln Phe His Ser Ala Gly Gln Ser Tyr Leu Asn Glu Asp Leu

115 120 125

Glu Pro Glu Phe Pro Tyr Val Ala Leu Arg Val Phe Ser Gly Leu Cys

130 135 140

Ser Val Ala Thr Val Leu Leu Ala Tyr Lys Thr Leu Arg Ala Thr Gly

145 150 155 160

Val Arg His Leu Ile Ala Leu Phe Gly Ala Phe Leu Ile Ala Leu Glu

165 170 175

Gly Ser Met Ile Thr Gln Ser Arg Phe Phe Met Gln Thr Ala His Val

180 185 190

Val Phe Phe Thr Gly Leu Ala Val Gly Met Ser Lys Thr Ser Asp Leu

195 200 205

Phe Glu Pro Ser Ser A la Lys Trp Leu Lys His Thr Ala Ala Ala Gly

210 215 220

Leu Gly Val Ala Phe Leu Ile Ser Ser Ala Trp Ser Gly Leu Phe Thr

225 230 235 240

Ala Val Trp Leu Val Leu Val Thr Leu Arg Arg Val Trp Tyr Leu Thr

245 250 255

Gly Asp Val Thr Thr Asn Pro Arg Thr Thr Phe Leu Arg Tyr Ala Leu

260 265 270

Pro Arg Phe Ala Leu Ile Val Ala Ala Pro Val Ala Phe Tyr Leu Trp

275 280 285

Val Phe Lys Val His Leu Asp Leu Leu Pro Val Ala Gly Pro Gly Tyr

290 295 300

Pro Phe Met Ser Ala Glu Phe Gln His Gly Leu Val Gly Thr His Leu

305 310 315 320

Asn Asn Ile Ser Ala Glu Val Ser Tyr Gly Ser Thr Val Ser Ile Arg

325 330 335

His Leu His Thr Gly Lys Tyr Leu His Ser Glu Asn Lys Thr Tyr Pro

340 345 350

Lys Thr Gly His Gln Arg Val Thr Thr Phe Gly Asp Gln Asp Phe Asn

355 360 365

Asn Leu Phe Tyr Val Glu Met Arg Val Lys Ser Glu Arg Gly Glu Leu

370 375 380

Ala Arg Lys Val Lys Ala Val Glu Ser Gly Arg Gln Ile Arg Leu Phe

385 390 395 400

His Asn Ala Thr Gln Lys Tyr Leu Phe Ile Asp Pro Asp Asn Lys Pro

405 410 415

Pro Leu Ser Glu Thr Asp Tyr Asn Lys Glu Val Ser Thr Phe Gly Asn

420 425 430

Ala Ser Trp Val Gly Glu Asn Tyr Leu Asn Phe Glu Leu Leu Leu Ala

435 440 445

Pro Gly Phe Ser Lys Thr Glu Val Gly Lys Lys Arg Val Arg Ala Val

450 455 460

Glu Ser Val Phe Gln Leu Tyr Asn Val Lys Asn Lys Cys Tyr Leu Leu

465 470 475 480

Gly Thr Glu Asn Arg Leu Pro Ser Trp Ala Asp Gly Glu Asn Glu Val

485 490 495

Val Cys Ile Glu Lys Pro Ile Phe Glu Arg Ser Leu Trp Tyr Phe Glu

500 505 510

Thr Asn Leu His Asp Lys Phe Thr Pro Ala Arg Ala Gln Val Ala Phe

515 520 525

Arg Gln Gln Thr Phe Trp Asp Lys Ile Leu Glu Ile His Lys Val Met

530 535 540

Ala Asp Leu Leu Ala Gln Asn Thr His Asp Asp Ala Asn Ser Thr Ala

545 550 555 560

Pro Arg Asp Trp Phe Phe Phe Arg Lys Gly Ile Arg Tyr Trp Ala Glu

565 570 575

Ser Gln Ala Met Val Tyr Leu Thr Gly Asn Pro Val Val Tyr Ser Leu

580 585 590

Thr Ala Leu Gly Thr Val Gly Phe Leu Val Phe Lys Leu Gly His Leu

595 600 605

Cys Ser Phe Asn Pro Asn Lys Ser Pro Asp Tyr Ser Ser Asp Phe Leu

610 615 620

Lys Phe Asp Tyr His Ala Gln Glu Phe Leu Leu Gly Tyr Leu Leu Asn

625 630 635 640

Trp Leu Pro His Ala Leu Ser Lys Thr Asn Thr Tyr Val Phe Glu Tyr

645 650 655

Gln Pro Ala Leu Tyr Phe Gly Val Leu Leu Ser Cys Gln Ser Leu Glu

660 665 670

Tyr Leu Ala Ser Lys Asn Leu Lys Leu Cys Tyr Val Phe Ala Ala Ala

675 680 685

Val Ala Leu Leu Thr Ala Ala Phe Phe Arg Leu Ser Ala Pro Leu Met

690 695 700

Tyr Gly Leu Lys Trp Gln Glu Leu Tyr Cys Val Ala Val Ser Thr Ala

705 710 715 720

Ala Arg Gln Ser Ile Asp Cys Ser Val Tyr Ser Glu

725 730

<210>91

<211>2241

<212>DNA

<213>Ogataea minuta

<400>91

atgtccgagt cagagctgag aaaccgcaaa gctactctgg gaactgcgtt tcaagatgag 60

tcgactggac cgaaagaaga gagtcacttg gatcaaaaat cgttagccag aagagggtgg 120

gtccaactga tcaccacgta tgttgaacca gtggcaggtc cccttttctt cactgtcctg 180

gctgcgtatc tgagactcta tgatctcaaa gccaacaatc gagtggtctg ggacgaggct 240

cattttggca aatttggagc ccagtacttg agacacgaat tttaccacga cgtccatccg 300

ccgctgggga aaatgctgtg cggactgagc gagtatctgg caggctacaa tggcagttct 360

gagggtttca atttcgagag cggaaaagaa tatccggatc accttgacta tgcctcgatg 420

agatcgttcg ggacttggtt cagcactctg gtcattcctg tctgctattt cacatgcaaa 480

tcgctcaatt tcaacctaca gaccacctat ctagtttcga caatgtgctg tctggagaac 540

tcgtacattg cgctgggaaa gttcatactg ctggactcca tgctgatgtt gttcacgggg 600

actacgtttt tctgtctcgt caaaacccac acgctgcggg cgcaggagtt ctccaccaga 660

tggactcttt ggatgtgtct gaccggagtt tcaactggct gtgtttgctc ggtgaaatgg 720

gtcggtctgt ttgtcacgct acttgttgga gcatacacgg tgctagagct atggctgaaa 780

ttctggtcca aggagttcaa gacagccagg tacttgaaaa gctgggtttt cagagcagtg 840

agtctgatct tcatcccagc tctcgtttat ttgatattct tcaaggtaca tttctcgctc 900

ctgacccgga ccgggacggg agcgggctct ttgtcgtctc tttaccaggc cagcatggag 960

gacgcggaca tcctggatta cccgagaaac gttgctattg gctcgcgcat cactctcaga 1020

tctcaaggcc cctcgcccag tcttttgcac tcgcaccagt ctgtctatcc cgcaggatcg 1080

gaacagtacc aggtgacaac ctacgggttc aaagactcca acaacaactt tctggtgaaa 1140

aaagcccgga cacctttcaa atatggagag ttcgtctcca acggcgacct gattcgactt 1200

cagcacgagc taacccgagg aaacctccat tctcacgcca tcaacggaca tgtttccaag 1260

cagttctggg aggtgagcgg gtacggaaac gaggaaatcg gggacgacaa ggatgattgg 1320

gaggtgatta ttgcggagca gctcaaatct cctaactcga cctattcagc gctgcacgag 1380

tcgtccccag aattctaccg cacggtccac ccgatctcca ctagcttcaa gttgcgccac 1440

aaggttttag gctgctacct ggccaccaca gggcactcgt atccgacatg gggctttaaa 1500

caaggcgagg tgatctgtaa accggcggag tcgctcttga acccgctgga caaatcgacc 1560

tggtggaacg tcgagcttca cgacaacagc ggtctgaaag tagacccagg ctaccaatac 1620

ccccgtcccc ggttcttttg ggactttctc tcgattcaaa tggccatgat ggcctcgaac 1680

aacgctttgg ttccagaccc gcacaaacag gacgatatag cctccagttg gtgggagtgg 1740

ccgacgttga aacaggggct gaggatgtgc tcttggtctc acggggtggt gcggtactac 1800

ctcctgggaa atccgttttc tacgtggttc agcacttttt gcattggcgc tctgctggtg 1860

ctgatggctc gctggacgct cctctggcaa agacagatcc tcgttctcac cgaaaaccag 1920

gcctggactt taaccatgaa agccgttgtt ccgctcatgg ggtgggcttt ccactacctt 1980

ccattcgtcg tgatgggaag ggtgacgtat taccaccatt acatgccggc tttgtacttt 2040

gctttcttcg tgacgggctt tgtagtcgaa cattcggtcg ctcgtttcgg aggggtttac 2100

acgggaaagt tggtctatct agtactttgg ggctgtgtgt gctacagctt ctggctgttc 2160

agtccgcttt gtttggggat gcacggaatg acgtcgctct atcgtcatct caactgggtt 2220

tccacctggc gtatagctta g 2241

<210>92

<211>746

<212>PRT

<213>Ogataea minuta

<400>92

Met Ser Glu Ser Glu Leu Arg Asn Arg Lys Ala Thr Leu Gly Thr Ala

1 5 10 15

Phe Gln Asp Glu Ser Thr Gly Pro Lys Glu Glu Ser His Leu Asp Gln

20 25 30

Lys Ser Leu Ala Arg Arg Gly Trp Val Gln Leu Ile Thr Thr Tyr Val

35 40 45

Glu Pro Val Ala Gly Pro Leu Phe Phe Thr Val Leu Ala Ala Tyr Leu

50 55 60

Arg Leu Tyr Asp Leu Lys Ala Asn Asn Arg Val Val Trp Asp Glu Ala

65 70 75 80

His Phe Gly Lys Phe Gly Ala Gln Tyr Leu Arg His Glu Phe Tyr His

85 90 95

Asp Val His Pro Pro Leu Gly Lys Met Leu Cys Gly Leu Ser Glu Tyr

100 105 110

Leu Ala Gly Tyr Asn Gly Ser Ser Glu Gly Phe Asn Phe Glu Ser Gly

115 120 125

Lys Glu Tyr Pro Asp His Leu Asp Tyr Ala Ser Met Arg Ser Phe Gly

130 135 140

Thr Trp Phe Ser Thr Leu Val Ile Pro Val Cys Tyr Phe Thr Cys Lys

145 150 155 160

Ser Leu Asn Phe Asn Leu Gln Thr Thr Tyr Leu Val Ser Thr Met Cys

165 170 175

Cys Leu Glu Asn Ser Tyr Ile Ala Leu Gly Lys Phe Ile Leu Leu Asp

180 185 190

Ser Met Leu Met Leu Phe Thr Gly Thr Thr Phe Phe Cys Leu Val Lys

195 200 205

Thr His Thr Leu Arg Ala Gln Glu Phe Ser Thr Arg Trp Thr Leu Trp

210 215 220

Met Cys Leu Thr Gly Val Ser Thr Gly Cys Val Cys Ser Val Lys Trp

225 230 235 240

Val Gly Leu Phe Val Thr Leu Leu Val Gly Ala Tyr Thr Val Leu Glu

245 250 255

Leu Trp Leu Lys Phe Trp Ser Lys Glu Phe Lys Thr Ala Arg Tyr Leu

260 265 270

Lys Ser Trp Val Phe Arg Ala Val Ser Leu Ile Phe Ile Pro Ala Leu

275 280 285

Val Tyr Leu Ile Phe Phe Lys Val His Phe Ser Leu Leu Thr Arg Thr

290 295 300

Gly Thr Gly Ala Gly Ser Leu Ser Ser Leu Tyr Gln Ala Ser Met Glu

305 310 315 320

Asp Ala Asp Ile Leu Asp Tyr Pro Arg Asn Val Ala Ile Gly Ser Arg

325 330 335

Ile Thr Leu Arg Ser Gln Gly Pro Ser Pro Ser Leu Leu His Ser His

340 345 350

Gln Ser Val Tyr Pro Ala Gly Ser Glu Gln Tyr Gln Val Thr Thr Tyr

355 360 365

Gly Phe Lys Asp Ser Asn Asn Asn Phe Leu Val Lys Lys Ala Arg Thr

370 375 380

Pro Phe Lys Tyr Gly Glu Phe Val Ser Asn Gly Asp Leu Ile Arg Leu

385 390 395 400

Gln His Glu Leu Thr Arg Gly Asn Leu His Ser His Ala Ile Asn Gly

405 410 415

His Val Ser Lys Gln Phe Trp Glu Val Ser Gly Tyr Gly Asn Glu Glu

420 425 430

Ile Gly Asp Asp Lys Asp Asp Trp Glu Val Ile Ile Ala Glu Gln Leu

435 440 445

Lys Ser Pro Asn Ser Thr Tyr Ser Ala Leu His Glu Ser Ser Pro Glu

450 455 460

Phe Tyr Arg Thr Val His Pro Ile Ser Thr Ser Phe Lys Leu Arg His

465 470 475 480

Lys Val Leu Gly Cys Tyr Leu Ala Thr Thr Gly His Ser Tyr Pro Thr

485 490 495

Trp Gly Phe Lys Gln Gly Glu Val Ile Cys Lys Pro Ala Glu Ser Leu

500 505 510

Leu Asn Pro Leu Asp Lys Ser Thr Trp Trp Asn Val Glu Leu His Asp

515 520 525

Asn Ser Gly Leu Lys Val Asp Pro Gly Tyr Gln Tyr Pro Arg Pro Arg

530 535 540

Phe Phe Trp Asp Phe Leu Ser Ile Gln Met Ala Met Met Ala Ser Asn

545 550 555 560

Asn Ala Leu Val Pro Asp Pro His Lys Gln Asp Asp Ile Ala Ser Ser

565 570 575

Trp Trp Glu Trp Pro Thr Leu Lys Gln Gly Leu Arg Met Cys Ser Trp

580 585 590

Ser His Gly Val Val Arg Tyr Tyr Leu Leu Gly Asn Pro Phe Ser Thr

595 600 605

Trp Phe Ser Thr Phe Cys Ile Gly Ala Leu Leu Val Leu Met Ala Arg

610 615 620

Trp Thr Leu Leu Trp Gln Arg Gln Ile Leu Val Leu Thr Glu Asn Gln

625 630 635 640

Ala Trp Thr Leu Thr Met Lys Ala Val Val Pro Leu Met Gly Trp Ala

645 650 655

Phe His Tyr Leu Pro Phe Val Val Met Gly Arg Val Thr Tyr Tyr His

660 665 670

His Tyr Met Pro Ala Leu Tyr Phe Ala Phe Phe Val Thr Gly Phe Val

675 680 685

Val Glu His Ser Val Ala Arg Phe Gly Gly Val Tyr Thr Gly Lys Leu

690 695 700

Val Tyr Leu Val Leu Trp Gly Cys Val Cys Tyr Ser Phe Trp Leu Phe

705 710 715 720

Ser Pro Leu Cys Leu Gly Met His Gly Met Thr Ser Leu Tyr Arg His

725 730 735

Leu Asn Trp Val Ser Thr Trp Arg Ile Ala

740 745

<210>93

<211>30

<212>DNA

<213>人工序列

<220>

<223>引物

<400>93

caagcttgga cctacaacac gtccgaagaa 30

<210>94

<211>30

<212>DNA

<213>人工序列

<220>

<223>引物

<400>94

cggtaccggt ttgatacctt gggtggcaca 30

<210>95

<211>31

<212>DNA

<213>人工序列

<220>

<223>引物

<400>95

gaagcttact acataattcg tgtacgtgtt c 31

<210>96

<211>31

<212>DNA

<213>人工序列

<220>

<223>引物

<400>96

cggtaccgtc gccgtattgg tcagcaatct c 31

<210>97

<211>39

<212>DNA

<213>人工序列

<220>

<223>引物

<400>97

gtcatgagat ccaagctgat ccctcaatgg agatctact 39

<210>98

<211>39

<212>DNA

<213>人工序列

<220>

<223>引物

<400>98

ggtgtgtggg ggatcgggat gcaaatggat ggctcgaac 39

<210>99

<211>39

<212>DNA

<213>人工序列

<220>

<223>引物

<400>99

gacggtatcg ataagcttga tgcgcggcct tccgacctt 39

<210>100

<211>39

<212>DNA

<213>人工序列

<220>

<223>引物

<400>100

ctggggaagc tcggatccgg ctcgaggtct tcgttcaga 39

<210>101

<211>38

<212>DNA

<213>人工序列

<220>

<223>引物

<400>101

ctagttctag agcggcccag gtcgctttca ggcagcag 38

<210>102

<211>40

<212>DNA

<213>人工序列

<220>

<223>引物

<400>102

caccgcggtg gcggccaagc ttgggtaccg gctcgcgtag 40

<210>103

<211>34

<212>DNA

<213>人工序列

<220>

<223>引物

<400>103

gcagcccggg ggatccacga aaccacgtcc tact 34

<210>104

<211>33

<212>DNA

<213>人工序列

<220>

<223>引物

<400>104

ggggaagctc ggatcgactc atcttgaaac gca 33

<210>105

<211>33

<212>DNA

<213>人工序列

<220>

<223>引物

<400>105

agttctagag cggccttacc accattacat gcc 33

<210>106

<211>40

<212>DNA

<213>人工序列

<220>

<223>引物

<400>106

aattggagct ccaccgcggc cgcaacttac tcgacgctaa 40

<210>107

<211>25

<212>DNA

<213>人工序列

<220>

<223>引物

<400>107

gaacggcact ggtcaacttg gccat 25

<210>108

<211>25

<212>DNA

<213>人工序列

<220>

<223>引物

<400>108

cttcgtggcc gaggagcagg actga 25

<210>109

<211>23

<212>DNA

<213>人工序列

<220>

<223>引物

<400>109

gaattctagc cgagcatgag cta 23

<210>110

<211>26

<212>DNA

<213>人工序列

<220>

<223>引物

<400>110

cgttcagact cttgttgatt ttccac 26

<210>111

<211>25

<212>DNA

<213>人工序列

<220>

<223>引物

<400>111

gctgtgccac tgcacgcctc gactc 25

<210>112

<211>24

<212>DNA

<213>人工序列

<220>

<223>引物

<400>112

cttgtccctc ttgaatggcg agtg 24

<210>113

<211>20

<212>DNA

<213>人工序列

<220>

<223>引物

<400>113

ggaacacgcc aaacatcatg 20

<210>114

<211>19

<212>DNA

<213>人工序列

<220>

<223>引物

<400>114

cacaagcaga atcaggcac 19

<210>115

<211>24

<212>DNA

<213>人工序列

<220>

<223>引物

<400>115

cggtgacgac ttcgactagt cgag 24

<210>116

<211>26

<212>DNA

<213>人工序列

<220>

<223>引物

<400>116

cggtgctgtt ggcgtcgtca tgggtg 26

<210>117

<211>25

<212>DNA

<213>人工序列

<220>

<223>引物

<400>117

ggcgcgttcc aattccactc tgctg 25

<210>118

<211>26

<212>DNA

<213>人工序列

<220>

<223>引物

<400>118

cgacgagtcc tctcaccagg aggttg 26

<210>119

<211>18

<212>DNA

<213>人工序列

<220>

<223>引物

<400>119

tgtgggtgcg atcctgag 18

<210>120

<211>20

<212>DNA

<213>人工序列

<220>

<223>引物

<400>120

gccgtcgttg gagcaaaact 20

<210>121

<211>18

<212>DNA

<213>人工序列

<220>

<223>引物

<400>121

gcatgtgcca ctgctaaa 18

<210>122

<211>19

<212>DNA

<213>人工序列

<220>

<223>引物

<400>122

gaccaacttt cccgtgtaa 19

Claims

1.一种转化的宿主细胞，其包含激活的HAC1基因和RRBP1基因。

2.根据权利要求1的转化的宿主细胞，其包含以下激活的HAC1基因(1)和RRBP1基因(2)：

(1)选自下面(a)至(d)的激活的HAC1基因：

(a)编码由SEQ ID NO：23所示的氨基酸序列组成的蛋白的基因；

(2)选自下面(e)至(h)的RRBP1基因：

(e)编码人或狗来源的RRBP1的基因；

3.根据权利要求1的转化细胞，其包含以下激活的HAC1基因(1)和RRBP1基因(2)：

(1)选自下面(i)至(1)的激活的HAC1基因：

(2)选自下面(e)至(h)的RRBP1基因：

(e)编码人或狗来源的RRBP1的基因；

4.根据权利要求1-3中任一项的转化的宿主细胞，其中所述宿主细胞是真核细胞。

5.根据权利要求4的转化的宿主细胞，其中所述真核细胞是酵母。

6.根据权利要求5的转化的宿主细胞，其中所述酵母是甲醇同化酵母。

7.根据权利要求6的转化的宿主细胞，其中所述甲醇同化酵母是Ogataea minuta。

8.根据权利要求5的转化的宿主细胞，其中所述酵母是啤酒糖酵母。

9.根据权利要求1-8中任一项的转化的宿主细胞，其包含导入其中的编码外源蛋白的基因。

10.根据权利要求9的转化的宿主细胞，其中所述外源蛋白是多聚体蛋白。

11.根据权利要求10的转化的宿主细胞，其中所述多聚体蛋白是异多聚体。

12.根据权利要求11的转化的宿主细胞，其中所述异多聚体是抗体或其功能片段。

13.一种生产蛋白的方法，其包含，在培养基中培养根据权利要求9-12中任一项的转化的宿主细胞，和从培养产物进行靶蛋白取样。

14.根据权利要求13的方法，其中在抑制蛋白O-甘露糖基转移酶(PMT)活性的条件下进行培养。

15.根据权利要求14的方法，其中通过向培养基中添加蛋白O-甘露糖基转移酶(PMT)活性的抑制剂，抑制PMT活性。

16.编码甲醇同化酵母的激活的HAC1蛋白的基因。

17.选自下面(a)至(d)的基因：

(a)编码由SEQ ID NO：23所示的氨基酸序列组成的蛋白的基因；

18.包含根据权利要求17的基因的表达载体。

19.根据权利要求18的表达载体，它是pOMexPGHy/Hac1。

20包含激活的HAC1基因和RRBP1基因的表达载体。

21.根据权利要求20的表达载体，其中所述激活的HAC1基因是根据权利要求17的基因。

22.根据权利要求20的表达载体，其中所述激活的HAC1基因是编码啤酒糖酵母、里氏木霉或构巢曲霉的激活的HAC1蛋白的基因或其同源基因。

23.根据权利要求20的载体，它是YEp351GAP-II-aHAC1/p180。

24.根据权利要求20的表达载体，其中所述RRBP1基因是人或狗来源的RRBP1基因或其同源基因。

25.一种转化的宿主细胞，其中已经导入了根据权利要求18-24中的任一项的表达载体。

26.一种转化的宿主细胞，其中已经导入了包含激活的HAC1基因的表达载体和包含RRBP1基因的表达载体。

27.根据权利要求26的转化的宿主细胞，其中所述包含激活的HAC1基因的表达载体是根据权利要求18或19的表达载体。

28.根据权利要求26的转化的宿主细胞，其中所述激活的HAC1基因是编码啤酒糖酵母、里氏木霉或构巢曲霉的激活的HAC1蛋白的基因或其同源基因。

29.根据权利要求26的转化细胞，其中所述RRBP1基因是人或狗来源的RRBP1基因或其同源基因。

30.一种生产转化的宿主细胞的方法，其包含下述步骤：

(A)向宿主细胞中导入激活的HAC1基因；和

(B)向宿主细胞中导入RRBP1基因。

31.根据权利要求30的方法，其中所述激活的HAC1基因是下述基因中的任一个：

(1)根据权利要求17的基因；

32.根据权利要求30的方法，其中所述RRBP1基因是下述基因中的任一个：

(1)编码人或狗来源的RRBP1的基因；

33.根据权利要求30-32中的任一项的方法，其中所述宿主细胞是真核细胞。

34.根据权利要求33的方法，其中所述真核细胞是酵母。

35.根据权利要求34的方法，其中所述酵母是甲醇同化酵母。

36.根据权利要求35的方法，其中所述甲醇同化酵母是Ogataeaminuta。

37.根据权利要求34的方法，其中所述酵母是啤酒糖酵母。

38.选自下面(a)至(d)的基因：

(a)编码由SEQ ID NO：70所示氨基酸序列组成的蛋白的基因；

39.包含根据权利要求38的基因的表达载体。

40.根据权利要求39的表达载体，它是pOMexPGHy/PpHac1。

41.一种生产蛋白的方法，其包含，在抑制O-糖链合成的条件下，在培养基中培养已经导入激活的HAC1基因和/或RRBP1基因和编码外源蛋白的基因的转化细胞，和从培养产物进行靶蛋白取样。

42.根据权利要求41的生产蛋白的方法，其中通过插入灭活PMT基因来抑制O-糖链合成。

43.根据权利要求41的生产蛋白的方法，其中通过向培养基中添加PMT活性的抑制剂来抑制O-糖链合成。

44.根据权利要求41的生产蛋白的方法，其中通过插入灭活PMT基因和向培养基中添加PMT活性的抑制剂来抑制O-糖链合成。

45.根据权利要求43或44的生产蛋白的方法，其中所述PMT活性的抑制剂是5-[[3，4-(1-苯基甲氧基)苯基]亚甲基]-4-氧代-2-硫代-3-噻唑烷乙酸或{(5Z)-4-氧代-5-3-(1-苯基乙氧基)-4-(2-苯基乙氧基)亚苄基]-2-硫代-1，3-噻唑烷-3-基}乙酸。

46.一种转化的宿主细胞，其具有插入灭活的PMT基因和导入其中的激活的HAC1基因。

47.根据权利要求46的转化细胞，其中所述宿主细胞是Ogataeaminuta。