CN101163790A

CN101163790A - 在宿主细胞中表达克隆的改进方法

Info

Publication number: CN101163790A
Application number: CNA2006800086839A
Authority: CN
Inventors: 罗埃尔弗·伯恩哈德·梅玛; 蒂鲍特·乔斯·维恩策尔; 科尼利斯·玛丽亚·雅各布斯·沙吉; 约翰尼斯·翰德里克·德温德; 奥斯卡·保罗·柯伊伯斯; 鲁特格尔·简·洛尔延范; 马若兰·科纳拉·迪克; 布伦达·沃恩克
Original assignee: DSM IP Assets BV
Current assignee: DSM IP Assets BV
Priority date: 2005-03-18
Filing date: 2006-03-20
Publication date: 2008-04-16

Abstract

帝斯曼知识产权资产管理有限公司B.V.24403WO，在宿主细胞中表达克隆的改进方法，本发明涉及高度适用于经改进的表达克隆方法中的启动子DNA序列和利用该启动子的经改进的表达克隆方法，所述经改进的表达克隆方法用于分离下述DNA序列，所述DNA序列包含在宿主细胞中编码目的蛋白质的DNA序列。所述经分离的DNA序列适用于制造目的蛋白质的方法。

Description

在宿主细胞中表达克隆的改进方法

技术领域

本发明涉及高度适合用于下述方法的启动子，所述方法通过表达克隆鉴定编码目的蛋白质的DNA序列。

背景技术

已知数量递增的基于表达克隆的筛选方法。这类方法先前被成功地用于在例如Bacillus(比较US 4,469,791、WO2005/38024)和E.coli(例如WO 95/18219和WO 95/34662)中鉴定原核基因产物。WO2005/38024描述筛选分泌蛋白质的重组Bacillus细胞的方法。然而，该方法缺乏高通量自动化检测技术。酵母也被用作用于表达克隆真核基因的宿主细胞。Strasser等(Eur.J.Biochem.(1989)184：699-706)报导了通过在酵母Saccharomyces cerevisiae中表达克隆真菌基因组DNA来鉴定真菌α-淀粉酶。类似地，WO 93/11249报导了通过在S.cerevisiae中表达克隆真菌cDNA来鉴定真菌纤维素酶。最近，描述了在丝状真菌中的表达克隆(WO99/32617)。

在所有这些方法中，在可分离分泌具有目的特性蛋白质的转化体之前，不得不筛选大量转化体。因此存在对下述表达克隆方法的需要，所述方法可最优化检测编码被分泌蛋白质的DNA序列的机会。

附图简述

图1.描述了pPhtrA-gfp-amyE。该分泌报告子载体包含与GFP可操作连接的B.subtilis htrA启动子。该载体对pPhtrB-gfp-amyE是有代表性的。

图2.用于分泌-胁迫的B.subtilis报告子菌株的结构。htr启动子与GFP基因融合，最终产生质粒pPhtrA-gfp-amyE和pPhtrB-gfp-amyE。产生的质粒通过相应htr基因座中的单交换重组整合进Bacillus宿主细胞染色体中，得到VT210A和VT210B细胞。Cmr代表氯霉素抗性基因。

图3.描述了pUBnpr-2，其包含来自Bacillus amyloliquefaciens的中性蛋白酶基因npr(Genbank登录号K 02497)

图4.描述了pUBBAG，其包含来自Bacillus amyloliquefaciens的β-葡聚糖酶基因bag(Genbank登录号M 15674)。

图5.描述了使用荧光激活细胞分选术(Fluorescence Activated CellSorting)对用质粒pUB110(空对照载体)或质粒pKTH10(编码Bacillusamyloliquefaciens的α-淀粉酶基因amyQ)转化的Bacillus subtilis VT210A细胞的分析。y轴描述所观察到的事件数量，x轴描述相对荧光。在图A中，描述了对用空载体pUB110转化的Bacillus subtilis VT210A细胞的分析。在图B中，描述了对用amyQ载体pKTH10转化的Bacillus subtilisVT210A细胞的分析。在图C中，描述了对用1∶20比例的pUB110和pKTH10转化的Bacillus subtilis VT210A细胞混合种群的分析。在图D中，描述了对用pUB110和pKTH10二者转化的Bacillus subtilis VT210A细胞混合种群的细胞分选；细胞分选限制由垂直虚线指示。显示高于所述限制的细胞被分选出来。

图6.描述了对用质粒pUB110(空对照载体)或质粒pKTH10(编码Bacillus amyloliquefaciens的α-淀粉酶基因amyQ)转化的Bacillus subtilisVT210A细胞混合种群的分析。分析通过荧光激活细胞扫描(FluorescenceActivated Cell Scanning)进行。y轴描述所观察到的事件数量，x轴描述相对荧光。

图7.描述了用于在A.niger中表达绿色荧光蛋白(GFP，Chalfie，M et al.，Science(1994)263(5148)：802-805)的pGBFINGFP-2载体。所述FIN载体的主链特征先前描述于WO 99/32617中。

图8.描述了用于在A.niger中表达植酸酶(PHY)(与WO99/32617中所述FytA相同的植酸酶基因PHY)的pGBFIN-32载体。

图9.描述了其中大部分植酸酶基因和整个葡萄糖淀粉酶启动子被去除的pGBFIN-40载体，该载体用作构建A.niger WT载体菌株的孔对照载体。

图10.描述了为确认分泌诱导的启动子身份而进行的Northern印迹分析。

图11.描述了用于在A.niger中基因表达的载体。该载体在构建分泌诱导的A.niger报告子构建体中用作主链。

图12.描述了pGBFINGFPBLE-1克隆载体。该分泌诱导型报告子构建体包含与本发明分泌诱导型启动子1可操作连接的GFP-BLE报告子融合基因。该构建体对于pGBFINGFPBLE-2、pGBFINGFPBLE-3、pGBFINGFPBLE-4和pGBFINGFPBLE-5是代表性的。

图13.描述了pGBTOPSEL-1，该载体用作构建最终分泌诱导型报告子质粒的主链。所述载体的主链特征先前描述于WO 99/32617。

图14.描述了最终分泌报告子构建体pGBTOPGFPBLE-1。该分泌诱导的报告子载体包含与本发明分泌诱导型启动子1可操作连接的GFP-BLE报告子构建体。该载体对pGBTOPGFPBLE-2、pGBTOPGFPBLE-3、pGBTOPGFPBLE-4和pGBTOPGFPBLE-5是代表性的。

图15.描述了含有下述报告子构建体的A.niger共转化体腐草霉素抗性的差异，所述报告子构建体带有与编码细胞内蛋白质(由黑点表示)或细胞外蛋白质(由黑方块表示)的文库构建体结合的分泌诱导型启动子P4。

图16.描述了含有下述报告子构建体的A.niger共转化体腐草霉素抗性的差异，所述报告子构建体带有与编码细胞内蛋白质(由黑点表示)或细胞外蛋白质(由黑方块表示)的文库构建体结合的分泌诱导型启动子P5。

图17.描述了E-PAGE^TM凝胶，其中各图代表包含下述报告子构建体的经共转化的A.niger克隆，所述报告子构建体带有与编码细胞外蛋白质的文库构建体结合的分泌诱导型启动子P1。M代表E-PAGE

预染标准(Invitrogen，U.K.)。

图18.描述了E-PAGE^TM凝胶，其中各图代表包含下述报告子构建体的经共转化的A.niger克隆，所述报告子构建体带有与编码细胞外蛋白质的文库构建体结合的分泌诱导型启动子P3。M代表E-PAGE

预染标准(Invitrogen，U.K.)。

发明内容

启动子DNA序列

根据本发明的第一方面，提供了启动子DNA序列，例如：

(a)以下列表所示的DNA序列：SEQ ID NO：1、SEQ ID NO：2、SEQID NO：20、SEQ ID NO：21、SEQ ID NO：22、SEQ ID NO：23或SEQ IDNO：24，

(b)能够与(a)的DNA序列杂交的DNA序列，

(c)与(a)的DNA序列至少50％同源的DNA序列，

(d)(a)到(c)的DNA序列中任何一种的变体，或

(e)(a)到(d)的DNA序列中任何一种的亚序列。

根据一种优选的实施方案，本发明的启动子序列为这样的一种启动子DNA序列，例如：

(a)以下列表所示的一种DNA序列：SEQ ID NO：1、SEQ ID NO：2、SEQ ID NO：20、SEQ ID NO：21、SEQ ID NO：22、SEQ ID NO：23或SEQ IDNO：24，

(b)能够与(a)的DNA序列杂交的DNA序列，

(c)与(a)的DNA序列至少50％同源的一个DNA序列，

(d)(a)到(c)的DNA序列中任何一种的一个变体，或

(e)(a)到(d)的DNA序列中任何一种的一个亚序列。

在本申请上下文中，启动子DNA序列为下述DNA序列，当该启动子DNA序列与该编码序列可操作连接时，所述DNA序列能够控制编码序列的表达。术语“可操作连接”在本文定义为一种构型，其中启动子DNA序列适当地置于与编码序列相关的位置，使得所述启动子DNA序列指导由所述编码序列编码的多肽的产生。

术语“编码序列”在本文定义为被转录为下述mRNA的核酸序列，所述mRNA置于适当调控序列调控之下时被翻译为多肽。编码序列的边界通常由ATG起始密码子(其通常为mRNA5’末端开放读码框的起点)和转录终止序列(在mRNA 3’末端开放读码框的紧下游)确定。编码序列可包括但不仅限于基因组DNA、cDNA、半合成的、合成的和重组的核酸序列。优选地，启动子DNA序列被定义为位于其连接的编码序列上游的DNA序列，并定义为能够调控该编码序列的表达。

更具体地，术语“启动子”在本文定义为下述DNA序列，所述DNA序列结合RNA聚合酶，并指导聚合酶到达编码多肽的编码序列正确的下游转录起始位点以起始转录。RNA聚合酶能有效催化与编码区适当DNA链互补的信使RNA的装配。术语“启动子”还应被理解为包括用于转录为mRNA后翻译的5’非编码区(启动子和翻译起点之间)、顺式作用转录调控元件如增强子，和其它能够与转录因子相互作用的核苷酸序列。

在一种优选的实施方案中，本发明的启动子DNA序列为来自以下的DNA序列：SEQ ID NO：1、SEQ ID NO：2、SEQ ID NO：20、SEQ IDNO：21、SEQ ID NO：22、SEQ ID NO：23或SEQ ID NO：24。

根据另一优选的实施方案，本发明的启动子DNA序列为能够与以下列表所示的DNA序列杂交并仍保持启动子活性的DNA序列：SEQ ID NO1、SEQ ID NO：2、SEQ ID NO：20、SEQ ID NO：21、SEQ ID NO：22、SEQID NO：23或SEQ ID NO：24。

启动子活性优选通过测量作为编码序列表达结果产生的蛋白质浓度来确定，所述编码序列与启动子可操作连接。或者启动子活性通过测量由编码序列编码的蛋白质的酶活性确定，所述编码序列与启动子可操作连接。根据优选的实施方案，启动子活性(及其强度)通过测量lacZ报告子基因表达来确定(In Luo，Gene 163(1995)127-131或Perkins and Youngman(1986)Proc Natl Acad Sci USA 83：140；或Vagner et al.(1998)Microbiology144：3097中)。根据另一优选的实施方案，通过使用绿色荧光蛋白作为编码序列确定启动子活性(In Microbiology.1999 Mar；145(Pt 3)：729-34.Santerre Henriksen AL，Even S，Muller C，Punt PJ，van den Hondel CA，NielsenJ.Study)。在细菌细胞中，GFP和其它荧光蛋白已广泛用于表达和(动态)蛋白质定位研究(在Southward and Surette(2002)MoI.Microbiol.45：1191中综述)。另外，可通过测量在启动子调控下产生的转录物mRNA水平确定启动子活性。可例如通过Northern印迹、GeneChips^TM(Affymetrix)或斑点阵列技术或定量(实时)PCR测量mRNA水平(J.Sambrook，E.F.Fritsch，and T.Maniatis，2001，Molecular Cloning，A Laboratory Manual，3dedition，Cold Spring Harbor，N.Y.)。最优选地，通过使用Northern印迹的mRNA分析确定启动子活性。

优选地，本发明的(经分离的)启动子DNA序列在非常低严格度条件下，更优选低严格度条件下，更优选中严格度条件下，更优选中-高严格度条件下，甚至更优选高严格度条件下和最优选非常高严格度条件下与下述核酸探针杂交，所述核酸探针在相同条件下与

(i)SEQ ID NO：1、SEQ ID NO：2、SEQ ID NO：20、SEQ ID NO：21、SEQ IDNO：22、SEQ ID NO：23或SEQ ID NO：24，或

(ii)(i)的亚序列，或

(iii)(i)、(ii)的互补链杂交。

术语互补链为本领域技术人员已知，并描述于(J.Sambrook，E.F.Fritsch，and T.Maniatus，1989，Molecular Cloning，A Laboratory Manual，2dedition，Cold Spring Harbor，N.Y.)。SEQ ID NO：1、SEQ ID NO：2、SEQ IDNO：20、SEQ ID NO：21、SEQ ID NO：22、SEQ ID NO：23或SEQ ID NO：24的亚序列可在20个核苷酸和编码区上游SEQ ID NO：1、SEQ ID NO：2、SEQ ID NO：20、SEQ ID NO：21、SEQ ID NO：22、SEQ ID NO：23或SEQ IDNO：24的相应全序列(SEQ ID NO：1、SEQ ID NO：2、SEQ ID NO：20、SEQID NO：21、SEQ ID NO：22、SEQ ID NO：23或SEQ ID NO：24的相应编码区分别在SEQ ID NO：25、SEQ ID NO：26、SEQ ID NO：27、SEQ ID NO：28和SEQ ID NO：29中给出)之间的范围。

SEQ ID NO：1、SEQ ID NO：2、SEQ ID NO：20、SEQ ID NO：21、SEQID NO：22、SEQ ID NO：23或SEQ ID NO：24的核酸序列及其亚序列(如前一段中所定义)可用于设计核酸探针，以从不同属或种的菌株中根据本领域公知方法鉴定和克隆DNA启动子。具体地，这类探针可用于与目的属或种的基因组或cDNA根据标准Southern印迹方法杂交，从而从其中鉴定和分离相应的基因。这类探针可显著短于整个序列，但是应有至少15个，优选至少25个和更优选至少35个核苷酸长。另外，这类探针可用于通过PCR扩增DNA启动子。也可使用更长的探针。可使用DNA、RNA和肽核酸(PNA)探针。典型地，标记探针用于检测相应基因(例如用@32P、@33P、@3H、@35S、生物素或抗生物素蛋白或荧光标记物)。本发明包括这类探针。

因此从这类其它生物中制备的基因组DNA或cDNA可用于筛选下述DNA，所述DNA与上文所述探针杂交并编码多肽。来自这类其它生物的基因组DNA或其它DNA可通过琼脂糖或聚丙烯酰胺凝胶电泳或其它分离技术分离。来自文库或经分离的DNA的DNA可转移至并固定在硝酸纤维素或其它合适的载体材料上。为了鉴定与SEQ ID NO：1、SEQ ID NO：2、SEQ ID NO：20、SEQ ID NO：21、SEQ ID NO：22、SEQ ID NO：23或SEQ IDNO：24或其亚序列同源的克隆或DNA序列，载体材料可用于Southern印迹。就本发明的目的而言，杂交是指DNA序列在非常低到非常高严格度条件下与下述经标记的核酸探针杂交，所述探针对应于SEQ ID NO：1、SEQ ID NO：2、SEQ ID NO：20、SEQ ID NO：21、SEQ ID NO：22、SEQ IDNO：23或SEQ ID NO：24中所示DNA序列，对应于所述DNA序列的互补链，或对应于所述DNA序列的亚序列。在这些条件下与核酸探针杂交的分子使用例如X射线胶片检测。也可使用其它杂交技术，例如使用用于检测的荧光和玻片和/或DNA微阵列作为支持。DNA微阵列杂交检测的一个实例在FEMS Yeast Res.2003 Dec；4(3)：259-69(Daran-Lapujade P，Daran JM，Kotter P，Petit T，Piper MD，Pronk JT.″Comparative genotyping of theSaccharomyces cerevisiae laboratory strains S288C and CEN.PK1 13-7D usingoligonucleotide microarrays″)中给出。另外，PNA微阵列用于杂交的用途描述于Nucleic Acids Res.2003 Oct 1；31(19)：e119(Brandt O，Feldner J，Stephan A，Schroder M，Schnolzer M，Arlinghaus HF，Hoheisel JD，Jacob A.PNA microarrays for hybridisation of unlabelled DNA samples.)。

在一种优选的实施方案中，核酸或DNA探针为SEQ ID NO：1、SEQID NO：2、SEQ ID NO：20、SEQ ID NO：21、SEQ ID NO：22、SEQ ID NO：23或SEQ ID NO：24的DNA序列。在另一实施方案中，核酸探针为具有SEQID NO：1的核苷酸100到150的DNA序列或具有SEQ ID NO：2的核苷酸170到220的DNA序列。

在另一优选的实施方案中，核酸探针为具有以下的DNA序列：

-SEQ ID NO：20的核苷酸996到2797、SEQ ID NO：21的核苷酸996到3561、SEQ ID NO：22的核苷酸997到3536、SEQ ID NO：23的核苷酸1034到3175或SEQ ID NO：24的核苷酸1080到4054，更优选：

-SEQ ID NO：20的核苷酸1496到2497、SEQ ID NO：21的核苷酸1496到3261、SEQ ID NO：22的核苷酸1497到3236、SEQ ID NO：23的核苷酸1534到2875或SEQ ID NO：24的核苷酸1580到3754，甚至更优选：

-SEQ ID NO：20的核苷酸1896到2197、SEQ ID NO：21的核苷酸1896到2861、SEQ ID NO：22的核苷酸1897到2936、SEQ ID NO：23的核苷酸1934到2575或SEQ ID NO：24的核苷酸1980到3454，和最优选：

-SEQ ID NO：20的核苷酸1996到2100、SEQ ID NO：21的核苷酸1996到2300、SEQ ID NO：22的核苷酸1997到2400、SEQ ID NO：23的核苷酸2034到2100或SEQ ID NO：24的核苷酸2080到2800。

根据另一优选的实施方案，探针为位于编码序列上游的SEQ IDNO：20、SEQ ID NO：21、SEQ ID NO：22、SEQ ID NO：23或SEQ ID NO：24的DNA序列的一部分。SEQ ID NO：20、SEQ ID NO：21、SEQ ID NO：22、SEQ ID NO：23或SEQ ID NO：24的相应的编码区分别在SEQ ID NO：25、SEQ ID NO：26、SEQ ID NO：27、SEQ ID NO：28和SEQ ID NO：29中给出。

对于至少100个核苷酸长度的长探针而言，非常低到非常高严格度条件被定义为：依照标准Southern印迹程序，在42℃下5倍SSPE、0.3％SDS、200毫克/ml经剪切且变性的鲑精DNA和甲酰胺中预杂交和杂交，所述甲酰胺对于非常低和低严格度而言为25％，对于中和中-高严格度而言为35％或对于高和非常高严格度而言为50％。对于至少100个核苷酸长度的长探针而言，最后用2倍SSC、0.2％SDS，在至少45℃(非常低严格度)，更优选至少50℃(低严格度)，更优选至少55℃(中严格度)，更优选至少60℃(中-高严格度)，进一步更优选至少65℃(高严格度)和最优选至少70℃(非常高严格度)下对载体材料洗涤三次，每次15分钟。

对于约15个核苷酸到约70个核苷酸长度的短探针而言，严格度条件定义为：在比使用Bolton and McCarthy(1962，Proceedings of the NationalAcademy of Sciences USA 48：1390)算法计算的Tm低5℃到10℃下，在0.9M NaCl、0.09 M Tris-HCl pH 7.6、6 mM EDTA、0.5％NP-40、1倍Denhardfs溶液、1mM焦磷酸钠、1mM磷酸二氢钠、0.1mM ATP和0.2mg/ml酵母RNA中依照标准Southern印迹程序预杂交、杂交和杂交后洗涤。对于约15个核苷酸到约70个核苷酸长度的短探针而言，在6倍SCC加上0.1％SDS中15分钟对载体材料洗涤一次，并使用6倍SSC在低于所计算的Tm 5℃到10℃下洗涤两次，每次15分钟。

根据另一优选的实施方案，首先用来自SEQ ID NO 1、SEQ IDNO：2、SEQ ID NO：20、SEQ ID NO：21、SEQ ID NO：22、SEQ ID NO：23或SEQ ID NO：24的本发明的启动子DNA序列克隆与其可操作连接的天然基因、编码序列或其部分。这可从SEQ ID NO 1、SEQ ID NO：2、SEQ IDNO：20、SEQ ID NO：21、SEQ ID NO：22、SEQ ID NO：23或SEQ ID NO：24或先前定义的其亚序列开始来完成，其中使用该序列作为探针。将所述探针与给定宿主的cDNA或基因组文库杂交，所述宿主为Bacillus、Aspergillus niger或本申请文本中定义的任何其它宿主。一旦天然基因或其部分被克隆，可随后使用其自身作为探针，通过本文所述杂交实验克隆来自其它真菌的它的同源基因。在本发明上下文中，同源基因是指与天然基因至少50％同源的基因。优选地，同源基因与天然基因至少55％同源，更优选至少60％，更优选至少65％，更优选至少70％，进一步更优选至少75％，优选至少约80％，更优选约90％，进一步更优选约95％和最优选约97％。

同源基因编码序列上游的序列为本发明包含的启动子。或者，可通过使用SEQ ID NO 25、SEQ ID NO：26、SEQ ID NO：27、SEQ ID NO：28或SEQ ID NO：29或如前定义的其亚序列，用例如如本文所述的比对或BLAST算法搜索基因组数据库来鉴定与本发明启动子可操作连接的天然基因、编码序列或其部分的序列。随后可使用该经鉴定的序列来鉴定本申请中定义的任何其它真菌宿主中的直向同源基因或同源基因。经鉴定的直向同源基因或同源基因编码序列上游的序列为本发明所包括的启动子。

根据另一优选的实施方案，本发明的启动子DNA序列为来自SEQ IDNO：1、SEQ ID NO：2、SEQ ID NO：20、SEQ ID NO：21、SEQ ID NO：22、SEQ ID NO：23或SEQ ID NO：24并仍然具有较前定义的启动子活性的(经分离的)DNA序列。

根据另一优选的实施方案，本发明的启动子DNA序列为分别来自SEQ ID NO：1、SEQ ID NO：2、SEQ ID NO：20、SEQ ID NO：21、SEQ IDNO：22、SEQ ID NO：23或SEQ ID NO：24的(经分离的)DNA序列，其与位于各自编码区(SEQ ID NO：25、SEQ ID NO：26、SEQ ID NO：27、SEQID NO：28或SEQ ID NO：29)上游的各自相应的DNA序列SEQ IDNO：15、SEQ ID NO：16、SEQ ID NO：17、SEQ ID NO：18或SEQ ID NO：19的至少部分至少50％同源。优选地，所述DNA序列与位于各自相应编码区上游的SEQ ID NO 15、SEQ ID NO：16、SEQ ID NO：17、SEQ ID NO：18或SEQ ID NO：19的至少部分至少55％同源，更优选至少60％，更优选至少65％，更优选至少70％，进一步更优选至少75％，优选约80％，更优选约90％，进一步更优选约95％，最优选约97％同源。

就本发明目的而言，优选通过Wilbur-Lipman方法(Wilbur andLipman，1983，Proceedings of the National Academy of Science USA 80：726-730)使用LASERGENE.TM.MEGALIGN.TM.软件(DNASTAR，Inc.，Madison，Wis.)用同一性表格和以下多重比对参数确定两个核酸序列之间的同源性程度：缺口惩罚为10和缺口长度惩罚为10。配对比对参数为Ktuple＝3、缺口惩罚＝3和窗口＝20。

根据另一优选的实施方案，本发明的启动子DNA序列来自下述(经分离的)DNA序列，所述分离的DNA序列为位于各自相应编码区上游的SEQ ID NO：1、SEQ ID NO：2、SEQ ID NO：15、SEQ ID NO：16、SEQ IDNO：17、SEQ ID NO：18或SEQ ID NO：19或SEQ ID NO：1、SEQ ID NO：2、SEQ ID NO：15、SEQ ID NO：16、SEQ ID NO：17、SEQ ID NO：18或SEQ IDNO：19的部分的变体。术语“变体启动子”在本文被定义为具有下述核苷酸序列的启动子，所述核苷酸序列包含母体启动子的一个或多个核苷酸的取代、缺失和/或插入，其中所述变体启动子具有大于或小于相应母体启动子的启动子活性。术语“变体启动子”还应包括天然变体和使用本领域公知方法(例如经典诱变、定向诱变和DNA改组(shuffling))体外产生的变体。变体启动子可具有一个或多个突变。各突变为核苷酸的独立取代、缺失和/或插入。向启动子中引入核苷酸取代、缺失和/或核苷酸可使用任何本领域已知方法(例如经典诱变、定向诱变或DNA改组)完成。特别有用的为下述方法，所述方法利用带有目的插入的超螺旋的双链DNA载体和含有所需突变的两个合成引物。各自与载体相反链互补的寡核苷酸引物通过Pfu DNA聚合酶的手段在温度循环中延伸。掺入引物后，产生含有交错切口的经突变的质粒。温度循环之后，用Dpn1处理产物以消化亲代DNA模板并选择含有突变的经合成的DNA，所述Dpn1对经甲基化的和经半甲基化的DNA特异。也可使用本领域已知的其它方法。其它方法的实例为QuickChange^TM定点诱变试剂盒(Stratagene Cloning Systems，La JoIIa，CA)、改变的位点

II体外诱变体系(The Altered

in vitroMutagenesis Systems)(Promega Corporation)或通过使用如Gene.1989 Apr15；77(1)：51-9.(Ho SN，Hunt HD，Horton RM，Pullen JK，Pease LR″Site-directed mutagenesis by overlap extension using the polymerase chain reaction″)所述PCR或使用如Molecular Biology：Current Innovations and Future Trends.(Eds.A.M.Griffin and H.G.Griffin.ISBN 1-898486-01-8 1995 HorizonScientific Press，PO Box 1，Wymondham，Norfolk，U.K.)所述PCR的重叠延伸。根据优选的实施方案，变体启动子为与最初来自SEQ ID NO：1、SEQID NO：2、SEQ ID NO：15、SEQ ID NO：16、SEQ ID NO：17、SEQ ID NO：18或SEQ ID NO：19的启动子序列相比，具有至少一个经修饰的调节位点的启动子。这类调节位点可以整体被去除或如上文所解释被特异突变。从而调节这类启动子变体使得例如其不再被葡萄糖诱导。这类启动子变体和如何获得它们的技术的实例描述于EP 673 429B或WO 94/04673。

启动子变体可以是等位变体。等位变体是指占据相同染色体位点的基因的两种或更多可选择的形式中的任何。等位变体通过突变天然发生，并可由种群中的多态性引起。可通过包含步骤(a)和(b)的以下方法获得变体启动子：(a)在非常低、低、中、中-高、高或非常高严格度条件下将DNA与

(i)SEQ ID NO 1、SEQ ID NO：2、SEQ ID NO：15、SEQ ID NO：16、SEQ ID NO：17、SEQ ID NO：18或SEQ ID NO：19，或

(ii)(i)的亚序列，或

(iii)(i)、(ii)的互补链杂交，和

(b)从所述DNA序列中分离变体启动子。严格度和洗涤条件如本文定义。

本发明的启动子可以是下述启动子，所述启动子的序列可用接头提供，所述接头用于引入特异限制性位点的目的，所述限制性位点便于连接启动子序列和编码多肽的核酸序列编码区。

在另一优选的实施方案中，启动子DNA序列来自SEQ ID NO：1、SEQ ID NO：2、SEQ ID NO：15、SEQ ID NO：16、SEQ ID NO：17、SEQ IDNO：18或SEQ ID NO：19的亚序列。在本文上下文中亚序列优选被定义为位于先前定义的各相应编码序列上游的SEQ ID NO：1、SEQ ID NO：2、SEQ ID NO：15、SEQ ID NO：16、SEQ ID NO：17、SEQ ID NO：18或SEQ IDNO：19的部分。

亚序列优选含有至少约50个核苷酸，或优选至少约100个核苷酸，更优选至少约200个核苷酸，甚至更优选至少约230个核苷酸，甚至更优选至少约250个核苷酸和最优选至少约290个核苷酸。

根据另一优选的实施方案，亚序列与前述句子定义的亚序列区别在于一个或多个来自5’和/或3’端的核苷酸被缺失，所述DNA序列仍具有早先定义的启动子活性。

在另一优选的实施方案中，启动子亚序列为来自翻译起点和/或来自转录起点的“经修剪的(trimmed)”亚序列。修剪启动子并对其功能性分析的实例描述于Gene.1994 Aug 5；145(2)：179-87：the effect of multiple copiesof the upstream region on expression of the Aspergillus niger glucoamylase-encoding gene.Verdoes JC，Punt PJ，Stouthamer AH，van den Hondel CA).

本文所提供的序列信息不应狭义地解释为要求包括错误鉴定的碱基。本文所公开的特异序列可被容易地使用，并最终进行进一步的序列分析从而鉴定测序错误，以从丝状真菌(特别是Aspergillus niger)中分离最初的DNA序列。

除非另有说明，所有通过测序本文DNA分子确定的核苷酸序列都是使用自动DNA测序仪确定的。因此，如本领域已知，对于通过该自动途径确定的任何DNA序列而言，本文确定的任何核苷酸序列可能含有一些错误。通过自动化确定的核苷酸序列通常与经测序DNA分子的实际核苷酸序列至少约90％相同，更典型地至少约95％相同到至少约99.9％相同。可通过其它手段更为精确地确定实际序列，包括本领域公知的手工DNA测序方法。

本领域技术人员能够鉴定这类被错误鉴定的碱基，并知道如何改正这类错误。

功能性核酸等同物可典型地含有不改变其涉及的生物学功能的突变。术语“功能性等同物”还包括A.niger DNA序列的直向同源物。A.nigerDNA序列的直向同源物为能够从其它菌株或物种中分离，并具有类似或相同生物学活性的DNA序列。

还可通过使用“序列比较算法”确定同源(类似或同一)序列。可例如通过Smith & Waterman，Adv.Appl.Math.2：482(1981)的局部同源性算法、通过Needleman & Wunsch，J.MoI.Biol.48：443(1970)的同源性比对算法、通过Pearson & Lipman，Proc.Nat′l Acad.Sci.USA 85：2444(1988)的搜索相似性算法、通过这些算法的计算机实现(GAP，BESTFIT，FASTA，andTFASTA in the Wisconsin Genetics Software Package，Genetics ComputerGroup，575 Science Dr.，Madison，Wl)或通过目测进行用于查询序列的最佳比对。适用于确定序列相似性的算法的实例为BLAST算法，其描述于Altschul，et al.，J.MoI.Biol.215：403-410(1990)。或者，其它程序可用于本文较早描述的序列比对。用于进行BLAST分析的软件通过National Centerfor Biotechnology Information(http://www.ncbi.nlm.nih.gov/)可公开获得。该算法涉及首先通过鉴定查询序列中W长度的短字词鉴定高分序列对(HSP)，所述短字在与数据库序列中相同长度的字相比时，匹配或满足一些正值阈分值T。这些最初的相邻字击中(word hits)被用作为寻找含有它们的更长HSP的起点。字击中在两个方向上沿两条被比较序列中的各条延伸，直至积累的比对评分可以提高。当累积的比对评分从达到的最大值减少数量X时；累积的比对评分降为零或低于零时；或到达任一序列末端时，字击中的延伸停止。BLAST算法参数W、T和X确定比对的敏感性和速度。BLAST程序使用11的字长(W)、50的BLOSUM62评分矩阵(参阅Henikoff & Henikoff，Proc.Natl.Acad.Sci.USA 89：10915(1989))比对(B)、10的期望值(E)、M＝5、N＝-4和双链比较作为默认值。然后BLAST算法进行两条序列间相似性的统计分析(参阅例如Karlin &Altschul，Proc.Nat′l.Acad.Sci.USA 90：5873-5787(1993))。由BLAST算法提供的一种相似性测量为最小和概率(P(N))，其提供了对两个核苷酸或氨基酸序列间偶然发生匹配的可能性的指示。例如，如果在测试氨基酸序列与蛋白质(如蛋白酶)氨基酸序列的比较中最小和可能性为小于约0.1，更优选小于约0.01和最优选小于约0.001时，认为氨基酸序列与蛋白质(如蛋白酶)相似。

优选地，变体启动子的相似性为与具有SEQ ID NO：1、SEQ IDNO：2、SEQ ID NO：15、SEQ ID NO：16、SEQ ID NO：17、SEQ ID NO：18或SEQ ID NO：19的DNA序列之一至少40％同源。更优选地，相似性为与具有SEQ ID NO：1、SEQ ID NO：2、SEQ ID NO：15、SEQ ID NO：16、SEQ IDNO：17、SEQ ID NO：18或SEQ ID NO：19的DNA序列至少50％，更优选至少60％，更优选至少70％，更优选至少80％，更优选至少90％和更优选至少95％或至少98％同源。

除天然存在的启动子序列等位变体外，技术人员知道：可通过突变将改变引入来自SEQ ID NO：1、SEQ ID NO：2、SEQ ID NO：15、SEQ IDNO：16、SEQ ID NO：17、SEQ ID NO：18或SEQ ID NO：19的启动子序列中，而本质上不改变其启动子功能。

本发明的启动子序列可得自任何属的微生物。就本发明的目的而言，在本文中与给定来源结合使用术语“得自”应指多肽由所述来源制造或由来插入了自所述来源的基因的细胞制造。优选微生物为原核生物。优选的原核生物为Bacillus和E.coli。优选的Bacilli为Bacillus subtilis、Bacillusamyloliquefaciens、Bacillus licheniformis、Bacillus alcalophilus、Bacillusclausii、Bacillus brevis、Bacillus circulans、Bacillus firmus、Bacilluspumilis、Bacillus stearothermophilus、Bacillus megaterium、Bacilluslentus或Bacillus thuringiensis。

或者，启动子序列得自真核生物，优选真菌来源，并更优选来自酵母菌株，如Candida、Hansenula、Kluyveromyces、Pichia、Saccharomyces、Schizosaccharomyces或Yarrowia菌株；或更优选地，来自丝状真菌菌株，如Acremonium、Aspergillus、Aureobasidium、Cryptococcus、Filibasidium、Fusarium、Humicola、Magnaporthe、Mucor、Myceliophthora、Neocallimastix、Neurospora、Paecilomyces、Penicillium、Piromyces、Schizophyllum、Talaromyces、Thermoascus、Thielavia、Tolypocladium或Trichoderma菌株。

在优选的实施方案中，启动子序列得自Saccharomycescarlsbergensis、Saccharomyces cerevisiae、Saccharomyces diastaticus、Saccharomyces douglasii、Saccharomyces kluyveri、Saccharomycesnorbensis、Saccharomyces oviformis、Saccharomyces bayanus、Saccharomyces bayanus，var.uvarum或Saccharomyces pastorianus菌株。

在另一优选的实施方案中，启动子序列得自Aspergillus aculeatus、Aspergillus awamori、Aspergillus foetidus、Aspergillus japonicus、A.nidulans、A.niger优选A.niger CBS 513.88、A.sojae、Aspergillus oryzae(A.oryzae)、Humicola insolens、Humicola lanuginosa、Mucor miehei、Myceliophthora thermophila、Neurospora crassa、Penicilliumpurpurogenum、Trichoderma harzianum、Trichoderma koningii、Trichoderma longibrachiatum、Trichoderma reesei或Trichoderma viride菌株。

在另一优选的实施方案中，启动子序列得自Fusarium bactridioides、Fusarium cerealis、Fusarium crookwellense、Fusarium culmorum、Fusariumgraminearum、Fusarium graminum、Fusarium heterosporum Fusariumnegundi、Fusarium oxysporum、Fusarium reticulatum、Fusarium roseum、Fusarium sambucinum、Fusarium sarcochroum、Fusarium sporotrichioides、Fusarium sulphureum、Fusarium torulosum、Fusarium trichothecioides、Fusarium venenatum菌株。

应当理解：对于上述物种而言，本发明包括完美和不完美的状态，和其它分类学等价物(例如无性型)，而无论其被已知的物种名如何。本领域技术人员会容易地识别合适等价物的性质。公众可以在大量培养物收集中容易地得到这些物种的菌株，所述培养物收集如美国模式培养物保藏单位(ATCC)、Deutsche Sammlung von Mikroorganismen und ZellkulturenGmbH(DSM)、Centraalbureau Voor Schimmelcultures(CBS)和AgriculturalResearch Service Patent Culture Collection，Northern Regional Research Center(NRRL)。

此外，可使用上述探针从其它来源中鉴定或获得根据本发明的启动子序列，所述其它来源包括从自然(例如土壤、堆肥、水等)中分离的微生物。用于从天然生境中分离微生物的技术为本领域公知。然后可类似地筛选另一微生物的基因组DNA文库得到核酸序列。一旦用探针检测到了编码启动子的核酸序列，则可通过使用本领域常规技术人员已知地技术分离或克隆该序列(参阅例如Sambrook et al.，1989，上文)。

在本发明中，启动子DNA序列还可以是杂交启动子，其包含一个或多个本发明启动子的部分；本发明启动子的部分和另一已知启动子的部分(如一个启动子的前导序列和来自另一启动子的转录起始位点)；或本发明一个或多个启动子的部分和一个或多个其它启动子的部分。其它启动子可以是在所选的宿主细胞中显示转录活性的任何启动子序列，包括变体的、截短的和杂交启动子，并可得自编码与所述宿主细胞同源或异源的细胞外或细胞内多肽的基因。其它启动子序列对于编码多肽的核酸序列来说可以是同源或异源的，并可对细胞来说是同源或异源的。

作为一种优选的实施方案，经鉴定的启动子的重要调节亚序列可与其它“基本”启动子融合以增强它们的启动子活性(例如描述于MolMicrobiol.1994May；12(3)：479-90.Regulation of the xylanase-encoding xlnAgene of Aspergillus tubigensis.de Graaff LH，van den Broeck HC，van OoijenAJ，Visser J.)

适用于用本发明启动子构建杂交启动子的其它启动子的其它实例包括得自下述基因的启动子：A.oryzae TAKA淀粉酶、Rhizomucor miehei天冬氨酸蛋白酶、A.niger中性α-淀粉酶、A.niger酸稳定α-淀粉酶、A.niger或Aspergillus awamori葡萄糖淀粉酶(glaA)、A.niger gpdA、A.niger葡萄糖氧化酶goxC、Rhizomucor miehei脂酶、A.oryzae碱性蛋白酶、A.oryzae磷酸丙糖异构酶、A.nidulans乙酰胺酶和Fusarium oxysporum胰蛋白酶样蛋白酶(WO 96/00787)以及NA2-tpi启动子(来自A.niger中性α-淀粉酶基因的启动子和A.oryzae磷酸丙糖异构酶的杂种)、Saccharomycescerevisiae烯醇化酶(ENO-1)、Saccharomyces cerevisiae半乳糖激酶(GAL1)、Saccharomyces cerevisiae醇脱氢酶/甘油醛-3-磷酸盐脱氢酶(ADH2/GAP)和Saccharomyces cerevisiae 3-磷酸甘油酸酯激酶，及其突变体、截短的启动子和杂交启动子。适用于酵母宿主细胞的其它启动子由Romanos et al.，1992，Yeast 8：423-488描述。其它用于细菌细胞的有用启动子为以下基因的启动子：B.subtilis碱性蛋白酶(apr)、B.subtilis中性蛋白酶(npr)、B.amyloliquefaciens α-淀粉酶(amyQ)、B.amyloliquefaciens碱性蛋白酶(apr)和B.amyloliquefaciens中性蛋白酶(npr)。

在本发明中，启动子DNA序列还可以是“串联启动子”。“串联启动子”在本文中被定义为两个或更多启动子序列，其各与编码序列可操作连接并介导编码序列到mRNA的转录。

串联启动子包含两个或更多本发明的启动子，或者一个或多个本发明的启动子和一个或多个其它已知启动子，如上举例适用于构建杂交启动子的那些。串联启动子的两个或更多启动子序列可同时启动核酸序列的转录。或者串联启动子的一个或多个启动子序列可在细胞生长的不同阶段、或在真菌宿主的情况下时在菌丝体形态学上不同的部分、或在成孢子的细菌(如bacilli)中孢子发育中不同的细胞区室内启动核酸序列的转录。

在本发明中，启动子可编码序列和/或对宿主细胞可以是外源的。本发明的变体、杂交或串联启动子应被理解为对编码多肽的DNA序列外源，即使野生型的启动子对编码序列或对宿主细胞是内源的。

本发明的变体、杂交或串联启动子具有为来自SEQ ID NO：1、SEQ IDNO：2、SEQ ID NO：20、SEQ ID NO：21、SEQ ID NO：22、SEQ ID NO：23或SEQ ID NO：24和早先定义的任何启动子的至少约20％，优选至少约40％，更优选至少约60％，更优选至少约80％，更优选至少约90％，更优选至少约100％，进一步更优选至少约200％，最优选至少约300％，和进一步最优选至少约400％的启动子活性。启动子活性优选如先前所述来确定。最优选启动子活性使用Norhtern印迹通过mRNA分析确定。

DNA构建体

根据第二个方面，本发明提供下述DNA构建体，所述构建体包含与赋予可选择性状的报告基因可操作连接的如上部分所述的本发明启动子DNA序列。报告基因可以是对合适宿主赋予可选择性状的任何基因。优选报告基因为选择性标记基因。

“DNA构建体”在本文中被定义为单链或双链的核酸分子，其分离自天然存在的基因，或其经修饰而含有以天然不存在的方式组合和并置的核酸片段。

当DNA构建体含有编码序列和编码序列表达所需的全部调控序列时，术语“DNA构建体”与术语“表达盒”同义。在本申请上下文中，术语“DNA构建体”与术语“经分离的DNA构建体”可互换使用，其中两个术语理解为同义。

DNA构建体可包含选择性标记基因，其允许容易选择经转化的宿主细胞。DNA构建体包含两个选择性标记基因时，技术人员会理解这两个选择性标记基因不相同：与本发明启动子连接的第一个选择性标记基因用于本发明的筛选方法中，DNA构建体中存在的第二个选择性标记基因允许经转化的宿主细胞的标准选择。

报告基因与本发明的启动子DNA序列可操作连接，从而在给定的宿主细胞中所述报告基因能够在启动子DNA序列调控下表达。由报告子基因编码的多肽对宿主细胞和/或对启动子DNA序列可以是同源或异源的。

在本文上下文中“一个”是指“至少一个”。因此DNA构建体包含至少一个报告基因。宿主可与至少两个DNA构建体共转化，其中一个包含选择性标记而另一个包含与报告基因连接的本发明启动子。或者根据更优选的实施方案，DNA构建体中包含的报告基因为包含至少一部分一个报告基因和至少一部分第二个报告基因的杂交报告基因，其中第一个和第二个报告基因的编码序列按读码框彼此配对，且其中所述杂交报告基因与本发明启动子可操作连接。第一个和/或第二个报告基因可以是赋予合适宿主可选择性状的任何基因。用于真菌的优选杂交报告基因包括Streptoalloteichus hindustanis(Drocourt et al.，NAR，1990)的GFP基因和腐草霉素抗性基因(BLE)。

选择性标记或可选择标记为下述基因，所述基因的产生提供抗微生物剂或病毒抗性、对重金属的抗性、对营养缺陷型的原养型等。用于原核宿主细胞的合适可选择标记包括但不仅限于卡那霉素、新霉素、红霉素和其它MLS型标记物(大环内酯-林肯酰胺-蜜柑霉素B)、氯霉素、氨苄西林、四环素、链霉素和壮观霉素。用于酵母的合适标记物为ADE2、HIS3、LEU2、LYS2、MET3、TRP1和URA3。用于在丝状真菌宿主细胞中使用的可选择标记物包括但不仅限于amdS(乙酰胺酶)、argB(鸟氨酸氨甲基转移酶)、bar(膦丝菌素乙酰转移酶)、hygB(潮霉素磷酸转移酶)、niaD(硝酸盐还原酶)、pyrG(乳清苷-5′-磷酸脱羧酶)、sC(硫酸腺嘌呤基转移酶)、trpC(邻氨基苯甲酸合酶)及其等效物。也可使用提供针对例如腐草霉素、潮霉素B或G418抗性的标记。优选用于Aspergillus细胞的为A.nidulans或A.oryzae的amdS和pyrG基因和Streptomyces hygroscopicus的bar基因。amdS标记基因优选应用EP 635574B或WO 97/06261中所述技术使用。优选的选择性标记基因为与A.nidulans gpdA启动子融合的A.nidulans amdS编码序列(EP635 574B)。也可使用来自其它丝状真菌的amdS基因(WO 97/06261)。

根据另一优选的实施方案，报告基因编码用于如上所述的原核、酵母和/或丝状真菌细胞的可选择标记物。或者报告基因编码如下的报告子蛋白：β-半乳糖苷酶、β-葡萄糖苷酸酶、水母发光蛋白、绿色荧光蛋白(GFP)及其变体(红色、氰基、黄色荧光蛋白)、萤光素酶、lux、血红素、β-内酰胺酶或碱性磷酸酶。更优选地，报告基因为或包含编码荧光报告子蛋白的基因，所述荧光报告子蛋白例如但不仅限于GFP、YFP和CFP(分别为绿色、黄色和氰基荧光蛋白质)。转化体将显示荧光并可使用光电管分选技术(FACS，荧光活化的细胞分选)从非表达克隆中分离。该方法的一个重要优点为：不需要将转化混合物涂布平板(其显著的提高了筛选方法的通量)，并且阳性克隆可直接排列为MTP形式用于进一步的自动化处理。或者报告基因编码(跨)膜蛋白或细胞壁蛋白，抗体可出现在其上。可使用磁细胞分选技术(，Magnetic cell sorting，www.miltenyibiotec.com)从非表达转化体中分离显示所述膜蛋白的转化体。

调控元件

DNA构建体除启动子DNA序列外可进一步包含一种或多种调控序列，其在宿主细胞中在与调控序列相容的条件下指导报告基因的表达。表达应被理解为包括多肽产生中涉及的任何步骤，其包括但不仅限于转录、转录后修饰、翻译、翻译后修饰和分泌。一个或多个调控序列对编码序列或宿主来说可以是内源的。或者可以用一个或多个对核酸序列外源的调控序列代替一个或多个调控序列，用于改善编码序列在宿主细胞中的表达。

术语“调控序列”在本文中被定义为包括编码序列(如报告基因)表达必需或有利的所有组件，包括本发明的启动子。各调控序列对编码多肽的编码序列来说可以是内源的或外源的。这类调控序列包括但不仅限于前导序列、最佳翻译起始序列(如Kozak，1991，J.Biol.Chem.266：19867-19870中所述)、多腺苷酸化序列、前肽序列、信号肽序列、上游激活序列、本发明的启动子(包括其的变体、片段和杂交和串联启动子)和转录终止子。调控序列最少包括转录和翻译终止信号和本发明启动子(部分)。调控序列可以与用于引入特异限制性位点目的的接头一起提供，所述限制性位点便于连接调控序列与编码多肽的编码序列(如报告基因)的编码区。

调控序列可以是合适的转录终止子序列，即被宿主细胞识别终止转录的序列。终止子序列与编码多肽的编码序列3’末端可操作连接。任何在所选宿主细胞中有功能的终止子可用于本发明。

技术人员会理解序列的5’端和3’端根据各编码序列定义。对于给定的终止子序列和给定的编码序列而言，技术人员会知道如何将它们可操作连接在一起。

用于丝状真菌宿主细胞的优选终止子得自A.oryzae TAKA淀粉酶、A.niger葡萄糖淀粉酶、A.nidulans邻氨基苯甲酸合酶、A.niger α-葡萄糖苷酶、trpC基因和Fusarium oxysporum胰蛋白酶样蛋白酶基因。

用于酵母宿主细胞的优选终止子得自以下基因：Saccharomycescerevisiae烯醇化酶、Saccharomyces cerevisiae细胞色素C(CYC1)和Saccharomyces cerevisiae甘油醛-3-磷酸盐脱氢酶。用于酵母宿主细胞的其它有用终止子由Romanos et al，1992，上文描述。调控序列还可为合适的前导序列，即mRNA的非翻译区，其对宿主细胞翻译是重要的。前导序列与编码多肽的核酸序列5’末端可操作地连接。在所选宿主细胞中有功能的任何前导序列可用于本发明。

用于丝状真菌宿主细胞的优选前导序列得自A.oryzae TAKA淀粉酶、A.nidulans磷酸丙糖异构酶和A.niger葡萄糖淀粉酶基因。

用于酵母宿主细胞的合适前导序列来自Saccharomyces cerevisiae烯醇化酶(ENO-1)、Saccharomyces cerevisiae 3-磷酸甘油酸酯激酶、Saccharomyces cerevisiaeα-因子和Saccharomyces cerevisiae醇脱氢酶和甘油醛-3-磷酸酯脱氢酶(ADH2/GAP)基因。

调控序列还可以是聚腺苷酸化序列，所述序列与核酸序列3’末端可操作连接。用于丝状真菌宿主细胞的优选的聚腺苷酸化序列得自A.oryzaeTAKA淀粉酶、A.niger葡萄糖淀粉酶、A.nidulans邻氨基苯甲酸合酶、Fusarium oxysporum胰蛋白酶样蛋白酶和A.nidulans α-葡萄糖苷酶。

用于酵母宿主细胞的有用聚腺苷酸化序列由Guo and Sherman，1995，Molecular Cellular Biology 15：5983-5990描述。

还可期望添加调节序列，其允许多肽表达的调节与宿主细胞的生长相关。调节体系的实例为响应化学或物理刺激(包括调节化合物的存在)引起基因的表达被打开或关闭的那些。原核体系中的调节体系包括E.coli的lac和trp操纵子体系，和B.subtilis的spac、xyl、sacB和citM体系(在Meima et al.(2004)Expression Systems in Bacillus.In″Protein ExpressionTechnologies.Current status and future trends″(F.Baneyx，ed.)，HorizonBioscience，Wymondham，Norfolk，UK，pp.199-252中综述)。在杆菌中中适用于调控表达的其它启动子为在营养饥饿条件下被诱导的启动子，如分别位于磷酸盐和氮调控下的Pho调节子和TnrA/GlnR体系。在酵母中可使用ADH2体系或GAL1体系。在丝状真菌中，可使用如US 5,503,991中所述的TAKA α-淀粉酶启动子、A.niger葡萄糖淀粉酶启动子、A.oryzae葡萄糖淀粉酶启动子、A.tubingensis木聚糖内切酶(xlnA)启动子、A.niger硝酸盐还原酶(niaD)启动子、Trichoderma reesei纤维二糖水解酶启动子和A.nidulans醇和醛脱氢酶(分别为alcA和aldA)作为调节序列。调节序列的其它实例为允许基因扩增的调节序列。在真核体系中，这些调节序列包括二氢叶酸还原酶基因(其在存在甲氨喋呤时被扩增)和金属硫蛋白基因(其在有重金属时被扩增)。在这些情况下，编码多肽的核酸序列应与调节序列可操作地连接。

本发明启动子DNA序列中的内源调节序列可以被去除，例如去除creA结合位点(如早先在EP 673 429B中所述的碳分解代谢物阻遏)、改变pacC和areA(用于pH和氮调节)。在B.subtilis中，碳代谢物阻遏(CCR)涉及CcpA蛋白质与cre元件的结合。cre元件与木糖诱导型的xyl启动子组合用于开发表达体系，所述表达体系允许双重调控目的基因(Bhavsar et al.(2001)Appl Environ Microbiol67：403)。

优选地，DNA构建体包含本发明的启动子DNA序列、与所述启动子DNA序列可操作连接的编码序列和翻译调控序列，如：

-选自以下序列列表的依照5’到3’方向的一种翻译终止序列：TAAG、TAGA和TAAA，优选TAAA，和/或

-选自以下序列列表的依照5’到3’方向的一种翻译起始编码序列：GCTACCCCC；GCTACCTCC；GCTACCCTC；GCTACCTTC；GCTCCCCCC；GCTCCCTCC；GCTCCCCTC；GCTCCCTTC；GCTGCCCCC；GCTGCCTCC；GCTGCCCTC；GCTGCCTTC；GCTTCCCCC；GCTTCCTCC；GCTTCCCTC；和GCTTCCTTC，优选GCT TCC TTC和/或

-选自以下序列列表的一种转录起始序列：5′-mwChkyCAAA-3′、5′-mwChkyCACA-3′或5′-mwChkyCAAG-3′，其中采用针对核苷酸的不确定编码：m(A/C)；w(A/T)；y(C/T)；k(G/T)；h(A/C/T)，优选5′-CACCGTCAAA-3′或5′-CGCAGTCAAG-3′。

在本发明上下文中，术语“翻译起始编码序列”被定义为DNA编码序列开放读码框的起始子或起始密码子紧邻上游的九个核苷酸。起始子或起始密码子编码AA甲硫氨酸。起始密码子典型地为ATG，但是也可以是任何功能性起始密码子如GTG。

在本发明上下文中，术语“翻译终止序列”被定义为从开放读码框或核苷酸编码序列3’端翻译终止密码子开始的，并依照5’到3’方向的三个或四个核苷酸。

在本发明上下文中，术语“翻译起始序列”被定义为编码多肽的DNA序列开放读码框起始子或起始密码子紧邻下游的十个核苷酸。起始子或起始密码子编码甲硫氨酸这种氨基酸。起始密码子典型为ATG，但是也可以是任何功能性起始密码子，如GTG。本领域公知在RNA中尿嘧啶U代替脱氧核苷酸胸腺嘧啶T。

用于原核生物的优选调控序列已在EP 284 126A中描述。

本发明还涉及重组表达载体，其包含与报告基因可操作连接的本发明启动子和转录和翻译起始和终止信号。上述多种报告基因和调控序列可以结合在一起，产生下述重组表达载体，所述重组表达载体可包括一个或多个便利的限制性位点，所述限制性位点允许在这类位点处插入或取代启动子和/或报告基因。或者可通过例如Gene.1989 Apr 15；77(1)：51-9.Ho SN，Hunt HD，Horton RM，Pullen JK，Pease LR″Site-directed mutagenesis byoverlap extension using the polymerase chain reaction″中所述的使用PCR的序列重叠延伸(SOE-PCR)，或通过使用Gateway^TM克隆体系(Invitrogen)克隆完成编码序列和启动子的融合。

重组表达载体可以是能够转化宿主细胞的任何载体。对载体的选择典型地会取决于载体与其被引入的宿主细胞间的相容性。载体可以是线性或闭环质粒。载体可以是整合的或自主复制的载体。

载体可以是自主复制载体(即作为染色体外实体存在时其复制不依赖于染色体复制)例如质粒、染色体外因子、微型染色体或人工染色体。自主复制载体可包含确保自主复制的任何手段。载体可以是引入宿主细胞时被整合进基因组，并与其被整合进的染色体一起复制的载体。另外，可以使用包含要引入宿主细胞基因组中全部DNA或转座子的单个载体或质粒或两个或更多的载体或质粒，或转座子。自主维持克隆载体的一个实例为包含AMA1-序列的克隆载体。AMA1为从A.nidulans分离的6.0kb基因组DNA片段，其能够在Aspergillus中自主维持(参阅例如Aleksenko andClutterbuck(1997)，Fungal Genet.Biol.21：373-397)。适用于在革兰氏阳性细菌如B.subtilis和B.amyloliquefaciens中表达的自主复制载体的实例为葡萄球菌载体pUB110(McKenzie et al.(1986)Plasmid 15：93)和内源B.subtilis质粒pTA1015、pTA1040和pTA1060和来自它们的载体(例如pHB201；Bron et al.(1998)J Biotechnol 64：3)。

本发明的载体优选含有下述元件，所述元件允许载体稳定整合进宿主细胞基因组或允许载体在细胞中独立于基因组自主复制。

就整合进宿主细胞基因组而言，载体可依赖于启动子序列和/或报告基因序列或载体的任何其它元件，用于通过同源重组或非同源重组将载体稳定整合进基因组。或者载体可含有用于指导通过同源重组整合进宿主细胞基因组的额外的核酸序列。所述额外的核酸序列使得载体能够在染色体中精确的靶位点整合进宿主细胞基因组。为了提高精确位点整合的可能性，整合元件应优选含有足够数量的核酸，例如20到50个，优选55到95个，优选100到1,500个碱基对，优选400到1,500个碱基对，更优选800到1,500个碱基对并最优选至少2kb，所述核酸与宿主细胞基因组中预先确定的靶基因座的DNA序列同源。整合元件可以是与宿主细胞基因组中靶序列同源的任何序列。另外，整合元件可以是非编码或编码核酸序列。为了促进靶向的整合，克隆载体优选在转化宿主细胞之前线性化。线性化优选以下述方式进行：克隆载体的至少一端(但是优选两端)侧翼为与靶位点同源的序列。

优选地，表达载体中与靶位点同源的整合元件来自高度表达的基因座，即它们来自能够在真菌宿主细胞中高水平表达的基因。能够有高表达水平的基因(即高表达的基因)在本文中定义为下述基因，所述基因的mRNA可占据总细胞mRNA的至少0.5％(w/w)(例如在经诱导的条件下)，或者，所述基因的基因产物可占据总细胞蛋白质的至少1％(w/w)，或在经分泌的基因产物情况下，所述基因的基因产物可分泌至至少0.1g/l的水平(如EP 357127B1中所述)。大量优选的高表达真菌基因以实例的方式给出：淀粉酶、葡萄糖淀粉酶、醇脱氢酶、木聚糖酶、磷酸甘油醛脱氢酶或来自Aspergilli或Trichoderma的纤维二糖水解酶基因。用于这些目的的最优选的高表达基因为葡萄糖淀粉酶基因，优选A.niger葡萄糖淀粉酶基因、A.oryzae TAKA-淀粉酶基因、A.nidulans gpdA基因、SEQ IDNO：25、SEQ ID NO：26、SEQ ID NO：27、SEQ ID NO：28和SEQ ID NO：29基因座，优选SEQ ID NO：25、SEQ ID NO：26、SEQ ID NO：27、SEQ IDNO：28和SEQ ID NO：29的A.niger基因座或Trichoderma reesei纤维二糖水解酶基因。

或者，载体可以通过非同源重组整合进宿主细胞基因组。

或者，和/或与上述实施方案组合，可在本发明步骤(e)中针对制造(优选分泌)目的蛋白质对细胞进行生产(筛选)后，从宿主细胞中缺失下述DNA构建体，所述DNA构建体包含与本发明启动子可操作连接的报告基因。步骤(e)稍后描述。这使得宿主细胞能够直接用于制造目的蛋白质，而所述宿主细胞不包含报告基因和/或可选择标记基因。为了能够缺失本发明的DNA构建体，DNA构建体优选包含报告基因和DNA重复之间的双向可选择标记。DNA重复允许通过内染色体同源重组缺失DNA构建体。该方法与EP 0635574所述的″MARKER-GENE FREE″方法类似。

对自主复制而言，载体可以还包含允许载体在所述宿主细胞中自主复制的复制起点。用于酵母宿主细胞的复制起点实例为2微米复制起点、ARS1、ARS4、ARS1和CEN3的组合，和ARS4和CEN6的组合。复制起点可以是具有下述突变的复制起点，所述突变使宿主细胞中复制起点的功能对于温度敏感(参阅例如Ehrlich，1978，Proceedings of the NationalAcademy of Sciences USA 75：1433)。

可将多于一个拷贝的本发明DNA构建体插入宿主细胞中。这可通过优选将数拷贝DNA序列整合进其基因组中，更优选通过将DNA序列的整合靶向高表达基因座(优选葡萄糖淀粉酶基因座或SEQ ID NO：25、SEQID NO：26、SEQ ID NO：27、SEQ ID NO：28和SEQ ID NO：29的基因座)中完成。或者这可通过在核酸序列中包含可扩增的可选择标记基因，使细胞含有经扩增的拷贝的可选择标记基因，并从而可通过例如在存在适当可选择剂时培养细胞用于选择额外拷贝的核酸序列。为了进一步提高要过表达的DNA序列的拷贝数，可使用如WO98/46772中所述的基因转换技术。

用于连接上述元件以构建本发明重组表达载体的方法为本领域技术人员公知(参阅例如Sambrook et al.，1989，上文)。

宿主细胞

本发明还涉及用上一部分定义的DNA构建体转化的重组宿主细胞，所述DNA构建体包含与报告基因可操作连接的本发明的启动子DNA序列。优选地，经转化的宿主细胞还包含包含下述DNA序列的额外的DNA构建体，所述DNA序列包含来自下述生物DNA文库的编码序列，所述生物可能能够制造一种或多种具有目的特性的蛋白质。

这类细胞可有利地用于下一部分中描述的表达克隆方法中。包含与报告基因可操作连接的本发明启动子DNA序列的表达载体被引入宿主细胞。再用包含下述DNA序列的DNA构建体或表达载体转化宿主细胞，所述DNA序列包含来自DNA文库的编码序列。如先前所述，DNA构建体或表达载体均作为染色体整合体或作为自我复制染色体外载体。宿主细胞的选择在很大程度上取决于其中制造了DNA文库的生物和/或取决于所使用的启动子DNA序列的来源。

宿主细胞可以是任何微生物。优选地，宿主细胞与制备DNA文库的宿主细胞相同，和/或与如说明书中早先定义的本发明启动子来源的宿主细胞为相同生物。根据一种优选的实施方案，宿主细胞为原核生物或真核生物。根据一种更优选的实施方案，适用于本发明方法的宿主细胞为原核生物，更优选地，在启动子部分定义为启动子来源的原核生物。更优选地，原核宿主细胞为Bacillus宿主细胞，优选地，Bacillus Subtilis、Bacilluslicheniformis和/或Bacillus amyloliquefaciens种。

根据另一更优选的实施方案，适用于本发明方法的宿主细胞为真菌。

宿主细胞可以是野生型丝状真菌宿主细胞或变体、突变体或经遗传修饰的丝状真菌宿主细胞。在本发明优选的实施方案中，宿主细胞为蛋白酶缺陷或蛋白酶负型菌株。这可以是称为“alp”的碱性蛋白酶基因被缺失的蛋白酶缺陷菌株Aspergillus oryzae JaL 125(描述于WO 97/35956或EP429490)或公开于WO 96/14404中的A.niger三肽基氨基肽酶(TRAP)缺陷菌株。另外，根据本发明也考虑WO 01/68864中描述的转录激活子(prtT)产生减少的宿主细胞。另一特别考虑的宿主菌株为Aspergillus oryzaeBECh2，其中出现在亲本菌株IF04177中的三个TAKA淀粉酶基因被灭活。另外，两个蛋白酶(碱性蛋白酶和中性金属蛋白酶11)通过基因破坏被破坏。通过突变破坏了形成代谢产物环并偶氮酸和曲酸的能力。BECh2描述于WO 00/39322并来自JaL228(描述于WO 98/12300)，所述JaL228也是US 5,766,912中公开为A1560的IF04177的突变体。

任选地，丝状真菌宿主细胞与野生型细胞相比包含提高的解折叠蛋白应答(UPR)以增强目的多肽的生产能力。UPR可通过US2004/0186070A1和/或US2001/0034045A1和/或WO01/72783A2和/或WO2005/123763中描述的技术提高。更具体地，HAC1和/或IRE1和/或PTC2的蛋白质水平被调节，和/或SEC61蛋白质被设计从而获得具有提高的UPR的宿主细胞。

或者，或与提高的UPR一起，宿主细胞可通常被遗传修饰以获得下述表型，所述表型与野生型细胞相比显示更低的蛋白酶表达和/或蛋白酶分泌，从而增强目的多肽的制造能力。这类表型可通过缺失和/或修饰和/或灭活蛋白酶表达的转录调节子获得。这类转录调节子为例如prtT。通过调节prtT降低蛋白酶的表达可通过US2004/0191864A1和EP2005/055145中所述技术进行。

或者，或与提高的UPR和/或显示更低蛋白酶表达和/或蛋白酶分泌的表型一起，宿主细胞显示草酸盐缺陷表型，从而增强目的多肽的制造量。草酸盐缺陷表型可通过WO2004/070022A2和WO2000/50576中描述的技术获得。

或者，或与提高的UPR和/或显示更低蛋白酶表达和/或蛋白酶分泌和/或草酸盐缺陷的表型一起，宿主细胞显示与野生型细胞相比表型差异的组合，从而提高目的多肽的制造量。这些差异可包括，但不仅限于降低的葡萄糖淀粉酶和/或中性α-淀粉酶A和/或中性α-淀粉酶B、α-1、6转葡萄糖基酶、蛋白酶和草酸水解酶的表达。所述由宿主细胞显示的表型差异可根据US2004/0191864A1中所述技术通过遗传修饰获得。

或者，或与上述表型组合，核酸构建体通过同源重组靶向整合进入宿主细胞基因组(即整合进预先确定的靶位点)的效率优选通过宿主细胞的增强的同源重组能力提高。细胞的这类表型优选涉及WO2005/095624中描述的缺陷hdfA或hdfB基因。WO2005/095624公开了获得具有提高的靶向整合能力的丝状真菌细胞的优选方法。

更优选地，本发明的宿主细胞选自以下列表：Bacillus、酵母和丝状真菌，优选Aspergillus、Penicillium或Trichoderma种。进一步更优选Aspergillus宿主细胞为Aspergillus niger或Aspergillus sojae或Aspergillusoryzae种。

本发明还涉及重组的宿主细胞，所述宿主细胞包含多于一个本发明的启动子DNA序列，各启动子与一个报告基因可操作连接。这类宿主细胞可有利地用于下一部分种所述的表达克隆方法中。可通过多种方法转化细菌细胞，包括化学诱导的感受态(例如CaCl₂)或电穿孔(Sambrook et al.(1989)″Molecular Cloning：a laboratory manual″，Cold Spring HarborLaboratories，Cold Spring Harbor，New York)、原生质体转化(Chang andCohen(1979)Mol Gen Genet 168：111)以及，在一些Bacillus种的情况下为天然感受态(Spizizen(1958)Proc Natl Acad Sci USA 44：1072)。可通过下述方法转化真菌细胞，所述方法涉及原生质体形成、原生质体转化和以本身已知的方式再生细胞壁。用于转化Aspergillus宿主细胞的合适方法描述于EP 238 023和Yelton et al.，1984，Proceedings of the National Academyof Sciences USA 81：1470-1474。使用Agrobacterium tumefaciens转化Aspergillus和其它丝状真菌宿主细胞的合适方法描述于例如Nat Biotechnol.1998 Sep；16(9)：839-42.Erratum in：Nat Biotechnol 1998 Nov；16(11)：1074.Agrobacterium tumefaciens-mediated transformation of filamentous fungi，deGroot MJ，Bundock P，Hooykaas PJ，Beijersbergen AG.Unilever ResearchLaboratory Vlaardingen，The Netherlands。用于转化Fusarium种的合适方法描述于Malardier et al.，1989，Gene 78：147-156和WO 96/00787。可使用Becker and Guarente，In Abelson，J.N.and Simon，M.I.，editors，Guide toYeast Genetics and Molecular Biology，Methods in Enzymology，Volume 194，pp 182-187，Academic Press，Inc.，New York；lto et al.，1983，Journal ofBacteriology 153：163；和Hinnen et al.，1978，Proceedings of the NationalAcademy of Sciences USA 75：1920中描述的方法转化酵母。原核生物的转化可如EP 284 126A中所述进行。

表达克隆方法

根据另一方面，本发明提供用于在宿主细胞中分离包含下述DNA序列的DNA序列的方法，所述DNA序列编码目的蛋白质，所述方法包含步骤：

(a)制备第一DNA构建体，其包含与赋予可选择性状的报告基因可操作连接的启动子DNA序列；当所述DNA构建体存在于宿主细胞中和当宿主细胞产生目的蛋白质(优选地，被分泌的目的蛋白质)时，所述启动子DNA序列被诱导；

(b)制备第二DNA构建体，其包含包含下述DNA序列的DNA序列，所述DNA序列编码来自下述生物DNA文库的目的蛋白质，所述生物被怀疑能够制造一种或多种目的蛋白质；

(c)用(a)和(b)中制备的两种DNA构建体转化宿主细胞；

(d)在有助于制造DNA文库中存在的目的蛋白质的条件下，培养(c)中获得的所有经转化的宿主细胞；和

(e)通过分析在(d)中制造的蛋白质，筛选制造目的蛋白质的经转化的宿主细胞。

步骤(a)

制备第一DNA构建体，其包含与赋予可选择性状的报告基因可操作连接的启动子DNA序列；当所述DNA构建体存在于宿主细胞中和当宿主细胞产生目的蛋白质(优选地，被分泌的目的蛋白质)时，所述启动子DNA序列被诱导。

第一DNA构建体中存在的启动子为当宿主细胞产生目的蛋白质(优选被分泌当目的蛋白质)时被诱导的启动子。

在本发明中，术语“被诱导的”定义为：在相同培养条件下，与相应对照宿主细胞不(过量)产生目的蛋白质时的启动子活性相比，当宿主细胞(过量)产生(优选分泌)目的蛋白质时，本发明启动子的启动子活性提高。优选地，当宿主细胞中(过量)产生(优选分泌)目的蛋白质时，与相同培养条件下其中不(过量)产生目的蛋白质的相应对照宿主细胞相比，启动子活性提高至少约1.5倍，更优选至少约两倍，更优选至少约三倍，更优选至少约四倍，更优选至少约五倍，进一步更优选至少约六倍，进一步更优选至少约八倍，进一步更优选至少约十倍，进一步更优选至少约二十倍，进一步更优选至少约50倍，以及最优选至少约100倍。更优选地，启动子活性提高是无限的，即当不(过量)产生目的蛋白质时，未检测到启动子活性或启动子是无活性的，而当(过量)产生目的蛋白质时，启动子被诱导。优选如前所述确定启动子活性。最优选使用Northern印迹通过mRNA分析确定启动子活性。

可通过将制造目的蛋白质的细胞的基因表达谱与不制造所述蛋白质的对照菌株的基因表达谱比较，鉴定这类启动子。优选地，这类表达谱使用确立的DNA微阵列分析比较。或者可使用技术人员已知的其它方法(如Northern印迹或定量PCR分析)比较表达谱。比较表达谱的最优选的方法如下进行：首先通过DNA微阵列分析比较表达谱，然后通过Northern印迹随后确证微阵列结果。根据优选的实施方案，启动子为启动子部分描述的本发明的启动子DNA序列。

根据另一优选的实施方案，当宿主细胞为Bacillus细胞时，启动子来自下列基因组DNA序列：htrA(SEQ ID NO：1)或htrB(SEQ ID NO：2)。优选启动子DNA序列来自位于起始密码子上游的这些基因组DNA序列之一的非编码部分，或为位于上游的所述基因组序列的部分。更优选所使用的启动子为SEQ ID NO：1或SEQ ID NO：2的DNA序列。

根据另一优选的实施方案，当宿主细胞为丝状真菌细胞时，启动子来自下列基因组DNA序列：SEQ ID NO：20、SEQ NO：21、SEQ ID NO：22、SEQ ID NO：23或SEQ ID NO：24。优选地，启动子DNA序列来自位于起始密码子上游的这些基因组DNA序列之一的非编码部分，或为位于上游的所述基因组序列的部分。更优选地，所使用的启动子为SEQ IDNO：15、SEQ NO：16、SEQ ID NO：17、SEQ ID NO：18或SEQ ID NO：19的DNA序列或其衍生物。

步骤(a)中制备的第一DNA构建体已经在相应的“DNA构建体”部分中描述，优选地，其包含如“DNA构建体”部分所述赋予可选择性状的报告基因。

步骤(b)

步骤(b)中制备的DNA构建体包含包含下述DNA序列的DNA序列，所述DNA序列编码来自下述生物DNA文库的目的蛋白质，所述生物被怀疑能够制造一种或多种目的蛋白质；可能制造一种或多种目的蛋白质的生物为原核生物或真核生物。优选的原核生物和真核生物的实例早先已在说明书中与本发明启动子的来源一起定义。根据另一优选的实施方案，该生物为Bacillus，更优选地，在启动子部分定义的Bacillus物种。根据另一优选的实施方案，该生物为真核生物，更优选为真菌，其中最优选丝状真菌。

在步骤(b)中制备的DNA构建体，优选包含如“DNA构建体”和“调控元件”部分中定义的调节序列。

在根据本发明的方法中，来自可能制造一种或多种目的蛋白质的DNA片段文库可以是基因组文库或cDNA文库。然而，在真核供体的情况下，优选使用cDNA文库以避免真菌宿主生物中启动子或剪接信号识别的问题。优选从分离自来源生物的mRNA中制备cDNA文库，所述来源生物在有助于目的蛋白质表达的条件下生长。

如果存在在宿主细胞表达蛋白质后可用于检测所述蛋白质的测定法，那么根据本发明的方法可应用于分离编码任何目的蛋白质或多肽的DNA序列。

步骤(c)

要用两种DNA构建体转化的宿主细胞的身份已描述于“宿主细胞”部分中。转化方法已在相同部分中描述。根据一个实施方案，用(a)和(b)中制备的构建体同时转化宿主细胞。或者，并根据另一实施方案，先用步骤(a)制备的DNA构建体转化宿主细胞，然后用用步骤(b)制备的DNA构建体转化宿主细胞。

根据优选的实施方案，宿主细胞为原核生物，优选Bacillus细胞，更优选为Bacillus subtilis，进一步更优选为htrA基因缺陷的Bacillus subtilis(其中htrA基因的至少部分编码区被缺失和/或取代和/或其中htrA基因的编码区仍然存在于所述Bacillus细胞的基因组中)，最优选使用Bacillussubtilis BV2003(Hyyrylainen et al.(2001)MoI Microbiol 41：1159)。

或者，或与先前优选的实施方案结合，宿主细胞为Bacillus细胞，且报告基因编码如DNA构建体部分定义的荧光报告蛋白，最优选GFP。

或者，或与先前优选的实施方案结合，当宿主细胞为Bacillus细胞时，启动子来自以下列表所述基因组DNA序列：htrA(SEQ ID NO：1)或htrB(SEQ ID NO：2)。优选地，启动子DNA序列来自位于起始密码子上游的这两个基因组DNA序列之一的非编码部分，或为位于上游的所述序列的部分。更优选地，所使用的启动子为来自SEQ ID NO：1或SEQ ID NO：2的启动子。根据最优选的实施方案，所使用的启动子和所使用的报告基因为与SEQ ID NO：1可操作连接的GFP，或与SEQ ID NO：2可操作连接的GFP。

根据另一优选的实施方案，所述生物为真核生物，更优选真菌，其中最优选丝状真菌。优选丝状真菌为Aspergillus、Penicillium或Trichoderma种。进一步更优选Aspergillus宿主细胞为Aspergillus niger或Aspergillussojae或Aspergillus oryzae种。最优选的宿主细胞为A.niger，优选CBS513.88或其衍生物。

或者，或与先前优选的实施方案结合，宿主细胞为丝状真菌细胞，报告基因编码如DNA构建体部分所定义的荧光报告蛋白，最优选GFP。或者报告基因编码可选择标记。更优选地，报告基因为荧光蛋白和可选择标记物的杂交报告基因。最优选杂交报告基因包含GFP和Streptoalloteichushindustanis的腐草霉素抗性基因(BLE)(Drocourt etal.，NAR，1990)。

或者，或与先前优选的实施方案结合，当宿主细胞为丝状真菌细胞时，启动子来自以下列表中存在的基因组DNA序列：SEQ ID NO：20、SEQ ID NO：21、SEQ ID NO：22、SEQ ID NO：23或SEQ ID NO：24。优选启动子序列来自位于起始密码子上游的所列基因组DNA序列之一的非编码部分，或为位于上游的部分所述序列。更优选地，所使用的启动子为实施例3到7中所使用的启动子之一，并来自SEQ ID NO：20、SEQ IDNO：21、SEQ ID NO：22、SEQ ID NO：23或SEQ ID NO：24。根据最优选的实施方案，所使用的启动子和所用的杂交报告基因为与启动子SEQ ID NO：15可操作连接的GFP-BLE(SEQ ID NO：61)、与启动子SEQ ID NO：16可操作连接的GFP-BLE、与SEQ ID NO：17可操作连接的GFP-BLE、与启动子SEQ ID NO：18可操作连接的GFP-BLE或与启动子SEQ ID NO：19可操作连接的GFP-BLE。

步骤(d)

用两种DNA构建体转化宿主细胞后，在有助于制造DNA文库中存在的目的蛋白质的条件下，培养所有获得的经转化的宿主细胞。根据检测目的蛋白质所需的测试法，将经转化的克隆传代并储存为固体培养基(例如琼脂平板)上或液体培养基中的菌落，由此在微孔滴定板的孔中培养、储存和/或测试个体文库克隆。

技术人员会理解通常对本领域已知克隆方法的适应可同样应用于本发明的方法中。所述适应包括但不仅限于例如筛选文库克隆池、筛选相同文库得到大量不同的目的蛋白质，以及再筛选、再分离和再克隆阳性克隆以确保更精确的结果。

技术人员可获得多种方法用于从筛选方法中鉴定为经转化的宿主细胞中分离编码目的蛋白质的DNA序列，和用于随后分析所分离的DNA序列。

步骤(e)

在步骤(d)之后，通过分析制造的蛋白质筛选经转化的宿主细胞用于制造目的蛋白质，优选地，分泌目的蛋白质。在步骤(e)中，通过监测由第一DNA构建体中存在的启动子DNA序列诱导的依赖于制造(优选依赖于分泌)的报告子表达，筛选制造(优选分泌)目的蛋白质的经转化的宿主细胞。

根据优选的实施方案，当宿主细胞为Bacillus细胞时，优选使用基于荧光的细胞分析测定法(例如荧光激活的细胞扫描、荧光激活的细胞分选(FACS)或荧光分析)进行筛选，以鉴定制造(优选分泌)目的蛋白质的经转化的宿主细胞，所述筛选通过监测由第一DNA构建体中存在的启动子DNA序列诱导的依赖于制造(优选地，依赖于分泌)的报告子表达。更优选宿主细胞为包含第一DNA构建体的Bacillus细胞，所述DNA构建体包含如SEQ ID NO：1或其衍生物或SEQ ID NO：2或其衍生物的启动子，所述DNA构建体还包含编码荧光报告子的报告基因，并且筛选使用基于荧光的细胞分析测定法进行。进一步更优选地，宿主细胞为Bacillus且第一DNA构建体包含：

-与GFP可操作连接的启动子DNA序列SEQ ID NO：1或其衍生物，或

-与GFP可操作连接的启动子DNA序列SEQ ID NO：2或其衍生物

且筛选使用FACS进行。或者，或与先前的实施方案结合，筛选可使用例如比色测定法或使用选择性培养条件进行。技术人员会理解，根据所使用的报告基因，选择性培养条件是但不仅限于：杀生物剂的使用、抗生素的使用、至少一种营养、原养型。

根据另一优选的实施方案，当宿主细胞为丝状真菌细胞时，优选通过在选择性培养条件下进行筛选，以鉴定制造(优选分泌)目的蛋白质的经转化的宿主细胞，所述筛选通过监测由本发明第一DNA构建体中存在的启动子DNA序列诱导的依赖于制造(优选依赖于分泌)的报告子表达。技术人员会理解基于所使用的报告基因，可相应选择选择性培养条件。选择性培养条件的实例是但不仅限于：使用杀生物剂、使用抗生素、至少一种营养、原养型。或者，或与先前实施方案结合，筛选可使用比色、荧光的(如FACS)或基于酶活性的测定法进行。根据更优选的实施方案，宿主细胞为包含本发明第一DNA构建体的丝状真菌细胞，且筛选使用选择性培养条件进行。更优选地，宿主细胞为包含本发明第一DNA构建体的丝状真菌细胞时，所述DNA构建体包含选自下列的启动子：SEQ IDNO：15或其衍生物、SEQ ID NO：16或其衍生物、SEQ ID NO：17或其衍生物、SEQ ID NO：18或其衍生物、SEQ ID NO：19或其衍生物，所述DNA构建体还包含编码可选择标记的报告基因，且筛选使用选择性培养条件进行。进一步更优选地，宿主细胞为包含本发明第一DNA构建体的丝状真菌细胞，所述DNA构建体包含选自下列的启动子：SEQ ID NO：15或其衍生物、SEQ ID NO：16或其衍生物、SEQ ID NO：17或其衍生物、SEQ IDNO：18或其衍生物、SEQ ID NO：19或其衍生物，所述DNA构建体还包含杂交报告基因如SEQ ID NO：61，且筛选使用选择性培养条件进行。

根据另一更优选的实施方案，宿主细胞为包含本发明第一DNA构建体的A.niger细胞，且筛选使用选择性培养条件进行。更优选地，宿主细胞为包含本发明第一DNA构建体的A.niger细胞，所述DNA构建体包含选自下列的启动子：SEQ ID NO：15或其衍生物、SEQ ID NO：16或其衍生物、SEQ ID NO：17或其衍生物、SEQ ID NO：18或其衍生物、SEQ IDNO：19或其衍生物，所述DNA构建体还包含编码可选择标记的报告子基因，且筛选使用选择性培养条件进行。进一步更优选地，宿主细胞为包含本发明第一DNA构建体的A.niger细胞，所述DNA构建体包含选自下列的启动子：SEQ ID NO：15或其衍生物、SEQ ID NO：16或其衍生物、SEQID NO：17或其衍生物、SEQ ID NO：18或其衍生物、SEQ ID NO：19或其衍生物，所述DNA构建体还包含杂交报告基因如SEQ ID NO：61，且筛选使用选择性培养条件进行。进一步更优选地，宿主细胞为A.niger细胞且第一DNA构建体包含：

-与启动子SEQ ID NO：15可操作连接的杂交报告基因GFP-BLE(SEQID NO：61)，或

-与启动子SEQ ID NO：16或其衍生物可操作连接的GFP-BLE，或

-与启动子SEQ ID NO：17或其衍生物可操作连接的GFP-BLE，或

-与启动子SEQ ID NO：18或其衍生物可操作连接的GFP-BLE，或

-与启动子SEQ ID NO：19或其衍生物可操作连接的GFP-BLE，且筛选使用包含抗生素(优选腐草霉素)作为选择剂的选择性培养条件进行。

通过如上所述本发明的筛选方法分离的DNA序列用于制造目的蛋白质或改善目的蛋白质的制造，所述目的蛋白质由DNA序列编码。有利地，在上述筛选方法中分离的经转化的宿主细胞直接用于制造目的蛋白质的方法中，所述方法通过在有助于制造(优选分泌)目的蛋白质的条件下培养经转化的宿主细胞并可选地回收蛋白质。

根据一种优选的实施方案，宿主细胞能够直接用于制造目的蛋白质，所述宿主细胞不包含报告基因和/或可选择标记基因。因此，在细胞已被筛选用于制造(优选分泌)目的蛋白质后，从宿主细胞中缺失包含与本发明启动子可操作连接的报告基因的DNA构建体。为了能够缺失本发明的DNA构建体，所述DNA构建体优选在DNA重复之间包含报告基因和双向可选择标记基因。DNA重复允许通过内染色体同源重组缺失DNA构建体。该方法与EP 0 635 574B1所述的″MARKER-GENE FREE″方法类似。

在本发明筛选方法中分离的最初经转化的宿主细胞通常会具有足够用于筛选目的，但是可为经济制造目的显著改善的表达水平。为此，将DNA序列插入表达载体中，其随后用于转化合适的宿主细胞。在该表达载体中，DNA序列与适当的表达信号(如启动子、可选的信号序列和终止子)可操作连接，如“DNA构建体”和“调控元件”部分中所定义，所述表达信号能够指导蛋白质在宿主生物中的表达。用于制造蛋白质的合适宿主细胞可以是原核或真核细胞，优选真细菌、酵母或丝状真菌。优选的细菌宿主细胞选自如启动子部分定义的Bacillus属。根据另一优选的实施方案，宿主细胞为已在“宿主细胞”部分中定义的酵母或丝状真菌。优选的酵母宿主细胞选自Saccharomyces、Kluyveromyces、Yarrowia、Pichia和Hansenula属。优选的丝状真菌宿主细胞选自在上文列为用于筛选方法的优选宿主细胞的相同属。更优选地，丝状真菌为Aspergillus、Penicillium或Trichoderma种。进一步更优选地，Aspergillus宿主细胞为Aspergillusniger或Aspergillus sojae或Aspergillus oryzae种。最优选的宿主细胞为A.niger，优选CBS513.88或其衍生物。

通过技术人员可获得的多种流程中的任何流程，用表达载体转化合适的宿主细胞。然后将经转化的宿主细胞用于下述方法，所述方法通过在有助于表达编码蛋白质的DNA序列的条件下培养经转化的宿主细胞来制造目的蛋白质，并可选地回收蛋白质。

优选目的蛋白质为酶。

因此，本发明涉及本发明启动子在表达克隆方法中的用途。

本发明还涉及本发明启动子的其它用途。优选地，本发明启动子可DNA构建体或表达载体(均在前一部分中定义)中与任何编码序列可操作连接。这类DNA构建体或表达载体可被引入在“宿主细胞”部分中定义的任何宿主细胞中，并用于表达给定的有价值化合物。这类有价值化合物的实例为，但不仅限于代谢物或多肽。优选地，与本发明启动子可操作连接的编码序列编码有价值的化合物。或者，并根据本发明另一优选的实施方案，与本发明启动子可操作连接的编码序列涉及有价值化合物的制造。

或者，并根据本发明启动子另一优选的用途，本发明的启动子被整合进灭活或取代构建体中，转化进给定宿主细胞中，并用于灭活或取代靶基因。

本发明由以下实施例进一步说明。

实施例

材料和方法

一般程序

标准分子克隆技术，如DNA分离、凝胶电泳、核酸的限制性酶修饰、Northern分析、E.coli转化等，如Sambrook et al.(2001)″MolecularCloning：a laboratory manual，3d edition″，Cold Spring Harbor Laboratories，Cold Spring Harbor，New York and lnnis et al.(1990)″PCR protocols，a guideto methods and applications″Academic Press，San Diego所述进行。合成的寡脱氧核苷酸得自Invitrogen(Breda，The Netherlands)。室温为20℃±2℃。

Aspergillus niger转化

A.niger转化根据Tilburn，J.et al.(1983)Gene 26，205-221和Kelly，J.&Hynes，M.(1985)EMBO J.，4，475-479所述方法进行，其中采用以下改变：

使孢子发芽并在置于300rpm摇床中的摇瓶中Aspergillus最小培养基(100ml)中在30℃下培养16小时。每升Aspergillus最小培养基含有：6gNaNO₃、0.52g KCl、1.52g KH₂PO₄、1.12ml 4M KOH、0.52gMgSO₄.7H₂O、10g葡萄糖、1g酪蛋白氨基酸、22mg ZnSO₄.7H₂O、11mg H₃BO₃、5mg FeSO₄.7H₂O、1.7mg CoCl₂.6H₂O、1.6mg CuSO₄.5H₂O、5mg MnCl₂.2H₂O、1.5mg Na₂MoO₄.2H₂O、50mg EDTA、2mg核黄素、2mg硫胺-HCl、2mg烟酰胺、1mg吡哆醇-HCL、0.2mg panthotenic acid、4g生物素、10ml青霉素(5000IU/ml)链霉素(5000UG/ml)溶液(Gibco)。

-用Novozym 234^TM(Novo Industries)代替解螺旋酶用于制备原生质体；

-形成原生质体后(60-90分钟)，加入KC缓冲液(0.8M KCl、9.5mM柠檬酸，pH 6.2)至45ml的终体积，在浮桶式转头离心机中在4℃下3000rpm将原生质体悬浮液离心10分钟。原生质体重悬于20ml KC缓冲液中并随后加入25ml STC缓冲液(1.2M山梨糖、10mM Tris-HCI pH7.5，50mM CaCl₂)。在浮桶式转头离心机中在4℃下3000rpm将原生质体悬浮液离心10分钟，在STC缓冲液中洗涤并在STC缓冲液中重悬为10E8原生质体/ml的浓度；

-向200微升原生质体悬浮液中加入溶解在10微升TE缓冲液(10mMTris-HCI pH 7.5，0.1mM EDTA)和100微升PEG溶液(20％PEG 4000(Merck)，0.8M山梨醇，10mM Tris-HCl pH 7.5，50mM CaCl₂)中的DNA片段；

-在室温下将DNA-原生质体悬浮液孵育10分钟后，缓慢加入1.5mlPEG溶液(60％PEG 4000(Merck)，10mM Tris-HCl pH 7.5，50mM CaCl₂)并重复混匀管。在室温下孵育20分钟后，用5ml 1.2M山梨醇稀释悬浮液，颠倒混匀并在室温下4000rpm离心10分钟。将原生质体柔和地重悬于1ml 1.2M山梨醇中并涂布在固体选择性培养基上，所述培养基由不含核黄素、硫胺-HCl、烟酰胺、吡哆醇、panthotenic acid、生物素、酪蛋白氨基酸和葡萄糖的Aspergillus最小培养基组成。对乙酰胺选择而言，培养基含有10mM乙酰胺作为唯一氮源和1M蔗糖作为渗压剂和C源。或者将原生质体涂布于添加有1-50微克/ml腐草霉素和1M蔗糖作为渗压剂的PDA(马铃薯葡萄糖琼脂，Oxoid)上。使用20％琼脂(琼脂No.1，OxoidL1 1)固化再生平板。在30℃下孵育6-10天后，将转化体的分生孢子转移至由含2％葡萄糖和1.5％琼脂糖(Invitrogen)的Aspergillus选择性培养基(在乙酰胺选择的情况下含有乙酰胺作为唯一氮源，或在腐草霉素选择情况下为添加了1-50微克/ml腐草霉素的PDA)上，并在30℃下孵育5-10天。分离单个转化体，并重复一次该选择性纯化步骤，藉此储存经纯化的转化体。

Aspergillus niger微量滴定板发酵和取样

为了获得A.niger的孢子，将菌丝体转移至根据供应商说明制备的填充有150微升固体PDA培养基(马铃薯葡萄糖琼脂，Oxoid)的微量滴定板上。在30℃(静止)生长3-7天后形成孢子。然后向各孔中添加100微升液体发酵培养基(70g/l葡萄糖.H₂O、25g/l蛋白胨(来自酪蛋白)、12.5g/l酵母提取物(Difco)、2g/l K2SO4、1g/l KH₂PO₄、0.5g/lMgSO₄.7H₂O、0.03g/l ZnCL₂、0.02g/l CaCL₂、9mg/l MnSO₄-H₂O、3mg/lFeSO₄.7H₂O，用4N H₂SO₄调至pH 5.6)。上下吸打液体培养基20次以分离培养基中的孢子。将接种过的发酵培养基转移至另一微量滴定板并在34℃、550rpm和80％湿度下在轨道微量滴定板摇床(Infors HT)上孵育6天。在第6天收集上清液并用于检测所分泌的蛋白质。

质谱法分析

将上清液通过离心力在Ultracel滤板(Millipore，Billerica，MA，USA)上超滤。超滤根据制造商提供的流程进行。向经超滤的上清液中添加10微升200mM的碳酸氢铵，pH7.8(Riedel-de Haen AG，Seelze，Germany)和1微升250微克每ml的胰蛋白酶(Worthington，Lakewood，NJ，USA)。将上清液在37℃消化3小时。经消化的上清液以1∶1的比例与10毫克每ml的经再结晶的α-氰-4-羟基苯丙烯酸(？CHCA)(Laser Bio Labs，Sophia-AntipolisCedex，France)溶液混合；从这些混合物中将1微升点在MALDI靶标上。在vMALDI LTQ质谱仪(Thermo electron，Orlando，FL，USA)上用MALDIMS和MALDI MS/MS分析被点的样品。

所获得的MS/MS谱被转化为肽序列，与在预先推定的FASTA蛋白质数据库中可获得的蛋白质序列比较，以鉴定个体酶。

RNA分离

收集在培养皿中20ml液体选择性再生培养基(6g/l NaNO₃，0.52g/lKCl，1.52g/l KH₂PO₄，0.25g/l KOH，0.52g/l MgSO₄.7H₂O，22mg/lZnSO₄.7H₂O，11mg/l H₃BO₃，5mg/l FeSO₄.7H₂O，1.7mg/l CoCl₂.6H₂O，1.6mg/l CuSO₄.5H₂O，5mg/l MnCl₂.2H₂O，1.5mg/l Na₂MoO₄.2H₂O，50mg/lEDTA，341g/l蔗糖，10ml青霉素(5000lU/ml)链霉素(5000UG/ml)溶液(Gibco))上形成的Aspergillus niger菌丝体，用软化水洗涤并在纸巾之间挤压去除多余的水。立刻将菌丝体在液氮中冷冻，并用研钵和研杵研磨成精细的粉末。将产生的粉末转移至无菌的50ml管中并称量，藉此对酶1-1.2g被研磨的菌丝体加入10ml TRIzol试剂(Invitrogen)(每管最多25ml)。立刻通过充分混合(涡旋1分钟)增溶菌丝体粉末，然后室温孵育5分钟并随机搅拌。添加0.2(最初TRIzol)体积的氯仿(从而对每10ml最初使用的TRIzol添加2ml氯仿)，涡旋并在室温下放置10分钟。然后将混合物在4℃，6000g离心30分钟。将上部水相转移至新管中并通过添加0.5(最初TRIzol)体积的100％异丙醇(从而每10ml最初使用的TRIzol添加5ml异丙醇)沉淀总RNA。在室温下沉淀10分钟后，通过在6000g离心30分钟回收RNA。去除上清液后，将RNA沉淀块用一倍(原始TRIzol)体积的70％乙醇洗涤。去除乙醇后，将RNA沉淀块晾干。干燥的RNA沉淀块溶于3ml GTS(100mM Tris-Cl，pH 7.5，4M硫氰酸胍，0.5％十二烷基肌氨酸钠)缓冲液。根据供应商手册使用Rneasy Maxi试剂盒(Qiagen)额外纯化RNA。使用10微升RNA溶液确定核酸的量和浓度。

Aspergillus niger菌株

A.niger WT-1：该A.niger菌株为包含编码葡萄糖淀粉酶(glaA)、真菌淀粉酶和酸性淀粉酶的基因缺失的CBS513.88。A.niger WT-1使用如EP 0635574B1所述的″MARKER-GENE FREE″途径构建。该专利中广泛描述了如何缺失CBS 513.88基因组中的glaA特异DNA序列。第一个步骤得到了MARKER-GENE FREE？glaA重组A.niger CBS 513.88菌株，其最终完全不具有任何外源DNA序列。然后通过EP 0 635 574B1中所述方法从A.niger WT-1基因组中缺失编码真菌淀粉酶和酸性淀粉酶的基因。

如图7到9和11到14所描绘的用于克隆目的构建体的载体含有先前在WO 99/32617中描述的主链特征。

A.niger WT-GFP：该A.niger菌株通过用图7所描述的表达载体pGBFINGFP-2转化A.niger WT-1获得，所述载体含有由葡萄糖淀粉酶启动子驱动的编码公知绿色荧光蛋白(GFP)的基因(Chalfie，M et al.，Science(1994)263(5148)：802-805)。在选择性培养基上纯化后，基于PCR分析选择单拷贝整合体。

A.niger WT-PHY：该A.niger菌株通过用图8所描述的表达载体pGBFIN-32转化A.niger WT-1获得，所述载体包含由葡萄糖淀粉酶启动子驱动的植酸酶基因PHY(与先前在WO 99/32617中描述的FytA相同)。在选择性培养基上纯化后，基于PCR分析选择单拷贝整合体。

A.niger WT-PHY-2：该A.niger菌株通过用图8所描述的表达载体pGBFIN-32转化A.niger WT-1获得，所述载体包含由葡萄糖淀粉酶启动子驱动的植酸酶基因PHY(与先前在WO 99/32617中描述的FytA相同)。在选择性培养基上纯化后，基于PCR分析选择单拷贝整合体。

A.niger WT-载体：该A.niger菌株通过用图9所描述的空对照载体pGBFIN-40转化A.niger WT-1菌株获得。空对照载体pGBFIN-40通过Xhol消化图8中所描述的pGBFIN-32并将最大片段重新连接，从而去除葡萄糖淀粉酶启动子和植酸酶基因PHY的5’部分构建。通过PCR分析选择单拷贝整合体。

实施例1构建Bacillus报告质粒和报告菌株

1.1构建报告质粒pPhtrA-gfp-amyE和pPhtrB-gfp-amyE

首先，如下构建报告质粒pPhtrA-gfp-amyE。使用pSG1151(P.J.Lewisand A.L.Marston，1999；GFP vectors for controlled expression and duallabelling of protein fusions in Bacillus subtilis，Gene 227，101.)作为模板DNA，用以下引物：RN-lacZ-rv(SEQ ID NO：3)，GTGAGCGGATAACAATTTCACACAGG；和 gfp-terminator-rv，(SEQ IDNO： 4)GTGGCTCAGCTTTTTTAAGGAAGGGAGGCTCTCACCTCCCTTCCCTTTATTTGTAGAGC TCATCCATGCC，通过PCR扩增编码最佳化版本GFP——gfpmut-1的基因(P.Cormack，R.H.Valdivia，and S.Falkow，1996；FACS-optimized mutants of the green fluorescent protein(GFP)，Gene 173，33.)，其中所述引物分别得到gfpmut-1上游和下游的KpnI和Bpu1101I位点(黑体)。使用KpnI和Bpu1101I位点将913bp PCR产物连接在下述pDL中，得到pGFP-amyE，所述pDL包含用于位点特异重组的amyE基因座的同源侧翼区(G.Yuan and S.L.Wong，1995；Regulation of groEexpression in Bacillus subtilis：the involvement of the sigma A-like promoterand the roles of the inverted repeat sequence(CIRCE)，J.Bacteriol.177，5427)。使用B.subtilis 168(Bacillus Genetic Stock Center ID：1 A1)的染色体DNA作为模板DNA，通过PCR扩增htrA的启动子(P_htrA)(SEQ ID NO：1)。所使用的引物为分别引入KpnI和HindIII位点(黑体)的PhtrA-fw，(SEQ ID NO：5)CGTGAGGTACCGGCTTCTGTTTCTGCC；和Phtr-rv，(SEQ ID NO：6)CATCACGAAGCTTATCCATCATGTTCACTCCG。用Kpn1和Hind3消化后，将531bp PCR产物连接进pGFP-amyE中gfp基因上游，得到报告质粒pPhtrA-gfp-amyE。该质粒的图谱描绘于图1中。质粒pPhtrB-gfp-AmyE以如上所述类似的方法构建。用于扩增htrB启动子(P_htrB)(SEQ ID NO 2)的引物为PhtrB-fw(SEQ ID NO 7)GACCGGTACCTCAGGATCTTTCGCC和PhtrA-rv(SEQ ID NO 8)GGCCATCAAGCTTATAATCCATGTTCTTACACTCC。

1.2构建Bacillus报告菌株VT210A和VT210B

将得到的质粒pPhtrA-gfp-amyE和pPhtrB-gfp-amyE引入DaprE、DnprE双突变体B.subtilis DB104中(F.Kawamura and R.H.Doi，1984；Construction of a Bacillus subtilis double mutant deficient in extra cellularalkaline and neutral proteases，J.Bacteriol.160，442)。通过对染色体DNA的PCR检查氯霉素抗性转化体通过amyE基因座上双交换的位点特异性整合。为了降低HtrA对P_htrA的负反馈调节(D.Noone，A.Howell，R.Collery，and K.M.Devine，2001；YkdA and YvtA，HtrA-like serine proteases in Bacillussubtilis，engage in negative auto regulation and reciprocal cross-regulation ofykdA and yvtA gene expression，J.Bacteriol.183，654)，用B.subtilisBV2003的染色体DNA转化新菌株，所述B.subtilis BV2003具有通过pMutin2整合被破坏的htrA基因(H.L.Hyyrylainen，A.Bolhuis，E.Darmon，L.Muukkonen，P.Koski，M.Vitikainen，M.Sarvas，Z.Pragai，S.Bron，J.M.van Dij1，and V.P.Kontinen，2001；A novel two-component regulatory system in Bacillussubtilis for the survival of severe secretion stress，Mol.Microbiol.41，1159)。选择红霉素抗性的转化体并通过对染色体DNA的PCR检查htrA破坏。获得的菌株命名为VT200A和VT200B。

为了提高VT200A菌株的转化效率，设计了BsuMR破坏构建体。BsuMR体系通过由三个基因：ydiR、ydiS和ydiA组成的操纵子形成，其中各基因对BsuMR功能是必须的(P.J.Lewis and A.L.Marston，1999；GFPvectors for controlled expression and dual labeling of protein fusions in Bacillussubtilis，Gene 227，101)。使用以下引物和B.subtilis染色体DNA作为模板扩增756bp的ydiR区——侧翼区1(flr1)：flrBsul F，(SEQ ID NO 9)GAAAGATTGTTTCAGAAGCC；和flrBsuR，(SEQ ID NO10)ACAGCGTTGGGATCCAAGCCCTTCCATTTTGGACATTTGG。使用pDG1726(A.M.Guerout-Fleury，K.Shazand，N.Frandsen，and P.Stragier，1995；Antibiotic-resistance cassettes for Bacillus subtilis，Gene 167，335)作为模板DNA和以下引物扩增壮观霉素抗性标记：specBsu-F，(SEQ ID NO11)GGGCTTGGATCCCAACGCTGTCGACGTTGTAAAACGACGG；和specBsu-R， (SEQ ID NO12)CGCATAGCTTTCCGGTCGCCGCAGCTATGACCATGATTACGC。1319bp PCR产物和flrBsu1片段用于第二轮PCR，其中由引物flrBsu1-R和specBsu-F(黑体)引入的其同源末端重组后，两个片段作为一个模板作用。使用引物flrBsu1-F和specBsu-R获得2075bp PCR片段flr1-spec^r，其被亚克隆进pCR-XL-TOPO(Invitrogen)中得到pCT-XL-TOPO-flr1-spec。覆盖ydiS(编码DNA内切核酸酶)的3’末端和相邻ydjA(未知功能)大部分的739bp区域——侧翼区2，使用引物flrBsu2-F，(SEQ ID NO 13)GATGATTCGTCTTTTTGTAGTG；和引物flrBsu2-R，(SEQ ID NO 14)CGATCAACATATGTGTTCACG和B.subtilis的染色体DNA作为模板扩增。将PCR产物克隆进pCR-XL-TOPO中得到pCR-XL-TOPO-flr2。利用pCR-XL-TOPO载体的多克隆位点，使用XhoI和NsiI将flr1-spec^r从pCR-XL-TOPO-flr1上限制性酶切下并连接进用XhoI和Pstl(与NsiI匹配)消化的pCR-XL-TOPO-flr2中。这引起构建体pTOPO-flr1-spec^r-flr2的删除，其被引入菌株VT200A。通过对染色体DNA的PCR检查壮观霉素抗性转化体的ydiS缺失。获得的最终报告菌株称为VT210A和VT210B并用于进一步的实验，构建这些菌株的一般性概括描绘于图2中。

1.3构建表达载体pUBnpr2和pUBBAG：

质粒pUB110的构建及其序列之前已被描述过(McKenzie T.，HoshinoT.，and Sueoka，N.1986.The nucleotide sequence of pUB110；some salientfeatures in relation to replication and its regulation.Plasmid 15：93-103)。将Bacillus amyloliquefaciens a-淀粉酶基因amyQ(Genbank登录号J 01542)克隆进pUB110，得到如先前所述的质粒pKTH10(Palva，I.1982.Molecularcloning of the alpha-amylase gene of Bacillus amyloliquefaciens and itsexpression in B.subtilis.Gene 19：81-87)。

将均来自Bacillus amyloliquefaciens的中性蛋白酶基因npr(Genbank登录号K 02497)和β-葡聚糖酶基因bag(Genbank登录号M15674)克隆进载体pUB110的过程实质上根据用于克隆amyQ的方法进行，得到如图3和图4所描绘的质粒pUBnpr2和pUBBAG。

1.4将表达构建体pKTHIO、pUBnpr2和pUBBAG转化进Bacillus报告菌株VT210A中：

Bacillus subtilis菌株VT210A的转化实际上如先前所述利用该生物的天然感受态进行(Anagnostopoulos，C.and Spizizen，J.1961.Requirements fortransformation in Bacillus subtilis.J.Bacteriology 81：741-746)。DNA孵育后，将细胞涂布于2 x TY琼脂上，其含有0.1％淀粉和作为转化选择剂的抗生素卡那霉素(20μg/ml)。将板在37℃孵育过夜。当转化涉及质粒pKTH10时，用鲁戈溶液(lugol solution)覆盖菌落以检测分泌淀粉酶的细胞。

实施例2通过荧光激活的细胞测定法分析分泌胁迫的细胞

2.1通过荧光激活的细胞分选选择分泌胁迫的细胞：

以1∶20的比例使用质粒pUB110(空对照载体)和pKTH10(编码Bacillus amyloliquefaciens a-淀粉酶基因amyQ)共转化Bacillus subtilis菌株VT210A。将一部分细胞涂布于选择性TY琼脂平板上，向另一部分中添加含卡那霉素的2 x TY培养基，并将细胞孵育过夜。同样用与共转化相同的操作转化分离的质粒。第二天，在FACS型流式细胞仪(Mo-FIo ofDakocytomation)上由熟练操作者GFP荧光分析培养物。使用80mWatt和488nm的蓝色激光。典型的FACS实验包含对20.000个事件(细胞)的分析。首先单独分析(图5A和5B)和作为混合(图5C)分析VT210A，pUB110(无分泌胁迫)和VT210A，pKTH10(由于过量生产α-淀粉酶AmyQ的分泌胁迫)细胞的荧光信号。在这些结果的基础上手动设置细胞分界限(图5D中的虚线)，使得显示高于细胞分选界限的GFP荧光的细胞被分选。将共转化培养物应用于流式细胞仪并在管中收集被分选的细胞。为了验证经分选的荧光群体已经富集了分泌α-淀粉酶的细胞，将被收集的细胞的不同稀释液涂布在含淀粉的选择性琼脂上。对未经FACS分选的最初的过夜输入培养物进行相同处理。培养后用鲁戈溶液覆盖菌落，使α-淀粉酶活性引起的卤素形成显影。图表1所示，约90％的经分选的细胞的确分泌α-淀粉酶，而输入培养物中仅0.5％-0.7％的细胞分泌α-淀粉酶。该结果清除地说明了有力的本发明选择工具，其通过使用正常细胞和分泌胁迫细胞之间的荧光信号辨别来分离分泌蛋白质的细胞。

表1：流式细胞术后富集形成amy⁺菌落的单位。

2.2通过荧光细胞扫描选择分泌胁迫的细胞：

将质粒pUB110(空对照载体)和pKTH10(编码Bacillusamyloliquefaciens a-淀粉酶基因amyQ)单独地转化进Bacillus subtilis菌株VT210B中。将一部分细胞涂布于选择性TY琼脂平板上，向另一部分中添加含卡那霉素的2 x TY培养基，并将细胞孵育过夜。在流式细胞仪(Coulter Epics XL-MCL，Beckman Coulter)上由熟练操作者分析培养物。典型的实验包含20.000事件(细胞)的分析。使用FITC滤器并将光电倍增管电压设为700和800伏特之间检测荧光信号。正常细胞和受到分泌胁迫的细胞间的荧光信号差异描绘于图6中。

2.3使用荧光计选择分泌胁迫的VT21OA细胞

经转化的报告菌株细胞在存在卡那霉素的2 x TY培养基中孵育并在37℃过夜培养。用于转化质粒pUB110、pKTH10、pUBnpr2和pUBBAG的DNA数量相等。生长至稳定期后，将四种转化的培养细胞以96孔微量滴定板的形式等体积分为8份。孔在荧光计中分析荧光(MolecularDevices，type Spectra MAX Gemini)。刺激在490nm，发射在510nm和截断在495nm。表2说明通过清晰显著(P two-tail＜0.05)的荧光信号差异而将非胁迫的细胞(pUB110)从胁迫的细胞(pKTH10、pUBnpr2和pUBBAG)中区别出来。

	pUB 110细胞	比值
	pUB 110细胞	比值	pKTH10细胞	P＝1,05899E-13	7,84
pUBnpr2细胞	P＝4,63415E-11	1,58	pKTH10细胞	P＝1,05899E-13	7,84
pUBnpr2细胞	P＝4,63415E-11	1,58	pUBBAG细胞	P＝7,17216E-14	1,77

表2.假定不等方差的t检验。给定空宿主细胞(pUB110)对分泌胁迫(pKTH10、pUBnpr2、pUBBAG)细胞的P值。

比值表达了胁迫细胞的平均荧光值(n＝8)对空宿主细胞的平均荧光值(n＝8)。

实施例3基因组广泛表达分析A.niger以鉴定分泌诱导的启动子

进行基因组广泛表达分析以鉴定在A.niger WT-PHY中高度表达，并在A.niger WT-GFP，A.niger WT-载体和A.niger WT-1中不显示或显示较低表达的启动子序列。为了模拟将来的应用实验，获得A.niger WT-1，A.niger WT-GFP，A.niger WT-PHY和A.niger WT-vector菌株的原生质体。在A.niger WT-GFP，A.niger WT-PHY and A.niger WT-载体情况下将20ml数量补充有50mg/l phleomycin(Invitrogen)的液体选择性再生培养基在培养皿中与100微升10E7/ml原生质体孵育。在30℃(静止)生长3天的周期后，在液体培养基表面形成菌丝体小片，将其用于总RNA分离。在Affymetrix A.niger GeneChips^TM上的cDNA合成、cDNA标记和杂交根据供应商流程进行。随后的表达分析得到5个下述基因，所述基因在A.niger WT-PHY菌株中的表达水平为在A.niger WT-1，A.niger WT-GFP和A.niger WT-载体中基底表达水平的至少8.5倍。为了确认所述发现，进行Northern印迹分析。

实施例4Northern分析

为了确认Affymetrix A.niger GeneChips^TM实验的结果，进行Northern印迹分析。为此从A.niger菌株WT-1、WT-GFP、WT-FYT和WT-载体中分离总RNA。将RNA变性，在1％琼脂糖凝胶上通过凝胶电泳分离，并根据制造商说明通过毛细管印迹转移至尼龙膜(Hybond-N+，AmershamBiosciences)上。在GS Gene Linker^TM(BioRad，C3 setting，150mJoule)上将RNA紫外交联在尼龙膜上。用于产生³²P-标记的DNA探针的DNA使用A.niger WT-1的基因组DNA作为模板并使用表3所列引物(SEQ ID NO′s 50到59)通过PCR分离。根据供应商说明(RadPrime DNA Labeling System，Invitrogen)将Northern印迹与随机引物32P-标记的DNA探针杂交，所述探针代表了分泌诱导的基因(SEQ ID NO′s 20到24)。Northern分析到结果显示在图10中。Northern印迹的杂交模式证实了通过表达分析AffymetrixA.niger GeneChips^TM数据获得的数据；分泌诱导的基因在A.niger菌株WT-1、WT-GFP、WT-载体中低表达并在A.niger WT-PHY中高表达。

引物

引物序列

基因序列

SEQ ID NO：50	CAACACCTACGGCGTCAAGG	SEQ ID NO：20
SEQ ID NO：50	CAACACCTACGGCGTCAAGG	SEQ ID NO：20	SEQ ID NO：51	TAACCCGGGGAGATGCTGTT	SEQ ID NO：20
SEQ ID NO：52	CGATCCGGAAATTCCTCCTG	SEQ ID NO：21	SEQ ID NO：51	TAACCCGGGGAGATGCTGTT	SEQ ID NO：20
SEQ ID NO：52	CGATCCGGAAATTCCTCCTG	SEQ ID NO：21	SEQ ID NO：53	GCCGCCGACTCAGCAGTAT	SEQ ID NO：21
SEQ ID NO：54	GTGCATGAACAACACGGAGA	SEQ ID NO：22	SEQ ID NO：53	GCCGCCGACTCAGCAGTAT	SEQ ID NO：21
SEQ ID NO：54	GTGCATGAACAACACGGAGA	SEQ ID NO：22	SEQ ID NO：55	ACTCAGTTGTGCGCCTCTCG	SEQ ID NO：22
SEQ ID NO：56	GTCGAACTCGGCGTTTCTCC	SEQ ID NO：23	SEQ ID NO：55	ACTCAGTTGTGCGCCTCTCG	SEQ ID NO：22
SEQ ID NO：56	GTCGAACTCGGCGTTTCTCC	SEQ ID NO：23	SEQ ID NO：57	CCGGTGAGGAGGTGCTTTTC	SEQ ID NO：23
SEQ ID NO：58	AGCATCTCGCCATCCATCAG	SEQ ID NO：24	SEQ ID NO：57	CCGGTGAGGAGGTGCTTTTC	SEQ ID NO：23
SEQ ID NO：58	AGCATCTCGCCATCCATCAG	SEQ ID NO：24	SEQ ID NO：59	GCCTTCGGACCATGGTATCC	SEQ ID NO：24

表3：用于分离用于经³²P-标记探针的DNA的引物。

实施例5克隆GFP-BLE分泌诱导的报告构建体

通过PCR构建GFP(绿色荧光蛋白(Chalfie，M et al.，Science(1994)263(5148)：802-805)和腐草霉素结合蛋白(BLE，存在于先前在WO99/32617中描述的pGBFIN-14中)的融合。使用SEQ ID NO：62和SEQ ID NO：63的引物组通过PCR扩增GFP片段。使用引物组SEQ ID NO：64和SEQ IDNO：65和pGBFIN-14作为模板通过PCR扩增BLE片段。获得的重叠PCR片段用于使用引物SEQ ID NO：62和SEQ ID NO：65的融合PCR中，得到PCR融合产物GFP-BLE(SEQ ID NO：61)。用限制性酶PacI和AscI消化GFP-BLE融合物并与经PacI、AscI线性化的克隆载体pGBFIN-2(描述于WO99/32617和EP98/08577)连接，从而将GFP-BLE融合物置于葡萄糖淀粉酶启动子的调控下，得到的载体pGBFINBLE-2描绘于图11中。

使用来自A.niger WT-1的基因组DNA作为模板和表4所示引物通过PCR分离分泌诱导的基因的启动子序列。

引物	引物序列	启动子	PCR产物
引物	引物序列	启动子	PCR产物	SEQ ID	ACTTCATTAATTAAGTTGATTGAGGTAGAGATGAGTTTG	P1、SEQ ID	SEQ ID

NO：40		NO：20	NO：35
NO：40		NO：20	NO：35	SEQ IDNO：41	ACTTCACTCGAGATAATGTAGGCGACAAAGTAGCC	P1、SEQ IDNO：20	SEQ IDNO：35
SEQ IDNO：42	ACTTCATTAATTAATTTGACACTTAACGTGGTAAGG	P2、SEQ IDNO：21	SEQ IDNO：36	SEQ IDNO：41	ACTTCACTCGAGATAATGTAGGCGACAAAGTAGCC	P1、SEQ IDNO：20	SEQ IDNO：35
SEQ IDNO：42	ACTTCATTAATTAATTTGACACTTAACGTGGTAAGG	P2、SEQ IDNO：21	SEQ IDNO：36	SEQ IDNO：43	ACTTCACTCGAGTTCTCACAAGCAAATCCGAGA	P2、SEQ IDNO：21	SEQ IDNO：36
SEQ IDNO：44	ATCCTACTCGAGTGGTGCCTGTGAACGAGGTCA	P3、SEQ IDNO：22	SEQ IDNO：37	SEQ IDNO：43	ACTTCACTCGAGTTCTCACAAGCAAATCCGAGA	P2、SEQ IDNO：21	SEQ IDNO：36
SEQ IDNO：44	ATCCTACTCGAGTGGTGCCTGTGAACGAGGTCA	P3、SEQ IDNO：22	SEQ IDNO：37	SEQ IDNO：45	ACTTCATTAATTAATGTGGATTTTGGATAGTAATTAAAG	P3、SEQ IDNO：22	SEQ IDNO：37
SEQ IDNO：46	ATCCTATTAATTAAGATGGTTTGGTGTATAACAGAACA	P4、SEQ IDNO：23	SEQ IDNO：38	SEQ IDNO：45	ACTTCATTAATTAATGTGGATTTTGGATAGTAATTAAAG	P3、SEQ IDNO：22	SEQ IDNO：37
SEQ IDNO：46	ATCCTATTAATTAAGATGGTTTGGTGTATAACAGAACA	P4、SEQ IDNO：23	SEQ IDNO：38	SEQ IDNO：47	ACTTCACTCGAGGTCCACACTCTAATTGGGATGA	P4、SEQ IDNO：23	SEQ IDNO：38
SEQ IDNO：48	ATCCTATTAATTAAGTTGCATCTGCGACAGACAGT	P5、SEQ IDNO：24	SEQ IDNO：39	SEQ IDNO：47	ACTTCACTCGAGGTCCACACTCTAATTGGGATGA	P4、SEQ IDNO：23	SEQ IDNO：38
SEQ IDNO：48	ATCCTATTAATTAAGTTGCATCTGCGACAGACAGT	P5、SEQ IDNO：24	SEQ IDNO：39	SEQ IDNO：49	ACTTCACTCGAGGCCTTTGGAGAATGTAATATCCC	P5、SEQ IDNO：24	SEQ IDNO：39

表4：用于扩增相应启动子的引物概述

用限制性酶XhoI和PacI消化得到的PCR片段(SEQ ID NO′s：35到39)，并连接进用XhoI、PacI线性化的图11所描述的克隆载体pGBFINBLE-2中，从而去除PgpdA-amdS并用各自的分泌诱导启动子Pind代替葡萄糖淀粉酶启动子，得到pGBFINGFPBLE-1到5。pGBFINGFPBLE-1描绘于图12中，并代表pGBFINGFPBLE-2到5。通过XhoI和FseI消化pGBFINGFPBLE-1并随后与XhoI、FseI线性化的图13所描绘的A.niger表达载体pGBTOPSEL-1连接来分离各诱导型启动子与GFP-BLE的融合构建体。得到的分泌报告构建体pGBTOPGFPBLE-1到5含有位于各分泌诱导型启动子P1、P2、P3、P4、P5调控下的GFP-BLE融合物。在图14中，pGBTOPGFPBLE-1作为pGBTOPGFPBLE-1到5的代表被描绘。在实施例6和7中使用这些载体转化A.niger WT-1。

实施例6过表达细胞外蛋白质赋予表达GFP-BLE报告构建体的A.niger腐草霉素抗性

根据材料和方法中描述的步骤进行分泌报告构建体pGBTOPGFPBLE-1到5到A.niger WT-PHY-2中的转化，所述A.niger WT-PHY-2过表达经分泌的蛋白质植酸酶。在补充有多种数量腐草霉素(0、5、10、15、20、25、30、35、40、45、50微克每毫升)作为选择剂的选择性再生平板上选择转化体。所有5个报告构建体能够在含腐草霉素的平板上正选择，而负对照WT-PHY-2野生型不能在含腐草霉素的任何平板上生长。分泌报告构建体pGBTOPGFPBLE-1到5能够在分别有50、35、50、35、25微克每毫升腐草霉素上成长。从而说明这些构建体的分泌诱导型启动子是有功能的，并且转化后在腐草霉素上的正选择是可能的。

实施例7cDNA文库和GFP-BLE报告构建体共转化后选择表达细胞外蛋白质的A.niger克隆

使用分泌报告构建体pGBTOPGFPBLE-1到5与经定义的A.nigercDNA文库组合共转化Aspergillus niger WT-1，所述cDNA文库编码50个细胞外蛋白质和50个细胞内蛋白质。通过菌落PCR确认共转化事件。含分泌报告构建体与表达文库构建体组合的共转化体的孢子在补充有不同数量腐草霉素(0、5、25、50、100、175微克每毫升)的选择性平板上生长。证明了含有分泌报告构建体与编码细胞外蛋白质的文库构建体组合的共转化体与含有分泌报告构建体与编码细胞内蛋白质的文库构建体组合的转化体相比，腐草霉素抗性的平均提高。代表分泌敏感性启动子P4和P5的这些结果的图片在图15和图16中显示。这些结果说明达到了至少多至20倍的腐草霉素抗性提高。

证明了下述共转化体制造的细胞外蛋白质的多样性，所述共转化体含有包含启动子P1或P3的分泌报告构建体与编码细胞外蛋白质的文库构建体的组合。共转化体在微量滴定板上个体生长，并在第6天将这些培养物的上清液通过E-PAGE^TM High-Throughput Pre-Cast Gel System(Invitrogen)和质谱法(MALDI MS/MS)进行蛋白质分析。

E-PAGE^TM 96，6％Gels(Invitrogen)含有用于蛋白质分离的微量滴定板格式的96个样品区和8个标记物区。根据供应商手册将上清液和标记物(E-PAGE^TM 预染标准(Invitrogen))上样在凝胶上。将凝胶电泳后，根据供应商手册将SimplyBlue^TM Safestain(Invitrogen)用于染色。E-PAGE^TM凝胶的扫描图通过Invitrogen提供的E-editor程序编辑，所述程序将蛋白质样品排列为微量滴定板格式。由具有分泌敏感启动子P1和P3的共转化体制造的细胞外蛋白质展示在图17和18中，并在表5中概述。这些结果说明，至多70％的经分析的腐草霉素抗性菌落分泌通过E-PAGE可检测数量的蛋白质。根据凝胶上观察到的蛋白质片段的大小，评估用给定文库转化的菌落的多样性。这些结果说明根据E-PAGE分析可观察到至多35％的多样性。

质谱结果描绘于表5中。至多58％的被分析为腐草霉素抗性的菌落分泌通过质谱可检测数量的蛋白质。根据所检测的肽序列的同一性评估多样性。这些结果说明使用质谱可观察到至多100％的多样性。

表5：E-PAGE和质谱结果概述。用于分析的测定法在第一列中描述；第二列鉴定了分泌敏感的启动子-报告子构建体；第三列描述了由测量法分析的转化体的数量；第四列和第五列说明了对蛋白质分泌评分为正的菌落数量和各自的阳性百分比；第六列和第七列说明了分泌不同蛋白质的菌落数量和各自的多样性百分比。

申请人或代理人文件参考编号24403WO

国际申请号：

与被保藏的微生物相关的说明

(PCT Rule 13bis)

序列表

<110>帝斯曼知识产权资产管理有限公司

<120>在宿主细胞中表达克隆的改进方法

<130>24403WO

<160>65

<170>XML to WIPO ST.25Converter-http://www.biomax.de/

<210>1

<211>168

<212>DNA

<213>Bacillus subtilis

<400>1

CGACTCAGTC CTTTCATATA CAATATGAAG TGTACCGTTT TCCGCACTTT TTCACAATTT 60

CCCATAATCT TTTCATTTTT ATCCCACAGT TTTTGTTTAT GATAAACTCA AGTCATAAAC 120

CTATCAATAT AAATAGACAT GTGAAAATAG AGAAACGGAG TGAACATG 168

<210>2

<211>277

<212>DNA

<213>Bacillus subtilis

<400>2

GGCTCTTCAC ATCCTTTCAA CGTCATTATA AACTAGTTTT AACATACGGC AGGCAATTTT 60

CATAATTTCA CATATTCTTT TCATTTTTAT CCCACAATGT TTGTTTATGA TATGGTTAAG 120

GGAAGAAAGG AAGAGAAAAA GAGCGAGGAA GATGTAGGAT GATCAAACAT ATTCTATTTT 180

GGTGCTTTGC TTTTCTCCTC ATTATTGGGA CAATTGAACT TGTACATGCG ATGAATATGT 240

AACGATAAAT GAATAACCGT TAAAGGAGTG TAAGAAC 277

<210>3

<211>26

<212>DNA

<213>人工序列

<220>

<223>引物

<400>3

GTGAGCGGAT AACAATTTCA CACAGG 26

<210>4

<211>70

<212>DNA

<213>人工序列

<220>

<223>引物

<400>4

GTGGCTCAGC TTTTTTAAGG AAGGGAGGCT CTCACCTCCC TTCCCTTTAT TTGTAGAGCT 60

CATCCATGCC 70

<210>5

<211>27

<212>DNA

<213>人工序列

<220>

<223>引物

<400>5

CGTGAGGTAC CGGCTTCTGT TTCTGCC 27

<210>6

<211>32

<212>DNA

<213>人工序列

<220>

<223>引物

<400>6

CATCACGAAG CTTATCCATC ATGTTCACTC CG 32

<210>7

<211>25

<212>DNA

<213>人工序列

<220>

<223>引物

<400>7

GACCGGTACC TCAGGATCTT TCGCC 25

<210>8

<211>35

<212>DNA

<213>人工序列

<220>

<223>引物

<400>8

GGCCATCAAG CTTATAATCC ATGTTCTTAC ACTCC 35

<210>9

<211>20

<212>DNA

<213>人工序列

<220>

<223>引物

<400>9

GAAAGATTGT TTCAGAAGC 20

<210>10

<211>40

<212>DNA

<213>人工序列

<220>

<223>引物

<400>10

ACAGCGTTGG GATCCAAGCC CTTCCATTTT GGACATTTGG 40

<210>11

<211>40

<212>DNA

<213>人工序列

<220>

<223>引物

<400>11

GGGCTTGGAT CCCAACGCTG TCGACGTTGT AAAACGACGG 40

<210>12

<211>42

<212>DNA

<213>人工序列

<220>

<223>引物

<400>12

CGCATAGCTT TCCGGTCGCC GCAGCTATGA CCATGATTAC GC 42

<210>13

<211>22

<212>DNA

<213>人工序列

<220>

<223>引物

<400>13

GATGATTCGT CTTTTTGTAG TG 22

<210>14

<211>21

<212>DNA

<213>人工序列

<220>

<223>引物

<400>14

CGATCAACAT ATGTGTTCAC G 21

<210>15

<211>1050

<212>DNA

<213>Aspergillus niger

<400>15

ATAATGTAGG CGACAAAGTA GCCGGGCATG CGACCGGAGG ACTCGGTCAG AGGCACGAAT 60

ATGAGAGGCC AGAACGCCGC ACCCATGTTC CAAGATGTTG TGGCCCAGTA AAGGTTAGGA 120

AATGGGGTGT TTTGAACGTG GAATCGTTCT TCCATCCAGT TGTTGCCGGA GCCGTAGGAA 180

CCGGCCGGGA TACCAGTGAG GATGGAACTA TACCTATTAG CACTGCCATC TTCGAGAACA 240

AGGCTAAGAC ATACATGAAA CAAACGGTGA CCGTGAGAAG CCATTTATAA GAGGTGCTCC 300

AATTGAACCT GAATATGTTA AAACTAGTAT ACTAGCAACT GCATGCTTGA CGTACGGATT 360

GTCCGGGTCA TCCTTGCCGT TCCAGGTATG GATCTCAAGG TCCTCCCTGT CACGCAGATC 420

ATTGTGGCTG ACTACCCCGA CATGGGGGTC CCGGCGAAAG AACGACCGCA CCCTGCAACG 480

TCACTTAGTG GCTGTCTGAC AGGGATTGAT TGGCAATGAT TGGCAGACTA ACCGTCCCAG 540

AAACGAATCA TCGAACTCAT TGGTGTGCAC TGTGCTAGCG CGGCGCAGCG ACGGGCGTGG 600

CTCCTCGGCA GGGGTGGACA TGACTTTCTC TGTGTAGATT CCTTGCAAGG TATCTGCTTG 660

ACAGATGCAG AGATGATGTT GAGTAAAATA GGGTGCAGAG ACCCTGCAGA ACCTGCATCG 720

GCCGGCGGCG ACATGTCGTC ATGACCGACC CGGGCCGAGC GGAATTAATG AAACTCGGAA 780

CAGCCAGGGG AATCCGACGC TTTGAGTGGC CAATCCATGT CTATCCACAT CTGCATTGAA 840

GTGGATGAAA GGTGGAGGAG GGCTGGTTGC CAAATTCTGT TAGGGCTTGG AATGTAAGCA 900

ACCGGTTTCG GTCATGACAT CATCACAGCG ATGACTTCAT CACTCTCGGA CGAGCATATA 960

TAGTTGTGCC TGTCGTCGTA TCTCAACAAA CATCAACAAC AACAACAATC ATCTACTGCA 1020

TTTACCAAAC TCATCTCTAC CTCAATCAAC 1050

<210>16

<211>1032

<212>DNA

<213>Aspergillus niger

<400>16

TTCTCACAAG CAAATCCGAG AAACGCAATT GACCATATGT CCTTAGTATG AGGGCTAGCA 60

GGAATACTTG TTTGTCGATG CATACCGACT AATAAAAATG GTTCTTCTTT TTCGCGCAGG 120

GATTTGGTTT TTCATTTTTC ATTTTTCATA TTTTATGTTA TTTTATTTTA TTTTTTTGTT 180

TTATTTTATT TTATTTTTTT TTTTTAAATA AGACTGGGTG TTTTCGTCTC CCACCCCTGC 240

TGAGGAACTG TTTGATATAC AGAAGCCTGA GATACTTGAG ATTATGTGAC AAAGAAATTG 300

TAAACCTGAA TGTGACTAAG GCAGAAGAGA GCAGGTGAGG CCACACAATA CTGTACACCC 360

ACTTCCGATC GTCATCGAAA TGAGCGTTGT GGGTACTGGA ACGACAAACC ATAGATCGGA 420

TCTGCATCCG AATAGGCTTT ACTTTGTACA TTGGTAGGAG TTTGAATGTT TGAAGATCCG 480

GCAGATGATC ACCTGCTGCA GGGAATAATT TGAAACCTGT CCGTCTGCTT TGACCCAATT 540

GACGAGGTAC GTGATTTGAT GCTACCCAAG CAGTATGAAT GCGACGGAGG TGGCTATCCT 600

TACCTTGTCA TATGCAACTC ATAACGGGTA GTCCCCATGG AGCCACGGCT ATTTATTTCT 660

AAGGGCCAAC AGTGAAAGAT TGTGAGATCG TATACCTCCT GGGTATGACG CAACCAGGGT 720

GAGCACTGGC ATTGCTCCAA TCCATATGGT GGAGGTATGT CTCCGAGACC ATGACGCATG 780

TAGACCCTGA CCTGTCCCTG ATCCAGGGAT CTGGTTTGTC ACTTGGCGTA TTTTAATTAA 840

CTGCGGGTCA GGGTCTTGCC GTCCAGACCC AATGGATGAA TTGCCTGCGT GGCCCTGCAG 900

TTCCAGCGAT CGGCACGGCA CGGCTATGAC GTCGGTGGGT GTTCCGTTTG ATATTTAACC 960

ATAGAAGACA GCCTTGTTAT GCTGGTTCCT GCCGCAAAAT AAAGGTCTAT CCTTACCACG 1020

TTAAGTGTCA AA 1032

<210>17

<211>1035

<212>DNA

<213>Aspergillus niger

<400>17

TGGTGCCTGT GAACGAGGTC ACCACTGATA AATTGTCTGG ATCCGTAACG TCTGTATCAG 60

TGGATGGTAC TGAAAAGTTC CAAAGATTGA GGGCAGCATA TGTAGCACAT GGTGGTAGCT 120

CTAAGTGGTT CGAAACTTCG ATGAATGGGC GTGATATACA GGGGGGTAGC ACCTGTATAG 180

TTGATGTCAG CGAAGGCACG GGCCATGCAG TGATAGACAA GAAAAGAGGG ATTGAATAAA 240

AGACTCGATT CTGAAGGGGA GTAATACATC TTTCGGCTTC TCACCACCCC AGATGTAGGC 300

GTGTGTAAGG TAAGCAAGCA CAACATATGC TCTCCGCCAC TCAGGTTCCC CCTTCAACTT 360

CTTCGTAGAG AGTATACCCA GGTCATCGAC AGACCTCCTG ATAGTACCAG ACTGAATCAG 420

GCCAGGCAAG TCCTGAGCGA TTTCCTCCCA CGGGGAATAG TAAGGGTCTT CCAATCTCCG 480

TACGGGAGGA ACTTCCGGGA GGAACCCGTT CTGGAGGGAG ACACCGTACG CAACAAGTGA 540

AATGTCTTGT GTATAAAGCA TGATAATATA TGCACTTCAG TAGACAACTT GATATTCAAG 600

CCTCCTTGAA ATGATCCTCA TGCAGGTAAG AGTAGATCCA AGTGTTTATA TTGTATTCCC 660

AAGGAGGGAC GGAAGAAAAC CGGATCCAGA GGGCTCGAGA TAGGGCCACC TGCATGAGCA 720

AAGACGGGTC ATTTCCCGTT TCACAACGAC CATTCTCAGG CAGAAAGGCA GTGGATTAGC 780

GGAAAACTTA GCAACCATCC GGATTTCTGG AGTGGATGCT TTGTTATCTC ACTTCCGGCA 840

ACACGGATGG TGAGGCGGAA GCGGAACGGT ATCCGGATCC GGAGGGAGGG ACAAACCGAA 900

GTGCCTTGTG TCACACGCCG GTCCATATAT AAATGTTAAT TGGTGACGGT CAGCGGATTG 960

TTTCTGGTGT TCATCCATTT TTTCTTGATA TCCTGGACCC AGTTATTGCA CTTTAATTAC 1020

TATCCAAAAT CCACA 1035

<210>18

<211>1071

<212>DNA

<213>Aspergillus niger

<400>18

GTCCACACTC TAATTGGGAT GAGCATTGCC TTTCAGGAAC TTGACTTTTT GTGGTTGCAT 60

CTTTTGTTGC CTTACCCACG CAGGCTTCGT TTATGAGATA GCGATTTCAG GCCTCAAATT 120

GCTGTCATCA CTTCCGGCCC CAAACTCGTG GGCGGTGCCC GCCCATCGCT GGCAAGAAGC 180

ACAGACTAAC GCCTTACTTC GCCTAGTTGC ACACGATGCA TCAAGACTTC CTCCTATTTC 240

ACAACGACCA GCTCCTTGCC ATTTGTTGTT TCGAATGCCC CCTTCCCCGT GCCTTGCATT 300

TCTAATTCCC ATCTATACCC TTTTGCGCTC TCACGCCCGC CTGACTATCA ATTTTTCTGC 360

CAGCATAACC CTGCGTGCAG AGCGGTTGAC AGCAGGCTTG CTAAGAGTCT TCGTCTAGAA 420

GAACTGTCTG GGTGGATTCC TTTTCGGATT AACTTTTGCT ATTTTAAAAG CTGATTGCAC 480

TACGGAGTAC ACCCGCAATC TGATTCTCAC TGATACTCCA ATTAAAGGCC ACTAATTGCT 540

GACATTTGTA ACATATTTGC GTTTGCTTTC CGGTTGAAAT TGGCGGCTTT GTGCTTTCGA 600

TCGCTAGCAG TCTCTGTGCA TGTACAACTG ATCGGCTATT CAGTCCTATT CGGAAGCGGC 660

ACTGAGAGGC GGAGACAAGC CACAGATACG ACGAGTCTGA TTTTGAGACG GGCGCATCCA 720

ACGAAAGCCT GCGATTGCAA TTGAAGATCT CAATTGGGGG ACTGACAACC TAATACCTAA 780

ACATATCGAG GATTAGGCGC CAACACGAGC ATGGGAAGCT TTGGTGCATG CGACGGCTGA 840

TCCATTTCTA ACAACCGTTT TGCGCGCGCG TCCGAGGTAA GGCTCCCGAT CCCTTGGCGC 900

TTTGCATGTT TCACTCCGAT GCATCTACTG TTTATATGAG TGCGGTGGGC AAGCTGTGCC 960

CACCGACTGA GCATTCTCAA CCGGCCCAAT GCTGTGGGAT CGATCCTCCC CTCCAAAGTT 1020

GTCGCTCGGT TACACTTGAT CGGAGCTTGT TCTGTTATAC ACCAAACCAT C 1071

<210>19

<211>1116

<212>DNA

<213>Aspergillus niger

<400>19

GCCTTTGGAG AATGTAATAT CCCTTGATCA CCCCAGACTC ACATCCAGAT TCTGACTGAC 60

CTCGTGCATA GCCATATTTA ACTTGGTCCC TGATGATCAA AACAGTACAT GGAACTGGGG 120

CCGAACATTT CCCTAGCCAA AGGAGCATCA GGGATTCAAC GTGATCAGTA CAGCCTTGTA 180

GCTCGCTGAA ACTGCCCTGG AGCCAAGCCA AAGCCTAGAC AGCAAGGTGC ATGGGCGAGC 240

TTTGCGAGGA TTTAGTTGTT ATTTAGTATG CCAAGATTAA GCCACGCAGA ATGGCTTATG 300

GCCATAGTAG CAACAACGGC CACGGAACGT TCTTCCATGT GGTATGGGGA AAGCCGCCGG 360

ATATTTGGGG AGGGCGTGAT TGTTCCGGTG GCTATCTTTC CGGTGGAGAT AACGGCGGTG 420

GACCATCAAA ACTCCTCAGC CCGGATTGCT CGGACTCCGC ATCGTCAAGT ATCGGTTTCA 480

TGACAGCCAT TCGACTACTT AGAAGACACA AATAGCTATC CAACTTACCC GGACCTTTGA 540

TAATAATTTT CAGCAGATCT GTCGATCTCA GAGACAATAA TGCCACCGTT CTGTGTGGAA 600

GGCACTGCGC CGTGGTTTAA CAATAATAAA ACTCCAAATT GCCCAAAAGC TAGAGCGAAG 660

GAAAGTCGAG AAGCCCAGTC TAGACTGGCG GGCTGATCGT CCGGTTCACA ACCTGATTGA 720

CAAATCATCT GTGACCCTCG ATGTTCCGCG GCGTTGAGCG GGTGAGAATG TGGATCCTAG 780

TGGGGAAGAC CCAATTGCCG CCGGAAAAGG TGAGCTTGTG CTGCACATGT CCGGTGGCTC 840

AATTCAGGGC CATGCCAGGA CATTGCTCTT CAAAGGGATG CGATTGCTAT TCCCTATTTA 900

CTTCTTTAAC CCGCTGACGG GCCTGTCTGG ACCGAGAATT CTTGGTCAAG TTTCAGTGGA 960

GCGATCCAGG AAAGAACATC CGATATGGAC AGTTGCCCTC GATCTCAGGT CTGTAGTCGT 1020

GTGACACAGA GGCCTCTACT CGCTTGCCTT GCATGTCGGA GCTCAAAGGT GCGATGTGAA 1080

TTAACACGAG GAGCGACTGT CTGTCGCAGA TGCAAC 1116

<210>20

<211>3191

<212>DNA

<213>Aspergillus niger

<400>20

GGAGTTACGT CCCAGAGATG CTGCGGACAA TGCCGATGCG GCATACTTCT CATACGCATC 60

CGTCAAGTAA TTCACAACAG CCATGTAGAT ACTGTAGATG CCAATACCGG TAGCCCCGAT 120

GCCGAGGGTC GGGACAATCC AAGGCACAGA AGGAAAACTG GCCCAACCAT ACCAGAACAG 180

CCCGCCTGCG AACAGCAAGC TGCCAATGAT ACTAGTATAC AGACGGGCCT CCGGGATGGG 240

TTTCCCGGGC TTCTCTTTGT TGCGTTTCGC CGACCGCAAA TACAGCATAT CCTGAAGAGG 300

ATTGACGAGA GTACCGATTA GAGCACCCAC GGAGATGGCC AATTGAATGC ACCCAGTTTG 360

CAAAGTATTC ATGCCGTAGT TGGTGGAGAA GGTCTGAACG ACACTGCTGA AGAAGAGATA 420

CAGGATACCC CAGGCGAAAG AGATCCAGAG GGTGAAGAAG GCAACGACGG GCTCGGTGAG 480

GAGCATTCGT GTGGGCCGTT CGAAGGAGAT CTGCATCAGA CGCCAGACGC TGGTGTTGTC 540

TAGCTCGGCT TCGGCGTAGA TGGGGCGCTG CTTTTCTTTG CGGAGCTTCT TGGCCCGACG 600

GGTGAGGATC ACGTCCGCGC GGGTTTCGTA CAGGATGAAC CAGAAGATGG GTAGGAGCCC 660

TGTTAGATAG ATAATTTGGA TGTAGAAGAT CCAGCGCCAC GGGGCGGTTT TGTGGATGGC 720

TACGATGGCG GATCCGATGA ATGGGCCCAG GGCAATTCCA ACCACACTGG TAAAACCGAA 780

GAGCGACATA GGGAGACTCC TCGCTTTGTC ACCATACCAG ACATCACTGA TGCTACCGCC 840

GACGATGTTG ATCGATACGG AGGACGCACC ACCACCGAAG AAACGCGTCA CTACGAGAGT 900

AGCGTAGTTT TGGGCGAAGG CGGAGGGGAA TAGCGAGATG ATGAGAATAA TGTAGGCGAC 960

AAAGTAGCCG GGCATGCGAC CGGAGGACTC GGTCAGAGGC ACGAATATGA GAGGCCAGAA 1020

CGCCGCACCC ATGTTCCAAG ATGTTGTGGC CCAGTAAAGG TTAGGAAATG GGGTGTTTTG 1080

AACGTGGAAT CGTTCTTCCA TCCAGTTGTT GCCGGAGCCG TAGGAACCGG CCGGGATACC 1140

AGTGAGGATG GAACTATACC TATTAGCACT GCCATCTTCG AGAACAAGGC TAAGACATAC 1200

ATGAAACAAA CGGTGACCGT GAGAAGCCAT TTATAAGAGG TGCTCCAATT GAACCTGAAT 1260

ATGTTAAAAC TAGTATACTA GCAACTGCAT GCTTGACGTA CGGATTGTCC GGGTCATCCT 1320

TGCCGTTCCA GGTATGGATC TCAAGGTCCT CCCTGTCACG CAGATCATTG TGGCTGACTA 1380

CCCCGACATG GGGGTCCCGG CGAAAGAACG ACCGCACCCT GCAACGTCAC TTAGTGGCTG 1440

TCTGACAGGG ATTGATTGGC AATGATTGGC AGACTAACCG TCCCAGAAAC GAATCATCGA 1500

ACTCATTGGT GTGCACTGTG CTAGCGCGGC GCAGCGACGG GCGTGGCTCC TCGGCAGGGG 1560

TGGACATGAC TTTCTCTGTG TAGATTCCTT GCAAGGTATC TGCTTGACAG ATGCAGAGAT 1620

GATGTTGAGT AAAATAGGGT GCAGAGACCC TGCAGAACCT GCATCGGCCG GCGGCGACAT 1680

GTCGTCATGA CCGACCCGGG CCGAGCGGAA TTAATGAAAC TCGGAACAGC CAGGGGAATC 1740

CGACGCTTTG AGTGGCCAAT CCATGTCTAT CCACATCTGC ATTGAAGTGG ATGAAAGGTG 1800

GAGGAGGGCT GGTTGCCAAA TTCTGTTAGG GCTTGGAATG TAAGCAACCG GTTTCGGTCA 1860

TGACATCATC ACAGCGATGA CTTCATCACT CTCGGACGAG CATATATAGT TGTGCCTGTC 1920

GTCGTATCTC AACAAACATC AACAACAACA ACAATCATCT ACTGCATTTA CCAAACTCAT 1980

CTCTACCTCA ATCAACATGC CTATCTCCAT TCCCTCCGCC TCCAGCGTCC ACGACCTCTT 2040

CAGCCTGAAG GGCAAGGTCG TCGTTATCAC CGGCGCTTCC GGCCCTCGCG GCATGGGCAT 2100

TGAAGCCGCG CGTGGCTGCG CCGAAATGGG CGCCAACATC GCCCTCACCT ACTCCTCTCG 2160

TCCTCAGGGT GGTGAGAAGA ACGCCGAAGA ACTTCGCAAC ACCTACGGCG TCAAGGCCAA 2220

GGCCTACCAG TGCAACGTGG GCGACTGGAA CAGCGTCAAG AAGCTCGTGG ACGACGTGCT 2280

GGCCGAGTTT GGCCAGATTG ACGCCTTCAT TGCCAACGCT GGCAAGACAG CCAGCAGTGG 2340

TATCCTGGAT GGTTCCGTTG AGGACTGGGA AGAGGTCATC CAGACAGACC TGACGGGTAC 2400

CTTCCACTGC GCCAAGGCGG TGGGCCCGCA CTTCAAGCAG CGCGGAACGG GCAGCTTCAT 2460

CATCACCTCC AGCATGTCGG GTCACATTGC CAACTTCCCG CAGGAGCAGA CGTCGTACAA 2520

CGTTGCCAAG GCAGGCTGCA TCCATATGGC CCGGTCATTG GCCAACGAGT GGAGGGACTT 2580

TGCCCGCGTG AACAGCATCT CCCCGGGTTA CATCGACACG GGGCTGTCGG ACTTTGTGGA 2640

TAAGAAGACT CAGGATCTGT GGATGTCGAT GATCCCCATG GGACGCAACG GTGATGCCAA 2700

GGAGCTGAAG GGTGCATATG TCTATCTCGC CAGTGATGCC AGCACATACA CGACGGGTGC 2760

CGATTTGGTC ATTGACGGAG GATACACCGT GCGGTAAATT ATCATCCGCG GTCGGATAGA 2820

AAATAATGTT TATGACATGT ATGTAATGAA TATGAATGTT CAACAATAGT CTTCAATTCT 2880

TCACTTGCTA GTATCCTGAG TATCTTGTCG TATAGCTCAA CAACCTGGCA TGGCCGGGCG 2940

CGCAGTGTAG CTCTCCCAAG TCTATGGATA CAACTTGCGT CAGTGTGGAT CTTTGGCTCA 3000

GATTCGGAGG GGCAGTGGGG TAAACAAGAA CACGCAGCCA CTCTCGGCTT TGCGGATCCC 3060

CACGGAACGC CAGTCAACCC TGAAGATTCA GTCCGGGCCT GGGCTCGGAC TGATTTGGTG 3120

AGGGGATTCT GCATCCGTCC AAACCTTATC ATCGTTGGTG AGACGGACTC CGGACAGCCA 3180

GGAGCCTTAT T 3191

<210>21

<211>4031

<212>DNA

<213>Aspergillus niger

<400>21

GGGGTCAAAG GACACAATGT CGAAATAGCG AGATTGCTGT GCATCATCGG GGCTGTCTAC 60

AGTCCGCTGG ATTTCTTTCC CTCGGTTAAG TATTTCCTGC ACGCCGGACC CGCCAGGGCC 120

ACCTGTATTC CTAGTAAGCG ACCGTGGTGG GGTGACAGAA TGGTGGCGGT GGTGGCATTG 180

CTGCCTATAC CTGGGTTCAC GATTATGGAG CCACCGTAAC GCTCGTCGGC AGGATCTACC 240

TGTGCAGGCA GTTTTATGAC GGCCAGGGCA GCCGTTTTAT TTTCAATGGC ACTAGCTGAC 300

CAGTCTAGGG GAACTTCGAG ACGTGCACAT AGATAGTCCT GGTAGCAGGG GATGAAATTT 360

AGTGCTGAGC CTGGCGCAGT CTGGTAGGAG CGGGTTAGAC TGTGAGAAAT TATAATAGGG 420

CGGATGAGAT CAGTACGCTA CTCCAGGAGA AGTCCCCGGC TTGCACCGCA GACGGCATCA 480

TGGGTTGGTG TCGCAGGGAG GAGGGTGAGT TGAGTAAGAG AGAATTAATG AAAAGGATGG 540

AGTAGCCGAC CATATAAGTA CTGGATGAAG TGAGCGAGTT AGCGTCAGCC ACGACGGGCT 600

GACATGCATG ATCGGGGCAC CGCCGGCAAC CGATACAGCC TCAGCTCGAC GGGAAAACGT 660

GGTTACCTGG ACTTAGAAGA TGATAATACA ATGAAAAGAT AGCGTAGATT GCCATAAATA 720

CGCCACAATC TATTTATTAG GCAACAATCA AGTAAGAGCA GATTTGGCGA CTCATAGTAG 780

TCCCCATGGA GGGGCGCGAT GGTTTTCTTC GCCGAAATAA TCGCTTAATG CCTCTAACGA 840

AGATCTCAGA ACCTCCAAAC TGTAGTATTC TTCTCACAAG CAAATCCGAG AAACGCAATT 900

GACCATATGT CCTTAGTATG AGGGCTAGCA GGAATACTTG TTTGTCGATG CATACCGACT 960

AATAAAAATG GTTCTTCTTT TTCGCGCAGG GATTTGGTTT TTCATTTTTC ATTTTTCATA 1020

TTTTATGTTA TTTTATTTTA TTTTTTTGTT TTATTTTATT TTATTTTTTT TTTTTAAATA 1080

AGACTGGGTG TTTTCGTCTC CCACCCCTGC TGAGGAACTG TTTGATATAC AGAAGCCTGA 1140

GATACTTGAG ATTATGTGAC AAAGAAATTG TAAACCTGAA TGTGACTAAG GCAGAAGAGA 1200

GCAGGTGAGG CCACACAATA CTGTACACCC ACTTCCGATC GTCATCGAAA TGAGCGTTGT 1260

GGGTACTGGA ACGACAAACC ATAGATCGGA TCTGCATCCG AATAGGCTTT ACTTTGTACA 1320

TTGGTAGGAG TTTGAATGTT TGAAGATCCG GCAGATGATC ACCTGCTGCA GGGAATAATT 1380

TGAAACCTGT CCGTCTGCTT TGACCCAATT GACGAGGTAC GTGATTTGAT GCTACCCAAG 1440

CAGTATGAAT GCGACGGAGG TGGCTATCCT TACCTTGTCA TATGCAACTC ATAACGGGTA 1500

GTCCCCATGG AGCCACGGCT ATTTATTTCT AAGGGCCAAC AGTGAAAGAT TGTGAGATCG 1560

TATACCTCCT GGGTATGACG CAACCAGGGT GAGCACTGGC ATTGCTCCAA TCCATATGGT 1620

GGAGGTATGT CTCCGAGACC ATGACGCATG TAGACCCTGA CCTGTCCCTG ATCCAGGGAT 1680

CTGGTTTGTC ACTTGGCGTA TTTTAATTAA CTGCGGGTCA GGGTCTTGCC GTCCAGACCC 1740

AATGGATGAA TTGCCTGCGT GGCCCTGCAG TTCCAGCGAT CGGCACGGCA CGGCTATGAC 1800

GTCGGTGGGT GTTCCGTTTG ATATTTAACC ATAGAAGACA GCCTTGTTAT GCTGGTTCCT 1860

GCCGCAAAAT AAAGGTCTAT CCTTACCACG TTAAGTGTCA AAATGAGTGG GGTAAGCTTT 1920

GCCCGTCAGG CCTTACTCCA GGCTGCTCTT CTTTCGATTG TCTCCGCAAT CCCGGCGCCC 1980

ACGGCCTTCG TCAACAATGT CGCTCCGCCC GAGCCCATCA TCACCCCTTC GCCGGTTCAA 2040

CATCGACCTT CTCGAGTCGC TGGTCGAAAC ATTCTGAGTG ACGTCGATTC TGATATTAAC 2100

AGCATCCTTT CTGGCCTTGG ATCCGACCTA CCCTCCTGGG TCGCATCGGG TGTGCCCAAC 2160

TACTTCCAGG GTTTCCCTAC TGGGGATGCA GTGGTGAGCT CCTTGGGCTT GAACAGCGCT 2220

GAGTTGGCAG CCTTGCCCAC CAATGTCTTG AATATCGACC CATATGCCAA CTGGACTAGC 2280

TCTGGCTGGA ACGTTCGCTT CCACGGAAAC GTCTACAAGC AGCCCAACAC CTCCATCTCC 2340

GACCTCAATG ATTTGGCTGA TGTTTTCCTC GGCAATACAA GCATCTCCGA CCTTTCCGAA 2400

TCCGAGCAGA AACAGGCTCG GAATTTAACA GCGGAAATAT TAGTGGTCCA GCAAGCTCAC 2460

GTCGCCGTAA ACACAATCCA CCTGGAGCCT GCACCGAGTC AGGGATCCAG CGGACAGTCA 2520

GGCGGCGGTG GATCCTCTAA TACCACTGGC GGCACCCAAG ACCTCACTCT GCCCTACAAC 2580

ACTACAGTTG AAGGCGATTT TGACACTTTC GTACCGATTA GCAGCAATGG CTTGACGGCA 2640

GGTAATGAAA CTTCGGCGAT ACAACGGCTT AACGTCCATG TGGAGGGCGC GACAATAGGA 2700

AACAGTACTG CCTATCTCGT ACCTCCGACC GGGCTCACTG TCGTTTCGGA CATCGATGAT 2760

ATCCTACGCG TCACCAAAAT CTATGAACCA GAGCAAGGTT TACTCAACTC ATTTGCGCGC 2820

CCCTTCAGGC CGTGGGAGAA TATGCCGGAC ATCTATCGCA ACTGGTCGAT CAGTCTCCCC 2880

AACCTGCACT TTCACTACCT AGTAAGTCTG CTAGATGTCC CTGATTGCAT TGTTGCTGCA 2940

TACTCACCAC TACACTACAG ACGACGACCC CCGAACAAGT CACCAGGAAC TACATGCAAT 3000

TCATCTACGA CAACTACCCC GGTGGATCTT TCGACACCCG TCCCCTCAAC TTTAGCGACG 3060

TTTCCGCCAC CTTGTCGATC CGGAAATTCC TCCTGCAAAA GGTCTTCGAG ACCTTTCCGC 3120

AGCGCAAGTT CATCCTCATC GCCGACACCA GCAACAGCGA CGTCATGCGT GACTATCCTG 3180

AAATGGCGAC CGACTTCCCT GGTCAAGTGC AATGTATTTT TCTCCGGAAC ACCAGCGCCA 3240

CCGACTCAGG GGACAAATTC CCATACGATA CCTCTGGGTT TAAGAAGCTC AATCAGTCAA 3300

ACTACATGTT CTTCTTGCAT CCCGATGACT TGACGAATCT AGACATCGCG AATGGCCAGT 3360

GTTACAACAC ATCCATTCCG CAGAATTTAA CGTTTAGTTA TCAGGGTTTG CCATTGGGGC 3420

TGGGTGATGA ACCCACAGCT GTCAATGGGT CTGCCAATCA TACTGCTGAG TCGGCGGCCG 3480

GTTTGTCGGT AAAGGGTGGG ACTGATATGC AGGGTTTGAT CTTTCTGTTC ACCCTGGTTA 3540

CGGCCTATTC CATTTTCTTG TAAATATCAG TTACGATGTA TGAGAGATAA CGACTTTGAT 3600

ATACTCACGG CTCAATTTAC GTTCCAAAAC CGAATACAGC GGATATCTAT GCTCGATGCA 3660

AGGACTACCA CTATGTTACA CTACTAAGGG TTTATCTACT ATGGGAAATA TTAGTGCTTG 3720

GTTTGTTACA GCTCACTCGA GCTTGCGTTA CTAACCACTT TTATCGGTCC ATGGATCCAC 3780

CGCCCAACGC AGTTATCCCA GGAGGTGGCC GCAATGGCCA GTCAAGTCAA TTAAATCTCC 3840

TCTGCTAGGA ATTGCATGGG TTTTGACAGA CAGAACTCGG GGAAAGTATC GATATTCAAT 3900

GATCTGACGG TGGCTCCGAA ATTCGCTAGG CTAGCCCTTC ATCACTAGTA ATATTAGTTG 3960

TCCAACTTTC GCGCTTTACA CTTTCCATAG CAAACCCCCA ATTCCCAGCC AAATCCTCAT 4020

ATCCTCTAGG A 4031

<210>22

<211>3771

<212>DNA

<213>Aspergillus niger

<400>22

GCTTCTATGG TATCAAGGGT CGCGTAGCCA AAAGTTTAAC TGCATCGCTG CGGTATTAGT 60

CGGTGTAGCT GGCTGCAGCT TTCGTTGTGT CCCTGGTCTG TTTAAGAAAC GGTATCAGAT 120

CTGTCCCGCC CGTCCCCCTG ACACCGGCAT TGAGTTTCTC ATGAGAATTG TCCACTATTG 180

TCGACGTTGT TGTGGCTAGG TTTGTTCTCG AAGATACTTG GTTTGGCGGC GGAGTCCTTG 240

CAGCCATGAT GATGTATCGA GTCACCATCC GCACATGCTT ATCGCGAAAT CCCCCAAGTG 300

ACATAACCGC CATGTTATAT GCATCCCTCA AAGCAGATCC GGGCTTGTGA CTTAATACAT 360

AGGATCTCAC ATTAGACGTG CGGAGCATCA TTTCCAAGAA GCGTCGGTGA GGGCCTGGCA 420

TGTAGTTTCG CATGTTCTTG AATATACAGT CAGTATCGAC ATTGCTTTGT CTGGATAACT 480

CCTCGAAGAT CAGTCCTTAC CTGCATAAAA CCAGTCATGA CTTGAGGATT CGACTTGCCG 540

TGAGGCTTGG TCTCCCCAGT GGCCGAATGT TCCACACCCA AGAAAATGTC GAAGGCTTGG 600

ATCAGAGAAC TTTGAGCATT GCTACCACCA CTGTATTGAT GCCATTCGCC TCGTCCTTCC 660

CCAACATCAT AGAATACGCC GTTTGGCAGC CCGGCCGATG CCATGTTCTT GCTGCCGGCT 720

AGGTATGGAC GTAATTGATG GTAAAAGACG GGCGGCGCAC ACTTTTCATA CATGCGTTCC 780

AAGAGGTCAC CGAGTTCCTT GAGACCATAA TTGAGCTGCT CCAGACGAGA AATAACACGC 840

TGGCTATCAT CAACATTAGC TGCATGCATA GCATCCAGCA TTAGCTCGAT GAGCTGTGCT 900

CCCTTGGCCT CGATAGCGAC GGAGAGGACG AAAAACCATT CTTCGTCTTT GGTGCCTGTG 960

AACGAGGTCA CCACTGATAA ATTGTCTGGA TCCGTAACGT CTGTATCAGT GGATGGTACT 1020

GAAAAGTTCC AAAGATTGAG GGCAGCATAT GTAGCACATG GTGGTAGCTC TAAGTGGTTC 1080

GAAACTTCGA TGAATGGGCG TGATATACAG GGGGGTAGCA CCTGTATAGT TGATGTCAGC 1140

GAAGGCACGG GCCATGCAGT GATAGACAAG AAAAGAGGGA TTGAATAAAA GACTCGATTC 1200

TGAAGGGGAG TAATACATCT TTCGGCTTCT CACCACCCCA GATGTAGGCG TGTGTAAGGT 1260

AAGCAAGCAC AACATATGCT CTCCGCCACT CAGGTTCCCC CTTCAACTTC TTCGTAGAGA 1320

GTATACCCAG GTCATCGACA GACCTCCTGA TAGTACCAGA CTGAATCAGG CCAGGCAAGT 1380

CCTGAGCGAT TTCCTCCCAC GGGGAATAGT AAGGGTCTTC CAATCTCCGT ACGGGAGGAA 1440

CTTCCGGGAG GAACCCGTTC TGGAGGGAGA CACCGTACGC AACAAGTGAA ATGTCTTGTG 1500

TATAAAGCAT GATAATATAT GCACTTCAGT AGACAACTTG ATATTCAAGC CTCCTTGAAA 1560

TGATCCTCAT GCAGGTAAGA GTAGATCCAA GTGTTTATAT TGTATTCCCA AGGAGGGACG 1620

GAAGAAAACC GGATCCAGAG GGCTCGAGAT AGGGCCACCT GCATGAGCAA AGACGGGTCA 1680

TTTCCCGTTT CACAACGACC ATTCTCAGGC AGAAAGGCAG TGGATTAGCG GAAAACTTAG 1740

CAACCATCCG GATTTCTGGA GTGGATGCTT TGTTATCTCA CTTCCGGCAA CACGGATGGT 1800

GAGGCGGAAG CGGAACGGTA TCCGGATCCG GAGGGAGGGA CAAACCGAAG TGCCTTGTGT 1860

CACACGCCGG TCCATATATA AATGTTAATT GGTGACGGTC AGCGGATTGT TTCTGGTGTT 1920

CATCCATTTT TTCTTGATAT CCTGGACCCA GTTATTGCAC TTTAATTACT ATCCAAAATC 1980

CACAATGTCG AAGTCGAATG GCGTCAGCCT GGCATTCCCC GCCGAAGCAG CGACAAAGGA 2040

ATATGCAGCA TCTCTAGACT CTTCTGATAG ACTTGCTGCA TTTCGGGAGA AGTTCATCGT 2100

CCCATCGAAA GCAAATATTG CTTCCAAAAA GCTAGCAAAG CCTGGTGGGT TCCATCCTGG 2160

CAACTGTAGA CCTCGTCACT AATGTCACAG GCCTTTCGCC CGAGTCATGC ATTTACTTCT 2220

GCGGTAACTC ACTTGGCATT CAACCCAAGG CCACAGCAAA GTACTTAGAA GCACAGTTGG 2280

ACACTTGGTC ATCTATTGGA GTTGGCGGCC ACTTCACTGA TCTTGAGGGC TCACCCTTGA 2340

AGCAATGGCA GCTGCTCTCA GAGCAAGCAG CTGATTCAAT GAGCAAGATT GTGGGAGCAA 2400

AGCCAGAAGA AGTCGCAGCG ATGGGAACAC TTACAACGAA CCTTCATCTT CTGCTGGCTA 2460

GTTTCTATAA ACCGACTCAA ACAAAGCACA AGATCTTGAT GGATTGGAAG GCTTTCCCAA 2520

GTGATCACGT AAGTTCGAAA GAAGCTGCCT TCTGCTATCA CGGCACTGAC GATTATATAG 2580

TACGCTATCG AATCTCATAT TGCCTGGCAT GACCTGGATC CTAAGGAGTC TATGGTGCTC 2640

ATCGGTCCAG ATGAAGGCGA ATACGAGATA TCCACCCAGA AGATTTTCTC TTATATCGAC 2700

AAGCATGCTG ATGAGGCTGC TATGATTCTT CTTCCTGGTA TTCAATATTA TACTGGGCAA 2760

CTGTTCGATA TCCAGAAAAT TACAAAATAT GCCCATTCGC GCAACATGGT TGTTGGCTGG 2820

GATCTGGCCC ATGCGTTCGC TAATGTTGAG CTAAAGCTGC ATGATTGGAA CGTTGATTTT 2880

GCAGCATGGT GCACATATAA GTACGGAAAC GCCGGTCCTG GAGCAATGGG GGGGCTTTTC 2940

GTGCATGAAC AACACGGAGA GGTCGATTAC AGCGCGGGAG AAGATGCACC CAAATTCCGC 3000

CATCGTCTGA CCGGGTGGTA TGGTGGCGAT CGATCGGTAA GATTCAAGAT GGACAACAGT 3060

ATGTGTGCAC TTGGCTATAG AACAATTTTG TGGGCTAGTA AGCTGATACG ATTGATAACC 3120

AGAGTTCAAA CCTATTCCTG GGGCAGGAGG ATTTCAGATA TCAAATCCTT CGGCCATCGA 3180

CCTTGCGTGT CTTTGTGCCG CTTTATCGGT GTTTGATGAG ACGTCAATGG CAGATCTTCG 3240

CAGAAAATCA TTGAAGCTAA CAGCATACCT TGAGTTCCTT TTGCTCAGGG ATTATGAAGA 3300

AGAATCTAGG CCATTCAGCA TTATCACGCC CAAGGACCCC GAGGCGAGAG GCGCACAACT 3360

GAGTCTATTG CTCAAGCCTG GTCTATTACA GAATGTTGCA CAGAAGTTGC AAGAAGCAGG 3420

AATAGTCTGC GATAAACGGG AGCCGGGTGT TGTGCGTGTC GCTCCGGTTC CTTTGTACAA 3480

CAGCTTCAGC GAGGTTTGGA CATTTGTGAA GATCTTCAAG GATGCACTGC AGCAGTGATG 3540

GGTCTCACTA GATCATTTGG TCAGGACTGA GACCAGATTT GTCAAGTTCG CTCCGATGAA 3600

TGATTTTTTA GATAGATACC AAATTATTTG ATTCTTAGAT TTGTTGAAGC TCTCACTGCG 3660

ACATGGTCCA CAGCCACTGT GCAAAAGCAA ATAACTGAAG TAGGAACTCT ATGATAGACC 3720

CGTACTGTTG AGGTTATAGA TTTCCAAAGC CGTTCCTTGG ATCACCACTT C 3771

<210>23

<211>3562

<212>DNA

<213>Aspergillus niger

<400>23

CCTGTGCTTG TGGTATGACA GAGCCACTGA TATCATCTCC TCTCATCTCC AGTTGTAATC 60

GGAATTGATC GAGGGGGCCA ATCTTCCACA CAGCCCCATG GAAGACGCAC AGATGCTTTC 120

GATGCCACGC TGGCAGACGG CCGCCAACTG TCATCGTCCA GTGCTGCCGC CATTCCCATG 180

CAAAAGCCAA CGCTAAGAAG CGCGCGGGCG CCGAGTTTCC ACGCTTGCAG CTTAGTTCAG 240

CGACCCAGCT CAGTGGCGGC TCGCTCATGC ATAGAAAGAT GGGTTTGGAC CCGCGCTGGG 300

CCTTTCATCT GCAACACTGC TCGCAGACCA TGTGTGACTT TTGGCTGCAA AAAAAAAGAG 360

GCTGGCGACA GCTGATCCAC TGTGCTATTC CTATCTCATC CTCCCCGGCT GGATCGAAAG 420

CTGCACGGCA GGGGAAATCA ACAGTTGGGC TCTGACACGT ATCGAGCTAA CTGATGCGCT 480

GTCCTTCCGC CTAATGCCTA CTAAGTCTTA GGGACGGGAC CATCATCCAA CATGCCACCT 540

TGTCCTTCGT AATTCCTTTT TGATCTCGGT GATGGTGGCC ACCCAGGAAA TGACGTTCCT 600

CACCTTGGCT GCAATTGGTG CCCGATGTCT CATCTCCGCT CAGAACGGCG GCGAGGGCAG 660

AATAAAAATT GACGGGCACA GCAGGAACTA ATCAAACATA CCGGCGGTCT TCTAAATGAT 720

CGTATCTCCC GGAATACTCC CTCTTTCTAC AGAAGCGGGG ATCCATTCGC CCTATATGTA 780

TAGTGGAGCT TTGCCGCACT GATTCGCACG GCATTATACC TCCGCACTGC CGTGCCTTCA 840

TCCACTTGAT TGTGGCCAGG GAAATATCAA CGGGGCAGAT AACTTGCCCT TGCATCATTA 900

TTGCTCCGCA CATTCATTCA TTATCGCTCT GATCCCACAT CCTCACGCAG CTGCGACCGG 960

AGTGTCCACA CTCTAATTGG GATGAGCATT GCCTTTCAGG AACTTGACTT TTTGTGGTTG 1020

CATCTTTTGT TGCCTTACCC ACGCAGGCTT CGTTTATGAG ATAGCGATTT CAGGCCTCAA 1080

ATTGCTGTCA TCACTTCCGG CCCCAAACTC GTGGGCGGTG CCCGCCCATC GCTGGCAAGA 1140

AGCACAGACT AACGCCTTAC TTCGCCTAGT TGCACACGAT GCATCAAGAC TTCCTCCTAT 1200

TTCACAACGA CCAGCTCCTT GCCATTTGTT GTTTCGAATG CCCCCTTCCC CGTGCCTTGC 1260

ATTTCTAATT CCCATCTATA CCCTTTTGCG CTCTCACGCC CGCCTGACTA TCAATTTTTC 1320

TGCCAGCATA ACCCTGCGTG CAGAGCGGTT GACAGCAGGC TTGCTAAGAG TCTTCGTCTA 1380

GAAGAACTGT CTGGGTGGAT TCCTTTTCGG ATTAACTTTT GCTATTTTAA AAGCTGATTG 1440

CACTACGGAG TACACCCGCA ATCTGATTCT CACTGATACT CCAATTAAAG GCCACTAATT 1500

GCTGACATTT GTAACATATT TGCGTTTGCT TTCCGGTTGA AATTGGCGGC TTTGTGCTTT 1560

CGATCGCTAG CAGTCTCTGT GCATGTACAA CTGATCGGCT ATTCAGTCCT ATTCGGAAGC 1620

GGCACTGAGA GGCGGAGACA AGCCACAGAT ACGACGAGTC TGATTTTGAG ACGGGCGCAT 1680

CCAACGAAAG CCTGCGATTG CAATTGAAGA TCTCAATTGG GGGACTGACA ACCTAATACC 1740

TAAACATATC GAGGATTAGG CGCCAACACG AGCATGGGAA GCTTTGGTGC ATGCGACGGC 1800

TGATCCATTT CTAACAACCG TTTTGCGCGC GCGTCCGAGG TAAGGCTCCC GATCCCTTGG 1860

CGCTTTGCAT GTTTCACTCC GATGCATCTA CTGTTTATAT GAGTGCGGTG GGCAAGCTGT 1920

GCCCACCGAC TGAGCATTCT CAACCGGCCC AATGCTGTGG GATCGATCCT CCCCTCCAAA 1980

GTTGTCGCTC GGTTACACTT GATCGGAGCT TGTTCTGTTA TACACCAAAC CATCATGGAT 2040

GTGACTAATT TGGCTGTCGA TTGTCCCGTT ATAGAGACCG GTTCCCTTGC TTTGTGGATG 2100

GCTTCCTCCG AAGTGGACCA GAAGGCCTTG GGCAACTTTG CGGCCATAAC GGGCCTCGAG 2160

AACCCGTTCC TGTCCGCGAT GCTGTACAAG ATTCTGGGGT TGTCTGTTAT GTTATCGAAG 2220

AAACTCCTCC GTGCACGACG ATTGCGGCGC CTAGACCCCA CCCGAGAGAC TAAATCGCTT 2280

CATCTTTATT ACCATATCAT CTGGCTTTCG CGTGAGGGTC TTCTGATATT AGAGGAGTTC 2340

GTCCTGCCAC TGGTTGAGGG ATTTATGGAA CTCAAAATTT TAGCTTACAA GCTGCGCGCC 2400

TCCTTTTACC ATATATTCGT CCTATTTCAG AACCAGCCTG CTGTCCACTC GCCGGGTATC 2460

GTTAGTCTGC CGAGTAGTAC ACCTTTATCC AACGGCGTGA CAGAAGCGGA GTCACCATCC 2520

AAGGATTCCA ATTTGAGATT TTCATTTCAG CTGAAGCCCG ACACGATAAC GGTTTCCGGG 2580

AAGCCCAGTT CCGCCTCGGA TAGTGCGCCA CGAGGCAAGG TTACGCAGGC ACCCCCGGGC 2640

TTTGCGCCGG TTCAACCGCC CAAGTCGAAC TCGGCGTTTC TCCTCCCTGC TCTCGATTAT 2700

ACCCCTACAG CTACCGCATG CTTCAATCAT GCCGCCCTCT TGGCAGATCA ATTCCTCCCG 2760

GGGTCGCACC CGCTCCGTCT GTCCATCAAG CTTGAATTTG CCGCCTACCT CTACGATTGC 2820

CTACATGACG CTCATGCCTG TCGACGGTTG GCCAAGCAAG CCATTGCCGA TGTGTACAAT 2880

GCGCAAGAGG GCATGGACGA CGAGAGCTTC GAGGATGCAG CTGAGATTGT GGGTATTTTG 2940

GGCAAGATGG TGAAGCGGGG AAGGAACACA AGCAGTGCTG GAAATAGCAC CACGGCTGTG 3000

AAAACGCCCC AGGAGGAGCG AAGTGAGGGC AGTCGAACAC CATCCTCTCA GACAACGTTG 3060

AAAAGGCCGG CGCGAGTGCC GAAAAGCACC TCCTCACCGG CGCGCGCGAC CAAGCCGACG 3120

ACTAGCGAGG GGATGTCCCC CGCTGTGCCC GACCCCACCA TGATGAATCC CATATGATGC 3180

CTTTCCCTAC GACCTGTATA TGCTTCTTCT TGGAACTATG GAGTCGCGCA TGAGCGCTTG 3240

GCCTGTGACT TCTACTTGAC TTGCACCTGT CTGTATCATC TCGGTAACGG AGTTGCGGCG 3300

ATAGACTGGA ATTGGGCATC AGCTTGCGGG GAGCTGTGGA ATGAGCGATT AAGCGCGACA 3360

AAAACTTGAG GTGGAAGGGA CAGACCAGCC AATTTGTGAT GGTGACTGTA GATAGATAGA 3420

TGTGTGCAAT ACAAAGTATG TTGTTGATGT CATGCACCCC ACTTGTGTAT GCTTGTCTGG 3480

ACAATGGACC TACACTTAGT CGCAACAACT GTATGTCTCA AGCCAATGGC CATGGGGCAG 3540

GATGGATCGA TGGATCTCTT GT 3562

<210>24

<211>4361

<212>DNA

<213>Aspergillus niger

<400>24

CGACGGACTA ACGTCGCGCG CCCCATTTCA CGTCTTGAAG ACAGATGTGT ATGCGATTGC 60

TCGCGAAATT CTCATCCGAT TCCGTCGGCT TGACCTGACA TCTGGAATAG ACGAACAGGA 120

CTTGGAAGCT ATCATTCGTA TTACCGAAGA GTCCAACGTA CTTCTCACTG ACTGGTGGAA 180

GTCCGTCCCG AAACTGTATG ACTTCGATTA CTGGAAAGCA GACGGTCGAT GGGAAATGAT 240

TGAAGGCCAG CTGCAAAGGC TTCCCTCCGA AGCAAGGCAA CAGGTGGAGA CAATATATCT 300

ACAGGCTGCT GTTCTCCAGT TGACGTACGA CGGCATGGTC ATCCAAGCAA ATAGACCACT 360

GTTGGAGCGA AGAATCAACA GGCTAACATC TTCGCGGGCG ATCGTGGATG CGATGCATAG 420

GGCGCTTGAC CGAGCCACTG CTGCTGCTCT CCGCATATCC CGTGTTCCAG TTCACAAGCT 480

GAAAAATCAT TTTGCTATAG CAGTCGTATC GATGCAAGAG TTCACTGCTG GTGTGATTCT 540

CTGTATACCT CCCACGGTGA AGCCTTTAAC GGCCACCGCT CATGAGGCGA AGGACGGGGT 600

GGTAAGAATA ATACGCGCCA GTCGAAGTCT CAAGAGCCAC GATCGAATAG CAAGGCAAAC 660

TGAACAACTT CTGACGGAAC TACTCAAAGT TACCACCCAA CGCGAGATAA CGCACGCCTT 720

GGCCGATAAT CTCGACACCA ATTTCCCCTC CGATACGCGG CTAACAGGCT CCGTTGTTGC 780

CGGCGCCTCA AGTGACTCCT TGGGTGCAGG ACGCTCCAGG CCAGTTCCCG GATCCGCAGC 840

GCAGGCAGTT GTAGATCCTA TCCAAGGAGC CTGGGACTCA GAATTCAATG CCCTCCCTGC 900

CGTAACGGGA CCTTATGATT TCCTCCCTGC TCAAGCCTTT CAACAGCTGG ACGATACATT 960

TGGTGCCTTT GGAGAATGTA ATATCCCTTG ATCACCCCAG ACTCACATCC AGATTCTGAC 1020

TGACCTCGTG CATAGCCATA TTTAACTTGG TCCCTGATGA TCAAAACAGT ACATGGAACT 1080

GGGGCCGAAC ATTTCCCTAG CCAAAGGAGC ATCAGGGATT CAACGTGATC AGTACAGCCT 1140

TGTAGCTCGC TGAAACTGCC CTGGAGCCAA GCCAAAGCCT AGACAGCAAG GTGCATGGGC 1200

GAGCTTTGCG AGGATTTAGT TGTTATTTAG TATGCCAAGA TTAAGCCACG CAGAATGGCT 1260

TATGGCCATA GTAGCAACAA CGGCCACGGA ACGTTCTTCC ATGTGGTATG GGGAAAGCCG 1320

CCGGATATTT GGGGAGGGCG TGATTGTTCC GGTGGCTATC TTTCCGGTGG AGATAACGGC 1380

GGTGGACCAT CAAAACTCCT CAGCCCGGAT TGCTCGGACT CCGCATCGTC AAGTATCGGT 1440

TTCATGACAG CCATTCGACT ACTTAGAAGA CACAAATAGC TATCCAACTT ACCCGGACCT 1500

TTGATAATAA TTTTCAGCAG ATCTGTCGAT CTCAGAGACA ATAATGCCAC CGTTCTGTGT 1560

GGAAGGCACT GCGCCGTGGT TTAACAATAA TAAAACTCCA AATTGCCCAA AAGCTAGAGC 1620

GAAGGAAAGT CGAGAAGCCC AGTCTAGACT GGCGGGCTGA TCGTCCGGTT CACAACCTGA 1680

TTGACAAATC ATCTGTGACC CTCGATGTTC CGCGGCGTTG AGCGGGTGAG AATGTGGATC 1740

CTAGTGGGGA AGACCCAATT GCCGCCGGAA AAGGTGAGCT TGTGCTGCAC ATGTCCGGTG 1800

GCTCAATTCA GGGCCATGCC AGGACATTGC TCTTCAAAGG GATGCGATTG CTATTCCCTA 1860

TTTACTTCTT TAACCCGCTG ACGGGCCTGT CTGGACCGAG AATTCTTGGT CAAGTTTCAG 1920

TGGAGCGATC CAGGAAAGAA CATCCGATAT GGACAGTTGC CCTCGATCTC AGGTCTGTAG 1980

TCGTGTGACA CAGAGGCCTC TACTCGCTTG CCTTGCATGT CGGAGCTCAA AGGTGCGATG 2040

TGAATTAACA CGAGGAGCGA CTGTCTGTCG CAGATGCAAC ATGAGAAATT TGGAGTGTGT 2100

CTACACAAAA TCACGAAGGT ATCCCTCGTC TATCTTTCCG TGTGTATTAT TAGCCGAGAG 2160

TCACGCAATG CTCTTTGTAT ACAATGAAAT AATGTTGGAG CTAGAGAATG ATTTCTGATA 2220

GTTATATGTT ACAGGACACT CAGGAGGTCG TCAACTAGTC CGAACACGGC GTCCTCTCCT 2280

GACACTAATG CCTCATCTTC GCCATGCTCG GACTCTAGTG GGACCCATGC TGGCATTTCC 2340

ATTCCCCACT CAGATAGTCC CGCCAGTGTG GACGAATGTG GGAACAACGG CCTTTTCGAC 2400

GGGGGTAGGT AATATGTCAT GCTTACCTGC GACACTCACT CACCATTCTT CTAGAATCTC 2460

TAACTCAATT ATTGGTCTCT GGGAGCAAAG CCATATCAGG CCAACCACAT ATCGCCATTA 2520

AGCCACATGT TCTGTCTACC TATCCCCTTG ACAACCTCCT CTCAGACATT GAGGGACTCC 2580

TCGAGCAGCC AGTCTCTCAT TTGGCTCAAA GCAAGGAAGA TCTAACAAAA CCGGACCGGA 2640

TGTTTCGAAC TCGCCTTCCA GCGGTCTCAG GTGAGGACAA TGAGTATCTG CTAAGGAAAG 2700

GAGCTCTGCT GCTCTTGCCA CCAGCCTTGC GCAACGAACT ATTGGCGGCA TATGTCAACT 2760

ACGTCCATCC GCTATTACCG ATTCTTGATC TTGGAGACTT TCTCTCACAA ATCATTGTTG 2820

GAGATGATGC TCAATTCAAG TCACCACTAT TATACCAAGC TGTCATGTTC GCGGGCAGTA 2880

TTTTTGCTCA GCGAGACGGC ACAGACGAAC CTGAACAGCT AACGAGGGCT TTATTTGAAC 2940

GTACAAAGGT TAGTAATGGT TACAATTAGA CATATCTTAG ATATACTGAG CGATTTCCAG 3000

GTTCTATACG AGTTTGAATC CGAATCATGT GCCTACACTC AAATTCAAGC TCTCTTATTG 3060

ATGACTCTCT GGCATGGAGA TATGTCACGC CACAAAGGCC CGTCTTACTG GCTTGACGTC 3120

GCCTTCTCCA CTGCGGAAAG AATTGGCCTA CTCCATGATG AAGACTGGCC ATGCGATAGC 3180

CGTTCCTTCC GATCCGCTAT GTGGTGTTGC CTTTACGTAC GTGATCGAAC AATCTCGCTT 3240

GGGTCTCGTC GGCCTCCACG GATGCCAGTC AACAAATATC CGGACTCAAT TCTCCATCTT 3300

ATGAGCGACG CACCTCGGGA ATATGACGAA ATAATTCTTG AGAGTCTAGG TAGCGCTTCT 3360

CTGATGCTTA CAAGCACTTA CCAAGAACAA TCGACCATGC TCTTCAAGGA ACTTGTCAAA 3420

CTCTCCTACT GCGTCGGGGC AATCTTAGAT TATCTATACG AAGGGGCCTG GGTCCGAATA 3480

CCAACACGTC GCAGCAGCTT TTATTCACTC GCCCCTAAAT GCAGCATCTC GCCATCCATC 3540

AGACCAAGCT GTGAGAAACT ACTTTACTCT TGGATTCAAT TCCTCCCTCT CAACGCAGTC 3600

TACCATCCGC CACAGTTGCC CGCCGATGCG GAAGGGGAGT CAGCCGAAAC AGTCTTCCTT 3660

GTCCACAAAG CCTTCCTTTA CTTGCTGTAC CTAGCCTCCA TGGCAGTCAT ATACCGCACA 3720

GGCACTCATA GCCAACAAAC CAGCACGGCA ACTCCGAACA TGGAAGGTCT ACGGGCATCG 3780

ACGTCACAAA TAAAAAAGGT CCTTGCGGAG CTGCAGGGCA TGGGACTGCT TCAGTTCCTT 3840

CCAGGGGCAT CAGTCACTAT CCTGATGTTC GCTGTGGAGG CTAGTCTGTT GGATCTCCAG 3900

GGCTCGGATA CCATGGTCCG AAGGCAGGCT ATGTCAAATC TATATGCCTG TGAGGAGGCT 3960

GCGTTACACT TGATGCAGGC TTATCCTACG GCTGAGATGG CGGTATTGAA GACTAGGACA 4020

GCCCGTGCAA ACCTTCTTGG GTTGGTTGAG ACATGAAGAC CAATCATGGA AGCTCTGCTT 4080

CCATCAAAGC ATTGTGTCTT TGCTTAATGA ATGAATGGAT TATGAGCGTT TCGCAACCTT 4140

CTTTAATGCA GCTACATAAT AGAGCATAAA CAGAGGCCCG GAAATATATA ATTTGGCTAA 4200

GAACCCGGTT GCAAGCAGGC AAGTCACGAG GTGCAGAACA TACCATCAAG TTTATAGATT 4260

ATTGTAGGGG ATATCCTCAA CAATATCTTA CTTCCACCAT TACGTACTGA AGATCGAGGT 4320

TATCGGGGAC CATGCTGTCG TGTCAATAGG TACGACTCGT T 4361

<210>25

<211>801

<212>DNA

<213>Aspergillus niger

<220>

<221>CDS

<222>(1)..(801)

<400>5

atg cct atc tcc att ccc tcc gcc tcc agc gtc cac gac ctc ttc agc 48

Met Pro Ile Ser Ile Pro Ser Ala Ser Ser Val His Asp Leu Phe Ser

1 5 10 15

ctg aag ggc aag gtc gtc gtt atc acc ggc gct tcc ggc cct cgc ggc 96

Leu Lys Gly Lys Val Val Val Ile Thr Gly Ala Ser Gly Pro Arg Gly

20 25 30

atg ggc att gaa gcc gcg cgt ggc tgc gcc gaa atg ggc gcc aac atc 144

Met Gly Ile Glu Ala Ala Arg Gly Cys Ala Glu Met Gly Ala Asn Ile

35 40 45

gcc ctc acc tac tcc tct cgt cct cag ggt ggt gag aag aac gcc gaa 192

Ala Leu Thr Tyr Ser Ser Arg Pro Gln Gly Gly Glu Lys Asn Ala Glu

50 55 60

gaa ctt cgc aac acc tac ggc gtc aag gcc aag gcc tac cag tgc aac 240

Glu Leu Arg Asn Thr Tyr Gly Val Lys Ala Lys Ala Tyr Gln Cys Asn

65 70 75 80

gtg ggc gac tgg aac agc gtc aag aag ctc gtg gac gac gtg ctg gcc 288

Val Gly Asp Trp Asn Ser Val Lys Lys Leu Val Asp Asp Val Leu Ala

85 90 95

gag ttt ggc cag att gac gcc ttc att gcc aac gct ggc aag aca gcc 336

Glu Phe Gly Gln Ile Asp Ala Phe Ile Ala Asn Ala Gly Lys Thr Ala

100 105 110

agc agt ggt atc ctg gat ggt tcc gtt gag gac tgg gaa gag gtc atc 384

Ser Ser Gly Ile Leu Asp Gly Ser Val Glu Asp Trp Glu Glu Val Ile

115 120 125

cag aca gac ctg acg ggt acc ttc cac tgc gcc aag gcg gtg ggc ccg 432

Gln Thr Asp Leu Thr Gly Thr Phe His Cys Ala Lys Ala Val Gly Pro

130 135 140

cac ttc aag cag cgc gga acg ggc agc ttc atc atc acc tcc agc atg 480

His Phe Lys Gln Arg Gly Thr Gly Ser Phe Ile Ile Thr Ser Ser Met

145 150 155 160

tcg ggt cac att gcc aac ttc ccg cag gag cag acg tcg tac aac gtt 528

Ser Gly His Ile Ala Asn Phe Pro Gln Glu Gln Thr Ser Tyr Asn Val

165 170 175

gcc aag gca ggc tgc atc cat atg gcc cgg tca ttg gcc aac gag tgg 576

Ala Lys Ala Gly Cys Ile His Met Ala Arg Ser Leu Ala Asn Glu Trp

180 185 190

agg gac ttt gcc cgc gtg aac agc atc tcc ccg ggt tac atc gac acg 624

Arg Asp Phe Ala Arg Val Asn Ser Ile Ser Pro Gly Tyr Ile Asp Thr

195 200 205

ggg ctg tcg gac ttt gtg gat aag aag act cag gat ctg tgg atg tcg 672

Gly Leu Ser Asp Phe Val Asp Lys Lys Thr Gln Asp Leu Trp Met Ser

210 215 220

atg atc ccc atg gga cgc aac ggt gat gcc aag gag ctg aag ggt gca 720

Met Ile Pro Met Gly Arg Asn Gly Asp Ala Lys Glu Leu Lys Gly Ala

225 230 235 240

tat gtc tat ctc gcc agt gat gcc agc aca tac acg acg ggt gcc gat 768

Tyr Val Tyr Leu Ala Ser Asp Ala Ser Thr Tyr Thr Thr Gly Ala Asp

245 250 255

ttg gtc att gac gga gga tac acc gtg cgg taa 801

Leu Val Ile Asp Gly Gly Tyr Thr Val Arg

260 265

<210>26

<211>1602

<212>DNA

<213>Aspergillus niger

<220>

<221>CDS

<222>(1)..(1602)

<400>26

atg agt ggg gta agc ttt gcc cgt cag gcc tta ctc cag gct gct ctt 48

Met Ser Gly Val Ser Phe Ala Arg Gln Ala Leu Leu Gln Ala Ala Leu

1 5 10 15

ctt tcg att gtc tcc gca atc ccg gcg ccc acg gcc ttc gtc aac aat 96

Leu Ser Ile Val Ser Ala Ile Pro Ala Pro Thr Ala Phe Val Asn Asn

20 25 30

gtc gct ccg ccc gag ccc atc atc acc cct tcg ccg gtt caa cat cga 144

Val Ala Pro Pro Glu Pro Ile Ile Thr Pro Ser Pro Val Gln His Arg

35 40 45

cct tct cga gtc gct ggt cga aac att ctg agt gac gtc gat tct gat 192

Pro Ser Arg Val Ala Gly Arg Asn Ile Leu Ser Asp Val Asp Ser Asp

50 55 60

att aac agc atc ctt tct ggc ctt gga tcc gac cta ccc tcc tgg gtc 240

Ile Asn Ser Ile Leu Ser Gly Leu Gly Ser Asp Leu Pro Ser Trp Val

65 70 75 80

gca tcg ggt gtg ccc aac tac ttc cag ggt ttc cct act ggg gat gca 288

Ala Ser Gly Val Pro Asn Tyr Phe Gln Gly Phe Pro Thr Gly Asp Ala

85 90 95

gtg gtg agc tcc ttg ggc ttg aac agc gct gag ttg gca gcc ttg ccc 336

Val Val Ser Ser Leu Gly Leu Asn Ser Ala Glu Leu Ala Ala Leu Pro

100 105 110

acc aat gtc ttg aat atc gac cca tat gcc aac tgg act agc tct ggc 384

Thr Asn Val Leu Asn Ile Asp Pro Tyr Ala Asn Trp Thr Ser Ser Gly

115 120 125

tgg aac gtt cgc ttc cac gga aac gtc tac aag cag ccc aac acc tcc 432

Trp Asn Val Arg Phe His Gly Asn Val Tyr Lys Gln Pro Asn Thr Ser

130 135 140

atc tcc gac ctc aat gat ttg gct gat gtt ttc ctc ggc aat aca agc 480

Ile Ser Asp Leu Asn Asp Leu Ala Asp Val Phe Leu Gly Asn Thr Ser

145 150 155 160

atc tcc gac ctt tcc gaa tcc gag cag aaa cag gct cgg aat tta aca 528

Ile Ser Asp Leu Ser Glu Ser Glu Gln Lys Gln Ala Arg Asn Leu Thr

165 170 175

gcg gaa ata tta gtg gtc cag caa gct cac gtc gcc gta aac aca atc 576

Ala Glu Ile Leu Val Val Gln Gln Ala His Val Ala Val Asn Thr Ile

180 185 190

cac ctg gag cct gca ccg agt cag gga tcc agc gga cag tca ggc ggc 624

His Leu Glu Pro Ala Pro Ser Gln Gly Ser Ser Gly Gln Ser Gly Gly

195 200 205

ggt gga tcc tct aat acc act ggc ggc acc caa gac ctc act ctg ccc 672

Gly Gly Ser Ser Asn Thr Thr Gly Gly Thr Gln Asp Leu Thr Leu Pro

210 215 220

tac aac act aca gtt gaa ggc gat ttt gac act ttc gta ccg att agc 720

Tyr Asn Thr Thr Val Glu Gly Asp Phe Asp Thr Phe Val Pro Ile Ser

225 230 235 240

agc aat ggc ttg acg gca ggt aat gaa act tcg gcg ata caa cgg ctt 768

Ser Asn Gly Leu Thr Ala Gly Asn Glu Thr Ser Ala Ile Gln Arg Leu

245 250 255

aac gtc cat gtg gag ggc gcg aca ata gga aac agt act gcc tat ctc 816

Asn Val His Val Glu Gly Ala Thr Ile Gly Asn Ser Thr Ala Tyr Leu

260 265 270

gta cct ccg acc ggg ctc act gtc gtt tcg gac atc gat gat atc cta 864

Val Pro Pro Thr Gly Leu Thr Val Val Ser Asp Ile Asp Asp Ile Leu

275 280 285

cgc gtc acc aaa atc tat gaa cca gag caa ggt tta ctc aac tca ttt 912

Arg Val Thr Lys Ile Tyr Glu Pro Glu Gln Gly Leu Leu Asn Ser Phe

290 295 300

gcg cgc ccc ttc agg ccg tgg gag aat atg ccg gac atc tat cgc aac 960

Ala Arg Pro Phe Arg Pro Trp Glu Asn Met Pro Asp Ile Tyr Arg Asn

305 310 315 320

tgg tcg atc agt ctc ccc aac ctg cac ttt cac tac cta acg acg acc 1008

Trp Ser Ile Ser Leu Pro Asn Leu His Phe His Tyr Leu Thr Thr Thr

325 330 335

ccc gaa caa gtc acc agg aac tac atg caa ttc atc tac gac aac tac 1056

Pro Glu Gln Val Thr Arg Asn Tyr Met Gln Phe Ile Tyr Asp Asn Tyr

340 345 350

ccc ggt gga tct ttc gac acc cgt ccc ctc aac ttt agc gac gtt tcc 1104

Pro Gly Gly Ser Phe Asp Thr Arg Pro Leu Asn Phe Ser Asp Val Ser

355 360 365

gcc acc ttg tcg atc cgg aaa ttc ctc ctg caa aag gtc ttc gag acc 1152

Ala Thr Leu Ser Ile Arg Lys Phe Leu Leu Gln Lys Val Phe Glu Thr

370 375 380

ttt ccg cag cgc aag ttc atc ctc atc gcc gac acc agc aac agc gac 1200

Phe Pro Gln Arg Lys Phe Ile Leu Ile Ala Asp Thr Ser Asn Ser Asp

385 390 395 400

gtc atg cgt gac tat cct gaa atg gcg acc gac ttc cct ggt caa gtg 1248

Val Met Arg Asp Tyr Pro Glu Met Ala Thr Asp Phe Pro Gly Gln Val

405 410 415

caa tgt att ttt ctc cgg aac acc agc gcc acc gac tca ggg gac aaa 1296

Gln Cys Ile Phe Leu Arg Asn Thr Ser Ala Thr Asp Ser Gly Asp Lys

420 425 430

ttc cca tac gat acc tct ggg ttt aag aag ctc aat cag tca aac tac 1344

Phe Pro Tyr Asp Thr Ser Gly Phe Lys Lys Leu Asn Gln Ser Asn Tyr

435 440 445

atg ttc ttc ttg cat ccc gat gac ttg acg aat cta gac atc gcg aat 1392

Met Phe Phe Leu His Pro Asp Asp Leu Thr Asn Leu Asp Ile Ala Asn

450 455 460

ggc cag tgt tac aac aca tcc att ccg cag aat tta acg ttt agt tat 1440

GLy Gln Cys Tyr Asn Thr Ser Ile Pro Gln Asn Leu Thr Phe Ser Tyr

465 470 475 480

cag ggt ttg cca ttg ggg ctg ggt gat gaa ccc aca gct gtc aat ggg 1488

Gln Gly Leu Pro Leu Gly Leu Gly Asp Glu Pro Thr Ala Val Asn Gly

485 490 495

tct gcc aat cat act gct gag tcg gcg gcc ggt ttg tcg gta aag ggt 1536

Ser Ala Asn His Thr Ala Glu Ser Ala Ala Gly Leu Ser Val Lys Gly

500 505 510

ggg act gat atg cag ggt ttg atc ttt ctg ttc acc ctg gtt acg gcc 1584

Gly Thr Asp Met Gln Gly Leu Ile Phe Leu Phe Thr Leu Val Thr Ala

515 520 525

tat tcc att ttc ttg taa 1602

Tyr Ser Ile Phe Leu

530

<210>27

<211>1392

<212>DNA

<213>Aspergillus niger

<220>

<221>CDS

<222>(1)..(1392)

<400>27

atg tcg aag tcg aat ggc gtc agc ctg gca ttc ccc gcc gaa gca gcg 48

Met Ser Lys Ser Asn Gly Val Ser Leu Ala Phe Pro Ala Glu Ala Ala

1 5 10 15

aca aag gaa tat gca gca tct cta gac tct tct gat aga ctt gct gca 96

Thr Lys Glu Tyr Ala Ala Ser Leu Asp Ser Ser Asp Arg Leu Ala Ala

20 25 30

ttt cgg gag aag ttc atc gtc cca tcg aaa gca aat att gct tcc aaa 144

Phe Arg Glu Lys Phe Ile Val Pro Ser Lys Ala Asn Ile Ala Ser Lys

35 40 45

aag cta gca aag cct ggc ctt tcg ccc gag tca tgc att tac ttc tgc 192

Lys Leu Ala Lys Pro Gly Leu Ser Pro Glu Ser Cys Ile Tyr Phe Cys

50 55 60

ggt aac tca ctt ggc att caa ccc aag gcc aca gca aag tac tta gaa 240

Gly Asn Ser Leu Gly Ile Gln Pro Lys Ala Thr Ala Lys Tyr Leu Glu

65 70 75 80

gca cag ttg gac act tgg tca tct att gga gtt ggc ggc cac ttc act 288

Ala Gln Leu Asp Thr Trp Ser Ser Ile Gly Val Gly Gly His Phe Thr

85 90 95

gat ctt gag ggc tca ccc ttg aag caa tgg cag ctg ctc tca gag caa 336

Asp Leu Glu Gly Ser Pro Leu Lys Gln Trp Gln Leu Leu Ser Glu Gln

100 105 110

gca gct gat tca atg agc aag att gtg gga gca aag cca gaa gaa gtc 384

Ala Ala Asp Ser Met Ser Lys Ile Val Gly Ala Lys Pro Glu Glu Val

115 120 125

gca gcg atg gga aca ctt aca acg aac ctt cat ctt ctg ctg gct agt 432

Ala Ala Met Gly Thr Leu Thr Thr Asn Leu His Leu Leu Leu Ala Ser

130 135 140

ttc tat aaa ccg act caa aca aag cac aag atc ttg atg gat tgg aag 480

Phe Tyr Lys Pro Thr Gln Thr Lys His Lys Ile Leu Met Asp Trp Lys

145 150 155 160

gct ttc cca agt gat cac tac gct atc gaa tct cat att gcc tgg cat 528

Ala Phe Pro Ser Asp His Tyr Ala Ile Glu Ser His Ile Ala Trp His

165 170 175

gac ctg gat cct aag gag tct atg gtg ctc atc ggt cca gat gaa ggc 576

Asp Leu Asp Pro Lys Glu Ser Met Val Leu Ile Gly Pro Asp Glu Gly

180 185 190

gaa tac gag ata tcc acc cag aag att ttc tct tat atc gac aag cat 624

Glu Tyr Glu Ile Ser Thr Gln Lys Ile Phe Ser Tyr Ile Asp Lys His

195 200 205

gct gat gag gct gct atg att ctt ctt cct ggt att caa tat tat act 672

Ala Asp Glu Ala Ala Met Ile Leu Leu Pro Gly Ile Gln Tyr Tyr Thr

210 215 220

ggg caa ctg ttc gat atc cag aaa att aca aaa tat gcc cat tcg cgc 720

Gly Gln Leu Phe Asp Ile Gln Lys Ile Thr Lys Tyr Ala His Ser Arg

225 230 235 240

aac atg gtt gtt ggc tgg gat ctg gcc cat gcg ttc gct aat gtt gag 768

Asn Met Val Val Gly Trp Asp Leu Ala His Ala Phe Ala Asn Val Glu

245 250 255

cta aag ctg cat gat tgg aac gtt gat ttt gca gca tgg tgc aca tat 816

Leu Lys Leu His Asp Trp Asn Val Asp Phe Ala Ala Trp Cys Thr Tyr

260 265 270

aag tac gga aac gcc ggt cct gga gca atg ggg ggg ctt ttc gtg cat 864

Lys Tyr Gly Asn Ala Gly Pro Gly Ala Met Gly Gly Leu Phe Val His

275 280 285

gaa caa cac gga gag gtc gat tac agc gcg gga gaa gat gca ccc aaa 912

Glu Gln His Gly Glu Val Asp Tyr Ser Ala Gly Glu Asp Ala Pro Lys

290 295 300

ttc cgc cat cgt ctg acc ggg tgg tat ggt ggc gat cga tcg gta aga 960

Phe Arg His Arg Leu Thr Gly Trp Tyr Gly Gly Asp Arg Ser Val Arg

305 310 315 320

ttc aag atg gac aac aag ttc aaa cct att cct ggg gca gga gga ttt 1008

Phe Lys Met Asp Asn Lys Phe Lys Pro Ile Pro Gly Ala Gly Gly Phe

325 330 335

cag ata tca aat cct tcg gcc atc gac ctt gcg tgt ctt tgt gcc gct 1056

Gln Ile Ser Asn Pro Ser Ala Ile Asp Leu Ala Cys Leu Cys Ala Ala

340 345 350

tta tcg gtg ttt gat gag acg tca atg gca gat ctt cgc aga aaa tca 1104

Leu Ser Val Phe Asp Glu Thr Ser Met Ala Asp Leu Arg Arg Lys Ser

355 360 365

ttg aag cta aca gca tac ctt gag ttc ctt ttg ctc agg gat tat gaa 1152

Leu Lys Leu Thr Ala Tyr Leu Glu Phe Leu Leu Leu Arg Asp Tyr Glu

370 375 380

gaa gaa tct agg cca ttc agc att atc acg ccc aag gac ccc gag gcg 1200

Glu Glu Ser Arg Pro Phe Ser Ile Ile Thr Pro Lys Asp Pro Glu Ala

385 390 395 400

aga ggc gca caa ctg agt cta ttg ctc aag cct ggt cta tta cag aat 1248

Arg Gly Ala Gln Leu Ser Leu Leu Leu Lys Pro Gly Leu Leu Gln Asn

405 410 415

gtt gca cag aag ttg caa gaa gca gga ata gtc tgc gat aaa cgg gag 1296

Val Ala Gln Lys Leu Gln Glu Ala Gly Ile Val Cys Asp Lys Arg Glu

420 425 430

ccg ggt gtt gtg cgt gtc gct ccg gtt cct ttg tac aac agc ttc agc 1344

Pro Gly Val Val Arg Val Ala Pro Val Pro Leu Tyr Asn Ser Phe Ser

435 440 445

gag gtt tgg aca ttt gtg aag atc ttc aag gat gca ctg cag cag tga 1392

Glu Val Trp Thr Phe Val Lys Ile Phe Lys Asp Ala Leu Gln Gln

450 455 460

<210>28

<211>1143

<212>DNA

<213>Aspergillus niger

<220>

<221>CDS

<222>(1)..(1143)

<400>28

atg gat gtg act aat ttg gct gtc gat tgt ccc gtt ata gag acc ggt 48

Met Asp Val Thr Asn Leu Ala Val Asp Cys Pro Val Ile Glu Thr Gly

1 5 10 15

tcc ctt gct ttg tgg atg gct tcc tcc gaa gtg gac cag aag gcc ttg 96

Ser Leu Ala Leu Trp Met Ala Ser Ser Glu Val Asp Gln Lys Ala Leu

20 25 30

ggc aac ttt gcg gcc ata acg ggc ctc gag aac ccg ttc ctg tcc gcg 144

Gly Asn Phe Ala Ala Ile Thr Gly Leu Glu Asn Pro Phe Leu Ser Ala

35 40 45

atg ctg tac aag att ctg ggg ttg tct gtt atg tta tcg aag aaa ctc 192

Met Leu Tyr Lys Ile Leu Gly Leu Ser Val Met Leu Ser Lys Lys Leu

50 55 60

ctc cgt gca cga cga ttg cgg cgc cta gac ccc acc cga gag act aaa 240

Leu Arg Ala Arg Arg Leu Arg Arg Leu Asp Pro Thr Arg Glu Thr Lys

65 70 75 80

tcg ctt cat ctt tat tac cat atc atc tgg ctt tcg cgt gag ggt ctt 288

Ser Leu His Leu Tyr Tyr His Ile Ile Trp Leu Ser Arg Glu Gly Leu

85 90 95

ctg ata tta gag gag ttc gtc ctg cca ctg gtt gag gga ttt atg gaa 336

Leu Ile Leu Glu Glu Phe Val Leu Pro Leu Val Glu Gly Phe Met Glu

100 105 110

ctc aaa att tta gct tac aag ctg cgc gcc tcc ttt tac cat ata ttc 384

Leu Lys Ile Leu Ala Tyr Lys Leu Arg Ala Ser Phe Tyr His Ile Phe

115 120 125

gtc cta ttt cag aac cag cct gct gtc cac tcg ccg ggt atc gtt agt 432

Val Leu Phe Gln Asn Gln Pro Ala Val His Ser Pro Gly Ile Val Ser

130 135 140

ctg ccg agt agt aca cct tta tcc aac ggc gtg aca gaa gcg gag tca 480

Leu Pro Ser Ser Thr Pro Leu Ser Asn Gly Val Thr Glu Ala Glu Ser

145 150 155 160

cca tcc aag gat tcc aat ttg aga ttt tca ttt cag ctg aag ccc gac 528

Pro Ser Lys Asp Ser Asn Leu Arg Phe Ser Phe Gln Leu Lys Pro Asp

165 170 175

acg ata acg gtt tcc ggg aag ccc agt tcc gcc tcg gat agt gcg cca 576

Thr Ile Thr Val Ser Gly Lys Pro Ser Ser Ala Ser Asp Ser Ala Pro

180 185 190

cga ggc aag gtt acg cag gca ccc ccg ggc ttt gcg ccg gtt caa ccg 624

Arg Gly Lys Val Thr Gln Ala Pro Pro Gly Phe Ala Pro Val Gln Pro

195 200 205

ccc aag tcg aac tcg gcg ttt ctc ctc cct gct ctc gat tat acc cct 672

Pro Lys Ser Asn Ser Ala Phe Leu Leu Pro Ala Leu Asp Tyr Thr Pro

210 215 220

aca gct acc gca tgc ttc aat cat gcc gcc ctc ttg gca gat caa ttc 720

Thr Ala Thr Ala Cys Phe Asn His Ala Ala Leu Leu Ala Asp Gln Phe

225 230 235 240

ctc ccg ggg tcg cac ccg ctc cgt ctg tcc atc aag ctt gaa ttt gcc 768

Leu Pro Gly Ser His Pro Leu Arg Leu Ser Ile Lys Leu Glu Phe Ala

245 250 255

gcc tac ctc tac gat tgc cta cat gac gct cat gcc tgt cga cgg ttg 816

Ala Tyr Leu Tyr Asp Cys Leu His Asp Ala His Ala Cys Arg Arg Leu

260 265 270

gcc aag caa gcc att gcc gat gtg tac aat gcg caa gag ggc atg gac 864

Ala Lys Gln Ala Ile Ala Asp Val Tyr Asn Ala Gln Glu Gly Met Asp

275 280 285

gac gag agc ttc gag gat gca gct gag att gtg ggt att ttg ggc aag 912

Asp Glu Ser Phe Glu Asp Ala Ala Glu Ile Val Gly Ile Leu Gly Lys

290 295 300

atg gtg aag cgg gga agg aac aca agc agt gct gga aat agc acc acg 960

Met Val Lys Arg Gly Arg Asn Thr Ser Ser Ala Gly Asn Ser Thr Thr

305 310 315 320

gct gtg aaa acg ccc cag gag gag cga agt gag ggc agt cga aca cca 1008

Ala Val Lys Thr Pro Gln Glu Glu Arg Ser Glu Gly Ser Arg Thr Pro

325 330 335

tcc tct cag aca acg ttg aaa agg ccg gcg cga gtg ccg aaa agc acc 1056

Ser Ser Gln Thr Thr Leu Lys Arg Pro Ala Arg Val Pro Lys Ser Thr

340 345 350

tcc tca ccg gcg cgc gcg acc aag ccg acg act agc gag ggg atg tcc 1104

Ser Ser Pro Ala Arg Ala Thr Lys Pro Thr Thr Ser Glu Gly Met Ser

355 360 365

ccc gct gtg ccc gac ccc acc atg atg aat ccc ata tga 1143

Pro Ala Val Pro Asp Pro Thr Met Met Asn Pro Ile

370 375 380

<210>29

<211>1779

<212>DNA

<213>Aspergillus niger

<220>

<221>CDS

<222>(1)..(1779)

<400>29

atg aga aat ttg gag tgt gtc tac aca aaa tca cga agg tat ccc tcg 48

Met Arg Asn Leu Glu Cys Val Tyr Thr Lys Ser Arg Arg Tyr Pro Ser

1 5 10 15

tct atc ttt ccg aca ctc agg agg tcg tca act agt ccg aac acg gcg 96

Ser Ile Phe Pro Thr Leu Arg Arg Ser Ser Thr Ser Pro Asn Thr Ala

20 25 30

tcc tct cct gac act aat gcc tca tct tcg cca tgc tcg gac tct agt 144

Ser Ser Pro Asp Thr Asn Ala Ser Ser Ser Pro Cys Ser Asp Ser Ser

35 40 45

ggg acc cat gct ggc att tcc att ccc cac tca gat agt ccc gcc agt 192

Gly Thr His Ala Gly Ile Ser Ile Pro His Ser Asp Ser Pro Ala Ser

50 55 60

gtg gac gaa tgt ggg aac aac ggc ctt ttc gac ggg gaa tct cta act 240

Val Asp Glu Cys Gly Asn Asn Gly Leu Phe Asp Gly Glu Ser Leu Thr

65 70 75 80

caa tta ttg gtc tct ggg agc aaa gcc ata tca ggc caa cca cat atc 288

Gln Leu Leu Val Ser Gly Ser Lys Ala Ile Ser Gly Gln Pro His Ile

85 90 95

gcc att aag cca cat gtt ctg tct acc tat ccc ctt gac aac ctc ctc 336

Ala Ile Lys Pro His Val Leu Ser Thr Tyr Pro Leu Asp Asn Leu Leu

100 105 110

tca gac att gag gga ctc ctc gag cag cca gtc tct cat ttg gct caa 384

Ser Asp Ile Glu Gly Leu Leu Glu Gln Pro Val Ser His Leu Ala Gln

115 120 125

agc aag gaa gat cta aca aaa ccg gac cgg atg ttt cga act cgc ctt 432

Ser Lys Glu Asp Leu Thr Lys Pro Asp Arg Met Phe Arg Thr Arg Leu

130 135 140

cca gcg gtc tca ggt gag gac aat gag tat ctg cta agg aaa gga gct 480

Pro Ala Val Ser Gly Glu Asp Asn Glu Tyr Leu Leu Arg Lys Gly Ala

145 150 155 160

ctg ctg ctc ttg cca cca gcc ttg cgc aac gaa cta ttg gcg gca tat 528

Leu Leu Leu Leu Pro Pro Ala Leu Arg Asn Glu Leu Leu Ala Ala Tyr

165 170 175

gtc aac tac gtc cat ccg cta tta ccg att ctt gat ctt gga gac ttt 576

Val Asn Tyr Val His Pro Leu Leu Pro Ile Leu Asp Leu Gly Asp Phe

180 185 190

ctc tca caa atc att gtt gga gat gat gct caa ttc aag tca cca cta 624

Leu Ser Gln Ile Ile Val Gly Asp Asp Ala Gln Phe Lys Ser Pro Leu

195 200 205

tta tac caa gct gtc atg ttc gcg ggc agt att ttt gct cag cga gac 672

Leu Tyr Gln Ala Val Met Phe Ala Gly Ser Ile Phe Ala Gln Arg Asp

210 215 220

ggc aca gac gaa cct gaa cag cta acg agg gct tta ttt gaa cgt aca 720

Gly Thr Asp Glu Pro Glu Gln Leu Thr Arg Ala Leu Phe Glu Arg Thr

225 230 235 240

aag gtt cta tac gag ttt gaa tcc gaa tca tgt gcc tac act caa att 768

Lys Val Leu Tyr Glu Phe Glu Ser Glu Ser Cys Ala Tyr Thr Gln Ile

245 250 255

caa gct ctc tta ttg atg act ctc tgg cat gga gat atg tca cgc cac 816

Gln Ala Leu Leu Leu Met Thr Leu Trp His Gly Asp Met Ser Arg His

260 265 270

aaa ggc ccg tct tac tgg ctt gac gtc gcc ttc tcc act gcg gaa aga 864

Lys Gly Pro Ser Tyr Trp Leu Asp Val Ala Phe Ser Thr Ala Glu Arg

275 280 285

att ggc cta ctc cat gat gaa gac tgg cca tgc gat agc cgt tcc ttc 912

Ile Gly Leu Leu His Asp Glu Asp Trp Pro Cys Asp Ser Arg Ser Phe

290 295 300

cga tcc gct atg tgg tgt tgc ctt tac gta cgt gat cga aca atc tcg 960

Arg Ser Ala Met Trp Cys Cys Leu Tyr Val Arg Asp Arg Thr Ile Ser

305 310 315 320

ctt ggg tct cgt cgg cct cca cgg atg cca gtc aac aaa tat ccg gac 1008

Leu Gly Ser Arg Arg Pro Pro Arg Met Pro Val Asn Lys Tyr Pro Asp

325 330 335

tca att ctc cat ctt atg agc gac gca cct cgg gaa tat gac gaa ata 1056

Ser Ile Leu His Leu Met Ser Asp Ala Pro Arg Glu Tyr Asp Glu Ile

340 345 350

att ctt gag agt cta ggt agc gct tct ctg atg ctt aca agc act tac 1104

Ile Leu Glu Ser Leu Gly Ser Ala Ser Leu Met Leu Thr Ser Thr Tyr

355 360 365

caa gaa caa tcg acc atg ctc ttc aag gaa ctt gtc aaa ctc tcc tac 1152

Gln Glu Gln Ser Thr Met Leu Phe Lys Glu Leu Val Lys Leu Ser Tyr

370 375 380

tgc gtc ggg gca atc tta gat tat cta tac gaa ggg gcc tgg gtc cga 1200

Cys Val Gly Ala Ile Leu Asp Tyr Leu Tyr Glu Gly Ala Trp Val Arg

385 390 395 400

ata cca aca cgt cgc agc agc ttt tat tca ctc gcc cct aaa tgc agc 1248

Ile Pro Thr Arg Arg Ser Ser Phe Tyr Ser Leu Ala Pro Lys Cys Ser

405 410 415

atc tcg cca tcc atc aga cca agc tgt gag aaa cta ctt tac tct tgg 1296

Ile Ser Pro Ser Ile Arg Pro Ser Cys Glu Lys Leu Leu Tyr Ser Trp

420 425 430

att caa ttc ctc cct ctc aac gca gtc tac cat ccg cca cag ttg ccc 1344

Ile Gln Phe Leu Pro Leu Asn Ala Val Tyr His Pro Pro Gln Leu Pro

435 440 445

gcc gat gcg gaa ggg gag tca gcc gaa aca gtc ttc ctt gtc cac aaa 1392

Ala Asp Ala Glu Gly Glu Ser Ala Glu Thr Val Phe Leu Val His Lys

450 455 460

gcc ttc ctt tac ttg ctg tac cta gcc tcc atg gca gtc ata tac cgc 1440

Ala Phe Leu Tyr Leu Leu Tyr Leu Ala Ser Met Ala Val Ile Tyr Arg

465 470 475 480

aca ggc act cat agc caa caa acc agc acg gca act ccg aac atg gaa 1488

Thr Gly Thr His Ser Gln Gln Thr Ser Thr Ala Thr Pro Asn Met Glu

485 490 495

ggt cta cgg gca tcg acg tca caa ata aaa aag gtc ctt gcg gag ctg 1536

Gly Leu Arg Ala Ser Thr Ser Gln Ile Lys Lys Val Leu Ala Glu Leu

500 505 510

cag ggc atg gga ctg ctt cag ttc ctt cca ggg gca tca gtc act atc 1584

Gln Gly Met Gly Leu Leu Gln Phe Leu Pro Gly Ala Ser Val Thr Ile

515 520 525

ctg atg ttc gct gtg gag gct agt ctg ttg gat ctc cag ggc tcg gat 1632

Leu Met Phe Ala Val Glu Ala Ser Leu Leu Asp Leu Gln Gly Ser Asp

530 535 540

acc atg gtc cga agg cag gct atg tca aat cta tat gcc tgt gag gag 1680

Thr Met Val Arg Arg Gln Ala Met Ser Asn Leu Tyr Ala Cys Glu Glu

545 550 555 560

gct gcg tta cac ttg atg cag gct tat cct acg gct gag atg gcg gta 1728

Ala Ala Leu His Leu Met Gln Ala Tyr Pro Thr Ala Glu Met Ala Val

565 570 575

ttg aag act agg aca gcc cgt gca aac ctt ctt ggg ttg gtt gag aca 1776

Leu Lys Thr Arg Thr Ala Arg Ala Asn Leu Leu Gly Leu Val Glu Thr

580 585 590

tga 1779

<210>30

<211>266

<212>PRT

<213>Aspergillus niger

<400>30

Met Pro Ile Ser Ile Pro Ser Ala Ser Ser Val His Asp Leu Phe Ser

1 5 10 15

Leu Lys Gly Lys Val Val Val Ile Thr Gly Ala Ser Gly Pro Arg Gly

20 25 30

Met Gly Ile Glu Ala Ala Arg Gly Cys Ala Glu Met Gly Ala Asn Ile

35 40 45

Ala Leu Thr Tyr Ser Ser Arg Pro Gln Gly Gly Glu Lys Asn Ala Glu

50 55 60

Glu Leu Arg Asn Thr Tyr Gly Val Lys Ala Lys Ala Tyr Gln Cys Asn

65 70 75 80

Val Gly Asp Trp Asn Ser Val Lys Lys Leu Val Asp Asp Val Leu Ala

85 90 95

Glu Phe Gly Gln Ile Asp Ala Phe Ile Ala Asn Ala Gly Lys Thr Ala

100 105 110

Ser Ser Gly Ile Leu Asp Gly Ser Val Glu Asp Trp Glu Glu Val Ile

115 120 125

Gln Thr Asp Leu Thr Gly Thr Phe His Cys Ala Lys Ala Val Gly Pro

130 135 140

His Phe Lys Gln Arg Gly Thr Gly Ser Phe Ile Ile Thr Ser Ser Met

145 150 155 160

Ser Gly His Ile Ala Asn Phe Pro Gln Glu Gln Thr Ser Tyr Asn Val

165 170 175

Ala Lys Ala Gly Cys Ile His Met Ala Arg Ser Leu Ala Asn Glu Trp

180 185 190

Arg Asp Phe Ala Arg Val Asn Ser Ile Ser Pro Gly Tyr Ile Asp Thr

195 200 205

Gly Leu Ser Asp Phe Val Asp Lys Lys Thr Gln Asp Leu Trp Met Ser

210 215 220

Met Ile Pro Met Gly Arg Asn Gly Asp Ala Lys Glu Leu Lys Gly Ala

225 230 235 240

Tyr Val Tyr Leu Ala Ser Asp Ala Ser Thr Tyr Thr Thr Gly Ala Asp

245 250 255

Leu Val Ile Asp Gly Gly Tyr Thr Val Arg

260 265

<210>31

<211>533

<212>PRT

<213>Aspergillus niger

<400>31

Met Ser Gly Val Ser Phe Ala Arg Gln Ala Leu Leu Gln Ala Ala Leu

1 5 10 15

Leu Ser Ile Val Ser Ala Ile Pro Ala Pro Thr Ala Phe Val Asn Asn

20 25 30

Val Ala Pro Pro Glu Pro Ile Ile Thr Pro Ser Pro Val Gln His Arg

35 40 45

Pro Ser Arg Val Ala Gly Arg Asn Ile Leu Ser Asp Val Asp Ser Asp

50 55 60

Ile Asn Ser Ile Leu Ser Gly Leu Gly Ser Asp Leu Pro Ser Trp Val

65 70 75 80

Ala Ser Gly Val Pro Asn Tyr Phe Gln Gly Phe Pro Thr Gly Asp Ala

85 90 95

Val Val Ser Ser Leu Gly Leu Asn Ser Ala Glu Leu Ala Ala Leu Pro

100 105 110

Thr Asn Val Leu Asn Ile Asp Pro Tyr Ala Asn Trp Thr Ser Ser Gly

115 120 125

Trp Asn Val Arg Phe His Gly Asn Val Tyr Lys Gln Pro Asn Thr Ser

130 135 140

Ile Ser Asp Leu Asn Asp Leu Ala Asp Val Phe Leu Gly Asn Thr Ser

145 150 155 160

Ile Ser Asp Leu Ser Glu Ser Glu Gln Lys Gln Ala Arg Asn Leu Thr

165 170 175

Ala Glu Ile Leu Val Val Gln Gln Ala His Val Ala Val Asn Thr Ile

180 185 190

His Leu Glu Pro Ala Pro Ser Gln Gly Ser Ser Gly Gln Ser Gly Gly

195 200 205

Gly Gly Ser Ser Asn Thr Thr Gly Gly Thr Gln Asp Leu Thr Leu Pro

210 215 220

Tyr Asn Thr Thr Val Glu Gly Asp Phe Asp Thr Phe Val Pro Ile Ser

225 230 235 240

Ser Asn Gly Leu Thr Ala Gly Asn Glu Thr Ser Ala Ile Gln Arg Leu

245 250 255

Asn Val His Val Glu Gly Ala Thr Ile Gly Asn Ser Thr Ala Tyr Leu

260 265 270

Val Pro Pro Thr Gly Leu Thr Val Val Ser Asp Ile Asp Asp Ile Leu

275 280 285

Arg Val Thr Lys Ile Tyr Glu Pro Glu Gln Gly Leu Leu Asn Ser Phe

290 295 300

Ala Arg Pro Phe Arg Pro Trp Glu Asn Met Pro Asp Ile Tyr Arg Asn

305 310 315 320

Trp Ser Ile Ser Leu Pro Asn Leu His Phe His Tyr Leu Thr Thr Thr

325 330 335

Pro Glu Gln Val Thr Arg Asn Tyr Met Gln Phe Ile Tyr Asp Asn Tyr

340 345 350

Pro Gly Gly Ser Phe Asp Thr Arg Pro Leu Asn Phe Ser Asp Val Ser

355 360 365

Ala Thr Leu Ser Ile Arg Lys Phe Leu Leu Gln Lys Val Phe Glu Thr

370 375 380

Phe Pro Gln Arg Lys Phe Ile Leu Ile Ala Asp Thr Ser Asn Ser Asp

385 390 395 400

Val Met Arg Asp Tyr Pro Glu Met Ala Thr Asp Phe Pro Gly Gln Val

405 410 415

Gln Cys Ile Phe Leu Arg Asn Thr Ser Ala Thr Asp Ser Gly Asp Lys

420 425 430

Phe Pro Tyr Asp Thr Ser Gly Phe Lys Lys Leu Asn Gln Ser Asn Tyr

435 440 445

Met Phe Phe Leu His Pro Asp Asp Leu Thr Asn Leu Asp Ile Ala Asn

450 455 460

Gly Gln Cys Tyr Asn Thr Ser Ile Pro Gln Asn Leu Thr Phe Ser Tyr

465 470 475 480

Gln Gly Leu Pro Leu Gly Leu Gly Asp Glu Pro Thr Ala Val Asn Gly

485 490 495

Ser Ala Asn His Thr Ala Glu Ser Ala Ala Gly Leu Ser Val Lys Gly

500 505 510

Gly Thr Asp Met Gln Gly Leu Ile Phe Leu Phe Thr Leu Val Thr Ala

515 520 525

Tyr Ser Ile Phe Leu

530

<210>32

<211>463

<212>PRT

<213>Aspergillus niger

<400>32

Met Ser Lys Ser Asn Gly Val Ser Leu Ala Phe Pro Ala Glu Ala Ala

1 5 10 15

Thr Lys Glu Tyr Ala Ala Ser Leu Asp Ser Ser Asp Arg Leu Ala Ala

20 25 30

Phe Arg Glu Lys Phe Ile Val Pro Ser Lys Ala Asn Ile Ala Ser Lys

35 40 45

Lys Leu Ala Lys Pro Gly Leu Ser Pro Glu Ser Cys Ile Tyr Phe Cys

50 55 60

Gly Asn Ser Leu Gly Ile Gln Pro Lys Ala Thr Ala Lys Tyr Leu Glu

65 70 75 80

Ala Gln Leu Asp Thr Trp Ser Ser Ile Gly Val Gly Gly His Phe Thr

85 90 95

Asp Leu Glu Gly Ser Pro Leu Lys Gln Trp Gln Leu Leu Ser Glu Gln

100 105 110

Ala Ala Asp Ser Met Ser Lys Ile Val Gly Ala Lys Pro Glu Glu Val

115 120 125

Ala Ala Met Gly Thr Leu Thr Thr Asn Leu His Leu Leu Leu Ala Ser

130 135 140

Phe Tyr Lys Pro Thr Gln Thr Lys His Lys Ile Leu Met Asp Trp Lys

145 150 155 160

Ala Phe Pro Ser Asp His Tyr Ala Ile Glu Ser His Ile Ala Trp His

165 170 175

Asp Leu Asp Pro Lys Glu Ser Met Val Leu Ile Gly Pro Asp Glu Gly

180 185 190

Glu Tyr Glu Ile Ser Thr Gln Lys Ile Phe Ser Tyr Ile Asp Lys His

195 200 205

Ala Asp Glu Ala Ala Met Ile Leu Leu Pro Gly Ile Gln Tyr Tyr Thr

210 215 220

Gly Gln Leu Phe Asp Ile Gln Lys Ile Thr Lys Tyr Ala His Ser Arg

225 230 235 240

Asn Met Val Val Gly Trp Asp Leu Ala His Ala Phe Ala Asn Val Glu

245 250 255

Leu Lys Leu His Asp Trp Asn Val Asp Phe Ala Ala Trp Cys Thr Tyr

260 265 270

Lys Tyr Gly Asn Ala Gly Pro Gly Ala Met Gly Gly Leu Phe Val His

275 280 285

Glu Gln His Gly Glu Val Asp Tyr Ser Ala Gly Glu Asp Ala Pro Lys

290 295 300

Phe Arg His Arg Leu Thr Gly Trp Tyr Gly Gly Asp Arg Ser Val Arg

305 310 315 320

Phe Lys Met Asp Asn Lys Phe Lys Pro Ile Pro Gly Ala Gly Gly Phe

325 330 335

Gln Ile Ser Asn Pro Ser Ala Ile Asp Leu Ala Cys Leu Cys Ala Ala

340 345 350

Leu Ser Val Phe Asp Glu Thr Ser Met Ala Asp Leu Arg Arg Lys Ser

355 360 365

Leu Lys Leu Thr Ala Tyr Leu Glu Phe Leu Leu Leu Arg Asp Tyr Glu

370 375 380

Glu Glu Ser Arg Pro Phe Ser Ile Ile Thr Pro Lys Asp Pro Glu Ala

385 390 395 400

Arg Gly Ala Gln Leu Ser Leu Leu Leu Lys Pro Gly Leu Leu Gln Asn

405 410 415

Val Ala Gln Lys Leu Gln Glu Ala Gly Ile Val Cys Asp Lys Arg Glu

420 425 430

Pro Gly Val Val Arg Val Ala Pro Val Pro Leu Tyr Asn Ser Phe Ser

435 440 445

Glu Val Trp Thr Phe Val Lys Ile Phe Lys Asp Ala Leu Gln Gln

450 455 460

<210>33

<211>380

<212>PRT

<213>Aspergillus niger

<400>33

Met Asp Val Thr Asn Leu Ala Val Asp Cys Pro Val Ile Glu Thr Gly

1 5 10 15

Ser Leu Ala Leu Trp Met Ala Ser Ser Glu Val Asp Gln Lys Ala Leu

20 25 30

Gly Asn Phe Ala Ala Ile Thr Gly Leu Glu Asn Pro Phe Leu Ser Ala

35 40 45

Met Leu Tyr Lys Ile Leu Gly Leu Ser Val Met Leu Ser Lys Lys Leu

50 55 60

Leu Arg Ala Arg Arg Leu Arg Arg Leu Asp Pro Thr Arg Glu Thr Lys

65 70 75 80

Ser Leu His Leu Tyr Tyr His Ile Ile Trp Leu Ser Arg Glu Gly Leu

85 90 95

Leu Ile Leu Glu Glu Phe Val Leu Pro Leu Val Glu Gly Phe Met Glu

100 105 110

Leu Lys Ile Leu Ala Tyr Lys Leu Arg Ala Ser Phe Tyr His Ile Phe

115 120 125

Val Leu Phe Gln Asn Gln Pro Ala Val His Ser Pro Gly Ile Val Ser

130 135 140

Leu Pro Ser Ser Thr Pro Leu Ser Asn Gly Val Thr Glu Ala Glu Ser

145 150 155 160

Pro Ser Lys Asp Ser Asn Leu Arg Phe Ser Phe Gln Leu Lys Pro Asp

165 170 175

Thr Ile Thr Val Ser Gly Lys Pro Ser Ser Ala Ser Asp Ser Ala Pro

180 185 190

Arg Gly Lys Val Thr Gln Ala Pro Pro Gly Phe Ala Pro Val Gln Pro

195 200 205

Pro Lys Ser Asn Ser Ala Phe Leu Leu Pro Ala Leu Asp Tyr Thr Pro

210 215 220

Thr Ala Thr Ala Cys Phe Asn His Ala Ala Leu Leu Ala Asp Gln Phe

225 230 235 240

Leu Pro Gly Ser His Pro Leu Arg Leu Ser Ile Lys Leu Glu Phe Ala

245 250 255

Ala Tyr Leu Tyr Asp Cys Leu His Asp Ala His Ala Cys Arg Arg Leu

260 265 270

Ala Lys Gln Ala Ile Ala Asp Val Tyr Asn Ala Gln Glu Gly Met Asp

275 280 285

Asp Glu Ser Phe Glu Asp Ala Ala Glu Ile Val Gly Ile Leu Gly Lys

290 295 300

Met Val Lys Arg Gly Arg Asn Thr Ser Ser Ala Gly Asn Ser Thr Thr

305 310 315 320

Ala Val Lys Thr Pro Gln Glu Glu Arg Ser Glu Gly Ser Arg Thr Pro

325 330 335

Ser Ser Gln Thr Thr Leu Lys Arg Pro Ala Arg Val Pro Lys Ser Thr

340 345 350

Ser Ser Pro Ala Arg Ala Thr Lys Pro Thr Thr Ser Glu Gly Met Ser

355 360 365

Pro Ala Val Pro Asp Pro Thr Met Met Asn Pro Ile

370 375 380

<210>34

<211>592

<212>PRT

<213>Aspergillus niger

<400>34

Met Arg Asn Leu Glu Cys Val Tyr Thr Lys Ser Arg Arg Tyr Pro Ser

1 5 10 15

Ser Ile Phe Pro Thr Leu Arg Arg Ser Ser Thr Ser Pro Asn Thr Ala

20 25 30

Ser Ser Pro Asp Thr Asn Ala Ser Ser Ser Pro Cys Ser Asp Ser Ser

35 40 45

Gly Thr His Ala Gly Ile Ser Ile Pro His Ser Asp Ser Pro Ala Ser

50 55 60

Val Asp Glu Cys Gly Asn Asn Gly Leu Phe Asp Gly Glu Ser Leu Thr

65 70 75 80

Gln Leu Leu Val Ser Gly Ser Lys Ala Ile Ser Gly Gln Pro His Ile

85 90 95

Ala Ile Lys Pro His Val Leu Ser Thr Tyr Pro Leu Asp Asn Leu Leu

100 105 110

Ser Asp Ile Glu Gly Leu Leu Glu Gln Pro Val Ser His Leu Ala Gln

115 120 125

Ser Lys Glu Asp Leu Thr Lys Pro Asp Arg Met Phe Arg Thr Arg Leu

130 135 140

Pro Ala Val Ser Gly Glu Asp Asn Glu Tyr Leu Leu Arg Lys Gly Ala

145 150 155 160

Leu Leu Leu Leu Pro Pro Ala Leu Arg Asn Glu Leu Leu Ala Ala Tyr

165 170 175

Val Asn Tyr Val His Pro Leu Leu Pro Ile Leu Asp Leu Gly Asp Phe

180 185 190

Leu Ser Gln Ile Ile Val Gly Asp Asp Ala Gln Phe Lys Ser Pro Leu

195 200 205

Leu Tyr Gln Ala Val Met Phe Ala Gly Ser Ile Phe Ala Gln Arg Asp

210 215 220

Gly Thr Asp Glu Pro Glu Gln Leu Thr Arg Ala Leu Phe Glu Arg Thr

225 230 235 240

Lys Val Leu Tyr Glu Phe Glu Ser Glu Ser Cys Ala Tyr Thr Gln Ile

245 250 255

Gln Ala Leu Leu Leu Met Thr Leu Trp His Gly Asp Met Ser Arg His

260 265 270

Lys Gly Pro Ser Tyr Trp Leu Asp Val Ala Phe Ser Thr Ala Glu Arg

275 280 285

Ile Gly Leu Leu His Asp Glu Asp Trp Pro Cys Asp Ser Arg Ser Phe

290 295 300

Arg Ser Ala Met Trp Cys Cys Leu Tyr Val Arg Asp Arg Thr Ile Ser

305 310 315 320

Leu Gly Ser Arg Arg Pro Pro Arg Met Pro Val Asn Lys Tyr Pro Asp

325 330 335

Ser Ile Leu His Leu Met Ser Asp Ala Pro Arg Glu Tyr Asp Glu Ile

340 345 350

Ile Leu Glu Ser Leu Gly Ser Ala Ser Leu Met Leu Thr Ser Thr Tyr

355 360 365

Gln Glu Gln Ser Thr Met Leu Phe Lys Glu Leu Val Lys Leu Ser Tyr

370 375 380

Cys Val Gly Ala Ile Leu Asp Tyr Leu Tyr Glu Gly Ala Trp Val Arg

385 390 395 400

Ile Pro Thr Arg Arg Ser Ser Phe Tyr Ser Leu Ala Pro Lys Cys Ser

405 410 415

Ile Ser Pro Ser Ile Arg Pro Ser Cys Glu Lys Leu Leu Tyr Ser Trp

420 425 430

Ile Gln Phe Leu Pro Leu Asn Ala Val Tyr His Pro Pro Gln Leu Pro

435 440 445

Ala Asp Ala Glu Gly Glu Ser Ala Glu Thr Val Phe Leu Val His Lys

450 455 460

Ala Phe Leu Tyr Leu Leu Tyr Leu Ala Ser Met Ala Val Ile Tyr Arg

465 470 475 480

Thr Gly Thr His Ser Gln Gln Thr Ser Thr Ala Thr Pro Asn Met Glu

485 490 495

Gly Leu Arg Ala Ser Thr Ser Gln Ile Lys Lys Val Leu Ala Glu Leu

500 505 510

Gln Gly Met Gly Leu Leu Gln Phe Leu Pro Gly Ala Ser Val Thr Ile

515 520 525

Leu Met Phe Ala Val Glu Ala Ser Leu Leu Asp Leu Gln Gly Ser Asp

530 535 540

Thr Met Val Arg Arg Gln Ala Met Ser Asn Leu Tyr Ala Cys Glu Glu

545 550 555 560

Ala Ala Leu His Leu Met Gln Ala Tyr Pro Thr Ala Glu Met Ala Val

565 570 575

Leu Lys Thr Arg Thr Ala Arg Ala Asn Leu Leu Gly Leu Val Glu Thr

580 585 590

<210>35

<211>1076

<212>DNA

<213>人工序列

<220>

<221>引物结合

<222>(1)..(35)

<220>

<221>启动子

<222>(13)..(1062)

<220>

<221>引物结合

<222>(1037)..(1076)

<400>35

ACTTCACTCG AGATAATGTA GGCGACAAAG TAGCCGGGCA TGCGACCGGA GGACTCGGTC 60

AGAGGCACGA ATATGAGAGG CCAGAACGCC GCACCCATGT TCCAAGATGT TGTGGCCCAG 120

TAAAGGTTAG GAAATGGGGT GTTTTGAACG TGGAATCGTT CTTCCATCCA GTTGTTGCCG 180

GAGCCGTAGG AACCGGCCGG GATACCAGTG AGGATGGAAC TATACCTATT AGCACTGCCA 240

TCTTCGAGAA CAAGGCTAAG ACATACATGA AACAAACGGT GACCGTGAGA AGCCATTTAT 300

AAGAGGTGCT CCAATTGAAC CTGAATATGT TAAAACTAGT ATACTAGCAA CTGCATGCTT 360

GACGTACGGA TTGTCCGGGT CATCCTTGCC GTTCCAGGTA TGGATCTCAA GGTCCTCCCT 420

GTCACGCAGA TCATTGTGGC TGACTACCCC GACATGGGGG TCCCGGCGAA AGAACGACCG 480

CACCCTGCAA CGTCACTTAG TGGCTGTCTG ACAGGGATTG ATTGGCAATG ATTGGCAGAC 540

TAACCGTCCC AGAAACGAAT CATCGAACTC ATTGGTGTGC ACTGTGCTAG CGCGGCGCAG 600

CGACGGGCGT GGCTCCTCGG CAGGGGTGGA CATGACTTTC TCTGTGTAGA TTCCTTGCAA 660

GGTATCTGCT TGACAGATGC AGAGATGATG TTGAGTAAAA TAGGGTGCAG AGACCCTGCA 720

GAACCTGCAT CGGCCGGCGG CGACATGTCG TCATGACCGA CCCGGGCCGA GCGGAATTAA 780

TGAAACTCGG AACAGCCAGG GGAATCCGAC GCTTTGAGTG GCCAATCCAT GTCTATCCAC 840

ATCTGCATTG AAGTGGATGA AAGGTGGAGG AGGGCTGGTT GCCAAATTCT GTTAGGGCTT 900

GGAATGTAAG CAACCGGTTT CGGTCATGAC ATCATCACAG CGATGACTTC ATCACTCTCG 960

GACGAGCATA TATAGTTGTG CCTGTCGTCG TATCTCAACA AACATCAACA ACAACAACAA 1020

TCATCTACTG CATTTACCAA ACTCATCTCT ACCTCAATCA ACTTAATTAA TGAAGT 1076

<210>36

<211>1057

<212>DNA

<213>人工序列

<220>

<221>引物结合

<222>(1)..(33)

<220>

<221>启动子

<222>(13)..(1043)

<220>

<221>引物结合

<222>(1022)..(1057)

<400>36

ACTTCACTCG AGTTCTCACA AGCAAATCCG AGAAACGCAA TTGACCATAT GTCCTTAGTA 60

TGAGGGCTAG CAGGAATACT TGTTTGTCGA TGCATACCGA CTAATAAAAA TGGTTCTTCT 120

TTTTCGCGCA GGGATTTGGT TTTTCATTTT TCATTTTTCA TATTTTATGT TATTTTATTT 180

TATTTTTTTG TTTTATTTTA TTTTATTTTT TTTTTTTAAA TAAGACTGGG TGTTTTCGTC 240

TCCCACCCCT GCTGAGGAAC TGTTTGATAT ACAGAAGCCT GAGATACTTG AGATTATGTG 300

ACAAAGAAAT TGTAAACCTG AATGTGACTA AGGCAGAAGA GAGCAGGTGA GGCCACACAA 360

TACTGTACAC CCACTTCCGA TCGTCATCGA AATGAGCGTT GTGGGTACTG GAACGACAAA 420

CCATAGATCG GATCTGCATC CGAATAGGCT TTACTTTGTA CATTGGTAGG AGTTTGAATG 480

TTTGAAGATC CGGCAGATGA TCACCTGCTG CAGGGAATAA TTTGAAACCT GTCCGTCTGC 540

TTTGACCCAA TTGACGAGGT ACGTGATTTG ATGCTACCCA AGCAGTATGA ATGCGACGGA 600

GGTGGCTATC CTTACCTTGT CATATGCAAC TCATAACGGG TAGTCCCCAT GGAGCCACGG 660

CTATTTATTT CTAAGGGCCA ACAGTGAAAG ATTGTGAGAT CGTATACCTC CTGGGTATGA 720

CGCAACCAGG GTGAGCACTG GCATTGCTCC AATCCATATG GTGGAGGTAT GTCTCCGAGA 780

CCATGACGCA TGTAGACCCT GACCTGTCCC TGATCCAGGG ATCTGGTTTG TCACTTGGCG 840

TATTTTAATT AACTGCGGGT CAGGGTCTTG CCGTCCAGAC CCAATGGATG AATTGCCTGC 900

GTGGCCCTGC AGTTCCAGCG ATCGGCACGG CACGGCTATG ACGTCGGTGG GTGTTCCGTT 960

TGATATTTAA CCATAGAAGA CAGCCTTGTT ATGCTGGTTC CTGCCGCAAA ATAAAGGTCT 1020

ATCCTTACCA CGTTAAGTGT CAAATTAATT AAGAAGT 1057

<210>37

<211>1061

<212>DNA

<213>人工序列

<220>

<221>引物结合

<222>(1)..(33)

<220>

<221>启动子

<222>(13)..(1047)

<220>

<221>引物结合

<222>(1023)..(1061)

<400>37

ATCCTACTCG AGTGGTGCCT GTGAACGAGG TCACCACTGA TAAATTGTCT GGATCCGTAA 60

CGTCTGTATC AGTGGATGGT ACTGAAAAGT TCCAAAGATT GAGGGCAGCA TATGTAGCAC 120

ATGGTGGTAG CTCTAAGTGG TTCGAAACTT CGATGAATGG GCGTGATATA CAGGGGGGTA 180

GCACCTGTAT AGTTGATGTC AGCGAAGGCA CGGGCCATGC AGTGATAGAC AAGAAAAGAG 240

GGATTGAATA AAAGACTCGA TTCTGAAGGG GAGTAATACA TCTTTCGGCT TCTCACCACC 300

CCAGATGTAG GCGTGTGTAA GGTAAGCAAG CACAACATAT GCTCTCCGCC ACTCAGGTTC 360

CCCCTTCAAC TTCTTCGTAG AGAGTATACC CAGGTCATCG ACAGACCTCC TGATAGTACC 420

AGACTGAATC AGGCCAGGCA AGTCCTGAGC GATTTCCTCC CACGGGGAAT AGTAAGGGTC 480

TTCCAATCTC CGTACGGGAG GAACTTCCGG GAGGAACCCG TTCTGGAGGG AGACACCGTA 540

CGCAACAAGT GAAATGTCTT GTGTATAAAG CATGATAATA TATGCACTTC AGTAGACAAC 600

TTGATATTCA AGCCTCCTTG AAATGATCCT CATGCAGGTA AGAGTAGATC CAAGTGTTTA 660

TATTGTATTC CCAAGGAGGG ACGGAAGAAA ACCGGATCCA GAGGGCTCGA GATAGGGCCA 720

CCTGCATGAG CAAAGACGGG TCATTTCCCG TTTCACAACG ACCATTCTCA GGCAGAAAGG 780

CAGTGGATTA GCGGAAAACT TAGCAACCAT CCGGATTTCT GGAGTGGATG CTTTGTTATC 840

TCACTTCCGG CAACACGGAT GGTGAGGCGG AAGCGGAACG GTATCCGGAT CCGGAGGGAG 900

GGACAAACCG AAGTGCCTTG TGTCACACGC CGGTCCATAT ATAAATGTTA ATTGGTGACG 960

GTCAGCGGAT TGTTTCTGGT GTTCATCCAT TTTTTCTTGA TATCCTGGAC CCAGTTATTG 1020

CACTTTAATT ACTATCCAAA ATCCACATTA ATTAATGAAG T 1061

<210>38

<211>1097

<212>DNA

<213>人工序列

<220>

<221>引物结合

<222>(1)..(34)

<220>

<221>启动子

<222>(13)..(1083)

<220>

<221>引物结合

<222>(1060)..(1097)

<400>38

ACTTCACTCG AGGTCCACAC TCTAATTGGG ATGAGCATTG CCTTTCAGGA ACTTGACTTT 60

TTGTGGTTGC ATCTTTTGTT GCCTTACCCA CGCAGGCTTC GTTTATGAGA TAGCGATTTC 120

AGGCCTCAAA TTGCTGTCAT CACTTCCGGC CCCAAACTCG TGGGCGGTGC CCGCCCATCG 180

CTGGCAAGAA GCACAGACTA ACGCCTTACT TCGCCTAGTT GCACACGATG CATCAAGACT 240

TCCTCCTATT TCACAACGAC CAGCTCCTTG CCATTTGTTG TTTCGAATGC CCCCTTCCCC 300

GTGCCTTGCA TTTCTAATTC CCATCTATAC CCTTTTGCGC TCTCACGCCC GCCTGACTAT 360

CAATTTTTCT GCCAGCATAA CCCTGCGTGC AGAGCGGTTG ACAGCAGGCT TGCTAAGAGT 420

CTTCGTCTAG AAGAACTGTC TGGGTGGATT CCTTTTCGGA TTAACTTTTG CTATTTTAAA 480

AGCTGATTGC ACTACGGAGT ACACCCGCAA TCTGATTCTC ACTGATACTC CAATTAAAGG 540

CCACTAATTG CTGACATTTG TAACATATTT GCGTTTGCTT TCCGGTTGAA ATTGGCGGCT 600

TTGTGCTTTC GATCGCTAGC AGTCTCTGTG CATGTACAAC TGATCGGCTA TTCAGTCCTA 660

TTCGGAAGCG GCACTGAGAG GCGGAGACAA GCCACAGATA CGACGAGTCT GATTTTGAGA 720

CGGGCGCATC CAACGAAAGC CTGCGATTGC AATTGAAGAT CTCAATTGGG GGACTGACAA 780

CCTAATACCT AAACATATCG AGGATTAGGC GCCAACACGA GCATGGGAAG CTTTGGTGCA 840

TGCGACGGCT GATCCATTTC TAACAACCGT TTTGCGCGCG CGTCCGAGGT AAGGCTCCCG 900

ATCCCTTGGC GCTTTGCATG TTTCACTCCG ATGCATCTAC TGTTTATATG AGTGCGGTGG 960

GCAAGCTGTG CCCACCGACT GAGCATTCTC AACCGGCCCA ATGCTGTGGG ATCGATCCTC 1020

CCCTCCAAAG TTGTCGCTCG GTTACACTTG ATCGGAGCTT GTTCTGTTAT ACACCAAACC 1080

ATCTTAATTA ATAGGAT 1097

<210>39

<211>1142

<212>DNA

<213>人工序列

<220>

<221>引物结合

<222>(1)..(35)

<220>

<221>启动子

<222>(13)..(1128)

<220>

<221>引物结合

<222>(1118)..(1142)

<400>39

ATCCTACTCG AGGCCTTTGG AGAATGTAAT ATCCCTTGAT CACCCCAGAC TCACATCCAG 60

ATTCTGACTG ACCTCGTGCA TAGCCATATT TAACTTGGTC CCTGATGATC AAAACAGTAC 120

ATGGAACTGG GGCCGAACAT TTCCCTAGCC AAAGGAGCAT CAGGGATTCA ACGTGATCAG 180

TACAGCCTTG TAGCTCGCTG AAACTGCCCT GGAGCCAAGC CAAAGCCTAG ACAGCAAGGT 240

GCATGGGCGA GCTTTGCGAG GATTTAGTTG TTATTTAGTA TGCCAAGATT AAGCCACGCA 300

GAATGGCTTA TGGCCATAGT AGCAACAACG GCCACGGAAC GTTCTTCCAT GTGGTATGGG 360

GAAAGCCGCC GGATATTTGG GGAGGGCGTG ATTGTTCCGG TGGCTATCTT TCCGGTGGAG 420

ATAACGGCGG TGGACCATCA AAACTCCTCA GCCCGGATTG CTCGGACTCC GCATCGTCAA 480

GTATCGGTTTC ATGACAGCC ATTCGACTAC TTAGAAGACA CAAATAGCTA TCCAACTTAC 540

CCGGACCTTTG ATAATAATT TTCAGCAGAT CTGTCGATCT CAGAGACAAT AATGCCACCG 600

TTCTGTGTGGA AGGCACTGC GCCGTGGTTT AACAATAATA AAACTCCAAA TTGCCCAAAA 660

GCTAGAGCGAA GGAAAGTCG AGAAGCCCAG TCTAGACTGG CGGGCTGATC GTCCGGTTCA 720

CAACCTGATTG ACAAATCAT CTGTGACCCT CGATGTTCCG CGGCGTTGAG CGGGTGAGAA 780

TGTGGATCCTA GTGGGGAAG ACCCAATTGC CGCCGGAAAA GGTGAGCTTG TGCTGCACAT 840

GTCCGGTGGCT CAATTCAGG GCCATGCCAG GACATTGCTC TTCAAAGGGA TGCGATTGCT 900

ATTCCCTATTT ACTTCTTTA ACCCGCTGAC GGGCCTGTCT GGACCGAGAA TTCTTGGTCA 960

AGTTTCAGTGG AGCGATCCA GGAAAGAACA TCCGATATGG ACAGTTGCCC TCGATCTCAG 1020

GTCTGTAGTCG TGTGACACA GAGGCCTCTA CTCGCTTGCC TTGCATGTCG GAGCTCAAAG 1080

GTGCGATGTGA ATTAACACG AGGAGCGACT GTCTGTCGCA GATGCAACTT AATTAATAGG 1140

AT 1142

<210>40

<211>39

<212>DNA

<213>人工序列

<220>

<223>引物

<400>40

ACTTCATTAA TTAAGTTGAT TGAGGTAGAG ATGAGTTTG 39

<210>41

<211>35

<212>DNA

<213>人工序列

<220>

<223>引物

<400>4I

ACTTCACTCG AGATAATGTA GGCGACAAAG TAGCC 35

<210>42

<211>36

<212>DNA

<213>人工序列

<220>

<223>引物

<400>42

ACTTCATTAA TTAATTTGAC ACTTAACGTG GTAAGG 36

<210>43

<211>33

<212>DNA

<213>人工序列

<220>

<223>引物

<400>43

ACTTCACTCG AGTTCTCACA AGCAAATCCG AGA 33

<210>44

<211>33

<212>DNA

<213>人工序列

<220>

<223>引物

<400>44

ATCCTACTCG AGTGGTGCCT GTGAACGAGG TCA 33

<210>45

<211>39

<212>DNA

<213>人工序列

<220>

<223>引物

<400>45

ACTTCATTAA TTAATGTGGA TTTTGGATAG TAATTAAAG 39

<210>46

<211>38

<212>DNA

<213>人工序列

<220>

<223>引物

<400>46

ATCCTATTAA TTAAGATGGT TTGGTGTATA ACAGAACA 38

<210>47

<211>34

<212>DNA

<213>人工序列

<220>

<223>引物

<400>47

ACTTCACTCG AGGTCCACAC TCTAATTGGG ATGA 34

<210>48

<211>35

<212>DNA

<213>人工序列

<220>

<223>引物

<400>48

ATCCTATTAA TTAAGTTGCA TCTGCGACAG ACAGT 35

<210>49

<211>35

<212>DNA

<213>人工序列

<220>

<223>引物

<400>49

ACTTCACTCG AGGCCTTTGG AGAATGTAAT ATCCC 35

<210>50

<211>20

<212>DNA

<213>人工序列

<220>

<223>引物

<400>50

CAACACCTAC GGCGTCAAGG 20

<210>51

<211>20

<212>DNA

<213>人工序列

<220>

<223>引物

<400>51

TAACCCGGGG AGATGCTGTT 20

<210>52

<211>20

<212>DNA

<213>人工序列

<220>

<223>引物

<400>52

CGATCCGGAA ATTCCTCCTG 20

<210>53

<211>19

<212>DNA

<213>人工序列

<220>

<223>引物

<400>53

GCCGCCGACT CAGCAGTAT 19

<210>54

<211>20

<212>DNA

<213>人工序列

<220>

<223>引物

<400>54

GTGCATGAAC AACACGGAGA 20

<210>55

<211>20

<212>DNA

<213>人工序列

<220>

<223>引物

<400>55

ACTCAGTTGT GCGCCTCTCG 20

<210>56

<211>20

<212>DNA

<213>人工序列

<220>

<223>引物

<400>56

GTCGAACTCG GCGTTTCTCC 20

<210>57

<211>20

<212>DNA

<213>人工序列

<220>

<223>引物

<400>57

CCGGTGAGGA GGTGCTTTTC 20

<210>58

<211>20

<212>DNA

<213>人工序列

<220>

<223>引物

<400>58

AGCATCTCGC CATCCATCAG 20

<210>59

<211>20

<212>DNA

<213>人工序列

<220>

<223>引物

<400>59

GCCTTCGGAC CATGGTATCC 20

<210>60

<400>60

000

<210>61

<211>1226

<212>DNA

<213>人工序列

<220>

<221>基因

<222>(23)..(739)

<223>GFP

<220>

<221>基因

<222>(740)..(1212)

<223>BLE

<400>61

GTCCTGTTAA TTAACCTTCA CCATGGTGAG CAAGGGCGAG GAGCTGTTCA CCGGGGTGGT 60

GCCCATCCTG GTCGAGCTGG ACGGCGACGT AAACGGCCAC AAGTTCAGCG TGTCCGGCGA 120

GGGCGAGGGC GATGCCACCT ACGGCAAGCT GACCCTGAAG TTCATCTGCA CCACCGGCAA 180

GCTGCCCGTG CCCTGGCCCA CCCTCGTGAC CACCCTGACC TACGGCGTGC AGTGCTTCAG 240

CCGCTACCCC GACCACATGA AGCAGCACGA CTTCTTCAAG TCCGCCATGC CCGAAGGCTA 300

CGTCCAGGAG CGCACCATCT TCTTCAAGGA CGACGGCAAC TACAAGACCC GCGCCGAGGT 360

GAAGTTCGAG GGCGACACCC TGGTGAACCG CATCGAGCTG AAGGGCATCG ACTTCAAGGA 420

GGACGGCAAC ATCCTGGGGC ACAAGCTGGA GTACAACTAC AACAGCCACA ACGTCTATAT 480

CATGGCCGAC AAGCAGAAGA ACGGCATCAA GGTGAACTTC AAGATCCGCC ACAACATCGA 540

GGACGGCAGC GTGCAGCTCG CCGACCACTA CCAGCAGAAC ACCCCCATCG GCGACGGCCC 600

CGTGCTGCTG CCCGACAACC ACTACCTGAG CACCCAGTCC GCCCTGAGCA AAGACCCCAA 660

CGAGAAGCGC GATCACATGG TCCTGCTGGA GTTCGTGACC GCCGCCGGGA TCACTCTCGG 720

CATGGACGAG CTGTACAAGG CCAAGTTGAC CAGTGCCGTT CCGGTGCTCA CCGCGCGCGA 780

CGTCGCCGGA GCGGTCGAGT TCTGGACCGA CCGGCTCGGG TTCTCCCGGG ACTTCGTGGA 840

GGACGACTTC GCCGGTGTGG TCCGGGACGA CGTGACCCTG TTCATCAGCG CGGTCCAGGA 900

CCAGGTGGTG CCGGACAACA CCCTGGCCTG GGTGTGGGTG CGCGGCCTGG ACGAGCTGTA 960

CGCCGAGTGG TCGGAGGTCG TGTCCACGAA CTTCCGGGAC GCCTCCGGGC CGGCCATGAC 1020

CGAGATCGGC GAGCAGCCGT GGGGGCGGGA GTTCGCCCTG CGCGACCCGG CCGGCAACTG 1080

CGTGCACTTC GTGGCCGAGG AGCAGGACTA AAGGCGCGCC TGAAGT 1226

<210>62

<211>37

<212>DNA

<213>人工序列

<220>

<223>引物

<400>62

GTCCTGTTAA TTAACCTTCA CCATGGTGAG CAAGGGC 37

<210>63

<211>36

<212>DNA

<213>人工序列

<220>

<223>引物

<400>63

GCACTGGTCA ACTTGGCCTT GTACAGCTCG TCCATG 36

<210>64

<211>36

<212>DNA

<213>人工序列

<220>

<223>引物

<400>64

CATGGACGAG CTGTACAAGG CCAAGTTGAC CAGTGC 36

<210>65

<211>35

<212>DNA

<213>人工序列

<220>

<223>引物

<400>65

ACTTCAGGCG CGCCTTTAGT CCTGCTCCTC GGCCA 35

Claims

1.启动子DNA序列，例如：

(b)能够与(a)的DNA序列杂交的DNA序列，

(c)与(a)的DNA序列至少50％同源的DNA序列，

(d)(a)到(c)中任何DNA序列的变体，或

(e)(a)到(d)中任何DNA序列的亚序列。

2.DNA构建体，其包含与报告基因可操作连接的如权利要求1所述的启动子DNA，所述报告基因赋予可选择性状，优选地，选择性标记基因。

3.包含如权利要求2所述的DNA构建体的表达载体，其中所述DNA构建体包含下述DNA片段，所述DNA片段与宿主细胞基因组中预先确定的靶基因座DNA序列同源，优选所述预先确定的靶基因座包含高表达的基因。

4.包含如权利要求2所述的DNA构建体的表达载体，其中所述DNA构建体能够在宿主细胞中自主维持，优选地，所述DNA构建体包含AMA1序列。

5.宿主细胞，其包含如权利要求2所述DNA构建体，或包含如权利要求3或4所述的表达载体。

6.如权利要求5所述的宿主细胞，其还包含包含下述DNA序列的DNA构建体，所述DNA序列包含来自下述DNA文库的编码序列，所述DNA文库来自被怀疑能够产生一种或多种目的蛋白质的生物。

7.如权利要求5或6所述的宿主细胞，其中所述宿主细胞为原核生物或真核生物。

8.如权利要求7所述的宿主细胞，其中所述宿主细胞选自以下列表：Bacillus、酵母或丝状真菌，优选地，Aspergillus、Penicillium或Trichoderma种。

9.如权利要求8所述的宿主细胞，其中Aspergillus为Aspergillus niger或Aspergillus sojae或Aspergillus oryzae种。

10.用于分离下述DNA序列的方法，所述DNA序列包含在宿主细胞中编码目的蛋白质的DNA序列，所述方法包含如下步骤：

(a)制备第一DNA构建体，其包含与赋予可选择性状的报告基因可操作连接的启动子DNA序列；当所述DNA构建体存在于宿主细胞中和当所述宿主细胞产生目的蛋白质，优选被分泌的目的蛋白质时，所述启动子DNA序列被诱导；

(c)用(a)和(b)中制备的两种DNA构建体转化宿主细胞；

(d)在有助于产生所述DNA文库中存在的目的蛋白质的条件下，培养(c)中获得的所有经转化的宿主细胞；和

(e)通过分析在(d)中产生的蛋白质，筛选产生目的蛋白质的经转化的宿主细胞。

11.如权利要求10所述的方法，其中首先用步骤(a)中制备的DNA构建体转化所述宿主细胞，然后用步骤(b)中制备的DNA构建体转化所述宿主细胞。

12.如权利要求10或11所述的方法，其中步骤(a)中使用的所述启动子为权利要求1的启动子。

13.如权利要求10到12任一项所述的方法，其中所述被怀疑能够产生目的蛋白质的生物为真核生物或原核生物。

14.如权利要求10到13任一项所述的方法，其中所述目的蛋白质为酶。