[go: up one dir, main page]

CN107828671B - 用于生产3-羟基丙酸的组合物和方法 - Google Patents

用于生产3-羟基丙酸的组合物和方法 Download PDF

Info

Publication number
CN107828671B
CN107828671B CN201711043999.8A CN201711043999A CN107828671B CN 107828671 B CN107828671 B CN 107828671B CN 201711043999 A CN201711043999 A CN 201711043999A CN 107828671 B CN107828671 B CN 107828671B
Authority
CN
China
Prior art keywords
gene
seq
amino acid
exogenous
acid sequence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201711043999.8A
Other languages
English (en)
Other versions
CN107828671A (zh
Inventor
H·杰森
B·鲁施
J·胡里塔
B·马斯泰尔
A·贝里
D·雅弗
M·卡特莱特
M·巴恩哈特
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Cargill Inc
Original Assignee
Cargill Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Cargill Inc filed Critical Cargill Inc
Publication of CN107828671A publication Critical patent/CN107828671A/zh
Application granted granted Critical
Publication of CN107828671B publication Critical patent/CN107828671B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/52Genes encoding for enzymes or proenzymes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N1/00Microorganisms, e.g. protozoa; Compositions thereof; Processes of propagating, maintaining or preserving microorganisms or compositions thereof; Processes of preparing or isolating a composition containing a microorganism; Culture media therefor
    • C12N1/14Fungi; Culture media therefor
    • C12N1/16Yeasts; Culture media therefor
    • C12N1/18Baker's yeast; Brewer's yeast
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/80Vectors or expression systems specially adapted for eukaryotic hosts for fungi
    • C12N15/81Vectors or expression systems specially adapted for eukaryotic hosts for fungi for yeasts
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/80Vectors or expression systems specially adapted for eukaryotic hosts for fungi
    • C12N15/81Vectors or expression systems specially adapted for eukaryotic hosts for fungi for yeasts
    • C12N15/815Vectors or expression systems specially adapted for eukaryotic hosts for fungi for yeasts for yeasts other than Saccharomyces
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/0004Oxidoreductases (1.)
    • C12N9/0006Oxidoreductases (1.) acting on CH-OH groups as donors (1.1)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/1096Transferases (2.) transferring nitrogenous groups (2.6)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/88Lyases (4.)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/93Ligases (6)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P7/00Preparation of oxygen-containing organic compounds
    • C12P7/40Preparation of oxygen-containing organic compounds containing a carboxyl group including Peroxycarboxylic acids
    • C12P7/42Hydroxy-carboxylic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P7/00Preparation of oxygen-containing organic compounds
    • C12P7/40Preparation of oxygen-containing organic compounds containing a carboxyl group including Peroxycarboxylic acids
    • C12P7/52Propionic acid; Butyric acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y101/00Oxidoreductases acting on the CH-OH group of donors (1.1)
    • C12Y101/01Oxidoreductases acting on the CH-OH group of donors (1.1) with NAD+ or NADP+ as acceptor (1.1.1)
    • C12Y101/010593-Hydroxypropionate dehydrogenase (1.1.1.59)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y206/00Transferases transferring nitrogenous groups (2.6)
    • C12Y206/01Transaminases (2.6.1)
    • C12Y206/01018Beta-alanine-pyruvate transaminase (2.6.1.18)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y206/00Transferases transferring nitrogenous groups (2.6)
    • C12Y206/01Transaminases (2.6.1)
    • C12Y206/01001Aspartate transaminase (2.6.1.1), i.e. aspartate-aminotransferase
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y206/00Transferases transferring nitrogenous groups (2.6)
    • C12Y206/01Transaminases (2.6.1)
    • C12Y206/010194-Aminobutyrate—2-oxoglutarate transaminase (2.6.1.19)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y401/00Carbon-carbon lyases (4.1)
    • C12Y401/01Carboxy-lyases (4.1.1)
    • C12Y401/01031Phosphoenolpyruvate carboxylase (4.1.1.31)

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Genetics & Genomics (AREA)
  • Organic Chemistry (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Biotechnology (AREA)
  • Biomedical Technology (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Microbiology (AREA)
  • Mycology (AREA)
  • Molecular Biology (AREA)
  • Medicinal Chemistry (AREA)
  • Plant Pathology (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Botany (AREA)
  • Tropical Medicine & Parasitology (AREA)
  • Virology (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)

Abstract

本发明涉及用于生产3‑羟基丙酸的组合物和方法,具体公开了包含活性3‑HP发酵途径的经遗传修饰的酵母细胞以及这些细胞生产3‑HP的用途。

Description

用于生产3-羟基丙酸的组合物和方法
本发明申请是基于申请日为2011年11月21日、申请号为201180065738.0(国际申请号为PCT/US2011/061717)、名称为“用于生产3-羟基丙酸的组合物和方法”的发明专利申请的分案申请。
序列表的引用
本申请含有计算机可读取形式的序列表,其通过提述并入本文。
背景技术
3-羟基丙酸(3-HP)是一种3碳羧酸,其由U.S.Department of Energy鉴定为12种高潜力的建造模块(building block)化学品之一,可以通过发酵制备。3-HP,一种乳酸(2-羟基丙酸)的异构体,的其它名称是包括亚甲基乳酸(ethylene lactic acid)和3-羟基丙酸根(3-hydroxypropionate)。3-HP是有吸引力的可再生的平台化学品,具有由葡萄糖生产的100%理论产率、使其参与多种化学反应的多个功能基团以及低毒性。3-HP可以用作底物,以形成几种商品化学品,例如1,3-丙二醇、丙二酸、丙烯酰胺和丙烯酸。丙烯酸是大体积的化学品(>70亿lbs/年),其用于制备丙烯酸酯和具有超强吸收能力的聚合物,且目前来源于丙烯的催化性氧化。3-HP的发酵生产将提供可持续的石油化学品替代物,作为这些商业上重要的化学品的原料,因而减少了能量消耗、美国对外来原油的依赖性和温室效应气体的产生。
细菌可以用于将糖发酵成有机酸。然而,对于大规模的有机酸生产,细菌显示出某些缺点。随着有机酸产生,发酵培养基变得酸性越来越强。事实上,较低的pH条件是优选的,因为所得产物部分或完全是酸性形式的。然而,产生有机酸的大部分细菌在强酸环境中表现不佳,因此或者死亡或者开始产生缓慢以致其随着培养基变得酸性更强而变得经济上不可行。为了防止这种情况,需要对培养基进行缓冲以维持较高的pH。然而,这使得有机酸产物的回收更加困难和昂贵。
近些年来,围绕利用酵母将糖发酵成有机酸的兴趣日益增加。酵母在一些工业发酵中用作生物催化剂,并显示出超越细菌的几项优势。尽管很多细菌不能合成其生长和有效代谢糖类所需要的某些氨基酸或蛋白,但大多数酵母菌种能够由无机氮化合物合成其必需的氨基酸或蛋白。酵母还不易受到在细菌中导致生产力或整体发酵运行过程受损的细菌噬菌体感染。
虽然酵母是有机酸生产的引人注目的候选者,但其显现出几项困难。首先,酵母中的途径工厂改造通常比细菌中更加困难。酵母中的酶被分隔在胞质、线粒体或过氧化物酶体中,而在细菌中其汇集于胞质中。这意味着可能需要去除靶向信号,以确保生物合成途径的所有酶共存于单个细胞内的相同区室中。还需要对途径中间物在区室之间的转运进行调控,以使到达目标产物的碳流最大化。其次,并非所有的酵母菌种符合大规模经济发酵的必要标准。事实上,仅小部分酵母具有足够高的体积和特定的糖利用与在低pH条件下快速生长的能力的结合。U.S.Department of Energy已经估测,大约2.5g/L/小时的生长速率对于几种有机酸的经济发酵来说是必需的,包括3-HP(http://www1.eere.energy.gov/biomass/pdfs/35523.pdf)。
虽然很多酵母菌种天然地将己糖发酵为乙醇,几乎没有任何酵母天然地产生显著产量的有机酸。这导致尝试对多种酵母菌种进行遗传修饰以生产有机酸。先前已经通过破坏或缺失天然的丙酮酸脱羧酶(PDC)基因并插入乳酸脱氢酶(LDH)基因以消除乙醇的产生,从而开发了产生乳酸的经遗传修饰的酵母株(参见例如W099/14335、WO00/71738、WO02/42471、WO03/049525、WO03/102152和WO03/102201)。这种改变使糖代谢由产生乙醇转为产生乳酸。酵母的发酵产物和途径不同于细菌,因而需要不同的工程改造方法以使产率最大化。增加有机酸产物的产率或纯度可能需要消除或减少的其他天然产物是甘油、醋酸盐和二醇。经遗传改变的酵母株中甘油的减少描述于例如WO07/106524中。
与乳酸不同,3-HP不是自然界任何已知途径的主要终产物,其在一些细菌和真菌中仅以痕量发现。因此,需要进行更多的遗传工程改造,以生成产生3-HP的酵母。先前对酿酒酵母(Saccharomyces cerevisiae)菌株进行了工程改造,以经由乳酸盐中间物产生非常低水平的3-HP(参见WO02/042418)。然而,野生型酿酒酵母的耐受水平不足以使其成为生产3-HP的最佳宿主。因此,需要在工业化规模上以更具成本效率的方式生产3-HP的改进的酵母菌株。
发明内容
在某些实施方案中,本文提供了经遗传修饰的酵母细胞,其包含由PEP、丙酮酸和/或甘油产生3-HP的活性3-HP发酵途径。在某些实施方案中,本文中提供的细胞含有一个或多个3-HP途径基因,所述基因编码具有PPC、PYC、AAT、ADC、BAAT、gabT、3-HPDH、HIBADH、4-羟基丁酸脱氢酶、ACC、AAM、丙氨酸脱氢酶、醛脱氢酶、BCKA、KGD、4-氨基丁酸转氨酶、β-丙氨酰-CoA氨解酶、Co-A酰化丙二酸半醛脱氢酶、CoA合成酶、CoA转移酶、甘油脱水酶、IPDA、LDH、乳酰-CoA脱水酶、苹果酸脱羧酶、苹果酸脱氢酶、丙二酰-CoA还原酶、OAA甲酸裂合酶(formatelyase)、OAA脱氢酶、丙酮酸/丙氨酸氨基转移酶、PDH、2-酮酸脱羧酶、3-HP-CoA脱水酶、3-HP-CoA水解酶或3-羟基异丁酰-CoA水解酶活性的酶。
在某些实施方案中,本文提供了经遗传修饰的酵母细胞,其包含由PEP或丙酮酸产生3-HP的活性3-HP发酵途径,其中所述细胞含有编码具有PPC、PYC、AAT、ADC、BAAT、gabT、3-HPDH、HIBADH和4-羟基丁酸脱氢酶活性的酶的一个或多个基因。在某些实施方案中,一个或多个3-HP途径基因是外源的,且在这些实施方案中,所述基因可来源于酵母、真菌、细菌、植物、昆虫或哺乳动物来源。例如,细胞可以含有来源于东方伊萨酵母(I.orientalis)的酵母PYC基因或来源于类球红细菌(R.sphaeroides)、菜豆根瘤菌(R.etli)、荧光假单胞菌(P.fluorescens)、谷氨酸棒杆菌(C.glutamicum)或苜蓿中华根瘤菌(S.meliloti)的细菌PYC基因;来源于大肠杆菌(E.coli)、嗜热自养甲烷杆菌(M.thermoautotrophicum)或产气荚膜梭菌(C.perfringens)的细菌PPC基因;来源于东方伊萨酵母或酿酒酵母的酵母AAT基因或来源于大肠杆菌的细菌AAT基因;来源于阿维链霉菌(S.avermitilis)、丙酮丁醇梭菌(C.acetobutylicum)、幽门螺旋杆菌(H.pylori)、地衣芽孢杆菌(B.licheniformis)或谷氨酸棒杆菌的细菌ADC基因;来源于东方伊萨酵母或克鲁维酵母(S.kluyveri)的酵母BAAT基因或来源于阿维链霉菌的细菌BAAT基因;来源于酿酒酵母的酵母gabT基因或来源于阿维链霉菌的细菌gabT基因;来源于东方伊萨酵母或酿酒酵母的酵母3-HPDH基因或来源于大肠杆菌或M.sedula的细菌3-HPDH基因;来源于粪产碱菌(A.faecalis)、恶臭假单胞菌(P.putida)或铜绿假单胞菌(P.aeruginosa)的细菌HIBADH基因;和/或来源于克鲁维酵母的酵母4-羟基丁酸脱氢酶基因或来源于R.eutropha的细菌4-羟基丁酸脱氢酶基因。
在某些实施方案中,本文提供了经遗传修饰的酵母细胞,其包含由PEP或丙酮酸产生3-HP的活性3-HP发酵途径,其中所述细胞含有编码具有PPC、苹果酸脱氢酶和苹果酸脱羧酶活性的酶的一个或多个基因。在某些实施方案中,一个或多个3-HP途径基因是外源的,在这些实施方案中,基因可来源于酵母、真菌、细菌、植物、昆虫或哺乳动物来源。
在某些实施方案中,本文提供了经遗传修饰的酵母细胞,其包含由PEP或丙酮酸产生3-HP的活性3-HP发酵途径,其中所述细胞含有编码具有PPC、2-酮酸脱羧酶、KGD、BCKA、吲哚丙酮酸脱羧酶、3-HPDH、HIBADH或4-羟基丁酸脱氢酶活性的酶的一个或多个基因。在某些实施方案中,一个或多个3-HP途径基因是外源的,在这些实施方案中,基因可来源于酵母、真菌、细菌、植物、昆虫或哺乳动物来源。
在某些实施方案中,本文提供了经遗传修饰的酵母细胞,其包含由PEP或丙酮酸产生3-HP的活性3-HP发酵途径,其中所述细胞含有编码具有PPC、OAA甲酸裂合酶、丙二酰-CoA还原酶、Co-A酰化丙二酸半醛脱氢酶、3-HPDH、HIBADH和4-羟基丁酸脱氢酶活性的酶的一个或多个基因。在某些实施方案中,一个或多个3-HP途径基因是外源的,在这些实施方案中,基因可来源于酵母、真菌、细菌、植物、昆虫或哺乳动物来源。
在某些实施方案中,本文提供了经遗传修饰的酵母细胞,其包含由丙酮酸产生3-HP的活性3-HP发酵途径,其中所述细胞含有编码具有PDH、酰基-CoA羧化酶、丙二酰-CoA还原酶、CoA酰化丙二酸半醛脱氢酶、3-HPDH、HIBADH和4-羟基丁酸脱氢酶活性的酶的一个或多个基因。在某些实施方案中,一个或多个3-HP途径基因是外源的,在这些实施方案中,基因可来源于酵母、真菌、细菌、植物、昆虫或哺乳动物来源。
在某些实施方案中,本文提供了经遗传修饰的酵母细胞,其包含由丙酮酸产生3-HP的活性3-HP发酵途径,其中所述细胞含有编码具有丙氨酸脱氢酶、丙酮酸/丙氨酸氨基转移酶、丙氨酸2,3氨基变位酶、CoA转移酶、CoA合成酶、β-丙氨酰-CoA氨解酶、3-HP-CoA脱水酶、3-HP-CoA水解酶、3-羟基异丁酰-CoA水解酶、BAAT、3-HPDH、HIBADH和4-羟基丁酸脱氢酶活性的酶的一个或多个基因。在某些实施方案中,一个或多个3-HP途径基因是外源的,在这些实施方案中,基因可来源于酵母、真菌、细菌、植物、昆虫或哺乳动物来源。
在某些实施方案中,本文提供了经遗传修饰的酵母细胞,其包含由丙酮酸产生3-HP的活性3-HP发酵途径,其中所述细胞含有编码具有LDH、CoA转移酶、乳酰-CoA脱水酶、3-HP-CoA脱水酶、3-HP-CoA水解酶和3-羟基异丁酰-CoA水解酶活性的酶的一个或多个基因。在某些实施方案中,一个或多个3-HP途径基因是外源的,在这些实施方案中,基因可来源于酵母、真菌、细菌、植物、昆虫或哺乳动物来源。
在某些实施方案中,本文提供了经遗传修饰的酵母细胞,其包含由PEP或丙酮酸产生3-HP的活性3-HP发酵途径,其中所述细胞含有编码具有甘油脱水酶和醛脱氢酶活性的酶的一个或多个基因。在某些实施方案中,一个或多个3-HP途径基因是外源的,在这些实施方案中,基因可来源于酵母、真菌、细菌、植物、昆虫或哺乳动物来源。
本文提供的经遗传修饰的酵母细胞可以是任何酵母菌种。在某些实施方案中,细胞是Crabtree阴性的,在这些实施方案的某些中,其属于伊萨酵母属(Issatchenkia)、假丝酵母属(Candida)、克鲁维酵母属(Kluyveromyces)、毕赤酵母属(Pichia)、裂殖酵母属(Schizosaccharomyces)、有孢圆酵母属(Torulaspora)、接合酵母属(Zygosaccharomyces)或酵母属(Saccharomyces)。在这些实施方案的某些中,细胞可以属于东方伊萨酵母P.fermentans进化枝或酵母属进化枝,在这些实施方案中,其可以是东方伊萨酵母、郎比可假丝酵母(C.lambica)或博伊丁酵母(S.bulderi)。在某些实施方案中,酵母细胞可以是3-HP抗性酵母细胞。3-HP抗性可以是细胞的天然特性或其是细胞在引入与活性3-HP发酵途径相关的遗传修饰之前、过程中或之后或其组合经过了突变和/或选择所致。在某些实施方案中,酵母细胞可以表现出对除了3-HP、其他发酵产物或副产物和/或多种培养基组分以外的有机酸具有高于由相同菌种的野生型酵母细胞所表现出的耐受性程度。在某些实施方案中,酵母细胞已经经过了突变和/或选择,以致经突变和/或选择的细胞具有高于相同菌种野生型细胞的3-HP抗性程度。在这些实施方案的一些中,细胞在用一个或多个外源3-HP途径基因进行遗传修饰之前已经经过了突变和/或选择。在一些实施方案中,细胞经过了乳酸或3-HP存在下的选择。在一些实施方案中,选择是恒化选择。
除了与活性3-HP发酵途径相关的修饰之外,本文提供的细胞可能含有一个或多个天然基因的缺失或破坏。例如,细胞可以含有一个或多个PDC、ADH、GAL6、CYB2A、CYB2B、GPD、GPP、ALD或PCK基因的缺失或破坏。在某些实施方案中,这些缺失或破坏可以与引入与活性3-HP发酵途径相关的一个或多个基因偶联。
在某些实施方案中,本文提供了利用本文提供的经遗传修饰的酵母细胞,通过在至少一种碳源存在下培养细胞并从培养基中分离3-HP从而产生3-HP的方法。在这些实施方案的某些中,碳源可以选自葡萄糖、木糖、阿拉伯糖、蔗糖、果糖、纤维素、葡萄糖寡聚物和甘油的一种或多种。
具体地,本发明涉及如下各项:
1.包含活性3-HP发酵途径的经遗传修饰的酵母细胞,其中细胞包含选自:
外源PPC基因;
外源PYC基因;
外源AAT基因;
外源ADC基因;
外源BAAT或gabT基因;和
外源3-HPDH基因
的一种或多种外源3-HP途径基因。
2.项1的经遗传修饰的酵母细胞,其包含外源PYC基因。
3.项2的经遗传修饰的酵母细胞,其中PYC基因编码与选自SEQ ID NO:2、3、4、5、6、7和8的氨基酸序列具有至少60%,如至少65%、70%、75%、80%、85%、90%、95%、97%、98%、99%或100%序列同一性的多肽。
4.项2或3的经遗传修饰的酵母细胞,其中PYC基因包含与SEQ ID NO:1的核苷酸序列具有至少60%,如至少65%、70%、75%、80%、85%、90%、95%、97%、98%、99%或100%序列同一性的核苷酸序列。
5.项1-4任一项的经遗传修饰的酵母细胞,其包含外源AAT基因。
6.项5任一项的经遗传修饰的酵母细胞,其中AAT基因编码与选自SEQ ID NO:14、15和16的氨基酸序列具有至少60%,如至少65%、70%、75%、80%、85%、90%、95%、97%、98%、99%或100%序列同一性的多肽。
7.项5或6的经遗传修饰的酵母细胞,其中AAT基因包含与SEQ ID NO:13的核苷酸序列具有至少60%,如至少65%、70%、75%、80%、85%、90%、95%、97%、98%、99%或100%序列同一性的核苷酸序列。
8.项1-7任一项的经遗传修饰的酵母细胞,其包含外源ADC基因。
9.项9的经遗传修饰的酵母细胞,其中ADC基因编码与选自SEQ ID NO:17、18、133、135、137和139的氨基酸序列具有至少60%,如至少65%、70%、75%、80%、85%、90%、95%、97%、98%、99%或100%序列同一性的多肽。
10.项8或9的经遗传修饰的酵母细胞,其中ADC基因包含与选自SEQ ID NO:130、131、132、134、136和138的核苷酸序列具有至少60%,如至少65%、70%、75%、80%、85%、90%、95%、97%、98%、99%或100%序列同一性的核苷酸序列。
11.项1-10任一项的经遗传修饰的酵母细胞,其包含外源BAAT基因或外源gabT基因。
12.项11的经遗传修饰的酵母细胞,其中外源BAAT基因或gabT基因编码与选自SEQID NO:20、21、22、23、和24的氨基酸序列具有至少60%,如至少65%、70%、75%、80%、85%、90%、95%、97%、98%、99%或100%序列同一性的多肽。
13.项11或12的经遗传修饰的酵母细胞,其中BAAT基因或gabT基因包含与选自SEQID NO:19、140、141、和142的核苷酸序列具有至少60%,如至少65%、70%、75%、80%、85%、90%、95%、97%、98%、99%或100%序列同一性的核苷酸序列。
14.项11-13任一项的经遗传修饰的酵母细胞,其中所述BAAT基因或gabT为也是gabT基因的BAAT基因。
15.项1-14任一项的经遗传修饰的酵母细胞,其包含外源3-HPDH基因。
16.项15的经遗传修饰的酵母细胞,其中3-HPDH基因编码与选自SEQ ID NO:26、27、28、29、30、31、32、33、34和129的氨基酸序列具有至少60%,如至少65%、70%、75%、80%、85%、90%、95%、97%、98%、99%或100%序列同一性的多肽。
17.项15或16的经遗传修饰的酵母细胞,其中3-HPDH基因包含与选自SEQ ID NO:25、143、144和343的核苷酸序列具有至少60%,如至少65%、70%、75%、80%、85%、90%、95%、97%、98%、99%或100%序列同一性的核苷酸序列。
18.项15-17任一项的经遗传修饰的酵母细胞,其中3-HPDH基因也是HIBADH基因。
19.项15-18任一项的经遗传修饰的酵母细胞,其中3-HPDH基因也是4-羟基丁酸脱氢酶基因。
20.项1-19任一项的经遗传修饰的酵母细胞,其包含外源PPC基因。
21.项20的经遗传修饰的酵母细胞,其中PPC基因编码与选自SEQ ID NO:10、11和12的氨基酸序列具有至少60%,如至少65%、70%、75%、80%、85%、90%、95%、97%、98%、99%或100%序列同一性的多肽。
22.项20或21的经遗传修饰的酵母细胞,其中PPC基因包含与SEQ ID NO:9的核苷酸序列具有至少60%,如至少65%、70%、75%、80%、85%、90%、95%、97%、98%、99%或100%序列同一性的核苷酸序列。
23.项1-22任一项的经遗传修饰的酵母细胞,其中所述酵母细胞是Crabtree阴性的。
24.项1-22任一项的经遗传修饰的酵母细胞,其中酵母细胞属于选自伊萨酵母属(Issatchenkia)、假丝酵母属(Candida)、克鲁维酵母属(Kluyveromyces)、毕赤酵母属(Pichia)、裂殖酵母属(Schizosaccharomyces)、有孢圆酵母属(Torulaspora)、接合酵母属(Zygosaccharomyces)和酵母属(Saccharomyces)的属。
25.项24的经遗传修饰的酵母细胞,其中酵母细胞属于选自东方伊萨酵母/发酵毕赤酵母(I.orientalis/P.fermentans)进化枝和酵母属进化枝的进化枝。
26.项24的经遗传修饰的酵母细胞,其中酵母细胞选自东方伊萨酵母(I.orientalis)、郎比可假丝酵母(C.lambica)和博伊丁酵母(S.bulderi)。
27.项1-26任一项的经遗传修饰的酵母细胞,其中所述细胞进一步包含选自PDC、ADH、GAL6、CYB2A、CYB2B、GPD、GPP、ALD和PCK基因的天然基因的一个或多个缺失或破坏。
28.项27的经遗传修饰的酵母细胞,其中一个或多个缺失或破坏得自一个或多个外源3-HP途径基因的插入。
29.项1-28任一项的经遗传修饰的酵母细胞,其中一个或多个外源3-HP途径基因可操作连接到一个或多个外源调节元件上。
30.项1-29任一项的经遗传修饰的酵母细胞,其中细胞能够在含75g/L或更多3-HP的培养基中在小于4的pH下生长。
31.项1-30任一项的经遗传修饰的酵母细胞,其中细胞是3-HP抗性酵母细胞。
32.项1-31任一项的经遗传修饰的酵母细胞,其中细胞已经经过了突变和/或选择,以致经突变的和/或选择的细胞相比同种的野生型细胞具有更高程度的对3-HP的抗性。
33.项32的经遗传修饰的酵母细胞,其中细胞在用一个或多个外源3-HP途径基因进行遗传修饰之前已经经过了突变和/或选择。
34.项32或33的经遗传修饰的酵母细胞,其中细胞已经经过了乳酸或3-HP存在下的选择。
35.项34的经遗传修饰的酵母细胞,其中选择是恒化选择。
36.生产3-HP的方法,包括:
(i)在含至少一种碳源的培养基的存在下培养项1-35任一项的经遗传修饰的酵母细胞;和
(ii)从培养物中分离3-HP。
37.项36的方法,其中所述碳源选自葡萄糖、木糖、阿拉伯糖、蔗糖、果糖、纤维素、葡萄糖寡聚物和甘油。
38.项36或37的方法,其中培养基的pH小于5,如在约1.5至约4.5、约2.0至约4.0或约2.0至约3.5的范围中。
附图简述
图1:所选3-HP发酵途径的概要
图2:质粒pMIBa107
图3:靶向整合技术的示意性展示。
图4:质粒pGMEr125(a)
图5:质粒pGMRr125(b)
图6:质粒pGMEr121
图7:质粒pMhCt074
图8:质粒pMhCt083
图9:质粒pMhCt087
图10:质粒pMhCt075
图11:质粒pMhCt077
图12:质粒pMhCt095
图13:质粒pMhCt096
图14:质粒pMeJi310-2
图15:质粒pMeJi312-2
图16:质粒pGMEr126
图17:质粒pGMEr130
图18:质粒pGMEr137
图19:质粒pACN5
图20:质粒pACN23
图21:质粒pHJJ27
图22:质粒pACN43
图23:质粒pHJJ75
图24:质粒pHJJ76
图25:质粒pJLJ49
图26:质粒pJLJ62
图27:质粒pMI458
图28:质粒pCM208
图29:质粒pJY39
图30:质粒pMcTs64
图31:质粒pMcTs65
图32:质粒pJLJ8。
发明详述
下面的本发明的描述仅仅意在阐述本发明的多个实施方案。因此,所讨论的特定修饰不能视为对本发明范围的限制。对于本领域技术人员来说显而易见的是,可以在不偏离本发明范围的情况下进行多种等价替代、变化和修饰,并且应当理解这种等同的实施方案包含于本文中。
本文中引用的所有参考文献作为整体通过提述并入。
缩写
3-HP,3-羟基丙酸;3-HPA,3-羟基丙醛;3-HPDH,3-羟基丙酸脱氢酶;AAM,丙氨酸2,3氨基变位酶;AAT,天冬氨酸氨基转移酶;ACC,乙酰-CoA羧化酶;ADC,天冬氨酸1-脱羧酶;AKG,α-酮戊二酸;ALD,醛脱氢酶;BAAT,β-丙氨酸氨基转移酶;BCKA,支链α-酮酸脱羧酶;bp,碱基对;CYB2,L-(+)-乳酸-细胞色素c氧化还原酶;CYC,异-2-细胞色素c;EMS,甲基磺酸乙酯(ethane methyl sulfonase);ENO,烯醇酶;gabT,4-氨基丁酸氨基转移酶;GAPDH,甘油醛-3-磷酸脱氢酶;GPD,甘油3-磷酸脱氢酶;GPP,甘油-3-磷酸磷酸酶;HIBADH,3-羟基异丁酸脱氢酶;IPDA,吲哚丙酮酸脱羧酶;KGD,α-酮戊二酸脱羧酶;LDH,乳酸脱氢酶;MAE,苹果酸酶;OAA,草酰乙酸;PCK,磷酸烯醇丙酮酸羧激酶;PDC,丙酮酸脱羧酶;PDH,丙酮酸脱氢酶;PEP,磷酸烯醇丙酮酸;PGK,磷酸甘油酸激酶;PPC,磷酸烯醇丙酮酸羧化酶;PYC,丙酮酸羧化酶;RKI,核糖5-磷酸酮醇异构酶;TAL,转醛醇酶;TEF1,翻译延长因子-1;TEF2,翻译延长因子-2;TKL,转酮醇酶;XDH,木糖醇脱氢酶;XR,木糖还原酶;YP,酵母提取物/蛋白胨。
描述
本文中提供了用于生产3-HP的经遗传修饰的酵母细胞、制备这些酵母细胞的方法以及利用这些细胞生产3-HP的方法。本文中使用的“3-HP”包括3-羟基丙酸的盐和酸形式。
一些3-HP发酵途径是本领域已知的(参见例如US专利号6,852,517;US专利号7,309,597;US公开号2001/0021978;US公开号2008/0199926;WO02/42418和WO10/031083,所有通过提述并入本文)。3-HP发酵途径经由一系列中间物运行,所述中间物可以包括磷酸烯醇丙酮酸(PEP)、丙酮酸、草酰乙酸(OAA)、天冬氨酸、β-丙氨酸、丙二酸半醛、苹果酸、丙二酰-CoA、乙酰-CoA、丙氨酸、乳酸、乳酰-CoA、丙烯酰-CoA、甘油、3-羟基丙醛(3-HPA)、β-丙氨酰-CoA、3-HP-CoA和甘油酸。几条已知的3-HP发酵途径的概述示于图1中。
如本文中所公开,对一组来自多个菌种的酵母细胞进行3-HP抗性的测试。基于在含有不同浓度3-HP的培养基中的生长速率和葡萄糖消耗速率,对呈现3-HP抗性的细胞进行进一步评估。基于这些实验,鉴定出了一组用于3-HP生产的理想的宿主细胞。接着对这些宿主细胞进行遗传修饰,以含有活性3-HP发酵途径,获得在低pH条件下产生3-HP的经遗传修饰的酵母细胞。
本文在某些实施方案中提供了经遗传修饰的酵母细胞,其具有至少一条由PEP、丙酮酸和/或甘油产生3-HP的活性3-HP发酵途径。本文中使用的具有“活性3-HP发酵途径”的酵母细胞产生催化3-HP发酵途径中的每个反应所必需的活性酶,因此当在至少一种可发酵糖存在时在发酵条件下进行培养时,能够产生可测量的产量的3-HP。具有活性3-HP发酵途径的酵母细胞包含一个或多个3-HP途径基因。本文中使用的“3-HP途径基因”是指编码参与3-HP发酵途径的酶的核苷酸序列编码区。
在某些实施方案中,本文中提供的酵母细胞具有经由PEP或丙酮酸、OAA、天冬氨酸、β-丙氨酸和丙二酸半醛中间物进行的活性3-HP发酵途径(参见例如US公开号2010/0021978,图1)。在这些实施方案中,酵母细胞包含一组3-HP发酵途径基因,其包括丙酮酸羧化酶(PYC)、PEP羧化酶(PPC)、天冬氨酸氨基转移酶(AAT)、天冬氨酸1-脱羧酶(ADC)、β-丙氨酸氨基转移酶(BAAT)、氨基丁酸氨基转移酶(gabT)、3-HP脱氢酶(3-HPDH)、3-羟基异丁酸脱氢酶(HIBADH)和4-羟基丁酸脱氢酶基因中的一个或多个。3-HP发酵途径基因还可以包括PEP羧激酶(PCK)基因,其已经修饰以产生优选催化PEP转化为OAA的多肽(天然PCK基因一般产生优选催化OAA至PEP的逆反应的多肽)。
在某些实施方案中,本文中提供的酵母细胞具有经由PEP或丙酮酸、OAA和苹果酸中间物进行的活性3-HP发酵途径(参见例如US公开号2010/0021978,图4)。在这些实施方案中,酵母细胞包含一组3-HP发酵途径基因,其包括PPC、PYC、苹果酸脱氢酶和苹果酸脱羧酶基因中的一个或多个。3-HP发酵途径基因还可以包括PCK基因,其已经修饰以产生优选催化PEP转化为OAA的多肽。
在某些实施方案中,本文中提供的酵母细胞具有经由PEP或丙酮酸、OAA和丙二酸半醛中间物进行的活性3-HP发酵途径(参见例如US公开号2010/0021978,图1)。在这些实施方案中,酵母细胞包含一组3-HP发酵途径基因,其包括PPC、PYC、2-酮酸脱羧酶、α-酮戊二酸(AKG)脱羧酶(KGD)、支链α-酮酸脱羧酶(BCKA)、吲哚丙酮酸脱羧酶(IPDA)、3-HPDH、HIBADH和4-羟基丁酸脱氢酶基因中的一个或多个。3-HP发酵途径基因还可以包括PCK基因,其已经修饰以产生优选催化PEP转化为OAA的多肽。3-HP发酵途径基因还可以包括PDC基因和/或甲酸苄酯脱羧酶基因,其已经被修饰以编码能够催化OAA转化为丙二酸半醛的多肽。
在某些实施方案中,本文中提供的酵母细胞具有经由PEP或丙酮酸、OAA、丙二酰-CoA和丙二酸半醛中间物进行的活性3-HP发酵途径(参见例如US公开号2010/0021978,图2)。在这些实施方案中,酵母细胞包含一组3-HP发酵途径基因,其包括PPC、PYC、OAA甲酸裂合酶、丙二酰-CoA还原酶、CoA酰化丙二酸半醛脱氢酶、3-HPDH、HIBADH和4-羟基丁酸脱氢酶基因中的一个或多个。3-HP发酵途径基因还可以包括PCK基因,其已经修饰以产生优选催化PEP转化为OAA的多肽。此外,3-HP发酵途径基因还可以包括通过修饰2-酮酸脱氢酶基因而获得的OAA脱氢酶基因,以产生催化OAA转化为丙二酰-CoA的多肽。
在某些实施方案中,本文中提供的酵母细胞具有经由丙酮酸、乙酰-CoA、丙二酰-CoA和丙二酸半醛中间物进行的活性3-HP发酵途径,其中丙二酸半醛中间物是任选的(参见例如WO02/042418,图44)。在这些实施方案中,酵母细胞包含一组3-HP发酵途径基因,其包括丙酮酸脱氢酶(PDH)、乙酰-CoA羧化酶(ACC)、丙二酰-CoA还原酶、CoA酰化丙二酸半醛脱氢酶、3-HPDH、HIBADH和4-羟基丁酸脱氢酶基因中的一个或多个。
在某些实施方案中,本文中提供的酵母细胞具有经由丙酮酸、丙氨酸、β-丙氨酸、β-丙氨酰-CoA、丙烯酰-CoA、3-HP-CoA和丙二酸半醛中间物进行的活性3-HP发酵途径,其中β-丙氨酰-CoA、丙烯酰-CoA、3-HP-CoA和丙二酸半醛中间物是任选的(β-丙氨酸能够经由丙二酸半醛中间物或经由β-丙氨酰-CoA、丙烯酰-CoA和3-HP-CoA中间物转化为3-HP)(参见例如US专利7,309,597,图1)。在这些实施方案中,酵母细胞包含一组3-HP发酵途径基因,其包括丙氨酸脱氢酶、丙酮酸/丙氨酸氨基转移酶、丙氨酸2,3氨基变位酶、CoA转移酶、CoA合成酶、β-丙氨酰-CoA氨解酶、3-HP-CoA脱水酶、3-HP-CoA水解酶、3-羟基异丁酰-CoA水解酶、BAAT、3-HPDH、HIBADH和4-羟基丁酸脱氢酶基因中的一个或多个。
在某些实施方案中,本文中提供的酵母细胞具有经由丙酮酸、乳酸、乳酰-CoA、丙烯酰-CoA和3-HP-CoA中间物进行的活性3-HP发酵途径(参见例如WO02/042418,图1)。在这些实施方案中,酵母细胞包含一组3-HP发酵途径基因,其包括LDH、CoA转移酶、CoA合成酶、乳酰-CoA脱水酶、3-HP-CoA脱水酶、3-HP-CoA水解酶和3-羟基异丁酰-CoA水解酶基因中的一个或多个。
在某些实施方案中,本文中提供的酵母细胞具有经由甘油和3-HPA中间物进行的活性3-HP发酵途径(参见例如US专利6,852,517)。在这些实施方案中,酵母细胞包含一组3-HP发酵途径基因,其包括甘油脱水酶和醛脱氢酶基因中的一个或多个。
在某些实施方案中,本文中提供的酵母细胞具有经由PEP或丙酮酸、OAA、天冬氨酸、β-丙氨酸、β-丙氨酰-CoA、丙烯酰-CoA、3-HP-CoA和丙氨酸中间物进行的活性3-HP发酵途径,其中OAA、天冬氨酸和丙氨酸中间物是任选的(PEP或丙酮酸可以经由OAA和天冬氨酸或经由丙氨酸转化为β-丙氨酸)(参见WO02/042418,图54;US专利7,309,597,图1)。在这些实施方案中,酵母细胞包含一组3-HP发酵途径基因,其包括PPC、PYC、AAT、ADC、CoA转移酶、CoA合成酶、β-丙氨酰-CoA氨解酶、3-HP-CoA脱水酶、3-HP-CoA水解酶、3-羟基异丁酰-CoA水解酶、丙氨酸脱氢酶、丙酮酸/丙氨酸氨基转移酶和AAM基因中的一个或多个。3-HP发酵途径基因还可以包括PCK基因,其已经修饰以产生优选催化PEP转化为OAA的多肽。
本文中提供的酵母细胞中的3-HP发酵途径基因可以是内源的或外源的。本文中关于基因元件例如基因、启动子和终止子序列所使用的“内源的”是指基因元件存在于天然形式的特定酵母细胞的基因组中的特定位置。本文中关于基因元件使用的“外源的”是指基因元件不存在于天然形式的特定酵母细胞的基因组中的特定位置。本文中关于酵母细胞使用的“天然的”是指特定酵母菌种的野生型酵母细胞。本文中关于代谢途径使用的“天然的”是指天然酵母细胞中存在且具有活性的代谢途径。
外源基因元件可以具有天然的或非天然的序列。具有天然序列的外源基因元件包含与天然细胞基因组中存在的基因元件相同(除了不影响功能的个体-个体突变以外)的序列(即外源基因元件与内源基因元件相同)。然而,外源元件在宿主细胞基因组中存在的位置与内源元件不同。例如,与内源PYC基因相同的外源PYC基因可以插入到酵母细胞中,产生具有非天然(增加的)数量的PYC基因拷贝。具有非天然序列的外源基因元件包含天然细胞基因组中未发现的序列。例如,来自特定菌种的外源PYC基因可以插入到另一菌种的酵母细胞中。外源基因优选以功能性方式整合到宿主细胞基因组中,这意味着其能够在宿主细胞中产生活性蛋白。然而,在某些实施方案中,外源基因可以作为载体的一部分引入细胞中,所述载体稳定保持于宿主胞质中。
在某些实施方案中,本文中提供的酵母细胞包含一个或多个外源3-HP发酵途径基因。在某些实施方案中,本文中公开的经遗传修饰的酵母细胞包含单个外源基因。在其他实施方案中,酵母细胞包含多个外源基因。在这些实施方案中,酵母细胞可包含单个外源基因的多个拷贝和/或两个或多个不同外源基因的拷贝。包含多个外源基因的酵母细胞可包含任意数量的外源基因。例如,这些酵母细胞可包含1至20个外源基因,在某些优选的实施方案中,其可包含1至7个外源基因。外源基因的多个拷贝可整合到单个基因座中,以致其彼此相邻。或者,其可整合到宿主细胞基因组内分离的基因座中。
在某些实施方案中,本文中提供的酵母细胞包含一个或多个内源3-HP发酵途径基因。在这些实施方案的某些中,可以对细胞进行工程改造,以过量表达这些内源基因中的一个或多个,这意味着在至少相同的条件下,经修饰的细胞使内源基因以高于天然细胞的水平表达。在这些实施方案的某些中,过量表达的内源基因可以与一个或多个外源调节元件可操作连接。例如,可以将一个或多个天然或非天然外源强效启动子引入细胞中,以致其与一个或多个内源3-HP途径基因可操作连接。
本文中提供的酵母细胞中的3-HP发酵途径基因可以与一个或多个调节元件例如启动子或终止子可操作连接。如本文中所使用,术语“启动子”是指位于基因翻译起始密码子上游(即5’)的非翻译序列(一般约1至1000碱基对(bp)内,优选约1至500bp内),其调控基因转录的起始。本文中使用的术语“终止子”是指位于基因翻译终止密码子下游(即3’)的非翻译序列(一般约1至1000bp内,优选约1至500bp内,尤其是约1至100bp内),其调控基因转录的结束。如果启动子或终止子在基因组中相对于基因的位置使得启动子或终止子(视情况而定)行使其转录调控功能,则其与基因“可操作连接”。适宜的启动子和终止子描述于例如WO99/14335、WO00/71738、WO02/42471、WO03/102201、WO03/102152和WO03/049525中(所有作为整体通过提述并入)。
本文中提供的细胞中与3-HP发酵途径基因连接的调节元件可以是内源的或外源的。例如,外源3-HP发酵途径基因可以插入到酵母细胞中,使其处于内源启动子和/或终止子的转录调控下。或者,外源3-HP发酵途径基因可以与一个或多个外源调节元件连接。例如,可以将外源基因作为基因表达构建体的一部分引入细胞中,所述构建体包含一个或多个外源调节元件。在某些实施方案中,外源调节元件或至少外源调节元件的功能性部分,可包含天然序列。在其他实施方案中,外源调节元件可包含非天然序列。在这些实施方案中,外源调节元件可包含与天然调节元件具有相对较高程度的序列同一性的序列。例如,外源基因可以与天然启动子或终止子具有至少50%、至少60%、至少70%、至少80%或至少90%序列同一性的外源启动子或终止子连接。核苷酸或氨基酸序列的序列同一性百分比可以通过本领域已知的方法计算,例如利用具有缺省参数的BLAST(National Center forBiological Information(NCBI)Basic Local Alighment Search Tool)第2.2.1版软件。例如,利用具有缺省参数的BLAST第2.2.1版运算方法得到至少90%相同性分值的序列被认为具有至少90%的序列同一性。BLAST软件可以从NCBI,Bethesda,Maryland获得。
在某些方面中,本文中提供的细胞中与3-HP发酵途径基因连接的调节元件(例如启动子)对于途径基因来说可以是外来的。对于途径基因来说是外来的调节元件是不以天然形式与基因连接的调节元件。本领域技术人员可以领会的是,对于途径基因来说是外来的调节元件可以是内源的或外源的,这取决于途径基因及其与酵母细胞的关系。在一些情况下,内源3-HP发酵途径基因与对于途径基因来说是外来的调节元件(例如启动子)可操作连接。在其他情况下,外源3-HP发酵途径基因与对于途径基因来说是外来的外源调节元件(例如启动子)可操作连接。
在其中多个外源基因插入宿主细胞的那些实施方案中,每个外源基因可以处于不同调节元件的控制下,或者两个或多个外源基因可以处于相同调节元件的控制下。例如,当第一外源基因与第一调节元件连接时,第二外源基因也可以与第一调节元件连接,或者其可以与第二调节元件连接。第一和第二调节元件可以是相同的或享有高度的序列同一性,或者其完全无关。
本文中提供的酵母细胞中可以与一个或多个3-HP发酵途径基因连接的启动子的示例包括但不限于PDC1、磷酸甘油酸激酶(PGK)、木糖还原酶(XR)、木糖醇脱氢酶(XDH)、L-(+)-乳酸-细胞色素c氧化还原酶(CYB2)、翻译延长因子-1(TEF1)、翻译延长因子-2(TEF2)、烯醇酶(ENO1)、甘油醛-3-磷酸脱氢酶(GAPDH)和乳清苷5’-磷酸脱羧酶(URA3)基因的启动子。在这些示例中,3-HP发酵途径基因可以与PDC1、PGK、XR、XDH、CYB2、TEF1、TEF2、ENO1、GAPDH或URA3基因的内源或外源启动子连接。当启动子是外源的时,其与PDC1、PGK、XR、XDH、CYB2、TEF1、TEF2、ENO1、GAPDH或URA3基因的天然启动子可以是相同的或享有高度的序列同一性(即至少约80%、至少约85%、至少约90%、至少约95%或至少约99%)。
本文中提供的酵母细胞中可以与一个或多个3-HP发酵途径基因连接的终止子的示例包括但不限于PDC1、XR、XDH、转醛醇酶(TAL)、转酮醇酶(TKL)、核糖5-磷酸酮醇异构酶(RKI)、CYB2或异-2-细胞色素c(CYC)基因或者半乳糖家族基因(特别是GAL 10终止子)的终止子。在这些示例中,3-HP发酵途径基因可以与PDC1、XR、XDH、TAL、TKL、RKI、CYB2或CYC基因或者半乳糖家族基因的内源或外源终止子连接。当终止子是外源的时,其与PDC1、XR、XDH、TAL、TKL、RKI、CYB2或CYC基因或者半乳糖家族基因的天然终止子可以是相同的或享有高度的序列同一性(即至少约80%、至少约85%、至少约90%、至少约95%或至少约99%)。在某些实施方案中,3-HP发酵途径基因与包含宿主细胞天然的天然GAL 10基因的功能性部分或者与天然GAL 10终止子享有至少80%、至少85%、至少90%或至少95%序列同一性的序列的终止子连接。
外源基因可以通过本领域任何已知的方法插入到酵母宿主细胞中。在优选的实施方案中,基因整合到宿主细胞基因组中。外源基因可以以靶向或随机方式整合到基因组中。在其中基因以靶向方式整合的那些实施方案中,其可以整合到特定基因的基因座,以致外源基因的整合与天然基因的缺失或破坏偶联。例如,外源3-HP途径基因的引入可以与一个或多个编码参与其他发酵产物途径的酶的基因的缺失或破坏偶联。或者,外源基因可以整合到不对应于基因的基因组部分中。
靶向整合和/或缺失可以利用整合构建体。本文中使用的术语“构建体”是指用于转化宿主细胞的DNA序列。构建体可以是例如环状质粒或载体、环状质粒或载体的一部分(例如限制性酶消化产物)、线性质粒或载体或者利用质粒或基因组DNA作为模板制备的PCR产物。用外源构建体转化酵母细胞的方法描述于例如WO99/14335、WO00/71738、WO02/42471、WO03/102201、WO03/102152和WO03/049525中。整合构建体可以利用来自插入位点靶标的两条克隆的靶DNA序列进行组装。两条靶DNA序列在天然宿主基因组中可以是相邻的或非相邻的。在本文中,“非相邻的”是指DNA序列在天然基因组中不是互相紧邻的,而是由将要被缺失的区域分隔开。本文中使用的“相邻的”序列在天然基因组中直接互相紧邻。当靶向整合将与靶基因的缺失或破坏偶联时,整合构建体还可以被称为缺失构建体。在缺失构建体中,一条靶序列可包含位于靶基因启动子5’端的区域、所有或一部分启动子区域、所有或一部分靶基因编码序列或者其一些组合。另一条靶序列可包含位于靶基因终止子3’端的区域、所有或一部分终止子区域和/或所有或一部分靶基因编码序列。当靶向整合不与天然基因的缺失或破坏偶联时,靶序列的选择使得干扰序列的插入将不会破坏天然基因的表达。制备整合或缺失构建体,以致两条靶序列彼此之间定向于相同方向,如其天然存在于宿主细胞基因组中时。当利用整合或缺失构建体将外源基因引入到宿主细胞中时,将基因表达盒克隆到构建体的两条靶基因序列之间,以使外源基因能够表达。基因表达盒含有外源基因,并且可以进一步包含与外源基因可操作连接的一个或多个调节序列,例如启动子或终止子。缺失构建体还可以构建为不含基因表达盒。设计这种构建体,以在不插入外源基因的情况下使基因序列缺失或破坏。
整合或缺失构建体可包含克隆到质粒的两条靶基因序列之间的一个或多个选择标志物盒。选择标志物盒含有使得能够进行转化子选择的至少一个选择标志物基因。“选择标志物基因”是编码经转化的细胞在选择培养基中存活和/或生长所需蛋白的基因,因此能够用于对细胞施加选择压力。成功的转化子将含有选择标志物基因,其给予成功转化的细胞提供选择基础的至少一种特性。通常的选择标志物基因编码下列蛋白:(a)赋予对抗生素或其他毒素的抗性(例如对博来霉素或zeomycin(例如印度斯坦链异壁菌(Streptoalloteichus hindustanus)ble基因)、氨基糖苷类例如G418或卡那霉素(例如来自转座子Tn903的卡那霉素抗性基因)或潮霉素(例如来自大肠杆菌的氨基糖苷类抗生素抗性基因)的抗性),(b)补充细胞的营养缺陷型缺陷(例如亮氨酸(例如马克斯克鲁维酵母(K.marxianus)LEU2基因)、尿嘧啶(例如马克斯克鲁维酵母、酿酒酵母或东方伊萨酵母URA3基因)或色氨酸(例如马克斯克鲁维酵母、酿酒酵母或东方伊萨酵母TRP基因)的缺陷),(c)能够使细胞合成从简易培养基中不可获得的关键营养成分,或(d)赋予细胞在特定碳源上生长的能力(例如来自酿酒酵母的MEL5基因,其编码α-半乳糖苷酶(蜜二糖酶)并赋予在蜜二糖作为唯一碳源上生长的能力)。优选的选择标志物包括URA3基因、zeocin抗性基因、G418抗性基因、MEL5基因和潮霉素抗性基因。另一种优选的选择标志物是L-乳酸:亚铁细胞色素c氧化还原酶(CYB2)基因盒,前提是宿主细胞天然地缺少这种基因或其天然的CYB2基因首先被缺失或破坏。选择标志物与在宿主细胞中可操作的一个或多个启动子和/或终止子序列可操作连接。在某些实施方案中,这些启动子和/或终止子序列是包含于选择标志物盒中的外源启动子和/或终止子序列。适宜的启动子和终止子如本文中所描述。
整合或缺失构建体用于转化宿主细胞。可以利用例如电穿孔和/或化学转化(例如基于氯化钙、醋酸锂等)方法完成转化。可以基于选择标志物的存在或缺少进行选择或筛选,以鉴定成功的转化子。在成功的转化子中,在靶位点的基因座的同源重组事件导致靶位点序列的破坏或缺失。当构建体靶向天然基因以供缺失或破坏时,可以在该重组事件过程中缺失所有或一部分天然靶基因、其启动子和/或其终止子。将整合构建体中的表达盒、选择标志物盒和靶序列之间的任何其他基因物质插入到宿主基因组靶序列的对应基因座中。可以进行PCR分析或Southern分析,以确认发生了期望的插入/缺失。
在一些实施方案中,可以利用来自两个或多个构建体、PCR产物或其组合的DNA进行细胞转化,而非利用单个构建体或PCR产物。在这些实施方案中,一个整合片段的3’末端与另一个整合片段的5’末端重叠。在一个实例中,一个构建体将含有来自靶序列基因座的第一序列和标志物基因盒的非功能性部分,而另一个将含有来自靶序列基因座的第二序列和标志物基因盒的第二非功能性部分。选择标志物基因盒的部分,以致其能够组合,以形成完整的盒。同时用这些碎片转化细胞,使得形成完整的功能性标志物或结构性基因盒。可以基于由选择标志物给予的特性选择成功的转化子。在另一个实施例中,选择标志物存在于一个片段上,而靶序列在另外的片段上,以使整合片段非常有可能在目标位点整合。在其他实施方案中,可以利用来自三条线性DNAs的转化整合外源基因物质。在这些实施方案中,一个片段在5’末端与第二片段并且在3’末端与第三片段重叠。
可以设计整合或缺失构建体,以致选择标志物基因和其调节元件的一些或所有能够由于随后的同源重组事件而自发缺失。完成此的便利方法是设计构建体使得选择标志物基因和/或调节元件的侧翼为重复序列。重复序列是相同的DNA序列,其对于宿主细胞是天然或非天然的,并且在构建体上以对于彼此相同或相反的方向取向。重复序列的长度有利地为50至1500bp,并且无需编码任何物质。包含重复序列允许发生同源重组,这导致选择标志物基因和一条重复序列的缺失。由于同源重组发生的频率相对较低,使转化子在非选择培养基上生长数轮,以使一些细胞中发生自发性同源重组是必需的。已经自发缺失选择标志物基因的细胞可以基于其由选择标志物基因所给予的选择特性的丧失而进行选择或筛选。在某些情况下,重组酶的表达可以增强重复位点之间的重组。
本文中提供的经修饰的酵母细胞中的外源3-HP发酵途径基因可来源于来自任何适宜来源的来源基因。例如,外源基因可来源于酵母、真菌、细菌、植物、昆虫或哺乳动来源。如本文中所使用,“来源于”天然来源基因的外源基因编码以下多肽:1)其与由天然基因所编码的多肽相同,2)其与由天然基因所编码的多肽享有至少50%、至少60%、至少70%、至少80%、至少85%、至少90%、至少95%、至少97%或至少99%的序列同一性和/或3)在3-HP发酵途径中与由天然基因所编码的多肽具有相同的功能。例如,来源于东方伊萨酵母PYC基因的PYC基因可以编码包含SEQ ID NO:2的氨基酸序列的多肽,与SEQ ID NO:2的氨基酸序列具有至少50%、至少60%、至少70%、至少80%、至少85%、至少90%、至少95%、至少97%或至少99%序列同一性的多肽和/或能够催化丙酮酸转化OAA的多肽。来源于天然基因的基因可包含与天然基因的编码区具有至少50%、至少60%、至少70%、至少80%、至少85%、至少90%、至少95%、至少97%或至少99%序列同一性的核苷酸序列。在某些实施方案中,来源于天然基因的基因可包含与来源基因的编码区相同的核苷酸序列。例如,来源于东方伊萨酵母PYC基因的PYC基因可包含SEQ ID NO:1的核苷酸序列或与SEQ ID NO:1的核苷酸序列具有至少50%、至少60%、至少70%、至少80%、至少85%、至少90%、至少95%、至少97%或至少99%序列同一性的核苷酸序列。
在本文中提供的经修饰的酵母细胞的某些实施方案中,外源3-HP发酵途径基因源自的天然来源基因产生参与3-HP发酵途径的多肽。然而在其他实施方案中,天然来源基因可以编码不参与3-HP发酵途径或催化3-HP发酵途径中的逆反应的多肽。在这些实施方案中,外源3-HP途径基因相对于天然来源基因将具有已经经过了一个或多个靶向或随机的突变,这引起修饰的活性和/或底物偏好。例如,可以使天然来源基因突变,以产生编码在3-HP发酵途径中期望的反应方向中活性增加和/或非期望的方向中活性降低的多肽的基因。例如,当天然来源基因编码能够同时催化3-HP发酵途径中的正向和逆向反应的多肽时,可以对基因进行修饰,以致所得外源基因在正向反应中活性增加并且在逆向反应中活性降低。类似地,可以使天然来源基因突变,以产生编码与天然多肽具有不同底物偏好的多肽的基因。例如,可以使3-HP途径基因突变,以产生能够作用于天然多肽不偏好或根本不起作用的底物的多肽。在这些实施方案中,由外源3-HP途径基因所编码的多肽可以催化由天然来源基因所编码的多肽完全不能催化的反应。还可以使天然来源基因突变,以致所得3-HP途径基因在一种或多种下游3-HP途径中间物或副产物的存在下在DNA、RNA或蛋白水平上呈现为反馈抑制减少。
在本文中提供的经修饰的酵母细胞的某些实施方案中,外源3-HP途径基因可来源于宿主酵母菌种。例如,当宿主细胞是东方伊萨酵母时,外源基因可来源于东方伊萨酵母基因。在这些实施方案中,外源基因可包含与天然基因的编码区相同的核苷酸序列,以致如果处于与野生型细胞中驱动基因表达的启动子不同的启动子的控制下,外源基因掺入到宿主细胞中使得天然基因序列的拷贝数增加和/或基因的调节或表达水平发生改变。在其他实施方案中,外源3-HP途径基因可包含与天然3-HP途径基因的编码区不同的核苷酸序列,然而即使如此仍然编码与由天然3-HP途径基因所编码的多肽相同的多肽。仍在其他实施方案中,外源3-HP途径基因可包含编码与由一个或多个天然3-HP途径基因所编码的多肽具有至少50%、至少60%、至少70%、至少80%、至少85%、至少90%、至少95%、至少97%或至少99%序列同一性的多肽的核苷酸序列。在这些实施方案的某些中,外源基因包含与一个或多个天然基因具有至少50%、至少60%、至少70%、至少80%、至少85%、至少90%、至少95%、至少97%或至少99%序列同一性的核苷酸序列。仍在其他实施方案中,外源3-HP基因可以编码与由天然3-HP途径基因所编码的多肽具有少于50%的序列同一性然而即使如此仍然与3-HP发酵途径中的天然多肽具有相同功能(即能够催化相同的反应)的多肽。如果需要,天然来源基因可以经过突变,以提供以通用真核细胞起始密码子(ATG)起始的编码序列,或出于其他目的。
在其他实施方案中,外源3-HP途径基因可来源于与宿主酵母细胞菌种不同的菌种。在这些实施方案的某些中,外源3-HP途径基因可来源于与宿主细胞不同的酵母菌种。例如,当宿主细胞是东方伊萨酵母时,外源基因可来源于酿酒酵母。在其他实施方案中,外源3-HP途径基因可来源于真菌、细菌、植物、昆虫或哺乳动物来源。例如,当宿主细胞是东方伊萨酵母时,外源基因可来源于细菌来源,例如大肠杆菌。在外源3-HP途径基因来源于非酵母来源的那些实施方案中,外源基因序列可以经密码子优化,以在酵母宿主细胞中表达。
在外源3-HP途径基因来源于宿主细胞菌种以外的其他菌种的那些实施方案中,外源基因可以编码与由来源生物的天然3-HP途径基因所编码的多肽相同的多肽。在这些实施方案的某些中,外源3-HP途径基因可以与来自来源生物的天然3-HP途径基因是相同的。在其他实施方案中,外源基因可以与来自来源生物的天然3-HP途径基因享有至少50%、至少60%、至少70%、至少80%、至少85%、至少90%、至少95%、至少97%或至少99%的序列同一性。在其他实施方案中,外源3-HP途径基因可以编码与由来自来源生物的天然3-HP途径基因所编码的多肽享有至少50%、至少60%、至少70%、至少80%、至少85%、至少90%、至少95%、至少97%或至少99%序列同一性的多肽。在这些实施方案的某些中,外源基因可包含与来自来源生物的一个或多个天然3-HP途径基因具有至少50%、至少60%、至少70%、至少80%、至少85%、至少90%、至少95%、至少97%或至少99%序列同一性的核苷酸序列。仍在其他实施方案中,外源3-HP基因可以编码与由来自来源生物的天然3-HP途径基因所编码的多肽具有少于50%的序列同一性然而即使如此仍然与3-HP发酵途径中来自来源生物的天然多肽具有相同功能的多肽。
在某些实施方案中,本文中提供的酵母细胞表达一个或多个3-HP途径基因,其编码选自下组的酶:ACC(催化乙酰-CoA转化为丙二酰-CoA),丙氨酸2,3氨基变位酶(AAM,催化丙氨酸转化为β-丙氨酸),丙氨酸脱氢酶(催化丙酮酸转化为丙氨酸),醛脱氢酶(催化3-HPA转化为3-HP),KGD(催化OAA转化为丙二酸半醛),ATT(催化OAA转化为天冬氨酸),ADC(催化天冬氨酸转化为β-丙氨酸),BCKA(催化OAA转化为丙二酸半醛),BAAT(催化β-丙氨酸转化为丙二酸半醛),4-氨基丁酸氨基转移酶(gabT,催化β-丙氨酸转化为丙二酸半醛),β-丙氨酰-CoA氨解酶(催化β-丙氨酰-CoA转化为丙烯酰-CoA),Co-A酰化丙二酸半醛脱氢酶(催化丙二酰-CoA转化为丙二酸半醛),CoA合成酶(催化β-丙氨酸转化为β-丙氨酰-CoA或乳酸转化为乳酰-CoA),CoA转移酶(催化β-丙氨酸转化为β-丙氨酰-CoA和/或乳酸转化为乳酰-CoA),甘油脱水酶(催化甘油转化为3-HPA),IPDA(催化OAA转化为丙二酸半醛),LDH(催化丙酮酸转化为乳酸),乳酰-CoA脱水酶(催化乳酰-CoA转化为丙烯酰-CoA),苹果酸脱羧酶(催化苹果酸转化为3-HP),苹果酸脱氢酶(催化OAA转化为苹果酸),丙二酰-CoA还原酶(催化丙二酰-CoA转化为丙二酸半醛或3-HP),OAA甲酸裂合酶(还被称为丙酮酸-甲酸裂合酶和酮酸甲酸裂合酶,催化OAA转化为丙二酰-CoA),OAA脱氢酶(催化OAA转化为丙二酰-CoA),PPC(催化PEP转化为OAA),丙酮酸/甘氨酸氨基转移酶(催化丙酮酸转化为甘氨酸),PYC(催化丙酮酸转化为OAA),PDH(催化丙酮酸转化为乙酰-CoA),2-酮酸脱羧酶(催化OAA转化为丙二酸半醛),3-HP-CoA脱水酶(也被称为丙烯酰-CoA水合酶,催化丙烯酰-CoA转化为3-HP-CoA),3-HPDH(催化丙二酸半醛转化为3-HP),3-HP-CoA水解酶(催化3-HP-CoA转化为3-HP),HIBADH(催化丙二酸半醛转化为3-HP),3-羟基异丁酰-CoA水解酶(催化3-HP-CoA转化为3-HP)和4-羟基丁酸脱氢酶(催化丙二酸半醛转化为3-HP)。对于这些酶活性的每个,圆括号中的目标反应可以是天然或非天然活性的结果。
本文中使用的“丙酮酸羧化酶基因”或“PYC基因”是指编码具有丙酮酸羧化酶活性的多肽的任何基因,意味着能够催化丙酮酸、CO2、ATP转化为OAA、ADP和磷酸。在某些实施方案中,PYC基因可来源于酵母来源。例如,PYC基因可来源于编码SEQ ID NO:2所示氨基酸序列的东方伊萨酵母PYC基因。在其他实施方案中,基因可以编码与SEQ ID NO:2的氨基酸序列具有至少50%、至少60%、至少70%、至少80%、至少85%、至少90%、至少95%、至少97%或至少99%序列同一性的氨基酸序列。在某些实施方案中,来源于东方伊萨酵母的PYC基因可包含SEQ ID NO:1所示的核苷酸序列或者与SEQ ID NO:1所示的核苷酸序列具有至少50%、至少60%、至少70%、至少80%、至少85%、至少90%、至少95%、至少97%或至少99%序列同一性的核苷酸序列。在其他实施方案中,PYC基因可来源于细菌来源。例如,PYC基因可来源于仅利用PYC而非PPC(参见下面)进行糖回补(anaplerosis)的少数几个细菌菌种之一,例如类球红细菌,或者来源于同时具有PYC和PPC的细菌菌种,例如菜豆根瘤菌。由类球红细菌和菜豆根瘤菌的PYC基因所编码的氨基酸序列分别示于SEQ ID NO:3和4。PYC基因可来源于编码SEQ ID NO:3或4的氨基酸序列的基因,或来源于编码与SEQ ID NO:3或4的氨基酸序列具有至少50%、至少60%、至少70%、至少80%、至少85%、至少90%、至少95%、至少97%或至少99%序列同一性的氨基酸序列的基因。或者,PYC基因可来源于编码不依赖于乙酰-CoA活化的酶的PYC基因,例如编码SEQ ID NO:5(羧基转移酶亚基)或SEQ ID NO:6(生物素羧化酶亚基)所示氨基酸序列的荧光假单胞菌PYC基因、编码SEQ ID NO:7所示氨基酸序列的谷氨酸棒杆菌PYC基因,或编码与SEQ ID NO:5、6或7的氨基酸序列具有至少50%、至少60%、至少70%、至少80%、至少85%、至少90%、至少95%、至少97%或至少99%序列同一性的氨基酸序列的基因。PYC基因还可来源于编码不被天冬氨酸抑制的酶的PYC基因,例如编码SEQ ID NO:8所示氨基酸序列的苜蓿中华根瘤菌PYC基因(Sauer FEMS Microbiol Rev29:765(2005)),或者来源于编码与SEQ ID NO:8的氨基酸序列具有至少50%、至少60%、至少70%、至少80%、至少85%、至少90%、至少95%、至少97%或至少99%序列同一性的氨基酸序列的基因。
本文中使用的“PEP羧化酶基因”或“PPC基因”是指编码具有PEP羧化酶活性的多肽的任何基因,意味着能够催化PEP和CO2转化为OAA和磷酸。在某些实施方案中,PPC基因可来源于细菌PPC基因。例如,PPC基因可来源于大肠杆菌PPC基因,其编码SEQ ID NO:10所示的氨基酸序列或者与SEQ ID NO:10的氨基酸序列具有至少50%、至少60%、至少70%、至少80%、至少85%、至少90%、至少95%、至少97%或至少99%序列同一性的氨基酸序列。在某些实施方案中,来源于大肠杆菌的PPC基因可包含SEQ ID NO:9所示的核苷酸序列或者与SEQ ID NO:9所示的核苷酸序列具有至少50%、至少60%、至少70%、至少80%、至少85%、至少90%、至少95%、至少97%或至少99%序列同一性的核苷酸序列。在其他实施方案中,PPC基因可来源于在很多古菌(archea)和有限数量的细菌中发现的“A”型PPC,其不被乙酰CoA活化并且较少被天冬氨酸抑制。例如,PPC基因可来源于编码SEQ ID NO:11所示氨基酸序列的嗜热自养甲烷杆菌PPC A基因、编码SEQ ID NO:12所示氨基酸序列的产气荚膜梭菌PPC A基因或编码与SEQ ID NO:11或12的氨基酸序列具有至少50%、至少60%、至少70%、至少80%、至少85%、至少90%、至少95%、至少97%或至少99%序列同一性的氨基酸序列的基因。在这些实施方案的某些中,基因相对于天然基因已经经过了一个或多个突变,以产生具有改进的特性的酶。例如,基因可以已经进行突变,以编码对天冬氨酸反馈的抗性相对于天然多肽增加的PPC多肽。在其他实施方案中,PPC基因可来源于植物来源。
本文中使用的“天冬氨酸氨基转移酶基因”或“AAT基因”是指编码具有天冬氨酸氨基转移酶活性的多肽的任何基因,意味着能够催化OOA转化为天冬氨酸。具有天冬氨酸氨基转移酶活性的酶被分类为EC 2.6.1.1。在某些实施方案中,AAT基因可来源于酵母来源,例如东方伊萨酵母或酿酒酵母。例如,AAT基因可来源于编码SEQ ID NO:14所示氨基酸序列的东方伊萨酵母AAT基因或编码SEQ ID NO:15所示氨基酸序列的酿酒酵母AAT2基因。在其他实施方案中,基因可以编码与SEQ ID NO:14或15的氨基酸序列具有至少50%、至少60%、至少70%、至少80%、至少85%、至少90%、至少95%、至少97%或至少99%序列同一性的氨基酸序列。在某些实施方案中,来源于东方伊萨酵母的AAT基因可包含SEQ ID NO:13所示的核苷酸序列或者与SEQ ID NO:13所示的核苷酸序列具有至少50%、至少60%、至少70%、至少80%、至少85%、至少90%、至少95%、至少97%或至少99%序列同一性的核苷酸序列。在其他实施方案中,AAT基因可来源于细菌来源。例如,AAT基因可来源于大肠杆菌aspC基因,其编码包含SEQ ID NO:16所示氨基酸序列的多肽。在其他实施方案中,基因可以编码与SEQID NO:16的氨基酸序列具有至少50%、至少60%、至少70%、至少80%、至少85%、至少90%、至少95%、至少97%或至少99%序列同一性的氨基酸序列。
本文中使用的“天冬氨酸脱羧酶”或“ADC基因”是指编码具有天冬氨酸脱羧酶活性的多肽的任何基因,意味着能够催化天冬氨酸转化为β-丙氨酸。具有天冬氨酸脱羧酶活性的酶被分类为EC 4.1.1.11。在某些实施方案中,ADC基因可来源于细菌来源。由于活性天冬氨酸脱羧酶需要对非活性酶原进行蛋白水解加工,在这些实施方案中,应当选择能够支持由细菌ADC基因所编码的活性酶形成的酵母宿主细胞。
在一些实施方案中,ADC基因可来源于编码SEQ ID NO:17所示氨基酸序列的阿维链霉菌panD基因。在一些实施方案中,ADC基因可以编码与SEQ ID NO:17的氨基酸序列具有至少50%、至少60%、至少70%、至少80%、至少85%、至少90%、至少95%、至少97%或至少99%序列同一性的氨基酸序列。在某些实施方案中,来源于阿维链霉菌的ADC基因可包含SEQ ID NO:130、145、146或147任一项所示的核苷酸序列或者与SEQ ID NO:130、145、146或147任一项所示的核苷酸序列具有至少50%、至少60%、至少70%、至少80%、至少85%、至少90%、至少95%、至少97%或至少99%序列同一性的核苷酸序列。
在其他实施方案中,ADC基因可来源于编码SEQ ID NO:18所示氨基酸序列的丙酮丁醇梭菌panD基因。在一些实施方案中,ADC基因可以编码与SEQ ID NO:18的氨基酸序列具有至少50%、至少60%、至少70%、至少80%、至少85%、至少90%、至少95%、至少97%或至少99%序列同一性的氨基酸序列。在某些实施方案中,来源于丙酮丁醇梭菌的ADC基因可包含SEQ ID NO:131所示的核苷酸序列或者与SEQ ID NO:131所示的核苷酸序列具有至少50%、至少60%、至少70%、至少80%、至少85%、至少90%、至少95%、至少97%或至少99%序列同一性的核苷酸序列。
在其他实施方案中,ADC基因可来源于编码SEQ ID NO:133所示氨基酸序列的幽门螺旋杆菌ADC基因。在一些实施方案中,ADC基因可以编码与SEQ ID NO:133的氨基酸序列具有至少50%、至少60%、至少70%、至少80%、至少85%、至少90%、至少95%、至少97%或至少99%序列同一性的氨基酸序列。在某些实施方案中,来源于幽门螺旋杆菌的ADC基因可包含SEQ ID NO:133所示的核苷酸序列或者与SEQ ID NO:133所示的核苷酸序列具有至少50%、至少60%、至少70%、至少80%、至少85%、至少90%、至少95%、至少97%或至少99%序列同一性的核苷酸序列。
在其他实施方案中,ADC基因可来源于编码SEQ ID NO:135所示氨基酸序列的芽孢杆菌种TS25(Bacillus sp.TS25)ADC基因。在一些实施方案中,ADC基因可以编码与SEQ IDNO:135的氨基酸序列具有至少50%、至少60%、至少70%、至少80%、至少85%、至少90%、至少95%、至少97%或至少99%序列同一性的氨基酸序列。在某些实施方案中,来源于芽孢杆菌种TS25的ADC基因可包含SEQ ID NO:134所示的核苷酸序列或者与SEQ ID NO:134所示的核苷酸序列具有至少50%、至少60%、至少70%、至少80%、至少85%、至少90%、至少95%、至少97%或至少99%序列同一性的核苷酸序列。
在其他实施方案中,ADC基因可来源于编码SEQ ID NO:137所示氨基酸序列的谷氨酸棒杆菌ADC基因。在一些实施方案中,ADC基因可以编码与SEQ ID NO:137的氨基酸序列具有至少50%、至少60%、至少70%、至少80%、至少85%、至少90%、至少95%、至少97%或至少99%序列同一性的氨基酸序列。在某些实施方案中,来源于谷氨酸棒杆菌的ADC基因可包含SEQ ID NO:136所示的核苷酸序列或者与SEQ ID NO:136所示的核苷酸序列具有至少50%、至少60%、至少70%、至少80%、至少85%、至少90%、至少95%、至少97%或至少99%序列同一性的核苷酸序列。
在其他实施方案中,ADC基因可来源于编码SEQ ID NO:139所示氨基酸序列的地衣芽孢杆菌ADC基因。在一些实施方案中,ADC基因可以编码与SEQ ID NO:139的氨基酸序列具有至少50%、至少60%、至少70%、至少80%、至少85%、至少90%、至少95%、至少97%或至少99%序列同一性的氨基酸序列。在某些实施方案中,来源于地衣芽孢杆菌的ADC基因可包含SEQ ID NO:138、148、149、150或151任一项所示的核苷酸序列或者与SEQ ID NO:138、148、149、150或151任一项所示的核苷酸序列具有至少50%、至少60%、至少70%、至少80%、至少85%、至少90%、至少95%、至少97%或至少99%序列同一性的核苷酸序列。
本文中使用的“β-丙氨酸氨基转移酶基因”或“BAAT基因”是指编码具有β-丙氨酸氨基转移酶活性的多肽的任何基因,意味着能够催化β-丙氨酸转化为丙二酸半醛。具有β-丙氨酸氨基转移酶活性的酶被分类为EC 2.6.1.19。在某些实施方案中,BAAT基因可来源于酵母来源,例如,BAAT基因可来源于pyd4基因的东方伊萨酵母同源物,其编码SEQ ID NO:20所示的氨基酸序列。在一些实施方案中,BAAT基因可以编码与SEQ ID NO:20的氨基酸序列具有至少50%、至少60%、至少70%、至少80%、至少85%、至少90%、至少95%、至少97%或至少99%序列同一性的氨基酸序列。在某些实施方案中,来源于东方伊萨酵母的BAAT基因可包含SEQ ID NO:19所示的核苷酸序列或者与SEQ ID NO:19所示的核苷酸序列具有至少50%、至少60%、至少70%、至少80%、至少85%、至少90%、至少95%、至少97%或至少99%序列同一性的核苷酸序列。在其他实施方案中,BAAT基因可来源于编码SEQ ID NO:21所示氨基酸序列的克鲁维酵母pyd4基因。在一些实施方案中,BAAT基因可以编码与SEQ ID NO:21的氨基酸序列具有至少50%、至少60%、至少70%、至少80%、至少85%、至少90%、至少95%、至少97%或至少99%序列同一性的氨基酸序列。在某些实施方案中,来源于克鲁维酵母的BAAT基因可包含SEQ ID NO:142所示的核苷酸序列或者与SEQ ID NO:142所示的核苷酸序列具有至少50%、至少60%、至少70%、至少80%、至少85%、至少90%、至少95%、至少97%或至少99%序列同一性的核苷酸序列。在其他实施方案中,BAAT基因可来源于细菌来源。例如,BAAT基因可来源于编码SEQ ID NO:22所示氨基酸序列的阿维链霉菌BAAT基因。在一些实施方案中,BAAT基因可以编码与SEQ ID NO:22的氨基酸序列具有至少50%、至少60%、至少70%、至少80%、至少85%、至少90%、至少95%、至少97%或至少99%序列同一性的氨基酸序列。在某些实施方案中,来源于阿维链霉菌的BAAT基因可包含SEQ ID NO:140所示的核苷酸序列或者与SEQ ID NO:140所示的核苷酸序列具有至少50%、至少60%、至少70%、至少80%、至少85%、至少90%、至少95%、至少97%或至少99%序列同一性的核苷酸序列。
BAAT基因还可以是“4-氨基丁酸氨基转移酶”或“gabT基因”,意味着其对4-氨基丁酸以及β-丙氨酸具有天然活性。或者,BAAT基因可来源于对来自细菌或酵母来源的天然gabT基因的随机或定向工程改造,以编码具有BAAT活性的多肽。例如,BAAT基因可来源于编码SEQ ID NO:23所示氨基酸序列的阿维链霉菌gabT。在一些实施方案中,来源于阿维链霉菌的BAAT基因可以编码与SEQ ID NO:23的氨基酸序列具有至少50%、至少60%、至少70%、至少80%、至少85%、至少90%、至少95%、至少97%或至少99%序列同一性的氨基酸序列。在其他实施方案中,BAAT基因可来源于编码SEQ ID NO:24所示氨基酸序列的酿酒酵母gabT基因UGA1。在一些实施方案中,来源于酿酒酵母的BAAT基因可以编码与SEQ ID NO:24的氨基酸序列具有至少50%、至少60%、至少70%、至少80%、至少85%、至少90%、至少95%、至少97%或至少99%序列同一性的氨基酸序列。在某些实施方案中,来源于酿酒酵母的BAAT基因可包含SEQ ID NO:141所示的核苷酸序列或者与SEQ ID NO:141所示的核苷酸序列具有至少50%、至少60%、至少70%、至少80%、至少85%、至少90%、至少95%、至少97%或至少99%序列同一性的核苷酸序列。
本文中使用的“3-HP脱氢酶基因”或“3-HPDH基因”是指编码具有3-HP脱氢酶活性的多肽的任何基因,意味着能够催化丙二酸半醛转化为3-HP。具有3-HP脱氢酶活性的酶如果利用NAD(H)转助因子则被分类为EC 1.1.1.59,如果其利用NADP(H)转助因子则被分类为EC 1.1.1.298。被分类为EC 1.1.1.298的酶也可被称为丙二酸半醛还原酶。
在某些实施方案中,3-HPDH基因可来源于酵母来源。例如,3-HPDH基因可来源于YMR226C基因的东方伊萨酵母同源物,其编码SEQ ID NO:26所示的氨基酸序列。在一些实施方案中,3-HPDH基因可以编码与SEQ ID NO:26的氨基酸序列具有至少50%、至少60%、至少70%、至少80%、至少85%、至少90%、至少95%、至少97%或至少99%序列同一性的氨基酸序列。在某些实施方案中,来源于东方伊萨酵母的3-HPDH基因可包含SEQ ID NO:25所示的核苷酸序列或者与SEQ ID NO:25所示的核苷酸序列具有至少50%、至少60%、至少70%、至少80%、至少85%、至少90%、至少95%、至少97%或至少99%序列同一性的核苷酸序列。在其他实施方案中,3-HPDH基因可来源于编码SEQ ID NO:129所示氨基酸序列的酿酒酵母YMR226C基因。在一些实施方案中,3-HPDH基因可以编码与SEQ ID NO:129的氨基酸序列具有至少50%、至少60%、至少70%、至少80%、至少85%、至少90%、至少95%、至少97%或至少99%序列同一性的氨基酸序列。在某些实施方案中,来源于酿酒酵母的3-HPDH基因可包含SEQ ID NO:144所示的核苷酸序列或者与SEQ ID NO:144所示的核苷酸序列具有至少50%、至少60%、至少70%、至少80%、至少85%、至少90%、至少95%、至少97%或至少99%序列同一性的核苷酸序列。
在其他实施方案中,3-HPDH基因可来源于细菌来源。例如,3-HPDH基因可来源于编码SEQ ID NO:27所示氨基酸序列的大肠杆菌ydfG基因。在一些实施方案中,基因可以编码与SEQ ID NO:27的氨基酸序列具有至少50%、至少60%、至少70%、至少80%、至少85%、至少90%、至少95%、至少97%或至少99%序列同一性的氨基酸序列。在某些实施方案中,来源于大肠杆菌的3-HPDH基因可包含SEQ ID NO:143所示的核苷酸序列或者与SEQ ID NO:143所示的核苷酸序列具有至少50%、至少60%、至少70%、至少80%、至少85%、至少90%、至少95%、至少97%或至少99%序列同一性的核苷酸序列。在其他实施方案中,3-HPDH基因可来源于编码SEQ ID NO:29所示氨基酸序列的M.sedula丙二酸半醛还原酶基因。在一些实施方案中,3-HPDH基因可以编码与SEQ ID NO:29所示的氨基酸序列具有至少50%、至少60%、至少70%、至少80%、至少85%、至少90%、至少95%、至少97%或至少99%序列同一性的氨基酸序列。在某些实施方案中,来源于M.sedula的3-HPDH基因可包含SEQ ID NO:343所示的核苷酸序列或者与SEQ ID NO:343所示的核苷酸序列具有至少50%、至少60%、至少70%、至少80%、至少85%、至少90%、至少95%、至少97%或至少99%序列同一性的核苷酸序列。
本文中使用的“3-羟基异丁酸脱氢酶基因”或“HIBADH基因”是指编码具有3-羟基异丁酸脱氢酶活性的多肽的任何基因,意味着能够催化3-羟基异丁酸转化为丙二酸半醛。具有3-羟基异丁酸脱氢酶活性的酶被分类为EC 1.1.1.31。一些3-羟基异丁酸脱氢酶还具有3-HPDH活性。在某些实施方案中,HIBADH基因可来源于细菌来源。例如,HIBADH基因可来源于编码SEQ ID NO:28所示氨基酸序列的粪产碱菌M3A基因,分别编码SEQ ID NO:30或SEQID NO:31所示氨基酸序列的恶臭假单胞菌KT2440或E23440mmsB基因,或者编码SEQ ID NO:32所示氨基酸序列的铜绿假单胞菌PAO1mmsB基因。在某些实施方案中,HIBADH基因可以编码与SEQ ID NO:28、30、31或32所示的氨基酸序列具有至少50%、至少60%、至少70%、至少80%、至少85%、至少90%、至少95%、至少97%或至少99%序列同一性的氨基酸序列。
本文中使用的“4-羟基丁酸脱氢酶基因”是指编码具有4-羟基丁酸脱氢酶活性的多肽的任何基因,意味着能够催化4-羟基丁酸转化为琥珀酸半醛。具有4-羟基丁酸脱氢酶活性的酶被分类为EC 1.1.1.61。一些4-羟基丁酸脱氢酶还具有3-HPDH活性。在某些实施方案中,4-羟基丁酸脱氢酶基因可来源于细菌来源。例如,4-羟基丁酸脱氢酶基因可来源于编码SEQ ID NO:33所示氨基酸序列的R.eutropha H16 4hbd基因或者编码SEQ ID NO:34所示氨基酸序列的克鲁维梭菌(C.kluyveri)DSM 555hbd基因。在其他实施方案中,基因可以编码与SEQ ID NO:33或34所示的氨基酸序列具有至少50%、至少60%、至少70%、至少80%、至少85%、至少90%、至少95%、至少97%或至少99%序列同一性的氨基酸序列。
本文中使用的“PEP羧激酶基因”或“PCK基因”是指编码具有PEP羧激酶活性的多肽的任何基因,意味着能够催化PEP、CO2和ADP或GDP转化为OAA和ATP或GTP,或者反之亦然。具有PEP羧激酶活性的酶被分类为EC 4.1.1.32(利用GTP/GDP)和EC 4.1.1.49(利用ATP/ADP)。在某些实施方案中,PCK基因可来源于酵母来源。在其他实施方案中,PCK基因可来源于细菌来源,并且在这些实施方案的某些中,基因可来源于其中PCK反应有利于OAA的产生而非脱羧化占主导的更常见反应形式的细菌中。例如,PCK基因可来源于编码SEQ ID NO:35所示氨基酸序列的产琥珀酸曼氏杆菌(M.succiniciproducens)PCK基因、编码SEQ ID NO:36所示氨基酸序列的产琥珀酸厌氧螺菌(A.succiniciproducens)PCK基因、编码SEQ IDNO:37所示氨基酸序列的产琥珀酸放线杆菌(A.succinogenes)PCK基因或者编码SEQ IDNO:38所示氨基酸序列的R.eutropha PCK基因。在其他实施方案中,PCK基因相对于其所来源的天然基因已经经过了一个或多个突变,以致所得基因编码优选催化PEP转化为OAA的多肽。例如,PCK基因可来源于编码SEQ ID NO:39所示氨基酸序列的大肠杆菌K12菌株PCK基因,其中已经使基因突变,以优选催化PEP转化为OAA。在其他实施方案中,PEP向OAA的转化由例如在丙酸菌(例如谢曼氏丙酸杆菌(P.shermanii)、伍氏醋酸杆菌(A.woodii))中发现的PEP羧基转磷酸酶催化,所述丙酸菌利用无机磷酸盐和二磷酸盐而非ATP/ADP或GTP/GDP。
本文中使用的“苹果酸脱氢酶基因”是指编码具有苹果酸脱氢酶活性的多肽的任何基因,意味着能够催化OAA转化为苹果酸。在某些实施方案中,苹果酸脱氢酶基因可来源于细菌或酵母来源。
本文中使用的“苹果酸脱羧酶基因”是指编码具有苹果酸脱羧酶活性的多肽的任何基因,意味着能够催化苹果酸转化为3-HP。已知苹果酸脱羧酶活性不能天然发生。因此,苹果酸脱羧酶基因可以通过在编码具有乙酰乳酸脱羧酶活性的多肽的天然来源基因中掺入一个或多个突变而得到。具有乙酰乳酸脱羧酶活性的多肽催化2-羟基-2-甲基-3-氧代丁酸转化为2-乙偶姻(2-acetoin),其被分类为EC 4.1.1.5。在某些实施方案中,苹果酸脱羧酶基因可来源于细菌来源。例如,苹果酸脱羧酶基因可来源于编码SEQ ID NO:40所示氨基酸序列的乳酸乳球菌(L.lactis)aldB基因、编码SEQ ID NO:41所示氨基酸序列的嗜热链球菌(S.thermophilus)aldB基因、编码SEQ ID NO:42所示氨基酸序列的短芽孢杆菌(B.brevis)aldB基因或者编码SEQ ID NO:43所示氨基酸序列的产气肠杆菌(E.aerogenes)budA基因。
本文中使用的“α-酮戊二酸(AKG)脱羧酶基因”或“KGD基因”是指编码具有α-酮戊二酸脱羧酶活性的多肽的任何基因,意味着能够催化α-酮戊二酸(2-氧化戊二酸)转化为琥珀酸半醛。具有α-酮戊二酸脱羧酶活性的酶被分类为EC 4.1.1.71。KGD基因可以用于得到编码能够催化OAA转化为丙二酸半醛的多肽的基因。这种活性可以在天然KGD基因中找到,或者其可以通过在天然KGD基因中掺入一个或多个突变而得到。在某些实施方案中,KGD基因可来源于细菌来源。例如,KGD基因可来源于编码SEQ ID NO:44所示氨基酸序列的结核分枝杆菌(M.tuberculosis)KGD基因、编码SEQ ID NO:45所示氨基酸序列的B.japonicum KGD基因或者编码SEQ ID NO:46所示氨基酸序列的M.loti(即Rhizobium loti)KGD基因。
本文中使用的“支链α-酮酸脱羧酶基因”或“BCKA基因”是指编码具有支链α-酮酸脱羧酶活性的多肽的任何基因,其能够用于使长度为3至6个碳原子的一类α-酮酸脱羧。具有BCKA活性的酶被分类为EC 4.1.1.72。BCKA基因可以用于得到编码能够催化OAA转化为丙二酸半醛的多肽的基因。这种活性可以在天然BCKA基因中找到,或者其可以通过在天然BCKA基因中掺入一个或多个突变而得到。在某些实施方案中,BCKA基因可来源于细菌来源。例如,BCKA基因可来源于编码SEQ ID NO:47所示氨基酸序列的乳酸乳球菌kdcA基因。
本文中使用的“吲哚丙酮酸脱羧酶基因”或“IPDA基因”是指编码具有吲哚丙酮酸脱羧酶活性的多肽的任何基因,意味着能够催化吲哚丙酮酸转化为吲哚乙醛。具有IPDA活性的酶被分类为EC 4.1.1.74。IPDA基因可以用于得到编码能够催化OAA转化为丙二酸半醛的多肽的基因。这种活性可以在天然IPDA基因中找到,或者其可以通过在天然IPDA基因中掺入一个或多个突变而得到。在某些实施方案中,吲哚丙酮酸脱羧酶基因可来源于酵母、细菌或植物来源。
本文中使用的“丙酮酸脱羧酶基因”或“PDC基因”是指编码具有丙酮酸脱羧酶活性的多肽的任何基因,意味着能够催化丙酮酸转化为乙醛。具有PDC活性的酶被分类为EC4.1.1.1。在优选的实施方案中,掺入到如本文中所提供的经修饰的酵母细胞中的PDC基因相对于其所来源的天然基因已经经过了一个或多个突变,以致所得基因编码能够催化OAA转化为丙二酸半醛的多肽。在某些实施方案中,PDC基因可来源于酵母来源。例如,PDC基因可来源于编码SEQ ID NO:49所示氨基酸序列的东方伊萨酵母PDC基因、编码SEQ ID NO:50所示氨基酸序列的酿酒酵母PDC1基因或者编码SEQ ID NO:51所示氨基酸序列的乳酸克鲁维酵母(K.lactis)PDC。在某些实施方案中,来源于东方伊萨酵母PDC基因的PDC基因可包含SEQ ID NO:48所示的核苷酸序列或者与SEQ ID NO:48所示的核苷酸序列具有至少50%、至少60%、至少70%、至少80%、至少85%、至少90%、至少95%、至少97%或至少99%序列同一性的核苷酸序列。在其他实施方案中,PDC基因可来源于细菌来源。例如,PDC基因可来源于编码SEQ ID NO:52所示氨基酸序列的运动发酵单胞菌(Z.mobilis)PDC基因或者编码SEQID NO:53所示氨基酸序列的巴斯德醋酸杆菌(A.Pasteurianus)PDC基因。
本文中使用的甲酸苄酯脱羧酶”基因是指编码具有甲酸苄酯脱羧酶活性的多肽的任何基因,意味着能够催化甲酸苄酯转化为苯甲醛。具有甲酸苄酯脱羧酶活性的酶被分类为EC 4.1.1.7。在优选的实施方案中,掺入到如本文中所提供的经修饰的酵母细胞中的甲酸苄酯脱羧酶基因相对于其所来源的天然基因已经经过了一个或多个突变,以致所得基因编码能够催化OAA转化为丙二酸半醛的多肽。在某些实施方案中,甲酸苄酯脱羧酶基因可来源于细菌来源。例如,甲酸苄酯脱羧酶基因可来源于编码SEQ ID NO:54所示氨基酸序列的恶臭假单胞菌mdlC基因、编码SEQ ID NO:55所示氨基酸序列的铜绿假单胞菌mdlC基因、编码SEQ ID NO:56所示氨基酸序列的施氏假单胞菌(P.stutzeri)dpgB基因或者编码SEQ IDNO:57所示氨基酸序列的荧光假单胞菌ilvB-1基因。
本文中使用的“OAA甲酸裂合酶”是指编码具有OAA甲酸裂合酶活性的多肽的任何基因,意味着能够催化酰化酮酸转化为其相应的CoA衍生物。由OAA甲酸裂合酶基因所编码的多肽可以对丙酮酸或对另一种酮酸具有活性。在某些实施方案中,OAA甲酸裂合酶基因编码将OAA转化为丙二酰-CoA的多肽。
本文中使用的“丙二酰-CoA还原酶基因”是指编码具有丙二酰-CoA还原酶活性的多肽的任何基因,意味着能够催化丙二酰-CoA转化为丙二酸半醛(也被称为Co-A酰化丙二酸半醛脱氢酶活性)。在某些实施方案中,丙二酰-CoA还原酶基因可来源于双功能性丙二酰-CoA还原酶基因,其还能够催化丙二酸半醛转化为3-HP。在这些实施方案的某些中,丙二酰-CoA还原酶基因可来源于细菌来源。例如,丙二酰-CoA还原酶基因可来源于编码SEQ IDNO:58所示氨基酸序列的橙色绿屈挠菌(C.aurantiacus)丙二酰-CoA还原酶基因、编码SEQID NO:59所示氨基酸序列的R.castenholzii丙二酰-CoA还原酶基因或者编码SEQ ID NO:60所示氨基酸序列的赤杆菌属NAP1(Erythrobacter sp.NAP1)丙二酰-CoA还原酶基因。在其他实施方案中,丙二酰-CoA还原酶基因可来源于编码仅催化丙二酰-CoA转化为丙二酸半醛的多肽的丙二酰-CoA还原酶基因。例如,丙二酰-CoA还原酶基因可来源于编码SEQ IDNO:61所示氨基酸序列的M.sedula Msed_0709基因或者编码SEQ ID NO:62所示氨基酸序列的硫化叶菌(S.tokodaii)丙二酰-CoA还原酶。
本文中使用的“丙酮酸脱氢酶基因”或“PDH基因”是指编码具有丙酮酸脱氢酶活性的多肽的任何基因,意味着能够催化丙酮酸转化为乙酰-CoA。在某些实施方案中,PDH基因可来源于酵母来源。例如,PDH基因可来源于分别编码SEQ ID NO:63-66所示氨基酸序列的酿酒酵母LAT1、PDA1、PDB1或LPD基因。在其他实施方案中,PDH基因可来源于细菌来源。例如,PDH基因可来源于分别编码SEQ ID NO:67-69所示氨基酸序列的大肠杆菌K12亚株MG1655aceE、aceF或Ipd基因或者分别编码SEQ ID NO:70-73所示氨基酸序列的枯草芽孢杆菌(B.subtilis)pdhA、pdhB、pdhC或pdhD基因。
本文中使用的“乙酰-CoA羧化酶基因”或“ACC基因”是指编码具有乙酰-CoA羧化酶活性的多肽的任何基因,意味着能够催化乙酰-CoA转化为丙二酰-CoA。具有乙酰-CoA羧化酶活性的酶被分类为EC 6.4.1.2。在某些实施方案中,乙酰-CoA羧化酶基因可来源于酵母来源。例如,乙酰-CoA羧化酶基因可来源于编码SEQ ID NO:74所示氨基酸序列的酿酒酵母ACC1基因。在其他实施方案中,乙酰-CoA羧化酶基因可来源于细菌来源。例如,乙酰-CoA羧化酶基因可来源于分别编码SEQ ID NO:75-78所示氨基酸序列的大肠杆菌accA、accB、accC或accD基因或者分别编码SEQ ID NO:79-82所示氨基酸序列的橙色绿屈挠菌accA、accB、accC或accD基因。
本文中使用的“丙氨酸脱氢酶基因”是指编码具有丙氨酸脱氢酶活性的多肽的任何基因,意味着能够催化丙酮酸NAD依赖性还原胺化为丙氨酸。具有丙氨酸脱氢酶活性的酶被分类为EC 1.4.1.1。在某些实施方案中,丙氨酸脱氢酶基因可来源于细菌来源。例如,丙氨酸脱氢酶基因可来源于编码SEQ ID NO:83所示氨基酸序列的枯草芽孢杆菌丙氨酸脱氢酶基因。
本文中使用的“丙酮酸/丙氨酸氨基转移酶基因”是指编码具有丙酮酸/丙氨酸氨基转移酶活性的多肽的任何基因,意味着能够催化丙酮酸和L-谷氨酸转化为丙氨酸和2-氧代戊二酸。在某些实施方案中,丙酮酸/丙氨酸氨基转移酶基因来源于酵母来源。例如,丙酮酸/丙氨酸氨基转移酶基因可来源于编码SEQ ID NO:84所示氨基酸序列的粟酒裂殖酵母(S.pombe)丙酮酸/丙氨酸氨基转移酶基因或者编码SEQ ID NO:85所示氨基酸序列的酿酒酵母ALT2基因。
本文中使用的“丙氨酸2,3氨基变位酶基因”或“AAM基因”是指编码具有丙氨酸2,3氨基变位酶活性的多肽的任何基因,意味着能够催化丙氨酸转化为β-丙氨酸。已知丙氨酸2,3氨基变位酶活性不能天然发生。因此,丙氨酸2,3氨基变位酶基因可以通过在编码具有类似活性例如赖氨酸2,3氨基变位酶活性(参见例如US专利7,309,597)的多肽的天然来源基因中掺入一个或多个突变而得到。在某些实施方案中,天然来源基因可以是编码SEQ IDNO:86所示氨基酸序列的枯草芽孢杆菌赖氨酸2,3氨基变位酶基因、编码SEQ ID NO:87所示氨基酸序列的牙龈卟啉单胞菌(P.gingivalis)赖氨酸2,3氨基变位酶基因或者编码SEQ IDNO:88所示氨基酸序列的具核梭杆菌(F.nucleatum)(ATCC-10953)赖氨酸2,3氨基变位酶基因。
本文中使用的“CoA转移酶基因”是指编码具有CoA转移酶活性的多肽的任何基因,所述CoA转移酶活性在一个实施例中包括催化β-丙氨酸转化为β-丙氨酰-CoA和/或乳酸转化为乳酰-CoA的能力。在某些实施方案中,CoA转移酶基因可来源于酵母来源。在其他实施方案中,CoA转移酶基因可来源于细菌来源。例如,CoA转移酶基因可来源于编码SEQ ID NO:89所示氨基酸序列的埃氏巨球形菌(M.elsdenii)CoA转移酶基因。
本文中使用的“CoA合成酶基因”是指编码具有CoA合成酶活性的多肽的任何基因。在一个实例中,这包括催化β-丙氨酸转化为β-丙氨酰-CoA的能力。在另一个实例中,这包括催化乳酸转化为乳酰-CoA的能力。在某些实施方案中,CoA合成酶基因可来源于酵母来源。例如,CoA合成酶基因可来源于酿酒酵母CoA合成酶基因。在其他实施方案中,CoA合成酶基因可来源于细菌来源。例如,CoA合成酶基因可来源于大肠杆菌CoA合成酶、类球红细菌或肠道沙门氏菌(S.enterica)CoA合成酶基因。
本文中使用的“β-丙氨酰-CoA氨解酶基因”是指编码具有β-丙氨酰-CoA氨解酶活性的多肽的任何基因,意味着能够催化β-丙氨酰-CoA转化为丙烯酰-CoA。在某些实施方案中,β-丙氨酰-CoA氨解酶基因可来源于细菌来源,例如编码SEQ ID NO:90所示氨基酸序列的丙酸梭菌(C.propionicum)β-丙氨酰-CoA氨解酶基因。
本文中使用的“3-HP-CoA脱水酶基因”或“丙烯酰-CoA水合酶基因”是指编码具有3-HP-CoA脱水酶活性的多肽的任何基因,意味着能够催化丙烯酰-CoA转化为3-HP-CoA。具有3-HP-CoA脱水酶活性的酶被分类为EC4.2.1.116。在某些实施方案中,3-HP-CoA脱水酶基因可来源于酵母或真菌来源,例如编码SEQ ID NO:91所示氨基酸序列的大豆疫霉根腐菌(P.sojae)3-HP-CoA脱水酶基因。在其他实施方案中,3-HP-CoA脱水酶基因可来源于细菌来源。例如,3-HP-CoA脱水酶基因可来源于编码SEQ ID NO:92所示氨基酸序列的橙色绿屈挠菌3-HP-CoA脱水酶基因、编码SEQ ID NO:93所示氨基酸序列的深红红螺菌(R.rubrum)3-HP-CoA脱水酶基因或者编码SEQ ID NO:94所示氨基酸序列的R.capsulates 3-HP-CoA脱水酶基因。仍在其他实施方案中,3-HP-CoA脱水酶基因可来源于哺乳动物来源。例如,3-HP-CoA脱水酶基因可来源于编码SEQ ID NO:95所示氨基酸序列的智人(H.sapiens)3-HP-CoA脱水酶基因。
本文中使用的“3-HP-CoA水解酶基因”是指编码具有3-HP-CoA水解酶活性的多肽的任何基因,意味着能够催化3-HP-CoA转化为3-HP。在某些实施方案中,3-HP-CoA基因可来源于酵母或真菌来源。在其他实施方案中,3-HP-CoA基因可来源于细菌或哺乳动物来源。
本文中使用的“3-羟基异丁酰-CoA水解酶基因”是指编码具有3-羟基异丁酰-CoA水解酶活性的多肽的任何基因,所述3-羟基异丁酰-CoA水解酶活性在一个实例中包括催化3-HP-CoA转化为3-HP的能力。在某些实施方案中,3-羟基异丁酰-CoA水解酶基因可来源于细菌来源,例如编码SEQ ID NO:96所示氨基酸序列的荧光假单胞菌3-羟基异丁酰-CoA水解酶基因或者编码SEQ ID NO:97所示氨基酸序列的蜡状芽孢杆菌(B.cereus)3-羟基异丁酰-CoA水解酶基因。在其他实施方案中,3-羟基异丁酰-CoA水解酶基因可来源于哺乳动物来源,例如编码SEQ ID NO:98所示氨基酸序列的智人3-羟基异丁酰-CoA水解酶基因。
本文中使用的“乳酸脱氢酶基因”或“LDH基因”是指编码具有乳酸脱氢酶活性的多肽的任何基因,意味着能够催化丙酮酸转化为乳酸。在某些实施方案中,LDH基因可来源于真菌、细菌或哺乳动物来源。
本文中使用的“乳酰-CoA脱水酶基因”是指编码具有乳酰-CoA脱水酶活性的多肽的任何基因,意味着能够催化乳酰-CoA转化为丙烯酰-CoA。在某些实施方案中,乳酰-CoA脱水酶基因可来源于细菌来源。例如,乳酰-CoA脱水酶基因可来源于编码SEQ ID NO:99-101所示氨基酸序列的埃氏巨球形菌乳酰-CoA脱水酶E1、Ella或Ellb亚基基因。
本文中使用的“醛脱氢酶基因”是指编码具有醛脱氢酶活性的多肽的任何基因,所述醛脱氢酶活性在一个实例中包括催化3-HPA转化为3-HP及其相反转化的能力。在某些实施方案中,醛脱氢酶基因可来源于酵母来源,例如编码SEQ ID NO:102所示氨基酸序列的酿酒酵母醛脱氢酶基因或者编码SEQ ID NO:122、124或126所示氨基酸序列的东方伊萨酵母醛脱氢酶基因。在其他实施方案中,醛脱氢酶可来源于细菌来源,例如编码SEQ ID NO:103所示氨基酸序列的大肠杆菌aldH基因或者编码SEQ ID NO:104所示氨基酸序列的肺炎克雷伯氏菌(K.pneumoniae)醛脱氢酶基因。
本文中使用的“甘油脱水酶基因”是指编码具有甘油脱水酶活性的多肽的任何基因,意味着能够催化甘油转化为3-HPA。在某些实施方案中,甘油脱水酶基因可来源于细菌来源,例如肺炎克雷伯氏菌或弗氏柠檬酸杆菌(C.freundii)甘油脱水酶基因。
在某些实施方案中,本文中提供的经遗传修饰的酵母细胞进一步包含一个或多个天然基因的缺失或破坏。关于天然基因的“缺失或破坏”是指或者基因的整个编码区被去除(缺失),或者基因的编码区、启动子和/或其终止子区域被修饰(例如通过缺失、插入或突变),以致基因不再产生活性酶,产生显著减少的量(至少减少75%,优选至少减少90%)的活性酶,或产生活性显著降低(至少降低75%,优选至少降低90%)的酶。
在某些实施方案中,一个或多个天然基因的缺失或破坏导致一个或多个天然代谢途径的缺失或破坏。关于代谢途径的“缺失或破坏”是指该途径或者无法运行,或者表现出相对于天然途径降低至少75%、至少85%或至少95%的活性。在某些实施方案中,天然代谢途径的缺失或破坏通过掺入导致一个或多个天然基因的表达减少的一个或多个遗传修饰而达到,所述表达减少使得3-HP的产生减少。
在某些实施方案中,天然基因的缺失或破坏可以通过强制进化(forcedevolution)、诱变或基因工程改造方法,随后进行适宜的选择或筛选以鉴定期望突变体而达到。在某些实施方案中,天然宿主细胞基因的缺失或破坏可以与在宿主细胞中掺入一个或多个外源基因偶联,即可以利用也是缺失构建体的基因表达整合构建体来掺入外源基因。在其他实施方案中,缺失或破坏可以利用不含外源基因的缺失构建体或者通过本领域已知的其他方法而达到。
在某些实施方案中,本文中提供的经遗传修饰的酵母细胞包含一个或多个天然基因的缺失或破坏,所述天然基因编码参与乙醇发酵的酶,包括例如丙酮酸脱羧酶(PDC,将丙酮酸转化为乙醛)和/或乙醇脱氢酶(ADH,将乙醛转化为乙醇)基因。这些修饰降低了酵母细胞生产乙醇的能力,从而使3-HP的生产最大化。然而,在某些实施方案中,可以对本文中提供的经遗传修饰的酵母细胞进行工程改造,以同时产生3-HP和乙醇。在那些实施方案中,编码参与乙醇发酵的酶的天然基因优选不被缺失或破坏,并且在某些实施方案中,酵母细胞可包含使乙醇生产增加的一个或多个外源基因。
在某些实施方案中,本文中提供的经遗传修饰的酵母细胞包含一个或多个天然基因的缺失或破坏,所述天然基因编码参与产生另外的发酵产物例如甘油或其他副产物例如乙酸盐或二醇的酶。例如,本文中提供的细胞可包含一个或多个以下基因的缺失或破坏:甘油3-磷酸脱氢酶(GPD,催化二羟基丙酮至甘油3-磷酸的反应)、甘油3-磷酸酶(GPP,催化甘油3-磷酸转化为甘油)、甘油激酶(催化甘油3-磷酸酶转化为甘油)、二羟基丙酮激酶(催化二羟基丙酮磷酸转化为二羟基丙酮)、甘油脱氢酶(催化二羟基丙酮转化为甘油)、醛脱氢酶(ALD,例如,将乙醛转化为乙酸或将3-HP转化为3-HPA)或丁二醇脱氢酶(催化丁二醇转化为乙偶姻和相反转化)基因。
在某些实施方案中,本文中提供的经遗传修饰的酵母细胞包含一个或多个天然基因的缺失或破坏,所述天然基因编码催化3-HP发酵途径中的逆反应的酶,包括例如PEP羧激酶(PCK)、具有OAA脱羧酶活性的酶或CYB2A或CYB2B(催化乳酸转化为丙酮酸)。PCK催化PEP转化为OAA和相反转化,但是表现为优选OAA至OPP的反应。为了减少OAA至PEP的转化,一个或多个拷贝的天然PCK基因可以被缺失或破坏。在某些实施方案中,其中一个或多个天然PCK基因已被缺失或破坏的酵母细胞可以表达一个或多个外源PCK基因,所述外源PCK基因已经进行突变,以编码有利于PEP转化为OAA的多肽。OAA脱羧酶催化OAA转化为丙酮酸。已经鉴定出了具有OAA脱羧酶活性的酶,例如大肠杆菌中由eda基因所编码的酶以及酵母和真菌中的苹果酸酶(MAE)。为了降低OAA脱羧酶活性,编码具有OAA脱羧酶活性的酶的一个或多个拷贝的天然基因可以被缺失或破坏。在某些实施方案中,其中一个或多个天然OAA脱羧化基因已被缺失或破坏的酵母细胞可以表达一个或多个外源OAA脱羧化基因,所述外源OAA脱羧化基因已经进行突变,以编码催化丙酮酸转化为OAA的多肽。
在某些实施方案中,本文中提供的经遗传修饰的酵母细胞包含一个或多个天然基因的缺失或破坏,所述天然基因编码参与利用3-HP发酵途径产物或中间物的不期望反应的酶。这些基因的示例包括编码将3HP转化为3HP醛的酶的那些,所述3HP醛已知对细菌细胞是有毒性的。
在某些实施方案中,本文中提供的经遗传修饰的酵母细胞包含一个或多个天然基因的缺失或破坏,所述天然基因编码对3-HP发酵途径具有中性作用的酶,包括例如GAL6(将半乳糖转化为葡萄糖的GAL系统的负性调节物)。中性基因的缺失或破坏使得能够在不影响天然发酵途径的情况下插入一个或多个外源基因。
在某些实施方案中,本文中提供的酵母细胞是3-HP抗性酵母细胞。本文中使用的“3-HP抗性酵母细胞”是指在含有75g/L或更多3-HP的培养基中在小于4.0的pH下呈现至少2.5g/L/hr的平均糖酵解速率的酵母细胞。这些速率和条件代表生产3-HP的经济的过程。在这些实施方案的某些中,酵母细胞可以以其天然形式呈现3-HP抗性。在其他实施方案中,细胞可以在引入与活性3-HP发酵途径相关的遗传修饰之前、过程中或之后已经经过了突变和/或选择(例如恒化选择或重复的系列亚培养),以致经突变和/或选择的细胞具有高于相同菌种野生型细胞的3-HP抗性程度。例如,在一些实施方案中,细胞在用一个或多个外源3-HP途径基因进行遗传修饰之前已经经过了3-HP或乳酸存在下的突变和/或选择。在某些实施方案中,可以对以其天然形式表现出3-HP抗性的细胞进行突变和/或选择。可以在不同水平的3-HP存在下对已经经过了突变和/或选择的细胞进行糖消耗和其他特性的测试,以确定其作为3-HP生产的工业宿主的潜力。除了3-HP抗性,本文中提供的酵母细胞可以已经经过了对一种或多种额外的有机酸(例如乳酸)或者对其他发酵产物、副产物或培养基组分的抗性的突变和/或选择。
可以利用本领域公知的方法进行选择,例如对3-HP或其他化合物的抗性的选择。例如,如上面所提及,选择可以是恒化选择。恒化选择利用使得能够持续培养微生物(例如酵母)的恒化器,其中特定的生长速率和细胞数量可以被独立地控制。持续培养是基本上恒定容积的流动系统,其中持续加入培养基,任何溢出可以持续移除。一旦这种系统处于平衡,细胞数量和营养成分状态保持恒定,并且系统处于稳定状态。恒化器使得能够通过稀释速率和限制性营养成分例如碳源或氮源的浓度变化来调控培养物的群体密度和特定生长速率。通过随着培养物生长而改变条件(例如,降低接种菌株生长所必需的第二碳源的浓度,以及其它),群体中能够在改变的条件下生长较快的微生物将被选择,并且其生长将超过在新条件下表现不佳的微生物。通常这种选择需要在恒化培养物的生长过程中不断增加或减少至少一种培养物组分。恒化器的操作及其在微生物定向进化中的用途是本领域公知的(参见例如Novick Proc Natl Acad Sci USA 36:708-719(1950),Harder J ApplBacteriol 43:1-24(1977))。其他选择方法包括但不限于例如U.S.专利号7,629,162中所描述的在选择性条件下重复的系列亚培养。这种方法可以用于替代或附加于上面所描述的利用葡萄糖限制性恒化方法。
在如实施例中所公开的3-HP培养基中呈现生长和葡萄糖消耗的最佳组合的酵母菌株是用于与3-HP发酵途径相关的多种遗传修饰的优选宿主细胞。如通过在75g/L或更高3-HP的存在下在pH小于4下的生长所显示,具有相对较高程度的3-HP抗性的有潜力的酵母属包括例如假丝酵母属(Candida)、克鲁维酵母属(Kluyveromyces)、伊萨酵母属(Issatchenkia)、酵母属(Saccharomyces)、毕赤酵母属(Pichia)、裂殖酵母属(Schizosaccharomyces)、有孢圆酵母属(Torulaspora)和接合酵母属(Zygosaccharomyces)。呈现3-HP抗性的菌种包括东方伊萨酵母(也被称为克鲁斯假丝酵母(C.krusei))、郎比可假丝酵母(C.lambica)(也被称为发酵毕赤酵母(Pichiafermentans))和博伊丁酵母(S.bulderi)(也被称为Kazachstania bulderi)。东方伊萨酵母和郎比可假丝酵母来自东方伊萨酵母/发酵毕赤酵母进化枝,而博伊丁酵母来自酵母属进化枝。呈现3-HP抗性的特定菌株包括东方伊萨酵母株24210、PTA-6658、60585和CD1822,博伊丁酵母株MYA-402和MYA-404,以及郎比可假丝酵母株ATCC 38617。
其他野生型酵母或真菌可以相同方式测试并进行鉴定,以在如本文中所描述的高水平3-HP存在下具有可接受的生长和葡萄糖利用水平。例如,Gross和Robbins(Hydrobiologia 433(103):91-109)已经汇编了在低pH(<4)的环境中鉴定的81种真菌菌种的一份名单,其能够作为潜力生产宿主进行相关测试。
在某些实施方案中,本文中提供的经修饰的酵母细胞通过将一个或多个遗传修饰掺入Crabtree阴性宿主酵母细胞中而制备。在这些实施方案的某些中,宿主酵母细胞属于伊萨酵母属、假丝酵母属或酵母属,在这些实施方案的某些中,宿主酵母细胞属于东方伊萨酵母/发酵毕赤酵母或酵母进化枝。在某些实施方案中,宿主细胞是东方伊萨酵母或郎比可假丝酵母或博伊丁酵母。
东方伊萨酵母/发酵毕赤酵母进化枝是含有至少东方伊萨酵母、盔形毕赤酵母(P.galeiformis)、毕赤酵母菌种YB-4149(NRRL命名)、嗜酒假丝酵母(C.ethanolica)、(P.deserticola)、膜璞毕赤酵母(P.membranifaciens)和发酵毕赤酿母的最末端的进化枝。通过对酵母菌种26S核糖体DNA可变D1/D2结构域的分析,鉴定东方伊萨酵母/发酵毕赤酵母进化枝的成员,其中利用由Kurtzman和Robnett在通过提述并入通过提述并入本文的“Identification and Phylogeny of Ascomycetous Yeasts from Analysis of NuclearLarge Subunit(26S)Ribosomal DNA Partial Sequences,"Antonie van Leeuwenhoek73:331-371,1998中所描述的方法(具体参见第349页)。对成百上千子囊菌26S核糖体DNA可变D1/D2结构域的分析已经揭示,东方伊萨酵母/发酵毕赤酵母进化枝含有非常密切相关的菌种。东方伊萨酵母/发酵毕赤酵母进化枝的成员表现为与进化枝其他成员在26S核糖体DNA可变D1/D2结构域中的相似性高于进化枝外酵母菌种。因此,东方伊萨酵母/发酵毕赤酵母进化枝的其他成员可以通过利用Kurtzman和Robnett的方法比较其相应核糖体DNA的D1/D2结构域并与进化枝其他成员和进化枝外密切相关的菌种作对比而进行鉴定。
在某些实施方案中,本文中提供的经修饰的酵母细胞属于伊萨酵母属,在这些实施方案的某些中,酵母细胞是东方伊萨酵母。当最初鉴定时,东方伊萨酵母菌种被命名为库德毕赤酵母(Pichia Kudriavzevii)。无性型(无性生殖形式)的东方伊萨酵母被称为克鲁斯假丝酵母。东方伊萨酵母菌种的大量其它同义词已经列于别处(Kurtzman and Fell,TheYeasts,a Taxonomic Study.Section 35.Issatchenkia Kudryavtsev,pp 222-223(1998))。
生产3-HP的理想的酵母细胞理想地能够在低pH水平下生长。在低pH下进行发酵的能力降低了下游回收的成本,使得生产更经济。因此,在某些实施方案中,酵母宿主细胞能够在低pH水平下生长(例如在小于7、6、5、4或3的水平下)。
除了3-HP抗性和/或低pH生长能力之外,适宜的宿主细胞可以具有一个或多个有利的特性。例如,可以进一步基于糖酵解速率、特定生长速率、热耐受性、对生物质水解产物抑制物的耐受性、过程的总体鲁棒性(robustness)等等对呈现3-HP抗性的潜在宿主细胞进行选择。可以在与3-HP发酵途径相关的任何遗传修饰前对这些标准进行评估,或者在一个或多个这种修饰已经发生后对其进行评估。
由于大多数酵母是乙醇的天然生产者,因此将催化由丙酮酸产生乙醇中第一个步骤的酶(PDC)去除或者显著减少,对于产生足够的替代性产物来说是必需的。在Crabtree阳性酵母例如酵母属中,PDC基因的缺失或破坏使得宿主获得对二碳化合物例如乙醇或乙酸盐的营养缺陷型,并且不能在含有葡萄糖的培养基中生长。可以利用乙酸盐非依赖性和葡萄糖耐受性的进行性选择获得能够克服这些局限的突变体(参见例如van Maris ApplEnviron Microbiol 70:159(2004))。因此,在某些实施方案中,优选的酵母宿主细胞是Crabtree阴性的酵母细胞,其中PDC缺失菌株能够在葡萄糖上生长,并且保持C2原养型。
基因表达水平和/或给定细胞中将要利用的外源基因数目将根据所选择的酵母菌种而变化。对于经全基因组测序的酵母,可以利用全基因组化学计量模型来确定应当表达哪种酶以开发期望的3-HP发酵途径。全基因组化学计量模型量描述于例如Hjersted等,"Genome-scale analysis of Saccharomyces cerevisiae metabolism and ethanolproduction in fed-batch culture,"Biotechnol.Bioeng.2007;和Famili等,"Saccharomyces cerevisiae phenotypes can be predicted by using constraint-based analysis of a genome-scale reconstructed metabolic network,"Proc.Natl.Acad.Sci.2003,100(23):13134-9。
对于不具有已知的基因组序列酵母,通常可以利用例如下面实施例2A中描述的技术获得目标基因的序列(作为过量表达的候选物或者作为插入位点)。可以进行常规的实验设计,以测试多种基因的表达和多种酶的活性,包括在3-HP途径中发挥功能的基因和酶。可进行实验,其中每种酶在酵母中独立表达,和形成酶区块,所述酶区块直至和优选包括所有途径酶,以确立何者为改进的3-HP产生所需(或所期望)。一种说明性实验设计测试每种单独的酶以及每个独特酶对的表达,并且能够进一步测试所有所需酶或者每个独特酶组合的表达。将要领会的是,可以采取多种方法。
在某些实施方案中,提供了由如本文中所提供的经遗传修饰的酵母细胞生产3-HP的方法。在某些实施方案中,这些方法包括在至少一种碳源存在下培养如本文中所提供的经遗传修饰的酵母细胞,使细胞能够生产3-HP一段时间,接着从培养物中分离由细胞生产的3-HP。碳源可以是能够被所提供的酵母发酵的任何碳源。碳源可以是十二碳糖例如蔗糖,己糖例如葡萄糖或果糖,葡聚糖(glycan)或其他葡萄糖多聚物,葡萄糖寡聚物例如麦芽糖、麦芽三糖和异麦芽三糖、潘糖,以及果糖寡聚物。如果细胞经修饰以赋予发酵戊糖的能力,则发酵培养基可包含戊糖,例如木糖、木聚糖或木糖的其他寡聚物和/或阿拉伯糖。这些戊糖是含半纤维素的生物质的适宜水解产物。在寡聚糖的情况下,为了将这些消化为相应的单糖以由细胞发酵,向发酵液中加入酶可能是必需的。在某些实施方案中,培养物中可以存在多于一种类型的经遗传修饰的酵母细胞。同样地,在某些实施方案中,培养物中可以存在与经遗传修饰的酵母细胞相同或不同菌种的一种或多种天然酵母细胞。
在某些实施方案中,对本文中提供的细胞进行培养以生产3-HP可以分为多个阶段。例如,细胞培养过程可以分为培养期、生产期和回收期。本领域普通技术人员将认识到,这些时期中使用的条件可以基于例如所使用的酵母菌种、酵母所利用的特定3-HP发酵途径、期望产率或其他因素的因素而变化。
培养基将通常含有特定细胞所需的营养成分,包括氮源(例如氨基酸、蛋白、无机氮源例如氨或铵盐,等)以及多种维生素、矿物质等。在一些实施方案中,本发明的细胞可以在化学限定性培养基中进行培养。在一个实施例中,培养基含有大约5g/L硫酸铵、大约3g/L磷酸二氢钾、大约0.5g/L硫酸镁、微量元素、维生素以及大约150g/L葡萄糖。可以使pH在培养过程中自由变化,或者如果需要,进行缓冲以防止pH降至预设水平以下或升至预设水平以上。在某些实施方案中,发酵培养基接种足够的作为评估对象的酵母细胞,以产生大约1.0的OD600。除非另有详细说明,本文中使用的OD600是指利用UD600型分光光度仪(Beckman Coulter)以1cm路径长度在600nm波长下所测得的光密度值。培养温度可以在大约30-40℃范围内,培养时间可以长达大约120小时。
在一个实施例中,生产期过程中,发酵培养基中的细胞浓度通常为大约0.1至20,优选0.1至5,甚至更优选1至3g干燥细胞/升发酵培养基的范围内。根据途径所需,发酵可以在需氧、微氧或厌氧条件下进行。如果需要,氧摄取速率(OUR)可以作为过程控制环节在发酵期间变化(参见例如WO03/102200)。在一些实施方案中,本文中提供的经修饰的酵母细胞在微氧条件下进行培养,其特征在于氧摄取速率为2至45mmol/L/hr,例如2至25、2至20、2至15、2至10、10至45、15至40、20至35或25至35mmol/L/hr。在某些实施方案中,当在微氧条件下培养时,本文中提供的经修饰的酵母细胞可以表现尤其出色,所述微氧条件的特征在于氧摄取速率为2至25mmol/L/hr。在生产期过程中,可以对培养基进行缓冲,以致pH保持在大约3.0至大约7.0或大约4.0至大约6.0的范围内。适宜的缓冲剂是随着酸的形成能够将其中和的碱性物质,包括例如氢氧化钙、碳酸钙、氢氧化钠、氢氧化钾、碳酸钾、碳酸钠、碳酸铵、氨水、氢氧化铵等等。总的来讲,已经用于常规发酵过程中的那些缓冲剂也适用于此处。
在利用经缓冲的发酵的那些实施方案中,可以随着酸性发酵产物的形成将其中和为相应的盐。在这些实施方案中,酸的回收包括游离酸的再生。这可以通过去除细胞并用强酸例如硫酸使发酵液酸化来进行。这导致形成盐类副产物。例如,当钙盐用作中和剂并且硫酸用作酸化剂时,产生盐类副产物石膏。将该副产物从肉汤中分离,并利用例如液-液萃取、蒸馏、吸收以及其他技术回收酸(参见例如T.B.Vickroy,Vol.3,Chapter 38ofComprehensive Biotechnology,(M.Moo-Young编),Pergamon,Oxford,1985;R.Datta等,FEMS Microbiol Rev,1995,16:221-231;U.S.专利Nos.4,275,234、4,771,001、5,132,456、5,420,304、5,510,526、5,641,406和5,831,122以及WO93/00440)。
在其他实施方案中,可以允许发酵培养基的pH由3-HP pKa处或以上,通常为4.5或更高的起始pH,降至酸性发酵产物的pKa处或以下,例如低于4.5或4.0,例如在大约1.5至大约4.5的范围内、大约2.0至大约4.0的范围内或大约2.0至大约3.5的范围内。
在其他实施方案中,可以进行发酵,以通过在发酵过程之前或初始将发酵液的pH调节至产物酸的pKa处或以下,从而产生产物酸。其后在培养期间,pH可以保持在产物酸的pKa处或以下。在某些实施方案中,pH可以保持在低于4.5或4.0,例如在大约1.5至大约4.5的范围内、大约2.0至大约4.0的范围内或大约2.0至大约3.5的范围内。
在本文中提供的方法的某些实施方案中,经遗传修饰的酵母细胞产生相对低水平的乙醇。在某些实施方案中,可以产生产率为10%或更低的乙醇,优选产率为2%或更低。在这些实施方案的某些中,产生的乙醇不可检测出。然而在其他实施方案中,3-HP和乙醇可以同时产生。在这些实施方案中,可以产生产率为高于10%、高于25%或高于50%的乙醇。
在本文中提供的方法的某些实施方案中,3-HP在碳源上的终产率是至少10%、至少20%、至少30%、至少40%、至少50%或高于50%的理论产率。3-HP的浓度或效价将是产率以及碳源起始浓度的函数。在某些实施方案中,在发酵过程中的某些时间点,优选发酵结束时,效价可以达到至少1-3、至少5、至少10、至少20、至少30、至少40、至少50或高于50g/L。在某些实施方案中,可以通过尤其是在生产期过程中改变发酵培养基的温度,从而使3-HP的终产率增加。
一旦产生,可以使用本领域已知的任何方法从发酵培养基中分离3-HP。例如,可以利用普通的分离技术从培养液中去除生物质,并且可以利用普通的离析步骤(例如萃取、蒸馏和离子交换步骤)从不含微生物的培养液中获得3-HP。此外,3-HP可以在其产生时进行分离,或者其可以在产物生产期已经结束后从培养液中分离。
可以将利用本文中公开的方法产生的3-HP化学性地转化为其他有机化合物。例如,可以使3-HP氢化,以形成1,3丙二醇,这其是一种有价值的聚酯单体。丙二醇还可以利用具有氧化还原酶活性的多肽在体外或体内由3-HP产生。可以利用任何方法使有机酸例如3-HP氢化,例如用于使琥珀酸和/或乳酸氢化的那些。例如,可以利用金属催化剂使3-HP氢化。在另一个实例中,可以利用任何已知进行脱氢反应的方法使3-HP脱氢,从而形成丙烯酸。例如,可以在催化剂(例如金属或无机酸催化剂)存在下对3-HP进行加热,以形成丙烯酸。
提供下面的示例来更好地说明所请求保护的本发明,且不应被理解为对本发明范围的限制。特定材料所被提及的程度,仅仅用于说明的目的,而并不是打算对本发明进行限制。在不行使创造性能力和不超出本发明范围的情况下,本领域技术人员可以开发出等同的方法和反应物。应当理解,可以保持在本发明的范围之内,对本文所描述的步骤作出许多变化。发明人的意为这些变化都包括在本发明的范围之内。
实施例
培养基和溶液
TE由10mM Tris碱和1mM EDTA,pH8.0构成。
2X YT+amp平板由16g/L胰蛋白胨,10g/L的酵母提取物,5g/L的NaCl,100mg/L的氨苄青霉素和15g/L的Bacto琼脂构成。
ura选择平板由6.7g含硫酸铵酵母基础氮源,5g酪蛋白氨基酸,100ml 0.5M,pH5的琥珀酸,20g Noble琼脂以及855mL去离子水构成。高压蒸汽灭菌后,加入40mL的无菌50%葡萄糖和2mL 10mg/mL的氯霉素(chloraphenicol),然后倾倒平板。
ura选择培养基由6.7g含硫酸铵酵母基础氮源,5g酪蛋白氨基酸,100ml 0.5M,pH5的琥珀酸以及855mL去离子水构成。高压蒸汽灭菌后,加入40mL的无菌50%葡萄糖和2mL10mg/mL的氯霉素。
YP+10%葡萄糖培养基由500mL YP培养液和100mL无菌50%葡萄糖构成。
YP培养液由10g/L的酵母提取物,20g/L的蛋白胨构成。
YPD平板由10g酵母提取物,20g蛋白胨,20g bacto琼脂,以及去离子水加至960ml构成。高压灭菌后,加入40mL的无菌50%葡萄糖,并倾倒平板。
TAE由4.84g/L的Tris碱,1.14mL/L冰醋酸和2mL/L的0.5M EDTA,pH8.0构成。
TBE由10.8g/L的Tris碱,5.5g/L的硼酸,和4mL/L的0.5M EDTA,pH8.0构成。
LiOAc/TE溶液由为8份的无菌水,1份的1M LiOAc以及1份的10×TE构成。
10×TE(200mL)由2.42g Tris碱,4mL 0.5M的EDTA,pH8.0构成,用5M的HCl调整pH值至7.5,用高压蒸汽灭菌器对溶液进行灭菌。
PEG/LiOAc/TE溶液由8份50%的PEG3350,1份1M的LiOAc,以及1份10×TE构成。
50%PEG3350的制备方法为:将100g PEG3350加入到150mL水中,并加热和搅拌直至溶解。然后用水将体积补至200mL,高压蒸汽灭菌。
ScD FOA平板由275mL的2X-ScD 2X FOA液体培养基和275mL的2XScD 2X FOA平板培养基构成,熔化并冷却至65℃.
2X-ScD 2X FOA液体培养基由6.66g不含氨基酸的酵母基础氮源,1.54g ura-DO补充物(Clontech,Moutain View,CA,USA),20g葡萄糖,50mg尿嘧啶,以及2g 5-FOA(5-氟乳清酸,一水合物;Toronto Research Chemicals,North York,ON,Canada)和水加至1L构成。将得到的溶液过滤除菌。
2XScD 2X FOA平板培养基由11g bacto琼脂和275mL水构成。将得到的溶液高压蒸汽灭菌。
DM2培养基由硫酸铵(5.0g/L),七水硫酸镁(4.50.5g/L),磷酸二氢钾(3.0g/L),微量元素溶液(1mL/L)和维生素溶液(1mL/L)构成。在所有培养基组分溶解之后,用合适的碱(例如,KOH)将培养基的pH调节到所需的初始pH值。
微量元素溶液由EDTA(15.0g/L),七水硫酸锌(4.5g/L),脱水氯化镁(1.0g/L),六水氯化钴(II)(0.3g/L),五水硫酸铜(II)(0.3g/L),脱水二钠钼(disodium molybdenumdehydrate)(0.4g/L),脱水氯化钙(4.5g/L),七水硫酸亚铁(3g/L),硼酸(1.0g/L),以及碘化钾(0.1g/L)构成。
维生素溶液由生物素(D-,0.05g/L),泛酸钙(D+;1g/L),烟酸(5g/L),myo-肌醇(25g/L),盐酸吡哆醇(1g/L),对氨基苯甲酸(0.2g/L),以及盐酸硫胺(1g/L)构成。
DM1X-α-gal平板由DM1盐,20g/L的葡萄糖,微量元素溶液,维生素溶液,2ml/L的X-α-gal(16mg/ml),20g/L的琼脂构成。
DM1盐溶液由2.28g/L的尿素,3g/L的磷酸二氢钾,以及0.5g/L的七水硫酸镁构成。
Butterfield磷酸缓冲液由1.25ml/L的储备溶液(26.22g/L磷酸二氢钾和7.78g/L的碳酸钠),以及5mL/L的氯化镁溶液(81.1g/L MgCl2-6H2O)构成。将得到的溶液高压蒸汽灭菌,调节pH至7.2。
CNB1摇瓶培养基由尿素(2.3g/L),七水硫酸镁(0.5g/L),磷酸二氢钾(3.0g/L),微量元素溶液(1mL/L)和维生素溶液(1mL/L),葡萄糖(120.0g/L),2-(N-吗啉代)乙磺酸(MES)(97.6g/L)构成。在所有培养基组分溶解后,用合适的碱(例如,KOH)将培养基的pH调节为初始pH5.8。
表0:引物序列
Figure BDA0001451815470000471
Figure BDA0001451815470000481
Figure BDA0001451815470000491
Figure BDA0001451815470000501
各种序列
启动子:在实施例中描述的PDC,TDH3,ENO1和PGK1启动子分别来源于东方伊萨酵母的SEQ ID NO:244,245,246和247序列。终止子:实施例中描述的TAL,TKL,RKI和PDC终止子分别来源于东方伊萨酵母的SEQ ID NO:248,249,250和251序列。实施例中描述的URA3启动子,ORF和终止子来源于东方伊萨酵母SEQ ID NO:252序列。
实施例1A:基于3-HP抗性选择酵母宿主细胞
检测一组野生型酵母株在3-HP存在的情况下的生长能力。
通过评估7个野生酵母株(表1,组A)在含有不同水平3-HP的培养基上的生长能力来确定在初筛过程中所使用的3-HP浓度范围。这些实验中使用的3-HP是由丙烯酸水溶液(30%)和CO2催化剂在200psi和175℃下通过化学合成得到的,如WO04/076398中所描述的。用异丙醚在室温下进行逆向萃取以除去残留的丙烯酸(见WO05/021470)。
细胞在YPD平板上划线,培养过夜。在pH3.0的YPD培养基中制备OD600约为4的细胞浆。该浆状物用于接种到含有不同浓度3-HP(pH3.9)的微滴定孔中,至OD600为0.05。用透气膜覆盖平板,在30℃/300RPM的摇床中孵育过夜。在GENios模型平板读数器(Tecan)中对每个孔测量600nm波长处的光密度,并肉眼观察平板的生长情况。一个或多个菌株所生长的最高3-HP浓度(125g/L)被选为初筛步骤的上限值。
初筛
对于初筛步骤,利用与范围确定相同的步骤,对生长在含有0g/L,75g/L,100g/L或125g/L 3-HP(pH3.9)的微滴定板上的89个野生型酵母菌株进行筛选。对于每个菌株都使用新鲜的YPD平板,并且在pH3.0的YPD培养基中制备OD600约为4的细胞浆。该浆状物用于接种到含有不同浓度3-HP(pH3.9)的微滴定孔中至OD600为0.05。用透气膜覆盖平板,在30℃/300RPM的摇床中孵育过夜。在GENios模型平板读数器中对每个孔测量600nm波长处的光密度,并肉眼观察平板的生长情况。实施类似的步骤,以评估在乳酸浓度为0g/L,30g/L,45g/L和60g/L时的生长情况。表1总结了观察到生长的最高3-HP或乳酸浓度。
鉴定出15个能在100g/L的3-HP上生长或者在75g/L的3-HP上生长良好的菌株(表1,B组)。为了进一步缩小菌株的范围,实行了第二微滴定板检测。该检测与第一次的检测类似,但是所使用的3-HP浓度为100g/L,112.5g/L,和125g/L(pH3.9)。从这个检测中鉴定出了11个在75g/L的3-HP上生长良好或在75和112.5g/L的3-HP上都展现出一些生长的菌株(表1,C组)。将这11个菌株进行二次筛选。四株在75g/L的3-HP上生长情况不好以及在112.5g/L的3-HP上没有生长的菌株并没有进行二次筛选。据预测,没有进行二次筛选的菌株在商业发酵中也展示出较差的经济表现。不过可能一个或多个这样的菌株均能满足商业上可行的发酵过程的最低要求。
表1:在3-HP或乳酸上的生长
Figure BDA0001451815470000521
Figure BDA0001451815470000531
Figure BDA0001451815470000541
上面所测试的东方伊萨酵母菌种CD1822是通过在葡萄糖限制恒化器中使东方伊萨酵母ATCC PTA-6658进化91天产生的。用含有15g/L右旋葡萄糖的DM培养基供给该系统,通过将乳酸加入到供给培养基中,在pH=3,稀释率为0.06h-1下进行操作。用大概2mmol L- 1h-1的低氧传输速率来维持该条件,而溶解氧的浓度保持恒定在0%的空气饱和度。初始时间点的单菌落分离物在两个摇瓶分析中被表征出。在第一个分析中,菌种的特征在于它们在25g/L的总乳酸存在下,在无需对pH校正的DM1确定培养基(DM1 defined medium)中,能够将葡萄糖发酵成乙醇。在第二分析中,在存在25,32和45g/L的总乳酸的情况下,在无需对pH校正的DM1确定培养基中测定分离物的生长速率。CD1822菌株是基于所测量的发酵速率和生长速率所选择出来的单一分离物。其他进化东方伊萨酵母的方法包括,但不限于在选择条件下重复系列传代培养,如US专利号7629162中所描述。此类方法可以用来代替,或补充上述的葡萄糖限制恒化器法。本领域技术人员可以理解的是,可以使用类似的进化步骤,添加3-HP而不是乳酸来开发改进的3-HP抗性,来产生菌株。此外,在选择前也可以对菌株进行诱变,如本文所述(例如,见实施例1B)。
二次筛选
对于二次筛选的第一部分,在pH 3.9,含有0g/L,35g/L,或75g/L 3-HP的YPD培养基中测量生长速率。用收获自种子瓶的生物质接种摇瓶,所述种子瓶过夜生长至OD600为6至10。将250ml生长速率受困的瓶子(50mL工作体积)接种至OD600 0.1,在250rpm和30℃下生长。在分析的整个时间进程中获取样品,并通过OD600对生物质生长进行分析。绘制所得到的OD600数据,确立生长速率。
表2:3-HP中的生长速率(μ)
菌株 0g/L 3-HP 35g/L 3-HP 75g/L 3-HP
东方伊萨酵母ATCC60585 0.56 0.51 0.29
东方伊萨酵母CD1822 0.62 0.52 0.28
郎比可假丝酵母ATCC38617 0.65 0.53 0.30
粗壮假丝酵母 0.51 0.32 0.14
东方伊萨酵母PTA-6658 0.61 0.53 0.32
东方伊萨酵母24210 0.58 0.51 0.26
博伊丁酵母MYA402 0.53 0.45 0.28
膜酺毕赤酵母 0.41 0.39 0.32
博伊丁酵母MYA404 0.55 0.44 0.27
栗酒裂殖酵母 0.41 0.35 0.21
Zygosaccharomyces lentus 0.61 0.41 0.20
对于二次筛选的第二部分,测量pH3.9,含有100g/L葡萄糖和0g/L,35g/L或75g/L3-HP的YPD培养基中相同10个菌种的葡萄糖消耗量。用收获自种子瓶的生物质接种摇瓶,所述种子瓶过夜生长至OD600为6至10。将250ml生长速率受困的瓶子(50mL工作体积)接种至OD600 0.1,在250rpm和30℃下生长。在分析的整个时间进程中获取样品,并利用YellowSprings Instruments(YSI)的2700Biochemistry Analyzer分析葡萄糖消耗量。绘制所得到的OD600数据,确立葡萄糖消耗速率。
表3:3-HP中的葡萄糖消耗速率(g/L/hr)
Figure BDA0001451815470000551
Figure BDA0001451815470000561
在75g/L的3-HP(pH3.9)条件下,有四个菌种(膜酺毕赤酵母,栗酒裂殖酵母,粗壮假丝酵母和Z.lentus)并未达到2.5g/L/hr的葡萄糖利用率,而该条件则是经济的发酵过程所必需的。
为了鉴定3-HP的主要菌株,将菌株的表现分为三类等级。这些类别中的两个是基于生长速率的不同方面:1)在最高酸浓度上的生长速率和2)所绘制的生长速率相对于酸浓度的斜率。第三个类别是在最高酸浓度时的糖酵解速率。该分级是通过将每个评级的最高和最低值作为标准化的边界,在标准化的范围内完成的。因此,对于每个类别,每个菌株都获得一个0和1之间的评级,其中1是可能的最高得分。一个菌株的总评级值是三个类别标准化值的总和。所制定权重值中生长速率和糖酵解速率权重相同。在这种情况下,在最高酸浓度下的糖酵解速率权重为50%,而两个生长速率评级每个的权重为25%。每个类别的标准化数值和总和以及权重值都归纳在表4中。
表4:3-HP中的菌株级别
Figure BDA0001451815470000562
在所检测的菌株中,来自于东方伊萨酵母,郎比可假丝酵母,和博伊丁酵母种的菌株呈现在低pH下作为3-HP生产宿主的最大潜力。
利用相同的方法,用pH值为2.85,含有0,25,和50g/L乳酸(~80%游离酸)的培养基,来对初筛中的原始的91个野生型酵母菌株进行筛选,评级和评分。对来自于13个菌株的标准化值和权重和总得分值进行二次筛选。
表5:乳酸中的菌株级别
Figure BDA0001451815470000571
对于乳酸,只有S.javensis在pH2.85,含有50g/L乳酸的培养基中没能达到2.5g/L/hr的葡萄糖利用率。而东方伊萨酵母,郎比可假丝酵母和博伊丁酵母对3-HP和乳酸都展示出酸耐受,很多菌株只是对一种酸产生了耐受。这些也可以在初筛的结果中看到(表1)。例如,C.milleri,皱褶假丝酵母,C.vanderwaltii,K.ohmeri,贝酵母,S.javensis,Y.lipolytica,Z.bisporus和Z.kombuchaensis都表现在45-60g/L乳酸上生长,而不在甚至是所检测的最低浓度的3-HP上生长(35g/L)。因此,菌株对于一种有机酸的耐受性并不能明确地用于预测其对于其他酸类的耐受性。这得到了进一步的凸显,即通过将上述呈现3-HP抗性的菌株与WO03/049525中所鉴定的8个优选能作为有机酸生产宿主的菌株列表进行对比。其中那些菌株中的两株(C.diddensiae和C.entomophila)无法获得来进行测试,其他6株都包括在上述的初筛之中。在这6株中,只有C.krusei(作为东方伊萨酵母进行测试)能够在35g/L的3-HP存在的情况下生长。
实施例1B:诱变和选择具有3-HP抗性的突变菌株
对在实施例1A中选择出来的酵母细胞进行诱变,并将其暴露于选择压力下,以便鉴定具有高3-HP抗性的突变株。
例如,新鲜YP(酵母提取物/蛋白胨)+20g/L的葡萄糖平板或液体培养(OD600为1-4)中的酵母细胞被悬浮于无菌水中,至OD600为10左右。200μl该细胞悬液的等分试样被滴加入各试管中,暴露于3μl的甲磺酸乙酯(EMS)中,约1小时,这杀灭约65%的细胞。可以使用更高的EMS浓度来提高杀灭率。在暴露之后,用5%的硫代硫酸钠中和细胞,在PBS缓冲液中洗涤,在营养充足的培养基中恢复约4小时,并在选择培养基中培养。同样进行模拟样本(无EMS),以确保条件是选择性的。另外,也可以使用紫外线照射来诱变细胞。
0为了选择3-HP抗性的突变菌株,将EMS-处理过的细胞悬液(约2×108个诱变细胞)的等分试样接种到马铃薯葡萄糖琼脂(PDA)或另外的培养基上,该培养基所含有的3-HP的水平使亲本菌株所不能生长的或生长得很慢。将这些平板孵育几天,直至菌落出现。纯化单个菌落,在非选择培养基上划线,以消除选择的任何适应性影响,然后在选择培养基上重新测试,以确认抗性的提高。然后通过对产物和底物定期取样进行HPLC分析,在摇瓶中测试抗性菌株。另外,对3-HP抗性的选择可以通过恒化器或系列摇瓶进化来完成。可以再进行几轮诱变和选择。诱变可用于提高天然并不能满足3-HP的生产需求的宿主的抗性,以便它具有用于商业生产3-HP所需的属性。
实施例2A:将DNA转化进宿主基因组的步骤
将DNA转化进酵母宿主的基因组中,以产生在下面实施例中所述的经修饰的酵母菌株,是基于下述的特定步骤来实施的。
将4mL YP+10%葡萄糖的培养基加入到14mL Falon管中,使用无菌环将所需的菌株接种到该培养基中。培养物在37℃下以250rpm振荡培养过夜(~16hr)。1mL的过夜培养物被加入到250mL含有50mL液体YP+10%葡萄糖培养基的挡板烧瓶中。烧瓶在37℃下以250rpm振荡培养。以约每小时的间隔时间取出少量等量的培养物,并测量OD600。培养物生长至OD600为0.6-1.0。
室温下以2279×g离心收集细胞,将沉淀物重悬于25mL无菌水中,然后在室温下以2279×g离心。将沉淀重悬于1ml无菌水中,将重悬细胞转移至1.5mL管中,然后在16100×g下沉淀。将细胞重悬于1mL LiOAc/TE溶液中,然后在16100×g下沉淀。细胞沉淀物重悬于500μl LiOAc/TE溶液中。
将下列组分加入到1.5mL管中:100μl上述细胞,10μl新鲜煮沸再冷冻的鲑鱼精子DNA(Agilent Technologies,Santa Clara,CA,USA),以及10μl所需的线性转化DNA。制备用水代替了DNA的对照反应。对于每个转化反应,加入600μl PEG/LiOAc/TE溶液,在30℃下,250rpm的摇床中每个反应在其一侧孵育30分钟。将40μl DMSO加入到每个反应中,然后在42℃的水浴中孵育5分钟。在5400×g下沉淀细胞1分钟。细胞重悬于水中,分为两份,将转化反应的每一半都涂布到ura选择培养平板上。平板被放置在37℃下。经过18至24hr的生长后,一般都可见菌落,这取决于菌株背景。
用无菌环将小量的酵母从培养皿转移到含有300μl酵母裂解溶液(
Figure BDA0001451815470000591
Biotechenologies,Madison,WI,USA)的1.5mL管中,并使用MasterPureTMYeast DNA Purification KiT(
Figure BDA0001451815470000592
Biotechenologies)根据制造商说明提取基因组DNA。
用MasterPureTMYeast DNAPurification KiT(
Figure BDA0001451815470000593
Biotechenologies)制备的基因组DNA被用于PCR反应,以确定在分离的转化体中是否发生了正确的整合事件。PCR反应体系(25μl)包含0.5μl待筛选菌株的基因组DNA,1×CrimsonTaqTM反应缓冲液(New England Biolabs,Ipswich,MA,USA),有义和反义引物各25pmol,dATP,dCTP,dGTP和dTTP各200μM,以及0.625单位的Crimson TaqTM DNA聚合酶(New EnglandBiolabs)。在
Figure BDA0001451815470000594
(Eppendorf Scientific,Westbury,New York,USA)中进行PCR,其程序为一个循环的95℃ 30秒,接着是30个循环,每个循环95℃ 30秒,50℃ 30秒,68℃最大预期产物的每kbp 1分钟,最后68℃延伸10分钟。热循环之后,在TAE或TBE中用1%的琼脂糖凝胶电泳分离PCR反应产物,观察和解释如之前描述的特异性引物对所产生的条带的大小。
实施例2B:插入位点的选择
适合于将外源基因掺入到宿主酵母细胞中的插入位点可以是基因的基因座,当从酵母宿主细胞中缺失所述基因的基因座时,将会对3-HP的生产带来有益的或中性的影响。对于所选择的酵母菌株的合适插入位点的非限制性示例描述在本文所进行的实施例中。本领域技术人员可以很容易地应用本发明的教导来使用这些和其他的插入位点,例如,一个或多个PDC的基因座(例如,编码如SEQ ID NO:49所示的氨基酸序列和/或包括如SEQ IDNO:48所示的核苷酸序列的编码区域的东方伊萨酵母PDC基因),ADH基因座(例如,编码如SEQ ID NO:106,108或110所示的氨基酸序列和/或包含如SEQ ID NO:105,107或109所示的核苷酸序列的编码区域的东方伊萨酵母ADH基因),GAL6基因座(例如,编码如SEQ ID NO:112所示的氨基酸序列和/或包含如SEQ ID NO:111所示的核苷酸序列的编码区域的东方伊萨酵母GAL6基因),CYB2A基因座(例如,编码如SEQ ID NO:114所示的氨基酸序列和/或包含如SEQ ID NO:113所示的核苷酸序列的编码区域的东方伊萨酵母CYB2A基因),CYB2B基因座(例如,编码如SEQ ID NO:116所示的氨基酸序列和/或包含如SEQ ID NO:115所示的核苷酸序列的编码区域的东方伊萨酵母CYB2B基因),GPD基因座(例如,编码如SEQ ID NO:118所示的氨基酸序列和/或包含如SEQ ID NO:117所示的核苷酸序列的编码区域的东方伊萨酵母GPD基因),ALD基因座(例如,编码如SEQ ID NO:120所示的氨基酸序列和/或包含如SEQ IDNO:119所示的核苷酸序列的编码区域的东方伊萨酵母ALD同源基因5680,编码如SEQ IDNO:122所示的氨基酸序列和/或包含如SEQ ID NO:121所示的核苷酸序列的编码区域的东方伊萨酵母ALD同源基因42026,编码如SEQ ID NO:124所示的氨基酸序列和/或包含如SEQID NO:123所示的核苷酸序列的编码区域的东方伊萨酵母ALD同源基因42426,编码如SEQID NO:126所示的氨基酸序列和/或包含如SEQ ID NO:125所示的核苷酸序列的编码区域的东方伊萨酵母ALD同源基因42727),或PCK基因座(编码如SEQ ID NO:128所示的氨基酸序列和/或包含如SEQ ID NO:127所示的核苷酸序列的编码区域的东方伊萨酵母PCK基因)或其同源物。如果这些基因的序列并未公开,则可以利用标准步骤获得其序列,例如基因组测序,基因组或cDNA文库的探针杂交,或者基于已知同源序列设计的简并引物扩增基因片段,然后再进行基因组步行以获得全序列。插入位点的其他的合适位置包括不含有开放阅读框的基因间隔区。
实施例2C:插入载体,选择标志物盒,基因表达盒和整合构建体的技术
产生插入位点载体以将一个或多个外源性基因整合进宿主酵母细胞中。宿主酵母细胞可以是经历过如实施例1中所描述的选择过程的细胞,或其可为未经诱变和/或选择的细胞。
为了产生插入位点载体,用宿主基因组DNA作为模板扩增所需插入位点的上游区域(5’)和下游区域(3’)。上游区域优选大于70bp并小于1.5kbp。将所得的靶序列同时或顺序连接到克隆载体中,以获得含有每条片段的一个拷贝的载体,使得这些片段是连续的或者几乎是连续的。可在片段之间掺入一个独特地限制性位点,使得能够插入基因表达盒和/或选择标志物盒。独特地限制性酶切位点可以掺入至或者靠近上游片段的5’端,以及下游片段的3’端,以允许将来可以将这些位点间的DNA从克隆载体中移除。
用于掺入至插入位点载体的选择标志物盒由常规克隆技术所产生。这些选择标志物盒包含可选择性标记的基因,并且也可含有上游启动子和/或下游终止子序列。合适的选择标志物基因的示例包括URA3,TRP1,HIS,MEL5,CYB2A,LEU2,和G418基因。侧翼序列可以在启动子/标记基因/终止子序列的任一侧被掺入表达盒,以允许将来通过重组敲除该标记。这些侧翼序列可以包括直接的或倒置的重复序列(可以是功能性的或非功能性的序列)或一个或多个loxP位点。
基因表达盒利用常规克隆技术所产生。这些基因表达盒含有待过表达的基因,也可含有上游启动子和/或下游终止子序列。在某些实施方式中,可以将这些启动子/基因/终止子组合的两个或多个拷贝掺入到单个基因表达盒中。为了促进其在宿主酵母菌株中的表达,异源基因可以经过密码子优化。本文中所述的选择标志物盒可以克隆进基因表达盒中,使得它与待过表达的基因以及任何相关的启动子和/或终止子是连续的或几乎连续的。
或者,为了将天然启动子替换为外源启动子,表达盒可以将待整合的启动子上游的选择盒整合进靶向序列之间。
可以利用常规克隆技术将基因表达盒插入到本文所述插入位点载体的两个靶位点序列之间,以产生基因表达整合构建体。一个或多个选择标志物盒也可以插入到靶序列之间,无论是作为基因表达盒的一个部分还是独立插入。在某些变化方式中,基因表达盒的片段可以被克隆到不同的插入位点载体中,以使得这些整合片段之间有共同的重叠片段。例如,一个载体可能含有上游插入片段,启动子,基因和终止子,第二个载体可能含有终止子,选择标志物盒和下游插入片段。在另一个实例中,为了允许同时插入两个基因,一个载体可能含有上游插入片段,启动子,基因,终止子以及所有或部分的选择标志物盒,第二个载体可能含有所有或部分的选择标志物盒,第二启动子,基因,终止子,以及下游插入片段。
为了产生基因敲除构建体,使用来源于待缺失或破坏的基因上游和下游侧翼区域的靶DNA序列来制作插入位点载体。所选择的靶序列可以包括靶基因的上游和下游侧翼区域和/或所有或部分的靶基因编码序列或其调节元件(例如,启动子或终止子)。一个或多个选择标志物盒可以被掺入到插入位点载体中的两个靶序列之间。当敲除与外源基因的表达偶联时,还将一个或多个基因表达盒被掺入插入位点载体中。
可以通过限制性酶消化来自克隆载体的片段或来自多个载体的重叠片段来使待整合到宿主酵母基因组中的DNA片段线性化。或者,可以使用PCR,或者PCR与限制性酶切的组合来产生线性的整合片段。插入位点侧翼区域可以是由于其本身存在于载体模板中或掺入到扩增引物中而掺入到整合片段中。在后一种情况中,优选侧翼区域最少是70个核苷酸掺入到引物中。
合适的插入载体,选择标志物盒,基因表达盒,以及所选酵母菌株的整合构建体的非限制性示例描述于下面的具体实施例中。本领域技术人员能够很容易地应用从这些实施例中得到的教导以及前面的描述,从而产生其他修饰的能够生产3-HP的酵母菌株。
实施例2D:在adh1202基因座表达外源基因的插入载体的构建
构造质粒pMIBa107以允许在东方伊萨酵母adh1202基因座掺入单个基因,该基因位于PDC启动子和终止子的控制之下,使用URA3作为选择性标记。PCR扩增有ura选择性标记PDC启动子和终止子,并克隆进如下所述的pCR4TM4BLUNT
Figure BDA0001451815470000621
(Invitrogen,La Jolla,CA,USA)中。含有PDC启动子,终止子和URA3选择性标记的PCR片段由SOE PCR构建。PDC启动子的扩增引物在PCR产物的3’端含有PDC终止子的同源物,PDC终止子和URA3选择标志物的扩增引物在产物的5’端与PDC启动子同源。然后将这两个片段通过SOE PCR置于一起。
用引物0611184和0611195从pACN5(图19)中扩增PDC启动子。引物0611184将NotI限制性位点引入到PCR产物的5’端。引物0611195则将XbaI限制性位点引入至PDC启动子后,并在PCR产物的3’端引入PDC终止子的同源物。
根据制造商说明使用
Figure BDA0001451815470000622
Pfx DNA聚合酶(Invitrogen)来实施扩增反应。每个PCR反应含有0.5μl稀释的pACN5(图19),引物0611184和0611195各25pM,1×Pfx扩增缓冲液(Invitrogen),2mm的MgSO4,0.2mM dNTP混合物,1.25单位的
Figure BDA0001451815470000623
Pfx DNA聚合酶(Invitrogen),终体积为50μl。在
Figure BDA0001451815470000624
(EppendorfScientific)中孵育扩增反应物,程序为95℃ 2分钟的1个循环,随后是每个为95℃ 30秒,55℃ 30秒和72℃ 2分钟的30个循环,及72℃ 3分钟的最后延伸。
以89mM Tris碱-89mM硼酸-2mM EDTA二钠缓冲液(TBE)中1%琼脂糖凝胶电泳来纯化PCR产物。一条约700bp的片段被从胶上切下,并根据制造商的说明使用
Figure BDA0001451815470000631
Gel Extracttion试剂盒(Qiagen,Valencia,CA,USA)从琼脂糖中提取。
用引物0611189和0611185从pHJJ76(图24)中扩增PDC终止子和URA3选择标志物。引物0611189在PCR产物的5’端引入了PDC启动子的同源物以及直接在PDC终止子前面引入PacI位点。引物0611185将一个NotI限制性位点引入到PCR产物的3’端。根据制造商说明使用
Figure BDA0001451815470000632
Pfx DNA聚合酶(Invitrogen)来实施扩增反应。每个PCR反应含有0.5μl稀释的pHJJ76,引物0611189和0611185各25pM,1×Pfx扩增缓冲液(Invitrogen),2mm的MgSO4,0.2mM dNTP混合物,1.25单位的
Figure BDA0001451815470000633
Pfx DNA聚合酶(Invitrogen),终体积为50μl。在
Figure BDA0001451815470000634
(Eppendorf Scientific)中孵育扩增反应物,程序为95℃ 2分钟的1个循环,随后是每个为95℃ 30秒,55℃ 30秒和72℃ 2分钟的30个循环,及72℃ 3分钟的最后延伸。
以使用89mM Tris碱-89mM硼酸-2mM EDTA二钠缓冲液(TBE)的1%琼脂糖凝胶电泳来纯化PCR产物。一条约2000bp的片段被从胶上切下,并根据制造商的说明使用
Figure BDA0001451815470000635
Gel Extracttion试剂盒(Qiagen,Valencia,CA,USA)从琼脂糖中提取。
使用SOE-PCR将2000bp的PDC终止子和URA3选择标志物PCR产物以及700bp的PDC启动子PCR产物融合。根据制造商说明使用
Figure BDA0001451815470000636
Pfx DNA聚合酶(Invitrogen)来实施扩增反应。每个PCR反应含有8ng 2000bp的PDC终止子和URA3选择标志物PCR产物,24ng700bp的PDC启动子PCR产物,引物0611184和0611185各50pM,1×Pfx扩增缓冲液(Invitrogen),2mm的MgSO4,0.2mM dNTP混合物,2.5单位的
Figure BDA0001451815470000637
Pfx DNA聚合酶(Invitrogen),终体积为100μl。在
Figure BDA0001451815470000638
(EppendorfScientific)中孵育扩增反应反应物,程序为95℃ 2分钟的1个循环,随后是每个为95℃ 30秒,55℃ 30秒和68℃ 3分钟的30个循环,和68℃ 3分钟的1个循环。
以使用89mM Tris碱-89mM硼酸-2mM EDTA二钠缓冲液(TBE)的1%琼脂糖凝胶电泳来纯化2700bpPCR产物。约2700bp的片段被从胶上切下,并根据制造商的说明使用
Figure BDA0001451815470000639
Gel Extracttion试剂盒(Qiagen,Valencia,CA,USA)从琼脂糖中提取。
根据使用制造商说明,用测序用Zero
Figure BDA0001451815470000641
PCR克隆试剂盒(Invitrogen)将2700bp的PCR产物克隆进pCRTM4BLUNT
Figure BDA0001451815470000642
(Invitrogen)载体中。在6μl的反应总体积中,将1μl或4μl 2700bp的PCR产物,1μl盐溶液(Invitrogen)和1μlpCRTM4BLUNT
Figure BDA0001451815470000643
(Invitrogen)在室温下一起孵育15分钟。根据实验制造商说明,将每个克隆反应中取出2μl转化至One
Figure BDA0001451815470000644
TOP10 Chemically Competent大肠杆菌细胞(Invitrogen)中。将转化体涂布在2X YT+amp平板上,37℃孵育过夜。通过NotI消化来筛选所得到的一些转化体,以筛选出所需PCR产物的合适插入。用DNA测序来证实产生所需大小条带的克隆的正确性并将其命名为pMIBa100。
质粒pHJJ76(图24)含有同源性,以允许将基因整合到adh1202基因座上。用NotI消化质粒pHJJ76,以移除存在于adh1202同源序列内部的URA3选择标志物。用89mM Tris碱-89mM硼酸-2mM EDTA二钠缓冲液(TBE)中1%琼脂糖凝胶电泳来纯化消化后的pHJJ76。使用
Figure BDA0001451815470000645
Gel Extracttion试剂盒(Qiagen,Valencia,CA,USA)从琼脂糖中提取出一条5.2kbp长的片段,然后用T4DNA连接酶连接到一起。根据制造商说明,将连接产物转化至One
Figure BDA0001451815470000646
TOP10 Chemically Competent大肠杆菌细胞(Invitrogen)中。将转化体涂布在2X YT+amp平板上,37℃孵育过夜。通过ApaI和SacI消化来筛选所得到的一些转化体。产生所需消化产物的克隆被命名为pHJJ76-no ura。
将来自于pMIBa100(见上)的PDC启动子和终止子和URA3选择标志物克隆进pHJJ76-no ura中,以产生质粒,在该质粒中,为了在adh1202基因座进行整合,基因可以被置于PDC启动子和终止子的调控之下。用NotI消化pHJJ76-no ura,接着用CIP处理。用
Figure BDA0001451815470000647
PCR Purification试剂盒(Qiagen)纯化该线性的5.2kbp片段。用NotI消化pMIBa100,并用89mM Tris碱-89mM硼酸-2mM EDTA二钠缓冲液(TBE)来实施1%琼脂糖凝胶电泳。约2742bp的片段被从胶上切下,使用
Figure BDA0001451815470000648
Gel Extracttion试剂盒(Qiagen,Valencia,CA,USA)提取,然后用T4DNA连接酶将其连接至pHJJ76-no ura的5.2kbp片段上。根据制造商说明,将连接产物转化至One
Figure BDA0001451815470000649
TOP10 Chemically Competent大肠杆菌细胞(Invitrogen)中。将转化体涂布在2X YT+amp平板上,37℃孵育过夜。通过KpnI和XbaI消化来筛选所得到的一些转化体。产生所需消化产物的克隆命名为pMIBa107(图2)。
实施例2E:在PDC基因座表达多个外源基因的插入载体片段的构造
可以使用下列的插入载体片段来产生预定的DNA构建体,所述构建体是将内源性的东方伊萨酵母PDC基因替换为表达多个基因的表达盒,例如,本文所描述的从PDC,ENO1和TDH3启动子表达的三个基因。左端构建体(pMhCt068及其衍生体)和右端构建体(pMhCt069及其衍生体)发生同源重组使URA3蛋白表达,导致该菌株由尿嘧啶营养缺陷型转化为尿嘧啶原养型,而允许对所需要的整合体进行选择。每个左端构建体的5’末端与PDC基因座的上游DNA同源,而每个右端构建体的3’末端则与PDC基因座的下游DNA同源。这些同源区域用于将表达盒靶向PDC基因座。在图3中示意性地示出了该靶向方法,并且可以利用本文所述的多个基因的任意组合来进行改进来靶向任意合适的位点,例如,上述的任意位点,例如ADH基因座(见下述示例)或ALD基因座。
左端片段的构造
对空的左端构建体载体,pMhCt068,进行如下所述多个步骤的克隆。
用引物0611166和0611167从东方伊萨酵母的基因组DNA中扩增含有PDC启动子区域和所需的其它限制性位点以及侧翼DNA的PCR片段。
PCR反应体系(50μL)含有100ng东方伊萨酵母的基因组DNA(例如,可使用来自于
Figure BDA0001451815470000651
Biotechnologies的MasterPureTM YeastDNA Purification Kit制备),1XThermoPol Reaction缓冲液(New England Biolabs),引物0611166和0611167每种100pmol,dATP、dCTP、dGTP和dTTP每种200μM,2μL 100mM MgSO4,以及2个单位的
Figure BDA0001451815470000652
(exo-)DNA聚合酶(New England Biolabs)。在
Figure BDA0001451815470000653
(Eppendorf Scientific)中进行PCR,程序为94℃ 2分钟的1个循环,随后是每个为94℃ 30秒,54℃ 30秒和72℃ 1分钟的34个循环,及72℃ 10分钟的最后延伸。热循环后,以TAE缓冲液中0.9%琼脂糖凝胶电泳来分离PCR反应产物,其中约780碱基对的PCR产物被从胶上切下并根据制造商的说明使用
Figure BDA0001451815470000654
Extract II试剂盒(Macherey-Nagel,Bethlehem,PA,USA)进行纯化。
用引物0611168和0611169从pACN5(图19)中扩增含有TAL终止子区域和所需的其它限制性位点以及侧翼DNA的PCR片段。PCR反应体系(50μL)含有1μL pACN5小量制备质粒DNA,1X iproofTMHF缓冲液(Bio-Rad Laboratories,Hercules,CA,USA),引物0611168和0611169每种100pmol,dATP、dCTP、dGTP和dTTP每种200μM,1.5μL DMSO,以及1个单位的iProof TMHigh Fidelity DNA聚合酶(Bio-Rad Laboratories)。在
Figure BDA0001451815470000661
Figure BDA0001451815470000662
(Eppendorf Scientific)中进行PCR,程序为98℃ 30秒的1个循环,随后是每个为98℃ 10秒,59℃ 20秒和72℃ 45秒的324个循环,及72℃ 10分钟的最后延伸。热循环后,以TAE缓冲液中0.9%琼脂糖凝胶电泳来分离PCR反应产物,其中约460碱基对的PCR产物被从胶上切下并根据制造商的说明使用
Figure BDA0001451815470000663
Extract II试剂盒(Macherey-Nagel)纯化。
然后用PCR来构建融合了上述产物的单一扩增产物。PCR反应体系(50μL)含有125ng包含PCR产物的PDC启动子,76ng包含PCR产物的TAL终止子,1X ThermoPol Reaction缓冲液(New England Biolabs),引物0611166和0611169每种100pmol,dATP、dCTP、dGTP和dTTP每种200μM,2μL 100mM MgSO4,以及2个单位的
Figure BDA0001451815470000664
(exo-)DNA聚合酶(New EnglandBiolabs)。在
Figure BDA0001451815470000665
(Eppendorf Scientific)中进行PCR,程序为94℃ 2分钟的1个循环,随后是每个为94℃ 30秒,54℃ 30秒和72℃ 1分30秒的34个循环,及72℃ 10分钟的最后延伸。热循环后,以TAE缓冲液中0.9%琼脂糖凝胶电泳来分离PCR反应产物,其中约1250碱基对的PCR产物被从胶上切下并根据制造商的说明使用
Figure BDA0001451815470000666
Extract II试剂盒(Macherey-Nagel,Bethlehem,PA,USA)进行纯化。
用引物0611170和0611171从pACN43(图22)中扩增含有ENO1启动子区域和所需的其它限制性位点以及侧翼DNA的PCR片段。PCR反应体系(50μL)含有1μL pACN43小量制备质粒DNA,1X Phusion HF缓冲液(New England Biolabs),引物0611170和0611171每种100pmol,dATP、dCTP、dGTP和dTTP每种200μM,以及1个单位的PhusionTMHigh Fidelity DNA聚合酶(New England Biolabs)。在
Figure BDA0001451815470000667
(EppendorfScientific)中进行PCR,程序为98℃ 30秒的1个循环,随后是每个为98℃ 10秒,59℃ 20秒和72℃ 45秒的34个循环,及72℃ 10分钟的最后延伸。热循环后,以TAE缓冲液中0.9%琼脂糖凝胶电泳来分离PCR反应产物,其中约1050碱基对的PCR产物被从胶上切下并根据制造商的说明使用
Figure BDA0001451815470000668
Extract II试剂盒(Macherey-Nagel)纯化。
用引物0611172和0611173从pACN43(图22)中扩增PCR片段以及其它限制性位点和侧翼DNA,该片段含有RKI终止子区域,其后是URA3启动子区域以及URA3ORF的5’末端。PCR反应体系(50μL)含有1μL pACN43小量制备质粒DNA,1X iproofTMHF缓冲液(Bio-RadLaboratories,Hercules,CA,USA),引物0611172和0611173每种100pmol,dATP、dCTP、dGTP和dTTP每种200μM,1.5μL DMSO,以及1个单位的iProofTMHigh Fidelity DNA聚合酶(Bio-Rad Laboratories)。在
Figure BDA0001451815470000671
(EppendorfScientific)中进行PCR,程序为98℃ 30秒的1个循环,随后是每个为98℃ 10秒,59℃ 20秒和72℃ 45秒的34个循环,及72℃ 10分钟的最后延伸。热循环后,以TAE缓冲液中0.9%琼脂糖凝胶电泳来分离PCR反应产物,其中约1400碱基对的PCR产物被从胶上切下并根据制造商的说明使用
Figure BDA0001451815470000672
Extract II试剂盒(Macherey-Nagel)纯化。
用PCR来构建融合了两个上述产物的单一扩增产物。PCR反应体系(50μL)含有93ng包含PCR产物的ENO1启动子(见上),125ng RKI终止子,URA3启动子和包含PCR产物的部分ORF(见上),1X Phusion HF缓冲液(New England Biolabs),引物0611170和0611173每种100pmol,dATP、dCTP、dGTP和dTTP每种200μM,1.5μL DMSO,以及1个单位的PhusionTMHighFidelity DNA聚合酶(New England Biolabs)。在
Figure BDA0001451815470000673
(Eppendorf Scientific)中进行PCR,程序为98℃ 30秒的1个循环,随后是每个为98℃ 10秒,56℃ 20秒和72℃ 2分45秒的34个循环,及72℃ 10分钟的最后延伸。热循环后,以TAE缓冲液中0.9%琼脂糖凝胶电泳来分离PCR反应产物,其中约2460碱基对的PCR产物被从胶上切下并根据制造商的说明使用
Figure BDA0001451815470000674
Extract II试剂盒(Macherey-Nagel)进行纯化。
为了为PCR产物创建接收载体,使用Hind III和EcoRI消化质粒pMhCt017(具有一个无关插入的标准克隆载体pUC19),用10个单位的小牛肠磷酸酶(New England Biolabs)在37℃下处理30分钟,和在TAE缓冲液中通过0.9%的琼脂糖凝胶电泳纯化,约2.6kbp的条带被从胶上切下并根据制造商的说明使用
Figure BDA0001451815470000675
Extract II试剂盒(Macherey-Nagel)纯化。所得到的Hind III至EcoRI纯化片段与pUC18中发现的相同(Yanisch-Perron,C.,Vieira,J.and Messing,J.(1985)Gene,33,103-119)。
用IN-FUSIONTM Advantage PCR Cloning KiT(Clontech)将上述纯化的1250bp和2460bp PCR产物插入到消化后的pMhCt017片段中,总反应体积为10μL,由125ngpMhCt017Hind III至EcoRI载体片段,92ng PDC启动子和TAL终止子PCR产物,165ng ENO1启动子和URA3启动子以及含有PCR产物的部分ORF,1X In-Fusion反应缓冲液(Clontech)和1μL IN-FUSIONTM酶(Clontech)构成。将该反应孵育在37℃下15分钟,50℃下15分钟,然后置于冰上。将该反应体系用40μL TE缓冲液稀释,取出2.5μL根据制造商说明用于转化SoloPackGlod SuperCompetent Cells(Agilent Technologies)。将转化体体涂布于2X YT+amp平板上,37℃孵育过夜。通过Apa LI消化来筛选所得到的一些转化体,其中有所需PCR产物的正确插入。用DNA测序命名来证实产生所需大小条带的克隆的正确性,并命名为pMhCt068。
质粒pMhCt068含有PDC启动子区域,之后是NheI和AscI限制性位点,所述限制性位点可用于本文所述的感兴趣的异位基因的加入,TAL终止子,ENO1启动子区域,在其后面的XbaI和PacI限制性位点(该限制性位点用于克隆本文所述的感兴趣的第二异位基因),RKI终止子,东方伊萨酵母URA3启动子和东方伊萨酵母URA3ORF的5’端。发现质粒pMhCt068在进入PDC启动子中大约200bp处有一个A至T的核苷酸改变,在进入PDC启动子的约2/3处有G至T的改变,以及位于NheI限制性位点的5’侧翼有一个提前起始密码子(ATG)。因此,pMhCt068的正确版本如下构建。
用引物0611166和0611828从pACN5(图19)中PCR扩增PDC启动子区域,该扩增并没有引入上述不期望的起始密码子。PCR反应体系(50μL)含有1μL 1至50稀释度的pACN5小量制备质粒DNA,1X ThermoPol Reaction缓冲液(New England Biolabs),引物0611166和0611828每种100pmol,dATP、dCTP、dGTP和dTTP每种200μM,2μL 100mM MgSO4,以及2个单位的
Figure BDA0001451815470000681
(exo-)DNA聚合酶(New England Biolabs)。在
Figure BDA0001451815470000683
Figure BDA0001451815470000682
(Eppendorf Scientific)中进行PCR,程序为94℃ 2分钟的1个循环,随后是每个为94℃ 30秒,54℃ 30秒和72℃1分钟的34个循环,及72℃ 10分钟的最后延伸。热循环后,以TAE缓冲液中0.9%琼脂糖凝胶电泳来分离PCR反应产物,其中约780碱基对的PCR产物被从胶上切下并根据制造商的说明使用
Figure BDA0001451815470000684
Extract II试剂盒(Macherey-Nagel)纯化。
如上所述的方法将含有PCR产物的PDC启动子融合到含有PCR产物的TAL终止子上。由于TAL终止子PCR片段是由0611168引物所得到的,因此所得到的PCR融合产物应当是混合物,即缺失提前起始密码子的产物和含有不期望的起始密码子的产物。纯化所得到的~1250bp的PCR产物,并如前所述,通过IN-FUSIONTMAdvantage PCR Cloing Kit(Clontech)将其与RKI终止子,URA3启动子和含有融合PCR产物和pUC18的部分ORF组合。DNA测序显示产生预期ApaLI消化图谱的克隆的正确性,包括PDC启动子中不存在突变和NheI限制性位点5’端的提前ATG的缺失(这些是期望的),并命名为pMhCt082。
右端片段的构造
对空的右端构建体载体,pMhCt069,进行如下所述多个步骤的克隆。
用引物0611174和0611175从pACN43(图22)中扩增含有东方伊萨酵母URA3ORF 3’末端,URA3终止子(URA3终止密码子下游275bp),URA3启动子(当整合进酵母宿主后,用作重复区域以环出标志物)以及期望的其它限制性位点和侧翼DNA的PCR片段。PCR反应体系(50μL)含有1μL pACN43小量制备质粒DNA,1X Phusion HF缓冲液(New England Biolabs),引物0611174和0611175每种100pmol,dATP、dCTP、dGTP和dTTP每种200μM,以及1个单位的PhusionTMHigh Fidelity DNA聚合酶(New England Biolabs)。在
Figure BDA0001451815470000691
(Eppendorf Scientific)中进行PCR,程序为98℃ 30秒的1个循环,随后是每个为98℃ 10秒,59℃ 20秒和72℃ 45秒的34个循环,及72℃10分钟的最后延伸。热循环后,以TAE缓冲液中0.9%琼脂糖凝胶电泳来分离PCR反应产物,其中约1210bp的PCR产物被从胶上切下并根据制造商的说明使用
Figure BDA0001451815470000692
Extract II试剂盒(Macherey-Nagel)纯化。
使用引物0611176和0611177从pACN23(图20)中扩增含有TDH3启动子区域和期望的其它限制性位点和侧翼DNA的PCR片段。PCR反应体系(50μL)含有1μL pACN23小量制备质粒DNA,1X Phusion HF缓冲液(New England Biolabs),引物0611176和0611177每种100pmol,dATP、dCTP、dGTP和dTTP每种200μM,以及1个单位的PhusionTMHigh Fidelity DNA聚合酶(New England Biolabs)。在
Figure BDA0001451815470000693
(EppendorfScientific)中进行PCR,程序为98℃ 30秒的1个循环,随后是每个为98℃ 10秒,59℃ 20秒和72℃ 45秒的34个循环,及72℃ 10分钟的最后延伸。热循环后,以TAE缓冲液中0.9%琼脂糖凝胶电泳来分离PCR反应产物,其中约1028碱基对的PCR产物被从胶上切下并根据制造商的说明使用
Figure BDA0001451815470000694
Extract II试剂盒(Macherey-Nagel)纯化。
用引物0611178和0611179从东方伊萨酵母基因组DNA中扩增PCR片段,所述片段含有东方伊萨酵母PDC基因区域终止密码子的3’端区域(PDC终止子区域)和期望的另外限制性位点以及侧翼DNA。PCR反应体系(50μL)含有100ng东方伊萨酵母的基因组DNA,1XiproofTMHF缓冲液(Bio-Rad Laboratories),引物0611178和0611179每种100pmol,dATP、dCTP、dGTP和dTTP每种200μM,1.5μL DMSO,以及1个单位的iProof TMHigh Fidelity DNA聚合酶(Bio-Rad Laboratories)。在
Figure BDA0001451815470000701
Figure BDA0001451815470000702
(EppendorfScientific)中进行PCR,程序为98℃ 30秒的1个循环,随后是每个为98℃ 10秒,59℃ 20秒和72℃ 45秒的34个循环,及72℃ 10分钟的最后延伸。热循环后,以TAE缓冲液中0.9%琼脂糖凝胶电泳来分离PCR反应产物,其中约938碱基对的PCR产物被从胶上切下并根据制造商的说明使用
Figure BDA0001451815470000703
Extract II试剂盒(Macherey-Nagel)纯化。
用PCR来构建融合了两个上述最后产物的单一扩增产物。PCR反应体系(50μL)含有125ng包含PCR产物的TDH3启动子,114ng含有PCR产物的PDC终止子,1X Phusion HF缓冲液(New England Biolabs),引物0611176和0611179每种100pmol,dATP、dCTP、dGTP和dTTP每种200μM,1.5μL DMSO,以及1个单位的PhusionTMHigh Fidelity DNA聚合酶(New EnglandBiolabs)。在
Figure BDA0001451815470000704
(Eppendorf Scientific)中进行PCR,程序为98℃ 30秒的1个循环,随后是每个为98℃ 10秒,56℃ 20秒和72℃ 2分30秒的34个循环,及72℃ 10分钟的最后延伸。热循环后,以TAE缓冲液中0.9%琼脂糖凝胶电泳来分离PCR反应产物,其中约1966碱基对的PCR产物被从胶上切下并根据制造商的说明使用
Figure BDA0001451815470000705
Extract II试剂盒(Macherey-Nagel)进行纯化。
随后用IN-FUSIONTMAdvantage PCR Cloing Kit(Clontech)将上述纯化的1210bp和1966bp PCR融合产物插入到见上所述的Hind III和EcoRI消化后的pMhCt017片段中,总反应体积为10μL,由125ng pMhCt017Hind III至EcoRI载体片段,54ng含有URA3ORF 3’末端及其后URA3终止子的PCR产物,200ng TDH3启动子和PDC终止子融合PCR产物,1X In-Fusion反应缓冲液(Clontech)和1μL IN-FUSIONTM酶(Clontech)构成。将该反应孵育在37℃下15分钟,50℃下15分钟,然后置于冰上。将该反应体系用40μL TE缓冲液稀释,取出2.5μL根据制造商说明用于转化SoloPack Glod SuperCompetentCells(Agilent Technologies)。将转化体涂布于2X YT+amp平板上,37℃孵育过夜。通过Apa LI消化来筛选所到一些转化体有所期望的PCR产物合适地插入。用DNA测序来证实产生所需大小条带的克隆的正确性,并命名为pMhCt069。
质粒pMhCt069含有东方伊萨酵母URA3标记的3’末端,相应的URA3终止子,URA3启动子(用于将来将URA3标记环出),TDH3启动子,用于亚克隆所需基因使其异位表达的XbaI和PacI限制性位点,以及PDC位点的3’侧翼区域。
实施例2F:在adh9091基因座表达多个外源基因的插入载体片段的构造
设计下面的插入载体片段的方法与实施例2E中所描述的类似,是为了将内源性的东方伊萨酵母adh9091基因替换为表达多个本文所述的感兴趣的基因的表达盒。
左端片段的构造
对空的左端构建体载体,pGREr125,进行如下所述多个步骤的克隆。
含有在东方伊萨酵母adh9091基因座发生同源重组所需的5’端侧翼的构建体,以及PDC启动子/TAL终止子空表达盒被PCR克隆进载体质粒pCR2.1-TOPO(Invitrogen)。用引物0611250和0611251从质粒pACN5(图19)中PCR扩增PDC启动子片段。PCR反应体系(50μL)含有15ng pACN5质粒DNA,1X Phusion HF缓冲液(New England Biolabs),引物0611250和0611251每种50pmol,dATP、dCTP、dGTP和dTTP每种200μM,1.5μL 100%DMSO,以及1个单位的PhusionTMHigh Fidelity DNA聚合酶(New England Biolabs)。在
Figure BDA0001451815470000711
(Eppendorf Scientific)中进行PCR,程序为98℃ 2分钟的1个循环,随后是每个为98℃ 30秒,55℃ 30秒和72℃ 1分30秒的35个循环,及72℃ 7分钟的最后延伸。热循环后,以TBE缓冲液中0.8%琼脂糖凝胶电泳来分离PCR反应产物,其中约900bp的PCR产物被从胶上切下并根据制造商的说明使用
Figure BDA0001451815470000712
GelExtracttion试剂盒(Qiagen)从琼脂糖中纯化。所得到的PCR片段的总长度为约753bp,在该片段的5’末端有NotI限制性位点,其3’末端有PacI和XbaI限制性位点。
产生第二PCR片段以使用引物0611252和0611253从质粒pACN5(图19)中扩增TAL终止子区域,所述第二片段含有上述PCR产物的5’同源物,包括XbaI和PacI限制性位点。PCR反应体系(50μL)含有15ng质粒pACN5DNA(见上),1X Phusion HF缓冲液(New EnglandBiolabs),引物0611252和0611253每种50pmol,dATP、dCTP、dGTP和dTTP每种200μM,1.5μL100%DMSO,以及1个单位的PhusionTMHigh Fidelity DNA聚合酶(New England Biolabs)。在
Figure BDA0001451815470000721
(Eppendorf Scientific)中进行PCR,程序为98℃ 2分钟的1个循环,随后是每个为98℃ 30秒,55℃ 30秒和72℃ 1分30秒的35个循环,有72℃ 7分钟的最后延伸。热循环后,以TBE缓冲液中0.8%琼脂糖凝胶电泳来分离PCR反应产物,其中约900bp的PCR产物被从胶上切下并根据制造商的说明使用
Figure BDA0001451815470000722
GelExtracttion试剂盒(Qiagen)从琼脂糖中纯化。所得到的PCR片段的总长度为约435bp,在该片段的5’末端有PacI和XbaI限制性位点,3’末端有PmeI限制性位点。
用引物0611250和0611253通过PCR将753bp的片段和435bp的片段融合,结果得到一条1149bp的片段,其中,PDC启动子在TAL终止子的上游。PCR反应体系(50μL)含有125ng753bp片段,75ng 435bp片段,1X Phusion HF缓冲液(New England Biolabs),引物0611250和0611253每种50pmol,dATP、dCTP、dGTP和dTTP每种200μM,1.5μL 100%DMSO,以及1个单位的PhusionTMHigh Fidelity DNA聚合酶(New England Biolabs)。在
Figure BDA0001451815470000723
Figure BDA0001451815470000724
(Eppendorf Scientific)中进行PCR,程序为98℃ 2分钟的1个循环,随后是每个为98℃ 30秒,55℃ 30秒和72℃ 1分钟的35个循环,及72℃ 7分钟的最后延伸。热循环后,以TBE缓冲液中0.8%琼脂糖凝胶电泳来分离PCR反应产物,其中约1149bp对的PCR产物被从胶上切下并根据制造商的说明使用
Figure BDA0001451815470000725
Gel Extracttion试剂盒(Qiagen)从琼脂糖中纯化。
产生PCR片段以使用引物0611254和0611255扩增东方伊萨酵母adh9091基因座的5’侧翼,所述第二片段含有上述1149bp PCR产物的3’同源物,包括NotI限制性位点。PCR反应体系(50μL)含有15ng质粒pHJJ27(图21)作为模板DNA,1X Phusion HF缓冲液(NewEngland Biolabs),引物0611254和0611255每种50pmol,dATP、dCTP、dGTP和dTTP每种200μM,1.5μL 100%DMSO,以及1个单位的PhusionTMHigh Fidelity DNA聚合酶(New EnglandBiolabs)。在
Figure BDA0001451815470000726
(Eppendorf Scientific)中进行PCR,程序为98℃ 2分钟的1个循环,随后是每个为98℃ 30秒,55℃ 30秒和72℃ 1分30秒的35个循环,有72℃ 7分钟的最后延伸。热循环后,以TBE缓冲液中0.8%琼脂糖凝胶电泳来分离PCR反应产物,其中约900bp的PCR产物被从胶上切下并根据制造商的说明使用
Figure BDA0001451815470000727
Gel Extracttion试剂盒(Qiagen)从琼脂糖中纯化。所得到的PCR片段的总长度为约891bp,在该片段的5’末端有HpaI限制性位点,3’末端有NotI限制性位点。
用引物0611254和0611253,利用PCR将891bp片段融合到1149bp的PDC启动子/TAL终止子片段上,产生约2005bp的片段。PCR反应体系(50μL)含有125ng的1149bp片段,95ng的891bp片段,1X Phusion HF缓冲液(New England Biolabs),引物0611254和0611253每种50pmol,dATP、dCTP、dGTP和dTTP每种200μM,1.5μL 100%DMSO,以及1个单位的PhusionTMHigh Fidelity DNA聚合酶(New England Biolabs)。在
Figure BDA0001451815470000731
Figure BDA0001451815470000732
(Eppendorf Scientific)中进行PCR,程序为98℃ 2分钟的1个循环,随后是每个为98℃ 30秒,55℃ 30秒和72℃ 2分钟的35个循环,及72℃ 7分钟的最后延伸。热循环后,以TBE缓冲液中0.8%琼脂糖凝胶电泳来分离PCR反应产物,其中约2005bp的PCR产物被从胶上切下并根据制造商的说明使用
Figure BDA0001451815470000733
Gel Extracttion试剂盒(Qiagen)从琼脂糖中纯化。
所得到的2005bp片段,包含用于在adh9091基因座整合的5’侧翼,PDC启动子和TAL终止子,被克隆进pCR2.1-TOPO载体中,使用TOPO TA Cloning Kit(Invitrogen)根据操作说明转化进One-Shot Top10大肠杆菌细胞中。将转化体涂布于2X YT+amp平板上,37℃孵育过夜。通过AvaI消化来筛选到一些转化体有所期望的PCR产物的正确插入。产生所需大小条带的克隆被确认并命名为pGMEr112。质粒pGMEr112包含用于在adh9091基因座进行同源重组的5’侧翼,其后是空的表达盒PDC启动子/TAL终止子。
用引物0611283和0611263通过PCR从质粒pHJJ27(图21)中扩增由URA3启动子片段驱动的5’截短的URA3标记基因。PCR反应体系(50μL)含有15ng质粒pHJJ27,1X Phusion HF缓冲液(New England Biolabs),引物0611263和0611283每种50pmol,dATP、dCTP、dGTP和dTTP每种200μM,1.5μL 100%DMSO,以及1个单位的PhusionTMHigh Fidelity DNA聚合酶(New England Biolabs)。在
Figure BDA0001451815470000734
(EppendorfScientific)中进行PCR,程序为98℃ 2分钟的1个循环,随后是每个为98℃ 30秒,55℃ 30秒和72℃ 1分30秒的35个循环,及72℃ 7分钟的最后延伸。热循环后,以TBE缓冲液中0.8%琼脂糖凝胶电泳来分离PCR反应产物,其中约900bp的PCR产物被从胶上切下并根据制造商的说明使用
Figure BDA0001451815470000735
Gel Extracttion试剂盒(Qiagen)从琼脂糖中纯化。所得到的PCR片段的总长度为约885bp,在该片段的5’末端有HpaI和PmeI限制性位点,3’末端有NheI限制性位点。
将所得到的885bp片段克隆进pCR2.1-TOPO载体中,使用TOPO TA Cloning KiT(Invitrogen)根据制造商说明转化进One-Shot Top10大肠杆菌细胞中。将转化体涂布于2XYT+amp平板上,37℃孵育过夜。通过BglI消化来筛选到一些有所期望的PCR产物的正确插入的转化体。产生所需大小条带的克隆被确认并命名为pGMEr108。质粒pGMEr108包括URA3启动子,其后是URA3基因的5’截短片段,该片段的侧翼5’末端是HpaI和PmeI限制性位点,3’末端则是NotI限制性位点。
将来自于质粒pGMEr112(见上)的1998bp的HpaI和PmeI限制性片段连接至由HpaI和PmeI线性化的来自于pGMEr108(见上)的4806bp载体上,所述限制性片段包含5’adh9091侧翼,其后是构建体PDC启动子/TAL终止子。以TBE缓冲液中0.8%琼脂糖凝胶电泳来分离双限制性酶切反应产物,其中约1998bp的插入片段和4806bp的载体片段被从胶上切下并根据制造商的说明使用
Figure BDA0001451815470000741
Gel Extracttion试剂盒(Qiagen)从琼脂糖中纯化。使用1:3的载体:插入片段比例来进行连接反应,特别的,建立的反应体系有2μL 4806bp线性化载体,6μL 1998bp插入片段,9μL 2X Quick Ligation反应缓冲液以及1μL Quick T4DNA连接酶(New England Biolabs),根据制造商说明来实施。
根据制造商说明,将5μL连接产物转化到大肠杆菌
Figure BDA0001451815470000742
UltracompetentCells(Agilent Technogogies)中。将转化体涂布于2X YT+amp平板上,37℃孵育过夜。通过HindIII消化来筛选到一些有所期望的PCR产物的正确插入的转化体。产生所需大小条带的克隆被确认并命名为pGMEr117。
质粒pGMEr117包括5’adh9091侧翼,其后是空的表达盒PDC启动子/TAL终止子以及由URA3驱动的截短的5’URA3基因。此外,质粒pGMEr117有两个不同的XbaI限制性位点:第一个限制性位点位于PDC启动子和TAL终止子之间(靠近限制性位点PacI),该位点可用于插入感兴趣的基因,第二个XbaI限制性位点则来自于原始pCR2.1-TOPO的骨架。为了消除这第二个XbaI限制性位点,用ApaI消化质粒pGMEr117,然后根据制造商说明用酶DNA聚合酶I,大(Klenow)片段(New England Biolabs)处理线性化的质粒。将得到的线性化质粒(含有平末端)用限制性酶EcoRV消化,其从含有XbaI限制性位点载体中将一条43bp的片段切割出来。以TBE缓冲液中0.8%琼脂糖凝胶电泳来分离限制性酶切反应产物,并将约6761bp的载体片段被从胶上切下并根据制造商的说明使用
Figure BDA0001451815470000743
Gel Extracttion试剂盒(Qiagen)从琼脂糖中纯化。建立自连接反应体系,其具有3μL线性化载体,6μL灭菌双蒸水,10μL 2X Quick Ligation反应缓冲液以及1μL Quick T4DNA连接酶(New EnglandBiolabs),根据制造商说明来实施。
根据制造商说明,将5μL连接产物转化到大肠杆菌
Figure BDA0001451815470000751
UltracompetentCells(Agilent Technogogies)中。将转化体涂布于2X YT+amp平板上,37℃孵育过夜。通过XbaI消化来筛选到一些有所期望的PCR产物的正确插入的转化体。产生所需大小条带的克隆被确认并命名为pGMEr122。
用引物0611295和0611296从质粒pACN43(图22)中PCR扩增ENO1启动子片段。PCR反应体系(50μL)含有15ng pACN43质粒,1X Phusion HF缓冲液(New England Biolabs),引物0611295和0611296每种50pmol,dATP、dCTP、dGTP和dTTP每种200μM,1.5μL 100%DMSO(NewEngland Biolabs)以及1个单位的PhusionTMHigh Fidelity DNA聚合酶(New EnglandBiolabs)。在
Figure BDA0001451815470000752
(Eppendorf Scientific)中进行PCR,程序为98℃ 2分钟的1个循环,随后是每个为98℃ 30秒,55℃ 30秒和72℃ 1分钟的35个循环,及72℃ 7分钟的最后延伸。热循环后,以TBE缓冲液中0.8%琼脂糖凝胶电泳来分离PCR反应产物,其中约1009bp的PCR产物被从胶上切下并根据制造商的说明使用
Figure BDA0001451815470000753
Gel Extracttion试剂盒(Qiagen)纯化。所得到的PCR片段的总长度约为1009bp,在片段的5’末端具有PmeI限制性位点,在3’末端有ApaI和NruI限制性位点。
产生第二PCR片段以使用引物0611297和0611298从质粒pACN43(图22)中扩增RKI终止子,所述第二片段含有上述PCR产物的5’同源物,包括NruI和ApaI限制性位点。PCR反应体系(50μL)含有15ng质粒pACN43DNA,1X Phusion HF缓冲液(New England Biolabs),引物0611297和0611298每种50pmol,dATP、dCTP、dGTP和dTTP每种200μM,1.5μL 100%DMSO(NewEngland Biolabs),以及1个单位的PhusionTMHigh Fidelity DNA聚合酶(New EnglandBiolabs)。在
Figure BDA0001451815470000754
(Eppendorf Scientific)中进行PCR,程序为98℃ 2分钟的1个循环,随后是每个为98℃ 30秒,55℃ 30秒和72℃ 1分钟的35个循环,及72℃ 7分钟的最后延伸。热循环后,以TBE缓冲液中0.8%琼脂糖凝胶电泳来分离PCR反应产物,其中约438bp的PCR产物被从胶上切下并根据制造商的说明使用
Figure BDA0001451815470000755
Gel Extracttion试剂盒(Qiagen)从琼脂糖中纯化。所得到的PCR片段的总长度为约438bp,在该片段的5’末端有NruI和ApaI限制性位点,3’末端有PmeI限制性位点。
用引物0611295和0611298通过PCR将1009bp的启动子片段和438bp的终止子片段融合在一起,产生一条约1447bp的片段,该片段中ENO1启动子位于RKI终止子上游。PCR反应体系(50μL)含有125ng 1009bp片段,65ng 438bp片段,1X Phusion HF缓冲液(New EnglandBiolabs),引物0611295和0611298每种50pmol,dATP、dCTP、dGTP和dTTP每种200μM,1.5μLDMSO(New England Biolabs),以及1个单位的PhusionTMHigh Fidelity DNA聚合酶(NewEngland Biolabs)。在
Figure BDA0001451815470000761
(Eppendorf Scientific)中进行PCR,程序为98℃ 2分钟的1个循环,随后是每个为98℃ 30秒,55℃ 30秒和72℃ 2分钟的35个循环,及72℃ 7分钟的最后延伸。热循环后,以TBE缓冲液中0.8%琼脂糖凝胶电泳来分离PCR反应产物,其中约1447bp对的PCR产物被从胶上切下并根据制造商的说明使用
Figure BDA0001451815470000762
Gel Extracttion试剂盒(Qiagen)从琼脂糖中纯化。
所得到的1447bp的片段,包含ENO1启动子/RKI终止子构建体,克隆进pCR2.1-TOPO载体中,使用TOPO TA Cloning KiT(Invitrogen)根据制造商说明转化进One-Shot Top10大肠杆菌细胞中。将转化体涂布于2X YT+amp平板上,37℃孵育过夜。通过BamHI消化来筛选到一些有所期望的PCR产物的正确插入的转化体。产生所需大小条带的克隆被确认并命名为pGMEr114,其包含空的表达盒ENO1启动子/RKI终止子。
用限制性酶PmeI在37℃下对质粒pGMEr122和pGMEr114消化3小时。在终止各个消化反应前1小时,向每个消化管中加入1μL牛肠碱性磷酸酯酶(New England Biolabs),以使得末端去磷酸化防止自连接。所得到的来自于质粒pGMEr122的6761bp载体片段,以及包含来自于质粒pGMEr144的构建体ENO1启动子/TAL终止子(1439bp)的插入片段,在1X TBE缓冲液中通过0.8%琼脂糖凝胶电泳来分离,并从凝胶中切割下来,根据制造商的说明使用
Figure BDA0001451815470000763
Gel Extracttion试剂盒(Qiagen)从琼脂糖中纯化。
随后制备后续的连接反应,其包括3μL来自于质粒pGMEr122的载体片段,4μL来自于质粒pGMEr114的插入片段,2μL无菌dd水,10μL 2X Quick Ligation反应缓冲液以及1μLQuick T4DNA连接酶(New England Biolabs),根据制造商说明来实施。根据制造商说明,将5μL上述连接反应的等分试样转化到大肠杆菌
Figure BDA0001451815470000764
Ultracompetent Cells(Agilent Technogogies)中。将转化体涂布于2X YT+amp平板上,37℃孵育过夜。通过XbaI和BstBI消化来筛选到一些有所期望的PCR产物的正确插入的转化体。产生所需大小条带的克隆通过测序被确认并命名为pGMEr125。ENO1启动子/RKI终止子构建体以相反的取向被插入,导致了两个版本的命名为(a)和(b)的质粒pGMEr125(图4和5)。
质粒pGMEr125a和pGMEr125b含有PDC启动子区域,TAL终止子,ENO1启动子区域,RKI终止子,东方伊萨酵母URA3启动子,相应的URA3标记的5’末端以及东方伊萨酵母adh9091基因座的5’侧翼区域。
右端片段的构建
对空的右端构建体载体,pGREr121,进行如下所述多个步骤的克隆。
用引物0611256和0611257从质粒pACN23(图20)中PCR扩增TDH3启动子片段。PCR反应体系(50μL)含有15ng pACN23质粒DNA,1X Phusion HF缓冲液(New England Biolabs),引物0611256和0611257每种50pmol,dATP、dCTP、dGTP和dTTP每种200μM,1.5μL 100%DMSO(New England Biolabs),以及1个单位的PhusionTMHigh Fidelity DNA聚合酶(NewEngland Biolabs)。在
Figure BDA0001451815470000771
(EppendorfScientific)中进行PCR,程序为98℃ 2分钟的1个循环,随后是每个为98℃ 30秒,55℃ 30秒和72℃ 1分30秒的35个循环,及72℃ 7分钟的最后延伸。热循环后,以TBE缓冲液中0.8%琼脂糖凝胶电泳来分离PCR反应产物,其中约994bp的PCR产物被从胶上切下并根据制造商的说明使用
Figure BDA0001451815470000772
Gel Extracttion试剂盒(Qiagen)从琼脂糖中纯化。所得到的PCR片段的总长度为约994bp,在该片段的5’末端有SfoI限制性位点,其3’末端有PacI和NruI限制性位点。
产生第二PCR片段以使用引物0611258和0611259从质粒pACN23(图20)中扩增TKL终止子,所述第二片段含有上述PCR产物的5’同源物,包括NruI和PacI限制性位点。PCR反应体系(50μL)含有15ng质粒pACN23DNA,1X Phusion HF缓冲液(New England Biolabs),引物0611258和0611259每种50pmol,dATP、dCTP、dGTP和dTTP每种200μM,1.5μL 100%DMSO(NewEngland Biolabs),以及1个单位的PhusionTMHigh Fidelity DNA聚合酶(New EnglandBiolabs)。在
Figure BDA0001451815470000773
(Eppendorf Scientific)中进行PCR,程序为98℃ 2分钟的1个循环,随后是每个为98℃ 30秒,55℃ 30秒和72℃ 1分30秒的35个循环,及72℃ 7分钟的最后延伸。热循环后,以TBE缓冲液中0.8%琼脂糖凝胶电泳来分离PCR反应产物,其中约469bp的PCR产物被从胶上切下并根据制造商的说明使用
Figure BDA0001451815470000781
Gel Extracttion试剂盒(Qiagen)从琼脂糖中纯化。所得到的PCR片段的总长度为约469bp,在该片段的5’末端有NruI和PacI限制性位点,3’末端有NotI限制性位点。
用引物0611256和0611259通过PCR将上述994bp和469bp的片段融合在一起,产生一条约1433bp的片段,该片段中TDH3启动子位于TKL终止子上游。PCR反应体系(50μL)含有125ng 994bp片段,60ng 469bp片段,1X Phusion HF缓冲液(New England Biolabs),引物0611256和0611259每种50pmol,dATP、dCTP、dGTP和dTTP每种200μM,1.5μL 100%DMSO(NewEngland Biolabs),以及1个单位的PhusionTMHigh Fidelity DNA聚合酶(New EnglandBiolabs)。在
Figure BDA0001451815470000782
(Eppendorf Scientific)中进行PCR,程序为98℃ 2分钟的1个循环,随后是每个为98℃ 30秒,55℃ 30秒和72℃ 1分钟的35个循环,及72℃ 7分钟的最后延伸。热循环后,以TBE缓冲液中0.8%琼脂糖凝胶电泳来分离PCR反应产物,其中约1433bp的PCR产物被从胶上切下并根据制造商的说明使用
Figure BDA0001451815470000783
Gel Extracttion试剂盒(Qiagen)从琼脂糖中纯化。
产生第二PCR片段以使用引物0611260和0611261扩增adh9091基因座的3’侧翼,所述第二片段含有上述1433bp的PCR产物3’末端的5’同源物,包括NotI限制性位点。PCR反应体系(50μL)含有15ng质粒pHJJ27DNA作为模板DNA,1X Phusion HF缓冲液(New EnglandBiolabs),引物0611260和0611261每种50pmol,dATP、dCTP、dGTP和dTTP每种200μM,1.5μL100%DMSO(New England Biolabs),以及1个单位的PhusionTMHigh Fidelity DNA聚合酶(New England Biolabs)。在
Figure BDA0001451815470000784
(EppendorfScientific)中进行PCR,程序为98℃ 2分钟的1个循环,随后是每个为98℃ 30秒,55℃ 30秒和72℃ 1分30秒的35个循环,及72℃ 7分钟的最后延伸。热循环后,以TBE缓冲液中0.8%琼脂糖凝胶电泳来分离PCR反应产物,其中约1019bp的PCR产物被从胶上切下并根据制造商的说明使用
Figure BDA0001451815470000785
Gel Extracttion试剂盒(Qiagen)从琼脂糖中纯化。所得到的PCR片段的总长度为约1019bp,在该片段的5’末端有NotI限制性位点,3’末端有ApaI限制性位点。
用引物0611256和0611261通过PCR将1019bp的片段融合至1433bp的TDH3启动子/TKL终止子片段下游,产生约2405bp的片段。PCR反应体系(50μL)含有125ng 1433bp片段,90ng 1019bp片段,1X Phusion HF缓冲液(New England Biolabs),引物0611256和0611261每种50pmol,dATP、dCTP、dGTP和dTTP每种200μM,1.5μL 100%DMSO(New EnglandBiolabs),以及1个单位的PhusionTMHigh Fidelity DNA聚合酶(New England Biolabs)。在
Figure BDA0001451815470000791
(Eppendorf Scientific)中进行PCR,程序为98℃ 2分钟的1个循环,随后是每个为98℃ 30秒,55℃ 30秒和72℃ 2分钟的35个循环,及72℃ 7分钟的最后延伸。热循环后,以TBE缓冲液中0.8%琼脂糖凝胶电泳来分离PCR反应产物,其中约2405bp的PCR产物被从胶上切下并根据制造商的说明使用
Figure BDA0001451815470000792
GelExtracttion试剂盒(Qiagen)从琼脂糖中纯化。
将所得到的2405bp的片段,其包含用于在位于TDH3启动子/TAL终止子构建体下游adh9091基因座发生整合的3’侧翼,克隆进pCR2.1-TOPO载体中,并使用TOPO TA CloningKiT(Invitrogen)根据制造商说明转化进One-Shot Top10大肠杆菌细胞中。将转化体涂布于2X YT+amp平板上,37℃孵育过夜。通过AvaI消化来筛选到一些有所期望的PCR产物的正确插入的所得的转化体。产生所需大小条带的克隆被确认并命名为pGMEr113。质粒pGMEr113包含用于在东方伊萨酵母adh9091位点发生同源重组的3’侧翼,及其前面的空的表达盒TDH3启动子/TKL终止子。
用引物0611264和0611284从质粒pHJJ27(图21)中扩增URA3ORF的截短的3’片段,URA3终止子和URA3启动子(如上所述,当整合进酵母宿主后,用作重复区域以环出标记)。PCR反应体系(50μL)含有15ng pHJJ27质粒DNA,1X Phusion HF缓冲液(New EnglandBiolabs),引物0611264和0611284每种50pmol,dATP、dCTP、dGTP和dTTP每种200μM,1.5μL100%DMSO(New England Biolabs),以及1个单位的PhusionTMHigh Fidelity DNA聚合酶(New England Biolabs)。在
Figure BDA0001451815470000793
(EppendorfScientific)中进行PCR,程序为98℃ 2分钟的1个循环,随后是每个为98℃ 30秒,55℃ 30秒和72℃ 1分30秒的35个循环,及72℃ 7分钟的最后延伸。热循环后,以TBE缓冲液中0.8%琼脂糖凝胶电泳来分离PCR反应产物,其中约1324bp的PCR产物被从胶上切下并根据制造商的说明使用
Figure BDA0001451815470000794
Gel Extracttion试剂盒(Qiagen)纯化。所得到的PCR片段的总长度为约1324bp,在其5’端有NheI限制性位点,3’端则有ApaI和SfoI限制性位点。
将上述凝胶纯化的1324bp片段克隆进pCR2.1-TOPO载体中,使用TOPO TA CloningKiT(Invitrogen)根据制造商说明转化进One-Shot Top10大肠杆菌细胞中。将转化体涂布于2X YT+amp平板上,37℃孵育过夜。通过HindIII消化来筛选到一些有所期望的PCR产物的正确插入的所得的转化体。产生所需大小条带的克隆被确认并命名为pGMEr109。质粒pGMEr109包含URA3ORF的3’片段和URA3终止子,其后是URA3启动子。质粒pGMEr109中URA3基因3’片段的上游部分与克隆进质粒pGMEr108的截短的5’URA3片段的末端具有460bp的同源性。该同源区域允许该基因的这两个部分发生重组,以在用含有这两个片段的构建体对宿主进行共转化时,能产生功能性的选择标志物。
用KpnI消化质粒pGMEr109,然后根据制造商说明用酶DNA聚合酶I,大(Klenow)片段(New England Biolabs)进行处理。将得到的线性化质粒(含有平末端)用限制性酶BamHI消化。以TBE缓冲液中0.8%琼脂糖凝胶电泳来分离产物,其中5247bp的载体片段被从胶上切下并根据制造商的说明使用
Figure BDA0001451815470000801
Gel Extracttion试剂盒(Qiagen)从琼脂糖中纯化。
用BamHI和EcoRV来消化质粒pGMEr113,得到2466bp的片段,该片段具有构建体TDH3启动子/TKL终止子,其后为URA3ORF的截短3’片段和URA3终止子,其后为URA3启动子。以TBE缓冲液中0.8%琼脂糖凝胶电泳来分离双限制性酶切反应产物,其中约2466bp的载体片段被从胶上切下并根据制造商的说明使用
Figure BDA0001451815470000802
Gel Extracttion试剂盒(Qiagen)从琼脂糖中纯化。2644bpBamHI和EcoRV消化片段随后被连接进来自质粒pGMEr109的5247bp载体片段。连接反应设置为包含3μL 5247bp的线性载体,3μL2466bp的插入片段,3μL无菌dd水,10μL 2X Quick Ligation反应缓冲液以及1μL Quick T4DNA连接酶(NewEngland Biolabs),根据制造商说明来实施。
根据制造商说明,将5μL连接反应产物转化到大肠杆菌
Figure BDA0001451815470000803
Ultracompetent Cells(Agilent Technogogies)中。将转化体涂布于2X YT+amp平板上,37℃孵育过夜。通过XbaI和PacI消化来筛选到一些有所期望的PCR产物的正确插入的所得的的转化体。产生所需大小条带的克隆通过测序被确认并命名为pGMEr121(图6)。
质粒pGMEr121含有东方伊萨酵母URA3标记的3’末端,其后为相应的URA3启动子,TDH3启动子,TKL终止子和adh9091位点的3’侧翼区域。
实施例2G:东方伊萨酵母CNB1的构造
如下所述,从东方伊萨酵母CD1822中构建东方伊萨酵母CNB1(对于从东方伊萨酵母ATCC PTA-6658中生产东方伊萨酵母CD1822,见实施例1A)。菌株CD1822中含有的URA3基因的两个拷贝都被缺失以允许该基因能够成为遗传工程的选择标志物。URA3是酵母遗传学中的一种多用途标志物,这是由于该基因无论是存在(在尿嘧啶缺失的培养基上生长)还是缺失(在5-氟乳清酸存在的情况下生长)都可以用于选择。通过利用选择盒进行替换来破坏其中一个URA3基因,所述选择盒含有MEL5选择标志物,其侧翼为重复DNA序列。对检测为MEL5选择盒阳性的菌株就MEL5标记基因的缺失进行筛选。然后通过在5-氟乳清酸存在的情况下生长来选择第二个URA3基因缺失。
用2.8μg经SacI/PspOMI消化的载体pMI458(图27)的DNA转化CD1822。质粒pMI458含有酿酒酵母(S.cerevisiae)MEL5基因(SEQ ID NO:255),该基因位于东方伊萨酵母PGK启动子的调控之下(P-loPGK,SEQ ID NO:247),其侧翼分别是与东方伊萨酵母URA3基因上游序列(P-loURA3,SEQ ID NO:253)和下游序列(T-loURA3,SEQ ID NO:254)同源的DNA片段。P-loURA3和T-loURA3的相对取向与在东方伊萨酵母基因组中相同的。在30℃下,5天后获得了大约500个Mel+菌落。通过接种至10mL BFP(Butterfield磷酸缓冲液)管中,取出25μL涂布在DM1-X-α-gal平板上而单菌落分离了10个菌落。然后挑取从各个初步分离物中得到的单个蓝色菌落,置于YPD上以进行进一步分析。
使用PCR来从转化体中筛选所期望的基因事件。为了获得在PCR筛选中作为模板使用的基因组DNA,从1.5mL过夜培养物中将细胞旋转沉降至带螺旋帽的微量离心管中,重悬于0.2mL 2%的Triton X-100,1%SDS,100mM NaCl,10mM Tris-HCl,pH为8.0,1mM的乙二胺四乙酸二钠pH 8.0的溶液中。添加用10mM Tris pH8.0/1mM EDTA(Sigma)平衡0.2mL苯酚:氯仿:异戊醇(25:24:1)混合物和0.3g玻璃珠。用Mini-BeadBeater-8(BioSpec)将管子全速振荡2分钟。加入0.2mL TE,简短地旋涡振荡管子。通过在16100×g下离心5分钟来分离水相。将上清液移到新的管中,加入1mL 100%的乙醇。将该管在20℃下放置30分钟,在16100×g下离心5分钟,将液体倒出。风干DNA,重悬于500μL TE中。
利用引物oCA405和oCA406来对所期望的5’交叉进行PCR筛选,这将产生1.5kbp的产物。对于所期望的3’交叉的筛选则使用引物WG26和CM647,这产生1.6kbp的产物。用来构建pMI458的URA3区域外的引物(上游或下游远端)是oCA405和CM647,其在野生型中产生3.2kbp的产物,而在pMI458被破坏的等位基因中产生5.0kbp的产物,当选择标志物被环出时产生2.2kbp的产物。这些PCR反应都使用55℃的退火温度。同样可以使用四引物方法通过PCR来筛选URA3开放阅读框的缺失。引物pJLJ28和pJLJ29扩增肌动蛋白基因的800bp片段,引物pJLJ30和pJLJ31扩增URA3基因的600bp片段。在一个反应中使用所有这些引物提供阳性内部对照(肌动蛋白片段)。按照生产商的操作步骤使用来自于Roche的Taq DNA聚合酶,退火温度为61℃。确认MEL5选择盒整合到URA3位点上的是菌株1822ura het MEL-1和1822ura het MEL-2。
然后通过允许在KtSEQ1a(SEQ ID NO:256)和KtSEQ1b(SEQ ID NO:257)之间发生重组,将MEL-5标志物从1822ura het MEL-1和1822ura het MEL-2的基因组中移除。MEL+菌株在YPD培养基中生长过夜,直至OD600约为0.5至2.0。然后在YPD培养基中稀释培养物,使其OD600值回到约0.00001。将200μL培养物稀释液转移到96孔微量滴定板的每个孔中。用具有黏性的覆盖物覆盖平板,在30℃培养箱中孵育,以最大搅拌6-7小时(约6次细胞分裂,取决于菌株的生长速率)。从每个孔中取出100μL(约为~1000cfu每平板)涂布在DM1+X-α-gal培养基上。将平板孵育在30℃下过夜,或者在室温下2天,观察不同的颜色。将白色菌落(推定为mel-)在类似的培养基上划线,如上所述通过PCR进行筛选。发现了两个独立的环出,一个来自于1822ura het MEL-1,保藏为1822ura het MEL-1,另一个来自于1822ura hetMEL-2,保藏为1822ura het MEL-2。奇怪的是,所获得的大部分白色菌落均没有给出预期的2.2kbp条带。
为了得到ura-衍生体,在YP5D培养基上(YP+100g/L右旋糖)培养1822ura hetmel-1和1822ura het mel-1过夜,过夜培养物的等分试样(0.5,5和50μL)涂布于ScD-2XFOA平板上,对FOA-抗性的菌落划线以得到单菌落,通过在ScD-ura平板上涂布来证实ura-表型。从1822ura het mel-1中挑取2个菌落,从1822ura het mel-2中挑取6个菌落以进行进一步分析。这些菌落在YPD中生长过夜,使用上述的酚/氯仿法提取基因组DNA。
通过PCR筛选URA3开放阅读框的存在,8个菌株中均不含有URA3基因。1822ura hetmel-1的两个ura后代命名为yJLJ3(CNB1)和yJLJ4。基于基因组测序,确定yJLJ3(CNB1)和yJLJ4含有URA3基因及附近透酶基因的缺失;优选只有URA3基因被缺失。为了构建CD1822的ura3营养缺陷型而不破坏该透酶基因,用1μg SacI/ApaI消化的pCM208(图28)转化CD1822。质粒pCM208含有与东方伊萨酵母URA3基因的上游(5’URA侧翼(附近),SEQ ID NO:258)和下游(3’URA侧翼(附近),SEQ ID NO:259)侧翼区域同源的DNA序列。在30℃下培养5天后,获得大约200个Mel+菌落。通过在ScD X-α-gal平板上划线分离出8个蓝色菌落。使用PCR来就期望的基因事件筛选转化体。使用引物oJY11和oJY12来进行5’交叉筛选,这将在所期望的转化体中产生0.9kbp的产物。使用引物oJY13和oJY14来进行3’交叉筛选,这将在所期望的转化体中产生1.0kbp的产物。8个克隆中有3个显示了所期望的PCR产物。这些菌落的MEL标记可被环出,并如上文所述,缺失第二URA3基因。或者,衍生自yJLJ3或yJLJ4的菌株中的URA3和透酶基因的缺失能够在一步转化中被修复,如实施例2H中所述。
实施例2H:含有URA3选择标志物的MBin500对照菌株的构建
如前所述,由于其URA3基因的纯合缺失,本文所使用的命名为CNB1的东方伊萨酵母菌株,是尿苷营养缺陷型。使用ura修复载体,pJLJ62(图26),能够对URA3基因座进行杂合修复,该载体含有ura修复盒,其由URA3基因及691bp的5’侧翼DNA,1500bp的3’侧翼DNA构成。ura修复盒的侧翼是5’的NotI限制性位点,3’的ApaI限制性位点。使用NotI和ApaI进行限制性消化,以从载体骨架中移除2796bp的ura修复盒。使用QIAquick PCR PurificationKiT(Qiagen),根据制造商的说明对消化物进行纯化。将DNA洗脱至玻璃蒸馏水中,用1μg来转化东方伊萨酵母CNB1。在ura选择平板上选择转化体,不需要补充尿苷的单菌落被命名为MBin500。
实施例2I:移除URA3选择标志物
为了分离其中URA3选择标志物通过存在于整合盒中的两个URA3启动子区域的重组而被移除的菌株,将目的ura+菌株接种至3mL YP+10%葡萄糖的培养基中,在37℃下,以250rpm振荡培养至少4小时至过夜。取出50-100μL培养物涂布在ScD FOA平板上,在37℃下生长48-60h直到菌落出现。由于FOA可被URA3蛋白转化成毒性化合物,导致ura+细胞的死亡,因此可在FOA上生长来选择URA3标记的移除。通过在YPD平板上,37℃下生长来对几个FOA-抗性菌落纯化两次。如本文所述,然后通过PCR对这些纯化的分离物进行URA3适当环出的筛选。
实施例2J:对摇瓶中生长的修饰的酵母菌株进行十二烷基磺酸钠聚丙烯酰胺凝胶 电泳(SDS-PAGE)分析和酶分析的步骤
将4mL ura选择培养基加入到14mL Falcon管中,用无菌环将所期望的菌株接种到该培养基中。在37℃下以250rpm振荡培养该培养物过夜(~16hrs)。对于含有至少一个东方伊萨酵母基因座野生型拷贝的菌株,将500μL过夜培养物加入到125mL含有25mL YP+10%葡萄糖培养基的挡板瓶中。对于pdcΔ/pdcΔ菌株,将1mL过夜培养物加入到125mL含有25mL液体YP+100g/L葡萄糖培养基的挡板瓶中。在37℃下以250rpm振荡培养该瓶培养物。大约每隔一小时从培养物中取出小量等分试液,测量OD600。使培养物生长,直至OD600值为4至6之间。
为了制备用于SDS-PAGE分析的细胞的小样本,从培养物中取出对应2.5OD单位的体积的培养物,并置于1.5mL管中。在16100×g下沉淀细胞,移除上清液,细胞沉淀储藏于-20℃直至使用。
在室温下以2279×g离心来收获培养瓶中剩余的细胞,将沉淀重悬于12.5mL0.85M NaCl中,然后在室温下以2279×g离心。将沉淀重悬于1mL 0.85M NaCl中,将重悬细胞转移到2.0mL管中,然后在16100×g下沉淀。然后移除上清液,如果能在一周之内就可以使用以进行酶测定,则将沉淀储藏于-20℃下,或者在-80℃下进行更长期储藏。
对于对应2.5OD单位的细胞沉淀的SDS-PAGE分析,将细胞重悬于100dH2O中,然后加入100μL 0.2M NaOH。将样品在室温下孵育5分钟,然后16100×g离心沉淀细胞,重悬于100μL SDS样品缓冲液中(Bio-Rad Laboratories)。将样品在95℃下加热5分钟,简单地离心以沉淀细胞。根据制造商的说明,在Criterion 8-16%Pre-Cast凝胶(Bio-RadLaboratories)上对1至5μL的上清液进行分析。用InstantBlueTM Coomassie-BasedStaining Solution(Expedeon Protein Solutions,San Diego,CA,USA)显色条带。
实施例2K:用于产品分析的修饰酵母菌株的摇瓶培养步骤
在Ura选择平板上对菌株进行划线以得到单菌落,在30℃下培养1-2天。将来自于Ura选择平板上的1-2个菌落接种到含有50mL CNB1摇瓶培养基的250mL挡板瓶中,以制备种子培养物。种子培养物在30℃下,以200rpm振荡培养约18小时。然后取出培养物的小量等分试液来测定OD600值,直至OD600达到4至6。使用
Figure BDA0001451815470000851
Reagent StriP(Bayer,Elkhart,IN,USA)来测量残余存在的葡萄糖。使用种子瓶培养来接种到含有50mL CNB1摇瓶培养基的125mL挡板瓶中,至OD600=0.2。培养物在30℃下,140rpm下振荡孵育20小时。移除培养液的样品以进行如下所述的分析。使用样品的等分试样来测量培养物的光密度(OD),并使用
Figure BDA0001451815470000852
Reagent Strip来测量残余的葡萄糖。然后将剩余的样品进行离心,使用上清液进行产品分析。
实施例2L:用于产品分析的修饰酵母菌株发酵的步骤
使用种子繁殖阶段来培养本文所描述的菌株,然后在2L的生物反应器(Applikon,Foster City,CA,USA)中再进行单阶段发酵。
对于种子阶段的制备,将25mL 1X DM2培养基(用KOH调整至所需的pH值)加入到125mL挡板瓶中,然后用无菌环接种目的菌株。在所需的温度下,250rpm振荡培养培养物过夜约16hr。然后每隔约一小时取出培养物的小量等分试液,测定OD600值直至OD600达到4-6。
使用
Figure BDA0001451815470000853
Reagent StriP(Bayer,Elkhart,IN,USA)来测量存在的残余的葡萄糖。然后将12mL培养物加入到4mL无菌冷冻的75%甘油中,彻底混匀,在冰上孵育10分钟。随后将培养物和甘油的混合物混匀,等分为10份,每份1.0mL放置于1.8mL冷冻管中(ThermoScientific,Rochester,NY,USA),储藏在-80℃下。
使用25mL种子瓶培养接种到含有1.5L DM2培养基的2L生物反应器中。在约30℃-40℃的温度下,控制pH值在2.0-7.0的范围内,在搅拌条件下以及导致氧气吸收速率(OUR)在2-45mmol/L/hr范围内的通气条件下,在该生物反应器中进行发酵。在本文所示的实施例中,生物反应器中培养物的温度,pH和OUR分别是30℃,4.0和25-30。
定期移除发酵液样品以进行分析。简单地说,使用样品的等分试液测量培养物的光密度(OD),葡萄糖浓度和pH。然后将剩下的样品离心。沉淀物储藏于-80℃用于酶分析,上清液用于进行3-HP和其他胞外化合物的分析。除另有指明之外,本文中所报告的所有3-HP生产值均是发酵的48-小时时间点的生产值。在发酵过程中的二氧化碳生成量和氧气消耗是通过确定从生物反应器中排出的气体中的二氧化碳含量和氧气含量来进行测定的。
实施例2M:对修饰酵母菌株所产生的3-HP和β-丙氨酸的分析步骤
通过在1%甲酸中稀释10倍来酸化培养物样品,并且通过0.46μm的96孔滤板来进行过滤。根据样品中的分析物浓度在水中进行进一步稀释。在样品缓冲液中进一步稀释10倍,该缓冲液为1mM NH4Ac,0.1%NH3和5mg/L的一律用13C标记的3-HP(作为3-HP的内标),或者1%甲酸和3mg/L一律用13C标记的β-丙氨酸(作为β-丙氨酸的内标)。总稀释倍数为约100至1000,取决于β-丙氨酸或3-HP的浓度。
将2μL样品注入Agilent 1200HPLC(Agilent)中,由MassHunter程序与Agilent6410Triple Quad MS/MS检测器控制,使用的仪器设置和栏目在表6中列出。定量离子碎片峰面积与其稳定同位素对应物(来自于内标)之间的比值可用于定量,以消除离子的抑制效应和仪器漂移。在日常检测中,标准偏差为低于5%。
表6:用于β-丙氨酸和3-HP分析的LC/MS/MS设置
Figure BDA0001451815470000861
实施例3:表达3-HP发酵途径基因的修饰酵母菌株
在酵母宿主细胞中表达编码涉及3-HP不同发酵途径中的酶的一个或多个基因,其为单独表达或组合表达。3-HP途径酶可以从外源基因,内源基因或其一些组合来进行表达。利用基因表达构建体将要表达的外源基因引入酵母细胞中,例如,如实施例2中所描述的表达构建体。外源基因可在一个单一的位点或多个位点整合进宿主酵母的基因组中,并且外源基因的整合伴随着插入位点的目的基因的缺失或破坏,如下所述。
实施例3A:表达天冬氨酸/丙二酸半醛途径基因的修饰酵母菌株
通过利用PEP和/或丙酮酸,OAA,天冬氨酸,β-丙氨酸,丙二酸半醛中间体的途径来产生3-HP的酵母细胞可以通过表达一个或多个参与该途径的酶来进行工程改造。表达的基因包括一个或多个PPC,PYC,AAT,ADC,BAAT,gabT,3-HPDH(包括丙二酸半醛还原酶),HIBADH,或4-羟基丁酸酯脱氢酶基因。
所表达的基因可以衍生自宿主细胞的天然基因。例如,当宿主酵母细胞是东方伊萨酵母时,所表达的基因可以衍生自东方伊萨酵母PYC(例如,编码如SEQ ID NO:2所示的氨基酸序列的和/或包括如SEQ ID NO:1所示核苷酸序列编码区的东方伊萨酵母PYC基因),AAT(例如,编码如SEQ ID NO:14所示的氨基酸序列的和/或包括如SEQ ID NO:13所示核苷酸序列编码区的东方伊萨酵母AAT基因),BAAT(例如,编码如SEQ ID NO:20所示的氨基酸序列的和/或包括如SEQ ID NO:19所示核苷酸序列编码区的东方伊萨酵母pyd4同源基因),或3-HPDH(例如,编码如SEQ ID NO:26所示的氨基酸序列的和/或包括如SEQ ID NO:25所示核苷酸序列编码区的与东方伊萨酵母YMR226C同源的基因)。当酵母宿主细胞是另外的3-HP耐受酵母菌株时,可以使用本领域已知技术来获得基因序列,途径基因的天然同源物能够被外源表达或者与外源调节元件连接来进行表达。天然途径基因可以包括一个或多个PPC,PYC,AAT,BAAT和/或3-HPDH基因。
或者,一个或多个表达的3-HP基因可来自于源基因,该源基因对于宿主细胞而言是非天然的。例如,当酵母宿主细胞是东方伊萨酵母时,可以对该细胞进行工程改造以表达一个或多个非天然的PYC基因,如编码如SEQ ID NO:3所示氨基酸序列的类球红细菌(R.sphaeroides)PYC基因,编码如SEQ ID NO:4所示氨基酸序列的菜豆根瘤菌(R.etli)PYC基因,编码如SEQ ID NO:5或6所示氨基酸序列的荧光假单胞菌(P.fluorescens)PYC基因,编码如SEQ ID NO:7所示氨基酸序列的谷氨酸棒杆菌(C.glutamicum)PYC基因,或编码如SEQ ID NO:8所示氨基酸序列的苜蓿中华根瘤菌(S.melioti)PYC基因;一个或多个非天然PPC基因,例如编码如SEQ ID NO:10所示氨基酸序列的大肠杆菌(E.coli)PPC基因,编码如SEQ ID NO:11所示氨基酸序列的嗜热碱甲烷杆菌(M.thermoautotrophicum)PPC基因,编码如SEQ ID NO:12所示氨基酸序列的产气荚膜梭菌(C.perfringens)PPC基因;一个或多个非天然AAT基因,如编码如SEQ ID NO:16所示氨基酸序列的大肠杆菌aspC基因,或编码如SEQID NO:15所示氨基酸序列的酿酒酵母(S.cerevisiae)AAT2基因;一个或多个非天然ADC基因,如编码如SEQ ID NO:17所示氨基酸序列的(和/或包含如SEQ ID NO:130,145,146或147所示核苷酸序列的编码区的)阿维链霉菌(S.avermitilis)PanD基因,编码如SEQ ID NO:18所示氨基酸序列的(和/或包含如SEQ ID NO:131所示核苷酸序列的编码区的)丙酮丁醇梭菌(C.acetobutylicum)PanD基因,编码如SEQ ID NO:133所示氨基酸序列的(和/或包含如SEQ ID NO:132所示核苷酸序列的编码区的)幽门螺旋杆菌(H.pylori)ADC基因,编码如SEQID NO:135所示氨基酸序列的(和/或包含如SEQ ID NO:134所示核苷酸序列的编码区的)芽孢杆菌属(Bacillus sp)TS25ADC基因,编码如SEQ ID NO:137所示氨基酸序列的(和/或包含如SEQ ID NO:136所示核苷酸序列的编码区的)谷氨酸棒杆菌(C.glutamicum)ADC基因,编码如SEQ ID NO:139所示氨基酸序列的(和/或包含如SEQ ID NO:138,148,149,150或151所示核苷酸序列的编码区的)地衣芽孢杆菌(B.licheniformis)ADC基因;一个或多个非天然BAAT或gabT基因,如编码如SEQ ID NO:21所示氨基酸序列的(和/或包含如SEQ ID NO:142所示核苷酸序列的编码区的)克鲁维酵母pyd4基因,编码如SEQ ID NO:22所示氨基酸序列的(和/或包含如SEQ ID NO:140所示核苷酸序列的编码区的)阿维链霉菌BAAT基因,编码如SEQ ID NO:23所示氨基酸序列的阿维链霉菌gabT基因,或编码如SEQ ID NO:24所示氨基酸序列的(和/或包含如SEQ ID NO:141所示核苷酸序列的编码区的)酿酒酵母UGA1基因;一个或多个非天然3-HPDH基因,如编码如SEQ ID NO:27所示氨基酸序列的(和/或包含如SEQID NO:143所示核苷酸序列的编码区的)大肠杆菌ydfG基因,或编码如SEQ ID NO:129所示氨基酸序列的(和/或包含如SEQ ID NO:144所示核苷酸序列的编码区的)酿酒酵母YMR226C基因;一个或多个非天然的丙二酸半醛还原酶基因,如编码如SEQ ID NO:29所示氨基酸序列的(和/或包含如SEQ ID NO:343所示核苷酸序列的编码区的)嗜热金属球菌丙二酸半醛还原酶基因;一个或多个非天然HIBADH基因,如编码如SEQ ID NO:28所示氨基酸序列的粪产碱菌(A.faecalis)M3A基因,编码分别如SEQ ID NO:30或SEQ ID NO:31所示氨基酸序列的恶臭假单胞菌(P.putida)KT2440或E23440mmsB基因,或者编码如SEQ ID NO:32所示氨基酸序列的铜绿假单胞菌(P.aeruginosa)PAO1 mmsB基因;和/或一个或多个非天然4-羟基丁酸脱氢酶基因,如编码如SEQ ID NO:33所示氨基酸序列的R.eutropha(R.eutropha)H164hbd基因,或编码如SEQ ID NO:34所示氨基酸序列C.kluyver DSM 555hbd基因。
实施例3A-0:表达天冬氨酸/丙二酸半醛途径基因的修饰酵母菌株的酶活测定
制备用于酶测定的粗制无细胞提取物(CFE)
通过离心来收集本发明所示的来自于摇瓶或生物反应器培养物中的细胞,弃去上清液,如上所述,将细胞沉淀储藏于-80℃下。为了制备CFE,将细胞沉淀物解冻,用磷酸盐缓冲液(PBS)洗涤,再一次离心收集。弃去上清液,在2.0mL微量离心管中,将细胞沉淀重悬于大约等体积的裂解缓冲液中,该裂解缓冲液含有1%的蛋白酶抑制剂Cocktail,来自于Sigma的P8215。加入约300μL 0.5mm的氧化锆珠(BioSpec),在
Figure BDA0001451815470000891
裂解器(MPBiomedicals)中以6/20秒的设定进行3轮细胞裂解。在每轮之间,将样品管置于冰上冷却5分钟。裂解之后,在微量离心管中,4℃下,以最大速度对样品离心15分钟。将上清液转移到新的1.5mL管中,并保持在冰上。根据制造商提供的说明,使用Bio-Rad蛋白质测定试剂(Bradford测定)对裂解液中的总蛋白浓度进行确定,用牛血清蛋白作为标准品。
丙酮酸羧化酶活性(PYC)活性:
本文所示细胞的CFE中的丙酮酸羧化酶的活性测定如下。制备储备反应混合溶液,当在测定反应混合物中与CFE组合时,该混合溶液提供的组分的最终浓度如下:Tris(pH8.0),100mM;NaHCO3,10mM;MgCl2,5mM;NADH,0.2mM;ATP,1mM;乙酰CoA,1mM;丙酮酸,1mM;生物素(如果测定PYC酶时需要),5μM;牛心苹果酸脱氢酶,0.02单位/mL。将270μL该混合物加入到96孔微量滴定板的孔中,加入30μL经过适当稀释的CFE以开始反应。使用SpectraMax340PC酶标仪监测340nm处的NADH消耗量。丙酮酸羧化酶的活性表示为nmol NADH消耗/秒/mg蛋白质。
磷酸烯醇丙酮酸羧化酶(PPC)活性:
CFE中的磷酸烯醇丙酮酸羧化酶(PPC)的活性测定如下。制备储备反应混合溶液,当在测定反应混合物中与CFE组合时,该混合溶液提供的组分的最终浓度如下:Tris(pH8.0),100mM;NaHCO3,10mM;MgCl2,5mM;NADH,0.1mM;乙酰CoA,0.5mM;磷酸烯醇丙酮酸,3.3mM;牛心(或猪心)苹果酸脱氢酶,0.02单位/mL。将270μL该混合物加入到96孔微量滴定板的孔中,加入30μL经过适当稀释的CFE以开始反应。使用SpectraMax 340PC酶标仪监测340nm处的NADH消耗量。
天冬氨酸转氨酶(AAT)活性:
本文所示细胞的CFE中的天冬氨酸转氨酶的活性测定如下。制备储备反应混合溶液,当在测定反应混合物中与CFE组合时,该混合溶液提供的组分的最终浓度如下:100mMTris(pH8.0),100mM;NaHCO3,10mM;MgCl2,5mM;NADH,0.1mM;天冬氨酸,1mM;α-酮戊二酸,1mM;苹果酸脱氢酶,0.02单位/mL。在一些测定中,储备反应混合物还含有吡哆醛5’磷酸(0.1mM)。将270μL该混合物加入到96孔微量滴定板的孔中,加入30μL经过适当稀释的CFE以开始反应。使用SpectraMax 340PC酶标仪监测340nm处的NADH消耗量。天冬氨酸转氨酶的活性表示为nmoles NADH消耗/秒/mg蛋白质。
天冬氨酸脱羧酶(ADC)活性:
本文所示细胞的CFE中的天冬氨酸脱羧酶的活性测定如下。在恒温37℃下,将165μL 100mM NH4Ac缓冲液(pH6.8)和25μL 80mM的天冬氨酸加入到96孔微量滴定板的每个孔中。加入10μL CFE以起始反应。在不同的时间间隔(5,10,15,20,25,30,40,60分钟),从反应混合物中取出20μL样品,加入到180μL淬灭缓冲液中(2%的甲酸以及2mg/L的13C标记β-丙氨酸作为内标)。过滤之后,用LC/MS/MS分析样品中的β-丙氨酸。从β-丙氨酸相对于时间的曲线图中获取斜率。通过斜率除以反应中总细胞蛋白浓度来计算活性。ADC的活性表示为μmolβ-丙氨酸形成/秒/g蛋白质。
在一些具体实验中则使用修改的ADC测定法。在这些情况下,本文所示细胞的CFE中的天冬氨酸转氨酶的活性测定如下。将110μL 100mM NH4Ac缓冲液(pH7.6)和80μL 25mM的天冬氨酸(用NaOH中和之后)加入到恒温40℃的96孔微量滴定板的每个孔中。加入10μLCFE以起始反应。在不同的时间间隔(2,4,6,8,10分钟),从反应混合物中取出20μL样品,加入到180μL淬灭缓冲液中(2%的甲酸以及2mg/L的13C标记β-丙氨酸作为内标或者在2%的甲酸中淬灭,然后按比例1:10转移至含有2mg/L的13C标记β-丙氨酸作为内标的20%甲醇/80%水中)。过滤之后,用LC/MS/MS分析样品中的β-丙氨酸。从β-丙氨酸相对于时间的曲线图中获取斜率。通过斜率除以反应中总细胞蛋白浓度来计算活性。ADC的活性表示为μmolβ-丙氨酸形成/秒/g蛋白质。
β-丙氨酸转氨酶(BAAT)活性
CFE中的β-丙氨酸转氨酶(BAAT)的活性测定如下。在室温下,将190μL含有100mMNH4HCO3(pH7.6),8mMα-酮戊二酸,0.5mM乙酰CoA,0.1mM吡哆醛-5'-磷酸和200mMβ-丙氨酸的反应混合物加入到96孔微量滴定板中。加入10μL CFE以起始反应。在2,4,6,8,10,12,15和20分钟时,从反应混合物中取出20μL样品,并加入到75μL淬灭缓冲液中(2.5%的甲酸)。中和样品,通过加入5μL 10M的NaOH和50μL 100mM的NaCO3(pH10)来控制pH值。在注射时将过滤后的样品与OPA(临苯二甲醛)试剂,10mg/mL(Agilent Technologies 5061-3335)混合,以衍生化样品。在HPLC分离之后,通过荧光检测(激发波长340nm;发射波长460nm)对用OPA衍生化的谷氨酸进行定量。将15μL样品注射到5μm包装的反相Gemini C18分析柱中(Phenomonex150×4.6mm)。在62.5%20mM的磷酸缓冲液(pH7.8)(A)和37.5%甲醇(B)中平衡该柱。线性梯度如下所示:坡增(ramp)至40%B,0-0.3分钟;40%B,0.3-1分钟;坡增至85%B,1-1.75分钟;85%B,1.75-2.25分钟;坡增至37.5%,2.25-3分钟;37.5%B,3-4分钟。流速为2mL/分钟。反应缓冲液中谷氨酸的标准曲线用于确定样品中的浓度。从[谷氨酸]相对于时间的曲线图中获取斜率。通过斜率除以反应中总细胞蛋白浓度来计算活性。
3-HP脱氢酶(3-HPDH)活性
本文所示细胞的CFE中的3-HP脱氢酶的活性测定如下。将190μL稀释于(通常是100倍稀释)100mM NH4HCO3(pH7.6)中的CFE和NADPH加入到恒温37℃的96孔微量滴定板的每个孔中。通过加入10μL 60mM的丙二酸半醛(从在10mM H2SO4中的200mM MSA储备溶液在10mMH2SO4中制备)来起始反应。在1,2,4,6,8,10和12分钟时,从反应混合物中取出每份20μL样品,在80μL沸水中淬火。冷却之后,用75μL含有2mM NH4Ac(pH6.8)和3mg/L 13C标记的3-HP的缓冲液与75μL淬火混合物进行混合。过滤之后,用LC/MS/MS定量样品中的3-HP。从3-HP相对于时间的曲线图中获取斜率。通过斜率除以反应中总细胞蛋白浓度来计算活性。3-HP脱氢酶的活性表示为nmol NADPH形成/秒/mg蛋白质。
在一些具体实施方式中使用修改的3-HPDH测定法。在这些情况下,本文所示细胞的CFE中的3-HPDH的活性测定如下。通过测量在340nm处,NADPH随着时间推移而消失来测量丙二酸半醛的还原。根据Yamada和Jzcoby所发现的方法自己合成丙二酸半醛(Yamada,E.W.,Jacoby,W.B.,1960,Direct conversion of malonic semialdehyde to acetyl-coenzyme A,Journal of Biological Chemistry,Volume 235,Number 3,pp.589-594)。该测定在96孔板中实施,最终体积为200μL。将30μL CCE加入到170μL的测定缓冲液(2mM的丙二酸半醛,100nM Tris pH8.0和0.5mM的NADPH)中来起始反应。在室温下(~25℃),在微板读数仪(Spectra Max 340PC,Molecular Devices LLC,Sunnyvale,CA)上追踪340nm处的吸光度10分钟。1个单位的3-HPDH活性被定义为在丙二酸半醛存在的情况下,1分钟内氧化1μmol的NADPH所需的酶量。
实施例3A-1:在adh1202基因座表达天冬氨酸脱羧酶(ADC)的插入载体
为了在东方伊萨酵母中表达,对一些天冬氨酸脱羧酶基因进行了密码子优化,并通过
Figure BDA0001451815470000922
(Burlingame,CA,USA)合成,得到了表7中所列出的质粒。通过XbaI和PacI限制性消化,可使合成基因到达载体pMA-T中,也能使其从载体中引出(elicit)。然后将限制性片段克隆进pMIBa107的相同位置中,将基因置于PDC启动子和终止子的控制之下,并允许其在东方伊萨酵母的adh1202基因座发生整合。
表7:转化体构建体
Figure BDA0001451815470000921
质粒1045172,105387,105388,105389,105390,105391用XbaI和PacI进行消化,使用TBE缓冲液进行1.3%琼脂糖凝胶电泳。每个消化反应中,对应于ADC(panD)基因的400-500bp片段被从凝胶中切割下来,并使用
Figure BDA0001451815470000931
Gel Extract KiT(Qiagen)从琼脂糖中提取。
用XbaI和PacI消化质粒pMIBa107,用小牛肠磷酸酶(New England Biolabs)处理,在TBE缓冲液中进行琼脂糖凝胶电泳后,纯化载体条带。将XbaI和PacI消化后的panD片段用T4DNA连接酶和Quick Ligation KiT(New England Biolabs)根据制造商的说明,连接到这个纯化的pMIBa107载体上。根据制造商的说明,将连接产物转化进XL10-GOLD ULTRA细胞中(Agilent Technologies)。将转化体涂布在2X YT+amp平板上,37℃孵育过夜。每个反应挑取24个转化体至2X YT+amp平板上。通过ApaI,NcoI和SacI消化筛选出所得到的四个转换体每个的小量制备DNA。通过DNA测序来验证产生所需条带大小的克隆的正确性,并如表7所示被命名。所得到的质粒允许以表达盒正向取向的方式使每个ADC基因整合到adh1202基因座上。
大约10μg的每种整合构建体用ApaI和KpnI消化,使用89mM Tirs碱-89mM硼酸-2mM乙二胺四乙酸钠(TBE)缓冲液,在1%琼脂糖凝胶上进行电泳。每个质粒大约4450bp的片段从凝胶中切割下来,根据制造商的说明使用
Figure BDA0001451815470000932
Gel Extract KiT(Qiagen)提取。发现纯化产物的浓度在39-138ng/ul之间。用0.39-1.4μg来自于整合构建体(用ApaI和KpnI消化)的片段转化进东方伊萨酵母CNB1中,如上所述。将转化体涂布在ura选择培养基上,37℃下孵育,在ura选择培养基上重新划线,37℃下孵育。从URA3+菌落中制备基因组DNA,通过PCR检测以验证整合。使用引物0611718和0611632扩增2.5kbp片段来验证整合。每个PCR反应含有2.5μL基因组DNA,引物0611718和0611632各12.5pm,1X Crimson TaqTM反应缓冲液(New England Biolabs),0.2mM dNTP混合物,0.625单位Crimson TaqTM DNA聚合酶(NewEngland Biolabs),最终体积为25μL。扩增反应孵育在
Figure BDA0001451815470000933
Figure BDA0001451815470000934
(Eppendorf Scientific)中,程序为1个循环95℃ 30秒;30个循环的95℃ 30秒,50℃ 30秒和68℃ 3分钟;以及1个循环的68℃ 10分钟。
对于每个构建体,两个证实为URA3的转化体被命名如表7所示。这些菌株在adh1202对于所示的ADC基因是杂合的,所述基因由来自于东方伊萨酵母的PDC启动子和终止子驱动表达。
检测表7中所列出的菌株中(以及MBin500菌株,如上,作为阴性对照)PanD的表达和酶活性。每个菌株的过夜培养物在YPD ON中,37℃下过夜培养,在37℃下,在125mL的挡板瓶中,以1:50稀释到25mL新鲜YPD中,生长至OD600~2-8。然后使用细胞沉淀物来制备CFE,然后如上所述使用该CFE进行ADC活性测定。代表性的结果示于表8中。
表8:转化体酶活性数据
Figure BDA0001451815470000941
接下来,创建yWTY5-17和yWTY7-25的纯合子版本。首先,如上所述分离ura-衍生的yWTY5-17和yWTY7-25。从FOA-抗性菌落中制备基因组DNA,如上所述用PCR进行检查以验证URA3选择标志物的缺失。使用引物0611718和0611632,对于ura标志存在的整合,扩增出2.4kbp的片段,对于ura标志的缺失,则扩增出1100bp的片段。使用引物0611718和0611632,产生1100bp PCR片段的ura-菌株yWTY5-17和yWTY7-25被分别命名为MIBa331和MIBa332。
pWTY10-0033-5和pWTY10-0033-7各10μg用ApaI,KpnI和NcoI进行消化,使用89mMTirs碱-89mM硼酸-2mM乙二胺四乙酸钠(TBE)缓冲液,在1%琼脂糖凝胶上进行电泳。每个质粒大约4450bp的片段从凝胶中切割下来,使用
Figure BDA0001451815470000942
Gel Extract KiT(Qiagen)提取。将来自pWTY10-0033-5和pWTY10-0033-7纯化片段分别转化进MIBa331和MIBa332中,如上所述。将转化体涂布在ura选择培养基上,37℃下孵育过夜,然后在ura选择培养基上重新划线,37℃下孵育过夜。制备基因组DNA,实施Crimson TaqTM PCR来验证整合,如上所述。使用引物0611718和0611632,对于ura标志存在的整合,扩增出2.4kbp的片段,对于ura标志的缺失,则扩增出1100bp的片段。使用引物0611718和0611632,产生1100bp和2.4kbp PCR片段的MIBa331和MIBa332转化体被保存并分别命名为MIBa338和MIBa337。MIBa337在adh1202基因座是来自于阿维链霉菌的ADC基因纯合子,MIBa338则在adh1202基因座是来自于地衣芽孢杆菌的ADC基因纯合子。两个菌株都具有各自的ADC位于来自于东方伊萨酵母的PDC启动子和终止子的调控之下。
将来自于panD纯合菌株MIBa337和MIBa338与来自于panD杂合菌株yWTY5-17和yWTY7-25的ADC表达和酶活进行比较。培养物在YPD中以37℃下培养过夜,然后在37℃下,在125mL的挡板瓶中,以1:50稀释到25mL新鲜YPD中,生长至OD600~2-8。使用细胞沉淀物来制备CFE,然后如上所述使用该CFE进行ADC活性测定。两个独立实验的代表性的结果示于表9A中。
表9A:转化体酶活数据
Figure BDA0001451815470000951
第三个独立实验,即从菌株MIBa337和MIBa338制备的CFE中的ADC活性比较的结果示于表9B中。
表9B:转化体酶活数据
Figure BDA0001451815470000952
上述样品的SDS-PAGE分析表明MIBa338中的panD表达量在这些菌株中是最高的。
使用本发明所描述的方法,在生物反应器中评估菌株MBin500,MIBa337和MIBa338的3-HP产生。对照菌株MBin500没有产生可检测的3-HP(两个独立发酵的平均值)。菌株MIBa337产生了1.33g/L 3-HP(实施了一个发酵),菌株MIBa338产生了3.15g/L 3-HP(三个独立发酵的平均值)。在菌株MIBa337和MIBa338的各个独立发酵中,进一步比较它们的3-HP生产性能和ADC活性(表10)。考虑到这些发酵中细胞量的不同,3-HP生产性能在表10中被记录为3-HP浓度/每单位的细胞量(表示为[g/L 3-HP]/[g/L细胞干重])。该结果显示,使用地衣芽孢杆菌panD基因(菌株MIBa338)要比使用阿维链霉菌的panD基因(菌株MIBa337)具有改进的ADC活性和3-HP生产性能。
表10:菌株MIBa337和MIBa338的3-HP生产性能和ADC活性
Figure BDA0001451815470000961
实施例3A-2:在adh1202基因座表达β-丙氨酸转氨酶(BAAT)或3-羟基丙酸脱氢酶 (3-HPDH)的插入载体
来自于阿维链霉菌的BAAT,来自于酿酒酵母的UGA1,来自于克鲁维酵母的PYD4,来自于酿酒酵母的YMR226c以及来自于大肠杆菌的ydfG,这些基因的东方伊萨酵母密码子优化型式由
Figure BDA0001451815470000963
合成,所得到的质粒在下面列出。这些合成基因通过使用XbaI和PacI消化能够进入到载体pMA-T中,也可以从载体中引出。然后将经消化的片段克隆进pMIBa107的相同位置中,将基因置于PDC启动子和终止子的调控之下,并允许其在adh1202基因座发生整合。
表11:转化体构建体
Figure BDA0001451815470000962
Figure BDA0001451815470000971
质粒1054168,1054169,1054170,1054171,1054172和1054173用XbaI和PacI进行消化,使用89mM Tirs碱-89mM硼酸-2mM乙二胺四乙酸钠(TBE)缓冲液,在1%琼脂糖凝胶上进行电泳。将来自于1045168的761bp片段(ydfG),来自于1045169的1430bp片段(UGA1),来自于1045170的1370bp片段(BAAT),来自于1045171的1442bp片段(PYD4)或来自于1045173的814bp片段(YMR226c)从凝胶中切割下来,使用
Figure BDA0001451815470000972
Gel Extract KiT(Qiagen)从琼脂糖中提取。质粒pMIBa107用XbaI和PacI消化,接着用CIP进行处理,产生7.9kbp的线性片段。消化物用
Figure BDA0001451815470000973
PCR Purification KiT(Qiagen)进行纯化。如本文所述,然后利用T4DNA连接酶将消化后的ydfG,UGA1,BAAT,PYD4或YMR226c片段连接到pMIBa107上(用XbaI和PacI消化,并用CIP处理)。根据制造商的说明将连接产物转化至One
Figure BDA0001451815470000974
TOP10Chemically Competent大肠杆菌细胞(Invitrogen)中。将转化体涂布在2X YT+amp平板上,37℃孵育过夜。通过XbaI和PacI消化筛选到所得转化体中。产生所需片段大小的克隆通过DNA测序来确认正确,并分别对于ydfG,BAAT,UGA1,YMR226c或PYD4命名为pMIBa120,pMIBa121,pMIBa122,pMIBa123和pMIBa124。所得到的质粒允许以表达盒正向取向的方式使所需基因整合到adh1202基因组上。
表11中的整合构建体用于将为在东方伊萨酵母中表达而密码子优化的目的基因整合到东方伊萨酵母的adh1202基因座上,在PDC启动子和终止子的调控之下。如本文所述,表达盒还包括URA3选择标志物以允许对ura-宿主中的转化体进行选择。表达盒和adh1202同源区域的侧翼是ApaI和KpnI限制性位点,以允许片段从质粒中释放出来。
表11中的各个整合构建体各15μg用ApaI,KpnI和NcoI消化,使用89mM Tirs碱-89mM硼酸-2mM乙二胺四乙酸钠(TBE)缓冲液,在1%琼脂糖凝胶上进行电泳。用NcoI消化破坏了载体的骨架,使得更容易从琼脂糖凝胶中提取目的片段。将分别来自于pMIBa120,pMIBa121,pMIBa122,pMIBa123和pMIBa124的4884bp,5493bp,5553bp,4937bp和5565bp的片段,从凝胶中切割下来,使用
Figure BDA0001451815470000975
Gel Extract KiT(Qiagen)从琼脂糖中提取。发现纯化后产物的浓度在80-120ng/μL之间。如本文所述,将0.8-1.2μg来自于pMIBa120-4的限制性片段转化进东方伊萨酵母CNB1(ura-)中。然后将转化体涂布在ura选择培养基上,室温下生长60小时。将转化体在ura选择培养基上重新划线,在37℃下孵育过夜。
通过菌落PCR对几个转化体各进行检查以验证整合。使用引物对来验证正确的整合,所述引物对检查整合的5’和3’端,并列在下面。引物0611717以反向退火于PDC启动子中,而引物0611225则以正向退火于URA3选择标志物上。引物0611631和0611632分别以正向和反向在整合位点的外面进行退火;引物0611717和0611631在正确的整合体中扩增出976bp的片段;引物0611225和0611632在正确的整合体中扩增出1.4kbp的片段;引物0611631和0611632扩增出2.7kbp的片段则意味着野生型染色体,而如果整合,则扩增出~5kbp的片段。为了构建基因组DNA,将每个转化体的一个菌落在50μL的含0,05U/μL溶细胞酶(Sigma,St.Louis,MO,USA)的TE中,在37℃下孵育30分钟,接着在95℃下孵育10分钟。如本文所述实施PCR以验证整合。使用0611717和0611631产生976bp PCR片段,使用0611225和0611632产生1.4kbp片段,和使用0611631和0611632产生2.7kbp片段的每个杂合整合体的一个转化体被保存,并命名为MIBa308,MIBa309,MIBa310,MIBa311和MIBa312,如表11中所示。
转化体MIBa308,MIBa309,MIBa310,MIBa311和MIBa312的培养物在YPD中,37℃下生长过夜。在125mL挡板瓶中,在37℃以1:50倍将培养物稀释到25mL新鲜YPD中,生长至OD600为~4-10。使用本文所述的方法,通过SDS-PAGE来分析细胞样品的蛋白表达。从培养物的细胞沉淀中制备CFE,使用本文所述的方法测量CFE中3HP脱氢酶的活性。通过SDS-PAGE是否存在~53KDa的条带来检测MIBa310和MIBa312中是否分别有UGA1和PYD4的表达,所述条带在没有整合任何基因的菌株中是不存在的。而在这些条件下,SDS-PAGE并不能检测到MIBa309中BAAT的表达。表12A显示了菌株的CFE中3-HP脱氢酶(3-HPDH)的活性。
表12A:转化体酶活数据
Figure BDA0001451815470000981
Figure BDA0001451815470000991
在采用改进的测定条件的独立实验中,比较从菌株MBin500(对照),MIBa310,MIBa309和MIBa312中制备的CFE中BAAT的活性。该实验的结果示于表12B中。
表12B:转化体酶活数据
菌株 过表达基因 基因来源 基因SEQ ID NO BAAT活性
MBin500 N/A N/A N/A 0.67
MIBa310 gabT(UGA1) 酿酒酵母 141 9.05
MIBa309 BAAT 阿维链霉菌 140 0.42
MIBa312 BAAT(PYD4) 克鲁维酵母 142 105.85
质粒pMIBa120-4(如上)含有NotI限制性位点,位于表达盒的侧翼,如下所示:PDC启动子,目的基因(BAAT或3-HPDH),PDC终止子,以及URA3选择标志物。用于在adh1202基因座整合的同源区在NotI限制性位点之外。这些质粒全都具有正向取向的表达盒。
构建具有反向取向表达盒的新质粒,以允许方便地筛选纯合整合菌株。用NotI消化质粒pMIBa120-4,使用89mM Tirs碱-89mM硼酸-2mM乙二胺四乙酸钠(TBE)缓冲液,在1%琼脂糖凝胶上进行电泳。3.5kbp片段(pMIBa120),4.2kbp片段(pMIBa121),4.2kbp片段(pMIBa122),3.5kbp片段(pMIBa123)和4.2kbp片段(pMIBa124)从凝胶中切割下来,使用
Figure BDA0001451815470000992
Gel Extract KiT(Qiagen)从琼脂糖中提取。使用T4DNA连接酶如上所述,将这些片段分别连接到5.2kbp线性化的用NotI/CIP处理过的pHJJ76-无ura上。根据制造商的说明将连接产物转化至One
Figure BDA0001451815470000993
TOP10Chemically Competent大肠杆菌细胞(Invitrogen)中。将转化体涂布在2X YT+amp平板上,37℃孵育过夜。通过XbaI和KpnI消化来筛选数个所得转化体。产生所需片段大小的克隆分别对于UGA1,YMR226C,PYD4,ydfG和BAAT命名为pMIBa131,pMIBa132,pMIBa133,pMIBa134和pMIBa135。所得到的质粒允许以表达盒反向取向的方式使所需基因整合到adh1202基因座上。
如本文所述,分离MIba308-12的ura-衍生体。数个MIBA308-12的FOA抗性菌落是通过37℃下生长在YPD平板上以纯化两次的菌落。从FOA-抗性菌落中制备基因组DNA,通过PCR进行检查仪验证URA3选择标志物的缺失,如本文所述。引物0611631和0611632在整合位点的外部,分别以正向和反向进行退火。引物0611718退火于ura选择标志物上游的PDC终止子上;引物0611632和0611631在野生型染色体上扩增出2.7kbp的片段;引物0611718和0611632对于ura标记存在的整合则扩增出2.4kbp的片段,如果不存在ura标记则扩增出1100bp片段。使用引物0611718和0611632产生1100bp PCR片段,使用0611631和0611632产生2.7kbp片段的MIBa308-12的其中一个ura-菌株被保存,命名为MIBa314(MIBa310的ura-菌株),MIBa315(MIBa312的ura-菌株),MIBa316(MIBa311的ura-菌株),MIBa326(MIBa308的ura-菌株)和MIBa328(MIBa309的ura-菌株)。
pMIBa131,pMIBa132,pMIBa133和pMIBa135各10-15μg,用ApaI,KpnI和NcoI消化,使用89mM Tirs碱-89mM硼酸-2mM乙二胺四乙酸钠(TBE)缓冲液,在1%琼脂糖凝胶上进行电泳。用NcoI消化后,将目的片段从琼脂糖凝胶中提取变得更方便。将分别来自于pMIBa131-3,pMIBa135的5553bp,4937bp,5565bp,5493bp片段从凝胶中切割下来,使用
Figure BDA0001451815470001002
Gel Extract KiT(Qiagen)从琼脂糖中提取。发现纯化后产物的浓度在67-80ng/μL之间。将0.67-0.8μg来自于pMIBa131-3和pMIBa135的限制性片段转化进MIBa314,MIBa316,MIBa315或MIBa328中,如本文所述。将转化体涂布在ura选择培养基上,在37℃下孵育过夜。然后将转化体在ura选择培养基上重新划线,在37℃下孵育过夜。从URA3+菌落中制备基因组DNA,如上所述使用PCR进行检查以验证第二表达盒的整合,使得菌株对于目的基因是纯合的。如上所述,引物0611718和0611632对于第一个整合扩增出1100bp片段,而引物0611632和0611717则对于反向取向的第二整合扩增出814bp的片段。使用引物0611718和0611632扩增出1100bp,以及使用引物0611717和0611632扩增出814bp的每个品系的URA3+转化体被命名为MIBA317,MIBA318,MIBA319和MIBA329(见表13)。
表13:转化体基因型
Figure BDA0001451815470001001
确定YMR226c,UGA1,PYD4和BAAT纯合或杂合菌株中的表达和酶活。MIBA309-12,MIBa317-9和MIBa329的过夜培养物在YPD ON中,37℃下生长,然后在37℃在125mL挡板瓶中,以1:50倍将培养物稀释到25mL新鲜YPD中,生长至OD600为~4-10。使用本文所述的方法,通过SDS-PAGE来分析细胞样品的蛋白表达。也从培养物的细胞沉淀中制备CFE,使用本文所述的方法测量CFE中3HP脱氢酶的活性。基于SDS-PAGE的结果,MIBa310,MIBa318,MIBa312和MIBa319含有分子量为~53KDa的蛋白(由UGA1或PYD4基因编码的蛋白质的期望大小)。在对菌株MBin500进行SDS-PAGE分析时并没有观察到对应于该蛋白质的条带。另外,纯合菌株MIBa318和MIBa319中UGA1和PYD4的表达分别比相应的杂合菌株MIBa310或MIBa312中的表达要高(通过SDS-PAGE分析来判断)。在这些条件下在菌株MIBa309或MIBa329中没有检测(通过SDS-PAGE)到BAAT的表达。表14A显示了菌株MBin500,MIBa311和MIBa317的CFE中,3-HP脱氢酶(3-HPDH)的活性。
表14A:转化体酶活性数据
Figure BDA0001451815470001011
在使用改进的测定条件的独立实验中,比较从菌株MBin500(对照),MIBa319和MIBa329中制备的CFE中BAAT的活性。该实验的结果示于表14B中。
表14B:转化体酶活数据
菌株 过表达基因 基因SEQ ID NO 来源 BAAT活性
MBin500(对照) N/A N/A N/A 0.67
MIBa319 BAAT(PYD4) 142 克鲁维酵母 228.01
MIBa329 BAAT 140 阿维链霉菌 0.38
如本文所述,分离菌株MIBa317,MIBa318和MIba319的ura-衍生体。数个MIBa317,MIBa318和MIba319的FOA抗性菌落是通过37℃下生长在YPD平板上以纯化菌落。从FOA-抗性菌落中制备基因组DNA,通过PCR进行检查以验证URA3选择标志物的缺失,如本文中所述。引物0611718和0611632扩增出1100bp片段表明如上述的第一整合,引物0611632和0611717扩增出814bp片段表明在反向取向存在第二整合。引物0611718和0611631扩增出2.6kbp片段表明第二整合具有ura标志,而1200bp片段表明没有ura标志。使用0611718和0611632产生1100bp PCR片段,使用0611632和0611717产生814bp片段,或者使用0611718和0611631产生1200bp MIBa307和MIBa308ura-菌株被保存,分别命名为MIBa320和MIBa321。当ura标志从MIBa319中移除时,可能发生基因转换事件,从而产生MIBa322,如PCR所示(用引物0611632和0611631不产生2.7kbp片段,或者用引物0611632和0611717不产生814bp片段,但是用0611718和0611632则扩增出1100bp片段),以至于两个表达盒都是正向取向的。
实施例3A-3:在pdc基因座表达天冬氨酸1-脱羧酶(ADC),β-丙氨酸氨基转移酶 (BAAT)和3-羟基丙酸脱氢酶(3-HPDH)的插入载体的左端片段的构建
含有阿维链霉菌ADC(SEQ ID NO:130)和阿维链霉菌BAAT(SEQ ID NO:140)的左端片段
为了允许在ENO1启动子和PDC终止子区域之间插入供表达的基因,用XbaI和PacI消化pMhCt068载体,用10个单位的小牛肠磷酸酶(New England Biolabs)在37℃下处理30分钟,在TAE缓冲液中通过0.9%的琼脂糖凝胶电泳纯化,约6.1kbp的条带从凝胶上切下,根据制造商的说明使用
Figure BDA0001451815470001021
Extract II KiT(Macherey-Nagel)纯化。
然后,用引物0611196和0611186扩增克鲁维酵母BAAT(pyd4)基因(SEQ ID NO:142),所述引物包括后续亚克隆步骤所需的限制性位点。PCR反应体系(50μL)包含1μL 1比50稀释的小量制备含有克鲁维酵母pyd4基因的质粒,1X Pfx扩增缓冲液(Invitrogen),引物0611196和0611186每种100pmol,dATP、dCTP、dGTP和dTTP每种200μM,1.5μL DMSO和2.5个单位的
Figure BDA0001451815470001022
Pfx DNA聚合酶(Invitrogen)。在
Figure BDA0001451815470001023
(Eppendorf Scientific)中进行PCR,程序为95℃ 2分钟的1个循环,随后是每个为95℃ 30秒,40.8℃ 30秒和72℃ 1分30秒的34个循环,及72℃ 5分钟的最后延伸。热循环后,以TAE缓冲液中0.9%琼脂糖凝胶电泳来分离PCR反应产物,其中约1428bp的PCR产物被从凝胶上切下并根据制造商的说明使用
Figure BDA0001451815470001024
Extract II KiT(Macherey-Nagel)纯化。
上面所产生的pyd4 PCR产物用XbaI和PacI消化,在TAE缓冲液中通过0.9%琼脂糖凝胶电泳纯化,约1.4kbp的条带从凝胶上切下,根据制造商的说明使用
Figure BDA0001451815470001031
Extract II KiT(Macherey-Nagel)纯化。在连接反应中,将该纯化的DNA克隆进上述被XbaI和PacI限制性消化过的pMhCt068载体中,所述连接反应(20μL)含有1X Quick连接缓冲液(New England Biolabs),100ng XbaI/PacI pMhCt068载体,70.5ng XbaI/PacI Pyd4插入物,以及1μL Quick T4DNA连接酶(New England Biolabs)。连接反应在室温下孵育5分钟,然后在冰上冷却。5μL反应物根据制造商的说明被用于转化Solo Pack GoldSuperCompetent Cells(Agilent Technologies)。转化体被涂布于2X YT+amp平板上并在37℃下孵育过夜。通过XbaI和PacI消化筛选到数个有所需PCR产物的合适插入的所得转化体,其中确认的一个分离物被命名为“左+pyd4#1”。
用引物0611376和0611377(注意当通过In-Fusion插入到pMhCt068时,引物0611376会导致在NheI限制性位点的5’末端的“T”碱基被移除,这将除去存在于初始pMhCt068克隆中的不期望的ATG起始密码子)扩增编码SEQ ID NO:17的阿维链霉菌ADC,并且为了在大肠杆菌中表达而经过密码子优化的多聚核苷酸。PCR反应体系(50μL)包含1μL 1比50稀释的小量制备的含有为大肠杆菌表达经密码子优化的阿维链霉菌ADC基因的质粒,1XThermoPol反应缓冲液(New England Biolabs),引物0611376和0611377每种100pmol,dATP、dCTP、dGTP和dTTP每种200μM,2μL 100mM MgSO4,和2个单位的
Figure BDA0001451815470001032
(exo-)DNA聚合酶(New England Biolabs)。在
Figure BDA0001451815470001033
Figure BDA0001451815470001034
(EppendorfScientific)中进行PCR,程序为94℃ 2分钟的1个循环,随后是每个为94℃ 30秒,54℃ 30秒和72℃ 1分钟的34个循环,及72℃ 10分钟的最后延伸。热循环后,以TAE缓冲液中0.9%琼脂糖凝胶电泳来分离PCR反应产物,其中约420bp的PCR产物被从凝胶上切下并根据制造商的说明使用
Figure BDA0001451815470001035
Extract II KiT(Macherey-Nagel)纯化。
然后将“左+pyd4#1”质粒用NheI和AscI消化,再用10单位的小牛肠磷酸酶(NewEngland Biolabs)在37℃下处理30分钟,在TAE缓冲液中通过0.9%的琼脂糖凝胶电泳纯化,约7.5kbp的条带从凝胶上切下,根据制造商的说明使用
Figure BDA0001451815470001036
Extract IIKiT(Macherey-Nagel)纯化。上述纯化的含有对于大肠杆菌经密码子优化的阿维链霉菌ADC基因的PCR片段,用NheI和AscI消化,在TAE缓冲液中通过0.9%的琼脂糖凝胶电泳纯化,约420bp的条带从凝胶上切下,根据制造商的说明使用
Figure BDA0001451815470001037
Extract II KiT(Macherey-Nagel)纯化。随后在连接反应中,将得到的片段连接到线性的“左+pyd4#1”载体中,所述连接反应(20μL)含有1X Quick连接缓冲液(New England Biolabs),100ng NheI/AscI“左+pyd4#1”载体,31ng NheI和AscII消化过的panD插入片段,以及1μL Quick T4DNA连接酶(New England Biolabs)。连接反应在室温下孵育5分钟,然后置于冰上。5μL反应物根据制造商的说明被用于转化Solo Pack Gold SuperCompetent Cells(AgilentTechnologies)。转化体被涂布于2X YT+amp平板上并在37℃下孵育过夜。如本文所述,通过AscI和PvuII消化筛选到数个有对于大肠杆菌经密码子优化的阿维链霉菌ADC基因片段的合适插入的所得的转化体。产生所需片段大小的克隆通过DNA测序来确认正确并命名为pMhCt070。
质粒pMhCt070用作基础载体,用于添加为在酵母宿主中表达而经过密码子优化的ADC和BAAT同源物。pMhCt070用XbaI和PacI消化,用10个单位的小牛肠磷酸酶(New EnglandBiolabs)在37℃下处理30分钟,在TAE缓冲液中通过0.9%的琼脂糖凝胶电泳纯化,约6.5kbp的条带从凝胶上切下,根据制造商的说明使用
Figure BDA0001451815470001041
Extract II KiT(Macherey-Nagel)纯化。将如上所述的经XbaI和PacI消化的片段,所述片段含有编码阿维链霉菌BAAT(SEQ ID NO:140),并为了在东方伊萨酵母中表达而经过密码子优化的多核苷酸,连接到pMhCt070切割载体上,如下所示:连接反应(20μL)含有1X Quick连接缓冲液(NewEngland Biolabs),42ng经XbaI和PacI消化的pMhCt070载体,4μL密码子优化的阿维链霉菌BAAT XbaI和PacI消化的插入片段,以及1μL Quick T4 DNA连接酶(New EnglandBiolabs)。连接反应在室温下孵育5分钟,然后置于冰上。5μL反应物根据制造商的说明被用于转化Solo Pack Gold SuperCompetent Cells(Agilent Technologies)。转化体被涂布于2X YT+amp平板上并在37℃下孵育过夜。如本文所述,通过XbaI,PacI和EcoRV消化筛选到数个有所需BAAT ORF的正确插入的所得的转化体。产生所需片段大小的克隆被通过DNA测序确认正确并命名为pMhCt072。
将在pMhCt072中的为在大肠杆菌中表达而进行密码子优化的阿维链霉菌ADC基因,用为在东方伊萨酵母中表达而进行的密码子优化的型式(SEQ ID NO:130)进行替换。东方伊萨酵母密码子优化ADC基因(SEQ ID NO:130),连同所需另外的限制性位点和侧翼DNA用引物0611378和0611379来扩增。PCR反应体系(50μL)包含1μL 1比50稀释的小量制备的含有密码子优化的阿维链霉菌panD基因的质粒
Figure BDA0001451815470001042
1XThermoPol反应缓冲液(NewEngland Biolabs),引物0611378和0611379每种100pmol,dATP、dCTP、dGTP和dTTP每种200μM,2μL 100mM MgSO4,和2个单位的
Figure BDA0001451815470001051
(exo-)DNA聚合酶(New England Biolabs)。在
Figure BDA0001451815470001052
(Eppendorf Scientific)中进行PCR,程序为94℃ 2分钟的1个循环,随后是每个为94℃ 30秒,54℃ 30秒和72℃ 45秒的34个循环,及72℃10分钟的最后延伸。热循环后,以TAE缓冲液中1%琼脂糖凝胶电泳来分离PCR反应产物,其中约420bp的PCR产物被从胶上切下并根据制造商的说明使用
Figure BDA0001451815470001053
ExtractII KiT(Macherey-Nagel)纯化。
5μL小量制备的pMhCt072用XbaI和PacI消化,再用10单位的小牛肠磷酸酶(NewEngland Biolabs)在37℃下处理30分钟,在TAE缓冲液中通过1%的琼脂糖凝胶电泳纯化,约7.5kbp的条带从凝胶上切下,根据制造商的说明使用
Figure BDA0001451815470001054
Extract IIKiT(Macherey-Nagel)纯化。在随后的IN-FUSIONTM Advantage PCR Cloning KiT(Clontech)反应中,将含有来自于上面的密码子优化的阿维链霉菌ADC基因的分离PCR产物加入到载体中:10μL反应体积由6μL pMhCt072消化和纯化载体,1μL纯化的密码子优化的panD PCR产物,1X In-Fusion反应缓冲液(Clontech)和1μL IN-FUSIONTM酶(Clontech)构成。反应物在37℃孵育15分钟,在50℃ 15分钟,随后被置于冰上。以40μLTE缓冲液稀释反应物并根据制造商的说明使用2.5μL来转化Solo Pack Gold Super Competent Cells(Agilent Technologies)。转化体被涂布于2X YT+amp平板上并在37℃下孵育过夜。通过NheI,AscI和ClaI消化筛选到数个合适地插入了所需PCR产物的所得转化体。产生所需片段大小的克隆通过DNA测序来确认正确并命名为pMhCt074(图7)。
pMhCt074是左端PDC靶向构建体,含有驱动密码子优化的阿维链霉菌ADC(panD,SEQ ID NO:130)表达的PDC启动子,TAL终止子,驱动密码子优化的阿维链霉菌BAAT(SEQ IDNO:140)表达的ENO1启动子,RKI终止子,东方伊萨酵母URA3启动子和东方伊萨酵母URA3ORF的5’片段。
含有阿维链霉菌ADC(SEQ ID NO:130)和克鲁维酵母BAAT(SEQ ID NO:142)的左端片段
为了构建表达克鲁维酵母BAAT(pyd4)的左端DNA构建体,将含有为在东方伊萨酵母中表达而经过密码子优化的克鲁维酵母BAAT序列(SEQ ID NO:142,如上)的XbaI和PacI消化的片段连接到上面的pMhCt070消化载体上,如下所示:连接反应(20μL)含有1X Quick连接缓冲液(New England Biolabs),42ng经XbaI和PacI消化的pMhCt070载体,4μL密码子优化的克鲁维酵母BAAT XbaI和PacI消化的插入物,以及1μL Quick T4DNA连接酶(NewEngland Biolabs)。连接反应在室温下孵育5分钟,然后置于冰上。5μL反应物根据制造商的说明被用于转化Solo Pack Gold SuperCompetent Cells(Agilent Technologies)。转化体被置于2X YT+amp平板上并在37℃下孵育过夜。如本文所述,通过XbaI,PacI和EcoRV消化筛选到数个有所需pyd4ORF的合适插入所得的转化体。产生所需片段大小的克隆通过DNA测序来确认正确并命名为pMhCt073。
质粒pMhCt073含有所需的,为在东方伊萨酵母中表达而经过密码子优化的克鲁维酵母BAAT(pyd4)序列,但是并不含有所需的为在东方伊萨酵母中表达而经过密码子优化的阿维链霉菌ADC(panD)序列。为了移入ORF,5μL小量制备的pMhCt073用XbaI和PacI消化,再用10单位的小牛肠磷酸酶(New England Biolabs)在37℃下处理30分钟,在TAE缓冲液中通过1%的琼脂糖凝胶电泳纯化,约7.5kbp的条带从凝胶上切下,根据制造商的说明使用
Figure BDA0001451815470001061
Extract II KiT(Macherey-Nagel)纯化。在随后的IN-FUSIONTMAdvantage PCR Cloning KiT(Clontech)反应中,将含有来自于上面的密码子优化的阿维链霉菌panD基因(如上)的分离PCR产物加入到载体中:10μL反应体积由6μL pMhCt073消化和纯化载体,1μL纯化的密码子优化的panD PCR产物,1X In-Fusion反应缓冲液(Clontech)和1μL IN-FUSIONTM酶(Clontech)构成。反应物在37℃孵育15分钟,在50℃ 15分钟,随后被置于冰上。以40μL TE缓冲液稀释反应物并根据制造商的说明使用2.5μL来转化Solo PackGold Super Competent Cells(Agilent Technologies)。转化体被涂布于2X YT+amp平板上并在37℃下孵育过夜。通过NheI,AscI和ClaI消化筛选到数个合适地插入了所需PCR产物所得转化体。产生所需片段大小的克隆通过DNA测序来确认正确并命名为pMhCt076。
质粒pMhCt076是左端PDC靶向构建体,含有驱动为在东方伊萨酵母中表达而经密码子优化的阿维链霉菌ADC(panD,SEQ ID NO:130)表达的PDC启动子,TAL终止子,驱动为在东方伊萨酵母中表达而经密码子优化的克鲁维酵母BAAT(SEQ ID NO:142)表达的ENO1启动子,RKI终止子,东方伊萨酵母URA3启动子和东方伊萨酵母URA3ORF的5’片段。
测序确定,质粒pMhCt076在到PDC启动子中约200bp处有A至T的核苷酸改变,以及在PDC启动子的~2/3处有G至T的核苷酸改变,而这些都是存在于pMhCt068亲本载体中的(如上)。为了解决潜在基因表达改变的担忧,如下所述克隆一个类似pMhCt076,但是含有正确PDC启动子的构建体。
5μL小量制备的pMhCt082用NheI和PacI消化,再用10单位的小牛肠磷酸酶(NewEngland Biolabs)在37℃下处理30分钟,在TAE缓冲液中通过0.9%的琼脂糖凝胶电泳纯化,约4.7kbp的条带从凝胶上切下,根据制造商的说明使用
Figure BDA0001451815470001071
Extract IIKiT(Macherey-Nagel)纯化。4μL小量制备的pMhCt076用NheI和PacI消化,在TAE缓冲液中通过0.9%的琼脂糖凝胶电泳纯化,约3.3kbp的条带从凝胶上切下,根据制造商的说明使用
Figure BDA0001451815470001072
Extract II KiT(Macherey-Nagel)纯化。在连接反应中将纯化的4.7kbp载体和3.3kbp插入片段连接起来,所述反应(20μL)含有1X Quick连接缓冲液(NewEngland Biolabs),3μL pMhCt082载体,6μL pMhCt076插入物,1μLX Quick T4DNA连接酶(New England Biolabs)。反应物在室温下孵育5分钟,随后被置于冰上。根据制造商的说明使用5μL该反应来转化ONE
Figure BDA0001451815470001073
TOP10化学感受态大肠杆菌细胞(Invitrogen)。转化体被涂布于2X YT+amp平板上并在室温下孵育3天。通过StuI和NotI消化来筛选到数个合适地插入了所需PCR产物的所得转化体。产生所需片段大小的克隆通过DNA测序来确认正确并命名为pMhCt083(图8)。
质粒pMhCt083与pMhCt076相同,除了前者含有正确的PDC启动子序列,而后者如上所述具有一个A至T的核苷酸改变和一个G至T的核苷酸改变。测试表明,与pMhCt083和pMhCt077相比,来自于pMhCt076和pMhCt077整合的表达阿维链霉菌panD的菌株中,panD酶活性并没有差异。
含有阿维链霉菌ADC(SEQ ID NO:130)和酿酒酵母gabT(SEQ ID NO:141)的左端片段
4μL小量制备的pMhCt083用XbaI和PacI消化,用10单位的小牛肠磷酸酶(NewEngland Biolabs)在37℃下处理30分钟,在TAE缓冲液中通过0.9%的琼脂糖凝胶电泳纯化,约6.5kbp的条带从凝胶上切下,根据制造商的说明使用
Figure BDA0001451815470001074
Extract IIKiT(Macherey-Nagel)纯化。将经XbaI和PacI消化的片段,所述片段含有编码酿酒酵母gabT并为了在东方伊萨酵母中表达而经过密码子优化(UGA1,SEQ ID NO:141),连接到pMhCt083切割载体上,如下所示:连接反应(20μL)含有1X Quick连接缓冲液(New EnglandBiolabs),1μL经XbaI和PacI消化的纯化pMhCt083载体,3μL密码子优化的酿酒酵母UGA1XbaI和PacI消化的插入物,以及1μL Quick T4DNA连接酶(New England Biolabs)。连接反应在室温下孵育5分钟,然后在冰上冷却。5μL反应物根据制造商的说明被用于转化Solo Pack Gold SuperCompetent Cells(Agilent Technologies)。转化体被涂布于2X YT+amp平板上并在37℃下孵育过夜。如本文所述,通过XbaI和BglII消化筛选到数个有所需BAAT ORF的合适插入的所得的转化体。产生所需片段大小的克隆通过DN A测序来确认正确并命名为pMhCt087(图9)。
pMhCt087是左端PDC靶向构建体,含有驱动为在东方伊萨酵母中表达而经密码子优化的阿维链霉菌ADC(panD,SEQ ID NO:130)表达的PDC启动子,TAL终止子,驱动为在东方伊萨酵母中表达而经密码子优化的酿酒酵母gabT(UGA1,SEQ ID NO:141)表达的ENO1启动子,RKI终止子,东方伊萨酵母URA3启动子和东方伊萨酵母URA3ORF的5’片段。
实施例3-4:在pdc基因座表达天冬氨酸1-脱羧酶(ADC),β-丙氨酸氨基转移酶 (BAAT)和3-羟基丙酸脱氢酶(3-HPDH)的插入载体的右端片段的构建
含有大肠杆菌3-HPDH(SEQ ID NO:143)的右端片段
2μL小量制备的pMhCt069(如上)用XbaI和PacI消化,再用10单位的小牛肠磷酸酶(New England Biolabs)在37℃下处理30分钟,在TAE缓冲液中通过0.9%的琼脂糖凝胶电泳纯化,约2.2kbp的条带从凝胶上切下,根据制造商的说明使用
Figure BDA0001451815470001081
Extract II KiT(Macherey-Nagel)纯化。将经XbaI和PacI消化的片段,所述片段含有为了在东方伊萨酵母中表达而经过密码子优化(ydfG,SEQ ID NO:143)的大肠杆菌3-HPDH基因,连接到pMhCt069切割载体上,如下所示:连接反应(20μL)含有1X Quick连接缓冲液(NewEngland Biolabs),2μL经XbaI和PacI消化的纯化pMhCt069载体,4μL XbaI和PacI消化的密码子优化的大肠杆菌ydfG插入物,以及1μL Quick T4DNA连接酶(New England Biolabs)。连接反应在室温下孵育5分钟,然后在冰上冷却。5μL反应物根据制造商的说明被用于转化Solo Pack Gold SuperCompetent Cells(Agilent Technologies)。转化体被涂布于2X YT+amp平板上并在室温下孵育3天。如本文所述,通过XbaI,PacI和EcoRV消化筛选到数个有所需ydfG ORF的合适插入的所得的转化体。如本发明中所述产生所需片段大小的克隆通过DNA测序来确认正确并命名为pMhCt075(图10)。
质粒pMhCt075含有东方伊萨酵母URA3ORF的3’片段,来自于东方伊萨酵母的URA3终止子,其后是URA3启动子(用于将来将URA3标志环出),为了在东方伊萨酵母中表达而经密码子优化的大肠杆菌3-HPDH基因(ydfG,SEQ ID NO:143),其由东方伊萨酵母TDH3启动子所驱动,以及东方伊萨酵母PDC终止子区域。
含有酿酒酵母3-HPDH(SEQ ID NO:144)的右端片段
将用XbaI和PacI消化的,含有为了在东方伊萨酵母中表达而经过密码子优化的酿酒酵母YMR226C基因(如上)的片段连接到pMhCt069切割载体中,如下所示:连接反应(20μL)含有1X Quick连接缓冲液(New England Biolabs),2μL经XbaI和PacI消化的纯化pMhCt069载体,4μL XbaI和PacI消化的密码子优化的酿酒酵母3-HPDH(YMR226C,SEQ ID NO:144)插入物,以及1μL Quick T4DNA连接酶(New England Biolabs)。连接反应在室温下孵育5分钟,然后置于冰上。5μL反应物根据制造商的说明被用于转化Solo Pack GoldSuperCompetent Cells(Agilent Technologies)。转化体被涂布于2X YT+amp平板上并在室温下孵育3天。如本文所述,通过XbaI,PacI和EcoRV消化筛选到数个有所需YMR226C ORF的合适插入的所得的转化体。产生所需片段大小的克隆通过DNA测序来确认正确并命名为pMhCt077(图11)。
质粒pMhCt077含有东方伊萨酵母URA3ORF的3’片段,来自于东方伊萨酵母的URA3终止子,其后是URA3启动子(用于将来将URA3标志环出),为了在东方伊萨酵母中表达而经密码子优化的酿酒酵母3-HPDH基因(YMR226C,SEQ ID NO:144),其由东方伊萨酵母TDH3启动子所驱动,以及东方伊萨酵母PDC终止子区域。
实施例3A-5:在pdc基因座表达天冬氨酸1-脱羧酶(ADC),β-丙氨酸氨基转移酶(BAAT)和3-羟基丙酸脱氢酶(3-HPDH)的杂合和纯合酵母菌株
上面的实施例3A-3和3A-4描述了为使三种异位基因同时在东方伊萨酵母PDC基因座中靶向表达的各种左端或右端构建体的构建。在转化前,每种构建体(一个所需的左端构建体和一个所需的右端构建体)各约10μg用NotI消化,以将所需的转化DNA从pUC18骨架载体中释放出来;对于大多数消化,在NotI消化中也包括限制性酶PvuI。限制性酶PvuI将pUC18载体片段消化为两半,使得用凝胶电泳能够更容易地分离较大的所需DNA片段。含有较大的表达盒的条带可通过凝胶电泳从pUC18骨架DNA中分离出来,并从凝胶中切割,根据制造商的说明使用
Figure BDA0001451815470001102
Extract II KiT(Macherey-Nagel)纯化。30μL洗脱缓冲液被用于洗脱步骤。等摩尔比的左端和右端构建体,共10μL用于转化东方伊萨酵母菌株CNB1或合适的衍生体。在ura选择平板上选择转化体,置于37℃下生长。第二天,挑取出约12个转化体,并在ura选择平板上重新划线以得到单个菌落,在37℃下生长。翌日,从每个起始转化体生成的每条线中挑取单独的菌落,在ura选择平板上重新划线以得到单个菌落。37℃下再生长一个晚上后,从每条线中挑取最终的单菌落,在ura选择平板上重新划线,在37℃下生长过夜。经过这种两轮单菌落纯化和生长之后,制备用于PCR的基因组DNA,所述PCR是为了验证如上所述的所需的靶向整合的发生。为了使用左-和右端构建体靶向到PDC,使用引物0611814,0611554和0611555来进行所需整合事件的验证。引物0611554结合到东方伊萨酵母基因组DNA中正好是PDC终止子区域的3’端,该区域存在于右端PDC靶向构建体中;引物0611555结合到PDC ORF中,进行扩增直至停止;引物0611814结合到存在于右端构建体中的TDH3启动子区域的3’末端附近,并朝3’方向进行扩增。从含有引物0611814和0611554的PCR中产生约1.9kbp的条带表明在PDC基因座发生了所需整合事件。从含引物0611555和0611554的PCR中产生约1.4kbp的条带表明存在野生型PDC基因座。由于该整合事件是二倍体东方伊萨酵母CNB1中的第一个靶向事件,所需整合体对引物0611814和0611554将显示出1.9kbp的条带,对引物0611555和0611554则显示出1.4kbp的条带。对每个质粒具有所需条带谱型的两个独立转化体被命名,如表15中所示。
表15:转化体基因型
Figure BDA0001451815470001101
接下来,如上所述分离yMhCt004或yMhCt005的ura-衍生体。使用引物0611815和0611817,用PCR对每个亲本菌株的几个FOA抗性菌落的基因组DNA进行所需环出事件的筛选。引物0611815在左端构建体的RKI终止子上进行退火,朝着URA3启动子扩增。引物0611817在TDH3启动子中退火,反方向朝着URA3盒扩增。存在828bp的条带意味着只存在所期望的ura3残留位点(在亲本菌株的两个URA3启动子之间发生同源重组后,所留下的单个URA3启动子),而约2.2kbp的条带则意味着存在完整的URA3启动子-URA3ORF-URA3终止子-URA3启动子盒,这表明所期望的重组事件并没有发生。如上所述,实施Crimson TaqTM DNA聚合酶(New England Biolabs)的PCR反应。来自于亲本菌株yMhCt004的一个FOA抗性菌落,被命名为yMhCt012,来自于亲本菌株yMhCt005的一个FOA抗性菌落,命名为yMhCt007,都具有所期望的828bp条带。
接下来转化菌株yMhCt012和yMhCt007,以构建PDC基因被缺失并且分别被panD,pyd4,和YMR226C或者panD,UGA1和YMR226C的表达盒替换的纯合菌株。用来自于pMhCt083和pMhCt077的线性DNA转化菌株yMhCt012,用来自于pMhCt087和pMhCt077的线性DNA转化菌株yMhCt007。经过两轮的单菌落纯化后,用引物0611815和0611817,用PCR筛选每个亲本菌株的几个转化体的基因组DNA,如上所述。来自于各个亲本菌株的两个独立分离的整合体都具有828bp条带(扩增来自于原始靶向PDC基因座的ura3残留区域得到的)和2.2kbp条带(在另一条染色体上发生第二次整合的URA3启动子-URA3ORF-URA3终止子-URA3启动子盒整合所得到的),命名所述整合体,如表16所示。
表16:转化体基因型
Figure BDA0001451815470001111
如上所述分离yMhCt008的ura-衍生体。使用引物0611815和0611817,用PCR对yMhCt008亲本菌株的几个FOA抗性菌落的基因组DNA进行所需环出事件的筛选。存在828bp的条带意味着只存在所期望的ura3残留位点(在亲本菌株的两个URA3启动子之间发生同源重组后,所留下的单个URA3启动子)。只显示828bp条带的分离物用引物0611555和0611554进行进一步的筛选,如本文所述。从含有引物0611555和0611554的PCR中产生约1.4kbp的条带意味着存在野生型PDC基因座。缺少该条带的分离物,这表明两条染色体上的PDC基因座都丢失,被命名为yMhCt010。
在摇瓶中培养菌株,制备CFE,测定天冬氨酸脱羧酶(ADC)活性和3-HP脱氢酶(3-HPDH)活性,如本文所述。这几个测定系列的实验结果(记为试验1-4)如表17中所示。还对来自于表17中试验1的菌株进行SDS-PAGE分析,如本文所述。在SDS-PAGE分析中,试验1中的菌株74/75#1和菌株yMhCt002在27kD处产生了条带,而该条带在试验1的对照菌株中(Mbin500)并不存在。该蛋白质条带的大小与其作为ydfG基因编码的蛋白质的身份是吻合的。
表17:转化体酶活数据
Figure BDA0001451815470001121
Figure BDA0001451815470001131
另一个测定系列的实验结果示于表17中(试验2)。表17中试验2的菌株也用SDS-PAGE进行分析,如本文所述。在SDS-PAGE分析中,除MBin500之外,试验2中的所有菌株在29kD处都具有条带。该蛋白质条带的大小与其作为YMR226c基因编码的蛋白质的身份是吻合的。试验2中的yMhCt005和87/77#2在53kD处具有条带,而该试验中的其他三个样品中却不存在该条带。该蛋白质条带的大小与其作为UGA1基因编码的蛋白质的身份是吻合的。
另一个测定系列的实验结果示于表17中(试验3)。表17中试验3的菌株也用SDS-PAGE进行分析,如本文所述。在SDS-PAGE分析中,除MBin500之外,试验3中的所有菌株在53kD和29kD处都具有条带。该蛋白质条带的大小分别与其作为UGA1和YMR226c基因编码的蛋白质的身份是吻合的。在SDS-PAGE分析中,试验3中的MBin500和yMhCt005在64kD处具有条带,而该试验中的yMhCt008和yMhCt009中却不存在该条带。该蛋白质条带的大小与其作为东方伊萨酵母酵母CNB1的天然丙酮酸脱羧酶(PDC)基因编码的蛋白质的身份是吻合的。
另一个测定系列的实验结果示于表17中(试验4)。表17中试验4的菌株也用SDS-PAGE进行分析,如本文所述。在SDS-PAGE分析中,除MBin500之外,试验4中的所有菌株在29kD处都具有条带。该蛋白质条带的大小与其作为YMR226c基因编码的蛋白质的身份是吻合的。试验4中的yMhCt005,yMhCt008和yMhCt009在53kD处具有条带,该蛋白质条带的大小与UGA1基因编码的蛋白质是吻合的。试验4中的yMhCt013和yMhCt014菌株在53kD处也有一条微弱的条带,该条带的大小与PYD4基因编码的蛋白质是吻合的。试验4中的MBin500,yMhCt004和yMhCt005在64kD处具有条带,而该条带在菌株yMhCt008,yMhCt009,yMhCt013和yMhCt014中并不存在。该蛋白质条带的大小与其作为东方伊萨酵母酵母CNB1的天然丙酮酸脱羧酶(PDC)基因编码的蛋白质的身份是吻合的。
使用本文所述的方法,在生物反应器中测试菌株MBin500和yMhCt008,评估3-HP生产。对照菌株Mbin500并没有产生可检测的3-HP(两个独立发酵的平均值)。菌株yMhCt008产生2.45g/L的3-HP(12个独立发酵的平均值)。
实施例3A-6:在adh1202基因座表达β-丙氨酸氨基转移酶(BAAT)或3-羟基丙酸脱 氢酶(3-HPDH),在pdc基因座表达天冬氨酸1-脱羧酶(ADC),β-丙氨酸氨基转移酶(BAAT)和 3-羟基丙酸脱氢酶(3-HPDH)的酵母菌株
用NotI和PvuI消化20μg pMhCt077,pMhCt083和pMhCt087(如上),然后以89mMTris碱-89mM硼酸-2mM EDTA二钠缓冲液(TBE)中进行1%琼脂糖凝胶电泳。NotI消化片段3815bp,5332bp或5320bp分别来自于pMhCt077,pMhCt083和pMhCt087,从凝胶中切割下来,并使用
Figure BDA0001451815470001142
Gel Extract KiT(Qiagen)从琼脂糖中提取。将560ng NotI消化后的pMhCt077和560ng NotI消化后的pMhCt083或pMhCt087转化进菌株MIba320,MIBa321和MIBa322。MIBa320用pMhCt077/83以及pMhCt077/87组合转化。MIBa321用pMhCt077/87转化,MIBa322用pMhCt077/83转化,如本文所述。将转化体涂布于ura选择培养基上,室温孵育约60小时。转化体在ura选择培养基上重新划线,在37℃下孵育过夜。从URA3+菌落中制备基因组DNA,如本文所述使用PCR检查以验证表达盒的整合。引物对611814和611554扩增出1.9kbp片段表明整合。引物对611555和611554扩增出1.4kbp片段表明是野生型基因座。用611554和611814扩增出1.9kbp PCR片段,用611555和611554扩增出1.4kbp片段的每个品系中的一个URA3+转化体被保存,它们被命名为MIBa323,MIBa324,MIBa325和MIBa327(见表18的基因型)。启动子和终止子来源于东方伊萨酵母基因。
表18:转化体基因型
Figure BDA0001451815470001141
Figure BDA0001451815470001151
菌株在摇瓶培养,如本发明中所述制备CFE并测试3-HP脱氢酶(3-HPDH)活性。结果示于表19中。
表19:转化体酶活性数据
Figure BDA0001451815470001152
如本发明所描述分离MIBa323、MIBa324、MIBa325和MIBa327的Ura-衍生体。如本发明所描述的,从FOA抗性菌落制备基因组DNA并以PCR检查来确定失去了URA3选择标志物。引物0611815在左端构建体RKI终止子退火并向URA3启动子扩增,而引物0611817在TDH3启动子退火并反向朝URA3盒扩增。828bp条带的存在表示仅URA3残留位点的存在(在亲本菌株中两个URA3启动子间同源重组后留下的单个URA3启动子),而约2.2kbp条带表示完整URA3启动子-URA3ORF-URA3终止子-URA3启动子盒的存在,表明所需的重组事件没有发生。以引物0611815和0611817获得了828bp PCR片段的MIBa323、MIBa324、MIBa325和MIBa327的Ura-菌株被保存并被分别命名为MIBa335、MIBa333、MIBa334和MIBa336。
按上面MIBa320-2转化部分中所描述,以来自pMhCt077和pMhCt087的片段转化菌株MIBa333和MIBa334,并以来自pMhCt077和pMhCt083的片段转化菌株MIBa335和MIBa336。如本发明中所描述通过在ura选择培养基上生长来选择转化体。如本发明所描述的,从URA3+菌落制备基因组DNA并以PCR检查来确定表达盒的整合。引物0611815在左端构建体RKI终止子退火并向URA3启动子扩增。引物0611817在TDH3启动子退火并反向朝URA3盒扩增。对第一整合所期望的828bp条带的存在表示仅URA3残留位点的存在(在亲本菌株中两个URA3启动子间同源重组后留下的单个URA3启动子),而对第二整合约2.2kbp条带表示完整URA3启动子-URA3ORF-URA3终止子-URA3启动子盒的存在。当ura标志存在时,引物对0611815和0611816扩增625bp片段。当PDC基因座存在时,引物0611555和0611554扩增1.4kbp片段。纯合的整合株不应该能以这些引物扩增片段。保存以引物0611815和0611817扩增出828bp和2.2kbp PCR片段的,以引物0611815和0611816扩增出625bp的,以引物0611555和0611554未扩增出片段的每个品系的一个URA3+转化体;这些被命名为MIBa340、MIBa341、MIBa345和MIBa348(见表20A)。启动子和终止子来自东方伊萨酵母基因。
表20A:转化体基因型
Figure BDA0001451815470001161
Figure BDA0001451815470001171
比较从菌株MBin500(对照)、MIBa345、MIBa348、MIBa340和MIBa341制备的CFE中的天冬氨酸1-脱羧酶(ADC),β-丙氨酸氨基转移酶(BAAT)和3-HP脱氢酶(3-HPDH)活性。该实验的结果显示于表20B中。
表20B:转化体酶活性数据
Figure BDA0001451815470001172
实施例3A-7:具有用于在adh1202基因座表达天冬氨酸1-脱羧酶(ADC)的多个核苷 酸序列的插入载体左端片段
设计构建体以在东方伊萨酵母adh1202基因座掺入编码ADC(SEQ ID NO:17)的四个核苷酸拷贝。使用与本发明所描述的对PDC基因座所用方法类似的方法,设计左端和右端构建体以允许同源重组。整合载体的一般设计和所需的重组事件在图3中显示。该方法也被用于表达如下面实施例中所描述的可选的ADC(SEQ ID NO:139)。
为了防止重组在编码相同ADC序列的多个核苷酸拷贝之间发生,设计四种不同的为在东方伊萨酵母中表达而密码子优化的核苷酸序列(SEQ ID NO:130、145、146和147)以编码相同的SEQ ID NO:17的ADC序列。此外,由于构建体的初始设置被设计为靶向东方伊萨酵母的ald5680基因座,adh1202靶向序列在克隆的后面步骤中被掺入这些载体。ald5680构建体可以被用于靶向东方伊萨酵母CNB1菌株中的第二基因座,该菌株中在adh1202异位的四个panD拷贝与在ald5680的四个另外的panD拷贝已纯合。
如下构建左端ald5680靶向载体。以引物0612271和0612272扩增含紧接着ald5680ORF的5’端的序列,连同有所需的另外限制性位点和克隆用的侧翼DNA的PCR产物。PCR反应体系(50μL)包含1μL 1比50稀释的pHJJ75小量制备质粒DNA(图23),1X iproofTMHF缓冲液(Bio-Rad Laboratories),引物0612271和0612272每种100pmol,dATP、dCTP、dGTP和dTTP每种200μM,和1个单位的iProofTMHigh Fidelity DNA聚合酶(Bio-RadLaboratories)。在
Figure BDA0001451815470001181
(Eppendorf Scientific)中进行PCR,程序为98℃ 30秒的1个循环,随后是每个为98℃ 10秒,59℃ 20秒和72℃ 45秒的32个循环,及72℃ 10分钟的最后延伸。热循环后,以TAE缓冲液中1%琼脂糖凝胶电泳来分离PCR反应产物,其中约930碱基对的PCR产物被从凝胶上切下并根据制造商的说明使用
Figure BDA0001451815470001182
Extract II KiT(Macherey-Nagel)纯化。
为允许纯化更大量的DNA,使用纯化的930bp PCR产物作为模板DNA来重复上述PCR反应。设置5个50μL的反应并以上述条件扩增,除了以1μL纯化的930bp PCR产物替代pHJJ75质粒(如上)作为模板DNA。热循环后,如上纯化扩增的930bp产物。
含PDC promo-optPanD-ENO1-UGA1的片段(其含有SEQ ID NO:130的为东方伊萨酵母密码子优化的阿维链霉菌ADC编码序列)通过NotI和EcoRI消化,从pMhCt087(如上)上切下。10μg pMhCt087的中量制备品被以NotI和EcoRI消化并随后通过TAE缓冲液中0.9%琼脂糖凝胶电泳纯化。约4.4kbp的条带被从凝胶上切下并根据制造商的说明使用
Figure BDA0001451815470001183
Extract II KiT(Macherey-Nagel)纯化。
使用引物0612273和0612274扩增含URA3分裂标志的5’半边,并有所需的另外限制性位点和克隆用的侧翼DNA的PCR产物。PCR反应体系(50μL)包含1μL 1比50稀释的pMhCt082小量制备质粒DNA(如上),1X iproofTM HF缓冲液(Bio-Rad Laboratories),引物0612273和0612274每种100pmol,dATP、dCTP、dGTP和dTTP每种200μM,和1个单位的iProof TMHighFidelity DNA聚合酶(Bio-Rad Laboratories)。在
Figure BDA0001451815470001184
(Eppendorf Scientific)中进行PCR,程序为98℃ 30秒的1个循环,随后是每个为98℃ 10秒,59℃ 20秒和72℃ 45秒的32个循环,及72℃ 10分钟的最后延伸。热循环后,以TAE缓冲液中1%琼脂糖凝胶电泳来分离PCR反应产物,其中约960碱基对的PCR产物被从凝胶上切下并根据制造商的说明使用
Figure BDA0001451815470001191
Extract II KiT(Macherey-Nagel)纯化。
为构建上述DNA片段的接收载体,质粒pUC19(Yanisch-Perron,C,Vieira,J.和Messing,J.(1985)Gene,33,103-119)被以Hind III和EcoRI消化,以10个单位的小牛肠磷酸酶(New England Biolabs)在37℃下处理30分钟,并以TAE缓冲液中0.9%琼脂糖凝胶电泳纯化,约2.6kbp的条带被从凝胶上切下并根据制造商的说明使用
Figure BDA0001451815470001192
Extract II KiT(Macherey-Nagel)纯化。
来自上面的纯化的930bp、4.4kbp和960bp的DNA片段随后被使用IN-FUSIONTMAdvantage PCR Cloning KiT(Clontech)在10μL总反应体积中插入消化的pUC19片段,10μL总反应体积由150ng以Hind III和EcoRI消化的pUC19载体,56ng含ald5680侧翼DNA的930bpDNA,250ng来自以NotI和EcoRI消化的pMhCt087的PDC promo-optPanD-ENO1-UGA1片段,55ng含URA3分裂标志5’半边的960bpPCR产物,1X In-Fusion反应缓冲液(Clontech)和1μLIN-FUSIONTM酶(Clontech)构成。反应物在37℃孵育15分钟,在50℃ 15分钟,随后被置于冰上。随后以40μLTE缓冲液稀释反应物并根据制造商的说明使用2.5μL来转化Solo PackGold Super Competent Cells(Agilent Technologies)。转化体被涂布于2X YT+amp平板上并在室温下孵育3天。通过Sall和Hpal消化筛选到数个合适插入了所需PCR产物的所得转化体。产生所需片段大小的克隆通过DNA测序来确认正确并命名为pMhCt089。
接下来,以编码SEQ ID NO:17ADC的,为在东方伊萨酵母中表达而密码子优化的阿维链霉菌panD基因来替代pMhCt089中的UGA1ORF。通过
Figure BDA0001451815470001193
在pMA-T载体中合成阿维链霉菌panD型式r1(SEQ ID NO:145)。以Xbal和Pacl消化质粒pMA-T,得到的片段被以TAE缓冲液中0.9%琼脂糖凝胶电泳分离,约434bp的条带被从胶上切下并根据制造商的说明使用
Figure BDA0001451815470001194
Extract II KiT(Macherey-Nagel)纯化。质粒pMhCt089被以Xbal和Pacl消化,以10个单位的小牛肠磷酸酶(New England Biolabs)在37℃下处理30分钟,而得到的片段被以TAE缓冲液中0.9%琼脂糖凝胶电泳分离,约4.5kbp的条带被从凝胶上切下并根据制造商的说明使用
Figure BDA0001451815470001195
Extract II KiT(Macherey-Nagel)纯化。在含1X Quick连接缓冲液(New England Biolabs),2μL Xbal/Pacl pMhCt089载体,2μLXbal/Pacl阿维链霉菌panD型式r1插入物,和1μLQuick T4DNA连接酶(New England Biolabs)的连接体系中(20μL)将pMhCt089载体和阿维链霉菌panD型式r1结合。连接反应物被在室温下孵育5分钟,并随后被置于冰上。5μL该反应物被用于根据制造商的说明转化ONE
Figure BDA0001451815470001201
TOP10化学感受态大肠杆菌细胞(Invitrogen)。转化体被涂布于2X YT+amp平板上并在室温下孵育3天。通过Xbal和Pacl消化筛选到数个合适插入了所需PCR产物的所得转化体。产生所需片段大小的克隆通过DNA测序来确认正确并命名为pMhCt092。
左端构建体的最后克隆步骤是以adh1202 5’同源区域替代存在于pMhCt092中的ald5680 5’同源区域。以引物0612470和0612471扩增含ald1202ORF 5’端序列,连同有所需的另外限制性位点和克隆用的侧翼DNA的PCR产物。PCR反应体系(50μL)包含1μL 1比50稀释的pGMEr140小量制备质粒DNA(本发明所描述pMIBa107的衍生体,其中PCR扩增的区域相同),1X iproofTMHF缓冲液(Bio-Rad Laboratories),引物0612470和0612471每种100pmol,dATP、dCTP、dGTP和dTTP每种200μM,和1个单位的iProof TMHigh Fidelity DNA聚合酶(Bio-Rad Laboratories)。在
Figure BDA0001451815470001202
Figure BDA0001451815470001203
(EppendorfScientific)中进行PCR,程序为98℃ 30秒的1个循环,随后是每个为98℃ 10秒,59℃ 20秒和72℃ 30秒的34个循环,及72℃ 10分钟的最后延伸。热循环后,以TAE缓冲液中1%琼脂糖凝胶电泳来分离PCR反应产物,其中约790bp的PCR产物被从凝胶上切下并根据制造商的说明使用
Figure BDA0001451815470001204
Extract II KiT(Macherey-Nagel)纯化。
为构建上述DNA片段的接收载体,质粒pMhCt092被以Hpal和NotI消化,以10个单位的小牛肠磷酸酶(New England Biolabs)在37℃下处理30分钟,并以TAE缓冲液中0.9%琼脂糖凝胶电泳纯化,约7.0kbp的条带被从凝胶上切下并根据制造商的说明使用
Figure BDA0001451815470001205
Extract II KiT(Macherey-Nagel)纯化。使用IN-FUSIONTM AdvantagePCR Cloning KiT(Clontech)在10μL总反应体积中将PCR产物和线性载体联结,10μL总反应体积由120ng以Hpal和NotI消化的pMhCt092载体,30ng含adh1202 5’同源区的PCR产物,1XIn-Fusion反应缓冲液(Clontech)和1μL IN-FUSIONTM酶(Clontech)构成。反应物在37℃孵育15分钟,在50℃ 15分钟,随后被置于冰上。以40μLTE缓冲液稀释反应物并根据制造商的说明使用2.5μL来转化Solo Pack Gold Super Competent Cells(AgilentTechnologies)。转化体被涂布于2X YT+amp平板上并在室温下孵育过夜。通过BamHI和Pstl消化筛选到数个合适插入了所需PCR产物的所得转化体。产生所需片段大小的克隆通过DNA测序来确认正确并命名为pMhCt095(图12)。
质粒pMhCt095是左端东方伊萨酵母adh1202靶向构建体,其含有驱动为在东方伊萨酵母中表达而密码子优化的阿维链霉菌ADC基因(SEQ ID NO:130)表达的PDC启动子,TAL终止子,驱动为在东方伊萨酵母中表达而密码子优化的第二阿维链霉菌ADC基因(SEQ IDNO:145)表达的ENO1启动子,东方伊萨酵母RKI终止子,东方伊萨酵母URA3启动子和东方伊萨酵母URA3ORF的5’片段。
实施例3A-8:具有用于在adh1202基因座表达天冬氨酸1-脱羧酶(ADC)的多个核苷 酸序列的插入载体右端片段
以引物0612275和0612276扩增含东方伊萨酵母URA3ORF 3’片段,连同有所需的另外限制性位点和克隆用的侧翼DNA的PCR产物。PCR反应体系(50μL)包含1μL 1比50稀释的pMhCt069小量制备质粒DNA(如上),1X iproofTMHF缓冲液(Bio-Rad Laboratories),引物0612275和0612276每种100pmol,dATP、dCTP、dGTP和dTTP每种200μM,和1个单位的iProofTMHigh Fidelity DNA聚合酶(Bio-Rad Laboratories)。在
Figure BDA0001451815470001211
Figure BDA0001451815470001212
(Eppendorf Scientific)中进行PCR,程序为98℃ 30秒的1个循环,随后是每个为98℃ 10秒,59℃ 20秒和72℃ 45秒的32个循环,及72℃ 10分钟的最后延伸。热循环后,以TAE缓冲液中1%琼脂糖凝胶电泳来分离PCR反应产物,其中约1155bp的PCR产物被从胶上切下并根据制造商的说明使用
Figure BDA0001451815470001213
Extract II KiT(Macherey-Nagel)纯化。
含TDH3启动子,用于异位基因插入的Xbal和Pacl限制性位点,和PDC终止子的片段通过以NotI和Pmel消化被从pMhCt069上切下。10μg pMhCt069的中量制备品被以NotI和Pmel消化,并随后通过TAE缓冲液中0.9%琼脂糖凝胶电泳纯化。约1.85kbp的条带被从凝胶上切下并根据制造商的说明使用
Figure BDA0001451815470001214
Extract II KiT(Macherey-Nagel)纯化。
以引物0612277和0612278扩增含ald5680ORF 3’序列,连同有所需的另外限制性位点和克隆用的侧翼DNA的PCR产物。PCR反应体系(50μL)包含1μL 1比50稀释的pHJJ75小量制备质粒DNA(图23),1X iproofTMHF缓冲液(Bio-Rad Laboratories),引物0612277和0612278每种100pmol,dATP、dCTP、dGTP和dTTP每种200μM,和1个单位的iProof TMHighFidelity DNA聚合酶(Bio-Rad Laboratories)。在
Figure BDA0001451815470001221
(Eppendorf Scientific)中进行PCR,程序为98℃ 30秒的1个循环,随后是每个为98℃ 10秒,59℃ 20秒和72℃ 45秒的32个循环,及72℃ 10分钟的最后延伸。热循环后,以TAE缓冲液中1%琼脂糖凝胶电泳来分离PCR反应产物,其中约844bp的PCR产物被从凝胶上切下并根据制造商的说明使用
Figure BDA0001451815470001222
Extract II KiT(Macherey-Nagel)纯化。
来自上面的纯化的1155bp、1.85kbp和844bp的DNA片段随后被使用IN-FUSIONTMAdvantage PCR Cloning KiT(Clontech)在10μL总反应体积中插入以EcoRI和Hind III消化的pUC19,10μL总反应体积由150ng以Hind III和EcoRI消化的pUC19载体,66ng含URA3分裂标志3’部分的1155bpDNA;106ng来自以Pmel和NotI消化的并含TDH3启动子,用于异位基因插入的Xbal和Pacl限制性位点,和PDC终止子的来自pMhCt069的1.85kbp片段;48ng含3’ald5680侧翼DNA的844bp PCR产物;1X In-Fusion反应缓冲液(Clontech)和1μL IN-FUSIONTM酶(Clontech)构成。反应物在37℃孵育15分钟,在50℃ 15分钟,随后被置于冰上。以40μL TE缓冲液稀释反应物并根据制造商的说明使用2.5μL来转化Solo Pack GoldSuper Competent Cells(Agilent Technologies)。转化体被涂布于2X YT+amp平板上并在室温下孵育3天。通过Sall和Hpal消化筛选到数个合适插入了所需PCR产物的所得转化体。产生所需片段大小的克隆通过DNA测序来确认正确并命名为ald5680右#20。
如下在TDH3启动子和ald5680右#20的3’ald5680侧翼DNA之间加入TKL终止子,PGK1启动子,Xbal和Pacl限制性位点以及PDC终止子区域的较短型式。以引物0612356和0612357扩增TKL终止子连同所需的另外限制性位点和克隆用的侧翼DNA。使用退火温度的温度梯度和在某些反应中的DMSO来扩增所需的PCR产物。准备四个相同的PCR反应体系,每个PCR反应体系(50μL)包含1μL 1比50稀释的pACN23小量制备质粒DNA(图20),1XiproofTMHF缓冲液(Bio-Rad Laboratories),引物0612356和0612357每种100pmol,dATP、dCTP、dGTP和dTTP每种200μM,和1个单位的iProof TMHigh Fidelity DNA聚合酶(Bio-RadLaboratories)。如上设置第二组四个管,除了每个反应包括加入1.5μL的DMSO。在
Figure BDA0001451815470001223
(Eppendorf Scientific)中进行PCR,程序为98℃ 30秒的1个循环,随后是每个为98℃ 10秒,X℃ 20秒,其中X=47.6℃、51.8℃、57.1℃或62.1℃,和72℃ 45秒的32个循环,及72℃ 10分钟的最后延伸。在每个退火温度进行有和没有DMSO的PCR。热循环后,以TAE缓冲液中1%琼脂糖凝胶电泳来分离每种10μL的PCR反应物。对该凝胶的观察显示有DMSO在两个最高的退火温度进行的,以及没有DMSO在两个最低退火温度进行的PCR反应给出了所需844bp产物的最高产量。将这四个PCR反应物结合,以TAE缓冲液中1%琼脂糖凝胶电泳来分离,其中约844碱基对的PCR产物被从凝胶上切下并根据制造商的说明使用
Figure BDA0001451815470001231
Extract II KiT(Macherey-Nagel)纯化。
以两步骤过程来完成所需PGK1启动子区域的PCR扩增。首先,以下面引物0612150和0612151扩增之后克隆含PGK1启动子的PCR产物。PCR反应体系(50μL)包含3μL pJLJ49小量制备质粒DNA(图25),1X Pfx扩增缓冲液(Invitrogen),2mm MgSO4,引物0612150和0612151每种100pmol,dATP、dCTP、dGTP和dTTP每种200μM,和1.25个单位的
Figure BDA0001451815470001232
PfxDNA聚合酶(InvitrogenBio-Rad Laboratories)。在
Figure BDA0001451815470001233
Figure BDA0001451815470001234
(Eppendorf Scientific)中进行PCR,程序为95℃ 2分钟的1个循环,随后是每个为95℃ 1分钟,55℃ 1分钟和72℃ 3分钟的25个循环,及72℃ 10分钟的最后延伸。热循环后,以TAE缓冲液中1%琼脂糖凝胶电泳来分离PCR反应产物,其中约630bp的PCR产物被从凝胶上切下并根据制造商的说明使用
Figure BDA0001451815470001235
Extract II KiT(Macherey-Nagel)纯化。
根据制造商的说明,使用测序用Zero
Figure BDA0001451815470001236
PCR Cloning KiT(Invitrogen)将约630bp的PCR产物克隆进pCR4TM BLUNT
Figure BDA0001451815470001237
载体(Invitrogen)。在6μL总反应体积中,0.5或4μL 630bp PCR产物,1μL盐溶液(Invitrogen)和1μL pCR4TM BLUNT
Figure BDA0001451815470001238
(Invitrogen)一起在室温孵育15分钟。根据制造商的说明每种克隆反应物2μL被转化入ONE
Figure BDA0001451815470001239
TOP10化学感受态大肠杆菌细胞(Invitrogen)。转化体被置于LB+kan平板上并在37℃孵育过夜。通过EcoRI消化筛选到数个合适插入了所需PCR产物的所得转化体。产生所需片段大小的克隆通过DNA测序来确认正确并命名为PGK1_in_TOPO。
用作PCR模板之前,来自PGK1_in_TOPO的PGK1启动子被如下分离并纯化。25μL的PGK1_in_TOPO中量制备品以Xbal和Pacl消化并通过TAE缓冲液中0.9%琼脂糖凝胶电泳来纯化,而约640bp的PCR产物被从凝胶上切下并根据制造商的说明使用
Figure BDA0001451815470001241
Extract II KiT(Macherey-Nagel)纯化。
使用温度梯度以引物0612358和0612359扩增PGK1启动子连同所需的另外限制性位点和克隆用的侧翼DNA。设置八个相同的PCR反应,每个PCR反应体系(50μL)包含20ng通过PGK1_in_TOPO的Xbal和Pacl消化得到的纯化PGK1启动子DNA,1X Herculase反应缓冲液(Agilent Technologies),引物0612358和0612359每种100pmol,dATP、dCTP、dGTP和dTTP每种200μM,和2.5个单位的Herculase HotStart DNA聚合酶(Agilent Technologies)。在
Figure BDA0001451815470001242
(Eppendorf Scientific)中进行PCR,程序为98℃ 30秒的1个循环,随后是每个为98℃ 10秒,X℃ 20秒,其中X=53.7℃、55.4℃、57.6℃、60.0℃、62.4℃、64.8℃、66.9℃、68.6℃,和72℃ 45秒的32个循环,及72℃ 10分钟的最后延伸。热循环后,以TAE缓冲液中1%琼脂糖凝胶电泳来分离每种10μL的PCR反应物。该胶的观察显示以最高退火温度进行的PCR反应给出了所需约700bp产物的最高产量。将这四个PCR反应物结合,以TAE缓冲液中1%琼脂糖凝胶电泳来分离,其中约700碱基对的PCR产物被从凝胶上切下并根据制造商的说明使用
Figure BDA0001451815470001243
Extract II KiT(Macherey-Nagel)纯化。
质粒ald5680右#20包含来自东方伊萨酵母PDC ORF的约870bp的下游区域作为PDC终止子区域。然而,该区域可能比作为终止子适合功能所需的大,而如果保持在其目前的大小,该区域可能起对不想要的PDC基因座重组的催化剂的作用。因此,以引物0612360和0612361扩增以较小型式替换ald5680右#20中PDC终止子的PCR产物。使用退火温度的温度梯度和在某些反应中的DMSO来扩增所需的PCR产物。建立四个相同的PCR反应体系,每个PCR反应体系(50μL)包含1μL 1比50稀释的pJLJ49小量制备质粒DNA(图25),1X iproofTMHF缓冲液(Bio-Rad Laboratories),引物0612360和0612361每种100pmol,dATP、dCTP、dGTP和dTTP每种200μM,和1个单位的iProofTMHigh Fidelity DNA聚合酶(Bio-Rad Laboratories)。如上设置第二组四个管,除了每个反应包括加入1.5μL的DMSO。在
Figure BDA0001451815470001244
Figure BDA0001451815470001245
(Eppendorf Scientific)中进行PCR,程序为98℃ 30秒的1个循环,随后是每个为98℃ 10秒,X℃ 20秒,其中X=47.6℃、51.8℃、57.1℃或62.1℃,和72℃45秒的32个循环,及72℃ 10分钟的最后延伸。对于所示的每个退火温度,都实施了有和没有DMSO的PCR反应。热循环后,以TAE缓冲液中1%琼脂糖凝胶电泳来分离每种10μL的PCR反应物。对该凝胶的观察显示有DMSO进行的四个PCR反应,无论退火温度,给出了所需338bp产物的最高产量。将这四个PCR反应物结合,以TAE缓冲液中1%琼脂糖凝胶电泳来分离,其中约338碱基对的PCR产物被从凝胶上切下并根据制造商的说明使用
Figure BDA0001451815470001251
Extract II KiT(Macherey-Nagel)纯化。
使用PCR构建将约700bp含PGK1的PCR产物的融合到338bp的PDC终止子产物上的单独扩增产物。PCR反应体系(50μL)包含107ng含PGK1的PCR产物,56ng含PDC终止子的PCR产物,1X Phusion HF缓冲液(New England Biolabs),引物0612358和0612361每种100pmol,dATP、dCTP、dGTP和dTTP每种200μM,和1个单位的Phusion TMHigh Fidelity DNA聚合酶(NewEngland Biolabs)。在
Figure BDA0001451815470001252
(Eppendorf Scientific)中进行PCR,程序为98℃ 30秒的1个循环,随后是每个为98℃ 10秒,56℃ 20秒和72℃ 2分钟45秒的34个循环,及72℃ 10分钟的最后延伸。热循环后,以TAE缓冲液中0.9%琼脂糖凝胶电泳来分离PCR反应产物,其中约1020碱基对的PCR产物被从凝胶上切下并根据制造商的说明使用
Figure BDA0001451815470001253
Extract II KiT(Macherey-Nagel)纯化。
质粒ald5680右#20被以Xbal和Notl消化,以10个单位的小牛肠磷酸酶(NewEngland Biolabs)在37℃下处理30分钟,并以TAE缓冲液中0.9%琼脂糖凝胶电泳纯化。约5.6kbp的条带被从凝胶上切下并根据制造商的说明使用
Figure BDA0001451815470001254
Extract IIKiT(Macherey-Nagel)纯化。
来自上面的纯化的487bp和1020bp的PCR产物随后被使用IN-FUSIONTM AdvantagePCR Cloning KiT(Clontech)在10μL总反应体积中插入消化的ald5680右#20片段,10μL总反应体积由150ng以Xbal和Notl消化的ald5680右#20载体,13ngTKL终止子PCR产物,28ngPGK1启动子-PDC终止子PCR产物,1X In-Fusion反应缓冲液(Clontech)和1μL IN-FUSIONTM酶(Clontech)构成。反应物在37℃孵育15分钟,在50℃ 15分钟,随后被置于冰上。以40μLTE缓冲液稀释反应物并根据制造商的说明使用2.5μL来转化Solo Pack Gold SuperCompetent Cells(Agilent Technologies)。转化体被涂布于2X YT+amp平板上并在37℃下孵育过夜。通过Accl消化筛选到数个合适插入了所需PCR产物的所得转化体。产生所需片段大小的克隆通过DNA测序来确认正确并命名为pMhCt091。
质粒pMhCt091是空的右端东方伊萨酵母ald5680靶向构建体,其包含东方伊萨酵母URA3 ORF的3’片段,随后有用于加入感兴趣基因的Nhel和Ascl限制性位点的东方伊萨酵母TDH3启动子,东方伊萨酵母TKL终止子,随后有用于加入第二感兴趣基因的Xbal和Pacl限制性位点的东方伊萨酵母PGK1启动子,东方伊萨酵母PDC终止子,和将同源重组靶向3’ald5680基因座的侧翼DNA。
通过
Figure BDA0001451815470001261
在载体1075328_SaPanD_r5中合成阿维链霉菌panD型式r5(SEQID NO:146)。Xbal和Pacl限制性位点被改变为通过PCR克隆进pMhCt091 5’克隆位点所需的Nhel和Ascl位点。PCR反应体系(50μL)包含1μL 1比50稀释的1075328_SaPanD_r5小量制备质粒DNA
Figure BDA0001451815470001262
1X iproofTM HF缓冲液(Bio-Rad Laboratories),引物0612378和0612379每种100pmol,dATP、dCTP、dGTP和dTTP每种200μM,1.5μL DMSO和1个单位的iproofTMHigh Fidelity DNA聚合酶(Bio-Rad Laboratories)。在
Figure BDA0001451815470001263
Figure BDA0001451815470001264
(Eppendorf Scientific)中进行PCR,程序为98℃ 30秒的1个循环,随后是每个为98℃ 10秒,59℃ 20秒和72℃ 30秒的34个循环,及72℃ 10分钟的最后延伸。热循环后,以TAE缓冲液中0.9%琼脂糖凝胶电泳来分离PCR反应产物,其中约471个碱基对的PCR产物被从凝胶上切下并根据制造商的说明使用
Figure BDA0001451815470001265
Extract IIKiT(Macherey-Nagel)纯化。
质粒pMhCt091(如上)被以Nhel和Ascl消化,以10个单位的小牛肠磷酸酶(NewEngland Biolabs)在37℃下处理30分钟,并以TAE缓冲液中0.9%琼脂糖凝胶电泳纯化。约6.9kbp的条带被从凝胶上切下并根据制造商的说明使用
Figure BDA0001451815470001266
Extract IIKiT(Macherey-Nagel)纯化。来自上面的含panD r5的纯化PCR产物随后被使用IN-FUSIONTMAdvantage PCR Cloning KiT(Clontech)在10μL总反应体积中插入消化的pMhCt091片段,10μL总反应体积由150ng以Nhel和Ascl消化的pMhCt091载体,19ng panD r5PCR产物,1XIn-Fusion反应缓冲液(Clontech)和1μL IN-FUSIONTM酶(Clontech)构成。反应物在37℃孵育15分钟,在50℃ 15分钟,随后被置于冰上。以40μL TE缓冲液稀释反应物并根据制造商的说明使用2.5μL来转化Solo Pack Gold Super Competent Cells(AgilentTechnologies)。转化体被涂布于2X YT+amp平板上并在37℃孵育过夜。通过Smal消化筛选到数个合适插入了所需PCR产物的所得转化体。产生所需片段大小的克隆通过DNA测序来确认正确并命名为pMhCt093。
质粒pMhCt093被以Xbal和Pacl消化,以10个单位的小牛肠磷酸酶(New EnglandBiolabs)在37℃下处理30分钟,并以TAE缓冲液中0.9%琼脂糖凝胶电泳纯化。约7.4kbp的条带被从凝胶上切下并根据制造商的说明使用
Figure BDA0001451815470001271
Extract II KiT(Macherey-Nagel)纯化。通过
Figure BDA0001451815470001272
在载体pMA-T中合成为在东方伊萨酵母中表达而被密码子优化的阿维链霉菌panD型式r2(SEQ ID NO:147)。以Xbal和Pacl消化质粒并以TAE缓冲液中0.9%琼脂糖凝胶电泳分离得到的片段。约434bp的条带被从凝胶上切下并根据制造商的说明使用
Figure BDA0001451815470001273
Extract II KiT(Macherey-Nagel)纯化。
上面纯化的~434bp片段在连接反应体系(20μL)中被克隆进Xbal和Pacl消化的pMhCt093载体,连接反应体系(20μL)含1X Quick连接缓冲液(New England Biolabs),2μL以Xbal和Pacl消化的pMhCt093载体,2μL上述的~434bp片段,和1μL Quick T4DNA连接酶(New England Biolabs)。连接反应物在室温下孵育5分钟,随后管被置于冰上。5μL该反应物被用于根据制造商的说明来转化Solo Pack Gold Super Competent Cells(AgilentTechnologies)。转化体被涂布于2X YT+amp平板上并在室温下孵育3天。通过Xbal和Pacl消化筛选到数个合适插入了所需PCR产物的所得转化体。选择分离的pMhCt094来进行之后的工作。
右端构建体的最后克隆步骤是以adh1202 3’同源区域替代存在于pMhCt094中的ald5680 3’同源区域。以引物612472和612473扩增含紧接着ald1202ORF的3’端的序列,连同有所需的另外限制性位点和克隆用的侧翼DNA的PCR产物。PCR反应体系(50μL)包含1μL 1比50稀释的pGMEr140小量制备质粒DNA(如上),1X iproofTMHF缓冲液(Bio-RadLaboratories),引物0612472和0612473每种100pmol,dATP、dCTP、dGTP和dTTP每种200μM,和1个单位的iProof TMHigh Fidelity DNA聚合酶(Bio-Rad Laboratories)。在
Figure BDA0001451815470001274
(Eppendorf Scientific)中进行PCR,程序为98℃ 30秒的1个循环,随后是每个为98℃ 10秒,59℃ 20秒和72℃ 30秒的34个循环,及72℃10分钟的最后延伸。热循环后,以TAE缓冲液中1%琼脂糖凝胶电泳来分离PCR反应产物,其中约620碱基对的的PCR产物被从凝胶上切下并根据制造商的说明使用
Figure BDA0001451815470001275
Extract II KiT(Macherey-Nagel)纯化。
为构建上述DNA片段的接收载体,质粒pMhCt094被以sacII和NotI消化,以10个单位的小牛肠磷酸酶(New England Biolabs)在37℃下处理30分钟,并以TAE缓冲液中0.9%琼脂糖凝胶电泳纯化,约7.0kbp的条带被从凝胶上切下并根据制造商的说明使用
Figure BDA0001451815470001281
Extract II KiT(Macherey-Nagel)纯化。使用IN-FUSIONTM AdvantagePCR Cloning KiT(Clontech)在10μL总反应体积中将PCR产物和线性载体联结,10μL总反应体积由191ng以Sacll和NotI消化的pMhCt094载体,36ng含adh12023’同源区的PCR产物,1XIn-Fusion反应缓冲液(Clontech)和1μL IN-FUSIONTM酶(Clontech)构成。反应物在37℃孵育15分钟,在50℃ 15分钟,随后被置于冰上。以40μL TE缓冲液稀释反应物并根据制造商的说明使用2.5μL来转化Solo Pack Gold Super Competent Cells(AgilentTechnologies)。转化体被涂布于2X YT+amp平板上并在37℃孵育过夜。通过Nsil和Pvul消化筛选到数个合适插入了所需PCR产物的所得转化体。产生所需片段大小的克隆通过DNA测序来确认正确并命名为pMhCt096(图13)。
质粒pMhCt096是右端东方伊萨酵母adh1202靶向构建体,其含有东方伊萨酵母URA3ORF的3’片段,驱动为在东方伊萨酵母中表达而密码子优化的第三阿维链霉菌ADC基因(SEQ ID NO:146)表达的东方伊萨酵母TDH3启动子,东方伊萨酵母TKL终止子,驱动为在东方伊萨酵母中表达而密码子优化的第四阿维链霉菌ADC基因(SEQ ID NO:147)表达的东方伊萨酵母RGK1PGK1启动子,东方伊萨酵母PDC终止子和将同源重组靶向到3’adh1202基因座的侧翼DNA。
实施例3A-9在PDC基因座表达天冬氨酸1-脱羧酶(ADC),β-丙氨酸氨基转移酶 (BAAT)和3-羟基丙酸脱氢酶(3-HPDH);和在adh1202基因座表达来自四种核苷酸序列的天 冬氨酸1-脱羧酶(ADC)的酵母菌株
上面的实施例3A-7和3A-8描述了左端和右端构建体的构建,左端和右端构建体是用于在adh1202基因座靶向表达为在东方伊萨酵母中表达而密码子优化的阿维链霉菌ADC基因的四种核苷酸变体。在转化进东方伊萨酵母CNB1之前,以Hpal和Sacll消化10μgpMhCt095以从pUC19骨架载体中释放所需转化DNA。类似的,以EcoRI和Sacll消化10μgpMhCt096以从pUC19骨架载体中释放所需转化DNA。含~5kbp表达盒的条带被通过凝胶电泳从pUC19骨架DNA中分离,从凝胶上切下,并根据制造商的说明使用
Figure BDA0001451815470001292
Extract II KiT(Macherey-Nagel)纯化。30μL洗脱缓冲液被用于洗脱步骤。总计10μL的等摩尔比的pMhCt095和pMhCt096线性转化DNA被用于转化菌株yMhCt010(如上)。在ura选择平板上选择转化体并将其置于37℃下生长。翌日挑出约12个转化体并将其再划线到ura选择平板上以获取单菌落并在37℃下生长过夜,随后从每个初始转化体生成的每个划线中挑取单菌落并再划线到ura选择平板上。在37℃下生长再一夜之后,从每个划线中挑取最终单菌落并再划线到ura选择平板上,并37℃下生长过夜。在这第二轮单菌落纯化和生长之后,制备基因组DNA来用于如本发明中所述验证所需靶向整合发生的PCR。使用引物0611718和0611632(如上)来验证pMhCt095和pMhCt096片段正确靶向到adh1202基因座。引物0611718结合到存在于pMhCt096中的PDC终止子区域,而引物0611632结合到靶向区域adh1202基因座DNA 3’端并以反义方向扩增。以这些引物从PCR中生成约727bp条带表明了在adh1202基因座所需整合事件的发生。
PCR反应体系(25μL)包含0.5μL要被筛选的菌株的基因组DNA,1X Crimson TaqTM反应缓冲液(New England Biolabs),25pmol有义引物,25pmol反义引物,dATP、dCTP、dGTP和dTTP每种200μM,和0.625个单位的Crimson Taq TMDNA聚合酶(New England Biolabs)。在
Figure BDA0001451815470001293
Figure BDA0001451815470001294
(Eppendorf Scientific)中进行PCR,程序为95℃ 30秒的1个循环,随后是每个为95℃ 30秒,50℃ 30秒和68℃ 2.5分钟的30个循环,及68℃ 10分钟的最后延伸。热循环后,以TAE缓冲液中1%琼脂糖凝胶电泳来分离PCR反应产物并如上所述观察和解释条带的大小。给出所需727bp条带的两个独立分离的转化体被命名为yMhCt019或95/96 2(见表21中的基因型)。
表21:转化体基因型
Figure BDA0001451815470001291
随后如本发明所描述分离yMhCt019的ura-衍生体。使用引物0611815和0612795通过PCR筛选到来自yMhCt019数个FOA抗性菌落的基因组DNA有所需环出事件。引物0611815在左端构建体RKI终止子处退火并向URA3启动子扩增,而引物0612795在3’adh1202同源区域中(pMhCt096的或者内源adh1202基因座)反向朝着5’区域退火。如上所述对分离的yMhCt019进行PCR反应,除了延伸阶段的长度被变为3.5分钟。以这些引物生成3.7kbp条带表明所需的环出事件已经发生而仅URA3启动子残留剩余在修饰的adh1202基因座,而约5.1kbp的条带会表明完整URA3启动子-URA3ORF-URA3终止子-URA3启动子盒的存在,表示所需重组事件没有发生。给出所需3.7kp条带的菌株被保存并命名为yMhCt021。
为了分离多个在adh1202的panD表达盒的纯合的yMhCt021衍生体,如上所述以线性化的pMhCt095和pMhCt096转化yMhCt021。在两轮单菌落纯化和生长之后,制备基因组DNA来用于验证所需靶向整合发生的PCR。使用引物0612891和0612893来验证pMhCt095和pMhCt096片段正确靶向到yMhCt021剩余野生型的adh1202基因座。引物0612891在SaPanDr1加上pMhCt095r1终止后的Pacl位点半边的3’区域退火。引物0612893在SaPanD r5的最5’区域退火,包括Nhel位点和pMhCt096的前导序列,并在反向互补的方向扩增。
按照从yMhCt021剩余野生型的adh1202基因座上经pMhCt095和pMhCt096的第二重组事件所预期,这些引物生成3.2kbp条带表明完整URA3启动子-URA3ORF-URA3终止子-URA3启动子盒的存在,而约1.7kbp条带表明在其他adh1202基因座处URA3残留位点的存在(来自初始整合事件和随后的URA3标记环出)。按上面对分离yMhCt019所描述的进行PCR反应,除了延伸阶段的长度被变为3.5分钟。给出两个这些条带的菌株被命名为yMhCt022(见表22中的基因型)。
表22:转化体基因型
Figure BDA0001451815470001301
菌株在摇瓶中培养,如本发明中所述制备CFE并测试天冬氨酸脱羧酶(ADC)活性。实验结果在表23A中显示。
表23A:转化体酶活性数据
Figure BDA0001451815470001311
比较了从菌株MBin500(对照),yMhCt019、95/96-2、yMhCt008和yMhCt022制备的CFE中的天冬氨酸1-脱羧酶(ADC),β-丙氨酸氨基转移酶(BAAT)和3-HP脱氢酶(3-HPDH)活性。该实验的结果在表23B中显示。
表23B:转化体的酶活性数据
Figure BDA0001451815470001312
也如本发明所述通过SDS-PAGE分析了菌株yMhCt019和95/96 2。两个菌株都显示在53kD、29kD、~14kD和~3kD的蛋白条带。53kD和29kD蛋白条带的大小分别与UGA1和YMR226c基因所编码蛋白的大小相符。14和3kD蛋白条带组合的大小与panD基因所编码的经翻译后切割的蛋白相符。在对照菌株Mbin500的SDS-PAGE分析中没有观察到53kD、29kD,14kD和3kD蛋白。
使用本发明描述的方法,在生物反应器中评价菌株MBin500和yMhCt019的3-HP产生。对照菌株Mbin500没有产生可检测到的3-HP(两个独立的发酵的平均)。菌株yMhCt019产生5.23g/L的3-HP(三个独立的发酵的平均)。
实施例3A-10:在adh1202基因座从四种核苷酸序列表达天冬氨酸1-脱羧酶(ADC) 的酵母菌株
设计另外的构建体以在adh1202基因座掺入编码来自地衣芽孢杆菌的替代ADC(SEQ ID NO:139)的四个核苷酸拷贝。以与上述方式类似的方式,设计左端和右端构建体以允许在东方伊萨酵母adh1202基因座的同源重组。
左端片段的构建
质粒pMhCt095(如上)被如本发明中所述以Xbal和Pacl消化并以TBE缓冲液中1%琼脂糖凝胶电泳来纯化。约7.3kbp的条带被从凝胶上切下并根据制造商的说明使用
Figure BDA0001451815470001321
Extract II KiT(Macherey-Nagel)纯化。
地衣芽孢杆菌天冬氨酸脱羧酶(ADC)PanD基因为在东方伊萨酵母中表达而被密码子优化(型式1,SEQ ID NO:149)并合成构建入质粒1110206
Figure BDA0001451815470001322
质粒1110206被如本发明中所述以Xbal和Pacl消化并以TBE缓冲液中1%琼脂糖凝胶电泳来纯化。约380bp的条带被从凝胶上切下并根据制造商的说明使用
Figure BDA0001451815470001323
Extract II KiT(Macherey-Nagel)纯化。
使用T4连接酶(New England Biolabs)在10μL总反应体积中将~380bp的纯化片段连接进7.3kbp的pMhCt095线性化载体,10μL总反应体积由60.5ng消化的pMhCt095,6.3ng来自1110206的380bp片段,有10mM ATP的1μL 10X连接缓冲液(New England Biolabs),和1μL T4连接酶(New England Biolabs)构成。反应物在室温下孵育1.5小时,而3μL等份的反应物被用于根据制造商的说明转化进ONE
Figure BDA0001451815470001324
TOP10化学感受态大肠杆菌细胞(Invitrogen)。转化体被涂布于2X YT+amp平板上并在37℃下孵育过夜。通过使用Xbal和Pacl限制性消化筛选到数个有合适插入的所得转化体。产生正确消化条带大小的克隆被命名为pMeJi309。
质粒pMeJi309被以Nhel和Ascl消化并以TBE缓冲液中1%琼脂糖凝胶电泳来纯化。约7.3kbp的条带被从凝胶上切下并根据制造商的说明使用
Figure BDA0001451815470001325
Extract IIKiT(Macherey-Nagel)纯化。
地衣芽孢杆菌天冬氨酸脱羧酶panD基因为在东方伊萨酵母中表达而被再次密码子优化(型式2,SEQ ID NO:148)并合成构建入质粒1110205
Figure BDA0001451815470001326
在含3μL1110205,引物0612695和0612724每种25pM,1X pfx扩增缓冲液(Invitrogen),2mm MgSO4,1.25个单位
Figure BDA0001451815470001327
pfx DNA聚合酶(Invitrogen)的终体积50μL的混合物中进行PCR。扩增反应物在
Figure BDA0001451815470001328
(Eppendorf Scientific)中孵育,程序为95℃ 2分钟的1个循环;每个为95℃ 1分钟,55℃ 1分钟和72℃ 1分钟的25个循环;以及72℃ 3分钟的1个循环。
扩增反应的PCR产物被以TBE缓冲液中1%琼脂糖凝胶电泳来纯化。约400bp的条带被从凝胶上切下并根据制造商的说明使用
Figure BDA0001451815470001331
Extract II KiT(Macherey-Nagel)纯化。纯化的PCR产物被使用IN-FUSIONTM Advantage PCR Cloning KiT(Clontech)在反应中插入上面消化的pMeJi309载体,反应体系包括93ng pMeJi309载体片段,52ng上述PCR产物,2μL 1X IN-FUSIONTMIn-Fusion反应缓冲液(Clontech)和1μL IN-FUSIONTM酶(Clontech)。反应物在37℃孵育15分钟,在50℃ 15分钟,随后被置于冰上。2.5μL反应物样品根据制造商的说明转化入ONE
Figure BDA0001451815470001332
TOP10化学感受态大肠杆菌细胞(Invitrogen)。转化体被涂布于2X YT+amp平板上并在37℃孵育过夜。通过使用Xbal和Pacl的限制性消化筛选到数个有合适插入的所得转化体。产生正确消化条带大小的克隆通过DNA测序来确认正确并命名为pMeJi310-2(图14)。
右端片段的构建
质粒pMhCt096(如上)被以Xbal和Pacl消化并以TBE缓冲液中1%琼脂糖凝胶电泳来纯化。约4.8kbp的条带被从凝胶上切下并根据制造商的说明使用
Figure BDA0001451815470001333
Extract II KiT(Macherey-Nagel)纯化。
地衣芽孢杆菌天冬氨酸脱羧酶panD基因为在东方伊萨酵母中表达而被再次密码子优化(型式3,SEQ ID NO:151)并合成构建入质粒1110208
Figure BDA0001451815470001334
质粒1110208被以Xbal和Pacl消化并以TBE缓冲液中1%琼脂糖凝胶电泳来纯化。约380bp的条带被从凝胶上切下并根据制造商的说明使用
Figure BDA0001451815470001335
Extract II KiT(Macherey-Nagel)纯化。
使用T4连接酶(New England Biolabs)在10μL总反应体积中将上面380bp的片段连接进7.3kbp的pMhCt096线性化载体,10μL总反应体积由72.2ng消化的pMhCt096,6.9ng来自1110208的380bp片段,有10mM ATP的1μL 10X连接缓冲液,和1μL T4连接酶构成。反应物在室温下孵育1个半小时,而3μL等份的反应物被用于根据制造商的说明转化进ONE
Figure BDA0001451815470001336
TOP10化学感受态大肠杆菌细胞(Invitrogen)。转化体被涂布于2X YT+amp平板上并在37℃下孵育过夜。通过使用Nhel和Ascl限制性消化筛选到数个有合适插入的所得转化体。产生正确消化条带大小的克隆被命名为pMeJi311。
质粒pMeJi311被以Nhel和Ascl消化并以TBE缓冲液中1%琼脂糖凝胶电泳来纯化。约7.3kbp的条带被从凝胶上切下并根据制造商的说明使用
Figure BDA0001451815470001337
Extract IIKiT(Macherey-Nagel)纯化。
地衣芽孢杆菌天冬氨酸脱羧酶panD基因为在东方伊萨酵母中表达而被再次密码子优化(型式4,SEQ ID NO:150)并合成构建入质粒1110207
Figure BDA0001451815470001341
在含3μL1110207,引物0612698和0612725每种25pM,1X pfx扩增缓冲液(Invitrogen),2mm MgSO4,1.25个单位
Figure BDA0001451815470001342
pfx DNA聚合酶(Invitrogen)的终体积50μL的混合物中进行PCR。扩增反应物在
Figure BDA0001451815470001343
(Eppendorf Scientific)中孵育,程序为95℃ 2分钟的1个循环;每个为95℃ 1分钟,55℃ 1分钟和72℃ 1分钟的25个循环;以及72℃3分钟的1个循环。
扩增反应的PCR产物被以TBE缓冲液中1%琼脂糖凝胶电泳来纯化。约400bp的条带被从凝胶上切下并根据制造商的说明使用
Figure BDA0001451815470001344
Extract II KiT(Macherey-Nagel)纯化。纯化的PCR产物被使用IN-FUSIONTM Advantage PCR Cloning KiT(Clontech)在反应中插入上面消化的pMeJi311载体,反应体系包括65.1ng pMeJi311Nhel到Ascl消化的载体片段,85ng上述PCR产物,2μL 1X In-Fusion反应缓冲液(Clontech)和1μL IN-FUSIONTM酶(Clontech)。反应物在37℃孵育15分钟,在50℃ 15分钟,随后被置于冰上。2.5μL反应物样品被根据制造商的说明转化入ONE
Figure BDA0001451815470001345
TOP10化学感受态大肠杆菌细胞(Invitrogen)。转化体被涂布于2X YT+amp平板上并在室温孵育2天。通过使用Nhel和Ascl的限制性消化筛选到数个有合适插的入所得转化体。产生正确消化条带大小的克隆通过DNA测序来确认正确并命名为pMeJi312-2(图15)。
左端和右端片段的整合
如本发明所述质粒pMeJi310-2被以Hpal和Sacll消化而质粒pMeJi312-2被以EcoRI和Sacll消化。这些以TBE缓冲液中1%琼脂糖凝胶电泳来纯化,而两个约5kbp的条带被从凝胶上切下并根据制造商的说明使用
Figure BDA0001451815470001346
Extract II KiT(Macherey-Nagel)纯化。
以消化的pMeJi310-2和pMeJi312-2DNA转化东方伊萨酵母CNB1,并如本发明中所述通过Crimson Taq(New England Biolabs)PCR来验证正确的基因座靶向和转化。引物0612794和0611245产生约3.17kbp的条带;引物612479和0611632产生约1.48kbp的条带;而引物611248和612795产生约2.3kbp的条带。给出表达盒正确整合预期条带的菌株被命名为MeJi409-2。随后如上所述获得MeJi409-2的ura-衍生体。
使用本发明描述的方法,在发酵生物反应器中评价菌株MBin500和MeJi409-2的3-HP产生。对照菌株Mbin500没有产生可检测到的3-HP(两个独立的发酵的平均)。菌株MeJi409-2(1个发酵)产生4.62g/L。为考虑到相比其他(如,未来)发酵,这些发酵中的细胞质量量上的差异,MeJi409-2每单位细胞质量的3-HP浓度(表示为[g/L 3-HP]/[g/L干细胞重])被计算为0.20。
实施例3A-11:在adh 9091基因座表达天冬氨酸1-脱羧酶(ADC)和天冬氨酸氨基转 移酶(AAT)的酵母菌株
使用引物0611268和0611269从东方伊萨酵母基因组DNA中PCR扩增编码SEQ IDNO:14的东方伊萨酵母氨基转移酶(AAT)的核苷酸序列(SEQ ID NO:13)。PCR反应体系(50μL)包含50ng东方伊萨酵母菌株的基因组DNA,1X Phusion HF缓冲液(New EnglandBiolabs),引物0611268和0611269每种50pmol,dATP、dCTP、dGTP和dTTP每种200μM,1.5μL100%DMSO(New England Biolabs)和1个单位的Phusion High Fidelity DNA聚合酶(NewEngland Biolabs)。在
Figure BDA0001451815470001351
(Eppendorf Scientific)中进行PCR,程序为98℃ 2分钟的1个循环,随后是每个为98℃ 30秒,55℃ 30秒和72℃ 1分钟30秒的35个循环,及72℃ 7分钟的最后延伸。热循环后,以TBE缓冲液中0.8%琼脂糖凝胶电泳来分离PCR反应产物,其中约1278bp的PCR产物被从凝胶上切下并根据制造商的说明使用
Figure BDA0001451815470001352
Gel Extraction KiT(Qiagen)纯化。所得PCR片段的总长度约1278bp,在片段5’末端有Nrul限制性位点而在其3’末端有Pacl限制性位点。
上面得到的包含AAT基因CDS(SEQ ID NO:13)的1278bp片段随后被克隆进pCR2.1-TOPO载体并根据制造商的说明转化进One-Shot TOP10大肠杆菌细胞(Invitrogen)。转化体被涂布于2X YT+amp平板上并在37℃孵育过夜。通过Bam HI消化筛选到数个有所需片段的合适插入的所得转化体。产生所需条带大小的克隆通过测序来确认并命名为pGMEr111。
质粒pGMEr121和pGMEr111被以限制性酶Pacl和Nrul双消化。所得的来自质粒pGMEr121的7695bp载体片段,和所得的来自质粒pGMEr111的含AAT编码序列的1272bp插入片段,被以1XTBE缓冲液中0.8%琼脂糖凝胶电泳来分离,从凝胶上切下,并根据制造商的说明使用
Figure BDA0001451815470001353
Gel Extraction KiT(Qiagen)纯化。
随后以3μL载体片段,4μL插入片段,2μL无菌双蒸水,10μL 2X Quick连接酶缓冲液和1μL Quick T4连接酶(Quick Ligation Kit,New England Biolabs)来建立连接反应体系并根据制造商说明进行反应。5μL等份的上述连接反应物被根据制造商说明转化入
Figure BDA0001451815470001361
Ultracompetent大肠杆菌细胞(Agilent Technologies)。转化体被涂布于2X YT+amp平板上并在37℃孵育过夜。通过SmaI/PpuMI双消化筛选到数个有所需插入物的合适插入的所得转化体。产生所需条带大小的克隆通过测序来确认并命名为pGMEr126(图16)。
质粒pGMEr126包括东方伊萨酵母AAT表达盒,其中基因转录由东方伊萨酵母TDH3启动子和TKL终止子调控,其上游侧翼有截短的URA3编码序列3’区域和URA3启动子;下游侧翼有东方伊萨酵母adh9091基因座3’同源区域。
使用引物0611661和0611662从获自
Figure BDA0001451815470001362
的pMA-T载体PCR扩增为在东方伊萨酵母中表达而密码子优化的阿维链霉菌panD基因(SEQ ID NO:130)。PCR反应体系(50μL)包含50ng菌株质粒DNA,1X Phusion HF缓冲液(New England Biolabs),引物0611661和0611662每种50pmol,dATP、dCTP、dGTP和dTTP每种200μM,1.5μL 100%DMSO(New EnglandBiolabs)和1个单位的Phusion High Fidelity DNA聚合酶(New England Biolabs)。在
Figure BDA0001451815470001363
(Eppendorf Scientific)中进行PCR,程序为98℃ 2分钟的1个循环,随后是每个为98℃ 30秒,55℃ 30秒和72℃ 30秒的35个循环,及72℃7分钟的最后延伸。热循环后,以TBE缓冲液中0.8%琼脂糖凝胶电泳来分离PCR反应产物,其中约453bp的PCR产物被从凝胶上切下并根据制造商的说明使用
Figure BDA0001451815470001364
GelExtraction KiT(Qiagen)纯化。所得PCR片段的总长度约453bp,在片段5’末端有Nrul限制性位点而在3’末端有Apal限制性位点。
包含阿维链霉菌panD基因密码子优化型式的453bp片段被克隆进pCR2.1-TOPO载体并根据制造商的说明转化进One-Shot TOP10大肠杆菌细胞(Invitrogen)。转化体被涂布于2X YT+amp平板上并在37℃孵育过夜。通过EcoRI消化筛选到数个有所需片段的合适插入的所得转化体。产生所需条带大小的克隆通过测序来确认并命名为pGMEr127。
质粒pGMEr127和pGMEr125(a)被以限制性酶Nrul和Apal消化。在终止消化反应之前将1μL小牛肠碱性磷酸酯酶(New England Biolabs)加入到pGMEr125(a)消化体系中以将末端去磷酸化并防止自连接。所得的来自质粒pGMEr125(a)(如上)的8188bp载体片段,和来自质粒pGMEr127(如上)的含阿维链霉菌panD基因密码子优化型式(SEQ ID NO:130)的440bp插入片段,被以1XTBE缓冲液中0.8%琼脂糖凝胶电泳来分离,从凝胶上切下,并根据制造商的说明使用
Figure BDA0001451815470001371
Gel Extraction KiT(Qiagen)纯化。
随后以4μL载体片段,4μL插入片段,9μL2X Quick连接酶缓冲液和1μL Quick T4连接酶(New England Biolabs)来建立连接反应体系并根据制造商说明进行反应。5μL等份的上述连接反应物被根据制造商说明转化入
Figure BDA0001451815470001372
Ultracompetent大肠杆菌细胞(Agilent Technologies)。转化体被涂布于2X YT+amp平板上并在37℃孵育过夜。通过bamHI消化筛选到数个有所需插入物的合适插入的所得转化体。产生所需条带大小的克隆被确认并命名为pGMEr130(图17)。
质粒pGMEr130包含由下面片段制成的构建体:东方伊萨酵母adh9091基因座的5’侧翼,有东方伊萨酵母PDC启动子/TAL终止子的空表达盒,东方伊萨酵母ENO1启动子和RKI终止子调控下的panD表达盒(含SEQ ID NO:130),和东方伊萨酵母URA3启动子调控下的截短的URA3标记基因5’片段。
为确定酵母菌株东方伊萨酵母CNB1是否能表达阿维链霉菌panD基因的东方伊萨酵母密码子优化型式(SEQ ID NO:130)和东方伊萨酵母AAT基因(SEQ ID NO:13),构建了表达质粒pGMEr130和pGMEr126。质粒pGMEr130包括(从5’到3’)在东方伊萨酵母adh9091基因座构建体基因组整合用的5’侧翼区域,ENO1启动子和RKI终止子调控下的panD表达盒,由URA3启动子驱动的截短的URA3选择标志物5’部分。质粒pGMEr126包括(从5’到3’)URA3选择标志物3’部分,TDH3启动子和TKL终止子调控下的AAT基因表达盒,和在东方伊萨酵母adh9091基因座构建体基因组整合用的3’侧翼区域。所有启动子和终止子源自东方伊萨酵母。
pGMEr126被以限制性酶EcoRI消化,其切割出感兴趣的4758bp片段,而pGMEr130被以限制性酶Hind III消化,构建转化所需的5034bp片段。4758bp和5034bp片段被以1XTBE缓冲液中0.8%琼脂糖凝胶电泳来分离,从凝胶上切下,并根据制造商的说明使用
Figure BDA0001451815470001373
Gel Extraction KiT(Qiagen)纯化。
培养东方伊萨酵母CNB1并如本发明中所述以约500ng的4758bp和5034bp线性片段共转化。获得8个转化菌株并随后在摇瓶中培养。将得到的培养液用于跑SDS-PAGE,Tris-HCl(Bio-Rad Laboratories)凝胶以检测为在东方伊萨酵母中表达而密码子优化的阿维链霉菌panD基因(SEQ ID NO:130)和东方伊萨酵母AAT基因(SEQ ID NO:13)的表达。阳性菌株被命名为yGMEr008,而如上描述其培养液也被用于确定ADC和AAT活性水平。
实施例3A-12:在adh9091基因座表达丙酮酸羧化酶(PYC),天冬氨酸1-脱羧酶 (ADC)和天冬氨酸氨基转移酶(AAT)的酵母菌株
使用引物0611266和0611267从东方伊萨酵母基因组DNA PCR扩增编码SEQ ID NO:2的东方伊萨酵母丙酮酸脱羧酶(PYC)的核苷酸序列。PCR反应体系(50μL)包含50ng东方伊萨酵母菌株的基因组DNA,1X Phusion HF缓冲液(New England Biolabs),引物0611266和0611267每种50pmol,dATP、dCTP、dGTP和dTTP每种200μM,1.5μL 100%DMSO(New EnglandBiolabs)和1个单位的Phusion High Fidelity DNA聚合酶(New England Biolabs)。在
Figure BDA0001451815470001381
Figure BDA0001451815470001382
(Eppendorf Scientific)中进行PCR,程序为98℃ 2分钟的1个循环,随后是每个为98℃ 30秒,55℃ 30秒和72℃ 1分钟30秒的35个循环,及72℃ 7分钟的最后延伸。热循环后,以TBE缓冲液中0.8%琼脂糖凝胶电泳来分离PCR反应产物,其中约3557bp的PCR产物被从凝胶上切下并根据制造商的说明使用
Figure BDA0001451815470001383
Gel Extraction KiT(Qiagen)纯化。所得PCR片段在片段5’末端有Xbal限制性位点而在其3’末端有Pacl限制性位点。
得到的包含东方伊萨酵母PYC基因CDS(SEQ ID NO:1)的3557bp片段被克隆进pCR2.1-TOPO载体并根据制造商的说明转化进One-Shot TOP10大肠杆菌细胞(Invitrogen)。转化体被涂布于2X YT+amp平板上并在37℃孵育过夜。通过EcoRI消化筛选到数个有所需片段的合适插入的所得转化体。产生所需条带大小的6个克隆被确认并命名为pGMEr132.7、pGMEr132.14、pGMEr132.16、pGMErl 32.25、pGMEr132.27和pGMErl 32.30。序列分析显示质粒pGMEr132.14有合适的PYC CDS但丢失了CDS 5’端的Xbal限制性位点。由于需要该限制性位点以将PYC CDS插入表达质粒pGMEr125,质粒pGMEr132.14的315bp HindIII片段(包含PYC CDS上的5’端,有改变的Xbal位点)被以来自质粒pGMEr132.7的315bpHind III片段所替代,其具有包括正确Xbal位点在内的未变化的PYC CDS 5’端。所得来自pGMEr132.14的7173bp Hind III载体片段,和来自pGMEr132.7的315bp bp Hind III插入物被以1XTBE缓冲液中0.8%琼脂糖凝胶电泳来分离,从凝胶上切下,并根据制造商的说明使用
Figure BDA0001451815470001384
Gel Extraction KiT(Qiagen)纯化。
随后以4μL载体片段,5μL插入片段,10μL2X Quick连接酶缓冲液和1μL Quick T4连接酶(New England Biolabs)来建立连接反应体系并根据制造商说明进行反应。5μL等份的上述连接反应物被根据制造商说明转化入One-Shot TOP10大肠杆菌细胞(Invitrogen)。转化体被涂布于2X YT+amp平板上并在37℃孵育过夜。通过BamHI和Xbal双消化筛选到数个有所需插入物的合适插入和取消的所得转化体。产生所需条带大小的克隆被确认并命名为pGMEr133。
为了将东方伊萨酵母PYC CDS插入到质粒pGMEr125(b)中PDC启动子下游。质粒pGMEr125(b)和pGMEr133(如上)被以Pacl和Xbal消化。所得的来自质粒pGMEr125(b)的8188bp载体片段,和来自质粒pGMEr133的包含东方伊萨酵母PYC CDS(SEQ ID NO:1)的3553bp插入片段被以1XTBE缓冲液中0.8%琼脂糖凝胶电泳来分离,从凝胶上切下,并根据制造商的说明使用
Figure BDA0001451815470001391
Gel Extraction KiT(Qiagen)纯化。
随后以3μL载体片段,6μL插入片段,10μL2X Quick连接酶缓冲液和1μL Quick T4连接酶(New England Biolabs)来建立连接反应体系并根据制造商说明进行反应。5μL等份的上述连接反应物被根据制造商说明转化入One-Shot TOP10大肠杆菌细胞(Invitrogen)大肠杆菌细胞(Agilent Technologies)。转化体被涂布于2X YT+amp平板上并在37℃孵育过夜。通过BamHI消化筛选到数个有所需片段的合适插入的所得转化体。产生所需条带大小的克隆被确认并命名为pGMEr136。
质粒pGMEr136包括东方伊萨酵母adh9091基因座的5’侧翼,东方伊萨酵母PDC启动子和TAL终止子调控下的东方伊萨酵母PYC基因表达盒(SEQ ID NO:1),有东方伊萨酵母ENO1启动子/RKI终止子的空表达盒,和URA3启动子调控下的截短的东方伊萨酵母URA3标志基因5’片段。
约5μg的质粒pGMEr136(如上)和4μg的质粒pGMEr127被以限制性酶Apal和Nrul消化。所得来自质粒pGMEr136的11729bp载体片段,和所得来自质粒pGMEr127的包含为在东方伊萨酵母中表达而密码子优化的阿维链霉菌panD基因(SEQ ID NO:130)的插入片段(436bp)被根据制造商的说明使用
Figure BDA0001451815470001392
Extract II(Macherey-Nagel)以1XTBE缓冲液中0.8%琼脂糖凝胶电泳来纯化。
随后以5μL载体片段,4μL插入物,9μL2X Quick连接酶缓冲液和1μL Quick T4连接酶(New England Biolabs)来建立连接反应体系。反应物被在室温下孵育1小时。5μL等份的上述连接反应物被根据制造商说明转化入ONE
Figure BDA0001451815470001401
TOP10化学感受态大肠杆菌细胞(Invitrogen)。转化体被涂布于2X YT+amp平板上并在37℃孵育过夜。通过BamHI消化筛选到数个有所需插入物的所得转化体。产生所需条带大小的克隆被选出并命名为pGMEr137(图18)。
质粒pGMEr137包含在东方伊萨酵母PDC启动子和TAL终止子基因转录调控下的东方伊萨酵母PYC基因(SEQ ID NO:1),在东方伊萨酵母ENO1启动子和RKI终止子转录调控下的为在东方伊萨酵母中表达而密码子优化的阿维链霉菌panD基因(SEQ ID NO:130),随后有URA3标志5’端和东方伊萨酵母adh9091基因座5’侧翼区域的URA3启动子。
质粒pGMEr126(如上)被以限制性酶EcoRI消化,其切下感兴趣的4758bp片段;而质粒pGMEr137(如上)被以限制性酶Hpal和Nhel消化,构建8400bp片段。4758bp和8400bp的片段被以1XTBE缓冲液中0.8%琼脂糖凝胶电泳来分离,条带被从凝胶上切下并根据制造商的说明使用
Figure BDA0001451815470001402
Extract II(Macherey-Nagel)来纯化。培养东方伊萨酵母CNB1并如本发明所述以约500ng 4758bp和8400bp线性片段共转化,得到转化体yGMEr009。
实施例3A-13:在PDC基因座表达天冬氨酸1-脱羧酶(ADC),β-丙氨酸氨基转移酶 (BAAT)和3-羟基丙酸脱氢酶(3-HPDH);并在adh9091基因座表达丙酮酸羧化酶(PYC),天冬 氨酸1-脱羧酶(ADC)和天冬氨酸氨基转移酶(AAT)的酵母菌株
为了在已经过表达天冬氨酸氨基转移酶(AAT),β-丙氨酸氨基转移酶(BAAT)和3-HP脱氢酶(3-HPDH)的菌株中增加丙酮酸羧化酶(PYC)和天冬氨酸氨基转移酶(AAT)活性,如上所述以pGMEr137(如上)和pGMEr126(如上)线性片段转化yMhCt010(如上)。在两轮单菌落纯化和生长之后,如上所述制备基因组DNA来用于验证所需靶向整合发生的PCR。使用引物0611814和0612055来确认pGMEr137和pGMEr126片段正确靶向到adh9091基因座。引物0611814在pGMEr126TDH3启动子3’端退火并在3’方向扩增,引物0612055退火于存在于pGMEr126中的在adh90913’侧翼同源区的3’,所以以该引物对进行的PCR产物扩增仅在整合DNA通过同源重组靶向正确位点时发生。来自含引物0611814和0612055的PCR的约3066bp条带的存在表示pGMEr126和pGMEr137片段在adh9091基因座发生所需整合。
在以pGMEr137和pGMEr126线性片段转化的yMhCt010数个独立转化体两轮单菌落纯化和生长之后,如上所述制备基因组DNA来用于验证所需靶向整合发生的PCR。给出包含引物0611814和0612055的约3066bp PCR条带的三个独立分离的菌株被命名为yMhCt020,GMErin010#2,GMErin010#3。这些菌株包含在两个pdc基因座和一个adh9091基因座编码对应ADC(SEQ ID NO:17)的多核苷酸(SEQ ID NO:130);在两个pdc基因座编码对应gabT(SEQID NO:24)的多核苷酸(SEQ ID NO:141);在两个pdc基因座编码对应3-HPDH(SEQ ID NO:129)的多核苷酸(SEQ ID NO:144);在一个adh9091基因座编码对应PYC(SEQ ID NO:2)的多核苷酸(SEQ ID NO:1);在一个adh9091基因座编码对应AAT(SEQ ID NO:14)的多核苷酸(SEQ ID NO:13)(见表24)。
表24:转化体基因型
Figure BDA0001451815470001411
菌株yMhCt020,GMErin010#2,和GMErin010#3在摇瓶中培养,如本发明所述制备CFE并测试PYC、AAT和3-HPDH活性。实验结果在表25中显示。
表25:转化体酶活性数据
Figure BDA0001451815470001412
也如本发明中描述的以SDS-PAGE分析了表25中的菌株。MBin500和GMEr009-2显示在四个其他样品中没有的~64kD蛋白条带。这些蛋白的质量与其作为东方伊萨酵母CNB1中天然丙酮酸脱羧酶的身份相符。菌株yMhCt008、yMhCt020、GMErin010#2和GMErin010#3显示53kD和29kD的条带。这些蛋白的质量分别与UGA1和YMR226c基因所编码的蛋白的质量相符。菌株GMEr009-2、yMhCt020、GMErin010#2,和GMErin010#3都显示46.3kD的条带。这些蛋白的质量与AAT基因所编码蛋白的质量相符。
实施例3A-14:在两个1202基因座从四个核苷酸序列表达天冬氨酸1-脱羧酶(ADC) 的酵母菌株。
使用上面描述的FOA逆选择环出方案分离包含编码SEQ ID NO:139地衣芽孢杆菌ADC(如上)的四个核苷酸拷贝的MeJi409-2ura3-衍生体。使用引物0611815和0611817通过PCR筛选亲本菌株MeJi409-2数个FOA抗性菌落的基因组DNA有所需环出事件。引物0611815在左端构建体RKI终止子处退火并向ura3启动子扩增。引物0611817在TDH3启动子处退火并反向朝ura3盒扩增。828bp条带的存在表示如所需的仅ura3残留位点的存在(在亲本菌株中两个URA3启动子间同源重组后留下的单个URA3启动子),而约2.2kbp条带表示完整URA3启动子-URA3ORF-URA3终止子-URA3启动子盒的存在,表明所需的重组事件没有发生。如上所述进行以Crimson TaqTM DNA聚合酶(New England Biolabs)的PCR反应。来自亲本菌株MeJi409-2的一个FOA抗性菌落,命名为MeJi411,给出了所需的828bp条带。
左端和右端片段的整合
如本发明中所述质粒pMeJi310-2被以Hpal和Sacll消化而质粒pMeJi312-2被以EcoRI和Sacll消化。这些被以TBE缓冲液中1%琼脂糖凝胶电泳来纯化,两个约5kbp的条带被从凝胶上切下并根据制造商的说明使用
Figure BDA0001451815470001421
Extract II KiT(Macherey-Nagel)来纯化。
以消化的pMeJi310-2和pMeJi312-2DNA来转化MeJi411,并如本发明所述以Crimson Taq(New England Biolabs)PCR来验证正确的位点靶向和转化。引物0611225和0611632产生了约5kbp的条带;引物0611815和0611632产生了约6kbp有ura标志的条带,和4.5kbp没有该标志的条带。当野生型adh1202基因座仍然完整时引物0611631和0612579得到了约936bp的条带(选择不显示该条带的菌株)。给出表达盒正确整合预期条带的菌株被命名为MeJi412。
实施例3A-15:在adh1202基因座表达编码天冬氨酸1-脱羧酶(ADC)的四个核苷酸 拷贝的酵母菌株,其中有在PDC启动子的调控下编码天冬氨酸1-脱羧酶(ADC)的两个核苷酸 拷贝和在TDH3启动子调控下的两个拷贝。
本实施例描述了构建体,其设计为要在adh1202基因座掺入编码SEQ ID NO:139地衣芽孢杆菌ADC的四个核苷酸拷贝,所述拷贝有在东方伊萨酵母PDC启动子调控下的两个拷贝和在东方伊萨酵母TDH31启动子调控下的两个拷贝。以与上面描述方式类似的方式,设计左端和右端构建体以允许在东方伊萨酵母CNB1adh1202基因座的同源重组。
左端片段的构建
质粒pMeJi310-2(如上,见图14)被以Xbal和Stul消化随后如本发明中所述以CIP处理并以TBE缓冲液中1%琼脂糖凝胶电泳来纯化。约6.7kbp的条带被从凝胶上切下并根据制造商的说明使用
Figure BDA0001451815470001431
Gel Extraction KiT(Qiagen)纯化。
通过以Notl的消化,随后以Klenow的补平反应和以Nhel的后续消化来将PDC启动子从pMeJi310-2上切下。约708bp的条带被从凝胶上切下并根据制造商的说明使用
Figure BDA0001451815470001432
Gel Extraction KiT(Qiagen)纯化。
使用T4连接酶(New England Biolabs)在10μL总反应体积中将708bp的纯化片段连接进6.7kbp的pMeJi310-2线性化载体,10μL总反应体积由1μL来自pMeJi310-2的6.7kbp片段,1或5μL来自pMeJi310-2的708bp片段,1μL有10mM ATP的10X连接缓冲液(New EnglandBiolabs),和1μL T4连接酶(New England Biolabs)构成。反应物在16℃下孵育过夜,而4μL等份的反应物被用于根据制造商的说明转化进ONE
Figure BDA0001451815470001433
TOP10化学感受态大肠杆菌细胞(Invitrogen)。转化体被涂布于2X YT+amp平板上并在37℃下孵育过夜。通过使用ApaLI的限制性消化筛选到数个有合适插入的所得转化体。产生正确消化条带大小的克隆被命名为pMIBa137。
右端片段的构建
质粒pMeJi312-2(如上)被以Xbal和Stul消化随后如本发明中所述以CIP处理并以TBE缓冲液中1%琼脂糖凝胶电泳来纯化。约6.8kbp的条带被从凝胶上切下并根据制造商的说明使用
Figure BDA0001451815470001434
Gel Extraction KiT(Qiagen)纯化。
以Pmel和Nhel消化从pMeJi312-2上切下TDH3启动子。约966bp的条带被从凝胶上切下并根据制造商的说明使用
Figure BDA0001451815470001435
Gel Extraction KiT(Qiagen)纯化。
使用T4连接酶(New England Biolabs)在10μL总反应体积中将966bp的纯化片段连接进6.8kbp的pMeJi312-2线性化载体,10μL总反应体积由1μL来自pMeJi312-2的6.8kbp片段,1或5μL来自pMeJi312-2的966bp片段,1μL有10mM ATP的10X连接缓冲液(New EnglandBiolabs),和1μL T4连接酶(New England Biolabs)构成。反应物在16℃下孵育约6小时,而4μL等份的反应物被用于根据制造商的说明转化进ONE
Figure BDA0001451815470001441
TOP10化学感受态大肠杆菌细胞(Invitrogen)。转化体被涂布于2X YT+amp平板上并在37℃下孵育过夜。通过使用Sall的限制性消化筛选到数个有合适插入的所得转化体。产生正确消化条带大小的克隆被命名为pMIBa136。
左端和右端片段的整合
如本发明中所述质粒pMIBa137被以Hpal和Sacll消化而质粒pMIBa136被以EcoRI和Sacll消化。这些被以TBE缓冲液中1%琼脂糖凝胶电泳来纯化,两个约5kbp的条带被从凝胶上切下并根据制造商的说明使用
Figure BDA0001451815470001442
Gel Extraction KiT(Qiagen)来纯化。
以消化的pMIBa137和pMIBa136DNA来转化东方伊萨酵母CNB1,并如本发明所述以Crimson Taq(New England Biolabs)PCR来验证正确的基因座靶向和转化。引物0611717和0611631产生约2.5kbp和955bp的条带;引物0611718和0611632产生约733bp的条带;引物0612794和0611245产生约2.7kbp的条带;引物0611225和0612795产生约4.2kbp的条带。给出表达盒正确整合预期条带的菌株被命名为MIBa351。
从MIBa351去除ura标志
如上所述分离MIBa351的ura-衍生体。使用引物0611815和0611817通过PCR筛选到MIBa351数个FOA抗性菌落的基因组DNA有所需环出事件。引物0611815在左端构建体RKI终止子处退火并向ura3启动子扩增,而引物0611817在TDH3启动子处退火并反向朝ura3盒扩增。828bp条带的存在表示如所需的仅URA3残留位点的存在(在亲本菌株中两个URA3启动子间同源重组后留下的单个URA3启动子),而约2.2kbp条带表示完整URA3启动子-URA3ORF-URA3终止子-URA3启动子盒的存在,表明所需的重组事件没有发生。如上所述进行用Crimson Taq TMDNA聚合酶(New England Biolabs)的PCR反应。以上述引物得到828bp片段的FOA抗性菌落被以产生2.7kbp产物的引物0612794和0611245以及测试4kbp产物的引物0611815和0612795进一步测试,以确认编码SEQ ID NO:139的地衣芽孢杆菌ADC的核苷酸序列SEQ ID NO:138的四个拷贝保持完整。一个来自亲本菌株MIBa351的FOA抗性菌落,命名为MIBa353,以所有三个引物组给出了所需的PCR产物。
反向表达盒右端片段的构建
质粒pMIBa136包含两个朝正向取向的表达盒。为简化同源菌株的筛选,构建了新的质粒,其中pMIBa136的panDbl表达盒被置于反向取向。质粒pMIBa136(如上)被以Notl和Pmel消化,如本发明中所述随后碱性用Klenow的补平反应,并以TBE缓冲液中1%琼脂糖凝胶电泳来纯化。约3.4kbp和4.4kbp的条带被从凝胶上切下并根据制造商的说明使用
Figure BDA0001451815470001451
Gel Extraction KiT(Qiagen)来纯化。来自pMIBa136的的4.4kbp片段被以CIP处理并根据制造商的说明使用
Figure BDA0001451815470001452
PCR Purification KiT(Qiagen)来纯化。
使用T4连接酶(New England Biolabs)在10μL总反应体积中将来自pMIBa136的3.4kbp的纯化片段连接进4.4kbp的pMIBa136载体,10μL总反应体积由1μL来自pMIBa136的4.4kbp片段,1或5μL来自pMIBa136的3.4kbp片段,1μL有10mM ATP的10X连接缓冲液(NewEngland Biolabs),和1μL T4连接酶(New England Biolabs)构成。反应物在16℃下孵育过夜,而4μL等份的反应物被用于根据制造商的说明转化进ONE
Figure BDA0001451815470001453
TOP10化学感受态大肠杆菌细胞(Invitrogen)。转化体被涂布于2X YT+amp平板上并在37℃下孵育过夜。通过使用Pacll和EcoRI的限制性消化筛选到数个有合适插入的所得转化体。产生正确消化条带大小的克隆被命名为pMIBa138。
左端和右端片段的整合
如本发明中所述质粒pMIBa137被以Hpal和Sacll消化而质粒pMIBa138被以EcoRI和Sacll消化。这些被以TBE缓冲液中1%琼脂糖凝胶电泳来纯化,两个约5kbp的条带被从凝胶上切下并根据制造商的说明使用
Figure BDA0001451815470001454
Gel Extraction KiT(Qiagen)来纯化。
以消化的pMIBa137和pMIBa138DNA来转化MIBa353,并使用
Figure BDA0001451815470001455
Plant DirectPCR KiT(Finnzymes)来通过PCR来验证正确的基因座靶向和转化。引物0611718和0611632产生约733bp的条带(以确认第一整合仍然存在);引物0612367和0611632产生约960bp的条带(以确认整合的第二拷贝);当野生型adh1202基因座仍然存在时引物0611631和06112579产生约936bp的条带(缺少该条带确认野生型adh1202基因座的丧失)。给出表达盒正确整合预期条带的两个菌株被保存并被命名为MIBa355和MIBa356。
MeJi409-2,MeJi412、MIBa351和MIBa355中天冬氨酸1-脱羧酶活性
菌株MeJi409-2,MeJi412、MIBa351和MIBa355被在摇瓶中培养,如本发明中所述制备CFE并测试天冬氨酸1-脱羧酶(ADC)活性。结果显示于表26中。每个菌株的活性为两个独立摇瓶培养物的平均值。也使用本发明描述的方法,在生物反应器中测试菌株MeJi409-2、MeJi412、MIBa351和MIBa355的3-HP产生。这些生物反应器实验的结果也显示于表26中。考虑到这些发酵中的细胞质量的差异,表26中显示的3-HP产生性能被表示为每单位细胞质量的3-HP浓度(表示为g/L 3-HP/g/L干细胞重)。结果显示随着细胞中ADC活性水平的增加,3-HP产生性能增加。
表26:转化体ADC活性和3-HP产生数据
Figure BDA0001451815470001461
实施例3A-16:在PDC基因座表达丙酮酸羧化酶(PYC)的质粒构建
如下所述构建用于在PDC基因座整合的,含SEQ ID NO:1核苷酸序列(编码SEQ IDNO:2的东方伊萨酵母PYC)的质粒pANN28。
根据制造商的说明使用基因组DNA作为模板来PCR扩增东方伊萨酵母PDC的上游和下游侧翼区域(Pfu聚合酶Stratagene)。引物oANN7和oANN8允许掺入上游区域侧翼独特的限制位点而引物oANN9和oANN10允许掺入下游区域侧翼独特的限制位点。如本发明中所述,PCR产物被以TBE缓冲液中1%琼脂糖凝胶电泳纯化。每个PCR产物约800bp的条带被从凝胶上切下并根据制造商的说明使用Gel Extraction KiT(Qiagen)来纯化。纯化的PCR产物被克隆进TOPO载体(Invitrogen)并根据制造商的说明转化进电感受态大肠杆菌DH10B细胞(Invitrogen)。使用与用于构建PCR产物的引物相同的引物通过菌落PCR筛选到中的数个有合适插入的所得转化体。产生正确PDC下游侧翼的克隆被命名为pANN04。产生正确PDC上游侧翼的克隆被命名为pANN07。
质粒pANN04被以Apal和Sacl消化(用作载体/骨架);质粒pANN04被以Notl和Sacl消化;质粒pANN07被以Notl和Apal消化。如本发明中所述,每个片段被以TBE缓冲液中1%琼脂糖凝胶电泳纯化。对载体约3.5kbp的条带,和对每个插入物约1kbp的条带被从凝胶上切下并根据制造商的说明使用Gel Extraction KiT(Qiagen)来纯化。使用T4连接酶(NewEngland Biolabs)在10μL总反应体积中将纯化产物连接,10μL总反应体积由49ng载体,120ng下游插入物,41ng上游插入物,1μL有10mM ATP的10X连接缓冲液(New EnglandBiolabs),和1μL T4连接酶(New England Biolabs)构成。反应物在室温下孵育30分钟,而2μL等份的反应物被根据制造商的说明转化进电感受态大肠杆菌One Shot TOP10细胞(Invitrogen)。转化体被涂布于LB+卡那霉素平板上并在37℃下孵育过夜。使用引物oANN7和oANN8(产生约1.7kbp的片段)通过菌落PCR筛选到数个有合适插入的所得转化体。产生正确插入的克隆被命名为pANN12。
来自pGMEr137(如上)的东方伊萨酵母PYC编码序列(SEQ ID NO:1)被以位点定向诱变修饰,以消除不改变所编码酶氨基酸序列的三个EcoRI限制性位点。质粒pGMEr137被用作引物oANN13、oANN14和oANN15的模板,根据制造商的说明来使用Multi Change KiT(Stratagene),使用这些引物消除上述限制性位点。通过使用EcoRI的限制性消化筛选到数个所得转化体。阳性克隆通过测序进一步确认。得到正确pyc编码序列的克隆被命名为pANN14。
质粒pJY39(图29)被以Xhol和Pacl消化;质粒pACN5(如上,见图19)被以Xhol和Xbal消化;质粒pANN14被以Xball和Pacl消化。如本发明中所述,每个片段被以TBE缓冲液中1%琼脂糖凝胶电泳纯化。对载体约8kbp的条带,对第一插入物约700bp的条带和对编码PYC的第二插入物约3.6kbp的条带被从凝胶上切下并根据制造商的说明使用Gel ExtractionKiT(Qiagen)来纯化。使用T4连接酶(New England Biolabs)在10μL总反应体积中将纯化产物连接,10μL总反应体积由51ng载体,49ng第一插入物,210ng第二插入物,1μL有10mM ATP的10X连接缓冲液(New England Biolabs),和1μL T4连接酶(New England Biolabs)构成。反应物在室温下孵育30分钟,而2μL等份的反应物被根据制造商的说明转化进电感受态大肠杆菌One Shot TOP10细胞(Invitrogen)。转化体被涂布于LB+卡那霉素平板上并在37℃下孵育过夜。使用引物oJLJ57和oJLJ43(产生约1kbp的片段),引物oJLJ45和oANN16(产生约730bp的片段),和引物oANN20和oJY45(产生约1.2kbp的片段)通过菌落PCR筛选到数个有合适插入的所得转化体。得到正确插入的克隆被命名为pANN15。
质粒pANN12和pANN15被以Notl消化。质粒pANN15被另外地以Ncol消化以将骨架进一步片段化并改进所需片段的分离。消化的pANN12被根据制造商的说明使用Qiagen试剂盒纯化。如本发明中所述Notl片段以TBE缓冲液中的琼脂糖凝胶电泳纯化。约5kbp的片段(来自pANN12)和约6.3kbp的片段(来自pANN15)被根据制造商的说明使用Gel Extraction KiT(Qiagen)来凝胶纯化。
使用T4连接酶(New England Biolabs)在10μL总反应体积中将来自pANN15的纯化产物连接进pANN12线性化载体,10μL总反应体积由50ng载体,115ng插入物,1μL有10mM ATP的10X连接缓冲液(New England Biolabs),和1μL T4连接酶(New England Biolabs)构成。反应物在室温下孵育1.5小时,而2μL等份的反应物被用于根据制造商的说明转化电感受态大肠杆菌One Shot TOP10细胞(Invitrogen)。转化体被涂布于LB+卡那霉素平板上并在37℃下孵育过夜。使用引物oANN20和oJY45(产生约1.2kbp的片段)通过菌落PCR筛选到数个有合适插入的所得转化体。产生正确插入的克隆被通过以Sacl/EcoRI和以Sacl/EcoRV的限制性酶消化来进一步筛选以区分插入取向。产生上游PDC侧翼附近ura3标志的克隆被命名为pANN27。产生下游PDC侧翼附近ura3标志的克隆被命名为pANN28。
实施例3A-17:在adh1202基因座从四个核苷酸序列表达天冬氨酸1-脱羧酶(ADC) 和在pdc基因座表达丙酮酸羧化酶(PYC)的酵母菌株
本实施例描述了酵母菌株的构建,该酵母菌株在adh1202基因座表达编码SEQ IDNO:139地衣芽孢杆菌ADC的四个核苷酸拷贝并在pdc基因座表达编码SEQ ID NO:2东方伊萨酵母PYC的核苷酸。
从MeJi412去除ura标志
如上所述分离MeJi412的ura-衍生体。使用引物0611815和0611817通过菌落PCR筛选到MeJi412数个FOA抗性菌落有所需环出事件。引物0611815在左端构建体RKI终止子处退火并向ura3启动子扩增,而引物0611817在TDH3启动子处退火并反向朝ura3盒扩增。869bp条带的存在表示如所需的仅ura3残留位点的存在(在亲本菌株中两个URA3启动子间同源重组后留下的单个URA3启动子),而约2.6kbp条带表示完整URA3启动子-URA3ORF-URA3终止子-URA3启动子盒的存在,表明所需的重组事件没有发生。如上所述进行用
Figure BDA0001451815470001481
PlantDirect PCR KiT(Finnzymes)的PCR反应。以上述引物产生869bp片段的FOA抗性菌落被以产生3.8kbp产物的引物0612794和0611817以及产生3.7kbp产物的引物0611815和0612795进一步测试,以确认编码SEQ ID NO:139地衣芽孢杆菌ADC的核苷酸序列SEQ ID NO:138四个拷贝保持完整。一个来自亲本菌株MeJi412的FOA抗性菌落,命名为MeJi413,以所有三个引物组给出了所需的PCR产物。
片段的整合
质粒pANN28(如上)被以Ascl和Sacl消化并通过TBE缓冲液中的琼脂糖凝胶电泳纯化。约7.1kbp的条带被从凝胶上切下并根据制造商的说明使用Gel Extraction KiT(Qiagen)来纯化。
以来自菌株pANN28的消化并纯化片段来转化菌株MeJi413,并根据制造商说明通过菌落PCR(Failsafe,mix E,Epicenter)来验证正确的基因座靶向和转化。引物oANN12和oJLJ44产生约1kbp的条带;引物oANN11和oANN16产生约1.3kbp的条带。给出表达盒正确整合预期条带的菌株被命名为yANN35。
随后如上所述分离yANN35的ura-衍生体。使用引物oANN12和oJY44通过菌落PCR筛选到数个FOA抗性菌落有所需环出事件。引物oANN12在下游侧翼区域外退火。引物oJY44在TAL终止子处退火。1.5kbp条带的存在表示如所需的仅ura3残留位点的存在(在亲本菌株中两个URA3启动子间同源重组后留下的单个URA3启动子),而约2.8kbp条带表示完整URA3启动子-URA3 ORF-URA3终止子-URA3启动子盒的存在,表明所需的重组事件没有发生。如上所述进行用Failsafe DNA聚合酶(Epicenter)的PCR反应。对该事件阳性的分离株被进一步使用引物oANN16和oANN11通过菌落PCR来确认。一个FOA抗性菌落被命名为yANN37。
以来自菌株pANN28的消化并纯化片段来转化菌株yANN37,并根据制造商说明通过菌落PCR(Failsafe,mix E,Epicenter)来验证正确的基因座靶向和转化。使用对PDC基因特异的引物oHJJ116和oHJJ117进行初步筛选。约500bp的条带表示基因的存在并因此是所需整合的阴性结果。对PDC缺失阳性的分离株被以另外的PCR反应进一步确认。引物oANN11和oANN16产生约1.3kbp的条带;引物oANN12和oJY44oJLJ44产生约1kbp的条带;引物oANN12和oJY44产生约1.5kbp的条带和约2.9kbp的条带(分别对应第一个第二整合事件)。
此外,如上所述通过菌落PCR来确认之前在adh1202基因座处的整合事件。引物0611631和0611245产生约3.8kbp的条带。引物0611245和oNovo3产生约3kbp的条带。引物0611815和0612795产生约3.6kbp的条带。给出表达盒正确整合预期条带的菌株被命名为yANN41。
实施例3A-18:在adh1202基因座从四个核苷酸序列表达天冬氨酸1-脱羧酶(ADC) 和在pdc基因座表达丙酮酸羧化酶(PYC)的酵母菌株
本实施例描述了酵母菌株的构建,该酵母菌株在adh1202基因座表达编码SEQ IDNO:139地衣芽孢杆菌ADC的四个核苷酸拷贝(有两个在PDC启动子调控下的拷贝和两个在TDH3启动子调控下的拷贝)并在pdc基因座表达编码SEQ ID NO:2东方伊萨酵母PYC的核苷酸。
从MIBa355去除ura标志
如上所述分离MIBa355的ura-衍生体。使用引物0611815和0611718通过PCR筛选到MIBa355数个FOA抗性菌落的基因组DNA有所需环出事件。约500bp条带的存在表示如所需的仅ura3残留位点的存在(在亲本菌株中两个URA3启动子间同源重组后留下的单个URA3启动子),而约1.9kbp条带表示完整URA3启动子-URA3ORF-URA3终止子-URA3启动子盒的存在,表明所需的重组事件没有发生。根据制造商的说明使用
Figure BDA0001451815470001501
Plant Direct PCR KiT(Finnzymes)进行PCR。以上述引物产生约500bp片段的FOA抗性菌落被以产生3.5kbp产物的引物0611631和0611245以及产生4.5kbp产物的引物0611815和0611632进一步测试,以确认编码SEQ ID NO:139地衣芽孢杆菌ADC的核苷酸序列SEQ ID NO:138四个拷贝保持完整。其也被使用引物0611815和0611817以PCR测试,以确认adh1202处第一修饰的存在。这些PCR引物产生828bp的片段。一个来自亲本菌株MIBa355的FOA抗性菌落,命名为MIBa357,以所有四个引物组给出了所需的PCR产物。
质粒pANN28(如上)被以Ascl和Sacl消化并以TBE缓冲液中的1%琼脂糖凝胶电泳纯化。约7.1kbp的条带被从凝胶上切下并根据制造商的说明使用
Figure BDA0001451815470001502
Extract II KiT(Macherey-Nagel)纯化。
MIBa357被以消化的pANN28DNA转化,并使用PhirePlant Direct PCR KiT(Finnzymes)通过PCR验证正确的基因座靶向和转化。引物0611622和0611552产生约850bp条带;引物0611245和0612794产生约2.8kbp的条带;引物0611815和0612795产生约3.9kbp的条带。给出表达盒正确整合预期条带的菌株被命名为McTs241。
随后如前所述分离McTs241的ura-衍生体。使用引物0614233和0611554通过PCR筛选到McTs241数个FOA抗性菌落有所需的环出事件,并在减除了ura的平板上缺乏生长。约4.6kbp条带的存在表示如所需的仅ura3残留位点的存在(在亲本菌株中两个URA3启动子间同源重组后留下的单个URA3启动子),而约5.9kbp条带表示完整URA3启动子-URA3ORF-URA3终止子-URA3启动子盒的存在,表明所需的重组事件没有发生。如上所述进行使用PhirePlant Direct PCR KiT(Finnzymes)的PCR反应。一个来自亲本菌株McTs241的,具有所需环出事件的FOA抗性菌落被命名为McTs247。
为构建纯合整合体,McTs247被以消化的pANN28DNA转化,并使用PhirePlantDirect PCR KiT(Finnzymes)通过PCR验证正确的基因座靶向和转化。作为第一次筛选,使用引物0611552和0611553通过PCR来筛选转化体,其仅当pdc基因座完整并因此PDC基因座处PYC的纯合重组没有发生时应产生约850bp的条带。对该PCR的条带阴性的那些随后被使用引物0611555和0611554通过另外PCR来筛选。使用这些引物,当PDC完整并因此PDC基因座处无PYC的纯合重组时产物应仅扩增1.4kbp条带。使用产生约850bp条带的引物0611622和0611552;产生约2.8kbp条带的引物0611245和0612794;产生约3.9kbp条带的引物0611815和0612795通过PCR进行转化体的进一步筛选。给出表达盒正确整合预期条带的菌株被命名为McTs253。
实施例3A-19:菌株MeJi412、yANN35、yANN41、MIBa355、McTs241和McTs253的PYC活 性、ADC活性和3-HP产生性能。
菌株MeJi412、yANN35、yANN41、MIBa355、McTs241和McTs253被在摇瓶中生长,如本发明中所述制备CFE并测试丙酮酸羧化酶(PYC)活性和天冬氨酸1-脱羧酶(ADC)活性。结果显示于表27中。也使用本发明描述的方法,在生物反应器中测试菌株MeJi412、yANN35、yANN41、MIBa355、McTs241和McTs253的3-HP产生。这些生物反应器实验的结果也显示于表27中。考虑到这些发酵中的细胞质量的差异,显示的3-HP产生性能被表示为每单位细胞质量的3-HP浓度(表示为g/L 3-HP/g/L干细胞重)。结果显示随着细胞中PYC活性水平的增加,3-HP产生性能增加。
表27:转化体PYC和ADC活性和3-HP产生性能
Figure BDA0001451815470001511
实施例3A-20:在adh1202基因座从四个核苷酸序列表达天冬氨酸1-脱羧酶(ADC) 并缺失了β-丙氨酸氨基转移酶(BAAT)的酵母菌株
本实施例描述了酵母菌株的构建和性能,所述酵母菌株在adh1202基因座表达编码SEQ ID NO:139地衣芽孢杆菌ADC的四个核苷酸拷贝并缺失了编码SEQ ID NO:20的BAAT(PYD4)的天然东方伊萨酵母基因。
东方伊萨酵母BAAT(PYD4)缺失质粒的构建
质粒pMIBa 123(如上)被以Notl、Kpnl、Apal消化并如本发明中所述通过TBE缓冲液中1%的琼脂糖凝胶电泳来纯化。约3.6kbp和3.8kbp的两个条带被被从凝胶上切下并根据制造商的说明使用
Figure BDA0001451815470001521
Extract II KiT(Macherey-Nagel)纯化。这两片段包含质粒骨架和有SEQ ID NO:144的酿酒酵母3-HPDH基因(YMR226c)的ura选择盒
以引物0613178和0613180使用东方伊萨酵母MBin500基因组DNA通过PCR扩增生成上游东方伊萨酵母PYD4同源区的PCR产物。使用引物0613179和0613181通过PCR扩增从MBin500基因组DNA制备下游东方伊萨酵母PYD4同源区片段。每种引物50pmol被用于含0.5μL作为模板的MBin500基因组DNA,dATP、dCTP、dGTP和dTTP每种0.2mM,1XExpand HighFidelity Buffer(Roche),3.5U Expand High Fidelity Enzyme Mix(Roche)的终体积50μL的PCR反应中。在
Figure BDA0001451815470001522
5333(Eppendorf)中进行扩增反应,程序为95℃ 3分钟的1个循环;和每个为95℃ 30秒,55℃ 30秒和72℃ 1分钟的30个循环。循环后,反应物被在72℃孵育5分钟并随后在10℃冷却直至进一步处理。使用引物0613178和0613180的约800bp的PCR条带,以及使用引物0613179和0613181的约900bp的PCR条带被以TBE缓冲液中1%的琼脂糖凝胶电泳纯化。条带被从凝胶上切下并根据制造商的说明使用
Figure BDA0001451815470001523
Extract II KiT(Macherey-Nagel)纯化。
PYD4上游PCR产物,PYD4下游PCR产物,和pMIBa123Notl/Kpnl/Apal消化的质粒被根据制造商说明在用IN-FUSION HDTM(Clontech Labboratories,Inc.)的反应中组装。来自In-FUSION反应的2μL被根据制造商的说明转化进ONE
Figure BDA0001451815470001524
TOP10化学感受态大肠杆菌细胞(Invitrogen)。在恢复期后,来自转化反应的两份100μL等份被涂布于于添加有每mL100μg氨苄青霉素的150mm 2X YT平板上。平板在37℃孵育过夜。从选择平板上选出推定的重组克隆并使用
Figure BDA0001451815470001525
9600(Qiagen)从每一个制备质粒DNA。克隆通过限制性消化和测序来分析。有正确序列的质粒通过测序验证并命名为pMcTs61。
质粒pMcTs61仍然含PDC启动子,来自酿酒酵母的YMR226c基因,和PDC终止子。为去除这些不需要的片段,pMcTs61被以EcoRI和Xhol消化随后加入Klenow片段以构建平末端。7.1kbp的片段被以TBE缓冲液中1%的琼脂糖凝胶电泳纯化。条带被从凝胶上切下并根据制造商的说明使用
Figure BDA0001451815470001531
Extract II KiT(Macherey-Nagel)纯化。使用T4连接酶(New England Biolabs,Ipswich,MA,USA)将消化的平末端质粒连接在一起。反应混合物在总体积20μL中含1X T4连接酶缓冲液,1μL T4DNA连接酶,5μL pMcTs61消化和平末端化的纯化DNA。反应物在室温下孵育2小时。10μL连接反应样品被用于根据制造商的说明转化ONE
Figure BDA0001451815470001532
TOP10化学感受态大肠杆菌细胞(Invitrogen)。在恢复期后,来自转化反应的两份100μL等份被涂布于添加有每mL 100μg氨苄青霉素的150mm 2X YT平板上。平板在37℃孵育过夜。从选择平板上选出推定的重组克隆。通过菌落PCR分析克隆。通过将1个菌落溶解于50μL无菌水中,在95℃加热10分钟,随后在冰上冷却直至使用来制备每个菌落的模板DNA。引物0612911和0612909被用于筛选转化体。如果质粒正确,以这些引物的PCR反应会扩增出1kbp的条带。每种引物10pmol被用于含2μL菌落DNA模板,dATP、dCTP、dGTP和dTTP每种0.1mM,1X Crimson Taq反应缓冲液(New England Biolabs),1U Crimson Taq DNA聚合酶(New England Biolabs)的终体积20μL的PCR反应中。在
Figure BDA0001451815470001533
Figure BDA0001451815470001534
5333(Eppendorf)中进行扩增反应,程序为95℃ 3分钟的1个循环;和每个为95℃ 30秒,55℃ 30秒和72℃ 3分钟的30个循环。循环后,反应物被在72℃孵育5分钟并随后在10℃冷却直至进一步处理。以TAE缓冲液中的溴化乙啶来在1%TAE-琼脂糖凝胶中观察来自5μLPCR反应物的1kbp片段。有正确大小PCR产物的一个转化体被选出并命名为pMcTs64(图30)。使用
Figure BDA0001451815470001535
9600(Qiagen)制备pMcTs64的质粒DNA。
使用pMcTs64构建体从MeJi413缺失天然东方伊萨酵母BAAT(PYD4)
质粒pMcTs64(如上,见图30)被以Apal、Ncol、Kpnl消化并通过TBE缓冲液中1%的琼脂糖凝胶电泳来纯化。约3.3kbp的条带被被从凝胶上切下并根据制造商的说明使用
Figure BDA0001451815470001536
Extract II KiT(Macherey-Nagel)纯化。
菌株MeJi413(如上)被以消化的pMcTs64DNA转化,并使用Phire Plant DirectPCR KiT(Finnzymes)通过PCR验证正确的基因座靶向和转化。引物0612908和0613242产生约1.7kbp条带;引物0613241和0612909产生约1.5kbp的条带以确认缺失盒的整合;引物0611815和0611632产生约4.2kbp的条带;引物0611817和0611631产生约4.8kbp的条带以确认ADH1202基因座的ADC表达盒仍然完整。给出缺失盒和ADC盒正确整合预期条带的菌株被命名为McTs225。
随后如前所述分离McTs225的ura-衍生体。使用引物0612911和0612910通过PCR筛选到McTs225数个FOA抗性菌落有所需的环出事件。约1.1kbp条带的存在表示如所需的仅ura3残留位点的存在(在亲本菌株中两个URA3启动子间同源重组后留下的单个URA3启动子),而约2.5kbp条带表示完整URA3启动子-URA3ORF-URA3终止子-URA3启动子盒的存在,表明所需的重组事件没有发生。引物0611815和0611632产生约4.2kbp的条带;引物0611817和0611631产生约4.8kbp的条带以确认adh1202基因座的ADC表达盒仍然完整。如上所述进行使用Phire Plant Direct PCR KiT(Finnzymes)的PCR反应。一个来自亲本菌株McTs225的,具有所需环出事件的FOA抗性菌落被命名为McTs228。
为构建编码SEQ ID NO:20的东方伊萨酵母BAAT(PYD4)的天然基因的纯合缺失体,McTs228被以消化的pMcTs64转化,并使用Phire Plant Direct PCR KiT(Finnzymes)通过PCR验证正确的基因座靶向和转化。两组引物被用于通过PCR筛选PYD4位点缺失。仅当PYD4位点完整时,引物0613550和0612910产生约700bp的条带,表明PYD4纯合缺失没有发生。此外转化体被以在PYD4没有被缺失时产生约600bp条带的引物0612911和0613551来筛选。对东方伊萨酵母PYD4基因座阴性的转化体被以产生约3.5kbp和2.1kbp条带的引物0613242和0613243,产生约1.7kbp条带的引物0612908和0613243;产生约950bp条带的引物0612909和0612911来进一步筛选。以产生约4.8kbp条带的引物0611817和0611631以及产生约4.2kbp条带的引物611815和612712来确认adh1202处ADC盒仍然完整。给出表达盒正确整合预期条带的菌株被命名为McTs236。
随后如前所述分离McTs236的ura-衍生体。使用产生约2.1kbp条带的引物0613242和0613243通过PCR筛选到McTs236数个FOA抗性菌落有所需的环出事件。使用产生约3kbp条带的引物0611245和0612794以及产生约3.6kbp条带的引物0611815和0612795来确认adh1202基因座的ADC盒仍然完整。给出表达盒正确整合预期条带的菌株被命名为McTs245。
使用本发明描述的方法,在生物反应器中测试菌株MIBa372和McTs245的3-HP产生。考虑到这些发酵中的细胞质量的差异,3-HP产生性能被表示为每单位细胞质量的3-HP浓度(表示为g/L 3-HP/g/L干细胞重)。菌株MIBa372和McTs245的g/L 3-HP/g/L干细胞重分别为1.66和0.16。这些结果表明由于缺失该基因导致3-HP产生性能降低至10分之1,因此是东方伊萨酵母中的天然PYD4基因负责将β-丙氨酸转化成丙二酸半醛。
实施例3A-21在adh1202基因座从四个核苷酸序列表达天冬氨酸1-脱羧酶(ADC)并 缺失了3-HP脱氢酶(3-HPDH)的酵母菌株
本实施例描述了酵母菌株的构建和性能,所述酵母菌株在adh1202基因座表达编码SEQ ID NO:139地衣芽孢杆菌ADC的四个核苷酸拷贝并缺失了编码SEQ ID NO:26的3-HPDH的天然东方伊萨酵母基因。
东方伊萨酵母3-HPDH缺失质粒的构建
质粒pMIBa 123(如上)被以Notl、Kpnl、Apal消化并如本发明中所述通过TBE缓冲液中1%的琼脂糖凝胶电泳来纯化。约3.6kbp和3.8kbp的两个条带被被从凝胶上切下并根据制造商的说明使用
Figure BDA0001451815470001551
Extract II KiT(Macherey-Nagel)纯化。这两片段包含质粒骨架和有SEQ ID NO:144酿酒酵母3-HPDH基因的ura选择盒。
使用引物0613183和0613184从如前所述制备的东方伊萨酵母MBin500基因组DNA扩增上游东方伊萨酵母3-HPDH同源区的PCR产物。使用引物0613185和0613186从MBin500基因组DNA扩增下游东方伊萨酵母3-HPDH同源区片段。每种引物50pmol被用于含0.5μL作为模板的MBin500基因组DNA,dATP、dGTP、dCTP、和dTTP每种0.2mM,2%DMSO,1X Phusion HF缓冲液(Finnzymes),2U
Figure BDA0001451815470001552
Hot Start High Fidelity DNA聚合酶(Finnzymes)的终体积50μL的PCR反应中。在
Figure BDA0001451815470001554
Figure BDA0001451815470001553
5333(EppendorfScientific Inc.,Westbury,NY,USA)中进行扩增反应,程序为95℃ 3分钟的1个循环;和每个为95℃ 30秒,55℃ 30秒和72℃ 1分钟的30个循环。循环后,反应物被在72℃孵育5分钟并随后在4℃冷却直至进一步处理。引物0613183和0613184的约640bp的PCR条带,以及引物0613185和0613186的约670bp的PCR条带被以TBE缓冲液中1%的琼脂糖凝胶电泳纯化。条带被从凝胶上切下并根据制造商的说明使用
Figure BDA0001451815470001555
Extract II KiT(Macherey-Nagel)纯化。
东方伊萨酵母3-HPDH上游PCR产物,东方伊萨酵母3-HPDH下游PCR产物,和pMIBa123Notl/Kpnl/Apal消化的质粒被根据制造商说明在用IN-FUSION HDTM(ClontechLabboratories,Inc.)的反应中组装。来自In-FUSION反应的2μL被根据制造商的说明转化进ONE
Figure BDA0001451815470001561
TOP10化学感受态大肠杆菌细胞(Invitrogen)。在恢复期后,来自转化反应的两份100μL等份被涂布于添加有每mL 100μg氨苄青霉素的150mm 2X YT平板上。平板在37℃孵育过夜。从选择平板上选出推定的重组克隆并使用
Figure BDA0001451815470001562
9600(Qiagen)从每一个制备质粒DNA。克隆通过限制性消化和测序来分析。有正确序列的质粒通过测序验证并命名为pMcTs60。
质粒pMcTs60仍然含PDC启动子,来自酿酒酵母的YMR226c基因,和PDC终止子。为去除这些不需要的片段,pMcTs60被以Notl和Xbal消化,含3-HPDH同源区和质粒骨架片段的约5kbp条带被以TBE缓冲液中1%的琼脂糖凝胶电泳纯化。条带被从凝胶上切下并根据制造商的说明使用
Figure BDA0001451815470001563
Extract II KiT(Macherey-Nagel)纯化。以两个PCR反应,一个用引物0613416和0613417另一个用引物0613418和0613419来扩增ura3选择盒。每种引物50pmol被用于含0.5μL作为模板的pMcTs60质粒DNA,dATP、dGTP、dCTP和dTTP每种0.2mM,1X Expand High Fidelity Buffer(Roche),3.5U Expand High Fidelity Enzyme Mix(Roche)的终体积50μL的PCR反应中。在
Figure BDA0001451815470001564
5333(Eppendorf Scientific Inc.)中进行扩增反应,程序为95℃ 3分钟的1个循环;和每个为95℃ 30秒,55℃ 30秒和72℃ 1分钟的30个循环。循环后,反应物被在72℃孵育5分钟并随后在4℃冷却直至进一步处理。引物0613416和0613417的约700bp的PCR条带,以及引物0613418和0613419的1kbp的PCR条带被以TBE缓冲液中1%的琼脂糖凝胶电泳纯化。条带被从凝胶上切下并根据制造商的说明使用
Figure BDA0001451815470001565
Extract II KiT(Macherey-Nagel)纯化。含东方伊萨酵母3-HPDH同源区的质粒骨架和ura3盒PCR产物被根据制造商说明在用IN-FUSION HDTM(Clontech Labboratories,Inc.)的反应中组装。来自In-FUSION反应的2μL被根据制造商的说明转化进Solo Pack Gold Super Competent Cells(Stratagene)。在恢复期后,来自转化反应的两份100μL等份被涂布于添加有每mL 100μg氨苄青霉素的150mm 2X YT平板上。平板在37℃孵育过夜。从选择平板上选出推定的重组克隆并使用
Figure BDA0001451815470001566
9600(Qiagen)从每一个制备质粒DNA。克隆通过限制性消化来分析,有正确限制性消化方式的质粒被命名为pMcTs65(图31)。
使用pMcTs65构建体从MeJi413缺失天然东方伊萨酵母3-HPDH
质粒pMcTs65(如上,见图31)被以Apal、Sph、Kpnl消化并通过TBE缓冲液中1%的琼脂糖凝胶电泳来纯化。约2.9kbp的条带被被从凝胶上切下并根据制造商的说明使用
Figure BDA0001451815470001571
Extract II KiT(Macherey-Nagel)纯化。
菌株MeJi413(如上)被以消化的pMcTs65DNA转化,并使用Phire Plant DirectPCR KiT(Finnzymes)通过PCR验证正确的基因座靶向和转化。引物0613034和0613035产生约2.7kbp条带以确认缺失盒的整合;引物0611815和0611632产生约4.2kbp的条带;引物0611817和0611631产生约4.8kbp的条带以确认adh1202基因座的ADC表达盒仍然完整。给出缺失盒和ADC盒正确整合预期条带的菌株被命名为McTs229。
随后如前所述分离McTs229的ura-衍生体。使用引物0613034和0613241通过PCR筛选到McTs229数个FOA抗性菌落有所需的环出事件。约1.4kbp条带的存在表示如所需的仅ura3残留位点的存在(在亲本菌株中两个URA3启动子间同源重组后留下的单个URA3启动子),而约2.8kbp条带表示完整URA3启动子-URA3ORF-URA3终止子-URA3启动子盒的存在,表明所需的重组事件没有发生。约1.9kbp条带的存在表示存在于这些转化体中的野生型基因盒,因为这些是缺失的杂合。引物0611815和0611632产生约4.2kbp的条带;引物0611631和0612366产生约4.5kbp的条带以确认ADH1202基因座的ADC表达盒仍然完整。如上所述进行使用Phire Plant Direct PCR KiT(Finnzymes)的PCR反应。一个来自亲本菌株McTs225的,具有所需环出事件的FOA抗性菌落被命名为McTs238。
为构建编码SEQ ID NO:26的东方伊萨酵母3-HPDH的天然基因的纯合缺失体,McTs238被以消化的pMcTs65转化,并使用Phire Plant Direct PCR KiT(Finnzymes)通过PCR验证正确的基因座靶向和转化。两组引物被用于通过PCR筛选YMR226c基因座缺失。当3-HPDH位点完整时引物0613034和0613747产生约500bp的条带以表明3-HPDH纯合缺失没有发生。此外转化体被以引物0613746和0613241来筛选,其在3-HPDH没有被缺失时产生约660bp的条带。对东方伊萨酵母3-HPDH基因座野生型阴性的转化体被以产生约2.8kbp和1.4kbp条带的引物0613034和0613241,产生约1.5kbp条带的引物0612908和0613241;产生约1kbp条带的引物0613034和0612909来进一步筛选。以产生约3kbp条带的引物0611245和0612794以及产生约3.6kbp条带的引物0611815和0612795来确认ADH1202基因座处ADC盒仍然完整。有表达盒正确整合预期条带的菌株被命名为McTs244。
随后如前所述分离McTs244的ura-衍生体。使用产生约1.4kbp条带的引物0613034和0613241通过PCR筛选到McTs244数个FOA抗性菌落有所需的环出事件。使用产生约3kbp条带的引物0611245和0612794以及产生约3.6kbp条带的引物0611815和0612795来确认ADH1202基因座的ADC表达盒仍然完整。一个来自亲本菌株McTs244的,具有所需环出事件的FOA抗性菌落被命名为McTs259。
使用本发明描述的方法,在生物反应器中测试菌株MIBa372和McTs244的3-HP产生。考虑到这些发酵中的细胞质量的差异,3-HP产生性能被表示为每单位细胞质量的3-HP浓度(表示为g/L 3-HP/g/L干细胞重)。菌株MIBa372和McTs259的g/L 3-HP/g/L干细胞重分别为1.66和<0.1。这些结果表明由于缺失该基因消除了3-HP产生,因此是东方伊萨酵母中的天然3-HPDH基因负责将丙二酸半醛转化为3-HP。
实施例3A-22:在pdc基因座表达丙酮酸羧化酶(PYC),天冬氨酸氨基转移酶(AAT),β-丙氨酸氨基转移酶(BAAT),和3-羟基丙酸脱氢酶(3-HPDH);并在adh1202基因座从四个核苷酸序列表达天冬氨酸1-脱氢酶(ADC)的酵母菌株
设计另外的构建体以在菌株中东方伊萨酵母pdc基因座掺入编码SEQ ID NO:2的东方伊萨酵母PYC的核苷酸序列SEQ ID NO:1,编码SEQ ID NO:14的东方伊萨酵母ATT的核苷酸序列SEQ ID NO:13,编码SEQ ID NO:21的克鲁维酵母BAAT的核苷酸序列SEQ ID NO:142,和编码SEQ ID NO:129的酿酒酵母3-HPDH的核苷酸序列SEQ ID NO:144,菌株也在adh1202基因座包含编码SEQ ID NO:139的地衣芽孢杆菌ADC的四个核苷酸拷贝,以与上面描述的方式类似的方式,设计左端和右端构建体以允许在东方伊萨酵母CNB1pdc基因座的同源重组。如下所述,这些构建体被制备并转化进MIBa357。
左端片段的构建
使用质粒pGMEr126(图16)作为模板按制造商的说明通过PCR扩增(Pfu聚合酶,Stratagene)编码SEQ ID NO:14的东方伊萨酵母ATT的核苷酸序列SEQ ID NO:13。引物oANN1和oANN2允许掺入基因编码序列侧翼独特的限制性位点。PCR产物被以TBE缓冲液中1%琼脂糖凝胶电泳纯化。约1.3kbp的条带被从凝胶上切下并根据制造商的说明使用GelExtraction KiT(Qiagen)纯化。纯化的PCR产物被以Apal和Nrul消化并如本发明中所述被凝胶纯化。
质粒pGMEr135(与上面pGMEr136相同,除了ENO1启动子/RKI终止子插入物是相反取向)被以Apal和Nrul消化并如本发明中所述以TBE缓冲液中琼脂糖凝胶电泳纯化。约11.7kbp的条带被从凝胶上切下并根据制造商的说明使用Gel Extraction KiT(Qiagen)纯化。
使用T4连接酶(New England Biolabs)在10μL总反应体积中将纯化的1.3kbpPCR产物连接进11.7kbp的pGMEr135线性化载体,10μL总反应体积由49.8ng载体,354ng 1.3kbp插入物,1μL有10mM ATP的10X连接缓冲液(New England Biolabs),和1μL T4连接酶(NewEngland Biolabs)构成。反应物在室温下孵育30分钟,而2μL等份的反应物被根据制造商的说明转化进电感受态大肠杆菌DH10B细胞(Invitrogen)。转化体被涂布于LB+卡那霉素平板上并在37℃下孵育过夜。使用引物oHJ2和oANN1(产生约2.3kbp条带)以及引物oANN5和oANN6(产生约877bp条带)通过菌落PCR筛选到数个有合适插入的所得转化体。PCR扩增aat片段的序列也被确认。产生正确插入和序列的克隆以Apal和Nrul消化并如本发明中所述被凝胶纯化。约1.3kbp的条带被从凝胶上切下并根据制造商的说明使用Gel Extraction KiT(Qiagen)纯化。
包含编码SEQ ID NO:2的东方伊萨酵母PYC的所需核苷酸序列SEQ ID NO:1的质粒pGMEr137(如上,见图18)被以Apal和Nrul消化并如本发明中所述以TBE缓冲液中琼脂糖凝胶电泳纯化。约11.7kbp的条带被从凝胶上切下并根据制造商的说明使用Gel ExtractionKiT(Qiagen)纯化。
使用T4连接酶(New England Biolabs)在10μL总反应体积中将纯化的1.3kbpPCR产物连接进11.7kbp的pGMEr137线性化载体,10μL总反应体积由49.4ng载体,54ng 1.3kbp插入物,1μL有10mM ATP的10X连接缓冲液(New England Biolabs),和1μL T4连接酶(NewEngland Biolabs)构成。反应物在室温下孵育30分钟,而2μL等份的反应物被用于根据制造商的说明转化进电感受态大肠杆菌DH10B细胞(Invitrogen)。转化体被涂布于LB+卡那霉素平板上并在37℃下孵育过夜。使用引物oHJ2和oANN1(产生约2.3kbp条带)以及引物oANN5和oANN6(产生约877bp条带)通过菌落PCR筛选到数个有合适插入所得转化体。产生正确插入和序列的克隆被命名为pANN02。
具有相反朝向AAT编码序列的左端片段的构建
质粒pANN02被以Pmel消化并如本发明中所述以TBE缓冲液中琼脂糖凝胶电泳纯化。约10.3kbp的条带和约2.7kbp的条带被从凝胶上切下并根据制造商的说明使用GelExtraction KiT(Qiagen)纯化。来自pANN2的10.3kbp载体片段被以CIP(New EnglandBiolabs)去磷酸化并根据制造商的说明使用纯化试剂盒(Qiagen)纯化。使用T4连接酶(NewEngland Biolabs)在10μL总反应体积中将来自pANN02的2.7kbp片段连接进来自pANN02的去磷酸化10.3kbp线性化载体,10μL总反应体积由36ng载体,28ng插入物,1μL有10mM ATP的10X连接缓冲液(New England Biolabs),和1μL T4连接酶(New England Biolabs)构成。反应物在室温下孵育30分钟,而2μL等份的反应物被根据制造商的说明转化进电感受态大肠杆菌TOP10细胞(Invitrogen)。转化体被涂布于LB+卡那霉素平板上并在37℃下孵育过夜。使用引物oJY44和oHJ1(产生约1.3kbp条带)通过菌落PCR筛选到数个有合适插入的所得转化体。产生正确插入的克隆被命名为pANN5。
右端片段的构建
如下构建含两个地衣芽孢杆菌ADC编码区和东方伊萨酵母PDC基因座3’靶向侧翼DNA的右端构建体。质粒pMhCt071(与上述pMhCt077相同的质粒,除了酿酒酵母3-HPDH ORF没有为东方伊萨酵母密码子优化)被以Pmel和Pacl消化,以10个单位的小牛肠磷酸酶(NewEngland Biolabs)处理,并以TAE缓冲液中0.9%琼脂糖凝胶电泳纯化,约4.7kbp的条带被从凝胶上切下并根据制造商的说明使用
Figure BDA0001451815470001601
Extract II KiT(Macherey-Nagel)纯化。
质粒pMeJi312-2(如上,见图15)被以Pmel和Pacl消化以提取两个地衣芽孢杆菌ADC表达盒,并以TAE缓冲液中0.9%琼脂糖凝胶电泳纯化,约2.8kbp的条带被从凝胶上切下并根据制造商的说明使用
Figure BDA0001451815470001602
Extract II KiT(Macherey-Nagel)纯化。
在含1X Quick连接缓冲液(New England Biolabs),1μL 4.7kbp pMhCt071载体片段,3μL来自pMeJi312-2的2.8kbp插入物,和1μL Quick T4DNA连接酶(New EnglandBiolabs)的连接体系中(20μL),将来自pMeJi312-2的含两个地衣芽孢杆菌ADC编码区的片段连接进线性化的pMhCt071载体片段。连接反应物在室温孵育5分钟,随后将管置于冰上。5μL反应物根据制造商的说明被用于转化Solo Pack Gold SuperCompetent Cells(AgilentTechnologies)。转化体被涂布于2X YT+amp平板上并在37℃下孵育过夜。通过ApaLI消化筛选到数个有所需片段的正确连接的所得转化体。产生所需片段大小的克隆被保存并命名为pMhCt110。
质粒pMhCt110被以Xbal和Pacl消化,随后如本发明所述以CIP处理并以TBE缓冲液中1%琼脂糖凝胶电泳纯化。约7.1kbp的片段被从凝胶上切下并根据制造商的说明使用
Figure BDA0001451815470001611
Gel Extraction KiT(Qiagen)纯化。
SEQ ID NO:144的密码子优化酿酒酵母3-HPDH编码序列被通过以Xbal和Pacl消化从pMIBa123(如上)上切下并如本发明所述以TBE缓冲液中1%琼脂糖凝胶电泳纯化。约814bp的片段被从凝胶上切下并根据制造商的说明使用
Figure BDA0001451815470001612
Gel ExtractionKiT(Qiagen)纯化。使用T4连接酶(New England Biolabs)在10μL总反应体积中将814bp的纯化片段连接进来自pMhCt110的7.1kbp片段,10μL总反应体积由1μL消化的pMhCt110,1或7μL来自pMIBa123的814bp片段,1μL有10mM ATP的10X连接缓冲液(New England Biolabs),和1μL T4连接酶(New England Biolabs)构成。反应物在室温下孵育30分钟,而4μL等份的反应物被用于根据制造商的说明转化进ONE
Figure BDA0001451815470001613
TOP10化学感受态大肠杆菌细胞(Invitrogen)。转化体被涂布于2X YT+amp平板上并在室温下孵育过周末。通过使用Xbal和Pacl以及Ascl和Pacl的2个酶组合的限制性消化筛选到数个有合适插入的所得转化体。从每个消化中产生正确消化条带大小的克隆被命名为pMIBa142。
质粒pMIBa142被以Ascl消化,随后进行用Klenow的补平反应和以Nhel的随后消化以及CIP处理。如本发明所述消化物以TBE缓冲液中1%琼脂糖凝胶电泳来纯化。约7.5kbp的条带被从凝胶上切下并根据制造商的说明使用
Figure BDA0001451815470001614
Gel Extraction KiT(Qiagen)来纯化。
编码SEQ ID NO:21的克鲁维酵母BAAT的核苷酸序列SEQ ID NO:142通过以Pacl的消化被从pMIBa124(如上)上切下,随后进行用Klenow的补平反应和以Xbal的随后消化。如本发明所述消化物以TBE缓冲液中1%琼脂糖凝胶电泳来纯化。约1.4kbp的条带被从凝胶上切下并根据制造商的说明使用
Figure BDA0001451815470001615
Gel Extraction KiT(Qiagen)来纯化。
使用T4连接酶(New England Biolabs)在10μL总反应体积中将来自pMIBa124的1.4kbp纯化片段连接进来自pMIBa142的7.5kbp片段,10μL总反应体积由1μL消化的pMIBa142,7μL来自pMIBa124的1.4kbp片段,1μL有10mM ATP的10X连接缓冲液(New EnglandBiolabs),和1μL T4连接酶(New England Biolabs)构成。反应物在16℃下孵育2.5小时,而整个连接物被根据制造商的说明转化进Sure细胞(Agilent)。转化体被涂布于2X YT+amp平板上并在37℃下孵育过夜。通过使用Stul和Pmel的限制性消化筛选到数个有合适插入的所得转化体。产生正确消化条带大小的克隆被命名为pMIBa144。
左端和右端片段整合进MIBa357
如本发明中所述质粒pANN5被以Notl和Nhel消化而质粒pMIBa144被以Notl消化。这些被以TBE缓冲液中1%琼脂糖凝胶电泳来纯化。来自pANN5约8.2kbp片段和来自pMIBa144的约6kbp片段被从凝胶上切下并根据制造商的说明使用
Figure BDA0001451815470001621
Extract II KiT(Macherey-Nagel)纯化。
以消化的pANN5和pMIBa144DNA来转化MIBa357,并根据制造商说明使用
Figure BDA0001451815470001622
Plant Direct PCR KiT(Finnzymes)来通过PCR来验证正确的基因座靶向和转化。引物0611552和0613695产生约4.1kbp的条带(以确认pdc基因座处左半边整合);引物0612358和0611554产生约2.5kbp的条带(以确认pdc基因座处右半边整合);引物0611245和0611631产生约3.5kbp的条带(以确认左半边4XADC整合仍然在adh1202基因座);而引物0611815和0611632产生约4.6kbp的条带(以确认右半边4XADC整合仍然在adh1202基因座)。给出pdc基因座表达盒正确整合预期条带并在adh1202基因座保留表达盒的一个分离株被保存并命名为MIBa360。
从MIBa360去除ura标志
如上所描述分离MIBa360的ura-衍生体。使用引物0611815和0613689通过PCR筛选到来自MIBa360数个FOA抗性菌落的基因组DNA有所需环出事件。约1.9kbp条带的存在表示如所需地去除了ura标志而有ura3残留位点(在亲本菌株中两个URA3启动子间同源重组后留下的单个URA3启动子),而约3.3kbp条带表示完整URA3启动子-URA3ORF-URA3终止子-URA3启动子盒的存在,表明所需重组事件没有发生。按照制造商的说明使用
Figure BDA0001451815470001623
PlantDirect PCR KiT(Finnzymes)进行PCR。以上述引物产生约1.9kbp片段的两个FOA抗性菌落被保存并命名为MIBa363和MIBa364。
反向表达盒右端片段的构建
质粒pMIBa144包含所需朝正向取向前进的ADC和3-HPDH表达盒。为简化同源菌株的筛选,构建了新的质粒,其中pMIBa144的ADC表达盒被置于反向取向。质粒pMIBa144(如上)被以Stul和Pmel消化,如本发明中所述以TBE缓冲液中1%琼脂糖凝胶电泳来纯化。约6.1kbp和2.8kbp的条带被从凝胶上切下并根据制造商的说明使用
Figure BDA0001451815470001631
GelExtraction KiT(Qiagen)来纯化。来自pMIBa144的的6.1kbp片段被以CIP处理并根据制造商的说明使用
Figure BDA0001451815470001632
PCR Purification KiT(Qiagen)来纯化。
使用T4连接酶(New England Biolabs)在10μL总反应体积中将来自pMIBa144的2.8kbp的纯化片段连接进6.1kbp的pMIBa144线性化载体,10μL总反应体积由1μL来自pMIBa144的6.1kbp片段,7μL来自pMIBa144的2.8kbp片段,1μL有10mM ATP的10X连接缓冲液(New England Biolabs),和1μL T4连接酶(New England Biolabs)构成。反应物在16℃下孵育4小时,而4μL等份的反应物被根据制造商的说明转化进ONE
Figure BDA0001451815470001633
TOP10化学感受态大肠杆菌细胞(Invitrogen)。转化体被涂布于2X YT+amp平板上并在37℃下孵育过夜。通过使用Sphl和Xbal的限制性消化筛选到数个有合适插入的所得转化体。产生正确消化条带大小的克隆被命名为pMIBa146。
将左端和右端片段整合进MIBa363
如本发明中所述质粒pANN5被以Notl和Nhel消化而质粒pMIBa146被以Notl消化。这些被以TBE缓冲液中1%琼脂糖凝胶电泳来纯化。来自pANN5约8.2kbp片段和来自pMIBa146的约6.2kbp片段被从凝胶上切下并根据制造商的说明使用
Figure BDA0001451815470001634
PCRPurification KiT(Qiagen)纯化。
以消化的pANN5和pMIBa144DNA来转化MIBa363,并根据制造商说明使用
Figure BDA0001451815470001635
Plant Direct PCR KiT(Finnzymes)或Kapa Robust DNA聚合酶来通过PCR来验证正确的基因座靶向和转化。为确认在pdc基因座的整合,使用了下列引物对。引物0613689和0611815产生约1.9kbp的条带;引物0612366和0611554产生约2.5kbp的条带;引物0613688和0611815产生约3.2kbp的条带;引物0611622和0611552产生约945bp的条带。为检查在adh1202基因座的整合,使用了下列引物对。引物0611245和0612794产生约2.8kbp的条带;引物0611815和0612795产生约3.9kbp的条带。给出在pdc基因座表达盒正确整合预期条带并在adh1202基因座保留表达盒的2个分离株被保存并命名为MIBa372和MIBa373。
从MIBa372去除ura标志物
如上所述分离MIBa372的ura-衍生体。使用引物0611815和0613688通过PCR筛选到来自MIBa372数个FOA抗性菌落的基因组DNA有所需环出事件。约2.1kbp条带的存在表示如需要地去除了ura标志而有ura3残留位点(在亲本菌株中两个URA3启动子间同源重组后留下的单个URA3启动子),而约3.3kbp条带表示完整URA3启动子-URA3ORF-URA3终止子-URA3启动子盒的存在,表明所需重组事件没有发生。也使用确认第一染色体修饰的引物0611815和0613689(扩增1.9kbp片段)和确认pdc基因座丢失的0611552和0611553(如果pdc基因座存在扩增850bp片段)来通过PCR筛选MIBa372的FOA抗性菌落。按照制造商的说明使用
Figure BDA0001451815470001642
Plant Direct PCR KiT(Finnzymes)进行PCR。以0611815和0613689产生约1.9kbp片段,但以0613688和0611815或者0611552和0611553不扩增片段的FOA抗性菌落被保存并命名为MIBa375。MIBa375的基因型显示于表28中。
表28:转化体的基因型
Figure BDA0001451815470001641
实施例3A-23:缺失了甘油3-磷酸脱氢酶(GPD)基因的酵母菌株。
菌株MIBa375中GPD基因的缺失
设计另外的构建体以缺失来自宿主东方伊萨酵母基因组的甘油3-磷酸脱氢酶基因(SEQ ID NO:117,其编码SEQ ID NO:118的GPD)的两个拷贝,这些构建体包含与GPD基因上游序列同源的约1003bp核苷酸序列,和与GPD基因下游序列同源的约852bp序列,有克隆在之间的TPDC-URA3标志盒(PDC终止子-URA3启动子-URA3基因-URA3终止子-URA3启动子)。
根据制造商的说明书使用Pfu DNA聚合酶从东方伊萨酵母CNB1基因组DNA扩增GPD的上游和下游区域。上游区域包含Apal位点;使用重叠引物通过PCR消除该位点,所述引物设计有对Apal识别序列中一个核苷酸的错配。引物对oACN48/oACN51以及oACN49/oACN50被用于扩增对上游区域的这两个重叠片段。这些PCR产物被在1%琼脂糖凝胶中分离并从中切下,并根据制造商的说明使用Qiaquick Gel Extraction KiT(Qiagen)纯化,并被用作以引物oACN48/oACN49(具有正向Apal/反向Notl位点)的第二轮PCR的模板。根据制造商的说明书使用PfuDNA聚合酶以引物oACN52/oACN53(具有正向Notl/反向Sacl位点)从东方伊萨酵母基因组DNA扩增下游区域。两个PCR产物被凝胶纯化并分别克隆进载体
Figure BDA0001451815470001651
(Invitrogen)。分离株通过质粒DNA的限制性消化被确认具有所需插入物,并通过测序验证。载体pACN58包含克隆的上游片段而pACN59包含下游片段。质粒pACN58被以Apal/Notl消化以释放上游侧翼,质粒pACN59被以Sacl/Notl消化以释放下游侧翼,而pACN59被以Apal/Sacl消化以提供载体骨架。这三个所需的片段被在1%琼脂糖凝胶中分离,切下和纯化,并在使用T4连接酶(New England Biolabs)的3-片段连接反应中连接。连接反应物被转化进大肠杆菌TOP10电感受态细胞,并通过质粒DNA的限制性消化来确认转化体。在该过程中,检测到下游区域中另外的Sacl位点,其产生853bp的下游区域(相对于1kbp)。有所需插入物的两个分离株被命名为pACN62和pACN63。
使用Notl消化从载体pJLJ8(图32)分离TPDC1-URA3盒并凝胶纯化。该片段随后被连接进已经被以Notl消化并去磷酸化的pACN62(如上),连接物被转化进大肠杆菌DH10B电感受态细胞(Invitrogen)。使用引物oACN48/oJLJ44和oACN48/oJLJ46通过PCR确认有URA3插入物的菌落。引物oJLJ44在URA3启动子下游末端退火并从TPDC1-URA3盒向外扩增。引物oJLJ46在PDC终止子5‘末端退火并从TPDC1-URA3盒向外扩增。载体pHJJ56包含面向下游GPD区域的URA3而pHJJ57包含面向上游GPD区域的URA3。
通过以Kpnl和Apal消化来将pHJJ56和pHJJ57线性化,而含有缺失盒的片段被通过凝胶提取纯化。线性化的pHJJ56被转化进ura-菌株MIBa375。单菌落被再划线以纯化,并使用引物oJLJ44,oJLJ46,oACN54和oACN55通过PCR测试所需的GPD缺失。在40μL Y-裂解缓冲液和2μL Zymolyase(ZymoResearch)中37℃裂解细胞30分钟,而1μL裂解反应物被用于25μLPCR反应。根据制造商的说明书PCR反应使用Failsafe DNA聚合酶和Buffer E,有55℃的退火温度和下列循环过程:94℃ 2分钟的1个循环;每个94℃ 30秒,55℃ 30秒,和72℃ 1.5分钟的29个循环;以及72℃ 3分钟的1个循环。有一个GPD拷贝敲除的菌株产生约0.9和1.2kbp的条带并被命名为yHJN1和yHJN2。
菌株yHJN1和yHJN2在YPD培养基中培养过夜并被置于ScD-2X FOA培养基上以选择URA3标志的缺失。单菌落被在YPD上纯化并贴到ScD-ura和YPD培养基上以确认ura-表型。使用与用来确认第一整合的PCR反应相同的反应来确认Ura-菌落已经保留了敲除。yHJN1的ura-衍生体被命名为yHJN3而yHJN2的ura-衍生体被命名为yHJN4。
线性化的pHJJ57被转化进yHJN3和yHJN4,而单菌落被在ScD-ura培养基上纯化。在一个反应中使用引物oJLJ44,oACN54和oACN55,在第二反应中使用引物oJLJ46,oACN54和oACN55通过PCR确认两个GPD拷贝敲除的存在。引物oACN54在GPD上游侧翼序列上游约37bp区域上退火,而oACN55退火至下游侧翼下游约24bp区域。如果两个GPD拷贝被缺失则前面的反应产生约900和1050bp的条带,而后面的反应产生约1025和1200bp的条带。在ScD-ura平板上,有两个GPD拷贝敲除的菌落比有单个拷贝缺失的那些生长更慢。有两个GPD基因拷贝缺失的菌株被命名为yHJN7(源自yHJN3)和yHJN8(源自yHJN4)。
使用本发明中描述的方法,在生物反应器中测试菌株MIBa372,yHJN7和yHJN8的甘油生产。菌株MIBa372在48小时中产生29.5g/L甘油。发酵期间菌株yHJN7或yHJN8没有产生可检测的甘油。最终发酵液中甘油的缺失可以为从发酵液中回收和纯化3-HP提供优势。
实施例3A-24:在adh1202基因座从四个核苷酸序列表达天冬氨酸1-脱羧酶(ADC), 在adh9091基因座表达3-HP脱氢酶(3-HPDH)并缺失了天然3-HP脱氢酶(3-HPDH)的酵母菌株
在adh9091基因座整合东方伊萨酵母3-HPDH的质粒构建
使用引物0611954和0611957(对3-HPDH)或0611997和0611998(PYD4)从如前所述制备的MBin500东方伊萨酵母基因组DNA扩增编码SEQ ID NO:26的东方伊萨酵母3-HPDH的SEQ ID NO:25以及编码SEQ ID NO:20的东方伊萨酵母BAAT(PYD4)的SEQ ID NO:19核苷酸序列。扩增期间引物0611954向3-HPDH 5’末端加入kozak序列(TAAA)和Nhel位点,而引物0611957向3-HPDH 3’端加入Pacl位点。扩增期间引物0611997向PYD45’末端加入kozak序列(TAAA)和Pacl位点,而引物0611998向PYD4的3’端加入Pacl位点。每种引物50pmol被用于含50ng作为模板的MBin500基因组DNA,dATP、dGTP、dCTP和dTTP每种0.2mM,1X Expand HighFidelity Buffer(Roche),2.6单位Expand High Fidelity DNA聚合酶(Roche)的终体积50μL的PCR反应中。在
Figure BDA0001451815470001661
(Eppendorf Scientific)中进行扩增反应,程序为95℃ 3分钟的1个循环;随后每个为95℃ 1分钟,55℃ 1分钟和72℃1分钟(3-HPDH PCR)或2分钟(PYD4PCR)的30个循环,及72℃ 5分钟的最终延伸。热循环后,PCR反应产物被以TAE缓冲液中1.0%的琼脂糖凝胶电泳分离,其中约831bp的3-HPDH或1.4kbp的PYD4 PCR产物被从凝胶上切下并根据制造商的说明使用
Figure BDA0001451815470001671
GelExtraction KiT(Qiagen)纯化。5μL纯化的3-HPDH或PYD4被根据制造商的说明使用TOPO-TACloning Kit克隆进pCR2.1(Invitrogen)。转化物被涂布于2X YT+amp平板上并在37℃下孵育过夜。通过EcoRI消化筛选到数个所得转化体。产生所需插入大小的克隆被通过DNA测序来确认正确。一个含3-HPDH的克隆被命名为pMBin190,而另一个含PYD4的被命名为pMBin193。
质粒pMBin193被以Xbal和Pacl消化并在TAE缓冲液中1.0%的琼脂糖凝胶上跑电泳,其中约1.4kbp PYD4条带被从凝胶上切下并根据制造商的说明使用
Figure BDA0001451815470001672
GelExtraction KiT(Qiagen)纯化。消化的PYD4片段被使用T4DNA连接酶连接进Xbal和Pacl限制性消化的线性pMIBa107质粒(如上)。连接产物被根据制造商的说明转化进One
Figure BDA0001451815470001673
TOP10化学感受态大肠杆菌细胞(Invitrogen)。转化体被涂布于2X YT+amp平板上并在37℃下孵育过夜。通过SnaBI或EcoRI消化筛选到数个的所得转化体。产生产生所需条带大小的一个克隆被命名为pMBin203。质粒pMBin203含在下列表达盒侧翼的Notl位点:PYD4CDS上游或下游的PDC启动子和终止子,URA3启动子,URA3ORF,和随后有URA3启动子的URA3终止子。
质粒pMBin203被以Notl消化并在TAE缓冲液中1.0%的琼脂糖凝胶上分离,其中约4.1kbp的片段(含PDC启动子,PYD4CDS,PDC终止子,和URA3标志选择标志物)被从凝胶上切下并根据制造商的说明使用
Figure BDA0001451815470001674
Gel Extraction KiT(Qiagen)纯化。质粒pHJJ27(含与adh9091基因座同源的5’和3’区域;见图21)被以Notl消化,如上所述以CIP处理并在TAE缓冲液中1%琼脂糖凝胶上分离,其中约5.7kbp的线性质粒被纯化。如上所述来自pMBin203的片段随后被使用T4DNA连接酶连接进Notl限制性消化的pHJJ27。连接产物被根据制造商的说明转化进One
Figure BDA0001451815470001675
TOP10化学感受态大肠杆菌细胞(Invitrogen)。转化体被涂布于2X YT+amp平板上并在37℃下孵育过夜。通过Pstl消化筛选到数个所得转化体。产生产生所需条带大小的一个克隆被命名为pMBin204。质粒pMBin204允许PYD4靶向到adh9091基因座。
如本发明中所述,通过Nhel和Pacl消化编码SEQ ID NO:26的东方伊萨酵母3-HPDH的SEQ ID NO:25核苷酸序列被从质粒pMBin190(如上)去除,并通过TBE缓冲液中琼脂糖凝胶电泳纯化。约827bp的条带被从凝胶上切下并根据制造商的说明使用
Figure BDA0001451815470001683
Extract II KiT(Macherey-Nagel)纯化。质粒pMBin204(如上)被以Xbal和Pacl消化并如本发明中所述通过TBE缓冲液中琼脂糖凝胶电泳纯化。约8.4kbp的条带被从凝胶上切下并根据制造商的说明使用
Figure BDA0001451815470001684
Extract II KiT(Macherey-Nagel)纯化。
使用T4连接酶(New England Biolabs)在20μL总反应体积中将上面纯化的约827bp东方伊萨酵母3-HPDH基因产物连接进8.4kbp的pMBin204线性化载体,20μL总反应体积由1μL8.4kbp载体,10μL827bp插入物,有10mM ATP的2μL10X连接缓冲液(New EnglandBiolabs)和1μL T4连接酶(New England Biolabs)构成。反应物在16℃孵育18小时,10μL等份的反应物被根据制造商的说明转化进One Shot TOP10细胞(Invitrogen)。在恢复期后,来自转化反应的两份100μL等份被涂布于添加有每mL 100μg氨苄青霉素的150mm 2X YT平板上。平板在37℃孵育过夜。从选择平板上选出推定的重组克隆并使用
Figure BDA0001451815470001685
9600(Qiagen)从每一个制备质粒DNA。克隆通过限制性消化来分析,有正确限制性消化方式的质粒被命名为pMcTs90。
在adh9091基因座整合酿酒酵母3-HPDH的质粒构建
编码SEQ ID NO:129的酿酒酵母3-HPDH的826bp野生型核苷酸序列被从JGI69基因组DNA PCR扩增,并在基因5’端加上Xbal位点和在基因3’端加上Pacl位点。扩增反应按照制造商的说明使用
Figure BDA0001451815470001686
Pfx DNA聚合酶(Invitrogen)进行。Master PCR反应含1.125μL酿酒酵母基因组DNA,引物611191和611199每种112.5pM,1X Pfx扩增缓冲液(Invitrogen),2mmMgSO4,0.2mM dNTP混合物,5个单位的
Figure BDA0001451815470001682
Pfx DNA聚合酶(Invitrogen),终体积200μL。混合物被等分到8个管中并进行梯度PCR。扩增反应物在
Figure BDA0001451815470001681
(Eppendorf Scientific Inc.)中孵育,程序为95℃ 2分钟的1个循环;每个为95℃ 30秒,40-55℃梯度30秒,和72℃ 2分钟的30个循环;和72℃ 3分钟的1个循环。
如本发明所述826bp野生型YMR226c PCR基因产物被通过TBE缓冲液中1%的琼脂糖凝胶电泳纯化。约826bp片段被从凝胶上切下并使用
Figure BDA0001451815470001687
Gel ExtractionKiT(Qiagen)从凝胶中提取。PCR产物被以Xbal和Pacl在37℃消化过夜并随后使用
Figure BDA0001451815470001691
PCR Purification KiT(Qiagen)纯化。
质粒pMIBa100(如上)被以Xbal和Pacl消化随后以CIP处理,得到约6.8kbp的线性片段。消化物按照制造商的说明使用
Figure BDA0001451815470001692
PCR Purification KiT(Qiagen)纯化。
使用T4连接酶(New England Biolabs)在10μL总反应体积中将826bp YMR226c纯化并消化的PCR片段连接进6.8kbp pMIBa100线性化载体,10μL总反应体积由1μL来自pMIBa100的6.7kbp片段,1或7μL 826bp YMR226c PCR产物,1μL有10mM ATP的10X连接缓冲液(New England Biolabs),和1μL T4连接酶(New England Biolabs)构成。反应物在16℃下孵育约4小时,而整个反应物被根据制造商的说明转化进Sure化学感受态细胞(Agilent)。转化体被涂布于2X YT+amp平板上并在37℃下孵育过夜。通过使用Xbal和Pacl的限制性消化筛选到数个有合适插入的所得转化体。产生正确消化条带大小和DNA序列的克隆被命名为pMIBa101。
质粒pHJJ76-no ura(如上)被以Notl消化随后以CIP处理。线性5.2kbp片段使用
Figure BDA0001451815470001693
PCR Purification KiT(Qiagen)纯化。
YMR226c表达盒通过以Notl消化被从pMIBa101上切下。约3546bp的条带被从凝胶上切下并按照制造商的说明使用
Figure BDA0001451815470001694
PCR Purification KiT(Qiagen)纯化。
使用T4连接酶(New England Biolabs)在10μL总反应体积中将来自pMIBa101的3546bp纯化片段连接进5.2kbp pHJJ76-no ura线性化载体,10μL总反应体积由1μL来自pHJJ76-no ura的5.2kbp片段,1或5μL来自pMIBa101的3546bp片段,1μL有10mM ATP的10X连接缓冲液(New England Biolabs),和1μL T4连接酶(New England Biolabs)构成。反应物在16℃下孵育过夜,而约4μL等份的反应物被根据制造商的说明转化进ONE
Figure BDA0001451815470001695
TOP10化学感受态大肠杆菌细胞(Invitrogen)。转化体被涂布于2X YT+amp平板上并在37℃下孵育过夜。通过使用Xbal和Knpl的限制性消化筛选到数个有合适插入的所得转化体。产生正确消化条带大小的克隆被命名为pMIBa109。
编码SEQ ID NO:129的酿酒酵母3-HPDH的野生型核苷酸序列被通过Xbal和Pacl消化被从质粒pMIBa109中去除,并如本发明所述在TBE缓冲液中通过琼脂糖凝胶电泳纯化。约818bp的条带被从凝胶上切下并根据制造商的说明使用
Figure BDA0001451815470001701
Extract II KiT(Macherey-Nagel)纯化。
使用T4连接酶(New England Biolabs)在20μL总反应体积中将纯化的约818bp酿酒酵母3-HPDH基因产物连接进上面8.4kbp的pMBin204线性化载体,20μL总反应体积由1μL8.4kbp载体,10μL 818bp插入物,2μL有10mM ATP的10X连接缓冲液(New England Biolabs)和1μL T4连接酶(New England Biolabs)构成成。反应物在16℃孵育18小时,10μL等份的反应物被根据制造商的说明转化进One Shot TOP10细胞(Invitrogen)。在恢复期后,来自转化反应的两份100μL等份被涂布于添加有每mL 100μg氨苄青霉素的150mm 2X YT平板上。平板在37℃孵育过夜。从选择平板上选出推定的重组克隆并使用
Figure BDA0001451815470001702
9600(Qiagen)从每一个制备质粒DNA。克隆通过限制性消化来分析,有正确限制性消化方式的质粒被命名为pMcTs91。
在adh9091基因座整合M.sedula 3-HPDH的质粒构建
编码SEQ ID NO:29的M.sedula 3-HPDH的SEQ ID NO:343东方伊萨酵母密码子优化核苷酸序列由
Figure BDA0001451815470001703
合成,得到质粒11AAE2AP。合成的基因被以Xbal和Pacl从质粒中消化出来并如本发明所述通过TBE缓冲液中的琼脂糖凝胶电泳纯化。约959bp的条带被从凝胶上切下并根据制造商的说明使用
Figure BDA0001451815470001704
Extract II KiT(Macherey-Nagel)纯化。
使用T4连接酶(New England Biolabs)在20μL总反应体积中将纯化的约956bpM.sedula 3-HPDH基因产物连接进上面8.4kbp的pMBin204线性化载体,20μL总反应体积由1μL 8.4kbp载体,16μL 956bp插入物,2μL有10mM ATP的10X连接缓冲液(New EnglandBiolabs)和1μL T4连接酶(New England Biolabs)构成。反应物在室温下孵育1小时,10μL等份的反应物被根据制造商的说明转化进Solo Pack Gold Super Competent Cells(Invitrogen)。在恢复期后,来自转化反应的两份100μL等份被涂布于添加有每mL 100μg氨苄青霉素的150mm 2X YT平板上。平板在37℃孵育过夜。从选择平板上选出推定的重组克隆并使用
Figure BDA0001451815470001705
9600(Qiagen)从每一个制备质粒DNA。克隆通过限制性消化来分析,有正确限制性消化方式的质粒被命名为pMcTs76。
在adh9091基因座整合大肠杆菌3-HPDH的质粒构建
编码SEQ ID NO:27的大肠杆菌3-HPDH的SEQ ID NO:143东方伊萨酵母密码子优化核苷酸序列由
Figure BDA0001451815470001706
合成,得到质粒1045168。合成的基因被以Xbal和Pacl从质粒中消化出来并如本发明所述通过TBE中的琼脂糖凝胶电泳纯化。约761bp的条带被从凝胶上切下并根据制造商的说明使用
Figure BDA0001451815470001711
Extract II KiT(Macherey-Nagel)纯化。
使用T4连接酶(New England Biolabs)在20μL总反应体积中将纯化的约761bp大肠杆菌3-HPDH基因产物连接进上面8.4kbp的pMBin204线性化载体,20μL总反应体积由1μL8.4kbp载体,16μL 761bp插入物,2μL有10mM ATP的10X连接缓冲液(New England Biolabs)和1μL T4连接酶(New England Biolabs)组成。反应物在室温下孵育1小时,10μL等份的反应物被根据制造商的说明转化进Solo Pack Gold Super Competent Cells(InvitrogenAgilent)。在恢复期后,来自转化反应的两份100μL等份被涂布于添加有每mL100μg氨苄青霉素的150mm 2X YT平板上。平板在37℃孵育过夜。从选择平板上选出推定的重组克隆并使用
Figure BDA0001451815470001712
9600(Qiagen)从每一个制备质粒DNA。克隆通过限制性消化来分析,有正确限制性消化方式的质粒被命名为pMcTs77。
在McTs259中在adh9091整合3-HPDH片段
如本发明中所述质粒pMcTs76、pMcTs77、pMcTs91被以Kpnl和Apal消化,而质粒pMcTs90被以Sacl和Apal消化。得到的消化产物被通过TBE缓冲液中1%琼脂糖凝胶电泳纯化,而来自pMcTs76的5.5kbp片段,来自pMcTs77的5.3kbp片段,来自pMcTs90的5.4kbp片段和来自pMcTs91的5.4kbp片段被从凝胶上切下并根据制造商的说明使用
Figure BDA0001451815470001713
Extract II KiT(Macherey-Nagel)纯化。
在adh1202基因座表达编码SEQ ID NO:139的地衣芽孢杆菌ADC的四个核苷酸拷贝并缺失了编码SEQ ID NO:26的3-HPDH(如上)的天然东方伊萨酵母基因的菌株McTs259,被以消化的pMcTs76、pMcTs77、pMcTs90或pMcTs91DNA转化。按照制造商的说明使用
Figure BDA0001451815470001714
Plant Direct PCR KiT(Finnzymes)来通过PCR来验证正确的基因座靶向和转化。为确认在adh9091基因座的整合,使用下列引物对。引物0614627和0612909对来自pMcTs76的整合片段产生约3.47kbp条带,对来自pMcTs77的整合片段产生约3.27kbp条带,对来自pMcTs90的整合片段产生约3.34kbp条带,对来自pMcTs91的整合片段产生约3.33kbp条带;引物0612908和0614626产生约1.97kbp条带。为检查在adh1202的整合,使用了下列引物对。引物0611245和0612794产生约3.0kbp条带而引物0611815和0612795产生约3.6kbp的条带。为检查天然东方伊萨酵母3-HPDH基因的缺失,使用了下列引物。引物0613034和0613241产生约1.4kbp条带。如表29中所示,给出在adh9091基因座表达盒正确整合预期条带,在adh1202基因座保留表达盒并保留东方伊萨酵母3-HPDH位点缺失的分离株被保存并命名为McTs261(pMcTs76片段),McTs263(pMcTs77片段),McTs267(pMcTs90片段)和McTs269(pMcTs91片段)。
表29:转化体构建
Figure BDA0001451815470001721
使用上述摇瓶方法测试转化菌株的3-HP产生。杂合转化体McTs267、McTs269和McTs263分别产生0.149(+/-0.024),0.168(+/-0.052),0.162(+/-0.018)g/L 3-HP每g/L干细胞重。天然菌株MeJi412产生0.263(+/-0.026)g/L3-HP每g/L干细胞重,而3-HPDH缺失菌株不产生可检测的3-HP。本试验中杂合转化体McTs261不产生可检测的3-HP。这些结果显示使用外源或内源3-HPDH基因序列,甚至杂合的3-HPDH转化体也可以恢复一些3-HPDH缺失菌株的3-HPDH活性。
实施例3B:表达苹果酸途径基因的修饰的酵母菌株
通过利用PEP、OAA和苹果酸中间体的途径来产生3-HP的酵母细胞被工程改造以表达一个或多个涉及该途径中的酶。表达的基因可以包括一个或多个PPC,苹果酸脱氢酶和苹果酸脱羧酶基因。表达的基因可以源自对宿主细胞是天然的基因,或者其可以源自对宿主细胞非天然的来源基因。
实施例3C:表达丙二酸半醛途径基因的修饰的酵母菌株
通过利用PEP、OAA和丙二酸半醛中间体的途径来产生3-HP的酵母细胞被工程改造以表达一个或多个涉及该途径中的酶。表达的基因可包括一个或多个PPC,2-酮酸脱羧酶,KGD,BCKA,吲哚丙酮酸脱羧酶,3-HPDH(包括丙二酸半醛还原酶),HIBADH和4-羟基丁酸脱氢酶基因。表达的基因可源自对宿主细胞是天然的基因,或者其可源自对宿主细胞非天然的来源基因。
实施例3D:表达丙二酰CoA途径基因的修饰的酵母菌株
通过利用PEP、OAA,丙二酰CoA,和可选的,丙二酸半醛中间体的途径来产生3-HP的酵母细胞被工程改造以表达一个或多个涉及该途径中的酶。表达的基因可以包括一个或多个PPC,OAA甲酸裂解酶,丙二酰CoA还原酶,CoA酰化丙二酸半醛脱氢酶,3-HPDH(包括丙二酸半醛还原酶),HIBADH和4-羟基丁酸脱氢酶基因。表达的基因可以源自对宿主细胞是天然的基因,或者其可以源自对宿主细胞非天然的来源基因。
实施例3E:表达丙二酰CoA途径基因的修饰的酵母菌株
通过利用丙酮酸,乙酰CoA,丙二酰CoA,和可选的,丙二酸半醛中间体的途径来产生3-HP的酵母细胞被工程改造以表达一个或多个涉及该途径中的酶。表达的基因可以包括一个或多个PDH,乙酰CoA羧化酶,丙二酰CoA还原酶,CoA酰化丙二酸半醛脱氢酶,3-HPDH(包括丙二酸半醛还原酶),HIBADH和4-羟基丁酸脱氢酶基因。表达的基因可以源自对宿主细胞是天然的基因,或者其可以源自对宿主细胞非天然的来源基因。
实施例3F:表达丙氨酸途径基因的修饰的酵母菌株
通过利用丙酮酸,丙氨酸,β-丙氨酸,和可选的,丙二酸半醛,β-丙氨酰CoA,丙烯酰CoA以及3-HP-CoA中间体的途径来产生3-HP的酵母细胞被工程改造以表达一个或多个涉及该途径中的酶。表达的基因可以包括一个或多个丙氨酸脱氢酶,丙酮酸/丙氨酸氨基转移酶,丙氨酸2,3氨基变位酶,CoA转移酶,CoA合成酶,β-丙氨酰CoA氨解酶,3-HP-CoA脱水酶,3-HP-CoA水解酶,3-羟异丁酰CoA水解酶,BAAT,3-HPDH(包括丙二酸半醛还原酶),HIBADH和4-羟基丁酸脱氢酶基因。表达的基因可以源自对宿主细胞是天然的基因,或者其可以源自对宿主细胞非天然的来源基因。
实施例3G:表达乳酸途径基因的修饰的酵母菌株
通过利用丙酮酸,乳酸,乳酰CoA,丙烯酰CoA和3-HP-CoA中间体的途径来产生3-HP的酵母细胞被工程改造以表达一个或多个涉及该途径中的酶。表达的基因可以包括一个或多个LDH,CoA转移酶,CoA合成酶,乳酰CoA脱水酶,3-HP-CoA脱水酶,3-HP-CoA水解酶和3-羟异丁酰CoA水解酶基因。表达的基因可以源自对宿主细胞是天然的基因,或者其可以源自对宿主细胞非天然的来源基因。
实施例3H:表达甘油途径基因的修饰的酵母菌株
通过利用甘油和3-HPA中间体的途径来产生3-HP的酵母细胞被工程改造以表达一个或多个涉及该途径中的酶。表达的基因可以包括一个或多个甘油脱水酶和醛脱氢酶基因。表达的基因可以源自对宿主细胞是天然的基因,或者其可以源自对宿主细胞非天然的来源基因。
实施例3I:表达β-丙氨酰CoA途径基因的修饰的酵母菌株
通过利用PEP或丙酮酸,β-丙氨酸,β-丙氨酰CoA,丙烯酰CoA,3-HP-CoA和可选的OAA,天冬氨酸和丙氨酸中间体的途径来产生3-HP的酵母细胞被工程改造以表达一个或多个涉及该途径中的酶。表达的基因可以包括一个或多个PPC,PYC,AAT,ADC,CoA转移酶,CoA合成酶,β-丙氨酰CoA氨解酶,3-HP-CoA脱水酶,3-HP-CoA水解酶,3-羟异丁酰CoA水解酶,丙氨酸脱氢酶,丙酮酸/丙氨酸氨基转移酶和AAM基因。表达的基因可以源自对宿主细胞是天然的基因,或者其可以源自对宿主细胞非天然的来源基因。
在某些方面中,本发明使用的酵母细胞或方法可由下面编号的段落描述:
[B1]包含活性3-HP发酵途径的经遗传修饰的酵母细胞,其中细胞包含选自:
外源PPC基因;
外源PYC基因;
外源AAT基因;
外源ADC基因;
外源BAAT或gabT基因;和
外源3-HPDH基因
的一种或多种外源3-HP途径基因。
[B2]段落B1的经遗传修饰的酵母细胞,其包含外源AAT基因。
[B3]段落B1或B2的经遗传修饰的酵母细胞,其包含外源PYC基因。
[B4]段落B1-B3任一项的经遗传修饰的酵母细胞,其包含外源ADC基因。
[B5]段落B1-B4任一项的经遗传修饰的酵母细胞,其包含外源BAAT或gabT基因。
[B6]段落B1-B5任一项的经遗传修饰的酵母细胞,其包含外源3-HPDH基因。
[B7]段落B1的经遗传修饰的酵母细胞,其包含:
外源PYC基因;
外源AAT基因;
外源ADC基因;
外源BAAT或gabT基因;和
外源3-HPDH基因。
[B8]段落B1-B7任一项的经遗传修饰的酵母细胞,其包含外源PPC基因。
[B9]段落B1-B7任一项的经遗传修饰的酵母细胞,其中外源PYC基因编码与选自SEQ ID NO:2、3、4、5、6、7和8的氨基酸序列具有至少60%,如至少65%、70%、75%、80%、85%、90%、95%、97%、98%、99%或100%序列同一性的多肽。
[B10]段落B9的经遗传修饰的酵母细胞,其中外源PYC基因编码与选自SEQ ID NO:2的氨基酸序列具有至少60%,如至少65%、70%、75%、80%、85%、90%、95%、97%、98%、99%或100%序列同一性的多肽。
[B11]段落B9的经遗传修饰的酵母细胞,其中外源PYC基因编码与SEQ ID NO:3的氨基酸序列具有至少60%,如至少65%、70%、75%、80%、85%、90%、95%、97%、98%、99%或100%序列同一性的多肽。
[B12]段落B9的经遗传修饰的酵母细胞,其中外源PYC基因编码与SEQ ID NO:4的氨基酸序列具有至少60%,如至少65%、70%、75%、80%、85%、90%、95%、97%、98%、99%或100%序列同一性的多肽。
[B13]段落B9的经遗传修饰的酵母细胞,其中外源PYC基因编码与SEQ ID NO:5的氨基酸序列具有至少60%,如至少65%、70%、75%、80%、85%、90%、95%、97%、98%、99%或100%序列同一性的多肽。
[B14]段落B9的经遗传修饰的酵母细胞,其中外源PYC基因编码与SEQ ID NO:6的氨基酸序列具有至少60%,如至少65%、70%、75%、80%、85%、90%、95%、97%、98%、99%或100%序列同一性的多肽。
[B15]段落B9的经遗传修饰的酵母细胞,其中外源PYC基因编码与SEQ ID NO:7的氨基酸序列具有至少60%,如至少65%、70%、75%、80%、85%、90%、95%、97%、98%、99%或100%序列同一性的多肽。
[B16]段落B9的经遗传修饰的酵母细胞,其中外源PYC基因编码与SEQ ID NO:8的氨基酸序列具有至少60%,如至少65%、70%、75%、80%、85%、90%、95%、97%、98%、99%或100%序列同一性的多肽。
[B17]段落B1-B16任一项的经遗传修饰的酵母细胞,其中外源PYC基因包含与SEQID NO:1的核苷酸序列具有至少60%,如至少65%、70%、75%、80%、85%、90%、95%、97%、98%、99%或100%序列同一性的核苷酸序列。
[B18]段落B1-B17任一项的经遗传修饰的酵母细胞,其中AAT基因编码与选自SEQID NO:14、15和16的氨基酸序列具有至少60%,如至少65%、70%、75%、80%、85%、90%、95%、97%、98%、99%或100%序列同一性的多肽。
[B19]段落B18的经遗传修饰的酵母细胞,其中AAT基因编码与SEQ ID NO:14的氨基酸序列具有至少60%,如至少65%、70%、75%、80%、85%、90%、95%、97%、98%、99%或100%序列同一性的多肽。
[B20]段落B18的经遗传修饰的酵母细胞,其中AAT基因编码与SEQ ID NO:15的氨基酸序列具有至少60%,如至少65%、70%、75%、80%、85%、90%、95%、97%、98%、99%或100%序列同一性的多肽。
[B21]段落B18的经遗传修饰的酵母细胞,其中AAT基因编码与SEQ ID NO:16的氨基酸序列具有至少60%,如至少65%、70%、75%、80%、85%、90%、95%、97%、98%、99%或100%序列同一性的多肽。
[B22]段落B1-B21任一项的经遗传修饰的酵母细胞,其中AAT基因包含与SEQ IDNO:13的核苷酸序列具有至少60%,如至少65%、70%、75%、80%、85%、90%、95%、97%、98%、99%或100%序列同一性的核苷酸序列。
[B23]段落B1-B22任一项的经遗传修饰的酵母细胞,其中ADC基因编码与选自SEQID NO:17、18、133、135、137和139的氨基酸序列具有至少60%,如至少65%、70%、75%、80%、85%、90%、95%、97%、98%、99%或100%序列同一性的多肽。
[B24]段落B23的经遗传修饰的酵母细胞,其中ADC基因编码与SEQ ID NO:17的氨基酸序列具有至少60%,如至少65%、70%、75%、80%、85%、90%、95%、97%、98%、99%或100%序列同一性的多肽。
[B25]段落B23的经遗传修饰的酵母细胞,其中ADC基因编码与SEQ ID NO:18的氨基酸序列具有至少60%,如至少65%、70%、75%、80%、85%、90%、95%、97%、98%、99%或100%序列同一性的多肽。
[B26]段落B23的经遗传修饰的酵母细胞,其中ADC基因编码与SEQ ID NO:133的氨基酸序列具有至少60%,如至少65%、70%、75%、80%、85%、90%、95%、97%、98%、99%或100%序列同一性的多肽。
[B27]段落B23的经遗传修饰的酵母细胞,其中ADC基因编码与SEQ ID NO:135的氨基酸序列具有至少60%,如至少65%、70%、75%、80%、85%、90%、95%、97%、98%、99%或100%序列同一性的多肽。
[B28]段落B23的经遗传修饰的酵母细胞,其中ADC基因编码与SEQ ID NO:137的氨基酸序列具有至少60%,如至少65%、70%、75%、80%、85%、90%、95%、97%、98%、99%或100%序列同一性的多肽。
[B29]段落B23的经遗传修饰的酵母细胞,其中ADC基因编码与SEQ ID NO:139的氨基酸序列具有至少60%,如至少65%、70%、75%、80%、85%、90%、95%、97%、98%、99%或100%序列同一性的多肽。
[B30]段落B1-B29任一项的经遗传修饰的酵母细胞,其中ADC基因包含与选自SEQID NO:130、131、132、134、136和138的核苷酸序列具有至少60%,如至少65%、70%、75%、80%、85%、90%、95%、97%、98%、99%或100%序列同一性的核苷酸序列。
[B31]段落B30的经遗传修饰的酵母细胞,其中ADC基因包含与SEQ ID NO:130的核苷酸序列具有至少60%,如至少65%、70%、75%、80%、85%、90%、95%、97%、98%、99%或100%序列同一性的核苷酸序列。
[B32]段落B30的经遗传修饰的酵母细胞,其中ADC基因包含与SEQ ID NO:131的核苷酸序列具有至少60%,如至少65%、70%、75%、80%、85%、90%、95%、97%、98%、99%或100%序列同一性的核苷酸序列。
[B33]段落B30的经遗传修饰的酵母细胞,其中ADC基因包含与SEQ ID NO:132的核苷酸序列具有至少60%,如至少65%、70%、75%、80%、85%、90%、95%、97%、98%、99%或100%序列同一性的核苷酸序列。
[B34]段落B30的经遗传修饰的酵母细胞,其中ADC基因包含与SEQ ID NO:134的核苷酸序列具有至少60%,如至少65%、70%、75%、80%、85%、90%、95%、97%、98%、99%或100%序列同一性的核苷酸序列。
[B35]段落B30的经遗传修饰的酵母细胞,其中ADC基因包含与SEQ ID NO:136的核苷酸序列具有至少60%,如至少65%、70%、75%、80%、85%、90%、95%、97%、98%、99%或100%序列同一性的核苷酸序列。
[B36]段落B30的经遗传修饰的酵母细胞,其中ADC基因包含与SEQ ID NO:138的核苷酸序列具有至少60%,如至少65%、70%、75%、80%、85%、90%、95%、97%、98%、99%或100%序列同一性的核苷酸序列。
[B37]段落B1-B36任一项的经遗传修饰的酵母细胞,其中外源BAAT或gabT基因编码与选自SEQ ID NO:20、21、22、23和24的氨基酸序列具有至少60%,如至少65%、70%、75%、80%、85%、90%、95%、97%、98%、99%或100%序列同一性的多肽。
[B38]段落B37的经遗传修饰的酵母细胞,其中外源BAAT或gabT基因编码与SEQ IDNO:20的氨基酸序列具有至少60%,如至少65%、70%、75%、80%、85%、90%、95%、97%、98%、99%或100%序列同一性的多肽。
[B39]段落B37的经遗传修饰的酵母细胞,其中外源BAAT或gabT基因编码与SEQ IDNO:21的氨基酸序列具有至少60%,如至少65%、70%、75%、80%、85%、90%、95%、97%、98%、99%或100%序列同一性的多肽。
[B40]段落B37的经遗传修饰的酵母细胞,其中外源BAAT或gabT基因编码与SEQ IDNO:22的氨基酸序列具有至少60%,如至少65%、70%、75%、80%、85%、90%、95%、97%、98%、99%或100%序列同一性的多肽。
[B41]段落B37的经遗传修饰的酵母细胞,其中外源BAAT或gabT基因编码与SEQ IDNO:23的氨基酸序列具有至少60%,如至少65%、70%、75%、80%、85%、90%、95%、97%、98%、99%或100%序列同一性的多肽。
[B42]段落B37的经遗传修饰的酵母细胞,其中外源BAAT或gabT基因编码与SEQ IDNO:24的氨基酸序列具有至少60%,如至少65%、70%、75%、80%、85%、90%、95%、97%、98%、99%或100%序列同一性的多肽。
[B43]段落B1-B42任一项的经遗传修饰的酵母细胞,其中BAAT或gabT基因包含与选自SEQ ID NO:19、140、141和142的核苷酸序列具有至少60%,如至少65%、70%、75%、80%、85%、90%、95%、97%、98%、99%或100%序列同一性的核苷酸序列。
[B44]段落B43的经遗传修饰的酵母细胞,其中BAAT基因或gabT基因包含与SEQ IDNO:19的核苷酸序列具有至少60%,如至少65%、70%、75%、80%、85%、90%、95%、97%、98%、99%或100%序列同一性的核苷酸序列。
[B45]段落B43的经遗传修饰的酵母细胞,其中BAAT基因或gabT基因包含与SEQ IDNO:140的核苷酸序列具有至少60%,如至少65%、70%、75%、80%、85%、90%、95%、97%、98%、99%或100%序列同一性的核苷酸序列。
[B46]段落B43的经遗传修饰的酵母细胞,其中BAAT基因或gabT基因包含与SEQ IDNO:141的核苷酸序列具有至少60%,如至少65%、70%、75%、80%、85%、90%、95%、97%、98%、99%或100%序列同一性的核苷酸序列。
[B47]段落B43的经遗传修饰的酵母细胞,其中BAAT基因或gabT基因包含与SEQ IDNO:142的核苷酸序列具有至少60%,如至少65%、70%、75%、80%、85%、90%、95%、97%、98%、99%或100%序列同一性的核苷酸序列。
[B48]段落B1-B47任一项的经遗传修饰的酵母细胞,其中所述外源BAAT基因或外源gabT为也是gabT基因的BAAT基因。
[B49]段落B1-B48任一项的经遗传修饰的酵母细胞,其中3-HPDH基因编码与选自由SEQ ID NO:26、27、28、29、30、31、32、33、34和129组成的组的氨基酸序列具有至少60%,如至少65%、70%、75%、80%、85%、90%、95%、97%、98%、99%或100%序列同一性的多肽。
[B50]段落B49的经遗传修饰的酵母细胞,其中3-HPDH基因编码与SEQ ID NO:26的氨基酸序列具有至少60%,如至少65%、70%、75%、80%、85%、90%、95%、97%、98%、99%或100%序列同一性的多肽。
[B51]段落B49的经遗传修饰的酵母细胞,其中3-HPDH基因编码与SEQ ID NO:27的氨基酸序列具有至少60%,如至少65%、70%、75%、80%、85%、90%、95%、97%、98%、99%或100%序列同一性的多肽。
[B52]段落B49的经遗传修饰的酵母细胞,其中3-HPDH基因编码与SEQ ID NO:28的氨基酸序列具有至少60%,如至少65%、70%、75%、80%、85%、90%、95%、97%、98%、99%或100%序列同一性的多肽。
[B53]段落B49的经遗传修饰的酵母细胞,其中3-HPDH基因编码与SEQ ID NO:29的氨基酸序列具有至少60%,如至少65%、70%、75%、80%、85%、90%、95%、97%、98%、99%或100%序列同一性的多肽。
[B54]段落B49的经遗传修饰的酵母细胞,其中3-HPDH基因编码与SEQ ID NO:30的氨基酸序列具有至少60%,如至少65%、70%、75%、80%、85%、90%、95%、97%、98%、99%或100%序列同一性的多肽。
[B55]段落的B49经遗传修饰的酵母细胞,其中3-HPDH基因编码与SEQ ID NO:31的氨基酸序列具有至少60%,如至少65%、70%、75%、80%、85%、90%、95%、97%、98%、99%或100%序列同一性的多肽。
[B56]段落B49的经遗传修饰的酵母细胞,其中3-HPDH基因编码与SEQ ID NO:32的氨基酸序列具有至少60%,如至少65%、70%、75%、80%、85%、90%、95%、97%、98%、99%或100%序列同一性的多肽。
[B57]段落B49的经遗传修饰的酵母细胞,其中3-HPDH基因编码与SEQ ID NO:33的氨基酸序列具有至少60%,如至少65%、70%、75%、80%、85%、90%、95%、97%、98%、99%或100%序列同一性的多肽。
[B58]段落B49的经遗传修饰的酵母细胞,其中3-HPDH基因编码与SEQ ID NO:34的氨基酸序列具有至少60%,如至少65%、70%、75%、80%、85%、90%、95%、97%、98%、99%或100%序列同一性的多肽。
[B59]段落B49的经遗传修饰的酵母细胞,其中3-HPDH基因编码与SEQ ID NO:129的氨基酸序列具有至少60%,如至少65%、70%、75%、80%、85%、90%、95%、97%、98%、99%或100%序列同一性的多肽。
[B60]段落B1-B59任一项的经遗传修饰的酵母细胞,其中3-HPDH基因包含与选自SEQ ID NO:25、143、144和343的核苷酸序列具有至少60%,如至少65%、70%、75%、80%、85%、90%、95%、97%、98%、99%或100%序列同一性的核苷酸序列。
[B61]段落B60的经遗传修饰的酵母细胞,其中3-HPDH基因包含与SEQ ID NO:25的核苷酸序列具有至少60%,如至少65%、70%、75%、80%、85%、90%、95%、97%、98%、99%或100%序列同一性的核苷酸序列。
[B62]段落B60的经遗传修饰的酵母细胞,其中3-HPDH基因包含与SEQ ID NO:143的核苷酸序列具有至少60%,如至少65%、70%、75%、80%、85%、90%、95%、97%、98%、99%或100%序列同一性的核苷酸序列。
[B63]段落B60的经遗传修饰的酵母细胞,其中3-HPDH基因包含与SEQ ID NO:144的核苷酸序列具有至少60%,如至少65%、70%、75%、80%、85%、90%、95%、97%、98%、99%或100%序列同一性的核苷酸序列。
[B64]段落B60的经遗传修饰的酵母细胞,其中3-HPDH基因包含与SEQ ID NO:343的核苷酸序列具有至少60%,如至少65%、70%、75%、80%、85%、90%、95%、97%、98%、99%或100%序列同一性的核苷酸序列。
[B65]段落B1-B64任一项的经遗传修饰的酵母细胞,其中3-HPDH基因也是HIBADH基因。
[B66]段落B1-B65任一项的经遗传修饰的酵母细胞,其中3-HPDH基因也是4-羟基丁酸脱氢酶基因。
[B67]段落B1-B66任一项的经遗传修饰的酵母细胞,其中PPC基因编码与选自SEQID NO:10、11和12的氨基酸序列具有至少60%,如至少65%、70%、75%、80%、85%、90%、95%、97%、98%、99%或100%序列同一性的多肽。
[B68]段落B67的经遗传修饰的酵母细胞,其中PPC基因编码与SEQ ID NO:10的氨基酸序列具有至少60%,如至少65%、70%、75%、80%、85%、90%、95%、97%、98%、99%或100%序列同一性的多肽。
[B69]段落B67的经遗传修饰的酵母细胞,其中PPC基因编码与SEQ ID NO:11的氨基酸序列具有至少60%,如至少65%、70%、75%、80%、85%、90%、95%、97%、98%、99%或100%序列同一性的多肽。
[B70]段落B67的经遗传修饰的酵母细胞,其中PPC基因编码与SEQ ID NO:12的氨基酸序列具有至少60%,如至少65%、70%、75%、80%、85%、90%、95%、97%、98%、99%或100%序列同一性的多肽。
[B71]段落B1-B70任一项的经遗传修饰的酵母细胞,其中PPC基因包含与SEQ IDNO:9的核苷酸序列具有至少60%,如至少65%、70%、75%、80%、85%、90%、95%、97%、98%、99%或100%序列同一性的核苷酸序列。
[B72]段落B1-B71任一项的经遗传修饰的酵母细胞,其中所述酵母细胞是Crabtree阴性的。
[B73]段落B1-B72任一项的经遗传修饰的酵母细胞,其中酵母细胞属于选自伊萨酵母、假丝酵母、克鲁维酵母属、毕赤酵母、裂殖酵母、有孢圆酵母属、接合酵母属和酵母属的属。
[B74]段落B73的经遗传修饰的酵母细胞,其中酵母细胞属于选自东方伊萨酵母/发酵毕赤酵母进化枝和酵母属进化枝的进化枝。
[B75]段落B73的经遗传修饰的酵母细胞,其中酵母细胞选自东方伊萨酵母、郎比可假丝酵母和博伊丁酵母。
[B76]段落B1-B75任一项的经遗传修饰的酵母细胞,其中所述细胞进一步包含选自PDC、ADH、GAL6、CYB2A、CYB2B、GPD、GPP、ALD和PCK基因的天然基因的一个或多个缺失或破坏。
[B77]段落B76的经遗传修饰的酵母细胞,其中一个或多个缺失或破坏得自一个或多个外源3-HP途径基因的插入。
[B78]段落B1-B77任一项的经遗传修饰的酵母细胞,其中一个或多个外源3-HP途径基因可操作连接到一个或多个外源调节元件上。
[B79]段落B78的经遗传修饰的酵母细胞,其中一个或多个调节元件对于一个或多个3-HP途径基因是外来的。
[B80]段落B1-B79任一项的经遗传修饰的酵母细胞,其中外源PYC基因可操作连接到对于PYC基因是外来的外源启动子上。
[B81]段落B1-B80任一项的经遗传修饰的酵母细胞,其中外源ATT基因可操作连接到对于ATT基因是外来的外源启动子上。
[B82]段落B1-B81任一项的经遗传修饰的酵母细胞,其中外源ADC基因可操作连接到对于ADC基因是外来的外源启动子上。
[B83]段落B1-B82任一项的经遗传修饰的酵母细胞,其中外源BAAT或gabT基因可操作连接到对于BAAT或gabT基因是外来的外源启动子上。
[B84]段落B1-B83任一项的经遗传修饰的酵母细胞,其中外源3-HPDH基因可操作连接到对于3-HPDH基因是外来的外源启动子上。
[B85]段落B1-B84任一项的经遗传修饰的酵母细胞,其中外源PPC基因可操作连接到对于PPC基因是外来的外源启动子上。
[B86]段落B1-B85任一项的经遗传修饰的酵母细胞,其中细胞能够在含75g/L或更多3-HP的培养基中在小于4的pH下生长。
[B87]段落B1-B86任一项的经遗传修饰的酵母细胞,其中细胞是3-HP抗性酵母细胞。
[B88]段落B1-B87任一项的经遗传修饰的酵母细胞,其中细胞已经经过了突变和/或选择,以致经突变和/或选择的细胞相比同种的野生型细胞具有更高程度的3-HP抗性。
[B89]段落B88的经遗传修饰的酵母细胞,其中细胞在用一个或多个外源3-HP途径基因进行遗传修饰之前已经经过了突变和/或选择。
[B90]段落B88或B89的经遗传修饰的酵母细胞,其中细胞已经经过了乳酸或3-HP存在下的选择。
[B91]段落B91的经遗传修饰的酵母细胞,其中选择是恒化选择。
[B92]生产3-HP的方法,包括:
(i)在含至少一种碳源的培养基的存在下培养段落B1-B91任一项的经遗传修饰的酵母细胞;和
(ii)从培养物中分离3-HP。
[B93]段落B92的方法,其中所述碳源选自葡萄糖、木糖、阿拉伯糖、蔗糖、果糖、纤维素、葡萄糖寡聚物和甘油。
[B94]段落B92或B93的方法,其中培养基的pH小于5,如在约1.5至约4.5、约2.0至约4.0或约2.0至约3.5的范围中。
序列表
<110> 卡吉尔公司(CARGILL, INCORPORATED)
Jessen, Holly
Rush, Brian
Huryta, Jeanette
Mastel, Beth
Berry, Alan
Yaver, Debbie
<120> 用于生产3-羟基丙酸的组合物和方法
<130> N00096-CN-PCD
<150> US 61/416,199
<151> 2010-11-22
<150> US 61/535,181
<151> 2011-09-15
<160> 351
<170> PatentIn version 3.5
<210> 1
<211> 3543
<212> DNA
<213> 东方伊萨酵母
<400> 1
atgtcaactg tggaagatca ctcctcccta cataaattga gaaaggaatc tgagattctt 60
tccaatgcaa acaaaatctt agtggctaat agaggtgaaa ttccaattag aattttcagg 120
tcagcccatg aattgtcaat gcatactgtg gcgatctatt cccatgaaga tcggttgtcc 180
atgcataggt tgaaggccga cgaggcttat gcaatcggta agactggtca atattcgcca 240
gttcaagctt atctacaaat tgacgaaatt atcaaaatag caaaggaaca tgatgtttcc 300
atgatccatc caggttatgg tttcttatct gaaaactccg aattcgcaaa gaaggttgaa 360
gaatccggta tgatttgggt tgggcctcct gctgaagtta ttgattctgt tggtgacaag 420
gtttctgcaa gaaatttggc aattaaatgt gacgttcctg ttgttcctgg taccgatggt 480
ccaattgaag acattgaaca ggctaaacag tttgtggaac aatatggtta tcctgtcatt 540
ataaaggctg catttggtgg tggtggtaga ggtatgagag ttgttagaga aggtgatgat 600
atagttgatg ctttccaaag agcgtcatct gaagcaaagt ctgcctttgg taatggtact 660
tgttttattg aaagattttt ggataagcca aaacatattg aggttcaatt attggctgat 720
aattatggta acacaatcca tctctttgaa agagattgtt ctgttcaaag aagacatcaa 780
aaggttgttg aaattgcacc tgccaaaact ttacctgttg aagttagaaa tgctatatta 840
aaggatgctg taacgttagc taaaaccgct aactatagaa atgctggtac tgcagaattt 900
ttagttgatt cccaaaacag acattatttt attgaaatta atccaagaat tcaagttgaa 960
catacaatta ctgaagaaat cacgggtgtt gatattgttg ccgctcaaat tcaaattgct 1020
gcaggtgcat cattggaaca attgggtcta ttacaaaaca aaattacaac tagaggtttt 1080
gcaattcaat gtagaattac aaccgaggat cctgctaaga attttgcccc agatacaggt 1140
aaaattgagg tttatagatc tgcaggtggt aacggtgtca gattagatgg tggtaatggg 1200
tttgccggtg ctgttatatc tcctcattat gactcgatgt tggttaaatg ttcaacatct 1260
ggttctaact atgaaattgc cagaagaaag atgattagag ctttagttga atttagaatc 1320
agaggtgtca agaccaatat tcctttctta ttggcattgc taactcatcc agttttcatt 1380
tcgggtgatt gttggacaac ttttattgat gatacccctt cgttattcga aatggtttct 1440
tcaaagaata gagcccaaaa attattggca tatattggtg acttgtgtgt caatggttct 1500
tcaattaaag gtcaaattgg tttccctaaa ttgaacaagg aagcagaaat cccagatttg 1560
ttggatccaa atgatgaggt tattgatgtt tctaaacctt ctaccaatgg tctaagaccg 1620
tatctattaa agtatggacc agatgcgttt tccaaaaaag ttcgtgaatt cgatggttgt 1680
atgattatgg ataccacctg gagagatgca catcaatcat tattggctac aagagttaga 1740
actattgatt tactgagaat tgctccaacg actagtcatg ccttacaaaa tgcatttgca 1800
ttagaatgtt ggggtggcgc aacatttgat gttgcgatga ggttcctcta tgaagatcct 1860
tgggagagat taagacaact tagaaaggca gttccaaata ttcctttcca aatgttattg 1920
agaggtgcta atggtgttgc ttattcgtca ttacctgata atgcaattga tcattttgtt 1980
aagcaagcaa aggataatgg tgttgatatt ttcagagtct ttgatgcttt gaacgatttg 2040
gaacaattga aggttggtgt tgatgctgtc aagaaagccg gaggtgttgt tgaagctaca 2100
gtttgttact caggtgatat gttaattcca ggtaaaaagt ataacttgga ttattattta 2160
gagactgttg gaaagattgt ggaaatgggt acccatattt taggtattaa ggatatggct 2220
ggcacgttaa agccaaaggc tgctaagttg ttgattggct cgatcagatc aaaataccct 2280
gacttggtta tccatgtcca tacccatgac tctgctggta ccggtatttc aacttatgtt 2340
gcatgcgcat tggcaggtgc cgacattgtc gattgtgcaa tcaattcgat gtctggttta 2400
acctctcaac cttcaatgag tgcttttatt gctgctttag atggtgatat cgaaactggt 2460
gttccagaac attttgcaag acaattagat gcatactggg cagaaatgag attgttatac 2520
tcatgtttcg aagccgactt gaagggacca gacccagaag tttataaaca tgaaattcca 2580
ggtggacagt tgactaacct aatcttccaa gcccaacaag ttggtttggg tgaacaatgg 2640
gaagaaacta agaagaagta tgaagatgct aacatgttgt tgggtgatat tgtcaaggtt 2700
accccaacct ccaaggttgt tggtgattta gcccaattta tggtttctaa taaattagaa 2760
aaagaagatg ttgaaaaact tgctaatgaa ttagatttcc cagattcagt tcttgatttc 2820
tttgaaggat taatgggtac accatatggt ggattcccag agcctttgag aacaaatgtc 2880
atttccggca agagaagaaa attaaagggt agaccaggtt tagaattaga acctttcaac 2940
ctcgaggaaa tcagagaaaa tttggtttcc agatttggtc caggtattac tgaatgtgat 3000
gttgcatctt ataacatgta tccaaaggtt tacgagcaat atcgtaaggt ggttgaaaaa 3060
tatggtgatt tatctgtttt accaacaaaa gcatttttgg ctcctccaac tattggtgaa 3120
gaagttcatg tggaaattga gcaaggtaag actttgatta ttaagttatt agccatttct 3180
gacttgtcta aatctcatgg tacaagagaa gtatactttg aattgaatgg tgaaatgaga 3240
aaggttacaa ttgaagataa aacagctgca attgagactg ttacaagagc aaaggctgac 3300
ggacacaatc caaatgaagt tggtgcgcca atggctggtg tcgttgttga agttagagtg 3360
aagcatggaa cagaagttaa gaagggtgat ccattagccg ttttgagtgc aatgaaaatg 3420
gaaatggtta tttctgctcc tgttagtggt agggtcggtg aagtttttgt caacgaaggc 3480
gattccgttg atatgggtga tttgcttgtg aaaattgcca aagatgaagc gccagcagct 3540
taa 3543
<210> 2
<211> 1180
<212> PRT
<213> 东方伊萨酵母
<400> 2
Met Ser Thr Val Glu Asp His Ser Ser Leu His Lys Leu Arg Lys Glu
1 5 10 15
Ser Glu Ile Leu Ser Asn Ala Asn Lys Ile Leu Val Ala Asn Arg Gly
20 25 30
Glu Ile Pro Ile Arg Ile Phe Arg Ser Ala His Glu Leu Ser Met His
35 40 45
Thr Val Ala Ile Tyr Ser His Glu Asp Arg Leu Ser Met His Arg Leu
50 55 60
Lys Ala Asp Glu Ala Tyr Ala Ile Gly Lys Thr Gly Gln Tyr Ser Pro
65 70 75 80
Val Gln Ala Tyr Leu Gln Ile Asp Glu Ile Ile Lys Ile Ala Lys Glu
85 90 95
His Asp Val Ser Met Ile His Pro Gly Tyr Gly Phe Leu Ser Glu Asn
100 105 110
Ser Glu Phe Ala Lys Lys Val Glu Glu Ser Gly Met Ile Trp Val Gly
115 120 125
Pro Pro Ala Glu Val Ile Asp Ser Val Gly Asp Lys Val Ser Ala Arg
130 135 140
Asn Leu Ala Ile Lys Cys Asp Val Pro Val Val Pro Gly Thr Asp Gly
145 150 155 160
Pro Ile Glu Asp Ile Glu Gln Ala Lys Gln Phe Val Glu Gln Tyr Gly
165 170 175
Tyr Pro Val Ile Ile Lys Ala Ala Phe Gly Gly Gly Gly Arg Gly Met
180 185 190
Arg Val Val Arg Glu Gly Asp Asp Ile Val Asp Ala Phe Gln Arg Ala
195 200 205
Ser Ser Glu Ala Lys Ser Ala Phe Gly Asn Gly Thr Cys Phe Ile Glu
210 215 220
Arg Phe Leu Asp Lys Pro Lys His Ile Glu Val Gln Leu Leu Ala Asp
225 230 235 240
Asn Tyr Gly Asn Thr Ile His Leu Phe Glu Arg Asp Cys Ser Val Gln
245 250 255
Arg Arg His Gln Lys Val Val Glu Ile Ala Pro Ala Lys Thr Leu Pro
260 265 270
Val Glu Val Arg Asn Ala Ile Leu Lys Asp Ala Val Thr Leu Ala Lys
275 280 285
Thr Ala Asn Tyr Arg Asn Ala Gly Thr Ala Glu Phe Leu Val Asp Ser
290 295 300
Gln Asn Arg His Tyr Phe Ile Glu Ile Asn Pro Arg Ile Gln Val Glu
305 310 315 320
His Thr Ile Thr Glu Glu Ile Thr Gly Val Asp Ile Val Ala Ala Gln
325 330 335
Ile Gln Ile Ala Ala Gly Ala Ser Leu Glu Gln Leu Gly Leu Leu Gln
340 345 350
Asn Lys Ile Thr Thr Arg Gly Phe Ala Ile Gln Cys Arg Ile Thr Thr
355 360 365
Glu Asp Pro Ala Lys Asn Phe Ala Pro Asp Thr Gly Lys Ile Glu Val
370 375 380
Tyr Arg Ser Ala Gly Gly Asn Gly Val Arg Leu Asp Gly Gly Asn Gly
385 390 395 400
Phe Ala Gly Ala Val Ile Ser Pro His Tyr Asp Ser Met Leu Val Lys
405 410 415
Cys Ser Thr Ser Gly Ser Asn Tyr Glu Ile Ala Arg Arg Lys Met Ile
420 425 430
Arg Ala Leu Val Glu Phe Arg Ile Arg Gly Val Lys Thr Asn Ile Pro
435 440 445
Phe Leu Leu Ala Leu Leu Thr His Pro Val Phe Ile Ser Gly Asp Cys
450 455 460
Trp Thr Thr Phe Ile Asp Asp Thr Pro Ser Leu Phe Glu Met Val Ser
465 470 475 480
Ser Lys Asn Arg Ala Gln Lys Leu Leu Ala Tyr Ile Gly Asp Leu Cys
485 490 495
Val Asn Gly Ser Ser Ile Lys Gly Gln Ile Gly Phe Pro Lys Leu Asn
500 505 510
Lys Glu Ala Glu Ile Pro Asp Leu Leu Asp Pro Asn Asp Glu Val Ile
515 520 525
Asp Val Ser Lys Pro Ser Thr Asn Gly Leu Arg Pro Tyr Leu Leu Lys
530 535 540
Tyr Gly Pro Asp Ala Phe Ser Lys Lys Val Arg Glu Phe Asp Gly Cys
545 550 555 560
Met Ile Met Asp Thr Thr Trp Arg Asp Ala His Gln Ser Leu Leu Ala
565 570 575
Thr Arg Val Arg Thr Ile Asp Leu Leu Arg Ile Ala Pro Thr Thr Ser
580 585 590
His Ala Leu Gln Asn Ala Phe Ala Leu Glu Cys Trp Gly Gly Ala Thr
595 600 605
Phe Asp Val Ala Met Arg Phe Leu Tyr Glu Asp Pro Trp Glu Arg Leu
610 615 620
Arg Gln Leu Arg Lys Ala Val Pro Asn Ile Pro Phe Gln Met Leu Leu
625 630 635 640
Arg Gly Ala Asn Gly Val Ala Tyr Ser Ser Leu Pro Asp Asn Ala Ile
645 650 655
Asp His Phe Val Lys Gln Ala Lys Asp Asn Gly Val Asp Ile Phe Arg
660 665 670
Val Phe Asp Ala Leu Asn Asp Leu Glu Gln Leu Lys Val Gly Val Asp
675 680 685
Ala Val Lys Lys Ala Gly Gly Val Val Glu Ala Thr Val Cys Tyr Ser
690 695 700
Gly Asp Met Leu Ile Pro Gly Lys Lys Tyr Asn Leu Asp Tyr Tyr Leu
705 710 715 720
Glu Thr Val Gly Lys Ile Val Glu Met Gly Thr His Ile Leu Gly Ile
725 730 735
Lys Asp Met Ala Gly Thr Leu Lys Pro Lys Ala Ala Lys Leu Leu Ile
740 745 750
Gly Ser Ile Arg Ser Lys Tyr Pro Asp Leu Val Ile His Val His Thr
755 760 765
His Asp Ser Ala Gly Thr Gly Ile Ser Thr Tyr Val Ala Cys Ala Leu
770 775 780
Ala Gly Ala Asp Ile Val Asp Cys Ala Ile Asn Ser Met Ser Gly Leu
785 790 795 800
Thr Ser Gln Pro Ser Met Ser Ala Phe Ile Ala Ala Leu Asp Gly Asp
805 810 815
Ile Glu Thr Gly Val Pro Glu His Phe Ala Arg Gln Leu Asp Ala Tyr
820 825 830
Trp Ala Glu Met Arg Leu Leu Tyr Ser Cys Phe Glu Ala Asp Leu Lys
835 840 845
Gly Pro Asp Pro Glu Val Tyr Lys His Glu Ile Pro Gly Gly Gln Leu
850 855 860
Thr Asn Leu Ile Phe Gln Ala Gln Gln Val Gly Leu Gly Glu Gln Trp
865 870 875 880
Glu Glu Thr Lys Lys Lys Tyr Glu Asp Ala Asn Met Leu Leu Gly Asp
885 890 895
Ile Val Lys Val Thr Pro Thr Ser Lys Val Val Gly Asp Leu Ala Gln
900 905 910
Phe Met Val Ser Asn Lys Leu Glu Lys Glu Asp Val Glu Lys Leu Ala
915 920 925
Asn Glu Leu Asp Phe Pro Asp Ser Val Leu Asp Phe Phe Glu Gly Leu
930 935 940
Met Gly Thr Pro Tyr Gly Gly Phe Pro Glu Pro Leu Arg Thr Asn Val
945 950 955 960
Ile Ser Gly Lys Arg Arg Lys Leu Lys Gly Arg Pro Gly Leu Glu Leu
965 970 975
Glu Pro Phe Asn Leu Glu Glu Ile Arg Glu Asn Leu Val Ser Arg Phe
980 985 990
Gly Pro Gly Ile Thr Glu Cys Asp Val Ala Ser Tyr Asn Met Tyr Pro
995 1000 1005
Lys Val Tyr Glu Gln Tyr Arg Lys Val Val Glu Lys Tyr Gly Asp
1010 1015 1020
Leu Ser Val Leu Pro Thr Lys Ala Phe Leu Ala Pro Pro Thr Ile
1025 1030 1035
Gly Glu Glu Val His Val Glu Ile Glu Gln Gly Lys Thr Leu Ile
1040 1045 1050
Ile Lys Leu Leu Ala Ile Ser Asp Leu Ser Lys Ser His Gly Thr
1055 1060 1065
Arg Glu Val Tyr Phe Glu Leu Asn Gly Glu Met Arg Lys Val Thr
1070 1075 1080
Ile Glu Asp Lys Thr Ala Ala Ile Glu Thr Val Thr Arg Ala Lys
1085 1090 1095
Ala Asp Gly His Asn Pro Asn Glu Val Gly Ala Pro Met Ala Gly
1100 1105 1110
Val Val Val Glu Val Arg Val Lys His Gly Thr Glu Val Lys Lys
1115 1120 1125
Gly Asp Pro Leu Ala Val Leu Ser Ala Met Lys Met Glu Met Val
1130 1135 1140
Ile Ser Ala Pro Val Ser Gly Arg Val Gly Glu Val Phe Val Asn
1145 1150 1155
Glu Gly Asp Ser Val Asp Met Gly Asp Leu Leu Val Lys Ile Ala
1160 1165 1170
Lys Asp Glu Ala Pro Ala Ala
1175 1180
<210> 3
<211> 1154
<212> PRT
<213> 类球红细菌(Rhodobacter sphaeroides)
<400> 3
Met Ala Glu Phe Arg Lys Ile Leu Ile Ala Asn Arg Gly Glu Ile Ala
1 5 10 15
Ile Arg Val Met Arg Ala Ala Asn Glu Met Gly Lys Lys Thr Val Ala
20 25 30
Val Tyr Ala Glu Glu Asp Lys Leu Ser Leu His Arg Phe Lys Ala Asp
35 40 45
Glu Ala Tyr Arg Ile Gly Glu Gly Leu Ser Pro Val Gly Ala Tyr Leu
50 55 60
Ser Ile Pro Glu Ile Ile Arg Val Ala Gln Met Ser Gly Ala Asp Ala
65 70 75 80
Ile His Pro Gly Tyr Gly Leu Leu Ser Glu Asn Pro Asp Phe Val Glu
85 90 95
Ala Cys Asp Ala Ala Gly Ile Ala Phe Ile Gly Pro Lys Ala Glu Thr
100 105 110
Met Arg Ala Leu Gly Asp Lys Ala Ser Ala Arg Arg Val Ala Met Ala
115 120 125
Ala Gly Val Pro Val Ile Pro Ala Thr Glu Val Leu Gly Asp Asp Met
130 135 140
Glu Glu Ile Lys Arg Gln Ala Ala Glu Ile Gly Tyr Pro Leu Met Leu
145 150 155 160
Lys Ala Ser Trp Gly Gly Gly Gly Arg Gly Met Arg Pro Ile Thr Ser
165 170 175
Glu Ala Glu Leu Ala Asp Lys Val Arg Glu Gly Arg Arg Glu Ala Glu
180 185 190
Ala Ala Phe Gly Asn Gly Glu Gly Tyr Leu Glu Lys Met Ile Gln Arg
195 200 205
Ala Arg His Val Glu Val Gln Ile Leu Gly Asp Lys Tyr Gly Ala Ile
210 215 220
Tyr His Leu Tyr Glu Arg Asp Cys Thr Val Gln Arg Arg Asn Gln Lys
225 230 235 240
Val Val Glu Arg Ala Pro Ala Pro Tyr Leu Thr Glu Glu Gln Arg Thr
245 250 255
Glu Ile Cys Glu Leu Gly Arg Arg Ile Cys Ala His Val Asn Tyr Glu
260 265 270
Cys Ala Gly Thr Val Glu Phe Leu Met Asp Met Asp Ser Glu Lys Phe
275 280 285
Tyr Phe Ile Glu Val Asn Pro Arg Val Gln Val Glu His Thr Val Thr
290 295 300
Glu Glu Val Thr Gly Ile Asp Ile Val Gln Ser Gln Ile Arg Ile Ala
305 310 315 320
Glu Gly Ala Thr Leu Ala Glu Ala Thr Gly Cys Pro Ser Gln Asp Asp
325 330 335
Ile Lys Leu Ser Gly His Ala Leu Gln Cys Arg Val Thr Thr Glu Asp
340 345 350
Pro Gln Asn Asn Phe Ile Pro Asp Tyr Gly Arg Leu Thr Ala Tyr Arg
355 360 365
Ser Ala Thr Gly Met Gly Ile Arg Leu Asp Gly Gly Thr Ala Tyr Ala
370 375 380
Gly Gly Val Ile Thr Arg Tyr Tyr Asp Ser Leu Leu Val Lys Val Thr
385 390 395 400
Ala Trp Ala Pro Thr Pro Glu Lys Ala Ile Ala Arg Met Asp Arg Ala
405 410 415
Leu Arg Glu Phe Arg Ile Arg Gly Val Ala Thr Asn Ile Ala Phe Val
420 425 430
Glu Asn Leu Leu Lys His Pro Ser Phe Leu Asp Tyr Ser Tyr Thr Thr
435 440 445
Lys Phe Ile Asp Thr Thr Pro Asp Leu Phe Asn Phe Lys Pro Arg Arg
450 455 460
Asp Arg Ala Thr Lys Ile Leu Thr Tyr Ile Ala Asp Ile Thr Val Asn
465 470 475 480
Gly His Pro Glu Thr Ala Gly Arg Val Arg Pro Ser Ala Glu Leu Lys
485 490 495
Asp Pro Lys Ala Pro Glu Pro Lys Gly Ala Pro Gln Pro Gly Thr Arg
500 505 510
Thr Leu Leu Glu Glu Lys Gly Pro Gln Ala Val Ala Asp Trp Met Ala
515 520 525
Ala Gln Thr Arg Val Leu Met Thr Asp Thr Thr Met Arg Asp Gly His
530 535 540
Gln Ser Leu Leu Ala Thr Arg Met Arg Ser Ile Asp Met Ile Lys Val
545 550 555 560
Thr Pro Ala Tyr Ala Ala Asn Leu Gly Gly Leu Phe Ser Val Glu Cys
565 570 575
Trp Gly Gly Ala Thr Phe Asp Val Ala Tyr Arg Phe Leu Gln Glu Cys
580 585 590
Pro Trp Gln Arg Leu Arg Asp Ile Arg Ala Arg Leu Pro Asn Val Met
595 600 605
Thr Gln Met Leu Leu Arg Ala Ser Asn Gly Val Gly Tyr Thr Asn Tyr
610 615 620
Pro Asp Asn Val Val Gln Glu Phe Val Arg Gln Ala Ala Glu Thr Gly
625 630 635 640
Val Asp Val Phe Arg Val Phe Asp Ser Leu Asn Trp Val Glu Asn Met
645 650 655
Arg Val Ala Met Asp Ala Val Ile Glu Ala Asn Lys Val Cys Glu Gly
660 665 670
Thr Ile Cys Tyr Thr Gly Asp Leu Leu Asp Pro Asp Arg Ser Lys Tyr
675 680 685
Asp Leu Asn Tyr Tyr Val Gly Met Gly Arg Ala Leu Arg Asp Ala Gly
690 695 700
Ala His Val Leu Gly Leu Lys Asp Met Ala Gly Leu Leu Lys Pro Ala
705 710 715 720
Ala Ala Arg Val Leu Val Lys Ala Leu Lys Glu Glu Val Gly Leu Pro
725 730 735
Ile His Phe His Thr His Asp Thr Ser Gly Ile Ala Gly Ala Thr Val
740 745 750
Leu Ala Ala Cys Asp Ala Gly Val Asp Ala Val Asp Ala Ala Met Asp
755 760 765
Ala Phe Ser Gly Gly Thr Ser Gln Pro Cys Leu Gly Ser Ile Val Glu
770 775 780
Ala Leu Lys His Thr Asp Arg Asp Thr Gly Leu Asp Ile Ala Ala Ile
785 790 795 800
Arg Glu Ile Ser Asp Tyr Trp Gly His Val Arg Gln Gln Tyr Ser Ala
805 810 815
Phe Glu Ser Gly Leu Pro Ser Pro Ala Ser Glu Val Tyr Leu His Glu
820 825 830
Met Pro Gly Gly Gln Phe Thr Asn Leu Lys Ala Gln Ala Arg Ser Met
835 840 845
Gly Leu Glu Glu Arg Trp Ser Glu Val Ala Gln Ala Tyr Ala Asp Ala
850 855 860
Asn Arg Met Phe Gly Asp Ile Val Lys Val Thr Pro Ser Ser Lys Val
865 870 875 880
Val Gly Asp Met Ala Leu Met Met Val Ala Gln Gly Leu Thr Arg Glu
885 890 895
Glu Val Glu Asp Pro Glu Val Glu Val Ser Phe Pro Asp Ser Val Val
900 905 910
Asp Met Leu Lys Gly Asn Leu Gly Gln Pro His Gly Gly Trp Pro Glu
915 920 925
Pro Ile Leu Lys Lys Val Leu Lys Gly Glu Ala Pro Ser Thr Glu Arg
930 935 940
Pro Gly Ala His Leu Pro Pro Val Asp Ile Ala Ala Ala Arg Glu Lys
945 950 955 960
Leu Leu Ser Glu Ile Lys Gln Gly Asp Asp Asp Pro Leu Asp Thr Ala
965 970 975
Val Asp Ala Glu Asp Leu Asn Gly Tyr Leu Met Tyr Pro Lys Val Phe
980 985 990
Thr Asp Tyr Arg Ala Arg His Arg Ile Tyr Gly Pro Val Arg Thr Leu
995 1000 1005
Pro Thr Arg Thr Phe Phe Tyr Gly Met Glu Pro Gly Glu Glu Ile
1010 1015 1020
Ser Ala Glu Ile Asp Pro Gly Lys Thr Leu Glu Ile Arg Leu Ser
1025 1030 1035
Ala Val Gly Glu Thr Ser Asp Asp Gly Asp Ala Lys Val Phe Phe
1040 1045 1050
Glu Leu Asn Gly Gln Pro Arg Val Ile Arg Val Ala Asn Arg Ala
1055 1060 1065
Val Lys Ala Lys Thr Ala Thr Arg Pro Lys Ala Gln Asp Gly Asn
1070 1075 1080
Pro Ala His Val Gly Ala Pro Met Pro Gly Ser Val Ala Ser Val
1085 1090 1095
Ala Val Ser Ala Gly Gln Lys Val Lys Pro Gly Asp Leu Leu Val
1100 1105 1110
Thr Ile Glu Ala Met Lys Met Glu Thr Gly Leu His Ala Asp Arg
1115 1120 1125
Ala Ala Thr Val Lys Ala Val His Val Gly Pro Gly Ala Gln Ile
1130 1135 1140
Glu Ala Lys Asp Leu Leu Val Glu Leu Glu Asp
1145 1150
<210> 4
<211> 1154
<212> PRT
<213> 菜豆根瘤菌
<400> 4
Met Pro Ile Ser Lys Ile Leu Val Ala Asn Arg Ser Glu Ile Ala Ile
1 5 10 15
Arg Val Phe Arg Ala Ala Asn Glu Leu Gly Ile Lys Thr Val Ala Ile
20 25 30
Trp Ala Glu Glu Asp Lys Leu Ala Leu His Arg Phe Lys Ala Asp Glu
35 40 45
Ser Tyr Gln Val Gly Arg Gly Pro His Leu Ala Arg Asp Leu Gly Pro
50 55 60
Ile Glu Ser Tyr Leu Ser Ile Asp Glu Val Ile Arg Val Ala Lys Leu
65 70 75 80
Ser Gly Ala Asp Ala Ile His Pro Gly Tyr Gly Leu Leu Ser Glu Ser
85 90 95
Pro Glu Phe Val Asp Ala Cys Asn Lys Ala Gly Ile Ile Phe Ile Gly
100 105 110
Pro Lys Ala Asp Thr Met Arg Gln Leu Gly Asn Lys Val Ala Ala Arg
115 120 125
Asn Leu Ala Ile Ser Val Gly Val Pro Val Val Pro Ala Thr Glu Pro
130 135 140
Leu Pro Asp Asp Met Ala Glu Val Ala Lys Met Ala Ala Ala Ile Gly
145 150 155 160
Tyr Pro Val Met Leu Lys Ala Ser Trp Gly Gly Gly Gly Arg Gly Met
165 170 175
Arg Val Ile Arg Ser Glu Ala Asp Leu Ala Lys Glu Val Thr Glu Ala
180 185 190
Lys Arg Glu Ala Met Ala Ala Phe Gly Lys Asp Glu Val Tyr Leu Glu
195 200 205
Lys Leu Val Glu Arg Ala Arg His Val Glu Ser Gln Ile Leu Gly Asp
210 215 220
Thr His Gly Asn Val Val His Leu Phe Glu Arg Asp Cys Ser Val Gln
225 230 235 240
Arg Arg Asn Gln Lys Val Val Glu Arg Ala Pro Ala Pro Tyr Leu Ser
245 250 255
Glu Ala Gln Arg Gln Glu Leu Ala Ala Tyr Ser Leu Lys Ile Ala Gly
260 265 270
Ala Thr Asn Tyr Ile Gly Ala Gly Thr Val Glu Tyr Leu Met Asp Ala
275 280 285
Asp Thr Gly Lys Phe Tyr Phe Ile Glu Val Asn Pro Arg Ile Gln Val
290 295 300
Glu His Thr Val Thr Glu Val Val Thr Gly Ile Asp Ile Val Lys Ala
305 310 315 320
Gln Ile His Ile Leu Asp Gly Ala Ala Ile Gly Thr Pro Gln Ser Gly
325 330 335
Val Pro Asn Gln Glu Asp Ile Arg Leu Asn Gly His Ala Leu Gln Cys
340 345 350
Arg Val Thr Thr Glu Asp Pro Glu His Asn Phe Ile Pro Asp Tyr Gly
355 360 365
Arg Ile Thr Ala Tyr Arg Ser Ala Ser Gly Phe Gly Ile Arg Leu Asp
370 375 380
Gly Gly Thr Ser Tyr Ser Gly Ala Ile Ile Thr Arg Tyr Tyr Asp Pro
385 390 395 400
Leu Leu Val Lys Val Thr Ala Trp Ala Pro Asn Pro Leu Glu Ala Ile
405 410 415
Ser Arg Met Asp Arg Ala Leu Arg Glu Phe Arg Ile Arg Gly Val Ala
420 425 430
Thr Asn Leu Thr Phe Leu Glu Ala Ile Ile Gly His Pro Lys Phe Arg
435 440 445
Asp Asn Ser Tyr Thr Thr Arg Phe Ile Asp Thr Thr Pro Glu Leu Phe
450 455 460
Gln Gln Val Lys Arg Gln Asp Arg Ala Thr Lys Leu Leu Thr Tyr Leu
465 470 475 480
Ala Asp Val Thr Val Asn Gly His Pro Glu Ala Lys Asp Arg Pro Lys
485 490 495
Pro Leu Glu Asn Ala Ala Arg Pro Val Val Pro Tyr Ala Asn Gly Asn
500 505 510
Gly Val Lys Asp Gly Thr Lys Gln Leu Leu Asp Thr Leu Gly Pro Lys
515 520 525
Lys Phe Gly Glu Trp Met Arg Asn Glu Lys Arg Val Leu Leu Thr Asp
530 535 540
Thr Thr Met Arg Asp Gly His Gln Ser Leu Leu Ala Thr Arg Met Arg
545 550 555 560
Thr Tyr Asp Ile Ala Arg Ile Ala Gly Thr Tyr Ser His Ala Leu Pro
565 570 575
Asn Leu Leu Ser Leu Glu Cys Trp Gly Gly Ala Thr Phe Asp Val Ser
580 585 590
Met Arg Phe Leu Thr Glu Asp Pro Trp Glu Arg Leu Ala Leu Ile Arg
595 600 605
Glu Gly Ala Pro Asn Leu Leu Leu Gln Met Leu Leu Arg Gly Ala Asn
610 615 620
Gly Val Gly Tyr Thr Asn Tyr Pro Asp Asn Val Val Lys Tyr Phe Val
625 630 635 640
Arg Gln Ala Ala Lys Gly Gly Ile Asp Leu Phe Arg Val Phe Asp Cys
645 650 655
Leu Asn Trp Val Glu Asn Met Arg Val Ser Met Asp Ala Ile Ala Glu
660 665 670
Glu Asn Lys Leu Cys Glu Ala Ala Ile Cys Tyr Thr Gly Asp Ile Leu
675 680 685
Asn Ser Ala Arg Pro Lys Tyr Asp Leu Lys Tyr Tyr Thr Asn Leu Ala
690 695 700
Val Glu Leu Glu Lys Ala Gly Ala His Ile Ile Ala Val Lys Asp Met
705 710 715 720
Ala Gly Leu Leu Lys Pro Ala Ala Ala Lys Val Leu Phe Lys Ala Leu
725 730 735
Arg Glu Ala Thr Gly Leu Pro Ile His Phe His Thr His Asp Thr Ser
740 745 750
Gly Ile Ala Ala Ala Thr Val Leu Ala Ala Val Glu Ala Gly Val Asp
755 760 765
Ala Val Asp Ala Ala Met Asp Ala Leu Ser Gly Asn Thr Ser Gln Pro
770 775 780
Cys Leu Gly Ser Ile Val Glu Ala Leu Ser Gly Ser Glu Arg Asp Pro
785 790 795 800
Gly Leu Asp Pro Ala Trp Ile Arg Arg Ile Ser Phe Tyr Trp Glu Ala
805 810 815
Val Arg Asn Gln Tyr Ala Ala Phe Glu Ser Asp Leu Lys Gly Pro Ala
820 825 830
Ser Glu Val Tyr Leu His Glu Met Pro Gly Gly Gln Phe Thr Asn Leu
835 840 845
Lys Glu Gln Ala Arg Ser Leu Gly Leu Glu Thr Arg Trp His Gln Val
850 855 860
Ala Gln Ala Tyr Ala Asp Ala Asn Gln Met Phe Gly Asp Ile Val Lys
865 870 875 880
Val Thr Pro Ser Ser Lys Val Val Gly Asp Met Ala Leu Met Met Val
885 890 895
Ser Gln Asp Leu Thr Val Ala Asp Val Val Ser Pro Asp Arg Glu Val
900 905 910
Ser Phe Pro Glu Ser Val Val Ser Met Leu Lys Gly Asp Leu Gly Gln
915 920 925
Pro Pro Ser Gly Trp Pro Glu Ala Leu Gln Lys Lys Ala Leu Lys Gly
930 935 940
Glu Lys Pro Tyr Thr Val Arg Pro Gly Ser Leu Leu Lys Glu Ala Asp
945 950 955 960
Leu Asp Ala Glu Arg Lys Val Ile Glu Lys Lys Leu Glu Arg Glu Val
965 970 975
Ser Asp Phe Glu Phe Ala Ser Tyr Leu Met Tyr Pro Lys Val Phe Thr
980 985 990
Asp Phe Ala Leu Ala Ser Asp Thr Tyr Gly Pro Val Ser Val Leu Pro
995 1000 1005
Thr Pro Ala Tyr Phe Tyr Gly Leu Ala Asp Gly Glu Glu Leu Phe
1010 1015 1020
Ala Asp Ile Glu Lys Gly Lys Thr Leu Val Ile Val Asn Gln Ala
1025 1030 1035
Val Ser Ala Thr Asp Ser Gln Gly Met Val Thr Val Phe Phe Glu
1040 1045 1050
Leu Asn Gly Gln Pro Arg Arg Ile Lys Val Pro Asp Arg Ala His
1055 1060 1065
Gly Ala Thr Gly Ala Ala Val Arg Arg Lys Ala Glu Pro Gly Asn
1070 1075 1080
Ala Ala His Val Gly Ala Pro Met Pro Gly Val Ile Ser Arg Val
1085 1090 1095
Phe Val Ser Ser Gly Gln Ala Val Asn Ala Gly Asp Val Leu Val
1100 1105 1110
Ser Ile Glu Ala Met Lys Met Glu Thr Ala Ile His Ala Glu Lys
1115 1120 1125
Asp Gly Thr Ile Ala Glu Val Leu Val Lys Ala Gly Asp Gln Ile
1130 1135 1140
Asp Ala Lys Asp Leu Leu Ala Val Tyr Gly Gly
1145 1150
<210> 5
<211> 602
<212> PRT
<213> 荧光假单胞菌
<400> 5
Met Thr Lys Lys Ile Phe Val Thr Asp Thr Ile Leu Arg Asp Ala His
1 5 10 15
Gln Ser Leu Leu Ala Thr Arg Met Arg Thr Glu Asp Met Leu Pro Ile
20 25 30
Cys Asp Lys Leu Asp Lys Val Gly Tyr Trp Ser Leu Glu Cys Trp Gly
35 40 45
Gly Ala Thr Phe Asp Ala Cys Val Arg Phe Leu Lys Glu Asp Pro Trp
50 55 60
Glu Arg Leu Arg Gln Leu Arg Ala Ala Leu Pro Asn Thr Arg Leu Gln
65 70 75 80
Met Leu Leu Arg Gly Gln Asn Leu Leu Gly Tyr Arg His Tyr Ser Asp
85 90 95
Asp Val Val Lys Ala Phe Val Ala Lys Ala Ala Val Asn Gly Ile Asp
100 105 110
Val Phe Arg Ile Phe Asp Ala Met Asn Asp Val Arg Asn Leu Arg Val
115 120 125
Ala Ile Glu Ala Val Lys Ala Ala Gly Lys His Ala Gln Gly Thr Ile
130 135 140
Ala Tyr Thr Thr Ser Pro Val His Thr Ile Asp Ala Phe Val Ala Gln
145 150 155 160
Ala Lys Gln Met Glu Ala Met Gly Cys Asp Ser Val Ala Ile Lys Asp
165 170 175
Met Ala Gly Leu Leu Thr Pro Tyr Ala Thr Gly Glu Leu Val Arg Ala
180 185 190
Leu Lys Ala Glu Gln Ser Leu Pro Val Phe Ile His Ser His Asp Thr
195 200 205
Ala Gly Leu Ala Ala Met Cys Gln Leu Lys Ala Ile Glu Asn Gly Ala
210 215 220
Asp His Ile Asp Thr Ala Ile Ser Ser Phe Ala Ser Gly Thr Ser His
225 230 235 240
Pro Gly Thr Glu Ser Met Val Ala Ala Leu Lys Gly Thr Glu Phe Asp
245 250 255
Thr Gly Leu Asn Leu Glu Leu Leu Gln Glu Ile Gly Leu Tyr Phe Tyr
260 265 270
Ala Val Arg Lys Lys Tyr His Gln Phe Glu Ser Glu Phe Thr Ala Val
275 280 285
Asp Thr Arg Val Gln Val Asn Gln Val Pro Gly Gly Met Ile Ser Asn
290 295 300
Leu Ala Asn Gln Leu Lys Glu Gln Gly Ala Leu Asn Arg Met Gly Glu
305 310 315 320
Val Leu Ala Glu Ile Pro Arg Val Arg Glu Asp Leu Gly Phe Pro Pro
325 330 335
Leu Val Thr Pro Thr Ser Gln Ile Val Gly Thr Gln Ala Phe Phe Asn
340 345 350
Val Leu Ala Gly Glu Arg Tyr Lys Thr Ile Thr Asn Glu Val Lys Leu
355 360 365
Tyr Leu Gln Gly Gly Tyr Gly Lys Ala Pro Gly Thr Val Asn Glu Lys
370 375 380
Leu Arg Arg Gln Ala Ile Gly Ser Glu Glu Val Ile Asp Val Arg Pro
385 390 395 400
Ala Asp Leu Leu Lys Pro Glu Met Thr Lys Leu Arg Ala Asp Ile Gly
405 410 415
Ala Leu Ala Lys Ser Glu Glu Asp Val Leu Thr Phe Ala Met Phe Pro
420 425 430
Asp Ile Gly Arg Lys Phe Leu Glu Glu Arg Ala Ala Gly Thr Leu Thr
435 440 445
Pro Glu Val Leu Leu Pro Ile Pro Glu Ala Gly Lys Val Ala Ser Ala
450 455 460
Gly Gly Glu Gly Val Pro Thr Glu Phe Val Ile Asp Val His Gly Glu
465 470 475 480
Thr Tyr Arg Val Asp Ile Thr Gly Val Gly Val Lys Ala Glu Gly Lys
485 490 495
Arg His Phe Tyr Leu Ser Ile Asp Gly Met Pro Glu Glu Val Val Phe
500 505 510
Glu Pro Leu Asn Glu Phe Val Gly Gly Gly Ser Ser Lys Arg Lys Gln
515 520 525
Ala Ser Ala Pro Gly His Val Ser Thr Thr Met Pro Gly Asn Ile Val
530 535 540
Asp Val Leu Val Lys Glu Gly Asp Thr Val Lys Ala Gly Gln Ala Val
545 550 555 560
Leu Ile Thr Glu Ala Met Lys Met Glu Thr Glu Val Gln Ala Ala Ile
565 570 575
Ala Gly Lys Val Thr Ala Ile His Val Ala Lys Gly Asp Arg Val Asn
580 585 590
Pro Gly Glu Ile Leu Ile Glu Ile Glu Gly
595 600
<210> 6
<211> 481
<212> PRT
<213> 荧光假单胞菌
<400> 6
Met Val Pro Pro Ala Gln Gly Asn Leu Gln Val Ile Thr Lys Ile Leu
1 5 10 15
Ile Ala Asn Arg Gly Glu Ile Ala Val Arg Ile Val Arg Ala Cys Ala
20 25 30
Glu Met Gly Ile Arg Ser Val Ala Ile Tyr Ser Asp Ala Asp Arg His
35 40 45
Ala Leu His Val Lys Arg Ala Asp Glu Ala His Ser Ile Gly Ala Glu
50 55 60
Pro Leu Ala Gly Tyr Leu Asn Pro Arg Lys Leu Val Asn Leu Ala Val
65 70 75 80
Glu Thr Gly Cys Asp Ala Leu His Pro Gly Tyr Gly Phe Leu Ser Glu
85 90 95
Asn Ala Glu Leu Ala Asp Ile Cys Ala Glu Arg Gly Ile Lys Phe Ile
100 105 110
Gly Pro Ser Ala Glu Val Ile Arg Arg Met Gly Asp Lys Thr Glu Ala
115 120 125
Arg Arg Ser Met Ile Lys Ala Gly Val Pro Val Thr Pro Gly Thr Glu
130 135 140
Gly Asn Val Ser Gly Ile Glu Glu Ala Leu Ser Glu Gly Asp Arg Ile
145 150 155 160
Gly Tyr Pro Val Met Leu Lys Ala Thr Ser Gly Gly Gly Gly Arg Gly
165 170 175
Ile Arg Arg Cys Asn Ser Arg Glu Glu Leu Glu Gln Asn Phe Pro Arg
180 185 190
Val Ile Ser Glu Ala Thr Lys Ala Phe Gly Ser Ala Glu Val Phe Leu
195 200 205
Glu Lys Cys Ile Val Asn Pro Lys His Ile Glu Ala Gln Ile Leu Gly
210 215 220
Asp Ser Phe Gly Asn Val Val His Leu Phe Glu Arg Asp Cys Ser Ile
225 230 235 240
Gln Arg Arg Asn Gln Lys Leu Ile Glu Ile Ala Pro Ser Pro Gln Leu
245 250 255
Thr Pro Glu Gln Arg Ala Tyr Ile Gly Asp Leu Ser Val Arg Ala Ala
260 265 270
Lys Ala Val Gly Tyr Glu Asn Ala Gly Thr Val Glu Phe Leu Leu Ala
275 280 285
Glu Gly Glu Val Tyr Phe Met Glu Met Asn Thr Arg Val Gln Val Glu
290 295 300
His Thr Ile Thr Glu Glu Ile Thr Gly Ile Asp Ile Val Arg Glu Gln
305 310 315 320
Ile Arg Ile Ala Ser Gly Leu Pro Leu Ser Val Lys Gln Glu Asp Ile
325 330 335
Gln His Arg Gly Phe Ala Leu Gln Phe Arg Ile Asn Ala Glu Asp Pro
340 345 350
Lys Asn Asn Phe Leu Pro Ser Phe Gly Lys Ile Thr Arg Tyr Tyr Ala
355 360 365
Pro Gly Gly Pro Gly Val Arg Thr Asp Thr Ala Ile Tyr Thr Gly Tyr
370 375 380
Thr Ile Pro Pro Phe Tyr Asp Ser Met Cys Leu Lys Leu Val Val Trp
385 390 395 400
Ala Leu Thr Trp Glu Glu Ala Met Asp Arg Gly Leu Arg Ala Leu Asp
405 410 415
Asp Met Arg Leu Gln Gly Val Lys Thr Thr Ala Ala Tyr Tyr Gln Glu
420 425 430
Ile Leu Arg Asn Pro Glu Phe Arg Ser Gly Gln Phe Asn Thr Ser Phe
435 440 445
Val Glu Ser His Pro Glu Leu Thr Asn Tyr Ser Ile Lys Arg Lys Pro
450 455 460
Glu Glu Leu Ala Leu Ala Ile Ala Ala Ala Ile Ala Ala His Ala Gly
465 470 475 480
Leu
<210> 7
<211> 1140
<212> PRT
<213> 谷氨酸棒杆菌
<400> 7
Met Ser Thr His Thr Ser Ser Thr Leu Pro Ala Phe Lys Lys Ile Leu
1 5 10 15
Val Ala Asn Arg Gly Glu Ile Ala Val Arg Ala Phe Arg Ala Ala Leu
20 25 30
Glu Thr Gly Ala Ala Thr Val Ala Ile Tyr Pro Arg Glu Asp Arg Gly
35 40 45
Ser Phe His Arg Ser Phe Ala Ser Glu Ala Val Arg Ile Gly Thr Glu
50 55 60
Gly Ser Pro Val Lys Ala Tyr Leu Asp Ile Asp Glu Ile Ile Gly Ala
65 70 75 80
Ala Lys Lys Val Lys Ala Asp Ala Ile Tyr Pro Gly Tyr Gly Phe Leu
85 90 95
Ser Glu Asn Ala Gln Leu Ala Arg Glu Cys Ala Glu Asn Gly Ile Thr
100 105 110
Phe Ile Gly Pro Thr Pro Glu Val Leu Asp Leu Thr Gly Asp Lys Ser
115 120 125
Arg Ala Val Thr Ala Ala Lys Lys Ala Gly Leu Pro Val Leu Ala Glu
130 135 140
Ser Thr Pro Ser Lys Asn Ile Asp Glu Ile Val Lys Ser Ala Glu Gly
145 150 155 160
Gln Thr Tyr Pro Ile Phe Val Lys Ala Val Ala Gly Gly Gly Gly Arg
165 170 175
Gly Met Arg Phe Val Ala Ser Pro Asp Glu Leu Arg Lys Leu Ala Thr
180 185 190
Glu Ala Ser Arg Glu Ala Glu Ala Ala Phe Gly Asp Gly Ala Val Tyr
195 200 205
Val Glu Arg Ala Val Ile Asn Pro Gln His Ile Glu Val Gln Ile Leu
210 215 220
Gly Asp His Thr Gly Glu Val Val His Leu Tyr Glu Arg Asp Cys Ser
225 230 235 240
Leu Gln Arg Arg His Gln Lys Val Val Glu Ile Ala Pro Ala Gln His
245 250 255
Leu Asp Pro Glu Leu Arg Asp Arg Ile Cys Ala Asp Ala Val Lys Phe
260 265 270
Cys Arg Ser Ile Gly Tyr Gln Gly Ala Gly Thr Val Glu Phe Leu Val
275 280 285
Asp Glu Lys Gly Asn His Val Phe Ile Glu Met Asn Pro Arg Ile Gln
290 295 300
Val Glu His Thr Val Thr Glu Glu Val Thr Glu Val Asp Leu Val Lys
305 310 315 320
Ala Gln Met Arg Leu Ala Ala Gly Ala Thr Leu Lys Glu Leu Gly Leu
325 330 335
Thr Gln Asp Lys Ile Lys Thr His Gly Ala Ala Leu Gln Cys Arg Ile
340 345 350
Thr Thr Glu Asp Pro Asn Asn Gly Phe Arg Pro Asp Thr Gly Thr Ile
355 360 365
Thr Ala Tyr Arg Ser Pro Gly Gly Ala Gly Val Arg Leu Asp Gly Ala
370 375 380
Ala Gln Leu Gly Gly Glu Ile Thr Ala His Phe Asp Ser Met Leu Val
385 390 395 400
Lys Met Thr Cys Arg Gly Ser Asp Phe Glu Thr Ala Val Ala Arg Ala
405 410 415
Gln Arg Ala Leu Ala Glu Phe Thr Val Ser Gly Val Ala Thr Asn Ile
420 425 430
Gly Phe Leu Arg Ala Leu Leu Arg Glu Glu Asp Phe Thr Ser Lys Arg
435 440 445
Ile Ala Thr Gly Phe Ile Ala Asp His Pro His Leu Leu Gln Ala Pro
450 455 460
Pro Ala Asp Asp Glu Gln Gly Arg Ile Leu Asp Tyr Leu Ala Asp Val
465 470 475 480
Thr Val Asn Lys Pro His Gly Val Arg Pro Lys Asp Val Ala Ala Pro
485 490 495
Ile Asp Lys Leu Pro Asn Ile Lys Asp Leu Pro Leu Pro Arg Gly Ser
500 505 510
Arg Asp Arg Leu Lys Gln Leu Gly Pro Ala Ala Phe Ala Arg Asp Leu
515 520 525
Arg Glu Gln Asp Ala Leu Ala Val Thr Asp Thr Thr Phe Arg Asp Ala
530 535 540
His Gln Ser Leu Leu Ala Thr Arg Val Arg Ser Phe Ala Leu Lys Pro
545 550 555 560
Ala Ala Glu Ala Val Ala Lys Leu Thr Pro Glu Leu Leu Ser Val Glu
565 570 575
Ala Trp Gly Gly Ala Thr Tyr Asp Val Ala Met Arg Phe Leu Phe Glu
580 585 590
Asp Pro Trp Asp Arg Leu Asp Glu Leu Arg Glu Ala Met Pro Asn Val
595 600 605
Asn Ile Gln Met Leu Leu Arg Gly Arg Asn Thr Val Gly Tyr Thr Pro
610 615 620
Tyr Pro Asp Ser Val Cys Arg Ala Phe Val Lys Glu Ala Ala Ser Ser
625 630 635 640
Gly Val Asp Ile Phe Arg Ile Phe Asp Ala Leu Asn Asp Val Ser Gln
645 650 655
Met Arg Pro Ala Ile Asp Ala Val Leu Glu Thr Asn Thr Ala Val Ala
660 665 670
Glu Val Ala Met Ala Tyr Ser Gly Asp Leu Ser Asp Pro Asn Glu Lys
675 680 685
Leu Tyr Thr Leu Asp Tyr Tyr Leu Lys Met Ala Glu Glu Ile Val Lys
690 695 700
Ser Gly Ala His Ile Leu Ala Ile Lys Asp Met Ala Gly Leu Leu Arg
705 710 715 720
Pro Ala Ala Val Thr Lys Leu Val Thr Ala Leu Arg Arg Glu Phe Asp
725 730 735
Leu Pro Val His Val His Thr His Asp Thr Ala Gly Gly Gln Leu Ala
740 745 750
Thr Tyr Phe Ala Ala Ala Gln Ala Gly Ala Asp Ala Val Asp Gly Ala
755 760 765
Ser Ala Pro Leu Ser Gly Thr Thr Ser Gln Pro Ser Leu Ser Ala Ile
770 775 780
Val Ala Ala Phe Ala His Thr Arg Arg Asp Thr Gly Leu Ser Leu Glu
785 790 795 800
Ala Val Ser Asp Leu Glu Pro Tyr Trp Glu Ala Val Arg Gly Leu Tyr
805 810 815
Leu Pro Phe Glu Ser Gly Thr Pro Gly Pro Thr Gly Arg Val Tyr Arg
820 825 830
His Glu Ile Pro Gly Gly Gln Leu Ser Asn Leu Arg Ala Gln Ala Thr
835 840 845
Ala Leu Gly Leu Ala Asp Arg Phe Glu Leu Ile Glu Asp Asn Tyr Ala
850 855 860
Ala Val Asn Glu Met Leu Gly Arg Pro Thr Lys Val Thr Pro Ser Ser
865 870 875 880
Lys Val Val Gly Asp Leu Ala Leu His Leu Val Gly Ala Gly Val Asp
885 890 895
Pro Ala Asp Phe Ala Ala Asp Pro Gln Lys Tyr Asp Ile Pro Asp Ser
900 905 910
Val Ile Ala Phe Leu Arg Gly Glu Leu Gly Asn Pro Pro Gly Gly Trp
915 920 925
Pro Glu Pro Leu Arg Thr Arg Ala Leu Glu Gly Arg Ser Glu Gly Lys
930 935 940
Ala Pro Leu Thr Glu Val Pro Glu Glu Glu Gln Ala His Leu Asp Ala
945 950 955 960
Asp Asp Ser Lys Glu Arg Arg Asn Ser Leu Asn Arg Leu Leu Phe Pro
965 970 975
Lys Pro Thr Glu Glu Phe Leu Glu His Arg Arg Arg Phe Gly Asn Thr
980 985 990
Ser Ala Leu Asp Asp Arg Glu Phe Phe Tyr Gly Leu Val Glu Gly Arg
995 1000 1005
Glu Thr Leu Ile Arg Leu Pro Asp Val Arg Thr Pro Leu Leu Val
1010 1015 1020
Arg Leu Asp Ala Ile Ser Glu Pro Asp Asp Lys Gly Met Arg Asn
1025 1030 1035
Val Val Ala Asn Val Asn Gly Gln Ile Arg Pro Met Arg Val Arg
1040 1045 1050
Asp Arg Ser Val Glu Ser Val Thr Ala Thr Ala Glu Lys Ala Asp
1055 1060 1065
Ser Ser Asn Lys Gly His Val Ala Ala Pro Phe Ala Gly Val Val
1070 1075 1080
Thr Val Thr Val Ala Glu Gly Asp Glu Val Lys Ala Gly Asp Ala
1085 1090 1095
Val Ala Ile Ile Glu Ala Met Lys Met Glu Ala Thr Ile Thr Ala
1100 1105 1110
Ser Val Asp Gly Lys Ile Asp Arg Val Val Val Pro Ala Ala Thr
1115 1120 1125
Lys Val Glu Gly Gly Asp Leu Ile Val Val Val Ser
1130 1135 1140
<210> 8
<211> 1152
<212> PRT
<213> 苜蓿中华根瘤菌
<400> 8
Met Ser Ile Ser Lys Ile Leu Val Ala Asn Arg Ser Glu Ile Ala Ile
1 5 10 15
Arg Val Phe Arg Ala Ala Asn Glu Leu Gly Leu Lys Thr Val Ala Ile
20 25 30
Trp Ala Glu Glu Asp Lys Leu Ala Leu His Arg Phe Lys Ala Asp Glu
35 40 45
Ser Tyr Gln Val Gly Arg Gly Pro His Leu Pro Arg Asp Leu Gly Pro
50 55 60
Ile Met Ser Tyr Leu Ser Ile Asp Glu Val Ile Arg Val Ala Lys Leu
65 70 75 80
Ser Gly Ala Asp Ala Ile His Pro Gly Tyr Gly Leu Leu Ser Glu Ser
85 90 95
Pro Glu Phe Ala Glu Ala Cys Ala Ala Asn Gly Ile Thr Phe Ile Gly
100 105 110
Pro Lys Pro Glu Thr Met Arg Gln Leu Gly Asn Lys Val Ala Ala Arg
115 120 125
Asn Leu Ala Ile Ser Ile Gly Val Pro Val Val Pro Ala Thr Glu Pro
130 135 140
Leu Pro Asp Asp Pro Glu Glu Ile Lys Arg Leu Ala Glu Glu Ile Gly
145 150 155 160
Tyr Pro Val Met Leu Lys Ala Ser Trp Gly Gly Gly Gly Arg Gly Met
165 170 175
Arg Ala Ile Arg Asp Pro Lys Asp Leu Ile Arg Glu Val Thr Glu Ala
180 185 190
Lys Arg Glu Ala Lys Ala Ala Phe Gly Lys Asp Glu Val Tyr Leu Glu
195 200 205
Lys Leu Val Glu Arg Ala Arg His Val Glu Ser Gln Ile Leu Gly Asp
210 215 220
Thr His Gly Asn Val Val His Leu Phe Glu Arg Asp Cys Ser Ile Gln
225 230 235 240
Arg Arg Asn Gln Lys Val Val Glu Arg Ala Pro Ala Pro Tyr Leu Asn
245 250 255
Asp Ala Gln Arg Gln Glu Leu Ala Asp Tyr Ser Leu Lys Ile Ala Arg
260 265 270
Ala Thr Asn Tyr Ile Gly Ala Gly Thr Val Glu Tyr Leu Met Asp Ser
275 280 285
Asp Thr Gly Lys Phe Tyr Phe Ile Glu Val Asn Pro Arg Ile Gln Val
290 295 300
Glu His Thr Val Thr Glu Val Val Thr Gly Ile Asp Ile Val Lys Ala
305 310 315 320
Gln Ile His Ile Leu Asp Gly Phe Ala Ile Gly Ala Pro Glu Ser Gly
325 330 335
Val Pro Arg Gln Glu Asp Ile Arg Leu Asn Gly His Ala Leu Gln Cys
340 345 350
Arg Ile Thr Thr Glu Asp Pro Glu Gln Asn Phe Ile Pro Asp Tyr Gly
355 360 365
Arg Ile Thr Ala Tyr Arg Gly Ala Thr Gly Phe Gly Ile Arg Leu Asp
370 375 380
Gly Gly Thr Ala Tyr Ser Gly Ala Val Ile Thr Arg Tyr Tyr Asp Pro
385 390 395 400
Leu Leu Glu Lys Val Thr Ala Trp Ala Pro Asn Pro Gly Glu Ala Ile
405 410 415
Gln Arg Met Ile Arg Ala Leu Arg Glu Phe Arg Ile Arg Gly Val Ala
420 425 430
Thr Asn Leu Thr Phe Leu Glu Ala Ile Ile Ser His Pro Lys Phe His
435 440 445
Asp Asn Ser Tyr Thr Thr Arg Phe Ile Asp Thr Thr Pro Glu Leu Phe
450 455 460
Gln Gln Val Lys Arg Gln Asp Arg Ala Thr Lys Leu Leu Thr Tyr Leu
465 470 475 480
Ala Asp Val Thr Val Asn Gly His Pro Glu Val Lys Gly Arg Pro Lys
485 490 495
Pro Ser Asp Asp Ile Ala Ala Pro Val Val Pro Phe Thr Gly Gly Asp
500 505 510
Val Lys Pro Gly Thr Lys Gln Arg Leu Asp Gln Leu Gly Pro Lys Lys
515 520 525
Phe Ala Glu Trp Val Lys Ala Gln Pro Glu Val Leu Ile Thr Asp Thr
530 535 540
Thr Met Arg Asp Gly His Gln Ser Leu Leu Ala Thr Arg Met Arg Thr
545 550 555 560
Tyr Asp Ile Ala Arg Ile Ala Gly Thr Tyr Ala Arg Ala Leu Pro Asn
565 570 575
Leu Phe Ser Leu Glu Cys Trp Gly Gly Ala Thr Phe Asp Val Ser Met
580 585 590
Arg Phe Leu Thr Glu Asp Pro Trp Glu Arg Leu Ala Met Val Arg Glu
595 600 605
Gly Ala Pro Asn Leu Leu Leu Gln Met Leu Leu Arg Gly Ala Asn Gly
610 615 620
Val Gly Tyr Lys Asn Tyr Pro Asp Asn Val Val Lys Tyr Phe Val Arg
625 630 635 640
Gln Ala Ala Lys Gly Gly Ile Asp Val Phe Arg Val Phe Asp Cys Leu
645 650 655
Asn Trp Val Glu Asn Met Arg Val Ala Met Asp Ala Val Ala Glu Glu
660 665 670
Asp Arg Ile Cys Glu Ala Ala Ile Cys Tyr Thr Gly Asp Ile Leu Asn
675 680 685
Ser Ala Arg Pro Lys Tyr Asp Leu Lys Tyr Tyr Thr Ala Leu Ala Ala
690 695 700
Glu Leu Glu Lys Ala Gly Ala His Met Ile Ala Val Lys Asp Met Ala
705 710 715 720
Gly Leu Leu Lys Pro Ala Ala Ala Arg Val Leu Phe Lys Ala Leu Lys
725 730 735
Glu Ala Thr Gly Leu Pro Ile His Phe His Thr His Asp Thr Ser Gly
740 745 750
Ile Ala Ala Ala Thr Val Leu Ala Ala Val Glu Ser Gly Val Asp Val
755 760 765
Val Asp Ala Ala Met Asp Ala Leu Ser Gly Asn Thr Ser Gln Pro Cys
770 775 780
Leu Gly Ser Ile Val Glu Ala Leu Ser Gly Ser Glu Arg Asp Pro Gly
785 790 795 800
Leu Asp Pro Glu Trp Ile Arg Arg Ile Ser Phe Tyr Trp Glu Ala Val
805 810 815
Arg His Gln Tyr Ala Ala Phe Glu Ser Asp Leu Lys Gly Pro Ala Ser
820 825 830
Glu Val Tyr Leu His Glu Met Pro Gly Gly Gln Phe Thr Asn Leu Lys
835 840 845
Glu Gln Ala Arg Ser Leu Gly Leu Glu Thr Arg Trp His Glu Val Ala
850 855 860
Gln Ala Tyr Ala Asp Ala Asn Arg Met Phe Gly Asp Ile Val Lys Val
865 870 875 880
Thr Pro Ser Ser Lys Val Val Gly Asp Met Ala Leu Met Met Val Ser
885 890 895
Gln Asp Leu Thr Val Ala Asp Val Glu Asn Pro Gly Lys Asp Ile Ala
900 905 910
Phe Pro Glu Ser Val Val Ser Met Leu Lys Gly Asp Leu Gly Gln Pro
915 920 925
Pro Gly Gly Trp Pro Glu Ala Leu Gln Lys Lys Ala Leu Lys Gly Glu
930 935 940
Glu Pro Tyr Asp Ala Arg Pro Gly Ser Leu Leu Glu Asp Ala Asp Leu
945 950 955 960
Asp Ala Glu Arg Lys Gly Ile Glu Glu Lys Leu Gly Arg Glu Val Thr
965 970 975
Asp Phe Glu Phe Ala Ser Tyr Leu Met Tyr Pro Lys Val Phe Thr Asp
980 985 990
Tyr Ala Val Ala Cys Glu Thr Tyr Gly Pro Val Ser Val Leu Pro Thr
995 1000 1005
Pro Ala Tyr Phe Tyr Gly Met Ala Pro Gly Glu Glu Leu Phe Ala
1010 1015 1020
Asp Ile Glu Lys Gly Lys Thr Leu Val Ile Leu Asn Gln Ala Gln
1025 1030 1035
Gly Glu Ile Asp Glu Lys Gly Met Val Lys Met Phe Phe Glu Met
1040 1045 1050
Asn Gly Gln Pro Arg Ser Ile Lys Val Pro Asp Arg Asn Arg Gly
1055 1060 1065
Ala Ser Ala Ala Val Arg Arg Lys Ala Glu Ala Gly Asn Ala Ala
1070 1075 1080
His Leu Gly Ala Pro Met Pro Gly Val Ile Ser Thr Val Ala Val
1085 1090 1095
Ala Ser Gly Gln Ser Val Lys Ala Gly Asp Val Leu Leu Ser Ile
1100 1105 1110
Glu Ala Met Lys Met Glu Thr Ala Leu His Ala Glu Lys Asp Gly
1115 1120 1125
Val Ile Ser Glu Val Leu Val Arg Ala Gly Asp Gln Ile Asp Ala
1130 1135 1140
Lys Asp Leu Leu Val Val Phe Gly Gly
1145 1150
<210> 9
<211> 2652
<212> DNA
<213> 大肠杆菌
<400> 9
atgaacgaac aatattccgc attgcgtagt aatgtcagta tgctcggcaa agtgctggga 60
gaaaccatca aggatgcgtt gggagaacac attcttgaac gcgtagaaac tatccgtaag 120
ttgtcgaaat cttcacgcgc tggcaatgat gctaaccgcc aggagttgct caccacctta 180
caaaatttgt cgaacgacga gctgctgccc gttgcgcgtg cgtttagtca gttcctgaac 240
ctggccaaca ccgccgagca ataccacagc atttcgccga aaggcgaagc tgccagcaac 300
ccggaagtga tcgcccgcac cctgcgtaaa ctgaaaaacc agccggaact gagcgaagac 360
accatcaaaa aagcagtgga atcgctgtcg ctggaactgg tcctcacggc tcacccaacc 420
gaaattaccc gtcgtacact gatccacaaa atggtggaag tgaacgcctg tttaaaacag 480
ctcgataaca aagatatcgc tgactacgaa cacaaccagc tgatgcgtcg cctgcgccag 540
ttgatcgccc agtcatggca taccgatgaa atccgtaagc tgcgtccaag cccggtagat 600
gaagccaaat ggggctttgc cgtagtggaa aacagcctgt ggcaaggcgt accaaattac 660
ctgcgcgaac tgaacgaaca actggaagag aacctcggct acaaactgcc cgtcgaattt 720
gttccggtcc gttttacttc gtggatgggc ggcgaccgcg acggcaaccc gaacgtcact 780
gccgatatca cccgccacgt cctgctactc agccgctgga aagccaccga tttgttcctg 840
aaagatattc aggtgctggt ttctgaactg tcgatggttg aagcgacccc tgaactgctg 900
gcgctggttg gcgaagaagg tgccgcagaa ccgtatcgct atctgatgaa aaacctgcgt 960
tctcgcctga tggcgacaca ggcatggctg gaagcgcgcc tgaaaggcga agaactgcca 1020
aaaccagaag gcctgctgac acaaaacgaa gaactgtggg aaccgctcta cgcttgctac 1080
cagtcacttc aggcgtgtgg catgggtatt atcgccaacg gcgatctgct cgacaccctg 1140
cgccgcgtga aatgtttcgg cgtaccgctg gtccgtattg atatccgtca ggagagcacg 1200
cgtcataccg aagcgctggg cgagctgacc cgctacctcg gtatcggcga ctacgaaagc 1260
tggtcagagg ccgacaaaca ggcgttcctg atccgcgaac tgaactccaa acgtccgctt 1320
ctgccgcgca actggcaacc aagcgccgaa acgcgcgaag tgctcgatac ctgccaggtg 1380
attgccgaag caccgcaagg ctccattgcc gcctacgtga tctcgatggc gaaaacgccg 1440
tccgacgtac tggctgtcca cctgctgctg aaagaagcgg gtatcgggtt tgcgatgccg 1500
gttgctccgc tgtttgaaac cctcgatgat ctgaacaacg ccaacgatgt catgacccag 1560
ctgctcaata ttgactggta tcgtggcctg attcagggca aacagatggt gatgattggc 1620
tattccgact cagcaaaaga tgcgggagtg atggcagctt cctgggcgca atatcaggca 1680
caggatgcat taatcaaaac ctgcgaaaaa gcgggtattg agctgacgtt gttccacggt 1740
cgcggcggtt ccattggtcg cggcggcgca cctgctcatg cggcgctgct gtcacaaccg 1800
ccaggaagcc tgaaaggcgg cctgcgcgta accgaacagg gcgagatgat ccgctttaaa 1860
tatggtctgc cagaaatcac cgtcagcagc ctgtcgcttt ataccggggc gattctggaa 1920
gccaacctgc tgccaccgcc ggagccgaaa gagagctggc gtcgcattat ggatgaactg 1980
tcagtcatct cctgcgatgt ctaccgcggc tacgtacgtg aaaacaaaga ttttgtgcct 2040
tacttccgct ccgctacgcc ggaacaagaa ctgggcaaac tgccgttggg ttcacgtccg 2100
gcgaaacgtc gcccaaccgg cggcgtcgag tcactacgcg ccattccgtg gatcttcgcc 2160
tggacgcaaa accgtctgat gctccccgcc tggctgggtg caggtacggc gctgcaaaaa 2220
gtggtcgaag acggcaaaca gagcgagctg gaggctatgt gccgcgattg gccattcttc 2280
tcgacgcgtc tcggcatgct ggagatggtc ttcgccaaag cagacctgtg gctggcggaa 2340
tactatgacc aacgcctggt agacaaagca ctgtggccgt taggtaaaga gttacgcaac 2400
ctgcaagaag aagacatcaa agtggtgctg gcgattgcca acgattccca tctgatggcc 2460
gatctgccgt ggattgcaga gtctattcag ctacggaata tttacaccga cccgctgaac 2520
gtattgcagg ccgagttgct gcaccgctcc cgccaggcag aaaaagaagg ccaggaaccg 2580
gatcctcgcg tcgaacaagc gttaatggtc actattgccg ggattgcggc aggtatgcgt 2640
aataccggct aa 2652
<210> 10
<211> 883
<212> PRT
<213> 大肠杆菌
<400> 10
Met Asn Glu Gln Tyr Ser Ala Leu Arg Ser Asn Val Ser Met Leu Gly
1 5 10 15
Lys Val Leu Gly Glu Thr Ile Lys Asp Ala Leu Gly Glu His Ile Leu
20 25 30
Glu Arg Val Glu Thr Ile Arg Lys Leu Ser Lys Ser Ser Arg Ala Gly
35 40 45
Asn Asp Ala Asn Arg Gln Glu Leu Leu Thr Thr Leu Gln Asn Leu Ser
50 55 60
Asn Asp Glu Leu Leu Pro Val Ala Arg Ala Phe Ser Gln Phe Leu Asn
65 70 75 80
Leu Ala Asn Thr Ala Glu Gln Tyr His Ser Ile Ser Pro Lys Gly Glu
85 90 95
Ala Ala Ser Asn Pro Glu Val Ile Ala Arg Thr Leu Arg Lys Leu Lys
100 105 110
Asn Gln Pro Glu Leu Ser Glu Asp Thr Ile Lys Lys Ala Val Glu Ser
115 120 125
Leu Ser Leu Glu Leu Val Leu Thr Ala His Pro Thr Glu Ile Thr Arg
130 135 140
Arg Thr Leu Ile His Lys Met Val Glu Val Asn Ala Cys Leu Lys Gln
145 150 155 160
Leu Asp Asn Lys Asp Ile Ala Asp Tyr Glu His Asn Gln Leu Met Arg
165 170 175
Arg Leu Arg Gln Leu Ile Ala Gln Ser Trp His Thr Asp Glu Ile Arg
180 185 190
Lys Leu Arg Pro Ser Pro Val Asp Glu Ala Lys Trp Gly Phe Ala Val
195 200 205
Val Glu Asn Ser Leu Trp Gln Gly Val Pro Asn Tyr Leu Arg Glu Leu
210 215 220
Asn Glu Gln Leu Glu Glu Asn Leu Gly Tyr Lys Leu Pro Val Glu Phe
225 230 235 240
Val Pro Val Arg Phe Thr Ser Trp Met Gly Gly Asp Arg Asp Gly Asn
245 250 255
Pro Asn Val Thr Ala Asp Ile Thr Arg His Val Leu Leu Leu Ser Arg
260 265 270
Trp Lys Ala Thr Asp Leu Phe Leu Lys Asp Ile Gln Val Leu Val Ser
275 280 285
Glu Leu Ser Met Val Glu Ala Thr Pro Glu Leu Leu Ala Leu Val Gly
290 295 300
Glu Glu Gly Ala Ala Glu Pro Tyr Arg Tyr Leu Met Lys Asn Leu Arg
305 310 315 320
Ser Arg Leu Met Ala Thr Gln Ala Trp Leu Glu Ala Arg Leu Lys Gly
325 330 335
Glu Glu Leu Pro Lys Pro Glu Gly Leu Leu Thr Gln Asn Glu Glu Leu
340 345 350
Trp Glu Pro Leu Tyr Ala Cys Tyr Gln Ser Leu Gln Ala Cys Gly Met
355 360 365
Gly Ile Ile Ala Asn Gly Asp Leu Leu Asp Thr Leu Arg Arg Val Lys
370 375 380
Cys Phe Gly Val Pro Leu Val Arg Ile Asp Ile Arg Gln Glu Ser Thr
385 390 395 400
Arg His Thr Glu Ala Leu Gly Glu Leu Thr Arg Tyr Leu Gly Ile Gly
405 410 415
Asp Tyr Glu Ser Trp Ser Glu Ala Asp Lys Gln Ala Phe Leu Ile Arg
420 425 430
Glu Leu Asn Ser Lys Arg Pro Leu Leu Pro Arg Asn Trp Gln Pro Ser
435 440 445
Ala Glu Thr Arg Glu Val Leu Asp Thr Cys Gln Val Ile Ala Glu Ala
450 455 460
Pro Gln Gly Ser Ile Ala Ala Tyr Val Ile Ser Met Ala Lys Thr Pro
465 470 475 480
Ser Asp Val Leu Ala Val His Leu Leu Leu Lys Glu Ala Gly Ile Gly
485 490 495
Phe Ala Met Pro Val Ala Pro Leu Phe Glu Thr Leu Asp Asp Leu Asn
500 505 510
Asn Ala Asn Asp Val Met Thr Gln Leu Leu Asn Ile Asp Trp Tyr Arg
515 520 525
Gly Leu Ile Gln Gly Lys Gln Met Val Met Ile Gly Tyr Ser Asp Ser
530 535 540
Ala Lys Asp Ala Gly Val Met Ala Ala Ser Trp Ala Gln Tyr Gln Ala
545 550 555 560
Gln Asp Ala Leu Ile Lys Thr Cys Glu Lys Ala Gly Ile Glu Leu Thr
565 570 575
Leu Phe His Gly Arg Gly Gly Ser Ile Gly Arg Gly Gly Ala Pro Ala
580 585 590
His Ala Ala Leu Leu Ser Gln Pro Pro Gly Ser Leu Lys Gly Gly Leu
595 600 605
Arg Val Thr Glu Gln Gly Glu Met Ile Arg Phe Lys Tyr Gly Leu Pro
610 615 620
Glu Ile Thr Val Ser Ser Leu Ser Leu Tyr Thr Gly Ala Ile Leu Glu
625 630 635 640
Ala Asn Leu Leu Pro Pro Pro Glu Pro Lys Glu Ser Trp Arg Arg Ile
645 650 655
Met Asp Glu Leu Ser Val Ile Ser Cys Asp Val Tyr Arg Gly Tyr Val
660 665 670
Arg Glu Asn Lys Asp Phe Val Pro Tyr Phe Arg Ser Ala Thr Pro Glu
675 680 685
Gln Glu Leu Gly Lys Leu Pro Leu Gly Ser Arg Pro Ala Lys Arg Arg
690 695 700
Pro Thr Gly Gly Val Glu Ser Leu Arg Ala Ile Pro Trp Ile Phe Ala
705 710 715 720
Trp Thr Gln Asn Arg Leu Met Leu Pro Ala Trp Leu Gly Ala Gly Thr
725 730 735
Ala Leu Gln Lys Val Val Glu Asp Gly Lys Gln Ser Glu Leu Glu Ala
740 745 750
Met Cys Arg Asp Trp Pro Phe Phe Ser Thr Arg Leu Gly Met Leu Glu
755 760 765
Met Val Phe Ala Lys Ala Asp Leu Trp Leu Ala Glu Tyr Tyr Asp Gln
770 775 780
Arg Leu Val Asp Lys Ala Leu Trp Pro Leu Gly Lys Glu Leu Arg Asn
785 790 795 800
Leu Gln Glu Glu Asp Ile Lys Val Val Leu Ala Ile Ala Asn Asp Ser
805 810 815
His Leu Met Ala Asp Leu Pro Trp Ile Ala Glu Ser Ile Gln Leu Arg
820 825 830
Asn Ile Tyr Thr Asp Pro Leu Asn Val Leu Gln Ala Glu Leu Leu His
835 840 845
Arg Ser Arg Gln Ala Glu Lys Glu Gly Gln Glu Pro Asp Pro Arg Val
850 855 860
Glu Gln Ala Leu Met Val Thr Ile Ala Gly Ile Ala Ala Gly Met Arg
865 870 875 880
Asn Thr Gly
<210> 11
<211> 483
<212> PRT
<213> 嗜热自养甲烷杆菌
<400> 11
Met Lys Val Pro Arg Cys Met Ser Thr Gln His Pro Asp Asn Val Asn
1 5 10 15
Pro Pro Phe Phe Ala Glu Glu Pro Glu Leu Gly Gly Glu Asp Glu Ile
20 25 30
Arg Glu Ala Tyr Tyr Val Phe Ser His Leu Gly Cys Asp Glu Gln Met
35 40 45
Trp Asp Cys Glu Gly Lys Glu Val Asp Asn Tyr Val Val Lys Lys Leu
50 55 60
Leu Thr Lys Tyr Gln Ala Phe Phe Arg Asp His Val Leu Gly Glu Asp
65 70 75 80
Leu Arg Leu Thr Leu Arg Val Pro Asn Pro Thr Val Glu Arg Ala Glu
85 90 95
Ala Lys Ile Leu Leu Glu Thr Leu Glu Ser Ile Pro Arg Ser Tyr Asp
100 105 110
Thr Ala Ser Leu Phe Tyr Gly Met Asp Ala Ala Pro Val Phe Glu Val
115 120 125
Ile Leu Pro Met Thr Ser Ser Ser Ser Cys Leu Asn Arg Ile His Ser
130 135 140
Tyr Tyr Leu Asp Phe Val Lys Gly Lys Glu Arg Leu Gln Leu Ala Asp
145 150 155 160
Gly Val Thr Val Lys Glu Trp Ile Gly Glu Phe Arg Pro Asp Glu Ile
165 170 175
Asn Val Ile Pro Leu Phe Glu Asp His Glu Gly Met Leu Asn Ala Ala
180 185 190
Lys Ile Thr Gly Glu Tyr Leu Asp Gly Lys Asp Ile Gln Glu Gln Arg
195 200 205
Val Phe Leu Ala Arg Ser Asp Pro Ala Met Asn Tyr Gly Met Ile Ser
210 215 220
Ala Thr Leu Leu Asn Arg Ile Ala Leu Ser Asp Phe Arg Asp Leu Glu
225 230 235 240
Glu Glu Ser Gly Val Lys Leu Tyr Pro Ile Ile Gly Met Gly Ser Ala
245 250 255
Pro Phe Arg Gly Asn Leu Arg Pro Asp Asn Val Glu Asp Val Thr Trp
260 265 270
Glu Tyr Arg Gly Ala Tyr Thr Phe Thr Val Gln Ser Ser Phe Lys Tyr
275 280 285
Asp His Glu Pro Ser Asp Val Ile Arg Gly Ile Lys Lys Leu Arg Ser
290 295 300
Val Lys Pro Gly Arg Ala Ala Glu Ile Glu Arg Glu Ser Val Leu Glu
305 310 315 320
Ile Ile Ser Ala Tyr Cys Arg Glu Tyr Arg Arg Gln Val Met Asp Leu
325 330 335
Val Asp Ile Ile Asn Arg Val Ala Arg Tyr Val Pro Gly Arg Arg Lys
340 345 350
Arg Lys Leu His Ile Gly Leu Phe Gly Tyr Ser Arg Ser Met Gly Asn
355 360 365
Val Ser Leu Pro Arg Ala Ile Thr Phe Thr Ala Ala Leu Tyr Ser Leu
370 375 380
Gly Val Pro Pro Glu Leu Leu Gly Phe Asn Ala Leu Ser Ser Gly Asp
385 390 395 400
Leu Glu Phe Ile Glu Glu Val Tyr Pro Gly Leu Gly Arg Asp Leu His
405 410 415
Asp Ala Ala Arg Tyr Ala Asn Pro Glu Ser Pro Phe Leu Ser Pro Glu
420 425 430
Val Lys Ser Ser Phe Glu Glu Tyr Leu Glu Pro Glu Tyr Asp Glu Gly
435 440 445
His Met Lys Thr Thr Glu Glu Ile Ile Arg Ala Leu Arg Ile Asn Arg
450 455 460
Thr Ala Asn Leu Gln Glu Leu Ile Leu Glu Ala Ala Ser Gln Arg Lys
465 470 475 480
Phe Leu Gly
<210> 12
<211> 537
<212> PRT
<213> 产气荚膜梭菌
<400> 12
Met Lys Ile Pro Cys Ser Met Met Thr Gln His Pro Asp Asn Val Glu
1 5 10 15
Thr Tyr Ile Ser Ile Gln Gln Glu Pro Ala Glu Ala Ile Lys Gly Leu
20 25 30
Thr Pro Gln Asp Lys Gly Gly Leu Gly Ile Glu Glu Val Met Ile Asp
35 40 45
Phe Glu Gly Lys Leu Thr Pro Tyr His Gln Thr Ser Gln Ile Ala Leu
50 55 60
Gly Leu Ile Ser Asn Gly Ile Ile Pro Gly Lys Asp Val Arg Val Thr
65 70 75 80
Pro Arg Ile Pro Asn Ala Asn Lys Glu Ser Val Phe Arg Gln Leu Met
85 90 95
Ser Ile Met Ser Ile Ile Glu Thr Asn Val Gln Ser Lys Glu Leu Thr
100 105 110
Gly Thr Pro Ala Ile Ser Glu Val Val Val Pro Met Ile Glu Thr Gly
115 120 125
Lys Glu Ile Ser Glu Phe Gln Asp Arg Val Asn Ser Val Val Asp Met
130 135 140
Gly Asn Lys Asn Tyr Lys Thr Lys Leu Asp Leu Asn Ser Val Arg Ile
145 150 155 160
Ile Pro Leu Val Glu Asp Val Pro Ala Leu Ala Asn Ile Asp Arg Ile
165 170 175
Leu Asp Glu His Tyr Glu Ile Glu Lys Ser Lys Gly His Ile Leu Lys
180 185 190
Asp Leu Arg Ile Met Ile Ala Arg Ser Asp Thr Ala Met Ser Tyr Gly
195 200 205
Leu Ile Ser Gly Val Leu Ser Val Leu Met Ala Val Asp Gly Ala Tyr
210 215 220
Lys Trp Gly Glu Lys His Gly Val Thr Ile Ser Pro Ile Leu Gly Cys
225 230 235 240
Gly Ser Leu Pro Phe Arg Gly His Phe Ser Glu Glu Asn Ile Asp Glu
245 250 255
Ile Leu Ala Thr Tyr Ser Gly Ile Lys Thr Phe Thr Phe Gln Ser Ala
260 265 270
Leu Arg Tyr Asp His Gly Glu Glu Ala Thr Lys His Ala Val Arg Glu
275 280 285
Leu Lys Glu Lys Ile Ala Gln Ser Lys Pro Arg Asn Phe Ser Glu Glu
290 295 300
Asp Lys Asp Leu Met Lys Glu Phe Ile Gly Ile Cys Ser Lys His Tyr
305 310 315 320
Leu Gln Thr Phe Leu Lys Val Ile Asp Thr Val Ser Phe Val Ser Asp
325 330 335
Phe Ile Pro Lys Asn Arg Asp Arg Leu Thr Lys Ala Lys Thr Gly Leu
340 345 350
Glu Tyr Asn Arg Glu Val Ala Asn Leu Asp Asn Val Ala Asp Leu Val
355 360 365
Lys Asp Glu Val Leu Lys Gln Glu Ile Leu Ser Ile Asp Asn Ser Lys
370 375 380
Glu Tyr Ala Val Pro Arg Ala Ile Ser Phe Thr Gly Ala Met Tyr Thr
385 390 395 400
Leu Gly Met Pro Pro Glu Leu Met Gly Met Gly Arg Ala Leu Asn Glu
405 410 415
Ile Lys Thr Lys Tyr Gly Gln Glu Gly Ile Asp Lys Leu Leu Glu Ile
420 425 430
Tyr Pro Ile Leu Arg Lys Asp Leu Ala Phe Ala Ala Arg Phe Ala Asn
435 440 445
Gly Gly Val Ser Lys Lys Ile Ile Asp Glu Glu Ala Arg Gln Glu Tyr
450 455 460
Lys Glu Asp Met Lys Tyr Val Asn Glu Ile Leu Asn Leu Gly Leu Asp
465 470 475 480
Tyr Asp Phe Leu Asn Glu Asn Glu Phe Tyr His Thr Leu Leu Lys Thr
485 490 495
Thr Lys Pro Ile Ile Met His Leu Met Gly Leu Glu Glu Asn Val Met
500 505 510
Arg Asn Ser Thr Glu Glu Leu Lys Ile Leu Asn Glu Trp Ile Val Arg
515 520 525
Met Gly Lys Val Arg Gly Ser Ile Gly
530 535
<210> 13
<211> 1260
<212> DNA
<213> 东方伊萨酵母
<400> 13
atgtccagag gcttctttac tgagaacatt acgcaattgc caccagaccc tttgtttggt 60
cttaaggcca ggttcagcaa tgactcacgt gaaaacaagg tcgatttagg tattggggca 120
tatagggacg acaacggtaa gccatggatc ttaccatctg tcaggttggc cgaaaacttg 180
attcagaact ccccagacta caaccatgag tacctaccaa tcggtggact tgctgatttc 240
acttctgctg cggcaagagt tgtatttgga ggcgattcta aagccatttc gcaaaaccgt 300
cttgtctcca tccagagttt gtcaggtaca ggtgccttac atgttgctgg tctatttatc 360
aagcgccaat acaagtctct tgatggcact tccgaagacc ctctaatata tctatcggaa 420
cctacatggg ccaaccacgt tcaaatcttt gaagttattg gtctcaagcc tgtattctat 480
ccatattggc atgccgcaag caagaccttg gatctgaagg gctacttaaa ggcaataaac 540
gatgctccag aagggtcggt ttttgtattg catgcaacgg ctcataaccc tactggtttg 600
gatccaacac aagaacaatg gatggagatt ttggccgcta taagtgccaa aaagcatctg 660
ccattatttg attgtgcata tcagggtttc acctccgggt ctctagatag agatgcttgg 720
gctgttcgag aagctgtcaa caatgacaag tacgaattcc cgggaattat tgtctgtcaa 780
tcgtttgcga aaaatgttgg catgtatggt gaacggattg gtgcagttca tattgttcta 840
cctgaatcag acgcttccct aaacagcgcc atcttctccc aattgcaaaa gacaatcaga 900
tcggagattt ccaatccacc aggatacggt gcaaagattg tgtctaaagt tttgaacact 960
ccggaacttt acaaacagtg ggagcaagat ttgatcacca tgtcttcgag aatcactgca 1020
atgagaaagg agctagtaaa tgagctcgag cgtcttggaa cccctggcac ttggagacac 1080
atcaccgagc aacagggtat gttttccttt actggtttga acccggagca ggttgccaag 1140
ctagagaagg agcatggtgt ttatcttgtt cgtagtggac gtgcaagtat tgcaggcctc 1200
aacatgggaa acgtcaagta tgttgccaag gccattgact ctgtcgtgag agacctttag 1260
<210> 14
<211> 419
<212> PRT
<213> 东方伊萨酵母
<400> 14
Met Ser Arg Gly Phe Phe Thr Glu Asn Ile Thr Gln Leu Pro Pro Asp
1 5 10 15
Pro Leu Phe Gly Leu Lys Ala Arg Phe Ser Asn Asp Ser Arg Glu Asn
20 25 30
Lys Val Asp Leu Gly Ile Gly Ala Tyr Arg Asp Asp Asn Gly Lys Pro
35 40 45
Trp Ile Leu Pro Ser Val Arg Leu Ala Glu Asn Leu Ile Gln Asn Ser
50 55 60
Pro Asp Tyr Asn His Glu Tyr Leu Pro Ile Gly Gly Leu Ala Asp Phe
65 70 75 80
Thr Ser Ala Ala Ala Arg Val Val Phe Gly Gly Asp Ser Lys Ala Ile
85 90 95
Ser Gln Asn Arg Leu Val Ser Ile Gln Ser Leu Ser Gly Thr Gly Ala
100 105 110
Leu His Val Ala Gly Leu Phe Ile Lys Arg Gln Tyr Lys Ser Leu Asp
115 120 125
Gly Thr Ser Glu Asp Pro Leu Ile Tyr Leu Ser Glu Pro Thr Trp Ala
130 135 140
Asn His Val Gln Ile Phe Glu Val Ile Gly Leu Lys Pro Val Phe Tyr
145 150 155 160
Pro Tyr Trp His Ala Ala Ser Lys Thr Leu Asp Leu Lys Gly Tyr Leu
165 170 175
Lys Ala Ile Asn Asp Ala Pro Glu Gly Ser Val Phe Val Leu His Ala
180 185 190
Thr Ala His Asn Pro Thr Gly Leu Asp Pro Thr Gln Glu Gln Trp Met
195 200 205
Glu Ile Leu Ala Ala Ile Ser Ala Lys Lys His Leu Pro Leu Phe Asp
210 215 220
Cys Ala Tyr Gln Gly Phe Thr Ser Gly Ser Leu Asp Arg Asp Ala Trp
225 230 235 240
Ala Val Arg Glu Ala Val Asn Asn Asp Lys Tyr Glu Phe Pro Gly Ile
245 250 255
Ile Val Cys Gln Ser Phe Ala Lys Asn Val Gly Met Tyr Gly Glu Arg
260 265 270
Ile Gly Ala Val His Ile Val Leu Pro Glu Ser Asp Ala Ser Leu Asn
275 280 285
Ser Ala Ile Phe Ser Gln Leu Gln Lys Thr Ile Arg Ser Glu Ile Ser
290 295 300
Asn Pro Pro Gly Tyr Gly Ala Lys Ile Val Ser Lys Val Leu Asn Thr
305 310 315 320
Pro Glu Leu Tyr Lys Gln Trp Glu Gln Asp Leu Ile Thr Met Ser Ser
325 330 335
Arg Ile Thr Ala Met Arg Lys Glu Leu Val Asn Glu Leu Glu Arg Leu
340 345 350
Gly Thr Pro Gly Thr Trp Arg His Ile Thr Glu Gln Gln Gly Met Phe
355 360 365
Ser Phe Thr Gly Leu Asn Pro Glu Gln Val Ala Lys Leu Glu Lys Glu
370 375 380
His Gly Val Tyr Leu Val Arg Ser Gly Arg Ala Ser Ile Ala Gly Leu
385 390 395 400
Asn Met Gly Asn Val Lys Tyr Val Ala Lys Ala Ile Asp Ser Val Val
405 410 415
Arg Asp Leu
<210> 15
<211> 418
<212> PRT
<213> 酿酒酵母
<400> 15
Met Ser Ala Thr Leu Phe Asn Asn Ile Glu Leu Leu Pro Pro Asp Ala
1 5 10 15
Leu Phe Gly Ile Lys Gln Arg Tyr Gly Gln Asp Gln Arg Ala Thr Lys
20 25 30
Val Asp Leu Gly Ile Gly Ala Tyr Arg Asp Asp Asn Gly Lys Pro Trp
35 40 45
Val Leu Pro Ser Val Lys Ala Ala Glu Lys Leu Ile His Asn Asp Ser
50 55 60
Ser Tyr Asn His Glu Tyr Leu Gly Ile Thr Gly Leu Pro Ser Leu Thr
65 70 75 80
Ser Asn Ala Ala Lys Ile Ile Phe Gly Thr Gln Ser Asp Ala Phe Gln
85 90 95
Glu Asp Arg Val Ile Ser Val Gln Ser Leu Ser Gly Thr Gly Ala Leu
100 105 110
His Ile Ser Ala Lys Phe Phe Ser Lys Phe Phe Pro Asp Lys Leu Val
115 120 125
Tyr Leu Ser Lys Pro Thr Trp Ala Asn His Met Ala Ile Phe Glu Asn
130 135 140
Gln Gly Leu Lys Thr Ala Thr Tyr Pro Tyr Trp Ala Asn Glu Thr Lys
145 150 155 160
Ser Leu Asp Leu Asn Gly Phe Leu Asn Ala Ile Gln Lys Ala Pro Glu
165 170 175
Gly Ser Ile Phe Val Leu His Ser Cys Ala His Asn Pro Thr Gly Leu
180 185 190
Asp Pro Thr Ser Glu Gln Trp Val Gln Ile Val Asp Ala Ile Ala Ser
195 200 205
Lys Asn His Ile Ala Leu Phe Asp Thr Ala Tyr Gln Gly Phe Ala Thr
210 215 220
Gly Asp Leu Asp Lys Asp Ala Tyr Ala Val Arg Leu Gly Val Glu Lys
225 230 235 240
Leu Ser Thr Val Ser Pro Val Phe Val Cys Gln Ser Phe Ala Lys Asn
245 250 255
Ala Gly Met Tyr Gly Glu Arg Val Gly Cys Phe His Leu Ala Leu Thr
260 265 270
Lys Gln Ala Gln Asn Lys Thr Ile Lys Pro Ala Val Thr Ser Gln Leu
275 280 285
Ala Lys Ile Ile Arg Ser Glu Val Ser Asn Pro Pro Ala Tyr Gly Ala
290 295 300
Lys Ile Val Ala Lys Leu Leu Glu Thr Pro Glu Leu Thr Glu Gln Trp
305 310 315 320
His Lys Asp Met Val Thr Met Ser Ser Arg Ile Thr Lys Met Arg His
325 330 335
Ala Leu Arg Asp His Leu Val Lys Leu Gly Thr Pro Gly Asn Trp Asp
340 345 350
His Ile Val Asn Gln Cys Gly Met Phe Ser Phe Thr Gly Leu Thr Pro
355 360 365
Gln Met Val Lys Arg Leu Glu Glu Thr His Ala Val Tyr Leu Val Ala
370 375 380
Ser Gly Arg Ala Ser Ile Ala Gly Leu Asn Gln Gly Asn Val Glu Tyr
385 390 395 400
Val Ala Lys Ala Ile Asp Glu Val Val Arg Phe Tyr Thr Ile Glu Ala
405 410 415
Lys Leu
<210> 16
<211> 396
<212> PRT
<213> 大肠杆菌
<400> 16
Met Phe Glu Asn Ile Thr Ala Ala Pro Ala Asp Pro Ile Leu Gly Leu
1 5 10 15
Ala Asp Leu Phe Arg Ala Asp Glu Arg Pro Gly Lys Ile Asn Leu Gly
20 25 30
Ile Gly Val Tyr Lys Asp Glu Thr Gly Lys Thr Pro Val Leu Thr Ser
35 40 45
Val Lys Lys Ala Glu Gln Tyr Leu Leu Glu Asn Glu Thr Thr Lys Asn
50 55 60
Tyr Leu Gly Ile Asp Gly Ile Pro Glu Phe Gly Arg Cys Thr Gln Glu
65 70 75 80
Leu Leu Phe Gly Lys Gly Ser Ala Leu Ile Asn Asp Lys Arg Ala Arg
85 90 95
Thr Ala Gln Thr Pro Gly Gly Thr Gly Ala Leu Arg Val Ala Ala Asp
100 105 110
Phe Leu Ala Lys Asn Thr Ser Val Lys Arg Val Trp Val Ser Asn Pro
115 120 125
Ser Trp Pro Asn His Lys Ser Val Phe Asn Ser Ala Gly Leu Glu Val
130 135 140
Arg Glu Tyr Ala Tyr Tyr Asp Ala Glu Asn His Thr Leu Asp Phe Asp
145 150 155 160
Ala Leu Ile Asn Ser Leu Asn Glu Ala Gln Ala Gly Asp Val Val Leu
165 170 175
Phe His Gly Cys Cys His Asn Pro Thr Gly Ile Asp Pro Thr Leu Glu
180 185 190
Gln Trp Gln Thr Leu Ala Gln Leu Ser Val Glu Lys Gly Trp Leu Pro
195 200 205
Leu Phe Asp Phe Ala Tyr Gln Gly Phe Ala Arg Gly Leu Glu Glu Asp
210 215 220
Ala Glu Gly Leu Arg Ala Phe Ala Ala Met His Lys Glu Leu Ile Val
225 230 235 240
Ala Ser Ser Tyr Ser Lys Asn Phe Gly Leu Tyr Asn Glu Arg Val Gly
245 250 255
Ala Cys Thr Leu Val Ala Ala Asp Ser Glu Thr Val Asp Arg Ala Phe
260 265 270
Ser Gln Met Lys Ala Ala Ile Arg Ala Asn Tyr Ser Asn Pro Pro Ala
275 280 285
His Gly Ala Ser Val Val Ala Thr Ile Leu Ser Asn Asp Ala Leu Arg
290 295 300
Ala Ile Trp Glu Gln Glu Leu Thr Asp Met Arg Gln Arg Ile Gln Arg
305 310 315 320
Met Arg Gln Leu Phe Val Asn Thr Leu Gln Glu Lys Gly Ala Asn Arg
325 330 335
Asp Phe Ser Phe Ile Ile Lys Gln Asn Gly Met Phe Ser Phe Ser Gly
340 345 350
Leu Thr Lys Glu Gln Val Leu Arg Leu Arg Glu Glu Phe Gly Val Tyr
355 360 365
Ala Val Ala Ser Gly Arg Val Asn Val Ala Gly Met Thr Pro Asp Asn
370 375 380
Met Ala Pro Leu Cys Glu Ala Ile Val Ala Val Leu
385 390 395
<210> 17
<211> 139
<212> PRT
<213> 阿维链霉菌
<400> 17
Met Leu Arg Thr Met Phe Lys Ser Lys Ile His Arg Ala Thr Val Thr
1 5 10 15
Gln Ala Asp Leu His Tyr Val Gly Ser Val Thr Ile Asp Ala Asp Leu
20 25 30
Leu Asp Ala Ala Asp Leu Leu Pro Gly Glu Leu Val His Ile Val Asp
35 40 45
Ile Thr Asn Gly Ala Arg Leu Glu Thr Tyr Val Ile Glu Gly Glu Arg
50 55 60
Gly Ser Gly Val Val Gly Ile Asn Gly Ala Ala Ala His Leu Val His
65 70 75 80
Pro Gly Asp Leu Val Ile Ile Ile Ser Tyr Ala Gln Val Ser Asp Ala
85 90 95
Glu Ala Arg Ala Leu Arg Pro Arg Val Val His Val Asp Arg Asp Asn
100 105 110
Arg Val Val Ala Leu Gly Ala Asp Pro Ala Glu Pro Val Pro Gly Ser
115 120 125
Asp Gln Ala Arg Ser Pro Gln Ala Val Thr Ala
130 135
<210> 18
<211> 127
<212> PRT
<213> 丙酮丁醇梭菌
<400> 18
Met His Leu Asn Met Leu Lys Ser Lys Ile His Arg Ala Thr Val Val
1 5 10 15
Gln Ala Asp Leu Asn Tyr Val Gly Ser Ile Thr Ile Asp Arg Asn Leu
20 25 30
Met Asp Lys Ala Asn Ile Leu Glu Tyr Glu Lys Val Glu Ile Ala Asn
35 40 45
Ile Asn Asn Gly Ala Arg Phe Glu Thr Tyr Val Ile Ala Gly Glu Ala
50 55 60
Gly Ser Gly Ile Ile Cys Leu Asn Gly Ala Ala Ala Arg Cys Ala Gln
65 70 75 80
Ala Gly Asp Lys Val Ile Ile Met Cys Tyr Cys Ser Leu Thr Pro Glu
85 90 95
Glu Ala Ser Glu His Arg Pro Lys Val Val Phe Val Asn Asp Asp Asn
100 105 110
Ser Ile Ser Asn Val Thr Glu Tyr Glu Lys His Gly Thr Ile Gly
115 120 125
<210> 19
<211> 1404
<212> DNA
<213> 东方伊萨酵母
<400> 19
atgtctatta gtgaaaaata ttttcctcaa gaacctcaat ctcctgaatt gaaaactgca 60
attccaggtc ctcaatcaaa ggcaaagctc gaggaattat ctgctgtcta tgatacaaag 120
gctgcatatt ttgttaccga ctactacaaa tctcttggta actatattgt ggatgcagat 180
ggcaacaagc tactagattc ttattgccaa atctcttcta tcgcattggg ttacaataat 240
ccagcattat taaaagtagc acattctgat gaaatgacag ttgctttatg taacagacct 300
gctttggcat gttttccatc cactgattac tatgaaatac taaagaaggg attgttgtcc 360
gttgctccaa agggattaga taaggtttgt actgcacaca cgggatctga tgccaatgaa 420
atggcattta aggctgcatt tttgtttcaa gcaagtaaga agagaggtga caaaccattt 480
accagcgaag agctggaatc tgtcatggag aacaagttgc caggcacctc tgacatggtt 540
atcctgtcat ttgaaaaagg gttccatggt agattgtttg gatctttatc taccactaga 600
tctaaagcta ttcacaaact ggatattcct gcgtttgaat ggccaaaggc tccattccct 660
cagttaaagt atcctctgga tcaattccaa gctgaaaaca aagcagaaga agaaagatgt 720
ttgaaggctt tagaggaaat tattgtcaac tctcctgcca aaattgcagc tgcaatcatt 780
gaaccggtcc aatctgaagg tggtgataat catgcttcac cagaattctt ccaaggtatt 840
agagaaatca ccaaaaagca cggtgtcatt cttattgttg atgaagttca aacaggaggt 900
ggtgcttctg gtaagatgtg gttacatgaa cactatggca ttgtcccaga catcatgact 960
ttttctaaaa aaatgcaaaa tgcaggtttc tttttcagtg aagcaggtct tgctggggac 1020
caaccattca gacaattcaa tacctggtgc ggtgatccat caaaagctct aattgcaaga 1080
accataattg aagaaattaa agataagaac ctattgacta gtgttaccga aacaggtgac 1140
tacctatatt caaagctcga agcaatttca gcaaagtatg acaaaatgat caacttgaga 1200
ggtaagggaa gaggtttctt tattgcattt gatgccccaa caccggagtt aagaaacaaa 1260
tttattgctg aatgtaagaa attaggttta aacattggtg gatgcggtga acaaggtgtt 1320
agattgagac ctgcattagt ttttgaaaag aagcatgctg atatcttagc ctccattatt 1380
gatcaagctt tttccaaaat ttaa 1404
<210> 20
<211> 467
<212> PRT
<213> 东方伊萨酵母
<400> 20
Met Ser Ile Ser Glu Lys Tyr Phe Pro Gln Glu Pro Gln Ser Pro Glu
1 5 10 15
Leu Lys Thr Ala Ile Pro Gly Pro Gln Ser Lys Ala Lys Leu Glu Glu
20 25 30
Leu Ser Ala Val Tyr Asp Thr Lys Ala Ala Tyr Phe Val Thr Asp Tyr
35 40 45
Tyr Lys Ser Leu Gly Asn Tyr Ile Val Asp Ala Asp Gly Asn Lys Leu
50 55 60
Leu Asp Ser Tyr Cys Gln Ile Ser Ser Ile Ala Leu Gly Tyr Asn Asn
65 70 75 80
Pro Ala Leu Leu Lys Val Ala His Ser Asp Glu Met Thr Val Ala Leu
85 90 95
Cys Asn Arg Pro Ala Leu Ala Cys Phe Pro Ser Thr Asp Tyr Tyr Glu
100 105 110
Ile Leu Lys Lys Gly Leu Leu Ser Val Ala Pro Lys Gly Leu Asp Lys
115 120 125
Val Cys Thr Ala His Thr Gly Ser Asp Ala Asn Glu Met Ala Phe Lys
130 135 140
Ala Ala Phe Leu Phe Gln Ala Ser Lys Lys Arg Gly Asp Lys Pro Phe
145 150 155 160
Thr Ser Glu Glu Leu Glu Ser Val Met Glu Asn Lys Leu Pro Gly Thr
165 170 175
Ser Asp Met Val Ile Leu Ser Phe Glu Lys Gly Phe His Gly Arg Leu
180 185 190
Phe Gly Ser Leu Ser Thr Thr Arg Ser Lys Ala Ile His Lys Leu Asp
195 200 205
Ile Pro Ala Phe Glu Trp Pro Lys Ala Pro Phe Pro Gln Leu Lys Tyr
210 215 220
Pro Leu Asp Gln Phe Gln Ala Glu Asn Lys Ala Glu Glu Glu Arg Cys
225 230 235 240
Leu Lys Ala Leu Glu Glu Ile Ile Val Asn Ser Pro Ala Lys Ile Ala
245 250 255
Ala Ala Ile Ile Glu Pro Val Gln Ser Glu Gly Gly Asp Asn His Ala
260 265 270
Ser Pro Glu Phe Phe Gln Gly Ile Arg Glu Ile Thr Lys Lys His Gly
275 280 285
Val Ile Leu Ile Val Asp Glu Val Gln Thr Gly Gly Gly Ala Ser Gly
290 295 300
Lys Met Trp Leu His Glu His Tyr Gly Ile Val Pro Asp Ile Met Thr
305 310 315 320
Phe Ser Lys Lys Met Gln Asn Ala Gly Phe Phe Phe Ser Glu Ala Gly
325 330 335
Leu Ala Gly Asp Gln Pro Phe Arg Gln Phe Asn Thr Trp Cys Gly Asp
340 345 350
Pro Ser Lys Ala Leu Ile Ala Arg Thr Ile Ile Glu Glu Ile Lys Asp
355 360 365
Lys Asn Leu Leu Thr Ser Val Thr Glu Thr Gly Asp Tyr Leu Tyr Ser
370 375 380
Lys Leu Glu Ala Ile Ser Ala Lys Tyr Asp Lys Met Ile Asn Leu Arg
385 390 395 400
Gly Lys Gly Arg Gly Phe Phe Ile Ala Phe Asp Ala Pro Thr Pro Glu
405 410 415
Leu Arg Asn Lys Phe Ile Ala Glu Cys Lys Lys Leu Gly Leu Asn Ile
420 425 430
Gly Gly Cys Gly Glu Gln Gly Val Arg Leu Arg Pro Ala Leu Val Phe
435 440 445
Glu Lys Lys His Ala Asp Ile Leu Ala Ser Ile Ile Asp Gln Ala Phe
450 455 460
Ser Lys Ile
465
<210> 21
<211> 475
<212> PRT
<213> 克鲁维酵母
<400> 21
Met Pro Ser Tyr Ser Val Ala Glu Leu Tyr Tyr Pro Asp Glu Pro Thr
1 5 10 15
Glu Pro Lys Ile Ser Thr Ser Ser Tyr Pro Gly Pro Lys Ala Lys Gln
20 25 30
Glu Leu Glu Lys Leu Ser Asn Val Phe Asp Thr Arg Ala Ala Tyr Leu
35 40 45
Leu Ala Asp Tyr Tyr Lys Ser Arg Gly Asn Tyr Ile Val Asp Gln Asp
50 55 60
Gly Asn Val Leu Leu Asp Val Tyr Ala Gln Ile Ser Ser Ile Ala Leu
65 70 75 80
Gly Tyr Asn Asn Pro Glu Ile Leu Lys Val Ala Lys Ser Asp Ala Met
85 90 95
Ser Val Ala Leu Ala Asn Arg Pro Ala Leu Ala Cys Phe Pro Ser Asn
100 105 110
Asp Tyr Gly Gln Leu Leu Glu Asp Gly Leu Leu Lys Ala Ala Pro Gln
115 120 125
Gly Gln Asp Lys Ile Trp Thr Ala Leu Ser Gly Ser Asp Ala Asn Glu
130 135 140
Thr Ala Phe Lys Ala Cys Phe Met Tyr Gln Ala Ala Lys Lys Arg Asn
145 150 155 160
Gly Arg Ser Phe Ser Thr Glu Glu Leu Glu Ser Val Met Asp Asn Gln
165 170 175
Leu Pro Gly Thr Ser Glu Met Val Ile Cys Ser Phe Glu Lys Gly Phe
180 185 190
His Gly Arg Leu Phe Gly Ser Leu Ser Thr Thr Arg Ser Lys Pro Ile
195 200 205
His Lys Leu Asp Ile Pro Ala Phe Asn Trp Pro Lys Ala Pro Phe Pro
210 215 220
Asp Leu Lys Tyr Pro Leu Glu Glu Asn Lys Glu Ala Asn Lys Ala Glu
225 230 235 240
Glu Ser Ser Cys Ile Glu Lys Phe Ser Gln Ile Val Gln Glu Trp Gln
245 250 255
Gly Lys Ile Ala Ala Val Ile Ile Glu Pro Ile Gln Ser Glu Gly Gly
260 265 270
Asp Asn His Ala Ser Ser Asp Phe Phe Gln Lys Leu Arg Glu Ile Thr
275 280 285
Ile Glu Asn Gly Ile Leu Met Ile Val Asp Glu Val Gln Thr Gly Val
290 295 300
Gly Ala Thr Gly Lys Met Trp Ala His Glu His Trp Asn Leu Ser Asn
305 310 315 320
Pro Pro Asp Leu Val Thr Phe Ser Lys Lys Phe Gln Ala Ala Gly Phe
325 330 335
Tyr Tyr His Asp Pro Lys Leu Gln Pro Asp Gln Pro Phe Arg Gln Phe
340 345 350
Asn Thr Trp Cys Gly Asp Pro Ser Lys Ala Leu Ile Ala Lys Val Ile
355 360 365
Tyr Glu Glu Ile Val Lys His Asp Leu Val Thr Arg Thr Ala Glu Val
370 375 380
Gly Asn Tyr Leu Phe Asn Arg Leu Glu Lys Leu Phe Glu Gly Lys Asn
385 390 395 400
Tyr Ile Gln Asn Leu Arg Gly Lys Gly Gln Gly Thr Tyr Ile Ala Phe
405 410 415
Asp Phe Gly Thr Ser Ser Glu Arg Asp Ser Phe Leu Ser Arg Leu Arg
420 425 430
Cys Asn Gly Ala Asn Val Ala Gly Cys Gly Asp Ser Ala Val Arg Leu
435 440 445
Arg Pro Ser Leu Thr Phe Glu Glu Lys His Ala Asp Val Leu Val Ser
450 455 460
Ile Phe Asp Lys Thr Leu Arg Gln Leu Tyr Gly
465 470 475
<210> 22
<211> 451
<212> PRT
<213> 阿维链霉菌
<400> 22
Met Thr Pro Gln Pro Asn Pro Gln Val Gly Ala Ala Val Lys Ala Ala
1 5 10 15
Asp Arg Ala His Val Phe His Ser Trp Ser Ala Gln Glu Leu Ile Asp
20 25 30
Pro Leu Ala Val Ala Gly Ala Glu Gly Ser Tyr Phe Trp Asp Tyr Asp
35 40 45
Gly Arg Arg Tyr Leu Asp Phe Thr Ser Gly Leu Val Phe Thr Asn Ile
50 55 60
Gly Tyr Gln His Pro Lys Val Val Ala Ala Ile Gln Glu Gln Ala Ala
65 70 75 80
Ser Leu Thr Thr Phe Ala Pro Ala Phe Ala Val Glu Ala Arg Ser Glu
85 90 95
Ala Ala Arg Leu Ile Ala Glu Arg Thr Pro Gly Asp Leu Asp Lys Ile
100 105 110
Phe Phe Thr Asn Gly Gly Ala Asp Ala Ile Glu His Ala Val Arg Met
115 120 125
Ala Arg Ile His Thr Gly Arg Pro Lys Val Leu Ser Ala Tyr Arg Ser
130 135 140
Tyr His Gly Gly Thr Gln Gln Ala Val Asn Ile Thr Gly Asp Pro Arg
145 150 155 160
Arg Trp Ala Ser Asp Ser Ala Ser Ala Gly Val Val His Phe Trp Ala
165 170 175
Pro Tyr Leu Tyr Arg Ser Arg Phe Tyr Ala Glu Thr Glu Gln Gln Glu
180 185 190
Cys Glu Arg Ala Leu Glu His Leu Glu Thr Thr Ile Ala Phe Glu Gly
195 200 205
Pro Gly Thr Ile Ala Ala Ile Val Leu Glu Thr Val Pro Gly Thr Ala
210 215 220
Gly Ile Met Val Pro Pro Pro Gly Tyr Leu Ala Gly Val Arg Glu Leu
225 230 235 240
Cys Asp Lys Tyr Gly Ile Val Phe Val Leu Asp Glu Val Met Ala Gly
245 250 255
Phe Gly Arg Thr Gly Glu Trp Phe Ala Ala Asp Leu Phe Asp Val Thr
260 265 270
Pro Asp Leu Met Thr Phe Ala Lys Gly Val Asn Ser Gly Tyr Val Pro
275 280 285
Leu Gly Gly Val Ala Ile Ser Gly Lys Ile Ala Glu Thr Phe Gly Lys
290 295 300
Arg Ala Tyr Pro Gly Gly Leu Thr Tyr Ser Gly His Pro Leu Ala Cys
305 310 315 320
Ala Ala Ala Val Ala Thr Ile Asn Val Met Ala Glu Glu Gly Val Val
325 330 335
Glu Asn Ala Ala Asn Leu Gly Ala Arg Val Ile Glu Pro Gly Leu Arg
340 345 350
Glu Leu Ala Glu Arg His Pro Ser Val Gly Glu Val Arg Gly Val Gly
355 360 365
Met Phe Trp Ala Leu Glu Leu Val Lys Asp Arg Glu Thr Arg Glu Pro
370 375 380
Leu Val Pro Tyr Asn Ala Ala Gly Glu Ala Asn Ala Pro Met Ala Ala
385 390 395 400
Phe Gly Ala Ala Ala Lys Ala Asn Gly Leu Trp Pro Phe Ile Asn Met
405 410 415
Asn Arg Thr His Val Val Pro Pro Cys Asn Val Thr Glu Ala Glu Ala
420 425 430
Lys Glu Gly Leu Ala Ala Leu Asp Ala Ala Leu Ser Val Ala Asp Glu
435 440 445
Tyr Thr Val
450
<210> 23
<211> 419
<212> PRT
<213> 阿维链霉菌
<400> 23
Met Ser Ala Leu Ser Pro His Leu Arg Gln Ala Thr Pro Val Val Ala
1 5 10 15
Val Arg Gly Glu Gly Val His Leu Tyr Gly Glu Asp Gly Arg Arg Tyr
20 25 30
Leu Asp Phe Thr Ala Gly Ile Gly Val Thr Ser Thr Gly His Cys His
35 40 45
Pro Arg Val Val Ala Ala Ala Gln Glu Gln Ala Gly Thr Leu Val His
50 55 60
Gly Gln Tyr Thr Thr Val Leu His Pro Pro Leu Arg Arg Leu Val Asp
65 70 75 80
Arg Leu Gly Glu Val Leu Pro Ala Gly Leu Asp Ser Leu Phe Phe Thr
85 90 95
Asn Ser Gly Ser Glu Ala Val Glu Ala Ala Leu Arg Leu Ala Arg Gln
100 105 110
Ala Thr Gly Arg Pro Asn Val Leu Val Cys His Gly Gly Phe His Gly
115 120 125
Arg Thr Val Ala Ala Ala Ala Met Thr Thr Ser Gly Thr Arg Phe Arg
130 135 140
Ser Gly Phe Ser Pro Leu Met Ser Gly Val Val Val Thr Pro Phe Pro
145 150 155 160
Thr Ala Phe Arg Tyr Gly Trp Asp Glu Glu Thr Ala Thr Arg Phe Ala
165 170 175
Leu Gln Glu Leu Asp Tyr Thr Leu Arg Thr Ile Ser Ser Pro Asp Asp
180 185 190
Thr Ala Ala Ile Ile Val Glu Pro Val Leu Gly Glu Gly Gly Tyr Val
195 200 205
Pro Ala Thr Arg Ala Phe Leu Glu Gly Leu Arg Glu Arg Ala Asp Arg
210 215 220
His Gly Phe Val Leu Ile Leu Asp Glu Val Gln Thr Gly Val Gly Arg
225 230 235 240
Thr Gly Arg Phe Trp Gly His Asp His Phe Gly Val Thr Pro Asp Ile
245 250 255
Leu Ile Thr Ala Lys Gly Leu Ala Ser Gly Phe Pro Leu Ser Gly Ile
260 265 270
Ala Ala Ser Ala Glu Leu Met Gly Lys Ala Trp Pro Gly Ser Gln Gly
275 280 285
Gly Thr Tyr Gly Ala Asn Ala Val Ala Cys Ala Ala Ala Cys Ala Thr
290 295 300
Leu Asp Val Val Arg Asp Glu Lys Leu Val Asp Asn Ala Glu Ala Met
305 310 315 320
Gly Ala Arg Leu Arg Ala Gly Leu Ala Ala Val Ala Ala Thr Thr Pro
325 330 335
Ala Ile Gly Asp Val Arg Gly Leu Gly Leu Met Leu Ala Ser Glu Phe
340 345 350
Val Thr Glu Asp Gly Gly Pro Asp Pro Glu Thr Ala Ala Arg Val Gln
355 360 365
Arg Ala Ala Val Asp Glu Gly Leu Leu Leu Leu Leu Cys Gly Ala Trp
370 375 380
Asn Gln Val Val Arg Met Ile Pro Ala Leu Val Ile Asp Glu Ala Glu
385 390 395 400
Val Asp Glu Gly Leu Arg Ala Trp Ser Ala Ala Val Glu Val Gly Val
405 410 415
Pro Ala Arg
<210> 24
<211> 471
<212> PRT
<213> 酿酒酵母
<400> 24
Met Ser Ile Cys Glu Gln Tyr Tyr Pro Glu Glu Pro Thr Lys Pro Thr
1 5 10 15
Val Lys Thr Glu Ser Ile Pro Gly Pro Glu Ser Gln Lys Gln Leu Lys
20 25 30
Glu Leu Gly Glu Val Phe Asp Thr Arg Pro Ala Tyr Phe Leu Ala Asp
35 40 45
Tyr Glu Lys Ser Leu Gly Asn Tyr Ile Thr Asp Val Asp Gly Asn Thr
50 55 60
Tyr Leu Asp Leu Tyr Ala Gln Ile Ser Ser Ile Ala Leu Gly Tyr Asn
65 70 75 80
Asn Pro Ala Leu Ile Lys Ala Ala Gln Ser Pro Glu Met Ile Arg Ala
85 90 95
Leu Val Asp Arg Pro Ala Leu Gly Asn Phe Pro Ser Lys Asp Leu Asp
100 105 110
Lys Ile Leu Lys Gln Ile Leu Lys Ser Ala Pro Lys Gly Gln Asp His
115 120 125
Val Trp Ser Gly Leu Ser Gly Ala Asp Ala Asn Glu Leu Ala Phe Lys
130 135 140
Ala Ala Phe Ile Tyr Tyr Arg Ala Lys Gln Arg Gly Tyr Asp Ala Asp
145 150 155 160
Phe Ser Glu Lys Glu Asn Leu Ser Val Met Asp Asn Asp Ala Pro Gly
165 170 175
Ala Pro His Leu Ala Val Leu Ser Phe Lys Arg Ala Phe His Gly Arg
180 185 190
Leu Phe Ala Ser Gly Ser Thr Thr Cys Ser Lys Pro Ile His Lys Leu
195 200 205
Asp Phe Pro Ala Phe His Trp Pro His Ala Glu Tyr Pro Ser Tyr Gln
210 215 220
Tyr Pro Leu Asp Glu Asn Ser Asp Ala Asn Arg Lys Glu Asp Asp His
225 230 235 240
Cys Leu Ala Ile Val Glu Glu Leu Ile Lys Thr Trp Ser Ile Pro Val
245 250 255
Ala Ala Leu Ile Ile Glu Pro Ile Gln Ser Glu Gly Gly Asp Asn His
260 265 270
Ala Ser Lys Tyr Phe Leu Gln Lys Leu Arg Asp Ile Thr Leu Lys Tyr
275 280 285
Asn Val Val Tyr Ile Ile Asp Glu Val Gln Thr Gly Val Gly Ala Thr
290 295 300
Gly Lys Leu Trp Cys His Glu Tyr Ala Asp Ile Gln Pro Pro Val Asp
305 310 315 320
Leu Val Thr Phe Ser Lys Lys Phe Gln Ser Ala Gly Tyr Phe Phe His
325 330 335
Asp Pro Lys Phe Ile Pro Asn Lys Pro Tyr Arg Gln Phe Asn Thr Trp
340 345 350
Cys Gly Glu Pro Ala Arg Met Ile Ile Ala Gly Ala Ile Gly Gln Glu
355 360 365
Ile Ser Asp Lys Lys Leu Thr Glu Gln Cys Ser Arg Val Gly Asp Tyr
370 375 380
Leu Phe Lys Lys Leu Glu Gly Leu Gln Lys Lys Tyr Pro Glu Asn Phe
385 390 395 400
Gln Asn Leu Arg Gly Lys Gly Arg Gly Thr Phe Ile Ala Trp Asp Leu
405 410 415
Pro Thr Gly Glu Lys Arg Asp Leu Leu Leu Lys Lys Leu Lys Leu Asn
420 425 430
Gly Cys Asn Val Gly Gly Cys Ala Val His Ala Val Arg Leu Arg Pro
435 440 445
Ser Leu Thr Phe Glu Glu Lys His Ala Asp Ile Phe Ile Glu Ala Leu
450 455 460
Ala Lys Ser Val Asn Glu Leu
465 470
<210> 25
<211> 813
<212> DNA
<213> 东方伊萨酵母
<400> 25
atgtttggta atatttccca aagacttgca ggcaagaaca tcctaattac aggtgcgtcc 60
actggtatcg gataccatac agcaaagtat tttgcagaag ctgcaaatgg agacttgaag 120
ttggttttgg ctgcaagaag aaaggagaag ctggaggcac taaaggcaga cttgcttgcc 180
aagtatccat ccatcaaagt ccatattgag agtttggatg tctccaaaac ggaaaccatt 240
gcacctttct taaaaggttt acctgaggaa ttttcaattg tcgacgtgtt ggtcaacaat 300
gcaggtaagg cgcttggttt ggatccaatt ggctctgtcg atccaaagga cgtggatgaa 360
atgttccaga ccaatgtttt gggtatgatt caattgaccc agttggttgt acagcaaatg 420
aaggagagaa actccgggga cattgtccaa ctaggttcag tggctggtag aaacccatac 480
ccaggtggtg gtatctactg tgcctccaag gccgcattga gatcttttac acatgtattg 540
agagaggaat tgattaatac caagattaga gtgattgaaa tcgagcctgg aaatgttgca 600
actgaggaat tttctttgac cagattcaaa ggtgataagt ccaaggccga aaaggtctat 660
gagggaaccg agccattgta tggtaccgat attgcagaat tgattctatt tgcagtttct 720
agacctcaaa acactgttat tgcagaaaca cttgtttttg ctagtaacca agcttctgct 780
taccatattt tcagaggatc attagataaa tag 813
<210> 26
<211> 270
<212> PRT
<213> 东方伊萨酵母
<400> 26
Met Phe Gly Asn Ile Ser Gln Arg Leu Ala Gly Lys Asn Ile Leu Ile
1 5 10 15
Thr Gly Ala Ser Thr Gly Ile Gly Tyr His Thr Ala Lys Tyr Phe Ala
20 25 30
Glu Ala Ala Asn Gly Asp Leu Lys Leu Val Leu Ala Ala Arg Arg Lys
35 40 45
Glu Lys Leu Glu Ala Leu Lys Ala Asp Leu Leu Ala Lys Tyr Pro Ser
50 55 60
Ile Lys Val His Ile Glu Ser Leu Asp Val Ser Lys Thr Glu Thr Ile
65 70 75 80
Ala Pro Phe Leu Lys Gly Leu Pro Glu Glu Phe Ser Ile Val Asp Val
85 90 95
Leu Val Asn Asn Ala Gly Lys Ala Leu Gly Leu Asp Pro Ile Gly Ser
100 105 110
Val Asp Pro Lys Asp Val Asp Glu Met Phe Gln Thr Asn Val Leu Gly
115 120 125
Met Ile Gln Leu Thr Gln Leu Val Val Gln Gln Met Lys Glu Arg Asn
130 135 140
Ser Gly Asp Ile Val Gln Leu Gly Ser Val Ala Gly Arg Asn Pro Tyr
145 150 155 160
Pro Gly Gly Gly Ile Tyr Cys Ala Ser Lys Ala Ala Leu Arg Ser Phe
165 170 175
Thr His Val Leu Arg Glu Glu Leu Ile Asn Thr Lys Ile Arg Val Ile
180 185 190
Glu Ile Glu Pro Gly Asn Val Ala Thr Glu Glu Phe Ser Leu Thr Arg
195 200 205
Phe Lys Gly Asp Lys Ser Lys Ala Glu Lys Val Tyr Glu Gly Thr Glu
210 215 220
Pro Leu Tyr Gly Thr Asp Ile Ala Glu Leu Ile Leu Phe Ala Val Ser
225 230 235 240
Arg Pro Gln Asn Thr Val Ile Ala Glu Thr Leu Val Phe Ala Ser Asn
245 250 255
Gln Ala Ser Ala Tyr His Ile Phe Arg Gly Ser Leu Asp Lys
260 265 270
<210> 27
<211> 248
<212> PRT
<213> 大肠杆菌
<400> 27
Met Ile Val Leu Val Thr Gly Ala Thr Ala Gly Phe Gly Glu Cys Ile
1 5 10 15
Thr Arg Arg Phe Ile Gln Gln Gly His Lys Val Ile Ala Thr Gly Arg
20 25 30
Arg Gln Glu Arg Leu Gln Glu Leu Lys Asp Glu Leu Gly Asp Asn Leu
35 40 45
Tyr Ile Ala Gln Leu Asp Val Arg Asn Arg Ala Ala Ile Glu Glu Met
50 55 60
Leu Ala Ser Leu Pro Ala Glu Trp Cys Asn Ile Asp Ile Leu Val Asn
65 70 75 80
Asn Ala Gly Leu Ala Leu Gly Met Glu Pro Ala His Lys Ala Ser Val
85 90 95
Glu Asp Trp Glu Thr Met Ile Asp Thr Asn Asn Lys Gly Leu Val Tyr
100 105 110
Met Thr Arg Ala Val Leu Pro Gly Met Val Glu Arg Asn His Gly His
115 120 125
Ile Ile Asn Ile Gly Ser Thr Ala Gly Ser Trp Pro Tyr Ala Gly Gly
130 135 140
Asn Val Tyr Gly Ala Thr Lys Ala Phe Val Arg Gln Phe Ser Leu Asn
145 150 155 160
Leu Arg Thr Asp Leu His Gly Thr Ala Val Arg Val Thr Asp Ile Glu
165 170 175
Pro Gly Leu Val Gly Gly Thr Glu Phe Ser Asn Val Arg Phe Lys Gly
180 185 190
Asp Asp Gly Lys Ala Glu Lys Thr Tyr Gln Asn Thr Val Ala Leu Thr
195 200 205
Pro Glu Asp Val Ser Glu Ala Val Trp Trp Val Ser Thr Leu Pro Ala
210 215 220
His Val Asn Ile Asn Thr Leu Glu Met Met Pro Val Thr Gln Ser Tyr
225 230 235 240
Ala Gly Leu Asn Val His Arg Gln
245
<210> 28
<211> 298
<212> PRT
<213> 粪产碱菌
<400> 28
Met Ser Asn Thr Ile Ala Phe Ile Gly Leu Gly His Met Gly Lys Pro
1 5 10 15
Met Ala Leu Asn Leu Leu Lys Ala Gly His Ser Leu Asn Val Phe Asp
20 25 30
Leu Asn Ala Gln Ala Met Gln Glu Leu Gln Ala Ala Gly Ala Gln Val
35 40 45
Gly Glu Ser Ala Val Gln Ile Ala Gln Asp Ala Gln Met Val Phe Thr
50 55 60
Met Leu Pro Ala Gly Arg His Val Arg Gln Val Tyr Glu Gly Glu Asn
65 70 75 80
Gly Leu Leu Gln Thr Val Ala Pro Gly Thr Val Leu Val Asp Cys Ser
85 90 95
Thr Ile Asp Ala Gln Thr Ser Gln Asp Leu Ala Ala Lys Ala Ser Lys
100 105 110
Leu Gly Leu Phe Met Leu Asp Ala Pro Val Ser Gly Gly Thr Gly Gly
115 120 125
Ala Ile Ala Gly Thr Leu Thr Phe Met Val Gly Gly Glu Asp Gln Ala
130 135 140
Leu Glu Lys Ala Arg Pro Tyr Leu Asp Ala Met Gly Lys Asn Ile Phe
145 150 155 160
His Ala Gly Lys Ala Gly Ala Gly Gln Val Ala Lys Ile Cys Asn Asn
165 170 175
Met Leu Leu Gly Ile Leu Met Ala Gly Thr Ala Glu Ala Leu Ala Leu
180 185 190
Gly Val Ala His Gly Leu Asp Pro Ala Val Leu Ser Thr Ile Met Ala
195 200 205
Arg Ser Ser Gly Arg Asn Trp Ala Thr Glu Leu Tyr Asn Pro Trp Pro
210 215 220
Gly Val Met Pro Asp Val Pro Ala Ser Arg Asp Tyr Gln Gly Gly Phe
225 230 235 240
Ala Thr Gly Leu Met Leu Lys Asp Leu Gly Leu Ala Ala Asp Ala Ala
245 250 255
Val Ser Gln Asn Ser Ala Thr Pro Leu Gly Glu Leu Ala Arg Asn Leu
260 265 270
Phe Ala Leu His Ala Ala Gln Gly Gln Asn Ala Gly Leu Asp Phe Ser
275 280 285
Ser Ile Leu Asn Leu Tyr Arg Gln Lys His
290 295
<210> 29
<211> 314
<212> PRT
<213> Metallosphaera sedula
<400> 29
Met Thr Glu Lys Val Ser Val Val Gly Ala Gly Val Ile Gly Val Gly
1 5 10 15
Trp Ala Thr Leu Phe Ala Ser Lys Gly Tyr Ser Val Ser Leu Tyr Thr
20 25 30
Glu Lys Lys Glu Thr Leu Asp Lys Gly Ile Glu Lys Leu Arg Asn Tyr
35 40 45
Val Gln Val Met Lys Asn Asn Ser Gln Ile Thr Glu Asp Val Asn Thr
50 55 60
Val Ile Ser Arg Val Ser Pro Thr Thr Asn Leu Asp Glu Ala Val Arg
65 70 75 80
Gly Ala Asn Phe Val Ile Glu Ala Val Ile Glu Asp Tyr Asp Ala Lys
85 90 95
Lys Lys Ile Phe Gly Tyr Leu Asp Ser Val Leu Asp Lys Glu Val Ile
100 105 110
Leu Ala Ser Ser Thr Ser Gly Leu Leu Ile Thr Glu Val Gln Lys Ala
115 120 125
Met Ser Lys His Pro Glu Arg Ala Val Ile Ala His Pro Trp Asn Pro
130 135 140
Pro His Leu Leu Pro Leu Val Glu Ile Val Pro Gly Glu Lys Thr Ser
145 150 155 160
Met Glu Val Val Glu Arg Thr Lys Ser Leu Met Glu Lys Leu Asp Arg
165 170 175
Ile Val Val Val Leu Lys Lys Glu Ile Pro Gly Phe Ile Gly Asn Arg
180 185 190
Leu Ala Phe Ala Leu Phe Arg Glu Ala Val Tyr Leu Val Asp Glu Gly
195 200 205
Val Ala Thr Val Glu Asp Ile Asp Lys Val Met Thr Ala Ala Ile Gly
210 215 220
Leu Arg Trp Ala Phe Met Gly Pro Phe Leu Thr Tyr His Leu Gly Gly
225 230 235 240
Gly Glu Gly Gly Leu Glu Tyr Phe Phe Asn Arg Gly Phe Gly Tyr Gly
245 250 255
Ala Asn Glu Trp Met His Thr Leu Ala Lys Tyr Asp Lys Phe Pro Tyr
260 265 270
Thr Gly Val Thr Lys Ala Ile Gln Gln Met Lys Glu Tyr Ser Phe Ile
275 280 285
Lys Gly Lys Thr Phe Gln Glu Ile Ser Lys Trp Arg Asp Glu Lys Leu
290 295 300
Leu Lys Val Tyr Lys Leu Val Trp Glu Lys
305 310
<210> 30
<211> 295
<212> PRT
<213> 恶臭假单胞菌
<400> 30
Met Arg Ile Ala Phe Ile Gly Leu Gly Asn Met Gly Ala Pro Met Ala
1 5 10 15
Arg Asn Leu Ile Lys Ala Gly His Gln Leu Asn Leu Phe Asp Leu Asn
20 25 30
Lys Ala Val Leu Ala Glu Leu Ala Glu Leu Gly Gly Gln Ile Ser Pro
35 40 45
Ser Pro Lys Asp Ala Ala Ala Asn Ser Glu Leu Val Ile Thr Met Leu
50 55 60
Pro Ala Ala Ala His Val Arg Ser Val Tyr Leu Asn Glu Asp Gly Val
65 70 75 80
Leu Ala Gly Ile Arg Pro Gly Thr Pro Thr Val Asp Cys Ser Thr Ile
85 90 95
Asp Pro Gln Thr Ala Arg Asp Val Ser Lys Ala Ala Ala Ala Lys Gly
100 105 110
Val Asp Met Gly Asp Ala Pro Val Ser Gly Gly Thr Gly Gly Ala Ala
115 120 125
Ala Gly Thr Leu Thr Phe Met Val Gly Ala Ser Thr Glu Leu Phe Ala
130 135 140
Ser Leu Lys Pro Val Leu Glu Gln Met Gly Arg Asn Ile Val His Cys
145 150 155 160
Gly Glu Val Gly Thr Gly Gln Ile Ala Lys Ile Cys Asn Asn Leu Leu
165 170 175
Leu Gly Ile Ser Met Ile Gly Val Ser Glu Ala Met Ala Leu Gly Asn
180 185 190
Ala Leu Gly Ile Asp Thr Lys Val Leu Ala Gly Ile Ile Asn Ser Ser
195 200 205
Thr Gly Arg Cys Trp Ser Ser Asp Thr Tyr Asn Pro Trp Pro Gly Ile
210 215 220
Ile Glu Thr Ala Pro Ala Ser Arg Gly Tyr Thr Gly Gly Phe Gly Ala
225 230 235 240
Glu Leu Met Leu Lys Asp Leu Gly Leu Ala Thr Glu Ala Ala Arg Gln
245 250 255
Ala His Gln Pro Val Ile Leu Gly Ala Val Ala Gln Gln Leu Tyr Gln
260 265 270
Ala Met Ser Leu Arg Gly Glu Gly Gly Lys Asp Phe Ser Ala Ile Val
275 280 285
Glu Gly Tyr Arg Lys Lys Asp
290 295
<210> 31
<211> 295
<212> PRT
<213> 恶臭假单胞菌
<400> 31
Met Arg Ile Ala Phe Ile Gly Leu Gly Asn Met Gly Ala Pro Met Ala
1 5 10 15
Arg Asn Leu Ile Lys Ala Gly His Gln Leu Asn Leu Phe Asp Leu Asn
20 25 30
Lys Thr Val Leu Ala Glu Leu Ala Glu Leu Gly Gly Gln Ile Ser Pro
35 40 45
Ser Pro Lys Asp Ala Ala Ala Ser Ser Glu Leu Val Ile Thr Met Leu
50 55 60
Pro Ala Ala Ala His Val Arg Ser Val Tyr Leu Asn Asp Asp Gly Val
65 70 75 80
Leu Ala Gly Ile Arg Pro Gly Thr Pro Thr Val Asp Cys Ser Thr Ile
85 90 95
Asp Pro Gln Thr Ala Arg Asp Val Ser Lys Ala Ala Ala Ala Lys Gly
100 105 110
Val Asp Met Gly Asp Ala Pro Val Ser Gly Gly Thr Gly Gly Ala Ala
115 120 125
Ala Gly Thr Leu Thr Phe Met Val Gly Ala Ser Ala Glu Leu Phe Ala
130 135 140
Ser Leu Lys Pro Val Leu Glu Gln Met Gly Arg Asn Ile Val His Cys
145 150 155 160
Gly Glu Val Gly Thr Gly Gln Ile Ala Lys Ile Cys Asn Asn Leu Leu
165 170 175
Leu Gly Ile Ser Met Ile Gly Val Ser Glu Ala Met Ala Leu Gly Asn
180 185 190
Ala Leu Gly Ile Asp Thr Lys Val Leu Ala Gly Ile Ile Asn Ser Ser
195 200 205
Thr Gly Arg Cys Trp Ser Ser Asp Thr Tyr Asn Pro Trp Pro Gly Ile
210 215 220
Ile Glu Thr Ala Pro Ala Ser Arg Gly Tyr Thr Gly Gly Phe Gly Ala
225 230 235 240
Glu Leu Met Leu Lys Asp Leu Gly Leu Ala Thr Glu Ala Ala Arg Gln
245 250 255
Ala His Gln Pro Val Ile Leu Gly Ala Val Ala Gln Gln Leu Tyr Gln
260 265 270
Ala Met Ser Leu Arg Gly Glu Gly Gly Lys Asp Phe Ser Ala Ile Val
275 280 285
Glu Gly Tyr Arg Lys Lys Asp
290 295
<210> 32
<211> 298
<212> PRT
<213> 铜绿假单胞菌
<400> 32
Met Thr Asp Ile Ala Phe Leu Gly Leu Gly Asn Met Gly Gly Pro Met
1 5 10 15
Ala Ala Asn Leu Leu Lys Ala Gly His Arg Val Asn Val Phe Asp Leu
20 25 30
Gln Pro Lys Ala Val Leu Gly Leu Val Glu Gln Gly Ala Gln Gly Ala
35 40 45
Asp Ser Ala Leu Gln Cys Cys Glu Gly Ala Glu Val Val Ile Ser Met
50 55 60
Leu Pro Ala Gly Gln His Val Glu Ser Leu Tyr Leu Gly Asp Asp Gly
65 70 75 80
Leu Leu Ala Arg Val Ala Gly Lys Pro Leu Leu Ile Asp Cys Ser Thr
85 90 95
Ile Ala Pro Glu Thr Ala Arg Lys Val Ala Glu Ala Ala Ala Ala Lys
100 105 110
Gly Leu Thr Leu Leu Asp Ala Pro Val Ser Gly Gly Val Gly Gly Ala
115 120 125
Arg Ala Gly Thr Leu Ser Phe Ile Val Gly Gly Pro Ala Glu Gly Phe
130 135 140
Ala Arg Ala Arg Pro Val Leu Glu Asn Met Gly Arg Asn Ile Phe His
145 150 155 160
Ala Gly Asp His Gly Ala Gly Gln Val Ala Lys Ile Cys Asn Asn Met
165 170 175
Leu Leu Gly Ile Leu Met Ala Gly Thr Ala Glu Ala Leu Ala Leu Gly
180 185 190
Val Lys Asn Gly Leu Asp Pro Ala Val Leu Ser Glu Val Met Lys Gln
195 200 205
Ser Ser Gly Gly Asn Trp Ala Leu Asn Leu Tyr Asn Pro Trp Pro Gly
210 215 220
Val Met Pro Gln Ala Pro Ala Ser Asn Gly Tyr Ala Gly Gly Phe Gln
225 230 235 240
Val Arg Leu Met Asn Lys Asp Leu Gly Leu Ala Leu Ala Asn Ala Gln
245 250 255
Ala Val Gln Ala Ser Thr Pro Leu Gly Ala Leu Ala Arg Asn Leu Phe
260 265 270
Ser Leu His Ala Gln Ala Asp Ala Glu His Glu Gly Leu Asp Phe Ser
275 280 285
Ser Ile Gln Lys Leu Tyr Arg Gly Lys Asp
290 295
<210> 33
<211> 382
<212> PRT
<213> Ralstonis eutropha
<400> 33
Met Ala Phe Ile Tyr Tyr Leu Thr His Ile His Leu Asp Phe Gly Ala
1 5 10 15
Val Ser Leu Leu Lys Ser Glu Cys Glu Arg Ile Gly Ile Arg Arg Pro
20 25 30
Leu Leu Val Thr Asp Lys Gly Val Val Ala Ala Gly Val Ala Gln Arg
35 40 45
Ala Ile Asp Ala Met Gln Gly Leu Gln Val Ala Val Phe Asp Glu Thr
50 55 60
Pro Ser Asn Pro Thr Glu Ala Met Val Arg Lys Ala Ala Ala Gln Tyr
65 70 75 80
Arg Glu Ala Gly Cys Asp Gly Leu Val Ala Val Gly Gly Gly Ser Ser
85 90 95
Ile Asp Leu Ala Lys Gly Ile Ala Ile Leu Ala Thr His Glu Gly Glu
100 105 110
Leu Thr Thr Tyr Ala Thr Ile Glu Gly Gly Ser Ala Arg Ile Thr Asp
115 120 125
Lys Ala Ala Pro Leu Ile Ala Val Pro Thr Thr Ser Gly Thr Gly Ser
130 135 140
Glu Val Ala Arg Gly Ala Ile Ile Ile Leu Asp Asp Gly Arg Lys Leu
145 150 155 160
Gly Phe His Ser Trp His Leu Leu Pro Lys Ser Ala Val Cys Asp Pro
165 170 175
Glu Leu Thr Leu Gly Leu Pro Ala Gly Leu Thr Ala Ala Thr Gly Met
180 185 190
Asp Ala Ile Ala His Cys Ile Glu Thr Phe Leu Ala Pro Ala Phe Asn
195 200 205
Pro Pro Ala Asp Gly Ile Ala Leu Asp Gly Leu Glu Arg Gly Trp Gly
210 215 220
His Ile Glu Arg Ala Thr Arg Asp Gly Gln Asp Arg Asp Ala Arg Leu
225 230 235 240
Asn Met Met Ser Ala Ser Met Gln Gly Ala Met Ala Phe Gln Lys Gly
245 250 255
Leu Gly Cys Val His Ser Leu Ser His Pro Leu Gly Gly Leu Lys Ile
260 265 270
Asp Gly Arg Thr Gly Leu His His Gly Thr Leu Asn Ala Val Val Met
275 280 285
Pro Ala Val Leu Arg Phe Asn Ala Asp Ala Pro Thr Val Val Arg Asp
290 295 300
Asp Arg Tyr Ala Arg Leu Arg Arg Ala Met His Leu Pro Asp Gly Ala
305 310 315 320
Asp Ile Ala Gln Ala Val His Asp Met Thr Val Arg Leu Gly Leu Pro
325 330 335
Thr Gly Leu Arg Gln Met Gly Val Thr Glu Asp Met Phe Asp Lys Val
340 345 350
Ile Ala Gly Ala Leu Val Asp His Cys His Lys Thr Asn Pro Lys Glu
355 360 365
Ala Ser Ala Ala Asp Tyr Arg Arg Met Leu Glu Gln Ser Met
370 375 380
<210> 34
<211> 371
<212> PRT
<213> 克鲁维梭菌
<400> 34
Met Lys Leu Leu Lys Leu Ala Pro Asp Val Tyr Lys Phe Asp Thr Ala
1 5 10 15
Glu Glu Phe Met Lys Tyr Phe Lys Val Gly Lys Gly Asp Phe Ile Leu
20 25 30
Thr Asn Glu Phe Leu Tyr Lys Pro Phe Leu Glu Lys Phe Asn Asp Gly
35 40 45
Ala Asp Ala Val Phe Gln Glu Lys Tyr Gly Leu Gly Glu Pro Ser Asp
50 55 60
Glu Met Ile Asn Asn Ile Ile Lys Asp Ile Gly Asp Lys Gln Tyr Asn
65 70 75 80
Arg Ile Ile Ala Val Gly Gly Gly Ser Val Ile Asp Ile Ala Lys Ile
85 90 95
Leu Ser Leu Lys Tyr Thr Asp Asp Ser Leu Asp Leu Phe Glu Gly Lys
100 105 110
Val Pro Leu Val Lys Asn Lys Glu Leu Ile Ile Val Pro Thr Thr Cys
115 120 125
Gly Thr Gly Ser Glu Val Thr Asn Val Ser Val Ala Glu Leu Lys Arg
130 135 140
Arg His Thr Lys Lys Gly Ile Ala Ser Asp Glu Leu Tyr Ala Thr Tyr
145 150 155 160
Ala Val Leu Val Pro Glu Phe Ile Lys Gly Leu Pro Tyr Lys Phe Phe
165 170 175
Val Thr Ser Ser Val Asp Ala Leu Ile His Ala Thr Glu Ala Tyr Val
180 185 190
Ser Pro Asn Ala Asn Pro Tyr Thr Asp Met Phe Ser Val Lys Ala Met
195 200 205
Glu Leu Ile Leu Asn Gly Tyr Met Gln Met Val Glu Lys Gly Asn Asp
210 215 220
Tyr Arg Val Glu Ile Ile Glu Asp Phe Val Ile Gly Ser Asn Tyr Ala
225 230 235 240
Gly Ile Ala Phe Gly Asn Ala Gly Val Gly Ala Val His Ala Leu Ser
245 250 255
Tyr Pro Ile Gly Gly Asn Tyr His Val Pro His Gly Glu Ala Asn Tyr
260 265 270
Leu Phe Phe Thr Glu Ile Phe Lys Thr Tyr Tyr Glu Lys Asn Pro Asn
275 280 285
Gly Lys Ile Lys Asp Val Asn Lys Leu Leu Ala Gly Ile Leu Lys Cys
290 295 300
Asp Glu Ser Glu Ala Tyr Asp Ser Leu Ser Gln Leu Leu Asp Lys Leu
305 310 315 320
Leu Ser Arg Lys Pro Leu Arg Glu Tyr Gly Met Lys Glu Glu Glu Ile
325 330 335
Glu Thr Phe Ala Asp Ser Val Ile Glu Gly Gln Gln Arg Leu Leu Val
340 345 350
Asn Asn Tyr Glu Pro Phe Ser Arg Glu Asp Ile Val Asn Thr Tyr Lys
355 360 365
Lys Leu Tyr
370
<210> 35
<211> 538
<212> PRT
<213> 产琥珀酸曼氏杆菌(Mannheimia succiniciproducens)
<400> 35
Met Thr Asp Leu Asn Gln Leu Thr Gln Glu Leu Gly Ala Leu Gly Ile
1 5 10 15
His Asp Val Gln Glu Val Val Tyr Asn Pro Ser Tyr Glu Leu Leu Phe
20 25 30
Ala Glu Glu Thr Lys Pro Gly Leu Glu Gly Tyr Glu Lys Gly Thr Val
35 40 45
Thr Asn Gln Gly Ala Val Ala Val Asn Thr Gly Ile Phe Thr Gly Arg
50 55 60
Ser Pro Lys Asp Lys Tyr Ile Val Leu Asp Asp Lys Thr Lys Asp Thr
65 70 75 80
Val Trp Trp Thr Ser Glu Lys Val Lys Asn Asp Asn Lys Pro Met Ser
85 90 95
Gln Asp Thr Trp Asn Ser Leu Lys Gly Leu Val Ala Asp Gln Leu Ser
100 105 110
Gly Lys Arg Leu Phe Val Val Asp Ala Phe Cys Gly Ala Asn Lys Asp
115 120 125
Thr Arg Leu Ala Val Arg Val Val Thr Glu Val Ala Trp Gln Ala His
130 135 140
Phe Val Thr Asn Met Phe Ile Arg Pro Ser Ala Glu Glu Leu Lys Gly
145 150 155 160
Phe Lys Pro Asp Phe Val Val Met Asn Gly Ala Lys Cys Thr Asn Pro
165 170 175
Asn Trp Lys Glu Gln Gly Leu Asn Ser Glu Asn Phe Val Ala Phe Asn
180 185 190
Ile Thr Glu Gly Val Gln Leu Ile Gly Gly Thr Trp Tyr Gly Gly Glu
195 200 205
Met Lys Lys Gly Met Phe Ser Met Met Asn Tyr Phe Leu Pro Leu Arg
210 215 220
Gly Ile Ala Ser Met His Cys Ser Ala Asn Val Gly Lys Asp Gly Asp
225 230 235 240
Thr Ala Ile Phe Phe Gly Leu Ser Gly Thr Gly Lys Thr Thr Leu Ser
245 250 255
Thr Asp Pro Lys Arg Gln Leu Ile Gly Asp Asp Glu His Gly Trp Asp
260 265 270
Asp Glu Gly Val Phe Asn Phe Glu Gly Gly Cys Tyr Ala Lys Thr Ile
275 280 285
Asn Leu Ser Ala Glu Asn Glu Pro Asp Ile Tyr Gly Ala Ile Lys Arg
290 295 300
Asp Ala Leu Leu Glu Asn Val Val Val Leu Asp Asn Gly Asp Val Asp
305 310 315 320
Tyr Ala Asp Gly Ser Lys Thr Glu Asn Thr Arg Val Ser Tyr Pro Ile
325 330 335
Tyr His Ile Gln Asn Ile Val Lys Pro Val Ser Lys Ala Gly Pro Ala
340 345 350
Thr Lys Val Ile Phe Leu Ser Ala Asp Ala Phe Gly Val Leu Pro Pro
355 360 365
Val Ser Lys Leu Thr Pro Glu Gln Thr Lys Tyr Tyr Phe Leu Ser Gly
370 375 380
Phe Thr Ala Lys Leu Ala Gly Thr Glu Arg Gly Ile Thr Glu Pro Thr
385 390 395 400
Pro Thr Phe Ser Ala Cys Phe Gly Ala Ala Phe Leu Ser Leu His Pro
405 410 415
Thr Gln Tyr Ala Glu Val Leu Val Lys Arg Met Gln Glu Ser Gly Ala
420 425 430
Glu Ala Tyr Leu Val Asn Thr Gly Trp Asn Gly Thr Gly Lys Arg Ile
435 440 445
Ser Ile Lys Asp Thr Arg Gly Ile Ile Asp Ala Ile Leu Asp Gly Ser
450 455 460
Ile Asp Lys Ala Glu Met Gly Ser Leu Pro Ile Phe Asp Phe Ser Ile
465 470 475 480
Pro Lys Ala Leu Pro Gly Val Asn Pro Ala Ile Leu Asp Pro Arg Asp
485 490 495
Thr Tyr Ala Asp Lys Ala Gln Trp Glu Glu Lys Ala Gln Asp Leu Ala
500 505 510
Gly Arg Phe Val Lys Asn Phe Glu Lys Tyr Thr Gly Thr Ala Glu Gly
515 520 525
Gln Ala Leu Val Ala Ala Gly Pro Lys Ala
530 535
<210> 36
<211> 532
<212> PRT
<213> 产琥珀酸厌氧螺菌(Anaerobiospirillum succiniciproducens)
<400> 36
Met Ser Leu Ser Glu Ser Leu Ala Lys Tyr Gly Ile Thr Gly Ala Thr
1 5 10 15
Asn Ile Val His Asn Pro Ser His Glu Glu Leu Phe Ala Ala Glu Thr
20 25 30
Gln Ala Ser Leu Glu Gly Phe Glu Lys Gly Thr Val Thr Glu Met Gly
35 40 45
Ala Val Asn Val Met Thr Gly Val Tyr Thr Gly Arg Ser Pro Lys Asp
50 55 60
Lys Phe Ile Val Lys Asn Glu Ala Ser Lys Glu Ile Trp Trp Thr Ser
65 70 75 80
Asp Glu Phe Lys Asn Asp Asn Lys Pro Val Thr Glu Glu Ala Trp Ala
85 90 95
Gln Leu Lys Ala Leu Ala Gly Lys Glu Leu Ser Asn Lys Pro Leu Tyr
100 105 110
Val Val Asp Leu Phe Cys Gly Ala Asn Glu Asn Thr Arg Leu Lys Ile
115 120 125
Arg Phe Val Met Glu Val Ala Trp Gln Ala His Phe Val Thr Asn Met
130 135 140
Phe Ile Arg Pro Thr Glu Glu Glu Leu Lys Gly Phe Glu Pro Asp Phe
145 150 155 160
Val Val Leu Asn Ala Ser Lys Ala Lys Val Glu Asn Phe Lys Glu Leu
165 170 175
Gly Leu Asn Ser Glu Thr Ala Val Val Phe Asn Leu Ala Glu Lys Met
180 185 190
Gln Ile Ile Leu Asn Thr Trp Tyr Gly Gly Glu Met Lys Lys Gly Met
195 200 205
Phe Ser Met Met Asn Phe Tyr Leu Pro Leu Gln Gly Ile Ala Ala Met
210 215 220
His Cys Ser Ala Asn Thr Asp Leu Glu Gly Lys Asn Thr Ala Ile Phe
225 230 235 240
Phe Gly Leu Ser Gly Thr Gly Lys Thr Thr Leu Ser Thr Asp Pro Lys
245 250 255
Arg Leu Leu Ile Gly Asp Asp Glu His Gly Trp Asp Asp Asp Gly Val
260 265 270
Phe Asn Phe Glu Gly Gly Cys Tyr Ala Lys Val Ile Asn Leu Ser Lys
275 280 285
Glu Asn Glu Pro Asp Ile Trp Gly Ala Ile Lys Arg Asn Ala Leu Leu
290 295 300
Glu Asn Val Thr Val Asp Ala Asn Gly Lys Val Asp Phe Ala Asp Lys
305 310 315 320
Ser Val Thr Glu Asn Thr Arg Val Ser Tyr Pro Ile Phe His Ile Lys
325 330 335
Asn Ile Val Lys Pro Val Ser Lys Ala Pro Ala Ala Lys Arg Val Ile
340 345 350
Phe Leu Ser Ala Asp Ala Phe Gly Val Leu Pro Pro Val Ser Ile Leu
355 360 365
Ser Lys Glu Gln Thr Lys Tyr Tyr Phe Leu Ser Gly Phe Thr Ala Lys
370 375 380
Leu Ala Gly Thr Glu Arg Gly Ile Thr Glu Pro Thr Pro Thr Phe Ser
385 390 395 400
Ser Cys Phe Gly Ala Ala Phe Leu Thr Leu Pro Pro Thr Lys Tyr Ala
405 410 415
Glu Val Leu Val Lys Arg Met Glu Ala Ser Gly Ala Lys Ala Tyr Leu
420 425 430
Val Asn Thr Gly Trp Asn Gly Thr Gly Lys Arg Ile Ser Ile Lys Asp
435 440 445
Thr Arg Gly Ile Ile Asp Ala Ile Leu Asp Gly Ser Ile Asp Thr Ala
450 455 460
Asn Thr Ala Thr Ile Pro Tyr Phe Asn Phe Thr Val Pro Thr Glu Leu
465 470 475 480
Lys Gly Val Asp Thr Lys Ile Leu Asp Pro Arg Asn Thr Tyr Ala Asp
485 490 495
Ala Ser Glu Trp Glu Val Lys Ala Lys Asp Leu Ala Glu Arg Phe Gln
500 505 510
Lys Asn Phe Lys Lys Phe Glu Ser Leu Gly Gly Asp Leu Val Lys Ala
515 520 525
Gly Pro Gln Leu
530
<210> 37
<211> 538
<212> PRT
<213> 产琥珀酸放线杆菌(Actinobacillus succinogenes)
<400> 37
Met Thr Asp Leu Asn Lys Leu Val Lys Glu Leu Asn Asp Leu Gly Leu
1 5 10 15
Thr Asp Val Lys Glu Ile Val Tyr Asn Pro Ser Tyr Glu Gln Leu Phe
20 25 30
Glu Glu Glu Thr Lys Pro Gly Leu Glu Gly Phe Asp Lys Gly Thr Leu
35 40 45
Thr Thr Leu Gly Ala Val Ala Val Asp Thr Gly Ile Phe Thr Gly Arg
50 55 60
Ser Pro Lys Asp Lys Tyr Ile Val Cys Asp Glu Thr Thr Lys Asp Thr
65 70 75 80
Val Trp Trp Asn Ser Glu Ala Ala Lys Asn Asp Asn Lys Pro Met Thr
85 90 95
Gln Glu Thr Trp Lys Ser Leu Arg Glu Leu Val Ala Lys Gln Leu Ser
100 105 110
Gly Lys Arg Leu Phe Val Val Glu Gly Tyr Cys Gly Ala Ser Glu Lys
115 120 125
His Arg Ile Gly Val Arg Met Val Thr Glu Val Ala Trp Gln Ala His
130 135 140
Phe Val Lys Asn Met Phe Ile Arg Pro Thr Asp Glu Glu Leu Lys Asn
145 150 155 160
Phe Lys Ala Asp Phe Thr Val Leu Asn Gly Ala Lys Cys Thr Asn Pro
165 170 175
Asn Trp Lys Glu Gln Gly Leu Asn Ser Glu Asn Phe Val Ala Phe Asn
180 185 190
Ile Thr Glu Gly Ile Gln Leu Ile Gly Gly Thr Trp Tyr Gly Gly Glu
195 200 205
Met Lys Lys Gly Met Phe Ser Met Met Asn Tyr Phe Leu Pro Leu Lys
210 215 220
Gly Val Ala Ser Met His Cys Ser Ala Asn Val Gly Lys Asp Gly Asp
225 230 235 240
Val Ala Ile Phe Phe Gly Leu Ser Gly Thr Gly Lys Thr Thr Leu Ser
245 250 255
Thr Asp Pro Lys Arg Gln Leu Ile Gly Asp Asp Glu His Gly Trp Asp
260 265 270
Glu Ser Gly Val Phe Asn Phe Glu Gly Gly Cys Tyr Ala Lys Thr Ile
275 280 285
Asn Leu Ser Gln Glu Asn Glu Pro Asp Ile Tyr Gly Ala Ile Arg Arg
290 295 300
Asp Ala Leu Leu Glu Asn Val Val Val Arg Ala Asp Gly Ser Val Asp
305 310 315 320
Phe Asp Asp Gly Ser Lys Thr Glu Asn Thr Arg Val Ser Tyr Pro Ile
325 330 335
Tyr His Ile Asp Asn Ile Val Arg Pro Val Ser Lys Ala Gly His Ala
340 345 350
Thr Lys Val Ile Phe Leu Thr Ala Asp Ala Phe Gly Val Leu Pro Pro
355 360 365
Val Ser Lys Leu Thr Pro Glu Gln Thr Glu Tyr Tyr Phe Leu Ser Gly
370 375 380
Phe Thr Ala Lys Leu Ala Gly Thr Glu Arg Gly Val Thr Glu Pro Thr
385 390 395 400
Pro Thr Phe Ser Ala Cys Phe Gly Ala Ala Phe Leu Ser Leu His Pro
405 410 415
Ile Gln Tyr Ala Asp Val Leu Val Glu Arg Met Lys Ala Ser Gly Ala
420 425 430
Glu Ala Tyr Leu Val Asn Thr Gly Trp Asn Gly Thr Gly Lys Arg Ile
435 440 445
Ser Ile Lys Asp Thr Arg Gly Ile Ile Asp Ala Ile Leu Asp Gly Ser
450 455 460
Ile Glu Lys Ala Glu Met Gly Glu Leu Pro Ile Phe Asn Leu Ala Ile
465 470 475 480
Pro Lys Ala Leu Pro Gly Val Asp Pro Ala Ile Leu Asp Pro Arg Asp
485 490 495
Thr Tyr Ala Asp Lys Ala Gln Trp Gln Val Lys Ala Glu Asp Leu Ala
500 505 510
Asn Arg Phe Val Lys Asn Phe Val Lys Tyr Thr Ala Asn Pro Glu Ala
515 520 525
Ala Lys Leu Val Gly Ala Gly Pro Lys Ala
530 535
<210> 38
<211> 618
<212> PRT
<213> Ralstonis eutropha
<400> 38
Met Asn His Pro Ser Met Gln Gly Thr Thr Ala Leu Asn Val Pro Ala
1 5 10 15
Trp Val Arg Asn Gln Lys Leu Val Ala Trp Val Ala Glu Ile Ala Ala
20 25 30
Leu Thr Lys Pro Glu Arg Ile His Trp Cys Asp Gly Ser Gln Glu Glu
35 40 45
Tyr Asp Arg Leu Cys Glu Gln Met Val Ala Ala Gly Thr Leu Lys Arg
50 55 60
Leu Asn Pro Ala Lys Arg Lys Asn Ser Tyr Leu Ala Leu Ser Asp Pro
65 70 75 80
Ser Asp Val Ala Arg Val Glu Asp Arg Thr Phe Ile Cys Ser Gln Lys
85 90 95
Lys Glu Asp Ala Gly Pro Thr Asn Asn Trp Val Ala Pro Ala Glu Met
100 105 110
Arg Thr Thr Leu Asn Gly Leu Phe Asp Gly Cys Met Arg Gly Arg Thr
115 120 125
Leu Tyr Val Val Pro Phe Ser Met Gly Pro Leu Gly Ser Pro Ile Ala
130 135 140
His Ile Gly Val Glu Leu Ser Asp Ser Pro Tyr Val Ala Val Asn Met
145 150 155 160
Arg Ile Met Thr Arg Met Gly Lys Ala Val Tyr Asp Val Leu Gly Thr
165 170 175
Asp Gly Asp Phe Val Pro Cys Val His Thr Val Gly Lys Pro Leu Ala
180 185 190
Ala Gly Glu Lys Asp Val Pro Trp Pro Cys Asn Pro Thr Lys Tyr Ile
195 200 205
Val His Phe Pro Glu Ser Arg Glu Ile Trp Ser Phe Gly Ser Gly Tyr
210 215 220
Gly Gly Asn Ala Leu Leu Gly Lys Lys Cys Phe Ala Leu Arg Ile Ala
225 230 235 240
Ser Thr Met Gly Arg Asp Glu Gly Trp Leu Ala Glu His Met Leu Ile
245 250 255
Leu Gly Val Thr Ser Pro Glu Gly Lys Lys Phe His Val Ala Ala Ala
260 265 270
Phe Pro Ser Ala Cys Gly Lys Thr Asn Phe Ala Met Leu Ile Pro Pro
275 280 285
Lys Gly Phe Glu Gly Trp Lys Val Thr Thr Ile Gly Asp Asp Ile Ala
290 295 300
Trp Ile Lys Pro Gly Lys Asp Gly Arg Leu Tyr Ala Ile Asn Pro Glu
305 310 315 320
Ala Gly Tyr Phe Gly Val Ala Pro Gly Thr Ser Glu Lys Thr Asn Phe
325 330 335
Asn Ala Met Ala Thr Leu Lys Glu Asn Val Ile Phe Thr Asn Val Ala
340 345 350
Leu Thr Asp Asp Gly Asp Val Trp Trp Glu Gly Met Thr Lys Glu Ala
355 360 365
Pro Ala His Leu Thr Asp Trp Gln Gly Lys Asp Trp Thr Pro Glu Ile
370 375 380
Ala Lys Ala Thr Gly Ala Lys Ala Ala His Pro Asn Ala Arg Phe Thr
385 390 395 400
Ala Pro Ala Ser Gln Cys Pro Ser Ile Asp Glu Asn Trp Asp Asn Pro
405 410 415
Ala Gly Val Pro Ile Asp Ala Phe Ile Phe Gly Gly Arg Arg Ser Thr
420 425 430
Thr Val Pro Leu Val Thr Glu Ala Arg Asn Trp Thr Glu Gly Val Tyr
435 440 445
Met Ala Ala Thr Met Gly Ser Glu Thr Thr Ala Ala Ala Ala Gly Gln
450 455 460
Gln Gly Val Val Arg Arg Asp Pro Phe Ala Met Leu Pro Phe Cys Gly
465 470 475 480
Tyr Asn Met Ser Asp Tyr Phe Gly His Trp Leu Ala Leu Gly Gln Lys
485 490 495
Leu Glu Ala Ala Gly Ala Lys Leu Pro Lys Ile Tyr Cys Val Asn Trp
500 505 510
Phe Arg Lys Asp Ala Asp Gly Asn Phe Val Trp Pro Gly Phe Gly Glu
515 520 525
Asn Met Arg Val Leu Ser Trp Met Ile Asp Arg Val Glu Gly Lys Gly
530 535 540
Glu Gly Ala Glu His Val Phe Gly Thr Ser Pro Arg Tyr Glu Asp Leu
545 550 555 560
Asn Trp Ser Gly Val Glu Phe Ser Val Ala Gln Phe Thr Gln Val Thr
565 570 575
Ser Ile Asp Ala Asp Ala Trp Lys Gln Glu Leu Ala Leu His Asp Glu
580 585 590
Leu Phe Thr Gln Leu Lys His Asn Leu Pro Gln Ala Leu Ala Glu Ala
595 600 605
Arg Ala Ala Leu Gly Lys Arg Leu Glu Gly
610 615
<210> 39
<211> 540
<212> PRT
<213> 大肠杆菌
<400> 39
Met Arg Val Asn Asn Gly Leu Thr Pro Gln Glu Leu Glu Ala Tyr Gly
1 5 10 15
Ile Ser Asp Val His Asp Ile Val Tyr Asn Pro Ser Tyr Asp Leu Leu
20 25 30
Tyr Gln Glu Glu Leu Asp Pro Ser Leu Thr Gly Tyr Glu Arg Gly Val
35 40 45
Leu Thr Asn Leu Gly Ala Val Ala Val Asp Thr Gly Ile Phe Thr Gly
50 55 60
Arg Ser Pro Lys Asp Lys Tyr Ile Val Arg Asp Asp Thr Thr Arg Asp
65 70 75 80
Thr Phe Trp Trp Ala Asp Lys Gly Lys Gly Lys Asn Asp Asn Lys Pro
85 90 95
Leu Ser Pro Glu Thr Trp Gln His Leu Lys Gly Leu Val Thr Arg Gln
100 105 110
Leu Ser Gly Lys Arg Leu Phe Val Val Asp Ala Phe Cys Gly Ala Asn
115 120 125
Pro Asp Thr Arg Leu Ser Val Arg Phe Ile Thr Glu Val Ala Trp Gln
130 135 140
Ala His Phe Val Lys Asn Met Phe Ile Arg Pro Ser Asp Glu Glu Leu
145 150 155 160
Ala Gly Phe Lys Pro Asp Phe Ile Val Met Asn Gly Ala Lys Cys Thr
165 170 175
Asn Pro Gln Trp Lys Glu Gln Gly Leu Asn Ser Glu Asn Phe Val Ala
180 185 190
Phe Asn Leu Thr Glu Arg Met Gln Leu Ile Gly Gly Thr Trp Tyr Gly
195 200 205
Gly Glu Met Lys Lys Gly Met Phe Ser Met Met Asn Tyr Leu Leu Pro
210 215 220
Leu Lys Gly Ile Ala Ser Met His Cys Ser Ala Asn Val Gly Glu Lys
225 230 235 240
Gly Asp Val Ala Val Phe Phe Gly Leu Ser Gly Thr Gly Lys Thr Thr
245 250 255
Leu Ser Thr Asp Pro Lys Arg Arg Leu Ile Gly Asp Asp Glu His Gly
260 265 270
Trp Asp Asp Asp Gly Val Phe Asn Phe Glu Gly Gly Cys Tyr Ala Lys
275 280 285
Thr Ile Lys Leu Ser Lys Glu Ala Glu Pro Glu Ile Tyr Asn Ala Ile
290 295 300
Arg Arg Asp Ala Leu Leu Glu Asn Val Thr Val Arg Glu Asp Gly Thr
305 310 315 320
Ile Asp Phe Asp Asp Gly Ser Lys Thr Glu Asn Thr Arg Val Ser Tyr
325 330 335
Pro Ile Tyr His Ile Asp Asn Ile Val Lys Pro Val Ser Lys Ala Gly
340 345 350
His Ala Thr Lys Val Ile Phe Leu Thr Ala Asp Ala Phe Gly Val Leu
355 360 365
Pro Pro Val Ser Arg Leu Thr Ala Asp Gln Thr Gln Tyr His Phe Leu
370 375 380
Ser Gly Phe Thr Ala Lys Leu Ala Gly Thr Glu Arg Gly Ile Thr Glu
385 390 395 400
Pro Thr Pro Thr Phe Ser Ala Cys Phe Gly Ala Ala Phe Leu Ser Leu
405 410 415
His Pro Thr Gln Tyr Ala Glu Val Leu Val Lys Arg Met Gln Ala Ala
420 425 430
Gly Ala Gln Ala Tyr Leu Val Asn Thr Gly Trp Asn Gly Thr Gly Lys
435 440 445
Arg Ile Ser Ile Lys Asp Thr Arg Ala Ile Ile Asp Ala Ile Leu Asn
450 455 460
Gly Ser Leu Asp Asn Ala Glu Thr Phe Thr Leu Pro Met Phe Asn Leu
465 470 475 480
Ala Ile Pro Thr Glu Leu Pro Gly Val Asp Thr Lys Ile Leu Asp Pro
485 490 495
Arg Asn Thr Tyr Ala Ser Pro Glu Gln Trp Gln Glu Lys Ala Glu Thr
500 505 510
Leu Ala Lys Leu Phe Ile Asp Asn Phe Asp Lys Tyr Thr Asp Thr Pro
515 520 525
Ala Gly Ala Ala Leu Val Ala Ala Gly Pro Lys Leu
530 535 540
<210> 40
<211> 236
<212> PRT
<213> 乳酸乳球菌
<400> 40
Met Ser Glu Ile Thr Gln Leu Phe Gln Tyr Asn Thr Leu Gly Ala Leu
1 5 10 15
Met Ala Gly Leu Tyr Glu Gly Thr Met Thr Ile Gly Glu Leu Leu Lys
20 25 30
His Gly Asp Leu Gly Ile Gly Thr Leu Asp Ser Ile Asp Gly Glu Leu
35 40 45
Ile Val Leu Asp Gly Lys Ala Tyr Gln Ala Lys Gly Asp Lys Thr Ile
50 55 60
Val Glu Leu Thr Asp Asp Ile Lys Val Pro Tyr Ala Ala Val Val Pro
65 70 75 80
His Gln Ala Glu Val Val Phe Lys Gln Lys Phe Thr Val Ser Asp Lys
85 90 95
Glu Leu Glu Asp Arg Ile Glu Ser Tyr Phe Asp Gly Gln Asn Leu Phe
100 105 110
Arg Ser Ile Lys Ile Thr Gly Lys Phe Pro Lys Met His Val Arg Met
115 120 125
Ile Pro Arg Ala Lys Ser Gly Thr Lys Phe Val Glu Val Ser Gln Asn
130 135 140
Gln Pro Glu Tyr Thr Glu Glu Asn Ile Lys Gly Thr Ile Val Gly Ile
145 150 155 160
Trp Thr Pro Glu Met Phe His Gly Val Ser Val Ala Gly Tyr His Leu
165 170 175
His Phe Ile Ser Glu Asp Phe Thr Phe Gly Gly His Val Leu Asp Phe
180 185 190
Ile Ile Asp Asn Gly Thr Val Glu Ile Gly Ala Ile Asp Gln Leu Asn
195 200 205
Gln Ser Phe Pro Val Gln Asp Arg Lys Phe Leu Phe Ala Asp Leu Asp
210 215 220
Ile Glu Ala Leu Lys Lys Asp Ile Asp Val Ala Glu
225 230 235
<210> 41
<211> 239
<212> PRT
<213> 嗜热链球菌
<400> 41
Met Ser Glu Ala Ile Lys Leu Phe Gln Tyr Asn Thr Leu Gly Ala Leu
1 5 10 15
Met Ala Gly Leu Tyr Gly Gly Thr Leu Thr Val Gly Glu Leu Leu Glu
20 25 30
His Gly Asp Leu Gly Leu Gly Thr Leu Asp Ser Ile Asp Gly Glu Leu
35 40 45
Ile Val Leu Asp Gly Lys Ala Tyr Gln Ala Lys Gly Ser Glu Gly Lys
50 55 60
Val Glu Val Val Glu Val Ser Pro Asp Glu Lys Val Pro Tyr Ala Ala
65 70 75 80
Val Val Pro His Gln Ala Glu Val Ile Phe Arg Gln Arg Tyr Glu Met
85 90 95
Thr Asp Lys Glu Leu Glu Asp Arg Ile Glu Ser Tyr Tyr Asp Gly Val
100 105 110
Asn Leu Phe Arg Ser Ile Lys Ile Lys Gly His Phe Lys His Met His
115 120 125
Val Arg Met Ile Pro Lys Ser Asn Ala Asp Ile Lys Phe Ala Asp Val
130 135 140
Ala Thr Arg Gln Pro Glu Tyr Glu Val Asp Asp Ile Ser Gly Thr Ile
145 150 155 160
Val Gly Ile Trp Thr Pro Glu Met Phe His Gly Val Ser Val Ala Gly
165 170 175
Tyr His Leu His Phe Ile Ser Asp Asp Leu Thr Phe Gly Gly His Val
180 185 190
Met Asp Phe Val Ile Glu Asn Gly Ile Ile Glu Val Gly Pro Val Asp
195 200 205
Gln Leu Asp Gln Arg Phe Pro Val Gln Asp Arg Gln Tyr Leu Phe Ala
210 215 220
Lys Phe Asn Val Asp Glu Met Arg Lys Asp Ile Thr Lys Ala Glu
225 230 235
<210> 42
<211> 285
<212> PRT
<213> 短芽孢杆菌
<400> 42
Met Lys Lys Asn Ile Ile Thr Ser Ile Thr Ser Leu Ala Leu Val Ala
1 5 10 15
Gly Leu Ser Leu Thr Ala Phe Ala Ala Thr Thr Ala Thr Val Pro Ala
20 25 30
Pro Pro Ala Lys Gln Glu Ser Lys Pro Ala Val Ala Ala Asn Pro Ala
35 40 45
Pro Lys Asn Val Leu Phe Gln Tyr Ser Thr Ile Asn Ala Leu Met Leu
50 55 60
Gly Gln Phe Glu Gly Asp Leu Thr Leu Lys Asp Leu Lys Leu Arg Gly
65 70 75 80
Asp Met Gly Leu Gly Thr Ile Asn Asp Leu Asp Gly Glu Met Ile Gln
85 90 95
Met Gly Thr Lys Phe Tyr Gln Ile Asp Ser Thr Gly Lys Leu Ser Glu
100 105 110
Leu Pro Glu Ser Val Lys Thr Pro Phe Ala Val Thr Thr His Phe Glu
115 120 125
Pro Lys Glu Lys Thr Thr Leu Thr Asn Val Gln Asp Tyr Asn Gln Leu
130 135 140
Thr Lys Met Leu Glu Glu Lys Phe Glu Asn Lys Asn Val Phe Tyr Ala
145 150 155 160
Val Lys Leu Thr Gly Thr Phe Lys Met Val Lys Ala Arg Thr Val Pro
165 170 175
Lys Gln Thr Arg Pro Tyr Pro Gln Leu Thr Glu Val Thr Lys Lys Gln
180 185 190
Ser Glu Phe Glu Phe Lys Asn Val Lys Gly Thr Leu Ile Gly Phe Tyr
195 200 205
Thr Pro Asn Tyr Ala Ala Ala Leu Asn Val Pro Gly Phe His Leu His
210 215 220
Phe Ile Thr Glu Asp Lys Thr Ser Gly Gly His Val Leu Asn Leu Gln
225 230 235 240
Phe Asp Asn Ala Asn Leu Glu Ile Ser Pro Ile His Glu Phe Asp Val
245 250 255
Gln Leu Pro His Thr Asp Asp Phe Ala His Ser Asp Leu Thr Gln Val
260 265 270
Thr Thr Ser Gln Val His Gln Ala Glu Ser Glu Arg Lys
275 280 285
<210> 43
<211> 259
<212> PRT
<213> 产气肠杆菌
<400> 43
Met Met Met His Ser Ser Ala Cys Asp Cys Glu Ala Ser Leu Cys Glu
1 5 10 15
Thr Leu Arg Gly Phe Ser Ala Gln His Pro Asp Ser Val Ile Tyr Gln
20 25 30
Thr Ser Leu Met Ser Ala Leu Leu Ser Gly Val Tyr Val Gly Glu Thr
35 40 45
Thr Ile Ala Asp Leu Leu Ala His Gly Asp Phe Gly Leu Gly Thr Phe
50 55 60
Asn Glu Leu Asp Gly Glu Met Ile Ala Phe Ser Ser Gln Val Tyr Gln
65 70 75 80
Leu Arg Ala Asp Gly Ser Ala Arg Ala Ala Lys Pro Glu Gln Lys Thr
85 90 95
Pro Phe Ala Val Met Thr Trp Phe Gln Pro Gln Tyr Arg Lys Thr Phe
100 105 110
Asn Gly Pro Val Ser Arg Gln Gln Ile His Asp Val Ile Asp Gln Gln
115 120 125
Ile Pro Ser Asp Asn Leu Phe Cys Val Arg Ile Asp Gly Asn Phe Arg
130 135 140
His Ala His Thr Arg Thr Val Pro Arg Gln Thr Pro Pro Tyr Arg Ala
145 150 155 160
Met Thr Asp Val Leu Asp Asp Gln Pro Val Phe Arg Phe Asn Gln Arg
165 170 175
Glu Gly Val Leu Val Gly Phe Arg Thr Pro Gln His Met Gln Gly Ile
180 185 190
Asn Val Ala Gly Tyr His Glu His Phe Ile Thr Asp Asp Arg Gln Gly
195 200 205
Gly Gly His Leu Leu Asp Tyr Gln Leu Glu Ser Gly Val Leu Thr Phe
210 215 220
Gly Glu Ile His Lys Leu Met Ile Asp Leu Pro Ala Asp Ser Ala Phe
225 230 235 240
Leu Gln Ala Asn Leu His Pro Ser Asn Leu Asp Ala Ala Ile Arg Ala
245 250 255
Val Glu Asn
<210> 44
<211> 1231
<212> PRT
<213> 结核分枝杆菌
<400> 44
Met Ala Asn Ile Ser Ser Pro Phe Gly Gln Asn Glu Trp Leu Val Glu
1 5 10 15
Glu Met Tyr Arg Lys Phe Arg Asp Asp Pro Ser Ser Val Asp Pro Ser
20 25 30
Trp His Glu Phe Leu Val Asp Tyr Ser Pro Glu Pro Thr Ser Gln Pro
35 40 45
Ala Ala Glu Pro Thr Arg Val Thr Ser Pro Leu Val Ala Glu Arg Ala
50 55 60
Ala Ala Ala Ala Pro Gln Ala Pro Pro Lys Pro Ala Asp Thr Ala Ala
65 70 75 80
Ala Gly Asn Gly Val Val Ala Ala Leu Ala Ala Lys Thr Ala Val Pro
85 90 95
Pro Pro Ala Glu Gly Asp Glu Val Ala Val Leu Arg Gly Ala Ala Ala
100 105 110
Ala Val Val Lys Asn Met Ser Ala Ser Leu Glu Val Pro Thr Ala Thr
115 120 125
Ser Val Arg Ala Val Pro Ala Lys Leu Leu Ile Asp Asn Arg Ile Val
130 135 140
Ile Asn Asn Gln Leu Lys Arg Thr Arg Gly Gly Lys Ile Ser Phe Thr
145 150 155 160
His Leu Leu Gly Tyr Ala Leu Val Gln Ala Val Lys Lys Phe Pro Asn
165 170 175
Met Asn Arg His Tyr Thr Glu Val Asp Gly Lys Pro Thr Ala Val Thr
180 185 190
Pro Ala His Thr Asn Leu Gly Leu Ala Ile Asp Leu Gln Gly Lys Asp
195 200 205
Gly Lys Arg Ser Leu Val Val Ala Gly Ile Lys Arg Cys Glu Thr Met
210 215 220
Arg Phe Ala Gln Phe Val Thr Ala Tyr Glu Asp Ile Val Arg Arg Ala
225 230 235 240
Arg Asp Gly Lys Leu Thr Thr Glu Asp Phe Ala Gly Val Thr Ile Ser
245 250 255
Leu Thr Asn Pro Gly Thr Ile Gly Thr Val His Ser Val Pro Arg Leu
260 265 270
Met Pro Gly Gln Gly Ala Ile Ile Gly Val Gly Ala Met Glu Tyr Pro
275 280 285
Ala Glu Phe Gln Gly Ala Ser Glu Glu Arg Ile Ala Glu Leu Gly Ile
290 295 300
Gly Lys Leu Ile Thr Leu Thr Ser Thr Tyr Asp His Arg Ile Ile Gln
305 310 315 320
Gly Ala Glu Ser Gly Asp Phe Leu Arg Thr Ile His Glu Leu Leu Leu
325 330 335
Ser Asp Gly Phe Trp Asp Glu Val Phe Arg Glu Leu Ser Ile Pro Tyr
340 345 350
Leu Pro Val Arg Trp Ser Thr Asp Asn Pro Asp Ser Ile Val Asp Lys
355 360 365
Asn Ala Arg Val Met Asn Leu Ile Ala Ala Tyr Arg Asn Arg Gly His
370 375 380
Leu Met Ala Asp Thr Asp Pro Leu Arg Leu Asp Lys Ala Arg Phe Arg
385 390 395 400
Ser His Pro Asp Leu Glu Val Leu Thr His Gly Leu Thr Leu Trp Asp
405 410 415
Leu Asp Arg Val Phe Lys Val Asp Gly Phe Ala Gly Ala Gln Tyr Lys
420 425 430
Lys Leu Arg Asp Val Leu Gly Leu Leu Arg Asp Ala Tyr Cys Arg His
435 440 445
Ile Gly Val Glu Tyr Ala His Ile Leu Asp Pro Glu Gln Lys Glu Trp
450 455 460
Leu Glu Gln Arg Val Glu Thr Lys His Val Lys Pro Thr Val Ala Gln
465 470 475 480
Gln Lys Tyr Ile Leu Ser Lys Leu Asn Ala Ala Glu Ala Phe Glu Thr
485 490 495
Phe Leu Gln Thr Lys Tyr Val Gly Gln Lys Arg Phe Ser Leu Glu Gly
500 505 510
Ala Glu Ser Val Ile Pro Met Met Asp Ala Ala Ile Asp Gln Cys Ala
515 520 525
Glu His Gly Leu Asp Glu Val Val Ile Gly Met Pro His Arg Gly Arg
530 535 540
Leu Asn Val Leu Ala Asn Ile Val Gly Lys Pro Tyr Ser Gln Ile Phe
545 550 555 560
Thr Glu Phe Glu Gly Asn Leu Asn Pro Ser Gln Ala His Gly Ser Gly
565 570 575
Asp Val Lys Tyr His Leu Gly Ala Thr Gly Leu Tyr Leu Gln Met Phe
580 585 590
Gly Asp Asn Asp Ile Gln Val Ser Leu Thr Ala Asn Pro Ser His Leu
595 600 605
Glu Ala Val Asp Pro Val Leu Glu Gly Leu Val Arg Ala Lys Gln Asp
610 615 620
Leu Leu Asp His Gly Ser Ile Asp Ser Asp Gly Gln Arg Ala Phe Ser
625 630 635 640
Val Val Pro Leu Met Leu His Gly Asp Ala Ala Phe Ala Gly Gln Gly
645 650 655
Val Val Ala Glu Thr Leu Asn Leu Ala Asn Leu Pro Gly Tyr Arg Val
660 665 670
Gly Gly Thr Ile His Ile Ile Val Asn Asn Gln Ile Gly Phe Thr Thr
675 680 685
Ala Pro Glu Tyr Ser Arg Ser Ser Glu Tyr Cys Thr Asp Val Ala Lys
690 695 700
Met Ile Gly Ala Pro Ile Phe His Val Asn Gly Asp Asp Pro Glu Ala
705 710 715 720
Cys Val Trp Val Ala Arg Leu Ala Val Asp Phe Arg Gln Arg Phe Lys
725 730 735
Lys Asp Val Val Ile Asp Met Leu Cys Tyr Arg Arg Arg Gly His Asn
740 745 750
Glu Gly Asp Asp Pro Ser Met Thr Asn Pro Tyr Val Tyr Asp Val Val
755 760 765
Asp Thr Lys Arg Gly Ala Arg Lys Ser Tyr Thr Glu Ala Leu Ile Gly
770 775 780
Arg Gly Asp Ile Ser Met Lys Glu Ala Glu Asp Ala Leu Arg Asp Tyr
785 790 795 800
Gln Gly Gln Leu Glu Arg Val Phe Asn Glu Val Arg Glu Leu Glu Lys
805 810 815
His Gly Val Gln Pro Ser Glu Ser Val Glu Ser Asp Gln Met Ile Pro
820 825 830
Ala Gly Leu Ala Thr Ala Val Asp Lys Ser Leu Leu Ala Arg Ile Gly
835 840 845
Asp Ala Phe Leu Ala Leu Pro Asn Gly Phe Thr Ala His Pro Arg Val
850 855 860
Gln Pro Val Leu Glu Lys Arg Arg Glu Met Ala Tyr Glu Gly Lys Ile
865 870 875 880
Asp Trp Ala Phe Gly Glu Leu Leu Ala Leu Gly Ser Leu Val Ala Glu
885 890 895
Gly Lys Leu Val Arg Leu Ser Gly Gln Asp Ser Arg Arg Gly Thr Phe
900 905 910
Ser Gln Arg His Ser Val Leu Ile Asp Arg His Thr Gly Glu Glu Phe
915 920 925
Thr Pro Leu Gln Leu Leu Ala Thr Asn Ser Asp Gly Ser Pro Thr Gly
930 935 940
Gly Lys Phe Leu Val Tyr Asp Ser Pro Leu Ser Glu Tyr Ala Ala Val
945 950 955 960
Gly Phe Glu Tyr Gly Tyr Thr Val Gly Asn Pro Asp Ala Val Val Leu
965 970 975
Trp Glu Ala Gln Phe Gly Asp Phe Val Asn Gly Ala Gln Ser Ile Ile
980 985 990
Asp Glu Phe Ile Ser Ser Gly Glu Ala Lys Trp Gly Gln Leu Ser Asn
995 1000 1005
Val Val Leu Leu Leu Pro His Gly His Glu Gly Gln Gly Pro Asp
1010 1015 1020
His Thr Ser Ala Arg Ile Glu Arg Phe Leu Gln Leu Trp Ala Glu
1025 1030 1035
Gly Ser Met Thr Ile Ala Met Pro Ser Thr Pro Ser Asn Tyr Phe
1040 1045 1050
His Leu Leu Arg Arg His Ala Leu Asp Gly Ile Gln Arg Pro Leu
1055 1060 1065
Ile Val Phe Thr Pro Lys Ser Met Leu Arg His Lys Ala Ala Val
1070 1075 1080
Ser Glu Ile Lys Asp Phe Thr Glu Ile Lys Phe Arg Ser Val Leu
1085 1090 1095
Glu Glu Pro Thr Tyr Glu Asp Gly Ile Gly Asp Arg Asn Lys Val
1100 1105 1110
Ser Arg Ile Leu Leu Thr Ser Gly Lys Leu Tyr Tyr Glu Leu Ala
1115 1120 1125
Ala Arg Lys Ala Lys Asp Asn Arg Asn Asp Leu Ala Ile Val Arg
1130 1135 1140
Leu Glu Gln Leu Ala Pro Leu Pro Arg Arg Arg Leu Arg Glu Thr
1145 1150 1155
Leu Asp Arg Tyr Glu Asn Val Lys Glu Phe Phe Trp Val Gln Glu
1160 1165 1170
Glu Pro Ala Asn Gln Gly Ala Trp Pro Arg Phe Gly Leu Glu Leu
1175 1180 1185
Pro Glu Leu Leu Pro Asp Lys Leu Ala Gly Ile Lys Arg Ile Ser
1190 1195 1200
Arg Arg Ala Met Ser Ala Pro Ser Ser Gly Ser Ser Lys Val His
1205 1210 1215
Ala Val Glu Gln Gln Glu Ile Leu Asp Glu Ala Phe Gly
1220 1225 1230
<210> 45
<211> 985
<212> PRT
<213> Bradyrhizobium japonicum
<400> 45
Met Ser Arg Gln Asp Ala Asn Ala Ala Phe Ala Leu Ser Ser Phe Leu
1 5 10 15
Gln Gly Thr Asn Ala Thr Tyr Ile Asp Glu Ile Tyr Ala Arg Tyr Glu
20 25 30
Lys Asp Pro Ser Ser Val Asp Ala Glu Trp Gln Glu Phe Phe Lys Ser
35 40 45
Leu Lys Asp Gln Pro Asp Asp Val Arg Arg Asn Ala Glu Gly Pro Ser
50 55 60
Trp Glu Arg Ala Asn Trp Pro Leu Thr Pro Gln Asp Asp Leu Thr Ser
65 70 75 80
Ala Leu Asp Gly Asn Trp Ala Glu Val Glu Lys Ala Val Gly Gly Lys
85 90 95
Ile Ala Ala Lys Ala Gln Ala Lys Gly Ala Asp Ile Ser Ser Ala Asp
100 105 110
Leu Leu Gln Ala Thr Arg Asp Ser Val Arg Ala Leu Met Leu Ile Arg
115 120 125
Ser Tyr Arg Met Arg Gly His Phe His Ala Lys Leu Asp Pro Leu Gly
130 135 140
Ile Glu Ala Pro Arg Asn Arg Glu Glu Leu Asp Pro Arg Thr Tyr Gly
145 150 155 160
Phe Ser Glu Ala Asp Phe Asp Arg Lys Ile Phe Leu Asp His Val Leu
165 170 175
Gly Leu Glu Tyr Gly Thr Leu Arg Glu Ile Thr Ala Ile Cys Glu Arg
180 185 190
Thr Tyr Cys Gln Thr Leu Gly Val Glu Phe Met His Ile Ser Asn Ala
195 200 205
Ala Gln Lys Ala Trp Ile Gln Glu Arg Ile Glu Gly Pro Asp Lys Glu
210 215 220
Ile Ser Phe Thr Arg Glu Gly Arg Arg Ala Ile Leu Thr Lys Leu Val
225 230 235 240
Glu Ala Glu Gly Phe Glu Lys Phe Cys Asp Thr Lys Phe Thr Gly Thr
245 250 255
Lys Arg Phe Gly Leu Asp Gly Ala Glu Ser Leu Ile Pro Ala Leu Glu
260 265 270
Gln Ile Ile Lys Arg Gly Gly Asn Leu Gly Val Lys Glu Ile Val Leu
275 280 285
Gly Met Pro His Arg Gly Arg Leu Asn Val Leu Thr Gln Val Met Gly
290 295 300
Lys Ala His Arg Ala Leu Phe His Glu Phe Lys Gly Gly Ser Ala Asn
305 310 315 320
Pro Asp Ala Val Glu Gly Ser Gly Asp Val Lys Tyr His Leu Gly Ala
325 330 335
Ser Ser Asp Arg Glu Phe Asp Gly Asn Arg Ile His Leu Ser Leu Thr
340 345 350
Ala Asn Pro Ser His Leu Glu Ile Val Asp Pro Val Val Leu Gly Lys
355 360 365
Val Arg Ala Lys Gln Asp Gln His Gly Asp Pro Pro Asp Met Arg Ile
370 375 380
Ser Val Met Pro Leu Leu Met His Gly Asp Ala Ala Phe Ala Gly Gln
385 390 395 400
Gly Val Val Ala Glu Cys Phe Gly Leu Ser Asp Leu Lys Gly Tyr Arg
405 410 415
Thr Gly Gly Ser Val His Phe Ile Val Asn Asn Gln Ile Gly Phe Thr
420 425 430
Thr Tyr Pro Arg Tyr Ser Arg Ser Ser Pro Tyr Pro Ser Asp Val Ala
435 440 445
Lys Met Ile Asp Ala Pro Ile Phe His Val Asn Gly Asp Asp Pro Glu
450 455 460
Ala Val Val Phe Ala Ala Lys Val Ala Thr Glu Phe Arg Gln Lys Phe
465 470 475 480
His Lys Pro Val Val Ile Asp Met Phe Cys Tyr Arg Arg His Gly His
485 490 495
Asn Glu Gly Asp Glu Pro Ala Phe Thr Gln Pro Val Met Tyr Lys Lys
500 505 510
Ile Ala Ala His Pro Ser Thr Leu Glu Leu Tyr Ala Arg Arg Leu Ile
515 520 525
Ser Glu Gly Val Met Thr Glu Gly Glu Val Asp Lys Ala Lys Ala Asp
530 535 540
Trp Arg Ala Arg Leu Asp Ala Glu Phe Glu Ala Gly Thr Ser Tyr Lys
545 550 555 560
Pro Asn Lys Ala Asp Trp Leu Asp Gly Lys Trp Ala Gly Phe Lys Ile
565 570 575
Ala Asp Gln Glu Glu Asp Ala Arg Arg Gly Val Thr Gly Val Asp Ile
580 585 590
Thr Ala Leu Lys Asp Ile Gly Arg Lys Ile Thr Lys Val Pro Asp Gly
595 600 605
Phe Arg Val His Arg Thr Ile Gln Arg Phe Leu Glu Asn Arg Ser Lys
610 615 620
Ala Ile Asp Ser Gly Ala Gly Ile Asp Trp Ala Thr Gly Glu Ala Leu
625 630 635 640
Ala Phe Cys Ser Leu Leu Asn Glu Asn His His Val Arg Leu Ser Gly
645 650 655
Gln Asp Ser Glu Arg Gly Thr Phe Ser Gln Arg His Ser Val Leu Ile
660 665 670
Asp Gln Glu Asp Glu Ser Arg Tyr Thr Pro Phe Asn His Leu Gly His
675 680 685
Glu Gln Gly His Tyr Glu Val Ile Asn Ser Leu Leu Ser Glu Glu Ala
690 695 700
Val Leu Gly Phe Glu Tyr Gly Tyr Ser Leu Ala Glu Pro Asn Thr Leu
705 710 715 720
Thr Leu Trp Glu Ala Gln Phe Gly Asp Phe Ala Asn Gly Ala Gln Val
725 730 735
Val Phe Asp Gln Phe Ile Ser Ser Gly Glu Arg Lys Trp Leu Arg Met
740 745 750
Ser Gly Leu Val Cys Leu Leu Pro His Gly Tyr Glu Gly Gln Gly Pro
755 760 765
Glu His Ser Ser Ala Arg Leu Glu Arg Tyr Leu Gln Met Cys Ala Glu
770 775 780
Asp Asn Met Gln Val Val Tyr Pro Thr Thr Pro Ala Asn Tyr Phe His
785 790 795 800
Val Leu Arg Arg Gln Leu His Arg Glu Ile Arg Lys Pro Leu Ile Leu
805 810 815
Met Thr Pro Lys Ser Leu Leu Arg His Lys Arg Ala Val Ser Arg Leu
820 825 830
Glu Glu Leu Ala Lys Gly Thr Thr Phe His Arg Ile Leu Tyr Asp Asp
835 840 845
Ala Gln Met Leu Pro Thr Asp Ala Ile Lys Leu Val Pro Asp Glu Lys
850 855 860
Ile Arg Arg Ile Val Leu Cys Ser Gly Lys Val Tyr Tyr Asp Leu Tyr
865 870 875 880
Glu Glu Arg Glu Lys Arg Gly Ile Asp Asp Ile Tyr Leu Met Arg Val
885 890 895
Glu Gln Leu Tyr Pro Val Pro Leu Lys Ala Leu Val Ala Glu Leu Ser
900 905 910
Arg Phe Lys Lys Ala Glu Val Val Trp Cys Gln Glu Glu Pro Arg Asn
915 920 925
Met Gly Ala Trp His Phe Ile Glu Pro Tyr Leu Glu Trp Val Leu Asn
930 935 940
Gln Val Asn Gly Val Ser Arg Arg Pro Arg Tyr Val Gly Arg Ala Ala
945 950 955 960
Ser Ala Ala Thr Ala Thr Gly Leu Met Ser Lys His Gln Ala Gln Leu
965 970 975
Lys Ala Phe Leu Asp Glu Ala Leu Ser
980 985
<210> 46
<211> 995
<212> PRT
<213> Rhizobium loti
<400> 46
Met Ala Arg Gln Asp Gln Thr Asn Asp Gln Phe Ser Leu Thr Ser Phe
1 5 10 15
Leu Tyr Gly Gly Asn Ala Asp Tyr Ile Asp Ala Leu Tyr Ala Ala Tyr
20 25 30
Glu Asp Asp Pro Ala Ser Val Asn Pro Glu Trp Gln Glu Phe Phe Ala
35 40 45
Gly Leu Lys Asp Asp Ala Gly Asp Val Arg Arg Asn Ala Lys Gly Ala
50 55 60
Ser Trp Ala Lys Pro Ser Trp Pro Leu Gln Ala Asn Gly Glu Leu Val
65 70 75 80
Ser Ala Leu Asp Gly Asn Trp Gly Ile Val Glu Lys His Leu Glu Lys
85 90 95
Lys Val Lys Asp Lys Ala Val Thr Asn Gly Val Val Leu Ser Asp Ala
100 105 110
Asp Val His Gln Ala Thr Arg Asp Ser Val Arg Ala Ile Met Met Ile
115 120 125
Arg Ala Tyr Arg Met Arg Gly His Leu His Ala Asn Leu Asp Pro Leu
130 135 140
Gly Ile Ala Lys Pro Leu Glu Asp Tyr Asn Glu Leu Ser Pro Glu Asn
145 150 155 160
Tyr Gly Phe Thr Ala Ala Asp Tyr Asp Arg Pro Ile Phe Leu Asp Asn
165 170 175
Val Leu Gly Leu Glu Phe Gly Thr Ile Arg Gln Met Leu Glu Ile Leu
180 185 190
Thr Arg Thr Tyr Cys Ser Thr Leu Gly Val Glu Phe Met His Ile Ser
195 200 205
Asp Pro Glu Glu Lys Ala Trp Ile Gln Ala Arg Ile Glu Gly Ala Asp
210 215 220
Lys Glu Ile Ser Phe Thr Asn Thr Gly Lys Lys Ala Ile Leu Gln Lys
225 230 235 240
Leu Val Glu Ala Glu Gly Phe Glu Gln Phe Ile Asp Val Lys Tyr Lys
245 250 255
Gly Thr Lys Arg Phe Gly Leu Asp Gly Gly Glu Ala Leu Ile Pro Ala
260 265 270
Leu Glu Gln Ile Val Lys Arg Gly Gly Gln Leu Gly Met Lys Glu Ile
275 280 285
Val Leu Gly Met Ala His Arg Gly Arg Leu Asn Val Leu Ser Gln Val
290 295 300
Met Ala Lys Pro His Arg Ala Ile Phe His Glu Phe Lys Gly Gly Ser
305 310 315 320
Ala Ala Pro Asp Glu Val Glu Gly Ser Gly Asp Val Lys Tyr His Leu
325 330 335
Gly Ala Ser Ser Asp Arg Glu Phe Asp Gly Asn Lys Val His Leu Ser
340 345 350
Leu Thr Ala Asn Pro Ser His Leu Glu Ile Val Asp Pro Val Val Met
355 360 365
Gly Lys Ala Arg Ala Lys Gln Asp Tyr Leu Phe Gly Arg Gly Arg Glu
370 375 380
Glu Ile Val Pro Leu Glu Glu Arg Ala Lys Val Leu Pro Leu Leu Leu
385 390 395 400
His Gly Asp Ala Ala Phe Ala Gly Gln Gly Val Ile Ala Glu Ile Leu
405 410 415
Gly Leu Ser Gly Leu Arg Gly His Arg Val Ala Gly Thr Leu His Phe
420 425 430
Ile Ile Asn Asn Gln Ile Gly Phe Thr Thr Asn Pro Arg Phe Ser Arg
435 440 445
Ser Ser Pro Tyr Pro Ser Asp Val Ala Lys Met Ile Glu Ala Pro Ile
450 455 460
Phe His Val Asn Gly Asp Asp Pro Glu Ala Val Val His Ala Thr Lys
465 470 475 480
Val Ala Ile Glu Phe Arg Met Lys Phe His Lys Pro Val Val Val Asp
485 490 495
Met Phe Cys Tyr Arg Arg Phe Gly His Asn Glu Gly Asp Glu Pro Ala
500 505 510
Phe Thr Gln Pro Ile Met Tyr Arg Asn Ile Arg Thr His Lys Thr Thr
515 520 525
Val Gln Ile Tyr Ala Asp Arg Leu Ile Ala Glu Gly His Ile Thr Gln
530 535 540
Ala Glu Leu Asp Gln Met Lys Ala Asp Trp Arg Ala His Leu Glu Ser
545 550 555 560
Glu Trp Glu Val Gly Gln His Tyr Lys Pro Asn Lys Ala Asp Trp Leu
565 570 575
Asp Gly Ala Trp Ser Gly Leu Arg Thr Ala Asp Asn Gln Asp Glu Gln
580 585 590
Arg Arg Gly Lys Thr Ala Val Pro Val Lys Thr Leu Lys Glu Ile Gly
595 600 605
Lys Lys Leu Thr Glu Val Pro Lys Gly Phe Glu Ala His Lys Thr Ile
610 615 620
Ile Arg Phe Leu Glu Asn Arg Arg Glu Ala Ile Glu Ser Gly Glu Gly
625 630 635 640
Ile Asp Trp Ser Thr Ala Glu Ala Leu Ala Phe Gly Ala Ile Leu Leu
645 650 655
Asp Gly Asn Pro Ile Arg Leu Ser Gly Gln Asp Ser Glu Arg Gly Thr
660 665 670
Phe Ser Gln Arg His Ser Val Leu Tyr Asp Gln Arg Asp Glu Thr Arg
675 680 685
Tyr Ile Pro Leu Asn Asn Leu Ser Ala Ala Gln Ala Gly Tyr Glu Val
690 695 700
Ile Asn Ser Met Leu Ser Glu Glu Ala Val Leu Gly Phe Glu Tyr Gly
705 710 715 720
Tyr Ser Leu Ala Glu Pro Lys Ala Leu Thr Leu Trp Glu Ala Gln Phe
725 730 735
Gly Asp Phe Ala Asn Gly Ala Gln Val Val Phe Asp Gln Phe Ile Ser
740 745 750
Ser Gly Glu Arg Lys Trp Leu Arg Met Ser Gly Leu Val Cys Leu Leu
755 760 765
Pro His Gly Tyr Glu Gly Gln Gly Pro Glu His Ser Ser Ala Arg Leu
770 775 780
Glu Arg Phe Leu Gln Leu Cys Ala Glu Asp Asn Met Gln Val Ala Asn
785 790 795 800
Cys Thr Thr Pro Ala Asn Tyr Phe His Ile Leu Arg Arg Gln Leu Lys
805 810 815
Arg Asp Phe Arg Lys Pro Leu Ile Leu Met Thr Pro Lys Ser Leu Leu
820 825 830
Arg His Lys Arg Ala Val Ser Thr Leu Pro Glu Ile Ser Gly Glu Ser
835 840 845
Ser Phe His Arg Leu Leu Trp Asp Asp Ala Gln Leu Leu Pro Asn Gln
850 855 860
Pro Ile Lys Leu Thr Lys Asp Ser Lys Ile Arg Arg Val Val Leu Cys
865 870 875 880
Ser Gly Lys Val Tyr Tyr Asp Leu Tyr Glu Glu Arg Glu Lys Arg Gly
885 890 895
Ile Asn Asp Ile Tyr Leu Leu Arg Val Glu Gln Leu Tyr Pro Phe Pro
900 905 910
Ala Lys Ala Leu Ile Thr Glu Leu Ser Arg Phe Arg Asn Ala Glu Met
915 920 925
Val Trp Cys Gln Glu Glu Pro Lys Asn Met Gly Ala Trp Ser Phe Ile
930 935 940
Asp Pro Tyr Leu Glu Trp Val Leu Ala His Ile Asp Ala Lys His Gln
945 950 955 960
Arg Val Arg Tyr Thr Gly Arg Pro Ala Ala Ala Ser Pro Ala Thr Gly
965 970 975
Leu Met Ser Lys His Leu Ala Gln Leu Ala Ala Leu Leu Glu Asp Ala
980 985 990
Leu Gly Glu
995
<210> 47
<211> 547
<212> PRT
<213> 乳酸乳球菌
<400> 47
Met Tyr Thr Val Gly Asp Tyr Leu Leu Asp Arg Leu His Glu Leu Gly
1 5 10 15
Ile Glu Glu Ile Phe Gly Val Pro Gly Asp Tyr Asn Leu Gln Phe Leu
20 25 30
Asp Gln Ile Ile Ser Arg Glu Asp Met Lys Trp Ile Gly Asn Ala Asn
35 40 45
Glu Leu Asn Ala Ser Tyr Met Ala Asp Gly Tyr Ala Arg Thr Lys Lys
50 55 60
Ala Ala Ala Phe Leu Thr Thr Phe Gly Val Gly Glu Leu Ser Ala Ile
65 70 75 80
Asn Gly Leu Ala Gly Ser Tyr Ala Glu Asn Leu Pro Val Val Glu Ile
85 90 95
Val Gly Ser Pro Thr Ser Lys Val Gln Asn Asp Gly Lys Phe Val His
100 105 110
His Thr Leu Ala Asp Gly Asp Phe Lys His Phe Met Lys Met His Glu
115 120 125
Pro Val Thr Ala Ala Arg Thr Leu Leu Thr Ala Glu Asn Ala Thr Tyr
130 135 140
Glu Ile Asp Arg Val Leu Ser Gln Leu Leu Lys Glu Arg Lys Pro Val
145 150 155 160
Tyr Ile Asn Leu Pro Val Asp Val Ala Ala Ala Lys Ala Glu Lys Pro
165 170 175
Ala Leu Ser Leu Glu Lys Glu Ser Ser Thr Thr Asn Thr Thr Glu Gln
180 185 190
Val Ile Leu Ser Lys Ile Glu Glu Ser Leu Lys Asn Ala Gln Lys Pro
195 200 205
Val Val Ile Ala Gly His Glu Val Ile Ser Phe Gly Leu Glu Lys Thr
210 215 220
Val Thr Gln Phe Val Ser Glu Thr Lys Leu Pro Ile Thr Thr Leu Asn
225 230 235 240
Phe Gly Lys Ser Ala Val Asp Glu Ser Leu Pro Ser Phe Leu Gly Ile
245 250 255
Tyr Asn Gly Lys Leu Ser Glu Ile Ser Leu Lys Asn Phe Val Glu Ser
260 265 270
Ala Asp Phe Ile Leu Met Leu Gly Val Lys Leu Thr Asp Ser Ser Thr
275 280 285
Gly Ala Phe Thr His His Leu Asp Glu Asn Lys Met Ile Ser Leu Asn
290 295 300
Ile Asp Glu Gly Ile Ile Phe Asn Lys Val Val Glu Asp Phe Asp Phe
305 310 315 320
Arg Ala Val Val Ser Ser Leu Ser Glu Leu Lys Gly Ile Glu Tyr Glu
325 330 335
Gly Gln Tyr Ile Asp Lys Gln Tyr Glu Glu Phe Ile Pro Ser Ser Ala
340 345 350
Pro Leu Ser Gln Asp Arg Leu Trp Gln Ala Val Glu Ser Leu Thr Gln
355 360 365
Ser Asn Glu Thr Ile Val Ala Glu Gln Gly Thr Ser Phe Phe Gly Ala
370 375 380
Ser Thr Ile Phe Leu Lys Ser Asn Ser Arg Phe Ile Gly Gln Pro Leu
385 390 395 400
Trp Gly Ser Ile Gly Tyr Thr Phe Pro Ala Ala Leu Gly Ser Gln Ile
405 410 415
Ala Asp Lys Glu Ser Arg His Leu Leu Phe Ile Gly Asp Gly Ser Leu
420 425 430
Gln Leu Thr Val Gln Glu Leu Gly Leu Ser Ile Arg Glu Lys Leu Asn
435 440 445
Pro Ile Cys Phe Ile Ile Asn Asn Asp Gly Tyr Thr Val Glu Arg Glu
450 455 460
Ile His Gly Pro Thr Gln Ser Tyr Asn Asp Ile Pro Met Trp Asn Tyr
465 470 475 480
Ser Lys Leu Pro Glu Thr Phe Gly Ala Thr Glu Asp Arg Val Val Ser
485 490 495
Lys Ile Val Arg Thr Glu Asn Glu Phe Val Ser Val Met Lys Glu Ala
500 505 510
Gln Ala Asp Val Asn Arg Met Tyr Trp Ile Glu Leu Val Leu Glu Lys
515 520 525
Glu Asp Ala Pro Lys Leu Leu Lys Lys Met Gly Lys Leu Phe Ala Glu
530 535 540
Gln Asn Lys
545
<210> 48
<211> 1728
<212> DNA
<213> 东方伊萨酵母
<400> 48
atgactgaca aaatctccct aggtacttat ctgtttgaaa agttaaagga agcaggctct 60
tattccatct ttggtgttcc tggtgatttc aatttggcat tgttggacca cgtcaaggaa 120
gttgaaggca ttagatgggt cggtaacgct aacgagttga atgccggcta cgaagctgat 180
ggttatgcaa gaatcaatgg atttgcatcc ctaatcacca cctttggtgt cggtgaattg 240
tctgccgtca atgccattgc aggttcttat gctgaacacg tcccattgat ccatattgtt 300
ggtatgcctt ccttgtctgc tatgaagaac aacttgttgt tacaccatac cttgggtgac 360
acaagattcg acaacttcac cgaaatgtca aagaaaatca gtgcaaaggt tgaaattgtt 420
tacgatttgg aatcagctcc aaaattaatt aataacttga ttgaaaccgc ttatcacaca 480
aagagaccag tctacttggg acttccttcc aactttgctg atgaattggt tccagcggca 540
ttagttaagg aaaacaagtt acatttagaa gaacctctaa acaaccccgt tgctgaagaa 600
gaattcattc ataacgttgt tgaaatggtc aagaaggcag aaaaaccaat cattctcgtt 660
gacgcttgtg ctgcaagaca taacatttct aaggaagtga gagagttggc taaattgact 720
aaattccctg tcttcaccac cccaatgggt aaatctactg ttgatgaaga tgatgaagaa 780
ttctttggct tatacttggg ttctctatct gctccagatg ttaaggacat tgttggccca 840
accgattgta tcttatcctt aggtggttta ccttctgatt tcaacaccgg ttccttctca 900
tatggttaca ccactaagaa tgtcgttgaa ttccattcca actactgtaa attcaaatct 960
gcaacttatg aaaacttgat gatgaagggc gcagtccaaa gattgatcag cgaattgaag 1020
aatattaagt attccaatgt ctcaacttta tctccaccaa aatctaaatt tgcttacgaa 1080
tctgcaaagg ttgctccaga aggtatcatc actcaagatt acctgtggaa gagattatct 1140
tacttcttaa agccaagaga tatcattgtc actgaaactg gtacttcctc ctttggtgtc 1200
ttggctaccc acttaccaag agattcaaag tctatctccc aagtcttatg gggttccatt 1260
ggtttctcct taccagctgc agttggtgct gcatttgctg ctgaagatgc acacaaacaa 1320
actggcgaac aagaaagaag aactgttttg tttattggtg atggttcttt acaattgact 1380
gtccaatcaa tctcagatgc tgcaagatgg aacatcaagc catacatctt catcttaaac 1440
aacagaggtt acactatcga aaagttgatc cacggtcgtc atgaggacta caaccaaatt 1500
caaccatggg atcaccaatt gttattgaag ctctttgctg acaagaccca atatgaaaac 1560
catgttgtta aatccgctaa ggacttggac gctttgatga aggatgaagc attcaacaag 1620
gaagataaga ttagagtcat tgaattattc ttggatgaat tcgatgctcc agaaatcttg 1680
gttgctcaag ctaaattatc tgatgaaatc aactctaaag ccgcttaa 1728
<210> 49
<211> 575
<212> PRT
<213> 东方伊萨酵母
<400> 49
Met Thr Asp Lys Ile Ser Leu Gly Thr Tyr Leu Phe Glu Lys Leu Lys
1 5 10 15
Glu Ala Gly Ser Tyr Ser Ile Phe Gly Val Pro Gly Asp Phe Asn Leu
20 25 30
Ala Leu Leu Asp His Val Lys Glu Val Glu Gly Ile Arg Trp Val Gly
35 40 45
Asn Ala Asn Glu Leu Asn Ala Gly Tyr Glu Ala Asp Gly Tyr Ala Arg
50 55 60
Ile Asn Gly Phe Ala Ser Leu Ile Thr Thr Phe Gly Val Gly Glu Leu
65 70 75 80
Ser Ala Val Asn Ala Ile Ala Gly Ser Tyr Ala Glu His Val Pro Leu
85 90 95
Ile His Ile Val Gly Met Pro Ser Leu Ser Ala Met Lys Asn Asn Leu
100 105 110
Leu Leu His His Thr Leu Gly Asp Thr Arg Phe Asp Asn Phe Thr Glu
115 120 125
Met Ser Lys Lys Ile Ser Ala Lys Val Glu Ile Val Tyr Asp Leu Glu
130 135 140
Ser Ala Pro Lys Leu Ile Asn Asn Leu Ile Glu Thr Ala Tyr His Thr
145 150 155 160
Lys Arg Pro Val Tyr Leu Gly Leu Pro Ser Asn Phe Ala Asp Glu Leu
165 170 175
Val Pro Ala Ala Leu Val Lys Glu Asn Lys Leu His Leu Glu Glu Pro
180 185 190
Leu Asn Asn Pro Val Ala Glu Glu Glu Phe Ile His Asn Val Val Glu
195 200 205
Met Val Lys Lys Ala Glu Lys Pro Ile Ile Leu Val Asp Ala Cys Ala
210 215 220
Ala Arg His Asn Ile Ser Lys Glu Val Arg Glu Leu Ala Lys Leu Thr
225 230 235 240
Lys Phe Pro Val Phe Thr Thr Pro Met Gly Lys Ser Thr Val Asp Glu
245 250 255
Asp Asp Glu Glu Phe Phe Gly Leu Tyr Leu Gly Ser Leu Ser Ala Pro
260 265 270
Asp Val Lys Asp Ile Val Gly Pro Thr Asp Cys Ile Leu Ser Leu Gly
275 280 285
Gly Leu Pro Ser Asp Phe Asn Thr Gly Ser Phe Ser Tyr Gly Tyr Thr
290 295 300
Thr Lys Asn Val Val Glu Phe His Ser Asn Tyr Cys Lys Phe Lys Ser
305 310 315 320
Ala Thr Tyr Glu Asn Leu Met Met Lys Gly Ala Val Gln Arg Leu Ile
325 330 335
Ser Glu Leu Lys Asn Ile Lys Tyr Ser Asn Val Ser Thr Leu Ser Pro
340 345 350
Pro Lys Ser Lys Phe Ala Tyr Glu Ser Ala Lys Val Ala Pro Glu Gly
355 360 365
Ile Ile Thr Gln Asp Tyr Leu Trp Lys Arg Leu Ser Tyr Phe Leu Lys
370 375 380
Pro Arg Asp Ile Ile Val Thr Glu Thr Gly Thr Ser Ser Phe Gly Val
385 390 395 400
Leu Ala Thr His Leu Pro Arg Asp Ser Lys Ser Ile Ser Gln Val Leu
405 410 415
Trp Gly Ser Ile Gly Phe Ser Leu Pro Ala Ala Val Gly Ala Ala Phe
420 425 430
Ala Ala Glu Asp Ala His Lys Gln Thr Gly Glu Gln Glu Arg Arg Thr
435 440 445
Val Leu Phe Ile Gly Asp Gly Ser Leu Gln Leu Thr Val Gln Ser Ile
450 455 460
Ser Asp Ala Ala Arg Trp Asn Ile Lys Pro Tyr Ile Phe Ile Leu Asn
465 470 475 480
Asn Arg Gly Tyr Thr Ile Glu Lys Leu Ile His Gly Arg His Glu Asp
485 490 495
Tyr Asn Gln Ile Gln Pro Trp Asp His Gln Leu Leu Leu Lys Leu Phe
500 505 510
Ala Asp Lys Thr Gln Tyr Glu Asn His Val Val Lys Ser Ala Lys Asp
515 520 525
Leu Asp Ala Leu Met Lys Asp Glu Ala Phe Asn Lys Glu Asp Lys Ile
530 535 540
Arg Val Ile Glu Leu Phe Leu Asp Glu Phe Asp Ala Pro Glu Ile Leu
545 550 555 560
Val Ala Gln Ala Lys Leu Ser Asp Glu Ile Asn Ser Lys Ala Ala
565 570 575
<210> 50
<211> 563
<212> PRT
<213> 酿酒酵母
<400> 50
Met Ser Glu Ile Thr Leu Gly Lys Tyr Leu Phe Glu Arg Leu Lys Gln
1 5 10 15
Val Asn Val Asn Thr Val Phe Gly Leu Pro Gly Asp Phe Asn Leu Ser
20 25 30
Leu Leu Asp Lys Ile Tyr Glu Val Glu Gly Met Arg Trp Ala Gly Asn
35 40 45
Ala Asn Glu Leu Asn Ala Ala Tyr Ala Ala Asp Gly Tyr Ala Arg Ile
50 55 60
Lys Gly Met Ser Cys Ile Ile Thr Thr Phe Gly Val Gly Glu Leu Ser
65 70 75 80
Ala Leu Asn Gly Ile Ala Gly Ser Tyr Ala Glu His Val Gly Val Leu
85 90 95
His Val Val Gly Val Pro Ser Ile Ser Ala Gln Ala Lys Gln Leu Leu
100 105 110
Leu His His Thr Leu Gly Asn Gly Asp Phe Thr Val Phe His Arg Met
115 120 125
Ser Ala Asn Ile Ser Glu Thr Thr Ala Met Ile Thr Asp Ile Ala Thr
130 135 140
Ala Pro Ala Glu Ile Asp Arg Cys Ile Arg Thr Thr Tyr Val Thr Gln
145 150 155 160
Arg Pro Val Tyr Leu Gly Leu Pro Ala Asn Leu Val Asp Leu Asn Val
165 170 175
Pro Ala Lys Leu Leu Gln Thr Pro Ile Asp Met Ser Leu Lys Pro Asn
180 185 190
Asp Ala Glu Ser Glu Lys Glu Val Ile Asp Thr Ile Leu Ala Leu Val
195 200 205
Lys Asp Ala Lys Asn Pro Val Ile Leu Ala Asp Ala Cys Cys Ser Arg
210 215 220
His Asp Val Lys Ala Glu Thr Lys Lys Leu Ile Asp Leu Thr Gln Phe
225 230 235 240
Pro Ala Phe Val Thr Pro Met Gly Lys Gly Ser Ile Asp Glu Gln His
245 250 255
Pro Arg Tyr Gly Gly Val Tyr Val Gly Thr Leu Ser Lys Pro Glu Val
260 265 270
Lys Glu Ala Val Glu Ser Ala Asp Leu Ile Leu Ser Val Gly Ala Leu
275 280 285
Leu Ser Asp Phe Asn Thr Gly Ser Phe Ser Tyr Ser Tyr Lys Thr Lys
290 295 300
Asn Ile Val Glu Phe His Ser Asp His Met Lys Ile Arg Asn Ala Thr
305 310 315 320
Phe Pro Gly Val Gln Met Lys Phe Val Leu Gln Lys Leu Leu Thr Thr
325 330 335
Ile Ala Asp Ala Ala Lys Gly Tyr Lys Pro Val Ala Val Pro Ala Arg
340 345 350
Thr Pro Ala Asn Ala Ala Val Pro Ala Ser Thr Pro Leu Lys Gln Glu
355 360 365
Trp Met Trp Asn Gln Leu Gly Asn Phe Leu Gln Glu Gly Asp Val Val
370 375 380
Ile Ala Glu Thr Gly Thr Ser Ala Phe Gly Ile Asn Gln Thr Thr Phe
385 390 395 400
Pro Asn Asn Thr Tyr Gly Ile Ser Gln Val Leu Trp Gly Ser Ile Gly
405 410 415
Phe Thr Thr Gly Ala Thr Leu Gly Ala Ala Phe Ala Ala Glu Glu Ile
420 425 430
Asp Pro Lys Lys Arg Val Ile Leu Phe Ile Gly Asp Gly Ser Leu Gln
435 440 445
Leu Thr Val Gln Glu Ile Ser Thr Met Ile Arg Trp Gly Leu Lys Pro
450 455 460
Tyr Leu Phe Val Leu Asn Asn Asp Gly Tyr Thr Ile Glu Lys Leu Ile
465 470 475 480
His Gly Pro Lys Ala Gln Tyr Asn Glu Ile Gln Gly Trp Asp His Leu
485 490 495
Ser Leu Leu Pro Thr Phe Gly Ala Lys Asp Tyr Glu Thr His Arg Val
500 505 510
Ala Thr Thr Gly Glu Trp Asp Lys Leu Thr Gln Asp Lys Ser Phe Asn
515 520 525
Asp Asn Ser Lys Ile Arg Met Ile Glu Ile Met Leu Pro Val Phe Asp
530 535 540
Ala Pro Gln Asn Leu Val Glu Gln Ala Lys Leu Thr Ala Ala Thr Asn
545 550 555 560
Ala Lys Gln
<210> 51
<211> 563
<212> PRT
<213> 乳酸克鲁维酵母(Kluyveromyces lactis)
<400> 51
Met Ser Glu Ile Thr Leu Gly Arg Tyr Leu Phe Glu Arg Leu Lys Gln
1 5 10 15
Val Glu Val Gln Thr Ile Phe Gly Leu Pro Gly Asp Phe Asn Leu Ser
20 25 30
Leu Leu Asp Asn Ile Tyr Glu Val Pro Gly Met Arg Trp Ala Gly Asn
35 40 45
Ala Asn Glu Leu Asn Ala Ala Tyr Ala Ala Asp Gly Tyr Ala Arg Leu
50 55 60
Lys Gly Met Ser Cys Ile Ile Thr Thr Phe Gly Val Gly Glu Leu Ser
65 70 75 80
Ala Leu Asn Gly Ile Ala Gly Ser Tyr Ala Glu His Val Gly Val Leu
85 90 95
His Val Val Gly Val Pro Ser Val Ser Ser Gln Ala Lys Gln Leu Leu
100 105 110
Leu His His Thr Leu Gly Asn Gly Asp Phe Thr Val Phe His Arg Met
115 120 125
Ser Ser Asn Ile Ser Glu Thr Thr Ala Met Ile Thr Asp Ile Asn Thr
130 135 140
Ala Pro Ala Glu Ile Asp Arg Cys Ile Arg Thr Thr Tyr Val Ser Gln
145 150 155 160
Arg Pro Val Tyr Leu Gly Leu Pro Ala Asn Leu Val Asp Leu Thr Val
165 170 175
Pro Ala Ser Leu Leu Asp Thr Pro Ile Asp Leu Ser Leu Lys Pro Asn
180 185 190
Asp Pro Glu Ala Glu Glu Glu Val Ile Glu Asn Val Leu Gln Leu Ile
195 200 205
Lys Glu Ala Lys Asn Pro Val Ile Leu Ala Asp Ala Cys Cys Ser Arg
210 215 220
His Asp Ala Lys Ala Glu Thr Lys Lys Leu Ile Asp Leu Thr Gln Phe
225 230 235 240
Pro Ala Phe Val Thr Pro Met Gly Lys Gly Ser Ile Asp Glu Lys His
245 250 255
Pro Arg Phe Gly Gly Val Tyr Val Gly Thr Leu Ser Ser Pro Ala Val
260 265 270
Lys Glu Ala Val Glu Ser Ala Asp Leu Val Leu Ser Val Gly Ala Leu
275 280 285
Leu Ser Asp Phe Asn Thr Gly Ser Phe Ser Tyr Ser Tyr Lys Thr Lys
290 295 300
Asn Ile Val Glu Phe His Ser Asp Tyr Thr Lys Ile Arg Ser Ala Thr
305 310 315 320
Phe Pro Gly Val Gln Met Lys Phe Ala Leu Gln Lys Leu Leu Thr Lys
325 330 335
Val Ala Asp Ala Ala Lys Gly Tyr Lys Pro Val Pro Val Pro Ser Glu
340 345 350
Pro Glu His Asn Glu Ala Val Ala Asp Ser Thr Pro Leu Lys Gln Glu
355 360 365
Trp Val Trp Thr Gln Val Gly Glu Phe Leu Arg Glu Gly Asp Val Val
370 375 380
Ile Thr Glu Thr Gly Thr Ser Ala Phe Gly Ile Asn Gln Thr His Phe
385 390 395 400
Pro Asn Asn Thr Tyr Gly Ile Ser Gln Val Leu Trp Gly Ser Ile Gly
405 410 415
Phe Thr Thr Gly Ala Thr Leu Gly Ala Ala Phe Ala Ala Glu Glu Ile
420 425 430
Asp Pro Lys Lys Arg Val Ile Leu Phe Ile Gly Asp Gly Ser Leu Gln
435 440 445
Leu Thr Val Gln Glu Ile Ser Thr Met Ile Arg Trp Gly Leu Lys Pro
450 455 460
Tyr Leu Phe Val Leu Asn Asn Asp Gly Tyr Thr Ile Glu Arg Leu Ile
465 470 475 480
His Gly Glu Thr Ala Gln Tyr Asn Cys Ile Gln Asn Trp Gln His Leu
485 490 495
Glu Leu Leu Pro Thr Phe Gly Ala Lys Asp Tyr Glu Ala Val Arg Val
500 505 510
Ser Thr Thr Gly Glu Trp Asn Lys Leu Thr Thr Asp Glu Lys Phe Gln
515 520 525
Asp Asn Thr Arg Ile Arg Leu Ile Glu Val Met Leu Pro Thr Met Asp
530 535 540
Ala Pro Ser Asn Leu Val Lys Gln Ala Gln Leu Thr Ala Ala Thr Asn
545 550 555 560
Ala Lys Asn
<210> 52
<211> 568
<212> PRT
<213> 运动发酵单胞菌(Zymomonas mobilis)
<400> 52
Met Ser Tyr Thr Val Gly Thr Tyr Leu Ala Glu Arg Leu Val Gln Ile
1 5 10 15
Gly Leu Lys His His Phe Ala Val Ala Gly Asp Tyr Asn Leu Val Leu
20 25 30
Leu Asp Asn Leu Leu Leu Asn Lys Asn Met Glu Gln Val Tyr Cys Cys
35 40 45
Asn Glu Leu Asn Cys Gly Phe Ser Ala Glu Gly Tyr Ala Arg Ala Lys
50 55 60
Gly Ala Ala Ala Ala Val Val Thr Tyr Ser Val Gly Ala Leu Ser Ala
65 70 75 80
Phe Asp Ala Ile Gly Gly Ala Tyr Ala Glu Asn Leu Pro Val Ile Leu
85 90 95
Ile Ser Gly Ala Pro Asn Asn Asn Asp His Ala Ala Gly His Val Leu
100 105 110
His His Ala Leu Gly Lys Thr Asp Tyr His Tyr Gln Leu Glu Met Ala
115 120 125
Lys Asn Ile Thr Ala Ala Ala Glu Ala Ile Tyr Thr Pro Glu Glu Ala
130 135 140
Pro Ala Lys Ile Asp His Val Ile Lys Thr Ala Leu Arg Glu Lys Lys
145 150 155 160
Pro Val Tyr Leu Glu Ile Ala Cys Asn Ile Ala Ser Met Pro Cys Ala
165 170 175
Ala Pro Gly Pro Ala Ser Ala Leu Phe Asn Asp Glu Ala Ser Asp Glu
180 185 190
Ala Ser Leu Asn Ala Ala Val Glu Glu Thr Leu Lys Phe Ile Ala Asn
195 200 205
Arg Asp Lys Val Ala Val Leu Val Gly Ser Lys Leu Arg Ala Ala Gly
210 215 220
Ala Glu Glu Ala Ala Val Lys Phe Ala Asp Ala Leu Gly Gly Ala Val
225 230 235 240
Ala Thr Met Ala Ala Ala Lys Ser Phe Phe Pro Glu Glu Asn Pro His
245 250 255
Tyr Ile Gly Thr Ser Trp Gly Glu Val Ser Tyr Pro Gly Val Glu Lys
260 265 270
Thr Met Lys Glu Ala Asp Ala Val Ile Ala Leu Ala Pro Val Phe Asn
275 280 285
Asp Tyr Ser Thr Thr Gly Trp Thr Asp Ile Pro Asp Pro Lys Lys Leu
290 295 300
Val Leu Ala Glu Pro Arg Ser Val Val Val Asn Gly Ile Arg Phe Pro
305 310 315 320
Ser Val His Leu Lys Asp Tyr Leu Thr Arg Leu Ala Gln Lys Val Ser
325 330 335
Lys Lys Thr Gly Ala Leu Asp Phe Phe Lys Ser Leu Asn Ala Gly Glu
340 345 350
Leu Lys Lys Ala Ala Pro Ala Asp Pro Ser Ala Pro Leu Val Asn Ala
355 360 365
Glu Ile Ala Arg Gln Val Glu Ala Leu Leu Thr Pro Asn Thr Thr Val
370 375 380
Ile Ala Glu Thr Gly Asp Ser Trp Phe Asn Ala Gln Arg Met Lys Leu
385 390 395 400
Pro Asn Gly Ala Arg Val Glu Tyr Glu Met Gln Trp Gly His Ile Gly
405 410 415
Trp Ser Val Pro Ala Ala Phe Gly Tyr Ala Val Gly Ala Pro Glu Arg
420 425 430
Arg Asn Ile Leu Met Val Gly Asp Gly Ser Phe Gln Leu Thr Ala Gln
435 440 445
Glu Val Ala Gln Met Val Arg Leu Lys Leu Pro Val Ile Ile Phe Leu
450 455 460
Ile Asn Asn Tyr Gly Tyr Thr Ile Glu Val Met Ile His Asp Gly Pro
465 470 475 480
Tyr Asn Asn Ile Lys Asn Trp Asp Tyr Ala Gly Leu Met Glu Val Phe
485 490 495
Asn Gly Asn Gly Gly Tyr Asp Ser Gly Ala Gly Lys Gly Leu Lys Ala
500 505 510
Lys Thr Gly Gly Glu Leu Ala Glu Ala Ile Lys Val Ala Leu Ala Asn
515 520 525
Thr Asp Gly Pro Thr Leu Ile Glu Cys Phe Ile Gly Arg Glu Asp Cys
530 535 540
Thr Glu Glu Leu Val Lys Trp Gly Lys Arg Val Ala Ala Ala Asn Ser
545 550 555 560
Arg Lys Pro Val Asn Lys Leu Leu
565
<210> 53
<211> 557
<212> PRT
<213> 巴斯德醋酸杆菌(Acetobacter pasteurianus)
<400> 53
Met Thr Tyr Thr Val Gly Met Tyr Leu Ala Glu Arg Leu Val Gln Ile
1 5 10 15
Gly Leu Lys His His Phe Ala Val Gly Gly Asp Tyr Asn Leu Val Leu
20 25 30
Leu Asp Gln Leu Leu Leu Asn Lys Asp Met Lys Gln Ile Tyr Cys Cys
35 40 45
Asn Glu Leu Asn Cys Gly Phe Ser Ala Glu Gly Tyr Ala Arg Ser Asn
50 55 60
Gly Ala Ala Ala Ala Val Val Thr Phe Ser Val Gly Ala Ile Ser Ala
65 70 75 80
Met Asn Ala Leu Gly Gly Ala Tyr Ala Glu Asn Leu Pro Val Ile Leu
85 90 95
Ile Ser Gly Ala Pro Asn Ser Asn Asp Gln Gly Thr Gly His Ile Leu
100 105 110
His His Thr Ile Gly Lys Thr Asp Tyr Ser Tyr Gln Leu Glu Met Ala
115 120 125
Arg Gln Val Thr Cys Ala Ala Glu Ser Ile Thr Asp Ala His Ser Ala
130 135 140
Pro Ala Lys Ile Asp His Val Ile Arg Thr Ala Leu Arg Glu Arg Lys
145 150 155 160
Pro Ala Tyr Leu Asp Ile Ala Cys Asn Ile Ala Ser Glu Pro Cys Val
165 170 175
Arg Pro Gly Pro Val Ser Ser Leu Leu Ser Glu Pro Glu Ile Asp His
180 185 190
Thr Ser Leu Lys Ala Ala Val Asp Ala Thr Val Ala Leu Leu Lys Asn
195 200 205
Arg Pro Ala Pro Val Met Leu Leu Gly Ser Lys Leu Arg Ala Ala Asn
210 215 220
Ala Leu Ala Ala Thr Glu Thr Leu Ala Asp Lys Leu Gln Cys Ala Val
225 230 235 240
Thr Ile Met Ala Ala Ala Lys Gly Phe Phe Pro Glu Asp His Ala Gly
245 250 255
Phe Arg Gly Leu Tyr Trp Gly Glu Val Ser Asn Pro Gly Val Gln Glu
260 265 270
Leu Val Glu Thr Ser Asp Ala Leu Leu Cys Ile Ala Pro Val Phe Asn
275 280 285
Asp Tyr Ser Thr Val Gly Trp Ser Gly Met Pro Lys Gly Pro Asn Val
290 295 300
Ile Leu Ala Glu Pro Asp Arg Val Thr Val Asp Gly Arg Ala Tyr Asp
305 310 315 320
Gly Phe Thr Leu Arg Ala Phe Leu Gln Ala Leu Ala Glu Lys Ala Pro
325 330 335
Ala Arg Pro Ala Ser Ala Gln Lys Ser Ser Val Pro Thr Cys Ser Leu
340 345 350
Thr Ala Thr Ser Asp Glu Ala Gly Leu Thr Asn Asp Glu Ile Val Arg
355 360 365
His Ile Asn Ala Leu Leu Thr Ser Asn Thr Thr Leu Val Ala Glu Thr
370 375 380
Gly Asp Ser Trp Phe Asn Ala Met Arg Met Thr Leu Ala Gly Ala Arg
385 390 395 400
Val Glu Leu Glu Met Gln Trp Gly His Ile Gly Trp Ser Val Pro Ser
405 410 415
Ala Phe Gly Asn Ala Met Gly Ser Gln Asp Arg Gln His Val Val Met
420 425 430
Val Gly Asp Gly Ser Phe Gln Leu Thr Ala Gln Glu Val Ala Gln Met
435 440 445
Val Arg Tyr Glu Leu Pro Val Ile Ile Phe Leu Ile Asn Asn Arg Gly
450 455 460
Tyr Val Ile Glu Ile Ala Ile His Asp Gly Pro Tyr Asn Tyr Ile Lys
465 470 475 480
Asn Trp Asp Tyr Ala Gly Leu Met Glu Val Phe Asn Ala Gly Glu Gly
485 490 495
His Gly Leu Gly Leu Lys Ala Thr Thr Pro Lys Glu Leu Thr Glu Ala
500 505 510
Ile Ala Arg Ala Lys Ala Asn Thr Arg Gly Pro Thr Leu Ile Glu Cys
515 520 525
Gln Ile Asp Arg Thr Asp Cys Thr Asp Met Leu Val Gln Trp Gly Arg
530 535 540
Lys Val Ala Ser Thr Asn Ala Arg Lys Thr Thr Leu Ala
545 550 555
<210> 54
<211> 528
<212> PRT
<213> 恶臭假单胞菌
<400> 54
Met Ala Ser Val His Gly Thr Thr Tyr Glu Leu Leu Arg Arg Gln Gly
1 5 10 15
Ile Asp Thr Val Phe Gly Asn Pro Gly Ser Asn Glu Leu Pro Phe Leu
20 25 30
Lys Asp Phe Pro Glu Asp Phe Arg Tyr Ile Leu Ala Leu Gln Glu Ala
35 40 45
Cys Val Val Gly Ile Ala Asp Gly Tyr Ala Gln Ala Ser Arg Lys Pro
50 55 60
Ala Phe Ile Asn Leu His Ser Ala Ala Gly Thr Gly Asn Ala Met Gly
65 70 75 80
Ala Leu Ser Asn Ala Trp Asn Ser His Ser Pro Leu Ile Val Thr Ala
85 90 95
Gly Gln Gln Thr Arg Ala Met Ile Gly Val Glu Ala Leu Leu Thr Asn
100 105 110
Val Asp Ala Ala Asn Leu Pro Arg Pro Leu Val Lys Trp Ser Tyr Glu
115 120 125
Pro Ala Ser Ala Ala Glu Val Pro His Ala Met Ser Arg Ala Ile His
130 135 140
Met Ala Ser Met Ala Pro Gln Gly Pro Val Tyr Leu Ser Val Pro Tyr
145 150 155 160
Asp Asp Trp Asp Lys Asp Ala Asp Pro Gln Ser His His Leu Phe Asp
165 170 175
Arg His Val Ser Ser Ser Val Arg Leu Asn Asp Gln Asp Leu Asp Ile
180 185 190
Leu Val Lys Ala Leu Asn Ser Ala Ser Asn Pro Ala Ile Val Leu Gly
195 200 205
Pro Asp Val Asp Ala Ala Asn Ala Asn Ala Asp Cys Val Met Leu Ala
210 215 220
Glu Arg Leu Lys Ala Pro Val Trp Val Ala Pro Ser Ala Pro Arg Cys
225 230 235 240
Pro Phe Pro Thr Arg His Pro Cys Phe Arg Gly Leu Met Pro Ala Gly
245 250 255
Ile Ala Ala Ile Ser Gln Leu Leu Glu Gly His Asp Val Val Leu Val
260 265 270
Ile Gly Ala Pro Val Phe Arg Tyr His Gln Tyr Asp Pro Gly Gln Tyr
275 280 285
Leu Lys Pro Gly Thr Arg Leu Ile Ser Val Thr Cys Asp Pro Leu Glu
290 295 300
Ala Ala Arg Ala Pro Met Gly Asp Ala Ile Val Ala Asp Ile Gly Ala
305 310 315 320
Met Ala Ser Ala Leu Ala Asn Leu Val Glu Glu Ser Ser Arg Gln Leu
325 330 335
Pro Thr Ala Ala Pro Glu Pro Ala Lys Val Asp Gln Asp Ala Gly Arg
340 345 350
Leu His Pro Glu Thr Val Phe Asp Thr Leu Asn Asp Met Ala Pro Glu
355 360 365
Asn Ala Ile Tyr Leu Asn Glu Ser Thr Ser Thr Thr Ala Gln Met Trp
370 375 380
Gln Arg Leu Asn Met Arg Asn Pro Gly Ser Tyr Tyr Phe Cys Ala Ala
385 390 395 400
Gly Gly Leu Gly Phe Ala Leu Pro Ala Ala Ile Gly Val Gln Leu Ala
405 410 415
Glu Pro Glu Arg Gln Val Ile Ala Val Ile Gly Asp Gly Ser Ala Asn
420 425 430
Tyr Ser Ile Ser Ala Leu Trp Thr Ala Ala Gln Tyr Asn Ile Pro Thr
435 440 445
Ile Phe Val Ile Met Asn Asn Gly Thr Tyr Gly Ala Leu Arg Trp Phe
450 455 460
Ala Gly Val Leu Glu Ala Glu Asn Val Pro Gly Leu Asp Val Pro Gly
465 470 475 480
Ile Asp Phe Arg Ala Leu Ala Lys Gly Tyr Gly Val Gln Ala Leu Lys
485 490 495
Ala Asp Asn Leu Glu Gln Leu Lys Gly Ser Leu Gln Glu Ala Leu Ser
500 505 510
Ala Lys Gly Pro Val Leu Ile Glu Val Ser Thr Val Ser Pro Val Lys
515 520 525
<210> 55
<211> 528
<212> PRT
<213> 铜绿假单胞菌
<400> 55
Met Lys Thr Val His Ser Ala Ser Tyr Glu Ile Leu Arg Arg His Gly
1 5 10 15
Leu Thr Thr Val Phe Gly Asn Pro Gly Ser Asn Glu Leu Pro Phe Leu
20 25 30
Lys Asp Phe Pro Glu Asp Phe Arg Tyr Ile Leu Gly Leu His Glu Gly
35 40 45
Ala Val Val Gly Met Ala Asp Gly Phe Ala Leu Ala Ser Gly Arg Pro
50 55 60
Ala Phe Val Asn Leu His Ala Ala Ala Gly Thr Gly Asn Gly Met Gly
65 70 75 80
Ala Leu Thr Asn Ala Trp Tyr Ser His Ser Pro Leu Val Ile Thr Ala
85 90 95
Gly Gln Gln Val Arg Ser Met Ile Gly Val Glu Ala Met Leu Ala Asn
100 105 110
Val Asp Ala Gly Gln Leu Pro Lys Pro Leu Val Lys Trp Ser His Glu
115 120 125
Pro Ala Cys Ala Gln Asp Val Pro Arg Ala Leu Ser Gln Ala Ile Gln
130 135 140
Thr Ala Ser Leu Pro Pro Arg Ala Pro Val Tyr Leu Ser Ile Pro Tyr
145 150 155 160
Asp Asp Trp Ala Gln Pro Ala Pro Ala Gly Val Glu His Leu Ala Ala
165 170 175
Arg Gln Val Ser Gly Ala Ala Leu Pro Ala Pro Ala Leu Leu Ala Glu
180 185 190
Leu Gly Glu Arg Leu Ser Arg Ser Arg Asn Pro Val Leu Val Leu Gly
195 200 205
Pro Asp Val Asp Gly Ala Asn Ala Asn Gly Leu Ala Val Glu Leu Ala
210 215 220
Glu Lys Leu Arg Met Pro Ala Trp Val Ala Pro Ser Ala Ser Arg Cys
225 230 235 240
Pro Phe Pro Thr Arg His Ala Cys Phe Arg Gly Val Leu Pro Ala Ala
245 250 255
Ile Ala Gly Ile Ser Arg Leu Leu Asp Gly His Asp Leu Ile Leu Val
260 265 270
Val Gly Ala Pro Val Phe Arg Tyr His Gln Phe Ala Pro Gly Asp Tyr
275 280 285
Leu Pro Ala Gly Ala Glu Leu Val Gln Val Thr Cys Asp Pro Gly Glu
290 295 300
Ala Ala Arg Ala Pro Met Gly Asp Ala Leu Val Gly Asp Ile Ala Leu
305 310 315 320
Thr Leu Glu Ala Leu Leu Glu Gln Val Arg Pro Ser Ala Arg Pro Leu
325 330 335
Pro Glu Ala Leu Pro Arg Pro Pro Ala Leu Ala Glu Glu Gly Gly Pro
340 345 350
Leu Arg Pro Glu Thr Val Phe Asp Val Ile Asp Ala Leu Ala Pro Arg
355 360 365
Asp Ala Ile Phe Val Lys Glu Ser Thr Ser Thr Val Thr Ala Phe Trp
370 375 380
Gln Arg Val Glu Met Arg Glu Pro Gly Ser Tyr Phe Phe Pro Ala Ala
385 390 395 400
Gly Gly Leu Gly Phe Gly Leu Pro Ala Ala Val Gly Ala Gln Leu Ala
405 410 415
Gln Pro Arg Arg Gln Val Ile Gly Ile Ile Gly Asp Gly Ser Ala Asn
420 425 430
Tyr Gly Ile Thr Ala Leu Trp Ser Ala Ala Gln Tyr Arg Val Pro Ala
435 440 445
Val Phe Ile Ile Leu Lys Asn Gly Thr Tyr Gly Ala Leu Arg Trp Phe
450 455 460
Ala Gly Val Leu Glu Val Pro Asp Ala Pro Gly Leu Asp Val Pro Gly
465 470 475 480
Leu Asp Phe Cys Ala Ile Ala Arg Gly Tyr Gly Val Glu Ala Leu His
485 490 495
Ala Ala Thr Arg Glu Glu Leu Glu Gly Ala Leu Lys His Ala Leu Ala
500 505 510
Ala Asp Arg Pro Val Leu Ile Glu Val Pro Thr Gln Thr Ile Glu Pro
515 520 525
<210> 56
<211> 526
<212> PRT
<213> 施氏假单胞菌(Pseudomonas stutzeri)
<400> 56
Met Ala Ser Val His Ser Ile Thr Tyr Glu Leu Leu Arg Arg Gln Gly
1 5 10 15
Ile Asp Thr Val Phe Gly Asn Pro Gly Ser Asn Glu Leu Pro Phe Leu
20 25 30
Lys Asp Phe Pro Glu Asp Phe Arg Tyr Ile Leu Ala Leu Gln Glu Ala
35 40 45
Cys Val Val Gly Ile Ala Asp Gly Tyr Ala Gln Ala Ser Arg Lys Pro
50 55 60
Ala Phe Ile Asn Leu His Ser Ala Ala Gly Thr Gly Asn Ala Met Gly
65 70 75 80
Ala Met Ser Asn Ala Trp Asn Cys His Ser Pro Leu Ile Val Thr Ala
85 90 95
Gly Gln Gln Asn Arg Ala Met Ile Gly Val Glu Ala Leu Leu Thr Asn
100 105 110
Val Asp Ala Ala Ser Leu Pro Arg Pro Leu Val Lys Trp Ser Tyr Glu
115 120 125
Pro Ala Ser Ala Ala Glu Val Pro His Ala Met Ser Arg Ala Ile His
130 135 140
Met Ala Ser Met Ala Pro Arg Gly Pro Val Tyr Leu Ser Val Pro Tyr
145 150 155 160
Asp Asp Trp Asp Lys Glu Ala Asp Pro Gln Ser His His Leu Tyr Asp
165 170 175
Arg Ser Val Asn Ser Ala Val Arg Leu Asn Asp Gln Asp Leu Glu Val
180 185 190
Leu Val Glu Ala Leu Asn Ser Ala Ser Asn Pro Ala Ile Val Leu Gly
195 200 205
Pro Asp Val Asp Ser Ala Asn Ala Asn Ala Asp Cys Val Thr Leu Ala
210 215 220
Glu Arg Leu Lys Ala Pro Val Trp Val Ala Pro Ser Ala Pro Arg Cys
225 230 235 240
Pro Phe Pro Thr Arg His Pro Cys Phe Arg Gly Leu Met Pro Ala Gly
245 250 255
Ile Ala Ala Ile Ser Gln Leu Leu Glu Gly His Asp Val Val Leu Val
260 265 270
Ile Gly Ala Pro Val Phe Arg Tyr His Gln Tyr Asp Pro Gly Gln Tyr
275 280 285
Leu Lys Pro Gly Thr Arg Leu Ile Ser Ile Thr Cys Asp Pro Leu Glu
290 295 300
Ala Ala Arg Ala Pro Met Gly Asp Ala Ile Val Ala Asp Ile Gly Thr
305 310 315 320
Met Thr Ala Ala Leu Ala Ser Arg Ile Gly Glu Ser Glu Arg Gln Leu
325 330 335
Pro Ala Val Leu Pro Ser Pro Glu Arg Val Asn Gln Asp Ala Gly Arg
340 345 350
Leu Arg Pro Glu Thr Val Phe Asp Thr Leu Asn Glu Met Ala Pro Glu
355 360 365
Asp Ala Ile Tyr Leu Asn Glu Ser Thr Ser Thr Thr Ala Gln Met Trp
370 375 380
Gln Arg Leu Asn Met Arg Asn Pro Gly Ser Tyr Tyr Phe Cys Ala Ala
385 390 395 400
Gly Gly Leu Gly Phe Ala Leu Pro Ala Ala Ile Gly Val Gln Leu Ala
405 410 415
Glu Pro Asp Arg Gln Val Ile Ala Val Ile Gly Asp Gly Ser Ala Asn
420 425 430
Tyr Ser Ile Ser Ala Leu Trp Thr Ala Ala His Tyr Asn Ile Pro Ala
435 440 445
Ile Phe Leu Ile Met Asn Asn Gly Thr Tyr Gly Ala Leu Arg Trp Phe
450 455 460
Ala Gly Val Leu Glu Ala Glu Asn Val Pro Gly Leu Asp Val Pro Gly
465 470 475 480
Ile Asp Phe Cys Ala Ile Ala Lys Gly Tyr Gly Ile Pro Ala Leu Lys
485 490 495
Ala Asp Asn Leu Glu Gln Leu Lys Gly Ser Ile His Glu Ala Leu Ser
500 505 510
Ala Lys Gly Pro Val Leu Ile Glu Val Ser Thr Val Ser Leu
515 520 525
<210> 57
<211> 528
<212> PRT
<213> 荧光假单胞菌
<400> 57
Met Lys Thr Val His Ser Ala Ser Tyr Asp Ile Leu Arg Gln Gln Gly
1 5 10 15
Leu Thr Thr Val Phe Gly Asn Pro Gly Ser Asn Glu Leu Pro Phe Leu
20 25 30
Lys Gly Phe Pro Glu Asp Phe Arg Tyr Ile Leu Gly Leu His Glu Gly
35 40 45
Ala Val Val Gly Met Ala Asp Gly Phe Ala Leu Ala Ser Gly Gln Pro
50 55 60
Ala Phe Val Asn Leu His Ala Ala Ala Gly Thr Gly Asn Gly Met Gly
65 70 75 80
Ala Leu Thr Asn Ala Trp Tyr Ser His Ser Pro Leu Val Ile Thr Ala
85 90 95
Gly Gln Gln Val Arg Ser Met Ile Gly Val Glu Ala Met Leu Ala Asn
100 105 110
Val Asp Ala Pro Gln Leu Pro Lys Pro Leu Val Lys Trp Ser Ala Glu
115 120 125
Pro Ala Cys Ala Glu Asp Val Pro Arg Ala Leu Ser Gln Ala Ile His
130 135 140
Met Ala Asn Gln Ala Pro Lys Gly Pro Val Tyr Leu Ser Ile Pro Tyr
145 150 155 160
Asp Asp Trp Ala Arg Pro Ala Pro Ala Gly Val Glu His Leu Ala Arg
165 170 175
Arg Gln Val Ala Thr Ala Gly Leu Pro Ser Ala Ala Gln Leu Arg Ser
180 185 190
Leu Val Gln Arg Leu Ala Ala Ala Arg Asn Pro Val Leu Val Leu Gly
195 200 205
Pro Asp Val Asp Gly Ser Arg Ser Asn His Leu Ala Val Gln Leu Ala
210 215 220
Glu Lys Leu Arg Met Pro Ala Trp Val Ala Pro Ser Ala Ser Arg Cys
225 230 235 240
Pro Phe Pro Thr Arg His Pro Ser Phe Arg Gly Val Leu Pro Ala Ala
245 250 255
Ile Ala Gly Ile Ser Arg Cys Leu Ala Asp His Asp Leu Ile Leu Val
260 265 270
Val Gly Ala Pro Val Phe Arg Tyr His Gln Phe Ala Pro Gly Asp Tyr
275 280 285
Leu Pro Ala Gly Thr Glu Leu Leu His Ile Thr Cys Asp Pro Gly Glu
290 295 300
Ala Ala Arg Ala Pro Met Gly Asp Ala Leu Val Gly Asp Ile Val Glu
305 310 315 320
Thr Leu Gln Ala Leu Val Trp Ala Leu Pro Asp Cys Asp Arg Pro Gln
325 330 335
Pro Gln Ala Leu Pro Pro Ala Ala Pro Val Glu Glu Leu Gly Gly Leu
340 345 350
Leu Arg Pro Glu Thr Val Phe Asp Val Ile Asp Glu Leu Ala Pro Lys
355 360 365
Asp Ala Ile Tyr Val Lys Glu Ser Thr Ser Thr Val Gly Ala Phe Trp
370 375 380
Gln Arg Val Glu Met Arg Glu Pro Gly Ser Tyr Tyr Phe Pro Ala Ala
385 390 395 400
Gly Gly Leu Gly Phe Gly Leu Pro Ala Ala Val Gly Val Gln Leu Ala
405 410 415
Arg Pro Glu Arg Arg Val Ile Gly Val Ile Gly Asp Gly Ser Ala Asn
420 425 430
Tyr Gly Ile Thr Ala Leu Trp Thr Ala Ala Gln Tyr Gln Ile Pro Val
435 440 445
Val Phe Ile Ile Leu Lys Asn Gly Thr Tyr Gly Ala Leu Arg Trp Phe
450 455 460
Ala Gly Val Leu Gln Val Ser Asp Ala Pro Gly Leu Asp Val Pro Gly
465 470 475 480
Leu Asp Phe Cys Ala Ile Gly Arg Gly Tyr Gly Val His Ser Val Gln
485 490 495
Ala Asn Thr Arg Glu Ala Phe Ala Gln Ala Leu Ser Glu Ala Leu Ala
500 505 510
Gly Asp Arg Pro Val Leu Ile Glu Val Pro Thr Leu Thr Ile Glu Pro
515 520 525
<210> 58
<211> 1220
<212> PRT
<213> 橙色绿屈挠菌(Chloroflexus aurantiacus)
<400> 58
Met Ala Thr Gly Glu Ser Met Ser Gly Thr Gly Arg Leu Ala Gly Lys
1 5 10 15
Ile Ala Leu Ile Thr Gly Gly Ala Gly Asn Ile Gly Ser Glu Leu Thr
20 25 30
Arg Arg Phe Leu Ala Glu Gly Ala Thr Val Ile Ile Ser Gly Arg Asn
35 40 45
Arg Ala Lys Leu Thr Ala Leu Ala Glu Met Gln Ala Glu Ala Gly Val
50 55 60
Pro Ala Lys Arg Ile Asp Leu Glu Val Met Asp Gly Ser Asp Pro Val
65 70 75 80
Ala Val Arg Ala Gly Ile Glu Ala Ile Val Ala Arg His Gly Gln Ile
85 90 95
Asp Ile Leu Val Asn Asn Ala Gly Ser Ala Gly Ala Gln Arg Arg Leu
100 105 110
Ala Glu Ile Pro Leu Thr Glu Ala Glu Leu Gly Pro Gly Ala Glu Glu
115 120 125
Thr Leu His Ala Ser Ile Ala Asn Leu Leu Gly Met Gly Trp His Leu
130 135 140
Met Arg Ile Ala Ala Pro His Met Pro Val Gly Ser Ala Val Ile Asn
145 150 155 160
Val Ser Thr Ile Phe Ser Arg Ala Glu Tyr Tyr Gly Arg Ile Pro Tyr
165 170 175
Val Thr Pro Lys Ala Ala Leu Asn Ala Leu Ser Gln Leu Ala Ala Arg
180 185 190
Glu Leu Gly Ala Arg Gly Ile Arg Val Asn Thr Ile Phe Pro Gly Pro
195 200 205
Ile Glu Ser Asp Arg Ile Arg Thr Val Phe Gln Arg Met Asp Gln Leu
210 215 220
Lys Gly Arg Pro Glu Gly Asp Thr Ala His His Phe Leu Asn Thr Met
225 230 235 240
Arg Leu Cys Arg Ala Asn Asp Gln Gly Ala Leu Glu Arg Arg Phe Pro
245 250 255
Ser Val Gly Asp Val Ala Asp Ala Ala Val Phe Leu Ala Ser Ala Glu
260 265 270
Ser Ala Ala Leu Ser Gly Glu Thr Ile Glu Val Thr His Gly Met Glu
275 280 285
Leu Pro Ala Cys Ser Glu Thr Ser Leu Leu Ala Arg Thr Asp Leu Arg
290 295 300
Thr Ile Asp Ala Ser Gly Arg Thr Thr Leu Ile Cys Ala Gly Asp Gln
305 310 315 320
Ile Glu Glu Val Met Ala Leu Thr Gly Met Leu Arg Thr Cys Gly Ser
325 330 335
Glu Val Ile Ile Gly Phe Arg Ser Ala Ala Ala Leu Ala Gln Phe Glu
340 345 350
Gln Ala Val Asn Glu Ser Arg Arg Leu Ala Gly Ala Asp Phe Thr Pro
355 360 365
Pro Ile Ala Leu Pro Leu Asp Pro Arg Asp Pro Ala Thr Ile Asp Ala
370 375 380
Val Phe Asp Trp Ala Gly Glu Asn Thr Gly Gly Ile His Trp Ile Leu
385 390 395 400
Pro Ala Thr Ser His Glu Pro Ala Pro Cys Val Ile Glu Val Asp Asp
405 410 415
Glu Arg Val Leu Asn Phe Leu Ala Asp Glu Ile Thr Gly Thr Ile Val
420 425 430
Ile Ala Ser Arg Leu Ala Arg Tyr Trp Gln Ser Gln Arg Leu Thr Pro
435 440 445
Gly Ala Arg Ala Arg Gly Pro Arg Val Ile Phe Leu Ser Asn Gly Ala
450 455 460
Asp Gln Asn Gly Asn Val Tyr Gly Arg Ile Gln Ser Ala Ala Ile Gly
465 470 475 480
Gln Leu Ile Arg Val Trp Arg His Glu Ala Glu Leu Asp Tyr Gln Arg
485 490 495
Ala Ser Ala Ala Gly Asp His Val Leu Pro Pro Val Trp Ala Asn Gln
500 505 510
Ile Val Arg Phe Ala Asn Arg Ser Leu Glu Gly Leu Glu Phe Ala Cys
515 520 525
Ala Trp Thr Ala Gln Leu Leu His Ser Gln Arg His Ile Asn Glu Ile
530 535 540
Thr Leu Asn Ile Pro Ala Asn Ile Ser Ala Thr Thr Gly Ala Arg Ser
545 550 555 560
Ala Ser Val Gly Trp Ala Glu Ser Leu Ile Gly Leu His Leu Gly Lys
565 570 575
Val Ala Leu Ile Thr Gly Gly Ser Ala Gly Ile Gly Gly Gln Ile Gly
580 585 590
Arg Leu Leu Ala Leu Ser Gly Ala Arg Val Met Leu Ala Ala Arg Asp
595 600 605
Arg His Lys Leu Glu Gln Met Gln Ala Met Ile Gln Ser Glu Leu Ala
610 615 620
Glu Val Gly Tyr Thr Asp Val Glu Asp Arg Val His Ile Ala Pro Gly
625 630 635 640
Cys Asp Val Ser Ser Glu Ala Gln Leu Ala Asp Leu Val Glu Arg Thr
645 650 655
Leu Ser Ala Phe Gly Thr Val Asp Tyr Leu Ile Asn Asn Ala Gly Ile
660 665 670
Ala Gly Val Glu Glu Met Val Ile Asp Met Pro Val Glu Gly Trp Arg
675 680 685
His Thr Leu Phe Ala Asn Leu Ile Ser Asn Tyr Ser Leu Met Arg Lys
690 695 700
Leu Ala Pro Leu Met Lys Lys Gln Gly Ser Gly Tyr Ile Leu Asn Val
705 710 715 720
Ser Ser Tyr Phe Gly Gly Glu Lys Asp Ala Ala Ile Pro Tyr Pro Asn
725 730 735
Arg Ala Asp Tyr Ala Val Ser Lys Ala Gly Gln Arg Ala Met Ala Glu
740 745 750
Val Phe Ala Arg Phe Leu Gly Pro Glu Ile Gln Ile Asn Ala Ile Ala
755 760 765
Pro Gly Pro Val Glu Gly Asp Arg Leu Arg Gly Thr Gly Glu Arg Pro
770 775 780
Gly Leu Phe Ala Arg Arg Ala Arg Leu Ile Leu Glu Asn Lys Arg Leu
785 790 795 800
Asn Glu Leu His Ala Ala Leu Ile Ala Ala Ala Arg Thr Asp Glu Arg
805 810 815
Ser Met His Glu Leu Val Glu Leu Leu Leu Pro Asn Asp Val Ala Ala
820 825 830
Leu Glu Gln Asn Pro Ala Ala Pro Thr Ala Leu Arg Glu Leu Ala Arg
835 840 845
Arg Phe Arg Ser Glu Gly Asp Pro Ala Ala Ser Ser Ser Ser Ala Leu
850 855 860
Leu Asn Arg Ser Ile Ala Ala Lys Leu Leu Ala Arg Leu His Asn Gly
865 870 875 880
Gly Tyr Val Leu Pro Ala Asp Ile Phe Ala Asn Leu Pro Asn Pro Pro
885 890 895
Asp Pro Phe Phe Thr Arg Ala Gln Ile Asp Arg Glu Ala Arg Lys Val
900 905 910
Arg Asp Gly Ile Met Gly Met Leu Tyr Leu Gln Arg Met Pro Thr Glu
915 920 925
Phe Asp Val Ala Met Ala Thr Val Tyr Tyr Leu Ala Asp Arg Asn Val
930 935 940
Ser Gly Glu Thr Phe His Pro Ser Gly Gly Leu Arg Tyr Glu Arg Thr
945 950 955 960
Pro Thr Gly Gly Glu Leu Phe Gly Leu Pro Ser Pro Glu Arg Leu Ala
965 970 975
Glu Leu Val Gly Ser Thr Val Tyr Leu Ile Gly Glu His Leu Thr Glu
980 985 990
His Leu Asn Leu Leu Ala Met Tyr Leu Glu Arg Tyr Gly Ala Arg Gln
995 1000 1005
Val Trp Ile Val Glu Thr Glu Thr Gly Ala Glu Thr Met Arg Arg
1010 1015 1020
Leu Leu His Asp His Val Glu Ala Gly Arg Leu Met Thr Ile Val
1025 1030 1035
Ala Gly Asp Gln Ile Glu Ala Ala Ile Asp Gln Ala Ile Thr Arg
1040 1045 1050
Tyr Gly Arg Pro Gly Pro Val Val Cys Thr Pro Phe Arg Pro Leu
1055 1060 1065
Pro Thr Val Pro Leu Val Gly Arg Lys Asp Ser Asp Trp Ser Thr
1070 1075 1080
Val Leu Ser Glu Ala Glu Phe Ala Glu Leu Cys Glu His Gln Leu
1085 1090 1095
Thr His His Phe Arg Val Ala Arg Lys Ile Ala Leu Ser Asp Gly
1100 1105 1110
Ala Ser Leu Ala Leu Val Thr Pro Glu Thr Thr Ala Thr Ser Thr
1115 1120 1125
Thr Glu Gln Phe Ala Leu Ala Asn Phe Ile Lys Thr Thr Leu His
1130 1135 1140
Ala Phe Thr Ala Thr Ile Gly Val Glu Ser Glu Arg Thr Ala Gln
1145 1150 1155
Arg Ile Leu Ile Asn Gln Val Asp Leu Thr Arg Arg Ala Arg Ala
1160 1165 1170
Glu Glu Pro Arg Asp Pro His Glu Arg Gln Gln Glu Leu Glu Arg
1175 1180 1185
Phe Ile Glu Ala Val Leu Leu Val Thr Ala Pro Leu Pro Pro Glu
1190 1195 1200
Ala Asp Thr Arg Tyr Ala Gly Arg Ile His Arg Gly Arg Ala Ile
1205 1210 1215
Thr Val
1220
<210> 59
<211> 1229
<212> PRT
<213> Roseiflexus castenholzii
<400> 59
Met Ser Thr Val Arg Arg Leu Glu Gly Lys Val Ala Leu Ile Thr Gly
1 5 10 15
Gly Ala Gly Asn Ile Gly Glu Val Ile Thr Arg Arg Phe Leu Ala Glu
20 25 30
Gly Ala Thr Val Val Ile Thr Gly Arg Asn Ala Glu Lys Leu Ala Val
35 40 45
Tyr Arg Arg Arg Leu Ile Asp Glu Glu Arg Val Ala Pro Glu Arg Val
50 55 60
Val Ala Leu Arg Met Asp Gly Ser Asp Ile Ala Gln Val Arg Ala Gly
65 70 75 80
Val Ala Gln Ile Val His Gly Gly Thr Asp Val Pro Ile Pro Leu His
85 90 95
Arg Ile Asp Ile Leu Val Asn Asn Ala Gly Ser Ala Gly Pro Arg Arg
100 105 110
Arg Leu Val Asp Ile Pro Leu Glu Pro Ser Glu Val Gln Pro Pro Asp
115 120 125
Ser Glu Thr Leu Ala Gln Ala Val Gly Asn Leu Val Gly Ile Thr Trp
130 135 140
Asn Leu Thr Arg Ala Ala Ala Pro His Met Pro Ser Gly Ser Ser Val
145 150 155 160
Ile Asn Ile Ser Thr Ile Phe Ser Arg Thr Asp Tyr Tyr Gly Arg Ile
165 170 175
Ala Tyr Val Ala Pro Lys Ala Ala Leu Asn Ala Leu Ser Asp Gly Leu
180 185 190
Ala Arg Glu Leu Gly Val Arg Gly Ile Arg Val Asn Thr Ile Tyr Pro
195 200 205
Gly Pro Ile Glu Ser Glu Arg Ile Tyr Thr Met Phe Gln Ala Met Asp
210 215 220
Ala Leu Lys Gly Gln Pro Glu Gly Asp Thr Ala Ser Gly Phe Leu Arg
225 230 235 240
Met Met Arg Leu Ser Arg Ile Asp Gln Asn Gly Glu Val Val Lys Arg
245 250 255
Phe Pro Ser Pro Val Asp Val Ala Asn Thr Ala Val Phe Leu Ala Ser
260 265 270
Asp Glu Ser Ala Ala Phe Thr Gly His Ala Phe Glu Val Thr His Gly
275 280 285
Met Glu Val Pro Thr Glu Ser Arg Thr Thr Phe Val Ser Arg Pro Gly
290 295 300
Leu Arg Ser Val Asp Ala Thr Gly Lys Val Ile Leu Ile Cys Ala Gly
305 310 315 320
Asp Gln Val Asp Asp Ala Val Ala Leu Ala Asp Thr Leu Arg Ser Cys
325 330 335
Arg Ala Thr Val Val Ile Gly Phe Arg Asp Pro Arg Ala Leu Glu Lys
340 345 350
Ala Ser Val Leu Leu Arg Glu Pro Arg His Ala Leu Ala Ala Asp Met
355 360 365
Tyr Gly Arg Pro Thr Met Thr Ala Glu Ala Arg Leu Val Arg Leu Asp
370 375 380
Pro Leu Asp Pro Arg Ala Ala Ala Gln Thr Leu Glu Gln Ile His Ala
385 390 395 400
Glu Leu Gly Ala Ile His His Ala Val Val Leu Pro Gly Gln Ser Arg
405 410 415
His Ala Pro Ser Ala Ser Leu Ile Glu Val Asp Asp Gln Val Val Glu
420 425 430
Arg Phe Leu His Gln Glu Leu Val Gly Thr Ile Ala Leu Ala Arg Glu
435 440 445
Leu Ala Arg Phe Trp Glu Glu Tyr Pro Ser Gly Ser Ser Met His Arg
450 455 460
Val Leu Phe Val Ser Asn Pro Asp Asp Gln Gln Gly Asn Gln Tyr Ser
465 470 475 480
His Ile Leu Arg Ala Ala Val Glu Gln Leu Val Arg Val Trp Arg His
485 490 495
Glu Ser Glu Tyr Asp Ser Val Asn Pro Ala His Gln Gln Glu Gly Gln
500 505 510
Ser Ser Ala Ala Val Trp Ala Asn Gln Leu Ile Arg Tyr Val Asn Asn
515 520 525
Glu Met Ala Asn Leu Asp Phe Thr Cys Ala Trp Val Ala Lys Leu Leu
530 535 540
Gly Ser Asp Arg Arg Ile Ala Glu Ile Asn Leu Tyr Leu Pro Glu Glu
545 550 555 560
Ile Val Gly Thr Ile Gly Val His Asn Pro Gly Phe Gly Trp Ala Glu
565 570 575
Ser Leu Phe Gly Leu His Met Gly Lys Val Ala Leu Ile Thr Gly Gly
580 585 590
Ser Ala Gly Ile Gly Gly Gln Ile Gly Arg Leu Leu Ala Leu Ser Gly
595 600 605
Ala His Val Met Leu Ala Ala Arg Asn Ala Asp Gln Leu Glu Gln Met
610 615 620
Arg Ala Ser Ile Val Arg Glu Val Arg Asp Ala Ser Tyr Pro Asp Ala
625 630 635 640
Glu Ser Arg Val Ala Ile Phe Pro Gly Ser Asp Val Ser Asp Ile Asp
645 650 655
Gly Leu Glu Arg Leu Val Asn His Thr Val Arg Val Phe Gly Lys Val
660 665 670
Asp Tyr Leu Ile Asn Asn Ala Gly Ile Ala Gly Ala Glu Glu Met Val
675 680 685
Ile Asp Met Pro Val Asp Ala Trp Arg His Thr Leu Arg Ala Asn Leu
690 695 700
Ile Ser Asn Tyr Ala Leu Leu Arg Arg Leu Ala Pro Gln Met Lys Ala
705 710 715 720
Ala Gly Gly Ala Tyr Val Leu Asn Val Ser Ser Tyr Phe Gly Gly Glu
725 730 735
Lys Tyr Val Ala Ile Pro Tyr Pro Asn Arg Ser Asp Tyr Ala Val Ser
740 745 750
Lys Ala Gly Gln Arg Ala Met Val Glu Ser Leu Ala Arg Phe Leu Gly
755 760 765
Pro Glu Ile Gln Ile Asn Ala Ile Ala Pro Gly Pro Val Glu Gly Glu
770 775 780
Arg Leu Lys Gly Ala Gly Ser Arg Pro Gly Leu Phe Met Arg Arg Ala
785 790 795 800
Arg Leu Ile Leu Glu Asn Lys Arg Leu Asn Glu Val Phe Ala Ala Leu
805 810 815
Leu Ala Ala Arg His Glu Gly Ala Thr Ile Ala Asp Leu Leu Pro Asp
820 825 830
Leu Phe Ala Asn Asp Ile Gln Ser Ile Ala Asn Ser Ala Ala Met Pro
835 840 845
Ala Pro Leu Arg Arg Leu Ala Thr Met Leu Arg Glu Thr Ser Asp Ala
850 855 860
Gly Gly Ser Ala Gln Ser Tyr Leu Met Asn Ala Thr Ile Ala Arg Lys
865 870 875 880
Leu Leu Asn Arg Leu Glu Asn Gly Gly Tyr Ile Thr Leu His Asp Arg
885 890 895
Arg Ala Leu Thr Val Glu Pro Pro Glu Pro Phe Phe Thr Glu Ala Gln
900 905 910
Ile Glu Arg Glu Ala Ile Lys Val Arg Asp Gly Ile Leu Gly Met Leu
915 920 925
His Leu Gln Arg Met Pro Thr Glu Phe Asp Val Ala Leu Ala Thr Val
930 935 940
Phe Tyr Leu Ala Asp Arg Asn Val Thr Gly Glu Thr Phe His Pro Ser
945 950 955 960
Gly Gly Leu Arg Phe Glu Arg Thr Val Thr Glu Gly Glu Leu Phe Gly
965 970 975
Lys Pro Gly Gln Gln Arg Leu Glu Arg Leu Lys Gly Ser Val Val Tyr
980 985 990
Leu Ile Gly Glu His Leu Arg Gln His Leu Val Leu Leu Ala Arg Thr
995 1000 1005
Phe Leu Asp Glu Ile His Val Ala Arg Val Val Leu Leu Thr Glu
1010 1015 1020
Thr Thr Gln Ala Ala Thr Asp Leu Ala Ala Glu Leu Ser Asp Tyr
1025 1030 1035
Glu Ala Ala Gly Arg Phe Val Val Ile Pro Thr Cys Gly Asp Ile
1040 1045 1050
Glu Gly Gly Ile Asp Arg Ala Met Ala Glu Tyr Gly Arg Pro Gly
1055 1060 1065
Pro Val Ile Ser Thr Pro Phe Arg Pro Leu Pro Asp Arg Ala Leu
1070 1075 1080
Ser Ala Arg Asn Gly Asp Trp Ser Ser Val Leu Thr Thr Ala Glu
1085 1090 1095
Phe Glu Glu Leu Val Glu Gln Gln Ile Thr His His Phe Arg Val
1100 1105 1110
Ala Arg Lys Ala Gly Leu Ile Glu Gly Ala Asn Val Thr Leu Val
1115 1120 1125
Thr Pro Pro Thr Ser Ala Arg Ser Thr Ser Glu Glu Phe Ala Leu
1130 1135 1140
Ala Asn Phe Val Lys Thr Thr Leu His Ala Leu Thr Ala Thr Ala
1145 1150 1155
Gly Ala Glu Ser Glu Arg Thr Val Pro His Val Pro Val Asn Gln
1160 1165 1170
Val Asp Leu Thr Arg Arg Ala Arg Ser Glu Glu Pro Arg Thr Pro
1175 1180 1185
Ser Glu Glu Glu Glu Glu Leu Gln Arg Phe Val Asn Ala Val Leu
1190 1195 1200
Leu Thr Ser Ala Pro Leu Pro Thr Pro Leu Glu Ser Arg Tyr Arg
1205 1210 1215
Ala Arg Ile Tyr Arg Gly Asn Ala Ile Thr Val
1220 1225
<210> 60
<211> 1217
<212> PRT
<213> Erythrobacter sp.
<400> 60
Met Ser Lys Glu Gly Asn Ala Ala Lys Gly Arg Leu Glu Gly Lys Val
1 5 10 15
Ala Leu Ile Thr Gly Ala Ala Gly Asn Leu Gly Asn Glu Ile Ser Arg
20 25 30
Ala Phe Ala Arg Glu Gly Ala Phe Val Val Met Thr Gly Arg Thr Glu
35 40 45
Glu Arg Ile Ser Ala Ala Arg Glu Gln Leu Ile Ala Asp Thr Gly Val
50 55 60
Ala Pro Glu Arg Ile Asp Thr Ala Val Leu Asp Gly Gly Asn Pro Asp
65 70 75 80
Ser Ile Arg Ala Ala Met Ala Lys Leu Arg Lys Glu Tyr Gly Arg Ile
85 90 95
Asp Ile Leu Ile Asn Asn Ala Gly Ser Ala Gly Pro Lys Gln Pro Leu
100 105 110
His Asn Val Pro Leu Ser Pro Gln Glu Met Glu Ala Cys Gly Asp Thr
115 120 125
Glu Thr Val Arg Asp Ala Met Leu Asn Ile Leu Gly Val Thr Trp Asn
130 135 140
Met Ala Arg Ile Val Ala Pro Met Met Pro Val Gly Gly Ala Met Val
145 150 155 160
Asn Ile Ser Thr Ile Phe Ser His Thr Arg Tyr Tyr Gly Arg Thr Ala
165 170 175
Tyr Val Val Pro Lys Ala Ala Leu Asn Ala Leu Ser Asn Gln Leu Ala
180 185 190
Ser Glu Leu Gly Pro Arg Gly Ile Arg Val Asn Thr Val Phe Pro Gly
195 200 205
Pro Ile Glu Ser Asp Arg Ile Arg Thr Val Phe Ala Ala Met Asp Glu
210 215 220
Val Gln Ser Gln Pro Lys Asp Thr Thr Ala Asn Tyr Phe Thr Gly Arg
225 230 235 240
Met Ala Leu Thr Arg Ser Val Asn Gly Lys Val Asp Gly Lys Pro Leu
245 250 255
Pro Asn Pro Lys Asp Ile Ala Gly Thr Cys Leu Phe Leu Ala Ser Glu
260 265 270
Glu Ala Ala Gly Ile Ala Gly Glu Glu Val Asp Val Thr His Gly Leu
275 280 285
Ser Ala Asn Arg Thr Ser Ala Ser Thr Tyr Met Thr Arg Pro Ser Met
290 295 300
Arg Ser Leu Asp Gly Ala Gly Leu Asn Ile Phe Ile Val Ser Gly Glu
305 310 315 320
Asn Trp Asp Asp Ala Leu Val Ala Ala His Thr Leu Ile Gly Ser Gly
325 330 335
Ala Lys Val Arg Leu Gly Leu Ala Arg Asn Ala Asp Val Ala Gln Ala
340 345 350
Asn Ala Arg Leu Lys Ala Gln Gly Ile Gly Glu Glu Leu Thr Val Thr
355 360 365
Arg Phe Asn Arg Ala Glu Pro Asp Ala Met Glu Asp Ala Leu Ala Ala
370 375 380
Phe Ser Gly Asp Val Asp Gly Ala Ile Thr Gly Ala Ile Ile Leu Pro
385 390 395 400
Val Lys Pro Ser Gly His Phe Thr Gly Ser Leu Leu Ala Ala Asp Asp
405 410 415
Asp Thr Val Thr Lys Phe Met Asp Thr Glu Leu Val Gly Ala Ile Ala
420 425 430
Val Ser Arg Ser Leu Ala Arg Tyr Trp His Gly Arg Glu Asp Leu Gln
435 440 445
Ser Pro Pro Arg Cys Val Phe Met Thr Asn Pro Gly Asp Pro Leu Gly
450 455 460
Asn Ser Phe Ala Ser Val Leu Ser Ala Gly Ile Thr Gln Leu Ile Arg
465 470 475 480
Ile Trp Arg Asp Glu Glu Arg Val Gln Ala Gly Asn Gly Ser Thr Glu
485 490 495
His Ala Val Trp Ser Asn Gln Ile Val Arg His Thr Asn Thr Glu Asp
500 505 510
Glu Asn Thr Arg Phe Ala Ser Gly His Ala Thr Arg Val Leu Phe Arg
515 520 525
Glu Gln His Ile Ala Glu Ile Asp Leu Lys Leu Pro Ala Asn Ile Ser
530 535 540
Glu Glu Thr Gly Ser Arg Lys Ala Met Val Gly Phe Ala Glu Asn Ile
545 550 555 560
Thr Gly Leu His Leu Gly Lys Val Ala Phe Ile Thr Gly Gly Ser Ala
565 570 575
Gly Ile Gly Gly Gln Val Ala Arg Leu Leu Ala Leu Ala Gly Ala Lys
580 585 590
Val Met Met Val Ala Arg Arg Glu Ser Glu Leu Val Ala Ala Arg Asp
595 600 605
Arg Ile Val Gly Glu Leu Gln Asp Ile Gly Phe Ala Gly Val Glu Arg
610 615 620
Arg Val Lys Tyr Met Ala Asp Ile Asp Val Ser Asp Phe Ala Ser Leu
625 630 635 640
Asp Lys Ala Val Asp Ala Thr Leu Glu Glu Phe Gly Arg Ile Asp Tyr
645 650 655
Leu Ile Asn Asn Ala Gly Val Ala Gly Ala Glu Asp Met Val Ile Asp
660 665 670
Met Glu Pro Glu Ala Trp Arg Phe Thr Leu Asp Ala Asn Leu Ile Ser
675 680 685
Asn Tyr His Leu Met Gln Arg Val Val Pro Leu Met Lys Glu Gln Gly
690 695 700
Ser Gly Tyr Val Leu Asn Val Ser Ser Tyr Phe Gly Gly Glu Lys Phe
705 710 715 720
Leu Ala Val Ala Tyr Pro Asn Arg Ala Asp Tyr Gly Leu Ser Lys Ala
725 730 735
Gly Gln Arg Ala Met Val Glu Ala Phe Ser Pro Phe Leu Gly Pro Glu
740 745 750
Val Gln Cys Asn Ala Ile Ala Pro Gly Pro Val Asp Gly Asp Arg Leu
755 760 765
Ser Gly Thr Gly Gly Lys Pro Gly Leu Phe Gln Arg Arg Ala Lys Leu
770 775 780
Ile Leu Glu Asn Lys Arg Leu Asn Ala Val Tyr Ser Ala Val Ile His
785 790 795 800
Ala Ile Arg Glu Gly Gly Asp Ala Ala Lys Ile Leu Thr Arg Leu Ser
805 810 815
Arg Asn Ser Thr Ser Thr Leu Ser His Asp Ala Glu Ala Pro Glu Glu
820 825 830
Leu Arg Lys Leu Ala Leu Asp Phe Ala Ser Gln Gly Asp Gly Leu Cys
835 840 845
Thr Trp Asp Gln Tyr Leu Leu Thr Asp Ala Met Ala Gln Arg Leu Leu
850 855 860
Val Arg Leu Gln Leu Gly Gly Phe Leu Leu Gly Ser Asn Glu Trp Ala
865 870 875 880
Ser Leu Ser Ser Ser Glu Gln Thr Trp Leu Lys Leu Ser Pro Pro Asp
885 890 895
Asp Lys Pro Phe Leu Pro Ala Ala Gln Val Asp Lys Val Ala Asn Gly
900 905 910
Val Gly Lys Gly Val Ile Ser Gln Leu His Leu Gly Ala Met Pro Thr
915 920 925
Glu Ala Glu Val Ala Gln Ala Thr Val Phe Phe Leu Ala Asp Arg Ala
930 935 940
Val Ser Gly Glu Thr Phe Met Pro Ser Gly Gly Leu Arg Val Glu Arg
945 950 955 960
Ser Asn Thr Glu Arg Glu Met Phe Gly Ser Pro Lys Gln Glu Arg Ile
965 970 975
Asp Lys Met Lys Gly Lys Thr Val Trp Ile Ile Gly Glu His Leu Ser
980 985 990
Asp Tyr Val Ala Ala Thr Ile Glu Glu Leu Val Ser Gly Cys Gly Val
995 1000 1005
Ala Lys Val Val Leu Ile Ala Lys Asp Lys Ser Gly Glu Lys Ala
1010 1015 1020
Val Arg Asp Gln Leu Pro Asn Asp Leu Ser Lys Asp Ala Leu Glu
1025 1030 1035
Val Leu Ile Ala Gly Asp Gly Leu Glu Glu Ala Met Asp Glu Ala
1040 1045 1050
Leu Gly His Trp Gly Lys Pro Thr Thr Val Leu Ser Met Pro Gly
1055 1060 1065
Glu Pro Leu Pro Asp His Leu Phe Glu Gly Gly Asn Pro Leu Ser
1070 1075 1080
Thr Lys Asp Phe Ala His Met Val Glu Ala Asn Ile Thr Arg His
1085 1090 1095
Tyr Arg Val Thr Arg Lys Ala Ser Leu Tyr Asp Gly Cys Gln Val
1100 1105 1110
Val Leu Val Ser Pro Asp Val Pro Tyr Gly Ser Asp Gly Pro Gly
1115 1120 1125
Val Ala Leu Ala Asn Phe Val Lys Thr Ser Leu His Ala Phe Thr
1130 1135 1140
Ala Thr Val Ala Val Glu Asn Glu Arg Leu Val His Asp Val Pro
1145 1150 1155
Val Asn Gln Ile Asn Leu Thr Arg Arg Val Ser Ser Glu Glu Pro
1160 1165 1170
Arg Asp Ala Asp Glu His Ala Glu Glu Leu Arg Arg Phe Thr Arg
1175 1180 1185
Ala Val Leu Leu Val Gly Ala Pro Leu Pro Asp Ala Gln Asp Ser
1190 1195 1200
Arg Tyr Arg Ser Lys Ile Tyr Arg Gly Thr Ser Met Thr Val
1205 1210 1215
<210> 61
<211> 357
<212> PRT
<213> Metallosphaera sedula
<400> 61
Met Arg Arg Thr Leu Lys Ala Ala Ile Leu Gly Ala Thr Gly Leu Val
1 5 10 15
Gly Ile Glu Tyr Val Arg Met Leu Ala Asp His Pro Tyr Ile Lys Pro
20 25 30
Thr Tyr Leu Ala Gly Lys Gly Ser Val Gly Lys Pro Tyr Gly Glu Ile
35 40 45
Val Arg Trp Gln Thr Val Gly Asn Val Pro Lys Glu Val Ala Asn Gln
50 55 60
Glu Val Lys Pro Thr Asp Pro Lys Leu Met Asp Asp Val Asp Ile Ile
65 70 75 80
Phe Ser Pro Leu Pro Gln Gly Ala Ala Gly Pro Val Glu Glu Gln Phe
85 90 95
Ala Lys Leu Gly Phe Asn Val Ile Ser Asn Ser Pro Asp His Arg Phe
100 105 110
Asp Met Asp Val Pro Met Ile Ile Pro Glu Val Asn Pro His Thr Val
115 120 125
Thr Leu Ile Asp Glu Gln Arg Lys Arg Arg Asp Trp Lys Gly Phe Ile
130 135 140
Val Thr Thr Pro Leu Cys Thr Ala Gln Gly Ala Ala Ile Pro Leu Thr
145 150 155 160
Pro Ile Tyr Gln Asn Phe Lys Met Ser Gly Val Met Ile Thr Thr Met
165 170 175
Gln Ser Leu Ser Gly Ala Gly Tyr Pro Gly Ile Ala Ser Leu Asp Ile
180 185 190
Val Asp Asn Ala Leu Pro Leu Gly Asp Gly Tyr Asp Ala Lys Thr Val
195 200 205
Lys Glu Ile Thr Arg Ile Leu Ser Glu Val Lys Arg Asn Val Gln Glu
210 215 220
Pro Gly Val Asn Glu Ile Thr Leu Asp Ala Thr Thr His Arg Ile Ala
225 230 235 240
Thr Ile His Gly His Tyr Glu Val Ala Tyr Val Thr Phe Lys Glu Asp
245 250 255
Thr Asp Val Arg Lys Val Met Glu Ser Met Glu Ser Phe Lys Gly Glu
260 265 270
Pro Gln Asp Leu Lys Leu Pro Thr Ala Pro Glu Lys Pro Ile Ile Val
275 280 285
Thr Thr Gln Asp Ala Arg Pro Gln Val Phe Phe Asp Arg Trp Ala Gly
290 295 300
Asn Pro Pro Gly Met Ser Val Val Val Gly Arg Leu Lys Gln Val Asn
305 310 315 320
Pro Arg Thr Ile Arg Phe Val Ser Leu Ile His Asn Thr Val Arg Gly
325 330 335
Ala Ala Gly Gly Gly Val Leu Thr Ala Glu Leu Leu Val Glu Lys Gly
340 345 350
Tyr Ile Asp Lys Arg
355
<210> 62
<211> 356
<212> PRT
<213> Sulfolobus tokodaii
<400> 62
Met Arg Arg Thr Leu Lys Ala Ala Ile Leu Gly Ala Thr Gly Leu Val
1 5 10 15
Gly Ile Glu Tyr Val Arg Met Leu Ser Asn His Pro Tyr Ile Lys Pro
20 25 30
Ala Tyr Leu Ala Gly Lys Gly Ser Val Gly Lys Pro Tyr Gly Glu Val
35 40 45
Val Arg Trp Gln Thr Val Gly Gln Val Pro Lys Glu Ile Ala Asp Met
50 55 60
Glu Ile Lys Pro Thr Asp Pro Lys Leu Met Asp Asp Val Asp Ile Ile
65 70 75 80
Phe Ser Pro Leu Pro Gln Gly Ala Ala Gly Pro Val Glu Glu Gln Phe
85 90 95
Ala Lys Glu Gly Phe Pro Val Ile Ser Asn Ser Pro Asp His Arg Phe
100 105 110
Asp Pro Asp Val Pro Leu Leu Val Pro Glu Leu Asn Pro His Thr Ile
115 120 125
Ser Leu Ile Asp Glu Gln Arg Lys Arg Arg Glu Trp Lys Gly Phe Ile
130 135 140
Val Thr Thr Pro Leu Cys Thr Ala Gln Gly Ala Ala Ile Pro Leu Gly
145 150 155 160
Ala Ile Phe Lys Asp Tyr Lys Met Asp Gly Ala Phe Ile Thr Thr Ile
165 170 175
Gln Ser Leu Ser Gly Ala Gly Tyr Pro Gly Ile Pro Ser Leu Asp Val
180 185 190
Val Asp Asn Ile Leu Pro Leu Gly Asp Gly Tyr Asp Ala Lys Thr Ile
195 200 205
Lys Glu Ile Phe Arg Ile Leu Ser Glu Val Lys Arg Asn Val Asp Glu
210 215 220
Pro Lys Leu Glu Asp Val Ser Leu Ala Ala Thr Thr His Arg Ile Ala
225 230 235 240
Thr Ile His Gly His Tyr Glu Val Leu Tyr Val Ser Phe Lys Glu Glu
245 250 255
Thr Ala Ala Glu Lys Val Lys Glu Thr Leu Glu Asn Phe Arg Gly Glu
260 265 270
Pro Gln Asp Leu Lys Leu Pro Thr Ala Pro Ser Lys Pro Ile Ile Val
275 280 285
Met Asn Glu Asp Thr Arg Pro Gln Val Tyr Phe Asp Arg Trp Ala Gly
290 295 300
Asp Ile Pro Gly Met Ser Val Val Val Gly Arg Leu Lys Gln Val Asn
305 310 315 320
Lys Arg Met Ile Arg Leu Val Ser Leu Ile His Asn Thr Val Arg Gly
325 330 335
Ala Ala Gly Gly Gly Ile Leu Ala Ala Glu Leu Leu Val Glu Lys Gly
340 345 350
Tyr Ile Glu Lys
355
<210> 63
<211> 482
<212> PRT
<213> 酿酒酵母
<400> 63
Met Ser Ala Phe Val Arg Val Val Pro Arg Ile Ser Arg Ser Ser Val
1 5 10 15
Leu Thr Arg Ser Leu Arg Leu Gln Leu Arg Cys Tyr Ala Ser Tyr Pro
20 25 30
Glu His Thr Ile Ile Gly Met Pro Ala Leu Ser Pro Thr Met Thr Gln
35 40 45
Gly Asn Leu Ala Ala Trp Thr Lys Lys Glu Gly Asp Gln Leu Ser Pro
50 55 60
Gly Glu Val Ile Ala Glu Ile Glu Thr Asp Lys Ala Gln Met Asp Phe
65 70 75 80
Glu Phe Gln Glu Asp Gly Tyr Leu Ala Lys Ile Leu Val Pro Glu Gly
85 90 95
Thr Lys Asp Ile Pro Val Asn Lys Pro Ile Ala Val Tyr Val Glu Asp
100 105 110
Lys Ala Asp Val Pro Ala Phe Lys Asp Phe Lys Leu Glu Asp Ser Gly
115 120 125
Ser Asp Ser Lys Thr Ser Thr Lys Ala Gln Pro Ala Glu Pro Gln Ala
130 135 140
Glu Lys Lys Gln Glu Ala Pro Ala Glu Glu Thr Lys Thr Ser Ala Pro
145 150 155 160
Glu Ala Lys Lys Ser Asp Val Ala Ala Pro Gln Gly Arg Ile Phe Ala
165 170 175
Ser Pro Leu Ala Lys Thr Ile Ala Leu Glu Lys Gly Ile Ser Leu Lys
180 185 190
Asp Val His Gly Thr Gly Pro Arg Gly Arg Ile Thr Lys Ala Asp Ile
195 200 205
Glu Ser Tyr Leu Glu Lys Ser Ser Lys Gln Ser Ser Gln Thr Ser Gly
210 215 220
Ala Ala Ala Ala Thr Pro Ala Ala Ala Thr Ser Ser Thr Thr Ala Gly
225 230 235 240
Ser Ala Pro Ser Pro Ser Ser Thr Ala Ser Tyr Glu Asp Val Pro Ile
245 250 255
Ser Thr Met Arg Ser Ile Ile Gly Glu Arg Leu Leu Gln Ser Thr Gln
260 265 270
Gly Ile Pro Ser Tyr Ile Val Ser Ser Lys Ile Ser Ile Ser Lys Leu
275 280 285
Leu Lys Leu Arg Gln Ser Leu Asn Ala Thr Ala Asn Asp Lys Tyr Lys
290 295 300
Leu Ser Ile Asn Asp Leu Leu Val Lys Ala Ile Thr Val Ala Ala Lys
305 310 315 320
Arg Val Pro Asp Ala Asn Ala Tyr Trp Leu Pro Asn Glu Asn Val Ile
325 330 335
Arg Lys Phe Lys Asn Val Asp Val Ser Val Ala Val Ala Thr Pro Thr
340 345 350
Gly Leu Leu Thr Pro Ile Val Lys Asn Cys Glu Ala Lys Gly Leu Ser
355 360 365
Gln Ile Ser Asn Glu Ile Lys Glu Leu Val Lys Arg Ala Arg Ile Asn
370 375 380
Lys Leu Ala Pro Glu Glu Phe Gln Gly Gly Thr Ile Cys Ile Ser Asn
385 390 395 400
Met Gly Met Asn Asn Ala Val Asn Met Phe Thr Ser Ile Ile Asn Pro
405 410 415
Pro Gln Ser Thr Ile Leu Ala Ile Ala Thr Val Glu Arg Val Ala Val
420 425 430
Glu Asp Ala Ala Ala Glu Asn Gly Phe Ser Phe Asp Asn Gln Val Thr
435 440 445
Ile Thr Gly Thr Phe Asp His Arg Thr Ile Asp Gly Ala Lys Gly Ala
450 455 460
Glu Phe Met Lys Glu Leu Lys Thr Val Ile Glu Asn Pro Leu Glu Met
465 470 475 480
Leu Leu
<210> 64
<211> 420
<212> PRT
<213> 酿酒酵母
<400> 64
Met Leu Ala Ala Ser Phe Lys Arg Gln Pro Ser Gln Leu Val Arg Gly
1 5 10 15
Leu Gly Ala Val Leu Arg Thr Pro Thr Arg Ile Gly His Val Arg Thr
20 25 30
Met Ala Thr Leu Lys Thr Thr Asp Lys Lys Ala Pro Glu Asp Ile Glu
35 40 45
Gly Ser Asp Thr Val Gln Ile Glu Leu Pro Glu Ser Ser Phe Glu Ser
50 55 60
Tyr Met Leu Glu Pro Pro Asp Leu Ser Tyr Glu Thr Ser Lys Ala Thr
65 70 75 80
Leu Leu Gln Met Tyr Lys Asp Met Val Ile Ile Arg Arg Met Glu Met
85 90 95
Ala Cys Asp Ala Leu Tyr Lys Ala Lys Lys Ile Arg Gly Phe Cys His
100 105 110
Leu Ser Val Gly Gln Glu Ala Ile Ala Val Gly Ile Glu Asn Ala Ile
115 120 125
Thr Lys Leu Asp Ser Ile Ile Thr Ser Tyr Arg Cys His Gly Phe Thr
130 135 140
Phe Met Arg Gly Ala Ser Val Lys Ala Val Leu Ala Glu Leu Met Gly
145 150 155 160
Arg Arg Ala Gly Val Ser Tyr Gly Lys Gly Gly Ser Met His Leu Tyr
165 170 175
Ala Pro Gly Phe Tyr Gly Gly Asn Gly Ile Val Gly Ala Gln Val Pro
180 185 190
Leu Gly Ala Gly Leu Ala Phe Ala His Gln Tyr Lys Asn Glu Asp Ala
195 200 205
Cys Ser Phe Thr Leu Tyr Gly Asp Gly Ala Ser Asn Gln Gly Gln Val
210 215 220
Phe Glu Ser Phe Asn Met Ala Lys Leu Trp Asn Leu Pro Val Val Phe
225 230 235 240
Cys Cys Glu Asn Asn Lys Tyr Gly Met Gly Thr Ala Ala Ser Arg Ser
245 250 255
Ser Ala Met Thr Glu Tyr Phe Lys Arg Gly Gln Tyr Ile Pro Gly Leu
260 265 270
Lys Val Asn Gly Met Asp Ile Leu Ala Val Tyr Gln Ala Ser Lys Phe
275 280 285
Ala Lys Asp Trp Cys Leu Ser Gly Lys Gly Pro Leu Val Leu Glu Tyr
290 295 300
Glu Thr Tyr Arg Tyr Gly Gly His Ser Met Ser Asp Pro Gly Thr Thr
305 310 315 320
Tyr Arg Thr Arg Asp Glu Ile Gln His Met Arg Ser Lys Asn Asp Pro
325 330 335
Ile Ala Gly Leu Lys Met His Leu Ile Asp Leu Gly Ile Ala Thr Glu
340 345 350
Ala Glu Val Lys Ala Tyr Asp Lys Ser Ala Arg Lys Tyr Val Asp Glu
355 360 365
Gln Val Glu Leu Ala Asp Ala Ala Pro Pro Pro Glu Ala Lys Leu Ser
370 375 380
Ile Leu Phe Glu Asp Val Tyr Val Lys Gly Thr Glu Thr Pro Thr Leu
385 390 395 400
Arg Gly Arg Ile Pro Glu Asp Thr Trp Asp Phe Lys Lys Gln Gly Phe
405 410 415
Ala Ser Arg Asp
420
<210> 65
<211> 366
<212> PRT
<213> 酿酒酵母
<400> 65
Met Phe Ser Arg Leu Pro Thr Ser Leu Ala Arg Asn Val Ala Arg Arg
1 5 10 15
Ala Pro Thr Ser Phe Val Arg Pro Ser Ala Ala Ala Ala Ala Leu Arg
20 25 30
Phe Ser Ser Thr Lys Thr Met Thr Val Arg Glu Ala Leu Asn Ser Ala
35 40 45
Met Ala Glu Glu Leu Asp Arg Asp Asp Asp Val Phe Leu Ile Gly Glu
50 55 60
Glu Val Ala Gln Tyr Asn Gly Ala Tyr Lys Val Ser Lys Gly Leu Leu
65 70 75 80
Asp Arg Phe Gly Glu Arg Arg Val Val Asp Thr Pro Ile Thr Glu Tyr
85 90 95
Gly Phe Thr Gly Leu Ala Val Gly Ala Ala Leu Lys Gly Leu Lys Pro
100 105 110
Ile Val Glu Phe Met Ser Phe Asn Phe Ser Met Gln Ala Ile Asp His
115 120 125
Val Val Asn Ser Ala Ala Lys Thr His Tyr Met Ser Gly Gly Thr Gln
130 135 140
Lys Cys Gln Met Val Phe Arg Gly Pro Asn Gly Ala Ala Val Gly Val
145 150 155 160
Gly Ala Gln His Ser Gln Asp Phe Ser Pro Trp Tyr Gly Ser Ile Pro
165 170 175
Gly Leu Lys Val Leu Val Pro Tyr Ser Ala Glu Asp Ala Arg Gly Leu
180 185 190
Leu Lys Ala Ala Ile Arg Asp Pro Asn Pro Val Val Phe Leu Glu Asn
195 200 205
Glu Leu Leu Tyr Gly Glu Ser Phe Glu Ile Ser Glu Glu Ala Leu Ser
210 215 220
Pro Glu Phe Thr Leu Pro Tyr Lys Ala Lys Ile Glu Arg Glu Gly Thr
225 230 235 240
Asp Ile Ser Ile Val Thr Tyr Thr Arg Asn Val Gln Phe Ser Leu Glu
245 250 255
Ala Ala Glu Ile Leu Gln Lys Lys Tyr Gly Val Ser Ala Glu Val Ile
260 265 270
Asn Leu Arg Ser Ile Arg Pro Leu Asp Thr Glu Ala Ile Ile Lys Thr
275 280 285
Val Lys Lys Thr Asn His Leu Ile Thr Val Glu Ser Thr Phe Pro Ser
290 295 300
Phe Gly Val Gly Ala Glu Ile Val Ala Gln Val Met Glu Ser Glu Ala
305 310 315 320
Phe Asp Tyr Leu Asp Ala Pro Ile Gln Arg Val Thr Gly Ala Asp Val
325 330 335
Pro Thr Pro Tyr Ala Lys Glu Leu Glu Asp Phe Ala Phe Pro Asp Thr
340 345 350
Pro Thr Ile Val Lys Ala Val Lys Glu Val Leu Ser Ile Glu
355 360 365
<210> 66
<211> 499
<212> PRT
<213> 酿酒酵母
<400> 66
Met Leu Arg Ile Arg Ser Leu Leu Asn Asn Lys Arg Ala Phe Ser Ser
1 5 10 15
Thr Val Arg Thr Leu Thr Ile Asn Lys Ser His Asp Val Val Ile Ile
20 25 30
Gly Gly Gly Pro Ala Gly Tyr Val Ala Ala Ile Lys Ala Ala Gln Leu
35 40 45
Gly Phe Asn Thr Ala Cys Val Glu Lys Arg Gly Lys Leu Gly Gly Thr
50 55 60
Cys Leu Asn Val Gly Cys Ile Pro Ser Lys Ala Leu Leu Asn Asn Ser
65 70 75 80
His Leu Phe His Gln Met His Thr Glu Ala Gln Lys Arg Gly Ile Asp
85 90 95
Val Asn Gly Asp Ile Lys Ile Asn Val Ala Asn Phe Gln Lys Ala Lys
100 105 110
Asp Asp Ala Val Lys Gln Leu Thr Gly Gly Ile Glu Leu Leu Phe Lys
115 120 125
Lys Asn Lys Val Thr Tyr Tyr Lys Gly Asn Gly Ser Phe Glu Asp Glu
130 135 140
Thr Lys Ile Arg Val Thr Pro Val Asp Gly Leu Glu Gly Thr Val Lys
145 150 155 160
Glu Asp His Ile Leu Asp Val Lys Asn Ile Ile Val Ala Thr Gly Ser
165 170 175
Glu Val Thr Pro Phe Pro Gly Ile Glu Ile Asp Glu Glu Lys Ile Val
180 185 190
Ser Ser Thr Gly Ala Leu Ser Leu Lys Glu Ile Pro Lys Arg Leu Thr
195 200 205
Ile Ile Gly Gly Gly Ile Ile Gly Leu Glu Met Gly Ser Val Tyr Ser
210 215 220
Arg Leu Gly Ser Lys Val Thr Val Val Glu Phe Gln Pro Gln Ile Gly
225 230 235 240
Ala Ser Met Asp Gly Glu Val Ala Lys Ala Thr Gln Lys Phe Leu Lys
245 250 255
Lys Gln Gly Leu Asp Phe Lys Leu Ser Thr Lys Val Ile Ser Ala Lys
260 265 270
Arg Asn Asp Asp Lys Asn Val Val Glu Ile Val Val Glu Asp Thr Lys
275 280 285
Thr Asn Lys Gln Glu Asn Leu Glu Ala Glu Val Leu Leu Val Ala Val
290 295 300
Gly Arg Arg Pro Tyr Ile Ala Gly Leu Gly Ala Glu Lys Ile Gly Leu
305 310 315 320
Glu Val Asp Lys Arg Gly Arg Leu Val Ile Asp Asp Gln Phe Asn Ser
325 330 335
Lys Phe Pro His Ile Lys Val Val Gly Asp Val Thr Phe Gly Pro Met
340 345 350
Leu Ala His Lys Ala Glu Glu Glu Gly Ile Ala Ala Val Glu Met Leu
355 360 365
Lys Thr Gly His Gly His Val Asn Tyr Asn Asn Ile Pro Ser Val Met
370 375 380
Tyr Ser His Pro Glu Val Ala Trp Val Gly Lys Thr Glu Glu Gln Leu
385 390 395 400
Lys Glu Ala Gly Ile Asp Tyr Lys Ile Gly Lys Phe Pro Phe Ala Ala
405 410 415
Asn Ser Arg Ala Lys Thr Asn Gln Asp Thr Glu Gly Phe Val Lys Ile
420 425 430
Leu Ile Asp Ser Lys Thr Glu Arg Ile Leu Gly Ala His Ile Ile Gly
435 440 445
Pro Asn Ala Gly Glu Met Ile Ala Glu Ala Gly Leu Ala Leu Glu Tyr
450 455 460
Gly Ala Ser Ala Glu Asp Val Ala Arg Val Cys His Ala His Pro Thr
465 470 475 480
Leu Ser Glu Ala Phe Lys Glu Ala Asn Met Ala Ala Tyr Asp Lys Ala
485 490 495
Ile His Cys
<210> 67
<211> 887
<212> PRT
<213> 大肠杆菌
<400> 67
Met Ser Glu Arg Phe Pro Asn Asp Val Asp Pro Ile Glu Thr Arg Asp
1 5 10 15
Trp Leu Gln Ala Ile Glu Ser Val Ile Arg Glu Glu Gly Val Glu Arg
20 25 30
Ala Gln Tyr Leu Ile Asp Gln Leu Leu Ala Glu Ala Arg Lys Gly Gly
35 40 45
Val Asn Val Ala Ala Gly Thr Gly Ile Ser Asn Tyr Ile Asn Thr Ile
50 55 60
Pro Val Glu Glu Gln Pro Glu Tyr Pro Gly Asn Leu Glu Leu Glu Arg
65 70 75 80
Arg Ile Arg Ser Ala Ile Arg Trp Asn Ala Ile Met Thr Val Leu Arg
85 90 95
Ala Ser Lys Lys Asp Leu Glu Leu Gly Gly His Met Ala Ser Phe Gln
100 105 110
Ser Ser Ala Thr Ile Tyr Asp Val Cys Phe Asn His Phe Phe Arg Ala
115 120 125
Arg Asn Glu Gln Asp Gly Gly Asp Leu Val Tyr Phe Gln Gly His Ile
130 135 140
Ser Pro Gly Val Tyr Ala Arg Ala Phe Leu Glu Gly Arg Leu Thr Gln
145 150 155 160
Glu Gln Leu Asp Asn Phe Arg Gln Glu Val His Gly Asn Gly Leu Ser
165 170 175
Ser Tyr Pro His Pro Lys Leu Met Pro Glu Phe Trp Gln Phe Pro Thr
180 185 190
Val Ser Met Gly Leu Gly Pro Ile Gly Ala Ile Tyr Gln Ala Lys Phe
195 200 205
Leu Lys Tyr Leu Glu His Arg Gly Leu Lys Asp Thr Ser Lys Gln Thr
210 215 220
Val Tyr Ala Phe Leu Gly Asp Gly Glu Met Asp Glu Pro Glu Ser Lys
225 230 235 240
Gly Ala Ile Thr Ile Ala Thr Arg Glu Lys Leu Asp Asn Leu Val Phe
245 250 255
Val Ile Asn Cys Asn Leu Gln Arg Leu Asp Gly Pro Val Thr Gly Asn
260 265 270
Gly Lys Ile Ile Asn Glu Leu Glu Gly Ile Phe Glu Gly Ala Gly Trp
275 280 285
Asn Val Ile Lys Val Met Trp Gly Ser Arg Trp Asp Glu Leu Leu Arg
290 295 300
Lys Asp Thr Ser Gly Lys Leu Ile Gln Leu Met Asn Glu Thr Val Asp
305 310 315 320
Gly Asp Tyr Gln Thr Phe Lys Ser Lys Asp Gly Ala Tyr Val Arg Glu
325 330 335
His Phe Phe Gly Lys Tyr Pro Glu Thr Ala Ala Leu Val Ala Asp Trp
340 345 350
Thr Asp Glu Gln Ile Trp Ala Leu Asn Arg Gly Gly His Asp Pro Lys
355 360 365
Lys Ile Tyr Ala Ala Phe Lys Lys Ala Gln Glu Thr Lys Gly Lys Ala
370 375 380
Thr Val Ile Leu Ala His Thr Ile Lys Gly Tyr Gly Met Gly Asp Ala
385 390 395 400
Ala Glu Gly Lys Asn Ile Ala His Gln Val Lys Lys Met Asn Met Asp
405 410 415
Gly Val Arg His Ile Arg Asp Arg Phe Asn Val Pro Val Ser Asp Ala
420 425 430
Asp Ile Glu Lys Leu Pro Tyr Ile Thr Phe Pro Glu Gly Ser Glu Glu
435 440 445
His Thr Tyr Leu His Ala Gln Arg Gln Lys Leu His Gly Tyr Leu Pro
450 455 460
Ser Arg Gln Pro Asn Phe Thr Glu Lys Leu Glu Leu Pro Ser Leu Gln
465 470 475 480
Asp Phe Gly Ala Leu Leu Glu Glu Gln Ser Lys Glu Ile Ser Thr Thr
485 490 495
Ile Ala Phe Val Arg Ala Leu Asn Val Met Leu Lys Asn Lys Ser Ile
500 505 510
Lys Asp Arg Leu Val Pro Ile Ile Ala Asp Glu Ala Arg Thr Phe Gly
515 520 525
Met Glu Gly Leu Phe Arg Gln Ile Gly Ile Tyr Ser Pro Asn Gly Gln
530 535 540
Gln Tyr Thr Pro Gln Asp Arg Glu Gln Val Ala Tyr Tyr Lys Glu Asp
545 550 555 560
Glu Lys Gly Gln Ile Leu Gln Glu Gly Ile Asn Glu Leu Gly Ala Gly
565 570 575
Cys Ser Trp Leu Ala Ala Ala Thr Ser Tyr Ser Thr Asn Asn Leu Pro
580 585 590
Met Ile Pro Phe Tyr Ile Tyr Tyr Ser Met Phe Gly Phe Gln Arg Ile
595 600 605
Gly Asp Leu Cys Trp Ala Ala Gly Asp Gln Gln Ala Arg Gly Phe Leu
610 615 620
Ile Gly Gly Thr Ser Gly Arg Thr Thr Leu Asn Gly Glu Gly Leu Gln
625 630 635 640
His Glu Asp Gly His Ser His Ile Gln Ser Leu Thr Ile Pro Asn Cys
645 650 655
Ile Ser Tyr Asp Pro Ala Tyr Ala Tyr Glu Val Ala Val Ile Met His
660 665 670
Asp Gly Leu Glu Arg Met Tyr Gly Glu Lys Gln Glu Asn Val Tyr Tyr
675 680 685
Tyr Ile Thr Thr Leu Asn Glu Asn Tyr His Met Pro Ala Met Pro Glu
690 695 700
Gly Ala Glu Glu Gly Ile Arg Lys Gly Ile Tyr Lys Leu Glu Thr Ile
705 710 715 720
Glu Gly Ser Lys Gly Lys Val Gln Leu Leu Gly Ser Gly Ser Ile Leu
725 730 735
Arg His Val Arg Glu Ala Ala Glu Ile Leu Ala Lys Asp Tyr Gly Val
740 745 750
Gly Ser Asp Val Tyr Ser Val Thr Ser Phe Thr Glu Leu Ala Arg Asp
755 760 765
Gly Gln Asp Cys Glu Arg Trp Asn Met Leu His Pro Leu Glu Thr Pro
770 775 780
Arg Val Pro Tyr Ile Ala Gln Val Met Asn Asp Ala Pro Ala Val Ala
785 790 795 800
Ser Thr Asp Tyr Met Lys Leu Phe Ala Glu Gln Val Arg Thr Tyr Val
805 810 815
Pro Ala Asp Asp Tyr Arg Val Leu Gly Thr Asp Gly Phe Gly Arg Ser
820 825 830
Asp Ser Arg Glu Asn Leu Arg His His Phe Glu Val Asp Ala Ser Tyr
835 840 845
Val Val Val Ala Ala Leu Gly Glu Leu Ala Lys Arg Gly Glu Ile Asp
850 855 860
Lys Lys Val Val Ala Asp Ala Ile Ala Lys Phe Asn Ile Asp Ala Asp
865 870 875 880
Lys Val Asn Pro Arg Leu Ala
885
<210> 68
<211> 630
<212> PRT
<213> 大肠杆菌
<400> 68
Met Ala Ile Glu Ile Lys Val Pro Asp Ile Gly Ala Asp Glu Val Glu
1 5 10 15
Ile Thr Glu Ile Leu Val Lys Val Gly Asp Lys Val Glu Ala Glu Gln
20 25 30
Ser Leu Ile Thr Val Glu Gly Asp Lys Ala Ser Met Glu Val Pro Ser
35 40 45
Pro Gln Ala Gly Ile Val Lys Glu Ile Lys Val Ser Val Gly Asp Lys
50 55 60
Thr Gln Thr Gly Ala Leu Ile Met Ile Phe Asp Ser Ala Asp Gly Ala
65 70 75 80
Ala Asp Ala Ala Pro Ala Gln Ala Glu Glu Lys Lys Glu Ala Ala Pro
85 90 95
Ala Ala Ala Pro Ala Ala Ala Ala Ala Lys Asp Val Asn Val Pro Asp
100 105 110
Ile Gly Ser Asp Glu Val Glu Val Thr Glu Ile Leu Val Lys Val Gly
115 120 125
Asp Lys Val Glu Ala Glu Gln Ser Leu Ile Thr Val Glu Gly Asp Lys
130 135 140
Ala Ser Met Glu Val Pro Ala Pro Phe Ala Gly Thr Val Lys Glu Ile
145 150 155 160
Lys Val Asn Val Gly Asp Lys Val Ser Thr Gly Ser Leu Ile Met Val
165 170 175
Phe Glu Val Ala Gly Glu Ala Gly Ala Ala Ala Pro Ala Ala Lys Gln
180 185 190
Glu Ala Ala Pro Ala Ala Ala Pro Ala Pro Ala Ala Gly Val Lys Glu
195 200 205
Val Asn Val Pro Asp Ile Gly Gly Asp Glu Val Glu Val Thr Glu Val
210 215 220
Met Val Lys Val Gly Asp Lys Val Ala Ala Glu Gln Ser Leu Ile Thr
225 230 235 240
Val Glu Gly Asp Lys Ala Ser Met Glu Val Pro Ala Pro Phe Ala Gly
245 250 255
Val Val Lys Glu Leu Lys Val Asn Val Gly Asp Lys Val Lys Thr Gly
260 265 270
Ser Leu Ile Met Ile Phe Glu Val Glu Gly Ala Ala Pro Ala Ala Ala
275 280 285
Pro Ala Lys Gln Glu Ala Ala Ala Pro Ala Pro Ala Ala Lys Ala Glu
290 295 300
Ala Pro Ala Ala Ala Pro Ala Ala Lys Ala Glu Gly Lys Ser Glu Phe
305 310 315 320
Ala Glu Asn Asp Ala Tyr Val His Ala Thr Pro Leu Ile Arg Arg Leu
325 330 335
Ala Arg Glu Phe Gly Val Asn Leu Ala Lys Val Lys Gly Thr Gly Arg
340 345 350
Lys Gly Arg Ile Leu Arg Glu Asp Val Gln Ala Tyr Val Lys Glu Ala
355 360 365
Ile Lys Arg Ala Glu Ala Ala Pro Ala Ala Thr Gly Gly Gly Ile Pro
370 375 380
Gly Met Leu Pro Trp Pro Lys Val Asp Phe Ser Lys Phe Gly Glu Ile
385 390 395 400
Glu Glu Val Glu Leu Gly Arg Ile Gln Lys Ile Ser Gly Ala Asn Leu
405 410 415
Ser Arg Asn Trp Val Met Ile Pro His Val Thr His Phe Asp Lys Thr
420 425 430
Asp Ile Thr Glu Leu Glu Ala Phe Arg Lys Gln Gln Asn Glu Glu Ala
435 440 445
Ala Lys Arg Lys Leu Asp Val Lys Ile Thr Pro Val Val Phe Ile Met
450 455 460
Lys Ala Val Ala Ala Ala Leu Glu Gln Met Pro Arg Phe Asn Ser Ser
465 470 475 480
Leu Ser Glu Asp Gly Gln Arg Leu Thr Leu Lys Lys Tyr Ile Asn Ile
485 490 495
Gly Val Ala Val Asp Thr Pro Asn Gly Leu Val Val Pro Val Phe Lys
500 505 510
Asp Val Asn Lys Lys Gly Ile Ile Glu Leu Ser Arg Glu Leu Met Thr
515 520 525
Ile Ser Lys Lys Ala Arg Asp Gly Lys Leu Thr Ala Gly Glu Met Gln
530 535 540
Gly Gly Cys Phe Thr Ile Ser Ser Ile Gly Gly Leu Gly Thr Thr His
545 550 555 560
Phe Ala Pro Ile Val Asn Ala Pro Glu Val Ala Ile Leu Gly Val Ser
565 570 575
Lys Ser Ala Met Glu Pro Val Trp Asn Gly Lys Glu Phe Val Pro Arg
580 585 590
Leu Met Leu Pro Ile Ser Leu Ser Phe Asp His Arg Val Ile Asp Gly
595 600 605
Ala Asp Gly Ala Arg Phe Ile Thr Ile Ile Asn Asn Thr Leu Ser Asp
610 615 620
Ile Arg Arg Leu Val Met
625 630
<210> 69
<211> 474
<212> PRT
<213> 大肠杆菌
<400> 69
Met Ser Thr Glu Ile Lys Thr Gln Val Val Val Leu Gly Ala Gly Pro
1 5 10 15
Ala Gly Tyr Ser Ala Ala Phe Arg Cys Ala Asp Leu Gly Leu Glu Thr
20 25 30
Val Ile Val Glu Arg Tyr Asn Thr Leu Gly Gly Val Cys Leu Asn Val
35 40 45
Gly Cys Ile Pro Ser Lys Ala Leu Leu His Val Ala Lys Val Ile Glu
50 55 60
Glu Ala Lys Ala Leu Ala Glu His Gly Ile Val Phe Gly Glu Pro Lys
65 70 75 80
Thr Asp Ile Asp Lys Ile Arg Thr Trp Lys Glu Lys Val Ile Asn Gln
85 90 95
Leu Thr Gly Gly Leu Ala Gly Met Ala Lys Gly Arg Lys Val Lys Val
100 105 110
Val Asn Gly Leu Gly Lys Phe Thr Gly Ala Asn Thr Leu Glu Val Glu
115 120 125
Gly Glu Asn Gly Lys Thr Val Ile Asn Phe Asp Asn Ala Ile Ile Ala
130 135 140
Ala Gly Ser Arg Pro Ile Gln Leu Pro Phe Ile Pro His Glu Asp Pro
145 150 155 160
Arg Ile Trp Asp Ser Thr Asp Ala Leu Glu Leu Lys Glu Val Pro Glu
165 170 175
Arg Leu Leu Val Met Gly Gly Gly Ile Ile Gly Leu Glu Met Gly Thr
180 185 190
Val Tyr His Ala Leu Gly Ser Gln Ile Asp Val Val Glu Met Phe Asp
195 200 205
Gln Val Ile Pro Ala Ala Asp Lys Asp Ile Val Lys Val Phe Thr Lys
210 215 220
Arg Ile Ser Lys Lys Phe Asn Leu Met Leu Glu Thr Lys Val Thr Ala
225 230 235 240
Val Glu Ala Lys Glu Asp Gly Ile Tyr Val Thr Met Glu Gly Lys Lys
245 250 255
Ala Pro Ala Glu Pro Gln Arg Tyr Asp Ala Val Leu Val Ala Ile Gly
260 265 270
Arg Val Pro Asn Gly Lys Asn Leu Asp Ala Gly Lys Ala Gly Val Glu
275 280 285
Val Asp Asp Arg Gly Phe Ile Arg Val Asp Lys Gln Leu Arg Thr Asn
290 295 300
Val Pro His Ile Phe Ala Ile Gly Asp Ile Val Gly Gln Pro Met Leu
305 310 315 320
Ala His Lys Gly Val His Glu Gly His Val Ala Ala Glu Val Ile Ala
325 330 335
Gly Lys Lys His Tyr Phe Asp Pro Lys Val Ile Pro Ser Ile Ala Tyr
340 345 350
Thr Glu Pro Glu Val Ala Trp Val Gly Leu Thr Glu Lys Glu Ala Lys
355 360 365
Glu Lys Gly Ile Ser Tyr Glu Thr Ala Thr Phe Pro Trp Ala Ala Ser
370 375 380
Gly Arg Ala Ile Ala Ser Asp Cys Ala Asp Gly Met Thr Lys Leu Ile
385 390 395 400
Phe Asp Lys Glu Ser His Arg Val Ile Gly Gly Ala Ile Val Gly Thr
405 410 415
Asn Gly Gly Glu Leu Leu Gly Glu Ile Gly Leu Ala Ile Glu Met Gly
420 425 430
Cys Asp Ala Glu Asp Ile Ala Leu Thr Ile His Ala His Pro Thr Leu
435 440 445
His Glu Ser Val Gly Leu Ala Ala Glu Val Phe Glu Gly Ser Ile Thr
450 455 460
Asp Leu Pro Asn Pro Lys Ala Lys Lys Lys
465 470
<210> 70
<211> 371
<212> PRT
<213> 枯草芽孢杆菌
<400> 70
Met Ala Ala Lys Thr Lys Lys Ala Ile Val Asp Ser Lys Lys Gln Phe
1 5 10 15
Asp Ala Ile Lys Lys Gln Phe Glu Thr Phe Gln Ile Leu Asn Glu Lys
20 25 30
Gly Glu Val Val Asn Glu Ala Ala Met Pro Asp Leu Thr Asp Asp Gln
35 40 45
Leu Lys Glu Leu Met Arg Arg Met Val Phe Thr Arg Val Leu Asp Gln
50 55 60
Arg Ser Ile Ser Leu Asn Arg Gln Gly Arg Leu Gly Phe Tyr Ala Pro
65 70 75 80
Thr Ala Gly Gln Glu Ala Ser Gln Ile Ala Thr His Phe Ala Leu Glu
85 90 95
Lys Glu Asp Phe Val Leu Pro Gly Tyr Arg Asp Val Pro Gln Leu Ile
100 105 110
Trp His Gly Leu Pro Leu Tyr Gln Ala Phe Leu Phe Ser Arg Gly His
115 120 125
Phe Arg Gly Asn Gln Met Pro Asp Asp Val Asn Ala Leu Ser Pro Gln
130 135 140
Ile Ile Ile Gly Ala Gln Tyr Ile Gln Thr Ala Gly Val Ala Leu Gly
145 150 155 160
Leu Lys Lys Arg Gly Lys Lys Ala Val Ala Ile Thr Tyr Thr Gly Asp
165 170 175
Gly Gly Ala Ser Gln Gly Asp Phe Tyr Glu Gly Ile Asn Phe Ala Gly
180 185 190
Ala Tyr Lys Ala Pro Ala Ile Phe Val Val Gln Asn Asn Arg Tyr Ala
195 200 205
Ile Ser Thr Pro Val Glu Lys Gln Ser Ala Ala Glu Thr Ile Ala Gln
210 215 220
Lys Ala Val Ala Ala Gly Ile Val Gly Val Gln Val Asp Gly Met Asp
225 230 235 240
Pro Leu Ala Val Tyr Ala Ala Thr Ala Glu Ala Arg Glu Arg Ala Ile
245 250 255
Asn Gly Glu Gly Pro Thr Leu Ile Glu Thr Leu Thr Phe Arg Tyr Gly
260 265 270
Pro His Thr Met Ala Gly Asp Asp Pro Thr Lys Tyr Arg Thr Lys Glu
275 280 285
Ile Glu Asn Glu Trp Glu Gln Lys Asp Pro Leu Val Arg Phe Arg Ala
290 295 300
Phe Leu Glu Asn Lys Gly Leu Trp Ser Glu Glu Glu Glu Ala Lys Val
305 310 315 320
Ile Glu Asp Ala Lys Glu Glu Ile Lys Gln Ala Ile Lys Lys Ala Asp
325 330 335
Ala Glu Pro Lys Gln Lys Val Thr Asp Leu Met Lys Ile Met Tyr Glu
340 345 350
Lys Met Pro His Asn Leu Glu Glu Gln Phe Glu Ile Tyr Thr Gln Lys
355 360 365
Glu Ser Lys
370
<210> 71
<211> 325
<212> PRT
<213> 枯草芽孢杆菌
<400> 71
Met Ala Gln Met Thr Met Ile Gln Ala Ile Thr Asp Ala Leu Arg Thr
1 5 10 15
Glu Leu Lys Asn Asp Glu Asn Val Leu Val Phe Gly Glu Asp Val Gly
20 25 30
Val Asn Gly Gly Val Phe Arg Ala Thr Glu Gly Leu Gln Lys Glu Phe
35 40 45
Gly Glu Asp Arg Val Phe Asp Thr Pro Leu Ala Glu Ser Gly Ile Gly
50 55 60
Gly Leu Ala Leu Gly Leu Gly Leu Asn Gly Phe Arg Pro Val Met Glu
65 70 75 80
Ile Gln Phe Phe Gly Phe Val Tyr Glu Val Met Asp Ser Val Ser Gly
85 90 95
Gln Met Ala Arg Met Arg Tyr Arg Ser Gly Gly Arg Trp Thr Ser Pro
100 105 110
Val Thr Ile Arg Ser Pro Phe Gly Gly Gly Val His Thr Pro Glu Leu
115 120 125
His Ala Asp Ser Leu Glu Gly Leu Val Ala Gln Gln Pro Gly Ile Lys
130 135 140
Val Val Ile Pro Ser Thr Pro Tyr Asp Ala Lys Gly Leu Leu Ile Ser
145 150 155 160
Ala Ile Arg Asp Asn Asp Pro Val Val Phe Leu Glu His Met Lys Leu
165 170 175
Tyr Arg Ser Phe Arg Gln Glu Val Pro Glu Glu Glu Tyr Thr Ile Glu
180 185 190
Leu Gly Lys Ala Asp Val Lys Arg Glu Gly Thr Asp Leu Ser Ile Ile
195 200 205
Thr Tyr Gly Ala Met Val His Glu Ser Leu Lys Ala Ala Asp Glu Leu
210 215 220
Glu Lys Asp Gly Ile Ser Ala Glu Val Val Asp Leu Arg Thr Val Ser
225 230 235 240
Pro Leu Asp Ile Asp Thr Ile Ile Ala Ser Val Glu Lys Thr Gly Arg
245 250 255
Ala Ile Val Val Gln Glu Ala Gln Lys Gln Ala Gly Ile Ala Ala Asn
260 265 270
Val Val Ala Glu Ile Asn Asp Arg Ala Ile Leu Ser Leu Glu Ala Pro
275 280 285
Val Leu Arg Val Ala Ala Pro Asp Thr Val Phe Pro Phe Ser Gln Ala
290 295 300
Glu Ser Val Trp Leu Pro Asn His Lys Asp Val Leu Glu Thr Ala Arg
305 310 315 320
Lys Val Leu Glu Phe
325
<210> 72
<211> 442
<212> PRT
<213> 枯草芽孢杆菌
<400> 72
Met Ala Phe Glu Phe Lys Leu Pro Asp Ile Gly Glu Gly Ile His Glu
1 5 10 15
Gly Glu Ile Val Lys Trp Phe Val Lys Pro Asn Asp Glu Val Asp Glu
20 25 30
Asp Asp Val Leu Ala Glu Val Gln Asn Asp Lys Ala Val Val Glu Ile
35 40 45
Pro Ser Pro Val Lys Gly Lys Val Leu Glu Leu Lys Val Glu Glu Gly
50 55 60
Thr Val Ala Thr Val Gly Gln Thr Ile Ile Thr Phe Asp Ala Pro Gly
65 70 75 80
Tyr Glu Asp Leu Gln Phe Lys Gly Ser Asp Glu Ser Asp Asp Ala Lys
85 90 95
Thr Glu Ala Gln Val Gln Ser Thr Ala Glu Ala Gly Gln Asp Val Ala
100 105 110
Lys Glu Glu Gln Ala Gln Glu Pro Ala Lys Ala Thr Gly Ala Gly Gln
115 120 125
Gln Asp Gln Ala Glu Val Asp Pro Asn Lys Arg Val Ile Ala Met Pro
130 135 140
Ser Val Arg Lys Tyr Ala Arg Glu Lys Gly Val Asp Ile Arg Lys Val
145 150 155 160
Thr Gly Ser Gly Asn Asn Gly Arg Val Val Lys Glu Asp Ile Asp Ser
165 170 175
Phe Val Asn Gly Gly Ala Gln Glu Ala Ala Pro Gln Glu Thr Ala Ala
180 185 190
Pro Gln Glu Thr Ala Ala Lys Pro Ala Ala Ala Pro Ala Pro Glu Gly
195 200 205
Glu Phe Pro Glu Thr Arg Glu Lys Met Ser Gly Ile Arg Lys Ala Ile
210 215 220
Ala Lys Ala Met Val Asn Ser Lys His Thr Ala Pro His Val Thr Leu
225 230 235 240
Met Asp Glu Val Asp Val Thr Asn Leu Val Ala His Arg Lys Gln Phe
245 250 255
Lys Gln Val Ala Ala Asp Gln Gly Ile Lys Leu Thr Tyr Leu Pro Tyr
260 265 270
Val Val Lys Ala Leu Thr Ser Ala Leu Lys Lys Phe Pro Val Leu Asn
275 280 285
Thr Ser Ile Asp Asp Lys Thr Asp Glu Val Ile Gln Lys His Tyr Phe
290 295 300
Asn Ile Gly Ile Ala Ala Asp Thr Glu Lys Gly Leu Leu Val Pro Val
305 310 315 320
Val Lys Asn Ala Asp Arg Lys Ser Val Phe Glu Ile Ser Asp Glu Ile
325 330 335
Asn Gly Leu Ala Thr Lys Ala Arg Glu Gly Lys Leu Ala Pro Ala Glu
340 345 350
Met Lys Gly Ala Ser Cys Thr Ile Thr Asn Ile Gly Ser Ala Gly Gly
355 360 365
Gln Trp Phe Thr Pro Val Ile Asn His Pro Glu Val Ala Ile Leu Gly
370 375 380
Ile Gly Arg Ile Ala Glu Lys Ala Ile Val Arg Asp Gly Glu Ile Val
385 390 395 400
Ala Ala Pro Val Leu Ala Leu Ser Leu Ser Phe Asp His Arg Met Ile
405 410 415
Asp Gly Ala Thr Ala Gln Asn Ala Leu Asn His Ile Lys Arg Leu Leu
420 425 430
Asn Asp Pro Gln Leu Ile Leu Met Glu Ala
435 440
<210> 73
<211> 470
<212> PRT
<213> 枯草芽孢杆菌
<400> 73
Met Val Val Gly Asp Phe Pro Ile Glu Thr Asp Thr Leu Val Ile Gly
1 5 10 15
Ala Gly Pro Gly Gly Tyr Val Ala Ala Ile Arg Ala Ala Gln Leu Gly
20 25 30
Gln Lys Val Thr Val Val Glu Lys Ala Thr Leu Gly Gly Val Cys Leu
35 40 45
Asn Val Gly Cys Ile Pro Ser Lys Ala Leu Ile Asn Ala Gly His Arg
50 55 60
Tyr Glu Asn Ala Lys His Ser Asp Asp Met Gly Ile Thr Ala Glu Asn
65 70 75 80
Val Thr Val Asp Phe Thr Lys Val Gln Glu Trp Lys Ala Ser Val Val
85 90 95
Asn Lys Leu Thr Gly Gly Val Ala Gly Leu Leu Lys Gly Asn Lys Val
100 105 110
Asp Val Val Lys Gly Glu Ala Tyr Phe Val Asp Ser Asn Ser Val Arg
115 120 125
Val Met Asp Glu Asn Ser Ala Gln Thr Tyr Thr Phe Lys Asn Ala Ile
130 135 140
Ile Ala Thr Gly Ser Arg Pro Ile Glu Leu Pro Asn Phe Lys Tyr Ser
145 150 155 160
Glu Arg Val Leu Asn Ser Thr Gly Ala Leu Ala Leu Lys Glu Ile Pro
165 170 175
Lys Lys Leu Val Val Ile Gly Gly Gly Tyr Ile Gly Thr Glu Leu Gly
180 185 190
Thr Ala Tyr Ala Asn Phe Gly Thr Glu Leu Val Ile Leu Glu Gly Gly
195 200 205
Asp Glu Ile Leu Pro Gly Phe Glu Lys Gln Met Ser Ser Leu Val Thr
210 215 220
Arg Arg Leu Lys Lys Lys Gly Asn Val Glu Ile His Thr Asn Ala Met
225 230 235 240
Ala Lys Gly Val Glu Glu Arg Pro Asp Gly Val Thr Val Thr Phe Glu
245 250 255
Val Lys Gly Glu Glu Lys Thr Val Asp Ala Asp Tyr Val Leu Ile Thr
260 265 270
Val Gly Arg Arg Pro Asn Thr Asp Glu Leu Gly Leu Glu Gln Val Gly
275 280 285
Ile Glu Met Thr Asp Arg Gly Ile Val Lys Thr Asp Lys Gln Cys Arg
290 295 300
Thr Asn Val Pro Asn Ile Tyr Ala Ile Gly Asp Ile Ile Glu Gly Pro
305 310 315 320
Pro Leu Ala His Lys Ala Ser Tyr Glu Gly Lys Ile Ala Ala Glu Ala
325 330 335
Ile Ala Gly Glu Pro Ala Glu Ile Asp Tyr Leu Gly Ile Pro Ala Val
340 345 350
Val Phe Ser Glu Pro Glu Leu Ala Ser Val Gly Tyr Thr Glu Ala Gln
355 360 365
Ala Lys Glu Glu Gly Leu Asp Ile Val Ala Ala Lys Phe Pro Phe Ala
370 375 380
Ala Asn Gly Arg Ala Leu Ser Leu Asn Glu Thr Asp Gly Phe Met Lys
385 390 395 400
Leu Ile Thr Arg Lys Glu Asp Gly Leu Val Ile Gly Ala Gln Ile Ala
405 410 415
Gly Ala Ser Ala Ser Asp Met Ile Ser Glu Leu Ser Leu Ala Ile Glu
420 425 430
Gly Gly Met Thr Ala Glu Asp Ile Ala Met Thr Ile His Ala His Pro
435 440 445
Thr Leu Gly Glu Ile Thr Met Glu Ala Ala Glu Val Ala Ile Gly Ser
450 455 460
Pro Ile His Ile Val Lys
465 470
<210> 74
<211> 2123
<212> PRT
<213> 酿酒酵母
<400> 74
Met Arg Ser Ile Arg Lys Trp Ala Tyr Glu Thr Phe Asn Asp Glu Lys
1 5 10 15
Ile Ile Gln Phe Val Val Met Ala Thr Pro Asp Asp Leu His Ala Asn
20 25 30
Ser Glu Tyr Ile Arg Met Ala Asp Gln Tyr Val Gln Val Pro Gly Gly
35 40 45
Thr Asn Asn Asn Asn Tyr Ala Asn Ile Asp Leu Ile Leu Asp Val Ala
50 55 60
Glu Gln Thr Asp Val Asp Ala Val Trp Ala Gly Trp Gly His Ala Ser
65 70 75 80
Glu Asn Pro Cys Leu Pro Glu Leu Leu Ala Ser Ser Gln Arg Lys Ile
85 90 95
Leu Phe Ile Gly Pro Pro Gly Arg Ala Met Arg Ser Leu Gly Asp Lys
100 105 110
Ile Ser Ser Thr Ile Val Ala Gln Ser Ala Lys Ile Pro Cys Ile Pro
115 120 125
Trp Ser Gly Ser His Ile Asp Thr Ile His Ile Asp Asn Lys Thr Asn
130 135 140
Phe Val Ser Val Pro Asp Asp Val Tyr Val Arg Gly Cys Cys Ser Ser
145 150 155 160
Pro Glu Asp Ala Leu Glu Lys Ala Lys Leu Ile Gly Phe Pro Val Met
165 170 175
Ile Lys Ala Ser Glu Gly Gly Gly Gly Lys Gly Ile Arg Arg Val Asp
180 185 190
Asn Glu Asp Asp Phe Ile Ala Leu Tyr Arg Gln Ala Val Asn Glu Thr
195 200 205
Pro Gly Ser Pro Met Phe Val Met Lys Val Val Thr Asp Ala Arg His
210 215 220
Leu Glu Val Gln Leu Leu Ala Asp Gln Tyr Gly Thr Asn Ile Thr Leu
225 230 235 240
Phe Gly Arg Asp Cys Ser Ile Gln Arg Arg His Gln Lys Ile Ile Glu
245 250 255
Glu Ala Pro Val Thr Ile Thr Lys Pro Glu Thr Phe Gln Arg Met Glu
260 265 270
Arg Ala Ala Ile Arg Leu Gly Glu Leu Val Gly Tyr Val Ser Ala Gly
275 280 285
Thr Val Glu Tyr Leu Tyr Ser Pro Lys Asp Asp Lys Phe Tyr Phe Leu
290 295 300
Glu Leu Asn Pro Arg Leu Gln Val Glu His Pro Thr Thr Glu Met Ile
305 310 315 320
Ser Gly Val Asn Leu Pro Ala Thr Gln Leu Gln Ile Ala Met Gly Ile
325 330 335
Pro Met His Met Ile Ser Asp Ile Arg Lys Leu Tyr Gly Leu Asp Pro
340 345 350
Thr Gly Thr Ser Tyr Ile Asp Phe Lys Asn Leu Lys Arg Pro Ser Pro
355 360 365
Lys Gly His Cys Ile Ser Cys Arg Ile Thr Ser Glu Asp Pro Asn Glu
370 375 380
Gly Phe Lys Pro Ser Thr Gly Lys Ile His Glu Leu Asn Phe Arg Ser
385 390 395 400
Ser Ser Asn Val Trp Gly Tyr Phe Ser Val Gly Asn Asn Gly Ala Ile
405 410 415
His Ser Phe Ser Asp Ser Gln Phe Gly His Ile Phe Ala Val Gly Asn
420 425 430
Asp Arg Gln Asp Ala Lys Gln Asn Met Val Leu Ala Leu Lys Asp Phe
435 440 445
Ser Ile Arg Gly Glu Phe Lys Thr Pro Ile Glu Tyr Leu Ile Glu Leu
450 455 460
Leu Glu Thr Arg Asp Phe Glu Ser Asn Asn Ile Ser Thr Gly Trp Leu
465 470 475 480
Asp Asp Leu Ile Leu Lys Asn Leu Ser Ser Asp Ser Lys Leu Asp Pro
485 490 495
Thr Leu Ala Ile Ile Cys Gly Ala Ala Met Lys Ala Tyr Val Phe Thr
500 505 510
Glu Lys Val Arg Asn Lys Tyr Leu Glu Leu Leu Arg Arg Gly Gln Val
515 520 525
Pro Pro Lys Asp Phe Leu Lys Thr Lys Phe Pro Val Asp Phe Ile Phe
530 535 540
Asp Asn Asn Arg Tyr Leu Phe Asn Val Ala Gln Ser Ser Glu Glu Gln
545 550 555 560
Phe Ile Leu Ser Ile Asn Lys Ser Gln Cys Glu Val Asn Val Gln Lys
565 570 575
Leu Ser Ser Asp Cys Leu Leu Ile Ser Val Asp Gly Lys Cys His Thr
580 585 590
Val Tyr Trp Lys Asp Asp Ile Arg Gly Thr Arg Leu Ser Ile Asp Ser
595 600 605
Asn Thr Ile Phe Leu Glu Ala Glu Leu Asn Pro Thr Gln Val Ile Ser
610 615 620
Pro Thr Pro Gly Lys Leu Val Lys Tyr Leu Val Arg Ser Gly Asp His
625 630 635 640
Val Phe Ala Gly Gln Gln Tyr Ala Glu Ile Glu Ile Met Lys Met Gln
645 650 655
Met Pro Leu Val Ala Lys Ser Asp Gly Val Ile Glu Leu Leu Arg Gln
660 665 670
Pro Gly Ser Ile Ile Glu Ala Gly Asp Val Ile Ala Lys Leu Thr Leu
675 680 685
Asp Ser Pro Ser Lys Ala Asn Glu Ser Ser Leu Tyr Arg Gly Glu Leu
690 695 700
Pro Val Leu Gly Pro Pro Leu Ile Glu Gly Ser Arg Pro Asn His Lys
705 710 715 720
Leu Arg Val Leu Ile Asn Arg Leu Glu Asn Ile Leu Asn Gly Tyr His
725 730 735
Glu Asn Ser Gly Ile Glu Thr Thr Leu Lys Glu Leu Ile Lys Ile Leu
740 745 750
Arg Asp Gly Arg Leu Pro Tyr Ser Glu Trp Asp Ser Gln Ile Ser Thr
755 760 765
Val Arg Asn Arg Leu Pro Arg Gln Leu Asn Glu Gly Leu Gly Asn Leu
770 775 780
Val Lys Lys Ser Val Ser Phe Pro Ala Lys Glu Leu His Lys Leu Met
785 790 795 800
Lys Arg Tyr Leu Glu Glu Asn Thr Asn Asp His Val Val Tyr Val Ala
805 810 815
Leu Gln Pro Leu Leu Lys Ile Ser Glu Arg Tyr Ser Glu Gly Leu Ala
820 825 830
Asn His Glu Cys Glu Ile Phe Leu Lys Leu Ile Lys Lys Tyr Tyr Ala
835 840 845
Val Glu Lys Ile Phe Glu Asn His Asp Ile His Glu Glu Arg Asn Leu
850 855 860
Leu Asn Leu Arg Arg Lys Asp Leu Thr Asn Leu Lys Lys Ile Leu Cys
865 870 875 880
Ile Ser Leu Ser His Ala Asn Val Val Ala Lys Asn Lys Leu Val Thr
885 890 895
Ala Ile Leu His Glu Tyr Glu Pro Leu Cys Gln Asp Ser Ser Lys Met
900 905 910
Ser Leu Lys Phe Arg Ala Val Ile His Asp Leu Ala Ser Leu Glu Ser
915 920 925
Lys Trp Ala Lys Glu Val Ala Val Lys Ala Arg Ser Val Leu Leu Arg
930 935 940
Gly Ile Phe Pro Pro Ile Lys Lys Arg Lys Glu His Ile Lys Thr Leu
945 950 955 960
Leu Gln Leu His Ile Lys Asp Thr Gly Ala Glu Asn Ile His Ser Arg
965 970 975
Asn Ile Tyr Ser Cys Met Arg Asp Phe Gly Asn Leu Ile His Ser Asn
980 985 990
Leu Ile Gln Leu Gln Asp Leu Phe Phe Phe Phe Gly His Gln Asp Thr
995 1000 1005
Ala Leu Ser Ser Ile Ala Ser Glu Ile Tyr Ala Arg Tyr Ala Tyr
1010 1015 1020
Gly Asn Tyr Gln Leu Lys Ser Ile Lys Ile His Lys Gly Ala Pro
1025 1030 1035
Asp Leu Leu Met Ser Trp Gln Phe Ser Ser Leu Arg Asn Tyr Leu
1040 1045 1050
Val Asn Ser Asp Gly Glu Ser Asp Glu Phe Thr Lys Leu Ser Lys
1055 1060 1065
Pro Pro Ser Thr Ser Gly Lys Ser Ser Ala Asn Ser Phe Gly Leu
1070 1075 1080
Leu Val Asn Met Arg Ala Leu Glu Ser Leu Glu Lys Thr Leu Asp
1085 1090 1095
Glu Val Tyr Glu Gln Ile His Ile Pro Glu Glu Arg Leu Ser Ser
1100 1105 1110
Gly Glu Asn Ser Leu Ile Val Asn Ile Leu Ser Pro Ile Arg Tyr
1115 1120 1125
Arg Ser Glu Asn Asp Leu Ile Lys Thr Leu Lys Ile Lys Leu His
1130 1135 1140
Glu Asn Glu Arg Gly Leu Ser Lys Leu Lys Val Asn Arg Ile Thr
1145 1150 1155
Phe Ala Phe Ile Ala Ala Asn Ala Pro Ala Val Lys Phe Tyr Ser
1160 1165 1170
Phe Asp Gly Thr Thr Tyr Asp Glu Ile Ser Gln Ile Arg Asn Met
1175 1180 1185
Asp Pro Ser Tyr Glu Ala Pro Leu Glu Leu Gly Lys Met Ser Asn
1190 1195 1200
Tyr Lys Ile Arg Ser Leu Pro Thr Tyr Asp Ser Ser Ile Arg Ile
1205 1210 1215
Phe Glu Gly Ile Ser Lys Phe Thr Pro Leu Asp Lys Arg Phe Phe
1220 1225 1230
Val Arg Lys Ile Ile Asn Ser Phe Met Tyr Asn Asp Gln Lys Thr
1235 1240 1245
Thr Glu Glu Asn Leu Lys Ala Glu Ile Asn Ala Gln Val Val Tyr
1250 1255 1260
Met Leu Glu His Leu Gly Ala Val Asp Ile Ser Asn Ser Asp Leu
1265 1270 1275
Asn His Ile Phe Leu Ser Phe Asn Thr Val Leu Asn Ile Pro Val
1280 1285 1290
His Arg Leu Glu Glu Ile Val Ser Thr Ile Leu Lys Thr His Glu
1295 1300 1305
Thr Arg Leu Phe Gln Glu Arg Ile Thr Asp Val Glu Ile Cys Ile
1310 1315 1320
Ser Val Glu Cys Leu Glu Thr Lys Lys Pro Ala Pro Leu Arg Leu
1325 1330 1335
Leu Ile Ser Asn Lys Ser Gly Tyr Val Val Lys Ile Glu Thr Tyr
1340 1345 1350
Tyr Glu Lys Ile Gly Lys Asn Gly Asn Leu Ile Leu Glu Pro Cys
1355 1360 1365
Ser Glu Gln Ser His Tyr Ser Gln Lys Ser Leu Ser Leu Pro Tyr
1370 1375 1380
Ser Val Lys Asp Trp Leu Gln Pro Lys Arg Tyr Lys Ala Gln Phe
1385 1390 1395
Met Gly Thr Thr Tyr Val Tyr Asp Phe Pro Gly Leu Phe His Gln
1400 1405 1410
Ala Ala Ile Gln Gln Trp Lys Arg Tyr Phe Pro Lys His Lys Leu
1415 1420 1425
Asn Asp Ser Phe Phe Ser Trp Val Glu Leu Ile Glu Gln Asn Gly
1430 1435 1440
Asn Leu Ile Lys Val Asn Arg Glu Pro Gly Leu Asn Asn Ile Gly
1445 1450 1455
Met Val Ala Phe Glu Ile Met Val Gln Thr Pro Glu Tyr Pro Glu
1460 1465 1470
Gly Arg Asn Met Ile Val Ile Ser Asn Asp Ile Thr Tyr Asn Ile
1475 1480 1485
Gly Ser Phe Gly Pro Arg Glu Asp Leu Phe Phe Asp Arg Val Thr
1490 1495 1500
Asn Tyr Ala Arg Glu Arg Gly Ile Pro Arg Ile Tyr Leu Ala Ala
1505 1510 1515
Asn Ser Gly Ala Lys Leu Gly Ile Ala Glu Glu Leu Ile Pro Leu
1520 1525 1530
Phe Arg Val Ala Trp Asn Asp Pro Ser Asp Pro Thr Lys Gly Phe
1535 1540 1545
Gln Tyr Leu Tyr Leu Ala Pro Lys Asp Met Gln Leu Leu Lys Asp
1550 1555 1560
Ser Gly Lys Gly Asn Ser Val Val Val Glu His Lys Met Val Tyr
1565 1570 1575
Gly Glu Glu Arg Tyr Ile Ile Lys Ala Ile Val Gly Phe Glu Glu
1580 1585 1590
Gly Leu Gly Val Glu Cys Leu Gln Gly Ser Gly Leu Ile Ala Gly
1595 1600 1605
Ala Thr Ser Lys Ala Tyr Arg Asp Ile Phe Thr Ile Thr Ala Val
1610 1615 1620
Thr Cys Arg Ser Val Gly Ile Gly Ser Tyr Leu Val Arg Leu Gly
1625 1630 1635
Gln Arg Thr Ile Gln Val Glu Asp Lys Pro Ile Ile Leu Thr Gly
1640 1645 1650
Ala Ser Ala Ile Asn Lys Val Leu Gly Thr Asp Ile Tyr Thr Ser
1655 1660 1665
Asn Leu Gln Ile Gly Gly Thr Gln Ile Met Tyr Lys Asn Gly Ile
1670 1675 1680
Ala His Leu Thr Ala Ser Asn Asp Met Lys Ala Ile Glu Lys Ile
1685 1690 1695
Met Thr Trp Leu Ser Tyr Val Pro Ala Lys Arg Asp Met Ser Pro
1700 1705 1710
Pro Leu Leu Glu Thr Met Asp Arg Trp Asp Arg Asp Val Asp Phe
1715 1720 1725
Lys Pro Ala Lys Gln Val Pro Tyr Glu Ala Arg Trp Leu Ile Glu
1730 1735 1740
Gly Lys Trp Asp Ser Asn Asn Asn Phe Gln Ser Gly Leu Phe Asp
1745 1750 1755
Lys Asp Ser Phe Phe Glu Thr Leu Ser Gly Trp Ala Lys Gly Val
1760 1765 1770
Ile Val Gly Arg Ala Arg Leu Gly Gly Ile Pro Val Gly Val Ile
1775 1780 1785
Ala Val Glu Thr Lys Thr Ile Glu Glu Ile Ile Pro Ala Asp Pro
1790 1795 1800
Ala Asn Leu Asp Ser Ser Glu Phe Ser Val Lys Glu Ala Gly Gln
1805 1810 1815
Val Trp Tyr Pro Asn Ser Ala Phe Lys Thr Ala Gln Thr Ile Asn
1820 1825 1830
Asp Phe Asn Tyr Gly Glu Gln Leu Pro Leu Ile Ile Leu Ala Asn
1835 1840 1845
Trp Arg Gly Phe Ser Gly Gly Gln Arg Asp Met Tyr Asn Glu Val
1850 1855 1860
Leu Lys Tyr Gly Ser Phe Ile Val Asp Ala Leu Val Asp Tyr Lys
1865 1870 1875
Gln Pro Ile Leu Ile Tyr Ile Pro Pro Phe Gly Glu Leu Arg Gly
1880 1885 1890
Gly Ser Trp Val Val Ile Asp Pro Thr Ile Asn Pro Glu Gln Met
1895 1900 1905
Glu Met Tyr Ala Asp Val Glu Ser Arg Gly Gly Val Leu Glu Pro
1910 1915 1920
Asp Gly Val Val Ser Ile Lys Tyr Arg Lys Glu Lys Met Ile Glu
1925 1930 1935
Thr Met Ile Arg Leu Asp Ser Thr Tyr Gly His Leu Arg Arg Thr
1940 1945 1950
Leu Thr Glu Lys Lys Leu Ser Leu Glu Lys Gln Asn Asp Leu Thr
1955 1960 1965
Lys Arg Leu Lys Ile Arg Glu Arg Gln Leu Ile Pro Ile Tyr Asn
1970 1975 1980
Gln Ile Ser Ile Gln Phe Ala Asp Leu His Asp Arg Ser Thr Arg
1985 1990 1995
Met Leu Val Lys Gly Val Ile Arg Asn Glu Leu Glu Trp Lys Lys
2000 2005 2010
Ser Arg Arg Phe Leu Tyr Trp Arg Leu Arg Arg Arg Leu Asn Glu
2015 2020 2025
Gly Gln Val Ile Lys Arg Leu Gln Lys Lys Thr Cys Asp Asn Lys
2030 2035 2040
Thr Lys Met Lys Tyr Asp Asp Leu Leu Lys Ile Val Gln Ser Trp
2045 2050 2055
Tyr Asn Asp Leu Asp Val Asn Asp Asp Arg Ala Val Val Glu Phe
2060 2065 2070
Ile Glu Arg Asn Ser Lys Lys Ile Asp Lys Asn Ile Glu Glu Phe
2075 2080 2085
Glu Ile Ser Leu Leu Ile Asp Glu Leu Lys Lys Lys Phe Glu Asp
2090 2095 2100
Arg Arg Gly Asn Ile Val Leu Glu Glu Leu Thr Arg Leu Val Asp
2105 2110 2115
Ser Lys Arg Lys Arg
2120
<210> 75
<211> 319
<212> PRT
<213> 大肠杆菌
<400> 75
Met Ser Leu Asn Phe Leu Asp Phe Glu Gln Pro Ile Ala Glu Leu Glu
1 5 10 15
Ala Lys Ile Asp Ser Leu Thr Ala Val Ser Arg Gln Asp Glu Lys Leu
20 25 30
Asp Ile Asn Ile Asp Glu Glu Val His Arg Leu Arg Glu Lys Ser Val
35 40 45
Glu Leu Thr Arg Lys Ile Phe Ala Asp Leu Gly Ala Trp Gln Ile Ala
50 55 60
Gln Leu Ala Arg His Pro Gln Arg Pro Tyr Thr Leu Asp Tyr Val Arg
65 70 75 80
Leu Ala Phe Asp Glu Phe Asp Glu Leu Ala Gly Asp Arg Ala Tyr Ala
85 90 95
Asp Asp Lys Ala Ile Val Gly Gly Ile Ala Arg Leu Asp Gly Arg Pro
100 105 110
Val Met Ile Ile Gly His Gln Lys Gly Arg Glu Thr Lys Glu Lys Ile
115 120 125
Arg Arg Asn Phe Gly Met Pro Ala Pro Glu Gly Tyr Arg Lys Ala Leu
130 135 140
Arg Leu Met Gln Met Ala Glu Arg Phe Lys Met Pro Ile Ile Thr Phe
145 150 155 160
Ile Asp Thr Pro Gly Ala Tyr Pro Gly Val Gly Ala Glu Glu Arg Gly
165 170 175
Gln Ser Glu Ala Ile Ala Arg Asn Leu Arg Glu Met Ser Arg Leu Gly
180 185 190
Val Pro Val Val Cys Thr Val Ile Gly Glu Gly Gly Ser Gly Gly Ala
195 200 205
Leu Ala Ile Gly Val Gly Asp Lys Val Asn Met Leu Gln Tyr Ser Thr
210 215 220
Tyr Ser Val Ile Ser Pro Glu Gly Cys Ala Ser Ile Leu Trp Lys Ser
225 230 235 240
Ala Asp Lys Ala Pro Leu Ala Ala Glu Ala Met Gly Ile Ile Ala Pro
245 250 255
Arg Leu Lys Glu Leu Lys Leu Ile Asp Ser Ile Ile Pro Glu Pro Leu
260 265 270
Gly Gly Ala His Arg Asn Pro Glu Ala Met Ala Ala Ser Leu Lys Ala
275 280 285
Gln Leu Leu Ala Asp Leu Ala Asp Leu Asp Val Leu Ser Thr Glu Asp
290 295 300
Leu Lys Asn Arg Arg Tyr Gln Arg Leu Met Ser Tyr Gly Tyr Ala
305 310 315
<210> 76
<211> 156
<212> PRT
<213> 大肠杆菌
<400> 76
Met Asp Ile Arg Lys Ile Lys Lys Leu Ile Glu Leu Val Glu Glu Ser
1 5 10 15
Gly Ile Ser Glu Leu Glu Ile Ser Glu Gly Glu Glu Ser Val Arg Ile
20 25 30
Ser Arg Ala Ala Pro Ala Ala Ser Phe Pro Val Met Gln Gln Ala Tyr
35 40 45
Ala Ala Pro Met Met Gln Gln Pro Ala Gln Ser Asn Ala Ala Ala Pro
50 55 60
Ala Thr Val Pro Ser Met Glu Ala Pro Ala Ala Ala Glu Ile Ser Gly
65 70 75 80
His Ile Val Arg Ser Pro Met Val Gly Thr Phe Tyr Arg Thr Pro Ser
85 90 95
Pro Asp Ala Lys Ala Phe Ile Glu Val Gly Gln Lys Val Asn Val Gly
100 105 110
Asp Thr Leu Cys Ile Val Glu Ala Met Lys Met Met Asn Gln Ile Glu
115 120 125
Ala Asp Lys Ser Gly Thr Val Lys Ala Ile Leu Val Glu Ser Gly Gln
130 135 140
Pro Val Glu Phe Asp Glu Pro Leu Val Val Ile Glu
145 150 155
<210> 77
<211> 449
<212> PRT
<213> 大肠杆菌
<400> 77
Met Leu Asp Lys Ile Val Ile Ala Asn Arg Gly Glu Ile Ala Leu Arg
1 5 10 15
Ile Leu Arg Ala Cys Lys Glu Leu Gly Ile Lys Thr Val Ala Val His
20 25 30
Ser Ser Ala Asp Arg Asp Leu Lys His Val Leu Leu Ala Asp Glu Thr
35 40 45
Val Cys Ile Gly Pro Ala Pro Ser Val Lys Ser Tyr Leu Asn Ile Pro
50 55 60
Ala Ile Ile Ser Ala Ala Glu Ile Thr Gly Ala Val Ala Ile His Pro
65 70 75 80
Gly Tyr Gly Phe Leu Ser Glu Asn Ala Asn Phe Ala Glu Gln Val Glu
85 90 95
Arg Ser Gly Phe Ile Phe Ile Gly Pro Lys Ala Glu Thr Ile Arg Leu
100 105 110
Met Gly Asp Lys Val Ser Ala Ile Ala Ala Met Lys Lys Ala Gly Val
115 120 125
Pro Cys Val Pro Gly Ser Asp Gly Pro Leu Gly Asp Asp Met Asp Lys
130 135 140
Asn Arg Ala Ile Ala Lys Arg Ile Gly Tyr Pro Val Ile Ile Lys Ala
145 150 155 160
Ser Gly Gly Gly Gly Gly Arg Gly Met Arg Val Val Arg Gly Asp Ala
165 170 175
Glu Leu Ala Gln Ser Ile Ser Met Thr Arg Ala Glu Ala Lys Ala Ala
180 185 190
Phe Ser Asn Asp Met Val Tyr Met Glu Lys Tyr Leu Glu Asn Pro Arg
195 200 205
His Val Glu Ile Gln Val Leu Ala Asp Gly Gln Gly Asn Ala Ile Tyr
210 215 220
Leu Ala Glu Arg Asp Cys Ser Met Gln Arg Arg His Gln Lys Val Val
225 230 235 240
Glu Glu Ala Pro Ala Pro Gly Ile Thr Pro Glu Leu Arg Arg Tyr Ile
245 250 255
Gly Glu Arg Cys Ala Lys Ala Cys Val Asp Ile Gly Tyr Arg Gly Ala
260 265 270
Gly Thr Phe Glu Phe Leu Phe Glu Asn Gly Glu Phe Tyr Phe Ile Glu
275 280 285
Met Asn Thr Arg Ile Gln Val Glu His Pro Val Thr Glu Met Ile Thr
290 295 300
Gly Val Asp Leu Ile Lys Glu Gln Leu Arg Ile Ala Ala Gly Gln Pro
305 310 315 320
Leu Ser Ile Lys Gln Glu Glu Val His Val Arg Gly His Ala Val Glu
325 330 335
Cys Arg Ile Asn Ala Glu Asp Pro Asn Thr Phe Leu Pro Ser Pro Gly
340 345 350
Lys Ile Thr Arg Phe His Ala Pro Gly Gly Phe Gly Val Arg Trp Glu
355 360 365
Ser His Ile Tyr Ala Gly Tyr Thr Val Pro Pro Tyr Tyr Asp Ser Met
370 375 380
Ile Gly Lys Leu Ile Cys Tyr Gly Glu Asn Arg Asp Val Ala Ile Ala
385 390 395 400
Arg Met Lys Asn Ala Leu Gln Glu Leu Ile Ile Asp Gly Ile Lys Thr
405 410 415
Asn Val Asp Leu Gln Ile Arg Ile Met Asn Asp Glu Asn Phe Gln His
420 425 430
Gly Gly Thr Asn Ile His Tyr Leu Glu Lys Lys Leu Gly Leu Gln Glu
435 440 445
Lys
<210> 78
<211> 304
<212> PRT
<213> 大肠杆菌
<400> 78
Met Ser Trp Ile Glu Arg Ile Lys Ser Asn Ile Thr Pro Thr Arg Lys
1 5 10 15
Ala Ser Ile Pro Glu Gly Val Trp Thr Lys Cys Asp Ser Cys Gly Gln
20 25 30
Val Leu Tyr Arg Ala Glu Leu Glu Arg Asn Leu Glu Val Cys Pro Lys
35 40 45
Cys Asp His His Met Arg Met Thr Ala Arg Asn Arg Leu His Ser Leu
50 55 60
Leu Asp Glu Gly Ser Leu Val Glu Leu Gly Ser Glu Leu Glu Pro Lys
65 70 75 80
Asp Val Leu Lys Phe Arg Asp Ser Lys Lys Tyr Lys Asp Arg Leu Ala
85 90 95
Ser Ala Gln Lys Glu Thr Gly Glu Lys Asp Ala Leu Val Val Met Lys
100 105 110
Gly Thr Leu Tyr Gly Met Pro Val Val Ala Ala Ala Phe Glu Phe Ala
115 120 125
Phe Met Gly Gly Ser Met Gly Ser Val Val Gly Ala Arg Phe Val Arg
130 135 140
Ala Val Glu Gln Ala Leu Glu Asp Asn Cys Pro Leu Ile Cys Phe Ser
145 150 155 160
Ala Ser Gly Gly Ala Arg Met Gln Glu Ala Leu Met Ser Leu Met Gln
165 170 175
Met Ala Lys Thr Ser Ala Ala Leu Ala Lys Met Gln Glu Arg Gly Leu
180 185 190
Pro Tyr Ile Ser Val Leu Thr Asp Pro Thr Met Gly Gly Val Ser Ala
195 200 205
Ser Phe Ala Met Leu Gly Asp Leu Asn Ile Ala Glu Pro Lys Ala Leu
210 215 220
Ile Gly Phe Ala Gly Pro Arg Val Ile Glu Gln Thr Val Arg Glu Lys
225 230 235 240
Leu Pro Pro Gly Phe Gln Arg Ser Glu Phe Leu Ile Glu Lys Gly Ala
245 250 255
Ile Asp Met Ile Val Arg Arg Pro Glu Met Arg Leu Lys Leu Ala Ser
260 265 270
Ile Leu Ala Lys Leu Met Asn Leu Pro Ala Pro Asn Pro Glu Ala Pro
275 280 285
Arg Glu Gly Val Val Val Pro Pro Val Pro Asp Gln Glu Pro Glu Ala
290 295 300
<210> 79
<211> 282
<212> PRT
<213> 橙色绿屈挠菌
<400> 79
Met Glu Glu Thr Ala Ile Pro Gln Ser Leu Thr Pro Trp Asp Arg Val
1 5 10 15
Gln Leu Ala Arg His Pro Gln Arg Pro His Thr Leu Asp Tyr Ile Ala
20 25 30
Ala Leu Cys Glu Asp Phe Val Glu Leu His Gly Asp Arg Arg Phe Gly
35 40 45
Asp Asp Pro Ala Met Val Gly Gly Met Ala Thr Phe Ala Gly Gln Thr
50 55 60
Val Met Val Ile Gly His Gln Lys Gly Asn Asp Thr Arg Glu Asn Met
65 70 75 80
Arg Arg Asn Phe Gly Met Pro His Pro Glu Gly Tyr Arg Lys Ala Gln
85 90 95
Arg Leu Met Arg His Ala Glu Lys Phe Gly Leu Pro Val Ile Cys Phe
100 105 110
Val Asp Thr Pro Ala Ala Asp Pro Thr Lys Ser Ser Glu Glu Arg Gly
115 120 125
Gln Ala Asn Ala Ile Ala Glu Ser Ile Met Leu Met Thr Thr Leu Arg
130 135 140
Val Pro Ser Ile Ala Val Val Ile Gly Glu Gly Gly Ser Gly Gly Ala
145 150 155 160
Leu Ala Ile Ser Val Ala Asp Arg Ile Leu Met Gln Glu Asn Ala Ile
165 170 175
Tyr Ser Val Ala Pro Pro Glu Ala Ala Ala Ser Ile Leu Trp Arg Asp
180 185 190
Ala Ala Lys Ala Pro Glu Ala Ala Arg Ala Leu Lys Leu Thr Ala Ala
195 200 205
Asp Leu Tyr Asp Leu Arg Ile Ile Asp Glu Val Ile Pro Glu Pro Pro
210 215 220
Gly Gly Ala His Ala Asp Arg Leu Thr Ala Ile Thr Thr Val Gly Glu
225 230 235 240
Arg Leu Arg Val His Leu Ala Asp Leu Gln Gln Arg Asp Ile Asp Thr
245 250 255
Leu Leu Arg Glu Arg Tyr Arg Lys Tyr Arg Ser Met Gly Gln Tyr Gln
260 265 270
Glu Gln Gln Met Asp Phe Phe Gly Arg Met
275 280
<210> 80
<211> 180
<212> PRT
<213> 橙色绿屈挠菌
<400> 80
Met Met Leu Trp Gly Ala Met Lys Asp Glu Thr Thr Glu Leu Pro Ala
1 5 10 15
Asp Gln Pro Asp Pro Phe Gly Leu Ala Ala Val Arg Val Leu Leu Gln
20 25 30
Met Leu Glu Gln Ser Asp Val Tyr Glu Ile Thr Ile Glu Asn Gly Asn
35 40 45
Ala Lys Leu His Val Lys Arg Gly Gln Pro Gly Gly Val Ile Tyr Ser
50 55 60
Ala Pro Leu Pro Thr Ala Pro Val Pro Ser Pro Ser Leu Pro Ala Thr
65 70 75 80
Pro Val Thr Pro Phe Val Gln Pro Pro Pro Ala Pro Glu Gly Pro Pro
85 90 95
Val Glu Met Pro Ala Gly His Thr Ile Thr Ala Pro Met Val Gly Thr
100 105 110
Phe Tyr Ala Ala Pro Ser Pro Arg Asp Arg Pro Phe Val Gln Glu Gly
115 120 125
Asp Glu Val Arg Val Gly Asp Thr Val Gly Ile Val Glu Ala Met Lys
130 135 140
Met Met Asn Glu Ile Glu Ser Asp Val Ala Gly Arg Val Ala Arg Ile
145 150 155 160
Leu Val Lys Asn Gly Gln Pro Val Glu Tyr Gly Gln Pro Leu Met Val
165 170 175
Ile Glu Pro Leu
180
<210> 81
<211> 455
<212> PRT
<213> 橙色绿屈挠菌
<400> 81
Met Ile Arg Lys Val Leu Val Ala Asn Arg Gly Glu Ile Ala Val Arg
1 5 10 15
Ile Ile Arg Ala Cys Gln Glu Leu Gly Ile Arg Thr Val Val Ala Tyr
20 25 30
Ser Thr Ala Asp Arg Asp Ser Leu Ala Val Arg Leu Ala Asp Glu Ala
35 40 45
Val Cys Ile Gly Pro Pro Pro Ala Ala Lys Ser Tyr Leu Asn Ala Pro
50 55 60
Ala Leu Ile Ser Ala Ala Leu Val Ser Gly Cys Asp Ala Ile His Pro
65 70 75 80
Gly Tyr Gly Phe Leu Ser Glu Asn Pro Tyr Phe Ala Glu Met Cys Ala
85 90 95
Asp Cys Lys Leu Thr Phe Ile Gly Pro Pro Pro Glu Pro Ile Arg Leu
100 105 110
Met Gly Asp Lys Ala Ile Gly Arg Glu Thr Met Arg Lys Ala Gly Val
115 120 125
Pro Thr Val Pro Gly Ser Asp Gly Glu Val Arg Ser Leu Glu Glu Ala
130 135 140
Ile Asp Val Ala Arg Gln Ile Gly Tyr Pro Val Leu Leu Lys Pro Ser
145 150 155 160
Gly Gly Gly Gly Gly Arg Gly Met Arg Val Ala Tyr Asp Glu Ala Asp
165 170 175
Leu Gln Arg Ala Phe Pro Thr Ala Arg Ala Glu Ala Glu Ala Ala Phe
180 185 190
Gly Asn Gly Ala Leu Leu Leu Glu Lys Tyr Leu Thr Arg Val Arg His
195 200 205
Val Glu Ile Gln Val Leu Ala Asp Gln Tyr Gly His Ala Ile His Leu
210 215 220
Gly Glu Arg Asp Cys Ser Ala Gln Arg Arg His Gln Lys Ile Val Glu
225 230 235 240
Glu Ala Pro Ser Pro Ala Val Thr Pro Glu Leu Arg Glu Arg Met Gly
245 250 255
Ala Asp Ala Val Arg Gly Ile Lys Ser Ile Gly Tyr Val Asn Ala Gly
260 265 270
Thr Leu Glu Phe Leu Leu Asp Gln Asp Gly Asn Tyr Tyr Phe Ile Glu
275 280 285
Met Asn Thr Arg Ile Gln Val Glu His Pro Val Thr Glu Gln Val Thr
290 295 300
Gly Ile Asp Leu Val Arg Trp Gln Leu Leu Ile Ala Ser Gly Glu Arg
305 310 315 320
Leu Thr Leu Arg Gln Glu Asp Ile Lys Ile Thr Arg His Ala Ile Glu
325 330 335
Cys Arg Ile Asn Ala Glu Asp Pro Glu Arg Asp Phe Leu Pro Ala Ser
340 345 350
Gly Glu Val Glu Phe Tyr Leu Pro Pro Gly Gly Pro Gly Val Arg Val
355 360 365
Asp Ser His Leu Tyr Ser Gly Tyr Thr Pro Pro Gly Thr Tyr Asp Ser
370 375 380
Leu Leu Ala Lys Ile Ile Thr Phe Gly Asp Thr Arg Asp Glu Ala Leu
385 390 395 400
Asn Arg Met Arg Arg Ala Leu Asn Glu Cys Val Ile Thr Gly Ile Lys
405 410 415
Thr Thr Ile Pro Phe Gln Leu Ala Leu Ile Asp Asp Pro Glu Phe Arg
420 425 430
Ala Gly Arg Ile His Thr Gly Tyr Val Ala Glu Leu Leu Arg Gln Trp
435 440 445
Lys Glu Thr Leu Asn Pro Val
450 455
<210> 82
<211> 305
<212> PRT
<213> 橙色绿屈挠菌
<400> 82
Met Lys Glu Phe Phe Arg Leu Ser Arg Lys Gly Phe Thr Gly Arg Glu
1 5 10 15
Asp Gln Asp Ser Ala Gln Ile Pro Asp Asp Leu Trp Val Lys Cys Ser
20 25 30
Ser Cys Arg Glu Leu Ile Tyr Lys Lys Gln Leu Asn Asp Asn Leu Lys
35 40 45
Val Cys Pro Lys Cys Gly His His Met Arg Leu Ser Ala His Glu Trp
50 55 60
Leu Gly Leu Leu Asp Val Gly Ser Phe Arg Glu Met Asp Ala Asn Leu
65 70 75 80
Leu Pro Thr Asp Pro Leu Gly Phe Val Thr Asp Glu Glu Ser Tyr Ala
85 90 95
Ala Lys Leu Ala Lys Thr Gln Gln Arg Thr Gly Met Ala Asp Ala Val
100 105 110
Ile Ala Gly Ile Gly Ala Ile Ser Asn Met Gln Ile Cys Val Ala Val
115 120 125
Ala Asp Phe Ser Phe Met Gly Ala Ser Met Gly Ser Val Tyr Gly Glu
130 135 140
Lys Met Ala Arg Ser Ala Glu Arg Ala Ala Glu Leu Gly Val Pro Leu
145 150 155 160
Leu Thr Ile Asn Thr Ser Gly Gly Ala Arg Gln Gln Glu Gly Val Ile
165 170 175
Gly Leu Met Gln Met Ala Lys Val Thr Met Ala Leu Thr Arg Leu Ala
180 185 190
Asp Ala Gly Gln Pro His Ile Ala Leu Leu Val Asp Pro Cys Tyr Gly
195 200 205
Gly Val Thr Ala Ser Tyr Pro Ser Val Ala Asp Ile Ile Ile Ala Glu
210 215 220
Pro Gly Ala Asn Ile Gly Phe Ala Gly Lys Arg Leu Ile Glu Gln Ile
225 230 235 240
Met Arg Gln Lys Leu Pro Ala Gly Phe Gln Thr Ala Glu Phe Met Leu
245 250 255
Glu His Gly Met Ile Asp Met Val Val Pro Arg Ser Glu Met Arg Asp
260 265 270
Thr Leu Ala Arg Ile Leu Arg Leu Tyr Arg Gln Arg Ser Thr Ser Pro
275 280 285
Ala Lys Ala Glu Leu Ala Gly Arg Arg Ala Thr Leu Pro Gln Pro Ile
290 295 300
Met
305
<210> 83
<211> 378
<212> PRT
<213> 枯草芽孢杆菌
<400> 83
Met Ile Ile Gly Val Pro Lys Glu Ile Lys Asn Asn Glu Asn Arg Val
1 5 10 15
Ala Leu Thr Pro Gly Gly Val Ser Gln Leu Ile Ser Asn Gly His Arg
20 25 30
Val Leu Val Glu Thr Gly Ala Gly Leu Gly Ser Gly Phe Glu Asn Glu
35 40 45
Ala Tyr Glu Ser Ala Gly Ala Glu Ile Ile Ala Asp Pro Lys Gln Val
50 55 60
Trp Asp Ala Glu Met Val Met Lys Val Lys Glu Pro Leu Pro Glu Glu
65 70 75 80
Tyr Val Tyr Phe Arg Lys Gly Leu Val Leu Phe Thr Tyr Leu His Leu
85 90 95
Ala Ala Glu Pro Glu Leu Ala Gln Ala Leu Lys Asp Lys Gly Val Thr
100 105 110
Ala Ile Ala Tyr Glu Thr Val Ser Glu Gly Arg Thr Leu Pro Leu Leu
115 120 125
Thr Pro Met Ser Glu Val Ala Gly Arg Met Ala Ala Gln Ile Gly Ala
130 135 140
Gln Phe Leu Glu Lys Pro Lys Gly Gly Lys Gly Ile Leu Leu Ala Gly
145 150 155 160
Val Pro Gly Val Ser Arg Gly Lys Val Thr Ile Ile Gly Gly Gly Val
165 170 175
Val Gly Thr Asn Ala Ala Lys Met Ala Val Gly Leu Gly Ala Asp Val
180 185 190
Thr Ile Ile Asp Leu Asn Ala Asp Arg Leu Arg Gln Leu Asp Asp Ile
195 200 205
Phe Gly His Gln Ile Lys Thr Leu Ile Ser Asn Pro Val Asn Ile Ala
210 215 220
Asp Ala Val Ala Glu Ala Asp Leu Leu Ile Cys Ala Val Leu Ile Pro
225 230 235 240
Gly Ala Lys Ala Pro Thr Leu Val Thr Glu Glu Met Val Lys Gln Met
245 250 255
Lys Pro Gly Ser Val Ile Val Asp Val Ala Ile Asp Gln Gly Gly Ile
260 265 270
Val Glu Thr Val Asp His Ile Thr Thr His Asp Gln Pro Thr Tyr Glu
275 280 285
Lys His Gly Val Val His Tyr Ala Val Ala Asn Met Pro Gly Ala Val
290 295 300
Pro Arg Thr Ser Thr Ile Ala Leu Thr Asn Val Thr Val Pro Tyr Ala
305 310 315 320
Leu Gln Ile Ala Asn Lys Gly Ala Val Lys Ala Leu Ala Asp Asn Thr
325 330 335
Ala Leu Arg Ala Gly Leu Asn Thr Ala Asn Gly His Val Thr Tyr Glu
340 345 350
Ala Val Ala Arg Asp Leu Gly Tyr Glu Tyr Val Pro Ala Glu Lys Ala
355 360 365
Leu Gln Asp Glu Ser Ser Val Ala Gly Ala
370 375
<210> 84
<211> 505
<212> PRT
<213> 粟酒裂殖酵母
<400> 84
Met Phe Thr Asp Tyr Pro Asn Asp Ile Asn Cys Glu Ser Pro Arg Met
1 5 10 15
Ser Asp Leu Asp Gly Phe Cys Gln Asn Ala Phe Ser Asp Leu Asn Ser
20 25 30
Leu Asn Gln Gln Val Phe Lys Ala Asn Tyr Ala Val Arg Gly Ala Leu
35 40 45
Ala Ile Leu Ala Asp Glu Ile Gln Asp Asp Leu Leu Glu Asn Pro Ser
50 55 60
Ser Tyr Pro Phe Ser Glu Ile Val Tyr Ala Asn Ile Gly Asn Pro Gln
65 70 75 80
Gln Met Gly Gln Ser Pro Ile Thr Phe Val Arg Gln Val Leu Ser Leu
85 90 95
Cys Gln Tyr Pro Thr Leu Leu Asp His Ala Glu Glu Lys Trp Phe Gln
100 105 110
Asn Leu Phe Pro Thr Asp Val Val Gln Arg Ser Lys Met Leu Leu Lys
115 120 125
Glu Ser Gly Ser Leu Gly Ala Tyr Ser Ala Ser Gln Gly Ile Pro Leu
130 135 140
Val Arg Arg His Val Ala Asp Phe Ile Arg Ala Arg Asp Gly Phe Asp
145 150 155 160
Cys Glu Pro Ser Asp Ile Tyr Leu Thr Ser Gly Ala Ser His Ala Ala
165 170 175
Arg Leu Ile Met Thr Leu Ile Ile Ala Arg Pro Thr Asp Gly Val Met
180 185 190
Val Pro Ala Pro Gln Tyr Pro Leu Tyr Gly Ala Gln Ile Asp Leu Met
195 200 205
Ser Gly Ser Met Val Ser Tyr Ser Leu Ser Glu Glu Asn Asn Trp Asp
210 215 220
Ile Asp Phe Asp Gln Phe Lys Lys Ser Phe Asp Glu Ala Ser Lys Lys
225 230 235 240
Gly Ile Asn Val Arg Leu Cys Val Val Ile Asn Pro Gly Asn Pro Thr
245 250 255
Gly Ala Cys Ile Ser Glu Asn Ser Met Glu Lys Val Leu Arg Phe Ala
260 265 270
Lys Ala Lys Gly Ile Val Leu Leu Ala Asp Glu Val Tyr Gln Asn Asn
275 280 285
Ile Tyr Gln Asn Lys Phe His Ser Phe Arg Arg Lys Leu Gly Glu Leu
290 295 300
Arg Glu Lys Glu Pro Asp Asn His Trp Asp Gln Val Ser Leu Ile Ser
305 310 315 320
Val Asn Ser Val Ser Lys Gly Gln Phe Gly Glu Cys Gly Gln Arg Gly
325 330 335
Gly Tyr Leu Asp Val Val Asn Ile Pro Glu Pro Ala Lys Asp Gln Ile
340 345 350
Leu Lys Leu Ala Thr Ile Asp Ile Cys Pro Pro Val Ala Gly Gln Leu
355 360 365
Leu Val Asp Met Leu Val Asn Pro Pro Lys Pro Gly Asp Pro Ser Tyr
370 375 380
Asp Leu Phe Ile Lys Glu Val Asp Glu Ile His Glu Ala Leu Arg Leu
385 390 395 400
Gln Cys Arg Gln Leu Tyr Glu Gly Thr Lys Arg Met Lys Arg Val Ser
405 410 415
Cys Leu Glu Pro His Gly Ala Met Tyr Leu His Pro Ser Val Ser Leu
420 425 430
Pro Glu Lys Leu Ile Thr Thr Ala Lys Ala Gln Lys Ile Gln Pro Asp
435 440 445
Glu Phe Tyr Ala Ile Glu Leu Leu Lys Arg Ser Gly Ile Cys Val Val
450 455 460
Pro Gly Ser Gly Phe Gly Gln Pro Glu Gly Asp Tyr His Ile Arg Ile
465 470 475 480
Thr Phe Leu Ala Lys Gly Thr Glu Tyr Ile Glu Arg Phe Val Lys Ala
485 490 495
His Asn Glu Ile Met Asp Leu Tyr Glu
500 505
<210> 85
<211> 507
<212> PRT
<213> 酿酒酵母
<400> 85
Met Thr Met Thr His Gln Gln Asp Leu Lys Gly Val Phe Thr Ala Lys
1 5 10 15
Asp Leu Asp Phe Lys Pro Ala Gly Lys Ile Thr Lys Lys Asp Leu Asn
20 25 30
Thr Gly Val Thr Lys Ala Glu Tyr Ala Val Arg Gly Ala Ile Pro Thr
35 40 45
Arg Ala Asp Glu Leu Lys Glu Glu Leu Lys Lys Asn Pro Glu Val Leu
50 55 60
Pro Phe Asp Asp Ile Ile Asn Ala Asn Ile Gly Asn Pro Gln Gln Leu
65 70 75 80
Asp Gln Lys Pro Leu Thr Phe Thr Arg Gln Val Leu Ala Ile Leu Glu
85 90 95
Tyr Pro Glu Ile Leu Arg Val Gly His Asn Glu Leu Ala Ser Leu Asn
100 105 110
Leu Phe Ser Arg Asp Ala Leu Glu Arg Ala Glu Arg Leu Leu Asn Asp
115 120 125
Ile Gly Gly Ser Ile Gly Ala Tyr Ser His Ser Gln Gly Val Pro Gly
130 135 140
Ile Arg Gln Thr Val Ala Asp Phe Ile Thr Arg Arg Asp Gly Gly Glu
145 150 155 160
Pro Ala Thr Pro Glu Asp Ile Tyr Leu Thr Thr Gly Ala Ser Ser Ala
165 170 175
Ala Thr Ser Leu Leu Ser Leu Leu Cys Lys Asp Ser Gln Thr Gly Leu
180 185 190
Leu Ile Pro Ile Pro Gln Tyr Pro Leu Tyr Thr Ala Ser Ala Ser Leu
195 200 205
Phe Asn Ala Gln Val Leu Pro Tyr Tyr Leu Asp Glu Glu Ser Asn Trp
210 215 220
Ser Thr Asn Ser Asp Glu Ile Glu Lys Val Val Gln Asp Ala Leu Lys
225 230 235 240
Lys Gln Ile Arg Pro Ser Val Leu Ile Val Ile Asn Pro Gly Asn Pro
245 250 255
Thr Gly Ala Val Leu Ser Glu Glu Thr Ile Ala Arg Ile Cys Leu Ile
260 265 270
Ala Ala Lys Tyr Gly Ile Thr Ile Ile Ser Asp Glu Val Tyr Gln Glu
275 280 285
Asn Ile Phe Asn Asp Val Lys Phe His Ser Met Lys Lys Val Leu Arg
290 295 300
Lys Leu Gln His Leu Tyr Pro Gly Lys Phe Asp Asn Val Gln Leu Ala
305 310 315 320
Ser Leu His Ser Ile Ser Lys Gly Phe Met Asp Glu Cys Gly Gln Arg
325 330 335
Gly Gly Tyr Met Glu Ile Ile Gly Phe Ser Gln Glu Ile Arg Asp Ala
340 345 350
Leu Phe Lys Leu Met Ser Ile Ser Ile Cys Ser Val Val Thr Gly Gln
355 360 365
Ala Val Val Asp Leu Met Val Lys Pro Pro Gln Pro Gly Asp Glu Ser
370 375 380
Tyr Glu Gln Asp His Asp Glu Arg Leu Lys Ile Phe His Glu Met Arg
385 390 395 400
Thr Arg Ala Asn Leu Leu Tyr Glu Thr Phe Lys Glu Leu Glu Gly Ile
405 410 415
Glu Cys Gln Lys Pro Gln Gly Ala Met Tyr Leu Phe Pro Arg Leu Val
420 425 430
Leu Pro Lys Lys Ala Leu Cys Glu Ser Glu Arg Leu Gly Ile Glu Pro
435 440 445
Asp Glu Phe Tyr Cys Thr Ser Leu Leu Glu Ser Thr Gly Ile Cys Thr
450 455 460
Val Pro Gly Ser Gly Phe Gly Gln Arg Pro Gly Thr Tyr His Val Arg
465 470 475 480
Thr Thr Phe Leu Ala Pro Gly Thr Lys Trp Ile Gln Asp Trp Lys Glu
485 490 495
Phe His Gln Asp Phe Phe Ser Lys Tyr Arg Asn
500 505
<210> 86
<211> 471
<212> PRT
<213> 枯草芽孢杆菌
<400> 86
Met Lys Asn Lys Trp Tyr Lys Pro Lys Arg His Trp Lys Glu Ile Glu
1 5 10 15
Leu Trp Lys Asp Val Pro Glu Glu Lys Trp Asn Asp Trp Leu Trp Gln
20 25 30
Leu Thr His Thr Val Arg Thr Leu Asp Asp Leu Lys Lys Val Ile Asn
35 40 45
Leu Thr Glu Asp Glu Glu Glu Gly Val Arg Ile Ser Thr Lys Thr Ile
50 55 60
Pro Leu Asn Ile Thr Pro Tyr Tyr Ala Ser Leu Met Asp Pro Asp Asn
65 70 75 80
Pro Arg Cys Pro Val Arg Met Gln Ser Val Pro Leu Ser Glu Glu Met
85 90 95
His Lys Thr Lys Tyr Asp Leu Glu Asp Pro Leu His Glu Asp Glu Asp
100 105 110
Ser Pro Val Pro Gly Leu Thr His Arg Tyr Pro Asp Arg Val Leu Phe
115 120 125
Leu Val Thr Asn Gln Cys Ser Met Tyr Cys Arg Tyr Cys Thr Arg Arg
130 135 140
Arg Phe Ser Gly Gln Ile Gly Met Gly Val Pro Lys Lys Gln Leu Asp
145 150 155 160
Ala Ala Ile Ala Tyr Ile Arg Glu Thr Pro Glu Ile Arg Asp Cys Leu
165 170 175
Ile Ser Gly Gly Asp Gly Leu Leu Ile Asn Asp Gln Ile Leu Glu Tyr
180 185 190
Ile Leu Lys Glu Leu Arg Ser Ile Pro His Leu Glu Val Ile Arg Ile
195 200 205
Gly Thr Arg Ala Pro Val Val Phe Pro Gln Arg Ile Thr Asp His Leu
210 215 220
Cys Glu Ile Leu Lys Lys Tyr His Pro Val Trp Leu Asn Thr His Phe
225 230 235 240
Asn Thr Ser Ile Glu Met Thr Glu Glu Ser Val Glu Ala Cys Glu Lys
245 250 255
Leu Val Asn Ala Gly Val Pro Val Gly Asn Gln Ala Val Val Leu Ala
260 265 270
Gly Ile Asn Asp Ser Val Pro Ile Met Lys Lys Leu Met His Asp Leu
275 280 285
Val Lys Ile Arg Val Arg Pro Tyr Tyr Ile Tyr Gln Cys Asp Leu Ser
290 295 300
Glu Gly Ile Gly His Phe Arg Ala Pro Val Ser Lys Gly Leu Glu Ile
305 310 315 320
Ile Glu Gly Leu Arg Gly His Thr Ser Gly Tyr Ala Val Pro Thr Phe
325 330 335
Val Val Asp Ala Pro Gly Gly Gly Gly Lys Ile Ala Leu Gln Pro Asn
340 345 350
Tyr Val Leu Ser Gln Ser Pro Asp Lys Val Ile Leu Arg Asn Phe Glu
355 360 365
Gly Val Ile Thr Ser Tyr Pro Glu Pro Glu Asn Tyr Ile Pro Asn Gln
370 375 380
Ala Asp Ala Tyr Phe Glu Ser Val Phe Pro Glu Thr Ala Asp Lys Lys
385 390 395 400
Glu Pro Ile Gly Leu Ser Ala Ile Phe Ala Asp Lys Glu Val Ser Phe
405 410 415
Thr Pro Glu Asn Val Asp Arg Ile Lys Arg Arg Glu Ala Tyr Ile Ala
420 425 430
Asn Pro Glu His Glu Thr Leu Lys Asp Arg Arg Glu Lys Arg Asp Gln
435 440 445
Leu Lys Glu Lys Lys Phe Leu Ala Gln Gln Lys Lys Gln Lys Glu Thr
450 455 460
Glu Cys Gly Gly Asp Ser Ser
465 470
<210> 87
<211> 416
<212> PRT
<213> Porphyromonas gingivalis
<400> 87
Met Ala Glu Ser Arg Arg Lys Tyr Tyr Phe Pro Asp Val Thr Asp Glu
1 5 10 15
Gln Trp Asn Asp Trp His Trp Gln Val Leu Asn Arg Ile Glu Thr Leu
20 25 30
Asp Gln Leu Lys Lys Tyr Val Thr Leu Thr Ala Glu Glu Glu Glu Gly
35 40 45
Val Lys Glu Ser Leu Lys Val Leu Arg Met Ala Ile Thr Pro Tyr Tyr
50 55 60
Leu Ser Leu Ile Asp Pro Glu Asn Pro Asn Cys Pro Ile Arg Lys Gln
65 70 75 80
Ala Ile Pro Thr His Gln Glu Leu Val Arg Ala Pro Glu Asp Gln Val
85 90 95
Asp Pro Leu Ser Glu Asp Glu Asp Ser Pro Val Pro Gly Leu Thr His
100 105 110
Arg Tyr Pro Asp Arg Val Leu Phe Leu Ile Thr Asp Lys Cys Ser Met
115 120 125
Tyr Cys Arg His Cys Thr Arg Arg Arg Phe Ala Gly Gln Lys Asp Ala
130 135 140
Ser Ser Pro Ser Glu Arg Ile Asp Arg Cys Ile Asp Tyr Ile Ala Asn
145 150 155 160
Thr Pro Thr Val Arg Asp Val Leu Leu Ser Gly Gly Asp Ala Leu Leu
165 170 175
Val Ser Asp Glu Arg Leu Glu Tyr Ile Leu Lys Arg Leu Arg Glu Ile
180 185 190
Pro His Val Glu Ile Val Arg Ile Gly Ser Arg Thr Pro Val Val Leu
195 200 205
Pro Gln Arg Ile Thr Pro Gln Leu Val Asp Met Leu Lys Lys Tyr His
210 215 220
Pro Val Trp Leu Asn Thr His Phe Asn His Pro Asn Glu Val Thr Glu
225 230 235 240
Glu Ala Val Glu Ala Cys Glu Arg Met Ala Asn Ala Gly Ile Pro Leu
245 250 255
Gly Asn Gln Thr Val Leu Leu Arg Gly Ile Asn Asp Cys Thr His Val
260 265 270
Met Lys Arg Leu Val His Leu Leu Val Lys Met Arg Val Arg Pro Tyr
275 280 285
Tyr Ile Tyr Val Cys Asp Leu Ser Leu Gly Ile Gly His Phe Arg Thr
290 295 300
Pro Val Ser Lys Gly Ile Glu Ile Ile Glu Asn Leu Arg Gly His Thr
305 310 315 320
Ser Gly Tyr Ala Val Pro Thr Phe Val Val Asp Ala Pro Gly Gly Gly
325 330 335
Gly Lys Ile Pro Val Met Pro Asn Tyr Val Val Ser Gln Ser Pro Arg
340 345 350
His Val Val Leu Arg Asn Tyr Glu Gly Val Ile Thr Thr Tyr Thr Glu
355 360 365
Pro Glu Asn Tyr His Glu Glu Cys Asp Cys Glu Asp Cys Arg Ala Gly
370 375 380
Lys His Lys Glu Gly Val Ala Ala Leu Ser Gly Gly Gln Gln Leu Ala
385 390 395 400
Ile Glu Pro Ser Asp Leu Ala Arg Lys Lys Arg Lys Phe Asp Lys Asn
405 410 415
<210> 88
<211> 425
<212> PRT
<213> Fusobacterium nucleatum
<400> 88
Met Asn Thr Val Asn Thr Arg Lys Lys Phe Phe Pro Asn Val Thr Asp
1 5 10 15
Glu Glu Trp Asn Asp Trp Thr Trp Gln Val Lys Asn Arg Ile Glu Lys
20 25 30
Ile Asp Asp Leu Lys Lys Tyr Val Glu Leu Ser Ala Glu Glu Glu Glu
35 40 45
Gly Val Val Arg Thr Leu Glu Thr Leu Arg Met Ala Ile Thr Pro Tyr
50 55 60
Tyr Phe Ser Leu Ile Asp Met Asn Ser Asp Arg Cys Pro Ile Arg Lys
65 70 75 80
Gln Ala Ile Pro Thr Ile Gln Glu Ile His Gln Ser Asp Ala Asp Leu
85 90 95
Leu Asp Pro Leu His Glu Asp Glu Asp Ser Pro Val Pro Gly Leu Thr
100 105 110
His Arg Tyr Pro Asp Arg Val Leu Leu Leu Ile Thr Asp Met Cys Ser
115 120 125
Met Tyr Cys Arg His Cys Thr Arg Arg Arg Phe Ala Gly Ser Ser Asp
130 135 140
Asp Ala Met Pro Met Asp Arg Ile Asp Lys Ala Ile Glu Tyr Ile Ala
145 150 155 160
Lys Thr Pro Gln Val Arg Asp Val Leu Leu Ser Gly Gly Asp Ala Leu
165 170 175
Leu Val Ser Asp Lys Lys Leu Glu Ser Ile Ile Gln Lys Leu Arg Ala
180 185 190
Ile Pro His Val Glu Ile Ile Arg Ile Gly Ser Arg Thr Pro Val Val
195 200 205
Leu Pro Gln Arg Ile Thr Pro Glu Leu Cys Asn Met Leu Lys Lys Tyr
210 215 220
His Pro Ile Trp Leu Asn Thr His Phe Asn His Pro Gln Glu Val Thr
225 230 235 240
Pro Glu Ala Lys Lys Ala Cys Glu Met Leu Ala Asp Ala Gly Val Pro
245 250 255
Leu Gly Asn Gln Thr Val Leu Leu Arg Gly Ile Asn Asp Ser Val Pro
260 265 270
Val Met Lys Arg Leu Val His Asp Leu Val Met Met Arg Val Arg Pro
275 280 285
Tyr Tyr Ile Tyr Gln Cys Asp Leu Ser Met Gly Leu Glu His Phe Arg
290 295 300
Thr Pro Val Ser Lys Gly Ile Glu Ile Ile Glu Gly Leu Arg Gly His
305 310 315 320
Thr Ser Gly Tyr Ala Val Pro Thr Phe Val Val Asp Ala Pro Gly Gly
325 330 335
Gly Gly Lys Thr Pro Val Met Pro Gln Tyr Val Ile Ser Gln Ser Pro
340 345 350
His Arg Val Val Leu Arg Asn Phe Glu Gly Val Ile Thr Thr Tyr Thr
355 360 365
Glu Pro Glu Asn Tyr Thr His Glu Pro Cys Tyr Asp Glu Glu Lys Phe
370 375 380
Glu Lys Met Tyr Glu Ile Ser Gly Val Tyr Met Leu Asp Glu Gly Leu
385 390 395 400
Lys Met Ser Leu Glu Pro Ser His Leu Ala Arg His Glu Arg Asn Lys
405 410 415
Lys Arg Ala Glu Ala Glu Gly Lys Lys
420 425
<210> 89
<211> 517
<212> PRT
<213> Megasphaera elsdenii
<400> 89
Met Arg Lys Val Glu Ile Ile Thr Ala Glu Gln Ala Ala Gln Leu Val
1 5 10 15
Lys Asp Asn Asp Thr Ile Thr Ser Ile Gly Phe Val Ser Ser Ala His
20 25 30
Pro Glu Ala Leu Thr Lys Ala Leu Glu Lys Arg Phe Leu Asp Thr Asn
35 40 45
Thr Pro Gln Asn Leu Thr Tyr Ile Tyr Ala Gly Ser Gln Gly Lys Arg
50 55 60
Asp Gly Arg Ala Ala Glu His Leu Ala His Thr Gly Leu Leu Lys Arg
65 70 75 80
Ala Ile Ile Gly His Trp Gln Thr Val Pro Ala Ile Gly Lys Leu Ala
85 90 95
Val Glu Asn Lys Ile Glu Ala Tyr Asn Phe Ser Gln Gly Thr Leu Val
100 105 110
His Trp Phe Arg Ala Leu Ala Gly His Lys Leu Gly Val Phe Thr Asp
115 120 125
Ile Gly Leu Glu Thr Phe Leu Asp Pro Arg Gln Leu Gly Gly Lys Leu
130 135 140
Asn Asp Val Thr Lys Glu Asp Leu Val Lys Leu Ile Glu Val Asp Gly
145 150 155 160
His Glu Gln Leu Phe Tyr Pro Thr Phe Pro Val Asn Val Ala Phe Leu
165 170 175
Arg Gly Thr Tyr Ala Asp Glu Ser Gly Asn Ile Thr Met Asp Glu Glu
180 185 190
Ile Gly Pro Phe Glu Ser Thr Ser Val Ala Gln Ala Val His Asn Cys
195 200 205
Gly Gly Lys Val Val Val Gln Val Lys Asp Val Val Ala His Gly Ser
210 215 220
Leu Asp Pro Arg Met Val Lys Ile Pro Gly Ile Tyr Val Asp Tyr Val
225 230 235 240
Val Val Ala Ala Pro Glu Asp His Gln Gln Thr Tyr Asp Cys Glu Tyr
245 250 255
Asp Pro Ser Leu Ser Gly Glu His Arg Ala Pro Glu Gly Ala Thr Asp
260 265 270
Ala Ala Leu Pro Met Ser Ala Lys Lys Ile Ile Gly Arg Arg Gly Ala
275 280 285
Leu Glu Leu Thr Glu Asn Ala Val Val Asn Leu Gly Val Gly Ala Pro
290 295 300
Glu Tyr Val Ala Ser Val Ala Gly Glu Glu Gly Ile Ala Asp Thr Ile
305 310 315 320
Thr Leu Thr Val Glu Gly Gly Ala Ile Gly Gly Val Pro Gln Gly Gly
325 330 335
Ala Arg Phe Gly Ser Ser Arg Asn Ala Asp Ala Ile Ile Asp His Thr
340 345 350
Tyr Gln Phe Asp Phe Tyr Asp Gly Gly Gly Leu Asp Ile Ala Tyr Leu
355 360 365
Gly Leu Ala Gln Cys Asp Gly Ser Gly Asn Ile Asn Val Ser Lys Phe
370 375 380
Gly Thr Asn Val Ala Gly Cys Gly Gly Phe Pro Asn Ile Ser Gln Gln
385 390 395 400
Thr Pro Asn Val Tyr Phe Cys Gly Thr Phe Thr Ala Gly Gly Leu Lys
405 410 415
Ile Ala Val Glu Asp Gly Lys Val Lys Ile Leu Gln Glu Gly Lys Ala
420 425 430
Lys Lys Phe Ile Lys Ala Val Asp Gln Ile Thr Phe Asn Gly Ser Tyr
435 440 445
Ala Ala Arg Asn Gly Lys His Val Leu Tyr Ile Thr Glu Arg Cys Val
450 455 460
Phe Glu Leu Thr Lys Glu Gly Leu Lys Leu Ile Glu Val Ala Pro Gly
465 470 475 480
Ile Asp Ile Glu Lys Asp Ile Leu Ala His Met Asp Phe Lys Pro Ile
485 490 495
Ile Asp Asn Pro Lys Leu Met Asp Ala Arg Leu Phe Gln Asp Gly Pro
500 505 510
Met Gly Leu Lys Lys
515
<210> 90
<211> 145
<212> PRT
<213> 丙酸梭菌(Clostridium propionicum)
<400> 90
Met Val Gly Lys Lys Val Val His His Leu Met Met Ser Ala Lys Asp
1 5 10 15
Ala His Tyr Thr Gly Asn Leu Val Asn Gly Ala Arg Ile Val Asn Gln
20 25 30
Trp Gly Asp Val Gly Thr Glu Leu Met Val Tyr Val Asp Gly Asp Ile
35 40 45
Ser Leu Phe Leu Gly Tyr Lys Asp Ile Glu Phe Thr Ala Pro Val Tyr
50 55 60
Val Gly Asp Phe Met Glu Tyr His Gly Trp Ile Glu Lys Val Gly Asn
65 70 75 80
Gln Ser Tyr Thr Cys Lys Phe Glu Ala Trp Lys Val Ala Thr Met Val
85 90 95
Asp Ile Thr Asn Pro Gln Asp Thr Arg Ala Thr Ala Cys Glu Pro Pro
100 105 110
Val Leu Cys Gly Arg Ala Thr Gly Ser Leu Phe Ile Ala Lys Lys Asp
115 120 125
Gln Arg Gly Pro Gln Glu Ser Ser Phe Lys Glu Arg Lys His Pro Gly
130 135 140
Glu
145
<210> 91
<211> 260
<212> PRT
<213> Phytophthora sojae
<400> 91
Met Ala Ala Glu Tyr Glu Ser Ile Leu Thr Glu Val Arg Gly Lys Val
1 5 10 15
Ala Ile Ile Thr Leu Asn Arg Pro Lys Ala Leu Asn Ala Leu Cys Ser
20 25 30
Pro Leu Ile Glu Glu Leu Asn Gly Ala Ala His Ala Phe Asp Ala Asp
35 40 45
Pro Ser Ile Gly Ala Ile Val Ile Thr Gly Ser Gly Ser Lys Ala Phe
50 55 60
Ala Ala Gly Ala Asp Ile Lys Glu Met Ala Thr Lys Thr Phe Val Asp
65 70 75 80
Ala Tyr Lys Ser Asn Met Phe Ala Asn Trp Gly Asp Ile Thr Lys Val
85 90 95
Ser Lys Pro Val Ile Ala Ala Val Asn Gly Tyr Ala Leu Gly Gly Gly
100 105 110
Cys Glu Leu Ala Met Leu Cys Asp Leu Ile Ile Ala Gly Asp Ser Ala
115 120 125
Lys Phe Gly Gln Pro Glu Ile Thr Leu Gly Thr Ile Pro Gly Cys Gly
130 135 140
Gly Thr Gln Arg Leu Ile Arg Ala Val Gly Lys Ser Lys Ala Met Glu
145 150 155 160
Met Ile Leu Thr Gly Asn Met Ile Asp Ala Gln Gln Ala Glu Arg Asp
165 170 175
Gly Leu Val Ala Arg Val Val Pro Ala Asp Gln Leu Leu Asp Glu Ala
180 185 190
Leu Lys Thr Ala Asn Lys Ile Ala Ser Phe Ser Gln Pro Val Val Lys
195 200 205
Met Ala Lys Glu Ala Val Asn Ala Ala Tyr Glu Gln Ser Leu Gln Glu
210 215 220
Gly Leu Lys Tyr Glu Ser Arg Leu Phe Trp Ser Ser Phe Ala Thr Lys
225 230 235 240
Asp Gln Lys Glu Gly Met Ala Ala Phe Val Glu Lys Arg Lys Ala Asp
245 250 255
Phe Lys Asp Glu
260
<210> 92
<211> 258
<212> PRT
<213> 橙色绿屈挠菌
<400> 92
Met Ser Glu Glu Ser Leu Val Leu Ser Thr Ile Glu Gly Pro Ile Ala
1 5 10 15
Ile Leu Thr Leu Asn Arg Pro Gln Ala Leu Asn Ala Leu Ser Pro Ala
20 25 30
Leu Ile Asp Asp Leu Ile Arg His Leu Glu Ala Cys Asp Ala Asp Asp
35 40 45
Thr Ile Arg Val Ile Ile Ile Thr Gly Ala Gly Arg Ala Phe Ala Ala
50 55 60
Gly Ala Asp Ile Lys Ala Met Ala Asn Ala Thr Pro Ile Asp Met Leu
65 70 75 80
Thr Ser Gly Met Ile Ala Arg Trp Ala Arg Ile Ala Ala Val Arg Lys
85 90 95
Pro Val Ile Ala Ala Val Asn Gly Tyr Ala Leu Gly Gly Gly Cys Glu
100 105 110
Leu Ala Met Met Cys Asp Ile Ile Ile Ala Ser Glu Asn Ala Gln Phe
115 120 125
Gly Gln Pro Glu Ile Asn Leu Gly Ile Ile Pro Gly Ala Gly Gly Thr
130 135 140
Gln Arg Leu Thr Arg Ala Leu Gly Pro Tyr Arg Ala Met Glu Leu Ile
145 150 155 160
Leu Thr Gly Ala Thr Ile Ser Ala Gln Glu Ala Leu Ala His Gly Leu
165 170 175
Val Cys Arg Val Cys Pro Pro Glu Ser Leu Leu Asp Glu Ala Arg Arg
180 185 190
Ile Ala Gln Thr Ile Ala Thr Lys Ser Pro Leu Ala Val Gln Leu Ala
195 200 205
Lys Glu Ala Val Arg Met Ala Ala Glu Thr Thr Val Arg Glu Gly Leu
210 215 220
Ala Ile Glu Leu Arg Asn Phe Tyr Leu Leu Phe Ala Ser Ala Asp Gln
225 230 235 240
Lys Glu Gly Met Gln Ala Phe Ile Glu Lys Arg Ala Pro Asn Phe Ser
245 250 255
Gly Arg
<210> 93
<211> 288
<212> PRT
<213> Rhodospirillum rubrum
<400> 93
Met Ala Ala Ala Pro Gly Pro Pro Ala Ala Arg Pro Arg Ala Ala Arg
1 5 10 15
Gln Ser Arg Met Ile Leu Pro Pro Leu Arg Glu Gln Ala Gln Met Ala
20 25 30
Tyr Glu Asn Ile Leu Val Glu Thr Asn Gly Lys Val Gly Ile Val Thr
35 40 45
Leu Asn Arg Pro Lys Ala Leu Asn Ala Leu Ser Ala Gly Leu Val Arg
50 55 60
Asp Leu Gly Ala Ala Leu Asp Ala Phe Glu Ala Asp Val Asn Val His
65 70 75 80
Val Ile Val Leu Thr Gly Ser Asp Lys Ala Phe Ala Ala Gly Ala Asp
85 90 95
Ile Lys Glu Met Ala Glu Lys Ser Tyr Met Asp Ala Tyr Leu Glu Asp
100 105 110
Phe Ile Thr Lys Gly Trp Glu Arg Val Thr Thr Cys Arg Lys Pro Ile
115 120 125
Ile Ala Ala Val Ala Gly Phe Ala Leu Gly Gly Gly Cys Glu Met Ala
130 135 140
Met Met Cys Asp Phe Ile Ile Ala Ala Gln Asn Ala Lys Phe Gly Gln
145 150 155 160
Pro Glu Ile Asn Leu Gly Thr Leu Pro Gly Ala Gly Gly Thr Gln Arg
165 170 175
Leu Thr Arg Phe Val Gly Lys Ser Lys Ala Met Asp Met Cys Leu Thr
180 185 190
Gly Arg Met Met Asp Ala Asp Glu Ala Trp Lys Cys Gly Leu Val Ser
195 200 205
Arg Ile Val Pro Val Asp Asp Leu Lys Asp Glu Val Leu Lys Ile Ala
210 215 220
Glu Ala Ile Ala Asp Lys Ser Leu Pro Ile Thr Met Met Val Lys Glu
225 230 235 240
Ala Val Asn Ala Ala Tyr Glu Thr Thr Leu Ala Gln Gly Val Arg Phe
245 250 255
Glu Arg Arg Leu Phe Gln Ala Ser Phe Ala Thr Asp Asp Gln Lys Glu
260 265 270
Gly Met Asn Ala Phe Ile Glu Lys Arg Gln Pro Ser Phe Thr Asp Arg
275 280 285
<210> 94
<211> 258
<212> PRT
<213> Rhodobacter capsulatus
<400> 94
Met Ser Tyr Gln Thr Leu Ile Val Glu Ile Ala Asp Gly Val Ala Leu
1 5 10 15
Ile Arg Leu Asn Arg Pro Glu Ala Leu Asn Ala Leu Asn Ser Gln Leu
20 25 30
Leu Gly Glu Leu Ala Ala Ala Leu Ser Thr Leu Asp Ala Asp Pro Ala
35 40 45
Val Arg Cys Phe Val Leu Thr Gly Ser Asp Lys Ala Phe Ala Ala Gly
50 55 60
Ala Asp Ile Lys Glu Met Ala Asp Lys Ser Phe Val Asp Met Leu Lys
65 70 75 80
Leu Asp Phe Phe Gly Thr Glu Gly Asp Ala Ile Leu Arg Thr Arg Lys
85 90 95
Pro Val Ile Ala Ala Val Ala Gly Tyr Ala Leu Gly Gly Gly Cys Glu
100 105 110
Leu Ala Met Met Cys Asp Phe Ile Leu Cys Ala Glu Asn Ala Lys Phe
115 120 125
Gly Gln Pro Glu Ile Asn Leu Gly Val Val Ala Gly Ile Gly Gly Thr
130 135 140
Gln Arg Leu Thr Arg Phe Val Gly Lys Ser Lys Ser Met Glu Met His
145 150 155 160
Leu Thr Gly Arg Phe Met Asp Ala Ala Glu Ala Glu Arg Ser Gly Leu
165 170 175
Val Ser Arg Val Leu Pro Leu Ala Asp Leu Leu Pro Glu Ala Leu Ala
180 185 190
Thr Ala Arg Lys Ile Ala Glu Lys Ser Ala Ile Ala Thr Met Val Ala
195 200 205
Lys Asp Cys Val Asn Arg Ala Tyr Glu Thr Thr Leu Arg Glu Gly Val
210 215 220
Leu Tyr Glu Arg Arg Val Phe His Ala Leu Phe Ala Thr Glu Asp Gln
225 230 235 240
Lys Glu Gly Met Ala Ala Phe Ala Glu Lys Arg Pro Ala Lys Phe Ala
245 250 255
Asp Lys
<210> 95
<211> 290
<212> PRT
<213> 智人
<400> 95
Met Ala Ala Leu Arg Val Leu Leu Ser Cys Ala Arg Gly Pro Leu Arg
1 5 10 15
Pro Pro Val Arg Cys Pro Ala Trp Arg Pro Phe Ala Ser Gly Ala Asn
20 25 30
Phe Glu Tyr Ile Ile Ala Glu Lys Arg Gly Lys Asn Asn Thr Val Gly
35 40 45
Leu Ile Gln Leu Asn Arg Pro Lys Ala Leu Asn Ala Leu Cys Asp Gly
50 55 60
Leu Ile Asp Glu Leu Asn Gln Ala Leu Lys Ile Phe Glu Glu Asp Pro
65 70 75 80
Ala Val Gly Ala Ile Val Leu Thr Gly Gly Asp Lys Ala Phe Ala Ala
85 90 95
Gly Ala Asp Ile Lys Glu Met Gln Asn Leu Ser Phe Gln Asp Cys Tyr
100 105 110
Ser Ser Lys Phe Leu Lys His Trp Asp His Leu Thr Gln Val Lys Lys
115 120 125
Pro Val Ile Ala Ala Val Asn Gly Tyr Ala Phe Gly Gly Gly Cys Glu
130 135 140
Leu Ala Met Met Cys Asp Ile Ile Tyr Ala Gly Glu Lys Ala Gln Phe
145 150 155 160
Ala Gln Pro Glu Ile Leu Ile Gly Thr Ile Pro Gly Ala Gly Gly Thr
165 170 175
Gln Arg Leu Thr Arg Ala Val Gly Lys Ser Leu Ala Met Glu Met Val
180 185 190
Leu Thr Gly Asp Arg Ile Ser Ala Gln Asp Ala Lys Gln Ala Gly Leu
195 200 205
Val Ser Lys Ile Cys Pro Val Glu Thr Leu Val Glu Glu Ala Ile Gln
210 215 220
Cys Ala Glu Lys Ile Ala Ser Asn Ser Lys Ile Val Val Ala Met Ala
225 230 235 240
Lys Glu Ser Val Asn Ala Ala Phe Glu Met Thr Leu Thr Glu Gly Ser
245 250 255
Lys Leu Glu Lys Lys Leu Phe Tyr Ser Thr Phe Ala Thr Asp Asp Arg
260 265 270
Lys Glu Gly Met Thr Ala Phe Val Glu Lys Arg Lys Ala Asn Phe Lys
275 280 285
Asp Gln
290
<210> 96
<211> 399
<212> PRT
<213> 荧光假单胞菌
<400> 96
Met Arg Val Val Leu Cys Lys Phe Ala Leu Leu Arg Ser His Asp Gly
1 5 10 15
Ser Ser Ala Asn Ile Leu Ile Lys Asn Asn Lys Ser Arg Glu Leu Ser
20 25 30
Met Thr Ala Gln Val Ser Thr Glu Ala Ser His Ala Ala Ile Leu Gln
35 40 45
Asp Glu Val Leu Ala Glu Val Arg Asn His Ile Gly His Leu Thr Leu
50 55 60
Asn Arg Pro Ala Gly Leu Asn Ala Leu Thr Leu Gln Met Val Arg Ser
65 70 75 80
Leu Thr Ser Gln Leu Gln Ala Trp Ser Asp Asp Pro Gln Val Tyr Ala
85 90 95
Val Val Leu Arg Gly Ala Gly Glu Lys Ala Phe Cys Ala Gly Gly Asp
100 105 110
Ile Arg Ser Leu Tyr Asp Ser Phe Lys Asn Gly Asp Thr Leu His Gln
115 120 125
Asp Phe Phe Val Glu Glu Tyr Ala Leu Asp Leu Ala Ile His His Tyr
130 135 140
Arg Lys Pro Val Leu Ala Leu Met Asp Gly Phe Val Leu Gly Gly Gly
145 150 155 160
Met Gly Leu Val Gln Gly Ala Asp Leu Arg Val Val Thr Glu Arg Ser
165 170 175
Arg Leu Ala Met Pro Glu Val Ala Ile Gly Tyr Phe Pro Asp Val Gly
180 185 190
Gly Ser Tyr Phe Leu Pro Arg Ile Pro Gly Glu Leu Gly Ile Tyr Leu
195 200 205
Gly Val Thr Gly Val Gln Ile Arg Ala Ala Asp Ala Leu Tyr Cys Gly
210 215 220
Leu Ala Asp Trp Tyr Leu Asp Ser His Lys Leu Ala Asp Leu Asp Gln
225 230 235 240
Lys Leu Asp Asn Leu Arg Trp His Asp Ser Pro Leu Lys Asp Leu Gln
245 250 255
Gly Ala Leu Ala Arg Leu Ala Val Gln Gln Leu Pro Asp Ala Pro Leu
260 265 270
Ala Ala Leu Arg Pro Ala Ile Asp His Phe Phe Ala Leu Pro Asp Val
275 280 285
Pro Ser Ile Val Glu Gln Leu Gln Gln Val Thr Val Ala Asp Ser His
290 295 300
Glu Trp Ala Leu Asn Thr Val Ser Leu Met Gln Thr Arg Ser Pro Leu
305 310 315 320
Ala Met Ala Val Thr Leu Glu Met Leu Arg Arg Gly Arg Arg Leu Ser
325 330 335
Leu Glu Gln Cys Phe Ala Leu Glu Leu His Leu Asp Arg Gln Trp Phe
340 345 350
Glu Arg Gly Asp Leu Ile Glu Gly Val Arg Ala Leu Ile Ile Asp Lys
355 360 365
Asp Lys Ser Pro Arg Trp Asn Pro Pro Thr Leu His Gly Leu Ala Leu
370 375 380
Asn His Val Glu Ser Phe Phe His His Phe Glu Lys Val Val Lys
385 390 395
<210> 97
<211> 351
<212> PRT
<213> 蜡状芽孢杆菌
<400> 97
Met Thr Glu Gln Val Leu Phe Ser Val Ser Glu Asn Gly Val Ala Thr
1 5 10 15
Ile Thr Leu Asn Arg Pro Lys Ala Leu Asn Ser Leu Ser Tyr Asp Met
20 25 30
Leu Gln Pro Ile Gly Gln Lys Leu Lys Glu Trp Glu His Asp Glu Arg
35 40 45
Ile Ala Leu Ile Val Leu Lys Gly Ala Gly Thr Lys Gly Phe Cys Ala
50 55 60
Gly Gly Asp Ile Lys Thr Leu Tyr Glu Ala Arg Ser Asn Glu Val Ala
65 70 75 80
Leu Gln His Ala Glu Arg Phe Phe Glu Glu Glu Tyr Glu Ile Asp Thr
85 90 95
Tyr Ile Tyr Gln Tyr Thr Lys Pro Ile Ile Ala Cys Leu Asp Gly Ile
100 105 110
Val Met Gly Gly Gly Val Gly Leu Thr Asn Gly Ala Lys Tyr Arg Ile
115 120 125
Val Thr Glu Arg Thr Lys Trp Ala Met Pro Glu Met Asn Ile Gly Phe
130 135 140
Phe Pro Asp Val Gly Ala Ala Tyr Phe Leu Asn Lys Ala Pro Gly Tyr
145 150 155 160
Thr Gly Arg Phe Val Ala Leu Thr Ala Ser Ile Leu Lys Ala Ser Asp
165 170 175
Val Leu Phe Ile Asn Ala Ala Asp Tyr Phe Met Thr Ser Asp Ser Leu
180 185 190
Pro Glu Phe Leu Thr Glu Leu Glu Ser Val Asn Trp His Lys Glu Asp
195 200 205
Asp Val His Thr Asn Leu Lys Glu Val Ile Arg Thr Phe Ala Thr Ala
210 215 220
Pro Asn Leu Glu Ser Glu Leu Ala Pro Ser Leu Glu Val Ile Asn Ser
225 230 235 240
His Phe Ala Phe Asp Thr Ile Glu Glu Ile Ile His Ser Leu Glu Lys
245 250 255
Asp Glu Ser Ser Phe Ala Leu Lys Thr Lys Glu Ile Leu Leu Ser Lys
260 265 270
Ser Pro Ile Ser Leu Lys Val Thr Leu Lys Gln Phe Ile Asp Gly Gln
275 280 285
Asp Lys Ser Val Glu Glu Cys Phe Ala Thr Asp Leu Ile Leu Ala Lys
290 295 300
Asn Phe Met Arg His Glu Asp Phe Phe Glu Gly Val Arg Ser Val Val
305 310 315 320
Val Asp Lys Asp Gln Asn Pro Asn Tyr Lys Tyr Lys Gln Leu Ser Asp
325 330 335
Val Ser Glu Glu Asp Val Asn Arg Phe Phe Asn Leu Leu Asn Ala
340 345 350
<210> 98
<211> 381
<212> PRT
<213> 智人
<400> 98
Met Trp Arg Leu Met Ser Arg Phe Asn Ala Phe Lys Arg Thr Asn Thr
1 5 10 15
Ile Leu His His Leu Arg Met Ser Lys His Thr Asp Ala Ala Glu Glu
20 25 30
Val Leu Leu Glu Lys Lys Gly Cys Ala Gly Val Ile Thr Leu Asn Arg
35 40 45
Pro Lys Phe Leu Asn Ala Leu Thr Leu Asn Met Ile Arg Gln Ile Tyr
50 55 60
Pro Gln Leu Lys Lys Trp Glu Gln Asp Pro Glu Thr Phe Val Ile Ile
65 70 75 80
Ile Lys Gly Ala Gly Gly Lys Ala Phe Cys Ala Gly Gly Asp Ile Arg
85 90 95
Val Ile Ser Glu Ala Glu Lys Ala Lys Gln Lys Ile Ala Pro Val Phe
100 105 110
Phe Arg Glu Glu Tyr Met Leu Asn Asn Ala Val Gly Ser Cys Gln Lys
115 120 125
Pro Tyr Val Ala Leu Ile His Gly Ile Thr Met Gly Gly Gly Val Gly
130 135 140
Leu Ser Val His Gly Gln Phe Arg Val Ala Thr Glu Lys Cys Leu Phe
145 150 155 160
Ala Met Pro Glu Thr Ala Ile Gly Leu Phe Pro Asp Val Gly Gly Gly
165 170 175
Tyr Phe Phe Ala Thr Thr Pro Arg Lys Thr Trp Leu Leu Pro Cys Ile
180 185 190
Asn Gly Phe Arg Leu Lys Gly Arg Asp Val Tyr Arg Ala Gly Ile Ala
195 200 205
Thr His Phe Val Asp Ser Glu Lys Leu Ala Met Leu Glu Glu Asp Leu
210 215 220
Leu Ala Leu Lys Ser Pro Ser Lys Glu Asn Ile Ala Ser Val Leu Glu
225 230 235 240
Asn Tyr His Thr Glu Ser Lys Ile Asp Arg Asp Lys Ser Phe Ile Leu
245 250 255
Glu Glu His Met Asp Lys Ile Asn Ser Cys Phe Ser Ala Asn Thr Val
260 265 270
Glu Glu Ile Ile Glu Asn Leu Gln Gln Asp Gly Ser Ser Phe Ala Leu
275 280 285
Glu Gln Leu Lys Val Ile Asn Lys Met Ser Pro Thr Ser Leu Lys Ile
290 295 300
Thr Leu Arg Gln Leu Met Glu Gly Ser Ser Lys Thr Leu Gln Glu Val
305 310 315 320
Leu Thr Met Glu Tyr Arg Leu Ser Gln Ala Cys Met Arg Gly His Asp
325 330 335
Phe His Glu Gly Val Arg Ala Val Leu Ile Asp Lys Asp Gln Ser Pro
340 345 350
Lys Trp Lys Pro Ala Asp Leu Lys Glu Val Thr Glu Glu Asp Leu Asn
355 360 365
Asn His Phe Lys Ser Leu Gly Ser Ser Asp Leu Lys Phe
370 375 380
<210> 99
<211> 261
<212> PRT
<213> Megasphaera elsdenii
<400> 99
Val Lys Thr Val Tyr Thr Leu Gly Ile Asp Val Gly Ser Ser Ser Ser
1 5 10 15
Lys Ala Val Ile Leu Glu Asp Gly Lys Lys Ile Val Ala His Ala Val
20 25 30
Val Glu Ile Gly Thr Gly Ser Thr Gly Pro Glu Arg Val Leu Asp Glu
35 40 45
Val Phe Lys Asp Thr Asn Leu Lys Ile Glu Asp Met Ala Asn Ile Ile
50 55 60
Ala Thr Gly Tyr Gly Arg Phe Asn Val Asp Cys Ala Lys Gly Glu Val
65 70 75 80
Ser Glu Ile Thr Cys His Ala Lys Gly Ala Leu Phe Glu Cys Pro Gly
85 90 95
Thr Thr Thr Ile Leu Asp Ile Gly Gly Gln Asp Val Lys Ser Ile Lys
100 105 110
Leu Asn Gly Gln Gly Leu Val Met Gln Phe Ala Met Asn Asp Lys Cys
115 120 125
Ala Ala Gly Thr Gly Arg Phe Leu Asp Val Met Ser Lys Val Leu Glu
130 135 140
Ile Pro Met Ser Glu Met Gly Asp Trp Tyr Phe Lys Ser Lys His Pro
145 150 155 160
Ala Ala Val Ser Ser Thr Cys Thr Val Phe Ala Glu Ser Glu Val Ile
165 170 175
Ser Leu Leu Ser Lys Asn Val Pro Lys Glu Asp Ile Val Ala Gly Val
180 185 190
His Gln Ser Ile Ala Ala Lys Ala Cys Ala Leu Val Arg Arg Val Gly
195 200 205
Val Gly Glu Asp Leu Thr Met Thr Gly Gly Gly Ser Arg Asp Pro Gly
210 215 220
Val Val Asp Ala Val Ser Lys Glu Leu Gly Ile Pro Val Arg Val Ala
225 230 235 240
Leu His Pro Gln Ala Val Gly Ala Leu Gly Ala Ala Leu Ile Ala Tyr
245 250 255
Asp Lys Ile Lys Lys
260
<210> 100
<211> 428
<212> PRT
<213> Megasphaera elsdenii
<400> 100
Met Ser Glu Glu Lys Thr Val Asp Ile Glu Ser Met Ser Ser Lys Glu
1 5 10 15
Ala Leu Gly Tyr Phe Leu Pro Lys Val Asp Glu Asp Ala Arg Lys Ala
20 25 30
Lys Lys Glu Gly Arg Leu Val Cys Trp Ser Ala Ser Val Ala Pro Pro
35 40 45
Glu Phe Cys Thr Ala Met Asp Ile Ala Ile Val Tyr Pro Glu Thr His
50 55 60
Ala Ala Gly Ile Gly Ala Arg His Gly Ala Pro Ala Met Leu Glu Val
65 70 75 80
Ala Glu Asn Lys Gly Tyr Asn Gln Asp Ile Cys Ser Tyr Cys Arg Val
85 90 95
Asn Met Gly Tyr Met Glu Leu Leu Lys Gln Gln Ala Leu Thr Gly Glu
100 105 110
Thr Pro Glu Val Leu Lys Asn Ser Pro Ala Ser Pro Ile Pro Leu Pro
115 120 125
Asp Val Val Leu Thr Cys Asn Asn Ile Cys Asn Thr Leu Leu Lys Trp
130 135 140
Tyr Glu Asn Leu Ala Lys Glu Leu Asn Val Pro Leu Ile Asn Ile Asp
145 150 155 160
Val Pro Phe Asn His Glu Phe Pro Val Thr Lys His Ala Lys Gln Tyr
165 170 175
Ile Val Gly Glu Phe Lys His Ala Ile Lys Gln Leu Glu Asp Leu Cys
180 185 190
Gly Arg Pro Phe Asp Tyr Asp Lys Phe Phe Glu Val Gln Lys Gln Thr
195 200 205
Gln Arg Ser Ile Ala Ala Trp Asn Lys Ile Ala Thr Tyr Phe Gln Tyr
210 215 220
Lys Pro Ser Pro Leu Asn Gly Phe Asp Leu Phe Asn Tyr Met Gly Leu
225 230 235 240
Ala Val Ala Ala Arg Ser Leu Asn Tyr Ser Glu Ile Thr Phe Asn Lys
245 250 255
Phe Leu Lys Glu Leu Asp Glu Lys Val Ala Asn Lys Lys Trp Ala Phe
260 265 270
Gly Glu Asn Glu Lys Ser Arg Val Thr Trp Glu Gly Ile Ala Val Trp
275 280 285
Ile Ala Leu Gly His Thr Phe Lys Glu Leu Lys Gly Gln Gly Ala Leu
290 295 300
Met Thr Gly Ser Ala Tyr Pro Gly Met Trp Asp Val Ser Tyr Glu Pro
305 310 315 320
Gly Asp Leu Glu Ser Met Ala Glu Ala Tyr Ser Arg Thr Tyr Ile Asn
325 330 335
Cys Cys Leu Glu Gln Arg Gly Ala Val Leu Glu Lys Val Val Arg Asp
340 345 350
Gly Lys Cys Asp Gly Leu Ile Met His Gln Asn Arg Ser Cys Lys Asn
355 360 365
Met Ser Leu Leu Asn Asn Glu Gly Gly Gln Arg Ile Gln Lys Asn Leu
370 375 380
Gly Val Pro Tyr Val Ile Phe Asp Gly Asp Gln Thr Asp Ala Arg Asn
385 390 395 400
Phe Ser Glu Ala Gln Phe Asp Thr Arg Val Glu Ala Leu Ala Glu Met
405 410 415
Met Ala Asp Lys Lys Ala Asn Glu Gly Gly Asn His
420 425
<210> 101
<211> 372
<212> PRT
<213> Megasphaera elsdenii
<400> 101
Met Ser Gln Ile Asp Glu Leu Ile Ser Lys Leu Gln Glu Val Ser Asn
1 5 10 15
His Pro Gln Lys Thr Val Leu Asn Tyr Lys Lys Gln Gly Lys Gly Leu
20 25 30
Val Gly Met Met Pro Tyr Tyr Ala Pro Glu Glu Ile Val Tyr Ala Ala
35 40 45
Gly Tyr Leu Pro Val Gly Met Phe Gly Ser Gln Asn Pro Gln Ile Ser
50 55 60
Ala Ala Arg Thr Tyr Leu Pro Pro Phe Ala Cys Ser Leu Met Gln Ala
65 70 75 80
Asp Met Glu Leu Gln Leu Asn Gly Thr Tyr Asp Cys Leu Asp Ala Val
85 90 95
Ile Phe Ser Val Pro Cys Asp Thr Leu Arg Cys Met Ser Gln Lys Trp
100 105 110
His Gly Lys Ala Pro Val Ile Val Phe Thr Gln Pro Gln Asn Arg Lys
115 120 125
Ile Arg Pro Ala Val Asp Phe Leu Lys Ala Glu Tyr Glu His Val Arg
130 135 140
Thr Glu Leu Gly Arg Ile Leu Asn Val Lys Ile Ser Asp Leu Ala Ile
145 150 155 160
Gln Glu Ala Ile Lys Val Tyr Asn Glu Asn Arg Gln Val Met Arg Glu
165 170 175
Phe Cys Asp Val Ala Ala Gln Tyr Pro Gln Ile Phe Thr Pro Ile Lys
180 185 190
Arg His Asp Val Ile Lys Ala Arg Trp Phe Met Asp Lys Ala Glu His
195 200 205
Thr Ala Leu Val Arg Glu Leu Ile Asp Ala Val Lys Lys Glu Pro Val
210 215 220
Gln Pro Trp Asn Gly Lys Lys Val Ile Leu Ser Gly Ile Met Ala Glu
225 230 235 240
Pro Asp Glu Phe Leu Asp Ile Phe Ser Glu Phe Asn Ile Ala Val Val
245 250 255
Ala Asp Asp Leu Ala Gln Glu Ser Arg Gln Phe Arg Thr Asp Val Pro
260 265 270
Ser Gly Ile Asp Pro Leu Glu Gln Leu Ala Gln Gln Trp Gln Asp Phe
275 280 285
Asp Gly Cys Pro Leu Ala Leu Asn Glu Asp Lys Pro Arg Gly Gln Met
290 295 300
Leu Ile Asp Met Thr Lys Lys Tyr Asn Ala Asp Ala Val Val Ile Cys
305 310 315 320
Met Met Arg Phe Cys Asp Pro Glu Glu Phe Asp Tyr Pro Ile Tyr Lys
325 330 335
Pro Glu Phe Glu Ala Ala Gly Val Arg Tyr Thr Val Leu Asp Leu Asp
340 345 350
Ile Glu Ser Pro Ser Leu Glu Gln Leu Arg Thr Arg Ile Gln Ala Phe
355 360 365
Ser Glu Ile Leu
370
<210> 102
<211> 519
<212> PRT
<213> 酿酒酵母
<400> 102
Met Phe Ser Arg Ser Thr Leu Cys Leu Lys Thr Ser Ala Ser Ser Ile
1 5 10 15
Gly Arg Leu Gln Leu Arg Tyr Phe Ser His Leu Pro Met Thr Val Pro
20 25 30
Ile Lys Leu Pro Asn Gly Leu Glu Tyr Glu Gln Pro Thr Gly Leu Phe
35 40 45
Ile Asn Asn Lys Phe Val Pro Ser Lys Gln Asn Lys Thr Phe Glu Val
50 55 60
Ile Asn Pro Ser Thr Glu Glu Glu Ile Cys His Ile Tyr Glu Gly Arg
65 70 75 80
Glu Asp Asp Val Glu Glu Ala Val Gln Ala Ala Asp Arg Ala Phe Ser
85 90 95
Asn Gly Ser Trp Asn Gly Ile Asp Pro Ile Asp Arg Gly Lys Ala Leu
100 105 110
Tyr Arg Leu Ala Glu Leu Ile Glu Gln Asp Lys Asp Val Ile Ala Ser
115 120 125
Ile Glu Thr Leu Asp Asn Gly Lys Ala Ile Ser Ser Ser Arg Gly Asp
130 135 140
Val Asp Leu Val Ile Asn Tyr Leu Lys Ser Ser Ala Gly Phe Ala Asp
145 150 155 160
Lys Ile Asp Gly Arg Met Ile Asp Thr Gly Arg Thr His Phe Ser Tyr
165 170 175
Thr Lys Arg Gln Pro Leu Gly Val Cys Gly Gln Ile Ile Pro Trp Asn
180 185 190
Phe Pro Leu Leu Met Trp Ala Trp Lys Ile Ala Pro Ala Leu Val Thr
195 200 205
Gly Asn Thr Val Val Leu Lys Thr Ala Glu Ser Thr Pro Leu Ser Ala
210 215 220
Leu Tyr Val Ser Lys Tyr Ile Pro Gln Ala Gly Ile Pro Pro Gly Val
225 230 235 240
Ile Asn Ile Val Ser Gly Phe Gly Lys Ile Val Gly Glu Ala Ile Thr
245 250 255
Asn His Pro Lys Ile Lys Lys Val Ala Phe Thr Gly Ser Thr Ala Thr
260 265 270
Gly Arg His Ile Tyr Gln Ser Ala Ala Ala Gly Leu Lys Lys Val Thr
275 280 285
Leu Glu Leu Gly Gly Lys Ser Pro Asn Ile Val Phe Ala Asp Ala Glu
290 295 300
Leu Lys Lys Ala Val Gln Asn Ile Ile Leu Gly Ile Tyr Tyr Asn Ser
305 310 315 320
Gly Glu Val Cys Cys Ala Gly Ser Arg Val Tyr Val Glu Glu Ser Ile
325 330 335
Tyr Asp Lys Phe Ile Glu Glu Phe Lys Ala Ala Ser Glu Ser Ile Lys
340 345 350
Val Gly Asp Pro Phe Asp Glu Ser Thr Phe Gln Gly Ala Gln Thr Ser
355 360 365
Gln Met Gln Leu Asn Lys Ile Leu Lys Tyr Val Asp Ile Gly Lys Asn
370 375 380
Glu Gly Ala Thr Leu Ile Thr Gly Gly Glu Arg Leu Gly Ser Lys Gly
385 390 395 400
Tyr Phe Ile Lys Pro Thr Val Phe Gly Asp Val Lys Glu Asp Met Arg
405 410 415
Ile Val Lys Glu Glu Ile Phe Gly Pro Val Val Thr Val Thr Lys Phe
420 425 430
Lys Ser Ala Asp Glu Val Ile Asn Met Ala Asn Asp Ser Glu Tyr Gly
435 440 445
Leu Ala Ala Gly Ile His Thr Ser Asn Ile Asn Thr Ala Leu Lys Val
450 455 460
Ala Asp Arg Val Asn Ala Gly Thr Val Trp Ile Asn Thr Tyr Asn Asp
465 470 475 480
Phe His His Ala Val Pro Phe Gly Gly Phe Asn Ala Ser Gly Leu Gly
485 490 495
Arg Glu Met Ser Val Asp Ala Leu Gln Asn Tyr Leu Gln Val Lys Ala
500 505 510
Val Arg Ala Lys Leu Asp Glu
515
<210> 103
<211> 495
<212> PRT
<213> 大肠杆菌
<400> 103
Met Asn Phe His His Leu Ala Tyr Trp Gln Asp Lys Ala Leu Ser Leu
1 5 10 15
Ala Ile Glu Asn Arg Leu Phe Ile Asn Gly Glu Tyr Thr Ala Ala Ala
20 25 30
Glu Asn Glu Thr Phe Glu Thr Val Asp Pro Val Thr Gln Ala Pro Leu
35 40 45
Ala Lys Ile Ala Arg Gly Lys Ser Val Asp Ile Asp Arg Ala Met Ser
50 55 60
Ala Ala Arg Gly Val Phe Glu Arg Gly Asp Trp Ser Leu Ser Ser Pro
65 70 75 80
Ala Lys Arg Lys Ala Val Leu Asn Lys Leu Ala Asp Leu Met Glu Ala
85 90 95
His Ala Glu Glu Leu Ala Leu Leu Glu Thr Leu Asp Thr Gly Lys Pro
100 105 110
Ile Arg His Ser Leu Arg Asp Asp Ile Pro Gly Ala Ala Arg Ala Ile
115 120 125
Arg Trp Tyr Ala Glu Ala Ile Asp Lys Val Tyr Gly Glu Val Ala Thr
130 135 140
Thr Ser Ser His Glu Leu Ala Met Ile Val Arg Glu Pro Val Gly Val
145 150 155 160
Ile Ala Ala Ile Val Pro Trp Asn Phe Pro Leu Leu Leu Thr Cys Trp
165 170 175
Lys Leu Gly Pro Ala Leu Ala Ala Gly Asn Ser Val Ile Leu Lys Pro
180 185 190
Ser Glu Lys Ser Pro Leu Ser Ala Ile Arg Leu Ala Gly Leu Ala Lys
195 200 205
Glu Ala Gly Leu Pro Asp Gly Val Leu Asn Val Val Thr Gly Phe Gly
210 215 220
His Glu Ala Gly Gln Ala Leu Ser Arg His Asn Asp Ile Asp Ala Ile
225 230 235 240
Ala Phe Thr Gly Ser Thr Arg Thr Gly Lys Gln Leu Leu Lys Asp Ala
245 250 255
Gly Asp Ser Asn Met Lys Arg Val Trp Leu Glu Ala Gly Gly Lys Ser
260 265 270
Ala Asn Ile Val Phe Ala Asp Cys Pro Asp Leu Gln Gln Ala Ala Ser
275 280 285
Ala Thr Ala Ala Gly Ile Phe Tyr Asn Gln Gly Gln Val Cys Ile Ala
290 295 300
Gly Thr Arg Leu Leu Leu Glu Glu Ser Ile Ala Asp Glu Phe Leu Ala
305 310 315 320
Leu Leu Lys Gln Gln Ala Gln Asn Trp Gln Pro Gly His Pro Leu Asp
325 330 335
Pro Ala Thr Thr Met Gly Thr Leu Ile Asp Cys Ala His Ala Asp Ser
340 345 350
Val His Ser Phe Ile Arg Glu Gly Glu Ser Lys Gly Gln Leu Leu Leu
355 360 365
Asp Gly Arg Asn Ala Gly Leu Ala Ala Ala Ile Gly Pro Thr Ile Phe
370 375 380
Val Asp Val Asp Pro Asn Ala Ser Leu Ser Arg Glu Glu Ile Phe Gly
385 390 395 400
Pro Val Leu Val Val Thr Arg Phe Thr Ser Glu Glu Gln Ala Leu Gln
405 410 415
Leu Ala Asn Asp Ser Gln Tyr Gly Leu Gly Ala Ala Val Trp Thr Arg
420 425 430
Asp Leu Ser Arg Ala His Arg Met Ser Arg Arg Leu Lys Ala Gly Ser
435 440 445
Val Phe Val Asn Asn Tyr Asn Asp Gly Asp Met Thr Val Pro Phe Gly
450 455 460
Gly Tyr Lys Gln Ser Gly Asn Gly Arg Asp Lys Ser Leu His Ala Leu
465 470 475 480
Glu Lys Phe Thr Glu Leu Lys Thr Ile Trp Ile Ser Leu Glu Ala
485 490 495
<210> 104
<211> 495
<212> PRT
<213> 肺炎克雷伯氏菌(Klebsiella pneumoniae)
<400> 104
Met Asn Phe Gln His Leu Ala Tyr Trp Gln Glu Lys Ala Lys Asn Leu
1 5 10 15
Ala Ile Glu Thr Arg Leu Phe Ile Asn Gly Glu Tyr Cys Ala Ala Ala
20 25 30
Asp Asn Thr Thr Phe Glu Thr Ile Asp Pro Ala Ala Gln Gln Thr Leu
35 40 45
Ala Gln Val Ala Arg Gly Lys Lys Ala Asp Val Glu Arg Ala Val Lys
50 55 60
Ala Ala Arg Gln Ala Phe Asp Asn Gly Asp Trp Ser Gln Ala Ser Pro
65 70 75 80
Ala Gln Arg Lys Ala Ile Leu Thr Arg Phe Ala Asp Leu Met Glu Ala
85 90 95
His Arg Glu Glu Leu Ala Leu Leu Glu Thr Leu Asp Thr Gly Lys Pro
100 105 110
Ile Arg His Ser Leu Arg Asp Asp Ile Pro Gly Ala Ala Arg Ala Ile
115 120 125
Arg Trp Tyr Ala Glu Ala Leu Asp Lys Val Tyr Gly Glu Val Ala Pro
130 135 140
Thr Gly Ser Asn Glu Leu Ala Met Ile Val Arg Glu Pro Ile Gly Val
145 150 155 160
Ile Ala Ala Val Val Pro Trp Asn Phe Pro Leu Leu Leu Ala Cys Trp
165 170 175
Lys Leu Gly Pro Ala Leu Ala Ala Gly Asn Ser Val Ile Leu Lys Pro
180 185 190
Ser Glu Lys Ser Pro Leu Thr Ala Leu Arg Leu Ala Gly Leu Ala Lys
195 200 205
Glu Ala Gly Leu Pro Asp Gly Val Leu Asn Val Val Ser Gly Phe Gly
210 215 220
His Glu Ala Gly Gln Ala Leu Ala Leu His Pro Asp Val Glu Val Ile
225 230 235 240
Thr Phe Thr Gly Ser Thr Arg Thr Gly Lys Gln Leu Leu Lys Asp Ala
245 250 255
Gly Asp Ser Asn Met Lys Arg Val Trp Leu Glu Ala Gly Gly Lys Ser
260 265 270
Ala Asn Ile Val Phe Ala Asp Cys Pro Asp Leu Gln Gln Ala Val Arg
275 280 285
Ala Thr Ala Gly Gly Ile Phe Tyr Asn Gln Gly Gln Val Cys Ile Ala
290 295 300
Gly Thr Arg Leu Leu Leu Glu Glu Ser Ile Ala Asp Glu Phe Leu Ala
305 310 315 320
Arg Leu Lys Ala Glu Ala Gln His Trp Gln Pro Gly Asn Pro Leu Asp
325 330 335
Pro Asp Thr Thr Met Gly Met Leu Ile Asp Asn Thr His Ala Asp Asn
340 345 350
Val His Ser Phe Ile Arg Gly Gly Glu Ser Gln Ser Thr Leu Phe Leu
355 360 365
Asp Gly Arg Lys Asn Pro Trp Pro Ala Ala Val Gly Pro Thr Ile Phe
370 375 380
Val Asp Val Asp Pro Ala Ser Thr Leu Ser Arg Glu Glu Ile Phe Gly
385 390 395 400
Pro Val Leu Val Val Thr Arg Phe Lys Ser Glu Glu Glu Ala Leu Lys
405 410 415
Leu Ala Asn Asp Ser Asp Tyr Gly Leu Gly Ala Ala Val Trp Thr Arg
420 425 430
Asp Leu Ser Arg Ala His Arg Met Ser Arg Arg Leu Lys Ala Gly Ser
435 440 445
Val Phe Val Asn Asn Tyr Asn Asp Gly Asp Met Thr Val Pro Phe Gly
450 455 460
Gly Tyr Lys Gln Ser Gly Asn Gly Arg Asp Lys Ser Leu His Ala Leu
465 470 475 480
Glu Lys Phe Thr Glu Leu Lys Thr Ile Trp Ile Ala Leu Glu Ser
485 490 495
<210> 105
<211> 1053
<212> DNA
<213> 东方伊萨酵母
<400> 105
atgtcttacg aaatcccaca aacacaaaag gcctgtgtct tttacgaaaa cggcggccca 60
atcacataca aggacattcc agttccaaag ccaaaaccta ctgagatttt agtcaaggtt 120
ctgtactctg gtgtctgcca caccgacttg cacgcatgga agggtgactg gcctctagct 180
accaagttgc cattggttgg tggtcacgaa ggtgccggtg ttgttgttgc caagggtgaa 240
aacgtcacct cttttgagat tggtgattac gcaggtatca agtggttgaa tggttcatgt 300
atgggttgtg aattctgtga acaaggtgct gaaccaaact gtcctaaggc cgacttgagt 360
ggttacaccc acgacggttc cttccaacag tatgctactg ctgacgctat tcaagctgca 420
cacatctcca aggaaaccga cttggctggt gttgctccaa tcttgtgtgc aggtgtcact 480
gtctacaagg ctttaaagac tgcagacctt agagcaggtg aatgggtttg tatttccggt 540
gcagctggtg gtttaggttc tcttgctatt caatatgcaa aggctatggg tctgagagtt 600
gttggtattg acggtggtga cgaaaagaag gaattgtgta aatcccttgg tgctgaagca 660
tttattgatt tcacaaagac caaggatatc gtcaaggctg tccaagaggc aaccaatggt 720
ggtccacatg gtgtcatcaa tgtctctgtc tctgaagctg caatttctca atcttgtgaa 780
tacgttagac ctctaggtaa ggttgttctt gttggtttac cagcaggcgc acaagtcaaa 840
actggtgtct ttgaagccgt tgtcaagtct attgaaatta agggttctta tgtcggtaac 900
agaaaggata ccgccgaagc acttgacttc tacactagag gcttggtcaa gtctccattc 960
aagattgtcg gtttatccga attgccaaaa gtctttgaac tcatggaaca gggtaagatt 1020
ttaggtagaa tggtcttaga cacctccaaa taa 1053
<210> 106
<211> 350
<212> PRT
<213> 东方伊萨酵母
<400> 106
Met Ser Tyr Glu Ile Pro Gln Thr Gln Lys Ala Cys Val Phe Tyr Glu
1 5 10 15
Asn Gly Gly Pro Ile Thr Tyr Lys Asp Ile Pro Val Pro Lys Pro Lys
20 25 30
Pro Thr Glu Ile Leu Val Lys Val Leu Tyr Ser Gly Val Cys His Thr
35 40 45
Asp Leu His Ala Trp Lys Gly Asp Trp Pro Leu Ala Thr Lys Leu Pro
50 55 60
Leu Val Gly Gly His Glu Gly Ala Gly Val Val Val Ala Lys Gly Glu
65 70 75 80
Asn Val Thr Ser Phe Glu Ile Gly Asp Tyr Ala Gly Ile Lys Trp Leu
85 90 95
Asn Gly Ser Cys Met Gly Cys Glu Phe Cys Glu Gln Gly Ala Glu Pro
100 105 110
Asn Cys Pro Lys Ala Asp Leu Ser Gly Tyr Thr His Asp Gly Ser Phe
115 120 125
Gln Gln Tyr Ala Thr Ala Asp Ala Ile Gln Ala Ala His Ile Ser Lys
130 135 140
Glu Thr Asp Leu Ala Gly Val Ala Pro Ile Leu Cys Ala Gly Val Thr
145 150 155 160
Val Tyr Lys Ala Leu Lys Thr Ala Asp Leu Arg Ala Gly Glu Trp Val
165 170 175
Cys Ile Ser Gly Ala Ala Gly Gly Leu Gly Ser Leu Ala Ile Gln Tyr
180 185 190
Ala Lys Ala Met Gly Leu Arg Val Val Gly Ile Asp Gly Gly Asp Glu
195 200 205
Lys Lys Glu Leu Cys Lys Ser Leu Gly Ala Glu Ala Phe Ile Asp Phe
210 215 220
Thr Lys Thr Lys Asp Ile Val Lys Ala Val Gln Glu Ala Thr Asn Gly
225 230 235 240
Gly Pro His Gly Val Ile Asn Val Ser Val Ser Glu Ala Ala Ile Ser
245 250 255
Gln Ser Cys Glu Tyr Val Arg Pro Leu Gly Lys Val Val Leu Val Gly
260 265 270
Leu Pro Ala Gly Ala Gln Val Lys Thr Gly Val Phe Glu Ala Val Val
275 280 285
Lys Ser Ile Glu Ile Lys Gly Ser Tyr Val Gly Asn Arg Lys Asp Thr
290 295 300
Ala Glu Ala Leu Asp Phe Tyr Thr Arg Gly Leu Val Lys Ser Pro Phe
305 310 315 320
Lys Ile Val Gly Leu Ser Glu Leu Pro Lys Val Phe Glu Leu Met Glu
325 330 335
Gln Gly Lys Ile Leu Gly Arg Met Val Leu Asp Thr Ser Lys
340 345 350
<210> 107
<211> 1131
<212> DNA
<213> 东方伊萨酵母
<400> 107
atgtttgcat caaccttcag aagtcaagct gtaagagctg caagatttac tagattccaa 60
tccacttttg ccattcctga gaagcaaatg ggtgttatct ttgaaactca tggtggtcct 120
ttacaataca aggaaattcc agttccaaaa ccaaaaccaa ctgaaatttt aatcaatgtt 180
aaatactctg gtgtctgcca taccgattta cacgcatgga aaggtgactg gccattacca 240
gcaaagttac ccctagttgg tggtcacgaa ggtgcgggca ttgttgttgc gaaaggttct 300
gcagttacca actttgagat tggcgattat gctggtatta agtggttaaa cggttcatgt 360
atgtcatgtg aattctgtga acaaggtgat gaatctaact gtgaacatgc cgatttgagt 420
ggttatactc atgatggttc tttccaacaa tatgccactg ctgacgctat tcaagctgca 480
aagatcccaa agggtaccga cttatctgaa gttgcgccaa ttttatgtgc tggtgttact 540
gtctataaag ctttgaaaac tgctgattta agagcaggtc aatgggttgc gatttctggt 600
gccgctggtg gtctaggttc tcttgctgtc caatatgcaa aggcaatggg tctaagagtt 660
ttaggtatcg atggtggtga aggtaaaaag gaactttttg aacaatgtgg tggtgatgtg 720
tttatcgatt tcaccagata cccaagagat gcacctgaaa agatggttgc tgatattaag 780
gctgcaacta acggtttggg tccacacggt gttatcaatg tctctgtctc cccagctgct 840
atctctcaat catgtgacta tgttagagca actggtaagg ttgtccttgt cggtatgcca 900
tctggtgctg tctgtaagtc tgatgtcttc actcatgttg ttaaatcctt acaaattaaa 960
ggttcttatg ttggtaacag agcagatacc agagaagctt tggaattctt taatgaaggt 1020
aaggtcagat ctccaatcaa ggttgtccca ttatctactt tacctgaaat ttacgaattg 1080
atggagcaag gtaagatttt aggtagatac gttgttgata cttctaaata a 1131
<210> 108
<211> 376
<212> PRT
<213> 东方伊萨酵母
<400> 108
Met Phe Ala Ser Thr Phe Arg Ser Gln Ala Val Arg Ala Ala Arg Phe
1 5 10 15
Thr Arg Phe Gln Ser Thr Phe Ala Ile Pro Glu Lys Gln Met Gly Val
20 25 30
Ile Phe Glu Thr His Gly Gly Pro Leu Gln Tyr Lys Glu Ile Pro Val
35 40 45
Pro Lys Pro Lys Pro Thr Glu Ile Leu Ile Asn Val Lys Tyr Ser Gly
50 55 60
Val Cys His Thr Asp Leu His Ala Trp Lys Gly Asp Trp Pro Leu Pro
65 70 75 80
Ala Lys Leu Pro Leu Val Gly Gly His Glu Gly Ala Gly Ile Val Val
85 90 95
Ala Lys Gly Ser Ala Val Thr Asn Phe Glu Ile Gly Asp Tyr Ala Gly
100 105 110
Ile Lys Trp Leu Asn Gly Ser Cys Met Ser Cys Glu Phe Cys Glu Gln
115 120 125
Gly Asp Glu Ser Asn Cys Glu His Ala Asp Leu Ser Gly Tyr Thr His
130 135 140
Asp Gly Ser Phe Gln Gln Tyr Ala Thr Ala Asp Ala Ile Gln Ala Ala
145 150 155 160
Lys Ile Pro Lys Gly Thr Asp Leu Ser Glu Val Ala Pro Ile Leu Cys
165 170 175
Ala Gly Val Thr Val Tyr Lys Ala Leu Lys Thr Ala Asp Leu Arg Ala
180 185 190
Gly Gln Trp Val Ala Ile Ser Gly Ala Ala Gly Gly Leu Gly Ser Leu
195 200 205
Ala Val Gln Tyr Ala Lys Ala Met Gly Leu Arg Val Leu Gly Ile Asp
210 215 220
Gly Gly Glu Gly Lys Lys Glu Leu Phe Glu Gln Cys Gly Gly Asp Val
225 230 235 240
Phe Ile Asp Phe Thr Arg Tyr Pro Arg Asp Ala Pro Glu Lys Met Val
245 250 255
Ala Asp Ile Lys Ala Ala Thr Asn Gly Leu Gly Pro His Gly Val Ile
260 265 270
Asn Val Ser Val Ser Pro Ala Ala Ile Ser Gln Ser Cys Asp Tyr Val
275 280 285
Arg Ala Thr Gly Lys Val Val Leu Val Gly Met Pro Ser Gly Ala Val
290 295 300
Cys Lys Ser Asp Val Phe Thr His Val Val Lys Ser Leu Gln Ile Lys
305 310 315 320
Gly Ser Tyr Val Gly Asn Arg Ala Asp Thr Arg Glu Ala Leu Glu Phe
325 330 335
Phe Asn Glu Gly Lys Val Arg Ser Pro Ile Lys Val Val Pro Leu Ser
340 345 350
Thr Leu Pro Glu Ile Tyr Glu Leu Met Glu Gln Gly Lys Ile Leu Gly
355 360 365
Arg Tyr Val Val Asp Thr Ser Lys
370 375
<210> 109
<211> 1134
<212> DNA
<213> 东方伊萨酵母
<400> 109
atgttatcca agaccatcac tgctgcattg aggggcaata caactcgtac tgcattcaga 60
atcaatgcca ttagaagttt agcgatccca gctattccag agacacaaaa gggtgttatc 120
ttttatgaga acggaggtga actattttac aaggacattc cagttccaaa gccaaagcca 180
aatgagattt tggtgaatgt caagtattct ggtgtttgtc ataccgattt acacgcatgg 240
aaaggtgact ggcctttggc gaccaagttg ccattggttg gtggacatga aggtgccgga 300
gttgttgttg ctaaggggga caatgtcacc aactttgaaa ttggcgatta tgccggtatc 360
aagtggttga atggttcatg tatggggtgt gaattttgcc aacaaggtgc agagccaaac 420
tgtccacagg ccgacttgag tggttacacc catgacgggt cctttcaaca atatgccact 480
gccgatgctg ttcaggcagc caagattcct cagggcactg atttggctca agttgcgcca 540
attttatgtg caggtattac tgtctataag gctttaaaga ctgcagaatt aagaccaggt 600
caatgggttg ccatttctgg tgctgctgga ggtttaggtt ctcttgctgt tcaatatgcc 660
aaggccatgg gtttgagagt tttgggtatt gatggtggtg aggagaaggg caagtttgca 720
aagtctcttg gagctgaagt tttcattgat ttcaccaaat ccaaggacat tgtcaaggat 780
atccaagagg ccaccaatgg tggtccacat ggtgtcatta atgtttctgt ttctccagct 840
gctatttctc aaagtaccca gtatgtcaga accttgggta aggttgtcct tgttggatta 900
ccagcgcatg ctgtatgcga gtcttcggtt ttcgaccatg ttgtcaagtc gattcaaatt 960
agaggctctt atgttggtaa cagggaagat actagtgagg ctattgattt tttcaccagg 1020
ggtttagtga agtcaccaat taagattgtt ggtttgagtg agttgccaaa gatctatgaa 1080
ttgatggagc aaggtaagat tttaggcaga tatgttgttg acacttcgaa atga 1134
<210> 110
<211> 377
<212> PRT
<213> 东方伊萨酵母
<400> 110
Met Leu Ser Lys Thr Ile Thr Ala Ala Leu Arg Gly Asn Thr Thr Arg
1 5 10 15
Thr Ala Phe Arg Ile Asn Ala Ile Arg Ser Leu Ala Ile Pro Ala Ile
20 25 30
Pro Glu Thr Gln Lys Gly Val Ile Phe Tyr Glu Asn Gly Gly Glu Leu
35 40 45
Phe Tyr Lys Asp Ile Pro Val Pro Lys Pro Lys Pro Asn Glu Ile Leu
50 55 60
Val Asn Val Lys Tyr Ser Gly Val Cys His Thr Asp Leu His Ala Trp
65 70 75 80
Lys Gly Asp Trp Pro Leu Ala Thr Lys Leu Pro Leu Val Gly Gly His
85 90 95
Glu Gly Ala Gly Val Val Val Ala Lys Gly Asp Asn Val Thr Asn Phe
100 105 110
Glu Ile Gly Asp Tyr Ala Gly Ile Lys Trp Leu Asn Gly Ser Cys Met
115 120 125
Gly Cys Glu Phe Cys Gln Gln Gly Ala Glu Pro Asn Cys Pro Gln Ala
130 135 140
Asp Leu Ser Gly Tyr Thr His Asp Gly Ser Phe Gln Gln Tyr Ala Thr
145 150 155 160
Ala Asp Ala Val Gln Ala Ala Lys Ile Pro Gln Gly Thr Asp Leu Ala
165 170 175
Gln Val Ala Pro Ile Leu Cys Ala Gly Ile Thr Val Tyr Lys Ala Leu
180 185 190
Lys Thr Ala Glu Leu Arg Pro Gly Gln Trp Val Ala Ile Ser Gly Ala
195 200 205
Ala Gly Gly Leu Gly Ser Leu Ala Val Gln Tyr Ala Lys Ala Met Gly
210 215 220
Leu Arg Val Leu Gly Ile Asp Gly Gly Glu Glu Lys Gly Lys Phe Ala
225 230 235 240
Lys Ser Leu Gly Ala Glu Val Phe Ile Asp Phe Thr Lys Ser Lys Asp
245 250 255
Ile Val Lys Asp Ile Gln Glu Ala Thr Asn Gly Gly Pro His Gly Val
260 265 270
Ile Asn Val Ser Val Ser Pro Ala Ala Ile Ser Gln Ser Thr Gln Tyr
275 280 285
Val Arg Thr Leu Gly Lys Val Val Leu Val Gly Leu Pro Ala His Ala
290 295 300
Val Cys Glu Ser Ser Val Phe Asp His Val Val Lys Ser Ile Gln Ile
305 310 315 320
Arg Gly Ser Tyr Val Gly Asn Arg Glu Asp Thr Ser Glu Ala Ile Asp
325 330 335
Phe Phe Thr Arg Gly Leu Val Lys Ser Pro Ile Lys Ile Val Gly Leu
340 345 350
Ser Glu Leu Pro Lys Ile Tyr Glu Leu Met Glu Gln Gly Lys Ile Leu
355 360 365
Gly Arg Tyr Val Val Asp Thr Ser Lys
370 375
<210> 111
<211> 1347
<212> DNA
<213> 东方伊萨酵母
<400> 111
atgtctcctt cacaaattaa cgttgacaac ttatctaatt ggactgaaga attcaaatct 60
gacgccaaga ctcaaatcgg gggttctgta ttgcaacatt ccaacattga tgaggtcttg 120
attaacagag atgcagaaat cgccaacaag catatcttca accacaagat tgaaattgaa 180
ggtctacctg tcatggatca gaaggcttct ggtagatgtt ggttgtttgc atcgactaac 240
ttgatgcgtg ttactgcaat gaagaaatac aatttgaagg aaatcaagct ttccccatcg 300
tatttgtttt tctatgacaa attggaaaga gcaaactatt tccttgaaca aatcatcgac 360
actcataagg aaccaatcga ttcaagattg gttcaatatt tcctgaccaa tccagttgaa 420
gatggtggtc aattcaccat gatggcacaa attgctacca aatacggtgt tgttcctgat 480
caagtctacc cagattcttt caacacaacc acttcgagga ttatgaacag attagtcaac 540
cacagattac gttcttatgc aatgacttta cgtaacgctc tagatgaagg taaagatgta 600
atgtccttga agaatgagat gcaaaaagaa atttatcgtt tgctaacaat gttccttggt 660
aacccaccaa agccaaacga agagtttgtc tgggaattca ccgataaaga tggtaaatat 720
gaatctatta aaactacacc attaaaatat gcaactgaag ttttggattt ccatgctcca 780
gaatatgttt ccttgttaaa tgacccaaga aataagtata acaagatggt tcaagttgaa 840
agattaggta atgttgctgg tggcgaacca gttgcatact taaacttaga aattgaaaag 900
ttatctcaag ctgttgttaa cagaatcaaa aataacaaac cagttttctt tggtaccgat 960
acacctaaat ttatggataa aagtagaggt attatggata tcaatttatg ggactatgag 1020
ttattaggtt atgatgtccg taccatgtca aagaaggaaa gagttgtttt tggtgattct 1080
ttaatgaccc acgctatgtt gattactgca gtgcacgttg atgaaaatgg caaacctgtc 1140
agatacagag tcgaaaacag ttggggtacc aagagtggtc aagaaggtta ttacacaatg 1200
acccaagaat attttgaaga gtacgtttat caagtagtca ttgaaaagag tgaatttgct 1260
gccctaaacc tcgatgtttc cattctggag gataaagaac cagtcgtctt gccaccttat 1320
gaccctatgg gtgcacttgc tttataa 1347
<210> 112
<211> 448
<212> PRT
<213> 东方伊萨酵母
<400> 112
Met Ser Pro Ser Gln Ile Asn Val Asp Asn Leu Ser Asn Trp Thr Glu
1 5 10 15
Glu Phe Lys Ser Asp Ala Lys Thr Gln Ile Gly Gly Ser Val Leu Gln
20 25 30
His Ser Asn Ile Asp Glu Val Leu Ile Asn Arg Asp Ala Glu Ile Ala
35 40 45
Asn Lys His Ile Phe Asn His Lys Ile Glu Ile Glu Gly Leu Pro Val
50 55 60
Met Asp Gln Lys Ala Ser Gly Arg Cys Trp Leu Phe Ala Ser Thr Asn
65 70 75 80
Leu Met Arg Val Thr Ala Met Lys Lys Tyr Asn Leu Lys Glu Ile Lys
85 90 95
Leu Ser Pro Ser Tyr Leu Phe Phe Tyr Asp Lys Leu Glu Arg Ala Asn
100 105 110
Tyr Phe Leu Glu Gln Ile Ile Asp Thr His Lys Glu Pro Ile Asp Ser
115 120 125
Arg Leu Val Gln Tyr Phe Leu Thr Asn Pro Val Glu Asp Gly Gly Gln
130 135 140
Phe Thr Met Met Ala Gln Ile Ala Thr Lys Tyr Gly Val Val Pro Asp
145 150 155 160
Gln Val Tyr Pro Asp Ser Phe Asn Thr Thr Thr Ser Arg Ile Met Asn
165 170 175
Arg Leu Val Asn His Arg Leu Arg Ser Tyr Ala Met Thr Leu Arg Asn
180 185 190
Ala Leu Asp Glu Gly Lys Asp Val Met Ser Leu Lys Asn Glu Met Gln
195 200 205
Lys Glu Ile Tyr Arg Leu Leu Thr Met Phe Leu Gly Asn Pro Pro Lys
210 215 220
Pro Asn Glu Glu Phe Val Trp Glu Phe Thr Asp Lys Asp Gly Lys Tyr
225 230 235 240
Glu Ser Ile Lys Thr Thr Pro Leu Lys Tyr Ala Thr Glu Val Leu Asp
245 250 255
Phe His Ala Pro Glu Tyr Val Ser Leu Leu Asn Asp Pro Arg Asn Lys
260 265 270
Tyr Asn Lys Met Val Gln Val Glu Arg Leu Gly Asn Val Ala Gly Gly
275 280 285
Glu Pro Val Ala Tyr Leu Asn Leu Glu Ile Glu Lys Leu Ser Gln Ala
290 295 300
Val Val Asn Arg Ile Lys Asn Asn Lys Pro Val Phe Phe Gly Thr Asp
305 310 315 320
Thr Pro Lys Phe Met Asp Lys Ser Arg Gly Ile Met Asp Ile Asn Leu
325 330 335
Trp Asp Tyr Glu Leu Leu Gly Tyr Asp Val Arg Thr Met Ser Lys Lys
340 345 350
Glu Arg Val Val Phe Gly Asp Ser Leu Met Thr His Ala Met Leu Ile
355 360 365
Thr Ala Val His Val Asp Glu Asn Gly Lys Pro Val Arg Tyr Arg Val
370 375 380
Glu Asn Ser Trp Gly Thr Lys Ser Gly Gln Glu Gly Tyr Tyr Thr Met
385 390 395 400
Thr Gln Glu Tyr Phe Glu Glu Tyr Val Tyr Gln Val Val Ile Glu Lys
405 410 415
Ser Glu Phe Ala Ala Leu Asn Leu Asp Val Ser Ile Leu Glu Asp Lys
420 425 430
Glu Pro Val Val Leu Pro Pro Tyr Asp Pro Met Gly Ala Leu Ala Leu
435 440 445
<210> 113
<211> 1737
<212> DNA
<213> 东方伊萨酵母
<400> 113
atgttactca gatcactaaa ctcttctgct cgttgtgtca aacaaacaac cagaacaaag 60
gttaggtatc tcagccacgt cagtggtgca agcatggcga aacctacatt gaagaacaac 120
tcgagagaat ccaacaaatc cagaaactat ctaattgctg ctgtgacagc attggctgta 180
tcaacctcaa ttggagttgc cgtacatgtg aaggacccct tgtataacga tgctaccggc 240
agtgattctc cgagaagtat atctgttgac gagtttgtca agcataattc acaaaacgac 300
tgttggattg caatcaatgg caaggtttat gatttcactg attttattcc aaaccatcca 360
ggtggggtac ctccattagt taatcatgct ggttatgatg gtactaaact ttatgagaaa 420
ttgcatccaa aaggtacaat tgagaaattc ttgccaaagg ataagtttct gggtgtgtta 480
gatggtgaag cgccaaaatt ggaagcagac tatttggtgg acgatgatga acaagagaga 540
ctggattatt tgaacaactt acctcctttg tcatctattc agaatgttta tgatttcgaa 600
tacttggcca agaagatttt acctaaagat gcctgggcat attattcttg tggtgccgat 660
gatgaaatca caatgagaga aaaccattat gcttatcaaa gagtttattt cagaccaaga 720
atttgtgttg atgtcaagga agttgatact tcttatgaaa tgttaggcac taaaacctct 780
gttccttttt atgtatctgc caccgctttg gctaaattag gccatcctga tggtgaatgc 840
tcaattgcta gaggcgctgg taaggaaggt gtcgttcaaa tgatttcgac cctttcctca 900
atgtcattag atgaaattgc cgctgctaga attccaggtg caacccaatg gttccaatta 960
tacattaatg aggatagaaa tgtcgctaaa ggtctggtca aacatgcaga agacttgggt 1020
atgaaggcta tctttataac tgttgatgct ccttctctag gtaacagaga aaaggataaa 1080
agattaaagt ttgttaatga caccgatgtc gatttgggtg attccgcaga tcgaaacagt 1140
ggtgcttcaa aggcactatc ttcgttcatt gatgcttctg tctcttggaa tgacgtcaaa 1200
gcggtcaagt cgtggactaa attgcctgtc ttagttaaag gtgttcaaac agttgaagac 1260
gttattgaag cttacgatgc tggttgtcaa ggtgttgttt tgtcaaacca cggtggtagg 1320
caactagata ctgctcctcc tccaatcgaa ttattagctg aaactgttcc aactttgaag 1380
agattgggta aattaagacc agattttgaa attttaattg acggtggtgt caaaagaggt 1440
accgatattt tgaaagcagt cgcaatcggt ggccaagatg tcagagtttc agttggtatg 1500
ggtagacctt tcttatatgc caactcttgc tatggtgaag caggtgttag aaaattaatt 1560
caaaatctaa aggatgaatt agaaatggat atgagattgt tgggtgtcac taaaatggac 1620
cagctatctt cgaaacatgt cgatactaaa cgtttgattg gtagagatgc gatcaactat 1680
ttgtatgata atgtatacag cccaatcgaa accgttaaat tcaacaatga agattga 1737
<210> 114
<211> 578
<212> PRT
<213> 东方伊萨酵母
<400> 114
Met Leu Leu Arg Ser Leu Asn Ser Ser Ala Arg Cys Val Lys Gln Thr
1 5 10 15
Thr Arg Thr Lys Val Arg Tyr Leu Ser His Val Ser Gly Ala Ser Met
20 25 30
Ala Lys Pro Thr Leu Lys Asn Asn Ser Arg Glu Ser Asn Lys Ser Arg
35 40 45
Asn Tyr Leu Ile Ala Ala Val Thr Ala Leu Ala Val Ser Thr Ser Ile
50 55 60
Gly Val Ala Val His Val Lys Asp Pro Leu Tyr Asn Asp Ala Thr Gly
65 70 75 80
Ser Asp Ser Pro Arg Ser Ile Ser Val Asp Glu Phe Val Lys His Asn
85 90 95
Ser Gln Asn Asp Cys Trp Ile Ala Ile Asn Gly Lys Val Tyr Asp Phe
100 105 110
Thr Asp Phe Ile Pro Asn His Pro Gly Gly Val Pro Pro Leu Val Asn
115 120 125
His Ala Gly Tyr Asp Gly Thr Lys Leu Tyr Glu Lys Leu His Pro Lys
130 135 140
Gly Thr Ile Glu Lys Phe Leu Pro Lys Asp Lys Phe Leu Gly Val Leu
145 150 155 160
Asp Gly Glu Ala Pro Lys Leu Glu Ala Asp Tyr Leu Val Asp Asp Asp
165 170 175
Glu Gln Glu Arg Leu Asp Tyr Leu Asn Asn Leu Pro Pro Leu Ser Ser
180 185 190
Ile Gln Asn Val Tyr Asp Phe Glu Tyr Leu Ala Lys Lys Ile Leu Pro
195 200 205
Lys Asp Ala Trp Ala Tyr Tyr Ser Cys Gly Ala Asp Asp Glu Ile Thr
210 215 220
Met Arg Glu Asn His Tyr Ala Tyr Gln Arg Val Tyr Phe Arg Pro Arg
225 230 235 240
Ile Cys Val Asp Val Lys Glu Val Asp Thr Ser Tyr Glu Met Leu Gly
245 250 255
Thr Lys Thr Ser Val Pro Phe Tyr Val Ser Ala Thr Ala Leu Ala Lys
260 265 270
Leu Gly His Pro Asp Gly Glu Cys Ser Ile Ala Arg Gly Ala Gly Lys
275 280 285
Glu Gly Val Val Gln Met Ile Ser Thr Leu Ser Ser Met Ser Leu Asp
290 295 300
Glu Ile Ala Ala Ala Arg Ile Pro Gly Ala Thr Gln Trp Phe Gln Leu
305 310 315 320
Tyr Ile Asn Glu Asp Arg Asn Val Ala Lys Gly Leu Val Lys His Ala
325 330 335
Glu Asp Leu Gly Met Lys Ala Ile Phe Ile Thr Val Asp Ala Pro Ser
340 345 350
Leu Gly Asn Arg Glu Lys Asp Lys Arg Leu Lys Phe Val Asn Asp Thr
355 360 365
Asp Val Asp Leu Gly Asp Ser Ala Asp Arg Asn Ser Gly Ala Ser Lys
370 375 380
Ala Leu Ser Ser Phe Ile Asp Ala Ser Val Ser Trp Asn Asp Val Lys
385 390 395 400
Ala Val Lys Ser Trp Thr Lys Leu Pro Val Leu Val Lys Gly Val Gln
405 410 415
Thr Val Glu Asp Val Ile Glu Ala Tyr Asp Ala Gly Cys Gln Gly Val
420 425 430
Val Leu Ser Asn His Gly Gly Arg Gln Leu Asp Thr Ala Pro Pro Pro
435 440 445
Ile Glu Leu Leu Ala Glu Thr Val Pro Thr Leu Lys Arg Leu Gly Lys
450 455 460
Leu Arg Pro Asp Phe Glu Ile Leu Ile Asp Gly Gly Val Lys Arg Gly
465 470 475 480
Thr Asp Ile Leu Lys Ala Val Ala Ile Gly Gly Gln Asp Val Arg Val
485 490 495
Ser Val Gly Met Gly Arg Pro Phe Leu Tyr Ala Asn Ser Cys Tyr Gly
500 505 510
Glu Ala Gly Val Arg Lys Leu Ile Gln Asn Leu Lys Asp Glu Leu Glu
515 520 525
Met Asp Met Arg Leu Leu Gly Val Thr Lys Met Asp Gln Leu Ser Ser
530 535 540
Lys His Val Asp Thr Lys Arg Leu Ile Gly Arg Asp Ala Ile Asn Tyr
545 550 555 560
Leu Tyr Asp Asn Val Tyr Ser Pro Ile Glu Thr Val Lys Phe Asn Asn
565 570 575
Glu Asp
<210> 115
<211> 1698
<212> DNA
<213> 东方伊萨酵母
<220>
<221> misc_feature
<222> (941)..(941)
<223> N= A, C, T, 或 G
<220>
<221> misc_feature
<222> (943)..(943)
<223> N= A, C, T, 或 G
<400> 115
atgttaagat cccagttcaa aaacattttg aaaaatgtta acaagaacca ttctctaagg 60
agaactttta cttccagcac ctcaaaggct ggaaaaaatg cttcatacaa tgccaagatt 120
atatctgcaa ccgtggcctc gattgttgca gcagctggct cttatatgtt ggtccagcct 180
tcactagcta atgatgaggc acagtctgct aatccaacta ggaagatctc tgttgacgaa 240
tttgttaaac acaaccatgc cgatgattgt tggatcactg ttaacggtaa cgtctatgac 300
ttgactgatt tcatttcaat gcatccaggt ggtactaccc cattgattca aaatgcaggt 360
cacgacgcaa ctgaaattta caacaagatt catccaaagg gtacaatcga gaacttctta 420
ccaaaggaaa agcaattggg tgttttggat ggtgaagctc ctaaaatcga agttgtgctt 480
gacgaaaagg agaaacacag attggagttg ttgaatcatc tccctgctct ttccagaatt 540
caaaacattt atgatttcga acatattgct tctagagttt tgagcgacca agcatggaac 600
tactattcat gtggtgccga agatgaaatc accttgaggg aaaatcatta tgcttaccaa 660
agaatctact ttaagccaaa atgttgtgtc aatgttgcag aagttgatac ctctcatgaa 720
attttaggta caaaagcttc tgttcctttc tacgtttccg cagccgcttc tgcaaagttg 780
gggcacgagg atggtgaatg ttccattgct agaggtgcag gtaaggaagg cgttattcaa 840
atgatttctt ccttctcttc caactctttg gaggaaattg cagaatccag aattcctggt 900
gcaacacaat ggtttcaatt atacgttaat gaagacaagg ntnttgtgaa gaagacttta 960
aaaagggccg aaaacttggg tatgaaggcc atctttgtca ctgtggacgc tgctagtaga 1020
ggtaatagag aaaaagacat tacaatgaga attaccgaag atacagatga gttaatagac 1080
gattcttctg ttagagctgg ttctacctct ggtgcattgc cagctttcat tgacaagagg 1140
ctgacttggg atgaagttaa ggatatcatt tcatggacca agttaccagt tttgctgaag 1200
ggtgttcaaa gaactgatga tattgagaag gcaattgata ttggttgtaa gggtgttgtc 1260
ttgtccaatc atggtggtag acaattagat acttctcctc ctccaataga agttatggct 1320
gaatctgttc caatcctaaa gcaaaagggt aaactggatc caaatttcag tattttcgtt 1380
gatggtggtg ttagaagagg tacagatatt ttgaaagctt tggctattgg tggcagagac 1440
tgtaaagttg ctgttggtct gggtagacct ttcctttatg caaatactgg ttatggtgaa 1500
aagggtgtca gaaaggccgt gcaaattcta agagaagaat taaaggctga catgagaatg 1560
ttgggcgtta cctctttgaa cgagctagac gactcttaca ttgacaccag aagattacta 1620
ggtagagatg ctgttaacca catatacaac aacaactact acccaatgtc taagattcaa 1680
ttcaaaaacg aaaaataa 1698
<210> 116
<211> 565
<212> PRT
<213> 东方伊萨酵母
<220>
<221> MISC_FEATURE
<222> (314)..(314)
<223> Xaa = Asp, Gly, Ala, 或 Val
<220>
<221> MISC_FEATURE
<222> (315)..(315)
<223> Xaa = Ile, Val, Leu, 或 Phe
<400> 116
Met Leu Arg Ser Gln Phe Lys Asn Ile Leu Lys Asn Val Asn Lys Asn
1 5 10 15
His Ser Leu Arg Arg Thr Phe Thr Ser Ser Thr Ser Lys Ala Gly Lys
20 25 30
Asn Ala Ser Tyr Asn Ala Lys Ile Ile Ser Ala Thr Val Ala Ser Ile
35 40 45
Val Ala Ala Ala Gly Ser Tyr Met Leu Val Gln Pro Ser Leu Ala Asn
50 55 60
Asp Glu Ala Gln Ser Ala Asn Pro Thr Arg Lys Ile Ser Val Asp Glu
65 70 75 80
Phe Val Lys His Asn His Ala Asp Asp Cys Trp Ile Thr Val Asn Gly
85 90 95
Asn Val Tyr Asp Leu Thr Asp Phe Ile Ser Met His Pro Gly Gly Thr
100 105 110
Thr Pro Leu Ile Gln Asn Ala Gly His Asp Ala Thr Glu Ile Tyr Asn
115 120 125
Lys Ile His Pro Lys Gly Thr Ile Glu Asn Phe Leu Pro Lys Glu Lys
130 135 140
Gln Leu Gly Val Leu Asp Gly Glu Ala Pro Lys Ile Glu Val Val Leu
145 150 155 160
Asp Glu Lys Glu Lys His Arg Leu Glu Leu Leu Asn His Leu Pro Ala
165 170 175
Leu Ser Arg Ile Gln Asn Ile Tyr Asp Phe Glu His Ile Ala Ser Arg
180 185 190
Val Leu Ser Asp Gln Ala Trp Asn Tyr Tyr Ser Cys Gly Ala Glu Asp
195 200 205
Glu Ile Thr Leu Arg Glu Asn His Tyr Ala Tyr Gln Arg Ile Tyr Phe
210 215 220
Lys Pro Lys Cys Cys Val Asn Val Ala Glu Val Asp Thr Ser His Glu
225 230 235 240
Ile Leu Gly Thr Lys Ala Ser Val Pro Phe Tyr Val Ser Ala Ala Ala
245 250 255
Ser Ala Lys Leu Gly His Glu Asp Gly Glu Cys Ser Ile Ala Arg Gly
260 265 270
Ala Gly Lys Glu Gly Val Ile Gln Met Ile Ser Ser Phe Ser Ser Asn
275 280 285
Ser Leu Glu Glu Ile Ala Glu Ser Arg Ile Pro Gly Ala Thr Gln Trp
290 295 300
Phe Gln Leu Tyr Val Asn Glu Asp Lys Xaa Xaa Val Lys Lys Thr Leu
305 310 315 320
Lys Arg Ala Glu Asn Leu Gly Met Lys Ala Ile Phe Val Thr Val Asp
325 330 335
Ala Ala Ser Arg Gly Asn Arg Glu Lys Asp Ile Thr Met Arg Ile Thr
340 345 350
Glu Asp Thr Asp Glu Leu Ile Asp Asp Ser Ser Val Arg Ala Gly Ser
355 360 365
Thr Ser Gly Ala Leu Pro Ala Phe Ile Asp Lys Arg Leu Thr Trp Asp
370 375 380
Glu Val Lys Asp Ile Ile Ser Trp Thr Lys Leu Pro Val Leu Leu Lys
385 390 395 400
Gly Val Gln Arg Thr Asp Asp Ile Glu Lys Ala Ile Asp Ile Gly Cys
405 410 415
Lys Gly Val Val Leu Ser Asn His Gly Gly Arg Gln Leu Asp Thr Ser
420 425 430
Pro Pro Pro Ile Glu Val Met Ala Glu Ser Val Pro Ile Leu Lys Gln
435 440 445
Lys Gly Lys Leu Asp Pro Asn Phe Ser Ile Phe Val Asp Gly Gly Val
450 455 460
Arg Arg Gly Thr Asp Ile Leu Lys Ala Leu Ala Ile Gly Gly Arg Asp
465 470 475 480
Cys Lys Val Ala Val Gly Leu Gly Arg Pro Phe Leu Tyr Ala Asn Thr
485 490 495
Gly Tyr Gly Glu Lys Gly Val Arg Lys Ala Val Gln Ile Leu Arg Glu
500 505 510
Glu Leu Lys Ala Asp Met Arg Met Leu Gly Val Thr Ser Leu Asn Glu
515 520 525
Leu Asp Asp Ser Tyr Ile Asp Thr Arg Arg Leu Leu Gly Arg Asp Ala
530 535 540
Val Asn His Ile Tyr Asn Asn Asn Tyr Tyr Pro Met Ser Lys Ile Gln
545 550 555 560
Phe Lys Asn Glu Lys
565
<210> 117
<211> 1167
<212> DNA
<213> 东方伊萨酵母
<400> 117
atggtgtccc ctgctgaaag attatctact attgcgtcca caatcaagcc aaacagaaaa 60
gattctacat cattacaacc agaagactat ccggaacatc cgttcaaggt gacggttgtt 120
ggttccggta actgggggtg tacaattgcc aaggttatag cggaaaacac cgttgagaga 180
cctcgtcaat ttcaaagaga tgttaatatg tgggtctatg aagaattgat tgaaggcgaa 240
aagttgactg aaatcataaa taccaaacac gaaaacgtca agtacttgcc aggtatcaag 300
ttgccagtta acgttgttgc agttccagac attgttgagg cttgtgcagg ctcagacttg 360
attgtcttta atattcctca ccaattttta ccaagaattt tatcccaatt aaagggtaag 420
gtgaatccaa aggctagagc aatttcttgt ttgaaaggtt tggatgtcaa tcctaatgga 480
tgtaagttgc tctccactgt tattactgaa gagttgggta tttattgtgg tgccttatca 540
ggtgctaatt tagctcctga agttgcacaa tgtaaatggt cggaaacaac tgttgcatat 600
acaattccgg acgatttcag aggtaaaggc aaggatattg accatcaaat tctaaagagt 660
ttgttccata gaccttattt ccatgttcgt gttattagtg atgttgcagg tatttccatt 720
gccggtgcac tcaagaatgt cgttgctatg gctgctggat ttgtcgaagg tttaggttgg 780
ggtgataatg caaaggctgc agtcatgaga ataggtttgg tggaaaccat tcaatttgcc 840
aagacttttt tcgatggctg tcatgctgca acctttactc atgaatctgc aggtgttgcc 900
gacctaatca ctacctgtgc cggcggccgt aacgttagag ttggtagata tatggcacaa 960
cattctgtct ctgcaacgga ggctgaagaa aagttgttga atggccaatc ctgtcaaggt 1020
atccacacaa ctagggaagt ttacgagttc ctctccaaca tgggcaggac agatgagttc 1080
ccactattta ccaccaccta ccgtatcatc tacgaaaact tcccaattga gaagctgcca 1140
gaatgccttg aacctgtgga agattaa 1167
<210> 118
<211> 388
<212> PRT
<213> 东方伊萨酵母
<400> 118
Met Val Ser Pro Ala Glu Arg Leu Ser Thr Ile Ala Ser Thr Ile Lys
1 5 10 15
Pro Asn Arg Lys Asp Ser Thr Ser Leu Gln Pro Glu Asp Tyr Pro Glu
20 25 30
His Pro Phe Lys Val Thr Val Val Gly Ser Gly Asn Trp Gly Cys Thr
35 40 45
Ile Ala Lys Val Ile Ala Glu Asn Thr Val Glu Arg Pro Arg Gln Phe
50 55 60
Gln Arg Asp Val Asn Met Trp Val Tyr Glu Glu Leu Ile Glu Gly Glu
65 70 75 80
Lys Leu Thr Glu Ile Ile Asn Thr Lys His Glu Asn Val Lys Tyr Leu
85 90 95
Pro Gly Ile Lys Leu Pro Val Asn Val Val Ala Val Pro Asp Ile Val
100 105 110
Glu Ala Cys Ala Gly Ser Asp Leu Ile Val Phe Asn Ile Pro His Gln
115 120 125
Phe Leu Pro Arg Ile Leu Ser Gln Leu Lys Gly Lys Val Asn Pro Lys
130 135 140
Ala Arg Ala Ile Ser Cys Leu Lys Gly Leu Asp Val Asn Pro Asn Gly
145 150 155 160
Cys Lys Leu Leu Ser Thr Val Ile Thr Glu Glu Leu Gly Ile Tyr Cys
165 170 175
Gly Ala Leu Ser Gly Ala Asn Leu Ala Pro Glu Val Ala Gln Cys Lys
180 185 190
Trp Ser Glu Thr Thr Val Ala Tyr Thr Ile Pro Asp Asp Phe Arg Gly
195 200 205
Lys Gly Lys Asp Ile Asp His Gln Ile Leu Lys Ser Leu Phe His Arg
210 215 220
Pro Tyr Phe His Val Arg Val Ile Ser Asp Val Ala Gly Ile Ser Ile
225 230 235 240
Ala Gly Ala Leu Lys Asn Val Val Ala Met Ala Ala Gly Phe Val Glu
245 250 255
Gly Leu Gly Trp Gly Asp Asn Ala Lys Ala Ala Val Met Arg Ile Gly
260 265 270
Leu Val Glu Thr Ile Gln Phe Ala Lys Thr Phe Phe Asp Gly Cys His
275 280 285
Ala Ala Thr Phe Thr His Glu Ser Ala Gly Val Ala Asp Leu Ile Thr
290 295 300
Thr Cys Ala Gly Gly Arg Asn Val Arg Val Gly Arg Tyr Met Ala Gln
305 310 315 320
His Ser Val Ser Ala Thr Glu Ala Glu Glu Lys Leu Leu Asn Gly Gln
325 330 335
Ser Cys Gln Gly Ile His Thr Thr Arg Glu Val Tyr Glu Phe Leu Ser
340 345 350
Asn Met Gly Arg Thr Asp Glu Phe Pro Leu Phe Thr Thr Thr Tyr Arg
355 360 365
Ile Ile Tyr Glu Asn Phe Pro Ile Glu Lys Leu Pro Glu Cys Leu Glu
370 375 380
Pro Val Glu Asp
385
<210> 119
<211> 1566
<212> DNA
<213> 东方伊萨酵母
<400> 119
atgttgtccc tctctaaaca gtcaagaaac tttttcaaat tgaactattt ttcagtcacc 60
caaatagcaa aaatgtctgc aacttccgtc actttcccaa ttatcaacga aacttaccaa 120
cagccaaccg ggcttttcat caacaatgaa tttgttagtg caaagtcagg taagactttt 180
gatgttaaca ccccaattga tgagtctctc atttgtaaag tccaacaggc cgatgctgaa 240
gatgttgaaa ttgccgttca agcagcatct aaagcttaca agacttggag atttacaccg 300
ccaaatgaaa gaggcagata cttgaacaaa ttggccgatt tgatggacga aaagagagac 360
ttacttgcca aaattgaatc ccttgataat ggtaaggcct tacattgtgc aaaattcgat 420
gtcaatcttg tcattgaata tttcagatac tgtgcaggtt actgtgataa aatcgatggt 480
agaacaatta caaccgatgt agaacatttt acctacacta gaaaggaacc tttaggtgtc 540
tgtggtgcaa ttacaccttg gaacttccca ttgctgatgt ttgcttggaa aatcggcccg 600
gctttagcaa ccggtaatac cattatcttg aagcctgcca gtgcaacacc tctatcaaac 660
ctctttactt gtaccttgat caaggaggcg ggcattccag ccggtgttgt taatgttgtt 720
ccaggttccg gtagaggctg tggtaactcc attttacaac atcctaaaat taagaaggtt 780
gcgtttaccg gatctacaga agttggtaaa actgttatga aggaatgtgc taattccatc 840
aaaaaggtta ctctcgaatt gggtggtaag tctccaaaca ttgttttcaa agactgtaac 900
gttgaacaaa ccattcaaaa tttgattact ggtattttct tcaatggtgg tgaagtctgt 960
tgtgctggtt ctagaattta cattgaagca accgatgaga aatggtatac tgaattcttg 1020
accaaattca aggagactgt tgaaaaatta aagattggta acccatttga agagggtgtt 1080
ttccaaggtg cacaaaccac tccagatcaa ttccaaactg tcttggacta catcaccgct 1140
gctaacgaat ccagcttgaa actattaact ggtggtaaaa gaattggcaa taagggatac 1200
tttgttgagc caactatctt ctacgatgtt cctcaaaatt ccaagttaac tcaagaagaa 1260
atctttggtc cagttgctgt tgttttacct ttcaagtcca ctgaagaatt gattgaaaag 1320
gcaaatgatt ccgattttgg cttaggttcc ggtattcaca ctgaagattt caacaaggca 1380
atttgggttt ccgaaaggct tgaagcaggt tctgtttgga tcaacactta caatgatttc 1440
cacccagctg ctccattcgg tggttacaag gaatccggta ttggcagaga aatgggtatt 1500
gaagctttcg acaactatac tcaaaccaag ttagttagag ctagagttaa caagccagct 1560
ttttag 1566
<210> 120
<211> 521
<212> PRT
<213> 东方伊萨酵母
<400> 120
Met Leu Ser Leu Ser Lys Gln Ser Arg Asn Phe Phe Lys Leu Asn Tyr
1 5 10 15
Phe Ser Val Thr Gln Ile Ala Lys Met Ser Ala Thr Ser Val Thr Phe
20 25 30
Pro Ile Ile Asn Glu Thr Tyr Gln Gln Pro Thr Gly Leu Phe Ile Asn
35 40 45
Asn Glu Phe Val Ser Ala Lys Ser Gly Lys Thr Phe Asp Val Asn Thr
50 55 60
Pro Ile Asp Glu Ser Leu Ile Cys Lys Val Gln Gln Ala Asp Ala Glu
65 70 75 80
Asp Val Glu Ile Ala Val Gln Ala Ala Ser Lys Ala Tyr Lys Thr Trp
85 90 95
Arg Phe Thr Pro Pro Asn Glu Arg Gly Arg Tyr Leu Asn Lys Leu Ala
100 105 110
Asp Leu Met Asp Glu Lys Arg Asp Leu Leu Ala Lys Ile Glu Ser Leu
115 120 125
Asp Asn Gly Lys Ala Leu His Cys Ala Lys Phe Asp Val Asn Leu Val
130 135 140
Ile Glu Tyr Phe Arg Tyr Cys Ala Gly Tyr Cys Asp Lys Ile Asp Gly
145 150 155 160
Arg Thr Ile Thr Thr Asp Val Glu His Phe Thr Tyr Thr Arg Lys Glu
165 170 175
Pro Leu Gly Val Cys Gly Ala Ile Thr Pro Trp Asn Phe Pro Leu Leu
180 185 190
Met Phe Ala Trp Lys Ile Gly Pro Ala Leu Ala Thr Gly Asn Thr Ile
195 200 205
Ile Leu Lys Pro Ala Ser Ala Thr Pro Leu Ser Asn Leu Phe Thr Cys
210 215 220
Thr Leu Ile Lys Glu Ala Gly Ile Pro Ala Gly Val Val Asn Val Val
225 230 235 240
Pro Gly Ser Gly Arg Gly Cys Gly Asn Ser Ile Leu Gln His Pro Lys
245 250 255
Ile Lys Lys Val Ala Phe Thr Gly Ser Thr Glu Val Gly Lys Thr Val
260 265 270
Met Lys Glu Cys Ala Asn Ser Ile Lys Lys Val Thr Leu Glu Leu Gly
275 280 285
Gly Lys Ser Pro Asn Ile Val Phe Lys Asp Cys Asn Val Glu Gln Thr
290 295 300
Ile Gln Asn Leu Ile Thr Gly Ile Phe Phe Asn Gly Gly Glu Val Cys
305 310 315 320
Cys Ala Gly Ser Arg Ile Tyr Ile Glu Ala Thr Asp Glu Lys Trp Tyr
325 330 335
Thr Glu Phe Leu Thr Lys Phe Lys Glu Thr Val Glu Lys Leu Lys Ile
340 345 350
Gly Asn Pro Phe Glu Glu Gly Val Phe Gln Gly Ala Gln Thr Thr Pro
355 360 365
Asp Gln Phe Gln Thr Val Leu Asp Tyr Ile Thr Ala Ala Asn Glu Ser
370 375 380
Ser Leu Lys Leu Leu Thr Gly Gly Lys Arg Ile Gly Asn Lys Gly Tyr
385 390 395 400
Phe Val Glu Pro Thr Ile Phe Tyr Asp Val Pro Gln Asn Ser Lys Leu
405 410 415
Thr Gln Glu Glu Ile Phe Gly Pro Val Ala Val Val Leu Pro Phe Lys
420 425 430
Ser Thr Glu Glu Leu Ile Glu Lys Ala Asn Asp Ser Asp Phe Gly Leu
435 440 445
Gly Ser Gly Ile His Thr Glu Asp Phe Asn Lys Ala Ile Trp Val Ser
450 455 460
Glu Arg Leu Glu Ala Gly Ser Val Trp Ile Asn Thr Tyr Asn Asp Phe
465 470 475 480
His Pro Ala Ala Pro Phe Gly Gly Tyr Lys Glu Ser Gly Ile Gly Arg
485 490 495
Glu Met Gly Ile Glu Ala Phe Asp Asn Tyr Thr Gln Thr Lys Leu Val
500 505 510
Arg Ala Arg Val Asn Lys Pro Ala Phe
515 520
<210> 121
<211> 1506
<212> DNA
<213> 东方伊萨酵母
<400> 121
atgtcagcac tgttcagaac cattgagact ccaaacggta aaaccctgga acaaccactg 60
ggtctcttca tcgacaatga gtgggtgaaa acaaaccgta cttttgagac cattaatccg 120
tccacaggtg aggcgatctg tcatgtttac cgtgctgggg tccaggaggt gaacgacgct 180
gtcgaagctg caaatagagc atttagaaac gaatcttggt caggtctaac tggttctcaa 240
cgtggcgatt tactgtatcg catgtaccaa gttatcaaaa gagacgccga gagcattgca 300
tcgattgagt ccatggataa tggtaaaccg tatgctgcag aatgcctaga tggagattta 360
ggtgaagctg ctgacgtttt caaatattat gccggttggg ccgacaagat caccggtgaa 420
ctcattggct cgagtgtatt gggtaagaat aagatgtgtt atgtcgagcc tacaccactg 480
ggtgccgttg gcggtatagt cccttggaat ttcccgttta ccatgatggc atggaaaatt 540
gccccggcac tggcgacggg ttgtacagtg gttatgaagt caagtgaagt cacaccgttg 600
acggcattat ggtatggcaa gattgcactt gaagtgggtc tacctaaagg tgtacttaac 660
atcctctccg gttttggatc ggatgttgga tcggccatgg cttcacatcc aaagttggct 720
aagatagcgt tcactggctc aactgcaact ggtaaaaaaa tcatggaagc agcaggtggt 780
tccaacttga aaaaggttac actagagtgt ggtggtaaat ctccttacat tgtttttgat 840
gatgctgact tagaattggc agtagaatgg gcatattggg gtatttggta taacaaaggt 900
gaggtttgta cttcaacttc gagatttttg attcaggaag acatttacga taagtttgtt 960
gagagttttg ttgagttgac caagacgaga gcaatcactg ctgatccgtt tgatgataga 1020
tgcactatcg ggcctttggt ttctagctca cagtacgaaa aagtcaaaaa gtacgttgaa 1080
ataggtaaaa atgaaggagc aaagctacta actggcaaat tcatcgacgg gccaggctat 1140
ttctgtgagc catttatctt cagtgaatgc actgacgata tgacaatcat gaaagaggaa 1200
atctttggcc ctgttgtggg gattactaaa ttctcaacgg ttaaagaggc gatcgagaga 1260
gccaatgcta cgacttacgg tttaggagct gcgttgtttt cctctaacat aacaaaggca 1320
cattctgtgg ctgccaagtt ggaggctgga atggtgtgga tcaattctaa tggtgattct 1380
gatatccaca ttccatttgg tggttccaaa atgagtggta taggtaggga gttggggcca 1440
tacgcactag acttgtttac tgagaaaaag gcagttcatg tcaacttatc gcttccggtc 1500
aagtga 1506
<210> 122
<211> 501
<212> PRT
<213> 东方伊萨酵母
<400> 122
Met Ser Ala Leu Phe Arg Thr Ile Glu Thr Pro Asn Gly Lys Thr Leu
1 5 10 15
Glu Gln Pro Leu Gly Leu Phe Ile Asp Asn Glu Trp Val Lys Thr Asn
20 25 30
Arg Thr Phe Glu Thr Ile Asn Pro Ser Thr Gly Glu Ala Ile Cys His
35 40 45
Val Tyr Arg Ala Gly Val Gln Glu Val Asn Asp Ala Val Glu Ala Ala
50 55 60
Asn Arg Ala Phe Arg Asn Glu Ser Trp Ser Gly Leu Thr Gly Ser Gln
65 70 75 80
Arg Gly Asp Leu Leu Tyr Arg Met Tyr Gln Val Ile Lys Arg Asp Ala
85 90 95
Glu Ser Ile Ala Ser Ile Glu Ser Met Asp Asn Gly Lys Pro Tyr Ala
100 105 110
Ala Glu Cys Leu Asp Gly Asp Leu Gly Glu Ala Ala Asp Val Phe Lys
115 120 125
Tyr Tyr Ala Gly Trp Ala Asp Lys Ile Thr Gly Glu Leu Ile Gly Ser
130 135 140
Ser Val Leu Gly Lys Asn Lys Met Cys Tyr Val Glu Pro Thr Pro Leu
145 150 155 160
Gly Ala Val Gly Gly Ile Val Pro Trp Asn Phe Pro Phe Thr Met Met
165 170 175
Ala Trp Lys Ile Ala Pro Ala Leu Ala Thr Gly Cys Thr Val Val Met
180 185 190
Lys Ser Ser Glu Val Thr Pro Leu Thr Ala Leu Trp Tyr Gly Lys Ile
195 200 205
Ala Leu Glu Val Gly Leu Pro Lys Gly Val Leu Asn Ile Leu Ser Gly
210 215 220
Phe Gly Ser Asp Val Gly Ser Ala Met Ala Ser His Pro Lys Leu Ala
225 230 235 240
Lys Ile Ala Phe Thr Gly Ser Thr Ala Thr Gly Lys Lys Ile Met Glu
245 250 255
Ala Ala Gly Gly Ser Asn Leu Lys Lys Val Thr Leu Glu Cys Gly Gly
260 265 270
Lys Ser Pro Tyr Ile Val Phe Asp Asp Ala Asp Leu Glu Leu Ala Val
275 280 285
Glu Trp Ala Tyr Trp Gly Ile Trp Tyr Asn Lys Gly Glu Val Cys Thr
290 295 300
Ser Thr Ser Arg Phe Leu Ile Gln Glu Asp Ile Tyr Asp Lys Phe Val
305 310 315 320
Glu Ser Phe Val Glu Leu Thr Lys Thr Arg Ala Ile Thr Ala Asp Pro
325 330 335
Phe Asp Asp Arg Cys Thr Ile Gly Pro Leu Val Ser Ser Ser Gln Tyr
340 345 350
Glu Lys Val Lys Lys Tyr Val Glu Ile Gly Lys Asn Glu Gly Ala Lys
355 360 365
Leu Leu Thr Gly Lys Phe Ile Asp Gly Pro Gly Tyr Phe Cys Glu Pro
370 375 380
Phe Ile Phe Ser Glu Cys Thr Asp Asp Met Thr Ile Met Lys Glu Glu
385 390 395 400
Ile Phe Gly Pro Val Val Gly Ile Thr Lys Phe Ser Thr Val Lys Glu
405 410 415
Ala Ile Glu Arg Ala Asn Ala Thr Thr Tyr Gly Leu Gly Ala Ala Leu
420 425 430
Phe Ser Ser Asn Ile Thr Lys Ala His Ser Val Ala Ala Lys Leu Glu
435 440 445
Ala Gly Met Val Trp Ile Asn Ser Asn Gly Asp Ser Asp Ile His Ile
450 455 460
Pro Phe Gly Gly Ser Lys Met Ser Gly Ile Gly Arg Glu Leu Gly Pro
465 470 475 480
Tyr Ala Leu Asp Leu Phe Thr Glu Lys Lys Ala Val His Val Asn Leu
485 490 495
Ser Leu Pro Val Lys
500
<210> 123
<211> 1506
<212> DNA
<213> 东方伊萨酵母
<400> 123
atggctcttc cacttgcaac tacaatctcc ttatcaagcg gcaaaacatt agaacagcca 60
attggtttat ttattgataa tgaatttgtc aatccaattt ctgtttctaa tgcaagaaca 120
ctaacaacct tcaacccaag cacaggtgag ccaataaccg atgttcattg tgcctcagct 180
gcagatgttg atgttgcggt aaatgctgca aacaaggcaa tggaaacatg gaaagacatt 240
gatcctactg ttcgtgtcga acttttacta aaattggcca gcttagttga cgagcattcc 300
caagcaattg ctgaaattga agcactagac tcgggtaaac cattgtactc gaatgcactg 360
gcggatgttc aatcggttgc tgagtactta aggtactgtg ccggttgggc ggataaatta 420
cacggtacgc aaattccaat aaactctaag gtaatggcta ttacaaaacg tgtaccctta 480
gttgtcggct gcatcattcc atggaactac ccaatttcaa tggcctcctg gaagttctgt 540
ccagcattgg ctgccggatg tactattgta atgaagtcaa gtgagataac cccgttatcg 600
ttactttatt ttgcgaattt ggtcaaatta gcaggtttcc ctaagggtgt ttttaatgtc 660
gtctctggat ttggtgatga tgttggctca gcgctttcaa atcacccaaa gttgggtaag 720
attgcattta caggctcgac cttgaccggg caaaaggtga tggcggatgc tgccagatca 780
aatttgaaaa gcgtatcttt ggaatgtggt ggtaaatctc cacttattgt cttcgaagat 840
gcagaattgg atgaatgcgt taaatgggca agttttggtg tcatgtataa caccggacaa 900
aattgtactg ccaattctcg tattattgtg catgataagg tttatgatca atttatcgaa 960
aagttcctgt ctcaactcaa ggaagattgg aaaatgggag atgtcatgaa tgaaaagact 1020
acattgggac cacttgtcag ccaacaacaa tatgagcgtg ttcagtcgta tattgatata 1080
ggtgtcaaag aaggggctac actgattcaa ccgcttaagg agagcactcc atcaaatgga 1140
ttctacatct ctcctactgt ttttactaac gttaaggaag atatgagaat tgttaaggag 1200
gaaatatttg gtcctgtcgt aactatctcc aaattctcaa ctgaggaaga ggcaatttca 1260
aaggcgaatg atacaattta tggcttagct gcaatgttat ttactactaa ttttgaacgt 1320
gccaacagag ttgctgataa gctggaagct ggcagtgtgt acattaatag ctctaacaac 1380
gagagtacca aagttccatt tggaggaatg aagatgagtg gtattggaag agagttgggg 1440
caagaagcat ttaatttgta cactgttaca aagagtattt attatagtta tggtgctaag 1500
ctttaa 1506
<210> 124
<211> 501
<212> PRT
<213> 东方伊萨酵母
<400> 124
Met Ala Leu Pro Leu Ala Thr Thr Ile Ser Leu Ser Ser Gly Lys Thr
1 5 10 15
Leu Glu Gln Pro Ile Gly Leu Phe Ile Asp Asn Glu Phe Val Asn Pro
20 25 30
Ile Ser Val Ser Asn Ala Arg Thr Leu Thr Thr Phe Asn Pro Ser Thr
35 40 45
Gly Glu Pro Ile Thr Asp Val His Cys Ala Ser Ala Ala Asp Val Asp
50 55 60
Val Ala Val Asn Ala Ala Asn Lys Ala Met Glu Thr Trp Lys Asp Ile
65 70 75 80
Asp Pro Thr Val Arg Val Glu Leu Leu Leu Lys Leu Ala Ser Leu Val
85 90 95
Asp Glu His Ser Gln Ala Ile Ala Glu Ile Glu Ala Leu Asp Ser Gly
100 105 110
Lys Pro Leu Tyr Ser Asn Ala Leu Ala Asp Val Gln Ser Val Ala Glu
115 120 125
Tyr Leu Arg Tyr Cys Ala Gly Trp Ala Asp Lys Leu His Gly Thr Gln
130 135 140
Ile Pro Ile Asn Ser Lys Val Met Ala Ile Thr Lys Arg Val Pro Leu
145 150 155 160
Val Val Gly Cys Ile Ile Pro Trp Asn Tyr Pro Ile Ser Met Ala Ser
165 170 175
Trp Lys Phe Cys Pro Ala Leu Ala Ala Gly Cys Thr Ile Val Met Lys
180 185 190
Ser Ser Glu Ile Thr Pro Leu Ser Leu Leu Tyr Phe Ala Asn Leu Val
195 200 205
Lys Leu Ala Gly Phe Pro Lys Gly Val Phe Asn Val Val Ser Gly Phe
210 215 220
Gly Asp Asp Val Gly Ser Ala Leu Ser Asn His Pro Lys Leu Gly Lys
225 230 235 240
Ile Ala Phe Thr Gly Ser Thr Leu Thr Gly Gln Lys Val Met Ala Asp
245 250 255
Ala Ala Arg Ser Asn Leu Lys Ser Val Ser Leu Glu Cys Gly Gly Lys
260 265 270
Ser Pro Leu Ile Val Phe Glu Asp Ala Glu Leu Asp Glu Cys Val Lys
275 280 285
Trp Ala Ser Phe Gly Val Met Tyr Asn Thr Gly Gln Asn Cys Thr Ala
290 295 300
Asn Ser Arg Ile Ile Val His Asp Lys Val Tyr Asp Gln Phe Ile Glu
305 310 315 320
Lys Phe Leu Ser Gln Leu Lys Glu Asp Trp Lys Met Gly Asp Val Met
325 330 335
Asn Glu Lys Thr Thr Leu Gly Pro Leu Val Ser Gln Gln Gln Tyr Glu
340 345 350
Arg Val Gln Ser Tyr Ile Asp Ile Gly Val Lys Glu Gly Ala Thr Leu
355 360 365
Ile Gln Pro Leu Lys Glu Ser Thr Pro Ser Asn Gly Phe Tyr Ile Ser
370 375 380
Pro Thr Val Phe Thr Asn Val Lys Glu Asp Met Arg Ile Val Lys Glu
385 390 395 400
Glu Ile Phe Gly Pro Val Val Thr Ile Ser Lys Phe Ser Thr Glu Glu
405 410 415
Glu Ala Ile Ser Lys Ala Asn Asp Thr Ile Tyr Gly Leu Ala Ala Met
420 425 430
Leu Phe Thr Thr Asn Phe Glu Arg Ala Asn Arg Val Ala Asp Lys Leu
435 440 445
Glu Ala Gly Ser Val Tyr Ile Asn Ser Ser Asn Asn Glu Ser Thr Lys
450 455 460
Val Pro Phe Gly Gly Met Lys Met Ser Gly Ile Gly Arg Glu Leu Gly
465 470 475 480
Gln Glu Ala Phe Asn Leu Tyr Thr Val Thr Lys Ser Ile Tyr Tyr Ser
485 490 495
Tyr Gly Ala Lys Leu
500
<210> 125
<211> 1544
<212> DNA
<213> 东方伊萨酵母
<220>
<221> misc_feature
<222> (1319)..(1319)
<223> N= A, C, G, 或 T
<400> 125
atgatgggcg caactacagc aaaaattagt attccaaatg gtaacaaata cgagcaacct 60
acaggtttgt tcatcaatgg tgagtttgtt gcttcaagtg atggtaaaac tgcagaagtt 120
gagaatccag gcaatggaaa cattgtatgt tctgtccact tagcttctat tgaggatatt 180
aataccgccg tagaagctgc tgaagatgca tttttcaaaa ggtgggccac catcagtggt 240
aaagccaagg gagaatactt gagtaagatt gccgatctaa tcgttaaata ttctgatcaa 300
ttggcagatc tagaggctat tgaatcaggt aagccaaagg acaccaatgc aatctttgat 360
gttttacatt cggctgatgt tttcagatac tatgctggca aggctgtcac tgcacaaagc 420
ggcaagacta tcgagtccga actctccaaa tttacataca cagtttacga gccctatggt 480
gtttgtgccg ctatcatcgc atggaacttc ccaatgagca catttgcgtg gaaagttgcg 540
gcatgtttag ctgctggtaa tacaatggtt gtcaaaactt ccgagctgac tccgttatct 600
gcattgttca tgtgtaagat tttccaagaa gcagatctac ctgctggagt tataaacgtc 660
acatgtggtt taggttctgt tgcaggtgtt cgattgagtg aacatgaaaa ggttcagaaa 720
atttcgttta ctggctccac tggcgttggt aagttgatcc aagaatccgc agcaaagtct 780
aacttaaagt attgtacgct tgaatgtggt ggtaagtctc cgttagtgat ttacgaggat 840
gcagatcttg agcaagcagt gaagtgggct gcctttggta tttttttcaa caaaggtgaa 900
atttgcacag cctcttccag aatatatgtt caagaatcag tctatgacaa atttttgact 960
atgtacaagg atcatgtgga agaagcctat gttcaaggag aacagtttgc cactggtgtt 1020
aacgttgggc ctactgtctg caaagcccaa caagagaaaa tactggccta cattgaaagt 1080
gccaagcaag aaggtggtag aattatcact ggtggtaaaa taccatctta cacgaacaaa 1140
aatggttact atctcgaacc aacaattatt gcagattgta accaggatat gaaggtagtc 1200
agggaagaga ttttcggacc agtcgttact gtatccaaat tcactagtga tgaagaagcc 1260
atcaaattaa gcaatgattc cgaatatggc ttggcagcat atttattcac tystsrasna 1320
ssrgttyrgy taaaatyrth thraaggacc tcgttagatc tcagaattat atcagaaaag 1380
tgcaaagcgg acaggtcttt gtcaacttca cctttgcggc tgatttcagg ttgccatttg 1440
gcggatataa gatgagtggt aacggaagag agcttggtga tgaaggactg agtgctttcc 1500
agcaagtcaa agcagtacac attaatctca ctgggaagtt gtaa 1544
<210> 126
<211> 503
<212> PRT
<213> 东方伊萨酵母
<400> 126
Met Met Gly Ala Thr Thr Ala Lys Ile Ser Ile Pro Asn Gly Asn Lys
1 5 10 15
Tyr Glu Gln Pro Thr Gly Leu Phe Ile Asn Gly Glu Phe Val Ala Ser
20 25 30
Ser Asp Gly Lys Thr Ala Glu Val Glu Asn Pro Gly Asn Gly Asn Ile
35 40 45
Val Cys Ser Val His Leu Ala Ser Ile Glu Asp Ile Asn Thr Ala Val
50 55 60
Glu Ala Ala Glu Asp Ala Phe Phe Lys Arg Trp Ala Thr Ile Ser Gly
65 70 75 80
Lys Ala Lys Gly Glu Tyr Leu Ser Lys Ile Ala Asp Leu Ile Val Lys
85 90 95
Tyr Ser Asp Gln Leu Ala Asp Leu Glu Ala Ile Glu Ser Gly Lys Pro
100 105 110
Lys Asp Thr Asn Ala Ile Phe Asp Val Leu His Ser Ala Asp Val Phe
115 120 125
Arg Tyr Tyr Ala Gly Lys Ala Val Thr Ala Gln Ser Gly Lys Thr Ile
130 135 140
Glu Ser Glu Leu Ser Lys Phe Thr Tyr Thr Val Tyr Glu Pro Tyr Gly
145 150 155 160
Val Cys Ala Ala Ile Ile Ala Trp Asn Phe Pro Met Ser Thr Phe Ala
165 170 175
Trp Lys Val Ala Ala Cys Leu Ala Ala Gly Asn Thr Met Val Val Lys
180 185 190
Thr Ser Glu Leu Thr Pro Leu Ser Ala Leu Phe Met Cys Lys Ile Phe
195 200 205
Gln Glu Ala Asp Leu Pro Ala Gly Val Ile Asn Val Thr Cys Gly Leu
210 215 220
Gly Ser Val Ala Gly Val Arg Leu Ser Glu His Glu Lys Val Gln Lys
225 230 235 240
Ile Ser Phe Thr Gly Ser Thr Gly Val Gly Lys Leu Ile Gln Glu Ser
245 250 255
Ala Ala Lys Ser Asn Leu Lys Tyr Cys Thr Leu Glu Cys Gly Gly Lys
260 265 270
Ser Pro Leu Val Ile Tyr Glu Asp Ala Asp Leu Glu Gln Ala Val Lys
275 280 285
Trp Ala Ala Phe Gly Ile Phe Phe Asn Lys Gly Glu Ile Cys Thr Ala
290 295 300
Ser Ser Arg Ile Tyr Val Gln Glu Ser Val Tyr Asp Lys Phe Leu Thr
305 310 315 320
Met Tyr Lys Asp His Val Glu Glu Ala Tyr Val Gln Gly Glu Gln Phe
325 330 335
Ala Thr Gly Val Asn Val Gly Pro Thr Val Cys Lys Ala Gln Gln Glu
340 345 350
Lys Ile Leu Ala Tyr Ile Glu Ser Ala Lys Gln Glu Gly Gly Arg Ile
355 360 365
Ile Thr Gly Gly Lys Ile Pro Ser Tyr Thr Asn Lys Asn Gly Tyr Tyr
370 375 380
Leu Glu Pro Thr Ile Ile Ala Asp Cys Asn Gln Asp Met Lys Val Val
385 390 395 400
Arg Glu Glu Ile Phe Gly Pro Val Val Thr Val Ser Lys Phe Thr Ser
405 410 415
Asp Glu Glu Ala Ile Lys Leu Ser Asn Asp Ser Glu Tyr Gly Leu Ala
420 425 430
Ala Tyr Leu Phe Thr Lys Asp Leu Val Arg Ser Gln Asn Tyr Ile Arg
435 440 445
Lys Val Gln Ser Gly Gln Val Phe Val Asn Phe Thr Phe Ala Ala Asp
450 455 460
Phe Arg Leu Pro Phe Gly Gly Tyr Lys Met Ser Gly Asn Gly Arg Glu
465 470 475 480
Leu Gly Asp Glu Gly Leu Ser Ala Phe Gln Gln Val Lys Ala Val His
485 490 495
Ile Asn Leu Thr Gly Lys Leu
500
<210> 127
<211> 1716
<212> DNA
<213> 东方伊萨酵母
<220>
<221> misc_feature
<222> (655)..(655)
<223> n is a, c, g, 或 t
<400> 127
atggctccaa ctgctgttga tatccataac gagtacaaac agaatgtttc caacgaacag 60
gaaattcctt tcaacaaaac tgaaagaaag tcatcgattg catctaaatt aggactgaat 120
ccagacgcta agattcacta caattctgct gttcctatat tatacgaaga tggtttaaag 180
gaaaaaggta caaccatttc ctcttctggt gcattgattg cattctctgg ttccaaaaca 240
ggtagatctc caaaggacaa aagaattgtc gatgaagaga cttcaacaga caacatctgg 300
tggggtccag tcaataagaa ggttgatgaa aacacttgga atatctcgaa atctagagcg 360
attgattatt tgagaacaag agagaaggtt tacattatcg atgcttttgc tggttgggat 420
ccaagataca gaattaaggt tagaattgtc tgtgctagag cttaccatgc tttgttcatg 480
aagaatatgt taattagacc aacaacggaa gaattaaaga actttggtga gcctgatttc 540
accatttgga atgcaggtca attccctgct aatgtttaca ctaagggtat gacttcttca 600
acttctgttg aaataaattt caagtctthr ysgymtthrs rsrthrsrva gtasnhyssr 660
atggaaatgg ttatcctagg tactgaatac gcaggtgaaa tgaagaaagg tatctttacc 720
gttatgttct acttgatgcc aatcagacac aaggttttaa ctttacactc ttctgcaaat 780
caaggtaaaa aggatggtga tgtcacatta ttctttggtt tatctggtac aggtaaaaca 840
accttgtctg cagatcctca tagagaattg attggtgatg atgaacattg ctggtctgat 900
catggtgttt tcaacattga aggtggatgt tatgctaagt gtttggactt atctgctgaa 960
agagaacctg agattttcaa tgcaattagg tttggatctg tcttggagaa tgttgtctat 1020
gatccagttg atagaactgt tgactattcc gctgctaatg tcactgaaaa tactagatgt 1080
gcttatccta tcgactttat tccttctgct aagatcccat gtctggcaga ttctcatcca 1140
aagaatattg ttcttttaac ttgtgatgca agaggtgttt tgccacctgt ctccaagcta 1200
actaatgcac aagtcatgta tcactttatc tctggttaca cctccaagat ggcaggtacc 1260
gaagttggtg tcactgaacc agaagcaacc ttctctgcat gttttggtca acctttctta 1320
gttttacatc caatgaaata cgcacaacaa ctctctgata aaatggctga acattcttcc 1380
accgcttggt tattgaatac cggttggact ggtcaatctt atgttaaagg tggtaagaga 1440
tgtccattga agtatactag agcaatttta gatgctattc actctggtga gcttgcaaaa 1500
caggaattcg aaacataccc tactttcggt ttacaagttc caaaaacttg tccaggtgtc 1560
ccagaaagtg ttctgaaccc atctaaacac tgggctactg gtgaagctga tttcaaggct 1620
gaagtcacta acttggctaa attatttgct gagaactttg aaaagtattc tgcagaatgt 1680
actgcagaag ttgttgctgc tggtcctgct ttataa 1716
<210> 128
<211> 560
<212> PRT
<213> 东方伊萨酵母
<400> 128
Met Ala Pro Thr Ala Val Asp Ile His Asn Glu Tyr Lys Gln Asn Val
1 5 10 15
Ser Asn Glu Gln Glu Ile Pro Phe Asn Lys Thr Glu Arg Lys Ser Ser
20 25 30
Ile Ala Ser Lys Leu Gly Leu Asn Pro Asp Ala Lys Ile His Tyr Asn
35 40 45
Ser Ala Val Pro Ile Leu Tyr Glu Asp Gly Leu Lys Glu Lys Gly Thr
50 55 60
Thr Ile Ser Ser Ser Gly Ala Leu Ile Ala Phe Ser Gly Ser Lys Thr
65 70 75 80
Gly Arg Ser Pro Lys Asp Lys Arg Ile Val Asp Glu Glu Thr Ser Thr
85 90 95
Asp Asn Ile Trp Trp Gly Pro Val Asn Lys Lys Val Asp Glu Asn Thr
100 105 110
Trp Asn Ile Ser Lys Ser Arg Ala Ile Asp Tyr Leu Arg Thr Arg Glu
115 120 125
Lys Val Tyr Ile Ile Asp Ala Phe Ala Gly Trp Asp Pro Arg Tyr Arg
130 135 140
Ile Lys Val Arg Ile Val Cys Ala Arg Ala Tyr His Ala Leu Phe Met
145 150 155 160
Lys Asn Met Leu Ile Arg Pro Thr Thr Glu Glu Leu Lys Asn Phe Gly
165 170 175
Glu Pro Asp Phe Thr Ile Trp Asn Ala Gly Gln Phe Pro Ala Asn Val
180 185 190
Tyr Thr Lys Gly Met Thr Ser Ser Thr Ser Val Glu Ile Asn Phe Lys
195 200 205
Ser Met Glu Met Val Ile Leu Gly Thr Glu Tyr Ala Gly Glu Met Lys
210 215 220
Lys Gly Ile Phe Thr Val Met Phe Tyr Leu Met Pro Ile Arg His Lys
225 230 235 240
Val Leu Thr Leu His Ser Ser Ala Asn Gln Gly Lys Lys Asp Gly Asp
245 250 255
Val Thr Leu Phe Phe Gly Leu Ser Gly Thr Gly Lys Thr Thr Leu Ser
260 265 270
Ala Asp Pro His Arg Glu Leu Ile Gly Asp Asp Glu His Cys Trp Ser
275 280 285
Asp His Gly Val Phe Asn Ile Glu Gly Gly Cys Tyr Ala Lys Cys Leu
290 295 300
Asp Leu Ser Ala Glu Arg Glu Pro Glu Ile Phe Asn Ala Ile Arg Phe
305 310 315 320
Gly Ser Val Leu Glu Asn Val Val Tyr Asp Pro Val Asp Arg Thr Val
325 330 335
Asp Tyr Ser Ala Ala Asn Val Thr Glu Asn Thr Arg Cys Ala Tyr Pro
340 345 350
Ile Asp Phe Ile Pro Ser Ala Lys Ile Pro Cys Leu Ala Asp Ser His
355 360 365
Pro Lys Asn Ile Val Leu Leu Thr Cys Asp Ala Arg Gly Val Leu Pro
370 375 380
Pro Val Ser Lys Leu Thr Asn Ala Gln Val Met Tyr His Phe Ile Ser
385 390 395 400
Gly Tyr Thr Ser Lys Met Ala Gly Thr Glu Val Gly Val Thr Glu Pro
405 410 415
Glu Ala Thr Phe Ser Ala Cys Phe Gly Gln Pro Phe Leu Val Leu His
420 425 430
Pro Met Lys Tyr Ala Gln Gln Leu Ser Asp Lys Met Ala Glu His Ser
435 440 445
Ser Thr Ala Trp Leu Leu Asn Thr Gly Trp Thr Gly Gln Ser Tyr Val
450 455 460
Lys Gly Gly Lys Arg Cys Pro Leu Lys Tyr Thr Arg Ala Ile Leu Asp
465 470 475 480
Ala Ile His Ser Gly Glu Leu Ala Lys Gln Glu Phe Glu Thr Tyr Pro
485 490 495
Thr Phe Gly Leu Gln Val Pro Lys Thr Cys Pro Gly Val Pro Glu Ser
500 505 510
Val Leu Asn Pro Ser Lys His Trp Ala Thr Gly Glu Ala Asp Phe Lys
515 520 525
Ala Glu Val Thr Asn Leu Ala Lys Leu Phe Ala Glu Asn Phe Glu Lys
530 535 540
Tyr Ser Ala Glu Cys Thr Ala Glu Val Val Ala Ala Gly Pro Ala Leu
545 550 555 560
<210> 129
<211> 267
<212> PRT
<213> 酿酒酵母
<400> 129
Met Ser Gln Gly Arg Lys Ala Ala Glu Arg Leu Ala Lys Lys Thr Val
1 5 10 15
Leu Ile Thr Gly Ala Ser Ala Gly Ile Gly Lys Ala Thr Ala Leu Glu
20 25 30
Tyr Leu Glu Ala Ser Asn Gly Asp Met Lys Leu Ile Leu Ala Ala Arg
35 40 45
Arg Leu Glu Lys Leu Glu Glu Leu Lys Lys Thr Ile Asp Gln Glu Phe
50 55 60
Pro Asn Ala Lys Val His Val Ala Gln Leu Asp Ile Thr Gln Ala Glu
65 70 75 80
Lys Ile Lys Pro Phe Ile Glu Asn Leu Pro Gln Glu Phe Lys Asp Ile
85 90 95
Asp Ile Leu Val Asn Asn Ala Gly Lys Ala Leu Gly Ser Asp Arg Val
100 105 110
Gly Gln Ile Ala Thr Glu Asp Ile Gln Asp Val Phe Asp Thr Asn Val
115 120 125
Thr Ala Leu Ile Asn Ile Thr Gln Ala Val Leu Pro Ile Phe Gln Ala
130 135 140
Lys Asn Ser Gly Asp Ile Val Asn Leu Gly Ser Ile Ala Gly Arg Asp
145 150 155 160
Ala Tyr Pro Thr Gly Ser Ile Tyr Cys Ala Ser Lys Phe Ala Val Gly
165 170 175
Ala Phe Thr Asp Ser Leu Arg Lys Glu Leu Ile Asn Thr Lys Ile Arg
180 185 190
Val Ile Leu Ile Ala Pro Gly Leu Val Glu Thr Glu Phe Ser Leu Val
195 200 205
Arg Tyr Arg Gly Asn Glu Glu Gln Ala Lys Asn Val Tyr Lys Asp Thr
210 215 220
Thr Pro Leu Met Ala Asp Asp Val Ala Asp Leu Ile Val Tyr Ala Thr
225 230 235 240
Ser Arg Lys Gln Asn Thr Val Ile Ala Asp Thr Leu Ile Phe Pro Thr
245 250 255
Asn Gln Ala Ser Pro His His Ile Phe Arg Gly
260 265
<210> 130
<211> 420
<212> DNA
<213> 阿维链霉菌
<400> 130
atgttaagaa ccatgttcaa atctaagatt cacagagcaa ctgttactca agcagatctc 60
cattatgttg gttccgttac tattgatgca gacttgttag acgcagcaga cttgttgcca 120
ggtgaattgg ttcacatcgt tgacattacg aacggtgcta gattggaaac ttacgtcatt 180
gaaggtgaac gtggttccgg tgttgttggt atcaatggtg ctgccgctca tttagttcat 240
cctggtgatc ttgttatcat tatctcctat gcacaagttt cagatgcaga agcacgtgca 300
ttgcgtccaa gagttgttca cgttgacaga gacaatagag ttgttgcgct tggtgcggat 360
ccagccgaac cagtcccagg ttccgaccaa gctagatccc cacaagctgt tactgcataa 420
<210> 131
<211> 384
<212> DNA
<213> 丙酮丁醇梭菌
<400> 131
atgcacttga acatgttgaa gtccaagatc cacagagcta ccgtcgttca agcagacttg 60
aactacgtcg gttccatcac catcgacaga aacttgatgg acaaggcaaa catcttggaa 120
tacgaaaagg tcgagatcgc aaacatcaac aacggtgcaa gattcgaaac ctacgtcatc 180
gctggtgagg ctggttccgg tatcatctgt ttgaacggtg ctgctgcaag atgtgcacaa 240
gcgggtgaca aggttatcat catgtgttac tgttccttga ccccagaaga agcttccgag 300
cacagaccaa aggtcgtttt cgtcaacgac gacaactcca tctccaacgt caccgaatac 360
gagaagcacg gcaccatcgg ttaa 384
<210> 132
<211> 354
<212> DNA
<213> Helicobacter pylori
<400> 132
atgaccttcg agatgttgta ctccaagatc cacagagcaa ccatcaccga cgcaaacttg 60
aactacatcg gctccatcac catcgacgag gacttggcta agttggctaa gttgagagag 120
ggtatgaagg tcgaaatcgt cgacgtcaac aacggcgaga gattctccac ctacgtcatc 180
ttgggtaaga agagaggtga aatctgcgtc aacggtgcag cagccagaaa ggtcgctatc 240
ggtgacgtcg tcatcatctt ggcttacgca tccatgaacg aggacgagat caacgctcac 300
aagccatcca tcgtcttggt cgacgaaaag aacgaaatct tggaaaaggg ttaa 354
<210> 133
<211> 117
<212> PRT
<213> Helicobacter pylori
<400> 133
Met Thr Phe Glu Met Leu Tyr Ser Lys Ile His Arg Ala Thr Ile Thr
1 5 10 15
Asp Ala Asn Leu Asn Tyr Ile Gly Ser Ile Thr Ile Asp Glu Asp Leu
20 25 30
Ala Lys Leu Ala Lys Leu Arg Glu Gly Met Lys Val Glu Ile Val Asp
35 40 45
Val Asn Asn Gly Glu Arg Phe Ser Thr Tyr Val Ile Leu Gly Lys Lys
50 55 60
Arg Gly Glu Ile Cys Val Asn Gly Ala Ala Ala Arg Lys Val Ala Ile
65 70 75 80
Gly Asp Val Val Ile Ile Leu Ala Tyr Ala Ser Met Asn Glu Asp Glu
85 90 95
Ile Asn Ala His Lys Pro Ser Ile Val Leu Val Asp Glu Lys Asn Glu
100 105 110
Ile Leu Glu Lys Gly
115
<210> 134
<211> 387
<212> DNA
<213> Bacillus sp. TS25
<400> 134
atgtacagaa ccatgatgaa gtccaagttg cacagagcga ccgtcaccga agcaaacttg 60
aactacgtcg gttccatcac catcgaccaa gacttgatgg aagctgcaga catcttggaa 120
aacgagaagg tccaaatcgt caacaacaac aacggtgcta gattcgaaac ctacgtcatc 180
gctggtccaa gaggctccgg caccatctgt ttgaacggtg cagcagcaag attggtccaa 240
ccaggtgaca ccgttatcat catctcctac gcaatgttgg aagaagccga ggctagaaag 300
caccaacctg tcgtcgtttt gttgaaccca gacaacacca tccaagaatt gatcagagaa 360
acccacggtg ctaccgctac cgtctaa 387
<210> 135
<211> 128
<212> PRT
<213> Bacillus sp. TS25
<400> 135
Met Tyr Arg Thr Met Met Lys Ser Lys Leu His Arg Ala Thr Val Thr
1 5 10 15
Glu Ala Asn Leu Asn Tyr Val Gly Ser Ile Thr Ile Asp Gln Asp Leu
20 25 30
Met Glu Ala Ala Asp Ile Leu Glu Asn Glu Lys Val Gln Ile Val Asn
35 40 45
Asn Asn Asn Gly Ala Arg Phe Glu Thr Tyr Val Ile Ala Gly Pro Arg
50 55 60
Gly Ser Gly Thr Ile Cys Leu Asn Gly Ala Ala Ala Arg Leu Val Gln
65 70 75 80
Pro Gly Asp Thr Val Ile Ile Ile Ser Tyr Ala Met Leu Glu Glu Ala
85 90 95
Glu Ala Arg Lys His Gln Pro Val Val Val Leu Leu Asn Pro Asp Asn
100 105 110
Thr Ile Gln Glu Leu Ile Arg Glu Thr His Gly Ala Thr Ala Thr Val
115 120 125
<210> 136
<211> 411
<212> DNA
<213> 谷氨酸棒杆菌
<400> 136
atgttgagaa ccatcttggg ttccaaaatc cacagagcta ccgttaccca agcagacttg 60
gactacgttg gttcagtcac catcgatgca gacttggttc atgccgcagg tttgatcgaa 120
ggtgaaaagg ttgccatcgt cgacatcacc aatggcgcta gattggaaac ctacgttatc 180
gttggtgatg ctggcaccgg taacatctgt atcaacggtg cagcagcaca cttgatcaac 240
ccaggtgatt tggttatcat catgtcctac ttgcaagcta ccgatgcaga ggccaaggct 300
tacgaaccaa agatcgttca cgtcgacgca gacaacagaa tcgttgcttt gggtaacgac 360
ttggcagaag ctttgcctgg ttccggtttg ttgacctcaa gatctatcta a 411
<210> 137
<211> 136
<212> PRT
<213> 谷氨酸棒杆菌
<400> 137
Met Leu Arg Thr Ile Leu Gly Ser Lys Ile His Arg Ala Thr Val Thr
1 5 10 15
Gln Ala Asp Leu Asp Tyr Val Gly Ser Val Thr Ile Asp Ala Asp Leu
20 25 30
Val His Ala Ala Gly Leu Ile Glu Gly Glu Lys Val Ala Ile Val Asp
35 40 45
Ile Thr Asn Gly Ala Arg Leu Glu Thr Tyr Val Ile Val Gly Asp Ala
50 55 60
Gly Thr Gly Asn Ile Cys Ile Asn Gly Ala Ala Ala His Leu Ile Asn
65 70 75 80
Pro Gly Asp Leu Val Ile Ile Met Ser Tyr Leu Gln Ala Thr Asp Ala
85 90 95
Glu Ala Lys Ala Tyr Glu Pro Lys Ile Val His Val Asp Ala Asp Asn
100 105 110
Arg Ile Val Ala Leu Gly Asn Asp Leu Ala Glu Ala Leu Pro Gly Ser
115 120 125
Gly Leu Leu Thr Ser Arg Ser Ile
130 135
<210> 138
<211> 384
<212> DNA
<213> 地衣芽孢杆菌
<400> 138
atgtacagaa ccttgatgtc cgctaagttg cacagagcta gagtcaccga agcaaacttg 60
aactacgttg gttccgtcac catcgacgag gacttgttgg acgcagtcgg tatgatggca 120
aacgaaaagg tccaaatcgt caacaacaac aacggtgcta gattggaaac ctacatcatc 180
cctggtgaga gaggttccgg tgtcgtctgt ttgaacggtg ctgcagctag attggtccaa 240
gttggtgacg tcgttatcat cgtttcctac gccatgatgt ccgaagaaga agcaaagacc 300
cacaagccaa aggtcgctgt tttgaacgaa agaaacgaaa tcgaagagat gttgggtcaa 360
gaaccagcta gaaccatctt gtaa 384
<210> 139
<211> 127
<212> PRT
<213> 地衣芽孢杆菌
<400> 139
Met Tyr Arg Thr Leu Met Ser Ala Lys Leu His Arg Ala Arg Val Thr
1 5 10 15
Glu Ala Asn Leu Asn Tyr Val Gly Ser Val Thr Ile Asp Glu Asp Leu
20 25 30
Leu Asp Ala Val Gly Met Met Ala Asn Glu Lys Val Gln Ile Val Asn
35 40 45
Asn Asn Asn Gly Ala Arg Leu Glu Thr Tyr Ile Ile Pro Gly Glu Arg
50 55 60
Gly Ser Gly Val Val Cys Leu Asn Gly Ala Ala Ala Arg Leu Val Gln
65 70 75 80
Val Gly Asp Val Val Ile Ile Val Ser Tyr Ala Met Met Ser Glu Glu
85 90 95
Glu Ala Lys Thr His Lys Pro Lys Val Ala Val Leu Asn Glu Arg Asn
100 105 110
Glu Ile Glu Glu Met Leu Gly Gln Glu Pro Ala Arg Thr Ile Leu
115 120 125
<210> 140
<211> 1356
<212> DNA
<213> 阿维链霉菌
<400> 140
atgacaccac agccaaaccc acaagtcggt gcagcagtca aagctgcaga tagagcacac 60
gtcttccact cttggtctgc acaagaattg atcgatccat tggctgttgc tggtgcagag 120
ggttcctact tctgggatta cgatggtaga cgttaccttg acttcacctc cggcttagtc 180
ttcaccaaca tcggttacca acacccaaag gttgtcgcag ctatccaaga acaagccgca 240
tctttgacta catttgcccc agctttcgca gttgaagcaa gatccgaagc tgcaagattg 300
atcgctgagc gtactccagg tgatttagac aaaatcttct tcaccaacgg tggcgcagat 360
gctatcgagc acgctgttcg tatggcaaga atccacgctg gtagaccaaa ggtcttatcc 420
gcatacagat cataccacgg tggtacacaa caggcagtca acatcactgg tgatccaagg 480
agatgggcat ccgattccgc ttctgctggc gttgtccact tctgggctcc atacttatac 540
agatccagat tctacgccga aactgagcaa caagaatgtg agcgtgctct tgagcacttg 600
gaaactacta tcgccttcga aggtccaggt actattgccg ctatcgtttt ggaaactgtc 660
ccaggtactg ctggtatcat ggttcctcca ccaggttact tagcaggtgt tagagaattg 720
tgtgacaaat acggtatcgt cttcgtcttg gatgaagtca tggctggttt cggcagaact 780
ggcgaatggt tcgctgcaga cttattcgat gttaccccag acttgatgac cttcgctaag 840
ggtgtcaact caggttacgt tccattgggt ggtgttgcta tctccggcaa aatcgcagag 900
actttcggta agagagctta cccaggtggt ttgacgtact ccggtcaccc tcttgcttgc 960
gcagccgctg ttgctactat caacgttatg gcagaagaag gtgtcgttga aaacgctgca 1020
aacttgggtg ctagagttat cgaaccaggt ttgagagaac ttgcagagag acacccatca 1080
gttggtgaag ttagaggtgt tggtatgttc tgggctttgg aattggttaa ggatagagaa 1140
accagagaac ctttggtccc atacaatgcc gctggtgaag cgaacgcacc aatggctgct 1200
ttcggtgcag ctgcaaaggc aaacggtttg tggccattca tcaacatgaa cagaacccac 1260
gttgttcctc cttgtaacgt taccgaagcc gaagctaaag aaggcttggc agcattggat 1320
gcagctttat ctgttgcaga tgagtacact gtctaa 1356
<210> 141
<211> 1416
<212> DNA
<213> 酿酒酵母
<400> 141
atgtccatct gtgagcaata ctacccagaa gaaccaacca agccaaccgt caagaccgaa 60
tccatccctg gtccagaatc ccaaaagcaa ttgaaggaat tgggtgaagt tttcgacacc 120
agaccagctt acttcttggc agactacgaa aagtccttgg gtaactacat caccgacgtc 180
gacggtaaca cctacttgga cttgtacgct caaatctcct ccatcgcctt gggttacaac 240
aacccagcat tgatcaaagc cgctcaatcc ccagaaatga tcagagcatt ggttgacaga 300
ccagccttgg gtaacttccc ttccaaggac ttggacaaga tcttgaagca aatcttgaag 360
tccgctccaa agggtcagga ccacgtctgg tccggtttgt ccggtgcaga cgcaaacgaa 420
ttggctttca aggctgcatt catctactac agagctaagc aaagaggtta cgacgcagac 480
ttctccgaaa aggaaaactt gtccgttatg gacaacgacg caccaggtgc tccacacttg 540
gcagttttgt ccttcaagag agctttccac ggtagattgt tcgcatccgg ttccactacc 600
tgttccaagc caatccacaa gttggacttc cctgctttcc actggccaca cgccgaatac 660
ccatcctacc agtacccttt ggacgaaaac tccgacgcaa acagaaagga ggacgaccac 720
tgcttggcaa tcgttgaaga attgatcaag acctggtcca tccctgttgc tgcgttgatc 780
atcgaaccaa tccaatccga gggtggtgac aaccacgcct ccaagtactt cttgcaaaag 840
ttgagagaca tcaccttgaa gtacaacgtc gtctacatca tcgacgaagt ccaaactggc 900
gttggcgcaa ccggtaagtt gtggtgtcac gaatacgcag acatccagcc tccagtcgac 960
ttggtcacct tctccaagaa gttccaatcc gctggctact tcttccacga ccctaagttc 1020
atcccaaaca agccatacag acaattcaac acctggtgtg gtgaaccagc aagaatgatc 1080
atcgcaggtg caatcggtca agagatctcc gacaagaagt tgaccgaaca atgctccaga 1140
gtcggtgact acttgttcaa gaagttggaa ggtttgcaaa agaagtaccc agagaacttc 1200
caaaacttga gaggtaaggg tagaggcacc ttcatcgctt gggacttgcc aactggcgag 1260
aagagagact tgttgttgaa gaagttgaag ttgaacggct gtaacgttgg tggctgtgct 1320
gttcacgcag tcagattgag accttccttg accttcgaag agaagcacgc agacatcttc 1380
atcgaagctt tggctaagtc cgtcaacgaa ttgtaa 1416
<210> 142
<211> 1428
<212> DNA
<213> 克鲁维酵母
<400> 142
atgccatcct actccgttgc agaattgtac tacccagacg aacctaccga acctaagatc 60
tccacctcct cctacccagg tccaaaggca aagcaagaat tggaaaagtt gtccaacgtc 120
ttcgacacca gagcagctta cttgttggca gactactaca agtcccgtgg taactacatc 180
gttgaccagg acggtaacgt cttgttggac gtttacgctc aaatctcctc catcgccttg 240
ggttacaaca acccagaaat cttgaaggtt gcaaagtccg acgcaatgtc cgttgcattg 300
gccaaccgtc cagcattggc ttgtttccca tccaacgact acggtcaatt gttggaagac 360
ggtttgttga aggcagcacc acaaggtcaa gacaagatct ggaccgcttt gtccggttcc 420
gacgcaaacg aaaccgcctt caaagcctgc ttcatgtacc aagctgcgaa gaagagaaac 480
ggtagatcct tctccaccga agaattggaa tccgttatgg acaaccaatt gccaggcacc 540
tccgaaatgg ttatctgttc cttcgaaaag ggtttccacg gtcgtttgtt cggttccttg 600
tccactacca gatccaagcc tatccacaag ttggacatcc cagctttcaa ctggcctaaa 660
gccccattcc cagacttgaa gtacccattg gaagaaaaca aggaagccaa caaggctgaa 720
gaatcctcct gtatcgaaaa gttctcccaa atcgttcaag agtggcaagg taagatcgct 780
gcagttatca tcgaaccaat ccagtccgag ggtggcgaca accacgcttc ctccgacttc 840
ttccaaaagt tgagagaaat caccatcgaa aacggtatct tgatgatcgt cgacgaagtt 900
caaaccggtg tcggtgctac cggcaagatg tgggcacacg aacactggaa cttgtccaac 960
cctccagact tggttacctt ctccaagaag ttccaagcag caggtttcta ctaccacgac 1020
ccaaagttgc aaccagacca gccattcaga cagttcaaca cctggtgtgg tgacccatcc 1080
aaggctttga tcgccaaggt tatctacgaa gaaatcgtta agcacgactt ggtcaccaga 1140
actgccgaag tcggtaacta cttgttcaac agattggaaa agttgttcga aggtaagaac 1200
tacatccaga acttgagagg taagggtcaa ggcacctaca tcgctttcga cttcggcacc 1260
tcctccgaga gagactcctt cttgtccaga ttgagatgta acggtgcaaa cgtcgctggt 1320
tgcggtgact ccgctgtcag attgagacca tccttgacct tcgaagagaa gcacgcagac 1380
gtcttggttt ccatcttcga caagaccttg agacaattgt acggctaa 1428
<210> 143
<211> 747
<212> DNA
<213> 大肠杆菌
<400> 143
atgatcgttt tggtcaccgg tgcaaccgca ggtttcggcg aatgtatcac cagaagattc 60
atccagcagg gtcacaaggt tatcgctacc ggtagaagac aagagagatt gcaagaattg 120
aaggacgagt tgggtgacaa cttgtacatc gctcaattgg acgttagaaa cagagcagct 180
atcgaagaaa tgttggcatc cttgccagct gaatggtgca acatcgacat cttggtcaac 240
aacgctggtt tggcattggg tatggaacca gctcacaagg ctagtgttga ggactgggag 300
accatgatcg acaccaacaa caagggtttg gtctacatga ccagagcagt tttgcctggt 360
atggttgaaa gaaaccacgg tcacatcatc aacatcggtt ccaccgctgg ttcctggcca 420
tacgctggcg gtaacgtcta cggtgctacc aaggctttcg ttagacagtt ctccttgaac 480
ttgagaaccg acttgcacgg caccgctgtt agagttaccg acatcgaacc aggtttggtt 540
ggtggcaccg aattctccaa cgtcagattc aagggcgacg acggtaaggc tgaaaagacc 600
taccaaaaca ccgtcgcttt gaccccagaa gacgtttcag aggctgtttg gtgggtcagt 660
accttgccag cacacgtcaa catcaacacc ttggaaatga tgccagtcac ccaatcctac 720
gcaggtttga acgttcacag acaataa 747
<210> 144
<211> 804
<212> DNA
<213> 酿酒酵母
<400> 144
atgtcccaag gtagaaaggc agcagaaaga ttggcaaaga agaccgtctt gatcaccggt 60
gcgtccgctg gtatcggtaa ggctaccgcg ttggagtact tggaagcatc caacggtgac 120
atgaagttga tcttggcagc aagaagattg gagaagttgg aagaattgaa gaagaccatc 180
gaccaagaat tcccaaacgc taaggtccac gttgcacaat tggacatcac ccaagcagag 240
aagatcaagc cattcatcga aaacttgcca caagaattca aggacatcga catcttggtc 300
aacaacgctg gtaaggcgtt gggttccgac agagttggtc aaatcgcaac cgaagacatc 360
caagacgtct tcgacaccaa cgtcaccgct ttgatcaaca tcacccaagc tgttttgcca 420
atcttccaag cgaagaactc cggtgacatc gtcaacttgg gttccatcgc tggtagagac 480
gcatacccaa ccggctccat ctactgcgcc tccaagttcg ctgtcggtgc tttcaccgac 540
tccttgagaa aggaattgat caacaccaag atcagagtca tcttgattgc ccctggtttg 600
gtcgaaaccg aattctcctt ggttagatac agaggtaacg aagaacaagc aaagaacgtt 660
tacaaggaca ctaccccatt gatggccgac gacgttgcag acttgatcgt ttacgctacc 720
tccagaaagc aaaacaccgt tatcgcagac accttgatct tcccaaccaa ccaagcatcc 780
ccacaccaca tcttcagagg ttaa 804
<210> 145
<211> 420
<212> DNA
<213> 阿维链霉菌
<400> 145
atgcttagaa ccatgttcaa atccaagatc cacagagcaa ccgtcactca agcagatttg 60
cattacgttg gttctgttac tattgacgca gacttacttg atgcagccga tttacttcct 120
ggtgagcttg ttcatattgt tgatatcacc aatggtgcgc gtcttgaaac ctatgtcatt 180
gagggtgaac gtggttccgg tgtcgtcggt atcaatggcg cagctgcaca cctcgtccat 240
ccaggtgacc tggtcatcat catttcttat gcacaggtct ccgatgctga agcccgtgcc 300
ttaagaccaa gagtcgttca cgtcgacaga gataacagag ttgtcgcttt aggtgcagac 360
ccagcagagc cagttccagg ttccgatcaa gctagatcac cacaggctgt taccgcctaa 420
<210> 146
<211> 420
<212> DNA
<213> 阿维链霉菌
<400> 146
atgttaagaa ctatgtttaa gtccaagatt cacagagcta ccgtcaccca agcagatttg 60
cattacgtcg gttccgttac cattgatgca gatttactcg atgcggcaga cttgttacct 120
ggtgaactag ttcacattgt tgacattacc aatggtgcta gattggaaac ttacgtcatt 180
gaaggtgaaa gaggtagtgg tgtcgttggt atcaatggtg cagctgctca cttagttcac 240
ccaggtgact tagtcatcat catttcatat gcacaagttt ccgatgcgga agctagagca 300
ttaagaccaa gagttgttca tgttgataga gacaacagag tcgttgcact tggtgcagat 360
cctgctgaac cagttccagg ttcagatcaa gctaggtctc cacaagcagt tactgcataa 420
<210> 147
<211> 420
<212> DNA
<213> 阿维链霉菌
<400> 147
atgttaagaa ctatgttcaa gagtaagatt catagggcta ccgttaccca ggcagatcta 60
cattatgttg gttctgttac cattgacgca gatttgttgg atgcagcaga cttgttacca 120
ggtgaactcg ttcacattgt cgatatcacc aacggtgcca gactggaaac ttatgtcatt 180
gaaggtgaga gaggcagtgg tgttgtcggc attaacggtg ccgcagcaca cttggttcat 240
ccaggtgact tggtcatcat catttcttac gcacaagtct ccgatgccga agctagagca 300
ttgagaccta gagtcgttca cgttgacaga gacaatagag ttgttgctct tggtgcagat 360
ccagctgagc cagttccagg ttccgatcaa gcgagatctc ctcaagctgt tactgcataa 420
<210> 148
<211> 384
<212> DNA
<213> 地衣芽孢杆菌
<400> 148
atgtatagaa ccttgatgag tgcaaagctt cacagagcaa gagtcactga agcaaacttg 60
aactacgttg gttctgttac tattgacgaa gacttacttg atgcagtcgg tatgatggca 120
aacgagaaag ttcaaattgt caacaataac aatggtgcgc gtcttgaaac ctatatcatt 180
cctggtgaac gtggttccgg tgtcgtctgc ttgaatggcg cagctgcaag gctcgtccaa 240
gttggtgacg tcgtcatcat tgtttcttat gcaatgatgt ccgaagaaga agccaaaaca 300
cataagccaa aggtcgctgt cctcaatgaa agaaacgaaa ttgaggaaat gttaggtcag 360
gaaccagcga gaaccatctt ataa 384
<210> 149
<211> 384
<212> DNA
<213> 地衣芽孢杆菌
<400> 149
atgtatagaa ccttgatgag tgcaaagctt cacagagcaa gagtcactga agcaaacttg 60
aactacgttg gttctgttac tattgacgaa gacttacttg atgcagtcgg tatgatggca 120
aacgagaaag ttcaaattgt caacaataac aatggtgcgc gtcttgaaac ctatatcatt 180
cctggtgaac gtggttccgg tgtcgtctgc ttgaatggcg cagctgcaag gctcgtccaa 240
gttggtgacg tcgtcatcat tgtttcttat gcaatgatgt ccgaagaaga agccaaaaca 300
cataagccaa aggtcgctgt cctcaatgaa agaaacgaaa ttgaggaaat gttaggtcag 360
gaaccagcga gaaccatctt ataa 384
<210> 150
<211> 384
<212> DNA
<213> 地衣芽孢杆菌
<400> 150
atgtacagaa cgttaatgtc tgccaagtta cacagagcga gagttactga agcaaatctc 60
aactatgttg gttcagttac cattgatgag gatctattgg atgctgttgg tatgatggca 120
aatgaaaagg ttcaaatcgt caataacaac aatggtgcta gattagaaac ttacatcatt 180
cctggtgaaa gaggttcagg tgttgtttgc ttaaacggtg ctgccgcaag attagttcaa 240
gtcggtgatg ttgttatcat cgtctcttat gctatgatga gtgaggaaga agctaagact 300
cataagccta aggttgccgt tctcaatgag agaaacgaaa tcgaagaaat gcttggccaa 360
gaacctgcca gaaccatcct gtaa 384
<210> 151
<211> 384
<212> DNA
<213> 地衣芽孢杆菌
<400> 151
atgtatagaa cattgatgtc tgcaaagttg catagggctc gtgttactga ggcaaatcta 60
aactacgtcg gttccgtcac aatcgatgaa gatctactcg atgccgttgg tatgatggcc 120
aatgaaaaag ttcaaattgt caacaacaac aacggtgcaa gattggagac ctatatcatt 180
cctggtgaaa gaggttcagg tgttgtttgt ctgaacggtg ctgctgcgag gttggtccaa 240
gtcggtgatg ttgtcattat cgtttcttat gcaatgatgt cagaagaaga agctaagacc 300
cataagccaa aggttgctgt tttgaacgaa agaaatgaga ttgaggaaat gttaggtcaa 360
gaaccagcaa gaacaatctt ataa 384
<210> 152
<211> 54
<212> DNA
<213> 东方伊萨酵母
<400> 152
taaaacgacg gccagtgaat tccgcggcgg ccgcgagtcc atcggttcct gtca 54
<210> 153
<211> 59
<212> DNA
<213> 东方伊萨酵母
<400> 153
cataagaaaa tcaaagacag aaggcgcgcc tttgctagca tttttgtgtt ttgctgtgt 59
<210> 154
<211> 59
<212> DNA
<213> 人工序列
<220>
<223> 人工引物
<400> 154
acacagcaaa acacaaaaat gctagcaaag gcgcgccttc tgtctttgat tttcttatg 59
<210> 155
<211> 45
<212> DNA
<213> 人工序列
<220>
<223> 人工引物
<400> 155
gggggaaaga actaccaata ggcctccttt aattcggaga aaatc 45
<210> 156
<211> 45
<212> DNA
<213> 人工序列
<220>
<223> 人工引物
<400> 156
gattttctcc gaattaaagg aggcctattg gtagttcttt ccccc 45
<210> 157
<211> 51
<212> DNA
<213> 人工序列
<220>
<223> 人工引物
<400> 157
aaaataaact agtaaaataa attaattaat tatctagaga gggggttata t 51
<210> 158
<211> 51
<212> DNA
<213> 人工序列
<220>
<223> 人工引物
<400> 158
atataacccc ctctctagat aattaattaa tttattttac tagtttattt t 51
<210> 159
<211> 53
<212> DNA
<213> 人工序列
<220>
<223> 人工引物
<400> 159
gaccatgatt acgccaagct ccgcggcggc cgcccagtca aaaccttctt ctc 53
<210> 160
<211> 52
<212> DNA
<213> 人工序列
<220>
<223> 人工引物
<400> 160
taaaacgacg gccagtgaat tccgcggcgg ccgcctttga aggagcttgc ca 52
<210> 161
<211> 49
<212> DNA
<213> 人工序列
<220>
<223> 人工引物
<400> 161
ctattccttc ctcaaattgc tgtttaaacg cgttgaagat ctattctcc 49
<210> 162
<211> 49
<212> DNA
<213> 人工序列
<220>
<223> 人工引物
<400> 162
ggagaataga tcttcaacgc gtttaaacag caatttgagg aaggaatag 49
<210> 163
<211> 55
<212> DNA
<213> 人工序列
<220>
<223> 人工引物
<400> 163
aatgttcatt ttacattcag atgttaatta aggtctagat gtgtttgttt gtgtg 55
<210> 164
<211> 55
<212> DNA
<213> 人工序列
<220>
<223> 人工引物
<400> 164
cacacaaaca aacacatcta gaccttaatt aacatctgaa tgtaaaatga acatt 55
<210> 165
<211> 53
<212> DNA
<213> 人工序列
<220>
<223> 人工引物
<400> 165
gaccatgatt acgccaagct ccgcggcggc cgcaatgcca agagttatgg ggc 53
<210> 166
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 人工引物
<400> 166
ggctacccta tatatggtga gcg 23
<210> 167
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 人工引物
<400> 167
gggtccaagt tatccaagca g 21
<210> 168
<211> 29
<212> DNA
<213> 人工序列
<220>
<223> 人工引物
<400> 168
ccttaattaa ccgtaaagtt gtctcaatg 29
<210> 169
<211> 55
<212> DNA
<213> 人工序列
<220>
<223> 人工引物
<400> 169
cagcaaaaca caaaaattct agaaaattta attaacatct gaatgtaaaa tgaac 55
<210> 170
<211> 55
<212> DNA
<213> 人工序列
<220>
<223> 人工引物
<400> 170
gttcatttta cattcagatg ttaattaaat tttctagaat ttttgtgttt tgctg 55
<210> 171
<211> 32
<212> DNA
<213> 人工序列
<220>
<223> 人工引物
<400> 171
gctctagata aaatgccctc ttattctgtc gc 32
<210> 172
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工引物
<400> 172
gactggatca ttatgactcc 20
<210> 173
<211> 44
<212> DNA
<213> 人工序列
<220>
<223> 人工引物
<400> 173
acgccttgcc aaatgcggcc gcgagtccat cggttcctgt caga 44
<210> 174
<211> 49
<212> DNA
<213> 人工序列
<220>
<223> 人工引物
<400> 174
tcaaagacag aattaattaa gctctagaat ttttgtgttt tgctgtgtt 49
<210> 175
<211> 49
<212> DNA
<213> 人工序列
<220>
<223> 人工引物
<400> 175
aacacaaaaa ttctagagct taattaattc tgtctttgat tttcttatg 49
<210> 176
<211> 32
<212> DNA
<213> 人工序列
<220>
<223> 人工引物
<400> 176
gtttaaacct ttaattcgga gaaaatctga tc 32
<210> 177
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 人工引物
<400> 177
gttaacggta ccgagctcta agtagtggtg 30
<210> 178
<211> 41
<212> DNA
<213> 人工序列
<220>
<223> 人工引物
<400> 178
aaccgatgga ctcgcggccg catttggcaa ggcgtatcta t 41
<210> 179
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 人工引物
<400> 179
ggcgccagca atttgaggaa ggaataggag 30
<210> 180
<211> 52
<212> DNA
<213> 人工序列
<220>
<223> 人工引物
<400> 180
aaactattag attaattaag ctcgcgatgt gtttgtttgt gtgttttgtg tg 52
<210> 181
<211> 52
<212> DNA
<213> 人工序列
<220>
<223> 人工引物
<400> 181
caaacaaaca catcgcgagc ttaattaatc taatagttta atcacagctt at 52
<210> 182
<211> 42
<212> DNA
<213> 人工序列
<220>
<223> 人工引物
<400> 182
tacattatgg tagcggccgc gtgtgacatt ttgatccact cg 42
<210> 183
<211> 47
<212> DNA
<213> 人工序列
<220>
<223> 人工引物
<400> 183
tggatcaaaa tgtcacacgc ggccgctacc ataatgtatg cgttgag 47
<210> 184
<211> 27
<212> DNA
<213> 人工序列
<220>
<223> 人工引物
<400> 184
gggccctaaa agtgttggtg tattaga 27
<210> 185
<211> 33
<212> DNA
<213> 人工序列
<220>
<223> 人工引物
<400> 185
gctagctcaa caaactcttt atcagattta gca 33
<210> 186
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 人工引物
<400> 186
gctagcgagg aaaagaagtc taacctttgt 30
<210> 187
<211> 35
<212> DNA
<213> 人工序列
<220>
<223> 人工引物
<400> 187
tcgcgataaa atgtcaactg tggaagatca ctcct 35
<210> 188
<211> 27
<212> DNA
<213> 人工序列
<220>
<223> 人工引物
<400> 188
ttaattaagc tgctggcgct tcatctt 27
<210> 189
<211> 32
<212> DNA
<213> 人工序列
<220>
<223> 人工引物
<400> 189
tcgcgataaa atgtccagag gcttctttac tg 32
<210> 190
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 人工引物
<400> 190
ttaattaact aaaggtctct cacgacagag 30
<210> 191
<211> 40
<212> DNA
<213> 人工序列
<220>
<223> 人工引物
<400> 191
gttaacccgg tttaaacata gcctcatgaa atcagccatt 40
<210> 192
<211> 44
<212> DNA
<213> 人工序列
<220>
<223> 人工引物
<400> 192
gggcccatat ggcgcccggg gcgttgaaga tctattctcc agca 44
<210> 193
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 人工引物
<400> 193
gtttaaacga ttggtagttc tttccccctc 30
<210> 194
<211> 46
<212> DNA
<213> 人工序列
<220>
<223> 人工引物
<400> 194
aataaattaa gggcccttta tcgcgagagg gggttatatg tgtaaa 46
<210> 195
<211> 50
<212> DNA
<213> 人工序列
<220>
<223> 人工引物
<400> 195
tataaccccc tctcgcgata aagggccctt aatttatttt actagtttat 50
<210> 196
<211> 27
<212> DNA
<213> 人工序列
<220>
<223> 人工引物
<400> 196
gtttaaactt ttgtagcacc tcctggt 27
<210> 197
<211> 48
<212> DNA
<213> 人工序列
<220>
<223> 人工引物
<400> 197
cagcaaaaca caaaaagcta gctaaaatgt tacgtaccat gttcaaaa 48
<210> 198
<211> 46
<212> DNA
<213> 人工序列
<220>
<223> 人工引物
<400> 198
gaaaatcaaa gacagaaggc gcgccttatg ctgtaacagc ctgcgg 46
<210> 199
<211> 49
<212> DNA
<213> 人工序列
<220>
<223> 人工引物
<400> 199
cagcaaaaca caaaaagcta gctaaaatgt taagaaccat gttcaaatc 49
<210> 200
<211> 47
<212> DNA
<213> 人工序列
<220>
<223> 人工引物
<400> 200
gaaaatcaaa gacagaaggc gcgccttatg cagtaacagc ttgtggg 47
<210> 201
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工引物
<400> 201
gcatggtggt gcaagcgacg 20
<210> 202
<211> 19
<212> DNA
<213> 人工序列
<220>
<223> 人工引物
<400> 202
ggtgctgcat ttgctgctg 19
<210> 203
<211> 25
<212> DNA
<213> 人工序列
<220>
<223> 人工引物
<400> 203
tgtatacagg atcgaagaat agaag 25
<210> 204
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> 人工引物
<400> 204
gaacgtctac aacgaggtga ac 22
<210> 205
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 人工引物
<400> 205
ggcgcgcctc gcgataaaat g 21
<210> 206
<211> 32
<212> DNA
<213> 人工序列
<220>
<223> 人工引物
<400> 206
agggccctta attaattatg cagtaacagc tt 32
<210> 207
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工引物
<400> 207
cgctacgata cgctacgata 20
<210> 208
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工引物
<400> 208
ctcccttccc tgatagaagg 20
<210> 209
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 人工引物
<400> 209
ggggagcaat ttgccaccag g 21
<210> 210
<211> 25
<212> DNA
<213> 人工序列
<220>
<223> 人工引物
<400> 210
ctccttcatt taactatacc agacg 25
<210> 211
<211> 26
<212> DNA
<213> 人工序列
<220>
<223> 人工引物
<400> 211
gacagatgta aggaccaata gtgtcc 26
<210> 212
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 人工引物
<400> 212
ccatatcgaa atctagcccg tcc 23
<210> 213
<211> 58
<212> DNA
<213> 人工序列
<220>
<223> 人工引物
<400> 213
cataagaaaa tcaaagacag aaggcgcgcc tttgctagct ttttgtgttt tgctgtgt 58
<210> 214
<211> 19
<212> DNA
<213> 人工序列
<220>
<223> 人工引物
<400> 214
attggacaca acattatat 19
<210> 215
<211> 46
<212> DNA
<213> 人工序列
<220>
<223> 人工引物
<400> 215
gtaaaacgac ggccagtgaa ttgttaacat aggctccaac atctcg 46
<210> 216
<211> 38
<212> DNA
<213> 人工序列
<220>
<223> 人工引物
<400> 216
ggaaccgatg gactcgcggc cgcgtgggat attggaag 38
<210> 217
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> 人工引物
<400> 217
ggaggtgcta caaaaggaat tc 22
<210> 218
<211> 48
<212> DNA
<213> 人工序列
<220>
<223> 人工引物
<400> 218
gaccatgatt acgccaagct ccgcggagtc aaaaccttct tctctacc 48
<210> 219
<211> 46
<212> DNA
<213> 人工序列
<220>
<223> 人工引物
<400> 219
gtaaaacgac ggccagtgaa ttctttgaag gagcttgcca agaaac 46
<210> 220
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 人工引物
<400> 220
cctattcctt cctcaaattg ctg 23
<210> 221
<211> 38
<212> DNA
<213> 人工序列
<220>
<223> 人工引物
<400> 221
ataactcttg gcattgcggc cgccaagtta gttagagc 38
<210> 222
<211> 51
<212> DNA
<213> 人工序列
<220>
<223> 人工引物
<400> 222
atgaccatga ttacgccaag ctccgcggca aagacggtgt attagtgctt g 51
<210> 223
<211> 64
<212> DNA
<213> 人工序列
<220>
<223> 人工引物
<400> 223
cacaaaacac acaaacaaac acagctagca aaggcgcgcc atctaatagt ttaatcacag 60
ctta 64
<210> 224
<211> 47
<212> DNA
<213> 人工序列
<220>
<223> 人工引物
<400> 224
gccgttgcag caaatgtcga ggcctgtgtg acattttgat ccactcg 47
<210> 225
<211> 47
<212> DNA
<213> 人工序列
<220>
<223> 人工引物
<400> 225
cgagtggatc aaaatgtcac acaggcctcg acatttgctg caacggc 47
<210> 226
<211> 51
<212> DNA
<213> 人工序列
<220>
<223> 人工引物
<400> 226
cattttacat tcagatgtta attaattatc tagatgttgt tgttgttgtc g 51
<210> 227
<211> 51
<212> DNA
<213> 人工序列
<220>
<223> 人工引物
<400> 227
cgacaacaac aacaacatct agataattaa ttaacatctg aatgtaaaat g 51
<210> 228
<211> 51
<212> DNA
<213> 人工序列
<220>
<223> 人工引物
<400> 228
gctctaacta acttggcggc cgcttttatt ataaaattat atattattct t 51
<210> 229
<211> 47
<212> DNA
<213> 人工序列
<220>
<223> 人工引物
<400> 229
aacacacaaa caaacacagc tagctaaaat gttaagaact atgttta 47
<210> 230
<211> 46
<212> DNA
<213> 人工序列
<220>
<223> 人工引物
<400> 230
gattaaacta ttagatggcg cgccttatgc agtaactgct tgtgga 46
<210> 231
<211> 42
<212> DNA
<213> 人工序列
<220>
<223> 人工引物
<400> 231
cgacggccag tgaattcgtt aacccgtttc gatgggattc cc 42
<210> 232
<211> 46
<212> DNA
<213> 人工序列
<220>
<223> 人工引物
<400> 232
caggaaccga tggactcgcg gccgctccct tctctaaatg gactgc 46
<210> 233
<211> 48
<212> DNA
<213> 人工序列
<220>
<223> 人工引物
<400> 233
tatataattt tataataaaa gcggccgcac caggggttta gtgaagtc 48
<210> 234
<211> 47
<212> DNA
<213> 人工序列
<220>
<223> 人工引物
<400> 234
catgattacg ccaagctccg cggccataac tgacatttat ggtaagg 47
<210> 235
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 人工引物
<400> 235
ccaacaatct taattggtga c 21
<210> 236
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工引物
<400> 236
ggctgttacc gcctaattaa 20
<210> 237
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 人工引物
<400> 237
gttcttaaca ttttagctag ctg 23
<210> 238
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 人工引物
<400> 238
acgcgtcgac tcgacatttg ctgcaacggc 30
<210> 239
<211> 29
<212> DNA
<213> 人工序列
<220>
<223> 人工引物
<400> 239
ctagtctaga tgttgttgtt gttgtcgtt 29
<210> 240
<211> 49
<212> DNA
<213> 人工序列
<220>
<223> 人工引物
<400> 240
caaaacacag caaaacacaa aaagctagca tgtatagaac cttgatgag 49
<210> 241
<211> 40
<212> DNA
<213> 人工序列
<220>
<223> 人工引物
<400> 241
caaagacaga aggcgcgcct tataagatgg ttctcgctgg 40
<210> 242
<211> 50
<212> DNA
<213> 人工序列
<220>
<223> 人工引物
<400> 242
caaaacacac aaacaaacac agctagcatg tacagaacgt taatgtctgc 50
<210> 243
<211> 47
<212> DNA
<213> 人工序列
<220>
<223> 人工引物
<400> 243
gtgattaaac tattagatgg cgcgccttac aggatggttc tggcagg 47
<210> 244
<211> 703
<212> DNA
<213> 东方伊萨酵母
<400> 244
gagtccatcg gttcctgtca gatgggatac tcttgacgtg gaaaattcaa acagaaaaaa 60
aaccccaata atgaaaaata acactacgtt atatccgtgg tatcctctat cgtatcgtat 120
cgtagcgtat cgtagcgtac cgtatcacag tatagtctaa tattccgtat cttattgtat 180
cctatcctat tcgatcctat tgtatttcag tgcaccattt taatttctat tgctataatg 240
tccttattag ttgccactgt gaggtgacca atggacgagg gcgagccgtt cagaagccgc 300
gaagggtgtt cttcccatga atttcttaag gagggcggct cagctccgag agtgaggcga 360
gacgtctcgg tcagcgtatc ccccttcctc ggcttttaca aatgatgcgc tcttaatagt 420
gtgtcgttat ccttttggca ttgacggggg agggaaattg attgagcgca tccatatttt 480
tgcggactgc tgaggacaat ggtggttttt ccgggtggcg tgggctacaa atgatacgat 540
ggtttttttc ttttcggaga aggcgtataa aaaggacacg gagaacccat ttattctaaa 600
aacagttgag cttctttaat tattttttga tataatattc tattattata tattttcttc 660
ccaataaaac aaaataaaac aaaacacagc aaaacacaaa aat 703
<210> 245
<211> 961
<212> DNA
<213> 东方伊萨酵母
<400> 245
agcaatttga ggaaggaata ggagaaggag aagcaatttc taggaaagag caaggtgtgc 60
aacagcatgc tctgaatgat attttcagca atagttcagt tgaagaacct gttggcgtat 120
ctacatcact tcctacaaac aacaccacga attgcgtccg tggtgacgca actacgaatg 180
gcattgtcaa tgccaatgcc agtgcacata cacgtgcaag tcccaccggt tccctgcccg 240
gctatggtag agacaagaag gacgataccg gcatcgacat caacagtttc aacagcaatg 300
cgtttggcgt cgacgcgtcg atggggctgc cgtatttgga tttggacggg ctagatttcg 360
atatggatat ggatatggat atggatatgg agatgaattt gaatttagat ttgggtcttg 420
atttggggtt ggaattaaaa ggggataaca atgagggttt tcctgttgat ttaaacaatg 480
gacgtgggag gtgattgatt taacctgatc caaaaggggt atgtctattt tttagagtgt 540
gtctttgtgt caaattatgg tagaatgtgt aaagtagtat aaactttcct ctcaaatgac 600
gaggtttaaa acaccccccg ggtgagccga gccgagaatg gggcaattgt tcaatgtgaa 660
atagaagtat cgagtgagaa acttgggtgt tggccagcca agggggaagg aaaatggcgc 720
gaatgctcag gtgagattgt tttggaattg ggtgaagcga ggaaatgagc gacccggagg 780
ttgtgacttt agtggcggag gaggacggag gaaaagccaa gagggaagtg tatataaggg 840
gagcaatttg ccaccaggat agaattggat gagttataat tctactgtat ttattgtata 900
atttatttct ccttttatat caaacacatt acaaaacaca caaaacacac aaacaaacac 960
a 961
<210> 246
<211> 992
<212> DNA
<213> 东方伊萨酵母
<400> 246
tattggtagt tctttccccc tctcaagctg gcgtgaaatg caaccttacg gcgtctacgt 60
tactacaagg tccagaaagt gtaggtattg ctactatttt tattttttat tggttctgga 120
gaaatgcaga cagtcaatga acacaactgt ctcaatatgc atctatgcac atgcacacac 180
acacacatca caggtacccc tacaaagaga ggtctcttga taatgtttca ttaccacgtg 240
gcatcccccc cccccccccc aataaacaag tggccgagtt cccctgttgc agaggaggac 300
aaaaaaaccg ctggtgttgg taccattatg cagcaactag cacaacaaac aaccgaccca 360
gacatacaaa tcaacaacac ttcgccaaag acaccctttc cagggaggat ccactcccaa 420
cgtctctcca taatgtctct gttggcccat gtctctgtcg ttgacaccgt aaccacacca 480
accaacccgt ccattgtact gggatggtcg tccatagaca cctctccaac ggggaacacc 540
tcattcgtaa accgccaagg ttaccgttcc tcctgactcg ccccgttgtt gatgctgcgc 600
acctgtggtt gcccaacatg gttgtatatc gtgtaaccac accaacacat gtgcagcaca 660
tgtgtttaaa agagtgtcat ggaggtggat catgatggaa gtggacttta ccacttggga 720
actgtctcca ctcccgggaa gaaaagaccc ggcgtatcac gcggttgcct caatggggca 780
atttggaagg agaaatatag ggaaaatcac gtcgctctcg gacggggaag agttccagac 840
tatgaggggg gggggtggta tataaagaca ggagatgtcc acccccagag agaggaagaa 900
gttggaactt tagaagagag agataacttt ccccagtgtc catcaataca caaccaaaca 960
caaactctat atttacacat ataaccccct ct 992
<210> 247
<211> 613
<212> DNA
<213> 东方伊萨酵母
<400> 247
ttgctgcaac ggcaacatca atgtccacgt ttacacacct acatttatat ctatatttat 60
atttatattt atttatttat gctacttagc ttctatagtt agttaatgca ctcacgatat 120
tcaaaattga cacccttcaa ctactcccta ctattgtcta ctactgtcta ctactcctct 180
ttactatagc tgctcccaat aggctccacc aataggctct gtcaatacat tttgcgccgc 240
cacctttcag gttgtgtcac tcctgaagga ccatattggg taatcgtgca atttctggaa 300
gagagtccgc gagaagtgag gcccccactg taaatcctcg agggggcatg gagtatgggg 360
catggaggat ggaggatggg gggggggggg gggaaaatag gtagcgaaag gacccgctat 420
caccccaccc ggagaactcg ttgccgggaa gtcatatttc gacactccgg ggagtctata 480
aaaggcgggt tttgtctttt gccagttgat gttgctgaga ggacttgttt gccgtttctt 540
ccgatttaac agtatagaat caaccactgt taattataca cgttatacta acacaacaaa 600
aacaaaaaca acg 613
<210> 248
<211> 399
<212> DNA
<213> 东方伊萨酵母
<400> 248
tctgtctttg attttcttat gttattcaaa acatctgccc caaaatctaa cgattatata 60
tattcctacg tataactgta tagctaatta ttgatttatt tgtacataaa aaccacataa 120
atgtaaaagc aagaaaaaaa ataactaagg agaaggatca atatctcatt tataatgctc 180
gccaaagcag cgtacgtgaa ttttaatcaa gacatcaaca aatcttgcaa cttggttata 240
tcgcttcttc acccactcac ccgcttttct acattgttga acacaaatat atacaggggt 300
atgtctcaag gtcaagtgca gtttcaacag agactacctc aaggtacctc ttcagaaatg 360
cagaacttca ctcttgatca gattttctcc gaattaaag 399
<210> 249
<211> 422
<212> DNA
<213> 东方伊萨酵母
<400> 249
atctaatagt ttaatcacag cttatagtct attatagttt tcttttttaa acattgttgt 60
attttgtccc cccccctcta attgatgatg attatcctat aagaatccaa taaaacgatg 120
gaaactaata ctttctcctt tgtcatgtgg tctttagtat ttcttgaaca ttggctctga 180
tttctcgact ttatagtcct attaaaatct ctgttagttc tcgatcgttg tatctcgttt 240
cttgtctctt tggtggatga ttttgcgtgc gaacatgttt ttttcccttt ctctcaccat 300
catcgtgtag ttcttgtcac catcccccca ccccttcctt ctctcattga ttctataaga 360
gcttatccac agaggtgcag taacgaggta gtttaacctt cgagtggatc aaaatgtcac 420
ac 422
<210> 250
<211> 421
<212> DNA
<213> 东方伊萨酵母
<400> 250
tttattttac tagtttattt ttgctcctga gaataggatt acaaacactt aaagtcttta 60
attacaacta tatataatat tctgttggtt ttcttgaatt ggttcgctgc gattcatgcc 120
tcccattcac caaaggtgga gtgggaaata acggttttac tgcggtaatt agcagaggca 180
agaacaggat acactttttg atgataaatc tgtattatag tcgagcctat ttaggaaatc 240
aaattttctt gtgtttactt ttcaaataaa taatgttcga aaatttttac tttactcctt 300
catttaacta taccagacgt tatatcatca acaccttctg accatataca gctcaagatg 360
tttaagagtc tgttaaattt tttcaatcca tttcatggag taccaggagg tgctacaaaa 420
g 421
<210> 251
<211> 281
<212> DNA
<213> 东方伊萨酵母
<400> 251
catctgaatg taaaatgaac attaaaatga attactaaac tttacgtcta ctttacaatc 60
tataaacttt gtttaatcat ataacgaaat acactaatac acaatcctgt acgtatgtaa 120
tacttttatc catcaaggat tgagaaaaaa aagtaatgat tccctgggcc attaaaactt 180
agacccccaa gcttggatag gtcactctct attttcgttt ctcccttccc tgatagaagg 240
gtgatatgta attaagaata atatataatt ttataataaa a 281
<210> 252
<211> 1394
<212> DNA
<213> 东方伊萨酵母
<400> 252
catagcctca tgaaatcagc catttgcttt tgttcaacga tcttttgaaa ttgttgttgt 60
tcttggtagt taagttgatc catcttggct tatgttgtgt gtatgttgta gttattctta 120
gtatattcct gtcctgagtt tagtgaaaca taatatcgcc ttgaaatgaa aatgctgaaa 180
ttcgtcgaca tacaattttt caaacttttt ttttttcttg gtgcacggac atgtttttaa 240
aggaagtact ctataccagt tattcttcac aaatttaatt gctggagaat agatcttcaa 300
cgctttaata aagtagtttg tttgtcaagg atggcgtcat acaaagaaag atcagaatca 360
cacacttccc ctgttgctag gagacttttc tccatcatgg aggaaaagaa gtctaacctt 420
tgtgcatcat tggatattac tgaaactgaa aagcttctct ctattttgga cactattggt 480
ccttacatct gtctagttaa aacacacatc gatattgttt ctgattttac gtatgaagga 540
actgtgttgc ctttgaagga gcttgccaag aaacataatt ttatgatttt tgaagataga 600
aaatttgctg atattggtaa cactgttaaa aatcaatata aatctggtgt cttccgtatt 660
gccgaatggg ctgacatcac taatgcacat ggtgtaacgg gtgcaggtat tgtttctggc 720
ttgaaggagg cagcccaaga aacaaccagt gaacctagag gtttgctaat gcttgctgag 780
ttatcatcaa agggttcttt agcatatggt gaatatacag aaaaaacagt agaaattgct 840
aaatctgata aagagtttgt cattggtttt attgcgcaac acgatatggg cggtagagaa 900
gaaggttttg actggatcat tatgactcca ggggttggtt tagatgacaa aggtgatgca 960
cttggtcaac aatatagaac tgttgatgaa gttgtaaaga ctggaacgga tatcataatt 1020
gttggtagag gtttgtacgg tcaaggaaga gatcctatag agcaagctaa aagataccaa 1080
caagctggtt ggaatgctta tttaaacaga tttaaatgat tcttacacaa agatttgata 1140
catgtacact agtttaaata agcatgaaaa gaattacaca agcaaaaaaa aaaaaataaa 1200
tgaggtactt tacgttcacc tacaaccaaa aaaactagat agagtaaaat cttaagattt 1260
agaaaaagtt gtttaacaaa ggctttagta tgtgaatttt taatgtagca aagcgataac 1320
taataaacat aaacaaaagt atggttttct ttatcagtca aatcattatc gattgattgt 1380
tccgcgtatc tgca 1394
<210> 253
<211> 523
<212> DNA
<213> 东方伊萨酵母
<400> 253
gtataaactg tatgtcatta taaacaggga aggttgacat tgtctagcgg caatcattgt 60
ctcatttggt tcattaactt tggttctgtt cttggaaacg ggtaccaact ctctcagagt 120
gcttcaaaaa tttttcagca catttggtta gacatgaact ttctctgctg gttaaggatt 180
cagaggtgaa gtcttgaaca caatcgttga aacatctgtc cacaagagat gtgtatagcc 240
tcatgaaatc agccatttgc ttttgttcaa cgatcttttg aaattgttgt tgttcttggt 300
agttaagttg atccatcttg gcttatgttg tgtgtatgtt gtagttattc ttagtatatt 360
cctgtcctga gtttagtgaa acataatatc gccttgaaat gaaaatgctg aaattcgtcg 420
acatacaatt tttcaaactt tttttttttc ttggtgcacg gacatgtttt taaaggaagt 480
actctatacc agttattctt caccctgcag ggtacgtagc atg 523
<210> 254
<211> 626
<212> DNA
<213> 东方伊萨酵母
<220>
<221> misc_feature
<222> (28)..(28)
<223> n is a, c, g, 或 t
<400> 254
gggcaacaaa gcctcccaga tttgatanat tttcaatttg tgctttgaat catgacttcc 60
acctgtttgg tccgcaagaa cacgtaaatg cgcaatttgt ttctcccttc tgcttaaaaa 120
ccatgcacct ttaatattat ctggaaagat aaagaacaga attgttgcgt agaaacaagt 180
agcagagccg taaatgagaa aaatatactt ccaagctggt aatttcccct ttattagtcc 240
aatacagtgt ccgaagaccc caccaagaat accagcaagg gtgttgaaat ataatgtaga 300
tcttagtggt tgttctgatt tcttccacca cattccgcta ataatcataa aagacggtaa 360
tattccggct tcaaatacgc caagaaaaaa cctcacggta accaaaccac caaagctatg 420
acatgcagcc atgcacataa gtaagccgcc ccaaatgaac aaacaaatag acacaaattt 480
gccaattcta actcgtggca acaaaaaaaa ggatatgaac tcacctaata aataaccgaa 540
ataaaaagta gaagcaactg tggaaaattg agaaccatgt aaatttgtgt cttctttcaa 600
tgtataaaca gccgcaatac ctaggg 626
<210> 255
<211> 1416
<212> DNA
<213> 酿酒酵母
<400> 255
atgtttgctt tctactttct caccgcatgc accactttga agggtgtttt cggagtttct 60
ccgagttaca atggtcttgg tctcacccca cagatgggtt gggacagctg gaatacgttt 120
gcctgcgatg tcagtgaaca gctacttcta gacactgctg atagaatttc tgacttgggg 180
ctaaaggata tgggttacaa gtatgtcatc ctagatgact gttggtctag cggcagggat 240
tccgacggtt tcctcgttgc agacaagcac aaatttccca acggtatggg ccatgttgca 300
gaccacctgc ataataacag ctttcttttc ggtatgtatt cgtctgctgg tgagtacacc 360
tgtgctgggt accctgggtc tctggggcgt gaggaagaag atgctcaatt ctttgcaaat 420
aaccgcgttg actacttgaa gtatgataat tgttacaata aaggtcaatt tggtacacca 480
gacgtttctt accaccgtta caaggccatg tcagatgctt tgaataaaac tggtaggcct 540
attttctatt ctctatgtaa ctggggtcag gatttgacat tttactgggg ctctggtatc 600
gccaattctt ggagaatgag cggagatatt actgctgagt tcacccgtcc agatagcaga 660
tgtccctgtg acggtgacga atatgattgc aagtacgccg gtttccattg ttctattatg 720
aatattctta acaaggcagc tccaatgggg caaaatgcag gtgttggtgg ttggaacgat 780
ctggacaatc tagaggtcgg agtcggtaat ttgactgacg atgaggaaaa ggcccatttc 840
tctatgtggg caatggtaaa gtccccactt atcattggtg ccgacgtgaa tcacttaaag 900
gcatcttcgt actcgatcta cagtcaagcc tctgtcatcg caattaatca agatccaaag 960
ggtattccag ccacaagagt ctggagatat tatgtttcag acaccgatga atatggacaa 1020
ggtgaaattc aaatgtggag tggtccgctt gacaatggtg accaagtggt tgctttattg 1080
aatggaggaa gcgtagcaag accaatgaac acgaccttgg aagagatttt ctttgacagc 1140
aatttgggtt caaaggaact gacatcgact tgggatattt acgacttatg ggccaacaga 1200
gttgacaact ctacggcgtc tgctatcctt gaacagaata aggcagccac cggtattctc 1260
tacaatgcta cagagcagtc ttataaagac ggtttgtcta agaatgatac aagactgttt 1320
ggccagaaaa ttggtagtct ttctccaaat gctatactta acacaactgt tccagctcat 1380
ggtatcgcct tctataggtt gagaccctcg gcttaa 1416
<210> 256
<211> 707
<212> DNA
<213> Kluyveromyces thermotolerans
<400> 256
cactcgcaag ctgtgccatc gcccaacggt taattataag aaatcaacat cagccaacaa 60
ctattttcgt ccccctcttt tcagtggtaa cgagcaatta cattagtaag agactatttt 120
cttcagtgat ttgtaatttt ttttcagtga tttgtaattc tttctcgaaa tatgcgggct 180
taacttatcc ggacattcac tacatgcaag gaaaaacgag aaccgcggag atttcctcag 240
taagtaacaa tgatgatctt tttacgcttc atcatcactt tccaaagttc taagctataa 300
gttcaagcct agatacgctg aaaaactcct gaccaacaat gtaaagaaaa caattacaat 360
tgtaaggttg aaaacatcta aaaatgaaat attttattgt acatgcacac cctgatagtc 420
attctcttac ttcatccctg aaagacgtgg ctgtacaaga gttggaatcg caaggtcatg 480
aggttaaagt tagtgatctt tatgctcaaa agtggaaggc ctcaatagac cgtgacgact 540
tcgagcagct tttcgcaaga agagaggtta aaaatacccc aagcttctta tgaagcgtat 600
gccagaggag cattaacaaa agacgtaaat caggaacagg aaaaacttat ttgggcggac 660
tttgtcattt tgtcgtttcc tatatggtgg tcttctatgc cggctag 707
<210> 257
<211> 655
<212> DNA
<213> Kluyveromyces thermotolerans
<400> 257
ggttaattat aagaaatcaa catcagccaa caactatttt cgtccccctc ttttcagtgg 60
taacgagcaa ttacattagt aagagactat tttcttcagt gatttgtaat tttttttcag 120
tgatttgtaa ttctttctcg aaatatgcgg gcttaactta tccggacatt cactacatgc 180
aaggaaaaac gagaaccgcg gagatttcct cagtaagtaa caatgatgat ctttttacgc 240
ttcatcatca ctttccaaag ttctaagcta taagttcaag cctagatacg ctgaaaaact 300
cctgaccaac aatgtaaaga aaacaattac aattgtaagg ttgaaaacat ctaaaaatga 360
aatattttat tgtacatgca caccctgata gtcattctct tacttcatcc ctgaaagacg 420
tggctgtaca agagttggaa tcgcaaggtc atgaggttaa agttagtgat ctttatgctc 480
aaaagtggaa ggcctcaata gaccgtgacg acttcgagca gcttttcgca agaagagagg 540
ttaaaaatac cccaagcttc ttatgaagcg tatgccagag gagcattaac aaaagacgta 600
aatcaggaac aggaaaaact tatttgggcg gactttgtca ttttgtcgtt tccta 655
<210> 258
<211> 523
<212> DNA
<213> 东方伊萨酵母
<400> 258
gtataaactg tatgtcatta taaacaggga aggttgacat tgtctagcgg caatcattgt 60
ctcatttggt tcattaactt tggttctgtt cttggaaacg ggtaccaact ctctcagagt 120
gcttcaaaaa tttttcagca catttggtta gacatgaact ttctctgctg gttaaggatt 180
cagaggtgaa gtcttgaaca caatcgttga aacatctgtc cacaagagat gtgtatagcc 240
tcatgaaatc agccatttgc ttttgttcaa cgatcttttg aaattgttgt tgttcttggt 300
agttaagttg atccatcttg gcttatgttg tgtgtatgtt gtagttattc ttagtatatt 360
cctgtcctga gtttagtgaa acataatatc gccttgaaat gaaaatgctg aaattcgtcg 420
acatacaatt tttcaaactt tttttttttc ttggtgcacg gacatgtttt taaaggaagt 480
actctatacc agttattctt caccctgcag ggtacgtagc atg 523
<210> 259
<211> 707
<212> DNA
<213> 东方伊萨酵母
<400> 259
tgataacagc aatctgcatg tggattcata atattaggtg tttattgtgg gtattaacgt 60
gtctacctgc tttagctggg gctattatgg taaataagat tgatccacac gaaaatcgac 120
atgctgcatt agctggaatt tatttgatgg gattctacaa tgtgccatgg acattaatgt 180
tggcgttggt atcttcaaac acctcaggat ctaccaagaa gacgttcatg tatgtttctg 240
ttgcagtttg gtatgcagtt ggtaacatta tcggtccata ttttttcaaa ggttctcaag 300
caccaaagta tccgatgggg atacatgcca tggaagcttc cttttcaatt atggcgttca 360
ccggtatcct ttactatctt atgctgagaa tacagaataa acaaaagcaa tcgttaacta 420
tgaatgatat aaaacactta gaatacgcgg aacaatcaat cgataatgat ttgactgata 480
aagaaaacca tacttttgtt tatgtttatt agttatcgct ttgctacatt aaaaattcac 540
atactaaagc ctttgttaaa caactttttc taaatcataa gattttactc tatctagttt 600
ttttggttgt aggtgaacgt aaagtacctc atttaatttt tttttgcttg tgtaattctt 660
ttcatgctta tttaaactag tgtacatgta tcaaatcttt gtgtaag 707
<210> 260
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> 人工引物
<400> 260
gcaactgatg ttcacgaatg cg 22
<210> 261
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工引物
<400> 261
ttgccgttgc agcaaatctc 20
<210> 262
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工引物
<400> 262
aatgatccat ggtccgagag 20
<210> 263
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 人工引物
<400> 263
acggcagtat accctatcag g 21
<210> 264
<211> 28
<212> DNA
<213> 人工序列
<220>
<223> 人工引物
<400> 264
gcaccaagag cagttttccc atctattg 28
<210> 265
<211> 36
<212> DNA
<213> 人工序列
<220>
<223> 人工引物
<400> 265
ccatatagtt cttttctaac atcaacatca cacttc 36
<210> 266
<211> 37
<212> DNA
<213> 人工序列
<220>
<223> 人工引物
<400> 266
ggagaataga tcttcaacgc tttaataaag tagtttg 37
<210> 267
<211> 25
<212> DNA
<213> 人工序列
<220>
<223> 人工引物
<400> 267
cgtgttgcgc aataaaacca atgac 25
<210> 268
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工引物
<400> 268
cctcgaagag cttgaatttg 20
<210> 269
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工引物
<400> 269
gtagtgaatg tccggataag 20
<210> 270
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工引物
<400> 270
gcaaggtcat gaggttaaag 20
<210> 271
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工引物
<400> 271
aacacttatg gcgtctcctc 20
<210> 272
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 人工DNA引物
<400> 272
cgaaccaatt caagaaaacc aac 23
<210> 273
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 人工DNA引物
<400> 273
tctgtccctt ggcgacgc 18
<210> 274
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 人工DNA引物
<400> 274
cttttcaaac agataagtac c 21
<210> 275
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工DNA引物
<400> 275
atgggctgac ctgaaaattc 20
<210> 276
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 人工DNA引物
<400> 276
gctgaaaata tcattcagag cat 23
<210> 277
<211> 18
<212> DNA
<213> 人工序列
<220>
<223> 人工DNA引物
<400> 277
actgttgatg tcgatgcc 18
<210> 278
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工DNA引物
<400> 278
tctgaatgca gtacgagttg 20
<210> 279
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工DNA引物
<400> 279
gaagggggtc caagttatcc 20
<210> 280
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工DNA引物
<400> 280
gatatgggcg gtagagaaga 20
<210> 281
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工DNA引物
<400> 281
gctccttcaa aggcaacaca 20
<210> 282
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工DNA引物
<400> 282
tgaactatca catgaacgta 20
<210> 283
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工DNA引物
<400> 283
tcaaggtagg gtcacttaac 20
<210> 284
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工DNA引物
<400> 284
tgattccttc aatcacaggt 20
<210> 285
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工DNA引物
<400> 285
aaccgaccta tcgaatgcct 20
<210> 286
<211> 51
<212> DNA
<213> 人工序列
<220>
<223> 人工DNA引物
<400> 286
accatgatta cgccaagctt ggtaccttgg ggtttacgct tacagcgtac t 51
<210> 287
<211> 61
<212> DNA
<213> 人工序列
<220>
<223> 人工DNA引物
<400> 287
tcaacgcccc gggggatctg gatccgcggc cgcaagaaat tcctttcttt tcccctttat 60
a 61
<210> 288
<211> 58
<212> DNA
<213> 人工序列
<220>
<223> 人工DNA引物
<400> 288
aaccgatgga ctcctcgagg gatccgcggc cgcgcataac aaaattgtgc ctaaccca 58
<210> 289
<211> 53
<212> DNA
<213> 人工序列
<220>
<223> 人工DNA引物
<400> 289
acgactcact atagggcgaa ttgggccccg ggaaaaggag agagaaaagg aga 53
<210> 290
<211> 55
<212> DNA
<213> 人工序列
<220>
<223> 人工DNA引物
<400> 290
tatgaccatg attacgccaa gcttggtacc tcctacagaa gtagcaccag cacca 55
<210> 291
<211> 60
<212> DNA
<213> 人工序列
<220>
<223> 人工DNA引物
<400> 291
ggaaccgatg gactcctcga gggatccgcg gccgcagact accgtgtaaa taagagtacc 60
<210> 292
<211> 61
<212> DNA
<213> 人工序列
<220>
<223> 人工DNA引物
<400> 292
tcttcaacgc cccgggggat ctggatccgc ggccgcattt gatataaacg cttctataat 60
a 61
<210> 293
<211> 58
<212> DNA
<213> 人工序列
<220>
<223> 人工DNA引物
<400> 293
gtaatacgac tcactatagg gcgaattggg cccaacatct gctgctgtaa tatattca 58
<210> 294
<211> 25
<212> DNA
<213> 人工序列
<220>
<223> 人工DNA引物
<400> 294
gcatgtctgt taactctcaa accat 25
<210> 295
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 人工DNA引物
<400> 295
tccataatcc aatagatcat ccc 23
<210> 296
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> 人工DNA引物
<400> 296
aacacaatgg aaccaaccta gt 22
<210> 297
<211> 45
<212> DNA
<213> 人工序列
<220>
<223> 人工DNA引物
<400> 297
atttacacgg tagtctgcgg ccgccatagc ctcatgaaat cagcc 45
<210> 298
<211> 40
<212> DNA
<213> 人工序列
<220>
<223> 人工DNA引物
<400> 298
ctctaggttc actggttgtt tcttgggctg cctccttcaa 40
<210> 299
<211> 40
<212> DNA
<213> 人工序列
<220>
<223> 人工DNA引物
<400> 299
ttgaaggagg cagcccaaga aacaaccagt gaacctagag 40
<210> 300
<211> 56
<212> DNA
<213> 人工序列
<220>
<223> 人工DNA引物
<400> 300
tattatagaa gcgtttatat caaatgcggc cgcggatcca gatcccccgg ggcgtt 56
<210> 301
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工DNA引物
<400> 301
aatgatcaac ttgagaggta 20
<210> 302
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工DNA引物
<400> 302
caggtctgtt acataaagca 20
<210> 303
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 人工DNA引物
<400> 303
gtttacgctc aaatctcctc c 21
<210> 304
<211> 24
<212> DNA
<213> 人工序列
<220>
<223> 人工DNA引物
<400> 304
ggtacatgaa gcaggctttg aagg 24
<210> 305
<211> 24
<212> DNA
<213> 人工序列
<220>
<223> 人工DNA引物
<400> 305
gattgtgtcc gtcagccttt gctc 24
<210> 306
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 人工DNA引物
<400> 306
taccatattt tcagaggatc a 21
<210> 307
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 人工DNA引物
<400> 307
aggatgttct tgcctgcaag t 21
<210> 308
<211> 26
<212> DNA
<213> 人工序列
<220>
<223> 人工DNA引物
<400> 308
gatgatatag ttgatgcttt ccaaag 26
<210> 309
<211> 33
<212> DNA
<213> 人工序列
<220>
<223> 人工DNA引物
<400> 309
gggccccttc atttacgaaa taaagtgccg cgg 33
<210> 310
<211> 40
<212> DNA
<213> 人工序列
<220>
<223> 人工DNA引物
<400> 310
gcggccgcaa ataaatttaa aataaacgat atcaaaattc 40
<210> 311
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 人工DNA引物
<400> 311
cgacgccaaa gaagggctca gccgaaaaag 30
<210> 312
<211> 32
<212> DNA
<213> 人工序列
<220>
<223> 人工DNA引物
<400> 312
ccatttcttt ttcggctgag cccttctttg gc 32
<210> 313
<211> 32
<212> DNA
<213> 人工序列
<220>
<223> 人工DNA引物
<400> 313
gcggccgcaa taacctcagg gagaactttg gc 32
<210> 314
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 人工DNA引物
<400> 314
gagctcccaa acaaggtctc agtaggatcg 30
<210> 315
<211> 28
<212> DNA
<213> 人工序列
<220>
<223> 人工DNA引物
<400> 315
cgccataagg agaggctgta gatttgtc 28
<210> 316
<211> 25
<212> DNA
<213> 人工序列
<220>
<223> 人工DNA引物
<400> 316
ccaggacatc ttgcttgcaa tgtcg 25
<210> 317
<211> 34
<212> DNA
<213> 人工序列
<220>
<223> 人工DNA引物
<400> 317
gttccatcgg gcccctaaag gtctctcacg acag 34
<210> 318
<211> 33
<212> DNA
<213> 人工序列
<220>
<223> 人工DNA引物
<400> 318
caaacacatc gcgataaaat gtccagaggc ttc 33
<210> 319
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> 人工DNA引物
<400> 319
gcaagacctt ggatctgaag gg 22
<210> 320
<211> 25
<212> DNA
<213> 人工序列
<220>
<223> 人工DNA引物
<400> 320
cgaaccaatt caagaaaacc aacag 25
<210> 321
<211> 28
<212> DNA
<213> 人工序列
<220>
<223> 人工DNA引物
<400> 321
gggcccgtcc cttggcgacg ccctgatc 28
<210> 322
<211> 33
<212> DNA
<213> 人工序列
<220>
<223> 人工DNA引物
<400> 322
gcggccgcta tttttgtgtt ttgctgtgtt ttg 33
<210> 323
<211> 37
<212> DNA
<213> 人工序列
<220>
<223> 人工DNA引物
<400> 323
gcggccgcca tctgaatgta aaatgaacat taaaatg 37
<210> 324
<211> 29
<212> DNA
<213> 人工序列
<220>
<223> 人工DNA引物
<400> 324
gagctccccc agttgttgtt gcaattaac 29
<210> 325
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> 人工DNA引物
<400> 325
gaagagacgt acaagatccg cc 22
<210> 326
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> 人工DNA引物
<400> 326
taggaatggt gcatcatcca ac 22
<210> 327
<211> 40
<212> DNA
<213> 人工序列
<220>
<223> 人工DNA引物
<400> 327
ttcttatctg aaaactccga gttcgcaaag aaggttgaag 40
<210> 328
<211> 45
<212> DNA
<213> 人工序列
<220>
<223> 人工DNA引物
<400> 328
ttattgaaat taatccaagg attcaagttg aacatacaat tactg 45
<210> 329
<211> 42
<212> DNA
<213> 人工序列
<220>
<223> 人工DNA引物
<400> 329
tttccaaaaa agttcgtgag ttcgatggtt gtatgattat gg 42
<210> 330
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> 人工DNA引物
<400> 330
cctctaccac caccaccaaa tg 22
<210> 331
<211> 24
<212> DNA
<213> 人工序列
<220>
<223> 人工DNA引物
<400> 331
gggaagaaac taagaagaag tatg 24
<210> 332
<211> 44
<212> DNA
<213> 人工序列
<220>
<223> 人工DNA引物
<400> 332
caatccttct agagaggggg ttatatgtgt aaatatagag tttg 44
<210> 333
<211> 36
<212> DNA
<213> 人工序列
<220>
<223> 人工DNA引物
<400> 333
ttctaccctc gagattggtt ctttccccct ctcaag 36
<210> 334
<211> 44
<212> DNA
<213> 人工序列
<220>
<223> 人工DNA引物
<400> 334
gtggtcaatc tagaaaatat gactgacaaa atctccctag gtac 44
<210> 335
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 人工DNA引物
<400> 335
caattttgga gctgattcca aatcgtaaac 30
<210> 336
<211> 31
<212> DNA
<213> 人工序列
<220>
<223> 人工DNA引物
<400> 336
caagagtatc ccatctgaca ggaaccgatg g 31
<210> 337
<211> 27
<212> DNA
<213> 人工序列
<220>
<223> 人工DNA引物
<400> 337
gctggagaat agatcttcaa cgccccg 27
<210> 338
<211> 29
<212> DNA
<213> 人工序列
<220>
<223> 人工DNA引物
<400> 338
cggagaaggc gtataaaaag gacacggag 29
<210> 339
<211> 47
<212> DNA
<213> 人工序列
<220>
<223> 人工DNA引物
<400> 339
ggataaaagt attacatacg tacaggattg tgtattagtg tatttcg 47
<210> 340
<211> 40
<212> DNA
<213> 人工序列
<220>
<223> 人工DNA引物
<400> 340
cctccagtgt ttttctctct gtctctttgt tttttttttc 40
<210> 341
<211> 46
<212> DNA
<213> 人工序列
<220>
<223> 人工DNA引物
<400> 341
ggttaattaa tttatttgta cataaaaacc acataaatgt aaaagc 46
<210> 342
<211> 35
<212> DNA
<213> 人工序列
<220>
<223> 人工DNA引物
<400> 342
gaattccttt aattcggaga aaatctgatc aagag 35
<210> 343
<211> 945
<212> DNA
<213> Metallosphaera sedula
<400> 343
atgaccgaaa aggtctccgt cgtcggtgca ggcgtcatcg gtgtcggttg ggctaccttg 60
ttcgcttcca agggttactc cgtctccttg tacaccgaaa agaaggaaac cttggacaag 120
ggtatcgaaa agttgcgtaa ctacgtccaa gtcatgaaga acaactccca aatcaccgaa 180
gacgtcaaca ccgtcatctc cagagtttcc cctactacca acttggacga agccgttaga 240
ggtgcaaact tcgtcatcga ggctgtcatc gaagactacg acgctaagaa gaagatcttc 300
ggttacttgg actccgtctt ggacaaggaa gttatcttgg catcctccac ctccggtttg 360
ttgatcaccg aagtccaaaa ggctatgtcc aagcacccag aaagagctgt catcgcccac 420
ccatggaacc caccacactt gttgcctttg gtcgaaatcg ttccaggtga gaagacctcc 480
atggaagtcg ttgagagaac caagtccttg atggaaaagt tggacagaat cgtcgtcgtt 540
ttgaagaagg aaatcccagg tttcatcggt aacagattgg cattcgcttt gttcagagaa 600
gctgtctact tggttgacga gggtgtcgca accgtcgagg acatcgacaa ggttatgact 660
gccgctatcg gcttgagatg ggccttcatg ggtccattct tgacctacca cttgggtggt 720
ggtgagggtg gtttggaata cttcttcaac agaggtttcg gttacggtgc caacgaatgg 780
atgcacacct tggctaagta cgacaagttc ccatacaccg gtgtcaccaa ggccatccag 840
caaatgaagg aatactcctt catcaagggt aagaccttcc aagagatctc caagtggaga 900
gacgaaaagt tgttgaaggt ctacaagttg gtctgggaaa agtaa 945
<210> 344
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工DNA引物
<400> 344
agggtacctt agtacgaagg 20
<210> 345
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 人工DNA引物
<400> 345
ctattcttac gatgaaggcg 20
<210> 346
<211> 31
<212> DNA
<213> 人工序列
<220>
<223> 人工DNA引物
<400> 346
ccttaattaa ttatccacgg aagatatgat g 31
<210> 347
<211> 32
<212> DNA
<213> 人工序列
<220>
<223> 人工DNA引物
<400> 347
gctctagata aaatgtccca aggtagaaaa gc 32
<210> 348
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 人工DNA引物
<400> 348
gctagctaaa atgtttggta atatttccca 30
<210> 349
<211> 28
<212> DNA
<213> 人工序列
<220>
<223> 人工DNA引物
<400> 349
ttaattaact atttatctaa tgatcctc 28
<210> 350
<211> 41
<212> DNA
<213> 人工序列
<220>
<223> 人工DNA引物
<400> 350
tctagataaa atgtctatta gtgaaaaata ttttcctcaa g 41
<210> 351
<211> 43
<212> DNA
<213> 人工序列
<220>
<223> 人工DNA引物
<400> 351
ttaattaact tttaaatttt ggaaaaagct tgatcaataa tgg 43

Claims (13)

1.一种经遗传修饰的酵母细胞,其选自东方伊萨酵母(Issatchenkia orientalis)、郎比可假丝酵母(Candida lambica)和博伊丁酵母(Saccharomyces bulderi),其包含活性3-HP发酵途径,其中所述细胞包含外源的β-丙氨酸氨基转移酶(BAAT基因)或4-氨基丁酸氨基转移酶(gabT基因),外源意指所述基因不存在于天然形式的所述酵母细胞的基因组中所述基因的位置,其中所述BAAT基因或gabT基因编码多肽,所述多肽与SEQ ID NO: 20或SEQ IDNO: 21的氨基酸序列有至少99%序列同一性,其中所述多肽源自东方伊萨酵母(Issatchenkia orientalis)、克鲁维酵母(Saccharomyces kluyveri)、阿维链霉菌(Streptomyces avermitilis)或酿酒酵母(Saccharomyces cerevisiae)。
2.根据权利要求1所述的经遗传修饰的酵母细胞,其中所述细胞包含一种或多种选自如下的外源3-HP途径基因:
外源磷酸烯醇丙酮酸羧化酶(PPC)基因;
外源丙酮酸羧化酶(PYC)基因;
外源天冬氨酸氨基转移酶(AAT)基因;
外源天冬氨酸1-脱羧酶(ADC)基因;和
外源3-羟基丙酸脱氢酶(3-HPDH)基因;
外源意指所述基因不存在于天然形式的所述酵母细胞的基因组中所述基因的位置。
3.根据权利要求2所述的经遗传修饰的酵母细胞,其中所述PYC基因编码多肽,所述多肽与选自SEQ ID NO: 2, 3, 4, 5, 6,7和8的氨基酸序列具有至少60%, 65%, 70%, 75%,80%, 85%, 90%, 95%, 97%, 98%, 99%或100%序列同一性。
4.根据权利要求2或3所述的经遗传修饰的酵母细胞,其中所述AAT基因编码多肽,所述多肽与选自SEQ ID NO: 14, 15和16的氨基酸序列具有至少60%, 65%, 70%, 75%, 80%,85%, 90%, 95%, 97%, 98%, 99%或100%序列同一性。
5.根据权利要求2所述的经遗传修饰的酵母细胞,其中所述ADC基因编码多肽,所述多肽与选自SEQ ID NO: 17, 18, 133, 135, 137和139的氨基酸序列具有至少60%, 65%,70%, 75%, 80%, 85%, 90%, 95%, 97%, 98%, 99%或100%序列同一性。
6.根据权利要求1所述的经遗传修饰的酵母细胞,其中所述BAAT基因或gabT基因编码多肽,所述多肽与SEQ ID NO: 20或SEQ ID NO: 21的氨基酸序列具有至少95%, 97%, 98%,99%或100%序列同一性。
7.根据权利要求2所述的经遗传修饰的酵母细胞,其中所述3-HPDH基因编码多肽,所述多肽与选自SEQ ID NO: 26, 27, 28, 29, 30, 31, 32, 33, 34和129的氨基酸序列具有至少60%, 例如至少65%, 70%, 75%, 80%,85%, 90%, 95%, 97%, 98%, 99%或100%序列同一性。
8.根据权利要求2所述的经遗传修饰的酵母细胞,其中所述PPC基因编码多肽,所述多肽与选自SEQ ID NO: 10, 11和12的氨基酸序列具有至少60%, 例如至少65%, 70%, 75%,80%,85%, 90%, 95%, 97%, 98%, 99%或100%序列同一性。
9.根据权利要求1所述的经遗传修饰的酵母细胞,其中所述细胞进一步包含选自PDC,ADH, GAL6, CYB2A, CYB2B, GPD, GPP, ALD和PCK基因的天然基因的一个或多个缺失或破坏。
10.根据权利要求9所述的经遗传修饰的酵母细胞,其中一个或多个缺失或破坏得自一个或多个外源3-HP途径基因的插入。
11.根据权利要求1所述的经遗传修饰的酵母细胞,其中一个或多个外源3-HP途径基因可操作连接到一个或多个外源调节元件上。
12.根据权利要求1所述的经遗传修饰的酵母细胞,其中所述细胞能够在含75g/L或更多3-HP的培养基中在小于4的pH生长。
13.一种产生3-HP的方法,包括:
(i) 在含至少一种碳源的培养基的存在下培养权利要求1-12中任一项所述的经遗传修饰的酵母细胞;和
(ii) 从培养物中分离3-HP。
CN201711043999.8A 2010-11-22 2011-11-21 用于生产3-羟基丙酸的组合物和方法 Active CN107828671B (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US41619910P 2010-11-22 2010-11-22
US61/416,199 2010-11-22
US201161535181P 2011-09-15 2011-09-15
US61/535,181 2011-09-15
CN201180065738.0A CN103502432A (zh) 2010-11-22 2011-11-21 用于生产3-羟基丙酸的组合物和方法

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
CN201180065738.0A Division CN103502432A (zh) 2010-11-22 2011-11-21 用于生产3-羟基丙酸的组合物和方法

Publications (2)

Publication Number Publication Date
CN107828671A CN107828671A (zh) 2018-03-23
CN107828671B true CN107828671B (zh) 2022-03-08

Family

ID=45099210

Family Applications (2)

Application Number Title Priority Date Filing Date
CN201180065738.0A Pending CN103502432A (zh) 2010-11-22 2011-11-21 用于生产3-羟基丙酸的组合物和方法
CN201711043999.8A Active CN107828671B (zh) 2010-11-22 2011-11-21 用于生产3-羟基丙酸的组合物和方法

Family Applications Before (1)

Application Number Title Priority Date Filing Date
CN201180065738.0A Pending CN103502432A (zh) 2010-11-22 2011-11-21 用于生产3-羟基丙酸的组合物和方法

Country Status (11)

Country Link
US (7) US9090918B2 (zh)
EP (2) EP2643450A2 (zh)
JP (1) JP6061862B2 (zh)
KR (1) KR20130119945A (zh)
CN (2) CN103502432A (zh)
AU (1) AU2011336923B2 (zh)
BR (1) BR112013012630B1 (zh)
CA (1) CA2818499A1 (zh)
MX (1) MX2013005654A (zh)
WO (1) WO2012074818A2 (zh)
ZA (1) ZA201303544B (zh)

Families Citing this family (90)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090053782A1 (en) 2006-03-13 2009-02-26 Catherine Asleson Dundon Yeast cells having disrupted pathway from dihydroxyacetone phosphate to glycerol
WO2012019175A2 (en) 2010-08-06 2012-02-09 Mascoma Corporation Production of malonyl-coa drived products via anaerobic pathways
EP2643466B1 (en) * 2010-11-22 2017-08-09 Cargill, Incorporated Yeast cells and process for converting acetaldehyde to ethanol
WO2012074818A2 (en) 2010-11-22 2012-06-07 Novozymes, Inc. Compositions and methods for 3-hydroxypropionic acid production
EP2725895A1 (en) * 2011-06-28 2014-05-07 Brookhaven Science Associates LLC Modified plants with increased oil content
AU2012298799B2 (en) * 2011-08-24 2018-02-01 Novozymes, Inc. Methods for producing multiple recombinant polypeptides in a filamentous fungal host cell
US8728788B1 (en) 2011-09-30 2014-05-20 Novozymes A/S Dehydrogenase variants and polynucleotides encoding same
CN114395496A (zh) * 2012-03-06 2022-04-26 利戈斯股份有限公司 用于产生丙二酸的重组宿主细胞
CN104508136A (zh) * 2012-05-30 2015-04-08 新西兰郎泽科技公司 重组微生物及其用途
SG11201501013PA (en) 2012-08-10 2015-04-29 Opx Biotechnologies Inc Microorganisms and methods for the production of fatty acids and fatty acid derived products
WO2014057036A1 (en) 2012-10-11 2014-04-17 Technical University Of Denmark Genetically engineered yeast
BR112015012409A2 (pt) 2012-11-30 2017-09-12 Novozymes Inc célula recombinante de levedura, e, método de produção de 3-hp
ES2735024T3 (es) * 2013-03-14 2019-12-13 Du Pont Glicerol-3-fosfato deshidrogenasa para la producción de butanol
US10442749B2 (en) 2013-03-15 2019-10-15 Cargill, Incorporated Recovery of 3-hydroxypropionic acid
US9447438B2 (en) 2013-03-15 2016-09-20 Cargill, Incorporated Acetyl-coA carboxylases
US20150044746A1 (en) * 2013-03-15 2015-02-12 Opx Biotechnologies, Inc. Method of enhanced bioproduction
US10066245B2 (en) 2013-06-14 2018-09-04 Technical University Of Denmark Microbial production of 3-hydroxypropionic acid
EP3008179A1 (en) 2013-06-14 2016-04-20 Technical University of Denmark 3hp tolerance
BR112016001026A2 (pt) 2013-07-19 2017-10-24 Cargill Inc organismo geneticamente modificado
US9556443B2 (en) * 2013-07-19 2017-01-31 Samsung Electronics Co., Ltd. Yeast cell with inactivated NADH dehydrogenase and method of producing lactate using the yeast cell
US11408013B2 (en) 2013-07-19 2022-08-09 Cargill, Incorporated Microorganisms and methods for the production of fatty acids and fatty acid derived products
US9845484B2 (en) 2013-07-31 2017-12-19 Novozymes A/S 3-hydroxypropionic acid production by recombinant yeasts expressing an insect aspartate 1-decarboxylase
WO2015031504A1 (en) * 2013-08-27 2015-03-05 The Regents Of The University Of California RECOMBINANT PATHWAY AND ORGANISMS FOR MALONYL-CoA SYNTHESIS
WO2015036273A1 (de) 2013-09-12 2015-03-19 Basf Se Verfahren zur herstellung von acrylsäure
WO2015036278A1 (de) 2013-09-12 2015-03-19 Basf Se Verfahren zur dehydratisierung von 3-hydroxypropionsäure zu acrylsäure
EP3044198B1 (de) 2013-09-12 2019-10-09 Basf Se Verfahren zur dehydratisierung von 3-hydroxypropionsäure zu acrylsäure
ES2719828T3 (es) 2013-11-22 2019-07-16 Jmtc Enzyme Corp Transformante y procedimiento para la producción del mismo, y procedimiento para la producción de ácido láctico
JP6515502B2 (ja) * 2013-11-22 2019-05-22 Agc株式会社 形質転換体の製造方法、形質転換体、および単座組込み用ベクターキット
KR101555867B1 (ko) 2014-04-18 2015-10-01 부산대학교 산학협력단 3-하이드록시프로피온산을 분해하지 않는 슈도모나스 데니트리피칸스 결실 변이균주 및 이를 이용한 3-하이드록시프로피온산의 생산방법
US10385368B2 (en) * 2014-06-26 2019-08-20 Lygos, Inc. Recombinant host cells for the production of malonate
WO2016026763A1 (en) 2014-08-18 2016-02-25 Basf Se Process for preparing acrylic acid using a heterogeneous alumina catalyst
BR112017004069B1 (pt) * 2014-08-29 2024-02-06 Sk Innovation Co., Ltd Levedura recombinante produzindo ácido 3-hidroxipropiônico e método para produzir ácido 3-hidroxipropiônico usando o mesmo
EP2993228B1 (en) 2014-09-02 2019-10-09 Cargill, Incorporated Production of fatty acid esters
JP6620375B2 (ja) 2014-10-10 2019-12-18 Jmtcエンザイム株式会社 形質転換体およびその製造方法、ならびに乳酸の製造方法
US20170362613A1 (en) * 2014-12-19 2017-12-21 Novozymes A/S Recombinant Host Cells For The Production Of 3-Hydroxypropionic Acid
EP3234165A1 (en) * 2014-12-19 2017-10-25 Novozymes A/S Recombinant host cells for the production of 3-hydroxypropionic acid
WO2016135020A1 (de) 2015-02-24 2016-09-01 Basf Se Verfahren zur kontinuierlichen dehydratisierung von 3-hydroxypropionsäure zu acrylsäure
WO2016138303A1 (en) 2015-02-27 2016-09-01 Novozymes A/S Mutant host cells for the production of 3-hydroxypropionic acid
WO2016162175A1 (de) 2015-04-07 2016-10-13 Basf Se Verfahren zur dehydratisierung von 3-hydroxypropionsäure zu acrylsäure
MY194187A (en) 2015-06-11 2022-11-18 Noroo Ic Co Ltd Promoter system inducing expression by 3-hydroxypropionic acid and method for biological production of 3-hydroxypropionic acid using same
WO2016200239A1 (ko) * 2015-06-11 2016-12-15 부산대학교 산학협력단 3-하이드록시프로피온산에 의해 발현이 유도되는 프로모터 시스템 및 이를 이용한 3-하이드록시프로피온산의 생물학적 생산방법
CA2992794A1 (en) * 2015-07-21 2017-01-26 Radhakrishnan Mahadevan Methods and microorganisms for the production of 1,3-butanediol
US20180265902A1 (en) 2015-08-24 2018-09-20 Novozymes A/S Beta-Alanine Aminotransferases For The Production of 3-Hydroxypropionic Acid
US20180258437A1 (en) * 2015-11-12 2018-09-13 Lygos, Inc. Recombinant host cells and methods for the production of l-aspartate and beta-alanine
CA3042854A1 (en) * 2015-11-12 2017-05-18 Lygos, Inc. Recombinant host cells and methods for the anaerobic production of l-aspartate and beta-alanine
DE102016114555A1 (de) 2016-08-05 2018-02-08 Thyssenkrupp Ag Prozess zur Herstellung von Acrylsäure aus einer wässrigen 3-Hydroxypropanol-Lösung
CN110168095A (zh) 2016-12-06 2019-08-23 诺维信公司 用于使用工程化酵母菌株从含有木糖的纤维素基质生产乙醇的改善方法
WO2018144701A2 (en) 2017-02-02 2018-08-09 Cargill Incorporated Genetically modified cells that produce c6-c10 fatty acid derivatives
US11091753B2 (en) 2017-05-31 2021-08-17 Novozymes A/S Xylose fermenting yeast strains and processes thereof for ethanol production
BR112019025391A2 (pt) 2017-06-02 2020-07-07 Novozymes A/S levedura melhorada para a produção de etanol
KR102662145B1 (ko) 2017-08-17 2024-04-29 바스프 에스이 아크릴산 n-부틸 에스테르 또는 아크릴산 이소부틸 에스테르를 연속적으로 제조하는 방법
AU2018322748B2 (en) 2017-08-29 2024-05-02 Novozymes A/S Baker's yeast expressing anti-staling/freshness amylases
WO2019148192A1 (en) 2018-01-29 2019-08-01 Novozymes A/S Microorganisms with improved nitrogen utilization for ethanol production
KR102419608B1 (ko) * 2018-02-08 2022-07-08 주식회사 엘지화학 고농도 3-하이드록시프로피온산 수용액의 제조 방법
WO2019231944A2 (en) 2018-05-31 2019-12-05 Novozymes A/S Processes for enhancing yeast growth and productivity
CA3143683A1 (en) * 2018-06-25 2020-01-02 Lygos, Inc. Recombinant host cells and methods for the production of aspartic acid and s-alanine
EP3827088A1 (en) 2018-07-25 2021-06-02 Novozymes A/S Enzyme-expressing yeast for ethanol production
BR112021006692A2 (pt) 2018-10-08 2021-08-10 Novozymes A/S levedura expressando enzimas para produção de etanol
JP7370587B2 (ja) * 2018-10-30 2023-10-30 GreenEarthInstitute株式会社 有機化合物の製造方法およびコリネ型細菌
BR112021011629A2 (pt) * 2018-12-18 2021-09-08 Braskem S.A. Via de coprodução de derivados de 3-hp e acetil-coa a partir de malonato semialdeído
CN109852605A (zh) * 2019-01-16 2019-06-07 徐州工程学院 一种诱变筛选高产3-羟基丙酸菌株的方法
CN114450390A (zh) 2019-07-26 2022-05-06 诺维信公司 用于乙醇生产的氮转运提高的微生物
CN112390855B (zh) * 2019-07-31 2022-04-29 上海交通大学医学院附属仁济医院 Pretide-146a在制备缓解或治疗自身免疫性疾病的药物中的应用
CN114423296A (zh) 2019-08-05 2022-04-29 诺维信公司 从全酒糟副产物生产高蛋白饲料成分的酶共混物和工艺
CN114127124A (zh) 2019-08-06 2022-03-01 诺维信公司 用于提高酶表达的融合蛋白
MX2022002834A (es) 2019-09-16 2022-04-06 Novozymes As Polipeptidos con actividad beta-glucanasa y polinucleotidos que los codifican.
WO2021119304A1 (en) 2019-12-10 2021-06-17 Novozymes A/S Microorganism for improved pentose fermentation
EP4103709A2 (en) 2020-02-10 2022-12-21 Novozymes A/S Polypeptides having alpha-amylase activity and polynucleotides encoding same
EP4171773B1 (de) 2020-06-29 2024-07-10 Basf Se Vorrichtung zur durchführung von stoffaustauschprozessen
JP2023531938A (ja) * 2020-07-31 2023-07-26 エルジー・ケム・リミテッド 3-ヒドロキシプロピオン酸の2段階製造方法
CN111985041B (zh) * 2020-09-17 2021-03-30 青岛理工大学 一种加固边坡挡墙高度确定方法及加固边坡挡墙
US10894812B1 (en) 2020-09-30 2021-01-19 Alpine Roads, Inc. Recombinant milk proteins
US10947552B1 (en) 2020-09-30 2021-03-16 Alpine Roads, Inc. Recombinant fusion proteins for producing milk proteins in plants
CA3191387A1 (en) 2020-09-30 2022-04-07 Nobell Foods, Inc. Recombinant milk proteins and food compositions comprising the same
US20230357806A1 (en) * 2020-09-30 2023-11-09 Genomium, Inc. Fermentation process to produce bioacrolein and bioacrylic acid
CN116438309A (zh) 2020-11-02 2023-07-14 诺维信公司 葡糖淀粉酶变体和编码它们的多核苷酸
KR102696014B1 (ko) * 2020-11-05 2024-08-16 주식회사 엘지화학 3-하이드록시프로피온산의 생산 방법
WO2022098163A1 (ko) * 2020-11-05 2022-05-12 주식회사 엘지화학 포도당으로부터 3-히드록시프로피온산의 생산능을 가지는 미생물 및 이의 용도
EP4208554A4 (en) 2021-02-08 2024-03-20 Lanzatech, Inc. RECOMBINANT MICROORGANISMS AND THEIR USES
WO2022261003A1 (en) 2021-06-07 2022-12-15 Novozymes A/S Engineered microorganism for improved ethanol fermentation
FR3125042B1 (fr) 2021-07-09 2024-04-12 Snf Sa Procédé d’obtention d’alkyl(méth)acrylamide substitué biosourcé
FR3125040B1 (fr) 2021-07-09 2024-04-26 Snf Sa Procédé d’obtention de bio-monomère à partir de diméthylaminoethanol d’origine renouvelable
FR3125048B1 (fr) 2021-07-09 2024-04-19 Snf Sa Polymère biosourcé à biodégradabilité améliorée
WO2023168233A1 (en) 2022-03-03 2023-09-07 Cargill, Incorporated Genetically modified yeast and fermentation processes for the production of 3-hydroxypropionate
WO2023168244A1 (en) 2022-03-03 2023-09-07 Cargill, Incorporated Genetically modified yeast and fermentation processes for the production of 3-hydroxypropionate
CN116024184B (zh) * 2022-07-26 2024-03-15 南京科技职业学院 醛脱氢酶突变体及其在制备5-羟甲基-2-呋喃甲酸中的应用
WO2024137704A2 (en) 2022-12-19 2024-06-27 Novozymes A/S Processes for producing fermentation products using fiber-degrading enzymes with engineered yeast
WO2024226289A1 (en) 2023-04-26 2024-10-31 Cargill, Incorporated Methods for producing propionic acid
WO2024258820A2 (en) 2023-06-13 2024-12-19 Novozymes A/S Processes for producing fermentation products using engineered yeast expressing a beta-xylosidase
WO2025058922A1 (en) 2023-09-15 2025-03-20 Cargill, Incorporated Rising film evaporator clean-in-place method and system

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2007106524A2 (en) * 2006-03-13 2007-09-20 Cargill Inc. Yeast cells having disrupted pathway from dihydroxyacetone phosphate to glycerol
WO2009089457A1 (en) * 2008-01-11 2009-07-16 Novozymes A/S Methods for producing 3-hydroxypropionic acid and compounds thereof
CN101528918A (zh) * 2006-08-30 2009-09-09 诺沃奇梅兹A/S 生产3-羟基丙酸的β-丙氨酸/α-酮戊二酸氨基转移酶
WO2010011874A2 (en) * 2008-07-23 2010-01-28 Opx Biotechnologies, Inc Methods, systems and compositions for increased microorganism tolerance to and production of 3-hydroxypropionic acid (3-hp)

Family Cites Families (63)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
IL39710A (en) 1972-06-19 1975-04-25 Imi Inst For Res & Dev Recovery of acids from aqueous solutions by solvent extraction
US4771001A (en) 1986-03-27 1988-09-13 Neurex Corp. Production of lactic acid by continuous fermentation using an inexpensive raw material and a simplified method of lactic acid purification
US5210296A (en) 1990-11-19 1993-05-11 E. I. Du Pont De Nemours And Company Recovery of lactate esters and lactic acid from fermentation broth
US5132456A (en) 1991-05-07 1992-07-21 The Regents Of The University Of California Sorption of carboxylic acid from carboxylic salt solutions at PHS close to or above the pKa of the acid, with regeneration with an aqueous solution of ammonia or low-molecular-weight alkylamine
US5420304A (en) 1992-03-19 1995-05-30 Biopak Technology, Ltd. Method to produce cyclic esters
AT398982B (de) 1993-02-18 1995-02-27 Vogelbusch Gmbh Verfahren zur abtrennung und reinigung von milchsäure
US5510526A (en) 1993-06-29 1996-04-23 Cargill, Incorporated Lactic acid production, separation and/or recovery process
IL109003A (en) 1994-03-16 1999-09-22 Yissum Res Dev Co Process and extractant composition for extracting water-soluble carboxylic and mineral acids
IT1294728B1 (it) 1997-09-12 1999-04-12 Biopolo S C A R L Ceppi di lievito per la riproduzione di acido lattico
ATE458040T1 (de) 1998-04-13 2010-03-15 Univ Georgia Pyruvate carboxylase überexpression zur verstärkten produktion von oxalacetat abgeleiteten verbindungen in mikrobiellen zellen
EP1105514B1 (en) * 1998-08-04 2008-02-06 Metabolix, Inc. Polyhydroxyalkanoate production from polyols
PT1183385E (pt) 1999-05-21 2006-11-30 Cargill Dow Llc Métodos e materiais para a síntese de produtos orgânicos
WO2001016346A1 (en) 1999-08-30 2001-03-08 Wisconsin Alumni Research Foundation Production of 3-hydroxypropionic acid in recombinant organisms
US6852517B1 (en) 1999-08-30 2005-02-08 Wisconsin Alumni Research Foundation Production of 3-hydroxypropionic acid in recombinant organisms
JP4098455B2 (ja) 2000-03-10 2008-06-11 株式会社日立製作所 マーク画像中の電子透かし情報の参照方法及び計算機
JP4490628B2 (ja) * 2000-11-20 2010-06-30 カーギル インコーポレイテッド 3−ヒドロキシプロピオン酸および他の有機化合物
WO2002042471A2 (en) 2000-11-22 2002-05-30 Cargill Dow Polymers Llc Methods and materials for the synthesis of organic products
AU2002311989A1 (en) 2001-11-23 2003-06-23 Cargill Dow Polymers Llc Methods and materials for the production of organic products in cells of $i(candida) species
WO2003062173A2 (en) 2002-01-18 2003-07-31 Cargill, Incorporated Alanine 2,3- aminomutase
CN100577626C (zh) 2002-03-25 2010-01-06 嘉吉有限公司 制造α,β-不饱和羧酸或其衍生物的方法
WO2003102200A2 (en) 2002-05-30 2003-12-11 Cargill Dow Llc Fermentation process using specific oxygen uptake rates as a process control
AU2003285106A1 (en) 2002-11-01 2004-06-07 Cargill, Incorporated Process for preparation of 1,3-propanediol
WO2004076398A1 (en) 2003-02-24 2004-09-10 Cargill Incorporated Process for preparing 3-hydroxycarboxylic acids
EP1654212B1 (en) 2003-06-26 2009-07-29 Novozymes A/S Process for separating and recovering 3-hydroxypropionic acid and acrylic acid
CN1832915A (zh) 2003-06-26 2006-09-13 嘉吉有限公司 分离和回收3-羟基丙酸和丙烯酸的方法
US7326557B2 (en) 2003-11-14 2008-02-05 Rice University Increasing intracellular NADPH availability in E. coli
US7700319B2 (en) 2003-12-04 2010-04-20 Novozymes A/S Production of 3-hydroxypropionic acid using beta-alanine/pyruvate aminotransferase
US20090031453A1 (en) 2004-07-30 2009-01-29 Holly Jean Jessen Alanine 2, 3 aminomutases
US7987056B2 (en) 2004-09-20 2011-07-26 The Regents Of The University Of Colorado, A Body Corporate Mixed-library parallel gene mapping quantitative micro-array technique for genome-wide identification of trait conferring genes
JP2008517607A (ja) 2004-10-25 2008-05-29 コデクシス, インコーポレイテッド 改良されたアラニン2,3−アミノムターゼおよび関連ポリヌクレオチド
DK2305826T3 (en) 2005-08-10 2016-06-27 Univ Florida Materials and methods for the efficient production of lactic acid
US7846688B2 (en) 2005-08-15 2010-12-07 The Regents Of The University Of Colorado Broad host range vectors for shotgun and expression library cloning in Gram negative bacteria
DE102005048818A1 (de) * 2005-10-10 2007-04-12 Degussa Ag Mikrobiologische Herstellung von 3-Hydroxypropionsäure
US7842485B2 (en) 2006-03-15 2010-11-30 The Regents Of The University Of Colorado Enhanced alcohol tolerant microorganism and methods of use thereof
WO2008021765A2 (en) 2006-08-08 2008-02-21 Regents Of The University Of Colorado Compositions and methods for chemical reporter vectors
US8938765B2 (en) 2006-12-22 2015-01-20 Time Warner Cable Enterprises Llc Methods, apparatus and user interface for providing content on demand
JP2010515465A (ja) 2007-01-12 2010-05-13 ザ リージェンツ オブ ザ ユニバーシティー オブ コロラド,ア ボディー コーポレート 微生物によって生成される有機化学物質の生成に対する耐性を高めるための組成物および方法
WO2008091627A2 (en) 2007-01-22 2008-07-31 Genomatica, Inc. Methods and organisms for growth-coupled production of 3-hydroxypropionic acid
US8048624B1 (en) 2007-12-04 2011-11-01 Opx Biotechnologies, Inc. Compositions and methods for 3-hydroxypropionate bio-production from biomass
NZ598403A (en) 2007-12-19 2012-07-27 Novozymes As Polypeptides having cellulolytic enhancing activity and polynucleotides encoding same
EP2313491A4 (en) 2008-07-08 2011-12-07 Opx Biotechnologies Inc METHODS, COMPOSITIONS AND SYSTEMS FOR BIOSYNTHETIC BIOPRODUCTION OF 1,4-BUTANEDIOL
US20100021978A1 (en) 2008-07-23 2010-01-28 Genomatica, Inc. Methods and organisms for production of 3-hydroxypropionic acid
WO2010017230A2 (en) 2008-08-04 2010-02-11 The Regents Of The University Of Colorado Methods, systems and compositions related to microbial bio-production of butanol and/or isobutanol
EP2326709A4 (en) 2008-09-15 2013-01-23 Opx Biotechnologies Inc METHODS, SYSTEMS AND COMPOSITIONS RELATED TO REDUCED MICROBIAL PRODUCTION OF 3-HYDROXYPROPIONIC ACID (3-HP) IN ALDEHYDMETABOLITE
US8518684B2 (en) 2008-11-18 2013-08-27 Novozymes, Inc. Methods and compositions for degrading cellulosic material
US20110144377A1 (en) 2009-06-16 2011-06-16 E. I. Du Pont Nemours And Company Process for the biological production of 3-hydroxypropionic acid with high yield
GB2487866A (en) 2009-09-27 2012-08-08 Opx Biotechnologies Inc Method for producing 3-Hydroxypropionic acid and other products
US8809027B1 (en) 2009-09-27 2014-08-19 Opx Biotechnologies, Inc. Genetically modified organisms for increased microbial production of 3-hydroxypropionic acid involving an oxaloacetate alpha-decarboxylase
CN102597228A (zh) 2009-10-23 2012-07-18 诺维信股份有限公司 纤维二糖水解酶变体及编码其的多核苷酸
CN102666847B (zh) 2009-10-29 2015-12-09 诺维信股份有限公司 具有纤维二糖水解酶活性的多肽和编码该多肽的多核苷酸
US20110125118A1 (en) 2009-11-20 2011-05-26 Opx Biotechnologies, Inc. Production of an Organic Acid and/or Related Chemicals
US20130122541A1 (en) 2010-01-27 2013-05-16 The Regents Of The University Of Colorado Microorganism production of high-value chemical products, and related compositions, methods and systems
EP3070171B1 (en) 2010-03-30 2018-06-13 Novozymes A/S Process for enhancing by-products from fermentation processes
EP2603595A1 (en) 2010-08-12 2013-06-19 Novozymes, Inc. Compositions comprising a polypeptide having cellulolytic enhancing activity and a dioxy compound and uses thereof
WO2012074818A2 (en) * 2010-11-22 2012-06-07 Novozymes, Inc. Compositions and methods for 3-hydroxypropionic acid production
US20140121118A1 (en) 2010-11-23 2014-05-01 Opx Biotechnologies, Inc. Methods, systems and compositions regarding multiplex construction protein amino-acid substitutions and identification of sequence-activity relationships, to provide gene replacement such as with tagged mutant genes, such as via efficient homologous recombination
US20130345470A1 (en) 2012-06-20 2013-12-26 Opx Biotechnologies, Inc. Purification of 3-Hydroxypropionic Acid from Crude Cell Broth and Production of Acrylamide
WO2013192451A1 (en) 2012-06-20 2013-12-27 Opx Biotechnologies, Inc. Dehydration of 3-hydroxypropionic acid to acrylic acid
WO2014145332A1 (en) 2013-03-15 2014-09-18 Opx Biotechnologies, Inc. Monfunctional mcr + 3-hp dehydrogenase
US10442749B2 (en) 2013-03-15 2019-10-15 Cargill, Incorporated Recovery of 3-hydroxypropionic acid
US9512057B2 (en) 2013-03-15 2016-12-06 Cargill, Incorporated 3-hydroxypropionic acid compositions
US9447438B2 (en) 2013-03-15 2016-09-20 Cargill, Incorporated Acetyl-coA carboxylases
US20150044746A1 (en) 2013-03-15 2015-02-12 Opx Biotechnologies, Inc. Method of enhanced bioproduction

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2007106524A2 (en) * 2006-03-13 2007-09-20 Cargill Inc. Yeast cells having disrupted pathway from dihydroxyacetone phosphate to glycerol
CN101528918A (zh) * 2006-08-30 2009-09-09 诺沃奇梅兹A/S 生产3-羟基丙酸的β-丙氨酸/α-酮戊二酸氨基转移酶
WO2009089457A1 (en) * 2008-01-11 2009-07-16 Novozymes A/S Methods for producing 3-hydroxypropionic acid and compounds thereof
WO2010011874A2 (en) * 2008-07-23 2010-01-28 Opx Biotechnologies, Inc Methods, systems and compositions for increased microorganism tolerance to and production of 3-hydroxypropionic acid (3-hp)

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
产3-羟基丙酸重组菌的构建及其转化甘油的研究;张晓梅等;《生物技术通报》;20090831;第25卷(第8期);全文 *

Also Published As

Publication number Publication date
US20140065681A1 (en) 2014-03-06
US10260072B2 (en) 2019-04-16
US20180044684A1 (en) 2018-02-15
US20190249181A1 (en) 2019-08-15
WO2012074818A3 (en) 2012-09-27
US20200291408A1 (en) 2020-09-17
CN107828671A (zh) 2018-03-23
US9777280B2 (en) 2017-10-03
US10633664B2 (en) 2020-04-28
EP2643450A2 (en) 2013-10-02
ZA201303544B (en) 2014-11-26
EP3287519A1 (en) 2018-02-28
MX2013005654A (es) 2013-07-17
WO2012074818A2 (en) 2012-06-07
US20120135481A1 (en) 2012-05-31
EP3287519B1 (en) 2020-03-18
US9090918B2 (en) 2015-07-28
US11118187B2 (en) 2021-09-14
JP2013542747A (ja) 2013-11-28
US20160177317A1 (en) 2016-06-23
CN103502432A (zh) 2014-01-08
US12054721B2 (en) 2024-08-06
CA2818499A1 (en) 2012-06-07
US20220064654A1 (en) 2022-03-03
KR20130119945A (ko) 2013-11-01
BR112013012630B1 (pt) 2021-09-08
AU2011336923A1 (en) 2013-05-30
AU2011336923B2 (en) 2017-02-16
BR112013012630A2 (pt) 2020-09-24
JP6061862B2 (ja) 2017-01-18

Similar Documents

Publication Publication Date Title
CN107828671B (zh) 用于生产3-羟基丙酸的组合物和方法
CN107406821B (zh) 用于生产3-羟基丙酸的突变宿主细胞
EP3027733B1 (en) 3-hydroxypropionic acid production by recombinant yeasts expressing an insect aspartate 1-decarboxylase
US20170107526A1 (en) Compositions and Methods for Succinate Production
EP2925873B1 (en) 3-hydroxypropionic acid production by recombinant yeasts
EP2807262A2 (en) Methods for succinate production
CN110869488B (zh) 增强型代谢物生产酵母
WO2012103263A2 (en) Compositions and methods for malate and fumarate production
CN110914434A (zh) 苏氨酸生产酵母

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TG01 Patent term adjustment
TG01 Patent term adjustment