CN114456996A

CN114456996A - 改善的脂肪酸衍生物的生产

Info

Publication number: CN114456996A
Application number: CN202210135822.5A
Authority: CN
Inventors: 德里克·L·格林菲尔德; 安德烈亚斯·W·席尔默; 伊利莎白·J·克拉克; 伊莱·S·格罗班; 伯纳多·M·达科斯塔; Z·胡; 凯文·霍尔登; 诺厄·赫尔曼
Original assignee: Genomatica Inc
Current assignee: Genomatica Inc
Priority date: 2012-04-02
Filing date: 2013-04-02
Publication date: 2022-05-10
Also published as: CA2883968A1; MX366939B; MX2014011905A; BR122019026127B1; WO2013152051A3; US20210348173A1; MY181688A; JP6738852B2; KR20200062388A; MX2019004568A; EP2834352A2; CN104395464B; CA2883968C; AU2013243601B2; BR112014024675B1; JP2015512644A; US20240150774A1; CA3162104A1; JP7366836B2; KR20150032930A

Abstract

本发明公开涉及重组宿主细胞，其包括有效改善了脂肪酸衍生物的效价、产率和/或生产率的菌株修饰。本发明公开进一步涉及包括重组宿主细胞的细胞培养物，其中所述的重组宿主细胞用于发酵生产脂肪酸衍生物及其组合物。

Description

改善的脂肪酸衍生物的生产

本申请是CN201380026304.9的分案申请。

相关申请的交叉引用

本申请要求2012年4月2日提交的美国临时申请号61/619,324的权益，并且该申请以引用方式全文并入本文。

序列表

本发明包括序列表，该序列表通过EFS-Web以ASCII形式提交，并以引用方式全文并入本文。在2013年4月2日创建的所述的ASCII拷贝命名为LS00042PCT_SL.txt，并且大小为143,098字节。

技术领域

本发明公开涉及包括细胞株修饰的重组宿主细胞，其有效地改善了脂肪酸衍生物的效价、产率和/或生产率。本发明公开进一步涉及细胞培养物，其包括用于发酵生产脂肪衍生物及其组合物的重组宿主细胞。

背景技术

包括脂肪醛、脂肪醇、碳氢化合物(烷烃和烯烃)、脂肪酯(例如蜡、脂肪酸酯或脂肪酯)和酮在内的脂肪酸衍生物代表了工业化学品和燃料的重要类别。这些分子及其衍生物具有多种用途，包括但不限于用作表面活性剂、润滑剂、增塑剂、溶剂、乳化剂、软化剂、增稠剂、风味剂、香料和燃料。原油是目前用于生产石油化学品和燃料的原材料的主要来源。由石油衍生的两类主要原材料为短链烯烃(例如乙烯和丙烯)和芳香族(例如苯和二甲苯异构体)。这些原材料通过使用多种方法(例如催化裂化、蒸汽裂化或催化重整)以相当多的花费从原油中的长链碳氢化合物断裂而衍生得到。这些原材料可以用于制造石油化学品，例如单体、溶剂、洗涤剂和粘合剂，而这些化学品不能以其他方式由原油直接精炼。由此，石油化学品可以用于制造专门的化学品，例如塑料、树脂、纤维、弹性体、药物、润滑剂、凝胶等。可以由石油化学品原材料生产的具体的专门化学品包括但不限于脂肪酸、碳氢化合物、脂肪醛、脂肪醇、酯和酮。

碳氢化合物例如具有许多商业用途。依此，短链烷烃和烯烃用于运输燃料。长链烯烃用于塑料、润滑剂和合成润滑剂。此外，烯烃用作生产醇、酯、增塑剂、表面活性剂、叔胺、增强型石油采收剂、脂肪酸、硫醇、烯基琥珀酸酐、环氧化物、氯化烷烃、氯化烯烃、蜡、燃料添加剂和阻流剂的供料。类似地，酯具有多种商业用途。例如生物柴油(备选燃料)由酯(例如脂肪酸甲基酯、脂肪酸乙基酯等)制成。一些低分子量的酯是具有怡人气味的挥发物，这使它们得以用作香料或风味剂。此外，酯用作漆、涂料和清漆的溶剂。此外，一些天然形成的物质(例如蜡、脂肪和油)还由酯制成。酯进一步用作树脂和塑料中的软化剂、增塑剂、阻燃剂以及汽油和油中的添加剂。此外，酯可以用于制造聚合物、膜、纺织品、染料和药物。

醛用于生产多种专门的化学品。例如醛用于生产聚合物、树脂(例如酚醛树脂)、染料、风味剂、增塑剂、香精、药物和其他化学品，其中一部分可以用作溶剂、防腐剂或消毒剂。此外，某些天然和合成的化合物(例如维生素)和用作激素的化合物为醛。此外，许多糖包括醛基。脂肪醛可以通过化学或酶还原而转化为脂肪醇。相似地，脂肪醇也具有许多商业用途。更短链的脂肪醇用于化妆品和食品工业，例如乳化剂、软化剂和增稠剂。由于脂肪醇的两性本性，脂肪醇起到非离子表面活性剂的作用，其用于个人护理和家庭产品，例如洗涤剂。此外，脂肪醇用于蜡、树胶、树脂、药品软膏和洗剂、润滑油添加剂、纺织品抗静电和整理剂、增塑剂、化妆品、工业溶剂和用于脂肪的溶剂。脂肪醇(例如脂肪族的醇)包括8至22个碳原子的链。脂肪醇通常具有偶数的碳原子、以及与末端碳连接的单个醇基(-OH)。一些脂肪醇是不饱和的，一些脂肪醇是支化的。它们广泛用于工业化学中。大多数天然的脂肪醇以蜡的形式被发现，其为脂肪酸与脂肪醇形成的酯。它们由细菌、植物和动物产生。目前，脂肪醇是通过脂肪酸(其由天然来源产生，该天然来源例如椰子油、棕榈油、棕榈坚果油、牛脂和猪油)的催化氢化或者通过α-烯烃(由石油化学品供料产生)的化学水合而生产。由天然来源衍生的脂肪醇具有可变的链长。脂肪醇的链长对于具体应用而言是重要的且特异性的。此外，脂肪醇脱水形成α-烯烃还可以通过化学催化作用来完成。

由于勘探、提取、运输和精炼用于化学和燃料产品的石油提出了固有的挑战，本领域需要备选的来源，其可以经济且高效地产生以用于化学和燃料生产。此外，特别考虑到居住在这个星球上的人口从过去以来一直在增长，所以燃烧石油基燃料已经成为环境的严重危害。因此，需要石油替代物，其不能与产生勘探、提取、运输和精炼石油所造成的相同类型的环境破坏。

生产可再生石油的一种选择是通过改造宿主细胞来生产可再生的石油。生物衍生的燃料和化学品提供了超过石油基燃料的益处。诸如碳氢化合物(例如烷烃、烯烃或炔烃)、脂肪醇、酯、脂肪酸、脂肪醛和酮之类的生物衍生的化学品由生物质直接转化成所需的化学产品。然而，为了由商业上切实可行的可发酵的糖或生物质得到生物衍生的脂肪酸衍生物用作用于生产可再生化学品和燃料的来源，必须优化所述的方法以便高效地转化和回收产品。近年来，在生物衍生的燃料和化学品的研发中，有一个研究和研发的焦点。然而，所述的相关方法和产品仍非常需要改善，以使得生物衍生的燃料和化学品成为商业上切实可行的选择。需要改善的领域包括生产方法的能量效率、以及终产品的产率。本发明公开解决了该需要。

发明概述

本发明公开的一个方面提供了具有基因改造的多核苷酸序列的重组宿主细胞，其中所述的多核苷酸序列编码一种或多种具有特异性酶活性的多肽。所述的多核苷酸序列对于宿主细胞是外源的或内源的。依此，本发明公开提供了具有基因改造的多核苷酸序列的重组宿主细胞，其中所述的基因改造的多核苷酸序列编码一种或多种如下多肽，其中所述的多肽具有选自以下的活性，包括但不限于3-羟基癸酰基-[acp]脱水酶(E.C.4.2.1.60)活性；β-酮脂酰基-ACP合酶I(E.C.2.3.1.41)活性；β-酮脂酰基-ACP合酶II(E.C.2.3.1.179)活性；[acp]S-丙二酰基转移酶{丙二酰基-CoA-ACP酰基转移酶}(E.C.2.3.1.39)活性；3-氧酰基-{β-酮脂酰基}-ACP还原酶(E.C.1.1.1.100)活性；β-酮脂酰基-ACP合酶III(E.C.2.3.1.180)活性；烯酰基-ACP还原酶(NADH)(E.C.1.3.1.9)活性；烯酰基-ACP还原酶(NADPH)(E.C.1.3.1.10)活性；3-羟基-酰基-[acp]脱水酶(E.C.4.2.1.59)活性；以及反-2,顺-3-癸烯酰基-ACP异构酶(E.C.5.3.3.14)活性，其中当在有效表达多核苷酸的条件下在包括碳源的培养基中培养时，所述的重组宿主细胞以比相应的野生型宿主细胞更高的效价、产率和生产率来生产脂肪酸衍生物。在相关的方面中，当所述的多肽与至少一种其他的具有酶活性的多肽组合表达时，重组宿主细胞以更高的效价、产率和/或生产率生产脂肪酸衍生物组合物。在另一个方面中，当所述的多肽与至少5种其他的具有酶活性的多肽组合表达时，重组宿主细胞以更高的效价、产率和/或生产率生产脂肪酸衍生物组合物。在另一个方面中，当所述的多肽与至少2种、3种、4种、5种、6种或更多的具有酶活性的多肽组合表达时，重组宿主细胞以更高的效价、产率和/或生产率生产脂肪酸衍生物组合物。在另一个相关的方面中，重组宿主细胞包括进一步编码为酰基载体蛋白质(ACP)的多肽的一种或多种基因改造的多核苷酸序列。ACP可以与一种或多种如下多肽组合表达，其中所述的多肽编码任一种酶活性，其中当在合适的条件下培养时，ACP进一步增加重组宿主细胞的效价、产率和/或生产率。在另一个相关的方面中，基因改造的多核苷酸序列进一步编码具有accABCD活性(E.C.6.4.1.2)的多肽。accABCD可以与一种或多种编码任一种酶活性的多肽组合表达，其中当在合适的条件下培养时，accABCD进一步增加重组宿主细胞的效价、产率和/或生产率。

本发明公开的另一个方面提供了具有基因改造的多核苷酸的重组宿主细胞，其中所述的基因改造的多核苷酸序列编码一种或多种多肽，其中所述的多肽具有酶活性，包括但不限于反-2,顺-3-癸烯酰基-ACP异构酶活性(fabA或fabM)；β-酮脂酰基-ACP合酶I(fabB)；丙二酰基-CoA-ACP酰基转移酶(fabD)；β-酮脂酰基-ACP合酶I(fabF或fabB)；β-酮脂酰基-ACP还原酶(fabG)；β-酮脂酰基-ACP合酶III(fabH)；烯酰基-ACP还原酶(fabI、fabL、fabV或fabK)；3-羟基-酰基-[acp]脱水酶(fabA或fabZ)；和反-2-烯酰基-ACP还原酶II(fabK)。在相关的方面中，多肽选自fabA、fabB、fabD、fabF、fabG、fabH、fabI、fabL、fabV、fabZ、fabM、fabK和/或它们的组合。在另一个相关的方面中，多肽选自：鼠伤寒沙门氏杆菌(Salmonella typhimurium)(NP_460041)的FabA；得自大肠埃希氏菌(Escherichia coli)(NP_416826)的FabB；得自鼠伤寒沙门氏杆菌(NP_460164)的FabD；得自鼠伤寒沙门氏杆菌(NP_460165)的FabG；得自鼠伤寒沙门氏杆菌(NP_460163)的FabH；得自鼠伤寒沙门氏杆菌(NP_459232)的FabZ；得自变性链球菌(Streptococcus mutans)(AAN59379)的FabM；得自肺炎链球菌(Streptococcus pneumoniae)(AAF98273)的FabK；得自霍乱弧菌(Vibriocholera)(YP_001217283)的FabV；得自丙酮丁醇梭菌(Clostridium acetobutylicum)(NP_350156)的FabF；得自枯草芽孢杆菌亚种枯草菌株168(Bacillus subtillissubsp.subtilis str.168)(NP_389054)的FabL；得自枯草芽孢杆菌亚种枯草菌株168(NP_388745)的FabI；得自不动杆菌菌种(Acinetobacter sp.)ADP1(YP_047630)的FabI；得自Marinobacter aquaeoli VT8(YP_958813)的FabI；得自不透明红球菌(Rhodococcusopacus)B4(YP_002784194)的FabI；得自不动杆菌菌种ADP1(YP_046731)的FabH；得自Marinobacter aquaeoli VT8(YP_958649)的FabH；得自不透明红球菌B4(YP_00278448)的FabH或它们的组合。

本发明公开进一步考虑了具有基因改造的多核苷酸序列的重组宿主细胞，其中所述的基因改造的多核苷酸序列编码ACP多肽，其中当在有效表达ACP多肽的条件下在包括碳源的培养基中培养时，重组宿主细胞以比相应的野生型宿主细胞更高的效价、产率或生产率生产脂肪酸衍生物。在相关的方面中，基因改造的多核苷酸序列进一步编码具有磷酸泛酰巯基乙胺基转移酶(E.C.2.7.8.7)活性的多肽。此处，基因改造的多核苷酸序列包括编码磷酸泛酰巯基乙胺基转移酶(E.C.2.7.8.7)的sfp基因。在相关的方面中，基因改造的多核苷酸序列进一步编码具有accABCD活性(E.C.6.4.1.2)的多肽。ACP可以与accABCD和/或磷酸泛酰巯基乙胺基转移酶组合表达，其中在合适的条件下培养时，任何表达多肽的组合都会进一步使重组宿主细胞的效价、产率和/或生产率增加。在另一个相关的方面中，ACP作为重组宿主细胞中表达的终末途径的酶由同一有机体衍生得到，其中终末途径的酶切割任何的酰基-ACP物质，其为脂肪酸生物合成途径的一部分。ACP对于宿主细胞而言是外源的或内源的。

本发明公开进一步涵盖了包括如下基因改造的多核苷酸序列的重组宿主细胞，其中所述的基因改造的多核苷酸序列包括转座子，其中将转座子插入到yijP基因中影响位于yijP基因侧翼的第二基因，其中第二基因编码受到上调的或下调的多核苷酸，并且其中上调的或下调的多核苷酸编码如下多肽，当所述宿主细胞在有效表达所述多肽的条件下在包括碳源的培养基中培养时，所述上调的或下调的多核苷酸编码的多肽影响脂肪酸衍生物的生产。yijP基因的任一侧的侧翼上可以具有基因。在相关的方面中，转座子插入到yijP基因中使得yijP基因或其多核苷酸失活，这影响位于yijP基因侧翼的一个或多个基因，其中一个或多个侧翼基因编码如下多肽，当所述的宿主细胞在有效表达所述多肽的条件下在包括碳源的培养基中培养时，所述一个或多个侧翼基因编码的多肽影响脂肪酸衍生物组合物的生产。在一个相关的方面中，侧翼基因包括多核苷酸，其包括但不限于ppc,yijO,frwD,pflCpflD或argE。

本发明公开的另一个方面提供了包括基因改造的多核苷酸序列的重组宿主细胞，其中所述的基因改造的多核苷酸序列编码磷酸烯醇式丙酮酸羧化酶(ppc)多肽，其中当在有效表达ppc多肽的条件下在包括碳源的培养基中培养时，所述的重组宿主细胞以比相应的野生型宿主细胞更高的效价、产率或生产率产生脂肪酸衍生物组合物。

此外，本发明公开的另一个方面提供了细胞培养物，其包括本发明提出的任一种重组宿主细胞(上文所述)。将重组宿主细胞在培养基中培养，这样根据本发明提出的基因改造方法，重组宿主细胞生产脂肪酸衍生物组合物(上文所述)。在相关的方面中，由本发明公开的重组宿主细胞生产的脂肪酸衍生物组合物包括但不限于脂肪酸、脂肪酯、脂肪醇、脂肪醛、烷烃、端烯烃、内烯烃和酮。在另一个相关的方面中，脂肪酸衍生物为C6、C8、C10、C12、C13、C14、C15、C16、C17或C18脂肪酸衍生物。在另一个相关的方面中，脂肪酸衍生物为C10:l、C12:l、C14:l、C16:l或C18:l的不饱和脂肪酸衍生物。在另一个相关的方面中，脂肪酸衍生物组合物包括C8、C10、C12、C14、C16和C18脂肪酸衍生物中的一种或多种。由包括本发明公开的重组宿主细胞的细胞培养物生产的脂肪酸衍生物组合物包括脂肪酸、脂肪醛、脂肪醇、脂肪酯、烷烃、端烯烃、内烯烃和酮。本发明公开进一步涵盖了：包括脂肪酸衍生物的脂肪酸衍生物组合物，其中在所述的脂肪酸衍生物中，在距脂肪醇的还原末端的C7和C8之间，在碳链的位置7处具有双键；包括不饱和脂肪酸衍生物的脂肪酸衍生物组合物；包括饱和脂肪酸衍生物的脂肪酸衍生物组合物；以及包括支链脂肪酸衍生物的脂肪酸衍生物组合物。

本发明公开进一步考虑了包括任一种本发明提出的重组宿主细胞的细胞培养物，其中当相应的野生型宿主细胞在与重组宿主细胞相同的培养条件下时，重组宿主细胞的效价比相应的野生型宿主细胞的效价高至少大约5％。在此，重组宿主细胞具有大约1g/L至大约250g/L的效价，更具体而言，大约90g/L至大约120g/L的效价。在相关的方面中，重组宿主细胞的产率为至少大约10％至大约40％。在一个方面中，重组宿主细胞的产率为大约25％。此外，本发明还涵盖了包括任一种本发明提出的重组宿主细胞的细胞培养物，其中细胞培养物的生产率为大约0.7mg/L/hr至大约3g/L/hr或更高。

本发明公开的另一个方面提出了制备重组宿主细胞的方法，包括对重组宿主细胞进行基因改造，使得该细胞在特定的培养条件下表达由一种或多种多核苷酸序列编码的多肽序列，其中所述的多核苷酸序列编码具有特异酶活性的一种或多种多肽。

附图简述

当组合附图一起阅读本发明公开时，可以更好地理解，其中所述的附图起到示意优选的实施方案的作用。此外，应该理解的是本发明公开不限于附图中公开的具体的实施方案。

图1提出了在重组微生物有机体中以酰基CoA作为前体来生产脂肪酸衍生物的示例性生物合成途径。该循环由丙二酰基-ACP和乙酰基-CoA的缩合来引发。

图2提出了示例性脂肪酸的生物合成循环，其中通过丙二酰基-CoA的转酰基作用形成丙二酰基-ACP来生产丙二酰基-ACP(通过丙二酰基-CoA:ACP酰基转移酶(fabD)的催化)；然后，β-酮脂酰基-ACP合酶III(fabH)引发丙二酰基-ACP和乙酰基-CoA的缩合。延长循环开始于β-酮脂酰基-ACP合酶I(fabB)和β-酮脂酰基-ACP合酶II(fabF)催化的丙二酰基-ACP与酰基-ACP的缩合，从而生产β-酮-酰基-ACP，该β-酮-酰基-ACP接着被β-酮脂酰基-ACP还原酶(fabG)还原，从而生产β-羟基-酰基-ACP，其通过β-羟基酰基-ACP脱水酶(fabA或fabZ)脱水形成反-2-烯酰-酰基-ACP。FabA还可以使反-2-烯酰基-酰基-ACP异构化形成顺-3-烯酰基-酰基-ACP，其可以绕过fabI，并可以被fabB利用(脂肪族链长通常至多为C16)，从而生产β-酮-酰基-ACP。各循环中的最后步骤是由烯酰基-ACP还原酶(fabI)催化的，其将反-2-烯酰基-酰基-ACP转化为酰基-ACP。在上文所述的方法中，脂肪酸合成的终止是通过硫酯酶将酰基由酰基-ACP上移除从而释放游离的脂肪酸(FFA)来进行的。硫酯酶(例如tesA)水解硫酯键，这是通过硫氢基键在酰基链与ACP之间进行的。

图3示出了乙酰基-CoA羧化酶(accABCD)的酶复合物的结构和功能。BirA使accB(其为生物素羧基载体蛋白质)生物素化，其为乙酰基-CoA羧化酶的酶复合物的一部分。

图4提出了以酰基-ACP为起始来生产脂肪醇的示例性生物合成途径的概况，其中脂肪醛的生产是由酰基-ACP还原酶(AAR)或硫酯酶(TE)、以及羧酸还原酶(Car)的酶活性来催化的。脂肪醛通过醛还原酶(也称为醇脱氢酶)转化为脂肪醇。

图5提出了以酰基-ACP为起始来生产脂肪酯的示例性生物合成途径的概况，其中脂肪酯的生产是通过单酶系统或三酶系统来完成的。

图6提出了以酰基-ACP为起始来生产碳氢化合物的示例性生物合成途径的概况；内烯烃的生产是由OleABCD的酶活性来催化的；烷烃的生产是通过醛脱羧基酶(ADC)将脂肪醛酶转化形成烷烃来催化的；端烯烃的生产是通过羧化酶将脂肪酸酶转化形成端烯烃来催化的。

图7示出了由具有fadE基因衰减(即，删除)的MG1655大肠杆菌菌株生产的脂肪酸衍生物(总的脂肪物质)与大肠杆菌MG1655生产的脂肪酸衍生物的比较。图7提出的数据显示fadE基因衰减不会影响脂肪酸衍生物的生产。

图8示出了在对数期的DAM1_i377中的丙二酰基-CoA水平，其中所述的DAM1_i377表达8种不同的谷氨酸棒状杆菌(C.glutamicum)乙酰基-CoA羧化酶(Acc)操纵子构建体。

图9示出了在对数期的大肠杆菌DAMl_i377中的细胞内短链-CoA水平，其中所述的大肠杆菌DAMl_i377表达ptrcl/3_accDACB-birA±panK操纵子构建体。accDACB+birA在本发明中还称为accD+。

图10示出了大肠杆菌菌株DV2中的脂肪酸甲基酯(FAME)的生产，其中所述的大肠杆菌菌株DV2表达由烃海杆菌(M.hydrocarbonoclasticus)得到的酯合酶9和由谷氨酸棒状杆菌得到的乙酰基-CoA羧化酶复合物的成分。

图11示出了大肠杆菌的脂肪醇生产，其中所述的大肠杆菌在pCL质粒上表达细长聚球藻(Synechococcus elongatus)PCC7942 AAR以及由谷氨酸棒状杆菌得到的accD+操纵子。其中显示了accD+菌株的3个重复样品。

图12A和12B示出当质粒pCL_P_trc_tesA转化至如图所示的各包括iFAB的菌株中时，由2个重复的平板筛选得到的总脂肪物质的生产数据(mg/L)，并在FA2培养基中发酵20小时，从而在32℃(图12A)和37℃(图12B)完成诱导至收获。

图13示出具有质粒pDS57和整合的fabHI操纵子的大肠杆菌DAMl的FAME生产。fabH/I基因得自Marinobacter aquaeoli VT8或得自贝氏不动杆菌(Acinetobacterbaylyi)ADP1。关于这些菌株的fabH/I操纵子的更多细节参见表7。

图14示出具有质粒pDS57、以及不同构造的谷氨酸棒状杆菌acc基因及整合的fabHI操纵子的大肠杆菌DAMl的FAME生产。该菌株包括得自不透明红球菌或贝氏不动杆菌ADP1的fabH/I基因。关于fabH/I和acc操纵子的更多细节参见表7。

图15示出2种大肠杆菌DAM1 pDS57菌株与对照菌株大肠杆菌DAM1 pDS57相比的FAME和FFA效价，其中所述的大肠杆菌DAM1pDS57菌株选自图13中的整合的fabH/I基因菌株。

图16为iFAB138基因座的图示，其包括整合在iFAB138前面的cat-loxP-P_T5盒的示意图(图16A)；以及P_T5_iFAB138区(图16B)的示意图。

图17示出了菌株V668，其具有修复的rph和ilvG基因，生产比EG149更高水平的FFA，其中所述的EG149不具有任一修复的rph和ilvG基因。

图18为插入在菌株LC535的yijP基因中的转座子盒(转座子匹配物68F11)的图示。其中示出位于转座子盒内的启动子，并且该启动子可以影响相邻基因的表达。

图19示出表达细长聚球藻酰基-ACP还原酶(AAR)并共表达多种蓝细菌酰基载体蛋白质(ACP)的大肠杆菌DV2的脂肪醇的生产。关于ACP来源的细节在表12中提供。

图20示出表达无前导序列的大肠杆菌硫酯酶'tesA并共表达蓝细菌酰基载体蛋白质(cACP)和枯草芽孢杆菌sfp的大肠杆菌DV2的脂肪酸的生产。

发明详述

综述

本发明公开至少部分基于这样的发现：在重组宿主细胞中，脂肪酸生物合成途径的多个方面的修饰有利于增强该宿主细胞生产脂肪酸衍生物。本发明公开涉及具有所需特征的脂肪酸衍生物的组合物及生产该脂肪酸衍生物的方法。此外，本发明公开涉及重组宿主细胞(例如微生物有机体)、重组宿主细胞的培养物、制备和使用重组宿主细胞的方法，例如在培养的重组宿主细胞在发酵生产具有所需特性的脂肪酸衍生物中的用途。

更具体而言，所需的脂肪酸衍生物组合物(例如酰基-CoA、脂肪酸、脂肪醛、短链和长链的醇、碳氢化合物、脂肪醇、酯(例如蜡、脂肪酸酯或脂肪酯)、端烯烃、内烯烃和酮)的生产通过修饰一种或多种基因(与脂肪酸、脂肪酯、烷烃、烯烃、烯烃(olefin)或脂肪醇的生物合成途径、生产、降解和/或分泌有关)的表达而增强。本发明公开提供了重组宿主细胞，其经改造，从而提供相对于未改造的或天然的宿主细胞(例如作为对照细胞的野生型宿主细胞)而言增强的脂肪酸生物合成，这种增强是通过例如菌株的改善来完成的。依此，本发明公开鉴定用于本发明公开的重组宿主细胞、方法和组合物的多核苷酸。通常公认的是，与此类多核苷酸绝对一致的序列不是必须的。例如可以对特定多核苷酸序列进行改变，并针对活性筛选编码的多肽。这种改变通常包括保守突变和沉默突变(例如密码子优化)。可以使用本领域已知的方法，针对所需的功能筛选基因改造的或修饰的多核苷酸、以及编码的变体多肽，其中所述的功能包括但不限于增强的催化活性、增强的稳定性或降低的抑制作用(例如降低的反馈抑制作用)。

本发明公开鉴定根据酶分类(EC)号、与本发明所述的脂肪酸生物合成途径的多个步骤(即，反应)有关的酶活性，并提供通过所述的EC号分类的示例性多肽(例如酶)、以及编码此类多肽的示例性多核苷酸。此类示例性多肽和多核苷酸(其通过本发明的编号和/或序列识别号(SEQ ID NO)识别)可用于改造亲代宿主细胞中的脂肪酸途径，从而获得本发明所述的重组宿主细胞。本发明所述的多肽和多核苷酸是示例性的并且是非限定的。本领域的那些技术人员可以通过多个数据库获得本发明所述的示例性多肽的同源序列(例如theNational Center for Biotechnology Information(NCBI)提供的rhw Entrez数据库，theSwiss Institute of Bioinformatics提供的ExPasy数据库，the Technical Universityof Braunschweig提供的BRENDA数据库，以及the Bioinformatics Center of KyotoUniversity and University of Tokyo提供的KEGG数据库，所有这些均可在the WorldWide Web上获得)。

定义

除非明确地作出另外的指示，如本说明书和所附的权利要求书所用，单数形式“一”、“一个”和“一种”包括复数指示物。因此，例如“重组宿主细胞”包括两种或更多种此类重组宿主细胞，“脂肪醇”包括一种或多种脂肪醇或脂肪醇的混合物，“编码序列的核酸”包括一种或多种编码序列的核酸；“酶”包括一种或多种酶等。

编号：在整个说明书中使用的序列编号得自由NCBI(National Center forBiotechnology Information)提供的数据库(其由the National Institutes of Health,U.S.A.维护)(该编号在本发明中确认为“NCBI编号”或备选地确认为“GenBank编号”)，以及得自由the Swiss Institute of Bioinformatics提供的UniProt Knowledgebase(UniProtKB)and Swiss-Prot数据库(该编号在本发明中确认为“UniProtKB编号”)。

酶分类(EC)号：EC号由the Nomenclature Committee of the InternationalUnion of Biochemistry and Molecular Biology(IUBMB)建立，其描述可以在国际互联网的IUBMB Enzyme Nomenclature网站上获得。EC号是根据酶催化的反应将酶分类。

如本文所用，术语“核苷酸”是指多核苷酸的单体单元，其由杂环碱基、糖和一个或多个磷酸基构成。天然形成的碱基(鸟嘌呤(G)、腺嘌呤(A)、胞嘧啶(C)、胸腺嘧啶(T)和尿嘧啶(U))通常为嘌呤或嘧啶的衍生物，但是应该理解的是天然和非天然形成的碱基类似物也被包括在内。天然形成的糖为戊糖(五碳糖)、脱氧核糖(其形成DNA)或核糖(其形成RNA)，但是应该理解的是天然和非天然形成的糖类似物也被包括在内。核酸通常通过磷酸键连接，从而形成核酸或多核苷酸，但是本领域已知许多其他的键(例如磷硫酰键、硼烷磷酸键等)。

如本文所用，术语“多核苷酸”是指核苷酸(RNA)和脱氧核苷酸(DNA)的聚合物，其可以是单链的或双链的，并且其可以包括非天然或改变的核苷酸。术语“多核苷酸”、“核酸序列”和“核苷酸序列”在本发明中可以交换使用，其是指任何长度的核苷酸(RNA或DNA)的聚合形式。这些术语是指分子的一级结构，因此包括双链和单链DNA、以及双链和单链RNA。该术语包括由核苷酸类似物和修饰多核苷酸(例如但不限于甲基化的和/或加帽的多核苷酸)形成的RNA或DNA的类似物作为等价物。多核苷酸可以为任何形式，包括但不限于质粒、病毒、染色体、EST、cDNA、mRNA和rRNA。

如本文所用，术语“多肽”和“蛋白质”可以交换使用，其是指氨基酸残基的聚合物。术语“重组多肽”是指通过重组技术生产的多肽，其中通常，将编码所表达蛋白质的DNA或RNA插入到合适的表达载体中，该载体依此转化宿主细胞，从而生产多肽。

如本文所用，术语“同源”和“同源的”是指包括如下序列的多核苷酸或多肽，其中所述的序列与相应的多核苷酸或多肽序列具有至少大约50％的一致性。优选的是，同源的多核苷酸或多肽具有如下多核苷酸序列或氨基酸序列，该多核苷酸序列或氨基酸序列与相应的氨基酸序列或核苷酸序列具有至少大约80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％)、97％、98％或者至少大约99％的同源性。如本文所用，术语序列“同源性”和序列“一致性”可以交换使用。

本领域的任一普通技术人员很好地知道测定两个或多个序列之间的同源性的方法。简言之，计算两个序列之间的“同源性”可以按以下方式进行。为了达到最佳比较的目的，将序列进行比对(例如可以在第一和第二氨基酸或核酸序列的一者或二者中引入空位以达到最佳比对的目的，并且可以忽视非同源的序列以达到比较目的)。在优选的实施方案中，用于比较目的的、比对的第一序列的长度为第二序列的长度的至少大约30％、优选至少大约40％、更优选地至少大约50％、甚至更优选地至少大约60％、甚至更优选地至少大约70％、至少大约75％、至少大约80％、至少大约85％、至少大约90％、至少大约95％或者大约100％。然后，比较在第一和第二序列的相应的氨基酸位置或核苷酸位置处的氨基酸残基或核苷酸。当第一序列的位置被第二序列中相应位置处的相同氨基酸残基或核苷酸占据时，则分子在该位置处是相同的。两个序列之间的百分同源性为序列所共有的相同位置的数量的函数，其考虑了空位的数量和各空位的长度，必须引入空位的数量和各空位的长度以达到两个序列的最佳比对的目的。

序列的比较以及两个序列之间的百分同源性的确定可以使用数学算法来完成，例如BLAST(Altschul et al.,J.Mol.Biol,215(3):403-410(1990))。此外，两个氨基酸序列之间的百分同源性还可以使用Needleman和Wunsch算法来确定，其中所述的算法被引入到GCG软件包的GAP程序中，其中使用了Blossum 62矩阵或PAM250矩阵，以及16、14、12、10、8、6或4的空位权重和1、2、3、4、5或6的长度权重(Needleman and Wunsch,J.Mol.Biol.,48:444-453(1970))。此外，两个核苷酸序列之间的百分同源性还可以使用GCG软件包中的GAP程序来确定，其中使用了NWSgapdna.CMP矩阵以及40、50、60、70或80的空位权重和1、2、3、4、5或6的长度权重。本领域的任一普通技术人员可以进行最初的同源性计算，并相应地调整算参数。优选的参数组(和如果操作者不确定应当应用哪些参数来确定分子是否在所要求的同源性限制内而应该使用的参数组)是具有12的空位罚分、4的空位延伸罚分和5的移码空位罚分的Blossum 62评分矩阵。序列比对的其他方法是生物技术领域已知的(例如参见Rosenberg,BMC Bioinformatics,6:278(2005)；Altschul,et al.,FEBS J.,272(20):5101-5109(2005))。

如本文所用，术语“在低严谨性、中严谨性、高严谨性或极高严谨性的条件下杂交”描述了用于杂交和洗涤的条件。实施杂交反应的指导可以见于Current Protocols inMolecular Biology,John Wiley&Sons,N.Y.(1989),6.3.1-6.3.6。该参考文献中描述了水性和非水性方法并且可以使用任一种方法。本发明所指的具体的杂交条件如下：1)低严谨性杂交条件—在大约45℃下、在6x氯化钠/柠檬酸钠(SSC)中，然后在至少50℃下、在0.2XSSC、0.1％SDS中洗涤两次(对于低严谨性条件，洗涤温度可以升至55℃)；2)中严谨性杂交条件—在大约45℃下、在6xSSC中，然后在60℃的0.2xSSC、0.1％SDS中洗涤一次或多次；3)高严谨性杂交条件—在大约45℃的6xSSC中，然后在65℃下、在0.2XSSC、0.1％SDS中洗涤一次或多次；以及4)极高严谨性杂交条件—在65℃的0.5M磷酸钠、7％SDS，然后在65℃下、在0.2xSSC、1％SDS中洗涤一次或多次。除非另外指示，极高的严谨性条件(4)是优选的条件。

“内源的”多肽是指由宿主细胞(例如亲代微生物细胞)的基因组编码的多肽，其中重组细胞由所述的宿主细胞改造或衍生得到。

“外源的”多肽是指由亲代微生物细胞的基因组编码的多肽。变体(即，突变体)多肽为外源多肽的实例。

术语“异源的”通常是指由不同的物种衍生得到或有不同的有机体衍生得到。如本文所用，异源的是指并非天然存在于特定的有机体中的核苷酸序列或多肽序列。异源表达是指将蛋白质或多肽凭经验加入到通常不表达该蛋白质的细胞中。依此，异源的是指这样的事实：被转移的蛋白质最初由与受体不同类型的细胞或不同的物种衍生得到。例如可以通过重组方法将与植物细胞异源的多核苷酸序列引入到细菌宿主细胞中，然后该植物多核苷酸在重组细菌宿主细胞中为异源多核苷酸。

如本文所用，术语多肽的“片段”是指全长多肽或蛋白质的较短的部分，其大小为4个氨基酸残基至整个氨基酸序列减去1个氨基酸残基。在本发明公开的某些实施方案中，片段是指多肽或蛋白质的结构域(例如底物结合结构域或催化结构域)的整个氨基酸序列。

如本文所用，术语“诱变”是指一种方法，通过该方法有机体的遗传信息以稳定的方式被改变。编码蛋白质的核酸序列的诱变产生突变体蛋白质。此外，诱变还指非编码核酸序列的改变，而这种改变会导致修饰的蛋白质活性。

如本文所用，术语“基因”是指编码RNA产物或蛋白质产物的核酸序列；以及影响RNA或蛋白质的表达的可操作地连接的核酸序列(例如此类序列包括但不限于启动子或增强子序列)或编码会影响RNA或蛋白质的表达的序列的、可操作地连接的核酸序列(例如此类序列包括但不限于核糖体结合位点或翻译控制序列)。

表达控制序列是本领域已知的，并且包括例如启动子、增强子、多聚腺苷酸信号、转录终止子、内部核糖体进入位点(IRES)等，它们提供了多核苷酸序列在宿主细胞中的表达。表达控制序列特异性地与转录有关的细胞蛋白质相互作用(Maniatis et al.,Science,236:1237-1245(1987))。示例性的表达控制序列例如Goeddel,Gene ExpressionTechnology:Methods in Enzymology,Vol.185,Academic Press,San Diego,Calif.(1990)中所述。

在本发明公开的方法中，表达控制序列与多核苷酸序列可操作地连接。“可操作地连接”是指多核苷酸序列和表达控制序列以这样的方式连接，使得在合适的分子(例如转录活化蛋白质)与表达控制序列结合时，允许基因表达。根据转录和翻译的方向，可操作地连接的启动子位于所选的多核苷酸序列的上游。可操作地连接的增强子可以位于所选的多核苷酸的上游、内部或下游。

如本文所用，术语“载体”是指能够运送所连接的另一种核酸(即，多核苷酸序列)的核酸分子。一种类型的有用的载体为附加体(即，能够在染色体外复制的核酸)。有用的载体为能够使所连接的核酸自主复制和/或表达的那些。能够使可操作地连接的基因定向表达的载体在本发明中还称为“表达载体”。总体而言，用于重组DNA技术中的表达载体通常为“质粒”形式，其通常是指环状双链的DNA环，该DNA环作为载体形式不能与染色体结合。术语“质粒”和“载体”在本发明中可以交换使用，因为质粒为最常用的载体形式。然而，还包括此类其他形式的表达载体，这些载体发挥着等价的功能并且到目前为止是本领域已知的。在一些实施方案中，重组载体进一步包括与多核苷酸序列可操作地连接的启动子。在一些实施方案中，启动子是发育调节的、细胞器特异性的、组织特异性的、诱导型的、构成型的或者是细胞特异性的启动子。重组载体通常包括至少一个序列，其包括(a)与多核苷酸序列可操作地缀合的表达控制序列；(b)与多核苷酸序列可操作地缀合的选择标记；(c)与多核苷酸序列可操作地缀合的标记序列；(d)与多核苷酸序列可操作地缀合的纯化部分；(e)与多核苷酸序列可操作地缀合的分泌序列；以及(f)与多核苷酸序列可操作地缀合的靶向序列。在某些实施方案中，核苷酸序列被稳定地引入到宿主细胞的基因组DNA中，并且核苷酸序列的表达处于受调节的启动子区的控制之下。本发明所述的表达载体包括适用于在宿主细胞中表达多核苷酸序列的形式的、本发明所述的多核苷酸序列。本领域的技术人员应该理解的是表达载体的设计可以取决于诸如待转化的宿主细胞的选择、所需多肽的表达水平之类的因素。本发明所述的表达载体可以被引入到宿主细胞中，从而生产由本发明所述的多核苷酸序列编码的多肽，包括融合多肽。

在原核生物(例如大肠杆菌)中表达编码多肽的基因最通常的是使用包括构成型或诱导型启动子的载体来实施，其中所述的启动子指导融合或非融合多肽的表达。融合载体将一定数量的氨基酸加入到其中编码的多肽中，通常加入到重组多肽的氨基末端或羧基末端。这种融合载体通常起到以下3种目的中的一种或多种：(1)增加重组多肽的表达；(2)增加重组多肽的溶解性；以及(3)通过在亲和纯化中起到配体的作用而有助于重组多肽的纯化。通常，在融合表达的载体中，在融合部分与重组多肽的连接处引入蛋白水解的切割位点。这使得在纯化融合多肽后，重组多肽与融合部分分离。在某些实施方案中，本发明公开的多核苷酸序列与由噬菌体T5衍生的启动子可操作地连接。

在某些实施方案中，宿主细胞为酵母细胞，表达载体为酵母表达载体。用于在酿酒酵母(S.cerevisiae)中表达的载体的实例包括pYepSecl(Baldari et al.,EMBO J.,6:229-234(1987))、pMFa(Kurjan et al.,细胞,30:933-943(1982))、pJRY88(Schultz etal.,Gene,54:113-123(1987))、pYES2(Invitrogen Corp.,San Diego,CA)和picZ(Invitrogen Corp.,San Diego,CA)。

在其他的实施方案中，宿主细胞为昆虫细胞，表达载体为杆状病毒表达载体。可用于在培养的昆虫细胞(例如Sf9细胞)中表达蛋白质的杆状病毒载体包括例如pAc系列(Smith et al.,Mol.细胞Biol.,3:2156-2165(1983))和pVL系列(Lucklow et al.,Virology,170:31-39(1989))。

在另一个实施方案中，本发明所述的多核苷酸序列可以使用哺乳动物表达载体在哺乳动物细胞中表达。用于原核和真核细胞的其他合适的表达系统是本领域公知的，例如参见Sambrook et al.,"Molecular Cloning:A Laboratory Manual,"再版,Cold SpringHarbor Laboratory,(1989)。

本发明所指的术语“相应的野生型宿主细胞”是指作为对照细胞的细胞。例如如果重组宿主细胞中的多肽受到上调，则相同的多肽在对照细胞中以更低的水平存在。相反，如果重组宿主细胞中的多肽受到下调，则相同的多肽在对照细胞中以更高的水平存在。此外，“重组的或改造的宿主细胞”为用于生产一种或多种脂肪酸衍生物的微生物有机体，其中所述的脂肪酸衍生物包括例如酰基-CoA、脂肪酸、脂肪醛、短链和长链的醇、碳氢化合物、脂肪醇、酯(例如蜡、脂肪酸酯或脂肪酯)、端烯烃、内烯烃和酮。在一些实施方案中，重组宿主细胞包括一种或多种多核苷酸，各种多核苷酸均编码具有脂肪酸生物合成酶活性的多肽。

如本文所用，“酰基-CoA”是指在烷基链的羰基碳与辅酶A(CoA)的4'-磷酸泛酰亚硫酰基部分的硫氢基之间形成酰基硫酯，其具有下式R-C(O)S-CoA，其中R为具有至少4个碳原子的任何烷基。

如本文所用，“酰基-ACP”是指在烷基链的羰基碳与酰基载体蛋白质(ACP)的磷酸泛酰巯基乙胺基部分的硫氢基之间形成酰基硫酯。磷酸泛酰巯基乙胺基部分在翻译后通过全-酰基载体蛋白质合酶(ACPS)(一种磷酸泛酰巯基乙胺基转移酶)的作用与ACP上的保守丝氨酸残基连接。在一些实施方案中，酰基-ACP为完全饱和的酰基-ACP的合成中的中间体。在其他的实施方案中，酰基-ACP为不饱和的酰基-ACP的合成中的中间体。在一些实施方案中，碳链具有大约5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25或26个碳。这些酰基-ACP的每一种都是将它们转化为脂肪酸衍生物的酶的底物。

如本文所用，术语“脂肪酸衍生物”是指“脂肪酸”或“脂肪酸衍生物”，其可以称为“脂肪酸或其衍生物”。术语“脂肪酸”是指具有式RCOOH的羧酸。R表示脂肪族基团，优选为烷基。R可以包括大约4至大约22各碳原子。脂肪酸可以是饱和的、单不饱和的或多不饱和的。“脂肪酸衍生物”为部分由生产宿主有机体的脂肪酸生物合成途径形成的产物。“脂肪酸衍生物”包括部分由酰基-ACP或酰基-ACP衍生物形成的产率。示例性的脂肪酸衍生物包括例如酰基-CoA、脂肪酸、脂肪醛、短链和长链的醇、脂肪醇、碳氢化合物、酯(例如蜡、脂肪酸酯或脂肪酯)、端烯烃、内烯烃和酮。

本发明所指的“脂肪酸衍生物组合物”是由重组宿主细胞生产的，并且通常包括脂肪酸衍生物的混合物。在一些情况下，所述的混合物包括多于一种类型的产物(例如脂肪酸和脂肪醇、脂肪酸和脂肪酸酯、或者烷烃或烯烃)。在其他的情况下，脂肪酸衍生物组合物可以包括例如具有不同链长、且饱和或支化特征的脂肪醇(或者另一种脂肪酸衍生物)的混合物。在其他的情况下，脂肪酸衍生物组合物包括多于一种类型的产物、以及具有不同链长且饱和或支化特征的产物的混合物。

如本文所用，术语“脂肪酸生物合成途径”是指生产脂肪酸及其衍生物的生物合成途径。脂肪酸生物合成途径除了包括本发明所讨论的生产具有所需特征的脂肪酸衍生物的酶或多肽以外，还可以包括其他的具有酶活性的酶或多肽。

如本文所用，“脂肪醛”是指具有式RCHO的醛，其特征在于羰基(C＝O)。在一些实施方案中，脂肪醛为由脂肪醇形成的任何的醛。在某些实施方案中，R基的长度为至少5、至少6、至少7、至少8、至少9、至少10、至少11、至少12、至少13、至少14、至少15、至少16、至少17、至少18或者至少19个碳。备选地或此外，R基的长度为20或更少、19或更少、18或更少、17或更少、16或更少、15或更少、14或更少、13或更少、12或更少、11或更少、10或更少、9或更少、8或更少、7或更少、6或更少的碳。因此，R基可以具有上述任何两个端点限定的R基。例如R基可以为6-16个碳的长度、10-14个碳的长度或者12-18个碳的长度。在一些实施方案中，脂肪醛为C6、C7、C8、C9、C10、C11、C12、C13、C14、C15、C16、C17、C18、C19、C20、C21、C22、C23、C24、C25或C26脂肪醛。在某些实施方案中，脂肪醛为C6、C7、C8、C9、C10、C11、C12、C13、C14、C15、C16、C17或C18脂肪醛。

如本文所用，“脂肪醇”是指具有式ROH的醇。在一些实施方案中，R基的长度为至少5、至少6、至少7、至少8、至少9、至少10、至少11、至少12、至少13、至少14、至少15、至少16、至少17、至少18或者至少19个碳。备选地或此外，R基的长度为20或更少、19或更少、18或更少、17或更少、16或更少、15或更少、14或更少、13或更少、12或更少、11或更少、10或更少、9或更少、8或更少、7或更少、6或更少的碳。因此，R基可以具有上述任何两个端点限定的R基。例如R基可以为6-16个碳的长度、10-14个碳的长度或者12-18个碳的长度。在一些实施方案中，脂肪醇为C6、C7、C8、C9、C10、C11、C12、C13、C14、C15、C16、C17、C18、C19、C20、C21、C22、C23、C24、C25或C26脂肪醇。在某些实施方案中，脂肪醇为C6、C7、C8、C9、C10、C11、C12、C13、C14、C15、C16、C17或C18脂肪醇。

脂肪酸衍生物(例如脂肪醇)的R基可以为直连或支链。支链可以具有多于一个的支化点，并且可以包括环状支。在一些实施方案中，支化的脂肪酸、支化的脂肪醛或支化的脂肪醇为C6、C7、C8、C9、C10、C11、C12、C13、C14、C15、C16、C17、C18、C19、C20、C21、C22、C23、C24、C25或C26的支化的脂肪酸、支化的脂肪醛或支化的脂肪醇。在具体的实施方案中，支化的脂肪酸、支化的脂肪醛或支化的脂肪醇为C6、C7、C8、C9、C10、C11、C12、C13、C14、C15、C16、C17或C18的支化的脂肪酸、支化的脂肪醛或支化的脂肪醇。在某些实施方案中，支化的脂肪酸、支化的脂肪醛或支化的脂肪醇的羟基在第一位置(C1)处。

在某些实施方案中，支化的脂肪酸衍生物为异脂肪酸衍生物，例如异脂肪醛、异脂肪醇或反异脂肪酸衍生物、反异脂肪醛或反异脂肪醇。在示例性的实施方案中，支化的脂肪酸衍生物选自异C7:0、异C8:0、异C9:0、异C10:0、异C11:0、异C12:0、异C13:0、异C14:0、异C15:0、异C16:0、异C17:0、异C18:0、异C19:0、反异C7:0、反异C8:0、反异C9:0、反异C10:0、反异C11:0、反异C12:0、反异C13:0、反异C14:0、反异C15:0、反异C16:0、反异C17:0、反异C18:0和反异C19:0的支化的脂肪醇。

支化的或非支化的脂肪酸衍生物的R基可以是饱和的或不饱和的。如果是不饱和的，则R基可以具有多于一个的不饱和点。在一些实施方案中，不饱和的脂肪酸衍生物是单不饱和的脂肪酸衍生物。在某些实施方案中，不饱和的脂肪酸衍生物为C6:l、C7:l、C8:l、C9:l、C10:l、C11:l、C12:l、C13:l、C14:l、C15:l、C16:l、C17:l、C18:l、C19:l、C20:l、C21:l、C22:1、C23:1、C24:1、C25:1或C26:1的不饱和的脂肪酸衍生物。在某些实施方案中，不饱和的脂肪酸衍生物为C10:l、C12:l、C14:l、C16:l或C18:l的不饱和脂肪酸衍生物。在其他的实施方案中，不饱和的脂肪酸衍生物在ω-7位置处是不饱和的。在某些实施方案中，不饱和的脂肪酸衍生物包括顺式双键。

如本文所用，术语“克隆”通常是指起源于单一的共同祖先并与该祖先基本上是遗传一致的细胞或一组细胞，例如由单一的细菌细胞形成的克隆细菌菌落的细菌。

如本文所用，术语“培养物”通常是指包括活细胞的液体培养基。在一个实施方案中，培养物包括在受控的条件下在预定的培养物培养基中再生产的细胞，例如在包括所选的碳源和氮的液体培养基中生长的重组宿主细胞培养物。动词形式的“培养”或名词形式的“培养”是指使重组细胞细胞群体在液体或固体培养基中在合适的条件下生长。在具体的实施方案中，培养是指底物以发酵方式生物转化为终产物。培养用的培养基是公知的，并且此类培养物培养基的单个成分可得自商业来源，例如Difco^TM和BBL^TM商标。在一个非限定性的实例中，水性营养培养基为包括氮、盐和碳的复合来源的“富集培养基”，例如YP培养基，其包括此类培养基的10g/L蛋白胨以及10g/L酵母提取物。根据美国专利5,000,000；5,028,539；5,424,202；5,482,846；5,602,030；WO 2010127318中所述的方法，培养物的宿主细胞可以另外改造，从而高效地同化碳并使用纤维素材料作为碳源。此外，在一些实施方案中，宿主细胞被改造从而表达转化酶，这样蔗糖可以被用作碳源。

如本文所用，术语“在有效表达基因改造的多核苷酸序列的条件下”是指允许宿主细胞生产所需的脂肪酸衍生物的任何条件。合适的条件包括例如发酵条件。

如本文所用，在重组宿主细胞中，“修饰的”或“改变水平”的蛋白质(例如酶)活性是指在相对于亲代或天然宿主细胞测定的活性中存在的一个或多个特征的差异。通常，活性的差异是在重组宿主细胞(具有修饰的活性)与相应的野生型宿主细胞之间测定的(例如重组宿主细胞培养物相对于相应的野生型宿主细胞的比较)。修饰的活性可以是以下情况的结果，例如：重组宿主细胞所表达的蛋白质的量改变(例如编码蛋白质的DNA序列的拷贝数量升高或降低、编码蛋白质的mRNA转录子的数量升高或降低、和/或由mRNA形成蛋白质的蛋白质翻译的量升高或降低的结果)；蛋白质结构的改变(例如一级结构改变，如蛋白质的编码序列的改变，其导致底物特异性的改变、所见的动力学参数改变)；以及蛋白质的稳定性改变(例如蛋白质降解的升高或降低)。在一些实施方案中，所述的多肽为本发明所述的任一种多肽的突变体或变体。在某些情况下，用于本发明所述的多肽的编码序列为为了在特定的宿主细胞中的表达而优化的密码子。例如就在大肠杆菌中的表达而言，可以根据例如Grosjean et al.,Gene 18:199-209(1982)中所述优化一个或多个密码子。

如本文所用，术语“调节序列”通常是指DNA中碱基的序列，该序列与编码蛋白质的DNA序列可操作地连接，其中所述的碱基序列最终控制蛋白质的表达。调节序列的实例包括但不限于RNA启动子序列、转录因子结合序列、转录终止序列、转录调控因子(例如增强子元件)、影响RNA稳定性的核苷酸序列以及翻译调节序列(例如核糖体结合位点(例如原核生物中的Shine-Dalgarno序列或真核生物中的Kozak序列)、起始密码子、终止密码子)。

术语“改变的表达水平”和“修饰的表达水平”可以交换使用，并且是指在相同的条件下，与多核苷酸、多肽或碳氢化合物在相应的野生型细胞中的浓度相比，多核苷酸、多肽或碳氢化合物在改造的宿主细胞中以不同的浓度存在。

如本文所用，术语“效价”是指每单位体积的宿主细胞培养物生产的脂肪酸衍生物的量。在本发明所述的组合物和方法的任何方面中，脂肪酸衍生物以大约25mg/L、大约50mg/L、大约75mg/L、大约100mg/L、大约125mg/L、大约150mg/L、大约175mg/L、大约200mg/L、大约225mg/L、大约250mg/L、大约275mg/L、大约300mg/L、大约325mg/L、大约350mg/L、大约375mg/L、大约400mg/L、大约425mg/L、大约450mg/L、大约475mg/L、大约500mg/L、大约525mg/L、大约550mg/L、大约575mg/L、大约600mg/L、大约625mg/L、大约650mg/L、大约675mg/L、大约700mg/L、大约725mg/L、大约750mg/L、大约775mg/L、大约800mg/L、大约825mg/L、大约850mg/L、大约875mg/L、大约900mg/L、大约925mg/L、大约950mg/L、大约975mg/L、大约1000mg/L、大约1050mg/L、大约1075mg/L、大约1100mg/L、大约1125mg/L、大约1150mg/L、大约1175mg/L、大约1200mg/L、大约1225mg/L、大约1250mg/L、大约1275mg/L、大约1300mg/L、大约1325mg/L、大约1350mg/L、大约1375mg/L、大约1400mg/L、大约1425mg/L、大约1450mg/L、大约1475mg/L、大约1500mg/L、大约1525mg/L、大约1550mg/L、大约1575mg/L、大约1600mg/L、大约1625mg/L、大约1650mg/L、大约1675mg/L、大约1700mg/L、大约1725mg/L、大约1750mg/L、大约1775mg/L、大约1800mg/L、大约1825mg/L、大约1850mg/L、大约1875mg/L、大约1900mg/L、大约1925mg/L、大约1950mg/L、大约1975mg/L、大约2000mg/L(2g/L)、3g/L、5g/L、10g/L、20g/L、30g/L、40g/L、50g/L、60g/L、70g/L、80g/L、90g/L、100g/L或上述任意两个值所限定的范围的效价生产。在其他的实施方案中，脂肪酸衍生物以高于100g/L、高于200g/L、高于300g/L或更高(例如500g/L、700g/L、1000g/L、1200g/L、1500g/L或2000g/L)的效价生产。根据本发明公开的方法由重组宿主细胞生产的脂肪酸衍生物的效价为5g/L至200g/L、10g/L至150g/L、20g/L至120g/L、以及30g/L至100g/L。在一个实施方案中，根据本发明公开的方法由重组宿主细胞生产的脂肪酸衍生物的效价为大约1g/L至大约250g/L、并且更具体为90g/L至大约120g/L。所述的效价可以指由给定的重组宿主细胞培养物生产的特定的脂肪酸衍生物或脂肪酸衍生物的组合。

如本文所用，“由宿主细胞生产的脂肪酸衍生物的产率”是指输入的碳源在宿主细胞中被转化为产物(即，脂肪醇或脂肪醛)的效率。根据本发明公开的方法经改造从而生产脂肪酸衍生物的宿主细胞的产率为至少3％、至少4％、至少5％、至少6％、至少7％、至少8％、至少9％、至少10％、至少11％、至少12％、至少13％、至少14％、至少15％、至少16％、至少17％、至少18％、至少19％、至少20％、至少21％、至少22％、至少23％、至少24％、至少25％、至少26％、至少27％、至少28％、至少29％、至少30％或者由上述任意两个值所限定的范围。在其他的实施方案中，一种或多种脂肪酸衍生物以高于30％、40％、50％、60％、70％、80％、90％或更高的产率生产。备选地或此外，产率为大约30％或更低、大约27％或更低、大约25％或更低、大约22％或更低。因此，产率可以由上述任意两个端点来限定。例如根据本发明公开的方法由重组宿主细胞生产的一种或多种脂肪酸衍生物的产率可以为5％至15％、10％至25％、10％至22％、15％至27％、18％至22％、20％至28％、或20％至30％。在具体的实施方案中，由重组宿主细胞生产的一种或多种脂肪酸衍生物的产率为大约10％至大约40％。在另一个具体的实施方案中，由重组宿主细胞生产的一种或多种脂肪酸衍生物的产率为大约25％。所述的产率可以指由给定的重组宿主细胞培养物生产的特定的脂肪酸衍生物或脂肪酸衍生物的组合。

如本文所用，术语“生产率”是指每单位时间内每单位体积的宿主细胞培养物生产一种或多种脂肪酸衍生物的量。在本发明所述的组合物和方法的任何方面中，由重组宿主细胞生产的一种或多种脂肪酸衍生物的生产率为至少100mg/L/小时、至少200mg/L/小时、至少300mg/L/小时、至少400mg/L/小时、至少500mg/L/小时、至少600mg/L/小时、至少700mg/L/小时、至少800mg/L/小时、至少900mg/L/小时、至少1000mg/L/小时、至少1100mg/L/小时、至少1200mg/L/小时、至少1300mg/L/小时、至少1400mg/L/小时、至少1500mg/L/小时、至少1600mg/L/小时、至少1700mg/L/小时、至少1800mg/L/小时、至少1900mg/L/小时、至少2000mg/L/小时、至少2100mg/L/小时、至少2200mg/L/小时、至少2300mg/L/小时、至少2400mg/L/小时、或至少2500mg/L/小时。例如根据本发明所述的方法由重组宿主细胞生产的一种或多种脂肪酸衍生物的生产率可以为500mg/L/小时至2500mg/L/小时、或700mg/L/小时至2000mg/L/小时。在一个具体的实施方案中，产率为大约0.7mg/L/h至大约3g/L/h。所述的生产率可以指由给定的重组宿主细胞培养物生产的特定的脂肪酸衍生物或脂肪酸衍生物的组合。

如本文所用，术语“总脂肪物质”和“总脂肪酸产物”在本发明中可以交换使用，其是指脂肪醇、脂肪醛和脂肪酸的量，其可以通过GC-FID来评价，如国际专利申请公开WO2008/119082中所述。相同的术语用于指脂肪酯分析时，可以用于指脂肪酯和游离脂肪酸。

如本文所用，术语“葡萄糖利用率”是指每单位时间内培养物使用的葡萄糖的量，其报告为克/升/小时(g/L/hr)。如本文所用，术语“碳源”是指适于用作原核或简单的真核细胞生长所需的碳源的底物或化合物。碳源可以为多种形式，包括但不限于聚合物、碳水化合物、酸、醇、醛、酮、氨基酸、肽和气体(例如CO和CO₂)。示例性的碳源包括但不限于：单糖，例如葡萄糖、果糖、甘露糖、半乳糖、木糖和阿拉伯糖；寡糖，例如低聚果糖和低聚半乳糖；多糖，例如淀粉、纤维素、胶质和木聚糖；二糖，例如蔗糖、麦芽糖、纤维二糖和松二糖；纤维素材料和变体，例如半纤维素、甲基纤维素和羧甲基纤维素钠；饱和的或不饱和的脂肪酸、琥珀酸盐、乳酸盐和醋酸盐；醇，例如乙醇、甲醇和甘油；或它们的混合物。此外，碳源还可以为光合成产物，例如葡萄糖。在某些优选的实施方案中，碳源为生物质。在其他优选的实施方案中，碳源为葡萄糖。在其他优选的实施方案中，碳源为蔗糖。

如本文所用，术语“生物质”是指可以衍生得到碳源的任何生物材料。在一些实施方案中，适于生物转化的生物质被加工成碳源。在其他的实施方案中，生物质不需要进一步加工成碳源。碳源可以转化为生物燃料。示例性的生物质来源为植物物质或蔬菜，例如谷物、甘蔗或柳枝稷。另一种示例性的生物质来源为代谢废物，例如动物物质(例如牛粪便)。其他的示例性生物质来源包括藻类和其他海生植物。此外，生物质还包括由工业、农业、林业和家庭得到的废物，包括但不限于发酵废物、未干的秣草、稻草、木材、污物、垃圾、纤维素城市废物和食物剩余物。此外，术语“生物质”还指碳源，例如碳水化合物(例如单糖、二糖或多糖)。

如本文所用，对产物(例如脂肪酸及其衍生物)而言的术语“分离的”是指由细胞成分、细胞培养物培养基、或者化学或合成的前体分离得到的产物。通过本发明所述的方法生产的脂肪酸及其衍生物在发酵液及细胞质中相对而言可以是不可混合的。因此，所述的脂肪酸及其衍生物可以在细胞内或细胞外收集于有机相中。

如本文所用，术语动词性的“纯化”、形容词性的“纯化的”或名词性的“纯化”是指通过例如分离或隔离将分子从其环境中移出或分离。“基本上纯化的”分子为至少大约60％游离于(例如至少大约70％游离于、至少大约75％游离于、至少大约85％游离于、至少大约90％游离于、至少大约95％游离于、至少大约97游离于、至少大约99％游离于)它们所关联的其他组分。如本文所用，这些术语还指从样品中去除污染物。例如污染物的去除可以使样品中脂肪酸衍生物的百分率增加。例如当在重组宿主细胞中产生脂肪酸衍生物时，可以通过去除宿主细胞蛋白质来纯化脂肪酸衍生物。纯化后，样品中脂肪酸衍生物的百分率增加。术语动词性的“纯化”、形容词性的“纯化的”或名词性的“纯化”是相对的术语，其不需要绝对的纯度。因此，例如当在重组宿主细胞中产生脂肪酸衍生物时，纯化的脂肪酸衍生物是基本与其他细胞成分(例如核酸、多肽、脂质、碳水化合物或其他碳氢化合物)隔离的脂肪酸衍生物。

菌株改良

为了形成脂肪酸衍生物的高效价、产率和/或生产率，对生产型宿主细胞进行了多种修饰。FadR是与脂肪酸降解和脂肪酸生物合成途径的重要调节因子(Cronan et al,MolMicrobiol,29(4):937-943(1998))。大肠杆菌ACS酶FadD和脂肪酸运送蛋白质FadL为脂肪酸吸收系统的成分。FadL介导了脂肪酸运送至细菌细胞，而FadD介导了酰基-CoA酯的形成。当没有其他碳源可以利用时，外源脂肪酸被细菌吸收，并转化为酰基-CoA酯，其可以与运送因子FadR结合，并抑制fad基因的表达，其中所述的fad基因编码负责脂肪酸运送(FadL)、激活(FadD)和β-氧化的蛋白质(FadA,FadB,FadE和FadH)。当有备选的碳源可以利用时，细菌合成脂肪酸作为酰基-ACP，其用于磷脂的合成，但是不是β-氧化的底物。因此，酰基-CoA和酰基-ACP为脂肪酸的独立来源，这可以得到不同的终产物(Caviglia et al,JBiol.Chem.,279(12):1163-1169(2004))。

在本领域中，关于宿主细胞(例如大肠杆菌)中的脂肪酸生物合成的限定因素具有矛盾的推断。一种建议是对用于脂肪酸生物合成的主要前体的限定，例如乙酰基-CoA和丙二酰基-CoA可以使得脂肪酸衍生物的合成减少。增加通过脂肪酸生物合成的流量的一种方法是操纵该途径中的多种酶(参见图1和2)。实施例3描述了多个研究，该研究显示fab操纵子的构建以及向大肠杆菌宿主细胞的染色体中的整合，其中所述的fab操纵子编码生物合成途径中的酶，这些酶用于将丙二酰基-CoA转化为酰基-ACP。不想被理论所束缚，这可以增加脂肪酸生物合成的流量。通过乙酰基-CoA羧化酶(acc)复合物和脂肪酸生物合成(fab)途径由乙酰基-CoA供应酰基-ACP是限定脂肪酸衍生物的生产速率的另一个步骤(参见图3)。实施例2显示出优化形式的大肠杆菌谷氨酸棒状杆菌accABCD(±birA)过表达的效果，其证明此类基因修饰可以使大肠杆菌中的乙酰基-coA和丙二酰基-CoA的生产增加。

在另一个方法中，显示大肠杆菌宿主细胞中的rph和ilvG基因突变使得游离的脂肪酸(FFA)的产更高，这转化为脂肪醇的生产更高，如实施例4所示。在另一个方法中，获得转座子诱变和高通量的筛选，从而发现可以增加效价或产率的有利突变。如实施例5所示，将转座子插入到yijP基因中可以改善脂肪醇中摇瓶和分批供料的发酵中的产率。

由重组宿主细胞生成脂肪酸衍生物

本发明公开提供了多肽(例如酶)的多个实例，其中所述的多肽(例如酶)具有适用于本发明所述的脂肪酸生物合成途径的活性。此类多肽在本发明中统称为“脂肪酸生物合成多肽”或“脂肪酸生物合成酶”。本发明提供了脂肪酸途径的多肽的非限定性实例，其中所述的多肽适用于本发明公开的重组宿主细胞。在一些实施方案中，本发明公开包括含有如下多核苷酸序列的重组宿主细胞，其中所述的多核苷酸序列编码脂肪酸生物合成的多肽。所述的多核苷酸序列可以被整合到重组宿主细胞的染色体中，引入到存在于重组宿主细胞中的一个或多个质粒表达系统中，或两者，其中所述的多核苷酸序列包括编码脂肪酸生物合成的多肽的开放阅读框以及可操作地连接的调节序列。在一个实施方案中，脂肪酸生物合成的多核苷酸序列编码多肽，该多肽对于被改造的重组宿主细胞的亲代宿主细胞(即，对照细胞)而言是外源的。一些此类的外源多肽在重组宿主细胞中是过表达的。在另一个实施方案中，脂肪酸生物合成的多核苷酸序列编码外源或异源的多肽。换言之，由多核苷酸编码的多肽对于亲代宿主细胞而言是外源的。在另一个实施方案中，遗传修饰的宿主细胞过表达编码如下多肽(蛋白质)的基因，其中所述的多肽(蛋白质)增加宿主细胞生产脂肪酸生物合成酶的底物(即，脂肪酰基硫酯底物)的速率。在某些实施方案中，由所表达的基因编码的酶与脂肪酸的生物合成直接有关。此类重组宿主细胞可以被进一步改造，从而包括编码一种或多种脂肪酸生物合成的多肽(即，与脂肪酸生物合成有关的酶)的多核苷酸序列。此类多肽的实例为具有硫酯酶活性的多肽或蛋白质，其中所述的重组宿主细胞合成脂肪酸；或者具有硫酯酶活性和羧酸还原酶(CAR)活性的多肽或蛋白质，其中重组宿主细胞合成脂肪醛和脂肪醇；或者具有硫酯酶活性、羧酸还原酶活性和醇脱氢酶活性的多肽或蛋白质，其中重组宿主细胞合成脂肪醇；或者具有酰基-CoA还原酶(AAR)活性的多肽或蛋白质，其中重组宿主细胞合成脂肪醛和脂肪醇；或者具有酰基-CoA还原酶(AAR)活性和醇脱氢酶活性的多肽或蛋白质，其中重组宿主细胞合成脂肪醇；或者具有形成脂肪醇的酰基CoA还原酶(FAR)活性的多肽或蛋白质，其中重组宿主细胞合成脂肪醇；或者具有硫酯酶活性、羧酸还原酶活性和醛脱羧基酶活性的多肽或蛋白质，其中重组宿主细胞合成烷烃；或者具有酰基-CoA还原酶活性和醛脱羧基酶活性的多肽和蛋白质，其中重组宿主细胞合成烷烃；或者具有酯合酶活性的多肽和蛋白质，其中重组宿主细胞合成脂肪酯(例如单酶系统；参见图5)；或者具有硫酯酶活性、酰基-CoA合酶活性和酯合酶活性的多肽和蛋白质，其中重组宿主细胞合成脂肪酯(例如三酶系统；参见图5)；或者具有OleA活性的多肽和蛋白质，其中重组宿主细胞合成脂肪族酮；或者具有OleABCD活性的多肽和蛋白质，其中重组宿主细胞合成内烯烃；或者具有硫酯酶活性和脱羧酶活性的多肽和蛋白质，其中重组宿主细胞合成端烯烃；或者它们的组合。在一些实施方案中，由脂肪酸生物合成的多核苷酸编码的一种多肽是外源(或异源)多肽(例如由除了亲代宿主细胞以外的有机体起源的多肽，或者原产于亲代微生物细胞的多肽的变体)，或者内源多肽(即，原产于亲代宿主细胞的多肽)，其中内源多肽在重组宿主细胞中是过表达的。

下表1提供了示例性蛋白质的列表，其中所述的蛋白质可以在重组宿主细胞中表达从而有利于特定脂肪酸衍生物的生产。

表1：基因名称

脂肪酸的生产

重组宿主细胞可以包括一种或多种多核苷酸序列，该多核苷酸序列包括编码硫酯酶(例如Enzyme Commission编号为EC 3.1.1.5或EC 3.1.2(例如EC 3.1.2.14))的开放阅读框，以及有助于蛋白质在重组宿主细胞中的表达的可操作地连接的调节序列。在重组宿主细胞中，相对于编码硫酯酶的相应的野生型基因而言，编码序列的开放阅读框和/或调节序列被修饰。相对于由相应的野生型基因在重组宿主细胞中表达的硫酯酶的活性而言，所述的硫酯酶在相应的宿主细胞中的活性被修饰。在一些实施方案中，包括脂肪酸的脂肪酸衍生物组合物通过在有效表达硫酯酶的条件下在碳源存在下培养重组细胞来生产。在相关的实施方案中，重组宿主细胞包括编码具有硫酯酶活性的多肽的多核苷酸，以及编码具有其他的脂肪酸生物合成酶活性的多肽的一种或多种其他的多核苷酸。在一些此类的情况下，通过具有不同的脂肪酸生物合成酶活性的一种或多种酶将在硫酯酶作用下生产的脂肪酸转化为另一种脂肪酸衍生物，例如脂肪酯、脂肪醛、脂肪醇或碳氢化合物。

可以通过修饰特定硫酯酶的表达来选择由此形成的脂肪酸或脂肪酸衍生物的链长。硫酯酶将影响所生产的脂肪酸衍生物的链长。可以通过修饰所选的硫酯酶(EC3.1.2.14或EC 3.1.1.5)的表达来选择脂肪酸衍生物底物的链长。因此，可以改造宿主细胞，从而表达、过表达、衰减表达或不表达一种或多种所选的硫酯酶，其用于增加优选的脂肪酸衍生物底物的生产。例如可以通过表达偏爱生产C₁₀脂肪酸的硫酯酶，并衰减偏爱生产除了C₁₀脂肪酸以外的脂肪酸(例如偏爱生产C₁₄脂肪酸的硫酯酶)的硫酯酶来生产C₁₀脂肪酸。这将得到相对均匀的碳链长为10的脂肪酸群体。在其他的情况下，可以通过衰减生产非C₁₄脂肪酸的内源硫酯酶，并表达利用C₁₄-ACP的硫酯酶来生产C₁₄脂肪酸。在一些情况下，可以通过表达利用C₁₂-ACP的硫酯酶，并衰减生产非C₁₂脂肪酸的硫酯酶来生产C₁₂脂肪酸。例如可以通过表达偏爱生产C12脂肪酸的硫酯酶，并衰减偏爱生产除了C12脂肪酸以外的脂肪酸的硫酯酶来生产C12脂肪酸。这将得到相对均匀的碳链长为12的脂肪酸群体。由具有细胞外生产的几乎所有的脂肪酸衍生物的培养物培养基回收脂肪酸衍生物。可以使用本领域已知的方法(例如GC-FID)来分析由重组宿主细胞生产的脂肪酸衍生物组合物，以便测定特定的脂肪酸衍生物的分布，以及脂肪酸衍生物组合物的成分的链长和饱和度。可以使用本领域已知的方法(例如通过使用放射性前体、HPLC或在细胞溶解后的GC-MS)来证明乙酰基-CoA、丙二酰基-CoA和脂肪酸的过度生产。用于脂肪酸途径的硫酯酶及编码该硫酯酶的多核苷酸的其他非限定性实例在PCT公开申请号WO2010/075483中提供，该文献明确地以引用方式并入本文。

脂肪醛的生产

在一个实施方案中，重组宿主细胞生产脂肪醛。在一些实施方案中，由重组宿主细胞生产的脂肪酸被转化为脂肪醛。在一些实施方案中，由重组宿主细胞生产的脂肪醛接着被转化为脂肪醇或碳氢化合物。在一些实施方案中，天然的(内源的)脂肪醛生物合成多肽(例如醛还原酶)存在于宿主细胞(例如大肠杆菌)中，并有效地将脂肪醛转化为脂肪醇。在其他的实施方案中，天然的(内源的)脂肪醛生物合成多肽是过表达的。在其他的实施方案中，外源脂肪醛生物合成多肽被引入到重组宿主细胞中，并被表达或过表达。天然的或重组的宿主细胞可以包括编码如下酶的多核苷酸，其中所述的酶具有脂肪醛生物合成活性(例如脂肪醛生物合成多肽或脂肪醛生物合成多肽或酶)。在宿主细胞中表达或过表达脂肪醛生物合成酶时，脂肪醛被生产。经改造从而生产脂肪醛的重组宿主细胞通常将一些脂肪醛转化为脂肪醇。在一些实施方案中，通过在重组宿主细胞中表达或过表达编码如下多肽的多核苷酸而生产脂肪醛，其中所述的多肽具有脂肪醛生物合成活性，例如羧酸还原酶(CAR)活性。CarB为示例性的羧酸还原酶。在实施本发明公开的过程中，编码羧酸还原酶多肽的基因可以在宿主细胞中表达或过表达。在一些实施方案中，CarB多肽具有SEQ ID NO:7的氨基酸序列。在其他的实施方案中，CarB多肽为SEQ ID NO:7的变体或突变体。羧酸还原酶(CAR)多肽及编码该羧酸还原酶(CAR)多肽的多核苷酸的实例包括但不限于FadD9(EC6.2.1.-,UniProtKB Q50631,GenBank NP_217106,SEQ ID NO:34)、CarA(GenBank ABK75684)、CarB(GenBank YP889972；SEQ ID NO:33)以及在PCT公开号WO2010/042664和美国专利号8,097,439中所述的相关多肽，这些文献均明确地以引用方式并入本文。在一些实施方案中，重组宿主细胞进一步包括编码硫酯酶的多核苷酸。在一些实施方案中，通过在重组宿主细胞中表达或过表达编码脂肪醛生物合成多肽(例如具有酰基-ACP还原酶(AAR)活性的多肽)的多核苷酸来生产脂肪醛。酰基-ACP还原酶在重组宿主细胞中的表达导致脂肪醛和脂肪醇的生产(参见图4)。在重组宿主细胞(例如大肠杆菌)中存在的天然的(内源的)醛还原酶可以将脂肪醛转化为脂肪醇。示例性的酰基-ACP还原酶多肽在PCT公开号WO2009/140695和WO/2009/140696中有所描述，这两份文献均明确地以引用方式并入本文。通过在有效表达脂肪醛生物合成酶的条件下在碳源存在下培养宿主细胞来生产包括脂肪醛的组合物(例如脂肪醛组合物)。在一些实施方案中，脂肪醛组合物包括脂肪醛和脂肪醇。通常，由重组宿主细胞的细胞外环境(即，细胞培养物培养基)中回收脂肪醛组合物。

脂肪醇的生产

在一些实施方案中，重组宿主细胞包括编码如下多肽(例如酶)的多核苷酸，其中所述的多肽(例如酶)具有脂肪醇生物合成活性(脂肪醇生物合成多肽或脂肪醇生物合成酶)，并且所述的脂肪醇由重组宿主细胞生产。可以通过在有效表达脂肪醇生物合成酶的条件下在碳源存在下培养重组宿主细胞来生产包括脂肪醇的组合物(脂肪醇组合物)。在一些实施方案中，脂肪醇组合物包括脂肪醇，而且，脂肪醇组合物可以包括其他的脂肪酸衍生物。通常，由重组宿主细胞的细胞外环境(即，细胞培养物培养基)回收脂肪醇组合物。在一种方法中，重组宿主细胞经改造，从而通过表达硫酯酶和羧酸还原酶(CAR)来生产脂肪醇，其中所述的硫酯酶将酰基-ACP转化为游离的脂肪酸(FFA)，其中所述的羧酸还原酶将游离的脂肪酸转化为脂肪醛。存在于宿主细胞(例如大肠杆菌)中天然的(内源的)醛还原酶可以将脂肪醛转化为脂肪醇。在一些实施方案中，存在于宿主细胞中天然的(内源的)脂肪醛生物合成多肽(例如醛还原酶)足可以将脂肪醛转化为脂肪醇。而且，在其他的实施方案中，天然的(内源的)脂肪醛生物合成多肽是过表达的，并且在其他的实施方案中，外源的脂肪醛生物合成多肽被引入到重组宿主细胞中，并且被表达或过表达。在一些实施方案中，通过在重组宿主细胞中表达或过表达编码如下多肽的多核苷酸来生产脂肪醇，其中所述的多肽具有将脂肪醛转化为脂肪醇的脂肪醇生物合成活性。例如醇脱氢酶(醛还原酶，例如EC1.1.1.1)可以用于实施本发明公开。如本文所用，醇脱氢酶是指能够将脂肪醛转化为醇(例如脂肪醇)的多肽。本领域的普通技术人员将理解的是某些醇脱氢酶还能够催化其他的反应，并且这些非特异性的醇脱氢酶也被涵盖在醇脱氢酶的范围内。可以根据本发明公开使用的醇脱氢酶多肽的实例包括但不限于不动杆菌菌种M-l(SEQ ID NO:3)的AlrA或AlrA同源物(例如AlrAadpl(SEQ ID NO:4))，以及内源大肠杆菌醇脱氢酶，例如YjgB,(AAC77226)(SEQ ID NO:5)、DkgA(NP_417485)、DkgB(NP_414743)、YdjL(AAC74846)、YdjJ(NP_416288)、AdhP(NP_415995)、YhdH(NP_417719)、YahK(NP_414859)、YphC(AAC75598)、YqhD(446856)和YbbO[AAC73595.1]。其他的实例在国际专利申请公开号WO 2007/136762、WO2008/119082和WO 2010/062480中有所描述，这些文献均明确地以引用方式并入本文。在某些实施方案中，脂肪醇生物合成多肽具有醛还原酶或醇脱氢酶活性(EC 1.1.1.1)。

在另一种方法中，重组宿主细胞经改造，从而通过表达形成脂肪醇的酰基-CoA还原酶或脂肪酰基还原酶(FAR)来生产脂肪醇，其中所述的成脂肪醇的酰基-CoA还原酶或脂肪酰基还原酶(FAR)将脂肪酰基硫酯底物(例如脂肪酰基-CoA或脂肪酰基-ACP)转化为脂肪醇。在一些实施方案中，通过在重组宿主细胞中表达或过表达编码具有形成脂肪醇的酰基-CoA还原酶(FAR)活性的多肽的多核苷酸来生产脂肪醇。根据该实施方案可以使用的FAR多肽的实例在PCT公开号WO2010/062480中有所描述，该文献明确地以引用方式并入本文。可以通过酰基-CoA依赖途径(利用了脂肪酰基-ACP和脂肪酰基-CoA中间体)和酰基-CoA独立途径(利用了脂肪酰基-ACP中间体，但不利用脂肪酰基-CoA中间体)来生产脂肪醇。在特定的实施方案中，由过表达的基因所编码的酶选自脂肪酸合成酶、酰基-ACP硫酯酶、脂肪酰基-CoA合酶和乙酰基-CoA羧化酶。在一些实施方案中，由过表达的基因所编码的蛋白质对于宿主细胞而言是内源的。在其他的实施方案中，由过表达的基因所编码的蛋白质对于宿主细胞而言是异源的。此外，脂肪醇还可以通过能够将多种酰基-ACP或酰基-CoA分子还原成相应的伯醇的酶而天然地形成。此外，参见美国专利公开号20100105963、20110206630和美国专利号8097439，这些文献明确地以引用方式并入本文。增加重组宿主细胞生产脂肪醇的策略包括通过在生产型宿主中过表达天然的脂肪酸生物合成基因和/或表达由不同的有机体得到的外源脂肪酸生物合成基因来增加通过脂肪酸生物合成途径的流量，这样增加脂肪醇的生物合成。

酯的生产

如本文所用，术语“脂肪酯”可以用于指酯。本发明所指的脂肪酯可以为由脂肪酸制得的任何酯，例如脂肪酸酯。在一些实施方案中，脂肪酯包括A侧链和B侧链。如本文所用，酯的“A侧链”是指与酯的羧酸氧连接的碳链。如本文所用，酯的“B侧链”是指包括酯的亲代羧酸的碳链。在其中脂肪酯衍生自脂肪酸生物合成途径的实施方案中，A侧链由醇提供，而B侧链由脂肪酸提供。任何醇都可以用于形成脂肪酯的A侧链。例如所述的醇可以衍生自脂肪酸生物合成途径。备选地，所述的醇可以通过非脂肪酸的生物合成途径来生产。此外，外源可以提供醇。例如在脂肪酯由有机体生产的情况下，发酵液中可以供应醇。备选地，在脂肪酯由还可以生产醇的有机体生产的情况下，可以外源地供应羧酸，例如脂肪酸或醋酸。包括A侧链或B侧链的碳链可以为任何长度。在一个实施方案中，酯的A侧链为至少大约1、2、3、4、5、6、7、8、10、12、14、16或18个碳的长度。当脂肪酯为脂肪酸甲基酯时，酯的A侧链为1个碳的长度。当脂肪酯为脂肪酸乙基酯时，酯的A侧链为2个碳的长度。酯的B侧链可以为至少大约4、6、8、10、12、14、16、18、20、22、24或26个碳的长度。A侧链和/或B侧链可以是直链或支链的。支链可以具有一个或多个分支点。此外，支链可以包括环状支。此外，A侧链和/或B侧链可以是饱和的或不饱和的。如果是不饱和的，A侧链和/或B侧链则可以具有一个或多个不饱和点。在一个实施方案中，脂肪酯以生物合成的方式生产。在这种实施方案中，首先，脂肪酸被活化。“活化的”脂肪酸的非限定性实例为酰基-CoA、酰基ACP和酰基磷酸。酰基-CoA可以为脂肪酸生物合成或降解的直接产物。此外，酰基-CoA可以由游离的脂肪酸、CoA、和腺苷核苷酸三磷酸(ATP)合成。生产酰基-CoA的酶的实例为酰基-CoA合酶。在一些实施方案中，重组宿主细胞包括编码多肽的多核苷酸，所述多肽例如具有酯合酶活性的酶(酯合酶多肽或酯合酶)。

脂肪酯通过酯合酶多肽催化的反应来生产，其中所述的酯合酶多肽在重组宿主细胞中表达或过表达。在一些实施方案中，通过在有效表达酯合酶的条件下在碳源存在下培养重组细胞来生产包括脂肪酯的组合物。在一些实施方案中，由细胞培养物回收脂肪酯组合物。酯合酶多肽包括例如分类为EC 2.3.1.75的酯合酶多肽，或催化酰基硫酯转化为脂肪酯的任何其他多肽，其包括但不限于硫酯酶、酯合酶、酰基-CoA:醇酰基转移酶、酰基转移酶、或脂肪酰基-CoA:脂肪醇酰基转移酶。例如多核苷酸可以编码蜡/dgat，其为得自霍霍巴、不动杆菌菌种菌株ADP、泊库岛食烷菌(Alcanivorax borkumensis)、绿脓杆菌(Pseudomonas aeruginosa)、Fundibacter jadensis、拟南芥、或Alkaligenes eutrophus中的双功能酯合酶/酰基-CoA:二酰基甘油酰基转移酶。在具体的实施方案中，酯合酶多肽为不动杆菌菌种的二酰基甘油O-酰基转移酶(蜡-dgaT；UniProtKB Q8GGG1,GenBankAA017391)或霍霍巴的蜡合酶(UniProtKB Q9XGY6,GenBank AAD38041)。在另一个实施方案中，酯合酶多肽为例如ES9(得自除烃海杆菌DSM 8798,UniProtKB A3RE51(SEQ ID NO:6)的蜡酯合酶)；除烃海杆菌DSM8789的ES8(GenBank Accession No.ABO21021；SEQ ID NO:7)；由ws2基因编码的GenBank ABO21021；或者ES376(由除烃海杆菌DSM 8798,UniProtKBA3RE50,GenBank ABO21020衍生的、wsl基因编码的另一种蜡质合酶)。在特定的实施方案中，编码酯合酶多肽的多核苷酸在重组宿主细胞中是过表达的。在一些实施方案中，脂肪酸酯由重组宿主细胞生产，其中所述的重组宿主细胞经改造，从而表达3种生物合成酶：硫酯酶、酰基-CoA合成酶(fadD)和酯合酶(例如三酶系统；参见图5)。在其他的实施方案中，脂肪酸酯由重组宿主细胞生产，其中所述的重组宿主细胞经改造，从而表达一种脂肪酸生物合成酶，即，酯合酶(例如单酶系统；参见图5)。适用于这些实施方案的酯合酶多肽及编码该酯合酶多肽的多核苷酸的非限定性实例包括在PCT公开号WO2007/136762、WO2008/119082和WO/2011/038134(三酶系统)，以及WO/2011/038132(单酶系统)中所述的那些，这些文献均明确地以引用方式并入本文。重组宿主细胞可以在宿主细胞的细胞外环境中生产脂肪酯，例如脂肪酸甲基酯、脂肪酸乙基酯或蜡酯。

碳氢化合物的生产

本发明公开的这一方面至少部分基于这样的发现：改变脂肪醛生物合成多肽(例如酰基-ACP还原酶多肽(EC 6.4.1.2))和碳氢化合物生物合成多肽(例如脱羧基酶)在重组宿主细胞中的表达水平促进重组宿主细胞以增强方式生产碳氢化合物。在一个实施方案中，重组宿主细胞生产碳氢化合物，例如烷烃、烯烃(例如端烯烃或内烯烃)或酮。在一些实施方案中，通过脱羰基作用转化由重组宿主细胞生产的脂肪醛，从而除去碳原子而形成碳氢化合物。在其他的实施方案中，通过脱羧基作用转化由重组宿主细胞生产的脂肪酸，从而除去碳原子而形成端烯烃。在一些实施方案中，通过脱羧基作用转化酰基-ACP中间体，从而除去碳原子而形成内烯烃或酮(参见图6)。在一些实施方案中，重组宿主细胞包括编码如下多肽(酶)的多核苷酸，其中所述的多肽(酶)具有碳氢化合物生物合成活性(碳氢化合物生物合成多肽或碳氢化合物生物合成酶)，并且通过在重组宿主细胞中表达或过表达碳氢化合物生物合成酶来生产碳氢化合物。蓝细菌的烷烃生物合成途径已经用于改造重组宿主细胞，以用于生产碳氢化合物(图6)，其中所述的烷烃生物合成途径由酰基-酰基载体蛋白质还原酶(AAR)和醛脱羧基酶(ADC)组成，这两种酶一起将脂肪酸代谢的中间体转化为烷烃和烯烃。上述途径(通过该途径，在蓝细菌中饱和的酰基-ACP被转化为烷烃)中两个反应的第二个反应涉及由醛脱羧基酶(ADC)(其为铁样蛋白质，具有组成未知的双核金属辅因子)切断脂肪醛中间体的C1-C2键。在一些实施方案中，通过在重组宿主细胞中表达或过表达编码如下多肽的多核苷酸来生产碳氢化合物，其中所述的多肽具有碳氢化合物生物合成活性，例如醛脱羧基酶(ADC)活性(例如EC 4.1.99.5)。可以编码醛脱羧基酶(用于本实施方案)的示例性多核苷酸包括但不限于在PCT公开号WO2008/119082和WO2009/140695中所述的那些以及在下表2中所示的那些序列，所述的这些文献明确地以引用方式并入本文。在一些实施方案中，重组宿主细胞进一步包括编码脂肪醛生物合成多肽的多核苷酸。在一些实施方案中，重组宿主细胞进一步包括编码酰基-ACP还原酶的多核苷酸。例如参见下表2。

表2：示例性碳氢化合物生物合成的多核苷酸及多肽

在一些实施方案中，通过在有效地表达酰基-CoA还原酶和脱羧基酶多核苷酸的条件下在碳源存在下培养重组细胞来生产包括碳氢化合物的组合物。在一些实施方案中，碳氢化合物组合物包括饱和的或不饱和的碳氢化合物。而且，碳氢化合物组合物可以包括其他的脂肪酸衍生物。通常，由重组宿主细胞的细胞外环境(即，细胞培养物培养基)中回收碳氢化合物组合物。如本文所用，烷烃是指仅由碳(C)和氢(H)组成的饱和的碳氢化合物或化合物，其中这些原子通过单键连接在一起(即，它们是饱和的化合物)。烯烃和烯烃是指包括至少一个碳-碳双键的碳氢化合物(即，它们是不饱和的化合物)。就α-烯烃或烯烃而言，端烯烃、α-烯烃、端烯烃和1-烯烃是指相同的化合物，其具有化学式CxH2x，其与具有相似分子式的其他烯烃的不同之处在于碳氢化合物链的线性以及双键在第一或α-位置处的位置。在一些实施方案中，通过在重组宿主细胞中表达或过表达编码碳氢化合物生物合成多肽(例如具有脱羧酶活性的多肽)的多核苷酸来生产端烯烃，例如在PCT公开号WO2009/085278中所述，该文献明确地以引用方式并入本文。在一些实施方案中，重组宿主细胞进一步包括编码硫酯酶的多核苷酸。在其他的实施方案中，通过在重组宿主细胞中表达或过表达编码碳氢化合物生物合成多肽(例如具有OleA活性的多肽)的多核苷酸来生产酮，例如在PCT公开号WO2008/147781中所述，该文献明确地以引用方式并入本文。在相关的实施方案中，通过在重组宿主细胞中表达或过表达编码碳氢化合物生物合成多肽(例如具有OleCD或OleBCD的多肽)的多核苷酸来生产内烯烃，例如在PCT公开号WO2008/147781中所述，该文献明确地以引用方式并入本文。

重组宿主细胞和细胞培养物

用于增加重组宿主细胞生产脂肪酸衍生物的策略包括通过在生产型宿主中过表达天然的脂肪酸生物合成基因和/或表达由不同的有机体得到的外源脂肪酸生物合成基因来增加通过脂肪酸生物合成途径的流量。如本文所用，重组宿主细胞或经改造的宿主细胞是指这样的宿主细胞，例如通过蓄意引入新的基因元件和/或蓄意修饰在宿主细胞天然存在的基因元件使基因构成相对于相应的野生型宿主细胞而言被改变。此外，此类重组宿主细胞的后代还包括这些新的和/或修饰的基因元件。在本发明所述的发明公开中的任一方面中，宿主细胞可以选自植物细胞、昆虫细胞、真菌细胞(例如丝状真菌，如假丝酵母菌种；或者芽殖酵母，例如酵母菌种)、海藻细胞和细菌细胞。在一个优选的实施方案中，重组宿主细胞为重组微生物有机体。作为微生物有机体的宿主细胞的实例包括但不限于得自大肠杆菌属(Escherichia)、芽孢杆菌属(Bacillus)、乳酸杆菌属(Lactobacillus)、发酵单胞菌属(Zymomonas)、红球菌属(Rhodococcus)、假单胞菌属(Pseudomonas)、曲霉菌属(Aspergillus)、木霉属(Trichoderma)、链孢霉属(Neurospora)、镰孢属(Fusarium)、腐殖霉属(Humicola)、根毛霉属(Rhizomucor)、克鲁维氏酵母属(Kluyveromyces)、毕赤酵母属(Pichia)、毛霉属(Mucor)、蚀丝霉属(Myceliophtora)、青霉菌属(Penicillium)、原毛平革菌属(Phanerochaete)、侧耳属(Pleurotus)、栓菌属(Trametes)、金孢子菌属(Chrysosporium)、酵母菌属(Saccharomyces)、寡养单胞菌属(Stenotrophamonas)、裂殖酵母属(Schizosaccharomyces)、耶氏酵母属(Yarrowia)或链霉菌属(Streptomyces)的细胞。在一些实施方案中，宿主细胞为革兰氏阳性细菌细胞。在其他的实施方案中，宿主细胞为革兰氏阴性细菌细胞。在一些实施方案中，宿主细胞为大肠杆菌细胞。在其他的实施方案中，宿主细胞为迟缓芽孢杆菌(Bacillus lentus)细胞、短芽孢杆菌(Bacillus brevis)细胞、嗜热脂肪芽孢杆菌(Bacillus stearothermophilus)细胞、地衣芽孢杆菌(Bacilluslichenoformis)细胞、嗜碱芽孢杆菌(Bacillus alkalophilus)细胞、凝结芽孢杆菌(Bacillus coagulans)细胞、环状芽孢杆菌(Bacillus circulans)细胞、短小芽孢杆菌(Bacillus pumilis)细胞、苏云金芽孢杆菌(Bacillus thuringiensis)细胞、克劳氏芽孢杆菌(Bacillus clausii)细胞、巨大芽孢杆菌(Bacillus megaterium)细胞、枯草芽孢杆菌(Bacillus subtilis)细胞、或解淀粉牙胞杆菌(Bacillus amyloliquefaciens)细胞。在其他的实施方案中，宿主细胞为康氏木霉(Trichoderma koningii)细胞、绿色木霉(Trichoderma viride)细胞、里氏木霉(Trichoderma reesei)细胞、长梗木霉(Trichoderma longibrachiatum)细胞、泡盛曲霉(Aspergillus awamori)细胞、烟曲霉(Aspergillus fumigates)细胞、臭曲霉(Aspergillus foetidus)细胞、构巢曲霉(Aspergillus nidulans)细胞、黑曲霉(Aspergillus niger)细胞、米曲霉(Aspergillusoryzae)细胞、特异腐质霉(Humicola insolens)细胞、棉毛状腐质霉(Humicolalanuginose)细胞、不透明红球菌细胞、米黑根毛霉(Rhizomucor miehei)细胞或米黑毛霉(Mucor michei)细胞。在另一个实施方案中，宿主细胞为变铅青链霉菌(Streptomyceslividans)细胞或灰链霉菌(Streptomyces murinus)细胞。在另一个实施方案中，宿主细胞为放线菌细胞。在一些实施方案中，宿主细胞为酿酒酵母细胞。在其他的实施方案中，宿主细胞为得自真核植物、海藻、蓝细菌、绿硫细菌、绿色非硫细菌、嗜极生物、酵母、真菌、它们经改造的有机体或合成有机体的细胞。在一些实施方案中，宿主细胞为光依赖的或固定碳。在一些实施方案中，例如在光存在下，宿主细胞具有自养活性。在一些实施方案中，在光缺乏下，宿主细胞为异养的或兼养的。在某些实施方案中，宿主细胞为得自拟南芥、柳枝稷(Panicum virgatum)、巨芒(Miscanthus giganteus)、玉米(Zea mays)、葡萄藻(Botryococcuse braunii)、莱茵衣藻(Chlamydomonas reinhardtii)、杜氏盐藻(Dunaliela salina)、聚球菌属菌种PCC 7002、聚球菌属菌种PCC 7942、集胞藻(Synechocystis Sp.)菌种PCC 6803、长嗜热聚球蓝(Thermosynechococcus elongates)BP-1、绿硫细菌(Chlorobium tepidum)、Chlorojlexus auranticus、Chromatiummvinosum、深红红螺菌(Rhodospirillum rubrum)、荚膜红细菌(Rhodobacter capsulatus)、沼泽红假单胞菌(Rhodopseudomonas palusris)、杨氏梭菌(Clostridium ljungdahlii)、热纤梭菌(Clostridiuthermocellum)、产黄青霉菌(Penicillium chrysogenum)、毕赤酵母菌(Pichia pastoris)、酿酒酵母、粟酒酵母(Schizosaccharomyces pombe)、萤光假单孢菌(Pseudomonas fluorescens)或运动发酵单胞菌(Zymomonas mobilis)的细胞。

由重组宿主细胞生产脂肪酸衍生物

可以通过包括本发明所述的菌株改善的重组宿主细胞来生产多种脂肪酸衍生物，其包括但不限于脂肪酸、酰基-CoA、脂肪醛、短链和长链的醇、碳氢化合物(例如烷烃、烯烃或烯烃，例如端烯烃或内烯烃)、脂肪醇、酯(例如蜡酯、脂肪酸酯(例如甲基酯或乙基酯))和酮。在本发明公开的一些实施方案中，相对于由相应的野生型宿主细胞的对照培养物所生产的相同脂肪酸衍生物的效价而言，在特定的组合物中，更高效价的脂肪酸衍生物为由重组宿主细胞生产的具有更高效价的特定类型的脂肪酸衍生物(例如脂肪醇、脂肪酸酯或碳氢化合物)。在这种情况下，脂肪酸衍生物组合物可以包括例如具有各种链长以及饱和或支化特征的脂肪醇的混合物。在本发明公开的其他的实施方案中，相对于由相应的野生型宿主细胞的对照培养物所生产的相同脂肪酸衍生物的效价而言，在特定的组合物中，更高效价的脂肪酸衍生物为具有更高效价的不同脂肪酸衍生物(例如脂肪醛和脂肪醇，或者脂肪酸和酯)的组合。

改造宿主细胞

在一些实施方案中，通过重组载体的方式将多核苷酸(或基因)序列提供给宿主细胞，其中所述的重组载体包括与多核苷酸序列可操作地连接的启动子。在某些实施方案中，启动子是发育调节的，细胞器特异性的、组织特异性的、诱导型的、构成型的或者是细胞特异性的启动子。在一些实施方案中，重组载体包括至少一个如下序列，其包括但不限于(a)与多核苷酸序列可操作地缀合的表达控制序列；(b)与多核苷酸序列可操作地缀合的选择标记；(c)与多核苷酸序列可操作地缀合的标记序列；(d)与多核苷酸序列可操作地缀合的纯化部分；(e)与多核苷酸序列可操作地缀合的分泌序列；以及(f)与多核苷酸序列可操作地缀合的靶向序列。本发明所述的表达载体包括本发明所述的、以适用于在宿主细胞中表达多核苷酸序列的形式的多核苷酸序列。本领域的那些技术人员将理解的是表达载体的设计可以取决于诸如待转化的宿主细胞的选择、所需多肽的表达水平之类的因素。本发明所述的表达载体可以被引入到宿主细胞中，从而生产由本发明所述的多核苷酸序列编码的多肽，包括融合多肽。在原核生物(例如大肠杆菌)中，表达编码多肽的基因大部分是使用包括构成型或诱导型启动子的载体来实施的，其中所述的启动子定向于融合或非融合多肽的表达。融合载体将一定数量的氨基酸加入到其中编码的多肽中，通常加入到重组多肽的氨基末端或羧基末端。这种融合载体通常起到以下3种目的中的一种或多种：(1)增加重组多肽的表达；(2)增加重组多肽的溶解性；以及(3)通过在亲和纯化中起到配体的作用而有助于重组多肽的纯化。通常，在融合表达的载体中，在融合部分与重组多肽的连接处引入蛋白水解的切割位点。这使得在纯化融合多肽后，重组多肽与融合部分分离。此类及它们的同种鉴定序列的实例包括因子Xa、凝血酶和肠激酶。融合表达载体的实例包括pGEX(PharmaciaBiotech,Inc.,Piscataway,NJ；Smith et al.,Gene,67:31-40(1988))、pMAL(New EnglandBiolabs,Beverly,MA)、和pRITS(Pharmacia Biotech,Inc.,Piscataway,N.J.)，它们分别将谷胱甘肽S-转移酶(GST),麦芽糖E结合蛋白质或蛋白质A分别融合到目标重组多肽中。诱导型非融合大肠杆菌表达载体的实例包括pTrc(Amann et al,Gene(1988)69:301-315)和pET11d(Studier et al,Gene Expression Technology:Methods in Enzymology 185,Academic Press,San Diego,Calif.(1990)60-89)。由pTrc载体使目标基因表达依赖于由杂交的trp-lac融合启动子引起的宿主RNA聚合酶的转录。由pET11d载体使目标基因表达依赖于由T7gn10-lac融合启动子引起的转录，其中所述的启动子是由共表达的病毒RNA聚合酶(T7 gnl)介导的。这种病毒聚合酶通过宿主菌株BL21(DE3)和HMS174(DE3)，由容留在T7gn1基因中的居民λ噬菌体在lacUV5启动子的转录控制之下来供应的。用于原核和真核细胞的合适的表达系统是本领域公知的，例如参见Sambrook et al,"Molecular Cloning:ALaboratory Manual,"second edition,Cold Spring Harbor Laboratory,(1989)。诱导型非融合大肠杆菌表达载体的实例包括pTrc(Amann et al,Gene,69:301-315(1988))和PET11d(Studier et al,Gene Expression Technology:Methods in Enzymology 185,Academic Press,San Diego,CA,pp.60-89(1990))。在某些实施方案中，本发明公开的多核苷酸序列与由噬菌体T5衍生的启动子可操作地连接。在一个实施方案中，宿主细胞为酵母细胞。在这种实施方案中，表达载体为酵母表达载体。可以通过用于将外来核酸(例如DNA)引入到宿主细胞中的多种本领域公认的技术将载体引入到原核和真核细胞中。用于转化或转染宿主细胞的合适的方法可以在例如Sambrook et al.(supra)中找到。已知稳定地转化细菌细胞取决于所使用的表达载体和转化技术，仅有一小部分细胞接受并复制表达载体。为了鉴定和选择这些转化子，编码选择标记(例如抗生素抗性)的基因可以与所关注的基因一起引入到宿主细胞中。选择标记包括赋予药品抗性的那些，例如但不限于氨苄青霉素、卡那霉素、氯霉素或四环素。编码选择标记的核酸可以在与编码本发明所述多肽的相同的载体上引入到宿主细胞中，或者可以在分开的载体上引入到宿主细胞中。稳定地转化有诱导型核酸的细胞可以通过在合适的选择药品存在下的生长来鉴定。

宿主细胞

如本文所用，改造的或重组的宿主细胞为用于生产本发明进一步所述的脂肪酸衍生物组合物的细胞。如果在宿主细胞中表达的一种或多种多核苷酸在相同的条件下相对于其在相应的野生型宿主细胞(例如对照细胞)中的表达被改变或修饰，则该宿主细胞称为改造的宿主细胞或重组宿主细胞。在本发明所述的发明公开的任一方面中，可以由真核植物、海藻、蓝细菌、绿硫细菌、绿色非硫细菌、紫硫细菌、紫色非硫细菌、嗜极生物、酵母、真菌、它们经改造的有机体或合成有机体中选择宿主细胞。在一些实施方案中，宿主细胞为光依赖的或固定碳的。在一些实施方案中，宿主细胞具有自养活性。如本文所述，多种宿主细胞可以用于生产脂肪酸衍生物。

突变体或变体

在一些实施方案中，所述的多肽为本发明所述任一种多肽的突变体或变体。如本文所用，术语突变体或变体是指具有如下氨基酸序列的多肽，其中所述的氨基酸序列与野生型多肽具有至少1个氨基酸的差异。例如突变体可以包括以下保守氨基酸取代的一个或多个：脂肪族氨基酸(例如丙氨酸、缬氨酸、亮氨酸和异亮氨酸)被另一种脂肪族氨基酸替代；丝氨酸被苏氨酸替代；苏氨酸被丝氨酸替代；酸性残基(例如天冬氨酸和谷氨酸)被另一种酸性残基替代；带有氨基的残基(例如天冬酰氨和谷氨酰胺)被另一种带有氨基的残基替代；碱性残基(赖氨酸和精氨酸)被另一种碱性残基替代；以及芳香族残基(例如苯丙氨酸和酪氨酸)被另一种芳香族残基替代。在一些实施方案中，突变体多肽具有大约1、2、3、4、5、6、7、8、9、10、15、20、30、40、50、60、70、80、90、100或更多的氨基酸取代、加入、插入或删除。优选的多肽片段或突变体保留了相应的野生型多肽的一些或所有的生物学功能(例如酶活性)。在一些实施方案中，所述的片段或变体保留了相应的野生型多肽的至少75％、至少80％、至少90％、至少95％、至少98％或者更高的生物学功能。在其他的实施方案中，所述的片段或突变体保留了相应的野生型多肽的大约100％的生物学功能。关于确定哪种氨基酸残基可以被取代、插入或删除而不会影响生物学活性的指导可以使用本领域公知的计算机程序来找到，例如LASERGENETM软件(DNASTAR,Inc.,Madison,WI)。在其他的实施方案中，所述的片段或突变体与相应的野生型多肽相比表现出增强的生物学功能。例如所述的片段或突变体的酶活性与相应的野生型多肽相比可以展示至少10％、至少25％、至少50％、至少75％、或者至少90％的改善。在其他的实施方案中，所述的片段或突变体的酶活性与相应的野生型多肽相比可以展示至少100％(例如至少200％或至少500％)的改良。应该理解的是本发明所述的多肽可以具有额外的保守型或非必需氨基酸的取代，这基本不会影响多肽的功能。一种特定的取代是否被耐受(即，不会不利地影响所需的生物学功能，例如羧酸还原酶活性)可以如Bowie et al.(Science,247:1306-1310(1990))中所述来确定。保守型氨基酸取代为其中氨基酸残基被具有相似侧链的氨基酸残基替代的取代。本领域已经对具有相似侧链的氨基酸残基家族进行定义。这些家族包括具有碱性侧链的氨基酸(例如赖氨酸、精氨酸、组氨酸)、酸性侧链的氨基酸(例如天冬氨酸、谷氨酸)、不带电荷的极性侧链的氨基酸(例如甘氨酸、天冬酰胺、谷氨酰胺、丝氨酸、苏氨酸、酪氨酸、半胱氨酸)、非极性侧链的氨基酸(例如丙氨酸、缬氨酸、亮氨酸、异亮氨酸、脯氨酸、苯丙氨酸、甲硫氨酸、色氨酸)、β-支化侧链的氨基酸(例如苏氨酸、缬氨酸、异亮氨酸)以及芳香族侧链的氨基酸(例如酪氨酸、苯丙氨酸、色氨酸、组氨酸)。

变体可以天然形成或在体外创建。具体而言，可以使用基因改造技术(例如定点诱变、随机化学诱变、核酸外切酶III的删除方法或标准的克隆技术)来创建此类变体。备选地，可以使用化学合成或修饰方法来创建此类变体、片段、类似物或衍生物。制备变体的方法是本领域公知的。这些方法包括以下方法：将由天然分离物得到的核酸序列进行修饰，从而生成编码多肽的核酸，其中所述的多肽具有增强它们在工业或实验室应用中的价值的特征。在此类方法中，大量的变体序列被生成并表征，其中所述的变体与由天然分离物得到的序列具有一个或多个核苷酸差异。通常，这些核苷酸差异使得相对于由天然分离物得到的核酸所编码的多肽而言发生氨基酸改变。例如可以通过使用随机和定点诱变来制备变体。随机和定点诱变在例如Arnold,Curr.Opin.Biotech.,4:450-455(1993)中有所描述。可以使用易错PCR来取得随机诱变(例如参见Leung et al.,Technique,1:11-15(1989)；andCaldwell et al.,PCR Methods Applic,2:28-33(1992))。在易错PCR中，在其中DNA聚合酶的复制忠实性低的条件下实施PCR，这样在PCR产物的全长上获得高比率的点突变。简言之，在此类方法中，待诱变的核酸(例如编码羧基还原酶的多核苷酸序列)与PCR引物、反应缓冲剂、MgCl₂、MnCl₂、Taq聚合酶及合适浓度的dNTP混合，以便在PCR产物的全长上获得高比率的点突变。例如可以使用20毫微摩尔的待诱变的核酸，30皮摩尔的每种PCR引物，包含50mMKCl、10mM Tris HCl(pH 8.3)、0.01％凝胶、7mM MgCl₂、0.5mM MnCl₂的反应缓冲剂，5单位的Taq聚合酶，0.2mM dGTP，0.2mM dATP，1mM dCTP和1mM dTTP来进行反应。PCR可以进行30个循环：94℃，1min；45℃，1min；以及72℃，1min。然而，应该理解的是这些参数可以适当地改变。然后将诱变核酸克隆岛合适的载体中，并评价由诱变核酸编码的多肽的活性。可以使用寡核苷酸定点诱变在目的任何克隆的DNA中生成位点特异性突变，从而完成定点诱变。寡核苷酸诱变在例如Reidhaar-Olson et al.,Science,241:53-57(1988)中有所描述。简言之，在此类方法中，许多双链寡核苷酸被合成并插入到待诱变的克隆DNA(例如编码CAR多肽的多核苷酸序列)中，其中所述的双链寡核苷酸带有有待引入到克隆DNA中的一个或多个突变。回收包括诱变DNA的克隆，并评估它们所编码的多肽的活性。用于生成变体的另一种方法为拼装PCR。拼装PCR涉及由小DNA片段的混合物得到的PCR产物的拼装。大量不同的PCR反应在相同的瓶中平行进行，其中一个反应的产物启动另一个反应的产物。拼装PCR在例如美国专利5,965,408中有所描述。生成变体的另一种方法是有性PCR诱变。在有性PCR诱变中，作为DNA分子的随机发酵(基于序列同源性)的结果，在体外在不同的但高度相关的DNA序列的DNA分子之间形成被迫的同源重组。其后为在PCR反应中，通过引物的延伸而形成交叉固定。有性PCR诱变在例如Stemmer,Proc.Natl.Acad.Sci.,U.S.A.,91:10747-10751(1994)中有所描述。此外，还可以通过体内诱变来创建变体。在一些实施方案中，通过在细菌菌株(例如大肠杆菌菌株)中增殖核酸序列来形成该核酸序列中的随机突变，其中所述的核酸序列在一种或多种DNA修复途径中携带突变。此类“增变基因”菌株具有比野生型菌株更高的随机突变。在这些菌株中的一种菌株中增殖DNA序列(例如编码CAR多肽的多核苷酸序列)最终将在DNA内形成随机突变。适用于体内诱变的增变基因菌株在例如国际专利申请公开号WO1991/016427中有所描述。此外，还可以使用盒式诱变来生成变体。在盒式诱变中，小区域的双链DNA分子被不同于天然序列的合成寡核苷酸“盒”替代。寡核苷酸通常包括完全和/或部分随机的天然序列。此外，还可以使用递归整体诱变来生成变体。递归整体诱变是用于蛋白质改造(即，蛋白质诱变)的算法，研发该方法用于生产其成员具有氨基酸序列的差异、但表现型相关的突变体的多样化群体。该方法使用反馈机制来控制一连串的组合盒式诱变。递归整体诱变在例如Arkin et al,Proc.Natl.Acad.Sci.,U.S.A.,89:7811-7815(1992)中有所描述。在一些实施方案中，使用指数整体诱变来创建变体。指数整体诱变为用于生成组合文库的方法，其中所述的组合文库具有高百分率的独特的及功能突变体，其中多个残余物小组被平行随机化，从而鉴定在各改变的位置处会得到功能蛋白质的氨基酸。指数整体诱变在例如Delegrave et al.,Biotech.Res,11:1548-1552(1993)中有所描述。在一些实施方案中，使用改组方法来创建变体，其中编码不同多肽的大量核酸的多个部分融合在一起从而创建编码嵌合多肽的嵌合核酸序列，例如美国专利5,965,408和5,939,250中所述。插入诱变为通过插入一个或多个碱基来进行DNA诱变。插入突变可以天然形成、通过病毒或转座子介导、或者可以用于实验室研究目的的人工创建(例如通过转座子诱变)。当外源DNA被整合到宿主DNA中时，任何随后突变的严重性完全取决于DNA插入到宿主基因组中的位置。例如如果转座子插入到必需基因的中间、启动子区域或插入到抑制因子或增强子区域中，那么有意义的效果可以是明显的。实施转座子诱变和高通量筛选以找到能够增加一种或多种脂肪酸衍生物的效价或产率的有利突变。

培养重组宿主细胞和细胞培养物/发酵

如本文所用，术语“发酵”广义而言是指宿主细胞将有机材料转化为目标物质，例如通过在包括碳源的培养基中增殖重组宿主细胞的培养物，使重组宿主细胞将碳源转化为脂肪酸及其衍生物。如本文所用，术语“允许生产的条件”是指允许宿主细胞生产所需产物(例如脂肪酸或脂肪酸衍生物)的任何条件。类似地，术语“其中载体的多核苷酸被表达的条件”是指允许宿主细胞合成多肽的任何条件。合适的条件包括例如发酵条件。发酵条件可以包括例如许多参数，包括但不限于温度范围、通风水平、供料速率和培养基成分。这些条件(单独及组合)均允许宿主细胞生长。发酵可以是需氧的、厌氧的或它们的变体(例如微需氧的)。示例性的培养物培养基包括培养液或凝胶。通常，培养基包括可以被宿主细胞直接代谢的碳源。此外，培养基中可以使用酶，从而有利于碳源的动员(例如淀粉或纤维素解聚成可发酵的糖)和随后的代谢。就小规模的生产而言，改造的宿主细胞可以以例如大约100mL、500mL、1L、2L、5L或10L的批次生长；发酵；并诱导表达所需的多核苷酸序列，例如编码CAR多肽的多核苷酸序列。就大规模的生产而言，改造的宿主细胞可以以例如大约10L、100L、1000L、10,000L、100,000L、1,000,000L或更大的批次生产；发酵；并诱导表达所需的多核苷酸序列。备选地，可以实施大规模分批供料的发酵。本发明所述的脂肪酸衍生物组合物可以在重组宿主细胞培养物的细胞外环境中找到，并且可以容易地由培养物培养基中分离。脂肪酸衍生物可以由重组宿主细胞分泌、运送至细胞外环境中或者主动转运至重组宿主细胞培养物的细胞外环境中。使用本领域已知的常规方法由重组宿主细胞分离脂肪酸衍生物。

由重组宿主细胞衍生的产物

如本文所用，“现代碳级份”或fM具有与National Institute of Standards andTechnology(NIST)Standard Reference Materials SRMs4990B和4990C(其分别称为草酸标准品HOxI和HoxII)定义的相同的含义。基本定义是指0.95乘以14C/12C同位素比HOxI(参见AD1950)。这大致相当于衰变校正过的工业革命前的木材。对于当前的活生物圈(植物材料)，fM为大约1.1。包括生物学方法生产的有机化合物，特别是使用本发明的脂肪酸生物合成途径生产的脂肪酸衍生物的生物产物(例如根据本发明公开生产的脂肪酸衍生物)不是使用可再生来源生产的，因此是新的物质的组合物。基于双重碳同位素指纹法(dualcarbon-isotopic fingerprinting)或¹⁴C定年法可以将这些新的生物产物与衍生于石油化学碳的有机化合物区别开。此外，可以通过双重碳同位素指纹法(例如参见美国专利号7,169,588，该文献以引用方式并入本文)来确定生物来源碳的具体来源(例如葡萄糖与甘油)。在商业中，区别生物产物与石油基有机化合物的能力在追踪这些材料方面是有益的。例如，包括生物学基的和石油基的碳同位素谱二者的有机化合物或化学品可以区别于仅由石油基材料制成的有机化合物和化学品。因此，在商业中，可以基于本发明的生物产物的独特的碳同位素谱来追踪或跟踪它们。通过比较各样品中稳定碳同位素比(¹³C/¹²C)，可以将生物产物与石油基有机化合物区分开。给定的生物产物中¹³C/¹²C比是大气二氧化碳中该二氧化碳被固定时的¹³C/¹²C比的结果。它还反映了准确的代谢途径。此外，还存在区域性差异。石油、C3植物(阔叶植物)、C4植物(草本植物)以及海洋碳酸盐类在¹³C/¹²C以及相应的δ¹³C值中全部表现出显著差异。进一步地，由于代谢途径的原因，C₃和C₄植物的脂物质的分析情况与衍生自相同植物的碳水化合物组分的材料不同。在测量精度之内，由于同位素分馏效应¹³C表现出大的差异，对于生物产物而言最显著的效应是光合机制。植物中碳同位素比中差异的主要原因与植物中光合碳代谢途径的差异紧密相关，特别是在初级羧化(即大气CO₂的初始固定)期间发生的反应。两大类植物是涉及“C3”(或Calvin-Benson)光合循环以及涉及“C4”(或Hatch-Slack)光合循环的植物。在C3植物中，主要CO₂固定或羧化反应涉及核酮糖-1,5-二磷酸羧化酶，并且第一稳定产物是3-碳化合物。诸如阔叶树和针叶树之类的C3植物在温带气候地带中是主要的。在C4植物中，涉及另一种酶(磷酸烯醇式丙酮酸羧化酶)的其它羧化反应是主要羧化反应。第一稳定的碳化合物是4-碳的酸，该4-碳的酸随后被脱羧基。如此释放的CO₂被C3循环再固定。C4植物的实例是热带牧草、玉米和甘蔗。C4和C3植物都表现出一定范围的¹³C/¹²C同位素比，但是对于C4植物而言，通常的值是大约-7至大约-13/密耳，而对于C3植物而言，是大约-19至大约-27/密耳(例如参见Stuiver et al,Radiocarbon 19:355(1977))。煤和石油通常落在后面的范围内。13C测量尺度最初由PeeDee Belemnite(PDB)石灰石的零集所定义，其中给出的值是与该材料的偏差的千分比。“δ13C”值被表达为千分比(每密耳)，缩写为‰，并且按照下式进行计算：

δ¹³C(‰)＝[(¹³C/¹²C)样品-(¹³C/¹²C)标准品]/(¹³C/¹²C)标准品x1000

由于PDB参考材料(RM)已经被耗尽，已经与IAEA、USGS、NIST和其它选定的国际同位素实验室合作开发了一系列备选RM。与PDB的每单位密耳偏差的标记为δ¹³C。通过高精度的稳定比率质谱(IRMS)在质量44、45以及46的分子离子上对CO₂进行测量。本发明所述的组合物包括通过本发明所述的任何方法生产的生物产物，包括例如脂肪醛和醇产物。具体而言，所述的生物产物的δ¹³C可以为大约-28或更大、大约-27或更大、-20或更大、-18或更大、-15或更大、-13或更大、-10或更大或-8或更大。例如所述的生物产物的δ¹³C可以为大约-30至大约-15、大约-27至大约-19、大约-25至大约-21、大约-15至大约-5、大约-13至大约-7或大约-13至大约-10。在其它的情况下，所述的生物产物的δ¹³C可以为大约-10、-11、-12或-12.3。此外，还可以通过比较每种化合物中¹⁴C的量，将根据本发明公开所生产的生物产物区别于石油基有机化合物。因为¹⁴C具有5730年的核半衰期，所以包括“较老的”碳的石油基燃料可以区别于包括“较新的”碳的生物产物(参见例如Currie,"Source Apportionment ofAtmospheric Particles",Characterization of Environmental Particles,J.Buffleand H.P.van Leeuwen,Eds.,1of Vol.I of the IUPAC Environmental AnalyticalChemistry Series(Lewis Publishers,Inc.)3-74,(1992))。放射性碳定年法的基本假设是大气中¹⁴C浓度的恒定性导致活有机体中¹⁴C的恒定性。然而，由于1950年以来的大气核试验以及1850年以来的化石燃料的燃烧，¹⁴C已经获得了次要的地球化学时间特征(geochemical time characteristic)。¹⁴C在大气CO₂中以及由此在生物圈中的浓度在19世纪60年代中期核试验的高峰时几乎翻倍。此后，其逐渐地返回至大约1.2x10-12的稳态宇宙发生(大气)基线同位素率(¹⁴C/¹²C)，并且大致的驰豫“半衰期”(relaxation“half-life”)为7至10年。(后者所述的这种半衰期不必按照字面理解；而是必须使用详细的大气核输入/衰变函数来追踪核时代开始以来的大气和生物圈¹⁴C的变化。)后者所述的这种生物圈¹⁴C时间特征支持每年定年法测定近代生物圈的碳的承诺。可以通过加速器质谱(AMS)测量¹⁴C，结果以“现代碳的比例”(fM)的单位给出。fM由National Institute of Standards andTechnology(NIST)Standard Reference Materials(SRM)4990B和4990C定义。如本文所用，“现代碳的级份”或“fM”具有与National Institute of Standards and Technology(NIST)Standard Reference Materials(SRMs)4990B和4990C(其分别称为草酸标准品HOxI和HoxII)定义的相同的含义。基本的定义涉及0.95乘以14C/12C同位素比HoxI(参考AD1950)。这大致相当于衰变校正的工业革命前的木材。对于当前的活生物圈(植物材料)，fM为大约1.1。本发明所述的组合物包括可以fM ¹⁴C为至少大约1的生物产物。例如本发明公开的生物产物可以具有至少大约1.01的fM ¹⁴C、大约1至大约1.5的fM ¹⁴C、大约1.04至大约1.18的fM ¹⁴C、或者大约1.111至大约1.124的fM ¹⁴C。

已知¹⁴C的另一种量度为现代碳的百分率(pMC)。对于使用¹⁴C年代的考古学家或地质学家而言，AD 1950等于“旧的零年”。其还表示100pMC。在1963年热核武器的顶峰时，大气中的“炸弹碳”达到正常水平的几乎两倍。其在大气中的分布自其出现以来是近似的，对于自从AD 1950生活的植物和动物表现出大于100pMC的值。随着时间的流逝，该值逐渐降低，当今的值接近107.5pMC。这意味着诸如玉米之类的新生物质材料将给出接近107.5pMC的¹⁴C标记。石油基化合物将具有为零的pMC值。化石碳与现代碳的组合导致现代pMC含量被稀释。通过假定107.5pMC代表现代生物质材料的¹⁴C含量并且0pMC代表石油基产物的¹⁴C含量，则该材料的测量pMC值将反映两种类型的成分的比例。例如100％来源于现代大豆的材料将给出接近107.5pMC的放射性碳标记。如果使用石油基产物将该材料稀释50％，则它将给出约54pMC的放射性碳标记。通过指定“100％”等于107.5pMC并且指定为“0％”等于0pMC而衍生得到基于生物学的碳含量。例如测量为99pMC的样品将给出93％的等同的生物学基的碳含量。该值被称为基于生物学的平均碳结果并且假定在所分析的材料中的所有成分均起源于现代的生物材料或石油基材料。包括本发明所述的一种或多种脂肪酸衍生物的生物产物可以具有至少大约50、60、70、75、80、85、90、95、96、97、98、99或100的pMC。在其它的情况下，本发明所述的脂肪酸衍生物可以具有大约50至大约100、大约60至大约100、大约70至大约100、大约80至大约100、大约85至大约100、大约87至大约98、或者大约90至大约95的pMC。在其它的情况下，本发明所述的脂肪酸衍生物可以具有大约90、91、92、93、94或94.2的pMC。

筛选由重组宿主细胞生产的脂肪酸衍生物组合物

为了测定所述的这些条件是否足以允许表达，可以将宿主细胞培养例如大约4、8、12、24、36或48小时。在培养过程中和/或培养后，可以获得样品并分析，以测定这些条件是否允许表达。例如可以针对所需产物的存在情况，测定在其中生长有宿主细胞的样品或培养基中的宿主细胞。当测定产物的存在情况时，可以使用例如但不限于TLC、HPLC、GC/FID、GC/MS、LC/MS和MS。使用用于“总脂肪物质”的GC/FID测定方法在96孔板中、1升和5升滑石以及1000L中试工厂中筛选重组宿主细胞培养物。

脂肪酸衍生物组合物的用途

脂肪酸为具有长的脂肪族尾部(链)的羧酸，其可以是饱和的或不饱和的。大部分天然形成的脂肪酸都具有偶数个碳原子(4至28)的链。脂肪酸通常衍生自甘油三酸酯。当脂肪酸未与其他分子连接时，它们称为“游离的”脂肪酸。工业上，通常通过水解甘油三酸酯来水解脂肪酸，并除去甘油。棕榈、大豆、油菜籽、椰子油和向日葵油是目前最普通的脂肪酸来源。由这些油衍生的大部分脂肪酸用于人类食品。椰子油和棕榈坚果油主要由12和14个碳的脂肪酸构成。这些油特别适用于进一步加工成用于洗涤剂和清洁剂、以及化妆品的表面活性剂。棕榈、大豆、油菜籽和向日葵油、以及诸如牛脂之类的动物脂肪主要包括长链脂肪酸(例如C18，其为饱和的或不饱和的)，其用作聚合物用途和润滑剂的原材料。生态学和毒物学研究表明基于可再生来源的脂肪酸衍生产物比基于石油化学品的物质具有更有利的性质。脂肪醛用于生产许多专门的化学品。例如醛用于生产聚合物、树脂(例如酚醛树脂)、染料、风味剂、增塑剂、香精、药物和其他化学品，其中的一些物质可以用作溶剂、防腐剂或消毒剂。此外，某些天然和合成的化合物(例如维生素和激素)为醛，并且许多糖包括醛基。脂肪醛可以通过化学或酶还原而转化为脂肪醇。脂肪醇具有许多商业用途。全世界，脂肪醇及其衍生物的每年销售量超过10亿美元。短链脂肪醇用于化妆品和食品工业，例如乳化剂、软化剂和增稠剂。由于脂肪醇的两性性质，其可作为非离子表面活性剂，可用于个人护理和家庭产品，例如洗涤剂。此外，脂肪醇用于蜡、树胶、树脂、药物软膏和洗剂、润滑油添加剂、纺织品防静电和整理剂、增塑剂、化妆品、工业溶剂和用于脂肪的溶剂。此外，本发明公开还提供了表面活性剂组合物或洗涤剂组合物，其包括通过本发明所述的任一种方法生产的脂肪醇。本领域的任一普通技术人员将理解的是根据表面活性剂或洗涤剂组合物的预期目的，可以生产和使用不同的脂肪醇。例如当本发明所述的脂肪醇用作生产表面活性剂或洗涤剂的供料时，本领域的任一技术人员将理解的是脂肪醇供料的特征将影响所生产的表面活性剂或洗涤剂的特征。因此，可以通过生产特定的脂肪醇作为供料来选择表面活性剂或洗涤剂的特征。本发明所述的脂肪醇基表面活性剂和/或洗涤剂组合物可以与本发明公知的其他表面活性剂和/或洗涤剂混合。在一些实施方案中，混合物可以包括脂肪醇按重量计至少大约10％、至少大约10％、至少大约15％、至少大约20％、至少大约30％、至少大约40％、至少大约50％、至少大约60％或者由上述任意两个值所限定的范围。在其他的实例中，可以制备表面活性剂或洗涤剂组合物，其包括脂肪醇的按重量计至少大约5％、至少大约10％、至少大约20％、至少大约30％、至少大约40％、至少大约50％、至少大约60％、至少大约70％、至少大约80％、至少大约85％、至少大约90％、至少大约95％或者由上述任意两个值所限定的范围，该脂肪醇包括碳链，其长度为8、9、10、11、12、13、14、15、16、17、18、19、20、21或22个碳。此外，此类表面活性剂或洗涤剂组合物还可以包括至少一种添加剂，例如由非微生物来源(例如植物油或石油)得到的微乳剂、表面活性剂或洗涤剂，该添加剂可以以占脂肪醇的按重量计至少大约5％、至少大约10％、至少大约15％、至少大约20％、至少大约30％、至少大约40％、至少大约50％、至少大约60％、至少大约70％、至少大约80％、至少大约85％、至少大约90％、至少大约95％或者由上述任意两个值所限定的范围的量存在。酯具有许多商业用途。例如生物柴油(备选燃料)由酯(例如脂肪酸甲基酯、脂肪酸乙基酯等)构成。一些低分子量的酯是挥发性的，并具有令人愉快的香味，这使得它们可以用作香料或风味剂。此外，酯作为漆、颜料和清漆的溶剂。此外，一些天然形成的物质(例如蜡、脂肪和油)由酯构成。此外，酯还可以用作树脂和增塑剂中的软化剂、阻燃剂、以及汽油和油中的添加剂。此外，酯可以用于制造聚合物、膜、纺织品、染料和药物。碳氢化合物具有许多商业用途。例如短链烷烃被用作燃料。长链烷烃(例如5个碳至16个碳)可以用作运输燃料(例如汽油、柴油或航空燃料)。具有多于16个碳原子的烷烃是燃油和润滑油的重要成分。甚至更长的烷烃(其在室温下为固态)可以用作例如石蜡。此外，长链烷烃可以断裂，从而生产具有商业价值的短链碳氢化合物。与短链烷烃相似，短链烯烃用于运输燃料。长链烯烃用于塑料、润滑剂和合成润滑剂。此外，烯烃可以用作生产醇、酯、增塑剂、表面活性剂、叔胺、增强型石油采收剂、脂肪酸、硫醇、烯基琥珀酸酐、环氧化物、氯化烷烃、氯化烯烃、蜡、燃料添加剂和阻流剂的供料。酮在商业上用作溶剂。例如丙酮通常用作溶剂，而且其还是用于制造聚合物的原材料。此外，酮还可以用于漆、颜料、爆炸物、香精和纺织品加工。此外，酮用于生产醇、烯烃、烷烃、亚胺和烯胺。润滑剂通常由烯烃构成，特别是聚烯烃和α-烯烃。润滑剂可以由原油精炼，或者使用由原油精炼的原材料来制造。由原油获得这些专门的化学品需要高额的金融投资以及大量的能量。此外，由于原油中的长链碳氢化合物经常断裂而产生较小的单体，所以它们还是无效的方法。随后，这些单体被用作制造更复杂的专门化学品的原材料。通过以下实例进一步说明本发明公开。提供这些实例仅为了说明的目的。它们不应该被解释成以任何方式限定了本发明公开的范围或内容。

实施例

实施例1

生产型宿主的修饰—酰基-CoA脱氢酶的衰减

本实施例描述了基因改造的宿主细胞的构建，其中脂肪酸降解酶的表达被衰减。

使用Datsenko et al,Proc.Natl.Acad.Sci.USA 97:6640-6645(2000)所述的Lambda Red(还称为Red驱动整合)来选择大肠埃希氏杆菌MG1655(大肠杆菌K菌株)的fadE基因，其具有以下修饰：

使用以下两个引物形成fadE的删除：

Del-fadE-F

5'-AAAAACAGCAACAATGTGAGCTTTGTTGTAATTATATTGTAAACATATTGATTCCGGGGATCCGTCGACC(SEQ ID NO:9)；和

Del-fadE-R

5'-AAACGGAGCCTTTCGGCTCCGTTATTCATTTACGCGGCTTCAACTTTCCTGTAGGCTGGAGCTGCTTC(SEQ ID NO:10)

使用Del-fadE-F和Del-fadE-R引物通过PCR来扩增由质粒pKD13(如Datsenko etal,如上所述)得到的卡那霉素抗性(KmR)盒。然后，使用PCR产物转化包括pKD46(如Datsenko et al,如上所述)的感受态大肠杆菌MG1655细胞，其中所述的细胞事先使用阿拉伯糖诱导3至4小时。在37℃下在具有代谢物抑制(SOC)培养基的特级优化肉汤中生长3小时后，将细胞平板接种于包括50μg/mL卡那霉素的Luria琼脂平板上。在37℃下温育过夜后，鉴定并分离抗性菌落。使用引物fadE-L2和fadE-Rl，通过PCR扩增来证明fadE基因的破坏，其中所述的引物被设计位于大肠杆菌fadE基因的两侧。

证明fadE被删除的引物为：

fadE-L2 5'-CGGGCAGGTGCTATGACCAGGAC(SEQ ID NO:11)；和

fadE-Rl 5'-CGCGGCGTTGACCGGCAGCCTGG(SEQ ID NO:12)

在证明fadE被删除之后，使用Datsenko et al.,如上所述的pCP20质粒除去单一菌落的KmR标记。fadE基因被删除并且KmR标记被除去的所得MG1655大肠杆菌菌株命名为大肠杆菌MG1655ΔfadE或大肠杆菌MG 1655D1。将由fadE基因被删除的MG1655大肠杆菌菌株得到的脂肪酸衍生物(总脂肪物质)生产与由大肠杆菌MG1655得到的脂肪酸衍生物生产比较。fadE基因的删除不影响脂肪酸衍生物的生产(图7)。本发明描述了多种示例性宿主细胞菌株，其实例如下表3所述。

表3：大肠杆菌菌株的基因特征

质粒：pDG109、pLC56和pV171.1均为具有carB和tesA可变表达的pCL_P_trc_carB_tesA_alrA_fabB_fadR操纵子。iFAB138为SEQ ID NO:19。

实施例2

通过脂肪酸合成途径的流量增加—乙酰基CoA羧化酶所介导

脂肪酯的生产：

用于脂肪酸生物合成的主要前体为丙二酰基-CoA和乙酰基-CoA(图1)。已经表明这些前体限制了在大肠杆菌中脂肪酸生物合成的速率。在本实施例中，合成acc操纵子[谷氨酸棒状杆菌accABCD(±birA)]是过表达的，并且基因修饰导致在大肠杆菌中乙酰基-CoA和丙二酰基-CoA的生产增加。在一个方法中，为了增加丙二酰基-CoA的水平，由谷氨酸棒状杆菌得到的乙酰基-CoA羧化酶复合物在大肠杆菌中是过表达的。乙酰基-CoA羧化酶(acc)由4个独立的亚基accA、accB、accC和accD构成(图3)。谷氨酸棒状杆菌acc的优点在于2个亚基作为融合蛋白质表达，分别为accCB和accDA，这有利于其平衡的表达。此外，谷氨酸棒状杆菌birA(其将accB亚基生物素化)是过表达的(图3)。示例性的谷氨酸棒状杆菌birA DNA序列在SEQ ID NO:55和SEQ ID NO:56中示出。谷氨酸棒状杆菌birA蛋白质序列在SEQ IDNO:57中示出。

谷氨酸棒状杆菌acc基因的合成操纵子在OP80(参见WO2008/119082，其以引用方式并入本文)的Ptrcl-accDACB、Ptrc3-accDACB、Ptrcl-accCBDA和Ptrc3-CBDA中以以下方式克隆。Ptrc1和Ptrc3为常用的Ptrc启动子的衍生物，其使得目标基因的表达衰减。注意由染色体DNA扩增天然序列，因为其显示出了有利的密码子使用(accCB中，仅Arg6的密码子被改变)。谷氨酸棒状杆菌birA基因为通过基因合成优化并获得的密码子。在所有4种操纵子构建体中，谷氨酸棒状杆菌birA基因克隆到acc基因的下游中。下面，我们将操纵子构造accDACB称为accD-，而将操纵子构造accDACB+birA称为accD+。将所得的质粒转化到大肠杆菌DAM l_i377中，所述的质粒包括由大肠杆菌得到的无前导序列的硫酯酶'tesA和酰基-CoA合成酶fadD以及由除烃海杆菌得到的酯合酶9(ES9)的完整拷贝(SEQ ID NO:6)。所有基因都在Ptrc启动子的控制之下。将所述的菌株在摇瓶中在5NBT培养基(如下文所述)中生长，并针对丙二酰基-CoA，使用下文所述的短链-CoA测定来分析所述的菌株。图8显示8种谷氨酸棒状杆菌acc±birA构建体中的6种在对数期中显示出丙二酰基-CoA水平升高，证明了它们在大肠杆菌中的功能性。注意birA的共表达进一步增加了丙二酰基-CoA在ptrcl/3_accDACB菌株中的水平，特别是具有包括Ptrc3-accDACB-birA操纵子构造(质粒pASl19.50D；SEQ ID NO:62)的质粒时更是如此。

为了测试组合panK与acc-birA共表达的作用，将优化的panK基因克隆到ptrcl/3_accDACB-birA中birA的下游。泛酸酯激酶panK(或CoaA)在辅酶A的生物合成中催化第一步骤，其中所述的辅酶A是与许多反应(例如乙酰基-CoA(乙酰基-CoA羧化酶的底物)的形成)有关的必需辅助子。将所得的质粒转化到DAMl_i377中，使DAMl_i377在摇瓶中在5NBT(+TVS1)培养基中生长，并使用以下所述的方法针对短链CoA来分析所述的菌株。如图9所示，在对数期，panK共表达进一步增加丙二酰基-CoA的水平，并且还增加乙酰基-CoA的水平，证明panK可以进一步增加丙二酰基-CoA的水平。在另一个大肠杆菌生产型宿主中，在具有acc基因和不具有acc基因的条件下，通过表达酯合酶9(SEQ ID NO:6)来评价共表达乙酰基-CoA羧化酶复合物对脂肪酯生产的影响。更具体而言，将质粒OP80(载体对照)、pDS57(具有ES9)、pDS57-accD-(具有ES9和accDACB)或pDS57-accD+(具有ES9和accDACB-birA；SEQ IDNO:63)转化到大肠杆菌菌株DV2中，并在补充有100mg/L壮观霉素的LB平板上选择相应的转化子。

将各质粒的2个转化子独立地接种到补充有100mg/L壮观霉素的LB培养基上，并在32℃下生长5至8小时。将培养物以30倍稀释至具有以下组成的基本培养基中：0.5g/LNaCl、1mM MgSO₄ x 7H₂O、0.1mM CaCl₂、2g/L NH₄Cl、3g/L KH₂PO₄、6g/L Na₂HPO₄、1mg/L硫胺、1x微量金属溶液、10mg/L柠檬酸铁、100mM Bis-Tris(pH7.0)、30g/L葡萄糖和100mg/L壮观霉素。在32℃下过夜生长后，将培养物以4个重复10倍稀释至相同组成的基本培养基中，其中所述的培养基与之前的基本培养基的不同之处在于该培养基包括1g/L而非2g/L NH₄Cl，并且补充有1mM IPTG和2％(v/v)甲醇。然后，使所得的培养物在摇瓶中在32℃下生长。通过具有火焰离子化检测器的气相色谱法(GC-FID)来分析脂肪酸甲基酯(FAME)的生产。使用醋酸丁酯以1:1体积/体积的比例提取样品。在涡流处理后，将样品离心，并通过气相色谱法(GC)分析有机相。分析条件如下，仪器：Trace GC Ultra(Thermo Electron Corporation)，并装配有火焰离子检测器(FID)；柱：得自Thermo Electron Corporation的DB-1(1％二苯基硅氧烷；99％二甲基硅氧烷)CO1 UFM 1/0.1/5 01DET，相pH5，FT：0.4μm，长5m，id：0.1mm；进入条件：250℃无分流，根据样品浓度(分导流为75mL/m)使用的3.8m 1/25分流方法；载气，流速：氦气，3.0mL/m；模块温度：330℃；烤箱温度：0.5m，保持在50℃，100℃/m至330℃，0.5m保持在330℃；检测器温度：300℃；注射体积：2μL；运行时间/流速：6.3m/3.0mL/m(无分流方法)，3.8m/1.5mL/m(分流1/25方法)，3.04m/1.2mL/m(分流1/50方法)。生产的FAME示于图10中。ES9本身在大肠杆菌DV2中的表达使得FAME的生产高于对照DV2 OP80。谷氨酸棒状杆菌乙酰基-CoA羧化酶复合物的共表达使得FAME增加为大约1.5倍，而谷氨酸棒状杆菌生物素蛋白质连接酶的额外表达使得FAME增加为大约5倍。这些结果表明丙二酰基-CoA的供应增加会改善ES9在大肠杆菌中将脂肪酸生物合成机的中间体转化为脂肪酸甲基酯的能力。

短链CoA测试：使用0.467ml 10％TCA制备15ml Falcon管(用巴豆酰基-CoA作为内部标准品)，并覆盖2ml硅油。将管在冰上冷冻，并将相当于1ml(OD600＝31.2)的发酵液小心地分层放置在硅油的顶上。在4℃下，以11400g将样品离心4个4分钟的周期。对各样品而言，移出400ml TCA/细胞提取物的等分液，并放置在新的Eppendorf管中，使用1ml辛胺(处于CHC13)中和。在涡流处理后，将样品在13000g下离心30秒。使用0.2μm PTFE注射器式过滤器过滤200ml顶层，然后进行LC-MS/MS分析。

试验中使用的培养基的描述：

1000倍浓缩的微量维生素溶液

0.06g/L核黄素

6g/L烟酸

5.4g/L泛酸

1.4g/L维生素B6

0.06g/L生物素

0.01g/L叶酸

1000倍浓缩的微量金属溶液

2mL/L浓盐酸

0.5g/L硼酸

1.9g/L硫酸铜，五水合物，USP

1g/L无水氯化锌

2g/L无水钼酸钠

2g/L无水氯化钙

脂肪醇的生产

通过在大肠杆菌DV2中在具有和不具有acc的条件下表达由细长聚球藻得到的酰基-ACP还原酶(AAR)(SEQ ID NO:38)来评价共表达乙酰基-CoA羧化酶复合物对脂肪醇生产的影响。由于当accD+操纵子构造与酯合酶共表达时会给出最佳的结果，所以选择该构造(参见之前的实施例)。使用融合技术(Clontech Laboratories,Inc.,Mountain View,CA)，将accDABC-birA操纵子克隆到pLS9-185(pCL1920衍生物)中aar基因的下游。将所得的质粒转化大肠杆菌DV2中，并在补充有100mg/L壮观霉素的LB平板上选择相应的转化子。所生产的脂肪醇示于图11中。AAR和accD+共表达使得脂肪醇效价与仅具有AAR的对照(pLS9-185)相比增加为大约1.5倍。数据是可重复的(由三个重复的样品显示)。这些结果证明当使用这种酰基-ACP还原酶时，丙二酰基-CoA水平增加使得脂肪酸的生产得到改善。此外，实施例3描述了acc基因与完整的fab操纵子共表达。

实施例3

通过脂肪酸合成途径的流量增加—iFAB

脂肪酸衍生物的生产：

增加重组宿主细胞中通过脂肪酸合成途径的流量的策略包括在大肠杆菌中共表达天然大肠杆菌脂肪酸生物合成基因和表达由不同有机体得到的外源脂肪酸生物合成基因。在本研究中，将由不同有机体得到的脂肪酸生物合成基因与大肠杆菌DV2(表3)的基因组相组合，在lacUV5启动子的控制下，并整合到IS5-11位点中。评价包括iFAB130-145的16个菌株。iFAB130-145的详细结构示于表4和5中。

表4：在iFAB130-145中使用得自不同物种的成分

缩写	完整描述
		St_fabD	鼠伤寒沙门氏杆菌fabD基因
nSt_fabH	具有天然RBS的鼠伤寒沙门氏杆菌fabH基因
		sSt_fabH	具有合成RBS的鼠伤寒沙门氏杆菌fabH基因
Cac_fabF	丙酮丁醇梭菌(ATCC824)fabF基因
		St_fabG	鼠伤寒沙门氏杆菌fabG基因
St_fabA	鼠伤寒沙门氏杆菌fabA基因
		St_fabZ	鼠伤寒沙门氏杆菌fabZ基因
BS_fabl	枯草芽孢杆菌fabl基因
		BS_FabL	枯草芽孢杆菌fabL基因
Vc_FabV	霍乱弧菌fabV基因
		Ec_FabI	大肠埃希氏杆菌fabI基因

各“iFAB”包括多个fab基因，其顺序如下：1)烯酰基-ACP还原酶(BS_fabI、BS_FabL、Vc_FabV或Ec_FabI)；2)b-酮脂酰基-ACP合成酶III(St_fabH)；3)丙二酰基-CoA-ACP酰基转移酶(St_fabD)；4)b-酮脂酰基-ACP还原酶(St_fabG)；5)3-羟基-酰基-ACP脱水酶(St_fabA或St_fabZ)；6)b-酮脂酰基-ACP合成酶II(Cac_fabF)。注意St_fabA还具有反-2,顺-3-癸烯酰基-ACP异构酶活性，并且Cac_fabF具有b-酮脂酰基-ACP合成酶II和b-酮脂酰基-ACP合成酶I活性(Zhu et al.,BMC Microbiology 9:119(2009))。iFAB130-145的具体组成见下表5。

表5：iFAB130-145的组成

将质粒pCL_P_trc_tesA转化到各菌株中，并在20小时内在FA2培养基中运行发酵，从而在32℃和37℃下完成诱导至发酵。由两个重复的平板筛选得到的总脂肪物质的生产数据示于图12A和12B中。通过该筛选，确定最佳的构建体为具有iFAB138的DV2。iFAB138在EG149的基因组中的序列示于SEQ ID NO:19中。

脂肪酯的生产

将全部合成fab操纵子整合到的大肠杆菌染色体中，并通过在大肠杆菌DAMlpDS57中表达，针对增加的FAME生产来评价所述的操纵子。此外，由谷氨酸棒状杆菌得到的4种合成acc操纵子被共表达，并针对改善的FAME生产率评价这些操纵子。获得以更快的速率和更高的效价生产FAME的多种菌株。将16种不同的iFAB操纵子(表5)置于lacUV5启动子的控制之下，并整合到大肠杆菌DAM1的IS5-11位点中。这些菌株命名为DAMl ifab130至145。使用pDS57(包括酯合酶377)或共表达不同类型的acc操纵子的pDS57(参见上文)转化这些菌株，以用于评价FAME的生产。示例性质粒在表6中有所描述。

表6：包括酯合酶ES9(得自除烃海杆菌)和合成acc操纵子(得自谷氨酸棒状杆菌)的质粒

质粒	基因
		pTB.071	pDS57-accCBDA
pTB.072	pDS57-accCBDA-birA
		pTB.073	pDS57-accDACB
pTB.074	pDS57-accDACB-birA

pDS57＝pCL_ptrc-ES9

在32℃下，在96孔板(4NBT培养基)、摇瓶(5NBT培养基)(关于培养基的描述参见上文)和发酵罐中分析DAM1 ifab菌株。在96孔板和摇瓶中得到最佳结果，其中具有pDS57-acc-birA质粒的多种DAM1 ifab菌株显示出更高的FAME效价。具体而言，具有pDS57-accDACB-birA的DAM1 ifab131、ifab135、ifab137、ifab138和ifab143显示出效价改善20-40％，表明在这些菌株中，取得了通过脂肪酸途径的更高流量，这得到了更好的产物形成速率(这些结果在多个独立的试验中是可重复的)。

过表达fabH和fabI对脂肪酸甲基酯(FAME)生产的影响

增加重组宿主细胞中通过脂肪酸合成途径的流量的策略包括过表达天然的脂肪酸生物合成基因，和表达异源脂肪酸生物合成基因。fabH和fabI是已经显示出反馈抑制的2种脂肪酸生物合成酶(Heath and Rock,JBC 271:1833-1836(1996))。进行研究以测定FabH和FabI是否限制FAME生产的速率。fabH和fabI同源物(得自大肠杆菌、枯草芽孢杆菌、贝氏不动杆菌ADP1、Marinobacter aquaeoli VT8和不透明红球菌)作为合成的操纵子进行过表达，并在大肠杆菌DAM1 pDS57(据观察，该菌株为良好的FAME生产者)中进行评价。在一种方法中，由累积蜡(贝氏不动杆菌、Marinobacter aquaeoli)或三酰基甘油酯(不透明红球菌)的有机体构建fabHfabI操纵子，并将其整合到大肠杆菌DAMl pDS57的染色体中。在相关的方法中，由谷氨酸棒杆菌得到的合成acc操纵子被共表达(如上文实施例2中所述)。构建11种不同的fabHI操纵子(体外拼装)，如表7中概括的那样。将fabHI操纵子置于IPTG诱导的lacUV5启动子的控制之下，并整合到大肠杆菌DAM1的IS5-11位点中。使用pDS57(包括酯合酶377)或共表达不同类型的acc操纵子的pDS57转化这些菌株，以用于评价FAME的生产。

表7：整合的fabHI操纵子的基因型

菌株	其他fab操纵子的基因型	质粒
			stEP117	DAM1ΔinsH::P<sub>LACUV5</sub>(snyRBS)EcfabH(snyRBS)BsfabI::kan	pDS57
stEP118	DAM1ΔinsH::P<sub>LACUV5</sub>(snyRBS)EcfabH(snyRBS)BsfabL::kan	pDS57
			stEP127	DAM1ΔinsH::P<sub>LACUV5</sub>(EcRBS)EcfabH(EcRBS)BsfabI::kan	pDS57
stEP128	DAM1ΔinsH::P<sub>LACUV5</sub>(EcRBS)EcfabH(EcRBS)BsfabL::kan	pDS57
			stEP129	DAM1ΔinsH::P<sub>LACUV5</sub>(EcRBS)ADP1fabH(EcRBS)ADP1fabI::kan	pDS57
stEP130	DAM1ΔinsH::P<sub>LACUV5</sub>(snyRBS)ADP1fabH(synRBS)ADP1fabI::kan	pDS57
			stEP131	DAM1ΔinsH::P<sub>LACUV5</sub>(snyRBS)VT8fabH1(synRBS)VT8fabI::kan	pDS57
stEP132	DAM1ΔinsH::P<sub>LACUV5</sub>(snyRBS)VT8fabH2(synRBS)VT8fabI::kan	pDS57
			stEP133	DAM1ΔinsH::P<sub>LACUV5</sub>(EcRBS)VT8fabH1(synRBS)VT8fabI::kan	pDS57
stEP134	DAM1ΔinsH::P<sub>LACUV5</sub>(EcRBS)VT8fabH2(synRBS)VT8fabI::kan	pDS57
			stEP151	DAM1ΔinsH::P<sub>LACUV5</sub>(snyRBS)RofabI(synRBS)RofabH::kan	pDS57
stEP153	DAM1ΔinsH::P<sub>LACUV5</sub>(EcRBS)ADP1fabH(EcRBS)ADP1fabI::kan	pDS57-accCBDA
			stEP154	DAM1ΔinsH::P<sub>LACUV5</sub>(EcRBS)ADP1fabH(EcRBS)ADP1fabI::kan	pDS57-accDACB
stEP155	DAM1ΔinsH::P<sub>LACUV5</sub>(EcRBS)ADP1fabH(EcRBS)ADP1fabI::kan	pDS57-accCBDA-birA
			stEP156	DAM1ΔinsH::P<sub>LACUV5</sub>(EcRBS)ADP1fabH(EcRBS)ADP1fabI::kan	pDS57-accDACB-birA
stEP157	DAM1ΔinsH::P<sub>LACUV5</sub>(snyRBS)EcfabH(synRBS)BsfabI::kan	pDS57-accCBDA
			stEP158	DAM1ΔinsH::P<sub>LACUV5</sub>(snyRBS)EcfabH(synRBS)BsfabI::kan	pDS57-accCBDA-bvirA
stEP159	DAM1ΔinsH::P<sub>LACUV5</sub>(EcRBS)EcfabH(synRBS)BsfabI::kan	pDS57-accCBDA
			stEP160	DAM1ΔinsH::P<sub>LACUV5</sub>(EcRBS)EcfabH(synRBS)BsfabI::kan	pDS57-accCBDA-birA
stEP161	DAM1ΔinsH::P<sub>LACUV5</sub>(EcRBS)VT8fabH1(synRBS)VT8fabI::kan	pDS57-accCBDA
			stEP162	DAM1ΔinsH::P<sub>LACUV5</sub>(EcRBS)VT8fabH1(synRBS)VT8fabI::kan	pDS57-accCBDA-birA
stEP163	DAM1ΔinsH::P<sub>LACUV5</sub>(EcRBS)VT8fabH2(synRBS)VT8fabI::kan	pDS57-accCBDA
			stEP164	DAM1ΔinsH::P<sub>LACUV5</sub>(EcRBS)VT8fabH2(synRBS)VT8fabI::kan	pDS57-accCBDA-birA

Bs：枯草芽孢杆菌；Ec：大肠埃希氏杆菌；ADP1：不动杆菌菌株ADP1；VT8：Marinobacter aquaeolei VT8；Ro：不透明红球菌B4

在32℃下，在96孔板(4NBT培养基)、摇瓶(5NBT培养基)、和发酵罐中分析DAM1ifabHI菌株。在摇瓶中，携带pDS57质粒的多种ifabHI菌株比对照DAMl pDS57菌株工作的更好，其达到高出10至15％的FAME效价(图13)。当使用pDS57-acc-birA质粒转化ifabHI菌株时，得到另外增加的FAME效价，特别是在菌株StEP156(DAMl IS5-11::lacUV5(ecRBS)ADPlfabH(ecRBS)ADP1fabI pDS57-accD ACB-birA)中观察到FAME效价增加50％(图14)。

在发酵罐中运行具有ifabHI的一些菌株，其中还观察到FAME效价、特定生产率和产率增加(图15)，表明在这些菌株中，获得通过脂肪酸途径的更高流量，这会得到更好的产率形成速率。具体而言，stEP129(DAMl 5-11::UV5(ecRBS)ADPlfabH(ecRBS)ADPlfabIpDS57)在多个独立的发酵运行中显示更高的FAME效价和产率。fabH和fabI的其他组合可以用于取得相似的效果。尽管此处举例FAME，改变脂肪酸生物合成基因的这种方法为增加任何脂肪酸衍生物的生产的有用方法。

在操纵子FAB 138之前插入强启动子对脂肪酸甲基酯(FAME)生产的影响

通过T5启动子(SEQ ID NO:2)替代iFAB 138的lacUV5启动子，使得iFAB138表达更高水平，这通过mRNA分析来证明。由T5启动子使iFAB138表达得到更高的脂肪酯效价、产率和生产率。菌株shu.002(表3)与菌株BD64(表3)是同基因的，不同之处在于其包括控制iFAB138操纵子表达的T5启动子(SEQ ID NO:19)。

表8：用于形成iT5_138盒的引物并证明其插入到新菌株中

引物DG405和DG406(表8)用于扩增cat-loxP和T5启动子盒，从而将50bp同源物加入到PCR产物的各个末端，这样其能够整合到任何菌株中，从而替代lacUV5启动子来调节iFAB138操纵子的表达。将cat-loxP-T5启动子转化到BD64/pKD46菌株中。在37℃过夜，在LB+氯霉素平板上回收转化子，补到新的LB+氯霉素平板上，并使用引物DG422和DG423通过菌落PCR来证明。将质粒pJW168(Palmeros et al,Gene 247:255-264(2000))转化到菌株BD64i-cat-loxP-T5_138中，并在32℃下在LB+羧苄青霉素平板上进行选择。为了除去cat标志，通过IPTG诱导cre重组酶的表达。通过使培养物在42℃下生长而除去质粒pJW168。将菌落补到LB+氯霉素和LB+羧苄青霉素上，从而分别证明pJW168的失去和cat标志的除去。此外，将菌落补到LB上作为阳性对照，所有补片的平板都在32℃下温育。使用引物DG422和DG423，通过菌落PCR证明cat标志的除去。使用引物EG744、EG749和oTREE047，通过测序来证明所得的PCR产物，该菌株称为shu.002。图16示出了iFAB138基因座：cat-loxP-P_T5盒整合到FAB138前面的图(图16A)，和P_T5_iFAB 138区的图(图16B)。整合到iFAB138前面的并与整合位点具有同源性的cat-loxP-T5启动子序列示于SEQ ID NO:1中，并且与整合位点具有同源性的iT5_FAB138启动子区序列示于SEQ ID NO:2中。有多种条件可以使脂肪酸流量增加。在本实施例中，脂肪酸流量增加是通过改变操纵子iFAB138的启动子强度来实现的。由T5启动子的iFAB138表达是有利的，然而，当该启动子改变与插入yijP::Tn5盒结合时，观察到脂肪酸酯和其他的脂肪酸衍生物的效价、产率和生产率的进一步改善(数据未示出)。

实施例4

通过修复rph和ilvG突变来增加游离脂肪酸(FFA)产率的量

在所述的菌株中校正ilvG和rph突变，从而更多地生产FFA。使用pCL_P_trc_tesA转化菌株EG149和V668(表3)。在FA2培养基中在32℃下将发酵运行40小时，以比较具有pCL_P_trc_tesA的菌株的EG149和V668的FFA生产。校正rph和ilvG突变使得具有pCL_P_trc_tesA的基础菌株的FFA生产增加116％。如图17所示，V668/pCL_P_trc_tesA比EG149/pCL_P_trc_tesA对照生产更多的FFA。由于FFA是LS9产物的前体，较多的FFA生产是新菌株可以生产更高水平的LS9产物的良好的指示剂。

实施例5：通过转座子诱变使得脂肪酸衍生物的生产增加—yijP

脂肪醇的生产

为了改善大肠杆菌生产脂肪醇的效价、产率和生产率，实施转座子诱变和高通量的筛选，并对有利的突变测序。显示将转座子插入到yijP菌株中会改善菌株在摇瓶和分批供料发酵中的脂肪醇产率。SL313菌株生产脂肪醇。表3中提供该菌株的基因型。然后，对转座子克隆进行高通量的筛选，以测量脂肪醇的生产。简言之，将菌落挑选至包括LB的深孔平板中，过夜生长，接种至新鲜的LB中，并生长3小时，接种至新鲜的FA2.1培养基中，生长16小时，然后使用醋酸丁酯提取。使用BSTFA(Ν,Ο-双[三甲基甲硅烷基]三氟乙酰胺)衍生粗提物，并使用GC/FID分析。所有培养基中均包括壮观霉素(100mg/L)，从而保持对pDG109质粒的选择。通过挑选生产与对照菌株SL313相似的总脂肪物质的克隆来选择匹配物(hit)，其中所述的克隆比对照菌株具有更高百分率的脂肪醇物质和更低百分率的游离脂肪酸。菌株68F11被鉴定为匹配物，并使用FA2.1培养基在摇瓶发酵中证实。转座子匹配物68F11与对照菌株SL313比较表明68F11比对照菌株生产更高百分率的脂肪醇物质，而两种菌株均生产相似效价的总脂肪物质。对匹配物68F11的单个菌落(称为LC535)测序，从而鉴定转座子插入的位置。简言之，使用试剂盒ZR Fungal/Bacterial DNA MiniPrep^TM(Zymo ResearchCorporation,Irvine,CA)，根据制造商提供的说明由10mL过夜LB培养物纯化基因组DNA。使用位于转座子内部的引物，由转座子向外测序纯化的基因组DNA。

DG150

5'-GCAGTTATTGGTGCCCTTAAACGCCTGGTTGCTACGCCTG-3'(SEQ ID NO:27)

DG131 5'-GAGCCAATATGCGAGAACACCCGAGAA-3'(SEQ ID NO:28)

据测定，菌株LC535在yijP基因中具有转座子插入(图18)，yijP编码保守的内在膜蛋白，其功能尚不清楚。yijP基因在操纵子内并与编码磷酸烯醇式丙酮酸羧化酶的ppc基因和编码功能未知的预测DNA结合转录调节因子的yijO基因共转录。转座子内部的启动子可能影响yijP、ppc和yijO的转录水平和定时，并且还可以影响对相邻的基因frwD、pflC、pfld和argE。转座子盒内的启动子示于图18中，并且可以影响相邻基因的表达。在2个不同的日期在分批供料的发酵中评价菌株LC535。2次发酵证明LC535与对照SL313相比以更高的产率生产脂肪醇，并且根据碳输出，绝对产率改善1.3-1.9％。在不同的菌株V940中进一步评价yijP转座子盒，其中所述的菌株与菌株SL313相比以更高的产率生产脂肪醇。使用以下引物，由菌株LC535扩增yijP::Tn5-cat盒。

LC277

5'-CGCTGAACGTATTGCAGGCCGAGTTGCTGCACCGCTCCCGCCAGGCAG-3'(SEQ ID NO:29)

LC278

5'-GGAATTGCCACGGTGCGGCAGGCTCCATACGCGAGGCCAGGTTATCCAACG-3'(SEQ ID NO:30)

将该线性DNA电穿孔至菌株SL571中，并使用lambda red重组系统整合至染色体中。使用转座子区外的引物筛选菌落：

DG407

5'-AATCACCAGCACTAAAGTGCGCGGTTCGTTACCCG-3'(SEQ ID NO:31)

DG408

5'-ATCTGCCGTGGATTGCAGAGTCTATTCAGCTACG-3'(SEQ ID NO:32)

使用生产型质粒pV171.1转化具有校正yijP转座子盒的菌落，从而生产菌株D851。在摇瓶发酵中，针对不包括yijP转座子盒的菌株V940，测试D851。发酵结果显示yjiP转座子盒赋予D851菌株比V940菌株生产更高百分率的脂肪醇，并生产与V940对照菌株相似效价的总脂肪物质。在2个不同的日期，在分批供料发酵中评价菌株D851。由这些发酵得到的数据示于表9中，其标明在5升分批供料发酵中，具有yijP::Tn5-cat转座子插入的菌株具有增高的总脂肪物质(“FAS”)的产率，以及增高的脂肪醇百分率(“FALC”)。术语“总脂肪物质”和“总脂肪酸产物”可以交换使用，其是指脂肪醇、脂肪醛和游离脂肪酸的量，其可按照国际专利申请公开WO 2008/119082中所述通过GC-FID来评价。当相同的术语用于指脂肪酯分析时，相同的术语可以用于指脂肪酯和游离脂肪酸。如本文所用，术语“脂肪酯”包括β羟基酯。

表9：yijP转座子插入对FAS和FALC的效价和产率的影响

菌株	FAS效价	FAS产率	FALC百分率	FALC产率
					V940	68g/L	18.7％	95.0％	17.8％
D851	70g/L	19.4％	96.1％	18.6％
					V940	64g/L	18.4％	91.9％	16.9％
D851	67g/L	19.0％	94.0％	17.8％

罐式发酵方法

为了评价脂肪酸和脂肪酸衍生物在发酵罐中的生产，使用所需菌株的甘油瓶将20mL LB+壮观霉素接种于摇瓶中，并在32℃下温育大约6小时。使用4mL LB培养物接种125mL Low PFA种子培养基(参见下文)，然后将其在32℃的振荡器中温育过夜。使用50mL过夜培养物来接种1L发酵罐培养基中。在pH7.2和30.5℃下，在最大供料速率为16g/L/hr葡萄糖的条件下，在pH稳态条件下运行发酵罐。

表10：Low P FA种子培养基

表11：发酵罐培养基

成分	浓度
		(NH<sub>4</sub>)<sub>2</sub>SO<sub>4</sub>	0.5g/L
KH<sub>2</sub>PO<sub>4</sub>	3.0g/L
		柠檬酸铁	0.034g/L
TM2微量矿物溶液	10mL/L
		酪蛋白氨基酸	5g/L
灭菌后加入
		MgSO<sub>4</sub>-7H<sub>2</sub>O	2.2g/L
微量维生素溶液	1.25mL/L
		葡萄糖	5g/L
接种物	50mL/L

进一步研究表明FAS和FALC的效价和产率在具有yijP转座子插入的菌株中有所改善是由于磷酸烯醇式丙酮酸羧化酶(ppc)活性的降低。在以下菌株中体外进行ppc酶测试，以评价这种假说。

1)Δppc＝DG14(LC942Δppc::cat-sacB/pLC56)

2)wt-ppc＝DG16(LC942/pLC56)

3)yijP::Tn5＝DG18(LC942 yijP::Tn5-cat/pLC56)

使用标准的摇瓶方法，在FA2.3培养基(如上文所述)中，在摇瓶发酵中生长的细胞中测量Ppc活性，并在诱导后的12至16小时收获。离心大约5mL细胞，并将细胞团悬浮在具有蛋白酶抑制剂混合物溶液的BugBuster Protein Extraction Reagent(Novagen)中。在振荡器上，在温和摇动的条件下将细胞悬浮物温育20min。通过在4℃下以16000x g离心20min，然后将上清液转移至新管中，从而除去不溶的细胞残渣。使用以下反应混合物，通过使用柠檬酸合酶的缀合反应来测定细胞裂解物中的Ppc活性：0.4mM乙酰基-CoA、10mM磷酸烯醇式丙酮酸盐、0.5mM一溴二胺、5mM MgCl₂、10mM NaHCO₃和由猪心得到的10单位的柠檬酸合酶，处于100mM Tris-HCl(pH 8.0)中。使用一溴二胺对CoA进行荧光衍生，用光度计监测使用柠檬酸合酶反应(使用草酰乙酸和乙酰基-CoA)中的CoA的形成。Ppc测试结果显示与野生型细胞相比，yijP::Tn5-cat转座子盒将所述细胞中的Ppc活性降低2.7倍。ppc删除的细胞生长不好，并且活性比野生型细胞低大约10倍。此外，结果还表明产率最高的脂肪醇的生产需要Ppc表达水平低于野生型的水平。此外，还收集蛋白质组学的数据来评估Ppc蛋白质在具有和不具有yijP::Tn5-cat转座子盒的2种菌株中的丰度。使用标准的脂肪醇生产条件，由生物反应器中生长的菌株V940和D851收集蛋白质样品(如上文所述)。在2个不同的时间点(32小时和48小时)取得样品，并制备该样品以用于分析。

按照如下方式实施样品的收集和蛋白质分离：

在各时间点，由各生物反应器收集20ml发酵液。使用冰冷的PBS淬灭样品，并通过在4℃下离心(4500rpm/10min)来收获样品。使用冰冷的PBS洗涤细胞团，并离心一次以上，然后储存在-80℃下以用于进一步加工。

使用法式压滤方法进行总蛋白质提取。简言之，将细胞团再次悬浮于7ml冰冷的PBS中，并在2000psi下法式压滤2次，以确保细菌完全溶解。将样品在10000rpm下在4℃下离心20min，从而使未裂解的细胞和细胞残渣与蛋白质级份分离。使用BCA Protein AssayReagent测定澄清裂解物的总蛋白质浓度。将样品稀释至2mg蛋白质/ml浓度，并冷冻在-80℃下。

将样品再次悬浮于合适的缓冲剂中，并在37℃下在胰蛋白酶作用下过夜，并冻干。将片段化的蛋白质样品用同位素富集的甲基哌嗪乙酸在室温下标记30min。使用阳离子交换液相色谱分离标记的样品，并使用离子阱质谱仪进行质朴分析。使用背景消除和偏畸值校正，将原始数据归一化。

蛋白质组学数据显示，当在32小时和48小时与V940比较时，Ppc蛋白质在D851菌株中的相对丰度明显降低。在32小时，D851具有V940的Ppc水平的大约15％，而在48小时，具有V940的Ppc水平的大约35％。这些数据显示yijP::Tn5-cat转座子盒使得细胞中的Ppc丰度显著降低。这表明由容留yijP::Tn5-cat转座子匹配物的菌株生产脂肪醇的可见益处是由于减少了Ppc蛋白质的量。

这些结果表明改变ppc活性可以改善脂肪酸衍生物的产率。有多种方式可以改变ppc基因的表达，yijP转座子插入是完成上述改变的一种方式。不想被理论所束缚，如果降低磷酸烯醇式丙酮酸羧化酶活性的效果是限制了碳通过TCA循环的流动，则可以通过降低柠檬酸合酶(gltA)的活性或者减慢TCA循环(通过降低与TCA循环有关的任一种酶的活性)来取得相似的结果。

实施例6

通过脂肪酸合成途径的流量增加—酰基载体蛋白质(ACP)介导的脂肪醇生产

当由除了大肠杆菌以外的来源获得终末途径的酶在大肠杆菌(作为异源宿主)中表达、从而将脂肪酰基-ACP转化为产物时，局限可以存在于重组途径的酶对大肠杆菌脂肪酰基-ACP的识别、亲和和/或转换中。注意尽管ACP蛋白质在所有有机体中在一定程度上是保守的，但是它们的初级序列可能显著不同。为了检验该假说，将由多种蓝细菌得到的acp基因克隆到在pLS9-185(其为pCL1920衍生物)中存在的细长聚球藻PCC7942酰基-ACP还原酶(AAR)的下游。此外，由枯草芽孢杆菌得到的sfp基因(编号No.X63158；SEQ ID NO:53)编码具有广泛的底物特异性的磷酸泛酰巯基乙胺基转移酶，将其克隆到各acp基因的下游。其中所述的酶与非活性的apo-ACP向活性全-ACP的转化有关。所构建的质粒在表12中描述。

表12：在细长聚球藻PCC7942 AAR下游在具有和不具有枯草芽孢杆菌sfp下共表达蓝细菌ACP的质粒

使用InFusion技术(Clontech Laboratories,Inc.,Mountain View,CA)，将所有的acp基因与合成的RBS一起克隆到pLS9-185中aar基因下游紧邻的EcoRI位点中。在acp基因的下游重建EcoRI位点。相似地，使用InFusion技术将枯草芽孢杆菌sfp基因与合成的RBS一起克隆到所述的EcoRI位点中。所有质粒均转化至大肠杆菌MG1655DV2(表3)中。这些试验的对照单独表达AAR(pLS9-185)。由标准的摇瓶发酵试验的结果示于图19中。在包括质粒pDS171S、pDS172S、pDS168和pDS169的菌株中，观察到脂肪醇效价的显著升高，证明ACP过表达对于脂肪醇生产是有利的，推测这种情况是由于有助于酰基-ACP被异源终末途径的酶所识别、亲和和/或转换(关于ACP的来源以及sfp的存在或缺乏参见表12)。

脂肪酸的生产

为了评价ACP的过表达是否还可以增加游离脂肪酸的生产，由pDS171扩增具有sfp的一种蓝细菌ACP基因(表12)，并克隆到'tesA的下游而进入pCL载体中。所得的操纵子处于Ptrc3启动子的控制之下，该启动子提供比Ptrc野生型启动子更低的转录水平。构建体被克隆到大肠杆菌DV2中，并针对脂肪酸的生产进行评价。对照菌株包括相同的质粒，但不具有蓝细菌ACP和枯草芽孢杆菌sfp。由标准微量滴定板发酵试验得到的结果示于图20中。在共表达异源ACP的菌株中观察到脂肪酸效价显著改善，证明ACP共表达对于脂肪酸生产可以是有利的，推测这种情况是由于增加了通过脂肪酸生物合成途径的流量。

本发明包括以下实施方案：

1.一种重组宿主细胞，其包括基因改造的多核苷酸序列，所述的基因改造的多核苷酸序列编码一种或多种多肽，其中：

所述的一种或多种多肽具有选自以下的活性：3-羟基-酰基-[acp]脱水酶(E.C.4.2.1.59)活性；β-酮脂酰基-ACP合酶I(E.C.2.3.1.41)活性；β-酮脂酰基-ACP合酶II(E.C.2.3.1.179)活性；[acp]S-丙二酰基转移酶{丙二酰基-CoA-ACP酰基转移酶}(E.C.2.3.1.39)活性；3-氧酰基-{β-酮脂酰基}-ACP还原酶(E.C.1.1.1.100)活性；β-酮脂酰基-ACP合酶III(E.C.2.3.1.180)活性；烯酰基-ACP还原酶(NADH)(E.C.1.3.1.9)活性；烯酰基-ACP还原酶(NADPH)(E.C.1.3.1.10)活性；以及反-2,顺-3-癸烯酰基-ACP异构酶(E.C.5.3.3.14)活性；并且

其中当在有效表达所述的多核苷酸的条件下在包括碳源的培养基中培养时，所述的重组宿主细胞以比相应的野生型宿主细胞更高的效价、产率或生产率来生产脂肪酸衍生物组合物。

2.根据实施方案1所述的重组宿主细胞，其中具有反-2,顺-3-癸烯酰基-ACP异构酶活性的多肽为FabA或FabM。

3.根据实施方案1所述的重组宿主细胞，其中具有β-酮脂酰基-ACP合酶II活性的多肽为FabF。

4.根据实施方案1所述的重组宿主细胞，其中具有丙二酰基-CoA-ACP酰基转移酶活性的多肽为FabD。

5.根据实施方案1所述的重组宿主细胞，其中具有β-酮脂酰基-ACP合酶I活性的多肽为FabF或FabB。

6.根据实施方案1所述的重组宿主细胞，其中具有β-酮脂酰基-ACP还原酶活性的多肽为FabG。

7.根据实施方案1所述的重组宿主细胞，其中具有β-酮脂酰基-ACP合酶III活性的多肽为FabH。

8.根据实施方案1所述的重组宿主细胞，其中具有烯酰基-ACP还原酶活性的多肽为FabI、FabL、FabV或FabK。

9.根据实施方案1所述的重组宿主细胞，其中具有3-羟基-酰基-[acp]脱水酶活性的多肽为FabA或FabZ。

10.根据实施方案1所述的重组宿主细胞，其中具有烯酰基-ACP还原酶活性的多肽为FabV。

11.根据实施方案1所述的重组宿主细胞，其中所述的多肽选自FabA、FabB、FabD、FabF、FabG、FabH、FabI、FabL、FabV、FabZ、FabM和FabK。

12.根据实施方案1所述的重组宿主细胞，其中编码多肽是FabV、FabH、FabD、FabG、FabA和FabF。

13.根据实施方案1所述的重组宿主细胞，其中所述的多肽选自得自鼠伤寒沙门氏杆菌(Salmonella typhimurium)的FabA(NP_460041)；得自大肠埃希氏菌(Escherichiacoli)的FabB(NP_416826)；得自鼠伤寒沙门氏杆菌的FabD(NP_460164)；得自鼠伤寒沙门氏杆菌的FabG(NP_460165)；得自鼠伤寒沙门氏杆菌的FabH(NP_460163)；得自鼠伤寒沙门氏杆菌的FabZ(NP_459232)；得自变性链球菌(Streptococcus mutans)的FabM(AAN59379)；得自肺炎链球菌(Streptococcus pneumoniae)的FabK(AAF98273)；得自霍乱弧菌(Vibriocholera)的FabV(YP_001217283)；得自丙酮丁醇梭菌(Clostridium acetobutylicum)的FabF(NP_350156)；得自枯草芽孢杆菌亚种枯草菌株168(Bacillus subtillissubsp.subtilis str.168)的FabI(NP_389054)；得自枯草芽孢杆菌亚种枯草菌株168的FabL(NP_388745)；得自不动杆菌菌种(Acinetobacter sp.)ADP1的FabI(YP_047630)；得自Marinobacter aquaeoli VT8的FabI(YP_958813)；得自不透明红球菌(Rhodococcusopacus)B4的FabI(YP_002784194)；得自大肠埃希氏菌的FabI(NP_415804)；得自不动杆菌菌种ADP1的FabH(YP_046731)；得自Marinobacter aquaeoli VT8的FabH(YP_958649)；和得自不透明红球菌B4的FabH(YP_00278448)。

14.根据实施方案1所述的重组宿主细胞，其中由所述的基因改造的多核苷酸序列编码的所述的一种或多种多肽是外源的。

15.根据实施方案1所述的重组宿主细胞，其进一步包括编码酰基载体蛋白质(ACP)的基因改造的多核苷酸序列。

16.根据实施方案15所述的重组宿主细胞，其中所述的ACP进一步增加了所述的脂肪酸衍生物组合物的效价、产率或生产率。

17.一种重组宿主细胞，其包括基因改造的多核苷酸序列，其中所述的基因改造的多核苷酸序列编码ACP多肽，其中当在有效表达所述的ACP多肽的条件下在包括碳源的培养基中培养时，所述的重组宿主细胞以比相应的野生型宿主细胞更高的效价、产率或生产率来生产脂肪酸衍生物组合物。

18.根据实施方案15或实施方案17所述的重组宿主细胞，其进一步包括编码如下多肽的重组多核苷酸，其中所述的多肽具有磷酸泛酰巯基乙胺基转移酶(E.C.2.7.8.7)活性。

19.根据实施方案18所述的重组宿主细胞，其中具有磷酸泛酰巯基乙胺基转移酶活性的多肽由sfp基因编码。

20.根据实施方案1、15或17中任一项所述的重组宿主细胞，其中所述的重组宿主细胞进一步包括编码如下多肽的重组多核苷酸，其中所述的多肽具有accABCD(E.C.6.4.1.2)活性。

21.根据实施方案15或实施方案17所述的重组宿主细胞，其中所述的ACP衍生自在所述的重组宿主细胞中表达作为终末途径酶的相同的有机体。

22.根据实施方案15或实施方案17所述的重组宿主细胞，其中所述的ACP是外源的。

23.一种细胞培养物，其包括根据实施方案1至22中任一项所述的重组宿主细胞。

24.根据实施方案23所述的细胞培养物或根据实施方案1至22中任一项所述的重组宿主细胞用于生产脂肪酸衍生物组合物的用途。

25.一种生产脂肪酸衍生物组合物的方法，包括：

(a)在有效表达根据实施方案1至22中任一项所述的多核苷酸的条件下在包括碳源的培养基中培养根据实施方案1至22中任一项所述的重组宿主细胞；并且

(b)分离所述的脂肪酸衍生物组合物。

26.一种经基因改造以影响ppc基因的重组宿主细胞，其中：

所述的ppc基因编码下调的多核苷酸；并且

所述的下调的多核苷酸编码如下ppc多肽，当在有效表达所述的ppc多肽的条件下在包括碳源的培养基中培养所述的宿主细胞时，所述的ppc多肽影响脂肪酸衍生物组合物的生产。

　　序列表

　　<110> 基因组股份公司

　　<120> 改善的脂肪酸衍生物的生产

　　<130> LS00042PCT

　　<140>

　　<141>

　　<150> 61/619,324

　　<151> 2012-04-02

　　<160> 64

　　<170> PatentIn version 3.5

　　<210> 1

　　<211> 1232

　　<212> DNA

　　<213> 人工序列

　　<220>

　　<221> 来源

　　<223> /注="人工序列的描述: 合成的多核苷酸"

　　<400> 1

　　ttgtccatct ttatataatt tgggggtagg gtgttcttta tgtaaaaaaa acgttttagg 60

　　atgcatatgg cggccgcata acttcgtata gcatacatta tacgaagtta tctagagttg 120

　　catgcctgca ggtccgctta ttatcactta ttcaggcgta gcaaccaggc gtttaagggc 180

　　accaataact gccttaaaaa aattacgccc cgccctgcca ctcatcgcag tactgttgta 240

　　attcattaag cattctgccg acatggaagc catcacaaac ggcatgatga acctgaatcg 300

　　ccagcggcat cagcaccttg tcgccttgcg tataatattt gcccatggtg aaaacggggg 360

　　cgaagaagtt gtccatattg gccacgttta aatcaaaact ggtgaaactc acccagggat 420

　　tggctgagac gaaaaacata ttctcaataa accctttagg gaaataggcc aggttttcac 480

　　cgtaacacgc cacatcttgc gaatatatgt gtagaaactg ccggaaatcg tcgtggtatt 540

　　cactccagag cgatgaaaac gtttcagttt gctcatggaa aacggtgtaa caagggtgaa 600

　　cactatccca tatcaccagc tcaccgtctt tcattgccat acggaattcc ggatgagcat 660

　　tcatcaggcg ggcaagaatg tgaataaagg ccggataaaa cttgtgctta tttttcttta 720

　　cggtctttaa aaaggccgta atatccagct gaacggtctg gttataggta cattgagcaa 780

　　ctgactgaaa tgcctcaaaa tgttctttac gatgccattg ggatatatca acggtggtat 840

　　atccagtgat ttttttctcc attttagctt ccttagctcc tgaaaatctc gataactcaa 900

　　aaaatacgcc cggtagtgat cttatttcat tatggtgaaa gttggaacct cttacgtgcc 960

　　gatcaacgtc tcattttcgc caaaagttgg cccagggctt cccggtatca acagggacac 1020

　　caggatttat ttattctgcg aagtgatctt ccgtcacagg tatttattcg actctagata 1080

　　acttcgtata gcatacatta tacgaagtta tggatccagc ttatcgatac cgtcaaacaa 1140

　　atcataaaaa atttatttgc tttcaggaaa atttttctgt ataatagatt caattgcgat 1200

　　gacgacgaac acgcacctgc aggaggagac ca 1232

　　<210> 2

　　<211> 232

　　<212> DNA

　　<213> 人工序列

　　<220>

　　<221> 来源

　　<223> /注="人工序列的描述: 合成的多核苷酸"

　　<400> 2

　　ttgtccatct ttatataatt tgggggtagg gtgttcttta tgtaaaaaaa acgttttagg 60

　　atgcatatgg cggccgcata acttcgtata gcatacatta tacgaagtta tggatccagc 120

　　ttatcgatac cgtcaaacaa atcataaaaa atttatttgc tttcaggaaa atttttctgt 180

　　ataatagatt caattgcgat gacgacgaac acgcacctgc aggaggagac ca 232

　　<210> 3

　　<211> 340

　　<212> PRT

　　<213> 不动杆菌菌种

　　<400> 3

　　Met Ser Asn His Gln Ile Arg Ala Tyr Ala Ala Met Gln Ala Gly Glu

　　1 5 10 15

　　Gln Val Val Pro Tyr Gln Phe Asp Ala Gly Glu Leu Lys Ala His Gln

　　 20 25 30

　　Val Glu Val Lys Val Glu Tyr Cys Gly Leu Cys His Ser Asp Leu Ser

　　 35 40 45

　　Val Ile Asn Asn Glu Trp Gln Ser Ser Val Tyr Pro Ala Val Ala Gly

　　 50 55 60

　　His Glu Ile Ile Gly Thr Ile Ile Ala Leu Gly Ser Glu Ala Lys Gly

　　65 70 75 80

　　Leu Lys Leu Gly Gln Arg Val Gly Ile Gly Trp Thr Ala Glu Thr Cys

　　 85 90 95

　　Gln Ala Cys Asp Pro Cys Ile Gly Gly Asn Gln Val Leu Cys Thr Gly

　　 100 105 110

　　Glu Lys Lys Ala Thr Ile Ile Gly His Ala Gly Gly Phe Ala Asp Lys

　　 115 120 125

　　Val Arg Ala Gly Trp Gln Trp Val Ile Pro Leu Pro Asp Asp Leu Asp

　　 130 135 140

　　Pro Glu Ser Ala Gly Pro Leu Leu Cys Gly Gly Ile Thr Val Leu Asp

　　145 150 155 160

　　Pro Leu Leu Lys His Lys Ile Gln Ala Thr His His Val Gly Val Ile

　　 165 170 175

　　Gly Ile Gly Gly Leu Gly His Ile Ala Ile Lys Leu Leu Lys Ala Trp

　　 180 185 190

　　Gly Cys Glu Ile Thr Ala Phe Ser Ser Asn Pro Asp Lys Thr Glu Glu

　　 195 200 205

　　Leu Lys Ala Asn Gly Ala Asp Gln Val Val Asn Ser Arg Asp Ala Gln

　　 210 215 220

　　Ala Ile Lys Gly Thr Arg Trp Lys Leu Ile Ile Leu Ser Thr Ala Asn

　　225 230 235 240

　　Gly Thr Leu Asn Val Lys Ala Tyr Leu Asn Thr Leu Ala Pro Lys Gly

　　 245 250 255

　　Ser Leu His Phe Leu Gly Val Thr Leu Glu Pro Ile Pro Val Ser Val

　　 260 265 270

　　Gly Ala Ile Met Gly Gly Ala Lys Ser Val Thr Ser Ser Pro Thr Gly

　　 275 280 285

　　Ser Pro Leu Ala Leu Arg Gln Leu Leu Gln Phe Ala Ala Arg Lys Asn

　　 290 295 300

　　Ile Ala Pro Gln Val Glu Leu Phe Pro Met Ser Gln Leu Asn Glu Ala

　　305 310 315 320

　　Ile Glu Arg Leu His Ser Gly Gln Ala Arg Tyr Arg Ile Val Leu Lys

　　 325 330 335

　　Ala Asp Phe Asp

　　 340

　　<210> 4

　　<211> 314

　　<212> PRT

　　<213> 不动杆菌菌种

　　<400> 4

　　Met Ala Thr Thr Asn Val Ile His Ala Tyr Ala Ala Met Gln Ala Gly

　　1 5 10 15

　　Glu Ala Leu Val Pro Tyr Ser Phe Asp Ala Gly Glu Leu Gln Pro His

　　 20 25 30

　　Gln Val Glu Val Lys Val Glu Tyr Cys Gly Leu Cys His Ser Asp Val

　　 35 40 45

　　Ser Val Leu Asn Asn Glu Trp His Ser Ser Val Tyr Pro Val Val Ala

　　 50 55 60

　　Gly His Glu Val Ile Gly Thr Ile Thr Gln Leu Gly Ser Glu Ala Lys

　　65 70 75 80

　　Gly Leu Lys Ile Gly Gln Arg Val Gly Ile Gly Trp Thr Ala Glu Ser

　　 85 90 95

　　Cys Gln Ala Cys Asp Gln Cys Ile Ser Gly Gln Gln Val Leu Cys Thr

　　 100 105 110

　　Gly Glu Asn Thr Ala Thr Ile Ile Gly His Ala Gly Gly Phe Ala Asp

　　 115 120 125

　　Lys Val Arg Ala Gly Trp Gln Trp Val Ile Pro Leu Pro Asp Glu Leu

　　 130 135 140

　　Asp Pro Thr Ser Ala Gly Pro Leu Leu Cys Gly Gly Ile Thr Val Phe

　　145 150 155 160

　　Asp Pro Ile Leu Lys His Gln Ile Gln Ala Ile His His Val Ala Val

　　 165 170 175

　　Ile Gly Ile Gly Gly Leu Gly His Met Ala Ile Lys Leu Leu Lys Ala

　　 180 185 190

　　Trp Gly Cys Glu Ile Thr Ala Phe Ser Ser Asn Pro Asn Lys Thr Asp

　　 195 200 205

　　Glu Leu Lys Ala Met Gly Ala Asp His Val Val Asn Ser Arg Asp Asp

　　 210 215 220

　　Ala Glu Ile Lys Ser Gln Gln Gly Lys Phe Asp Leu Leu Leu Ser Thr

　　225 230 235 240

　　Val Asn Val Pro Leu Asn Trp Asn Ala Tyr Leu Asn Thr Leu Ala Pro

　　 245 250 255

　　Asn Gly Thr Phe His Phe Leu Gly Val Val Met Glu Pro Ile Pro Val

　　 260 265 270

　　Pro Val Gly Ala Leu Leu Gly Gly Ala Lys Ser Leu Thr Ala Ser Pro

　　 275 280 285

　　Thr Gly Ser Pro Ala Ala Leu Arg Lys Leu Leu Glu Phe Ala Ala Arg

　　 290 295 300

　　Lys Asn Ile Ala Pro Gln Ile Glu Met Tyr

　　305 310

　　<210> 5

　　<211> 1020

　　<212> DNA

　　<213> 大肠杆菌

　　<400> 5

　　atgtcgatga taaaaagcta tgccgcaaaa gaagcgggcg gcgaactgga agtttatgag 60

　　tacgatcccg gtgagctgag gccacaagat gttgaagtgc aggtggatta ctgcgggatc 120

　　tgccattccg atctgtcgat gatcgataac gaatggggat tttcacaata tccgctggtt 180

　　gccgggcatg aggtgattgg gcgcgtggtg gcactcggga gcgccgcgca ggataaaggt 240

　　ttgcaggtcg gtcagcgtgt cgggattggc tggacggcgc gtagctgtgg tcactgcgac 300

　　gcctgtatta gcggtaatca gatcaactgc gagcaaggtg cggtgccgac gattatgaat 360

　　cgcggtggct ttgccgagaa gttgcgtgcg gactggcaat gggtgattcc actgccagaa 420

　　aatattgata tcgagtccgc cgggccgctg ttgtgcggcg gtatcacggt ctttaaacca 480

　　ctgttgatgc accatatcac tgctaccagc cgcgttgggg taattggtat tggcgggctg 540

　　gggcatatcg ctataaaact tctgcacgca atgggatgcg aggtgacagc ctttagttct 600

　　aatccggcga aagagcagga agtgctggcg atgggtgccg ataaagtggt gaatagccgc 660

　　gatccgcagg cactgaaagc actggcgggg cagtttgatc tcattatcaa caccgtcaac 720

　　gtcagcctcg actggcagcc ctattttgag gcgctgacct atggcggtaa tttccatacg 780

　　gtcggtgcgg ttctcacgcc gctgtctgtt ccggccttta cgttaattgc gggcgatcgc 840

　　agcgtctctg gttctgctac cggcacgcct tatgagctgc gtaagctgat gcgttttgcc 900

　　gcccgcagca aggttgcgcc gaccaccgaa ctgttcccga tgtcgaaaat taacgacgcc 960

　　atccagcatg tgcgcgacgg taaggcgcgt taccgcgtgg tgttgaaagc cgatttttga 1020

　　<210> 6

　　<211> 473

　　<212> PRT

　　<213> 除烃海杆菌

　　<400> 6

　　Met Lys Arg Leu Gly Thr Leu Asp Ala Ser Trp Leu Ala Val Glu Ser

　　1 5 10 15

　　Glu Asp Thr Pro Met His Val Gly Thr Leu Gln Ile Phe Ser Leu Pro

　　 20 25 30

　　Glu Gly Ala Pro Glu Thr Phe Leu Arg Asp Met Val Thr Arg Met Lys

　　 35 40 45

　　Glu Ala Gly Asp Val Ala Pro Pro Trp Gly Tyr Lys Leu Ala Trp Ser

　　 50 55 60

　　Gly Phe Leu Gly Arg Val Ile Ala Pro Ala Trp Lys Val Asp Lys Asp

　　65 70 75 80

　　Ile Asp Leu Asp Tyr His Val Arg His Ser Ala Leu Pro Arg Pro Gly

　　 85 90 95

　　Gly Glu Arg Glu Leu Gly Ile Leu Val Ser Arg Leu His Ser Asn Pro

　　 100 105 110

　　Leu Asp Phe Ser Arg Pro Leu Trp Glu Cys His Val Ile Glu Gly Leu

　　 115 120 125

　　Glu Asn Asn Arg Phe Ala Leu Tyr Thr Lys Met His His Ser Met Ile

　　 130 135 140

　　Asp Gly Ile Ser Gly Val Arg Leu Met Gln Arg Val Leu Thr Thr Asp

　　145 150 155 160

　　Pro Glu Arg Cys Asn Met Pro Pro Pro Trp Thr Val Arg Pro His Gln

　　 165 170 175

　　Arg Arg Gly Ala Lys Thr Asp Lys Glu Ala Ser Val Pro Ala Ala Val

　　 180 185 190

　　Ser Gln Ala Met Asp Ala Leu Lys Leu Gln Ala Asp Met Ala Pro Arg

　　 195 200 205

　　Leu Trp Gln Ala Gly Asn Arg Leu Val His Ser Val Arg His Pro Glu

　　 210 215 220

　　Asp Gly Leu Thr Ala Pro Phe Thr Gly Pro Val Ser Val Leu Asn His

　　225 230 235 240

　　Arg Val Thr Ala Gln Arg Arg Phe Ala Thr Gln His Tyr Gln Leu Asp

　　 245 250 255

　　Arg Leu Lys Asn Leu Ala His Ala Ser Gly Gly Ser Leu Asn Asp Ile

　　 260 265 270

　　Val Leu Tyr Leu Cys Gly Thr Ala Leu Arg Arg Phe Leu Ala Glu Gln

　　 275 280 285

　　Asn Asn Leu Pro Asp Thr Pro Leu Thr Ala Gly Ile Pro Val Asn Ile

　　 290 295 300

　　Arg Pro Ala Asp Asp Glu Gly Thr Gly Thr Gln Ile Ser Phe Met Ile

　　305 310 315 320

　　Ala Ser Leu Ala Thr Asp Glu Ala Asp Pro Leu Asn Arg Leu Gln Gln

　　 325 330 335

　　Ile Lys Thr Ser Thr Arg Arg Ala Lys Glu His Leu Gln Lys Leu Pro

　　 340 345 350

　　Lys Ser Ala Leu Thr Gln Tyr Thr Met Leu Leu Met Ser Pro Tyr Ile

　　 355 360 365

　　Leu Gln Leu Met Ser Gly Leu Gly Gly Arg Met Arg Pro Val Phe Asn

　　 370 375 380

　　Val Thr Ile Ser Asn Val Pro Gly Pro Glu Gly Thr Leu Tyr Tyr Glu

　　385 390 395 400

　　Gly Ala Arg Leu Glu Ala Met Tyr Pro Val Ser Leu Ile Ala His Gly

　　 405 410 415

　　Gly Ala Leu Asn Ile Thr Cys Leu Ser Tyr Ala Gly Ser Leu Asn Phe

　　 420 425 430

　　Gly Phe Thr Gly Cys Arg Asp Thr Leu Pro Ser Met Gln Lys Leu Ala

　　 435 440 445

　　Val Tyr Thr Gly Glu Ala Leu Asp Glu Leu Glu Ser Leu Ile Leu Pro

　　 450 455 460

　　Pro Lys Lys Arg Ala Arg Thr Arg Lys

　　465 470

　　<210> 7

　　<211> 455

　　<212> PRT

　　<213> 除烃海杆菌

　　<400> 7

　　Met Thr Pro Leu Asn Pro Thr Asp Gln Leu Phe Leu Trp Leu Glu Lys

　　1 5 10 15

　　Arg Gln Gln Pro Met His Val Gly Gly Leu Gln Leu Phe Ser Phe Pro

　　 20 25 30

　　Glu Gly Ala Pro Asp Asp Tyr Val Ala Gln Leu Ala Asp Gln Leu Arg

　　 35 40 45

　　Gln Lys Thr Glu Val Thr Ala Pro Phe Asn Gln Arg Leu Ser Tyr Arg

　　 50 55 60

　　Leu Gly Gln Pro Val Trp Val Glu Asp Glu His Leu Asp Leu Glu His

　　65 70 75 80

　　His Phe Arg Phe Glu Ala Leu Pro Thr Pro Gly Arg Ile Arg Glu Leu

　　 85 90 95

　　Leu Ser Phe Val Ser Ala Glu His Ser His Leu Met Asp Arg Glu Arg

　　 100 105 110

　　Pro Met Trp Glu Val His Leu Ile Glu Gly Leu Lys Asp Arg Gln Phe

　　 115 120 125

　　Ala Leu Tyr Thr Lys Val His His Ser Leu Val Asp Gly Val Ser Ala

　　 130 135 140

　　Met Arg Met Ala Thr Arg Met Leu Ser Glu Asn Pro Asp Glu His Gly

　　145 150 155 160

　　Met Pro Pro Ile Trp Asp Leu Pro Cys Leu Ser Arg Asp Arg Gly Glu

　　 165 170 175

　　Ser Asp Gly His Ser Leu Trp Arg Ser Val Thr His Leu Leu Gly Leu

　　 180 185 190

　　Ser Asp Arg Gln Leu Gly Thr Ile Pro Thr Val Ala Lys Glu Leu Leu

　　 195 200 205

　　Lys Thr Ile Asn Gln Ala Arg Lys Asp Pro Ala Tyr Asp Ser Ile Phe

　　 210 215 220

　　His Ala Pro Arg Cys Met Leu Asn Gln Lys Ile Thr Gly Ser Arg Arg

　　225 230 235 240

　　Phe Ala Ala Gln Ser Trp Cys Leu Lys Arg Ile Arg Ala Val Cys Glu

　　 245 250 255

　　Ala Tyr Gly Thr Thr Val Asn Asp Val Val Thr Ala Met Cys Ala Ala

　　 260 265 270

　　Ala Leu Arg Thr Tyr Leu Met Asn Gln Asp Ala Leu Pro Glu Lys Pro

　　 275 280 285

　　Leu Val Ala Phe Val Pro Val Ser Leu Arg Arg Asp Asp Ser Ser Gly

　　 290 295 300

　　Gly Asn Gln Val Gly Val Ile Leu Ala Ser Leu His Thr Asp Val Gln

　　305 310 315 320

　　Asp Ala Gly Glu Arg Leu Leu Lys Ile His His Gly Met Glu Glu Ala

　　 325 330 335

　　Lys Gln Arg Tyr Arg His Met Ser Pro Glu Glu Ile Val Asn Tyr Thr

　　 340 345 350

　　Ala Leu Thr Leu Ala Pro Ala Ala Phe His Leu Leu Thr Gly Leu Ala

　　 355 360 365

　　Pro Lys Trp Gln Thr Phe Asn Val Val Ile Ser Asn Val Pro Gly Pro

　　 370 375 380

　　Ser Arg Pro Leu Tyr Trp Asn Gly Ala Lys Leu Glu Gly Met Tyr Pro

　　385 390 395 400

　　Val Ser Ile Asp Met Asp Arg Leu Ala Leu Asn Met Thr Leu Thr Ser

　　 405 410 415

　　Tyr Asn Asp Gln Val Glu Phe Gly Leu Ile Gly Cys Arg Arg Thr Leu

　　 420 425 430

　　Pro Ser Leu Gln Arg Met Leu Asp Tyr Leu Glu Gln Gly Leu Ala Glu

　　 435 440 445

　　Leu Glu Leu Asn Ala Gly Leu

　　 450 455

　　<210> 8

　　<211> 457

　　<212> PRT

　　<213> 泊库岛食烷菌

　　<400> 8

　　Met Lys Ala Leu Ser Pro Val Asp Gln Leu Phe Leu Trp Leu Glu Lys

　　1 5 10 15

　　Arg Gln Gln Pro Met His Val Gly Gly Leu Gln Leu Phe Ser Phe Pro

　　 20 25 30

　　Glu Gly Ala Gly Pro Lys Tyr Val Ser Glu Leu Ala Gln Gln Met Arg

　　 35 40 45

　　Asp Tyr Cys His Pro Val Ala Pro Phe Asn Gln Arg Leu Thr Arg Arg

　　 50 55 60

　　Leu Gly Gln Tyr Tyr Trp Thr Arg Asp Lys Gln Phe Asp Ile Asp His

　　65 70 75 80

　　His Phe Arg His Glu Ala Leu Pro Lys Pro Gly Arg Ile Arg Glu Leu

　　 85 90 95

　　Leu Ser Leu Val Ser Ala Glu His Ser Asn Leu Leu Asp Arg Glu Arg

　　 100 105 110

　　Pro Met Trp Glu Ala His Leu Ile Glu Gly Ile Arg Gly Arg Gln Phe

　　 115 120 125

　　Ala Leu Tyr Tyr Lys Ile His His Ser Val Met Asp Gly Ile Ser Ala

　　 130 135 140

　　Met Arg Ile Ala Ser Lys Thr Leu Ser Thr Asp Pro Ser Glu Arg Glu

　　145 150 155 160

　　Met Ala Pro Ala Trp Ala Phe Asn Thr Lys Lys Arg Ser Arg Ser Leu

　　 165 170 175

　　Pro Ser Asn Pro Val Asp Met Ala Ser Ser Met Ala Arg Leu Thr Ala

　　 180 185 190

　　Ser Ile Ser Lys Gln Ala Ala Thr Val Pro Gly Leu Ala Arg Glu Val

　　 195 200 205

　　Tyr Lys Val Thr Gln Lys Ala Lys Lys Asp Glu Asn Tyr Val Ser Ile

　　 210 215 220

　　Phe Gln Ala Pro Asp Thr Ile Leu Asn Asn Thr Ile Thr Gly Ser Arg

　　225 230 235 240

　　Arg Phe Ala Ala Gln Ser Phe Pro Leu Pro Arg Leu Lys Val Ile Ala

　　 245 250 255

　　Lys Ala Tyr Asn Cys Thr Ile Asn Thr Val Val Leu Ser Met Cys Gly

　　 260 265 270

　　His Ala Leu Arg Glu Tyr Leu Ile Ser Gln His Ala Leu Pro Asp Glu

　　 275 280 285

　　Pro Leu Ile Ala Met Val Pro Met Ser Leu Arg Gln Asp Asp Ser Thr

　　 290 295 300

　　Gly Gly Asn Gln Ile Gly Met Ile Leu Ala Asn Leu Gly Thr His Ile

　　305 310 315 320

　　Cys Asp Pro Ala Asn Arg Leu Arg Val Ile His Asp Ser Val Glu Glu

　　 325 330 335

　　Ala Lys Ser Arg Phe Ser Gln Met Ser Pro Glu Glu Ile Leu Asn Phe

　　 340 345 350

　　Thr Ala Leu Thr Met Ala Pro Thr Gly Leu Asn Leu Leu Thr Gly Leu

　　 355 360 365

　　Ala Pro Lys Trp Arg Ala Phe Asn Val Val Ile Ser Asn Ile Pro Gly

　　 370 375 380

　　Pro Lys Glu Pro Leu Tyr Trp Asn Gly Ala Gln Leu Gln Gly Val Tyr

　　385 390 395 400

　　Pro Val Ser Ile Ala Leu Asp Arg Ile Ala Leu Asn Ile Thr Leu Thr

　　 405 410 415

　　Ser Tyr Val Asp Gln Met Glu Phe Gly Leu Ile Ala Cys Arg Arg Thr

　　 420 425 430

　　Leu Pro Ser Met Gln Arg Leu Leu Asp Tyr Leu Glu Gln Ser Ile Arg

　　 435 440 445

　　Glu Leu Glu Ile Gly Ala Gly Ile Lys

　　 450 455

　　<210> 9

　　<211> 70

　　<212> DNA

　　<213> 人工序列

　　<220>

　　<221> 来源

　　<223> /注="人工序列的描述: 合成的寡核苷酸"

　　<400> 9

　　aaaaacagca acaatgtgag ctttgttgta attatattgt aaacatattg attccgggga 60

　　tccgtcgacc 70

　　<210> 10

　　<211> 68

　　<212> DNA

　　<213> 人工序列

　　<220>

　　<221> 来源

　　<223> /注="人工序列的描述: 合成的寡核苷酸"

　　<400> 10

　　aaacggagcc tttcggctcc gttattcatt tacgcggctt caactttcct gtaggctgga 60

　　gctgcttc 68

　　<210> 11

　　<211> 23

　　<212> DNA

　　<213> 人工序列

　　<220>

　　<221> 来源

　　<223> /注="人工序列的描述: 合成的寡核苷酸"

　　<400> 11

　　cgggcaggtg ctatgaccag gac 23

　　<210> 12

　　<211> 23

　　<212> DNA

　　<213> 人工序列

　　<220>

　　<221> 来源

　　<223> /注="人工序列的描述: 合成的寡核苷酸"

　　<400> 12

　　cgcggcgttg accggcagcc tgg 23

　　<210> 13

　　<211> 60

　　<212> DNA

　　<213> 人工序列

　　<220>

　　<221> 来源

　　<223> /注="人工序列的描述: 合成的寡核苷酸"

　　<400> 13

　　ccttggcatt ggcaatttga gaattcgagg aggaaaacta aatgaccatt tcctcacctt 60

　　<210> 14

　　<211> 60

　　<212> DNA

　　<213> 人工序列

　　<220>

　　<221> 来源

　　<223> /注="人工序列的描述: 合成的寡核苷酸"

　　<400> 14

　　ttttgttcgg gcccaagctt ttattgcaaa cgcagatgcg tgatttcacc cgcattcagc 60

　　<210> 15

　　<211> 60

　　<212> DNA

　　<213> 人工序列

　　<220>

　　<221> 来源

　　<223> /注="人工序列的描述: 合成的寡核苷酸"

　　<400> 15

　　cgggcccaag cttcgaattc ttattgcaaa cgcagatgcg tgatttcacc cgcattcagc 60

　　<210> 16

　　<211> 60

　　<212> DNA

　　<213> 人工序列

　　<220>

　　<221> 来源

　　<223> /注="人工序列的描述: 合成的寡核苷酸"

　　<400> 16

　　gaatagcgcc gtcgacgagg aggaaaacta aatgaccatt tcctcacctt tgattgacgt 60

　　<210> 17

　　<211> 60

　　<212> DNA

　　<213> 人工序列

　　<220>

　　<221> 来源

　　<223> /注="人工序列的描述: 合成的寡核苷酸"

　　<400> 17

　　tgatgatgat gatggtcgac ttattgcaaa cgcagatgcg tgatttcacc cgcattcagc 60

　　<210> 18

　　<211> 4250

　　<212> DNA

　　<213> 人工序列

　　<220>

　　<221> 来源

　　<223> /注="人工序列的描述: 合成的多核苷酸"

　　<400> 18

　　atgaccattt cctcaccttt gattgacgtc gccaaccttc cagacatcaa caccactgcc 60

　　ggcaagatcg ccgaccttaa ggctcgccgc gcggaagccc atttccccat gggtgaaaag 120

　　gcagtagaga aggtccacgc tgctggacgc ctcactgccc gtgagcgctt ggattactta 180

　　ctcgatgagg gctccttcat cgagaccgat cagctggctc gccaccgcac caccgctttc 240

　　ggcctgggcg ctaagcgtcc tgcaaccgac ggcatcgtga ccggctgggg caccattgat 300

　　ggacgcgaag tctgcatctt ctcgcaggac ggcaccgtat tcggtggcgc gcttggtgag 360

　　gtgtacggcg aaaagatgat caagatcatg gagctggcaa tcgacaccgg ccgcccattg 420

　　atcggtcttt acgaaggcgc tggcgctcgt attcaggacg gcgctgtctc cctggacttc 480

　　atttcccaga ccttctacca aaacattcag gcttctggcg ttatcccaca gatctccgtc 540

　　atcatgggcg catgtgcagg tggcaacgct tacggcccag ctctgaccga cttcgtggtc 600

　　atggtggaca agacctccaa gatgttcgtt accggcccag acgtgatcaa gaccgtcacc 660

　　ggcgaggaaa tcacccagga agagcttggc ggagcaacca cccacatggt gaccgctggt 720

　　aactcccact acaccgctgc gaccgatgag gaagcactgg attgggtaca ggacctggtg 780

　　tccttcctcc catccaacaa tcgctcctac gcaccgatgg aagacttcga cgaggaagaa 840

　　ggcggcgttg aagaaaacat caccgctgac gatctgaagc tcgacgagat catcccagat 900

　　tccgcgaccg ttccttacga cgtccgcgat gtcatcgaat gcctcaccga cgatggcgaa 960

　　tacctggaaa tccaggcaga ccgcgcagaa aacgttgtta ttgcattcgg ccgcatcgaa 1020

　　ggccagtccg ttggctttgt tgccaaccag ccaacccagt tcgctggctg cctggacatc 1080

　　gactcctctg agaaggcagc tcgcttcgtc cgcacctgcg acgcgttcaa catcccaatc 1140

　　gtcatgcttg tcgacgtccc cggcttcctc ccaggcgcag gccaggagta cggtggcatt 1200

　　ctgcgtcgtg gcgcaaagct gctctacgca tacggcgaag caaccgttcc aaagatcacc 1260

　　gtcaccatgc gtaaggctta cggcggagcg tactgcgtga tgggttccaa gggcttgggc 1320

　　tctgacatca accttgcatg gccaaccgca cagatcgccg tcatgggcgc tgctggcgca 1380

　　gttggattca tctaccgcaa ggagctcatg gcagctgatg ccaagggcct cgataccgta 1440

　　gctctggcta agtccttcga gcgcgagtat gaagaccaca tgctcaaccc gtaccacgct 1500

　　gcagaacgtg gcctgatcga cgccgtgatc ctgccaagcg aaacccgcgg acagatttcc 1560

　　cgcaaccttc gcctgctcaa gcacaagaac gtcactcgcc ctgctcgcaa gcacggcaac 1620

　　atgccactgt aaggaggaaa actaaatgtc agtcgagact cgcaagatca ccaaggttct 1680

　　tgtcgctaac cgtggtgaga ttgcaatccg cgtgttccgt gcagctcgag atgaaggcat 1740

　　cggatctgtc gccgtctacg cagagccaga tgcagatgca ccattcgtgt catatgcaga 1800

　　cgaggctttt gccctcggtg gccaaacatc cgctgagtcc taccttgtca ttgacaagat 1860

　　catcgatgcg gcccgcaagt ccggcgccga cgccatccac cccggctacg gcttcctcgc 1920

　　agaaaacgct gacttcgcag aagcagtcat caacgaaggc ctgatctgga ttggaccttc 1980

　　acctgagtcc atccgctccc tcggcgacaa ggtcaccgct cgccacatcg cagataccgc 2040

　　caaggctcca atggctcctg gcaccaagga accagtaaaa gacgcagcag aagttgtggc 2100

　　tttcgctgaa gaattcggtc tcccaatcgc catcaaggca gctttcggtg gcggcggacg 2160

　　tggcatgaag gttgcctaca agatggaaga agtcgctgac ctcttcgagt ccgcaacccg 2220

　　tgaagcaacc gcagcgttcg gccgcggcga gtgcttcgtg gagcgctacc tggacaaggc 2280

　　acgccacgtt gaggctcagg tcatcgccga taagcacggc aacgttgttg tcgccggaac 2340

　　ccgtgactgc tccctgcagc gccgtttcca gaagctcgtc gaagaagcac cagcaccatt 2400

　　cctcaccgat gaccagcgcg agcgtctcca ctcctccgcg aaggctatct gtaaggaagc 2460

　　tggctactac ggtgcaggca ccgttgagta cctcgttggc tccgacggcc tgatctcctt 2520

　　cctcgaggtc aacacccgcc tccaggtgga acacccagtc accgaagaga ccaccggcat 2580

　　cgacctggtc cgcgaaatgt tccgcatcgc agaaggccac gagctctcca tcaaggaaga 2640

　　tccagctcca cgcggccacg cattcgagtt ccgcatcaac ggcgaagacg ctggctccaa 2700

　　cttcatgcct gcaccaggca agatcaccag ctaccgcgag ccacagggcc caggcgtccg 2760

　　catggactcc ggtgtcgttg aaggttccga aatctccgga cagttcgact ccatgctggc 2820

　　aaagctgatc gtttggggcg acacccgcga gcaggctctc cagcgctccc gccgtgcact 2880

　　tgcagagtac gttgtcgagg gcatgccaac cgttatccca ttccaccagc acatcgtgga 2940

　　aaacccagca ttcgtgggca acgacgaagg cttcgagatc tacaccaagt ggatcgaaga 3000

　　ggtttgggat aacccaatcg caccttacgt tgacgcttcc gagctcgacg aagatgagga 3060

　　caagacccca gcacagaagg ttgttgtgga gatcaacggc cgtcgcgttg aggttgcact 3120

　　cccaggcgat ctggcactcg gtggcaccgc tggtcctaag aagaaggcca agaagcgtcg 3180

　　cgcaggtggt gcaaaggctg gcgtatccgg cgatgcagtg gcagctccaa tgcagggcac 3240

　　tgtcatcaag gtcaacgtcg aagaaggcgc tgaagtcaac gaaggcgaca ccgttgttgt 3300

　　cctcgaggct atgaagatgg aaaaccctgt gaaggctcat aagtccggaa ccgtaaccgg 3360

　　ccttactgtc gctgcaggcg agggtgtcaa caagggcgtt gttctcctcg agatcaagta 3420

　　atctagagga ggaaaactaa atgaatgttg acattagccg ctctcgtgaa ccgttgaacg 3480

　　tggaactgtt gaaagaaaaa ctgctgcaga acggtgattt cggtcaagtg atctacgaga 3540

　　aggtcaccgg ctctaccaat gcggacctgc tggctctggc gggcagcggc gctccaaact 3600

　　ggaccgtcaa gactgttgaa tttcaggacc acgcccgtgg ccgtctgggt cgtccgtgga 3660

　　gcgcaccgga gggttcccaa accatcgtca gcgttctggt ccaactgagc attgatcagg 3720

　　tggaccgtat tggtacgatc ccgctggccg caggcttggc tgttatggat gcgctgaatg 3780

　　atctgggcgt ggagggtgca ggcctgaaat ggccgaacga tgttcagatc cacggtaaga 3840

　　agttgtgcgg tattctggtt gaagcaaccg gcttcgactc cactccgacc gtggttatcg 3900

　　gttggggtac gaatatctcg ttgacgaaag aagagctgcc ggtcccgcac gcgaccagcc 3960

　　tggccctgga gggtgttgaa gttgaccgta cgacgttcct gattaacatg ctgacccatc 4020

　　tgcatacccg tctggatcag tggcagggtc cgtctgtgga ctggctggat gactatcgcg 4080

　　cggtttgtag cagcattggc caagatgtgc gtgtcctgct gcctggtgac aaagagctgc 4140

　　tgggcgaggc gattggcgtg gcgaccggtg gtgagatccg tgtgcgcgac gccagcggca 4200

　　cggtccacac gctgaatgcg ggtgaaatca cgcatctgcg tttgcaataa 4250

　　<210> 19

　　<211> 5659

　　<212> DNA

　　<213> 人工序列

　　<220>

　　<221> 来源

　　<223> /注="人工序列的描述: 合成的多核苷酸"

　　<400> 19

　　atgatcatca aacctaaaat tcgtggattt atctgtacaa caacgcaccc agtgggttgt 60

　　gaagcgaacg taaaagaaca aattgcctac acaaaagcac aaggtccgat caaaaacgca 120

　　cctaagcgcg tgttggttgt cggatcgtct agcggctatg gtctgtcatc acgcatcgct 180

　　gcggcgtttg gcggtggtgc ggcgacgatc ggcgtatttt tcgaaaagcc gggcactgac 240

　　aaaaaaccag gtactgcggg tttctacaat gcagcagcgt ttgacaagct agcgcatgaa 300

　　gcgggcttgt acgcaaaaag cctgaacggc gatgcgttct cgaacgaagc gaagcaaaaa 360

　　gcgattgagc tgattaagca agacctcggc cagattgatt tggtggttta ctcgttggct 420

　　tctccagtgc gtaagatgcc agacacgggt gagctagtgc gctctgcact aaaaccgatc 480

　　ggcgaaacgt acacctctac cgcggtagat accaataaag atgtgatcat tgaagccagt 540

　　gttgaacctg cgaccgagca agaaatcgct gacactgtca ccgtgatggg cggtcaagat 600

　　tgggaactgt ggatccaagc actggaagag gcgggtgttc ttgctgaagg ttgcaaaacc 660

　　gtggcgtaca gctacatcgg tactgaattg acttggccaa tttactggga tggcgcttta 720

　　ggccgtgcca agatggacct agatcgcgca gcgacagcgc tgaacgaaaa gctggcagcg 780

　　aaaggtggta ccgcgaacgt tgcagttttg aaatcagtgg tgactcaagc aagctctgcg 840

　　attcctgtga tgccgctcta catcgcaatg gtgttcaaga agatgcgtga acagggcgtg 900

　　catgaaggct gtatggagca gatctaccgc atgttcagtc aacgtctgta caaagaagat 960

　　ggttcagcgc cggaagtgga tgatcacaat cgtctgcgtt tggatgactg ggaactgcgt 1020

　　gatgacattc agcagcactg ccgtgatctg tggccacaaa tcaccacaga gaacctgcgt 1080

　　gagctgaccg attacgacat gtacaaagaa gagttcatca agctgtttgg ctttggcatt 1140

　　gaaggcattg attacgatgc tgacgtcaat ccagaagtcg aatttgatgt gattgatatc 1200

　　gagtaattta gtgactgagc gtacatgtat acgaagatta ttggtactgg cagctatctg 1260

　　cccgaacaag tgcggactaa cgccgatctg gaaaaaatgg ttgagacctc tgacgagtgg 1320

　　attgtcactc gtacaggtat tcgtaaacgc catatcgccg cgccgaatga aactgtcgcg 1380

　　acgatgggct ttaccgctgc gaatcgcgcg attgagatgg cggggatcga taaagaccaa 1440

　　attggcttga ttgtggtggc taccacatca gcaacgcatg catttccaag cgcggcatgt 1500

　　cagattcaaa gtatgctcgg tattaaaggt tgcccggcgt ttgatgtcgc ggcagcgtgc 1560

　　gcaggtttca cctacgcgtt aagcatcgcc gaccagtacg ttaaatccgg cgcggttaaa 1620

　　cacgcgctgg tggtcggttc cgatgtatta gcccgcactt gcgatcctgg cgatcgcggt 1680

　　acgatcatta ttttcggcga tggcgcaggc gcggccgtac tgagcgcttc tgaagaaccg 1740

　　ggtattatct ccactcatct tcatgccgat ggccgttacg gtgaattact gaccctgccg 1800

　　aatgccgatc gcgtaaatcc ggataacccg atttacctga caatggcggg caatgaagtc 1860

　　tttaaagtgg cggtcactga actggcgcat attgtcgatg agacgctggc ggctaataac 1920

　　ctggatcgct cagaactcga ttggctggtg ccgcatcagg ctaacctgcg tatcattagc 1980

　　gcgacagcga aaaaactcgg catgtcgatg gacaatgtcg tcgtcacgct ggacaggcac 2040

　　ggcaatacct ccgcggcttc tgtgccgtgc gcgctggatg aagccgtgcg tgacgggcga 2100

　　attaaagccg gtcagctggt attgcttgaa gccttcgggg gtggattcac ctggggctcc 2160

　　gcgctgattc gtttctagta taaggattta aacatgacgc aatttgcatt tgtgttcccc 2220

　　ggtcagggtt ctcagagcgt tgggatgttg gccgagatgg cggcaaatta ccctatcgta 2280

　　gaagaaacgt ttgctgaagc ttctgcggct ctgggatatg atctgtgggc gctcacccag 2340

　　caaggtccag cggaagaact gaataaaacc tggcagacgc agccggcgtt attaaccgct 2400

　　tccgtcgcgc tttggcgcgt ttggcagcag cagggcggta aaatgcctgc gttaatggca 2460

　　ggtcacagcc tgggcgaata ttccgcgctg gtttgcgctg gcgtcatcaa ctttgctgat 2520

　　gccgttcgtc tggtggaaat gcgcggtaaa ttcatgcagg aagcggttcc ggaaggcact 2580

　　ggcggcatgt ctgcgatcat cgggctggat gatgcctcta ttgctaaagc ctgtgaagaa 2640

　　tctgccgaag ggcaggttgt ttcgccggtt aactttaact cgccgggaca ggtggttatc 2700

　　gccgggcata aagaggcggt agaacgtgcg ggcgcagcct gtaaagccgc tggcgcgaaa 2760

　　cgcgcgctgc cgctgccggt gagcgtaccg tcgcactgcg cgctgatgaa accagcggca 2820

　　gataagctgg cggttgaatt agccaaaatt acctttagcg cgccaacggt gccggtagtg 2880

　　aacaacgttg acgtgaaatg tgaaaccgat gccgccgcta tccgcgatgc gctggttcgc 2940

　　cagttgtaca atccggtaca gtggacgaag agcgtggaat ttatcgcggc gcagggcgtt 3000

　　gaacatcttt atgaagtggg tccaggtaaa gtcctcactg gtctgacgaa acgtattgtc 3060

　　gacaccctga cagcgtcggc gctgaacgag ccggcggcgc tgtctgcggc acttacgcaa 3120

　　taaaagagga aaaccatgag ctttgaagga aagattgcgc tggtgactgg tgcaagccgt 3180

　　ggcataggcc gcgcaattgc agagactctc gttgcccgcg gcgcgaaagt tatcgggact 3240

　　gcgaccagtg aaaatggtgc gaagaacatt agcgactatt taggtgctaa cgggaaaggt 3300

　　ttgatgttga atgtgaccga tcctgcatct attgaatctg ttctggaaaa tattcgcgca 3360

　　gaatttggtg aagtggatat cctggttaat aatgccggta tcactcgtga taatctgttg 3420

　　atgcgaatga aagatgatga gtggaacgat attatcgaaa ccaacttatc atccgttttc 3480

　　cgcctgtcaa aagcggtaat gcgcgctatg atgaaaaagc gttgtggtcg cattatcact 3540

　　attggttctg tggttggtac catgggaaat gcaggtcagg caaactacgc tgcggcgaaa 3600

　　gcgggcctga tcggtttcag taaatcactg gcgcgtgaag ttgcgtcccg tggtattact 3660

　　gtcaatgttg tggctccggg ttttattgaa acggacatga cgcgtgcgct gtctgacgat 3720

　　cagcgtgcgg gtatcctggc gcaggtgcct gcgggtcgcc tcggcggcgc tcaggaaatc 3780

　　gccagtgcgg ttgcattttt agcctctgac gaagcgagtt acatcactgg tgagactctg 3840

　　cacgtcaacg gcggaatgta catggtttaa ttttaaggtt tacataaaac atggtagata 3900

　　aacgcgaatc ctatacaaaa gaagaccttc ttgcctctgg tcgtggtgaa ctgtttggcg 3960

　　ctaaagggcc gcaactccct gcaccgaaca tgctgatgat ggaccgcgtc gttaagatga 4020

　　ccgaaacggg cggcaatttc gacaaaggct atgtcgaagc cgagctggat atcaatccgg 4080

　　atctatggtt cttcggatgc cactttatcg gcgatccggt gatgcccggt tgtctgggtc 4140

　　tggatgctat gtggcaattg gtgggattct acctgggctg gttgggcggc gaaggcaaag 4200

　　gccgcgctct gggcgtgggc gaagtgaaat ttaccggcca ggttctgccg acagccagga 4260

　　aagtcaccta tcgtattcat ttcaaacgta tcgtaaaccg tcgcctgatc atgggcctgg 4320

　　cggacggtga ggttctggtg gatggtcgcc tgatctatac cgcacacgat ttgaaagtcg 4380

　　gtttgttcca ggatacttcc gcgttctaaa aggaggcaac aaaatgaatc gccgcgttgt 4440

　　cattacgggt attggtgcag tgacgccggt gggtaacaac gctgatagct tctggtgcag 4500

　　catcaaagag ggtaaatgtg gcattgacaa gatcaaagcg tttgacgcaa ccgatttcaa 4560

　　agttaagctg gctgccgaag tgaaggactt caccccggag gactttatcg acaagcgtga 4620

　　ggcgaaccgt atggaccgtt ttagccagtt tgcgatcgtt gcggcggatg aggcaatcaa 4680

　　ggacagcaaa ctggacctgg agtcgattga taagaatcgt ttcggcgtca ttgttggtag 4740

　　cggcattggc ggcatcggca ccattgagaa gcaggatgaa aagctgatta ccaaaggtcc 4800

　　gggtcgtgtg agccctatga ctattccgat gatcattgcg aatatggcaa gcggtaatct 4860

　　ggcgattcgt tatggcgcta aaggtatttg cacgaccatt gtcaccgcat gtgcgagcgc 4920

　　gaacaacagc attggtgagt ccttccgtaa cattaagttt ggttatagcg acgttatgat 4980

　　ctctggtggt agcgaagcag gtatcacccc gttgagcctg gcgggttttg cctcgatgaa 5040

　　ggccgtgacc aaatctgagg acccgaagcg cgccagcatc ccgttcgata aggatcgcag 5100

　　cggttttgtg atgggcgagg gcagcggtat cgttatcttg gaagagttgg agcacgcgct 5160

　　gaagcgtggt gccaaaatct atgccgagat cgttggctat ggtgcgacct gcgacgcata 5220

　　tcatatcacg agcccagcgc cgaatggtga aggtggtgca cgtgcaatga aactggcaat 5280

　　ggaagaagat aatgtccgcc cagaggacat ttcctatatc aacgcgcacg gtacgagcac 5340

　　ggcgtacaat gacagcttcg aaacccaagc gatcaagacg gtcctgggtg aatacgccta 5400

　　caaagtgccg gtgtctagca ccaagagcat gaccggccac ctgctgggcg ctggcggtgc 5460

　　agtcgaagcg attatctgtg ccaaagctat tgaagagggt ttcattccgc cgaccatcgg 5520

　　ctacaaagag gcggatccgg aatgcgacct ggattacgtt cctaacgagg gccgtaatgc 5580

　　agaagtcaac tacgttctgt ccaacagcct gggcttcggt ggccataatg cgactctgct 5640

　　gttcaaaaag tacaaatga 5659

　　<210> 20

　　<211> 75

　　<212> DNA

　　<213> 人工序列

　　<220>

　　<221> 来源

　　<223> /注="人工序列的描述: 合成的寡核苷酸"

　　<400> 20

　　ttgtccatct ttatataatt tgggggtagg gtgttcttta tgtaaaaaaa acgttttagg 60

　　atgcatatgg cggcc 75

　　<210> 21

　　<211> 75

　　<212> DNA

　　<213> 人工序列

　　<220>

　　<221> 来源

　　<223> /注="人工序列的描述: 合成的寡核苷酸"

　　<400> 21

　　gataaatcca cgaattttag gtttgatgat cattggtctc ctcctgcagg tgcgtgttcg 60

　　tcgtcatcgc aattg 75

　　<210> 22

　　<211> 30

　　<212> DNA

　　<213> 人工序列

　　<220>

　　<221> 来源

　　<223> /注="人工序列的描述: 合成的寡核苷酸"

　　<400> 22

　　actcaccgca ttggtgtagt aaggcgcacc 30

　　<210> 23

　　<211> 30

　　<212> DNA

　　<213> 人工序列

　　<220>

　　<221> 来源

　　<223> /注="人工序列的描述: 合成的寡核苷酸"

　　<400> 23

　　tgaatgtcat cacgcagttc ccagtcatcc 30

　　<210> 24

　　<211> 33

　　<212> DNA

　　<213> 人工序列

　　<220>

　　<221> 来源

　　<223> /注="人工序列的描述: 合成的寡核苷酸"

　　<400> 24

　　ccatcttctt tgtacagacg ttgactgaac atg 33

　　<210> 25

　　<211> 30

　　<212> DNA

　　<213> 人工序列

　　<220>

　　<221> 来源

　　<223> /注="人工序列的描述: 合成的寡核苷酸"

　　<400> 25

　　gcaccatagc cgtaatccca caggttatag 30

　　<210> 26

　　<211> 25

　　<212> DNA

　　<213> 人工序列

　　<220>

　　<221> 来源

　　<223> /注="人工序列的描述: 合成的寡核苷酸"

　　<400> 26

　　tgtcattaat ggttaataat gttga 25

　　<210> 27

　　<211> 40

　　<212> DNA

　　<213> 人工序列

　　<220>

　　<221> 来源

　　<223> /注="人工序列的描述: 合成的寡核苷酸"

　　<400> 27

　　gcagttattg gtgcccttaa acgcctggtt gctacgcctg 40

　　<210> 28

　　<211> 27

　　<212> DNA

　　<213> 人工序列

　　<220>

　　<221> 来源

　　<223> /注="人工序列的描述: 合成的寡核苷酸"

　　<400> 28

　　gagccaatat gcgagaacac ccgagaa 27

　　<210> 29

　　<211> 48

　　<212> DNA

　　<213> 人工序列

　　<220>

　　<221> 来源

　　<223> /注="人工序列的描述: 合成的寡核苷酸"

　　<400> 29

　　cgctgaacgt attgcaggcc gagttgctgc accgctcccg ccaggcag 48

　　<210> 30

　　<211> 51

　　<212> DNA

　　<213> 人工序列

　　<220>

　　<221> 来源

　　<223> /注="人工序列的描述: 合成的寡核苷酸"

　　<400> 30

　　ggaattgcca cggtgcggca ggctccatac gcgaggccag gttatccaac g 51

　　<210> 31

　　<211> 35

　　<212> DNA

　　<213> 人工序列

　　<220>

　　<221> 来源

　　<223> /注="人工序列的描述: 合成的寡核苷酸"

　　<400> 31

　　aatcaccagc actaaagtgc gcggttcgtt acccg 35

　　<210> 32

　　<211> 34

　　<212> DNA

　　<213> 人工序列

　　<220>

　　<221> 来源

　　<223> /注="人工序列的描述: 合成的寡核苷酸"

　　<400> 32

　　atctgccgtg gattgcagag tctattcagc tacg 34

　　<210> 33

　　<211> 1168

　　<212> PRT

　　<213> 耻垢分枝杆菌

　　<400> 33

　　Met Thr Ile Glu Thr Arg Glu Asp Arg Phe Asn Arg Arg Ile Asp His

　　1 5 10 15

　　Leu Phe Glu Thr Asp Pro Gln Phe Ala Ala Ala Arg Pro Asp Glu Ala

　　 20 25 30

　　Ile Ser Ala Ala Ala Ala Asp Pro Glu Leu Arg Leu Pro Ala Ala Val

　　 35 40 45

　　Lys Gln Ile Leu Ala Gly Tyr Ala Asp Arg Pro Ala Leu Gly Lys Arg

　　 50 55 60

　　Ala Val Glu Phe Val Thr Asp Glu Glu Gly Arg Thr Thr Ala Lys Leu

　　65 70 75 80

　　Leu Pro Arg Phe Asp Thr Ile Thr Tyr Arg Gln Leu Ala Gly Arg Ile

　　 85 90 95

　　Gln Ala Val Thr Asn Ala Trp His Asn His Pro Val Asn Ala Gly Asp

　　 100 105 110

　　Arg Val Ala Ile Leu Gly Phe Thr Ser Val Asp Tyr Thr Thr Ile Asp

　　 115 120 125

　　Ile Ala Leu Leu Glu Leu Gly Ala Val Ser Val Pro Leu Gln Thr Ser

　　 130 135 140

　　Ala Pro Val Ala Gln Leu Gln Pro Ile Val Ala Glu Thr Glu Pro Lys

　　145 150 155 160

　　Val Ile Ala Ser Ser Val Asp Phe Leu Ala Asp Ala Val Ala Leu Val

　　 165 170 175

　　Glu Ser Gly Pro Ala Pro Ser Arg Leu Val Val Phe Asp Tyr Ser His

　　 180 185 190

　　Glu Val Asp Asp Gln Arg Glu Ala Phe Glu Ala Ala Lys Gly Lys Leu

　　 195 200 205

　　Ala Gly Thr Gly Val Val Val Glu Thr Ile Thr Asp Ala Leu Asp Arg

　　 210 215 220

　　Gly Arg Ser Leu Ala Asp Ala Pro Leu Tyr Val Pro Asp Glu Ala Asp

　　225 230 235 240

　　Pro Leu Thr Leu Leu Ile Tyr Thr Ser Gly Ser Thr Gly Thr Pro Lys

　　 245 250 255

　　Gly Ala Met Tyr Pro Glu Ser Lys Thr Ala Thr Met Trp Gln Ala Gly

　　 260 265 270

　　Ser Lys Ala Arg Trp Asp Glu Thr Leu Gly Val Met Pro Ser Ile Thr

　　 275 280 285

　　Leu Asn Phe Met Pro Met Ser His Val Met Gly Arg Gly Ile Leu Cys

　　 290 295 300

　　Ser Thr Leu Ala Ser Gly Gly Thr Ala Tyr Phe Ala Ala Arg Ser Asp

　　305 310 315 320

　　Leu Ser Thr Phe Leu Glu Asp Leu Ala Leu Val Arg Pro Thr Gln Leu

　　 325 330 335

　　Asn Phe Val Pro Arg Ile Trp Asp Met Leu Phe Gln Glu Tyr Gln Ser

　　 340 345 350

　　Arg Leu Asp Asn Arg Arg Ala Glu Gly Ser Glu Asp Arg Ala Glu Ala

　　 355 360 365

　　Ala Val Leu Glu Glu Val Arg Thr Gln Leu Leu Gly Gly Arg Phe Val

　　 370 375 380

　　Ser Ala Leu Thr Gly Ser Ala Pro Ile Ser Ala Glu Met Lys Ser Trp

　　385 390 395 400

　　Val Glu Asp Leu Leu Asp Met His Leu Leu Glu Gly Tyr Gly Ser Thr

　　 405 410 415

　　Glu Ala Gly Ala Val Phe Ile Asp Gly Gln Ile Gln Arg Pro Pro Val

　　 420 425 430

　　Ile Asp Tyr Lys Leu Val Asp Val Pro Asp Leu Gly Tyr Phe Ala Thr

　　 435 440 445

　　Asp Arg Pro Tyr Pro Arg Gly Glu Leu Leu Val Lys Ser Glu Gln Met

　　 450 455 460

　　Phe Pro Gly Tyr Tyr Lys Arg Pro Glu Ile Thr Ala Glu Met Phe Asp

　　465 470 475 480

　　Glu Asp Gly Tyr Tyr Arg Thr Gly Asp Ile Val Ala Glu Leu Gly Pro

　　 485 490 495

　　Asp His Leu Glu Tyr Leu Asp Arg Arg Asn Asn Val Leu Lys Leu Ser

　　 500 505 510

　　Gln Gly Glu Phe Val Thr Val Ser Lys Leu Glu Ala Val Phe Gly Asp

　　 515 520 525

　　Ser Pro Leu Val Arg Gln Ile Tyr Val Tyr Gly Asn Ser Ala Arg Ser

　　 530 535 540

　　Tyr Leu Leu Ala Val Val Val Pro Thr Glu Glu Ala Leu Ser Arg Trp

　　545 550 555 560

　　Asp Gly Asp Glu Leu Lys Ser Arg Ile Ser Asp Ser Leu Gln Asp Ala

　　 565 570 575

　　Ala Arg Ala Ala Gly Leu Gln Ser Tyr Glu Ile Pro Arg Asp Phe Leu

　　 580 585 590

　　Val Glu Thr Thr Pro Phe Thr Leu Glu Asn Gly Leu Leu Thr Gly Ile

　　 595 600 605

　　Arg Lys Leu Ala Arg Pro Lys Leu Lys Ala His Tyr Gly Glu Arg Leu

　　 610 615 620

　　Glu Gln Leu Tyr Thr Asp Leu Ala Glu Gly Gln Ala Asn Glu Leu Arg

　　625 630 635 640

　　Glu Leu Arg Arg Asn Gly Ala Asp Arg Pro Val Val Glu Thr Val Ser

　　 645 650 655

　　Arg Ala Ala Val Ala Leu Leu Gly Ala Ser Val Thr Asp Leu Arg Ser

　　 660 665 670

　　Asp Ala His Phe Thr Asp Leu Gly Gly Asp Ser Leu Ser Ala Leu Ser

　　 675 680 685

　　Phe Ser Asn Leu Leu His Glu Ile Phe Asp Val Asp Val Pro Val Gly

　　 690 695 700

　　Val Ile Val Ser Pro Ala Thr Asp Leu Ala Gly Val Ala Ala Tyr Ile

　　705 710 715 720

　　Glu Gly Glu Leu Arg Gly Ser Lys Arg Pro Thr Tyr Ala Ser Val His

　　 725 730 735

　　Gly Arg Asp Ala Thr Glu Val Arg Ala Arg Asp Leu Ala Leu Gly Lys

　　 740 745 750

　　Phe Ile Asp Ala Lys Thr Leu Ser Ala Ala Pro Gly Leu Pro Arg Ser

　　 755 760 765

　　Gly Thr Glu Ile Arg Thr Val Leu Leu Thr Gly Ala Thr Gly Phe Leu

　　 770 775 780

　　Gly Arg Tyr Leu Ala Leu Glu Trp Leu Glu Arg Met Asp Leu Val Asp

　　785 790 795 800

　　Gly Lys Val Ile Cys Leu Val Arg Ala Arg Ser Asp Asp Glu Ala Arg

　　 805 810 815

　　Ala Arg Leu Asp Ala Thr Phe Asp Thr Gly Asp Ala Thr Leu Leu Glu

　　 820 825 830

　　His Tyr Arg Ala Leu Ala Ala Asp His Leu Glu Val Ile Ala Gly Asp

　　 835 840 845

　　Lys Gly Glu Ala Asp Leu Gly Leu Asp His Asp Thr Trp Gln Arg Leu

　　 850 855 860

　　Ala Asp Thr Val Asp Leu Ile Val Asp Pro Ala Ala Leu Val Asn His

　　865 870 875 880

　　Val Leu Pro Tyr Ser Gln Met Phe Gly Pro Asn Ala Leu Gly Thr Ala

　　 885 890 895

　　Glu Leu Ile Arg Ile Ala Leu Thr Thr Thr Ile Lys Pro Tyr Val Tyr

　　 900 905 910

　　Val Ser Thr Ile Gly Val Gly Gln Gly Ile Ser Pro Glu Ala Phe Val

　　 915 920 925

　　Glu Asp Ala Asp Ile Arg Glu Ile Ser Ala Thr Arg Arg Val Asp Asp

　　 930 935 940

　　Ser Tyr Ala Asn Gly Tyr Gly Asn Ser Lys Trp Ala Gly Glu Val Leu

　　945 950 955 960

　　Leu Arg Glu Ala His Asp Trp Cys Gly Leu Pro Val Ser Val Phe Arg

　　 965 970 975

　　Cys Asp Met Ile Leu Ala Asp Thr Thr Tyr Ser Gly Gln Leu Asn Leu

　　 980 985 990

　　Pro Asp Met Phe Thr Arg Leu Met Leu Ser Leu Val Ala Thr Gly Ile

　　 995 1000 1005

　　Ala Pro Gly Ser Phe Tyr Glu Leu Asp Ala Asp Gly Asn Arg Gln

　　 1010 1015 1020

　　Arg Ala His Tyr Asp Gly Leu Pro Val Glu Phe Ile Ala Glu Ala

　　 1025 1030 1035

　　Ile Ser Thr Ile Gly Ser Gln Val Thr Asp Gly Phe Glu Thr Phe

　　 1040 1045 1050

　　His Val Met Asn Pro Tyr Asp Asp Gly Ile Gly Leu Asp Glu Tyr

　　 1055 1060 1065

　　Val Asp Trp Leu Ile Glu Ala Gly Tyr Pro Val His Arg Val Asp

　　 1070 1075 1080

　　Asp Tyr Ala Thr Trp Leu Ser Arg Phe Glu Thr Ala Leu Arg Ala

　　 1085 1090 1095

　　Leu Pro Glu Arg Gln Arg Gln Ala Ser Leu Leu Pro Leu Leu His

　　 1100 1105 1110

　　Asn Tyr Gln Gln Pro Ser Pro Pro Val Cys Gly Ala Met Ala Pro

　　 1115 1120 1125

　　Thr Asp Arg Phe Arg Ala Ala Val Gln Asp Ala Lys Ile Gly Pro

　　 1130 1135 1140

　　Asp Lys Asp Ile Pro His Val Thr Ala Asp Val Ile Val Lys Tyr

　　 1145 1150 1155

　　Ile Ser Asn Leu Gln Met Leu Gly Leu Leu

　　 1160 1165

　　<210> 34

　　<211> 1168

　　<212> PRT

　　<213> 结核分支杆菌

　　<400> 34

　　Met Ser Ile Asn Asp Gln Arg Leu Thr Arg Arg Val Glu Asp Leu Tyr

　　1 5 10 15

　　Ala Ser Asp Ala Gln Phe Ala Ala Ala Ser Pro Asn Glu Ala Ile Thr

　　 20 25 30

　　Gln Ala Ile Asp Gln Pro Gly Val Ala Leu Pro Gln Leu Ile Arg Met

　　 35 40 45

　　Val Met Glu Gly Tyr Ala Asp Arg Pro Ala Leu Gly Gln Arg Ala Leu

　　 50 55 60

　　Arg Phe Val Thr Asp Pro Asp Ser Gly Arg Thr Met Val Glu Leu Leu

　　65 70 75 80

　　Pro Arg Phe Glu Thr Ile Thr Tyr Arg Glu Leu Trp Ala Arg Ala Gly

　　 85 90 95

　　Thr Leu Ala Thr Ala Leu Ser Ala Glu Pro Ala Ile Arg Pro Gly Asp

　　 100 105 110

　　Arg Val Cys Val Leu Gly Phe Asn Ser Val Asp Tyr Thr Thr Ile Asp

　　 115 120 125

　　Ile Ala Leu Ile Arg Leu Gly Ala Val Ser Val Pro Leu Gln Thr Ser

　　 130 135 140

　　Ala Pro Val Thr Gly Leu Arg Pro Ile Val Thr Glu Thr Glu Pro Thr

　　145 150 155 160

　　Met Ile Ala Thr Ser Ile Asp Asn Leu Gly Asp Ala Val Glu Val Leu

　　 165 170 175

　　Ala Gly His Ala Pro Ala Arg Leu Val Val Phe Asp Tyr His Gly Lys

　　 180 185 190

　　Val Asp Thr His Arg Glu Ala Val Glu Ala Ala Arg Ala Arg Leu Ala

　　 195 200 205

　　Gly Ser Val Thr Ile Asp Thr Leu Ala Glu Leu Ile Glu Arg Gly Arg

　　 210 215 220

　　Ala Leu Pro Ala Thr Pro Ile Ala Asp Ser Ala Asp Asp Ala Leu Ala

　　225 230 235 240

　　Leu Leu Ile Tyr Thr Ser Gly Ser Thr Gly Ala Pro Lys Gly Ala Met

　　 245 250 255

　　Tyr Arg Glu Ser Gln Val Met Ser Phe Trp Arg Lys Ser Ser Gly Trp

　　 260 265 270

　　Phe Glu Pro Ser Gly Tyr Pro Ser Ile Thr Leu Asn Phe Met Pro Met

　　 275 280 285

　　Ser His Val Gly Gly Arg Gln Val Leu Tyr Gly Thr Leu Ser Asn Gly

　　 290 295 300

　　Gly Thr Ala Tyr Phe Val Ala Lys Ser Asp Leu Ser Thr Leu Phe Glu

　　305 310 315 320

　　Asp Leu Ala Leu Val Arg Pro Thr Glu Leu Cys Phe Val Pro Arg Ile

　　 325 330 335

　　Trp Asp Met Val Phe Ala Glu Phe His Ser Glu Val Asp Arg Arg Leu

　　 340 345 350

　　Val Asp Gly Ala Asp Arg Ala Ala Leu Glu Ala Gln Val Lys Ala Glu

　　 355 360 365

　　Leu Arg Glu Asn Val Leu Gly Gly Arg Phe Val Met Ala Leu Thr Gly

　　 370 375 380

　　Ser Ala Pro Ile Ser Ala Glu Met Thr Ala Trp Val Glu Ser Leu Leu

　　385 390 395 400

　　Ala Asp Val His Leu Val Glu Gly Tyr Gly Ser Thr Glu Ala Gly Met

　　 405 410 415

　　Val Leu Asn Asp Gly Met Val Arg Arg Pro Ala Val Ile Asp Tyr Lys

　　 420 425 430

　　Leu Val Asp Val Pro Glu Leu Gly Tyr Phe Gly Thr Asp Gln Pro Tyr

　　 435 440 445

　　Pro Arg Gly Glu Leu Leu Val Lys Thr Gln Thr Met Phe Pro Gly Tyr

　　 450 455 460

　　Tyr Gln Arg Pro Asp Val Thr Ala Glu Val Phe Asp Pro Asp Gly Phe

　　465 470 475 480

　　Tyr Arg Thr Gly Asp Ile Met Ala Lys Val Gly Pro Asp Gln Phe Val

　　 485 490 495

　　Tyr Leu Asp Arg Arg Asn Asn Val Leu Lys Leu Ser Gln Gly Glu Phe

　　 500 505 510

　　Ile Ala Val Ser Lys Leu Glu Ala Val Phe Gly Asp Ser Pro Leu Val

　　 515 520 525

　　Arg Gln Ile Phe Ile Tyr Gly Asn Ser Ala Arg Ala Tyr Pro Leu Ala

　　 530 535 540

　　Val Val Val Pro Ser Gly Asp Ala Leu Ser Arg His Gly Ile Glu Asn

　　545 550 555 560

　　Leu Lys Pro Val Ile Ser Glu Ser Leu Gln Glu Val Ala Arg Ala Ala

　　 565 570 575

　　Gly Leu Gln Ser Tyr Glu Ile Pro Arg Asp Phe Ile Ile Glu Thr Thr

　　 580 585 590

　　Pro Phe Thr Leu Glu Asn Gly Leu Leu Thr Gly Ile Arg Lys Leu Ala

　　 595 600 605

　　Arg Pro Gln Leu Lys Lys Phe Tyr Gly Glu Arg Leu Glu Arg Leu Tyr

　　 610 615 620

　　Thr Glu Leu Ala Asp Ser Gln Ser Asn Glu Leu Arg Glu Leu Arg Gln

　　625 630 635 640

　　Ser Gly Pro Asp Ala Pro Val Leu Pro Thr Leu Cys Arg Ala Ala Ala

　　 645 650 655

　　Ala Leu Leu Gly Ser Thr Ala Ala Asp Val Arg Pro Asp Ala His Phe

　　 660 665 670

　　Ala Asp Leu Gly Gly Asp Ser Leu Ser Ala Leu Ser Leu Ala Asn Leu

　　 675 680 685

　　Leu His Glu Ile Phe Gly Val Asp Val Pro Val Gly Val Ile Val Ser

　　 690 695 700

　　Pro Ala Ser Asp Leu Arg Ala Leu Ala Asp His Ile Glu Ala Ala Arg

　　705 710 715 720

　　Thr Gly Val Arg Arg Pro Ser Phe Ala Ser Ile His Gly Arg Ser Ala

　　 725 730 735

　　Thr Glu Val His Ala Ser Asp Leu Thr Leu Asp Lys Phe Ile Asp Ala

　　 740 745 750

　　Ala Thr Leu Ala Ala Ala Pro Asn Leu Pro Ala Pro Ser Ala Gln Val

　　 755 760 765

　　Arg Thr Val Leu Leu Thr Gly Ala Thr Gly Phe Leu Gly Arg Tyr Leu

　　 770 775 780

　　Ala Leu Glu Trp Leu Asp Arg Met Asp Leu Val Asn Gly Lys Leu Ile

　　785 790 795 800

　　Cys Leu Val Arg Ala Arg Ser Asp Glu Glu Ala Gln Ala Arg Leu Asp

　　 805 810 815

　　Ala Thr Phe Asp Ser Gly Asp Pro Tyr Leu Val Arg His Tyr Arg Glu

　　 820 825 830

　　Leu Gly Ala Gly Arg Leu Glu Val Leu Ala Gly Asp Lys Gly Glu Ala

　　 835 840 845

　　Asp Leu Gly Leu Asp Arg Val Thr Trp Gln Arg Leu Ala Asp Thr Val

　　 850 855 860

　　Asp Leu Ile Val Asp Pro Ala Ala Leu Val Asn His Val Leu Pro Tyr

　　865 870 875 880

　　Ser Gln Leu Phe Gly Pro Asn Ala Ala Gly Thr Ala Glu Leu Leu Arg

　　 885 890 895

　　Leu Ala Leu Thr Gly Lys Arg Lys Pro Tyr Ile Tyr Thr Ser Thr Ile

　　 900 905 910

　　Ala Val Gly Glu Gln Ile Pro Pro Glu Ala Phe Thr Glu Asp Ala Asp

　　 915 920 925

　　Ile Arg Ala Ile Ser Pro Thr Arg Arg Ile Asp Asp Ser Tyr Ala Asn

　　 930 935 940

　　Gly Tyr Ala Asn Ser Lys Trp Ala Gly Glu Val Leu Leu Arg Glu Ala

　　945 950 955 960

　　His Glu Gln Cys Gly Leu Pro Val Thr Val Phe Arg Cys Asp Met Ile

　　 965 970 975

　　Leu Ala Asp Thr Ser Tyr Thr Gly Gln Leu Asn Leu Pro Asp Met Phe

　　 980 985 990

　　Thr Arg Leu Met Leu Ser Leu Ala Ala Thr Gly Ile Ala Pro Gly Ser

　　 995 1000 1005

　　Phe Tyr Glu Leu Asp Ala His Gly Asn Arg Gln Arg Ala His Tyr

　　 1010 1015 1020

　　Asp Gly Leu Pro Val Glu Phe Val Ala Glu Ala Ile Cys Thr Leu

　　 1025 1030 1035

　　Gly Thr His Ser Pro Asp Arg Phe Val Thr Tyr His Val Met Asn

　　 1040 1045 1050

　　Pro Tyr Asp Asp Gly Ile Gly Leu Asp Glu Phe Val Asp Trp Leu

　　 1055 1060 1065

　　Asn Ser Pro Thr Ser Gly Ser Gly Cys Thr Ile Gln Arg Ile Ala

　　 1070 1075 1080

　　Asp Tyr Gly Glu Trp Leu Gln Arg Phe Glu Thr Ser Leu Arg Ala

　　 1085 1090 1095

　　Leu Pro Asp Arg Gln Arg His Ala Ser Leu Leu Pro Leu Leu His

　　 1100 1105 1110

　　Asn Tyr Arg Glu Pro Ala Lys Pro Ile Cys Gly Ser Ile Ala Pro

　　 1115 1120 1125

　　Thr Asp Gln Phe Arg Ala Ala Val Gln Glu Ala Lys Ile Gly Pro

　　 1130 1135 1140

　　Asp Lys Asp Ile Pro His Leu Thr Ala Ala Ile Ile Ala Lys Tyr

　　 1145 1150 1155

　　Ile Ser Asn Leu Arg Leu Leu Gly Leu Leu

　　 1160 1165

　　<210> 35

　　<211> 696

　　<212> DNA

　　<213> 细长聚球藻

　　<400> 35

　　atgccgcagc ttgaagccag ccttgaactg gactttcaaa gcgagtccta caaagacgct 60

　　tacagccgca tcaacgcgat cgtgattgaa ggcgaacaag aggcgttcga caactacaat 120

　　cgccttgctg agatgctgcc cgaccagcgg gatgagcttc acaagctagc caagatggaa 180

　　cagcgccaca tgaaaggctt tatggcctgt ggcaaaaatc tctccgtcac tcctgacatg 240

　　ggttttgccc agaaattttt cgagcgcttg cacgagaact tcaaagcggc ggctgcggaa 300

　　ggcaaggtcg tcacctgcct actgattcaa tcgctaatca tcgagtgctt tgcgatcgcg 360

　　gcttacaaca tctacatccc agtggcggat gcttttgccc gcaaaatcac ggagggggtc 420

　　gtgcgcgacg aatacctgca ccgcaacttc ggtgaagagt ggctgaaggc gaattttgat 480

　　gcttccaaag ccgaactgga agaagccaat cgtcagaacc tgcccttggt ttggctaatg 540

　　ctcaacgaag tggccgatga tgctcgcgaa ctcgggatgg agcgtgagtc gctcgtcgag 600

　　gactttatga ttgcctacgg tgaagctctg gaaaacatcg gcttcacaac gcgcgaaatc 660

　　atgcgtatgt ccgcctatgg ccttgcggcc gtttga 696

　　<210> 36

　　<211> 231

　　<212> PRT

　　<213> 细长聚球藻

　　<400> 36

　　Met Pro Gln Leu Glu Ala Ser Leu Glu Leu Asp Phe Gln Ser Glu Ser

　　1 5 10 15

　　Tyr Lys Asp Ala Tyr Ser Arg Ile Asn Ala Ile Val Ile Glu Gly Glu

　　 20 25 30

　　Gln Glu Ala Phe Asp Asn Tyr Asn Arg Leu Ala Glu Met Leu Pro Asp

　　 35 40 45

　　Gln Arg Asp Glu Leu His Lys Leu Ala Lys Met Glu Gln Arg His Met

　　 50 55 60

　　Lys Gly Phe Met Ala Cys Gly Lys Asn Leu Ser Val Thr Pro Asp Met

　　65 70 75 80

　　Gly Phe Ala Gln Lys Phe Phe Glu Arg Leu His Glu Asn Phe Lys Ala

　　 85 90 95

　　Ala Ala Ala Glu Gly Lys Val Val Thr Cys Leu Leu Ile Gln Ser Leu

　　 100 105 110

　　Ile Ile Glu Cys Phe Ala Ile Ala Ala Tyr Asn Ile Tyr Ile Pro Val

　　 115 120 125

　　Ala Asp Ala Phe Ala Arg Lys Ile Thr Glu Gly Val Val Arg Asp Glu

　　 130 135 140

　　Tyr Leu His Arg Asn Phe Gly Glu Glu Trp Leu Lys Ala Asn Phe Asp

　　145 150 155 160

　　Ala Ser Lys Ala Glu Leu Glu Glu Ala Asn Arg Gln Asn Leu Pro Leu

　　 165 170 175

　　Val Trp Leu Met Leu Asn Glu Val Ala Asp Asp Ala Arg Glu Leu Gly

　　 180 185 190

　　Met Glu Arg Glu Ser Leu Val Glu Asp Phe Met Ile Ala Tyr Gly Glu

　　 195 200 205

　　Ala Leu Glu Asn Ile Gly Phe Thr Thr Arg Glu Ile Met Arg Met Ser

　　 210 215 220

　　Ala Tyr Gly Leu Ala Ala Val

　　225 230

　　<210> 37

　　<211> 1029

　　<212> DNA

　　<213> 细长聚球藻

　　<400> 37

　　atggcattcg gtcttatcgg tcatctcacc agtttggagc aggcccgcga cgtttctcgc 60

　　aggatgggct acgacgaata cgccgatcaa ggattggagt tttggagtag cgctcctcct 120

　　caaatcgttg atgaaatcac agtcaccagt gccacaggca aggtgattca cggtcgctac 180

　　atcgaatcgt gtttcttgcc ggaaatgctg gcggcgcgcc gcttcaaaac agccacgcgc 240

　　aaagttctca atgccatgtc ccatgcccaa aaacacggca tcgacatctc ggccttgggg 300

　　ggctttacct cgattatttt cgagaatttc gatttggcca gtttgcggca agtgcgcgac 360

　　actaccttgg agtttgaacg gttcaccacc ggcaatactc acacggccta cgtaatctgt 420

　　agacaggtgg aagccgctgc taaaacgctg ggcatcgaca ttacccaagc gacagtagcg 480

　　gttgtcggcg cgactggcga tatcggtagc gctgtctgcc gctggctcga cctcaaactg 540

　　ggtgtcggtg atttgatcct gacggcgcgc aatcaggagc gtttggataa cctgcaggct 600

　　gaactcggcc ggggcaagat tctgcccttg gaagccgctc tgccggaagc tgactttatc 660

　　gtgtgggtcg ccagtatgcc tcagggcgta gtgatcgacc cagcaaccct gaagcaaccc 720

　　tgcgtcctaa tcgacggggg ctaccccaaa aacttgggca gcaaagtcca aggtgagggc 780

　　atctatgtcc tcaatggcgg ggtagttgaa cattgcttcg acatcgactg gcagatcatg 840

　　tccgctgcag agatggcgcg gcccgagcgc cagatgtttg cctgctttgc cgaggcgatg 900

　　ctcttggaat ttgaaggctg gcatactaac ttctcctggg gccgcaacca aatcacgatc 960

　　gagaagatgg aagcgatcgg tgaggcatcg gtgcgccacg gcttccaacc cttggcattg 1020

　　gcaatttga 1029

　　<210> 38

　　<211> 342

　　<212> PRT

　　<213> 细长聚球藻

　　<400> 38

　　Met Ala Phe Gly Leu Ile Gly His Leu Thr Ser Leu Glu Gln Ala Arg

　　1 5 10 15

　　Asp Val Ser Arg Arg Met Gly Tyr Asp Glu Tyr Ala Asp Gln Gly Leu

　　 20 25 30

　　Glu Phe Trp Ser Ser Ala Pro Pro Gln Ile Val Asp Glu Ile Thr Val

　　 35 40 45

　　Thr Ser Ala Thr Gly Lys Val Ile His Gly Arg Tyr Ile Glu Ser Cys

　　 50 55 60

　　Phe Leu Pro Glu Met Leu Ala Ala Arg Arg Phe Lys Thr Ala Thr Arg

　　65 70 75 80

　　Lys Val Leu Asn Ala Met Ser His Ala Gln Lys His Gly Ile Asp Ile

　　 85 90 95

　　Ser Ala Leu Gly Gly Phe Thr Ser Ile Ile Phe Glu Asn Phe Asp Leu

　　 100 105 110

　　Ala Ser Leu Arg Gln Val Arg Asp Thr Thr Leu Glu Phe Glu Arg Phe

　　 115 120 125

　　Thr Thr Gly Asn Thr His Thr Ala Tyr Val Ile Cys Arg Gln Val Glu

　　 130 135 140

　　Ala Ala Ala Lys Thr Leu Gly Ile Asp Ile Thr Gln Ala Thr Val Ala

　　145 150 155 160

　　Val Val Gly Ala Thr Gly Asp Ile Gly Ser Ala Val Cys Arg Trp Leu

　　 165 170 175

　　Asp Leu Lys Leu Gly Val Gly Asp Leu Ile Leu Thr Ala Arg Asn Gln

　　 180 185 190

　　Glu Arg Leu Asp Asn Leu Gln Ala Glu Leu Gly Arg Gly Lys Ile Leu

　　 195 200 205

　　Pro Leu Glu Ala Ala Leu Pro Glu Ala Asp Phe Ile Val Trp Val Ala

　　 210 215 220

　　Ser Met Pro Gln Gly Val Val Ile Asp Pro Ala Thr Leu Lys Gln Pro

　　225 230 235 240

　　Cys Val Leu Ile Asp Gly Gly Tyr Pro Lys Asn Leu Gly Ser Lys Val

　　 245 250 255

　　Gln Gly Glu Gly Ile Tyr Val Leu Asn Gly Gly Val Val Glu His Cys

　　 260 265 270

　　Phe Asp Ile Asp Trp Gln Ile Met Ser Ala Ala Glu Met Ala Arg Pro

　　 275 280 285

　　Glu Arg Gln Met Phe Ala Cys Phe Ala Glu Ala Met Leu Leu Glu Phe

　　 290 295 300

　　Glu Gly Trp His Thr Asn Phe Ser Trp Gly Arg Asn Gln Ile Thr Ile

　　305 310 315 320

　　Glu Lys Met Glu Ala Ile Gly Glu Ala Ser Val Arg His Gly Phe Gln

　　 325 330 335

　　Pro Leu Ala Leu Ala Ile

　　 340

　　<210> 39

　　<211> 717

　　<212> DNA

　　<213> Prochlorococcus mariunus

　　<400> 39

　　atgcaaacac tcgaatctaa taaaaaaact aatctagaaa attctattga tttacccgat 60

　　tttactactg attcttacaa agacgcttat agcaggataa atgcaatagt tattgaaggt 120

　　gaacaagagg ctcatgataa ttacatttcc ttagcaacat taattcctaa cgaattagaa 180

　　gagttaacta aattagcgaa aatggagctt aagcacaaaa gaggctttac tgcatgtgga 240

　　agaaatctag gtgttcaagc tgacatgatt tttgctaaag aattcttttc caaattacat 300

　　ggtaattttc aggttgcgtt atctaatggc aagacaacta catgcctatt aatacaggca 360

　　attttaattg aagcttttgc tatatccgcg tatcacgttt acataagagt tgctgatcct 420

　　ttcgcgaaaa aaattaccca aggtgttgtt aaagatgaat atcttcattt aaattatgga 480

　　caagaatggc taaaagaaaa tttagcgact tgtaaagatg agctaatgga agcaaataag 540

　　gttaaccttc cattaatcaa gaagatgtta gatcaagtct cggaagatgc ttcagtacta 600

　　gctatggata gggaagaatt aatggaagaa ttcatgattg cctatcagga cactctcctt 660

　　gaaataggtt tagataatag agaaattgca agaatggcaa tggctgctat agtttaa 717

　　<210> 40

　　<211> 238

　　<212> PRT

　　<213> Prochlorococcus mariunus

　　<400> 40

　　Met Gln Thr Leu Glu Ser Asn Lys Lys Thr Asn Leu Glu Asn Ser Ile

　　1 5 10 15

　　Asp Leu Pro Asp Phe Thr Thr Asp Ser Tyr Lys Asp Ala Tyr Ser Arg

　　 20 25 30

　　Ile Asn Ala Ile Val Ile Glu Gly Glu Gln Glu Ala His Asp Asn Tyr

　　 35 40 45

　　Ile Ser Leu Ala Thr Leu Ile Pro Asn Glu Leu Glu Glu Leu Thr Lys

　　 50 55 60

　　Leu Ala Lys Met Glu Leu Lys His Lys Arg Gly Phe Thr Ala Cys Gly

　　65 70 75 80

　　Arg Asn Leu Gly Val Gln Ala Asp Met Ile Phe Ala Lys Glu Phe Phe

　　 85 90 95

　　Ser Lys Leu His Gly Asn Phe Gln Val Ala Leu Ser Asn Gly Lys Thr

　　 100 105 110

　　Thr Thr Cys Leu Leu Ile Gln Ala Ile Leu Ile Glu Ala Phe Ala Ile

　　 115 120 125

　　Ser Ala Tyr His Val Tyr Ile Arg Val Ala Asp Pro Phe Ala Lys Lys

　　 130 135 140

　　Ile Thr Gln Gly Val Val Lys Asp Glu Tyr Leu His Leu Asn Tyr Gly

　　145 150 155 160

　　Gln Glu Trp Leu Lys Glu Asn Leu Ala Thr Cys Lys Asp Glu Leu Met

　　 165 170 175

　　Glu Ala Asn Lys Val Asn Leu Pro Leu Ile Lys Lys Met Leu Asp Gln

　　 180 185 190

　　Val Ser Glu Asp Ala Ser Val Leu Ala Met Asp Arg Glu Glu Leu Met

　　 195 200 205

　　Glu Glu Phe Met Ile Ala Tyr Gln Asp Thr Leu Leu Glu Ile Gly Leu

　　 210 215 220

　　Asp Asn Arg Glu Ile Ala Arg Met Ala Met Ala Ala Ile Val

　　225 230 235

　　<210> 41

　　<211> 1044

　　<212> DNA

　　<213> Prochlorococcus mariunus

　　<400> 41

　　atggcatttg ggcttatagg tcattcaact agttttgaag atgcaaaaag aaaggcttca 60

　　ttattgggct ttgatcatat tgcggatggt gatttagatg tttggtgcac agctccacct 120

　　caactagttg aaaatgtaga ggttaaaagt gctataggta tatcaattga aggttcttat 180

　　attgattcat gtttcgttcc tgaaatgctt tcaagattta aaacggcaag aagaaaagta 240

　　ttaaatgcaa tggaattagc tcaaaaaaaa ggtattaata ttaccgcttt gggggggttc 300

　　acttctatca tctttgaaaa ttttaatctc cttcaacata agcagattag aaacacttca 360

　　ctagagtggg aaaggtttac aactggtaat actcatactg cgtgggttat ttgcaggcaa 420

　　ttagagatga atgctcctaa aataggtatt gatcttaaaa gcgcaacagt tgctgtagtt 480

　　ggtgctactg gagatatagg cagtgctgtt tgtcgatggt taatcaataa aacaggtatt 540

　　ggggaacttc ttttggtagc taggcaaaag gaacccttgg attctttgca aaaggaatta 600

　　gatggtggaa ctatcaaaaa tctagatgaa gcattgcctg aagcagatat tgttgtatgg 660

　　gtagcaagta tgccaaagac aatggaaatc gatgctaata atcttaaaca accatgttta 720

　　atgattgatg gaggttatcc aaagaatcta gatgaaaaat ttcaaggaaa taatatacat 780

　　gttgtaaaag gaggtatagt aagattcttc aatgatatag gttggaatat gatggaacta 840

　　gctgaaatgc aaaatcccca gagagaaatg tttgcatgct ttgcagaagc aatgatttta 900

　　gaatttgaaa aatgtcatac aaactttagc tggggaagaa ataatatatc tctcgagaaa 960

　　atggagttta ttggagctgc ttctgtaaag catggcttct ctgcaattgg cctagataag 1020

　　catccaaaag tactagcagt ttga 1044

　　<210> 42

　　<211> 347

　　<212> PRT

　　<213> Prochlorococcus mariunus

　　<400> 42

　　Met Ala Phe Gly Leu Ile Gly His Ser Thr Ser Phe Glu Asp Ala Lys

　　1 5 10 15

　　Arg Lys Ala Ser Leu Leu Gly Phe Asp His Ile Ala Asp Gly Asp Leu

　　 20 25 30

　　Asp Val Trp Cys Thr Ala Pro Pro Gln Leu Val Glu Asn Val Glu Val

　　 35 40 45

　　Lys Ser Ala Ile Gly Ile Ser Ile Glu Gly Ser Tyr Ile Asp Ser Cys

　　 50 55 60

　　Phe Val Pro Glu Met Leu Ser Arg Phe Lys Thr Ala Arg Arg Lys Val

　　65 70 75 80

　　Leu Asn Ala Met Glu Leu Ala Gln Lys Lys Gly Ile Asn Ile Thr Ala

　　 85 90 95

　　Leu Gly Gly Phe Thr Ser Ile Ile Phe Glu Asn Phe Asn Leu Leu Gln

　　 100 105 110

　　His Lys Gln Ile Arg Asn Thr Ser Leu Glu Trp Glu Arg Phe Thr Thr

　　 115 120 125

　　Gly Asn Thr His Thr Ala Trp Val Ile Cys Arg Gln Leu Glu Met Asn

　　 130 135 140

　　Ala Pro Lys Ile Gly Ile Asp Leu Lys Ser Ala Thr Val Ala Val Val

　　145 150 155 160

　　Gly Ala Thr Gly Asp Ile Gly Ser Ala Val Cys Arg Trp Leu Ile Asn

　　 165 170 175

　　Lys Thr Gly Ile Gly Glu Leu Leu Leu Val Ala Arg Gln Lys Glu Pro

　　 180 185 190

　　Leu Asp Ser Leu Gln Lys Glu Leu Asp Gly Gly Thr Ile Lys Asn Leu

　　 195 200 205

　　Asp Glu Ala Leu Pro Glu Ala Asp Ile Val Val Trp Val Ala Ser Met

　　 210 215 220

　　Pro Lys Thr Met Glu Ile Asp Ala Asn Asn Leu Lys Gln Pro Cys Leu

　　225 230 235 240

　　Met Ile Asp Gly Gly Tyr Pro Lys Asn Leu Asp Glu Lys Phe Gln Gly

　　 245 250 255

　　Asn Asn Ile His Val Val Lys Gly Gly Ile Val Arg Phe Phe Asn Asp

　　 260 265 270

　　Ile Gly Trp Asn Met Met Glu Leu Ala Glu Met Gln Asn Pro Gln Arg

　　 275 280 285

　　Glu Met Phe Ala Cys Phe Ala Glu Ala Met Ile Leu Glu Phe Glu Lys

　　 290 295 300

　　Cys His Thr Asn Phe Ser Trp Gly Arg Asn Asn Ile Ser Leu Glu Lys

　　305 310 315 320

　　Met Glu Phe Ile Gly Ala Ala Ser Val Lys His Gly Phe Ser Ala Ile

　　 325 330 335

　　Gly Leu Asp Lys His Pro Lys Val Leu Ala Val

　　 340 345

　　<210> 43

　　<211> 255

　　<212> DNA

　　<213> 念球藻

　　<400> 43

　　atgagccaaa cggaactttt tgaaaaggtc aagaaaatcg tcatcgaaca actgagtgtt 60

　　gaagatgctt ccaaaatcac tccacaagct aagtttatgg aagatttagg agctgattcc 120

　　ctggatactg ttgaactcgt gatggctttg gaagaagaat ttgatatcga aattcccgac 180

　　gaagctgccg agcagattgt atcggttcaa gacgcagtag attacatcaa taacaaagtt 240

　　gctgcatcag cttaa 255

　　<210> 44

　　<211> 84

　　<212> PRT

　　<213> 念球藻

　　<400> 44

　　Met Ser Gln Thr Glu Leu Phe Glu Lys Val Lys Lys Ile Val Ile Glu

　　1 5 10 15

　　Gln Leu Ser Val Glu Asp Ala Ser Lys Ile Thr Pro Gln Ala Lys Phe

　　 20 25 30

　　Met Glu Asp Leu Gly Ala Asp Ser Leu Asp Thr Val Glu Leu Val Met

　　 35 40 45

　　Ala Leu Glu Glu Glu Phe Asp Ile Glu Ile Pro Asp Glu Ala Ala Glu

　　 50 55 60

　　Gln Ile Val Ser Val Gln Asp Ala Val Asp Tyr Ile Asn Asn Lys Val

　　65 70 75 80

　　Ala Ala Ser Ala

　　<210> 45

　　<211> 234

　　<212> DNA

　　<213> 集胞藻

　　<400> 45

　　atgaatcagg aaatttttga aaaagtaaaa aaaatcgtcg tggaacagtt ggaagtggat 60

　　cctgacaaag tgacccccga tgccaccttt gccgaagatt taggggctga ttccctcgat 120

　　acagtggaat tggtcatggc cctggaagaa gagtttgata ttgaaattcc cgatgaagtg 180

　　gcggaaacca ttgataccgt gggcaaagcc gttgagcata tcgaaagtaa ataa 234

　　<210> 46

　　<211> 77

　　<212> PRT

　　<213> 集胞藻

　　<400> 46

　　Met Asn Gln Glu Ile Phe Glu Lys Val Lys Lys Ile Val Val Glu Gln

　　1 5 10 15

　　Leu Glu Val Asp Pro Asp Lys Val Thr Pro Asp Ala Thr Phe Ala Glu

　　 20 25 30

　　Asp Leu Gly Ala Asp Ser Leu Asp Thr Val Glu Leu Val Met Ala Leu

　　 35 40 45

　　Glu Glu Glu Phe Asp Ile Glu Ile Pro Asp Glu Val Ala Glu Thr Ile

　　 50 55 60

　　Asp Thr Val Gly Lys Ala Val Glu His Ile Glu Ser Lys

　　65 70 75

　　<210> 47

　　<211> 243

　　<212> DNA

　　<213> 原绿球藻

　　<400> 47

　　atgtcacaag aagaaatcct tcaaaaagta tgctctattg tttctgagca actaagtgtt 60

　　gaatcagccg aagtaaaatc tgattcaaac tttcaaaatg atttaggtgc agactcccta 120

　　gacaccgtag agctagttat ggctcttgaa gaagcatttg atatcgagat acctgatgaa 180

　　gcagctgaag gtatcgcaac agtaggagat gctgttaaat tcatcgaaga aaaaaaaggt 240

　　taa 243

　　<210> 48

　　<211> 80

　　<212> PRT

　　<213> 原绿球藻

　　<400> 48

　　Met Ser Gln Glu Glu Ile Leu Gln Lys Val Cys Ser Ile Val Ser Glu

　　1 5 10 15

　　Gln Leu Ser Val Glu Ser Ala Glu Val Lys Ser Asp Ser Asn Phe Gln

　　 20 25 30

　　Asn Asp Leu Gly Ala Asp Ser Leu Asp Thr Val Glu Leu Val Met Ala

　　 35 40 45

　　Leu Glu Glu Ala Phe Asp Ile Glu Ile Pro Asp Glu Ala Ala Glu Gly

　　 50 55 60

　　Ile Ala Thr Val Gly Asp Ala Val Lys Phe Ile Glu Glu Lys Lys Gly

　　65 70 75 80

　　<210> 49

　　<211> 243

　　<212> DNA

　　<213> 细长聚球藻

　　<400> 49

　　atgagccaag aagacatctt cagcaaagtc aaagacattg tggctgagca gctgagtgtg 60

　　gatgtggctg aagtcaagcc agaatccagc ttccaaaacg atctgggagc ggactcgctg 120

　　gacaccgtgg aactggtgat ggctctggaa gaggctttcg atatcgaaat ccccgatgaa 180

　　gccgctgaag gcattgcgac cgttcaagac gccgtcgatt tcatcgctag caaagctgcc 240

　　tag 243

　　<210> 50

　　<211> 80

　　<212> PRT

　　<213> 细长聚球藻

　　<400> 50

　　Met Ser Gln Glu Asp Ile Phe Ser Lys Val Lys Asp Ile Val Ala Glu

　　1 5 10 15

　　Gln Leu Ser Val Asp Val Ala Glu Val Lys Pro Glu Ser Ser Phe Gln

　　 20 25 30

　　Asn Asp Leu Gly Ala Asp Ser Leu Asp Thr Val Glu Leu Val Met Ala

　　 35 40 45

　　Leu Glu Glu Ala Phe Asp Ile Glu Ile Pro Asp Glu Ala Ala Glu Gly

　　 50 55 60

　　Ile Ala Thr Val Gln Asp Ala Val Asp Phe Ile Ala Ser Lys Ala Ala

　　65 70 75 80

　　<210> 51

　　<211> 255

　　<212> DNA

　　<213> 念珠菌菌种

　　<400> 51

　　atgagccaat cagaaacttt tgaaaaagtc aaaaaaattg ttatcgaaca actaagtgtg 60

　　gagaaccctg acacagtaac tccagaagct agttttgcca acgatttaca ggctgattcc 120

　　ctcgatacag tagaactagt aatggctttg gaagaagaat ttgatatcga aattcccgat 180

　　gaagccgcag agaaaattac cactgttcaa gaagcggtgg attacatcaa taaccaagtt 240

　　gccgcatcag cttaa 255

　　<210> 52

　　<211> 84

　　<212> PRT

　　<213> 念珠菌菌种

　　<400> 52

　　Met Ser Gln Ser Glu Thr Phe Glu Lys Val Lys Lys Ile Val Ile Glu

　　1 5 10 15

　　Gln Leu Ser Val Glu Asn Pro Asp Thr Val Thr Pro Glu Ala Ser Phe

　　 20 25 30

　　Ala Asn Asp Leu Gln Ala Asp Ser Leu Asp Thr Val Glu Leu Val Met

　　 35 40 45

　　Ala Leu Glu Glu Glu Phe Asp Ile Glu Ile Pro Asp Glu Ala Ala Glu

　　 50 55 60

　　Lys Ile Thr Thr Val Gln Glu Ala Val Asp Tyr Ile Asn Asn Gln Val

　　65 70 75 80

　　Ala Ala Ser Ala

　　<210> 53

　　<211> 675

　　<212> DNA

　　<213> 枯草芽孢杆菌

　　<400> 53

　　atgaagattt acggaattta tatggaccgc ccgctttcac aggaagaaaa tgaacggttc 60

　　atgactttca tatcacctga aaaacgggag aaatgccgga gattttatca taaagaagat 120

　　gctcaccgca ccctgctggg agatgtgctc gttcgctcag tcataagcag gcagtatcag 180

　　ttggacaaat ccgatatccg ctttagcacg caggaatacg ggaagccgtg catccctgat 240

　　cttcccgacg ctcatttcaa catttctcac tccggccgct gggtcattgg tgcgtttgat 300

　　tcacagccga tcggcataga tatcgaaaaa acgaaaccga tcagccttga gatcgccaag 360

　　cgcttctttt caaaaacaga gtacagcgac cttttagcaa aagacaagga cgagcagaca 420

　　gactattttt atcatctatg gtcaatgaaa gaaagcttta tcaaacagga aggcaaaggc 480

　　ttatcgcttc cgcttgattc cttttcagtg cgcctgcatc aggacggaca agtatccatt 540

　　gagcttccgg acagccattc cccatgctat atcaaaacgt atgaggtcga tcccggctac 600

　　aaaatggctg tatgcgccgc acaccctgat ttccccgagg atatcacaat ggtctcgtac 660

　　gaagagcttt tataa 675

　　<210> 54

　　<211> 224

　　<212> PRT

　　<213> 枯草芽孢杆菌

　　<400> 54

　　Met Lys Ile Tyr Gly Ile Tyr Met Asp Arg Pro Leu Ser Gln Glu Glu

　　1 5 10 15

　　Asn Glu Arg Phe Met Thr Phe Ile Ser Pro Glu Lys Arg Glu Lys Cys

　　 20 25 30

　　Arg Arg Phe Tyr His Lys Glu Asp Ala His Arg Thr Leu Leu Gly Asp

　　 35 40 45

　　Val Leu Val Arg Ser Val Ile Ser Arg Gln Tyr Gln Leu Asp Lys Ser

　　 50 55 60

　　Asp Ile Arg Phe Ser Thr Gln Glu Tyr Gly Lys Pro Cys Ile Pro Asp

　　65 70 75 80

　　Leu Pro Asp Ala His Phe Asn Ile Ser His Ser Gly Arg Trp Val Ile

　　 85 90 95

　　Gly Ala Phe Asp Ser Gln Pro Ile Gly Ile Asp Ile Glu Lys Thr Lys

　　 100 105 110

　　Pro Ile Ser Leu Glu Ile Ala Lys Arg Phe Phe Ser Lys Thr Glu Tyr

　　 115 120 125

　　Ser Asp Leu Leu Ala Lys Asp Lys Asp Glu Gln Thr Asp Tyr Phe Tyr

　　 130 135 140

　　His Leu Trp Ser Met Lys Glu Ser Phe Ile Lys Gln Glu Gly Lys Gly

　　145 150 155 160

　　Leu Ser Leu Pro Leu Asp Ser Phe Ser Val Arg Leu His Gln Asp Gly

　　 165 170 175

　　Gln Val Ser Ile Glu Leu Pro Asp Ser His Ser Pro Cys Tyr Ile Lys

　　 180 185 190

　　Thr Tyr Glu Val Asp Pro Gly Tyr Lys Met Ala Val Cys Ala Ala His

　　 195 200 205

　　Pro Asp Phe Pro Glu Asp Ile Thr Met Val Ser Tyr Glu Glu Leu Leu

　　 210 215 220

　　<210> 55

　　<211> 867

　　<212> DNA

　　<213> 谷氨酸棒状杆菌

　　<400> 55

　　ttgggcgtgt cgcccttaaa gcgcgctttt cgacgcgacc ccactacatt ggcttccatg 60

　　aacgttgaca tttcacgatc cagagagccg ctaaacgttg agctcctgaa ggaaaaattg 120

　　ctccaaaacg gtgactttgg ccaggtcatt tacgaaaaag tgacaggctc cactaatgct 180

　　gacttgctgg cacttgcagg ttctggcgct ccaaactgga cggtgaaaac tgtcgagttt 240

　　caagatcatg cgcgtgggcg actcggccgc ccgtggtctg cccctgaggg ttcccaaaca 300

　　atcgtgtctg tgctcgttca actatctatt gatcaagtgg accggattgg cactattcca 360

　　ctcgcggcgg gactcgctgt catggatgcg ttgaatgacc tcggtgtgga aggtgccgga 420

　　ctgaaatggc ccaacgatgt tcaaatccac ggcaagaaac tctgcggcat cctggtggaa 480

　　gccaccggct ttgattccac cccaacagtt gtcatcggtt ggggcactaa tatcagcctg 540

　　actaaagagg agcttcctgt tcctcatgca acttccctcg cattggaagg tgttgaagtc 600

　　gacagaacca cattccttat taatatgctc acacatctgc atactcgact ggaccagtgg 660

　　cagggtccaa gtgtggattg gctcgatgat taccgtgcgg tatgttccag tattggccaa 720

　　gatgttcgag tgcttctacc tggggataaa gaactcttag gtgaagcgat cggtgtcgcg 780

　　actggcggag aaattcgtgt tcgcgatgct tcgggcaccg ttcacaccct caacgccggt 840

　　gaaattacgc accttcgcct gcagtaa 867

　　<210> 56

　　<211> 810

　　<212> DNA

　　<213> 谷氨酸棒状杆菌

　　<400> 56

　　atgaatgttg acattagccg ctctcgtgaa ccgttgaacg tggaactgtt gaaagaaaaa 60

　　ctgctgcaga acggtgattt cggtcaagtg atctacgaga aggtcaccgg ctctaccaat 120

　　gcggacctgc tggctctggc gggcagcggc gctccaaact ggaccgtcaa gactgttgaa 180

　　tttcaggacc acgcccgtgg ccgtctgggt cgtccgtgga gcgcaccgga gggttcccaa 240

　　accatcgtca gcgttctggt ccaactgagc attgatcagg tggaccgtat tggtacgatc 300

　　ccgctggccg caggcttggc tgttatggat gcgctgaatg atctgggcgt ggagggtgca 360

　　ggcctgaaat ggccgaacga tgttcagatc cacggtaaga agttgtgcgg tattctggtt 420

　　gaagcaaccg gcttcgactc cactccgacc gtggttatcg gttggggtac gaatatctcg 480

　　ttgacgaaag aagagctgcc ggtcccgcac gcgaccagcc tggccctgga gggtgttgaa 540

　　gttgaccgta cgacgttcct gattaacatg ctgacccatc tgcatacccg tctggatcag 600

　　tggcagggtc cgtctgtgga ctggctggat gactatcgcg cggtttgtag cagcattggc 660

　　caagatgtgc gtgtcctgct gcctggtgac aaagagctgc tgggcgaggc gattggcgtg 720

　　gcgaccggtg gtgagatccg tgtgcgcgac gccagcggca cggtccacac gctgaatgcg 780

　　ggtgaaatca cgcatctgcg tttgcaataa 810

　　<210> 57

　　<211> 269

　　<212> PRT

　　<213> 谷氨酸棒状杆菌

　　<400> 57

　　Met Asn Val Asp Ile Ser Arg Ser Arg Glu Pro Leu Asn Val Glu Leu

　　1 5 10 15

　　Leu Lys Glu Lys Leu Leu Gln Asn Gly Asp Phe Gly Gln Val Ile Tyr

　　 20 25 30

　　Glu Lys Val Thr Gly Ser Thr Asn Ala Asp Leu Leu Ala Leu Ala Gly

　　 35 40 45

　　Ser Gly Ala Pro Asn Trp Thr Val Lys Thr Val Glu Phe Gln Asp His

　　 50 55 60

　　Ala Arg Gly Arg Leu Gly Arg Pro Trp Ser Ala Pro Glu Gly Ser Gln

　　65 70 75 80

　　Thr Ile Val Ser Val Leu Val Gln Leu Ser Ile Asp Gln Val Asp Arg

　　 85 90 95

　　Ile Gly Thr Ile Pro Leu Ala Ala Gly Leu Ala Val Met Asp Ala Leu

　　 100 105 110

　　Asn Asp Leu Gly Val Glu Gly Ala Gly Leu Lys Trp Pro Asn Asp Val

　　 115 120 125

　　Gln Ile His Gly Lys Lys Leu Cys Gly Ile Leu Val Glu Ala Thr Gly

　　 130 135 140

　　Phe Asp Ser Thr Pro Thr Val Val Ile Gly Trp Gly Thr Asn Ile Ser

　　145 150 155 160

　　Leu Thr Lys Glu Glu Leu Pro Val Pro His Ala Thr Ser Leu Ala Leu

　　 165 170 175

　　Glu Gly Val Glu Val Asp Arg Thr Thr Phe Leu Ile Asn Met Leu Thr

　　 180 185 190

　　His Leu His Thr Arg Leu Asp Gln Trp Gln Gly Pro Ser Val Asp Trp

　　 195 200 205

　　Leu Asp Asp Tyr Arg Ala Val Cys Ser Ser Ile Gly Gln Asp Val Arg

　　 210 215 220

　　Val Leu Leu Pro Gly Asp Lys Glu Leu Leu Gly Glu Ala Ile Gly Val

　　225 230 235 240

　　Ala Thr Gly Gly Glu Ile Arg Val Arg Asp Ala Ser Gly Thr Val His

　　 245 250 255

　　Thr Leu Asn Ala Gly Glu Ile Thr His Leu Arg Leu Gln

　　 260 265

　　<210> 58

　　<211> 1632

　　<212> DNA

　　<213> 谷氨酸棒状杆菌

　　<400> 58

　　atgaccattt cctcaccttt gattgacgtc gccaaccttc cagacatcaa caccactgcc 60

　　ggcaagatcg ccgaccttaa ggctcgccgc gcggaagccc atttccccat gggtgaaaag 120

　　gcagtagaga aggtccacgc tgctggacgc ctcactgccc gtgagcgctt ggattactta 180

　　ctcgatgagg gctccttcat cgagaccgat cagctggctc gccaccgcac caccgctttc 240

　　ggcctgggcg ctaagcgtcc tgcaaccgac ggcatcgtga ccggctgggg caccattgat 300

　　ggacgcgaag tctgcatctt ctcgcaggac ggcaccgtat tcggtggcgc gcttggtgag 360

　　gtgtacggcg aaaagatgat caagatcatg gagctggcaa tcgacaccgg ccgcccattg 420

　　atcggtcttt acgaaggcgc tggcgctcgt attcaggacg gcgctgtctc cctggacttc 480

　　atttcccaga ccttctacca aaacattcag gcttctggcg ttatcccaca gatctccgtc 540

　　atcatgggcg catgtgcagg tggcaacgct tacggcccag ctctgaccga cttcgtggtc 600

　　atggtggaca agacctccaa gatgttcgtt accggcccag acgtgatcaa gaccgtcacc 660

　　ggcgaggaaa tcacccagga agagcttggc ggagcaacca cccacatggt gaccgctggt 720

　　aactcccact acaccgctgc gaccgatgag gaagcactgg attgggtaca ggacctggtg 780

　　tccttcctcc catccaacaa tcgctcctac gcaccgatgg aagacttcga cgaggaagaa 840

　　ggcggcgttg aagaaaacat caccgctgac gatctgaagc tcgacgagat catcccagat 900

　　tccgcgaccg ttccttacga cgtccgcgat gtcatcgaat gcctcaccga cgatggcgaa 960

　　tacctggaaa tccaggcaga ccgcgcagaa aacgttgtta ttgcattcgg ccgcatcgaa 1020

　　ggccagtccg ttggctttgt tgccaaccag ccaacccagt tcgctggctg cctggacatc 1080

　　gactcctctg agaaggcagc tcgcttcgtc cgcacctgcg acgcgttcaa catcccaatc 1140

　　gtcatgcttg tcgacgtccc cggcttcctc ccaggcgcag gccaggagta cggtggcatt 1200

　　ctgcgtcgtg gcgcaaagct gctctacgca tacggcgaag caaccgttcc aaagatcacc 1260

　　gtcaccatgc gtaaggctta cggcggagcg tactgcgtga tgggttccaa gggcttgggc 1320

　　tctgacatca accttgcatg gccaaccgca cagatcgccg tcatgggcgc tgctggcgca 1380

　　gttggattca tctaccgcaa ggagctcatg gcagctgatg ccaagggcct cgataccgta 1440

　　gctctggcta agtccttcga gcgcgagtat gaagaccaca tgctcaaccc gtaccacgct 1500

　　gcagaacgtg gcctgatcga cgccgtgatc ctgccaagcg aaacccgcgg acagatttcc 1560

　　cgcaaccttc gcctgctcaa gcacaagaac gtcactcgcc ctgctcgcaa gcacggcaac 1620

　　atgccactgt aa 1632

　　<210> 59

　　<211> 543

　　<212> PRT

　　<213> 谷氨酸棒状杆菌

　　<400> 59

　　Met Thr Ile Ser Ser Pro Leu Ile Asp Val Ala Asn Leu Pro Asp Ile

　　1 5 10 15

　　Asn Thr Thr Ala Gly Lys Ile Ala Asp Leu Lys Ala Arg Arg Ala Glu

　　 20 25 30

　　Ala His Phe Pro Met Gly Glu Lys Ala Val Glu Lys Val His Ala Ala

　　 35 40 45

　　Gly Arg Leu Thr Ala Arg Glu Arg Leu Asp Tyr Leu Leu Asp Glu Gly

　　 50 55 60

　　Ser Phe Ile Glu Thr Asp Gln Leu Ala Arg His Arg Thr Thr Ala Phe

　　65 70 75 80

　　Gly Leu Gly Ala Lys Arg Pro Ala Thr Asp Gly Ile Val Thr Gly Trp

　　 85 90 95

　　Gly Thr Ile Asp Gly Arg Glu Val Cys Ile Phe Ser Gln Asp Gly Thr

　　 100 105 110

　　Val Phe Gly Gly Ala Leu Gly Glu Val Tyr Gly Glu Lys Met Ile Lys

　　 115 120 125

　　Ile Met Glu Leu Ala Ile Asp Thr Gly Arg Pro Leu Ile Gly Leu Tyr

　　 130 135 140

　　Glu Gly Ala Gly Ala Arg Ile Gln Asp Gly Ala Val Ser Leu Asp Phe

　　145 150 155 160

　　Ile Ser Gln Thr Phe Tyr Gln Asn Ile Gln Ala Ser Gly Val Ile Pro

　　 165 170 175

　　Gln Ile Ser Val Ile Met Gly Ala Cys Ala Gly Gly Asn Ala Tyr Gly

　　 180 185 190

　　Pro Ala Leu Thr Asp Phe Val Val Met Val Asp Lys Thr Ser Lys Met

　　 195 200 205

　　Phe Val Thr Gly Pro Asp Val Ile Lys Thr Val Thr Gly Glu Glu Ile

　　 210 215 220

　　Thr Gln Glu Glu Leu Gly Gly Ala Thr Thr His Met Val Thr Ala Gly

　　225 230 235 240

　　Asn Ser His Tyr Thr Ala Ala Thr Asp Glu Glu Ala Leu Asp Trp Val

　　 245 250 255

　　Gln Asp Leu Val Ser Phe Leu Pro Ser Asn Asn Arg Ser Tyr Ala Pro

　　 260 265 270

　　Met Glu Asp Phe Asp Glu Glu Glu Gly Gly Val Glu Glu Asn Ile Thr

　　 275 280 285

　　Ala Asp Asp Leu Lys Leu Asp Glu Ile Ile Pro Asp Ser Ala Thr Val

　　 290 295 300

　　Pro Tyr Asp Val Arg Asp Val Ile Glu Cys Leu Thr Asp Asp Gly Glu

　　305 310 315 320

　　Tyr Leu Glu Ile Gln Ala Asp Arg Ala Glu Asn Val Val Ile Ala Phe

　　 325 330 335

　　Gly Arg Ile Glu Gly Gln Ser Val Gly Phe Val Ala Asn Gln Pro Thr

　　 340 345 350

　　Gln Phe Ala Gly Cys Leu Asp Ile Asp Ser Ser Glu Lys Ala Ala Arg

　　 355 360 365

　　Phe Val Arg Thr Cys Asp Ala Phe Asn Ile Pro Ile Val Met Leu Val

　　 370 375 380

　　Asp Val Pro Gly Phe Leu Pro Gly Ala Gly Gln Glu Tyr Gly Gly Ile

　　385 390 395 400

　　Leu Arg Arg Gly Ala Lys Leu Leu Tyr Ala Tyr Gly Glu Ala Thr Val

　　 405 410 415

　　Pro Lys Ile Thr Val Thr Met Arg Lys Ala Tyr Gly Gly Ala Tyr Cys

　　 420 425 430

　　Val Met Gly Ser Lys Gly Leu Gly Ser Asp Ile Asn Leu Ala Trp Pro

　　 435 440 445

　　Thr Ala Gln Ile Ala Val Met Gly Ala Ala Gly Ala Val Gly Phe Ile

　　 450 455 460

　　Tyr Arg Lys Glu Leu Met Ala Ala Asp Ala Lys Gly Leu Asp Thr Val

　　465 470 475 480

　　Ala Leu Ala Lys Ser Phe Glu Arg Glu Tyr Glu Asp His Met Leu Asn

　　 485 490 495

　　Pro Tyr His Ala Ala Glu Arg Gly Leu Ile Asp Ala Val Ile Leu Pro

　　 500 505 510

　　Ser Glu Thr Arg Gly Gln Ile Ser Arg Asn Leu Arg Leu Leu Lys His

　　 515 520 525

　　Lys Asn Val Thr Arg Pro Ala Arg Lys His Gly Asn Met Pro Leu

　　 530 535 540

　　<210> 60

　　<211> 1776

　　<212> DNA

　　<213> 谷氨酸棒状杆菌

　　<400> 60

　　atgtcagtcg agactcgcaa gatcaccaag gttcttgtcg ctaaccgtgg tgagattgca 60

　　atccgcgtgt tccgtgcagc tcgagatgaa ggcatcggat ctgtcgccgt ctacgcagag 120

　　ccagatgcag atgcaccatt cgtgtcatat gcagacgagg cttttgccct cggtggccaa 180

　　acatccgctg agtcctacct tgtcattgac aagatcatcg atgcggcccg caagtccggc 240

　　gccgacgcca tccaccccgg ctacggcttc ctcgcagaaa acgctgactt cgcagaagca 300

　　gtcatcaacg aaggcctgat ctggattgga ccttcacctg agtccatccg ctccctcggc 360

　　gacaaggtca ccgctcgcca catcgcagat accgccaagg ctccaatggc tcctggcacc 420

　　aaggaaccag taaaagacgc agcagaagtt gtggctttcg ctgaagaatt cggtctccca 480

　　atcgccatca aggcagcttt cggtggcggc ggacgtggca tgaaggttgc ctacaagatg 540

　　gaagaagtcg ctgacctctt cgagtccgca acccgtgaag caaccgcagc gttcggccgc 600

　　ggcgagtgct tcgtggagcg ctacctggac aaggcacgcc acgttgaggc tcaggtcatc 660

　　gccgataagc acggcaacgt tgttgtcgcc ggaacccgtg actgctccct gcagcgccgt 720

　　ttccagaagc tcgtcgaaga agcaccagca ccattcctca ccgatgacca gcgcgagcgt 780

　　ctccactcct ccgcgaaggc tatctgtaag gaagctggct actacggtgc aggcaccgtt 840

　　gagtacctcg ttggctccga cggcctgatc tccttcctcg aggtcaacac ccgcctccag 900

　　gtggaacacc cagtcaccga agagaccacc ggcatcgacc tggtccgcga aatgttccgc 960

　　atcgcagaag gccacgagct ctccatcaag gaagatccag ctccacgcgg ccacgcattc 1020

　　gagttccgca tcaacggcga agacgctggc tccaacttca tgcctgcacc aggcaagatc 1080

　　accagctacc gcgagccaca gggcccaggc gtccgcatgg actccggtgt cgttgaaggt 1140

　　tccgaaatct ccggacagtt cgactccatg ctggcaaagc tgatcgtttg gggcgacacc 1200

　　cgcgagcagg ctctccagcg ctcccgccgt gcacttgcag agtacgttgt cgagggcatg 1260

　　ccaaccgtta tcccattcca ccagcacatc gtggaaaacc cagcattcgt gggcaacgac 1320

　　gaaggcttcg agatctacac caagtggatc gaagaggttt gggataaccc aatcgcacct 1380

　　tacgttgacg cttccgagct cgacgaagat gaggacaaga ccccagcaca gaaggttgtt 1440

　　gtggagatca acggccgtcg cgttgaggtt gcactcccag gcgatctggc actcggtggc 1500

　　accgctggtc ctaagaagaa ggccaagaag cgtcgcgcag gtggtgcaaa ggctggcgta 1560

　　tccggcgatg cagtggcagc tccaatgcag ggcactgtca tcaaggtcaa cgtcgaagaa 1620

　　ggcgctgaag tcaacgaagg cgacaccgtt gttgtcctcg aggctatgaa gatggaaaac 1680

　　cctgtgaagg ctcataagtc cggaaccgta accggcctta ctgtcgctgc aggcgagggt 1740

　　gtcaacaagg gcgttgttct cctcgagatc aagtaa 1776

　　<210> 61

　　<211> 591

　　<212> PRT

　　<213> 谷氨酸棒状杆菌

　　<400> 61

　　Met Ser Val Glu Thr Arg Lys Ile Thr Lys Val Leu Val Ala Asn Arg

　　1 5 10 15

　　Gly Glu Ile Ala Ile Arg Val Phe Arg Ala Ala Arg Asp Glu Gly Ile

　　 20 25 30

　　Gly Ser Val Ala Val Tyr Ala Glu Pro Asp Ala Asp Ala Pro Phe Val

　　 35 40 45

　　Ser Tyr Ala Asp Glu Ala Phe Ala Leu Gly Gly Gln Thr Ser Ala Glu

　　 50 55 60

　　Ser Tyr Leu Val Ile Asp Lys Ile Ile Asp Ala Ala Arg Lys Ser Gly

　　65 70 75 80

　　Ala Asp Ala Ile His Pro Gly Tyr Gly Phe Leu Ala Glu Asn Ala Asp

　　 85 90 95

　　Phe Ala Glu Ala Val Ile Asn Glu Gly Leu Ile Trp Ile Gly Pro Ser

　　 100 105 110

　　Pro Glu Ser Ile Arg Ser Leu Gly Asp Lys Val Thr Ala Arg His Ile

　　 115 120 125

　　Ala Asp Thr Ala Lys Ala Pro Met Ala Pro Gly Thr Lys Glu Pro Val

　　 130 135 140

　　Lys Asp Ala Ala Glu Val Val Ala Phe Ala Glu Glu Phe Gly Leu Pro

　　145 150 155 160

　　Ile Ala Ile Lys Ala Ala Phe Gly Gly Gly Gly Arg Gly Met Lys Val

　　 165 170 175

　　Ala Tyr Lys Met Glu Glu Val Ala Asp Leu Phe Glu Ser Ala Thr Arg

　　 180 185 190

　　Glu Ala Thr Ala Ala Phe Gly Arg Gly Glu Cys Phe Val Glu Arg Tyr

　　 195 200 205

　　Leu Asp Lys Ala Arg His Val Glu Ala Gln Val Ile Ala Asp Lys His

　　 210 215 220

　　Gly Asn Val Val Val Ala Gly Thr Arg Asp Cys Ser Leu Gln Arg Arg

　　225 230 235 240

　　Phe Gln Lys Leu Val Glu Glu Ala Pro Ala Pro Phe Leu Thr Asp Asp

　　 245 250 255

　　Gln Arg Glu Arg Leu His Ser Ser Ala Lys Ala Ile Cys Lys Glu Ala

　　 260 265 270

　　Gly Tyr Tyr Gly Ala Gly Thr Val Glu Tyr Leu Val Gly Ser Asp Gly

　　 275 280 285

　　Leu Ile Ser Phe Leu Glu Val Asn Thr Arg Leu Gln Val Glu His Pro

　　 290 295 300

　　Val Thr Glu Glu Thr Thr Gly Ile Asp Leu Val Arg Glu Met Phe Arg

　　305 310 315 320

　　Ile Ala Glu Gly His Glu Leu Ser Ile Lys Glu Asp Pro Ala Pro Arg

　　 325 330 335

　　Gly His Ala Phe Glu Phe Arg Ile Asn Gly Glu Asp Ala Gly Ser Asn

　　 340 345 350

　　Phe Met Pro Ala Pro Gly Lys Ile Thr Ser Tyr Arg Glu Pro Gln Gly

　　 355 360 365

　　Pro Gly Val Arg Met Asp Ser Gly Val Val Glu Gly Ser Glu Ile Ser

　　 370 375 380

　　Gly Gln Phe Asp Ser Met Leu Ala Lys Leu Ile Val Trp Gly Asp Thr

　　385 390 395 400

　　Arg Glu Gln Ala Leu Gln Arg Ser Arg Arg Ala Leu Ala Glu Tyr Val

　　 405 410 415

　　Val Glu Gly Met Pro Thr Val Ile Pro Phe His Gln His Ile Val Glu

　　 420 425 430

　　Asn Pro Ala Phe Val Gly Asn Asp Glu Gly Phe Glu Ile Tyr Thr Lys

　　 435 440 445

　　Trp Ile Glu Glu Val Trp Asp Asn Pro Ile Ala Pro Tyr Val Asp Ala

　　 450 455 460

　　Ser Glu Leu Asp Glu Asp Glu Asp Lys Thr Pro Ala Gln Lys Val Val

　　465 470 475 480

　　Val Glu Ile Asn Gly Arg Arg Val Glu Val Ala Leu Pro Gly Asp Leu

　　 485 490 495

　　Ala Leu Gly Gly Thr Ala Gly Pro Lys Lys Lys Ala Lys Lys Arg Arg

　　 500 505 510

　　Ala Gly Gly Ala Lys Ala Gly Val Ser Gly Asp Ala Val Ala Ala Pro

　　 515 520 525

　　Met Gln Gly Thr Val Ile Lys Val Asn Val Glu Glu Gly Ala Glu Val

　　 530 535 540

　　Asn Glu Gly Asp Thr Val Val Val Leu Glu Ala Met Lys Met Glu Asn

　　545 550 555 560

　　Pro Val Lys Ala His Lys Ser Gly Thr Val Thr Gly Leu Thr Val Ala

　　 565 570 575

　　Ala Gly Glu Gly Val Asn Lys Gly Val Val Leu Leu Glu Ile Lys

　　 580 585 590

　　<210> 62

　　<211> 10025

　　<212> DNA

　　<213> 人工序列

　　<220>

　　<221> 来源

　　<223> /注="人工序列的描述: 合成的多核苷酸"

　　<400> 62

　　cactatacca attgagatgg gctagtcaat gataattact agtccttttc ctttgagttg 60

　　tgggtatctg taaattctgc tagacctttg ctggaaaact tgtaaattct gctagaccct 120

　　ctgtaaattc cgctagacct ttgtgtgttt tttttgttta tattcaagtg gttataattt 180

　　atagaataaa gaaagaataa aaaaagataa aaagaataga tcccagccct gtgtataact 240

　　cactacttta gtcagttccg cagtattaca aaaggatgtc gcaaacgctg tttgctcctc 300

　　tacaaaacag accttaaaac cctaaaggcg tcggcatccg cttacagaca agctgtgacc 360

　　gtctccggga gctgcatgtg tcagaggttt tcaccgtcat caccgaaacg cgcgaggcag 420

　　cagatcaatt cgcgcgcgaa ggcgaagcgg catgcattta cgttgacacc atcgaatggt 480

　　gcaaaacctt tcgcggtatg gcatgatagc gcccggaaga gagtcaattc agggtggtga 540

　　atgtgaaacc agtaacgtta tacgatgtcg cagagtatgc cggtgtctct tatcagaccg 600

　　tttcccgcgt ggtgaaccag gccagccacg tttctgcgaa aacgcgggaa aaagtggaag 660

　　cggcgatggc ggagctgaat tacattccca accgcgtggc acaacaactg gcgggcaaac 720

　　agtcgttgct gattggcgtt gccacctcca gtctggccct gcacgcgccg tcgcaaattg 780

　　tcgcggcgat taaatctcgc gccgatcaac tgggtgccag cgtggtggtg tcgatggtag 840

　　aacgaagcgg cgtcgaagcc tgtaaagcgg cggtgcacaa tcttctcgcg caacgcgtca 900

　　gtgggctgat cattaactat ccgctggatg accaggatgc cattgctgtg gaagctgcct 960

　　gcactaatgt tccggcgtta tttcttgatg tctctgacca gacacccatc aacagtatta 1020

　　ttttctccca tgaagacggt acgcgactgg gcgtggagca tctggtcgca ttgggtcacc 1080

　　agcaaatcgc gctgttagcg ggcccattaa gttctgtctc ggcgcgtctg cgtctggctg 1140

　　gctggcataa atatctcact cgcaatcaaa ttcagccgat agcggaacgg gaaggcgact 1200

　　ggagtgccat gtccggtttt caacaaacca tgcaaatgct gaatgagggc atcgttccca 1260

　　ctgcgatgct ggttgccaac gatcagatgg cgctgggcgc aatgcgcgcc attaccgagt 1320

　　ccgggctgcg cgttggtgcg gatatctcgg tagtgggata cgacgatacc gaagacagct 1380

　　catgttatat cccgccgtta accaccatca aacaggattt tcgcctgctg gggcaaacca 1440

　　gcgtggaccg cttgctgcaa ctctctcagg gccaggcggt gaagggcaat cagctgttgc 1500

　　ccgtctcact ggtgaaaaga aaaaccaccc tggcgcccaa tacgcaaacc gcctctcccc 1560

　　gcgcgttggc cgattcatta atgcagctgg cacgacaggt ttcccgactg gaaagcgggc 1620

　　agtgagcgca acgcaattaa tgtaagttag cgcgaattga tctggtttga cagcttatca 1680

　　tcgactgcac ggtgcaccaa tgcttctggc gtcaggcagc catcggaagc tgtggtatgg 1740

　　ctgtgcaggt cgtaaatcac tgcataattc gtgtcgctca aggcgcactc ccgttctgga 1800

　　taatgttttt tgcgccgaca tcataacggt tctggcaaat attctgttga caattaatca 1860

　　tccggctcgt ataaagtgtg gaattgtgag cggataacaa tttcacacag gaaacagcgc 1920

　　cgctgagaaa aagcgaagcg gcactgctct ttaacaattt atcagacaat ctgtgtgggc 1980

　　actcgaccgg aattatcgat taactttatt attaaaaatt aaagaggtat atattaatgt 2040

　　atcgattaaa taaggaggaa taaaccatga ccatttcctc acctttgatt gacgtcgcca 2100

　　accttccaga catcaacacc actgccggca agatcgccga ccttaaggct cgccgcgcgg 2160

　　aagcccattt ccccatgggt gaaaaggcag tagagaaggt ccacgctgct ggacgcctca 2220

　　ctgcccgtga gcgcttggat tacttactcg atgagggctc cttcatcgag accgatcagc 2280

　　tggctcgcca ccgcaccacc gctttcggcc tgggcgctaa gcgtcctgca accgacggca 2340

　　tcgtgaccgg ctggggcacc attgatggac gcgaagtctg catcttctcg caggacggca 2400

　　ccgtattcgg tggcgcgctt ggtgaggtgt acggcgaaaa gatgatcaag atcatggagc 2460

　　tggcaatcga caccggccgc ccattgatcg gtctttacga aggcgctggc gctcgtattc 2520

　　aggacggcgc tgtctccctg gacttcattt cccagacctt ctaccaaaac attcaggctt 2580

　　ctggcgttat cccacagatc tccgtcatca tgggcgcatg tgcaggtggc aacgcttacg 2640

　　gcccagctct gaccgacttc gtggtcatgg tggacaagac ctccaagatg ttcgttaccg 2700

　　gcccagacgt gatcaagacc gtcaccggcg aggaaatcac ccaggaagag cttggcggag 2760

　　caaccaccca catggtgacc gctggtaact cccactacac cgctgcgacc gatgaggaag 2820

　　cactggattg ggtacaggac ctggtgtcct tcctcccatc caacaatcgc tcctacgcac 2880

　　cgatggaaga cttcgacgag gaagaaggcg gcgttgaaga aaacatcacc gctgacgatc 2940

　　tgaagctcga cgagatcatc ccagattccg cgaccgttcc ttacgacgtc cgcgatgtca 3000

　　tcgaatgcct caccgacgat ggcgaatacc tggaaatcca ggcagaccgc gcagaaaacg 3060

　　ttgttattgc attcggccgc atcgaaggcc agtccgttgg ctttgttgcc aaccagccaa 3120

　　cccagttcgc tggctgcctg gacatcgact cctctgagaa ggcagctcgc ttcgtccgca 3180

　　cctgcgacgc gttcaacatc ccaatcgtca tgcttgtcga cgtccccggc ttcctcccag 3240

　　gcgcaggcca ggagtacggt ggcattctgc gtcgtggcgc aaagctgctc tacgcatacg 3300

　　gcgaagcaac cgttccaaag atcaccgtca ccatgcgtaa ggcttacggc ggagcgtact 3360

　　gcgtgatggg ttccaagggc ttgggctctg acatcaacct tgcatggcca accgcacaga 3420

　　tcgccgtcat gggcgctgct ggcgcagttg gattcatcta ccgcaaggag ctcatggcag 3480

　　ctgatgccaa gggcctcgat accgtagctc tggctaagtc cttcgagcgc gagtatgaag 3540

　　accacatgct caacccgtac cacgctgcag aacgtggcct gatcgacgcc gtgatcctgc 3600

　　caagcgaaac ccgcggacag atttcccgca accttcgcct gctcaagcac aagaacgtca 3660

　　ctcgccctgc tcgcaagcac ggcaacatgc cactgtaagg aggaaaacta aatgtcagtc 3720

　　gagactcgca agatcaccaa ggttcttgtc gctaaccgtg gtgagattgc aatccgcgtg 3780

　　ttccgtgcag ctcgagatga aggcatcgga tctgtcgccg tctacgcaga gccagatgca 3840

　　gatgcaccat tcgtgtcata tgcagacgag gcttttgccc tcggtggcca aacatccgct 3900

　　gagtcctacc ttgtcattga caagatcatc gatgcggccc gcaagtccgg cgccgacgcc 3960

　　atccaccccg gctacggctt cctcgcagaa aacgctgact tcgcagaagc agtcatcaac 4020

　　gaaggcctga tctggattgg accttcacct gagtccatcc gctccctcgg cgacaaggtc 4080

　　accgctcgcc acatcgcaga taccgccaag gctccaatgg ctcctggcac caaggaacca 4140

　　gtaaaagacg cagcagaagt tgtggctttc gctgaagaat tcggtctccc aatcgccatc 4200

　　aaggcagctt tcggtggcgg cggacgtggc atgaaggttg cctacaagat ggaagaagtc 4260

　　gctgacctct tcgagtccgc aacccgtgaa gcaaccgcag cgttcggccg cggcgagtgc 4320

　　ttcgtggagc gctacctgga caaggcacgc cacgttgagg ctcaggtcat cgccgataag 4380

　　cacggcaacg ttgttgtcgc cggaacccgt gactgctccc tgcagcgccg tttccagaag 4440

　　ctcgtcgaag aagcaccagc accattcctc accgatgacc agcgcgagcg tctccactcc 4500

　　tccgcgaagg ctatctgtaa ggaagctggc tactacggtg caggcaccgt tgagtacctc 4560

　　gttggctccg acggcctgat ctccttcctc gaggtcaaca cccgcctcca ggtggaacac 4620

　　ccagtcaccg aagagaccac cggcatcgac ctggtccgcg aaatgttccg catcgcagaa 4680

　　ggccacgagc tctccatcaa ggaagatcca gctccacgcg gccacgcatt cgagttccgc 4740

　　atcaacggcg aagacgctgg ctccaacttc atgcctgcac caggcaagat caccagctac 4800

　　cgcgagccac agggcccagg cgtccgcatg gactccggtg tcgttgaagg ttccgaaatc 4860

　　tccggacagt tcgactccat gctggcaaag ctgatcgttt ggggcgacac ccgcgagcag 4920

　　gctctccagc gctcccgccg tgcacttgca gagtacgttg tcgagggcat gccaaccgtt 4980

　　atcccattcc accagcacat cgtggaaaac ccagcattcg tgggcaacga cgaaggcttc 5040

　　gagatctaca ccaagtggat cgaagaggtt tgggataacc caatcgcacc ttacgttgac 5100

　　gcttccgagc tcgacgaaga tgaggacaag accccagcac agaaggttgt tgtggagatc 5160

　　aacggccgtc gcgttgaggt tgcactccca ggcgatctgg cactcggtgg caccgctggt 5220

　　cctaagaaga aggccaagaa gcgtcgcgca ggtggtgcaa aggctggcgt atccggcgat 5280

　　gcagtggcag ctccaatgca gggcactgtc atcaaggtca acgtcgaaga aggcgctgaa 5340

　　gtcaacgaag gcgacaccgt tgttgtcctc gaggctatga agatggaaaa ccctgtgaag 5400

　　gctcataagt ccggaaccgt aaccggcctt actgtcgctg caggcgaggg tgtcaacaag 5460

　　ggcgttgttc tcctcgagat caagtaatct agaggaggaa aactaaatga atgttgacat 5520

　　tagccgctct cgtgaaccgt tgaacgtgga actgttgaaa gaaaaactgc tgcagaacgg 5580

　　tgatttcggt caagtgatct acgagaaggt caccggctct accaatgcgg acctgctggc 5640

　　tctggcgggc agcggcgctc caaactggac cgtcaagact gttgaatttc aggaccacgc 5700

　　ccgtggccgt ctgggtcgtc cgtggagcgc accggagggt tcccaaacca tcgtcagcgt 5760

　　tctggtccaa ctgagcattg atcaggtgga ccgtattggt acgatcccgc tggccgcagg 5820

　　cttggctgtt atggatgcgc tgaatgatct gggcgtggag ggtgcaggcc tgaaatggcc 5880

　　gaacgatgtt cagatccacg gtaagaagtt gtgcggtatt ctggttgaag caaccggctt 5940

　　cgactccact ccgaccgtgg ttatcggttg gggtacgaat atctcgttga cgaaagaaga 6000

　　gctgccggtc ccgcacgcga ccagcctggc cctggagggt gttgaagttg accgtacgac 6060

　　gttcctgatt aacatgctga cccatctgca tacccgtctg gatcagtggc agggtccgtc 6120

　　tgtggactgg ctggatgact atcgcgcggt ttgtagcagc attggccaag atgtgcgtgt 6180

　　cctgctgcct ggtgacaaag agctgctggg cgaggcgatt ggcgtggcga ccggtggtga 6240

　　gatccgtgtg cgcgacgcca gcggcacggt ccacacgctg aatgcgggtg aaatcacgca 6300

　　tctgcgtttg caataaaagc ttgtttaaac ggtctccagc ttggctgttt tggcggatga 6360

　　gagaagattt tcagcctgat acagattaaa tcagaacgca gaagcggtct gataaaacag 6420

　　aatttgcctg gcggcagtag cgcggtggtc ccacctgacc ccatgccgaa ctcagaagtg 6480

　　aaacgccgta gcgccgatgg tagtgtgggg tctccccatg cgagagtagg gaactgccag 6540

　　gcatcaaata aaacgaaagg ctcagtcgaa agactgggcc tttcgtttta tctgttgttt 6600

　　gtcggtgaac gctctcctga cgcctgatgc ggtattttct ccttacgcat ctgtgcggta 6660

　　tttcacaccg catatggtgc actctcagta caatctgctc tgatgccgca tagttaagcc 6720

　　agccccgaca cccgccaaca cccgctgacg agcttagtaa agccctcgct agattttaat 6780

　　gcggatgttg cgattacttc gccaactatt gcgataacaa gaaaaagcca gcctttcatg 6840

　　atatatctcc caatttgtgt agggcttatt atgcacgctt aaaaataata aaagcagact 6900

　　tgacctgata gtttggctgt gagcaattat gtgcttagtg catctaacgc ttgagttaag 6960

　　ccgcgccgcg aagcggcgtc ggcttgaacg aattgttaga cattatttgc cgactacctt 7020

　　ggtgatctcg cctttcacgt agtggacaaa ttcttccaac tgatctgcgc gcgaggccaa 7080

　　gcgatcttct tcttgtccaa gataagcctg tctagcttca agtatgacgg gctgatactg 7140

　　ggccggcagg cgctccattg cccagtcggc agcgacatcc ttcggcgcga ttttgccggt 7200

　　tactgcgctg taccaaatgc gggacaacgt aagcactaca tttcgctcat cgccagccca 7260

　　gtcgggcggc gagttccata gcgttaaggt ttcatttagc gcctcaaata gatcctgttc 7320

　　aggaaccgga tcaaagagtt cctccgccgc tggacctacc aaggcaacgc tatgttctct 7380

　　tgcttttgtc agcaagatag ccagatcaat gtcgatcgtg gctggctcga agatacctgc 7440

　　aagaatgtca ttgcgctgcc attctccaaa ttgcagttcg cgcttagctg gataacgcca 7500

　　cggaatgatg tcgtcgtgca caacaatggt gacttctaca gcgcggagaa tctcgctctc 7560

　　tccaggggaa gccgaagttt ccaaaaggtc gttgatcaaa gctcgccgcg ttgtttcatc 7620

　　aagccttacg gtcaccgtaa ccagcaaatc aatatcactg tgtggcttca ggccgccatc 7680

　　cactgcggag ccgtacaaat gtacggccag caacgtcggt tcgagatggc gctcgatgac 7740

　　gccaactacc tctgatagtt gagtcgatac ttcggcgatc accgcttccc tcatgatgtt 7800

　　taactttgtt ttagggcgac tgccctgctg cgtaacatcg ttgctgctcc ataacatcaa 7860

　　acatcgaccc acggcgtaac gcgcttgctg cttggatgcc cgaggcatag actgtacccc 7920

　　aaaaaaacag tcataacaag ccatgaaaac cgccactgcg ccgttaccac cgctgcgttc 7980

　　ggtcaaggtt ctggaccagt tgcgtgagcg catacgctac ttgcattaca gcttacgaac 8040

　　cgaacaggct tatgtccact gggttcgtgc cttcatccgt ttccacggtg tgcgtcaccc 8100

　　ggcaaccttg ggcagcagcg aagtcgaggc atttctgtcc tggctggcga acgagcgcaa 8160

　　ggtttcggtc tccacgcatc gtcaggcatt ggcggccttg ctgttcttct acggcaaggt 8220

　　gctgtgcacg gatctgccct ggcttcagga gatcggaaga cctcggccgt cgcggcgctt 8280

　　gccggtggtg ctgaccccgg atgaagtggt tcgcatcctc ggttttctgg aaggcgagca 8340

　　tcgtttgttc gcccagcttc tgtatggaac gggcatgcgg atcagtgagg gtttgcaact 8400

　　gcgggtcaag gatctggatt tcgatcacgg cacgatcatc gtgcgggagg gcaagggctc 8460

　　caaggatcgg gccttgatgt tacccgagag cttggcaccc agcctgcgcg agcaggggaa 8520

　　ttaattccca cgggttttgc tgcccgcaaa cgggctgttc tggtgttgct agtttgttat 8580

　　cagaatcgca gatccggctt cagccggttt gccggctgaa agcgctattt cttccagaat 8640

　　tgccatgatt ttttccccac gggaggcgtc actggctccc gtgttgtcgg cagctttgat 8700

　　tcgataagca gcatcgcctg tttcaggctg tctatgtgtg actgttgagc tgtaacaagt 8760

　　tgtctcaggt gttcaatttc atgttctagt tgctttgttt tactggtttc acctgttcta 8820

　　ttaggtgtta catgctgttc atctgttaca ttgtcgatct gttcatggtg aacagctttg 8880

　　aatgcaccaa aaactcgtaa aagctctgat gtatctatct tttttacacc gttttcatct 8940

　　gtgcatatgg acagttttcc ctttgatatg taacggtgaa cagttgttct acttttgttt 9000

　　gttagtcttg atgcttcact gatagataca agagccataa gaacctcaga tccttccgta 9060

　　tttagccagt atgttctcta gtgtggttcg ttgtttttgc gtgagccatg agaacgaacc 9120

　　attgagatca tacttacttt gcatgtcact caaaaatttt gcctcaaaac tggtgagctg 9180

　　aatttttgca gttaaagcat cgtgtagtgt ttttcttagt ccgttatgta ggtaggaatc 9240

　　tgatgtaatg gttgttggta ttttgtcacc attcattttt atctggttgt tctcaagttc 9300

　　ggttacgaga tccatttgtc tatctagttc aacttggaaa atcaacgtat cagtcgggcg 9360

　　gcctcgctta tcaaccacca atttcatatt gctgtaagtg tttaaatctt tacttattgg 9420

　　tttcaaaacc cattggttaa gccttttaaa ctcatggtag ttattttcaa gcattaacat 9480

　　gaacttaaat tcatcaaggc taatctctat atttgccttg tgagttttct tttgtgttag 9540

　　ttcttttaat aaccactcat aaatcctcat agagtatttg ttttcaaaag acttaacatg 9600

　　ttccagatta tattttatga atttttttaa ctggaaaaga taaggcaata tctcttcact 9660

　　aaaaactaat tctaattttt cgcttgagaa cttggcatag tttgtccact ggaaaatctc 9720

　　aaagccttta accaaaggat tcctgatttc cacagttctc gtcatcagct ctctggttgc 9780

　　tttagctaat acaccataag cattttccct actgatgttc atcatctgag cgtattggtt 9840

　　ataagtgaac gataccgtcc gttctttcct tgtagggttt tcaatcgtgg ggttgagtag 9900

　　tgccacacag cataaaatta gcttggtttc atgctccgtt aagtcatagc gactaatcgc 9960

　　tagttcattt gctttgaaaa caactaattc agacatacat ctcaattggt ctaggtgatt 10020

　　ttaat 10025

　　<210> 63

　　<211> 11469

　　<212> DNA

　　<213> 人工序列

　　<220>

　　<221> 来源

　　<223> /注="人工序列的描述: 合成的多核苷酸"

　　<400> 63

　　cactatacca attgagatgg gctagtcaat gataattact agtccttttc ctttgagttg 60

　　tgggtatctg taaattctgc tagacctttg ctggaaaact tgtaaattct gctagaccct 120

　　ctgtaaattc cgctagacct ttgtgtgttt tttttgttta tattcaagtg gttataattt 180

　　atagaataaa gaaagaataa aaaaagataa aaagaataga tcccagccct gtgtataact 240

　　cactacttta gtcagttccg cagtattaca aaaggatgtc gcaaacgctg tttgctcctc 300

　　tacaaaacag accttaaaac cctaaaggcg tcggcatccg cttacagaca agctgtgacc 360

　　gtctccggga gctgcatgtg tcagaggttt tcaccgtcat caccgaaacg cgcgaggcag 420

　　cagatcaatt cgcgcgcgaa ggcgaagcgg catgcattta cgttgacacc atcgaatggt 480

　　gcaaaacctt tcgcggtatg gcatgatagc gcccggaaga gagtcaattc agggtggtga 540

　　atgtgaaacc agtaacgtta tacgatgtcg cagagtatgc cggtgtctct tatcagaccg 600

　　tttcccgcgt ggtgaaccag gccagccacg tttctgcgaa aacgcgggaa aaagtggaag 660

　　cggcgatggc ggagctgaat tacattccca accgcgtggc acaacaactg gcgggcaaac 720

　　agtcgttgct gattggcgtt gccacctcca gtctggccct gcacgcgccg tcgcaaattg 780

　　tcgcggcgat taaatctcgc gccgatcaac tgggtgccag cgtggtggtg tcgatggtag 840

　　aacgaagcgg cgtcgaagcc tgtaaagcgg cggtgcacaa tcttctcgcg caacgcgtca 900

　　gtgggctgat cattaactat ccgctggatg accaggatgc cattgctgtg gaagctgcct 960

　　gcactaatgt tccggcgtta tttcttgatg tctctgacca gacacccatc aacagtatta 1020

　　ttttctccca tgaagacggt acgcgactgg gcgtggagca tctggtcgca ttgggtcacc 1080

　　agcaaatcgc gctgttagcg ggcccattaa gttctgtctc ggcgcgtctg cgtctggctg 1140

　　gctggcataa atatctcact cgcaatcaaa ttcagccgat agcggaacgg gaaggcgact 1200

　　ggagtgccat gtccggtttt caacaaacca tgcaaatgct gaatgagggc atcgttccca 1260

　　ctgcgatgct ggttgccaac gatcagatgg cgctgggcgc aatgcgcgcc attaccgagt 1320

　　ccgggctgcg cgttggtgcg gatatctcgg tagtgggata cgacgatacc gaagacagct 1380

　　catgttatat cccgccgtta accaccatca aacaggattt tcgcctgctg gggcaaacca 1440

　　gcgtggaccg cttgctgcaa ctctctcagg gccaggcggt gaagggcaat cagctgttgc 1500

　　ccgtctcact ggtgaaaaga aaaaccaccc tggcgcccaa tacgcaaacc gcctctcccc 1560

　　gcgcgttggc cgattcatta atgcagctgg cacgacaggt ttcccgactg gaaagcgggc 1620

　　agtgagcgca acgcaattaa tgtaagttag cgcgaattga tctggtttga cagcttatca 1680

　　tcgactgcac ggtgcaccaa tgcttctggc gtcaggcagc catcggaagc tgtggtatgg 1740

　　ctgtgcaggt cgtaaatcac tgcataattc gtgtcgctca aggcgcactc ccgttctgga 1800

　　taatgttttt tgcgccgaca tcataacggt tctggcaaat attctgaaat gagctgttga 1860

　　caattaatca tccggctcgt ataatgtgtg gaattgtgag cggataacaa tttcacacag 1920

　　gaaacagcgc cgctgagaaa aagcgaagcg gcactgctct ttaacaattt atcagacaat 1980

　　ctgtgtgggc actcgaccgg aattatcgat taactttatt attaaaaatt aaagaggtat 2040

　　atattaatgt atcgattaaa taaggaggaa taaaccatga aacgtctcgg aaccctggac 2100

　　gcctcctggc tggcggttga atctgaagac accccgatgc atgtgggtac gcttcagatt 2160

　　ttctcactgc cggaaggcgc accagaaacc ttcctgcgtg acatggtcac tcgaatgaaa 2220

　　gaggccggcg atgtggcacc accctgggga tacaaactgg cctggtctgg tttcctcggg 2280

　　cgcgtgatcg ccccggcctg gaaagtcgat aaggatatcg atctggatta tcacgtccgg 2340

　　cactcagccc tgcctcgccc cggcggggag cgcgaactgg gtattctggt atcccgactg 2400

　　cactctaacc ccctggattt ttcccgccct ctttgggaat gccacgttat tgaaggcctg 2460

　　gagaataacc gttttgccct ttacaccaaa atgcaccact cgatgattga cggcatcagc 2520

　　ggcgtgcgac tgatgcagag ggtgctcacc accgatcccg aacgctgcaa tatgccaccg 2580

　　ccctggacgg tacgcccaca ccaacgccgt ggtgcaaaaa ccgacaaaga ggccagcgtg 2640

　　cccgcagcgg tttcccaggc aatggacgcc ctgaagctcc aggcagacat ggcccccagg 2700

　　ctgtggcagg ccggcaatcg cctggtgcat tcggttcgac acccggaaga cggactgacc 2760

　　gcgcccttca ctggaccggt ttcggtgctc aatcaccggg ttaccgcgca gcgacgtttt 2820

　　gccacccagc attatcaact ggaccggctg aaaaacctgg cccatgcttc cggcggttcc 2880

　　ttgaacgaca tcgtgcttta cctgtgtggc accgcattgc ggcgctttct ggctgagcag 2940

　　aacaatctgc cagacacccc gctgacggct ggtataccgg tgaatatccg gccggcagac 3000

　　gacgagggta cgggcaccca gatcagtttt atgattgcct cgctggccac cgacgaagct 3060

　　gatccgttga accgcctgca acagatcaaa acctcgaccc gacgggccaa ggagcacctg 3120

　　cagaaacttc caaaaagtgc cctgacccag tacaccatgc tgctgatgtc accctacatt 3180

　　ctgcaattga tgtcaggtct cggggggagg atgcgaccag tcttcaacgt gaccatttcc 3240

　　aacgtgcccg gcccggaagg cacgctgtat tatgaaggag cccggcttga ggccatgtat 3300

　　ccggtatcgc taatcgctca cggcggcgcc ctgaacatca cctgcctgag ctatgccgga 3360

　　tcgctgaatt tcggttttac cggctgtcgg gatacgctgc cgagcatgca gaaactggcg 3420

　　gtttataccg gtgaagctct ggatgagctg gaatcgctga ttctgccacc caagaagcgc 3480

　　gcccgaaccc gcaagtaact cgaggaggaa aactaaatga ccatttcctc acctttgatt 3540

　　gacgtcgcca accttccaga catcaacacc actgccggca agatcgccga ccttaaggct 3600

　　cgccgcgcgg aagcccattt ccccatgggt gaaaaggcag tagagaaggt ccacgctgct 3660

　　ggacgcctca ctgcccgtga gcgcttggat tacttactcg atgagggctc cttcatcgag 3720

　　accgatcagc tggctcgcca ccgcaccacc gctttcggcc tgggcgctaa gcgtcctgca 3780

　　accgacggca tcgtgaccgg ctggggcacc attgatggac gcgaagtctg catcttctcg 3840

　　caggacggca ccgtattcgg tggcgcgctt ggtgaggtgt acggcgaaaa gatgatcaag 3900

　　atcatggagc tggcaatcga caccggccgc ccattgatcg gtctttacga aggcgctggc 3960

　　gctcgtattc aggacggcgc tgtctccctg gacttcattt cccagacctt ctaccaaaac 4020

　　attcaggctt ctggcgttat cccacagatc tccgtcatca tgggcgcatg tgcaggtggc 4080

　　aacgcttacg gcccagctct gaccgacttc gtggtcatgg tggacaagac ctccaagatg 4140

　　ttcgttaccg gcccagacgt gatcaagacc gtcaccggcg aggaaatcac ccaggaagag 4200

　　cttggcggag caaccaccca catggtgacc gctggtaact cccactacac cgctgcgacc 4260

　　gatgaggaag cactggattg ggtacaggac ctggtgtcct tcctcccatc caacaatcgc 4320

　　tcctacgcac cgatggaaga cttcgacgag gaagaaggcg gcgttgaaga aaacatcacc 4380

　　gctgacgatc tgaagctcga cgagatcatc ccagattccg cgaccgttcc ttacgacgtc 4440

　　cgcgatgtca tcgaatgcct caccgacgat ggcgaatacc tggaaatcca ggcagaccgc 4500

　　gcagaaaacg ttgttattgc attcggccgc atcgaaggcc agtccgttgg ctttgttgcc 4560

　　aaccagccaa cccagttcgc tggctgcctg gacatcgact cctctgagaa ggcagctcgc 4620

　　ttcgtccgca cctgcgacgc gttcaacatc ccaatcgtca tgcttgtcga cgtccccggc 4680

　　ttcctcccag gcgcaggcca ggagtacggt ggcattctgc gtcgtggcgc aaagctgctc 4740

　　tacgcatacg gcgaagcaac cgttccaaag atcaccgtca ccatgcgtaa ggcttacggc 4800

　　ggagcgtact gcgtgatggg ttccaagggc ttgggctctg acatcaacct tgcatggcca 4860

　　accgcacaga tcgccgtcat gggcgctgct ggcgcagttg gattcatcta ccgcaaggag 4920

　　ctcatggcag ctgatgccaa gggcctcgat accgtagctc tggctaagtc cttcgagcgc 4980

　　gagtatgaag accacatgct caacccgtac cacgctgcag aacgtggcct gatcgacgcc 5040

　　gtgatcctgc caagcgaaac ccgcggacag atttcccgca accttcgcct gctcaagcac 5100

　　aagaacgtca ctcgccctgc tcgcaagcac ggcaacatgc cactgtaagg aggaaaacta 5160

　　aatgtcagtc gagactcgca agatcaccaa ggttcttgtc gctaaccgtg gtgagattgc 5220

　　aatccgcgtg ttccgtgcag ctcgagatga aggcatcgga tctgtcgccg tctacgcaga 5280

　　gccagatgca gatgcaccat tcgtgtcata tgcagacgag gcttttgccc tcggtggcca 5340

　　aacatccgct gagtcctacc ttgtcattga caagatcatc gatgcggccc gcaagtccgg 5400

　　cgccgacgcc atccaccccg gctacggctt cctcgcagaa aacgctgact tcgcagaagc 5460

　　agtcatcaac gaaggcctga tctggattgg accttcacct gagtccatcc gctccctcgg 5520

　　cgacaaggtc accgctcgcc acatcgcaga taccgccaag gctccaatgg ctcctggcac 5580

　　caaggaacca gtaaaagacg cagcagaagt tgtggctttc gctgaagaat tcggtctccc 5640

　　aatcgccatc aaggcagctt tcggtggcgg cggacgtggc atgaaggttg cctacaagat 5700

　　ggaagaagtc gctgacctct tcgagtccgc aacccgtgaa gcaaccgcag cgttcggccg 5760

　　cggcgagtgc ttcgtggagc gctacctgga caaggcacgc cacgttgagg ctcaggtcat 5820

　　cgccgataag cacggcaacg ttgttgtcgc cggaacccgt gactgctccc tgcagcgccg 5880

　　tttccagaag ctcgtcgaag aagcaccagc accattcctc accgatgacc agcgcgagcg 5940

　　tctccactcc tccgcgaagg ctatctgtaa ggaagctggc tactacggtg caggcaccgt 6000

　　tgagtacctc gttggctccg acggcctgat ctccttcctc gaggtcaaca cccgcctcca 6060

　　ggtggaacac ccagtcaccg aagagaccac cggcatcgac ctggtccgcg aaatgttccg 6120

　　catcgcagaa ggccacgagc tctccatcaa ggaagatcca gctccacgcg gccacgcatt 6180

　　cgagttccgc atcaacggcg aagacgctgg ctccaacttc atgcctgcac caggcaagat 6240

　　caccagctac cgcgagccac agggcccagg cgtccgcatg gactccggtg tcgttgaagg 6300

　　ttccgaaatc tccggacagt tcgactccat gctggcaaag ctgatcgttt ggggcgacac 6360

　　ccgcgagcag gctctccagc gctcccgccg tgcacttgca gagtacgttg tcgagggcat 6420

　　gccaaccgtt atcccattcc accagcacat cgtggaaaac ccagcattcg tgggcaacga 6480

　　cgaaggcttc gagatctaca ccaagtggat cgaagaggtt tgggataacc caatcgcacc 6540

　　ttacgttgac gcttccgagc tcgacgaaga tgaggacaag accccagcac agaaggttgt 6600

　　tgtggagatc aacggccgtc gcgttgaggt tgcactccca ggcgatctgg cactcggtgg 6660

　　caccgctggt cctaagaaga aggccaagaa gcgtcgcgca ggtggtgcaa aggctggcgt 6720

　　atccggcgat gcagtggcag ctccaatgca gggcactgtc atcaaggtca acgtcgaaga 6780

　　aggcgctgaa gtcaacgaag gcgacaccgt tgttgtcctc gaggctatga agatggaaaa 6840

　　ccctgtgaag gctcataagt ccggaaccgt aaccggcctt actgtcgctg caggcgaggg 6900

　　tgtcaacaag ggcgttgttc tcctcgagat caagtaatct agaggaggaa aactaaatga 6960

　　atgttgacat tagccgctct cgtgaaccgt tgaacgtgga actgttgaaa gaaaaactgc 7020

　　tgcagaacgg tgatttcggt caagtgatct acgagaaggt caccggctct accaatgcgg 7080

　　acctgctggc tctggcgggc agcggcgctc caaactggac cgtcaagact gttgaatttc 7140

　　aggaccacgc ccgtggccgt ctgggtcgtc cgtggagcgc accggagggt tcccaaacca 7200

　　tcgtcagcgt tctggtccaa ctgagcattg atcaggtgga ccgtattggt acgatcccgc 7260

　　tggccgcagg cttggctgtt atggatgcgc tgaatgatct gggcgtggag ggtgcaggcc 7320

　　tgaaatggcc gaacgatgtt cagatccacg gtaagaagtt gtgcggtatt ctggttgaag 7380

　　caaccggctt cgactccact ccgaccgtgg ttatcggttg gggtacgaat atctcgttga 7440

　　cgaaagaaga gctgccggtc ccgcacgcga ccagcctggc cctggagggt gttgaagttg 7500

　　accgtacgac gttcctgatt aacatgctga cccatctgca tacccgtctg gatcagtggc 7560

　　agggtccgtc tgtggactgg ctggatgact atcgcgcggt ttgtagcagc attggccaag 7620

　　atgtgcgtgt cctgctgcct ggtgacaaag agctgctggg cgaggcgatt ggcgtggcga 7680

　　ccggtggtga gatccgtgtg cgcgacgcca gcggcacggt ccacacgctg aatgcgggtg 7740

　　aaatcacgca tctgcgtttg caataagttt aaacggtctc cagcttggct gttttggcgg 7800

　　atgagagaag attttcagcc tgatacagat taaatcagaa cgcagaagcg gtctgataaa 7860

　　acagaatttg cctggcggca gtagcgcggt ggtcccacct gaccccatgc cgaactcaga 7920

　　agtgaaacgc cgtagcgccg atggtagtgt ggggtctccc catgcgagag tagggaactg 7980

　　ccaggcatca aataaaacga aaggctcagt cgaaagactg ggcctttcgt tttatctgtt 8040

　　gtttgtcggt gaacgctctc ctgacgcctg atgcggtatt ttctccttac gcatctgtgc 8100

　　ggtatttcac accgcatatg gtgcactctc agtacaatct gctctgatgc cgcatagtta 8160

　　agccagcccc gacacccgcc aacacccgct gacgagctta gtaaagccct cgctagattt 8220

　　taatgcggat gttgcgatta cttcgccaac tattgcgata acaagaaaaa gccagccttt 8280

　　catgatatat ctcccaattt gtgtagggct tattatgcac gcttaaaaat aataaaagca 8340

　　gacttgacct gatagtttgg ctgtgagcaa ttatgtgctt agtgcatcta acgcttgagt 8400

　　taagccgcgc cgcgaagcgg cgtcggcttg aacgaattgt tagacattat ttgccgacta 8460

　　ccttggtgat ctcgcctttc acgtagtgga caaattcttc caactgatct gcgcgcgagg 8520

　　ccaagcgatc ttcttcttgt ccaagataag cctgtctagc ttcaagtatg acgggctgat 8580

　　actgggccgg caggcgctcc attgcccagt cggcagcgac atccttcggc gcgattttgc 8640

　　cggttactgc gctgtaccaa atgcgggaca acgtaagcac tacatttcgc tcatcgccag 8700

　　cccagtcggg cggcgagttc catagcgtta aggtttcatt tagcgcctca aatagatcct 8760

　　gttcaggaac cggatcaaag agttcctccg ccgctggacc taccaaggca acgctatgtt 8820

　　ctcttgcttt tgtcagcaag atagccagat caatgtcgat cgtggctggc tcgaagatac 8880

　　ctgcaagaat gtcattgcgc tgccattctc caaattgcag ttcgcgctta gctggataac 8940

　　gccacggaat gatgtcgtcg tgcacaacaa tggtgacttc tacagcgcgg agaatctcgc 9000

　　tctctccagg ggaagccgaa gtttccaaaa ggtcgttgat caaagctcgc cgcgttgttt 9060

　　catcaagcct tacggtcacc gtaaccagca aatcaatatc actgtgtggc ttcaggccgc 9120

　　catccactgc ggagccgtac aaatgtacgg ccagcaacgt cggttcgaga tggcgctcga 9180

　　tgacgccaac tacctctgat agttgagtcg atacttcggc gatcaccgct tccctcatga 9240

　　tgtttaactt tgttttaggg cgactgccct gctgcgtaac atcgttgctg ctccataaca 9300

　　tcaaacatcg acccacggcg taacgcgctt gctgcttgga tgcccgaggc atagactgta 9360

　　ccccaaaaaa acagtcataa caagccatga aaaccgccac tgcgccgtta ccaccgctgc 9420

　　gttcggtcaa ggttctggac cagttgcgtg agcgcatacg ctacttgcat tacagcttac 9480

　　gaaccgaaca ggcttatgtc cactgggttc gtgccttcat ccgtttccac ggtgtgcgtc 9540

　　acccggcaac cttgggcagc agcgaagtcg aggcatttct gtcctggctg gcgaacgagc 9600

　　gcaaggtttc ggtctccacg catcgtcagg cattggcggc cttgctgttc ttctacggca 9660

　　aggtgctgtg cacggatctg ccctggcttc aggagatcgg aagacctcgg ccgtcgcggc 9720

　　gcttgccggt ggtgctgacc ccggatgaag tggttcgcat cctcggtttt ctggaaggcg 9780

　　agcatcgttt gttcgcccag cttctgtatg gaacgggcat gcggatcagt gagggtttgc 9840

　　aactgcgggt caaggatctg gatttcgatc acggcacgat catcgtgcgg gagggcaagg 9900

　　gctccaagga tcgggccttg atgttacccg agagcttggc acccagcctg cgcgagcagg 9960

　　ggaattaatt cccacgggtt ttgctgcccg caaacgggct gttctggtgt tgctagtttg 10020

　　ttatcagaat cgcagatccg gcttcagccg gtttgccggc tgaaagcgct atttcttcca 10080

　　gaattgccat gattttttcc ccacgggagg cgtcactggc tcccgtgttg tcggcagctt 10140

　　tgattcgata agcagcatcg cctgtttcag gctgtctatg tgtgactgtt gagctgtaac 10200

　　aagttgtctc aggtgttcaa tttcatgttc tagttgcttt gttttactgg tttcacctgt 10260

　　tctattaggt gttacatgct gttcatctgt tacattgtcg atctgttcat ggtgaacagc 10320

　　tttgaatgca ccaaaaactc gtaaaagctc tgatgtatct atctttttta caccgttttc 10380

　　atctgtgcat atggacagtt ttccctttga tatgtaacgg tgaacagttg ttctactttt 10440

　　gtttgttagt cttgatgctt cactgataga tacaagagcc ataagaacct cagatccttc 10500

　　cgtatttagc cagtatgttc tctagtgtgg ttcgttgttt ttgcgtgagc catgagaacg 10560

　　aaccattgag atcatactta ctttgcatgt cactcaaaaa ttttgcctca aaactggtga 10620

　　gctgaatttt tgcagttaaa gcatcgtgta gtgtttttct tagtccgtta tgtaggtagg 10680

　　aatctgatgt aatggttgtt ggtattttgt caccattcat ttttatctgg ttgttctcaa 10740

　　gttcggttac gagatccatt tgtctatcta gttcaacttg gaaaatcaac gtatcagtcg 10800

　　ggcggcctcg cttatcaacc accaatttca tattgctgta agtgtttaaa tctttactta 10860

　　ttggtttcaa aacccattgg ttaagccttt taaactcatg gtagttattt tcaagcatta 10920

　　acatgaactt aaattcatca aggctaatct ctatatttgc cttgtgagtt ttcttttgtg 10980

　　ttagttcttt taataaccac tcataaatcc tcatagagta tttgttttca aaagacttaa 11040

　　catgttccag attatatttt atgaattttt ttaactggaa aagataaggc aatatctctt 11100

　　cactaaaaac taattctaat ttttcgcttg agaacttggc atagtttgtc cactggaaaa 11160

　　tctcaaagcc tttaaccaaa ggattcctga tttccacagt tctcgtcatc agctctctgg 11220

　　ttgctttagc taatacacca taagcatttt ccctactgat gttcatcatc tgagcgtatt 11280

　　ggttataagt gaacgatacc gtccgttctt tccttgtagg gttttcaatc gtggggttga 11340

　　gtagtgccac acagcataaa attagcttgg tttcatgctc cgttaagtca tagcgactaa 11400

　　tcgctagttc atttgctttg aaaacaacta attcagacat acatctcaat tggtctaggt 11460

　　gattttaat 11469

　　<210> 64

　　<211> 1173

　　<212> PRT

　　<213> 耻垢分枝杆菌

　　<400> 64

　　Met Thr Ser Asp Val His Asp Ala Thr Asp Gly Val Thr Glu Thr Ala

　　1 5 10 15

　　Leu Asp Asp Glu Gln Ser Thr Arg Arg Ile Ala Glu Leu Tyr Ala Thr

　　 20 25 30

　　Asp Pro Glu Phe Ala Ala Ala Ala Pro Leu Pro Ala Val Val Asp Ala

　　 35 40 45

　　Ala His Lys Pro Gly Leu Arg Leu Ala Glu Ile Leu Gln Thr Leu Phe

　　 50 55 60

　　Thr Gly Tyr Gly Asp Arg Pro Ala Leu Gly Tyr Arg Ala Arg Glu Leu

　　65 70 75 80

　　Ala Thr Asp Glu Gly Gly Arg Thr Val Thr Arg Leu Leu Pro Arg Phe

　　 85 90 95

　　Asp Thr Leu Thr Tyr Ala Gln Val Trp Ser Arg Val Gln Ala Val Ala

　　 100 105 110

　　Ala Ala Leu Arg His Asn Phe Ala Gln Pro Ile Tyr Pro Gly Asp Ala

　　 115 120 125

　　Val Ala Thr Ile Gly Phe Ala Ser Pro Asp Tyr Leu Thr Leu Asp Leu

　　 130 135 140

　　Val Cys Ala Tyr Leu Gly Leu Val Ser Val Pro Leu Gln His Asn Ala

　　145 150 155 160

　　Pro Val Ser Arg Leu Ala Pro Ile Leu Ala Glu Val Glu Pro Arg Ile

　　 165 170 175

　　Leu Thr Val Ser Ala Glu Tyr Leu Asp Leu Ala Val Glu Ser Val Arg

　　 180 185 190

　　Asp Val Asn Ser Val Ser Gln Leu Val Val Phe Asp His His Pro Glu

　　 195 200 205

　　Val Asp Asp His Arg Asp Ala Leu Ala Arg Ala Arg Glu Gln Leu Ala

　　 210 215 220

　　Gly Lys Gly Ile Ala Val Thr Thr Leu Asp Ala Ile Ala Asp Glu Gly

　　225 230 235 240

　　Ala Gly Leu Pro Ala Glu Pro Ile Tyr Thr Ala Asp His Asp Gln Arg

　　 245 250 255

　　Leu Ala Met Ile Leu Tyr Thr Ser Gly Ser Thr Gly Ala Pro Lys Gly

　　 260 265 270

　　Ala Met Tyr Thr Glu Ala Met Val Ala Arg Leu Trp Thr Met Ser Phe

　　 275 280 285

　　Ile Thr Gly Asp Pro Thr Pro Val Ile Asn Val Asn Phe Met Pro Leu

　　 290 295 300

　　Asn His Leu Gly Gly Arg Ile Pro Ile Ser Thr Ala Val Gln Asn Gly

　　305 310 315 320

　　Gly Thr Ser Tyr Phe Val Pro Glu Ser Asp Met Ser Thr Leu Phe Glu

　　 325 330 335

　　Asp Leu Ala Leu Val Arg Pro Thr Glu Leu Gly Leu Val Pro Arg Val

　　 340 345 350

　　Ala Asp Met Leu Tyr Gln His His Leu Ala Thr Val Asp Arg Leu Val

　　 355 360 365

　　Thr Gln Gly Ala Asp Glu Leu Thr Ala Glu Lys Gln Ala Gly Ala Glu

　　 370 375 380

　　Leu Arg Glu Gln Val Leu Gly Gly Arg Val Ile Thr Gly Phe Val Ser

　　385 390 395 400

　　Thr Ala Pro Leu Ala Ala Glu Met Arg Ala Phe Leu Asp Ile Thr Leu

　　 405 410 415

　　Gly Ala His Ile Val Asp Gly Tyr Gly Leu Thr Glu Thr Gly Ala Val

　　 420 425 430

　　Thr Arg Asp Gly Val Ile Val Arg Pro Pro Val Ile Asp Tyr Lys Leu

　　 435 440 445

　　Ile Asp Val Pro Glu Leu Gly Tyr Phe Ser Thr Asp Lys Pro Tyr Pro

　　 450 455 460

　　Arg Gly Glu Leu Leu Val Arg Ser Gln Thr Leu Thr Pro Gly Tyr Tyr

　　465 470 475 480

　　Lys Arg Pro Glu Val Thr Ala Ser Val Phe Asp Arg Asp Gly Tyr Tyr

　　 485 490 495

　　His Thr Gly Asp Val Met Ala Glu Thr Ala Pro Asp His Leu Val Tyr

　　 500 505 510

　　Val Asp Arg Arg Asn Asn Val Leu Lys Leu Ala Gln Gly Glu Phe Val

　　 515 520 525

　　Ala Val Ala Asn Leu Glu Ala Val Phe Ser Gly Ala Ala Leu Val Arg

　　 530 535 540

　　Gln Ile Phe Val Tyr Gly Asn Ser Glu Arg Ser Phe Leu Leu Ala Val

　　545 550 555 560

　　Val Val Pro Thr Pro Glu Ala Leu Glu Gln Tyr Asp Pro Ala Ala Leu

　　 565 570 575

　　Lys Ala Ala Leu Ala Asp Ser Leu Gln Arg Thr Ala Arg Asp Ala Glu

　　 580 585 590

　　Leu Gln Ser Tyr Glu Val Pro Ala Asp Phe Ile Val Glu Thr Glu Pro

　　 595 600 605

　　Phe Ser Ala Ala Asn Gly Leu Leu Ser Gly Val Gly Lys Leu Leu Arg

　　 610 615 620

　　Pro Asn Leu Lys Asp Arg Tyr Gly Gln Arg Leu Glu Gln Met Tyr Ala

　　625 630 635 640

　　Asp Ile Ala Ala Thr Gln Ala Asn Gln Leu Arg Glu Leu Arg Arg Ala

　　 645 650 655

　　Ala Ala Thr Gln Pro Val Ile Asp Thr Leu Thr Gln Ala Ala Ala Thr

　　 660 665 670

　　Ile Leu Gly Thr Gly Ser Glu Val Ala Ser Asp Ala His Phe Thr Asp

　　 675 680 685

　　Leu Gly Gly Asp Ser Leu Ser Ala Leu Thr Leu Ser Asn Leu Leu Ser

　　 690 695 700

　　Asp Phe Phe Gly Phe Glu Val Pro Val Gly Thr Ile Val Asn Pro Ala

　　705 710 715 720

　　Thr Asn Leu Ala Gln Leu Ala Gln His Ile Glu Ala Gln Arg Thr Ala

　　 725 730 735

　　Gly Asp Arg Arg Pro Ser Phe Thr Thr Val His Gly Ala Asp Ala Thr

　　 740 745 750

　　Glu Ile Arg Ala Ser Glu Leu Thr Leu Asp Lys Phe Ile Asp Ala Glu

　　 755 760 765

　　Thr Leu Arg Ala Ala Pro Gly Leu Pro Lys Val Thr Thr Glu Pro Arg

　　 770 775 780

　　Thr Val Leu Leu Ser Gly Ala Asn Gly Trp Leu Gly Arg Phe Leu Thr

　　785 790 795 800

　　Leu Gln Trp Leu Glu Arg Leu Ala Pro Val Gly Gly Thr Leu Ile Thr

　　 805 810 815

　　Ile Val Arg Gly Arg Asp Asp Ala Ala Ala Arg Ala Arg Leu Thr Gln

　　 820 825 830

　　Ala Tyr Asp Thr Asp Pro Glu Leu Ser Arg Arg Phe Ala Glu Leu Ala

　　 835 840 845

　　Asp Arg His Leu Arg Val Val Ala Gly Asp Ile Gly Asp Pro Asn Leu

　　 850 855 860

　　Gly Leu Thr Pro Glu Ile Trp His Arg Leu Ala Ala Glu Val Asp Leu

　　865 870 875 880

　　Val Val His Pro Ala Ala Leu Val Asn His Val Leu Pro Tyr Arg Gln

　　 885 890 895

　　Leu Phe Gly Pro Asn Val Val Gly Thr Ala Glu Val Ile Lys Leu Ala

　　 900 905 910

　　Leu Thr Glu Arg Ile Lys Pro Val Thr Tyr Leu Ser Thr Val Ser Val

　　 915 920 925

　　Ala Met Gly Ile Pro Asp Phe Glu Glu Asp Gly Asp Ile Arg Thr Val

　　 930 935 940

　　Ser Pro Val Arg Pro Leu Asp Gly Gly Tyr Ala Asn Gly Tyr Gly Asn

　　945 950 955 960

　　Ser Lys Trp Ala Gly Glu Val Leu Leu Arg Glu Ala His Asp Leu Cys

　　 965 970 975

　　Gly Leu Pro Val Ala Thr Phe Arg Ser Asp Met Ile Leu Ala His Pro

　　 980 985 990

　　Arg Tyr Arg Gly Gln Val Asn Val Pro Asp Met Phe Thr Arg Leu Leu

　　 995 1000 1005

　　Leu Ser Leu Leu Ile Thr Gly Val Ala Pro Arg Ser Phe Tyr Ile

　　 1010 1015 1020

　　Gly Asp Gly Glu Arg Pro Arg Ala His Tyr Pro Gly Leu Thr Val

　　 1025 1030 1035

　　Asp Phe Val Ala Glu Ala Val Thr Thr Leu Gly Ala Gln Gln Arg

　　 1040 1045 1050

　　Glu Gly Tyr Val Ser Tyr Asp Val Met Asn Pro His Asp Asp Gly

　　 1055 1060 1065

　　Ile Ser Leu Asp Val Phe Val Asp Trp Leu Ile Arg Ala Gly His

　　 1070 1075 1080

　　Pro Ile Asp Arg Val Asp Asp Tyr Asp Asp Trp Val Arg Arg Phe

　　 1085 1090 1095

　　Glu Thr Ala Leu Thr Ala Leu Pro Glu Lys Arg Arg Ala Gln Thr

　　 1100 1105 1110

　　Val Leu Pro Leu Leu His Ala Phe Arg Ala Pro Gln Ala Pro Leu

　　 1115 1120 1125

　　Arg Gly Ala Pro Glu Pro Thr Glu Val Phe His Ala Ala Val Arg

　　 1130 1135 1140

　　Thr Ala Lys Val Gly Pro Gly Asp Ile Pro His Leu Asp Glu Ala

　　 1145 1150 1155

　　Leu Ile Asp Lys Tyr Ile Arg Asp Leu Arg Glu Phe Gly Leu Ile

　　 1160 1165 1170

Claims

2.根据权利要求1所述的重组宿主细胞，其中具有反-2,顺-3-癸烯酰基-ACP异构酶活性的多肽为FabA或FabM。

3.根据权利要求1所述的重组宿主细胞，其中具有β-酮脂酰基-ACP合酶II活性的多肽为FabF。

4.根据权利要求1所述的重组宿主细胞，其中具有丙二酰基-CoA-ACP酰基转移酶活性的多肽为FabD。

5.根据权利要求1所述的重组宿主细胞，其中具有β-酮脂酰基-ACP合酶I活性的多肽为FabF或FabB。

6.根据权利要求1所述的重组宿主细胞，其中具有β-酮脂酰基-ACP还原酶活性的多肽为FabG。

7.根据权利要求1所述的重组宿主细胞，其中具有β-酮脂酰基-ACP合酶III活性的多肽为FabH。

8.根据权利要求1所述的重组宿主细胞，其中具有烯酰基-ACP还原酶活性的多肽为FabI、FabL、FabV或FabK。

9.根据权利要求1所述的重组宿主细胞，其中具有3-羟基-酰基-[acp]脱水酶活性的多肽为FabA或FabZ。

10.根据权利要求1所述的重组宿主细胞，其中具有烯酰基-ACP还原酶活性的多肽为FabV。