CN1816632A

CN1816632A - 用于改变产油酵母多不饱和脂肪酸和油含量的酰基转移酶

Info

Publication number: CN1816632A
Application number: CNA2004800191499A
Authority: CN
Inventors: N·S·亚达夫; H·张
Original assignee: EI Du Pont de Nemours and Co
Current assignee: EIDP Inc
Priority date: 2003-07-02
Filing date: 2004-07-02
Publication date: 2006-08-09
Also published as: BRPI0412052A; US7267976B2; US20060160193A1; WO2005003322A2; US7901928B2; KR20060030065A; US20070054385A1; CA2527089A1; US20080124786A1; NO20060522L; EP1664320A2; US7521223B2; WO2005003322A3; US7465565B2; US20090269828A1

Abstract

提供了两种酰基转移酶，该酶适用于用产油酵母(例如解脂西洋蓍酵母(Yarrowia lipolytica))制备富含ω脂肪酸的微生物油。具体地讲，从解脂西洋蓍酵母(Y.lipolytica)中分离编码磷脂酰胆碱－二酰基甘油酰基转移酶(PDAT)和二酰基甘油酰基转移酶(DGAT2)的基因。这些基因编码参与酵母的油生物合成最后一步的酶。这些基因各自有望在改变产油酵母的油中所产生的多不饱和脂肪酸的产量方面起到重要作用。

Description

用于改变产油酵母多不饱和脂肪酸和油含量的酰基转移酶

本申请要求于2003年7月2日申请的美国临时申请号60/484599的权益。

发明领域

本发明属于生物技术领域。更具体地讲，本发明涉及对编码磷脂：二酰基甘油酰基转移酶和二酰基甘油酰基转移酶的核酸片段的鉴定。这些酶可用于改变产油微生物例如产油酵母的含油量。

发明背景

本发明涉及产油酵母的开发，该酵母积蓄富含长链ω-3和/或ω-6多不饱和脂肪酸(“PUFA”，例如18∶3、18∶4、20∶3、20∶4、20∶5、22∶6脂肪酸)的油。因此，除了开发将合适的脂肪酸去饱和酶和延伸酶(elongase)引入这些特定宿主生物体(其中天然产生的PUFA通常仅限于产生18∶2脂肪酸[而很少产生18∶3脂肪酸])中的技术之外，也有必要在其合成后，增加PUFA向贮存脂库中的转移。

大多数游离脂肪酸与辅酶A(CoA)会发生酯化反应，产生酰基-CoA。这些分子随后在细胞内质网中作为甘油酯合成的底物，在此产生磷脂酸和二酰基甘油(DAG)。或者这些代谢中间产物都可以用于直接合成膜磷脂(例如磷脂酰甘油、磷脂酰乙醇胺、磷脂酰胆碱)，或者DAG可以用于直接合成三酰基甘油(TAG)，TAG是真核细胞脂质的主要贮存物质。

在酿酒酵母(Saccharomyces cerevisiae)中，合成TAG的三个途径已有描述。首先，TAG借助二酰基甘油酰基转移酶的活性主要由DAG和酰基-CoA合成。然而，最近已经鉴定磷脂：二酰基甘油酰基转移酶负责将磷脂和DAG分别转化为溶血磷脂和TAG，因此通过不依赖酰基-CoA的机制产生TAG(Dahlqvist等，PNAS.97(12)：6487-6492(2000))。最后，已知两个酰基-CoA：固醇-酰基转移酶利用酰基-CoA和固醇，产生固醇酯(和少量TAG；参见Sandager等，Biochem.Soc.Trans.28(6)：700-702(2000))。

一份关于酵母TAG生物合成的小而全的综述是由D.Sorger和G.Daum(Appl.Microbiol.Biotechnol.61：289-299(2003))撰写，该文中包括所涉及的基因和导致TAG合成的代谢中间产物的细节。然而，作者承认，迄今为止所做的大部分工作全都集中在酿酒酵母上，而TAG的形成和调节方面仍然存在着大量疑问。在该生物体中，最终已证明只有4个基因参与贮存脂合成，即ARE1和ARE2(编码酰基-CoA：固醇-酰基转移酶)、LRO1(编码磷脂：二酰基甘油酰基转移酶即PDAT酶)和DGA1(编码二酰基甘油酰基转移酶即DGAT2酶)(Sandager，L.等，J.Biol.Chem.277(8)：6478-6482(2002))。在其它生物体中已经鉴定了这些基因的同源物并发表在公开文献上，但是这些基因都不是从产油酵母中分离的。此外，尚未开发出改进产油酵母中脂肪酸向TAG库转移的技术。因此，需要鉴定并分离编码酰基转移酶的基因，所述基因将会适合于产油酵母产生PUFA并将PUFA积蓄在贮存脂库(即TAG部分)中。

通常鉴定为产油酵母的属包括但不限于：西洋蓍酵母属(Yarrowia)、假丝酵母属(Candida)、红酵母属(Rhodotorula、红冬孢酵母属(Rhodosporidium)、隐球酵母属(Cryptococcus)、丝孢酵母属(Trichosporon)和油脂酵母属(Lipomyces)。更具体地讲，说明性的产油酵母包括：红冬孢酵母(Rhodosporidium toruloides)、油脂酵母(Lipomyces starkeyii)、产油油脂酵母(L.lioferus)、拉考夫假丝酵母(Candida revkaufi)、铁红假丝酵母(C.pulcherrima)、热带假丝酵母(C.tropicalis)、产朊假丝酵母(C.utilis)、茁牙丝孢酵母(Trichosporonpullans)、丝孢酵母(T.cutaneum)、红酵母(Rhodotorula glutinus)、牧草红酵母(R.graminis)和解脂西洋蓍酵母(Yarrowia lipolytica)(以前曾称为解脂假丝酵母(Candida lipolytica))。这些生物体可积蓄高达其细胞干重80％的油；并且已经很好地开发了高含油量产油酵母的培养技术(例如参见EP 0 005 277B1；Ratledge，C.，Prog.Ind Microbiol.16：119-206(1982))。最近，已经通过遗传工程增加了产油酵母的天然能力(大多数仅限于18∶2脂肪酸的产生)，导致在转化体解脂西洋蓍酵母中产生20∶4(花生四烯酸)、20∶5(二十碳五烯酸)和22∶6(二十二碳六烯酸)PUFA。可通过将编码ω-3/ω-6生物合成途径的异源基因导入产油宿主中并使其表达，产生这些ω-3和ω-6脂肪酸(参见同时待审的美国申请号10/840579)。

PUFA的重要性是毫无疑问的。例如，某些PUFA对健康细胞来说是重要的生物组分，并且被称为“必需”脂肪酸，其在哺乳动物体内不能从头合成，而只能从膳食中获取或者通过亚油酸(LA)或α-亚麻酸(ALA)进一步去饱和和延伸而获得；细胞质膜组成，在此发现它们呈磷脂或TAG形式；适当的发育所必需(特别是在发育的婴儿脑中)并且用于组织形成和修复；而且，作为哺乳动物中的几种重要的生物活性花生酸类(例如前列环素、花生酸类、白三烯、前列腺素)的前体。另外，长链ω-3PUFA的高摄入对心血管产生保护作用(Dyerberg，J.等，Amer.J.Clin Nutr.28：958-966(1975)；Dyerberg，J.等，Lancet 2(8081)：117-119(1978年7月15日)；Shimokawa，H.，World Rev NutrDiet，88：100-108(2001)；von Schacky.C.和Dyerberg，J.，World Rev NutrDiet，88：90-99(2001))。而且，其它大量的研究成果大都包括因给予ω-3和/或ω-6脂肪酸而带来的抗各种症状和疾病(例如哮喘、银屑病、湿疹、糖尿病、癌症)的健康益处。

PUFA通常可分为两大类(由ω-6和ω-3脂肪酸组成)，其分别通过必需脂肪酸LA和ALA的去饱和和延伸而获得。尽管各种来自天然来源的市售PUFA[例如月见草、琉璃苣和红醋栗的种子；丝状真菌(被孢霉属(Mortierella))、紫球藻属(Porphyridium)(红藻)、鱼油和海洋浮游生物(小环藻属(Cyclotella)、菱形藻属(Nitzschia)、Crypthecodinium)]，但是这些生产方法有几个缺点(例如高度不均一的油组成，环境污染物的积蓄，因天气/疾病导致的可用性上的无法控制的波动，商业规模的价格)。由于这些缺陷，在以下方面进行了广泛深入的研究：1)开发易于商业生产的PUFA的重组体来源；和2)修饰脂肪酸生物合成途径，使其能够产生所需的PUFA。最近几年来，已经在各种生物体的脂肪酸去饱和酶和延伸酶基因的分离、克隆和操作方面取得了许多进展。有关这些基因序列的知识给在天然不产生PUFA的新的宿主生物体中产生需要的脂肪酸和/或脂肪酸组成，带来了希望。

正如Picataggio等(同时待审的美国专利申请号10/840579)所述，产油酵母已经鉴定为合适的微生物系统，其中表达PUFA去饱和酶和延伸酶基因，使得能够在这些特定宿主中经济地生产商业量的一种或多种PUFA。然而，为了进一步推进上文所述工作(即开发积蓄富含ω-3和/或ω-6脂肪酸的油的产油酵母)，有必要当通过脂肪酸去饱和酶和延伸酶合成PUFA时，增加这些PUFA向贮藏TAG(油)的转移。因此，需要鉴定并分离编码酰基转移酶的基因，所述基因将会适合于产生PUFA并以TAG形式积蓄PUFA。也必须开发改进产油酵母脂肪酸向TAG库转移的技术。

申请人已经通过从产油酵母解脂西洋蓍酵母中分离编码PDAT和DGAT2的基因，解决了上述问题。这些基因使得能够修饰产油酵母游离脂肪酸(例如ω-3和/或ω-6脂肪酸)向TAG库的转移。

发明概述

本发明涉及从西洋蓍酵母属中发现的两个基因，其中一个编码磷脂：二酰基甘油酰基转移酶，而另一个编码二酰基甘油酰基转移酶。所述基因及其所编码的酶可用于在微生物、特别是在产油酵母中操纵商业用油的生产。因此，本发明提供编码二酰基甘油酰基转移酶的分离的核酸分子，所述分子选自：

(a)编码选自SEQ ID NO：31、78和79的氨基酸序列的分离的核酸分子；

(b)在以下杂交条件下与(a)杂交的分离的核酸分子：0.1X SSC，0.1％SDS，65℃，用2X SSC、0.1％SDS洗涤，接着用0.1X SSC、0.1％SDS洗涤；或

(c)与(a)或(b)完全互补的分离的核酸分子。

在另一个实施方案中，本发明提供编码磷脂：二酰基甘油酰基转移酶的分离的核酸分子，所述分子选自：

(a)编码SEQ ID NO：46所示的氨基酸序列的分离的核酸分子；

(c)与(a)或(b)完全互补的分离的核酸分子。

同样，本发明提供多肽，所述多肽具有由本发明分离的核酸分子以及这些分子的遗传嵌合体所编码的二酰基甘油酰基转移酶和磷脂：二酰基甘油酰基转移酶活性；和包含它们的宿主细胞。

在一个优选的实施方案中，本发明提供增加转化宿主细胞中的三酰基甘油含量的方法，所述方法包括：

(a)提供转化宿主细胞，所述细胞包含：

(i)至少一个在合适的调节序列控制下编码酰基转移酶的基因，所述酰基转移酶具有选自SEQ ID NO：31、78、79和46的氨基酸序列；和

(ii)脂肪酸源；

(b)在以下条件下培养步骤(a)的细胞：其中至少一个编码酰基转移酶的基因被表达，致使将脂肪酸转移给三酰基甘油；和

(c)任选回收步骤(b)的三酰基甘油。

在一个另外的优选实施方案中，本发明提供增加转化宿主细胞体中的三酰基甘油的ω-3或ω-6脂肪酸含量的方法，所述方法包括：

(a)提供转化宿主细胞，所述细胞包含：

(i)至少一个编码ω-3/ω-6脂肪酸生物合成途径中的至少一种酶的基因；和

(ii)至少一个在合适的调节序列控制下编码酰基转移酶的基因，所述酰基转移酶具有选自SEQ ID NO：31、78、79和46的氨基酸序列；

(b)在以下条件下培养步骤(a)的细胞：其中(i)和(ii)的基因被表达，致使产生至少一种ω-3或ω-6脂肪酸并将其转移给三酰基甘油；和

(c)任选回收步骤(b)的三酰基甘油。

附图简述和序列描述

图1显示产油酵母脂质积蓄的生物化学机制的示意图。

图2显示ω-3和ω-6脂肪酸生物合成途径。

图3显示用于解脂西洋蓍酵母基因表达的质粒载体pY5和pY5-13的构建。

图4A显示使用ClustalW分析在不同酵母和真菌DGAT2酶之间的配对比较。相比之下，图4B显示不同酵母和真菌PDAT酶之间的配对比较。

图5A和图5B显示来自以下生物体的已知甘油醛-3-磷酸脱氢酶(GPD)蛋白的序列比对：酿酒酵母(Saccharomyces cerevisiae)(GenBank检索号CAA24607)、粟酒裂殖酵母(Schizosaccharomyces pombe)(GenBank检索号NP_595236)、米曲霉(Aspergillus oryzae)(GenBank检索号AAK08065)、褐牙鲆(Paralichthys olivaceus)(GenBank检索号BAA88638)、有爪蟾蜍(Xenopus laevis)(GenBank检索号P51469)和原鸡(Gallus gallus)(GenBank检索号DECHG3)，用于鉴定序列比对中的两个保守区。

根据以下详述和所附序列描述，可以更全面地理解本发明，这些描述构成本申请的组成部分。

以下序列符合37C.F.R.§1.821-1.825(“Requirements for PatentApplications Containing Nucleotide Sequences and/or Amino SequencesDisclosures-the Sequence Rules(对含核苷酸序列和/或氨基酸序列公开内容的专利申请的要求)”)并符合世界知识产权组织(WIPO)标准ST.25(1998)和EPO和PCT的序列表要求(法规5.2和49.5(a-bis)和Administrative Instructions的第208节和附录C)。用于核苷酸和氨基酸序列数据的符号和格式符合37C.F.R.§1.822所提出的规定。

SEQ ID NO：1和2分别为引物TEF5′和TEF3′，用于分离TEF启动子。

SEQ ID NO：3和4分别为引物XPR5′和XPR3′，用于分离XPR2转录终止子。

SEQ ID NO：5-16分别为引物YL5、YL6、YL9、YL10、YL7、YL8、YL3、YL4、YL1、YL2、YL61和YL62，用于质粒构建。

SEQ ID NO：17为含有大肠杆菌(E.coli)潮霉素抗性基因的1kBDNA片段(SEQ ID NO：18所提供的氨基酸序列)。

SEQ ID NO：19为含有西洋蓍酵母Ura3基因(SEQ ID NO：20所提供的氨基酸序列)的1.7kB DNA片段，所述片段用引物KU5和KU3(分别为SEQ ID NO：21和22)来扩增。

SEQ ID NO：23和25为简并引物，分别鉴定为P7和P8，用于分离解脂西洋蓍酵母DGAT2。

SEQ ID NO：24和26为分别对应于简并引物P7和P8的氨基酸共有序列。

SEQ ID NO：27-29分别为引物P80、P81和LinkAmp引物1，用于染色体步查。

SEQ ID NO：30显示包含ORF的2119bp DNA序列，其编码解脂西洋蓍酵母(Y.lipolytica)DGAT2。SEQ ID NO：31长度为514个氨基酸残基并且对应于SEQ ID NO：30的核苷酸+291至+1835；SEQ IDNO：78长度为459个氨基酸残基并且对应于SEQ ID NO：30的核苷酸+456至+1835；SEQ ID NO：79长度为355个氨基酸残基并且对应于SEQ ID NO：30的核苷酸+768至+1835，如SEQ ID NO：86所示。

SEQ ID NO：32-35分别为引物P95、P96、P97和P98，用于定向破坏解脂西洋蓍酵母DGAT2基因。

SEQ ID NO：36-38分别为引物P115、P116和P112，用于筛选定向整合破坏的解脂西洋蓍酵母DGAT2基因。

SEQ ID NO：39和41是分别鉴定为P26和P27的简并引物，用于分离解脂西洋蓍酵母PDAT。

SEQ ID NO：40和42为分别对应于简并引物P26和P27氨基酸共有序列。

SEQ ID NO：43和44分别为引物P39和P42，用于扩增解脂西洋蓍酵母PDAT基因的1008bp部分。

SEQ ID NO：45显示编码解脂西洋蓍酵母PDAT的DNA序列(ORF＝核苷酸+274至+2217)，SEQ ID NO：46显示相应的PDAT氨基酸序列。

SEQ ID NO：47和48分别为引物P41和P40，用于定向破坏解脂西洋蓍酵母PDAT基因。

SEQ ID NO：49-52分别为引物P51、P52、P37和P38，用于筛选定向整合破坏的解脂西洋蓍酵母PDAT基因。

SEQ ID NO：53为引物P79，用于从拯救质粒扩增全长解脂西洋蓍酵母DGAT2基因。

SEQ ID NO：54和55分别为引物P84和P85，用于从拯救质粒扩增全长解脂西洋蓍酵母PDAT基因。

SEQ ID NO：56为971bp片段，所述片段称为“GPDPro”并且鉴定为解脂西洋蓍酵母中的推定甘油醛-3-磷酸脱氢酶(GPD)启动子。

SEQ ID NO：57-62分别为以下微生物的GPD氨基酸序列：酿酒酵母(GenBank检索号CAA24607)、粟酒裂殖酵母(GenBank检索号NP_595236)、米曲霉(GenBank检索号AAK08065)、褐牙鲆(GenBank检索号BAA88638)、有爪蟾蜍(GenBank检索号P51469)和原鸡(GenBank检索号DECHG3)。

SEQ ID NO：63和64为GPD蛋白的保守氨基酸区。

SEQ ID NO：65和66分别为简并引物YL193和YL194，用于分离解脂西洋蓍酵母GPD基因的内在部分。

SEQ ID NO：67编码解脂西洋蓍酵母GPD基因的507bp内在部分，SEQ ID NO：68为相应的氨基酸序列。

SEQ ID NO：69-71分别为引物YL206、YL207和YL208，用于染色体步查。

SEQ ID NO：72为1848bp片段，所述片段称为“GPDP”，并且包含解脂西洋蓍酵母GPD基因上游的1525bp和代表该GPD基因5＇部分的额外323bp。

SEQ ID NO：73和74分别为引物P145和P146，用于扩增全长解脂西洋蓍酵母DGAT2基因。

SEQ ID NO：75和76分别为引物YPDAT5和YPDAT3，用于扩增全长解脂西洋蓍酵母PDAT基因。

SEQ ID NO：77为引物LinkAmp引物2，用于染色体步查。

SEQ ID NO：80和81分别为引物GPD-1和GPD-2，用于扩增酿酒酵母甘油醛-3-磷酸脱氢酶(GPD)启动子。

SEQ ID NO：82和83分别为引物ADHT-1和ADHT-2，用于扩增酿酒酵母醇脱氢酶(ADH1)终止子。

SEQ ID NO：84和85分别为引物UP 161和LP 162，用于产生酿酒酵母LRO 1打靶盒(targeting cassette)。

发明详述

根据本发明，申请人已经分离并证实编码磷脂：二酰基甘油酰基转移酶(PDAT)和二酰基甘油酰基转移酶(DGAT2)的解脂西洋蓍酵母基因的身份，所述酶用于将脂肪酸转移给贮藏三酰基甘油(TAG)。这可用于改变产油酵母所产生的长链多不饱和脂肪酸(PUFA)的数量。

本发明发现许多实用性。通过本文所公开的方法积蓄的PUFA或其衍生物可用作膳食代用品或补充剂，特别是婴儿配方食品，用于经静脉内喂食的患者或者用于预防或治疗营养不良。或者，可以将纯化的PUFA(或其衍生物)掺入到调配的烹饪用油、脂或人造黄油中，使得接受者在正常使用中能获取所需量的食物增补剂。也可以将PUFA掺入到婴儿配方食品、营养补充剂或其它食品中并且可以用作抗炎药或降胆固醇药。任选所述组合物可用于药用(人用或兽用)。在此情况下，PUFA通常经口服给予，但是也可以通过能让其成功吸收的任何途径给予，例如胃肠外(例如皮下、肌内或静脉内)、直肠、阴道或局部(例如皮肤软膏剂或洗剂)。

用通过重组方法产生的PUFA，来给人或动物补充营养，可以提高加入的PUFA以及代谢产物的水平。例如，用花生四烯酸(ARA)治疗，不仅使ARA水平升高，而且使ARA下游产物(例如前列腺素)的水平升高。复杂的调节机制可以使其令人满意地结合不同PUFA或加入不同的PUFA缀合物，以便预防、控制或克服所述机制，在个体中达到特定PUFA的所需水平。

定义

本文中记载的内容中使用了大量术语和缩写词。提供以下定义。

“可读框”缩写为ORF。

“聚合酶链式反应”缩写为PCR。

“美国典型培养物保藏中心”缩写为ATCC。

“多不饱和脂肪酸”缩写为PUFA。

“磷脂：二酰基甘油酰基转移酶”缩写为PDAT。

“二酰基甘油酰基转移酶”缩写为DGAT。

“二酰基甘油”缩写为DAG。

“三酰基甘油”缩写为TAG。

“辅酶A”缩写为CoA。

术语“脂肪酸”是指约C₁₂-C₂₂(尽管已知更长和更短链长的酸)的不同链长的长链脂族酸(烷酸)。主要的链长在C₁₆和C₂₂之间。脂肪酸的结构用简单的符号“X:Y”表示，其中X为具体脂肪酸的总碳原子数，Y为双键数。

通常，脂肪酸分为饱和或不饱和两大类。术语“饱和脂肪酸”是指在其碳主链间没有“双键”的脂肪酸。相比之下，“不饱和脂肪酸”在其碳主链上具有“双键”(其通常呈顺式构型)。“单不饱和脂肪酸”在其碳主链上仅有一个“双键”(例如通常在第9个和第10个碳原子之间，例如棕榈油酸(16∶1)和油酸(18∶1))，“多不饱和脂肪酸”(即“PUFA”)在碳主链上具有至少两个双键(例如对于亚油酸(18∶2)来说是在第9个和第10个、以及第12个和第13个碳原子之间，而对于α-亚麻酸(18∶3)来说是在第9个和第10个、第12个和第13个、以及第15个和第16个之间)。

“PUFA”可分为两大类(取决于最靠近所述脂肪酸碳链甲基端的第一个双键的位置(n))。因此，“ω-6脂肪酸”(ω-6或n-6)从分子的ω(甲基)端开始的第6个碳原子上有第一个不饱和双键并且另外还有总共两个或更多个双键，其后的各不饱和出现在朝分子羧基端方向的第3个额外碳原子上。相比之下，“ω-3脂肪酸”(ω-3或n-3)具有从分子ω端的第3个碳原子开始的第一个不饱和双键并且另外还有总共三个或更多个双键，其后的各不饱和出现在朝分子羧基端方向的第3个额外碳原子上。

对于本发明的内容，可以使用ω参比系统来指定碳数目，双键数及其双键距离ω碳的位置(为了此目的，从ω碳开始计数，ω碳编号为1)。该命名法见下表1“简写符号”一栏。该表的其余部分总结了ω-3和ω-6脂肪酸的通用名称、其在本说明书中所用的缩写词以及各化合物的化学名称。

表1

多不饱和脂肪酸的命名

通用名称	缩写词	化学名称	简写符号
通用名称	缩写词	化学名称	简写符号	亚油酸	LA	顺-9，12-十八碳二烯酸	18∶2ω-6
γ-亚油酸	GLA	顺-6，9，12-十八碳三烯酸	18∶3ω-6	亚油酸	LA	顺-9，12-十八碳二烯酸	18∶2ω-6
γ-亚油酸	GLA	顺-6，9，12-十八碳三烯酸	18∶3ω-6	二高-γ-亚油酸	DGLA	顺-8，11，14-二十碳三烯酸	20∶3ω-6
花生四烯酸	ARA	顺-5，8，11，14-二十碳四烯酸	20∶4ω-6	二高-γ-亚油酸	DGLA	顺-8，11，14-二十碳三烯酸	20∶3ω-6
花生四烯酸	ARA	顺-5，8，11，14-二十碳四烯酸	20∶4ω-6	α-亚麻酸	ALA	顺-9，12，15-十八碳三烯酸	18∶3ω-3
十八碳四烯酸	STA	顺-6，9，12，15-十八碳四烯酸	18∶4ω-3	α-亚麻酸	ALA	顺-9，12，15-十八碳三烯酸	18∶3ω-3
十八碳四烯酸	STA	顺-6，9，12，15-十八碳四烯酸	18∶4ω-3	二十碳四烯酸	ETA	顺-8，11，14，17-二十碳四烯酸	20∶4ω-3
二十碳五烯酸	EPA	顺-5，8，11，14，17-二十碳五烯酸	20∶5ω-3	二十碳四烯酸	ETA	顺-8，11，14，17-二十碳四烯酸	20∶4ω-3
二十碳五烯酸	EPA	顺-5，8，11，14，17-二十碳五烯酸	20∶5ω-3	二十二碳五烯酸	DPA	顺-7，10，13，16，19-二十二碳五烯酸	22∶5ω-3
二十二碳六烯酸	DHA	顺-4，7，10，13，16，19-二十二碳六烯酸	22∶6ω-3	二十二碳五烯酸	DPA	顺-7，10，13，16，19-二十二碳五烯酸	22∶5ω-3

“微生物油”或“单细胞油”是由微生物(例如藻类、产油酵母和丝状真菌)在其生命周期中天然产生的油。术语“油”是指在25℃时为液体且通常是多不饱和的脂质。相比之下，术语“脂(肪)”是指在25℃时为固体且通常是饱和的脂质。

“脂肪体”是指通常被特异性蛋白和单层磷脂所包裹的脂肪滴。这些细胞器是大多数生物体转移/贮藏中性脂质的位置。认为脂肪体来自含有TAG-生物合成酶的内质网微结构域；并且其合成和大小看来是由特异性蛋白组分所控制的。

“中性脂质”是指在细胞脂肪体中通常发现的作为贮藏脂肪和油的脂质，其之所以这样命名是因为在细胞pH下，该脂质不带电荷。通常，它们完全是非极性的，不亲水。中性脂质通常是指甘油与脂肪酸的单酯、二酯和/或三酯，也分别称为单酰基甘油、二酰基甘油或TAG(或者统称为酰基甘油)。只有发生水解反应，才能从酰基甘油中释放游离脂肪酸。

术语“三酰基甘油”、“油”和“TAG”是指中性脂质，其由三个脂肪酰基与一个甘油分子酯化而成(该术语在本发明内容中可互换使用)。所述油可含有长链PUFA，以及短链饱和和不饱和脂肪酸和长链饱和脂肪酸。因此“油的生物合成”通常是指细胞中TAG的合成。

术语“DAG AT”是指二酰基甘油酰基转移酶(亦称酰基-CoA-二酰基甘油酰基转移酶或二酰基甘油O-酰基转移酶)(EC 2.3.1.20)。该酶负责将酰基-CoA和1，2-二酰基甘油转化成TAG和CoA(因此参与TAG生物合成的最后一步)。DAG AT酶有两个家族即DGAT1和DGAT2。前一个家族与酰基-CoA：胆固醇酰基转移酶(ACAT)基因家族具有同源性，而后一个家族与此无关(Lardizabal等，J.Biol.Chem.276(42)：38862-28869(2001))。代表性的DGAT2酶是由酿酒酵母DGA1基因(GenBank检索号NC_001147的基因座NP_014888；Oelkers等，J.Biol.Chem.277：8877(2002))编码；从解脂西洋蓍酵母中分离的编码DGAT2的基因示于SEQ ID NO：30。

术语“PDAT”是指磷脂：二酰基甘油酰基转移酶(EC 2.3.1.158)。该酶负责将酰基从磷脂的sn-2位转移到1，2-二酰基甘油的sn-3位，因而产生溶血磷脂和TAG(因此参与TAG生物合成的最后一步)。该酶与DGAT(EC 2.3.1.20)的不同之处在于，其通过不依赖酰基-CoA的机制合成TAG。代表性的PDAT酶是由酿酒酵母LRO1基因编码(Dahlqvist等，Proc.Natl.Acad.Sci.USA 97：6487(2000))；从解脂西洋蓍酵母中分离的编码PDAT的基因示于SEQ ID NO：45。

术语“PUFA生物合成途径酶”是指与PUFA生物合成有关的以下任何酶(和编码所述酶的基因)，包括：Δ4去饱和酶、Δ5去饱和酶、Δ6去饱和酶、Δ12去饱和酶、Δ15去饱和酶、Δ17去饱和酶、Δ9去饱和酶、Δ8去饱和酶和/或延伸酶。

术语“ω-3/ω-6脂肪生物合成途径”是指图2所示的基因编码的酶促途径，其用于从油酸经不同中间产物转化成DHA。

术语“去饱和酶”是指可去饱和的多肽，即可以在一个或多个脂肪酸中引入双键，以产生单不饱和脂肪酸或多不饱和脂肪酸。尽管在本说明书中使用ω参比系统，以说明特定脂肪酸，但是更方便的是使用δ系统，从底物的羧基端开始计数，来表示去饱和酶的活性。本文特别感兴趣的是：Δ12去饱和酶，其在从脂肪酸分子羧基端开始编号的第12个和第13个碳原子之间进行去饱和并催化油酸转化成LA；Δ15去饱和酶，其催化LA转化成ALA；Δ17去饱和酶，其催化ARA转化成EPA和/或DGLA转化成ETA；Δ6去饱和酶，其催化LA转化成GLA和/或ALA转化成STA；Δ5去饱和酶，其催化DGLA转化成ARA和/或ETA转化成EPA；Δ4去饱和酶，其催化DPA转化成DHA；Δ8去饱和酶，其催化二十碳二烯酸(EDA；C20:2)转化成DGLA和/或二十碳三烯酸(ETrA；C20:3)转化成ETA；A9去饱和酶，其催化棕榈酸转化成棕榈油酸(16∶1)和/或硬脂酸转化成油酸(18∶1)。

术语“延伸酶”是指能延伸脂肪酸碳链产生比该延伸酶所作用的脂肪酸底物长两个碳的脂肪酸的多肽。该延伸反应发生在与脂肪酸合酶相关的多步骤机制中，其中CoA是酰基载体(Lassner等，ThePlant Cell 8：281-292(1996))。简而言之，丙二酰CoA与长链酰基-CoA缩合，得到CO₂和β-酮酰基-CoA(其中酰基部分已延长了两个碳原子)。后续反应包括还原成为β-羟基酰基-CoA，脱水成为烯酰基-CoA，第二次还原成为延伸的酰基-CoA。延伸酶所催化的反应实例是GLA转化成DGLA，STA转化成ETA，EPA转化成DPA。因此，延伸酶可具有不同的特异性。例如，C_16/18延伸酶将优选C₁₆底物，C_18/20延伸酶将优选C₁₈底物，C_20/22延伸酶将优选C₂₀底物。按照类似方式，Δ9延伸酶能分别催化LA和ALA转化成二十碳二烯酸(EDA；C20:2)和二十碳三烯酸(ETrA；C20:3)。

术语“转化效率”和“％底物转化率”是指特定酶(例如去饱和酶或延伸酶)将底物转化成产物的效率。转化效率按以下公式计算：([产物]/[底物+产物])*100，其中“产物”包括在所述途径中从底物获得的中间产物和所有产物。

术语“产油(生物体)”是指能够以TAG形式贮藏其能源的生物体(Weete，载于：Fungal Lipid Biochemistry，第2版，Plenum，1980)。通常这些微生物的细胞含油量符合S形曲线，其中脂质浓度在对数生长期后期或稳定生长期早期时增加到最大值，然后在稳定期晚期和死亡期逐渐下降(Yongmanitchai和Ward，Appl.Environ.Microbiol.57：419-25(1991))。

术语“产油酵母”是指这样的酵母类微生物：其能积蓄至少达细胞干重25％的油。产油酵母的实例包括但不限于以下属：西洋蓍酵母属、假丝酵母属、红酵母属、红冬孢酵母属、隐球酵母属、丝孢酵母属和油脂酵母属。

术语“可发酵碳底物”是指可以被微生物代谢产生能量的碳源。本发明典型的碳底物包括但不限于：单糖、寡糖、多糖、烷烃、脂肪酸、脂肪酸酯、甘油单酯、二氧化碳、甲醇、甲醛、甲酸酯和含碳胺。

本文所用的“分离的核酸片段”是单链或双链RNA或DNA的聚合物，其任选含有合成的、非天然的或经改变的核苷酸碱基。呈DNA聚合物形式的分离的核酸片段可包含一个或多个cDNA区段、基因组DNA区段或合成DNA区段。

当核酸分子的单链形式在合适的温度和溶液离子强度条件下可与其它核酸分子退火时，所述核酸分子与cDNA、基因组DNA或RNA分子等其它核酸分子是“可杂交的”。杂交和洗涤条件是众所周知的，以下列文献为例：Sambrook，J.，Fritsch，E.F.和Maniatis，T.Molecular Cloning：A Laboratory Manual，第2版，Cold Spring HarborLaboratory：Cold Spring Harbor，NY(1989)，特别是第11章和表11.1(所述文献通过引用全部结合到本文中)。温度和离子强度条件决定杂交的“严格性”。可以调节严格性条件，以筛选中度相似片段(例如来自亲缘关系较远的生物体的同源序列)到高度相似片段(例如来自亲缘关系较近的生物体的复制功能酶的基因)。杂交后洗涤决定严格性条件。一组优选的条件采用一系列这样的洗涤：开始用6X SSC、0.5％SDS在室温下洗涤15分钟，然后用2X SSC、0.5％SDS在45℃重复洗涤30分钟，最后用0.2X SSC、0.5％SDS在50℃重复洗涤30分钟。更优选的一组严格性条件采用更高温度，其中洗涤与上述洗涤相同，只是最后两次30分钟在0.2X SSC、0.5％SDS中的洗涤温度升至60℃。另一个优选的一组高度严格性条件采用的最后两次洗涤是在0.1XSSC、0.1％SDS中在65℃进行。另外的一组严格性条件包括例如在0.1X SSC、0.1％SDS中于65℃进行杂交，用2X SSC、0.1％SDS进行洗涤，接着用0.1X SSC、0.1％SDS洗涤。

杂交需要两个核酸含有互补序列，尽管取决于杂交的严格性，但是碱基之间可能会有错配。用于核酸杂交的合适的严格性取决于核酸长度和互补程度，其变化是本领域众所周知的。两个核苷酸序列之间的相似性或同源性程度越高，则具有所述序列的核酸杂交的Tm值也越大。核酸杂交的相对稳定性(对应于较高Tm)按以下顺序依次递减：RNA:RNA、DNA:RNA、DNA:DNA。对于长度大于100个核苷酸的杂交体，可以推导计算Tm的方程式(参见Sambrook等，出处同上，9.50-9.51)。对于较短核酸即寡核苷酸的杂交，错配的位置更重要，且寡核苷酸的长度决定其特异性(参见Sambrook等，出处同上，11.7-11.8)。在一个实施方案中，可杂交核酸的长度至少约为10个核苷酸。优选可杂交核酸的最短长度至少约为15个核苷酸；更优选至少约20个核苷酸；最优选其长度至少约为30个核苷酸。此外，技术人员将会理解，可按探针长度等因素所需来调整温度和洗涤液的盐浓度。

氨基酸或核苷酸序列的“实质部分”，是包含多肽的氨基酸序列或基因的核苷酸序列，所述序列足以推定性地鉴定所述多肽或基因，无论是通过本领域技术人员手工进行序列评价，还是使用BLAST(Basic Local Alignment Search Tool；Altschul，S.F.等，J.Mol.Biol.215：403-410(1993)等算法，通过计算机自动序列比较和鉴定。一般而言，为了推定性地鉴定多肽或核酸序列与已知蛋白或基因是同源的，必须要10个或更多相邻氨基酸序列或30个或更多核苷酸序列才行。此外，对于核苷酸序列，在基因鉴定(例如DNA杂交)和分离(例如细菌菌落或噬菌体噬斑的原位杂交)的序列依赖性方法中，可使用包含20-30个相邻核苷酸的基因特异性寡核苷酸探针。另外，在PCR中，也可使用12-15个碱基的短寡核苷酸作为扩增引物，以便获得包含所述引物的特定核酸片段。因此，核苷酸序列的“实质部分”包括这样的序列，其足以特异性地鉴定和/或分离含有所述序列的核酸片段。本发明说明书中公开了编码一种或多种特定酵母蛋白的部分或完整氨基酸和核苷酸序列。具有本发明所报道序列好处的技术人员，现在可以使用所公开的序列的所有部分或实质部分，用于本领域技术人员已知的目的。因此，本发明包括所附序列表中所示的完整序列、以及如上限定的序列的实质部分。

术语“互补”用于描述核苷酸碱基之间能够彼此杂交的关系。例如，对于DNA，腺嘌呤与胸腺嘧啶互补，胞嘧啶与鸟嘌呤互补。因此，本发明也包括与所附序列表所示的完整序列互补的分离的核酸片段，及其基本相似的核酸序列。

如本领域已知的术语“％同一性”是两个或更多多肽序列之间或者两个或更多多核苷酸序列之间通过序列比较而确定的关系。在本领域中“同一性”也指多肽序列之间或多核苷酸序列之间通过所述序列各序列段之间匹配而确定的序列相关性程度。可通过包括但不限于以下已知方法，容易地计算“同一性”和“相似性”：1.)Computational Molecular Biology(Lesk，A.M.编著)Oxford University：NY(1988)；2.) Biocomputing：Informatics and Genome Projects(Smith，D.W.编著)Academic：NY(1993)；3.) Computer Analysis of Sequence Data，第I部分(Griffin，A.M.和Griffin，H.G.编著)Humania：NJ(1994)；4.) Sequence Analysis in Molecular Biology(von Heinje，G.编著)Academic(1987)；5.) Sequence Analysis Primer(Gribskov，M.和Devereux，J.编著)Stockton：NY(1991)。设计测定同一性的优选方法，以给出待测序列之间的最佳匹配。已经将测定同一性和相似性的方法编写成公共可用的计算机程序。可以使用LASERGENE生物信息学计算机程序组(Suite)的Megalign程序(DNASTAR Inc.，Madison，WI)，进行序列比对和％同一性计算。可以使用比对的Clustal方法(Higgins和Sharp，CABIOS.5：151-153(1989))，使用默认参数(空位罚分＝10，空位长度罚分＝10)，进行多重序列比对。使用Clustal方法进行配对序列比对的默认参数为：KTUPLE 1，GAP PENALTY＝3，WINDOW＝5和DIAGONALS SAVED＝5。

合适的核酸片段(本发明的分离的多核苷酸)编码这样的多肽：所述多肽与本文所述的氨基酸序列具有至少约70％同一性，优选至少约75％同一性，更优选至少约80％同一性。优选的核酸片段编码与本文所述氨基酸序列具有约85％同一性的氨基酸序列。更优选的核酸片段编码具有与本文所述氨基酸序列具有至少约90％同一性的氨基酸序列。最优选的核酸片段编码与本文所述氨基酸序列具有至少约95％同一性的氨基酸序列。合适的核酸片段不仅具有以上同一性，而且通常编码这样的多肽：所述多肽具有至少50个氨基酸，优选至少100个氨基酸，更优选至少150个氨基酸，还更优选至少200个氨基酸，最优选至少250个氨基酸。

术语“序列分析软件”是指用于分析核苷酸序列或氨基酸序列的任何计算机算法或软件程序。“序列分析软件”可以是市售的或者是独立开发的。通常序列分析软件包括但不限于：1.)程序的GCG程序组(Wisconsin软件包第9.0版，Genetics Computer Group(GCG)，Madison，WI)；2.)BLASTP，BLASTN，BLASTX(Altschul等，J. Mol.Biol.215：403-410(1990))；3.)DNASTAR(DNASTAR，Inc.Madison，WI)；4.)Sequencher(Gene Codes Corporation，Ann Arbor，MI)；5.)掺入Smith-Waterman算法的FASTA程序(W.R.Pearson，Comput.Methods Genome Res.，[国际会议论文集](1994)，会议日期1992年111-20.Suhai，Sandor.Plenum编著：New York，NY)。在本说明书的上下文中，可以理解，当序列分析软件用于分析时，分析结果将基于参考程序的“默认值”，除非另有说明。本文所用的“默认值”是指当首次启动软件时最初安装的数值组或参数组。

“密码子简并性”是指遗传密码子的特性，该特性允许核苷酸序列发生变异而不会影响所编码多肽的氨基酸序列。技术人员熟知特定宿主细胞在使用核苷酸密码子去规定某一给定氨基酸的过程中所表现出的“密码子偏好性”。因此，当合成基因以改善在宿主细胞中的表达时，最好设计该基因，使得其密码子使用的频率接近所述宿主细胞的优选密码子使用频率。

术语“密码子优化”，当指基因或核酸分子编码区时，是指修饰密码子，使得所改变的密码子反映出宿主生物体的典型密码子使用而不改变其DNA所编码的多肽。

“合成基因”可以从寡核苷酸构件装配而成，所述寡核苷酸构件是用本领域技术人员已知方法化学合成的。这些构件连接并退火，形成基因区段，然后经酶促装配以构建完整基因。因此，所述基因可根据核苷酸序列的优化为最佳基因表达定制，以反映出宿主细胞的密码子偏好。技术人员知道成功基因表达的可能性，如果密码子使用偏好其宿主所偏好的密码子的话。优选密码子的确定可以根据来源于宿主细胞的基因的调查，其中序列信息是可获得的。

“基因”是指表达特定蛋白质的核酸片段，包括编码序列之前的调节序列(5′非编码序列)和之后的调节序列(3′非编码序列)。“天然基因”是指如在自然界发现的一样、具有其自身调节序列的基因。“嵌合基因”是指非天然基因的任何基因，包括自然界未发现在一起的调节序列和编码序列。因此，嵌合基因可包含其来源不同的调节序列和编码序列，或者包含其来源相同的、但排列方式不同于天然方式的调节序列和编码序列。“内源基因”是指在生物体基因组天然位置上的天然基因。“外源”基因是指在宿主生物体中并非正常存在的、而是通过基因转移引入到宿主生物体中的基因。外源基因可包括插入到非天然生物体中的天然基因，即嵌合基因。“转基因”是通过转化方法引入到基因组中的基因。“密码子优化基因”是具有经设计宿主细胞密码子使用频率来模拟其优选密码子使用频率的基因。

“编码序列”是指编码特定氨基酸序列的DNA序列。“合适的调节序列”是指位于编码序列上游(5′非编码序列)、编码序列之中或下游(3′非编码序列)的核苷酸序列，该调节序列能影响所连接的编码序列的转录、RNA加工或稳定性、或翻译。调节序列可以包括启动子、翻译前导序列、内含子、聚腺苷酸化识别序列、RNA加工位点、效应物结合位点和茎-环结构。

“启动子”是指能控制编码序列或功能性RNA表达的DNA序列。一般而言，编码序列位于启动子序列的3′。启动子可完全来自天然基因，或者可有来自天然存在的不同启动子的不同元件组成，或者甚至可包括合成DNA区段。本领域技术人员可以理解，不同的启动子可在不同的组织或细胞类型中、或在不同的发育阶段、或在响应不同的环境或生理条件下，指导基因的表达。使基因在大多数细胞类型中、在大部分时间内表达的启动子通常称为“组成型启动子”。也认识到，既然在大多数情况下并没有完全限定调节序列的确切界限，所以不同长度的DNA片段可具有相同的启动子活性。

术语“3′非编码序列”或“转录终止子”是指位于编码序列下游的DNA序列。其包括聚腺苷酸化识别序列和其它编码能够影响mRNA加工或基因表达的调节信号的序列。通常，聚腺苷酸化信号的特征在于影响聚腺苷酸序列段添加到mRNA前体的3′端。3′区可以影响所连接的编码序列的转录、RNA加工或稳定性、或翻译。

“RNA转录物”是指由RNA聚合酶催化的DNA序列转录而产生的产物。当RNA转录物是DNA序列完全互补的拷贝时，称其为初级转录物，或者它可以是来自初级转录物转录后加工所获得的RNA序列，称其为成熟RNA。“信使RNA”或“mRNA”是指无内含子并且可以被细胞翻译成蛋白质的RNA。“cDNA”是指与mRNA互补并且来该mRNA的双链DNA。“有义”RNA是指包括其mRNA并因此可被细胞翻译成蛋白质的RNA转录物。“反义RNA”是指与目标初级转录物或mRNA全部或部分互补并阻断目标基因表达的RNA转录物(U.S.5,107,065；WO 99/28508)。反义RNA的互补性可以是与特定基因转录物的任何部分互补，即与5′非编码序列、3′非编码序列或编码序列互补。“功能性RNA”是指反义RNA、核酶RNA或其它不翻译但仍对细胞过程有影响的RNA。

术语“操作性连接”是指一个核酸片段上核酸序列的连接方式，使得其中一个核酸序列的功能受到另一个核酸序列的影响。例如当启动子能够影响编码序列的表达时，所述启动子与所述编码序列操作性连接(即所述编码序列处于所述启动子的转录控制之下)。编码序列可以有义或反义方向与调节序列操作性连接。

本文所用的术语“表达”是指来自本发明核酸片段的有义(mRNA)或反义RNA的转录和稳定累积。表达也可以指将mRNA翻译成多肽。

“转化”是指将核酸分子转移到宿主生物体中，导致遗传稳定的遗传。核酸分子可以是例如自主复制的质粒；或者它可以整合到宿主生物体的基因组中。含有转化核酸片段的宿主生物体称为“转基因”或“重组”生物或“转化”生物。

术语“质粒”、“载体”和“盒”是指通常携带不是细胞主要代谢活动的组成部分且通常呈环状双链DNA片段形式的基因的额外染色体元件。所述元件可以是来自不同来源的自主复制序列、基因组整合序列、噬菌体或核苷酸序列、线状或环状、单链或双链DNA或RNA，其中许多核苷酸序列已经连接在一起或者重组到独特的构建体中，所述构建体能将启动子片段和用于选择基因产物的DNA序列以及合适的3′非翻译序列导入细胞中。“转化盒”是指含有外源基因并具有除外源基因外的其它元件的特定载体，所述载体能促进特定宿主细胞的转化。“表达盒”是含有外源基因并具有除外源基因外的其它元件的特定载体，所述载体能增加所述基因在外源宿主中的表达。

术语“同源重组”是指两个DNA分子之间的DNA片段交换(在交换期间)。交换的片段邻接两个DNA分子之间相同的核苷酸序列位点(即“同源区”)。术语“同源区”是指核苷酸序列在彼此具有同源性并参与同源重组的核酸片段上的一段序列。在这些长度至少约为10bp的同源区内可发生有效的同源重组，其中优选长度至少约50bp。计划重组的典型片段含有至少两个同源区，其中最好是中靶基因的破坏或置换。

本文所用的标准重组DNA和分子克隆技术是本领域众所周知的，并且描述于Sambrook，J.，Fritsch，E.F.和Maniatis，T.， Molecular Cloning：A LaboratoryManual，第2版，Cold Spring Harbor Lab oratory：Cold Spring Harbor，NY(1989)(下文称为“Maniatis”)；Silhavy，T.J.，Bennan，M.L.和Enquist，L.W.， Experiments with Gene FusionsColdSpring Harbor Laboratory：Cold Spring Harbor，NY(1984)；Ausubel，F.M.等， Current Protocols in Molecular Biology，Greene Publishing Assoc.and Wiley-Interscience出版(1987)。

脂肪酸和三酰基甘油的微生物生物合成

一般而言，产油微生物中脂质积蓄是响应生长培养基中存在的总碳氮比而触发的(图1)。当细胞剥夺可利用的氮供给时(例如当碳氮比大于约10时)，细胞腺苷一磷酸(AMP)的耗尽会引起线粒体中AMP依赖性异柠檬酸脱氢酶活性停止并积蓄柠檬酸，将柠檬酸转运到胞质溶胶中，随后用ATP-柠檬酸裂合酶切割柠檬酸，产生乙酰CoA和草酰乙酸。乙酰CoA是脂肪酸从头生物合成的主要构件。尽管可以有效代谢成乙酰CoA的任何化合物都可以作为脂肪酸的前体，但是葡萄糖在此类反应中是主要碳源(图1)。葡萄糖通过糖酵解转化成丙酮酸，丙酮酸再被转运到线粒体中，在此它可被丙酮酸脱氢酶(“PD”)转化为乙酰CoA。因为乙酰CoA不能直接穿过线粒体膜转运到细胞质中，所以来自乙酰CoA的两个碳与草酰乙酸缩合，形成柠檬酸(由柠檬酸合酶催化)。柠檬酸直接转运到细胞质，在此被ATP-柠檬酸裂合酶切割，再产生乙酰CoA和草酰乙酸。草酰乙酸通过转化成苹果酸而再次进入三羧酸循环。

丙二酰CoA的合成是脂肪酸生物合成的第一步，该步发生在细胞质中。通过乙酰CoA羧化酶(“ACC”)进行的乙酰CoA羧化，产生丙二酰CoA。脂肪酸合成是由多酶脂肪酸合酶复合体(“FAS”)催化而完成的，并且通过缩合8个含有2个碳原子的片段(来自乙酰CoA的乙酰基)而发生，形成含有16个碳原子的饱和脂肪酸，即棕榈酸。更具体地讲，FAS催化包含下列7个反应系列(Smith，S.FASEB J，8(15)：1248-59(1994))：

1.乙酰CoA和丙二酰CoA转移到FAS的酰基载体肽(ACP)上。然后将乙酰基转移到丙二酰基上，形成β-酮丁酰-ACP，释放CO2。

2.β-酮丁酰-ACP经过还原(通过β-酮酰还原酶)和脱水(通过β-羟基酰基脱水酶)，形成反式-单不饱和脂酰基。

3.双键被NADPH还原，得到比开始长两个碳的饱和脂酰基。然后丁酰基与新的丙二酰基的缩合并重复延伸步骤的能力得到再生。

4.当脂酰基长度到达16个碳时，硫脂酶活性将其水解，释放游离棕榈酸(16∶0)。

尽管棕榈酸合成是在胞质溶胶中进行的，但更长链饱和脂肪酸衍生物和不饱和脂肪酸衍生物的形成却是在线粒体和内质网(ER)中进行的，其中ER是占优势的系统。具体地讲，棕榈酸(16∶0)通过延伸酶和去饱和酶的作用作为硬脂酸(18∶0)、棕榈油酸(16∶1)和油酸(18∶1)的前体。例如，棕榈酸和硬脂酸通过Δ9去饱和酶的作用，分别转化成其不饱和衍生物即棕榈油酸(16∶1)和油酸(18∶1)。

TAG(脂肪酸的主要贮藏单元)通过包括以下反应在内的一系列反应而形成：1.)一分子酰基-CoA与甘油-3-磷酸通过酰基转移酶进行酯化，产生溶血磷脂酸；2.)第二分子酰基-CoA通过酰基转移酶进行酯化，产生1，2-二酰基甘油磷酸(通常称为磷脂酸)；3.)通过磷脂酸磷酸酶除去磷酸基，得到1，2-二酰基甘油(DAG)；4.)通过DAG酰基转移酶(例如PDAT、DGAT2或DGAT2)的作用，加入第三脂肪酸，形成TAG(图1)。

许多脂肪酸都可以掺入到TAG中，包括饱和脂肪酸和不饱和脂肪酸以及短链脂肪酸和长链脂肪酸。可通过酰基转移酶(例如DGAT2或PDAT)而掺入到TAG中的脂肪酸的一些非限制性实例包括：癸酸(10∶0)、月桂酸(12∶0)、肉豆蔻酸(14∶0)、棕榈酸(16∶0)、棕榈油酸(16∶1)、硬脂酸(18∶0)、油酸(18∶1)、十八碳-11-烯酸(18∶1)、亚油酸(18∶2)、桐油酸(18∶3)、γ-亚麻酸(18∶3)、α-亚麻酸(18∶3)、十八碳四烯酸(18∶4)、花生酸(20∶0)、二十碳二烯酸(20∶2)、二高-γ-亚油酸(20∶3)、二十碳三烯酸(20∶3)、花生四烯酸(20∶4)、二十碳四烯酸(20∶4)、二十碳五烯酸(20∶5)、山萮酸(22∶0)、二十二碳五烯酸(22∶5)、二十二碳六烯酸(22∶6)、木蜡酸(24∶0)、神经酸(24∶1)、蜡酸(26∶0)和褐煤酸(28∶0)。在本发明优选实施方案中，最希望将PUFA掺入到TAG中。

编码DGAT2的其因

从前认为DGAT1(负责第三酰基转移酶反应，其中酰基-CoA基团从酰基-CoA转移到DAG的sn-3位，形成TAG)是参与TAG合成中的唯一特异性酶。该酶已知与酰基-CoA：胆固醇酰基转移酶(ACAT)同源；然而，最近的研究已经鉴定出与ACAT基因家族无关的新的DAG酰基转移酶家族。因此，目前的命名法能区别与ACAT基因家族有关(DGAT1家族)和无关(DGAT2家族)的DAG酰基转移酶(Lardizabal等，J.Biol.Chem.276(42)：38862-28869(2001))。DGAT2家族成员看来存在于真核生物的所有主要种群中(真菌、植物、动物和原始真核生物)。

通过遗传学方法已经鉴定出许多编码DGAT2酶的基因，而且这些基因中的某些基因的DNA序列是公众可获得的。例如，一些非限制性实例包括以下GenBank检索号：NC_001147(基因座NP014888；酿酒酵母)；NM_012079(人)；NM_127503、AF051849和AJ238008(拟南芥(Arabidopsis thaliana))；NM_026384、NM_010046和AB057816(小鼠)；AY093657(猪)；AB062762(大鼠)；AF221132(新秀丽小杆线虫(Caenorhabditis elegans))；AF391089和AF391090(拉曼被孢霉(Mortierella ramanniana))；AF129003(烟草(Nicotiana tabacum))；以及AF251794和AF164434(欧洲油菜(Brassica napus))。另外，专利文献提供了DGAT2基因的许多另外的DNA序列(和/或有关几个以上基因及其分离方法的细节)。参见例如US 2003/124126(Cases等)；US 2003/115632、US2003/0028923和US2004/0107459(Lardizabal等)；WO 2001/034814(Banas等)。

尽管有几个编码DGAT2的完整和不完整序列的公开内容(出处同上)，但是这些序列极少显示出DGAT2活性。只有以下工作例外：1.)Bouvier-Nave，P.等(Biochem.Soc.Trans.28(6)：692-695(2000))，其中新秀丽小杆线虫的DGAT2在酿酒酵母中表达，导致TAG含量的增加以及微粒体油酰基-CoA：DAG酰基转移酶活性的增加；和2.)Lardizabal等(出处同上；另见US 2003/0028923A1和US 2004/0107459A1)，其中真菌拉曼被孢霉的两个DGAT2在昆虫细胞中表达，导致在从这些细胞中分离出的膜上的高水平DGAT活性。除了这些通过DGAT2的过量表达而增加油生物合成的实例之外，破坏编码DGAT2的基因也显示出降低细胞TAG含量(Oelkers等，J Biol Chem.277(11)：8877-81(2002)；Sandager等，J Biol Chem.277：6478-6482(2002)；Sorger和Daum.J.Bacteriol.184：519-524(2002))。

编码PDAT的基因

Dahlqvist等(Proc.Nat.Acad.Sci.(USA)97：6487-6492(2000))和Oelkers等(J.Biol.Chem.275：15609-15612(2000))最近发现，在缺乏酰基-CoA的条件下，也可通过不依赖酰基-CoA的PDAT酶，进行TAG合成。具体地讲，PDAT从磷脂酰胆碱底物的sn-2位除去酰基，用于转移到DAG的sn-3位，以产生TAG；尽管PDAT的功能尚未如DGAT2那样得到很好表征，但是已经推测PDAT在一些含油种子植物中在从磷脂除去“不常见”脂肪酸中起到主要作用(Banas，A.等，Biochem.Soc.Trans.28(6)：703-705(2000))。

PDAT与蛋白的卵磷脂：胆固醇酰基转移酶(LCAT)家族在结构上相关。通过遗传学方法已经鉴定出几个编码PDAT酶的基因，而且这些基因中的某些基因的DNA序列是公众可获得的。例如，一些非限制性实例包括以下GenBank检索号：P40345(酿酒酵母)；O94680和NP_596330(粟酒裂殖酵母)；和NP_190069和AB006704[gi：2351069]拟南芥)。另外，专利文献提供了PDAT基因的许多另外的DNA序列(和/或有关几个以上基因及其分离方法的细节)；参见例如WO2000/060095(Dahlqvist等)。

与DGAT2的方法类似，完成了PDAT在酿酒酵母中的过量表达，以增加油的生物合成。例如，过量表达编码PDAT的酿酒酵母LRO1基因，导致TAG含量增加，证明该酶参与TAG的形成(Dahlqvist等，Proc.Nat.Acad.Sci.(USA)97：6487-6492(2000)；Oelkers等，J.Biol.Chem.275：15609-15612(2000))。相比之下，已经发现，LRO1基因的缺失会引起TAG合成的明显减少(Oelkers等，出处同上)。

ω-3和ω-6多不饱和脂肪酸的生物合成

将LA转化成GLA、DGLA和ARA(ω-6途径)以及将ALA转化成STA、ETA、EPA、DPA和DHA(ω-3途径)的代谢过程包括通过加入2碳单元使碳链延伸，以及通过引入双键使分子去饱和(图2)。这需要一系列去饱和和延伸酶。具体地讲，通过Δ12去饱和酶的作用，将油酸转变成LA(18∶2)，即第一个ω-6脂肪酸。然后如下产生ω-6脂肪酸：1.)通过Δ6去饱和酶的活性，将LA转化成GLA；2.)通过延伸酶的作用，将GLA转化成DGLA；3.)通过Δ5去饱和酶的作用，将DGLA转化成ARA。按照类似方式，通过Δ15去饱和酶的作用，将亚油酸(LA)转化成ALA，即第一个ω-3脂肪酸。随后，按照类似ω-6脂肪酸的一系列步骤，产生ω-3脂肪酸。具体地讲，1.)通过Δ6去饱和酶的活性，将ALA转化成STA；2.)通过延伸酶的活性，将STA转化成ETA；3.)通过Δ5去饱和酶的活性，将ETA转化成EPA。或者，可以通过Δ17去饱和酶的活性，分别从DGLA和ARA，产生ETA和EPA。通过延伸酶和A4去饱和酶的活性，将EPA进一步转化成DHA。

在替代实施方案中，A9延伸酶能够分别催化LA和ALA转化成二十碳二烯酸(EDA；C20:2)和二十碳三烯酸(ETrA；C20:3)。然后，Δ8去饱和酶将这些产物分别转化成DGLA和ETA。

许多微生物，包括藻类、细菌、霉菌、真菌和酵母菌，在细胞代谢常规途径中都可以合成PUFA和ω脂肪酸。研究特别深入的是真菌，包括Schizochytrium aggregatm、破囊壶菌属(Thraustochytrium)的许多种和高山被孢霉(Mortierella alpina)。另外，许多沟鞭藻类(甲藻科(Dinophyceaae))天然产生高浓度的PUFA。这样，通过遗传学方法已经鉴定出参与PUFA产生的多种去饱和酶基因和延伸酶基因，而且这些基因中的某些基因的DNA序列是公众可获得的(非限制性实例见下表2)：

表2

参与PUFA产生的一些公众可获得的基因

Genbank检索号	描述
Genbank检索号	描述	AY131238	摩洛哥坚果(Argania spinosa)Δ6去饱和酶
Y055118	Echium pitardii var.pitardii Δ6去饱和酶	AY131238	摩洛哥坚果(Argania spinosa)Δ6去饱和酶
Y055118	Echium pitardii var.pitardii Δ6去饱和酶	AY055117	Echium gentianoides Δ6去饱和酶
AF296076	鲁氏毛霉(Mucor rouxii)Δ6去饱和酶	AY055117	Echium gentianoides Δ6去饱和酶
AF296076	鲁氏毛霉(Mucor rouxii)Δ6去饱和酶	AF007561	玻璃苣(Borago offcinalis)Δ6去饱和酶
L11421	蓝细菌(Synechocystis sp.)Δ6去饱和酶	AF007561	玻璃苣(Borago offcinalis)Δ6去饱和酶
L11421	蓝细菌(Synechocystis sp.)Δ6去饱和酶	NM_031344	褐鼠(Rattus norvegicus)Δ6脂肪酸去饱和酶
AF465283，AF465281，AF110510	高山被孢霉Δ6脂肪酸去饱和酶	NM_031344	褐鼠(Rattus norvegicus)Δ6脂肪酸去饱和酶
AF465283，AF465281，AF110510	高山被孢霉Δ6脂肪酸去饱和酶	AF465282	深黄被孢霉(Mortierella isabellina)Δ6脂肪酸去饱和酶
AF419296	畸雌腐霉(Pythium irregulare)Δ6脂肪酸去饱和酶	AF465282	深黄被孢霉(Mortierella isabellina)Δ6脂肪酸去饱和酶
AF419296	畸雌腐霉(Pythium irregulare)Δ6脂肪酸去饱和酶	AB052086	卷枝毛霉(Mucor circinelloides)D6d Δ6脂肪酸去饱和酶的mRNA
AJ250735	角齿藓(Ceratodon purpureus)Δ6脂肪酸去饱和酶的mRNA	AB052086	卷枝毛霉(Mucor circinelloides)D6d Δ6脂肪酸去饱和酶的mRNA
AJ250735	角齿藓(Ceratodon purpureus)Δ6脂肪酸去饱和酶的mRNA	AF126799	智人(Homo sapiens)Δ6脂肪酸去饱和酶
AF126798	小家鼠(Mus musculus)Δ6脂肪酸去饱和酶	AF126799	智人(Homo sapiens)Δ6脂肪酸去饱和酶
AF126798	小家鼠(Mus musculus)Δ6脂肪酸去饱和酶	AF199596，AF226273	智人Δ5去饱和酶
AF320509	褐鼠肝脏Δ5去饱和酶	AF199596，AF226273	智人Δ5去饱和酶
AF320509	褐鼠肝脏Δ5去饱和酶	AB072976	小家鼠D5D Δ5去饱和酶的mRNA
AF489588	破囊壶菌(Thraustochytrium sp.)ATCC21685Δ5脂肪酸去饱和酶	AB072976	小家鼠D5D Δ5去饱和酶的mRNA
AF489588	破囊壶菌(Thraustochytrium sp.)ATCC21685Δ5脂肪酸去饱和酶	AJ510244	大雄疫霉(Phytophthora megasperma)Δ5脂肪酸去饱和酶的mRNA
AF419297	畸雌腐霉Δ5脂肪酸去饱和酶	AJ510244	大雄疫霉(Phytophthora megasperma)Δ5脂肪酸去饱和酶的mRNA
AF419297	畸雌腐霉Δ5脂肪酸去饱和酶	AF07879	新秀丽小杆线虫Δ5脂肪酸去饱和酶
AF067654	高山被孢霉Δ5脂肪酸去饱和酶	AF07879	新秀丽小杆线虫Δ5脂肪酸去饱和酶
AF067654	高山被孢霉Δ5脂肪酸去饱和酶	AB022097	盘基网柄菌(Dictyostelium discoideum)Δ5脂肪酸去饱和酶的mRNA
AF489589.1	破囊壶菌(Thraustochytrium sp.)ATCC21685Δ4脂肪酸去饱和酶	AB022097	盘基网柄菌(Dictyostelium discoideum)Δ5脂肪酸去饱和酶的mRNA

AAG36933	Emericella nidulans oleate Δ12去饱和酶
AAG36933	Emericella nidulans oleate Δ12去饱和酶	AF110509	高山被孢霉Δ12脂肪酸去饱和酶mRNA
AB020033	高山被孢霉Δ12脂肪酸去饱和酶mRNA	AF110509	高山被孢霉Δ12脂肪酸去饱和酶mRNA
AB020033	高山被孢霉Δ12脂肪酸去饱和酶mRNA	AAL13300	高山被孢霉Δ12脂肪酸去饱和酶
AF417244	高山被孢霉ATCC 16266Δ12脂肪酸去饱和酶基因	AAL13300	高山被孢霉Δ12脂肪酸去饱和酶
AF417244	高山被孢霉ATCC 16266Δ12脂肪酸去饱和酶基因	AF161219	鲁氏毛霉Δ12去饱和酶mRNA
AY332747	Paylova lutheri Δ4脂肪酸去饱和酶(des1)mRNA	AF161219	鲁氏毛霉Δ12去饱和酶mRNA
AY332747	Paylova lutheri Δ4脂肪酸去饱和酶(des1)mRNA	AAG36933	Emericella nidulans oleate Δ12去饱和酶
AF110509，AB020033	高山被孢霉Δ12脂肪酸去饱和酶mRNA	AAG36933	Emericella nidulans oleate Δ12去饱和酶
AF110509，AB020033	高山被孢霉Δ12脂肪酸去饱和酶mRNA	AAL13300	高山被孢霉Δ12脂肪酸去饱和酶
AF417244	高山被孢霉ATCC 16266Δ12脂肪酸去饱和酶	AAL13300	高山被孢霉Δ12脂肪酸去饱和酶
AF417244	高山被孢霉ATCC 16266Δ12脂肪酸去饱和酶	AF161219	鲁氏毛霉Δ12去饱和酶mRNA
X86736	Spiruline latensisΔ12去饱和酶	AF161219	鲁氏毛霉Δ12去饱和酶mRNA
X86736	Spiruline latensisΔ12去饱和酶	AF240777	新秀丽小杆线虫Δ12去饱和酶
AB007640	雷氏衣藻(Chlamydomonas reinhardtii)Δ12去饱和酶	AF240777	新秀丽小杆线虫Δ12去饱和酶
AB007640	雷氏衣藻(Chlamydomonas reinhardtii)Δ12去饱和酶	AB075526	小球藻(Chlorella vulgaris)Δ12去饱和酶
AP002063	拟南芥微粒体Δ12去饱和酶	AB075526	小球藻(Chlorella vulgaris)Δ12去饱和酶
AP002063	拟南芥微粒体Δ12去饱和酶	NP_441622，BAA18302，BAA02924	蓝细菌(Synechocystis sp.)PCC 6803Δ15去饱和酶
AAL36934	紫苏(Perilla frutescens)Δ15去饱和酶	NP_441622，BAA18302，BAA02924	蓝细菌(Synechocystis sp.)PCC 6803Δ15去饱和酶
AAL36934	紫苏(Perilla frutescens)Δ15去饱和酶	AF338466	蝗虫(Acheta domesticus)Δ9去饱和酶3mRNA
AF438199	白云杉Picea glauca)去饱和酶Δ9(Des9)mRNA	AF338466	蝗虫(Acheta domesticus)Δ9去饱和酶3mRNA
AF438199	白云杉Picea glauca)去饱和酶Δ9(Des9)mRNA	E11368	蓝藻(Anabaena)Δ9去饱和酶
E11367	蓝细菌Δ9去饱和酶	E11368	蓝藻(Anabaena)Δ9去饱和酶
E11367	蓝细菌Δ9去饱和酶	D83185	Pichia angusta Δ9脂肪酸去饱和酶DNA
U90417	Synechococcus vulcanus Δ9酰基-脂质脂肪酸去饱和酶(desC)基因	D83185	Pichia angusta Δ9脂肪酸去饱和酶DNA
U90417	Synechococcus vulcanus Δ9酰基-脂质脂肪酸去饱和酶(desC)基因	AF085500	高山被孢霉Δ9去饱和酶mRNA
AY504633	Emericella nidulaΔ9硬脂酸去饱和酶(sdeB)基因	AF085500	高山被孢霉Δ9去饱和酶mRNA
AY504633	Emericella nidulaΔ9硬脂酸去饱和酶(sdeB)基因	NM_069854	新秀丽小杆线虫必需脂肪酸去饱和酶，硬脂酰-CoA去饱和酶(39.1kD)(fat-6)完整mRNA
AF230693	甘蓝(Brassica oleracea)栽培变种快速环化硬脂酰-ACP去饱和酶	NM_069854	新秀丽小杆线虫必需脂肪酸去饱和酶，硬脂酰-CoA去饱和酶(39.1kD)(fat-6)完整mRNA

	(Δ9-BO-1)基因，外显子序列
	(Δ9-BO-1)基因，外显子序列	AX464731	高山被孢霉延伸酶基因(另见WO 02/08401)
NM_119617	拟南芥脂肪酸延伸酶1(FAE1)(At4g34520)mRNA	AX464731	高山被孢霉延伸酶基因(另见WO 02/08401)
NM_119617	拟南芥脂肪酸延伸酶1(FAE1)(At4g34520)mRNA	NM_134255	小家鼠ELOVL家族成员5，长链脂肪酸(酵母)(Elovl5)的延伸，mRNA
NM_134383	褐鼠脂肪酸延伸酶2(rELO2)，mRNA	NM_134255	小家鼠ELOVL家族成员5，长链脂肪酸(酵母)(Elovl5)的延伸，mRNA
NM_134383	褐鼠脂肪酸延伸酶2(rELO2)，mRNA	NM_134382	褐鼠脂肪酸延伸酶1(rELO1)，mRNA
NM_068396，NM_068392，NM_070713，NM_068746，NM_064685	新秀丽小杆线虫脂肪酸延伸(elo-6)、(elo-5)、(elo-2)、(elo-3)和(elo-9)mRNA	NM_134382	褐鼠脂肪酸延伸酶1(rELO1)，mRNA

另外，专利文献提供了参与PUFA产生的基因的许多另外的DNA序列(和/或有关几个以上基因及其分离方法的细节)。参见例如U.S.5,968,809(A6去饱和酶)；U.S.5,972,664和U.S.6,075,183(Δ5去饱和酶)；WO 91/13972和U.S.5,057,419(Δ9去饱和酶)；WO 93/11245(Δ15去饱和酶)；WO 94/11516、U.S.5,443,974和WO 03/099216(Δ12去饱和酶)；WO 00/12720和U.S.2002/0139974A1(延伸酶)；U.S.2003/0196217A1(Δ17去饱和酶)；WO 00/34439(Δ8去饱和酶)；WO02/090493(Δ4去饱和酶)。这些专利和申请各自通过引用全部结合到本文中。

根据宿主细胞、底物的可用性和所需的最终产物，有价值的是几个去饱和酶和延伸酶用于产生PUFA。对于选择具有去饱和酶或延伸酶活性的特定多肽所考虑的问题包括：1.)多肽的底物专一性，2.)是否多肽或其组分是限速酶；3.)是否去饱和酶或延伸酶是合成所需PUFA所必需的；和/或4.)多肽所需的辅因子。表达的多肽优选具有与其所处宿主细胞的生物化学环境相容的参数。例如，多肽可与宿主细胞中的其它酶竞争底物。因此，认为多肽KM分析和比活决定给定多肽在给定宿主细胞中改变PUFA产生的适应性。特定宿主细胞中使用的多肽是能在给定宿主细胞所具有的生化条件下起作用的多肽，但是也可以是具有能修饰所需脂肪酸底物的去饱和酶或延伸酶活性的任何多肽。

解脂西洋蓍酵母DGAT2和PDAT酰基转移酶的序列鉴定

尽管用于产油酵母(例如解脂西洋蓍酵母)异源表达的几种编码DGAT2和PDAT的基因(出处同上)是可以使用的，但是比起可能的异源(或“外源”)酶来说，优选天然酶的表达。之所以这样优选，是因为：1.)天然酶与细胞中其它酶和蛋白之间的相互作用是优化的；2.)异源基因在宿主细胞中不可能共享相同的密码子偏好性。宿主生物天然PDAT和DGAT2基因序列的相关知识也利于通过定向破坏对同源染色体基因进行破坏。而且，正如本发明已知的，生物体的一种或多种酰基转移酶(例如PDAT、DGAT2)被破坏，当至少一种酰基转移酶保持功能性的话，可导致油含量的改变。

使用Clustal W的比对方法(Higgins和Sharp，CABIOS.5：151-153(1989))，将PDAT核苷酸碱基(SEQ ID NO：45)和由此推导出的氨基酸序列(SEQ ID NO：46)与一些公众数据库进行比较揭示出，最类似的已知序列与本文所述长度超过648个氨基酸的PDAT氨基酸序列有约47.1％同一性。更优选的氨基酸片段与本文序列有至少约70％-80％同一性，其中具有85％-90％同一性的序列是特别合适的，而具有约95％同一性的序列是最优选的。同样，编码与本文ORF相应的核酸序列的优选PDAT是这样的编码活性蛋白的序列：所述序列与编码本文所述PDAT的核酸序列有至少约70％-80％同一性，其中具有85％-90％同一性的序列是特别合适的，而具有约95％同一性的序列是最优选的。

使用Clustal W的比对方法(Higgins和Sharp，出处同上)，对DGAT2核苷酸碱基(SEQ ID NO：30)和由此推导出的氨基酸序列(SEQID NO：79)与一些公众数据库进行比较揭示出，最类似的已知序列与本文所述长度超过355个氨基酸的DGAT2氨基酸序列有约38.4％同一性。更优选的氨基酸片段与本文所述序列有至少约70％-80％同一性，其中具有85％-90％同一性的序列是特别合适的，而具有约95％同一性的序列是最优选的。同样，编码与本文ORF相应的核酸序列的优选DGAT2是这样的编码活性蛋白的序列：所述序列与编码本文所述DGAT2的核酸序列有至少约70％-80％同一性，其中具有85％-90％同一性的序列是特别合适的，而具有约95％同一性的序列是最优选的。

同源物的分离

可使用每个本发明的酰基转移酶核酸片段，从相同或其它微生物种类中分离编码同源蛋白的基因。使用依赖序列的方案，进行同源基因的分离是本领域众所周知的。依赖序列的方案的实例包括但不限于：1.)核酸杂交法；2)DNA和RNA扩增法，例如通过各种使用核酸扩增技术[例如聚合酶链式反应(PCR)，Mullis等，美国专利4,683,202；连接酶链式反应(LCR)，Tabor，S.等，Proc.Acad.Sci.USA 82：1074(1985)；或链置换扩增(SDA)，Walker等，Proc.Natl.Acad.Sci.U.S.A.，89：392(1992)]；3.)文库构建法和互补筛选法。

例如，通过使用全部或部分本发明的核酸片段作为DNA杂交探针，采用本领域技术人员众所周知的方法，从任何所需酵母或真菌中筛选文库，可直接分离编码与本文所述酰基转移酶类似的蛋白或多肽基因。可以通过本领域已知方法(Maniatis，出处同上)，设计和合成基于本发明核酸序列的特异性寡核苷酸探针。此外，可以通过技术人员已知的方法(例如随机引物DNA标记、切口平移或末端标记技术)或RNA探针，使用可行的体外转录系统，直接使用所述完整序列来合成DNA探针。另外，可以设计特异性引物并用于扩增本发明的部分(或全长)序列。可以在扩增反应期间直接标记所得扩增产物或者在扩增反应后进行标记，并用作探针以在合适的严格性条件下分离全长DNA片段。

通常在PCR类扩增技术中，引物具有不同序列并且彼此不互补。根据所需试验条件，可设计引物序列以供目标核酸的有效和可靠复制。PCR引物设计方法是常规的，并且是本领域众所周知的(Thein和Wallace，″The use of oligonucleotides as specific hybridization probesin the Diagnosis of Genetic Disorders″，载于Human Genetic Diseases：APractical Approach，K.E.Davis编著(1986)第33-50页，IRL：Herndon，VA；Rychlik，W.，载于 Methods in Molecular Biology，White，B.A.编著(1993)第15卷，第31-39页，PCR Protocols：Current Methods andApplications.Humania：Totowa，NJ)。

通常在聚合酶链式反应方案中可以使用本发明序列的两个短区段，以便由DNA或RNA扩增更长的编码同源基因的核酸片段。聚合酶链式反应也可在克隆核酸片段文库上进行，其中一个引物序列来自本发明核酸片段，而其它引物序列利用编码微粒体基因的mRNA前体3′端存在的聚腺苷酸序列段。

或者，第二引物序列可基于来自克隆载体的序列。例如，技术人员可按照RACE方案(Frohman等，PNAS USA 85：8998(1988))，通过使用PCR来扩增转录物中的一个位点和3′端或5′端之间区域的拷贝，产生cDNA。可以从本发明序列设计以3′和5′方向定向的引物。使用市售的3′RACE系统或5′RACE系统(BRL，Gaithersburg，MD)，可以分离特异性3′cDNA片段或5′cDNA片段(Ohara等，PNAS USA 86：5673(1989)；Loh等，Science 243：217(1989))。

或者，本发明的酰基转移酶序列可用作杂交试剂，以鉴定同源物。核酸杂交试验的基本组分包括探针、怀疑含有目标基因或基因片段的样品和特异性杂交方法。本发明的探针通常是与待检核酸序列互补的单链核酸序列。探针与待检核酸序列是“可杂交的”。探针长度可以从5个碱基至上万个碱基之间变化，这取决于准备进行的特异性试验。通常探针长度在约15个碱基至约30个碱基是合适的。仅需要部分探针分子与待检核酸序列互补即可。另外，探针和靶序列之间不必完全互补。在不完全互补分子之间也可以进行杂交，其结果是杂交区碱基的某一片段与适当的互补碱基间不配对。

杂交方法是公知的。通常探针和样品必须在允许核酸杂交的条件下进行混合。这包括在无机盐或有机盐存在下，在合适浓度和温度条件下，使探针接触样品。探针和样品核酸必须接触足够长时间，使得探针和样品核酸之间可以发生任何可能的杂交。混合物中探针或靶标浓度将决定杂交发生所需的时间。探针或靶标浓度越高，杂交保温所需时间则越短。可任选加入离液剂。离液剂通过抑制核酸酶活性而使核酸稳定。此外，离液剂允许短寡核苷酸探针在室温下进行灵敏而严格的杂交(Van Ness和Chen，Nucl.Acids Res.19：5143-5151(1991))。合适的离液剂其中包括氯化胍、硫氰酸胍、硫氰酸钠、四氯乙酸锂、高氯酸钠、四氯乙酸铷、碘化钾和三氟乙酸铯。通常离液剂终浓度约为3M。必要时，可以向杂交混合液中加入甲酰胺，其通常为30-50％(v/v)。

可以使用不同杂交溶液。通常包括约20-60％体积、优选30％极性有机溶剂。常用杂交溶液采用约30-50％v/v甲酰胺、约0.15-1M氯化钠、约0.05-0.1M缓冲液(例如柠檬酸钠、Tris-HCl、PIPES或HEPES(pH范围约6-9))、约0.05-0.2％去垢剂(例如十二烷基硫酸钠)或0.5-20mM EDTA、FICOLL(Pharmacia Inc.)(约300-500kdal)、聚乙烯吡咯烷酮(约250-500kdal)和血清白蛋白。常用杂交液也包括未标记的载体核酸约0.1-5mg/ml、分段核酸DNA(例如小牛胸腺或鲑精DNA或酵母RNA)，并且任选约0.5-2％(重量/体积)甘氨酸。也可包括其它添加物，例如体积排阻试剂，包括各种极性水溶性试剂或膨胀剂(例如聚乙二醇)、阴离子聚合物(例如聚丙烯酸酯或聚甲基丙烯酸酯)和阴离子糖聚合物(例如硫酸葡聚糖)。

核酸杂交适用于不同测定模式。最合适的模式之一是夹心测定模式。夹心测定法特别适用于在非变性条件下的杂交。夹心测定法的主要组分是固体支持物。固体支持物上已经吸收或共价偶联了固定化的核酸探针，所述探针是未标记的并且与所述序列的一部分互补。

本发明核苷酸和由此推导出的氨基酸序列的可用性促进了对DNA表达文库的免疫学筛选。可以合成代表本发明氨基酸序列的部分合成肽。这些肽可用于免疫动物，以产生与包含所述氨基酸序列的肽或蛋白具有特异性的多克隆抗体或单克隆抗体。随后，这些抗体可用于筛选DNA表达文库，以分离全长目标DNA克隆(Lerner，R.A.Adv.Immunol.36：1(1984)；Maniatis，出处同上)。

为了改进异源表达的基因优化

根据特定的目标TAG组成，最好是修饰特定酰基转移酶和/或PUFA生物合成途径酶的表达，以得到各自的优化转化效率。同样，可以利用各种技术，在替代宿主中改善/优化目标多肽的表达。两项这样的技术包括密码子优化和基因诱变。

密码子优化

为了本发明的目的，最好修饰编码具有酰基转移酶活性的多肽的密码子部分，例如，在替代宿主(即并非解脂西洋蓍酵母的产油酵母)中增强编码所述多肽的基因表达。一般而言，可以通过检查蛋白(优选最大量表达的蛋白)中的密码子使用并确定哪些密码子使用频率最高，而在特定的目标宿主种中确定宿主偏好的密码子。因此，可以使用宿主种中优选的密码子，来合成具有酰基转移酶活性的多肽的完整或部分编码序列。也可合成所有(或部分)DNA，以除去任何不稳定的序列或二级结构区，所述结构区可存在于转录的mRNA上。也可合成所有(或部分)DNA，以改变基本组成，使其在所需宿主细胞中更优化。

诱变

文献中已经详细记载了用于合成序列并将其组装在一起的方法。例如，可以使用体外诱变和选择、定点诱变、易错PCR(Melnikov等，Nucleic Acids Research，27(4)：1056-1062(1999年2月15日))、“基因改组”或其它方法，以获得天然存在的酰基转移酶基因的突变。这将允许在体内产生具有酰基转移酶活性的多肽，其具有更需要的物理和动力学参数用于在宿主细胞中起作用(例如更长的半寿期或从脂肪酸合成TAG的更高速率)。

如有必要，可以通过常规诱变、表达所得突变多肽并确定其活性，从而确定对于酶促活性重要的酰基转移酶多肽区。突变可包括缺失、插入和点突变或其组合。通常的功能性分析从缺失诱变开始，以确定功能所必需的蛋白的N-端和C-端极限，然后进行内部缺失、插入或点突变，以便进一步确定功能必要区。也可使用其它技术例如盒诱变或全合成。通过例如使用外切核酸酶，序贯除去5′或3′编码区，来进行缺失诱变。盒可用于所述技术。缺失后，通过将含有起始密码子或终止密码子的寡核苷酸连接到分别在5′或3′缺失之后缺失的编码区上，完成编码区。或者，通过各种方法，将编码起始密码子或终止密码子的寡核苷酸插入到编码区内，所述方法包括定点诱变、诱变PCR或通过连接到在现有限制位点上消化的DNA上。可以通过各种方法，同样可以产生内部缺失，所述方法包括通过使用DNA中现有的限制位点，使用诱变引物通过定点诱变或诱变PCR。通过例如接头分区诱变、定点诱变或诱变PCR等方法，产生插入。通过例如定点诱变或诱变PCR等技术产生点突变。

也可采用化学诱变来鉴定对活性重要的酰基转移酶多肽区。表达突变构建体，并测定所得改变的蛋白行使酰基转移酶功能的能力。所述结构-功能分析可以确定哪些区域可缺失，哪些区域可插入，哪些点突变允许突变蛋白以与天然酰基转移酶基本相同的方式行使功能。

来自本文所述酰基转移酶基因的所有这些突变蛋白和编码它们的核苷酸序列都包括在本发明范围内。

用微生物生产脂肪酸和三酰基甘油

与天然来源例如鱼或植物相比，用微生物生产脂肪酸和TAG在纯化上具备几个优点。例如：

1.)比起高等生物来说，已知许多微生物具有相当简单的油组成，使得所需组分的纯化更容易；

2.)微生物生产不受外部变化(例如天气和食物供给)所引起的波动的影响；

3.)微生物生产的油基本上没有环境污染物的污染；和

4.)可以通过控制培养条件，操纵微生物生产油，特别是通过给微生物所表达的酶提供特定底物，或者通过添加化合物或遗传工程方法抑制不需要的生物化学途径。

具体地讲，对于ω-3和/或ω-6脂肪酸的生产，以及含有这些PUFA的TAG的生产来说，具有额外的优点，因为微生物可提供特定形式的脂肪酸，其可以具有特殊用途；而且，通过在宿主中提供新的生物合成途径或者通过抑制不需要的途径，重组微生物能够改变天然存在的微生物脂肪酸分布型，因而增加所需PUFA或其缀合形式的水平，并且降低不想要的PUFA的水平。

因此，本发明酰基转移酶基因序列的有关知识将会用于操纵产油酵母、特别是解脂西洋蓍酵母脂肪酸生物合成和积蓄。这可能需要在脂肪酸或TAG生物合成途径内直接进行代谢工程或者对促使碳进入脂肪酸生物合成途径的途径进行额外操作。用于操纵生物化学途径的方法对本领域技术人员来说是众所周知的。

对影响产油酵母脂肪酸合成和油积蓄的上调基因和生物合成途径进行的代谢工程

引入在合适启动子控制下的编码本文所述酰基转移酶的嵌合基因，有望增加脂肪酸向贮藏TAG的转移。同样，本发明包括增加产油酵母中的TAG含量的方法，所述方法包括在产生脂肪酸的转化产油酵母宿主细胞中表达至少一种本发明的酰基转移酶，使得脂肪酸转移到TAG库。

可以将酰基转移酶基因额外拷贝引入到宿主中，以增加脂肪酸向TAG部分转移。通过使用更强的启动子(或者是调节型或者是组成型)使表达增加，通过从或者mRNA或者其编码的蛋白上去除/缺失不稳定序列，或者通过向mRNA上添加稳定序列，也可在转录水平上增加基因的表达(U.S.4,910,141)。而另一个增加异源基因表达的方法是增加其所编码的mRNA的翻译效率，即通过采用在选定宿主微生物中用于最佳基因表达的密码子，来置换天然基因中的密码子。

在一个具体的实施方案中，本发明包括增加产油酵母中的ω-3和/或ω-6脂肪酸含量的方法，因为可能将编码ω-3和/或ω-6脂肪酸生物合成所必需的每种酶的表达盒引入到生物体中(因为在这些生物体中天然产生的PUFA仅限于18∶2脂肪酸(即LA)和更少见的18∶3脂肪酸(即ALA))。因此，所述方法包括：

a)提供转化的产油酵母宿主细胞(具有至少一个编码ω-3/ω-6脂肪酸生物合成途径中的至少一种酶和至少一种本发明的酰基转移酶的基因)；

b)在可发酵碳底物的存在下，培养步骤(a)的酵母细胞，由此表达ω-3/ω-6脂肪酸生物合成途径和酰基转移酶的基因，由此产生ω-3和/或ω-6脂肪酸，并且由此将ω-3和/或ω-6脂肪酸转移到TAG。

可产生各种PUFA产物(在转移给TAG之前)，这取决于脂肪酸底物和转化到宿主细胞中的ω-3/ω-6脂肪酸生物合成途径的特定基因。同样，所需脂肪酸产物可以直接产生(其中脂肪酸底物直接转化成所需脂肪酸产物，而无需中间步骤或或中间途径)或间接产生(其中编码PUFA生物合成途径的多基因可联合使用，使得发生一系列反应，以产生所需PUFA)。具体地讲，例如，最好用表达盒转化产油酵母，所述表达盒包含用于过量产生EPA的Δ12去饱和酶、Δ6去饱和酶、高亲和性延伸酶、Δ5去饱和酶和Δ17去饱和酶。正如本领域技术人员众所周知的，以下酶活性与本文所述酰基转移酶的各种其它组合可用于在宿主中表达：Δ15去饱和酶、Δ4去饱和酶、Δ5去饱和酶、Δ6去饱和酶、Δ17去饱和酶、Δ9去饱和酶、Δ8去饱和酶和/或延伸酶(参见图2)。特定表达盒中包含的特定基因将取决于宿主细胞(及其PUFA分布型和/或去饱和酶分布型)、底物的可用性和所需的最终产物。

因此，在本发明的上下文中，可通过上述任何一种方法，用于调节TAG生物合成途径的表达。例如，本发明提供编码导致TAG贮藏的脂肪酸生物合成途径中的关键酶的基因。这些基因编码PDAT酶和DGAT2酶。它将特别用于改进这些基因在产油酵母中的表达水平，以便使用各种用于宿主生物代谢工程的方法，最大程度地产生和积蓄TAG。在优选的实施方案中，这些基因表达水平的改进以及ω-3/ω-6生物合成基因的表达可用于最大程度地产生和在TAG库中积蓄优选的PUFA。

对影响产油酵母脂肪酸合成和油积蓄的不需要的基因和生物合成途径下调进行的代谢工程

在一些实施方案中，它可用于破坏或灭活宿主生物的天然酰基转移酶，其基于本文所述的完整序列、这些完整序列的互补序列、所述序列实质部分、来自所述序列的密码子优化的去饱和酶以及与其基本同源的序列。例如，在解脂西洋蓍酵母中定向破坏本文所述DGAT2酰基转移酶、PDAT酰基转移酶以及DGAT2和PDAT酰基转移酶(作为双敲除)，产生突变株，其油产量具有各不相同的降低水平(实施例5)。

对于基因破坏，将外源DNA片段(通常是选择性标记基因)插入到有待破坏的结构基因中，以便间断其编码序列并且使该基因功能性失活。将破坏盒转化到宿主细胞中，通过同源重组，用非功能性破坏的基因替代功能性天然基因(参见例如Hamilton等，J.Bacteriol.171：4617-4622(1989)；Balbas等，Gene 136：211-213(1993)；Gueldener等，Nucleic Acids Res.24：2519-2524(1996)；Smith等，Methods Mol.Cell.Biol.5：270-277(1996))。

当目标基因序列时已知，反义技术是负调节基因的另一方法。为了进行该方法，将来自所需基因的核酸片段进行克隆并且操作性连接启动子，使得RNA反义链被转录。然后将该构建体引入到宿主细胞中并产生RNA的反义链。反义RNA通过阻止编码目标蛋白的mRNA的累积而抑制基因表达。本领域技术人员将会知道，应该特别注意使用反义技术，以便减少特定基因的表达。例如，反义基因表达的合适水平可能需要使用不同嵌合基因，所述基因使用本领域技术人员已知的不同调节元件。

尽管定向基因破坏和反义技术提供了有效的下调基因(其中序列是已知的)的方法，但是已经开发了其它特异性较差的方法，所述方法不是基于序列的方法。例如，可以将细胞暴露给UV辐射，然后筛选所需表型。采用化学试剂进行的诱变也能有效产生突变体，通常使用的物质包括影响非复制DNA的化学品(例如HNO₂和NH₂OH)，以及影响复制DNA的试剂(例如吖啶染料，以引起移码突变而著称)。利用辐射或化学试剂产生突变的具体方法在本领域已有充分的许多文献记载。参见例如Thomas D.Brock，载于 Biotechnology：A Textbook of Industrial Microbiology，第2版，(1989)Sinauer Associates：Sunderland，MA；或Deshpande，Mukund V.，Appl.Biochem.Biotechnol.，36：227(1992)。

另一个破坏基因的非特异性方法是使用转座元件或转座子。转座子是随机插入DNA、但随后可以根据序列回收以确定插入发生位置的遗传元件。体内和体外转座方法都是已知的。这两种方法都包括使用转座元件以及转座酶。当转座元件或转座子在转座酶存在下接触核酸片段时，转座元件将随机插入到核酸片段中。该技术用于随机诱变和基因分离，因为可以在转座元件序列的基础上鉴定破坏的基因。体外转座盒是市售的[参见例如：1.)Primer Island TranspositionKit，可得自Perkin Elmer Applied Biosystems，Branchburg，NJ，基于酵母Ty1元件；2.)Genome Priming System，可得自New EnglandBiolabs，Beverly，MA，基于细菌转座子Tn7；3.)EZ::TN转座子插入系统，可得自Epicentre Technologies，Madison，WI，基于Tn5细菌转座元件]。

因此，在本发明的上下文中，它可用于破坏一个本发明的酰基转移酶基因。例如，可能需要破坏基因和途径，以减少现有脂肪酸库和/或水解TAG，从而调节TAG的积蓄(和/或使其最大化)。

表达系统、表达盒和表达载体

可在微生物宿主细胞中、特别是在产油酵母(例如解脂西洋蓍酵母)细胞中，产生本文所述序列的基因和基因产物。在重组微生物宿主中的表达可用于将不同的脂肪酸转移给TAG。

对于本领域技术人员来说，含有能指导外源蛋白高水平表达的调节序列的微生物表达系统和表达载体是众所周知的。它们中的任一个都可用于构建嵌合基因，用于产生任何本发明序列的基因产物。然后，这些嵌合基因可通过转化而引入到合适的微生物中，以提供所编码的酶的高水平表达。

用于转化合适的宿主细胞的载体或DNA盒是本领域众所周知的。构建体中存在的序列的具体选择取决于所需表达产物(出处同上)、宿主细胞的特性以及将非转化细胞与转化细胞分离所采用的方法。然而，通常载体或盒含有指导相关基因转录和翻译的序列、选择标记和允许自主复制或染色体整合的序列。合适的载体包括基因的5′区(其控制转录起始)和DNA片段的3′区(其控制转录终止)。最优选的是当这两个控制区都来自转化的宿主细胞的基因时，尽管可以理解，所述控制区不必来自选为生产宿主的特定物种的天然基因。

用于驱动本发明ORF在所需宿主细胞中表达的起始控制区或启动子为数众多，并且是本领域技术人员所熟悉的。事实上，能够指导这些基因在选定宿主细胞中表达的任何启动子对本发明来说都是合适的。可以以瞬时或稳定的方式在宿主细胞中完成表达。瞬时表达可以通过诱导操作性连接目标基因的调节启动子的活性来完成。稳定表达可以通过使用操作性连接目标基因的组成型启动子来完成。作为实例，当宿主细胞为酵母时，提供酵母细胞中的功能性转录翻译区，特别是来自所述宿主种。可以从例如以下基因中得到转录起始调节区：1.)糖酵解途径中的基因，例如醇脱氢酶、甘油醛-3-磷酸-脱氢酶(参见美国专利申请号60/482263，所述专利申请通过引用结合到本文中)、磷酸甘油酸变位酶(参见美国专利申请号60/482263，所述专利申请通过引用结合到本文中)、果糖-二磷酸醛缩酶(参见美国专利申请号60/519971，所述专利申请通过引用结合到本文中)、磷酸葡萄糖-异构酶、磷酸甘油酸激酶等；或2.)调节基因，例如酸性磷酸酶、乳糖酶、金属硫蛋白、葡糖淀粉酶、翻译延伸因子EF1-α(TEF)蛋白(U.S.6,265,185)、核糖体蛋白S7(U.S.6,265,185)等。各种调节序列中的任何一种都可以使用，这取决于是需要组成型转录还是诱导型转录，启动子在表达目标ORF中的效率，构建的容易性等。

已经发现，翻译起始密码子“ATG”周围的核苷酸序列影响在酵母细胞中的表达。如果所需多肽在酵母中表达很差，则可修饰外源基因的核苷酸序列，使其包含有效的酵母翻译起始序列，以得到优化的基因表达。对于在酵母中的表达来说，这可以通过无效表达基因的定点诱变、通过将其融合到内源酵母基因(优选高效表达基因)读框内而完成。或者，人们可以确定宿主中共有翻译起始序列并将该序列经工程化引入异源基因中，以便在目标宿主中优化表达它们。

终止区可来自基因的3′区，其中从该基因获取起始区，或者从不同基因获取起始区。已知大量的终止区并且在各种宿主中能令人满意地行使功能(当用于与其衍生来源相同或不同的种属时)。终止区的选择通常是为了方便起见，而不是因为任何具体的特性。优选终止区来自酵母基因，特别是酵母属(Saccharomyces)、裂殖酵母属(Schizosaccharomyces)、假丝酵母属、西洋蓍酵母属或克鲁维酵母属(Kluyveromyces)。也已知编码γ-干扰素和α-2干扰素的哺乳动物基因的3′-区在酵母中能行使功能。终止控制区也可来自对优选宿主来说是天然的不同基因。任选终止位点可以是不必要的，然而，如果包括该位点的话是最优选的。

正如本领域技术人员已知的，仅将基因插入到克隆载体中，不能保证以所需水平成功表达。为了达到高表达速率的需要，已经通过操纵大量不同的遗传元件产生了许多专一的表达载体，所述遗传元件控制以下方面：转录、翻译、蛋白质稳定性、氧限制以及从宿主细胞中分泌。更具体地讲，已经操纵以控制基因表达的一些分子特性包括：1.)相关转录启动子和终止子序列的特性；2.)克隆基因的拷贝数和是否所述基因是由在质粒上或整合到宿主细胞的基因组上；3.)合成外源蛋白最终的细胞位置；4.)在宿主生物中的翻译效率；5.)克隆基因蛋白在宿主细胞内的内在稳定性；6.)在克隆基因内的密码子使用，使得其频率接近宿主细胞优选的密码子使用频率。这些修饰类型中的每种都包括在本发明内，如同进一步优化表达酰基转移酶的方法一样。

用于酰基转移酶重组表达的优选微生物宿主

用于表达本发明基因和核酸片段的宿主细胞可包括微生物宿主，其培养在各种原料(包括简单或复杂的碳水化合物、有机酸和醇和/或烃类)中，在宽的温度和pH值范围内。尽管已经分离了本发明所述基因，用于在产油酵母、特别是在解脂西洋蓍酵母中进行表达，但是，可以预计，因为转录、翻译和蛋白质生物合成机器是高度保守的，所以任何细菌、酵母、藻类和/或丝状真菌对于本发明核酸片段的表达来说都将是合适的宿主。

优选的微生物宿主是产油生物，例如产油酵母。这些产油生物天然具有合成和积蓄油的能力，其中总含油量可大于约25％的细胞干重，更优选大于约30％的细胞干重，最优选大于约40％的细胞干重。另外，使用这些生物产生PFUA的基础可参见同时待审的美国申请号10/840579，所述专利申请通过引用全部结合到本文中。

鉴定为产油酵母的典型属包括但不限于：西洋蓍酵母属、假丝酵母属、红酵母属、红冬孢酵母属、隐球酵母属、丝孢酵母属和油脂酵母属。更具体地讲，说明性的合成油的酵母包括：红冬孢酵母、油脂酵母、产油油脂酵母、拉考夫假丝酵母、铁红假丝酵母、热带假丝酵母、产朊假丝酵母、茁牙丝孢酵母、丝孢酵母、红酵母、牧草红酵母和解脂西洋蓍酵母(以前曾分类为解脂假丝酵母)。

最优选的是产油酵母解脂西洋蓍酵母；而且，在一个进一步实施方案中，最优选的是如下命名的解脂西洋蓍酵母菌株：ATCC#20362、ATCC#8862、ATCC#18944、ATCC#76982、ATCC#90812和/或LGAM S(7)1(Papanikolaou S.和Aggelis G.，Bioresour.Technol.82(1)：43-9(2002))。

微生物宿主的转化

一旦获得编码适于在产油酵母中表达的多肽的DNA，可将其置入能够在宿主细胞中自主复制的质粒载体中，或者将其直接整合到宿主细胞基因组中。表达盒的整合可在宿主基因组中随机发生或者可定向发生，即通过使用含有与宿主基因组同源的区域的构建体，其足以在宿主基因座上定向重组。当构建体定向于内源基因座时，可以通过内源基因座，提供所有或部分转录和翻译调节区。

当从分离的复制载体中表达两个或更多基因时，最好每个载体都具有不同的选择方式并且应缺乏与其它构建体的同源性，以保持稳定表达并防止元件在构建体中重配。可以经过试验，明智地选择和确定调节区、选择方式和引入的构建体的繁殖方法，使得所有引入的基因能以必要的水平表达，以用于所需产物的合成。

可通过任何标准技术，将包含目标基因的构建体引入到宿主细胞中。这些技术包括转化(例如乙酸锂转化[Methods in Enzymology，194：186-187(1991)])、原生质体融合、生物射弹轰击、电穿孔、微注射或者将目标基因引入宿主细胞的任何其它方法。适用于产油酵母(即解脂西洋蓍酵母)的更具体知识包括美国专利第4,880,741和5,071,764号和Chen，D.C.等(Appl Microbiol Biotechnol.48(2)：232-235(1997))。

为了方便起见，通过任何方法操纵以摄取DNA序列(例如表达盒)的宿主细胞在本文中可称为“转化”的或“重组”的。转化宿主可具有至少一个拷贝的表达构建体并且可具有两个或更多个，这取决于所述基因是否整合到基因组中、扩增或存在于染色体外的具有多拷贝数的元件中。可以通过选择引入的构建体上所含有的标记，来鉴定转化的宿主细胞。或者，单独的标记构建体可以与所需构建体共转化，如同许多转化技术将许多DNA分子引入宿主细胞中一样。通常，转化宿主根据在选择性培养基上生长能力进行选择。选择性培养基可掺入抗生素或缺乏未转化宿主所必需的生长因子，例如营养因子或生长因子。引入的标记基因可赋予抗生素抗性，或编码必需生长因子或酶，因而在转化宿主中表达时，允许在选择性培养基上生长。当可以直接或间接检测出表达的标记蛋白时，可以对转化宿主进行选择。标记蛋白可单独表达或者可作为与另一种蛋白融合的形式来表达。可以通过以下方法检测标记蛋白：1.)其酶活性(例如β-半乳糖苷酶可转化底物X-gal[5-溴-4-氯-3-吲哚基-β-D-吡喃半乳糖苷]，产生有色产物；萤光素酶可以转化萤光素，得到发光产物)；或2)其光产生或修饰特性(例如当蓝光照射时，维多利亚水母(AequoreaVictoria)绿色荧光蛋白发出荧光)。另外，可使用抗体测定标记蛋白或者例如目标蛋白上的分子标记。可以例如通过目测，或者通过FACS或淘选等技术，使用抗体，来选择表达标记蛋白或标记的细胞。为了选择酵母转化子，可使用在酵母中起作用的任何标记。最好卡那霉素、潮霉素和氨基糖苷G418抗性是令人感兴趣的，以及在缺乏尿嘧啶或亮氨酸的培养基上生长的能力。

转化后，宿主(无论是天然还是转基因的)可产生适合于本发明序列基因产物(以及任选在所述宿主细胞中表达的其它PUFA酶)的底物，或者可以从外源提供这些底物。

三酰基甘油生物合成和积蓄的发酵过程

在优化脂肪酸生物合成基因和酰基转移酶基因的活性的条件下，培养转化的微生物宿主细胞。这导致产生最大最经济的脂肪酸收率，其又可转移给TAG，用于贮存。一般而言，可以优化的培养基条件包括碳源类型和用量、氮源类型和用量、碳氮比、氧水平、生长温度、pH、生物量产生周期的长短、油积蓄周期的长短和细胞收获时间。目标微生物例如产油酵母生长在复合培养基(例如酵母膏-蛋白胨-葡萄糖肉汤(YPD))或缺乏生长所需组分的确定成分的极限培养基中因而迫使选择所需表达盒(例如Yeast Nitrogen Base(DIFCOLaboratories，Detroit，MI))。

本发明的发酵培养基必须含有合适的碳源。合适的碳源可包括但不限于：单糖(例如葡萄糖、果糖)、双糖(例如乳糖、蔗糖)、寡糖、多糖(例如淀粉、纤维素或其混合物)、糖醇(例如甘油)或来自可回收原料的混合物(例如干酪乳清渗出液、玉米浆、甜菜糖蜜、大麦芽)。另外，碳源可包括烷烃、脂肪酸、脂肪酸酯、甘油单酯、甘油二酯、甘油三酯、磷脂和各种商业来源的脂肪酸，包括植物油(例如大豆油)和动物脂肪。另外，碳底物可包括一碳底物(例如二氧化碳、甲醇、甲醛、甲酸酯、含碳胺类)，已经证明它们能代谢转化成关键生化中间产物。因此，预期用于本发明的碳源可包括各种各样的含碳底物，并且仅受所选用的宿主生物所限制。尽管所有以上提及的碳底物及其混合物有望适用于本发明，但是优选的碳底物是糖和/或脂肪酸。最优选的是葡萄糖和/或含有10-22个碳的脂肪酸。

氮可来源于无机物(例如(NH₄)₂SO₄)或者来源于有机物(例如尿素、谷氨酸)。除了合适的碳源和氮源之外，发酵培养基必须还含有合适的矿物质、盐、辅因子、缓冲剂、维生素和本领域技术人员已知的适于微生物生长和促进脂肪酸产生所必需的酶促途径的其他组分。特别注意的是几种金属离子(例如Mn⁺²、Co⁺²、Zn⁺²、Mg⁺²)，所述离子促进脂质和PUFA的合成(Nakahara，T.等，Ind.Appl.Single CellOils，D.J.Kyle和R.Colin编著，第61-97页(1992))。

本发明优选的生长培养基是市售的预制培养基，例如YeastNitrogen Base(DIFCO Laboratories，Detroit，MI)。其它确定成分培养基或合成生长培养基也可使用，用于特定微生物生长的合适培养基是微生物学或发酵科学领域技术人员已知的。用于发酵的合适pH范围通常在约pH4.0至pH8.0之间，其中在开始生长的条件下优选pH5.5至pH7.0。可以在好氧或厌氧条件下进行发酵，其中优选微好氧条件。

通常脂肪酸和TAG在产油酵母细胞中的高水平积蓄需要两个阶段的过程，因为代谢状态必须在生长和脂肪合成/贮藏之间保持“平衡”。因此，最优选两个阶段发酵过程对产油酵母中油的产生是必要的。在该方法中，发酵的第一阶段主要是产生和积蓄细胞量，其特征是快速细胞生长和细胞分裂。在发酵的第二阶段，优选在培养物中建立氮剥夺条件，以促进高水平的脂质积蓄。所述氮剥夺效应是降低细胞中AMP的有效浓度，因而降低线粒体中NAD-依赖性异柠檬酸脱氢酶的活性。当其发生时，将积蓄柠檬酸，因此在细胞质中形成丰富的乙酰基-CoA库并引发脂肪酸合成。因此，这一阶段的特征是细胞分裂停止，随之进行脂肪酸合成和TAG积蓄。

尽管细胞通常在约30℃生长，但是一些研究却表明在低温下不饱和脂肪酸的合成增加(Yongmanitchai和Ward，Appl.Environ.Microbiol.57：419-25(1991))。基于工艺过程经济学，在这两个阶段发酵的第一阶段后，当大量生物体生长已经发生时，可能发生该温度的变化。

当希望使用本发明基因进行脂肪酸和TAG的商业化生产时，预期可以应用各种发酵过程设计。例如，可通过分批、补料分批或连续发酵工艺，从重组微生物宿主进行含有PUFA的TAG的商业化生产。

分批发酵工艺是封闭系统，其中在工艺开始时就确定了培养基组成，并且在过程中除了为保持pH和氧水平所需之外，不添加其它物质。因此，在培养过程一开始，就给培养基接种所需生物体，允许在不向培养基内添加额外底物(即碳和氮源)的条件下具有生长或代谢活性。在分批工艺中，系统的代谢和生物量组成持续变化直到培养结束时。在典型的分批工艺中，细胞缓慢通过稳定延迟期进入高生长对数期，最终到达生长速率下降或停止的稳定期。如果不加以处理的话，处于稳定期的细胞将最终死亡。标准分批工艺的一个变化的工艺是补料分批工艺，其中在发酵过程中不断向发酵罐中加入底物。补料分批工艺也适于本发明。当分解代谢产物阻抑倾向于抑制细胞代谢或当在任何时间需要限制培养基中底物数量的时候，可采用补料分批工艺。测定在补料分批系统中底物的浓度是困难的，因此可以在可测量例如pH、溶解氧和废气分压(例如CO2)等因素的基础上进行估计。分批和补料分批培养法是常用的并且是本领域众所周知的，其实例可参见Thomas D.Brock，载于 Biotechnology：A Textbook of Industrial Microbiology，第2版，(1989)Sinauer Associates：Sunderland，MA；或Deshpande，Mukund V.，Appl.Biochem.Biotechnol.，36：227(1992)，所述文献通过引用结合到本文中。

也可通过连续发酵工艺，使用本发明基因，完成脂肪酸的商业化生产，其中将确定成分培养基连续加入到生物反应器中，同时取出等量的培养物，用于产物回收。连续培养通常将细胞以恒定的细胞密度保持在生长对数期。连续或补料分批培养法允许调整影响细胞生长或最终产物浓度的一个因素或任意数目的因素。例如，一个方法可限制碳源并让所有其它参数适应代谢。在其它系统中，可以持续改变各种影响生长的因素，同时，经培养基浊度测定的细胞浓度保持恒定。连续系统努力保持稳定状态的生长，并因此必须让细胞生长速率保持平衡，以免因培养基从培养物中被吸收而导致的细胞减少。连续培养工艺中调节营养和生长因子的方法，以及用于最大速率形成产生的技术是工业微生物学领域众所周知的各种方法详见Brock，出处同上。

脂肪酸的纯化

可以在宿主微生物中发现包括PUFA在内的脂肪酸，其呈游离脂肪酸或酯化形式例如酰基甘油、磷脂、硫脂或糖脂，它们可以通过本领域众所周知的方法从宿主细胞中萃取出来。酵母脂质的萃取技术、质量分析和可接受标准的一个综述是Z.Jacobs(Critical Reviewsin Biotechnology 12(5/6)：463-491(1992))。也可使用以下文献介绍的下游加工的概述：A.Singh和O.Ward(Adv.Appl.Microbiol.45：271-312(1997))。

一般而言，纯化包括PUFA在内的脂肪酸的方法可包括用有机溶剂萃取、超声处理、超临界流体萃取(例如使用二氧化碳)、皂化以及物理方法(例如压榨)或其组合。特别令人感兴趣的是在水存在下用甲醇和氯仿进行萃取(E.G.Bligh & W.J.Dyer，Can.J.Biochem.Physiol.37：911-917(1959))。如需要的话，可以酸化水层，使带负电荷的部分质子化，因而增加所需产物向有机层的分配。萃取后，可以通过在氮气流下进行蒸发而除去有机溶剂。当以缀合形式分离时，产物可经酶切或化学裂解，释放游离脂肪酸或更简单的目标缀合物，然后可以进一步进行操作，以产生所需最终产物。最好用氢氧化钾裂解缀合形式的脂肪酸。

如果需要进一步纯化，可以使用标准方法。所述方法可包括萃取、尿素处理、分步结晶、HPLC、分馏、硅胶层析、高速离心或蒸馏，或这些技术的组合。在已知技术的任何步骤(例如烷基化、碘化)中，都可以对活性基团例如酸基团或烯基进行保护。所用的方法包括脂肪酸的甲基化，以产生甲酯。同样，在任何步骤中都可以除去保护基。最好可以通过尿素处理和/或分馏，来完成含有GLA、STA、ARA、DHA和EPA的级分的纯化。

优选实施方案的描述

本文所述工作的最终目的是开发产油酵母，所述酵母积蓄富含ω-3和/或ω-6PUFA的TAG。为了这一目的，必须鉴定在产油酵母中能有效行使其功能的酰基转移酶，使其能够在这些宿主中合成和高水平积蓄优选的TAG。具体地讲，这些酰基转移酶表达水平的改进能够增加脂肪酸(特别是PUFA)向TAG的转移。因此，鉴定有效的酰基转移酶，对ω-3/ω-6PUFA掺入到宿主细胞所产生的TAG部分的数量的操作来说是必要的。

在本发明中，申请人已从编码PDAT和DGAT2的解脂西洋蓍酵母中分离和克隆了基因。根据在西洋蓍酵母菌株中较低的含油量(总脂肪酸％细胞干重)，证实了这些基因的活性，其中通过同源重组导致的中靶基因置换，使得天然PDAT、DGAT2或PDAT和DGAT2发生破坏(实施例5)。另外，在酿酒酵母的PDAT/DGAT2敲除菌株中本发明PDAT的过量表达导致含油量(总脂肪酸％细胞干重)增加。

申请人得出的结论是，这些编码PDAT和DGAT2的酰基转移酶基因用于在不同微生物宿主中进行表达，并且特别是在产油酵母(例如天然宿主解脂西洋蓍酵母)中进行过量表达。可以得到额外的益处，因为酰基转移酶的表达也可以置于强组成型或调节型启动子控制之下，所述启动子没有天然基因的调节限制。

实施例

以下实施例进一步限定了本发明。可以理解，仅仅是为了说明的目的而给出这些表明本发明优选实施方案的实施例。从以上讨论和这些实施例中，本领域技术人员可以确定本发明的必要特征，并且在不偏离其精神和范围的前提下，可以对本发明进行各种改变和修改，以适应各种用途和条件。

通用方法

在实施例中使用的标准重组DNA和分子克隆技术是本领域众所周知的，其在以下文献中有描述：1.)Sambrook，J.，Fritsch，E.F.和Maniatis，T.Molecular Cloning：A Laboratory Manual；Cold SpringHarbor Laboratory：Cold Spring Harbor，NY(1989)(Maniatis)；2.)T.J.Silhavy，M L.Bennan和L.W.Enquist，Experiments with GeneFusions；Cold Spring Harbor Laboratory：Cold Spring Harbor，NY(1984)；3.)Ausubel，F.M.等，Current Protocols in Molecular Biology，Greene Publishing Assoc.and Wiley-Interscience出版(1987)。

对于本领域技术人员来说，适合微生物培养物的维持和生长的材料与方法是众所周知的。以下文献中介绍了适用于以下实施例的技术： Manual of Methods for General Bacteriology(Phillipp Gerhardt，R.G.E.Murray，Ralph N.Costilow，Eugene W.Nester，Willis A.Wood，Noel R.Krieg和G.Briggs Philips编著)，American Society forMicrobiology：Washington，D.C.(1994))；或Thomas D.Brock，载于Biotechnology：A Textbook of Industrial Microbiology.第2版，SinauerAssociates：Sunderland，MA(1989)。除非另有说明，所有试剂、限制酶和用于微生物细胞生长和维持的材料得自Aldrich Chemicals(Milwaukee，WI)、DIFCO Laboratories(Detroit，MI)、GIBCO/BRL(Gaithersburg，MD)或Sigma Chemical Company(St.Louis，MO)。

大肠杆菌(E.coli)TOP10细胞和大肠杆菌Electromax DH10B细胞均得自Invitrogen(Carlsbad，CA)。大肠杆菌DH5α的最高效感受态细胞得自GIBCO/BRL(Gaithersburg，MD)。大肠杆菌(XL1-Blue)感受态细胞购自Stratagene Company(San Diego，CA)。大肠杆菌菌株通常于37℃在Luria Bertani(LB)平板上生长。按照标准方法进行常规分子克隆(Sambrook等，出处同上)。通过Sigma-Genosys(Spring，TX)合成寡核苷酸。将PCR产物克隆到Promega的pGEM-T-easy载体(Madison，WI)上。

使用载体和插入片段特异性引物的组合，使用染料终止剂技术(U.S.5,366,860；EP 272,007)，在ABI自动测序仪上产生DNA序列。在Sequencher(Gene Codes Corporation，Ann Arbor，MI)中进行序列编辑。所有序列在两个方向覆盖至少两次。用DNASTAR软件(DNASTAR，Inc.，Madison，WI)进行遗传序列的比较。

缩写词的含义如下：“sec”表示秒，“min”表示分钟，“h”表示小时，“d”表示天，“μL”表示微升，“ml”表示毫升，“L”表示升，“μM”表示微摩尔，“mM”表示毫摩尔，“M”表示摩尔，“mmol”表示毫摩尔浓度，“μmole”表示微摩尔浓度，“g”表示克，“ug”表示微克，“ng”表示纳克，“U”表示单位，“bp”表示碱基对，“kB”表示千碱基。

解脂西洋蓍酵母的培养

解脂西洋蓍酵母菌株ATCC#76982和ATCC#90812购自美国典型培养物保藏中心(Rockville，MD)。解脂西洋蓍酵母菌株通常于28℃在YPD琼脂(1％酵母膏、2％细菌蛋白胨、2％葡萄糖、2％琼脂)中培养。为了选择转化子，使用不含硫酸铵或氨基酸的极限培养基(0.17％yeast nitrogen base(DIFCO Laboratories，Detroit，MI)、2％葡萄糖、0.1％脯氨酸，pH6.1)。按照适于0.01％终浓度的量，补加腺嘌呤、亮氨酸、赖氨酸和/或尿嘧啶。

解脂西洋蓍酵母的脂肪酸分析

为了进行脂肪酸分析，按照Bligh，E.G和Dyer，W.J.(Can.J.Biochem.Physiol.37：911-917(1959))介绍的方法，离心收集细胞并萃取脂质。通过甲醇钠萃取的脂质的酯交换，制备脂肪酸甲酯(Roughan，G.和Nishida I.Arch Biochem Biophys.276(1)：38-46(1990))，然后用配备了30m×0.25mm(i.d.)HP-INNOWAX(Hewlett-Packard)柱的Hewlett-Packard 6890GC进行分析。炉温度从170℃(保持25min)起以3.5℃/min的速率升至185℃。

为了进行直接基础酯交换，收获西洋蓍酵母培养物(3ml)，用蒸馏水洗涤一次并在Speed-Vac中真空干燥5-10min。向样品中加入甲醇钠(100μl，1％)，然后将样品涡旋震荡20min。加入3滴1M NaCl和400μl己烷后，将样品涡旋离心。取出上层，如上所述，通过GC进行分析。

实施例1

适于在解脂西洋蓍酵母中表达基因的质粒的构建

本实施例描述了质粒pY5、pY5-13、pY5-20和pLV5的构建。

质粒pY5的构建

质粒pY5是pINA532[由Claude Gaillardin博士(Insitut NationalAgronomics，Centre de biotechnologie Agro-Industrielle，laboratoire deGenetique Moleculaire et Cellularie INRA-CNRS，F-78850 Thiverval-Grignon，France)惠赠]的衍生物，如图3所示构建质粒pY5，用于在解脂西洋蓍酵母中表达异源基因。首先，将含有pINA532的ARS18序列和LEU2基因的部分消化的3598bp的EcoR1片段亚克隆到pBluescript(Strategene，San Diego，CA)的EcoR1位点上，产生pY2。通过PCR，使用TEF5′(SEQ ID NO：1)和TEF3′(SEQ ID NO：2)作为引物，从解脂西洋蓍酵母基因组DNA扩增TEF启动子(Muller S.等，Yeast，14：1267-1283(1998))。在含有如下成分的50μl总体积中进行PCR扩增：100ng西洋蓍酵母基因组DNA、PCR缓冲液(含有10mMKCl、10mM(NH₄)₂SO₄、20mM Tris-HCl(pH8.75)、2mM MgSO₄、0.1％Triton X-100、100μg/ml BSA(终浓度))、200μM各种脱氧核糖核苷酸三磷酸、10μmole各引物和1μl的Pfu Turbo DNA聚合酶(Stratagene)。扩增如下进行：开始在95℃变性3min，接着是以下的35次循环：95℃1min，56℃30sec，72℃1min。最终延伸循环于72℃10min，接着在4℃终止反应。将418bp PCR产物连接到CR-Blunt上，产生pIP-tef。将pIP-tef的BamHI/EcoRV片段亚克隆到pY2的BamHI/SmaI位点上，产生pY4。

通过PCR，使用pINA532作为模板，XPR5′(SEQ ID NO：3)和XPR3′(SEQ ID NO：4)作为引物，扩增XPR2转录终止子。在50μl总体积中进行PCR扩增，使用如上所述的组分和条件。将179bp PCR产物用SacII消化，然后连接到pY4的SacII位点上，产生pY5。因此，pY5(见图3)用作西洋蓍酵母-大肠杆菌穿梭质粒，其含有：

1.)西洋蓍酵母自主复制序列(ARS18)；

2.)ColE1质粒复制起点；

3.)氨苄青霉素抗性基因(Amp^R)，用于在大肠杆菌中进行选择；

4.)西洋蓍酵母LEU2基因(E.C.1.1.1.85，编码异丙基苹果酸异构酶)，用于在西洋蓍酵母中进行选择；

5.)翻译延伸启动子(TEF)，用于在西洋蓍酵母中表达异源基因；和

6.)胞外蛋白酶基因终止子(XPR2)，用于在西洋蓍酵母的异源基因表达中终止转录。

质粒pY5-13的构建

构建pY5-13(图3)，作为pY5的衍生物，以便于在解脂西洋蓍酵母中亚克隆并表达异源基因。具体地讲，通过6轮定点诱变，使用pY5作为模板，构建pY5-13。通过定点诱变，使用寡核苷酸YL5和YL6(SEQ ID NO：5和6)，从pY5消除SalI和ClaI位点，产生pY5-5。通过定点诱变，使用寡核苷酸YL9和YL10(SEQ ID NO：7和8)，将SalI位点引入到pY5-5的LEU2基因和TEF启动子之间，产生pY5-6。使用寡核苷酸YL7和YL8(SEQ ID NO：9和10)，将PacI位点引入到pY5-6的LEU2基因和ARS18之间，产生pY5-8。使用寡核苷酸YL3和YL4(SEQ ID NO：11和12)，将NcoI位点引入到pY5-8的TEF启动子翻译起始密码子附近，产生pY5-9。使用YL1和YL2寡核苷酸(SEQ ID NO：13和14)，消除pY5-9的LEU2基因内的NcoI位点，产生pY5-12。最后，使用寡核苷酸YL61和YL62(SEQID NO：15和16)，将BsiWI位点引入到pY5-12的ColE1和XPR2区之间，产生pY5-13。

质粒pY5-20和pLV5的构建

质粒pY5-20是pY5的衍生物。它是通过将含有嵌合潮霉素抗性基因的Not I片段插入到pY5的Not I位点而构建的。具体地讲，大肠杆菌潮霉素抗性基因(SEQ ID NO：17；″HPT”；Kaster，K.R.等，Nucleic Acids Res.11：6895-6911(1983))经PCR扩增，用于表达。嵌合基因具有在解脂西洋蓍酵母TEF启动子控制下的潮霉素抗性ORF。

质粒pLV5是pY5-20的衍生物。它是通过用西洋蓍酵母Ura3基因替代潮霉素抗性基因而构建的。使用寡核苷酸KU5和KU3(SEQID NO：21和22)作为引物，西洋蓍酵母基因组DNA作为模板，通过PCR扩增含有西洋蓍酵母Ura3基因的1.7kB DNA片段(SEQ ID NO：19)。

实施例2

部分解脂西洋蓍酵母酰基-CoA：二酰基甘油酰基转移酶(DGAT2)基因的克隆和内源DGAT2基因的破坏

本实施例描述了使用简并PCR引物，来分离解脂西洋蓍酵母DGAT2的部分编码序列，并且使用所述部分序列来破坏解脂西洋蓍酵母中的天然基因。

通过PCR，使用简并PCR引物和染色体步查，从解脂西洋蓍酵母克隆部分推定DGAT2序列

使用DNeasy Tissue Kit(Qiagen，目录号69504)，从解脂西洋蓍酵母(ATCC#76982)中分离基因组DNA，然后以0.5μg/μl的DNA浓度重悬浮于试剂盒缓冲液AE中。使用基因组DNA作为模板并使用几组简并引物(其设计用于编码不同的已知DGAT2(即GenBank检索号NC_001147[酿酒酵母]和AF391089和AF391090[拉曼被孢霉])的保守氨基酸序列)，进行PCR扩增。用简并引物P7和P8获得了最佳结果，见下表。

表3

用于扩增部分推定DGAT2的简并引物

引物组	描述	简并核苷酸序列	相应的氨基酸序列
引物组	描述	简并核苷酸序列	相应的氨基酸序列	P7	(32)29聚体	5′-AACTACATCTTCGGCTAYCAYCCNCAYGG-3′(SEQ ID NO：23)	NYIFGYHPHG(SEQ ID NO：24)
P8	(48)29聚体	5′-AGGGACTCGGAGGCGCCGCCNCANACDAT-3′(SEQ ID NO：25)	与IVVGGASESL(SEQ ID NO：26)互补	P7	(32)29聚体	5′-AACTACATCTTCGGCTAYCAYCCNCAYGG-3′(SEQ ID NO：23)	NYIFGYHPHG(SEQ ID NO：24)

[注意：缩写词是用于核苷酸和蛋白的标准用法。所用的核酸简并密码如下：Y＝C/T；D＝A/G/T；N＝A/C/G/T。]

在RoboCycler Gradient 40 PCR仪(Stratagene)上，用制造商推荐方法和Accuprime Taq聚合酶(Invitrogen)，进行PCR。扩增如下进行：开始在95℃变性1min，接着是以下的30次循环：在95℃变性30sec，在55℃退火1min，在72℃延伸1min。最终延伸循环在72℃进行10min，接着在4℃终止反应。

用4％NuSieve(FMC)琼脂糖凝胶电泳检测所需PCR产物(约264bp)，分离，纯化，克隆到TOPO^克隆载体(Invitrogen)中并测序。根据BLAST程序分析(Basic Local Alignment Search Tool；Altschul，S.F.等，J.Mol.Biol.215：403-410(1993)，得知所得序列(包含在SEQ ID NO：30内)与已知DGAT2具有同源性。

使用该264bp片段作为起点，通过染色体步查，使用TOPO^Walker Kit(Invitrogen，目录号K8000-01)，得到673bp片段。分6步进行染色体步查，简要说明如下：

1.)基因组DNA(5μg)用限制酶Pst I或Sac I消化，留下3′突出端；

2.)消化的DNA用0.1U小牛小肠碱性磷酸酶处理，得到脱去磷酸的DNA；

3.)用DGAT2特异性引物P80(SEQ ID NO：27)和Taq聚合酶，进行引物延伸；

4.)加入TOPO^Linker(1μl)，将反应物在37℃孵育5min，使TOPO^Linker连接所述DNA；

5.)使用DGAT2基因特异性引物即P81(SEQ ID NO：28)和LinkAmp引物1(SEQ ID NO：29)，进行PCR；和

6.)将新扩增的片段与引物P81和LinkAmp引物1一起测序。

通过染色体步查得到的673bp片段序列也显示出与已知DGAT2序列的同一性。

定向破坏解脂西洋蓍酵母DGAT2基因

定向破坏解脂西洋蓍酵母ATCC#90812和ATCC#76982中的DGAT2基因，即通过同源重组介导的置换，用打靶盒置换内源DGAT2基因，所述打靶盒命名为质粒pY21DGAT2。pY21DGAT2来自质粒pY20(实施例1)。具体地讲，通过将570bp Hind III/Eco RI片段插入到类似的线状pY20上，产生pY21DGAT2。570bp DNA片段含有(从5′到3′方向)：3′同源序列，其从SEQ ID NO：30的编码序列(ORF)的+1090位至+1464位；BglII限制位点；和5′同源序列，其从SEQ ID NO：30所示编码序列(ORF)的+906位至+1089位。所述片段制备如下：通过从673bp DGAT2PCR产物(通过染色体步查，分别使用两对PCR引物P95和P96(SEQ ID NO：32和33)以及P97和P98(SEQ ID NO：34和35)而获得)的3′和5′序列进行PCR扩增。

通过Bgl II限制性消化，将pY21DGAT2变成线状，然后按照Chen，D.C.等(Appl Microbiol Biotechnol.48(2)：232-235(1997))的方法，通过乙酸锂方法，转化到对数期中期的解脂西洋蓍酵母ATCC#90812和ATCC#76982细胞中。简而言之，将解脂西洋蓍酵母ATCC#90821和解脂西洋蓍酵母ATCC#76982在YPD平板上划线，然后在30℃培养约18h。从这些平板上刮下几大环细胞，重悬浮在1ml含有以下成分的转化缓冲液中：

·2.25ml 50％PEG，平均分子量3350；

·0.125ml 2M乙酸锂，pH6.0；

·0.125ml 2M DTT；和

·50μg已剪切鲑精DNA。

将约500μg质粒DNA在100μl重悬浮细胞中孵育并在39℃保温1h，同时每隔15min涡旋混合一次。将细胞接种到YPD潮霉素选择性平板上，在30℃培养2-3天。

分离4个解脂西洋蓍酵母ATCC#76982潮霉素抗性菌落和14个解脂西洋蓍酵母ATCC#90812潮霉素抗性菌落，通过PCR筛选定向破坏。同源重组后，设计一组PCR引物(P115[SEQ ID NO：36]和P116[SEQ ID NO：37])，扩增特异性连接片段。设计另一对PCR引物(P115和P112[SEQ IDNO：38])，检测天然基因。ATCC#76982菌株的所有(4/4)潮霉素抗性菌落对连接片段呈阳性，而对天然片段呈阴性；而ATCC#90812菌株的14个潮霉素抗性菌落中有两个对连接片段呈阳性，对天然片段呈阴性。因此，在这6个菌株中证实了定向整合。通过对破坏的菌株之一(称为“S-D”)的总脂进行GC分析，进一步证实了基因的破坏(见实施例5)。

实施例3

部分解脂西洋蓍酵母磷脂：二酰基甘油酰基转移酶(PDAT)基因的克隆和内源PDAT基因的破坏

本实施例描述了使用简并PCR引物，来分离解脂西洋蓍酵母PDAT的部分编码序列，并且使用所述部分序列来破坏解脂西洋蓍酵母中的天然基因。

通过PCR并使用简并PCR引物和染色体步查，从解脂西洋蓍酵母克隆部分推定PDAT序列

使用DNeasy Tissue Kit(Qiagen，目录号69504)，从解脂西洋蓍酵母(ATCC#76982)中分离基因组DNA，然后以0.5μg/μl的DNA浓度重悬浮于试剂盒缓冲液AE中。使用基因组DNA作为模板并使用几对简并引物，进行PCR扩增，所述引物编码不同的已知PDAT(GenBank检索号NP190069和AB006704[(gi：2351069拟南芥)，和NP_596330[粟酒裂殖酵母]；和酿酒酵母Lro 1基因[Dahlqvist等，Proc.Natl.Acad.Sci.USA 97：6487(2000)]]的保守氨基酸序列。用简并引物P26和P27获得了最佳结果，见下表。

表4

用于扩增部分推定PDAT的简并引物

引物组	描述	简并核苷酸序列	相应的氨基酸序列
引物组	描述	简并核苷酸序列	相应的氨基酸序列	P26	(32)29聚体	5′-ATGCTGGACAAGGAGACCGGNCTNGAYCC-3′(SEQ ID NO：39)	MLDKETGLDP(SEQ ID NO：40)
P27	(16)33聚体	5′-CCAGATGACGTCGCCGCCCTTGGGNARCATNGA-3′(SEQ ID NO：41)	与SMLPKGGEVIW(SEQ ID NO：42)互补	P26	(32)29聚体	5′-ATGCTGGACAAGGAGACCGGNCTNGAYCC-3′(SEQ ID NO：39)	MLDKETGLDP(SEQ ID NO：40)

[注意：缩写词是用于核苷酸和蛋白的标准用法。所用的核酸简并密码如下：R＝A/G；Y＝C/T；N＝A/C/G/T。]

在RoboCycler Gradient 40 PCR仪(Stratagene)上，用实施例2中描述的扩增条件，进行PCR。用4％NuSieve(FMC)琼脂糖凝胶电泳检测所需PCR产物(约600bp)，分离，纯化，克隆到TOPO^克隆载体(Invitrogen)中并测序。根据BLAST程序分析(Basic Local AlignmentSearch Tool；Altschul，S.F.等，J.Mol.Biol.215：403-410(1993)，得知所得序列(包含在SEQ ID NO：45内)与已知PDAT具有同源性。

定向破坏解脂西洋蓍酵母PDAT基因

按照这个约600bp的PDAT的部分编码区的序列，在“Yeastproject Genolevures”的公共解脂西洋蓍酵母数据库(Center forBioinformatics，LaBRI，Talence Cedex，France)中发现了编码该序列的较大DNA片段。这允许使用PCR引物P39和P42(SEQ ID NO：43和44)，来分离1008bp基因组DNA片段，所述片段包含来自解脂西洋蓍酵母ATCC#90812的部分PDAT基因。

定向破坏解脂西洋蓍酵母ATCC#90812中的PDAT基因，即通过同源重组介导的置换，用打靶盒置换内源PDAT基因，所述打靶盒命名为pLV13。pLV13来自质粒pLV5(实施例1)。具体地讲，通过将992bp Bam HI/Eco RI片段插入到类似的线状pLV5上，产生pLV13。992bp DNA片段含有(从5′到3′方向)：3′同源序列，其从SEQID NO：45编码序列(ORF)的+877位至+1371位；Bgl II限制位点；和5′同源序列，其从SEQ ID NO：45编码序列(ORF)的+390位至+876位。所述片段制备如下：通过分别使用PCR引物P39和P41(SEQ IDNO：43和47)以及P40和P42(SEQ ID NO：48和44)，通过PCR扩增从上述1008bp PCR产物的3′和5′序列。

通过Bgl II限制性消化，将pLV13变成线状，然后通过乙酸锂方法，转化到对数期中期的Y lipolytica ATCC#90812细胞中(实施例2)。将细胞接种到Bio101 DOB/CSM-Ura选择性平板上，然后在30℃培养2-3天。

分离10个解脂西洋蓍酵母ATCC#90812菌落，并通过PCR筛选定向破坏。设计一组PCR引物(P51[SEQ ID NO：49]和P52[SEQ IDNO：50])扩增打靶盒。设计另一组PCR引物(P37[SEQ ID NO：51]和P38[SEQ ID NO：52])，检测天然基因。10个菌株中有10个都对连接片段呈阳性，而10个菌株中有3个对天然片段呈阴性，因而证实成功定向整合在这3个菌株中。通过对破坏的菌株之一(称为“S-P”)的总脂进行GC分析，进一步证实了基因的破坏(见实施例5)。

实施例4

PDAT和DGAT2基因都被破坏的

解脂西洋蓍酵母双重敲除菌株的构建

本实施例描述了双重敲除菌株的产生，所述菌株的PDAT和DGAT2基因都被破坏。

具体地讲，用质粒pLV13(来自实施例3)转化解脂西洋蓍酵母ATCC#90812潮霉素抗性“S-D”突变株(包含实施例2的DGAT2破坏)，然后如实施例3所述，通过PCR筛选转化子。证实12个转化子中有2个的DGAT2和PDAT基因都被破坏。通过对破坏的菌株之一(称为“S-D-P”)的总脂进行GC分析，进一步证实了基因的破坏(见实施例5)。

实施例5

突变型和野生型解脂西洋蓍酵母菌株(ATCC#90812)的 TAG含量测定

按照以下两种不同培养条件，分别培养野生型解脂西洋蓍酵母(ATCC#90812)和或者PDAT(来自实施例3)、或者DGAT2(来自实施例2)或者PDAT和DGAT2两者(来自实施例4)的基因被破坏的突变型解脂西洋蓍酵母(ATCC#90812)的单菌落：

·培养条件1：在30℃，将细胞在3ml极限培养基(配方/L：20g葡萄糖、1.7g yeast nidrogen base、1g L-脯氨酸、0.1g L-腺嘌呤、0.1g L-赖氨酸，pH6.1)中培养至OD600约为1.0。收获细胞，在蒸馏水中洗涤，快速真空干燥，然后在薄层层析(TLC)(见下文)之后，进行脂质的GC分析。

·培养条件2：使用诱导产油的条件，将细胞在50ml培养基中培养。具体地讲，从平板上挑取一环细胞，接种到一个装有3mlYPD培养基的摇瓶中并于30℃培养过夜(300rpm)。收获细胞，用0.9％NaCl洗涤一次，然后重悬浮在50ml高浓度葡萄糖培养基[配方/L：7g KH₂PO₄、2g K₂HPO₄、2g MgSO₄·7H₂O、80g葡萄糖、0.1g亮氨酸、0.1g尿嘧啶和0.1g L-赖氨酸，pH5.0]中。

然后如上所述，将细胞在摇瓶中培养48h。细胞用水洗涤，然后将细胞沉淀物冻干。20mg(干重)细胞用于在TLC(见下文)和GC分析后，通过GC分析测定总脂肪酸和油组成。

薄层层析法

用于TLC的方法见以下5步描述：

1)将15∶0脂肪酸(10μl 10mg/ml)内标物加入到2-3mg干细胞块内，接着用甲酶/氯仿法萃取总脂。

2)用25-50μl微量移液管，将萃取的脂肪(50μl)点样到距5×20cm硅胶60板下缘约1英寸处用铅笔轻划的线上。

3)然后在N2下让TLC板干燥，再插入到装有约100ml 80∶20∶1的己烷∶乙醚∶乙酸溶剂的槽中。

4)条带分离后，从板的一侧喷撒碘蒸汽以鉴别条带。这样就可以用刮刀刮取板的另一侧上的样品，用于进一步分析。

5)按照通用方法，对刮取的样品进行基础酯交换和GC分析。

GC分析结果

GC结果见下表5和表6。培养物称为“S”菌株(野生型)、“S-P”(PDAT敲除)、“S-D”(DGAT2敲除)和“″S-P-D”(PDAT和DGAT2敲除)。所用缩写词为：WT＝野生型；TFA＝总脂肪酸；dcw＝细胞干重；％WT＝相对于野生型(″S″菌株)的％。

表5

PDAT、DGAT2或这两者都破坏的西洋蓍酵母ATCC#90812菌株

(在极限培养基中培养)的含脂量

培养物	部分	TFA
		TFA		％dcw	％WT
		S菌株(WT)	总	％dcw	％WT	12	100
TAG	15		总	100		12	100
TAG	15		磷脂	100	5
S-P	总		磷脂	11	5		89
	总	TAG	14	11	98		89
	磷脂	TAG	14	5	98
	磷脂	S-D	总	5	10		81
TAG	10		总	66	10		81
TAG	10		磷脂	66	4
S-P-D	总		磷脂	8	4		64
	总	TAG	7	8	50		64
	磷脂	TAG	7	3	50

表6

PDAT、DGAT2或这两者都破坏的西洋蓍酵母ATCC#90812菌株

(在产油条件下培养)的含脂量

培养物	Dcw，mg	脂质部分	μg	TFA％	％WT
培养物	Dcw，mg	脂质部分	μg	TFA％	％WT	S菌株(WT)S-DS-PS-P-DS菌株(WT)S-DS-PS-P-D	32.037.528.831.232.037.528.831.2	总总总总TAGTAGTAGTAG	797329318228697227212122	dcw15.96.46.04.313.94.44.02.3	100403827100322917

以上结果表明，破坏的菌株与野生型相比显示出降低的油含量(TFA％dcw)。而且，表5和表6上的结果证实，编码DGAT2和PDAT的解脂西洋蓍酵母基因在天然生物中促使油的生物合成，其中DGAT2在产油过程中对油的生物合成起到主要促进作用。然而，令人惊奇的是，该结果也表明，存在额外参与油生物合成的解脂西洋蓍酵母基因。

实施例6

全长解脂西洋蓍酵母DGAT2和PDAT基因的克隆

本实施例描述了回收邻接破坏的DGAT2和PDAT基因的基因组序列的方法，所述方法通过质粒拯救，使用拯救质粒中的序列，对天然基因的完整ORF进行PCR。将全长基因及其推导出的氨基酸序列分别与其它真菌DGAT2和PDAT序列进行比较。

解脂西洋蓍酵母DGAT2和PDAT基因的质粒拯救

因为酰基转移酶基因因插入完整的pY21DGAT2和pLV13载体而被破坏，所述载体各自含有大肠杆菌氨苄青霉素抗性基因和大肠杆菌ori，它可在大肠杆菌中拯救PDAT和DGAT2侧翼序列。为此，采用DNeasy Tissue Kit，分离解脂西洋蓍酵母菌株“S-D”基因组DNA(携带破坏的DGAT2基因；实施例2)和解脂西洋蓍酵母菌株“S-P”基因组DNA(携带破坏的PDAT基因；实施例3)。具体地讲，10μg基因组DNA用50U以下限制酶、以200μl的反应体积进行消化：对于DGAT2--Age I和Nhe I；对于PDAT--Kpn I、Pac I和Sac I。消化的DNA用苯酚：氯仿抽提，然后重悬浮在40μl去离子水中。消化的DNA(10μl)在200μl含有3U T4DNA连接酶的连接混合物中自我连接。每次连接反应都于16℃进行12h。连接的DNA用苯酚∶氯仿抽提，然后重悬浮在40μl去离子水中。最后通过电穿孔，用1μl重悬浮的连接DNA转化大肠杆菌并接种在含有氨苄青霉素(Ap)的LB平板中。分离Ap抗性转化子并分析质粒的存在。在回收或拯救质粒中发现以下大小的插入片段(表7和表8)：

表7

根据限制酶，回收的DGAT2质粒的插入片段大小

酶	质粒插入片段大小(kB)
酶	质粒插入片段大小(kB)	Agel	2.3
Nhel	9.5	Agel	2.3

表8

根据限制酶，回收的PDAT质粒的插入片段大小

酶	质粒插入片段大小(kB)
酶	质粒插入片段大小(kB)	Kpn I	6.9
Sac I	5.4	Kpn I	6.9
Sac I	5.4	Sph I	7.0

用测序引物P79(SEQ ID NO：53)和P95(SEQ ID NO：32)，开始对DGAT2拯救质粒进行测序。相比之下，用测序引物P84(SEQ ID NO：54)和P85(SEQ ID NO：55)，开始对PDAT质粒进行测序。

根据测序结果，装配编码解脂西洋蓍酵母DGAT2基因的全长基因(2119bp；SEQ ID NO：30)。具体地讲，所述序列编码1545个碱基(SEQ ID NO：30的核苷酸+291至+1835)的可读框(ORF)，而由其推导出的氨基酸序列长度为514个残基(SEQ ID NO：31)。因为该ORF在1位、以及在56位和160位上具有起始密码子(′ATG′)，它含有至2个额外的嵌套(较小的)ORF。具体地讲，一个ORF长度为1380个碱基(SEQ ID NO：30的核苷酸+456至+1835)，其推导出的氨基酸序列为459个残基(SEQ ID NO：78)；另一个ORF长度为1068个碱基(SEQID NO：30的核苷酸+768至+1835)，其推导出的氨基酸序列为355个残基(SEQ ID NO：79)，其由SEQ ID NO：86编码。

由SEQ ID NO：86编码的ORF与其它已知DGAT酶具有高度相似性，并且因为SEQ ID NO：86中的破坏消除了天然基因的DGAT功能，所以已经清楚地鉴定出SEQ ID NO：79的多肽具有DGAT功能。例如，长度为355个残基的解脂西洋蓍酵母DGAT2(即SEQ ID NO：79)比酿酒酵母蛋白仅短16个氨基酸，比拉曼被孢霉2A型蛋白仅短7个氨基酸，比拉曼被孢霉2B型蛋白仅短2个氨基酸(见下文)。然而，尽管有这一假说，它可用于检测由SEQ ID NO：31、78和79编码的所有3个ORF对西洋蓍酵母DGAT2蛋白表达的贡献。

使用DNASTAR软件包(Madison，WI)的ClustalW(Slow/Accurate，Gonnet)程序，将SEQ ID NO：79(即由其推导出的355个残基的氨基酸序列；解脂西洋蓍酵母DGAT2(“Y1”))与已知真菌DGAT2进行了比较(见下表9)。

表9

已知真菌DGAT2的描述

生物体	缩写词	参考
生物体	缩写词	参考	酿酒酵母DGA1基因[基因座NP_014888]	Sc	GenBank检索号NC_001147
拉曼被孢霉DGAT2 2A型	MrA	GenBank检索号AF391089	酿酒酵母DGA1基因[基因座NP_014888]	Sc	GenBank检索号NC_001147
拉曼被孢霉DGAT2 2A型	MrA	GenBank检索号AF391089	拉曼被孢霉DGAT2 2B型	MrB	GenBank检索号AF391090

该比较表明配对距离(Pair Distances)的相似性百分率，见图4A。因此，将其它真菌同源物推导出的氨基酸序列与SEQ ID NO：79所示的本文所述解脂西洋蓍酵母DGAT2进行比较，表现出小于38.4％的氨基酸同一性。

对上述DGAT2蛋白进行测序和分析后，公开了解脂西洋蓍酵母DGAT2蛋白序列，作为Genolevures计划(由以下机构资助：Center forBioinformatics，LaBRI，btiment A30，UniversitéBordeaux 1，351，coursde 1a Libération，33405 Talence Cedex，France)的一部分。具体地讲，本文所公开的序列鉴定为ORF YALI-CDS2240.1，其编码514个氨基酸，据报道，所述蛋白与trlQ08650酿酒酵母YOR245C DGA1酰基-CoA：二酰基甘油酰基转移酶共享一些相似性。

按照用于推导DGAT2的全长序列类似方法，根据测序结果，装配编码解脂西洋蓍酵母PDAT基因的全长基因(2326bp；SEQ ID NO：45)。具体地讲，所述序列编码1944个碱基的可读框(SEQ ID NO：45的核苷酸+274至+2217)，而由其推导出的氨基酸序列长度为648个残基(SEQ ID NO：46)。采用上述分析方法，将解脂西洋蓍酵母PDAT(“Y1”)推导出的氨基酸序列与其它已知真菌PDAT进行比较(见表10)。

表10

已知或推定的真菌PDAT的描述

生物体	缩写词	参考
生物体	缩写词	参考	酿酒酵母Lro 1基因	Sc	Dahlqvist等，Proc.Natl.Acad.Sci.USA 97：6487(2000)
拟南芥“At3g44830”基因(卵磷脂：胆固醇酰基转移酶家族蛋白/LACT家族蛋白)	At2	GenBank检索号NP190069[gi：15230521]	酿酒酵母Lro 1基因	Sc	Dahlqvist等，Proc.Natl.Acad.Sci.USA 97：6487(2000)
拟南芥“At3g44830”基因(卵磷脂：胆固醇酰基转移酶家族蛋白/LACT家族蛋白)	At2	GenBank检索号NP190069[gi：15230521]	拟南芥	At1	GenBank检索号AB006704[gi：2351069]
粟酒裂殖酵母“SPBC776.14”基因	Sp	GenBank检索号NP_596330[gi：19113122]	拟南芥	At1	GenBank检索号AB006704[gi：2351069]

该比较结果见图4B的配对距离。结果证明，解脂西洋蓍酵母PDAT与其它PDAT同源物具有小于47.1％的氨基酸同一性。

对上述PDAT蛋白进行测序和分析后，公开了解脂西洋蓍酵母PDAT蛋白序列，作为Genolevures计划(出处同上)。本文所公开的PDAT序列鉴定为ORF YALI-CDS1359.1，其编码648个氨基酸，据报道，所述蛋白与splP40345酿酒酵母YNR008w LRO1卵磷脂胆固醇酰基转移酶样基因(其介导二酰基甘油的酯化)共享一些相似性。

实施例7

解脂西洋蓍酵母PDAT在酿酒酵母中的功能性表达

本实施例描述了编码PDAT的解脂西洋蓍酵母基因(SEQ ID NO：45)在酿酒酵母野生型和DGAT2/PDAT敲除菌株中的表达。

酿酒酵母菌株

从Open Biosystems(Huntsville，AL.)得到以下两个酿酒酵母菌株：

BY4741 WT(MATa、his3Δ1、1eu2Δ0、metl5Δ0和ura3Δ0)；和

BY4741 dga1(MATa、his3Δ1、leu2Δ0、metl5Δ0和ura3Δ0)、dgal(比较突变型DGAT2基因)。

如下所述，按照Open Biosytem推荐的方法，通过破坏编码PDAT的Lro1基因，从菌株BY4741 dga1得到单倍体菌株BY4741dga1/lro1。

首先，通过PCR，从质粒pJJ250扩增酿酒酵母LEU2基因，制备酿酒酵母LRO 1打靶盒(Jones，J.S.和I.Prakash，Yeast 6：363-366(1990))。使用以下引物对来完成这一步骤：

^*UP 161(SEQ ID NO：84)，由以下组成的81聚体：LRO 1基因5＇非翻译区在引物5′端的45bp，后接LEU2基因5′端的36bp；和

^*LP 162(SEQ ID NO：85)，由以下组成的81聚体：LRO 1基因3＇非翻译区在引物5′端的45bp，后接LEU2基因3′端的36bp。

在琼脂糖凝胶电泳后，纯化所需的1901bp的PCR产物，并通过标准乙酸锂方法(Current Protocols in Molecular Biology，P13.7.1)，转化菌株BY4741 dga1。在DOB-Leu平板(配方/L：43.7g DOBA[BIO101^Systems，目录号4026-012；Krackeler Scientific，Inc.，Albany，NY]和0.69g CSM-Leu[BIO 101^Systems，目录号4510-512；KrackelerScientific，Inc.])上选择转化子。3天后，可观察到超过100个转化子菌落；从这些菌落中选取6个进行PCR分析。在所有6个菌落中都证实了LRO 1敲除，因此得到双重敲除的酿酒酵母，在本文鉴定为菌株BY4741 dga1/lro1。

质粒pScGPD-YIPDAT(包含GPD::PDAT::ADH1嵌合基因)的合成采用引物GPD-1(SEQ ID NO：80)和GPD-2(SEQ ID NO：81)，使用标准条件，扩增酿酒酵母GPD(TDH3基因，其编码甘油醛-3-磷酸脱氢酶)启动子。将所得653bp的PCR产物克隆到pGEM-T(Promega，Madison，WI)中。所得质粒pGPD-GEM用Sac II和Spe I切割。分离含有GPD启动子的673bp片段并克隆到用Sac II和SpeI消化的酿酒酵母载体pRS426中，形成质粒pGPD426[pRS426是酵母自主复制载体，其携带URA基因(Christianson T.W.等，Gene 110：119-122(1992))]。

用引物ADHT-1(SEQ ID NO：82)和ADHT-2(SEQ ID NO：83)扩增酿酒酵母ADH1(醇脱氢酶基因)终止子区。所得330bp的PCR产物用Xho I和Kpn I切割并克隆到pGPD426的Xho I和Kpn I之间，结果形成质粒pGPD426N。

质粒pGPD426N用Nco I和Not I切割，然后将携带西洋蓍酵母PDAT ORF的Nco I-Not I片段克隆进去。因此，所得质粒pScGPD-YIPDAT含有在酿酒酵母GPD启动子控制之下的解脂西洋蓍酵母PDAT ORF(即GPD::PDAT::ADH1嵌合基因)。

解脂西洋蓍酵母PDAT在酿酒酵母中的转化和表达

通过标准乙酸锂方法(出处同上)，使用或者pGPD426N(“对照”)或者酵母质粒pScGPD-YIPDAT(包含GOD::PDAT::ADH1)，转化酿酒酵母菌株BY4741 dga1/lro1。挑出阳性转化子(即URA原养型)，在缺乏Ura的平板(即DOB-Ura平板(配方/L：43.7g DOBA[BIO 101^Systems，目录号4026-012；Krackeler Scientific，Inc.，Albany，NY]和0.69g CSM-Leu[BIO 101^Systems，目录号4511-212；KrackelerScientific，Inc.]))上划线并预培养1-2天。挑取一环细胞，接种到3ml缺乏Ura的培养基中，30℃培养过夜。将预培养物转入40ml培养基中，将细胞培养52h，然后收获，用水洗涤并冻干。测定细胞干重(“dcw”)，并通过直接基础酯交换，分析干细胞量。

表11

PDAT和DGAT2破坏的酿酒酵母菌株中的含脂量

菌株	质粒	用于GC的dcw(mg)	TFA(mg)	TFA％dcw
菌株	质粒	用于GC的dcw(mg)	TFA(mg)	TFA％dcw	BY4741dga 1/lro 1	pGPD426N(对照)	8.3	67	0.8
BY4741dga 1/lro 1	pScGPD-YIPDAT	9.4	154	1.6	BY4741dga 1/lro 1	pGPD426N(对照)	8.3	67	0.8

pScGPD-YIPDAT转化子中的总脂肪酸(相对于细胞干重的百分数的总脂肪酸，第5列，“TFA％dcw”)是对照(仅含有载体)的两倍。因为酿酒酵母不是产油生物，其总脂肪酸产量的差异是明显的。这些结果证实，由SEQ ID NO：45编码的酶相当于功能性解脂西洋蓍酵母PDAT酶。

实施例8

西洋蓍酵母甘油醛磷酸脱氢酶(GPD)启动子区的分离

本实施例描述了通过使用来自其它GPD序列保守区的引物，鉴定编码甘油醛磷酸脱氢酶的解脂西洋蓍酵母基因启动子区(SEQ IDNO：56)的方法。

对来自以下生物体的编码不同蛋白序列的GPD基因进行了比较：酿酒酵母(GenBank检索号CAA24607；SEQ ID NO：57)、粟酒裂殖酵母(GenBank检索号NP_595236；SEQ ID NO：58)、米曲霉(GenBank检索号AAK08065；SEQ ID NO：59)、褐牙鲆(GenBank检索号BAA88638；SEQ ID NO：60)、有爪蟾蜍(GenBank检索号P51469；SEQ ID NO：61)和原鸡(GenBank检索号DECHG3；SEQ ID NO：62)，显示在6个不同生物中的保守氨基酸序列有几个序列段(图5A和图5B)。因此，设计了分别对应于保守“KYDSTHG”(SEQ ID NO：63)和“TGAAKAV”(SEQ ID NO：64)的氨基酸序列的两个简并寡核苷酸(见下文)，并用于扩增来自解脂西洋蓍酵母的GPD的部分编码区：

简并寡核苷酸YL193：(SEQ ID NO：65)

AAGTACGAYTCBACYCAYGG

简并寡核苷酸YL194：(SEQ ID NO：66)

ACRGCCTTRGCRGCDCCRGT

[注意：用于SEQ ID NO：65和66的核酸简并密码如下：R＝A/G；Y＝C/T；B＝C/G/T；D＝A/G/T]。

根据图5A和图5B的GPD序列的全长序列，假定如上所述扩增的解脂西洋蓍酵母的GPD基因将从其N-端缺失约50个氨基酸，从其C-端缺失约115个氨基酸。

在包含以下成分的50μl总体积中进行PCR扩增：PCR缓冲液(含有10mM KCl、10mM(NH₄)₂SO₄、20mM Tris-HCl(pH 8.75)、2mMMgSO₄、0.1％Triton X-100)、100μg/ml BSA(终浓度)、脱氧核糖核苷三磷酸各200μM、引物各10pmole、50ng解脂西洋蓍酵母(ATCC#76982)基因组DNA和1μl Taq DNA聚合酶(Epicentre Technologies)。热循环仪条件设置为：35次循环，在95℃1min，56℃30sec和72℃1min，接着是在72℃最终延伸10min。

使用Qiagen PCR纯化试剂盒(Valencia，CA)对PCR产物进行纯化，再用1％(w/v)琼脂糖凝胶电泳进一步纯化。随后将所得PCR产物克隆到pGEM-T-easy载体(Promega，Madison，WI)中。连接的DNA用于转化大肠杆菌DH5α细胞，然后在含有氨苄青霉素(100μg/ml)的LB琼脂上选择转化子。对一个转化子进行的质粒DNA分析证实存在所需大小的质粒，其命名为“pT-GPD”。

序列分析显示，pT-GPD含有507bp片段(SEQ ID NO：67)。通过运行BLAST(Basic Local Alignment Search Tool；Altschul，S.F.等，J.Mol.Biol.215：403-410(1993)确定该序列的身份；搜索与BLAST“nr”数据库所含有的序列的相似性(包含所有非冗余GenBank CDS翻译，来自3维结构Brookhaven Protein Data Bank、SWISS-PROT蛋白序列数据库、EMBL和DDBJ数据库的序列)。用BLASTN算法[其由国立生物技术信息中心(National Center for Biotechnology Information(NCBI))提供]，分析所述序列与所有公众可用的“nr”数据库所含有的DNA序列的相似性。以所有阅读框翻译所述DNA序列，并使用NCBI所提供的BLASTX算法(Gish，W.和States，D.J.Nature Genetics3：266-272(1993))，比较其与所有公众可用的蛋白序列的相似性，所述蛋白序列包含在“nr”数据库中。按照％同一性、％相似性和期望值，报道BLAST的比较结果，发现了与SEQ ID NO：67具有最大相似性的序列。“％同一性”定义为两个蛋白之间相同氨基酸的百分率。“％相似性”定义为两个蛋白之间相同或保守氨基酸的百分率。“期望值”估计匹配的统计学显著性，用给定分值来规定匹配数，期望完全偶然地在这一大小的数据库中进行搜索。发现507bp的pT-GPD编码169个氨基酸(SEQ ID NO：68)。该氨基酸片段与裂殖酵母GPD蛋白序列(GenBank检索号NP_595236)具有77％同一性和84％相似性，其期望值为6e-68。西洋蓍酵母序列在其N-端和C-端具有“KYDSTHG”(SEQ ID NO：63)和“TGAAKAV”(SEQ ID NO：64)氨基酸序列(对应于用于扩增该片段的简并引物)。

为了分离GPD启动子区，按照实施例2所述，使用基因组步查技术(TOPO^Walker Kit，Invitrogen)。简而言之，解脂西洋蓍酵母基因组DNA用KpnI、SacI、SphI或PacI消化，并用小牛小肠碱性磷酸酶(CIP)脱磷酸。然后用引物YL206(SEQ ID NO：69)进行引物延伸反应。将引物延伸产物与TOPO^Linker连接，随后用作PCR反应的模板，该PCR反应用LinkAmp引物1(SEQ ID NO：29)和引物YL207(SEQ ID NO：70)。新扩增产物再用LinkAmp引物2(SEQ ID NO：77)和引物YL208(SEQ ID NO：71)进行第二次PCR反应。

用Qiagen PCR纯化试剂盒、接着通过1％琼脂糖凝胶电泳，纯化包含GPD基因5′上游区的PCR产物。然后将产物克隆到pGEM-T-easy载体(Promega，Madiaon，WI)中。连接的DNA用于转化大肠杆菌DH5α，转化子在含有氨苄青霉素(100μg/ml)的LB琼脂上选择。

对一个包含GPD基因5′上游区的转化子进行质粒DNA分析，证实存在预期的质粒，将其命名为pT-GPDP。序列分析表明，pT-GPDP含有1848bp片段(SEQ ID NO：72)，其中包括自GPD基因翻译起始密码子“ATG”的核苷酸“A”(称为+1)开始的1525bp 5′上游序列。确定GPD基因的-968位和ATG翻译起始位点之间的核苷酸区含有推定启动子区(“GPDPro”，如SEQ ID NO：56所示)。

实施例9(预言)

解脂西洋蓍酵母PDAT和DGAT2ORF

在西洋蓍酵母启动子控制下的表达

本实施例描述了野生型西洋蓍酵母菌株中嵌合基因内PDAT和DGAT2ORF在解脂西洋蓍酵母启动子控制下的过量表达。

解脂西洋蓍酵母DGAT2在解脂西洋蓍酵母中的表达

解脂西洋蓍酵母DGAT2的ORF，即SEQ ID NO：86，编码SEQ IDNO：79所示355个氨基酸残基的蛋白。用来自解脂西洋蓍酵母ATCC#90812基因组DNA的上游引物P145(SEQ ID NO：73)和下游引物P146(SEQ ID NO：74)，对解脂西洋蓍酵母DGAT2的ORF进行PCR扩增。分离所需的1071bp片段，纯化，用Nco I和Not I消化，克隆到Nco I-Not I所切割的pY5-13载体(如实施例1所述)中，使得所述基因处于解脂西洋蓍酵母TEF启动子的控制之下。通过小量制备(miniprep)分析，证实正确的转化子，所得质粒命名为pY27-DGAT2。

将质粒pY5-13(“对照”)和pY27-DGAT2转化到解脂西洋蓍酵母ATCC#90812野生型(WT)和DGAT2破坏的ATCC#90812(“S-D”)菌株中，然后在BIO 101^Systems DOB/CSM-Leu平板(KrackelerScientific，Inc.，Albany，NY)上进行选择。按照通用方法所述，培养单菌落转化子并进行GC分析。

解脂西洋蓍酵母PDAT在解脂西洋蓍酵母中的表达

用引物YPDAT5(SEQ ID NO：75)和YPDAT3(SEQ ID NO：76)和来自解脂西洋蓍酵母ATCC#90812的基因组DNA作为模板，对解脂西洋蓍酵母PDAT的ORF进行PCR扩增。分离所需1947bp片段，纯化，用NotI消化，克隆到NotI所切割的载体pY5-22GPD，使之处于西洋蓍酵母GPD启动子的控制之下。载体pY5-22GPD类似于pY5-13(实施例1)，都具有大肠杆菌ApR基因、大肠杆菌ori和西洋蓍酵母ARS序列。通过质粒DNA分析，证实正确的转化子，所得质粒命名为pY27-PDAT。

将质粒pY5-22GPD(“对照”)和pY27-PDAT转化到解脂西洋蓍酵母ATCC#90812野生型(WT)和PDAT破坏的ATCC#90812(″S-p″)菌株中，然后在BIO 101^Systems DOB/CSM-Leu平板上进行选择。按照通用方法所述，培养单菌落转化子并进行GC分析。

预期结果

因为PDAT酶和DGAT2酶都参与油的生物合成，所以预期它们的过量表达将会导致当这些酶限制的条件下的含油量增加。这一点通过以下证据得到证实：DGAT2的破坏、PDAT的破坏和这两个基因一起破坏都会导致含油量下降。

序列表

<110>E.I.du Pont de Nemours & Company

<120>用于改变产油酵母多不饱和脂肪酸和油含量的酰基转移酶

<130>CL.2302 PCT

<160>86

<170>PatentIn version 3.2

<210>1

<211>19

<212>DNA

<213>人工序列

<220>

<223>引物TEF5′

<400>1

agagaccggg ttggcggcg 19

<210>2

<211>30

<212>DNA

<213>人工序列

<220>

<223>引物TEF3′

<400>2

ttggatcctt tgaatgattc ttatactcag 30

<210>3

<211>29

<212>DNA

<213>人工序列

<220>

<223>引物XPR5′

<400>3

tttccgcggc ccgagattcc ggcctcttc 29

<210>4

<211>31

<212>DNA

<213>人工序列

<220>

<223>引物XPR3′

<400>4

tttccgcgga cacaatatct ggtcaaaattt c 31

<210>5

<211>39

<212>DNA

<213>人工序列

<220>

<223>引物YL5

<400>5

cccccctcga ggtcgatggt gtcgataagc ttgatatcg 39

<210>6

<211>39

<212>DNA

<213>人工序列

<220>

<223>引物YL6

<400>6

cgatatcaag cttatcgaca ccatcgacct cgagggggg 39

<210>7

<211>35

<212>DNA

<213>人工序列

<220>

<223>引物YL9

<400>7

tggtaaataa atgatgtcga ctcaggcgac gacgg 35

<210>8

<211>35

<212>DNA

<213>人工序列

<220>

<223>引物YL10

<400>8

ccgtcgtcgc ctgagtcgac atcatttatt tacca 35

<210>9

<211>37

<212>DNA

<213>人工序列

<220>

<223>引物YL7

<400>9

caaccgattt cgacagttaa ttaataattt gaatcga 37

<210>10

<211>37

<212>DNA

<213>人工序列

<220>

<223>引物YL8

<400>10

tcgattcaaa ttattaatta actgtcgaaa tcggttg 37

<210>11

<211>36

<212>DNA

<213>人工序列

<220>

<223>引物YL3

<400>11

gtataagaat cattcaccat ggatccacta gttcta 36

<210>12

<211>36

<212>DNA

<213>人工序列

<220>

<223>引物YL4

<400>12

tagaactagt ggatccatgg tgaatgattc ttatac 36

<210>13

<211>30

<212>DNA

<213>人工序列

<220>

<223>引物YL1

<400>13

cagtgccaaa agccaaggca ctgagctcgt 30

<210>14

<211>31

<212>DNA

<213>人工序列

<220>

<223>引物YL2

<400>14

gacgagctca gtgccttggc ttttggcact g 31

<210>15

<211>33

<212>DNA

<213>人工序列

<220>

<223>引物YL61

<400>15

acaattccac acaacgtacg agccggaagc ata 33

<210>16

<211>33

<212>DNA

<213>人工序列

<220>

<223>引物YL62

<400>16

tatgcttccg gctcgtacgt tgtgtggaat tgt 33

<210>17

<211>1026

<212>DNA

<213>大肠杆菌(Escherichia coli)

<400>17

atgaaaaagc ctgaactcac cgcgacgtct gtcgagaagt ttctgatcga aaagttcgac 60

agcgtctccg acctgatgca gctctcggag ggcgaagaat ctcgtgcttt cagcttcgat 120

gtaggagggc gtggatatgt cctgcgggta aatagctgcg ccgatggttt ctacaaagat 180

cgttatgttt atcggcactt tgcatcggcc gcgctcccga ttccggaagt gcttgacatt 240

ggggaattca gcgagagcct gacctattgc atctcccgcc gtgcacaggg tgtcacgttg 300

caagacctgc ctgaaaccga actgcccgct gttctgcagc cggtcgcgga ggccatggat 360

gcgatcgctg cggccgatct tagccagacg agcgggttcg gcccattcgg accgcaagga 420

atcggtcaat acactacatg gcgtgatttc atatgcgcga ttgctgatcc ccatgtgtat 480

cactggcaaa ctgtgatgga cgacaccgtc agtgcgtccg tcgcgcaggc tctcgatgag 540

ctgatgcttt gggccgagga ctgccccgaa gtccggcacc tcgtgcacgc ggatttcggc 600

tccaacaatg tcctgacgga caatggccgc ataacagcgg tcattgactg gagcgaggcg 660

atgttcgggg attcccaata cgaggtcgcc aacatcttct tctggaggcc gtggttggct 720

tgtatggagc agcagacgcg ctacttcgag cggaggcatc cggagcttgc aggatcgccg 780

cggctccggg cgtatatgct ccgcattggt cttgaccaac tctatcagag cttggttgac 840

ggcaatttcg atgatgcagc ttgggcgcag ggtcgatgcg acgcaatcgt ccgatccgga 900

gccgggactg tcgggcgtac acaaatcgcc cgcagaagcg cggccgtctg gaccgatggc 960

tgtgtagaag tactcgccga tagtggaaac cgacgcccca gcactcgtcc gagggcaaag 1020

gaatag 1026

<210>18

<211>341

<212>PRT

<213>大肠杆菌(Escherichia coli)

<400>18

Met Lys Lys Pro Glu Leu Thr Ala Thr Ser Val Glu Lys Phe Leu Ile

1 5 10 15

Glu Lys Phe Asp Ser Val Ser Asp Leu Met Gln Leu Ser Glu Gly Glu

20 25 30

Glu Ser Arg Ala Phe Ser Phe Asp Val Gly Gly Arg Gly Tyr Val Leu

35 40 45

Arg Val Asn Ser Cys Ala Asp Gly Phe Tyr Lys Asp Arg Tyr Val Tyr

50 55 60

Arg His Phe Ala Ser Ala Ala Leu Pro Ile Pro Glu Val Leu Asp Ile

65 70 75 80

Gly Glu Phe Ser Glu Ser Leu Thr Tyr Cys Ile Ser Arg Arg Ala Gln

85 90 95

Gly Val Thr Leu Gln Asp Leu Pro Glu Thr Glu Leu Pro Ala Val Leu

100 105 110

Gln Pro Val Ala Glu Ala Met Asp Ala Ile Ala Ala Ala Asp Leu Ser

115 120 125

Gln Thr Ser Gly Phe Gly Pro Phe Gly Pro Gln Gly Ile Gly Gln Tyr

130 135 140

Thr Thr Trp Arg Asp Phe Ile Cys Ala Ile Ala Asp Pro His Val Tyr

145 150 155 160

His Trp Gln Thr Val Met Asp Asp Thr Val Ser Ala Ser Val Ala Gln

165 170 175

Ala Leu Asp Glu Leu Met Leu Trp Ala Glu Asp Cys Pro Glu Val Arg

180 185 190

His Leu Val His Ala Asp Phe Gly ser Asn Asn Val Leu Thr Asp Asn

195 200 205

Gly Arg Ile Thr Ala Val Ile Asp Trp ser Glu Ala Met Phe glv Asp

210 215 220

Ser Gln Tyr Glu Val Ala Asn Ile Phe Phe Trp Arg Pro Trp Leu Ala

225 230 235 240

Cys Met Glu Gln Gln Thr Arg Tyr Phe Glu Arg Arg His Pro Glu Leu

245 250 255

Ala Gly ser Pro Arg Leu Arg Ala Tyr Met Leu Arg Ile Gly Leu Asp

260 265 270

Gln Leu Tyr Gln Ser Leu Val Asp Gly Asn Phe Asp Asp Ala Ala Trp

275 280 285

Ala Gln Gly Arg Cys Asp Ala Ile Val Arg Ser Gly Ala Gly Thr Val

290 295 300

Gly Arg Thr Gln Ile Ala Arg Arg Ser Ala Ala Val Trp Thr Asp Gly

305 310 315 320

Cys Val Glu Val Leu Ala Asp Ser Gly Asn Arg Arg Pro ser Thr Arg

325 330 335

Pro Arg Ala Lys Glu

340

<210>19

<211>1710

<212>DNA

<213>解脂西洋蓍酵母(Yarrowia lipolytica)

<400>19

gtcgacgagt atctgtctga ctcgtcattg ccgcctttgg agtacgactc caactatgag 60

tgtgcttgga tcactttgac gatacattct tcgttggagg ctgtgggtct gacagctgcg 120

ttttcggcgc ggttggccga caacaatatc agctgcaacg tcattgctgg ctttcatcat 180

gatcacattt ttgtcggcaa aggcgacgcc cagagagcca ttgacgttct ttctaatttg 240

gaccgatagc cgtatagtcc agtctatcta taagttcaac taactcgtaa ctattaccat 300

aacatatact tcactgcccc agataaggtt ccgataaaaa gttctgcaga ctaaatttat 360

ttcagtctcc tcttcaccac caaaatgccc tcctacgaag ctcgagctaa cgtccacaag 420

tccgcctttg ccgctcgagt gctcaagctc gtggcagcca agaaaaccaa cctgtgtgct 480

tctctggatg ttaccaccac caaggagctc attgagcttg ccgataaggt cggaccttat 540

gtgtgcatga tcaagaccca tatcgacatc attgacgact tcacctacgc cggcactgtg 600

ctccccctca aggaacttgc tcttaagcac ggtttcttcc tgttcgagga cagaaagttc 660

gcagatattg gcaacactgt caagcaccag tacaagaacg gtgtctaccg aatcgccgag 720

tggtccgata tcaccaacgc ccacggtgta cccggaaccg gaatcattgc tggcctgcga 780

gctggtgccg aggaaactgt ctctgaacag aagaaggagg acgtctctga ctacgagaac 840

tcccagtaca aggagttcct ggtcccctct cccaacgaga agctggccag aggtctgctc 900

atgctggccg agctgtcttg caagggctct ctggccactg gcgagtactc caagcagacc 960

attgagcttg cccgatccga ccccgagttt gtggttggct tcattgccca gaaccgacct 1020

aagggcgact ctgaggactg gcttattctg acccccgggg tgggtcttga cgacaaggga 1080

gacgctctcg gacagcagta ccgaactgtt gaggatgtca tgtctaccgg aacggatatc 1140

ataattgtcg gccgaggtct gtacggccag aaccgagatc ctattgagga ggccaagcga 1200

taccagaagg ctggctggga ggcttaccag aagattaact gttagaggtt agactatgga 1260

tatgtcattt aactgtgtat atagagagcg tgcaagtatg gagcgcttgt tcagcttgta 1320

tgatggtcag acgacctgtc tgatcgagta tgtatgatac tgcacaacct gtgtatccgc 1380

atgatctgtc caatggggca tgttgttgtg tttctcgata cggagatgct gggtacaagt 1440

agctaatacg attgaactac ttatacttat atgaggcttg aagaaagctg acttgtgtat 1500

gacttattct caactacatc cccagtcaca ataccaccac tgcactacca ctacaccaaa 1560

accatgatca aaccacccat ggacttcctg gaggcagaag aacttgttat ggaaaagctc 1620

aagagagaga agccaagata ctatcaagac atgtgtcgca acttcaagga ggaccaagct 1680

ctgtacaccg agaaacaggc ctttgtcgac 1710

<210>20

<211>286

<212>PRT

<213>解脂西洋蓍酵母(Yarrowialipolytica)

<400>20

Met Pro Ser Tyr Glu Ala Arg Ala Asn Val His Lys Ser Ala Phe Ala

1 5 10 15

Ala Arg Val Leu Lys Leu Val Ala Ala Lys Lys Thr Asn Leu Cys Ala

20 25 30

Ser Leu Asp Val Thr Thr Thr Lys Glu Leu Ile Glu Leu Ala Asp Lys

35 40 45

Val Gly Pro Tyr Val Cys Met Ile Lys Thr His Ile Asp Ile Ile Asp

50 55 60

Asp Phe Thr Tyr Ala Gly Thr Val Leu Pro Leu Lys Glu Leu Ala Leu

65 70 75 80

Lys His Gly Phe Phe Leu Phe Glu Asp Arg Lys Phe Ala Asp Ile Gly

85 90 95

Asn Thr Val Lys His Gln Tyr Lys Asn Gly Val Tyr Arg Ile Ala Glu

100 105 110

Trp Ser Asp Ile Thr Asn Ala His Gly Val Pro Gly Thr Gly Ile Ile

115 120 125

Ala Gly Leu Arg Ala Gly Ala Glu Glu Thr Val Ser Glu Gln Lys Lys

130 135 140

Glu Asp Val Ser Asp Tyr Glu Asn Ser Gln Tyr Lys Glu Phe Leu Val

145 150 155 160

Pro ser Pro Asn Glu Lys Leu Ala Arg Gly Leu Leu Met Leu Ala Glu

165 170 175

Leu Ser Cys Lys Gly ser Leu Ala Thr Gly Glu Tyr Ser Lys Gln Thr

180 185 190

Ile Glu Leu Ala Arg Ser Asp Pro Glu Phe Val Val Gly Phe Ile Ala

195 200 205

Gln Asn Arg Pro Lys Gly Asp Ser Glu Asp Trp Leu Ile Leu Thr Pro

210 215 220

Gly Val Gly Leu Asp Asp Lys Gly Asp Ala Leu Gly Glp Glp Tyr Arg

225 230 235 240

Thr Val Glu Asp Val Met Ser Thr Gly Thr Asp Ile Ile Ile VaI GIy

245 250 255

Arg Gly Leu Tyr Gly Gln Asn Arg Asp Pro Ile Glu Glu Ala Lys Arg

260 265 270

Tyr Gln Lys Ala Gly Trp Glu Ala Tyr Gln Lys Ile Asn Cys

275 280 285

<210>21

<211>35

<212>DNA

<213>人工序列

<220>

<223>引物KU5

<400>21

tttgcccggg cgagtatctg tctgactcgt cattg 35

<210>22

<211>33

<212>DNA

<213>人工序列

<220>

<223>引物KU3

<400>22

aaagcccg9g caaaggcctg tttctcggtg tac 33

<210>23

<211>29

<212>DNA

<213>人工序列

<220>

<223>引物P7

<220>

<221>其他特征

<222>(24)..(24)

<223>n为a、c、g或t

<400>23

aactacatct tcggctayca yccncaygg 29

<210>24

<211>10

<212>PRT

<213>人工序列

<220>

<223>DGAT2共有序列

<400>24

Asp Tyr Ile Phe Gly Tyr His Pro His Gly

1 5 10

<210>25

<211>29

<212>DNA

<213>人工序列

<220>

<223>引物P8

<220>

<221>其他特征

<222>(21)..(21)

<223>n为a、c、g或t

<220>

<221>其他特征

<222>(24)..(24)

<223>n为a、c、g或t

<400>25

agggactcgg aggcgccgcc ncanacdat 29

<210>26

<211>10

<212>PRT

<213>人工序列

<220>

<223>DGAT2共有序列

<400>26

Ile Val Val Gly Gly Ala Ser Glu Ser Leu

1 5 10

<210>27

<211>23

<212>DNA

<213>人工序列

<220>

<223>引物P80

<400>27

gggcatccct gtttctctta tga 23

<210>28

<211>23

<212>DNA

<213>人工序列

<220>

<223>引物P81

<400>28

aacttccgag tgcctctcta cag 23

<210>29

<211>24

<212>DNA

<213>人工序列

<220>

<223>LinkAmp引物1

<400>29

aggcacagtc gaggacttat ccta 24

<210>30

<211>2119

<212>DNA

<213>解脂西洋蓍酵母(Yarrowia lipolytica)

<220>

<221>CDS

<222>(291)..(1835)

<223>DGAT2可读框，包含2个较小的内部可读框

<220>

<221>其他特征

<222>(291)..(293)

<223>起始密码子(｀ATG′)

<220>

<221>其他特征

<222>(456)..(458)

<223>起始密码子(｀ATG′)

<220>

<221>其他特征

<222>(768)..(770)

<223>起始密码子(｀ATG′)

<400>30

aaacgcaccc actgctcgtc ctccttgctc ctcgaaaccg actcctctac acacgtcaaa 60

tccgaggttg aaatcttccc cacatttggc agccaaacca gcacatccca gcaacctcgc 120

acagcgccga aatcgacctg tcgacttggc cacaaaaaaa agcaccggct ctgcaacagt 180

tctcacgacc aattacgtac aagtacgaaa tcgttcgtgg accgtgactg ataagctccc 240

actttttctt ctaacaacag gcaacagaca agtcacacaa aacaaaagct atg act 296

Met Thr

1

atc gac tca caa tac tac aag tcg cga gac aaa aac gac acg gca ccc 344

Ile Asp Ser Gln Tyr Tyr Lys Ser Arg Asp Lys Asn Asp Thr Ala Pro

5 10 15

aaa atc gcg gga atc cga tat gcc ccg cta tcg aca cca tta ctc aac 392

Lys Ile Ala Gly Ile Arg Tyr Ala Pro Leu Ser Thr Pro Leu Leu Asn

20 25 30

cga tgt gag acc ttc tct ctg gtc tgg cac att ttc agc att ccc act 440

Arg Cys Glu Thr Phe Ser Leu Val Trp His Ile Phe Ser Ile Pro Thr

35 40 45 50

ttc ctc aca att ttc atg cta tgc tgc gca att cca ctg ctc tgg cca 488

Phe Leu Thr Ile Phe Met Leu Cys Cys Ala Ile Pro Leu Leu Trp Pro

55 60 65

ttt gtg att gcg tat gta gtg tac gct gtt aaa gac gac tcc ccg tcc 536

Phe Val Ile Ala Tyr Val Val Tyr Ala Val Lys Asp Asp Ser Pro Ser

70 75 80

aac gga gga gtg gtc aag cga tac tcg cct att tca aga aac ttc ttc 584

Asn Gly Gly Val Val Lys Arg Tyr Ser Pro Ile Ser Arg ASn Phe Phe

85 90 95

atc tgg aag ctc ttt ggc cgc tac ttc ccc ata act ctg cac aag acg 632

Ile Trp Lys Leu Phe Gly Arg Tyr Phe Pro Ile Thr Leu His Lys Thr

100 105 110

gtg gat ctg gag ccc acg cac aca tac taccct ctg gac gtc cag gag 680

Val Asp Leu Glu Pro Thr His Thr Tyr Tyr Pro Leu Asp Val Gln Glu

115 120 125 130

tat cac ctg att gct gag aga tac tgg ccg cag aac aag tac ctc cga 728

Tyr His Leu Ile Ala Glu Arg Tyr Trp Pro Gln Asn Lys Tyr Leu Arg

135 140 145

gca atc atc tcc acc atc gag tac ttt ctg ccc gcc ttc atg aaa cgg 776

Ala Ile Ile Set Thr Ile Glu Tyr Phe Leu Pro Ala Phe Met Lys Arg

150 155 160

tct ctt tct atc aac gag cag gag cag cct gcc gag cga gat cct ctc 824

Ser Leu Ser Ile Asn Glu Gln Glu Gln Pro Ala Glu Arg Asp Pro Leu

165 170 175

ctg tct ccc gtt tct ccc agc tct ccg ggt tct caa cct gac aag tgg 872

Leu Ser Pro Val Ser Pro Ser Ser Pro Gly Ser Gln Pro Asp Lys Trp

180 185 190

att aac cac gac agc aga tat agc cgt gga gaa tca tct ggc tcc aac 920

Ile Asn His Asp Ser Arg Tyr Ser Arg Gly Glu Ser Ser Gly Ser Asn

195 200 205 210

ggc cac gcc tcg ggc tcc gaa ctt aac ggc aac ggc aac aat ggc acc 968

Gly His Ala Ser Gly Ser Glu Leu Asn Gly Asn Gly Asn Asn Gly Thr

215 220 225

act aac cga cga cct ttg tcg tcc gcc tct gct ggc tcc act gca tct 1016

Thr Asp Arg Arg Pro Leu Ser Ser Ala Ser Ala Gly Ser Thr Ala Ser

230 235 240

gat tcc acg ctt ctt aac ggg tcc ctc aac tcc tac gcc aac cag atc 1064

Asp Ser Thr Leu Leu Asn Gly Ser Leu Asn Ser Tyr Ala Asn Gln Ile

245 250 255

att ggc gaa aac gac cca cag ctg tcg ccc aca aaa ctc aag ccc act 1112

Ile Gly Glu Asn Asp Pro Gln Leu Ser Pro Thr Lys Leu Lys Pro Thr

260 265 270

ggc aga aaa tac atc ttc ggc tac cac ccc cac ggc att atc ggc atg 1160

Gly Arg Lys Tyr Ile Phe Gly Tyr His Pro His Gly Ile Ile Gly Met

275 280 285 290

gga gcc ttt ggt gga att gcc acc gag gga gct gga tgg tcc aag ctc 1208

Gly Ala Phe Gly Gly Ile Ala Thr Glu Gly Ala Gly Trp Ser Lys Leu

295 300 305

ttt ccg ggc atc cct gtt tct ctt atg act ctc acc aac aac ttc cga 1256

Phe Pro Gly Ile Pro Val Ser Leu Met Thr Leu Thr Ash Asn Phe Arg

310 315 320

gtg cct ctc tac aga gag tac ctc atg agt ctg gga gtc gct tct gtc 1304

Val Pro Leu Tyr Arg Glu Tyr Leu Met Ser Leu Gly Val Ala Ser Val

325 330 335

tcc aag aag tcc tgc aag gcc ctc ctc aag cga aac cag tct atc tgc 1352

Ser Lys Lys Ser Cys Lys Ala Leu Leu Lys Arg Asn Gln Ser Ile Cys

340 345 350

att gtc gtt ggt gga gca cag gaa agt ctt ctg gcc aga ccc ggt gtc 1400

Ile Val Val Gly Gly Ala Gln Glu Ser Leu Leu Ala Arg Pro Gly Val

355 360 365 370

atg gac ctg gtg cta ctc aag cga aag ggt ttt gtt cga ctt ggt atg 1448

Met Asp Leu Val Leu Leu Lys Arg Lys Gly Phe Val Arg Leu Gly Met

375 380 385

gag gtc gga aat gtc gcc ctt gtt ccc atc atg gcc ttt ggt gag aac 1496

Glu Val Gly Asn Val Ala Leu Val Pro Ile Met Ala Phe Gly Glu Asn

390 395 400

gac ctc tat gac cag gtt agc aac gac aag tcg tcc aag ctg tac cga 1544

Asp Leu Tyr Asp Gln Val Ser Asn Asp Lys Ser Ser Lys Leu Tyr Arg

405 410 415

ttc cag cag ttt gtc aag aac ttc ctt gga ttc acc ctt cct ttg atg 1592

Phe Gln Gln Phe Val Lys Asn Phe Leu Gly Phe Thr Leu Pro Leu Met

420 425 430

cat gcc cga ggc gtc ttc aac tac gat gtc ggt ctt gtc ccc tac agg 1640

His Ala Arg Gly Val Phe Asn Tyr Asp Val Gly Leu Val Pro Tyr Arg

435 440 445 450

cga ccc gtc aac att gtg gtt ggt tcc ccc att gac ttg cct tat ctc 1688

Arg Pro Val Asn Ile Val Val Gly Ser Pro Ile Asp Leu Pro Tyr Leu

455 460 465

cca cac ccc acc gac gaa gaa gtg tcc gaa tac cac gac cga tac atc 1736

Pro His Pro Thr Asp Glu Glu Val Ser Glu Tyr His Asp Arg Tyr Ile

470 475 480

gcc gag ctg cag cga atc tac aac gag cac aag gat gaa tat ttc atc 1784

Ala Glu Leu Gln Arg Ile Tyr Asn Glu His Lys Asp Glu Tyr Phe Ile

485 490 495

gat tgg acc gag gag ggc aaa gga gcc cca gag ttc cga atg att gag 1832

Asp Trp Thr Glu Glu Gly Lys Gly Ala Pro Glu Phe Arg Met Ile Glu

500 505 510

taa ggaaaactgc ctgggttagg caaatagcta atgagtattt ttttgatggc 1885

aaccaaatgt agaaagaaaa aaaaaaaaaa agaaaaaaaa aagagaatat tatatctatg 1945

taattctatt aaaagctctg ttgagtgagc ggaataaata ctgttgaaga ggggattgtg 2005

tagagatctg tttactcaat ggcaaactca tctgggggag atccttccac tgtgggaagc 2065

tcctggatag cctttgcatc ggggttcaag aagaccattg tgaacagccc ttga 2119

<210>31

<211>514

<212>PRT

<213>解脂西洋蓍酵母(Yarrowia lipolytica)

<400>31

Met Thr Ile Asp Ser Gln Tyr Tyr Lys Ser Arg Asp Lys Asn Asp Thr

1 5 10 15

Ala Pro Lys Ile Ala Gly Ile Arg Tyr Ala Pro Leu Ser Thr Pro Leu

20 25 30

Leu Asn Arg Cys Glu Thr Phe Ser Leu Val Trp His Ile Phe Ser Ile

35 40 45

Pro Thr Phe Leu Thr Ile Phe Met Leu Cys Cys Ala Ile Pro Leu Leu

50 55 60

Trp Pro Phe Val Ile Ala Tyr Val Val Tyr Ala Val Lys Asp Asp Ser

65 70 75 80

Pro Ser Asn Gly Gly Val Val Lys Arg Tyr Ser Pro Ile Ser Arg Asn

85 90 95

Phe Phe Ile Trp Lys Leu Phe Gly Arg Tyr Phe Pro Ile Thr Leu His

100 105 110

Lys Thr Val Asp Leu Glu Pro Thr His Thr Tyr Tyr Pro Leu Asp Val

115 120 125

Gln Glu Tyr His Leu Ile Ala Glu Arg Tyr Trp Pro Gln Asn Lys Tyr

130 135 140

Leu Arg Ala Ile Ile Ser Thr Ile Glu Tyr Phe Leu Pro Ala Phe Met

145 150 155 160

Lys Arg Ser Leu Ser Ile Asn Glu Gln Glu Gln Pro Ala Glu Arg Asp

165 170 175

Pro Leu Leu Ser Pro Val Ser Pro Ser Ser Pro Gly Ser Gln Pro Asp

180 185 190

Lys Trp Ile Asn His Asp Ser Arg Tyr Ser Arg Gly Glu Ser Ser Gly

195 200 205

Ser Asn Gly His Ala Ser Gly Ser Glu Leu Asn Gly Asn Gly Asn Asn

210 215 220

Gly Thr Thr Asn Arg Arg Pro Leu Ser Ser Ala Ser Ala Gly Ser Thr

225 230 235 240

Ala Ser Asp Ser Thr Leu Leu Asn Gly Ser Leu Asn Ser Tyr Ala Asn

245 250 255

Gln Ile Ile Gly Glu Asn Asp Pro Gln Leu Ser Pro Thr Lys Leu Lys

260 265 270

Pro Thr Gly Arg Lys Tyr Ile Phe Gly Tyr His Pro His Gly Ile Ile

275 280 285

Gly Met Gly Ala Phe Gly Gly Tle Ala Thr Glu Gly Ala Gly Trp Ser

290 295 300

Lys Leu Phe Pro Gly Ile Pro Val Ser Leu Met Thr Leu Thr Asn Asn

305 310 315 320

Phe Arg Val Pro Leu Tyr Arg Glu Tyr Leu Met Ser Leu Gly Val Ala

325 330 335

Ser Val Ser Lys Lys Ser Cys Lys Ala Leu Leu Lys Arg Asn Gln Ser

340 345 350

Ile Cys Ile Val Val Gly Gly Ala Gln Glu Ser Leu Leu Ala Arg Pro

355 360 365

Gly Val Met Asp Leu Val Leu Leu Lys Arg Lys Gly Phe Val Arg Leu

370 375 380

Gly Met Glu Val Gly Asn Val Ala Leu Val Pro Ile Met Ala Phe Gly

385 390 395 400

Glu Asn Asp Leu Tyr Asp Gln Val Ser Asn Asp Lys Ser Ser Lys Leu

405 410 415

Tyr Arg Phe Gln Gln Phe Val Lys Asn Phe Leu Gly Phe Thr Leu Pro

420 425 430

Leu Met His Ala Arg Gly Val Phe Asn Tyr Asp Val Gly Leu Val Pro

435 440 445

Tyr Arg Arg Pro Val Asn Ile Val Val Gly Ser Pro Ile Asp Leu Pro

450 455 460

Tyr Leu Pro His Pro Thr Asp Glu Glu Val Ser Glu Tyr His Asp Arg

465 470 475 480

Tyr Ile Ala Glu Leu Gln Arg Ile Tyr Asn Glu His Lys Asp Glu Tyr

485 490 495

Phe Ile Asp Trp Thr Glu Glu Gly Lys Gly Ala Pro Glu Phe Arg Met

500 505 510

Ile Glu

<210>32

<211>29

<212>DNA

<213>人工序列

<220>

<223>引物P95

<400>32

ggcaagctta ttgtcgttgg tggagcaca 29

<210>33

<211>35

<212>DNA

<213>人工序列

<220>

<223>引物P96

<400>33

aattccacca gatctgtcgt ggtattcgga cactt 35

<210>34

<211>39

<212>DNA

<213>人工序列

<220>

<223>引物P97

<400>34

ataccacgac agatctggtg gaattgccac cgagggagc 39

<210>35

<211>30

<212>0NA

<213>人工序列

<220>

<223>引物P98

<400>35

gcggaattcg cagatagact ggtttcgctt 30

<210>36

<211>22

<212>DNA

<213>人工序列

<220>

<223>引物P115

<400>36

aactacatct tcggctatca cc 22

<210>37

<211>22

<212>DNA

<213>人工序列

<220>

<223>引物P116

<400>37

tgaacaagcg tagattccag ac 22

<210>38

<211>22

<212>DNA

<213>人工序列

<220>

<223>引物P112

<400>38

cacccttgct cggcgatgta tc 22

<210>39

<211>29

<212>DNA

<213>人工序列

<220>

<223>引物P26

<220>

<221>其他特征

<222>(21)..(21)

<223>n为a、c、g或t

<220>

<221>其他特征

<222>(24)..(24)

<223>n为a、c、g或t

<400>39

atgctggaca aggagaccgg nctngaycc 29

<210>40

<211>10

<212>PRT

<213>人工序列

<220>

<223>PDAT共有序列

<400>40

Met Leu Asp Lys Glu Thr Gly Leu Asp Pro

1 5 10

<210>41

<211>33

<212>DNA

<213>人工序列

<220>

<223>引物P27

<220>

<221>其他特征

<222>(25)..(25)

<223>n为a、c、g或t

<220>

<221>其他特征

<222>(31)..(31)

<223>n为a、c、g或t

<400>41

ccagatgacg tcgccgccct tgggnarcat nga 33

<210>42

<211>11

<212>PRT

<213>人工序列

<220>

<223>PDAT共有序列

<400>42

Ser Met Leu Pro Lys Gly Gly Glu Val Ile Trp

1 5 10

<210>43

<211>34

<212>DNA

<213>人工序列

<220>

<223>引物P39

<400>43

ggcggtaccg gatcctcaat cgaagagact aagc 34

<210>44

<211>30

<212>DNA

<213>人工序列

<220>

<223>引物P42

<400>44

ccggaattca gctttgagct tggagaagta 30

<210>45

<211>2326

<212>DNA

<213>解脂西洋蓍酵母(Yarrowia lipolytica)

<220>

<221>其他特征

<222>(2271)..(2271)

<223>n为a、c、g或t

<400>45

tattaatatt atgctcttca tgcaccagca aaataaccga aacgcgcata tgatagtggg 60

attctcgatt tgcccggcag acaaacgccg ctaaaatcgc cacagtatcg aattttaatt 120

gaatacgaac gtcaattccg gcttatcctt ctagcagttg tctcccgcag ctcgctccat 180

gactaatcat tcacgcgaca tgtctcagct accccggtct ggctcatgta aaaaaagtgt 240

aatcggcttt tttccggttg atcacaacca tcaatgacac aacctgtgaa tcggaaggcg 300

actgtcgagc gggtcgagcc agcagtggag gtggctgact ccgagtccga ggccaagacc 360

gacgtccacg ttcaccacca tcatcaccac cacaagcgaa aatccgtcaa gggcaagatt 420

ctcaacttct tcacccgaag tcgacgtatc accttcgtcc tcggcgccgt ggtcggtgtg 480

atagccgcgg gatactacgc tgcgccaccg gagctcagca ttgatatcga tgctcttctc 540

ggcgacttgc cctcgttcga ctttgacgct ctatctctcg acaacttgtc catggacagt 600

gtgtcggact ttgtacaaga catgaaatcg cggtttccga ccaagattct gcaggaggcg 660

gccaagatcg agaagcacca gaaaagcgaa cagaaggctg ccccttttgc tgtgggcaag 720

gctatgaaga gcgagggact caacgccaag tacccggtgg tgctggtgcc cggcgtcatc 780

tccacgggac tggagagctg gtccctggag ggaaccgagg agtgtcccac cgagtcgcac 840

ttcagaaagc gaatgtgggg ctcctggtac atgatccgag tcatgctgct ggacaagtac 900

tgctggctgc agaacctgat gctggacaca gagaccggtc tagaccctcc ccatttcaag 960

ctgcgagccg cccagggatt tgcctccgcc gacttcttta tggcaggcta ctggctgtgg 1020

aacaagctgc tcgagaacct ggctgttatt ggatacgata cggatacaat gtctgctgcg 1080

gcgtacgact ggagactgtc ctaccctgat ttggagcacc gagacggata cttctccaag 1140

ctcaaagctt caatcgaaga gactaagcgt atgacaggtg agaagacagt tctgacgggc 1200

cattccatgg gctcccaggt catcttctac ttcatgaagt gggctgaggc cgagggatat 1260

ggaggaggag gtcccaactg ggtcaatgac catattgaat cctttgtcga catttccggc 1320

tccatgctgg gtactcccaa gaccctggtt gctcttctgt ctggagaaat gaaggatacc 1380

gtgcagctga acgcgatggc tgtgtatgga ctggagcagt tcttctctcg acgagagcga 1440

gccgatctgc tgcgaacatg gggaggaatt gcttccatga ttcccaaggg tggtaaggct 1500

atctggggtg atcattctgg agcccctgat gacgagcccg gccagaatgt cacctttggc 1560

aacttcatca agttcaagga gtccttgacc gagtactctg ctaagaacct caccatggat 1620

gaaaccgttg acttcctgta ttctcagtct cccgagtggt ttgtgaaccg aaccgagggt 1680

gcttactcct ttggaattgc caagactcga aagcaggttg agcagaatga gaagcgacct 1740

tctacctgga gcaaccctct ggaagctgct ctccccaatg cccccgatct caagatctac 1800

tgcttctatg gagtcggtaa ggataccgag cgagcctact actaccagga tgagcccaat 1860

cccgagcaga ccaacttgaa cgtcagtatc gctggaaacg accctgatgg tgtgcttatg 1920

ggtcagggcg atggaaccgt ctcccttgtg acccatacca tgtgtcaccg atggaaggac 1980

gagaattcca agttcaaccc tggtaacgcc caggtcaagg ttgtggagat gttgcaccag 2040

cctgatcgac ttgatattcg aggcggtgct cagactgccg agcatgtgga cattctgggg 2100

cgttctgagt tgaacgagat ggttctgaag gtggctagtg gaaagggaaa tgagattgaa 2160

gagagagtca tctccaacat tgatgagtgg gtgtggaaga ttgatctcgg cagcaattag 2220

agagtccgtt ttgtagagta atatgttttg tatatcacac tgatggagaa nggcgttcga 2280

tttctcatga ttccatgtgg ttgtttaatg agcacgtaga acgacg 2326

<210>46

<211>648

<212>PRT

<213>解脂西洋蓍酵母(Yarrowia lipolytica)

<400>46

Met Thr Gln Pro Val Asn Arg Lys Ala Thr Val Glu Arg Val Glu Pro

1 5 10 15

Ala Val Glu Val Ala Asp Ser Glu Ser Glu Ala Lys Thr Asp Val His

20 25 30

Val His His His His His His His Lys Arg Lys Ser Val Lys Gly Lys

35 40 45

Ile Leu Asn Phe Phe Thr Arg Ser Arg Arg Ile Thr Phe Val Leu Gly

50 55 60

Ala Val Val Gly Val Ile Ala Ala Gly Tyr Tyr Ala Ala Pro Pro Glu

65 70 75 80

Leu Ser Ile Asp Ile Asp Ala Leu Leu Gly Asp Leu Pro Ser Phe Asp

85 90 95

Phe Asp Ala Leu Ser Leu Asp Asn Leu Ser Met Asp Ser Val Ser Asp

100 105 110

Phe Val Gln Asp Met Lys Ser Arg Phe Pro Thr Lys Ile Leu Gln Glu

115 120 125

Ala Ala Lys Ile Glu Lys His Gln Lys Ser Glu Gln Lys Ala Ala Pro

130 135 140

Phe Ala Val Gly Lys Ala Met Lys Ser Glu Gly Leu Asn Ala Lys Tyr

145 150 155 160

Pro Val Val Leu Val Pro Gly Val Ile Ser Thr Gly Leu Glu Ser Trp

165 170 175

Ser Leu Glu Gly Thr Glu Glu Cys Pro Thr Glu Ser His Phe Arg Lys

180 185 190

Arg Met Trp Gly Ser Trp Tyr Met Ile Arg Val Met Leu Leu Asp Lys

195 200 205

Tyr Cys Trp Leu Gln Asn Leu Met Leu Asp Thr Glu Thr Gly Leu Asp

210 215 220

Pro Pro His Phe Lys Leu Arg Ala Ala Gln Gly Phe Ala Ser Ala Asp

225 230 235 240

Phe Phe Met Ala Gly Tyr Trp Leu Trp Asn Lys Leu Leu Glu Asn Leu

245 250 255

Ala Val Ile Gly Tyr Asp Thr Asp Thr Met Ser Ala Ala Ala Tyr Asp

260 265 270

Trp Arg Leu Ser Tyr Pro Asp Leu Glu His Arg Asp Gly Tyr Phe Ser

275 280 285

Lys Leu Lys Ala Ser Ile Glu Glu Thr Lys Arg Met Thr Gly Glu Lys

290 295 300

Thr Val Leu Thr Gly His Ser Met Gly Ser Gln Val Ile Phe Tyr Phe

305 310 315 320

Met Lys Trp Ala Glu Ala Glu Gly Tyr Gly Gly Gly Gly Pro Asn Trp

325 330 335

Val Asn Asp His Ile Glu Ser Phe Val Asp Ile Ser Gly Ser Met Leu

340 345 350

Gly Thr Pro Lys Thr Leu Val Ala Leu Leu Ser Gly Glu Met Lys Asp

355 360 365

Thr Val Gln Leu Asn Ala Met Ala Val Tyr Gly Leu Glu Gln Phe Phe

370 375 380

Ser Arg Arg Glu Arg Ala Asp Leu Leu Arg Thr Trp Gly Gly Ile Ala

385 390 395 400

Ser Met Ile Pro Lys Gly Gly Lys Ala Ile Trp Gly Asp His Ser Gly

405 410 415

Ala Pro Asp Asp Glu Pro Gly Gln Asn Val Thr Phe Gly Asn Phe Ile

420 425 430

Lys Phe Lys Glu Ser Leu Thr Glu Tyr Ser Ala Lys Asn Leu Thr Met

435 440 445

Asp Glu Thr Val Asp Phe Leu Tyr Ser Gln Ser Pro Glu Trp Phe Val

450 455 460

Asn Arg Thr Glu Gly Ala Tyr Ser Phe Gly Ile Ala Lys Thr Arg Lys

465 470 475 480

Gln Val Glu Gln Asn Glu Lys Arg Pro Ser Thr Trp Ser Asn Pro Leu

485 490 495

Glu Ala Ala Leu Pro Asn Ala Pro Asp Leu Lys Ile Tyr Cys Phe Tyr

500 505 510

Gly Val Gly Lys Asp Thr Glu Arg Ala Tyr Tyr Tyr Gln Asp Glu Pro

515 520 525

Asn Pro Glu Gln Thr Asn Leu Asn Val Ser Ile Ala Gly Asn Asp Pro

530 535 540

Asp Gly Val Leu Met Gly Gln Gly Asp Gly Thr Val Ser Leu Val Thr

545 550 555 560

His Thr Met Cys His Arg Trp Lys Asp Glu Asn Ser Lys Phe Asn Pro

565 570 575

Gly Asn Ala Gln Val Lys Val Val Glu Met Leu His Gln Pro Asp Arg

580 585 590

Leu Asp Ile Arg Gly Gly Ala Gln Thr Ala Glu His Val Asp Ile Leu

595 600 605

Gly Arg Ser Glu Leu Asn Glu Met Val Leu Lys Val Ala Ser Gly Lys

610 615 620

Gly Asn Glu Ile Glu Glu Arg Val Ile Ser Asn Ile Asp Glu Trp Val

625 630 635 640

Trp Lys Ile Asp Leu Gly Ser Asn

645

<210>47

<211>41

<212>DNA

<213>人工序列

<220>

<223>引物P41

<400>47

cttctgtatt ctagatctca agatcgagaa gcaccagaaa a 41

<210>48

<211>48

<212>DNA

<213>人工序列

<220>

<223>引物P40

<400>48

gcttctcgat cttgagatct agaatacaga agtcaacggt tcatccat 48

<210>49

<211>22

<212>DNA

<213>人工序列

<220>

<223>引物P51

<400>49

tagatagact ggactatacg gc 22

<210>50

<211>20

<212>DNA

<213>人工序列

<220>

<223>引物P52

<400>50

gactgtccta ccctgatttg 20

<210>51

<211>33

<212>DNA

<213>人工序列

<220>

<223>引物P37

<400>51

ccaggtacca agatcgagaa gcaccagaaa agc 33

<210>52

<211>36

<212>DNA

<213>人工序列

<220>

<223>引物P38

<400>52

ctcgaattca gaatacagaa gtcaacggtt catcca 36

<210>53

<211>23

<212>DNA

<213>人工序列

<220>

<223>引物P79

<400>53

tctctgtaga gaggcactcg gaa 23

<210>54

<211>23

<212>DNA

<213>人工序列

<220>

<223>引物P84

<400>54

tgacgccggg caccagcacc acc 23

<210>55

<211>24

<212>DNA

<213>人工序列

<220>

<223>引物P85

<400>55

gtcacctttg gcaacttcat caag 24

<210>56

<211>971

<212>DNA

<213>解脂西洋蓍酵母(Yarrowia lipolytica)

<400>56

gacgcagtag gatgtcctgc acgggtcttt ttgtggggtg tggagaaagg ggtgcttgga 60

gatggaagcc ggtagaaccg ggctgcttgt gcttggagat ggaagccggt agaaccgggc 120

tgcttggggg gatttggggc cgctgggctc caaagagggg taggcatttc gttggggtta 180

cgtaattgcg gcatttgggt cctgcgcgca tgtcccattg gtcagaatta gtccggatag 240

gagacttatc agccaatcac agcgccggat ccacctgtag gttgggttgg gtgggagcac 300

ccctccacag agtagagtca aacagcagca gcaacatgat agttgggggt gtgcgtgtta 360

aaggaaaaaa aagaagcttg ggttatattc ccgctctatt tagaggttgc gggatagacg 420

ccgacggagg gcaatggcgc catggaacct tgcggatatc gatacgccgc ggcggactgc 480

gtccgaacca gctccagcag cgttttttcc gggccattga gccgactgcg accccgccaa 540

cgtgtcttgg cccacgcact catgtcatgt tggtgttggg aggccacttt ttaagtagca 600

caaggcacct agctcgcagc aaggtgtccg aaccaaagaa gcggctgcag tggtgcaaac 660

ggggcggaaa cggcgggaaa aagccacggg ggcacgaatt gaggcacgcc ctcgaatttg 720

agacgagtca cggccccatt cgcccgcgca atggctcgcc aacgcccggt cttttgcacc 780

acatcaggtt accccaagcc aaacctttgt gttaaaaagc ttaacatatt ataccgaacg 840

taggtttggg cgggcttgct ccgtctgtcc aaggcaacat ttatataagg gtctgcatcg 900

ccggctcaat tgaatctttt ttcttcttct cttctctata ttcattcttg aattaaacac 960

acatcaacat g 971

<210>57

<211>332

<212>PRT

<213>酿酒酵母(Saccharomyces cerevisiae)(GenBank检索号CAA24607)

<400>57

Met Val Arg Val Ala Ile Asn Gly Phe Gly Arg Ile Gly Arg Leu Val

1 5 10 15

Met Arg Ile Ala Leu Ser Arg Pro Asn Val Glu Val Val Ala Leu Asn

20 25 30

Asp Pro Phe Ile Thr Asn Asp Tyr Ala Ala Tyr Met Phe Lys Tyr Asp

35 40 45

Ser Thr His Gly Arg Tyr Ala Gly Glu Val Ser His Asg Asp Lys His

50 55 60

Ile Ile Val Asp Gly Lys Lys Ile Ala Thr Tyr Gln Glu Arg Asp Pro

65 70 75 80

Ala Asn Leu Pro Trp Gly Ser Ser Asn Val Asp Ile Ala Ile Asp Ser

85 90 95

Thr Gly Val Phe Lys Glu Leu Asp Thr Ala Gln Lys His Ile Asp Ala

100 105 110

Gly Ala Lys Lys Val Val Ile Thr Ala Pro Ser Ser Thr Ala Pro Met

115 120 125

Phe Val Met Gly Val Asn Glu Val Lys Tyr Thr Ser Asp Leu Lys Ile

130 135 140

Val Ser Asn Ala Ser Cys Thr Thr Asn Cys Leu Ala Pro Leu Ala Lys

145 150 155 160

Val Ile Asn Asp Ala Phe Gly Ile Glu Glu Gly Leu Met Thr Thr Val

165 170 175

His Ser Leu Thr Ala Thr Gln Lys Thr Val Asp Gly Pro Ser His Lys

180 185 190

Asp Trp Arg Gly Gly Arg Thr Ala Ser Gly Asn Ile Ile Pro Ser Ser

195 200 205

Thr Gly Ala Ala Lys Ala Val Gly Lys Val Leu Pro Glu Leu Gln Gly

210 215 220

Lys Leu Thr Gly Met Ala Phe Arg Val Pro Thr Val Asp Val Ser Val

225 230 235 240

Val Asp Leu Thr Val Lys Leu Asp Lys Glu Thr Thr Tyr Asp Glu Ile

245 250 255

Lys Lys Val Val Lys Ala Ala Ala Glu Gly Lys Leu Lys Gly Val Leu

260 265 270

Gly Tyr Thr Glu Asp Ala Val Val ser ser Asp Phe Leu Gly Asp Ser

275 280 285

His Ser Ser Ile Phe Asp Ala Ser Ala Gly Ile Gln Leu Ser Pro Lys

290 295 300

Phe Val Lys Leu Val Ser Trp Tyr Asp Asn Glu Tyr Gly Tyr Ser Thr

305 310 315 320

Arg Val Val Asp Leu Val Glu His Ile Ala Lys Ala

325 330

<210>58

<211>335

<212>PRT

<213>粟酒裂殖酵母(Schizosaccharomyces pombe)(GenBank检索号NP 595236)

<400>58

Met Ala Ile Pro Lys Val Gly Ile Asn Gly Phe Gly Arg Ile Gly Arg

1 5 10 15

Ile Val Leu Arg Asn Ala Ile Leu Thr Gly Lys Ile Gln Val Val Ala

20 25 30

Val Asn Asp Pro Phe Ile Asp Leu Asp Tyr Met Ala Tyr Met Phe Lys

35 40 45

Tyr Asp Ser Thr His Gly Arg Phe Glu Gly Ser Val Glu Thr Lys Gly

50 55 60

Gly Lys Leu Val Ile Asp Gly His Ser Ile Asp Val His Asn Glu Arg

65 70 75 80

Asp Pro Ala Asn Ile Lys Trp Ser Ala Ser Gly Ala Glu Tyr Val Ile

85 90 95

Glu Ser Thr Gly Val Phe Thr Thr Lys Glu Thr Ala Ser Ala His Leu

100 105 110

Lys Gly Gly Ala Lys Arg Val Ile Ile ser Ala Pro Ser Lys Asp Ala

115 120 125

Pro Met Phe Val Val Gly Val Asn Leu Glu Lys Phe Asn Pro Ser Glu

130 135 140

Lys Val Ile Ser Asn Ala Ser Cys Thr Thr Asn Cys Leu Ala Pro Leu

145 150 155 160

Ala Lys Val Ile Asn Asp Thr Phe Gly Ile Glu Glu Gly Leu Met Thr

165 170 175

Thr Val His Ala Thr Thr Ala Thr Gln Lys Thr Val Asp Gly Pro Ser

180 185 190

Lys Lys Asp Trp Arg Gly Gly Arg Gly Ala Ser Ala Asn Ile Ile Pro

195 200 205

Ser Ser Thr Gly Ala Ala Lys Ala Val Gly Lys Val Ile Pro Ala Leu

210 215 220

Asn Gly Lys Leu Thr Gly Met Ala Phe Arg Val Pro Thr Pro Asp Val

225 230 235 240

Ser Val Val Asp Leu Thr Val Lys Leu Ala Lys Pro Thr Asn Tyr Glu

245 250 255

Asp Ile Lys Ala Ala Ile Lys Ala Ala Ser Glu Gly Pro Met Lys Gly

260 265 270

Val Leu Gly Tyr Thr Glu Asp Ser Val Val Ser Thr Asp Phe Cys Gly

275 280 285

Asp Asn His Ser Ser Ile Phe Asp Ala Ser Ala Gly Ile Gln Leu Ser

290 295 300

Pro Gln Phe Val Lys Leu Val Ser Trp Tyr Asp Asn Glu Trp Gly Tyr

305 310 315 320

Ser His Arg Val Val Asp Leu Val Ala Tyr Thr Ala Ser Lys Asp

325 330 335

<210>59

<211>338

<212>PRT

<213>米曲霉(Aspergillus oryzae)(GenBank检索号AAK08065)

<400>59

Met Ala Thr Pro Lys Val Gly Ile Asn Gly Phe Gly Arg Ile Gly Arg

1 5 10 15

Ile Val Phe Arg Asn Ala Ile Ala Ser Gly Asp Val Asp Val Val Ala

20 25 30

Val Asn Aso Pro Phe Ile Glu Thr His Tyr Ala Ala Tyr Met Leu Lys

35 40 45

Tyr Asp Ser Thr His Gly Arg Phe Gln Gly Thr Ile Glu Thr Tyr Asp

50 55 60

Glu Gly Leu Ile Val Asn Gly Lys Lys Ile Arg Phe Phe Ala Glu Arg

65 70 75 80

Asp Pro Ala Ala Ile Pro Trp Gly Ser Ala Gly Ala AlaTyr Ile Val

85 90 95

Glu Ser Thr Gly Val Phe Thr Thr Thr Glu Lys Ala Ser Ala His Leu

100 105 110

Lys Gly Gly Ala Lys Lys Val Ile Ile Ser Ala Pro Ser Ala Asp Ala

115 120 125

Pro Met Phe Val Met Gly Val Asn Asn Lys Glu Tyr Lys Thr Asp Ile

130 135 140

Asn Val Leu Ser Asn Ala Ser Cys Thr Thr Asn Cys Leu Ala Pro Leu

145 150 155 160

Ala Lys Val Ile Asn Asp Asn Phe Gly Leu Val Glu Gly Leu Met Thr

165 170 175

Thr Val His Ser Tyr Thr Ala Thr Gln Lys Thr Val Asp Ala Pro Ser

180 185 190

Ala Lys Asp Trp Arg Gly Gly Arg Thr Ala Ala Gln Asn Ile Ile Pro

195 200 205

Ser Ser Thr Gly Ala Ala Lys Ala Val Gly Lys Val Ile Pro Ser Leu

210 215 220

Asn Gly Lys Leu Thr Gly Met Ser Met Arg Val Pro Thr Ala Asn Val

225 230 235 240

Ser Val Val Asp Leu Thr Cys Arg Thr Glu Lys Ala Val Thr Tyr Glu

245 250 255

Asp Ile Lys Lys Thr Ile Lys Ala Ala Ser Glu Glu Gly Glu Leu Lys

260 265 270

Gly Ile Leu Gly Tyr Thr Glu Asp Asp Ile Val Ser Thr Asp Leu Ile

275 280 285

Gly Asp Ala His Ser Ser Ile Phe Asp Ala Lys Ala Gly Ile Ala Leu

290 295 300

Ash Glu His Phe Ile Lys Leu Val Ser Trp Tyr Asp Asn Glu Trp Gly

305 310 315 320

Tyr Ser Arg Arg Val Val Asp Leu Ile Ala Tyr Ile Ser Lys Val Asp

325 330 335

Gly Gln

<210>60

<211>333

<212>PRT

<213>褐牙鲆(Paralichthys olivaceus)(GenBank检索号BAA88638)

<400>60

Met Val Lys Val Gly Ile Asn Gly Phe Gly Arg Ile Gly Arg Leu Val

1 5 10 15

Thr Arg Ala Ala Phe Thr Ser Lys Lys Val Glu Ile Val Ala Ile Asn

20 25 30

Asp Pro Phe Ile Asp Leu Glu Tyr Met Val Tyr Met Phe Lys Tyr Asp

35 40 45

Ser Thr His Gly Arg Phe Lys Gly Glu Val Lys Ile Glu Gly Asp Lys

50 55 60

Leu Val Ile Asp Gly His Lys Ile Thr Val Phe His Glu Arg Asp Pro

65 70 75 80

Thr Asn Ile Lys Trp Gly Asp Ala Gly Ala His Tyr Val Val Glu Ser

85 90 95

Thr Gly Val Phe Thr Thr Ile Glu Lys Ala Ser Ala His Leu Lys Gly

100 105 110

Gly Ala Lys Lys Val Ile Ile Ser Ala Pro Ser Ala Asp Ala Pro Met

115 120 125

Phe Val Met Gly Val Asn His Glu Lys Tyr Asp Lys Ser Leu Gln Val

130 135 140

Val Ser Asn Ala Ser Cys Thr Thr Asn Cys Leu Ala Pro Leu Ala Lys

145 150 155 160

Val Ile Asn Asp Asn Phe Gly Ile Ile Glu Gly Leu Met Ser Thr Val

165 170 175

His Ala Ile Thr Ala Thr Gln Lys Thr Val Asp Gly Pro Ser Gly Lys

180 185 190

Leu Trp Arg Asp Gly Arg Gly Ala Ser Glg Asn Ile Ile Pro Ala Ser

195 200 205

Thr Gly Ala Ala Lys Ala Val Gly Lys Val Ile Pro Glu Leu Asn Gly

210 215 220

Lys Leu Thr Gly Met Ala Phe Arg Val Pro Thr Pro Asn Val Ser Val

225 230 235 240

Val Asp Leu Thr Val Arg Leu Glu Lys Pro Ala Ser Tyr Glu Asn Ile

245 250 255

Lys Lys Val Val Lys Ala Ala Ala Glu Gly Pro Met Lys Gly Tyr Leu

260 265 270

Ala Tyr Thr Glu His Gln Val Val Ser Thr Asp Phe Asn Gly Asp Thr

275 280 285

His Ser Ser Ile Phe Asp Ala Gly Ala Gly Ile Ala Leu Asn Asp His

290 295 300

Phe Val Lys Leu Val Ser Trp Tyr Asp Asn Glu Phe Ala Tyr Ser Asn

305 310 315 320

Arg Val Cys Asp Leu Met Ala His Met Ala Ser Lys Glu

325 330

<210>61

<211>333

<212>PRT

<213>有爪蟾蜍(Xenopus laevis)(GenBank检索号P51469)

<400>61

Met Val Lys Val Gly Ile Asn Gly Phe Gly Cys Ile Gly Arg Leu Val

1 5 10 15

Thr Arg Ala Ala Phe Asp Ser Gly Lys Val Gln Val Val Ala Ile Asn

20 25 30

Asp Pro Phe Ile Asp Leu Asp Tyr Met Val Tyr Met Phe Lys Tyr Asp

35 40 45

Ser Thr His Gly Arg Phe Lys Gly Thr Val Lys Ala Glu Asn Gly Lys

50 55 60

Leu Ile Ile Asn Asp Gln Val Ile Thr Val Phe Gln Glu Arg Asp Pro

65 70 75 80

Ser Ser Ile Lys Trp Gly Asp Ala Gly Ala Val Tyr Val Val Glu Ser

85 90 95

Thr Gly Val Phe Thr Thr Thr Glu Lys Ala Ser Leu His Leu Lys Gly

100 105 110

Gly Ala Lys Arg Val Val Ile Ser Ala Pro Ser Ala Asp Ala Pro Met

115 120 125

Phe Val Val Gly Val Asn His Glu Lys Tyr Glu Asn Ser Leu Lys Val

130 135 140

Val Ser Asn Ala Ser Cys Thr Thr Asn Cys Leu Ala Pro Leu Ala Lys

145 150 155 160

Val Ile Asn Asp Asn Phe Gly Ile Val Glu Gly Leu Met Thr Thr Val

165 170 175

His Ala Phe Thr Ala Thr Gln Lys Thr Val Asp Gly Pro Ser Gly Lys

180 185 190

Leu Trp Arg Asp Gly Arg Gly Ala Gly Gln Asn Ile Ile Pro Ala Ser

195 200 205

Thr Gly Ala Ala Lys Ala Val Gly Lys Val Ile Pro Glu Leu Asn Gly

210 215 220

Lys Ile Thr Gly Met Ala Phe Arg Val Pro Thr Pro Asn Val Ser Val

225 230 235 240

Val Asp Leu Thr Cys Arg Leu Gln Lys Pro Ala Lys Tyr Asp Asp Ile

245 250 255

Lys Ala Ala Ile Lys Thr Ala Ser Glu Gly Pro Met Lys Gly Ile Leu

260 265 270

Gly Tyr Thr Gln Asp Gln Val Val Ser Thr Asp Phe Asn Gly Asp Thr

275 280 285

His Ser Ser Ile Phe Asp Ala Asp Ala Gly Ile Ala Leu Asn Glu Asn

290 295 300

Phe Val Lys Leu Val Ser Trp Tyr Asp Asn Glu Cys Gly Tyr Ser Asn

305 310 315 320

Arg Val Val Asp Leu Val Cys His Met Ala Ser Lys Glu

325 330

<210>62

<211>333

<212>PRT

<213>原鸡(Gallus gallus)(GenBank检索号DECHG3)

<400>62

Met Val Lys Val Gly Val Asn Gly Phe Gly Arg Ile Gly Arg Leu Val

1 5 10 15

Thr Arg Ala Ala Val Leu Ser Gly Lys Val Gln Val Val Ala Ile Asn

20 25 30

Asp Pro Phe Ile Asp Leu Asn Tyr Met Val Tyr Met Phe Lys Tyr Asp

35 40 45

Ser Thr His Gly His Phe Lys Gly Thr Val Lys Ala Glu Asn Gly Lys

50 55 60

Leu Val Ile Asn Gly His Ala Ile Thr Ile Phe Gln Glu Arg Asp Pro

65 70 75 80

Ser Asn Ile Lys Trp Ala Asp Ala Gly Ala Glu Tyr Val Val Glu Ser

85 90 95

Thr Gly Val Phe Thr Thr Met Glu Lys Ala Gly Ala His Leu Lys Gly

100 105 110

Gly Ala Lys Arg Val Ile Ile Ser Ala pro Ser Ala Asp Ala Pro Met

115 120 125

Phe Val Met Gly Val Asn His Glu Lys Tyr Asp Lys Ser Leu Lys Ile

130 135 140

Val Ser Asn Ala Ser Cys Thr Thr Asn Cys Leu Ala Pro Leu Ala Lys

145 150 155 160

Val Ile His Asp Asn Phe Gly Ile Val Glu Gly Leu Met Thr Thr Val

165 170 175

His Ala Ile Thr Ala Thr Gln Lys Thr Val Asp Gly Pro Ser Gly Lys

180 185 190

Leu Trp Arg Asp Gly Arg Gly Ala Ala Gln Asn Ile Ile Pro Ala Ser

195 200 205

Thr Gly Ala Ala Lys Ala Val Gly Lys Val Ile Pro Glu Leu Asn Gly

210 215 220

Lys Leu Thr Gly Met Ala Phe Arg Val Pro Thr Pro Asn Val Ser Val

225 230 235 240

Val Asp Leu Thr Cys Arg Leu Glu Lys Pro Ala Lys Tyr Asp Asp Ile

245 250 255

Lys Arg Val Val Lys Ala Ala Ala Asp Gly Pro Leu Lys Gly Ile Leu

260 265 270

Gly Tyr Thr Glu Asp Gln Val Val Ser Cys Asp Phe Asn Gly Asp Ser

275 280 285

His Ser Ser Thr Phe Asp Ala Gly Ala Gly Ile Ala Leu Asn Asp His

290 295 300

Phe Val Lys Leu Val Ser Trp Tyr Asp Asn Glu Phe Gly Tyr Ser Asn

305 310 315 320

Arg Val Val Asp Leu Met Val His Met Ala Ser Lys Glu

325 330

<210>63

<211>7

<212>PRT

<213>人工序列

<220>

<223>共有GPD序列

<400>63

Lys Tyr Asp Ser Thr His Gly

1 5

<210>64

<211>7

<212>PRT

<213>人工序列

<220>

<223>共有GPD序列

<400>64

Thr Gly Ala Ala Lys Ala Val

1 5

<210>65

<211>20

<212>DNA

<213>人工序列

<220>

<223>引物YL193

<400>65

aagtacgayt cbacycaygg 20

<210>66

<211>20

<212>DNA

<213>人工序列

<220>

<223>引物YL194

<400>66

acrgccttrg crgcdccrgt 20

<210>67

<211>507

<212>DNA

<213>解脂西洋蓍酵母(Yarrowia lipolytica)

<400>67

aagtacgact ccacccacgg ccgattcaag ggcaaggtcg aggccaagga cggcggtctg 60

atcatcgacg gcaagcacat ccaggtcttc ggtgagcgag acccctccaa catcccctgg 120

ggtaaggccg gtgccgacta cgttgtcgag tccaccggtg tcttcaccgg caaggaggct 180

gcctccgccc acctcaaggg tggtgccaag aaggtcatca tctccgcccc ctccggtgac 240

gcccccatgt tcgttgtcgg tgtcaacctc gacgcctaca agcccgacat gaccgtcatc 300

tccaacgctt cttgtaccac caactgtctg gctccccttg ccaaggttgt caacgacaag 360

tacggaatca ttgagggtct catgaccacc gtccactcca tcaccgccac ccagaagacc 420

gttgacggtc cttcccacaa ggactggcga ggtggccgaa ccgcctctgg taacatcatc 480

ccctcttcca ccggagccgc caaggct 507

<210>68

<211>169

<212>PRT

<213>解脂西洋蓍酵母(Yarrowia lipolytica)

<400>68

Lys Tyr Asp Ser Thr His Gly Arg Phe Lys Gly Lys Val Glu Ala Lys

1 5 10 15

Asp Gly Gly Leu Ile Ile Asp Gly Lys His Ile Gln Val Phe Gly Glu

20 25 30

Arg Asp Pro Ser Asn Ile Pro Trp Gly Lys Ala Gly Ala Asp Tyr Val

35 40 45

Val Glu Ser Thr Gly Val Phe Thr Gly Lys Glu Ala Ala Ser Ala His

50 55 60

Leu Lys Gly Gly Ala Lys Lys Val Ile Ile Ser Ala Pro Ser Gly Asp

65 70 75 80

Ala Pro Met Phe Val Val Gly Val Asn Leu Asp Ala Tyr Lys Pro Asp

85 90 95

Met Thr Val Ile Ser Asn Ala Ser Cys Thr Thr Asn Cys Leu Ala Pro

100 105 110

Leu Ala Lys Val Val Asn Asp Lys Tyr Gly Ile Ile Glu Gly Leu Met

115 120 125

Thr Thr Val His Ser Ile Thr Ala Thr Gln Lys Thr Val Asp Gly Pro

130 135 140

Ser His Lys Asp Trp Aro Gly Gly Arg Thr Ala Ser Gly Asn Ile Ile

145 150 155 160

Pro Ser Ser Thr Gly Ala Ala Lys Ala

165

<210>69

<211>26

<212>DNA

<213>人工序列

<220>

<223>引物YL206

<400>69

ccttgccggt gaagacaccg gtggac 26

<210>70

<211>28

<212>DNA

<213>人工序列

<220>

<223>引物YL207

<400>70

gaagacctgg atgtgcttgc cgtcgatg 28

<210>71

<211>24

<212>DNA

<213>人工序列

<220>

<223>引物YL208

<400>71

gaccttgccc ttgaatcggc cgtg 24

<210>72

<211>1848

<212>DNA

<213>解脂西洋蓍母(Yarrowia lipolyca)

<400>72

gtgattgcct ctgaatactt tcaacaagtt acacccttcg cggcgacgat ctacagcccg 60

atcacatgaa ctttggccga gggatgatgt aatcgagtat cgtggtagtt caatacgtac 120

atgtacgatg ggtgcctcaa ttgtgcgata ctactacaag tgcagcacgc tcgtgcccgt 180

accctacttt gtcggacgtc cctgctccct cgttcaacat ctcaagctca acaatcagtg 240

ttggacactg caacgctagc agccggtacg tggctttagc cccatgctcc atgctccatg 300

ctccatgctc tgggcctatg agctagccgt ttggcgcaca tagcatagtg acatgtcgat 360

caagtcaaag tcgaggtgtg gaaaacgggc tgcgggtcgc caggggcctc acaagcgcct 420

ccaccgcaga cgcccacctc gttagcgtcc attgcgatcg tctcggtaca tttggttaca 480

ttttgcgaca ggttgaaatg aatcggccga cgctcggtag tcggaaagag ccgggaccgg 540

ccggcgagca taaaccggac gcagtaggat gtcctgcacg ggtctttttg tggggtgtgg 600

agaaaggggt gcttggagat ggaagccggt agaaccgggc tgcttgtgct tggagatgga 660

agccggtaga accgggctgc ttggggggat ttggggccgc tgggctccaa agaggggtag 720

gcatttcgtt ggggttacgt aattgcggca tttgggtcct gcgcgcatgt cccattggtc 780

agaattagtc cggataggag acttatcagc caatcacagc gccggatcca cctgtaggtt 840

gggttgggtg ggagcacccc tccacagagt agagtcaaac agcagcagca acatgatagt 900

tgggggtgtg cgtgttaaag gaaaaaaaag aagcttgggt tatattcccg ctctatttag 960

aggttgcggg atagacgccg acggagggca atggcgccat ggaaccttgc ggatatcgat 1020

acgccgcggc ggactgcgtc cgaaccagct ccagcagcgt tttttccggg ccattgagcc 1080

gactgcgacc ccgccaacgt gtcttggccc acgcactcat gtcatgttgg tgttgggagg 1140

ccacttttta agtagcacaa ggcacctagc tcgcagcaag gtgtccgaac caaagaagcg 1200

gctgcagtgg tgcaaacggg gcggaaacgg cgggaaaaag ccacgggggc acgaattgag 1260

gcacgccctc gaatttgaga cgagtcacgg ccccattcgc ccgcgcaatg gctcgccaac 1320

gcccggtctt ttgcaccaca tcaggttacc ccaagccaaa cctttgtgtt aaaaagctta 1380

acatattata ccgaacgtag gtttgggcgg gcttgctccg tctgtccaag gcaacattta 1440

tataagggtc tgcatcgccg gctcaattga atcttttttc ttcttctctt ctctatattc 1500

attcttgaat taaacacaca tcaacatggc catcaaagtc ggtattaacg gattcgggcg 1560

aatcggacga attgtgagta ccatagaagg tgatggaaac atgacccaac agaaacagat 1620

gacaagtgtc atcgacccac cagagcccaa ttgagctcat actaacagtc gacaacctgt 1680

cgaaccaatt gatgactccc cgacaatgta ctaacacagg tcctgcgaaa cgctctcaag 1740

aaccctgagg tcgaggtcgt cgctgtgaac gaccccttca tcgacaccga gtacgctgct 1800

tacatgttca agtacgactc cacccacggc cgattcaagg gcaaggtc 1848

<210>73

<211>24

<212>DNA

<213>人工序列

<220>

<223>引物P145

<400>73

agactccatg gaacggtctc tttc 24

<210>74

<211>26

<212>DNA

<213>人工序列

<220>

<223>引物P146

<400>74

cttagcggcc gcttactcaa tcattc 26

<210>75

<211>35

<212>DNA

<213>人工序列

<220>

<223>引物YPDAT5

<400>75

atgcgcggcc gcacaatgac acaacctgtg aatcg 35

<210>76

<211> 34

<212>DNA

<213>人工序列

<220>

<223>引物YPDAT3

<400>76

gatcgcggcc gcctaattgc tgccgagatc aatc 34

<210>77

<211>25

<212>DNA

<213>人工序列

<220>

<223>LinkAmp引物2

<400>77

gcctctgaat actttcaaca agtta 25

<210>78

<211>459

<212>PRT

<213>解脂西洋蓍酵母(Yarrowia lipolytica)

<400>78

Met Leu Cys Cys Ala Ile Pro Leu Leu Trp Pro Phe Val Ile Ala Tyr

1 5 10 15

Val Val Tyr Ala Val Lys Asp Asp Ser Pro Ser Asn Gly Gly Val Val

20 25 30

Lys Arg Tyr Ser Pro Ile Ser Arg Asn Phe Phe Ile Trp Lys Leu Phe

35 40 45

Gly Arg Tyr Phe Pro Ile Thr Leu His Lys Thr Val Asp Leu Glu Pro

50 55 60

Thr His Thr Tyr Tyr Pro Leu Asp Val Gln Glu Tyr His Leu Ile Ala

65 70 75 80

Glu Arg Tyr Trp Pro Gln Asn Lys Tyr Leu Arg Ala Ile Ile Ser Thr

85 90 95

Ile Glu Tyr Phe Leu Pro Ala Phe Met Lys Arg Ser Leu Ser Ile Asn

100 105 110

Glu Gln Glu Gln Pro Ala Glu Arg Asp Pro Leu Leu Ser Pro Val Ser

115 120 125

Pro Ser Ser Pro Gly Ser Gln Pro Asp Lys Trp Ile Asn His Asp Ser

130 135 140

Arg Tyr Ser Arg Gly Glu Ser Ser Gly Ser Asn Gly His Ala Ser Gly

145 150 155 160

Ser Glu Leu Asn Gly Asn Gly Asn Asn Gly Thr Thr Asn Arg Arg Pro

165 170 175

Leu Ser Ser Ala Ser Ala Gly Ser Thr Ala Ser Asp Ser Thr Leu Leu

180 185 190

Asn Gly Ser Leu Asn Ser Tyr Ala Asn Gln Ile Ile Gly Glu Asn Asp

195 200 205

Pro Gln Leu Ser Pro Thr Lys Leu Lys Pro Thr Gly Arg Lys Tyr Ile

210 215 220

Phe Gly Tyr His Pro His Gly Ile Ile Gly Met Gly Ala Phe Gly Gly

225 230 235 240

Ile Ala Thr Glu Gly Ala Gly Trp Ser Lys Leu Phe Pro Gly Ile Pro

245 250 255

Val Ser Leu Met Thr Leu Thr Asn Asn Phe Arg Val Pro Leu Tyr Arg

260 265 270

Glu Tyr Leu Met Ser Leu Gly Val Ala Ser Val Ser Lys Lys Ser Cys

275 280 285

Lys Ala Leu Leu Lys Arg ASn Gln Ser Ile Cys Ile Val Val Gly Gly

290 295 300

Ala Gln Glu Ser Leu Leu Ala Arg Pro Gly Val Met Asp Leu Val Leu

305 310 315 320

Leu Lys Arg Lys Gly Phe Val Arg Leu Gly Met Glu Val Gly Asn Val

325 330 335

Ala Leu Val Pro Ile Met Ala Phe Gly Glu Asn Asp Leu Tyr Asp Gln

340 345 350

Val Ser Asn Asp Lys Ser Ser Lys Leu Tyr Arg Phe Gln Gln Phe Val

355 360 365

Lys Asn Phe Leu Gly Phe Thr Leu Pro Leu Met His Ala Arg Gly Val

370 375 380

Phe Asn Tyr Asp Val Gly Leu Val Pro Tyr Arg Arg Pro Val Asn Ile

385 390 395 400

Val Val Gly Ser Pro Ile Asp Leu Pro Tyr Leu Pro His Pro Thr Asp

405 410 415

Glu Glu Val Ser Glu Tyr His Asp Arg Tyr Ile Ala Glu Leu Gln Arg

420 425 430

Ile Tyr Asn Glu His Lys Asp Glu Tyr Phe Ile Asp Trp Thr Glu Glu

435 440 445

Gly Lys Gly Ala Pro Glu Phe Arg Met Ile Glu

450 455

<210>79

<211>355

<212>PRT

<213>解脂西洋蓍酵母(Yarrowia lipolytica)

<400>79

Met Lys Arg Ser Leu Ser Ile Asn Glu Gln Glu Gln Pro Ala Glu Arg

1 5 10 15

Asp Pro Leu Leu Ser Pro Val Ser Pro Ser Ser Pro Gly Ser Gln Pro

20 25 30

Asp Lys Trp Ile Asn His Asp Ser Arg Tyr Ser Arg Gly Glu Ser Ser

35 40 45

Gly Ser Asn Gly His Ala Ser Gly Ser Glu Leu Asn Gly Asn Gly Asn

50 55 60

Asn Gly Thr Thr Asn Arg Arg Pro Leu Ser Ser Ala Ser Ala Gly Ser

65 70 75 80

Thr Ala Ser Asp Ser Thr Leu Leu Asn Gly Ser Leu Asn Ser Tyr Ala

85 90 95

Asn Gln Ile Ile Gly Glu Asn Asp Pro Gln Leu Ser Pro Thr Lys Leu

100 105 110

Lys Pro Thr Gly Arg Lys Tyr Ile Phe Gly Tyr His Pro His Gly Ile

115 120 125

Ile Gly Met Gly Ala Phe Gly Gly Ile Ala Thr Glu Gly Ala Gly Trp

130 135 140

Ser Lys Leu Phe Pro Gly Ile Pro Val Ser Leu Met Thr Leu Thr Asn

145 150 155 160

Asn Phe Arg Val Pro Leu Tyr Arg Glu Tyr Leu Met Ser Leu Gly Val

165 170 175

Ala Ser Val Ser Lys Lys Ser Cys Lys Ala Leu Leu Lys Arg Asn Gln

180 185 190

Ser Ile Cys Ile Val Val Gly Gly Ala Gln Glu Ser Leu Leu Ala Arg

195 200 205

Pro Gly Val Met Asp Leu Val Leu Leu Lys Arg Lys Gly Phe Val Arg

210 215 220

Leu Gly Met Glu Val Gly Asn Val Ala Leu Val Pro Ile Met Ala Phe

225 230 235 240

Gly Glu Asn Asp Leu Tyr Asp Gln Val Ser Asn Asp Lys 5er Ser Lys

245 250 255

Leu Tyr A rg Phe Gln Gln Phe Val Lys Asn Phe Leu Gly Phe Thr Leu

260 265 270

Pro Leu Met His Ala Arg Gly Val Phe Asn Tyr Asp Val Gly Leu Val

275 280 285

Pro Tyr Arg Arg Pro Val Asn Ile Val Val Gly Ser Pro Ile Asp Leu

290 295 300

Pro Tyr Leu Pro His Pro Thr Asp Glu Glu Val Ser Glu Tyr His Asp

305 310 315 320

Arg Tyr Ile Ala Glu Leu Gln Arg Ile Tyr Asn Glu His Lys Asp Glu

325 330 335

Tyr Phe Ile Asp Trp Thr Glu Glu Gly Lys Gly Ala Pro Glu Phe Arg

340 345 350

Met Ile Glu

355

<210>80

<211>27

<212>DNA

<213>人工序列

<220>

<223>引物GPD-1

<400>80

tcgagtttat cattatcaat actcgcc 27

<210>81

<211>29

<212>DNA

<213>人工序列

<220>

<223>引物GPD-2

<400>81

tcgaaactaa gttcttggtg ttttaaaac 29

<210>82

<211>31

<212>DNA

<213>人工序列

<220>

<223>引物ADHT-1

<400>82

gatcctcgag taagcgaatt tcttatgatt t 31

<210>83

<211>31

<212>DNA

<213>人工序列

<220>

<223>引物ADHT-2

<400>83

gatcggtacc acaggtgttg tcctctgagg a 32

<210>84

<211>81

<212>DNA

<213>人工序列

<220>

<223>引物UP161

<400>84

aaaggttctctaccaacgaa ttcggcgaca atcgagtaaa aaatggaaca cacaggggcg 60

ctatcgcaca gaatcaaatt c 81

<210>85

<211>81

<212>DNA

<213>人工序列

<220>

<223>引物LP162

<400>85

ttgaaataat acacggatgg atagtgagtc aatgtcggtc atttatgaag aggaggtcga 60

ctacgtcgtt aaggccgttt c 81

<210>86

<211>1068

<212>DNA

<213>解脂西洋蓍酵母(Yarrowia lipolytica)

<400>86

atgaaacggt ctctttctat caacgagcag gagcagcctg ccgagcgaga tcctctcctg 60

tctcccgttt ctcccagctc tccgggttct caacctgaca agtggattaa ccacgacagc 120

agatatagcc gtggagaatc atctggctcc aacggccacg cctcgggctc cgaacttaac 180

ggcaacggca acaatggcac cactaaccga cgacctttgt cgtccgccrc tgctggctcc 240

actgcatctg attccacgct tcttaacggg tccctcaact cctacgccaa ccagatcatt 300

ggcgaaaacg acccacagct gtcgcccaca aaactcaagc ccactggcag aaaatacatc 360

ttcggctacc acccccacgg cattatcggc atgggagcct ttggtggaat tgccaccgag 420

ggagctggat ggtccaagct ctttccgggc atccctgttt ctcttatgac tctcaccaac 480

aacttccgag tgcctctcta cagagagtac ctcatgagtc tgggagtcgc ttctgtctcc 540

aagaagtcct gcaaggccct cctcaagcga aaccagtcta tctgcattgt cgttggtgga 600

gcacaggaaa gtcttctggc cagacccggt gtcatggacc tggtgctact caagcgaaag 660

ggttttgttc gacttggtat ggaggtcgga aatgtcgccc ttgttcccat catggccttt 720

ggtgagaacg acctctatga ccaggttagc aacgacaagt cgtccaagct gtaccgattc 780

cagcagtttg tcaagaactt ccttggattc acccttcctt tgatgcatgc ccgaggcgtc 840

ttcaactacg atgtcggtct tgtcccctac aggcgacccg tcaacattgt ggttggttcc 900

cccattgact tgccttatct cccacacccc accgacgaag aagtgtccga ataccacgac 960

cgatacatcg ccgagctgca gcgaatctac aacgagcaca aggatgaata tttcatcgat 1020

tggaccgagg agggcaaagg agccccagag ttccgaatga ttgagtaa 1068

Claims

1.一种编码二酰基甘油酰基转移酶的分离的核酸分子，所述分子选自：

(c)与(a)或(b)完全互补的分离的核酸分子。

2.一种编码磷脂：二酰基甘油酰基转移酶的分离的核酸分子，所述分子选自：

(a)编码SEQ ID NO：46所示的氨基酸序列的分离的核酸分子；

(c)与(a)或(b)完全互补的分离的核酸分子。

3.权利要求1的分离的核酸分子，所述分子选自SEQ ID NO：30和86。

4.权利要求2的分离的核酸分子，所述分子具有SEQ ID NO：45所示的核苷酸序列。

5.一种由权利要求1的分离的核酸分子编码的多肽。

6.一种由权利要求2的分离的核酸分子编码的多肽。

7.权利要求5的多肽，所述多肽选自SEQ ID NO：31、78和79。

8.一种分离的核酸分子，所述分子包含第一核苷酸序列，所述第一核苷酸序列编码至少648个氨基酸的磷脂：二酰基甘油酰基转移酶，根据Clustal W比对方法，所述酶与具有SEQ ID NO：46所示序列的多肽相比具有至少70％同一性；

或第二核苷酸序列，所述第二核苷酸序列包含第一核苷酸序列的互补序列。

9.一种分离的核酸分子，所述分子包含第一核苷酸序列，所述第一核苷酸序列编码至少355个氨基酸的二酰基甘油酰基转移酶2酶，根据Clustal W比对方法，所述酶与具有SEQ ID NO：79所示序列的多肽相比具有至少70％同一性；

10.一种嵌合基因，所述基因包含权利要求1或2中任一项的分离的核酸分子，所述核酸分子与合适的调节序列操作性连接。

11.一种转化宿主细胞，所述细胞包含权利要求10的嵌合基因。

12.权利要求11的转化宿主细胞，所述细胞选自藻类、细菌、霉菌、真菌和酵母。

13权利要求12的转化宿主细胞，其中所述酵母是产油酵母。

14.权利要求13的转化宿主细胞，其中所述产油酵母细胞选自西洋蓍酵母属(Yarrowia)、假丝酵母属(Candida)、红酵母属(Rhodotorula)、红冬孢酵母属(Rhodosporidium)、隐球酵母属(Cryptococcus)、丝孢酵母属(Trichosporon)和油脂酵母属(Lipomyces)。

15.权利要求14的转化宿主细胞，其中所述宿主细胞是解脂西洋蓍酵母(Yarrowia lipolytica)。

16.权利要求15的转化宿主细胞，其中所述解脂西洋蓍酵母是选自以下的菌株：解脂西洋蓍酵母ATCC#20362、解脂西洋蓍酵母ATCC#8862、解脂西洋蓍酵母ATCC#18944、解脂西洋蓍酵母ATCC#76982、解脂西洋蓍酵母ATCC#90812和解脂西洋蓍酵母LGAMS(7)1。

17.一种增加转化宿主细胞中的三酰基甘油含量的方法，所述方法包括：

(a)提供转化宿主细胞，所述细胞包含：

(ii)脂肪酸源；

(c)任选回收步骤(b)的三酰基甘油。

18.一种增加转化宿主细胞中的三酰基甘油的ω-3或ω-6脂肪酸含量的方法，所述方法包括：

(a)提供转化宿主细胞，所述细胞包含：

(c)任选回收步骤(b)的三酰基甘油。

19.权利要求18的方法，其中所述至少一个基因所编码的ω-3/ω-6脂肪酸生物合成途径中的至少一种酶选自去饱和酶和延伸酶。

20.权利要求19的方法，其中所述去饱和酶选自：Δ9去饱和酶、Δ12去饱和酶、Δ6去饱和酶、Δ5去饱和酶、Δ17去饱和酶、Δ8去饱和酶、Δ15去饱和酶和Δ4去饱和酶。

21.权利要求17或18中任一项的方法，其中所述宿主细胞选自藻类、细菌、霉菌、真菌和酵母。

22.权利要求21的方法，其中所述宿主细胞是产油酵母。

23.权利要求22的方法，其中所述产油酵母是选自以下属的成员：西洋蓍酵母属、假丝酵母属、红酵母属、红冬孢酵母属、隐球酵母属、丝孢酵母属和油脂酵母属。

24.权利要求23的方法，其中所述产油酵母是解脂西洋蓍酵母。

25.权利要求24的方法，其中所述解脂西洋蓍酵母是选自以下的菌株：解脂西洋蓍酵母ATCC#20362、解脂西洋蓍酵母ATCC#8862、解脂西洋蓍酵母ATCC#18944、解脂西洋蓍酵母ATCC#76982、解脂西洋蓍酵母ATCC#90812和解脂西洋蓍酵母LGAMS(7)1。

26.权利要求17的方法，其中所述脂肪酸选自：硬脂酸、油酸、亚油酸、γ-亚油酸、二高-γ-亚油酸、花生四烯酸、α-亚油酸、十八碳四烯酸(steraidonic acid)、二十碳四烯酸、二十碳五烯酸、二十二碳五烯酸、二十碳二烯酸和二十碳三烯酸。