[go: up one dir, main page]

CN108138152B - 贝壳杉烯酸羟化酶 - Google Patents

贝壳杉烯酸羟化酶 Download PDF

Info

Publication number
CN108138152B
CN108138152B CN201680057728.5A CN201680057728A CN108138152B CN 108138152 B CN108138152 B CN 108138152B CN 201680057728 A CN201680057728 A CN 201680057728A CN 108138152 B CN108138152 B CN 108138152B
Authority
CN
China
Prior art keywords
ser
val
ile
leu
gly
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201680057728.5A
Other languages
English (en)
Other versions
CN108138152A (zh
Inventor
约翰尼斯·古斯塔夫·恩斯特·范·莱文
普利斯希勒·扎尔特简斯
维克托·马里厄斯·波尔
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
DSM IP Assets BV
Original Assignee
DSM IP Assets BV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by DSM IP Assets BV filed Critical DSM IP Assets BV
Publication of CN108138152A publication Critical patent/CN108138152A/zh
Application granted granted Critical
Publication of CN108138152B publication Critical patent/CN108138152B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/80Vectors or expression systems specially adapted for eukaryotic hosts for fungi
    • C12N15/81Vectors or expression systems specially adapted for eukaryotic hosts for fungi for yeasts
    • C12N15/815Vectors or expression systems specially adapted for eukaryotic hosts for fungi for yeasts for yeasts other than Saccharomyces
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/0004Oxidoreductases (1.)
    • C12N9/0071Oxidoreductases (1.) acting on paired donors with incorporation of molecular oxygen (1.14)
    • C12N9/0073Oxidoreductases (1.) acting on paired donors with incorporation of molecular oxygen (1.14) with NADH or NADPH as one donor, and incorporation of one atom of oxygen 1.14.13
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/70Vectors or expression systems specially adapted for E. coli
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/0004Oxidoreductases (1.)
    • C12N9/0071Oxidoreductases (1.) acting on paired donors with incorporation of molecular oxygen (1.14)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/88Lyases (4.)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P19/00Preparation of compounds containing saccharide radicals
    • C12P19/44Preparation of O-glycosides, e.g. glucosides
    • C12P19/56Preparation of O-glycosides, e.g. glucosides having an oxygen atom of the saccharide radical directly bound to a condensed ring system having three or more carbocyclic rings, e.g. daunomycin, adriamycin
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y114/00Oxidoreductases acting on paired donors, with incorporation or reduction of molecular oxygen (1.14)
    • C12Y114/13Oxidoreductases acting on paired donors, with incorporation or reduction of molecular oxygen (1.14) with NADH or NADPH as one donor, and incorporation of one atom of oxygen (1.14.13)
    • C12Y114/13079Ent-kaurenoic acid oxidase (1.14.13.79)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y114/00Oxidoreductases acting on paired donors, with incorporation or reduction of molecular oxygen (1.14)
    • C12Y114/14Oxidoreductases acting on paired donors, with incorporation or reduction of molecular oxygen (1.14) with reduced flavin or flavoprotein as one donor, and incorporation of one atom of oxygen (1.14.14)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y402/00Carbon-oxygen lyases (4.2)
    • C12Y402/03Carbon-oxygen lyases (4.2) acting on phosphates (4.2.3)
    • C12Y402/03019Ent-kaurene synthase (4.2.3.19)

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Organic Chemistry (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Biotechnology (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Microbiology (AREA)
  • Molecular Biology (AREA)
  • Medicinal Chemistry (AREA)
  • Mycology (AREA)
  • Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Plant Pathology (AREA)
  • General Chemical & Material Sciences (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Enzymes And Modification Thereof (AREA)

Abstract

本发明涉及具有贝壳杉烯酸13‑羟化酶活性的变体多肽,所述变体多肽包含氨基酸序列,当与包含SEQ ID NO:1所示序列的贝壳杉烯酸13‑羟化酶比对时,所述氨基酸序列包含对应于以下位置处的任何氨基酸的氨基酸残基的至少一个替换:72、85、108、127、129、141、172、195、196、197、199、226、236、291、302、361或464,所述位置是参照SEQ ID NO:1限定的,并且其中所述变体与具有贝壳杉烯酸13‑羟化酶活性的参照多肽相比具有一种或多种改变的性质。本发明的变体多肽可用于重组宿主中以生产甜菊醇或甜菊醇糖苷。

Description

贝壳杉烯酸羟化酶
领域
本发明涉及具有贝壳杉烯酸13-羟化酶活性的变体多肽和包含编码所述多肽的序列的核酸。本发明还涉及包含所述核酸的核酸构建体和包含所述核酸或核酸构建体的表达载体。此外,本发明涉及包含所述核酸、核酸构建体或表达载体的重组宿主。本发明还涉及制备甜菊醇或甜菊醇糖苷的方法,所述方法包括发酵重组宿主,还涉及通过所述方法能够获得的发酵液以及通过所述方法获得的甜菊醇糖苷或从所述发酵液获得的甜菊醇糖苷。另外,本发明涉及包含两种或更多种甜菊醇糖苷的组合物,以及包含所述甜菊醇糖苷或组合物的食品、饲料或饮料。此外,本发明涉及将第一甜菊醇糖苷转化成第二甜菊醇糖苷的方法以及生产具有贝壳杉烯酸13-羟化酶活性的变体多肽的方法。
背景
多年生草本植物甜叶菊(Stevia rebaudiana Bert.)的叶子积聚大量被称为甜菊醇糖苷的具有强烈甜味的化合物。虽然这些化合物的生物功能尚不清楚,但它们作为替代性高效甜味剂具有商业意义。
这些甜的甜菊醇糖苷的功能和感官特性表现为优于许多高效甜味剂的功能和感官特性。此外,研究表明甜菊苷能够降低II型糖尿病患者的血糖水平,并且能够降低轻度高血压患者的血压。
甜菊醇糖苷积聚在甜叶菊叶中,其中它们可占叶干重的10%至20%。甜菊苷和莱鲍迪甙A均是热和pH稳定的,并且适用于碳酸饮料并且可应用于许多其他食物中。甜菊苷比蔗糖甜110与270倍之间,莱鲍迪甙A比蔗糖甜150与320倍之间。此外,莱鲍迪甙D也是在甜叶菊叶中积聚的高效二萜糖苷甜味剂。它可比蔗糖甜约200倍。莱鲍迪甙M是另一种高效二萜糖苷甜味剂。它在某些甜叶菊品种叶中以痕量存在,但已表明其具有优异的味道特征。
传统上已从甜叶菊植物中提取了甜菊醇糖苷。在甜叶菊中,(-)-贝壳杉烯酸(赤霉酸(GA)生物合成中的中间体)被转化成四环二萜甜菊醇,其然后通过多步糖基化途径进行以形成各种甜菊醇糖苷。然而,产率可以是可变的,并且受到农业和环境条件的影响。此外,甜叶菊种植需要大量的土地面积、在收获前的很长时间、密集劳动以及用于提取和纯化糖苷的额外成本。
最近,使用发酵工艺生产甜菊醇糖苷的兴趣日益增长。WO2013/110673和WO2015/007748中描述了可用于产生至少甜菊醇糖苷莱鲍迪甙A和莱鲍迪甙D的微生物。
此类微生物的进一步改进是令人希望的,以便可产生更高量的甜菊醇糖苷和/或另外或新的甜菊醇糖苷和/或更高量的特定甜菊醇糖苷和/或具有期望比例的不同甜菊醇糖苷的甜菊醇糖苷的混合物。
概述
本发明基于变体贝壳杉烯酸13-羟化酶的鉴定。这些变体可用于产生适用于生产甜菊醇和/或一种或多种甜菊醇糖苷的重组宿主。
这种重组宿主与表达非变体贝壳杉烯酸13-羟化酶的重组宿主相比可产生更高量的甜菊醇糖苷和更低量的非期望产物。产生更高量的甜菊醇糖苷和/或更低量的非期望产物可使甜菊醇糖苷的回收更容易。而且,可以获得更高的产率。
因此,本发明涉及具有贝壳杉烯酸13-羟化酶活性的变体多肽,所述变体多肽包含这样的氨基酸序列,当与包含SEQ ID NO:1所示序列(来自A.thaliana的野生型KAH序列)的贝壳杉烯酸13-羟化酶比对时,所述氨基酸序列包含对应于以下位置处的任何氨基酸的氨基酸残基的至少一个替换:
72、85、108、127、129、141、172、195、196、197、199、226、236、291、302、361或464
所述位置是参照SEQ ID NO:1限定的,并且其中所述变体与具有贝壳杉烯酸13-羟化酶活性的参照多肽相比具有一种或多种改变的性质。
本发明还涉及:
-具有贝壳杉烯酸13-羟化酶活性的变体多肽,其包含与SEQ ID NO:3、5、7、9、11、13、15、17、19、21、23、25、27、29、31、33、35或37具有至少约95%序列同一性,至少约96%、至少约97%、至少约98%或至少约99%序列同一性的氨基酸序列;
-包含编码本发明多肽的序列的核酸;
-包含本发明所述核酸的核酸构建体,所述核酸与能够指导贝壳杉烯酸13-羟化酶在合适表达宿主中表达的一种或多种控制序列可操作地连接;
-包含根据本发明的核酸或核酸构建体的表达载体;
-包含本发明的核酸、核酸构建体或表达载体的重组宿主;
-一种制备甜菊醇或甜菊醇糖苷的方法,所述方法包括:在合适的发酵培养基中发酵根据权利要求11-19中任一项所述的重组宿主,和任选地,回收甜菊醇或甜菊醇糖苷;
-包含通过本发明的方法能够获得的甜菊醇糖苷的发酵液;
-通过本发明的方法获得的或从本发明的发酵液获得的甜菊醇糖苷;
-组合物,其包含两种或更多种通过本发明的方法获得的或从本发明的发酵液获得的甜菊醇糖苷;
-食品、饲料或饮料,其包含本发明的甜菊醇糖苷或本发明的组合物;
-一种将第一甜菊醇糖苷转化成第二甜菊醇糖苷的方法,所述方法包括:
使所述第一甜菊醇糖苷与本发明的重组宿主、来源于所述重组宿主的无细胞提取物或来源于二者之一的酶制品接触;
从而将所述第一甜菊醇糖苷转化为所述第二甜菊醇糖苷;和
-一种生产贝壳杉烯酸13-羟化酶的方法,所述方法包括:在适于生产贝壳杉烯酸13-羟化酶的条件下培养本发明的宿主细胞,和任选地,回收所述贝壳杉烯酸13-羟化酶。
附图简介
图1和图2示出了导致甜菊醇糖苷生物合成的潜在通路的示意图。
图3示出了克隆到含有INT3整合侧翼(其允许在Y.lipolytica中进行同源重组)以及KAH4和HygB(编码潮霉素抗性)的启动子-开放阅读框-终止子的载体中的KAH4基因变体的质粒图谱。
序列表描述
SEQ ID NO:1示出了来自Arabidopsis thaliana的贝壳杉烯酸13-羟化酶多肽的氨基酸序列。
SEQ ID NO:2示出了编码来自Arabidopsis thaliana的贝壳杉烯酸13-羟化酶多肽的核苷酸序列,其针对在Yarrowia lipolitica中表达进行了密码子对优化。
SEQ ID NO:3示出了KAH4_m4多肽的氨基酸序列。
SEQ ID NO:4示出了编码KAH4_m4多肽的核苷酸序列,其针对在Yarrowialipolitica中表达进行了密码子对优化。
表5中描述了SEQ ID NO:5-38。
SEQ ID NO:39示出了编码来自Yarrowia lipolitica的羟甲基戊二酰基-CoA还原酶多肽的核苷酸序列,其针对在Yarrowia lipolitica中表达进行了密码子对优化。
SEQ ID NO:40示出了编码来自Yarrowia lipolitica的香叶基香叶基二磷酸合酶多肽的核苷酸序列,其针对在Yarrowia lipolitica中表达进行了密码子对优化。
SEQ ID NO:41示出了编码来自Mucor circenelloides的香叶基香叶基二磷酸合酶多肽的核苷酸序列,其针对在Yarrowia lipolitica中表达进行了密码子优化。
SEQ ID NO:42示出了编码来自Stevia rebaudiana的柯巴基焦磷酸合酶多肽的核苷酸序列,其针对在Yarrowia lipolitica中表达进行了密码子对优化。
SEQ ID NO:43示出了编码来自Stevia rebaudiana的贝壳杉烯合酶多肽的核苷酸序列,其针对在Yarrowia lipolitica中表达进行了密码子对优化。
SEQ ID NO:44示出了编码来自Giberella fujikuroi的贝壳杉烯氧化酶多肽的核苷酸序列,其针对在Yarrowia lipolitica中表达进行了密码子对优化。
SEQ ID NO:45示出了编码来自Arabidopsis thaliana的细胞色素P450还原酶多肽的核苷酸序列,其针对在Yarrowia lipolitica中表达进行了密码子对优化。
SEQ ID NO:46示出了编码来自Stevia rebaudiana的UDP-葡糖基转移酶多肽的核苷酸序列,其针对在Yarrowia lipolitica中表达进行了密码子对优化。
SEQ ID NO:47示出了编码来自Stevia rebaudiana的UDP-葡糖基转移酶多肽的变体的核苷酸序列,其针对在Yarrowia lipolitica中表达进行了密码子对优化。
SEQ ID NO:48示出了编码来自Stevia rebaudiana的UDP-葡糖基转移酶多肽的核苷酸序列,其针对在Yarrowia lipolitica中表达进行了密码子对优化。
SEQ ID NO:49示出了编码来自Stevia rebaudiana的UDP-葡糖基转移酶多肽的核苷酸序列,其针对在Yarrowia lipolitica中表达进行了密码子对优化。
详细描述
在本说明书和所附权利要求书中,词语“包含”、“包括”和“具有”以及变化形式应被解释为包含性的。也就是说,这些词语意图表达在上下文允许的情况下可包含未具体叙述的其他要素或整体。
不使用数量词修饰时在本文中用于指代一个/种或一个/种以上(即一个/种或至少一个/种)的语法对象。举例来说,“要素”可意指一个/种要素或多于一个/种要素。
根据本发明,因此提供了具有贝壳杉烯酸13-羟化酶活性的变体多肽。本发明的变体多肽具有贝壳杉烯酸13-羟化酶活性。贝壳杉烯酸13-羟化酶活性是在C-13位羟基化(-)-贝壳杉烯酸以形成甜菊醇的活性。
因此,出于本发明的目的,具有贝壳杉烯酸13-羟化酶活性的多肽可以是能够催化或部分催化由对映-贝壳杉烯酸形成甜菊醇(对映-贝壳杉-16-烯-13-醇-19-羧酸)的多肽。因此,出于本发明的目的,具有贝壳杉烯酸13-羟化酶活性的多肽可以是能够催化或部分催化利用NADPH和O2形成甜菊醇(对映-贝壳杉-16-烯-13-醇-19-羧酸)的多肽。
这种活性也可以被称为对映-ka 13-羟化酶活性或对映-贝壳杉烯酸13-羟化酶活性。
与具有贝壳杉烯酸13-羟化酶活性的参照多肽相比,本发明的变体多肽具有改变的贝壳杉烯酸13-羟化酶活性。
与参照多肽相比,这种变体多肽可以具有降低的贝壳杉烯酸13-羟化酶比活性。
与参照多肽相比,这种变体多肽可以具有提高的贝壳杉烯酸13-羟化酶比活性。
根据本发明的变体多肽可以是非天然存在的多肽。
在本文中,本发明的变体多肽可以被称为“贝壳杉烯酸13-羟化酶变体”、“贝壳杉烯酸羟化酶变体”、“KAH变体”、“变体多肽”或“KAH”或“KAH多肽”等。
本发明的KAH变体多肽(例如具有一个或多个本文所示替换的变体)可以与参照KAH多肽(例如SEQ ID NO:1的KAH)具有至少约60%、70%、80%的同一性,例如与亲本多肽具有至少约85%同一性,例如与亲本多肽具有至少约90%同一性,与亲本多肽具有至少约95%同一性,与亲本多肽具有至少约98%同一性或与亲本多肽具有至少约99%同一性。这种变体通常具有选自对应于以下位置处的一个或多个替换或成组替换
72、85、108、127、129、141、172、195、196、197、199、226、236、291、302、361或464
所述位置是参照SEQ ID NO:1限定的。
对应于参照KAH中的本文中限定的一个位置的氨基酸位置可以是这样的位置,其在多(蛋白质)序列比对中与任何所述氨基酸位置对齐。
本发明的KAH变体通常保留KAH活性。也就是说,本发明的KAH变体通常能够催化上述反应,尽管与参照多肽相比具有改变的活性。
优选地,本发明的KAH变体多肽与其所来源于的参照多肽相比通常展示出改进的性质,通常在比活性和/或底物特异性方面。如果如下所述使用变体,例如在用于生产甜菊醇和/或甜菊醇糖苷(通过在重组宿主中表达KAH)的方法中使用变体,则这种改进的性质通常是相关的。
因此,本发明的KAH变体通常能够增加能够产生甜菊醇和/或甜菊醇糖苷的重组宿主中所述甜菊醇和/或甜菊醇糖苷的产生(与表达参照多肽的能够产生甜菊醇和/或甜菊醇糖苷的重组宿主相比)。也就是说,与过表达宿主多肽(例如SEQ ID NO:1的KAH)的宿主细胞相比,在宿主细胞中过表达本发明的KAH变体多肽通常会导致甜菊醇和/或甜菊醇糖苷的产生增加。
本发明的KAH变体可以通常能够减少能够产生甜菊醇和/或甜菊醇糖苷的重组宿主中非甜菊醇糖苷(例如一种或多种贝壳杉烯酸糖苷)的产生(与表达参照多肽的能够产生甜菊醇和/或甜菊醇糖苷的重组宿主相比)。也就是说,与过表达宿主多肽(例如SEQ ID NO:1的KAH)的宿主细胞相比,在宿主细胞中过表达本发明的KAH变体多肽通常会导致甜菊醇和/或甜菊醇糖苷的产生增加。
产生更低量的非甜菊醇糖苷产物可使甜菊醇糖苷的回收更容易。而且,可以获得更高的产率。
展示出相对于参照KAH改进的性质的KAH变体展现出相关性质(例如比活性)的可测得的降低或提高,通常使得KAH变体更适合本文所述的用途,例如在用于生产甜菊醇或甜菊醇糖苷的方法中。
KAH变体多肽包含与参照多肽相比具有一个或多个氨基酸替换、缺失和/或插入的氨基酸序列和/或与参照多肽相比具有一个或多个截短的氨基酸序列。KAH变体多肽可以包含一个或多个本文所述的替换。
具有KAH活性的变体多肽,例如如本文所示,所述变体多肽具有这样的氨基酸序列,当与包含SEQ ID NO:1所示序列的KAH比对时,所述氨基酸序列包含对应于以下位置处的任何氨基酸的氨基酸残基的至少一个替换
72、85、108、127、129、141、172、195、196、197、199、226、236、291、302、361或464
所述位置是参照SEQ ID NO:1限定的,并且其中所述变体与具有KAH活性的参照多肽相比具有一种或多种改变的性质。
因此,存在于一个或多个所述位置处的氨基酸将被替代为与参照序列中该位置处出现的不同的氨基酸(所述位置是参照SEQ ID NO:1限定的)。
本发明的变体KAH可以包含上文所示替换中的一个,或者可以包含2、3、4、5、6、7、8、9、10、11、12、13、14、15、16或全部17个的任意组合。
如果本发明的变体包含15个上文所示替换,则优选地,其在对应于本文所限定的127和199位的位置处不包含替换。
如果本发明的变体包含16个上文所示替换,则优选地,其在对应于本文所限定的127或199位的位置处不包含替换。
如果本发明的变体包含至少4个上文所示替换,则所述变体可以至少在对应于本文所限定的195、196、197和199位的位置处包含替换,例如K195E+R196A+G197E+E199G替换。
如果本发明的变体包含至少5个上文所示替换,则所述变体可以至少在对应于本文所限定的195、196、197和199位的位置处包含替换,例如T127S+N129D+I172V+V361E+S464A替换。
除了上文限定的17个位置之外,本发明的变体多肽可以包含额外的替换,例如一个或多个额外的替换、添加或缺失。
本发明的变体可包含不同类型的这种修饰的组合。变体可以包含1、2、3、4、至少5、至少10、至少15、至少20、至少25、至少30个或更多个这样的修饰(其可以全部是同种类型的修饰或可以是不同类型的修饰)。通常,额外的修饰可以是替换。
本发明的变体多肽可以包含SEQ ID NO:3所示的氨基酸序列。然而,变体多肽可以包含位置72、85、108、127、129、141、172、195、196、197、199、226、236、291、302、361或464上的替换的任意组合,所述位置是参照合适的参照序列(例如SEQ ID NO:1所示的参照序列)限定的。
宿主细胞可以包含编码1、2、3、4、5或更多个本发明变体的核酸。所述变体可以是相同的或不同的。宿主细胞可以包含编码SEQ ID NO:1的KAH的核酸和编码一种或更多种本发明变体的核酸。也就是说,宿主可以包含编码SEQ ID NO:1的KAH的核酸和编码一种或更多种本发明变体的核酸,其中的每一种均可以以一个、两个、三个、四个、五个或更多个拷贝存在。
与参照多肽相比,变体多肽通常具有改变的KAH活性。通常,改变的活性可以根据重组宿主中的甜菊醇和/或甜菊醇糖苷产生来限定。
可以根据以下来定义改变的活性:与过表达参照多肽(例如SEQ IDNO:1的参照多肽)的宿主细胞的产生水平相比,当在等同宿主细胞中过表达变体KAH时甜菊醇和/或甜菊醇糖苷的产生增加。
可以根据以下来定义改变的活性:与过表达参照多肽(例如SEQ IDNO:1的参照多肽)的宿主细胞的产生水平相比,当在等同宿主细胞中过表达变体KAH时,非甜菊醇糖苷(例如不期望的产物,例如贝壳杉烯酸糖苷)的产生减少。
可以根据以下来定义改变的活性:与过表达参照多肽(例如SEQ IDNO:1的参照多肽)的宿主细胞的产生水平相比,当在等同宿主细胞中过表达变体KAH时,两种甜菊醇糖苷的产生比例的变化(例如莱鲍迪甙A:莱鲍迪甙M的比例可以增加,或者莱鲍迪甙M:莱鲍迪甙A的比例可以增加)。
可以根据以下来定义改变的活性:与过表达参照多肽(例如SEQ IDNO:1的参照多肽)的宿主细胞的产生水平相比,当在等同宿主细胞中过表达变体KAH时,产生的甜菊醇糖苷的总和与贝壳杉烯酸糖苷的总和的比例的变化(例如甜菊醇糖苷的总和:贝壳杉烯酸糖苷的总和的比例可以增加或者莱鲍迪甙M:莱鲍迪甙A的比例可以增加)。
还可以根据变体的稳定性提高来定义改变的活性,例如比参照多肽(例如SEQ IDNO:1的参照多肽)具有更长的半衰期。
还可以根据与参照多肽(例如SEQ ID NO:1的参照多肽)相比更有效的电子转运(例如根据更少去耦(decoupling))来定义改变的活性。
还可以根据与参照多肽(例如SEQ ID NO:1的参照多肽)相比宿主细胞内更有效的电子定位来定义改变的活性。
变体KAH可以能够提高生产水平,例如提高至少5%、至少10%、至少25%、至少50%、至少100%或更多。生产水平可以用g/L或mol/L(M)表示,因此甜菊醇和/或甜菊醇糖苷的生产水平提高将由以g/L或mol/L表示的更高的生产水平指示。
在不期望的产品(例如一种或多种贝壳杉烯酸糖苷)的情况下,变体KAH可以能够降低生产水平,例如降低至少5%、至少10%、至少25%、至少50%或者更多。变体KAH可以能够提高该比例,例如提高至少1%、至少2%、至少5%、至少10%、至少25%、至少50%、至少100%或更多或更多。
如上所述,这也可以根据甜菊醇糖苷的总和:贝壳杉烯酸糖苷的总和的增加来定义。
“多肽”一词在本文中用于指含有超过约七个氨基酸残基的链。本文中的所有多肽序列都是从左到右并从氨基末端到羧基末端的方向书写的。本文使用的单字母氨基酸代码在本领域中是公知的并且可以在Sambrook等人(Molecular Cloning:A LaboratoryManual,第2版,Cold Spring Harbor Laboratory,Cold Spring Harbor LaboratoryPress,Cold Spring Harbor,NY,1989)中找到。
本发明的KAH变体多肽可以是经分离的形式,例如基本上经分离的形式。“经分离的”多肽或蛋白质旨在表示从其天然环境中移出来的多肽或蛋白质。例如,出于本发明的目的,在宿主细胞中表达的重组产生的多肽和蛋白质被认为是经过分离的;已通过任何合适的技术基本纯化的重组多肽也被认为是经过分离的。根据本发明的KAH变体多肽可以通过本领域已知的方法从重组细胞培养物中回收和纯化。
本发明的KAH变体多肽包括化学合成程序的产物,以及通过重组技术由原核或真核宿主产生的产物,所述宿主包括例如细菌、酵母、高等植物、昆虫和哺乳动物细胞。根据在重组生产程序中使用的宿主,本发明的多肽可以是糖基化的或可以是未糖基化的。另外,本发明的多肽还可以包含初始修饰的(initial modified)甲硫氨酸残基,在某些情况下这是宿主介导的过程的结果。
本发明还涉及根据本发明的KAH多肽变体的生物活性片段。这类片段被认为包含在术语“本发明的KAH变体”中。
本发明的KAH多肽变体的生物活性片段包括包含下述氨基酸序列的多肽,所述氨基酸序列与本发明的变体蛋白的氨基酸序列足够相同或源于本发明的变体蛋白的氨基酸序列,其包括的氨基酸较全长蛋白质更少,但显示出相应全长蛋白质的至少一种生物活性。通常,生物活性片段包含具有本发明变体蛋白质的至少一种活性的结构域或基序。本发明的KAH变体的生物活性片段可以是多肽,其长度例如为10、25、50、100或更多个氨基酸。此外,可以通过重组技术来制备缺失蛋白质的其它区域的其它生物活性部分,并针对本发明多肽的天然形式的一种或多种生物活性对所述部分进行评估。
通常,本发明的KAH变体的蛋白片段包含一个或多个本文所限定的替换。
本发明还涉及编码上述生物活性片段(所述生物活性片段自身是本发明的变体)的核酸片段。
本发明提供了包含编码本发明KAH变体多肽(及其生物活性片段)的序列的多核苷酸。本发明还涉及编码本发明的KAH多肽变体的至少一个功能结构域的经分离的多核苷酸。通常,这种结构域包含一个或多个本文所述的替换。
可使用本领域技术人员公知的标准分子生物学技术结合本文提供的序列信息来产生本发明的核酸分子。例如,可使用标准合成技术,通过PCR产生或从头合成所需的核酸分子。这种合成过程通常是自动化过程。
与编码参照KAH的核酸相比,本发明的核酸可以包含一个或多个缺失,即缺口。这种缺失/缺口也可以使用适当的寡核苷酸利用定点诱变来产生。产生这种缺失的技术是本领域技术人员公知的。
此外,可通过标准合成技术(例如使用自动化DNA合成仪)来制备对应于根据本发明的核苷酸序列或可与根据本发明的核苷酸序列杂交的寡核苷酸。
此外,本发明包括互补核酸和反义核酸。与另一核苷酸序列互补的核酸分子是这样的核酸分子:其与另一核苷酸序列足够互补,从而其可与另一核苷酸序列杂交,由此形成稳定的双链体。
本发明的一个方面涉及编码本发明的变体多肽或其生物活性片段或结构域的经分离的核酸分子,以及足以用作杂交探针以鉴定编码本发明的多肽的核酸分子的核酸分子,和适于用作PCR引物以扩增或突变核酸分子(例如,用于制备本发明的核酸分子)的此类核酸分子的片段。
“经分离的核酸”或“经分离的多核苷酸”是这样的DNA或RNA,其与所述DNA或RNA所源于的生物体的天然基因组中所述DNA或RNA直接相邻的两条(5’端的一条和3’端的一条)编码序列并不直接相邻。因此,在一种实施方式中,经分离的核酸包括与编码序列直接相邻的5’非编码(例如,启动子)序列的部分或全部。因此该术语包括,例如,整合入载体中的重组DNA,整合入自主复制质粒或病毒中的重组DNA,或整合入原核生物或真核生物的基因组DNA中的重组DNA,或作为独立于其它序列的单独分子(例如,通过PCR或限制性核酸内切酶处理产生的cDNA或基因组DNA片段)存在的重组DNA。该术语还包括作为杂合基因一部分的重组DNA,所述杂合基因编码另外的多肽,所述多肽基本上不含细胞物质、病毒物质或培养基(当通过重组DNA技术产生时),或化学前体或其它化学制品(当化学合成时)。此外,“经分离的核酸片段”是这样的核酸片段:其天然并不作为片段存在,并且将不会以天然状态被发现。
在本文中使用时,术语“核酸”、“多核苷酸”或“核酸分子”旨在包括DNA分子(例如cDNA或基因组DNA)和RNA分子(例如mRNA)以及使用核苷酸类似物产生的DNA或RNA的类似物。核酸分子可以是单链或双链的,但优选是双链DNA。可以使用寡核苷酸类似物或衍生物(例如肌苷或硫代磷酸酯核苷酸)合成核酸。这种寡核苷酸可用于例如制备具有改变的碱基配对能力或增加的对核酸酶的抗性的核酸。
本发明还涉及包含编码本发明的变体多肽的核酸序列的核酸构建体,所述核酸序列与允许所述核酸序列在宿主细胞中表达的控制序列可操作地连接。可以将核酸构建体整合入载体(例如表达载体)中和/或整合入宿主细胞中以实现变体多肽的表达。
术语“核酸构建体”在本文中被称为单链或双链的核酸分子,其是从天然存在的基因分离的,或者更典型地,其已被修饰为含有以不会在自然中存在的方式组合和并置的核酸的区段。当核酸构建体含有表达编码序列所需的全部控制序列时,术语核酸构建体与术语“表达盒”的含义相同,其中所述控制序列与所述编码序列可操作地连接。
在本文中使用时,术语“可操作地连接”是指处于功能关系的多核苷酸元件(或编码序列或核酸序列)的连接。当核酸序列被置于与另一核酸序列的功能关系中时,其是“可操作地连接”的。例如,如果启动子或增强子影响编码序列的转录,则其与编码序列可操作地连接。
在本文中使用时,术语“启动子”是指这样的核酸片段,其的功能为控制位于该基因的转录起始位点的转录方向的上游的一个或多个基因的转录,并且在结构上通过DNA依赖性RNA聚合酶的结合位点、转录起始位点和本领域技术人员已知的任何其他DNA序列的存在来鉴定。“组成型”启动子是在大多数环境和发育条件下有活性的启动子。“诱导型”启动子是在环境或发育调控下有活性的启动子。
能够用于实现编码酶(例如变体KAH多肽或本发明的重组宿主中引入的任何其它酶)的核苷酸序列表达的启动子对编码待表达的酶的核苷酸序列而言可以不是天然的,即对与之可操作地连接的核苷酸序列(编码序列)而言异源的启动子。优选地,启动子对宿主细胞而言是同源的,即内源的。
该上下文中合适的启动子既包括组成型又包括诱导型的天然启动子以及经改造的启动子,所述启动子是本领域技术人员公知的。宿主细胞中合适的启动子可以是GAL7、GAL10或GAL 1、CYC1、HIS3、ADH1、PGL、PH05、GAPDH、ADC1、TRP1、URA3、LEU2、ENO、TPI和AOX1。其它合适的启动子包括PDC、GPD1、PGK1、TEF1和TDH。
通常,编码酶的核苷酸序列包含终止子。本发明中可以使用在宿主细胞中有功能的任何终止子。优选的终止子得自宿主细胞的天然基因。合适的终止子序列是本领域公知的。优选地,这类终止子与下述突变组合,所述突变防止本发明宿主细胞中无义介导的mRNA衰退(decay)(见例如Shirley等,2002,Genetics 161:1465-1482)。
本发明还涉及载体,优选表达载体,其包含本发明的核酸或核酸构建体(即,包含编码本发明的变体KAH多肽的序列)。
为了促进KAH的表达和/或翻译,编码KAH的核酸序列可以包含在表达载体中,以使得编码KAH的基因可操作地连接至用于在体外或在本发明的宿主细胞中表达和/或翻译的恰当控制序列。也就是说,本发明提供了包含本发明的核酸或核酸构建体的表达载体。
表达载体可以是可方便地进行重组DNA程序并且可引起编码KAH变体多肽的多核苷酸表达的任何载体(例如质粒或病毒)。载体的选择通常取决于载体与待引入所述载体的细胞的相容性。载体可以是线性质粒或闭环质粒。载体可以是自主复制型载体,即作为染色体外实体而存在、其复制独立于染色体复制的载体,例如,质粒、染色体外元件、微型染色体或人工染色体。如果打算用于真菌来源的宿主细胞中,则合适的附加型核酸构建体可以例如基于酵母2μ或pKD1质粒(Gleer等,1991,Biotechnology9:968-975)或AMA质粒(Fierro等,1995,Curr Genet.29:482-489)。
或者,表达载体可以是当被引入宿主细胞时整合至基因组中并与其已整合至其中的染色体一起复制的载体。整合型克隆载体可随机或在预定靶基因座处整合在宿主细胞的染色体中。在本发明的一个优选实施方式中,整合型克隆载体包含与宿主细胞基因组中预定靶基因座中的DNA序列同源的DNA片段,以将克隆载体靶向整合到该预定基因座。为了促进靶向整合,克隆载体优选在转化细胞之前线性化。优选进行线性化,使得克隆载体的至少一端但优选两端的侧翼是与靶基因座同源的序列。靶基因座侧翼的同源序列的长度优选为至少20bp、至少30bp、至少50bp、至少0.1kb、至少0.2kb、至少0.5kb、至少1kb、至少2kb或更长。宿主细胞的同源重组能力增强提高靶向整合到宿主细胞基因组中(即整合到预定的靶基因座中)的效率。
与靶基因座同源的克隆载体中的同源侧翼DNA序列可源自高表达的基因座,这意味着它们源自在宿主细胞中能够具有高表达水平的基因。能够具有高表达水平的基因(即高表达基因)在本文中被定义为:在例如经诱导条件下,其mRNA可以构成总细胞mRNA的至少0.5%(w/w)的基因,或者,其基因产物可以构成总细胞蛋白质的至少1%(w/w)的基因,或者在分泌的基因产物的情况下,可以分泌至至少0.1g/l的水平。更通常地,靶基因座可以是基因间位置,以使基因不被中断。这种基因座也可以提供高表达水平。因此,克隆载体中的同源侧翼DNA序列可以与基因间靶基因座同源。
核酸构建体或表达载体可以在本发明的宿主细胞体内装配,并且任选地,在单个步骤中整合到细胞的基因组中(参见例如WO2013/076280)
可将多于一个拷贝的本发明的核酸构建体或表达载体插入宿主细胞中以增加由包含在核酸构建体内的核酸序列编码的KAH变体多肽的产生(过表达)。这可以优选地通过将两个或更多个拷贝的核酸整合到其基因组中,更优选地通过使核酸靶向整合到上文所限定的基因座来完成。
本领域技术人员会理解:表达载体的设计可取决于诸如待转化的宿主细胞的选择,所期望蛋白质的表达水平等因素。本发明的表达载体可被引入宿主细胞中,从而产生由本文所述的核酸编码的蛋白质或肽(例如SEQID NO:1的KAH变体,例如功能等同物或片段,或包含一种或多种此类变体的融合蛋白)。
本发明的核酸构建体和载体可被设计用于在原核宿主细胞或真核宿主细胞中表达本发明的KAH变体多肽。
可以通过常规转化或转染技术将本发明的核酸构建体和/或表达载体引入原核或真核细胞中。在本文中使用时,术语“转化”和“转染”旨在指用于将外来核酸(例如DNA)引入本领域技术人员公知的宿主细胞中的多种本领域公认的技术。用于转化或转染宿主细胞的合适方法可见于Sambrook等(Molecular Cloning:A Laboratory Manual,第2版.ColdSpring Harbor Laboratory,Cold Spring Harbor Laboratory Press,Cold SpringHarbor,NY,1989),Davis等,Basic Methods in Molecular Biology(1986)和其他实验室手册。
术语“功能等同物”和“功能变体”在本文中可互换使用。根据本发明的功能等同物是经分离的核酸片段,其编码的多肽展示出本文所限定的KAH变体的特定功能。因此,功能等同物还包括生物活性片段,并且它们本身包含在本发明的术语“KAH变体”中。
优选地,本发明的功能等同物包含一个或多个本文所述的替换。然而,除了上述替换之外,功能等同物可以包含一个或多个修饰。
功能性核酸等同物通常可以包含沉默突变或不改变所编码的KAH变体多肽的生物学功能的突变。因此,本发明提供了编码变体KAH蛋白的核酸分子,所述变体KAH蛋白含有对特定生物活性(即KAH活性)而言并非必需的氨基酸残基的改变。
KAH变体蛋白质的这种功能等同物与它们所来源于的亲本KAH变体序列在氨基酸序列上不同,但仍保留亲本KAH变体的至少一种生物活性,优选地它们至少保留KAH活性。本领域技术人员会认识到,可以通过突变将改变引入根据本发明的核苷酸序列中,从而导致所得蛋白质的氨基酸序列发生变化,而基本上不改变这种蛋白质的功能。
在一个实施方式中,经分离的核酸分子包含编码蛋白质的核苷酸序列,其中所述蛋白质包含与亲本KAH变体或参照氨基酸序列(例如SEQ ID NO:1所示)具有至少约60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%同一性的氨基酸序列。
因此,本发明的KAH变体的功能等同物优选为这样的蛋白质,所述蛋白质包含与亲本KAH变体氨基酸序列或参照多肽序列(例如SEQ ID NO:1所示)具有至少约60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或更大同一性的氨基酸序列,并且通常还保留亲本KAH多肽的至少一种功能活性。
具有贝壳杉烯酸13-羟化酶活性的本发明变体多肽可以包含与SEQ ID NO:3、SEQID NO:5、SEQ ID NO:7、SEQ ID NO:9、SEQ ID NO:11、SEQ ID NO:13、SEQ ID NO:15、SEQ IDNO:17、SEQ ID NO:19、SEQ ID NO:21、SEQ ID NO:23、SEQ ID NO:25、SEQ ID NO:27、SEQ IDNO:29、SEQ ID NO:31、SEQ ID NO:33、SEQ ID NO:35或SEQ ID NO:37中的任何一个具有至少约80%序列同一性、至少约90%序列同一性、至少约95%序列同一性、至少约96%序列同一性、至少约97%序列同一性、至少约98%序列同一性或至少约99%序列同一性的氨基酸序列。
本发明的变体多肽可以具有表5所限定的序列或者表5中限定的替换模式(就位置而言,如果不是完全相同的氨基酸替换的话)。
本发明的变体KAH多肽可以例如通过筛选合适参照多肽的突变体(例如替换突变体)文库来鉴定。候选突变体可以基于它们在宿主细胞(与表达参照多肽的相应宿主细胞相比较)中表达时增加甜菊醇或甜菊醇糖苷产生的能力进行筛选。
根据本发明的核酸的片段可以包含不编码功能性多肽的序列或由不编码功能性多肽的序列组成。这种核酸可用作PCR反应的引物或探针。
无论根据本发明的核酸编码功能性多肽或非功能性多肽,其均可被用作杂交探针或聚合酶链式反应(PCR)引物。不编码具有KAH活性的多肽的本发明核酸分子的用途除了其它之外还包括:(1)与中期染色体压片(spreads)原位杂交(例如FISH)以提供KAH编码基因的精确染色体定位,如Verma等,Human Chromosomes:a Manual of Basic Techniques,Pergamon Press,New York(1988)中所述;(2)Northern印迹分析,以检测特定组织和/或细胞中KAH mRNA表达;和(3)可被用作诊断工具的探针和引物,以分析给定生物(例如组织)样品中能够与所述探针或引物杂交的核酸的存在。
给定参照KAH酶的变体可以通过以下标准程序获得:
-诱变(易错,掺杂(doped)寡核苷酸,掺入(spiked)寡核苷酸)或合成变异体
-在例如Y.lipolitica或S.cerevisiae中转化
-培养转化体,选择转化体
-在例如Y.lipolitica或S.cerevisiae中表达
-初步筛选,例如基于甜菊醇或甜菊醇糖苷产生
-鉴定改进的变体(例如与改变的辅因子特异性相关)。
在一个实施方式中,本发明涉及生产根据本发明的KAH多肽变体的方法,所述方法包括:
a)选择参照KAH多肽(即模板或起始多肽);
b)替换至少一个对应于任何以下位置处的氨基酸残基72、85、108、127、129、141、172、195、196、197、199、226、236、291、302、361或464
所述位置是参照SEQ ID NO:1限定的;
c)任选地,替换b)中所限定的一个或多个另外的氨基酸;
d)制备由步骤a)-c)产生的变体;
e)测定所述变体的性质,例如如实施例中所示;和
f)选择与所述参照KAH多肽相比具有改变的性质的变体。
在生产根据本发明的KAH多肽变体的方法的一个优选实施方式中,参照KAH多肽具有SEQ ID NO:1所示的序列。
更优选地,在根据本发明的方法的步骤b)中,替换至少一个对应于任何以下位置处的氨基酸残基
72、85、108、127、129、141、172、195、196、197、199、226、236、291、302、361或464
所述位置是参照SEQ ID NO:1限定的。参照多肽可以与SEQ ID NO:1具有至少约80%的同源性。
在另一个实施方式中,本发明涉及宿主细胞,例如含有本发明的核酸、核酸构建体或载体的经转化的宿主细胞或重组宿主细胞。根据本发明的“宿主细胞”或“重组细胞”通常是通过重组DNA技术将根据本发明的核酸(即编码本发明的KAH的核酸)引入其(或其祖先)中的细胞。在本发明的上下文中,根据本发明的“宿主细胞”或所述宿主细胞的亲本可以是任何类型的宿主细胞。
因此,本发明的宿主细胞可以包含编码一种或多种本发明的变体多肽的重组核酸。
根据前述权利要求中任一项所述的宿主细胞,其中所述宿主细胞是真核细胞或原核细胞。因此,包括了原核细胞和真核细胞,例如细菌、真菌、酵母等,特别优选的是来自酵母(例如S.cerevisiae、Y.lipolytica和K.lactis)的细胞。宿主细胞还包括但不限于哺乳动物细胞系,例如CHO、VERO、BHK、HeLa、COS、MDCK、293、3T3、WI38和脉络丛细胞系。
因此,本发明提供了一种生产KAH的方法,所述方法包括:在适合生产KAH的条件下培养本文所述的宿主细胞,和任选地,回收KAH。通常,宿主细胞能够产生甜菊醇或甜菊醇糖苷。
本发明的重组宿主可以包含本文所述的任何多肽。通常,本发明的重组宿主能够产生甜菊醇糖苷。通常,本发明的重组宿主能够产生糖基化二萜,例如甜菊醇糖苷。例如,本发明的重组宿主可以能够产生例如甜菊醇-13-单糖苷、甜菊醇-19-单糖苷、13-[(β-D-吡喃葡萄糖基)氧基)贝壳杉-16-烯-18-酸2-O-β-D-吡喃葡萄糖基-β-D-吡喃葡萄糖基酯、甜茶苷、甜菊苷、甜菊醇-19-双糖苷、甜菊醇双糖苷、莱鲍迪甙A、莱鲍迪甙E、莱鲍迪甙D或莱鲍迪甙M中的一种或更多种。
本发明的重组宿主可包含编码具有UDP-糖基转移酶(UGT)活性的一种或多种多肽的一种或多种重组核酸序列。
出于本发明的目的,具有UGT活性的多肽是具有糖基转移酶活性(EC 2.4)的多肽,即可以充当催化剂以将单糖单元从活化的核苷酸糖(又称“糖基供体”)转移到糖基受体分子(通常是醇)的多肽。UGT的糖基供体典型地是核苷酸糖尿苷二磷酸葡萄糖(尿嘧啶-二磷酸葡萄糖,UDP-葡萄糖)。
可以选择这种另外的UGT以产生期望的甜菊醇糖苷。Humphrey等人,PlantMolecular Biology(2006)61:47-62和Mohamed等人,J.Plant Physiology 168(2011)1136-1141中示出了甜菊醇糖苷形成的示意图。另外,图1示出了甜菊醇糖苷形成的示意图。
因此,本发明的重组宿主可包含一个或多个编码以下项中的一种或多种的重组核酸序列:
(i)具有UGT74G1活性的多肽;
(ii)具有UGT2活性的多肽;
(ii)具有UGT85C2活性的多肽;和
(iii)具有UGT76G1活性的多肽。
适用于本发明的重组酵母可包含编码能够催化向甜菊醇中添加C-13-葡萄糖的多肽的核苷酸序列。也就是说,适用于本发明方法的重组酵母可包含能够催化将甜菊醇转化为甜菊单糖苷的反应的UGT。
适用于本发明方法的这种重组酵母可包含编码具有由UDP-糖基转移酶(UGT)UGT85C2所示的活性的多肽的核苷酸序列,由此酵母转化后,核苷酸序列赋予所述酵母将甜菊醇转化为甜菊单糖苷的能力。
UGT85C2活性是将葡萄糖单元转移至甜菊醇的13-OH。因此,合适的UGT85C2可充当尿苷5'-二磷酸葡糖基:甜菊醇13-OH转移酶和尿苷5'-二磷酸葡糖基:甜菊醇-19-O-糖苷13-OH转移酶。功能性UGT85C2多肽还可催化葡糖基转移酶反应,所述反应利用除甜菊醇和甜菊醇-19-O-糖苷以外的甜菊醇糖苷底物。此类序列可在本文中称为UGT1序列。
适用于本发明的重组酵母可以包含编码具有UGT2活性的多肽的核苷酸序列。
具有UGT2活性的多肽是充当尿苷5'-二磷酸葡萄糖基:甜菊醇-13-O-糖苷转移酶(又称甜菊醇-13-单葡萄糖苷1,2-转葡萄糖基酶)的多肽,其将葡萄糖部分转移到受体分子甜菊醇-13-O-糖苷的13-O-葡萄糖的C-2'。典型地,适合的UGT2多肽还可以充当将葡萄糖部分转移到受体分子甜茶苷的13-O-葡萄糖的C-2’的尿苷5'-二磷酸葡萄糖基:甜茶苷转移酶。
具有UGT2活性的多肽也可以催化利用除甜菊醇-13-O-糖苷和甜茶苷以外的甜菊醇糖苷底物的反应,例如,功能性UGT2多肽可利用甜菊苷作为底物,从而将葡萄糖部分转移至19-O-葡萄糖残基的C-2'以产生莱鲍迪甙E。功能性UGT2多肽也可以利用莱鲍迪甙A作为底物,从而将葡萄糖部分转移至19-O-葡萄糖残基的C-2'以产生莱鲍迪甙D。然而,功能性UGT2多肽通常不将葡萄糖部分转移至在C-13位具有1,3-结合的葡萄糖的甜菊醇化合物,即将葡萄糖部分转移至甜菊醇1,3-双糖苷和1,3-甜菊苷通常不会发生。
具有UGT2活性的多肽也可以从除尿苷二磷酸葡萄糖以外的供体转移糖部分。例如,具有UGT2活性的多肽充当尿苷5'-二磷酸D-木糖基:甜菊醇-13-O-糖苷转移酶,其将木糖部分转移至受体分子甜菊醇-13-O-糖苷的13-O-葡萄糖的C-2'。作为另一个实例,具有UGT2活性的多肽可充当尿苷5'-二磷酸L-鼠李糖基:甜菊醇-13-O-糖苷转移酶,其将鼠李糖部分转移至受体分子甜菊醇的13-O-葡萄糖的C-2'。
适用于本发明方法的重组酵母可以包含编码具有UGT活性的多肽的核苷酸序列,可以包含编码能够催化向甜菊双糖苷添加C-19-葡萄糖的多肽的核苷酸序列。也就是说,本发明的重组酵母可以包含能够催化将甜菊双糖苷转化成甜菊苷的反应的UGT。因此,这种重组酵母可以能够将甜菊双糖苷转化为甜菊苷。这种核苷酸序列的表达可以赋予重组酵母生产至少甜菊苷的能力。
因此,适用于本发明方法的重组酵母还可以包含编码具有由UDP-糖基转移酶(UGT)UGT74G1所示的活性的多肽的核苷酸序列,由此当转化酵母后,所述核苷酸序列赋予细胞将甜菊双糖苷转化为甜菊苷的能力。
合适的UGT74G1多肽可以能够将葡萄糖单元分别转移至甜菊醇的13-OH或19-COOH。合适的UGT74G1多肽可充当尿苷5'-二磷酸葡糖基:甜菊醇19-COOH转移酶和尿苷5'-二磷酸葡糖基:甜菊醇-13-O-糖苷19-COOH转移酶。功能性UGT74G1多肽还可催化使用除甜菊醇和甜菊醇-13-O-糖苷以外的甜菊醇糖苷底物或者从除尿苷二磷酸葡萄糖以外的供体转移糖部分的糖基转移酶反应。此类序列可在本文中称为UGT3序列。
适用于本发明方法的重组酵母可包含编码能够催化甜菊苷的C-13位置处的葡萄糖的C-3'的葡糖基化的多肽的核苷酸序列。也就是说,适用于本发明方法的重组酵母可包含UGT,所述UGT能够催化甜菊苷转化至莱鲍迪甙A的反应。因此,这种重组酵母可以能够将甜菊苷转化为莱鲍迪甙A。这种核苷酸序列的表达可赋予酵母产生至少莱鲍迪甙A的能力。
适用于本发明方法的重组酵母可以因此还包含编码具有由UDP-糖基转移酶(UGT)UGT76G1所示的活性的多肽的核苷酸序列,由此当转化酵母后所述核苷酸序列赋予该酵母将甜菊苷转化为莱鲍迪甙A的能力。
合适的UGT76G1向受体分子甜菊醇1,2糖苷的C-13-O-葡萄糖的C-3'添加葡萄糖部分。因此,UGT76G1充当例如尿苷5'-二磷酸葡糖基:甜菊醇13-O-1,2葡糖苷C-3'葡糖基转移酶和尿苷5'-二磷酸葡糖基:甜菊醇-19-O-葡萄糖、13-O-1,2双糖苷C-3'葡糖基转移酶。功能性UGT76G1多肽还可催化葡糖基转移酶反应,所述反应使用含有除葡萄糖以外的糖的甜菊醇糖苷底物,例如甜菊醇鼠李糖苷和甜菊醇木糖苷。此类序列可在本文中称为UGT4序列。UGT4可以替代地或者另外地能够将RebD转化为RebM。
适用于本发明方法的重组酵母通常包含编码至少一种具有UGT1活性的多肽、至少一种具有UGT2活性的多肽、至少一种具有UGT3活性的多肽和至少一种具有UGT4活性的多肽的核苷酸序列。这些核酸序列中的一种或更多种可以是重组的。给定的核酸可编码具有一种或更多种上述活性的多肽。例如,核酸可以编码具有两种、三种或四种上述活性的多肽。优选地,用于本发明方法的重组酵母包含UGT1、UGT2和UGT3以及UGT4活性。合适的UGT1、UGT2、UGT3和UGT4序列在WO2015/007748的表1中进行了描述。
本发明的重组宿主可以包含两种或更多种编码具有任何一种UGT活性(例如,UGT1、UGT2、UGT3或UGT4活性)的多肽的核酸序列。当本发明的重组宿主包含两种或更多种编码具有任何一种UGT活性的多肽的核酸序列时,这些核酸序列可以相同或不同,和/或可编码相同或不同的多肽。特别地,本发明的重组宿主可以包含编码两种不同UGT2多肽的核酸序列。
根据本发明的重组宿主可以包含编码以下项中的一种或更多种的一种或更多种重组核苷酸序列:
具有对映-柯巴基焦磷酸合酶活性的多肽;
具有对映-贝壳杉烯合酶活性的多肽;
具有对映-贝壳杉烯氧化酶活性的多肽。
除了本发明的变体KAH多肽之外,根据本发明的重组宿主还可以包含编码具有贝壳杉烯酸13-羟化酶活性的多肽的重组核苷酸序列。也就是说,本发明的重组宿主可以包含一种或多种核苷酸序列,其包含两种或更多种不同的具有贝壳杉烯酸13-羟化酶活性的多肽,其中一种是本发明的变体KAH多肽。
出于本发明的目的,具有对映-柯巴基焦磷酸合酶(EC 5.5.1.13)的多肽能够催化化学反应:
Figure BDA0001616682560000231
所述酶具有一种底物,香叶基香叶基焦磷酸;以及一种产物,对映-柯巴基焦磷酸。所述酶参与赤霉素生物的合成。所述酶属于异构酶家族,特别是分子内裂解酶的类别。所述酶类别的系统名称是对映-柯巴基-二磷酸裂解酶(脱环)。通常使用的其他名称包括具有对映-柯巴基焦磷酸合酶、对映-贝壳杉烯合酶A和对映-贝壳杉烯合成酶A。
编码对映-柯巴基焦磷酸合酶的合适核酸序列可例如包含在WO2015/007748的SEQID.NO:1、3、5、7、17、19、59、61、141、142、151、152、153、154、159、160、182或184中列出的序列。
出于本发明的目的,具有对映-贝壳杉烯合酶活性(EC 4.2.3.19)的多肽是能够催化以下化学反应的多肽:
Figure BDA0001616682560000232
因此,所述酶具有一种底物,对映-柯巴基二磷酸;以及两种产物,对映-贝壳杉烯和二磷酸。
所述酶属于裂解酶家族,特别是作用于磷酸盐/酯的碳-氧裂解酶。所述酶类别的系统名称是对映-柯巴基二磷酸二磷酸-裂解酶(环化,对映-贝壳杉烯形成)。常用的其它名称包括对映-贝壳杉烯合酶B、对映-贝壳杉烯合成酶B、对映-柯巴基-二磷酸二磷酸-裂解酶和(环化)。所述酶参与双萜类生物合成。
编码对映-贝壳杉烯合酶的合适核酸序列可例如包含在WO2015/007748的SEQID.NO:9、11、13、15、17、19、63、65、143、144、155、156、157、158、159、160、183或184中列出的序列。
对映-柯巴基二磷酸合酶还可具有与相同蛋白质分子相关联的不同对映-贝壳杉烯合酶活性。由对映-贝壳杉烯合酶催化的反应是赤霉素的生物合成途径中的下一步骤。两种类型的酶活性是不同的,并且定点诱变以抑制蛋白质的对映-贝壳杉烯合酶活性导致对映-柯巴基焦磷酸的积累。
因此,本发明重组宿主中使用的单个核苷酸序列可编码具有对映-柯巴基焦磷酸合酶活性和对映-贝壳杉烯合酶活性的多肽。或者,两种活性可被两个不同的分离的核苷酸序列编码。
出于本发明的目的,具有对映-贝壳杉烯氧化酶活性(EC 1.14.13.78)的多肽是能够催化对映-贝壳杉烯的4-甲基的三次连续氧化以产生贝壳杉烯酸的多肽。这种活性通常需要细胞色素P450的存在。
编码对映-贝壳杉烯氧化酶的合适核酸序列可例如包含在WO2015/007748的SEQID.NO:21、23、25、67、85、145、161、162、163、180或186中列出的序列。
除了本发明的变体KAH多肽以外,编码贝壳杉烯酸13-羟化酶的合适核酸序列可例如包含在WO2015/007748的SEQ ID.NO:27、29、31、33、69、89、91、93、95、97、146、164、165、166、167或185中列出的序列。
本发明的重组宿主可包含编码具有NADPH-细胞色素p450还原酶活性的多肽的重组核酸序列。也就是说,本发明的重组宿主可能够表达编码具有NADPH-细胞色素p450还原酶活性的多肽的核苷酸序列。出于本发明的目的,具有NADPH-细胞色素P450还原酶活性(EC1.6.2.4;也称为NADPH:高铁血红蛋白氧化还原酶、NADPH:血红素蛋白氧化还原酶、NADPH:P450氧化还原酶、P450还原酶、POR、CPR、CYPOR)的多肽通常是一种这样的多肽,其为膜结合酶,从而允许电子从含有FAD和FMN的酶NADPH:细胞色素P450还原酶(POR;EC 1.6.2.4)转移至宿主细胞的微粒体中的细胞色素P450。
在本发明的重组宿主中,可上调宿主产生香叶基香叶基二磷酸(GGPP)的能力。在本发明的上下文中上调意味着重组宿主比等同的非重组宿主产生更多的GGPP。
因此,本发明的重组宿主可包含编码羟甲基戊二酰基-辅酶A还原酶、法尼基-焦磷酸合成酶和香叶基香叶基二磷酸合酶的一个或多个核苷酸序列,由此微生物转化后的所述核苷酸序列赋予微生物产生提高水平的GGPP的能力。因此,根据本发明的重组宿主可包含编码羟甲基戊二酰基-辅酶A还原酶、法尼基-焦磷酸合成酶和香叶基香叶基二磷酸合酶中的一种或多种的一个或多个重组核酸序列。
因此,本发明的重组宿主可包含编码以下中的一种或多种的核酸序列:
具有羟甲基戊二酰基-辅酶A还原酶活性的多肽;
具有法尼基-焦磷酸合成酶活性的多肽;
具有香叶基香叶基二磷酸合酶活性的多肽。
本文所限定的宿主或宿主细胞是适合遗传操作的生物体,其可以在可用于工业生产目标产物的细胞密度下培养。合适的宿主可以是微生物,例如可以维持在发酵装置中的微生物。宿主细胞可以是在自然界中发现的宿主细胞或在遗传操作或经典诱变后源自亲本宿主细胞的宿主细胞。
在本文中使用时,重组宿主是被遗传修饰或者被一种或多种本文所限定的核苷酸序列转化/转染的宿主。一种或多种这类核苷酸序列的存在改变了微生物产生甜菊醇或甜菊醇糖苷(特别是一种或多种甜菊醇糖苷)的能力。非重组宿主(即未被转化/转染或遗传修饰的宿主)通常不包含能使细胞产生甜菊醇糖苷的一种或多种核苷酸序列。因此,非重组宿主通常是不天然产生甜菊醇糖苷的宿主,尽管天然产生甜菊醇或甜菊醇糖苷并且已根据本发明进行了修饰(并且因此产生二萜糖苷的能力发生变化)的宿主被认为是根据本发明的重组宿主。
特别地,可行的是:选自对映-柯巴基焦磷酸合酶、对映-贝壳杉烯合酶、对映-贝壳杉烯氧化酶和贝壳杉烯酸13-羟化酶、UGT、羟甲基戊二酰基-CoA还原酶、法尼基焦磷酸合成酶、香叶基香叶基二磷酸合酶和NADPH-细胞色素P450还原酶的酶对于宿主而言是原生的,并且赋予宿主细胞产生甜菊醇或甜菊醇糖苷的能力可不需要用编码这些酶的一种或多种核苷酸序列转化。根据本发明的一种优选宿主可以是天然能够产生GGPP(即以其非重组形式)的重组宿主。
通过经典菌株改善可以进一步改善宿主微生物的甜菊醇或甜菊醇糖苷产生。
宿主细胞可以是原核、古细菌或真核宿主细胞。
原核宿主细胞可以是但不限于细菌宿主细胞。真核宿主细胞可以是但不限于酵母、真菌、变形虫、藻类、动物、昆虫宿主细胞。
真核宿主细胞可以是真菌宿主细胞。“真菌”包括真菌(Eumycotina)亚门的所有物种(Alexopoulos,C.J.,1962,在Introductory Mycology,John Wiley&Sons,Inc.(约翰威立出版有限公司),纽约)。因此,术语真菌包括丝状真菌和酵母等等。
“丝状真菌”在本文中定义为真核微生物,其包括真菌和卵菌亚门的所有丝状形式(如由Hawksworth等人,1995,同上所定义)。丝状真菌是以由壳多糖、纤维素、葡聚糖、壳聚糖、甘露聚糖以及其它复合多糖构成的菌丝壁为特征。营养体生长是通过菌丝延长,并且碳代谢是专性需氧的。丝状真菌菌株包括但不限于以下各项的菌株:Acremonium、Aspergillus、Agaricus、Aureobasidium、Cryptococcus、Corynascus、Chrysosporium、Filibasidium、Fusarium、Humicola、Magnaporthe、Monascus、Mucor、Myceliophthora、Mortierella、Neocallimastix、Neurospora、Paecilomyces、Penicillium、Piromyces、Phanerochaete、Podospora、Pycnoporus、Rhizopus、Schizophyllum、Sordaria、Talaromyces、Rasmsonia、Thermoascus、Thielavia、Tolypocladium、Trametes以及Trichoderma。可充当宿主细胞的优选丝状真菌菌株属于以下物种:Aspergillus niger、Aspergillus oryzae、Aspergillus fumigatus、Penicillium chrysogenum、Penicilliumcitrinum、Acremonium chrysogenum、Trichoderma reesei、Rasamsonia emersonii(先前称为Talaromyces emersonii)、Aspergillus sojae、Chrysosporium lucknowense、Myceliophtora thermophyla。用于比较转化和未转化细胞的发酵特征的参考宿主细胞包括例如Aspergillus niger CBS120.49、CBS 513.88;Aspergillus oryzae ATCC16868、ATCC 20423、IF0 4177、ATCC 1011、ATCC 9576、ATCC14488-14491、ATCC 11601、ATCC12892;Aspergillus fumigatus AF293(CBS101355);P.chrysogenum CBS 455.95;Penicilliumcitrinum ATCC 38065;Penicillium chrysogenum P2;Acremonium chrysogenum ATCC36225、ATCC 48272;Trichoderma reesei ATCC 26921、ATCC 56765、ATCC 26921;Aspergillus sojae ATCC11906;Chrysosporium lucknowense ATCC44006以及所有这些菌株的衍生株。作为丝状真菌宿主细胞特别优选的是Aspergillus niger CBS 513.88及其衍生株。
真核宿主细胞可以是酵母细胞。优选的酵母宿主细胞可选自以下属:酵母属(例如,S.cerevisiae、S.bayanus、S.pastorianus、S.carlsbergensis)、Brettanomyces、Kluyveromyces、Candida(例如,C.krusei、C.revkaufi、C.pulcherrima、C.tropicalis、C.utilis)、Issatchenkia (例如,I.orientalis)、Pichia(例如,P.pastoris)、Schizosaccharomyces、Hansenula、Kloeckera、Pachysolen、Schwanniomyces、Trichosporon、Yarrowia(例如,Y.lipolytica)(先前分类为Candida lipolytica))、Yamadazyma。
原核宿主细胞可以是细菌宿主细胞。细菌宿主细胞可以是革兰氏阴性或革兰氏阳性细菌。细菌的实例包括但不限于,属于以下属的细菌:Bacillus(例如,B.subtilis、B.amyloliquefaciens、B.licheniformis、B.puntis、B.megaterium、B.halodurans、B.pumilus)、Acinetobacter、Nocardia、Xanthobacter、Escherichia(例如,大肠杆菌(例如,菌株DH 1OB、Stbl2、DH5-α、DB3、DB3.1)、DB4、DB5、JDP682和ccdA-over(例如,美国申请号09/518,188)))、Streptomyces、Erwinia、Klebsiella、Serratia(S.marcessans)、Pseudomonas(例如,P.aeruginosa)、Salmonella(例如,S.typhimurium、S.typhi)。细菌还包括但不限于光合细菌(例如,绿色非硫细菌(例如,Choroflexus细菌(例如C.aurantiacus)、Chloronema(例如,C.gigateum))、绿色硫细菌(例如,Chlorobium细菌(例如,C.limicola)、Pelodictyon(例如,P.luteolum)、紫色硫细菌(例如,Chromatium(例如,C.okenii))以及紫色非硫细菌(例如,Rhodospirillum(例如,R.rubrum)、Rhodobacter(例如R.sphaeroides、R.capsulatus)和Rhodomicrobium细菌(例如R.vanellii))。
宿主细胞可以是来自非微生物生物体的宿主细胞。此类细胞的实例包括但不限于昆虫细胞(例如,Drosophila(例如,D.melanogaster)、Spodoptera(例如,S.frugiperdaSf9或Sf21细胞)和Trichoplusa(例如,High-Five细胞));线虫细胞(例如,C.elegans细胞);禽类细胞;两栖动物细胞(例如,Xenopus laevis细胞);爬行动物细胞;以及哺乳动物细胞(例如NIH3T3、293、CHO、COS、VERO、C127、BHK、Per-C6、Bowes黑色素瘤和HeLa细胞)。
本发明还提供了生产本发明多肽的方法,所述方法包括:
(a)在有益于通过宿主细胞产生多肽的条件下培养本发明的重组宿主细胞,和任选地,
(b)回收所述多肽。
根据本发明的重组宿主可能够在本领域中已知的任何合适的碳源上生长,并且将其转化为甜菊醇糖苷,例如甜菊醇糖苷。重组宿主可能够直接转化植物生物质、纤维素、半纤维素、果胶、鼠李糖、半乳糖、岩藻糖、麦芽糖、麦芽糖糊精、核糖、核酮糖或淀粉、淀粉衍生物、蔗糖、葡萄糖、乳糖或甘油。因此,优选的宿主表达酶如用于将纤维素转化成葡萄糖单体和将半纤维素转化成木糖和阿拉伯糖单体所需的纤维素酶(内切纤维素酶和外切纤维素酶)和半纤维素酶(例如内切和外切木聚糖酶、阿拉伯糖酶),能够将果胶转化成葡萄糖醛酸和半乳糖醛酸的果胶酶或将淀粉转化成葡萄糖单体的淀粉酶。优选地,宿主能够转化选自由以下各项组成的组的碳源:葡萄糖、木糖、阿拉伯糖、蔗糖、乳糖和甘油。宿主细胞可例如是WO03/062430、WO06/009434、EP1499708B1、WO2006096130或WO04/099381中所描述的真核宿主细胞。
因此,另一方面,本发明还提供了一种用于制备甜菊醇糖苷的方法,所述方法包括发酵本发明的重组宿主,所述重组宿主能够在合适的发酵培养基中产生至少一种甜菊醇糖苷;以及任选地回收所述甜菊醇糖苷。
甜菊醇糖苷可以是例如甜菊醇-13-单糖苷、甜菊醇-19-单糖苷、13-[(β-D-吡喃葡萄糖基)氧基)贝壳杉-16-烯-18-酸2-O-β-D-吡喃葡萄糖基-β-D-吡喃葡萄糖基酯、甜茶苷、甜菊苷、甜菊醇-19-双糖苷、甜菊醇双糖苷、rebA、莱鲍迪甙B、莱鲍迪甙C、莱鲍迪甙E、莱鲍迪甙D或莱鲍迪甙M。
在用于产生甜菊醇糖苷的方法中使用的发酵培养基可以是允许特定宿主细胞生长的任何合适的发酵培养基。发酵培养基的基本要素是本领域的技术人员已知的,并且可适用于所选择的宿主细胞。
优选地,发酵培养基包含选自由以下各项组成的组的碳源:植物生物质、纤维素、半纤维素、果胶、鼠李糖、半乳糖、岩藻糖、果糖、麦芽糖、麦芽糖糊精、核糖、核酮糖或淀粉、淀粉衍生物、葡萄糖、蔗糖、乳糖、脂肪酸、甘油三酯和甘油。优选地,发酵培养基还包含氮源,如尿素;或铵盐,如硫酸铵、氯化铵、硝酸铵或磷酸铵。
根据本发明的发酵方法可以分批、分批补料或连续模式进行。也可应用单独的水解和发酵(SHF)方法或同时糖化和发酵(SSF)方法。这些发酵方法模式的组合对于最佳生产率来说也可以是可行的。如果在发酵方法中使用淀粉、纤维素、半纤维素或果胶作为碳源,则SSF方法可以是特别有吸引力的,其中可需要添加水解酶如纤维素酶、半纤维素酶或果胶酶以水解底物。
在用于制备甜菊醇糖苷的方法中使用的重组宿主可以是如上文所定义的任何合适的重组宿主。在所述方法中使用根据本发明的重组真核宿主可以是有利的,因为大多数真核细胞不需要用于繁殖的无菌条件并且对噬菌体感染不敏感。此外,真核宿主细胞可在低pH下生长以防止细菌污染。
根据本发明的重组宿主可以是兼性厌氧微生物。兼性厌氧重组宿主可以需氧方式繁殖至高细胞浓度。然后可在高细胞密度下进行这种厌氧阶段,这显著地降低了所需的发酵体积并且可使需氧微生物污染的风险最小化。
用于产生根据本发明的甜菊醇糖苷的发酵方法可以是需氧或厌氧发酵方法。
厌氧发酵方法可在本文中定义为在不存在氧的情况下运行或者基本上不消耗氧(优选小于5、2.5或1mmol/L/h),并且其中有机分子充当电子供体和电子受体两者的发酵方法。根据本发明的发酵方法也可首先在需氧条件下运行,且随后在厌氧条件下运行。
发酵方法也可在限氧或微需氧条件下进行。或者,发酵方法可首先在需氧条件下运行,且随后在限氧条件下运行。限氧发酵方法是其中氧消耗受到从气体到液体的氧传递的限制的过程。氧限制的程度由进入气流的量和组成以及所用发酵设备的实际混合/传质特性决定。
在根据本发明的方法中产生甜菊醇糖苷可在宿主细胞的生长阶段期间、固定(稳定状态)阶段期间或在两个阶段期间发生。在不同的温度下运行发酵方法可以是可行的。
用于产生甜菊醇糖苷的方法可在对于重组宿主来说最佳的温度下进行。对于每种转化的重组宿主而言,最佳生长温度可不同并且是本领域的技术人员已知的。最佳温度可高于野生型生物的最适温度以在非无菌条件下在最低感染敏感性和最低冷却成本的条件下有效生长生物体。或者,所述方法可在对于重组宿主的生长来说不是最佳的温度下进行。
用于产生根据本发明的甜菊醇糖苷的方法可在任何合适的pH值下进行。如果重组宿主是酵母,则发酵培养基中的pH优选具有低于6、优选低于5.5、优选低于5、优选低于4.5、优选低于4、优选低于pH 3.5或低于pH 3.0或低于pH 2.5、优选高于pH 2的值。在这些低pH值下进行发酵的优点是可防止发酵培养基中污染细菌的生长。
这种方法可在工业规模上进行。这种方法的产物是一种或多种甜菊醇糖苷,例如甜菊醇-13-单糖苷、甜菊醇-19-单糖苷、13-[(β-D-吡喃葡萄糖基)氧基)贝壳杉-16-烯-18-酸2-O-β-D-吡喃葡萄糖基-β-D-吡喃葡萄糖基酯、甜茶苷、甜菊苷、甜菊醇-19-双糖苷(steviol-19-diside)、甜菊醇双糖苷(steviolbioside)、莱鲍迪甙A、莱鲍迪甙E、莱鲍迪甙D或莱鲍迪甙M中的一种或更多种。
从发酵培养基中回收甜菊醇糖苷可通过本领域已知的方法进行,例如通过蒸馏、真空萃取、溶剂萃取或蒸发。
在用于产生根据本发明的甜菊醇糖苷的方法中,实现高于5mg/l发酵液、优选高于10mg/l、优选高于20mg/l、优选高于30mg/l发酵液、优选高于40mg/l、更优选高于50mg/l、优选高于60mg/l、优选高于70mg/l、优选高于80mg/l、优选高于100mg/l、优选高于1g/l、优选高于5g/l、优选高于10g/l的浓度是可行的,但通常低于70g/l。
本发明还提供了一种包含能够通过本发明的用于制备甜菊醇糖苷的方法获得的甜菊醇糖苷的发酵液。
在微生物内表达一种或多种甜菊醇糖苷的情况下,可需要处理此类细胞以释放甜菊醇糖苷。优选地,在细胞外产生至少一种甜菊醇糖苷,例如rebA、rebD或rebM。
与由其中表达参照多肽而非本发明多肽的重组宿主产生的发酵液相比,根据本发明的发酵液可包含多于至少一种甜菊醇糖苷,例如rebA、rebD或rebM。
与由其中表达参照多肽而非本发明多肽的重组宿主产生的发酵液相比,根据本发明的发酵液可包含更少的至少一种非甜菊醇糖苷,例如一种或多种贝壳杉烯酸糖苷。
本发明还提供了通过根据本发明的用于制备甜菊醇糖苷的方法获得的或能够从本发明的发酵液获得的甜菊醇糖苷。这种甜菊醇糖苷可以是非天然存在的甜菊醇糖苷,也就是说不在植物中产生的甜菊醇糖苷。
还提供了组合物,其包含两种或更多种通过根据本发明的用于制备甜菊醇糖苷的方法能够获得的或能够从本发明的发酵液获得的甜菊醇糖苷。在这种组合物中,一种或多种甜菊醇糖苷可以是非天然存在的甜菊醇糖苷,也就是说不在植物中产生的甜菊醇糖苷。
此外,本发明提供了一种将第一甜菊醇糖苷转化为第二甜菊醇糖苷的方法,所述方法包括:
-使所述第一甜菊醇糖苷与本发明的重组宿主、来源于所述重组宿主的无细胞提取物或来源于二者之一的酶制品接触;
-从而将所述第一甜菊醇糖苷转化为所述第二甜菊醇糖苷。
在这种方法中,第二甜菊醇糖苷可以是甜菊醇-19-双糖苷、甜菊醇双糖苷、甜菊苷、13-[(β-D-吡喃葡萄糖基)氧基)贝壳杉-16-烯-18-酸2-O-β-D-吡喃葡萄糖基-β-D-吡喃葡萄糖基酯、RebA、RebE或RebD。
在这种方法中,第一甜菊醇糖苷可以是甜菊醇-13-单糖苷、甜菊醇-19-单糖苷、甜茶苷、甜菊苷、莱鲍迪甙A或13-[(β-D-吡喃葡萄糖基)氧基)贝壳杉-16-烯-18-酸2-O-β-D-吡喃葡萄糖基-β-D-吡喃葡萄糖基酯,且第二糖基化二萜是甜菊醇-19-双糖苷、甜菊醇双糖苷、甜菊苷、13-[(β-D-吡喃葡萄糖基)氧基)贝壳杉-16-烯-18-酸2-O-β-D-吡喃葡萄糖基-β-D-吡喃葡萄糖基酯、RebA、RebE或RebD。
也就是说,本发明涉及生物转换方法或生物转化方法。
通过根据本发明的发酵方法产生的甜菊醇糖苷或组合物可用于对于此类化合物来说已知的任何应用中。特别地,它们可例如用作甜味剂,例如用于食品或饮料中。因此,根据本发明,提供了包含本发明的甜菊醇糖苷或组合物的食品、饲料或饮料。
例如,本发明的甜菊醇糖苷或组合物可被配制成软饮料、配制为桌面甜味剂、口香糖、乳制品如酸奶(例如原味酸奶)、蛋糕、谷物或基于谷类的食物、营养食品、药物、食用凝胶、糖果产品、化妆品、牙膏或其它口腔组合物等。此外,本发明的甜菊醇糖苷或组合物可用作甜味剂,不仅用于饮料、食品和其它专门用于人消费的产品,而且用于具有改进的特性的动物饲料和草料中。
因此,本发明尤其提供了包含根据本发明方法制备的甜菊醇糖苷的食品、饲料或饮料。
在食品、饮料、药物、化妆品、桌面产品、口香糖的制造过程中,可使用诸如混合、捏合、溶解、酸浸、渗透、渗滤、喷洒、雾化、灌注和其它方法的常规方法。
本发明的甜菊醇糖苷或组合物可以干或液体的形式使用。它可在食品热处理之前或之后加入。甜味剂的量取决于使用目的。它可单独添加或与其它化合物组合添加。
根据本发明的方法产生的化合物可与一种或多种其它非热量或热量甜味剂掺混。这种掺混可用于改进风味或时间特征或稳定性。广泛范围的非热量和热量甜味剂二者可适用于与本发明的甜菊醇糖苷或组合物掺混。例如,非热量甜味剂如罗汉果苷、莫纳甜、阿斯巴甜、安赛蜜盐、环磺酸盐、三氯蔗糖、糖精盐或赤藓糖醇。适用于与本发明的甜菊醇糖苷或组合物掺混的热量甜味剂包括糖醇和碳水化合物如蔗糖、葡萄糖、果糖和HFCS。还可使用甜味氨基酸,如甘氨酸、丙氨酸或丝氨酸。
本发明的甜菊醇糖苷或组合物可与甜味剂抑制剂如天然甜味剂抑制剂组合使用。它可与鲜味增强剂如氨基酸或其盐组合。
本发明的甜菊醇糖苷或组合物可与多元醇或糖醇、碳水化合物、生理活性物质或功能成分(例如类胡萝卜素、膳食纤维、脂肪酸、皂苷、抗氧化剂、营养品、类黄酮、异硫氰酸酯、苯酚、植物甾醇或甾烷醇(植物甾醇和植物甾烷醇)、多元醇、益生元、益生菌、植物雌激素、大豆蛋白、硫化物/硫醇、氨基酸、蛋白质、维生素、矿物质和/或基于健康益处如心血管、降胆固醇或抗炎分类的物质组合。
含有本发明的甜菊醇糖苷或组合物的组合物可包括调味剂、芳香组分、核苷酸、有机酸、有机酸盐、无机酸、苦味化合物、蛋白质或蛋白质水解产物、表面活性剂、类黄酮、收敛剂化合物、维生素、膳食纤维、抗氧化剂、脂肪酸和/或盐。
本发明的甜菊醇糖苷或组合物可作为高强度甜味剂应用,以产生具有改进的味道特征的零卡路里、低卡路里或糖尿病人用饮料和食品。它也可用于不能使用糖的饮料、食品、药物和其他产品中。
此外,本发明的甜菊醇糖苷或组合物可用作甜味剂,不仅用于饮料、食品和其它专门用于人消费的产品,而且用于具有改进的特性的动物饲料和草料中。
本发明的甜菊醇糖苷或组合物可用作甜味化合物的产品的实例可以是酒精饮料,如伏特加酒、葡萄酒、啤酒、烈酒、清酒等;天然果汁、提神饮料、碳酸软饮料、减肥饮料、零卡路里饮料、低卡路里饮料和食物、酸奶饮料、速溶果汁、速溶咖啡、粉末型速溶饮料、罐装产品、糖浆、发酵大豆酱、酱油、醋、调味品、蛋黄酱、番茄酱、咖喱、汤、速食肉汤、酱油粉、醋粉、多种类型的饼干、香米饼、咸饼干、面包、巧克力、焦糖、糖果、口香糖、果冻、布丁、蜜饯和腌菜、鲜奶油、果酱、橘子酱、糖花膏、奶粉、冰淇淋、冰糕、包装在瓶中的蔬菜和水果、罐装和煮熟的豆类、在甜味酱中煮熟的肉和食物、农业蔬菜食品、海鲜、火腿、香肠、鱼火腿、鱼香肠、鱼酱、油炸鱼制品、干制海产品、冷冻食品、腌渍海带、腊肉、烟草、医药产品等。原则上它可具有无限应用。
甜味组合物包括饮料,其非限制性实例包括非碳酸化和碳酸饮料,如可乐、姜汁汽水、根汁汽水、苹果汁、水果味软饮料(例如柑橘味软饮料,如柠檬莱姆或橙汁)、软饮料粉等;来自水果或蔬菜的果汁、包括榨汁等的果汁、含有果粒的果汁、水果饮料、果汁饮料、含果汁的饮料、具有水果调味料的饮料、蔬菜汁、含蔬菜的汁以及含水果和蔬菜的混合果汁;运动饮料、能量饮料、接近水的饮料等(例如具有天然或合成调味剂的水);茶类或喜欢型饮料如咖啡、可可、红茶、绿茶、乌龙茶等;含乳成分饮料如乳饮料、含乳成分咖啡、牛奶咖啡、奶茶、果奶饮料、饮用酸奶、乳酸菌饮料等;以及乳制品。
通常,甜味组合物中存在的甜味剂的量取决于甜味组合物的具体类型及其所需的甜度而广泛变化。本领域的普通技术人员可容易确定加入到甜味组合物中的甜味剂的适当量。
本发明的甜菊醇糖苷或组合物可以干或液体的形式使用。它可在食品热处理之前或之后加入。甜味剂的量取决于使用目的。它可单独添加或与其它化合物组合添加。
在食品、饮料、药物、化妆品、桌面产品、口香糖的制造过程中,可使用诸如混合、捏合、溶解、酸浸、渗透、渗滤、喷洒、雾化、灌注和其它方法的常规方法。
因此,本发明的组合物可通过本领域的技术人员已知的提供成分的均匀或均质混合物的任何方法来制备。这些方法包括干混、喷雾干燥、团聚、湿法制粒、压实、共结晶等。
呈固体形式时,本发明的甜菊醇糖苷或组合物可以适于递送到待甜化的食物中的任何形式提供给消费者,所述形式包括小袋、小包、散装袋或盒、方块、片剂、喷雾或可溶解的条。所述组合物可以单位剂量或散装形式递送。
对于液体甜味剂体系和组合物而言,应开发方便范围的流体、半流体、糊状和膏状形式、使用任何形状或形式的适当包装材料的适当包装,其便于携带或分配或储存或运输含有任何上述甜味剂产品或上述产生的产品的组合的任何组合。
所述组合物可包含多种填充剂、功能成分、着色剂、调味剂。
术语“序列同源性”或“序列同一性”在本文中可互换使用。出于本发明的目的,在此定义为了确定两个氨基酸序列或两个核酸序列的序列同源性或序列同一性的百分比,出于最佳比较目的比对所述序列。为了优化两个序列之间的比对,可在比较的两个序列中的任一个中引入空位。这种比对可在所比较的序列的全长上进行。或者,比对可在更短的长度上进行,例如在约20、约50、约100或更多个核酸/碱基或氨基酸上进行。序列同一性是在所报告的比对区域上两个序列之间的相同匹配的百分比。
两个序列之间的序列比较和序列同一性百分比的确定可使用数学算法来完成。本领域的技术人员将意识到以下事实:若干不同的计算机程序可用于比对两个序列并确定两个序列之间的同一性(Kruskal,J.B.(1983)An overview of sequence comparison InD.Sankoff and J.B.Kruskal,(编辑),Time warps,string edits and macromolecules:the theory and practice of sequence comparison,第1-44页Addison Wesley)。两个氨基酸序列之间或两个核苷酸序列之间的序列同一性百分比可使用用于两个序列的比对的Needleman和Wunsch算法来确定(Needleman,S.B.和Wunsch,C.D.(1970)J.Mol.Biol.48,443-453)。氨基酸序列和核苷酸序列两者均可通过所述算法进行比对。Needleman-Wunsch算法已在计算机程序NEEDLE中实现。出于本发明的目的,使用了来自EMBOSS包的NEEDLE程序(2.8.0版或更高版本,EMBOSS:The European Molecular Biology Open SoftwareSuite(2000)Rice,P.Longden,I.和Bleasby,A.Trends in Genetics 16,(6)第276-277页,http://emboss.bioinformatics.nl/)。对于蛋白质序列而言,EBLOSUM62用于取代矩阵。对于核苷酸序列而言,使用EDNAFULL。所使用的任选参数是空位开放罚分为10,以及空位延伸罚分为0.5。技术人员将理解的是,所有这些不同的参数将产生稍微不同的结果,但是当使用不同的算法时,两个序列的总体同一性百分比没有显著改变。
在通过如上所述的程序NEEDLE进行比对后,查询序列与本发明的序列之间的序列同一性的百分比计算如下:在两个序列中显示相同氨基酸或相同核苷酸的比对中的相应位置的数目除以在减去比对中的总空位数后比对的总长度。如本文定义的同一性可通过使用NOBRIEF选项从NEEDLE获得,并且在程序的输出中标记为“最长同一性”。
本发明的核酸和蛋白质序列可进一步用作“查询序列”以进行针对公共数据库的检索,以例如鉴定其它家族成员或相关序列。此类搜索可使用Altschul等人(1990)J.Mol.Biol.215:403—10的NBLAST和XBLAST程序(2.0版)进行。BLAST核苷酸搜索可用NBLAST程序(得分=100、字长=12)来进行,以获得与本发明的核酸分子同源的核苷酸序列。BLAST蛋白质搜索可用XBLAST程序(得分=50、字长=3)来进行,以获得与本发明的蛋白分子同源的氨基酸序列。为了获得用于比较目的的空位比对,可利用如在Altschul等人,(1997)Nucleic Acids Res.25(17):3389-3402中描述的空位BLAST。当利用BLAST和空位BLAST程序时,可使用相应程序(例如XBLAST和NBLAST)的默认参数。参见美国国家生物技术信息中心http://www.ncbi.nlm.nih.gov/的主页。
本发明的一些实施方式:
1.具有贝壳杉烯酸13-羟化酶活性的变体多肽,所述变体多肽包含这样的氨基酸序列,当与包含SEQ ID NO:1所示序列的贝壳杉烯酸13-羟化酶比对时,所述氨基酸序列包含至少一个对应于以下位置处的任何氨基酸的氨基酸残基的替换:
72、85、108、127、129、141、172、195、196、197、199、226、236、291、302、361或464
所述位置是参照SEQ ID NO:1限定的,并且其中所述变体与具有贝壳杉烯酸13-羟化酶活性的参照多肽相比具有一种或多种改变的性质。
2.根据实施方式1所述的变体多肽,其中所述改变的性质是改变的贝壳杉烯酸13-羟化酶活性。
3.根据实施方式1或2所述的变体多肽,其中所述参照多肽包含SEQ ID NO:1的贝壳杉烯酸13-羟化酶。
4.根据前述实施方式中任一种所述的变体多肽,其中所述变体多肽是非天然存在的多肽。
5.根据前述实施方式中任一种所述的变体多肽,除了实施方式1中限定的那些替换之外,其包含额外的替换。
6.根据前述实施方式中任一种所述的变体多肽,其与SEQ ID NO:1具有至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约97%、至少约98%或至少约99%的序列同一性。
7.变体多肽,任选地根据实施方式1-6中任一种所述的变体多肽,其具有贝壳杉烯酸13-羟化酶活性,包含与SEQ ID NO:3、5、7、9、11、13、15、17、19、21、23、25、27、29、31、33、35或37之任一具有至少约95%序列同一性、至少约96%、至少约97%、至少约98%或至少约99%序列同一性的氨基酸序列。
8.核酸,其包含编码根据前述权利要求中任一项所述的多肽的序列。
9.核酸构建体,其包含实施方式8所述的核酸,所述核酸与能够指导贝壳杉烯酸13-羟化酶在合适表达宿主中表达的一种或多种控制序列可操作地连接。
10.表达载体,其包含根据实施方式8所述的核酸或根据实施方式9所述的核酸构建体。
11.重组宿主,其包含根据实施方式8所述的核酸、根据实施方式9所述的核酸构建体或根据实施方式10所述的表达载体。
12.根据实施方式11所述的重组宿主,其能够产生甜菊醇或甜菊醇糖苷。
13.根据实施方式11或12所述的重组宿主,其包含一种或更多种编码以下多肽的重组核苷酸序列:
具有对映-柯巴基焦磷酸合酶活性的多肽;
具有对映-贝壳杉烯合酶活性的多肽;和
具有对映-贝壳杉烯氧化酶活性的多肽;以及任选地
具有贝壳杉烯酸13-羟化酶活性的多肽,其不同于根据实施方式1-7中任一种所述的变体多肽。
14.根据实施方式11-13中任一种所述的重组宿主,其包含编码具有NADPH-细胞色素p450还原酶活性的多肽的重组核酸序列。
15.根据实施方式1-14中任一种所述的重组宿主,其包含编码以下项中的一种或更多种的重组核酸序列:
(i)具有UGT74G1活性的多肽;
(ii)具有UGT2活性的多肽;
(iii)具有UGT85C2活性的多肽;和
(iv)具有UGT76G1活性的多肽。
16.根据实施方式11-15中任一种所述的重组宿主,其中所述宿主属于Saccharomyces、Aspergillus、Pichia、Kluyveromyces、Candida、Hansenula、Humicola、Issatchenkia、Trichosporon、Brettanomyces、Pachysolen、Yarrowia、Yamadazyma或Escherichia属中的一种。
17.根据实施方式16所述的重组宿主,其中所述重组宿主是Saccharomycescerevisiae细胞、Yarrowia lipolitica细胞、Candida krusei细胞、Issatchenkiaorientalis细胞或Escherichia coli细胞。
18.根据实施方式11-17中任一种所述的重组宿主,其中所述宿主产生香叶基香叶基二磷酸(GGPP)的能力被上调。
19.根据实施方式11-18中任一种所述的重组宿主,其包含编码以下项中的一种或多种的核酸序列:
具有羟甲基戊二酰基-辅酶A还原酶活性的多肽;
具有法尼基-焦磷酸合成酶活性的多肽;和
具有香叶基香叶基二磷酸合酶活性的多肽。
20.一种制备甜菊醇或甜菊醇糖苷的方法,所述方法包括在合适的发酵培养基中发酵根据实施方式11-19中任一种所述的重组宿主,以及任选地回收所述甜菊醇或甜菊醇糖苷。
21.根据实施方式20的任一项所述的制备甜菊醇糖苷的方法,其中所述方法以工业规模进行。
22.发酵液,其包含通过根据实施方式20或21所述的方法能够获得的甜菊醇糖苷。
23.通过根据实施方式20或21所述的方法获得的或者从根据实施方式22所述的发酵液获得的甜菊醇糖苷。
24.组合物,其包含两种或更多种通过根据实施方式20或21所述的方法获得的或从根据实施方式22所述的发酵液获得的甜菊醇糖苷。
25.食品、饲料或饮料,其包含根据实施方式23所述的甜菊醇糖苷或根据实施方式24所述的组合物。
26.一种将第一甜菊醇糖苷转化为第二甜菊醇糖苷的方法,所述方法包括:
-使所述第一甜菊醇糖苷与根据实施方式11-19中任一种所述的重组宿主、来源于所述重组宿主的无细胞提取物或来源于二者之一的酶制品接触;
-从而将所述第一甜菊醇糖苷转化为所述第二甜菊醇糖苷。
27.根据实施方式26所述的方法,其中所述第二甜菊醇糖苷是:甜菊醇-19-双糖苷、甜菊醇双糖苷、甜菊苷、RebA、RebE、RebD或RebM。
28.根据实施方式27所述的方法,其中所述第一甜菊醇糖苷是甜菊醇-13-单糖苷、甜菊醇-19-单糖苷、甜茶苷、甜菊苷、莱鲍迪甙A或13-[(β-D-吡喃葡萄糖基)氧基)贝壳杉-16-烯-18-酸2-O-β-D-吡喃葡萄糖基-β-D-吡喃葡萄糖基酯,且所述第二甜菊醇糖苷是甜菊醇-19-双糖苷、甜菊醇双糖苷、甜菊苷、RebA、RebE或RebD。
29.一种生产贝壳杉烯酸13-羟化酶的方法,所述方法包括:在适于生产贝壳杉烯酸13-羟化酶的条件下培养根据实施方式11所述的宿主细胞;和任选地,回收所述贝壳杉烯酸13-羟化酶。
在本文对专利文件或作为现有技术给出的其他材料的引用不应被认为承认该文件或材料是已知的或它包含的信息是任何这些权利要求的优先权日时公知常识的一部分。
在本文所述的每个参考文献的披露均通过引用以其全部内容并入本文。
本发明通过以下实施例来进一步说明:
实施例
概述
标准遗传技术(如在宿主细胞中过表达酶以及宿主细胞的另外遗传修饰)是本领域已知的方法,例如在Sambrook和Russel(2001)"Molecular Cloning:A LaboratoryManual(第3版),Cold Spring Harbor Laboratory,Cold Spring Harbor LaboratoryPress,或F.Ausubel等人编辑,"Current protocols in molecular biology",GreenPublishing and Wiley Interscience,New York (1987)中所描述的。用于真菌宿主细胞的转化和遗传修饰的方法从例如EP-A-0635574、WO 98/46772、WO 99/60102和WO 00/37671中获知。
实施例1.产生甜菊醇糖苷的Yarrowia lipolitica中的KAH变体表达
KAH的基因变体(参见下表1)作为合成构建体订购。通过使用II型限制酶将它们组装到含有强组成型启动子、KAH基因和终止子的表达盒中。类似地,构建用于CPR3(编码细胞色素P450还原酶)和NAT(编码诺尔丝菌素抗性)的表达盒。还构建了允许在Y.lipolytica中进行同源重组的整合侧翼。这些整合侧翼被称为5’INT1和3’INT1。不同部分含有50bp同源序列以允许在S.cerevisiae中通过同源重组进行组装。将这些部分连同也含有两个50bp同源序列的线性化pRS417目的载体(destination vector)一起转化到S.cerevisiae中。在S.cerevisiae中组装后,表达通路由5’INT1、CPR3表达盒、KAH表达盒、NAT表达盒、3’INT1组成。
表1.KAH基因变体
Figure BDA0001616682560000411
从S.cerevisiae中分离含有所述表达通路的质粒,并PCR扩增该表达通路。将经纯化的PCR产物转化到Y.lipolytica菌株STV2186中。STV2186菌株已经具有用于产生甜菊醇糖苷的所有元件。该菌株的基因构成如下表2所示。申请WO2013/110673和WO2015/007748中已经更详细地描述了类似的菌株。该菌株含有ku70基因的破坏,以提高靶向整合效率。
表2.菌株STV2186的基因型。括号内指出了菌株中存在的基因拷贝数
Figure BDA0001616682560000412
实施例2.糖基化的贝壳杉烯酸和甜菊醇糖苷的产生
将用不同KAH变体转化的STV2186涂布在含有诺尔丝菌素的YPhD板上,获得单菌落分离物,并进行产生试验:用来自含有诺尔丝菌素的YEPh-D琼脂板的菌落物质接种200μl含葡萄糖的YEP作为预培养物。将预培养物在30℃、750rpm和80%湿度的Infors培养箱中孵育72小时。使用40μl预培养物接种2.5ml含有葡萄糖作为碳源的矿物培养基。将这些生产培养物在30℃、550rpm、80%湿度的Infors培养箱中孵育120小时。通过以3000xg离心10分钟使生产培养物沉淀。离心后,转移上清液并在33%乙腈中稀释,并使用LC/MS分析甜菊醇、甜菊醇糖苷、贝壳杉烯酸(KA)和糖基化贝壳杉烯酸(KA-糖苷)。
我们发现:表达KAH4_m4的菌株产生更高滴度的莱鲍迪甙A和其他甜菊醇糖苷。KA-糖苷的量明显更低。因此,期望产物(甜菊醇糖苷)与不期望的副产物(KA-糖苷)的比值增加为大于2倍。结果概述请参见表3。
表3.KA-糖苷和甜菊醇糖苷的产生。值代表至少4个独立转化株的平均值
Figure BDA0001616682560000421
甜菊醇糖苷的总和包括甜菊醇-13-单糖苷、甜菊醇-19-单糖苷、甜菊醇双糖苷、甜茶苷、莱鲍迪甙B、甜菊苷、莱鲍迪甙A、莱鲍迪甙E、莱鲍迪甙D和莱鲍迪甙M。KA-糖苷的总和包括KA-19-单葡糖苷、KA-19-二葡糖苷和KA-19-三葡糖苷。
实施例3.在生物反应器中生产糖基化的贝壳杉烯酸和甜菊醇糖苷
在含有50ml矿物培养基的500mL摇瓶中在30℃和280rpm下培养如上所述构建的酵母菌株3天。随后,将6ml摇瓶的内容物转移到起始体积为0.3L的发酵罐中。通过加入氨(12.5重量%)将pH控制在5.0。将温度控制在30℃。通过控制到发酵罐的葡萄糖进料来限制葡萄糖浓度。摇瓶和发酵的矿物培养基基于Verduyn等(Verduyn C,Postma E,ScheffersWA,Van Dijken JP.Yeast,1992Jul;8(7):501-517)。在水和33%乙腈中稀释培养液样品并利用LC/MS分析。
表4.相对于STV2016+KAH4+CPR菌株,KA-糖苷和甜菊醇糖苷的相对产生
Figure BDA0001616682560000422
甜菊醇糖苷的总和包括甜菊醇、甜菊醇-13-单糖苷、甜菊醇-19-单糖苷、甜菊醇双糖苷、甜茶苷、莱鲍迪甙B、甜菊苷、莱鲍迪甙A、莱鲍迪甙E、莱鲍迪甙D和莱鲍迪甙M。KA-糖苷的总和包括KA-19-单葡糖苷、KA-19-二葡糖苷和KA-19-三葡糖苷。
我们观察到:当表达KAH4_m4时,甜菊醇糖苷的量增加了40%。此外,KA-糖苷的量减少了约50%。因此,与表达KAH4相比,表达KAH4_m4改善了期望产物(例如RebA、RebM和其他甜菊醇糖苷)的形成,同时减少了不期望的KA-糖苷的形成。表达KAH4_m4提高了基于糖的产物产率。
实施例4.产生甜菊醇糖苷的Yarrowia lipolitica中的KAH变体表达
独立地并利用一些组合相对于KAH4检测KAH4_m4变体包含的突变。KAH4的基因变体(参见下表5)在DNA2.0作为载体中的克隆基因订购,其包含INT3整合侧翼(其允许在Y.lipolytica中进行同源重组)以及KAH4和HygB(编码潮霉素抗性)的启动子-开放阅读框-终止子。质粒图谱见图3。
表5.KAH基因变体
Figure BDA0001616682560000431
Figure BDA0001616682560000441
从质粒PCR扩增含有整合侧翼、KAH和HygB表达盒的表达通路。将经纯化的PCR产物转化到Y.lipolytica菌株STV2226中,并选择潮霉素抗性菌落。STV2226菌株已经表达了甜菊醇糖苷产生所需的所有基因(除了KAH),以产生甜菊醇糖苷。该菌株的基因构成如下表6所示。专利申请号WO2013/110673和WO2015/007748中已经更详细地描述了类似菌株的构建。STV2226菌株在ku70基因中含有1658bp的内部缺失,以提高靶向整合效率。
表6.菌株STV2226的基因型。括号内指出了菌株中存在的基因拷贝数
Figure BDA0001616682560000442
实施例5.表达KAH变体的菌株中糖基化的贝壳杉烯酸和甜菊醇糖苷的产生
将用不同KAH变体转化的STV2226涂布在含有潮霉素的YPhD板上,获得单菌落分离物,并进行产生试验:用来自含有潮霉素的YEPh-D琼脂板的菌落物质接种200μl含葡萄糖的YEP作为预培养物。将预培养物在30℃、750rpm和80%湿度的Infors培养箱中孵育72小时。使用40μl预培养物接种2.5ml含有葡萄糖作为碳源的矿物培养基。将这些生产培养物在30℃、550rpm、80%湿度的Infors培养箱中孵育120小时。通过以3000xg离心10分钟使生产培养物沉淀。离心后,转移上清液并在33%乙腈中稀释,并使用LC/MS分析甜菊醇、甜菊醇糖苷、贝壳杉烯酸(KA)和糖基化贝壳杉烯酸(KA-糖苷)。为了表示数据,将莱鲍迪甙A和甜菊醇糖苷的滴度(mM)归一化为利用转化了KAH4(SEQ ID NO:2)的STV2226获得的滴度。结果概述请参见表7。
表7.KA-糖苷和甜菊醇糖苷的产生。值对于大多数变体而言代表约九个重复的平 均值,且对于所有变体而言至少代表两个重复的平均值。将莱鲍迪甙A和甜菊醇糖苷归一化 为用转化了KAH4的菌株STV2226中的产生。
Figure BDA0001616682560000451
甜菊醇糖苷的总和包括甜菊醇-13-单糖苷、甜菊醇-19-单糖苷、甜菊醇双糖苷、甜茶苷、莱鲍迪甙B、甜菊苷、莱鲍迪甙A、莱鲍迪甙E、莱鲍迪甙D和莱鲍迪甙M。KA-糖苷的总和包括KA-19-单葡糖苷、KA-19-二葡糖苷和KA-19-三葡糖苷。
表达表5的KAH4变体的菌株产生更高滴度的莱鲍迪甙A和其他甜菊醇糖苷。一些变体的表达导致莱鲍迪甙A和总甜菊醇糖苷产生提高超过60%。对于所有变体,期望产物(甜菊醇糖苷)与不期望的副产物(KA-糖苷)的比值均增加;对于一些变体,所述比值甚至增加到>2倍。这些结果说明:对于生产甜菊醇糖苷,KAH4_p1-17酶优于来自A.thaliana的野生型KAH4。
序列表
<110> 帝斯曼知识产权资产管理有限公司
<120> 贝壳杉烯酸羟化酶
<130> 31488-WO-PCT
<150> US 62/237,203
<151> 2015-10-05
<150> EP 16183457.7
<151> 2016-08-09
<160> 49
<170> PatentIn version 3.5
<210> 1
<211> 525
<212> PRT
<213> Arabidopsis thaliana
<400> 1
Met Glu Ser Leu Val Val His Thr Val Asn Ala Ile Trp Cys Ile Val
1 5 10 15
Ile Val Gly Ile Phe Ser Val Gly Tyr His Val Tyr Gly Arg Ala Val
20 25 30
Val Glu Gln Trp Arg Met Arg Arg Ser Leu Lys Leu Gln Gly Val Lys
35 40 45
Gly Pro Pro Pro Ser Ile Phe Asn Gly Asn Val Ser Glu Met Gln Arg
50 55 60
Ile Gln Ser Glu Ala Lys His Cys Ser Gly Asp Asn Ile Ile Ser His
65 70 75 80
Asp Tyr Ser Ser Ser Leu Phe Pro His Phe Asp His Trp Arg Lys Gln
85 90 95
Tyr Gly Arg Ile Tyr Thr Tyr Ser Thr Gly Leu Lys Gln His Leu Tyr
100 105 110
Ile Asn His Pro Glu Met Val Lys Glu Leu Ser Gln Thr Asn Thr Leu
115 120 125
Asn Leu Gly Arg Ile Thr His Ile Thr Lys Arg Leu Asn Pro Ile Leu
130 135 140
Gly Asn Gly Ile Ile Thr Ser Asn Gly Pro His Trp Ala His Gln Arg
145 150 155 160
Arg Ile Ile Ala Tyr Glu Phe Thr His Asp Lys Ile Lys Gly Met Val
165 170 175
Gly Leu Met Val Glu Ser Ala Met Pro Met Leu Asn Lys Trp Glu Glu
180 185 190
Met Val Lys Arg Gly Gly Glu Met Gly Cys Asp Ile Arg Val Asp Glu
195 200 205
Asp Leu Lys Asp Val Ser Ala Asp Val Ile Ala Lys Ala Cys Phe Gly
210 215 220
Ser Ser Phe Ser Lys Gly Lys Ala Ile Phe Ser Met Ile Arg Asp Leu
225 230 235 240
Leu Thr Ala Ile Thr Lys Arg Ser Val Leu Phe Arg Phe Asn Gly Phe
245 250 255
Thr Asp Met Val Phe Gly Ser Lys Lys His Gly Asp Val Asp Ile Asp
260 265 270
Ala Leu Glu Met Glu Leu Glu Ser Ser Ile Trp Glu Thr Val Lys Glu
275 280 285
Arg Glu Ile Glu Cys Lys Asp Thr His Lys Lys Asp Leu Met Gln Leu
290 295 300
Ile Leu Glu Gly Ala Met Arg Ser Cys Asp Gly Asn Leu Trp Asp Lys
305 310 315 320
Ser Ala Tyr Arg Arg Phe Val Val Asp Asn Cys Lys Ser Ile Tyr Phe
325 330 335
Ala Gly His Asp Ser Thr Ala Val Ser Val Ser Trp Cys Leu Met Leu
340 345 350
Leu Ala Leu Asn Pro Ser Trp Gln Val Lys Ile Arg Asp Glu Ile Leu
355 360 365
Ser Ser Cys Lys Asn Gly Ile Pro Asp Ala Glu Ser Ile Pro Asn Leu
370 375 380
Lys Thr Val Thr Met Val Ile Gln Glu Thr Met Arg Leu Tyr Pro Pro
385 390 395 400
Ala Pro Ile Val Gly Arg Glu Ala Ser Lys Asp Ile Arg Leu Gly Asp
405 410 415
Leu Val Val Pro Lys Gly Val Cys Ile Trp Thr Leu Ile Pro Ala Leu
420 425 430
His Arg Asp Pro Glu Ile Trp Gly Pro Asp Ala Asn Asp Phe Lys Pro
435 440 445
Glu Arg Phe Ser Glu Gly Ile Ser Lys Ala Cys Lys Tyr Pro Gln Ser
450 455 460
Tyr Ile Pro Phe Gly Leu Gly Pro Arg Thr Cys Val Gly Lys Asn Phe
465 470 475 480
Gly Met Met Glu Val Lys Val Leu Val Ser Leu Ile Val Ser Lys Phe
485 490 495
Ser Phe Thr Leu Ser Pro Thr Tyr Gln His Ser Pro Ser His Lys Leu
500 505 510
Leu Val Glu Pro Gln His Gly Val Val Ile Arg Val Val
515 520 525
<210> 2
<211> 1578
<212> DNA
<213> Artificial sequence
<220>
<223> kaurenoic acid 13-hydroxylase from Arabidopsis thaliana,
codon-pair optimized for expression in Yarrowia lipolitica.
<400> 2
atggagtctc tggttgtcca caccgtcaac gccatctggt gcattgtcat tgtcggtatc 60
ttctccgtcg gctaccacgt ctacggccga gctgttgtcg agcagtggcg aatgcgacga 120
tctctcaagc tccagggtgt caagggtcct cctccctcca tcttcaacgg taacgtttcc 180
gagatgcagc gaatccagtc cgaggccaag cactgctccg gtgacaacat catctcccac 240
gactactctt cttctctgtt cccccacttt gaccactggc gaaagcagta cggccgaatc 300
tacacctact ccactggcct caagcagcac ctctacatca accaccccga gatggtcaag 360
gagctctccc agaccaacac cctcaacctc ggccgaatca cccacatcac caagcgactc 420
aaccccattc tcggtaacgg tatcatcacc tccaacggcc cccactgggc ccaccagcga 480
cgaatcattg cctacgagtt cacccacgac aagatcaagg gtatggtcgg tctgatggtc 540
gagtccgcca tgcccatgct caacaagtgg gaggagatgg tcaagcgagg tggtgagatg 600
ggctgtgaca tccgagtcga cgaggacctc aaggatgtct ccgctgacgt cattgccaag 660
gcctgtttcg gctcttcctt ctccaagggc aaggccatct tctccatgat ccgagatctg 720
ctcaccgcca tcaccaagcg atccgtcctc ttccgattca acggtttcac cgacatggtt 780
ttcggctcca agaagcacgg tgacgttgac attgacgctc tcgagatgga gctcgagtcc 840
tccatctggg agactgtcaa ggagcgagag attgagtgca aggacaccca caagaaggac 900
ctcatgcagc tcattctcga gggtgccatg cgatcttgtg acggtaacct gtgggacaag 960
tctgcttacc gacgattcgt tgtcgacaac tgcaagtcca tctactttgc cggccacgac 1020
tccaccgccg tttccgtttc ttggtgcctc atgctgctcg ctctcaaccc ctcttggcag 1080
gtcaagatcc gagatgagat tctgtcctcc tgcaagaacg gtatccccga cgccgagtcc 1140
atccccaacc tcaagaccgt caccatggtc atccaggaga ctatgcgact ctaccctccc 1200
gctcccattg tcggccgaga ggcctccaag gacattcgac tcggtgatct ggttgtcccc 1260
aagggtgtct gtatctggac cctcatcccc gctctgcacc gagatcccga gatctggggt 1320
cccgacgcca acgacttcaa gcccgagcga ttctccgagg gtatctccaa ggcctgcaag 1380
tacccccagt cctacatccc ctttggcctc ggcccccgaa cctgtgtcgg caagaacttt 1440
ggtatgatgg aggtcaaggt cctcgtttct ctgattgtct ccaagttctc cttcactctg 1500
tctcccacct accagcactc tccctcccac aagctgctcg tcgagcccca gcacggtgtt 1560
gtcatccgag ttgtataa 1578
<210> 3
<211> 525
<212> PRT
<213> Artificial sequence
<220>
<223> Variant kaurenoic acid 13-hydroxylase
<400> 3
Met Glu Ser Leu Val Val His Thr Val Asn Ala Ile Trp Cys Ile Val
1 5 10 15
Ile Val Gly Ile Phe Ser Val Gly Tyr His Val Tyr Gly Arg Ala Val
20 25 30
Val Glu Gln Trp Arg Met Arg Arg Ser Leu Lys Leu Gln Gly Val Lys
35 40 45
Gly Pro Pro Pro Ser Ile Phe Asn Gly Asn Val Ser Glu Met Gln Arg
50 55 60
Ile Gln Ser Glu Ala Lys His Asn Ser Gly Asp Asn Ile Ile Ser His
65 70 75 80
Asp Tyr Ser Ser Thr Leu Phe Pro His Phe Asp His Trp Arg Lys Gln
85 90 95
Tyr Gly Arg Ile Tyr Thr Tyr Ser Thr Gly Leu Arg Gln His Leu Tyr
100 105 110
Ile Asn His Pro Glu Met Val Lys Glu Leu Ser Gln Thr Asn Ser Leu
115 120 125
Asp Leu Gly Arg Ile Thr His Ile Thr Lys Arg Leu Ala Pro Ile Leu
130 135 140
Gly Asn Gly Ile Ile Thr Ser Asn Gly Pro His Trp Ala His Gln Arg
145 150 155 160
Arg Ile Ile Ala Tyr Glu Phe Thr His Asp Lys Val Lys Gly Met Val
165 170 175
Gly Leu Met Val Glu Ser Ala Met Pro Met Leu Asn Lys Trp Glu Glu
180 185 190
Met Val Glu Ala Glu Gly Gly Met Gly Cys Asp Ile Arg Val Asp Glu
195 200 205
Asp Leu Lys Asp Val Ser Ala Asp Val Ile Ala Lys Ala Cys Phe Gly
210 215 220
Ser Asn Phe Ser Lys Gly Lys Ala Ile Phe Ser Lys Ile Arg Asp Leu
225 230 235 240
Leu Thr Ala Ile Thr Lys Arg Ser Val Leu Phe Arg Phe Asn Gly Phe
245 250 255
Thr Asp Met Val Phe Gly Ser Lys Lys His Gly Asp Val Asp Ile Asp
260 265 270
Ala Leu Glu Met Glu Leu Glu Ser Ser Ile Trp Glu Thr Val Lys Glu
275 280 285
Arg Glu Arg Glu Cys Lys Asp Thr His Lys Lys Asp Leu Leu Gln Leu
290 295 300
Ile Leu Glu Gly Ala Met Arg Ser Cys Asp Gly Asn Leu Trp Asp Lys
305 310 315 320
Ser Ala Tyr Arg Arg Phe Val Val Asp Asn Cys Lys Ser Ile Tyr Phe
325 330 335
Ala Gly His Asp Ser Thr Ala Val Ser Val Ser Trp Cys Leu Met Leu
340 345 350
Leu Ala Leu Asn Pro Ser Trp Gln Glu Lys Ile Arg Asp Glu Ile Leu
355 360 365
Ser Ser Cys Lys Asn Gly Ile Pro Asp Ala Glu Ser Ile Pro Asn Leu
370 375 380
Lys Thr Val Thr Met Val Ile Gln Glu Thr Met Arg Leu Tyr Pro Pro
385 390 395 400
Ala Pro Ile Val Gly Arg Glu Ala Ser Lys Asp Ile Arg Leu Gly Asp
405 410 415
Leu Val Val Pro Lys Gly Val Cys Ile Trp Thr Leu Ile Pro Ala Leu
420 425 430
His Arg Asp Pro Glu Ile Trp Gly Pro Asp Ala Asn Asp Phe Lys Pro
435 440 445
Glu Arg Phe Ser Glu Gly Ile Ser Lys Ala Cys Lys Tyr Pro Gln Ala
450 455 460
Tyr Ile Pro Phe Gly Leu Gly Pro Arg Thr Cys Val Gly Lys Asn Phe
465 470 475 480
Gly Met Met Glu Val Lys Val Leu Val Ser Leu Ile Val Ser Lys Phe
485 490 495
Ser Phe Thr Leu Ser Pro Thr Tyr Gln His Ser Pro Ser His Lys Leu
500 505 510
Leu Val Glu Pro Gln His Gly Val Val Ile Arg Val Val
515 520 525
<210> 4
<211> 1578
<212> DNA
<213> Artificial sequence
<220>
<223> Variant kaurenoic acid 13-hydroxylase sequence CpO for expression
in Yarrowia lipolitica
<400> 4
atggagtctc tggttgtcca caccgtcaac gccatctggt gcattgtcat tgtcggtatc 60
ttctccgtcg gctaccacgt ctacggccga gccgttgtcg agcagtggcg aatgcgacga 120
tctctcaagc tccagggtgt caagggtcct cctccctcca tcttcaacgg taacgtttcc 180
gagatgcagc gaatccagtc cgaggccaag cacaactccg gtgacaacat catctcccac 240
gactactcct ccactctctt cccccacttt gaccactggc gaaagcagta cggccgaatc 300
tacacctact ccaccggtct gcgacagcac ctctacatca accaccccga gatggtcaag 360
gaactgtccc agaccaactc tctcgatctc ggtcgaatca cccacatcac caagcgactc 420
gcccccattc tcggcaacgg tatcatcacc tccaacggcc cccactgggc ccaccagcga 480
cgaatcattg cttacgagtt cacccacgac aaggtcaagg gtatggtcgg cctcatggtc 540
gagtccgcca tgcccatgct caacaagtgg gaggagatgg tcgaggctga gggtggtatg 600
ggctgtgaca tccgagtcga cgaggacctc aaggacgttt ctgccgatgt cattgccaag 660
gcctgctttg gctccaactt ctccaagggc aaggccattt tctccaagat ccgagatctg 720
ctcaccgcca ttaccaagcg atccgtcctc ttccgattca acggtttcac cgacatggtt 780
ttcggctcca agaagcacgg tgacgttgac attgatgctc tcgagatgga gctggagtcc 840
tccatctggg agactgtcaa ggagcgagag cgagagtgca aggacaccca caagaaggac 900
ctcctccagc tcattctcga gggtgccatg cgatcttgtg acggtaacct gtgggacaag 960
tccgcctacc gacgatttgt tgttgacaac tgcaagtcca tctactttgc cggccacgac 1020
tccaccgccg tttctgtctc ttggtgcctc atgctgctgg ctctcaaccc ctcttggcag 1080
gagaagatcc gtgacgagat tctctcttct tgtaagaacg gtatccccga tgctgagtcc 1140
atccccaacc tcaagaccgt caccatggtc atccaggaga ctatgcgact ctaccctccc 1200
gctcccattg tcggccgaga ggcctccaag gacatccgac tcggtgatct cgttgtcccc 1260
aagggtgtct gcatctggac cctcatcccc gctctgcacc gggaccccga aatctggggc 1320
cccgacgcca acgacttcaa gcccgagcga ttctccgagg gtatctccaa ggcttgcaag 1380
tacccccagg cctacatccc cttcggtctg ggcccccgaa cctgtgtcgg caagaacttc 1440
ggtatgatgg aggtcaaggt ccttgtctct ctcattgtct ccaagttctc cttcactctg 1500
tctcccacct accagcactc tccctcccac aagctcctcg ttgagcccca gcacggtgtt 1560
gtcatccgag tggtgtaa 1578
<210> 5
<211> 525
<212> PRT
<213> Artificial sequence
<220>
<223> Variant kaurenoic acid 13-hydroxylase
<400> 5
Met Glu Ser Leu Val Val His Thr Val Asn Ala Ile Trp Cys Ile Val
1 5 10 15
Ile Val Gly Ile Phe Ser Val Gly Tyr His Val Tyr Gly Arg Ala Val
20 25 30
Val Glu Gln Trp Arg Met Arg Arg Ser Leu Lys Leu Gln Gly Val Lys
35 40 45
Gly Pro Pro Pro Ser Ile Phe Asn Gly Asn Val Ser Glu Met Gln Arg
50 55 60
Ile Gln Ser Glu Ala Lys His Asn Ser Gly Asp Asn Ile Ile Ser His
65 70 75 80
Asp Tyr Ser Ser Ser Leu Phe Pro His Phe Asp His Trp Arg Lys Gln
85 90 95
Tyr Gly Arg Ile Tyr Thr Tyr Ser Thr Gly Leu Lys Gln His Leu Tyr
100 105 110
Ile Asn His Pro Glu Met Val Lys Glu Leu Ser Gln Thr Asn Thr Leu
115 120 125
Asn Leu Gly Arg Ile Thr His Ile Thr Lys Arg Leu Asn Pro Ile Leu
130 135 140
Gly Asn Gly Ile Ile Thr Ser Asn Gly Pro His Trp Ala His Gln Arg
145 150 155 160
Arg Ile Ile Ala Tyr Glu Phe Thr His Asp Lys Ile Lys Gly Met Val
165 170 175
Gly Leu Met Val Glu Ser Ala Met Pro Met Leu Asn Lys Trp Glu Glu
180 185 190
Met Val Lys Arg Gly Gly Glu Met Gly Cys Asp Ile Arg Val Asp Glu
195 200 205
Asp Leu Lys Asp Val Ser Ala Asp Val Ile Ala Lys Ala Cys Phe Gly
210 215 220
Ser Ser Phe Ser Lys Gly Lys Ala Ile Phe Ser Met Ile Arg Asp Leu
225 230 235 240
Leu Thr Ala Ile Thr Lys Arg Ser Val Leu Phe Arg Phe Asn Gly Phe
245 250 255
Thr Asp Met Val Phe Gly Ser Lys Lys His Gly Asp Val Asp Ile Asp
260 265 270
Ala Leu Glu Met Glu Leu Glu Ser Ser Ile Trp Glu Thr Val Lys Glu
275 280 285
Arg Glu Ile Glu Cys Lys Asp Thr His Lys Lys Asp Leu Met Gln Leu
290 295 300
Ile Leu Glu Gly Ala Met Arg Ser Cys Asp Gly Asn Leu Trp Asp Lys
305 310 315 320
Ser Ala Tyr Arg Arg Phe Val Val Asp Asn Cys Lys Ser Ile Tyr Phe
325 330 335
Ala Gly His Asp Ser Thr Ala Val Ser Val Ser Trp Cys Leu Met Leu
340 345 350
Leu Ala Leu Asn Pro Ser Trp Gln Val Lys Ile Arg Asp Glu Ile Leu
355 360 365
Ser Ser Cys Lys Asn Gly Ile Pro Asp Ala Glu Ser Ile Pro Asn Leu
370 375 380
Lys Thr Val Thr Met Val Ile Gln Glu Thr Met Arg Leu Tyr Pro Pro
385 390 395 400
Ala Pro Ile Val Gly Arg Glu Ala Ser Lys Asp Ile Arg Leu Gly Asp
405 410 415
Leu Val Val Pro Lys Gly Val Cys Ile Trp Thr Leu Ile Pro Ala Leu
420 425 430
His Arg Asp Pro Glu Ile Trp Gly Pro Asp Ala Asn Asp Phe Lys Pro
435 440 445
Glu Arg Phe Ser Glu Gly Ile Ser Lys Ala Cys Lys Tyr Pro Gln Ser
450 455 460
Tyr Ile Pro Phe Gly Leu Gly Pro Arg Thr Cys Val Gly Lys Asn Phe
465 470 475 480
Gly Met Met Glu Val Lys Val Leu Val Ser Leu Ile Val Ser Lys Phe
485 490 495
Ser Phe Thr Leu Ser Pro Thr Tyr Gln His Ser Pro Ser His Lys Leu
500 505 510
Leu Val Glu Pro Gln His Gly Val Val Ile Arg Val Val
515 520 525
<210> 6
<211> 1578
<212> DNA
<213> Artificial sequence
<220>
<223> Variant kaurenoic acid 13-hydroxylase sequence CpO for expression
in Yarrowia lipolitica
<400> 6
atggagtctc tggttgtcca caccgtcaac gccatctggt gcattgtcat tgtcggtatc 60
ttctccgtcg gctaccacgt ctacggccga gctgttgtcg agcagtggcg aatgcgacga 120
tctctcaagc tccagggtgt caagggtcct cctccctcca tcttcaacgg taacgtttcc 180
gagatgcagc gaatccagtc cgaggccaag cacaactccg gtgacaacat catctcccac 240
gactactctt cttctctgtt cccccacttt gaccactggc gaaagcagta cggccgaatc 300
tacacctact ccactggcct caagcagcac ctctacatca accaccccga gatggtcaag 360
gagctctccc agaccaacac cctcaacctc ggccgaatca cccacatcac caagcgactc 420
aaccccattc tcggtaacgg tatcatcacc tccaacggcc cccactgggc ccaccagcga 480
cgaatcattg cctacgagtt cacccacgac aagatcaagg gtatggtcgg tctgatggtc 540
gagtccgcca tgcccatgct caacaagtgg gaggagatgg tcaagcgagg tggtgagatg 600
ggctgtgaca tccgagtcga cgaggacctc aaggatgtct ccgctgacgt cattgccaag 660
gcctgtttcg gctcttcctt ctccaagggc aaggccatct tctccatgat ccgagatctg 720
ctcaccgcca tcaccaagcg atccgtcctc ttccgattca acggtttcac cgacatggtt 780
ttcggctcca agaagcacgg tgacgttgac attgacgctc tcgagatgga gctcgagtcc 840
tccatctggg agactgtcaa ggagcgagag attgagtgca aggacaccca caagaaggac 900
ctcatgcagc tcattctcga gggtgccatg cgatcttgtg acggtaacct gtgggacaag 960
tctgcttacc gacgattcgt tgtcgacaac tgcaagtcca tctactttgc cggccacgac 1020
tccaccgccg tttccgtttc ttggtgcctc atgctgctcg ctctcaaccc ctcttggcag 1080
gtcaagatcc gagatgagat tctgtcctcc tgcaagaacg gtatccccga cgccgagtcc 1140
atccccaacc tcaagaccgt caccatggtc atccaggaga ctatgcgact ctaccctccc 1200
gctcccattg tcggccgaga ggcctccaag gacattcgac tcggtgatct ggttgtcccc 1260
aagggtgtct gtatctggac cctcatcccc gctctgcacc gagatcccga gatctggggt 1320
cccgacgcca acgacttcaa gcccgagcga ttctccgagg gtatctccaa ggcctgcaag 1380
tacccccagt cctacatccc ctttggcctc ggcccccgaa cctgtgtcgg caagaacttt 1440
ggtatgatgg aggtcaaggt cctcgtttct ctgattgtct ccaagttctc cttcactctg 1500
tctcccacct accagcactc tccctcccac aagctgctcg tcgagcccca gcacggtgtt 1560
gtcatccgag ttgtataa 1578
<210> 7
<211> 525
<212> PRT
<213> Artificial sequence
<220>
<223> Variant kaurenoic acid 13-hydroxylase
<400> 7
Met Glu Ser Leu Val Val His Thr Val Asn Ala Ile Trp Cys Ile Val
1 5 10 15
Ile Val Gly Ile Phe Ser Val Gly Tyr His Val Tyr Gly Arg Ala Val
20 25 30
Val Glu Gln Trp Arg Met Arg Arg Ser Leu Lys Leu Gln Gly Val Lys
35 40 45
Gly Pro Pro Pro Ser Ile Phe Asn Gly Asn Val Ser Glu Met Gln Arg
50 55 60
Ile Gln Ser Glu Ala Lys His Cys Ser Gly Asp Asn Ile Ile Ser His
65 70 75 80
Asp Tyr Ser Ser Thr Leu Phe Pro His Phe Asp His Trp Arg Lys Gln
85 90 95
Tyr Gly Arg Ile Tyr Thr Tyr Ser Thr Gly Leu Lys Gln His Leu Tyr
100 105 110
Ile Asn His Pro Glu Met Val Lys Glu Leu Ser Gln Thr Asn Thr Leu
115 120 125
Asn Leu Gly Arg Ile Thr His Ile Thr Lys Arg Leu Asn Pro Ile Leu
130 135 140
Gly Asn Gly Ile Ile Thr Ser Asn Gly Pro His Trp Ala His Gln Arg
145 150 155 160
Arg Ile Ile Ala Tyr Glu Phe Thr His Asp Lys Ile Lys Gly Met Val
165 170 175
Gly Leu Met Val Glu Ser Ala Met Pro Met Leu Asn Lys Trp Glu Glu
180 185 190
Met Val Lys Arg Gly Gly Glu Met Gly Cys Asp Ile Arg Val Asp Glu
195 200 205
Asp Leu Lys Asp Val Ser Ala Asp Val Ile Ala Lys Ala Cys Phe Gly
210 215 220
Ser Ser Phe Ser Lys Gly Lys Ala Ile Phe Ser Met Ile Arg Asp Leu
225 230 235 240
Leu Thr Ala Ile Thr Lys Arg Ser Val Leu Phe Arg Phe Asn Gly Phe
245 250 255
Thr Asp Met Val Phe Gly Ser Lys Lys His Gly Asp Val Asp Ile Asp
260 265 270
Ala Leu Glu Met Glu Leu Glu Ser Ser Ile Trp Glu Thr Val Lys Glu
275 280 285
Arg Glu Ile Glu Cys Lys Asp Thr His Lys Lys Asp Leu Met Gln Leu
290 295 300
Ile Leu Glu Gly Ala Met Arg Ser Cys Asp Gly Asn Leu Trp Asp Lys
305 310 315 320
Ser Ala Tyr Arg Arg Phe Val Val Asp Asn Cys Lys Ser Ile Tyr Phe
325 330 335
Ala Gly His Asp Ser Thr Ala Val Ser Val Ser Trp Cys Leu Met Leu
340 345 350
Leu Ala Leu Asn Pro Ser Trp Gln Val Lys Ile Arg Asp Glu Ile Leu
355 360 365
Ser Ser Cys Lys Asn Gly Ile Pro Asp Ala Glu Ser Ile Pro Asn Leu
370 375 380
Lys Thr Val Thr Met Val Ile Gln Glu Thr Met Arg Leu Tyr Pro Pro
385 390 395 400
Ala Pro Ile Val Gly Arg Glu Ala Ser Lys Asp Ile Arg Leu Gly Asp
405 410 415
Leu Val Val Pro Lys Gly Val Cys Ile Trp Thr Leu Ile Pro Ala Leu
420 425 430
His Arg Asp Pro Glu Ile Trp Gly Pro Asp Ala Asn Asp Phe Lys Pro
435 440 445
Glu Arg Phe Ser Glu Gly Ile Ser Lys Ala Cys Lys Tyr Pro Gln Ser
450 455 460
Tyr Ile Pro Phe Gly Leu Gly Pro Arg Thr Cys Val Gly Lys Asn Phe
465 470 475 480
Gly Met Met Glu Val Lys Val Leu Val Ser Leu Ile Val Ser Lys Phe
485 490 495
Ser Phe Thr Leu Ser Pro Thr Tyr Gln His Ser Pro Ser His Lys Leu
500 505 510
Leu Val Glu Pro Gln His Gly Val Val Ile Arg Val Val
515 520 525
<210> 8
<211> 1578
<212> DNA
<213> Artificial sequence
<220>
<223> Variant kaurenoic acid 13-hydroxylase sequence CpO for expression
in Yarrowia lipolitica
<400> 8
atggagtctc tggttgtcca caccgtcaac gccatctggt gcattgtcat tgtcggtatc 60
ttctccgtcg gctaccacgt ctacggccga gctgttgtcg agcagtggcg aatgcgacga 120
tctctcaagc tccagggtgt caagggtcct cctccctcca tcttcaacgg taacgtttcc 180
gagatgcagc gaatccagtc cgaggccaag cactgctccg gtgacaacat catctcccac 240
gactactctt ctactctgtt cccccacttt gaccactggc gaaagcagta cggccgaatc 300
tacacctact ccactggcct caagcagcac ctctacatca accaccccga gatggtcaag 360
gagctctccc agaccaacac cctcaacctc ggccgaatca cccacatcac caagcgactc 420
aaccccattc tcggtaacgg tatcatcacc tccaacggcc cccactgggc ccaccagcga 480
cgaatcattg cctacgagtt cacccacgac aagatcaagg gtatggtcgg tctgatggtc 540
gagtccgcca tgcccatgct caacaagtgg gaggagatgg tcaagcgagg tggtgagatg 600
ggctgtgaca tccgagtcga cgaggacctc aaggatgtct ccgctgacgt cattgccaag 660
gcctgtttcg gctcttcctt ctccaagggc aaggccatct tctccatgat ccgagatctg 720
ctcaccgcca tcaccaagcg atccgtcctc ttccgattca acggtttcac cgacatggtt 780
ttcggctcca agaagcacgg tgacgttgac attgacgctc tcgagatgga gctcgagtcc 840
tccatctggg agactgtcaa ggagcgagag attgagtgca aggacaccca caagaaggac 900
ctcatgcagc tcattctcga gggtgccatg cgatcttgtg acggtaacct gtgggacaag 960
tctgcttacc gacgattcgt tgtcgacaac tgcaagtcca tctactttgc cggccacgac 1020
tccaccgccg tttccgtttc ttggtgcctc atgctgctcg ctctcaaccc ctcttggcag 1080
gtcaagatcc gagatgagat tctgtcctcc tgcaagaacg gtatccccga cgccgagtcc 1140
atccccaacc tcaagaccgt caccatggtc atccaggaga ctatgcgact ctaccctccc 1200
gctcccattg tcggccgaga ggcctccaag gacattcgac tcggtgatct ggttgtcccc 1260
aagggtgtct gtatctggac cctcatcccc gctctgcacc gagatcccga gatctggggt 1320
cccgacgcca acgacttcaa gcccgagcga ttctccgagg gtatctccaa ggcctgcaag 1380
tacccccagt cctacatccc ctttggcctc ggcccccgaa cctgtgtcgg caagaacttt 1440
ggtatgatgg aggtcaaggt cctcgtttct ctgattgtct ccaagttctc cttcactctg 1500
tctcccacct accagcactc tccctcccac aagctgctcg tcgagcccca gcacggtgtt 1560
gtcatccgag ttgtataa 1578
<210> 9
<211> 525
<212> PRT
<213> Artificial sequence
<220>
<223> Variant kaurenoic acid 13-hydroxylase
<400> 9
Met Glu Ser Leu Val Val His Thr Val Asn Ala Ile Trp Cys Ile Val
1 5 10 15
Ile Val Gly Ile Phe Ser Val Gly Tyr His Val Tyr Gly Arg Ala Val
20 25 30
Val Glu Gln Trp Arg Met Arg Arg Ser Leu Lys Leu Gln Gly Val Lys
35 40 45
Gly Pro Pro Pro Ser Ile Phe Asn Gly Asn Val Ser Glu Met Gln Arg
50 55 60
Ile Gln Ser Glu Ala Lys His Cys Ser Gly Asp Asn Ile Ile Ser His
65 70 75 80
Asp Tyr Ser Ser Ser Leu Phe Pro His Phe Asp His Trp Arg Lys Gln
85 90 95
Tyr Gly Arg Ile Tyr Thr Tyr Ser Thr Gly Leu Arg Gln His Leu Tyr
100 105 110
Ile Asn His Pro Glu Met Val Lys Glu Leu Ser Gln Thr Asn Thr Leu
115 120 125
Asn Leu Gly Arg Ile Thr His Ile Thr Lys Arg Leu Asn Pro Ile Leu
130 135 140
Gly Asn Gly Ile Ile Thr Ser Asn Gly Pro His Trp Ala His Gln Arg
145 150 155 160
Arg Ile Ile Ala Tyr Glu Phe Thr His Asp Lys Ile Lys Gly Met Val
165 170 175
Gly Leu Met Val Glu Ser Ala Met Pro Met Leu Asn Lys Trp Glu Glu
180 185 190
Met Val Lys Arg Gly Gly Glu Met Gly Cys Asp Ile Arg Val Asp Glu
195 200 205
Asp Leu Lys Asp Val Ser Ala Asp Val Ile Ala Lys Ala Cys Phe Gly
210 215 220
Ser Ser Phe Ser Lys Gly Lys Ala Ile Phe Ser Met Ile Arg Asp Leu
225 230 235 240
Leu Thr Ala Ile Thr Lys Arg Ser Val Leu Phe Arg Phe Asn Gly Phe
245 250 255
Thr Asp Met Val Phe Gly Ser Lys Lys His Gly Asp Val Asp Ile Asp
260 265 270
Ala Leu Glu Met Glu Leu Glu Ser Ser Ile Trp Glu Thr Val Lys Glu
275 280 285
Arg Glu Ile Glu Cys Lys Asp Thr His Lys Lys Asp Leu Met Gln Leu
290 295 300
Ile Leu Glu Gly Ala Met Arg Ser Cys Asp Gly Asn Leu Trp Asp Lys
305 310 315 320
Ser Ala Tyr Arg Arg Phe Val Val Asp Asn Cys Lys Ser Ile Tyr Phe
325 330 335
Ala Gly His Asp Ser Thr Ala Val Ser Val Ser Trp Cys Leu Met Leu
340 345 350
Leu Ala Leu Asn Pro Ser Trp Gln Val Lys Ile Arg Asp Glu Ile Leu
355 360 365
Ser Ser Cys Lys Asn Gly Ile Pro Asp Ala Glu Ser Ile Pro Asn Leu
370 375 380
Lys Thr Val Thr Met Val Ile Gln Glu Thr Met Arg Leu Tyr Pro Pro
385 390 395 400
Ala Pro Ile Val Gly Arg Glu Ala Ser Lys Asp Ile Arg Leu Gly Asp
405 410 415
Leu Val Val Pro Lys Gly Val Cys Ile Trp Thr Leu Ile Pro Ala Leu
420 425 430
His Arg Asp Pro Glu Ile Trp Gly Pro Asp Ala Asn Asp Phe Lys Pro
435 440 445
Glu Arg Phe Ser Glu Gly Ile Ser Lys Ala Cys Lys Tyr Pro Gln Ser
450 455 460
Tyr Ile Pro Phe Gly Leu Gly Pro Arg Thr Cys Val Gly Lys Asn Phe
465 470 475 480
Gly Met Met Glu Val Lys Val Leu Val Ser Leu Ile Val Ser Lys Phe
485 490 495
Ser Phe Thr Leu Ser Pro Thr Tyr Gln His Ser Pro Ser His Lys Leu
500 505 510
Leu Val Glu Pro Gln His Gly Val Val Ile Arg Val Val
515 520 525
<210> 10
<211> 1578
<212> DNA
<213> Artificial sequence
<220>
<223> Variant kaurenoic acid 13-hydroxylase sequence CpO for expression
in Yarrowia lipolitica
<400> 10
atggagtctc tggttgtcca caccgtcaac gccatctggt gcattgtcat tgtcggtatc 60
ttctccgtcg gctaccacgt ctacggccga gctgttgtcg agcagtggcg aatgcgacga 120
tctctcaagc tccagggtgt caagggtcct cctccctcca tcttcaacgg taacgtttcc 180
gagatgcagc gaatccagtc cgaggccaag cactgctccg gtgacaacat catctcccac 240
gactactctt cttctctgtt cccccacttt gaccactggc gaaagcagta cggccgaatc 300
tacacctact ccactggcct ccgacagcac ctctacatca accaccccga gatggtcaag 360
gagctctccc agaccaacac cctcaacctc ggccgaatca cccacatcac caagcgactc 420
aaccccattc tcggtaacgg tatcatcacc tccaacggcc cccactgggc ccaccagcga 480
cgaatcattg cctacgagtt cacccacgac aagatcaagg gtatggtcgg tctgatggtc 540
gagtccgcca tgcccatgct caacaagtgg gaggagatgg tcaagcgagg tggtgagatg 600
ggctgtgaca tccgagtcga cgaggacctc aaggatgtct ccgctgacgt cattgccaag 660
gcctgtttcg gctcttcctt ctccaagggc aaggccatct tctccatgat ccgagatctg 720
ctcaccgcca tcaccaagcg atccgtcctc ttccgattca acggtttcac cgacatggtt 780
ttcggctcca agaagcacgg tgacgttgac attgacgctc tcgagatgga gctcgagtcc 840
tccatctggg agactgtcaa ggagcgagag attgagtgca aggacaccca caagaaggac 900
ctcatgcagc tcattctcga gggtgccatg cgatcttgtg acggtaacct gtgggacaag 960
tctgcttacc gacgattcgt tgtcgacaac tgcaagtcca tctactttgc cggccacgac 1020
tccaccgccg tttccgtttc ttggtgcctc atgctgctcg ctctcaaccc ctcttggcag 1080
gtcaagatcc gagatgagat tctgtcctcc tgcaagaacg gtatccccga cgccgagtcc 1140
atccccaacc tcaagaccgt caccatggtc atccaggaga ctatgcgact ctaccctccc 1200
gctcccattg tcggccgaga ggcctccaag gacattcgac tcggtgatct ggttgtcccc 1260
aagggtgtct gtatctggac cctcatcccc gctctgcacc gagatcccga gatctggggt 1320
cccgacgcca acgacttcaa gcccgagcga ttctccgagg gtatctccaa ggcctgcaag 1380
tacccccagt cctacatccc ctttggcctc ggcccccgaa cctgtgtcgg caagaacttt 1440
ggtatgatgg aggtcaaggt cctcgtttct ctgattgtct ccaagttctc cttcactctg 1500
tctcccacct accagcactc tccctcccac aagctgctcg tcgagcccca gcacggtgtt 1560
gtcatccgag ttgtataa 1578
<210> 11
<211> 525
<212> PRT
<213> Artificial sequence
<220>
<223> Variant kaurenoic acid 13-hydroxylase
<400> 11
Met Glu Ser Leu Val Val His Thr Val Asn Ala Ile Trp Cys Ile Val
1 5 10 15
Ile Val Gly Ile Phe Ser Val Gly Tyr His Val Tyr Gly Arg Ala Val
20 25 30
Val Glu Gln Trp Arg Met Arg Arg Ser Leu Lys Leu Gln Gly Val Lys
35 40 45
Gly Pro Pro Pro Ser Ile Phe Asn Gly Asn Val Ser Glu Met Gln Arg
50 55 60
Ile Gln Ser Glu Ala Lys His Cys Ser Gly Asp Asn Ile Ile Ser His
65 70 75 80
Asp Tyr Ser Ser Ser Leu Phe Pro His Phe Asp His Trp Arg Lys Gln
85 90 95
Tyr Gly Arg Ile Tyr Thr Tyr Ser Thr Gly Leu Lys Gln His Leu Tyr
100 105 110
Ile Asn His Pro Glu Met Val Lys Glu Leu Ser Gln Thr Asn Thr Leu
115 120 125
Asp Leu Gly Arg Ile Thr His Ile Thr Lys Arg Leu Asn Pro Ile Leu
130 135 140
Gly Asn Gly Ile Ile Thr Ser Asn Gly Pro His Trp Ala His Gln Arg
145 150 155 160
Arg Ile Ile Ala Tyr Glu Phe Thr His Asp Lys Ile Lys Gly Met Val
165 170 175
Gly Leu Met Val Glu Ser Ala Met Pro Met Leu Asn Lys Trp Glu Glu
180 185 190
Met Val Lys Arg Gly Gly Glu Met Gly Cys Asp Ile Arg Val Asp Glu
195 200 205
Asp Leu Lys Asp Val Ser Ala Asp Val Ile Ala Lys Ala Cys Phe Gly
210 215 220
Ser Ser Phe Ser Lys Gly Lys Ala Ile Phe Ser Met Ile Arg Asp Leu
225 230 235 240
Leu Thr Ala Ile Thr Lys Arg Ser Val Leu Phe Arg Phe Asn Gly Phe
245 250 255
Thr Asp Met Val Phe Gly Ser Lys Lys His Gly Asp Val Asp Ile Asp
260 265 270
Ala Leu Glu Met Glu Leu Glu Ser Ser Ile Trp Glu Thr Val Lys Glu
275 280 285
Arg Glu Ile Glu Cys Lys Asp Thr His Lys Lys Asp Leu Met Gln Leu
290 295 300
Ile Leu Glu Gly Ala Met Arg Ser Cys Asp Gly Asn Leu Trp Asp Lys
305 310 315 320
Ser Ala Tyr Arg Arg Phe Val Val Asp Asn Cys Lys Ser Ile Tyr Phe
325 330 335
Ala Gly His Asp Ser Thr Ala Val Ser Val Ser Trp Cys Leu Met Leu
340 345 350
Leu Ala Leu Asn Pro Ser Trp Gln Val Lys Ile Arg Asp Glu Ile Leu
355 360 365
Ser Ser Cys Lys Asn Gly Ile Pro Asp Ala Glu Ser Ile Pro Asn Leu
370 375 380
Lys Thr Val Thr Met Val Ile Gln Glu Thr Met Arg Leu Tyr Pro Pro
385 390 395 400
Ala Pro Ile Val Gly Arg Glu Ala Ser Lys Asp Ile Arg Leu Gly Asp
405 410 415
Leu Val Val Pro Lys Gly Val Cys Ile Trp Thr Leu Ile Pro Ala Leu
420 425 430
His Arg Asp Pro Glu Ile Trp Gly Pro Asp Ala Asn Asp Phe Lys Pro
435 440 445
Glu Arg Phe Ser Glu Gly Ile Ser Lys Ala Cys Lys Tyr Pro Gln Ser
450 455 460
Tyr Ile Pro Phe Gly Leu Gly Pro Arg Thr Cys Val Gly Lys Asn Phe
465 470 475 480
Gly Met Met Glu Val Lys Val Leu Val Ser Leu Ile Val Ser Lys Phe
485 490 495
Ser Phe Thr Leu Ser Pro Thr Tyr Gln His Ser Pro Ser His Lys Leu
500 505 510
Leu Val Glu Pro Gln His Gly Val Val Ile Arg Val Val
515 520 525
<210> 12
<211> 1578
<212> DNA
<213> Artificial sequence
<220>
<223> Variant kaurenoic acid 13-hydroxylase sequence CpO for expression
in Yarrowia lipolitica
<400> 12
atggagtctc tggttgtcca caccgtcaac gccatctggt gcattgtcat tgtcggtatc 60
ttctccgtcg gctaccacgt ctacggccga gctgttgtcg agcagtggcg aatgcgacga 120
tctctcaagc tccagggtgt caagggtcct cctccctcca tcttcaacgg taacgtttcc 180
gagatgcagc gaatccagtc cgaggccaag cactgctccg gtgacaacat catctcccac 240
gactactctt cttctctgtt cccccacttt gaccactggc gaaagcagta cggccgaatc 300
tacacctact ccactggcct caagcagcac ctctacatca accaccccga gatggtcaag 360
gagctctccc agaccaacac cctcgacctc ggccgaatca cccacatcac caagcgactc 420
aaccccattc tcggtaacgg tatcatcacc tccaacggcc cccactgggc ccaccagcga 480
cgaatcattg cctacgagtt cacccacgac aagatcaagg gtatggtcgg tctgatggtc 540
gagtccgcca tgcccatgct caacaagtgg gaggagatgg tcaagcgagg tggtgagatg 600
ggctgtgaca tccgagtcga cgaggacctc aaggatgtct ccgctgacgt cattgccaag 660
gcctgtttcg gctcttcctt ctccaagggc aaggccatct tctccatgat ccgagatctg 720
ctcaccgcca tcaccaagcg atccgtcctc ttccgattca acggtttcac cgacatggtt 780
ttcggctcca agaagcacgg tgacgttgac attgacgctc tcgagatgga gctcgagtcc 840
tccatctggg agactgtcaa ggagcgagag attgagtgca aggacaccca caagaaggac 900
ctcatgcagc tcattctcga gggtgccatg cgatcttgtg acggtaacct gtgggacaag 960
tctgcttacc gacgattcgt tgtcgacaac tgcaagtcca tctactttgc cggccacgac 1020
tccaccgccg tttccgtttc ttggtgcctc atgctgctcg ctctcaaccc ctcttggcag 1080
gtcaagatcc gagatgagat tctgtcctcc tgcaagaacg gtatccccga cgccgagtcc 1140
atccccaacc tcaagaccgt caccatggtc atccaggaga ctatgcgact ctaccctccc 1200
gctcccattg tcggccgaga ggcctccaag gacattcgac tcggtgatct ggttgtcccc 1260
aagggtgtct gtatctggac cctcatcccc gctctgcacc gagatcccga gatctggggt 1320
cccgacgcca acgacttcaa gcccgagcga ttctccgagg gtatctccaa ggcctgcaag 1380
tacccccagt cctacatccc ctttggcctc ggcccccgaa cctgtgtcgg caagaacttt 1440
ggtatgatgg aggtcaaggt cctcgtttct ctgattgtct ccaagttctc cttcactctg 1500
tctcccacct accagcactc tccctcccac aagctgctcg tcgagcccca gcacggtgtt 1560
gtcatccgag ttgtataa 1578
<210> 13
<211> 525
<212> PRT
<213> Artificial sequence
<220>
<223> Variant kaurenoic acid 13-hydroxylase
<400> 13
Met Glu Ser Leu Val Val His Thr Val Asn Ala Ile Trp Cys Ile Val
1 5 10 15
Ile Val Gly Ile Phe Ser Val Gly Tyr His Val Tyr Gly Arg Ala Val
20 25 30
Val Glu Gln Trp Arg Met Arg Arg Ser Leu Lys Leu Gln Gly Val Lys
35 40 45
Gly Pro Pro Pro Ser Ile Phe Asn Gly Asn Val Ser Glu Met Gln Arg
50 55 60
Ile Gln Ser Glu Ala Lys His Cys Ser Gly Asp Asn Ile Ile Ser His
65 70 75 80
Asp Tyr Ser Ser Ser Leu Phe Pro His Phe Asp His Trp Arg Lys Gln
85 90 95
Tyr Gly Arg Ile Tyr Thr Tyr Ser Thr Gly Leu Lys Gln His Leu Tyr
100 105 110
Ile Asn His Pro Glu Met Val Lys Glu Leu Ser Gln Thr Asn Thr Leu
115 120 125
Asn Leu Gly Arg Ile Thr His Ile Thr Lys Arg Leu Ala Pro Ile Leu
130 135 140
Gly Asn Gly Ile Ile Thr Ser Asn Gly Pro His Trp Ala His Gln Arg
145 150 155 160
Arg Ile Ile Ala Tyr Glu Phe Thr His Asp Lys Ile Lys Gly Met Val
165 170 175
Gly Leu Met Val Glu Ser Ala Met Pro Met Leu Asn Lys Trp Glu Glu
180 185 190
Met Val Lys Arg Gly Gly Glu Met Gly Cys Asp Ile Arg Val Asp Glu
195 200 205
Asp Leu Lys Asp Val Ser Ala Asp Val Ile Ala Lys Ala Cys Phe Gly
210 215 220
Ser Ser Phe Ser Lys Gly Lys Ala Ile Phe Ser Met Ile Arg Asp Leu
225 230 235 240
Leu Thr Ala Ile Thr Lys Arg Ser Val Leu Phe Arg Phe Asn Gly Phe
245 250 255
Thr Asp Met Val Phe Gly Ser Lys Lys His Gly Asp Val Asp Ile Asp
260 265 270
Ala Leu Glu Met Glu Leu Glu Ser Ser Ile Trp Glu Thr Val Lys Glu
275 280 285
Arg Glu Ile Glu Cys Lys Asp Thr His Lys Lys Asp Leu Met Gln Leu
290 295 300
Ile Leu Glu Gly Ala Met Arg Ser Cys Asp Gly Asn Leu Trp Asp Lys
305 310 315 320
Ser Ala Tyr Arg Arg Phe Val Val Asp Asn Cys Lys Ser Ile Tyr Phe
325 330 335
Ala Gly His Asp Ser Thr Ala Val Ser Val Ser Trp Cys Leu Met Leu
340 345 350
Leu Ala Leu Asn Pro Ser Trp Gln Val Lys Ile Arg Asp Glu Ile Leu
355 360 365
Ser Ser Cys Lys Asn Gly Ile Pro Asp Ala Glu Ser Ile Pro Asn Leu
370 375 380
Lys Thr Val Thr Met Val Ile Gln Glu Thr Met Arg Leu Tyr Pro Pro
385 390 395 400
Ala Pro Ile Val Gly Arg Glu Ala Ser Lys Asp Ile Arg Leu Gly Asp
405 410 415
Leu Val Val Pro Lys Gly Val Cys Ile Trp Thr Leu Ile Pro Ala Leu
420 425 430
His Arg Asp Pro Glu Ile Trp Gly Pro Asp Ala Asn Asp Phe Lys Pro
435 440 445
Glu Arg Phe Ser Glu Gly Ile Ser Lys Ala Cys Lys Tyr Pro Gln Ser
450 455 460
Tyr Ile Pro Phe Gly Leu Gly Pro Arg Thr Cys Val Gly Lys Asn Phe
465 470 475 480
Gly Met Met Glu Val Lys Val Leu Val Ser Leu Ile Val Ser Lys Phe
485 490 495
Ser Phe Thr Leu Ser Pro Thr Tyr Gln His Ser Pro Ser His Lys Leu
500 505 510
Leu Val Glu Pro Gln His Gly Val Val Ile Arg Val Val
515 520 525
<210> 14
<211> 1578
<212> DNA
<213> Artificial sequence
<220>
<223> Variant kaurenoic acid 13-hydroxylase sequence CpO for expression
in Yarrowia lipolitica
<400> 14
atggagtctc tggttgtcca caccgtcaac gccatctggt gcattgtcat tgtcggtatc 60
ttctccgtcg gctaccacgt ctacggccga gctgttgtcg agcagtggcg aatgcgacga 120
tctctcaagc tccagggtgt caagggtcct cctccctcca tcttcaacgg taacgtttcc 180
gagatgcagc gaatccagtc cgaggccaag cactgctccg gtgacaacat catctcccac 240
gactactctt cttctctgtt cccccacttt gaccactggc gaaagcagta cggccgaatc 300
tacacctact ccactggcct caagcagcac ctctacatca accaccccga gatggtcaag 360
gagctctccc agaccaacac cctcaacctc ggccgaatca cccacatcac caagcgactc 420
gcccccattc tcggtaacgg tatcatcacc tccaacggcc cccactgggc ccaccagcga 480
cgaatcattg cctacgagtt cacccacgac aagatcaagg gtatggtcgg tctgatggtc 540
gagtccgcca tgcccatgct caacaagtgg gaggagatgg tcaagcgagg tggtgagatg 600
ggctgtgaca tccgagtcga cgaggacctc aaggatgtct ccgctgacgt cattgccaag 660
gcctgtttcg gctcttcctt ctccaagggc aaggccatct tctccatgat ccgagatctg 720
ctcaccgcca tcaccaagcg atccgtcctc ttccgattca acggtttcac cgacatggtt 780
ttcggctcca agaagcacgg tgacgttgac attgacgctc tcgagatgga gctcgagtcc 840
tccatctggg agactgtcaa ggagcgagag attgagtgca aggacaccca caagaaggac 900
ctcatgcagc tcattctcga gggtgccatg cgatcttgtg acggtaacct gtgggacaag 960
tctgcttacc gacgattcgt tgtcgacaac tgcaagtcca tctactttgc cggccacgac 1020
tccaccgccg tttccgtttc ttggtgcctc atgctgctcg ctctcaaccc ctcttggcag 1080
gtcaagatcc gagatgagat tctgtcctcc tgcaagaacg gtatccccga cgccgagtcc 1140
atccccaacc tcaagaccgt caccatggtc atccaggaga ctatgcgact ctaccctccc 1200
gctcccattg tcggccgaga ggcctccaag gacattcgac tcggtgatct ggttgtcccc 1260
aagggtgtct gtatctggac cctcatcccc gctctgcacc gagatcccga gatctggggt 1320
cccgacgcca acgacttcaa gcccgagcga ttctccgagg gtatctccaa ggcctgcaag 1380
tacccccagt cctacatccc ctttggcctc ggcccccgaa cctgtgtcgg caagaacttt 1440
ggtatgatgg aggtcaaggt cctcgtttct ctgattgtct ccaagttctc cttcactctg 1500
tctcccacct accagcactc tccctcccac aagctgctcg tcgagcccca gcacggtgtt 1560
gtcatccgag ttgtataa 1578
<210> 15
<211> 525
<212> PRT
<213> Artificial sequence
<220>
<223> Variant kaurenoic acid 13-hydroxylase
<400> 15
Met Glu Ser Leu Val Val His Thr Val Asn Ala Ile Trp Cys Ile Val
1 5 10 15
Ile Val Gly Ile Phe Ser Val Gly Tyr His Val Tyr Gly Arg Ala Val
20 25 30
Val Glu Gln Trp Arg Met Arg Arg Ser Leu Lys Leu Gln Gly Val Lys
35 40 45
Gly Pro Pro Pro Ser Ile Phe Asn Gly Asn Val Ser Glu Met Gln Arg
50 55 60
Ile Gln Ser Glu Ala Lys His Cys Ser Gly Asp Asn Ile Ile Ser His
65 70 75 80
Asp Tyr Ser Ser Ser Leu Phe Pro His Phe Asp His Trp Arg Lys Gln
85 90 95
Tyr Gly Arg Ile Tyr Thr Tyr Ser Thr Gly Leu Lys Gln His Leu Tyr
100 105 110
Ile Asn His Pro Glu Met Val Lys Glu Leu Ser Gln Thr Asn Thr Leu
115 120 125
Asn Leu Gly Arg Ile Thr His Ile Thr Lys Arg Leu Asn Pro Ile Leu
130 135 140
Gly Asn Gly Ile Ile Thr Ser Asn Gly Pro His Trp Ala His Gln Arg
145 150 155 160
Arg Ile Ile Ala Tyr Glu Phe Thr His Asp Lys Val Lys Gly Met Val
165 170 175
Gly Leu Met Val Glu Ser Ala Met Pro Met Leu Asn Lys Trp Glu Glu
180 185 190
Met Val Lys Arg Gly Gly Glu Met Gly Cys Asp Ile Arg Val Asp Glu
195 200 205
Asp Leu Lys Asp Val Ser Ala Asp Val Ile Ala Lys Ala Cys Phe Gly
210 215 220
Ser Ser Phe Ser Lys Gly Lys Ala Ile Phe Ser Met Ile Arg Asp Leu
225 230 235 240
Leu Thr Ala Ile Thr Lys Arg Ser Val Leu Phe Arg Phe Asn Gly Phe
245 250 255
Thr Asp Met Val Phe Gly Ser Lys Lys His Gly Asp Val Asp Ile Asp
260 265 270
Ala Leu Glu Met Glu Leu Glu Ser Ser Ile Trp Glu Thr Val Lys Glu
275 280 285
Arg Glu Ile Glu Cys Lys Asp Thr His Lys Lys Asp Leu Met Gln Leu
290 295 300
Ile Leu Glu Gly Ala Met Arg Ser Cys Asp Gly Asn Leu Trp Asp Lys
305 310 315 320
Ser Ala Tyr Arg Arg Phe Val Val Asp Asn Cys Lys Ser Ile Tyr Phe
325 330 335
Ala Gly His Asp Ser Thr Ala Val Ser Val Ser Trp Cys Leu Met Leu
340 345 350
Leu Ala Leu Asn Pro Ser Trp Gln Val Lys Ile Arg Asp Glu Ile Leu
355 360 365
Ser Ser Cys Lys Asn Gly Ile Pro Asp Ala Glu Ser Ile Pro Asn Leu
370 375 380
Lys Thr Val Thr Met Val Ile Gln Glu Thr Met Arg Leu Tyr Pro Pro
385 390 395 400
Ala Pro Ile Val Gly Arg Glu Ala Ser Lys Asp Ile Arg Leu Gly Asp
405 410 415
Leu Val Val Pro Lys Gly Val Cys Ile Trp Thr Leu Ile Pro Ala Leu
420 425 430
His Arg Asp Pro Glu Ile Trp Gly Pro Asp Ala Asn Asp Phe Lys Pro
435 440 445
Glu Arg Phe Ser Glu Gly Ile Ser Lys Ala Cys Lys Tyr Pro Gln Ser
450 455 460
Tyr Ile Pro Phe Gly Leu Gly Pro Arg Thr Cys Val Gly Lys Asn Phe
465 470 475 480
Gly Met Met Glu Val Lys Val Leu Val Ser Leu Ile Val Ser Lys Phe
485 490 495
Ser Phe Thr Leu Ser Pro Thr Tyr Gln His Ser Pro Ser His Lys Leu
500 505 510
Leu Val Glu Pro Gln His Gly Val Val Ile Arg Val Val
515 520 525
<210> 16
<211> 1578
<212> DNA
<213> Artificial sequence
<220>
<223> Variant kaurenoic acid 13-hydroxylase sequence CpO for expression
in Yarrowia lipolitica
<400> 16
atggagtctc tggttgtcca caccgtcaac gccatctggt gcattgtcat tgtcggtatc 60
ttctccgtcg gctaccacgt ctacggccga gctgttgtcg agcagtggcg aatgcgacga 120
tctctcaagc tccagggtgt caagggtcct cctccctcca tcttcaacgg taacgtttcc 180
gagatgcagc gaatccagtc cgaggccaag cactgctccg gtgacaacat catctcccac 240
gactactctt cttctctgtt cccccacttt gaccactggc gaaagcagta cggccgaatc 300
tacacctact ccactggcct caagcagcac ctctacatca accaccccga gatggtcaag 360
gagctctccc agaccaacac cctcaacctc ggccgaatca cccacatcac caagcgactc 420
aaccccattc tcggtaacgg tatcatcacc tccaacggcc cccactgggc ccaccagcga 480
cgaatcattg cctacgagtt cacccacgac aaggtcaagg gtatggtcgg tctgatggtc 540
gagtccgcca tgcccatgct caacaagtgg gaggagatgg tcaagcgagg tggtgagatg 600
ggctgtgaca tccgagtcga cgaggacctc aaggatgtct ccgctgacgt cattgccaag 660
gcctgtttcg gctcttcctt ctccaagggc aaggccatct tctccatgat ccgagatctg 720
ctcaccgcca tcaccaagcg atccgtcctc ttccgattca acggtttcac cgacatggtt 780
ttcggctcca agaagcacgg tgacgttgac attgacgctc tcgagatgga gctcgagtcc 840
tccatctggg agactgtcaa ggagcgagag attgagtgca aggacaccca caagaaggac 900
ctcatgcagc tcattctcga gggtgccatg cgatcttgtg acggtaacct gtgggacaag 960
tctgcttacc gacgattcgt tgtcgacaac tgcaagtcca tctactttgc cggccacgac 1020
tccaccgccg tttccgtttc ttggtgcctc atgctgctcg ctctcaaccc ctcttggcag 1080
gtcaagatcc gagatgagat tctgtcctcc tgcaagaacg gtatccccga cgccgagtcc 1140
atccccaacc tcaagaccgt caccatggtc atccaggaga ctatgcgact ctaccctccc 1200
gctcccattg tcggccgaga ggcctccaag gacattcgac tcggtgatct ggttgtcccc 1260
aagggtgtct gtatctggac cctcatcccc gctctgcacc gagatcccga gatctggggt 1320
cccgacgcca acgacttcaa gcccgagcga ttctccgagg gtatctccaa ggcctgcaag 1380
tacccccagt cctacatccc ctttggcctc ggcccccgaa cctgtgtcgg caagaacttt 1440
ggtatgatgg aggtcaaggt cctcgtttct ctgattgtct ccaagttctc cttcactctg 1500
tctcccacct accagcactc tccctcccac aagctgctcg tcgagcccca gcacggtgtt 1560
gtcatccgag ttgtataa 1578
<210> 17
<211> 525
<212> PRT
<213> Artificial sequence
<220>
<223> Variant kaurenoic acid 13-hydroxylase
<400> 17
Met Glu Ser Leu Val Val His Thr Val Asn Ala Ile Trp Cys Ile Val
1 5 10 15
Ile Val Gly Ile Phe Ser Val Gly Tyr His Val Tyr Gly Arg Ala Val
20 25 30
Val Glu Gln Trp Arg Met Arg Arg Ser Leu Lys Leu Gln Gly Val Lys
35 40 45
Gly Pro Pro Pro Ser Ile Phe Asn Gly Asn Val Ser Glu Met Gln Arg
50 55 60
Ile Gln Ser Glu Ala Lys His Cys Ser Gly Asp Asn Ile Ile Ser His
65 70 75 80
Asp Tyr Ser Ser Ser Leu Phe Pro His Phe Asp His Trp Arg Lys Gln
85 90 95
Tyr Gly Arg Ile Tyr Thr Tyr Ser Thr Gly Leu Lys Gln His Leu Tyr
100 105 110
Ile Asn His Pro Glu Met Val Lys Glu Leu Ser Gln Thr Asn Thr Leu
115 120 125
Asn Leu Gly Arg Ile Thr His Ile Thr Lys Arg Leu Asn Pro Ile Leu
130 135 140
Gly Asn Gly Ile Ile Thr Ser Asn Gly Pro His Trp Ala His Gln Arg
145 150 155 160
Arg Ile Ile Ala Tyr Glu Phe Thr His Asp Lys Ile Lys Gly Met Val
165 170 175
Gly Leu Met Val Glu Ser Ala Met Pro Met Leu Asn Lys Trp Glu Glu
180 185 190
Met Val Glu Ala Glu Gly Gly Met Gly Cys Asp Ile Arg Val Asp Glu
195 200 205
Asp Leu Lys Asp Val Ser Ala Asp Val Ile Ala Lys Ala Cys Phe Gly
210 215 220
Ser Ser Phe Ser Lys Gly Lys Ala Ile Phe Ser Met Ile Arg Asp Leu
225 230 235 240
Leu Thr Ala Ile Thr Lys Arg Ser Val Leu Phe Arg Phe Asn Gly Phe
245 250 255
Thr Asp Met Val Phe Gly Ser Lys Lys His Gly Asp Val Asp Ile Asp
260 265 270
Ala Leu Glu Met Glu Leu Glu Ser Ser Ile Trp Glu Thr Val Lys Glu
275 280 285
Arg Glu Ile Glu Cys Lys Asp Thr His Lys Lys Asp Leu Met Gln Leu
290 295 300
Ile Leu Glu Gly Ala Met Arg Ser Cys Asp Gly Asn Leu Trp Asp Lys
305 310 315 320
Ser Ala Tyr Arg Arg Phe Val Val Asp Asn Cys Lys Ser Ile Tyr Phe
325 330 335
Ala Gly His Asp Ser Thr Ala Val Ser Val Ser Trp Cys Leu Met Leu
340 345 350
Leu Ala Leu Asn Pro Ser Trp Gln Val Lys Ile Arg Asp Glu Ile Leu
355 360 365
Ser Ser Cys Lys Asn Gly Ile Pro Asp Ala Glu Ser Ile Pro Asn Leu
370 375 380
Lys Thr Val Thr Met Val Ile Gln Glu Thr Met Arg Leu Tyr Pro Pro
385 390 395 400
Ala Pro Ile Val Gly Arg Glu Ala Ser Lys Asp Ile Arg Leu Gly Asp
405 410 415
Leu Val Val Pro Lys Gly Val Cys Ile Trp Thr Leu Ile Pro Ala Leu
420 425 430
His Arg Asp Pro Glu Ile Trp Gly Pro Asp Ala Asn Asp Phe Lys Pro
435 440 445
Glu Arg Phe Ser Glu Gly Ile Ser Lys Ala Cys Lys Tyr Pro Gln Ser
450 455 460
Tyr Ile Pro Phe Gly Leu Gly Pro Arg Thr Cys Val Gly Lys Asn Phe
465 470 475 480
Gly Met Met Glu Val Lys Val Leu Val Ser Leu Ile Val Ser Lys Phe
485 490 495
Ser Phe Thr Leu Ser Pro Thr Tyr Gln His Ser Pro Ser His Lys Leu
500 505 510
Leu Val Glu Pro Gln His Gly Val Val Ile Arg Val Val
515 520 525
<210> 18
<211> 1578
<212> DNA
<213> Artificial sequence
<220>
<223> Variant kaurenoic acid 13-hydroxylase sequence CpO for expression
in Yarrowia lipolitica
<400> 18
atggagtctc tggttgtcca caccgtcaac gccatctggt gcattgtcat tgtcggtatc 60
ttctccgtcg gctaccacgt ctacggccga gctgttgtcg agcagtggcg aatgcgacga 120
tctctcaagc tccagggtgt caagggtcct cctccctcca tcttcaacgg taacgtttcc 180
gagatgcagc gaatccagtc cgaggccaag cactgctccg gtgacaacat catctcccac 240
gactactctt cttctctgtt cccccacttt gaccactggc gaaagcagta cggccgaatc 300
tacacctact ccactggcct caagcagcac ctctacatca accaccccga gatggtcaag 360
gagctctccc agaccaacac cctcaacctc ggccgaatca cccacatcac caagcgactc 420
aaccccattc tcggtaacgg tatcatcacc tccaacggcc cccactgggc ccaccagcga 480
cgaatcattg cctacgagtt cacccacgac aagatcaagg gtatggtcgg tctgatggtc 540
gagtccgcca tgcccatgct caacaagtgg gaggagatgg tcgaggccga gggtggtatg 600
ggctgtgaca tccgagtcga cgaggacctc aaggatgtct ccgctgacgt cattgccaag 660
gcctgtttcg gctcttcctt ctccaagggc aaggccatct tctccatgat ccgagatctg 720
ctcaccgcca tcaccaagcg atccgtcctc ttccgattca acggtttcac cgacatggtt 780
ttcggctcca agaagcacgg tgacgttgac attgacgctc tcgagatgga gctcgagtcc 840
tccatctggg agactgtcaa ggagcgagag attgagtgca aggacaccca caagaaggac 900
ctcatgcagc tcattctcga gggtgccatg cgatcttgtg acggtaacct gtgggacaag 960
tctgcttacc gacgattcgt tgtcgacaac tgcaagtcca tctactttgc cggccacgac 1020
tccaccgccg tttccgtttc ttggtgcctc atgctgctcg ctctcaaccc ctcttggcag 1080
gtcaagatcc gagatgagat tctgtcctcc tgcaagaacg gtatccccga cgccgagtcc 1140
atccccaacc tcaagaccgt caccatggtc atccaggaga ctatgcgact ctaccctccc 1200
gctcccattg tcggccgaga ggcctccaag gacattcgac tcggtgatct ggttgtcccc 1260
aagggtgtct gtatctggac cctcatcccc gctctgcacc gagatcccga gatctggggt 1320
cccgacgcca acgacttcaa gcccgagcga ttctccgagg gtatctccaa ggcctgcaag 1380
tacccccagt cctacatccc ctttggcctc ggcccccgaa cctgtgtcgg caagaacttt 1440
ggtatgatgg aggtcaaggt cctcgtttct ctgattgtct ccaagttctc cttcactctg 1500
tctcccacct accagcactc tccctcccac aagctgctcg tcgagcccca gcacggtgtt 1560
gtcatccgag ttgtataa 1578
<210> 19
<211> 525
<212> PRT
<213> Artificial sequence
<220>
<223> Variant kaurenoic acid 13-hydroxylase
<400> 19
Met Glu Ser Leu Val Val His Thr Val Asn Ala Ile Trp Cys Ile Val
1 5 10 15
Ile Val Gly Ile Phe Ser Val Gly Tyr His Val Tyr Gly Arg Ala Val
20 25 30
Val Glu Gln Trp Arg Met Arg Arg Ser Leu Lys Leu Gln Gly Val Lys
35 40 45
Gly Pro Pro Pro Ser Ile Phe Asn Gly Asn Val Ser Glu Met Gln Arg
50 55 60
Ile Gln Ser Glu Ala Lys His Cys Ser Gly Asp Asn Ile Ile Ser His
65 70 75 80
Asp Tyr Ser Ser Ser Leu Phe Pro His Phe Asp His Trp Arg Lys Gln
85 90 95
Tyr Gly Arg Ile Tyr Thr Tyr Ser Thr Gly Leu Lys Gln His Leu Tyr
100 105 110
Ile Asn His Pro Glu Met Val Lys Glu Leu Ser Gln Thr Asn Thr Leu
115 120 125
Asn Leu Gly Arg Ile Thr His Ile Thr Lys Arg Leu Asn Pro Ile Leu
130 135 140
Gly Asn Gly Ile Ile Thr Ser Asn Gly Pro His Trp Ala His Gln Arg
145 150 155 160
Arg Ile Ile Ala Tyr Glu Phe Thr His Asp Lys Ile Lys Gly Met Val
165 170 175
Gly Leu Met Val Glu Ser Ala Met Pro Met Leu Asn Lys Trp Glu Glu
180 185 190
Met Val Lys Arg Gly Gly Glu Met Gly Cys Asp Ile Arg Val Asp Glu
195 200 205
Asp Leu Lys Asp Val Ser Ala Asp Val Ile Ala Lys Ala Cys Phe Gly
210 215 220
Ser Asn Phe Ser Lys Gly Lys Ala Ile Phe Ser Met Ile Arg Asp Leu
225 230 235 240
Leu Thr Ala Ile Thr Lys Arg Ser Val Leu Phe Arg Phe Asn Gly Phe
245 250 255
Thr Asp Met Val Phe Gly Ser Lys Lys His Gly Asp Val Asp Ile Asp
260 265 270
Ala Leu Glu Met Glu Leu Glu Ser Ser Ile Trp Glu Thr Val Lys Glu
275 280 285
Arg Glu Ile Glu Cys Lys Asp Thr His Lys Lys Asp Leu Met Gln Leu
290 295 300
Ile Leu Glu Gly Ala Met Arg Ser Cys Asp Gly Asn Leu Trp Asp Lys
305 310 315 320
Ser Ala Tyr Arg Arg Phe Val Val Asp Asn Cys Lys Ser Ile Tyr Phe
325 330 335
Ala Gly His Asp Ser Thr Ala Val Ser Val Ser Trp Cys Leu Met Leu
340 345 350
Leu Ala Leu Asn Pro Ser Trp Gln Val Lys Ile Arg Asp Glu Ile Leu
355 360 365
Ser Ser Cys Lys Asn Gly Ile Pro Asp Ala Glu Ser Ile Pro Asn Leu
370 375 380
Lys Thr Val Thr Met Val Ile Gln Glu Thr Met Arg Leu Tyr Pro Pro
385 390 395 400
Ala Pro Ile Val Gly Arg Glu Ala Ser Lys Asp Ile Arg Leu Gly Asp
405 410 415
Leu Val Val Pro Lys Gly Val Cys Ile Trp Thr Leu Ile Pro Ala Leu
420 425 430
His Arg Asp Pro Glu Ile Trp Gly Pro Asp Ala Asn Asp Phe Lys Pro
435 440 445
Glu Arg Phe Ser Glu Gly Ile Ser Lys Ala Cys Lys Tyr Pro Gln Ser
450 455 460
Tyr Ile Pro Phe Gly Leu Gly Pro Arg Thr Cys Val Gly Lys Asn Phe
465 470 475 480
Gly Met Met Glu Val Lys Val Leu Val Ser Leu Ile Val Ser Lys Phe
485 490 495
Ser Phe Thr Leu Ser Pro Thr Tyr Gln His Ser Pro Ser His Lys Leu
500 505 510
Leu Val Glu Pro Gln His Gly Val Val Ile Arg Val Val
515 520 525
<210> 20
<211> 1578
<212> DNA
<213> Artificial sequence
<220>
<223> Variant kaurenoic acid 13-hydroxylase sequence CpO for expression
in Yarrowia lipolitica
<400> 20
atggagtctc tggttgtcca caccgtcaac gccatctggt gcattgtcat tgtcggtatc 60
ttctccgtcg gctaccacgt ctacggccga gctgttgtcg agcagtggcg aatgcgacga 120
tctctcaagc tccagggtgt caagggtcct cctccctcca tcttcaacgg taacgtttcc 180
gagatgcagc gaatccagtc cgaggccaag cactgctccg gtgacaacat catctcccac 240
gactactctt cttctctgtt cccccacttt gaccactggc gaaagcagta cggccgaatc 300
tacacctact ccactggcct caagcagcac ctctacatca accaccccga gatggtcaag 360
gagctctccc agaccaacac cctcaacctc ggccgaatca cccacatcac caagcgactc 420
aaccccattc tcggtaacgg tatcatcacc tccaacggcc cccactgggc ccaccagcga 480
cgaatcattg cctacgagtt cacccacgac aagatcaagg gtatggtcgg tctgatggtc 540
gagtccgcca tgcccatgct caacaagtgg gaggagatgg tcaagcgagg tggtgagatg 600
ggctgtgaca tccgagtcga cgaggacctc aaggatgtct ccgctgacgt cattgccaag 660
gcctgtttcg gctctaactt ctccaagggc aaggccatct tctccatgat ccgagatctg 720
ctcaccgcca tcaccaagcg atccgtcctc ttccgattca acggtttcac cgacatggtt 780
ttcggctcca agaagcacgg tgacgttgac attgacgctc tcgagatgga gctcgagtcc 840
tccatctggg agactgtcaa ggagcgagag attgagtgca aggacaccca caagaaggac 900
ctcatgcagc tcattctcga gggtgccatg cgatcttgtg acggtaacct gtgggacaag 960
tctgcttacc gacgattcgt tgtcgacaac tgcaagtcca tctactttgc cggccacgac 1020
tccaccgccg tttccgtttc ttggtgcctc atgctgctcg ctctcaaccc ctcttggcag 1080
gtcaagatcc gagatgagat tctgtcctcc tgcaagaacg gtatccccga cgccgagtcc 1140
atccccaacc tcaagaccgt caccatggtc atccaggaga ctatgcgact ctaccctccc 1200
gctcccattg tcggccgaga ggcctccaag gacattcgac tcggtgatct ggttgtcccc 1260
aagggtgtct gtatctggac cctcatcccc gctctgcacc gagatcccga gatctggggt 1320
cccgacgcca acgacttcaa gcccgagcga ttctccgagg gtatctccaa ggcctgcaag 1380
tacccccagt cctacatccc ctttggcctc ggcccccgaa cctgtgtcgg caagaacttt 1440
ggtatgatgg aggtcaaggt cctcgtttct ctgattgtct ccaagttctc cttcactctg 1500
tctcccacct accagcactc tccctcccac aagctgctcg tcgagcccca gcacggtgtt 1560
gtcatccgag ttgtataa 1578
<210> 21
<211> 525
<212> PRT
<213> Artificial sequence
<220>
<223> Variant kaurenoic acid 13-hydroxylase
<400> 21
Met Glu Ser Leu Val Val His Thr Val Asn Ala Ile Trp Cys Ile Val
1 5 10 15
Ile Val Gly Ile Phe Ser Val Gly Tyr His Val Tyr Gly Arg Ala Val
20 25 30
Val Glu Gln Trp Arg Met Arg Arg Ser Leu Lys Leu Gln Gly Val Lys
35 40 45
Gly Pro Pro Pro Ser Ile Phe Asn Gly Asn Val Ser Glu Met Gln Arg
50 55 60
Ile Gln Ser Glu Ala Lys His Cys Ser Gly Asp Asn Ile Ile Ser His
65 70 75 80
Asp Tyr Ser Ser Ser Leu Phe Pro His Phe Asp His Trp Arg Lys Gln
85 90 95
Tyr Gly Arg Ile Tyr Thr Tyr Ser Thr Gly Leu Lys Gln His Leu Tyr
100 105 110
Ile Asn His Pro Glu Met Val Lys Glu Leu Ser Gln Thr Asn Thr Leu
115 120 125
Asn Leu Gly Arg Ile Thr His Ile Thr Lys Arg Leu Asn Pro Ile Leu
130 135 140
Gly Asn Gly Ile Ile Thr Ser Asn Gly Pro His Trp Ala His Gln Arg
145 150 155 160
Arg Ile Ile Ala Tyr Glu Phe Thr His Asp Lys Ile Lys Gly Met Val
165 170 175
Gly Leu Met Val Glu Ser Ala Met Pro Met Leu Asn Lys Trp Glu Glu
180 185 190
Met Val Lys Arg Gly Gly Glu Met Gly Cys Asp Ile Arg Val Asp Glu
195 200 205
Asp Leu Lys Asp Val Ser Ala Asp Val Ile Ala Lys Ala Cys Phe Gly
210 215 220
Ser Ser Phe Ser Lys Gly Lys Ala Ile Phe Ser Lys Ile Arg Asp Leu
225 230 235 240
Leu Thr Ala Ile Thr Lys Arg Ser Val Leu Phe Arg Phe Asn Gly Phe
245 250 255
Thr Asp Met Val Phe Gly Ser Lys Lys His Gly Asp Val Asp Ile Asp
260 265 270
Ala Leu Glu Met Glu Leu Glu Ser Ser Ile Trp Glu Thr Val Lys Glu
275 280 285
Arg Glu Ile Glu Cys Lys Asp Thr His Lys Lys Asp Leu Met Gln Leu
290 295 300
Ile Leu Glu Gly Ala Met Arg Ser Cys Asp Gly Asn Leu Trp Asp Lys
305 310 315 320
Ser Ala Tyr Arg Arg Phe Val Val Asp Asn Cys Lys Ser Ile Tyr Phe
325 330 335
Ala Gly His Asp Ser Thr Ala Val Ser Val Ser Trp Cys Leu Met Leu
340 345 350
Leu Ala Leu Asn Pro Ser Trp Gln Val Lys Ile Arg Asp Glu Ile Leu
355 360 365
Ser Ser Cys Lys Asn Gly Ile Pro Asp Ala Glu Ser Ile Pro Asn Leu
370 375 380
Lys Thr Val Thr Met Val Ile Gln Glu Thr Met Arg Leu Tyr Pro Pro
385 390 395 400
Ala Pro Ile Val Gly Arg Glu Ala Ser Lys Asp Ile Arg Leu Gly Asp
405 410 415
Leu Val Val Pro Lys Gly Val Cys Ile Trp Thr Leu Ile Pro Ala Leu
420 425 430
His Arg Asp Pro Glu Ile Trp Gly Pro Asp Ala Asn Asp Phe Lys Pro
435 440 445
Glu Arg Phe Ser Glu Gly Ile Ser Lys Ala Cys Lys Tyr Pro Gln Ser
450 455 460
Tyr Ile Pro Phe Gly Leu Gly Pro Arg Thr Cys Val Gly Lys Asn Phe
465 470 475 480
Gly Met Met Glu Val Lys Val Leu Val Ser Leu Ile Val Ser Lys Phe
485 490 495
Ser Phe Thr Leu Ser Pro Thr Tyr Gln His Ser Pro Ser His Lys Leu
500 505 510
Leu Val Glu Pro Gln His Gly Val Val Ile Arg Val Val
515 520 525
<210> 22
<211> 1578
<212> DNA
<213> Artificial sequence
<220>
<223> Variant kaurenoic acid 13-hydroxylase sequence CpO for expression
in Yarrowia lipolitica
<400> 22
atggagtctc tggttgtcca caccgtcaac gccatctggt gcattgtcat tgtcggtatc 60
ttctccgtcg gctaccacgt ctacggccga gctgttgtcg agcagtggcg aatgcgacga 120
tctctcaagc tccagggtgt caagggtcct cctccctcca tcttcaacgg taacgtttcc 180
gagatgcagc gaatccagtc cgaggccaag cactgctccg gtgacaacat catctcccac 240
gactactctt cttctctgtt cccccacttt gaccactggc gaaagcagta cggccgaatc 300
tacacctact ccactggcct caagcagcac ctctacatca accaccccga gatggtcaag 360
gagctctccc agaccaacac cctcaacctc ggccgaatca cccacatcac caagcgactc 420
aaccccattc tcggtaacgg tatcatcacc tccaacggcc cccactgggc ccaccagcga 480
cgaatcattg cctacgagtt cacccacgac aagatcaagg gtatggtcgg tctgatggtc 540
gagtccgcca tgcccatgct caacaagtgg gaggagatgg tcaagcgagg tggtgagatg 600
ggctgtgaca tccgagtcga cgaggacctc aaggatgtct ccgctgacgt cattgccaag 660
gcctgtttcg gctcttcctt ctccaagggc aaggccatct tctccaagat ccgagatctg 720
ctcaccgcca tcaccaagcg atccgtcctc ttccgattca acggtttcac cgacatggtt 780
ttcggctcca agaagcacgg tgacgttgac attgacgctc tcgagatgga gctcgagtcc 840
tccatctggg agactgtcaa ggagcgagag attgagtgca aggacaccca caagaaggac 900
ctcatgcagc tcattctcga gggtgccatg cgatcttgtg acggtaacct gtgggacaag 960
tctgcttacc gacgattcgt tgtcgacaac tgcaagtcca tctactttgc cggccacgac 1020
tccaccgccg tttccgtttc ttggtgcctc atgctgctcg ctctcaaccc ctcttggcag 1080
gtcaagatcc gagatgagat tctgtcctcc tgcaagaacg gtatccccga cgccgagtcc 1140
atccccaacc tcaagaccgt caccatggtc atccaggaga ctatgcgact ctaccctccc 1200
gctcccattg tcggccgaga ggcctccaag gacattcgac tcggtgatct ggttgtcccc 1260
aagggtgtct gtatctggac cctcatcccc gctctgcacc gagatcccga gatctggggt 1320
cccgacgcca acgacttcaa gcccgagcga ttctccgagg gtatctccaa ggcctgcaag 1380
tacccccagt cctacatccc ctttggcctc ggcccccgaa cctgtgtcgg caagaacttt 1440
ggtatgatgg aggtcaaggt cctcgtttct ctgattgtct ccaagttctc cttcactctg 1500
tctcccacct accagcactc tccctcccac aagctgctcg tcgagcccca gcacggtgtt 1560
gtcatccgag ttgtataa 1578
<210> 23
<211> 525
<212> PRT
<213> Artificial sequence
<220>
<223> Variant kaurenoic acid 13-hydroxylase
<400> 23
Met Glu Ser Leu Val Val His Thr Val Asn Ala Ile Trp Cys Ile Val
1 5 10 15
Ile Val Gly Ile Phe Ser Val Gly Tyr His Val Tyr Gly Arg Ala Val
20 25 30
Val Glu Gln Trp Arg Met Arg Arg Ser Leu Lys Leu Gln Gly Val Lys
35 40 45
Gly Pro Pro Pro Ser Ile Phe Asn Gly Asn Val Ser Glu Met Gln Arg
50 55 60
Ile Gln Ser Glu Ala Lys His Cys Ser Gly Asp Asn Ile Ile Ser His
65 70 75 80
Asp Tyr Ser Ser Ser Leu Phe Pro His Phe Asp His Trp Arg Lys Gln
85 90 95
Tyr Gly Arg Ile Tyr Thr Tyr Ser Thr Gly Leu Lys Gln His Leu Tyr
100 105 110
Ile Asn His Pro Glu Met Val Lys Glu Leu Ser Gln Thr Asn Thr Leu
115 120 125
Asn Leu Gly Arg Ile Thr His Ile Thr Lys Arg Leu Asn Pro Ile Leu
130 135 140
Gly Asn Gly Ile Ile Thr Ser Asn Gly Pro His Trp Ala His Gln Arg
145 150 155 160
Arg Ile Ile Ala Tyr Glu Phe Thr His Asp Lys Ile Lys Gly Met Val
165 170 175
Gly Leu Met Val Glu Ser Ala Met Pro Met Leu Asn Lys Trp Glu Glu
180 185 190
Met Val Lys Arg Gly Gly Glu Met Gly Cys Asp Ile Arg Val Asp Glu
195 200 205
Asp Leu Lys Asp Val Ser Ala Asp Val Ile Ala Lys Ala Cys Phe Gly
210 215 220
Ser Ser Phe Ser Lys Gly Lys Ala Ile Phe Ser Met Ile Arg Asp Leu
225 230 235 240
Leu Thr Ala Ile Thr Lys Arg Ser Val Leu Phe Arg Phe Asn Gly Phe
245 250 255
Thr Asp Met Val Phe Gly Ser Lys Lys His Gly Asp Val Asp Ile Asp
260 265 270
Ala Leu Glu Met Glu Leu Glu Ser Ser Ile Trp Glu Thr Val Lys Glu
275 280 285
Arg Glu Arg Glu Cys Lys Asp Thr His Lys Lys Asp Leu Met Gln Leu
290 295 300
Ile Leu Glu Gly Ala Met Arg Ser Cys Asp Gly Asn Leu Trp Asp Lys
305 310 315 320
Ser Ala Tyr Arg Arg Phe Val Val Asp Asn Cys Lys Ser Ile Tyr Phe
325 330 335
Ala Gly His Asp Ser Thr Ala Val Ser Val Ser Trp Cys Leu Met Leu
340 345 350
Leu Ala Leu Asn Pro Ser Trp Gln Val Lys Ile Arg Asp Glu Ile Leu
355 360 365
Ser Ser Cys Lys Asn Gly Ile Pro Asp Ala Glu Ser Ile Pro Asn Leu
370 375 380
Lys Thr Val Thr Met Val Ile Gln Glu Thr Met Arg Leu Tyr Pro Pro
385 390 395 400
Ala Pro Ile Val Gly Arg Glu Ala Ser Lys Asp Ile Arg Leu Gly Asp
405 410 415
Leu Val Val Pro Lys Gly Val Cys Ile Trp Thr Leu Ile Pro Ala Leu
420 425 430
His Arg Asp Pro Glu Ile Trp Gly Pro Asp Ala Asn Asp Phe Lys Pro
435 440 445
Glu Arg Phe Ser Glu Gly Ile Ser Lys Ala Cys Lys Tyr Pro Gln Ser
450 455 460
Tyr Ile Pro Phe Gly Leu Gly Pro Arg Thr Cys Val Gly Lys Asn Phe
465 470 475 480
Gly Met Met Glu Val Lys Val Leu Val Ser Leu Ile Val Ser Lys Phe
485 490 495
Ser Phe Thr Leu Ser Pro Thr Tyr Gln His Ser Pro Ser His Lys Leu
500 505 510
Leu Val Glu Pro Gln His Gly Val Val Ile Arg Val Val
515 520 525
<210> 24
<211> 1578
<212> DNA
<213> Artificial sequence
<220>
<223> Variant kaurenoic acid 13-hydroxylase sequence CpO for expression
in Yarrowia lipolitica
<400> 24
atggagtctc tggttgtcca caccgtcaac gccatctggt gcattgtcat tgtcggtatc 60
ttctccgtcg gctaccacgt ctacggccga gctgttgtcg agcagtggcg aatgcgacga 120
tctctcaagc tccagggtgt caagggtcct cctccctcca tcttcaacgg taacgtttcc 180
gagatgcagc gaatccagtc cgaggccaag cactgctccg gtgacaacat catctcccac 240
gactactctt cttctctgtt cccccacttt gaccactggc gaaagcagta cggccgaatc 300
tacacctact ccactggcct caagcagcac ctctacatca accaccccga gatggtcaag 360
gagctctccc agaccaacac cctcaacctc ggccgaatca cccacatcac caagcgactc 420
aaccccattc tcggtaacgg tatcatcacc tccaacggcc cccactgggc ccaccagcga 480
cgaatcattg cctacgagtt cacccacgac aagatcaagg gtatggtcgg tctgatggtc 540
gagtccgcca tgcccatgct caacaagtgg gaggagatgg tcaagcgagg tggtgagatg 600
ggctgtgaca tccgagtcga cgaggacctc aaggatgtct ccgctgacgt cattgccaag 660
gcctgtttcg gctcttcctt ctccaagggc aaggccatct tctccatgat ccgagatctg 720
ctcaccgcca tcaccaagcg atccgtcctc ttccgattca acggtttcac cgacatggtt 780
ttcggctcca agaagcacgg tgacgttgac attgacgctc tcgagatgga gctcgagtcc 840
tccatctggg agactgtcaa ggagcgagag cgagagtgca aggacaccca caagaaggac 900
ctcatgcagc tcattctcga gggtgccatg cgatcttgtg acggtaacct gtgggacaag 960
tctgcttacc gacgattcgt tgtcgacaac tgcaagtcca tctactttgc cggccacgac 1020
tccaccgccg tttccgtttc ttggtgcctc atgctgctcg ctctcaaccc ctcttggcag 1080
gtcaagatcc gagatgagat tctgtcctcc tgcaagaacg gtatccccga cgccgagtcc 1140
atccccaacc tcaagaccgt caccatggtc atccaggaga ctatgcgact ctaccctccc 1200
gctcccattg tcggccgaga ggcctccaag gacattcgac tcggtgatct ggttgtcccc 1260
aagggtgtct gtatctggac cctcatcccc gctctgcacc gagatcccga gatctggggt 1320
cccgacgcca acgacttcaa gcccgagcga ttctccgagg gtatctccaa ggcctgcaag 1380
tacccccagt cctacatccc ctttggcctc ggcccccgaa cctgtgtcgg caagaacttt 1440
ggtatgatgg aggtcaaggt cctcgtttct ctgattgtct ccaagttctc cttcactctg 1500
tctcccacct accagcactc tccctcccac aagctgctcg tcgagcccca gcacggtgtt 1560
gtcatccgag ttgtataa 1578
<210> 25
<211> 525
<212> PRT
<213> Artificial sequence
<220>
<223> Variant kaurenoic acid 13-hydroxylase
<400> 25
Met Glu Ser Leu Val Val His Thr Val Asn Ala Ile Trp Cys Ile Val
1 5 10 15
Ile Val Gly Ile Phe Ser Val Gly Tyr His Val Tyr Gly Arg Ala Val
20 25 30
Val Glu Gln Trp Arg Met Arg Arg Ser Leu Lys Leu Gln Gly Val Lys
35 40 45
Gly Pro Pro Pro Ser Ile Phe Asn Gly Asn Val Ser Glu Met Gln Arg
50 55 60
Ile Gln Ser Glu Ala Lys His Cys Ser Gly Asp Asn Ile Ile Ser His
65 70 75 80
Asp Tyr Ser Ser Ser Leu Phe Pro His Phe Asp His Trp Arg Lys Gln
85 90 95
Tyr Gly Arg Ile Tyr Thr Tyr Ser Thr Gly Leu Lys Gln His Leu Tyr
100 105 110
Ile Asn His Pro Glu Met Val Lys Glu Leu Ser Gln Thr Asn Thr Leu
115 120 125
Asn Leu Gly Arg Ile Thr His Ile Thr Lys Arg Leu Asn Pro Ile Leu
130 135 140
Gly Asn Gly Ile Ile Thr Ser Asn Gly Pro His Trp Ala His Gln Arg
145 150 155 160
Arg Ile Ile Ala Tyr Glu Phe Thr His Asp Lys Ile Lys Gly Met Val
165 170 175
Gly Leu Met Val Glu Ser Ala Met Pro Met Leu Asn Lys Trp Glu Glu
180 185 190
Met Val Lys Arg Gly Gly Glu Met Gly Cys Asp Ile Arg Val Asp Glu
195 200 205
Asp Leu Lys Asp Val Ser Ala Asp Val Ile Ala Lys Ala Cys Phe Gly
210 215 220
Ser Ser Phe Ser Lys Gly Lys Ala Ile Phe Ser Met Ile Arg Asp Leu
225 230 235 240
Leu Thr Ala Ile Thr Lys Arg Ser Val Leu Phe Arg Phe Asn Gly Phe
245 250 255
Thr Asp Met Val Phe Gly Ser Lys Lys His Gly Asp Val Asp Ile Asp
260 265 270
Ala Leu Glu Met Glu Leu Glu Ser Ser Ile Trp Glu Thr Val Lys Glu
275 280 285
Arg Glu Ile Glu Cys Lys Asp Thr His Lys Lys Asp Leu Leu Gln Leu
290 295 300
Ile Leu Glu Gly Ala Met Arg Ser Cys Asp Gly Asn Leu Trp Asp Lys
305 310 315 320
Ser Ala Tyr Arg Arg Phe Val Val Asp Asn Cys Lys Ser Ile Tyr Phe
325 330 335
Ala Gly His Asp Ser Thr Ala Val Ser Val Ser Trp Cys Leu Met Leu
340 345 350
Leu Ala Leu Asn Pro Ser Trp Gln Val Lys Ile Arg Asp Glu Ile Leu
355 360 365
Ser Ser Cys Lys Asn Gly Ile Pro Asp Ala Glu Ser Ile Pro Asn Leu
370 375 380
Lys Thr Val Thr Met Val Ile Gln Glu Thr Met Arg Leu Tyr Pro Pro
385 390 395 400
Ala Pro Ile Val Gly Arg Glu Ala Ser Lys Asp Ile Arg Leu Gly Asp
405 410 415
Leu Val Val Pro Lys Gly Val Cys Ile Trp Thr Leu Ile Pro Ala Leu
420 425 430
His Arg Asp Pro Glu Ile Trp Gly Pro Asp Ala Asn Asp Phe Lys Pro
435 440 445
Glu Arg Phe Ser Glu Gly Ile Ser Lys Ala Cys Lys Tyr Pro Gln Ser
450 455 460
Tyr Ile Pro Phe Gly Leu Gly Pro Arg Thr Cys Val Gly Lys Asn Phe
465 470 475 480
Gly Met Met Glu Val Lys Val Leu Val Ser Leu Ile Val Ser Lys Phe
485 490 495
Ser Phe Thr Leu Ser Pro Thr Tyr Gln His Ser Pro Ser His Lys Leu
500 505 510
Leu Val Glu Pro Gln His Gly Val Val Ile Arg Val Val
515 520 525
<210> 26
<211> 1578
<212> DNA
<213> Artificial sequence
<220>
<223> Variant kaurenoic acid 13-hydroxylase sequence CpO for expression
in Yarrowia lipolitica
<400> 26
atggagtctc tggttgtcca caccgtcaac gccatctggt gcattgtcat tgtcggtatc 60
ttctccgtcg gctaccacgt ctacggccga gctgttgtcg agcagtggcg aatgcgacga 120
tctctcaagc tccagggtgt caagggtcct cctccctcca tcttcaacgg taacgtttcc 180
gagatgcagc gaatccagtc cgaggccaag cactgctccg gtgacaacat catctcccac 240
gactactctt cttctctgtt cccccacttt gaccactggc gaaagcagta cggccgaatc 300
tacacctact ccactggcct caagcagcac ctctacatca accaccccga gatggtcaag 360
gagctctccc agaccaacac cctcaacctc ggccgaatca cccacatcac caagcgactc 420
aaccccattc tcggtaacgg tatcatcacc tccaacggcc cccactgggc ccaccagcga 480
cgaatcattg cctacgagtt cacccacgac aagatcaagg gtatggtcgg tctgatggtc 540
gagtccgcca tgcccatgct caacaagtgg gaggagatgg tcaagcgagg tggtgagatg 600
ggctgtgaca tccgagtcga cgaggacctc aaggatgtct ccgctgacgt cattgccaag 660
gcctgtttcg gctcttcctt ctccaagggc aaggccatct tctccatgat ccgagatctg 720
ctcaccgcca tcaccaagcg atccgtcctc ttccgattca acggtttcac cgacatggtt 780
ttcggctcca agaagcacgg tgacgttgac attgacgctc tcgagatgga gctcgagtcc 840
tccatctggg agactgtcaa ggagcgagag attgagtgca aggacaccca caagaaggac 900
ctcctccagc tcattctcga gggtgccatg cgatcttgtg acggtaacct gtgggacaag 960
tctgcttacc gacgattcgt tgtcgacaac tgcaagtcca tctactttgc cggccacgac 1020
tccaccgccg tttccgtttc ttggtgcctc atgctgctcg ctctcaaccc ctcttggcag 1080
gtcaagatcc gagatgagat tctgtcctcc tgcaagaacg gtatccccga cgccgagtcc 1140
atccccaacc tcaagaccgt caccatggtc atccaggaga ctatgcgact ctaccctccc 1200
gctcccattg tcggccgaga ggcctccaag gacattcgac tcggtgatct ggttgtcccc 1260
aagggtgtct gtatctggac cctcatcccc gctctgcacc gagatcccga gatctggggt 1320
cccgacgcca acgacttcaa gcccgagcga ttctccgagg gtatctccaa ggcctgcaag 1380
tacccccagt cctacatccc ctttggcctc ggcccccgaa cctgtgtcgg caagaacttt 1440
ggtatgatgg aggtcaaggt cctcgtttct ctgattgtct ccaagttctc cttcactctg 1500
tctcccacct accagcactc tccctcccac aagctgctcg tcgagcccca gcacggtgtt 1560
gtcatccgag ttgtataa 1578
<210> 27
<211> 525
<212> PRT
<213> Artificial sequence
<220>
<223> Variant kaurenoic acid 13-hydroxylase
<400> 27
Met Glu Ser Leu Val Val His Thr Val Asn Ala Ile Trp Cys Ile Val
1 5 10 15
Ile Val Gly Ile Phe Ser Val Gly Tyr His Val Tyr Gly Arg Ala Val
20 25 30
Val Glu Gln Trp Arg Met Arg Arg Ser Leu Lys Leu Gln Gly Val Lys
35 40 45
Gly Pro Pro Pro Ser Ile Phe Asn Gly Asn Val Ser Glu Met Gln Arg
50 55 60
Ile Gln Ser Glu Ala Lys His Cys Ser Gly Asp Asn Ile Ile Ser His
65 70 75 80
Asp Tyr Ser Ser Ser Leu Phe Pro His Phe Asp His Trp Arg Lys Gln
85 90 95
Tyr Gly Arg Ile Tyr Thr Tyr Ser Thr Gly Leu Lys Gln His Leu Tyr
100 105 110
Ile Asn His Pro Glu Met Val Lys Glu Leu Ser Gln Thr Asn Thr Leu
115 120 125
Asn Leu Gly Arg Ile Thr His Ile Thr Lys Arg Leu Asn Pro Ile Leu
130 135 140
Gly Asn Gly Ile Ile Thr Ser Asn Gly Pro His Trp Ala His Gln Arg
145 150 155 160
Arg Ile Ile Ala Tyr Glu Phe Thr His Asp Lys Ile Lys Gly Met Val
165 170 175
Gly Leu Met Val Glu Ser Ala Met Pro Met Leu Asn Lys Trp Glu Glu
180 185 190
Met Val Lys Arg Gly Gly Glu Met Gly Cys Asp Ile Arg Val Asp Glu
195 200 205
Asp Leu Lys Asp Val Ser Ala Asp Val Ile Ala Lys Ala Cys Phe Gly
210 215 220
Ser Ser Phe Ser Lys Gly Lys Ala Ile Phe Ser Met Ile Arg Asp Leu
225 230 235 240
Leu Thr Ala Ile Thr Lys Arg Ser Val Leu Phe Arg Phe Asn Gly Phe
245 250 255
Thr Asp Met Val Phe Gly Ser Lys Lys His Gly Asp Val Asp Ile Asp
260 265 270
Ala Leu Glu Met Glu Leu Glu Ser Ser Ile Trp Glu Thr Val Lys Glu
275 280 285
Arg Glu Ile Glu Cys Lys Asp Thr His Lys Lys Asp Leu Met Gln Leu
290 295 300
Ile Leu Glu Gly Ala Met Arg Ser Cys Asp Gly Asn Leu Trp Asp Lys
305 310 315 320
Ser Ala Tyr Arg Arg Phe Val Val Asp Asn Cys Lys Ser Ile Tyr Phe
325 330 335
Ala Gly His Asp Ser Thr Ala Val Ser Val Ser Trp Cys Leu Met Leu
340 345 350
Leu Ala Leu Asn Pro Ser Trp Gln Glu Lys Ile Arg Asp Glu Ile Leu
355 360 365
Ser Ser Cys Lys Asn Gly Ile Pro Asp Ala Glu Ser Ile Pro Asn Leu
370 375 380
Lys Thr Val Thr Met Val Ile Gln Glu Thr Met Arg Leu Tyr Pro Pro
385 390 395 400
Ala Pro Ile Val Gly Arg Glu Ala Ser Lys Asp Ile Arg Leu Gly Asp
405 410 415
Leu Val Val Pro Lys Gly Val Cys Ile Trp Thr Leu Ile Pro Ala Leu
420 425 430
His Arg Asp Pro Glu Ile Trp Gly Pro Asp Ala Asn Asp Phe Lys Pro
435 440 445
Glu Arg Phe Ser Glu Gly Ile Ser Lys Ala Cys Lys Tyr Pro Gln Ser
450 455 460
Tyr Ile Pro Phe Gly Leu Gly Pro Arg Thr Cys Val Gly Lys Asn Phe
465 470 475 480
Gly Met Met Glu Val Lys Val Leu Val Ser Leu Ile Val Ser Lys Phe
485 490 495
Ser Phe Thr Leu Ser Pro Thr Tyr Gln His Ser Pro Ser His Lys Leu
500 505 510
Leu Val Glu Pro Gln His Gly Val Val Ile Arg Val Val
515 520 525
<210> 28
<211> 1578
<212> DNA
<213> Artificial sequence
<220>
<223> Variant kaurenoic acid 13-hydroxylase sequence CpO for expression
in Yarrowia lipolitica
<400> 28
atggagtctc tggttgtcca caccgtcaac gccatctggt gcattgtcat tgtcggtatc 60
ttctccgtcg gctaccacgt ctacggccga gctgttgtcg agcagtggcg aatgcgacga 120
tctctcaagc tccagggtgt caagggtcct cctccctcca tcttcaacgg taacgtttcc 180
gagatgcagc gaatccagtc cgaggccaag cactgctccg gtgacaacat catctcccac 240
gactactctt cttctctgtt cccccacttt gaccactggc gaaagcagta cggccgaatc 300
tacacctact ccactggcct caagcagcac ctctacatca accaccccga gatggtcaag 360
gagctctccc agaccaacac cctcaacctc ggccgaatca cccacatcac caagcgactc 420
aaccccattc tcggtaacgg tatcatcacc tccaacggcc cccactgggc ccaccagcga 480
cgaatcattg cctacgagtt cacccacgac aagatcaagg gtatggtcgg tctgatggtc 540
gagtccgcca tgcccatgct caacaagtgg gaggagatgg tcaagcgagg tggtgagatg 600
ggctgtgaca tccgagtcga cgaggacctc aaggatgtct ccgctgacgt cattgccaag 660
gcctgtttcg gctcttcctt ctccaagggc aaggccatct tctccatgat ccgagatctg 720
ctcaccgcca tcaccaagcg atccgtcctc ttccgattca acggtttcac cgacatggtt 780
ttcggctcca agaagcacgg tgacgttgac attgacgctc tcgagatgga gctcgagtcc 840
tccatctggg agactgtcaa ggagcgagag attgagtgca aggacaccca caagaaggac 900
ctcatgcagc tcattctcga gggtgccatg cgatcttgtg acggtaacct gtgggacaag 960
tctgcttacc gacgattcgt tgtcgacaac tgcaagtcca tctactttgc cggccacgac 1020
tccaccgccg tttccgtttc ttggtgcctc atgctgctcg ctctcaaccc ctcttggcag 1080
gagaagatcc gagatgagat tctgtcctcc tgcaagaacg gtatccccga cgccgagtcc 1140
atccccaacc tcaagaccgt caccatggtc atccaggaga ctatgcgact ctaccctccc 1200
gctcccattg tcggccgaga ggcctccaag gacattcgac tcggtgatct ggttgtcccc 1260
aagggtgtct gtatctggac cctcatcccc gctctgcacc gagatcccga gatctggggt 1320
cccgacgcca acgacttcaa gcccgagcga ttctccgagg gtatctccaa ggcctgcaag 1380
tacccccagt cctacatccc ctttggcctc ggcccccgaa cctgtgtcgg caagaacttt 1440
ggtatgatgg aggtcaaggt cctcgtttct ctgattgtct ccaagttctc cttcactctg 1500
tctcccacct accagcactc tccctcccac aagctgctcg tcgagcccca gcacggtgtt 1560
gtcatccgag ttgtataa 1578
<210> 29
<211> 525
<212> PRT
<213> Artificial sequence
<220>
<223> Variant kaurenoic acid 13-hydroxylase
<400> 29
Met Glu Ser Leu Val Val His Thr Val Asn Ala Ile Trp Cys Ile Val
1 5 10 15
Ile Val Gly Ile Phe Ser Val Gly Tyr His Val Tyr Gly Arg Ala Val
20 25 30
Val Glu Gln Trp Arg Met Arg Arg Ser Leu Lys Leu Gln Gly Val Lys
35 40 45
Gly Pro Pro Pro Ser Ile Phe Asn Gly Asn Val Ser Glu Met Gln Arg
50 55 60
Ile Gln Ser Glu Ala Lys His Cys Ser Gly Asp Asn Ile Ile Ser His
65 70 75 80
Asp Tyr Ser Ser Ser Leu Phe Pro His Phe Asp His Trp Arg Lys Gln
85 90 95
Tyr Gly Arg Ile Tyr Thr Tyr Ser Thr Gly Leu Lys Gln His Leu Tyr
100 105 110
Ile Asn His Pro Glu Met Val Lys Glu Leu Ser Gln Thr Asn Thr Leu
115 120 125
Asn Leu Gly Arg Ile Thr His Ile Thr Lys Arg Leu Asn Pro Ile Leu
130 135 140
Gly Asn Gly Ile Ile Thr Ser Asn Gly Pro His Trp Ala His Gln Arg
145 150 155 160
Arg Ile Ile Ala Tyr Glu Phe Thr His Asp Lys Ile Lys Gly Met Val
165 170 175
Gly Leu Met Val Glu Ser Ala Met Pro Met Leu Asn Lys Trp Glu Glu
180 185 190
Met Val Lys Arg Gly Gly Glu Met Gly Cys Asp Ile Arg Val Asp Glu
195 200 205
Asp Leu Lys Asp Val Ser Ala Asp Val Ile Ala Lys Ala Cys Phe Gly
210 215 220
Ser Ser Phe Ser Lys Gly Lys Ala Ile Phe Ser Met Ile Arg Asp Leu
225 230 235 240
Leu Thr Ala Ile Thr Lys Arg Ser Val Leu Phe Arg Phe Asn Gly Phe
245 250 255
Thr Asp Met Val Phe Gly Ser Lys Lys His Gly Asp Val Asp Ile Asp
260 265 270
Ala Leu Glu Met Glu Leu Glu Ser Ser Ile Trp Glu Thr Val Lys Glu
275 280 285
Arg Glu Ile Glu Cys Lys Asp Thr His Lys Lys Asp Leu Met Gln Leu
290 295 300
Ile Leu Glu Gly Ala Met Arg Ser Cys Asp Gly Asn Leu Trp Asp Lys
305 310 315 320
Ser Ala Tyr Arg Arg Phe Val Val Asp Asn Cys Lys Ser Ile Tyr Phe
325 330 335
Ala Gly His Asp Ser Thr Ala Val Ser Val Ser Trp Cys Leu Met Leu
340 345 350
Leu Ala Leu Asn Pro Ser Trp Gln Val Lys Ile Arg Asp Glu Ile Leu
355 360 365
Ser Ser Cys Lys Asn Gly Ile Pro Asp Ala Glu Ser Ile Pro Asn Leu
370 375 380
Lys Thr Val Thr Met Val Ile Gln Glu Thr Met Arg Leu Tyr Pro Pro
385 390 395 400
Ala Pro Ile Val Gly Arg Glu Ala Ser Lys Asp Ile Arg Leu Gly Asp
405 410 415
Leu Val Val Pro Lys Gly Val Cys Ile Trp Thr Leu Ile Pro Ala Leu
420 425 430
His Arg Asp Pro Glu Ile Trp Gly Pro Asp Ala Asn Asp Phe Lys Pro
435 440 445
Glu Arg Phe Ser Glu Gly Ile Ser Lys Ala Cys Lys Tyr Pro Gln Ala
450 455 460
Tyr Ile Pro Phe Gly Leu Gly Pro Arg Thr Cys Val Gly Lys Asn Phe
465 470 475 480
Gly Met Met Glu Val Lys Val Leu Val Ser Leu Ile Val Ser Lys Phe
485 490 495
Ser Phe Thr Leu Ser Pro Thr Tyr Gln His Ser Pro Ser His Lys Leu
500 505 510
Leu Val Glu Pro Gln His Gly Val Val Ile Arg Val Val
515 520 525
<210> 30
<211> 1578
<212> DNA
<213> Artificial sequence
<220>
<223> Variant kaurenoic acid 13-hydroxylase sequence CpO for expression
in Yarrowia lipolitica
<400> 30
atggagtctc tggttgtcca caccgtcaac gccatctggt gcattgtcat tgtcggtatc 60
ttctccgtcg gctaccacgt ctacggccga gctgttgtcg agcagtggcg aatgcgacga 120
tctctcaagc tccagggtgt caagggtcct cctccctcca tcttcaacgg taacgtttcc 180
gagatgcagc gaatccagtc cgaggccaag cactgctccg gtgacaacat catctcccac 240
gactactctt cttctctgtt cccccacttt gaccactggc gaaagcagta cggccgaatc 300
tacacctact ccactggcct caagcagcac ctctacatca accaccccga gatggtcaag 360
gagctctccc agaccaacac cctcaacctc ggccgaatca cccacatcac caagcgactc 420
aaccccattc tcggtaacgg tatcatcacc tccaacggcc cccactgggc ccaccagcga 480
cgaatcattg cctacgagtt cacccacgac aagatcaagg gtatggtcgg tctgatggtc 540
gagtccgcca tgcccatgct caacaagtgg gaggagatgg tcaagcgagg tggtgagatg 600
ggctgtgaca tccgagtcga cgaggacctc aaggatgtct ccgctgacgt cattgccaag 660
gcctgtttcg gctcttcctt ctccaagggc aaggccatct tctccatgat ccgagatctg 720
ctcaccgcca tcaccaagcg atccgtcctc ttccgattca acggtttcac cgacatggtt 780
ttcggctcca agaagcacgg tgacgttgac attgacgctc tcgagatgga gctcgagtcc 840
tccatctggg agactgtcaa ggagcgagag attgagtgca aggacaccca caagaaggac 900
ctcatgcagc tcattctcga gggtgccatg cgatcttgtg acggtaacct gtgggacaag 960
tctgcttacc gacgattcgt tgtcgacaac tgcaagtcca tctactttgc cggccacgac 1020
tccaccgccg tttccgtttc ttggtgcctc atgctgctcg ctctcaaccc ctcttggcag 1080
gtcaagatcc gagatgagat tctgtcctcc tgcaagaacg gtatccccga cgccgagtcc 1140
atccccaacc tcaagaccgt caccatggtc atccaggaga ctatgcgact ctaccctccc 1200
gctcccattg tcggccgaga ggcctccaag gacattcgac tcggtgatct ggttgtcccc 1260
aagggtgtct gtatctggac cctcatcccc gctctgcacc gagatcccga gatctggggt 1320
cccgacgcca acgacttcaa gcccgagcga ttctccgagg gtatctccaa ggcctgcaag 1380
tacccccagg cctacatccc ctttggcctc ggcccccgaa cctgtgtcgg caagaacttt 1440
ggtatgatgg aggtcaaggt cctcgtttct ctgattgtct ccaagttctc cttcactctg 1500
tctcccacct accagcactc tccctcccac aagctgctcg tcgagcccca gcacggtgtt 1560
gtcatccgag ttgtataa 1578
<210> 31
<211> 525
<212> PRT
<213> Artificial sequence
<220>
<223> Variant kaurenoic acid 13-hydroxylase
<400> 31
Met Glu Ser Leu Val Val His Thr Val Asn Ala Ile Trp Cys Ile Val
1 5 10 15
Ile Val Gly Ile Phe Ser Val Gly Tyr His Val Tyr Gly Arg Ala Val
20 25 30
Val Glu Gln Trp Arg Met Arg Arg Ser Leu Lys Leu Gln Gly Val Lys
35 40 45
Gly Pro Pro Pro Ser Ile Phe Asn Gly Asn Val Ser Glu Met Gln Arg
50 55 60
Ile Gln Ser Glu Ala Lys His Cys Ser Gly Asp Asn Ile Ile Ser His
65 70 75 80
Asp Tyr Ser Ser Ser Leu Phe Pro His Phe Asp His Trp Arg Lys Gln
85 90 95
Tyr Gly Arg Ile Tyr Thr Tyr Ser Thr Gly Leu Lys Gln His Leu Tyr
100 105 110
Ile Asn His Pro Glu Met Val Lys Glu Leu Ser Gln Thr Asn Ser Leu
115 120 125
Asp Leu Gly Arg Ile Thr His Ile Thr Lys Arg Leu Asn Pro Ile Leu
130 135 140
Gly Asn Gly Ile Ile Thr Ser Asn Gly Pro His Trp Ala His Gln Arg
145 150 155 160
Arg Ile Ile Ala Tyr Glu Phe Thr His Asp Lys Val Lys Gly Met Val
165 170 175
Gly Leu Met Val Glu Ser Ala Met Pro Met Leu Asn Lys Trp Glu Glu
180 185 190
Met Val Lys Arg Gly Gly Glu Met Gly Cys Asp Ile Arg Val Asp Glu
195 200 205
Asp Leu Lys Asp Val Ser Ala Asp Val Ile Ala Lys Ala Cys Phe Gly
210 215 220
Ser Ser Phe Ser Lys Gly Lys Ala Ile Phe Ser Met Ile Arg Asp Leu
225 230 235 240
Leu Thr Ala Ile Thr Lys Arg Ser Val Leu Phe Arg Phe Asn Gly Phe
245 250 255
Thr Asp Met Val Phe Gly Ser Lys Lys His Gly Asp Val Asp Ile Asp
260 265 270
Ala Leu Glu Met Glu Leu Glu Ser Ser Ile Trp Glu Thr Val Lys Glu
275 280 285
Arg Glu Ile Glu Cys Lys Asp Thr His Lys Lys Asp Leu Met Gln Leu
290 295 300
Ile Leu Glu Gly Ala Met Arg Ser Cys Asp Gly Asn Leu Trp Asp Lys
305 310 315 320
Ser Ala Tyr Arg Arg Phe Val Val Asp Asn Cys Lys Ser Ile Tyr Phe
325 330 335
Ala Gly His Asp Ser Thr Ala Val Ser Val Ser Trp Cys Leu Met Leu
340 345 350
Leu Ala Leu Asn Pro Ser Trp Gln Glu Lys Ile Arg Asp Glu Ile Leu
355 360 365
Ser Ser Cys Lys Asn Gly Ile Pro Asp Ala Glu Ser Ile Pro Asn Leu
370 375 380
Lys Thr Val Thr Met Val Ile Gln Glu Thr Met Arg Leu Tyr Pro Pro
385 390 395 400
Ala Pro Ile Val Gly Arg Glu Ala Ser Lys Asp Ile Arg Leu Gly Asp
405 410 415
Leu Val Val Pro Lys Gly Val Cys Ile Trp Thr Leu Ile Pro Ala Leu
420 425 430
His Arg Asp Pro Glu Ile Trp Gly Pro Asp Ala Asn Asp Phe Lys Pro
435 440 445
Glu Arg Phe Ser Glu Gly Ile Ser Lys Ala Cys Lys Tyr Pro Gln Ala
450 455 460
Tyr Ile Pro Phe Gly Leu Gly Pro Arg Thr Cys Val Gly Lys Asn Phe
465 470 475 480
Gly Met Met Glu Val Lys Val Leu Val Ser Leu Ile Val Ser Lys Phe
485 490 495
Ser Phe Thr Leu Ser Pro Thr Tyr Gln His Ser Pro Ser His Lys Leu
500 505 510
Leu Val Glu Pro Gln His Gly Val Val Ile Arg Val Val
515 520 525
<210> 32
<211> 1578
<212> DNA
<213> Artificial sequence
<220>
<223> Variant kaurenoic acid 13-hydroxylase sequence CpO for expression
in Yarrowia lipolitica
<400> 32
atggagtctc tggttgtcca caccgtcaac gccatctggt gcattgtcat tgtcggtatc 60
ttctccgtcg gctaccacgt ctacggccga gctgttgtcg agcagtggcg aatgcgacga 120
tctctcaagc tccagggtgt caagggtcct cctccctcca tcttcaacgg taacgtttcc 180
gagatgcagc gaatccagtc cgaggccaag cactgctccg gtgacaacat catctcccac 240
gactactctt cttctctgtt cccccacttt gaccactggc gaaagcagta cggccgaatc 300
tacacctact ccactggcct caagcagcac ctctacatca accaccccga gatggtcaag 360
gagctctccc agaccaactc tctcgacctc ggccgaatca cccacatcac caagcgactc 420
aaccccattc tcggtaacgg tatcatcacc tccaacggcc cccactgggc ccaccagcga 480
cgaatcattg cctacgagtt cacccacgac aaggtcaagg gtatggtcgg tctgatggtc 540
gagtccgcca tgcccatgct caacaagtgg gaggagatgg tcaagcgagg tggtgagatg 600
ggctgtgaca tccgagtcga cgaggacctc aaggatgtct ccgctgacgt cattgccaag 660
gcctgtttcg gctcttcctt ctccaagggc aaggccatct tctccatgat ccgagatctg 720
ctcaccgcca tcaccaagcg atccgtcctc ttccgattca acggtttcac cgacatggtt 780
ttcggctcca agaagcacgg tgacgttgac attgacgctc tcgagatgga gctcgagtcc 840
tccatctggg agactgtcaa ggagcgagag attgagtgca aggacaccca caagaaggac 900
ctcatgcagc tcattctcga gggtgccatg cgatcttgtg acggtaacct gtgggacaag 960
tctgcttacc gacgattcgt tgtcgacaac tgcaagtcca tctactttgc cggccacgac 1020
tccaccgccg tttccgtttc ttggtgcctc atgctgctcg ctctcaaccc ctcttggcag 1080
gagaagatcc gagatgagat tctgtcctcc tgcaagaacg gtatccccga cgccgagtcc 1140
atccccaacc tcaagaccgt caccatggtc atccaggaga ctatgcgact ctaccctccc 1200
gctcccattg tcggccgaga ggcctccaag gacattcgac tcggtgatct ggttgtcccc 1260
aagggtgtct gtatctggac cctcatcccc gctctgcacc gagatcccga gatctggggt 1320
cccgacgcca acgacttcaa gcccgagcga ttctccgagg gtatctccaa ggcctgcaag 1380
tacccccagg cctacatccc ctttggcctc ggcccccgaa cctgtgtcgg caagaacttt 1440
ggtatgatgg aggtcaaggt cctcgtttct ctgattgtct ccaagttctc cttcactctg 1500
tctcccacct accagcactc tccctcccac aagctgctcg tcgagcccca gcacggtgtt 1560
gtcatccgag ttgtataa 1578
<210> 33
<211> 525
<212> PRT
<213> Artificial sequence
<220>
<223> Variant kaurenoic acid 13-hydroxylase
<400> 33
Met Glu Ser Leu Val Val His Thr Val Asn Ala Ile Trp Cys Ile Val
1 5 10 15
Ile Val Gly Ile Phe Ser Val Gly Tyr His Val Tyr Gly Arg Ala Val
20 25 30
Val Glu Gln Trp Arg Met Arg Arg Ser Leu Lys Leu Gln Gly Val Lys
35 40 45
Gly Pro Pro Pro Ser Ile Phe Asn Gly Asn Val Ser Glu Met Gln Arg
50 55 60
Ile Gln Ser Glu Ala Lys His Cys Ser Gly Asp Asn Ile Ile Ser His
65 70 75 80
Asp Tyr Ser Ser Ser Leu Phe Pro His Phe Asp His Trp Arg Lys Gln
85 90 95
Tyr Gly Arg Ile Tyr Thr Tyr Ser Thr Gly Leu Lys Gln His Leu Tyr
100 105 110
Ile Asn His Pro Glu Met Val Lys Glu Leu Ser Gln Thr Asn Thr Leu
115 120 125
Asn Leu Gly Arg Ile Thr His Ile Thr Lys Arg Leu Asn Pro Ile Leu
130 135 140
Gly Asn Gly Ile Ile Thr Ser Asn Gly Pro His Trp Ala His Gln Arg
145 150 155 160
Arg Ile Ile Ala Tyr Glu Phe Thr His Asp Lys Ile Lys Gly Met Val
165 170 175
Gly Leu Met Val Glu Ser Ala Met Pro Met Leu Asn Lys Trp Glu Glu
180 185 190
Met Val Glu Arg Gly Gly Glu Met Gly Cys Asp Ile Arg Val Asp Glu
195 200 205
Asp Leu Lys Asp Val Ser Ala Asp Val Ile Ala Lys Ala Cys Phe Gly
210 215 220
Ser Ser Phe Ser Lys Gly Lys Ala Ile Phe Ser Met Ile Arg Asp Leu
225 230 235 240
Leu Thr Ala Ile Thr Lys Arg Ser Val Leu Phe Arg Phe Asn Gly Phe
245 250 255
Thr Asp Met Val Phe Gly Ser Lys Lys His Gly Asp Val Asp Ile Asp
260 265 270
Ala Leu Glu Met Glu Leu Glu Ser Ser Ile Trp Glu Thr Val Lys Glu
275 280 285
Arg Glu Ile Glu Cys Lys Asp Thr His Lys Lys Asp Leu Met Gln Leu
290 295 300
Ile Leu Glu Gly Ala Met Arg Ser Cys Asp Gly Asn Leu Trp Asp Lys
305 310 315 320
Ser Ala Tyr Arg Arg Phe Val Val Asp Asn Cys Lys Ser Ile Tyr Phe
325 330 335
Ala Gly His Asp Ser Thr Ala Val Ser Val Ser Trp Cys Leu Met Leu
340 345 350
Leu Ala Leu Asn Pro Ser Trp Gln Val Lys Ile Arg Asp Glu Ile Leu
355 360 365
Ser Ser Cys Lys Asn Gly Ile Pro Asp Ala Glu Ser Ile Pro Asn Leu
370 375 380
Lys Thr Val Thr Met Val Ile Gln Glu Thr Met Arg Leu Tyr Pro Pro
385 390 395 400
Ala Pro Ile Val Gly Arg Glu Ala Ser Lys Asp Ile Arg Leu Gly Asp
405 410 415
Leu Val Val Pro Lys Gly Val Cys Ile Trp Thr Leu Ile Pro Ala Leu
420 425 430
His Arg Asp Pro Glu Ile Trp Gly Pro Asp Ala Asn Asp Phe Lys Pro
435 440 445
Glu Arg Phe Ser Glu Gly Ile Ser Lys Ala Cys Lys Tyr Pro Gln Ser
450 455 460
Tyr Ile Pro Phe Gly Leu Gly Pro Arg Thr Cys Val Gly Lys Asn Phe
465 470 475 480
Gly Met Met Glu Val Lys Val Leu Val Ser Leu Ile Val Ser Lys Phe
485 490 495
Ser Phe Thr Leu Ser Pro Thr Tyr Gln His Ser Pro Ser His Lys Leu
500 505 510
Leu Val Glu Pro Gln His Gly Val Val Ile Arg Val Val
515 520 525
<210> 34
<211> 1578
<212> DNA
<213> Artificial sequence
<220>
<223> Variant kaurenoic acid 13-hydroxylase sequence CpO for expression
in Yarrowia lipolitica
<400> 34
atggagtctc tggttgtcca caccgtcaac gccatctggt gcattgtcat tgtcggtatc 60
ttctccgtcg gctaccacgt ctacggccga gctgttgtcg agcagtggcg aatgcgacga 120
tctctcaagc tccagggtgt caagggtcct cctccctcca tcttcaacgg taacgtttcc 180
gagatgcagc gaatccagtc cgaggccaag cactgctccg gtgacaacat catctcccac 240
gactactctt cttctctgtt cccccacttt gaccactggc gaaagcagta cggccgaatc 300
tacacctact ccactggcct caagcagcac ctctacatca accaccccga gatggtcaag 360
gagctctccc agaccaacac cctcaacctc ggccgaatca cccacatcac caagcgactc 420
aaccccattc tcggtaacgg tatcatcacc tccaacggcc cccactgggc ccaccagcga 480
cgaatcattg cctacgagtt cacccacgac aagatcaagg gtatggtcgg tctgatggtc 540
gagtccgcca tgcccatgct caacaagtgg gaggagatgg tcgagcgagg tggtgagatg 600
ggctgtgaca tccgagtcga cgaggacctc aaggatgtct ccgctgacgt cattgccaag 660
gcctgtttcg gctcttcctt ctccaagggc aaggccatct tctccatgat ccgagatctg 720
ctcaccgcca tcaccaagcg atccgtcctc ttccgattca acggtttcac cgacatggtt 780
ttcggctcca agaagcacgg tgacgttgac attgacgctc tcgagatgga gctcgagtcc 840
tccatctggg agactgtcaa ggagcgagag attgagtgca aggacaccca caagaaggac 900
ctcatgcagc tcattctcga gggtgccatg cgatcttgtg acggtaacct gtgggacaag 960
tctgcttacc gacgattcgt tgtcgacaac tgcaagtcca tctactttgc cggccacgac 1020
tccaccgccg tttccgtttc ttggtgcctc atgctgctcg ctctcaaccc ctcttggcag 1080
gtcaagatcc gagatgagat tctgtcctcc tgcaagaacg gtatccccga cgccgagtcc 1140
atccccaacc tcaagaccgt caccatggtc atccaggaga ctatgcgact ctaccctccc 1200
gctcccattg tcggccgaga ggcctccaag gacattcgac tcggtgatct ggttgtcccc 1260
aagggtgtct gtatctggac cctcatcccc gctctgcacc gagatcccga gatctggggt 1320
cccgacgcca acgacttcaa gcccgagcga ttctccgagg gtatctccaa ggcctgcaag 1380
tacccccagt cctacatccc ctttggcctc ggcccccgaa cctgtgtcgg caagaacttt 1440
ggtatgatgg aggtcaaggt cctcgtttct ctgattgtct ccaagttctc cttcactctg 1500
tctcccacct accagcactc tccctcccac aagctgctcg tcgagcccca gcacggtgtt 1560
gtcatccgag ttgtataa 1578
<210> 35
<211> 525
<212> PRT
<213> Artificial sequence
<220>
<223> Variant kaurenoic acid 13-hydroxylase
<400> 35
Met Glu Ser Leu Val Val His Thr Val Asn Ala Ile Trp Cys Ile Val
1 5 10 15
Ile Val Gly Ile Phe Ser Val Gly Tyr His Val Tyr Gly Arg Ala Val
20 25 30
Val Glu Gln Trp Arg Met Arg Arg Ser Leu Lys Leu Gln Gly Val Lys
35 40 45
Gly Pro Pro Pro Ser Ile Phe Asn Gly Asn Val Ser Glu Met Gln Arg
50 55 60
Ile Gln Ser Glu Ala Lys His Cys Ser Gly Asp Asn Ile Ile Ser His
65 70 75 80
Asp Tyr Ser Ser Ser Leu Phe Pro His Phe Asp His Trp Arg Lys Gln
85 90 95
Tyr Gly Arg Ile Tyr Thr Tyr Ser Thr Gly Leu Lys Gln His Leu Tyr
100 105 110
Ile Asn His Pro Glu Met Val Lys Glu Leu Ser Gln Thr Asn Thr Leu
115 120 125
Asn Leu Gly Arg Ile Thr His Ile Thr Lys Arg Leu Asn Pro Ile Leu
130 135 140
Gly Asn Gly Ile Ile Thr Ser Asn Gly Pro His Trp Ala His Gln Arg
145 150 155 160
Arg Ile Ile Ala Tyr Glu Phe Thr His Asp Lys Ile Lys Gly Met Val
165 170 175
Gly Leu Met Val Glu Ser Ala Met Pro Met Leu Asn Lys Trp Glu Glu
180 185 190
Met Val Lys Ala Gly Gly Glu Met Gly Cys Asp Ile Arg Val Asp Glu
195 200 205
Asp Leu Lys Asp Val Ser Ala Asp Val Ile Ala Lys Ala Cys Phe Gly
210 215 220
Ser Ser Phe Ser Lys Gly Lys Ala Ile Phe Ser Met Ile Arg Asp Leu
225 230 235 240
Leu Thr Ala Ile Thr Lys Arg Ser Val Leu Phe Arg Phe Asn Gly Phe
245 250 255
Thr Asp Met Val Phe Gly Ser Lys Lys His Gly Asp Val Asp Ile Asp
260 265 270
Ala Leu Glu Met Glu Leu Glu Ser Ser Ile Trp Glu Thr Val Lys Glu
275 280 285
Arg Glu Ile Glu Cys Lys Asp Thr His Lys Lys Asp Leu Met Gln Leu
290 295 300
Ile Leu Glu Gly Ala Met Arg Ser Cys Asp Gly Asn Leu Trp Asp Lys
305 310 315 320
Ser Ala Tyr Arg Arg Phe Val Val Asp Asn Cys Lys Ser Ile Tyr Phe
325 330 335
Ala Gly His Asp Ser Thr Ala Val Ser Val Ser Trp Cys Leu Met Leu
340 345 350
Leu Ala Leu Asn Pro Ser Trp Gln Val Lys Ile Arg Asp Glu Ile Leu
355 360 365
Ser Ser Cys Lys Asn Gly Ile Pro Asp Ala Glu Ser Ile Pro Asn Leu
370 375 380
Lys Thr Val Thr Met Val Ile Gln Glu Thr Met Arg Leu Tyr Pro Pro
385 390 395 400
Ala Pro Ile Val Gly Arg Glu Ala Ser Lys Asp Ile Arg Leu Gly Asp
405 410 415
Leu Val Val Pro Lys Gly Val Cys Ile Trp Thr Leu Ile Pro Ala Leu
420 425 430
His Arg Asp Pro Glu Ile Trp Gly Pro Asp Ala Asn Asp Phe Lys Pro
435 440 445
Glu Arg Phe Ser Glu Gly Ile Ser Lys Ala Cys Lys Tyr Pro Gln Ser
450 455 460
Tyr Ile Pro Phe Gly Leu Gly Pro Arg Thr Cys Val Gly Lys Asn Phe
465 470 475 480
Gly Met Met Glu Val Lys Val Leu Val Ser Leu Ile Val Ser Lys Phe
485 490 495
Ser Phe Thr Leu Ser Pro Thr Tyr Gln His Ser Pro Ser His Lys Leu
500 505 510
Leu Val Glu Pro Gln His Gly Val Val Ile Arg Val Val
515 520 525
<210> 36
<211> 1578
<212> DNA
<213> Artificial sequence
<220>
<223> Variant kaurenoic acid 13-hydroxylase sequence CpO for expression
in Yarrowia lipolitica
<400> 36
atggagtctc tggttgtcca caccgtcaac gccatctggt gcattgtcat tgtcggtatc 60
ttctccgtcg gctaccacgt ctacggccga gctgttgtcg agcagtggcg aatgcgacga 120
tctctcaagc tccagggtgt caagggtcct cctccctcca tcttcaacgg taacgtttcc 180
gagatgcagc gaatccagtc cgaggccaag cactgctccg gtgacaacat catctcccac 240
gactactctt cttctctgtt cccccacttt gaccactggc gaaagcagta cggccgaatc 300
tacacctact ccactggcct caagcagcac ctctacatca accaccccga gatggtcaag 360
gagctctccc agaccaacac cctcaacctc ggccgaatca cccacatcac caagcgactc 420
aaccccattc tcggtaacgg tatcatcacc tccaacggcc cccactgggc ccaccagcga 480
cgaatcattg cctacgagtt cacccacgac aagatcaagg gtatggtcgg tctgatggtc 540
gagtccgcca tgcccatgct caacaagtgg gaggagatgg tcaaggccgg tggtgagatg 600
ggctgtgaca tccgagtcga cgaggacctc aaggatgtct ccgctgacgt cattgccaag 660
gcctgtttcg gctcttcctt ctccaagggc aaggccatct tctccatgat ccgagatctg 720
ctcaccgcca tcaccaagcg atccgtcctc ttccgattca acggtttcac cgacatggtt 780
ttcggctcca agaagcacgg tgacgttgac attgacgctc tcgagatgga gctcgagtcc 840
tccatctggg agactgtcaa ggagcgagag attgagtgca aggacaccca caagaaggac 900
ctcatgcagc tcattctcga gggtgccatg cgatcttgtg acggtaacct gtgggacaag 960
tctgcttacc gacgattcgt tgtcgacaac tgcaagtcca tctactttgc cggccacgac 1020
tccaccgccg tttccgtttc ttggtgcctc atgctgctcg ctctcaaccc ctcttggcag 1080
gtcaagatcc gagatgagat tctgtcctcc tgcaagaacg gtatccccga cgccgagtcc 1140
atccccaacc tcaagaccgt caccatggtc atccaggaga ctatgcgact ctaccctccc 1200
gctcccattg tcggccgaga ggcctccaag gacattcgac tcggtgatct ggttgtcccc 1260
aagggtgtct gtatctggac cctcatcccc gctctgcacc gagatcccga gatctggggt 1320
cccgacgcca acgacttcaa gcccgagcga ttctccgagg gtatctccaa ggcctgcaag 1380
tacccccagt cctacatccc ctttggcctc ggcccccgaa cctgtgtcgg caagaacttt 1440
ggtatgatgg aggtcaaggt cctcgtttct ctgattgtct ccaagttctc cttcactctg 1500
tctcccacct accagcactc tccctcccac aagctgctcg tcgagcccca gcacggtgtt 1560
gtcatccgag ttgtataa 1578
<210> 37
<211> 525
<212> PRT
<213> Artificial sequence
<220>
<223> Variant kaurenoic acid 13-hydroxylase
<400> 37
Met Glu Ser Leu Val Val His Thr Val Asn Ala Ile Trp Cys Ile Val
1 5 10 15
Ile Val Gly Ile Phe Ser Val Gly Tyr His Val Tyr Gly Arg Ala Val
20 25 30
Val Glu Gln Trp Arg Met Arg Arg Ser Leu Lys Leu Gln Gly Val Lys
35 40 45
Gly Pro Pro Pro Ser Ile Phe Asn Gly Asn Val Ser Glu Met Gln Arg
50 55 60
Ile Gln Ser Glu Ala Lys His Cys Ser Gly Asp Asn Ile Ile Ser His
65 70 75 80
Asp Tyr Ser Ser Ser Leu Phe Pro His Phe Asp His Trp Arg Lys Gln
85 90 95
Tyr Gly Arg Ile Tyr Thr Tyr Ser Thr Gly Leu Lys Gln His Leu Tyr
100 105 110
Ile Asn His Pro Glu Met Val Lys Glu Leu Ser Gln Thr Asn Thr Leu
115 120 125
Asn Leu Gly Arg Ile Thr His Ile Thr Lys Arg Leu Asn Pro Ile Leu
130 135 140
Gly Asn Gly Ile Ile Thr Ser Asn Gly Pro His Trp Ala His Gln Arg
145 150 155 160
Arg Ile Ile Ala Tyr Glu Phe Thr His Asp Lys Ile Lys Gly Met Val
165 170 175
Gly Leu Met Val Glu Ser Ala Met Pro Met Leu Asn Lys Trp Glu Glu
180 185 190
Met Val Lys Arg Glu Gly Glu Met Gly Cys Asp Ile Arg Val Asp Glu
195 200 205
Asp Leu Lys Asp Val Ser Ala Asp Val Ile Ala Lys Ala Cys Phe Gly
210 215 220
Ser Ser Phe Ser Lys Gly Lys Ala Ile Phe Ser Met Ile Arg Asp Leu
225 230 235 240
Leu Thr Ala Ile Thr Lys Arg Ser Val Leu Phe Arg Phe Asn Gly Phe
245 250 255
Thr Asp Met Val Phe Gly Ser Lys Lys His Gly Asp Val Asp Ile Asp
260 265 270
Ala Leu Glu Met Glu Leu Glu Ser Ser Ile Trp Glu Thr Val Lys Glu
275 280 285
Arg Glu Ile Glu Cys Lys Asp Thr His Lys Lys Asp Leu Met Gln Leu
290 295 300
Ile Leu Glu Gly Ala Met Arg Ser Cys Asp Gly Asn Leu Trp Asp Lys
305 310 315 320
Ser Ala Tyr Arg Arg Phe Val Val Asp Asn Cys Lys Ser Ile Tyr Phe
325 330 335
Ala Gly His Asp Ser Thr Ala Val Ser Val Ser Trp Cys Leu Met Leu
340 345 350
Leu Ala Leu Asn Pro Ser Trp Gln Val Lys Ile Arg Asp Glu Ile Leu
355 360 365
Ser Ser Cys Lys Asn Gly Ile Pro Asp Ala Glu Ser Ile Pro Asn Leu
370 375 380
Lys Thr Val Thr Met Val Ile Gln Glu Thr Met Arg Leu Tyr Pro Pro
385 390 395 400
Ala Pro Ile Val Gly Arg Glu Ala Ser Lys Asp Ile Arg Leu Gly Asp
405 410 415
Leu Val Val Pro Lys Gly Val Cys Ile Trp Thr Leu Ile Pro Ala Leu
420 425 430
His Arg Asp Pro Glu Ile Trp Gly Pro Asp Ala Asn Asp Phe Lys Pro
435 440 445
Glu Arg Phe Ser Glu Gly Ile Ser Lys Ala Cys Lys Tyr Pro Gln Ser
450 455 460
Tyr Ile Pro Phe Gly Leu Gly Pro Arg Thr Cys Val Gly Lys Asn Phe
465 470 475 480
Gly Met Met Glu Val Lys Val Leu Val Ser Leu Ile Val Ser Lys Phe
485 490 495
Ser Phe Thr Leu Ser Pro Thr Tyr Gln His Ser Pro Ser His Lys Leu
500 505 510
Leu Val Glu Pro Gln His Gly Val Val Ile Arg Val Val
515 520 525
<210> 38
<211> 1578
<212> DNA
<213> Artificial sequence
<220>
<223> Variant kaurenoic acid 13-hydroxylase sequence CpO for expression
in Yarrowia lipolitica
<400> 38
atggagtctc tggttgtcca caccgtcaac gccatctggt gcattgtcat tgtcggtatc 60
ttctccgtcg gctaccacgt ctacggccga gctgttgtcg agcagtggcg aatgcgacga 120
tctctcaagc tccagggtgt caagggtcct cctccctcca tcttcaacgg taacgtttcc 180
gagatgcagc gaatccagtc cgaggccaag cactgctccg gtgacaacat catctcccac 240
gactactctt cttctctgtt cccccacttt gaccactggc gaaagcagta cggccgaatc 300
tacacctact ccactggcct caagcagcac ctctacatca accaccccga gatggtcaag 360
gagctctccc agaccaacac cctcaacctc ggccgaatca cccacatcac caagcgactc 420
aaccccattc tcggtaacgg tatcatcacc tccaacggcc cccactgggc ccaccagcga 480
cgaatcattg cctacgagtt cacccacgac aagatcaagg gtatggtcgg tctgatggtc 540
gagtccgcca tgcccatgct caacaagtgg gaggagatgg tcaagcgaga gggtgagatg 600
ggctgtgaca tccgagtcga cgaggacctc aaggatgtct ccgctgacgt cattgccaag 660
gcctgtttcg gctcttcctt ctccaagggc aaggccatct tctccatgat ccgagatctg 720
ctcaccgcca tcaccaagcg atccgtcctc ttccgattca acggtttcac cgacatggtt 780
ttcggctcca agaagcacgg tgacgttgac attgacgctc tcgagatgga gctcgagtcc 840
tccatctggg agactgtcaa ggagcgagag attgagtgca aggacaccca caagaaggac 900
ctcatgcagc tcattctcga gggtgccatg cgatcttgtg acggtaacct gtgggacaag 960
tctgcttacc gacgattcgt tgtcgacaac tgcaagtcca tctactttgc cggccacgac 1020
tccaccgccg tttccgtttc ttggtgcctc atgctgctcg ctctcaaccc ctcttggcag 1080
gtcaagatcc gagatgagat tctgtcctcc tgcaagaacg gtatccccga cgccgagtcc 1140
atccccaacc tcaagaccgt caccatggtc atccaggaga ctatgcgact ctaccctccc 1200
gctcccattg tcggccgaga ggcctccaag gacattcgac tcggtgatct ggttgtcccc 1260
aagggtgtct gtatctggac cctcatcccc gctctgcacc gagatcccga gatctggggt 1320
cccgacgcca acgacttcaa gcccgagcga ttctccgagg gtatctccaa ggcctgcaag 1380
tacccccagt cctacatccc ctttggcctc ggcccccgaa cctgtgtcgg caagaacttt 1440
ggtatgatgg aggtcaaggt cctcgtttct ctgattgtct ccaagttctc cttcactctg 1500
tctcccacct accagcactc tccctcccac aagctgctcg tcgagcccca gcacggtgtt 1560
gtcatccgag ttgtataa 1578
<210> 39
<211> 1503
<212> DNA
<213> Artificial sequence
<220>
<223> hydroxymethylglutaryl-CoA reductase from Yarrowia lipolitica, CpO
for expression in Yarrowia lipolitica
<400> 39
atgacccagt ctgtgaaggt ggttgagaag cacgttccta tcgtcattga gaagcccagc 60
gagaaggagg aggacacctc ttctgaagac tccattgagc tgactgtcgg aaagcagccc 120
aagcccgtga ccgagacccg ttctctggac gacttggagg ctatcatgaa ggcaggtaag 180
accaagctcc tggaggacca cgaggttgtc aagctctctc tcgaaggcaa gctccctttg 240
tatgctcttg agaagcagct tggtgacaac acccgagctg ttggcatccg acgatctatc 300
atctcccagc agtctaatac caagactctt gagacctcaa agctccctta cctgcactac 360
gactacgacc gtgtttttgg agcctgttgc gagaacgtta ttggttacat gcctctcccc 420
gttggtgttg ctggccccat gaacattgat ggcaagaact accacattcc tatggccacc 480
actgagggtt gtcttgttgc ctcaaccatg cgaggttgca aggccatcaa cgccggtggc 540
ggtgttacca ctgtgcttac tcaggacggt atgacacgag gtccttgtgt ttccttcccc 600
tctctcaagc gggctggagc cgctaagatc tggcttgatt ccgaggaggg tctcaagtcc 660
atgcgaaagg ccttcaactc cacctctcga tttgctcgtc tccagtctct tcactctacc 720
cttgctggta acctgctgtt tattcgattc cgaaccacca ctggtgatgc catgggcatg 780
aacatgatct ccaagggcgt cgaacactct ctggccgtca tggtcaagga gtacggcttc 840
cctgatatgg acattgtgtc tgtctcgggt aactactgca ctgacaagaa gcccgcagcg 900
atcaactgga tcgaaggccg aggcaagagt gttgttgccg aagccaccat ccctgctcac 960
attgtcaagt ctgttctcaa aagtgaggtt gacgctcttg ttgagctcaa catcagcaag 1020
aatctgatcg gtagtgccat ggctggctct gtgggaggtt tcaatgcaca cgccgcaaac 1080
ctggtgaccg ccatctacct tgccactggc caggatcctg ctcagaatgt cgagtcttcc 1140
aactgcatca cgctgatgag caacgtcgac ggtaacctgc tcatctccgt ttccatgcct 1200
tctatcgagg tcggtaccat tggtggaggt actattttgg agccccaggg tgctatgctg 1260
gagatgcttg gcgtgcgagg tcctcacatc gagacccccg gtgccaacgc ccaacagctt 1320
gctcgcatca ttgcttctgg agttcttgca gcggagcttt cgctgtgttc tgctcttgct 1380
gccggccatc ttgtgcaaag tcatatgacc cacaaccgtt cccaggctcc tactccggcc 1440
aagcagtctc aggccgatct gcagcgtctc caaaacggtt cgaatatctg cattcggtca 1500
tag 1503
<210> 40
<211> 984
<212> DNA
<213> Artificial sequence
<220>
<223> Geranylgeranyl diphosphate synthase from Yarrowia lipolitica CpO
for expression in Yarrowia lipolitica
<400> 40
atggattata acagcgcgga tttcaaggag atctggggca aggccgccga caccgcgctg 60
ctgggaccgt acaactacct cgccaacaac cggggccaca acatcagaga acacttgatc 120
gcagcgttcg gagcggttat caaggtggac aagagcgatc tcgaaaccat ttcgcacatc 180
accaagattt tgcataactc gtcgctgctt gttgatgacg tggaagacaa ctcgatgctc 240
cgacgaggcc tgccggcagc ccattgtctg tttggagtcc cccaaaccat caactccgcc 300
aactacatgt actttgtggc tctgcaggag gtgctcaagc tcaagtctta tgatgccgtc 360
tccattttca ccgaggaaat gatcaacttg catagaggtc agggtatgga tctctactgg 420
agagaaacac tcacttgccc ctcggaagac gagtatctgg agatggtggt gcacaagacc 480
ggaggactgt ttcggctggc tctgagactt atgctgtcgg tggcatcgaa acaggaggac 540
catgaaaaga tcaactttga tctcacacac cttaccgaca cactgggagt catttaccag 600
attctggatg attacctcaa cctgcagtcc acggaattga ccgagaacaa gggattctgc 660
gaagatatca gcgaaggaaa gttttcgttt ccgctgattc acagcatccg gaccaacccg 720
gataaccacg agattctcaa cattctcaaa cagcgaacaa gcgacgcttc actcaaaaag 780
tacgccgtgg actacatgag aacagaaacc aagagtttcg actactgcct caagagaatc 840
caggccatgt cactcaaggc aagttcgtac attgatgatc tcgcagcagc cggccacgat 900
gtctccaagt tgcgagccat tttgcattat tttgtgtcca cctctgactg tgaggagaga 960
aagtactttg aggatgcgca gtga 984
<210> 41
<211> 927
<212> DNA
<213> Artificial sequence
<220>
<223> geranylgeranyl diphosphate synthase from Mucor circenelloides,
codon optimized for expression in Yarrowia lipolitica.
<400> 41
atgctagcca caaaaatgct caactctcac aaccgaaccg aggagcgatc caccgaggat 60
attattctcg agccttacac ctacctcatt tctcagcccg gaaaggacat tcgagctaag 120
ctcatttctg cctttgacct ctggctgcac gttcctaagg atgttctttg cgtcatcaac 180
aagattatcg gtatgctgca caacgcctct cttatgattg acgatgttca ggacgactct 240
gatctccgac gaggagtccc cgttgctcac cacatttacg gtgtccctca gactattaac 300
accgctaact acgtgatttt cctcgccctt caggaggtta tgaagctgaa catcccttct 360
atgatgcagg tgtgtaccga ggagcttatt aacctccacc gaggtcaggg aattgagctg 420
tactggcgag attccctcac ttgtcccact gaggaggagt acattgatat ggttaacaac 480
aagacctctg gcctccttcg acttgccgtc cgactgatgc aggctgcttc tgagtccgac 540
atcgactaca cccctctcgt caacattatc ggaattcact tccaggttcg agatgactac 600
atgaacctcc agtccacctc ttacactaac aacaagggct tttgcgagga cctgaccgag 660
ggaaagttct ccttccctat tattcacgct attcgaaagg acccctctaa ccgacagctc 720
ctgaacatta tctctcagaa gcccacctcc attgaggtta agaagtacgc tcttgaggtg 780
atccgaaagg ctggatcttt tgagtacgtt cgagagttcc ttcgacagaa ggaggctgag 840
tccctgaagg agatcaagcg acttggcggc aaccctctcc tcgagaagta cattgagact 900
attcgagtcg aggctactaa cgactaa 927
<210> 42
<211> 2232
<212> DNA
<213> Artificial sequence
<220>
<223> Copalyl pyrophosphate synthase from Stevia rebaudiana CpO for
expression in Yarrowia lipolitica
<400> 42
atgtgcaagg ctgtttccaa ggagtactcc gatctgctcc agaaggacga ggcctctttc 60
accaagtggg acgacgacaa ggtcaaggac cacctcgaca ccaacaagaa cctctacccc 120
aacgacgaga tcaaggagtt tgtcgagtcc gtcaaggcca tgttcggctc catgaacgac 180
ggcgagatta atgtctctgc ttacgacacc gcctgggttg ctctggtcca ggatgtcgac 240
ggttccggct ctcctcagtt cccttcctct ctcgagtgga tcgccaacaa ccagctgtcc 300
gacggttctt ggggtgacca cctgctcttc tctgctcacg accgaatcat caacaccctg 360
gcctgtgtca ttgctctgac ctcttggaac gtccacccct ccaagtgcga gaagggtctg 420
aacttcctcc gagagaacat ctgcaagctc gaggacgaga acgccgagca catgcccatt 480
ggcttcgagg tcaccttccc ctctctgatt gacattgcca agaagctcaa cattgaggtc 540
cccgaggaca cccccgctct caaggagatc tacgctcgac gagacatcaa gctcaccaag 600
atccccatgg aggttctcca caaggtcccc accactctcc tccactctct cgagggtatg 660
cccgatctcg agtgggagaa gctgctcaag ctgcagtgca aggacggctc tttcctcttc 720
tccccctctt ccactgcctt cgccctcatg cagaccaagg acgagaagtg tctccagtac 780
ctcaccaaca ttgtcaccaa gttcaacggt ggtgtcccca acgtctaccc cgttgacctc 840
tttgagcaca tctgggttgt tgaccgactc cagcgactcg gtatcgcccg atacttcaag 900
tccgagatca aggactgtgt cgagtacatc aacaagtact ggaccaagaa cggtatctgc 960
tgggcccgaa acacccacgt ccaggacatt gacgacaccg ccatgggctt ccgagttctg 1020
cgagcccacg gctacgatgt cacccccgat gtctttcgac agtttgagaa ggacggcaag 1080
tttgtctgtt tcgccggtca gtccacccag gccgtcaccg gtatgttcaa cgtctaccga 1140
gcttctcaga tgctcttccc cggtgagcga atcctcgagg acgccaagaa gttctcctac 1200
aactacctca aggagaagca gtccaccaac gagctgctcg acaagtggat cattgccaag 1260
gatctgcccg gtgaggttgg ctacgccctc gacatcccct ggtacgcctc tctgccccga 1320
ctggagactc gatactacct cgagcagtac ggtggtgagg acgatgtctg gatcggtaag 1380
accctgtacc gaatgggcta cgtttccaac aacacctacc tcgagatggc caagctcgac 1440
tacaacaact acgttgccgt cctccagctc gagtggtaca ccatccagca gtggtacgtc 1500
gacattggta tcgagaagtt cgagtccgac aacatcaagt ccgtccttgt ctcctactac 1560
ctcgctgctg cctccatctt cgagcccgag cgatccaagg agcgaattgc ctgggccaag 1620
accaccatcc tcgtcgacaa gatcacctcc atcttcgact cctcccagtc ctccaaggaa 1680
gatatcaccg ccttcattga caagttccga aacaagtcct cctccaagaa gcactccatc 1740
aacggcgagc cctggcacga ggtcatggtt gctctcaaga aaactctcca cggctttgcc 1800
ctcgacgctc tgatgaccca ctctcaggac atccaccccc agctccacca ggcctgggag 1860
atgtggctca ccaagctcca ggacggtgtt gatgtcactg ctgagctcat ggtccagatg 1920
atcaacatga ccgccggccg atgggtttcc aaggagctcc tcacccaccc ccagtaccag 1980
cgactctcca ctgtcaccaa ctctgtctgc cacgacatca ccaagctcca caacttcaag 2040
gagaactcca ccaccgtcga ctccaaggtc caggagctgg tccagctcgt tttctccgac 2100
acccccgatg atctcgacca ggacatgaag cagaccttcc tgactgtcat gaaaactttc 2160
tactacaagg cctggtgcga ccccaacacc atcaacgacc acatctccaa ggtctttgag 2220
attgtgattt aa 2232
<210> 43
<211> 2274
<212> DNA
<213> Artificial sequence
<220>
<223> Kaurene synthase from Stevia rebaudiana CpO for expression in
Yarrowia lipolitica
<400> 43
atgacctccc acggcggcca gaccaacccc accaacctca tcattgacac caccaaggag 60
cgaatccaga agcagttcaa gaacgtcgag atctccgttt cctcctacga caccgcctgg 120
gtcgccatgg tcccctctcc caactccccc aagtctccct gcttccccga gtgtctcaac 180
tggctcatca acaaccagct caacgacggc tcttggggtc tggtcaacca cacccacaac 240
cacaaccacc ccctcctcaa ggactctctc tcttccactc tcgcctgcat tgttgctctc 300
aagcgatgga acgttggcga ggaccagatc aacaagggtc tgtctttcat tgagtccaac 360
ctcgcctccg ccaccgagaa gtcccagccc tcccccattg gctttgatat catcttcccc 420
ggtctgctcg agtacgccaa gaacctcgat atcaacctgc tctccaagca gaccgacttc 480
tctctcatgc tgcacaagcg agagctcgag cagaagcgat gccactccaa cgagatggac 540
ggctacctgg cctacatttc cgagggtctg ggtaacctct acgactggaa catggtcaag 600
aagtaccaga tgaagaacgg ttccgttttc aactccccct ctgccaccgc tgctgccttc 660
atcaaccacc agaaccccgg ctgtctcaac tacctcaact ctctgctcga caagtttggt 720
aacgccgtcc ccactgtcta cccccacgat ctcttcatcc gactctccat ggtcgacacc 780
attgagcgac tcggtatttc ccaccacttc cgagtcgaga tcaagaacgt tctcgatgag 840
acttaccgat gctgggttga gcgagatgag cagatcttca tggacgttgt cacctgtgct 900
ctggccttcc gactcctccg aatcaacggt tacgaggttt cccccgaccc cctcgccgag 960
atcaccaacg agctggctct caaggacgag tacgccgccc tcgagactta ccacgcttct 1020
cacattctgt accaagagga tctgtcctcc ggcaagcaga ttctcaagtc cgccgacttc 1080
ctcaaggaga tcatctccac tgactccaac cgactctcca agctcatcca caaggaagtc 1140
gagaacgctc tcaagttccc catcaacacc ggtctggagc gaatcaacac ccgacgaaac 1200
atccagctct acaacgtcga caacacccga attctcaaga ccacctacca ctcttccaac 1260
atctccaaca ccgactacct gcgactcgcc gtcgaggact tctacacctg ccagtccatc 1320
taccgagagg agctcaaggg tctggagcga tgggttgtcg agaacaagct cgaccagctc 1380
aagtttgccc gacaaaagac tgcctactgc tacttctccg ttgctgccac cctctcttct 1440
cccgagctct ccgacgcccg aatctcttgg gccaagaacg gtatcctgac cactgttgtc 1500
gacgacttct ttgacattgg tggcaccatt gacgagctga ccaacctcat ccagtgcgtc 1560
gagaagtgga acgtcgacgt tgacaaggac tgttgttccg agcacgtccg aatcctcttc 1620
ctggctctca aggacgccat ctgctggatc ggtgacgagg ccttcaagtg gcaggctcga 1680
gatgtcactt cccacgtcat ccagacctgg ctcgagctca tgaactccat gctgcgagag 1740
gccatctgga cccgagatgc ctacgtcccc accctcaacg agtacatgga gaacgcctac 1800
gtcagctttg ctctcggtcc cattgtcaag cccgccatct actttgtcgg tcccaagctg 1860
tccgaggaga ttgtcgagtc ctccgagtac cacaacctct tcaagctcat gtccacccag 1920
ggccgactcc tcaacgatat ccactccttc aagcgagagt tcaaggaagg taagctcaac 1980
gccgttgctc tgcacctgtc caacggtgag tccggcaagg tcgaggaaga ggtcgtcgag 2040
gagatgatga tgatgatcaa gaacaagcga aaggagctca tgaagctcat cttcgaggag 2100
aacggctcca ttgtcccccg agcctgcaag gacgccttct ggaacatgtg ccacgtcctc 2160
aacttcttct acgccaacga cgacggtttc accggcaaca ccattctcga caccgtcaag 2220
gacatcatct acaaccctct ggttctggtc aacgagaacg aggagcagag gtaa 2274
<210> 44
<211> 1578
<212> DNA
<213> Artificial sequence
<220>
<223> Kaurene oxidase from Giberella fujikuroi CpO for expression in
Yarrowia lipolitica
<400> 44
atgtccaagt ccaactccat gaactccacc tcccacgaga ctctcttcca gcagctcgtt 60
ctcggcctcg accgaatgcc cctcatggac gtccactggc tcatctacgt tgcctttggt 120
gcctggctct gctcctacgt catccacgtt ctgtcctctt cctccactgt caaggtcccc 180
gtcgtcggtt accgatccgt tttcgagccc acctggctcc tccgactgcg attcgtctgg 240
gagggtggtt ccatcattgg ccagggctac aacaagttca aggactccat cttccaggtc 300
cgaaagctcg gtaccgacat tgtcatcatc cctcccaact acattgacga ggtccgaaag 360
ctctcccagg acaagacccg atccgtcgag cccttcatca acgactttgc cggccagtac 420
acccgaggta tggtctttct gcagtccgat ctccagaacc gagtcatcca gcagcgactc 480
acccccaagc ttgtctctct caccaaggtc atgaaggaag agctcgacta cgctctgacc 540
aaggagatgc ccgacatgaa gaacgacgag tgggttgagg tcgacatctc ttccatcatg 600
gtccgactca tctctcgaat ctccgcccga gttttcctcg gccccgagca ctgccgaaac 660
caggagtggc tcaccaccac cgccgagtac tccgagtctc tcttcatcac cggcttcatc 720
ctccgagttg tcccccacat tctccgaccc ttcattgctc ctctgctgcc ctcttaccga 780
accctgctgc gaaacgtttc ttccggccga cgagtcattg gtgatatcat ccgatcccag 840
cagggtgacg gtaacgagga catcctctct tggatgcgag atgctgccac tggtgaggag 900
aagcagatcg acaacattgc ccagcgaatg ctcattctgt ctctcgcctc catccacacc 960
accgccatga ccatgaccca cgccatgtac gatctgtgtg cctgccccga gtacattgag 1020
cccctccgag atgaggtcaa gtccgtcgtt ggtgcttctg gctgggacaa gaccgctctc 1080
aaccgattcc acaagctcga ctctttcctc aaggagtccc agcgattcaa ccccgttttc 1140
ctgctcacct tcaaccgaat ctaccaccag tccatgaccc tctccgatgg taccaacatc 1200
ccctccggta cccgaattgc tgtcccctct cacgccatgc tccaggactc cgcccacgtc 1260
cccggtccca ctcctcccac tgagttcgac ggtttccgat actccaagat ccgatccgac 1320
tccaactacg cccagaagta cctcttctcc atgaccgact cttccaacat ggcctttggc 1380
tacggtaagt acgcctgccc cggccgattc tacgcctcca acgagatgaa gctgactctg 1440
gccattctgc tcctccagtt tgagttcaag ctccccgacg gtaagggccg accccgaaac 1500
atcaccatcg actccgacat gatccccgac ccccgagctc gactctgtgt ccgaaagcga 1560
tctctgcgtg acgagtaa 1578
<210> 45
<211> 2136
<212> DNA
<213> Artificial sequence
<220>
<223> Cytochrome P450 reductase from Arabidopsis thaliana CpO for
expression in Yarrowia lipolitica
<400> 45
atgtcctcct cttcttcttc ttccacctcc atgattgatc tcatggctgc catcatcaag 60
ggtgagcccg tcattgtctc cgaccccgcc aacgcctccg cctacgagtc cgttgctgcc 120
gagctgtcct ccatgctcat cgagaaccga cagtttgcca tgatcgtcac cacctccatt 180
gctgttctca ttggctgcat tgtcatgctc gtctggcgac gatctggctc cggtaactcc 240
aagcgagtcg agcccctcaa gcccctggtc atcaagcccc gagaagagga gatcgacgac 300
ggccgaaaga aggtcaccat cttctttggc acccagaccg gtactgctga gggcttcgcc 360
aaggctctcg gtgaggaagc caaggctcga tacgaaaaga cccgattcaa gattgtcgac 420
ctcgatgatt acgctgccga tgacgacgag tacgaggaga agctcaagaa agaggacgtt 480
gccttcttct tcctcgccac ctacggtgac ggtgagccca ccgacaacgc tgcccgattc 540
tacaagtggt tcaccgaggg taacgaccga ggcgagtggc tcaagaacct caagtacggt 600
gttttcggtc tgggcaaccg acagtacgag cacttcaaca aggttgccaa ggttgtcgac 660
gacatcctcg tcgagcaggg tgcccagcga ctcgtccagg tcggcctcgg tgatgatgac 720
cagtgcatcg aggacgactt cactgcctgg cgagaggctc tgtggcccga gctcgacacc 780
attctgcgag aggaaggtga caccgccgtt gccaccccct acaccgccgc cgtcctcgag 840
taccgagtct ccatccacga ctccgaggat gccaagttca acgacatcaa catggccaac 900
ggtaacggct acaccgtctt tgacgcccag cacccctaca aggccaacgt cgccgtcaag 960
cgagagctcc acacccccga gtccgaccga tcttgtatcc acctcgagtt tgacattgct 1020
ggttccggtc tgacctacga gactggtgac cacgttggtg tcctctgtga caacctgtcc 1080
gagactgtcg acgaggctct gcgactcctc gacatgtccc ccgacactta cttctctctg 1140
cacgccgaga aagaggacgg tactcccatc tcttcttctc tgccccctcc cttccctccc 1200
tgcaacctgc gaaccgctct gacccgatac gcctgcctcc tctcttctcc caagaagtct 1260
gctctcgttg ctctggccgc ccacgcctcc gaccccaccg aggctgagcg actcaagcac 1320
ctcgcctctc ccgctggcaa ggacgagtac tccaagtggg ttgtcgagtc ccagcgatct 1380
ctgctcgagg tcatggccga gttcccctcc gccaagcccc ctctcggtgt tttcttcgcc 1440
ggtgttgctc cccgactcca gccccgattc tactccatct cctcttcccc caagatcgcc 1500
gagactcgaa tccacgttac ctgtgctctg gtctacgaga agatgcccac cggccgaatc 1560
cacaagggtg tctgctccac ctggatgaag aacgccgttc cctacgagaa gtccgagaac 1620
tgttcctctg ctcccatctt tgtccgacag tccaacttca agctcccctc cgactccaag 1680
gtccccatca tcatgattgg ccccggtacc ggcctcgccc ccttccgagg cttcctgcag 1740
gagcgactcg ccctcgtcga gtccggtgtc gagctcggcc cctccgtcct cttctttggc 1800
tgccgaaacc gacgaatgga cttcatctac gaagaggagc tccagcgatt cgtcgagtcc 1860
ggtgctctcg ccgagctctc cgttgccttc tcccgagagg gtcccaccaa ggagtacgtc 1920
cagcacaaga tgatggacaa ggcctccgac atctggaaca tgatctccca gggcgcctac 1980
ctctacgtct gcggtgacgc caagggtatg gcccgagatg tccaccgatc tctgcacacc 2040
attgcccagg agcagggctc catggactcc accaaggccg agggtttcgt caagaacctc 2100
cagacctccg gccgatacct ccgagatgtc tggtaa 2136
<210> 46
<211> 1446
<212> DNA
<213> Artificial sequence
<220>
<223> UDP-glucosyltransferase from Stevia rebaudiana Cpo for expression
in Yarrowia lipolitica
<400> 46
atggacgcca tggccaccac cgagaagaag ccccacgtca tcttcatccc cttccccgcc 60
cagtcccaca tcaaggccat gctcaagctc gcccagctcc tccaccacaa gggcctccag 120
atcacctttg tcaacaccga cttcatccac aaccagttcc tcgagtcctc cggcccccac 180
tgtctggacg gtgctcccgg tttccgattt gagactatcc ccgatggtgt ctcccactcc 240
cccgaggcct ccatccccat ccgagagtct ctgctccgat ccattgagac taacttcctc 300
gaccgattca ttgatctcgt caccaagctc cccgatcctc ccacctgtat catctccgac 360
ggtttcctgt ccgttttcac cattgatgct gccaagaagc tcggtatccc cgtcatgatg 420
tactggactc tggctgcctg tggtttcatg ggtttctacc acatccactc tctgatcgag 480
aagggctttg ctcctctcaa ggacgcctcc tacctcacca acggttacct cgacaccgtc 540
attgactggg tccccggtat ggagggtatc cgactcaagg acttccccct cgactggtcc 600
accgacctca acgacaaggt tctcatgttc accaccgagg ctccccagcg atcccacaag 660
gtttcccacc acatcttcca caccttcgac gagctcgagc cctccatcat caagactctg 720
tctctgcgat acaaccacat ctacaccatt ggccccctcc agctcctcct cgaccagatc 780
cccgaggaga agaagcagac cggtatcacc tctctgcacg gctactctct cgtcaaggaa 840
gagcccgagt gcttccagtg gctccagtcc aaggagccca actccgttgt ctacgtcaac 900
tttggctcca ccaccgtcat gtctctcgag gacatgaccg agtttggctg gggtctggcc 960
aactccaacc actacttcct gtggatcatc cgatccaacc tcgtcattgg cgagaacgcc 1020
gttctgcctc ccgagctcga ggagcacatc aagaagcgag gcttcattgc ctcttggtgc 1080
tcccaggaga aggttctcaa gcacccctcc gtcggtggtt tcctgaccca ctgcggctgg 1140
ggctccacca ttgagtctct gtccgctggt gtccccatga tctgctggcc ctactcctgg 1200
gaccagctca ccaactgccg atacatctgc aaggagtggg aggttggtct ggagatgggt 1260
accaaggtca agcgagatga ggtcaagcga ctcgtccagg agctcatggg cgagggtggt 1320
cacaagatgc gaaacaaggc caaggactgg aaggagaagg cccgaattgc cattgccccc 1380
aacggctctt cttctctcaa cattgacaag atggtcaagg agatcactgt tctcgctcga 1440
aactaa 1446
<210> 47
<211> 1422
<212> DNA
<213> Artificial sequence
<220>
<223> variant of UDP-glucosyltransferase from Stevia rebaudiana Cpo for
expression in Yarrowia lipolitica
<400> 47
atggccacct ccgactccat tgttgacgac cgaaagaagc tccacattgt catgttcccc 60
tggctcgcct ttggccacat catcccctat ctcgagcttt ccaagctcat tgcccagaag 120
ggccacaagg tttccttcct ctccaccacc aagaacattg accgactctc ctcccacatc 180
tctcccctca tcaactttgt caagctcacc ctcccccgag tccaggagct gcccgaggac 240
gccgaggcca ccactgatgt ccaccccgag gatatcccct acctcaagaa ggcctccgac 300
ggcctccagc ccgaggtcac tgagttcctc gagcagcact ctcccgactg gatcatctac 360
gactacaccc actactggct ccccgagatt gccaagtctc tcggtgtctc tcgagcccac 420
ttctccgtca ccaccccctg ggccattgct tacatgggtc ccactgccga tgccatgatc 480
aacggttccg actaccgaac cgagcttgag gacttcaccg tccctcccaa gtggttcccc 540
ttccccacca ccgtctgctg gcgaaagcac gatctggccc gactcgtccc ctacaaggct 600
cccggtatct ccgacggtta ccgaatgggc ctcgtcatca agggctgcga ctgtctgctc 660
tccaagacct accacgagtt cggtactcag tggctccgac ttctcgagga gctgcaccga 720
gtccccgtca tccccgttgg tctgctccct ccctccatcc ccggctctga caaggacgac 780
tcttgggttt ccatcaagga gtggctcgac ggccaggaga agggctccgt tgtctacgtt 840
gctctcggtt ccgaggttct cgtcacccag gaagaggttg tcgagcttgc tcacggtctg 900
gagctgtccg gtctgccctt cttctgggcc taccgaaagc ccaagggtcc cgccaagtcc 960
gactccgtcg agcttcccga tggtttcgtc gagcgagtcc gagatcgagg tctggtctgg 1020
acctcttggg ctccccagct ccgaatcctc tcccacgagt ccgttgctgg tttcctcacc 1080
cactgcggtt ccggctccat tgtcgagggc ctcatgttcg gccaccctct catcatgctc 1140
cccatcttcg gtgaccagcc cctcaacgcc cgactccttg aggacaagca ggtcggtatc 1200
gagatccccc gaaacgagga agatggttct ttcacccgag actctgttgc cgagtctctg 1260
cgactcgtca tggtcgagga agagggtaag atctaccgag agaaggccaa ggagatgtcc 1320
aagctctttg gcgacaagga cctccaggac cagtacgtcg acgactttgt cgagtacctc 1380
cagaagcacc gacgagctgt tgccattgac cacgaaagct aa 1422
<210> 48
<211> 1383
<212> DNA
<213> Artificial sequence
<220>
<223> UDP-glucosyltransferase from Stevia rebaudiana Cpo for expression
in Yarrowia lipolitica
<400> 48
atggccgagc agcagaagat caagaagtct ccccacgttc tgctcatccc cttccctctg 60
cagggccaca tcaacccctt catccagttc ggcaagcgac tcatctccaa gggtgtcaag 120
accactctgg tcaccaccat ccacaccctc aactccactc tcaaccactc caacaccacc 180
accacctcca tcgagatcca ggccatctcc gacggctgtg acgagggtgg tttcatgtct 240
gctggtgagt cttacctcga gactttcaag caggtcggtt ccaagtctct ggctgacctc 300
atcaagaagc tccagtccga gggtaccacc attgacgcca tcatctacga ctccatgacc 360
gagtgggttc tcgatgtcgc catcgagttt ggtattgacg gtggctcctt cttcacccag 420
gcctgtgtcg tcaactctct ctactaccac gtccacaagg gtctgatctc tctgcccctc 480
ggcgagactg tctccgtccc cggtttcccc gttctgcagc gatgggagac tcctctcatt 540
ctccagaacc acgagcagat ccagtccccc tggtcccaga tgctcttcgg ccagttcgcc 600
aacattgacc aggcccgatg ggttttcacc aactccttct acaagctcga ggaagaggtc 660
attgagtgga cccgaaagat ctggaacctc aaggtcattg gccccaccct cccctccatg 720
tacctcgaca agcgactcga tgacgacaag gacaacggtt tcaacctcta caaggccaac 780
caccacgagt gcatgaactg gctcgacgac aagcccaagg agtccgttgt ctacgttgcc 840
tttggctctc tggtcaagca cggccccgag caggttgagg agatcacccg agctctgatt 900
gactccgatg tcaacttcct gtgggtcatc aagcacaagg aagagggtaa gctccccgag 960
aacctgtccg aggtcatcaa gaccggcaag ggcctcattg ttgcctggtg caagcagctc 1020
gacgttctcg cccacgagtc cgtcggctgc tttgtcaccc actgcggttt caactccacc 1080
ctcgaggcta tctctctcgg tgtccccgtt gttgccatgc cccagttctc cgaccagacc 1140
accaacgcca agctcctcga tgagattctc ggtgtcggtg tccgagtcaa ggctgacgag 1200
aacggtattg tccgacgagg taacctggct tcttgtatca agatgatcat ggaggaagag 1260
cgaggtgtca tcatccgaaa gaacgccgtc aagtggaagg atctggccaa ggttgctgtc 1320
cacgagggtg gctcttccga caacgacatt gtcgagtttg tctccgagct catcaaggcc 1380
taa 1383
<210> 49
<211> 1377
<212> DNA
<213> Artificial sequence
<220>
<223> UDP-glucosyltransferase from Stevia rebaudiana Cpo for expression
in Yarrowia lipolitica
<400> 49
atggagaaca agaccgagac taccgtccga cgacgacgac gaatcattct cttccccgtc 60
cccttccagg gccacatcaa ccccattctg cagctcgcca acgttctgta ctccaagggc 120
ttctccatca ccatcttcca caccaacttc aacaagccca agacctccaa ctacccccac 180
ttcactttcc gattcatcct cgacaacgac ccccaggacg agcgaatctc caacctgccc 240
acccacggtc ctctggctgg tatgcgaatc cccatcatca acgagcacgg tgctgacgag 300
ctccgacgag agctcgagct gctcatgctc gcctccgaag aggacgagga agtctcctgt 360
ctgatcaccg atgctctgtg gtactttgcc cagtccgtcg ccgactctct caacctgcga 420
cgactcgttc tcatgacctc ctctctgttc aacttccacg cccacgtttc tctgccccag 480
tttgacgagc tcggttacct cgaccccgat gacaagaccc gactcgagga gcaggcttcc 540
ggtttcccca tgctcaaggt caaggacatc aagtccgcct actccaactg gcagattctc 600
aaggagattc tcggcaagat gatcaagcag accaaggcct cctccggtgt catctggaac 660
tccttcaagg agctcgagga gtccgagctc gagactgtca tccgagagat ccccgctccc 720
tctttcctca tccccctgcc caagcacctc accgcttcct cctcttctct gctcgaccac 780
gaccgaaccg tctttcagtg gctcgaccag cagccccctt cctccgtcct ctacgtttcc 840
ttcggctcca cctccgaggt cgacgagaag gacttcctcg agattgctcg aggcctcgtt 900
gactccaagc agtccttcct gtgggttgtc cgacccggct ttgtcaaggg ctccacctgg 960
gttgagcccc tgcccgatgg tttcctcggt gagcgaggcc gaattgtcaa gtgggtcccc 1020
cagcaggaag ttctggccca cggtgccatt ggtgccttct ggacccactc cggctggaac 1080
tccactctcg agtccgtctg cgagggtgtc cccatgatct tctccgactt tggcctcgac 1140
cagcccctca acgcccgata catgtccgat gttctcaagg tcggtgtcta cctcgagaac 1200
ggctgggagc gaggtgagat tgccaacgcc atccgacgag tcatggtcga cgaggaaggt 1260
gagtacatcc gacagaacgc ccgagtcctc aagcagaagg ccgatgtctc tctcatgaag 1320
ggtggttctt cttacgagtc tctcgagtct ctcgtttcct acatctcttc tttgtaa 1377

Claims (22)

1.具有贝壳杉烯酸13-羟化酶活性的变体多肽,所述变体多肽是如下氨基酸序列,当与SEQ ID NO: 1所示序列比对时,所述氨基酸序列包含至少一个氨基酸残基的替换,所述替换发生在对应于氨基酸位置129的氨基酸残基处,
所述位置是参照SEQ ID NO: 1限定的,其中所述变体多肽的氨基酸序列如SEQ ID NO:11或SEQ ID NO: 31所示,并且其中所述变体多肽与具有贝壳杉烯酸13-羟化酶活性的参照多肽相比具有一种或更多种改变的性质。
2.根据权利要求1所述的变体多肽,其中所述改变的性质是改变的贝壳杉烯酸13-羟化酶活性。
3.根据权利要求1或2所述的变体多肽,其中所述参照多肽包含SEQ ID NO: 1的贝壳杉烯酸13-羟化酶。
4.根据权利要求1或2所述的变体多肽,其中所述变体多肽是非天然存在的多肽。
5.编码根据前述权利要求中任一项所述的变体多肽的核酸。
6.核酸构建体,其包含权利要求5所述的核酸,所述核酸与能够指导贝壳杉烯酸13-羟化酶在合适表达宿主中表达的一种或更多种控制序列可操作地连接。
7.表达载体,其包含根据权利要求5所述的核酸或根据权利要求6所述的核酸构建体。
8.重组宿主,其包含根据权利要求5所述的核酸、根据权利要求6所述的核酸构建体或根据权利要求7所述的表达载体。
9.根据权利要求8所述的重组宿主,其能够产生甜菊醇或甜菊醇糖苷。
10.根据权利要求9所述的重组宿主,其包含一种或更多种编码以下多肽的重组核苷酸:
具有对映-柯巴基焦磷酸合酶活性的多肽;
具有对映-贝壳杉烯合酶活性的多肽;
具有对映-贝壳杉烯氧化酶活性的多肽;或
具有贝壳杉烯酸13-羟化酶活性的多肽,其不同于根据权利要求1-4中任一项所述的变体多肽。
11.根据权利要求9所述的重组宿主,其包含编码具有NADPH-细胞色素p450还原酶活性的多肽的重组核酸。
12.根据权利要求9所述的重组宿主,其包含编码以下项中的一种或更多种的重组核酸:
(i)具有UGT74G1活性的多肽;
(ii)具有UGT2活性的多肽;
(iii)具有UGT85C2活性的多肽;和
(iv)具有UGT76G1活性的多肽。
13.根据权利要求8所述的重组宿主,其中所述宿主属于SaccharomycesAspergillusPichiaKluyveromycesCandidaHansenulaHumicolaIssatchenkiaTrichosporonBrettanomycesPachysolenYarrowiaYamadazymaEscherichia属中的一种。
14.根据权利要求13所述的重组宿主,其中所述重组宿主是Saccharomyces cerevisiae细胞、Yarrowia lipolytica细胞、Candida krusei细胞、Issatchenkia orientalis细胞或Escherichia coli细胞。
15.根据权利要求8-14中任一项所述的重组宿主,其中所述宿主产生香叶基香叶基二磷酸GGPP的能力被上调。
16.根据权利要求8-14中任一项所述的重组宿主,其包含编码以下项中的一种或更多种的核酸:
具有羟甲基戊二酰基-辅酶A还原酶活性的多肽;
具有法尼基-焦磷酸合成酶活性的多肽;
具有香叶基香叶基二磷酸合酶活性的多肽。
17.一种制备甜菊醇或甜菊醇糖苷的方法,所述方法包括在合适的发酵培养基中发酵根据权利要求8-16中任一项所述的重组宿主。
18.根据权利要求17所述的制备甜菊醇或甜菊醇糖苷的方法,其中所述方法还包括回收所述甜菊醇或甜菊醇糖苷。
19.根据权利要求17或18所述的制备甜菊醇或甜菊醇糖苷的方法,其中所述方法以工业规模进行。
20.根据权利要求17或18所述的制备甜菊醇或甜菊醇糖苷的方法,其中所述方法产生包含甜菊醇或甜菊醇糖苷的发酵液。
21.一种生产贝壳杉烯酸13-羟化酶的方法,所述方法包括:在适于生产贝壳杉烯酸13-羟化酶的条件下培养根据权利要求8-16中任一项所述的重组宿主。
22.根据权利要求21所述的生产贝壳杉烯酸13-羟化酶的方法,其中所述方法还包括回收所述贝壳杉烯酸13-羟化酶。
CN201680057728.5A 2015-10-05 2016-10-05 贝壳杉烯酸羟化酶 Active CN108138152B (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201562237203P 2015-10-05 2015-10-05
US62/237,203 2015-10-05
EP16183457.7 2016-08-09
EP16183457 2016-08-09
PCT/EP2016/073818 WO2017060318A2 (en) 2015-10-05 2016-10-05 Kaurenoic acid hydroxylases

Publications (2)

Publication Number Publication Date
CN108138152A CN108138152A (zh) 2018-06-08
CN108138152B true CN108138152B (zh) 2023-01-06

Family

ID=56683767

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201680057728.5A Active CN108138152B (zh) 2015-10-05 2016-10-05 贝壳杉烯酸羟化酶

Country Status (6)

Country Link
US (1) US11203764B2 (zh)
EP (2) EP4043558A3 (zh)
CN (1) CN108138152B (zh)
BR (1) BR112018006724A2 (zh)
CA (1) CA2999638A1 (zh)
WO (1) WO2017060318A2 (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018114995A1 (en) * 2016-12-22 2018-06-28 Dsm Ip Assets B.V. Fermentation process for producing steviol glycosides
US11608364B2 (en) 2018-04-30 2023-03-21 Dsm Ip Assets B.V. Steviol glycoside transport
WO2020081468A1 (en) * 2018-10-15 2020-04-23 Amyris, Inc. Stevia rebaudiana kaurenoic acid hydroxylase variants for high efficiency production of rebaudiosides
AU2021367159A1 (en) 2020-10-22 2023-05-04 Cargill, Incorporated Microorganisms for diterpene production
CN114438045B (zh) * 2022-01-06 2023-12-08 首都医科大学 分离的双加氧酶及其编码基因与应用

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2189474A1 (en) * 2007-08-10 2010-05-26 Shanghai Institutes for Biological Sciences Chinese Academy of Sciences A plant height regulatory gene and uses thereof
EP2902410A1 (en) * 2012-09-29 2015-08-05 Shanghai Institutes for Biological Sciences, Chinese Academy of Sciences Method for producing stevioside compounds by microorganism
CN104928263A (zh) * 2014-03-20 2015-09-23 中国科学院上海生命科学研究院 一种新的贝壳烯酸-13α-羟化酶、其编码基因及其应用

Family Cites Families (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0635574B1 (en) 1993-07-23 2003-04-23 Dsm N.V. Selection marker gene free recombinant strains, a method for obtaining them and the use of these strains
EP0979294B1 (en) 1997-04-11 2015-05-27 DSM IP Assets B.V. Gene conversion as a tool for the construction of recombinant industrial filamentous fungi
ID27054A (id) 1998-05-19 2001-02-22 Dsm Nv Perbaikan produksi sepalosporin di dalam organisme yang hidup
CN1331751A (zh) 1998-12-22 2002-01-16 Dsm公司 改进的头孢菌素的体内生产方法
DK1468093T4 (en) 2002-01-23 2018-04-09 Dsm Ip Assets Bv Fermentation of pentose sugars
SE0202090D0 (sv) 2002-05-08 2002-07-04 Forskarpatent I Syd Ab A modifierd yeast consuming L-arabinose
JP4711955B2 (ja) 2003-05-02 2011-06-29 ネイチャーワークス・エル・エル・シー 遺伝子組換え酵母及び遺伝子組換え酵母を用いた発酵方法
DK1781772T3 (en) 2004-07-16 2017-01-09 Dsm Ip Assets Bv Metabolic MODIFICATION of xylose-fermenting eukaryotic cells
WO2006096130A1 (en) 2005-03-11 2006-09-14 Forskarpatent I Syd Ab Arabinose- and xylose-fermenting saccharomyces cerevisiae strains
US7927851B2 (en) * 2006-03-21 2011-04-19 Vineland Research And Innovation Centre Compositions having ent-kaurenoic acid 13-hydroxylase activity and methods for producing same
US8277862B2 (en) * 2007-03-14 2012-10-02 Concentrate Manufacturing Company Of Ireland Beverage products having steviol glycosides and at least one acid
US8299318B2 (en) 2007-07-05 2012-10-30 Ceres, Inc. Nucleotide sequences and corresponding polypeptides conferring modulated plant characteristics
KR101598935B1 (ko) * 2010-04-16 2016-03-03 씨제이제일제당(주) 레바우디오사이드 a의 생산 공정에서 발생하는 부산물을 재활용하여 고수득율의 레바우디오사이드 a를 제조하는 방법
CA3176307A1 (en) 2010-06-02 2011-12-08 Evolva Nutrition, Inc. Recombinant production of steviol glycosides
EP2742142B2 (en) 2011-08-08 2020-03-25 Evolva SA Recombinant production of steviol glycosides
EP2783000A1 (en) 2011-11-23 2014-10-01 DSM IP Assets B.V. Nucleic acid assembly system
CN104203005A (zh) 2012-01-23 2014-12-10 帝斯曼知识产权资产管理有限公司 二萜的生产
EP2852296B1 (en) * 2012-05-22 2021-12-15 PureCircle SDN BHD Process for producing a high-purity steviol glycoside
CN110551646B (zh) 2013-02-06 2024-04-26 埃沃尔瓦公司 用于提高莱鲍迪苷d和莱鲍迪苷m之产生的方法
EP3004365A1 (en) * 2013-05-31 2016-04-13 DSM IP Assets B.V. Extracellular diterpene production
EP3021689B1 (en) 2013-07-15 2021-03-24 DSM IP Assets B.V. Diterpene production
WO2015011209A1 (en) * 2013-07-23 2015-01-29 Dsm Ip Assets B.V. Diterpene production in yarrowia
WO2015051454A1 (en) * 2013-10-07 2015-04-16 Vineland Research And Innovation Centre Compositions and methods for producing steviol and steviol glycosides
BR112017004712B1 (pt) 2014-09-09 2021-11-03 Evolva Sa Hospedeiro recombinante que produz um precursor de glicosídeo de esteviol, métodos para produzir um precursor de glicosídeo de esteviol, um esteviol ou um ou mais glicosídeos de esteviol, cultura do dito hospedeiro e lisado da cultura do dito hospedeiro
JP6946183B2 (ja) 2014-11-05 2021-10-06 マナス バイオシンセシス インコーポレイテッド ステビオール配糖体の微生物による生成

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2189474A1 (en) * 2007-08-10 2010-05-26 Shanghai Institutes for Biological Sciences Chinese Academy of Sciences A plant height regulatory gene and uses thereof
EP2902410A1 (en) * 2012-09-29 2015-08-05 Shanghai Institutes for Biological Sciences, Chinese Academy of Sciences Method for producing stevioside compounds by microorganism
CN104928263A (zh) * 2014-03-20 2015-09-23 中国科学院上海生命科学研究院 一种新的贝壳烯酸-13α-羟化酶、其编码基因及其应用

Also Published As

Publication number Publication date
CN108138152A (zh) 2018-06-08
EP4043558A2 (en) 2022-08-17
BR112018006724A2 (pt) 2018-10-09
US11203764B2 (en) 2021-12-21
EP3359654A2 (en) 2018-08-15
CA2999638A1 (en) 2017-04-13
WO2017060318A3 (en) 2017-06-08
EP3359654B1 (en) 2022-01-05
WO2017060318A2 (en) 2017-04-13
EP4043558A3 (en) 2022-11-16
US20210040491A1 (en) 2021-02-11

Similar Documents

Publication Publication Date Title
EP3271457B1 (en) Udp-glycosyltransferases
US11203764B2 (en) Kaurenoic acid hydroxylases
CN107922465B (zh) 甜菊醇糖苷转运
US11781121B2 (en) Geranylgeranyl pyrophosphate synthases
US20230295586A1 (en) Udp-glycosyltransferases
US11913034B2 (en) Kaurenoic acid hydroxylases
US10760085B2 (en) Kaurenoic acid hydroxylases

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant