表达用于使用淀粉和纤维素进行联合生物加工的糖分解酶的酵母
发明背景
生物质是来自活的或最近地活的生物的生物材料,例如木材、废弃物、(氢)气和酒精燃料。生物质是基于碳、氢和氧的。还可发现氮和少量其它原子包括碱金属、碱土金属和重金属。金属通常见于功能性分子例如卟啉中,所述卟啉包括包含镁的叶绿素。植物特别地将水和二氧化碳组合成糖构建块。所需能量通过基于叶绿素的光合作用从光产生。平均起来,0.1至1%的可获得的光被作为化学能贮存在植物中。糖构建块是陆生植物中发现的所有主要级份、木质素、半纤维素和纤维素的起始点。生物质被广泛地认为是用于产生可再生燃料和化学品的有前景的原料来源。阻碍更广泛地从生物质原料产生能量的主要障碍是普遍缺乏用于克服此类材料向有用的燃料转化的顽抗性的低成本技术。生物质包含可被转化成乙醇的碳水化合物级份(例如,淀粉、纤维素和半纤维素)。为了转化此类级份,必须将淀粉、纤维素和半纤维素最终转化或水解成单糖;历史上已证明正是此水解存在问题。
生物介导的方法很有希望用于能量转化,特别地用于生物质向燃料的转化。牵涉酶促或微生物水解的生物质处理方案通常包括4个生物介导的转化:(1)糖分解酶(淀粉酶、纤维素酶和半纤维素酶)的产生;(2)存在于预处理的生物质中的碳水化合物组分至糖的水解;(3)己糖(例如,葡萄糖、甘露糖和半乳糖)的发酵;和(4)戊糖(例如,木糖和阿拉伯糖)的发酵。这四种转化以单步骤在称为联合生物加工(CBP)的工艺配置的过程中发生,所述联合生物加工与其它集成程度不太高的配置区别在于其不包括用于产生纤维素酶和/或半纤维素酶的专门的处理步骤。
CBP提供了比以专门的糖分解酶生产为特征的方法成本更低效率更高的潜力。益处部分地因避免的资本成本、底物和其它原材料以及与糖分解酶生产相关的程序而产生。此外,几个因素支持使用CBP、包括酶-微生物协同以及使用嗜温生物和/或复合糖分解系统来实现更高的水解速率,从而减少反应器体积和资本投资。此外,纤维素粘附性的纤维素分解性微生物可能成功地与非粘附性微生物竞争纤维素水解的产物,例如污染物,这可增加基于微生物的纤维素利用的工业过程的稳定性。开发使得能够进行CBP的微生物的进展正在通过两个策略来进行:工程化天然存在的糖分解性微生物以提高产物相关性质,例如产率和效价;以及工程化显示出高产物产率和效价的非糖分解性微生物以表达使得能够利用淀粉、纤维素和半纤维素的异源糖分解酶系统。
淀粉分解成糖需要淀粉分解酶。淀粉酶是存在于人唾液中的淀粉分解酶的实例,在唾液中其开始降解的化学过程。胰腺也产生将饮食淀粉水解成二糖和三糖的淀粉酶(α淀粉酶),所述二糖和三糖被其它酶转化成葡萄糖以给身体提供能量。植物和一些细菌也产生淀粉酶。淀粉酶为糖苷水解酶并且作用于α-1,4-糖苷键。
几种淀粉分解酶参与淀粉水解。α-淀粉酶(EC 3.2.1.1)(又名:1,4-α-D-葡聚糖葡聚糖水解酶;糖原酶)为钙金属酶,即在钙不存在的情况下完全不能发挥功能。通过在沿着淀粉链的随机位置上作用,α-淀粉酶分解长链碳水化合物,最终从直链淀粉产生麦芽三糖和麦芽糖,或从支链淀粉产生麦芽糖、葡萄糖和“极限糊精”。因为其可在任何位置作用于底物,因此α-淀粉酶倾向于比β-淀粉酶更快地作用。另一种形式的淀粉酶β-淀粉酶(EC 3.2.1.2)(又名:1,4-α-D-葡聚糖麦芽糖水解酶;糖原酶;糖原淀粉酶)催化第二α-1,4糖苷键的水解,一次切离两个葡萄糖单位(麦芽糖)。第三种淀粉酶为γ-淀粉酶(EC 3.2.1.3)(又名:葡聚糖1,4-α-葡糖苷酶;淀粉葡糖苷酶;外切-1,4-α-葡糖苷酶;葡糖淀粉酶;溶酶体α-葡糖苷酶;1,4-α-D-葡聚糖葡聚糖水解酶)。除了在直链淀粉和支链淀粉的非还原末端上切割最后一个α(1-4)糖苷键从而产生葡萄糖外,γ-淀粉酶还将切割α(1-6)糖苷键。
第四种酶α-葡糖苷酶作用于由α-、β-和γ-淀粉酶产生的麦芽糖和其它短的麦芽寡糖,将它们转化成葡萄糖。
三个主要类型的酶促活性是天然纤维素的降解所需的:第一类型为内切葡聚糖酶(1,4-β-D-葡聚糖4-葡聚糖水解酶;EC 3.2.1.4)。内切葡聚糖酶在无定形纤维素的纤维素多糖链中随机切割,从而产生具有不同长度和因而具有新的链末端的寡糖。第二类型为外切葡聚糖酶,包括纤维糊精酶(1,4-β-D-葡聚糖葡聚糖水解酶;EC 3.2.1.74)和纤维二糖水解酶(1,4-β-D-葡聚糖纤维二糖水解酶;EC3.2.1.91)。外切葡聚糖酶以持续方式作用于纤维素多糖链的还原或非还原末端,释放葡萄糖(葡聚糖水解酶)或纤维二糖(纤维二糖水解酶)作为主要产物。外切葡聚糖酶还可作用于微晶纤维素,推测从微晶结构剥离纤维素链。第三类型为β-葡糖苷酶(β-葡萄糖苷葡萄糖水解酶;EC 3.2.1.21)。β-葡糖苷酶将可溶性纤维糊精和纤维二糖水解成葡萄糖单位。
多种植物生物质资源可以以淀粉和木质纤维素被获得以用于生物燃料特别是生物乙醇的生产。主要来源为(i)来自造纸厂、锯木厂和家俱制造厂的木材剩余物,(ii)市政固体废物,(iii)农业废物和(iv)能源作物例如玉米。特别地此类生物质资源的纤维质级份至可发酵的糖(葡萄糖、纤维二糖、麦芽糖、α-和纤维糊精)的预转化(使用物理、化学或酶促方法)将使得它们能够发酵成生物乙醇,只要使用具有利用此类糖的能力的必需的有发酵力的微生物。
在世界范围的基础上,每年产生1.3x1010公吨(干重)的陆生植物(Demain,A.L.,等人,Microbiol.Mol.Biol.Rev.69,124-154(2005))。植物生物质由约40-55%的纤维素、25-50%的半纤维素和10-40%的木质素组成,这取决于来源是硬木材、软木材还是草(Sun,Y.和Cheng,J.,Bioresource Technol.83,1-11(2002))。存在的主要多糖为不溶于水的纤维素,其包含可发酵糖(葡萄糖、纤维二糖或纤维糊精)的主要级份。
酿酒酵母(Saccharomyces cerevisiae)仍然是用于乙醇生产的优选微生物(
B.,等人,Adv.Biochem.Eng.Biotechnol.73,53–84(2001))。支持该微生物的属性为(i)接近理论产率的高生产力(0.51g产生的乙醇/g使用的葡萄糖),(ii)高耐渗性和乙醇耐受性,(iii)工业过程中的天然鲁棒性,(iv)因其与酒和面包制造以及啤酒酿造的长久联系而通常被认为是完全的(GRAS)。此外,酿酒酵母显示对通常在水解物中发现的由生物质的预处理产生的抑制剂的耐受性。酿酒酵母的主要缺点是其不能利用复杂多糖例如淀粉和纤维素,或其分解产物例如纤维二糖和纤维糊精。
里氏木霉中的(CBH1和CBH2)、黑曲霉中的(CBHA和CBHB)和白腐菌(P.chrysosporium)中的(CBH1-4)的编码纤维二糖水解酶的基因已被克隆和描述。由此类基因编码的蛋白质全都为包含通过柔性接头序列连接至纤维素结合分子的催化结构域的模块化酶。CBH2和CBHB为家族6的糖基水解酶。CBH1和CBH1-4为家族7的糖基水解酶。糖基水解酶为范围广泛的一组水解两个或更多个碳水化合物之间的糖苷键或碳水化合物与非碳水化合物部分之间的糖苷键的酶。糖基水解酶的分类系统,基于序列相似性,已产生85个不同家族的定义(Henrissat,B.等人,Proc.Natl.Acad.Sci.92:7090-7094(1995);Davies,G.和Henrissat,B.,Structure 3:853-859(1995))。糖苷水解酶家族7(GHF7)包括具有几种已知的活性的酶,包括内切葡聚糖酶和纤维二糖水解酶。此类酶先前称为纤维素酶家族C。
纤维二糖水解酶在通过从纤维素多聚体链的还原末端(CBH1;GHF7)或非还原末端(CBH2;GHF6)切割二糖纤维二糖来将纤维素转化成葡萄糖中起着重要作用。在结构上,纤维素酶和木聚糖酶通常由通过富含脯氨酸和/或羟基-氨基酸的接头区域连接至纤维素结合结构域(CBD)的催化结构域组成。在I型外切葡聚糖酶中,CBD结构域见于此类酶的C末端的最末端(该短的结构域形成通过2个二硫桥稳定的发夹环结构)。一些纤维素酶仅具有催化结构域。
糖基化水解酶家族7的酶在氨基酸水平上具有67%的同源性,但此类酶的任一种与糖基水解酶家族6的CBH2之间的同源性低于15%。
借助于重组DNA技术,已将此类来自细菌和真菌来源的异源纤维素酶的几种转移至酿酒酵母,从而使得能够降解纤维质衍生物(VanRensburg,P.,等人,Yeast14,67-76(1998))或在纤维二糖上生长(VanRooyen,R.,等人,J.Biotech.120,284–295(2005));McBride,J.E.,等人,Enzyme Microb.Techol.37,93-101(2005))。
相关工作已被Fujita,Y.,等人,(Appl.Environ.Microbiol.70,1207-1212(2004))描述,其中固定在酵母细胞表面上的纤维素酶具有明显的局限性。首先,Fujita等人不能使用仅表达重组BGL1和EGII的酵母实现无定形纤维素的发酵。Fujita等人的方法的第二局限性是在细胞用于使用无定形纤维素进行乙醇生产之前必须在标准碳原上将细胞预培养至高细胞密度(例如,Fujita等人教导了使用~15g/L的高生物质载量来完成乙醇生产)。
如上文中所提及的,产乙醇酵母例如酿酒酵母,当在纤维质底物例如预处理的木材上培养时,需要添加外源纤维素酶,因为该酵母不产生内源纤维素酶。功能性纤维素酶例如里氏木霉CBH1和CBH2在酵母酿酒酵母中的功能性表达已得到证明(Den Haan R等人,Metab Eng.,9,87-94(2007))。然而,在酵母中异源性表达的纤维素酶的目前表达水平和比活性对于木质纤维素底物来说仍然不是最高效的。因此,为了达到实现能够高效率地和成本划算地将纤维质底物转化成乙醇的联合生物加工(CBP)系统的目标,仍然显著需要改善表达的纤维素酶活性的量和种类。
基于其来源的种类、其所源自的特定组织和其预处理,木质纤维素材料的组成可发生极大地变化。由于其变化的组成,经设计用于CBP的生物必须产生可在多种反应环境中以多种构象容纳多种底物的消化酶类。迄今为止,木质纤维素底物的高效利用需要以高水平添加外源酶并且外源添加的酶非常昂贵。因此,从纤维素分解生物分离具有高比活性并且在宿主生物例如酵母酿酒酵母中具有高表达水平的纤维素酶以实现CBP将是非常有益的。同样地,为了以最大效率使用木质纤维素材料,发现协同作用以实现木质纤维素组分的更高效分解的旁系同源和/或直系同源酶的组合也将是有益的。
里氏木霉(Trichoderma reesei)的分泌蛋白质组由22个通过2D凝胶电泳和MALDI-TOF质谱法鉴定的独特的可辩认的蛋白质种类组成(
-Gimbert I,Margeot A,Dolla A,等人,Comparative secretomeanalyses of two Trichoderma reesei RUT-C30and CL847hypersecretorystrains,Biotechnol Biofuels.2008 Dec 23;1(1):18)。然而,里氏木霉系统的互补的研究显示少量的来自其它纤维素分解真菌的上清液的添加提供了里氏木霉纤维素酶制剂的活性的显著增强(Rosgaard L,Pedersen S,Cherry JR,等人,Efficiency of new fungal cellulase systems in boostingenzymatic degradation of barley straw lignocellulose,Biotechnol Prog.2006 Mar-Apr;22(2):493-8)。除此以外,里氏木霉基因组与几种其它纤维素分解真菌的比较(Martinez D,Berka RM,Henrissat B,等人,Genomesequencing and analysis of the biomass-degrading fungus Trichodermareesei(syn.Hypocrea jecorina),Nat Biotechnol.2008May;26(5):553-60)发现其基因组编码比所有其它测序的纤维素分解真菌更少的纤维素酶和半纤维素酶,并且在半纤维素降解上是特别有缺陷的,因为其完全丢失了单宁酸酶和阿魏酸酯酶酶家族。这些研究表明不存在于里氏木霉基因组中的活性也可用于水解木素纤维素。
此外,关于来自真菌的重建纤维素酶系统的文献确实使我们深入了解哪种(以及有多少)酶是水解所必需的。Gusakov AV,Salanovich TN,Antonov AI,等人,Design of highly efficient cellulase mixtures forenzymatic hydrolysis of cellulose,Biotechnol Bioeng.2007Aug1;97(5):1028-38使用纯化的Chrysosporium lucknowense纤维素酶,并且显示CBH1、CBH2、EG2、EG5、BGL和XYN2的混合物可广泛地水解有机溶剂(Organosolv)预处理的花旗松。因为有机溶剂预处理彻底地除去木质素,因此其可能除去另外地对某些酶活性的需要。在另一个研究(Zhou J,Wang YH,Chu J,等人,Optimization of cellulase mixture forefficient hydrolysis of steam-exploded corn stover by statisticallydesigned experiments,Bioresour Technol.2009 Jan;100(2):819-25.2008年9月3日电子版)中,预处理的玉米桔杆中的~80%的葡聚糖可被7种酶(包括CBH1、CBH2、EG1、EG3、EG4和BGL)的混合物转化。在由作者产生的优化的混合物中,CBH组成约2/3的总纤维素酶,CBH2对CBH1的比率为2:1。在这两项研究中,重建的系统显示比粗制酶制剂更大的总水解,虽然这可能是预处理条件的作用。
除真菌外,还存在许多种可用作基因供体用于在酵母中表达木质纤维素分解酶的纤维素分解细菌。在一个方面,本发明用于鉴定来自多种生物的纤维素分解酶,随后鉴定以最高效组合作用以降解木质纤维素材料的酶。鉴于纤维素分解细菌的多样性,基于几个参数的此类生物的分类(Lynd等人,2002)可告知基因供体的选择。下列是可能的区别特征:A)好氧的对厌氧的,B)嗜温菌对嗜热菌;和C)非复合的无细胞酶对复合的细胞结合的酶。
当确定需要的一组酶活性时的另一考虑是试图表征木质纤维素底物中的键连接。下面是硬木材底物的分析。图1提供了Van Zyl WH等人,Consolidated bioprocessing for bioethanol production usingSaccharomyces cerevisiae,Adv Biochem Eng Biotechnol.,108,205-235(2007)中给出的存在于植物材料中的碳水化合物结构的概述。虽然该描述不是特别地针对硬木材的,但其比较好地切合来自Handbookof Wood Chemistry and Composites(Rowell,2005)的信息,该手册阐明硬木材的半纤维素具有下列特征:主要由葡糖醛酸木聚糖(glucuronoxylans)(与图1的结构(B)相似)组成。此类葡糖醛酸木聚糖具有木聚糖骨架(β1-4连接的吡喃木糖单位),在C2或C-3上具有乙酰基,平均每10个木糖单位有7个乙酰基,并且被4-O甲基葡糖醛酸(α1-2连接)的侧链置换。硬木材包含2-5%的葡甘露聚糖,其由1-4连接的β-D-吡喃葡萄糖和β-D-吡喃甘露糖单位组成(与图1的结构(C)有些相似);并且硬木材包含少量果胶、淀粉和蛋白质。
来自图1的图板F给出了一种类型的木聚糖—木质素连接,以及与硬木材相关的与木聚糖的4-O-甲基葡糖醛酸连接的结构。该图获自Spanikova S和Biely P,FEBS Lett.,580,4597-4601(2006)。该论文的作者鉴定了作用于这类连接的酶:葡糖醛酸酯酶。他们将里氏木霉Cip2鉴定为该酶的同源物。
为了阐明异源纤维素酶表达在联合生物加工系统中的限制,在一个方面,本发明提供了能够促进高效纤维素降解和发酵产物在宿主细胞中的产生的新型糖分解酶的鉴定。具体地,在一个实施方案中,本发明用于从纤维素分解生物分离糖分解酶的新型基因。本发明提供了能够在酵母系统中异源表达并且促进淀粉、戊糖和木质纤维素组分的降解的新型基因。具体地,本发明在一个实施方案中提供了来自多种细菌、真菌、非常规酵母以及植物生物的可在酵母中表达的糖分解酶的新型基因。
在另一个方面,本发明还描述了表达用于从玉米淀粉生产燃料乙醇的酶的工业酵母菌株。
即使先前已公开了表达用于从完整谷粒或淀粉产生燃料乙醇的酶的酵母菌株,但因所得菌株相对较弱的产生/耐受高水平的乙醇的能力,该应用在基于谷类的燃料乙醇工业中一直未被商业化。例如,美国专利No.7,226,776公开了表达多糖酶的ethanologen可从碳水化合物聚合物直接产生乙醇,但显示的最大乙醇效价为3.9g/l。美国专利No.5,422,267公开了葡糖淀粉酶在酵母中用于产生酒精性饮料的用途;然而,未公开乙醇的商业相关效价。
此外,虽然已知酵母细胞天然利用糖例如葡萄糖和甘露糖,但它们缺乏高效利用戊糖例如木糖和阿拉伯糖的能力。
因此,在一个实施方案中,本发明描述了工业酵母菌株,所述菌株经工程化以表达广谱的多种糖分解酶以及戊糖利用途径以从包含己糖和戊糖的单糖和多糖的混合物的生物质原料产生多种化合物。
这样的酵母菌株的工程化和利用将允许进行利用生物质原料的生物过程。这样的生物质原料可包括几种不同的聚合化合物例如:纤维素、半纤维素、淀粉、果胶、菊粉、果聚糖等。同样地,生物质原料可包括戊糖和己糖碳水化合物的混合物。因此,来源于植物例如木材、玉米、龙舌兰属植物、柳枝稷等的包含不同碳水化合物和碳水化合物聚合物的组合的复合物底物可用于生物过程而无需不同底物的预先分离。此外,可将来源于不同来源的底物组合在相同的生物过程中。底物可直接来源于植物或来自任何种类的包含碳水化合物的废物或副产品。
本发明代表商业乙醇产品水平上的完全CBP效应的首次例证,其中酵母产生的酶完全替代标准商业方法中添加的外源酶。因此,酵母CBP菌株能够在不添加任何外源酶的情况下在72小时内从液化的谷类醪液产生125g/l以上的乙醇。这是由于将选择的一组酶改造成工业强劲的背景菌株而实现的。所得的菌株还可用于直接从颗粒状淀粉产生乙醇而无需液化。
发明概述
在一些实施方案中,本发明包括酵母菌株,分泌全套水解木素纤维素的酶(包括水解纤维素、半纤维素中的和木质素与碳水化合物之间的化学键的酶)或该全套酶的子集。在一些实施方案中,本发明也是一组针对每一类必需的酶促活性在酵母中良好表达以高效利用特定木质纤维素材料的蛋白质。该全套酶包括超过先前鉴定的在酵母中表达的活性:CBH1、CBH2、EG和BGL(如在例如PCT申请号PCT/US2009/065571中公开的)的活性。在一些实施方案中,本发明涉及表达如下基因的一种或多种基因产物的酵母细胞:烟曲霉菌(Aspergillus fumigatus)内切葡聚糖酶(登录号XP_747897);费希新萨托菌内切葡聚糖酶(登录号XP_001257357);棒曲霉(Aspergillus clavatus)内切葡聚糖酶(登录号XP_001270378);土曲霉(Aspergillus terreus)内切葡聚糖酶(登录号XP_001217291);马尔尼菲青霉菌(Penicillium marneffei)内切葡聚糖酶(登录号XP_002152969);球毛壳菌(Chaetomium globosum)内切葡聚糖酶(登录号XP_001229968);粗糙脉孢菌(Neurospora crassa)内切葡聚糖酶(登录号XP_956431);米曲霉(Aspergillus oryzae)内切葡聚糖酶(登录号BAA22589);Thielaviaheterothallica内切葡聚糖酶(登录号AAE25067);尖孢镰刀菌(Fusariumoxysporum)内切葡聚糖酶(登录号AAG09047);特异腐质霉(Humicolainsolens)内切葡聚糖酶(登录号1DYM_A);小麦黄斑病真菌(Pyrenophoratritici-repentis)内切葡聚糖酶(登录号XP_001935476);稻温病菌内切葡聚糖酶(登录号XP_370166);禾谷镰孢菌(Fusarium graminearum)内切葡聚糖酶(登录号XP_388429);金孢子菌(Chrysosporium lucknowense)内切葡聚糖酶;漏斗无定形菌(Polyporus arcularius)内切葡聚糖酶(登录号BAF75943.1);白曲霉(Aspergillus kawachii)内切葡聚糖酶(登录号BAB62317.1);甜菜胞囊线虫(Heterodera schachtii)内切葡聚糖酶(登录号CAC12958.1);厌氧真菌(Orpinomyces sp.)内切葡聚糖酶(登录号AAD04193.1);白囊耙齿菌(Irpex lacteus)内切葡聚糖酶(登录号BAD67544.1);球毛壳菌内切葡聚糖酶(登录号XP_001220409.1);黑曲霉(Aspergillus niger)内切葡聚糖酶(登录号XP_001397982.1);斜卧青霉菌(Penicillium decumbens)内切葡聚糖酶(登录号ABY28340.1);黄孢原毛平革菌(Phanerochaete chrysosporium)内切葡聚糖酶(登录号AAU12276);葡萄穗霉(Stachybotrys echinata)内切葡聚糖酶(登录号AAM77710);费希新萨托菌(Neosartorya fischeri)内切葡聚糖酶(登录号XP_001261563);巴西毛壳(Chaetomium brasiliense)内切葡聚糖酶(登录号AAM77701);球毛壳菌内切葡聚糖酶(登录号EAQ86340);烟曲霉菌内切葡聚糖酶(登录号CAF31975);特异腐质霉内切葡聚糖酶(登录号CAG27577);费希新萨托菌内切葡聚糖酶(登录号XP_001267517);太瑞斯梭孢壳霉(Thielavia terrestris)内切葡聚糖酶(登录号ACE10231);金孢子菌内切葡聚糖酶(登录号ACH15008);球毛壳菌内切葡聚糖酶(登录号XP_001226436);嗜热支顶孢属霉(Acremonium thermophilum)内切葡聚糖酶(登录号ACE10216);特异腐质霉内切葡聚糖酶(登录号CAB42307);太瑞斯梭孢壳霉内切葡聚糖酶(登录号CAH03187);金孢子菌内切葡聚糖酶(登录号AAQ38151);稻温病菌(Magnaporthe grisea)内切葡聚糖酶(登录号EDJ97375);球毛壳菌内切葡聚糖酶(登录号EAQ84577);特异腐质霉内切葡聚糖酶1DYS_B;粗糙脉孢菌(Neurospera crassa)内切葡聚糖酶(登录号XP_957415);里氏木霉(Trichoderma reesei)木葡聚糖酶(登录号AAP57752);黑曲霉木葡聚糖酶(登录号AAK77227);棘孢曲霉(Aspergillus aculeatus)木葡聚糖酶(登录号BAA29031);费希新萨托菌木葡聚糖酶(登录号XP_001261776);嗜热毛壳菌(Chaetomiumthermophilum)内切木聚糖酶(登录号CAD48749);里氏木霉内切木聚糖酶(登录号ABK59833);金孢子菌内切木聚糖酶(登录号AAQ38147);出芽短梗霉(Aureobasidium pullulans)内切木聚糖酶(登录号BAE71410);构巢曲霉(Aspergillus nidulans)β-木糖苷酶(登录号CAA73902;旋孢腔菌(Cochliobolus carbonum)β-木糖苷酶(登录号AAC67554);梅花状青霉(Penicillium herquei)β-木糖苷酶(登录号BAC75546);小麦黄斑病真菌β-木糖苷酶(登录号XP_001940956);黑曲霉β-甘露糖苷酶(登录号Q9UUZ3);棘孢曲霉β-甘露糖苷酶(登录号BAA29029);费希新萨托菌β-甘露糖苷酶(登录号XP_001258000);里氏木霉α-葡糖苷酸酶(登录号CAA92949);黑曲霉α-葡糖苷酸酶(登录号CAC38119);埃默森篮状菌(Talaromyces emersonii)α-葡糖苷酸酶(登录号AAL33576);黑曲霉乙酰基木聚糖酯酶(登录号XP_001395572);里氏木霉乙酰基木聚糖酯酶(登录号Q99034);费希新萨托菌乙酰基木聚糖酯酶(登录号XP_001262186);里氏木霉阿拉伯呋喃糖酶,1,4-β-D-阿拉伯木聚糖阿拉伯呋喃糖基水解酶(登录号AAP57750);球毛壳菌阿拉伯呋喃糖酶,1,4-β-D-阿拉伯木聚糖阿拉伯呋喃糖基水解酶(登录号XP_001223478);黑曲霉阿拉伯呋喃糖酶,1,4-β-D-阿拉伯木聚糖阿拉伯呋喃糖基水解酶(登录号XP_001389998);斜卧青霉菌膨胀因子(登录号ACH57439);费希新萨托菌膨胀因子(登录号XP_001257521);柄篮状菌(Talaromyces stipitatus)膨胀因子(登录号EED19018);里氏木霉(登录号AAP57751);球毛壳菌(登录号XP_001228455);稻温病菌(登录号XP_365869);里氏木霉葡糖苷酸酯酶(登录号AAP57749);球毛壳菌葡糖苷酸酯酶(登录号XP_001226041);烟曲霉菌葡糖苷酸酯酶(登录号XP_751313);银白杨(Populus alba)α-棒曲霉素(登录号BAB39482);黑提葡萄(Triticum aestivum)α-棒曲霉素(登录号BAC66697);小麦(Triticum aestivum)β-棒曲霉素(登录号AAS48881);蓝桉(Eucalyptus globulus)β-棒曲霉素(登录号AAZ08315);黑曲霉阿魏酸酯酶(登录号XP_001393337);土曲霉阿魏酸酯酶(登录号XP_001211092);柄篮状菌阿魏酸酯酶(登录号EED17739);球毛壳菌阿魏酸酯酶(登录号XP_001228412)除虫链霉菌(Streptomycesavermitilis)1,4-β-纤维二糖苷酶guxA1(登录号NP_821732.1);除虫链霉菌1,4-β-纤维二糖苷酶guxA2(登录号NP_823029.1);除虫链霉菌1,4-β-纤维二糖苷酶guxA3(登录号NP_823031.1);除虫链霉菌内切-1,4-β-葡聚糖酶celA1(登录号NP_821730.1);除虫链霉菌内切-1,4-β-葡聚糖酶celA2(登录号NP_823030.1);除虫链霉菌内切-1,4-β-葡聚糖酶celA3(登录号NP_823032.1);除虫链霉菌内切-1,4-β-葡聚糖酶celA4(登录号NP_823744.1);除虫链霉菌内切-1,4-β-葡聚糖酶(登录号NP_826394.1);除虫链霉菌内切-1,4-β-葡聚糖酶celA5(登录号NP_828072.1);除虫链霉菌Β-1,4-木聚糖酶(登录号NP_823272.1);除虫链霉菌Β-1,4-木聚糖酶(登录号NP_826161.1);除虫链霉菌木聚糖酶(登录号NP_827548.1);除虫链霉菌内切-1,4-β-木聚糖酶xynD(登录号NP_827557.1);除虫链霉菌1,4-β-木糖苷酶xynB1(登录号NP_822628.1);除虫链霉菌β-木糖苷酶(登录号NP_823285.1);除虫链霉菌1,4-β-木糖苷酶xynB2(登录号NP_826159.1);除虫链霉菌1,4-β-木糖苷酶xynB3(登录号NP_827745.1);除虫链霉菌β-葡糖苷酶bglC1(登录号NP_822977.1);除虫链霉菌β-葡糖苷酶bglC2(登录号NP_826430.1);除虫链霉菌β-葡糖苷酶bglC3(登录号NP_826775.1);除虫链霉菌AXE1(登录号NP_822477.1);除虫链霉菌AXE1(登录号NP_822632.1);除虫链霉菌abfA(登录号NP_822218.1);除虫链霉菌abfB(登录号NP_822290.1);除虫链霉菌abfA(登录号NP_826920.1);除虫链霉菌abfB(登录号BAC74043.1);除虫链霉菌SAV_6756(登录号BAC74467.1);除虫链霉菌agaA1(登录号BAC68338.1);除虫链霉菌agaA3(登录号BAC68787.1);除虫链霉菌agaB2(登录号BAC69185.1);Saccharophagus degradans 2-40Sde_2993(登录号YP_528462.1);Saccharophagus degradans 2-40Sde_2996(登录号YP_528465.1);Saccharophagus degradans 2-40Sde_3023(登录号YP_528492.1);Saccharophagus degradans 2-40cel5A(登录号ABD82260.1);Saccharophagus degradans 2-40 cel5E(登录号ABD82186.1);Saccharophagus degradans 2-40 cel5F(登录号ABD80834.1);Saccharophagus degradans 2-40 cel5J(登录号ABD81754.1;Saccharophagus degradans 2-40 cel9A(登录号ABD79898.1);Saccharophagus degradans 2-40 ced3A(登录号ABD81757.1);Saccharophagus degradans 2-40 ced3B(登录号ABD79509.1);Saccharophagus degradans 2-40 bgl1A(登录号ABD82858.1);Saccharophagus degradans 2-40 bgl1B(登录号ABD80656.1);Saccharophagus degradans 2-40 Cep94A(登录号ABD80580.1);Saccharophagus degradans 2-40Cep94B(登录号ABD80168.1);Saccharophagus degradans 2-40 Sde_0509(登录号YP_525985.1);Saccharophagus degradans 2-40 Sde_0169(登录号YP_525645.1);枯草芽孢杆菌(Bacillus subtilis)棒曲霉素exlX(登录号CAB13755.1);枯草芽孢杆菌内切-1,4-β-葡聚糖酶eglS(登录号CAB13696.2);枯草芽孢杆菌内切-木聚糖酶xynC(登录号CAB13698.1);枯草芽孢杆菌内切-1,4-β-木聚糖酶xynD(登录号CAB13699.1);枯草芽孢杆菌内切-1,4-β-木聚糖酶xynA(登录号CAB13776.1);枯草芽孢杆菌木聚糖β-1,4-木糖苷酶xynB(登录号CAB13642.2);Clostridiumphytofermentans Cphy_3367(登录号YP_001560459.1);Clostridiumphytofermentans Cphy_3368(登录号YP_001560460.1);Clostridiumphytofermentans Cphy_2058(登录号YP_001559165.1);Clostridiumphytofermentans Cphy_3202纤维素酶B(登录号YP_001560295.1);Clostridium phytofermentans Cphy_1163(登录号YP_001558280.1);Clostridium phytofermentans Cphy_3329(登录号YP_001560421.1);Clostridium phytofermentans Cphy_1125(登录号YP_001558242.1);Clostridium phytofermentans Cphy_1510(登录号YP_001558623.1);Clostridium phytofermentans Cphy_0624(登录号YP_001557750.1);Clostridium phytofermentans Cphy_2105 XynA(登录号YP_001559210.1);Clostridium phytofermentans Cphy_2108(登录号YP_001559213.1);Clostridium phytofermentans Cphy_3207Y(登录号YP_001560300.1);Clostridium phytofermentans Cphy_0191(登录号YP_001557317.1);Clostridium phytofermentans Cphy_0875(登录号YP_001558000.1);Clostridium phytofermentans Cphy_1169(登录号YP_001558286.1);Clostridium phytofermentans Cphy_1071(登录号YP_001558190.1);Clostridium phytofermentans Cphy_2128(登录号YP_001559233.1);Clostridium phytofermentans Cphy_2276(登录号YP_001559376.1);Clostridium phytofermentans Cphy_1936(登录号YP_001559043.1);解纤维梭菌(Clostridium cellulolyticum)cel5I(登录号AAL79562.1);解纤维梭菌CelCCF(dockerin)Cel48F-酵母CO模板pMU914(登录号AAB41452.1);解纤维梭菌Ccel_1259(登录号YP_002505595);解纤维梭菌Ccel_2226(登录号YP_002506548.1);解纤维梭菌Ccel_0732(dockerin)Cel9E-酵母CO模板pMU913(登录号YP_002505091.1);解纤维梭菌Ccel_1099(dockerin)Cel5A-酵母CO模板pMU967(登录号YP_002505438.1);解纤维梭菌Ccel_2392(dockerin)(登录号YP_002506705.1);解纤维梭菌Ccel_0731(dockerin)Cel9G-酵母CO模板pMU892(登录号YP_002505090.1);解纤维梭菌Ccel_0840(dockerin)Cel5D-酵母CO模板pMU891(登录号YP_002505196.1);解纤维梭菌CelCCC(dockerin)Cel8C-酵母CO模板pMU969(登录号AAA73867.1);嗜热裂孢菌(Thermobifida fusca)内切-1,4-β木聚糖酶(登录号ABL73883.1);嗜热裂孢菌内切-1,4-β-D-木聚糖酶(xyl11)(登录号AAV64879.1);嗜热裂孢菌内切葡聚糖酶(登录号AAZ55112.1);嗜热裂孢菌纤维素酶(登录号AAZ56745.1);嗜热裂孢菌外切-1,4-β-葡糖苷酶(登录号AAZ55642.1);嗜热裂孢菌β-葡糖苷酶(登录号AAZ55664.1);嗜热裂孢菌纤维素1,4-β-纤维二糖苷酶(登录号YP_290015.1);嗜热裂孢菌CBD E8(登录号AAZ55700.1);嗜热裂孢菌celC(E3)(登录号YP_288681.1);嗜热裂孢菌celE(E5)(登录号YP_288962.1);嗜热裂孢菌cel5B(内切葡聚糖酶)(登录号AAP56348.1);嗜热裂孢菌celA(E1)(登录号AAC06387.1);嗜热裂孢菌celB(E2)(登录号YP_289135.1);嗜热裂孢菌Tfu_1627(1,4-β-纤维二糖苷酶)(登录号YP_289685.1);热纤梭菌(Clostridium thermocellum)celA(dockerin)(登录号YP_001036701.1);热纤梭菌celY(cel48Y)(登录号CAI06105.1);热纤梭菌Cthe_0625(dockerin)(登录号YP_001037053.1);热纤梭菌celC(登录号CAC27410.1);热纤梭菌(登录号YP_001037893.1);热纤梭菌(登录号YP_001038519.1);热纤梭菌bglA(登录号CAA42814.1);热纤梭菌bglB(登录号CAA33665.1);热纤梭菌Cthe_2548(登录号YP_001038942.1);热纤梭菌Cthe_1273(登录号YP_001037698.1);热纤梭菌Cthe_0040(Cel9I)(登录号YP_001036474.1);热纤梭菌Cthe_0412(dockerin)(登录号YP_001036843.1);热纤梭菌Cthe_0825(dockerin)(登录号YP_001037253.1);耐热梭状芽孢杆菌(Clostridium stercorarium)xynA(登录号CAD48307);耐热梭状芽孢杆菌xynB(CelW-cello木聚糖酶)(登录号CAD48313);耐热梭状芽孢杆菌xynC(CelX-cello木聚糖酶)(登录号CAD48314);耐热梭状芽孢杆菌bxlB(b-木糖苷酶B)(登录号AJ508405);耐热梭状芽孢杆菌bxlA(b-木糖苷酶A)(登录号AJ508404);耐热梭状芽孢杆菌bglZ(β-葡糖苷酶)(登录号CAB08072);耐热梭状芽孢杆菌arfA(α-阿拉伯呋喃糖酶A)(登录号AJ508406);耐热梭状芽孢杆菌arfB(α-阿拉伯呋喃糖酶B)(登录号AAC28125);耐热梭状芽孢杆菌celZ(Cs-Cel9Z-微晶粉末纤维素酶I)(登录号CAA39010);耐热梭状芽孢杆菌celY(Cs-Cel48Y-微晶粉末纤维素酶II)(登录号CAA93280);Anaerocellum thermophilum celA(1,4-β-葡聚糖酶)(登录号CAB06786);Anaerocellum thermophilum celD(EG)(登录号CAB01405);Anaerocellum thermophilum xynA(1,4-β-D-木聚糖木聚糖水解酶)(登录号CAA93627);Anaerocellum thermophilumcelB(EG5)(登录号Z86104);Anaerocellum thermophilum Athe_1866(内切-1,4-β-甘露糖苷酶)(登录号YP_002573059);Anaerocellumthermophilum Athe_0594("纤维素酶")(登录号YP_002572493)。
在一些实施方案中,本发明的细胞可表达成对的对于给定的木质纤维素底物的作用方面具有协同活性的酶。此类成对的酶包括但不限于(除虫链霉菌内切-1,4-β-葡聚糖酶celA2(登录号NP_823030.1)和除虫链霉菌内切-1,4-β-葡聚糖酶celA5(登录号NP_828072.1));(除虫链霉菌内切-1,4-β-葡聚糖酶celA2(登录号NP_823030.1)和枯草芽孢杆菌内切-1,4-β-葡聚糖酶(登录号CAB13696.2));(除虫链霉菌内切-1,4-β-葡聚糖酶celA3(登录号NP_823032.1)和除虫链霉菌内切-1,4-β-葡聚糖酶(登录号NP_826394.1));(除虫链霉菌内切-1,4-β-葡聚糖酶celA4(登录号NP_823744.1)和除虫链霉菌木聚糖酶(登录号NP_827548.1));(枯草芽孢杆菌内切-1,4-β-葡聚糖酶(登录号CAB13696.2)和除虫链霉菌内切-1,4-β-葡聚糖酶(登录号NP_826394.1));(除虫链霉菌内切-1,4-β-葡聚糖酶celA4(登录号NP_823744.1)和枯草芽孢杆菌内切-1,4-β-葡聚糖酶(登录号CAB13696.2));(除虫链霉菌内切-1,4-β-葡聚糖酶celA5(登录号NP_828072.1)和除虫链霉菌内切-1,4-β-葡聚糖酶celA4(登录号NP_823744.1));(除虫链霉菌内切-1,4-β-葡聚糖酶celA5(登录号NP_828072.1)和Clostridium phytofermentans木聚糖酶(登录号YP_001557750.1));(Saccharophagus degradans 2-40甘露聚糖酶(登录号YP_525985.1)和除虫链霉菌内切-1,4-β-葡聚糖酶(登录号NP_826394.1));(除虫链霉菌木聚糖酶(登录号NP_827548.1)和Saccharophagusdegradans 2-40甘露聚糖酶(登录号YP_525985.1));(Clostridiumphytofermentans木聚糖酶(登录号YP_001557750.1)和除虫链霉菌木聚糖酶(登录号NP_827548.1));(Clostridium phytofermentans木聚糖酶(登录号YP_001557750.1)和除虫链霉菌木聚糖酶(登录号NP_827548.1));(除虫链霉菌内切-1,4-β-葡聚糖酶celA5(登录号NP_828072.1)和除虫链霉菌木聚糖酶(登录号NP_827548.1));(除虫链霉菌内切-1,4-β-葡聚糖酶(登录号NP_823744.1)和Saccharophagus degradans 2-40甘露聚糖酶(登录号YP_525985.1));(除虫链霉菌内切-1,4-β-葡聚糖酶celA2(登录号NP_823030.1)和Saccharophagus degradans 2-40甘露聚糖酶(登录号YP_525985.1));(除虫链霉菌内切-1,4-β-葡聚糖酶(登录号NP_823744.1)和除虫链霉菌内切-1,4-β-葡聚糖酶celA3(登录号NP_823032.1));(除虫链霉菌内切-1,4-β-葡聚糖酶(登录号NP_823744.1)和Clostridiumphytofermentans木聚糖酶(登录号YP_001557750.1));(除虫链霉菌木聚糖酶(登录号NP_827548.1)和除虫链霉菌内切-1,4-β-葡聚糖酶celA3(登录号NP_823032.1));(除虫链霉菌内切-1,4-β-葡聚糖酶celA4(登录号NP_823744.1)和除虫链霉菌内切-1,4-β-葡聚糖酶(登录号NP_826394.1))
在一些实施方案中,本发明的宿主细胞可表达对于给定的木质纤维素底物的作用方面具有协同活性的三种酶。此类三元组的酶可以是例如(除虫链霉菌内切-1,4-β-葡聚糖酶celA4 NP_823744.1、除虫链霉菌内切-1,4-β-葡聚糖酶celA5 NP_828072.1和除虫链霉菌内切-1,4-β-葡聚糖酶celA2NP_823030.1);(除虫链霉菌木聚糖酶NP_827548.1、除虫链霉菌内切-1,4-β-葡聚糖酶celA5 NP_828072.1和除虫链霉菌内切-1,4-β-葡聚糖酶celA2 NP_823030.1);(Clostridium phytofermentans木聚糖酶YP_001557750.1、除虫链霉菌内切-1,4-β-葡聚糖酶celA5 NP_828072.1和除虫链霉菌内切-1,4-β-葡聚糖酶celA2 NP_823030.1);(Saccharophagusdegradans 2-40甘露聚糖酶YP_525985.1、除虫链霉菌内切-1,4-β-葡聚糖酶celA5 NP_828072.1和除虫链霉菌内切-1,4-β-葡聚糖酶celA2NP_823030.1);(除虫链霉菌内切-1,4-β-葡聚糖酶celA3 NP_823032.1、除虫链霉菌内切-1,4-β-葡聚糖酶celA5 NP_828072.1和除虫链霉菌内切-1,4-β-葡聚糖酶celA2 NP_823030.1);(枯草芽孢杆菌内切-1,4-β-葡聚糖酶eglS CAB13696.2、除虫链霉菌内切-1,4-β-葡聚糖酶celA5 NP_828072.1和除虫链霉菌内切-1,4-β-葡聚糖酶celA2 NP_823030.1);(除虫链霉菌内切-1,4-β-葡聚糖酶NP_826394.1、除虫链霉菌内切-1,4-β-葡聚糖酶celA5NP_828072.1和除虫链霉菌内切-1,4-β-葡聚糖酶celA2 NP_823030.1);(除虫链霉菌内切-1,4-β-葡聚糖酶celA2 NP_823030.1、除虫链霉菌内切-1,4-β-葡聚糖酶celA5 NP_828072.1和除虫链霉菌内切-1,4-β-葡聚糖酶celA4 NP_823744.1);(除虫链霉菌木聚糖酶NP_827548.1除虫链霉菌内切-1,4-β-葡聚糖酶celA5 NP_828072.1和除虫链霉菌内切-1,4-β-葡聚糖酶celA4 NP_823744.1);(Clostridium phytofermentans木聚糖酶YP_001557750.1、除虫链霉菌内切-1,4-β-葡聚糖酶celA5 NP_828072.1和除虫链霉菌内切-1,4-β-葡聚糖酶celA4NP_823744.1);(Saccharophagusdegradans 2-40甘露聚糖酶YP_525985.1、除虫链霉菌内切-1,4-β-葡聚糖酶celA5 NP_828072.1和除虫链霉菌内切-1,4-β-葡聚糖酶celA4NP_823744.1);(除虫链霉菌内切-1,4-β-葡聚糖酶celA3 NP_823032.1、除虫链霉菌内切-1,4-β-葡聚糖酶celA5 NP_828072.1和除虫链霉菌内切-1,4-β-葡聚糖酶celA4 NP_823744.1);(除虫链霉菌内切-1,4-β-葡聚糖酶NP_826394.1、除虫链霉菌内切-1,4-β-葡聚糖酶celA5 NP_828072.1和除虫链霉菌内切-1,4-β-葡聚糖酶celA4 NP_823744.1);(枯草芽孢杆菌内切-1,4-β-葡聚糖酶eglS CAB13696.2、除虫链霉菌内切-1,4-β-葡聚糖酶celA5 NP_828072.1和除虫链霉菌内切-1,4-β-葡聚糖酶celA4NP_823744.1);(除虫链霉菌内切-1,4-β-葡聚糖酶celA2 NP_823030.1、除虫链霉菌内切-1,4-β-葡聚糖酶celA5 NP_828072.1和除虫链霉菌木聚糖酶NP_827548.1);(除虫链霉菌内切-1,4-β-葡聚糖酶celA4NP_823744.1,除虫链霉菌内切-1,4-β-葡聚糖酶celA5 NP_828072.1和除虫链霉菌木聚糖酶NP_827548.1);(Clostridium phytofermentans木聚糖酶YP_001557750.1、除虫链霉菌内切-1,4-β-葡聚糖酶celA5 NP_828072.1和除虫链霉菌木聚糖酶NP_827548.1);(Saccharophagus degradans 2-40甘露聚糖酶YP_525985.1、除虫链霉菌内切-1,4-β-葡聚糖酶celA5NP_828072.1和除虫链霉菌木聚糖酶NP_827548.1);(除虫链霉菌内切-1,4-β-葡聚糖酶celA3 NP_823032.1、除虫链霉菌内切-1,4-β-葡聚糖酶celA5 NP_828072.1和除虫链霉菌木聚糖酶NP_827548.1);(除虫链霉菌内切-1,4-β-葡聚糖酶NP_826394.1、除虫链霉菌内切-1,4-β-葡聚糖酶celA5 NP_828072.1和除虫链霉菌木聚糖酶NP_827548.1);(枯草芽孢杆菌内切-1,4-β-葡聚糖酶eglS CAB13696.2、除虫链霉菌内切-1,4-β-葡聚糖酶celA5 NP_828072.1和除虫链霉菌木聚糖酶NP_827548.1);(除虫链霉菌内切-1,4-β-葡聚糖酶celA2 NP_823030.1、除虫链霉菌内切-1,4-β-葡聚糖酶celA5 NP_828072.1和Clostridium phytofermentans木聚糖酶YP_001557750.1);(除虫链霉菌内切-1,4-β-葡聚糖酶celA4NP_823744.1、除虫链霉菌内切-1,4-β-葡聚糖酶celA5NP_828072.1和Clostridium phytofermentans木聚糖酶YP_001557750.1);(除虫链霉菌木聚糖酶NP_827548.1、除虫链霉菌内切-1,4-β-葡聚糖酶celA5NP_828072.1和Clostridium_ phytofermentans木聚糖酶YP_001557750.1);(Saccharophagus degradans 2-40 甘露聚糖酶YP_525985.1、除虫链霉菌内切-1,4-β-葡聚糖酶celA5 NP_828072.1和Clostridium phytofermentans木聚糖酶YP_001557750.1);(除虫链霉菌内切-1,4-β-葡聚糖酶celA3 NP_823032.1、除虫链霉菌内切-1,4-β-葡聚糖酶celA5 NP_828072.1和Clostridium phytofermentans木聚糖酶YP_001557750.1);(除虫链霉菌内切-1,4-β-葡聚糖酶NP_826394.1、除虫链霉菌内切-1,4-β-葡聚糖酶celA5 NP_828072.1和Clostridiumphytofermentans木聚糖酶YP_001557750.1);和(枯草芽孢杆菌内切-1,4-β-葡聚糖酶eglS CAB13696.2、除虫链霉菌内切-1,4-β-葡聚糖酶celA5 NP_828072.1和Clostridium phytofermentans木聚糖酶YP_001557750.1)。
在一些实施方案中,本发明的宿主细胞可表达在它们对给定的木质纤维素底物的作用方面具有协同活性的4种酶。此类四元组的酶可以是例如(除虫链霉菌内切-1,4-β-葡聚糖酶celA4 NP_823744.1、除虫链霉菌木聚糖酶NP_827548.1、除虫链霉菌内切-1,4-β-葡聚糖酶celA5NP_828072.1,和除虫链霉菌内切-1,4-β-葡聚糖酶celA2 NP_823030.1);(Clostridium phytofermentans木聚糖酶YP_001557750.1、除虫链霉菌木聚糖酶NP_827548.1、除虫链霉菌内切-1,4-β-葡聚糖酶celA5NP_828072.1,和除虫链霉菌内切-1,4-β-葡聚糖酶celA2 NP_823030.1);(Clostridium phytofermentans木聚糖酶YP_001557750.1、除虫链霉菌内切-1,4-β-葡聚糖酶celA4 NP_823744.1、除虫链霉菌内切-1,4-β-葡聚糖酶celA5 NP_828072.1和除虫链霉菌内切-1,4-β-葡聚糖酶celA2NP_823030.1);(除虫链霉菌内切-1,4-β-葡聚糖酶NP_826394.1、除虫链霉菌内切-1,4-β-葡聚糖酶celA4 NP_823744.1、除虫链霉菌内切-1,4-β-葡聚糖酶celA5 NP_828072.1和除虫链霉菌内切-1,4-β-葡聚糖酶celA2NP_823030.1);(Saccharophagus degradans 2-40甘露聚糖酶YP_525985.1、除虫链霉菌木聚糖酶NP_827548.1、除虫链霉菌内切-1,4-β-葡聚糖酶celA5 NP_828072.1和除虫链霉菌内切-1,4-β-葡聚糖酶celA2NP_823030.1);和(Saccharophagus degradans 2-40甘露聚糖酶YP_525985.1、除虫链霉菌内切-1,4-β-葡聚糖酶celA4、NP_823744.1、除虫链霉菌内切-1,4-β-葡聚糖酶celA5 NP_828072.1和除虫链霉菌内切-1,4-β-葡聚糖酶celA2 NP_823030.1)。
在一些实施方案中,酵母细胞表达与CBH1、CBH2、EG或BGL的一种或多种结合的任一个或多个上文中命名的基因。
在一些实施方案中,本发明的细胞可用于减少在SSF或CBP过程中水解木素纤维素所需的外源酶的量或在给定的纤维素酶载量在SSF或CBP过程中增加发酵产物的产率。
在一些实施方案中,本发明提供了内切葡聚糖酶、木聚糖酶、木糖苷酶、酯酶、其它水解酶以及具有活性的并且由酿酒酵母和其它酵母种类良好表达的其它辅助酶的多核苷酸和氨基酸序列。在一些实施方案中,此类良好表达的酶提供了纤维素酶混合物的增强的水解木素纤维素的能力。在一些实施方案中,本发明的酶的组合对于增强酵母表达的“核心”纤维素酶CBH1、CBH2、EG和BGL的活性是有用的。在一些实施方案中,宿主酵母细胞,除“核心”纤维素酶外,还表达木聚糖酶、木糖苷酶、葡糖淀粉酶和乙酰基木聚糖酯酶。在一些实施方案中,本发明提供了使用酵母高表达载体、着丝粒载体和利用基因组整合以多个拷贝表达多个基因的技术。
在一些实施方案中,本发明涉及通过将本发明的细胞与木质纤维素材料接触,随后回收发酵材料来产生发酵产物的方法。
在一些实施方案中,本发明涉及通过木质纤维素材料的发酵产生的产物。
在一个方面,将糖分解酶(淀粉酶,纤维素酶,半纤维素酶,纤维素分解及淀粉分解辅助酶、菊粉酶,果聚糖酶等)和利用戊糖的酶组合在单个酵母菌株中。在另一个实施方案中,水解酶和戊糖水解酶在用于相同技术方法的不同酵母菌株中表达。在一个方面,将各自表达不同的酶,或不同的酶组合的酵母菌株共培养在相同的容器(volume)中。在另一个实施方案中,将各自表达不同的酶或不同的酶组合的酵母菌株培养在分开的容器中。
复合生物质原料包含不同量的淀粉、木质纤维素材料和戊糖。因此,本发明的酵母菌株被构建来表达以不同水平表达不同的糖分解酶。在一个实施方案中,酵母菌株以比一种或多种淀粉水解酶和一种或多种利用戊糖的酶更高的水平表达一种或多种纤维素分解酶。在另一个实施方案中,酵母菌株以比一种或多种纤维分解酶和一种或多种利用戊糖的酶更高的水平表达一种或多种淀粉分解酶。在另一个实施方案中,酵母菌株以比一种或多种纤维分解酶和一种或多种淀粉分解酶更高的水平表达一种或多种利用戊糖的酶。
在一些实施方案中,本发明涉及包含编码含有与SEQ ID NO:442-446的氨基酸序列之任一具有至少90%的同一性的氨基酸序列的多肽的外源多核苷酸的重组酵母宿主细胞。
在一些实施方案中,本发明涉及包含一个或多个编码表19的多肽的异源多核苷酸的重组酵母宿主细胞。
在一些实施方案中,本发明涉及重组酵母宿主细胞,其包含:(a)至少一个包含编码葡糖淀粉酶的核酸的异源多核苷酸;(b)至少一个包含编码α-葡糖苷酶的核酸的异源多核苷酸;(c)至少一个包含编码利用戊糖的酶的核酸的异源多核苷酸;和(d)还包含至少一个编码包含根据SEQID NO:442-446的氨基酸序列的多肽的异源多核苷酸。在另一个实施方案中,酵母宿主细胞还包含α-淀粉酶、支链淀粉酶和/或异支链淀粉酶。
在一些实施方案中,本发明的细胞可表达成对的在它们对于给定的生物质底物的作用方面具有协同活性的淀粉分解酶。此类淀粉分解酶对包括但不限于(SEQ ID NO:443和SEQ ID NO:444);(SEQ ID NO:443和SEQ ID NO:445);(SEQ ID NO:445和SEQ ID NO:446);(SEQ IDNO:443和SEQ ID NO:445);(SEQ ID NO:442和SEQ ID NO:445);(SEQ ID NO:444和枯草芽孢杆菌阿拉伯木聚糖酶(登录号CAB13699.1));(SEQ ID NO:444和枯草芽孢杆菌阿拉伯木聚糖酶(登录号CAB13699.1));(SEQ ID NO:444和枯草芽孢杆菌阿拉伯木聚糖酶内切-1,5-α-L-阿拉伯糖苷酶(登录号CAB15969.1));(SEQ ID NO:444和枯草芽孢杆菌阿拉伯聚糖-内切1,5-α-L-阿拉伯糖苷酶(登录号CAA99586.1));(SEQ ID NO:444和枯草芽孢杆菌阿拉伯聚糖内切-1,5-α-L-阿拉伯糖苷酶(登录号AL009126));(SEQ ID NO:444和枯草芽孢杆菌内切-阿拉伯糖酶(登录号D85132));(SEQ ID NO:444和Clostridium phytofermentans阿拉伯半乳聚糖内切-1,4-β-半乳糖苷酶(登录号CP000885));(SEQ ID NO:444和地衣芽孢杆菌((Bacilluslicheniformis))阿拉伯聚糖-内切1,5-α-L-阿拉伯糖酶(登录号AAU40201.1);(SEQ ID NO:444和地衣芽孢杆菌阿拉伯聚糖-内切1,5-α-L-阿拉伯糖酶(登录号AAU41895.1);(SEQ ID NO:444和地衣芽孢杆菌阿拉伯半乳聚糖内切-1,4-β-半乳糖苷酶(登录号AAU43089.1);(SEQ ID NO:444和地衣芽孢杆菌阿拉伯聚糖内切-1,5-α-L-阿拉伯糖苷酶(登录号AAU43033.1);(SEQ ID NO:444和地衣芽孢杆菌阿拉伯聚糖内切-1,4-β-木聚糖酶(登录号AAU39947.1);(SEQ ID NO:444和解糖热厌氧杆菌(Thermoanaerobacterium saccharolyticum)阿拉伯半乳聚糖内切-1,4-β-半乳糖苷酶);(SEQ ID NO:444和解糖热厌氧杆菌α-N-阿拉伯呋喃糖酶);(SEQ ID NO:444和除虫链霉菌内切-1,4-β-木聚糖酶xynD(登录号827557.1);(SEQ ID NO:444和枯草芽孢杆菌内切-1,4-β-木聚糖酶xynA(登录号CAB13776.1);(SEQ ID NO:444和Clostridiumphytofermentans木聚糖酶(登录号YP_001558623.1);(SEQ ID NO:444和Clostridium phytofermentans木聚糖酶(登录号YP_001557750.1);(SEQ ID NO:444和嗜热裂孢菌内切-1,4-β-D-木聚糖酶(xyl11)(登录号AAV64879.1);(SEQ ID NO:444和热纤梭菌木聚糖酶(登录号YP_001038519.1);(SEQ ID NO:444和耐热梭状芽孢杆菌内切-木聚糖酶(登录号CAD48307);(SEQ ID NO:444和耐热梭状芽孢杆菌xynC(CelX–纤维素木聚糖酶)(登录号CAD48314);(SEQ ID NO:444和黑曲霉α-葡糖苷酶(登录号BAA23616.1));(SEQ ID NO:444和解糖热厌氧杆菌葡糖淀粉酶)。
在一些实施方案中,本发明的宿主细胞可表达在它们对于给定的生物质底物的作用方面具有协同活性的3种酶。此类三元组的酶可以是例如(SEQ ID NO:442、SEQ ID NO:445和SEQ ID NO:446);(SEQ ID NO:444、SEQ ID NO:445和SEQ ID NO:446);(SEQ ID NO:442、SEQ IDNO:445和SEQ ID NO:446)。
在一些实施方案中,本发明的宿主细胞可表达在它们对于给定的生物质底物的作用方面具有协同活性的4种酶。此类四元组的酶可以是例如(SEQ ID NO:442、SEQ ID NO:444、SEQ ID NO:445和SEQ ID NO:446);(SEQ ID NO:443、SEQ ID NO:444、SEQ ID NO:445和SEQ IDNO:446)。
在一些实施方案中,本发明涉及产生发酵产物的方法,所述方法包括:(a)将权利要求1-34的任一项的酵母细胞与谷类原料组合;(b)使所述酵母细胞发酵所述谷类原料;和(c)回收一种或多种发酵产物。
在一些实施方案中,本发明涉及包含两种或更多种编码多肽的异源多核苷酸的重组酵母宿主细胞,所述多肽包含:(a)至少一个与SEQ IDNO:219-436的氨基酸序列的一个或多个具有至少90%的同一性的氨基酸序列;和(b)至少一个与SEQ ID NO:442-446的氨基酸序列的一个或多个具有至少90%的同一性的氨基酸序列。
在一些实施方案中,本发明涉及重组酵母宿主细胞,其包含:(a)至少一个编码表11的多肽的异源多核苷酸;和(b)至少一个编码表19的多肽的异源多核苷酸。
附图概述
图1描述了纤维素和半纤维素的复杂性以及参与它们的降解的酶。阿拉伯木聚糖(b)、半乳甘露聚糖(c)和木糖葡聚糖(d)的纤维素(a)和半纤维素结构显示了存在的不同侧链。己糖与戊糖的区别在于来自环状六边形(吡喃糖环)的突出线的存在,显示了CH2OH基团。水解酶和4种多糖结构中被靶向切割的键由箭头标示。
图2描述了用于测试纤维素酶的基本克隆和表达载体(pMU1531)。该载体为用于在酵母中表达基因的附加型2-μ酵母表达载体。ENO1启动子-酿酒酵母启动子;S.cer ENO1 ter–酿酒酵母ENO1终止子;S.cer.URA3–酿酒酵母URA3营养缺陷型标记;2mu ori–2μ酿酒酵母质粒复制起始点;bla(AmpR)–Amp抗性标记;pBR322–E.coli pB322质粒的复制起始点;TEF1pr–棉病囊霉(Ashbya gossypii)TEF1启动子;TEF1ter–棉病囊霉TEF1终止子;ble(Zeo)R-印度斯坦链异壁菌(Streptoalloteichus hindustanus)ble Zeocin抗性基因。
图3描述了在M0509中表达的EG1候选者的CMC(上图)和微晶粉末纤维素(avicel)(下图)测定结果。在ENO1启动子和终止子的控制下测试所有EG1构建体。菌株M1322表达来自白蚁台湾乳白蚁(C.formosanus)的EG。里氏木霉EG1和里氏木霉EG2用作对照。
图4描述了与酵母产生的纯化的TeCBH1w/TrCBD、和ClCBH2和Novozyme188混合的前6个EG1候选者的预处理的硬木材(PHW)测定结果。
图5描述了在Novozyme188存在的情况下EG1候选者的PHW测定结果。
图6描述了产生(A)EG2和(B)EG3的菌株的上清液的SDS-PAGE分析的结果。包含不具有外源基因的质粒的菌株用作参照菌株(REF)。还包括包含表达T.r.eg2(先前发现的最成功的EG)的质粒pRDH180的菌株。
图7描述了CMC和大麦-β-葡聚糖测定的结果。将培养物点在含有0.2%的CMC(A和B)或大麦-β-葡聚糖(C)的SC-URA板上。数字指示每一个菌株包含的质粒。pRDH180包含里氏木霉eg2并且用作阳性对照。将板在30°C下温育3(A)或24(B及C)小时,随后洗掉菌落,用0.1%刚果红对板进行染色,用1% NaCl脱色。
图8描述了来自测量YPD和SC培养的表达EG的菌株在微晶粉末纤维素(24小时)和CMC(3小时)上活性的测定结果。包含不具有外源基因的质粒的菌株用作参照菌株(REF),表达T.r.eg2的菌株(pRDH180)被用作阳性对照。
图9描述了EG4、EG5和EG6克隆的CMC板测定的结果,以验证基因的活性表达。
图10描述了候选者EG4、EG5和EG6的PHW测定结果。
图11描述了通过PHW测定法利用EG4、EG5、EG6和木葡聚糖酶候选者进行的实验的结果。在50ml管中将培养物在35℃下于15ml的YPD中生长2天。将培养物离心,将各自2ml的上清液添加至2ml的PHW组分中(阴性对照为M0544,M1179表达CBH1、CBH2、EG2和BGL)。将4mg/g的纯化的酶以40:40:15:5的CBH1:CBH2:EG2:BGL1的比率用作筛选伴侣。
图12描述了产生(A)木聚糖酶和(B)木糖苷酶的菌株的上清液的SDS-PAGE分析的结果。包含不具有外源基因的质粒的菌株用作参照菌株(REF)。还包括了包含质粒pRDH182(表达T.r.xyn2)或包含质粒pRDH181(表达A.n.xlnD)的菌株。
图13描述了RBB-木聚糖测定的结果。将培养物点在含有0.2%RBB-木聚糖的SC-URA板上。数字指示由每一个菌株包含的质粒。将板在30°C下温育24小时。
图14描述了测量YPD和SC培养的表达木聚糖酶和木糖苷酶的菌株对1%桦树木的葡糖醛酸木聚糖(A)和pNPX(B)的活性的测定的结果。包含不具有外源基因的质粒的菌株用作参照菌株(REF)。
图15描述了测量水解活性的测定的结果,如通过由酵母上清液的混合物从5%的木聚糖释放的还原糖测量的。
图16描述了测量由酵母上清液从桦树木的葡糖醛酸木聚糖释放的糖的TLC测定的结果。Std1包含木四糖、木三糖、木二糖和木糖;Std2包含木三糖、木二糖和木糖。加载了5μL的反应物1至6。
图17描述了利用pNPA作为底物的阿拉伯呋喃糖酶活性测定的结果。
图18描述了候选酶对pNP-乙酸酯的酯酶活性的结果。
图19描述了各种辅助酶在未洗涤的MS630上进行的PHW测定的结果。在35℃下将培养物在50ml圆锥管中于10ml含有20ug/ml zeocin的YPD中生长3天。对于每一个候选者,添加1ml上清液,各0.5ml的M1457(BC60木聚糖酶)和M1381(P.t.r.GH43木糖苷酶)+2ml的PHW核心混合物。添加的核心酶为1mg/g的纯化的CBH1/CBH2/EG2和0.2mg/g的BGL1。
图20描述了对未洗涤的MS630(硬木材底物)使用辅助酶的组合进行的PHW测定的结果。所谓的“Big6”酶为:1mg/g的纯化的CBH1和CBH2,0.4mg/g的纯化的EG2和0.2mg/g的纯化的BGL,各0.5mL的M1457(来自C.phytofermentens的GH10木聚糖酶,或BC60—参见下文中的细菌酶筛选)和M1381(P.t.r.GH43木糖苷酶)。将这些酶在2mL的总体积中与PHW和缓冲剂组合,添加2mL的另外的酶作为测试,在酶之间均等地分配(即如果添加两种酶,则每一种1mL,或如果添加三种酶,则每一种0.67mL)。释放的葡萄糖和木糖的结果分别描述于图板A和B中。
图21描述了来自表达细菌(上)和真菌(下)的酶的酵母菌株的木聚糖酶测定的结果。在上图中,编号意指表7中描述的BC编号。
图22描述了来自评估在酵母中表达的细菌内切葡聚糖酶对CMC的分泌型活性的测定的结果。将菌株涂铺在YPD+Zeo板(Zeo 250mg/L)上进行2天,将其在96wp中接种于600uL YPD中,在35°C下以900rpm生长3天。对上清液进行标准CMC测定。所有菌株具有M0749背景。阴性对照为利用空表达载体pMU1575转化的M0749。pMU1575中的里氏木霉EG2用作阳性对照构建体。
图23描述了在酵母产生的纯化的CBH1和CBH2存在的情况下利用酵母产生的细菌内切葡聚糖酶(参见表7)的PHW测定的结果。所有孔补充有3.5mg/g TS BGL(Novozyme-188)和2mg/g TS酵母产生的纯化的CBH1+CBH2(比率1:1)。表达空载体的菌株的上清液用作阴性对照。
图24描述了测量由细菌GH9 EG(禾草腥黑粉菌Cel9A)与真菌GH5EG(里氏木霉EG2)的不同组合提供的从PHW释放的葡萄糖的测定结果。以2ml的量添加阴性对照(空载体)。所有其它样品的组合物示于图上。左边的条描述了来自补充有纯化的酵母产生的酶(1mg/g CBH1、1mg/g CBH2、0.2mg/g BGL)+未纯化的酵母产生的木聚糖酶(BC60,100ul/孔)和木糖苷酶(M1381,100ul/孔)的样品的结果。右边的条描述了来自补充有相同量的纯化的CBH+1mg/g AB BGL的样品的结果。
图25描述了在酵母中表达的细菌木聚糖酶对桦树木木聚糖的分泌型活性的测定的结果。将菌株涂铺在YPD+Zeo板(Zeo 250mg/L)上进行2天,将其在96孔板中接种于600μL YPD中。随后以900rpm将板在35°C下生长3天。在上清液中进行标准木糖测定(基于DNS的)。所有菌株具有M0749背景。阴性对照为利用空表达载体pMU1575转化的M0749。pMU1575中的里氏木霉Xyn2用作阳性对照构建体。
图26描述了通过PHW测定法测量的测量酵母产生的木聚糖酶对酵母产生的纤维素酶从PHW释放葡萄糖的影响的测定结果。左边的条描述了来自补充有酵母产生的纯化的纤维素酶(CBH1–1mg/g TS;CBH2–1mg/g TS;EG2–0.4mg/g TS,BGL–0.2mg/g TS)和酵母产生的未纯化的小麦黄斑病真菌β-木糖苷酶(GH43,M1381)的测定-50ul sup/4ml反应的测定的结果。将表达木糖苷酶的M1381菌株在摇床上于YPD中生长3天。右边的条描述了来自补充有相同量的酵母产生的纯化的CBH1、CBH2和EG2+1mg/g TS AB BGL(ME057)的测定的结果。利用葡萄糖己糖激酶试剂盒(Sigma)测量葡萄糖。以一式三份进行每一个实验。将来自表达空载体的菌株的上清液用作阴性对照(NegCon)。将表达真菌里氏木霉Xyn2的上清液用作阳性对照。
图27描述了来自木聚糖酶测定的结果,其中评估了表达解糖梭菌(T.saccharolyticum)的木聚糖酶基因的酵母菌株。
图28描述了来自在酵母产生的酶存在的情况下测量由细菌辅助酶提供的从PHW释放的葡萄糖的测定结果。进行标准PHW测定。利用HPLC测量葡萄糖。样品编号意指BC编号(参见表7)。以2ml的量添加所有样品。所有样品(包括NC(阴性对照))补充有纯化的1mg/gCBH1、1mg/gCBH2、0.4mg/gEG2、0.2mg/g BGL;未纯化的2.5%(v/v)木聚糖酶(M1457)和2.5%(v/v)。
图29描述了来自测量由属于不同GH家族的EG的不同组合(对)提供的从PHW释放的葡萄糖的测定结果。利用葡萄糖己糖激酶试剂盒测量葡萄糖。在第27小时和48小时采集样品。样品编号为GHF编号(参见下表)。以2ml的量添加NegCon(NC–空载体)上清液。每一个有色块的第一条柱为2ml的单种EG。每一个有色块中的所有其它条柱表示两种不同的EG(各自1ml)的组合。所有样品(包括NC)补充有1mg/gCBH1+1mg/gCBH2+4mg/g EE。EE–外源酶由下列组成:3.25mg/gME50-2(纤维素酶Novozyme22C,批号CZP00004,Novozymes);0.25mg/g ME54-2(木聚糖酶XYN30,批号EL2007020L,EB Enzymes;0.25mg/g ME57(β-葡糖苷酶ABK,批号EL2008044L,EB Enzymes;和0.25mg/g ME64(果胶酶FE,批号166005x/lm401-083-3580,Genencor)。MS630(预处理的硬木材)用作底物。以一式三份进行所有实验。缺失的条柱或不具有误差棒的条柱表示所有或大部分重复失败。
图30描述了来自测量由属于不同GH家族的EG的不同组合(三元组)提供的从PHW释放的葡萄糖的测定结果。利用GHK试剂盒测量葡萄糖。在第48小时采集样品。样品编号为GHF编号(参见下表)。以2ml的量添加阴性对照(NC–空载体)和其它单种EG上清液。在具有两种EG的样品中,添加1ml的每种上清液。在具有三种EG的样品中,添加0.666ml的每种上清液。所有样品(包括NC)补充有1mg/gCBH1+1mg/gCBH2+4mg/g EE。MS630用作底物(预处理的硬木材)。以一式三份进行所有实验。无误差棒的条柱表示两个重复失败。
图31描述了来自测量由属于不同GH家族的EG的不同组合提供的从PHW释放的葡萄糖的测定结果。利用葡萄糖己糖激酶试剂盒测量葡萄糖。在第24(A)、48(B)、72(C)和96(D)小时采集样品。样品编号为GHF编号(参见表)。以2ml的量添加阴性对照(NC–空载体)和其它单种EG上清液。在具有两种EG的样品中,添加1ml的每种上清液。在具有三种EG的样品中,添加0.666ml的每种上清液。在具有四种EG的样品中,添加0.5ml的每种上清液。所有样品(包括NC)补充有1mg/gCBH1+1mg/gCBH2+EE(EE组合物,参见上文)。以2mg/g TS(蓝色条柱)或4mg/g TS(紫色条柱)添加EE。以一式三份进行所有实验。
图32描述了来自图31的由选择的样品提供的从PHW释放葡萄糖的时间过程。
图33描述了在着丝粒的上游具有Gal启动子和ARS复制起点(另一个2μ起点也存在,以在多点起始大载体的复制)的CEN载体。四个内切葡聚糖酶由独特的启动子驱动它们。从现有载体PCR扩增启动子/EG/终止子盒,将其整合入NotI消化的pMU1943。右边图板显示了从YML转化板挑拣的6个独立的菌落的活性,所有所述菌落全都显示EG活性。
图34描述了被构建用于测试装配大构建体的能力的CEN载体。M1634包含具有7个基因(23kB)的CEN,M1635包含具有11个基因的CEN(M1635)。
图35描述了来自测量在起始培养物于YPD或YP-半乳糖中生长后从选择性和非选择性板挑拣的菌落的CMC活性的测定结果。活性在来自高抗生素抗性板的菌落的半乳糖处理前后是相当的。利用半乳糖处理的并且被涂铺在无潮霉素的YPD上的菌落显示出大的变化(如从误差棒看到的),这表明CEN载体在半乳糖生长过程中发挥预期的功能。
图36描述了来自对在无抗生素的YPD中传代两次(约10代)的表达CEN6载体的菌株的CMC测定的结果。CMC活性在于无抗生素的YPD中传代约10代后是相当的。应当注意,图35显示仅1小时后的CMC测定数据,然而菌株传代之前的CMC测定是1.5小时的时间点。
图37描述了在不同稀释度的来自YPD/zeocin(100)与YPD/zeocin(50)板的性能最佳的菌落之间的比较的测定。
图38描述了来自仅利用酵母产生的酶的PHW测定的结果。将M1179(具有核心纤维素酶CBH1/CBH2/EG2/BGL1的菌株)与表达4种EG(EG1、4、5和6)的CEN菌株、菌株M1377(EG3)和M1050(cel9A)一起使用。
图39描述了利用几个仅表达木聚糖酶、仅表达木糖苷酶或两种酶的组合的酿酒酵母的菌株进行的木聚糖至乙醇的转化。
图40描述了用于通过在rDNA基因座上整合共表达木聚糖酶和木糖苷酶的遗传构建体。
图41描述了用于表达来自表15-17的基因的附加型2-μ表达载体的图谱。S.cer ENO1 pr-酿酒酵母ENO1启动子;S.cer转化酶SP–酿酒酵母转化酶信号肽;S.ser ENO1 ter-酿酒酵母ENO1终止子;S.cer.URA3–酿酒酵母URA3营养缺陷型标记;2mu ori–2μ酿酒酵母质粒复制起始点;bla(AmpR)–Amp抗性标记;pBR322–大肠杆菌pB322质粒复制起始点;TEF1 pr–棉病囊霉TEF1启动子;TEF1 ter–棉病囊霉TEF1终止子;ble(Zeo)R-印度斯坦链异壁菌ble Zeocin抗性基因。
图42描述了通过淀粉-DNS(上),淀粉-GHK(中)和麦芽糖(下)测定法测量的表达新型合成基因的菌株的分泌型活性。所有基因描述于表15和16中。所有基因插入在pMU1575 2μ表达载体的PacI/AscI之间并且被转化至M1744菌株中。将转化子在YPD中生长3天,分析上清液的活性。“CO”-针对酵母合成基因优化的密码子;其它–从基因组DNA或cDNA通过PCR产生的。
图43描述了与酵母产生的AE8组合的酵母产生的淀粉分解酶的淀粉活性。将于YPD中生长3天的菌株的上清液与表达AE8的菌株的上清液以50:50的比率混合。在第一样品中,AE8上清液为100%。M0509的上清液用作阴性对照。“CO”-针对酵母合成基因优化的密码子;其它–从基因组DNA或cDNA通过PCR产生的。
图44描述了单个地新分泌的基因以及与AE8组合的新分泌的基因的玉米醪液(corn mash)测定法。将在YPD中生长3天的菌株的上清液与表达AE8的菌株的上清液以50:50的比率混合。将M0509的上清液用作阴性对照。
图45描述了添加至AE8的阿拉伯糖酶(上)和木聚糖酶(下)对葡萄糖从非预处理的玉米纤维释放的影响。将于YPD中生长3天的菌株的上清液与表达AE8的菌株的上清液以50:50的比率混合。将M0509的上清液用作阴性对照。阿拉伯糖酶描述于表16(AE67-78)中。“BC”基因描述于表7。“BCTsX1”为基于在Mascoma获得的基因组序列从解糖热厌氧杆菌基因组DNA PCR扩增的假定的木聚糖酶基因。
图46描述了淀粉分解酶在不同工业菌株中的表达。通过上清液对麦芽糖的活性评估淀粉酶AE3、AE8和AE49(参见表16)的表达水平。利用酵母介导的连接将所有基因亚克隆进入pMU1575 2u表达载体,将其转化至三个菌株之一中。将转化株在YPD中生长3天,利用麦芽糖测定分析上清液的活性。对于每一个转化分析4个转化株。
图47描述了用于随机整合菌株构建的表达构建体(上)。P–酿酒酵母启动子;t–酿酒酵母终止子;URA3–酿酒酵母URA3标记;D–δ整合位点;“CO”–密码子优化的合成基因。用于随机整合的基因的组合(下)。每一个组合中使用的基因被标记为灰色。
图48描述了通过随机整合构建的菌株对淀粉的分泌型活性。将在YPD中生长3天的菌株的上清液用于淀粉-DNS测定。Ura–转化株选自SD-URA板;淀粉–转化株选自YM-淀粉板(1xYNB+0.5%淀粉);对照–菌株不表达淀粉酶。CBP菌株-M1973用作阳性对照。以一式二份重复相同实验2次:第1次实验–上;第2次实验–下。
图49描述了利用阴性选择标记FCY1作为整合位点的定点整合菌株构建法的方案。表达葡糖淀粉酶AE8和/或AE9的淀粉分解菌株M1973和M2016用作实例。将侧翼连接FCY的区域的表达盒作为具有重叠末端的PCR扩增的DNA片段整合入工业菌株M0139的FCY1基因座(染色体16上的位置~677162)。宿主M0139为二倍体,从而以两个拷贝整合每一个表达盒。将具有Hyg标记的2-μ质粒与PCR产物共转化。首先将转化株在液体YPD+Hyg培养基中培养过夜,随后将其涂铺在具有FCY敲除选择性化合物5-氟胞嘧啶的培养基上。在具有抗生素的培养基上进行的预培养增加了双FCY1敲除的效率。
图50描述了另外的拷贝的葡糖淀粉酶至基因组位置例如腺嘌呤磷酸核糖基转移酶2(APT2)基因座中的整合。
图51描述了利用通用整合位点的定点整合菌株构建法的方案。将表达多拷贝的葡糖淀粉酶AE8和AE9的淀粉分解菌株M2022用作实例。在第一轮转化(上)中,将4个另外的葡糖淀粉酶表达盒作为具有重叠末端的PCR扩增的DNA片段与APT2侧翼区域、显性标记(Nat和Kan)和FCY1标记一起整合入工业菌株M1973(已表达4个葡糖淀粉酶拷贝,参见图50)的APT2基因座(染色体14上的位置~1345055)。将转化株涂铺在仅允许两个显著性标记都已被整合入不同拷贝的染色体的细胞生长的YPD+Nat+Kan板上。在第二轮转化(中)中,利用两个PCR产物转化通过淀粉-DNS测定选择的具有高淀粉分解活性的转化株,所述PCR产物具有重叠末端:5’-APT2侧翼区域和AE9表达盒的5’部分。将转化株涂铺在包含5-氟胞嘧啶的培养基上,所述培养基允许就FCY1的不存在进行选择。在图的底部,显示了M2022的终APT2整合基因座。还显示了哪个酿酒酵母启动子(pr)和终止子(ter)控制新添加的AE8和AE9的表达。
图52描述了由不具有外源葡糖淀粉酶的淀粉分解酵母从液化的玉米醪液产生的乙醇。数字为一式三份运行的平均值,误差棒为1个std。使用0.1g/L的接种物。在250mL密封的摇瓶中,利用50g的总发酵质量,在32°C的发酵温度下以125rpm的摇床转速对获自Valero生物精炼(Valero bio-refinery)的具有30%的固体(TS)的玉米醪液进行发酵。使用500ppm尿素作为唯一的营养物来源进行发酵。将标准剂量(0.45AGU/gTS)的商业葡糖淀粉酶(Spirizyme Ultra,Novozymes)添加至对照菌株M0139。在不添加任何外源酶的情况下发酵所有其它菌株。显示了60小时后产生的乙醇。
图53描述了在不添加外源葡糖淀粉酶的情况下由淀粉分解酵母从非液化的玉米醪液产生的乙醇。在50g培养瓶中运行粗制淀粉(以2mm筛选维利磨粉机碾磨的玉米);粗制玉米浆30%的固体;0.006mg/ml Pen G;0.1gDCW/l的接种物;T=35°C,进行24小时,然后置于32°C下。显示了一式二份培养瓶的平均值。使用500ppm的尿素作为唯一营养物来源进行发酵。将标准剂量(0.45AGU/g TS)的商业葡糖淀粉酶(Speezyme,Genencor Inc.)添加至对照菌株M0139。在不添加任何外源酶的情况下对所有其它菌株进行发酵。
图54描述了通过连续转移进行的淀粉分解性M1973菌株的改造。1973–来自冷藏原液的原始M1973菌株;1973A–被采用的M1973菌株。通过在32°C或35°C(第二数字)下对30%或35%TS玉米醪液(第一数字)进行发酵来评估菌株。显示了48小时的时间点的数据。
图55描述了利用CBP酵母菌株的工艺流程图的实例。磨碎的玉米醪液用作底物。将两个酵母CBP菌株S1和S2单独地用于流程和培养。利用酵母菌株S1对利用α-淀粉酶预处理的液化的玉米进行发酵。S1具有最佳的一组淀粉酶和工程化的辅助酶,在添加任何外源酶的情况下以高效率地将淀粉转化成葡萄糖。在蒸馏后,预处理釜馏物,利用菌株S2进行发酵。S2具有一组经工程化和优化以用于玉米纤维转化以及木糖和阿拉伯糖途径的纤维素分解酶。
图56描述了工业酵母菌株基因组DNA的PCR分型(Ness等人1993)。1kb–NEB 1kb阶梯。A–M0139样模式;B–M2390样模式。
图57描述了工业酵母菌株在41°C下的生长。将菌株在YPD板上划线以获得单个细菌,并且在41°C下温育4天。
图58(上)描述了表20中描述的工业细菌在YPD中于41°C下的最大生长速率。按照制造商的说明书利用板读数器Synergy2(BioTek)测量生长速率。下–表20中描述的工业菌株在摇瓶中第72小时时的玉米粉发酵。粗制玉米粉用作底物。以35%的总固体进行发酵;在35°C的温下进行24小时,然后在32°C下进行剩余的发酵时间。在相似的条件下但以33%的总固体在单独的实验中进行利用“*”标记的菌株的发酵。将完全商业剂量的外源GA以0.6AGU/g的总固体的浓度添加至所有菌株。按照一式两份重复进行实验。商业酶Spirizyme Ultra(Novozymes)用作外源葡糖淀粉酶。利用HPLC测量乙醇。
图59描述了用于转化不同工业宿主的表达构建体的图谱。ENO1-酿酒酵母ENO1启动子;AE9 CO-针对酿酒酵母扣囊复膜酵母(Saccharomycopsis fibuligera)葡糖淀粉酶基因(NCBI#CAC83969.1)优化的密码子;S.cer ENO1 ter-酿酒酵母ENO1终止子;PDC1-酿酒酵母PDC1终止子;ADH1-酿酒酵母ADH1启动子;TEF-酿酒酵母TEF2启动子;nat1-赋予对抗生素诺尔丝菌素的抗性的诺尔斯链霉菌(Streptomyces noursei)nat1基因;TRI1-酿酒酵母TRI1终止子。单独地PCR扩增DNA片段,所述片段在酵母转化过程中在体内重组。
图60描述了利用4个拷贝的扣囊复膜酵母葡糖淀粉酶基因(NCBI#CAC83969.1)转化的工业菌株(表20)的分泌淀粉分解活性。上图板显示了宿主菌株的名称。通过淀粉测定法来测量活性。对于每一个宿主挑拣数个转化株。将未转化的M0139菌株的上清液用作阴性对照(C)。
图61描述了工业菌株及其经工程化以表达4个拷贝的扣囊复膜酵母葡糖淀粉酶基因(NCBI#CAC83969.1)的转化株在摇瓶中第72小时时的玉米粉发酵。粗制玉米粉用作底物。菌株描述于表20和22中。以35%的总固体进行发酵;在35℃的温度下进行24小时,然后在32°C下进行剩余的发酵。以0.3AGU/g的固体的浓度向所有菌株添加外源GA。以一式二份进行转化菌株。宿主菌株的发酵进行一次。商业酶SpirizymeUltra(Novozymes)用作外源葡糖淀粉酶。利用HPLC测量乙醇。
图62描述了工业菌株及其经工程化以表达4个拷贝的扣囊复膜酵母葡糖淀粉酶基因(NCBI#CAC83969.1)的转化株在摇瓶中第48小时时的玉米醪液发酵。将来自常规植物的利用α-淀粉酶预处理的液化玉米用作底物。菌株描述于表20和22中。以35%的总固体和35°C进行发酵。以0.3AGU/g的固体的浓度向所有菌株添加外源GA。以一式二份进行实验。商业酶Spirizyme Ultra(Novozymes)用作外源葡糖淀粉酶。利用HPLC测量乙醇。
图63描述了经工程化以表达4个拷贝的AE9-扣囊复膜酵母葡糖淀粉酶基因(NCBI#CAC83969.1)的M2390转化株的分泌淀粉分解活性。利用淀粉测定法筛选约1000个转化株。该实验显示30个最具活性的转化株的重复的淀粉测定数据。以一式三份进行实验。将未转化的M2390菌株的上清液用作阴性对照。菌株M2111和M2395用作阳性对照(关于菌株描述参见表20和21)。
图64描述了经工程化以表达4个拷贝的AE9-扣囊复膜酵母葡糖淀粉酶基因(NCBI#CAC83969.1)的M2390转化株在微量样品反应瓶(minivial)中第72小时时的玉米醪液发酵。从淀粉分解活性筛选(图63)选择17个最佳转化株进行该实验。以30%的总固体和30°C进行发酵。将外源GA以0.3AGU/g的固体的浓度仅添加至未转化的M2390菌株。以一式二份进行实验。将M2111、M2395和M2390菌株用作对照(关于菌株的描述参见表20和21)。商业酶Spirizyme Ultra(Novozymes)用作外源葡糖淀粉酶。利用HPLC测量乙醇。
图65描述了经工程化以表达4个拷贝的AE9-扣囊复膜酵母葡糖淀粉酶基因(NCBI#CAC83969.1)的M2390转化株在微量样品反应瓶中第72小时时的玉米粉发酵。从淀粉分解活性筛选(图63)选择17个最佳转化株进行该实验。以30%的总固体和30°C进行发酵。以0.3AGU/g的固体的浓度向未转化的M2390菌株添加外源GA并且以0.1AGU/g的浓度向以所有其它菌株添加外源GA。以一式二份进行实验。将M2111、M2395和M2390菌株用作对照(关于菌株的描述参见表20和21)。商业酶Spirizyme Ultra(Novozymes)用作外源葡糖淀粉酶。利用HPLC测量乙醇。
图66描述了经工程化以表达4个拷贝的AE9-扣囊复膜酵母葡糖淀粉酶基因(NCBI#CAC83969.1)的M2390转化株在摇瓶中第72小时时的玉米粉发酵。从微量样品反应瓶发酵筛选(图64-65)选择7个最佳转化株进行该实验。以33%的总固体在35°C的温度下发酵24小时,随后在32°C下进行剩余的发酵。以0.6AGU/g的固体的浓度向未转化的M2390菌株添加外源GA并且以0.1AGU/g的浓度向以所有其它菌株添加外源GA。以一式二份进行实验。商业酶Spirizyme Ultra(Novozymes)用作外源葡糖淀粉酶。利用HPLC测量乙醇。
图67描述了M2691菌株-经工程化以表达4个拷贝的AE9-扣囊复膜酵母葡糖淀粉酶基因(NCBI#CAC83969.1)的最佳M2390转化株在摇瓶中的液化常规玉米醪液发酵的时间过程。将转化株P10-19(图66)重新命名为M2691。以32.5%的总固体在35°C的温度下发酵24小时,随后在32°C下进行剩余的发酵。将外源GA以0.3AGU/g的固体的浓度仅添加至未转化的M2390菌株。以一式二份进行实验。商业酶SpirizymeUltra(Novozymes)用作外源葡糖淀粉酶。利用HPLC测量乙醇。
图68描述了M2691菌株-经工程化以表达4个拷贝的AE9-扣囊复膜酵母葡糖淀粉酶基因(NCBI#CAC83969.1)的最佳M2390转化株在摇瓶中的粗制玉米粉发酵的时间过程。将转化株P10-19(图66)重新命名为M2691。以33%的总固体在35°C的温度下发酵24小时,随后在32°C下进行剩余的发酵。将外源GA以0.6AGU/g的固体的浓度添加至未转化的M2390菌株,将外源GA以0.1AGU/g的浓度添加至M2691。以一式二份进行实验。商业酶Spirizyme Ultra(Novozymes)用作外源葡糖淀粉酶。利用HPLC测量乙醇。
图69描述了未转化的M2390菌株、低GA产生者M2395菌株和高GA产生者M2519(P6-65)的外源葡糖淀粉酶剂量反应。以35%的总固体在35°C的温度下进行玉米粉摇瓶发酵24小时,随后在32°C下进行剩余的发酵。以一式二份进行实验。将商业酶Spirizyme Ultra(Novozymes)用作外源葡糖淀粉酶。利用HPLC测量乙醇和葡萄糖。
图70描述了两种M2390+AE9转化株M2519(上)和M2691(下)的稳定性测试。将两个菌株在YPD中进行繁殖。将菌株生长至静止生长期,利用100X稀释度传代11次(1次传代–约9个世代)。贮存传代之间的几个样品。将所有样品和原始菌株一起涂板和接种,在相同的测定中测量对淀粉的活性。以一式三份进行实验。
图71描述了酵母分泌的酶的支链淀粉(上)、木聚糖(中)和果胶(下)测定(表23)。基因在来自2μ质粒pMU1575的ENO1启动子和终止子下表达。通过克隆或酵母介导的连接将基因插入pMU1575的PacI/AscI位点之间。将表达提取物转化入工业背景Mascoma菌株M1744,在最简URA缺陷培养基上进行选择。对于每一个转化分析4个菌落。将转化株在YPD中生长3天,分析上清液的活性。将非转化菌株M0139(通过URA3基因缺失从M0139衍生的M1744)的上清液用作阴性对照。在果胶测定C中–将利用柠檬酸盐缓冲液稀释10倍的商业果胶酶Multifect(Genencor)用作阳性对照(5μl用于测定)。
图72描述了酵母产生的酶的玉米糖浆测定。CBH1、CBH2、EG2、BGL、XYL和XLD为HPLC纯化的蛋白质。对于其它酶,将表达酶的酵母菌株在YPD中生长3天,将上清液用作酶来源(表24)。B4–CBH1+CBH2+EG2+BGL;B6-CBH1+CBH2+EG2+BGL+XYL+XLD。用于测定的纯化的酶的量概述于表25中。将250μl的M0139(上)或M2111(下)上清液添加至所有样品中。以250μl的量添加其它上清液来源的酶。在样品中无需其它上清液酶时,则添加M0139上清液。对于AE10+AE35样品,除250μl的M0139或M2111上清液外,还添加125μl的每一种上清液。NC-除M0139或M2111上清液外不添加其它酶。
图73描述了用于构建具有表26中的基因的δ整合表达盒的附加型2μ酵母表达载体pMU2382的图谱。将处于酿酒酵母强组成型启动子和终止子的控制之下的目标基因插入利用BamHI和EcoRI消化的pMU2382载体的URA3与Delta2片段之间。通过酵母介导的连接以与URA3相同的方向插入表达盒。S.ser.URA3–酿酒酵母URA3营养缺陷型标记;2mu ori–2μ酿酒酵母质粒的复制起始点;bla(AmpR)–Amp抗性标记;pBR322–大肠杆菌pB322质粒的复制起始点,δ1和δ2–酿酒酵母δ位点的片段。
图74描述了利用来自表26的一些基因和基因组合转化的M2125的玉米粉测定的实例。转化(T)描述于表27中。破折号后的数字意指该转化的菌落编号。突出显示的转化株被选择用于通过发酵进行筛选。BC60–仅表达2μ质粒上的ENO1启动子下的BC60的M1744菌株。M2125–亲代菌株(具有URA3敲除的M2111)。将未转化的M0139菌株用作阴性对照。
图75描述了额外地表达AE9糖分解酶的菌株对自制玉米醪液的摇瓶发酵。基于在微量样品反应瓶玉米醪液发酵测定中达到的最高乙醇效价选择菌株。使用自制醪液。菌株描述于表28中。以30%的总固体和32°C进行发酵。将外源酶以0.3AGU/g的固体的浓度仅添加至未转化的M0139菌株。亲代M2111菌株用作背景对照。以一式二份进行实验。商业酶Spirizyme Ultra(Novozymes)用作外源葡糖淀粉酶。利用HPLC测量乙醇。
图76描述了额外地表达AE9糖分解酶的菌株对玉米粉的摇瓶发酵。基于在微量样品反应瓶玉米粉发酵测定中达到的最高乙醇效价选择菌株。菌株描述于表29中。以30%的总固体和32°C进行发酵。将外源酶以0.3AGU/g的固体的浓度添加至未转化的M0139菌株,以0.1AGU/g的浓度添加至所有其它菌株。亲代M2111菌株用作背景对照。以一式二份进行实验。商业酶Spirizyme Ultra(Novozymes)用作外源葡糖淀粉酶。利用HPLC测量乙醇和糖。基于葡萄糖浓度计算潜在乙醇(加上来自未消耗的葡萄糖的理论乙醇)。
图77描述了仅表达AE9的菌株对自制玉米醪液(上)和玉米粉(下)的摇床发酵。菌株是重复与在M2111构建中进行的相同的发酵,随后筛选1000个菌落对淀粉的活性的结果。基于在微量样品反应瓶玉米自制醪液和粉的发酵测定中达到的最高乙醇效价选择用于该摇瓶实验的菌株。菌株描述于表30和31中。以30%的总固体和32°C进行发酵。以0.3AGU/g的固体的浓度向未转化的M0139菌株添加外源酶。在玉米粉实验中,还将外源酶以0.1AGU/g的固体的浓度添加至所有其它菌株中。将先前构建的M2111菌株用于比较。以一式二份进行实验。商业酶Spirizyme Ultra(Novozymes)用作外源葡糖淀粉酶。线–由在YPD摇瓶(与发酵实验分开)中生长3天后的菌株分泌的蛋白质(AE9)。利用HPLC测量乙醇和蛋白质浓度。
图78描述了来自自制醪液和玉米粉(图75-77)进行的摇瓶筛选实验的最佳菌株对工业玉米醪液的摇瓶发酵。菌株描述于表32中。以30%的总固体和32°C进行发酵。将外源酶以0.3AGU/g的固体的浓度仅添加至未转化的M0139菌株。将M2111菌株用于比较。以一式二份进行实验。商业酶Spirizyme Ultra(Novozymes)用作外源葡糖淀粉酶。利用HPLC测量乙醇和糖浓度。基于葡萄糖浓度计算潜在的乙醇(加上来自未消耗的葡萄糖的理论乙醇)。
图79描述了来自自制醪液和玉米粉(图75-77)进行的摇瓶筛选实验的最佳菌株对工业玉米醪液的摇瓶发酵。菌株描述于表33中。以30%的总固体和32°C进行发酵。将外源酶以0.3AGU/g的固体的浓度仅添加至未转化的M0139菌株。将M2111菌株用于比较。以一式二份进行实验。商业酶Spirizyme Ultra(Novozymes)用作外源葡糖淀粉酶。利用HPLC测量乙醇和糖浓度。基于葡萄糖浓度计算潜在的乙醇(加上来自未消耗的葡萄糖的理论乙醇)。
图80描述了通过定点整合(上)构建的M2111菌株和通过随机整合(下)构建的菌株的稳定性测试。将菌株在YPD中繁殖,生长至静止生长期,以100X稀释度传代11次(1个传代–约9个世代)。贮存传代之间的几个样品。将所有样品和原始菌株一起涂板和接种,在相同的测定中测量对淀粉的活性。随机菌株描述于表32中。以一式三份进行实验。
图81描述了用于定点菌株构建的不同的可能策略。上–单位点整合策略;下–多位点整合策略。在单位点策略中,阴性标记在每一轮转化中交替并且所有表达盒彼此相邻地被整合入相同的基因座。在多位点策略中,阳性与阴性标记彼此交替并且在每一轮转化中表达盒可被整合入染色体上的任何位点。
图82描述了用于在酿酒酵母的δ位点上整合的TeCBH1+HgCBD表达构建体的方案。
图83描述了在对由几个酿酒酵母的菌株产生的预处理的硬木材上进行的含有纤维素酶的上清液的测定。在PHW测定中,将上清液与4%的总固体的预处理的硬木材、2mg酶/g的总固体载量的外源纤维素酶制剂一起温育。利用HPLC测量反应的葡萄糖的积累。
图84描述了仅包含一种酶(CBH2,M1873)或几种酶(M2232)的纤维素分解菌株与用于在SSF中进行乙醇生产的对照非产纤维素酶M1577的比较。使用未洗涤的预处理的硬木材和碱洗涤的预处理的硬木材底物。显示了来自160小时的发酵的数据。
图85描述了酵母产生的α-葡糖醛酸糖苷酶的SDS-PAGE(左)和Western印迹(右)。从树干毕赤酵母(Pichia stipitis)基因组DNA PCR扩增α-葡糖醛酸糖苷酶GH67,将其克隆为具有/不具有C-末端组氨酸标签。将来自转化的菌落在50mL通风的圆锥管中于酵母提取物(10g/L)、蛋白胨(20g/L)和葡萄糖(20g/L)+200μg/mL Zeocin,pH7.0中生长48-60个小时。将培养物上清液通过2μm PE滤器过滤,在10,000Da分子量截止滤器中浓缩约20倍。在非还原条件下通过SDS-PAGE电泳筛选蛋白质质量,利用考马斯蓝染料(左)进行染色或使用抗-组氨酸第一抗体和缀合有碱性磷酸酶的第二抗体通过Western印迹(右)进行检查(仅His标记的构建体可视)。
图86描述了AZCL-木糖葡聚糖琼脂板上的木葡聚糖酶活性。将等量的培养物点在含有0.5% AZCL(天青精(Azurine)-交联的)罗望子木糖葡聚糖Megazyme目录号I-AZXYG的SC琼脂板上。木葡聚糖酶活性显示为蓝色区域例如利用pMU2856和pMU2858+/-His标签转化的那些菌株。REF是指对照MO1744背景菌株上清液。
图87描述了AZCL-木糖葡聚糖中的木葡聚糖酶活性。将70μL的3天期的2xSC-ura培养物的上清液添加至深孔微量滴定板中的280μL的含有0.5% AZCL(天青精-交联的)罗望子木糖葡聚糖Megazyme目录号I-AZXYG的50mM醋酸钠缓冲液(pH5.0)中。将板在微量滴定板摇床中在35°C下以800rpm的振荡进行温育。在温育的第0、60和180分钟采100μL的样品,以3000rpm离心(2分钟),随后将50μL的上清液置于新鲜微量滴定板中,测定600nm处的OD以便可测量随时间的增加的OD。REF是指对照MO1744背景菌株。
图88描述了酵母表达的木糖葡聚糖酶+/-His标签的SDS-PAGE(左)和Western(右)分析。将双倍强度的缓冲至pH6.0的SC-URA培养基中的三天期培养物(在30°C下于转轮上温育的试管中的3mL培养物)离心,通过将15μL(+5μL上样缓冲液)加载至10% SDS-PAGE凝胶上来测定上清液。REF是指对照MO1744背景菌株上清液。
图89描述了在酿酒酵母中表达的酯酶的SDS-PAGE分析。将双倍强度的缓冲至pH6.0的SC-URA培养基中的三天期培养物(在30°C下于转轮上温育的试管中的3mL培养物)离心,通过将15μL(+5μL上样缓冲液)加载至10% SDS-PAGE凝胶上来测定上清液,随后进行银染。REF是指对照MO1744背景菌株上清液。
图90描述了酵母产生的酯酶的1-萘基乙酸酯酯酶测定。以一式二份进行实验。REF是指对照M1744背景菌株上清液。
图91描述了对于酵母产生的α-半乳糖苷酶的α-半乳糖苷酶活性测定。以一式二份进行实验。REF是指对照M1744背景菌株上清液。
图92描述了里氏木霉α-半乳糖苷酶(AGL3)+/-His标签在酿酒酵母中的表达的Western印迹分析。将来自转化的菌落在50mL通风的圆锥管中于酵母提取物(10g/L)、蛋白胨(20g/L)和葡萄糖(20g/L)+200μg/mLZeocin,pH7.0中生长48-60个小时。将培养物上清液通过2μm PE滤器过滤,在10,000Da分子量截止滤器中浓缩约20倍。在非还原条件下通过SDS-PAGE电泳筛选蛋白质质量,使用抗-组氨酸第一抗体和缀合有碱性磷酸酶的第二抗体通过Western印迹(右)进行检查(仅His标记的构建体可视)。
图93描述了α-半乳糖苷酶在酿酒酵母中的表达的SDS-PAGE分析。将双倍强度的缓冲至pH6.0的SC-URA培养基中的三天期培养物(在30°C下于转轮上温育的试管中的3mL培养物)离心,测定上清液,将15μL(+5μL上样缓冲液)加载至10% SDS-PAGE凝胶上,并且进行银染。
图94描述了利用商业和酵母产生的纯化的酶的不同组合的2%的总固体PWH测定以及所得的葡萄糖释放。将测定板在38℃下进行温育,在不同的时间点取出样品以在BioRad 87H柱上进行HPLC分析。
图95描述了利用商业和酵母产生的纯化的酶的不同组合的2%的总固体PWH测定以及所得的葡萄糖释放。将测定板在38℃下进行温育,在不同的时间点取出样品以在BioRad 87H柱上进行HPLC分析。
图96描述了利用商业和酵母产生的纯化的酶的不同组合的2%的总固体PWH测定以及所得的葡萄糖释放。将测定板在38℃下进行温育,在不同的时间点取出样品以在BioRad 87H柱上进行HPLC分析。
图97描述了利用酵母产生的纯化的酶的不同组合的2%的总固体造纸淤泥测定以及所得的葡萄糖释放。将测定板在38℃下进行温育,在不同的时间点取回样品以在BioRad 87H柱上进行HPLC分析。
图98描述了利用酵母产生的纯化的酶的不同组合的2%的总固体造纸淤泥测定以及所得的木糖释放。将测定板在38℃下进行温育,在不同的时间点取回样品以在BioRad 87H柱上进行HPLC分析。
图99描述了2种不同工业造纸淤泥SSF的最终乙醇效价(92小时)。淤泥1–前5个条柱;淤泥2–后5个条柱。使用洗涤的(1M柠檬酸)2%的固体造纸淤泥。以1.1g/l接种菌株M2108。在pH5.0,35°C,220rpm下进行发酵,进行92小时。
图100描述了利用0.1AGU/g TS外源葡糖-淀粉酶对30%TS玉米粉获得的乙醇和潜在乙醇效价。对照菌株(M0139)具有完全剂量(0.3AGU/g TS)的葡糖-淀粉酶。
图101描述了对30%TS玉米粉(ELN afoster2 corn-090)进行的木聚糖酶和辅助酶筛选的第72小时时的乙醇和潜在乙醇效价。
图102描述了从2%TS预处理的湿饼的水解释放的葡萄糖、木糖和阿拉伯糖。
图103描述了来自190℃,10分钟的水预处理的粗制纤维和1%硫酸预处理的粗纤维的水解产率。
发明详述
公开的方法和材料通常用于工程酵母的领域。
定义
“载体”例如“质粒”或“YAC”(酵母人工染色体)是指通常携带一个或多个不为细胞的中心代谢的一部分的基因的染色体外元件,并且通常以环状双链DNA分子的形式存在。此类元件可以为自主复制序列、基因组整合序列、噬菌体或来源于任何来源的单链或双链DNA或RNA的线性、环状或超螺旋核苷酸序列,其中许多核苷酸序列已被连接或重组至独特的构建体中,所述构建体能够将启动子片段和选择的基因产物的DNA序列连同适当的3'未翻译序列一起引入细胞。优选地,本发明的质粒或载体是稳定的并且能够自我复制。
“表达载体”是能够指导其所有效连接的基因的表达的载体。
如本文中所用,术语“整合的”是指通过分子生物学技术被置于宿主细胞的基因组中的遗传元件。例如,可将遗传元件以置于宿主细胞的染色体中而不是载体例如由宿主细胞携带的质粒中。用于将遗传元件整合入宿主细胞的基因组的方法在本领域是公知的并且包括同源重重组。
术语“异源的”,当用于指多核苷酸、基因、多肽或酶时,是指通常不在宿主生物中发现的多核苷酸、基因、多肽或酶。“异源的”还包括从来源生物取出,随后以与相应的天然基因不同的形式(例如,不在其在生物基因组中的天然位置中)再引入来源生物的天然编码区或其部分。可通过例如基因转移将异源多核苷酸或基因引入宿主生物。异源基因可包括作为包括非天然调控区的嵌合基因的一部分被重新引入天然宿主的天然编码区。外源基因可包含插入非天然生物的天然基因或嵌合基因。异源多核苷酸、基因、多肽或酶可来源于任何来源例如真核生物、原核生物、病毒或合成多核苷酸片段。如本文中所用,术语“异源的”还指来源于除内源来源外的来源的载体、质粒或宿主细胞的元件。因此,例如,异源序列可以是来源于来自相同宿主的不同基因或质粒,来自宿主细胞的不同菌株或来自不同分类群(例如,不同界、门、纲、目、科、属或种,或此类分类内的任何子集)的生物的序列。术语“异源的”在本文中也与术语“外源的”同义。
如本文中所用,术语“结构域”是指分子或结构的共有共同的物理或化学特征(例如疏水性、极性、球状、螺旋状区域或性质)的部分,例如DNA结合结构域或ATP结合结构域。结果域可通过它们与保守结构或功能基序的同源性来鉴定。纤维二糖水解酶(CBH)结构域的实例包括催化结构域(CD)和纤维素结合结构域(CBD)。
“核酸”、“多核苷酸”或“核酸分子”为由共价连接的称为核苷酸亚单位组成的多聚化合物。核酸包括多聚核糖核酸(polyribonucleicacid)(RNA)和多聚脱氧核糖核酸(polydeoxyribonucleic acid)(DNA),其两者都可以是单链的或双链的。DNA包括cDNA、基因组DNA、合成DNA和半合成DNA。
“分离的核酸分子”或“分离的核酸片段”是指以单链形式或双链螺旋形式存在的核糖核苷(腺苷、鸟苷、尿苷或胞苷;“RNA分子”)或脱氧核糖核苷(脱氧腺苷、脱氧鸟苷、脱氧胸苷或脱氧胞苷;“DNA分子”)的磷酸酯多聚体,或其任何磷酸酯类似物,例如硫代磷酸酯和硫酯。双链DNA-DNA、DNA-RNA和RNA-RNA螺旋是可能。术语核酸分子,特别地DNA或RNA分子,仅指分子的一级和二级结构,并且不将其限定于任何特定的三级结构。因此,该术语包括除其它以外在线性或环状DNA分子(例如,限制片段)、质粒和染色体中发现的双链DNA。在讨论特定双链DNA分子的结构中,可按照仅以5'至3'的方向沿着DNA的非转录链(即,具有与mRNA同源的序列的链)给出序列的常规惯例描述序列。
“基因”是指编码多肽的核苷酸的装配体,包括cDNA和基因组DNA核酸。“基因”还指表达特定蛋白质的核酸片段,包括单个编码区段(外显子)之间的间插序列(内含子)以及在编码序列之前(5'非编码序列)和之后(3'非编码序列)的调控序列。“天然基因”是指如在自然界中与其自己的调控序列一起被发现的基因。
当核酸分子的单链形式可在适当的温度和溶液离子强度条件下与另一个核酸分子退火时,核酸分子与另一个核酸分子例如cDNA、基因组DNA或RNA“杂交”。杂交和洗涤条件是公知的并且在例如Sambrook,J.,Fritsch,E.F.和Maniatis,T.MOLECULAR CLONING:ALABORATORY MANUAL,第2版,Cold Spring Harbor LaboratoryPress,Cold Spring Harbor(1989)中,特别地其中的第11章和表11.1中(在下文中"Maniatis",通过引用整体并入本文)进行了举例说明。温度和离子强度的条件决定杂交的“严格性”。可调整严格性条件来筛选适度地相似的片段,例如来自远缘生物的同源序列,高度相似的片段,例如来自近亲生物的复制功能酶的基因。杂交后洗涤测定严格性条件。一组条件使用始于6X SSC,0.5% SDS在室温下进行15分钟,随后利用2X SSC,0.5% SDS在45°C下重复,进行30分钟,随后利用0.2X SSC,0.5% SDS在50°C下重复2次(每次30分钟)的一系列洗涤。对于更严格的条件,在现高的温度下进行洗涤,其中除最终2次30分钟的洗涤(在0.2X SSC,0.5% SDS中)的温度升高至60°C外,洗涤与上述洗涤相同。另一组高度严格的条件使用在65°C下于0.1X SSC,0.1% SDS中进行的两次终洗涤。另一组高度严格条件定义为在0.1X SSC,0.1% SDS,65°C下杂交,并且利用2X SSC,0.1% SDS,随后用0.1X SSC,0.1% SDS进行洗涤。
杂交需要两个核酸包含互补序列,虽然这取决于杂交的严格性,碱基之间的错配是可能的。用于杂交核酸的适当的严格性取决于核酸的长度和互补的程度,本领域内公知的变量。两个核苷酸序列之间的相似性或同源性的程度越大,用于具有此类序列的核酸的杂交的Tm的值越大。核酸杂交的相对稳定性(对应于更高的Tm)按下列顺序递减:RNA:RNA、DNA:RNA、DNA:DNA。对于长度超过100个核苷酸的杂交体(hybrid),已产生计算Tm的公式(参见,例如,Maniatis的9.50-9.51)。为了与更短的核酸即寡核苷酸杂交,错配的位置变得更重要,寡核苷酸的长度决定其特异性(参见,例如,Maniatis的11.7-11.8)。在一个实施方案中,可杂交的核酸的长度为至少约10个核苷酸。优选地可杂交的核酸的最小长度为至少约15个核苷酸;更优选至少约20个核苷酸;和最优选地长度为至少30个核苷酸。此外,本领域技术人员将承认必要时可根据因素例如探针的长度调整温度和洗涤溶液的盐浓度。
如本领域中已知的,术语“百分比同一性”为两个或更多个多肽序列或两个或更多个多核苷酸序列之间的关系,如通过比较所述序列测定的。在本领域中,根据具体情况,“同一性”还意指多肽或多核苷酸序列之间的序列关联性的程度,如通过此类序列的字符串之间的匹配测定的。
如本文中已知的,两个多肽之间的“相似性”通过将多肽的氨基酸序列以及对其的保守氨基酸置换与第二多肽的序列相比较来测定。
“同一性”和“相似性”可利用已知的方法来容易地计算,所述方法包括但不限于:计算分子生物学(Computational Molecular Biology)(Lesk,A.M.,编著)Oxford University Press,NY(1988);生物计算:信息学和基因组项目(Biocomputing:Informatics and Genome Projects)(Smith,D.W.,ed.)Academic Press,NY(1993);序列数据的计算机分析(ComputerAnalysis of Sequence Data),第I部分(Griffin,A.M.,和Griffin,H.G.,编著)Humana Press,NJ(1994);分子生物学中的序列分析(SequenceAnalysis in Molecular Biology)(von Heinj e,G.,ed.)Academic Press(1987)和序列分析引物(Sequence Analysis Primer)(Gribskov,M.和Devereux,J.,eds.)Stockton Press,NY(1991)中描述的的方法。测定同一性的优选方法被设计来提供测试的序列之间的最佳匹配。测定同一性和相似性的方法被编码在公共可获得的计算程序中。可使用LASERGENE生物信息学计算套件(bioinformatics computing suite)(DNASTAR Inc.,Madison,Wis.)的Megalign程序来进行序列比对和百分比同一性计算。利用缺少参数(空隙罚分(GAP PENALTY)=10,空隙长度罚分(GAP LENGTHPENALTY)=10),使用比对的Clustal法(Higgins和Sharp(1989)CABIOS.5:151-153)进行本文中公开的序列的多重比对。使用Clustal法的双序列比对(pairwise alignment)的缺省参数为KTUPLE1,空隙罚分=3,窗口=5以及保留的对角线(DIAGONALS SAVED)=5。
适当的核酸序列或其片段(本发明的分离的多核苷酸)编码多肽,所述多肽与本文中报导的氨基酸序列具有至少约70%至75%的同一性,与本文中报导的氨基酸序列具有至少约80%、85%或90%的同一性,或与本文中报导的氨基酸序列具有至少约95%、96%、97%、98%、99%或100%的同一性。适当的核酸片段与本文中报导的核酸序列具有至少约70%,75%或80%的同一性,与本文中报导的核酸序列具有至少约80%,85%或90%的同一性,或与本文中报导的核酸序列具有至少约95%、96%、97%、98%、99%或100%的同一性。适当的核酸片段不仅具有上述同一性/相似性而且通常还编码具有至少50个氨基酸、至少100个氨基酸、至少150个氨基酸、至少200个氨基酸或至少250个氨基酸的多肽。
DNA或RNA“编码区”为当置于适当的调控序列的控制之下时在体外或体内在细胞中被转录和/或翻译成多肽的DNA或RNA分子。“适当的调控区”是指位于编码区的上游(5'非编码序列)、之内或下游离(3'非编码区)并且影响相关编码区的转录、RNA加工或稳定性或翻译的核酸区域。调控区可包括启动子、翻译前导序列、RNA加工位点、效应物结合位点和茎-环结构。编码区的边界由5'(氨基)端上的起始密码子和3'(羧基)端上的翻译终止密码子界定。编码区可包括但不限于原核区域、来自mRNA的cDNA、基因组DNA分子、合成DNA分子或RNA分子。如果意欲将编码区用于在真核细胞中表达,则通常将多聚腺苷酸化信号和转录终止序列置于编码区的3'。
“同种型”为具有与另一种蛋白质相同的功能但由不同基因编码并且可在其序列中具少数差异的蛋白质。
“旁系同源物”为由通过基因组内的复制发生关系的基因编码的蛋白质。
“直系同源物”为来自不同物种的已通过物种形成从共同祖先基因进化的基因。通常地,直系同源物在进化过程中保持与祖先基因相同的功能。
“开放阅读框架”缩写为ORF,意指包含翻译起始信号或起始密码子例如ATG或AUG以及终止密码子并且可被潜在地翻译成多肽序列的核酸(DNA、cDNA或RNA)的长度。
“启动子”是指能够控制编码序列或功能RNA的表达的DNA片段。一般地,编码区位于启动子的3'。启动子可在其整体性上来源于天然基因,或由来源于在自然界中发现的不同启动子的不同元件组成,或甚至包含合成DNA区段。本领域技术人员理解,不同的启动子可指导基因在不同组织或细胞类型中或在发育的不同阶段表达或响应不同环境或生理条件而表达。导致基因在大部分时间在大多数细胞类型中表达的启动子通常称为“组成型启动子”。还承认,由于在大多数情况下,调控序列的确切边界未被完全确定,因此不同长度的DNA片段可具有相同的启动子活性。启动子通常在其3'端以转录起始位点为边界并且向上游(5'方向)延伸以包括在可检测的高于背景的水平上起始转录所必需的最少数目的碱基或元件。在启动子内将发现转录起始位点(方便地例如通过利用核酸酶S1的作图来界定),以及负责RNA聚合酶的结合的蛋白质结合区域(共有序列)。
当RNA聚合酶将编码区转录成mRNA(所述mRNA随后被反式-RNA剪接(如果编码区包含内含子的话)并且翻译成由编码区编码的蛋白质)时,编码区在细胞中处于转录和翻译控制元件的“控制之下”。
“转录和翻译控制区”为DNA调控区,例如启动子、增强子、终止子等,其可提供编码区在宿主细胞中的表达。在真核细胞中,多腺苷酸化信号是控制区。
术语“有效地连接”是指核酸序列在单个核酸片段上的连接,以便一个序列的功能受另一个序列影响。例如,当启动子能够影响编码区的表达(即,编码区处于启动子的转录控制之下)时,启动子与该编码区有效地连接。编码区可以以有义或反义方向有效地连接至调控区。
如本文中所用,术语“表达”是指来源于本发明的核酸片段的有义(mRNA)或反义RNA的转录和稳定积累。表达还可指mRNA至多肽的翻译。
术语“木质纤维素”是指由木质素和纤维素组成的材料。
“纤维素分解酶”可以是参与纤维素消化、代谢和/或水解的任何酶。术语“纤维素酶”是指一类主要由真菌、细菌和原生动物产生的酶,其可催化纤维素的纤维素分解作用(cellulolysis)(即水解)。然而,还存在由其它类型的生物例如植物和动物产生的纤维素。几种不同类型的纤维素酶是已知的,其在结构上和力学上相异。基于催化的反应的类型存在一般类型的纤维素酶:内切纤维素酶打断内部键以破坏纤维素的晶体结构并且暴露单个纤维素多糖链;外切维素酶从由内切纤维素酶产生的暴露的链的末端切割2-4个单位,从而产生四糖或二糖例如纤维二糖。存在两个主要类型的外切纤维素酶(或纤维二糖水解酶,缩写为CBH)–一种类型从纤维素的还原末端连续作用,一种类型从纤维素的非还原末端连续作用;纤维二糖酶或β-葡糖苷酶将外切纤维素酶产物水解成单个单糖;通过自由基反应解聚纤维素的氧化纤维素酶,例如纤维二糖脱氢酶(受体);使用磷酸盐而非水解聚纤维素的纤维素磷酸化酶。在纤维素酶活性的最熟悉的例子中,酶复合物将纤维素分解成β-葡萄糖。“纤维素酶”可以是参与纤维素降解、代谢和/或水解的任何酶,包括内切葡聚糖酶、葡糖苷酶、纤维二糖水解酶、木聚糖酶、葡聚糖酶、木糖苷酶、木聚糖酯酶、阿拉伯呋喃糖酶、半乳糖苷酶、纤维二糖磷酸化酶、纤维糊精磷酸化酶、甘露聚糖酶、甘露糖苷酶、木糖葡聚糖酶、内切木聚糖酶、葡糖醛酸糖苷酶、乙酰基木聚糖酯酶、阿拉伯呋喃糖基水解酶、膨胀因子、葡糖苷酸酯酶、棒曲霉素、果胶酶和阿魏酸酯酶蛋白。
“淀粉分解酶”可以是参与淀粉酶消化、代谢和/或水解的任何酶。术语“淀粉酶”是指将淀粉分解成糖的酶。淀粉酶存在于人唾液中,在唾液中其开始消化的化学过程。包含许多淀粉但几乎无糖的食物例如稻和马铃薯,当咀嚼它们时味道有点甜,因为淀粉酶将它们的一些淀粉在口中转化成糖了。胰腺也产生淀粉酶(α-淀粉酶)来将饮食中的淀粉水解成二糖和三糖,所述二糖和三糖被其它酶转化成葡萄糖以给身体提供能量。植物和一些细菌也产生淀粉酶。所有淀粉酶为糖苷水解酶并且作用于α-1,4-糖苷键。一些淀粉酶例如γ-淀粉酶(葡糖淀粉酶)也作用于α-1,6-糖苷键。淀粉酶包括α-淀粉酶(EC 3.2.1.1)、β-淀粉酶(EC 3.2.1.2)和γ-淀粉酶(EC3.2.1.3)。α-淀粉酶为在钙不存在的情况下不起作用的钙金属酶。通过在沿着淀粉链的随机位置上作用,α-淀粉酶分解长链碳水化合物,最终从直链淀粉产生麦芽三糖和麦芽糖,或从支链淀粉产生麦芽糖、葡萄糖和“极限糊精”。因为其可在任何位置作用于底物,因此α-淀粉倾向于比β-淀粉酶更快地作用。在动物中,其为主要的消化酶并且其最适pH为约6.7-7.0。另一种形式的淀粉酶β-淀粉酶也由细菌、真菌和植物合成。通过从非还原末端作用,β-淀粉酶催化第二α-1,4糖苷键的水解,一次切取两个葡萄糖单位(麦芽糖)。许多微生物产生降解细胞外淀粉的淀粉酶。除在直链淀粉和支链淀粉的非还原末端上切割最后一个α(1-4)糖苷键,从而产生葡萄糖外,γ-淀粉酶还将切割α(1-6)糖苷键。另一种淀粉分解酶为α-葡糖苷酶,其作用于麦芽糖和由α-、β-和γ-淀粉酶产生的其它短的麦芽低聚糖,将它们转化成葡萄糖。另一种淀粉分解酶为支链淀粉酶。支链淀粉酶为特定类型的葡聚糖酶,淀粉分解性胞外酶(exoenzyme),其降解支链淀粉。支链淀粉被认为是通过α-1,6-糖苷键连接的麦芽三糖单位的链。支链淀粉酶(EC 3.2.1.41)也称为支链淀粉-6-葡聚糖水解酶(脱枝酶)。另一种淀粉分解酶异支链淀粉酶将支链淀粉水解成异葡糖基麦芽糖(6-α-麦芽糖基葡萄糖)。异支链淀粉酶(EC 3.2.1.57)也称为支链淀粉4-葡聚糖水解酶。“淀粉酶”可以是参与淀粉消化、代谢和/或水解的任何酶,包括α-淀粉酶、β-淀粉酶、葡糖淀粉酶、支链淀粉酶、异支链淀粉酶和α-葡糖苷酶。
术语“木聚糖分解活性”意欲包括水解寡聚戊糖和多聚戊糖的糖苷键的能力。术语“木聚糖酶”为赋予一类将线性多糖β-1,4-木聚糖降解成木糖,从而分解半纤维素(植物细胞壁的主要组分之一)的酶的名称。这样,其在微生物在植物来源上旺盛生长中起着主要作用(哺乳动物,相反地,不产生木聚糖酶)。此外,木聚糖酶存在于真菌中以将植物物质降解成可用的营养物。木聚糖酶包括相应于酶委员会偏号3.2.1.8的那些酶。“木糖代谢酶”可以是参与木糖降解、代谢和/或水解的任何酶,包括木糖异构酶、木酮糖激酶、木糖还原酶、木酮脱氢酶、木糖醇脱氢酶、木糖酸水解酶、木糖转酮醇酶和木糖转醛醇酶蛋白。
术语“果胶酶”为酶例如果胶酶(pectolyase)、果胶酶(pectozyme)和聚半乳糖醛酸酶的总称,在酿造中通常称为果胶溶解酶(pectic enzyme)。此类酶分解果胶(在植物的细胞壁中发现的多糖底物)。研究最多并且广泛使用的商业果胶酶之一为聚半乳糖醛酸酶。果胶酶通常用于牵涉植物材料的降解的过程,例如加速果汁从果实包括苹果和山榄果的提取。自1960年代以来果胶酶还已被用于葡萄酒生产。
“糖分解酶”可以是参与碳水化合物的降解、代谢和/或水解的任何酶,包括淀粉酶、纤维素酶、半纤维素酶、纤维素分解和淀粉分解辅助酶、菊糖酶、果聚糖酶和戊糖利用酶。
“戊糖利用酶”可以是参与戊糖的降解、代谢和/或水解的任何酶,包括木聚糖酶、阿拉伯糖酶、阿拉伯木聚糖酶、阿拉伯糖苷酶、阿拉伯呋喃糖酶、阿拉伯木聚糖酶、阿拉伯糖苷酶和阿拉伯呋喃糖酶、阿拉伯糖异构酶、核酮糖-5-磷酸4-差向异构酶、木糖异构酶、木酮糖激酶、木糖还原酶、木酮脱氢酶、木糖醇脱氢酶、木糖酸脱水酶、木糖转酮醇酶和/或木糖转醛醇酶。
表达异源糖分解酶的宿主细胞
为了解决先前的系统的局限性,在一个方面,本发明提供了表达可有效地并且高效率地用于从纤维素产生产物例如乙醇的异源纤维素酶的宿主细胞。在另一个实施方案中,宿主细胞表达可有效并且高效率地用于从生物质原料例如谷类原料产生产物例如乙醇的异源淀粉酶。在另一个实施方案中,宿主细胞表达利用戊糖的异源酶。
在一些实施方案中,宿主细胞可以为酵母。根据本发明,酵母宿主细胞可以例如来自酵母属(Saccharomyces)、克鲁维酵母属(Kluyveromyces)、假丝酵母属(Candida)、毕赤酵母属(Pichia)、裂殖酵母属(Schizosaccharomyces)、汉逊酵母属(Hansenula)、克勒克酵母属(Kloeckera)、许旺酵母属(Schwanniomyces)和子囊菌酵母属(Yarrowia)。作为宿主细胞的酵母种类可包括例如酿酒酵母、S.bulderi、S.barnetti、少孢酵母(S.exiguus),葡萄汁酵母(S.uvarum),糖化酵母(S.diastaticus),乳酸克鲁维酵母(K.lactis)、马克斯克鲁维酵母(K.marxianus)或K.fragilis。在一些实施方案中,酵母选自酿酒酵母,裂殖酵母(Schizzosaccharomyces pombe),白色念珠菌(Candida albicans)、毕赤酵母(Pichia pastoris)、树干毕赤酵母、解脂耶氏酵母(Yarrowia lipolytica)、多型汉逊酵母(Hansenula polymorpha),红发夫酵母(Phaffiarhodozyma)、产朊假丝酵母(Candida utilis)、Arxula adeninivorans、汉逊德巴利酵母(Debaryomyces hansenii)、多形德巴利酵母菌(Debaryomyces polymorphus)、粟酒裂殖酵母(Schizosaccharomycespombe)和许旺酵母(Schwanniomyces occidentalis)。在一个具体的实施方案中,酵母为酿酒酵母。根据本文中的教导,适当的宿主的选择被认为在本领域技术人员的能力范围内。
在本发明的一些实施方案中,宿主细胞为产油细胞(oleaginouscell)。根据本发明,产油细胞可以是产油酵母细胞。例如,产油酵母细胞可来自布拉霉属(Blakeslea)、假丝酵母属、隐球菌属(Cryptococcus)、小克银汉霉属(Cunninghamella)、油脂酵母属(Lipomyces)、被孢霉属(Mortierella)、毛霉属(Mucor),须霉属(Phycomyces)、腐霉菌属(Pythium)、Rhodosporidum,红酵母属(Rhodotorula),毛孢子菌属(T-richosporon)或子囊菌酵母属(Yarrowia)。根据本发明,产油宿主细胞可以是产油微藻类宿主细胞。例如,产油微藻类宿主细胞可来自破囊壶菌属(Thraustochytrium)或裂殖壶菌属(Schizochytrium)。
在本发明的一些实施方案中,宿主细胞是耐热宿主细胞。耐热宿主细胞可特别地用于通过允许外部产生的纤维素酶和产乙醇宿主细胞在相似的温度范围内最佳地发挥作用来同时进行糖化和发酵过程。
本发明的耐热宿主细胞可包括例如东方伊萨酵母(Issatchenkiaorientalis)、Pichia mississippiensis、墨西哥毕赤酵母(Pichia mexicana)、粉状毕赤酵母(Pichia farinosa)、Clavispora opuntiae、葡萄牙棒孢酵母(Clavispora lusitaniae)、Candida mexicana、多形汉逊酵母和克鲁维酵母属(Kluyveromyces)宿主细胞。
在本发明的一些具体实施方案中,宿主细胞为克鲁维酵母属宿主细胞。例如,克鲁维酵母属宿主细胞可以为乳酸克鲁维酵母、马克斯克鲁维酵母(K.marxianus)、K.blattae、K.phaffii、K.yarrowii、K.aestuarii、K.dobzhanskii、K.wickerhamii、K.thermotolerans或K.waltii宿主细胞。在一个实施方案中,宿主细胞为乳酸克鲁维酵母或马克斯克鲁维酵母宿主细胞。在另一个实施方案中,宿主细胞为马克斯克鲁维酵母宿主细胞。
在本发明的一些实施方案中,耐热宿主细胞可在高于约30℃、约31℃、约32℃、约33℃、约34℃、约35℃、约36℃、约37℃、约38℃、约39℃、约40℃、约41℃或约42℃的温度下生长。在本发明的一些实施方案中,耐热宿主细胞可在高于约30℃、约31℃、约32℃、约33℃、约34℃、约35℃、约36℃、约37℃、约38℃、约39℃、约40℃、约41℃、约42℃或约50℃的温度下从纤维素产生乙醇。
在本发明的一些实施方案中,耐热宿主细胞可在约30℃至60℃、约30℃至55℃、约30℃至50℃、约40℃至60℃、约40℃至55℃或约40℃至50℃的温度下生长。在本发明的一些实施方案中,耐热宿主细胞可在约30℃至60℃、约30℃至55℃、约30℃至50℃、约40℃至60℃、约40℃至55℃或约40℃至50℃的温度下从纤维素产生乙醇。
通常用编码在本文中更详细地描述的本发明的糖分解酶(淀粉酶、纤维素酶,半纤维素酶,纤维素分解酶和淀粉分解辅助酶、菊糖酶,果聚糖酶,戊糖水解酶等)的多核苷酸遗传工程化(转导或转化或转染)宿主细胞。可将编码糖分解酶的多核苷酸在本发明的载体上引入宿主细胞,所述载体可以是例如包含编码异源糖分解酶的序列的克隆载体或表达载体。宿主细胞可包含作为整合的拷贝和质粒拷贝的本发明的多核苷酸。
在某些方面,本发明涉及包含本文中描述的多核苷酸构建体的宿主细胞。在一个实施方案中,本发明的宿主细胞表达糖分解酶的一种或多种异源多肽。在一些实施方案中,宿主细胞包含编码异源糖分解酶或其片段、变体或衍生物的多核苷酸的组合。宿主细胞可以例如包含多拷贝的相同核酸序列,例如以增加表达水平,或宿主细胞可包含独特的多核苷酸的组合。在其它实施方案中,宿主细胞包含编码异源糖分解酶或其片段、变体或衍生物的单一多核苷酸。具体地,可将此类表达单一异源糖分解酶的宿主细胞用于与本发明的其它宿主细胞(所述细胞包含编码至少一种其它异源糖分解酶或其片段、变体或衍生物的多核苷酸)一起共培养。
可利用本领域已知的方法将编码异源糖分解酶的多核苷酸引入宿主细胞。可以通过醋酸锂转化、原生质体转化或利用电穿孔的转化实现编码异源糖分解酶的多核苷酸至例如酵母宿主细胞的引入,如CurrentProtocols in Molecular Biology,13.7.1-13.7.10中所描述的。可通过磷酸钙转染、DEAE-葡聚糖介导的转染或电穿孔实现构建体至其它宿主细胞内的引入(Davis,L.,等人,Basic Methods in Molecular Biology,(1986))。
可检查上述转化的宿主细胞或细胞培养物的如下蛋白质的蛋白质含量:内切葡聚糖酶、葡糖苷酶、纤维二糖水解酶、木聚糖酶、葡聚糖酶、木糖苷酶、木聚糖酯酶、阿拉伯呋喃糖酶、半乳糖苷酶、纤维二糖磷酸化酶、纤维糊精磷酸化酶、甘露聚糖酶、甘露糖苷酶、木糖葡聚糖酶、内切木聚糖酶、葡糖醛酸糖苷酶、乙酰基木聚糖酯酶、阿拉伯呋喃糖基水解酶、膨胀因子、葡糖苷酸酯酶、棒曲霉素、果胶酶、阿魏酸酯酶蛋白、α-淀粉酶、β-淀粉酶、葡糖淀粉酶、支链淀粉酶、异支链淀粉酶、α-葡糖苷酶、β-葡糖苷酶、阿拉伯糖酶、阿拉伯木聚糖酶、阿拉伯糖苷酶和阿拉伯呋喃糖酶、阿拉伯糖异构酶、核酮糖-5-硫酸4-差向异构酶、木糖异构酶、木酮糖激酶、木糖还原酶、木酮脱氢酶、木糖醇脱氢酶、木糖酸脱水酶、木糖转酮醇酶和/或木糖转醛醇酶。为了使用分泌的异源糖分解酶,可通过分析宿主(例如,酵母)细胞上清液来测定蛋白质含量。在某些实施方案中,可以通过丙酮沉淀或通过利用一次性使用的脱盐药筒缓冲样品来从酵母细胞上清液回收高分子量材料。还可利用方法,包括例如原生质体制备和裂解、使用玻璃珠的细胞破碎以及使用液氮的细胞破碎来从重组酵母细胞培养物回收和纯化蛋白质,包括束缚的异源糖分解酶。其它蛋白质纯化法包括硫酸铵或乙醇沉淀、酸提取、阴离子或阳离子交换层析、磷酸纤维素层析、疏水相互作用层析、亲和层析、羟基磷灰石层析、凝胶过滤和外源凝集素层析。必要时,可将蛋白质重折叠步骤用于完成成熟蛋白质的构造。最终,可将高效液相色谱(HPLC)用于终纯化步骤。
蛋白质分析法包括方法例如常规罗氏蛋白质定量法、BCA测定、280nm处的吸光度或根据BioRad的制造商的方案的蛋白质测定法。通过使用此类方法,可估计糖分解酶的蛋白质含量。此外,为了精确地测量蛋白质含量,可表达具有标签例如His-标签或HA-标签的异源纤维素酶,利用使用例如抗所述标签的抗体的标准方法、标准镍树脂纯化技术或类似方法来进行纯化。
可进一步分析上述转化的细胞或细胞培养物的纤维素或淀粉的水解,或戊糖利用(例如,通过糖检测测定),分析其特定类型的糖分解酶活性(例如,通过测量单独的内切葡聚糖酶、葡糖苷酶、纤维二糖水解酶、木聚糖酶、葡聚糖酶、木糖苷酶、木聚糖酯酶、阿拉伯呋喃糖酶、半乳糖苷酶、纤维二糖磷酸化酶、纤维糊精磷酸化酶、甘露聚糖酶、甘露糖苷酶、木糖葡聚糖酶、内切木聚糖酶、葡糖醛酸糖苷酶、乙酰基木聚糖酯酶、阿拉伯呋喃糖基水解酶、膨胀因子、葡糖苷酸酯酶、棒曲霉素、果胶酶、阿魏酸酯酶、α-淀粉酶、β-淀粉酶、葡糖淀粉酶、支链淀粉酶、异支链淀粉酶、α-葡糖苷酶、β-葡糖苷酶、半乳糖苷酶、阿拉伯糖酶、阿拉伯木聚糖酶、阿拉伯糖苷酶、阿拉伯呋喃糖酶、阿拉伯木聚糖酶、阿拉伯糖苷酶和阿拉伯呋喃糖酶、阿拉伯糖异构酶、核酮糖-5-硫酸4-差向异构酶、木糖异构酶、木酮糖激酶、木糖还原酶、木酮脱氢酶、木糖醇脱氢酶、木糖酸脱水酶、木糖转酮醇酶和/或木糖转醛醇酶)或分析其总纤维素酶活性。可以例如通过测量内切葡聚糖酶特异性CMC或羟乙基纤维素(HEC)底物的还原末端的增加来测定内切葡聚糖酶活性。纤维二糖水解酶活性可以例如通过使用不溶性纤维质底物例如无定形底物磷酸膨胀纤维素(PASC)或微晶纤维素(微晶粉末纤维素)并且测定底物水解的程度来进行测量。β-葡糖苷酶活性可利用多种测定法,例如使用纤维二糖来进行测定。用于其它糖分解酶类型的活性的测定在本领域中是已知的并且在下文中进行举例说明。
总的糖分解酶活性可协同地水解生物质原料,所述总的糖分解酶活性可包括内切葡聚糖酶、葡糖苷酶、纤维二糖水解酶、木聚糖酶、葡聚糖酶、木糖苷酶、木聚糖酯酶、阿拉伯呋喃糖酶、半乳糖苷酶、纤维二糖磷酸化酶、纤维糊精磷酸化酶、甘露聚糖酶、甘露糖苷酶、木糖葡聚糖酶、内切木聚糖酶、葡糖醛酸糖苷酶、乙酰基木聚糖酯酶、阿拉伯呋喃糖基水解酶、膨胀因子、葡糖苷酸酯酶、棒曲霉素、果胶酶、阿魏酸酯酶蛋白、α-淀粉酶、β-淀粉酶、葡糖淀粉酶、α-葡糖苷酶、β-葡糖苷酶、半乳糖苷酶、阿拉伯糖酶、阿拉伯木聚糖酶、阿拉伯糖苷酶、阿拉伯呋喃糖酶、阿拉伯木聚糖酶、阿拉伯糖苷酶、支链淀粉酶、异支链淀粉酶、阿拉伯糖异构酶、核酮糖-5-硫酸4-差向异构酶、木糖异构酶、木酮糖激酶、木糖还原酶、木酮脱氢酶、木糖醇脱氢酶、木糖酸脱水酶、木糖转酮醇酶和木糖转醛醇酶的活性。例如,从而可使用不溶性底物来测量总纤维素酶活性,所述不溶性底物包括纯纤维质底物例如Whatman1号滤纸、棉绒、微晶纤维素、细菌纤维素、藻类纤维素以及含纤维素的底物例如染色的纤维素、α-纤维素或预处理的木质纤维素。纤维素酶的比活性还可利用本领域技术人员已知的方法,例如利用微晶粉末纤维素测定(上文中描述的)来检测,其可利用测量的样品的蛋白质(质纤维素酶)浓度来进行标准化。总的糖分解活性还可使用包含淀粉、纤维素和半纤维素的复杂底物例如玉米醪液,通过测量释放的单体糖来进行测量。在这样的测定中,不同组的酶可“间接协同”地起作用,此时一组酶例如纤维素酶可通过水解围绕淀粉分解底物的纤维素分解底物使底物更容易被另一组酶例如淀粉酶接触。该机制也可反过来起作用。
本发明的一个方面因此涉及高效率地产生糖分解酶以帮助淀粉、纤维素和戊糖的降解和利用,以及产物例如乙醇的产生。“糖分解酶”可以是参与碳水化合物的降解、代谢和/或水解的任何酶,包括淀粉酶、纤维素酶、半纤维素酶、纤维素分解和淀粉分解辅助酶、菊糖酶、果聚糖酶和戊糖水解酶。“纤维素酶”可以是参与纤维素酶降解、代谢和/或水解的任何酶,包括内切葡聚糖酶、葡糖苷酶、纤维二糖水解酶、木聚糖酶、葡聚糖酶、木糖苷酶、木聚糖酯酶、阿拉伯呋喃糖酶、半乳糖苷酶、纤维二糖磷酸化酶、纤维糊精磷酸化酶、甘露聚糖酶、甘露糖苷酶、木糖葡聚糖酶、内切木聚糖酶、葡糖醛酸糖苷酶、乙酰基木聚糖酯酶、阿拉伯呋喃糖基水解酶、膨胀因子、葡糖苷酸酯酶、棒曲霉素、果胶酶和阿魏酸酯酶蛋白。“淀粉酶”可以是参与淀粉降解和/或代谢的任何酶,包括α-淀粉酶、β-淀粉酶、葡糖淀粉酶、支链淀粉酶、异支链淀粉酶和α-葡糖苷酶。戊糖水解酶可以是参与戊糖降解和/或代谢的任何酶,包括木聚糖酶、阿拉伯糖酶、阿拉伯木聚糖酶、阿拉伯糖苷酶、阿拉伯呋喃糖酶、阿拉伯木聚糖酶、阿拉伯糖苷酶和阿拉伯呋喃糖酶、阿拉伯糖异构酶、核酮糖-5-硫酸4-差向异构酶、木糖异构酶、木酮糖激酶、木糖还原酶、木酮脱氢酶、木糖醇脱氢酶、木糖酸脱水酶、木糖转酮醇酶和/或木糖转醛醇酶。
在另外实施方案中,测定转化的宿主细胞或细胞培养物的乙醇产量。乙醇产量可通过本领域技术人员已知的技术例如通过标准HPLC折射率法来测量。
异源糖分解酶
根据本发明的一个方面,异源糖分解酶在宿主细胞中的表达可有利地用于从生物质来源产生产物例如乙醇。例如,可异源地表达来自多种来源的纤维素酶以成功地增加乙醇产生的效率。糖分解酶可来自真菌、酵母、细菌、植物、原生动物或白蚁来源。在一些实施方案中,糖分解酶来自灰腐质霉、T.aurantiacus、埃默森篮状菌、里氏木霉、C.lacteus、台湾乳白蚁、N.takasagoensis、C.acinaciformis、M.darwinensis、N.walkeri、扣囊复膜孢酵母(S.fibuligera)、C.luckowense、栖北散白蚁(R.speratus)、褐色嗜热裂孢菌(Thermobfida fusca)、热纤梭菌(Clostridum thermocellum)、解纤维梭菌、约氏梭菌(Clostridum josui)、短小芽孢杆菌(Bacillus pumilis)、粪碱纤维单胞菌(Cellulomonas fimi)、Saccharophagus degradans、Piromyces equii、Neocallimastix patricarum或拟南芥。
在一些实施方案中,本发明的纤维素酶为本文中产生的表4或表7中公开的任何纤维素酶。在一些实施方案中,纤维素酶由与SEQ ID NO:1-218之任一项具有至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或100%的同一性的核酸序列编码。在一些实施方案中,纤维素酶具有与SEQ ID NO:219-436的任一项具有至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或100%的同一性的氨基酸序列。在一些实施方案中,本发明的纤维素酶是适用于在适当的宿主细胞中表达的任何纤维素酶。
在其它实施方案中,本发明的淀粉酶是本文中产生的表19中公开的任何淀粉酶。在一些实施方案中,淀粉酶由与SEQ ID NO:437-441之任一项具有至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或100%的同一性的核酸序列编码。在一些实施方案中,纤维素酶具有与SEQ ID NO:442-446之任一项具有至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或100%的同一性的氨基酸序列。在一些实施方案中,本发明的淀粉酶为适合在适当的宿主细胞中表达的任何淀粉酶。
在本发明的一些实施方案中,可在相同的宿主细胞中共表达来自单个生物的多个糖分解酶。在本发明的一些实施方案中,可在相同的宿主细胞中共表达来自不同生物的多个糖分解酶。具体地,可在相同的宿主细胞中共表达来自2、3、4、5、6、7、8、9、或更多个生物的糖分解酶。类似地,本发明可包括酵母菌株的共培养物,其中酵母菌株表达不同的糖分解酶。共培养物可包括表达来自相同生物或来自不同生物的异源糖分解酶的酵母菌株。共培养物可包括表达来自2、3、4、5、6、7、8、9、或更多个生物的糖分解酶的酵母菌株。
本发明的木质纤维素酶包括内切葡聚糖酶外切葡聚糖酶。本发明的其它木质纤维素酶包括可作用于木质纤维素材料的辅助酶。木质纤维素酶可以例如是内切葡聚糖酶、葡糖苷酶、纤维二糖水解酶、木聚糖酶、葡聚糖酶、木糖苷酶、木聚糖酯酶、阿拉伯呋喃糖酶、半乳糖苷酶、纤维二糖磷酸化酶、纤维糊精磷酸化酶、甘露聚糖酶、甘露糖苷酶、木糖葡聚糖酶、内切木聚糖酶、葡糖醛酸糖苷酶、乙酰基木聚糖酯酶、阿拉伯呋喃糖基水解酶、膨胀因子、葡糖苷酸酯酶、棒曲霉素、果胶酶和阿魏酸酯酶。在一些实施方案中,本发明的木质纤维素酶可以是用于降解期望的木质纤维素材料的任何适当的酶。
在本发明的某些实施方案中,木质纤维素酶可以为内切葡聚糖酶、葡糖苷酶、纤维二糖水解酶、木聚糖酶、葡聚糖酶、木糖苷酶、木聚糖酯酶、阿拉伯呋喃糖酶、半乳糖苷酶、纤维二糖磷酸化酶、纤维糊精磷酸化酶、甘露聚糖酶、甘露糖苷酶、木糖葡聚糖酶、内切木聚糖酶、葡糖醛酸糖苷酶、乙酰基木聚糖酯酶、阿拉伯呋喃糖基水解酶、膨胀因子、葡糖苷酸酯酶、棒曲霉素、果胶酶和阿魏酸酯酶旁系同源物或直系同源物。在具体的实施方案中,木质纤维素酶来源于表4和7中命名的任何种类。在一个具体的实施方案中,木质纤维素酶包含选自SEQ ID NO:219-436的氨基酸序列。在某些其它实施方案中,木质纤维素酶包含与选自SEQ ID NO:219-436的氨基酸序列具有至少约70、约80、约90、约95、约96、约97、约98、约99或100%的同一性的氨基酸序列。
在本发明的其它实施方案中,淀粉酶可以为α-淀粉酶、β-淀粉酶、葡糖淀粉酶、α-葡糖苷酶、支链淀粉酶或异支链淀粉酶旁系同源物或直系同源物。
作为一个实际问题,可使用已知的计算机程序常规地确定任何多肽是否与本发明的多肽具有至少70%、80%、85%、90%、95%、96%、97%、98%、99%或100%的同一性。用于测定百分比同一性的方法,如在下文中关于多核苷酸同一性更详细地论述的,也涉及用于评估多肽序列的同一性。
在本发明的一些具体实施方案中,糖分解酶包含选自本文中提供的表4或表7或表19的序列。本发明的糖分解酶还包括包含与表4或表7或表19的序列具有至少约70、约80、约90、约95、约96、约97、约98、约99或100%的同一性的序列。通过登录号查询适当的数据库例如Genebank就可容易地确定基因、蛋白质或其它元件的氨基酸和核酸序列。然而,本文中还公开了本发明的基因和蛋白质的序列(SEQ ID NO:1-445)。
本发明的一些实施方案包括包含SEQ ID NO:219-445的任意项的至少10、20、30、40、50、60、70、80、90、100、200、300、400或500或更多个连续氨基酸的多肽或结构域、片段、变体或衍生物。
在本发明的某些方面,本发明的多肽和多核苷酸以分离的形式(例如纯化至同质)提供。
本发明还包括多肽,所述多肽包含与SEQ ID NO:219-436或SEQID NO:442-446的任意项的多肽以及与这样的多肽的部分(多肽的这样的部分通常包含至少30个氨基酸,更优选至少50个氨基酸)具有至少约80%,85%,90%,95%,96%,97%,98%,99%的相似性的氨基酸序列,或可选择地由所述氨基酸序列组成。
如本领域中已知的,两个多肽之间的“相似性”通过将多肽的氨基酸序列和对其的保守氨基酸置换与第二多肽的序列相比较来测定。
本发明还涉及SEQ ID NO:219-436或SEQ ID NO:442-446的任意项的多肽的结构域、片段、变体、衍生物或类似物。
本发明的多肽的片段或部分可用于通过肽合成产生相应的全长多肽。因此,片段可用作用于产生全长多肽的中间体。
本发明的木质纤维素酶的片段包括结构域、蛋白质水解片段、缺失片段以及特别地表4和7中命名的基因的任一个的片段,所述片段保持内切葡聚糖酶、葡糖苷酶、纤维二糖水解酶、木聚糖酶、葡聚糖酶、木糖苷酶、木聚糖酯酶、阿拉伯呋喃糖酶、半乳糖苷酶、纤维二糖磷酸化酶、纤维糊精磷酸化酶、甘露聚糖酶、甘露糖苷酶、木糖葡聚糖酶、内切木聚糖酶、葡糖醛酸糖苷酶、乙酰基木聚糖酯酶、阿拉伯呋喃糖基水解酶、膨胀因子、葡糖苷酸酯酶、棒曲霉素、果胶酶和阿魏酸酯酶蛋白的任何特异性生物活性。多肽片段还包括保持内切葡聚糖酶、葡糖苷酶、纤维二糖水解酶、木聚糖酶、葡聚糖酶、木糖苷酶、木聚糖酯酶、阿拉伯呋喃糖酶、半乳糖苷酶、纤维二糖磷酸化酶、纤维糊精磷酸化酶、甘露聚糖酶、甘露糖苷酶、木糖葡聚糖酶、内切木聚糖酶、葡糖醛酸糖苷酶、乙酰基木聚糖酯酶、阿拉伯呋喃糖基水解酶、膨胀因子、葡糖苷酸酯酶、棒曲霉素、果胶酶和阿魏酸酯酶蛋白的催化活性的多肽的任何部分。
本发明的淀粉酶的片段包括结构域、蛋白质水解片段、缺失片段以及特别地表15、16和19中命名的基因的任一个的片段,所述片段保持α-淀粉酶、β-淀粉酶、葡糖淀粉酶、支链淀粉酶、异支链淀粉酶和α-葡糖苷酶蛋白的任何特异性生物活性。多肽片段还包括保持α-淀粉酶、β-淀粉酶、葡糖淀粉酶、支链淀粉酶、异支链淀粉酶和α-葡糖苷酶蛋白的催化活性的多肽的任何部分。
SEQ ID NO:219-436或SEQ ID NO:442-446的任意项的多肽的变体、衍生物或类似物可以为(i)其中一个或多个氨基酸残基被保守或非保守氨基酸残基(优选保守氨基酸残基)置换并且此类置换的氨基酸残基可以是或可以不是由遗传密码子编码的残基的变体、衍生物或类似物,或(ii)其中一个或多个氨基酸残基包括取代基的变体、衍生物或类似物,或(iii)其中成熟多肽与另一种化合物例如增加多肽的半衰期的化合物(例如,聚乙醇)融合的变体、衍生物或类似物,或(iv)其中额外的氨基酸融合于成熟多肽以便纯化所述多肽的变体、衍生物或类似物或(v)其中多肽的片段是可溶性的,即不是膜结合的,但仍然结合针对膜结合受体的配体的变体、衍生物或类似物。根据本文中的教导,此类变体、衍生物和类似物被认为在本领域技术人员的能力范围内。
本发明的多肽还包括多肽的变体。多肽的“变体”可以是保守变体或等位基因变体。如本文中所用的,保守变体是指不会不利地影响蛋白质的生物功能的氨基酸序列的改变。当改变的序列阻止或破坏与蛋白质相关的生物功能时,置换、插入或缺失被认为不利地影响蛋白质。例如,可改变蛋白质的总电荷、结构或疏水-亲水性质而不会不利地影响生物活性。因此,可以例如改变氨基酸序列以使肽更加疏水或亲水,但不会不利地影响蛋白质的生物活性。
“等位基因变体”意指占据生物的染色体上的给定的基因座的基因的替代形式。Genes II,Lewin,B.,编著,John Wiley&Sons,NewYork(1985)。可使用本领域已知的诱变技术产生非天然存在的变体。等位基因变体,虽然具有与上述氨基酸序列略微不同的氨基酸序列,但仍然具有相同或相似的与本发明的内切葡聚糖酶、葡糖苷酶、纤维二糖水解酶、木聚糖酶、葡聚糖酶、木糖苷酶、木聚糖酯酶、阿拉伯呋喃糖酶、半乳糖苷酶、纤维二糖磷酸化酶、纤维糊精磷酸化酶、甘露聚糖酶、甘露糖苷酶、木糖葡聚糖酶、内切木聚糖酶、葡糖醛酸糖苷酶、乙酰基木聚糖酯酶、阿拉伯呋喃糖基水解酶、膨胀因子、葡糖苷酸酯酶、棒曲霉素、果胶酶、阿魏酸酯酶、α-淀粉酶、β-淀粉酶、葡糖淀粉酶、α-葡糖苷酶、β-葡糖苷酶、半乳糖苷酶、阿拉伯糖酶、阿拉伯木聚糖酶、阿拉伯糖苷酶、阿拉伯呋喃糖酶、阿拉伯木聚糖酶、阿拉伯糖苷酶和阿拉伯呋喃糖酶、阿拉伯糖异构酶、核酮糖-5-硫酸4-差向异构酶、木糖异构酶、木酮糖激酶、木糖还原酶、木酮脱氢酶、木糖醇脱氢酶、木糖酸脱水酶、木糖转酮醇酶和/或木糖转醛醇酶相关的生物活性。内切葡聚糖酶,纤维二糖水解酶,β-葡糖苷酶,α-淀粉酶,β-淀粉酶,葡糖淀粉酶,支链淀粉酶,异支链淀粉酶或α-葡糖苷酶蛋白质家族的等位基因变体、保守置换变体和成员可具有与SEQ ID NO:219-436和SEQ ID NO:442-446的任意项所示的内切葡聚糖酶、葡糖苷酶、纤维二糖水解酶、木聚糖酶、葡聚糖酶、木糖苷酶、木聚糖酯酶、阿拉伯呋喃糖酶、半乳糖苷酶、纤维二糖磷酸化酶、纤维糊精磷酸化酶、甘露聚糖酶、甘露糖苷酶、木糖葡聚糖酶、内切木聚糖酶、葡糖醛酸糖苷酶、乙酰基木聚糖酯酶、阿拉伯呋喃糖基水解酶、膨胀因子、葡糖苷酸酯酶、棒曲霉素、果胶酶、阿魏酸酯酶、α-淀粉酶、β-淀粉酶、葡糖淀粉酶、支链淀粉酶,异支链淀粉酶、α-葡糖苷酶和β-葡糖苷酶的氨基酸序列具有至少75%、至少80%、至少90%、至少95%的氨基酸序列同一性的氨基酸序列。关于此类序列的同一性或同源性在本文中定义为在对齐序列和如有必要,引入空隙(以实现最大百分比同源性,并且不将任何保守置换当作序列同一性的部分)后,候选序列中与已知的肽相同的氨基酸残基的百分数。N末端、C末端或内部延伸、缺失或至肽序列内的插入不应当解释为影响同源性。
因此,在一个方面,本发明的蛋白质和肽包括这样的分子:所述分子包含SEQ ID NO:219-436或/和SEQ ID NO:442-446的氨基酸序列或它们的具有如下蛋白质的至少约3、4、5、6、10、15、20、25、30、35或更多个氨基酸残基的连续序列的片段:内切葡聚糖酶、葡糖苷酶、纤维二糖水解酶、木聚糖酶、葡聚糖酶、木糖苷酶、木聚糖酯酶、阿拉伯呋喃糖酶、半乳糖苷酶、纤维二糖磷酸化酶、纤维糊精磷酸化酶、甘露聚糖酶、甘露糖苷酶、木糖葡聚糖酶、内切木聚糖酶、葡糖醛酸糖苷酶、乙酰基木聚糖酯酶、阿拉伯呋喃糖基水解酶、膨胀因子、葡糖苷酸酯酶、棒曲霉素、果胶酶、阿魏酸酯酶、α-淀粉酶、β-淀粉酶、葡糖淀粉酶、支链淀粉酶、异支链淀粉酶、α-葡糖苷酶和β-葡糖苷酶多肽序列;此类序列的氨基酸序列变体,其中至少一个氨基酸残基已被插入公开的序列的N或C末端或其内部;已被另一个残基转换的公开的序列的氨基酸序列变体或如上定义的它们的片段。涉及的变体还包括通过例如同源重组、定点或PCR诱变产生的预定突变的变体,以及其它动物种类(包括但不限于细菌、真菌、昆虫、兔、大鼠、猪、牛、绵羊、马和非人灵长类物种)的相应蛋白质、等位基因或蛋白质的家族的其它天然存在的变体;和衍生物,其中蛋白质已通过置换、化学、酶促或其它适当的方法利用除天然存在的氨基酸外的部分(例如,可检测的部分例如酶或放射性同位素)进行了共价修饰。
通过使用蛋白质工程和重组DNA技术的已知方法,可产生变体来改善或改变糖分解酶的多肽的特征。例如,可从分泌型蛋白质的N端或C端缺失一个或多个氨基酸而不显著丧失生物功能。
因此,在另一个方面,本发明还包括显示充足的生物活性的内切葡聚糖酶、葡糖苷酶、纤维二糖水解酶、木聚糖酶、葡聚糖酶、木糖苷酶、木聚糖酯酶、阿拉伯呋喃糖酶、半乳糖苷酶、纤维二糖磷酸化酶、纤维糊精磷酸化酶、甘露聚糖酶、甘露糖苷酶、木糖葡聚糖酶、内切木聚糖酶、葡糖醛酸糖苷酶、乙酰基木聚糖酯酶、阿拉伯呋喃糖基水解酶、膨胀因子、葡糖苷酸酯酶、棒曲霉素、果胶酶、阿魏酸酯酶、α-淀粉酶、β-淀粉酶、葡糖淀粉酶、支链淀粉酶、异支链淀粉酶、α-葡糖苷酶、β-葡糖苷酶、半乳糖苷酶、阿拉伯糖酶、阿拉伯木聚糖酶、阿拉伯糖苷酶、阿拉伯呋喃糖酶、阿拉伯木聚糖酶、阿拉伯糖苷酶和阿拉伯呋喃糖酶、阿拉伯糖异构酶、核酮糖-5-硫酸4-差向异构酶、木糖异构酶、木酮糖激酶、木糖还原酶、木酮脱氢酶、木糖醇脱氢酶、木糖酸脱水酶、木糖转酮醇酶和木糖转醛醇酶的多肽变体。此类变体包括根据本领域内已知的一般规则选择的缺失、插入、倒位(inversion)、重复和置换,因此对活性具有极少的影响。
本领域技术人员完全清楚不太可能或不可能显著影响蛋白质功能的氨基酸置换(例如,利用第二脂族氨基酸替代一个脂族氨基酸),如在下文中进一步描述的。
例如,关于如何制备表型沉默的氨基酸置换的指导提供于Bowie等人,"Deciphering the Message in Protein Sequences:Tolerance to AminoAcid Substitutions,"Science 247:1306-1310(1990)中,其中作者指出存在两个用于研究氨基酸序列对改变的耐受性的策略。
第一策略利用在进化过程中通过自然选择产生的氨基酸置换的耐受性。通过比较不同物种的氨基酸序列,可鉴定保守的氨基酸。这些保守的氨基酸可能对于蛋白质功能是非常重要的。相反地,其中置换已被自然选择耐受的氨基酸位置表明这些位置对于蛋白质功能不是至关重要的。因此,耐受氨基酸置换的位置可被修饰同时仍然维持蛋白质的生物活性。
第二策略使用基因工程来在克隆的基因的指定位置上引入氨基酸改变以鉴定对于蛋白质功能是至关重要的区域。例如,可使用定点诱变或丙氨酸-扫描诱变(在分子的每一个残基上引入单个丙氨酸突变)。(Cunningham和Wells,Science 244:1081-1085(1989))。随后可测试所得的突变分子的生物活性。
如作者所述,这两个策略已显示蛋白质通常令人惊讶地耐受氨基酸置换。作者还指出在蛋白质的某些氨基酸位点上哪个氨基酸改变可能是允许的。例如,大多数埋藏的(在蛋白质的三级结构内部)氨基酸残基需要非极性侧链,然而表面侧链的少数特征通常是保守的。此外,耐受的保守氨基酸置换包括脂族或疏水氨基酸Ala、Val、Leu和Ile的替代;羟基残基Ser和Thr的替代;酸性残基Asp和Glu的替代;酰胺残基Asn和Gln的替代,碱性残基Lys、Arg和His的替代;芳香族残基Phe、Tyr和Trp的替代,和小尺寸的氨基酸Ala、Ser、Thr、Met和Gly的替代。
术语“衍生物”和“类似物”是指这样的多肽,所述多肽与本文中公开的内切葡聚糖酶、葡糖苷酶、纤维二糖水解酶、木聚糖酶、葡聚糖酶、木糖苷酶、木聚糖酯酶、阿拉伯呋喃糖酶、半乳糖苷酶、纤维二糖磷酸化酶、纤维糊精磷酸化酶、甘露聚糖酶、甘露糖苷酶、木糖葡聚糖酶、内切木聚糖酶、葡糖醛酸糖苷酶、乙酰基木聚糖酯酶、阿拉伯呋喃糖基水解酶、膨胀因子、葡糖苷酸酯酶、棒曲霉素、果胶酶、阿魏酸酯酶、α-淀粉酶、β-淀粉酶、葡糖淀粉酶、支链淀粉酶、异支链淀粉酶、α-葡糖苷酶、β-葡糖苷酶、半乳糖苷酶、阿拉伯糖酶、阿拉伯木聚糖酶、阿拉伯糖苷酶、阿拉伯呋喃糖酶、阿拉伯木聚糖酶、阿拉伯糖苷酶和阿拉伯呋喃糖酶、阿拉伯糖异构酶、核酮糖-5-硫酸4-差向异构酶、木糖异构酶、木酮糖激酶、木糖还原酶、木酮脱氢酶、木糖醇脱氢酶、木糖酸脱水酶、木糖转酮醇酶和木糖转醛醇酶多肽不同,但保留其必需性质。通常,衍生物和类似物总体上与本文中公开的内切葡聚糖酶、葡糖苷酶、纤维二糖水解酶、木聚糖酶、葡聚糖酶、木糖苷酶、木聚糖酯酶、阿拉伯呋喃糖酶、半乳糖苷酶、纤维二糖磷酸化酶、纤维糊精磷酸化酶、甘露聚糖酶、甘露糖苷酶、木糖葡聚糖酶、内切木聚糖酶、葡糖醛酸糖苷酶、乙酰基木聚糖酯酶、阿拉伯呋喃糖基水解酶、膨胀因子、葡糖苷酸酯酶、棒曲霉素、果胶酶、阿魏酸酯酶、α-淀粉酶、β-淀粉酶、葡糖淀粉酶、支链淀粉酶、异支链淀粉酶、α-葡糖苷酶、β-葡糖苷酶、半乳糖苷酶、阿拉伯糖酶、阿拉伯木聚糖酶、阿拉伯糖苷酶、阿拉伯呋喃糖酶、阿拉伯木聚糖酶、阿拉伯糖苷酶和阿拉伯呋喃糖酶、阿拉伯糖异构酶、核酮糖-5-硫酸4-差向异构酶、木糖异构酶、木酮糖激酶、木糖还原酶、木酮脱氢酶、木糖醇脱氢酶、木糖酸脱水酶、木糖转酮醇酶和木糖转醛醇酶多肽十分相似以及在许多区域与其同一。术语“衍生物”和“类似物”,当指内切葡聚糖酶、葡糖苷酶、纤维二糖水解酶、木聚糖酶、葡聚糖酶、木糖苷酶、木聚糖酯酶、阿拉伯呋喃糖酶、半乳糖苷酶、纤维二糖磷酸化酶、纤维糊精磷酸化酶、甘露聚糖酶、甘露糖苷酶、木糖葡聚糖酶、内切木聚糖酶、葡糖醛酸糖苷酶、乙酰基木聚糖酯酶、阿拉伯呋喃糖基水解酶、膨胀因子、葡糖苷酸酯酶、棒曲霉素、果胶酶、阿魏酸酯酶、α-淀粉酶、β-淀粉酶、葡糖淀粉酶、支链淀粉酶、异支链淀粉酶、α-葡糖苷酶、β-葡糖苷酶、半乳糖苷酶、阿拉伯糖酶、阿拉伯木聚糖酶、阿拉伯糖苷酶、阿拉伯呋喃糖酶、阿拉伯木聚糖酶、阿拉伯糖苷酶和阿拉伯呋喃糖酶、阿拉伯糖异构酶、核酮糖-5-硫酸4-差向异构酶、木糖异构酶、木酮糖激酶、木糖还原酶、木酮脱氢酶、木糖醇脱氢酶、木糖酸脱水酶、木糖转酮醇酶和木糖转醛醇酶多肽时,包括保留相应的天然多肽的至少一些活性(例如外切葡聚糖酶活性或其催化结构域的活性)的任何多肽。
本文中公开的糖分解酶的衍生物为已被改变以展示未在天然多肽中发现的特征的多肽。衍生物可通过置换、化学、酶促或或其它适当的方法利用除天然存在的氨基酸外的部分(例如,可检测的部分例如酶或放射性同位素)进行了共价修饰。衍生物的实例包括融合蛋白。
类似物为本发明的内切葡聚糖酶,葡糖苷酶,纤维二糖水解酶,木聚糖酶,葡聚糖酶,木糖苷酶,木聚糖酯酶,阿拉伯呋喃糖酶,半乳糖苷酶,纤维二糖磷酸化酶,纤维糊精磷酸化酶,甘露聚糖酶,甘露糖苷酶,木糖葡聚糖酶,内切木聚糖酶,葡糖醛酸糖苷酶,乙酰基木聚糖酯酶,阿拉伯呋喃糖基水解酶,膨胀因子,葡糖苷酸酯酶,棒曲霉素,果胶酶,阿魏酸酯酶,α-淀粉酶,β-淀粉酶,葡糖淀粉酶,支链淀粉酶,异支链淀粉酶,α-葡糖苷酶,β-葡糖苷酶,半乳糖苷酶,阿拉伯糖酶,阿拉伯木聚糖酶,阿拉伯糖苷酶,阿拉伯呋喃糖酶,阿拉伯木聚糖酶,阿拉伯糖苷酶和阿拉伯呋喃糖酶,阿拉伯糖异构酶,核酮糖-5-硫酸4-差向异构酶,木糖异构酶,木酮糖激酶,木糖还原酶,木酮脱氢酶,木糖醇脱氢酶,木糖酸脱水酶,木糖转酮醇酶和木糖转醛醇酶多肽的另一种形式。“类似物”也大体上保留与目标多肽相同的生物功能或活性,例如用作木聚糖酶。类似物包括可通过切割前蛋白的部分以产生具有活性的成熟多肽来激活的前蛋白。
本发明的多肽可以是重组多肽、天然多肽或合成多肽。在一些具体的实施方案中,多肽是重组多肽。
本发明中还提供了等位基因变体、直系同源物和/或种同源物。本领域已知的方法可用于使用来自本文中公开的序列或由ATCC保藏的克隆的信息获得相应于SEQ ID NO:1-218或SEQ ID NO:437-441的任意项的全长基因、等位基因变体、剪接变体、全长编码部分、直系同源物和/或物种同源物。例如,可通过从本文中提供的序列制备适当的探针或引物并且筛选等位基因变体和/或期望的同源物的适当的核酸来源来分离和鉴定等位基因变体和/或物种同源物。
糖分解酶的组合
在本发明的一些实施方案中,宿主细胞表达异源糖分解酶的组合。例如,宿主细胞可包含至少2种异源糖分解酶、至少3种异源糖分解酶、至少4种异源糖分解酶、至少5种异源糖分解酶、至少6种异源糖分解酶、至少7种异源糖分解酶、至少8种异源糖分解酶、至少9种异源糖分解酶、至少10种源糖分解酶、至少11种异源糖分解酶、至少12种异源糖分解酶、至少13种异源糖分解酶、至少14种异源糖分解酶或至少15种异源糖分解酶。宿主细胞中的异源糖分解酶可来自相同或来自不同的物种。在一个实施方案中,宿主细胞表达异源酶,包括纤维二糖水解酶、内切-葡聚糖酶、β-葡糖苷酶、木聚糖酶、木糖苷酶、葡糖淀粉酶、α-淀粉酶、α-葡糖苷酶、支链淀粉酶、异支链淀粉酶、果胶酶和乙酰基木聚糖酯酶。
束缚的和分泌型糖分解酶
根据本发明,糖分解酶可以是束缚的或分泌的。如本文中所使用,如果蛋白质的至少一个末端共价地和/或通过静电作用结合至例如细胞膜或细胞壁,则“蛋白质”被“束缚”至生物的细胞表面。应理解,束缚的蛋白质可包括一个或多个酶促区域,所述区域在核酸和/或蛋白质水平上可被连接于一个或多个其它类型的区域(例如,启动子、终止子、锚定结构域、接头、信号区等)。虽然一个或多个酶促区域可以不直接结合至细胞膜或细胞壁(例如,当结合通过锚定结构域发生时),然而根据本发明的说明书,蛋白质被认为是“束缚的酶”。
束缚可以例如通过将锚定结构域整合入由细胞异源表达的重组蛋白质,或通过异戊烯化、脂肪酰连接、糖基磷脂酰肌醇锚或其它适当的分子锚(其可将束缚的蛋白质锚定至宿主细胞的细胞膜或细胞壁)来实现。束缚的蛋白质可被束缚在其氨基末端或任选地束缚在其羧基末端。
如本文中所使用的,“分泌的”意指释放至细胞外环境中,例如释放至培养基中。虽然束缚的蛋白质可具有作为它们的未成熟氨基酸序列的部分的分泌信号,但它们维持附着至细胞表面,并且不落在如本文中使用的分泌型蛋白质的范围内。
如本文中所使用的,“柔性接头序列”是指连接两个氨基酸序列,例如细胞壁锚定氨基酸序列与包含期望的酶促活性的氨基酸序列的氨基酸序列。柔性接头序列允许包含期望的酶促活性的氨基酸序列具有必需自由度,以在接近细胞方面具有减少的位阻,并且还可帮助包含期望的酶促活性的氨基酸序列正确折叠。
在本发明的一些实施方案中,束缚的纤维素酶通过柔性接头序列连接于锚定结构域。在一些实施方案中,锚定结构域具有来自酿酒酵母的CWP2(用于羧基末端锚定)或FLO1(用于氨基末端锚定)。
在一些实施方案中,可将异源分泌信号添加至本发明的表达载体以帮助纤维素酶蛋白的细胞外表达。在一些实施方案中,异源分泌信号为来自里氏木霉Xyn2的分泌信号。在其它实施方案中,异源分泌信号为酿酒酵母转化酶信号。在其它实施方案中,异源分泌信号为酿酒酵母AF交配信号。
包含糖分解酶的整合蛋白
本发明还包括融合蛋白。例如,融合蛋白可以是异源糖分解酶和第二肽的融合物。异源糖分解酶与第二肽可直接或间接(例如通过接头序列)融合。融合蛋白可包括例如位于异源糖分解酶的N末端的第二肽和/或位于异源糖分解酶的C末端的第二肽。因此,在某些实施方案中,本发明的多肽包括第一多肽和第二多肽,其中第一多肽包括异源糖分解酶。
根据本发明,融合蛋白可包括第一和第二多肽,其中第一多肽包括异源糖分解酶并且第二多肽包括信号序列。根据另一个实施方案,融合蛋白可包括第一和第二多肽,其中第一多肽包括异源糖分解酶并且第二多肽包括用于帮助纯化或鉴定的多肽或报道肽。用于帮助纯化或鉴定的多肽或报道肽可以是例如HIS-标签、GST-标签、HA-标签、FLAG-标签、MYC-标签或荧光蛋白。
根据另一个实施方案,融合蛋白可包含第一和第二多肽,其中第一多肽包括异源糖分解酶并且第二多肽包括锚定肽。在一些实施方案中,锚定结构域具有来自酿酒酵母的CWP2(用于羧基末端锚定)或FLO1(用于氨基末端锚定)。
根据另一个实施方案,融合蛋白可包括第一和第二多肽,其中第一多肽包括异源糖分解酶并且第二多肽包括纤维素结合模块(CBM或SBM)。在一些实施方案中,CBM来自例如里氏木霉Cbh1或Cbh2或来自C.lucknowense Cbh2b。在一些具体的实施方案,将CBM融合至内切葡聚糖酶、葡糖苷酶、纤维二糖水解酶、木聚糖酶、葡聚糖酶、木糖苷酶、木聚糖酯酶、阿拉伯呋喃糖酶、半乳糖苷酶、纤维二糖磷酸化酶、纤维糊精磷酸化酶、甘露聚糖酶、甘露糖苷酶、木糖葡聚糖酶、内切木聚糖酶、葡糖醛酸糖苷酶、乙酰基木聚糖酯酶、阿拉伯呋喃糖基水解酶、膨胀因子、葡糖苷酸酯酶、棒曲霉素、果胶酶、阿魏酸酯酶、α-淀粉酶、β-淀粉酶、葡糖淀粉酶、支链淀粉酶、异支链淀粉酶、α-葡糖苷酶、β-葡糖苷酶、半乳糖苷酶、阿拉伯糖酶、阿拉伯木聚糖酶、阿拉伯糖苷酶、阿拉伯呋喃糖酶、阿拉伯木聚糖酶、阿拉伯糖苷酶和阿拉伯呋喃糖酶、阿拉伯糖异构酶、核酮糖-5-硫酸4-差向异构酶、木糖异构酶、木酮糖激酶、木糖还原酶、木酮脱氢酶、木糖醇脱氢酶、木糖酸脱水酶、木糖转酮醇酶和/或木糖转醛醇酶。
在某些实施方案中,本发明的多肽包括包含第一多肽和第二多肽的融合蛋白,其中第一多肽为内切葡聚糖酶、葡糖苷酶、纤维二糖水解酶、木聚糖酶、葡聚糖酶、木糖苷酶、木聚糖酯酶、阿拉伯呋喃糖酶、半乳糖苷酶、纤维二糖磷酸化酶、纤维糊精磷酸化酶、甘露聚糖酶、甘露糖苷酶、木糖葡聚糖酶、内切木聚糖酶、葡糖醛酸糖苷酶、乙酰基木聚糖酯酶、阿拉伯呋喃糖基水解酶、膨胀因子、葡糖苷酸酯酶、棒曲霉素、果胶酶、阿魏酸酯酶、α-淀粉酶、β-淀粉酶、葡糖淀粉酶、支链淀粉酶、异支链淀粉酶、α-葡糖苷酶、β-葡糖苷酶、半乳糖苷酶、阿拉伯糖酶、阿拉伯木聚糖酶、阿拉伯糖苷酶、阿拉伯呋喃糖酶、阿拉伯木聚糖酶、阿拉伯糖苷酶和阿拉伯呋喃糖酶、阿拉伯糖异构酶、核酮糖-5-硫酸4-差向异构酶、木糖异构酶、木酮糖激酶、木糖还原酶、木酮脱氢酶、木糖醇脱氢酶、木糖酸脱水酶、木糖转酮醇酶和/或木糖转醛醇酶,并且第二多肽选自由本文中公开的糖分解酶的结构域或片段编码的多肽。在某些实施方案中,本发明的多肽包括包含第一糖分解酶多肽和第二多肽的融合蛋白,其中第一多肽为本文中公开的任何糖分解酶的结构域、衍生物或片段,其中第二多肽为埃默森篮状菌(T.emersonii)Cbh1、灰腐质霉(H.grisea)Cbh1或嗜热子囊菌(T.aurantiacusi)Cbh1、埃默森篮状菌Cbh2、里氏木霉Cbh1或里氏木霉Cbh2、C.lucknowense Cbh2b或其结构域、片段、变体或衍生物。在另外的实施方案中,第一多肽位于第二多肽的N末端或C末端。在某些其它实施方案中,第一多肽和/或第二多肽由密码子优化的多核苷酸,例如针对酿酒酵母或克鲁维酵母的密码子优化的多核苷酸编码。
在某些其它实施方案中,第一多肽和第二多肽通过接头序列融合。在一些实施方案中,接头序列可由密码子优化的多核苷酸编码。(密码子优化的多核苷酸在下文中进行了更详细地描述)。相应于根据本发明的密码子优化的接头1的氨基酸序列为柔性接头-strep标签-TEV位点-FLAG-柔性接头融合物并且相应于GGGGSGGGGS AWHPQFGGENLYFQG DYKDDDK GGGGSGGGGS。
示例性DNA序列如下:
GGAGGAGGTGGTTCAGGAGGTGGTGGGTCTGCTTGGCATCCACAATTTGGAGGAGGCGGTGGTGAAAATCTGTATTTCCAGGGAGGCGGAGGTGATTACAAGGATGACGACAAAGGAGGTGGTGGATCAGGAGGTGGTGGCTCC(SEQ ID NO:41)。
相应于优化的接头2的氨基酸序列为柔性接头-strep标签-接头-TEV位点-柔性接头并且相应于GGGGSGGGGS WSHPQFEK GGENLYFQG GGGGSGGGGS。DNA序列如下:ggtggcggtggatctggaggaggcggttcttggtctcacccacaatttgaaaagggtggagaaaacttgtactttcaaggcggtggtggaggttctggcggaggtggctccggctca。
共培养物
在另一个方面,本发明涉及包含至少两种酵母宿主细胞的共培养物,其中至少两种酵母宿主细胞各自包含分离的编码糖分解酶的多核苷酸。如本文中所使用的,“共培养物”是指在相同的容器中一起生长两个不同菌株或物种的宿主细胞。在本发明的一些实施方案中,共培养物的至少一种宿主细胞包含含有核酸的异源多核苷酸,所述核酸编码内切葡聚糖酶、葡糖苷酶、纤维二糖水解酶、木聚糖酶、葡聚糖酶、木糖苷酶、木聚糖酯酶、阿拉伯呋喃糖酶、半乳糖苷酶、纤维二糖磷酸化酶、纤维糊精磷酸化酶、甘露聚糖酶、甘露糖苷酶、木糖葡聚糖酶、内切木聚糖酶、葡糖醛酸糖苷酶、乙酰基木聚糖酯酶、阿拉伯呋喃糖基水解酶、膨胀因子、葡糖苷酸酯酶、棒曲霉素、果胶酶、阿魏酸酯酶、α-淀粉酶、β-淀粉酶、葡糖淀粉酶、α-葡糖苷酶、支链淀粉酶、异支链淀粉酶、半乳糖苷酶、阿拉伯糖酶、阿拉伯木聚糖酶、阿拉伯糖苷酶、阿拉伯呋喃糖酶、阿拉伯木聚糖酶、阿拉伯糖苷酶和阿拉伯呋喃糖酶、阿拉伯糖异构酶、核酮糖-5-硫酸4-差向异构酶、木糖异构酶、木酮糖激酶、木糖还原酶、木酮脱氢酶、木糖醇脱氢酶、木糖酸脱水酶、木糖转酮醇酶和/或木糖转醛醇酶,共培养物的至少一种宿主细胞包含含有核酸的异源多核苷酸,所述核酸编码不同的内切葡聚糖酶、葡糖苷酶、纤维二糖水解酶、木聚糖酶、葡聚糖酶、木糖苷酶、木聚糖酯酶、阿拉伯呋喃糖酶、半乳糖苷酶、纤维二糖磷酸化酶、纤维糊精磷酸化酶、甘露聚糖酶、甘露糖苷酶、木糖葡聚糖酶、内切木聚糖酶、葡糖醛酸糖苷酶、乙酰基木聚糖酯酶、阿拉伯呋喃糖基水解酶、膨胀因子、葡糖苷酸酯酶、棒曲霉素、果胶酶、阿魏酸酯酶、α-淀粉酶、β-淀粉酶、葡糖淀粉酶、α-葡糖苷酶、β-葡糖苷酶、支链淀粉酶、异支链淀粉酶、半乳糖苷酶、阿拉伯糖酶、阿拉伯木聚糖酶、阿拉伯糖苷酶、阿拉伯呋喃糖酶、阿拉伯木聚糖酶、阿拉伯糖苷酶和阿拉伯呋喃糖酶、阿拉伯糖异构酶、核酮糖-5-硫酸4-差向异构酶、木糖异构酶、木酮糖激酶、木糖还原酶、木酮脱氢酶、木糖醇脱氢酶、木糖酸脱水酶、木糖转酮醇酶和木糖转醛醇酶,并且至少一种宿主细胞包含含有核酸的异源多核苷酸,所述核酸编码仍然不同的内切葡聚糖酶、葡糖苷酶、纤维二糖水解酶、木聚糖酶、葡聚糖酶、木糖苷酶、木聚糖酯酶、半乳糖苷酶、纤维二糖磷酸化酶、纤维糊精磷酸化酶、甘露聚糖酶、甘露糖苷酶、木糖葡聚糖酶、内切木聚糖酶、葡糖醛酸糖苷酶、乙酰基木聚糖酯酶、阿拉伯呋喃糖基水解酶、膨胀因子、葡糖苷酸酯酶、棒曲霉素、果胶酶、阿魏酸酯酶、α-淀粉酶、β-淀粉酶、葡糖淀粉酶、α-葡糖苷酶、β-葡糖苷酶、支链淀粉酶、异支链淀粉酶、半乳糖苷酶、阿拉伯糖酶、阿拉伯木聚糖酶、阿拉伯糖苷酶、阿拉伯呋喃糖酶、阿拉伯木聚糖酶、阿拉伯糖苷酶和阿拉伯呋喃糖酶、阿拉伯糖异构酶、核酮糖-5-硫酸4-差向异构酶、木糖异构酶、木酮糖激酶、木糖还原酶、木酮脱氢酶、木糖醇脱氢酶、木糖酸脱水酶、木糖转酮醇酶和/或木糖转醛醇酶。
共培养物可包含两个或更多个菌株的酵母宿主细胞,并且异源糖分解酶可在两个或更多个菌株的宿主细胞中以任意组合表达。例如,根据本发明,共培养物可包含两种菌株:表达内切葡聚糖酶的宿主细胞的一种菌株和表达β-葡糖苷酶、纤维二糖水解酶和第二纤维二糖水解酶的宿主细胞的第二菌株。类似地,共培养物可包含表达两种糖分解酶例如内切葡聚糖酶和β-葡糖苷酶的宿主细胞的一种菌株和表达一种或多种糖分解酶(例如,内切葡聚糖酶、葡糖苷酶、纤维二糖水解酶、木聚糖酶、葡聚糖酶、木糖苷酶、木聚糖酯酶、阿拉伯呋喃糖酶、半乳糖苷酶、纤维二糖磷酸化酶、纤维糊精磷酸化酶、甘露聚糖酶、甘露糖苷酶、木糖葡聚糖酶、内切木聚糖酶、葡糖醛酸糖苷酶、乙酰基木聚糖酯酶、阿拉伯呋喃糖基水解酶、膨胀因子、葡糖苷酸酯酶、棒曲霉素、果胶酶、阿魏酸酯酶、α-淀粉酶、β-淀粉酶、葡糖淀粉酶、支链淀粉酶、异支链淀粉酶、α-葡糖苷酶、β-葡糖苷酶、半乳糖苷酶、阿拉伯糖酶、阿拉伯木聚糖酶、阿拉伯糖苷酶、阿拉伯呋喃糖酶、阿拉伯木聚糖酶、阿拉伯糖苷酶和阿拉伯呋喃糖酶、阿拉伯糖异构酶、核酮糖-5-硫酸4-差向异构酶、木糖异构酶、木酮糖激酶、木糖还原酶、木酮脱氢酶、木糖醇脱氢酶、木糖酸脱水酶、木糖转酮醇酶和/或木糖转醛醇酶的一种或多种)的宿主细胞的第二菌株。共培养物,除了至少两种包含异源糖分解酶的宿主细胞外,还包括不包含异源糖分解酶的其它宿主细胞。共培养可包含表达如下蛋白质的一种菌株:内切葡聚糖酶、葡糖苷酶、纤维二糖水解酶、木聚糖酶、葡聚糖酶、木糖苷酶、木聚糖酯酶、阿拉伯呋喃糖酶、半乳糖苷酶、纤维二糖磷酸化酶、纤维糊精磷酸化酶、甘露聚糖酶、甘露糖苷酶、木糖葡聚糖酶、内切木聚糖酶、葡糖醛酸糖苷酶、乙酰基木聚糖酯酶、阿拉伯呋喃糖基水解酶、膨胀因子、葡糖苷酸酯酶、棒曲霉素、果胶酶、阿魏酸酯酶、α-淀粉酶、β-淀粉酶、葡糖淀粉酶、支链淀粉酶、异支链淀粉酶、α-葡糖苷酶、β-葡糖苷酶、半乳糖苷酶、阿拉伯糖酶、阿拉伯木聚糖酶、阿拉伯糖苷酶、阿拉伯呋喃糖酶、阿拉伯木聚糖酶、阿拉伯糖苷酶和阿拉伯呋喃糖酶、阿拉伯糖异构酶、核酮糖-5-硫酸4-差向异构酶、木糖异构酶、木酮糖激酶、木糖还原酶、木酮脱氢酶、木糖醇脱氢酶、木糖酸脱水酶、木糖转酮醇酶和/或木糖转醛醇酶;和表达如下蛋白质的第二宿主细胞:内切葡聚糖酶、葡糖苷酶、纤维二糖水解酶、木聚糖酶、葡聚糖酶、木糖苷酶、木聚糖酯酶、阿拉伯呋喃糖酶、半乳糖苷酶、纤维二糖磷酸化酶、纤维糊精磷酸化酶、甘露聚糖酶、甘露糖苷酶、木糖葡聚糖酶、内切木聚糖酶、葡糖醛酸糖苷酶、乙酰基木聚糖酯酶、阿拉伯呋喃糖基水解酶、膨胀因子、葡糖苷酸酯酶、棒曲霉素、果胶酶、阿魏酸酯酶、α-淀粉酶、β-淀粉酶、葡糖淀粉酶、支链淀粉酶、异支链淀粉酶、α-葡糖苷酶、β-葡糖苷酶、半乳糖苷酶、阿拉伯糖酶、阿拉伯木聚糖酶、阿拉伯糖苷酶、阿拉伯呋喃糖酶、阿拉伯木聚糖酶、阿拉伯糖苷酶和阿拉伯呋喃糖酶、阿拉伯糖异构酶、核酮糖-5-硫酸4-差向异构酶、木糖异构酶、木酮糖激酶、木糖还原酶、木酮脱氢酶、木糖醇脱氢酶、木糖酸脱水酶、木糖转酮醇酶和/或木糖转醛醇酶。
共培养物中的不同宿主细胞菌株可以以相等的数目存在,或一个菌株或物种的宿主细胞的数目可明显地超过另一个第二菌株或物种的宿主细胞的数目。例如,在包含两个菌株或物种的宿主细胞的共培养物中,一种宿主细胞对另一种宿主细胞的比率可以为1:1、1:2、1:3、1:4、1:5、1:10、1:100、1:500或1:1000。类似地,在包含3个或更多个菌株或物种的宿主细胞的共培养物中,宿主细胞的菌株或物种可以以相等或不相等的数目存在。
生物质原料包含不同比例的淀粉、木质纤维素和戊糖。因此,在一个方面,酵母菌株以不同的水平表达不同的糖分解酶。在一个实施方案中,一种或多种淀粉分解酶在酵母菌株中与一种或多种木质纤维素酶和/或一种或多种戊糖利用酶相比较以更高的水平表达。在另一个实施方案中,一种或多种木质纤维素酶在酵母菌株中与一种或多种淀粉分解酶和/或一种或多种戊糖利用酶相比较以更高的水平表达。在另一个实施方案中,一种或多种戊糖利用酶在酵母菌株中与一种或多种木质纤维素酶和/或一种或多种淀粉分解酶相比较以更高的水平表达。在另一个实施方案中,一种或多种淀粉分解酶、一种或多种纤维素酶以及一种或多种戊糖利用酶在酵母菌株中全都以大致相等的水平表达。在本发明的一些实施方案中,酵母菌株中淀粉分解酶与纤维素分解酶的表达的比率为约1:5、约1:2、约1:1、约2:1或约5:1。在本发明的一些实施方案中,可使用层析技术例如HPLC、离子交换层析、大小排阻层析或通过2D凝胶电泳、免疫印迹、质谱法、MALDI_TOF或功能测定来测定淀粉分解酶和纤维素分解酶的相对表达水平。
本发明的共培养物可包括束缚的糖分解酶、分泌型糖分解酶或束缚的糖分解酶和分泌型糖分解酶。例如,在本发明的一些实施方案中,共培养物包含至少一种包含编码分泌型异源糖分解酶的多核苷酸的酵母宿主细胞。在另一个实施方案中,共培养物包含至少一种包含编码束缚的异源糖分解酶的多核苷酸的酵母宿主细胞。在一个实施方案中,共培养物中的所有异源糖分解酶都是分泌型的,在另一个实施方案,共培养物中的所有异源糖分解酶都是束缚的。此外,其它糖分解酶例如外部添加的糖分解酶可存在于共培养物中。
编码异源糖分解酶的多核苷酸
在另一个方面,本发明包括编码本发明的糖分解酶的分离的多核苷酸。因此,本发明的多核苷酸可编码内切葡聚糖酶、外切葡聚糖酶、淀粉酶或戊糖利用酶。多核苷酸可编码内切葡聚糖酶、葡糖苷酶、纤维二糖水解酶、木聚糖酶、葡聚糖酶、木糖苷酶、木聚糖酯酶、阿拉伯呋喃糖酶、半乳糖苷酶、纤维二糖磷酸化酶、纤维糊精磷酸化酶、甘露聚糖酶、甘露糖苷酶、木糖葡聚糖酶、内切木聚糖酶、葡糖醛酸糖苷酶、乙酰基木聚糖酯酶、阿拉伯呋喃糖基水解酶、膨胀因子、葡糖苷酸酯酶、棒曲霉素、果胶酶、阿魏酸酯酶、α-淀粉酶、β-淀粉酶、葡糖淀粉酶、支链淀粉酶、异支链淀粉酶、α-葡糖苷酶、β-葡糖苷酶、半乳糖苷酶、阿拉伯糖酶、阿拉伯木聚糖酶、阿拉伯糖苷酶、阿拉伯呋喃糖酶、阿拉伯木聚糖酶、阿拉伯糖苷酶、阿拉伯呋喃糖酶、阿拉伯糖异构酶、核酮糖-5-硫酸4-差向异构酶、木糖异构酶、木酮糖激酶、木糖还原酶、木酮脱氢酶、木糖醇脱氢酶、木糖酸脱水酶、木糖转酮醇酶和/或木糖转醛醇酶。
本发明还包括包含核酸的分离的多核苷酸,所述核酸与编码本文中公开的如下蛋白质的核酸具有至少约70%,75%或80%的同一性,至少约90%至约95%的同一性,或至少约96%、97%、98%、99%或100%的同一性:内切葡聚糖酶、葡糖苷酶、纤维二糖水解酶、木聚糖酶、葡聚糖酶、木糖苷酶、木聚糖酯酶、阿拉伯呋喃糖酶、半乳糖苷酶、纤维二糖磷酸化酶、纤维糊精磷酸化酶、甘露聚糖酶、甘露糖苷酶、木糖葡聚糖酶、内切木聚糖酶、葡糖醛酸糖苷酶、乙酰基木聚糖酯酶、阿拉伯呋喃糖基水解酶、膨胀因子、葡糖苷酸酯酶、棒曲霉素、果胶酶、阿魏酸酯酶、α-淀粉酶、β-淀粉酶、葡糖淀粉酶、支链淀粉酶、异支链淀粉酶、α-葡糖苷酶、β-葡糖苷酶、半乳糖苷酶、阿拉伯糖酶、阿拉伯木聚糖酶、阿拉伯糖苷酶、阿拉伯呋喃糖酶、阿拉伯木聚糖酶、阿拉伯糖苷酶和阿拉伯呋喃糖酶、阿拉伯糖异构酶、核酮糖-5-硫酸4-差向异构酶、木糖异构酶、木酮糖激酶、木糖还原酶、木酮脱氢酶、木糖醇脱氢酶、木糖酸脱水酶、木糖转酮醇酶和/或木糖转醛醇酶。
本发明还包括上述糖分解酶基因的变体。变体可在编码区、非编码区或两者中包含改变。实例为包含产生沉默置换、添加或缺失但不改变编码的多肽的性质或活性的改变的多核苷酸变体。在某些实施方案中,核苷酸变体由因遗传密码的简并性而产生的沉默置换产生。在其它实施方案中,可因多种原因(例如针对特定宿主优化密码子表达)产生内切葡聚糖酶、葡糖苷酶、纤维二糖水解酶、木聚糖酶、葡聚糖酶、木糖苷酶、木聚糖酯酶、阿拉伯呋喃糖酶、半乳糖苷酶、纤维二糖磷酸化酶、纤维糊精磷酸化酶、甘露聚糖酶、甘露糖苷酶、木糖葡聚糖酶、内切木聚糖酶、葡糖醛酸糖苷酶、乙酰基木聚糖酯酶、阿拉伯呋喃糖基水解酶、膨胀因子、葡糖苷酸酯酶、棒曲霉素、果胶酶、阿魏酸酯酶、α-淀粉酶、β-淀粉酶、葡糖淀粉酶、支链淀粉酶、异支链淀粉酶、α-葡糖苷酶、β-葡糖苷酶、半乳糖苷酶、阿拉伯糖酶、阿拉伯木聚糖酶、阿拉伯糖苷酶、阿拉伯呋喃糖酶、阿拉伯木聚糖酶、阿拉伯糖苷酶、阿拉伯呋喃糖酶、阿拉伯糖异构酶、核酮糖-5-硫酸4-差向异构酶、木糖异构酶、木酮糖激酶、木糖还原酶、木酮脱氢酶、木糖醇脱氢酶、木糖酸脱水酶、木糖转酮醇酶和木糖转醛醇酶多核苷酸变体。本发明的密码子优化的多核苷酸在下文中进行进一步论述。
本发明还包括编码融合蛋白的分离的多核苷酸。在某些实施方案中,编码融合蛋白的核酸包括第一多核苷酸,其编码本文中和CBD(如上文中所描述的)中公开的内切葡聚糖酶、葡糖苷酶、纤维二糖水解酶、木聚糖酶、葡聚糖酶、木糖苷酶、木聚糖酯酶、阿拉伯呋喃糖酶、半乳糖苷酶、纤维二糖磷酸化酶、纤维糊精磷酸化酶、甘露聚糖酶、甘露糖苷酶、木糖葡聚糖酶、内切木聚糖酶、葡糖醛酸糖苷酶、乙酰基木聚糖酯酶、阿拉伯呋喃糖基水解酶、膨胀因子、葡糖苷酸酯酶、棒曲霉素、果胶酶、阿魏酸酯酶、α-淀粉酶、β-淀粉酶、葡糖淀粉酶、支链淀粉酶、异支链淀粉酶、α-葡糖苷酶、β-葡糖苷酶、半乳糖苷酶、阿拉伯糖酶、阿拉伯木聚糖酶、阿拉伯糖苷酶、阿拉伯呋喃糖酶、阿拉伯木聚糖酶、阿拉伯糖苷酶和阿拉伯呋喃糖酶、阿拉伯糖异构酶、核酮糖-5-硫酸4-差向异构酶、木糖异构酶、木酮糖激酶、木糖还原酶、木酮脱氢酶、木糖醇脱氢酶、木糖酸脱水酶、木糖转酮醇酶和木糖转醛醇酶。
在其它实施方案中,第一和第二多核苷酸方向相同,或第二多肽与第一多肽的方向相反。在另外的实施方案中,第一多肽编码位于由第二多核苷酸编码的多肽的N末端或C末端的多肽。在某些其它实施方案中,第一多核苷酸和/或第二多核苷酸由密码子优化的多核苷酸,例如针对酿酒酵母、克鲁维酵母或酿酒酵母和克鲁维酵母密码子优化的多核苷酸编码。
本发明中还提供了等位基因变体、直系同源物和/或物种同源物。本领域已知的方法可用于使用来自本文中公开的序列或由ATCC保藏的或另外地公共可获得的克隆的信息获得相应于SEQ ID NO:1-218的任意项或SEQ ID NO:437-441的任意项的基因的全长基因、等位基因变体、剪接变体、全长编码部分、直系同源物和/或物种同源物。例如,可通过从本文中提供的序列制备适当的探针或引物并且筛选等位基因变体和/或期望的同源物的适当的核酸来源来分离和鉴定等位基因变体和/或物种同源物。
关于具有与本发明的参照核苷酸序列具有至少例如95%的“同一性”的核苷酸序列的核酸是指,核酸的核苷酸序列与参照序列相同,只不过对于编码特定多肽的参照核苷酸序列的每100个核苷酸,该核苷酸序列可包括多达5个点突变。换而言之,为了获得具有与参照核苷酸序列具有至少95%的同一性的核苷酸序列的核酸,可将参照序列中多达5%的核苷酸缺失或置换为另一种核苷酸或者,可将多达参照序列的总核苷酸的5%的多个核苷酸插入该参照序列。查询序列可以是SEQ ID NO:1-218的任意项或SEQ ID NO:437-441的任意项的显示的完整序列或如本文中所述指定的任何片段或结构域。
作为一个实际问题,可使用已知的计算机程序常规地确定任何特定核酸分子或多肽是否与本发明的核苷酸序列或多肽具有至少80%、85%、90%、95%、96%、97%、98%、99%或100%的同一性。用于测定查询序列(本发明的序列)与目标序列之间的最佳总体匹配的方法,也称为全局序列比对,可使用基于Brutlag等人(Comp.App.Biosci.(1990)6:237-245.)的算法的FASTDB计算机程序来确定。在序列比对中,查询与目标序列都为DNA序列。RNA序列可通过将U转换成T来进行比较。所述全局序列比对的结果以百分比同一性来表示。计算百分比同一性的DNA序列的FASTDB算法中使用的优选参数为:矩阵=Unitary,k-tuple=4,错配罚分=1,连接罚分(Joining Penalty)=30,随机化组长度(Randomization Group Length)=0,截断评分(Cutoff Score)=1,空隙罚分(Gap Penalty)=5,空隙大小罚分(Gap Size Penalty)0.05,窗口大小(Window Size)=500或目标核苷酸的长度,以较短者为准。
如果由于5’或3’缺失而非由于内部缺失而导致目标序列比查询序列短,则必须对结果进行手工校正。这是因为当计算百分比同一性时,FASTDB程序不负责目标序列的5’和3’的截短。对于在5’或3’末端相对于查询序列被截短的目标序列,通过计算未匹配的/比对的查询序列的碱基数目(其为目标序列的5’和3’)占查询序列的总碱基数的百分比来校正百分比同一性。核苷酸是否匹配/比对是通过FASTDB序列比对的结果来确定的。然后从使用指定参数从上述FASTDB程序计算而来的百分比同一性中减去该百分比,以获得最终的百分比同一性评分。该校正后的评分用于本发明的目的。为了人工调整百分比同一性评分,只计算那些在目标序列的5’和3’碱基之外的碱基,如FASTDB比对所显示,它们不与查询序列匹配/比对。
例如,90个碱基的目标序列与100个碱基的查询序列进行比对以计算百分比同一性。缺失发生在目标序列的5’末端,因此,FASTDB比对不显示5’末端的前10个碱基的匹配/比对。10个未配对的碱基代表10%的序列(不匹配的5’和3’末端的碱基数目/查询序列的碱基总数目),因此,从FASTDB程序计算而来的百分比同一性分数中减去10%。如果剩下的90个碱基完全匹配,则最终的百分比同一性为90%。在另一个实例中,90个碱基的目标序列与100个碱基的查询序列进行比较。这次缺失是内部缺失,因此不存在不与查询序列匹配/比对的位于目标序列的5’或3’的碱基。在该情况下,FASTDB程序计算的百分比同一性不进行人工校正。再次说明:只有那些不与查询序列匹配/比对的位于目标序列的5’和3’的碱基进行人工校正。为了本发明的目的不进行其它人工校正。
本发明的一些实施方案包括包含SEQ ID NO:1-218的任意项或SEQ ID NO:437-441的任意项的至少10、20、30、35、40、50、60、70、80、90、100、200、300、400、500、600、700或800个连续核苷酸或更多个核苷酸的核酸分子或其结构域、片段、变体或衍生物。
本发明的多核苷酸可以以RNA的形式或以DNA的形式存在,所述DNA包括cDNA、基因组DNA和合成DNA。DNA可以是双链的或单链的,并且如果是单链,可以是编码链或非编码(反义)链。编码成熟多肽的编码序列可以与编码SEQ ID NO:219-436或SEQ ID NO:442-446的编码序列相同或可以是不同的编码序列,所述编码序列由于遗传密码子的冗余或简并性的缘故而编码与SEQ ID NO:1-218的任一项或SEQ IDNO:437-441的任一项的核酸序列相同的成熟多肽。
在某些实施方案中,本发明提供了分离的多核苷酸,其包含编码SEQ ID NO:219-436或SEQ ID NO:442-446的至少10个、至少20个、至少30个、至少40个、至少50个、至少60个、至少70个、至少80个、至少90个、至少95个或至少100个或更多个连续氨基酸的核酸片段。
编码包含SEQ ID NO:219-436或SEQ ID NO:442-446的成熟多肽的多核苷酸可包括:仅有成熟多肽的编码序列;成熟多肽的任意结构域的编码序列;和成熟多肽的编码序列(或结构域编码序列)以及非编码序列,例如内含子或成熟多肽的编码序列的5'和/或3'的非编码序列。
因此,术语“编码多肽的多核苷酸”包括:仅包括编码多肽的序列的多核苷酸以及包括另外的编码和/或非编码序列的多核苷酸
在本发明的其它方面,含有与本文中公开的核酸序列具有至少约90%、95%、96%、97%、98%或99%的同一性的序列的核酸分子编码具有如下蛋白质的功能活性的多肽:内切葡聚糖酶、葡糖苷酶、纤维二糖水解酶、木聚糖酶、葡聚糖酶、木糖苷酶、木聚糖酯酶、阿拉伯呋喃糖酶、半乳糖苷酶、纤维二糖磷酸化酶、纤维糊精磷酸化酶、甘露聚糖酶、甘露糖苷酶、木糖葡聚糖酶、内切木聚糖酶、葡糖醛酸糖苷酶、乙酰基木聚糖酯酶、阿拉伯呋喃糖基水解酶、膨胀因子、葡糖苷酸酯酶、棒曲霉素、果胶酶、阿魏酸酯酶、α-淀粉酶、β-淀粉酶、葡糖淀粉酶、支链淀粉酶、异支链淀粉酶、α-葡糖苷酶、β-葡糖苷酶、半乳糖苷酶、阿拉伯糖酶、阿拉伯木聚糖酶、阿拉伯糖苷酶、阿拉伯呋喃糖酶、阿拉伯木聚糖酶、阿拉伯糖苷酶、阿拉伯糖异构酶、核酮糖-5-硫酸4-差向异构酶、木糖异构酶、木酮糖激酶、木糖还原酶、木酮脱氢酶、木糖醇脱氢酶、木糖酸脱水酶、木糖转酮醇酶和木糖转醛醇酶。
当然,由于遗传密码的简并性,本领域技术人员将会立即认识到很大部分的具有与SEQ ID NO:1-218的任意项或SEQ ID NO:437-441的任意项的核酸序列具有至少约90%、95%、96%、97%、98%或99%的同一性的序列或其片段的核酸分子将编码具有功能活性的多肽。事实上,由于这些多核苷酸序列的任意项的简并变体都编码相同的多肽,因此,在许多情况下,本领域技术人员即使不进行上述比较测定也将会完全了解这一点。在本领域中还将认识到,对于那些不是简并变体的核酸分子,也会有合理的数量编码具有功能活性的多肽。
本发明的多核苷酸还包含融合于编码允许检测本发明的多核苷酸的标记序列的多核苷酸的编码如下蛋白质或或其结构域、片段、变体或衍生物的核酸:内切葡聚糖酶,葡糖苷酶,纤维二糖水解酶,木聚糖酶,葡聚糖酶,木糖苷酶,木聚糖酯酶,阿拉伯呋喃糖酶,半乳糖苷酶,纤维二糖磷酸化酶,纤维糊精磷酸化酶,甘露聚糖酶,甘露糖苷酶,木糖葡聚糖酶,内切木聚糖酶,葡糖醛酸糖苷酶,乙酰基木聚糖酯酶,阿拉伯呋喃糖基水解酶,膨胀因子,葡糖苷酸酯酶,棒曲霉素,果胶酶,阿魏酸酯酶,α-淀粉酶,β-淀粉酶,葡糖淀粉酶,支链淀粉酶,异支链淀粉酶,α-葡糖苷酶,β-葡糖苷酶,半乳糖苷酶,阿拉伯糖酶,阿拉伯木聚糖酶,阿拉伯糖苷酶,阿拉伯呋喃糖酶,阿拉伯木聚糖酶,阿拉伯糖苷酶,阿拉伯糖异构酶,核酮糖-5-硫酸4-差向异构酶,木糖异构酶,木酮糖激酶,木糖还原酶,木酮脱氢酶,木糖醇脱氢酶,木糖酸脱水酶,木糖转酮醇酶和木糖转醛醇酶。在本发明的一个实施方案中,标记的表达不依赖于糖分解酶的表达。标记序列可以是选自URA3、HIS3、LEU2、TRP1、LYS2、ADE2或本领域已知的任何其它适当的可选择的标记的酵母选择标记。Casey,G.P.等人,"A convenient dominant selection marker for gene transfer inindustrial strains of Saccharomyces yeast:SMR1 encoded resistance tothe herbicide sulfometuron methyl,"J.Inst.Brew.94:93-97(1988)。
密码子优化的多核苷酸
根据本发明的一个实施方案,编码异源糖分解酶的多核苷酸可进行密码子优化。如本文中所用,术语“密码子优化的编码区”是指:通过将至少一个或一个以上或许多个密码子替换为生物体的基因中更常使用的一个或多个密码子,而使核酸适应在该给定的生物的细胞表达。
一般而言,生物中高度表达的基因偏向于被该生物中最丰富的tRNA种类所识别的密码子。这种偏向的一种度量是“密码子适应指数”或“CAI”,其测定的是,在何种程度上,用于编码特定基因中的每一个氨基酸的密码子是在来自该生物的高度表达的基因的参照组中最常使用的密码子。
本发明的密码子优化的序列的CAI可以为约0.8至1.0,约0.8至0.9或约1.0。密码子优化的序列可以进一步被修饰以在特定生物中表达,这取决于该生物的生物学限制性。例如,可将大量的“A”或“T”的串(例如,超过4,5,6,7,8,9或10个连续碱基的串)从序列除去,如果已知这些串影响不利地影响转录。此外,可以为了分子克隆的目的除去特定的限制性酶位点。此类限制性酶位点的实例包括PacI、AscI、BamHI、BglII、EcoRI和XhoI。此外,可以检查DNA序列中的长度为10个碱基或更长的正向重复、反向重复和镜像重复序列,可通过将密码子替换为“第二最佳”密码子(即,在特定生物(针对该生物进行序列的优化)中以第二高的频率使用的密码子)来人工修饰所述正向重复、反向重复和镜像重复序列。
包含编码任何多肽链的氨基酸的密码子的核苷酸序列中的差异允许编码基因的序列的变异。由于每一个密码子由3个核苷酸组成,并且构成DNA的核苷酸限定在4种特定的碱基,因此存在64种可能的核苷酸组合,其中61种编码氨基酸(其余3种密码子编码终止翻译的信号)。本文表1中提供了“遗传密码”,其显示哪种密码子编码哪种氨基酸。结果是,许多氨基酸被不止一种密码子代表。例如,氨基酸丙氨酸和脯氨酸被4种三元组所编码,丝所和精氨酸被6种三元组编码,而色氨酸和甲硫氨酸仅由1种三元组编码。这种简并性允许DNA碱基组成在很大范围内变化,但不改变DNA所编码的蛋白质的氨基酸序列。
表1:标准遗传密码
许多生物显示出对于编码插入至生长中的肽链中的特定氨基酸的特定密码子的使用偏向。不同生物之间的密码子优选性或密码子偏向、密码子使用的差异受到遗传密码的简并性的影响,并且许多生物中有完善的记载。密码子偏向通常与信使RNA(mRNA)的翻译效率有关,信使RNA的翻译效率又被认为尤其依赖于被翻译的密码子的特性以及特定的转运RNA(tRNA)分子的可利用性。细胞中所选的tRNA的主导性通常是肽合成中最常使用的密码子的反映。因此,可以基于密码子优化调整基因以便在给定的生物中进行优化的基因表达。
鉴于对于多种动物、植物和微生物物种可以获得大量的基因序列,因此可以计算出密码子使用的相对频率。密码子使用表是可容易地获得的,例如http://phenotype.biosci.umbc.edu/codon/sgd/index.php(2008年5月7日访问)或http://www.kazusa.or.jp/codon/(2008年3月20日访问),并且这些表格可以按多种方式进行改编。参见Nakamura,Y.,等人,"Codon usage tabulated from the international DNA sequence databases:status for the year 2000,"Nucl.Acids Res.28:292(2000)。下文表2提供了酵母的密码子使用表格,其是从GenBank Release 128.0[15 February2002]计算而来的。该表达使用的是mRNA命名法,因此表格使用的是在RNA中发现的尿嘧啶(U)而非在DNA中发现的胸腺嘧啶(T)。该表格进行了改编,因此频率的计算是针对每一种氨基酸,而非针对所有64种密码子。
表2:酿酒酵母基因的密码子使用表
通过使用该表格或类似表格,本领域技术人员可以将频率应用于任何给定的多肽序列,并且产生密码子优化的编码区的核酸片段,其编码多肽,但其使用对于给定的物种而言的优化的密码子。可以通过多种不同的方法设计密码子优化的编码区。
在一种方法中,密码子使用表用于发现用于任何给定的氨基酸序列的单一的使用频率最高的密码子,并且在该特定氨基酸出现在多肽序列中时,每次都使用该密码子。例如,参见上文表2,对于亮氨酸而言,频率最高的密码子是UUG,其使用频率是27.2%。因此,按照该方法,给定的氨基酸序列中所有的亮氨酸残基都分配UUG密码子。
在另一种方法中,密码子的实际频率在整个编码序列上随机分布。因此,通过使用该法进行优化时,如果假定的多肽序列具有100个亮氨酸残基,则参照表2中酿酒酵母中的使用频率,约5个或5%的亮氨酸密码子将是CUC,约11个或11%的亮氨酸密码子将是约CUG,约12个或12%的亮氨酸密码子将是CUU,约13个或13%的亮氨酸密码子将是CUA,约26个或26%的亮氨酸密码子将是UUA,并且约27或27%的亮氨酸密码子将是UUG。
这些频率在编码假设的多肽的编码区中的所有亮氨酸密码子中随机分布。如本领域技术人员将理解的,使用该方法时序列中密码子的分布可以有很大变化;然而,序列总是编码相同的多肽。
当使用上述方法时,术语“约”用于精确说明给定的氨基酸的密码子频率的百分数。如本文中所使用的,“约”定义为比给定数值多1个氨基酸或少1个氨基酸。如果使用频率分数大于或等于0.50,则将氨基酸的整数数值五入;如果使用频率分数小于或等于0.49,则将其四舍。再次以人基因组中亮氨酸的使用频率为例,假设一个多肽具有62个亮氨酸残基,则这样计算密码子使用的频率分数:62乘以每种密码子的频率。因此,62的7.28%等于4.51个UUA密码子,或“约5”,即4、5或6个UUA密码子,62的12.66%等于7.85个UUA密码子,或“约8”,即7、8或9个UUG密码子,62的12.87%等于7.98个CUU密码子,或“约8”,即7、8或9个CUU密码子,62的19.56%等于12.13个CUC密码子,或“约12”,即11、12或13个CUC密码子,62的7.00%等于4.34个CUA密码子,或“约4”,即3、4或5个CUA密码子,以及62的40.62%等于25.19个CUG密码子,或“约25”,即24、25或26个CUG密码子。
可以通过计算每一种氨基酸的密码子频率,然后向多肽序列随机分配密码子,人工地以优化的频率随机分配密码子以编码给定的多肽序列。另外,本领域技术人员可以容易地获得多种算法和计算机软件程序。例如,Lasergene Package中的“EditSeq”函数,其可以从DNAstar,Inc.,Madison,WI获得,VectorNTI Suite中的backtranslation函数,其可从InforMax,Inc.,Bethesda,MD获得,以及GCG--Wisconsin Package中的"backtranslate"函数,其可从Accelrys,Inc.,San Diego,CA获得。此外,公众可获得多种资源以进行编码区序列的密码子优化,例如http://www.entelechon.com/2008/10/backtranslation-tool/(2010年5月30日访问)的"backtranslation"函数。本领域技术人员还可通过基本的数学函数轻易地实现构建初步算法以基于给定的频率分配密码子。
使用本领域技术人员熟知的标准和常规的分子生物学操作,可以获得多种选择以合成通过上文描述的任意方法设计的密码子优化的编码区。在一种方法中,通过标准方法合成一系列互补的寡核苷酸对,每个长度为80-90个核苷酸并且跨越想要的序列的长度。合成这些寡核苷酸对,从而实现在退火之后,它们形成80-90个碱基对的双链片段,其包含粘末端,例如,将所述对中的每个寡核苷酸合成为延伸超出与对中的另一寡核苷酸互补的区域3、4、5、6、7、8、9、10或更多个碱基。每对寡核苷酸的单链末端设计为与另一对寡核苷酸的单链末端退火。使寡核苷酸对退火,然后使大约5至6个这些双链片段通过粘性单链末端退火在一起,然后将它们连接在一起并克隆进入标准的细菌克隆载体,例如可以从Invitrogen Corporation,Carlsbad,CA获得的
载体。然后通过标准方法对构建体进行测序。几种这样的构建体(由5至6个80-90个碱基对片段的片段组成)连接在一起,即制备大约500个碱基对的片段,从而在一系列质粒构建体中代表完整的想要的序列。然后使用合适的限制性酶切割这些质粒的插入子,并连接在一起以形成最终的构建体。然后将最终的构建体克隆进入标准的细菌克隆载体并且测序。另外的方法对于本领域技术人员来说是完全显而易见的。此外,基因合成可以容易地从商业途径获得。
在某些实施方案中,通过本文描述的任何方法进行完整多肽序列或其片段、变体或衍生物的密码子优化。设计多种想要的片段、变体或衍生物,随后对每个单独进行密码子优化。此外,可以设计并构建本发明的部分密码子优化的编码区。例如,本发明包括编码多肽的密码子优化的编码区的核酸片段,其中至少约1%、2%、3%、4%、5%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%或100%的密码子位置针对给定的物种进行了密码子优化。也就是说,它们包含在想要的物种(例如酵母物种,例如酿酒酵母或克鲁维酵母)的基因中优选使用的密码子,以替换在天然核酸序列中通常使用的密码子。
在另外的实施方案中,将全长多肽序列针对给定的物种进行密码子优化,产生编码整个多肽的密码子优化的编码区,随后,从原始的密码子优化的编码区制备密码子优化的编码区的核酸片段,其编码多肽的片段、变体和衍生物。本领域技术人员熟知的是,如果基于密码子在给定的物种中的使用频率为全长编码区随机分配密码子,则编码片段、变体和衍生物的核酸片段将不一定是针对给定的物种完全密码子优化的。然而,与密码子使用相比较,此类序列与想要的物种的密码子使用的接近程度仍然要高得多。该方法的有利方面在于,合成编码给定的多肽的每一个片段、变体和衍生物的密码子优化的核酸片段虽然是常规操作,但是是耗时的,并且花费巨大。
密码子优化的编码区可以例如是编码如下本文中提供的蛋白质或其结构域、片段、变体或衍生物的形式:内切葡聚糖酶、葡糖苷酶、纤维二糖水解酶、木聚糖酶、葡聚糖酶、木糖苷酶、木聚糖酯酶、阿拉伯呋喃糖酶、半乳糖苷酶、纤维二糖磷酸化酶、纤维糊精磷酸化酶、甘露聚糖酶、甘露糖苷酶、木糖葡聚糖酶、内切木聚糖酶、葡糖醛酸糖苷酶、乙酰基木聚糖酯酶、阿拉伯呋喃糖基水解酶、膨胀因子、葡糖苷酸酯酶、棒曲霉素、果胶酶、阿魏酸酯酶、α-淀粉酶、β-淀粉酶、葡糖淀粉酶、支链淀粉酶、异支链淀粉酶、α-葡糖苷酶、β-葡糖苷酶、半乳糖苷酶、阿拉伯糖酶、阿拉伯木聚糖酶、阿拉伯糖苷酶、阿拉伯呋喃糖酶、阿拉伯木聚糖酶、阿拉伯糖苷酶和阿拉伯呋喃糖酶、阿拉伯糖异构酶、核酮糖-5-硫酸4-差向异构酶、木糖异构酶、木酮糖激酶、木糖还原酶、木酮脱氢酶、木糖醇脱氢酶、木糖酸脱水酶、木糖转酮醇酶和/或木糖转醛醇酶。
通过本文描述的方法针对特定物种进行密码子优化。例如,在某些实施方案中,编码本申请中公开的多肽或其结构域、片段、变体或衍生物的密码子优化的编码区是根据酵母(例如,酿酒酵母,乳酸克鲁维酵母和/或马克斯克鲁维酵母)的密码子使用进行优化的。还提供了包含编码本文中公开的多肽或其结构域、片段、变体或衍生物的密码子优化的编码区的多核苷酸、载体和其它表达构建体,以及使用此类多核苷酸、载体和其它表达构建体的多种方法。
在本文中描述的某些实施方案中,根据酵母(例如酿酒酵母、乳酸克鲁维酵母或马克斯克鲁维酵母)中的密码子使用优化编码SEQ ID NO:219-436的任意项或SEQ ID NO:442-446的任意项或其结构域、片段、变体或衍生物的密码子优化的编码区。在一些实施方案中,特别地针对酿酒酵母中的表达对序列进行密码子优化。或者,可根据任意植物、动物或微生物物种中的密码子使用优化编码SEQ ID NO:219-436的任意项或SEQ ID NO:442-446的任意项的密码子优化的编码区。
载体和在宿主细胞中使用载体的方法
在另一个方面,本发明涉及包括本发明的多核苷酸的载体、通常利用本发明的载体进行了遗传工程的宿主细胞以及通过重组技术进行的本发明的多肽的产生。
宿主细胞经过以本发明的载体进行的遗传工程化(转导或转化或转染),所述载体可以是例如克隆载体或表达载体。载体可以例如以质粒、病毒颗粒、噬菌体等的形式存在。可将工程化宿主细胞培养在经修饰的常规营养培养基中,视情况而定以激活启动子,选择转化株或扩增本发明的基因。培养条件例如温度、pH等为先前对于被选择用于表达的宿主细胞所使用的条件,并且对于本领域技术人员来说是显然的。
本发明的多核苷酸可以用于通过重组技术产生多肽。因此,例如,多核苷酸可以包含于多种用于表达多肽的表达载体中的任一种之中。此类载体包括染色体、非染色体和合成DNA序列,例如SV40的衍生物;细菌质粒;和酵母质粒。然而,可使用任何其它载体,只要其在宿主细胞中能够复制并且能存活即可。
可通过多种方法将适当的DNA序列插入载体。一般而言,利用本领域已知的方法将DNA序列插入适当的限制性内切核酸酶位。此类方法和其它方法被认为在本领域技术人员的能力范围内。
表达载体中的DNA序列与用于指导mRNA合成的适当的表达控制序列(启动子)有效连接。此类启动子的代表性实例如下:
基因 |
生物 |
系统名称 |
使用原因/益处 |
PGK1 |
酿酒酵母 |
YCR012W |
强组成型启动子 |
ENO1 |
酿酒酵母 |
YGR254W |
强组成型启动子 |
TDH3 |
酿酒酵母 |
YGR192C |
强组成型启动子 |
TDH2 |
酿酒酵母 |
YJR009C |
强组成型启动子 |
TDH1 |
酿酒酵母 |
YJL052W |
强组成型启动子 |
ENO2 |
酿酒酵母 |
YHR174W |
强组成型启动子 |
GPM1 |
酿酒酵母 |
YKL152C |
强组成型启动子 |
TPI1 |
酿酒酵母 |
YDR050C |
强组成型启动子 |
此外,来自压力和饥饿响应基因的启动子序列可用于本发明。在一些实施方案中,可使用来自酿酒酵母基因GAC1、GET3、GLC7、GSH1、GSH2、HSF1、HSP12、LCB5、LRE1、LSP1、NBP2、PDC1、PIL1、PIM1、SGT2、SLG1、WHI2、WSC2、WSC3、WSC4、YAP1、YDC1、HSP104、HSP26、ENA1、MSN2、MSN4、SIP2、SIP4、SIP5、DPL1、IRS4、KOG1、PEP4、HAP4、PRB1、TAX4、ZPR1、ATG1、ATG2、ATG10、ATG11、ATG12、ATG13、ATG14、ATG15、ATG16、ATG17、ATG18和ATG19的启动子区域。可使用驱动在本发明的宿主细胞中的基因表达的任意合适的启动子。此外,可使用大肠杆菌lac或trp以及已知控制原核或低等真核细胞中的基因表达的其它启动子。
此外,表达载体可包含一个或多个可选择的标记基因,以提供用于选择转化的宿主细胞的表型特征,例如用于真核细胞培养物的URA3、HIS3、LEU2、TRP1、LYS2或ADE2、二氢叶酸还原酶、新霉素(G418)抗性或zeocin抗性,或大肠杆菌中的四环素或氨苄青霉素抗性。
表达载体还可包含用于转录起始和/或转录终止子的核糖体结合位点。载体还可包括用于扩增表达的适当的序列或可包括其它调控区。
可将包含本文中公开的适当的DNA序列以及适当的启动子或控制序列的载体用于转化适当的宿主以允许宿主表达蛋白质。
因此,在某些方面,本发明涉及包含上述构建体的宿主细胞。宿主细胞可以为本申请的其它地方描述的宿主细胞。宿主细胞可以例如为低等真核细胞例如酵母细胞例如酿酒酵母或克鲁维酵母属酵母,或宿主细胞可以是原核细胞,例如细菌细胞。
作为适当的宿主的代表性实例,可包括:细菌细胞,例如大肠杆菌、链霉菌(Streptomyces)、鼠伤寒沙门菌(Salmonella typhimurium);嗜热或嗜温细菌;真菌细胞,例如酵母;和植物细胞等。适当的宿主的选择被认为是在本领域技术人员根据本文教导的能力范围之内。
适当的真菌宿主包括酵母。在本发明的某些方面,酵母选自酿酒酵母、乳酸克鲁维酵母、粟酒裂殖酵母、白色假丝酵母、巴斯德毕赤酵母、树干毕赤酵母、解脂耶氏酵母、多形汉逊酵母、红发夫酵母、产朊假丝酵母、Arxula adeninivorans、汉逊德巴利酵母、多形德巴利酵母菌、东方许旺酵母、东方伊萨酵母、马克斯克鲁维酵母(Kluyveromycesmarxianus)、布拉霉属(Blakeslea)、念珠菌属(Candida)、隐球菌属(Cryptococcus)、小克银汉霉属、油脂酵母属、被孢霉属、毛霉属、Phycomces、腐霉菌属、红冬孢酵母属(Rhodosporidium)、红酵母属、毛孢子菌属和子囊菌酵母属。
使用宿主细胞产生乙醇或其它发酵产物的方法
在另一个方面,本发明涉及使用宿主细胞和共培养物从包含淀粉、木质纤维素物质、己糖和戊糖的生物质原料产生乙醇或其它产物的用途。此类方法可以例如通过将生物质原料与本发明的宿主细胞或共培养物接触来实现。发酵产物包括但不限于产物例如丁醇、乙酸、氨基酸和维生素。
可按照本发明使用许多生物质原料。基于它们在水中的溶解性可将用于糖分解酶活性测定的底物分成两类,可溶性的和不溶性的。可溶性底物包括α-糊精、纤维糊精或衍生物、羧甲基纤维素(CMC)或羟乙基纤维素(HEC)。不溶性底物包括不溶性淀粉、晶体纤维素、微晶纤维素(微晶粉末纤维素)、无定形纤维素例如磷酸膨胀纤维素(PASC)、染色或荧光纤维素以及木质纤维素生物质。此类底物通常是高度有序的纤维质材料,从而仅仅是微溶的。
应理解,适当的木质纤维素材料可以是包含可溶性和/或不溶性纤维素的任何原料,其中不溶性纤维素可以以晶体或非晶体形式存在。在不同的实施方案中,木质纤维素生物质包括例如木材、玉米、玉米桔杆、锯屑、树皮、树叶、农业和林业的残留物、草例如柳枝稷、反刍动物消化产物、市政废弃物、造纸厂污水、报纸、纸板或其组合。
在一些实施方案中,本发明涉及用于通过将生物质原料与本发明的宿主细胞接触来水解生物质原料例如上述生物质原料的方法。在一些实施方案中,本发明涉及用于通过将原料与包含表达异源糖分解酶的酵母细胞的共培养物接触来水解生物质原料例如上述生物质原料的方法。
在本发明的一些实施方案中,将外部糖分解酶添加至发酵培养基的必需性减小,因为本发明的细胞表达本发明的多肽。
在一些实施方案中,本发明涉及用于发酵生物质原料的方法。此类方法可以例如通过在包含不溶性生物质原料的培养基中培养宿主细胞或共培养物,以允许生物质原料的糖化和发酵。
除了本发明的酶外,在一些实施方案中,本发明的宿主细胞可以具有另外的遗传修饰来使它们更适合用于将生物质原料发酵成乙醇。例如,本发明的宿主细胞可表达木糖异构酶和/或阿拉伯糖异构酶以更高效率地使用戊糖进行发酵。在一些实施方案中,木糖异构酶来自Pyromyces物种。除了木糖异构酶以外,在一些实施方案中,本发明的宿主细胞可过表达与磷酸戊糖途径相关的基因。此类基因包括但不限于转酮醇酶和转醛醇酶基因。磷酸戊糖途径的组分对于本领域技术人员来说是已知的并且用于帮助将来源于戊糖的碳同化进入发酵过程。(参见,例如,WO03/062430、WO06/009434和US2006/0234364)。在一些实施方案中,宿主细胞能够使用木糖和其它戊糖例如阿拉伯糖,通过将来自戊糖的碳经磷酸戊糖途径整合进入发酵途径。木糖利用宿主细胞异源地表达木糖异构酶,例如Pyromyces sp.E2 XylA,过表达木酮糖激酶、核酮糖5-磷酸异构酶、核酮糖5-磷酸差向异构酶、转酮醇酶和转醛醇酶,并且不表达醛糖还原酶例如GRE3基因(编码醛糖还原酶)。
根据本发明,可在至少约25℃、约28℃、约30℃、约31℃、约32℃、约33℃、约34℃、约35℃、约36℃、约37℃、约38℃、约39℃、约40℃、约41℃、约42℃或约50℃的温度下进行乙醇的产生。在本发明的一些实施方案中,耐热宿主细胞可在高于约30℃、约31℃、约32℃、约33℃、约34℃、约35℃、约36℃、约37℃、约38℃、约39℃、约40℃、约41℃、约42℃或约50℃的温度下从纤维素产生乙醇。在本发明的一些实施方案中,耐热宿主细胞可在约30℃至60℃、约30℃至55℃、约30℃至50℃、约40℃至60℃、约40℃至55℃或约40℃至50℃的温度下从纤维素产生乙醇。
在一些实施方案中,产生乙醇的方法可包括将生物质原料与本发明的宿主细胞或共培养物接触,以另外地将生物质原料与外部产生的糖分解酶接触。示例性外部产生的糖分解酶可商购获得并且对于本领域技术人员来说是已知的,在下文中进一步举例说明。
因此,本发明还涉及减少从生物质原料产生给定量的乙醇所需的外部产生的糖分解酶的量的方法,包括将糖分解酶与外部产生的糖分解酶和与本发明的宿主细胞或共培养物接触。在一些实施方案中,可使用少至少约5%、10%、15%、20%、25%、30%或50%的外部产生的糖分解酶获得相同量的乙醇产量。
在一些实施方案中,方法包括以特定的速率产生乙醇。例如,在一些实施方案中,以至少约0.1mg/小时/升、至少约0.25mg/小时/升、至少约0.5mg/小时/升、至少约0.75mg/小时/升、至少约1.0mg/小时/升、至少约2.0mg/小时/升、至少约5.0mg/小时/升、至少约10mg/小时/升、至少约15mg/小时/升、至少约20.0mg/小时/升、至少约25mg/小时/升、至少约30mg/小时/升、至少约50mg/小时/升、至少约100mg/小时/升、至少约200mg/小时/升或至少约500mg/小时/升的速率产生乙醇。
在一些实施方案中,本发明的宿主细胞可以以比在相同条件下生长的对照菌株(不存在异源生物质原料水解酶)快至少约0.1mg/小时/升、至少约0.25mg/小时/升、至少约0.5mg/小时/升、至少约0.75mg/小时/升、至少约1.0mg/小时/升、至少约2.0mg/小时/升、至少约5.0mg/小时/升、至少约10mg/小时/升、至少约15mg/小时/升、至少约20.0mg/小时/升、至少约25mg/小时/升、至少约30mg/小时/升、至少约50mg/小时/升、至少约100mg/小时/升、至少约200mg/小时/升或至少约500mg/小时/升的速率产生乙醇。在一些实施方案中,可在任何外部添加的糖分解酶不存在的情况下产生乙醇。
可使用本领域已知的任何方法测量乙醇产量。例如,可使用HPLC分析估计发酵样品中的乙醇的量。许多使用例如基于醇氧化酶的测定的乙醇测定试剂盒是商购可得的。根据本文中的教导,测定乙醇产量的方法在本领域技术人员的能力范围之内。
糖分解酶的协同活性
在一些实施方案中,本发明的两种或更多种酶的表达导致在底物降解方面的协同酶促活性。例如,两种不同的包含相同酶促活性的旁系同源物或直系同源物的存在与相当量的任一种酶本身相比较可以显著增强底物的降解。或者,协同作用的酶不需要具有完全相同的化学活性,但仍然可以以比任一种酶单独能够产生的能力更大的能力操作释放糖。不希望受特定理论束缚,据认为虽然酶的催化活性可以相同,但对于围绕化学底物的区域酶的不同特征以及酶的其它不同特性质帮助降解不同的生物质原料组分。在一些实施方案中,酶促协同作用允许使用减少量的外部糖分解酶进行生物质原料的降解和发酵。在一些实施方案中,协同作用的两种或更多种酶为本文中公开的内切葡聚糖酶、葡糖苷酶、纤维二糖水解酶、木聚糖酶、葡聚糖酶、木糖苷酶、木聚糖酯酶、阿拉伯呋喃糖酶、半乳糖苷酶、纤维二糖磷酸化酶、纤维糊精磷酸化酶、甘露聚糖酶、甘露糖苷酶、木糖葡聚糖酶、内切木聚糖酶、葡糖醛酸糖苷酶、乙酰基木聚糖酯酶、阿拉伯呋喃糖基水解酶、膨胀因子、葡糖苷酸酯酶、棒曲霉素、果胶酶、阿魏酸酯酶、α-淀粉酶、β-淀粉酶、葡糖淀粉酶、支链淀粉酶、异支链淀粉酶、α-葡糖苷酶、β-葡糖苷酶、半乳糖苷酶、阿拉伯糖酶、阿拉伯木聚糖酶、阿拉伯糖苷酶、阿拉伯呋喃糖酶、阿拉伯木聚糖酶、阿拉伯糖苷酶、阿拉伯糖异构酶、核酮糖-5-硫酸4-差向异构酶、木糖异构酶、木酮糖激酶、木糖还原酶、木酮脱氢酶、木糖醇脱氢酶、木糖酸脱水酶、木糖转酮醇酶和/或木糖转醛醇酶。在一些实施方案中,协同作用的两种或更多种酶不具有相同酶促活性。在其它实施方案中,协同作用的两种或更多种酶具有相同的酶活性。在一些实施方案中,协同作用的酶对为(除虫链霉菌内切-1,4-β-葡聚糖酶celA2(登录号NP_823030.1)和除虫链霉菌内切-1,4-β-葡聚糖酶celA5(登录号NP_828072.1));(除虫链霉菌内切-1,4-β-葡聚糖酶celA2(登录号NP_823030.1)和枯草芽孢杆菌内切-1,4-β-葡聚糖酶(登录号CAB13696.2));(除虫链霉菌内切-1,4-β-葡聚糖酶celA3(登录号NP_823032.1)和除虫链霉菌内切-1,4-β-葡聚糖酶(登录号NP_826394.1));(除虫链霉菌内切-1,4-β-葡聚糖酶celA4(登录号NP_823744.1)和除虫链霉菌木聚糖酶(登录号NP_827548.1));(枯草芽孢杆菌内切-1,4-β-葡聚糖酶(登录号CAB13696.2)和除虫链霉菌内切-1,4-β-葡聚糖酶(登录号NP_826394.1));(除虫链霉菌内切-1,4-β-葡聚糖酶celA4(登录号NP_823744.1)和枯草芽孢杆菌内切-1,4-β-葡聚糖酶(登录号CAB13696.2));(除虫链霉菌内切-1,4-β-葡聚糖酶celA5(登录号NP_828072.1)和除虫链霉菌内切-1,4-β-葡聚糖酶celA4(登录号NP_823744.1));(除虫链霉菌内切-1,4-β-葡聚糖酶celA5(登录号NP_828072.1)和Clostridium phytofermentans木聚糖酶(登录号YP_001557750.1));(Saccharophagus degradans 2-40甘露聚糖酶(登录号YP_525985.1)和除虫链霉菌内切-1,4-β-葡聚糖酶(登录号NP_826394.1));(除虫链霉菌木聚糖酶(登录号NP_827548.1)和Saccharophagusdegradans 2-40甘露聚糖酶(登录号YP_525985.1));(Clostridiumphytofermentans木聚糖酶(登录号YP_001557750.1)和除虫链霉菌木聚糖酶(登录号NP_827548.1));(Clostridium phytofermentans木聚糖酶(登录号YP_001557750.1)和除虫链霉菌木聚糖酶(登录号NP_827548.1));(除虫链霉菌内切-1,4-β-葡聚糖酶celA5(登录号NP_828072.1)和除虫链霉菌木聚糖酶(登录号NP_827548.1));(除虫链霉菌内切-1,4-β-葡聚糖酶(登录号NP_823744.1)和Saccharophagus degradans 2-40甘露聚糖酶(登录号YP_525985.1));(除虫链霉菌内切-1,4-β-葡聚糖酶celA2(登录号NP_823030.1)和Saccharophagus degradans 2-40甘露聚糖酶(登录号YP_525985.1));(除虫链霉菌内切-1,4-β-葡聚糖酶(登录号NP_823744.1)和除虫链霉菌内切-1,4-β-葡聚糖酶celA3(登录号NP_823032.1));(除虫链霉菌内切-1,4-β-葡聚糖酶(登录号NP_823744.1)和Clostridiumphytofermentans木聚糖酶(登录号YP_001557750.1));(除虫链霉菌木聚糖酶(登录号NP_827548.1)和除虫链霉菌内切-1,4-β-葡聚糖酶celA3(登录号NP_823032.1));或(除虫链霉菌内切-1,4-β-葡聚糖酶celA4(登录号NP_823744.1)和除虫链霉菌内切-1,4-β-葡聚糖酶(登录号NP_826394.1));(SEQ ID NO:443和SEQ ID NO:444);(SEQ ID NO:443和SEQ ID NO:445);(SEQ ID NO:445和SEQ ID NO:446);(SEQID NO:443和SEQ ID NO:445);(SEQ ID NO:442和SEQ ID NO:445);(SEQ ID NO:444和枯草芽孢杆菌阿拉伯木聚糖酶(登录号CAB13699.1));(SEQ ID NO:444和枯草芽孢杆菌阿拉伯木聚糖酶(登录号CAB13699.1));(SEQ ID NO:444和枯草芽孢杆菌阿拉伯聚糖内切-1,5-α-L-阿拉伯糖苷酶(登录号CAB15969.1));(SEQ ID NO:444和枯草芽孢杆菌阿拉伯聚糖-内切1,5-α-L-阿拉伯糖酶(登录号CAA99586.1));(SEQ ID NO:444和枯草芽孢杆菌阿拉伯聚糖内切-1,5-α-L-阿拉伯糖苷酶(登录号AL009126));(SEQ ID NO:444和枯草芽孢杆菌内切-阿拉伯糖酶(登录号 D85132));(SEQ ID NO:444和Clostridiumphytofermentans阿拉伯半乳聚糖内切-1,4-β-半乳糖苷酶(登录号CP000885));(SEQ ID NO:444和地衣芽孢杆菌阿拉伯聚糖-内切1,5-α-L-阿拉伯糖酶(登录号AAU40201.1);(SEQ ID NO:444和地衣芽孢杆菌阿拉伯聚糖-内切1,5-α-L-阿拉伯糖酶(登录号AAU41895.1);(SEQ ID NO:444和地衣芽孢杆菌阿拉伯半乳聚糖内切-1,4-β-半乳糖苷酶(登录号AAU43089.1);(SEQ ID NO:444和地衣芽孢杆菌阿拉伯聚糖内切-1,5-α-L-阿拉伯糖苷酶(登录号AAU43033.1);(SEQ ID NO:444和地衣芽孢杆菌阿拉伯聚糖内切-1,4-β-木聚糖酶(登录号AAU39947.1);(SEQ ID NO:444和解糖热厌氧杆菌阿拉伯半乳聚糖内切-1,4-β-半乳糖苷酶;(SEQ ID NO:444和解糖热厌氧杆菌α-N-阿拉伯呋喃糖酶);(SEQ ID NO:444和除虫链霉菌内切-1,4-β-木聚糖酶xynD(登录号827557.1);(SEQ ID NO:444和枯草芽孢杆菌内切-1,4-β-木聚糖酶xynA(登录号CAB13776.1);(SEQ ID NO:444和Clostridiumphytofermentans木聚糖酶(登录号YP_001558623.1);(SEQ ID NO:444和Clostridium phytofermentans木聚糖酶(登录号YP_001557750.1);(SEQ ID NO:444和嗜热裂孢菌内切-1,4-β-D-木聚糖酶(xyl11)(登录号AAV64879.1);(SEQ ID NO:444和热纤梭菌木聚糖酶(登录号YP_001038519.1);(SEQ ID NO:444和耐热梭状芽孢杆菌内切-木聚糖酶(登录号CAD48307);(SEQ ID NO:444和耐热梭状芽孢杆菌xynC(CelX-cello木聚糖酶)(登录号CAD48314);(SEQ ID NO:444和黑曲霉α-葡糖苷酶(登录号BAA23616.1));(SEQ ID NO:444和解糖热厌氧杆菌葡糖淀粉酶)。
在其它实施方案中,协同作用的酶三元组包括但不限于(SEQ IDNO:442、SEQ ID NO:445和SEQ ID NO:446);(SEQ ID NO:444、SEQID NO:445和SEQ ID NO:446)或(SEQ ID NO:442、SEQ ID NO:445和SEQ ID NO:446)。
在其它实施方案中,协同作用的酶组合包括但不限于(SEQ ID NO:442、SEQ ID NO:444、SEQ ID NO:445和SEQ ID NO:446);(SEQ IDNO:443、SEQ ID NO:444、SEQ ID NO:445和SEQ ID NO:446)。
在其它实施方案中,酶协同作用可通过表达3、4、5、6或7或更多种具有相同催化活性的酶来实现。在一个实施方案中,两种或更多种协同作用的具有相同酶促活性的酶包括但不限于(SEQ ID NO:444和SEQ ID NO:444);(SEQ ID NO:445和SEQ ID NO:445)。
甘油的还原
厌氧生长条件需要内源电子受体例如辅酶烟酰胺腺嘌呤二核苷酸(NAD+)的产生。在细胞氧化还原反应中,NAD+/NADH偶联作为还原当量的库(reservoir)和载体起着至关重要的作用。Ansell,R.,等人,EMBO J.16:2179-87(1997)。细胞甘油的产生(其产生NAD+)用作氧化还原阀(redoxvalve)来在酵母的厌氧发酵过程中除去过量还原力。然而,甘油的产生是消耗ATP并且导致还原的三碳化合物损失的非常浪费的过程。Ansell,R.,等人,EMBO J.16:2179-87(1997)。为了从起始葡萄糖分子产生甘油,3-磷酸-甘油脱氢酶(GPD)将磷酸二羟丙酮还原成3-磷酸甘油,甘油3-磷酸酶(GPP)使3-磷酸甘油脱磷酸为甘油。尽管非常浪费,但甘油的产生是厌氧生长所必需的代谢过程,因为缺失GPD活性在厌氧条件下完全抑制生长。参见Ansell,R.,等人,EMBO J.16:2179-87(1997)。
GPD由两个等基因gpd1和gpd2编码。GPD1编码正在厌氧生长的细胞中的主要同种型,而GPD2是在氧气不存在的情况下甘油产生所需的,氧气刺激其表达。Pahlman,A-K.,等人,J.Biol.Chem.276:3555-63(2001)。磷酸二羟丙酮通过GPD至甘油的转化的第一步骤是速率控制步骤。Guo,Z.P.,等人,Metab.Eng.13:49-59(2011)。GPP也由两个等基因gpp1和gpp2编码。当转换至缺氧条件时,GPP基因的缺失阻止生长,这显示GPP对于细胞对渗透性和缺氧应激的耐受性是非常重要的。参见Pahlman,A-K.,等人,J.Biol.Chem.276:3555-63(2001)。
因为甘油是乙醇的厌氧产生的主要副产品,因此,已进行许多努力以试图删除甘油的细胞产生。然而,由于由甘油合成产生的还原当量,在不补偿该有价值的代谢功能的情况下不能进行甘油合成途径的删除。已进行了删除甘油产生和工程化交互电子受体的尝试。Lidén,G.,等人,Appl.Env.Microbiol.62:3894-96(1996);Medina,V.G.,等人,Appl.Env.Microbiol.76:190-195(2010)。Lidén和Medina都删除了gpd1和gpd2基因并且尝试使用另外的碳源绕开甘油形成。Lidén将来自树干毕赤酵母的木糖还原酶工程化进入酿酒酵母gpd1/2缺失菌株。木糖还原酶活性在木糖存在的情况下促进删除甘油的菌株的厌氧生长。参见Lidén,G.,等人,Appl.Env.Microbiol.62:3894-96(1996)。Medina将来自大肠杆菌的乙醛脱氢酶mhpF工程化进入酿酒酵母gpd1/2缺失菌株以将乙酰-CoA转化成乙醛。乙醛脱氢酶活性在乙酸作为唯一碳原存在的情况下但不在葡萄糖作为唯一碳源存在的情况下促进删除甘油的菌株的厌氧生长。Medina,V.G.,等人,Appl.Env.Microbiol.76:190-195(2010);也参见EP2277989。Medina指出需要在工业化实施之前解决的关于含有mhpF的菌株的几个问题,包括比包含GPD1和GPD2的酵母显著减少的生长和产物形成速率。
重新指导从甘油至乙醇的流动的另外的尝试已包括非磷酸化NADP+-依赖性甘油醛-3-磷酸脱氢酶(GAPN)至酵母(具有或不具有GPD1的同时敲除)内的工程化。Bro,C.,等人,Metab.Eng.8:102-111(2006);美国专利申请公布No.US2006/0257983;Guo,Z.P.,等人,Metab.Eng.13:49-59(2011)。然而,存在控制甘油的产生和积累的其它细胞机制,包括甘油输出蛋白(exporter)例如FPS1,其不需要交替NADP+/NADPH偶联或甘油合成基因的缺失的工程化。Tamás,M.J.,等人,Mol.Microbiol.31:1087-1004(1999)。
FPS1是位于质膜上的通道蛋白,其在酵母渗透调节中控制甘油的积累和释放。该菌株的无效突变体积累大量细胞内甘油,生长比野生型慢得多,并且以更低的速率消耗糖底物。Tamás,M.J.,等人,Mol.Microbiol.31:1087-1004(1999)。尽管在缺氧条件下生长更慢,但fps1Δ菌株可用作消除NAD+-依赖性甘油活性的替代物。fps1Δ菌株具有减少的甘油形成,然而具有拥有完全功能的NAD+-依赖性甘油合成途径。或者,可使用FPS1的组成型活性突变体或来自其它生物的同源物而非缺失内源FPS1来调节甘油合成,同时保持NAD+-依赖性甘油活性不被削弱。在调节FPS1的本发明的实施方案中,重组宿主细胞可以仍然合成和保留甘油并且相对于不能产生甘油的菌株获得提高的鲁棒性。
在一个实施方案中,缺失一种或多种内源甘油产生性或调节性基因以产生具有改变的甘油产量的酵母菌株。在另一个实施方案中,下调一种或多种内源甘油产生性基因以产生具有改变的甘油产量的酵母菌株。在另一个实施方案中,下调一种或多种内源甘油调节性基因以产生具有改变的甘油产量的酵母菌株。在另一个实施方案中,下调一种或多种内源甘油调节性基因以产生具有改变的甘油产量的酵母菌株。在一个实施方案中,此类菌株的甘油产量与野生型酵母细胞相比较被下调。
丙酮酸甲酸裂解酶(PFL)
通过丙酮酸甲酸裂解酶(PFL)进行丙酮酸至乙酰-CoA和甲酸的转化。在大肠杆菌中,PFL是负责甲酸的产生的主要酶。PFL是PflB的二聚体,其需要由pflA编码的激活酶PflAE、自由基S-腺苷甲硫氨酸和单个电子供体。参见Waks,Z.,和Silver,P.A.,Appl.Env.Microbiol.75:1867-1875(2009)。Waks和Silver通过添加来自大肠杆菌的PFL和AdhE和缺失内源甲酸脱氢酶工程化酿酒酵母的菌株以分泌甲酸和在使用大肠杆菌的两步骤法中产生氢。然而Waks和Silver未将甲酸产生与甘油形成的除去组合,并且没有人未提出或评估甲酸作为甘油还原的替代电子受体的用途。
用于本发明的重组宿主细胞的PFL酶可来自细菌或真核生物来源。细菌PFL的实例包括但不限于地衣芽孢杆菌DSM13、地衣芽孢杆菌ATCC14580、嗜热链球菌(Streptococcus thermophilus)CNRZ1066、嗜热链球菌LMG18311、嗜热链球菌LMD-9、植物乳杆菌(Lactobacillusplantarum)WCFS1(Gene登录号lp_2598)、植物乳杆菌WCFS1(Gene登录号lp_3313)、植物乳杆菌JDM1(Gene登录号JDM1_2695)、植物乳杆菌JDM1(Gene登录号JDM1_2087)、干酪乳杆菌(Lactobacilluscasei)bl23、干酪乳杆菌ATCC 334、青春双岐杆菌(Bifidobacteriumadolescentis)、长双歧杆菌(Bifidobacterium longum)NCC2705、长双歧杆菌DJO10A、动物双岐杆菌(Bifidobacterium animalis)DSM 10140、解纤维梭菌、或大肠杆菌。其它PFL酶可来自PFL1家族、RNR pf1家族或PFL2超家族。
真核生物PFL的实例包括但不限于莱因衣藻(Chlamydomonasreinhardtii)PflA1、单鞭毛菌(Piromyces sp.)E2、或厌氧真菌(Neocallimastix frontalis)、Acetabularia acetabulum、雨生红球藻(Haematococcus pluvialis)、团藻(Volvox carteri)、绿藻(Ostreococcustauri)、Ostreococcus lucimarinus、Micromonas pusilla、假单胞菌属(Micromonas sp.)、坛紫菜(Porphyra haitanensis)和蓝载藻(Cyanophoraparadoxa)、opisthokont(寄生变形毛菌(Amoebidium parasiticum))、amoebozoan(Mastigamoeba balamuthi)、原生藻菌(stramenopile)(假微型海链藻(Thalassiosira pseudonana)(2))和粘着门(haptophyte)(Prymnesium parvum)、M.Pusilla、假单胞菌属、O.tauri和O.lucimarinus)amoebozoan(M.balamuthi)和原生藻菌(伪矮海链藻(T.pseudonana))。参见Stairs,C.W.,等人,"Eukaryotic pyruvate formatelyase and its activating enzyme were acquired laterally from afirmicute,"Mol.Biol.and Evol.,2011年2月3日于http://mbe.oxfordjournals.org/在线公布的。
乙醛/醇脱氢酶
乙醛脱氢酶、醇脱氢酶和/或双功能乙醛/醇脱氢酶至细胞内的工程化可增加乙醇的产量。然而,因为乙醇的产量是氧化还原中性的,因此乙醛/醇脱氢酶活性不能用作甘油的产生在无氧代谢中给细胞提供的氧化还原平衡的替代。当Medina尝试在酿酒酵母gpd1/2缺失菌株中表达来自大肠杆菌的乙醛脱氢酶mhpF,所述菌株在葡萄糖作为唯一碳源存在的厌氧条件下不生长。Medina,V.G.,等人,Appl.Env.Microbiol.76:190-195(2010);也参见EP2277989。相反地,甘油缺失菌株的厌氧生长需要乙酸的存在。然而,未曾将乙醛脱氢酶与PFL组合表达或未用曾用本发明的重组宿主细胞表达乙醛脱氢酶。此外,用改进的乙醛脱氢酶或使用双功能乙醛/醇脱氢酶(AADH)替代内源乙醛脱氢酶活性可有利地影响反应的体内动力学,从而提供改善的宿主菌株的生长。
提高乙酰-CoA至乙醇的转化
为了提高乙酰-CoA至乙醇的转化,可利用将乙酰-CoA转化成乙醛的改进的乙醛脱氢酶(例如,来自C.phytofermentans或其它来源)或将乙酰-CoA转化成乙醛以及将乙醛转化成乙醇的双功能乙醛/醇脱氢酶(AADH)来替代或补充(compliment)内源酵母基因。通过一种或多种酶的工程化,可增加乙酰-CoA至乙醇的转化的体内动力学,从而提供改善的宿主菌株生长。双功能醇/乙醛脱氢酶可来自多种微生物来源,包括但不于大肠杆菌、丙酮丁醇梭菌(C.acetobutylicum)、解糖梭菌(T.saccharolyticum)、热纤梭菌(C.thermocellum)、C.phytofermentans,Piromyces SP E2或青春双岐杆菌。
当将甘油缺失菌株缺氧生长时,它们不能生长或发酵,以及在糖酵解过程中不能消费糖。然而,如果给此类甘油缺失菌株补充以AADH,则菌株能够在补充有乙酸盐的培养基中生长。
用于本发明的重组宿主细胞的AADH酶可来自细菌或真核生物来源。细菌AADH的实例包括但不限于Clostridium phytofermentans、大肠杆菌(Escherichia coli)、凝结芽胞杆菌(Bacillus coagulans)、迟缓芽孢杆菌(Bacillus lentus)、地衣芽孢杆菌、短小芽胞杆菌(Bacillus pumilus)、枯草芽孢杆菌、嗜淀粉拟杆菌(Bacteroides amylophilus)、多毛拟杆菌(Bacteroides capillosus)、栖瘤胃拟杆菌(Bacteroides ruminocola)、猪拟杆菌(Bacteroides suis)、青春双岐杆菌、动物双岐杆菌、两歧双歧杆菌(Bifidobacterium bifidum)、婴儿双歧杆菌(Bifidobacterium infantis)、长双歧杆菌、嗜热双歧杆菌(Bifidobacterium thermophilum)、嗜酸乳杆菌(Lactobacillus acidophilus)、短乳杆菌(Lactobacillus brevis)、布赫纳乳杆菌(Lactobacillus buchneri)(仅在牛中)、保加利亚乳杆菌(Lactobacillusbulgaricus)、干酪乳杆菌、纤维二糖乳杆菌(Lactobacillus cellobiosus)、弯曲乳杆菌(Lactobacillus curvatus)、德氏乳杆菌(Lactobacillusdelbruekii)、香肠乳杆菌(Lactobacillus farciminis)(仅在猪中)、发酵乳杆菌(Lactobacillus fermentum)、瑞士乳杆菌(Lactobacillus helveticus)、乳酸乳杆菌(Lactobacillus lactis)、植物乳杆菌、罗特氏乳杆菌(Lactobacillusreuterii)、肠膜样明串珠菌(Leuconostoc mesenteroides)、乳酸片球菌(Pediococcus acidilacticii)、戊糖片球菌(Pediococcus pentosaceus)、Propionibacterium acidpropionici(仅在牛中)、费氏丙酸杆菌(Propionibacterium freudenreichii)、薛氏丙酸杆菌(Propionibacteriumshermanii)、Enterococcus cremoris、Enterococcus diacetylactis、屎肠球菌(Enterococcus faecium)、Enterococcus intermedius、Enterococcuslactis或嗜热菌肠球菌(Enterococcus thermophiles)。
木糖代谢
木糖为可被多种生物代谢为有用产物的五碳单糖。存在两个主要的木糖代谢途径,每一个途径在它们利用的特征酶上是独特的。一个途径称为“木糖还原酶-木糖醇脱氢酶”或XR-XDH途径。木糖还原酶(XR)和木糖醇脱氢酶(XDH)为用于该木糖降解法的两个主要酶。XR,由XYL1基因编码,负责木糖至木糖醇的还原并且借助于辅因子NADH或NADPH。木糖醇随后被通过XYL2基因表达的XDH氧化成木酮糖,并且只利用辅因子NAD+来实现。由于该途径中需要的因子和它们可获得以使用的程度不同,因此不平衡可导致木糖醇副产品的过量产生和期望的乙醇的产出不足。已在实验室中测试了XR和XDH酶水平的不同表达以试图优化木糖代谢途径的效率。
木糖代谢的另一途径称为“木糖异构酶”(XI)途径。酶XI负责木糖至木酮糖的直接转化,并且不通过木糖醇中间产物来进行。两个途径都产生木酮糖,虽然使用的酶不同。在产生木酮糖后,XR-XDH和XI途径通过在基因XKS1上编码的木酮糖激酶(XK)进行,以进一步将木酮糖修饰成通过-5-磷酸,随后其进入磷酸戊糖途径以进一步分解代谢。
关于在木糖代谢过程中通过磷酸戊糖途径的流动的研究已显示限制该步骤的速度可有益于至乙醇的发酵的效率。可提高乙醇产量的对该流的修饰包括a)降低磷酸葡萄糖异构酶活性,b)缺失GND1基因,和c)缺失ZWF1基因(Jeppsson等人,Appl.Environ.Microbiol.68:1604-09(2002))。由于磷酸戊糖途径在代谢过程中产生额外的NADPH,因此限制该步骤将帮助校正已经明显的NAD(P)H与NAD+辅因子之间的不平衡,从而减少木糖醇副产品。比较两个木糖代谢途径的另一个实验显示XI途径最能够代谢木糖以产生最大乙醇产率,然而XR-XDH途径达到快速得多的乙醇生产速率(Karhumaa等人,MicrobCell Fact.2007 Feb 5;6:5)。也参见国际公布No.WO2006/009434,通过引用整体并入本文。
在一些实施方案中,本发明的重组微生物具有使用一种或多种上述酶代谢木糖的能力。
阿拉伯糖代谢
阿拉伯糖为可被多种生物代谢成有用的产物的五碳单糖。L-阿拉伯糖残基被发现广泛地分布在不同植物组织的许多杂多糖中,例如阿拉伯聚糖、阿拉伯半乳聚糖、木聚糖和阿拉伯木聚糖。土壤中的芽孢杆菌属的种参与植物材料分解的早期阶段,枯草杆菌(B.subtilis)分泌能够从植物细胞释放阿拉伯糖基低聚物和L-阿拉伯糖的三种酶内切-阿拉伯聚糖酶和两种阿拉伯糖苷酶。
已描述了微生物中L-阿拉伯糖代谢的3条途径。许多细菌包括大肠杆菌使用阿拉伯糖异构酶(AraA;E.C.5.3.1.4)、核酮糖激酶(AraB;E.C.2.7.1.16)和磷酸核酮糖差向异构酶(AraD;E.C.5.1.3.4)连续地将L-阿拉伯糖通过L-核酮糖和L-核酮糖5-磷酸转化成D-木酮糖-5-磷酸。参见,例如,Sa-Nogueira I,等人,Microbiology 143:957–69(1997)。随后D-木酮糖-5-磷酸进入磷酸戊糖途径以进一步分解代谢。在第二途径中,L-阿拉伯糖被阿拉伯糖脱氢酶(ADH)、arabinolactone(AL)和阿拉伯糖酸脱水酶(AraC)的连续作用转化成L-2-酮-3-脱氧阿拉伯糖酸(L-KDA)。参见,例如,Watanabe,S,等人,J.Biol.Chem.281:2612-2623(2006)。L-KDA可在两个旁路途径中被进一步代谢:1)L-KDA被L-KDA脱水酶和KGSA脱氢酶通过2-酮戊二酸半醛(KGSA)转化成2-酮戊二酸或2)L-KDA被L-KDA醛缩酶转化成丙酮酸和乙醇醛。在第三真菌途径中,L-阿拉伯糖被酶例如NAD(P)H-依赖性醛糖还原酶(AR)、L-阿拉伯糖醇4-脱氢酶(ALDH)、L-木酮糖还原酶(LXR)、木糖醇脱氢酶(XylD)和木酮糖激酶(XylB)通过L-阿拉伯糖醇、L-木酮糖和木糖醇转化成D-木酮糖-5-磷酸。此类蛋白和参与阿拉伯糖代谢和调控的其它蛋白可见于http://www.nmpdr.org/FIG/wiki/rest.cgi/NmpdrPlugin/SeedViewer?page=Subsystems;subsystem=L-Arabinose_utilization,2011年3月21日访问,将其通过引用整体并入本文。
AraC蛋白调节其自已的合成和Ara系统的其它基因的表达。参见Schleif,R.,Trends Genet.16(12):559-65(2000)。在大肠杆菌中,AraC蛋白有利地和不利地调节L-阿拉伯糖的吸收和分解代谢所需的蛋白质的表达。已鉴定了包含与AraC的DNA结合结构域同源的区域的AraC的同源物例如鼠李糖操纵子的调控蛋白RhaR和RhaS(Leal,T.F.和deSa-Nogueira,I.,FEMS Microbiol Lett.241(1):41-48(2004))。此类阿拉伯糖调控蛋白称为AraC/XylS家族。也参见,Mota,L.J.,等人,Mol.Microbiol.33(3):476-89(1999);Mota,L.J.,等人,J Bacteriol.183(14):4190-201(2001)。
在大肠杆菌中,L-阿拉伯糖穿过大肠杆菌胞质膜的转运需要高亲和力转运操纵子araFGH(结合蛋白依赖性系统)或,低亲和力转运操作子araE(质子同向转运体)的表达。另外的阿拉伯糖转运蛋白包括美国专利No.7,846,712(将其通过引用并入本文)中公开的从马克斯克鲁维酵母和吉利蒙念珠菌鉴定的那些阿拉伯糖转运蛋白。
在一些实施方案中,本发明的重组微生物具有使用一种或多种上述酶代谢阿拉伯糖的能力。
现通过这些非限定性实施例更详细地描述本发明的下列实施方案。
实施例
实施例1:真菌木质纤维素酶系统组分在酵母中的表达
为了产生表达这些不同酶以及预期共表达它们的菌株,产生了几个启动子和终止子对来用作表达载体。启动子终止子对以及在它们的控制之下进行测试的酶类型列于表3中。利用标准分子生物学方法(参见例如Maniatis,"Molecular Cloning"Cold Spring Harbor Press)将编码各种酶活性的基因克隆进入载体pMU1531。图2给出了作为所使用的骨架克隆载体的pMU1531的示意图。该载体包含来自酿酒酵母的ENO1启动子和终止子以及用于酵母中的URA3和zeocin标记。随后对其进行修饰以具有表3中所列的各种启动子/终止子组合。
表3.用于表达真菌和细菌基因的启动子和终止子
表4.在酵母中表达的真菌酶系统的组分
实施例2:表征辅助纤维素酶的表达和活性
在菌株构建后,将表达真菌EG1候选者的菌株生长在50mL的具有100ug/mL zeocin的摇瓶培养物中,测试其对CMC和微晶粉末纤维素的活性。图3显示了几种活性EG1被发现以及几种EG1在活性上优于先前使用的相当的酶(里氏木霉EG1,M1276)。根据这些数据,基于对微晶粉末纤维素的活性选择最佳的前6个候选者以进一步在PHW上进行测试(图4和5)。
在酵母产生的纯化的CBH1和CBH2(每一种2mg/g)和Novozyme188BGL存在和不存在的情况下,利用预处理的木材底物(MS149)进行PHW测定。在测定中使用2mL的来自每一种EG1表达菌株的上清液。再次将从相同质粒表达TrEG2的菌株用作对照。来自此类测定的结果可见于图4和5中。几种EG1显示与CBH1和CBH2一起作用以增加水解的能力,虽然未达到TrEG2能够达到的水平。类似地,几种EG1显示在Novozymes 188(包含除BGL外的几种活性的粗制β-葡糖苷酶制剂)存在的情况下从PHW释放葡萄糖的能力,并且几种EG1还显示比仅仅单独的菌株背景更多的木糖释放。
鉴于M1311在CMC、微晶粉末纤维素和PHW测定的强劲性能以及其具有天然CBD的事实,烟曲霉菌酶被选择作为最佳EG1候选者。
为了研究其它EG2-型内切葡聚糖酶和研究EG3-型内切葡聚糖酶以增强目前纤维素表达构型。另外的cel5序列的选择基于与里氏木霉eg2或白曲霉egA具有相对好的同源性的序列,大部分成功地从测试的第一轮表达cel5基因。待测试的cel12序列的选择基于与里氏木霉eg3具有相对好的同源性的序列,虽然不考虑具有大于95%的同源性的序列。表4显示了被选择用于合成的基因以及表达载体的命名。使用pMU1531表达质粒克隆所有基因,使其处于ENO1启动子/终止子的控制之下。
使用含有250μg/ml zeocin的YPD作为选择培养基将质粒都转化至酿酒酵母M0509(表达木糖异构酶的工业上旺盛的菌株),利用PCR确认转化株。与参照菌株(包含pMU1531)和表达里氏木霉eg2的菌株(pRDH180)一起,在微晶粉末纤维素和CMC上测试表达eg2/eg3的菌株的活性。将菌株生长在YPD或双倍强度的SC培养基(3.4g/L YNB;3g/L氨基酸混合物;10g/L硫酸铵;20g/L葡萄糖),所述培养基被缓冲至pH6(20g/L琥珀酸;12g/L NaOH,利用NaOH将pH设置至6)。在高压灭菌其它组分后从50%葡萄糖原液添加葡萄糖。添加Zeocin至100μg/ml的终浓度以进行液体培养。将10mL培养物在125mL埃伦迈尔烧瓶中在30°C下生长3天(YPD)或4天(SC)。
对于每一个菌株接种3个瓶。温育后,取出样品进行凝胶分析,蛋白质测定和活性测量。在样品离心后,取出12μl的每一种样品,添加至5μl的蛋白质上样缓冲液并且煮沸5分钟。随后将样品加载在10%SDS-PAGE上,进行分离,随后进行银染(图6)。
根据凝胶显示,并非所有菌株都产生预期的大小范围内(关于预期的大小参见表5)内的可见条带。T.r.EG2显示为约55kDa的条带。由于预测其为约44kDa,因此额外的重量可代表高糖基化。也可在与P.decumbens产物相同的近似大小范围内看到C.lucknowense、黑曲霉和P.decumbens的EG2(在~50kDa略微更小)。根据凝胶显示,与其它EG2相比较,产生了多得多的C.lucknowense EG2蛋白。根据图6B,很清楚不存在葡萄穗霉或黄孢原毛平革菌(P.chrysosporium)eg3基因产物的可见条带。里氏木霉、希新萨托菌和巴西毛壳霉(C.brasiliense)eg3基因产物分别可见为30、25和35kDa的条带。再次地,额外重量可代表高糖基化。然而,发现希新萨托菌Eg3在其预测的大小上或非常接近预测的大小–该蛋白质不包含假定的N-糖基化位点。
为了筛选EG活性,将用于定量测试的5μl培养物点在含有0.2%CMC或大麦-β-葡聚糖的SC-URA板上(图7)。制备两块含CMC的板,在3或24小时后染色。如可从图7中看到的,表达T.r.eg2的菌株(180)在两个基质上产生极好的亮区。其它表达eg2的菌株与表达来自里氏木霉(164)、葡萄穗霉(165)、希新萨托菌(166)和C.brasiliense(168)的EG3的菌株一起也显示良好的亮区形成。表达希新萨托菌eg3的菌株(166)在板测定中始终产生比其它EG更大的亮区。由于该蛋白质的更小的大小(图6B)和糖基化的明显缺乏,该酶在该培养基中可具有更优的扩散性质。
使用如所描述的高通量微晶粉末纤维素转化法测试所有菌株的活性。利用类似的测定法(但是略去Novozyme188并始于1% CMC)测定对CMC的活性。用于测定法的DNS包含苯酚。来自在YPD和SC上生长的菌株的活性数据可见于图8中。
根据活性数据,很明显表达里氏木霉eg2的菌株(pRDH180)产生最高水平的分泌型活性。来自C.lucknowense的EG2在两种底物上显示第二高的活性。里氏木霉EG3和希新萨托菌EG3似乎是来自该组的用于酵母表达的优良酶(随后将在PHW测试cel12)。
也用包含EG4、EG5、EG6和木糖葡聚糖酶(GH74/XG)的2um质粒转化菌株M0509。随后将这些菌株点在具有CMC的YNB板上,在30℃下生长过夜,用刚果红染色以检查克隆的基因的活性(一些菌株的数据示于图9中)。EG4基因仅显示微弱的对CMC的活性,然而EG5候选者显示巨大的亮区,并且所有EG6显示中等亮区尺寸。XG候选者在CMC上都显示极小的亮区。所有酶类型产生功能性候选者。
还在其它酶存在的情况下在PHW测定中测试候选者的活性。将纯化的酵母产生的CBH1、CBH2、EG2和BGL用作以4mg酶蛋白质每克固体以及40%:40%:15%:5%(按质量计)的混合物加载的用于测定的伴侣(图10)。作为对照,使用M0509上清液(阴性)或M1179上清液(表CBH1、CBH2、EG2和BGL的阳性对照菌株)。
图10中的数据显示EG4(来自球毛壳菌或费希新萨托菌)或EG5(来自金孢子菌)的添加可增加4mg/g载量的CBH、EG2和BGL的水解。当与加载额外剂量的CBH1、CBH2、EG2和BGL(1179上清液)相比较时,EG4和EG5导致葡萄糖释放的增加,虽然基于来自葡萄糖测定试剂盒的数据该差异在统计未显示出统计上显著性。无论如何,已获得这3种分类的候选者,虽然还有几种仍待筛选。
将XG候选者和几种EG4、5和6候选者基因以及来自EG4、5和6的先前轮的测试的最佳候选者一起用于PHW测定(图11)。结果表明所述酶中的几种酶对PHW具有活性。来自球毛壳菌和南美貘的EG4都相对于阴性对照和相对于表达里氏木霉EG2的菌株导致葡萄糖释放的增加。对于球毛壳菌EG5和粗糙脉孢菌(N.crassa)EG6情况亦如此。XG候选者仅显示相对于对照菌株的反应的略微增强,希新萨托菌XG表现为最佳。
实施例3:5种合成木聚糖酶和5种合成木糖苷酶在酿酒酵母中的克隆和表达
检查了酵母中木聚糖酶和木糖苷酶的表达以拓宽酵母产生的木质纤维素系统的酶促活性谱。从公共数据库选择木聚糖酶并且在取代的木聚糖上测试其在酵母中的功能性表达。基于对黑曲霉xlnD(GH家族3的酶)的同源性选择木糖苷酶,其包括来自GH家族43的木糖苷酶。表5(表4的浓缩形式)显示被选择用于合成的基因以及表达载体的命名。使用pMU1531表达质粒将所有基因克隆在ENO1启动子/终止子的控制之下。将质粒都转化至酿酒酵母M0509,利用PCR确认转化株。
表5.在酿酒酵母中表达的编码木聚糖酶和木糖苷酶的基因
与参照菌株(包含pMU1531),表达T.r.xyn2的天然序列的菌株(pRDH182)和表达A.n.xlnD的天然序列的菌株(pRDH181)一起,测试表达木聚糖酶/木糖苷酶的菌株对1%桦树木的葡糖醛酸木聚糖(Roth)和pNP-木吡喃糖苷(pNPX)的活性。将菌株在YPD或缓冲的双倍强度的SC培养基(pH6)中进行生长。添加Zeocin至100μg/mL的终浓度以进行液体培养。将10mL培养物在125mL埃伦迈尔瓶中于30°C温育3天(YPD)或4天(SC)。对于每一个菌株接种3个瓶。温育后,取出样品进行凝胶分析、蛋白质测定和活性测量。在样品离心后,取出12μL的每一种样品,添加至5μL的蛋白质上样缓冲液并且煮沸5分钟。随后将样品加载至10% SDS-PAGE上,进行分离,然后进行银染(图12)。
根据凝胶,似乎并非所有菌株都产生在预期大小范围(关于预测的大小参见表5)的可见条带。(A)T.r.XYN2表现为如所预测的约21kDa的条带。嗜热毛壳菌XYN11A可见为约36kDa的弱条带,比预期的27.8kDa大。出芽短梗霉XYN10在~50kDa上可见为显著条带。浅白隐球酵母和黑曲霉木聚糖酶也可见为比预测的略微更大的条带但这些基因产物在液体测定中不产生活性(图14)。分泌的酶的增加的大小可被解释为高糖基化的结果。(B)大于90kDa上的巨大弥散(smear)可代表黑曲霉XLND木糖苷酶的异源糖基化形式。旋孢腔菌,梅花状青霉和小麦黄斑病真菌木糖苷酶显示为45、50和55kDa的条带(轻微弥散的),大于预测的~37kDa,也表明可能高糖基化。
为了筛选木聚糖酶活性,将用于定量测定的5μL的培养物点在包含0.2% RBB-木聚糖的SC-URA板上并且温育24小时(图13)。如可从图中看到的,表达T.r.xyn2的菌株(RDH182)产生极好的亮区然而参照菌株未产生。在其它表达木聚糖酶的菌株中,嗜热毛壳菌xyn11A和出芽短梗霉xyn10产生亮区但其它菌株都不产生可见的亮区。
测试所有菌株对桦树木葡糖醛酸木聚糖(Roth)和pNP-木吡喃糖苷(pNPX)的活性。基本如La Grange等人(1996,Appl.Environ.Microbiol.62,1036-1044)中描述的进行木聚糖酶测定。使反应小型化以用于96孔PCR板。将5μL上清液添加至45μL1%的葡糖醛酸木聚糖并且在35°C下温育5分钟。通过添加75μL DNS终止反应,然后在99°C下加热5分钟。使用木糖设置标准曲线。以与β-葡糖苷酶测定(参见上述方案)相同的方式但利用pNPX作为底物在pH5,35°C下进行2-5分钟(取决于活性)来进行木糖苷酸测定。来自生长在YPD和SC上的菌株的活性数据可见于图14中。
根据活性数据,表达天然T.r.xyn2的菌株(pRDH182)似乎产生最高水平的分泌型木聚糖酶活性。令人惊讶地是包含该基因的密码子优化的形式(序列已验证的)的菌株未显示分泌型活性。由嗜热毛壳菌xyn11A编码的GH家族11的木聚糖酶确实产生值得注意的活性,然而,远低于由表达天然T.r.xyn2的菌株产生的活性。表达出芽短梗霉xyn10(GH家族10)的菌株也产生可感知的活性。这是特别令人鼓舞的,因为已知家族10的木聚糖酶通常仅具有10%的GH家族11的酶的比活性。然而家族10的木聚糖酶在它们的作用中不太受木聚糖骨架上的侧链置换的限制。有些令人惊讶地,由来自旋孢腔菌和小麦黄斑病真菌的基因编码的GH家族43的木糖苷酶产生显著的木聚糖酶活性。此类酶也分类为“外切-木聚糖酶”并且非常有趣地看到它们是如何与其它木聚糖降解酶相互作用的。产生这两种酶的菌株也显示比表达天然A.n.xlnD的菌株高得多的对pNPX的木糖苷酶活性。此外,表达天然A.n.xlnD的菌株仅分泌约36%的当在YPD中生长时其产生的总木聚糖酶活性,然而76%和99%的玉米圆斑病菌(C.carbonum)和P.tritici-repentis异源木糖苷酶被分泌。YPD中的产生玉米圆斑病菌和P.tritici-repentis木糖苷酶的菌株的分泌型木糖苷酶活性分别为表达天然A.n.xlnD的菌株的分泌型活性的3.3和6.9倍。
评估鉴定的最佳木聚糖酶和木糖苷酶的协同作用的测定示于图15中。制备桦树木葡糖醛酸木聚糖(5%于50mM NaOAc,pH5中),将400μL的等分置于深孔板中。随后,如下添加SC-生长的酵母菌株的上清液:
1.100μl REF菌株的上清液
2.50μl REF菌株的上清液,50μl RDH182菌株(T.r.xyn2)的上清液
3.50μl REF菌株的上清液,50μl RDH171菌株(A.p.xyn10)的上清液
4.50μl REF菌株的上清液,50μl RDH177菌株(P.tr.xld)的上清液
5.50μl RDH182菌株(T.r.xyn2)的上清液,50μl RDH177菌株(P.tr.xld)的上清液
6.50μl RDH171菌株(A.p.xyn10)的上清液,50μl RDH177菌株的上清液(P.tr.xld)
在微量滴定板摇床上以1000rpm,35°C摇动混合物22小时。进行DNS测定以确定形成的还原糖的量(图15)。根据该结果,当将木聚糖酶和木糖苷酶混合时似乎存在协同作用。T.r.XYN2和P.tr.XLD混合物的活性为单独的活性的和的1.24倍。A.p.XYN10和P.tr.XLD混合物的活性为单独的此类上清液的活性的和的1.9倍。为了分析释放的糖,将5μL的每一种反应物和标准点在涂覆有二氧化硅的薄层层析(TLC)板上,利用由异丙醇:乙醇:水(7:1:2)组成的洗脱剂进行分离。随后通过将板浸入5%H2SO4的混合物(于乙醇中制备的),在180°C烘箱中加热来对板进行显影(图16)。木聚糖酶(泳道2和3)的作用产生少量木三糖和更显著量的木二糖。来自P.tritici-repentis的木糖苷酶从木聚糖释放少量木糖(泳道4)。异源产生的木聚糖酶与木糖苷酶的混合物产生显著量的木糖(泳道5和6),在这些反应物中未留下可见的木寡糖(xylo-oligos)。利用HPLC进一步分析这些反应物。图15和16中所示的结果显示本研究中鉴定的有希望的木聚糖酶和木糖苷酶可协同作用并且产生期望的产物即木糖。
产生表达里氏木霉Xyn2(木聚糖酶,pRDH182)和P.t.r.GH43木糖苷酶(木糖苷酶,pRDH177)或两种酶(下文的pMU1819)的M0509的衍生物。产生整合2种酶的盒以便两种酶被整合在rDNA基因座。(图40)。通过natMX标记进行选择。通过在含有酵母提取物(1%),蛋白胨(2%),葡萄糖(2%)和木聚糖(5%)的培养基中培养它们来测试3种菌株利用木聚糖的能力。对于每一种菌株,可在该测试中被转化成乙醇的木聚糖的百分比示于图39中。结果显示两种酶之间的协同作用以及产生可直接将木聚糖转化成乙醇的菌株的能力。
实施例4:真菌辅助酶的筛选
进行阿拉伯呋喃糖酶活性和酯酶活性测定以评估辅助酶中的任何辅助酶是否具有功能。如下进行阿拉伯呋喃糖酶测定:在50mM柠檬酸盐缓冲液pH5.4中制备底物(1mM4-硝基苯基-L-阿糖胞苷(Sigma#N-3641)),预热至35C。将20ul的酵母上清液+180ul的底物添加至96孔板,在35℃温育30分钟。通过添加100ul的1M Na2CO3来终止反应,在405nM上获得OD测量。将浓度为177ug/ul的Zoomerase(1ul)添加在总共20ul柠檬酸盐缓冲液中。如下进行酯酶活性测定:在DMSO中制备200mM的底物原液(4-硝基苯基乙酸酯-Sigma N-8130);将50ul的该源液添加至10ml的柠檬酸盐缓冲液pH5.4中以产生1mM的终浓度。将50ul的待测试的上清液添加至96孔平底板+100ul的底物溶液。将反应物在35℃温育30分钟,获取410nm的OD。
图17和18显示了进行的测定的结果。仅来自黑曲霉的Abfb基因显示对合成底物pNPA的活性。这确认了该基因的表达,该基因先前在酵母中(Crous等人1996),我们的菌株中表达。GH62阿拉伯呋喃糖酶候选者未显示对该底物的活性,这可归因于表达不足或不能切割底物。已显示几个基因具有对合成底物对-硝基苯基乙酸酯的活性(图18)。已显示两种类型的阿魏酸酯酶(FAEA和FAEB)以及乙酰基木聚糖酯酶(AXE)之一的候选者是有活性的。
建立PHW测定来筛选数种辅助组分并且在其它酵母产生的酶存在的情况下评估它们的影响。图19显示了第一筛选的结果,该结果显示M0544中表达的费希新萨托菌和里氏木霉AXE基因都从未洗涤的预处理的硬木材底物(MS630)产生增加的木聚糖和葡聚糖水解。事实上,在AXE不存在的情况下,使用酵母产生的木聚糖酶和木糖苷酶未产生可测量的木糖从该底物的释放。MS630中木聚糖的水解在测定中应当导致~1.8g/L木糖释放,从而观察到的~1.4g/L为可获得的总量的约77%,比对照增加25%。葡萄糖水解因N.f.AXE的存在增加~25%。
图20显示了酶的尝试性组合对MS630(预处理的硬木材底物)的结果。可观察到几个有趣的结果。一个是在(1mg/g)存在的情况下,辅助物质在测试的载量上对MS630中的葡聚糖水解仅具有小影响。然而,木聚糖水解因N.f.AXE(乙酰基木聚糖酯酶)或T.r.AXE的存在显著增加,最佳组合产生~90%的转化。在zoomerase不存在的情况下,这些酶增加葡聚糖和木聚糖的水解。此外,减少AXE的量并且同时增加酵母产生的木聚糖酶和木糖苷酶的载量增加了木糖释放的速率,这表明这些酶是在更高表达水平上需要的限速酶。在zoomerase不存在的情况下酶的最佳组合产生~72%的木聚糖至木糖的转化。
实施例5:测试内切葡聚糖酶的可能的木聚糖酶活性
先前已显示GH10和GH11的真菌和细菌木聚糖酶在发酵过程中产生乙基木聚糖吡喃糖苷(EXP)。为了发现不产生EXP的木聚糖酶,测试了几种属于不同GH家族的真菌和细菌的酶的木聚糖酶活性。筛选来自GH家族的酶5、7、8、10、11、12、16、26、43、44和51的对木聚糖的活性,因为已报导这些家族的成员包含一定的木聚糖酶活性。将培养物在YPD上生长72小时,在桦树木木聚糖酶测定上评估上清液(图21)。
图21显示BC60显示出显著的木聚糖酶活性,同样地,包含来自短梗茁霉(A.pullulans)的真菌GH10木聚糖酶的菌株(M1379)和两种来自烟曲霉菌(M1311)和长梗木霉(M1317)的GH7、EG1的菌株确实具有对桦树木木聚糖的活性,虽然其低于BC60和里氏木霉xyn2(Con5)。
实施例6:细菌木质纤维素分解酶系统组分在酵母中的表达
木质纤维素酶的几个潜在细菌供体列于表6中,优先选择具有非复合纤维素酶的嗜温生物。同时选择来自不同组的细菌(好氧对厌氧以及嗜温对嗜热)以提供多样性。同样地,如果先前已报导了它们的基因在酵母中的功能性表达,则选择优选供体(嗜热裂孢菌,Cellulomonas fimi,Clostridium phytofermentans等)。细菌基因组的GC含量也影响供体的选择。优先选择具有不太远离酿酒酵母GC含量–38%的GC含量的生物(参见表6),虽然基于来自禾草腥黑粉菌的具有67.5GC含量的天然cel9A在酵母中的成功表达也不完全排除具有高GC含量的生物。
表7给出了针对在酵母中的表达筛选的细菌基因的完全列表。除标明的基因外所有基因都通过PCR从基因组DNA获得成功扩增,通过酵母介导的连接将其与2μ载体骨架一起转化进入酵母菌株以进行克隆。未从基因组DNA克隆的酶可获得密码子优化的形式。
表6.纤维素分解酶、DBM-二硫键机构的不同细菌供体的表征
表7.就酿酒酵母中的表达筛选的细菌基因。在某些图和实施例中,BC#表示该实验中使用的酶
实施例7:筛选细菌内切葡聚糖酶在酵母中的表达/活性
预筛选所有细菌内切葡聚糖酶的对CMC的分泌型活性(图22)。筛选了57株表达细菌内切葡聚糖酶的酵母菌株。对于每一种酶,测定两个不同的转化克隆。将菌株涂铺在YPD+Zeo板(Zeo250mg/L)上进行2天,将其于600uL YPD中接种在96孔板。将菌株在35℃以900rpm生长3天,对上清液进行CMC测定(参见上文)。阴性对照为用空表达载体pMU1575转化的M0749。将pMU1575中的TrEG2用作阳性对照构建体。
图22显示15个细菌酶(26%)显示对CMC的分泌型活性。枯草芽孢杆菌EglS和解纤维梭菌Cel5A具有与良好表达的对照相似的对CMC的分泌型活性,所述对照为里氏木霉EG2。显示对CMC的活性的酶列于下面的表8中。除BC77、BC80和BC81外所有基因都未针对酵母进行密码子优化;因此最佳基因的表达水平可通过密码子优化来进一步升高。
实施例8:细菌内切葡聚糖酶与酵母产生的CBH对PHW的协同作用
为了确定哪种细菌内切葡聚糖酶增强CBH对预处理的木质纤维素的转化,利用几种通过在酵母产生的纯化的CBH1和CHB2存在的情况下在CMC上进行筛选选择的酵母产生的细菌EG进行了PHW测定(图23)。还利用Novozyme-188 BGL来补充测定。
图23显示几乎所有测试的细菌EG显著增加葡萄糖从PHW的释放。细菌EG的累加效应与阳性对照—里氏木霉EG2相似或比其更高。嗜热裂孢菌celE在EG当中是特别成功的。
先前的工作已显示禾草腥黑粉菌Cel9A基因在酵母中良好表达。我们已产生该基因的酵母密码子优化的形式,并且在强ENO1启动子的控制之下表达其和天然序列。这导致与对于CBH1候选者测量的对微晶粉末纤维素的活性(在48小时内8%的转化,以仅Novozymes 188存在作为背景)大致相等的对微晶粉末纤维素的活性。这表明基因的天然和编码子优化的形式得到良好表达。因此,在PHW测定中测试了该候选酶与酵母产生的纯化的CBH,和里氏木霉EG2的协同作用(图24)。如可在下文中看到的,Cel9A与EG2的组合具有明显的协同作用,性能比单独添加的单种酶更好,即使它们具有2倍的浓度。
表8.在酵母中显示功能表达的细菌内切葡聚糖酶的列表(参见图22)。
BC# |
供体生物 |
GHF |
基因或基因座标签 |
4 |
除虫链霉菌 |
12 |
内切-1,4-β-葡聚糖酶celA1 |
34 |
Saccharophagus degradans |
5 |
cel5A |
48 |
枯草芽孢杆菌 |
|
内切-1,4-β-葡聚糖酶eglS |
56 |
Clostridium phytofermentans |
5 |
Cphy_3202纤维素酶B |
72 |
解纤维梭菌 |
5 |
cel5I |
77 |
解纤维梭菌 |
5 |
Ccel_1099(酵母CO) |
80 |
解纤维梭菌 |
5 |
Ccel_0840(酵母CO) |
81 |
解纤维梭菌 |
8 |
CelCCC(酵母CO) |
91 |
嗜热裂孢菌 |
5 |
celE(E5) |
93 |
嗜热裂孢菌 |
9 |
celA(E1) |
94 |
嗜热裂孢菌 |
6 |
celB(E2) |
95 |
嗜热裂孢菌 |
9 |
Tfu_1627 |
96 |
热纤梭菌 |
8 |
celA |
99 |
热纤梭菌 |
5 |
celC |
108 |
热纤梭菌 |
9 |
Cthe_0825 |
125 |
嗜热裂孢菌 |
9 |
Cel9A |
实施例9:表征细菌木聚糖酶在酵母中的表达/活性
使用桦树木木聚糖作为底物筛选注释为木聚糖酶的细菌基因—参见上述方案(图25)。筛选了25个表达细菌木聚糖酶的酵母菌株。对于每一种酶,测定2个不同的转化克隆。以与上述内切葡聚糖酶相同的方式生长菌株。所有菌株具有M0749酵母背景。“阴性对照”为利用空表达载体pMU1575转化的M0749,将克隆进入pMU1575的里氏木霉Xyn2基因用作阳性对照构建体。
图25显示8个细菌酶(32%)具有对木聚糖的分泌型活性。几种木聚糖酶包括Clostridium phytofermentans Cphy1510(GHF10)和嗜热裂孢菌xyl11,具有与里氏木霉Xyn2相似的对木聚糖的分泌型活性或高于里氏木霉Xyn2的所述活性。显示对木聚糖的活性的酶列于下文表9中。
表9.在酵母中显示功能性表达的细菌木聚糖酶的列表(参见图25)
实施例10:细菌木聚糖酶与酵母产生的CBH和EG的协同作用
为了测试酵母产生的酶与细菌木聚糖酶的协同作用,利用先前通过在酵母产生的纯化的CBH1、CBH2、TrEG2和酵母产生的GH43木糖苷酶(来自小麦黄斑病真菌)存在的情况下在木聚糖上进行的筛选选择的几种酵母产生的细菌木聚糖酶进行PHW测定(图26)。里氏木霉Xyn2用作阳性对照,表达空载体的菌株用作阴性对照。也利用AB BGL补充测定。
图25显示一些细菌木聚糖酶显著增加葡萄糖从PHW的释放,特别地当外源酶不存在时。Clostridium phytofermentans GH10木聚糖酶(BC60和BC61)和耐热梭状芽孢杆菌XynB(BC110)对葡萄糖从PHW的释放具有最显著的影响。对于木聚糖酶帮助释放葡萄糖的事实,存在几种可能的解释。有可能一些木聚糖酶还具有内切葡聚糖酶或其它水解酶活性,从而直接水解纤维素。此外,也可能PHW中的木聚糖的降解可使纤维素更易接近存在于反应物中的纤维素酶。在反应中未测量到增加的木糖的释放,这可能归因于适当的互补活性(木糖苷酶和/或乙酰基木聚糖酯酶)的缺乏。
实施例11:克隆和筛选嗜热厌氧糖化杆菌(Thermoanaerobactersaccharolyticum)木聚糖酶
从基因组DNA克隆解糖梭菌木聚糖酶,将其融合于Eno1启动子以在酿酒酵母中表达。将总共12个木聚糖酶相关基因克隆进入pMU1575骨架(表4)。分别使用桦树木木聚糖酶测定和pNPX木糖苷酶测定筛选菌株的木聚糖酶和木糖苷酶活性(图26)。M1594为唯一显示显著木聚糖酶活性的菌株。未从这些菌株检测到木糖苷酶活性。
表10.酵母中克隆和表达的解糖梭菌木聚糖酶的描述
实施例12:具有甘露聚糖酶活性的细菌基因的筛选
为了发现纤维素酶、甘露聚糖酶和木聚糖酶的容易的高通量筛选,在琼脂糖板测定中测试4种来自Megazymes的天青精-交联的多糖(AZCL)。在该测定中,酶水解不溶性多糖,释放可溶性染料标记的片段以提供“染色的带(zone of dyeing)”。通过板测定来测试附着有半乳甘露聚糖、脱支阿拉伯聚糖和木聚糖AZCL的底物。具有假定的木聚糖酶和甘露聚糖酶活性的克隆提供了染色带;然而,在脱支阿拉伯聚糖上未检测到阿拉伯糖酶活性。
通过该板测定显示出活性的木聚糖酶匹配在先前应用的桦树木木聚糖测定(参见上文)中具有活性的木糖酶。通过甘露聚糖酶板测定发现3个功能性分泌的酵母产生的细菌甘露聚糖酶(来自C.phytofermentens的BC68、BC69和BC70)。
还在不添加任何外来酶的情况下利用PHW筛选由酵母表达的细菌辅助酶与酵母产生的酶(CBH1、CBH2、EG2、BGL、木聚糖酶、木糖苷酶)的协同作用(图28)。一种酶-Clostridium phytofermentans甘露糖苷酶(Cphy_2276、GH26、BC70)对葡萄糖从PHW的释放具有显著作用。所有酶对木糖释放都没有显著作用。系统中可能需要其它活性以察觉一些辅助酶的作用。
表11在酵母中表达的功能性“同类最佳”组分的概述
硬木材和选纸淤泥
另外的关于造低淤泥的
实施例13:增强水解的组分的组合:在外源酶(EE)存在的情况下不同EG组合(成对组合)对由酵母产生的CBH产生的PHW转化的作用
为了确定不同的EG是否彼此协同作用,使用PHW测定分析EG组合,目的在于测定协同关系。如果EG具有相似功能,则EG的组合不应当比以两倍浓度加载的单种EG(任一种)更好。然而,如果EG是协同作用的,则组合应当产生比2倍浓度的任一种酶更强的水解作用。
为了测试成对组合,利用以所有可能的组合方式成对组合(1ml+1ml)的表达单种EG的酵母菌株(表4)的上清液进行PHW测定。将表达EG的菌株涂铺在YPD+Zeo板上进行1天(除涂铺在SD-URA上的M1023外),接种在摇瓶中的YPD中,生长72小时。表达空载体的菌株用作阴性对照(2ml,NC)。将表达单种EG的菌株(2ml或1ml+1mlNC)用作阳性对照。所有样品包括NC补充有1mg/g CBH1、1mg/g CBH2和1mg/g ABBGL(图29)或1mg/g CBH1、1mg/gCBH2、0.2mg/g BGL和1mg/gZoomerase(图29)。
表12.表达不同GH家族的EG的酵母菌株
所有EG在含有URA3和Zeo标记的2u质粒中在ENO pr/tt下表达。骨架载体pMU1531用于真菌EG;pMU1575用于细菌EG。真菌EG具有天然信号序列;细菌EG连接于酿酒酵母转化酶信号。在YPD+Zeo板上选择具有真菌EG的菌株;在SD-URA-板上选择具有细菌EG的菌株。
如可从图29看到的,EG的几个组合胜过2倍载量的任一种酶,这表明EG确实具有协同作用。虽然在协同作用上在不同时间点(27和48小时)之间的协同作用中存在一些重叠,但协同作用的量随时间而改变。
为了分析EG对实验数据,基于图31和32的数据制作表13A和13B。在这些表中,对于每一个EG对计算两个参数:活性(红色数字)-与阴性对照相比较的葡萄糖释放的增加;和协同作用(黑色数字)–与对的更具活性的组分相比较的葡萄糖释放的增加。通过从EG对的葡萄糖释放值减去阴性对照的葡萄糖释放值来计算活性。协同作用计算为EG对的葡萄糖释放与对的更具有活性的组分的葡萄糖释放相比较的增加的百分比。图33和34以及表13A和B中显示的数据显示:
1.EG组合与单种EG相比较在PHW纤维素的转化上具有明确的有利方面。
2.在早期PHW转化时间点上,9个EG(来自单独的家族)的每一个与一些其它EG具有协同作用。
3.协同作用在更晚的转化时间点上变得不太明显。
为了选择最高效的EG对,基于两个参数:两个时间点的活性和协同作用(表14)排列最佳EG对。在表14中以绿色突显的对存在于所有4个“获胜”组中并且被认为是这些实验条件的最高效的EG组合。
表13.利用不同EG组合的实验的数据分析
灰色数字表示活性–与阴性对照(CBH+EE)相比较的葡萄糖释放的增加,g/l(EG对的活性减去NC);黑色数字–协同作用–与对的更具活性的组分相比较的葡萄糖释放的增加,%(100%*EG对的活性除以EG最大活性减去100%)。A–27小时时间点;B–48小时时间点。
表14.利用不同EG组合进行的实验的数据分析(参见图28和表13)
在该表中,基于来自表13的活性和协同作用数据的性能最佳的EG以始于最佳对的性能顺序排列。根据两个不同的参数(活性和协同性)方面和在两个不同的时间点:27和48时形成4组最佳表现者。以绿色突显的对是存在于所有4个组中的对。
实施例14:测试更高的EG组合的增强的PHW活性
基于上述EG对筛选,设计了这样的实验:其中将最高效率的EG对与来自表14的其余EG的每一个组合。在外源酶(EE,参见上述组成)和酵母产生的CBH存在的情况下利用所有可能的三元组EG组合进行PHW测定(图30)。将总测定体积针对三元组分成3部分(每部分0.67mL),然而对于一对对照和单个对照将其分别分成仅2部分或1部分。
图30显示酵母纤维素分解系统,当与EE一起使用时,确实获益于更复杂的EG组合物。基于48小时的数据,选择两个最佳的EG三元组:GH9+GH5+GH12和GH9+GH5+GH7进行进一步实验。
将最佳三元组与剩余的EG的每一个组合,以两个不同的EE浓度再次重复PHW测定(图31)。图31显示:
1.EG组合与单种EG相比较在PHW聚糖转化中具有明确的有利方面。
2.哪种EG组合是最佳的取决于EE载量和转化的时间。
3.在所有时间点和测试的EE载量上,最佳EG组合包括:Cel9A(GH9)、EG3(GH12)、EG1(GH7)和EG2(GH5)。
4.在较低的EE载量上,GH5、GH9、GH7和GH12的组合似乎是最佳的。
将最佳单种EG(GH9和GH5)和最佳4种一起的EG(GH9、GH5、GH12、GH7)的数据以2mg/g EE存在的情况下PHW转化的时间过程作图,后跟对照—不添加EG的2mg/g和4mg/g EE(取而代之添加空载体的上清液)(图32)。图32显示4种EG的组合在相同的体积上具有优于最佳单种EG的明确的有利方面。此外,图32还显示最佳EG组合提供了相当于2mg/g EE的PHW转化的增加。
实施例15:酶促组分的“完全”系统的表达以降解木质纤维素
开发用于在酵母中表达的“完全”或大致完全的木质纤维素酶系统的技术挑战在于该系统可能由许多组分组成。这些组分需要以多个拷贝表达以产生足够活性来体现意义。因此,开发用于多基因多拷贝表达的工具在该背景中是非常有用的。
用于以多个拷贝表达多个基因的可转移系统
除已在酵母中产生的“核心”酶(CBH1、CBH2、EG2和BGL)以外,还表达多个拷贝的表4中所列的~25个基因类型将需要新的分子工具。重复整合(并除去标记)将是费力的。除此以外,由于新的宿主不断产生,因此产生可在菌株之间转移的酶系统的系统将会极具价值。
表达大片段DNA是上述问题的解决办法。其中用于表达大片段DNA的选择是基于CEN的质粒和酵母人工染色体(YAC)。“CEN”是指着丝粒,CEN元件允许在细胞分裂过程中将遗传元件高保真地分配至母代和子代细胞。首先于1987开发的(Burke DT,Carle GF,Olson MV,","Science.1987年5月15日;236(4803):806-12)YAC已被用于克隆非常大的DNA片段以用于非酵母宿主(例如,在小鼠中;Schedl,1993)中表达,和用于基因组测序(例如Krzywinski M,Wallis J,

C,等人,"Integrated and sequence-ordered BAC-and YAC-based physical mapsfor the rat genome,"Genome Res.2004 Apr;14(4):766-79)。它们能够维持多至3百万碱基的DNA。对于我们的项目特别吸收人的是,已开发了可扩增其拷贝数的YAC(Smith DR,Smyth AP,Moir DT.,"Amplificationof large artificial chromosomes,"Proc Natl Acad Sci U S A.1990Nov;87(21):8242-6)。这基于破坏CEN功能,和选择具有不对称的YAC分离的细胞。作者显示开发的系统可使560Kb YAC的拷贝数增加至13个拷贝,使120Kb YAC的拷贝数增加至20个拷贝。在20个世代后,560Kb YAC降至8.2个拷贝,120Kb YAC降至11.3个拷贝。这些结果显示即使是此类非常大的DNA片段(对细胞不具有选择益处或几乎不具有选择益处)也可维持相当的稳定性。YAC的拷贝数特征最初产生于CEN质粒中(Chlebowicz-Sledziewska E,Sledziewski AZ.,"Construction of multicopy yeast plasmids with regulated centromerefunction,"Gene.1985;39(1):25-31),并且这些质粒可能是用于表达~20kb的可包含“主要”活性的DNA片段的最容易选择。除了这些特征外,研究者(Spencer F,Simchen G."Transfer of YAC clones to new yeasthosts,"Methods Mol Biol.1996;54:239-52)已显示YAC可从一个酵母宿主转移至另一个,以及可通过同源重组修饰。
对于被认为必需仅以单或双拷贝存在的酶—“较少的”组分—可构建单个大的整合构建体,这将省去产生大的CEN质粒,并且产生更稳定的系统。
实施例16:用于表达多个基因的大载体的装配
通过同源重组将基因装配至大的构建体中在酿酒酵母中是公知的(Shao Z,Zhao H,Zhao H.,"DNA assembler,an in vivo genetic methodfor rapid construction of biochemical pathways,"Nucleic Acids Res.2009Feb;37(2):e16.2008年12月12日的电子版)(Oldenburg KR,Vo KT,Michaelis S,Paddon C.,"Recombination-mediated PCR-directedplasmid construction in vivo in yeast,"Nucleic Acids Res.1997Jan15;25(2):451-2)。这代表了用于常规克隆和用于一次组合许多遗传元件的工具。通过使用上文中测试的酶,我们能够装配大的CEN构建体以便以多个拷贝表达多个基因。利用两个标记(hph或zeocin标记)之一,利用来自酿酒酵母的ARS1复制起始点,利用可破坏的着丝粒(CEN4)以及利用现有的2μ元件构建此类载体。通过将诱导型Gal1启动子置于着丝粒的上游来产生该可破坏的元件。在半乳糖上生长的过程中,质粒变得不稳定。
图33显示将4个内切葡聚糖酶同时装配至单个载体中的能力(在ENO1启动子/PYK终止子的控制之下的烟曲霉真菌的EG1、在FBA启动子/PGI终止子的控制之下的球毛壳菌的EG4、在GPM1启动子和TPI终止子的控制之下的C.lucknowense的EG5和在ENO2启动子和TDH3终止子的控制之下的球毛壳菌的EG6)。利用可重组以形成显示的终载体(实际的载体是环状的而非线性的)的重叠序列通过PCR扩增每一个表达盒。从该转化挑拣的几个菌落全都具有对CMC的活性,表明EG功能性表达。通过进行横跨所有被装配的单个片段的接合处的PCR验证构建体(pMU1943)。包含该盒的酵母菌株称为M1509。
如上文中所述,利用zeocin标记(pMU1666)产生类似的CEN载体和菌株。通过YML将EG1、EG4、EG5和EG6成功地装配至具有zeocin标记的CEN载体中(菌株M1553)。进行PCR测试以确认EG盒之间和载体与第一盒(EG1)以及与最后的盒(EG4)之间的接合处。
还可通过酵母介导的连接构建具有7个基因或11个基因的CEN载体。这两个载体的示意图示于图34中。通过PCR测试这些载体以确认插入物的存在。下面的两个载体显示大至23kB和35kB的载体可分别以该方式产生。
实施例17:用于多拷贝表达的CEN载体的扩增
菌株M1509在1000μg/ml的潮霉素浓度下在T0代产生极少的缓慢生长的菌落。在于YP+半乳糖中生长后,在潮霉素1000上存在增加的数目的菌落。这些菌落在YPD+潮霉素1000上也比半乳糖处理前的菌落生长快。这表明拷贝数可随半乳糖处理而增加,从而允许在高潮霉素浓度板上更快的生长和产生更多的菌落。然而,CMC测定显示在半乳糖处理之前和之后内切葡聚糖酶活性都保持几乎相同(图35)。
也在抗生素不存在的情况下在YPD中进行长出,进行约10个世代,长出之前和之后的CMC活性仍然非常相似,表明质粒的稳定性(图36)。另一个有趣的特征是在半乳糖生长处理后来自YPD板(无选择)的菌落显示可变的CMC活性,一些菌落具有大的活性降低(通过图35中极高的标准差显示的)。这表明CEN载体在半乳糖存在的情况下如所预期地工作,这使得一些细胞保留多个拷贝的质粒而其它载体丢失其。
如上文中所指出的,M1553为包含具有zeocin抗性盒和4个内切葡聚糖酶EG1、EG4、EG5和EG6的CEN载体的菌株。测试该菌株的抗生素抗性和EG活性。最初M1553在YPD板中可在达到50μg/ml的zeocin浓度下生长,当涂铺在具有100μg/m的zeocin的YPD板上时,在YPG(半乳糖)中和50μg/ml的zeocin下传代的该菌株显示菌落。当再划线时,这些zeocin(100)抗性菌落也在YPD-zeo 500ug/mL板上生长。将来自YPD-zeo 100ug/mL板的10个菌落与10个在YPD-zeo 50ug/mL上生长的原始CEN菌株菌落相比较。从培养上清液制备系列稀释物1:5、1:10、1:20和1:40,对稀释的上清液进行CMC测定。
图37显示在不同的稀释度上来自这些板的每一个板的前3位菌落的平均性性能的比较。来自100ug/mL zeocin板的菌落表现比zeocin 50ug/mL菌落好,这表明CEN载体的扩增已发生。取决于分析的稀释度(CMC测定似乎在一些稀释度上处于饱和),可在两组最佳的菌落之间观察到羧甲基纤维素酶活性的1.5至2倍的差异。
这显示与通过zeocin标记进行的选择偶联的破坏CEN功能的在半乳糖中的生长可导致载体扩增。
实施例18:具有多个EG的CEN载体对PHW的活性
如上所述在M0544中产生从不同启动子和终止子表达烟曲霉真菌EG1、球毛壳菌EG4、C.lucknowense EG5和球毛壳菌EG6的具有表达zeocin抗性标记的CEN载体。测试该载体在未扩增状态与从2μ载体表达EG3和Cel9A的菌株一起对PHW水解的作用(图38)。结果表明2倍载量的产生高水平的核心酶的菌株(M1179)相当于1倍载量的M1179+1倍载量的CEN载体菌株(或相当于1倍载量的M1179以及CEN菌株、EG3和Cel9A的混合物)。
实施例19:针对在酵母中的表达筛选淀粉分解酶
针对在酵母中的功能性表达筛选了100种以上的来自酵母、真菌、细菌和植物的淀粉分解酶、纤维素分解酶和辅助酶。大多被选择用于筛选的酶概述于表15和16中。标记为“BC”的细菌酶描述于表7中。来自表15和16的酶在酵母中表达,通过单独的或组合的多个测定进行筛选。表15包括67个基因(前10个与表16重叠)。确认了32个基因在酵母中的功能性表达(标记为灰色)。表16包含81个基因:确认了18个基因(灰色)在酵母中的功能性表达。从NCBI数据库或从所有者的Mascoma基因测序数据(在表16中标记有*)获得关于基因序列的信息。合成(GeneArt或DNA2.0)或PCR扩增基因。合成的基因是天然DNA序列或针对酿酒酵母进行了密码子优化。当使用PCR获得基因时,将基因组DNA或cDNA用作模板。使用的基因描述于表15、16或表7中。用于构建CBP菌株的重要基因的序列列于表19中。基因在ENO1启动子和终止子的控制之下从2-μ质粒pMU1575表达(图41)。通过克隆或酵母介导的连接将基因插入pMU1575的PacI/AscI位点之间。表达具有其天然信号序列的酵母和真菌基因。将细菌基因(例如AE49)连接于酿酒酵母转化酶信号序列。将表达构建体转化进入工业背景菌株M1744、M509或M0139并且在最简URA缺乏培养基上进行选择。将转化株在YPD上生长3天,分析上清液的活性。通过淀粉-DNS、淀粉-GHK、麦芽糖和玉米醪液测定筛选的最具活性的α-淀粉酶(AA)、葡糖淀粉酶(GA)和α-葡糖苷酶(AGL)的数据概述于表17中。针对在酵母中的功能性表达筛选几种酶的实例示于图42上。表达合成基因的菌株的分泌型活性利用淀粉-DNS、淀粉-GHK和麦芽糖测定来进行测量。图42显示不同酶对不同底物具有不同活性,这显示了不同的作用机制。
表15.针对在酵母中的功能性表达筛选的由FDA批准的用于饲料和/或食物用途的淀粉分解酶和其它酶。灰色框表示在酵母中显示功能性表达的酶。
表16.针对在酵母中的功能性表达筛选的淀粉分解和其它酶。*-从由Mascoma测序的基因组序列获得的基因序列。
表17.酵母产生的α-淀粉酶(AA)、葡糖淀粉酶(GA)和α-葡糖苷酶(AGL)的活性筛选概述。+号的量反应相对活性水平。NT–未测试的。CO–密码子优化的。菌株在M0509或M0139背景菌株中在2u载体pMU1575上表达单种酶
实施例20:筛选淀粉分解和辅助酶以与AE8协同作用
选择水解酶的特定组合以最佳地转化特定底物例如玉米醪液。这可通过筛选100种以上的酶的酵母中的功能性表达、彼此的协同作用以及在工业相关生物过程条件中的性能来实现。特定组合包括:AE9;AE9+AE8;AE9+AE1;AE9+AE7;AE9+AE10;AE9+AE8+AE10;AE9+AE7+AE10;AE9+AE7+AE8+AE10;AE1+AE8+AE9+AE10;AE1、AE7、AE8、AE9和AE10的所有其它组合(参见表16和19)。显示从底物例如预处理的玉米纤维和玉米糖浆(在玉米醪液发酵后浓缩的液体级份)较高的葡萄糖释放的水解酶的其它特定组合包括:“核心”纤维素酶、木聚糖酶、木糖苷酶、葡糖淀粉酶(AE9)、α-淀粉酶(AE7)、异支链淀粉酶(SE35)、α-葡糖苷酶(AE10)、乙酰基木聚糖酯酶(里氏木霉AXE)和果胶酶.
将在酵母中具有最佳分泌型活性的酶组合,随后筛选彼此的最佳协同作用。图43-45显示筛选组合的酶的实例。利用淀粉-DNS、玉米醪液和纤维测定筛选几种淀粉分解酶与AE8的协同作用。将在YPD上生长3天的菌株的上清液与具有AE8的上清液以50:50的比率混合。在图43的第一样品中,AE8上清液为100%。M0509宿主菌株的上清液用作阴性对照。图43显示几种AA和SE11葡糖淀粉酶,当添加至AE8时与当添加额外的AE8时相比较,对葡萄糖释放具有正作用。AE7α-淀粉酶具有特别强的作用。图44显示对于玉米醪液,SE14α-葡糖苷酶,当与AE8组合时,对葡萄糖释放具有正作用。
还分析了在AE8存在的情况下阿拉伯糖酶和木聚糖酶对葡萄糖从非预处理的玉米纤维的释放的作用(图44)。图44显示Ara8对葡萄糖从纤维的释放具有正作用。几种木聚糖酶,当添加至AE8中时,也对葡萄糖从纤维的释放具有一定作用(图45)。将获自酶组合的筛选的信息用于选择对于特定底物例如玉米醪液、预处理的玉米纤维和玉米糖浆来说是最佳的酶组。
实施例21:针对高乙醇产率和异源蛋白的产量筛选工业菌株
为了选择用于工程化淀粉酶的工业宿主菌株,针对在标准剂量的商业葡糖淀粉酶存在的情况下从液化玉米醪液产生的乙醇的产量筛选几个工业菌株和Mascoma开发的菌株(数据未显示)。选择两个性能最佳的菌株:M0212(良好建立的高性能ethanologen)和M0139(来自酿酒工业的高性能ethanologen)以进行进一步评估。由于CBP法的成功依赖于异源基因在工业酵母菌株中的充足表达,因此比较菌株表达淀粉酶的能力。评估3个菌株:就高乙醇产率选择的2个菌株M0212和M0139,以及M0749–未达到M0212和M0139的乙醇效价但已知产生高水平的异源蛋白质的Mascoma强劲菌株(McBride等人,WO2010/06000056,2010)。当从多拷贝2μpMU1575质粒表达时,测量上述菌株的培养上清液中的3种不同葡糖淀粉酶(AE3、AE8和AE49)的活性水平。使用麦芽糖作为底物的结果示于图46中。使用淀粉获得类似的结果(数据未显示)。结果明确地显示当M0212为所有测试的酶的生产平台时表达最低。然而,菌株M0139用作最佳分泌平台并且也是可与M0212相比较的ethanologen。当α淀粉酶(SE15)在所有3个菌株背景中表达并且在淀粉上测量活性时,也观察到相似的趋势。基于这些结果,选择M0139菌株作为用于工程化CBP菌株的宿主背景菌株。
实施例22:在工业背景中工程化无标记稳定的淀粉分解菌株
利用两个方法工程化表达淀粉分解酶的菌株:随机整合和定点整合。在两种情况下,基因都被稳定地整合进入基因组。当使用随机整合法时,通过选择连接的营养缺陷型标记将淀粉分解基因整合进入δ位点。以不同的组合同时整合几个基因,在含有淀粉的URA-板上筛选转化株。当使用定点整合法时,基因被整合进入指定的基因座。两种方法在下文中进行了更详细的描述。
利用随机整合进行菌株的构建
为了研究随机整合和淀粉板选择法用于菌株构建的潜能,构建4个具有最具活性的淀粉分解酶的整合构建体(图47,上)。构建体包含处于不同的连接于URA3标记并且侧翼连接δ整合位点的启动子和终止子之下的α-淀粉酶、2葡糖淀粉酶和α-葡糖苷酶。将构建体以7个不同的组合(图47,下)等量混合,将3μg的总DNA转化进入工业菌株M1744(M0139背景)和M0749(M0509背景)。将转化株涂铺在SD-URA板上和YM-淀粉板上(1xYNB+0.5%淀粉)。发现无额外标记的淀粉选择对具有M0509菌株背景的菌株有效,但在M0139背景的菌株中无效。然而,淀粉与URA选择的组合对M0139菌株有效(如果仅将淀粉用作M0139菌株的标记,则可获得大量背景菌落)。通过淀粉-DNS测定筛选从两种类型的平板和在两种宿主背景中选择的转化株。以一式两份再次测试最高命中2次(图48)。作为结果,产生了几个对淀粉具有高分泌型活性的菌株。产生具有最高活性的菌株的组合包括:单独的AE9、AE8+AE7、AE9+AE10和AE9+AE7。
通过定点整合构建菌株
定点整合法产生具有更容易表征的整合事件的转基因菌株。可利用Southern印迹容易地鉴定任何失靶(mistargeting)事件。此外,由于染色体上的每一个表达盒被整合进入独特的位点(未测试),因此通过定点整合工程化的菌株潜在地更稳定。已开发了URA3和FCY1阴性选择法。FCY1被最终选择为选择的标记,因为fcy突变不影响菌株的鲁棒性。通过使用该技术,在工业菌株背景中构建了许多干净(clean)菌株。图49显示葡糖淀粉酶表达盒如何被整合入FCY1基因座。在该情况下,FCY1敲除的逆选择也选择葡糖淀粉酶表达盒的整合。在表达盒中,葡糖淀粉酶基因处于来自不同中心代谢基因的强启动子的控制之下。当使用多个拷贝时,包含相同序列的表达盒彼此相对地排列以减少自发重组的机会。将葡糖淀粉酶表达盒作为PCR产物(该产物具有靶向FCY基因座的上游和下游的同源末端)转化进入工业菌株M0139。由于FCY的两个拷贝的去除是对5-氟胞嘧啶(5-FC)的抗性所必需的,因此,发现每一个表达盒被整合在两条染色体上。将包含表达潮霉素抗性基因标记(Hyg)的盒的2-μ质粒与PCR产物一起共转化。首先将转化株在液体YPD+Hyg(300ug/ml)培养基中培养过夜,随后将其涂铺在含有5-氟胞嘧啶的培养基上。在含有抗生素的培养基上的预培养提高了双FCY1敲除的效率。还将该方法与其它阴性选择标记例如URA3一起使用。FCY基因座上的遗传操作导致无标记并且可通过再重复利用FCY标记来容易地修饰的菌株。例如,可将额外拷贝的AE8和AE9置于其它基因座上。
图50显示了更多的葡糖淀粉酶拷贝是如何被整合进入另一个位点例如腺嘌呤磷酸核糖转移酶2(APT2)基因座的。在第一轮转化中,利用彼此的同源尾和APT2基因座的上游和下游区域通过PCR扩增4个额外的GA表达盒。利用重叠末端将显性标记(Nat和Kan)和FCY1标记作为PCR产物与4个额外的GA一起整合进入工业菌株M1973(已表达4GA拷贝,图49)中的ATPT2基因座。将转化株涂铺在允许两个显性标记都整合在染色体上的的细胞生长的YPD+Nat+Kan板上。通过淀粉-DNS测定筛选转化子的高淀粉分解活性。选择显示最高活性的菌株,通过转化两个具有彼此的同源末端、ATP2上游侧翼区和AE9表达盒的5’-部分的PCR产物来除去Kan和Nat标记。将转化株涂铺在含有5-氟胞嘧啶的培养基上,所述培养基选择已失去FCY1的菌株。在该方法中,可将表达盒整合进入任何酵母位点,只要事件不干扰必需功能。通过在生物反应器中进行玉米醪液发酵来进一步评估具有最高的对淀粉的活性菌株。
实施例23:通过玉米醪液发酵评估淀粉分解菌株
评估在筛选测定中显示最高活性的几个淀粉分解CBP菌株的从液化的玉米醪液产生乙醇的能力。通过定点整合或随机整合构用于该实验的菌株,从扣囊复膜酵母表达淀粉酶的不同组合(表18,19)。背景非淀粉分解M0139菌株用作对照。在32°C的发酵温度下以125rpm的摇动速度在密封的摇瓶中对具有30%的固体(TS)的获自Valero生物精练厂的玉米醪液进行发酵。使用500ppm尿素作为唯一氮源进行发酵。将标准剂量(0.45AGU/g TS)的商业葡糖淀粉酶(Spirizyme Ultra,Novozymes)添加至对照菌株M0139。在不再添加外源酶的情况下对所有其它菌株进行发酵。60小时的发酵后产生的乙醇示于图52中。图52显示所有CBP菌株以与利用完全剂量葡糖淀粉酶的对照菌株相似的量产生乙醇。表T6-2菌株在不添加任何酶的情况下在60小时内产生与对照菌株M0139相同量的乙醇。这是在商业乙醇产量水平上证实的完全CBP作用的第一个范例,这时酵母产生的酶完全替代在标准商业方法中添加的外源酶。
表18.用于图52中的发酵的菌株的描述。基因AE8、AE9和AE10描述于表16和19。
表19.用于构建CBP菌株的淀粉酶的蛋白质和DNA序列
实施例24:在粗制玉米醪液上评估CBP菌株性能
还通过非液化玉米淀粉的发酵(图53)对选择的CBP菌株的性能进行了测定。图53显示即使在此类CBP菌株中表达的酶的组合未针对该底物进行优化,仍有超过80g/l的乙醇在无任何外源酶的情况下在72小时内通过CBP菌株从粗制醪液产生。
实施例25:通过进化改善菌株性能
酵母因其针对非常广泛的条件的调整的能力而闻名。该性质可用于提高酵母的乙醇和高温抗性以及在某些相关条件例如在玉米醪液的发酵过程中改善性能(乙醇产率)。为了将该可能性开发为产生能够达到更高的乙醇产率的更好的CBP酵母菌株的工具,通过在玉米醪液中使用系列转移来进化最佳CBP菌株之一的M1973。使用装有35%TS液化玉米醪液的摇瓶,利用工业培养基在35°C和150rpm下生长来进行系列转移发酵。以3天的间隔,将10ml转移至相同组成的新鲜培养基(5次转移)。在始于第二次的每一次转移时,将温度升高1℃。在最后一次转移时,其为38°C。在5次转移(~500小时)后,将细胞涂铺在YPD板上以进行评估。通过在两个不同的温度(32°C和35°C)和两个不同的固体浓度(30%和35%)下对液化的玉米醪液进行发酵来评估进化的菌株。来自冷藏原液的原始M1973菌株用作对照(图54)。图53显示在所有测试的条件下,在第48小时,适应的M1973菌株能够产生比亲代M1973更多的乙醇。因此酵母菌株的进化被证明是用于开发更好的菌株的强大工具。
实施例26:CBP菌株的工艺流程图
CBP法的实例示于图55中。在该实例中,将两个酵母CBP菌株用于该方法并且分别培养:S1和S2。利用酵母菌株S1对利用α-淀粉酶预处理的液化玉米进行发酵。S1具有最优的经工程化以在不添加任何外源酶的情况下高效率地将玉米淀粉转化成葡萄糖的淀粉酶和辅助酶的组。在乙醇蒸馏后,预处理釜馏物并且利用菌株S2进行发酵。S2具有一组针对玉米纤维转化以及木糖和阿拉伯糖途径工程化和优化的纤维素分解酶。S2也具有工程化的淀粉分解酶,因为当玉米纤维预处理时更多的淀粉将被释放。还可利用研磨的粗制玉米醪液。在该情况下,无需α-淀粉酶预处理并且α-淀粉酶可由菌株S1表达。
实施例27:工业酵母菌株的筛选和表征
本研究的目的是发现将组合高温/乙醇耐受性和高异源蛋白质分泌的工业宿主。几个工业酵母菌株获自各种商业来源(表20)。为了更好地理解菌株彼此之间的关系,如由Ness等人,1993(图56)所描述的对所有菌株进行基因分型。带型或基因分型模式之间的相似性反映菌株的遗传相似性。大多菌株显示2种基因分型模式之一。一个模式与M0139相似,另一个模式与M2390相似。M2392的模式与其它菌株不同。
比较工业菌株在高温下生长的能力(图57)。图57显示菌株在41°C下显示显著不同的生长。当通过板读数器定量测量YPD中的41°C最大生长速率时时,确认了相同的模式(图58,上)。还测试了菌株的鲁棒性–利用完全酶剂量在高固体(high solid)上达到的最大乙醇效价(图58,下)。最大生长数据41°C与鲁棒性数据的比较显示在高温耐受性与高乙醇耐受性之间存在正相关。因此,可以在高通量形式中通过它们的41°C最大生长速率估计菌株达到高乙醇效价的能力。图56和58中显示的数据概述于表21中。表21中的数据显示来自乙醇工业的菌株(基因分型模式B)倾向具有与葡萄酒菌株(基因分型模式A)相比较更高的乙醇和更高的温度的耐受性。
为了比较工业菌株表达异源蛋白质的能力,利用AE9-扣囊复膜酵母葡糖淀粉酶基因(登录号CAC83969.1)的相同表达构建体转化表20的宿主菌株。将4个拷贝的AE9定向整合进入FCY基因座。FCY用作阴性标记。使用的构建体与用于M2016构建(实施例23)的构建体相似。本实验中使用的表达构建体的图谱示于图60。对于每一种宿主挑拣几个转化株,筛选其淀粉活性(图59)。不同的宿主菌株显示不同的分泌GA的能力。有趣地,相同菌株的两个批次M0212和M2390具有不同的对于相同AE9表达构建体的平均表达水平。因此,显示了来自乙醇工业的强劲性乙醇耐受性宿主如M2390可以是用于工程化CBP菌株的适当宿主。
在对粗制玉米粉和常规玉米醪液的摇瓶发酵中一起测试对淀粉具有活性的每一种宿主(表20)的转化株和非转化宿主(图61-62)。图61和62显示宿主菌株M0212和M2390以及其GA转化株M2395和M2399对两种测试底物都具有优于其它测试的工业菌株的性能。M2390具有比M0212更高的平均GA表达分泌水平,从而被选择作为工程化CBP菌株的宿主。
表20.用于本研究的工业ethanologen菌株
表21.工业菌株筛选的概述。概述基于图56和58中显示的数据
表22.利用4个拷贝的扣囊复膜酵母葡糖淀粉酶基因(NCBI#CAC83969.1)转化的工业菌株及通过淀粉测定选择的具有对淀粉的活性的转化株(图59)。以与M2016相同的方式产生菌株M2111,但通过淀粉测定筛选更多的菌落(84)。通过工业玉米醪液发酵筛选几个具有活性的菌落,将性能最佳的菌株命名为M2111。
实施例28:利用耐受高乙醇/温度的酵母菌株增加异源GA的产量
本研究的目的是工程化表达高水平的异源葡糖淀粉酶的乙醇/温育耐受工业酵母菌株。以与M2016(实施例23)相同的方式产生菌株M2111,但通过淀粉测定筛选更多的菌落(84)。即使已显示ethanologen M2390宿主具有比葡萄酒菌株M0139高得多的乙醇/温度耐受性并且当补充以高剂量的外源酶时(实施例28)在高固体或高温条件下表现明显更好,但来源于M0139(表22)的M2111转化株具有比来源于强劲的M2390的M2395高得多的AE9分泌水平(图63)。归因于高水平GA产生,与M2395相比较,在不添加任何外源酶的情况下,M2111以更低的固体和更低的温度发酵达到更高的乙醇效价。因此有必要利用M2390来增加GA产量以改善CBP性能–在较低或无外源酶的情况下达到的最大乙醇。即使当利用定点整合获得时转化株之间仍存在显著的活性变化。因此筛选更多转化株通常产生具有更高表达水平的菌株。当选择M2395时仅筛选数个转化株。为了增加M2390宿主的AE9表达水平,利用与用于获得菌株M2016相同的AE9表达构建体转化M2390。将表达构建体整合进入FCY基因座,将FCY用作阴性选择。筛选了约1000个转化株的淀粉活性。以一式三份重复对最佳的30个转化株的淀粉测定(图63)。几个转化株显示与M2111相似并且比M2395高得多的活性。
利用玉米粉和自制醪液通过微量样品反应瓶测定筛选17个最具活性的转化株的CBP性能(图64-65)。新的强劲背景的有利方面在玉米粉发酵实验中特别引人注目。新菌株显示比没那么强劲的M2111菌株显著更好的性能并且达到更高的乙醇效价。利用摇瓶玉米粉发酵进一步分析几个最佳菌株(图66)。摇瓶发酵的结果确认了新型强劲CBP菌株利用为标准粗制玉米粉法的1/6的外源酶在33%玉米粉上达到140g/l以上的乙醇的能力。
针对最佳M2390+AE9转化株之一—M2691菌株(P10-19)进行常规醪液(图67)和粗制玉米粉(图68)的时间过程发酵。将未转化的宿主M2390在两个实验中用作对照。对于玉米醪液,在不添加任何外源酶的情况下对M2691进行发酵,同时将标准(对于玉米醪液法)剂量的商业葡糖淀粉酶(0.3AGU/g固体)添加至对照M2390。在玉米粉上,将标准粗制底物GA剂量(0.6AGU/g)添加至M2390,将1/6的酶添加至表达GA的M2691菌株。图67显示在常规液化玉米醪液发酵法中,遗传工程化的产生GA的菌株能够提供完全CBP并且在第72小时达到高于125g/l的乙醇。就我们所知,这是通过遗传工程化菌株在不添加任何外源酶的情况下达到的高工业相关乙醇效价的第一次例证。图68显示对于粗制玉米底物产生GA的菌株可达到甚至更高的乙醇效价(在第72小时,高于140g/L),该效价为粗制玉米粉发酵工业的标准。仍然需要向工程化菌株中添加小剂量的外源酶来提供最佳发酵,但外源酶的量可减少数倍。
实施例28:增加异源GA产量实现外源酶剂量的减少
图69显示实现外源酶剂量的减小所需的酵母菌株异源产生的GA的量。3个菌株用于本实验:未转化的M2390、低GA产生者M2395和高GA产生者M2519(P6-65)。通过添加不同剂量的GA在摇瓶中的玉米粉上进行菌株发酵。将0.6AGU/g固体的标准玉米粉工业GA剂量计算为100%。该数据明确地显示由酵母菌株产生的GA的量对外源GA剂量的减少具有显著的影响。对于使用的特定外源GA(Spirizyme Ultra),归因于由M2519菌株异源表达的GA,剂量至少减少75%。此外,在发酵结束时,对于产生GA的菌株,存在额外的葡萄糖。在其它实验中显示了:如果以更低的33%的固体进行玉米粉的发酵,该葡萄糖可在100%的外源酶剂量下转化成额外的乙醇产率。
实施例29:葡糖淀粉酶表达的稳定性
测试了几个M2390+AE9菌株的GA表达的稳定性。菌株M2519和M2691的数据示于图70中。将菌株在YPD中繁殖,生长至静止生长期,以100倍的稀释度传代11次(1次传代等于约9个世代)。贮存传代之间的几个样品。将所有样品和原始菌株一起涂铺和接种在YPD中。随后在相同的淀粉测定中测量所有样品的对淀粉的活性。9个测试的菌株中仅有3个损失一些活性(10-50%)。大部分菌株保留100%的其淀粉分解活性长达99个世代。该数据表明大多数通过定点整合构建的菌株在遗传上是稳定的。
实施例30:针对在酵母中的功能性表达筛选糖分解基因
针对在酵母中的功能性表达筛选多个编码糖分解酶的基因(表23)。基因由GeneArt(现Life Technologies)合成或通过PCR从基因组DNA分离。将一些基因与天然序列一起表达,在其它基因中,天然信号序列被酿酒酵母转化酶信号序列替代。将一些合成基因进行密码子优化以用于在酿酒酵母中表达(通过GeneArt),利用天然DNA序列合成其它基因。所有基因在ENO1启动子和终止子控制之下从2-μ质粒pMU1575表达。通过克隆或酵母介导的连接将基因插入在pMU1575的PacI/AscI位点之间。将表达构建体转化进入工业背景Mascoma菌株M1744,在最简URA缺乏培养基上进行选择。将转化株在YPD上生长3天,分析上清液的对淀粉、支链淀粉、木聚糖、pNPX(木糖苷酶活性)、麦芽糖和果胶的活性(图71)。基于预测的活性选择每一种酶的测定。在一个或多个测定中显示分泌型活性的酶在表23中突出显示。图71显示了一些酶的支链淀粉、木聚糖和果胶测定的结果。异支链淀粉酶SE35对于支链淀粉是有活性的。5种木聚糖酶对木聚糖是有活性,3种果胶裂合酶对于果胶是有活性的。支链淀粉酶SE41对于支链淀粉具有微量分泌型活性。葡糖淀粉酶AE82对淀粉和麦芽糖具有一定的分泌型活性。
表23.针对在酵母中的功能性表达分析的基因。对于大多数基因,从NCBI数据库获得蛋白质序列。对于标记有“*”的基因,DNA基因序列获自Mascoma解糖热厌氧杆菌基因组序列数据。
实施例31:鉴定增加糖从工业玉米底物的释放的酶及其组合
蒸馏玉米糖浆(Distiller corn syrup)为从将玉米加工成乙醇留下的可溶性级份,其为用于鉴定将允许从玉米醪液释放更多糖的酶的底物之一。玉米糖浆包含在玉米醪液水解/发酵过程中未降解的可溶性低聚糖。测试了几种酵母产生的酶的玉米糖浆的转化。在FPLC上通过离子交换和疏水相互作用从酵母上清液纯化几种酶:CBH1、CBH2、EG2、BGL、XYL和XLD(表24)。对于其它酶,将表达酶的酵母菌株在YPD中生长3天,将上清液用作酶源。表24概述了关于本实验中使用的酶的信息。将两种酶的上清液按体积计等比例混合。将单种酶的上清液与空菌株对照M0139的上清液混合。图72显示此类测定之一的结果。利用和不利用酵母产生的葡糖淀粉酶(AE9)进行实验。表25显示用于该玉米糖浆测定的每一种纯化的酶的量。一些酶的添加增加了糖从玉米糖浆的释放。AE9本身具有最大的影响,表明在玉米醪液加工后存在许多未降解的淀粉。其它酶例如α-葡糖苷酶、β-葡糖苷酶、乙酰基木聚糖酯酶(与纤维素酶和半纤维素酶组合)也产生了葡萄糖从玉米糖浆的释放的显著增加。
基于该数据,选择了几个基因,所述基因具有因增加的糖从玉米醪液或玉米粉的释放而改善表达AE9葡糖淀粉酶的菌株M2111的潜力。选择的基因列于表26中。基于推理研究法选择表26中的其它候选者,所述推理研究法基于哪种酶可对基于底物结构的糖释放具有作用(Saulnier等人,Carbohydrate Polymers,26:279-287,1995)。所有选择的基因都显示在酵母中的功能性表达。
表24.玉米糖浆测定中使用的酶(图24)。除AE9外所有酶在2u质粒上在来自2-μ质粒pMU1575的酿酒酵母ENO1启动子和终止子的控制下表达。M2111中的AE9从整合进入染色体的4个拷贝表达(与M2016中一样)。将基因针对酿酒酵母进行密码子优化,并且由GeneArt合成。表达酵母和真菌基因使之具有天然信号序列。将细胞基因连接于酿酒酵母转化酶信号序列。
表25.以mg的酶/克总固体表示的玉米糖浆测定实验中使用的纯化的酶的量(图72)
表26.被选择用以在M2111菌株中单独或组合表达的酶。SBD–淀粉结合结构域。
实施例32:改进的淀粉分解菌株的构建和筛选
为了产生用于额外的AE9糖分解酶表达的转化宿主,将URA3从M2111敲除,将所得的M2125菌株用作用于转化的宿主。对于来自表26的每一种酶,构建靶向染色体上的δ位点的整合表达盒。URA3基因用作自养型选择标记。将每一个在酿酒酵母强组成型启动子和终止子控制之下的目标基因插入在用BamHI和EcoRI降解的pMU2382的URA3与Delta2片段之间(图73)。以与URA3相同的方向通过酵母介导的连接插入表达盒。包括δ位点、URA3和表达盒的片段可通过PCR或限制性降解来分离,将该片段转化进入M2125。将一些酶单独转化,将其它酶组合地转化。当转化1个以上的基因时,将不同的DNA片段以等比率(总DNA量与用于单个基因的量相同,约1μg)混合。对于每一个转化,挑拣约100个菌落(一个96孔板),通过特异性测定(例如,对于整合的木聚糖酶使用木聚糖测定,对于α-淀粉酶使用淀粉测定)进行预筛选。随后通过玉米粉测定测定几个最具活性的转化株,针对增加的糖释放筛选所述转化株。对于每一个测定,将转化株在YPD上生长3天,测定上清液。第二玉米粉测定的实例示于图74上。图74显示许多转化体显示高于亲代M2111菌株的活性。本实验中筛选的转化描述于表27中。
选择在玉米粉测定中释放最多糖的转化株(在图74中突出显示的)用于通过发酵进行筛选。通过对两种底物:自制玉米醪液和粗制玉米粉的微量样品反应瓶发酵测定预筛选第一菌株。挑选自制醪液和玉米粉作为筛选底物,因为它们允许更好地辨别不同的菌株(更坚硬的底物),然而工业玉米醪液太容易消化了以致不能允许观察到菌株之间的小的差异。每一种底物产生不同组的最佳表现者。似乎在两种底物中都表现良好的唯一菌株为具有整合的AE7(德巴利酵母α-淀粉酶)的菌株。筛选的下一步骤是按比例放大至摇瓶,并且也在相同的两种底物上进行,但将不同组的菌株用于每一种底物,这取决于在微量样品反应并测定中的表现。摇瓶筛选实验的结果示于图75和76中。图75和76显示几种不同的糖分解基因及其组合对乙醇效价具有正作用。确认微量样品反应瓶测定结果,AE7对两种底物具有正作用。
尝试重新制备M2111菌株以增加AE9的产量。应注意,即使当利用定向整合获得时,转化株之间仍然存在显著的活性变化。因此,筛选更多的转化株通常产生具有更高的表达水平的菌株。当选择M2111时仅筛选84个转化株。为了升高AE9表达水平,用与用于制备M2111菌株相同的AE9表达构建体转化M139。将表达构建体整合进入FCY基因座,FCY用作阴性选择。针对淀粉活性筛选了约1000个转化株。几个转化株显示高于M2111的活性。通过微量样品反应并发酵测定在自制醪液和粗制玉米粉上筛选几个最具对淀粉的活性的转化株。在粗制玉米上,相同的转化株具有比M2111更高的EtOH产率。在随访实验中,在摇瓶发酵中在相同的两种底物上筛选几个最佳的菌株(图77)。本实验确认了具有更高的对淀粉的活性的菌株在玉米粉上达到更高的乙醇效价。对于自制的玉米醪料,与M2111相比较不存在显著差异。对面粉的性能差异可归因于AE9的更高的分泌水平。为了测试该假说,将几个最佳菌株接种在YPD中并且在其中生长3天。利用HPLC测量AE9。将蛋白质数据与EtOH数据一起作图于图77中。对于玉米粉发酵发现AE9水平产量与EtOH产率之间的相关性,对于自制醪料不存在这样的关系。该数据表明对于玉米粉,菌株仍然是GA限制的,然而对自制醪液它们不是GA限制的。
也在工业玉米醪液(图78和79)上测试从在自制醪液和粗制玉米粉上进行的筛选出来的性能最佳的菌株,所述工业玉米醪液对于该应用(用于大部分商业玉米乙醇设施)是最商业相关的底物。来自该筛选的最佳菌株概述于表34中。
表27.来自图74的玉米粉活性测定的转化ID(T)。与每一个基因一起使用的酿酒酵母启动子示于括号中。
表28.被选择用于在摇瓶中在玉米醪液上进行筛选的表达除AE9外的糖分解酶的菌株(图75)。
# |
菌株ID |
菌株描述 |
1 |
T4-8 |
M2111+AE7 |
2 |
T4-1 |
M2111+AE7 |
3 |
T5-88 |
M2111+AE1 |
4 |
b |
M2111+AE1+AE8+AE10 |
5 |
d |
M2111+AE1+AE8+AE10 |
6 |
i |
M2111+AE1+AE8+AE10 |
7 |
o |
M2111+AE1+AE8+AE10 |
8 |
r |
M2111+AE1+AE8+AE10 |
9 |
M2111 |
对照 |
10 |
M139 |
对照 |
表29.被选择用于在摇瓶中在玉米粉上进行筛选的表达除AE9外的糖分解酶的菌株(图76)。
# |
菌株ID |
菌株描述 |
1 |
T2-6 |
M2111+AE9 |
2 |
T11-32 |
M2111+BC60+SE66 |
3 |
T18-11 |
M2111+SE35 |
4 |
T5-88 |
M2111+AE1 |
5 |
T4-8 |
M2111+AE7 |
6 |
b |
M2111+AE1+AE8+AE10 |
7 |
i |
M2111+AE1+AE8+AE10 |
8 |
p |
M2111+AE1+AE8+AE10 |
9 |
M2111 |
对照 |
10 |
M139 |
对照 |
表30.被选择用于在摇瓶中在自制玉米醪液上进行筛选的表达AE9的菌株(图77,上)。
# |
菌株ID |
菌株描述 |
1 |
P4-19 |
M139+AE9 |
2 |
P8-60 |
M139+AE9 |
3 |
P11-67 |
M139+AE9 |
4 |
P12-65 |
M139+AE9 |
5 |
P12-17 |
M139+AE9 |
6 |
M2111 |
对照 |
7 |
M139 |
对照 |
表31.被选择用于在摇瓶中在玉米粉进行筛选的表达AE9的菌株(图77,下)。
# |
菌株ID |
菌株描述 |
1 |
P2-9 |
M139+AE9 |
2 |
P11-20 |
M139+AE9 |
3 |
P12-84 |
M139+AE9 |
4 |
P12-65 |
M139+AE9 |
5 |
P12-17 |
M139+AE9 |
6 |
M2111 |
对照 |
7 |
M139 |
对照 |
表32.被选择用于在摇瓶中在工业玉米醪液上进行筛选的来自在自制醪液和玉米粉(图75-77)上进行的摇瓶筛选实验的最佳菌株(图78)。
表33.被选择用于在摇瓶中在工业玉米醪液上进行筛选的来自在自制醪液和玉米粉(图75-77)上进行的摇瓶筛选实验的最佳菌株(图79)。
表34.在工业玉米醪液上被选择作为最佳表现者的菌株(图78和79)
菌株ID |
菌株描述 |
T11-45 |
M2125+SE34+SE66 |
T2-40 |
M2125+AE3+AE5+AE7 |
T4-8 |
M2125+AE7 |
P12-84 |
M139+AE9 |
实施例33:通过定点和随机整合构建的菌株的稳定性
测试通过定点整合构建的M2111菌株的稳定性。M2111显示出显著的稳定性。在非选择性YPD培养基中在长达99个世代中没有活性的降低(图80,上)。为了测试随机整合菌株是否具有充足的稳定性用于工业发酵,将来自自制醪液和玉米粉摇瓶发酵的性能最佳的菌株中两个菌株T4-1(M2125+AE7)和T2-6(M2125+AE9)(图75和76)进行与M2111(图80,底)相同的稳定性测试。图80显示即使这些测试的随机菌株不具有与定点的M2111相同的稳定性水平,它们在YPD上繁殖的整个过程中也只损失极少的活性。在长达9-10个世代中活性没有损失。在约第50个世代仅10%损失,在约第99个世代损失20%。活性降低的方式与两个不同的随机菌株极其相似。在工业酵母制造过程中,细胞经历约28个世代(体积增加300000000倍)。在繁殖阶段中,细胞通过约4个世代,在发酵过程中经历4个世代。因此,世代的总数为约36。因此,鉴于在约50个世代仅有10%丢失,因此在工业应用的所有阶段过程中没有显著的活性丢失。
实施例34:用于表达多个酶的定点菌株构建的整合策略
图81显示可用于构建表达多个酶的菌株的单一位点整合策略(上)和多位点策略(中)。在单一位点策略中,阴性标记交替存在于每一轮转化中,所有表达盒彼此相邻地整合入相同基因座。在多位点策略中,阳性和阴性标记彼此交替,并且在每一轮转化中,表达盒可整合入染色体上的任何位点。
实施例35:几种纤维素分解酶在用于木材水解的单个酵母菌株中的表达
根据通过在测定中混合几种粗制或纯化的形式的纤维素酶产生的数据,确定产生多种纤维素分解活性的菌株可增强表达菌株水解木质纤维素的能力。为了测试该构想,产生了同时表达高达7个酶的酿酒酵母的菌株。简而言之,强劲的木糖利用菌株M1577第一个被工程化以产生高水平的C.lucknowense CBH2。
连续进行两次转化以产生该菌株。在第一步骤中,用NotI消化质粒pMU2115以产生将CBH2表达和zeocin选择盒靶向rDNA基因座的整合盒。在包含酵母提取物(10g/L)、蛋白胨(20g/L)和木糖(20g/L)的具有zeocin的琼脂糖(YPX+zeo)上选择来自该转化的菌落,挑拣菌落,在微晶粉末纤维素测定方案中筛选酶活性。一旦从这些筛选鉴定了最佳转化株,再次用2个另外用于CBH2表达的构建体转化该转化株。其中一个pMU2143(用NotI降解的)将CBH2表达构建体和卡那霉素抗性标记靶向酿酒酵母中的重复的tau1基因组基因座。另一个质粒pMU2142(也用NotI消化)将CBH2表达盒和潮霉素抗性标记靶向重复tyB基因组基因座。在该第二转化和在具有zeocin、潮霉素和G418存在的YPX琼脂糖板上选择后,使用下文中描述的微晶粉末纤维素测定法再次筛选菌落。贮存具有最高CBH2产量的菌株,命名为M1873。M1873能够在摇瓶发酵中产生~150mg/L的CBH2,如通过HPLC测定测量的。
随后用由酵母通过同源重组装配的PCR盒转化M1873以产生允许在酿酒酵母FCY1基因座上共表达纤维素酶(内切葡聚糖酶)的盒。这四个内切葡聚糖酶为来自烟曲霉菌的EG1、来自里氏木霉的EG2、来自费希新萨托菌的EG3和来自嗜热裂孢菌的Cel9A,其全都在来自酿酒酵母的不同启动子和终止子(ENO1启动子/PYK1终止子、PMA1启动子/ENO1终止子、TPI1启动子/FBA1终止子和PDC1启动子/ENO2终止子)的控制之下。表35列出了用于产生用于装配的适当片段的引物和模板。表37列出了所有引物序列,同样地在下文中列出了质粒序列。转化后,选择抗5-氟胞嘧啶(其对具有完整FCY1基因座的细胞是有毒性的)的菌株。此外,检查菌株的对Clonat的抗性,利用用于完整的FCY1基因座的PCR(X10821/X10824)进行检查。使用CMC活性测定和PHW测定筛选显示Clonat抗性并且无天然FCY1基因座的菌株。贮存从PHW产生最多葡萄糖的菌株,将其称为M2217。通过HPLC测定确认CBH2产量的保留。
在构建M2217后,将终转化用于产生也表达与来自灰腐质霉(Humicola grisea)的CBD(pMU1392)融合的埃默森篮状菌CBH1的菌株。这以上述相同的方法来进行,唯一的不同在于利用不同组的PCR产物。此外,用于基因装配的两个片段来源于质粒而非PCR产物的降解。表36列出了使用的片段。利用特异于Ty1转座子的δ位点的整合侧翼将两个拷贝的编码埃默森篮状菌CBH1与灰腐质霉CBD(来自灰腐质霉CBH1)之间的融合蛋白的基因的表达盒彼此相对放置(图82)。转化后将细胞涂铺在包含6.7g/L酵母氮碱基和20g/L纤维二糖(作为糖源)的培养基上。该培养基允许基于对扣囊复膜酵母BGLI的表达和分泌的选择来选择转化株。随后在PHW测定中筛选转化株的活性,贮存最佳的候选者,赋予其编号M2230、M2231和M2232。
在该组菌株已构建后,使用PHW方法进行终比较。简而言之,将菌株的组在48孔板中于YPD培养基需氧生长2天。将来自这些培养物的上清液连同少量(2mg/g)由AB Enzymes提供的里氏木霉的纤维素酶和缓冲液添加至PHW(4%的总固体终浓度)。利用HPLC跟踪随时间的葡萄糖从PHW释放的量。来自该比较的数据可见于图83中。仅产生C.lucknowense CBH2的M1873提供了相对于该测试中的对照菌株活性的巨大增加—约176%的葡萄糖释放的增加。4种内切葡聚糖酶的组的添加相对于M1873又增加18%,CBH1和BGL的添加比之又增加28%。总体上,产生7种纤维分解酶的菌株比阴性对照菌株产生更多的水解,相对于对照菌株使水解相对于增至3倍以上,相对于仅产生单种酶的菌株增加50%以上。
随后测试一组来自上述菌株的菌株的影响从预处理的桦树木产生的乙醇的量的能力。图84提供了来自包含少量外源纤维素酶的同时进行的糖化和发酵(SSF)反应的数据。SSF条件如下:终固体载量为18%(w/w)的底物MS887(从用水预处理硬木材产生的不溶性底物),2mg AB酶纤维素酶制剂/g的总固体,10%v/v接种物,35°C,利用5g/L CaCO3控制的pH5.5。使用的培养基为玉米浆(CSL,12g/L)和磷酸氢二铵(DAP,0.5g/L)。在配备有排气口的并且通过大搅拌棒混合的密闭的塑料离心瓶中进行反应,通过将所有上述成分组合在100克终质量的分批培养物中,在摇床上以225rpm混合来进行反应,在160小时的过程中取样。M1873和M2232都能够在这些条件下比非纤维素分解M1577产生更多的乙醇。M1873相对于M1577可在未洗涤的和碱洗涤的预处理的硬木材上分别获得15%和33%的产率增加。M2232可对两种底物产生比M1577多20%和43%的乙醇。M2232比M1873产生更多乙醇的能力显示了在单个菌株中同时表达7个酶的组合的功用。
表35.用于在酿酒酵母中装配EG表达岛的PCR片段
片段标识号 |
描述 |
引物 |
模板 |
1 |
FCY f1 |
X11631/X12837 |
gDNA |
2 |
EG1 |
X12838/X12822 |
pMU1821 |
3 |
EG2 |
X12823/X12824 |
pMU1479 |
4 |
EG3 |
X12825/X12826 |
pMU1958 |
5 |
Cel9A |
X12827/X12828 |
pMU1975 |
6 |
Clonat标记 |
X12829/X12841 |
pMU227 |
7 |
FCY f2 |
X12842/X11634 |
gDNA |
表36.用于在酿酒酵母中装配CBH1表达岛的PCR片段
表37.用于此类菌株构建的引物
实施例36:辅助酶在酵母中的表达
对于下文中描述的蛋白质,在酵母中以其天然形式表达以及为了增加纯化的容易性添加可切割的His标签表达了各种酶。测定具有和不具有His标签的蛋白质以确定标签是否影响蛋白质的活性或结合模式。如果认为必要,可在随后的酶评估测定中在利用肠激酶切割并且再纯化后除去标签。将基因PCR扩增或进行密码子优化并且合成,然后克隆进入已用Pac1和Asc1消化的载体pMU1531。通过酵母经由同源重组添加表达为氨基酸DDDDK的C末端肠激酶位点,表达为氨基酸GGSPPS的接头以及表达为氨基酸HHHHHH的6X His标签,对构建体进行测序以确认标签序列是完整的并且基因和标签是符合读框的。
将来自转化株的菌落生长在指定的培养基中进行48至72小时。将培养上清液通过2um PE滤器过滤,使用10,000分子量的截止滤器将其浓缩约20倍。在非还原条件下通过SDS-PAGE电穿孔筛选选蛋白质质量。
α-葡糖苷酸酶在酵母中的表达
在酵母中表达了树干毕赤酵母α-葡糖醛酸糖苷酶GH67(NCBI#ABN67901)(图85)。α-葡糖苷酸酶经预测为约111kDa(未标记的)和113(C末端His标记的),并且在图85中看见为100至150kDa之间的条带。迄今表征的大多数GH67 α-葡糖醛酸糖苷酶释放连接于末端木吡喃糖基残基的MeGlcA残基。此处描述的蛋白质释放连接于末端和内部木吡喃糖基残基的MeGlcA残基(Ryabova等人,FEBS Letters583:1457–1462,(2009))。
木糖葡聚糖酶在酵母中的表达
在酿酒酵母中功能性表达了几种木糖葡聚糖酶(表38)(图86-87)。表达黑曲霉XGL的菌株产生最多活性;然而,His标签添加对活性具有负作用(在第1小时约减少50%的活性)。
银染色的SDS-PAGE和Westen印迹分析表征了分泌的木糖葡聚糖酶(图88)。在SDS-PAGE上,对于黑曲霉xgl1(~150kDa),可见大的清楚条带;对于棘孢曲霉xgl1无条带;对于费希新萨托菌xgl为离散的条带(~130kDa)。蛋白质His标签形式显示明显更少的分泌的蛋白质。Western印迹分析显示黑曲霉xglHis标签的信号很强;费希新萨托菌xgl-His标签的信号较弱,并且A.c.xgl-His标签是不可见的。里氏木霉xgl+/-His标签因AZCL木糖葡聚糖测定中不可检测的活性而未被检查到。
表38.酿酒酵母中表达的木糖葡聚糖酶
酯酶在酵母中的表达
在酿酒酵母中功能性表达了几种酯酶(表39)。表达通过SDS-PAGE(图89)和活性测定来表征(图90)。SDS-PAGE分析显示黑曲霉FAEA(pMU1880)在~36kDa处显示明显的条带,球毛壳菌FAEB(pMU1882)显示多个可见条带,对于土曲霉(Aspergillusterreus)FAEA(pMU1884)注意到无条带。对于球毛壳菌CIP2(pMU2095+/-C His标签)和里氏木霉CIP2(pMU2097)的葡糖苷酸酯酶可见明显的条带。1-萘基-醋酸酯用于测定阿魏酸酯(图90),但该底物不太适合葡糖醛酸酯酶作用。没再进一步测试葡糖醛酸酯酶的活性。黑曲霉FAEA(pMU1880)对该底物显示最佳的活性,球毛壳菌FAEB(pMU1882)次之。
表39.酿酒酵母中表达的酯酶
α-半乳糖苷酶在酵母中的表达
在酵母中功能性表达了几种α-半乳糖苷酶(表40)(图91-93)。所有表达AGL1和2的菌株都显示分泌型活性(图91),但His标签对活性(下降约50%)具有负面影响。在进行这些实验时,无法获得AGL3菌株用于测试。
还通过Western印迹(图92)和银染(图93)分析了α-半乳糖苷酶。通过Western印迹,里氏木霉AGL3样品在约50-70kDa处具有一条明显的带。在SDS-PAGE上,对于里氏木霉agl1和埃默森篮状菌agl1(预测的大小:48.5 & 49.4kDa)注意到可见(弥散)条带(超过100kDa);对于里氏木霉agl2(预测的大小:82kDa)注意到~80kDA的不显眼的条带,但表达不足(未显示)。
表40.酿酒酵母中表达的-α半乳糖苷酶
实施例37:预处理的混合硬树木的酶促转化
为了估量各种酶对预处理的混合硬树木(PHW)的作用,利用2%的固体,在pH5.0和38°C下进行测定。在利用或不利用另外的商业酶的测定中估量酵母产生的纯化的酶。使用BioRad 87H柱利用HPLC评估(通过因预处理的性质而引起的糖、主要是葡萄糖的释放)酵母产生的酶的混合物的活性。下面的数据显示此类混合实验的一些结果。图94显示CBH2、BGL、EG1、EG2和EG3的添加使底物的水解增加,高于仅添加CBH2和BGL的商业酶混合物可获得的水解程度。因此,酵母产生的EG1、EG2和EG3在水解PHW中提供了益处。图95显示酵母产生的并且纯化的木聚糖酶,木糖苷酶和AXE的进一步添加使PHW的水解增加,高于对于仅商业酶混合物或添加有CBH2的商业混合物所看见的水解程度。这进一步表明上述辅助酶的益处。
图96显示以组合的方式添加这些酶继续显示相比于仅仅添加所述辅助酶之一的提高。
实施例38:造纸淤泥的酶促转化
上述信息是在商业酶存在的情况下在PHW上产生的。下列数据显示了纯化的酵母产生的酶在不添加任何另外的酶的情况下在2%,pH5.0,38°C水解测定以及SSF中水解造纸淤泥的效率。将这些结果与添加商业酶的相同测定或发酵相比较。
图97和98中的这些数据显示CBH1、CBH2、BGL、EG1、EG2、EG4、EG5、木聚糖酶和木糖苷酶的组合,当组合在一起时比当单独地测定时水解更多的底物。这在发酵中得到了进一步确认(图99)。通过SSF针对两种不同类型的工业造纸淤泥对纯化的酶进行了分析。利用1M柠檬酸盐洗涤两种造纸於泥底物。在下列条件下进行SSF:2%的总固体、1.1g/L干细胞重量M2108、15mg/mL四环素、YP培养基、pH5.0,35°C和220rpm。以4.1mg/g TS的剂量施用选择的酵母产生的酶的混合物,将其与范围在0–6.1mg/g TS内的AB Whole Broth的剂量反应相比较。纯化的酶混合物示于表41中,结果示于图99中。基于图99中显示的数据,酵母产生的酶的剂量与约3mg/g TS AB Whole Broth商业酶混合物对两种底物的剂量相当。这些数据支持主张:酵母产生的纯化的酶的组合可水解工业上相关的底物例如造纸淤泥而无需任何另外的商业酶。由酵母产生的酶产生的糖在SSF过程中被酵母成功地转化成乙醇。
表41.用于造纸淤泥SSF的酵母产生的酶混合物
表42.最佳酵母表达的纤维素酶、半纤维素酶和辅助酶的概述。高亮的黄色–用于木材转化的关键酶;黄色+绿色–用于造纸淤泥转化的关键酶(基于图94-99中显示的数据)。
实施例39:菌株鉴定和在30% TS玉米粉上测试的菌株的活性
对在玉米醪液发酵结束时剩下的上清液进行上清液测定,以确定此类酶的任一种是否可进一步水解可溶性寡聚体。经工程化而具有α-葡糖苷酶活性的菌株的细胞上清液从玉米醪液发酵结束时剩下的可溶性寡聚体释放葡萄糖。观察到的增加高于来自背景菌株(M749)的上清液。所有样品包含无大差别的剂量的商业葡糖淀粉酶。
具有0.3AGU/g TS GA的对照M0139达到121g/L的乙醇,潜在乙醇为127g/L。M2111在产生的乙醇和潜在的乙醇上更高一点,这显示了CBP的作用。存在少量具有超过128g/L的潜在乙醇的菌株,T2-6具有133g/L的潜在乙醇。T2-6(AE9)同样地也达到最高乙醇效价125g/L。T11-32(BC60,AXE)也具有超过130g/L的潜在乙醇。所有此类菌株都显示了高于对照菌株的CBP作用。
表43:用于评估通过添加上清液预处理的湿饼的酶的组。
MO139为对照菌株并且不具有酶促活性。将每一种酵母产生的纯化的酶添加至对照菌株,并且看到小的益处。当一起添加时,如对于Big4或Big6看到的,看见水解的较大增加。对于1mg/g TS的商业果胶酶(Multifect)至Big6的添加看到最大的葡萄糖和木糖产率。
实施例40:菌株鉴定和在预处理的湿饼(ELN afoster2 corn-074)上评估的上清液中表达的活性
当在商业酶的混合物存在的情况下使用酵母产生的纯化的酶时,将在蒸汽枪中通过自动水预处理(30% TS,160°C,20分钟)的玉米湿饼用于评估对水解的作用。使用的商业酶的混合物(称为MM)为0.9mg/g TS ABWhole Broth、0.1mg/g TS Multifect果胶酶和0.1mg/g TS SpirizymeGA。以1mg/g TS的浓度添加纯化的CBH1,其中以0.25mg/g TS添加所有其它纯化的酶。将这些酶在24孔板中添加至2%TS的预处理的湿饼(PWC),75mM柠檬酸钠缓冲液pH5.0,0.01%叠氮化钠中至4mL的总体积。将水解物在35°C下以220rpm进行温育。48小时的结果示于图102中。
仅用商业酶混合物“MM”释放的葡萄糖为2.8g/L。当除“MM”外随后还加载纯化的酵母产生的酶时,观察到水解的递增趋势。当添加所有纯化的酶而不添加“MM”时(图的右侧的最后的条柱中显示的),仍然观察到葡萄糖释放。纯化的酶与或不与商业酶一起的添加显示水解。在蒸汽枪中在190°C下用水处理10分钟预处理玉米粗纤维(与湿饼类似但已除去蛋白质),其中另一个条件使用1%的硫酸进行预处理。与先前的实验类似,在商业酶混合物存在的情况下通过添加纯化的酵母产生的酶来评估这两种底物。该特定测定的目的是测定在1mg/g TS的比率为30%:45%:25%的C-tec:H-tec:Multifect果胶酶的商业酶混合物与0.5U/gTS Depol FAE存在的情况下纯化的CBH1与CBH2的最佳比率。使用的各种混合物示于表44中,结果示于图103中。
表44:用于测定针对预处理的玉米粗纤维,CBH1对CBH2的最佳比率的纯化的酶的混合物。以1mg/g TS的剂量给每一个样品施用比例为30%:45%:25%的C-tec:H-tec:Multifect果胶酶的商业混合物与0.5U/gTS Depol FAE。
结果显示不断减少的量的CBH1与葡萄糖产率的减少相关。该作用对酸预处理的粗纤维比对190°C,10分钟处理的底物更明显。当仅加入4mg/g TS CBH1时,看到与CBH2存在时相比较相同的或更好的产率。简而言之,CBH1越多,葡萄糖产率越高。XLD、XLN和AXE(各自0.33mg/g TS)的添加也有助于使终产率相比商业酶混合物少量提高。
实施例41:方法
酵母菌株
M0509(NCPy102;ura-3::kanMX/ura-3::kanMX
gre3::loxP/gre3::loxP TAL1+/loxP-PTPI-TAL1
RKI1+/loxP-PTPI-RKI1 RPE1+/loxP-PTPI-RPE1
TKL+/loxP-PTPI-TKLδ::PTPI-xylA PTPI-XKS)和M0749(NCPy102;
ura-3::kanMX/ura-3::kanMX gre3::loxP/gre3::loxP
TAL1+/loxP-PTPI-TAL1 RKI1+/loxP-PTPI-RKI1
RPE1+/loxP-PTPI-RPE1 TKL+/loxP-PTPI-TKLδ::PTPI-xylA
PTPI-XKS fur1Δ::Nat/FUR1)菌株来源于二倍体葡萄酒菌株NCP
Y120(获自University of Stellenbosch,South Africa)并且描述于McBride等人,WO2010/060056,2010中。M0139(MAT a/MATα)为从Universityof Stellenbosch接受的酿酒酵母二倍体葡萄酒菌株。M1744为具有双URA3敲除(无标记)的M0139的衍生物。乙醇红(ER)是获自LesaffreCorp.的商购可得的二倍体ethanologen菌株。
淀粉-DNS测定
试剂:
二硝基水杨酸试剂溶液(DNS),1%
(可在4°C下贮存数月)
ο3,5-二硝基水扬酸:10g
ο亚硫酸钠:0.5g
ο氢氧化钠:10g
ο添加水至:1升
ο利用葡萄糖(使用浓度为0、1、2、3、4、5和6g/l葡萄糖样品,计算斜率[S])校准DNS
淀粉2.2%,pH5.0
(现用现配;将被酶稀释至2%)
ο在煮沸的水浴中将1.1g玉米淀粉溶解在50ml的水中
ο添加1ml的3M NaAc缓冲液pH5.0
程序:
1.将淀粉等分至96w PCR板150μl/孔(每一个待测量的样品一个孔)。在充填重复移液器之间振动淀粉以防止淀粉沉降。
2.将DNS等分至不同的96w PCR板50μl/孔(每一个待测量的样品2个孔)
3.将16.7μl的酶样品(细胞上清液)添加至淀粉,混合并且立即取出25μl置于50μl的DNS(t=0时的对照样品)中
4.在PCR仪中在35°C温育酶/淀粉样品3小时
5.将25μl的酶/淀粉样品取出放至50μl的DNS(t=3小时样品)中
6.在99°C温育DNA样品5分钟以进行显色,在4°C冷却5分钟(使用PCR机器)
7.将50μl的DNS样品转移至96w测定板中,并且测量565nm处的吸光度
淀粉分解活性[A]计算(转化的淀粉%):
A(%)=OD565[t=3h]–OD565[t=0]g/L X100%
S(DNS斜率) 20g/L
应当使用具有相同生长OD的细胞培养物的上清液。如果细胞差异生长,则应当根据细胞密度对活性进行标准化。
淀粉-GHK测定
试剂:
己糖激酶(HK)试剂
(可在-20°C下贮存数月)
ο将50ml的水添加至HK试剂瓶(Sigma #G3293-50mL)并且通过上下翻转进行混合(通常使用6个瓶子来制备贮液)
ο在完全溶解来自所有瓶的组合试剂后,添加Tris(5.45g/6瓶)
ο在50mL螺旋帽离心管中制备22mL的等份。(一个管足以测定96孔微量滴定板)。
ο冷冻贮存等份
ο利用葡萄糖标准物校准每一个新的贮液,计算斜率S(葡萄糖浓度为2、1、0.5、0.25、0.125、0g/l)。直至2g/l葡萄糖,本测定是线性的。
淀粉2.2%,pH5.0
(现配现用;将被酶稀释至2%)
ο在煮沸的水浴中将1.1g玉米淀粉溶解在50ml的水中
ο添加1ml的3M NaAc缓冲液pH5.0
程序:
1.将淀粉等分至96w PCR板中150μl/孔(每一个待测量的样品一个孔)
2.将HK试剂等分至不同的96w测定板200μl/孔(每一个待测量的样品2个孔)
3.将16.7μl的酶样品(细胞上清液)添加至淀粉,混合并且立即取出10μl,随后混合入200μl的HK试剂(t=0时的对照样品)。用平板薄膜覆盖,将HK板在30℃下温育≥30分钟
4.在PCR仪中在35°C温育酶/淀粉样品3小时
5.取出10μl酶/淀粉样品,与200μl的HK试剂混合(t=3小时,样品)。用平板薄膜覆盖,将HK板在30℃下温育≥30分钟
6.测量两块HK板在340nm处的吸光度
淀粉分解活性[A]计算(g/L释放的葡萄糖):
A=OD340[t=3h]–OD340[t=0]g/L
S(斜率)
应当使用具有相同生长OD的细胞培养物的上清液。如果细胞差异生长,则应当根据细胞密度对活性进行标准化。
麦芽糖测定
试剂:
麦芽糖2.2%:
ο1.1g D-麦芽糖
ο1mL 3M醋酸钠缓冲液pH5.0
ο用水加至50mL
己糖激酶(HK)试剂(参见淀粉-GHK测定)
程序:
1.将150μL麦芽糖溶液等分至96w PCR板中
2.将16.7μL上清液添加至麦芽糖溶液中
3.在35℃下于PCR仪中温育3小时(在最后1小时中从冰箱获得GHK试剂,让其在室温下解冻-不加热。一个装有22mL试剂的50mL管足以应付一个96孔板)
4.将10μL的上清液/麦芽糖样品置于测定板(Corning,cat#3641)的孔中
5.添加200μL的HK试剂,用平板薄膜覆盖
6.在35℃下温育≥35分钟
7.测量340nm处的吸光度
淀粉分解活性[A]计算(g/L葡萄糖):
A=OD340[t=3h]g/L
S(HK斜率)
应当使用具有相同生长OD的细胞培养物的上清液。如果细胞差异生长,则应当根据细胞密度对活性进行标准化。
玉米醪液测定
程序:
1.切取1mL枪头以便开口直径为大致4mm。对于该测定枪头不必是无菌的。
2.将待测试的菌株接种在YPD中。在35℃下振荡生长2-3天,直到约8-10的OD600(静止生长期)。
3.如果比较菌株,则将菌株M0509接种在YPD中。在35℃下振荡生长2-3天,直到约8-10的OD600(静止生长期)。这将用作测定的阴性对照。
4.每24孔板,制备终体积为100mL的底物混合物:
5.通过使用切割枪头,将2mL/孔的上述制备的底物混合物添加至24孔板。当分配底物时,使用磁力搅拌器连续搅拌。每一个菌株/条件推荐一式三份重复。
6.将2mL待测定的上清液添加至包含底物混合物的每一个孔中。
7.将24孔反应板置于摇床内,在35°C和250rpm下进行温育。
8.通过重力或通过离心使板中的底物沉降来在第24和48小时采集样品。随后将150μL上清液转移至具有0.2μm滤器芯子的离心管或96孔,0.2μm过滤板(Fisher:Millipore part # MSGVN2250),添加7.5μL10%的硫酸。过滤后,将样品转移至总回收HPLC小瓶中以在H-柱上进行分析。
玉米纤维测定
程序:
1.切取5mL枪头以便开口直径为大致4mm。对于该测定枪头不必是无菌的。
2.将待测试的菌株接种在YPD中。在35℃下振荡生长2-3天,直到约8-10的OD600(静止生长期)。
3.如果比较菌株,则将菌株M0509接种在YPD中。在35℃下振荡生长2-3天,直到约8-10的OD600(静止生长期)。这将用作测定的阴性对照。
4.每24孔板,制备终体积为100mL的底物混合物:
5.通过使用切割枪头,将2mL/孔的上述制备的底物混合物添加至24孔板。当分配底物时,使用磁力搅拌器连续搅拌。每一个菌株/条件推荐一式三份重复。
6.将24孔反应板置于摇床内,在35°C和250rpm下进行温育。
7.将2mL待测定的上清液添加至包含底物混合物的每一个孔中。
通过重力或通过离心使板中的底物沉降来在第24和48小时采集样品。随后将150μL上清液转移至具有0.2μm滤器芯子的离心管或96孔,0.2μm过滤板(Fisher:Millipore part # MSGVN2250),添加7.5μL10%的硫酸。过虑后,将样品转移至总回收HPLC小瓶中以在H-柱上进行分析。
CMC转化测定
程序:
1.将待测试的菌株在50ml管中接种在10mL YPD(或其它培养基)中,振荡生长3天
2.制备1.14% CMC底物,将1.14g CMC/100mL柠檬酸盐缓冲液(50mM pH5.5)高压灭菌20-25分钟。搅拌以确保所有CMC溶解
3.向44mL的1.14% CMC中添加1mL的0.5%叠氮化钠
4.将细胞在50ml管中以最大速度离心10分钟
5.将CMC添加至深孔96孔板,450μL/孔
6.对于每一个菌株进行一式四份
7.将100μL的DNS等份添加至96孔PCR板中
8.将50μL的酵母上清液或缓冲液添加至底物,通过用移液器上下吸打进行混合
9.采集T=0的样品:将50μL转移至含有DNS和混合物的96孔PCR板
10.将深孔板置于35°C 800rpm下
11.将PCR板在99°C下加热5分钟,随后在PCR仪中冷却至4°C
12.将50μL转移至微量滴定板
13.测量565nm处的吸光度
14.在24小时后从反应板采集样品,重复步骤6-12
15.使用如下公式计算24小时时的转化的CMC%:
Y–第24小时的转化的CMC%
S–对于来自2007年5月8日的DNS在565nm处为0.1的DNS/葡萄糖校准斜率
A–T=0时的CMC浓度,其对于1%CMC为10g/L
试剂:
二硝基水杨酸试剂溶液(DNS),1%
(可在4°C下贮存数月)
ο3,5-二硝基水扬酸:10g
ο亚硫酸钠:0.5g
ο氢氧化钠:10g
ο添加水至:1升
利用葡萄糖校准DNS(使用浓度为0,1,2,3,4,5,6,7,8,9,10g/l的葡萄糖样品,计算斜率[S],对于来自2007年5月8日的DNS,S=0.1)
微晶粉末纤维素的转化测定(高通量)
程序:
1.将待测试的菌株在深孔96孔板中接种在600ul YPD中。对于每一个菌株进行4个重复或对于每一个转化使用4个转化株。在30°C下振荡生长3天
2.以最大速度离心细胞10分钟
3.制备底物混合物:
用于完全96孔板的底物混合物,总体积30ml:
将dH2O添加至30ml
4.将底物添加至新的深孔96孔板,300μl/孔。添加之间进行振荡;不让微晶粉末纤维素沉降
5.将300μl的酵母离心的上清液或缓冲液添加至底物
6.采集T=0的样品:通过多通道移液器混合反应混合物,将100μl转移至96孔PCR板
7.将深孔96孔反应板置于处于35°C和800rpm的摇床中
8.以2000rpm离心具有T=0的样品的96孔PCR板进行2分钟
9.将100μl的DNS等份添加至新型96孔PCR板
10.小心地(不要碰到沉淀)从来自T=0离心的96-孔PCR板取出50μl的上清液,将其混合入DNS
11.在99°C下加热5分钟,随后在PCR仪中冷却至4°C
12.将50μL转移至微量滴定板
13.利用板读数器测量565nm处的吸光度
14.在24小时和48小时后从反应板采集样品,重复步骤6-13
15.使用如下公式计算24小时和48小时的转化的微晶粉末纤维素%:
Y–在第24或48小时转化的微晶粉末纤维素%
S-对于来自2007年5月8日的DNS在565nm处为0.1的DNS/葡萄糖校准斜率
A–T=0时的微晶粉末纤维素浓度,其对于1%微晶粉末纤维素为10g/L试剂:
二硝基水杨酸试剂溶液(DNS),1%
(可在4°C下贮存数月)
ο3,5-二硝基水扬酸:10g
ο亚硫酸钠:0.5g
ο氢氧化钠:10g
ο添加水至:1升
利用葡萄糖校准DNS(使用浓度为0,1,2,3,4,5,6,7,8,9,10g/l的葡萄糖样品,计算斜率[S],对于来自2007年5月8日的DNS,S=0.1)
24-孔PHW测定
程序:
1.将待测试的所有菌株包括所有对照涂铺在选择培养基板上。温育2天
2.将待测试的菌株在24孔板(高压灭菌的)中以一式三份接种在4mlYPD中。用两张粘性Rayon膜膜覆盖板以进行生物学培养(VWR)。在35℃下以225rpm振荡培养2-3天(将板贴在发酵实验室摇床中的粘性垫子上)
3.每24孔板,制备终体积为100mL的底物混合物:
4.如果测试与其它酶的协同作用,将另外的酶等份添加至适当的孔中(例如,为了测试酵母产生的CBH的协同作用,将纯化的CBH1与CBH2混合以达到1:1的比率,将混合物等分以用于终浓度2mg CBH/g DWPHW)。对于该测定24孔板和枪头不必灭菌
5.通过使用5mL切割枪头,将2mL/孔的上述制备的底物混合物添加至24孔测定板。当分配底物时,使用磁力搅拌器连续搅拌。
6.将待测试的培养物在24wp中以3000rpm离心5分钟
7.使用具有100-1200μl的可调整的间隔器的多通道移液器(Rainin)将2mL的上清液添加至具有底物混合物24孔测定板
8.关于阴性对照,可使用菌株M0509或空载体菌株。关于阳性对照,将Zoomerase在阴性对照菌株上清液中稀释至160μg/mL(4mg/g DWPHW)
9.通过重力或通过离心使板中的底物沉降来采集T=0的样品。随后使用具有20-300μl的可调整的间隔器的多通道移液器(Rainin)将200μL上清液转移至96PCR wp。可在该点将样品冷冻以待将来分析。
10.将24孔测定板置于摇床中,在35℃以225rpm温育(将板贴在发酵实验室摇床中的粘性垫子上)
11.在随后的时间点、优选24和48小时取样
12.为了进行HPLC分析,将5μL 10%硫酸的等份添加至具有过虑器的96wp(Millipore,MSGVN2250)。添加100μl的样品。在过虑后(在分析实验室中使用真空),将样品转移至总回收HPLC小瓶以在H-柱上进行分析。可将具有20-300μl的可调整的间隔器的多通道移液器(Rainin)用于转移以使其更快。可循环利用用于收集过虑样品的96孔收集板。
13.葡萄糖和木糖的浓度也可利用试剂盒(参见单独的方案)来测量
微量样品反应瓶发酵测定
用于玉米醪液的程序:
1)通过将其在105°C下干燥并且称重来测定醪液的固体含量
2)根据期望的终固体%称取液体玉米醪液的重量,将其置于10mL耐压瓶中
3)向每一个瓶中添加青霉素至0.006mg/mL的终浓度,添加尿素至终浓度500PPM,需要是添加水至达到终重量4g
4)将期望的酶添加至每一个瓶中
5)添加酵母细胞接种物至终浓度0.1g/L DCW
6)盖上每一个瓶子,将23规针插入塞子
7)在期望的温度下以125rpm温育瓶子
8)在第72小时,收获样品,通过HPLC分析测量乙醇浓度。
用于玉米粉的程序:
1)将玉米粉与水按照期望的终浓度混合
2)添加青霉素至终浓度0.006mg/mL,添加尿素至终浓度700PPM
3)按照期望的终固体%称取液体底物混合物的重量,将其置于10mL耐压瓶中
4)向每一个瓶中添加期望的酶
5)添加酵母细胞接种物至终浓度0.1g/L DCW
6)盖上每一个瓶子,将23规针插入塞子
7)在期望的温度下以125rpm温育瓶子
8)在第72小时,收获样品,通过HPLC分析测量乙醇浓度。
摇瓶发醇
用于玉米醪液的程序:
1)将酵母接种在50mL的YPD中,在35°C下以200rpm温育15-18小时
2)将细胞在50mL Falcon管中离心,将其重悬浮于50mL的水中,再次离心
3)将细胞重悬浮于10mL的无菌水中,利用液体湿度分析仪(Sartorius)测定干细胞重量浓度
1)通过将其在105°C干燥和称重测定醪液的固体含量
2)按照期望的终固体浓度将醪液添加至摇瓶中
3)添加青霉素至终浓度0.006mg/mL,添加尿素至终浓度500PPM,如果需要达到终重量50g,则添加水
4)将期望的酶添加至每一个瓶中
5)将0.005g细胞稀释在1mL水中,将细胞添加至瓶中(0.1g/L接种物)
6)在T=24小时、T=48小时和T=72小时采集1mL样品。将样品稀释4倍,通过HPLC分析测量乙醇和糖浓度。
用于玉米粉的程序:
1)将酵母接种在50mL的YPD中,在35°C下以200rpm温育15-18小时
2)将细胞在50mL Falcon管中离心,将其重悬浮于50mL的水中,再次离心
3)将细胞重悬浮于10mL的无菌水中,利用液体湿度分析仪(Sartorius)测定干细胞重量浓度。
4)按照期望的终浓度混合玉米粉与水
5)添加青霉素至终浓度0.006mg/mL,添加尿素至终浓度700PPM
6)按照期望的终固体%称取液体底物混合物,将其置于摇瓶中
7)将期望的酶添加至每一个瓶中
8)将0.005g的细胞稀释在1mL水中,将细胞添加至瓶中(0.1g/L接种物)
在T=24小时、T=48小时和T=72小时采集2mL样品。通过HPLC分析测量乙醇和糖浓度。
木聚糖测定
1.制备底物溶液:1,0%的0.05M柠檬酸钠缓冲液,pH5.0中的桦树木4-O-甲基葡糖醛酸木聚糖(Sigma)。在磁力搅拌器上于60℃下将1.0g在80ml缓冲液匀化,加热至沸点。通过持续搅拌冷却,加盖,缓慢搅拌过夜。利用缓冲液组成100ml。于4℃下贮存最多1周或在-20℃下冷冻例如25ml的等份。
2.将150μl的底物等分至96孔PCR板中
3.添加16.7μl包含酶的上清液
4.在35°C温育3小时
5.取出25μl的测定样品,将其与50μl DNS在PCR板中混合
6.在99℃下煮沸5分钟;在4℃下冷却
7.将50μl转移至平底造粒板corning板
8.在540或565nm处读取吸光度
木聚糖板测定
1.制备底物:将0.1%天青精-交联的木聚糖(Megazymes)与1.5%的水中的琼脂糖混合,高压灭菌20分钟
2.将底物倾倒在预制YPD板上,等待直到固化
3.涂铺酵母菌落,在35°C下温育24-48小时
酯酶测定(对于AXE和FAE)
1.制备底物:1M的甲醇或DMSO中的4-硝基苯基乙酸酯(SigmaN-8130)
2.利用50mM柠檬酸钠缓冲液pH5.4将底物稀释至1mM
3.将50μl包含酶的酵母上清液或对照置于96孔分析板中
4.添加100μl 4-硝基苯基乙酸酯预热的(35℃)底物
5.在给定的时间过程、例如30分钟、1小时和2小时中读取410nm处的吸光度。在时间点之间在35℃下温育样品板
6.可通过添加100μl Na2CO3(1M)终止反应
阿拉伯呋喃糖酶测定
1.制备底物:1M的甲醇中的4-硝基苯基α-L-阿糖胞苷(pNPA)(SigmaN-3641)
2.利用50mM柠檬酸钠缓冲液pH5.4将底物稀释至1mM
3.将20μl包含酶的酵母上清液或对照置于96孔分析板中
4.添加180μl 4-硝基苯基乙酸酯预热的(35℃)底物
5.在给定的时间过程、例如30分钟、1小时和2小时中读取405nm处的吸光度。在时间点之间在35℃下温育样品板
6.可通过添加100μl Na2CO3(1M)终止反应。
PWC(预处理的湿饼)测定
1.制备底物混合物(对于一个24孔板,使用70ml):8g的35% PWC(在160℃下预处理改性酒糟干燥谷物(modified distiller's driedgrains)(MDDG)进行20分钟),7ml 0.5% NaAz,5.25ml的1M柠檬酸钠pH5,0.7ml的100X抗真菌/病毒混合物(Sigma#A5955),以及加水至终体积70ml
2.以期望的量(低于200μl)将纯化的酶等份添加至24孔深孔板
3.添加2ml的包含酶的酵母上清液或空菌株的上清液(无酶)作为对照
4.添加2ml的底物混合物
5.在35°C下振荡温育48小时
6.在T=0小时、T=24小时和T=48小时取出200μl样品(通过重力或通过离心使板中的底物沉降)置于96孔PCR板中
7.离心PCR板,将100μL上清液转移至96孔,0.2μm过滤板(Fisher:Millipore# MSGVN2250),添加5μL的10%的硫酸
8.使用过滤的样品通过HPLC测量乙醇和糖浓度
木葡聚糖酶测定(96孔板)
将70μL的3日期的2xSC-ura培养物的上清液在96孔深孔板中液添加至280μL的含有0.5% AZCL(天青精-交联的)罗望子木糖葡聚糖(Megazyme目录号I-AZXYG)的50mM醋酸钠缓冲液(pH5.0)中
将板在微量滴定板摇床中于35°C下以800rpm的搅拌进行温育
在温育的第0、60和180分钟取出100μL的样品,置于96孔PCR板中,以3000rpm离心2分钟,之后将50μL上清液置于新鲜96孔分析板中,测量600nm处的OD。
木葡聚糖酶板测定
将包含1.5%琼脂+YPD的板覆盖一层0.1或0.5%的1.5%琼脂糖中的AZCL(天青精-交联的)罗望子木糖葡聚糖(Megazyme目录号I-AZXYG),点上2μL的过夜酵母培养物。将板在35°C下温育过夜。蓝色区带表示底物的水解。
支链淀粉测定
1.将150μl的1%支链淀粉(于100mM柠檬酸钠缓冲液pH5.0中)添加至每一个孔
2.混合16.7μl的酶上清液
3.在35℃下振荡(900rpm)温育3小时
4.取出25μl的测定样品,将其与50μl DNS(与在淀粉测定中一样)于PCR板中混合
5.在99℃下煮沸5分钟;于4℃下冷却
6.将50μl转移至平底corning板中
7.读取565或540nm处的吸光度
果胶测定
1.制备0.1%的果胶溶液(0.05g的苹果果胶,于50mL的100mM柠檬酸钠缓冲液pH5.0中;加热以溶解)
2.将50μL包含酶的上清液置于新的96孔深孔板(5μL的M0139上清液中的multifect果胶酶,总共50μL)的孔中
3.添加450μL的果胶溶液
4.在35°C下以900rpm温育4小时
5.将100μL DNS(与在淀粉测定相同)等分入96孔PCR板
6.将50μL果胶/上清液添加至DNS,在99°C下加热5分钟,然后冷却至4°C
7.将50μL转移至测定板(平底),测量565nm或540nm处的吸光度
改性微晶粉末纤维素测定方案:
程序:
将待测试的菌株在96孔板中接种在600ul YPD中。对于每一个菌株重复4次或对于每一个转化使用4个转化株。在30°C下振荡生长3天
1.以最大速度离心细胞10分钟
2.制备底物混合物:
用于完全96孔板的底物混合物,总体积30ml:
0.6g 微晶粉末纤维素(2%)
500μl 3M Na Ac pH5.0(50mM)
1.2ml 0.5%叠氮化钠(0.02%)
30μl BGL(Novozyme-188,Sigma)
600μl Zoomerase来自1mg/ml原液(获得1mg/gm的微晶粉末纤维素)
添加dH2O至30ml
3.将底物添加至新的深孔96孔板,300ul/孔。添加之间振荡,不让微晶粉末纤维素沉降
4.将300μl的酵母离心的上清液或缓冲液添加至底物
5.采集T=0的样品:通过多通道移液器混合反应混合物,将100μl转移至96孔PCR板
6.将深孔96孔反应板置于处于35°C和800rpm的摇床中
7.以2000rpm离心具有T=0的样品的96孔PCR板进行2分钟
8.将50μl的DNS等份添加至新型96孔PCR板
9.小心地(不要碰到沉淀)从来自T=0离心的96-孔PCR板取出25μl的上清液,将其混合入DNS
10.在99°C下加热5分钟,随后在PCR仪中冷却至4°C
11.将50μL转移至微量滴定板.
12.利用板读数器测量540nm处的吸光度
13.在2小时和4小时后从反应板采集样品,重复步骤6-13
14.使用如下公式计算2小时和4小时的转化的微晶粉末纤维素%:
Y-在第24或48小时转化的微晶粉末纤维素%
S–对于DNS 540nm处为0.25的DNS/葡萄糖校准斜率
A–T=0时的微晶粉末纤维素浓度,其对于1%微晶粉末纤维素为10g/L
试剂:
二硝基水杨酸试剂溶液(DNS),1%
(可在4°C下贮存数月)
ο3,5-二硝基水扬酸:10g
ο亚硫酸钠:0.5g
ο氢氧化钠:10g
ο添加水至:1升
利用葡萄糖校准DNS(使用浓度为0,1,2,3,4,5,6,7,8,9,10g/l的葡萄糖样品,计算斜率[S],对于DNS,S=0.25)
通过HPLC分析进行培养基中的TeCBH1-HgCBM-C和ClCBH2b的浓度测定
为了测定由表达TeCBH1-HgCBM-C(M1111,表达质粒pMU1392)和ClCBH2b(M1873)的菌株产生的CBH的浓度,在具有MWD检测器(在214和280nm上)的Agilent 2100 HPLC上开发了苯基反相法(phenylreversed phase method)。在该方法中,将上述纯化的CBH用于产生从200至10μg的标准曲线。将样品注射至在55℃下于0.1%三氟乙酸(TFA)(w/v),20%乙腈中平衡的苯基RP柱(Tosoh phenyl-5PW RP,4.6mm x7.5cm,10μm)上。使用具有0.1% TFA(w/v)的20-60%的乙腈的线性梯度在45分钟内以0.75ml/分钟从柱子洗脱蛋白质。在用95%乙腈/TFA清洁柱子后,重新平衡柱子。为了测定由不同菌株在培养基中产生TeCBH1-HgCBM-C和ClCBH2b的浓度,将样品的峰面积与从纯化的CBH(μg/μL,注射的)的峰面积产生的标准曲线相比较。
将TeCBH1-HgCBM-C和ClCBH2b纯化为HPLC测定中的蛋白质标准物
用10%体积的产CBH1或CBH2(M1111,分别表达质粒pMU1392和M1873)菌株的过夜预培养物接种1或1.5升YPD培养基。将培养物在30℃下在振荡(210rpm)的条件下生长。在3天的培养后,通过离心除去细胞收获上清液。利用10kDa截止Pellicon PTGC膜(Millipore)浓缩上清液,并且将其更换至50mM醋酸钠(pH5)中。将CBH1样品加载至用50mM醋酸钠,pH5.0平衡的DEAE Sepharose FF柱中。利用0至0.35M NaCl的线性盐梯度洗脱结合的CBH1。洗脱体积为15和20个柱体积。通过用将10μl样品与90μl 2mM的50mM NaAc(pH5.0)中的MULac一起在环境温度下温育20分钟并且利用0.5M Na2CO3终止反应,来用MULac测试级份的CBH1活性。利用Varioscan(Thermo Labsystems)微量滴定板读数器(激发光波长355nm和发射光波长460nm)测量荧光。在SDS-PAGE上使CBH1蛋白可视,混合包含单个条带的级份,并且使用20ml旋转浓缩器(spin concentrator),10kDa MWCO(Vivaspin,Vivascience GmbH)将其更换至50mM醋酸钠(pH5)中。随后进行纯化的第二步骤,其中将5ml GE phenyl HR柱用于进一步除去培养基组分。在该步骤中,用25mM醋酸钠,1.2M硫酸铵,pH5平衡柱子。将硫酸铵添加至样品中以使缓冲液中的浓度达到1.2M,将该材料注射至柱子上。利用25mM醋酸钠,pH5的线性梯度洗脱蛋白质,将对MULac具有活性的级份混合。通过SDS-PAGE估量纯度,使用理论吸收值(theoreticalabsorptivity value)利用280nm处的吸光度测定浓度。使用相同的层析步骤:DEAE阴离子交换,然后苯基HIC来纯化ClCBH2b。在该纯化过程中,在DEAE步骤的进行中发现ClCBH2b,其在递减的硫酸铵梯度内从苯基HIC柱洗脱。如上所述,使用1%微晶粉末纤维素水解测定在pH5.0下测定活性级份。如上所述测定纯度和浓度。
PHW测定
1.制备底物混合物(100mL每一个24孔板):8.3g的预处理的木材(48%的固体),20ml的1M柠檬酸钠pH4.8,2ml的100X抗真菌/细菌混合物(Sigma#A5955),和加水至终体积100ml。在一些测定中,添加0.222ml的商业葡糖淀粉酶(AB Enzymes#EL2008044L 63ml/ml)(热处理以除去副活性)
2.将纯化的酶(低于200μl)添加至24孔深孔板
3.添加2ml的包含酶的酵母上清液或空菌株的上清液(无酶)作为对照
4.通过使用切割的5ml枪头,将2mL/孔的底物混合物添加至酶。当分配底物时,使用磁力搅拌器连续搅拌
5.将24孔反应板置于35°C和250rpm下进行温育
6.在T=0小时、T=24小时和T=48小时取出200μl样品(通过重力或通过离心使板中的底物沉降)置于96孔PCR板中。
7.离心PCR板,将100μL上清液转移至96孔,0.2μm过滤板(Fisher:Millipore# MSGVN2250),添加5μL的10%的硫酸。
8.使用过滤的样品通过HPLC测量乙醇和糖浓度。
造纸淤泥测定
1.制备基质混合物(100mL,每一个24孔板):10.5g的造纸淤泥(38%的固体),40ml的1M柠檬酸钠pH5.2,2ml的100X抗真菌/细菌混合物(Sigma#A5955),和加水至终体积100ml。在一些测定中,添加0.222ml的商业热稳定性β-葡糖苷酶(AB Enzymes 63ml/ml)(热处理以除去副活性)
2.将纯化的酶(低于200μl)添加至24孔深孔板的孔中
3.添加2ml的包含酶的酵母上清液或空菌株的上清液(无酶)作为对照
4.通过使用切割的5ml枪头,将2mL/孔的底物混合物添加至酶。当分配底物时,使用磁力搅拌器连续搅拌
5.将24孔反应板置于38°C和250rpm下进行温育
6.在T=0小时、T=24小时和T=48小时取出200μl样品(通过重力或通过离心使板中的底物沉降)置于96孔PCR板中
7.离心PCR板,将100μL上清液转移至96孔,0.2μm过滤板(Fisher:Millipore#MSGVN2250),添加5μL的10%的硫酸
8.使用过滤的样品通过HPLC测量乙醇和糖浓度
1-萘基-乙酸酯测定
1.利用待测试的菌株接种SC或YPD培养基,在旋转摇床上进行温育。
2.通过离心除去细胞。
3.如下在96孔板中设置反应:
88μL柠檬酸盐缓冲液(50mM,pH5.0)*
10μL上清液
2μL乙醇中的1-蔡基-乙酸酯(500mM)**
100μL总计
*(也可使用磷酸盐缓冲液但醋酸盐缓冲液引起沉淀)
**(Sigma 46010)
4.在35°C下温育5-30分钟。温育时间取决于活性的水平
5.通过添加100μl 0.01% Fast Corrinth V盐溶液终止反应
6.在535nm读取100μL
50mM柠檬酸盐缓冲液pH5.0
1M柠檬酸20.5mL
1M柠檬酸钠29.5mL
这是50mL 1M柠檬酸盐磷酸缓冲液(pH5.0)。用水稀释至适当的浓度。
500mM 1-萘基-乙酸盐(Mr 186g/mol)
1-萘基-乙酸盐 0.0931g
乙醇(100%)1000μl
(每天制备新鲜批次)
Fast Corrinth V盐溶液(Sigma 227366)
Fast Corrinth V盐(0.01%)0.001g
Tween 20(10%) 1mL
1M醋酸钠缓冲液 pH4.4 9mL
10mL
NB:每天新鲜制备该溶液,将其保持在避光瓶中–当天使用,对光非常敏感。
1-萘酚(用于标准曲线)(Sigma 31097)
制备1g/L的用于测定的缓冲液中的1-萘酚溶液以设置标准曲线。
将标准曲线设置在0.025g/L与0.4g/L之间
使用NpGal的α-半乳糖苷酶活性测定
参考文献:Margolles-Clark等人1996.Eur J Biochem.240:104-111.
1.如下所示制备溶液
2.将待筛选的菌落涂铺面选择板上并且在30-35℃下温育48小时
3.在96孔板中接种600μl YPD并且在35℃下以800rpm振荡温育48-72小时
4.以2500rpm离心细胞2分钟
5.将20μl上清液置于96孔板内
6.添加180μl NpGal预热的(35℃)底物
7.在35℃下温育,进行给定的时间过程、例如30分钟,1小时和2小时(根据文献中的一些酶可能进行过夜)
8.在给定的时间过程中在405nm处读取吸光度。在两个时间点之前在35°C下温育样品板
9.通过添加100μl Na2CO3(1M)终止反应
1mM对硝基苯基-α-D-半乳糖吡喃糖苷(NpGal)(Sigma
N0877)301.3g/mol
制备1M原液=0.151g于500μl甲醇或DMSO中
1mM原液=10μl的1M原液于9.99ml柠檬盐缓冲液
柠檬酸盐缓冲液(0,05M pH 5.4) 1L
0.1M柠檬酸:21.01g的于1000ml H2O中的柠檬酸
0.1M柠檬酸钠:29.41g的于1000ml H2O中的C6H5O7Na3.2H2O
20.5ml的柠檬酸+29.5ml的柠檬酸钠,将dH2O添加至总共100ml
通过引用并入
本文中引用的所有文件,包括杂志论文或摘要、公布或相应的美国或相应外国专利申请、发布的或外国专利,或任何其它文件,各自通过引用整体并入本文,包括引用的文件中所示的所有数据、表格、图、和文本。
等同物
本领域技术人员将认识到或能够只使用常规实验确定对本文中描述的本发明的特定实施方案的许多等同物。此类等同物意欲包括在下列权利要求内。