CN101363022A - 替曲卡星a的生物合成基因簇及其应用 - Google Patents
替曲卡星a的生物合成基因簇及其应用 Download PDFInfo
- Publication number
- CN101363022A CN101363022A CNA2008100362488A CN200810036248A CN101363022A CN 101363022 A CN101363022 A CN 101363022A CN A2008100362488 A CNA2008100362488 A CN A2008100362488A CN 200810036248 A CN200810036248 A CN 200810036248A CN 101363022 A CN101363022 A CN 101363022A
- Authority
- CN
- China
- Prior art keywords
- nucleotide sequence
- gene cluster
- base
- encoding
- amino acids
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Enzymes And Modification Thereof (AREA)
Abstract
本发明是一种由青褐色小单孢菌(Micromonospora chalcea NRRL11289)产生的具有抗肿瘤活性的抗生素--替曲卡星A(Tectrocarcin A)的生物合成基因簇的克隆、测序、分析、功能研究及其应用。整个基因簇共包含36个基因:5个非重复使用的I型聚酮合成酶基因;4个特殊三碳单元生物合成基因;11个脱氧糖生物合成基因;9个后修饰基因;2个调节基因;1个抗性基因;以及4个功能不确定的基因。通过对上述生物合成基因的遗传操作可阻断替曲卡星A的生物合成。本发明所提供的基因及其蛋白也可以用来寻找和发现可用于医药、工业或农业的化合物或基因、蛋白。
Description
技术领域:
本发明属于微生物基因工程领域,具体涉及抗生素替曲卡星A(Tetrocarcin A)的生物合成基因簇的克隆、分析、功能研究及其应用。
技术背景:
Tetrocarcins是一类新型的螺环乙酰乙酸内酯类抗生素,首次分离自青褐色小单孢菌KY11091(Micromonospora chalcea KY11091)的发酵产物[J.Antibiot.(1980)33,668-670]。替曲卡星A(如图1所示)是其中的一个组分,其分子中含有苷元和糖基两部分:苷元Tetronolide结构非常独特,其中含有一个反式萘环及一个螺-4-羟基乙酰乙酸内酯(Spirotetronate)单元;苷元的C9位连有由两个L-阿米西糖和两个L-毛地黄毒糖交替连接而成的四糖边链,且一个L-毛地黄毒糖的4位羟基被乙酰化修饰;苷元的C17位则连接了一个罕见的,高度修饰的硝基脱氧糖Tetronitrose。
替曲卡星A是螺环乙酰乙酸内酯类抗生素中生物活性最好的一个化合物。它对部分革兰氏阳性菌具有较强的抑制活性,比如对枯草杆菌Bacillus subtilis No.10707的最低抑制浓度(MIC)低至0.1μg/ml[J.Antibiot.(1980)33,244-246]。对替曲卡星A的构效关系研究表明,随着寡糖侧链中糖基的逐个被去掉,替曲卡星A的抑菌活性逐渐降低,这一结果显示出糖基基团在抗菌过程中的重要作用[Bioorg.Med.Chem.Lett.(2001)11,887-890]。替曲卡星A的抗菌机制可能是抑制细菌RNA的合成,并对蛋白的合成有部分影响,但不影响细菌DNA的合成。在对替曲卡星A抗肿瘤活性的研究中发现其对部分肿瘤,包括白血病细胞P388、Ehrlish肿瘤细胞、MH134肝肿瘤细胞、B16黑色素肿瘤细胞等,均具有强烈的抑制效果[J.Antibiot.(1980)33,946-950],同时没有明显的骨髓抑制和肾毒性等毒副作用[J.Antibiot.(1982)35,1033-1037]。因此,其良好的生物活性促使人们对其抗肿瘤作用机制进行了深入研究。1983年以来,对替曲卡星A抗肿瘤机制研究的结果表明,它能够拮抗膜整合蛋白Bcl-2抑制细胞凋亡的作用,从而增加癌细胞对诱导其凋亡信号的敏感性和弱化癌细胞对于物理或化学药物治疗的抗性。Kaneko小组以替曲卡星A为基础进行化学结构衍生得到了一系列替曲卡星A结构类似物,活性测试结果表明,一些保留抑制Bcl-2活性的结构类似物并不具备抗菌的能力,这一结果暗示了替曲卡星A可能通过不同于抗菌机制的新作用机制来体现其抗肿瘤活性[Bioorg.Med.Chem.Lett.(2001)11,887-890]。值得注意的是,分别以T-急性淋巴细胞白血病(T-ALL)和B-慢性淋巴细胞白血病(B-CLL)肿瘤细胞为模型的细胞凋亡实验结果表明,替曲卡星A可能是通过激活一条内质网应激通路(ER-stress pathway)而诱导细胞凋亡的发生[FESB(2002)16,1295-1297]。也有研究者认为,替曲卡星A诱导细胞凋亡的机制是因为它能够降低线粒体跨膜电位,导致细胞色素C的释放和半胱天冬酶-9前体的活化而诱导细胞凋亡。由于替曲卡星A诱导细胞凋亡的过程不受Bcl-2、HSP70等抗凋亡因子的影响——这些蛋白的过量表达将钝化化疗药物Prednisolone、Chlorambucil或Fludarabine的作用,这一现象提示我们可以将替曲卡星A用于对现有临床化疗药物产生抗性的B-CLL肿瘤病人的治疗。同时,B-淋巴细胞对于替曲卡星A的敏感性远远高于内源性的T-淋巴细胞,显示替曲卡星A对治疗B-CLL肿瘤可能具有较好的特异性[Blood(2003)101,4561-4568]。另外,替曲卡星A通过对人乳腺癌细胞中的PI3K/Akt信号通路中一些因子磷酸化的抑制作用而达到对该肿瘤细胞生长的抑制[Biochem.Biophys.Res.Commun.(2007)356,260-265],可以通过进一步的研究将其发展成为治疗乳腺癌的有效药物。
替曲卡星A独特的化学结构也吸引了许多有机化学家从事其化学合成研究[J.Org.Chem.(1985)50,4673-4681;J.Org.Chem.(1988)53,1092-1095;Tetrahedron Lett.(1991)32,4925-4928;J.Am.Chem.Soc.(1994)116,6457-6458;J.Am.Chem.Soc.(1998)120,7411-7419;Bioorg.Med.Chem.Lett.(2001)11,887-890;J.Am.Chem.Soc.(2006)128,10572-10558]。由于替曲卡星A分子结构的复杂性,其化学半合成路线长,产率低,而且至今尚无关于该分子全合成研究的报道。
为了更好的展开对替曲卡星A的研究和开发,我们以微生物来源的替曲卡星A为目标分子,从克隆其生物合成基因簇出发,采用微生物学、分子生物学、生物化学及有机化学相结合的方法研究其生物合成,通过对其生物合成机制的研究揭示包括形成螺-4-羟基乙酰乙酸内酯等化学结构的独特酶学机理,在此基础上运用代谢工程和组合生物合成的原理,合理修饰替曲卡星A的生物合成途径,发展结构多样的替曲卡星A结构类似物,为深入研究其构效关系提供更多的化合物支持,并通过微生物发酵大量生产新型药物。
发明内容:
本发明涉及一种具有独特聚酮结构的抗生素——替曲卡星A的生物合成基因簇的克隆、分析、功能及其应用。本发明中整个替曲卡星A的生物合成基因簇共36个基因的核苷酸序列或互补序列(序列1),其中有5个基因(tcaA1,tcaA2,tcaA3,tcaA4,tcaA5)用于编码I型聚酮合成酶(PKS),共包含12个模块,57个功能域,负责催化替曲卡星A大环骨架部分聚酮链的生物合成;4个基因(tcaD1,tcaD2,tcaD3,tcaD4)编码的蛋白负责三碳单元的生物合成,并进一步与聚酮链缩合、环化形成大环骨架的[6,6]并环和[6,5]螺环结构;11个基因(tcaB1,tcaB2,tcaB3,tcaB4,tcaB5,tcaB6,tcaB7,tcaB8,tcaB9,tcaB10,tcaB11)编码的蛋白负责阿米西糖、毛地黄毒糖和Tetronitrose的生物合成;9个基因(tcaC,tcaE1,tcaE2,tcaF,tcaM,tcaT1,tcaT2,tcaT3,tcaT4)编码后修饰酶,催化替曲卡星A大环骨架的氧化和还原及分子中左侧四糖侧链和糖苷键的形成;2个调节基因(tcaR1,tcaR2);1个抗性基因(tcaG)及4个功能不十分确定的基因(tcaU1,tcaU2,tcaU3,tcaU4)。
本发明还提供了一个编码糖基转移酶的核苷酸序列,由序列2中的氨基酸序列组成,命名为tcaT1,其基因的核苷酸序列位于序列1中第8022-9134碱基处。
本发明还提供了一个编码黄素蛋白氧化还原酶辅因子的核苷酸序列,由序列3中的氨基酸序列组成,命名为tcaC,其基因的核苷酸序列位于序列1中第9250-9810碱基处。
本发明还提供了一个编码未知蛋白的核苷酸序列,由序列4中的氨基酸序列组成,命名为tcaU1,其基因的核苷酸序列位于序列1中第10171-9842碱基处。
本发明还提供了一个编码未知蛋白的核苷酸序列,由序列5中的氨基酸序列组成,命名为tcaU2,其基因的核苷酸序列位于序列1中第10440-10880碱基处。
本发明还提供了一个编码未知蛋白的核苷酸序列,由序列6中的氨基酸序列组成,命名为tcaU3,其基因的核苷酸序列位于序列1中第10691-11629碱基处。
本发明还提供了一个编码双组分反馈调节因子的核苷酸序列,由序列7中的氨基酸序列组成,命名为tcaR1,其基因的核苷酸序列位于序列1中第11988-12791碱基处。
本发明还提供了一个编码NDP-己糖-3,5(或5)异构酶的核苷酸序列,由序列8中的氨基酸序列组成,命名为tcaB5,其基因的核苷酸序列位于序列1中第12849-13442碱基处。
本发明还提供了一个编码3-酮基还原酶的核苷酸序列,由序列9中的氨基酸序列组成,命名为tcaB4,其基因的核苷酸序列位于序列1中第13499-14497碱基处。
本发明还提供了一个编码糖基转移酶的核苷酸序列,由序列10中的氨基酸序列组成,命名为tcaT2,其基因的核苷酸序列位于序列1中第15731-14553碱基处。
本发明还提供了一个编码甲基转移酶的核苷酸序列,由序列11中的氨基酸序列组成,命名为tcaB11,其基因的核苷酸序列位于序列1中第16681-15890碱基处。
本发明还提供了一个编码氨基转移酶的核苷酸序列,由序列12中的氨基酸序列组成,命名为tcaB7,其基因的核苷酸序列位于序列1中第16895-18037碱基处。
本发明还提供了一个编码氧-酰基转移酶的核苷酸序列,由序列13中的氨基酸序列组成,命名为tcaM,其基因的核苷酸序列位于序列1中第18152-19294碱基处。
本发明还提供了一个编码葡萄糖-1-磷酸TDP转移酶的核苷酸序列,由序列14中的氨基酸序列组成,命名为tcaB1,其基因的核苷酸序列位于序列1中第19343-20230碱基处。
本发明还提供了一个编码dNTP-D-葡萄糖-4,6-脱水酶的核苷酸序列,由序列15中的氨基酸序列组成,命名为tcaB2,其基因的核苷酸序列位于序列1中第20227-21225碱基处。
本发明还提供了一个编码酰基辅酶A脱氢酶的核苷酸序列,由序列16中的氨基酸序列组成,命名为tcaB10,其基因的核苷酸序列位于序列1中第21290-22594碱基处。
本发明还提供了一个编码NDP-脱氧己糖-3-氨基转移酶的核苷酸序列,由序列17中的氨基酸序列组成,命名为tcaB8,其基因的核苷酸序列位于序列1中第22600-23721碱基处。
本发明还提供了一个编码甲基转移酶的核苷酸序列,由序列18中的氨基酸序列组成,命名为tcaB9,其基因的核苷酸序列位于序列1中第23743-24987碱基处。
本发明还提供了一个编码未知蛋白的核苷酸序列,由序列19中的氨基酸序列组成,命名为tcaU4,其基因的核苷酸序列位于序列1中第25068-25562碱基处。
本发明还提供了一个编码含有KSQL,ATL,ACPL,KS1,AT1,DH1,KR1,ACP1,KS2,AT2,DH2,KR2,ACP2,KS3,AT3,DH3,KR3,ACP3结构域的非重复使用的I型聚酮合成酶的核苷酸序列,由序列20中的氨基酸序列组成,命名为tcaA1,其基因的核苷酸序列位于序列1中第25588-44580碱基处。
本发明还提供了一个编码含有KS4,AT4,DH4,KR*4,ACP4,KS5,AT5,DH5,KR5,ACP5,KS6,AT6,DH6,KR6,ACP6,KS7,AT7,DH7,KR7,ACP7结构域的非重复使用的I型聚酮合成酶的核苷酸序列,由序列21中的氨基酸序列组成,命名为tcaA2,其基因的核苷酸序列位于序列1中第44582-65605碱基处。
本发明还提供了一个编码含有KS10,AT10,DH10,KR10,ACP10结构域的非重复使用的I型聚酮合成酶的核苷酸序列,由序列22中的氨基酸序列组成,命名为tcaA4,其基因的核苷酸序列位于序列1中第65565-71087碱基处。
本发明还提供了一个编码含有KS11,AT11,DH11,KR*11,ACP11结构域的非重复使用的I型聚酮合成酶的核苷酸序列,由序列23中的氨基酸序列组成,命名为tcaA5,其基因的核苷酸序列位于序列1中第71162-75775碱基处。
本发明还提供了一个编码依赖FAD的氧化酶的核苷酸序列,由序列24中的氨基酸序列组成,命名为tcaE1,其基因的核苷酸序列位于序列1中第75796-77271碱基处。
本发明还提供了一个编码III型3-氧酰基载体蛋白合成酶的核苷酸序列,由序列25中的氨基酸序列组成,命名为tcaD4,其基因的核苷酸序列位于序列1中第77303-78355碱基处。
本发明还提供了一个编码甲氧基-丙二酰基载体蛋白合成酶的核苷酸序列,由序列26中的氨基酸序列组成,命名为tcaD1,其基因的核苷酸序列位于序列1中第78352-80253碱基处。
本发明还提供了一个编码独立存在的酰基载体蛋白的核苷酸序列,由序列27中的氨基酸序列组成,命名为tcaD2,其基因的核苷酸序列位于序列1中第80250-80477碱基处。
本发明还提供了一个编码丙酮酸2-氧代戊二酸脱氢酶(N端结构域)和水解酶/乙酰基转移酶(C端结构域)的核苷酸序列,由序列28中的氨基酸序列组成,命名为tcaD3,其基因的核苷酸序列位于序列1中第80474-82324碱基处。
本发明还提供了一个编码TetR家族转录调节因子的核苷酸序列,由序列29中的氨基酸序列组成,命名为tcaR2,其基因的核苷酸序列位于序列1中第83045-82467碱基处。
本发明还提供了一个编码糖基转移酶的核苷酸序列,由序列30中的氨基酸序列组成,命名为tcaT3,其基因的核苷酸序列位于序列1中第83216-84410碱基处。
本发明还提供了一个编码糖基转移酶的核苷酸序列,由序列31中的氨基酸序列组成,命名为tcaT4,其基因的核苷酸序列位于序列1中第84455-85594碱基处。
本发明还提供了一个编码包含FAD/FMN的脱氢酶的核苷酸序列,由序列32中的氨基酸序列组成,命名为tcaE2,其基因的核苷酸序列位于序列1中第97242-85225碱基处。
本发明还提供了一个编码硫酯酶的核苷酸序列,由序列33中的氨基酸序列组成,命名为tcaF,其基因的核苷酸序列位于序列1中第88026-87268碱基处。
本发明还提供了一个编码2,3-己糖脱水酶的核苷酸序列,由序列34中的氨基酸序列组成,命名为tcaB3,其基因的核苷酸序列位于序列1中第89533-88076碱基处。
本发明还提供了一个编码含有KS8,AT8,DH*8,ER8,KR8,ACP8,KS9,AT9,DH9,ER9,KR9,ACP9结构域的非重复使用的I型聚酮合成酶的核苷酸序列,由序列35中的氨基酸序列组成,命名为tcaA3,其基因的核苷酸序列位于序列1中第89806-101700碱基处。
本发明还提供了一个编码氧化还原酶的核苷酸序列,由序列36中的氨基酸序列组成,命名为tcaB6,其基因的核苷酸序列位于序列1中第102587-101715碱基处。
本发明还提供了一个编码药物排出蛋白的核苷酸序列,由序列37中的氨基酸序列组成,命名为tcaG,其基因的核苷酸序列位于序列1中第104125-102653碱基处。
序列1的互补序列可根据DNA碱基互补原则随时得到。序列1的核苷酸序列或部分核苷酸序列可以通过聚合酶链式反应(PCR)或用合适的限制性内切酶酶切相应的DNA或使用其他合适的技术得到。本发明提供了得到至少包含部分序列1中DNA序列的重组DNA质粒的途径。
本发明还提供了产生替曲卡星A生物合成基因被中断或加倍的微生物体的途径,至少其中之一的基因包含有序列1中的核苷酸序列。
本发明所提供的核苷酸序列或部分核苷酸序列,可利用聚合酶链式反应(PCR)的方法或包含本发明序列的DNA作为探针以Southern杂交等方法从其他生物体中得到与替曲卡星A生物合成基因相似的基因。
包含本发明所提供的核苷酸序列或至少部分核苷酸序列的克隆DNA可用于从青褐色小单孢菌M.chalcea NRRL11289基因组文库中定位更多的文库质粒。这些文库质粒至少包含本发明中的部分序列,也包含有青褐色小单孢菌M.chalceaNRRL11289基因组中以前邻近区域未克隆的DNA。
包含本发明所提供的核苷酸序列或至少部分核苷酸序列可以被修饰或突变。这些途径包括插入、置换或缺失,聚合酶链式反应,错误介导聚合酶链式反应,位点特异性突变,不同序列的重新连接,序列的不同部分或与其他来源的同源序列进行定向进化(DNA shuffling),或通过紫外线或化学试剂诱变等。
包含本发明所提供的核苷酸序列或至少部分核苷酸序列的克隆基因可以通过合适的表达体系在外源宿主中表达以得到相应的酶或其他更高的生物活性或产量。这些外源宿主包括链霉菌、假单孢菌、大肠杆菌、芽孢杆菌、酵母、植物和动物等。
本发明所提供的氨基酸序列可以用来分离所需要的蛋白并可用于抗体的制备。
包含本发明所提供的氨基酸序列或至少部分序列的多肽可能在去除或替代某些氨基酸之后仍有生物活性甚至有新的生物学活性,或者提高了产量或优化了蛋白动力学特征或其他致力于得到的性质。
包含本发明所提供的核苷酸序列或至少部分核苷酸序列的基因或基因簇可以在异源宿主中表达并通过DNA芯片技术了解它们在宿主代谢链中的功能。
包含本发明所提供的核苷酸序列编码的蛋白可以催化合成阿米西糖、毛地黄毒糖、硝基脱氧糖Tetronitrose及替曲卡星A聚酮大环骨架,进一步催化合成抗生素替曲卡星A。
包含本发明所提供的核苷酸序列或至少部分核苷酸序列的基因或基因簇可以通过遗传重组来构建重组载体以获得新型生物合成途径,也可以通过插入、置换、缺失或失活进而获得新型生物合成途径。
包含本发明所提供的核苷酸序列或至少部分核苷酸序列的克隆基因或DNA片段可以通过中断替曲卡星A生物合成的一个或几个步骤而得到新的替曲卡星A结构类似物或前体。包含DNA片段或基因可以用来提高替曲卡星A或其衍生物的产量,本发明提供了在基因工程微生物中提高产量的途径。
包含本发明所提供的聚酮合成酶可以通过缺失、插入或失活来自于相同或不同的聚酮合成酶系统的一个或多个聚酮合成酶结构域、模块或基因而产生新的聚酮化合物。
包含本发明所提供的核苷酸序列或至少部分核苷酸序列的片段或基因可以用来构建聚酮合成酶库或聚酮合成酶衍生库或组合库。
本发明所提供的三碳单位的生物合成基因及其他相关基因与聚酮合成藕联可用于合成替曲卡星A家族独特的[6,5]螺环及螺-4-羟基乙酰乙酸内酯结构极其类似物。
本发明所提供的替曲卡星A大环骨架的后修饰基因提供了通过遗传修饰得到类似物的途径,所包含的催化大环内酯生成的氧化反应亦可有其他应用。
总之,本发明所提供的包含替曲卡星A生物合成相关的所有基因和蛋白信息可以帮助人们理解替曲卡星A家族天然产物的生物合成机制,为进一步遗传改造提供了材料和知识。本发明所提供的基因及其蛋白质也可以用来寻找和发现可用于医药、工业或农业的化合物或基因、蛋白。
附图说明:
图1:替曲卡星A的化学结构
图2:替曲卡星A生物合成基因簇的限制性内切酶谱和基因结构。(A)7个交叠的粘粒代表了青褐色小单孢菌基因组中约110kb的DNA区域,B代表限制性内切酶BamHI,N代表限制性内切酶NcoI,粗体线表示已被DNA测序的部分,P5、P6代表标记的探针部分;(B)替曲卡星A生物合成基因簇的基因组成。
图3:提出的替曲卡星A糖基单元阿米西糖、毛地黄毒糖和硝基脱氧糖Tetronitrose的生物合成途径。
图4:提出的替曲卡星A大环骨架的生物合成途径及各单元组装成完整的替曲卡星A分子。
图5:青褐色小单孢菌发酵产物的高效液相色谱(HPLC)分析。(I)替曲卡星A标准品;(II)野生型青褐色小单孢菌NRRL11298;(III)tcaA1,tcaA2,tcaA4和tcaA基因中断的突变株。
图6:I型聚酮合成酶PKS tcaA1-A5的功能分析。(A)酰基转移酶结构域AT保守区域的分析;(B)脱水酶结构域DH保守区域的分析;(C)酮基还原酶结构域KR保守区域的分析。
符号说明:
图1:
Tetrocarcin:替曲卡星A。
图2:
(A)pTL3001,pTL3002,pTL3003,pTL3004,pTL3005,pTL3006和pTL3007表示筛选青褐色小单孢菌NRRL11289基因文库得到的粘粒;(B)P:探针;Sugar:糖基合成基因;PKS Skeleton:形成聚酮骨架的基因;3-C Unit:三碳单元合成基因;Glycosyltransferase:糖基化基因;Tailoring:后修饰基因;Regulation:调节基因;Resistance:抗性基因;Unknown:未知功能;Beyond the Cluster:基因簇之外。
图3:
TDP-L-amicetose:胸腺嘧啶核苷二磷酸-L-阿米西糖;TDP-L-digitoxose:胸腺嘧啶核苷二磷酸-L-毛地黄毒糖;TDP-L-tetronitrose:胸腺嘧啶核苷二磷酸-L-tetronitrose。
图4:
KS:酮基合成酶;AT:酰基转移酶;DH:脱氢酶;ER:烯醇还原酶;KR:酮基还原酶;ACP:酰基载体蛋白。
图5:
黑色三角:替曲卡星A标准品;数字1~6:野生型青褐色小单孢菌NRRL11298发酵液中新发现的可能的替曲卡星结构类似物。
图6:
(A)方框内表示决定底物特异性的保守氨基酸,星号表示活化丙二酸单酰辅酶A的AT;(B)方框内表示催化活性区域保守的酸性氨基酸,星号表示模块4和8中的DH因保守氨基酸的突变可能失去功能;(C)方框内表示催化活性保守的氨基酸,星号表示模块11中的KR因保守氨基酸的突变可能失去功能。
具体实施方式:
以下结合图1、图2、图3、图4、图5、及图6对本发明进一步详细说明。1.克隆、分析替曲卡星A的生物合成基因簇:
我们首先构建了以pOJ446为载体的青褐色小单孢菌NRRL11289总基因组文库。由于氯丝菌素和替曲卡星A在苷元结构上具有很高的相似性,这也暗示了这两个化合物苷元的生物合成基因簇也具有一定的同源性。以本课题组于2006年报道的氯丝菌素的生物合成基因簇为参照,我们将其中位于聚酮合成酶基因chlA2,chlA1和chlA5内部的一些DNA片段标记为异源探针,在青褐色小单孢菌NRRL11289总基因组文库中大约6000个克隆中进行筛选,分离得到的30个粘粒涵盖了染色体约70kb的区域。为获得完整的替曲卡星A生物合成基因簇,我们又构建了以pCC1FOS为载体的,随机性和效价都更高的青褐色小单孢菌NRRL11289总基因组文库。将已获得的与替曲卡星A生物合成相关的DNA区域左右末端的DNA片段标记为探针P5和P6,进行基因文库筛选和染色体步移,获得的18个粘粒分别向左右两侧扩展了15kb和22kb的DNA区域。经DNA测序和序列分析,发现该110kb的DNA区域已包含了完整的替曲卡星A生物合成基因簇。进一步经聚酮合成酶基因中断发现相应基因失活的突变菌株完全丧失了产生替曲卡星A的能力(图5,III),证明克隆了负责替曲卡星A生物合成的基因簇。综上所述,我们通过对青褐色小单孢菌NRRL11289的基因文库筛选和染色体步移获得了一系列相互交叠的粘粒,其中的pTL3001,pTL3002,pTL3003,pTL3004,pTL3005,pTL3006和pTL3007涵盖了染色体约110kb的区域(图2A)。DNA顺序分析了108,236bp的染色体区域,GC含量72.9%。生物信息学分析包含了47个开放读码框(图2B)。orf(-4)至orf42详细的分析结果列于表1。
表1 替曲卡星A的生物合成基因簇中各基因及编码蛋白的功能分析
2.替曲卡星A的生物合成基因簇边界的确定:
根据基因编码蛋白的功能分析,替曲卡星A的生物合成基因簇被确定为从基因tcaT1到tcaG(图2B),涵盖染色体94.6kb的区域,包含36个开放读码框。通过生物信息学分析,确定替曲卡星A的生物合成基因簇的边界:在替曲卡星A生物合成相关DNA区域左侧末端,orf(-4),orf(-3),orf(-2),orf(-1)和orf0分别编码了未知蛋白、ATP-结合区域(ATP酶)、双组分调节因子、III型DNA聚合酶和未知蛋白。这些酶往往参与微生物的初级代谢过程而与次级代谢无关;而tcaT1和tcaC分别编码了糖基转移酶和黄素氧化还原酶,我们推测它们都与替曲卡星A的生物合成相关。另外,从以上基因的相对位置来分析,orf0和tcaT1方向相反,不在相同启动子的控制之下。综合以上分析,我们推测替曲卡星A生物合成基因簇的左侧边界位于orf0和tcaT1之间。在替曲卡星A生物合成相关DNA区域右侧末端,tcaB6和tcaG分别编码了氧化还原酶和药物抗性基因,它们分别对替曲卡星A的生物合成以及排出微生物体外起着不可或缺的作用;而orf42、orf43、orf44、orf45、orf46和orf47分别编码了M23肽酶、整联蛋白、醛酮变位酶、调节蛋白、金属离子转运蛋白和α/β水解酶。以上这些酶均与微生物的初级代谢相关而非次级代谢必需。另外,从以上基因的相对位置来分析,tcaG和orf42方向相反,它们处于不同的启动子控制之下。综合以上分析,我们推测替曲卡星A生物合成基因簇的右侧边界位于tcaG和orf47之间。
整个替曲卡星A的生物合成基因簇共36个基因,其中5个(tcaA1,tcaA2,tcaA3,tcaA4,tcaA5)用于编码非重复使用的I型聚酮合成酶,共包含12个模块,负责催化替曲卡星A大环骨架部分聚酮链的生物合成;4个基因(tcaD1,tcaD2,tcaD3,tcaD4)编码的蛋白负责三碳单元的生物合成,并进一步与聚酮链缩合、环化形成大环骨架的[6,6]并环和[6,5]螺环结构;11个(tcaB1,tcaB2,tcaB3,tcaB4,tcaB5,tcaB6,tcaB7,tcaB8,tcaB9,tcaB10,tcaB11)编码的蛋白负责阿米西糖、毛地黄毒糖和硝基脱氧糖Tetronitrose的生物合成;9个后修饰基因(tcaC,tcaE1,tcaE2,tcaE3,tcaF,tcaM,tcaT1,tcaT2,tcaT3,tcaT4)编码的蛋白催化替曲卡星A大环骨架的后修饰和糖基化;还包括2个调节基因(tcaR1,tcaR2)和1个抗性基因(tcaG)及4个功能不十分确定的基因(tcaU1,tcaU2,tcaU3,tcaU4)。
3.阿米西糖、毛地黄毒糖和硝基脱氧糖Tetronitrose的生物合成:
阿米西糖、毛地黄毒糖和硝基脱氧糖Tetronitrose的生物合成如图3A所示:tcaB1编码的dNDP-D-葡萄糖合成酶催化dNDP-D-葡萄糖(2)的合成,然后在tcaB2编码的dNDP-D-葡萄糖-4,6-脱水酶的催化下发生6位脱水,生成化合物(3),接着在tcaB3编码的2,3-脱水酶的催化下发生2位脱水生成化合物(4)。以此化合物为第一个分支点,分别合成脱氧糖和硝基脱氧糖。在tcaB4编码的3-酮基还原酶的作用下3位酮基还原为羟基,生成化合物(5),接着在tcaB5编码的5位异构酶的催化下生成NDP-4-酮-2,6-二脱氧阿洛糖(6),以此化合物为第二个分支点分别在进行3位脱氧和4位还原分别形成化合物(7)和毛地黄毒糖,前者再经tcaB6编码的氧化还原酶催化反应生成阿米西糖。从化合物(4)出发,经tcaB8编码的氨基转移酶在其3位转上氨基,生成化合物(8),然后再经tcaB9编码的碳甲基转移酶在其3位转上甲基,生成化合物(9),tcaB10编码的氧化还原酶将其3位氨基氧化成为硝基,再经tcaB7编码的氨基转移酶在化合物(10)的4位转上氨基,生成化合物(11),tcaB11编码的氮甲基转移酶在4位氨基上转上甲基,之后,可能由一些位于已发现基因簇外侧的氧化酶和C-甲基转移酶的催化下,对化合物(11)再进行一系列氧化、甲基化进而生成硝基脱氧糖Tetronitrose,从而完成替曲卡星A中各个糖基单元的生物合成。
4.替曲卡星A聚酮大环骨架的合成及各单元组装成完整的替曲卡星A分子:
替曲卡星A大环骨架聚酮链部分是由典型的I型聚酮合成酶PKS催化合成的(图4)。其中tcaA1编码的PKS包含四个模块,起始模块包含KSQL,ATL,ACPL三个结构域,KSQL中因KS催化缩合关键的活性位点由半胱氨酸C突变为谷氨酰胺Q而仅具有脱羧活性。延伸模块1包含KS1,AT1,DH1,KR1,ACP1结构域;延伸模块2包含KS2,AT2,DH2,KR2,ACP2结构域;延伸模块3包含KS3,AT3,DH3,KR3,ACP3结构域。tcaA2编码的PKS包含四个延伸模块,延伸模块4包含KS4,AT4,DH*4,KR4,ACP4结构域,其中的DH结构域因关键的保守氨基酸突变而不具有活性(图6B);延伸模块5包含KS5,AT5,DH5,KR5,ACP5结构域结构域;延伸模块6包含KS6,AT6,DH6,KR6,ACP6;延伸模块7包含KS7,AT7,DH7,KR7,ACP7结构域。tcaA3编码的PKS包含延伸模块8,9,其中延伸模块8由KS8,AT8,DH*8,ER8,KR8,ACP8结构域组成,其中的DH结构域因关键的保守氨基酸突变而不具有活性(图6B);延伸模块9由KS9,AT9,DH9,KR9,ACP9结构域组成。tcaA4编码PKS只包含一个延伸模块10,由KS10,AT10,DH10,KR10,ACP10结构域组成,tcaA5编码的PKS包含最后一个模块11,由由KS11,AT11,DH10,KR*10,ACP11结构域组成,其中的KR结构域因关键的保守氨基酸突变而不具有活性(图6C)。分析所有模块中的AT结构域发现只有模块4、模块6和模块10中的AT识别甲基丙二酸单酰辅酶A,而其他模块的AT均识别丙二酸单酰辅酶A为底物(图6A),但根据替曲卡星A的分子结构,其中的起始模块、模块1和模块2中的AT也均应识别丙二酸单酰辅酶A,可能现有的推测AT底物的模型还不能准确推测其识别的真正底物。
在上述PKS的催化下7分子丙二酸单酰辅酶A与5分子甲基丙二酸单酰辅酶A依此经活化、脱羧缩合生成聚酮长链,其经第一次分子内[4+2]环加成反应形成中间体14;同时由甘油代谢的三碳单元中间体经tcaD1编码的甲氧基-丙二酰基载体蛋白合成酶活化,连接到tcaD2编码的酰基载体蛋白上,然后经tcaD3编码的丙酮酸/2-氧代戊二酸脱氢酶的催化,从TcaD2蛋白上解离的同时被连接于辅酶A上,形成活性形式的甘油酰辅酶A(16);然后该化合物在tcaD4编码的III型酮基合成酶催化下,将聚酮长链从TcaA5的最后一个酰基载体蛋白ACP上解离下来,形成中间体(17),其在tcaD3编码的水解酶/乙酰基转移酶的催化下形成五元内酯环,经一步可能自发进行也可能是由未知蛋白催化的脱水反应后形成化合物(19),其再经历一次分子内的[4+2]环加成反应生成化合物(20);tcaE1,tcaE2,tcaM,tcaT1,tcaT2,tcaT3,tcaT4编码的氧化酶、糖基转移酶和酰基转移酶对化合物(20)进行一系列的氧化、糖基化、酰基化等后修饰反应后,最终完成替曲卡星A的生物合成(图4)。
5.替曲卡星A生物合成基因簇的应用——以生物合成基因簇中聚酮合成酶基因的中断突变株发酵产物作为对照,从野生型菌株发酵产物中新发现一系列可能的替曲卡星A结构类似物:
在克隆、分析了完整替曲卡星A生物合成基因簇,研究了各基因编码蛋白可能的功能的基础上,本发明对替曲卡星A的生物合成机制进行了初步探讨,这有助于理解替曲卡星A的生物合成机制,同时也为进一步通过对生物合成基因簇进行遗传修饰获得替曲卡星A机构类似物提供了可能。如本发明通过对tcaT2(编码糖基转移酶)基因进行基因中断获得的突变菌株不再产生替曲卡星A,但可以产生几个新的替曲卡星A结构类似物(图5)。
以下进一步提供实施实例,这些实施实例有助于理解本发明,仅用作说明而不限制本发明的应用范围。
实施例1
替曲卡星A产生菌青褐色小单孢菌NRRL11289总DNA的提取:
吸取100μl-80℃冻存的青褐色小单孢菌菌丝悬液接种到含有3ml TSB(30g/LTryptone Soya Broth)培养基的试管中,30℃,振荡培养约36小时,取2.5ml菌液接种至50ml TSB(含0.5%甘氨酸,25mM氯化镁)培养基中,30℃,振荡培养约36个小时至菌液显新鲜橙色,3500rpm离心收集菌体,用裂解液(150g/L蔗糖,25mM Tris-Cl,25mM EDTA)洗两次,存于-20℃供提取基因组DNA用。向收集的菌丝中加入10ml裂解液(含溶菌酶5mg/ml,消色肽酶1mg/ml),涡旋至均一,37℃温浴30分钟,加入0.1ml蛋白酶K(4mg/ml),1ml 10%SDS,混匀迅速放入70℃水浴15分钟,待溶液澄清。置于冰上冷却,加入2.5ml 5M醋酸钾,冰上冷却15分钟。加入10ml Tris饱和酚,混匀,10ml氯仿,混匀,12000-15000rpm,4℃离心20分钟。用平口的枪头将水相吸出转移至新的离心管,加等量的氯仿/异戊醇(24:1)抽提,12000rpm,4℃离心10分钟,用平口的枪头将水相吸出置于新的离心管,加入0.1体积的3M醋酸钠,2倍体积的乙醇,混匀,有大团的DNA出现。将其勾出置于新的离心管,加5ml 70%乙醇洗涤,将液体倾出,用枪吸净,加5ml TE溶解,加32μl RNA酶(终浓度为50μg/ml),37℃温浴0.5小时。依次用等体积的饱和酚抽提两次,氯仿/异戊醇抽提两次,向水相中加入0.1体积的3M醋酸钠,2倍体积的无水乙醇,轻轻的混合充分,有絮状DNA出现。将四管DNA合并到两管(每管中有1ml 70%乙醇),将乙醇吸出,再加1ml无水乙醇洗涤,吸出,超净台中吹干,溶于1ml TE(50ml菌液收集的菌丝体提出的总DNA溶于1ml TE缓冲液)中。
实施例2
替曲卡星A产生菌青褐色小单孢菌NRRL11289基因组Cosmid文库的建立:
首先通过一系列的稀释实验来确定Sau3AI的用量,在此基础上大量酶切得到的DNA片段略大于40kb,脱磷。pOJ446先用BglII从两个cos序列中间切开并脱磷,然后再从多克隆位点处用BamHI切开,获得两个臂,与制备的40kb的DNA片段连接过夜。从-80℃冰箱中取出包装混合物置于干冰桶中,将包装混合物在指间迅速融化,在刚刚开始融化时加入4μL的连接产物,用枪混匀,22℃水浴2小时。加入500μLSM缓冲液[(L-1):5.8g NaCl,2.0g MgSO4,50.0ml1M Tris.HCl(pH=7.5),5.0ml 2%(w/v)琼脂]和50μL氯仿,轻轻混匀,3000rpm离心4秒,上下界面出现沉淀,转移上清至新管中,于4℃保存。将冻存于-80℃的菌株E.colivcs257涂布在LB培养基上复苏。挑取单克隆接种于50ml LB培养基中(含0.2%麦芽糖和10mM MgSO4),37℃,220rpm振荡6.5小时,测得其OD600=0.8时,取用100μL的包装上清和100 OD600=0.83的菌液,轻弹管壁使其混匀,平行操作5份。22℃水浴30分钟,加入800μL的LB培养基,37℃水浴1.5小时,每15分钟倒转一次。每一份涂布一块LB琼脂培养基(含100μg/ml氨苄西林)(15mm×15mm),每一份用200μL的LB培养基涮洗,37℃培养18个小时。测定噬菌斑形成单位(pfu)以估算文库的校价。然后用LB培养基涮洗,加入氨苄西林和甘油,使氨苄西林的终浓度为50μg/ml,甘油的终浓度为18%。分装成1ml×12,0.5ml×48,025ml×24。保存于-80℃。
替曲卡星A产生菌青褐色小单孢菌NRRL11289基因组Fosmid文库的建立:
用注射器对提取的青褐色小单孢菌NRRL11289总DNA(2.5μg以上)反复的吹吸来使其被机械剪切力随机打断,吹吸次数根据片段原始的大小来决定,一般每50次用电泳检查一次效果,直至10%左右的片段在36kb的control DNA附近。用蔗糖密度梯度离心的方法分离36~40kb大小的DNA进行补平且5’端被磷酸化。将DNA片段以10:1(载体:片段)的比例连至试剂盒提供的pCC1FOS载体,包装入CopyControlTM(Epicentre,Aus.)试剂盒中提供的MaxPlax Lambda Packaging Extracts噬菌体蛋白。
将试剂盒中提供的宿主菌EPI300—T1R取出,涂布或者画线于不含任何抗生素的LB琼脂培养基上,37℃过夜培养,以10%的接种量,接入50ml LB(含10mM MgSO4)中,37℃培养至OD600=0.8~1.0,将包装好的噬菌体蛋白转染该宿主菌并进行效价测定,并将转染后得到的克隆用合适体积的LB洗下后加入甘油(终浓度20%),冻存于—70℃。
实施例3
核酸分子杂交:
1)DIG DNA标记:将待标记的DNA用无菌水稀释至总体积15μL,沸水浴中加热变性10分钟,立即置于冰盐浴中冷却。接着加入2μL引物混合物,2μLdNTP混合物,1μL酶,混合均匀后,37℃水浴约16小时。加入0.8μL 0.8M EDTA(pH8.0)以终止反应,加入2.5μL 4M LiCl混合均匀,再加入75μL预冷的无水乙醇沉淀标记后的DNA,置于—80℃沉降40分钟。4℃,12000rpm离心20分钟收集DNA,用预冷的70%乙醇洗涤DNA沉淀,真空干燥后重新溶于50μLTE((pH 8.0)中。
2)DIG DNA探针标记后的质量检测:稀释标记的DNA探针,至以下六个梯度,1、10-1、10-2、10-3、10-4、10-5。稀释标记的对照DNA至浓度分别为以下浓度1μg/ml,100ng/ml,10ng/ml,1ng/ml,0.1ng/ml,0.01ng/ml。分别取1μL上述梯度的DNA样品点在杂交用的尼龙膜上,根据7)所述步骤进行显色反应,对比标记的DNA探针和DIG标记的对照DNA的显色强度以决定标记的DNA探针浓度。
3)菌落杂交(文库筛选)的膜转移:将保存于-80℃的基因文库稍融,取50μL,用450μL LB稀释得到10-1的稀释倍数,倍比稀释得到10-2,10-3,10-4,10-5,10-6。300μL涂培养基(15cm×15cm,培养基为LB/50μg/ml卡那霉素)。选取合适的比例,使每块培养基约1200—1500个克隆。照选定的比例均匀涂布四块培养基,37℃培养过夜。根据培养基的大小剪取尼龙膜,小心地覆盖于培养基表面不要产生气泡,做好位置标记,1分钟后取下尼龙膜置于干燥滤纸上,干燥10分钟直至菌落结合在尼龙膜上。原始的培养基置于培养箱中4—5hr,使克隆重新生长作为原培养基。将尼龙膜置于变性液(0.25M NaOH,1.5M NaCl)饱和的滤纸上15分钟(不要浸过膜),转移至中和液(1.0M Tris.HCl,1.5M NaCl,pH 7.5)饱和的滤纸上5分钟。转移至2×SSC(20×SSC储备液(L-1):NaCl,350.6g,柠檬酸钠,176.4g,pH=7.0)饱和的滤纸上自然风干。取下尼龙膜置于烘箱中,120℃固定45分钟。常温下于3×SSC/0.1%SDS溶液中振荡洗涤3小时,以除去细胞碎片。
4)Southern杂交的膜转移:DNA样品在适当浓度的琼脂糖凝胶上电泳至适当距离,做好标记。浸泡于400ml 0.25M HCl中脱嘌呤20分钟,使溴酚蓝变黄,用去离子水洗数次。室温下浸入碱性缓冲液(0.5M NaOH,1M NaCl)15分钟并轻轻振荡。换液一次继续浸泡凝胶20分钟,并轻轻振荡,去离子水洗三次。取一张每边都比凝胶大1mm的尼龙膜,用去离子水完全浸湿,做好标记。采用向上毛细管转移方法,用10×SSC转移缓冲液转移8—24hr。用2×SSC略微洗膜,120℃烘烤30分钟。
5)预杂交和杂交:预热杂交液(20ml/100cm2)至杂交温度68℃,放入杂交尼龙膜,轻轻振荡并保温30分钟。将DIG标记的DNA探针在沸水浴中变性5分钟,立即置于冰盐浴中冷却。冷却后,将DNA探针与合适体积的DIG杂交液(2.5ml/100cm2)混合均匀。去除预杂交液并立即把DNA探针/DIG杂交液加入,轻轻振荡保持杂交温度64℃或68℃约16小时。
6)杂交后严紧洗脱:室温下用2×SSC/0.1%SDS漂洗两次,每次5分钟。68℃,用0.1×SSC/0.1%SDS振荡漂洗两次,每次15分钟。
7)显色反应和检测:严紧洗脱后的尼龙膜在洗涤缓冲液(0.1M马来酸,0.15MNaCl,pH=7.5,0.3%(v/v)Tween 20)中平衡1-5分钟,接着在封闭缓冲液(封闭试剂以10%的浓度溶于0.1M马来酸,0.15M NaCl,pH=7.5)中封闭30分钟,然后在抗体中浸泡30分钟。用洗涤缓冲液漂洗尼龙膜两次后,用检测缓冲液(0.1M Tris-HCl,0.1M NaCl,pH=9.5)中平衡2-5分钟,最后将尼龙膜置于10ml新配制的显色溶液[NBT(nitroblue tetrazolium tcaoride)溶于70%DMF,浓度为70mg/ml,BCIP(5-bromo-4-tcaoro-3-indolyl-phosphate)溶于水,浓度为50mg/ml。用时10ml显色溶液中加45μLNBT,35μLBCIP]中,置于黑暗中显色。显色合适后用去离子水漂洗以终止反应。
实施例4
替曲卡星A产生菌青褐色小单孢菌NRRL11289遗传转移系统的建立:
取1ml-80℃冻存的青褐色小单孢菌NRRL11289菌丝悬液接种到TSB培养基(含3%甘露糖),28℃,250rpm振摇培养30~36小时至菌丝的对数生长期中期,即菌丝大量增殖,且显新鲜橙色。3000rpm离心10分钟收集菌丝。用15ml LB(10g/L蛋白胨,5g/L酵母提取物,10g/ml氯化钠)洗两次,悬浮菌丝于5ml LB中,取1ml转移入匀浆器中匀浆15~20分钟使菌丝变细,待用。
将构建好的重组质粒转化E.coli S17-1,从转化的培养基上挑取单克隆菌落入3ml LB(含相应抗生素)中于37℃,220rpm振摇培养12~15小时,取500μL菌液接种入50ml LB(含相应抗生素),于37℃,220rpm振摇培养4~5小时至OD600至0.3~0.4。将菌液倒入50ml离心管中,于2500rpm离心10分钟,倾去上清,用15ml LB洗涤菌体两次。向其中加入5ml LB培养液重悬菌体细胞,待用。
将青褐色小单孢菌NRRL11289的菌液和E.coli S17-1(含重组质粒)菌体细胞按照1:10体积混合,取200μL涂在As-1(含10mM MgCl2)培养基上,同时做阴性对照和阳性对照,其中,用做阳性对照和阴性对照的培养基上只涂200μL小单孢菌菌液。将涂好菌液的培养基放入30℃培养箱中培养16~20小时后,用8~10ml无菌水轻轻洗去每块培养基上的大肠杆菌,用枪吸走菌液,再向接合转移培养基上和阴性对照的培养基上涂布相应抗生素。然后将培养基置于超净台中吹3~4小时。将培养基放于30℃培养箱中倒置培养,约6天后长出浅橙色的接合子单菌落。
实施例5
替曲卡星A产生菌青褐色小单孢菌NRRL11289基因中断突变菌株的获得:
将含有相应重组质粒的青褐色小单孢菌NRRL11289的接合子单菌落接种入4ml TSB培养液(含相应抗生素)中于30℃,250rpm培养7天,待菌液长浓,显新鲜橙红色。取50μL单交换突变株的菌液接种入4ml TSB培养液(不含抗生素)中,于30℃,220rpm振摇培养并在无抗生素的TSB培养液中传代3~4次诱导基因双交换突变株的产生。之后,取2μL菌液涂于IWL-4琼脂培养基上,挑取对相应抗生素抗性正确的菌落即可能为基因双交换突变株。抽提突变株的总DNA进行Southern杂交验证,同时进行发酵进行表型验证。
实施例6
替曲卡星A生物发酵、产物分离纯化与鉴定:
接种1ml-80℃冻存的青褐色小单孢菌NRRL11289到50ml种子培养基(10g/L葡萄糖,24g/L可溶性淀粉,3g/L牛肉浸膏,5g/L蛋白胨,5g/L酵母提取物,20g/L碳酸钙,pH 7.2)中,220rpm,28℃培养36小时。取10ml种子发酵液接种入100ml二级发酵液(60g/L可溶性淀粉,10g/L干酵母,10g/Lβ-环糊精,2g/L碳酸钙,pH 6.8)中,220rpm,28℃培养72小时后,3800rpm离心10分钟收集上清,用1M HCl调pH至2.0,用等体积乙酸乙酯萃取3次,合并有机相,无水硫酸钠干燥,减压浓缩至干,然后将浓缩物溶于1ml甲醇中,用HPLC(AngilentTM 1100)方法检测,HPLC的条件如表2。将发酵产物的乙酸乙酯提取液以同样条件进行LC-MS检测(ThermoFisher LTQ Fleet)。
表2 HPLC条件和洗脱程序
实施例7
替曲卡星A生物合成基因簇的应用——以聚酮合成酶合成基因中断突变株为对照,在青褐色小单孢菌NRRL11289的发酵液中发现新的替曲卡星结构类似物:
在替曲卡星A生物合成基因簇中,tcaA1,tcaA2,tcaA4,tcaA5是一组同顺反子的编码聚酮合成酶的基因。该基因失活的突变菌株由于丧失了合成替曲卡星大环骨架的能力而不再产生替曲卡星。该结果不仅可以证实我们发现的该段DNA区域的确与替曲卡星的生物合成相关,其发酵液中消失的组分(与野生型发酵液)同时也可以帮助我们重新发现并识别青褐色小单孢菌NRRL11289产生的一系列替曲卡星的结构类似物、衍生物和其生物合成过程中的副产物。本发明首先对粘粒pTL3001和pTL3002进行NotI/BamHI限制性内切酶酶切分别获得6.0kb和4.5kb的基因片段,连接入质粒载体pANT841的相应酶切位点,得到重组质粒pTL3016和pTL3017;再分别从中酶切回收6.0kb HindIII/BamHI和4.5kb BamHI/SpeI片段,将其共同连入pOJ260载体的HindIII/XbaI位点,构建tcaA1,tcaA2,tcaA4和tcaA5基因中断突变株的重组质粒。将该质粒以实施例2所示方法导入替曲卡星A的产生菌青褐色小单孢菌NRRL11289中,按实施例5所示方法获得基因中断的双交换突变菌株,按实施例4所示方法发酵、提取产物,HPLC分析发现tcaA1,tcaA2,tcaA4和tcaA5基因中断的突变菌株的确不再产生替曲卡星,与此同时,与野生型发酵产物相比,该基因突变株中也同时消失了其它很多组分。因此,我们通过HPLC-MS进一步分析青褐色小单孢菌NRRL11289的发酵产物,发现其至少可以产生6个新的替曲卡星A结构类似物。
以下根据本发明内容提供基因和蛋白序列
序列列表:
SEQUENCE LISTING
<110>中国科学院上海有机化学研究所
<120>替曲卡星A(Tetrocarcin A)生物合成基因簇
<170>PatentIn version 3.3
<210>1
<211>108236
<212>DNA
<213>青褐色小单孢菌NRRL11289(Micromonospora chalcea NRRL11289)
<400>1
<210>2
<211>370
<212>PRT
<213>Micromonospora chalcea NRRL11289
<400>1
<210>3
<211>186
<212>PRT
<213>Micromonospora chalcea NRRL11289
<400>1
<210>4
<211>109
<212>PRT
<213>Micromonospora chalcea NRRL11289
<400>1
<210>5
<211>146
<212>PRT
<213>Micromonospora chalcea NRRL11289
<400>1
<210>6
<211>1263
<212>PRT
<213>Micromonospora chalcea NRRL11289
<400>1
<210>7
<211>267
<212>PRT
<213>Micromonospora chalcea NRRL11289
<400>1
<210>8
<211>197
<212>PRT
<213>Micromonospora chalcea NRRL11289
<400>1
<210>9
<211>332
<212>PRT
<213>Micromonospora chalcea NRRL11289
<400>1
<210>10
<211>392
<212>PRT
<213>Micromonospora chalcea NRRL11289
<400>1
<210>11
<211>263
<212>PRT
<213>Micromonospora chalcea NRRL11289
<400>1
<210>12
<211>380
<212>PRT
<213>Micromonospora chalcea NRRL11289
<400>1
<210>13
<211>380
<212>PRT
<213>Micromonospora chalcea NRRL11289
<400>1
<210>14
<211>395
<212>PRT
<213>Micromonospora chalcea NRRL11289
<400>1
<210>15
<211>332
<212>PRT
<213>Micromonospora chalcea NRRL11289
<400>1
<210>16
<211>434
<212>PRT
<213>Micromonospora chalcea NRRL11289
<400>1
<210>17
<211>373
<212>PRT
<213>Micromonospora chalcea NRRL11289
<400>1
<210>18
<211>414
<212>PRT
<213>Micromonospora chalcea NRRL11289
<400>1
<210>19
<211>164
<212>PRT
<213>Micromonospora chalcea NRRL11289
<400>1
<210>20
<211>6305
<212>PRT
<213>Micromonospora chalcea NRRL11289
<400>1
<210>21
<211>7007
<212>PRT
<213>Micromonospora chalcea NRRL11289
<400>1
<210>22
<211>1840
<212>PRT
<213>Micromonospora chalcea NRRL11289
<400>1
<210>23
<211>1537
<212>PRT
<213>Micromonospora chalcea NRRL11289
<400>1
<210>24
<211>491
<212>PRT
<213>Micromonospora chalcea NRRL11289
<400>1
<210>25
<211>350
<212>PRT
<213>Micromonospora chalcea NRRL11289
<400>1
<210>26
<211>633
<212>PRT
<213>Micromonospora chalcea NRRL11289
<400>1
<210>27
<211>75
<212>PRT
<213>Micromonospora chalcea NRRL11289
<400>1
<210>28
<211>616
<212>PRT
<213>Micromonospora chalcea NRRL11289
<400>1
<210>29
<211>201
<212>PRT
<213>Micromonospora chalcea NRRL11289
<400>1
<210>30
<211>398
<212>PRT
<213>Micromonospora chalcea NRRL11289
<400>1
<210>31
<211>379
<212>PRT
<213>Micromonospora chalcea NRRL11289
<400>1
<210>32
<211>505
<212>PRT
<213>Micromonospora chalcea NRRL11289
<400>1
<210>33
<211>254
<212>PRT
<213>Micromonospora chalcea NRRL11289
<400>1
<210>34
<211>487
<212>PRT
<213>Micromonospora chalcea NRRL11289
<400>1
<210>35
<211>3964
<212>PRT
<213>Micromonospcra chalcea NRRL11289
<400>1
<210>36
<211>289
<212>PRT
<213>Micromonospora chalcea NRRL11289
<400>1
<210>37
<211>490
<212>PRT
<213>Micromonospora chalcea NRRL11289
<400>1
Claims (7)
1.一种抗生素——替曲卡星A的生物合成基因簇,其在于编码替曲卡星A生物合成所涉及的36个基因,具体为:
1)替曲卡星A非重复使用的I型聚酮合成酶基因,即tcaA1,tcaA2,tcaA3,tcaA4,tcaA5共5个基因:
tcaA1位于基因簇核苷酸序列第25588-44580个碱基处,长度为18993个碱基对,编码聚酮合成酶,6330个氨基酸;
tcaA2位于基因簇核苷酸序列第44582-65605个碱基处,长度为21024个碱基对,编码聚酮合成酶,7007个氨基酸;
tcaA3位于基因簇核苷酸序列第89806-101700个碱基处,长度为11895个碱基对,编码聚酮合成酶,3964个氨基酸;
tcaA4位于基因簇核苷酸序列第65565-71087个碱基处,长度为5523个碱基对,编码聚酮合成酶,1840个氨基酸;
tcaA5位于基因簇核苷酸序列第71162-75775个碱基处,长度为4614个碱基对,编码聚酮合成酶,1537个氨基酸;
2)替曲卡星A特殊三碳单元生物合成基因,即tcaD1,tcaD2,tcaD3,tcaD4共4个基因:
tcaD1位于基因簇核苷酸序列第78352-80253个碱基处,长度为1902个碱基对,编码甲氧基-丙二酰基载体蛋白合成酶,633个氨基酸;
tcaD2位于基因簇核苷酸序列第80250-80477个碱基处,长度为228个碱基对,编码独立存在的酰基载体蛋白,75个氨基酸;
tcaD3位于基因簇核苷酸序列第80474-82324个碱基处,长度为1851个碱基对,N端结构域编码丙酮酸2-氧代戊二酸脱氢酶,C端结构域编码水解酶/乙酰基转移酶,616个氨基酸;
tcaD4位于基因簇核苷酸序列第77303-78355个碱基处,长度为1053个碱基对,编码III型聚酮合成酶,350个氨基酸;
3)替曲卡星A脱氧糖阿米西糖和毛地黄毒糖以及硝基脱氧糖Tetronitrose的生物合成基因,即tcaB1,tcaB2,tcaB3,tcaB4,tcaB5,tcaB6,tcaB7,tcaB8,tcaB9,tcaB10,tcaB11共11个基因:
tcaB1位于基因簇核苷酸序列第19343-20230个碱基处,长度为888个碱基对,编码dNDP-D-葡萄糖合成酶,295个氨基酸;
tcaB2位于基因簇核苷酸序列第20227-21225个碱基处,长度为999个碱基对,编码dNDP-D-葡萄糖-4,6-脱水酶,332个氨基酸;
tcaB3位于基因簇核苷酸序列第89533-88076个碱基处,长度为1464个碱基对,编码2,3-脱水酶,487个氨基酸;
tcaB4位于基因簇核苷酸序列第13499-14497个碱基处,长度为999个碱基对,编码3-酮基还原酶,332个氨基酸;
tcaB5位于基因簇核苷酸序列第12849-13442个碱基处,长度为603个碱基对,编码NDP-己糖-5-异构酶,200个氨基酸;
tcaB6位于基因簇核苷酸序列第102587-101715个碱基处,长度为873个碱基对,编码氧化还原酶,290个氨基酸;
tcaB7位于基因簇核苷酸序列第16895-18037个碱基处,长度为1143个碱基对,编码氨基转移酶,380个氨基酸;
tcaB8位于基因簇核苷酸序列第22600-23721个碱基处,长度为1122个碱基对,编码氨基转移酶,373个氨基酸;
tcaB9位于基因簇核苷酸序列第23743-24987个碱基处,长度为1245个碱基对,编码甲基转移酶,414个氨基酸;
tcaB10位于基因簇核苷酸序列第21290-22594个碱基处,长度为1305个碱基对,编码酰基辅酶A脱氢酶,434个氨基酸;
tcaB11位于基因簇核苷酸序列第16681-15890个碱基处,长度为792个碱基对,编码甲基转移酶,263个氨基酸;
4)替曲卡星A大环骨架的后修饰基因,即tcaC,tcaE1,tcaE2,tcaF,tcaM,tcaT1,tcaT2,tcaT3,tcaT4,共9个基因:
tcaC位于基因簇核苷酸序列第9250-9810个碱基处,长度为561个碱基对,编码黄素依赖的氧化酶,186个氨基酸;
tcaE1位于基因簇核苷酸序列第75796-77271个碱基处,长度为1476个碱基对,编码FAD依赖的氧化酶,491个氨基酸;
tcaE2位于基因簇核苷酸序列第87242-85225个碱基处,长度为1518个碱基对,编码FAD-脱氢酶,505个氨基酸;
tcaF位于基因簇核苷酸序列第88026-87268个碱基处,长度为765个碱基对,编码硫酯酶,254个氨基酸;
tcaM位于基因簇核苷酸序列第18152-19294个碱基处,长度为1143个碱基对,编码O-酰基转移酶,380个氨基酸;
tcaT1位于基因簇核苷酸序列第8022-9134个碱基处,长度为1113个碱基对,编码糖基转移酶,370个氨基酸;
tcaT2位于基因簇核苷酸序列第15731-14553个碱基处,长度为1179个碱基对,编码糖基转移酶,392个氨基酸;
tcaT3位于基因簇核苷酸序列第83216-84410个碱基处,长度为1197个碱基对,编码糖基转移酶,398个氨基酸;
tcaT4位于基因簇核苷酸序列第84455-85594个碱基处,长度为1140个碱基对,编码糖基转移酶,379个氨基酸;
5)替曲卡星A的调节基因,即tcaR1,tcaR2共2个基因:
tcaR1位于基因簇核苷酸序列第11988-12791个碱基处,长度为804个碱基对,编码特异活化因子,267个氨基酸;
tcaR2位于基因簇核苷酸序列第83045-82467个碱基处,长度为579个碱基对,编码TetR家族转录调节因子,192个氨基酸;
6)替曲卡星A的抗性基因,即tcaG共1个基因:
tcaG位于基因簇核苷酸序列第104125-102653个碱基处,长度为1473个碱基对,编码药物排出蛋白,490个氨基酸;
7)还包括4个功能不明确的基因,即tcaU1,tcaU2,tcaU3,tcaU4:
tcaU1位于基因簇核苷酸序列第10171-9842个碱基处,长度为330个碱基对,编码未知功能蛋白,109个氨基酸;
tcaU2位于基因簇核苷酸序列第10440-10880个碱基处,长度为441个碱基对,编码未知功能蛋白,146个氨基酸;
tcaU3位于基因簇核苷酸序列第10691-11629个碱基处,长度为939个碱基对,编码未知功能蛋白,312个氨基酸;
tcaU4位于基因簇核苷酸序列第25068-25562个碱基处,长度为495个碱基对,编码未知功能蛋白,164个氨基酸。
2.根据权利要求1所述的替曲卡星A的生物合成基因簇,其特征在于编码的聚酮合成酶包含模块或结构域:酮基合成酶结构域KS、酰基转移酶结构域AT、酮基还原酶结构域KR、脱水酶结构域DH、烯酰基还原酶结构域ER、酰基载体蛋白ACP。
3.根据权利要求1所述的替曲卡星A的生物合成基因簇的用途,其编码蛋白催化合成抗生素替曲卡星A及其结构类似物。
4.根据权利要求3所述的替曲卡星A的生物合成基因簇的用途,其编码蛋白催化合成脱氧糖阿米西糖和毛地黄毒糖极其类似物。
5.根据权利要求3所述的替曲卡星A的生物合成基因簇的用途,其编码蛋白催化合成硝基脱氧糖Tetronitrose及其类似物。
6.根据权利要求3所述的替曲卡星A的生物合成基因簇的用途,其编码蛋白催化合成及替曲卡星A聚酮大环骨架及其类似物。
7.根据权利要求3所述的替曲卡星A的生物合成基因簇的用途,对其中的基因进行遗传改造获得的突变体经生物发酵得到替曲卡星A的结构类似物。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN200810036248A CN101363022B (zh) | 2008-04-18 | 2008-04-18 | 替曲卡星a的生物合成基因簇及其应用 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN200810036248A CN101363022B (zh) | 2008-04-18 | 2008-04-18 | 替曲卡星a的生物合成基因簇及其应用 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN101363022A true CN101363022A (zh) | 2009-02-11 |
CN101363022B CN101363022B (zh) | 2012-09-26 |
Family
ID=40389626
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN200810036248A Expired - Fee Related CN101363022B (zh) | 2008-04-18 | 2008-04-18 | 替曲卡星a的生物合成基因簇及其应用 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN101363022B (zh) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103361345A (zh) * | 2013-06-15 | 2013-10-23 | 福州大学 | 重组调控生物元器件强化次级代谢产物生物合成的方法 |
CN106916834A (zh) * | 2015-12-24 | 2017-07-04 | 武汉臻智生物科技有限公司 | 化合物的生物合成基因簇及其应用 |
CN106916835A (zh) * | 2015-12-24 | 2017-07-04 | 武汉臻智生物科技有限公司 | 化合物的生物合成基因簇及其应用 |
CN107299064A (zh) * | 2016-09-29 | 2017-10-27 | 天津大学 | 一株具有广谱抗菌活性的海洋放线菌s‑19‑3 |
CN112980864A (zh) * | 2021-03-10 | 2021-06-18 | 百缮药业(苏州)有限公司 | 一种合成抗癌药物中间体的重组大肠杆菌及其构建方法和应用 |
CN114150006A (zh) * | 2021-11-29 | 2022-03-08 | 中国农业科学院植物保护研究所 | 一种可提高米尔贝霉素产量的基因簇、重组菌及其制备方法与应用 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2000012494A1 (fr) * | 1998-08-31 | 2000-03-09 | Kyowa Hakko Kogyo Co., Ltd. | Agents induisant l'apoptose |
EP1477563A3 (en) * | 2003-05-16 | 2004-11-24 | Wyeth | Cloning genes from streptomyces cyaneogriseus subsp.noncyanogenus for biosynthesis of antibiotics and methods of use |
CN100465277C (zh) * | 2005-07-01 | 2009-03-04 | 中国科学院上海有机化学研究所 | 氯丝菌素的生物合成基因簇及其应用 |
-
2008
- 2008-04-18 CN CN200810036248A patent/CN101363022B/zh not_active Expired - Fee Related
Cited By (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103361345A (zh) * | 2013-06-15 | 2013-10-23 | 福州大学 | 重组调控生物元器件强化次级代谢产物生物合成的方法 |
CN106916834A (zh) * | 2015-12-24 | 2017-07-04 | 武汉臻智生物科技有限公司 | 化合物的生物合成基因簇及其应用 |
CN106916835A (zh) * | 2015-12-24 | 2017-07-04 | 武汉臻智生物科技有限公司 | 化合物的生物合成基因簇及其应用 |
CN106916834B (zh) * | 2015-12-24 | 2022-08-05 | 武汉合生科技有限公司 | 化合物的生物合成基因簇及其应用 |
CN106916835B (zh) * | 2015-12-24 | 2022-08-12 | 武汉合生科技有限公司 | 化合物的生物合成基因簇及其应用 |
CN107299064A (zh) * | 2016-09-29 | 2017-10-27 | 天津大学 | 一株具有广谱抗菌活性的海洋放线菌s‑19‑3 |
CN107299064B (zh) * | 2016-09-29 | 2020-02-18 | 天津大学 | 一株具有广谱抗菌活性的海洋放线菌s-19-3 |
CN112980864A (zh) * | 2021-03-10 | 2021-06-18 | 百缮药业(苏州)有限公司 | 一种合成抗癌药物中间体的重组大肠杆菌及其构建方法和应用 |
CN112980864B (zh) * | 2021-03-10 | 2024-04-26 | 百缮药业(苏州)有限公司 | 一种合成抗癌药物中间体的重组大肠杆菌及其构建方法和应用 |
CN114150006A (zh) * | 2021-11-29 | 2022-03-08 | 中国农业科学院植物保护研究所 | 一种可提高米尔贝霉素产量的基因簇、重组菌及其制备方法与应用 |
CN114150006B (zh) * | 2021-11-29 | 2023-07-25 | 中国农业科学院植物保护研究所 | 一种可提高米尔贝霉素产量的基因簇、重组菌及其制备方法与应用 |
Also Published As
Publication number | Publication date |
---|---|
CN101363022B (zh) | 2012-09-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Hopwood | The Leeuwenhoek lecture, 1987-Towards an understanding of gene switching in Streptomyces, the basis of sporulation and antibiotic production | |
Walsh | Combinatorial biosynthesis of antibiotics: challenges and opportunities | |
Bode et al. | The impact of bacterial genomics on natural product research | |
Perlova et al. | Identification and analysis of the chivosazol biosynthetic gene cluster from the myxobacterial model strain Sorangium cellulosum So ce56 | |
CN102115757B (zh) | 台勾霉素的生物合成基因簇及其应用 | |
Jung et al. | A combined approach of classical mutagenesis and rational metabolic engineering improves rapamycin biosynthesis and provides insights into methylmalonyl-CoA precursor supply pathway in Streptomyces hygroscopicus ATCC 29253 | |
Kellenberger et al. | A polylinker approach to reductive loop swaps in modular polyketide synthases | |
CN101363022B (zh) | 替曲卡星a的生物合成基因簇及其应用 | |
CN105200072B (zh) | 一种芳香聚酮类非典型角环素fluostatins的生物合成基因簇及其应用 | |
Salcedo et al. | Characterization and engineering of the biosynthesis gene cluster for antitumor macrolides PM100117 and PM100118 from a marine actinobacteria: generation of a novel improved derivative | |
CN103131716A (zh) | 盐霉素的生物合成基因簇及其应用 | |
EP3385386A1 (en) | Carrimycin biosynthetic gene cluster | |
CN101275141B (zh) | 阿嗪霉素的生物合成基因簇 | |
CN110305881B (zh) | 一种聚酮类化合物neoenterocins的生物合成基因簇及其应用 | |
CN100465277C (zh) | 氯丝菌素的生物合成基因簇及其应用 | |
CN103215282A (zh) | 越野他汀的生物合成基因簇及其应用 | |
CN101445803A (zh) | 硫链丝菌素的生物合成基因簇 | |
US7153667B2 (en) | Discrete acyltransferases associated with type I polyketide synthases and methods of use | |
CN104911196A (zh) | 三欣卡辛的生物合成基因簇及其应用 | |
US7771972B2 (en) | Gene cluster of pederin biosynthesis genes | |
CN102061299A (zh) | 磷氮霉素的生物合成基因簇 | |
JP2005505301A (ja) | 形質転換細胞の作出、検出及び使用 | |
CN105087507B (zh) | 一种整合酶及其在改造刺糖多孢菌中的应用 | |
Khosla | The generation of organic molecule diversity through metabolic engineering | |
JP2004049100A (ja) | ミデカマイシンの生合成遺伝子 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20120926 |
|
CF01 | Termination of patent right due to non-payment of annual fee |