[go: up one dir, main page]

ES2959560T3 - Aumento de la productividad de células hospedadoras de E. coli que expresan funcionalmente enzimas P450 - Google Patents

Aumento de la productividad de células hospedadoras de E. coli que expresan funcionalmente enzimas P450 Download PDF

Info

Publication number
ES2959560T3
ES2959560T3 ES16839862T ES16839862T ES2959560T3 ES 2959560 T3 ES2959560 T3 ES 2959560T3 ES 16839862 T ES16839862 T ES 16839862T ES 16839862 T ES16839862 T ES 16839862T ES 2959560 T3 ES2959560 T3 ES 2959560T3
Authority
ES
Spain
Prior art keywords
seq
coli
terminal
amino acids
enzyme
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES16839862T
Other languages
English (en)
Inventor
Christopher Pirie
Liwei Li
Huey-Ming Mak
Srishti Tibrewala
Jason Donald
Ajikumar Kumaran
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Manus Bio Inc
Original Assignee
Manus Bio Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Manus Bio Inc filed Critical Manus Bio Inc
Application granted granted Critical
Publication of ES2959560T3 publication Critical patent/ES2959560T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/0004Oxidoreductases (1.)
    • C12N9/0071Oxidoreductases (1.) acting on paired donors with incorporation of molecular oxygen (1.14)
    • C12N9/0077Oxidoreductases (1.) acting on paired donors with incorporation of molecular oxygen (1.14) with a reduced iron-sulfur protein as one donor (1.14.15)
    • C12N9/0079Steroid 11 beta monooxygenase (P-450 protein)(1.14.15.4)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/52Genes encoding for enzymes or proenzymes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/70Vectors or expression systems specially adapted for E. coli
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P19/00Preparation of compounds containing saccharide radicals
    • C12P19/44Preparation of O-glycosides, e.g. glucosides
    • C12P19/56Preparation of O-glycosides, e.g. glucosides having an oxygen atom of the saccharide radical directly bound to a condensed ring system having three or more carbocyclic rings, e.g. daunomycin, adriamycin
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P5/00Preparation of hydrocarbons or halogenated hydrocarbons
    • C12P5/007Preparation of hydrocarbons or halogenated hydrocarbons containing one or more isoprene units, i.e. terpenes
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/01Fusion polypeptide containing a localisation/targetting motif
    • C07K2319/03Fusion polypeptide containing a localisation/targetting motif containing a transmembrane segment

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Genetics & Genomics (AREA)
  • Organic Chemistry (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Biotechnology (AREA)
  • Biomedical Technology (AREA)
  • Microbiology (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Plant Pathology (AREA)
  • Medicinal Chemistry (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)

Abstract

La presente invención se refiere a la producción de especies químicas en células huésped bacterianas. En particular, la presente invención proporciona la producción de especies químicas en células huésped de Escherichia coli (E. coli) que expresan funcionalmente enzimas P450 modificadas genéticamente. (Traducción automática con Google Translate, sin valor legal)

Description

DESCRIPCIÓN
Aumento de la productividad de células hospedadoras deE. colique expresan funcionalmente enzimas P450
Campo de la invención
La presente invención se refiere a la producción de especies químicas mediante química oxidativa en células hospedadoras bacterianas. En concreto, la presente invención proporciona enzimas P450 modificadas para la expresión funcional en células hospedadoras bacterianas, tales comoE. coli.
Antecedentes de la invención
E. colise utiliza ampliamente para la producción de sustancias químicas mediante la expresión recombinante de vías biosintéticas, lo que puede implicar la sobreexpresión de varios genes nativos y/o extraños. Sin embargo, cuando la vía biosintética implica la expresión recombinante de una o más enzimas del citocromo P450 (por ejemplo, para realizar la química oxidativa), se suelen preferir otros organismos hospedadores, tales como las levaduras. Véase Chang y Keasling, Nat. Chem. Bio., 2006. Las limitaciones percibidas del sistema bacteriano para la química oxidativa incluyen la ausencia de maquinaria de transferencia de electrones y de P450-reductasas (CPR), y la incompatibilidad traduccional de los módulos de señal de membrana de las enzimas P450 debido a la falta de retículo endoplásmico. Por lo tanto, sigue siendo una creencia común en la comunidad científica que E.colies un hospedador generalmente inadecuado para la expresión de P450 y la expresión de vías biosintéticas que incorporan las mismas. Véase Tippmanet al.,Biotech. Journal (2013); Thodeyet al.,Nat. Chem. Bio. (2014).
Es un objeto de la invención mejorar la productividad de las enzimas P450 en plataformas bacterianas, tales comoE. coli, para ampliar así la utilidad de estas plataformas para la química de P450.
Sumario de la invención
La invención se define mediante las reivindicaciones adjuntas.
La invención proporciona procedimientos para producir especies químicas mediante la expresión recombinante de vías biosintéticas que implican a las enzimas P450.
Las enzimas P450 modificadas descritas en el presente documento tienen un truncamiento N-terminal de 10 a 55 aminoácidos con respecto a la enzima de tipo salvaje, y la adición de un dominio transmembrana derivado de una proteína C-terminal citoplásmica de la membrana interna deE. coli.Se cree que el dominio transmembrana actúa para anclar la P450 a la membrana interna deE. coli.
El dominio transmembrana (o "anclaje N-terminal") se deriva de un gen deE. coliseleccionado entre waaA, ypfN, yhcB, yhbM, yhhm, zipA, ycgG, djlA, sohB, lpxK, F11O, motA, htpx, pgaC, ygdD, hemr e ycls. Estos genes se identificaron como proteínas C-terminales citoplásmica de la membrana interna mediante predicción bioinformática, así como validación experimental.
En algunos aspectos, la invención proporciona procedimientos para la producción de especies químicas mediante la expresión en células deE. colide una o más vías biosintéticas que incluyen al menos una enzima P450 (CYP) anclada a la membrana, y el cultivo de las células deE. colipara producir las especies químicas. Al menos una enzima P450 anclada a la membrana contiene un dominio transmembrana derivado de una proteína C-terminal citoplásmica de la membrana interna deE. coli.Tal como se demuestra en el presente documento, los procedimientos anteriores para expresar proteínas de P450 enE. colipueden dar lugar a una respuesta sustancial de estrés, lo que limita la productividad de la célula hospedadora. Las células deE. colique expresan las enzimas P450 modificadas descritas en el presente documento no muestran un fenotipo sustancialmente estresado en algunas realizaciones, mejorando así la productividad de la vía.
En diversos aspectos, la invención es aplicable a las enzimas P450 derivadas de plantas, que pueden modificarse para aumentar su productividad en un sistema de células hospedadoras bacterianas. Estas enzimas P450 modificadas pueden utilizarse en la producción de diversas especies químicas a través de la expresión de vías recombinantes, incluida, entre otras, la producción de compuestos terpenoides. Los terpenoides representan una clase diversa de moléculas que proporcionan atributos beneficiosos para la salud y nutricionales, así como numerosas aplicaciones comerciales distintas. Por ejemplo, los terpenoides se utilizan en la industria alimentaria y de bebidas, así como en las industrias de perfumería, cosmética y sanitaria.
En diversas realizaciones, la célula deE. colise utiliza para la producción de sustancias químicas mediante la expresión recombinante de vías biosintéticas, lo que puede implicar la sobreexpresión de varios genes nativos y/o extraños. A menudo, la expresión de varios genes extraños enE. coliy/o la sobreexpresión de genes nativos deE. colipueden inducir una importante respuesta de estrés, que limita la productividad. La expresión convencional de enzimas P450 enE. co li, junto con compañeros de citocromo P450 reductasa (CPR) para regenerar el cofactor, puede aumentar sustancialmente esta respuesta de estrés, tal como lo demuestra, por ejemplo, la sobreexpresión de IbpA, una proteína que se sobreexpresa enE. colien condiciones de alta agregación de proteínas y estrés. Es fundamental que la expresión de la enzima P450 induzca el menor estrés celular posible para evitar límites en la productividad de la vía. En consecuencia, la invención ayuda a minimizar el estrés celular en una célula hospedadora deE. colipara aumentar la productividad de la célula hospedadora para la producción de especies químicas.
Otros aspectos y realizaciones de la invención se desprenderán de la siguiente descripción detallada.
Descripción de las figuras
La figura 1 ilustra los anclajes N-terminales para expresar proteínas de P450 enE. coli,incluidos los diseños anteriores basados en el truncamiento de la hélice transmembrana de la P450 con la adición de un péptido de 8 aminoácidos (8RP), y el uso de hélices transmembrana de paso único y paso múltiple de proteínas deE. colicomo se describe en el presente documento.
La figura 2 muestra una predicción informática de péptidos señal y/o hélices transmembrana utilizando la herramienta de predicción Phobius. Se predice que SrKO y AfKAH tendrán una región transmembrana N-terminal. Se predice que el N-terminal de P450-C17 bovina es un péptido señal.
La figura 3 muestra el flujo total de terpenoides y la formación de terpenoides oxigenados tras la expresión enE. colide enzimas valenceno oxidasa (VO) truncadas en el residuo 30 y con diversos anclajes deE. coli.Las célulasde E. coliexpresan una vía de síntesis del valenceno, que produce el sustrato valenceno. También se muestran los resultados con enzimas VO de control que tienen el péptido señal 8rp con truncamiento de 20 o 30 residuos. Las enzimas incluyen una CPR acoplada traduccionalmente.
La figura 4 muestra el flujo total de terpenoides y la formación de terpenoides oxigenados tras la expresión en E.colide enzimas VO truncadas en el residuo 30 con candidatos a anclajes deE. coli(secuencias de yhcB, yhhm, zipA, ypfN, sohB y waaA).
La figura 5 muestra el flujo total de terpenoides y la formación de terpenoides oxigenados tras la expresión de enzimas VO a partir de un plásmido de expresión p10 o un plásmido de expresión p5. Mientras que el anclaje 8RP muestra una marcada disminución de la productividad en el nivel de expresión más alto proporcionado por un plásmido p10, el nivel de expresión más alto tiene poco impacto en la productividad con las enzimas VO modificadas con las secuencias de anclaje dE.coli.
La figura 6 muestra el flujo total de terpenoides y las valoraciones de terpenoides oxigenados tras la expresión de las enzimas VO en una cepa deE. coliproductora de valenceno con un compañero de citocromo P450 reductasa (CPR). Las enzimas VO se expresaron con la CPR como proteínas separadas del mismo operón o se acoplaron traduccionalmente.
La figura 7 muestra el nivel de expresión de la proteína VO con los candidatos a anclajes deE. coliN-terminales (es decir, yhcB, yhhm, zipA e ypfN), en comparación con t20-8RP Los cuatro anclajes deE. colinativos muestran una menor expresión total de VO en comparación con 8RP, lo que se traduce en una proporción relativa de VO/CPR significativamente menor.
La figura 8 muestra la respuesta de estrés celular a la expresión de VO con diferentes anclajes deE. coliN-terminales, mediante la evaluación de proteínas de respuesta al estrés conocidas deE. coli.La proteína IbpA, que se sobreexpresa enE. colien condiciones de alta agregación de proteínas, fue fuertemente expresada en respuesta a la expresión de t20-8RP, pero no con los anclajes deE. colinativos.
La figura 9 es un diagrama que muestra la optimización de la longitud de truncamiento y la longitud de anclaje de las enzimas VO ancladas a yhcB.
La figura 10 muestra el flujo total de terpenoides y la producción de terpenoides oxigenados con diversas enzimas VO truncadas y ancladas a yhcB. Los truncamientos variaron de 28 a 32 aminoácidos de la valenceno oxidasa, y la VO anclada incluyó de 20 a 24 aminoácidos del N-terminal de yhcB.
La figura 11 muestra la puntuación E(z) de las enzimas AfKAH truncadas en el residuo 26 con diversos anclajes deE. coli.El tipo salvaje ("wild-type", wt) es la puntuación en la enzima de tipo salvaje de E.coli,nXX es el número de residuos tomados de la proteína para un intercambio con el anclaje deE. coli,y el nombre de la proteína de origen. Los asteriscos muestran truncamientos no ensayados con VO. La puntuación E(z) calcula la idoneidad de una secuencia proteica para su inserción en una membrana celular basándose en estadísticas procedentes de estructuras cristalinas transmembrana resueltas.
La figura 12A muestra la formación de ácido kaurenoico tras la expresión en cepas productoras de kaureno de enzimas SrKO modificadas por un truncamiento en el residuo 30 y con la adición de anclajes deE. coli.Las enzimas se expresaron a partir de un plásmido p5 junto con una citocromo P450 reductasa (CPR) en el mismo operón. La formación de ácido kaurenoico se muestra a 30 °C y 34 °C. La figura 12B muestra la formación de ácido kaurenoico/DO de las cepas deE. coli.
La figura 13 muestra un análisis proteómico detallado de las células que expresan SrKO. Se evalúa la abundancia relativa de diversas proteínas de vías y de respuesta al estrés. SrKO se sobreexpresa significativamente cuando se empareja con anclajes no nativos(E. coliu 8rp), aunque el aumento de la expresión se atenúa a temperaturas más altas (34 °C frente a 30 °C). La respuesta al estrés de IbpA también aumenta significativamente a mayor temperatura.
Descripción detallada de la invención
La invención proporciona una expresión funcional mejorada de enzimas P450 en células hospedadoras bacterianas y, en concreto, en células bacterianas que no poseen enzimas P450 de forma natural, tales comoE. coli.Aunque estas plataformas bacterianas se utilizan ampliamente para la producción de una gran variedad de sustancias químicas, en general se consideran insuficientes cuando se requiere la química del P450. Las limitaciones percibidas de los sistemas bacterianos comoE. colipara la química oxidativa incluyen la ausencia de maquinaria de transferencia de electrones y P450-reductasas (CPR), y la incompatibilidad traduccional de los módulos de señal de membrana de las enzimas p450 debido a la falta de retículo endoplásmico.
La expresión básica del P450 enE. colise ha obtenido mediante la coexpresión de la P450 con una CPR. La enzima P450 contenía un truncamiento de al menos parte de la región transmembrana nativa de la P450, que se sustituyó por el marcador de 8 aminoácidos MALLLAVF (derivado de la P45017a bovina) en el extremo N-terminal. La presente invención demuestra que este marcador dista mucho de ser óptimo, y da lugar a una respuesta sustancial de estrés celular.
La presente divulgación proporciona enzimas P450 modificadas para la expresión funcional en plataformas bacterianas, tales comoE. coli.Las enzimas P450 comprenden una secuencia de anclaje a la membrana N-terminal derivada de una proteína nativa de la membrana interna deE. colique tiene un C-terminal citoplásmico. La secuencia de anclaje a la membrana N-terminal sustituye parte o la totalidad de la región transmembrana N-terminal nativa de la P450, cuando está presente en la enzima de tipo salvaje. La expresión de las enzimas P450 modificadas en bacterias induce menos estrés celular que los intentos anteriores de expresar funcionalmente las enzimas P450 enE. coli,por ejemplo. La invención permite aumentar la productividad biosintética en plataformas de hospedadores bacterianos, debido en parte a mejoras sustanciales en la eficiencia del P450 y a la minimización de la respuesta celular al estrés.
Se divulga una enzima P450 que tiene un dominio transmembrana derivado de una proteína de la membrana interna de E.colique tiene un C-terminal citoplásmico. El dominio transmembrana deE. coli(o un derivado del mismo) sustituye a una parte o a la totalidad de la región transmembrana N-terminal nativa de la P450.
La enzima P450 procede de plantas. La enzima P450 puede ser una P450 de la familia CYP70, CYP71, CYP73, CYP76 (por ejemplo, CYP76F), CYP82 o CYP92. La P450 puede ser una enzima divulgada en el documento US 8 722363. Los citocromos P450 de las plantas intervienen en una amplia gama de reacciones biosintéticas que dan lugar a diversos conjugados de ácidos grasos, hormonas vegetales, compuestos defensivos o compuestos de importancia médica y comercial, tales como los terpenoides. Los terpenoides representan la mayor clase de compuestos vegetales naturales caracterizados y suelen ser sustratos de las enzimas P450 vegetales. En algunas realizaciones, la P450 se deriva de una especie seleccionada entreZingiber sp., Barnadesia sp., Hyoscyamus sp., Latuca sp., Nicotiana sp., Citrus sp., Artemisia sp., Arabidopsis sp., Stevia sp., Bacillus sp., Pleurotus sp., Cichorium sp., Helianthus sp.yPhyscomitrella sp., Taxus sp., Rosa sp., Cymbopogon sp., Humulus sp., Pogostemon sp.yCannabis sp.Las secuencias de enzimas P450 de tipo salvaje son conocidas y son de acceso público y/o pueden obtenerse mediante análisis genéticos de plantas seleccionadas basados en motivos de P450 bien conocidos. Véase, por ejemplo, Saxena A.et al.,Identification of cytochrome P450 heme motif in plants proteome, Plant Omics (2013); Chapple C., Molecular-genetic analysis of plant cytochrome p450-dependent monooxygenases, Annual Review of Plant Physiology and Plant Molecular Biology, vol. 49:311-343 (1998).
La tabla 1 proporciona una lista de ejemplos de enzimas P450 que pueden modificarse de acuerdo con la invención:
Tabla 1
Así, la enzima P450 modificada puede basarse en secuencias de tipo salvaje de ZzHO (SEQ ID NO: 1), BsGAO (SEQ ID NO: 2), HmPO (SEQ ID NO: 3), LsGAO (SEQ ID NO: 4), NtEAO (SEQ ID NO: 5), CpVO (SEQ ID NO: 6), AaAO (SEQ ID NO: 7), AtKO (SEQ ID NO: 8), SrKO (SEQ ID NO: 9), PpKO (SEQ ID NO: 10), BmVO (SEQ ID NO: 11), PsVO (SEQ ID NO: 12), PoLO (SEQ ID NO: 13), CiVO (SEQ ID NO: 14) o HaGAO (SEQ ID NO: 15).
Otras enzimas P450 que pueden modificarse de acuerdo con la invención son la limoneno-6-hidroxilasa (AAQ18706.1, AAD44150.1), (-)-limoneno-3-hidroxilasa (EF426464, AY622319), ácido kaurenoico 13-hidroxilasa (EU722415.1), dioxigenasa de ruptura de carotenoides (ABY60886.1, BAJ05401.1), beta-caroteno hidroxilasa (AAA64983.1), amorfa-4,11-dieno monooxigenasa (DQ315671), taxadieno 5-alfa hidroxilasa (AY289209.2), 5-alfa-taxadienol-10-betahidroxilasa (AF318211.1), taxoide 10-beta hidroxilasa (AY563635.1), taxano 13-alfa-hidroxilasa (AY056019.1), taxano 14b-hidroxilasa (AY188177.1), taxoide 7-beta-hidroxilasa (AY307951.1). Pueden construirse derivados de estas P450 de acuerdo con la presente divulgación.
El andamio de la enzima P450 concreto puede seleccionarse en función de la especificidad de sustrato deseada, que puede ser su sustrato natural o un sustrato no natural similar al sustrato natural, o determinarse experimentalmente de otro modo. Las P450 pueden tener diferentes especificidades de sustrato, por lo que pueden modificarse para la química de sustratos no naturales. Véase, por ejemplo, Wuet al.,Expansion of substrate specificity of cytochrome P450 2A6 by random and site-directed mutagenesis, J. Biol. Chem., 280(49): 70-74 (2010). Algunos ejemplos de sustratos para la química de la P450 incluyen diversos metabolitos secundarios tales como, entre otros, terpenoides, alcaloides, cannabinoides, esteroides, saponinas, glucósidos, estilbenoides, polifenoles, antibióticos, policétidos, ácidos grasos y péptidos no ribosómicos. Algunos ejemplos de productos que pueden producirse mediante la química de la P450 incluyen, entre otros, luteína, tocoferol, ácido abiético, mogrósido, forskolina, amirina, lupeol, butiroespermol, ácido quílico, saponinas triterpenoides, ácido oleánico, ácido betulínico, ácido boswélico, ácido gimnémico, banaba/ácido corosólico, cetoesteroide deCissus,triterpenoide de curcurbitano, santalol, marrubiina, montbretina A, tropolona, esclareol, ácido pseudolárico, ácido grindélico, kauralexina, viteagnusina, epóxido de diterpenoide triptólido, triterpeno de quinona celastrol, ácido giberélico, ácido pseudolárico, carveol, carvona, nootkatol, nootkatona, piperitona, esteviol, perilaldehído, tagetona, verbenona, mentol, timol, 3-oxo-alfa-lonona, zeantina, artemisinina, taxol, gingkolida, gosipol, pseudoterosina, crotoforbolona, englerina, psiguadial, estemodinona, maritimol, ciclopamina, veratramina, aplivioleno, macfarlandina E, ácido betulínico, ácido oleanólico, ácido ursoloico, dolicol, lupeol, eufol, ácido cassaico, ertroxidiol, ácido trispórico, ácido podocárpico, reteno, deshidroleucodina, forbol, cafestol, kahweol, tetrahidrocannabinol, androstenol, tanshinona IIA o IIB o VI, criptotanshinona, 15,16-dihidrotanshinona, trijuganona A o B, dihidrotanshinona I, miltirona, ferruginol, hidrotanshinona IIA y 1,2-dihidrocritotanshinona.
Algunos ejemplos de productos de terpenoides que pueden producirse de acuerdo con la invención se describen en el documento US 8927241e incluyen: alfa-sinensal, beta-tujona, alcanfor, carveol, carvona, cineol, citral, citronelal, cubebol, geraniol, limoneno, mentol, mentona, nootkatona, nootkatol, pachulí, piperitona, sabineno, esteviol, glucósido de esteviol, taxadieno y timol.
En diversas realizaciones, la enzima P450 modificada comprende una secuencia de aminoácidos que tiene al menos un 30 % de identidad de secuencia, al menos un 40 % de identidad de secuencia o al menos un 50 % de identidad de secuencia con cualquiera de las SEQ ID NO: 1-15 u otra enzima P450 descrita en el presente documento. Aunque no es necesario que la P450 muestre una alta identidad de secuencia con estos ejemplos de enzimas P450 en algunas realizaciones, la P450 presenta motivos de P450 y/o estructura secundaria bien conocidos. En general, la identidad de secuencia de la P450 se determina por alineación de las secuencias completas de aminoácidos, excepto para las regiones transmembrana N-terminales (por ejemplo, la alineación no incluye aproximadamente los primeros 30 aminoácidos de la secuencia de tipo salvaje). En algunas realizaciones, la enzima P450 modificada comprende una secuencia de aminoácidos que tiene al menos un 60 % de identidad, al menos un 70 % de identidad, al menos un 75 % de identidad, al menos un 80 % de identidad, al menos un 85 % de identidad, al menos un 90 % de identidad, al menos un 95 % de identidad, al menos un 96 % de identidad, al menos un 97 % de identidad o al menos un 98 % de identidad con cualquiera de las SEQ ID NO: 48 a 60. Las SEQ ID NO: 48 a 60 muestran enzimas P450 sin la región transmembrana predicha (txx es la longitud del truncamiento N-terminal): t22ZzHO (SEQ ID NO:48), t20BsGAO (SEQ ID NO:49), 116HmPO (SEQ ID NO:50), 119LsGAO (SEQ ID NO:51), 116NtEAO (SEQ ID NO:52), t26CpVO (SEQ ID NO:53), t23AaAO (SEQ ID NO:54), t21AtKO (SEQ ID NO:55), t30SrKO (SEQ ID NO:56), t52PpKO (SEQ ID NO:57), t15PsVO (SEQ ID NO:58), t20CiVO (SEQ ID NO:59), t20HaGAO (SEQ ID NO:60).
La similitud de las secuencias de nucleótidos y de aminoácidos, es decir, el porcentaje de identidad de secuencia, puede determinarse mediante alineaciones de secuencias. Estas alineaciones pueden realizarse con varios algoritmos conocidos, tales como el algoritmo matemático de Karlin y Altschul (Karlin y Altschul (1993), Proc. Natl. Acad. Sci. USA, 90: 5873-5877), con hmmalign (paquete HMMER, http://hmmer.wustl.edu/) o con el algoritmo CLUSTAL (Thompson, J. D., Higgins, D. G. y Gibson, T J. (1994), Nucleic Acids Res., 22, 4673-4680). El grado de identidad de secuencia (coincidencia de secuencia) puede calcularse utilizando, por ejemplo, BLAST, BLAT o BlastZ (o BlastX). Un algoritmo similar se incorpora a los programas BLASTN y BLASTP de Altschulet al.(1990), J. Mol. Biol., 215: 403 410. Las búsquedas de polinucleótidos BLAST pueden realizarse con el programa BLASTN, puntuación = 100, longitud de palabra = 12.
Las búsquedas de proteínas BLAST pueden realizarse con el programa BLASTP, puntuación = 50, longitud de palabra = 3. Para obtener alineaciones con huecos con fines comparativos, se utiliza Gapped BLAST como se describe en Altschulet al.(1997), Nucleic Acids Res., 25: 3389-3402. Al utilizar los programas BLAST y Gapped BLAST, se utilizan los parámetros por defecto de los respectivos programas. El análisis de coincidencia de secuencias puede complementarse con técnicas establecidas de cartografiado de homología, tales como Shuffle-LAGAN (Brudno M., Bioinformatics, 2003b, 19, supl. 1:154-162) o los campos aleatorios de Markov.
En diversas realizaciones, la enzima P450 modificada puede comprender una secuencia de aminoácidos que tiene una o más mutaciones de aminoácidos en relación con la secuencia de tipo salvaje, sin incluir las modificaciones de la región transmembrana N-terminal (por ejemplo, aproximadamente los primeros 18 a 30 aminoácidos). Por ejemplo, la enzima P450 puede comprender una secuencia de aminoácidos que tenga de 1 a aproximadamente 50, o de 1 a aproximadamente 40, o de 1 a aproximadamente 30, o de 1 a aproximadamente 25, o de 1 a aproximadamente 20, o de 1 a aproximadamente 15, o de 1 a aproximadamente 10, o de 1 a aproximadamente 5 mutaciones en relación con la secuencia de tipo salvaje (por ejemplo, cualquiera de las SEQ ID NO: 48 a 60). En algunas realizaciones, dichas una o más mutaciones de aminoácidos pueden seleccionarse independientemente entre sustituciones, inserciones, deleciones y truncamientos. En algunas realizaciones, las mutaciones de aminoácidos son sustituciones de aminoácidos y pueden incluir sustituciones conservadoras y/o no conservadoras.
Las "sustituciones conservadoras" pueden realizarse, por ejemplo, basándose en la similitud en polaridad, carga, tamaño, solubilidad, hidrofobicidad, hidrofilicidad y/o la naturaleza anfipática de los residuos de aminoácidos implicados. Los 20 aminoácidos naturales pueden agruparse en los siguientes seis grupos de aminoácidos convencionales:
(1) hidrófobos: Met, Ala, Val, Leu, Ile;
(2) hidrófilos neutros: Cys, Ser, Thr; Asn, Gin;
(3) ácidos: Asp, Glu;
(4) básicos: His, Lys, Arg;
(5) residuos que influyen en la orientación de la cadena: Gly, Pro; y
(6) aromáticos: Trp, Tyr, Phe.
Tal como se utiliza en el presente documento, las "sustituciones conservadoras" se definen como intercambios de un aminoácido por otro aminoácido enumerado dentro del mismo grupo de los seis grupos de aminoácidos convencionales mostrados anteriormente. Por ejemplo, el intercambio de Asp por Glu conserva una carga negativa en el polipéptido así modificado. Además, la glicina y la prolina pueden sustituirse entre sí por su capacidad para interrumpir las a-hélices. Algunas sustituciones conservadoras preferidas dentro de los seis grupos anteriores son intercambios dentro de los siguientes subgrupos: (i) Ala, Val, Leu e Ile; (ii) Ser y Thr; (iii) Asn y Gin; (iv) Lys y Arg; y (v) Tyr y Phe.
Tal como se utiliza en el presente documento, las "sustituciones no conservativas" se definen como intercambios de un aminoácido por otro aminoácido incluido en un grupo diferente de los seis grupos de aminoácidos convencionales (1) a (6) mostrados anteriormente.
La enzima P450 modificada tiene un truncamiento N-terminal de 10 a 55 aminoácidos con respecto a la enzima de tipo salvaje. En general, el truncamiento es de los primeros 15 a 30 aminoácidos, y la longitud deseada puede determinarse basándose en la presente divulgación y utilizando herramientas de predicción conocidas en la técnica (por ejemplo, PHOBIUS, http://phobius.sbc.su.se/). Véase Lukas K.,et al.,ACombined Transmembrane Topology and Signal Peptide Prediction Method, Journal of Molecular Biology, 338(5):1027-1036 (2004); Lukas K.,et al.,An HMM posterior decoder for sequence feature prediction that includes homology information, Bioinformatics, 21 (supl. 1):i251-i257 (2005); Lukas K.,et al.,Advantages of combined transmembrane topology and signal peptide prediction--the Phobius web server, Nucleic Acids Res., 35:W429-432 (2007).
En diversas realizaciones, la enzima P450 modificada puede tener un truncamiento N-terminal de 10 a 55 aminoácidos, o de aproximadamente 15 a aproximadamente 45 aminoácidos, o de aproximadamente 15 a aproximadamente 40 aminoácidos, o de aproximadamente 15 a aproximadamente 35 aminoácidos con respecto a la enzima de tipo salvaje. En diversas realizaciones, la enzima P450 modificada puede tener un truncamiento N-terminal de aproximadamente 10, aproximadamente 11, aproximadamente 12, aproximadamente 13, aproximadamente 14, aproximadamente 15, aproximadamente 16, aproximadamente 17, aproximadamente 18, aproximadamente 19, aproximadamente 20, aproximadamente 21, aproximadamente 22, aproximadamente 23, aproximadamente 24, aproximadamente 25, aproximadamente 26, aproximadamente 27, aproximadamente 28, aproximadamente 29, aproximadamente 30, aproximadamente 31, aproximadamente 32, aproximadamente 33, aproximadamente 34, aproximadamente 35, aproximadamente 36, aproximadamente 37, aproximadamente 38, aproximadamente 39 o aproximadamente 40 aminoácidos con respecto a la enzima de tipo salvaje.
La región transmembrana de tipo salvaje se sustituye por una secuencia de anclaje a membrana derivada de una proteína deE. coli.La proteína deE. colies una proteína de la membrana interna con su extremo C-terminal en el citoplasma. El anclaje a membrana es un dominio transmembrana de paso único de uno de los siguientes genes: waaA (SEQ ID NO: 16), ypfN (SEQ ID NO: 17), yhcB (SEQ ID NO: 18), yhbM (SEQ ID NO: 19), yhhm (SEQ ID NO: 20), zipA (SEQ ID NO: 21), ycgG (SEQ ID NO: 22), djlA (SEQ ID NO: 23), sohB (SEQ ID NO: 24), lpxK (SEQ ID NO: 25), F11O (SEQ ID NO: 26), motA (SEQ ID NO: 27), htpx (SEQ ID NO: 28), pgaC (SEQ ID NO: 29), ygdD (SEQ IDnO:<30), hemr (SEQ ID NO: 31) e ycls (SEQ ID NO: 32). En una realización, el dominio transmembrana se deriva de>yhcB, yhhm, zipA, sohB y waaA. Las regiones transmembrana también pueden determinarse mediante herramientas de predicción conocidas en la técnica (incluido PHOBIUS).
En diversas realizaciones, la secuencia de anclaje a membrana tiene una longitud de aproximadamente 8 a aproximadamente 75 aminoácidos. Por ejemplo, el anclaje a membrana puede tener una longitud de entre aproximadamente 15 y aproximadamente 50 aminoácidos, o de entre aproximadamente 15 y aproximadamente 40 aminoácidos, o de entre aproximadamente 15 y aproximadamente 30 aminoácidos, o de entre aproximadamente 20 y aproximadamente 40 aminoácidos, o de entre aproximadamente 20 y aproximadamente 30 aminoácidos. En diversas realizaciones, el anclaje a membrana tiene una longitud de aproximadamente 8, aproximadamente 9, aproximadamente 10, aproximadamente 11, aproximadamente 12, aproximadamente 13, aproximadamente 14, aproximadamente 15, aproximadamente 16, aproximadamente 17, aproximadamente 18, aproximadamente 19, aproximadamente 20, aproximadamente 21, aproximadamente 22, aproximadamente 23, aproximadamente 24, aproximadamente 25, aproximadamente 26, aproximadamente 27, aproximadamente 28, aproximadamente 29, aproximadamente 30, aproximadamente 31, aproximadamente 32, aproximadamente 33, aproximadamente 34, aproximadamente 35, aproximadamente 36, aproximadamente 37, aproximadamente 38, aproximadamente 39, aproximadamente 40, aproximadamente 41, aproximadamente 42, aproximadamente 43, aproximadamente 44, aproximadamente 48, aproximadamente 49, aproximadamente 50, aproximadamente 51, aproximadamente 52, aproximadamente 53, aproximadamente 54, aproximadamente 55, aproximadamente 56, aproximadamente 57, aproximadamente 41, aproximadamente 42, aproximadamente 43, aproximadamente 44, aproximadamente 45, aproximadamente 46, aproximadamente 47, aproximadamente 48, aproximadamente 49, aproximadamente 50, aproximadamente 51, aproximadamente 52, aproximadamente 53, aproximadamente 54, aproximadamente 55, aproximadamente 56, aproximadamente 57, aproximadamente 58, aproximadamente 59, aproximadamente 60, aproximadamente 61, aproximadamente 62, aproximadamente 63, aproximadamente 64, aproximadamente 65, aproximadamente 66, aproximadamente 67, aproximadamente 68, aproximadamente 69, aproximadamente 70, aproximadamente 71, aproximadamente 72, aproximadamente 73, aproximadamente 74 o aproximadamente 75 aminoácidos.
En una realización, el dominio transmembrana es un dominio transmembrana yhcB o un derivado del mismo. Por ejemplo, el dominio transmembrana puede incluir los aminoácidos N-terminales 15 a 30 de yhcB, tales como los aminoácidos N-terminales 20 a 22 de yhcB. Por ejemplo, el dominio transmembrana puede incluir los 20, 21 o 22 aminoácidos N-terminales de yhcB. El dominio transmembrana puede tener una o más mutaciones de aminoácidos en relación con el dominio yhcB de tipo salvaje (SEQ ID NO: 18). En algunas realizaciones, el dominio transmembrana puede tener de aproximadamente 1 a aproximadamente 8, o de aproximadamente 1 a aproximadamente 7, o de aproximadamente 1 a aproximadamente 6, o de aproximadamente 1 a aproximadamente 5, o de 1 a aproximadamente 3 mutaciones en relación con la secuencia yhcB de tipo salvaje. Las mutaciones de uno o más aminoácidos pueden seleccionarse independientemente entre sustituciones, inserciones o deleciones. En algunas realizaciones, las mutaciones de aminoácidos son sustituciones de aminoácidos. En algunas realizaciones, las mutaciones se seleccionan en función de su puntuación predichas como región transmembrana, utilizando herramientas de predicción conocidas.
En una realización, el dominio transmembrana es un dominio transmembrana yhhM o un derivado del mismo. Por ejemplo, el dominio transmembrana puede incluir los aminoácidos N-terminales 15 a 30, o 19 a 21 de yhhM. Por ejemplo, el dominio transmembrana puede incluir los 19, 20 o 21 aminoácidos N-terminales de yhhM. El dominio transmembrana puede tener una o más mutaciones de aminoácidos en relación con el dominio yhhM de tipo salvaje (SEQ ID NO: 20). En algunas realizaciones, el dominio transmembrana puede tener de aproximadamente 1 a aproximadamente 8, o de aproximadamente 1 a aproximadamente 7, o de aproximadamente 1 a aproximadamente 6, o de aproximadamente 1 a aproximadamente 5, o de 1 a aproximadamente 3 mutaciones en relación con la secuencia yhhM de tipo salvaje. Las mutaciones de uno o más aminoácidos pueden seleccionarse independientemente entre sustituciones, inserciones o deleciones. En algunas realizaciones, las mutaciones de aminoácidos son sustituciones de aminoácidos. En algunas realizaciones, las mutaciones se seleccionan en función de su puntuación predichas como región transmembrana, utilizando herramientas de predicción conocidas.
En una realización, el dominio transmembrana es un dominio transmembrana zipA o un derivado del mismo. En esta realización, el dominio transmembrana puede incluir los aminoácidos N-terminales 15 a 30, o 24 a 26 de zipA. Por ejemplo, el dominio transmembrana puede incluir los 24, 25 o 26 aminoácidos N-terminales de zipA. El dominio transmembrana puede tener una o más mutaciones de aminoácidos en relación con el dominio zipA de tipo salvaje (SEQ ID NO: 21). En algunas realizaciones, el dominio transmembrana puede tener de aproximadamente 1 a aproximadamente 8, o de aproximadamente 1 a aproximadamente 7, o de aproximadamente 1 a aproximadamente 6, o de aproximadamente 1 a aproximadamente 5, o de 1 a aproximadamente 3 mutaciones en relación con la secuencia zipA de tipo salvaje. Las mutaciones de uno o más aminoácidos pueden seleccionarse independientemente entre sustituciones, inserciones o deleciones. En algunas realizaciones, las mutaciones de aminoácidos son sustituciones de aminoácidos. En algunas realizaciones, las mutaciones se seleccionan en función de su puntuación predichas como región transmembrana, utilizando herramientas de predicción conocidas.
En una realización, el dominio transmembrana es un dominio transmembrana ypfN o un derivado del mismo. En esta realización, el dominio transmembrana puede incluir los aminoácidos N-terminales 15 a 30, o 21 a 23 de ypfN. Por ejemplo, el dominio transmembrana puede incluir los 21, 22 o 23 aminoácidos N-terminales de ypfN. El dominio transmembrana puede tener una o más mutaciones de aminoácidos en relación con el dominio ypfN de tipo salvaje (SEQ ID NO: 17). En algunas realizaciones, el dominio transmembrana puede tener de aproximadamente 1 a aproximadamente 8, o de aproximadamente 1 a aproximadamente 7, o de aproximadamente 1 a aproximadamente 6, o de aproximadamente 1 a aproximadamente 5, o de 1 a aproximadamente 3 mutaciones en relación con la secuencia ypfN de tipo salvaje. Las mutaciones de uno o más aminoácidos pueden seleccionarse independientemente entre sustituciones, inserciones o deleciones. En algunas realizaciones, las mutaciones de aminoácidos son sustituciones de aminoácidos. En algunas realizaciones, las mutaciones se seleccionan en función de su puntuación predichas como región transmembrana, utilizando herramientas de predicción conocidas.
En una realización, el dominio transmembrana es un dominio transmembrana sohB o un derivado del mismo. En esta realización, el dominio transmembrana puede incluir los aminoácidos N-terminales 20 a 35, o 27 a 29 de sohB. Por ejemplo, el dominio transmembrana puede incluir los 27, 28 o 29 aminoácidos N-terminales de sohB. El dominio transmembrana puede tener una o más mutaciones de aminoácidos en relación con el dominio sohB de tipo salvaje (SEQ ID NO: 24). En algunas realizaciones, el dominio transmembrana puede tener de aproximadamente 1 a aproximadamente 8, o de aproximadamente 1 a aproximadamente 7, o de aproximadamente 1 a aproximadamente 6, o de aproximadamente 1 a aproximadamente 5, o de 1 a aproximadamente 3 mutaciones en relación con la secuencia sohB de tipo salvaje. Las mutaciones de uno o más aminoácidos pueden seleccionarse independientemente entre sustituciones, inserciones o deleciones. En algunas realizaciones, las mutaciones de aminoácidos son sustituciones de aminoácidos. En algunas realizaciones, las mutaciones se seleccionan en función de su puntuación predichas como región transmembrana, utilizando herramientas de predicción conocidas.
En una realización, el dominio transmembrana es un dominio transmembrana waaA o un derivado del mismo. En esta realización, el dominio transmembrana puede incluir los aminoácidos N-terminales 15 a 30, o 20 a 22 de waaA. Por ejemplo, el dominio transmembrana puede incluir los 20, 21 o 22 aminoácidos N-terminales de waaA. El dominio transmembrana puede tener una o más mutaciones de aminoácidos en relación con el dominio waaA de tipo salvaje (SEQ ID NO: 16). En algunas realizaciones, el dominio transmembrana puede tener de aproximadamente 1 a aproximadamente 8, o de aproximadamente 1 a aproximadamente 7, o de aproximadamente 1 a aproximadamente 6, o de aproximadamente 1 a aproximadamente 5, o de 1 a aproximadamente 3 mutaciones en relación con la secuencia waaA de tipo salvaje. Las mutaciones de uno o más aminoácidos pueden seleccionarse independientemente entre sustituciones, inserciones o deleciones. En algunas realizaciones, las mutaciones de aminoácidos son sustituciones de aminoácidos. En algunas realizaciones, las mutaciones se seleccionan en función de su puntuación predichas como región transmembrana, utilizando herramientas de predicción conocidas.
En otras realizaciones, el dominio transmembrana es un dominio transmembrana de yhbM (SEQ ID NO: 19), ycgG (SEQ ID NO: 22), djlA (SEQ ID NO: 23), lpxK (SEQ ID NO: 25), F11O (SEQ ID NO: 26), motA (SEQ ID NO: 27), htpx (SEQ ID NO: 28), pgaC (SEQ ID NO: 29), ygdD (SEQ ID NO: 30), hemr (SEQ ID NO: 31) o ycls (SEQ ID NO: 32), o un derivado del mismo. El derivado puede tener una o más mutaciones de aminoácidos en relación con la secuencia deE. colide tipo salvaje. En algunas realizaciones, el dominio transmembrana puede tener de aproximadamente 1 a aproximadamente 10, o de aproximadamente 1 a aproximadamente 8, o de aproximadamente 1 a aproximadamente 5, o de aproximadamente 1 a aproximadamente 3 mutaciones en relación con la secuencia de tipo salvaje deE. coli.En algunas realizaciones, dichas mutaciones de uno o más aminoácidos pueden seleccionarse independientemente entre sustituciones, inserciones y deleciones. En algunas realizaciones, las mutaciones de aminoácidos son sustituciones de aminoácidos. En algunas realizaciones, las mutaciones se seleccionan en función de su puntuación predichas como región transmembrana, utilizando herramientas de predicción conocidas.
También se divulgan polinucleótidos que comprenden una secuencia de nucleótidos que codifica una enzima P450 modificada descrita anteriormente. En algunas realizaciones, el polinucleótido puede tener codones optimizados para su expresión enE. coli.En otro ejemplo, el polinucleótido puede comprender una secuencia de nucleótidos que codifica al menos una enzima P450 modificada con una o más enzimas citocromo P450 reductasa (CPR) descritas en el presente documento como una fusión traduccional u operón. Dichos polinucleótidos pueden comprender, además de las secuencias que codifican la enzima P450 modificada, uno o más elementos de control de la expresión. Por ejemplo, el polinucleótido puede comprender uno o más promotores o potenciadores transcripcionales, sitios de unión a ribosomas, señales de terminación de la transcripción, como elementos de control de la expresión. El polinucleótido puede insertarse en cualquier vector adecuado, incluido un vector de expresión, que puede estar contenido en cualquier célula hospedadora adecuada para la expresión. El polinucleótido puede modificarse para su introducción y/o expresión de proteínas en cualquier célula hospedadora adecuada, incluidas células bacterianas, tales como células deE. coli.
También se divulgan células hospedadoras deE. colique expresan la enzima P450 modificada, ya sea integrada en el genoma o extracromosómicamente (por ejemplo, en un plásmido). En algunas realizaciones, la enzima P450 se expresa a partir de un promotor fuerte, tal como T7, T5, T3 o Trc, o un promotor que tenga una fuerza promotora enE. coliigual o superior a T7, T5, T3 o Trc. El promotor puede ser un promotor constitutivo fuerte deE. colio un promotor de colífagos o una variante de los mismos. Deuschleet al.,Promoters ofEscherichia coli:a hierarchy ofin vivostrength indicates alternate structures, EMBO J., 5(11): 2987-2994 (1986); http://parts.igem.org/Promoters/Catalog/Ecoli/Constitutive. Cuando se expresa a partir de un plásmido, éste puede ser un plásmido de bajo o alto número de copias (por ejemplo, p5, p10, p20). En otra realización, el gen de P450 se integra cromosómicamente en el genoma de la célula hospedadora deE. coli,que puede incluir además repeticiones en tándem del gen para aumentar el nivel de expresión. Véase el documento US 20110236927.
A las células deE. colise le puede suministrar el sustrato P450 deseado para su transformación química, o pueden expresarse vías bioquímicas en la célula hospedadora para generar el sustratoin vivo.
En algunas realizaciones, el hospedador bacteriano expresa una o más vías biosintéticas recombinantes. Por ejemplo, una célula hospedadora deE. colipuede expresar una o más vías biosintéticas recombinantes que incluyan al menos 1, al menos 2, al menos 3, al menos 4 o al menos 5 enzimas recombinantes. Las vías biosintéticas pueden producir un metabolito secundario mediante la sobreexpresión de al menos 1, al menos 2, al menos 3, al menos 4 o al menos 5 genes extraños. En estas u otras realizaciones, la célula hospedadora deE. colipuede sobreexpresar al menos 1, al menos 2, al menos 3, al menos 4 o al menos 5 genesde E. coli.La sobreexpresión de varios genesde E. coliy/o genes extraños puede producir importantes respuestas de estrés celular. Cuando estas vías incluyen una o más enzimas P450, estas respuestas al estrés pueden ser sustancialmente mayores. Por ejemplo, tal como se muestra en el presente documento, las enzimas P450 pueden inducir una sobreexpresión sustancial de la proteína IbpA, una proteína que se sobreexpresa en condiciones de agregación de proteínas y estrés celular. Por ejemplo, la sobreexpresión de genes nativosde E. co li, así como de genes extraños, puede dar lugar a condiciones de agregación de proteínas que induzcan una respuesta de estrés celular (por ejemplo, tal como se observa con la sobreexpresión de IbpA).
En diversas realizaciones, la invención da como resultado un estrés celular reducido de tal manera que la célula de E.colino muestra un fenotipo sustancialmente estresado durante el cultivo, o el estrés celular se minimiza. El estrés celular puede evaluarse midiendo la expresión de diversas proteínas de estrés celular, incluidas, entre otras, IbpA, DnaK, GrpE y GroL. En algunas realizaciones, los procedimientos de la invención no dan lugar a la sobreexpresión de la proteína de estrés celular IbpA. En este contexto, la sobreexpresión se refiere al menos a dos veces el nivel de expresión de IbpA de la cepa de origen. En algunas realizaciones, la modificación de la enzima P450 de la invención puede guiarse ensayando la expresión de IbpA en cultivos. Por ejemplo, la determinación de la longitud del truncamiento de la enzima P450 y/o el tamaño y/o la secuencia del anclaje puede guiarse por los niveles de expresión de IbpA en el cultivo.
En algunas realizaciones, al menos un gen extraño se expresa a partir de un promotor fuerte, tal como T7, T5, T3, o Trc, o un promotor que tiene una fuerza promotora enE. coliigual o superior a T7, T5, T3, o Trc. El promotor puede ser un promotor constitutivo fuerte deE. colio un promotor de colífagos o una variante de los mismos. Deuschleet al.,Promoters ofEscherichia coli: a hierarchy of in vivo strength indicates alternate structures, EMBO J., 5(11): 2987-2994 (1986); http://parts.igem.org/Promoters/Catalog/Ecoli/Constitutive. En una realización, los genes se expresan a partir de un plásmido, que puede ser un plásmido de bajo o alto número de copias (por ejemplo, p5, p10, p20). En otra realización, los genes se integran cromosómicamente en el genoma de la célula hospedadora deE. coli,que puede incluir además repeticiones en tándem del gen para aumentar el nivel de expresión. Véase el documento US 20110236927.
En algunas realizaciones, la célula deE. coliproduce un compuesto a partir de pirofosfato de isopentilo ("isopentyl pyrophosphate", IPP) y/o pirofosfato de dimetilalilo ("dimethylallyl pyrophosphate", DMAPP), tal como un terpeno o un compuesto terpenoide. En una realización ilustrativa, la célula deE. colipuede sobreexpresar al menos un gen de la vía MEP, que es endógena aE. coli.La vía MEP (2-C-metil-D-eritritol 4-fosfato), también denominada vía MEP/DOXP (2-C-metil-D-eritritol 4-fosfato/l-desoxi-D-xilulosa 5-fosfato) o vía del no mevalonato o vía independiente del ácido mevalónico se refiere a la vía que convierte el gliceraldehído-3-fosfato y el piruvato en IPP y DMAPP. En la vía MEP, el piruvato y el D-gliceraldehído-3-fosfato se convierten mediante una serie de reacciones en IPP y DMAPP La vía suele implicar la acción de las siguientes enzimas: 1-desoxi-D-xilulosa-5-fosfato sintasa (Dxs), 1-desoxi-D-xilulosa-5-fosfato reductoisomerasa (IspC), 4-difosfocitidil-2-C-metil-D-eritritol sintasa (IspD), 4-difosfocitidil-2-C-metil-D-eritritol cinasa (IspE), 2C-metil-D-eritritol 2,4-ciclodifosfato sintasa (IspF), 1-hidroxi-2-metil-2-(E)-butenil 4-difosfato sintasa (IspG) e isopentenil difosfato isomerasa (IspH). La vía MEP y los genes y enzimas que la componen se describen en el documento US 8512988. Por ejemplo, los genes que componen la vía MEP incluyen dxs, ispC, ispD, ispE, ispF, ispG, ispH, idi, ispA e ispB. En algunas realizaciones, se producen uno o más compuestos terpenoides al menos en parte por flujo metabólico a través de una vía MEP En una realización, la célula hospedadora deE. colipuede expresar al menos una copia adicional de un gen dxs y/o idi. En algunas realizaciones, el hospedador deE. coliexpresa al menos una copia adicional del gen dxs, ispD, ispF y/o idi, con el fin de sobreexpresar estos productos génicos.
En diversas realizaciones, la célula deE. coliexpresa una o más vías biosintéticas que incluyen al menos una enzima P450 modificada anclada a la membrana como se describe en el presente documento. En algunas realizaciones, la enzima P450 no se expresa fuertemente, pero el anclaje a la membrana más eficiente de acuerdo con la invención permite una actividad suficiente sin una expresión más fuerte. En diversas realizaciones, la célula deE. coliexpresa al menos 1, al menos 2, al menos 3, al menos 4, o al menos 5 enzimas P450, que pueden actuar en serie en una vía biosintética.
En algunas realizaciones, la enzima P450 se expresa a partir de un promotor fuerte (por ejemplo, constitutivo o inducible) deE. colio de colífago, o una variante del mismo (por ejemplo, Trc, T7, T5 o T3, o una variante del mismo). Mientras que la sobreexpresión de enzimas P450 puede inducir un estrés celular significativo, el sistema de anclaje a membrana de acuerdo con la invención hace que la asociación P450-membrana sea más productiva, con menos plegamiento incorrecto y/o agregación de proteínas, que de otro modo induciría estrés celular.
En diversas realizaciones, la célula hospedadora deE. coliexpresa la enzima P450 modificada junto con uno o más compañeros de citocromo P450 reductasa (CPR) que regeneran la enzima P450. Tal como se utiliza en el presente documento, la expresión "compañero de citocromo P450 reductasa" o "compañero de CPR" se refiere a una citocromo P450 reductasa capaz de regenerar el componente de cofactor de la citocromo P450 oxidasa de interés para la química oxidativa. La CPR puede ser un compañero natural de CPR para la enzima P450, y en otras realizaciones, el compañero de CPR no es el compañero natural de CPR para la enzima P450. En la naturaleza, la citocromo P450 reductasa es una proteína de membrana que se encuentra generalmente en el retículo endoplásmico. Cataliza la deshidratación de nucleótidos de piridina y la transferencia de electrones al citocromo P450 unido a la membrana. Las CPR pueden derivarse de cualquier especie que emplee de forma natural la bioquímica de P450, incluidas:Zingiber sp., Barnadesia sp., Hyoscyamus sp., Latuca sp., Nicotiana sp., Citrus sp., Artemisia sp., Arabidopsis sp., Stevia sp., Bacillus sp., Pleurotus sp., Cichorium sp., Helianthus sp.yPhyscomitrella sp., Taxus sp., Rosa sp., Cymbopogon sp., Humulus sp., Pogostemon sp.yCannabis sp.Algunos ejemplos de CPR son las deStevia rebaudiana(por<ejemplo, SEQ ID NO: 33, 40, 41 y 42), Arabidopsis thaliana (SEQ ID NO: 34, 37, 38 y 39), Taxus cuspidata>(SeQ<ID>NO: 35),Artemisia annua(SEQ ID NO:36) yPelargonium graveolans(SEQ ID NO: 43). En diversas realizaciones, la CPR de tipo salvaje o un derivado de la misma se expresa por separado de las enzimas P450 (por ejemplo, a partir del mismo operón o de uno diferente) o, en algunas realizaciones, como una fusión traduccional con la enzima P450. En general, los derivados de la CPR comprenden secuencias de aminoácidos que tienen al menos un 70 %, al menos un 80 %, al menos un 90 % o al menos un 95 % de identidad con la secuencia de tipo salvaje (por ejemplo, SEQ ID NO: 33-43), y pueden emplearse en las diversas realizaciones.
En una realización, la CPR puede expresarse como una proteína de fusión traduccional con una enzima P450 modificada. La CPR puede fusionarse a la enzima P450 mediante un conector. Algunos ejemplos de secuencias conectoras pueden ser predominantemente serina, glicina y/o alanina, y pueden tener de tres a cien aminoácidos en diversas realizaciones. Las secuencias conectoras incluyen, por ejemplo, GSG, GSGGGGS (SEQ ID NO: 44), GSGEAAAK (SEQ ID NO: 45), GSGEAAAKEAAAK (SEQ ID NO: 46) y GSGMGSSSN (SEQ ID NO: 47).
En algunas realizaciones, la invención permite un mejor control de la eficiencia de la enzima P450, al permitir proporciones de expresión eficientes de las enzimas P450 en relación con el compañero de CPR (cuando se expresan por separado). En algunas realizaciones, la proporción entre los niveles de expresión de la enzima o enzimas P450 y los compañeros de CPR puede oscilar entre aproximadamente 5:1 y aproximadamente 1:5, por ejemplo, aproximadamente 5:1, aproximadamente 4:1, aproximadamente 3:1, aproximadamente 2:1, aproximadamente 1:1, aproximadamente 1:2, aproximadamente 1:3, aproximadamente 1:4 o aproximadamente 1:5. Por ejemplo, la proporción entre los niveles de expresión de la enzima o enzimas P450 y el compañero de CPR puede ser de aproximadamente 2:1 a aproximadamente 1:2. En diversas realizaciones, la CPR también puede modificarse para incluir al menos una secuencia de anclaje a membrana derivada de una proteína deE. colicomo se describe en el presente documento. En una realización, la célula de E.coliexpresa una única proteína CPR, y opcionalmente expresa más de una enzima P450.
En diversas realizaciones, la célula hospedadora deE. coliexpresa una vía biosintética que produce un metabolito secundario seleccionado entre un terpenoide, alcaloide, cannabinoide, esteroide, saponina, glucósido, estilbenoide, polifenol, antibiótico, policétido, ácido graso o péptido no ribosómico. En ciertas realizaciones, la célula deE. coliproduce uno o más compuestos terpenoides. Un terpenoide, también denominado isoprenoide, es una sustancia química orgánica derivada de una unidad de isopreno de cinco carbonos (C5). Varios ejemplos no limitativos de terpenoides, clasificados en función del número de unidades de isopreno que contienen, incluyen: hemiterpenoides (1 unidad de isopreno), monoterpenoides (2 unidades de isopreno), sesquiterpenoides (3 unidades de isopreno), diterpenoides (4 unidades de isopreno), sesterpenoides (5 unidades de isopreno), triterpenoides (6 unidades de isopreno), tetraterpenoides (8 unidades de isopreno) y politerpenoides con un número mayor de unidades de isopreno. En una realización, la célula hospedadora deE. coliproduce un terpenoide seleccionado entre un monoterpenoide, un sesquiterpenoide, un diterpenoide, un sesterpenoide o un triterpenoide. Los terpenoides representan una clase diversa de moléculas que tienen numerosas aplicaciones comerciales, incluidas en las industrias alimentaria y de bebidas, así como en las industrias de perfumería, cosmética y sanitaria. A modo de ejemplo, los compuestos terpenoides se utilizan en perfumería (por ejemplo, el pachulí), en la industria de los aromas (por ejemplo, la nootkatona), como edulcorantes (por ejemplo, el esteviol) o como agentes terapéuticos (por ejemplo, el taxol) y muchos se extraen habitualmente de plantas. Sin embargo, las moléculas de terpenoides se encuentran en niveles de ppm en la naturaleza, por lo que requieren una recolección masiva para obtener cantidades suficientes para aplicaciones comerciales.
Cuando la especie química es un terpenoide, la célula hospedadora contendrá generalmente una vía en sentido descendente recombinante que produce el terpenoide a partir de precursores de IPP y DMAPP. Los terpenos, tales como los monoterpenos (C10), los sesquiterpenos (C15) y los diterpenos (C20), se obtienen a partir de sustratos de difosfato de prenilo, difosfato de geranilo (GPP), difosfato de farnesilo (FPP) y difosfato de geranilgeranilo (GGPP), respectivamente, mediante la acción de un grupo muy amplio de enzimas denominadas terpeno (terpenoide) sintasas. Estas enzimas suelen denominarse terpeno ciclasas, ya que el producto de las reacciones se cicla en diversos productos con un esqueleto de carbono de monoterpeno, sesquiterpeno y diterpeno. Muchos de los esqueletos de carbono resultantes sufren una oxigenación posterior por parte de las enzimas citocromo P450 hidrolisasas para dar lugar a grandes familias de derivados. En diversas realizaciones, la célula deE. coliexpresa una vía biosintética que implica la sobreexpresión de una geranil difosfato sintasa (GPS), una gernanilgeranil difosfato sintasa (GGPS), una farnsesil difosfato sintasa (FPS) o una farnesil geranil difosfato sintasa (FGPPS).
El producto de la invención en algunas realizaciones es uno o más terpenoides oxigenados. Tal como se utiliza en el presente documento, la expresión "terpenoide oxigenado" se refiere a un andamiaje de terpeno que sufre uno o más acontecimientos de oxigenación, produciendo un alcohol, aldehído, ácido carboxílico y/o cetona correspondientes. En algunas realizaciones, la célula deE. coliproduce al menos un terpenoide seleccionado entre alfa-sinensal, betatujona, alcanfor, carveol, carvona, cineol, citral, citronelal, cubebol, geraniol, limoneno, mentol, mentona, mirceno, nootkatona, nootkatol, pachulí, piperitona, 'sabineno, esteviol, glucósido de esteviol, taxadieno, timol y valenceno, ya sea como producto de P450 oxigenado o como sustrato para la química de P450.
En otra realización, la célula deE. coliproduce valenceno y/o nootkatona. En una realización de este tipo, la célula deE. colipuede expresar una vía biosintética que incluya además una farnesil pirofosfato sintasa, una valenceno sintasa y una valenceno oxidasa (la VO que comprende el anclaje a membrana descrito en el presente documento). Las farnesil pirofosfato sintasas (FPPS) producen pirofosfatos de farnesilo a partir de pirofosfato de isopentilo (IPP) y pirofosfato de dimetilalilo (DMAPP). Un ejemplo de farnesil pirofosfato sintasa es la ERG20 deSaccharomyces cerevisiae(n.° de registro NCBI P08524) y la ispA de E.coli.La valenceno sintasa produce andamiajes sesquiterpénicos y se describen, por ejemplo, en los documentos US 2012/0107893, US 2012/0246767 y US 7 273735.
En una realización, la célula deE. coliproduce esteviol o glucósido de esteviol (por ejemplo, RebM). El esteviol se produce a partir del kaureno por la acción de dos enzimas P450, la kaureno oxidasa (KO) y la ácido kaurenoico hidroxilasa (KAH). Tras la producción de esteviol, pueden producirse diversos productos glucósidos de esteviol mediante una serie de reacciones de glicosilación, que pueden tener lugarin vitrooin vivo.Las vías y las enzimas para la producción de esteviol y glucósidos de esteviol se divulgan en los documentos US 2013/0171328, US 2012/0107893, WO 2012/075030, WO 2014/122328.
En diversas realizaciones, la célula deE. colipuede expresar una vía biosintética que implica una geranilgeranil pirofosfato sintasa (GPPS), una copalil difosfato sintasa (CPPS) y una kaureno sintasa (KS), así como una kaureno oxidasa (KO) y una ácido kaureneoico hidroxilasa (KAH) que tiene un dominio transmembrana de paso único derivado de un gen deE. coli.En algunas realizaciones, la vía biosintética puede incluir además una o más enzimas glicosiltransferasas dependientes de difosfato de uridina (UGT).
Otras vías biosintéticas para la producción de compuestos terpenoides se divulgan en el documento US 8927241.
En diversas realizaciones, la célula deE. colise cultiva para producir una o más especies químicas. Por ejemplo, la célula deE. colipuede cultivarse para producir uno o más compuestos terpenoides.
Mientras que la biosíntesis comercial enE. colipuede estar limitada por la temperatura a la que las enzimas sobreexpresadas y/o extrañas son estables, las mejoras sustanciales en la estabilidad de las enzimas P450 descritas en el presente documento pueden permitir que los cultivos se mantengan a temperaturas más altas, lo que resulta en mayores rendimientos y una mayor productividad global. En algunas realizaciones, el cultivo se lleva a cabo a aproximadamente 30 °C o más, aproximadamente 31 °C o más, aproximadamente 32 °C o más, aproximadamente 33 °C o más, aproximadamente 34 °C o más, aproximadamente 35 °C o más, aproximadamente 36 °C o más, o aproximadamente 37 °C o más.
Las células hospedadoras son además adecuadas para la producción comercial de especies químicas, por lo que pueden ser productivas a escala comercial. En algunas realizaciones, el tamaño del cultivo es de al menos aproximadamente 100 l, al menos aproximadamente 200 l, al menos aproximadamente 500 l, al menos aproximadamente 1000 l o al menos aproximadamente 10000 l. En una realización, el cultivo puede llevarse a cabo en cultivo discontinuo, cultivo continuo o cultivo semicontinuo.
En diversas realizaciones, los procedimientos de la invención incluyen además la recuperación de una o más especies químicas, tales como uno o más compuestos terpenoides, del cultivo celular o de lisados celulares. En algunas realizaciones, el cultivo produce al menos aproximadamente 20 mg/l, al menos aproximadamente 25 mg/l, al menos aproximadamente 30 mg/l, al menos aproximadamente 35 mg/l, al menos aproximadamente 40 mg/l, al menos aproximadamente 45 mg/l, al menos aproximadamente 50 mg/l, al menos aproximadamente 55 mg/l, al menos aproximadamente 60 mg/l, al menos aproximadamente 65 mg/l, al menos aproximadamente 70 mg/l, al menos aproximadamente 75 mg/l, al menos aproximadamente 80 mg/l, al menos aproximadamente 85 mg/l, al menos aproximadamente 90 mg/l, al menos aproximadamente 95 mg/l, al menos aproximadamente 100 mg/l, al menos aproximadamente 150 mg/l o al menos aproximadamente 200 mg/l de la especie química.
En algunas realizaciones que implican la producción de un compuesto terpenoide, la producción de indol se utiliza como marcador sustituto de la producción de terpenoides y/o la acumulación de indol en el cultivo se controla para aumentar la producción de terpenoides. Por ejemplo, en diversas realizaciones, la acumulación de indol en el cultivo se controla por que esté por debajo de aproximadamente 100 mg/l, por debajo de aproximadamente 75 mg/l, por debajo de aproximadamente 50 mg/l, por debajo de aproximadamente 25 mg/l o por debajo de aproximadamente 10 mg/l. La acumulación de indol puede controlarse equilibrando la expresión y la actividad de la proteína utilizando el enfoque modular multivariante descrito en el documento US 8927241 y/o se controla por medios químicos.
El producto oxidado puede recuperarse mediante cualquier proceso adecuado, incluido el reparto del producto deseado en una fase orgánica. La producción del producto deseado puede determinarse y/o cuantificarse, por ejemplo, mediante cromatografía de gases (por ejemplo, GC-MS). El producto deseado puede producirse en sistemas de biorreactores discontinuos o continuos. La producción del producto, la recuperación y/o el análisis del producto pueden realizarse como se describe en el documento US 2012/0246767. Por ejemplo, en algunas realizaciones, en especial en relación con los terpenoides, el aceite oxidado se extrae del medio de reacción acuoso utilizando un disolvente orgánico, tal como un alcano como el heptano, seguido de una destilación fraccionada. Los componentes terpenoides de las fracciones pueden medirse cuantitativamente por GC/MS, seguido de la mezcla de las fracciones para generar un perfil de producto deseado.
En diversas realizaciones, las especies químicas recuperadas, tales como uno o más compuestos terpenoides, se incorporan a un producto (por ejemplo, un producto de consumo o industrial). Por ejemplo, el producto puede ser un aromatizante, una fragancia, un edulcorante, un cosmético, un producto de limpieza, un detergente o jabón, o un producto para el control de plagas. En algunas realizaciones, el producto oxigenado recuperado es nootkatol y/o nootkatona, y el producto es un aromatizante seleccionado entre una bebida, un chicle, un caramelo o un aditivo aromatizante, o el producto es un repelente de insectos. En algunas realizaciones, el producto oxigenado es esteviol o un glucósido de esteviol, que se suministra como edulcorante o se incorpora a bebidas o productos alimentarios.
La invención proporciona además procedimientos para fabricar productos tales como alimentos, bebidas, texturizantes (por ejemplo, almidones, fibras, gomas, grasas y miméticos de grasas, y emulsionantes), productos farmacéuticos, productos de tabaco, productos nutracéuticos, productos de higiene bucal y productos cosméticos, mediante la incorporación de las especies químicas producidas en el presente documento. Los mayores rendimientos de dichas especies producidas en las realizaciones de la invención pueden proporcionar importantes ventajas económicas, así como de sostenibilidad.
Ejemplos
Ejemplo 1: Identificación de genes candidatos deE. colicon secuencias de anclaje a membrana
La figura 1 ilustra el concepto de anclaje a membrana N-terminal. En una etapa previa, las enzimas P450 se expresaron enE. colimediante el truncamiento de al menos una parte de la región transmembrana N-terminal de la P450, con la adición de un péptido de 8 aminoácidos (MALLLAVF) derivado de la P45017a bovina. Véase, por ejemplo, Barnes H.J.,et al.,Expression and enzymatic activity of recombinant cytochrome P450 17a-hydroxylase inEscherichia coli,PNAS, 88: 5597-5601 (1991); Ajikumar PK.,et al.,Isoprenoid pathway optimization for taxol precursor overproduction inEscherichia coli,Science, 330(6000): 70-74 (2010). Sin embargo, la actividad de estas construcciones de P450 enE. coliera en general limitante, lo que hace que los hospedadores preferidos para las transformaciones oxidativas en las que intervienen enzimas P450 sean los eucariotas. En parte, la falta de productividad de la P450 enE. colipodría deberse a una respuesta de estrés celular desencadenada por el anclaje a la membrana no nativo. Mediante la modificación de las proteínas de P450 para que contengan un anclaje N-terminal derivado de una proteína deE. colique esté anclada de forma nativa en la membrana interna por su N-terminal (ya sea por hélices transmembrana de paso único o de paso múltiple), esta respuesta de estrés celular podría minimizarse y podrían identificarse otros beneficios para la expresión funcional de las enzimas P450.
Se llevó a cabo un análisis proteómico para identificar candidatos a secuencias de anclaje deE. colipara la expresión funcional enE. coli.En concreto, se utilizó el programa EcoGene 3.0 para identificar las proteínas de la membrana interna deE. colique incluyen un C-terminal en el citoplasma. Se utilizó la herramienta de predicción Phobius para evaluar los genes candidatos deE. colien busca de la presencia de péptidos señal y/o regiones transmembrana. El análisis identificó 395 genes que se determinó por medios experimentales que eran proteínas de la membrana interna. Además, se identificaron 85 genes predichos de la membrana interna. La predicción de hélices transmembrana o péptidos señal se ilustra en la figura 2 para tres enzimas P450 ancladas a membrana conocidas. Se predijo que la kaureno oxidasa deStevia rebaudiana(SrKO) y la ácido kaurenoico 13-hidroxilasa deArabidopsis thaliana(AtKAH) incluían dominios transmembrana. Se predijo que la enzima bovina P450-C17 tenía un péptido señal N-terminal, 8rp.
Ejemplo 2: Construcción y análisis funcional de enzimas valenceno oxidasa (VO) modificadas
Se construyeron diversos anclajes N-terminales basados en regiones transmembrana de paso único deE. coliy se incorporaron a la valenceno oxidasa (VO) truncada en el residuo 30. La valenceno oxidasa se deriva de la kaureno oxidasa deStevia rebaudiana(SrKO), que ha demostrado ser funcional para la transformación oxidativa del valenceno en nootkatona y nootkatol, que son compuestos sesquiterpénicos. Las construcciones se clonaron en el plásmido p5Trc-tc-CPR, que incluye una citocromo P450 reductasa (CPR) acoplada traduccionalmente. Como control, el péptido señal de la 8rp también se incorporó a la VO truncada en el residuo 20 o en el residuo 30 (8rp-t20 o 8rp-t30).
Las enzimas VO modificadas con candidatos a secuencias de anclaje deE. colise expresaron en células hospedadoras deE. colique producen valenceno a través de una vía de síntesis de valenceno recombinante. Las células se incubaron a 30 °C durante 48 horas en placas de 96 pocillos dispensadores con una capa superior de dodecano. Tal como se muestra en la figura 3, muchas de las enzimas ancladas aE. colisuperaron a las construcciones 8rp-t20 y 8rp-t30 tanto en el flujo total de terpenoides como en la formación de productos oxigenados.
Se evaluaron las principales construcciones de VO con secuencias de anclaje deE. coli.Las construcciones se expresaron en células hospedadoras deE. colique se incubaron a 30 °C durante 48 horas en placas de 24 pocillos dispensadores con una capa de aceite vegetal. En consonancia con los resultados anteriores, las enzimas ancladas a E.colisuperaron a las construcciones 8rp-t20 y 8rp-t30 tanto en el flujo total de terpenoides como en la formación de productos oxigenados (figura 4).
Se evaluaron los efectos del aumento de la expresión de las construcciones de P450 modificada en células deE. coli.En concreto, las construcciones de VO con las principales secuencias de anclaje deE. colise clonaron en un plásmido p10 y se expresaron en células deE. coliproductoras de valenceno, que se incubaron a 30 °C durante 48 horas en placas de 24 pocillos dispensadores con una capa de aceite vegetal. Tal como se muestra en la figura 5, la sobreexpresión de enzimas P450 ancladas a 8rp (a partir del plásmido p10) dio lugar a una actividad reducida que incluía una pérdida tres veces mayor en la formación de terpenoides oxigenados en comparación con una enzima expresada de forma más débil (a partir de un plásmido p5). En cambio, las enzimas P450 con anclajes deE. coli(en concreto yhcB y ZipA) sólo mostraron una modesta pérdida de producto oxigenado cuando se expresaron a partir de un plásmido p10. Además, las enzimas P450 con anclajes deE. coliexpresadas a partir de un plásmido p10 produjeron tanto producto como la enzima anclada a 8rp expresada a partir de un plásmido p5. En consecuencia, las enzimas P450 ancladas aE. colipermitieron una elevada expresión funcional en células deE. coli.
También se evaluó la expresión funcional con el compañero de CPR (deStevia).En concreto, la enzima CPR se expresó en células deE. colicon las enzimas P450 en el mismo operón o acopladas traduccionalmente a partir de un plásmido. Las células se incubaron a 30 °C durante 48 horas en placas de 24 pocillos dispensadores con una capa de aceite vegetal. Se observó que los anclajes a membrana basados en secuencias nativasde E. coli(por ejemplo, yhcB) proporcionaban una mayor valoración oxigenada cuando se acoplaban traduccionalmente a un compañero de CPR o cuando se expresaban por separado (figura 6). Además, las células con los anclajes deE. colicrecieron hasta una DO final más alta y con menos emulsión, lo que sugiere que las células están menos estresadas, a pesar de sobreexpresar una vía de MEP en sentido ascendente y una vía de biosíntesis de terpenoides en sentido descendente (nootkatona).
Durante el inicio de la traducción, las secuencias N-terminales pueden afectar significativamente a la expresión de una proteína. Por ello, se realizó una comparación para examinar la expresión de VO y la proporción VO/CPR con diferentes regiones de anclaje N-terminales. Tal como se muestra en la figura 7, los cuatro anclajes ensayados (yhcB, yhhm, zipA e ypfN) mostraron una menor expresión total de VO en comparación con el anclaje 8rp de control, lo que permite una expresión cinco veces menor en relación con la expresión de CPR. Esta proporción es importante para una transferencia eficaz de los electrones de P450 sin efectos nocivos sobre la eficacia del acoplamiento.
Se emprendió un enfoque proteómico para evaluar la respuesta de estrés celular a la expresión variable de P450. Por ejemplo, IbpA, que se sobreexpresa enE. colien condiciones de alta agregación de proteínas y estrés, se expresa fuertemente con la enzima P450 anclada a 8rp, pero no con las enzimas con anclaje de E.coli(figura 8).
La enzima VO anclada a yhcB se analizó más a fondo para determinar el impacto del anclaje y la longitud del truncamiento de P450 en la productividad general (figura 9). Se generaron variantes con truncamientos en las secuencias de anclaje y P450 utilizando la tecnología GeneArt y se subclonaron en un plásmido de selección p5T7-BCD18. En la tabla 2 figura una lista de las variantes.
Tabla 2
Se ensayó la formación de producto de las variantes en una cepa deE. coliintegrada con MEP/FPPS/VS. Las células deE. colise incubaron a 30 °C durante 48 horas en placas de 96 pocillos dispensadores con una capa superior de dodecano. Posteriormente, los productos se extrajeron con acetato de etilo. Tal como se muestra en la figura 10, la modificación de las longitudes de anclaje y de truncamiento de P450 sólo tiene un impacto modesto en la productividad global. Por ejemplo, la construcción n20yhcB-t29VO1 produjo un aumento de aproximadamente 1,2 veces en el flujo total de terpenoides y productos oxigenados. Estos resultados sugieren que las enzimas P450 ancladas aE. colison relativamente robustas a los cambios en la longitud de anclaje y de truncamiento.
Ejemplo 3: Construcción y análisis funcional de otras enzimas P450 modificadas
Se generaron enzimas modificadas de ácido kaurenoico 13-hidroxilasa deArabidopsis thaliana(AtKAH) y kaureno oxidasa deStevia rebaudiana(SrKO) con secuencias de anclaje deE. coli.

Claims (21)

REIVINDICACIONES
1. Un procedimiento para la biosíntesis de una o más especies químicas enE. coli,que comprende:
expresar una o más vías biosintéticas enE. coli,comprendiendo dichas una o más vías biosintéticas al menos una enzima P450 anclada a membrana, en el que la enzima P450 es una enzima P450 derivada de una planta que tiene un truncamiento N-terminal de 10 a 55 aminoácidos con respecto a la enzima de tipo salvaje, y comprende un dominio transmembrana que se deriva de un gen de proteína C-terminal citoplásmica de la membrana interna deE. coliseleccionado de waaA (SEQ ID NO:16), ypfN (SEQ ID NO:17), yhcB (SEQ ID NO:18), yhhm (SEQ ID NO:20), zipA (SEQ ID NO:21), ycgG (SEQ ID NO:22), djlA (SEQ ID NO: 23), sohB (SEQ ID NO:24), IpxK (SEQ ID NO:25), F11O (SEQ ID NO: 26), motA (SEQ ID NO: 27), htpx (SEQ ID NO: 28), hemr (SEQ ID NO: 31) e ycls (SEQ ID NO: 32), y
cultivar las células deE. colipara producir una o más especies químicas a partir de la vía o vías biosintéticas.
2. El procedimiento de la reivindicación 1, en el que las células deE. colino muestran un fenotipo sustancialmente estresado durante el cultivo.
3. El procedimiento de la reivindicación 1 o 2, en el que las células deE. coliexpresan al menos dos enzimas recombinantes de la vía o vías biosintéticas.
4. El procedimiento de una cualquiera de las reivindicaciones 1 a 3, en el que las células deE. colisobreexpresan al menos un gen de la vía de 2-C-metil-D-eritritol 4-fosfato (MEP).
5. El procedimiento de una cualquiera de las reivindicaciones 1 a 4, en el que al menos una enzima P450 que comprende un dominio transmembrana derivado de una proteína C-terminal citoplásmica de la membrana interna deE. colino se expresa fuertemente.
6. El procedimiento de una cualquiera de las reivindicaciones 1 a 5, en el que las células deE. coliexpresan al menos dos enzimas P450 que comprenden un dominio transmembrana derivado de una proteína C-terminal citoplásmica de la membrana interna deE. coli.
7. El procedimiento de una cualquiera de las reivindicaciones 1 a 6, en el que las células deE. coliexpresan una enzima P450 que comprende un dominio transmembrana derivado de una proteína C-terminal citoplásmica de la membrana interna deE. colien el que dicha enzima P450 se selecciona entre CiVO (SEQ ID NO:59),HmPO(SEQ ID NO:50), LsGAO (SEQ ID NO:51), BsGAO (SEQ ID NO:49), NtEAO (SEQ ID NO:52), SrKO (SEQ ID NO:56), PpKO (SEQ ID NO:57), ZzHO (SEQ ID NO:48), CpVO (SEQ ID NO:53),AtKO(SEQ ID NO:55),AaAO(SEQ ID NO:54), PsVO (SEQ ID NO:58) y HaGAO (SEQ ID NO:60), o derivados de las mismas que tengan al menos un 60 % de identidad con ellas.
8. El procedimiento de una cualquiera de las reivindicaciones 1 a 7, en el que la vía biosintética produce un metabolito secundario seleccionado de un terpenoide, alcaloide, cannabinoide, esteroide, saponina, glucósido, estilbenoide, polifenol, antibiótico, policétido, ácido graso o péptido no ribosómico, preferentemente, en el que la vía biosintética produce un terpenoide seleccionado de un monoterpenoide, un sesquiterpenoide, un diterpenoide, un sesterpenoide, o un triterpenoide, o preferiblemente, en el que la vía biosintética produce al menos un terpenoide seleccionado de alfa-sinensal, beta-tujona, alcanfor, carveol, carvona, cineol, citral, citronelal, cubebol, geraniol, limoneno, mentol, mentona, mirceno, nootkatona, nootkatol, pachulí, piperitona, sabineno, esteviol, glucósido de esteviol, taxadieno, timol y valenceno.
9. El procedimiento de una cualquiera de las reivindicaciones 1 a 8, en el que la vía biosintética comprende además la sobreexpresión de una geranil difosfato sintasa (GPS), una gernanilgeranil difosfato sintasa (GGPS), una farnsesil difosfato sintasa (FPS) o una farnesil geranil difosfato sintasa (FGPPS).
10. El procedimiento de una cualquiera de las reivindicaciones 1 a 9, en el que la vía biosintética comprende una geranilgeranil pirofosfato sintasa (GPPS), una copalil difosfato sintasa (CPPS) y una kaureno sintasa (KS), así como una kaureno oxidasa (KO) y una ácido kaureneoico hidroxilasa (KAH) que tienen el dominio transmembrana derivado de una proteína C-terminal citoplásmica de la membrana interna deE. coli.
11. El procedimiento de una cualquiera de las reivindicaciones 1 a 10, en el que la vía biosintética comprende además una o más enzimas glicosiltransferasas dependientes de difosfato de uridina (UGT).
12. El procedimiento de una cualquiera de las reivindicaciones 1 a 11, en el que IbpA no se sobreexpresa durante el cultivo.
13. El procedimiento de una cualquiera de las reivindicaciones 1 a 12, en el que el cultivo se realiza a 30 °C o más.
14. El procedimiento de una cualquiera de las reivindicaciones 1 a 13, en el que las células deE. coliexpresan una o más enzimas citocromo P450 reductasa (CPR) como una fusión traduccional u operón con la enzima P450 que comprende un dominio transmembrana derivado de una proteína C-terminal citoplásmica de la membrana interna deE. coli.
15. El procedimiento de la reivindicación 14, en el que la enzima P450 y la CPR se expresan por separado, y el nivel de expresión de la enzima P450 y la CPR es aproximadamente de 2:1 a 1:2.
16. El procedimiento de la reivindicación 14 o 15, en el que las células de E.coliexpresan una única proteína CPR.
17. El procedimiento de una cualquiera de las reivindicaciones 14 a 16, en el que al menos un compañero de CPR comprende un anclaje a membrana que tiene un dominio transmembrana de paso único derivado de una proteína C-terminal citoplásmica de la membrana interna deE. coli.
18. El procedimiento de una cualquiera de las reivindicaciones 1 a 17, en el que al menos un dominio transmembrana derivado de una proteína C-terminal citoplásmica de la membrana interna deE. colise selecciona de:
aproximadamente los 20 a 22 aminoácidos N-terminales de yhcB,
aproximadamente los 19 a 21 aminoácidos N-terminales de yhhm,
aproximadamente los 24 a 26 aminoácidos N-terminales de zipA,
aproximadamente los 21 a 23 aminoácidos N-terminales de ypfN,
aproximadamente los 27 a 29 aminoácidos N-terminales de SohB, y
aproximadamente los 20 a 22 aminoácidos N-terminales de waaA.
19. El procedimiento de una cualquiera de las reivindicaciones 1 a 18, que comprende además recuperar la especie química del cultivo.
20. El procedimiento de la reivindicación 19, comprende además incorporar la especie química a un producto.
21. El procedimiento de la reivindicación 1, en el que el dominio transmembrana derivado de una proteína C-terminal citoplásmica de la membrana interna deE. coliincluye:
los aminoácidos N-terminales 15 a 30 de yhcB que tienen opcionalmente de una a ocho mutaciones seleccionadas independientemente de sustituciones, inserciones o deleciones con respecto a la secuencia de aminoácidos de yhcB,
los 15 a 30 aminoácidos N-terminales de yhhM que tienen opcionalmente de una a ocho mutaciones seleccionadas independientemente de sustituciones, inserciones o deleciones con respecto a la secuencia de aminoácidos de yhhM,
los 15 a 30 aminoácidos N-terminales de zipA que tienen opcionalmente de una a ocho mutaciones seleccionadas independientemente de sustituciones, inserciones o deleciones con respecto a la secuencia de aminoácidos de zipA,
los aminoácidos N-terminales 15 a 30 de ypfN que tienen opcionalmente de una a ocho mutaciones seleccionadas independientemente de sustituciones, inserciones o deleciones con respecto a la secuencia de aminoácidos de ypfN,
los 20 a 35 aminoácidos N-terminales de sohB que tienen opcionalmente de una a ocho mutaciones seleccionadas independientemente de sustituciones, inserciones o deleciones con respecto a la secuencia de aminoácidos de sohB, o
los 15 a 30 aminoácidos N-terminales de waaA que tienen opcionalmente de una a ocho mutaciones seleccionadas independientemente de sustituciones, inserciones o deleciones con respecto a la secuencia de aminoácidos de waaA.
ES16839862T 2015-08-21 2016-08-19 Aumento de la productividad de células hospedadoras de E. coli que expresan funcionalmente enzimas P450 Active ES2959560T3 (es)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US201562208166P 2015-08-21 2015-08-21
PCT/US2016/047692 WO2017034942A1 (en) 2015-08-21 2016-08-19 Increasing productivity of e. coli host cells that functionally express p450 enzymes

Publications (1)

Publication Number Publication Date
ES2959560T3 true ES2959560T3 (es) 2024-02-27

Family

ID=58100748

Family Applications (1)

Application Number Title Priority Date Filing Date
ES16839862T Active ES2959560T3 (es) 2015-08-21 2016-08-19 Aumento de la productividad de células hospedadoras de E. coli que expresan funcionalmente enzimas P450

Country Status (4)

Country Link
US (3) US10774314B2 (es)
EP (1) EP3337893B1 (es)
ES (1) ES2959560T3 (es)
WO (1) WO2017034942A1 (es)

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10934564B2 (en) 2014-08-21 2021-03-02 Manus Bio Inc. Methods for production of oxygenated terpenes
ES2959560T3 (es) 2015-08-21 2024-02-27 Manus Bio Inc Aumento de la productividad de células hospedadoras de E. coli que expresan funcionalmente enzimas P450
JP7330888B2 (ja) 2017-01-26 2023-08-22 マナス バイオ インコーポレイテッド テルペノイド産物を微生物生産するための代謝工学
MX2019009135A (es) 2017-02-03 2019-10-09 Manus Bio Inc Ingenieria metabolica para la produccion microbiana de productos terpenoides.
BR112019019966A2 (pt) 2017-03-24 2020-04-28 Trait Biosciences Inc biossíntese in vivo de alto nível e isolamento de canabinoides solúveis em água em sistemas de plantas
US11905543B2 (en) 2017-07-11 2024-02-20 Trait Biosceinces, Inc. In vivo generation of water-soluble acetylated cannabinoid glycoside compounds in plant cell suspension cultures
EP3679153A4 (en) 2017-07-11 2021-01-06 Trait Biosciences, Inc. GENERATION OF WATER-SOLUBLE CANNABINOID COMPOUNDS IN YEAST AND PLANT CELL SUSPENSION CULTURES AND COMPOSITIONS
US11946059B2 (en) 2017-07-11 2024-04-02 Trait Biosciences, Inc. In vivo generation of water-soluble cannabinoids in plant cell suspension cultures
JP2022500018A (ja) 2018-09-06 2022-01-04 マナス バイオ インコーポレイテッド ロタンドンの微生物生成
EP3861101A4 (en) * 2018-10-05 2022-07-20 Manus Bio Inc. Biosynthesis and recovery of secondary metabolites
EP3877519A4 (en) 2018-11-09 2022-08-24 Ginkgo Bioworks, Inc. BIOSYNTHESIS OF MOGROSIDS
CN113122561B (zh) * 2020-01-16 2023-08-22 南京理工大学 膜蛋白SohB的表达载体及其表达纯化方法
CN113265381B (zh) * 2021-04-20 2022-07-08 首都医科大学 一种分离的cyp450蛋白及其编码基因与应用
FR3135988A1 (fr) * 2022-05-30 2023-12-01 Universite De Lorraine Protéine de fusion et utilisation pour la bioconversion de molécules

Family Cites Families (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2440278C (en) 2001-03-09 2017-02-28 University Of Kentucky Research Foundation Cytochrome p450s and uses thereof
ATE546521T1 (de) 2002-10-04 2012-03-15 Firmenich & Cie Sesquiterpene synthasen und verwerdungsmethoden
WO2006065126A2 (en) * 2004-10-14 2006-06-22 Plant Research International B.V. Terpene hydroxylation
AP2008004418A0 (en) * 2005-10-07 2008-04-30 Univ California Nucleic acids encoding modified cytochrome p450 enzyme and methods of use thereof
WO2008094546A2 (en) * 2007-01-31 2008-08-07 The Regents Of The University Of California Genetically modified host cells for increased p450 activity levels and methods of use thereof
US20110236927A1 (en) 2008-08-27 2011-09-29 Massachusetts Institute Of Technology Genetically stabilized tandem gene duplication
EP2594648B1 (en) 2009-11-10 2016-03-16 Massachusetts Institute of Technology Microbial engineering for the production of chemical and pharmaceutical products from the isoprenoid pathway
US8927241B2 (en) 2009-11-10 2015-01-06 Massachusetts Institute Of Technology Microbial engineering for the production of chemical and pharmaceutical products from the isoprenoid pathway
MX349121B (es) 2010-06-02 2017-07-12 Evolva Inc Produccion recombinante de esteviol glucosidos.
EP2633042A1 (en) 2010-10-29 2013-09-04 Allylix, Inc. Modified valencene synthase polypeptides, encoding nucleic acid molecules and uses thereof
EP2645847B1 (en) 2010-11-30 2018-01-17 Massachusetts Institute of Technology Microbial production of natural sweeteners, diterpenoid steviol glycosides
KR20150128705A (ko) 2013-02-11 2015-11-18 에볼바 에스아 재조합 숙주에서 스테비올 글리코시드의 효율적인 생성
US10934564B2 (en) * 2014-08-21 2021-03-02 Manus Bio Inc. Methods for production of oxygenated terpenes
MY182396A (en) 2014-11-05 2021-01-23 Manus Biosynthesis Inc Microbial production of steviol glycosides
ES2959560T3 (es) 2015-08-21 2024-02-27 Manus Bio Inc Aumento de la productividad de células hospedadoras de E. coli que expresan funcionalmente enzimas P450

Also Published As

Publication number Publication date
US20180251738A1 (en) 2018-09-06
US20200377865A1 (en) 2020-12-03
EP3337893A4 (en) 2019-01-02
US20230323314A1 (en) 2023-10-12
EP3337893A1 (en) 2018-06-27
WO2017034942A1 (en) 2017-03-02
EP3337893B1 (en) 2023-07-19
US10774314B2 (en) 2020-09-15

Similar Documents

Publication Publication Date Title
ES2959560T3 (es) Aumento de la productividad de células hospedadoras de E. coli que expresan funcionalmente enzimas P450
Gulck et al. Synthetic biology of cannabinoids and cannabinoid glucosides in Nicotiana benthamiana and Saccharomyces cerevisiae
US12227783B2 (en) Metabolic engineering for microbial production of terpenoid products
US10519470B2 (en) Microbial engineering for the production of chemical and pharmaceutical products from the isoprenoid pathway
Misawa Pathway engineering for functional isoprenoids
Lange et al. Metabolic engineering of plant monoterpenes, sesquiterpenes and diterpenes—current status and future opportunities
Tholl Biosynthesis and biological functions of terpenoids in plants
Dubey et al. An overview of the non-mevalonate pathway for terpenoid biosynthesis in plants
Dewick The biosynthesis of C 5–C 25 terpenoid compounds
US20190270971A1 (en) Increasing productivity of microbial host cells that functionally express p450 enzymes
JP2013510573A (ja) イソプレノイド経路から化学品および医薬品を産生するための微生物工学
Lanier et al. Plant terpene specialized metabolism: complex networks or simple linear pathways?
Günnewich et al. A diterpene synthase from the clary sage Salvia sclarea catalyzes the cyclization of geranylgeranyl diphosphate to (8R)-hydroxy-copalyl diphosphate
Kulkarni et al. Characterization of three novel isoprenyl diphosphate synthases from the terpenoid rich mango fruit
Li et al. An extremely promiscuous terpenoid synthase from the Lamiaceae plant Colquhounia coccinea var. mollis catalyzes the formation of sester-/di-/sesqui-/mono-terpenoids
Dhandapani et al. Production of multiple terpenes of different chain lengths by subcellular targeting of multi-substrate terpene synthase in plants
Hong et al. Key enzymes involved in the synthesis of hops phytochemical compounds: From structure, functions to applications
Hivert et al. Prenyltransferases catalyzing geranyldiphosphate formation in tomato fruit
Kumar et al. Isoprenyl diphosphate synthases of terpenoid biosynthesis in rose-scented geranium (Pelargonium graveolens)
Sato-Masumoto et al. A domain swapping approach to elucidate differential regiospecific hydroxylation by geraniol and linalool synthases from perilla
Nguyen Biochemical and evolutionary studies of sesquiterpene lactone metabolism in the sunflower (Asteraceae) family
Keasling 41 Microbial Production of Isoprenoids
Navale Improved production of epi-cedrol and santalene by fusion protein expression: Stability study and cyclization mechanism of epi-cedrol biosynthesis
Srivastava Characterization of the genes involved in santalene biosynthetic pathway in Indian Sandalwood Santalum album linn.
Sun Metabolic Engineering Applications