[go: up one dir, main page]

ES2830725T3 - Polipéptidos cetoreductasa para la síntesis de compuestos quirales - Google Patents

Polipéptidos cetoreductasa para la síntesis de compuestos quirales Download PDF

Info

Publication number
ES2830725T3
ES2830725T3 ES16749625T ES16749625T ES2830725T3 ES 2830725 T3 ES2830725 T3 ES 2830725T3 ES 16749625 T ES16749625 T ES 16749625T ES 16749625 T ES16749625 T ES 16749625T ES 2830725 T3 ES2830725 T3 ES 2830725T3
Authority
ES
Spain
Prior art keywords
polypeptide
residue
seq
ketoreductase
sequence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
ES16749625T
Other languages
English (en)
Inventor
Oscar Alvizo
Nicholas Agard
Xinkai Xie
David Entwistle
Birgit Kosjek
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Codexis Inc
Original Assignee
Codexis Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Codexis Inc filed Critical Codexis Inc
Application granted granted Critical
Publication of ES2830725T3 publication Critical patent/ES2830725T3/es
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/0004Oxidoreductases (1.)
    • C12N9/0006Oxidoreductases (1.) acting on CH-OH groups as donors (1.1)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P17/00Preparation of heterocyclic carbon compounds with only O, N, S, Se or Te as ring hetero atoms
    • C12P17/10Nitrogen as only ring hetero atom
    • C12P17/12Nitrogen as only ring hetero atom containing a six-membered hetero ring
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P41/00Processes using enzymes or microorganisms to separate optical isomers from a racemic mixture
    • C12P41/002Processes using enzymes or microorganisms to separate optical isomers from a racemic mixture by oxidation/reduction reactions
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P7/00Preparation of oxygen-containing organic compounds
    • C12P7/02Preparation of oxygen-containing organic compounds containing a hydroxy group
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P7/00Preparation of oxygen-containing organic compounds
    • C12P7/40Preparation of oxygen-containing organic compounds containing a carboxyl group including Peroxycarboxylic acids
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y101/00Oxidoreductases acting on the CH-OH group of donors (1.1)
    • C12Y101/01Oxidoreductases acting on the CH-OH group of donors (1.1) with NAD+ or NADP+ as acceptor (1.1.1)
    • C12Y101/01184Carbonyl reductase (NADPH) (1.1.1.184)

Landscapes

  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Health & Medical Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Genetics & Genomics (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Biochemistry (AREA)
  • Biotechnology (AREA)
  • Microbiology (AREA)
  • General Chemical & Material Sciences (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Medicinal Chemistry (AREA)
  • Molecular Biology (AREA)
  • Biomedical Technology (AREA)
  • Analytical Chemistry (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Enzymes And Modification Thereof (AREA)

Abstract

Un polipéptido modificado que tiene actividad de cetoreductasa, el polipéptido modificado que comprende una secuencia de aminoácidos con al menos 80% de identidad de secuencia con SEQ ID NO:4 y al menos una sustitución seleccionada de una prolina en la posición del polipéptido correspondiente a la posición D150 de SEQ ID NO:4, un residuo distinto de prolina en la posición del polipéptido correspondiente a la posición 94 de SEQ ID NO:4, un residuo distinto de fenilalanina en la posición del polipéptido correspondiente a la posición 145 de SEQ ID NO:4, un residuo distinto de fenilalanina en la posición del polipéptido correspondiente a la posición 249 de SEQ ID NO:4, un residuo distinto de valina en la posición del polipéptido correspondiente a la posición 144 de SEQ ID NO:4, y un residuo distinto de prolina en la posición del polipéptido correspondiente a la posición 190 de SEQ ID NO:4, y donde dicho polipéptido tiene una mayor selectividad de producto 2a:2c en comparación con SEQ ID NO:4 cuando se usa el compuesto (1) como sustrato, donde el compuesto (1) tiene la estructura, **(Ver fórmula)** el producto 2a tiene la estructura **(Ver fórmula)** y el producto 2c tiene la estructura **(Ver fórmula)**

Description

DESCRIPCIÓN
Polipéptidos cetoreductasa para la síntesis de compuestos quirales
CAMPO DE LA INVENCIÓN
[0001] La presente invención proporciona enzimas de cetoreductasa modificada que tienen propiedades mejoradas en comparación a una enzima de cetoreductasa de tipo silvestre de origen natural, así como los polinucleótidos que codifican las enzimas de cetoreductasa modificada, las células huésped capaces de expresar las enzimas de cetoreductasa modificada. La presente divulgación proporciona métodos para usar las enzimas de cetoreductasa modificadas genéticamente para sintetizar una variedad de compuestos quirales.
ANTECEDENTES
[0002] Las enzimas que pertenecen a la clase cetoreductasa (KRED) o carbonilo reductasa (EC1,1,1,184) son útiles para la síntesis de alcoholes ópticamente activos a partir del sustrato de cetona proquiral correspondiente y por reducción estereoselectiva de sustratos de aldehído racémico correspondientes. Los KRED normalmente convierten los sustratos de cetona y aldehído en el producto de alcohol correspondiente, pero también pueden catalizar la reacción inversa, la oxidación de un sustrato de alcohol en el producto de cetona/aldehído correspondiente. La reducción de cetonas y aldehídos y la oxidación de alcoholes por enzimas como KRED requiere un cofactor, más comúnmente dinucleótido de nicotinamida adenina reducido (NADH) o fosfato de dinucleótido de nicotinamida adenina reducido (NADPH) y dinucleótido de nicotinamida adenina (NAD) o nicotinamida fosfato de dinucleótido de adenina (NADP) para la reacción de oxidación. NADH y NADPH sirven como donantes de electrones, mientras que NAD y NADP sirven como aceptores de electrones. Se observa con frecuencia que las cetoreductasas y las alcohol deshidrogenasas aceptan el cofactor fosforilado o no fosforilado (en su estado oxidado y reducido), pero no ambos.
[0003] Con el fin de evitar que muchos procedimientos de síntesis química produzcan compuestos llave, cetoreductasas se están empleando cada vez más para la conversión enzimática de sustratos diferentes ceto y aldehído a productos de alcohol quiral. Estas aplicaciones pueden emplear células completas que expresan la cetoreductasa para reducciones biocatalíticas de cetonas y aldehídos, o mediante el uso de enzimas purificadas en aquellos casos en los que la presencia de múltiples cetoreductasas en células completas afectaría adversamente la estereopureza y el rendimiento del producto deseado. Para aplicaciones in vitro, se puede usar una enzima regeneradora de cofactor (NADH o NADPH), como glucosa deshidrogenasa (GDH), formiato deshidrogenasa, etc., junto con la cetoreductasa. Es deseable identificar otras enzimas de cetoreductasa que se pueden usar para llevar a cabo la conversión de varios ceto sustratos en los correspondientes productos de alcohol quiral.
SUMARIO DE LA INVENCIÓN
[0004] La presente invención proporciona enzimas de cetoreductasa modificada que tienen propiedades mejoradas en comparación a una enzima de cetoreductasa de tipo silvestre de origen natural, así como los polinucleótidos que codifican las enzimas de cetoreductasa modificada, las células huésped capaces de expresar las enzimas de cetoreductasa modificada. La presente divulgación proporciona métodos para usar las enzimas de cetoreductasa modificadas genéticamente para sintetizar una variedad de compuestos quirales.
[0005] La presente divulgación proporciona enzimas de cetoreductasa diseñada ("KRED") que son capaces de reducir estereoselectivamente un sustrato ceto definido a su producto de alcohol correspondiente y que tiene una propiedad mejorada en comparación con la enzima de tipo silvestre de origen natural KRED obtenida a partir de L. kefir (SEQ ID NO:2) o cuando se compara con otras enzimas de cetoreductasa modificadas genéticamente.
[0006] Por otra parte, las enzimas modificadas descritas en este documento pueden tener una o más propiedades mejoradas, además de la estereoselectividad alterada. Por ejemplo, el polipéptido de cetoreductasa modificado puede tener una actividad enzimática incrementada en comparación con la enzima de cetoreductasa de tipo silvestre para reducir el sustrato al producto y/o aumenta adicionalmente la estereoselectividad para el (los) enantiómero(s). Las mejoras en las propiedades de las enzimas también pueden incluir, entre otras, aumentos en la termoestabilidad, estabilidad del disolvente y/o inhibición reducida del producto.
[0007] Las realizaciones de la presente invención se exponen en las reivindicaciones adjuntas. En una realización, la presente invención proporciona un polipéptido modificado que tiene actividad de cetoreductasa, el polipéptido modificado que comprende una secuencia de aminoácidos con al menos un 80% de identidad de secuencia con la SEQ ID NO:4 y al menos una sustitución seleccionada de una prolina en la posición de la polipéptido correspondiente a la posición D150 de SEQ ID NO:4, un residuo distinto de prolina en la posición del polipéptido correspondiente a la posición 94 de SEQ ID NO:4, un residuo distinto de fenilalanina en la posición del polipéptido correspondiente a la posición 145 de SEQ ID NO:4, un resto distinto de fenilalanina en la posición del polipéptido correspondiente a la posición 249 de SEQ ID NO:4, un residuo distinto de valina en la posición del polipéptido correspondiente a la posición 144 de SEQ ID NO:4, y un residuo distinto de prolina en la posición del polipéptido correspondiente a la posición 190 de SEQ ID NO:4, y en donde dicho polipéptido tiene una selectividad de producto 2a:2c mayor en comparación con t o SEQ ID NO:4 cuando se usa el compuesto (1) como sustrato, en donde el compuesto (1) tiene la estructura
Figure imgf000003_0001
el producto 2a tiene la estructura
Figure imgf000003_0002
y el producto 2c tiene la estructura
Figure imgf000003_0003
[0008] En otra realización, la presente invención proporciona un polinucleótido que codifica un polipéptido modificado genéticamente de la presente invención.
[0009] En otra realización, la presente invención proporciona un vector de expresión que comprende un polinucleótido de la presente invención.
[0010] En otra realización, la presente invención proporciona una célula huésped que comprende un polinucleótido de la presente invención, o un vector de expresión de la presente invención.
[0011] En otra realización, la presente invención proporciona un método de preparación de un polipéptido modificado que tiene actividad de cetoreductasa, que comprende cultivar una célula huésped de la presente invención en condiciones adecuadas para la expresión del polipéptido, que opcionalmente comprende además aislar el polipéptido modificado.
[0012] La presente divulgación proporciona polipéptidos modificados que comprenden secuencias de aminoácidos con al menos 80% de identidad de secuencia con la SEQ ID NO:2 y al menos una sustitución en una posición seleccionada de X68, X94, X102, X110, X114, X135, X144, X145, X147, X149, X150, X153, X158, X173, X175, X190, X196, X197, X198, X199, X201, X202, X203, X205, X206, X207, X209, X210, X211, X212, X213, X233, X249, X250 y X252, en comparación con SEQ ID NO:2, y en donde el polipéptido tiene una selectividad 2a:2c mayor en comparación con SEQ ID NO:2. En algunos aspectos, las secuencias de aminoácidos de los polipéptidos manipulados comprenden al menos uno de los siguientes: el residuo correspondiente a X68 es un residuo no polar o alifático; el residuo correspondiente a X94 es un residuo polar o apolar; el residuo correspondiente a X102 es un residuo ácido; el residuo correspondiente a X110 es un residuo ácido o aromático; el residuo correspondiente a X114 es un residuo apolar; el residuo correspondiente a X135 es un residuo básico; el residuo correspondiente a X144 es un residuo aromático o no polar; el residuo correspondiente a X145 es un residuo aromático; el residuo correspondiente a X147 es un residuo no polar o alifático; el residuo correspondiente a X149 es un residuo polar; el residuo correspondiente a X150 es un residuo aromático o ácido; el residuo correspondiente a X153 es un residuo polar o aromático; el residuo correspondiente a X158 es un residuo no polar o alifático; el residuo correspondiente a X173 es un residuo no polar o alifático; el residuo correspondiente a X175 es un residuo polar; el residuo correspondiente a X190 es un residuo aromático, alifático, apolar o polar; el residuo correspondiente a X196 es un residuo aromático, polar, básico, apolar o alifático; el residuo correspondiente a X197 es un residuo aromático; el residuo correspondiente a X198 es un residuo polar no polar; el residuo correspondiente a X199 es un residuo ácido; el residuo correspondiente a X201 es un residuo polar; el residuo correspondiente a X202 es un residuo aromático o básico; el residuo correspondiente a X203 es un residuo aromático, apolar o alifático; el residuo correspondiente a X205 es un residuo polar; el residuo correspondiente a X206 es un residuo aromático; el residuo correspondiente a X207 es un residuo aromático, ácido, apolar o alifático; el residuo correspondiente a X209 es un residuo aromático, ácido, apolar, polar o alifático; el residuo correspondiente a X210 es un residuo no polar o alifático; el residuo correspondiente a X211 es un residuo aromático, ácido, alifático, polar o apolar; el residuo correspondiente a X212 es un residuo aromático, básico, apolar, alifático o ácido; el residuo correspondiente a X213 es un residuo aromático, básico, ácido, polar, apolar o alifático; el residuo correspondiente a X217 es un residuo polar o aromático; el residuo correspondiente a X233 es un residuo polar; el residuo correspondiente a X249 es un residuo básico o apolar; el residuo correspondiente a X250 es un residuo apolar; y el residuo correspondiente a X252 es un residuo aromático, en comparación con SEQ ID NO:2. En algunos aspectos adicionales, las secuencias de aminoácidos de los polipéptidos diseñados comprenden al menos una sustitución seleccionada de X68V, X94G/M/Q, X102D, X110E/W, X114G, X135K, X144G/W, X145W, X147L, X149S, X150D/F/P/W, X153H/P/T/V/C, X158V, X173L, X175T, X190A/L/Q/T/W, X196H/I/K/N/Q, X196I, X196K/N/Q, X197Y, X198G/S, X199E, X201N, X202F/H/R/Y, X203G/L/W, X205T, X206H/W/Y, X207D/G/V/Y, X209E/F/G/I/M/T/V/W, X210L/P, X211E/H/I/P/S, X212A/E/G/H/N/P/R/V, X213D/E/G/H/K/M/N/R, X217H/N, X233Q/T, X249G/K/R, X250G y X252W, en comparación con SEQ ID NO:2. En algunos aspectos adicionales, las secuencias de aminoácidos de los polipéptidos manipulados comprenden una sustitución en la posición X190, en comparación con SEQ ID NO:2. Todavía en algunos aspectos adicionales, las secuencias de aminoácidos de los polipéptidos manipulados comprenden una sustitución en la posición X190, en donde la sustitución se selecciona entre P, A, T y Q, en comparación con la SEQ ID NO:2. En algunos aspectos, las secuencias de aminoácidos de los polipéptidos manipulados comprenden una sustitución en la posición X249, en comparación con la SEQ ID NO:2. En algunos aspectos adicionales, las secuencias de aminoácidos de los polipéptidos manipulados comprenden una sustitución en la posición X249, en donde la sustitución se selecciona entre R, K y G, en comparación con la SEQ ID NO:2. En algunos aspectos adicionales, las secuencias de aminoácidos de los polipéptidos manipulados comprenden sustituciones en las posiciones X190 y X249, en comparación con SEQ ID NO:2. En algunos aspectos más, las secuencias de aminoácidos de los polipéptidos modificados comprenden sustituciones en las posiciones X190 y X249, en las que la sustitución en la posición X190 se selecciona entre P, A, T y Q, y la sustitución en la posición 249 se selecciona entre R, K y G, en comparación con SEQ ID NO:2.
[0013] La presente descripción también proporciona polipéptidos modificados que comprenden secuencias de aminoácidos con al menos 80% de identidad de secuencia con la SEQ ID NO:4, y al menos una sustitución en una posición seleccionada de X94, X144, X145, X150, X190, y x249, en comparación con SEQ ID NO:\ 4, y en donde dicho polipéptido tiene una mayor selectividad 2a:2c en comparación con SEQ ID NO:4. En algunos aspectos, las secuencias de aminoácidos de los polipéptidos manipulados comprenden al menos uno de los siguientes: el residuo correspondiente a X145 es un residuo aromático; el residuo correspondiente a X249 es un residuo básico; el residuo correspondiente a X94 es un residuo apolar; el residuo correspondiente a X144 es un residuo apolar; el residuo correspondiente a X150 es un residuo; y el residuo correspondiente a X190 es un residuo aromático, en comparación con s Eq ID NO:4. En algunos aspectos adicionales, las secuencias de aminoácidos de los polipéptidos manipulados comprenden al menos una sustitución seleccionada entre X145W, X249K/R, X94G, X144G, X150P, X190W, en comparación con la SEQ ID NO:4.
[0014] La presente descripción también proporciona polipéptidos modificados que comprenden secuencias de aminoácidos con al menos 80% de identidad de secuencia con la SEQ ID NO:10 y al menos una sustitución en una posición seleccionada de X145, X150, X153, X190, X198, X206, y X211, en comparación con SEQ ID NO:10, y en donde dicho polipéptido tiene una mayor selectividad 2a:2c en comparación con SEQ ID NO:10. En algunos aspectos, las secuencias de aminoácidos de los polipéptidos manipulados comprenden al menos uno de los siguientes: el residuo correspondiente a X145 es un residuo aromático; el residuo correspondiente a X150 es un residuo aromático; el residuo correspondiente a X153 es un residuo; el residuo correspondiente a X190 es un residuo alifático o apolar; el residuo correspondiente a X198 es un residuo apolar; el residuo correspondiente a X206 es un residuo aromático; y el residuo correspondiente a X211 es un residuo aromático, ácido, alifático, polar o no polar, en comparación con SEQ ID NO:10. En algunos aspectos adicionales, las secuencias de aminoácidos de los polipéptidos manipulados comprenden al menos una sustitución seleccionada de X145W, X150W/F, X153C, X190A, X198G, X206Y y X211 i/H/S/E, en comparación con SEQ ID NO:10.
[0015] La presente descripción también proporciona polipéptidos modificados que comprenden secuencias de aminoácidos con al menos 80% de identidad de secuencia con la SEQ ID NO:26 y al menos una sustitución en una posición seleccionada de X94, X147, X153, X175, X190, X196, X199, X201, X202, X203, X206, X207, X209, X210, X211, X212, X213, X217, en comparación con SEQ ID NO:26, y en donde dicho polipéptido tiene una mayor selectividad 2a:2c en comparación con SEQ ID NO:26. En algunos aspectos, las secuencias de aminoácidos de los polipéptidos manipulados comprenden al menos uno de los siguientes: el residuo correspondiente a X147 es un residuo no polar o alifático; el residuo correspondiente a X153 es un residuo polar o aromático; el residuo correspondiente a X175 es un residuo polar; el residuo correspondiente a X190 es un residuo polar, alifático o apolar; el residuo correspondiente a X196 es un residuo polar, básico, no polar o alifático; el residuo correspondiente a X199 es un residuo ácido; el residuo correspondiente a X201 es un residuo polar; el residuo correspondiente a X202 es un residuo aromático o básico; el residuo correspondiente a X203 es un residuo aromático, apolar o alifático; el residuo correspondiente a X206 es un residuo aromático; el residuo correspondiente a X207 es un residuo aromático, ácido o apolar; el residuo correspondiente a X209 es un residuo aromático, ácido, apolar, polar o alifático; el residuo correspondiente a X210 es un residuo no polar o alifático; el residuo correspondiente a X211 es un residuo apolar; el residuo correspondiente a X212 es un residuo aromático, básico, apolar o ácido; el residuo correspondiente a X213 es un residuo aromático, básico, ácido, polar, apolar o alifático; el residuo correspondiente a X217 es un residuo polar; y el residuo correspondiente a X94 es un residuo polar o no polar, en comparación con SEQ ID NO:26. En algunos aspectos adicionales, las secuencias de aminoácidos de los polipéptidos manipulados comprenden al menos una sustitución seleccionada entre X94Q/M, X147L, X153T/H, X175T, X190Q/L, X196N/K/I, X199E, X201N, X202Y/R/H/F, X203W/L, X206W/H, X207Y/G/D, X209Y/W/V/T/M/I/G/F/E, X210P/L, X211P, X212R/H/G/E, X213T/R/N/M/K/H/G/e/D, y X217N, en comparación a la SEQ ID NO:26.
[0016] La presente descripción también proporciona polipéptidos modificados que comprenden secuencias de aminoácidos con al menos 80% de identidad de secuencia con la SEQ ID NO:42 y al menos una sustitución en una posición seleccionada de X68, X94, X102, X110, X114, X135, X149, X150, X153, X158, X173, X190, X196, X197, X198, X203, X205, X207, X209, X212, X213, X217, X233, X249, X250, X252, en comparación con SEQ ID NO:42, y donde dicho polipéptido tiene una mayor selectividad 2a:2c en comparación con la SEQ ID NO:42. En algunos aspectos, las secuencias de aminoácidos de los polipéptidos manipulados comprenden al menos uno de los siguientes: el residuo correspondiente a X102 es un residuo ácido; el residuo correspondiente a X110 es un residuo ácido o aromático; el residuo correspondiente a X114 es un residuo apolar; el residuo correspondiente a X135 es un residuo básico; el residuo correspondiente a X149 es un residuo polar; el residuo correspondiente a X150 es un residuo ácido; el residuo correspondiente a X153 es un residuo; el residuo correspondiente a X158 es un residuo no polar o alifático; el residuo correspondiente a X173 es un residuo no polar o alifático; el residuo correspondiente a X190 es un residuo no polar, polar o alifático; el residuo correspondiente a X196 es un residuo aromático o polar; el residuo correspondiente a X197 es un residuo aromático; el residuo correspondiente a X198 es un residuo polar; el residuo correspondiente a X203 es un residuo alifático, aromático, no polar; el residuo correspondiente a X205 es un residuo polar; el residuo correspondiente a X207 es un residuo no polar o alifático; el residuo correspondiente a X209 es un residuo apolar; el residuo correspondiente a X212 es un residuo no polar, alifático, ácido o aromático; el residuo correspondiente a X213 es un residuo ácido, básico, apolar, alifático o polar; el residuo correspondiente a X217 es un residuo aromático; el residuo correspondiente a X233 es un residuo polar; el residuo correspondiente a X249 es un residuo apolar; el residuo correspondiente a X250 es un residuo apolar; el residuo correspondiente a X252 es un residuo aromático; el residuo correspondiente a X68 es un residuo no polar o alifático; y el residuo correspondiente a X94 es un residuo polar. En algunos aspectos adicionales, las secuencias de aminoácidos de los polipéptidos modificados comprenden al menos la sustitución seleccionada de X68V, X94Q, X102D, X110E/W, X114G, X135K, X149S, X150D, X153P, X158V, X173L, X190L/T, X196H/N/Q, X197Y, X198S, X203G/L/W, X205T, X207V, X209G, X212A/E/G/H/N/P, X213E/G/K/M/N/T/R/V, X217H, X233Q/T, X249G, X250G y X252W, en comparación con SEQ ID NO:42.
[0017] La presente invención también proporciona polipéptidos modificados, en donde la actividad estereoselectiva de los polipéptidos se incrementa al menos 2 veces en comparación con la correspondiente actividad del polipéptido de referencia de SEQ ID NOS: 4, 10, 26, y/o 42.
[0018] Se describen polipéptidos modificados en donde la secuencia de aminoácidos comprende una secuencia seleccionada del grupo que consiste de los identificadores de secuencia de número par de SEQ ID NOS: 6-238.
[0019] Se describen polipéptidos modificados genéticamente que tienen actividad de cetoreductasa, en los que el polipéptido comprende la SEQ ID NO:240. En algunos aspectos, el residuo correspondiente a X173 es leucina. En algunos aspectos alternativos, el residuo correspondiente a X249 es glicina. En algunos aspectos adicionales, el residuo correspondiente a X173 es leucina y el residuo correspondiente a X249 es glicina.
[0020] Se describen polipéptidos modificados genéticamente que tienen actividad de cetoreductasa, en los que el polipéptido comprende la SEQ ID NO:239. En algunos aspectos, el residuo correspondiente a X173 es leucina. En algunos aspectos alternativos, el residuo correspondiente a X249 es glicina. En algunos aspectos adicionales, el residuo correspondiente a X173 es leucina y el residuo correspondiente a X249 es glicina.
[0021] La presente descripción también proporciona polinucleótidos que codifican los polipéptidos modificados descritos en este documento. En algunas realizaciones, el polinucleótido comprende una secuencia de ácido nucleico seleccionada del grupo que consiste en los identificadores de secuencia de número impar de SEQ ID NOS: 5-237.
[0022] La presente descripción también proporciona vectores de expresión que comprende el (los) polinucleótido(s) que se describen en este documento.
[0023] La presente descripción también proporciona células huésped que comprenden el (los) polinucleótido(s) descrito(s) en este documento o al menos un vector de expresión descrito en este documento.
[0024] La presente descripción también proporciona métodos para preparar polipéptidos modificados que tiene actividad de cetoreductasa , que comprende cultivar la célula huésped descrita en el presente documento, en condiciones adecuadas para la expresión del polipéptido, que opcionalmente comprende además aislar el polipéptido modificado.
BREVE DESCRIPCIÓN DE LAS FIGURAS
[0025]
La Figura 1 proporciona el esquema de reacción.
La Figura 2 proporciona las estructuras de los isómeros del sustrato y del producto.
DESCRIPCIÓN DE LA INVENCIÓN
[0026] La presente invención proporciona enzimas de cetoreductasa modificada que tienen propiedades mejoradas en comparación a una enzima de cetoreductasa de tipo silvestre de origen natural, así como polinucleótidos que codifican las enzimas de cetoreductasa modificadas, células huésped capaces de expresar las enzimas de cetoreductasa modificadas. La presente divulgación proporciona métodos para usar las enzimas de cetoreductasa modificadas para sintetizar una variedad de compuestos quirales.
Definiciones
[0027] En referencia a la presente descripción, los términos técnicos y científicos usados en las descripciones en este documento tendrán los significados comúnmente entendidos por un experto normal en la técnica, salvo que se defina específicamente lo contrario. Por consiguiente, se pretende que los siguientes términos tengan los siguientes significados. A menos que se indique lo contrario, la práctica de la presente invención implica técnicas convencionales comúnmente utilizadas en biología molecular, fermentación, microbiología y campos relacionados, que son conocidas por los expertos en la técnica. A menos que se defina lo contrario en el presente documento, todos los términos técnicos y científicos usados en el presente documento tienen el mismo significado que el que entiende comúnmente un experto en la técnica a la que pertenece esta invención. Aunque cualquier método y material similar o equivalente a los descritos en este documento puede usarse en la práctica o ensayo de la presente invención, se describen los métodos y materiales preferidos. De hecho, se pretende que la presente invención no se limite a la metodología, protocolos y reactivos particulares descritos en el presente documento, ya que estos pueden variar, dependiendo del contexto en donde se utilicen. Los títulos proporcionados en este documento no son limitaciones de los diversos aspectos o realizaciones de la presente invención.
[0028] No obstante, con el fin de facilitar la comprensión de la presente invención, un número de términos se definen a continuación. Los rangos numéricos incluyen los números que definen el intervalo. Por tanto, cada rango numérico descrito en el presente documento pretende abarcar cada rango numérico más estrecho que se encuentre dentro de dicho rango numérico más amplio, como si dichos rangos numéricos más estrechos estuvieran todos expresamente escritos aquí. También se pretende que cada limitación numérica máxima (o mínima) descrita en este documento incluya cada limitación numérica inferior (o superior), como si dichas limitaciones numéricas inferiores (o superiores) estuvieran expresamente escritas en este documento.
[0029] Tal como se utiliza aquí, el término "que comprende" y sus afines se utiliza en su sentido inclusivo (es decir, equivalente a la expresión "que incluye" y sus correspondientes cognados).
[0030] Tal como se utiliza aquí y en las reivindicaciones adjuntas, la singular “un”, “una”, “el” y “ella” incluyen la referencia plural a menos que el contexto claramente dicte otra cosa. Así, por ejemplo, la referencia a una "célula huésped" incluye una pluralidad de tales células huésped.
[0031] A menos que se indique lo contrario, los ácidos nucleicos se escriben de izquierda a derecha en 5' a 3' y secuencias de aminoácidos se escriben de izquierda a derecha en orientación de amino a carboxi, respectivamente.
[0032] Los encabezamientos proporcionados en este documento no son limitaciones de los diversos aspectos o realizaciones de la invención que se pueden tener mediante referencia a la especificación como un todo. Por consiguiente, los términos definidos a continuación se definen más completamente por referencia a la especificación en su conjunto.
[0033] "Cetoreductasa " y "KRED" se usan indistintamente en este documento para referirse a un polipéptido que tiene una capacidad enzimática de reducir un grupo carbonilo a su alcohol correspondiente. Más específicamente, los polipéptidos de cetoreductasa de la invención son capaces de reducir estereoselectivamente el compuesto de fórmula (I) al producto correspondiente de fórmula (II), como se muestra en el Esquema 1 (Ver Figura 1).
[0034] Como se usa en este documento, los términos "proteína", "polipéptido" y "péptido" se usan indistintamente en este documento para denotar un polímero de al menos dos aminoácidos unidos covalentemente mediante un enlace amida, independientemente de la longitud o modificación post-translacional (p. ej., glicosilación, fosforilación, lipidación, miristilación, ubiquitinación, etc.). Se incluyen dentro de esta definición los D- y L-aminoácidos, y las mezclas de D- y L-aminoácidos.
[0035] Como se usa en el presente documento, "polinucleótido" y "ácido nucleico' se refieren a dos o más nucleósidos que están vinculados covalentemente juntos. El polinucleótido puede ser ribonucleósidos compuestos totalmente (es decir, un ARN), enteramente compuestos de 2' desoxirribonucleótidos (es decir, un ADN) o mezclas de ribo- y desoxirribonucleósidos 2'. Aunque los nucleósidos típicamente se unirán entre sí mediante enlaces fosfodiéster estándar, los polinucleótidos pueden incluir uno o más enlaces no estándar. El polinucleótido puede ser monocatenario o bicatenario, o puede incluir tanto regiones monocatenarias como regiones bicatenarias. Además, aunque un polinucleótido estará compuesto típicamente por las nucleobases codificantes naturales (es decir, adenina, guanina, uracilo, timina y citosina), puede incluir una o más nucleobases modificadas y/o sintéticas (p. ej., inosina, xantina, hipoxantina, etc.). Preferiblemente, tales nucleobases modificadas o sintéticas serán nucleobases codificadoras.
[0036] Como se usa en este documento, "secuencia codificadora" se refiere a la porción de un ácido nucleico (p. ej., un gen) que codifica una secuencia de aminoácidos de una proteína.
[0037] Como se usa en este documento, "de origen natural" o "de tipo silvestre" se refiere a la forma encontrada en la naturaleza. Por ejemplo, un polipéptido o secuencia polinucleotídica de origen natural o natural es una secuencia presente en un organismo que puede aislarse de una fuente en la naturaleza y que no ha sido modificada intencionalmente por manipulación humana.
[0038] Como se usa en el presente documento, "no natural" o "diseñado" o "recombinante" cuando se utiliza en la presente descripción con referencia a (p. ej., una célula, ácido nucleico, o polipéptido), se refiere a un material, o un material correspondiente a la forma natural o nativa del material, que ha sido modificado de una manera que de otro modo no existiría en la naturaleza, o es idéntico al mismo pero producido o derivado de materiales sintéticos y/o por manipulación usando técnicas recombinantes. Ejemplos no limitantes incluyen, entre otros, las células recombinantes que expresan genes que no se encuentran dentro de la forma (no nativa recombinante) de la célula o expresan genes nativos que se expresan de otro modo a un nivel diferente.
[0039] Como se usa en este documento, "porcentaje de identidad de secuencia", "porcentaje de identidad", y "por ciento idéntico" se refieren a comparaciones entre secuencias de polinucleótidos o secuencias polipeptídicas, y se determinan comparando dos secuencias alineadas de manera óptima sobre una ventana de comparación, en donde la porción de la secuencia de polinucleótidos o polipéptidos en la ventana de comparación puede comprender adiciones o deleciones (es decir, espacios) en comparación con la secuencia de referencia para una alineación óptima de las dos secuencias. El porcentaje se calcula determinando el número de posiciones en las que se produce la base de ácido nucleico o el residuo de aminoácido idénticos en ambas secuencias o se alinea una base de ácido nucleico o un residuo de aminoácido con un espacio para producir el número de posiciones coincidentes, dividiendo el número de posiciones emparejadas por el número total de posiciones en la ventana de comparación y multiplicar el resultado por 100 para obtener el porcentaje de identidad de secuencia. La determinación del alineamiento óptimo y el porcentaje de identidad de secuencia se realiza utilizando los algoritmos BLAST y BLAST 2,0 (véase, por ejemplo, Altschul et al., J. Mol. Biol. 215: 403-410 [1990]; y Altschul et al., Nucleic Acids Res. 3389-3402 [1977]). El software para realizar análisis BLAST está disponible públicamente a través del sitio web del Centro Nacional de Información Biotecnológica.
[0040] En resumen, los análisis BLAST implican primero identificar pares de secuencias de alta puntuación (HSPs) mediante la identificación de breves palabras de longitud con la secuencia de referencia, que coinciden o satisfacen alguna puntuación T de umbral de valor positivo cuando se alinean con una palabra de la misma longitud en una secuencia de base de datos. Se hace referencia a T como el umbral de puntuación de palabras vecinas (Altschul et al, supra). Estos aciertos de palabras vecinas iniciales actúan como semillas para iniciar búsquedas para encontrar HSP más largos que las contengan. Los aciertos de palabras se extienden en ambas direcciones a lo largo de cada secuencia hasta donde se pueda aumentar la puntuación de alineación acumulativa. Las puntuaciones acumulativas se calculan utilizando, para las secuencias de nucleótidos, los parámetros M (puntuación de recompensa para un par de residuos coincidentes; siempre >0) y N (puntuación de penalización por residuos no coincidentes; siempre <0). Para las secuencias de aminoácidos, se usa una matriz de puntuación para calcular la puntuación acumulativa. La extensión de los aciertos de palabra en cada dirección se detiene cuando: la puntuación de alineación acumulativa cae en la cantidad X de su valor máximo alcanzado; la puntuación acumulada llega a cero o menos, debido a la acumulación de una o más alineaciones de residuos de puntuación negativa; o se llega al final de cualquiera de las secuencias. Los parámetros del algoritmo BLAST W, T y X determinan la sensibilidad y la velocidad de la alineación. El programa BLASTN (para secuencias de nucleótidos) utiliza por defecto una longitud de palabra (W) de 11, una expectativa (E) de 10, M = 5, N = -4 y una comparación de ambas cadenas. Para las secuencias de aminoácidos, el programa b La STP utiliza como valores predeterminados una longitud de palabra (W) de 3, una expectativa (E) de 10 y la matriz de puntuación BLOSUM62 (véase, por ejemplo, Henikoff y Henikoff, Proc Natl Acad Sci EE.UU. 89: 10915 [1989]).
[0041] Hay muchos otros algoritmos disponibles y conocidos en la técnica que funcionan de manera similar a BLAST al proporcionar un porcentaje de identidad para dos secuencias. La alineación óptima de secuencias para comparación se puede realizar utilizando cualquier método adecuado conocido en la técnica (p. ej., mediante el algoritmo de homología local de Smith y Waterman, Adv. Appl. Math. 2: 482 [1981]; mediante el algoritmo de alineación de homología de Needleman y Wunsch, J. Mol. Biol. 48: 443 [1970]; por el método de búsqueda de similitud de Pearson y Lipman, Proc. Natl. Acad. Sci. EE.UU. 85: 2444 [1988]; y/o por implementaciones computarizadas de estos algoritmos [GAP, BESTFIT, FASTA y TFASTA en el paquete de software GCG Wisconsin]), o mediante inspección visual, utilizando métodos comúnmente conocidos en la técnica. Además, la determinación del alineamiento de secuencia y el porcentaje de identidad de secuencia puede emplear los programas BESTFIT o GAP en el paquete de software GCG Wisconsin (Accelrys, Madison WI), usando los parámetros predeterminados proporcionados.
[0042] Como se usa en este documento, "secuencia de referencia" se refiere a una secuencia definida a la que se compara otra secuencia. Una secuencia de referencia puede ser un subconjunto de una secuencia más grande, por ejemplo, un segmento de una secuencia de genes o polipéptidos de longitud completa. Generalmente, una secuencia de referencia tiene al menos 20 residuos de nucleótidos o aminoácidos de longitud, al menos 25 residuos de longitud, al menos 50 residuos de longitud, o la longitud completa del ácido nucleico o polipéptido. Dado que dos polinucleótidos o polipéptidos pueden cada uno (1) comprender una secuencia (es decir, una parte de la secuencia completa) que es similar entre las dos secuencias, y (2) pueden comprender además una secuencia que es divergente entre las dos secuencias, comparaciones de secuencias entre dos (o más) polinucleótidos o polipéptidos se realizan típicamente comparando secuencias de los dos polinucleótidos en una ventana de comparación para identificar y comparar regiones locales de similitud de secuencia. El término "secuencia de referencia" no está destinado a limitarse a secuencias de tipo silvestre y puede incluir secuencias modificadas o alteradas. Por ejemplo, en algunas realizaciones, una "secuencia de referencia" puede ser una secuencia de aminoácidos alterada o modificada previamente.
[0043] Como se usa en este documento, "ventana de comparación" se refiere a un segmento conceptual de al menos aproximadamente 20 nucleótidos contiguos o aminoácidos en donde una secuencia puede compararse a una secuencia de referencia de al menos 20 nucleótidos contiguos o aminoácidos y en donde la porción de la secuencia en la ventana de comparación puede comprender adiciones o deleciones (es decir, espacios) del 20 por ciento o menos en comparación con la secuencia de referencia (que no comprende adiciones o deleciones) para un alineamiento óptimo de las dos secuencias. La ventana de comparación puede tener más de 20 residuos contiguos e incluye, opcionalmente, 30, 40, 50, 100 o ventanas más largas.
[0044] Como se usa en este documento, "correspondiente a", "referencia a" o "en relación con" cuando se usa en el contexto de la numeración de una determinada secuencia de aminoácidos o polinucleótido se refiere a la numeración de los residuos de una referencia especificada secuencia cuando la secuencia de aminoácidos o polinucleótidos dada se compara con la secuencia de referencia. En otras palabras, el número de residuo o la posición de residuo de un polímero dado se designa con respecto a la secuencia de referencia en lugar de mediante la posición numérica real del residuo dentro de la secuencia de aminoácidos o polinucleótidos dada. Por ejemplo, una secuencia de aminoácidos dada, como la de una cetoreductasa modificada, puede alinearse con una secuencia de referencia introduciendo espacios para optimizar las coincidencias de residuos entre las dos secuencias. En estos casos, aunque los huecos están presentes, la numeración del residuo en la secuencia de aminoácidos o polinucleótidos dada se realiza con respecto a la secuencia de referencia a la que se ha alineado. Como se usa en el presente documento, una referencia a una posición de residuo, tal como "Xn", como se describe adicionalmente a continuación, debe interpretarse como una referencia a "un residuo correspondiente a", a menos que se indique específicamente lo contrario. Por tanto, por ejemplo, "X94" se refiere a cualquier aminoácido en la posición 94 en una secuencia de polipéptidos (p. ej., SEQ ID NOS: 2, 4, 10, 26 o 42).
[0045] Como se usa en este documento, "estereoselectividad" se refiere a la formación preferencial en una reacción enzimática de la química o un estereoisómero sobre otro estereoisómero u otro conjunto de estereoisómeros. La estereoselectividad puede ser parcial, donde se favorece la formación de un estereoisómero sobre otro, o puede ser completa cuando se forma solo un estereoisómero. Cuando los estereoisómeros son enantiómeros, la estereoselectividad se denomina enantioselectividad, la fracción (normalmente expresada como porcentaje) de un enantiómero en la suma de ambos enantiómeros. Comúnmente se informa alternativamente en la técnica (típicamente como un porcentaje) como el exceso enantiomérico (ee) calculado a partir del mismo de acuerdo con la fórmula [enantiómero principal - enantiómero menor]/[enantiómero principal enantiómero menor]. Cuando los estereoisómeros son diastereoisómeros, la estereoselectividad se denomina diastereoselectividad, la fracción (normalmente expresada como un porcentaje) de un diastereoisómero en una mezcla de dos diastereoisómeros, comúnmente informada alternativamente como el exceso diastereomérico (d.e.). El exceso enantiomérico y el exceso diastereomérico son tipos de exceso estereomérico. También debe entenderse que la estereoselectividad no se limita a estereoisómeros individuales y puede describirse para conjuntos de estereoisómeros.
[0046] Como se usa en el presente documento, "altamente estereoselectivo" se refiere a una reacción química o enzimática que es capaz de convertir un sustrato para su producto alcohol quiral correspondiente, con al menos aproximadamente 75% de exceso estereomérico.
[0047] Como se usa en este documento, "aumento de la actividad enzimática" y "aumento de la actividad" se refieren a una propiedad mejorada de una enzima modificada, que puede ser representada por un aumento en la actividad específica (p. ej., producto producido/hora/peso de proteína) o un aumento en el porcentaje de conversión del sustrato en el producto (p. ej., porcentaje de conversión de la cantidad inicial de sustrato en producto en un período de tiempo especificado usando una cantidad específica de cetoreductasa) en comparación con una enzima de referencia. En los Ejemplos se proporcionan métodos ejemplares para determinar la actividad enzimática. Cualquier propiedad relacionada con la actividad enzimática puede verse afectada, incluidas las propiedades enzimáticas clásicas de Km, Vmax o kcat, cuyos cambios pueden conducir a un aumento de la actividad enzimática. La actividad de la cetoreductasa se puede medir mediante cualquiera de los ensayos estándar utilizados para medir las cetoreductasas, como el cambio en la concentración de sustrato o producto, o el cambio en la concentración del cofactor (en ausencia de un sistema de regeneración de cofactor). Las comparaciones de las actividades enzimáticas se realizan usando una preparación definida de enzima, un ensayo definido en una condición establecida y uno o más sustratos definidos, como se describe con más detalle en este documento. Generalmente, cuando se comparan las enzimas en los lisados celulares, se determina el número de células y la cantidad de proteína analizada, así como el uso de sistemas de expresión idénticos y células hospedadoras idénticas para minimizar las variaciones en la cantidad de enzima producida por las células hospedadoras y presentes en los lisados.
[0048] Como se usa en el presente documento, "conversión" se refiere a la transformación enzimática de un sustrato en el producto correspondiente.
[0049] Como se usa en este documento, "por ciento de conversión" se refiere al porcentaje del sustrato que se convierte en el producto dentro de un período de tiempo en condiciones especificadas. Así, por ejemplo, la "actividad enzimática" o "actividad" de un polipéptido de cetoreductasa se puede expresar como "conversión porcentual" del sustrato en el producto.
[0050] Como se usa en este documento, "termoestable" o "estable térmicamente" se usan indistintamente para referirse a un polipéptido que es resistente a la inactivación cuando se expone a un conjunto de condiciones de temperatura (p. ej., 40-80°C) durante un período de tiempo (p. ej., 0,5-24 horas) en comparación con la enzima no tratada, reteniendo así un cierto nivel de actividad residual (p. ej., más del 60% al 80%, por ejemplo) después de la exposición a temperaturas elevadas.
[0051] Como se usa en la presente memoria, "estable de disolvente" se refiere a la capacidad de un polipéptido para mantener la actividad similar (p. ej., más de por ejemplo, 60% a 80%) después de la exposición a concentraciones variables (p. ej., 5-99%) de disolvente (p. ej., alcohol isopropílico, tetrahidrofurano, 2-metiltetrahidrofurano, acetona, tolueno, acetato de butilo, metilo terc-butiléter, etc.) durante un período de tiempo (p. ej., de 0,5 a 24 horas) en comparación con la enzima sin tratar.
[0052] Como se usa en este documento, "diferencia de aminoácido" o "diferencia de residuo" se refiere a una diferencia en el resto de aminoácido en una posición de una secuencia de polipéptido en relación con el residuo de aminoácido en una posición correspondiente en una referencia de secuencia. Las posiciones de las diferencias de aminoácidos generalmente se denominan aquí como "Xn", donde n se refiere a la posición correspondiente en la secuencia de referencia en donde se basa la diferencia de residuos. Por ejemplo, una "diferencia de residuo en la posición X40 en comparación con SEQ ID NO:2" se refiere a una diferencia del residuo de aminoácido en la posición del polipéptido correspondiente a la posición 40 de SEQ ID NO:2. Por tanto, si el polipéptido de referencia de SEQ ID NO:2 tiene una histidina en la posición 40, entonces una "diferencia de residuo en la posición X40 en comparación con SEQ ID NO:2" se refiere a una sustitución de aminoácido de cualquier residuo distinto de histidina en la posición del polipéptido correspondiente a la posición 40 de SEQ ID NO:2. En la mayoría de los casos en este documento, la diferencia de residuos de aminoácidos específicos en una posición se indica como "XnY" donde "Xn" especificó la posición correspondiente como se describe anteriormente, e "Y" es el identificador de una sola letra del aminoácido que se encuentra en el polipéptido modificado (es decir, el residuo diferente al del polipéptido de referencia). En algunos casos, la presente divulgación también proporciona diferencias de aminoácidos específicas indicadas por la notación convencional "AnB", donde A es el identificador de letras del residuo en la secuencia de referencia, "n" es el número de la posición del residuo en la secuencia de referencia, y B es el identificador de una sola letra de la sustitución del residuo en la secuencia del polipéptido manipulado. En algunos casos, un polipéptido de la presente divulgación puede incluir una o más diferencias de residuos de aminoácidos con respecto a una secuencia de referencia, que se indica mediante una lista de las posiciones especificadas donde están presentes diferencias de residuos con respecto a la secuencia de referencia. En algunas realizaciones, donde se puede usar más de un aminoácido en una posición de residuo específico de un polipéptido, los diversos residuos de aminoácidos que se pueden usar están separados por un "/" (p. ej., X192A/G). La presente divulgación incluye secuencias polipeptídicas manipuladas que comprenden una o más diferencias de aminoácidos que incluyen sustituciones de aminoácidos tanto conservativas como no conservadoras. Las secuencias de aminoácidos de los polipéptidos de anhidrasa carbónica recombinantes específicos incluidos en el Listado de Secuencias de la presente divulgación incluyen un residuo de metionina (M) de inicio (es decir, M representa la posición del residuo 1). El experto en la materia, sin embargo, comprende que este residuo de metionina iniciadora puede eliminarse mediante maquinaria de procesamiento biológico, como en una célula huésped o un sistema de traducción in vitro, para generar una proteína madura que carece del residuo de metionina iniciadora, pero que por lo demás conserva las propiedades de la enzima. En consecuencia, el término "diferencia de residuos de aminoácidos con respecto a SEQ ID NO:2 en la posición Xn", como se usa en este documento, puede referirse a la posición "Xn" o a la posición correspondiente (p. ej., posición (X-1)n) en una secuencia de referencia. que se ha procesado para carecer de la metionina de partida.
[0053] Como se usa en este documento, la frase "sustituciones conservadoras de aminoácidos" se refiere a la intercambiabilidad de residuos que tienen cadenas laterales similares, y por lo tanto típicamente implican la sustitución del aminoácido en el polipéptido con aminoácidos dentro de la misma o similar clase definida de aminoácidos. A modo de ejemplo y no de limitación, en algunas realizaciones, un aminoácido con una cadena lateral alifática se sustituye por otro aminoácido alifático (p. ej., alanina, valina, leucina e isoleucina); un aminoácido con una cadena lateral hidroxilo está sustituido con otro aminoácido con una cadena lateral hidroxilo (p. ej., serina y treonina); un aminoácido que tiene cadenas laterales aromáticas está sustituido con otro aminoácido que tiene una cadena lateral aromática (p. ej., fenilalanina, tirosina, triptófano e histidina); un aminoácido con una cadena lateral básica se sustituye por otro aminoácido con una cadena lateral básica (p. ej., lisina y arginina); un aminoácido con una cadena lateral ácida se sustituye por otro aminoácido con una cadena lateral ácida (p. ej., ácido aspártico o ácido glutámico); y/o un aminoácido hidrófobo o hidrófilo se reemplaza por otro aminoácido hidrófobo o hidrófilo, respectivamente. En la Tabla 1 se proporcionan ejemplos de sustituciones conservadoras.
Figure imgf000010_0001
[0054] Como se usa en este documento, la frase "sustitución no conservadora" se refiere a la sustitución de un aminoácido en el polipéptido por un aminoácido con propiedades de cadena lateral significativamente diferentes. Las sustituciones no conservadoras pueden usar aminoácidos entre, en lugar de dentro, los grupos definidos y afectan (a) la estructura de la cadena principal del péptido en el área de la sustitución (p. ej., prolina por glicina) (b) la carga o hidrofobicidad, o (c) la mayor parte de la cadena lateral. A modo de ejemplo y no de limitación, una sustitución no conservadora ejemplar puede ser un aminoácido ácido sustituido con un aminoácido básico o alifático; un aminoácido aromático sustituido por un pequeño aminoácido; y un aminoácido hidrófilo sustituido con un aminoácido hidrófobo.
[0055] Como se usa en este documento, "supresión" se refiere a la modificación del polipéptido mediante la eliminación de uno o más aminoácidos de polipéptido de referencia. Las deleciones pueden comprender la eliminación de 1 o más aminoácidos, 2 o más aminoácidos, 5 o más aminoácidos, 10 o más aminoácidos, 15 o más aminoácidos, o 20 o más aminoácidos, hasta el 10% del número total de aminoácidos, o hasta el 20% del número total de aminoácidos que componen el polipéptido mientras se retiene la actividad enzimática y/o se conservan las propiedades mejoradas de una enzima manipulada. Las deleciones pueden dirigirse a las porciones internas y/o porciones terminales del polipéptido. En diversas realizaciones, la deleción puede comprender un segmento continuo o puede ser discontinua.
[0056] Como se usa en este documento, "inserción" se refiere a la modificación del polipéptido mediante la adición de uno o más aminoácidos al polipéptido de referencia. En algunas realizaciones, las enzimas de cetoreductasa modificadas mejoradas comprenden inserciones de uno o más aminoácidos en el polipéptido de cetoreductasa natural, así como inserciones de uno o más aminoácidos en polipéptidos de cetoreductasa modificados genéticamente. Las inserciones pueden estar en las porciones internas del polipéptido o en el extremo carboxi o amino. Las inserciones, como se usa en este documento, incluyen proteínas de fusión como se conoce en la técnica. La inserción puede ser un segmento contiguo de aminoácidos o estar separada por uno o más de los aminoácidos del polipéptido de origen natural.
[0057] El término "conjunto de sustitución de aminoácidos" o "conjunto de sustitución" se refiere a un grupo de sustituciones de aminoácidos en una secuencia de polipéptido, en comparación con una secuencia de referencia. Un conjunto de sustitución puede tener 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15 o más sustituciones de aminoácidos. En algunas realizaciones, un conjunto de sustituciones se refiere al conjunto de sustituciones de aminoácidos que está presente en cualquiera de las variantes de KRED enumeradas en las Tablas proporcionadas en los Ejemplos.
[0058] Como se usa en el presente documento, "fragmento" se refiere a un polipéptido que tiene una deleción de amino-terminal o carboxi-terminal, pero donde la secuencia de aminoácidos restante es idéntica a las posiciones correspondientes en la secuencia. Los fragmentos pueden tener típicamente alrededor del 80%, alrededor del 90%, alrededor del 95%, alrededor del 98% o aproximadamente 99% del polipéptido de cetoreductasa de longitud completa, por ejemplo, el polipéptido de SEQ ID NO:4. En algunas realizaciones, el fragmento es "biológicamente activo" (es decir, exhibe la misma actividad enzimática que la secuencia de longitud completa).
[0059] Como se usa en este documento, "polipéptido aislado" se refiere a un polipéptido que está sustancialmente separado de otros contaminantes que acompañan de forma natural, por ejemplo, proteínas, lípidos, y polinucleótidos. El término abarca polipéptidos que se han eliminado o purificado de su entorno natural o sistema de expresión (p. ej., célula huésped o síntesis in vitro). Las enzimas de cetoreductasa mejoradas pueden estar presentes dentro de una célula, presentes en el medio celular o preparadas en diversas formas, tales como lisados o preparaciones aisladas. Como tal, en algunas realizaciones, los polipéptidos de cetoreductasa modificados genéticamente de la presente divulgación pueden ser un polipéptido aislado.
[0060] Como se usa en este documento, "polipéptido sustancialmente puro" se refiere a una composición en donde la especie de polipéptido es la especie predominante presente (es decir, sobre una base molar o en peso, es más abundante que cualesquiera otras especies macromoleculares individuales en la composición), y es generalmente una composición sustancialmente purificada cuando la especie diana comprende al menos aproximadamente el 50 por ciento de las especies macromoleculares presentes en moles o % en peso. Generalmente, una composición de polipéptido de cetoreductasa modificada sustancialmente pura comprenderá aproximadamente el 60% o más, aproximadamente el 70% o más, aproximadamente el 80% o más, aproximadamente el 90% o más, aproximadamente el 91% o más, aproximadamente el 92% o más, aproximadamente el 93% o más, aproximadamente el 94% o más, aproximadamente el 95% o más, aproximadamente el 96% o más, aproximadamente el 97% o más, aproximadamente el 98% o más, o aproximadamente el 99% de todas las especies macromoleculares por mol o % en peso presente en la composición. Las especies solventes, moléculas pequeñas (<500 Daltons) y especies de iones elementales no se consideran especies macromoleculares. En algunas realizaciones, el polipéptido de cetoreductasa mejorado aislado es una composición de polipéptido sustancialmente pura.
[0061] Como se usa en este documento, cuando se usa con referencia a un ácido nucleico o polipéptido, el término "heterólogo" se refiere a una secuencia que no está normalmente expresada y secretada por un organismo (p. ej., un organismo de tipo silvestre). En algunas realizaciones, el término abarca una secuencia que comprende dos o más subsecuencias que no se encuentran en la misma relación entre sí como se encuentra normalmente en la naturaleza, o se modifica de manera recombinante para que su nivel de expresión o relación física con otros ácidos nucleicos u otras moléculas en una célula, o estructura, normalmente no se encuentran en la naturaleza. Por ejemplo, un ácido nucleico heterólogo se produce típicamente de forma recombinante, con dos o más secuencias de genes no relacionados dispuestos de una manera que no se encuentra en la naturaleza (p. ej., un marco de lectura abierto de ácido nucleico (ORF) de la invención unido operativamente a una secuencia promotora insertado en un casete de expresión, como un vector). En algunas realizaciones, "polinucleótido heterólogo" se refiere a cualquier polinucleótido que se introduce en una célula huésped mediante técnicas de laboratorio e incluye polinucleótidos que se eliminan de una célula huésped, se someten a manipulación de laboratorio y luego se reintroducen en una célula huésped.
[0062] Como se usa en este documento, "codón optimizado" se refiere a cambios en los codones del polinucleótido que codifica una proteína para los que se utilizan preferentemente en un organismo particular de tal manera que la proteína codificada se expresa de manera eficiente en el organismo de interés. En algunas realizaciones, los polinucleótidos que codifican las enzimas de cetoreductasa pueden tener un codón optimizado para una producción óptima del organismo huésped seleccionado para la expresión.
[0063] Como se usa en este documento, "secuencia de control" se define en este documento para incluir todos los componentes, que son necesarios o ventajosos para la expresión de un polinucleótido y/o polipéptido de la presente divulgación. Cada secuencia de control puede ser nativa o extraña al polinucleótido de interés. Dichas secuencias de control incluyen, pero no se limitan a, una secuencia líder, de poliadenilación, secuencia de propéptido, promotor, secuencia de péptido señal y terminador de la transcripción.
[0064] Como se usa en el presente documento, "unido operativamente" se define aquí como una configuración en donde está apropiadamente una secuencia de control colocada (es decir, en una relación funcional) en una posición relativa a un polinucleótido de interés de tal manera que la secuencia de control dirige o regula la expresión del polinucleótido y/o polipéptido de interés.
[0065] Como se usa en el presente documento, las frases "sistema de regeneración de cofactor" y "sistema de cofactor de reciclaje" se refieren a un conjunto de reactivos que participan en una reacción que reduce la forma oxidada del cofactor (p. ej., NADP+ a NADPH). Los cofactores oxidados por la reducción del ceto sustrato catalizada por la cetoreductasa son regenerados en forma reducida por el sistema de regeneración de cofactores. Los sistemas de regeneración de cofactor comprenden un reductor estequiométrico que es una fuente de reducción de equivalentes de hidrógeno y es capaz de reducir la forma oxidada del cofactor. El sistema de regeneración de cofactor 11 puede comprender además un catalizador, p. ej. un catalizador enzimático que cataliza la reducción de la forma oxidada del cofactor por el reductor. Los sistemas de regeneración de cofactores para regenerar NADH o NADPH a partir de NAD o NADP+, respectivamente, son conocidos en la técnica y pueden usarse en los métodos descritos en el presente documento.
[0066] Como se usa en este documento, "deshidrogenasa de alcohol secundaria" se usa aquí para referirse a un NAD o NADP+ dependiente de enzima que cataliza la conversión de un alcohol secundario (p. ej., alcohol isopropílico) y NAD+ o NADP+ a una cetona y NADH o NADPH, respectivamente.
[0067] Como se usa en el presente documento, "condiciones de reacción adecuadas" se refieren a aquellas condiciones en la solución de reacción biocatalítica (p. ej., los rangos de la enzima de carga, la carga del sustrato, cofactor de carga, temperatura, pH, tampones, codisolventes, etc.) en donde un polipéptido de cetoreductasa de la presente divulgación es capaz de convertir un compuesto sustrato en un compuesto producto (p. ej., conversión del compuesto (1) en el compuesto (2a)). En la presente descripción se proporcionan ejemplos de "condiciones de reacción adecuadas" y se ilustran mediante los Ejemplos.
[0068] Como se usa en este documento, "carga", como en "carga de compuesto", "carga enzimática," o "carga de cofactor" se refiere a la concentración o cantidad de un componente en una mezcla de reacción al comienzo de la reacción.
[0069] Como se usa en la presente memoria, "sustrato" en el contexto de un proceso biocatalizador mediado se refiere al compuesto o molécula sobre la que actúa el biocatalizador. Por ejemplo, un sustrato ejemplar para el biocatalizador de cetoreductasa en el proceso descrito en este documento es el compuesto (1).
[0070] Como se usa en este documento, "producto" en el contexto de un proceso biocatalizador mediado se refiere al compuesto o molécula resultante de la acción del biocatalizador. Por ejemplo, un producto ejemplar para el biocatalizador de cetoreductasa en el proceso descrito en este documento es el compuesto (2a).
[0071] Como se usa en este documento, "equilibrado" como se usa en el presente documento se refiere al proceso que resulta en una concentración en estado estacionario de especies químicas en una reacción química o enzimática (p. ej., la interconversión de las dos especies A y B), incluyendo la interconversión de estereoisómeros, determinada por la constante de velocidad directa y la constante de velocidad inversa de la reacción química o enzimática.
[0072] Como se usa en este documento, "alquilo” se refiere a grupos hidrocarbonados saturados de 1 a 18 átomos de carbono inclusive, ya sea de cadena lineal o ramificada, más preferiblemente de 1 a 8 átomos de carbono inclusive, y más preferiblemente de 1 a 6 átomos de carbono inclusive. Un alquilo con un número especificado de átomos de carbono se indica entre paréntesis, por ejemplo, (C1-C4)alquilo se refiere a un alquilo de 1 a 4 átomos de carbono.
[0073] Como se usa en el presente documento, "alquenilo" se refiere a grupos de 2 a 12 átomos de carbono inclusive, ya sea lineales o ramificados que contienen al menos un doble enlace, pero que contienen opcionalmente más de un doble enlace.
[0074] Como se usa en el presente documento, "alquinilo" se refiere a grupos de 2 a 12 átomos de carbono inclusive, ya sea lineales o ramificados que contienen al menos un triple enlace, pero que opcionalmente contienen más de un enlace triple, y, además, que contienen opcionalmente uno o más resstos de doble enlace.
[0075] Como se usa en el presente documento, “heteroalquenilo”, "heteroalquilo '' y heteroalquinilo," se refieren a alquilo, alquenilo y alquinilo como se han definido en el presente documento en donde uno o más de los átomos de carbono están sustituidos cada uno independientemente con los mismos o diferentes heteroátomos o grupos heteroatómicos. Los heteroátomos y/o grupos heteroatómicos que pueden reemplazar los átomos de carbono incluyen, pero no se limitan a, -O-, -S-, -SO-, -NRa-, - PH-, -S(O)-, -S(O)2-, -S(o ) NRa-, -S(O)2NRa- y similares, incluyendo combinaciones de los mismos, donde cada Ra se selecciona independientemente de hidrógeno, alquilo, heteroalquilo, cicloalquilo, heterocicloalquilo, arilo y heteroarilo.
[0076] Como se usa en este documento, "alcoxi" se refiere al grupo -ORP en donde Rp es un grupo alquilo es como se define anteriormente, incluyendo opcionalmente grupos de alquilo sustituidos como también se define aquí.
[0077] Como se usa en este documento, "arilo" se refiere a un grupo carbocíclico aromático insaturado de 6 a 12 átomos de carbono inclusive tiene un solo anillo (p. ej., fenilo) o múltiples anillos condensados (p. ej., naftilo o antrilo). Los arilos ejemplares incluyen fenilo, piridilo, naftilo y similares.
[0078] Como se usa en este documento, "amino" se refiere al grupo -NH2. Amino sustituido se refiere al grupo - NHR6, NR6R6 y NR6R6R6, donde cada R6 se selecciona independientemente de alquilo, cicloalquilo, cicloheteroalquilo, alcoxi, arilo, heteroarilo, heteroarilalquilo, acilo, alcoxicarbonilo, sulfanilo, sulfinilo, sulfonilo y similares sustituidos o no sustituidos. Los grupos amino típicos incluyen, pero se limitan a, dimetilamino, dietilamino, trimetilamonio, trietilamonio, metilisulfonilamino, furanilo-oxi-sulfamino y similares.
[0079] Como se usa en este documento, "oxo" se refiere a = O.
[0080] Como se usa en este documento, "oxi" se refiere a un grupo divalente -O-, que puede tener diversos sustituyentes para formar diferentes oxi grupos, incluyendo éteres y ésteres.
[0081] Como se usa en este documento, "carboxi" se refiere a -COOH.
[0082] Como se usa en el presente documento, "carbonilo" se refiere a -C(O)-, que puede tener una variedad de sustituyentes para formar diferentes grupos de carbonilo incluyendo ácidos, haluros de ácido, aldehídos, amidas, ésteres y cetonas.
[0083] Como se usa en este documento, "alquilo xicarbonilo" se refiere a -C(O)ORE, donde RE es un grupo alquilo tal como se define en el presente documento, que puede estar opcionalmente sustituido.
[0084] Como se usa en este documento, "aminocarbonilo" se refiere a -C(O)NH2. Aminocarbonilo sustituido se refiere a -C(O)NR6R6, donde el grupo amino NR6R6 es como se define aquí.
[0085] Como se usa en este documento, "halógeno" y "halo" se refieren a fluoro, cloro, bromo y yodo.
[0086] Como se usa en este documento, "hidroxi" se refiere a -OH.
[0087] Como se usa en este documento, "ciano" se refiere a -CN.
[0088] Como se usa en este documento, "heteroarilo" se refiere a un grupo heterocíclico aromático de 1 a 10 átomos de carbono inclusive y de 1 a 4 heteroátomos inclusive seleccionados de oxígeno, nitrógeno y azufre dentro del anillo. Dichos grupos heteroarilo pueden tener un solo anillo (p. ej., piridilo o furilo) o múltiples anillos condensados (p. ej., indolizinilo o benzotienilo).
[0089] Como se usa en este documento, "heteroarilalquilo” se refiere a un alquilo sustituido con un heteroarilo (es decir, grupos heteroarilo-alquilo), preferiblemente que tiene de 1 a 6 átomos de carbono inclusive en el resto alquilo y de 5 a 12 átomos en el anillo inclusive en el resto heteroarilo. Ejemplos de tales grupos heteroarilalquilo son piridilmetilo y similares.
[0090] Como se usa en este documento, "heteroarilalquenilo" se refiere a un alquenilo sustituido con un heteroarilo (es decir, grupos de heteroarilo-alquenilo), preferiblemente que tiene de 2 a 6 átomos de carbono inclusive en el radical alquenilo y de 5 a 12 átomos en el anillo inclusive en el resto de heteroarilo.
[0091] Como se usa en este documento, "heteroarilalquinilo" se refiere a un alquinilo sustituido con un heteroarilo (es decir, grupos de heteroarilo-alquenilo), preferiblemente que tiene de 2 a 6 átomos de carbono inclusive en el radical alquinilo y de 5 a 12 átomos en el anillo inclusive en el resto de heteroarilo.
[0092] Como se usa en este documento, "heterociclo", "heterocíclico", y de manera intercambiable "heterocicloalquilo” se refiere a un grupo saturado o insaturado que tiene un solo anillo o múltiples anillos condensados, de 2 a 10 átomos de anillo de carbono inclusive y de 1 a 4 átomos de heteroanillo seleccionados inclusive de nitrógeno, azufre u oxígeno dentro del anillo. Dichos grupos heterocíclicos pueden tener un solo anillo (p. ej., piperidinilo o tetrahidrofurilo) o múltiples anillos condensados (p. ej., indolinilo, dihidrobenzofurano o quinuclidinilo). Los ejemplos de heterociclos incluyen, pero no se limitan a, furano, tiofeno, tiazol, oxazol, pirrolo, imidazol, pirazol, piridina, pirazina, pirimidina, piridazina, indolizina, isoindol, indol, indazol, purina, quinolizina, isoaquinolina, quinolina, ftalazolina, naftilpiridina, quinoxalina, quinazolina, cinolina, pteridina, carbazol, carbolina, fenantridina, acridina, fenantrolina, isotiazol, fenazina, isoxazol, fenoxazina, fenotiazina, imidazolidina, imidazolina, piperidina, piperazina, pirrolidina, indolina y similares.
[0093] Como se usa en el presente documento, "anillo con miembros" está destinado a abarcar cualquier estructura cíclica. El número que precede al término "miembro" denota el número de átomos esqueléticos que constituyen el anillo. Así, por ejemplo, ciclohexilo, piridina, pirano y tiopirano son anillos de 6 miembros y ciclopentilo, pirrolo, furano y tiofeno son anillos de 5 miembros.
[0094] A menos que se especifique lo contrario, las posiciones ocupadas por hidrógeno en los grupos anteriores pueden estar sustituidas adicionalmente con sustituyentes ejemplificados por, pero no limitados a, hidroxi, oxo, nitro, metoxi, etoxi, alcoxi, alcoxi sustituido, trifluorometoxi, haloalcoxi, fluoro, cloro, bromo, yodo, halo, metilo, etilo, propilo, butilo, alquilo, alquenilo, alquinilo, alquilo sustituido, trifluorometilo, haloalquilo, hidroxialquilo, alcoxialquilo, tio, alquiltio, acilo, carboxi, alcoxicarbonilo, carboxamido, carboxamido sustituido, alquilsulfonilo, alquilsulfinilo, alquilsulfonilamino, sulfonamido, sulfonamido sustituido, ciano, amino, amino sustituido, alquilamino, dialquilamino, aminoalquilo, acilamino, amidino, amidoximo, hidroxamoilo, fenilo, arilo, arilo sustituido, ariloxi, arilalquilo, arilalquenilo, arilalquinilo, piridilo, imidazolilo, heteroarilo, heteroarilo sustituido, heteroariloxi, heteroarilalquilo, heteroarilalquenilo, heteroarilalquinilo, ciclopropilo, ciclobutilo, ciclopentilo, ciclohexilo, cicloalquilo, cicloalquenilo, cicloalquilalquilo, cicloalquilo sustituido, cicloalquiloxi, pirrolidinilo, piperidinilo, morfolino, heterociclo, (heterociclo)oxi y (heterociclo)alquilo; y los heteroátomos preferidos son oxígeno, nitrógeno y azufre. Se entiende que cuando existen valencias abiertas en estos sustituyentes, pueden sustituirse adicionalmente con grupos alquilo, cicloalquilo, arilo, heteroarilo y/o heterociclo, que cuando estas valencias abiertas existen en el carbono, pueden sustituirse adicionalmente por halógeno y por oxígeno, sustituyentes unidos por enlaces de nitrógeno o azufre, y cuando existen múltiples valencias abiertas de este tipo, estos grupos pueden unirse para formar un anillo, ya sea mediante la formación directa de un enlace o mediante la formación de enlaces a un nuevo heteroátomo, preferiblemente oxígeno, nitrógeno, o azufre. Se entiende además que se pueden realizar las sustituciones anteriores siempre que la sustitución del hidrógeno por el sustituyente no introduzca una inestabilidad inaceptable en las moléculas de la presente invención y, por lo demás, sea químicamente razonable.
[0095] Como se usa en el presente documento, "opcional" y "opcionalmente" significa que el evento o circunstancia descrita posteriormente puede o no ocurrir, y que la descripción incluye casos en los que ocurre el evento o circunstancia en que no lo hace. Un experto en la técnica entendería que con respecto a cualquier molécula descrita que contiene uno o más sustituyentes opcionales, sólo se pretende incluir compuestos estéricamente prácticos y/o sintéticamente viables.
[0096] Como se usa en el presente documento, "opcionalmente sustituido" se refiere a todos los modificadores posteriores en un término o una serie de grupos químicos. Por ejemplo, en el término "arilalquilo opcionalmente sustituido", la porción "alquilo” y la porción "arilo" de la molécula pueden estar o no sustituidas, y para la serie "alquilo, cicloalquilo, arilo y heteroarilo opcionalmente sustituidos", el grupo alquilo, cicloalquilo, arilo, y grupos heteroarilo, independientemente de los otros, pueden ser o no ser sustituidos.
[0097] Como se usa en este documento, "grupo protector" se refiere a un grupo de átomos que enmascaran, reducen o previenen la reactividad del grupo funcional cuando se une a un grupo funcional reactivo en una molécula. Normalmente, un grupo protector puede eliminarse selectivamente según se desee durante el curso de una síntesis. Los ejemplos de grupos protectores son bien conocidos en la técnica. Los grupos funcionales que pueden tener un grupo protector incluyen, pero no se limitan a, grupos hidroxi, amino y carboxi. Los grupos protectores de amino representativos incluyen, pero no se limitan a, formilo, acetilo, trifluoroacetilo, bencilo, benciloxicarbonilo ("CBZ"), tercbutoxicarbonilo ("Boc"), trimetilsililo ("TMS"), 2-trimetilsililo-etanosulfonilo ("SES"), grupos tritilo y tritilo sustituido, aliloxicarbonilo, 9-fluorenilmetiloxicarbonilo ("FMOC"), nitro-veratriloxicarbonilo ("NVOC") y similares. Los grupos protectores de hidroxilo representativos incluyen, pero no se limitan a, aquellos en los que el grupo hidroxilo está acilado (p. ej., ésteres metílicos y etílicos, grupos acetato o propionato o ésteres glicólicos) o alquilado como éteres bencilo y tritílico, así como éteres alquilo., éteres de tetrahidropiranilo, éteres de trialquilsililo (p. ej., grupos TMS o TIPPS) y éteres alílicos. Se pueden encontrar otros grupos protectores en las referencias aquí indicadas.
Polipéptidos de cetoreductasa modificados
[0098] Biocatalizadores de cetoreductasa (KRED) o carbonilo reductasa (CE 1,1,1,184) son útiles para la síntesis de alcoholes a partir de aldehídos y cetonas, y alcoholes secundarios ópticamente activos a partir de los correspondientes sustratos de cetonas prostereoisoméricas. Los KRED también pueden catalizar la reacción inversa (es decir, la oxidación de un sustrato de alcohol al producto de aldehídos/cetona correspondiente). La reducción de aldehídos y cetonas y la oxidación de alcoholes por KREDs utiliza un cofactor, más comúnmente dinucleótido de nicotinamida adenina reducido (NADH) o fosfato de dinucleótido de nicotinamida adenina reducido (NADPH) y dinucleótido de nicotinamida adenina (NAD) o fosfato de dinucleótido de adenina de nicotinamida (NADP+) para la reacción de oxidación. NADH y NADPH sirven como donantes de electrones, mientras que NAD+ y NADP+ sirven como aceptores de electrones.
[0099] Los KRED se pueden encontrar en una amplia gama de bacterias y levaduras, como se conoce en la técnica (véase, por ejemplo, Hummel y Kula Eur. J. Biochem., 184: 1-13 [1989]). Se han informado numerosos genes KRED y secuencias de enzimas, incluidos los de Candida magnoliae (Genbank Acc. N° JC7338; GI: 11360538); Candida parapsilosis (Genbank Acc. N° BAA24528,1; GI: 2815409), Sporobolomyces salmonicolor (Genbank Acc. N° AF160799; GI: 6539734), Lactobacillus kéfir (Genbank Acc. N° AAP94029,1; GI: 33112056), Lactobacillus brevis (Genbank Acc. N° 1NXQ_A; GI: 30749782), y Thermoanaerobium brockii (Genbank Acc. N° P14941; GI: 1771790).
[0100] La estereoselectividad de cetoreductasas se ha aplicado a la preparación de importantes bloques de construcción farmacéuticos (véase por ejemplo, Broussy et al, Org Lett., 11: 305-308 [2009]). Se han demostrado aplicaciones específicas de KRED de origen natural o de ingeniería en procesos biocatalíticos para generar compuestos químicos útiles para la reducción de ésteres de 4-cloroacetoacetato (véase, por ejemplo, Zhou, J. Am. Chem. Soc., 105: 5925-5926 [1983]); Santaniello, J. Chem. Res., (S)132-133 [1984]; Patentes de EE.UU. Nos 5,559,030; Patente de EE.UU. N° 5,700,670; y Patente de EE.UU. N° 5,891,685), reducción de ácidos dioxocarboxílicos (Ver, por ejemplo, Patente de EE.UU. N° 6,399,339), reducción de (S)-cloro-5-hidroxi-3-oxohexanoato de terc-butilo (Ver, por ejemplo, Patente de EE.UU. N° 6,645,746; y WO 01/40450), compuestos de reducción basados en pirrolotriazina (Ver, por ejemplo, Publicación de Solicitud de EE.UU. N° 2006/0286646); reducción de acetofenonas sustituidas (véanse, por ejemplo, las Patentes de EE.UU. Nos 6,800,477 y 8,748,143); y reducción de cetotiolanos (WO 2005/054491).
[0101] La presente invención proporciona cetoreductasas capaces de utilizar el compuesto sustrato (1) diseñado, tercbutilo 2-(3-cloro-7-oxo-6,7-dihidro-5H-ciclopenta[clpiridina-6-ilo)acetato, como sustrato para la síntesis del producto (2), terc-butilo 2-((65,7 5)-3-cloro-7-hidroxi-6,7-dihidro-5H-ciclopenta[c]piridina-6-ilo)acetato, o los análogos estructurales correspondientes, como se muestra en la siguiente reacción y en la Figura 1.
Figure imgf000014_0001
La presente divulgación proporciona además enzimas de cetoreductasa mejoradas y métodos para usar las enzimas de cetoreductasa modificadas genéticamente para sintetizar compuestos quirales.
[0102] El compuesto (1) tiene un centro quiral y puede existir en dos formas diastereoisómeras diferentes (1a y 1b).
El proceso de epimerización ocurre espontáneamente a temperatura ambiente y en condiciones neutrales a básicas. En consecuencia, la reacción de la cetoreductasa puede dar como resultado al menos cuatro productos estereoméricos diferentes (2a-2d), como se muestra en la Figura 2 y a continuación.
Figure imgf000015_0001
Sin embargo, (2a) es el único producto deseado entre los cuatro estereoisómeros. El programa de evolución utilizado en el desarrollo de la presente invención se diseñó para mejorar la selectividad de la cetoreductasa para el uso del sustrato (1) al producto (2a) con una cantidad mínima de otros productos secundarios (2b-2d). Además, las variantes enzimáticas se evaluaron con respecto a su actividad y estabilidad.
[0103] El polipéptido de cetoreductasa de la SEQ ID NO:4 se seleccionó como la columna vertebral inicial para el desarrollo de las enzimas mejoradas proporcionadas por la presente invención. Esta enzima se eligió como la columna vertebral de partida ya que solo se produjeron dos productos (2a y 2c) cuando se usó en la reacción; no se observó formación de los otros dos productos (2b y 2d), a diferencia de los productos de reacción producidos usando la enzima variante a (SEQ ID NO:4). Como resultado, los valores de selectividad obtenidos en el cribado de alto rendimiento se calculan aquí por exceso diastereomérico (d.e.), de acuerdo con la ecuación (1), o por la relación diastereomérica (d.r.), que se calcula de acuerdo con la ecuación (2), los cuales se proporcionan a continuación. Debido a la variabilidad de las mediciones d.e. y d.r. a lo largo del tiempo, las mejoras de la selectividad se informan como la mejora en veces de d.r. sobre la enzima variante (SEQ ID NO:4)
(1) [(2a cantidad) -(2c cantidad)] / [(2a cantidad) (2c cantidad)]
(2) (2a cantidad) / (2c cantidad)
[0104] De hecho, los polipéptidos no naturales de la presente invención son cetoreductasas diseñadas para tener propiedades mejoradas en comparación con la cetoreductasa natural de SEQ ID NO:2 y/o la cetoreductasa manipulada de SEQ ID NO:4.
[0105] En algunas realizaciones, los polipéptidos de cetoreductasa modificados genéticamente son capaces de convertir el compuesto de sustrato en un producto con una actividad que aumenta al menos aproximadamente 1,2 veces, 1,5 veces, 2 veces, 3 veces, 4 veces, 5 veces, 10 veces, 20 veces, 30 veces, 40 veces, 50 veces o 100 veces con respecto a la actividad del polipéptido de referencia de SEQ ID NO:4 en condiciones de reacción adecuadas. En algunas realizaciones, los polipéptidos de cetoreductasa modificados genéticamente son capaces de convertir el compuesto de sustrato en un producto con un porcentaje de conversión de al menos aproximadamente 40%, al menos aproximadamente 50%, al menos aproximadamente 60%, al menos aproximadamente 70%, al menos aproximadamente 80%, o al menos aproximadamente 90%, al menos aproximadamente 95%, al menos aproximadamente 98%, al menos aproximadamente 99%, en un tiempo de reacción de aproximadamente 48 h, aproximadamente 36 h, aproximadamente 24 h o incluso un período de tiempo más corto, en condiciones de reacción adecuadas.
[0106] En algunas realizaciones, las cetoreductasas modificadas genéticamente son capaces de convertir el compuesto sustrato (1) en el compuesto producto (2a) en exceso diastereomérico sobre el compuesto (2c). En algunas realizaciones, las cetoreductasas modificadas genéticamente son capaces de convertir el compuesto (1) en el compuesto (2a) en un exceso diastereomérico de al menos 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90% o más sobre el compuesto (2c) en condiciones de reacción adecuadas.
[0107] Como apreciarán los expertos en la técnica, algunas de las categorías definidas anteriormente, a menos que se especifique lo contrario, no son mutuamente excluyentes. Por tanto, los aminoácidos que tienen cadenas laterales que presentan dos o más propiedades físico-químicas se pueden incluir en múltiples categorías. La clasificación apropiada de cualquier aminoácido o residuo será evidente para los expertos en la técnica, especialmente a la luz de la descripción detallada proporcionada en este documento.
[0108] En algunas realizaciones, las enzimas de cetoreductasa modificadas mejoradas comprenden deleciones de los polipéptidos de cetoreductasa naturales o deleciones de otros polipéptidos de cetoreductasa modificados genéticamente. En algunas realizaciones, cada una de las enzimas de cetoreductasa modificadas mejoradas descritas en este documento puede comprender deleciones de los polipéptidos descritos en este documento. Por tanto, para todas y cada una de las formas de realización de los polipéptidos de cetoreductasa de la divulgación, las deleciones pueden comprender uno o más aminoácidos, 2 o más aminoácidos, 3 o más aminoácidos, 4 o más aminoácidos, 5 o más aminoácidos, 6 o más aminoácidos, 8 o más aminoácidos, 10 o más aminoácidos, 15 o más aminoácidos, o 20 o más aminoácidos, hasta el 10% del número total de aminoácidos, hasta el 10% del número total de aminoácidos, hasta el 20% del número total de aminoácidos, o hasta el 30% del número total de aminoácidos de los polipéptidos de cetoreductasa, siempre que se mantenga la actividad funcional de la actividad de cetoreductasa. En algunas realizaciones, las deleciones pueden comprender, 1-2, 1-3, 1-4, 1-5, 1-6, 1-7, 1-8, 1-9, 1-10, 1-11, 1 -12, 1-14, 1-15, 1-16, 1-18, 1-20, 1-22, 1-24, 1-25, 1-30, 1-35 o aproximadamente 1-40 residuos de aminoácidos. En algunas realizaciones, el número de deleciones puede ser 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 14, 15, 16, 18, 20, 22, 24, 26, 30, 35 o aproximadamente 40 aminoácidos. En algunas realizaciones, las deleciones pueden comprender deleciones de 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 18 o 20 residuos de aminoácidos.
[0109] Como se describe en el presente documento, los polipéptidos de cetoreductasa de la divulgación pueden ser en forma de polipéptidos de fusión en donde los polipéptidos de cetoreductasas se fusionan con otros polipéptidos, tales como etiquetas de anticuerpos (p. ej., epítopo myc) o secuencias de purificaciones (p. ej., etiquetas de His). Por tanto, los polipéptidos de cetoreductasa pueden usarse con o sin fusiones con otros polipéptidos.
[0110] En algunas realizaciones, los polipéptidos descritos en este documento no están limitadas a los aminoácidos genéticamente codificados. Además de los aminoácidos codificados genéticamente, los polipéptidos descritos en este documento pueden estar compuestos, en su totalidad o en parte, de aminoácidos no codificados de origen natural y/o sintéticos. Ciertos aminoácidos no codificados que se encuentran comúnmente de los que pueden estar compuestos los polipéptidos descritos en este documento incluyen, pero no se limitan a: los D-estereómeros de los aminoácidos codificados genéticamente; ácido 2,3-diaminopropiónico (Dpr); ácido a-aminoisobutírico (Aib); ácido £-aminohexanoico (Aha); ácido 6-aminovalérico (Ava); N-metilglicina o sarcosina (MeGly o Sar); ornitina (Orn); citrulina (Cit); t-butilalanina (Bua); t-butilglicina (Bug); N-metilisoleucina (Melle); fenilglicina (Phg); ciclohexilalanina (Cha); norleucina (Nle); naftilalanina (Nal); 2-clorofenilalanina (Ocf); 3-clorofenilalanina (Mcf); 4-clorofenilalanina (Pcf); 2-fluorofenilalanina (desactivada); 3-fluorofenilalanina (Mff); 4-fluorofenilalanina (Pff); 2-bromofenilalanina (Obf); 3-bromofenilalanina (Mbf); 4-bromofenilalanina (Pbf); 2-metilfenilalanina (Omf); 3-metilfenilalanina (Mmf); 4-metilfenilalanina (Pmf); 2-nitrofenilalanina (Onf); 3-nitrofenilalanina (Mnf); 4-nitrofenilalanina (Pnf); 2-cianofenilalanina (Ocf); 3-cianofenilalanina (Mcf); 4-cianofenilalanina (Pcf); 2-trifluorometilfenilalanina (Otf); 3-trifluorometilfenilalanina (Mtf); 4-trifluorometilfenilalanina (Ptf); 4-aminofenilalanina (Paf); 4-yodofenilalanina (Pif); 4-aminometilfenilalanina (Pamf); 2,4-diclorofenilalanina (Opef); 3,4-diclorofenilalanina (Mpcf); 2,4-difluorofenilalanina (Opff); 3,4-difluorofenilalanina (Mpff); pirid-2-ilalanina (2pAla); pirid-3-ilalanina (3pAla); pirid-4-ilalanina (4pAla); naft-1 -ilalanina (1nAla); naft-2-ilalanina (2nAla); tiazolilalanina (taAla); benzotienilalanina (bAla); tienilalanina (tAla); furilalanina (fAla); homofenilalanina (hPhe); homotirosina (hTyr); homotriptófano (hTrp); pentafluorofenilalanina (5ff); estirilcalanina (sAla); autrilalanina (aAla); 3,3-difenilalanina (Dfa); ácido 3-amino-5-fenipentanoico (Afp); penicilamina (Pen); ácido 1,2,3,4-tetrahidroisoquinolina-3-carboxílico (Tic); p-2-tienilalanina (Thi); sulfóxido de metionina (Mso); N(w)-nitroarginina (nArg); homolisina (hLys); fosfonometilfenilalanina (pmPhe); fosfoserina (pSer); fosfotreonina (pThr); ácido homoaspártico (hAsp); ácido homoglutanico (hGlu); ácido 1-aminociclopent-(2 o 3)-en-4 carboxílico; ácido pipecólico (PA), ácido azetidina-3-carboxílico (ACA); ácido 1-aminociclopentano-3-carboxílico; alilglicina (aOly); propargilglicina (pgGly); homoalanina (hAla); norvalina (nVal); homoleucina (hLeu), homovalina (hVal); homoisolencina (hIle); homoarginina (hArg); N-acetilo lisina (AcLys); ácido 2,4-diaminobutírico (Dbu); ácido 2,3-diaminobutírico (Dab); N-metilvalina (MeVal); homocisteína (hCys); homoserina (hSer); hidroxiprolina (Hyp) y homoprolina (hPro). Los aminoácidos no codificados adicionales de los que pueden estar comprendidos los polipéptidos descritos en este documento son evidentes para los expertos en la técnica. Estos aminoácidos pueden estar en configuración L o D.
[0111] Los expertos en la técnica reconocerán que los aminoácidos o residuos que llevan grupos protectores de la cadena lateral pueden comprender también los polipéptidos descritos en el presente documento. Los ejemplos no limitantes de tales aminoácidos protegidos, que en este caso pertenecen a la categoría aromática, incluyen (grupos protectores enumerados entre paréntesis), pero no se limitan a: Arg(tos), Cys(metilbencilo), Cys(nitropiridinesulfenilo), Glu(6- benciléster), Gln(xantilo), Asn(N-S-xantilo), His(bom), His(bencilo), His(tos), Lys(fmoc), Lys(tos), Se(O-bencilo), Thr(O-bencilo) y Tyr(O-bencilo).
[0112] Aminoácidos no codificadores que están restringidos conformacionalmente de los que los polipéptidos descritos en el presente documento pueden estar compuestos incluyen, pero no se limitan a, aminoácidos de N-metilo (L-configuración); ácido 1-aminociclopent-(2 ó 3)-eno-4-carboxílico; ácido pipecólico; ácido azetidina-3-carboxílico; homoprolina (hPro); y ácido 1-aminociclopentano-3-carboxílico.
[0113] Como se describió anteriormente las diversas modificaciones introducidas en el polipéptido de origen natural para generar una enzima de cetoreductasa modificada pueden ser dirigidas a una propiedad específica de la enzima.
Polinucleótidos que codifican cetoreductasas modificadas genéticamente
[0114] En otro aspecto, la presente divulgación proporciona polinucleótidos que codifican las enzimas de cetoreductasa modificadas genéticamente. Los polinucleótidos pueden unirse operativamente a una o más secuencias reguladoras heterólogas que controlan la expresión génica para crear un polinucleótido recombinante capaz de expresar el polipéptido. Las construcciones de expresión que contienen un polinucleótido heterólogo que codifica la cetoreductasa modificada pueden introducirse en células huésped apropiadas para expresar el polipéptido de cetoreductasa correspondiente.
[0115] Debido al conocimiento de los codones correspondientes a los diversos aminoácidos, la disponibilidad de una secuencia de proteína proporciona una descripción de todos los polinucleótidos capaces de codificar el sujeto. La degeneración del código genético, donde los mismos aminoácidos están codificados por codones alternativos o sinónimos, permite que se produzca un número extremadamente grande de ácidos nucleicos, todos los cuales codifican las enzimas de cetoreductasa mejoradas descritas en este documento. Por tanto, habiendo identificado una secuencia de aminoácidos particular, los expertos en la técnica podrían producir cualquier número de ácidos nucleicos diferentes simplemente modificando la secuencia de uno o más codones de una manera que no cambie la secuencia de aminoácidos de la proteína. En este sentido, la presente divulgación contempla específicamente todas y cada una de las posibles variaciones de polinucleótidos que podrían realizarse seleccionando combinaciones basadas en las posibles elecciones de codones, y todas estas variaciones deben considerarse específicamente divulgadas para cualquier polipéptido divulgado en este documento, incluido las secuencias de aminoácidos presentadas en las Tablas de los Ejemplos. En varias realizaciones, los codones se seleccionan preferiblemente para adaptarse a la célula huésped en donde se produce la proteína. Por ejemplo, los codones preferidos usados en bacterias se usan para expresar el gen en bacterias; los codones preferidos usados en levadura se usan para expresión en levadura; y los codones preferidos utilizados en mamíferos se utilizan para la expresión en células de mamíferos. A modo de ejemplo, el polinucleótido de SEQ ID NO:2 ha sido codificado optimizado para expresión en E. coli, pero por lo demás codifica la cetoreductasa natural de Lactobacillus kéfir.
[0116] En algunos aspectos, el polinucleótido comprende una secuencia de nucleótidos que codifica un polipéptido de cetoreductasa con una secuencia de aminoácidos que tiene al menos aproximadamente 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% o 99% o más de identidad de secuencia con cualquiera de los polipéptidos de cetoreductasa modificados genéticamente de referencia descritos en este documento, donde el polipéptido de cetoreductasa codificado comprende una secuencia de aminoácidos en donde el residuo correspondiente a X190 de SEQ ID NOS: 4, 6, 25, 42 o 238 no es una tirosina. En algunos aspectos, el polinucleótido codifica un polipéptido de cetoreductasa que comprende una secuencia de aminoácidos en donde el residuo correspondiente a X190 es un residuo no aromático. En algunos aspectos, el polinucleótido codifica un polipéptido de cetoreductasa que comprende una secuencia de aminoácidos en donde el residuo correspondiente a X190 es alanina, glutamina, treonina o prolina, particularmente prolina. En algunas realizaciones, el polinucleótido codifica un polipéptido de cetoreductasa modificado que comprende una secuencia de aminoácidos seleccionada de SEQ ID NOS: 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 40, 42, 44, 46, 48, 50, 52, 54, 56, 58, 60, 62, 64, 66, 68, 70, 72, 74, 76, 78, 80, 82, 84, 86, 88, 90, 92, 94, 96, 98, 100, 102, 104, 106, 108, 110, 112, 114, 116, 118, 120, 122, 124, 126, 128, 130, 132, 134, 136, 138, 140, 142, 144, 146, 148, 150, 152, 154, 156, 158, 160, 162, 164, 166, 168, 170, 172, 174, 176, 178, 180, 182, 184, 186, 188, 190, 192, 194, 196, 198, 200, 202, 204, 206, 208, 210, 212, 214, 216, 218, 220, 222, 224, 226, 228, 230, 232, 234, 236 y 238.
[0117] En algunas realizaciones, los polinucleótidos que codifican las cetoreductasas manipuladas se seleccionan de las SEQ ID NOS: 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27., 29, 31, 33, 35, 37, 39, 41, 43, 45, 47, 49, 51, 53, 55, 57, 59, 61,63, 65, 67, 69, 71, 73, 75, 77, 79, 81, 83, 85, 87, 89, 91, 93, 95, 97, 99, 101, 103, 105, 107, 109, 111, 113, 115, 117, 119, 121, 123, 125, 127, 129, 131, 133, 135, 137, 139, 141, 143, 145, 147, 149, 151, 153, 155, 157, 159, 161, 163, 165, 167, 169, 171, 173, 175, 177, 179, 181, 183, 185, 187, 189, 191, 193, 195, 197, 199, 201, 203, 205, 207, 209, 211,213, 215, 217, 219, 221, 223, 225, 227, 229, 231, 233, 235 y 237.
[0118] En algunas realizaciones, los polinucleótidos son capaces de hibridar en condiciones muy rigurosas con un polinucleótido que comprende la SEQ ID NO:4, en donde el polinucleótido que hibrida en condiciones muy rigurosas tiene selectividad(es) para reducir o convertir el sustrato de fórmula estructural (I) al producto de fórmula estructural (II). En algunas realizaciones, los polinucleótidos que hibridan en condiciones muy rigurosas son capaces de reducir o convertir el sustrato de fórmula estructural (III) en el producto de fórmula estructural (IV).
[0119] En algunos aspectos, los polinucleótidos codifican los polipéptidos descritos en este documento pero tienen aproximadamente 80% o más de identidad de secuencia, aproximadamente 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% o 99% o más de identidad de secuencia a nivel de nucleótidos con un polinucleótido de referencia que codifica la cetoreductasa manipulada. En algunos aspectos, el polinucleótido de referencia se selecciona de una secuencia de polinucleótidos correspondiente a SEQ ID NO:4.
[0120] En algunas realizaciones, las secuencias de cetoreductasa modificadas comprenden secuencias que comprenden las posiciones identificadas para ser beneficiosas, como se describe en los Ejemplos. En algunos aspectos, las secuencias son SEQ ID NO:239 o SEQ ID NO:240. En algunas realizaciones adicionales, las secuencias comprenden secuencias variantes derivadas de SEQ ID NO:239 o SEQ ID NO:240 (es decir, SEQ ID NO:239 o SEQ ID NO:240 es la secuencia de partida a partir de la cual se desarrollan las secuencias variantes).
[0121] Un polinucleótido aislado que codifica un polipéptido de cetoreductasa mejorado puede ser manipulado en una variedad de maneras para proporcionar la expresión del polipéptido. La manipulación del polinucleótido aislado antes de su inserción en un vector puede ser deseable o necesaria dependiendo del vector de expresión. Las técnicas para modificar polinucleótidos y secuencias de ácido nucleico utilizando métodos de ADN recombinante son bien conocidas en la técnica.
[0122] Para las células huésped bacterianas, promotores adecuados para dirigir la transcripción de los constructos de ácidos nucleicos de la presente divulgación, se incluyen los promotores obtenidos a partir del E. coli lac operón, gen de agarasa Streptomyces coelicolor (dagA), gen levansacarasa Bacillus subtilis (sacB), gen de la alfa-amilasa de Bacillus licheniformis (amyL), gen de la amilasa maltogénica de Bacillus stearothermophilus (amyM), gen de la alfaamilasa de Bacillus amyloliquefaciens (amyQ), gen de la penicilinasa de Bacillus licheniformis (penP), genes de Bacillus xary y gen de beta-lactasa (véase, por ejemplo, VillaKamaroff y col., Proc. Natl. Acad. Sci. Ee .UU. 75: 3727­ 3731 [1978]), así como el promotor tac (véase, por ejemplo, DeBoer y col., Proc. Natl Acad. Sci. EE.UU. 80: 21 - 25 [1983]). Los expertos en la técnica conocen promotores adicionales adecuados.
[0123] Para las células huésped de hongos filamentosos, promotores adecuados para dirigir la transcripción de los constructos de ácidos nucleicos de la presente divulgación incluyen promotores obtenidos de los genes para amilasa TAKA Aspergillus oryzae, proteinasa aspártica Rhizomucor miehei, alfa-amilasa neutra Aspergillus niger, Aspergillus niger estable a los ácidos alfa-amilasa, glucoamilasa Aspergillus niger o Aspergillus awamori (glaA), lipasa Rhizomucor miehei, proteasa alcalina Aspergillus oryzae, isomerasa de fosfato triosa Aspergillus oryzae, acetamidasa Aspergillus nidulans, y Fusarium oxisporum similar a la tripsina de la proteasa (WO 96/00787), así como el promotor NA2-tpi (un híbrido de los promotores de los genes de la alfa-amilasa neutra de Aspergillus niger y la isomerasa de fosfato triosa Aspergillus oryzae), y sus promotores mutantes, truncados e híbridos.
[0124] En un huésped de levadura, promotores útiles incluyen, pero no se limitan a los de los genes para enolasa Saccharomyces cerevisiae (ENO-1), galactoquinasa Saccharomyces cerevisiae (GAL1), alcohol deshidrogenasa/gliceraldehído-3-fosfato deshidrogenasa Saccharomyces cerevisiae (ADH2/GAP) y 3-fosfoglicerato quinasa de Saccharomyces cerevisiae, así como otros promotores útiles para células hospedadoras de levadura (véase, por ejemplo, Romanos et al., Yeast 8: 423-488 [1992]).
[0125] La secuencia de control puede también ser una secuencia del terminador de transcripción adecuada, una secuencia reconocida por una célula huésped para terminar la transcripción. La secuencia del terminador está operativamente unida al extremo 3' de la secuencia de ácido nucleico que codifica el polipéptido. En la presente invención se puede utilizar cualquier terminador que sea funcional en la célula huésped de elección.
[0126] Por ejemplo, terminadores de la transcripción ejemplares para células huéspedes filamentosas fúngicas se pueden obtener a partir de los genes para amilasa TAKA Aspergillus oryzae, glucoamilasa Aspergillus niger, sintasa de antranilato Aspergillus nidulans, alfa-glucosidasa Aspergillus niger, y Fusarium oxisporum similar a la tripsina proteasa.
[0127] Los ejemplos de terminadores para células huéspedes de levadura se pueden obtener de los genes para enolasa Saccharomyces cerevisiae, citocromo C Saccharomyces cerevisiae (CYC1), y deshidrogenasa gliceraldehído-3-fosfato Saccharomyces cerevisiae, así como otros terminadores útiles para células huéspedes de levadura conocidos en la técnica (ver, por ejemplo, Romanos et al., supra).
[0128] La secuencia de control también puede ser una secuencia líder adecuada, una región no traducida de un ARNm que es importante para la traducción por parte de la célula huésped. La secuencia líder está operativamente unida al extremo 5' de la secuencia de ácido nucleico que codifica el polipéptido. Puede usarse cualquier secuencia líder que sea funcional en la célula huésped de elección. Se obtienen ejemplos de líderes para células hospedadoras fúngicas filamentosas a partir de los genes de la amilasa TAKA de Aspergillus oryzae y la isomerasa de fosfato triosa de Aspergillus nidulans. Líderes adecuados para células huéspedes de levadura se obtienen de los genes para enolasa Saccharomyces cerevisiae (ENO-1), 3-fosfoglicerato quinasa Saccharomyces cerevisiae, factor alfa de Saccharomyces cerevisiae, y alcohol deshidrogenasa/gliceraldehído-3-fosfato deshidrogenasa Saccharomyces cerevisiae (ADH2/GAP).
[0129] La secuencia de control puede también ser una secuencia de poliadenilación, una secuencia operativamente enlazada al término 3' de la secuencia de ácido nucleico y que, cuando se transcribe, es reconocida por la célula huésped como una señal para añadir residuos de poliadenosina a ARNm transcrito. En la presente invención se puede utilizar cualquier secuencia de poliadenilación que sea funcional en la célula huésped elegida. Las secuencias de poliadenilación ejemplares para células huésped fúngicas filamentosas pueden ser de los genes de amilasa TAKA de Aspergillus oryzae, glucoamilasa de Aspergillus niger, sintasa de antranilato de Aspergillus nidulans, proteasa similar a tripsina de Fusarium oxisporum y proteasa similar a tripsina de Aspergillus niger, así como alfa-gludencosilación de Aspergillus niseger adicionales útiles para células hospedadoras de levadura conocidas en la técnica (véase, por ejemplo, Guo et al., Mol. Cell. Biol., 15: 5983-5990 [1995]).
[0130] La secuencia de control puede también ser una región codificante del péptido señal que codifica para una secuencia de aminoácidos vinculada al término amino de un polipéptido y dirige el polipéptido codificado en la vía secretora de la célula. El extremo 5' de la secuencia codificante de la secuencia de ácido nucleico puede contener inherentemente una región codificante del péptido señal enlazada naturalmente en el marco de lectura de traducción con el segmento de la región codificante que codifica el polipéptido secretado. Alternativamente, el extremo 5' de la secuencia codificante puede contener una región codificante del péptido señal que es ajena a la secuencia codificante. La región codificante del péptido señal extraño puede ser necesaria cuando la secuencia codificante no contiene naturalmente una región codificante del péptido señal.
[0131] Alternativamente, la región de codificación de péptido señal ajena puede simplemente reemplazar la región de codificación de péptido señal natural a fin de mejorar la secreción del polipéptido. Sin embargo, en la presente invención se puede utilizar cualquier región codificante de péptido señal que dirija el polipéptido expresado hacia la vía secretora de una célula huésped de elección.
[0132] Regiones de codificación del péptido señal eficaces para células huéspedes bacterianas son el péptido señal obtenidas de codificación de los genes de amilasa maltogénica NC1B 11837 para Bacillus, alfa-amilasa Bacillus stearothermophilus, subtilisina Bacillus licheniformis, beta-lactamasa Bacillus licheniformis, proteasas neutras Bacillus stearothermophilus (nprT, nprS, nprM) y prsA Bacillus subtilis, así como péptidos señal adicionales conocidos en la técnica (véase, por ejemplo, Simonen et al., Microbiol. Rev., 57: 109-137 [1993]).
[0133] Regiones de codificación de péptido señal eficaces para las células huéspedes filamentosas fúngicas incluyen, pero no se limitan a la señal de péptido obtenidas de los genes para la codificación de amilasa TAKA Aspergillus oryzae, amilasa neutra Aspergillus niger, glucoamilasa Aspergillus niger, proteinasa aspártica Rhizomucor miehei, celulasa Humicola insolens y lipasa de Humicola lanuginosa. Péptidos señal útiles para células huéspedes de levadura pueden ser de los genes para factor alfa Saccharomyces cerevisiae y invertasa Saccharomyces cerevisiae, así como regiones de codificación del péptido señal útiles adicionales (véase por ejemplo, Romanos et al., 1992, supra).
[0134] La secuencia de control puede también ser una región codificante del propéptido que codifica para una secuencia de aminoácidos situada en el amino terminal de un polipéptido. El polipéptido resultante se conoce como proenzima o propolipéptido (o zimógeno en algunos casos). Un propolipéptido es generalmente inactivo y puede convertirse en un polipéptido activo maduro mediante escisión catalítica o autocatalítica del propéptido del propolipéptido. La región codificante del propéptido puede ser obtenida de los genes para proteasa alcalina Bacillus subtilis (aprE), proteasa neutra Bacillus subtilis (nprT), factor alfa de Saccharomyces cerevisiae, proteinasa aspártica Rhizomucor miehei, y lactasa Myceliophthora thermophila (WO 95/33836).
[0135] Cuando tanto el péptido señal y regiones del propéptido están presentes en el término amino de un polipéptido, la región de propéptido está situada junto al término amino de un polipéptido y la región del péptido señal está situada junto al término amino de la región del propéptido.
[0136] También puede ser deseable añadir secuencias reguladoras que permiten la regulación de la expresión del polipéptido relativa al crecimiento de la célula huésped. Ejemplos de sistemas reguladores son aquellos que provocan que la expresión del gen se active o desactive en respuesta a un estímulo químico o físico, incluida la presencia de un compuesto regulador. En las células huésped procariotas, las secuencias reguladoras adecuadas incluyen los sistemas operadores lac, tac y trp. En las células huésped de levadura, los sistemas reguladores adecuados incluyen, como ejemplos, el sistema ADH2 o el sistema GAL1. En los hongos filamentosos, las secuencias reguladoras adecuadas incluyen el promotor de alfa-amilasa de TAKA, el promotor de glucoamilasa de Aspergillus niger y el promotor de glucoamilasa de Aspergillus oryzae.
[0137] Otros ejemplos de secuencias reguladoras son aquellas que permiten la amplificación de genes. En los sistemas eucariotas, estos incluyen el gen de la reductasa de dihidrofolato, que se amplifica en presencia de metotrexato, y los genes de la metalotioneína, que se amplifican con metales pesados. En estos casos, la secuencia de ácido nucleico que codifica el polipéptido KRED de la presente invención estaría unida operativamente con la secuencia reguladora.
[0138] Por lo tanto, en algunas realizaciones, la presente descripción es también dirigida a un vector de expresión recombinante que comprende un polinucleótido que codifica un polipéptido de cetoreductasa modificado o una variante del mismo, y una o más regiones reguladoras de la expresión tales como un promotor y un terminador, un origen de replicación, etc., dependiendo del tipo de huéspedes en que se vayan a introducir. Las diversas secuencias de ácido nucleico y de control descritas anteriormente se pueden unir para producir un vector de expresión recombinante que puede incluir uno o más sitios de restricción convenientes para permitir la inserción o sustitución de la secuencia de ácido nucleico que codifica el polipéptido en dichos sitios. Alternativamente, la secuencia de ácido nucleico de la presente divulgación puede expresarse insertando la secuencia de ácido nucleico o una construcción de ácido nucleico que comprende la secuencia en un vector apropiado para la expresión. Al crear el vector de expresión, la secuencia codificante se localiza en el vector de manera que la secuencia codificante esté operativamente ligada con las secuencias de control apropiadas para la expresión.
[0139] El vector de expresión recombinante puede ser cualquier vector (p. ej., un plásmido o virus), que puede ser convenientemente sometido a procedimientos de ADN recombinante y puede provocar la expresión de la secuencia de polinucleótido. La elección del vector dependerá típicamente de la compatibilidad del vector con la célula huésped en donde se introducirá el vector. Los vectores pueden ser plásmidos circulares lineales o cerrados.
[0140] El vector de expresión puede ser un vector de replicación autónoma (es decir, un vector que existe como una entidad extracromosómica), la replicación del cual es independiente de replicación cromosómica, (p. ej., un plásmido, un elemento extracromosómico, un minicromosoma, o un cromosoma artificial). El vector puede contener cualquier medio para asegurar la autorreplicación. Alternativamente, el vector puede ser uno que, cuando se introduce en la célula huésped, se integra en el genoma y se replica junto con el (los) cromosoma(s) en los que se ha integrado. Además, se puede usar un solo vector o plásmido o dos o más vectores o plásmidos que juntos contienen el ADN total a introducir en el genoma de la célula huésped, o un transposón.
[0141] El vector de expresión de la presente invención contiene preferiblemente uno o más marcadores seleccionables, que permiten la selección fácil de células transformadas. Un marcador seleccionable puede ser un gen cuyo producto proporcione resistencia a biocidas o virus, resistencia a metales pesados, prototrofia a auxótrofos y similares. Ejemplos de marcadores bacterianos seleccionables son los genes dal de Bacillus subtilis o Bacillus licheniformis, o marcadores, que confieren resistencia a antibióticos tales como resistencia a ampicilina, kanamicina, cloranfenicol o tetraciclina. Los marcadores adecuados para las células huésped de levadura son ADE2, HIS3, LEU2, LYS2, MET3, TRP1 y URA3.
[0142] Los marcadores seleccionables para su uso en una célula huésped fúngica filamentosa incluyen, pero no se limitan a, amdS (acetamidasa), argB (carbamoiltransferasa de ornitina), bar (acetiltransferasa de fosfinotricina), hph (fosfotransferasa de higromicina), niaD (reductasa de nitrato) pyrG (descarboxilasa de orotidina-5'-fosfato), sC (adeniltransferasa de sulfato) y trpC (sintasa de antranilato), así como sus equivalentes. Las realizaciones para su uso en una célula de Aspergillus incluyen los genes amdS y pyrG de Aspergillus nidulans o Aspergillus oryzae y el gen bar de Streptomyces hygroscopicus.
[0143] Los vectores de expresión de la presente invención pueden contener un elemento que permite la integración del vector en el genoma de la célula huésped o la replicación autónoma del vector en la célula independiente del genoma. Para la integración en el genoma de la célula huésped, el vector puede depender de la secuencia de ácido nucleico que codifica el polipéptido o cualquier otro elemento del vector para la integración del vector en el genoma mediante recombinación homóloga o no homóloga.
[0144] Alternativamente, el vector de expresión puede contener secuencias de ácidos nucleicos adicionales para dirigir la integración por recombinación homóloga en el genoma de la célula huésped. Las secuencias de ácido nucleico adicionales permiten que el vector se integre en el genoma de la célula huésped en una ubicación o ubicaciones precisas en los cromosomas. Para aumentar la probabilidad de integración en una ubicación precisa, los elementos de integración deben contener preferiblemente un número suficiente de ácidos nucleicos, como 100 a 10.000 pares de bases, preferiblemente 400 a 10.000 pares de bases, y lo más preferiblemente 800 a 10.000 pares de bases, que son altamente homólogos con la secuencia diana correspondiente para mejorar la probabilidad de recombinación homóloga. Los elementos integradores pueden ser cualquier secuencia que sea homóloga con la secuencia diana en el genoma de la célula huésped. Además, los elementos de integración pueden ser secuencias de ácido nucleico no codificantes o codificantes. Por otro lado, el vector puede integrarse en el genoma de la célula huésped mediante recombinación no homóloga.
[0145] Para la replicación autónoma, el vector puede comprender además un origen de replicación que permite que el vector se replique de forma autónoma en la célula huésped en cuestión. Ejemplos de origenes de replicación bacterianos son P15A ori o los orígenes de replicación de los plásmidos pBR322, pUC19, pACYC177 (cuyo plásmido tiene el P15A ori) o pACYC184 que permite la replicación en E. coli y pUB 110, pE194, pTA1060 o pAMpI que permite la replicación en Bacillus. Ejemplos de orígenes de replicación para uso en una célula huésped de levadura son el origen de replicación de 2 micrones, ARS1, ARS4, la combinación de ARS1 y CEN3, y la combinación de ARS4 y CEN6. El origen de la replicación puede ser uno que tenga una mutación que haga que su funcionamiento sea sensible a la temperatura en la célula huésped (véase, por ejemplo, Ehrlich, Proc. Natl. Acad. Sci. EE.UU. 75: 1433 [1978]).
[0146] Más de una copia de una secuencia de ácido nucleico de la presente invención se puede insertar en la célula huésped para aumentar la producción del producto del gen. Puede obtenerse un aumento en el número de copias de la secuencia de ácido nucleico integrando al menos una copia adicional de la secuencia en el genoma de la célula huésped o incluyendo un gen marcador seleccionable amplificable con la secuencia de ácido nucleico donde las células que contienen copias amplificadas del gen marcador seleccionable, y por lo tanto copias adicionales de la secuencia de ácido nucleico, pueden seleccionarse cultivando las células en presencia del agente seleccionable apropiado.
[0147] Muchos de los vectores de expresión para uso en la presente descripción están disponibles comercialmente. Los vectores de expresión comerciales adecuados incluyen, entre otros, los vectores de expresión p3xFLAGTM™ (Sigma-Aldrich), que incluyen un promotor de CMV y un sitio de poliadenilación de hGH para la expresión en células huésped de mamíferos y un origen de replicación de pBR322 y marcadores de resistencia a ampicilina para la amplificación en E.coli. Otros vectores de expresión adecuados disponibles comercialmente incluyen, entre otros, los vectores pBluescriptII SK(-) y pBK-CMV (Stratagene), y plásmidos derivados de pBR322 (Gibco BRL), pUC (Gibco BRL), pREP4, pCEP4 (Invitrogen) o pPoli (véase, Lathe y col., Gene 57: 193-201 [1987]).
Células huésped para la expresión de polipéptidos de cetoreductasa
[0148] En otro aspecto, la presente divulgación proporciona una célula huésped que comprende un polinucleótido que codifica un polipéptido de cetoreductasa mejorado de la presente divulgación, estando el polinucleótido unido operativamente a una o más secuencias de control para la expresión de la enzima de cetoreductasa en la célula huésped. Las células huésped para usar en la expresión de los polipéptidos KRED codificados por los vectores de expresión de la presente invención son bien conocidas en la técnica e incluyen, pero no se limitan a, células bacterianas, tales como células de E. coli, Lactobacillus kéfir, Lactobacillus brevis, Lactobacillus minor, Streptomyces y Salmonella typhimurium; células fúngicas, tales como células de levadura (p. ej., Saccharomyces cerevisiae o Pichia pastoris (número de acceso ATCC 201178)); células de insectos tales como células de Drosophila S2 y Spodoptera Sf9; células animales tales como CHO, COS, BHK, 293 y células de melanoma de Bowes; y células vegetales. Los medios de cultivo y las condiciones de crecimiento apropiadas para las células hospedadoras descritas anteriormente son bien conocidas en la técnica.
[0149] Los polinucleótidos para la expresión de la cetoreductasa pueden introducirse en las células mediante varios métodos conocidos en la técnica. Las técnicas incluyen, entre otras, electroporación, bombardeo de partículas biolísticas, transfección mediada por liposomas, transfección con cloruro de calcio y fusión de protoplastos. Para el experto en la materia serán evidentes varios métodos para introducir polinucleótidos en células.
[0150] Escherichia coli W3110 es una cepa huésped que encuentra uso en la presente invención, aunque no se pretende que la presente invención esté limitada a esta cepa huésped específica. El vector de expresión se creó uniendo operativamente un polinucleótido que codifica una cetoreductasa mejorada en el plásmido pCK110900 operativamente unido al promotor lac bajo el control del represor lacI. El vector de expresión también contenía el origen de replicación P15a y el gen de resistencia al fenicol cloram. Las células que contienen el polinucleótido sujeto en Escherichia coli W3110 pueden aislarse sometiendo las células a selección con cloranfenicol.
Métodos de generación de polipéptidos de cetoreductasa modificados.
[0151] En algunas realizaciones, para hacer los polinucleótidos y polipéptidos KRED mejorados de la presente descripción, se obtiene (o se deriva) la enzima de cetoreductasa de origen natural que cataliza la reacción de reducción a partir de Lactobacillus kefir o Lactobacillus brevis o Lactobacillus menor. En algunas realizaciones, la secuencia de polinucleótidos parental tiene un codón optimizado para mejorar la expresión de la cetoreductasa en una célula huésped específica. Como ilustración, la secuencia de polinucleótidos parental que codifica el polipéptido KRED de tipo silvestre de Lactobacillus kéfir se construyó a partir de oligonucleótidos preparados en base a la secuencia polipeptídica conocida de KRED Lactobacillus kéfir disponible en la base de datos de Genbank (número de acceso de Genbank AAP94029 GI: 33112056). La secuencia de polinucleótidos parental, designada como SEQ ID NO:3, se optimizó por codones para la expresión en E. coli y el polinucleótido de codones optimizados se clonó en un vector de expresión, colocando la expresión del gen de la cetoreductasa bajo el control del promotor lac y gen represor lacI. Se identificaron los clones que expresan la cetoreductasa activa en E. coli y se secuenciaron los genes para confirmar su identidad. La secuencia designada (SEQ ID NO:3) fue la secuencia original utilizada como punto de partida para la mayoría de los experimentos y la construcción de bibliotecas de cetoreductasas manipuladas desarrolladas a partir de la cetoreductasa de Lactobacillus kefir.
[0152] Las cetoreductasas modificadas se pueden obtener sometiendo el polinucleótido que codifica la cetoreductasa de origen natural a mutagénesis y/o métodos de evolución dirigida, como se discutió anteriormente. La mutagénesis se puede realizar de acuerdo con cualquiera de las técnicas conocidas en la técnica, incluida la mutagénesis aleatoria y específica de sitio. La evolución dirigida se puede realizar con cualquiera de las técnicas conocidas en la técnica para seleccionar variantes de promotores mejoradas, incluida la reorganización. Los métodos de mutagénesis y evolución dirigida son bien conocidos en la técnica (véanse, por ejemplo, las patentes de EE.UU. Nos 5,605,793, 5,830,721, 6,132,970, 6,420,175, 6,277,638, 6,365,408, 6,602,986, 7,288,375, 6,287,861, 6,297,053, 6,576,467, 6,444,468, 5,811238, 6,117,679, 6,165,793, 6,180,406, 6,291,242, 6,995,017, 6,395,547, 6,506,602, 6,519,065, 6,506,603, 6,413,774, 6,573,098, 6,323,030, 6,344,356, 6,372,497, 7,868,138, 5,834,252, 5,928,905, 6,489,146, 6,096,548, 6,387,702, 6,391,552, 6,358,742, 6,482,647, 6,335,160, 6,653,072, 6,355,484, 6,03,344, 6,319,713, 6,613,514, 6,455,253, 6,579,678, 6,586,182, 6,406,855, 6,946,296, 7,534,564, 7,776,598, 5,837,458, 6,391,640, 6,309,883, 7,105,297, 7,795,030, 6,326,204, 6,251,674, 6,716,631, 6,528,311, 6,287,862, 6,335,198, 6,352,859, 6,379,964, 7,148,054, 7,629,170, 7,620,500, 6,365,377, 6,358,740, 6,406,910, 6,413,745, 6,436,675, 6,961,664, 7,430,477, 7,873,499, 7,702,464, 7,783,428, 7,747,391, 7,747,393, 7,751,986, 6,376,246, 6,426,224, 6,423,542, 6,479,652, 6,319,714, 6,521,453, 6,368,861, 7,421,347, 7,058,515, 7,024,312, 7,620,502, 7,853,410, 7,957,912, 7,904,249, y todas las contrapartes relacionadas no estadounidenses; Ling y col., Anal. Biochem, 254 (2): 157 - 78 [1997]; Dale y col., Meth. Mol. Biol., 57: 369 - 74 [1996]; Smith, Ann. Rev. Genet., 19: 423 - 462 [1985]; Botstein y col., Science, 229: 1193-1201 [1985]; Carter, Biochem. J., 237: 1 - 7 [1986]; Kramer y col., Cell, 38: 879­ 887 [1984]; Wells y col., Gene, 34: 315 - 323 [1985]; Minshull y col., Curr. Op. Chem. Biol., 3:284-290 [1999]; Christians y col., Nat. Biotechnol., 17: 259-264 [1999]; Crameri y col., Nature, 391: 288-291 [1998]; Crameri y col., Nat. Biotechnol., 15: 436-438 [1997]; Zhang y col., Proc. Nat. Acad. Sci. EE.UU., 94: 4504-4509 [1997]; Crameri y col., Nat. Biotechnol., 14: 315-319 [1996]; Stemmer, Nature, 370: 389 - 391 [1994]; Stemmer, Proc. Nat. Acad. Sci. EE.UU., 91: 10747-10751 [1994]; WO 95/22625; WO 97/0078; WO 97/35966; WO 98/27230; WO 00/42651; WO 01/75767; y WO 2009/152336).
[0153] Los clones obtenidos después de un tratamiento de mutagénesis se criban para cetoreductasas modificadas que tienen una propiedad mejorada de la enzima deseada. La medición de la actividad enzimática de las bibliotecas de expresión se puede realizar utilizando la técnica bioquímica estándar para controlar la tasa de disminución (a través de una disminución en la absorbancia o fluorescencia) de la concentración de NADH o NADPH, a medida que se convierte en NAD+ o NADP+. En esta reacción, el NADH o NADPH es consumido (oxidado) por la cetoreductasa ya que la cetoreductasa reduce un sustrato de cetona al grupo hidroxilo correspondiente. La tasa de disminución de la concentración de NADH o NADPH, medida por la disminución de la absorbancia o la fluorescencia, por unidad de tiempo indica la actividad relativa (enzimática) del polipéptido KRED en una cantidad fija del lisado (o un polvo liofilizado elaborado a partir del mismo). La estereoquímica de los productos puede determinarse mediante diversas técnicas conocidas y como se proporciona en los Ejemplos. Cuando la propiedad enzimática mejorada deseada es la estabilidad térmica, la actividad enzimática puede medirse después de someter las preparaciones enzimáticas a una temperatura definida y medir la cantidad de actividad enzimática que queda después de los tratamientos térmicos. Los clones que contienen un polinucleótido que codifica una cetoreductasa se aíslan luego, se secuencian para identificar los cambios en la secuencia de nucleótidos (si los hay) y se usan para expresar la enzima en una célula huésped.
[0154] Cuando se conoce la secuencia del polipéptido modificado, los polinucleótidos que codifican la enzima pueden prepararse por métodos estándar en fase sólida, según métodos sintéticos conocidos. En algunas realizaciones, se pueden sintetizar individualmente fragmentos de hasta aproximadamente 100 bases, luego unir (p. ej., mediante métodos de litigio enzimático o químico, o métodos mediados por polimerasa) para formar cualquier secuencia continua deseada. Por ejemplo, los polinucleótidos y oligonucleótidos de la invención se pueden preparar mediante síntesis química (p. ej., usando el método clásico de fosforamidita descrito por Beaucage et al., Tet. Lett., 22: 1859-69 [1981], o el método descrito por Matthes et al., EMBO J., 3: 801-05 [1984], como se practica típicamente en métodos sintéticos automatizados). De acuerdo con el método de la fosforamidita, los oligonucleótidos se sintetizan (p. ej., en un sintetizador automático de ADN), se purifican, se hibridan, se ligan y se clonan en vectores apropiados. Además, prácticamente cualquier ácido nucleico se puede obtener de cualquiera de una variedad de fuentes comerciales (p. ej., The Midland Certified Reagent Company, Midland, TX, The Great American Gene Company, Ramona, c A, ExpressGen Inc. Chicago, IL, Operon Technologies Inc., Alameda, CA y muchos otros).
[0155] Enzimas de cetoreductasa modificadas expresadas en una célula huésped pueden ser recuperadas de las células y/o el medio de cultivo usando una cualquiera o más de las técnicas bien conocidas para la purificación de proteínas, incluyendo, entre otros, el tratamiento de lisozima, la sonicación, la filtración, desalado, ultracentrifugación y cromatografía. Las soluciones adecuadas para la lisis y la alta eficiencia de extracción de proteínas a partir de bacterias, tales como E. coli, están disponibles comercialmente con el nombre comercial CelLytic B™ (Sigma-Aldrich).
[0156] Las técnicas cromatográficas para el aislamiento del polipéptido de cetoreductasa incluyen, entre otras, cromatografía en fase inversa, cromatografía líquida de alta resolución, cromatografía de intercambio iónico, electroforesis en gel y cromatografía de afinidad. Las condiciones para purificar una enzima particular dependerán, en parte, de factores tales como carga neta, hidrofobicidad, hidrofilicidad, peso molecular, forma molecular, etc., y resultarán evidentes para los expertos en la técnica.
[0157] En algunas realizaciones, la afinidad de técnicas se puede utilizar para aislar las enzimas de cetoreductasa mejoradas. Para la purificación por cromatografía de afinidad, puede usarse cualquier anticuerpo que se una específicamente al polipéptido de cetoreductasa. Para la producción de anticuerpos, se pueden inmunizar varios animales hospedadores, que incluyen pero no se limitan a conejos, ratones, ratas, etc., mediante inyección con cetoreductasa. El polipéptido de cetoreductasa puede unirse a un portador adecuado, tal como BSA, por medio de un grupo funcional de cadena lateral o conectores unidos a un grupo funcional de cadena lateral. Se pueden usar varios adyuvantes para aumentar la respuesta inmunológica, dependiendo de la especie huésped, incluidos, entre otros, los de Freund (completos e incompletos), geles minerales como hidróxido de aluminio, sustancias tensioactivas como lisolecitina, polioles plurónicos, polianiones, péptidos, emulsiones oleosas, hemocianina de lapa californiana, dinitrofenol y adyuvantes humanos potencialmente útiles como BCG (Bacillus Calmette Guerin) y Corynebacterium parvum.
[0158] Las cetoreductasas se pueden preparar y usar en forma de células que expresan las enzimas, como extractos crudos, o como preparaciones aisladas o purificadas. Las cetoreductasas se pueden preparar como liofilizados, en forma de polvo (p. ej., acetona en polvo) o prepararse como soluciones enzimáticas. En algunas realizaciones, las cetoreductasas pueden estar en forma de preparaciones sustancialmente puras.
[0159] En algunas realizaciones, los polipéptidos de cetoreductasa pueden unirse a un sustrato sólido. El sustrato puede ser una fase sólida, una superficie y/o una membrana. Un soporte sólido puede estar compuesto por polímeros orgánicos tales como poliestireno, polietileno, polipropileno, polifluoroetileno, polietilenoxi y poliacrilamida, así como copolímeros e injertos de los mismos. Un soporte sólido también puede ser inorgánico, como vidrio, sílice, vidrio de poro controlado (CPG), sílice de fase inversa o metal, como oro o platino. La configuración del sustrato puede ser en forma de cuentas, esferas, partículas, gránulos, un gel, una membrana o una superficie. Las superficies pueden ser planas, sustancialmente planas o no planas. Los soportes sólidos pueden ser porosos o no porosos y pueden tener características de hinchamiento o no hinchamiento. Un soporte sólido puede configurarse en forma de pozo, depresión u otro contenedor, recipiente, característica o ubicación. Se puede configurar una pluralidad de soportes en una matriz en varias ubicaciones, direccionables para la administración robótica de reactivos o mediante métodos y/o instrumentos de detección.
Métodos de uso de las enzimas de cetoreductasa modificadas y compuestos preparados con los mismos
[0160] Las enzimas de cetoreductasa descritas en este documento son capaces de catalizar la reducción asimétrica del grupo ceto en sustratos de 7-oxo-5,6-dih¡dro-5H-ciclopenta(hetero)areno, opcionalmente sustituidos en una o más de las posiciones arilo y la posición 6 y con sustitución de nitrógeno en el anillo arilo, al correspondiente alcohol quiral sustituido. En algunas realizaciones, las cetoreductasas son capaces de reducir o convertir el compuesto de sustrato de fórmula estructural (I), terc-butilo 2-(3-cloro-7-oxo-5,6-dihidro-5H-ciclopenta[c]piridina-6-ilo)acetato de etilo:
Figure imgf000023_0001
al producto alcohol quiral correspondiente (terc-butilo 2-[(6S, 7S)-3-cloro-7-hidroxi-6,7-dihidro-5H-ciclopenta[c]piridina-6-ilo]acetato de etilo) de fórmula estructural (II):
Figure imgf000023_0002
[0162] En algunas realizaciones, las cetoreductasas descritas en este documento son capaces de reducir o convertir compuestos de 7-oxo-5,6-dihidro-5H-ciclopenta(hetero)areno de fórmula estructural (III):
Figure imgf000023_0003
en donde a, b, c y d se seleccionan independientemente de carbono o nitrógeno. Y se selecciona independientemente de H, halógeno, NH2, OH, alquilo, alquenilo, alquinilo, arilo, heteroarilo, alcoxi, cuando el átomo asociado a, b, c, o d es carbono. Z se selecciona independientemente de H, (CH2)nalcoxicarbonilo donde n = 0-6, alquilo, alquenilo, alquinilo, alcoxi, arilo, heteroarilo, al correspondiente producto de alcohol quiral de fórmula estructural (IV):
Figure imgf000024_0001
[0163] La capacidad de las cetoreductasas descritas en la presente para catalizar la reacción de reducción de 7-oxo-5.6- dihidro-5H-ciclopenta(hetero)arenos específicos más sustituidos puede ser determinada por experimentación de rutina, p. ej. por métodos tales como se describe en el Ejemplos. Sin embargo, no se pretende que la presente invención se limite a estos métodos específicos, ya que pueden resultar útiles otros métodos conocidos por los expertos en la técnica.
[0164] En algunas realizaciones, las cetoreductasas descritas en este documento pueden usarse en un método para reducir el sustrato 7-oxo-5,6-dihidro-5H-ciclopenta(hetero)areno de fórmula (III) al compuesto correspondiente 7-hidroxi-6,7-dihidro-5H-ciclopenta(hetero)areno de fórmula (IV), donde el método comprende contacto o incubación del compuesto de fórmula (III) con un polipéptido de cetoreductasa descrito en el presente documento en condiciones de reacción adecuadas para la reducción o la conversión del compuesto de fórmula (III) en el compuesto correspondiente 6.7- dihidro-5-hidroxi-7H-ciclopenta(hetero)areno sustituido de fórmula (IV). En algunas realizaciones de este método, el sustrato se reduce al producto en más de aproximadamente 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90% o un exceso diastereomérico mayor.
[0165] En algunas realizaciones, las cetoreductasas descritas en este documento pueden usarse en un método para reducir un tere-butilo 2-(3-cloro-7-oxo-5,6-dihidro-5H-ciclopenta[c]piridina-6-ilo)acetato de sustrato de fórmula (I) a su producto de (S)-alcohol correspondiente, (tere-butilo 2-[(6S,7S)-3-cloro-7-hidroxi-6,7-dihidro-5H-ciclopenta[c]piridina-6-ilo]acetato de metilo), de fórmula (II), donde el método comprende el contacto o incubación del sustrato tere-butilo 2-(3-cloro-7-oxo-5,6-dihidro-5H-ciclopenta[c]piridina-6-ilo)acetatocon un polipéptido de cetoreductasa descrito en este documento en condiciones de reacción adecuadas para la reducción o la conversión de tere-butilo 2-(3-cloro-7-oxo-5,6-dihidro-5H-ciclopenta[c]piridina-6-ilo)acetato a (terc-butilo 2-[(6S,7S)-3-cloro-7-hidroxi-6,7-dihidro-5H-ciclopenta[c]piridina-6-ilo]acetato). En algunos aspectos, el sustrato se reduce al producto con una relación diastereomérica mejorada en más de aproximadamente 2,5 veces con respecto a la SEQ ID NO:4, en donde el polipéptido de cetoreductasa comprende una secuencia de aminoácidos basada en la fórmula de secuencia de SEQ ID NOS: 42, 208, 210, 212, 214, 216, 218, 220, 222, 224, 226, 228, y 238.
[0166] En algunos aspectos, una enzima de cetoreductasa (S)-selectiva modificada derivada de una enzima de cetoreductasa de la especie Laetobaeillus de tipo silvestre puede usarse en un método para reducir la acetofenona a (S)-1-fenetanol en más de aproximadamente 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% o 99,9% o más de exceso estereomérico.
[0167] En algunos aspectos, el sustrato se reduce al producto en mayor que aproximadamente 2,5 veces mayor relación diastereomérica de más de SEQ ID NO:4, donde el polipéptido de cetoreductasa utilizado en el método comprende una secuencia de aminoácidos seleccionada de SEQ iD No :42, 208, 210, 212, 214, 216, 218, 220, 222, 224, 226, 228 y 238. En algunos aspectos de este método, al menos aproximadamente el 95% del sustrato se reduce al producto en más de aproximadamente 90% de exceso diastereoisomérico en menos de 24 horas cuando el método se lleva a cabo con el polipéptido de cetoreductasa en una cantidad de menos de aproximadamente 2% en peso con respecto a la cantidad de sustrato de tere-butilo 2-(3-cloro-7-oxo-5,6-dihidro-5H-ciclopenta[c]piridina-6-ilo)acetato.
[0168] Como es conocido por los expertos en la técnica, las reacciones de reducción de cetoreductasa catalizada normalmente requieren un cofactor. Las reacciones de reducción catalizadas por las enzimas de cetoreductasa manipuladas descritas en el presente documento también requieren típicamente un cofactor, aunque muchas realizaciones de las cetoreductasas modificadas genéticamente requieren mucho menos cofactor que las reacciones catalizadas con enzimas de cetoreductasa naturales. Como se usa en el presente documento, el término "cofactor" se refiere a un compuesto no proteico que opera en combinación con una enzima de cetoreductasa. Los cofactores adecuados para su uso con las enzimas de cetoreductasa modificadas que se describen en este documento incluyen, entre otros, NADP+ (fosfato de dinucleótido de nicotinamida y adenina), NADPH (la forma reducida de NADP+), NAD+ (dinucleótido de nicotinamida y adenina) y NADH (la forma de NAD+). Generalmente, la forma reducida del cofactor se agrega a la mezcla de reacción. La forma de NAD(P)H reducida se puede regenerar opcionalmente a partir de la forma de NAD(P)+ oxidada usando un sistema de regeneración de cofactor.
[0169] El término "sistema de regeneración de cofactor" se refiere a un conjunto de reactivos que participan en una reacción que reduce la forma oxidada del cofactor (p. ej., NADP+ a NADPH). Los cofactores oxidados por la reducción del sustrato de ceto catalizada por la cetoreductasa son regenerados en forma reducida por el sistema de regeneración de cofactores. Los sistemas de regeneración de cofactor comprenden un reductor estequiométrico que es una fuente de reducción de equivalentes de hidrógeno y es capaz de reducir la forma oxidada del cofactor. El sistema de regeneración del cofactor puede comprender además un catalizador, p. ej. un catalizador enzimático, que cataliza la reducción de la forma oxidada del cofactor por el reductor. Los sistemas de regeneración de cofactores para regenerar NADH o NADPH a partir de NAD+ o NADP+, respectivamente, son conocidos en la técnica y pueden usarse en los métodos descritos en el presente documento.
[0170] Sistemas de regeneración de cofactor ejemplares adecuados que se pueden emplear incluyen, pero no están limitados a, glucosa y glucosa deshidrogenasa, formiato y formiato deshidrogenasa, glucosa-6-fosfato y glucosasfosfato deshidrogenasa, un alcohol secundario (p. ej., Isopropanol) y alcohol secundario deshidrogenasa, fosfito y fosfito deshidrogenasa, hidrógeno molecular e hidrogenasa, y similares. Estos sistemas se pueden utilizar en combinación con NADP+/NADPH o NAD+/NADH como cofactor. La regeneración electroquímica usando hidrogenasa también puede usarse como un sistema de regeneración de cofactor. Véase, por ejemplo, la Patente de EE.UU. Nos 5,538,867 y 6,495,023. También son adecuados los sistemas de regeneración de cofactores químicos que comprenden un catalizador metálico y un agente reductor (p. ej., hidrógeno molecular o formiato). Véase, por ejemplo, la publicación PCT WO 2000/053731.
[0171] Los términos "glucosa deshidrogenasa" y "GDH" se usan indistintamente en este documento para referirse a un NAD+ o NADP+ dependiente de enzima que cataliza la conversión de D-glucosa y NAD+ o NADP+ a ácido glucónico y NADH o NADPH, respectivamente. La ecuación (3), a continuación, describe la reducción catalizada por glucosa deshidrogenasa de NAD+ o NADP+ por glucosa.
m GDH
W glucosa NAD(P)+ H20 -----------► acido glucomco + NAD(P)H H*
[0172] Las glucosas deshidrogenases que son adecuadas para su uso en la práctica de los métodos descritos en este documento incluyen tanto glucosa deshidrogenasas de origen natural como glucosa deshidrogenasas de origen no natural. En la bibliografía se ha informado de genes que codifican glucosa deshidrogenasa de origen natural. Por ejemplo, el gen 61297 GDH Bacillus subtilis se expresó en E. coli y se informó que exhibía las mismas propiedades fisicoquímicas que la enzima producida en su huésped nativo (Vasantha y col., 1983, Proc. Natl. Acad. Sci. EE.UU.
80: 785). La secuencia génica del gen GDH B. subtilis, que corresponde a GenBank Acc. N° M12276, fue informado por Lampel et al., 1986, J. Bacteriol. 166: 238-243, y en forma corregida por Yamane et al., 1996, Microbiology 142: 3047-3056 como Genbank Acc. N° D50453. Los genes GDH de origen natural también incluyen aquellos que codifican el GDH de B. cereus ATCC 14579 (Nature, 2003, 423: 87-91; Genbank Acc. N° AE017013) y B. megaterium (Eur. J. Biochem., 1988, 174: 485-490, Genbank Acc. N° X12370; J. Ferment. Bioeng., 1990, 70: 363-369, Genbank Acc. N° GI216270). Glucosa deshidrogenasas de Bacillus sp. se proporcionan en la publicación PCT WO 2005/018579 como SEQ ID NOS: 10 y 12 (codificadas por secuencias polinucleotídicas correspondientes a SEQ ID NOS: 9 y 11, respectivamente, de la publicación PCT).
[0173] Glucosa deshidrogenasas no naturales pueden generarse utilizando métodos conocidos, tales como, por ejemplo, mutagénesis, evolución dirigida, y similares. Las enzimas GDH que tienen una actividad adecuada, ya sea de origen natural o no natural, pueden identificarse fácilmente usando el ensayo descrito en el Ejemplo 4 de la publicación PCT WO 2005/018579. En la publicación PCT WO 2005/018579 se proporcionan ejemplos de glucosa deshidrogenasas no naturales como SEQ ID NOS: 62, 64, 66, 68, 122, 124 y 126. Las secuencias de polinucleótidos que las codifican se proporcionan en la publicación PCT WO 2005/018579 como SEQ ID NOS: 61, 63, 65, 67, 121, 123 y 125, respectivamente. Las glucosas deshidrogenasas de origen no natural adicionales que son adecuadas para su uso en las reacciones de reducción catalizadas por cetoreductasa descritas en el presente documento se proporcionan en las publicaciones de solicitud de Estados Unidos números 2005/0095619 y 2005/0153417.
[0174] Las glucosas deshidrogenasas empleadas en las reacciones de reducción catalizadas por cetoreductasa descritas en este documento pueden exhibir una actividad de al menos aproximadamente 10 pmol/min/mg y, a veces, al menos aproximadamente 102 pmol/min/mg o aproximadamente 103 pmol/min/mg, hasta aproximadamente 104 pmol/min/mg o mayor en el ensayo descrito en el Ejemplo 4 de la publicación PCT WO 2005/018579.
[0175] Las reacciones de reducción de cetoreductasa catalizada descritas en este documento se llevan a cabo generalmente en un disolvente. Los disolventes adecuados incluyen agua, disolventes orgánicos (p. ej., acetato de etilo, acetato de butilo, 1-octanol, heptano, octano, metilo t-butilo éter (MTBE), tolueno y similares), líquidos iónicos (p. ej., 1-etilo-4-tetrafluoroborato de metilimidazolio, tetrafluoroborato de 1-butilo-3-metilimidazolio, hexafluorofosfato de 1-butilo-3-metilimidazolio y similares). En algunas realizaciones, se utilizan disolventes acuosos, que incluyen agua y sistemas de codisolventes acuosos.
[0176] Los sistemas de codisolventes acuosos ejemplares tienen agua y uno o más disolventes orgánicos. En general, un componente de disolvente orgánico de un sistema de codisolvente acuoso se selecciona de manera que no inactive completamente la enzima de cetoreductasa. Los sistemas codisolventes apropiados pueden identificarse fácilmente midiendo la actividad enzimática de la enzima de cetoreductasa modificada específica con un sustrato definido de interés en el sistema disolvente candidato, utilizando un ensayo de actividad enzimática, como los descritos en este documento.
[0177] El componente de disolvente orgánico de un sistema acuoso de co-disolvente puede ser miscible con el componente acuoso, proporcionando una única fase líquida, o puede ser parcialmente miscible o inmiscible con el componente acuoso, proporcionando dos fases líquidas. Generalmente, cuando se emplea un sistema de codisolvente acuoso, se selecciona para que sea bifásico, con agua dispersa en un disolvente orgánico, o viceversa. Generalmente, cuando se utiliza un sistema de codisolvente acuoso, es deseable seleccionar un disolvente orgánico que pueda separarse fácilmente de la fase acuosa. En general, la relación de agua a disolvente orgánico en el sistema de codisolvente está típicamente en el intervalo de aproximadamente 90:10 a aproximadamente 10:90 (v/v) de disolvente orgánico a agua, y entre 80:20 y 20: 80 (v/v) de disolvente orgánico a agua. El sistema de codisolvente se puede preformar antes de la adición a la mezcla de reacción, o se puede formar in situ en el recipiente de reacción.
[0178] El disolvente acuoso (agua o sistema acuoso co-disolvente) puede ser de pH tamponado o no tamponado. Generalmente, la reducción se puede llevar a cabo a un pH de aproximadamente 10 o menos, normalmente en el intervalo de aproximadamente 5 a aproximadamente 10. En algunas realizaciones, la reducción se lleva a cabo a un pH de aproximadamente 9 o menos, generalmente en el intervalo de aproximadamente 5 a aproximadamente 9. En algunas realizaciones, la reducción se lleva a cabo a un pH de aproximadamente 8 o menos, a menudo en el intervalo de aproximadamente 5 a aproximadamente 8, y normalmente en el intervalo de aproximadamente 6 a aproximadamente 8. La reducción también se puede llevar a cabo a un pH de aproximadamente 7,8 o menos, o 7,5 o menos. Alternativamente, la reducción puede llevarse a cabo a un pH neutro, es decir, aproximadamente 7.
[0179] Durante el curso de las reacciones de reducción, el pH de la mezcla de reacción puede cambiar. El pH de la mezcla de reacción se puede mantener a un pH deseado o dentro de un intervalo de pH deseado mediante la adición de un ácido o una base durante el curso de la reacción. Alternativamente, el pH puede controlarse usando un disolvente acuoso que comprenda un tampón. Los tampones adecuados para mantener los intervalos de pH deseados son conocidos en la técnica e incluyen, por ejemplo, fosfato de tampón, tampón trietanolamina y similares. También pueden usarse combinaciones de tampón y adición de ácido o base.
[0180] Cuando se emplea el sistema de regeneración de cofactor de glucosa/glucosa deshidrogenasa, la coproducción de ácido glucónico (pKa = 3,6), tal como se representa en la ecuación (3) anterior hace que el pH de la mezcla de reacción caiga si el ácido glucónico acuoso resultante no se neutraliza de otra manera.
[0181] El pH de la mezcla de reacción se puede mantener en el nivel deseado por técnicas de tamponamiento estándar, en donde el tampón neutraliza el ácido glucónico hasta la capacidad de amortiguación proporcionada, o mediante la adición de un concurrente de base con el curso de la conversión. También se pueden usar combinaciones de tampón y adición de bases. Los tampones adecuados para mantener los intervalos de pH deseados se describen anteriormente. Las bases adecuadas para la neutralización del ácido glucónico son bases orgánicas, por ejemplo, aminas, alcóxidos y similares, y bases inorgánicas, por ejemplo, sales de hidróxido (p. ej., NaOH), sales de carbonato (p. ej., NaHCO3), sales de bicarbonato (p. ej., K2CO3), sales de fosfato básico (p. ej., K2HPO4, Na3PO4) y similares. La adición de una base al mismo tiempo que el curso de la conversión se puede hacer manualmente mientras se controla el pH de la mezcla de reacción o, más convenientemente, usando un valorador automático como una estadística de pH. También se puede utilizar una combinación de capacidad de almacenamiento parcial y adición de base para el control del proceso.
[0182] Cuando se emplea la adición de base para neutralizar el ácido glucónico liberado durante una reacción de reducción catalizada de cetoreductasa , el progreso de la conversión puede ser monitorizada por la cantidad de base añadida para mantener el pH. Normalmente, las bases añadidas a las mezclas de reacción no tamponadas o parcialmente tamponadas durante el transcurso de la reducción se añaden en soluciones acuosas.
[0183] En algunas realizaciones, el sistema de regeneración del cofactor puede comprender una formiato deshidrogenasa. Los términos "formiato deshidrogenasa" y "FDH" se usan indistintamente en este documento para referirse a una enzima dependiente de NAD+ o NADP+ que cataliza la conversión de formiato y NAD+ o NADP+ en dióxido de carbono y NADH o NADPH, respectivamente. Las formiato deshidrogenasas que son adecuadas para su uso como sistemas de regeneración de cofactores en las reacciones de reducción catalizadas por cetoreductasa descritas en el presente documento incluyen tanto formiato deshidrogenasas de origen natural como formiato deshidrogenasas de origen no natural. Las formiato deshidrogenasas incluyen las correspondientes a SEQ ID NOS: 70 (Pseudomonas sp.) y 72 (Candida boidinii) de la publicación PCT WO 2005/018579, que están codificadas por secuencias de polinucleótidos correspondientes a SEQ ID NOS: 69 y 71, respectivamente, de publicación PCT 2005/018579. Formiato Deshidrogenasas empleadas en los métodos descritos en este documento, ya sea de origen natural o de origen no natural, pueden exhibir una actividad de al menos aproximadamente 1 pmol/min/mg, a veces al menos aproximadamente 10 pmol/min/mg, o al menos aproximadamente 102 pmol/min/mg, hasta aproximadamente 103 pmol/min/mg o mayor, y pueden ser seleccionados fácilmente para la actividad en el ensayo descrito en el Ejemplo 4 de la publicación PCT WO 2005/018579.
[0184] Como se usa en este documento, el término "formiato" se refiere a anión formiato (HCO2-), ácido fórmico (HCO2H), y mezclas de los mismos. El formiato se puede proporcionar en forma de una sal, típicamente una sal alcalina o de amonio (p. ej., HCO2Na, KHCO2NH4, y similares), en forma de ácido fórmico, ácido fórmico típicamente acuoso, o mezclas de los mismos. El ácido fórmico es un ácido moderado. En soluciones acuosas dentro de varias unidades de pH de su pKa (pKa = 3,7 en agua), el formiato está presente como HCO2- y HCO2H en concentraciones de equilibrio. A valores de pH por encima de aproximadamente pH 4, el formato está presente predominantemente como HCO2-. Cuando se proporciona formiato como ácido fórmico, la mezcla de reacción típicamente se tampona o se hace menos ácida añadiendo una base para proporcionar el pH deseado, típicamente de aproximadamente pH 5 o superior. Las bases adecuadas para la neutralización de ácido fórmico incluyen, pero no se limitan a, bases orgánicas, por ejemplo, aminas, alcóxidos y similares, y bases inorgánicas, por ejemplo, sales de hidróxido (p. ej., NaOH), sales de carbonato (p. ej., NaHCO3), sales de bicarbonato (p. ej., K2CO3), sales de fosfato básico (p. ej., K2HPO4, Na3PO4) y similares.
[0185] Para valores de pH por encima de aproximadamente pH 5, al que formiato está presente predominantemente como HCO2", la Ecuación (4) a continuación, describe la reducción catalizada deshidrogenasa-formiato de NAD+ o NADP+ por formiato.
/ a \ run
(4) HC02 NAD(P)+ ----------- C 0
Figure imgf000027_0001
[0186] Cuando formiato y formiato deshidrogenasa se emplean como el sistema de regeneración de cofactor, el pH de la mezcla de reacción puede mantenerse en el nivel deseado por técnicas de tamponamiento estándar, en donde el tampón libera protones hasta la capacidad de amortiguación proporcionada, o mediante la adición de un ácido concurrente con el curso de la conversión. Los ácidos adecuados para añadir durante el curso de la reacción para mantener el pH incluyen ácidos orgánicos, por ejemplo, ácidos carboxílicos, ácidos sulfónicos, ácidos fosfónicos y similares, ácidos minerales, por ejemplo, ácidos hidrohálicos (como ácido clorhídrico), ácido sulfúrico, ácido fosfórico y similares, sales ácidas, por ejemplo, sales de dihidrogenofosfato (p. ej., KH2PO4), sales de bisulfato (p. ej., NaHSO4) y similares. Algunas realizaciones utilizan ácido fórmico, por lo que se mantienen tanto la concentración de formiato como el pH de la solución.
[0187] Cuando se emplea de adición de ácido para mantener el pH durante una reacción de reducción utilizando el sistema de regeneración de cofactor de formiato/formiato deshidrogenasa, el progreso de la conversión puede ser monitorizado por la cantidad de ácido añadido para mantener el pH. Normalmente, los ácidos añadidos a mezclas de reacción no tamponadas o parcialmente tamponadas durante el transcurso de la conversión se añaden en soluciones acuosas.
[0188] Los términos "deshidrogenasa de alcohol secundario" y "sADH" se usan indistintamente en este documento para referirse a un NAD+ o NADP+ dependiente de enzima que cataliza la conversión de un alcohol secundario y NAD+ o NADP+ a una cetona y NADH o NADPH, respectivamente. La ecuación (5), a continuación, describe la reducción de NAD+ o NADP+ por un alcohol secundario, ilustrado por isopropanol.
Figure imgf000027_0002
[0189] Deshidrogenasas de alcohol secundario que son adecuadas para su uso como sistemas de cofactor de regeneración en las reacciones de reducción de cetoreductasa catalizada descritas en este documento incluyen deshidrogenasas de alcohol secundario tanto de origen natural, como deshidrogenasas de alcohol secundario de origen no natural. Las deshidrogenasas de alcohol secundario de origen natural incluyen deshidrogenasas de alcohol conocidas de Thermoanerobium brockii, Rhodococcus etythropolis, Lactobacillus kéfir y Lactobacillus brevis, y las deshidrogenasas de alcohol secundario de origen no natural incluyen alcohol deshidrogenasas manipuladas derivadas de las mismas. Las deshidrogenasas de alcohol secundario empleadas en los métodos descritos en el presente documento, ya sean de origen natural o no natural, pueden exhibir una actividad de al menos aproximadamente 1 pmol/min/mg, a veces al menos aproximadamente 10 pmol/min/mg, o al menos sobre 102 pmol/min/mg, hasta aproximadamente 103 pmol/min/mg o superior.
[0190] Alcoholes secundarios adecuados incluyen alcanoles inferiores secundarios y carbinoles de arilo-alquilo. Los ejemplos de alcoholes secundarios inferiores incluyen isopropanol, 2-butanol, 3-metilo-2-butanol, 2-pentanol, 3-pentanol, 3,3-dimetilo-2-butanol y similares. En una realización, el alcohol secundario es isopropanol. Los carbinoles de arilo-alquilo adecuados incluyen 1-ariletanols sustituidos y no sustituidos.
[0191] Cuando un alcohol secundario y deshidrogenasa de alcohol secundario se emplean como el sistema de regeneración del cofactor, el NAD+ o NADp+ resultante se reduce por la oxidación acoplada del alcohol secundario en la cetona por la deshidrogenasa de alcohol secundario. Algunas cetoreductasas modificadas también tienen actividad para deshidrogenar un reductor de alcohol secundario. En algunas realizaciones que usan alcohol secundario como reductor, la cetoreductasa modificada genéticamente y la deshidrogenasa de alcohol secundario son la misma enzima.
[0192] En la realización de formas de realización de las reacciones de reducción de cetoreductasa catalizada descritas en este documento el empleo de un sistema de regeneración de cofactor, ya sea la forma oxidada o reducida del cofactor se puede proporcionar inicialmente. Como se describió anteriormente, el sistema de regeneración del cofactor convierte el cofactor oxidado en su forma reducida, que luego se utiliza en la reducción del sustrato de cetoreductasa.
[0193] En algunas realizaciones, no se utilizan sistemas de regeneración de cofactor. Para reacciones de reducción llevadas a cabo sin el uso de un cofactor de sistemas de regeneración, el cofactor se añade a la mezcla de reacción en forma reducida.
[0194] En algunas realizaciones, cuando el proceso se lleva a cabo utilizando células completas del organismo huésped, la célula completa puede proporcionar de forma nativa el cofactor. Alternativamente o en combinación, la célula puede proporcionar de forma nativa o recombinante la glucosa deshidrogenasa.
[0195] En la realización de las reacciones de reducción estereoselectiva descritas en el presente documento, la enzima de cetoreductasa modificada, y cualesquiera enzimas que comprenden el sistema de regeneración de cofactor opcional, se puede añadir a la mezcla de reacción en la forma de las enzimas purificadas, células enteras transformadas con gen(es) que codifican las enzimas y/o extractos celulares y/o lisados de dichas células. El gen o genes que codifican la enzima de cetoreductasa modificada y las enzimas de regeneración del cofactor opcional pueden transformarse en células huésped por separado o juntas en la misma célula huésped. Por ejemplo, en algunas realizaciones, un conjunto de células huésped puede transformarse con gen o genes que codifican la enzima de cetoreductasa modificada por ingeniería genética y otro conjunto puede transformarse con gen o genes que codifican las enzimas de regeneración de cofactor. Ambos conjuntos de células transformadas se pueden utilizar juntos en la mezcla de reacción en forma de células enteras o en forma de lisados o extractos derivados de las mismas. En otras realizaciones, una célula huésped puede transformarse con gen(es) que codifican tanto la enzima de cetoreductasa modificada como las enzimas de regeneración del cofactor.
[0196] Las células enteras transformadas con gen(es) que codifican la enzima de cetoreductasa modificada y/o las enzimas opcionales de regeneración de cofactor, o extractos de células y/o lisados de los mismos, pueden ser empleados en una variedad de diferentes formas, incluyendo sólida (p. ej., liofilizada, secada por pulverización y similares) o semisólida (p. ej., una pasta bruta).
[0197] Los extractos celulares o lisados de células se pueden purificar parcialmente por precipitación (sulfato de amonio, polietilenimina, tratamiento térmico o similar, seguido de un procedimiento de desalado antes de la liofilización (p. ej., ultrafiltración, diálisis, y similares). Cualquiera de las preparaciones de células pueden estabilizarse por reticulación usando agentes de reticulación conocidos, tales como, por ejemplo, glutaraldehído o inmovilización a una fase sólida (p. ej., Eupergit C, y similares).
[0198] Los reactivos sólidos (p. ej., enzima, sales, etc.) se pueden proporcionar a la reacción en una variedad de formas diferentes, incluyendo polvo (p. ej., liofilizado, secado por aspersión y similares), solución, emulsión, suspensión y similares. Los reactivos pueden liofilizarse fácilmente o secar por atomización usando métodos y equipos que son conocidos por los expertos en la técnica. Por ejemplo, la solución de proteína se puede congelar a -80°C en pequeñas alícuotas, luego se agrega a una cámara de liofilización preenfriada, seguido de la aplicación de un vacío. Después de eliminar el agua de las muestras, la temperatura se eleva típicamente a 4°C durante dos horas antes de la liberación del vacío y la recuperación de las muestras liofilizadas.
[0199] Las cantidades de reactivos utilizados en la reacción de reducción generalmente variará dependiendo de las cantidades de producto deseadas, y concomitantemente la cantidad de sustrato de cetoreductasa empleado. Las siguientes pautas se pueden utilizar para determinar las cantidades de cetoreductasa , cofactor y sistema de regeneración de cofactor opcional que se deben usar. Generalmente, los sustratos de ceto pueden emplearse a una concentración de aproximadamente 20 a 300 gramos/litro usando de aproximadamente 50 mg a aproximadamente 5 g de cetoreductasa y de aproximadamente 10 mg a aproximadamente 150 mg de cofactor. Los expertos en la técnica comprenderán fácilmente cómo variar estas cantidades para adaptarlas al nivel deseado de productividad y escala de producción. Las cantidades apropiadas de sistema de regeneración de cofactor opcional pueden determinarse fácilmente mediante experimentación de rutina en base a la cantidad de cofactor y/o cetoreductasa utilizada. En general, el reductor (p. ej., glucosa, formiato, isopropanol) se utiliza a niveles por encima del nivel equimolar de sustrato de cetoreductasa para lograr una conversión esencialmente completa o casi completa del sustrato de cetoreductasa.
[0200] El orden de adición de los reactivos no es crítico. Los reactivos se pueden agregar juntos al mismo tiempo a un solvente (p. ej., solvente monofásico, sistema de codisolvente acuoso bifásico y similares), o alternativamente, algunos de los reactivos se pueden agregar por separado y algunos juntos en diferentes momentos. Por ejemplo, el sistema de regeneración de cofactor, el cofactor, la cetoreductasa y el sustrato de cetoreductasa pueden añadirse primero al disolvente.
[0201] Para mejorar la eficiencia de mezcla cuando se usa un sistema acuoso co-disolvente, el sistema de regeneración de cofactor, cetoreductasa , y cofactor puede ser añadido y se mezcla en la fase acuosa en primer lugar. A continuación, se puede añadir y mezclar la fase orgánica, seguido de la adición del sustrato de cetoreductasa. Alternativamente, el sustrato de cetoreductasa puede premezclarse en la fase orgánica, antes de la adición a la fase acuosa. Las condiciones adecuadas para llevar a cabo las reacciones de reducción catalizadas por cetoreductasa descritas en este documento incluyen una amplia variedad de condiciones que pueden optimizarse fácilmente mediante experimentación de rutina. que incluye, pero no se limita a, poner en contacto la enzima de cetoreductasa y el sustrato modificados genéticamente a un pH y temperatura experimentales y detectar el producto, por ejemplo, usando los métodos descritos en los Ejemplos proporcionados en este documento.
[0203] La reducción de cetoreductasa catalizada se lleva a cabo típicamente a una temperatura en el intervalo de aproximadamente 15°C a aproximadamente 75°C. Para algunas realizaciones, la reacción se lleva a cabo a una temperatura en el intervalo de aproximadamente 20°C a aproximadamente 55°C. En otras realizaciones más, se lleva a cabo a una temperatura en el intervalo de aproximadamente 20°C a aproximadamente 45°C. La reacción también se puede llevar a cabo en condiciones ambientales.
[0204] La reacción de reducción generalmente puede continuar hasta obtenerse la reducción del sustrato esencialmente completa, o casi completa. La reducción de sustrato a producto se puede controlar usando métodos conocidos detectando sustrato y/o producto. Los métodos adecuados incluyen cromatografía de gases, HPLC y similares. Los rendimientos de conversión del producto de reducción de alcohol generado en la mezcla de reacción son generalmente mayores de aproximadamente 50%, también pueden ser mayores de aproximadamente 60%, también pueden ser mayores de aproximadamente 70%, también pueden ser mayores de aproximadamente 80%, también pueden ser superiores al 90%, y a menudo son superiores a aproximadamente el 97%.
EXPERIMENTAL
[0205] Varias características y realizaciones de la descripción se ilustran en los siguientes ejemplos representativos, que están destinados a ser ilustrativos, y no limitantes.
[0206] En la divulgación experimental siguiente, se aplican las siguientes abreviaturas: ppm (partes por millón); M (molar); mM (milimolar), uM y pM (micromolar); nM (nanomolar); mol (moles); gm y g (gramo); mg (miligramos); ug y pg (microgramos); L y 1 (litro); ml y mL (mililitro); cm (centímetros); mm (milímetros); um y pm (micrómetros); seg. (segundos); min(s) (minuto(s)); h(s) y hr(s) (hora(s)); U (unidades); MW (peso molecular); rpm (rotaciones por minuto); °C (grados centígrados); TA (temperatura ambiente); CDS (secuencia de codificación); ADN (ácido desoxirribonucleico); ARN (ácido ribonucleico); HPLC (cromatografía líquida de alta resolución); FIOPC (multiplicación por mejora sobre el control positivo); HTP (alto rendimiento); LB (caldo Luria); Sigma-Aldrich (Sigma-Aldrich, St. Louis, MO); Millipore (Millipore, Corp., Billerica Ma ); Difco (Difco Laboratories, b D Diagnostic Systems, Detroit, MI); Daicel (Daicel, West Chester, PA); Genetix (Genetix USA, Inc., Beaverton, OR); Molecular Devices (Molecular Devices, LLC, Sunnyvale, CA); Applied Biosystems (Applied Biosystems, parte de Life Technologies, Corp., Grand Island, NY), Agilent (Agilent Technologies, Inc., Santa Clara, CA); Thermo Scientific (parte de Thermo Fisher Scientific, Waltham, MA); Corning (Corning, Inc., Palo Alto, CA); y Bio-Rad (Bio-Rad Laboratories, Hercules, CA).
[0207] En algunos experimentos, las muestras se analizaron por cromatografía líquida de alto rendimiento de fase inversa (HPLC) para cuantificar sustratos y productos residuales. Las reacciones (10 pL) se analizaron en una columna ChiralPak AS-3r (100 x 4,6 mm, tamaño de partícula de 3 pm) (Daicel, West Chester, PA) a 25-50°C eluyendo con 30-35% de acetonitrilo, 65-70% de agua y 0,1% de ácido fosfórico a 1-1,5 ml/min. Los reactivos y productos se cuantificaron mediante su detección UV a 210 o 254 nm. En una realización, las muestras se analizaron a 30°C con acetonitrilo al 35%, agua al 65% y ácido fosfórico al 0,1% a 1 ml/min. Una mezcla racémica de sustrato eluyó a los 8,0 min, el producto 2a eluyó a los 4,2 min, el 2c eluyó a los 4,6 min, el 2b eluyó a los 5,3 min y el 2d eluyó a los 6,1 min.
EJEMPLO 1
Construcción de genes de cetoreductasa y vectores de expresión
[0208] El gen que codifica cetoreductasa L. kifer (KRED) de tipo silvestre fue diseñado para la expresión en E. coli basado en la secuencia de aminoácidos informada de la cetoreductasa y un algoritmo de codón de optimización como se describe en Ejemplo 1 de WO2008/042876. El gen se sintetizó usando oligonucleótidos compuestos por 42 nucleótidos y se clonó en el vector de expresión pCK11 0900 (véase la Figura 3 de la Publicación de Solicitud de Patente de Ee .UU. n° 2006/0195947) bajo el control de un promotor lac. El vector de expresión también contenía el origen de replicación P15a y el gen de resistencia al cloranfenicol. La actividad de la cetoreductasa de tipo silvestre se confirmó como se describe en el documento WO2008/042876. Los polinucleótidos que codifican cetoreductasas modificadas genéticamente de la presente divulgación también se clonaron en el vector pCK110900 para la expresión en E. coli W311 0. La evolución dirigida del gen KRED se llevó a cabo seleccionando primero el gen original (es decir, SEQ ID NOS: 4, 9, 25, 41) seguida de la construcción de bibliotecas de genes variantes en las que las posiciones asociadas con determinadas características estructurales se sometieron a mutagénesis. A continuación, estas bibliotecas se cultivaron en placas, se cultivaron y se cribaron usando ensayos HTP como se describe en los Ejemplos 2 a 7.
EJEMPLO 2
Producción y análisis de polipéptidos KRED modificados genéticamente
[0209] Las bibliotecas de plásmidos obtenidas mediante evolución dirigida y que contienen genes de cetoreductasa evolucionados se transformaron en E coli W3110 y se colocaron en medio de agar Luria-Bertani (LB) que contenía glucosa al 1% y 30 pg/ml de cloranfenicol (CAM). Después de la incubación durante al menos 16 h a 30°C, las colonias se recogieron con un recolector de colonias robótico Q-bot® (Genetix) en una placa de microtitulación de pocillos poco profundos de 96 pocillos que contenía 200 ml de LB, glucosa al 1% y 30 ml g/ml CAM. Las células se cultivaron de 18 a 20 h a 30°C, con agitación a 200 rpm. Veinte pL de este cultivo se transfirió a 360 pL de Terrific Broth (TB) y 30 pg/ml de CAM. Después de la incubación de placas de pocillos profundos a 30°C con agitación a 250 rpm durante 2,5 h (OD600 0,6-0,8), se indujo la expresión génica recombinante mediante isopropilo tioglucósido (IPTG) hasta una concentración final de 1 mM. A continuación, las placas se incubaron a 30°C con agitación a 250 rpm durante 18-21 h.
[0210] Los cultivos celulares se sedimentaron a 3500 x g durante 20 min, y se descartaron sus sobrenadantes. Los sedimentos celulares se lisaron en 300 pl de 20 mM Tris, 1 mM MgCh, pH 7,5 con 1 g/L de lisozima y 0,5 g/L de sulfato de polimixina B mediante agitación a TA durante 2 h. Las muestras se centrifugaron a 3500 x g durante 20 min para aclarar los restos celulares, y el sobrenadante se usó para llevar a cabo las transformaciones descritas en los Ejemplos 3 a 7.
EJEMPLO 3
Variantes de KRED de SEQ ID NO:4
[0211] Variantes de KRED de E. coli fueron generadas como se describe en el Ejemplo 1. Para analizar la selectividad de las variantes, se añadieron 25 pL de sobrenadante producido como se describe en el Ejemplo 2 a una mezcla de 50 pL de sustrato (4 g/L) en isopropanol y 25 pL de 4 g/L NADP en fosfato de sodio 400 mM pH 9.0. Las reacciones se incubaron a 50°C durante 1 h y se inactivaron mediante la adición de 100 pL de CH3CN. La mezcla apagada (100 pL) se añadió a 50 pL de ácido fosfórico al 0,3%, se mezcló brevemente. Las muestras de reacción (10 pL) se analizaron mediante HPLC de fase inversa para cuantificar los sustratos y productos residuales como se describió anteriormente. Las variantes significativamente mejoradas se proporcionan en la Tabla 4.1, a continuación.
Figure imgf000030_0001
EJEMPLO 4
Variantes KRED de SEQ ID NO:9
[0212] Variantes de KRED E. coli se generaron como se describe en el Ejemplo 1. Para el análisis de la selectividad de las variantes, se añadió 25 pL de sobrenadante producido como se describe en el Ejemplo 2 a 180 pL de 20 mM Tris, 1 mM MgCl2, pH 7,5. El sobrenadante diluido (25 pL) se añadió a una mezcla de 50 pL de sustrato (2 g/L) en isopropanol y 25 pL de 4 g/L de NADP en fosfato de sodio 400 mM pH 9,0. Las reacciones se incubaron a 50°C durante 1 h y se inactivaron mediante la adición de 100 pL de CH3CN. La mezcla apagada (100 pL) se añadió a 50 pL de ácido fosfórico al 0,3%, se mezcló brevemente. Las muestras de reacción (10 pL) se analizaron mediante HPLC de fase inversa para cuantificar los sustratos y productos residuales como se describió anteriormente. Las variantes significativamente mejoradas se proporcionan en la Tabla 5.1, a continuación.
Figure imgf000030_0002
(Continuación)
Figure imgf000031_0002
EJEMPLO 5
Variantes de KRED de la SEQ ID NO:25
[0213] Se generaron variantes de KRED E. coli como se describe en el Ejemplo 1. Para el análisis de la selectividad de las variantes, 25 pL de sobrenadante producido como se describe en el Ejemplo 2 se añadió a una mezcla de 50 pL de sustrato (1 g/L) en isopropanol y 25 pL de 0,4 g/L de NADP en fosfato de sodio 400 mM pH 9,0. Las reacciones se incubaron a 50°C durante 2,5 h y se inactivaron mediante la adición de 100 pL de CH3CN. La mezcla apagada (100 pL) se añadió a 50 pL de ácido fosfórico al 0,3%, se mezcló brevemente. Las muestras de reacción (10 pL) se analizaron mediante HPLC de fase inversa para cuantificar los sustratos y productos residuales como se describió anteriormente. Las variantes significativamente mejoradas se proporcionan en la Tabla 6.1, a continuación.
Figure imgf000031_0001
(Continuación)
Figure imgf000032_0001
EJEMPLO 6
Variantes de KRED de SEQ ID NO:41
[0214] Se generaron variantes de KRED de E. coli como se describe en el Ejemplo 1. Para analizar la selectividad de las variantes, se añadieron a una mezcla 30 pL de sobrenadante producido como se describe en el ejemplo 2 de 75 pL de sustrato (20 g/L) en isopropanol y 45 pL de 0,33 g/L de NADP en 333 mM de fosfato de sodio pH 8.0. Las reacciones se incubaron a 30°C durante 1 h y se inactivaron mediante la adición de 100 pL de CH3CN. La mezcla apagada (100 pL) se añadió a 50 pL de ácido fosfórico al 0,3%, se mezcló brevemente. Las muestras de reacción (10 pL) se analizaron mediante HPLC de fase inversa para cuantificar los sustratos y productos residuales como se describió anteriormente. Las variantes significativamente mejoradas se proporcionan en la Tabla 7.1, a continuación.
Figure imgf000032_0002
(Continuación)
Figure imgf000033_0001
EJEMPLO 7
Producción de polipéptidos modificados (producción de escala de frasco agitado de KREDs) y validación de rendimiento
[0215] Las bibliotecas de plásmidos obtenidas a través de la evolución dirigida y que contienen genes de cetoreductasa evolucionados se transformaron en E. coli W3110 y se colocaron en medio de agar de Luria-Bertani (LB) que contiene 1% de glucosa y 30 pg/ml de cloranfenicol (CAM). Después de la incubación durante al menos 16 horas a 30°C, las colonias se recogieron en 50 ml de LB, glucosa al 1% y 30 pg/ml de CAM. Las células se cultivaron de 18 a 20 h a 30°C, con agitación a 250 rpm. A continuación, este cultivo se transfirió a Terrific Broth (TB) y 30 pg/ml de CAM a una OD600 final de 0,2 y un volumen final de 250 ml. Después de la incubación de los matraces a 30°C con agitación a 250 rpm durante 2,5 h (OD6000,6-0,8), se indujo la expresión del gen recombinante mediante isopropilo tioglucósido (IPTG) hasta una concentración final de 1 mM. A continuación, se incubó el matraz a 30°C con agitación a 250 rpm durante 18-21 h. Se sedimentaron células a 3500 x g durante 20 min y se descartó el sobrenadante. El sedimento celular se lavó 3x en 30 ml de fosfato sódico 50 mM enfriado en hielo, pH 7,5, se resuspendió en 12 ml del mismo tampón y se lisó usando un disruptor celular a 18-20 kpsi. Los lisados se aclararon a 10000 x g durante 30 min y los sobrenadantes aclarados se liofilizaron hasta un polvo blanquecino.
[0216] Para evaluar el compuesto final en proceso como condiciones, 500 pL de isopropanol se añadió a 50 mg de sustrato seguido de 500 pL de 200 mM de fosfato de sodio pH 8,0, 0,2 g/L de NADP, y 1 g/L de polvo liofilizado de

Claims (9)

REIVINDICACIONES
1. Un polipéptido modificado que tiene actividad de cetoreductasa, el polipéptido modificado que comprende una secuencia de aminoácidos con al menos 80% de identidad de secuencia con SEQ ID NO:4 y al menos una sustitución seleccionada de una prolina en la posición del polipéptido correspondiente a la posición D150 de SEQ ID NO:4, un residuo distinto de prolina en la posición del polipéptido correspondiente a la posición 94 de SEQ ID NO:4, un residuo distinto de fenilalanina en la posición del polipéptido correspondiente a la posición 145 de SEQ ID NO:4, un residuo distinto de fenilalanina en la posición del polipéptido correspondiente a la posición 249 de SEQ ID NO:4, un residuo distinto de valina en la posición del polipéptido correspondiente a la posición 144 de SEQ ID NO:4, y un residuo distinto de prolina en la posición del polipéptido correspondiente a la posición 190 de SEQ ID NO:4, y donde dicho polipéptido tiene una mayor selectividad de producto 2a:2c en comparación con SEQ ID NO:4 cuando se usa el compuesto (1) como sustrato, donde el compuesto (1) tiene la estructura,
Figure imgf000282_0001
el producto 2a tiene la estructura
Figure imgf000282_0002
y el producto 2c tiene la estructura
Figure imgf000282_0003
2. El polipéptido modificado de la reivindicación 1, en donde dicha secuencia de aminoácidos comprende al menos uno de los siguientes:
el resto distinto de prolina en la posición del polipéptido correspondiente a la posición 94 de SEQ ID NO:4 es un residuo no polar;
el resto distinto de fenilalanina en la posición del polipéptido correspondiente a la posición 145 de SEQ ID NO:4 es un resto aromático;
el resto distinto de fenilalanina en la posición del polipéptido correspondiente a la posición 249 de SEQ ID NO:4 es un resto básico;
el resto distinto de valina en la posición del polipéptido correspondiente a la posición 144 de SEQ ID NO:4 es un resto no polar; y
el resto distinto de prolina en la posición del polipéptido correspondiente a la posición 190 de SEQ ID NO:4 es un resto aromático.
3. El polipéptido modificado de la reivindicación 1, en donde al menos una sustitución se selecciona de una prolina en la posición del polipéptido correspondiente a la posición D150 de SEQ ID NO:4, una glicina en la posición del polipéptido correspondiente a la posición P94 de SEQ ID NO:4, un triptófano en la posición del polipéptido correspondiente a la posición F145 de SEQ ID NO:4, una lisina o arginina en la posición del polipéptido correspondiente a la posición F249 de SEQ ID NO:4, una glicina en el posición del polipéptido correspondiente a la posición V144 de SEQ ID NO:4, y un triptófano en la posición del polipéptido correspondiente a la posición P190 de SEQ ID NO:4.
4. El polipéptido modificado de cualquiera de las reivindicaciones 1-3, en donde la actividad estereoselectiva del polipéptido aumenta al menos 2 veces en comparación con la actividad correspondiente del polipéptido de referencia de SEQ ID NOS: 4, 10, 26 y/o 42.
5. Un polinucleótido que codifica el polipéptido modificado de una cualquiera de las reivindicaciones 1-4.
6. El polinucleótido de la reivindicación 5, en donde el polinucleótido comprende una secuencia de ácido nucleico seleccionada del grupo que consiste en los identificadores de secuencia de número impar de SEQ ID NOS: 5-237.
7. Un vector de expresión que comprende el polinucleótido de las Reivindicaciones 5 o 6.
8. Una célula huésped que comprende el polinucleótido de las Reivindicaciones 5 o 6, o el vector de expresión de la Reivindicación 7.
9. Un método para preparar un polipéptido modificado genéticamente que tiene actividad de cetoreductasa, que comprende cultivar la célula huésped de la reivindicación 8, en condiciones adecuadas para la expresión del polipéptido, que opcionalmente comprende además aislar el polipéptido modificado.
ES16749625T 2015-02-10 2016-02-05 Polipéptidos cetoreductasa para la síntesis de compuestos quirales Active ES2830725T3 (es)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US201562114380P 2015-02-10 2015-02-10
PCT/US2016/016692 WO2016130412A1 (en) 2015-02-10 2016-02-05 Ketoreductase polypeptides for the synthesis of chiral compounds

Publications (1)

Publication Number Publication Date
ES2830725T3 true ES2830725T3 (es) 2021-06-04

Family

ID=56615088

Family Applications (1)

Application Number Title Priority Date Filing Date
ES16749625T Active ES2830725T3 (es) 2015-02-10 2016-02-05 Polipéptidos cetoreductasa para la síntesis de compuestos quirales

Country Status (5)

Country Link
US (3) US10696953B2 (es)
EP (1) EP3256577B1 (es)
DK (1) DK3256577T3 (es)
ES (1) ES2830725T3 (es)
WO (1) WO2016130412A1 (es)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2205727B1 (en) * 2007-10-01 2015-06-24 Codexis, Inc. Ketoreductase polypeptides for the production of azetidinone
WO2016130412A1 (en) 2015-02-10 2016-08-18 Codexis, Inc. Ketoreductase polypeptides for the synthesis of chiral compounds
GB201802383D0 (en) * 2018-02-14 2018-03-28 Givaudan Sa Process
EP3823963A2 (en) 2018-07-16 2021-05-26 Novartis AG Chemical process for preparing phenylpiperidinyl indole derivatives
CN111378695B (zh) * 2020-04-07 2023-07-28 宁波酶赛生物工程有限公司 合成r-3-(2-氯-1-羟基乙基)苯酚的方法、去氧肾上腺素、滴眼剂
WO2024150146A1 (en) * 2023-01-12 2024-07-18 Novartis Ag Engineered ketoreductase polypeptides

Family Cites Families (63)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5538867A (en) 1988-09-13 1996-07-23 Elf Aquitaine Process for the electrochemical regeneration of pyridine cofactors
JP3155107B2 (ja) 1993-01-12 2001-04-09 ダイセル化学工業株式会社 光学活性4−ハロ−3−ヒドロキシ酪酸エステルの製造方法
US6165793A (en) 1996-03-25 2000-12-26 Maxygen, Inc. Methods for generating polynucleotides having desired characteristics by iterative selection and recombination
US5834252A (en) 1995-04-18 1998-11-10 Glaxo Group Limited End-complementary polymerase reaction
US5605793A (en) 1994-02-17 1997-02-25 Affymax Technologies N.V. Methods for in vitro recombination
US6406855B1 (en) 1994-02-17 2002-06-18 Maxygen, Inc. Methods and compositions for polypeptide engineering
US6117679A (en) 1994-02-17 2000-09-12 Maxygen, Inc. Methods for generating polynucleotides having desired characteristics by iterative selection and recombination
US20060257890A1 (en) 1996-05-20 2006-11-16 Maxygen, Inc. Methods and compositions for cellular and metabolic engineering
US6335160B1 (en) 1995-02-17 2002-01-01 Maxygen, Inc. Methods and compositions for polypeptide engineering
US6309883B1 (en) 1994-02-17 2001-10-30 Maxygen, Inc. Methods and compositions for cellular and metabolic engineering
US6995017B1 (en) 1994-02-17 2006-02-07 Maxygen, Inc. Methods for generating polynucleotides having desired characteristics by iterative selection and recombination
US5928905A (en) 1995-04-18 1999-07-27 Glaxo Group Limited End-complementary polymerase reaction
US6395547B1 (en) 1994-02-17 2002-05-28 Maxygen, Inc. Methods for generating polynucleotides having desired characteristics by iterative selection and recombination
US5837458A (en) 1994-02-17 1998-11-17 Maxygen, Inc. Methods and compositions for cellular and metabolic engineering
PT765394E (pt) 1994-06-03 2002-03-28 Novozymes Biotech Inc Lacases myceliophthora purificadas e acidos nucleicos que as codificam
AU2705895A (en) 1994-06-30 1996-01-25 Novo Nordisk Biotech, Inc. Non-toxic, non-toxigenic, non-pathogenic fusarium expression system and promoters and terminators for use therein
JPH08336393A (ja) 1995-04-13 1996-12-24 Mitsubishi Chem Corp 光学活性なγ−置換−β−ヒドロキシ酪酸エステルの製造法
FI104465B (fi) 1995-06-14 2000-02-15 Valio Oy Proteiinihydrolysaatteja allergioiden hoitamiseksi tai estämiseksi, niiden valmistus ja käyttö
US6506602B1 (en) 1996-03-25 2003-01-14 Maxygen, Inc. Methods for generating polynucleotides having desired characteristics by iterative selection and recombination
US6096548A (en) 1996-03-25 2000-08-01 Maxygen, Inc. Method for directing evolution of a virus
US5891685A (en) 1996-06-03 1999-04-06 Mitsubishi Chemical Corporation Method for producing ester of (S)-γ-halogenated-β-hydroxybutyric acid
US6326204B1 (en) 1997-01-17 2001-12-04 Maxygen, Inc. Evolution of whole cells and organisms by recursive sequence recombination
US7148054B2 (en) 1997-01-17 2006-12-12 Maxygen, Inc. Evolution of whole cells and organisms by recursive sequence recombination
DE69835360T2 (de) 1997-01-17 2007-08-16 Maxygen, Inc., Redwood City EVOLUTION Prokaryotischer GANZER ZELLEN DURCH REKURSIVE SEQUENZREKOMBINATION
US6365408B1 (en) 1998-06-19 2002-04-02 Maxygen, Inc. Methods of evolving a polynucleotides by mutagenesis and recombination
US6495023B1 (en) 1998-07-09 2002-12-17 Michigan State University Electrochemical methods for generation of a biological proton motive force and pyridine nucleotide cofactor regeneration
DE19857302C2 (de) 1998-12-14 2000-10-26 Forschungszentrum Juelich Gmbh Verfahren zur enantioselektiven Reduktion von 3,5-Dioxocarbonsäuren, deren Salze und Ester
JP4221100B2 (ja) 1999-01-13 2009-02-12 エルピーダメモリ株式会社 半導体装置
US6436675B1 (en) 1999-09-28 2002-08-20 Maxygen, Inc. Use of codon-varied oligonucleotide synthesis for synthetic shuffling
US6368861B1 (en) 1999-01-19 2002-04-09 Maxygen, Inc. Oligonucleotide mediated nucleic acid recombination
US6917882B2 (en) 1999-01-19 2005-07-12 Maxygen, Inc. Methods for making character strings, polynucleotides and polypeptides having desired characteristics
US6376246B1 (en) 1999-02-05 2002-04-23 Maxygen, Inc. Oligonucleotide mediated nucleic acid recombination
US7702464B1 (en) 2001-08-21 2010-04-20 Maxygen, Inc. Method and apparatus for codon determining
US7024312B1 (en) 1999-01-19 2006-04-04 Maxygen, Inc. Methods for making character strings, polynucleotides and polypeptides having desired characteristics
US6961664B2 (en) 1999-01-19 2005-11-01 Maxygen Methods of populating data structures for use in evolutionary simulations
EP1072010B1 (en) 1999-01-19 2010-04-21 Maxygen, Inc. Oligonucleotide mediated nucleic acid recombination
EP1165757A1 (en) 1999-03-05 2002-01-02 Maxygen, Inc. Encryption of traits using split gene sequences
AU3874900A (en) 1999-03-11 2000-09-28 Eastman Chemical Company Enzymatic reductions with dihydrogen via metal catalyzed cofactor regeneration
US7430477B2 (en) 1999-10-12 2008-09-30 Maxygen, Inc. Methods of populating data structures for use in evolutionary simulations
US6519065B1 (en) 1999-11-05 2003-02-11 Jds Fitel Inc. Chromatic dispersion compensation device
WO2001040450A1 (fr) 1999-12-03 2001-06-07 Kaneka Corporation Nouvelle carbonyl reductase, son gene et son procede d'utilisation
WO2001075767A2 (en) 2000-03-30 2001-10-11 Maxygen, Inc. In silico cross-over site selection
CN1498273A (zh) 2001-03-22 2004-05-19 ����˹�ж�-����˹˹������˾ 取代乙酰苯的立体选择还原
US20050084907A1 (en) 2002-03-01 2005-04-21 Maxygen, Inc. Methods, systems, and software for identifying functional biomolecules
US7747391B2 (en) 2002-03-01 2010-06-29 Maxygen, Inc. Methods, systems, and software for identifying functional biomolecules
US7783428B2 (en) 2002-03-01 2010-08-24 Maxygen, Inc. Methods, systems, and software for identifying functional biomolecules
WO2003078583A2 (en) 2002-03-09 2003-09-25 Maxygen, Inc. Optimization of crossover points for directed evolution
CA2535147A1 (en) 2003-08-11 2005-05-19 Codexis, Inc. Improved glucose dehydrogenase polypeptides and related polynucleotides
EP1654354A1 (en) 2003-08-11 2006-05-10 Codexis, Inc. Improved ketoreductase polypeptides and related polynucleotides
BRPI0413501A (pt) 2003-08-11 2006-10-10 Codexis Inc polipetìdeo, polinucleotìdeo isolado ou recombinante, vetor de expressão, célula hospedeira, e, método de preparar um polipetìdeo de hhdh
KR20060071397A (ko) 2003-08-11 2006-06-26 코덱시스, 인코포레이티드 4-치환된 3-히드록시부티르산 유도체 및 이웃자리 시아노,히드록시 치환된 카르복실산 에스테르의 효소적 제조 방법
WO2005054491A1 (ja) 2003-12-02 2005-06-16 Mercian Corporation 光学活性テトラヒドロチオフェン誘導体の製造方法、および、光学活性テトラヒドロチオフェン-3-オールの晶析方法
US7393667B2 (en) 2005-05-31 2008-07-01 Bristol-Myers Squibb Company Stereoselective reduction process for the preparation of pyrrolotriazine compounds
EP2066788B1 (en) 2006-10-02 2014-07-23 Codexis, Inc. Compositions and methods for producing stereoisomerically pure statins and synthetic intermediates therefor
WO2009029554A2 (en) * 2007-08-24 2009-03-05 Codexis, Inc. Improved ketoreductase polypeptides for the stereoselective production of (r)-3-hydroxythiolane
CN101855342B (zh) * 2007-09-13 2013-07-10 科德克希思公司 用于还原苯乙酮的酮还原酶多肽
EP2205727B1 (en) * 2007-10-01 2015-06-24 Codexis, Inc. Ketoreductase polypeptides for the production of azetidinone
CA2726850C (en) 2008-06-13 2015-06-02 Codexis, Inc. Method of synthesizing polynucleotide variants
US20090312196A1 (en) 2008-06-13 2009-12-17 Codexis, Inc. Method of synthesizing polynucleotide variants
EP2329013B1 (en) * 2008-08-27 2015-10-28 Codexis, Inc. Ketoreductase polypeptides for the production of a 3-aryl-3-hydroxypropanamine from a 3-aryl-3-ketopropanamine
US9139819B2 (en) * 2011-11-18 2015-09-22 Codexis, Inc. Biocatalysts for the preparation of hydroxy substituted carbamates
RU2015154473A (ru) 2013-05-21 2017-06-26 Др. Редди'С Лабораторис Лимитед Способ получения дегидроэпиандростерона и его промежуточных продуктов
WO2016130412A1 (en) 2015-02-10 2016-08-18 Codexis, Inc. Ketoreductase polypeptides for the synthesis of chiral compounds

Also Published As

Publication number Publication date
DK3256577T3 (da) 2020-09-14
EP3256577A1 (en) 2017-12-20
US20200347365A1 (en) 2020-11-05
US10696953B2 (en) 2020-06-30
US20220106575A1 (en) 2022-04-07
US11236308B2 (en) 2022-02-01
EP3256577B1 (en) 2020-08-26
US20180002676A1 (en) 2018-01-04
EP3256577A4 (en) 2018-10-17
WO2016130412A1 (en) 2016-08-18

Similar Documents

Publication Publication Date Title
US11236308B2 (en) Ketoreductase polypeptides for the synthesis of chiral compounds
JP7212972B2 (ja) 産業上の生体触媒作用のための操作されたトランスアミナーゼポリペプチド
US12252723B2 (en) Ketoreductase polypeptides and polynucleotides
EP3469088B1 (en) Biocatalysts and methods for hydroxylation of chemical compounds
EP2847327B1 (en) Biocatalysts and methods for hydroxylation of chemical compounds
EP2780448B1 (en) Biocatalysts for the preparation of hydroxy substituted carbamates
EP4133065A1 (en) Carboxyesterase polypeptides for kinetic resolution
US20230287360A1 (en) Ketoreductase polypeptides and polynucleotides
JP2023062167A (ja) アミドカップリングのためのカルボキシエステラーゼポリペプチド
US20230002744A1 (en) Biocatalysts and methods for hydroxylation of chemical compounds