ES2467918T3

ES2467918T3 - Sistemas de policétido sintasa de AGPI quiméricos y usos de los mismos

Info

Publication number: ES2467918T3
Application number: ES08755645.2T
Authority: ES
Inventors: Craig A. Weaver; Ross Zirkle; Daniel H. Doherty; James G. Metz
Original assignee: DSM IP Assets BV; Martek Biosciences Corp
Current assignee: DSM IP Assets BV; Martek Biosciences Corp
Priority date: 2007-05-16
Filing date: 2008-05-16
Publication date: 2014-06-13
Anticipated expiration: 2028-05-16
Also published as: KR20100020963A; WO2008144473A2; AU2008254837A1; CA2687523C; AU2008254837B2; IL202131A; JP2010527244A; WO2008144473A3; CA2687523A1; HK1143403A1; EP2160470B1; CN101849014A; US8003772B2; CN101849014B; US8309796B2; JP5551584B2; EP2160470A2; US20080022422A1; US8859855B2; US20130143281A1

Abstract

Sistema de policétido sintasa (PKS) de ácidos grasos poliinsaturados (AGPI) quimérico, en el que un dominio deshidrasa-2 (DH2) de la proteína transportadora de b-hidroxiacil-acilo similar a FabA de un primer sistema de PKS de AGPI se sustituye por un dominio DH2 de un segundo sistema de PKS de AGPI diferente, para producir un sistema de PKS de AGPI quimérico que produce una razón diferente de AGPI omega-3 con respecto a omega-6 en comparación con el primer sistema de PKS de AGPI

Description

Sistemas de policétido sintasa de AGPI quiméricos y usos de los mismos

5 Campo de la invención

Esta invención se refiere a sistemas de policétido sintasa (PKS) de ácidos grasos poliinsaturados (AGPI) quiméricos, y particularmente, a sistemas de PKS de AGPI quiméricos de Schizochytrium y Thraustochytrium. Más particularmente, se describen en el presente documento ácidos nucleicos que codifican para tales sistemas de PKS de AGPI, estos sistemas de PKS de AGPI, organismos modificados genéticamente que comprenden tales sistemas de PKS de AGPI, y métodos de preparación y uso de tales sistemas de PKS de AGPI.

Antecedentes de la invención

15 Los sistemas de policétido sintasa (PKS) se conocen generalmente en la técnica como complejos enzimáticos relacionados con los sistemas de ácido graso sintasa (FAS), pero que a menudo se modifican enormemente para producir productos especializados que muestran normalmente poca semejanza con los ácidos grasos. Sin embargo, se ha mostrado ahora que los sistemas similares a PKS, también denominados en el presente documento de manera intercambiable sistemas de PKS de AGPI, sistemas de AGPI sintasa o sistemas de PKS para la producción de AGPI, existen en bacterias marinas y determinados organismos eucariotas que pueden sintetizar ácidos grasos poliinsaturados (AGPI) a partir de acetil-CoA y malonil-CoA. Las rutas de PKS de AGPI para la síntesis de AGPI en Shewanella y otras bacterias marinas, Vibrio marinus, se describen en detalle en la patente estadounidense n.º

6.140.486. Las rutas de PKS de AGPI para la síntesis de AGPI en el traustoquitridio eucariota, Schizochytrium, se describe en detalle en la patente estadounidense n.º 6.566.583. Las rutas de PKS de AGPI para la síntesis de AGPI 25 en eucariotas tales como miembros de Thraustochytriales, incluyendo la descripción adicional de un sistema de PKS de AGPI en Schizochytrium y la identificación de un sistema de PKS de AGPI en Thraustochytrium, incluyendo detalles referentes a usos de estos sistemas, se describen en detalle en la publicación de solicitud de patente estadounidense n.º 20020194641, publicada el 19 de diciembre de 2002, y la publicación de solicitud de patente estadounidense n.º 20070089199, publicada el 19 de abril de 2007. La publicación de solicitud de patente estadounidense n.º 20040235127, publicada el 25 de noviembre de 2004, da a conocer la descripción estructural detallada de un sistema de PKS de AGPI en Thraustochytrium, y detalle adicional referente a la producción de ácido eicosapentaenoico (C20:5, ω-3) (EPA) y otros AGPI usando tales sistemas. La publicación de solicitud de patente estadounidense n.º 20050100995, publicada el 12 de mayo de 2005, da a conocer la descripción estructural y funcional de sistemas de PKS de AGPI en Shewanella olleyana y Shewanella japonica, y usos de tales sistemas.

35 Estas solicitudes también dan a conocer la modificación genética de organismos, incluyendo microorganismos y plantas, con los genes que comprenden la ruta de PKS de AGPI y la producción de AGPI por tales organismos. Además, la publicación de patente PCT n.º WO 05/097982 describe un sistema de PKS de AGPI en Ulkenia, y la publicación de solicitud de patente estadounidense n.º 20050014231 describe genes y proteínas PKS de AGPI de Thraustochytrium aureum.

Se describen sistemas de PKS de AGPI adicionales y usos de los mismos en los documentos WO 02/083870, WO 2004/087879, WO 2006/044646 y WO 2006/135866..

Los investigadores han intentado aprovechar los sistemas de policétido sintasa (PKS) que se han descrito

45 tradicionalmente en la bibliografía que se encuentran en uno de tres tipos básicos, denominados normalmente: tipo I (modular o iterativo), tipo II y tipo III. Con fines de mayor claridad, se observa que el sistema de PKS de tipo I modular anteriormente también se ha denominado simplemente sistema de PKS “modular”, y el sistema de PKS de tipo I iterativo anteriormente también se ha denominado simplemente sistema de PKS “tipo I”. El sistema de tipo II se caracteriza por proteínas separables, cada una de las cuales lleva a cabo una reacción enzimática distinta. Las enzimas actúan conjuntamente para producir el producto final y cada enzima individual del sistema participa normalmente varias veces en la producción del producto final. Este tipo de sistema funciona de manera análoga a los sistemas de ácido graso sintasa (FAS) hallados en plantas y bacterias. Los sistemas de PKS de tipo I iterativo son similares al sistema tipo II en que las enzimas se usan de modo iterativo para producir el producto final. El tipo I iterativo difiere del tipo II en que las actividades enzimáticas, en vez de asociarse con proteínas separables, se

55 producen como dominios de proteínas más grandes. Este sistema es análogo a los sistemas de FAS de tipo I hallados en animales y hongos.

A diferencia de los sistemas tipo II, en los sistemas de PKS de tipo I modular, cada dominio enzimático se usa sólo una vez en la producción del producto final. Los dominios se encuentran en proteínas muy grandes y el producto de cada reacción se pasa a otro dominio en la proteína PKS. Adicionalmente, en los sistemas de PKS descritos anteriormente, si se incorpora un doble enlace carbono-carbono en el producto final, está habitualmente en la configuración trans.

Se han descubierto más recientemente sistemas de tipo III y pertenecen a la familia de enzimas de condensación de

65 la chalcona sintasa de plantas. Los PKS de tipo III son distintos de los sistemas de PKS de tipo I y tipo II y utilizan sustratos de acil-CoA libre en reacciones de condensación iterativas para producir habitualmente un producto final

heterocíclico.

Se considera que los ácidos grasos poliinsaturados (AGPI) son útiles para fines nutricionales, farmacéuticos, industriales, y otros. El suministro actual de AGPI a partir de fuentes naturales y a partir de síntesis química no es 5 suficiente para las necesidades comerciales. Una fuente actual importante para AGPI es a partir de peces marinos; sin embargo, las reservas pesqueras están disminuyendo, y esto puede no ser un recurso sostenible. Adicionalmente, la contaminación, tanto por metales pesados como por moléculas orgánicas tóxicas, es un grave problema del aceite derivado de peces marinos. Los aceites vegetales derivados de cultivos de semillas oleaginosas son relativamente baratos y no tienen los problemas de contaminación asociados con los aceites de pescado. Sin embargo, los AGPI hallados en aceites de plantas desarrolladas comercialmente se limitan normalmente a ácido linoleico (dieciocho carbonos con 2 dobles enlaces, en las posiciones delta 9 y 12 - 18: 2 delta 9,12) y ácido linolénico (18:3 delta 9,12,15). En la ruta convencional (es decir, la ruta “habitual” o ruta “clásica”) para la síntesis de AGPI, ácidos grasos saturados de longitud de cadena media (productos de un sistema de ácido graso sintasa (FAS)) se modifican mediante una serie de reacciones de elongación y desaturación. Los sustratos para la reacción de

15 elongación son acil-CoA graso (la cadena de ácido graso que va a elongarse) y malonil-CoA (la fuente de los 2 carbonos añadidos durante cada reacción de elongación). El producto de la reacción con elongasa es un acil-CoA graso que tiene dos carbonos adicionales en la cadena lineal. Las desaturasas crean dobles enlaces cis en la cadena de ácido graso preexistente mediante la extracción de 2 hidrógenos en una reacción dependiente de oxígeno. Los sustratos para las desaturasas son o bien acil-CoA (en algunos animales) o bien el ácido graso que se esterifica para dar la estructura principal de glicerol de un fosfolípido (por ejemplo, fosfatidilcolina).

Por tanto, debido a que se requieren varias enzimas desaturasas y elongasas para la síntesis de ácidos grasos a partir de ácidos linoleico y linolénico para producir AGPI más insaturados y de cadena más larga, células huésped de plantas modificadas mediante ingeniería genética para la expresión de AGPI tales como EPA y ácido

25 docosahexaenoico (DHA) pueden requerir la expresión de varias enzimas independientes para lograr la síntesis. Adicionalmente, para la producción de cantidades utilizables de tales AGPI, pueden requerirse esfuerzos de modificación mediante ingeniería genética adicionales. Por tanto, resulta de interés obtener material genético implicado en la biosíntesis de AGPI a partir de especies que producen de manera natural estos ácidos grasos (por ejemplo, a partir de un sistema de PKS de AGPI) y expresar el material aislado solo o en combinación en un sistema heterólogo que puede manipularse para permitir la producción de cantidades comerciales de AGPI.

Ha habido muchos esfuerzos para producir AGPI en plantas de cultivo de semillas oleaginosas mediante modificación de los ácidos grasos producidos de manera endógenas. La modificación genética de estas plantas con diversos genes individuales para elongasas y desaturasas de ácidos grasos ha producido hojas o semillas que

35 contienen niveles medibles de AGPI tales como EPA, pero que contienen también un nivel significativo de AGPI de cadena más corta y menos saturados mezclados (Qi et al., Nature Biotech. 22:739 (2004); publicación PCT n.º WO 04/071467; Abbadi et al., Plant Cell 16:1 (2004)); Napier y Sayanova, Proceedings of the Nutrition Society (2005), 64:387-393; Robert et al., Functional Plant Biology (2005) 32:473-479; o publicación de solicitud de patente estadounidense 2004/0172682.

La mejora tanto en la producción microbiana como de plantas de AGPI es un objetivo comercial altamente deseable. Por tanto, sigue habiendo la necesidad en la técnica de un método para producir eficaz y eficientemente cantidades de lípidos (por ejemplo, triacilglicerol (TAG) y fosfolípido (PL)) enriquecidos en AGPI deseados, particularmente en organismos comercialmente útiles tales como microorganismos y plantas de semillas oleaginosas.

Sumario de la invención

Una realización de la invención se refiere a un sistema de PKS de AGPI quimérico, en el que un dominio deshidrosa2 (DH2) de β3-hidroxiacil-ACP similar a FabA de un primer sistema de PKS de AGPI se sustituye por un dominio DH2 de un segundo sistema de PKS de AGPI diferente, para producir un sistema de PKS de AGPI quimérico que produce una razón diferente de AGPI omega-3 con respecto a omega-6 en comparación con el primer sistema de PKS de AGPI. En un aspecto, una proteína que comprende el dominio DH2 del primer sistema de PKS de AGPI se sustituye por una proteína homóloga que comprende el dominio DH2 del segundo sistema de PKS de AGPI. En un aspecto, el dominio DH2 del sistema de PKS de AGPI primero o segundo corresponde a un dominio DH2 de

55 Schizochytrium o Thraustochytrium. En un aspecto, el primer sistema de PKS de AGPI es un sistema de PKS de AGPI de Schizochytrium, y en el que el segundo sistema de PKS de AGPI es un sistema de PKS de AGPI de Thraustochytrium. En un aspecto, el primer sistema de PKS de AGPI es un sistema de PKS de AGPI de Schizochytrium, y en el que el OrfC del sistema de PKS de AGPI de Schizochytrium se sustituye por el OrfC de un traustoquitridio diferente.

En un aspecto de esta realización, el primer sistema de PKS de AGPI es un sistema de PKS de AGPI de Schizochytrium, y en el que el OrfC del sistema de PKS de AGPI de Schizochytrium se sustituye por el OrfC de Thraustochytrium 23B. En un aspecto, un OrfC de este tipo de Thraustochytrium 23B se codifica por una secuencia de ácido nucleico que está optimizada para el uso de codones de Schizochytrium. Una secuencia de ácido nucleico 65 a modo de ejemplo comprende SEQ ID NO: 70. En un aspecto adicional, el OrfA del sistema de PKS de AGPI de Schizochytrium se sustituye por el OrfA de Thraustochytrium 23B. En un aspecto, un OrfA de este tipo de

Thraustochytrium 23B se codifica por una secuencia de ácido nucleico que está optimizada para el uso de codones de Schizochytrium. Una secuencia de ácido nucleico a modo de ejemplo comprende SEQ ID NO: 71. En otro aspecto adicional, el OrfB del sistema de PKS de AGPI de Schizochytrium se sustituye por el OrfB de Thraustochytrium 23B. En un aspecto, un OrfB de este tipo de Thraustochytrium 23B se codifica por una secuencia

5 de ácido nucleico que está optimizada para el uso de codones de Schizochytrium. Una secuencia de ácido nucleico a modo de ejemplo comprende SEQ ID NO: 72. Otras combinaciones de OrfA, B y C resultarán evidentes basándose en esta descripción para los expertos en la técnica.

Aún en otro aspecto de esta realización, el primer sistema de PKS de AGPI es un sistema de PKS de AGPI de Schizochytrium, y el dominio DH2 del OrfC del sistema de PKS de AGPI de Schizochytrium se sustituye por el dominio DH2 de Thraustochytrium 23B. En un aspecto, una secuencia de ácido nucleico a modo de ejemplo que comprende el dominio DH2 de Thraustochytrium 23B comprende SEQ ID NO: 73. En un aspecto, el dominio DH2 de Thraustochytrium 23B se codifica por una secuencia de ácido nucleico que está optimizada para el uso de codones de Schizochytrium. Una secuencia de ácido nucleico de este tipo que comprende el dominio DH2 de

15 Thraustochytrium 23B se ejemplifica mediante la secuencia de ácido nucleico que comprende SEQ ID NO: 75.

Aún en otro aspecto de esta realización, el sistema de PKS de AGPI quimérico comprende una proteína que comprende una secuencia de aminoácidos que es idéntica en al menos el 95% a SEQ ID NO: 74. En un aspecto, el sistema de PKS de AGPI quimérico comprende una proteína que comprende una secuencia de aminoácidos de SEQ ID NO: 74. En un aspecto, el sistema de PKS de AGPI quimérico comprende SEQ ID NO: 2, SEQ ID NO: 4 y SEQ ID NO: 74. En otro aspecto, el sistema de PKS de AGPI quimérico comprende SEQ ID NO: 39, SEQ ID NO: 4 y SEQ ID NO: 62. En otro aspecto, el sistema de PKS de AGPI quimérico comprende SEQ ID NO: 39, SEQ ID NO: 4 y SEQ ID NO: 74. En otro aspecto, el sistema de PKS de AGPI quimérico se codifica por moléculas de ácido nucleico que comprenden: SEQ ID NO: 1, SEQ ID NO: 3 y SEQ ID NO: 70. Aún en otro aspecto, el sistema de PKS de AGPI 25 quimérico se codifica por moléculas de ácido nucleico que comprenden: SEQ ID NO: 1, SEQ ID NO: 3 y SEQ ID NO:

73. En otro aspecto, el sistema de PKS de AGPI quimérico se codifica por moléculas de ácido nucleico que comprenden: SEQ ID NO: 1, SEQ ID NO: 3 y SEQ ID NO: 75. En otro aspecto, el sistema de PKS de AGPI quimérico se codifica por moléculas de ácido nucleico que comprenden: SEQ ID NO: 71, SEQ ID NO: 3 y SEQ ID NO: 70.

Otra realización de la invención se refiere a un método de alteración de la razón de omega-3 con respecto a omega6 de ácidos grasos poliinsaturados (AGPI) producidos por un primer sistema de PKS de AGPI, que comprende expresar cualquiera de los sistemas de PKS de AGPI quiméricos descritos anteriormente en un organismo. En un aspecto, el sistema de PKS de AGPI quimérico se expresa por un microorganismo. En un aspecto, el

35 microorganismo es un Schizochytrium. Aún en otro aspecto, el microorganismo es una levadura. En un aspecto, el sistema de PKS de AGPI quimérico se expresa por una planta.

Aún otra realización de la invención se refiere a un microorganismo o una planta o una parte de la planta modificado genéticamente, que comprende cualquiera de los sistemas de PKS de AGPI quiméricos descritos anteriormente.

Otra realización de la invención se refiere a un método de aumento de la producción de AGPI y de alteración de la razón de omega-3 con respecto a omega-6 de ácidos grasos poliinsaturados (AGPI) producidos por un primer sistema de PKS de AGPI. El método comprende expresar un sistema de PKS de AGPI quimérico en un organismo, en el que el dominio deshidrasa-2 (DH2) de β-hidroxiacil-ACP similar a FabA de un primer sistema de PKS de AGPI

45 se sustituye por un dominio DH2 de un segundo sistema de PKS de AGPI diferente, para producir un sistema de PKS de AGPI quimérico que produce una razón diferente de AGPI omega-3 con respecto a omega-6 en comparación con el primer sistema de PKS de AGPI. El dominio DH2 del segundo sistema de PKS de AGPI está optimizado para el uso de codones del organismo del que se deriva el primer sistema de PKS de AGPI.

También se describe una molécula de ácido nucleico aislada que codifica para una proteína OrfC quimérica que es idéntica en al menos el 95% a SEQ ID NO: 74. En un aspecto, la molécula de ácido nucleico aislada comprende una secuencia de ácido nucleico que es idéntica en al menos el 95% a SEQ ID NO: 73. En un aspecto, la secuencia de ácido nucleico está optimizada para el uso de codones de un organismo en el que va a expresarse la molécula de ácido nucleico. Como ejemplo, la secuencia de ácido nucleico puede optimizarse para el uso de codones de un

55 organismo del que se deriva una porción de la proteína quimérica. La secuencia de ácido nucleico puede ser idéntica en al menos el 95% a SEQ ID NO: 75.

También se describe una molécula de ácido nucleico recombinante que comprende cualquiera de las moléculas de ácido nucleico descritas anteriormente.

Se describe además una célula huésped recombinante que se ha transfectado con cualquiera de las moléculas de ácido nucleico descritas anteriormente. En un aspecto, la célula es un microorganismo. En un aspecto, el microorganismo es un Schizochytrium. En un aspecto, el microorganismo es una bacteria. En un aspecto, el microorganismo es una levadura. En un aspecto, la célula es una célula de planta.

65 También se describe una planta modificada genéticamente o parte de la misma, que comprende cualquiera de las células huésped recombinantes descritas anteriormente.

También se describe un sistema de PKS de AGPI quimérico, que comprende: (a) al menos un dominio enoil-ACP reductasa (ER); (b) al menos cuatro dominios ACP; (c) al menos dos dominiosβ-cetoacil-ACP sintasa (KS); (d) al

5 menos un dominio aciltransferasa (AT); (e) al menos un dominio β-cetoacil-ACP reductasa (KR); (f) al menos dos dominios β-hidroxiacil-ACP deshidrasa (DH) similar a FabA; (g) al menos un dominio de factor de longitud de cadena (CLF); y (h) al menos un dominio malonil-CoA:ACP aciltransferasa (MAT). Al menos uno de los dominios DH es de un primer sistema de PKS de AGPI, y el resto de los dominios (a)-(h) son de un segundo sistema de PKS de AGPI diferente.

También se describe un método de aumento de la producción de AGPI por un organismo que expresa un sistema de PKS de AGPI. El método incluye modificar una molécula de ácido nucleico que codifica para al menos una proteína en el sistema de PKS de AGPI para el uso de codones optimizado del organismo o de un organismo relacionado. En un aspecto, el organismo expresa un sistema de PKS de AGPI recombinante, heterólogo. En un aspecto, el

15 organismo es un Schizochytrium y una molécula de ácido nucleico que codifica para al menos una proteína en el sistema de PKS de AGPI endógeno está optimizada para el uso de codones de Schizochytrium.

Breve descripción de las figuras

La figura 1 es una representación gráfica de la estructura de dominios del sistema de PKS de AGPI de Schizochytrium.

La figura 2A es un dibujo esquemático que muestra la etapa 1 de la construcción de un plásmido que contiene una secuencia de ácido nucleico optimizada para codones de Schizochytrium, sintética que codifica para OrfC de

25 Thraustochytrium 23B (pThOrfC_synPS), así como plásmidos intermedios producidos mediante el procedimiento.

La figura 2B es un dibujo esquemático que muestra la etapa 2 de la construcción de un plásmido que contiene una secuencia de ácido nucleico optimizada para codones de Schizochytrium, sintética que codifica para OrfC de Thraustochytrium 23B (pThOrfC_synPS), así como plásmidos intermedios producidos mediante el procedimiento.

La figura 3A es un dibujo esquemático que muestra las etapas 1-6 de la construcción de un plásmido que codifica para OrfC de Schizochytrium que comprende un dominio DH2 nativo de Thraustochytrium 23B (pDS49), así como plásmidos intermedios producidos mediante el procedimiento.

35 La figura 3B es un dibujo esquemático que muestra la etapa 7 de la construcción de un plásmido que codifica para OrfC de Schizochytrium que comprende un dominio DH2 nativo de Thraustochytrium 23B (pDS49), así como plásmidos intermedios producidos mediante el procedimiento.

La figura 3C es un dibujo esquemático que muestra las etapas 8-9 de la construcción de un plásmido que codifica para OrfC de Schizochytrium que comprende un dominio DH2 nativo de Thraustochytrium 23B (pDS49), así como plásmidos intermedios producidos mediante el procedimiento.

La figura 4A es un dibujo esquemático que muestra la construcción de plásmido DD21 como la primera etapa en la construcción de un plásmido que codifica para OrfC de Schizochytrium que comprende un dominio DH2 optimizado

45 para codones de Schizochytrium, sintético de Thraustochytrium 23B (pDD24), así como plásmidos intermedios producidos mediante el procedimiento.

La figura 4B es un dibujo esquemático que muestra la construcción de plásmido DD22 como la segunda etapa en la construcción de un plásmido que codifica para OrfC de Schizochytrium que comprende un dominio DH2 optimizado para codones de Schizochytrium, sintético de Thraustochytrium 23B (pDD24), así como plásmidos intermedios producidos mediante el procedimiento.

La figura 4C es un dibujo esquemático que muestra la construcción de plásmido pDD24 como la etapa final en la construcción de un plásmido que codifica para OrfC de Schizochytrium que comprende un dominio DH2 optimizado

55 para codones de Schizochytrium, sintético de Thraustochytrium 23B (pDD24), así como plásmidos intermedios producidos mediante el procedimiento.

La figura 5 es un perfil de EMAG de levadura de control y levadura que expresa los OrfA, los OrfB, OrfC y Het I de Schizochytrium.

La figura 6 es el perfil de EMAG para la levadura de la figura 5, expandido para ilustrar la producción de AGPI objetivo.

Descripción detallada de la invención

65 La presente invención se refiere en general a sistemas de policétido sintasa (PKS) de ácidos grasos poliinsaturados

(AGPI), también conocidos como sistemas de AGPI sintasa, incluyendo sistemas de PKS de AGPI de traustoquitridios (por ejemplo, Schizochytrium y Thraustochytrium), laberintúlidos, bacterias marinas, y otros organismos que contienen PKS de AGPI, y proteínas PKS de AGPI quiméricas y sistemas producidos a partir de las mismas. La presente invención se refiere a organismos modificados genéticamente que comprenden tales sistemas 5 de PKS de AGPI, y a métodos de preparación y uso de tales sistemas para la producción de productos de interés, incluyendo moléculas bioactivas. En una realización preferida, la presente invención se refiere a un método para producir AGPI en un microorganismo o en una planta de semilla oleaginosa o parte de la planta que se ha modificado genéticamente para expresar un sistema de PKS de AGPI de la presente invención. Los aceites producidos por el microorganismo o la planta contienen al menos un AGPI producido por el sistema de PKS de AGPI, y en el caso de la planta, están sustancialmente libres de AGPI de cadena más corta y menos insaturados mezclados que son productos de ácidos grasos producidos mediante la modificación de productos de los sistemas de FAS. La presente invención incluye específicamente métodos para modificar la cantidad de AGPI y la razón de AGPI producidos por un sistema de PKS de AGPI, y en un aspecto de la invención, la razón de AGPI omega-3 con respecto a omega-6 o la razón de un AGPI con respecto a otro(s) AGPI (por ejemplo, la razón de DHA con respecto

15 a EPA), que puede aplicarse a la creación y el uso de cualquier constructo de PKS de AGPI y/u organismo modificado genéticamente, tal como se ejemplifica y describe en detalle en el presente documento.

En primer lugar, los presentes inventores describen en el presente documento un dominio de un sistema de PKS de AGPI que es tanto necesario como suficiente para modificar la razón de AGPI que se producen por un sistema de PKS de AGPI cuando se producen más de un AGPI, y proporcionan constructos quiméricos novedosos, sistemas de PKS de AGPI quiméricos novedosos, organismos novedosos, y métodos novedosos para producir cantidades modificadas de AGPI usando este descubrimiento. En segundo lugar, los presentes inventores describen en el presente documento métodos, modificaciones, y una variedad de sistemas de PKS de AGPI quiméricos y constructos para optimizar la expresión de PKS de AGPI en huéspedes heterólogos (o en un huésped endógeno)

25 para aumentar la producción de AGPI por el organismo. La invención incluye una descripción detallada del uso de estos dos descubrimientos, solos o en conjunto para potenciar y dirigir la producción de AGPI en un organismo.

Más particularmente, con respecto a determinadas realizaciones de la invención, trabajo previo de los presentes inventores y colaboradores (véase el ejemplo 8 en la publicación de solicitud de patente estadounidense n.º 20050100995) demostró que la región codificante de orfC de Thraustochytrium 23B (representada en el presente documento por SEQ ID NO: 62) podría sustituir funcionalmente la región codificante de orfC de Schizochytrium en el locus de OrfC en el genoma. Esto se determinó creando en primer lugar una deleción exacta de la región codificante de orfC de Schizochytrium orfC que contenía un casete de resistencia a antibióticos en su lugar (indicado como ΔorfC::ZEO) dando como resultado una cepa (indicada como B32-Z1) con un requisito de crecimiento obligado para

35 DHA y resistencia a Zeocin™. Entonces se construyó un plásmido en el que se clonó exactamente la región codificante de orfC de Th.23B entre regiones no codificantes aguas arriba y aguas abajo del orfC de Schizochytrium. La transformación de la cepa de ΔorfC::ZEO de Schizochytrium con este constructo de orfC de Th.23B dio como resultado la complementación de los transformantes de deleción y prototróficos (que no requieren DHA), sensibles a Zeocin. Se determinó que estos transformantes derivados de acontecimientos de recombinación de doble cruzamiento en el locus de OrfC de manera que la región codificante de orfC de Th.23B se había sustituido exactamente por la de Schizochytrium; es decir, sustitución génica. El análisis del contenido en ácidos grasos de estos transformantes mostró que la razón DHA/DPA se había cambiado de aproximadamente 2,3 (en Schizochytrium ATCC20888 de tipo natural) a aproximadamente 8,3 (aproximadamente la de Th.23B). Este resultado indicó que el gen orfC (que contiene tres dominios, DH1, DH2 y ER, en Schizochytrium y

45 Thraustochytrium) desempeña un papel importante en la determinación de la razón n-3/n-6 (omega-3/omega-6) de productos de AGPI. Sin embargo, la producción de AGPI totales en la cepa que contiene de orfC Th.23B, aunque significativa, fue menor que la del huésped de Schizochytrium de tipo natural (aproximadamente el 60%).

El examen de estas dos regiones codificantes de orfC condujo a los inventores a considerar que el gen de Th.23B se expresa escasamente en Schizochytrium debido a patrones de uso de codones notablemente diferentes entre Schizochytrium y Thraustochytrium. Los inventores han descubierto ahora que usando una región codificante de orfC de Th.23B “sintética” (es decir, una región codificante producida de manera sintética) con uso de codones optimizado para el patrón de Schizochytrium, se potenció la producción de DHA, mientras que se mantuvo la razón n-3/n-6 aumentada observada con el orfC de Th.23B no sintético (véanse los ejemplos 1 y 4).

55 Los inventores también han descrito previamente la existencia de dominios identificables dentro de la proteína OrfC para Schizochytrium y Thraustochytrium: deshidratasa 1 (DH1), deshidratasa 2 (DH2), y enoil reductasa (ER) (por ejemplo, véase la publicación de solicitud de patente estadounidense n.º 20020194641, citada anteriormente; la publicación de solicitud de patente estadounidense n.º 20040235127, citada anteriormente), y han enseñado que se cree que uno o más de los dominios en OrfC está implicado en el control del tipo y/o la razón de ácidos grasos producidos por el sistema de PKS de AGPI. En este documento, los inventores demuestran en sistemas de Schizochytrium, E. coli y levadura que el dominio DH2 solo es responsable de la mayor parte o la totalidad del efecto del sistema de PKS de AGPI sobre la razón de ácidos grasos omega-3 con respecto a omega-6 (n-3/n-6). En particular, los inventores realizaron en primer lugar experimentos en los que se usaron diversos dominios de OrfC de

65 Thraustochytrium 23B para sustituir los dominios correspondientes en el OrfC de Schizochytrium (datos no mostrados). Los inventores encontraron que la sustitución del dominio ER de OrfC de Schizochytrium por el de Thraustochytrium no cambió significativamente la razón DHA/DPA en comparación con Schizochytrium de tipo natural (históricamente de aproximadamente 2,3). Sin embargo, la sustitución de ambos dominios DH de Schizochytrium por los dominios correspondientes de Thraustochytrium aumentó significativamente la razón DHA/DPA hacia la de Thraustochytrium 23B de tipo natural (históricamente de aproximadamente 8,3-10), y la

5 sustitución de sólo el dominio DH2 de Schizochytrium por el de Thraustochytrium 23B, fue suficiente para lograr eficazmente el mismo resultado. Los ejemplos 2, 3, 4, 5, y 6 proporcionan una variedad de resultados experimentales que demuestran el efecto del dominio DH2 sobre la razón de ácidos grasos omega-3 con respecto a omega-6 (n-3/n-6) en sistemas de PKS de AGPI.

Los presentes inventores también describen el uso de una variedad de sistemas de PKS de AGPI quiméricos para aumentar la producción de AGPI por el organismo huésped, y han realizado el descubrimiento inesperado de que determinadas combinaciones de PKS de AGPI quiméricos (por ejemplo, sistemas de PKS de AGPI quiméricos compuestos por combinaciones particulares de Orf de Schizochytrium y Thraustochytrium) tienen una producción de AGPI significativamente mayor, y en un ejemplo, de producción de DHA, que los organismos nativos o que otros

15 sistemas de PKS de AGPI quiméricos. Por ejemplo, los inventores demuestran que un sistema de PKS de AGPI quimérico compuesto por un OrfA y OrfC de Thraustochytrium 23B y un OrfB de Schizochytrium, cuando se expresan en un organismo huésped de Schizochytrium, produce significativamente más ácidos grasos y significativamente más DHA específicamente, que Schizochytrium nativo o que otros sistemas de PKS de AGPI quiméricos derivados de estos dos organismos (ejemplo 8). Por consiguiente, la invención proporciona orientación sustancial sobre la producción de varios sistemas de PKS de AGPI diferentes que tienen una producción aumentada de AGPI y razones n-3/n-6 mejoradas, en comparación con algunas AGPI sintasas de tipo natural (no quiméricas).

Tal como se usa en el presente documento, un sistema de PKS de AGPI (que también puede denominarse un sistema de AGPI sintasa, una AGPI sintasa, o un sistema similar a PKS para la producción de AGPI) generalmente 25 tiene las siguientes características de identificación: (1) produce AGPI, y particularmente, AGPI de cadena larga, como producto natural del sistema; y (2) comprende varias proteínas multifuncionales ensambladas en un complejo que realiza tanto procesamiento iterativo de la cadena de ácido graso así como procesamiento no iterativo, incluyendo isomerización trans-cis y reacciones de reducción de enoílo en ciclos seleccionados. Además, los dominios ACP presentes en las enzimas AGPI sintasas requieren activación mediante unión de un cofactor (4fosfopanteteína). La unión de este cofactor se lleva a cabo por las fosfopanteteinil transferasas (PPTasa). Si las PPTasas endógenas del organismo huésped no pueden activar los dominios ACP de AGPI sintasas, entonces es necesario proporcionar una PPTasa que pueda llevar a cabo esa función. Los inventores han identificado la enzima Het I de Nostoc sp. como PPTasa a modo de ejemplo y adecuada para activar dominios ACP de AGPI sintasas. La referencia a un sistema de PKS de AGPI o una AGPI sintasa se refiere colectivamente a todos los genes y sus

35 productos codificados que actúan en un complejo para producir AGPI en un organismo. Por tanto, el sistema de PKS de AGPI se refiere específicamente a un sistema de PKS para el que los productos naturales son AGPI.

Más específicamente, un sistema de PKS de AGPI tal como se hace referencia en el presente documento produce ácidos grasos poliinsaturados (AGPI) y particularmente, AGPI de cadena larga, como productos. Por ejemplo, un organismo que contiene de manera endógena (de manera natural) un sistema de PKS de AGPI produce AGPI usando este sistema. Según la presente invención, AGPI son ácidos grasos con una longitud de la cadena carbonada de al menos 16 carbonos, y más preferiblemente al menos 18 carbonos, y más preferiblemente al menos 20 carbonos, y más preferiblemente 22 o más carbonos, con al menos 3 o más dobles enlaces, y preferiblemente 4

o más, y más preferiblemente 5 o más, e incluso más preferiblemente 6 o más dobles enlaces, en los que todos los

45 dobles enlaces están en la configuración cis. La referencia a ácidos grasos poliinsaturados de cadena larga (AGPICL) en el presente documento se refiere más particularmente a ácidos grasos de longitud de la cadena carbonada de 18 y más, y preferiblemente longitud de la cadena carbonada de 20 y más, que contienen 3 o más dobles enlaces. Los AGPICL de la serie de omega-6 incluyen: ácido gamma-linolénico (C18:3), ácido di-homogamma-linolénico (C20:3n-6), ácido araquidónico (C20:4n-6), ácido adrénico (también denominado ácido docosatetraenoico o DTA) (C22:4n-6), y ácido docosapentaenoico (C22:5n-6). Los AGPICL de la serie de omega-3 incluyen: ácido alfa-linolénico (C18:3), ácido eicosatrienoico (C20:3n-3), ácido eicosatetraenoico (C20:4n-3), ácido eicosapentaenoico (C20:5n-3), ácido docosapentaenoico (C22:5n-3) y ácido docosahexaenoico (C22:6n-3). Los AGPICL también incluyen ácidos grasos con más de 22 carbonos y 4 o más dobles enlaces incluyendo pero sin limitarse a C28:8(n-3).

55 En segundo lugar, un sistema de PKS de AGPI según la presente invención comprende varias proteínas multifuncionales (y puede incluir proteínas de una única función, particularmente para sistemas de PKS de AGPI de bacterias marinas) que se ensamblan en un complejo que realiza tanto procesamiento iterativo de la cadena de ácido graso así como procesamiento no iterativo, incluyendo isomerización trans-cis y reacciones de reducción de enoílo en ciclos seleccionados. Estas proteínas también pueden denominarse en el presente documento el complejo enzimático de PKS de AGPI central o el sistema de PKS de AGPI central. Las funciones generales de los dominios y motivos contenidos dentro de estas proteínas se conocen individualmente en la técnica y se han descrito en detalle con respecto a diversos sistemas de PKS de AGPI de bacterias marinas y organismos eucariotas (véase, por ejemplo, la patente estadounidense n.º 6.140.486; patente estadounidense n.º 6.566.583; Metz et al., Science

65 293:290-293 (2001); la publicación de solicitud de patente estadounidense n.º 20020194641; la publicación de solicitud de patente estadounidense n.º 20040235127; la publicación de solicitud de patente estadounidense n.º

20050100995 y la publicación PCT n.º WO 2006/135866). Los dominios pueden encontrarse como una única proteína (es decir, el dominio y la proteína son sinónimos) o como uno de dos o más (múltiples) dominios en una única proteína, tal como se mencionó anteriormente.

5 Antes del descubrimiento de un sistema de PKS de AGPI en bacterias marinas (véase la patente estadounidense n.º 6.140.486), no se sabía que los sistemas de PKS presentasen esta combinación de reacciones enzimáticas iterativas y selectivas, y no se pensaba que pudieran producir dobles enlaces carbono-carbono en la configuración cis. Sin embargo, el sistema de PKS de AGPI descrito por la presente invención tiene la capacidad para introducir dobles enlaces cis y la capacidad para variar la secuencia de reacción en el ciclo.

Los presentes inventores proponen usar estas características del sistema de PKS de AGPI para producir una gama de moléculas bioactivas que no podían producirse por los sistemas de PKS descritos previamente (de tipo I iterativo

o modular, de tipo II o de tipo III). Estas moléculas bioactivas incluyen, pero no se limitan a, ácidos grasos poliinsaturados (AGPI), antibióticos u otros compuestos bioactivos, muchos de los cuales se comentarán más

15 adelante. Por ejemplo, usando el conocimiento de las estructuras génicas de PKS de AGPI descritas en el presente documento, puede usarse cualquiera de varios métodos para alterar los genes de PKS de AGPI, o combinar porciones de estos genes con otros sistemas de síntesis, incluyendo otros sistemas de PKS, de manera que se producen nuevos productos. La capacidad inherente de este tipo de sistema particular para realizar reacciones tanto iterativas como selectivas permitirá que este sistema proporcione productos que no se encontrarían si se aplicaran métodos similares a otros tipos de sistemas de PKS.

Preferiblemente, un sistema de PKS de AGPI de la presente invención comprende al menos los siguientes dominios biológicamente activos que están contenidos normalmente en tres o más proteínas: (a) al menos un dominio enoil-ACP reductasa (ER); (b) múltiples dominio(s) de proteína transportadora de acilo (ACP) (por ejemplo, al menos de 25 uno a cuatro, y preferiblemente al menos cinco dominios ACP, y en algunas realizaciones hasta seis, siete, ocho, nueve, diez, o más de diez dominios ACP); (c) al menos dos dominiosβ-cetoacil-ACP sintasa (KS); (d) al menos un dominio aciltransferasa (AT); (e) al menos un dominio β-cetoacil-ACP reductasa (KR); (f) al menos dos dominiosβhidroxiacil-ACP deshidrasa (DH) similares a FabA; (g) al menos un dominio de factor de longitud de cadena (CLF);

(h) al menos un dominio malonil-CoA:ACP aciltransferasa (MAT). Un sistema de PKS de AGPI según la presente invención también puede comprender al menos una región que contiene un motivo de sitio activo conservado de deshidratasa (DH).

Se describe un sistema de PKS de AGPI de Schizochytrium que comprende al menos los siguientes dominios biológicamente activos: (a) dos dominios enoil-ACP reductasa (ER); (b) entre cuatro o cinco y diez o más dominios

35 de proteína transportadora de acilo (ACP), y en un aspecto, nueve dominios ACP; (c) dos dominiosβ-cetoacil-ACP sintasa (KS); (d) un dominio aciltransferasa (AT); (e) un dominio β-cetoacil-ACP reductasa (KR); (f) dos dominiosβhidroxiacil-ACP deshidrasa (DH) similares a FabA; (g) un dominio de factor de longitud de cadena (CLF); y (h) un dominio malonil-CoA:ACP aciltransferasa (MAT). También se describe un sistema de PKS de AGPI de Schizochytriums que también comprende al menos una región o dominio que contiene un motivo de sitio activo conservado de deshidratasa (DH) que no es parte de un dominio DH similar a FabA. Las características estructurales y funcionales de estos dominios generalmente se conocen individualmente en la técnica y se describirán en detalle a continuación con respecto a los sistemas de PKS de AGPI de la presente invención.

Adicionalmente, se describe un sistema de PKS de AGPI de Thraustochytrium que comprende al menos los

45 siguientes dominios biológicamente activos: (a) dos dominios enoil-ACP reductasa (ER); (b) entre cuatro o cinco y diez o más dominios de proteína transportadora de acilo (ACP), y en un aspecto, ocho dominios ACP; (c) dos dominiosβ-cetoacil-ACP sintasa (KS); (d) un dominio aciltransferasa (AT); (e) un dominio β-cetoacil-ACP reductasa (KR); (f) dos dominiosβ-hidroxiacil-ACP deshidrasa (DH) similares a FabA; (g) un dominio de factor de longitud de cadena (CLF); y (h) un dominio malonil-CoA:ACP aciltransferasa (MAT). También se describe un sistema de PKS de AGPI de Thraustochytrium que también comprende al menos una región o dominio que contiene un motivo de sitio activo conservado de deshidratasa (DH) que no es parte de un dominio DH similar a FabA. Las características estructurales y funcionales de estos dominios generalmente se conocen individualmente en la técnica y se describirán en detalle a continuación con respecto a los sistemas de PKS de AGPI de la presente invención.

55 Un sistema de PKS de AGPI puede incluir adicionalmente una o más proteínas auxiliares, que se definen en el presente documento como proteínas que no se considera que son parte del sistema de PKS de AGPI central tal como se describió anteriormente (es decir, no es parte del propio complejo de la enzima AGPI sintasa), pero que pueden ser, o son, necesarias para la producción de AGPI o al menos para la producción eficiente de AGPI usando el complejo de la enzima AGPI sintasa central de la presente invención, particularmente en determinados organismos huésped (por ejemplo, plantas). Por ejemplo, para producir AGPI, un sistema de PKS de AGPI debe actuar con una proteína auxiliar que transfiere un resto 4’-fosfopanteteinilo de coenzima A al/a los dominio(s) de proteína transportadora de acilo (ACP). Por tanto, un sistema de PKS de AGPI puede considerarse que incluye al menos un dominio 4’-fosfopanteteinil transferasa (PPTasa), o un dominio de este tipo puede considerarse que es un dominio o una proteína auxiliar para el sistema de PKS de AGPI. Cuando se modifican genéticamente organismos

65 (por ejemplo, microorganismos o plantas) para expresar un sistema de PKS de AGPI según la presente invención, algunos organismos huésped pueden expresar de manera endógena proteínas auxiliares, que son necesarias para actuar con el PKS de AGPI para producir AGPI (por ejemplo, PPTasas). Sin embargo, algunos organismos pueden transformarse con moléculas de ácido nucleico que codifican para una o más proteínas auxiliares descritas en el presente documento para permitir y/o potenciar la producción de AGPI por el organismo, incluso si el organismo

5 produce de manera endógena una proteína auxiliar homóloga (es decir, algunas proteínas auxiliares heterólogas pueden funcionar más eficaz o eficientemente con las proteínas AGPI sintasas transformadas que con la proteína auxiliar endógenas de las células huésped). La presente invención y solicitudes anteriores proporcionan ejemplos de bacterias y levaduras que se han modificado genéticamente con el sistema de PKS de AGPI de la presente invención que incluye una PPTasa auxiliar. Se han descrito plantas que se han modificado genéticamente con el sistema de PKS de AGPI que incluye una PPTasa auxiliar (véase, por ejemplo, la publicación de solicitud de patente estadounidense n.º 20070089199). Las características estructurales y funcionales de las PPTasas se describirán en más detalle a continuación.

La ruta “habitual” o “clásica” para la síntesis de AGPI de cadena larga (AGPICL) en organismos eucariotas implica la

15 modificación de ácidos grasos monoinsaturados o saturados de longitud de cadena media (por ejemplo, los productos de los sistemas de FAS descritos anteriormente). Estas modificaciones consisten en etapas de elongación y etapas de desaturación. Los sustratos para la reacción de elongación son acil-CoA graso (la cadena de ácido graso que va a elongarse) y malonil-CoA (la fuente de los dos carbonos añadidos durante cada reacción de elongación). El producto de la reacción con elongasa es un acil-CoA graso que tiene dos carbonos adicionales en la cadena lineal. Normalmente no se producen ácidos grasos libres (AGL) en este ciclo de reacción. Las desaturasas crean dobles enlaces cis en la cadena de ácido graso preexistente mediante la extracción de dos hidrógenos en una reacción dependiente de oxígeno. Los sustratos para las desaturasas son o bien acil-CoA (en algunos animales) o bien ácidos grasos que se esterifican en la cadena principal de glicerol de un PL (por ejemplo, fosfotidilcolina). De nuevo, no se producen AGL en este mecanismo de reacción. Por tanto, la única vez que se producen AGL en rutas

25 de síntesis de AGPICL “habituales” o “clásicas” es durante la liberación de los ácidos grasos de algunos sistemas de FAS. Tal como se comentó anteriormente, éstos son normalmente ácidos grasos de 16 ó 18 carbonos y habitualmente son ácidos grasos o bien saturados o bien monoinsaturados, ni AGPI de cadena más larga tales como EPA o DHA. Una consecuencia de este esquema para la producción de AGPI de cadena larga es que a menudo se acumulan productos intermedios en la ruta, que representan a menudo la mayoría de los ácidos grasos novedosos producidos por el sistema.

Por tanto, según la presente invención, la referencia a una ruta “habitual” o “clásica” para la producción de AGPI se refiere a la ruta de síntesis de ácidos grasos en la que ácidos grasos saturados de longitud de cadena media (por ejemplo, productos de un sistema de ácido graso sintasa (FAS)) se modifican mediante una serie de reacciones de

35 elongación y desaturación. Los sustratos para la reacción de elongación son acil-CoA graso (la cadena de ácido graso que va a elongarse) y malonil-CoA (la fuente de los 2 carbonos añadidos durante cada reacción de elongación). El producto de la reacción con elongasa es un acil-CoA graso que tiene dos carbonos adicionales en la cadena lineal. Las desaturasas crean dobles enlaces cis en la cadena de ácido graso preexistente mediante la extracción de 2 hidrógenos en una reacción dependiente de oxígeno. Tales rutas y los genes implicados en tales rutas se conocen bien en la bibliografía.

Tal como se usa en el presente documento, el término “lípido” incluye fosfolípidos (PL); ácidos grasos libres; ésteres de ácidos grasos; triacilgliceroles (TAG); diacilglicéridos; monoacilglicéridos; fosfátido; ceras (ésteres de alcoholes y ácidos grasos); esteroles y ésteres de esteroles; carotenoides; xantófilas (por ejemplo, oxicarotenoides);

45 hidrocarburos; y otros lípidos conocidos por un experto habitual en la técnica. Los términos “ácidos grasos poliinsaturados” y “AGPI” incluyen no sólo la forma de ácido graso libre, sino también otras formas, tales como la forma de TAG y la forma de PL.

La referencia a un organismo “heterólogo” o huésped “heterólogo”, con respecto a la expresión de una proteína, un dominio o un sistema de PKS de AGPI por el organismo/huésped, significa que al menos una proteína, un dominio o una porción del sistema de PKS de AGPI no es una proteína, un dominio o una porción que se expresa de manera natural (de manera endógena) por el organismo, aunque el sistema de PKS de AGPI puede incluir proteínas, dominios o porciones de los mismos que se expresan de manera natural por el organismo huésped (por ejemplo, una proteína quimérica tal como se describe en el presente documento que contiene secuencias derivadas del

55 organismo huésped y de un organismo diferente o una proteína diferente).

Determinadas moléculas de ácido nucleico (constructos) a modo de ejemplo que codifican para diversas proteínas quiméricas se describen en el presente documento (véanse los ejemplos). Según la presente invención, una “proteína quimérica” es una proteína modificada mediante ingeniería genética codificada por una secuencia de ácido nucleico que se produce mediante corte y empalme o unión (ligamiento) entre sí de dos o más genes o secuencias de ácido nucleico completos o parciales. Un “sistema de PKS de AGPI quimérico” es un sistema de PKS de AGPI que contiene proteínas y/o dominios, incluyendo proteínas y/o dominios quiméricos, de dos o más sistemas de PKS diferentes. Por ejemplo, los ejemplos describen un sistema de PKS de AGPI quimérico compuesto por los OrfA y OrfB de PKS de AGPI de Schizochytrium y el OrfC de PKS de AGPI de Thraustochytrium. Los ejemplos también 65 describen un sistema de PKS de AGPI quimérico compuesto por los OrfA, OrfB y todo el OrfC excepto por el dominio DH2 de PKS de AGPI de Schizochytrium, que es el dominio DH2 de PKS de AGPI de un PKS de AGPI de

Thraustochytrium. Este último sistema de PKS de AGPI quimérico comprende por consiguiente de una proteína quimérica (una proteína OrfC quimérica). Las mismas quimeras también se describen usando secuencias de ácido nucleico de Thraustochytrium que se han optimizado para el uso de codones de Schizochytrium, que ilustran una combinación de manipulaciones genéticas que puede usarse para alterar el producto producido por un sistema de

5 PKS de AGPI (véanse los ejemplos). Los ejemplos también describen una variedad de otros sistemas de PKS de AGPI quiméricos.

Tal como se usa en el presente documento, “optimización de codones” o expresiones derivadas de la misma se refieren al procedimiento de modificar (alterar, cambiar, mutar) una secuencia de ácido nucleico que codifica para una proteína dada para sustituir uno o más codones en la secuencia con codones que se usan de la manera más frecuente en secuencias de ácido nucleico de un organismo particular en el que va a expresarse una molécula de ácido nucleico que comprende la secuencia de ácido nucleico. La preferencia codónica y la idea general de optimización de codones se entienden por el experto en la técnica. Más particularmente, el grado en el que aparece un codón dado en el código genético puede variar significativamente entre organismos (por ejemplo, incluyendo de 15 una especie a otra dentro de un género). Cualquier codón que un organismo usa un pequeño porcentaje del tiempo,

o menos que otro codón para el mismo aminoácido, puede producir problemas en la expresión de proteínas. Por consiguiente, la expresión de proteínas puede mejorar drásticamente cuando la frecuencia de codones de la secuencia de ácido nucleico que está usándose se hace coincidir con la del organismo/sistema de expresión del huésped (por ejemplo, sustituyendo codones raros o poco frecuentes o usados menos frecuentemente por otros que reflejan más estrechamente la preferencia codónica natural del sistema del huésped, sin modificar la secuencia de aminoácidos).

Los presentes inventores describen en el presente documento métodos para optimizar el uso de codones de una secuencia de ácido nucleico para la de Schizochytrium, aunque esto es sólo un ejemplo del uso de optimización de

25 codones en la presente invención. Según la presente invención, la secuencia de nucleótidos de una molécula de ácido nucleico que codifica para una proteína dada (por ejemplo, una proteína PKS de AGPI) puede modificarse (por ejemplo, mediante síntesis, mutación, tecnología recombinante, etc.) para el uso óptimo (optimizado) de codones de una célula o un organismo huésped en el que va a expresarse la molécula de ácido nucleico, o en efecto, para el uso de codones optimizado de un organismo diferente (por ejemplo, una molécula de ácido nucleico que codifica para una proteína PKS de AGPI de Thraustochytrium para la expresión en una planta puede optimizarse para el uso de codones de Schizochytrium). La tabla 1 de los ejemplos ilustra el uso de codones optimizado para Schizochytrium.

Además, los inventores proponen en el presente documento la optimización de la secuencia de ácido nucleico de

35 una molécula de ácido nucleico que codifica para una proteína dada para el mismo huésped del que se derivó, aprendió u obtuvo la secuencia de ácido nucleico, para la expresión en ese huésped (o en otro huésped). Esta última realización de la invención representa una evolución “dirigida” o “acelerada” de clases, en las que, por ejemplo, una molécula de ácido nucleico que codifica para una proteína de un organismo (por ejemplo, una proteína PKS de AGPI de Schizochytrium) se modifica (por ejemplo, volviendo a sintetizar la secuencia de ácido nucleico y sustituyendo determinados nucleótidos) para potenciar el uso de codones (optimizar el uso de codones) que se prefiere por el mismo organismo (Schizochytrium, en este ejemplo). Esta molécula de ácido nucleico puede expresarse entonces en Schizochytrium (como molécula de ácido nucleico recombinante) o en otro organismo o célula huésped (por ejemplo, en una planta). En esta realización, se propone que una secuencia de ácido nucleico dada de un organismo puede no usar los codones óptimos (preferencia codónica) que pueden determinarse para

45 ese organismo. Por consiguiente, puede volver a sintetizarse la secuencia de ácido nucleico para mejorar la expresión de proteínas en ese organismo.

Los sistemas de PKS de AGPI y proteínas o dominios de los mismos que son útiles en la presente invención incluyen sistemas de PKS de AGPI tanto bacterianos como no bacterianos. Un sistema de PKS de AGPI no bacteriano es un sistema de PKS de AGPI que es de o se deriva de un organismo que no es una bacteria, tal como un eucariota o una arqueobacteria. Los eucariotas se separan de los procariotas basándose en el grado de diferenciación de las células, estando los eucariotas más diferenciados que los procariotas. En general, los procariotas no presentan una membrana nuclear, no muestran mitosis durante la división celular, sólo tienen un cromosoma, contienen ribosomas 70S en su citoplasma, no presentan mitocondrias, retículo endoplasmático,

55 cloroplastos, lisosomas ni aparato de Golgi, y pueden tener flagelos, que si están presentes, contienen una única fibrilla. En cambio, los eucariotas tienen una membrana nuclear, presentan mitosis durante la división celular, tienen muchos cromosomas, contienen ribosomas 80S en su citoplasma, presentan mitocondrias, retículo endoplasmático, cloroplastos (en algas), lisosomas y aparato de Golgi, y pueden tener flagelos, que si están presentes, contienen muchas fibrillas. En general, las bacterias son los procariotas, mientras que las algas, hongos, protistas, protozoos y plantas superiores son eucariotas. Según la presente invención, pueden producirse organismos modificados genéticamente que incorporan dominios funcionales PKS de AGPI no bacterianos con dominios funcionales PKS de AGPI bacterianos, así como proteínas o dominios funcionales PKS de otros sistemas de PKS (de tipo I iterativo o modular, de tipo II o de tipo III) o sistemas de FAS.

65 Según la presente invención, un dominio o una proteína que tiene actividad biológica (función) 3-cetoacil-ACP sintasa (KS) se caracteriza como la enzima que lleva a cabo la etapa inicial del ciclo de reacción de elongación de FAS (y PKS). El término “β-cetoacil-ACP sintasa” puede usarse de manera intercambiable con los términos “3-ceto acil-ACP sintasa”, “β-ceto acil-ACP sintasa” y “ceto-acil ACP sintasa”, y derivados similares. El grupo acilo destinado para la elongación se une a un residuo de cisteína en el sitio activo de la enzima mediante un enlace tioéster. En la reacción de múltiples etapas, la acil-enzima experimenta condensación con malonil-ACP para formar -cetoacil-ACP,

5 CO2 y enzima libre. La KS desempeña un papel clave en el ciclo de elongación y en muchos sistemas se ha mostrado que presenta mayor especificidad de sustrato que otras enzimas del ciclo de reacción. Por ejemplo, E. coli tiene tres enzimas KS distintas, cada una con su papel particular en la fisiología del organismo (Magnuson et al., Microbiol. Rev. 57, 522 (1993)). Los dos dominios KS de los sistemas de PKS de AGPI descritos en bacterias marinas y los traustoquitridios descritos en el presente documento pueden tener distintos papeles en la secuencia de reacción biosintética de AGPI. Como una clase de enzimas, las KS se han caracterizado bien. Las secuencias de muchos genes de KS verificados se conocen, se han identificado los motivos de sitios activos y se han determinado las estructuras cristalinas de varias. Pueden identificarse fácilmente proteínas (o dominios de proteínas) como pertenecientes a la familia de enzimas de KS mediante homología con secuencias de KS conocidas.

15 Según la presente invención, un dominio o una proteína que tiene actividad biológica (función) malonil-CoA:ACP aciltransferasa (MAT) se caracteriza como uno que transfiere el resto malonilo de malonil-CoA a ACP. El término “malonil-CoA:ACP aciltransferasa” puede usarse de manera intercambiable con “malonil aciltransferasa” y derivados similares. Además del motivo de sitio activo (GxSxG, SEQ ID NO: 96), estas enzimas presentan un motivo extendido de aminoácidos R y Q en posiciones clave que las identifica como enzimas MAT (por ejemplo, en contraposición a un dominio AT descrito a continuación). En algunos sistemas de PKS (pero no el dominio PKS de AGPI), los dominios MAT cargaran preferentemente metil- o etil-malonato en el grupo ACP (del éster de CoA correspondiente), introduciendo de ese modo ramificaciones en la cadena de carbono lineal. Pueden reconocerse dominios MAT por su homología con secuencias MAT conocidas y por su estructura de motivos extendida.

25 Según la presente invención, un dominio o una proteína que tiene actividad biológica (función) de proteína transportadora de acilo (ACP) se caracteriza como polipéptidos pequeños (normalmente, de 80 a 100 aminoácidos de longitud), que funcionan como portadores para cadenas de acilo grasas en crecimiento por medio de una unión tioéster a un cofactor de la proteína unido covalentemente. Se producen como unidades separadas o como dominios dentro de proteínas más grandes. Las ACP se convierten de apoformas inactivas a holoformas funcionales mediante transferencia del resto fosfopanteteinilo de CoA a un residuo de serina altamente conservado de la ACP. Los grupos acilo se unen a la ACP por medio de una unión tioéster en el extremo terminal libre del resto fosfopanteteinilo. Las ACP pueden identificarse mediante marcaje con panteteína radiactiva y mediante homología de secuencia con ACP conocidas. La presencia de variaciones del motivo mencionado anteriormente (LGIDS*) es también un rasgo distintivo de una ACP.

35 Según la presente invención, un dominio o una proteína que tiene actividad cetorreductasa, también denominada actividad biológica (función) 3-cetoacil-ACP reductasa (KR), se caracteriza como uno que cataliza la reducción dependiente de nucleótidos de piridina de formas de 3-cetoacilo de ACP. Es la primera etapa reductora en el ciclo de elongación de la biosíntesis de ácidos grasos de novo y una reacción realizada a menudo en biosíntesis de policétidos. El término “β-cetoacil-ACP reductasa” puede usarse de manera intercambiable con los términos “cetorreductasa”, “3-cetoacil-ACP reductasa”, “ceto-acil ACP reductasa” y derivados similares del término. Se observa similitud de secuencia significativa con una familia de enoil ACP reductasas (ER), la otra reductasa de FAS (pero no la familia de ER presente en los sistemas de PKS de AGPI), y la familia de alcohol deshidrogenasa de cadena corta. El análisis Pfam de la región de PKS de AGPI indicada anteriormente revela la homología con la

45 familia de alcohol deshidrogenasa de cadena corta en la región central. El análisis Blast de la misma región revela coincidencias en el área central con enzimas KR conocidas así como una región de homología extendida con dominios de los otros sistemas caracterizados de PKS de AGPI.

Según la presente invención, un dominio o una proteína se denomina factor de longitud de cadena (CLF) basándose en las siguientes razones. El CLF se describió originalmente como característico de sistemas de PKS de tipo II (enzimas disociadas) y se planteó la hipótesis de que desempeña un papel en la determinación del número de ciclos de elongación, y por tanto la longitud de cadena, del producto final. Las secuencias de aminoácidos de CLF muestran homología con dominios KS (y se piensa que forman heterodímeros con una proteína KS), pero carecen de la cisteína del sitio activo. El papel del CLF en sistemas de PKS ha sido controvertido. Nuevas pruebas (C.

55 Bisang et al., Nature 401, 502 (1999)) sugieren un papel en el cebado (proporcionando el grupo acilo inicial que va a elongarse) de los sistemas de PKS. En este papel, se piensa que el dominio CLF descarboxila malonato (como malonil-ACP), formando así un grupo acetato que puede transferirse al sitio activo de KS. Por tanto, este acetato actúa como molécula de “cebado” que puede experimentar la reacción de elongación inicial (condensación). Se han identificado homólogos del CLF de tipo II como dominios de “carga” en algunos sistemas de PKS modulares. Se encuentra un dominio con las características de secuencia del CLF en todos los sistemas de PKS de AGPI identificados actualmente y en cada caso se encuentra como parte de una proteína de múltiples dominios.

Una “aciltransferasa” o “AT” se refiere a una clase general de enzimas que pueden llevar a cabo varias reacciones de transferencia de acilo distintas. El término “aciltransferasa” puede usarse de manera intercambiable con el 65 término “acil transferasa”. Los dominios AT identificados en los sistemas de PKS de AGPI descritos en el presente documento muestran buena homología entre sí y con dominios presentes en todos los otros sistemas de PKS de

AGPI examinados actualmente y homología muy débil con algunas aciltransferasas cuyas funciones específicas se han identificado (por ejemplo con malonil-CoA:ACP aciltransferasa, MAT). A pesar de la débil homología con MAT, no se cree que este dominio AT funcione como una MAT porque no presenta una estructura de motivos extendida característica de tales enzimas (véase la descripción de dominios MAT, anteriormente). Para los fines de esta

5 descripción, las posibles funciones del dominio AT en un sistema de PKS de AGPI incluyen, pero no se limitan a: transferencia del grupo acilo graso del/de los dominio(s) ORFA ACP a agua (es decir, una tioesterasa – liberando el grupo acilo graso como un ácido graso libre), transferencia de un grupo acilo graso a un aceptor tal como CoA, transferencia del grupo acilo entre los diversos dominios ACP o transferencia del grupo acilo graso a una molécula aceptora lipófila (por ejemplo a ácido lisofosfádico).

Según la presente invención, este dominio tiene actividad biológica enoil reductasa (ER). La enzima ER reduce el doble enlace trans (introducido por la actividad DH) en el acil-ACP graso, dando como resultado la saturación completa de esos carbonos. El dominio ER dominio en la AGPI-PKS muestra homología con una familia recién caracterizada de enzimas ER (Heath et al., Nature 406, 145 (2000)). Heath y Rock identificaron esta nueva clase de

15 enzimas ER clonando un gen de interés de Streptococcus pneumoniae, purificando una proteína expresada a partir de ese gen y mostrando que tenía actividad ER en un ensayo in vitro. Todos los sistemas de PKS de AGPI examinados actualmente contienen al menos un dominio con homología de secuencia muy alta con el dominio ER de Schizochytrium, que muestra homología con la proteína ER de S. pneumoniae.

Según la presente invención, una proteína o dominio que tiene actividad deshidrasa o deshidratasa (DH) cataliza una reacción de deshidratación. Tal como se usa generalmente en el presente documento, la referencia a actividad DH se refiere normalmente a actividad biológica β-hidroxiacil-ACP deshidrasa (DH) similar a FabA. La actividad βhidroxiacil-ACP deshidrasa (DH) similar a FabA elimina HOH de una β-cetoacil-ACP y produce inicialmente un doble enlace trans en la cadena de carbono. El término “β-hidroxiacil-ACP deshidrasa similar a FabA” puede usarse de

25 manera intercambiable con los términos “β-hidroxil acil-ACP deshidrasa similar a FabA”, “β-hidroxiacil-ACP deshidrasa”, “deshidrasa” y derivados similares. Los dominios DH de los sistemas de PKS de AGPI muestran homología con enzimas DH bacterianas asociadas con sus sistemas de FAS (en vez de con los dominios DH de otros sistemas de PKS). Un subconjunto de DH bacterianas, las DH similares a FabA, presentan actividad isomerasa cis-trans (Heath et al., J. Biol. Chem., 271, 27795 (1996)). Es la homología con las proteínas DH similares a FabA la que sugiere que uno o todos los dominios DH descritos en el presente documento son responsables de la inserción de los dobles enlaces cis en los productos de PKS de AGPI.

Una proteína PKS de AGPI útil de la invención puede tener también actividad deshidratasa que no se caracteriza como similar a FabA (por ejemplo, la actividad cis-trans descrita anteriormente está asociada con actividad similar a

35 FabA), denominada generalmente en el presente documento actividad no similar a FabA, o actividad biológica βhidroxiacil-ACP deshidrasa (DH) no similar a FabA. Más específicamente, se encuentra un motivo de sitio activo conservado (∼13 aminoácidos de longitud: L*xxHxxxGxxxxP, SEQ ID NO: 97; *en el motivo, L también puede ser I) en dominios deshidratasa en sistemas de PKS (Donadio S, Katz L. Gene. 1 de febrero de 1992; 11 1(1):51-60). Este motivo conservado, denominado también en el presente documento motivo de sitio activo conservado de deshidratasa (DH) o motivo de DH, se encuentra en una región similar de todas las secuencias de AGPI-PKS conocidas descritas hasta la fecha y en las secuencias de PKS de AGPI descritas en el presente documento, pero se cree que este motivo se ha detectado sólo recientemente. Este motivo conservado está dentro de una región no caracterizada de alta homología en la secuencia de AGPI-PKS. La biosíntesis propuesta de AGPI por medio de AGPI-PKS requiere una deshidratación no similar a FabA, y este motivo puede estar asociado con esa reacción.

45 Para fines de ilustración, se describe en detalle a continuación la estructura de determinados sistemas de PKS de AGPI. Sin embargo, debe entenderse que esta invención no se limita al uso de estos sistemas de PKS de AGPI. Por ejemplo, puede encontrarse una descripción detallada de sistemas bacterianos de PKS de AGPI en la patente estadounidense n.º 6.140.486 y la publicación de solicitud de patente estadounidense n.º 20050100995, y se encuentra una descripción de otros sistemas o genes de PKS de AGPI en la publicación de patente PCT n.º WO 05/097982 y la publicación de solicitud de patente estadounidense n.º 20050014231.

Sistema de PKS de AGPI de Schizochytrium

55 Schizochytrium es un microorganismo marino traustoquitridio que acumula grandes cantidades de triacilgliceroles ricos en DHA y ácido docosapentaenoico (DPA; 22:5 ω-6); por ejemplo, el 30% de DHA + DPA en peso seco (Barclay et al., J. Appl. Phycol. 6, 123 (1994)). En eucariotas que sintetizan AGPI de 20 y 22 carbonos mediante una ruta de elongación/desaturación, las reservas de productos intermedios de 18, 20 y 22 carbonos son relativamente grandes de modo que experimentos de marcaje in vivo usando [14C]-acetato revelan una cinética de producto precursor clara para los productos intermedios predichos (Gellerman et al., Biochim. Biophys. Acta 573:23 (1979)). Además, productos intermedios radiomarcados proporcionados de manera exógena a tales organismos se convierten en los productos de AGPI finales. Los presentes inventores han mostrado que se captaba rápidamente [1-14C]-acetato por células de Schizochytrium y se incorporaban en ácidos grasos, pero al tiempo de marcaje más corto (1 min), DHA contenía el 31% del marcador recuperado en ácidos grasos, y este porcentaje permanecía

65 esencialmente sin cambios durante los 10-15 min de incorporación de [14C]-acetato y las 24 horas posteriores de crecimiento del cultivo (véase la publicación de solicitud de patente estadounidense n.º 20020194641, citada anteriormente). De manera similar, DPA representaba el 10% del marcador a lo largo de todo el experimento. No hay ninguna prueba de una relación precursor-producto entre ácidos grasos de 16 ó 18 carbonos y los ácidos grasos poliinsaturados de 22 carbonos. Estos resultados concuerdan con una síntesis rápida de DHA a partir de [14C]

5 acetato que implica reservas muy pequeñas (posiblemente unidas a enzima) de productos intermedios.

La figura 1 es una representación gráfica de los tres marcos de lectura abiertos del sistema de PKS de AGPI de Schizochytrium, e incluye la estructura de dominios de este sistema de PKS de AGPI. Hay tres marcos de lectura abiertos que forman el sistema de PKS de AGPI de Schizochytrium central. La estructura de dominios de cada marco de lectura abierto es tal como sigue.

Marco de lectura abierto A (OrfA) de Schizochytrium:

La secuencia de nucleótidos completa para OrfA se representa en el presente documento como SEQ ID NO: 1. OrfA

15 es una secuencia de 8730 nucleótidos (sin incluir el codón de terminación) que codifica para una secuencia de 2910 aminoácidos, representada en el presente documento como SEQ ID NO: 2. Dentro de OrfA hay doce dominios: (a) un dominio β-ceto acil-ACP sintasa (KS); (b) un dominio malonil-CoA:ACP aciltransferasa (MAT); (c) nueve dominios de proteína transportadora de acilo (ACP); y (d) un dominio cetorreductasa (KR). Se han aislado y secuenciado clones de ADN genómico (plásmidos) que codifican para OrfA de tanto Schizochytrium sp. ATCC 20888 como una cepa hija de ATCC 20888, indicada como Schizochytrium sp., cepa N230D. N230D era uno de más de 1.000 supervivientes elegidos al azar de Schizochytrium ATCC 20888 mutagenizada químicamente (NTG; 1-metil-3-nitro1-nitrosoguanidina) examinados para detectar variaciones en el contenido en ácidos grasos. Se valoró esta cepa particular por su productividad de DHA mejorada.

25 Un clon genómico descrito en el presente documento como JK1126, aislado de Schizochytrium sp. ATCC 20888, comprende, según el mejor entender de los presentes inventores, la secuencia de nucleótidos que abarca desde la posición 1 hasta 8730 de SEQ ID NO: 1, y codifica para la secuencia de aminoácidos correspondiente de SEQ ID NO: 2. El clon genómico pJK1126 (indicado como clon genómico pJK1126 OrfA, en forma de un vector de plásmido de E. coli que contiene el gen “OrfA” de Schizochytrium ATCC 20888) se depositó en la Colección Americana de Cultivos Tipo (ATCC), 10801 University Boulevard, Manassas, Va. 20110-2209 EE.UU. el 8 de junio de 2006 y se le asignó el n.º de registro de la ATCC PTA-7648. La secuencia de nucleótidos del clon genómico pJK1126 OrfA, y la secuencia de aminoácidos codificada por este plásmido se abarcan por la presente invención.

Dos clones genómicos descritos en el presente documento como clon genómico pJK306 OrfA y clon genómico

35 pJK320 OrfA, aislados de Schizochytrium sp. N230D, juntos (clones solapantes) comprenden, según el mejor entender de los presentes inventores, la secuencia de nucleótidos de SEQ ID NO: 1, y codifican para la secuencia de aminoácidos de SEQ ID NO: 2. El clon genómico pJK306 (indicado como clon genómico pJK306 OrfA, en forma de un plásmido de E. coli que contiene la porción en 5’ del gen OrfA de Schizochytrium sp. N230D (2,2 kB se solapan con pJK320)) se depositó en la Colección Americana de Cultivos Tipo (ATCC), 10801 University Boulevard, Manassas, Va. 20110-2209 EE.UU. el 8 de junio de 2006, y se le asignó el n.º de registro de la ATCC PTA-7641. La secuencia de nucleótidos del clon genómico pJK306 OrfA, y la secuencia de aminoácidos codificada por este plásmido se abarcan por la presente invención. El clon genómico pJK320 (indicado como clon genómico pJK320 OrfA, en forma de un plásmido de E. coli que contiene la porción en 3’ del gen OrfA de Schizochytrium sp. N230D (2,2 kB se solapan con pJK306)) se depositó en la Colección Americana de Cultivos Tipo (ATCC), 10801 University

45 Boulevard, Manassas, Va. 20110-2209 EE.UU. el 8 de junio de 2006, y se le asignó el n.º de registro de la ATCC PTA-7644. La secuencia de nucleótidos del clon genómico pJK320 OrfA, y la secuencia de aminoácidos codificada por este plásmido se abarcan por la presente invención.

El primer dominio en OrfA es un dominio KS, también denominado en el presente documento ORFA-KS, y la secuencia de nucleótidos que contiene la secuencia que codifica para el dominio ORFA-KS se representa en el presente documento como SEQ ID NO: 7 (posiciones 1-1500 de SEQ ID NO: 1). La secuencia de aminoácidos que contiene el dominio ORFA-KS se representa en el presente documento como SEQ ID NO: 8 (posiciones 1-500 de SEQ ID NO: 2). Se observa que el dominio ORFA-KS contiene un motivo de sitio activo: DXAC* (SEQ ID NO: 98; *sitio de unión a acilo C215). Además, un motivo característico en el extremo de la región KS de Schizochytrium,

55 GFGG (SEQ ID NO: 99), está presente en este dominio en SEQ ID NO: 2 y, por consiguiente, en SEQ ID NO: 8.

El segundo dominio en OrfA es un dominio MAT, también denominado en el presente documento ORFA-MAT, y la secuencia de nucleótidos que contiene la secuencia que codifica para el dominio ORFA-MAT se representa en el presente documento como SEQ ID NO: 9 (posiciones 1723-3000 de SEQ ID NO: 1). La secuencia de aminoácidos que contiene el dominio ORFA-MAT se representa en el presente documento como SEQ ID NO: 10 (posiciones 5751000 de SEQ ID NO: 2). El dominio MAT comprende un aspartato en la posición 93 y una histidina en la posición 94 (correspondientes a las posiciones 667 y 668, respectivamente, de SEQ ID NO: 2). Se observa que el dominio ORFA-MAT contiene un motivo de sitio activo: GHS*XG (*sitio de unión a acilo S706), representado en el presente documento como SEQ ID NO: 11.

65 Los dominios 3-11 de OrfA son nueve dominios ACP en tándem, también denominados en el presente documento ORFA-ACP (el primer dominio en la secuencia es ORFA-ACP1, el segundo dominio es ORFA-ACP2, el tercer dominio es ORFA-ACP3, etc.). El primer dominio ACP, ORFA-ACP1, está contenido dentro de la secuencia de nucleótidos que abarca de desde aproximadamente la posición 3343 hasta aproximadamente la posición 3600 de SEQ ID NO: 1 (OrfA). La secuencia de nucleótidos que contiene la secuencia que codifica para el dominio ORFA

5 ACP1 se representa en el presente documento como SEQ ID NO: 12 (posiciones 3343-3600 de SEQ ID NO: 1). La secuencia de aminoácidos que contiene el primer dominio ACP abarca de desde aproximadamente la posición 1115 hasta aproximadamente la posición 1200 de SEQ ID NO: 2. La secuencia de aminoácidos que contiene el dominio ORFA-ACP1 se representa en el presente documento como SEQ ID NO: 13 (posiciones 1115-1200 de SEQ ID NO: 2). Se observa que el dominio ORFA-ACP1 contiene un motivo de sitio activo: LGIDS* (*motivo de unión a panteteína S1157), representada en el presente documento por SEQ ID NO: 14.

Las secuencias de nucleótidos y aminoácidos de los nueve dominios ACP están altamente conservadas y, por tanto, la secuencia para cada dominio no se representa en el presente documento por un identificador de secuencia individual. Sin embargo, basándose en la información dada a conocer en el presente documento, un experto en la 15 técnica puede determinar fácilmente la secuencia que contiene cada uno de los otros ocho dominios ACP. Los nueve dominios ACP juntos abarcan una región de OrfA de desde aproximadamente la posición 3283 hasta aproximadamente posición 6288 de SEQ ID NO: 1, que corresponde a las posiciones de aminoácido de desde aproximadamente 1095 hasta aproximadamente 2096 de SEQ ID NO: 2. La secuencia de nucleótidos para toda la región ACP que contiene los nueve dominios se representa en el presente documento como SEQ ID NO: 16. La región representada por SEQ ID NO: 16 incluye los segmentos de ligador entre dominios ACP individuales. El intervalo de repetición para los nueve dominios es aproximadamente cada 330 nucleótidos de SEQ ID NO: 16 (el número real de aminoácidos medidos entre serinas de sitios activos adyacentes oscila entre 104 y 116 aminoácidos). Cada uno de los nueve dominios ACP contiene un motivo de unión a panteteína LGIDS* (representado en el presente documento por SEQ ID NO: 14), en el que S* es la serina del sitio de unión a 25 panteteína (S). La serina del sitio de unión a panteteína (S) está ubicada cerca del centro de cada secuencia de dominio ACP. En cada extremo de la región de dominio ACP y entre cada dominio ACP está una región que está altamente enriquecida en prolina (P) y alanina (A), que es que cree que es una región de ligador. Por ejemplo, entre los dominios ACP 1 y 2 está la secuencia: APAPVKAAAPAAPVASAPAPA, representada en el presente documento como SEQ ID NO: 15. Las ubicaciones de los residuos de serina de sitios activos (es decir, el sitio de unión a panteteína) para cada uno de los nueve dominios ACP, con respecto a la secuencia de aminoácidos de SEQ ID NO: 2, son las siguientes: ACP1 = S1157; ACP2 = S1266; ACP3 = S1377; ACP4 = S1488; ACP5 = S1604; ACP6 = S1715; ACP7 = S1819; ACP8 = S1930; y ACP9 = S2034. Dado que el tamaño promedio de un dominio ACP es de aproximadamente 85 aminoácidos, excluyendo el ligador, y de aproximadamente 110 aminoácidos incluyendo el ligador, estando la serina del sitio activo aproximadamente en el centro del dominio, un experto en la técnica puede

35 determinar fácilmente las posiciones de cada uno de los nueve dominios ACP en OrfA.

El dominio 12 en OrfA es un dominio KR, también denominado en el presente documento ORFA-KR, y la secuencia de nucleótidos que contiene la secuencia que codifica para el dominio ORFA-KR se representa en el presente documento como SEQ ID NO: 17 (posiciones 6598-8730 de SEQ ID NO: 1). La secuencia de aminoácidos que contiene el dominio ORFA-KR se representa en el presente documento como SEQ ID NO: 18 (posiciones 2200-2910 de SEQ ID NO: 2). Dentro del dominio KR hay una región central con homología con aldehído-deshidrogenasas de cadena corta (KR es a miembro de esta familia). Esta región central abarca de desde aproximadamente la posición 7198 hasta aproximadamente la posición 7500 de SEQ ID NO: 1, que corresponde a las posiciones de aminoácido 2400-2500 de SEQ ID NO: 2.

45 Marco de lectura abierto B (OrfB) de Schizochytrium:

La secuencia de nucleótidos completa para OrfB se representa en el presente documento como SEQ ID NO: 3. OrfB es una secuencia de 6177 nucleótidos (sin incluir el codón de terminación) que codifica para una secuencia de 2059 aminoácidos, representada en el presente documento como SEQ ID NO: 4. Dentro de OrfB hay cuatro dominios: (a) un dominio -ceto acil-ACP sintasa (KS); (b) un dominio de factor de longitud de cadena (CLF); (c) un dominio acil transferasa (AT); y (d) un dominio enoil ACP-reductasa (ER).

Se han aislado y secuenciado clones de ADN genómico (plásmidos) que codifican para OrfB de tanto 55 Schizochytrium sp. ATCC 20888 y una cepa hija de ATCC 20888, indicada como Schizochytrium sp., cepa N230D.

Un clon genómico descrito en el presente documento como pJK1129, aislado de Schizochytrium sp. ATCC 20888, comprende, según el mejor entender de los presentes inventores, la secuencia de nucleótidos de SEQ ID NO: 3, y codifica para la secuencia de aminoácidos de SEQ ID NO: 4. El clon genómico pJK1129 (indicado como clon genómico pJK1129 OrfB, en forma de un vector de plásmido de E. coli que contiene el gen “OrfB” de Schizochytrium ATCC 20888) se depositó en la Colección Americana de Cultivos Tipo (ATCC), 10801 University Boulevard, Manassas, Va. 20110-2209 EE.UU. el 8 de junio de 2006, y se le asignó el n.º de registro de la ATCC PTA-7649. La secuencia de nucleótidos del clon genómico pJK1126 OrfB, y la secuencia de aminoácidos codificada por este plásmido se abarcan por la presente invención.

65 Un clon genómico descrito en el presente documento como clon genómico pJK324 OrfB, aislado de Schizochytrium sp. N230D, comprende, según el mejor entender de los presentes inventores, la secuencia de nucleótidos de SEQ ID NO: 3, y codifica para la secuencia de aminoácidos de SEQ ID NO: 4. El clon genómico pJK324 (indicado como clon genómico pJK324 OrfB, en forma de un plásmido de E. coli que contiene la secuencia del gen OrfB de Schizochytrium sp. N230D) se depositó en la Colección Americana de Cultivos Tipo (ATCC), 10801 University

5 Boulevard, Manassas, Va. 20110-2209 EE.UU. el 8 de junio de 2006, y se le asignó el n.º de registro de la ATCC PTA-7643. La secuencia de nucleótidos del clon genómico pJK324 OrfB, y la secuencia de aminoácidos codificada por este plásmido se abarcan por la presente invención.

El primer dominio en OrfB es un dominio KS, también denominado en el presente documento ORFB-KS, y la

10 secuencia de nucleótidos que contiene la secuencia que codifica para el dominio ORFB-KS se representa en el presente documento como SEQ ID NO: 19 (posiciones 1-1350 de SEQ ID NO: 3). La secuencia de aminoácidos que contiene el dominio ORFB-KS se representa en el presente documento como SEQ ID NO: 20 (posiciones 1-450 de SEQ ID NO: 4). Este dominio KS comprende una valina en la posición 371 de SEQ ID NO: 20 (también posición 371 de SEQ ID NO: 20). Se observa que el dominio ORFB-KS contiene un motivo de sitio activo: DXAC* (*sitio de unión

15 a acilo C196). Además, un motivo característico en el extremo de esta región KS, GFGG, está presente en este dominio en SEQ ID NO: 4 y por consiguiente, en SEQ ID NO: 20.

El segundo dominio en OrfB es un dominio CLF, también denominado en el presente documento ORFB-CLF, y la secuencia de nucleótidos que contiene la secuencia que codifica para el dominio ORFB-CLF se representa en el

20 presente documento como SEQ ID NO: 21 (posiciones 1378-2700 de SEQ ID NO: 3). La secuencia de aminoácidos que contiene el dominio ORFB-CLF se representa en el presente documento como SEQ ID NO: 22 (posiciones 460900 de SEQ ID NO: 4). Se observa que el dominio ORFB-CLF contiene un motivo de sitio activo de KS sin la proteína de unión a acilo.

25 El tercer dominio en OrfB es un dominio AT, también denominado en el presente documento ORFB-AT, y la secuencia de nucleótidos que contiene la secuencia que codifica para el dominio ORFB-AT se representa en el presente documento como SEQ ID NO: 23 (posiciones 2701-4200 de SEQ ID NO: 3). La secuencia de aminoácidos que contiene el dominio ORFB-AT se representa en el presente documento como SEQ ID NO: 24 (posiciones 9011400 de SEQ ID NO: 4). Se observa que el dominio ORFB-AT contiene un motivo de sitio activo de GxS*xG (*sitio

30 de unión a acilo S1140) que es característico de proteínas aciltransferasa (AT).

El cuarto dominio en OrfB es un dominio ER, también denominado en el presente documento ORFB-ER, y la secuencia de nucleótidos que contiene la secuencia que codifica para el dominio ORFB-ER se representa en el presente documento como SEQ ID NO: 25 (posiciones 4648-6177 de SEQ ID NO: 3). La secuencia de aminoácidos

35 que contiene el dominio ORFB-ER se representa en el presente documento como SEQ ID NO: 26 (posiciones 15502059 de SEQ ID NO: 4).

Marco de lectura abierto C (OrfC) de Schizochytrium:

40 La secuencia de nucleótidos completa para OrfC se representa en el presente documento como SEQ ID NO: 5. OrfC es una secuencia de 4506 nucleótidos (sin incluir el codón de terminación) que codifica para una secuencia de 1502 aminoácidos, representada en el presente documento como SEQ ID NO: 6. Dentro de OrfC hay tres dominios: (a) dos dominios -hidroxil acil-ACP deshidrasa (DH) similares a FabA; y (b) un dominio enoil ACP-reductasa (ER).

45 Se han aislado y secuenciado clones de ADN genómico (plásmidos) que codifican para OrfC de tanto Schizochytrium sp. ATCC 20888 como una cepa hija de ATCC 20888, indicada como Schizochytrium sp., cepa N230D.

Un clon genómico descrito en el presente documento como pJK1131, aislado de Schizochytrium sp. ATCC 20888,

50 comprende, según el mejor entender de los presentes inventores, la secuencia de nucleótidos de SEQ ID NO: 5, y codifica para la secuencia de aminoácidos de SEQ ID NO: 6. El clon genómico pJK1131 (indicado como clon genómico pJK1131 OrfC, en forma de un vector de plásmido de E. coli que contiene el gen “OrfC” de Schizochytrium ATCC 20888) se depositó en la Colección Americana de Cultivos Tipo (ATCC), 10801 University Boulevard, Manassas, Va. 20110-2209 EE.UU. el 8 de junio de 2006, y se le asignó el n.º de registro de la ATCC PTA-7650. La

55 secuencia de nucleótidos del clon genómico pJK1131 OrfC, y la secuencia de aminoácidos codificada por este plásmido se abarcan por la presente invención.

Un clon genómico descrito en el presente documento como clon genómico pBR002 OrfC, aislado de Schizochytrium sp. N230D, comprende, según el mejor entender de los presentes inventores, la secuencia de nucleótidos de SEQ 60 ID NO: 5, y codifica para la secuencia de aminoácidos de SEQ ID NO: 6. El clon genómico pBR002 (indicado como clon genómico pBR002 OrfC, en forma de un vector de plásmido de E. coli que contiene la secuencia del gen OrfC de Schizochytrium sp. N230D) se depositó en la Colección Americana de Cultivos Tipo (ATCC), 10801 University Boulevard, Manassas, Va. 20110-2209 EE.UU. el 8 de junio de 2006, y se le asignó el n.º de registro de la ATCC PTA-7642. La secuencia de nucleótidos del clon genómico pBR002 OrfC, y la secuencia de aminoácidos codificada

65 por este plásmido se abarcan por la presente invención.

El primer dominio en OrfC es un dominio DH, también denominado en el presente documento ORFC-DH1. Éste es uno de dos dominios DH en OrfC, y se designa por tanto DH1. La secuencia de nucleótidos que contiene la secuencia que codifica para el dominio OrfC-DH1 se representa en el presente documento como SEQ ID NO: 27 (posiciones 1-1350 de SEQ ID NO: 5). La secuencia de aminoácidos que contiene el dominio OrfC-DH1 se

5 representa en el presente documento como SEQ ID NO: 28 (posiciones 1-450 de SEQ ID NO: 6).

El segundo dominio en OrfC es un dominio DH, también denominado en el presente documento ORFC-DH2. Éste es el segundo de dos dominios DH en OrfC, y por tanto se designa DH2. La secuencia de nucleótidos que contiene la secuencia que codifica para el dominio OrfC-DH2 se representa en el presente documento como SEQ ID NO: 29 (posiciones 1351-2847 de SEQ ID NO: 5). La secuencia de aminoácidos que contiene el dominio OrfC-DH2 se representa en el presente documento como SEQ ID NO: 30 (posiciones 451-949 de SEQ ID. NO: 6). Este dominio DH comprende los aminoácidos H-G-I-A-N-P-T-F-V-H-A-P-G-K-I (SEQ ID NO: 100; posiciones 876-890 de SEQ ID NO: 6) en las posiciones 426-440 de SEQ ID NO: 30.

15 El tercer dominio en OrfC es un dominio ER, también denominado en el presente documento ORFC-ER, y la secuencia de nucleótidos que contiene la secuencia que codifica para el dominio OrfC-ER se representa en el presente documento como SEQ ID NO: 31 (posiciones 2995-4506 de SEQ ID NO: 5). La secuencia de aminoácidos que contiene el dominio OrfC-ER se representa en el presente documento como SEQ ID NO: 32 (posiciones 9991502 de SEQ ID NO: 6)

Sistema de PKS de AGPI de Thraustochytrium

Hay tres marcos de lectura abiertos que forman el sistema de PKS de AGPI de Thraustochytrium 23B central. La organización de dominios es la misma que la que Schizochytrium con la excepción de que el Orf A de Th. 23B tiene

25 8 dominios ACP adyacentes, mientras que el Orf de Schizochytrium A tiene 9 dominios ACP adyacentes. La estructura de dominios de cada marco de lectura abierto es tal como sigue.

Marco de lectura abierto A (OrfA) de Thraustochytrium 23B:

La secuencia de nucleótidos completa para OrfA de Th. 23B se representa en el presente documento como SEQ ID NO: 38. OrfA de Th. 23B es una secuencia de 8433 nucleótidos (sin incluir el codón de terminación) que codifica para una secuencia de 2811 aminoácidos, representada en el presente documento como SEQ ID NO: 39. SEQ ID NO: 38 codifica para los siguientes dominios en OrfA de Th. 23B: (a) un dominioβ-cetoacil-ACP sintasa (KS); (b) un dominio malonil-CoA:ACP aciltransferasa (MAT); (c) ocho dominios de proteína transportadora de acilo (ACP); y (d)

35 un dominio β-cetoacil-ACP reductasa (KR).

Dos clones genómicos descritos en el presente documento como Th23BOrfA_pBR812.1 y Th23BOrfA_pBR811 (clones genómicos de OrfA), aislados de Thraustochytrium 23B, juntos (clones solapantes) comprenden, según el mejor entender de los presentes inventores, la secuencia de nucleótidos de SEQ ID NO: 38, y codifica para la secuencia de aminoácidos de SEQ ID NO: 39. El clon genómico Th23BOrfA_pBR812.1 (indicado como clon genómico Th23BOrfA_pBR812.1, en forma de un vector de plásmido de E. coli que contiene la secuencia del gen OrfA de Thraustochytrium 23B) se depositó en la Colección Americana de Cultivos Tipo (ATCC), 10801 University Boulevard, Manassas, Va. 20110-2209 EE.UU. el 1 de marzo de 2007, y se le asignó el n.º de registro de la ATCC PTA-8232. La secuencia de nucleótidos de Th23BOrfA_pBR812.1, un clon genómico de OrfA, y la secuencia de

45 aminoácidos codificada por este plásmido se abarcan por la presente invención. El clon genómico Th23BOrfA_pBR811 (indicado como clon genómico Th23BOrfA_pBR811, en forma de un vector de plásmido de E. coli que contiene la secuencia del gen OrfA de Thraustochytrium 23B) se depositó en la Colección Americana de Cultivos Tipo (ATCC), 10801 University Boulevard, Manassas, Va. 20110-2209 EE.UU. el 1 de marzo de 2007, y se le asignó el n.º de registro de la ATCC PTA-8231. La secuencia de nucleótidos de Th23BOrfA_pBR811, un clon genómico de OrfA, y la secuencia de aminoácidos codificada por este plásmido se abarcan por la presente invención.

El primer dominio en OrfA de Th. 23B es un dominio KS, también denominado en el presente documento OrfA-KS de Th. 23B, y está contenido dentro de la secuencia de nucleótidos que abarca de desde aproximadamente la posición

55 1 hasta aproximadamente la posición 1500 de SEQ ID NO: 38, representada en el presente documento como SEQ ID NO: 40. La secuencia de aminoácidos que contiene el dominio KS de Th. 23B es una región de SEQ ID NO: 39 que abarca de desde aproximadamente la posición 1 hasta aproximadamente la posición 500 de SEQ ID NO: 39, representada en el presente documento como SEQ ID NO: 41. Esta región de SEQ ID NO: 39 tiene una coincidencia de Pfam con FabB (β-cetoacil-ACP sintasa) que abarca de desde la posición 1 hasta aproximadamente la posición 450 de SEQ ID NO: 39 (también posiciones 1 a aproximadamente 450 de SEQ ID NO: 41). Se observa que el dominio Th. 23B OrfA-KS contiene un motivo de sitio activo: DXAC* (*sitio de unión a acilo C207). Además, un motivo característico en el extremo de la región KS de Th. 23B, GFGG, está presente en las posiciones 453-456 de SEQ ID NO: 39 (también posiciones 453-456 de SEQ ID NO: 41).

65 El segundo dominio en OrfA de Th. 23B es un dominio MAT, también denominado en el presente documento OrfA-MAT de Th. 23B, y está contenido dentro de la secuencia de nucleótidos que abarca de desde aproximadamente la posición 1503 hasta aproximadamente la posición 3000 de SEQ ID NO: 38, representada en el presente documento como SEQ ID NO: 42. La secuencia de aminoácidos que contiene el dominio MAT de Th. 23B es una región de SEQ ID NO: 39 que abarca de desde aproximadamente la posición 501 hasta aproximadamente la posición 1000, representada en el presente documento por SEQ ID NO: 43. Esta región de SEQ ID NO: 39 tiene una coincidencia

5 de Pfam con FabD (malonil-CoA:ACP aciltransferasa) que abarca de desde aproximadamente la posición 580 hasta aproximadamente la posición 900 de SEQ ID NO: 39 (posiciones 80-400 de SEQ ID NO: 43). Se observa que el dominio OrfA-MAT de Th. 23B contiene un motivo de sitio activo: GHS*XG (*sitio de unión a acilo S697), representado por las posiciones 695-699 de SEQ ID NO: 39.

10 Los dominios 3-10 de OrfA de Th. 23B son ocho dominios ACP en tándem, también denominados en el presente documento OrfA-ACP de Th. 23B (el primer dominio en la secuencia es OrfA-ACP1, el segundo dominio es OrfA-ACP2, el tercer dominio es OrfA-ACP3, etc.). El primer dominio ACP de Th. 23B, OrfA-ACP1 de Th. 23B, está contenido dentro de la secuencia de nucleótidos que abarca de desde aproximadamente la posición 3205 hasta aproximadamente la posición 3555 de SEQ ID NO: 38 (OrfA), representada en el presente documento como SEQ ID

15 NO: 44. La secuencia de aminoácidos que contiene el primer dominio ACP de Th. 23B es una región de SEQ ID NO: 39 que abarca de desde aproximadamente la posición 1069 hasta aproximadamente la posición 1185 de SEQ ID NO: 39, representada en el presente documento por SEQ ID NO: 45.

Los ocho dominios ACP en OrfA de Th. 23B son adyacentes entre sí y pueden identificarse por la presencia del

20 motivo de sitio de unión a fosfopanteteína, LGXDS* (representado por SEQ ID NO: 46), en el que la S* es el sitio de acoplamiento a fosfopanteteína. La posición de aminoácido de cada uno de los ocho sitios S*, con referencia a SEQ ID NO: 39, son 1128 (ACP1), 1244 (ACP2), 1360 (ACP3), 1476 (ACP4), 1592 (ACP5), 1708 (ACP6), 1824 (ACP7) y 1940 (ACP8). Las secuencias de nucleótidos y aminoácidos de los ocho dominios ACP de Th. 23B están altamente conservadas y, por tanto, la secuencia para cada dominio no se representa en el presente documento por un

25 identificador de secuencia individual. Sin embargo, basándose en la información dada a conocer en el presente documento, un experto en la técnica puede determinar fácilmente la secuencia que contiene cada uno de los otros siete dominios ACP en SEQ ID NO: 38 y SEQ ID NO: 39.

Todos los ocho dominios ACP de Th. 23B juntos abarcan una región de OrfA de Th. 23B de desde

30 aproximadamente la posición 3205 hasta aproximadamente la posición 5994 de SEQ ID NO: 38, que corresponde a las posiciones de aminoácido de desde aproximadamente 1069 hasta aproximadamente 1998 de SEQ ID NO: 39. La secuencia de nucleótidos para toda la región ACP que contiene los ocho dominios se representa en el presente documento como SEQ ID NO: 47. SEQ ID NO: 47 codifica para una secuencia de aminoácidos representada en el presente documento por SEQ ID NO: 48. SEQ ID NO: 48 incluye los segmentos de ligador entre dominios ACP

35 individuales. El intervalo de repetición para los ocho dominios es aproximadamente cada 116 aminoácidos de SEQ ID NO: 48, y puede considerarse que cada dominio consiste en aproximadamente 116 aminoácidos centrados en el motivo de sitio activo (descrito anteriormente).

El último dominio en OrfA de Th. 23B es un dominio KR, también denominado en el presente documento OrfA-KR de

40 Th. 23B, que está contenido dentro de la secuencia de nucleótidos que abarca de desde aproximadamente la posición 6001 hasta aproximadamente la posición 8433 de SEQ ID NO: 38, representada en el presente documento por SEQ ID NO: 49. La secuencia de aminoácidos que contiene el dominio KR de Th. 23B es una región de SEQ ID NO: 39 que abarca de desde aproximadamente la posición 2001 hasta aproximadamente la posición 2811 de SEQ ID NO: 39, representada en el presente documento por SEQ ID NO: 50. Esta región de SEQ ID NO: 39 tiene una

45 coincidencia de Pfam con FabG (β-cetoacil-ACP reductasa) que abarca de desde aproximadamente la posición 2300 hasta aproximadamente 2550 de SEQ ID NO: 39 (posiciones 300-550 de SEQ ID NO: 50).

Marco de lectura abierto B (OrfB) de Thraustochytrium 23B:

50 La secuencia de nucleótidos completa para OrfB de Th. 23B se representa en el presente documento como SEQ ID NO: 51, que es una secuencia de 5805 nucleótidos (sin incluir el codón de terminación) que codifica para una secuencia de 1935 aminoácidos, representada en el presente documento como SEQ ID NO: 52. SEQ ID NO: 51 codifica para los siguientes dominios en OrfB de Th. 23B: (a) un dominioβ-cetoacil-ACP sintasa (KS); (b) un dominio de factor de longitud de cadena (CLF); (c) un dominio aciltransferasa (AT); y (d) un dominio enoil-ACP reductasa

55 (ER).

Un clon genómico descrito en el presente documento como Th23BOrfB_pBR800 (clon genómico de OrfB), aislado de Thraustochytrium 23B, comprende, según el mejor entender de los presentes inventores, la secuencia de nucleótidos de SEQ ID NO: 51, y codifica para la secuencia de aminoácidos de SEQ ID NO: 52. El clon genómico 60 Th23BOrfB_pBR800 (indicado como clon genómico Th23BOrfB_pBR800, en forma de un vector de plásmido de E. coli que contiene la secuencia del gen OrfB de Thraustochytrium 23B) se depositó en la Colección Americana de Cultivos Tipo (ATCC), 10801 University Boulevard, Manassas, Va. 20110-2209 EE.UU. el 1 de marzo de 2007, y se le asignó el n.º de registro de la ATCC PTA-8227. La secuencia de nucleótidos de Th23BOrfB_pBR800, un clon genómico de OrfB, y la secuencia de aminoácidos codificada por este plásmido se abarcan por la presente

65 invención.

El primer dominio en el OrfB de Th. 23B es un dominio KS, también denominado en el presente documento OrfB-KS de Th. 23B, que está contenido dentro de la secuencia de nucleótidos que abarca de desde aproximadamente la posición 1 hasta aproximadamente la posición 1500 de SEQ ID NO: 51 (OrfB de Th. 23B), representada en el presente documento como SEQ ID NO: 53. La secuencia de aminoácidos que contiene el dominio KS de Th. 23B es

5 una región de SEQ ID NO: 52 que abarca de desde aproximadamente la posición 1 hasta aproximadamente la posición 500 de SEQ ID NO: 52, representada en el presente documento como SEQ ID NO: 54. Esta región de SEQ ID NO: 52 tiene una coincidencia de Pfam con FabB (β-cetoacil-ACP sintasa) que abarca de desde aproximadamente la posición 1 hasta aproximadamente la posición 450 (posiciones 1-450 de SEQ ID NO: 54). Se observa que el dominio OrfB-KS de Th. 23B contiene un motivo de sitio activo: DXAC*, en el que C* es el sitio de acoplamiento de grupo acilo y en el que la C* está en la posición 201 de SEQ ID NO: 52. Además, un motivo característico en el extremo de la región KS, GFGG, está presente en las posiciones de aminoácido 434-437 de SEQ ID NO: 52.

El segundo dominio en OrfB de Th. 23B es un dominio CLF, también denominado en el presente documento OrfB

15 CLF de Th. 23B, que está contenido dentro de la secuencia de nucleótidos que abarca de desde aproximadamente la posición 1501 hasta aproximadamente la posición 3000 de SEQ ID NO: 51 (OrfB), representada en el presente documento como SEQ ID NO: 55. La secuencia de aminoácidos que contiene el dominio CLF es una región de SEQ ID NO: 52 que abarca de desde aproximadamente la posición 501 hasta aproximadamente la posición 1000 de SEQ ID NO: 52, representada en el presente documento como SEQ ID NO: 56. Esta región de SEQ ID NO: 52 tiene una coincidencia de Pfam con FabB (β-cetoacil-ACP sintasa) que abarca de desde aproximadamente la posición 550 hasta aproximadamente la posición 910 (posiciones 50-410 de SEQ ID NO: 56). Aunque CLF tiene homología con proteínas KS, carece de una cisteína de sitio activo a la que se acopla el grupo acilo en proteínas KS.

El tercer dominio en OrfB de Th. 23B es un dominio AT, también denominado en el presente documento OrfB-AT de

25 Th. 23B, que está contenido dentro de la secuencia de nucleótidos que abarca de desde aproximadamente la posición 3001 hasta aproximadamente la posición 4500 de SEQ ID NO: 51 (OrfB de Th. 23B), representada en el presente documento como SEQ ID NO: 58. La secuencia de aminoácidos que contiene el dominio AT de Th. 23B es una región de SEQ ID NO: 52 que abarca de desde aproximadamente la posición 1001 hasta aproximadamente la posición 1500 de SEQ ID NO: 52, representada en el presente documento como SEQ ID NO: 58. Esta región de SEQ ID NO: 52 tiene una coincidencia de Pfam con FabD (malonil-CoA:ACP aciltransferasa) que abarca de desde aproximadamente la posición 1100 hasta aproximadamente la posición 1375 (posiciones 100-375 de SEQ ID NO: 58). Aunque este dominio AT de las AGPI sintasas tiene homología con proteínas MAT, carece del motivo extendido del MAT (residuos arginina y glutamina clave) y no se piensa que esté implicado en transferencias de malonil-CoA. Está presente el motivo GXS*XG de aciltransferasas, siendo la S* el sitio de acoplamiento de acilo y estando

35 ubicada en la posición 1123 con respecto a SEQ ID NO: 52.

El cuarto dominio en OrfB de Th. 23B es un dominio ER, también denominado en el presente documento OrfB-ER de Th. 23B, que está contenido dentro de la secuencia de nucleótidos que abarca de desde aproximadamente la posición 4501 hasta aproximadamente la posición 5805 de SEQ ID NO: 51 (OrfB), representada en el presente documento como SEQ ID NO: 59. La secuencia de aminoácidos que contiene el dominio ER de Th. 23B es una región de SEQ ID NO: 52 que abarca de desde aproximadamente la posición 1501 hasta aproximadamente la posición 1935 de SEQ ID NO: 52, representada en el presente documento como SEQ ID NO: 60. Esta región de SEQ ID NO: 52 tiene una coincidencia de Pfam con una familia de dioxigenasas relacionadas con 2-nitropropano dioxigenasas que abarca de desde aproximadamente la posición 1501 hasta aproximadamente la posición 1810

45 (posiciones 1-310 de SEQ ID NO: 60). Puede predecirse adicionalmente que este dominio funciona como una ER debido a la homología con una enzima ER recién caracterizada de Streptococcus pneumoniae.

Marco de lectura abierto C (OrfC) de Thraustochytrium 23B:

La secuencia de nucleótidos completa para OrfC de Th. 23B se representa en el presente documento como SEQ ID NO: 61, que es una secuencia de 4410 nucleótidos (sin incluir el codón de terminación) que codifica para una secuencia de 1470 aminoácidos, representada en el presente documento como SEQ ID NO: 62. SEQ ID NO: 61 codifica para los siguientes dominios en OrfC de Th. 23B: (a) dos dominiosβ-hidroxiacil-ACP deshidrasa (DH) similares a FabA, ambos con homología con la proteína FabA (una enzima que cataliza la síntesis de trans-2

55 decenoil-ACP y la isomerización reversible de este producto a cis-3-decenoil-ACP); y (b) un dominio enoil-ACP reductasa (ER) con alta homología con el dominio ER de OrfB de Schizochytrium.

Un clon genómico descrito en el presente documento como Th23BOrfC_pBR709A (clon genómico de OrfC), aislado de Thraustochytrium 23B, comprende, según el mejor entender de los presentes inventores, la secuencia de nucleótidos de SEQ ID NO: 61, y codifica para la secuencia de aminoácidos de SEQ ID NO: 62. El clon genómico Th23BOrfC_pBR709A (indicado como clon genómico Th23BOrfC_pBR709A, en forma de un vector de plásmido de

E. coli que contiene la secuencia del gen OrfC de Thraustochytrium 23B) se depositó en la Colección Americana de Cultivos Tipo (ATCC), 10801 University Boulevard, Manassas, Va. 20110-2209 EE.UU. el 1 de marzo de 2007, y se le asignó el n.º de registro de la ATCC PTA-8228. La secuencia de nucleótidos de Th23BOrfC_pBR709A, un clon

65 genómico de OrfC, y la secuencia de aminoácidos codificada por este plásmido se abarcan por la presente invención.

El primer dominio en OrfC de Th. 23B es un dominio DH, también denominado en el presente documento OrfC-DH1 de Th. 23B, que está contenido dentro de la secuencia de nucleótidos que abarca de desde aproximadamente la posición 1 hasta aproximadamente la posición 1500 de SEQ ID NO: 61 (OrfC), representada en el presente

5 documento como SEQ ID NO: 63. La secuencia de aminoácidos que contiene el dominio DH1 de Th. 23B es una región de SEQ ID NO: 62 que abarca de desde aproximadamente la posición 1 hasta aproximadamente la posición 500 de SEQ ID NO: 62, representada en el presente documento como SEQ ID NO: 64. Esta región de SEQ ID NO: 62 tiene una coincidencia de Pfam con FabA, tal como se mencionó anteriormente, que abarca de desde aproximadamente la posición 275 hasta aproximadamente la posición 400 (posiciones 275-400 de SEQ ID NO: 64).

El segundo dominio en OrfC de Th. 23B es también un dominio DH, también denominado en el presente documento OrfC-DH2 de Th. 23B, que está contenido dentro de la secuencia de nucleótidos que abarca de desde aproximadamente la posición 1501 hasta aproximadamente 3000 de SEQ ID NO: 61 (OrfC), representada en el presente documento como SEQ ID NO: 65. La secuencia de aminoácidos que contiene el dominio DH2 de Th. 23B

15 es una región de SEQ ID NO: 62 que abarca de desde aproximadamente la posición 501 hasta aproximadamente la posición 1000 de SEQ ID NO: 62, representada en el presente documento como SEQ ID NO: 66. Esta región de SEQ ID NO: 62 tiene una coincidencia de Pfam con FabA, tal como se mencionó anteriormente, que abarca de desde aproximadamente la posición 800 hasta aproximadamente la posición 925 (posiciones 300-425 de SEQ ID NO: 66).

El tercer dominio en OrfC de Th. 23B es un dominio ER, también denominado en el presente documento OrfC-ER de Th. 23B, que está contenido dentro de la secuencia de nucleótidos que abarca de desde aproximadamente la posición 3001 hasta aproximadamente la posición 4410 de SEQ ID NO: 61 (OrfC), representada en el presente documento como SEQ ID NO: 67. La secuencia de aminoácidos que contiene el dominio ER de Th. 23B es una

25 región de SEQ ID NO: 62 que abarca de desde aproximadamente la posición 1001 hasta aproximadamente la posición 1470 de SEQ ID NO: 62, representada en el presente documento como SEQ ID NO: 68. Esta región de SEQ ID NO: 62 tiene una coincidencia de Pfam con las dioxigenasas relacionadas con 2-nitropropano dioxigenasas, tal como se mencionó anteriormente, que abarca de desde aproximadamente la posición 1025 hasta aproximadamente la posición 1320 (posiciones 25-320 de SEQ ID NO: 68). También puede predecirse que este dominio funciona como una ER debido a la homología con una enzima ER recién caracterizada de Streptococcus pneumoniae.

Constructos sintéticos optimizados para codones

35 La invención también abarca versiones resintetizadas de cualquiera de las secuencias de ácido nucleico descritas en el presente documento, que tienen principalmente un uso de codones optimizado para un organismo heterólogo (huésped heterólogo), en el que la secuencia de aminoácidos codificada no está cambiada con referencia a la secuencia de aminoácidos natural, de tipo natural o fuente. Los presentes inventores han descubierto que la resintetización de secuencias de ácido nucleico para un uso de codones óptimo es un modo eficaz para mejorar la producción de AGPI en un huésped heterólogo que se transforma con moléculas de ácido nucleico de un sistema de PKS de AGPI. La resíntesis de todas las moléculas de ácido nucleico en un sistema de PKS de AGPI no se requiere necesariamente para una expresión y producción de AGPI óptimas en un huésped heterólogo. En efecto, los inventores han encontrado que la resíntesis de sólo algunas de las moléculas de ácido nucleico es suficiente para mejorar la producción de AGPI. Por ejemplo, mientras que la resíntesis de los Orf A y B de Schizochytrium mejoraba

45 la expresión de AGPI sintasa y la producción de AGPI en levadura, el uso del OrfC de Schizochytrium nativo y HetI PPTasa de Nostoc nativa eran suficientes. Además, la optimización de codones de un constructo para su uso en un huésped heterólogo también puede ser útil para mejorar la producción de AGPI en un huésped heterólogo diferente (por ejemplo, la optimización del uso de codones de una secuencia que codifica para OrfC de Thraustochytrium para su uso en Schizochytrium también puede ser eficaz para estimular la producción de AGPI en otro organismo huésped heterólogo, tal como plantas).

Además, el uso de constructos sintéticos optimizados para codones puede ser útil en la producción de constructos PKS de AGPI quiméricos y/o sistemas de PKS de AGPI quiméricos, en los que se introduce un dominio o una proteína de un sistema de PKS de AGPI (por ejemplo, de un primer organismo) en un segundo sistema de PKS de

55 AGPI (por ejemplo, de un segundo organismo). En tales sistemas, no sólo puede manipularse el perfil de AGPI (por ejemplo, mediante el uso de los constructos quiméricos y/o sistemas de PKS de AGPI quiméricos), sino que la producción de AGPI también puede mejorarse mediante el uso de constructos quiméricos sintéticos optimizados para codones. En efecto, la combinación de los dos conceptos (quimeras y optimización de codones) puede producir un resultado sinérgico con respecto a los perfiles de AGPI y/o la producción de AGPI. Se incluyen en la invención sistemas que contienen algunas secuencias que están optimizadas para codones para el huésped y algunas que no están optimizadas para codones para el huésped.

A continuación se describen determinadas secuencias optimizadas para codones a modo de ejemplo. Otras secuencias optimizadas para codones resultarán evidentes para los expertos en la técnica tras esta descripción:

65 sOrfA

SEQ ID NO: 35, indicada como sOrfA, representa la secuencia de ácido nucleico que codifica para OrfA de Schizochytrium (SEQ ID NO: 1) que se ha resintetizado para el uso de codones optimizado en levadura. SEQ ID NO: 1 y SEQ ID NO: 35 codifican cada una para SEQ ID NO: 2.

sOrfB

SEQ ID NO: 36, indicada como sOrfB, representa la secuencia de ácido nucleico que codifica para OrfB de Schizochytrium (SEQ ID NO: 3) que se ha resintetizado para el uso de codones optimizado en levadura. SEQ ID NO:

10 3 y SEQ ID NO: 36 codifican cada una para SEQ ID NO: 4.

OrfB*

SEQ ID NO: 37, indicada como OrfB* (pJK962), representa una secuencia de ácido nucleico que codifica para OrfB

15 de Schizochytrium (SEQ ID NO: 4) que se ha resintetizado dentro de una porción de SEQ ID NO: 3 (secuencia de nucleótidos que codifica para SEQ ID NO: 4) para su uso en células de plantas, y que se derivó de una secuencia muy similar desarrollada inicialmente para el uso de codones optimizado en E. coli, también denominada OrfB* (pJK780), que se describe a continuación. OrfB* en ambas formas (para E. coli y para plantas) es idéntica a SEQ ID NO: 3 con la excepción de un BspHI resintetizado (nucleótido 4415 de SEQ ID NO: 3) para dar un fragmento SacII

20 (sitio único en SEQ ID NO: 3). Ambas versiones (E. coli y planta) tienen otras dos modificaciones de codones cerca del inicio del gen en comparación con la secuencia genómica original de orfB (SEQ ID NO: 3). En primer lugar, el cuarto codón, arginina (R), se cambió de CGG en la secuencia genómica a CGC en orfB*. En segundo lugar, el quinto codón, asparagina (N), se cambió de AAT en la secuencia genómica a AAC en orfB*. Con el fin de facilitar la clonación de este gen en los vectores de plantas para crear SEQ ID NO: 37, también se modificó por ingeniería

25 genética un sitio de PstI (CTGCAG) en la secuencia de orfB* de E. coli 20 bases a partir del inicio del gen. Este cambio no alteró la secuencia de aminoácidos de la proteína codificada. Tanto SEQ ID NO: 37 como SEQ ID NO: 3 (así como la forma de OrfB* para E. coli, descrita en SEQ ID NO: 69 a continuación) codifican para SEQ ID NO: 4.

SEQ ID NO: 69, indicada como OrfB* (pJK780), representa una secuencia de ácido nucleico que codifica para OrfB

30 de Schizorchytrium (SEQ ID NO: 4) que se ha resintetizado dentro de una porción de SEQ ID NO: 3 (secuencia de nucleótidos que codifica para SEQ ID NO: 4) para su uso en E. coli. La secuencia del constructo de OrfB* en ambas formas (para E. coli y para plantas) se ha descrito anteriormente. SEQ ID NO: 69 y SEQ ID NO: 3 codifican para SEQ ID NO: 4.

35 El plásmido descrito en el presente documento como OrfB*_pJK780 comprende, según el mejor entender de los presentes inventores, la secuencia de nucleótidos de SEQ ID NO: 69, y codifica para la secuencia de aminoácidos de SEQ ID NO: 4. El plásmido OrfB*_pJK780 (indicado como clon OrfB*_pJK780, en forma de un vector de plásmido de E. coli) se depositó en la Colección Americana de Cultivos Tipo (ATCC), 10801 University Boulevard, Manassas, Va. 20110-2209 EE.UU. el 1 de marzo de 2007, y se le asignó el n.º de registro de la ATCC PTA-8225. La secuencia

40 de nucleótidos de OrfB*_pJK780 y la secuencia de aminoácidos codificada por este plásmido se abarcan por la presente invención.

pThOrfC-synPS

45 SEQ ID NO: 70 representa una secuencia de ácido nucleico que codifica para un OrfC de Thraustochytrium 23B (SEQ ID NO: 61, que codifica para SEQ ID NO: 62) que se ha resintetizado para el uso de codones optimizado en Schizochytrium. Las posiciones 2000-6412 de SEQ ID NO: 70 representan la región codificante para la proteína OrfC de Thraustochytrium 23B (incluyendo el codón de terminación). Las posiciones 1-1999 y 6413-8394 de SEQ ID NO: 70 representan secuencias de OrfC de Schizochytrium en el sentido de 5’ y en sentido de 3’ (regiones no

50 codificantes), respectivamente. La construcción del plásmido que contiene SEQ ID NO: 70, indicado como pThOrfCsynPS, se describe en detalle en el ejemplo 1. SEQ ID NO: 70 y SEQ ID NO: 61 codifican cada una para SEQ ID NO: 62. pThOrfC-syn PS se diseña para sustituir exactamente la región codificante (CDS) de orfC de Schizochytrium (SEQ ID NO: 5) por la región codificante para el orfC de Thraustochytrium 23B, resintetizada tal como se comentó anteriormente (SEQ ID NO: 70). La producción y el uso de organismos que se han transformado con este constructo

55 se describen en detalle a continuación y en los ejemplos.

El plásmido descrito anteriormente como pThOrfC-synPS comprende, según el mejor entender de los presentes inventores, la secuencia de nucleótidos de SEQ ID NO: 70, y codifica para la secuencia de aminoácidos correspondiente de SEQ ID NO: 62. El plásmido pThOrfC-synPS (indicado como pThOrfC-synPS, en forma de un 60 vector de plásmido de E. coli que contiene un OrfC de PKS de AGPI de Thraustochytrium 23B con “costura perfecta” (“perfect stitch”) optimizado para codones para la expresión en Schizochytrium o otros huéspedes heterólogos) se depositó en la Colección Americana de Cultivos Tipo (ATCC), 10801 University Boulevard, Manassas, Va. 201102209 EE.UU. el 1 de marzo de 2007, y se le asignó el n.º de registro de la ATCC PTA-8229. La secuencia de nucleótidos de pThOrfC-synPS, y la secuencia de aminoácidos codificada por este plásmido se abarcan por la

65 presente invención.

pDD26

SEQ ID NO: 71 representa una secuencia de ácido nucleico que codifica para un OrfA de Thraustochytrium 23B (SEQ ID NO: 38, que codifica para SEQ ID NO: 39) que se ha resintetizado para el uso de codones optimizado en 5 Schizochytrium. Las posiciones 2044-10479 de SEQ ID NO: 71 representan la región codificante para la proteína OrfA de Thraustochytrium 23B (incluyendo el codón de terminación). Las posiciones 1-2043 y 10480-12495 de SEQ ID NO: 71 representan secuencias de OrfA de Schizochytrium en el sentido de 5’ y en el sentido de 3’ (regiones no codificantes), respectivamente. La construcción del plásmido que contiene SEQ ID NO: 71, indicado como pDD26, se describe en detalle en el ejemplo 8. SEQ ID NO: 71 y SEQ ID NO: 38 codifican cada una para SEQ ID NO: 39.

10 pDD26 se diseña para sustituir exactamente la región codificante (CDS) de orfA de Schizochytrium (SEQ ID NO: 1) por la región codificante para el orfC de Thraustochytrium 23B, resintetizada tal como se comentó anteriormente (SEQ ID NO: 71). La producción y use de organismos que se han transformado con este constructo se describen en detalle a continuación y en los ejemplos.

15 Los plásmidos descritos anteriormente como pDD26 comprenden, según el mejor entender de los presentes inventores, la secuencia de nucleótidos de SEQ ID NO: 71, y codifican para la secuencia de aminoácidos correspondiente de SEQ ID NO: 39. El plásmido pDD26 (indicado como pDD26, en forma de un vector de plásmido de E. coli) se depositó en la Colección Americana de Cultivos Tipo (ATCC), 10801 University Boulevard, Manassas, Va. 20110-2209 USA el 8 de mayo de 2007, y se le asignó el n.º de registro de la ATCC PTA-8411. La secuencia de

20 nucleótidos de pDD26, y la secuencia de aminoácidos codificada por este plásmido se abarcan por la presente invención.

pDD32

25 SEQ ID NO: 72 representa una secuencia de ácido nucleico que codifica para un OrfB de Thraustochytrium 23B (SEQ ID NO: 51, que codifica para SEQ ID NO: 52) que se ha resintetizado para el uso de codones optimizado en Schizochytrium. Las posiciones 1452-7259 de SEQ ID NO: 72 representan la región codificante para la proteína OrfB de Thraustochytrium 23B (incluyendo el codón de terminación). Las posiciones 1-1451 y 7260-8647 de SEQ ID NO: 72 representan secuencias de OrfB de Schizochytrium en el sentido de 5’ y en el sentido de 3’ (regiones no

30 codificantes), respectivamente. La construcción del plásmido que contiene SEQ ID NO: 72, indicada como pDD32, se describe en detalle en el ejemplo 8. SEQ ID NO: 72 y SEQ ID NO: 51 codifican cada una para SEQ ID NO: 52. pDD32 se diseña para sustituir exactamente la región codificante (CDS) de orfB de Schizochytrium (SEQ ID NO: 3) por la región codificante para el orfC de Thraustochytrium 23B, resintetizada tal como se comentó anteriormente (SEQ ID NO: 72). La producción y use de organismos que se han transformado con este constructo se describen en

35 detalle a continuación y en los ejemplos.

Los plásmidos descritos anteriormente como pDD32 comprenden, según el mejor entender de los presentes inventores, la secuencia de nucleótidos de SEQ ID NO: 72, y codifican para la secuencia de aminoácidos correspondiente de SEQ ID NO: 52. El plásmido pDD32 (indicado como pDD32, en forma de un vector de plásmido

40 de E. coli) se depositó en la Colección Americana de Cultivos Tipo (ATCC), 10801 University Boulevard, Manassas, Va. 20110-2209 EE.UU. el 8 de mayo de 2007, y se le asignó el n.º de registro de la ATCC PTA-8412. La secuencia de nucleótidos de pDD32, y la secuencia de aminoácidos codificada por este plásmido se abarcan por la presente invención.

45 Constructos de PKS de AGPI quiméricos

La invención también abarca constructos quiméricos que usan porciones de dos o más secuencias de ácido nucleico de PKS de AGPI diferentes, tales como las descritas en el presente documento, para producir proteínas PKS de AGPI quiméricas. Los presentes inventores demuestran en el presente documento en varios ejemplos diferentes que 50 “mezclando y haciendo coincidir” dominios o porciones de proteínas PKS de AGPI de diferentes organismos (es decir, creando proteínas PKS de AGPI quiméricas compuestas por dominios o polipéptidos de dos o más organismos diferentes), puede modificarse el perfil de AGPI producidos por un organismo que expresa un sistema de PKS de AGPI que contiene tales proteínas quiméricas, en comparación con un sistema de PKS de AGPI nativo (que se produce de manera natural). Por ejemplo, los presentes inventores describen en el presente documento el 55 uso del dominio DH2 de un sistema de PKS de AGPI de Thraustochytrium en la proteína OrfC de una proteína de Schizochytrium, de modo que la proteína OrfC quimérica resultante contiene los dominios DH1 y ER de Schizochytrium, y el dominio DH2 de Thraustochytrium. El constructo quimérico se modifica adicionalmente mediante el uso de un dominio DH2 de Thraustochytrium optimizado para codones (para Schizochytrium) en un constructo, y un dominio DH2 de Thraustochytrium nativo en otro constructo, lo que demuestra la flexibilidad y los

60 efectos de las diversas modificaciones descritas en el presente documento.

Se describen a continuación determinados constructos quiméricos a modo de ejemplo. Otros constructos quiméricos resultarán evidentes para los expertos en la técnica tras esta descripción.

65 pDS49

SEQ ID NO: 73 representa una secuencia de ácido nucleico que codifica para una proteína quimérica que comprende una proteína OrfC de Schizochytrium (SEQ ID NO: 6) en la que el dominio DH2 (SEQ ID NO: 30) se ha sustituido por el dominio DH2 (secuencia que incluye SEQ ID NO: 66) de OrfC de Thraustochytrium 23B (SEQ ID NO: 62). En este constructo quimérico, la secuencia que codifica para DH2 de Thraustochytrium es la secuencia 5 nativa (no optimizada para codones). La construcción del plásmido que contiene SEQ ID NO: 73, indicado como pDS49, se describe en detalle en el ejemplo 2. Las secuencias no codificantes en el sentido de 5’ y en el sentido de 3’ de OrfC de Schizochytrium que flanquean SEQ ID NO: 73 en pDS49 son las mismas que las descritas anteriormente con respecto a SEQ ID NO: 70 (no representadas en SEQ ID NO: 73). SEQ ID NO: 73 codifica para una secuencia de aminoácidos de SEQ ID NO: 74. En referencia a SEQ ID NO: 74, el polipéptido OrfC quimérico tiene 1493 residuos de aminoácido de longitud. La región DH2, definida como los aminoácidos 516-1041 de SEQ ID NO: 74, consiste en la secuencia de aminoácidos de la región DH2 de la proteína OrfC de Th.23B, es decir, los aminoácidos 491-1016 de SEQ ID NO: 62, que incluye toda la SEQ ID NO: 66 y alguna secuencia de aminoácidos flanqueante de SEQ ID NO: 62. Con respecto al resto de la secuencia de aminoácidos de OrfC quimérica, los residuos 1-515 y 1042-1493 de SEQ ID NO: 74 son idénticos a los residuos de OrfC de Schizochytrium 1-515 y

15 1051-1502 de SEQ ID NO: 6, respectivamente. La producción y el uso de organismos que se han transformado con este constructo se describen en detalle a continuación y en los ejemplos.

Los plásmidos descritos anteriormente como pDS49 comprenden, según el mejor entender de los presentes inventores, la secuencia de nucleótidos de SEQ ID NO: 73, y codifican para la secuencia de aminoácidos correspondiente de SEQ ID NO: 74. El plásmido pDS49 (indicado como pDS49, en forma de un vector de plásmido de E. coli) se depositó en la Colección Americana de Cultivos Tipo (ATCC), 10801 University Boulevard, Manassas, Va. 20110-2209 EE.UU. el 1 de marzo de 2007, y se le asignó el n.º de registro de la ATCC PTA-8230. La secuencia de nucleótidos de pDS49, y la secuencia de aminoácidos codificada por este plásmido se abarcan por la presente invención.

oDD24

SEQ ID NO: 75 representa otro secuencia de ácido nucleico que codifica para una proteína quimérica que comprende una proteína OrfC de Schizochytrium (SEQ ID NO: 6) en la que el dominio DH2 (SEQ ID NO: 30) se ha sustituido por el dominio DH2 (secuencia que incluye SEQ ID NO: 66) de OrfC de Thraustochytrium 23B (SEQ ID NO: 62). En este constructo quimérico, la secuencia que codifica para DH2 de Thraustochytrium es una secuencia optimizada para codones para su uso en Schizochytrium. La construcción del plásmido que contiene SEQ ID NO: 75, indicado como pDD24, se describe en detalle en el ejemplo 3. Las secuencias no codificantes en el sentido de 5’ y en el sentido de 3’ de OrfC de Schizochytrium que flanquean SEQ ID NO: 75 en pDD24 son las mismas que las

35 descritas anteriormente con respecto a SEQ ID NO: 70 (no representadas en SEQ ID NO: 75). SEQ ID NO: 75 codifica para una secuencia de aminoácidos de SEQ ID NO: 74. SEQ ID NO: 74 se ha descrito en detalle anteriormente con respecto a SEQ ID NO: 73, que también codifica para SEQ ID NO: 74. Sin embargo, en este constructo, tal como se comentó anteriormente la secuencia de nucleótidos que codifica para los aminoácidos 5161041 de SEQ ID NO: 74 se derivó de la “secuencia génica sintética” para OrfC de Thraustochytrium 23B que está contenida en el plásmido pThOrfC-synPS (véase el ejemplo 1 y SEQ ID NO: 70) y que emplea codones que se prefieren para la expresión génica en Schizochytrium. La producción y el uso de organismos que se han transformado con este constructo se describen en detalle a continuación y en los ejemplos.

Los plásmidos descritos anteriormente como pDD24 comprenden, según el mejor entender de los presentes

45 inventores, la secuencia de nucleótidos de SEQ ID NO: 75, y codifican para la secuencia de aminoácidos correspondiente de SEQ ID NO: 74. El plásmido pDD24 (indicado como pDD24, en forma de un vector de plásmido de E. coli) se depositó en la Colección Americana de Cultivos Tipo (ATCC), 10801 University Boulevard, Manassas, Va. 20110-2209 EE.UU. el 1 de marzo de 2007, y se le asignó el n.º de registro de la ATCC PTA-8226. La secuencia de nucleótidos de pDD24, y la secuencia de aminoácidos codificada por este plásmido se abarcan por la presente invención.

Sistemas de PKS de AGPI quiméricos

Además del uso de la optimización de codones y los constructos quiméricos descritos anteriormente, la invención

55 incluye la producción y el uso de sistemas de PKS de AGPI quiméricos. Los sistemas de PKS de AGPI quiméricos incluyen el uso de los constructos quiméricos descritos anteriormente, en los que se crea una proteína PKS de AGPI quimérica y se usa en un sistema de PKS de AGPI, pero tales sistemas también abarcan sistemas de PKS de AGPI en los que una o más proteínas completas o proteínas de uno o más sistema(s) de PKS de AGPI se intercambian por o se añaden a la correspondiente proteína completa o proteínas de otro sistema de PKS de AGPI, de manera que el sistema de PKS de AGPI resultante comprende proteínas de dos o más sistemas de PKS de AGPI diferentes. Tales sistemas también pueden incluir el uso de proteínas quiméricas, tal como se describió anteriormente (por ejemplo, proteínas quiméricas y sustituciones de proteínas completas). Por ejemplo, el constructo descrito anteriormente como pTh23B_synPS (que comprende una secuencia que codifica para OrfC de Thraustochytrium 23B, optimizada para el uso de codones de Schizochytrium) puede sustituirse en un sistema de PKS de AGPI de

65 Schizochytrium para reemplazar perfectamente la secuencia que codifica para OrfC de Schizochytrium nativa, creando de ese modo un sistema de PKS de AGPI quimérico. Como otro ejemplo, la secuencia que codifica para OrfC de Thraustochytrium 23B nativa (no optimizada para codones) puede sustituirse en un sistema de PKS de AGPI de Schizochytrium para reemplazar perfectamente la secuencia que codifica para OrfC de Schizochytrium nativa, creando de ese modo otro sistema de PKS de AGPI quimérico. Aún como otro ejemplo, las secuencias que codifican para OrfA y OrfC de Thraustochytrium 23B nativas (optimizadas para codones o no) pueden sustituirse en

5 un sistema de PKS de AGPI de Schizochytrium para sustituir perfectamente las secuencias que codifican para OrfA y OrfC de Schizochytrium nativas, respectivamente, creando de ese modo aún otro sistema de PKS de AGPI quimérico. Estos y otros sistemas de PKS de AGPI quiméricos se describen en los ejemplos a continuación. Se incluyen en los ejemplos huéspedes de Schizochytrium que expresan sistemas de PKS de AGPI quiméricos compuestos por: (1) OrfA, SOrfB de Schizochytrium (S), y OrfC de Thraustochytrium (Th); (2) SOrfA, ThOrfB y SOrfC; (3) ThOrfA, SOrfB y SOrfC; (4) SOrfA, ThOrfB y ThOrfC; (5) ThOrfA, SOrfB y ThOrfC; (6) ThOrfA, ThOrfB y SOrfC; y (7) ThOrfA, ThOrfB y ThOrfC.

Basándose en la descripción y los experimentos a modo de ejemplo proporcionados en el presente documento, ahora es posible mejorar y/o modificar la producción de AGPI mediante resíntesis seleccionada de moléculas de

15 ácido nucleico de PKS de AGPI para el uso de codones del huésped, y/o el uso de constructos de PKS de AGPI quiméricos y/o sistemas de PKS de AGPI quiméricos en diversos organismos huésped, incluyendo en organismos huésped que no tienen de manera endógena un sistema de PKS de AGPI para la producción de AGPI.

Fosfopanteteinil transferasa (PPTasa)

Según la presente invención, un sistema de PKS de AGPI para la producción y/o acumulación de AGPI en un huésped heterólogo o la producción y/o acumulación mejoradas de AGPI en un huésped endógeno puede hacer uso de diversas proteínas auxiliares, que se definen en el presente documento como proteínas que no se considera que son parte del sistema de PKS de AGPI central tal como se describió anteriormente (es decir, no son parte del propio

25 complejo de la enzima AGPI sintasa), pero que pueden ser, o son, necesarias para la producción de AGPI o al menos para la producción eficiente de AGPI usando el complejo de la enzima AGPI sintasa central de la presente invención.

Con el fin de producir AGPI, un sistema de PKS de AGPI debe actuar con una proteína auxiliar que transfiere un resto 4’-fosfopanteteinilo de coenzima A al/a los dominio(s) de proteína transportadora de acilo (ACP). Por tanto, un sistema de PKS de AGPI puede considerarse que incluye al menos un dominio 4’-fosfopanteteinil transferasa (PPTasa), o un dominio de este tipo puede considerarse que es un dominio o una proteína auxiliar para el sistema de PKS de AGPI. Las características estructurales y funcionales de PPTasas se han descrito en detalle, por ejemplo, en la publicación de solicitud de patente estadounidense n.º 20020194641; publicación de solicitud de patente

35 estadounidense n.º 20040235127; y la publicación de solicitud de patente estadounidense n.º 20050100995.

Según la presente invención, un dominio o una proteína que tiene actividad biológica (función) 4’-fosfopanteteinil transferasa (PPTasa) se caracteriza como la enzima que transfiere un resto 4’-fosfopanteteinilo de la coenzima A a la proteína transportadora de acilo (ACP). Esta transferencia a un residuo de serina invariante de la ACP activa la apoforma inactiva a la holoforma. En la síntesis de tanto policétidos como ácidos grasos, el grupo fosfopanteteína forma tioésteres con las cadenas de acilo en crecimiento. Las PPTasas son una familia de enzimas que se han caracterizado bien en la síntesis de ácidos grasos, la síntesis de policétidos y la síntesis de péptidos no ribosómica. Se conocen las secuencias de muchas PPTasas, y se han determinado las estructuras cristalinas (por ejemplo, Reuter K, Mofid MR, Marahiel MA, Ficner R. “Crystal structure of the surfactin synthetase-activating enzyme sfp: a

45 prototype of the 4’-phosphopantetheinyl transferase superfamily” EMBO J. 1 de diciembre de 1999; 18(23):6823-31) así como el análisis mutacional de residuos de aminoácido importantes para la actividad (Mofid MR, Finking R, Essen LO, Marahiel MA. “Structure-based mutational analysis of the 4’-phosphopantetheinyl transferases Sfp from Bacillus subtilis: carrier protein recognition and reaction mechanism” Biochemistry. 13 de abril de 2004; 43(14): 412836). Estos aminoácidos invariantes y altamente conservados en PPTasas están contenidos dentro de los ORF de pfaE de ambas cepas de Shewanedla descritas anteriormente.

Una PPTasa heteróloga que se ha demostrado anteriormente que reconoce los dominios ACP de OrfA descritos en el presente documento como sustratos es la proteína Het I de Nostoc sp. PCC 7120 (anteriormente denominado Anabaena sp. PCC 7120). Het I está presente en una agrupación de genes en Nostoc que se sabe que son 55 responsables de la síntesis de hidroxi-ácidos grasos de cadena larga que son un componente de la capa de glicolípidos presente en heterocistos de ese organismo (Black y Wolk, 1994, J. Bacteriol. 176, 2282-2292; Campbell et al., 1997, Arch. Microbiol. 167, 251-258). Es probable que Het I active los dominios ACP de una proteína, Hgl E, presente en esa agrupación. Los dos dominios ACP de Hgl E tienen un alto grado de homología de secuencia con los dominios ACP encontrados en Orf A de Schizochytrium. SEQ ID NO: 34 representa la secuencia de aminoácidos de la proteína Het I de Nostoc, y es una PPTasa funcional que puede usarse con un sistema de PKS de AGPI descrito en el presente documento, incluyendo los sistemas de PKS de AGPI de Schizochytrium y Thraustochytrium. SEQ ID NO: 34 se codifica por SEQ ID NO: 33. El codón de iniciación endógeno de Het I no se ha identificado (no hay ninguna metionina presente en la proteína supuesta). Hay varios posibles codones de iniciación alternativos (por ejemplo, TTG y ATT) cerca del extremo 5’ del marco de lectura abierto. Ningún codón de metionina (ATG) está 65 presente en la secuencia. Sin embargo, se completó la construcción de un constructo de expresión de Het I usando PCR para sustituir el posible codón de iniciación alternativo en 5’ más lejano (TTG) por un codón de metionina (ATG,

como parte de un sitio de reconocimiento de enzima de restricción Ndel), e introduciendo un sitio de XhoI en el extremo 3’ de la secuencia codificante, y se ha mostrado que la PPTasa codificada (SEQ ID NO: 34) es funcional.

Otra PPTasa heteróloga que se ha demostrado anteriormente que reconoce los dominios ACP de OrfA descritos en

5 el presente documento como sustratos es sfp, derivada de Bacillus subtilis. Sfp se ha caracterizado bien, y se usa ampliamente debido a su capacidad para reconocer una amplia gama de sustratos. Basándose en la información de secuencia publicada (Nakana, et al., 1992, Molecular and General Genetics 232: 313-321), se produjo previamente un vector de expresión para sfp clonando la región codificante, junto con secuencias de ADN flanqueantes en el sentido de 5’ y en el sentido de 3’ definidas, en un vector de clonación pACYC-184. Este constructo codifica para una PPTasa funcional tal como se demostró por su capacidad para coexpresarse con Orf A, B* y C de Schizochytrium en E. coli lo que, en condiciones apropiadas, dio como resultado la acumulación de DHA en esas células (véase la publicación de solicitud de patente estadounidense n.º 20040235127).

Cuando se modifican genéticamente organismos (por ejemplo, microorganismos o plantas) para expresar un sistema

15 de PKS de AGPI según la presente invención, algunos organismos huésped pueden expresar de manera endógena proteínas auxiliares que son necesarias para actuar con la PKS de AGPI para producir AGPI (por ejemplo, PPTasas). Sin embargo, algunos organismos pueden transformarse con moléculas de ácido nucleico que codifican para una o más proteínas auxiliares descritas en el presente documento para permitir y/o potenciar la producción de AGPI por el organismo, aunque el organismo produzca de manera endógena una proteína auxiliar homóloga (es decir, algunas proteínas auxiliares heterólogas pueden funcionar más eficaz o eficientemente con las proteínas AGPI sintasas transformadas que la proteína auxiliar endógena de las células huésped). En una realización, una proteína auxiliar de este tipo incluye una PPTasa auxiliar.

Se describe una molécula de ácido nucleico aislada que comprende una secuencia de ácido nucleico de un sistema

25 de PKS de AGPI, un homólogo de la misma, un fragmento de la misma y/o una secuencia de ácido nucleico que es complementaria a cualquiera de tales secuencias de ácido nucleico. Se describe una molécula de ácido nucleico aislada que comprende una secuencia de ácido nucleico seleccionada del grupo que consiste en: (a) una secuencia de ácido nucleico que codifica para una secuencia de aminoácidos seleccionada del grupo que consiste en: SEQ ID NO: 2, SEQ ID NO: 4, SEQ ID NO: 6, SEQ ID NO: 39, SEQ ID NO: 52, SEQ ID NO: 62 y fragmentos biológicamente activos de las mismas; (b) una secuencia de ácido nucleico que codifica para una secuencia de aminoácidos seleccionada del grupo que consiste en: SEQ ID NO: 8, SEQ ID NO: 10, SEQ ID NO: 13, SEQ ID NO: 18, SEQ ID NO: 20, SEQ ID NO: 22, SEQ ID NO: 24, SEQ ID NO: 26, SEQ ID NO: 28, SEQ ID NO: 30, SEQ ID NO: 32, SEQ ID NO: 41, SEQ ID NO: 43, SEQ ID NO: 45, SEQ ID NO: 48, SEQ ID NO: 50, SEQ ID NO: 54, SEQ ID NO: 56, SEQ ID NO: 58, SEQ ID NO: 60, SEQ ID NO: 64, SEQ ID NO: 66, SEQ ID NO: 68 y fragmentos biológicamente activos de

35 las mismas; (c) una secuencia de ácido nucleico que codifica para una secuencia de aminoácidos que es idéntica en al menos aproximadamente el 60% a al menos 500 aminoácidos consecutivos de cualquiera de las secuencias de aminoácidos de (a), en el que la secuencia de aminoácidos tiene una actividad biológica de al menos uno, dos, tres

o más dominios de un sistema de policétido sintasa (PKS) de ácidos grasos poliinsaturados (AGPI); (d) una secuencia de ácido nucleico que codifica para una secuencia de aminoácidos que es idéntica en al menos aproximadamente el 60% a cualquiera de las secuencias de aminoácidos de (b), en la que dicha secuencia de aminoácidos tiene una actividad biológica de al menos un dominio de un sistema de policétido sintasa (PKS) de ácidos grasos poliinsaturados (AGPI); o (e) una secuencia de ácido nucleico que es completamente complementaria a la secuencia de ácido nucleico de (a), (b), (c) o (d). También se describen secuencias de ácido nucleico que incluyen una secuencia que codifica para los dominios de sitio activo u otros motivos funcionales descritos

45 anteriormente para varios de los dominios PKS de AGPI.

Se describen además moléculas de ácido nucleico aisladas que codifican para proteínas quiméricas útiles en un sistema de PKS de AGPI tal como se describe en el presente documento. La presente invención incluye el uso de cualquier dominio o proteína de o derivada de un sistema de PKS de AGPI en un dominio y/o con proteínas de o derivadas de otro sistema de PKS de AGPI con el fin de crear sistemas de PKS de AGPI novedosos con cualidades únicas.

Por ejemplo, una realización de la presente invención se refiere a el uso de un dominio DH2 de un sistema de PKS de AGPI para modificar un sistema de PKS de AGPI compuesto por proteínas/dominios de un organismo u

55 organismos diferentes, en el que la introducción del dominio DH2 (por ejemplo, en una realización, mediante sustitución del dominio DH2 endógeno o dominio similar en el huésped) modifica la razón de AGPI producidos por el sistema, y particularmente la razón de AGPI omega-3 con respecto a omega-6 producidos por el sistema. Esta realización se describe en detalle a continuación.

Se describen moléculas de ácido nucleico que incluyen una secuencia de ácido nucleico que codifica para una secuencia de aminoácidos de SEQ ID NO: 74, y fragmentos biológicamente activos de la misma, una secuencia de ácido nucleico que codifica para una secuencia de aminoácidos que es idéntica en al menos aproximadamente el 60% a SEQ ID NO: 74 que tiene actividad biológica de al menos uno, dos, tres o más dominios de un sistema de policétido sintasa (PKS) de ácidos grasos poliinsaturados (AGPI), o una secuencia de ácido nucleico que es 65 completamente complementaria a las secuencias de ácido nucleico anteriores. La molécula de ácido nucleico puede incluir una secuencia de ácido nucleico seleccionada de SEQ ID NO: 73 y SEQ ID NO: 75. La molécula de ácido

nucleico puede incluir una secuencia de ácido nucleico que codifica para la secuencia de aminoácidos codificada por un plásmido seleccionado del grupo de pDS49 y pDD24. La molécula de ácido nucleico puede incluir también la secuencia de ácido nucleico de un plásmido seleccionado del grupo de pDS49 y pDD24 que codifica para una proteína OrfC quimérica.

5 También se describen moléculas de ácido nucleico que comprenden una secuencia de ácido nucleico que codifica para una proteína PKS de AGPI o dominio u homólogo de la misma de un sistema de PKS de AGPI, en el que la secuencia de ácido nucleico está optimizada para el uso de codones de un organismo diferente, tal como un huésped en el que va a expresarse la secuencia de ácido nucleico. En el presente documento se describen ejemplos de tales secuencias de ácido nucleico, e incluyen, pero no se limitan a, las secuencias de ácido nucleico representadas por SEQ ID NO: 70, SEQ ID NO: 71 y SEQ ID NO: 72, así como SEQ ID NO: 75. Se describen secuencias de ácido nucleico optimizadas para codones que codifican para cualquier proteína o dominio PKS de AGPI, y particularmente, cualquiera de las secuencias de aminoácidos descritas en el presente documento. Una molécula de ácido nucleico de este tipo incluye una secuencia de ácido nucleico que codifica para la secuencia de

15 aminoácidos codificada por un plásmido seleccionado del grupo de pThOrfC-synPS, pDD26, pDD32 o pDD24. La molécula de ácido nucleico puede incluir la secuencia de ácido nucleico de un plásmido seleccionado de pThOrfCsynPS, pDD26, pDD32 o pDD24 que codifica para una proteína o proteína quimérica útil en un sistema de PKS de AGPI.

Según la presente invención, una secuencia de aminoácidos que tiene una actividad biológica de al menos un dominio de un sistema de PKS de AGPI es una secuencia de aminoácidos que tiene la actividad biológica de al menos un dominio del sistema de PKS de AGPI descrito en detalle en el presente documento, tal como se muestra a modo de ejemplo por los sistemas de PKS de AGPI de Schizochytrium y Thraustochytrium, y tal como se muestra a modo de ejemplo adicionalmente por las actividades biológicas descritas de cualquiera de las proteínas y los

25 dominios en cualquiera de los sistemas de PKS de AGPI descritos en la patente estadounidense n.º 6.140.486, la patente estadounidense n.º 6.566.583, la publicación de solicitud de patente estadounidense n.º 20020194641, la publicación de solicitud de patente estadounidense n.º 20070089199, la publicación de solicitud de patente estadounidense n.º 20040235127, la publicación de solicitud de patente estadounidense n.º 20050100995, la publicación de patente PCT n.º WO 05/097982 o la publicación de solicitud de patente estadounidense n.º 20050014231, citados anteriormente.

Por consiguiente, una molécula de ácido nucleico aislada descrita en el presente documento puede codificar para el producto de traducción de cualquier marco de lectura abierto de PKS de AGPI, dominio PKS de AGPI, fragmento biológicamente activo del mismo o cualquier homólogo de un dominio o marco de lectura abierto de PKS de AGPI

35 que se produce de manera natural que tiene actividad biológica. Un homólogo de un dominio o una proteína dado es una proteína o un polipéptido que tiene una secuencia de aminoácidos que difiere de la secuencia de aminoácidos de referencia que se produce de manera natural (es decir, del dominio o la proteína de referencia) en que al menos uno o unos cuantos, pero sin limitarse a uno o unos cuantos, aminoácidos se han delecionado (por ejemplo, una versión truncada de la proteína, tal como un péptido o fragmento), insertado, invertido, sustituido y/o derivatizado (por ejemplo, mediante glicosilación, fosforilación, acetilación, miristoilación, prenilación, palmitación, amidación y/o adición de glicosilfosfatidilinositol). A continuación se describen en detalle homólogos preferidos de un dominio o una proteína PKS de AGPI. Se observa que los homólogos pueden incluir homólogos producidos de manera sintética, variantes alélicas que se producen de manera natural de un dominio o una proteína dado o secuencias homólogas de organismos distintos del organismo del que se derivó la secuencia de referencia.

45 En general, la actividad biológica o acción biológica de una proteína o un dominio se refiere a cualquier función presentada o realizada por la proteína o el dominio que se atribuye a la forma que se produce de manera natural de la proteína o el dominio tal como se mide o se observa in vivo (es decir, en el entorno fisiológico natural de la proteína) o in vitro (es decir, en condiciones de laboratorio). En otra parte en el presente documento se han descrito en detalle actividades biológicas de sistemas de PKS de AGPI y las proteínas/dominios individuales que constituyen un sistema de PKS de AGPI. Modificaciones de una proteína o un dominio, tal como en un homólogo o mimético (comentado a continuación), pueden dar como resultado proteínas o dominios que tienen la misma actividad biológica que la proteína o el dominio que se produce de manera natural, o proteínas o dominios que tienen actividad biológica disminuida o aumentada en comparación con la de la proteína o el dominio que se produce de

55 manera natural. Las modificaciones que dan como resultado una disminución en la expresión o una disminución en la actividad de la proteína o el dominio pueden denominarse inactivación (completa o parcial), regulación por disminución o disminución de la acción de una proteína o un dominio. De manera similar, las modificaciones que dan como resultado un aumento en la expresión o un aumento en la actividad de la proteína o el dominio pueden denominarse amplificación, sobreproducción, activación, potenciación, regulación por incremento o aumento de la acción de una proteína o un dominio. Un dominio funcional de un sistema de PKS de AGPI es un dominio (es decir, un dominio puede ser una porción de una proteína) que puede realizar una función biológica (es decir, tiene actividad biológica).

Según la presente invención, una molécula de ácido nucleico aislada es una molécula de ácido nucleico que se ha

65 retirado de su medio natural (es decir, que se ha sometido a manipulación humana), siendo su medio natural el genoma o cromosoma en el que se encuentra la molécula de ácido nucleico en la naturaleza. Como tal, “aislado” no

refleja necesariamente el grado en el que se ha purificado la molécula de ácido nucleico, sino que indica que la molécula no incluye un genoma completo o un cromosoma completo en el que se encuentra la molécula de ácido nucleico en la naturaleza. Una molécula de ácido nucleico aislada puede incluir un gen. Una molécula de ácido nucleico aislada que incluye un gen no es un fragmento de un cromosoma que incluye tal gen, sino que más bien 5 incluye la región codificante y regiones reguladoras asociadas con el gen, pero normalmente ningún gen adicional encontrado de manera natural en el mismo cromosoma, aunque algunas moléculas de ácido nucleico pueden incluir genes cercanos/unidos que no son necesariamente una parte del sistema o gen de PKS de AGPI. Una molécula de ácido nucleico aislada también puede incluir una secuencia de ácido nucleico especificada flanqueada por (es decir, en el extremo 5’ y/o el 3’ de la secuencia) ácidos nucleicos adicionales que no flanquean normalmente la secuencia de ácido nucleico especificada en la naturaleza (es decir, secuencias heterólogas). Una molécula de ácido nucleico aislada puede incluir ADN, ARN (por ejemplo, ARNm) o derivados de o bien ADN o bien ARN (por ejemplo, ADNc). Aunque la expresión “molécula de ácido nucleico” se refiere principalmente a la molécula de ácido nucleico física y la expresión “secuencia de ácido nucleico” se refiere principalmente a la secuencia de nucleótidos en la molécula de ácido nucleico, las dos expresiones pueden usarse de manera intercambiable, especialmente con respecto a una

15 molécula de ácido nucleico, o una secuencia de ácido nucleico, que puede codificar para una proteína o un dominio de una proteína.

Preferiblemente, se produce una molécula de ácido nucleico aislada descrita en el presente documento usando tecnología de ADN recombinante (por ejemplo, amplificación por reacción en cadena de la polimerasa (PCR), clonación) o síntesis química. Las moléculas de ácido nucleico aisladas incluyen moléculas de ácido nucleico naturales y homólogos de las mismas, incluyendo, pero sin limitarse a, variantes alélicas naturales y moléculas de ácido nucleico modificadas en las que se han insertado, delecionado, sustituido y/o invertido nucleótidos de tal manera que tales modificaciones proporcionan el efecto deseado sobre la actividad biológica del sistema de PKS de AGPI tal como se describe en el presente documento. Se han comentado en detalle anteriormente homólogos de

25 proteínas (por ejemplo, proteínas codificadas por homólogos de ácido nucleico).

Puede producirse un homólogo de molécula de ácido nucleico usando varios métodos conocidos por los expertos en la técnica (véase, por ejemplo, Sambrook et al., Molecular Cloning: A Laboratory Manual, Cold Spring Harbor Labs Press, 1989). Por ejemplo, pueden modificarse moléculas de ácido nucleico usando una variedad de técnicas incluyendo, pero sin limitarse a, técnicas de mutagénesis clásicas y técnicas de ADN recombinante, tales como mutagénesis dirigida al sitio, tratamiento químico de una molécula de ácido nucleico para inducir mutaciones, escisión con enzimas de restricción de un fragmento de ácido nucleico, ligamiento de fragmentos de ácido nucleico, amplificación por PCR y/o mutagénesis de regiones seleccionadas de una secuencia de ácido nucleico, síntesis de mezclas de oligonucleótidos y ligamientos de grupos de mezclas para “construir” una mezcla de moléculas de ácido

35 nucleico y combinaciones de las mismas. Pueden seleccionarse homólogos de moléculas de ácido nucleico a partir de una mezcla de ácidos nucleicos modificados examinando para seleccionar la función de la proteína codificada por el ácido nucleico y/o mediante hibridación con un gen de tipo natural.

El tamaño mínimo de una molécula de ácido nucleico descrita en el presente documento es un tamaño suficiente para formar una sonda o un cebador oligonucleotídico que puede formar un híbrido estable (por ejemplo, en condiciones de rigurosidad moderada, alta o muy alta) con la secuencia complementaria de una molécula de ácido nucleico útil en la presente invención, o de un tamaño suficiente para codificar para una secuencia de aminoácidos que tiene una actividad biológica de al menos un dominio de un sistema de PKS de AGPI según la presente invención. Como tal, el tamaño de la molécula de ácido nucleico que codifica para una proteína de este tipo puede 45 depender de la composición de ácido nucleico y el porcentaje de homología o identidad entre la molécula de ácido nucleico y la secuencia complementaria así como de las condiciones de hibridación per se (por ejemplo, temperatura, concentración de sal y concentración de formamida). El tamaño mínimo de una molécula de ácido nucleico que se usa como cebador oligonucleotídico o como sonda es normalmente de al menos aproximadamente 12 a aproximadamente 15 nucleótidos de longitud si la moléculas de ácido nucleico son ricas en GC y de al menos aproximadamente 15 a aproximadamente 18 bases de longitud si son ricas en AT. No hay ningún límite, aparte de un límite práctico, en el tamaño máximo de una molécula de ácido nucleico descrita en el presente documento, ya que la molécula de ácido nucleico puede incluir una secuencia suficiente para codificar para un fragmento biológicamente activo de un dominio de un sistema de PKS de AGPI, un dominio completo de un sistema de PKS de AGPI, varios dominios dentro de un marco de lectura abierto (Orf) de un sistema de PKS de AGPI, un Orf completo

55 de un sistema de PKS de AGPI o más de un Orf de un sistema de PKS de AGPI.

Se describe una molécula de ácido nucleico aislada que comprende, consiste esencialmente en o consiste en una secuencia de ácido nucleico que codifica para una secuencia de aminoácidos seleccionada del grupo de: SEQ ID NO: 2, SEQ ID NO: 4, SEQ ID NO: 6, SEQ ID NO: 8, SEQ ID NO: 10, SEQ ID NO: 13, SEQ ID NO: 18, SEQ ID NO: 20, SEQ ID NO: 22, SEQ ID NO: 24, SEQ ID NO: 26, SEQ ID NO: 28, SEQ ID NO: 30, SEQ ID NO: 32, SEQ ID NO: 34, SEQ ID NO: 39, SEQ ID NO: 41, SEQ ID NO: 43, SEQ ID NO: 45, SEQ ID NO: 48, SEQ ID NO: 50, SEQ ID NO: 52, SEQ ID NO: 54, SEQ ID NO: 56, SEQ ID NO: 58, SEQ ID NO: 60, SEQ ID NO: 62, SEQ ID NO: 64, SEQ ID NO: 66, SEQ ID NO: 68 o SEQ ID NO: 74, o fragmentos biológicamente activos de las mismas. En un aspecto, la secuencia de ácido nucleico se selecciona de: SEQ ID NO: 1, SEQ ID NO: 3, SEQ ID NO: 5, SEQ ID NO: 7, SEQ ID 65 NO: 9, SEQ ID NO: 12, SEQ ID NO: 17, SEQ ID NO: 19, SEQ ID NO: 21, SEQ ID NO: 23, SEQ ID NO: 25, SEQ ID NO: 27, SEQ ID NO: 29, SEQ ID NO: 31, SEQ ID NO: 33, SEQ ID NO: 34, SEQ ID NO: 36, SEQ ID NO: 37, SEQ ID

NO: 38, SEQ ID NO: 40, SEQ ID NO: 42, SEQ ID NO: 44, SEQ ID NO: 47, SEQ ID NO: 49, SEQ ID NO: 51, SEQ ID NO: 53, SEQ ID NO: 55, SEQ ID NO: 57, SEQ ID NO: 59, SEQ ID NO: 61, SEQ ID NO: 63, SEQ ID NO: 65, SEQ ID NO: 67, SEQ ID NO: 69, SEQ ID NO: 70, SEQ ID NO: 71, SEQ ID NO: 72, SEQ ID NO: 73 o SEQ ID NO: 75.

5 Cualquiera de las secuencias de aminoácidos de PKS de AGPI descritas anteriormente, así como homólogos de tales secuencias, pueden producirse con desde al menos uno, y hasta aproximadamente 20, aminoácidos heterólogos adicionales que flanquean cada uno del extremo C y/o N-terminal de la secuencia de aminoácidos dada. Puede hacerse referencia a la proteína o al polipéptido resultante como “que consiste esencialmente en” una secuencia de aminoácidos dada. Según la presente invención, los aminoácidos heterólogos son una secuencia de aminoácidos que no se encuentran de manera natural (es decir, no se encuentran en la naturaleza, in vivo) flanqueando la secuencia de aminoácidos dada o que no se codificaría por los nucleótidos que flanquean la secuencia de ácido nucleico que se produce de manera natural que codifica para la secuencia de aminoácidos dada tal como se produce en el gen, si tales nucleótidos en la secuencia que se produce de manera natural se tradujesen usando el uso de codones convencional para el organismo del que se deriva la secuencia de aminoácidos dada. De

15 manera similar, la expresión “que consiste esencialmente en”, cuando se usa con referencia a una secuencia de ácido nucleico en el presente documento, se refiere a una secuencia de ácido nucleico que codifica para una secuencia de aminoácidos dada que puede estar flanqueada por al menos uno, y hasta aproximadamente 60, nucleótidos heterólogos adicionales en cada uno del extremo 5’ y/o el 3’ de la secuencia de ácido nucleico que codifica para la secuencia de aminoácidos dada. Los nucleótidos heterólogos no se encuentran de manera natural (es decir, no se encuentran en la naturaleza, in vivo) flanqueando la secuencia de ácido nucleico que codifica para la secuencia de aminoácidos dada tal como se produce en el gen natural.

También se describe una molécula de ácido nucleico aislada que comprende una secuencia de ácido nucleico que codifica para una secuencia de aminoácidos que tiene una actividad biológica de al menos un dominio de un sistema

25 de PKS de AGPI. En un aspecto, una secuencia de ácido nucleico de este tipo codifica para un homólogo de cualquiera de los dominios o las proteínas PKS de AGPI descritos anteriormente, en la que el homólogo tiene una actividad biológica de al menos un (o dos, tres, cuatro o más) dominio de un sistema de PKS de AGPI tal como se describió anteriormente en el presente documento.

En un aspecto de la invención, un homólogo de un dominio o una proteína PKS de AGPI abarcado por la presente invención comprende una secuencia de aminoácidos que es idéntica en al menos aproximadamente el 60% a al menos 500 aminoácidos consecutivos de una secuencia de aminoácidos elegida de: SEQ ID NO: 2, SEQ ID NO: 4, SEQ ID NO: 6, SEQ ID NO: 39, SEQ ID NO: 52, SEQ ID NO: 62 o SEQ ID NO: 74; en el que dicha secuencia de aminoácidos tiene una actividad biológica de al menos un dominio de un sistema de PKS de AGPI. En un aspecto 35 adicional, la secuencia de aminoácidos del homólogo es idéntica en al menos aproximadamente el 60% a al menos aproximadamente 600 aminoácidos consecutivos, y más preferiblemente a al menos aproximadamente 700 aminoácidos consecutivos, y más preferiblemente a al menos aproximadamente 800 aminoácidos consecutivos, y más preferiblemente a al menos aproximadamente 900 aminoácidos consecutivos, y más preferiblemente a al menos aproximadamente 1000 aminoácidos consecutivos, y más preferiblemente a al menos aproximadamente 1100 aminoácidos consecutivos, y más preferiblemente a al menos aproximadamente 1200 aminoácidos consecutivos, y más preferiblemente a al menos aproximadamente 1300 aminoácidos consecutivos, y más preferiblemente a al menos aproximadamente 1400 aminoácidos consecutivos, y más preferiblemente a al menos aproximadamente 1500 aminoácidos consecutivos de cualquiera de SEQ ID NO: 2, SEQ ID NO: 4, SEQ ID NO: 6, SEQ ID NO: 39, SEQ ID NO: 52, SEQ ID NO: 62 o SEQ ID NO: 74, o a la longitud completa de SEQ ID NO: 6; SEQ 45 ID NO: 62 o SEQ ID NO: 74. En un aspecto adicional, la secuencia de aminoácidos del homólogo es idéntica en al menos aproximadamente el 60% a al menos aproximadamente 1600 aminoácidos consecutivos; y más preferiblemente a al menos aproximadamente 1700 aminoácidos consecutivos, y más preferiblemente a al menos aproximadamente 1800 aminoácidos consecutivos, y más preferiblemente a al menos aproximadamente 1900 aminoácidos consecutivos, y más preferiblemente a al menos aproximadamente 2000 aminoácidos consecutivos de cualquiera de SEQ ID NO: 2, SEQ ID NO: 4, SEQ ID NO: 39 o SEQ ID NO: 52 o a la longitud completa de SEQ ID NO: 4 o SEQ ID NO: 52. En un aspecto adicional, la secuencia de aminoácidos del homólogo es idéntica en al menos aproximadamente el 60% a al menos aproximadamente 2100 aminoácidos consecutivos, y más preferiblemente a al menos aproximadamente 2200 aminoácidos consecutivos, y más preferiblemente a al menos aproximadamente 2300 aminoácidos consecutivos, y más preferiblemente a al menos aproximadamente 2400

55 aminoácidos consecutivos, y más preferiblemente a al menos aproximadamente 2500 aminoácidos consecutivos, y más preferiblemente a al menos aproximadamente 2600 aminoácidos consecutivos, y más preferiblemente a al menos aproximadamente 2700 aminoácidos consecutivos, y más preferiblemente a al menos aproximadamente 2800 aminoácidos consecutivos, e incluso más preferiblemente, a la longitud completa de SEQ ID NO: 2 o SEQ ID NO: 39.

En otro aspecto, un homólogo de un dominio o una proteína PKS de AGPI abarcado por la presente invención comprende una secuencia de aminoácidos que es idéntica en al menos aproximadamente el 65%, y más preferiblemente idéntica en al menos aproximadamente el 70%, y más preferiblemente idéntica en al menos aproximadamente el 75%, y más preferiblemente idéntica en al menos aproximadamente el 80%, y más 65 preferiblemente idéntica en al menos aproximadamente el 85%, y más preferiblemente idéntica en al menos aproximadamente el 90%, y más preferiblemente idéntica en al menos aproximadamente el 95%, y más

preferiblemente idéntica en al menos aproximadamente el 96%, y más preferiblemente idéntica en al menos aproximadamente el 97%, y más preferiblemente idéntica en al menos aproximadamente el 98%, y más preferiblemente idéntica en al menos aproximadamente el 99% a cualquiera de las secuencias de aminoácidos descritas anteriormente, a lo largo de cualquiera de las longitudes de aminoácido consecutivos descritas en los

5 párrafos anteriores, en el que la secuencia de aminoácidos tiene una actividad biológica de al menos un dominio de un sistema de PKS de AGPI.

En un aspecto de la invención, un homólogo de un dominio o una proteína PKS de AGPI abarcado por la presente invención comprende una secuencia de aminoácidos que es idéntica en al menos aproximadamente el 60% a una 10 secuencia de aminoácidos elegida de: SEQ ID NO: 8, SEQ ID NO: 10, SEQ ID NO: 13, SEQ ID NO: 18, SEQ ID NO: 20, SEQ ID NO: 22, SEQ ID NO: 24, SEQ ID NO: 26, SEQ ID NO: 28, SEQ ID NO: 30, SEQ ID NO: 32, SEQ ID NO: 34, SEQ ID NO: 41, SEQ ID NO: 43, SEQ ID NO: 45, SEQ ID NO: 48, SEQ ID NO: 50, SEQ ID NO: 54, SEQ ID NO: 56, SEQ ID NO: 58, SEQ ID NO: 60, SEQ ID NO: 64, SEQ ID NO: 66, SEQ ID NO: 68, o secuencias de aminoácidos que comprenden combinaciones de cualquiera de tales secuencias de aminoácidos, en el que dicha secuencia de 15 aminoácidos tiene una actividad biológica de al menos un dominio de un sistema de PKS de AGPI o proteína auxiliar del mismo. En un aspecto adicional, la secuencia de aminoácidos del homólogo es idéntica en al menos aproximadamente el 65%, y más preferiblemente idéntica en al menos aproximadamente el 70%, y más preferiblemente idéntica en al menos aproximadamente el 75%, y más preferiblemente idéntica en al menos aproximadamente el 80%, y más preferiblemente idéntica en al menos aproximadamente el 85%, y más 20 preferiblemente idéntica en al menos aproximadamente el 90%, y más preferiblemente idéntica en al menos aproximadamente el 95%, y más preferiblemente idéntica en al menos aproximadamente el 96%, y más preferiblemente idéntica en al menos aproximadamente el 97%, y más preferiblemente idéntica en al menos aproximadamente el 98%, y más preferiblemente idéntica en al menos aproximadamente el 99% a cualquiera de las secuencias de aminoácidos descritas anteriormente, en el que la secuencia de aminoácidos tiene una actividad

25 biológica de al menos un dominio de un sistema de PKS de AGPI o proteína auxiliar del mismo.

Según la presente invención, el término “contiguo” o “consecutivo”, con respecto a secuencias de aminoácidos o de ácido nucleico descritas en el presente documento, significa que están conectadas en una secuencia ininterrumpida. Por ejemplo, que una primera secuencia comprenda 30 aminoácidos contiguos (o consecutivos) de una segunda

30 secuencia, significa que la primera secuencia incluye una secuencia ininterrumpida de 30 residuos de aminoácido que es idéntica al 100% a una secuencia ininterrumpida de 30 residuos de aminoácido en la segunda secuencia. De manera similar, que una primera secuencia tenga una “identidad del 100%” con una segunda secuencia significa que la primera secuencia coincide exactamente con la segunda secuencia sin huecos entre nucleótidos o aminoácidos.

35 Tal como se usa en el presente documento, a menos que se especifique lo contrario, la referencia a un porcentaje (%) de identidad se refiere a una evaluación de la homología que se realiza usando: (1) una búsqueda de homología BLAST 2.0 Basic BLAST usando blastp para búsquedas de aminoácidos, blastn para búsquedas de ácidos nucleicos y blastX para búsquedas de ácidos nucleicos y búsquedas de aminoácidos traducidos en los 6 marcos de lectura abiertos, todos con parámetros por defecto convencionales, en la que la secuencia de consulta se filtra para detectar

40 regiones de baja complejidad por defecto (descrito en Altschul, S.F., Madden, T.L., Schääffer, A.A., Zhang, J., Zhang, Z., Miller, W. & Lipman, D.J. (1997) “Gapped BLAST and PSI-BLAST: a new generation of protein database search programs”, Nucleic Acids Res. 25:3389-3402); (2) una alineación BLAST 2 (usando los parámetros descritos a continuación); (3) y/o PSI-BLAST con los parámetros por defecto convencionales (BLAST con iteraciones específicas de posición). Se observa que debido a algunas diferencias en los parámetros convencionales entre

45 BLAST 2.0 Basic BLAST y BLAST 2, podría reconocerse que dos secuencias específicas tienen homología significativa usando el programa BLAST 2, mientras que una búsqueda realizada en BLAST 2.0 Basic BLAST usando una de las secuencias como secuencia de consulta puede no identificar la segunda secuencia en las coincidencias superiores. Además, PSI-BLAST proporciona una versión automatizada, fácil de usar, de una búsqueda de “perfil”, que es un modo sensible de buscar homólogos de secuencia. El programa realiza en primer

50 lugar una búsqueda en la base de datos BLAST con huecos. El programa PSI-BLAST usa la información de cualquier alineación significativa devuelta para construir una matriz de puntuación específica de posición, que reemplaza a la secuencia de consulta para la siguiente ronda de búsqueda en la base de datos. Por tanto, debe entenderse que el porcentaje de identidad puede determinarse usando uno cualquiera de estos programas.

55 Pueden alinearse dos secuencias específicas entre sí usando BLAST 2 Sequence tal como se describe en Tatusova y Madden, (1999), “Blast 2 sequence - a new tool for comparing protein and nucleotide sequence”, FEMS Microbiol Lett. 174:247-250. La alineación de secuencias BLAST 2 se realiza en blastp o blastn usando el algoritmo BLAST

2.0 para realizar una búsqueda en BLAST con huecos (BLAST 2.0) entre las dos secuencias permitiendo la introducción de huecos (deleciones e inserciones) en la alineación resultante. Con fines de mayor claridad en el

60 presente documento, se realiza una alineación de secuencias BLAST 2 usando los parámetros por defecto convencionales tal como sigue.

Para blastn, usando la matriz 0 BLOSUM62:

65 Recompensa por coincidencia = 1 Penalización por coincidencia errónea = -2

Penalizaciones por apertura de hueco (5) y extensión de extensión (2)

5 hueco x_dropoff (50) expectativa (10) tamaño de palabra (11) filtro (activado)

Para blastp, usando la matriz 0 BLOSUM62:

Penalizaciones por apertura de hueco (11) y extensión de hueco (1)

10 hueco x_dropoff (50) expectativa (10) tamaño de palabra (3) filtro (activado).

En otra realización de la invención, una secuencia de aminoácidos que tiene la actividad biológica de al menos un dominio de un sistema de PKS de AGPI de la presente invención incluye una secuencia de aminoácidos que es lo 15 suficientemente similar a un polipéptido o una proteína PKS de AGPI que se produce de manera natural como para que una secuencia de ácido nucleico que codifica para la secuencia de aminoácidos pueda hibridarse en condiciones de rigurosidad moderada, alta o muy alta (descritas a continuación) a (es decir, con) una molécula de ácido nucleico que codifica para el polipéptido o la proteína PKS de AGPI que se produce de manera natural (es decir, al complemento de la hebra de ácido nucleico que codifica para el polipéptido o la proteína PKS de AGPI que

20 se produce de manera natural). Preferiblemente, una secuencia de aminoácidos que tiene la actividad biológica de al menos un dominio de un sistema de PKS de AGPI de la presente invención se codifica por una secuencia de ácido nucleico que se hibrida en condiciones de rigurosidad moderada, alta o muy alta al complemento de una secuencia de ácido nucleico que codifica para una proteína que comprende una secuencia de aminoácidos representada por cualquiera de las secuencias de aminoácidos descritas en el presente documento.

25 En otra realización de la invención, una secuencia de nucleótidos de la presente invención es una secuencia de nucleótidos aislada de (que puede obtenerse de), idéntica a, o un homólogo de, la secuencia de nucleótidos de un Schizochytrium, en la que la secuencia de nucleótidos de un Schizochytrium (incluyendo cualquier hebra de una molécula de ADN de Schizochytrium) se hibrida en condiciones de rigurosidad moderada, alta o muy alta a una

30 secuencia de nucleótidos que codifica para una secuencia de aminoácidos representada por cualquiera de SEQ ID NO: 2, SEQ ID NO: 4, SEQ ID NO: 6, SEQ ID NO: 8, SEQ ID NO: 10, SEQ ID NO: 13, SEQ ID NO: 18, SEQ ID NO: 20, SEQ ID NO: 22, SEQ ID NO: 24, SEQ ID NO: 26, SEQ ID NO: 28, SEQ ID NO: 30 o SEQ ID NO: 32. En una realización, el Schizochytrium es Schizochytrium ATCC 20888. En otra realización, el Schizochytrium es una cepa hija de Schizochytrium 20888, incluyendo cepas mutadas de la misma (por ejemplo, N230D). En una realización, la

35 secuencia de ácido nucleico se hibrida en condiciones de rigurosidad moderada, alta o muy alta a una secuencia de nucleótidos seleccionada de: SEQ ID NO: 1, SEQ ID NO: 3, SEQ ID NO: 5, SEQ ID NO: 7, SEQ ID NO: 9, SEQ ID NO: 12, SEQ ID NO: 17, SEQ ID NO: 19, SEQ ID NO: 21, SEQ ID NO: 23, SEQ ID NO: 25, SEQ ID NO: 27, SEQ ID NO: 29 o SEQ ID NO: 31.

40 En otra realización de la invención, una secuencia de nucleótidos de la presente invención es una secuencia de nucleótidos aislada de (que puede obtenerse de), idéntica a, o un homólogo de, la secuencia de nucleótidos de un Thraustochytrium, en la que la secuencia de nucleótidos de un Thraustochytrium (incluyendo cualquier hebra de una molécula de ADN de Thraustochytrium) se hibrida en condiciones de rigurosidad moderada, alta o muy alta a una secuencia de nucleótidos que codifica para una secuencia de aminoácidos representada por cualquiera de SEQ ID

45 NO: 39, SEQ ID NO: 41, SEQ ID NO: 43, SEQ ID NO: 45, SEQ ID NO: 48, SEQ ID NO: 50, SEQ ID NO: 52, SEQ ID NO: 54, SEQ ID NO: 56, SEQ ID NO: 58, SEQ ID NO: 60, SEQ ID NO: 62, SEQ ID NO: 64, SEQ ID NO: 66, SEQ ID NO: 68. En una realización, el Thraustochytrium es Thraustochytrium 23B (ATCC 20892). En una realización, la secuencia de ácido nucleico se hibrida en condiciones de rigurosidad moderada, alta o muy alta a una secuencia de nucleótidos seleccionada de: SEQ ID NO: 38, SEQ ID NO: 40, SEQ ID NO: 42, SEQ ID NO: 44, SEQ ID NO: 47,

50 SEQ ID NO: 49, SEQ ID NO: 51, SEQ ID NO: 53, SEQ ID NO: 55, SEQ ID NO: 57, SEQ ID NO: 59, SEQ ID NO: 61, SEQ ID NO: 63, SEQ ID NO: 65 o SEQ ID NO: 67.

Aún en otra realización, una secuencia de nucleótidos de la presente invención es una secuencia de nucleótidos aislada de (que puede obtenerse de), idéntica a, o un homólogo de, la secuencia de nucleótidos de un organismo

55 eucariota (por ejemplo, un traustoquitridio o un laberintúlido) o una bacteria marina, en la que la secuencia de nucleótidos se hibrida en condiciones de rigurosidad moderada, alta o muy alta a una secuencia de nucleótidos que codifica para cualquiera de las secuencias de aminoácidos representadas en el presente documento.

En otra realización, una secuencia de nucleótidos de la presente invención es una secuencia de nucleótidos aislada

60 de (que puede obtenerse de), idéntica a, o un homólogo de, cualquier secuencia de nucleótidos que codifica para una proteína auxiliar descrita en el presente documento (incluyendo cualquier hebra de una molécula de ADN), en la que, en una realización, la secuencia de nucleótidos se hibrida en condiciones de rigurosidad moderada, alta o muy alta a una secuencia de nucleótidos que codifica para una secuencia de aminoácidos representada por SEQ ID NO:

34. En una realización, la secuencia de ácido nucleico se hibrida en condiciones de rigurosidad moderada, alta o 65 muy alta a una secuencia de nucleótidos representada por SEQ ID NO: 33.

En otra realización, una secuencia de nucleótidos de la presente invención es una secuencia de nucleótidos aislada de (que puede obtenerse de), idéntica a, o un homólogo de, cualquier secuencia de nucleótidos quimérica u optimizada para codones descrita en el presente documento (incluyendo cualquier hebra de una molécula de ADN), en la que, en una realización, la secuencia de nucleótidos se hibrida en condiciones de rigurosidad moderada, alta o 5 muy alta a una secuencia de nucleótidos que codifica para una secuencia de aminoácidos representada por SEQ ID NO: 74. En una realización, la secuencia de ácido nucleico se hibrida en condiciones de rigurosidad moderada, alta

o muy alta a una secuencia de nucleótidos seleccionada de SEQ ID NO: 35, SEQ ID NO: 36, SEQ ID NO: 37, SEQ ID NO: 69, SEQ ID NO: 70, SEQ ID NO: 71, SEQ ID NO: 72, SEQ ID NO: 73 o SEQ ID NO: 75.

Los expertos en la técnica conocen métodos para deducir una secuencia complementaria. Debe indicarse que puesto que las tecnologías de secuenciación de aminoácidos y secuenciación de ácido nucleico no están completamente libres de errores, las secuencias presentadas en el presente documento, en el mejor de los casos, representan secuencias aparentes de dominios y proteínas PKS de AGPI de la presente invención, o de las secuencias de nucleótidos que codifican para tales secuencias de aminoácidos.

15 Tal como se usa en el presente documento, las condiciones de hibridación se refieren a condiciones de hibridación convencionales en las que se usan moléculas de ácido nucleico para identificar moléculas de ácido nucleico similares. Tales condiciones convencionales se dan a conocer, por ejemplo, en Sambrook et al., Molecular Cloning A Laboratory Manual, Cold Spring Harbor Labs Press, 1989 (véanse específicamente las páginas 9.31-9.62). Además, se dan a conocer fórmulas para calcular las condiciones de hibridación y lavado apropiadas para lograr una hibridación que permite grados variables de apareamiento erróneo de nucleótidos, por ejemplo, en Meinkoth et al., 1984, Anal. Biochem. 138, 267-284.

Más particularmente, las condiciones de hibridación y lavado de rigurosidad moderada, tal como se denominan en el

25 presente documento, se refieren a condiciones que permiten el aislamiento de moléculas de ácido nucleico que tienen al menos aproximadamente el 70% de identidad de secuencia de ácido nucleico con la molécula de ácido nucleico que está usándose para estudiar con sonda en la reacción de hibridación (es decir, condiciones que permiten aproximadamente el 30% o menos de apareamiento erróneo de nucleótidos). Las condiciones de hibridación y lavado de alta rigurosidad, tal como se denominan en el presente documento, se refieren a condiciones que permiten el aislamiento de moléculas de ácido nucleico que tienen al menos aproximadamente el 80% de identidad de secuencia de ácido nucleico con la molécula de ácido nucleico que está usándose para estudiar con sonda en la reacción de hibridación (es decir, condiciones que permiten aproximadamente el 20% o menos de apareamiento erróneo de nucleótidos). Las condiciones de hibridación y lavado de rigurosidad muy alta, tal como se denominan en el presente documento, se refieren a condiciones que permiten el aislamiento de moléculas de ácido

35 nucleico que tienen al menos aproximadamente el 90% de identidad de secuencia de ácido nucleico con la molécula de ácido nucleico que está usándose para estudiar con sonda en la reacción de hibridación (es decir, condiciones que permiten aproximadamente el 10% o menos de apareamiento erróneo de nucleótidos). Tal como se comentó anteriormente, un experto en la técnica puede usar las fórmulas en Meinkoth et al., ibidem. para calcular las condiciones de hibridación y lavado apropiadas para lograr estos niveles particulares de apareamiento erróneo de nucleótidos. Tales condiciones variarán, dependiendo de si están formándose híbridos de ADN:ARN o ADN:ADN. Las temperaturas de fusión calculadas para híbridos de ADN:ADN son de 10ºC, menores que para híbridos de ADN:ARN. En realizaciones particulares, las condiciones de hibridación rigurosas para híbridos de ADN:ADN incluyen hibridación a una fuerza iónica de 6X SSC (Na+ 0,9 M) a una temperatura de entre aproximadamente 20ºC y aproximadamente 35ºC (rigurosidad inferior), más preferiblemente, entre aproximadamente 28ºC y

45 aproximadamente 40ºC (más rigurosa) e incluso más preferiblemente, entre aproximadamente 35ºC y aproximadamente 45ºC (incluso más rigurosa), con condiciones de lavado apropiadas. En realizaciones particulares, las condiciones de hibridación rigurosas para híbridos de ADN:ARN incluyen hibridación a una fuerza iónica de 6X SSC (Na+ 0,9 M) a una temperatura de entre aproximadamente 30ºC y aproximadamente 45ºC, más preferiblemente, entre aproximadamente 38ºC y aproximadamente 50ºC e incluso más preferiblemente, entre aproximadamente 45ºC y aproximadamente 55ºC, con condiciones de lavado rigurosas de manera similar. Estos valores se basan en cálculos de una temperatura de fusión para moléculas de más de aproximadamente 100 nucleótidos, formamida al 0% y un contenido en G + C de aproximadamente el 40%. Alternativamente, la Tm puede calcularse empíricamente tal como se expone en Sambrook et al., citado anteriormente, páginas 9.31 a 9.62. En general, las condiciones de lavado deben ser tan rigurosas como sea posible, y deben ser apropiadas para las

55 condiciones de hibridación elegidas. Por ejemplo, las condiciones de hibridación pueden incluir una combinación de condiciones de sal y temperatura que están aproximadamente 20-25ºC por debajo de la Tm calculada de un híbrido particular, y las condiciones de lavado incluyen normalmente una combinación de condiciones de sal y temperatura que están aproximadamente 12-20ºC por debajo de la Tm calculada del híbrido particular. Un ejemplo de condiciones de hibridación adecuadas para su uso con híbridos de ADN:ADN incluye una hibridación de 2-24 horas en 6X SSC (formamida al 50%) a aproximadamente 42ºC, seguido por etapas de lavado que incluyen uno o más lavados a temperatura ambiente en aproximadamente 2X SSC, seguido por lavados adicionales a temperaturas superiores y fuerza iónica inferior (por ejemplo, al menos un lavado a aproximadamente 37ºC en aproximadamente 0,1X-0,5X SSC, seguido por al menos un lavado a aproximadamente 68ºC en aproximadamente 0,1X-0,5X SSC).

65 Se describe además una molécula de ácido nucleico que comprende, que consiste esencialmente en o que consiste en, una secuencia de ácido nucleico que es idéntica a, o que es un homólogo de (tal como se definió anteriormente), la secuencia de ácido nucleico de un plásmido seleccionado de: pJK1126 (n.º de registro de la ATCC PTA-7648), pJK1129 (n.º de registro de la ATCC PTA-7649), pJK1131 (n.º de registro de la ATCC PTA-7650), pJK306 (n.º de registro de la ATCC PTA-7641), pJK320 (n.º de registro de la ATCC PTA-7644), pJK324 (n.º de registro de la ATCC PTA-7643), pBR002 (n.º de registro de la ATCC PTA-7642), Th23BOrfA_pBR812.1 (n.º de registro de la ATCC PTA

5 8232) Th23BOrfA_pBR811 (n.º de registro de la ATCC PTA-8231), Th23BOrfB_pBR800 (n.º de registro de la ATCC PTA-8227) o Th23BOrfC_pBR709A (n.º de registro de la ATCC PTA-8228).

También se describe una molécula de ácido nucleico que comprende, que consiste esencialmente en o que consiste en, una secuencia de ácido nucleico que es idéntica a, o que es a homólogo de (tal como se definió anteriormente),

10 la secuencia de ácido nucleico de un plásmido seleccionado de: pThOrfC-synPS (n.º de registro de la ATCC PTA8229), pDS49 (n.º de registro de la ATCC PTA-8230), pDD24 (n.º de registro de la ATCC PTA-8226), pDD26 (n.º de registro de la ATCC PTA-8411), pDD32 (n.º de registro de la ATCC PTA-8412) o OrtB*_pJK780 (n.º de registro de la ATCC PTA-8225).

15 También se describe una molécula de ácido nucleico que comprende, que consiste esencialmente en o que consiste en, una secuencia de ácido nucleico que codifica para una secuencia de aminoácidos que es idéntica a, o que es un homólogo de (tal como se definió anteriormente), la secuencia de aminoácidos codificada por un plásmido seleccionado de: pJK1126 (n.º de registro de la ATCC PTA-7648), pJK1129 (n.º de registro de la ATCC PTA-7649), pJK1131 (n.º de registro de la ATCC PTA-7650), pJK306 (n.º de registro de la ATCC PTA-7641), pJK320 (n.º de

20 registro de la ATCC PTA-7644), pJK324 (n.º de registro de la ATCC PTA-7643), pBR002 (n.º de registro de la ATCC PTA-7642), Th23BOrfA_pBR812.1 (n.º de registro de la ATCC PTA-8232) Th23BOrfA_pBR811 (n.º de registro de la ATCC PTA-8231), Th23BOrfB_pBR800 (n.º de registro de la ATCC PTA-8227) o Th23BOrfC_pBR709A (n.º de registro de la ATCC PTA-8228).

25 También se describe una molécula de ácido nucleico que comprende, que consiste esencialmente en o que consiste en, una secuencia de ácido nucleico que codifica para una secuencia de aminoácidos que es idéntica a, o que es un homólogo de (tal como se definió anteriormente), la secuencia de aminoácidos codificada por un plásmido seleccionado de: pThOrfC-synPS (n.º de registro de la ATCC PTA-8229), pDS49 (n.º de registro de la ATCC PTA8230), pDD24 (n.º de registro de la ATCC PTA-8226), pDD26 (n.º de registro de la ATCC PTA-8411), pDD32 (n.º de

30 registro de la ATCC PTA-8412) o OrfB*_pJK780 (n.º de registro de la ATCC PTA-8225).

Se describe además una molécula de ácido nucleico recombinante que comprende un vector recombinante y una molécula de ácido nucleico que comprende una secuencia de ácido nucleico que codifica para una secuencia de aminoácidos que tiene una actividad biológica de al menos un dominio o una proteína de un sistema de PKS de 35 AGPI tal como se describe en el presente documento. Tales secuencias de ácido nucleico y dominios o proteínas se describieron en detalle anteriormente. Según la presente invención, un vector recombinante es una molécula de ácido nucleico diseñada por ingeniería genética (es decir, producida artificialmente) que se usa como herramienta para manipular una secuencia de ácido nucleico de elección y para introducir una secuencia de ácido nucleico de este tipo en una célula huésped. El vector recombinante es por tanto adecuado para su uso en clonación, 40 secuenciación y/o manipulación de otra forma de la secuencia de ácido nucleico de elección, tal como expresando y/o suministrando la secuencia de ácido nucleico de elección a una célula huésped para formar una célula recombinante. Un vector de este tipo contiene normalmente secuencias de ácido nucleico heterólogas, es decir secuencias de ácido nucleico que no se encuentran de manera natural adyacentes a una secuencia de ácido nucleico que va a clonarse o suministrarse, aunque el vector también puede contener secuencias de ácido nucleico 45 reguladoras (por ejemplo, promotores, regiones no traducidas) que se encuentran de manera natural adyacentes a moléculas de ácido nucleico de la presente invención o que son útiles para la expresión de las moléculas de ácido nucleico de la presente invención (comentado en detalle a continuación). El vector puede ser o bien ARN o bien ADN, o bien procariota o bien eucariota, y normalmente es un plásmido. El vector puede mantenerse como un elemento extracromosómico (por ejemplo, un plásmido) o puede integrarse en el cromosoma de un organismo 50 recombinante (por ejemplo, un microbio o una planta). Todo el vector puede permanecer en su lugar dentro de una célula huésped, o en determinadas condiciones, el ADN de plásmido puede delecionarse, dejando atrás la molécula de ácido nucleico de la presente invención. La molécula de ácido nucleico integrada puede estar bajo el control de un promotor cromosómico, bajo el control de un promotor de plásmido o nativo o bajo una combinación de varios controles de promotor. Pueden integrarse copias individuales o múltiples de la molécula de ácido nucleico en el

55 cromosoma. Un vector recombinante de la presente invención puede contener al menos un marcador seleccionable.

Un vector recombinante usado en una molécula de ácido nucleico recombinante puede ser un vector de expresión. Tal como se usa en el presente documento, la expresión “vector de expresión” se usa para referirse a un vector que es adecuado para la producción de un producto codificado (por ejemplo, una proteína de interés). En esta 60 realización, una secuencia de ácido nucleico que codifica para el producto que va a producirse (por ejemplo, un dominio PKS de AGPI) se inserta en el vector recombinante para producir una molécula de ácido nucleico recombinante. La secuencia de ácido nucleico que codifica para la proteína que va a producirse se inserta en el vector de una manera que une operativamente la secuencia de ácido nucleico a secuencias reguladoras en el vector que permiten la transcripción y traducción de la secuencia de ácido nucleico dentro de la célula huésped

65 recombinante.

El vector recombinante usado en una molécula de ácido nucleico recombinante también puede ser un vector de direccionamiento. Tal como se usa en el presente documento, la expresión “vector de direccionamiento” se usa para referirse a un vector que se usa para suministrar una molécula de ácido nucleico particular a una célula huésped recombinante, en el que la molécula de ácido nucleico se usa delecionar o inactivar un gen endógeno dentro del

5 microorganismo o la células huésped (es decir, se usa para la alteración genética dirigida o tecnología de inactivación). Un vector de este tipo también puede conocerse en la técnica como vector de “inactivación”. En un aspecto de esta realización, una porción del vector, pero más normalmente, la molécula de ácido nucleico insertada en el vector (es decir, el inserto), tiene una secuencia de ácido nucleico que es homóloga a una secuencia de ácido nucleico de un gen diana en la célula huésped (es decir, un gen que se selecciona como diana para delecionarse o inactivarse). La secuencia de ácido nucleico del inserto del vector está diseñada para unirse al gen diana de manera que el gen diana y el inserto experimentan recombinación homóloga, mediante lo cual el gen diana endógeno se deleciona, se inactiva o se atenúa (es decir, mutando o delecionando al menos una porción del gen diana endógeno).

15 Normalmente, una molécula de ácido nucleico recombinante incluye al menos una molécula de ácido nucleico descrita en el presente documento operativamente unida a una o más secuencias de control de la transcripción. Tal como se usa en el presente documento, la expresión “molécula recombinante” o “molécula de ácido nucleico recombinante” se refiere principalmente a una molécula de ácido nucleico o secuencia de ácido nucleico operativamente unida a una secuencia de control de la transcripción, pero puede usarse de manera intercambiable con la expresión “molécula de ácido nucleico”, cuando tal molécula de ácido nucleico es una molécula recombinante tal como se comenta en el presente documento. Según la presente invención, la expresión “operativamente unida” se refiere a la unión de una molécula de ácido nucleico a una secuencia de control de la transcripción de una manera tal que la molécula puede expresarse cuando se transfecta (es decir, se transforma, se transduce, se transfecta, se conjuga o se conduce) al interior de una célula huésped. Las secuencias de control de la transcripción

25 son secuencias que controlan la iniciación, la elongación o la terminación de la transcripción. Secuencias de control de la transcripción particularmente importantes son las que controlan la iniciación de la transcripción, tales como secuencias promotoras, potenciadoras, operadoras y represoras. Las secuencias de control de la transcripción adecuadas incluyen cualquier secuencia de control de la transcripción que pueda funcionar en una célula o un organismo huésped en el que va a introducirse la molécula de ácido nucleico recombinante.

Las moléculas de ácido nucleico recombinantes descritas en el presente documento también pueden contener secuencias reguladoras adicionales, tales como secuencias reguladoras de la traducción, orígenes de replicación y otras secuencias reguladoras que son compatibles con la célula recombinante. Una molécula recombinante descrita en el presente documento, incluyendo las que se integran en el cromosoma de la célula huésped, también puede

35 contener señales secretoras (es decir, secuencias de ácido nucleico de segmento señal) para permitir que una proteína expresada se secrete de la célula que produce la proteína. Los segmentos señal adecuados incluyen un segmento señal que está asociado de manera natural con la proteína que va a expresarse o cualquier segmento señal heterólogo que pueda dirigir la secreción de la proteína según la presente invención. Una molécula recombinante descrita en el presente documento también puede comprender una secuencia líder para permitir que una proteína expresada se suministre a, y se inserte en, la membrana de una célula huésped. Las secuencias líder adecuadas incluyen una secuencia líder que está asociada de manera natural con la proteína, o cualquier secuencia líder heteróloga que pueda dirigir el suministro y la inserción de la proteína en la membrana de una célula.

Los presentes inventores han encontrado que los Orf A y B de PKS de AGPI de Schizochytrium y Thraustochytrium

45 están estrechamente unidos en el genoma y se ha secuenciado la región entre los Orf. En Schizochytrium, los Orf están orientados en direcciones opuestas y 4244 pares de bases separan los codones de iniciación (ATG) (es decir, están dispuestos tal como sigue: 3’OrfA5’-4244 pb-5’OrfB3’). El examen de la región intergénica de 4244 pb no reveló ningún Orf obvio (no se encontraron coincidencias significativas en una búsqueda de BlastX). Tanto el Orf A como el B se expresan altamente en Schizochytrium, al menos durante el tiempo de producción de aceite, lo que implica que están incrustados elementos promotores activos en esta región intergénica. Se cree que estos elementos genéticos tienen utilidad como secuencia promotora bidireccional para aplicaciones transgénicas. Por ejemplo, podría clonarse esta región, colocar cualquier gen de interés en cada extremo e introducir el constructo en Schizochytrium (o algún otro huésped en el que pueda mostrarse que los promotores funcionan). Se predice que los elementos reguladores, en las condiciones apropiadas, proporcionarían expresión de alto nivel, coordinada, de los

55 dos genes introducidos. La secuencia de nucleótidos completa para la región reguladora que contiene elementos reguladores de PKS de AGPI de Schizochytrium (por ejemplo, un promotor) se representa en el presente documento como SEQ ID NO: 76.

De una manera similar, OrfC se expresa altamente en Schizochytrium durante el tiempo de producción de aceite y se espera que residan elementos reguladores en la región en el sentido de 5’ de su codón de iniciación. Se ha clonado y secuenciado una región de ADN genómico en el sentido de 5’ del OrfC y se representa en el presente documento como (SEQ ID NO: 77). Esta secuencia contiene los 3886 nt inmediatamente en el sentido de 5’ del codón de iniciación de OrfC. El examen de esta región no reveló ningún Orf obvio (es decir, no se encontraron coincidencias significativas en una búsqueda de BlastX). Se cree que los elementos reguladores contenidos en esta 65 región, en las condiciones apropiadas, proporcionarán expresión de alto nivel de un gen colocado detrás de los mismos. Adicionalmente, en las condiciones apropiadas, puede coordinarse el nivel de expresión con genes bajo el

control de la región intergénica A-B (SEQ ID NO: 76).

Por tanto, una molécula de ácido nucleico recombinante, tal como se da a conocer en el presente documento, puede incluir una región reguladora de PKS de AGPI contenida dentro de SEQ ID NO: 76 y/o SEQ ID NO: 77. Una región 5 reguladora de este tipo puede incluir cualquier porción (fragmento) de SEQ ID NO: 76 y/o SEQ ID NO: 77 que tiene al menos actividad transcripcional de PKS de AGPI basal (al menos actividad promotora basal).

Pueden usarse una o más moléculas recombinantes descritas en el presente documento para producir un producto codificado (por ejemplo, un dominio, una proteína o un sistema de PKS de AGPI) de la presente invención. Puede 10 producirse un producto codificado expresando una molécula de ácido nucleico tal como se describe en el presente documento en condiciones eficaces para producir la proteína. Un método preferido para producir una proteína codificada es transfectando una célula huésped con una o más moléculas recombinantes para formar una célula recombinante. Las células huésped adecuadas para transfectar incluyen, pero no se limitan a, cualquier célula bacteriana, fúngica (por ejemplo, levadura), de insecto, vegetal o animal que pueda transfectarse. Las células

15 huésped pueden ser o bien células no transfectadas o bien células que ya están transfectadas con al menos otra molécula de ácido nucleico recombinante.

Según la presente invención, el término “transfección” se usa para referirse a cualquier método mediante el cual puede insertarse una molécula de ácido nucleico exógeno (es decir, una molécula de ácido nucleico recombinante) 20 en una célula. El término “transformación” puede usarse de manera intercambiable con el término “transfección” cuando tal término se usa para referirse a la introducción de moléculas de ácido nucleico en células microbianas, tales como algas, bacterias y levadura. En sistemas microbianos, el término “transformación” se usa para describir un cambio heredado debido a la adquisición ácidos nucleicos exógenos por el microorganismo y es esencialmente sinónimo al término “transfección.” Sin embargo, en células animales, transformación ha adquirido un segundo 25 significado que puede referirse a cambios en las propiedades de crecimiento de células en cultivo tras volverse cancerosas, por ejemplo. Por tanto, para evitar la confusión, el término “transfección” se usa preferiblemente con respecto a la introducción de ácidos nucleicos exógenos en células animales, y el término “transfección” se usará en el presente documento para abarcar generalmente la transfección de células animales, células de plantas y la transformación de células microbianas, en la medida en que los términos se refieran a la introducción de ácidos

30 nucleicos exógenos en una célula. Por tanto, las técnicas de transfección incluyen, pero no se limitan a, transformación, bombardeo con partículas, electroporación, microinyección, lipofección, adsorción, infección y fusión de protoplastos.

Un experto en la técnica apreciará que el uso de tecnologías de ADN recombinante puede mejorar el control de la

35 expresión de moléculas de ácido nucleico transfectadas manipulando, por ejemplo, el número de copias de las moléculas de ácido nucleico dentro de la célula huésped, la eficacia con la que se transcriben esas moléculas de ácido nucleico, la eficacia con la que se traducen los transcritos resultantes y la eficacia de las modificaciones postraduccionales. Adicionalmente, la secuencia promotora puede modificarse por ingeniería genética para mejorar el nivel de expresión en comparación con el promotor nativo. Las técnicas recombinantes útiles para controlar la

40 expresión de moléculas de ácido nucleico incluyen, pero no se limitan a, integración de la moléculas de ácido nucleico en uno o más cromosomas de la célula huésped, adición de secuencias de estabilidad de vector a plásmidos, sustituciones o modificaciones de señales de control de la transcripción (por ejemplo, promotores, operadores, potenciadores), sustituciones o modificaciones de señales de control de la traducción (por ejemplo, sitios de unión al ribosoma, secuencias de Shine-Dalgarno), modificación de moléculas de ácido nucleico para que

45 se correspondan con el uso de codones de la célula huésped y deleción de secuencias que desestabilizan los transcritos.

Se pretende que la discusión general anterior con respecto a moléculas de ácido nucleico recombinantes y la transfección de células huésped se aplique a cualquier molécula de ácido nucleico recombinante comentada en el

50 presente documento, incluyendo las que codifican para cualquier secuencia de aminoácidos que tiene una actividad biológica de al menos un dominio de un PKS de AGPI, las que codifican para secuencias de aminoácidos de otros sistemas de PKS y las que codifican para otras proteínas o dominios.

Esta invención también se refiere a sistemas de PKS de AGPI (y proteínas o dominios de los mismos) de

55 microorganismos distintos de los descritos específicamente en el presente documento que son homólogos en estructura, organización de dominios y/o función a cualquiera del sistema de PKS de AGPI (y proteínas o dominios del mismo) tal como se describe en el presente documento. Además, esta invención se refiere al uso de estos microorganismos y los sistemas de PKS de AGPI o componentes de los mismos (por ejemplo, dominios DH2) de estos microorganismos en las diversas aplicaciones para un sistema de PKS de AGPI (por ejemplo, organismos

60 modificados genéticamente y métodos de producción de moléculas bioactivas) según la presente invención. En la publicación de solicitud de patente estadounidense n.º 20020194641, citada anteriormente, se describe en detalle un procedimiento de examen para la identificación de microorganismos que comprenden un sistema de PKS de AGPI. El conocimiento de la estructura y función de las proteínas y los dominios PKS de AGPI descritos en el presente documento, y la secuencia de nucleótidos que codifica para el mismo, son herramientas útiles para la identificación,

65 confirmación y/o aislamiento de homólogos de tales proteínas o polinucleótidos.

Según la presente invención, el término “traustoquitridio” se refiere a cualquier miembro del orden Thraustochytriales, que incluye la familia Thraustochytriaceae, y el término “laberintúlido” se refiere a cualquier miembro del orden Labyrinthulales, que incluye la familia Labyrinthulaceae. En algún momento se consideró que los miembros de la familia Labyrinthulaceae eran miembros del orden Thraustochytriales, pero en revisiones más

5 recientes de la taxonomía de tales organismos, se considera ahora que la familia es un miembro del orden Labyrinthulales, y se considera que tanto Labyrinthulales como Thraustochytriales son miembros del filo Labyrinthulomycota. Los desarrollos has dado como resultado una revisión frecuente de la taxonomía de los traustoquitridios y laberintúlidos. Sin embargo, los teóricos de la taxonomía colocan ahora generalmente a ambos de estos grupos de microorganismos con las algas o protistas similares a las algas dentro del linaje de Stramenopila. La colocación taxonómica actual de los traustoquitridios y laberintúlidos puede resumirse tal como sigue:

Reino: Stramenopila (Chromista)

Filo: Labyrinthulomycota

15 Clase: Labyrinthulomycetes

Orden: Labyrinthulales

Familia: Labyrinthulaceae

Orden: Thraustochytriales

Familia: Thraustochytriaceae

25 Sin embargo, debido a las incertidumbres taxonómicas que quedan, lo mejor para los fines de la presente invención sería considerar las cepas descritas en la presente invención como traustoquitridios incluyendo los siguientes organismos: Orden: Thraustochytriales; Familia: Thraustochytriaceae; Géneros: Thraustochytrium (especies: sp., arudimentale, aureum, benthicola, globosum, kinnei, motivum, multirudimentale, pachydermum, proliferum, roseum, striatum), Ulkenia (especies: sp., amoeboidea, kerguelensis, minuta, profunda, radiata, sailens, sarkariana, schizochytrops visurgensis, yorkensis), Schizochytrium (especies: sp., aggregatum, limnaceum, mangrovei, minutum, octosporum), Japonochytrium (especie: sp., marinum), Aplanochytrium (especies: sp., haliotidis, kerguelensis, profunda, stocchinoi), Althornia (especie: sp., crouchii) o Elina (especies: sp., marisalba, sinorifica). Debe indicarse que la descripción original del género Ulkenia no se publicó en una revista revisada por expertos de modo que

35 siguen existiendo algunas cuestiones en cuanto a la validez de este género y las especies colocadas dentro del mismo. Para los fines de esta invención, se considerará que las especies descritas dentro de Ulkenia son miembros del género Thraustochytrium.

Las cepas descritas en la presente invención como laberintúlidos incluyen los siguientes organismos: Orden: Labyrinthulales, Familia: Labyrinthulaceae, Géneros: Labyrinthula (especies: sp., algeriensis, coenocystis, chattonii, macrocystis, macrocystis atlantica, macrocystis macrocystis, marina, minuta, roscoffensis, valkanovii, vitellina, vitellina pacifica, vitellina vitellina, zopfii), Labyrinthuloides (especies: sp., haliotidis, yorkensis), Labyrinthomyxa (especie: sp., maria), Diplophys (especie: sp., archeri), Pyrrhosorus (especie: sp., marinus), Sorodiplophrys (especie: sp., stercorea) o Chlamydomyxa (especies: sp., labyrinthuloides, montana) (aunque no hay actualmente un

45 consenso sobre la colocación taxonómica exacta de Pyrrhosorus, Sorodiplophrys o Chlamydomyxa).

Para producir rendimientos significativamente altos de diversas moléculas bioactivas usando el sistema de PKS de AGPI de la presente invención, un organismo, preferiblemente un microorganismo o una planta o parte de la planta (por ejemplo, una célula de planta), puede modificarse genéticamente para afectar a la actividad de un sistema de PKS de AGPI. En un aspecto, un organismo de este tipo puede contener de manera endógena y expresar un sistema de PKS de AGPI, y la modificación genética puede ser una modificación genética de uno o más de los dominios funcionales del sistema de PKS de AGPI endógeno, mediante lo cual la modificación tiene algún efecto sobre la actividad del sistema de PKS de AGPI. En otro aspecto, un organismo de este tipo puede contener de manera endógena y expresar un sistema de PKS de AGPI, y la modificación genética puede ser una introducción de

55 al menos una secuencia de ácido nucleico exógeno (por ejemplo, una molécula de ácido nucleico recombinante), en el que la secuencia de ácido nucleico exógeno codifica para al menos un dominio biológicamente activo o proteína del mismo o un segundo sistema de PKS y/o una proteína que afecta a la actividad de dicho sistema de PKS de AGPI (por ejemplo, una fosfopanteteinil transferasa (PPTasa), comentado a continuación). Aún en otro aspecto, el organismo no contiene necesariamente de manera endógena (de manera natural) un sistema de PKS de AGPI, sino que se modifica genéticamente para introducir al menos una molécula de ácido nucleico recombinante que codifica para una secuencia de aminoácidos que tiene la actividad biológica de al menos un dominio de un sistema de PKS de AGPI. En este aspecto, la actividad de PKS de AGPI se ve afectada introduciendo o aumentando la actividad de PKS de AGPI en el organismo. A continuación se comentarán en mayor detalle diversas realizaciones asociadas con cada uno de estos aspectos.

65 Por tanto, según la presente invención, una realización se refiere a un microorganismo modificado genéticamente, en el que el microorganismo expresa un sistema de PKS que comprende al menos un dominio biológicamente activo de un sistema de policétido sintasa (PKS) de ácidos grasos poliinsaturados (AGPI). El al menos un dominio del sistema de PKS de AGPI se codifica por una secuencia de ácido nucleico descrita en el presente documento. La modificación genética afecta a la actividad del sistema de PKS en el organismo. El microorganismo modificado

5 genéticamente puede incluir una cualquiera o más de las secuencias de ácido nucleico identificadas anteriormente, y/o cualquiera de los otros homólogos de cualquiera de los ORF o dominios PKS de AGPI tal como se describió en detalle anteriormente.

Tal como se usa en el presente documento, un microorganismo modificado genéticamente puede incluir una bacteria, un protista, una microalga, un hongo u otros microbios modificados genéticamente, y particularmente, cualquiera de los géneros del orden Thraustochytriales (por ejemplo, un traustoquitridio) descritos en el presente documento. Un microorganismo modificado genéticamente de este tipo tiene un genoma que está modificado (es decir, está mutado o cambiado) de su forma normal (es decir, de tipo natural o que se produce de manera natural) de manera que se logra el resultado deseado (es decir, actividad de PKS de AGPI aumentada o modificada y/o 15 producción de un producto deseado usando el sistema de PKS de AGPI o componente del mismo). La modificación genética de un microorganismo puede lograrse usando desarrollo de cepas clásico y/o técnicas de genética molecular. Tales técnicas se conocen en la técnica y se dan a conocer generalmente para microorganismos, por ejemplo en Sambrook et al., 1989, Molecular Cloning: A Laboratory Manual, Cold Spring Harbor Labs Press. Un microorganismo modificado genéticamente puede incluir un microorganismo en el que se han insertado, delecionado

o modificado moléculas de ácido nucleico (es decir, mutado; por ejemplo, mediante inserción, deleción, sustitución y/o inversión de nucleótidos), de una manera tal que tales modificaciones proporcionan el efecto deseado dentro del microorganismo.

Las células huésped de microorganismos preferidos para modificar según la presente invención incluyen, pero no se

25 limitan a, cualquier bacteria, protista, microalga, hongo o protozoo. En un aspecto, los microorganismos preferidos para modificar genéticamente incluyen, pero no se limitan a, cualquier microorganismo del orden Thraustochytriales

o cualquier microorganismo del orden Labyrinthulales. Las células huésped particularmente preferidas para su uso en la presente invención pueden incluir microorganismos de un género incluyendo, pero sin limitarse a: Thraustochytrium, Ulkenia, Schizochytrium, Japonochytrium, Aplanochytriune, Althornia, Elina, Labyrinthula, Labyrinthuloides, Labyrinthonsyxa, Diplophrys, Pyrrhosorus, Sorodiplophrys o Chlamydomyxa. Otros ejemplos de microorganismos huésped adecuados para la modificación genética incluyen, pero no se limitan a, levadura incluyendo Saccharamyces cerevisiae, Saccharomyces carlsbergensis u otra levadura tal como Candida, Kluyveromyces u otros hongos, por ejemplo, hongos filamentosos tales como Aspergillus, Neurospora, Penicillium, etc. También pueden usarse células bacterianas como huéspedes. Esto incluye Escherichia coli, que puede ser útil

35 en procesos de fermentación. Alternativamente, puede usarse como huésped un huésped tal como una especie de Lactobacillus o una especie de Bacillus.

Otra realización de la presente invención se refiere a una planta modificada genéticamente o parte de una planta (por ejemplo, en la que la planta se ha modificado genéticamente para expresar un sistema de PKS de AGPI descrito en el presente documento), que incluye al menos el complejo enzimático de PKS de AGPI central y, en una realización, al menos una proteína auxiliar de PKS de AGPI (por ejemplo, una PPTasa), de modo que la planta produce AGPI. Preferiblemente, la planta es una planta de semillas oleaginosas, en la que las semillas oleaginosas

o el aceite en las semillas oleaginosas contienen AGPI producidos por el sistema de PKS de AGPI. Tales aceites contienen una cantidad detectable de al menos un AGPI primario o objetivo que es el producto del sistema de PKS

45 de AGPI. No se conoce que las plantas contengan de manera endógena un sistema de PKS de AGPI y, por tanto, los sistemas de PKS de AGPI de la presente invención representan una oportunidad para producir plantas con capacidades de producción de ácidos grasos únicas. Una realización particularmente preferida de la presente invención es modificar por ingeniería genética plantas para producir uno o más AGPI en la misma planta, incluyendo EPA, DHA, DPA (n-3 y/o n-6); ARA, GLA, SDA y otros. La presente invención ofrece la capacidad para crear uno cualquiera de varios “aceites de diseño” en diversas razones y formas.

Se conocen bien en la técnica métodos para la modificación por ingeniería genética de plantas. Por ejemplo, se han desarrollado numerosos métodos para la transformación de plantas, incluyendo protocolos de transformación biológica y física. Véase, por ejemplo, Miki et al., “Procedures for Introducing Foreign DNA into Plants” en Methods in

55 Plant Molecular Biology and Biotechnology, Glick, B.R. y Thompson, J.E. Eds. (CRC Press, Inc., Boca Raton, 1993) págs. 67-88. Además, están disponibles vectores y métodos de cultivo in vitro para la transformación de tejidos o células de plantas y la regeneración de plantas. Véase, por ejemplo, Gruber et al., “Vectors for Plant Transformation” en Methods in Plant Molecular Billow and Biotechnology, Glick, B.R. y Thompson, J.E. Eds. (CRC Press, Inc., Boca Raton, 1993) págs. 89-119.

El método más ampliamente utilizado para introducir un vector de expresión en plantas se basa en el sistema de transformación natural de Agrobacterium. Véase, por ejemplo, Horsch et al., Science 227:1229 (1985). A. tumefaciens y A. rhizogenes son bacterias del suelo patógenas de plantas que transforman genéticamente células de plantas. Los plásmidos Ti y Ri de A. tumefaciens y A. rhizogenes, respectivamente, portan genes responsables 65 de la transformación genética de la planta. Véase, por ejemplo, Kado, C.I., Crit. Rev. Plant. Sci. 10:1 (1991). Numerosas referencias proporcionan descripciones de sistemas de vector de Agrobacterium y métodos para la

transferencia génica mediada por Agrobacterium, incluyendo Gruber et al., citado anteriormente, Miki et al., citado anteriormente, Moloney et al., Plant Cell Reports 8:238 (1989) y las patentes estadounidenses n.os 4.940.838 y

5.464.763.

5 Otro método generalmente aplicable de transformación de plantas es transformación mediada por microproyectiles en el que se porta ADN sobre la superficie de microproyectiles. El vector de expresión se introduce en tejidos de plantas con un dispositivo biolístico que acelera los microproyectiles hasta velocidades suficientes para penetrar en las membranas y paredes de células de plantas. Sanford et al., Part. Sci. Technol. 5:27 (1987), Sanford, J.C., Trends Biotech. 6:299 (1988), Sanford, J.C., Physiol. Plant 79:206 (1990), Klein et al., Biotechnology 10:268 (1992).

Otro método para el suministro físico de ADN a plantas es la sonicación de células diana. Zhang et al., Bio/Technology 9:996 (1991). Alternativamente, se ha usado la fusión de esferoplastos o liposomas para introducir vectores de expresión en plantas. Deshayes et al., EMBO J., 4:2731 (1985), Christou et al., Proc Natl. Acad. Sci. USA 84:3962 (1987). También se ha notificado la captación directa de ADN en protoplastos usando precipitación

15 con CaCl2, poli(alcohol vinílico) o poli-L-ornitina. Hain et al., Mol. Gen. Genet.- 199:161 (1985) y Draper et al., Plant Cell Physiol. 23:451 (1982). También se ha descrito la electroporación de protoplastos y tejidos y células completas. Donn et al., en Abstracts of VIIth International Congress on Plant Cell and Tissue Culture IAPTC, A2-38, pág. 53 (1990); D’Halluin et al., Plant Cell 4:1495-1505 (1992) y Spencer et al., Plant Mol. Biol. 24:51-61 (1994).

Tras la introducción del constructo genético en células de plantas, se hacen crecer células de plantas y tras la aparición de tejido de diferenciación tal como brotes y raíces, se generan plantas maduras. Normalmente se genera una pluralidad de plantas. Los expertos en la técnica conocerán generalmente metodologías para regenerar plantas y pueden encontrarse por ejemplo en: Plant Cell and Tissue Culture, 1994, Vasil y Thorpe Eds. Kluwer Academic Publishers y en: Plant Cell Culture Protocols (Methods in Molecular Biology 111, 1999 Hall Eds Humana Press).

25 Tal como se usa en el presente documento, una planta modificada genéticamente puede incluir cualquier planta modificada genéticamente incluyendo plantas superiores y, particularmente, cualquier planta consumible o planta útil para producir una molécula bioactiva deseada de la presente invención. “Partes de plantas”, tal como se usa en el presente documento, incluyen cualquier parte de una planta, incluyendo, pero sin limitarse a, semillas (inmaduras o maduras), aceites, polen, embriones, flores, frutos, brotes, hojas, raíces, tallos, explantes, etc. Una planta modificada genéticamente tiene un genoma que está modificado (es decir, mutado o cambiado) con respecto a su forma normal (es decir, de tipo natural o que se produce de manera natural) de manera que se alcanza el resultado deseado (por ejemplo, actividad PKS de AGPI y producción de AGPI). La modificación genética de una planta puede lograrse usando técnicas clásicas de desarrollo de cepas y/o genética molecular. En la técnica se conocen métodos para

35 producir una planta transgénica, en los que se incorpora en el genoma de la planta una molécula de ácido nucleico recombinante que codifica para una secuencia de aminoácidos deseada. Una planta preferida para modificarse genéticamente según la presente invención es preferiblemente una planta adecuada para su consumo por animales, incluyendo seres humanos.

Las plantas preferidas para modificarse genéticamente según la presente invención (es decir, células huésped de plantas) incluyen, pero no se limitan a, cualquier planta superior, incluyendo plantas tanto dicotiledóneas como monocotiledóneas, y particularmente plantas consumibles, incluyendo plantas cultivadas y especialmente plantas usadas por sus aceites. Tales plantas pueden incluir, pero no se limitan a, por ejemplo: canola, sojas, colza, linaza, maíz, cártamos, girasoles y tabaco. Por tanto, puede seleccionarse cualquier especie de planta o célula de planta.

45 Las células particulares usadas en el presente documento, y las plantas que se hacen crecer o se derivan a partir de las mismas, incluyen, pero no se limitan a, células que pueden obtenerse de canola (Brassica rapa L.); soja (Glicina max); colza (Brassica spp.); linaza/lino (Linum usitatissimum); maíz (Zea mays); cártamo (Carthamus tinctorius); girasol (Helianthus annuus); tabaco (Nicotiana tabacum); Arabidopsis thaliana, nuez de Brasil (Betholettia excelsa); ricino (Riccinus communis); coco (Cocus nucifera); cilantro (Cariandrum sativum); algodón (Gossypium spp.); cacahuete (Arachis hipogaea); jojoba (Simmondsia chinensis); mostaza (Brassica spp. y Sinapis alba); palma de aceite (Elaeis guineeis); olivo (Olea eurpaea); arroz (Oryza sativa); calabacín (Cucurbita maxima); cebada (Hordeum vulgare); trigo (Tracticum aestivum) y lenteja de agua (Lemnaceae sp.). Debe observarse que según el presente documento el contexto genético dentro de una especie de planta puede variar.

55 Otras plantas preferidas incluyen aquellas plantas que se sabe que producen compuestos usados como agentes farmacéuticos, agentes aromatizantes, agentes nutracéuticos, componentes alimenticios funcionales o agentes cosméticamente activos o plantas que se modifican por ingeniería genética para producir estos compuestos/agentes.

En una realización adicional, pueden usarse cultivos de células de plantas de acuerdo con el presente documento. En tales realizaciones no se hacen crecer células de plantas para dar plantas diferenciadas ni se cultivan usando prácticas agrícolas habituales, sino que en vez de eso se hacen crecer y se mantienen en un medio líquido.

Según la presente invención, una planta o un microorganismo modificado genéticamente incluye una planta o un microorganismo que se ha modificado usando tecnología recombinante. Tal como se usa en el presente documento, 65 las modificaciones genéticas que dan como resultado una disminución de la expresión génica, de la función del gen

o de la función del producto génico (es decir, la proteína codificada por el gen) pueden denominarse inactivación (completa o parcial), deleción, interrupción, bloqueo o regulación por disminución de un gen. Por ejemplo, una modificación genética en un gen que da como resultado una disminución de la función de la proteína codificada por tal gen, puede ser el resultado de una deleción completa del gen (es decir, el gen no existe, y por tanto la proteína no existe), una mutación en el gen que da como resultado una traducción incompleta o ausencia de traducción de la

5 proteína (por ejemplo, la proteína no se expresa), o una mutación en el gen que disminuye o suprime la función natural de la proteína (por ejemplo, se expresa una proteína que tiene una disminución o ausencia de acción o actividad enzimática). Las modificaciones genéticas que dan como resultado un aumento de la expresión o función génica pueden denominarse amplificación, sobreproducción, sobreexpresión, activación, potenciación, adición o regulación por incremento de un gen.

La modificación genética de una planta o un microorganismo según la presente invención afecta preferiblemente a la actividad del sistema de PKS expresado por la planta, ya sea el sistema de PKS endógeno y modificado genéticamente, endógeno con la introducción de moléculas de ácido nucleico recombinantes en el organismo o se proporcione completamente mediante tecnología recombinante. Según la presente invención, “afectar a la actividad 15 de un sistema de PKS” incluye cualquier modificación genética que provoca cualquier cambio o modificación detectable o medible en el sistema de PKS expresado por el organismo en comparación con en ausencia de la modificación genética. Un cambio o modificación detectable en el sistema de PKS puede incluir, pero no se limita a: la introducción de actividad de sistema de PKS en un organismo de manera que el organismo ahora tiene actividad de sistema de PKS medible/detectable (es decir, el organismo no contenía un sistema de PKS antes de la modificación genética), la introducción en el organismo de un dominio funcional de un sistema de PKS diferente de un sistema de PKS expresado de manera endógena por el organismo de manera que se modifica la actividad de sistema de PKS (por ejemplo, se introduce el dominio DH2 de un sistema de PKS de AGPI en el sistema de PKS de AGPI de un organismo diferente), un cambio en la cantidad de una molécula bioactiva producida por el sistema de PKS (por ejemplo, el sistema produce más (cantidad aumentada) o menos (cantidad disminuida) de un producto

25 dado en comparación con en ausencia de la modificación genética), un cambio en el tipo de una molécula bioactiva producida por el sistema de PKS (por ejemplo, el sistema produce un producto nuevo o diferente, o una variante de un producto que se produce de manera natural por el sistema) y/o un cambio en la razón de múltiples moléculas bioactivas producidas por el sistema de PKS (por ejemplo, el sistema produce una razón diferente de un AGPI con respecto a otro AGPI, produce un perfil lipídico completamente diferente en comparación con en ausencia de la modificación genética o coloca diversos AGPI en posiciones diferentes en un triacilglicerol en comparación con la configuración natural). Una modificación genética de este tipo incluye cualquier tipo de modificación genética e incluye específicamente modificaciones realizadas mediante tecnología recombinante y mediante mutagénesis clásica.

35 Debe observarse que la referencia a aumentar la actividad de un dominio o una proteína funcional en un sistema de PKS de AGPI se refiere a cualquier modificación genética en el organismo que contiene el dominio o la proteína (o en el que debe introducirse el dominio o la proteína) que da como resultado un aumento de la funcionalidad del sistema de dominio o proteína y puede incluir actividad superior del dominio o de la proteína (por ejemplo, actividad específica o actividad enzimática in vivo), inhibición o degradación reducida del sistema de dominio o proteína y sobreexpresión del dominio o de la proteína. Por ejemplo, puede aumentarse el número de copias del gen, pueden aumentarse los niveles de expresión mediante el uso de un promotor que proporciona niveles de expresión superiores a los del promotor nativo o puede alterarse un gen mediante ingeniería genética o mutagénesis clásica para aumentar la actividad del dominio o la proteína codificado por el gen.

45 De manera similar, la referencia a disminuir la actividad de un dominio o una proteína funcional en un sistema de PKS de AGPI se refiere a cualquier modificación genética en el organismo que contiene tal dominio o proteína (o en el que va a introducirse el dominio o la proteína) que da como resultado una disminución de la funcionalidad del dominio o de la proteína e incluye actividad disminuida del dominio o de la proteína, inhibición o degradación aumentada del dominio o de la proteína y una reducción o eliminación de la expresión del dominio o de la proteína. Por ejemplo, la acción de un dominio o una proteína de la presente invención puede disminuirse bloqueando o reduciendo la producción del dominio o de la proteína, “desactivación” del gen o la porción del mismo que codifica para el dominio o la proteína, reducción de la actividad del dominio o de la proteína o inhibición de la actividad del dominio o de la proteína. Bloquear o reducir la producción de un dominio o una proteína puede incluir colocar el gen que codifica para el dominio o la proteína bajo el control de un promotor que requiere la presencia de un compuesto

55 inductor en el medio de crecimiento. Estableciendo las condiciones de manera que se agote el inductor del medio, puede inactivarse la expresión del gen que codifica para el dominio o la proteína (y por tanto, de la síntesis de proteína). Bloquear o reducir la actividad del dominio o de la proteína también puede incluir usar un enfoque de tecnología de escisión similar al descrito en la patente estadounidense n.º 4.743.546. Para usar este enfoque, se clona el gen que codifica para la proteína de interés entre secuencias genéticas específicas que permiten una escisión específica, controlada, del gen a partir del genoma. La escisión puede provocarse, por ejemplo, por un desplazamiento en la temperatura de cultivo del cultivo, como en la patente estadounidense n.º 4.743.546, o por alguna otra señal física o nutricional.

En una realización de la presente invención, una modificación genética incluye una modificación de una secuencia

65 de ácido nucleico que codifica para una proteína o un dominio de un sistema de PKS de AGPI expresado de manera endógena (de manera natural), mediante lo cual se modifica genéticamente un microorganismo que contiene de

manera natural un sistema de este tipo, por ejemplo, mediante mutagénesis clásica, y técnicas de selección y/o técnicas de genética molecular, incluyendo técnicas de ingeniería genética. Las técnicas de ingeniería genética pueden incluir, por ejemplo, usar un vector recombinante de direccionamiento para delecionar una porción de un gen endógeno o para sustituir una porción de un gen endógeno por una secuencia heteróloga. Los ejemplos de 5 secuencias heterólogas que pueden introducirse en un genoma huésped incluyen secuencias que codifican para al menos un dominio funcional de otro sistema de PKS, tal como un sistema de PKS de AGPI diferente (bacteriano o no bacteriano), un sistema de PKS de tipo I (iterativo o modular), un sistema de PKS de tipo II o un sistema de PKS de tipo III. Otras secuencias heterólogas para introducir en el genoma de un huésped incluyen una secuencia que codifica para una proteína o un dominio funcional que no es un dominio de un sistema de PKS central, pero que

10 afectará a la actividad del sistema de PKS endógeno. Por ejemplo, puede introducirse en el genoma huésped una molécula de ácido nucleico que codifica para una fosfopanteteinil transferasa (comentada a continuación). A continuación se comentan en detalle modificaciones específicas que pueden realizarse a un sistema de PKS de AGPI endógeno.

15 En otro aspecto de esta realización de la invención, la modificación genética incluye: (1) la introducción en una célula

o un organismo huésped homólogo o heterólogo de una molécula de ácido nucleico recombinante que codifica para una secuencia de aminoácidos que tiene una actividad biológica de al menos un dominio de un sistema de PKS de AGPI; y/o (2) la introducción en una célula o un organismo huésped de una molécula de ácido nucleico recombinante que codifica para una proteína o un dominio funcional que afecta a la actividad de un sistema de PKS 20 de AGPI. El huésped puede incluir: (1) una célula o un organismo huésped que no expresa ningún sistema de PKS para la producción de AGPI, en el que se introducen todos los dominios funcionales de un sistema de PKS de AGPI en la célula huésped; (2) una célula huésped que expresa un sistema de PKS para la producción de AGPI (endógeno o recombinante), en la que se introduce al menos un dominio o una proteína PKS de AGPI adicional en la célula o el organismo. En otras palabras, la presente invención pretende abarcar cualquier célula u organismo

25 modificado genéticamente (por ejemplo, microorganismo o planta), en el que el organismo comprende al menos un dominio o una proteína PKS de AGPI descrito en el presente documento o se ha modificado para producir un dominio o una proteína PKS de AGPI resintetizado y/o quimérico tal como se describe en el presente documento.

Por tanto, usando la orientación proporcionada en el presente documento, así como la descripción de los sistemas

30 de PKS de AGPI descritos en el presente documento y conocidos antes de la invención, puede usarse el mezclado de genes (o mezclado de moléculas de ácido nucleico), por ejemplo, mediante la producción de proteínas quiméricas y/o sistemas de PKS de AGPI quiméricos tal como se describe en detalle en el presente documento, para ampliar la gama de productos de AGPI, las razones de los mismos y los niveles de producción de los mismos, por un organismo que expresa el sistema de PKS de AGPI. Por ejemplo, pueden usarse las enseñanzas

35 proporcionadas en el presente documento para mejorar las cantidades de AGPI producidos, para cambiar la razón de un AGPI con respecto a otro, incluyendo la razón de AGPI omega-3 con respecto a omega-6, y para ampliar la gama de productos de PKS de AGPI para incluir EPA, DPA (n-3 o n-6), DHA, ARA, GLA, SDA y otros, así como para producir una amplia variedad de moléculas bioactivas, incluyendo antibióticos, otros compuestos farmacéuticos y otros productos deseables. El método para obtener estas mejoras no sólo incluye el mezclado de genes de diversos

40 organismos sino también diversos métodos de modificación genética de los genes de PKS de AGPI y las moléculas de ácido nucleico dadas a conocer en el presente documento. El conocimiento de la base genética y la estructura de dominios de los sistemas de PKS de AGPI tal como se describe en el presente documento proporciona una base para diseñar organismos modificados genéticamente novedosos. A modo de ejemplo, en la publicación de solicitud de patente estadounidense n.º 20020194641, la publicación de solicitud de patente estadounidense

45 n.º 20040235127 y la publicación de solicitud de patente estadounidense n.º 20050100995, citadas anteriormente con respecto a la modificación genética y producción de moléculas bioactivas, se comentan diversas manipulaciones posibles del sistema de PKS de AGPI. Sin embargo, esta invención proporciona realizaciones novedosas referentes a la manipulación de los niveles de producción de AGPI por un organismo huésped y la manipulación de la razón de AGPI producidos por un organismo huésped.

50 Por consiguiente, se describen métodos para modificar genéticamente células microbianas o de plantas mediante: modificar genéticamente al menos una secuencia de ácido nucleico en el organismo que codifica para una secuencia de aminoácidos que tiene la actividad biológica de al menos un dominio funcional de un sistema de PKS de AGPI según la presente invención, y/o expresar al menos una molécula de ácido nucleico recombinante que

55 comprende una secuencia de ácido nucleico que codifica para tal secuencia de aminoácidos. Anteriormente se han descrito en detalle diversas realizaciones de tales secuencias, métodos para modificar genéticamente un organismo y modificaciones específicas. Normalmente, el método se usa para producir un organismo modificado genéticamente particular que produce una molécula o moléculas bioactivas particulares.

60 Se contempla que puede combinarse un programa de mutagénesis con un procedimiento de examen selectivo para obtener moléculas bioactivas de interés. Esto incluirá métodos para buscar una gama de compuestos bioactivos. Esta búsqueda no se limitará a la producción de las moléculas con dobles enlaces cis. Los métodos de mutagénesis pueden incluir, pero no se limitan a: mutagénesis química, intercambio génico, cambiar regiones de los genes que codifican para dominios enzimáticos específicos o mutagénesis limitada a regiones específicas de esos genes, así

65 como otros métodos.

Por ejemplo, pueden usarse métodos de mutagénesis de alto rendimiento para influir en, u optimizar, la producción de la molécula bioactiva deseada. Una vez que se haya desarrollado un sistema modelo eficaz, pueden modificarse estos genes de una manera con alto rendimiento. Puede considerarse la utilización de estas tecnologías en dos niveles. En primer lugar, si puede concebirse un examen lo suficientemente selectivo para la producción de un

5 producto de interés (por ejemplo, ARA), puede usarse para intentar alterar el sistema para producir este producto (por ejemplo, en lugar de, o junto con, otras estrategias tales como las comentadas anteriormente). Adicionalmente, si las estrategias expuestas anteriormente dieron como resultado un conjunto de genes que sí producían el producto de interés, entonces pueden usarse las tecnologías de alto rendimiento para optimizar el sistema. Por ejemplo, si el dominio introducido sólo funcionaba a temperaturas relativamente bajas, pueden concebirse métodos de selección para permitir eliminar esa limitación.

Se reconoce que muchas alteraciones genéticas, o bien al azar o bien dirigidas, que pueden introducirse en un sistema de PKS de AGPI nativo (endógeno, natural), darán como resultado una inactivación de funciones enzimáticas. Por tanto, se describe un sistema para seleccionar sólo aquellas modificaciones que no bloquean la 15 capacidad del sistema de PKS de AGPI para producir un producto. Por ejemplo, la cepa FabB de E. coli no puede sintetizar ácidos grasos insaturados y requiere la complementación del medio con ácidos grasos que pueden sustituir a sus ácidos grasos insaturados normales con el fin de crecer (véase Metz et al., 2001, citado anteriormente). Sin embargo, este requisito (de complementación del medio) puede eliminarse cuando se transforma la cepa con un sistema de PKS de AGPI funcional (es decir, uno que produce un producto de AGPI en el huésped de E. coli, véase (Metz et al., 2001, citado anteriormente, figura 2A)). Ahora la cepa FabB transformada requiere un sistema de PKS de AGPI funcional (para producir los ácidos grasos insaturados) para crecer sin complementación. El elemento clave en este ejemplo es que bastará con la producción de una amplia gama de ácidos grasos insaturados (incluso sustitutos de ácidos grasos insaturados, tales como ácidos grasos de cadena ramificada). Por tanto, se contempla que puede crearse un gran número de mutaciones en uno o más de los genes de PKS de AGPI

25 dados a conocer en el presente documento, y entonces transformar la cepa FabB apropiadamente modificada (por ejemplo, crear mutaciones en un constructo de expresión que contiene un dominio ER y transformar una cepa FabB que tiene los otros dominios esenciales en un plásmido separado, o integrados en el cromosoma) y seleccionar sólo aquellos transformantes que crecen sin complementación del medio (es decir, que todavía presentaban una capacidad para producir una molécula que podía complementar el defecto de FabB). Pueden desarrollarse exámenes adicionales para buscar compuestos particulares (por ejemplo el uso de CG para ácidos grasos) que están produciéndose en este subconjunto selectivo de un sistema de PKS activo. Pueden considerarse diversos exámenes selectivos similares para moléculas bioactivas de interés.

En una realización de la invención, un organismo modificado genéticamente tiene una modificación que cambia al

35 menos un producto producido por el sistema de PKS endógeno, en comparación con un organismo de tipo natural. Los constructos novedosos usados para producir tales organismos modificados, así como las proteínas y los organismos producidos usando tales constructos, y los métodos asociados con tales modificaciones, están todos abarcados por la invención.

En una realización preferida, un organismo modificado genéticamente expresa un sistema de PKS de AGPI que comprende una modificación genética en un dominio β-hidroxil acil-ACP deshidrasa (DH) correspondiente al dominio DH2 de Schizochytrium o Thraustochytrium, en el que la modificación altera la razón de ácidos grasos de cadena larga, y particularmente, la razón de ácidos grasos de cadena larga omega-3 con respecto a omega-6, producidos por el sistema de PKS de AGPI, en comparación con en ausencia de la modificación. En un aspecto de esta

45 realización, la modificación se selecciona del grupo que consiste en una deleción de la totalidad o de una parte del dominio, una sustitución de la totalidad o de parte del dominio por un dominio homólogo o una parte del mismo de un organismo diferente (por ejemplo, un organismo diferente que produce de manera natural diferentes razones y/o cantidades de los AGPI) y una mutación del dominio.

Más específicamente, tal como se ilustra en el presente documento, la comparación de la arquitectura (organización de dominios) de PKS de AGPI de Schizochytrium y Thraustochytrium con otra arquitectura de sistema de PKS de AGPI ilustra la capacidad de la naturaleza para alterar el orden de dominios así como incorporar nuevos dominios para crear productos finales novedosos, o alterar las razones de productos finales, por ejemplo. Además, ahora pueden manipularse los genes en el laboratorio para crear nuevos productos, tal como se describe en los ejemplos. 55 Los inventores han demostrado ahora la capacidad de emplear esta capacidad y usarla para crear organismos novedosos con cantidades de producción y perfiles de AGPI novedosos. En el presente documento se describe la manipulación de sistemas de PKS de AGPI de una manera o bien dirigida o bien al azar para influir en los productos finales. Por ejemplo, en una realización preferida, se usa la sustitución de un dominio DH (similar a FabA) o una porción biológicamente activa del mismo de un primer sistema de PKS de AGPI, y específicamente, el dominio DH2 descrito en el presente documento, por el dominio DH homólogo o una porción biológicamente activa del mismo en un segundo sistema de PKS de AGPI diferente, para alterar la razón de AGPI producidos por el segundo sistema de PKS de AGPI, y particularmente, para manipular la razón de ácidos grasos omega-3 con respecto a omega-6 producidos por el segundo sistema de PKS de AGPI. Puede alcanzarse un resultado similar sustituyendo una proteína entera o cualquier porción biológicamente activa de la misma que contiene tal dominio DH2 (por ejemplo, el 65 OrfC de Thraustochytrium 23B) de un primer sistema de PKS de AGPI por la proteína homóloga o porción de la misma en un segundo sistema de PKS de AGPI. Aunque los ejemplos descritos en el presente documento utilizan

los sistemas de PKS de AGPI de Schizochytrium y Thraustochytrium, la invención abarca la manipulación similar de cualquier sistema de PKS o similar a PKS para la producción de AGPI mediante la modificación de la proteína DH2 o del dominio similar a DH2. Tal modificación puede realizarse sola o junto con otras modificaciones de un sistema de PKS de AGPI.

5 Por consiguiente, una realización de la presente invención comprende un sistema de PKS de AGPI quimérico y un organismo que expresa tal sistema de PKS de AGPI quimérico. En un aspecto, el sistema de PKS de AGPI quimérico comprende un primer sistema de PKS de AGPI, en el que el dominio o la proteína del primer sistema de PKS de AGPI que corresponde al dominio DH2 o porción biológicamente activa del mismo (por ejemplo, de Schizochytrium o Thraustochytrium descritos en el presente documento) se ha modificado o sustituido por un dominio DH2 o una proteína o porción biológicamente activa del mismo de un segundo sistema de PKS de AGPI diferente. Por “sistema de PKS de AGPI diferente” quiere decirse un sistema de PKS de AGPI de una cepa, especie, género u organismo diferente, o incluso un homólogo de un sistema de PKS de AGPI natural o de tipo natural. El objetivo de producir esta proteína quimérica es alterar la razón de los AGPI, y particularmente la razón de AGPI

15 omega-3 con respecto a omega-6, producidos por el sistema de PKS de AGPI. Por tanto, la selección del sistema de PKS de AGPI diferente debe basarse en la selección de un segundo sistema que produce una razón de los AGPI diferente, o deseada, que el primer sistema de PKS de AGPI.

En un aspecto de la invención, tal sistema de PKS de AGPI quimérico comprende una proteína OrfA (SEQ ID NO: 2) y OrfB (SEQ ID NO: 4) de Schizochytrium tal como se describe en el presente documento, y una proteína OrfC (SEQ ID NO: 62) de Thraustochytrium tal como se describe en el presente documento. En los ejemplos se describen organismos de Schizochytrium, E. coli y levadura que expresan tales sistemas de PKS de AGPI quiméricos y están abarcados por la presente invención, además de plantas y partes de plantas que expresan tales sistemas de PKS de AGPI quiméricos. En otras realizaciones, ejemplificadas en los ejemplos, se producen sistemas de PKS de AGPI

25 quiméricos que comprenden todas las combinaciones de los OrfA, B y C de Schizochytrium y Thraustochytrium.

En otro aspecto de la invención, un sistema de PKS de AGPI quimérico comprende una proteína OrfA (SEQ ID NO: 2) y OrfB (SEQ ID NO: 4) de Schizochytrium tal como se describe en el presente documento, y una proteína OrfC quimérica (codificada por una secuencia de ácido nucleico representada en el presente documento por SEQ ID NO: 74, codificada por SEQ ID NO: 73). El polipéptido OrfC quimérico tiene 1493 residuos de aminoácido de longitud. La región DH2, definida como los aminoácidos 516-1041 de SEQ ID NO: 74, consiste en la secuencia de aminoácidos de la región DH2 de la proteína OrfC de Th.23B, es decir, los aminoácidos 491-1016 de SEQ ID NO: 62, que incluye la totalidad de SEQ ID NO: 66 y alguna secuencia de aminoácidos flanqueante de SEQ ID NO: 62. Con respecto al resto de la secuencia de aminoácidos de OrfC quimérica, los residuos 1-515 y 1042-1493 de SEQ ID NO: 74 son

35 idénticos a los residuos 1-515 y 1051-1502 del OrfC de Schizochytrium de SEQ ID NO: 6, respectivamente.

En otra realización de la invención, se ha modificado una célula o un organismo modificado genéticamente para expresar un sistema de PKS de AGPI o una porción del mismo, incluyendo un sistema de PKS de AGPI quimérico, en el que la(s) secuencia(s) de ácido nucleico que codifica(n) para el sistema de PKS de AGPI o porción del mismo está(n) optimizada(s) totalmente o en parte para utilizar el uso de codones preferido de la célula o el organismo huésped. Esta realización se ejemplifica a continuación e ilustra cómo puede aumentarse la producción de una molécula bioactiva (por ejemplo, un AGPI) realizando tales modificaciones. Esta realización puede usarse junto con las demás modificaciones genéticas descritas en el presente documento (por ejemplo, realizaciones de proteínas y PKS de AGPI quiméricos), para mejorar la producción de una molécula bioactiva en un organismo huésped.

45 En un aspecto de esta realización, un sistema de PKS de AGPI quimérico comprende una proteína OrfA (SEQ ID NO: 2) y OrfB (SEQ ID NO: 4) de Schizochytrium tal como se describe en el presente documento, y una proteína OrfC (SEQ ID NO: 62) de Thraustochytrium tal como se describe en el presente documento, en el que la secuencia de ácido nucleico que codifica para SEQ ID NO: 62 está optimizada para el uso de codones del huésped. En los ejemplos se describe un ejemplo de tal molécula optimizada para la expresión en Schizochytrium, representándose tal secuencia de ácido nucleico que codifica para OrfC de Thraustochytrium (OrfC sintético u optimizado para codones) en el presente documento por SEQ ID NO: 70. En otra realización, puede combinarse OrfA de Thraustochytrium (SEQ ID NO: 39) y/o OrfB de Thraustochytrium (SEQ ID NO: 52) con uno cualquiera o más de los Orf A, B y/o C de Schizochytrium, y/o con el OrfC de Thraustochytrium, para la expresión en Schizochytrium. De

55 nuevo, en este ejemplo, la molécula de ácido nucleico que codifica para el OrfA de Thraustochytrium y/o el OrfB de Thraustochytrium puede estar optimizada para el uso de codones del huésped. En los ejemplos se describen ejemplos de tales moléculas optimizadas para la expresión en Schizochytrium, representándose la secuencia de ácido nucleico que codifica para OrfA de Thraustochytrium (OrfA sintético u optimizado para codones) en el presente documento por SEQ ID NO: 71, y representándose la secuencia de ácido nucleico que codifica para OrfB de Thraustochytrium (OrfB sintético u optimizado para codones) en el presente documento por SEQ ID NO: 72.

En otro aspecto de esta realización, un sistema de PKS de AGPI quimérico comprende una proteína OrfA (SEQ ID NO: 2) y OrfB (SEQ ID NO: 4) de Schizochytrium tal como se describe en el presente documento, y una proteína OrfC quimérica y parcialmente optimizada para codones (codificada por una secuencia de ácido nucleico

65 representada en el presente documento por SEQ ID NO: 75). La proteína codificada por SEQ ID NO: 75 también se representa por SEQ ID NO: 74, que se describió anteriormente con respecto a SEQ ID NO: 73. Sin embargo, en este caso la porción de la secuencia de ácido nucleico que codifica para SEQ ID NO: 66 (dominio DH2), que se deriva de Thraustochytrium, está optimizada para la expresión en Schizochytrium tal como se describe en los ejemplos.

Anteriormente y a continuación en los ejemplos se describen otras secuencias de ácido nucleico optimizadas para 5 codones para su uso en E. coli, levadura y plantas.

En otra realización, se ha modificado un organismo modificado genéticamente mediante transfección del organismo con una molécula de ácido nucleico recombinante que codifica para una proteína que regula la longitud de cadena de ácidos grasos producidos por el sistema de PKS de AGPI. Por ejemplo, la proteína que regula la longitud de cadena de ácidos grasos producidos por el sistema de PKS de AGPI puede ser un factor de longitud de cadena que dirige la síntesis de unidades C20 y/o unidades C22.

En otra realización, un organismo modificado genéticamente expresa un sistema de PKS de AGPI que comprende una modificación en un dominio enoil-ACP reductasa (ER), en el que la modificación da como resultado la

15 producción de un compuesto diferente en comparación con en ausencia de la modificación. En un aspecto de esta realización, la modificación se selecciona del grupo que consiste en una deleción de la totalidad o una parte de un ER dominio, una sustitución del dominio ER por un dominio ER de un organismo diferente y una mutación de un dominio ER.

En una realización de la invención, el organismo modificado genéticamente produce un perfil de ácidos grasos poliinsaturados (AGPI) que es diferente del del organismo que se produce de manera natural sin una modificación genética.

Muchas otras modificaciones genéticas útiles para producir moléculas bioactivas resultarán evidentes para los

25 expertos en la técnica, dada la presente divulgación, y diversas otras modificaciones se han comentado anteriormente en el presente documento. La presente invención contempla cualquier modificación genética relacionada con un sistema de PKS de AGPI tal como se describe en el presente documento que da como resultado la producción de una molécula bioactiva deseada.

Tal como se describió anteriormente, en una realización de la presente invención, un organismo modificado genéticamente, tal como una planta o un microorganismo modificado genéticamente, incluye un organismo que tiene una capacidad potenciada de sintetizar moléculas bioactivas deseadas (productos) o que tiene una capacidad recién introducida de sintetizar productos específicos (por ejemplo, sintetizar AGPI, sintetizar un perfil de AGPI diferente o sintetizar un antibiótico específico). Según la presente invención, “una capacidad potenciada de sintetizar” un 35 producto se refiere a cualquier potenciación, o regulación por incremento, en una ruta relacionada con la síntesis del producto de manera que el microorganismo o la planta produce una cantidad aumentada del producto (incluyendo cualquier producción de un producto cuando antes no había ninguna) en comparación con el microorganismo o la planta de tipo natural, que se cultiva o se hace crecer en las mismas condiciones. Anteriormente se describieron en detalle métodos para producir tales organismos modificados genéticamente. En una realización preferida, la presente invención se refiere a una planta o parte de una planta modificada genéticamente (por ejemplo, en la que la planta se ha modificado genéticamente para expresar un sistema de PKS de AGPI, incluyendo un sistema de PKS de AGPI quimérico, descrito en el presente documento) que incluye al menos el complejo enzimático de PKS de AGPI central y, en una realización, al menos una proteína auxiliar de PKS de AGPI (por ejemplo, una PPTasa), de modo que la planta produce AGPI. Preferiblemente, la planta es una planta de semilla oleaginosa, en la que las

45 semillas oleaginosas o el aceite en las semillas oleaginosas contienen AGPI producidos por el sistema de PKS de AGPI. Tales aceites contienen una cantidad detectable de al menos un AGPI objetivo o principal que es el producto del sistema de PKS de AGPI.

Los presentes inventores han demostrado la producción de AGPI en una planta que se ha modificado genéticamente para expresar los genes que codifican para un sistema de PKS de AGPI de Schizochytrium y una enzima auxiliar de PKS de AGPI, 4’-fosfopanteteinil transferasa (PPTasa) (por ejemplo, véase la publicación de solicitud de patente estadounidense n.º 20070089199, citada anteriormente). Los aceites producidos por estas plantas contienen cantidades significativas tanto de DHA (ácido docosahexaenoico (C22:6, n-3)) como de DPA (ácido docosapentaenoico (C22:5, n-6), que son los AGPI predominantes (los AGPI primarios) producidos por el

55 Schizochytrium del que se derivaron los genes de PKS de AGPI. Significativamente, los aceites de plantas que producen AGPI usando la ruta de PKS de AGPI tienen un perfil de ácidos grasos diferente del de plantas que se modifican por ingeniería genética para producir los mismos AGPI mediante la ruta “habitual” descrita anteriormente. En particular, los aceites de plantas que se han modificado por ingeniería genética para producir AGPI específicos mediante la ruta de PKS de AGPI están sustancialmente libres de los diversos productos intermedios y secundarios que se acumulan en aceites que se producen como resultado del uso de la ruta de síntesis de AGPI habitual. Esta característica se comenta en detalle a continuación.

Más particularmente, esfuerzos para producir AGPI de cadena larga en plantas mediante la ruta “habitual” (descritos anteriormente) han adoptado el mismo enfoque básico, que viene dictado por esta ruta de síntesis. Estos esfuerzos 65 se basaron en la modificación de los ácidos grasos endógenos de las plantas mediante la introducción de genes que codificaban para diversas elongasas y desaturasas. Las plantas producen normalmente ácidos grasos de 18

carbonos (por ejemplo, ácido oleico, ácido linolénico, ácido linolénico) mediante la ácido graso sintasa de tipo II (FAS) en sus plástidos. A menudo, se forma un único doble enlace mientras el ácido graso está unido a ACP, y entonces se escinde el ácido oleico (18:1) de ACP mediante la acción de una acil-ACP tioesterasa. El ácido graso libre se exporta desde el plástido y se convierte en un acil-CoA. El ácido 18:1 puede esterificarse con fosfatidilcolina

5 (PC) y pueden añadirse hasta dos dobles enlaces cis más. Las elongasas recién introducidas pueden utilizar sustratos en la reserva de acil-CoA para añadir carbonos en incrementos de dos carbonos. Las desaturasas recién introducidas pueden utilizar o bien ácidos grasos esterificados con PC o bien aquéllos en la reserva de acil-CoA, dependiendo de la fuente de la enzima. Sin embargo, una consecuencia de este esquema para la producción de AGPI de cadena larga es que se acumulan productos intermedios o secundarios en la ruta, que a menudo representan la mayoría de los ácidos grasos novedosos en el aceite vegetal, en vez del AGPI de cadena larga objetivo.

Por ejemplo, usando la ruta habitual o clásica tal como se describió anteriormente, cuando el producto de AGPI objetivo (es decir, el producto de AGPI que es el objetivo de la producción, que se pretende producir, que se intenta 15 producir, usando la ruta habitual) es DHA o EPA, por ejemplo (por ejemplo, se produce usando elongasas y desaturasas que producirán el DHA o EPA a partir de los productos de los sistemas de FAS), se producirá una variedad de productos intermedios y productos secundarios además de DHA o EPA, y estos productos intermedios o secundarios representan con frecuencia la mayoría de los productos producidos por la ruta, o al menos están presentes en cantidades significativas en los lípidos del organismo de producción. Tales productos intermedios y secundarios incluyen, pero no se limitan a, ácidos grasos que tienen menos carbonos y/o menos dobles enlaces que el AGPI objetivo, o primario, y pueden incluir productos secundarios de ácido graso no habituales que pueden tener el mismo número de carbonos que el AGPI objetivo o primario, pero que pueden tener dobles enlaces en posiciones no habituales. A modo de ejemplo, en la producción de EPA usando la ruta habitual (por ejemplo, véase la publicación de solicitud de patente estadounidense 2004/0172682), aunque el AGPI objetivo de la ruta es EPA (es

25 decir, debido al uso de elongasas y desaturasas que actúan específicamente sobre los productos de los sistemas de FAS para producir EPA), los aceites producidos por el sistema incluyen una variedad de productos intermedios y secundarios incluyendo: ácido gamma-linolénico (GLA; 18:3, n-6); ácido estearidónico (STA o SDA; 18:4, n-3); ácido dihomo-gamma-linolénico (DGLA o HGLA; 20:3, n-6), ácido araquidónico (ARA, C20:4, n-6); ácido eicoesatrienoico (ETA; 20:3, n-9) y diversos otros productos intermedios o secundarios, tales como 20:0; 20:1 (Δ5); 20:1 (Δ11); 20:2 (Δ8,11); 20:2 (Δ11,14); 20:3 (Δ5,11,14); 20:3 (Δ11,14,17); ácido de Mead (20:3; Δ5,8,11); o 20:4 (Δ5,1,14,17). Los productos intermedios del sistema también pueden incluir AGPI de cadena larga que no son el objetivo de la modificación genética (por ejemplo, un sistema enzimático de ruta habitual para producir DHA puede producir realmente más EPA como producto intermedio que DHA).

35 En cambio, la sintasa PKS de AGPI de la presente invención no utiliza los productos de ácidos grasos de sistemas de FAS. En vez de eso, produce el producto de AGPI final (el producto de AGPI primario) a partir de la misma molécula precursora pequeña que se utiliza por FAS y elongasas (malonil-CoA). Por tanto, no se liberan productos intermedios en el ciclo de síntesis en ninguna cantidad significativa, y el producto de AGPI (también denominado en el presente documento producto de AGPI primario) se transfiere eficientemente a fracciones de fosfolípidos (PL) y triacilglicerol (TAG) de los lípidos. En efecto, un sistema de PKS de AGPI puede producir dos productos de AGPI objetivo o primarios (por ejemplo, el sistema de PKS de AGPI de Schizochytrium produce tanto DHA como DPAn-6 como productos primarios), pero DPA no es un producto intermedio en la ruta para producir DHA. En vez de eso, cada uno es un producto separado del mismo sistema de PKS de AGPI. Por tanto, los genes de PKS de AGPI de la presente invención son un medio excelente de producción de aceites que contienen AGPI, y particularmente,

45 AGPICL en un huésped heterólogo, tal como una planta, en el que los aceites están sustancialmente libres (definido a continuación) de los productos intermedios y productos secundarios que contaminan los aceites producidos por la ruta de AGPI “habitual”.

Por tanto, un objeto de la presente invención es producir, mediante manipulación genética de plantas tal como se describe en el presente documento, ácidos grasos poliinsaturados y, por extensión, aceites obtenidos a partir de tales plantas (por ejemplo, obtenidos a partir de las semillas oleaginosas de tales plantas) que comprenden estos AGPI. Los ejemplos de los AGPI que puede producirse por la presente invención incluyen, pero no se limitan a, DHA (ácido docosahexaenoico (C22:6, n-3)), ARA (ácido eicosatetraenoico o ácido araquidónico (C20:4, n-6)), DPA (ácido docosapentaenoico (C22:5, n-6 o n-3)) y EPA (ácido eicosapentaenoico (C20:5, n-3)). La presente invención

55 permite la producción de lípidos comercialmente valiosos enriquecidos en uno o más AGPI deseados (objetivos o primarios) mediante el desarrollo de los presentes inventores de plantas modificadas genéticamente mediante el uso del sistema de policétido sintasa de la presente invención, así como componentes del mismo, que produce AGPI.

Según la presente invención, la referencia a un “AGPI primario”, “AGPI objetivo”, “AGPI pretendido” o “AGPI deseado” se refiere al AGPI o a los AGPI particulares que son el producto pretendido u objetivo de la ruta enzimática que se usa para producir el/los AGPI. Por ejemplo, cuando se usan elongasas y desaturasas para modificar productos de los sistemas de FAS, pueden seleccionarse combinaciones particulares de elongasas y desaturasas que, cuando se usan juntas, producirán un AGPI objetivo o deseado (por ejemplo, DHA o EPA). Tal como se comentó anteriormente, tal AGPI objetivo o deseado producido por la ruta habitual puede no ser realmente un AGPI 65 “primario” en cuanto a la cantidad de AGPI como porcentaje de ácidos grasos totales producidos por el sistema, debido a la formación de productos intermedios y secundarios que pueden representar realmente la mayoría de los

productos producidos por el sistema. Sin embargo, puede usarse el término “AGPI primario” incluso en ese caso para hacer referencia al producto de AGPI objetivo o pretendido producido por las elongasas o desaturasas usadas en el sistema.

5 Cuando se usa un sistema de PKS de AGPI tal como se prefiere en la presente invención, un sistema de PKS de AGPI dado derivado de un organismo particular producirá AGPI particular(es), de manera que la selección de un sistema de PKS de AGPI de un organismo particular dará como resultado la producción de AGPI objetivo o primarios especificados. Por ejemplo, el uso de un sistema de PKS de AGPI de Schizochytrium dará como resultado la producción de DHA y DPAn-6 como AGPI objetivo o primarios. Por otro lado, el uso de un sistema de PKS de AGPI de diversas especies de Shewanella dará como resultado la producción de EPA como AGPI objetivo o primario. Se observa que la razón de los AGPI objetivo o primarios puede diferir dependiendo de la selección del sistema de PKS de AGPI particular y de cómo responde ese sistema a las condiciones específicas en las que se expresa. Por ejemplo, el uso de un sistema de PKS de AGPI de Thraustochytrium 23B (ATCC n.º 20892) también dará como resultado la producción de DHA y DPAn-6 como AGPI objetivo o primarios; sin embargo, en el caso de

15 Thraustochytrium 23B, la razón de DHA con respecto a DPAn-6 es de aproximadamente 10:1 (y puede oscilar entre aproximadamente 8:1 y aproximadamente 40:1), mientras que en Schizochytrium, normalmente la razón es de aproximadamente 2,5:1. Por tanto, el uso de un sistema o proteínas o dominios PKS de AGPI de Thraustochytrium puede alterar la razón de AGPI producidos por un organismo en comparación con Schizochytrium incluso aunque los AGPI objetivo sean los mismos. Sin embargo, tal como se detalló anteriormente, el uso de diversas proteínas y dominios con proteínas y dominios de otros sistemas de PKS de AGPI u otros sistemas de PKS (que producen moléculas bioactivas distintas de AGPI) puede combinarse (“mezclarse y hacerse corresponder”) para producir proteínas quiméricas y/o sistemas de PKS de AGPI quiméricos (descritos anteriormente), dando como resultado la producción de perfiles de AGPI diferentes, incluyendo tipos de AGPI, cantidades y/o razones de un AGPI con respecto a otro diferentes.

25 Cuando se usa un sistema de PKS de AGPI de la presente invención, los aceites producidos por el organismo, tal como una planta, están sustancialmente libres de productos intermedios o secundarios que no son los productos de AGPI objetivo o primarios y que no se producen de manera natural por el sistema de FAS endógeno en el organismo de tipo natural (por ejemplo, las plantas de tipo natural producen algunos AGPI de cadena más corta o media, tales como AGPI de 18 carbonos, mediante los sistemas de FAS, pero se producirán ácidos grasos nuevos, o adicionales, en la planta como resultado de la modificación genética con un sistema de PKS de AGPI). En otras palabras, en comparación con el perfil de ácidos grasos totales de la planta de tipo natural (no modificada genéticamente) o la planta original usada como receptor de la modificación genética indicada, la mayoría de los ácidos grasos adicionales en el perfil de ácidos grasos totales producidos por plantas que se han modificado genéticamente con el

35 sistema de PKS de AGPI de la presente invención (o un componente del mismo) comprenden los productos de AGPI objetivo o pretendidos del sistema de PKS de AGPI (es decir, la mayoría de los ácidos grasos adicionales en los ácidos grasos totales que se producen por la planta modificada genéticamente son el/los AGPI objetivo).

Según la presente invención, la referencia a “productos intermedios” o “productos secundarios” de un sistema enzimático que produce AGPI se refiere a cualquier producto, y particularmente, producto de ácidos grasos, que se produce por el sistema enzimático como resultado de la producción del/de los AGPI objetivo o primario(s) del sistema, pero que no son el/los AGPI primario(s) u objetivo. En una realización, los productos intermedios y secundarios pueden incluir ácidos grasos no objetivo que se producen de manera natural por la planta de tipo natural o por la planta original usada como receptor para la modificación genética indicada, pero ahora se clasifican 45 como productos intermedios o secundarios porque se producen en niveles superiores como resultado de la modificación genética, en comparación con los niveles producidos por la planta de tipo natural o por la planta original usada como receptor para la modificación genética indicada. Los productos intermedios y secundarios son particularmente significativos en la ruta habitual para la síntesis de AGPI y son sustancialmente menos significativos en la ruta de PKS de AGPI, tal como se comentó anteriormente. Se observa que un AGPI primario u objetivo de un sistema enzimático puede ser un producto intermedio de un sistema enzimático diferente en el que el producto primario u objetivo es un AGPI diferente, y esto es particularmente cierto para productos de la ruta habitual de producción de AGPI, ya que el sistema de PKS de AGPI evita sustancialmente la producción de productos intermedios. Por ejemplo, cuando se usa la ruta habitual para producir EPA, se producen ácidos grasos tales como GLA, DGLA y SDA como productos intermedios en cantidades significativas (por ejemplo, la publicación de solicitud

55 de patente estadounidense 2004/0172682 ilustra este punto). De manera similar, y también ilustrado por la publicación de solicitud de patente estadounidense 2004/0172682, cuando se usa la ruta habitual para producir DHA, además de los ácidos grasos mencionados anteriormente, se producen ETA y EPA (de manera notable, el AGPI objetivo en el primer ejemplo anterior) en cantidades significativas y de hecho, pueden estar presentes en cantidades significativamente superiores con respecto al producto de ácidos grasos totales al propio AGPI objetivo. Este último punto también se muestra en la publicación de solicitud de patente estadounidense 2004/0172682, en la que una planta que se modificó por ingeniería genética para producir DHA por la ruta habitual produce más EPA como porcentaje de ácidos grasos totales que el DHA objetivo.

Además, estar “sustancialmente libre” de productos intermedios o secundarios del sistema para sintetizar AGPI, o no

65 tener productos intermedios o secundarios presentes en cantidades sustanciales, significa que cualquier ácido graso como producto intermedio o secundario (AGPI no objetivo) que se produce en la planta (y/o partes de plantas y/o fracción de aceite de semilla) modificada genéticamente como resultado de la introducción o presencia del sistema enzimático para producir AGPI (es decir, que no se producen por la planta de tipo natural o la planta original usada como receptor para la modificación genética indicada), están presentes en una cantidad que es de menos de aproximadamente el 10% en peso de los ácidos grasos totales producidos por la planta, y más preferiblemente

5 menos de aproximadamente el 9%, y más preferiblemente menos de aproximadamente el 8%, y más preferiblemente menos de aproximadamente el 7%, y más preferiblemente menos de aproximadamente el 6%, y más preferiblemente menos de aproximadamente el 5%, y más preferiblemente menos de aproximadamente el 4%, y más preferiblemente menos de aproximadamente el 3%, y más preferiblemente menos de aproximadamente el 2%, y más preferiblemente menos de aproximadamente el 1% en peso de los ácidos grasos totales producidos por la planta, y más preferiblemente menos de aproximadamente el 0,5% en peso de los ácidos grasos totales producidos por la planta.

En una realización preferida, estar “sustancialmente libre” de productos intermedios o secundarios del sistema para sintetizar AGPI, o no tener productos intermedios o secundarios presentes en cantidades sustanciales, significa que 15 cualquier ácido graso como producto intermedio o secundario que se produce en la planta (y/o partes de plantas y/o en fracción de aceite de semilla) modificada genéticamente como resultado del sistema enzimático para producir los AGPI (es decir, que no se producen por la planta de tipo natural o por la planta original usada como receptor para la modificación genética indicada para la producción de AGPI objetivo), están presentes en una cantidad que es de menos de aproximadamente el 10% en peso de los ácidos grasos adicionales totales producidos por la planta (definiéndose los ácidos grasos adicionales como aquellos ácidos grasos o niveles de ácidos grasos que no se producen de manera natural por la planta de tipo natural o por la planta original que se usa como receptor para la modificación genética indicada para la producción de AGPI objetivo), y más preferiblemente menos de aproximadamente el 9%, y más preferiblemente menos de aproximadamente el 8%, y más preferiblemente menos de aproximadamente el 7%, y más preferiblemente menos de aproximadamente el 6%, y más preferiblemente

25 menos de aproximadamente el 5%, y más preferiblemente menos de aproximadamente el 4%, y más preferiblemente menos de aproximadamente el 3%, y más preferiblemente menos de aproximadamente el 2%, y más preferiblemente menos de aproximadamente el 1% de los ácidos grasos adicionales totales producidos por la planta. Por tanto, al contrario que el perfil de ácidos grasos de plantas que se han modificado genéticamente para producir AGPI mediante la ruta habitual, la mayoría de los productos de ácidos grasos resultantes de la modificación genética con un sistema de PKS de AGPI serán los productos de ácidos grasos objetivo o pretendidos.

Cuando el producto objetivo de un sistema de PKS de AGPI es un AGPI de cadena larga, tal como DHA o DPA (n-6

o n-3) producido por el sistema de PKS de AGPI de la invención descrito en el presente documento, los productos intermedios y productos secundarios que no están presentes en cantidades sustanciales en los lípidos totales de 35 plantas modificadas genéticamente con tal PKS de AGPI pueden incluir, pero no se limitan a: ácido gammalinolénico (GLA; 18:3, n-6); ácido estearidónico (STA o SDA; 18:4, n-3); ácido dihomo-gamma-linolénico (DGLA o HGLA; 20:3, n-6), ácido araquidónico (ARA, C20:4, n-6); ácido eicosatrienoico (ETA; 20:3, n-9) y diversos otros productos intermedios o secundarios, tales como 20:0; 20:1 (Δ5); 20:1 (Δ11); 20:2 (Δ8,11); 20:2 (Δ11,14); 20:3 (Δ5,11,14); 20:3 (Δ11,14,17); ácido de Mead (20:3; Δ5,8,11); o 20:4 (Δ5,1,14,17). Además, cuando el producto objetivo es un AGPI particular, tal como DHA, los productos intermedios y productos secundarios que no están presentes en cantidades sustanciales en los lípidos totales de las plantas modificadas genéticamente también incluyen otros AGPI, incluyendo otros AGPI que son un producto natural de un sistema de PKS de AGPI diferente, tal como EPA en este ejemplo. En algunos sistemas, un sistema de PKS de AGPI puede producir más de un AGPI, tal como tanto un AGPI C22 como uno C20, y tales combinaciones de AGPI pueden representar el producto objetivo,

45 mientras que otros AGPI pueden representar productos intermedios o secundarios. Debe observarse que el sistema de PKS de AGPI de la presente invención también puede usarse, si se desea, para producir como AGPI objetivo un AGPI que puede incluir GLA, SDA o DGLA (haciendo referencia a realizaciones en las que se producen aceites usando componentes de un sistema de PKS de AGPI descrito en el presente documento).

Usando el conocimiento de la base genética y la estructura de dominios del sistema de PKS de AGPI descrito en el presente documento, los presentes inventores han diseñado y producido constructos que codifican para un sistema de PKS de AGPI de este tipo y han producido satisfactoriamente plantas transgénicas que expresan el sistema de PKS de AGPI. Las plantas transgénicas producen aceites que contienen AGPI, y los aceites están sustancialmente libres de productos intermedios que se acumulan en una ruta de AGPI habitual (véase la publicación de solicitud de

55 patente estadounidense n.º 20070089199, citada anteriormente). Los presentes inventores también han demostrado el uso de los constructos para producir AGPI en E. coli, y también en otro eucariota, la levadura, como experimento de prueba de concepto antes de la producción de las plantas transgénicas (publicación de solicitud de patente estadounidense n.º 20070089199, citada anteriormente). Los ejemplos demuestran que la transformación tanto de levadura como de plantas con un sistema de PKS de AGPI que produce DHA y DPAn-6 como los AGPI objetivo produce ambos de estos AGPI como ácidos grasos adicionales primarios en los ácidos grasos totales de la planta (es decir, restando los ácidos grasos que se producen en la planta de tipo natural), y en la levadura y, además, que cualquier otro ácido graso que no está presente en los ácidos grasos de la planta de tipo natural son prácticamente indetectables. En otra parte en el presente documento se describen en detalle características específicas de plantas modificadas genéticamente y partes y aceites de las mismas de la presente invención.

65 Por consiguiente, se describe un método para producir moléculas bioactivas deseadas (también denominadas productos o compuestos) haciendo crecer o cultivando un microorganismo modificado genéticamente o una planta modificada genéticamente de la presente invención (descrito en detalle anteriormente). Tal método incluye la etapa de cultivar en un medio de crecimiento o fermentación o hacer crecer en un entorno adecuado, tal como tierra, un microorganismo o una planta, respectivamente, que tiene una modificación genética tal como se describió

5 anteriormente en el presente documento y según la presente invención. En una realización preferida, el método para producir moléculas bioactivas incluye la etapa de cultivar, en condiciones eficaces para producir la molécula bioactiva, un organismo modificado genéticamente que expresa un sistema de PKS que comprende al menos un dominio biológicamente activo de un sistema de policétido sintasa (PKS) de ácidos grasos poliinsaturados (AGPI) tal como se describe en el presente documento.

En el método de producción de compuestos bioactivos deseados, se cultiva o se hace crecer un microorganismo modificado genéticamente en un medio adecuado, en condiciones eficaces para producir el compuesto bioactivo. Un medio apropiado, o eficaz, se refiere a cualquier medio en el que un microorganismo modificado genéticamente de la presente invención, cuando se cultiva, puede producir el producto deseado. Tal medio es normalmente un medio 15 acuoso que comprende fuentes de carbono, nitrógeno y fosfato asimilables. Tal medio también puede incluir sales, minerales, metales y otros nutrientes apropiados. Los microorganismos de la presente invención pueden cultivarse en biorreactores de fermentación convencionales. Los microorganismos pueden cultivarse mediante cualquier procedimiento de fermentación incluyendo, pero sin limitarse a, fermentación discontinua, semicontinua, con recirculación de células y continua. Las condiciones de crecimiento preferidas para posibles microorganismos huésped según la presente invención se conocen bien en la técnica. Las moléculas bioactivas deseadas producidas por el microorganismo modificado genéticamente pueden recuperarse del medio de fermentación usando técnicas de separación y purificación convencionales. Por ejemplo, puede filtrarse o centrifugarse el medio de fermentación para eliminar microorganismos, residuos celulares y otra materia particulada, y puede recuperarse el producto a partir del sobrenadante libre de células mediante métodos convencionales, tales como, por ejemplo, intercambio

25 iónico, cromatografía, extracción, extracción con disolventes, separación por membrana, electrodiálisis, ósmosis inversa, destilación, derivatización química y cristalización. Alternativamente, pueden usarse microorganismos que producen el compuesto deseado, o extractos y diversas fracciones del mismo, sin eliminar los componentes del microorganismo del producto.

En el método para la producción de compuestos bioactivos deseados, se cultiva una planta modificada genéticamente o parte de la planta (incluyendo una célula de planta) en un medio de crecimiento o se hace crecer en un medio adecuado tal como tierra, según sea apropiado. Anteriormente se comentó en detalle un medio de crecimiento o de cultivo apropiado, o eficaz. Un medio de crecimiento adecuado para plantas superiores incluye cualquier medio de crecimiento para plantas, incluyendo, pero sin limitarse a, tierra, arena, cualquier otro medio

35 particulado que soporte el crecimiento de raíces (por ejemplo vermiculita, perlita, etc.) o cultivo hidropónico, así como luz, agua y complementos nutricionales adecuados que optimizan el crecimiento de la planta superior. Las plantas modificadas genéticamente de la presente invención se modifican por ingeniería genética para producir cantidades significativas del producto deseado mediante la actividad del sistema de PKS de AGPI que se modifica genéticamente según la presente invención. Los compuestos pueden recuperarse mediante procedimientos de purificación que extraen los compuestos de la planta. En una realización preferida, el compuesto se recupera cosechando la planta. En una realización particularmente preferida, se recuperan AGPI de la planta o parte de la planta cosechando el aceite de la planta o parte de la planta (por ejemplo, de las semillas oleaginosas). En esta realización, la planta puede consumirse en su estado natural o procesarse adicionalmente para obtener productos consumibles.

45 Las moléculas bioactivas, según la presente invención, incluyen cualquier molécula (compuesto, producto, etc.) que tiene una actividad biológica, y que puede producirse por un sistema de PKS que comprende al menos una secuencia de aminoácidos que tiene una actividad biológica de al menos un dominio funcional de un sistema de PKS de AGPI no bacteriano tal como se describe en el presente documento. Tales moléculas bioactivas pueden incluir, pero no se limitan a: un ácido graso poliinsaturado (AGPI), una formulación antiinflamatoria, un agente quimioterápico, un excipiente activo, un fármaco para la osteoporosis, un antidepresivo, un anticonvulsivo, un fármaco anti-Helicobacter pylori, un fármaco para el tratamiento de una enfermedad neurodegenerativa, un fármaco para el tratamiento de una enfermedad hepática degenerativa, un antibiótico y una formulación hipocolesterolemiante. Una ventaja del sistema de PKS de AGPI no bacteriano de la presente invención es la

55 capacidad de tal sistema de introducir dobles enlaces carbono-carbono en la configuración cis, y moléculas que incluyen un doble enlace cada tres carbonos. Esta capacidad puede utilizarse para producir una variedad de compuestos.

Con respecto a microorganismos, preferiblemente, se producen compuestos bioactivos de interés por el microorganismo modificado genéticamente en una cantidad que es de más de aproximadamente el 0,05%, y preferiblemente más de aproximadamente el 0,1%, y más preferiblemente más de aproximadamente el 0,25%, y más preferiblemente más de aproximadamente el 0,5%, y más preferiblemente más de aproximadamente el 0,75%, y más preferiblemente más de aproximadamente el 1%, y más preferiblemente más de aproximadamente el 2,5%, y más preferiblemente más de aproximadamente el 5%, y más preferiblemente más de aproximadamente el 10%, y 65 más preferiblemente más de aproximadamente el 15%, e incluso más preferiblemente más de aproximadamente el 20% del peso seco del microorganismo. Para compuestos lipídicos, preferiblemente, tales compuestos se producen

en una cantidad que es de más de aproximadamente el 5% del peso seco del microorganismo. Otros compuestos bioactivos, tales como antibióticos o compuestos que se sintetizan en cantidades más pequeñas, pueden producirse en cantidades conocidas por los expertos en la técnica, y las cepas que presentan tales compuestos se identifican como que contienen de manera predecible un sistema de PKS novedoso del tipo descrito en el presente documento.

5 En algunas realizaciones, el microorganismo secreta moléculas (compuestos) bioactivas particulares, en vez de acumularlas en las células. Por tanto, tales moléculas bioactivas se recuperan generalmente del medio de cultivo y la concentración de la molécula producida variará dependiendo del microorganismo y del tamaño del cultivo, y puede medirse en g/l, en vez de en peso celular seco.

10 Preferiblemente, un organismo modificado genéticamente (por ejemplo, microorganismo o planta) de la invención produce uno o más ácidos grasos poliinsaturados incluyendo, pero sin limitarse a, EPA (C20:5, n-3), DHA (C22:6, n3), DPA (C22:5, n-6 o n-3), ARA (C20:4, n-6), GLA (C18:3, n-6), ALA (C18:3, n-3) y/o SDA (C18:4, n-3)), y más preferiblemente, uno o más ácidos grasos de cadena larga (AGPICL), incluyendo, pero sin limitarse a, EPA (C20:5,

15 n-3), DHA (C22:6, n-3), DPA (C22:5, n-6 o n-3) o DTA (C22:4, n-6). En una realización particularmente preferida, un organismo modificado genéticamente de la invención produce uno o más ácidos grasos poliinsaturados incluyendo, pero sin limitarse a, EPA (C20:5, n-3), DHA (C22:6, n-3) y/o DPA (C22:5, n-6 o n-3).

Preferiblemente, un organismo modificado genéticamente de la invención produce al menos un AGPI (el AGPI

20 objetivo), en el que el perfil de ácidos grasos totales en el organismo (o una parte del organismo que acumula AGPI, tal como semillas maduras o aceite de tales semillas, si el organismo es una planta de semillas oleaginosas), comprende una cantidad detectable de este AGPI o estos AGPI. Preferiblemente, el AGPI es un AGPI de al menos 20 carbonos y comprende al menos 3 dobles enlaces, y más preferiblemente al menos 4 dobles enlaces, e incluso más preferiblemente, al menos 5 dobles enlaces. En una realización, el AGPI es un AGPI que no se produce de

25 manera natural por el organismo en cantidades detectables o significativas (por ejemplo, el organismo de tipo natural en ausencia de la modificación genética o el organismo original usado como receptor para la modificación genética indicada).

Preferiblemente, el perfil de ácidos grasos totales en el organismo (o parte del organismo que acumula AGPI)

30 comprende al menos el 0,1% del/de los AGPI objetivo en peso de los ácidos grasos totales, y más preferiblemente al menos aproximadamente el 0,2%, y más preferiblemente al menos aproximadamente el 0,3%, y más preferiblemente al menos aproximadamente el 0,4%, y más preferiblemente al menos aproximadamente el 0,5%, y más preferiblemente al menos aproximadamente el 1%, y más preferiblemente al menos aproximadamente el 2%, y más preferiblemente al menos aproximadamente el 3%, y más preferiblemente al menos aproximadamente el 4%, y

35 más preferiblemente al menos aproximadamente el 5%, y más preferiblemente al menos aproximadamente el 10%, y más preferiblemente al menos aproximadamente el 15%, y más preferiblemente al menos aproximadamente el 20%, y más preferiblemente al menos aproximadamente el 25%, y más preferiblemente al menos aproximadamente el 30%, y más preferiblemente al menos aproximadamente el 35%, y más preferiblemente al menos aproximadamente el 40%, y más preferiblemente al menos aproximadamente el 45%, y más preferiblemente al

40 menos aproximadamente el 50%, y más preferiblemente al menos aproximadamente el 55%, y más preferiblemente al menos aproximadamente el 60%, y más preferiblemente al menos aproximadamente el 65%, y más preferiblemente al menos aproximadamente el 70%, y más preferiblemente al menos aproximadamente el 75%, y más preferiblemente más del 75% de al menos un ácido graso poliinsaturado (el AGPI objetivo) en peso de los ácidos grasos totales, o cualquier porcentaje desde el 0,1% hasta el 75%, o superior al 75% (hasta el 100% o

45 aproximadamente el 100%), en incrementos del 0,1%, del/de los AGPI objetivo. Tal como se usa generalmente en el presente documento, la referencia a una cantidad en porcentaje de producción de AGPI es en peso de los ácidos grasos totales producidos por el organismo, a menos que se mencione lo contrario (por ejemplo, en algunos casos, el porcentaje en peso es con respecto a los ácidos grasos totales producidos por un complejo enzimático, tal como un sistema de PKS de AGPI). En una realización, los ácidos grasos totales producidos por una planta se presentan

50 como porcentaje en peso tal como se determina mediante análisis por cromatografía de gases (CG) de una preparación de ésteres metílicos de ácidos grasos (EMAG).

Tal como se describió anteriormente, una característica adicional de los ácidos grasos totales producidos por la planta descrita anteriormente (y/o partes de plantas o fracción de aceite de semilla) es que estos ácidos grasos 55 totales producidos por la planta comprenden menos de (o no contienen más de) aproximadamente el 10% en peso de cualquier ácido graso distinto del/de los AGPI objetivo que se produce(n) por el complejo enzimático que produce el/los AGPI objetivo. Preferiblemente, cualquier ácido graso que se produce por el complejo enzimático que produce el/los AGPI objetivo (por ejemplo, como resultado de la modificación genética de la planta con la enzima o el complejo enzimático que produce el/los AGPI objetivo), distinto del/de los AGPI objetivo, está presente a menos de 60 aproximadamente el 9%, y más preferiblemente menos de aproximadamente el 8%, y más preferiblemente menos de aproximadamente el 7%, y más preferiblemente menos de aproximadamente el 6%, y más preferiblemente menos de aproximadamente el 5%, y más preferiblemente menos de aproximadamente el 4%, y más preferiblemente menos de aproximadamente el 3%, y más preferiblemente menos de aproximadamente el 2%, y más preferiblemente menos de aproximadamente el 1% en peso de los ácidos grasos totales producidos por la

65 planta.

En otra realización, cualquier ácido graso que se produce por el complejo enzimático que produce el/los AGPI objetivo distinto del/de los AGPI objetivo está presente a menos de (o no contiene más de) aproximadamente el 10% en peso de los ácidos grasos totales que se producen por el complejo enzimático que produce el/los AGPI objetivo en la planta (es decir, esta medida se limita a aquellos ácidos grasos totales que se producen por el complejo

5 enzimático que produce los AGPI objetivo), y más preferiblemente menos de aproximadamente el 9%, y más preferiblemente menos de aproximadamente el 8%, y más preferiblemente menos de aproximadamente el 7%, y más preferiblemente menos de aproximadamente el 6%, y más preferiblemente menos de aproximadamente el 5%, y más preferiblemente menos de aproximadamente el 4%, y más preferiblemente menos de aproximadamente el 3%, y más preferiblemente menos de aproximadamente el 2%, y más preferiblemente menos de aproximadamente el 1% en peso de los ácidos grasos totales, y más preferiblemente menos de aproximadamente el 0,5% en peso de los ácidos grasos totales que se producen por el complejo enzimático que produce el/los AGPI objetivo en la planta.

En otro aspecto de esta realización de la invención, los ácidos grasos totales producidos por la planta (y/o partes de plantas o fracción de aceite de semilla) contienen menos del (o no contienen más del) 10% de AGPI que tienen 18 o 15 más carbonos en peso de los ácidos grasos totales producidos por la planta, distintos del/de los AGPI objetivo o de los AGPI que están presentes en la planta de tipo natural (no modificada genéticamente) o en la planta original usada como receptor para la modificación genética indicada (inicial o secuencial). En aspectos adicionales, los ácidos grasos totales producidos por la planta (y/o partes de plantas o fracción de aceite de semilla) contienen menos del 9% de AGPI que tienen 18 o más carbonos, o menos del 8% de AGPI que tienen 18 o más carbonos, o menos del 7% de AGPI que tienen 18 o más carbonos, o menos del 6% de AGPI que tienen 18 o más carbonos, o menos del 5% de AGPI que tienen 18 o más carbonos, o menos del 4% de AGPI que tienen 18 o más carbonos, o menos del 3% de AGPI que tienen 18 o más carbonos, o menos del 2% de AGPI que tienen 18 o más carbonos, o menos del 1% de AGPI que tienen 18 o más carbonos en peso de los ácidos grasos totales producidos por la planta, distintos del/de los AGPI objetivo o de los AGPI que están presentes en la planta de tipo natural (no modificada

25 genéticamente) o la planta original usada como receptor para la modificación genética indicada.

En otro aspecto de esta realización de la invención, los ácidos grasos totales producidos por la planta (y/o partes de plantas o fracción de aceite de semilla) contienen menos del (o no contienen más del) 10% de AGPI que tienen 20 o más carbonos en peso de los ácidos grasos totales producidos por la planta, distintos del/de los AGPI objetivo o de los AGPI que están presentes en la planta de tipo natural (no modificada genéticamente) o la planta original usada como receptor para la modificación genética indicada (inicial o secuencial). En aspectos adicionales, los ácidos grasos totales producidos por la planta (y/o partes de plantas o fracción de aceite de semilla) contienen menos del 9% de AGPI que tienen 20 o más carbonos, o menos del 8% de AGPI que tienen 20 o más carbonos, o menos del 7% de AGPI que tienen 20 o más carbonos, o menos del 6% de AGPI que tienen 20 o más carbonos, o menos del

35 5% de AGPI que tienen 20 o más carbonos, o menos del 4% de AGPI que tienen 20 o más carbonos, o menos del 3% de AGPI que tienen 20 o más carbonos, o menos del 2% de AGPI que tienen 20 o más carbonos, o menos del 1% de AGPI que tienen 20 o más carbonos en peso de los ácidos grasos totales producidos por la planta, distintos del/de los AGPI objetivo o de los AGPI que están presentes en la planta de tipo natural (no modificada genéticamente) o la planta original usada como receptor para la modificación genética indicada.

En una realización, los ácidos grasos totales en la planta (y/o partes de plantas o fracción de aceite de semilla) contienen menos de aproximadamente el 10% en peso de los ácidos grasos totales producidos por la planta, y más preferiblemente menos de aproximadamente el 9%, y más preferiblemente menos de aproximadamente el 8%, y más preferiblemente menos de aproximadamente el 7%, y más preferiblemente menos de aproximadamente el 6%, 45 y más preferiblemente menos de aproximadamente el 5%, y más preferiblemente menos de aproximadamente el 4%, y más preferiblemente menos de aproximadamente el 3%, y más preferiblemente menos de aproximadamente el 2%, y más preferiblemente menos de aproximadamente el 1% de un ácido graso seleccionado de uno cualquiera

o más de: ácido gamma-linolénico (GLA; 18:3, n-6); ácido estearidónico (STA o SDA; 18:4, n-3); ácido dihomogamma-linolénico (DGLA o HGLA; 20:3, n-6), ácido araquidónico (ARA, C20:4, n-6); ácido eicosatrienoico (ETA; 20:3, n-9) y diversos otros ácidos grasos, tales como 20:0; 20:1 (Δ5); 20:1 (Δ11); 20:2 (Δ8,11); 20:2 (Δ11,14); 20:3 (Δ5,11,14); 20:3 (Δ11,14,17); ácido de Mead (20:3; Δ5,8,11); o 20:4 (Δ5,1,14,17).

En otra realización, los ácidos grasos que se producen por el sistema enzimático que produce los AGPI de cadena larga en la planta contienen menos de aproximadamente el 10% en peso de un ácido graso seleccionado de: ácido 55 gamma-linolénico (GLA; 18:3, n-6); ácido estearidónico (STA o SDA; 18:4, n-3); ácido dihomo-gamma-linolénico (DGLA o HGLA; 20:3, n-6), ácido araquidónico (ARA, C20:4, n-6); ácido eicosatrienoico (ETA; 20:3, n-9) y diversos otros ácidos grasos, tales como 20:0; 20:1 (Δ5); 20:1 (Δ11); 20:2 (Δ8,11); 20:2 (Δ11,14); 20:3 (Δ5,11,14); 20:3 (Δ11,14,17); ácido de Mead (20:3; Δ5,8,11); o 20:4 (Δ5,1,14,17), como porcentaje de los ácidos grasos totales producidos por la planta, y más preferiblemente menos de aproximadamente el 9%, y más preferiblemente menos de aproximadamente el 8%, y más preferiblemente menos de aproximadamente el 7%, y más preferiblemente menos de aproximadamente el 6%, y más preferiblemente menos de aproximadamente el 5%, y más preferiblemente menos de aproximadamente el 4%, y más preferiblemente menos de aproximadamente el 3%, y más preferiblemente menos de aproximadamente el 2%, y más preferiblemente menos de aproximadamente el 1% de un ácido graso seleccionado de: ácido gamma-linolénico (GLA; 18:3, n-6); ácido estearidónico (STA o SDA; 18:4, 65 n-3); ácido dihomo-gamma-linolénico (DGLA o HGLA; 20:3, n-6), ácido araquidónico (ARA, C20:4, n-6); ácido

eicosatrienoico (ETA; 20:3, n-9) y diversos otros ácidos grasos, tales como 20:0; 20:1 (Δ5); 20:1 (Δ11); 20:2 (Δ8,11);

20:2 (Δ11,14); 20:3 (Δ5,11,14); 20:3 (Δ11,14,17); ácido de Mead (20:3; Δ5,8,11); o 20:4 (Δ5,1,14,17).

En otra realización, los ácidos grasos que se producen por el sistema enzimático que produce los AGPI de cadena

5 larga en la planta contienen menos de aproximadamente el 10% en peso de todos de los siguientes AGPI: ácido gamma-linolénico (GLA; 18:3, n-6), AGPI que tienen 18 carbonos y cuatro dobles enlaces carbono-carbono, AGPI que tienen 20 carbonos y tres dobles enlaces carbono-carbono, y AGPI que tienen 22 carbonos y dos o tres dobles enlaces carbono-carbono, como porcentaje de los ácidos grasos totales producidos por la planta, y más preferiblemente menos de aproximadamente el 9%, y más preferiblemente menos de aproximadamente el 8%, y más preferiblemente menos de aproximadamente el 7%, y más preferiblemente menos de aproximadamente el 6%, y más preferiblemente menos de aproximadamente el 5%, y más preferiblemente menos de aproximadamente el 4%, y más preferiblemente menos de aproximadamente el 3%, y más preferiblemente menos de aproximadamente el 2%, y más preferiblemente menos de aproximadamente el 1% de todos de los siguientes AGPI: ácido gammalinolénico (GLA; 18:3, n-6), AGPI que tienen 18 carbonos y cuatro dobles enlaces carbono-carbono, AGPI que tienen

15 20 carbonos y tres dobles enlaces carbono-carbono, y AGPI que tienen 22 carbonos y dos o tres dobles enlaces carbono-carbono.

En otra realización, los ácidos grasos que se producen por el sistema enzimático que produce los AGPI de cadena larga en la planta contienen menos de aproximadamente el 10% en peso de cada uno de los siguientes AGPI: ácido gamma-linolénico (GLA; 18:3, n-6), AGPI que tienen 18 carbonos y cuatro dobles enlaces carbono-carbono, AGPI que tienen 20 carbonos y tres dobles enlaces carbono-carbono, y AGPI que tienen 22 carbonos y dos o tres dobles enlaces carbono-carbono, como porcentaje de los ácidos grasos totales producidos por la planta, y más preferiblemente menos de aproximadamente el 9%, y más preferiblemente menos de aproximadamente el 8%, y más preferiblemente menos de aproximadamente el 7%, y más preferiblemente menos de aproximadamente el 6%,

25 y más preferiblemente menos de aproximadamente el 5%, y más preferiblemente menos de aproximadamente el 4%, y más preferiblemente menos de aproximadamente el 3%, y más preferiblemente menos de aproximadamente el 2%, y más preferiblemente menos de aproximadamente el 1% de cada uno de los siguientes AGPI: ácido gammalinolénico (GLA; 18:3, n-6), AGPI que tienen 18 carbonos y cuatro dobles enlaces carbono-carbono, AGPI que tienen 20 carbonos y tres dobles enlaces carbono-carbono, y AGPI que tienen 22 carbonos y dos o tres dobles enlaces carbono-carbono.

En otra realización, los ácidos grasos que se producen por el sistema enzimático que produce los AGPI de cadena larga en la planta contienen menos de aproximadamente el 10% en peso de uno cualquiera o más de los siguientes AGPI: ácido gamma-linolénico (GLA; 18:3, n-6), AGPI que tienen 18 carbonos y cuatro dobles enlaces carbono35 carbono, AGPI que tienen 20 carbonos y tres dobles enlaces carbono-carbono, y AGPI que tienen 22 carbonos y dos

o tres dobles enlaces carbono-carbono, como porcentaje de los ácidos grasos totales producidos por la planta, y más preferiblemente menos de aproximadamente el 9%, y más preferiblemente menos de aproximadamente el 8%, y más preferiblemente menos de aproximadamente el 7%, y más preferiblemente menos de aproximadamente el 6%, y más preferiblemente menos de aproximadamente el 5%, y más preferiblemente menos de aproximadamente el 4%, y más preferiblemente menos de aproximadamente el 3%, y más preferiblemente menos de aproximadamente el 2%, y más preferiblemente menos de aproximadamente el 1% de uno cualquiera o más de los siguientes AGPI: ácido gamma-linolénico (GLA; 18:3, n-6), AGPI que tienen 18 carbonos y cuatro dobles enlaces carbono-carbono, AGPI que tienen 20 carbonos y tres dobles enlaces carbono-carbono, y AGPI que tienen 22 carbonos y dos o tres dobles enlaces carbono-carbono.

45 En un aspecto de esta realización de la invención, la planta produce al menos dos AGPI objetivo, y el perfil de ácidos grasos totales en la planta, o la parte de la planta que acumula AGPI (incluyendo aceites de las semillas oleaginosas), comprende una cantidad detectable de estos AGPI. En esta realización, los AGPI son preferiblemente cada uno al menos un AGPI de 20 carbonos y comprenden al menos 3 dobles enlaces, y más preferiblemente al menos 4 dobles enlaces, e incluso más preferiblemente, al menos 5 dobles enlaces. Tales AGPI se eligen lo más preferiblemente de DHA, DPAn-6 y EPA. En un aspecto, la planta produce DHA y DPAn-6, y la razón de DHA con respecto a DPAn-6 es de aproximadamente 1:10 a aproximadamente 10:1 o superior, incluyendo cualquier razón entre las mismas. En una realización, la razón de DHA con respecto a DPA es de aproximadamente 1:1 a aproximadamente 3:1, y en otra realización, de aproximadamente 2,5:1. En una realización, la planta produce DHA y

55 EPA.

La invención incluye además cualquier semilla producida por las plantas descritas anteriormente, así como cualquier parte de plantas, aceites producidos por las plantas o semillas producidas por las plantas. La invención también incluye cualquier producto producido usando las plantas, partes de plantas, semilla o aceites descritos en el presente documento.

También se describe un método para modificar un producto final que contiene al menos un ácido graso, que comprende añadir a dicho producto final un aceite producido por una célula huésped recombinante que expresa al menos una molécula de ácido nucleico recombinante que comprende una secuencia de ácido nucleico que codifica

65 para al menos un dominio biológicamente activo de un sistema de PKS de AGPI tal como se describe en el presente documento.

Preferiblemente, el producto final se selecciona del grupo que consiste en un alimento, un suplemento dietético, una formulación farmacéutica, una leche de animal humanizada y un preparado para lactantes. Las formulaciones farmacéuticas adecuadas incluyen, pero no se limitan a, una formulación antiinflamatoria, un agente quimioterápico,

5 un excipiente activo, un fármaco para la osteoporosis, un antidepresivo, un anticonvulsivo, un fármaco anti-Helicobacter pylori, un fármaco para el tratamiento de una enfermedad neurodegenerativa, un fármaco para el tratamiento de una enfermedad hepática degenerativa, un antibiótico y una formulación hipocolesterolemiante. En una realización, el producto final se usa para tratar un estado seleccionado del grupo que consiste en: inflamación crónica, inflamación aguda, trastorno gastrointestinal, cáncer, caquexia, reestenosis cardiaca, trastorno neurodegenerativo, trastorno degenerativo del hígado, trastorno de lípidos sanguíneos, osteoporosis, osteoartritis, enfermedad autoinmunitaria, preeclampsia, parto prematuro, maculopatía relacionada con la edad, trastorno pulmonar y trastorno peroxisomal.

Los productos alimenticios adecuados incluyen, pero no se limitan a, productos de panadería fina, pan y bollos,

15 cereales para el desayuno, queso procesado y sin procesar, condimentos (ketchup, mayonesa, etc.), productos lácteos (leche, yogur), púdines y postres de gelatina, bebidas carbonatadas, tés, mezclas de bebida en polvo, productos de pescado procesados, bebidas a base de frutas, chicle, dulces duros, productos lácteos congelados, productos cárnicos procesados, frutos secos y cremas para untar a base de frutos secos, pasta, productos avícolas procesados, jugos y salsas, snacks de patatas fritas y otros snacks, chocolate y otros dulces, sopas y mezclas de sopa, productos a base de soja (leches, bebidas, natas, sustitutos lácteos para el café), cremas para untar a base de aceite vegetal y bebidas a base de verduras.

Se describe además un método para producir una leche de animal humanizada. Este método incluye las etapas de modificar genéticamente células productoras de leche de un animal productor de leche con al menos una molécula

25 de ácido nucleico recombinante que comprende una secuencia de ácido nucleico que codifica para al menos un dominio biológicamente activo de un sistema de PKS de AGPI tal como se describe en el presente documento.

En la técnica se conocen métodos para modificar genéticamente una célula huésped y para producir un animal productor de leche, no humano, modificado genéticamente. Ejemplos de animales huésped para modificar incluyen ganado, ovejas, cerdos, cabras, yaks, etc., que son susceptibles de manipulación genética y clonación para una rápida expansión de una población que expresa un transgén. Para animales, pueden adaptarse transgenes similares a PKS para la expresión en orgánulos, tejidos y líquidos corporales diana mediante modificación de las regiones reguladoras del gen. Resulta de particular interés la producción de AGPI en la leche materna del animal huésped.

35 Los siguientes ejemplos se proporcionan con fines de ilustración y no se pretende que limiten el alcance de la presente invención.

Ejemplos

Ejemplo 1

El siguiente ejemplo describe la construcción de un vector de clonación de orfC de Th.23B sintético para su uso en Schizochytrium.

45 Se combinaron datos de uso de codones para cuatro genes grandes de Schizochytrium (por ejemplo, ATCC 20888 o Schizochytrium N230D) (orfA, orfB, orfC y FAS; descritos en la publicación de solicitud de patente estadounidense n.º 20020194641, la publicación de solicitud de patente estadounidense n.º 20070089199 o la publicación de solicitud de patente estadounidense n.º 20050191679). Dado que Schizochytrium ATCC 20888 produce altos niveles de ácidos grasos, se espera que estos genes se expresen altamente. Se eliminaron los codones con una representación inferior a aproximadamente el 3% (dentro de aquéllos para un aminoácido dado) y se ajustó el uso relativo de los codones restantes. La tabla 1 muestra el uso de codones de Schizochytrium, el uso ajustado y el uso de codones para el orfC de Th.23B no sintético. Se usó DNA2.0 (Menlo Park, CA) para analizar estos datos de uso de codones para diseñar y sintetizar una región codificante para el orfC de 23B de Thraustochytrium. Se añadieron nucleótidos a ambos extremos de la región codificante para codificar para sitios de reconocimiento de enzimas de

55 restricción que facilitarán la posterior manipulación del gen sintético. Se ajustó un pequeño número de codones (sin cambiar el aminoácido codificado de SEQ ID NO: 62) para eliminar o añadir determinadas secuencias de reconocimiento de enzimas de restricción (véase a continuación un ejemplo). Se desarrolló la secuencia sintética resultante mediante DNA2.0 dentro de un vector de plásmido y se muestra en la figura 2B como “pThOrfC synth.”. La tabla 1 muestra el uso de codones de la región codificante sintética.

Tabla 1. aminoácido codón A, B y C de Schizo más FAS Uso ajustado / diana orfC de Th.23B orfC de Th.23B sintético

número fracción fracción número fracción número fracción

Arg CGG 7 0,013 0 13 0,18 0 0

Arg: CGA 6 0,011 0 13 0,18 0 0

Arg: CGT 94 0,173 0,21 17 0,24 11 0,15

Arg: CGC 436 0,803 0,79 17 0,24 61 0,85

Arg: AGG 0 0,000 0,00 9 0,13 0 0

Arg: AGA 0 0,000 0,00 3 0,04 0 0

Ser: TCG 244 0,327 0,34 19 0,19 32 0,33

Ser: TCA 10 0,013 0,00 16 0,16 0 0

Ser: TCT 64 0,086 0,10 12 0,12 10 0,10

Ser: TCC 230 0,308 0,29 19 0,19 32 0,33

Ser: AGT 19 0,025 0,00 12 0,12 0 0

Ser: AGC 179 0,240 0,27 20 0,20 24 0,24

Leu: CTG 111 0,123 0,13 36 0,28 13 0,10

Leu: CTA 2 0,002 0,00 7 0,05 0 0

Leu: CTT 148 0,164 0,18 33 0,26 33 0,26

Leu: CTC 623 0,690 0,69 27 0,21 82 0,64

Leu: TTG 18 0,020 0,00 21 0,16 0 0

Leu: TTA 1 0,001 0,00 4 0,03 0 0

Gly: GGG 7 0,009 0,00 21 0,18 0 0

Gly: GGA 38 0,047 0,04 33 0,29 5 0,04

Gly: GGT 174 0,216 0,25 17 0,15 35 0,30

Gly: GGC 585 0,728 0,71 44 0,38 75 0,65

Val: GTG 198 0,242 0,29 44 0,38 29 0,25

Val: GTA 4 0,005 0,00 14 0,12 0 0

Val: GTT 103 0,126 0,13 34 0,29 18 0,16

Val: GTC 512 0,627 0,58 24 0,21 69 0,59

Ala: GCG 214 0,159 0,17 21 0,18 20 0,17

Ala: GCA 41 0,031 0,00 36 0,31 0 0

Ala: GCT 236 0,176 0,21 33 0,28 25 0,22

Ala: GCC 853 0,635 0,62 26 0,22 71 0,61

Thr: ACG 156 0,297 0,28 19 0,30 21 0,33

Thr: ACA 13 0,025 0,00 8 0,13 0 0

Thr: ACT 71 0,135 0,22 16 0,25 10 0,16

Thr: ACC 285 0,543 0,50 20 0,32 32 0,51

Pro: CCG 195 0,340 0,32 19 0,24 27 0,35

Pro: CCA 12 0,021 0,00 17 0,22 0 0

Pro CCT 116 0,202 0,27 29 0,37 19 0,24 Pro CCC 250 0,436 0,41 13 0,17 32 0,41

Ile ATA 0 0,000 0,00 2 0,03 0 0 Ile ATT 136 0,298 0,28 40 0,57 16 0,23 Ile ATC 320 0,702 0,72 28 0,40 54 0,77

Glu GAG 683 0,912 0,90 47 0,56 77 0,92 Glu GAA 66 0,088 0,10 37 0,44 7 0,08

Asp GAT 143 0,237 0,26 33 0,37 22 0,24 Asp GAC 460 0,763 0,74 57 0,63 68 0,76

Lys AAG 551 0,960 0,90 40 0,48 73 0,88 Lys AAA 23 0,040 0,10 43 0,52 10 0,12

Asn AAT 22 0,062 0,11 12 0,21 6 0,10 Asn AAC 331 0,938 0,89 46 0,79 52 0,90

Cys TGT 7 0,050 0,06 12 0,36 4 0,12 Cys TGC 134 0,950 0,94 21 0,64 29 0,88

Tyr TAT 13 0,057 0,39 15 0,34 14 0,32 Tyr TAC 214 0,943 0,61 29 0,66 30 0,68

Phe TTT 160 0,451 0,47 44 0,62 28 0,39 Phe TTC 195 0,549 0,43 27 0,38 43 0,61

Gln CAG 306 0,924 0,90 26 0,47 50 0,91 Gln CAA 25 0,076 0,10 29 0,53 5 0,09

His CAT 29 0,173 0,15 10 0,32 7 0,23 His CAC 139 0,827 0,85 21 0,68 24 0,77

Met ATG 291 1,00 1 46 1 46 1

Trp TGG 104 1,00 1 19 1 19 1

Tal como se describió anteriormente, un trabajo anterior de los presentes inventores y colaboradores (véase el ejemplo 8 en la publicación de solicitud de patente estadounidense n.º 20050100995) dio como resultado la creación 5 de un plásmido en el que se clonó la región codificante (no sintética) del orfC de Th.23B entre las regiones no codificantes en el sentido de 5’ y en el sentido de 3’ del orfC de Schizochytrium de manera que se generó una “costura perfecta” con la región codificante de Th.23B. Pueden usarse plásmidos intermedios en este procedimiento para clonar la región codificante de orfC de Th.23B sintética (véanse las figuras 2A y 2B). Con el fin de utilizar más

fácilmente uno de estos constructos intermedios, los inventores diseñaron una secuencia de nucleótidos de 283 pb y se sintetizó mediante DNA2.0 para crear las uniones de “costura perfecta” y utilizar sitios de restricción dentro de las regiones en el sentido de 5’/3’ del orfC de Schizochytrium y se diseñó en el gen orfC de Th.23B sintético para posteriores reacciones de clonación. Esta secuencia de ADN corta se denominó “Th23B synth orfC INT” y estaba

5 contenida dentro del plásmido “pThOrfC stitch INT”.

El “Th23B synth orfC INT” de 283 pb consiste en cinco segmentos. El primer segmento consiste en los 102 pb finales de la región (no codificante) en el sentido de 5’ del orfC de Schizochytrium desde un sitio de SpeI hasta, pero sin incluir, el codón de iniciación ATG del orfC de Schizochytrium (véase SEQ ID NO: 77). El segundo segmento consiste en los 9 pb iniciales de la región codificante de orfC de Th.23B sintética (SEQ ID NO: 61) y contiene el ATG de iniciación que se solapa con un sitio de SanDI designado (GGGTCCC). Estos segmentos crean la unión de “costura perfecta” en el sentido de 5’. El tercer segmento es un sitio de restricción de BamHI de 6 pb (GGATCC) que funciona como espaciador. El cuarto segmento consiste en los 45 pb finales de la región codificante de orfC de Th.238 (SEQ ID NO: 61) desde un sitio de ClaI designado hasta el codón de terminación TAA. El quinto segmento 15 consiste en los 121 pb iniciales de la región en el sentido de 3’ (no codificante) de orfC de Schizochytrium (sin incluir el codón de terminación) hasta un sitio de BsmI “inverso”. Los seis nucleótidos finales del fragmento “Th23B synth orfC INT” en la orientación “directa” son 5’>GCATTC>3’. El complemento inverso, 5’>GAATGC>3’, es la secuencia de reconocimiento para BsmI. Los segmentos cuarto y quinto crean la unión de “costura perfecta” en el sentido de 3’.

A continuación se proporcionan detalles de construcción de la versión de “costura perfecta” de la secuencia codificante de orfC de Th.23B sintética (véanse también las figuras 2A y 2B).

Etapa 1 (figura 2A). Se eliminó el fragmento “Th23B synth orfC INT” de pThOrfC stitch INT mediante digestión con enzimas de restricción SpeI y BsmI y se purificó el fragmento mediante electroforesis en gel de agarosa (kit

25 GeneClean Turbo, QBioGene). De manera similar, se obtuvo el fragmento de vector SpeI/BsmI grande a partir de pREZ22 (véase la publicación de solicitud de patente estadounidense n.º 20050100995), que contiene aproximadamente 2000 pb de cada una de las regiones en el sentido de 5’ y en el sentido de 3’ del orfC de Schizochytrium separadas por un espaciador de sitio de reconocimiento de BamHI clonado en pBlueScriptII SK(+)). Se ligaron estos dos fragmentos y se transformaron en E. coli XL-1 Blue (Stratagene, La Jolla, CA). Se identificaron los clones que contenían el plásmido deseado, “pREZ22 orfC INT”, mediante digestiones por restricción y secuenciación de ADN parcial. Este plásmido contiene las regiones en el sentido de 5’ y en el sentido de 3’ del orfC de Schizochytrium perfectamente cosidas a las regiones 5’ y 3’, respectivamente, de la región codificante de orfC sintética, pero carece de la mayor parte de la región codificante.

35 Etapa 2 (figura 2B). Se obtuvo la mayor parte de la región codificante de orfC de Th.23B sintética a partir de “pThOrfC synth” mediante digestión con enzimas de restricción SanDI y ClaI y purificación del fragmento de ADN deseado (como anteriormente). Se ligó este fragmento en un fragmento de vector obtenido de manera similar a partir de pREZ22 orfC INT y se clonó en E. coli (como anteriormente). El plásmido resultante, “pThOrfC-synPS”, contiene la región codificante de orfC de Th.23B sintética de longitud completa perfectamente cosida a las regiones en el sentido de 5’ y en el sentido de 3’ del gen orfC de Schizochytrium. La secuencia de nucleótidos de la región codificante de pThOrfC-synPS se representa en el presente documento por SEQ ID NO: 70. SEQ ID NO: 70 codifica para SEQ ID NO: 62. Se depositó pThOrfC-synPS con el n.º de registro de la ATCC PTA-8229, tal como se describió anteriormente en el presente documento.

45 Ejemplo 2

El siguiente ejemplo describe la creación de un constructo que codifica para el OrfC de Schizochytrium que comprende un dominio DH2 de Thraustochytrium 23B.

Se sustituyó la región DH2 de orfC de Schizochytrium ATCC20888 (SEQ ID NO: 30) por la de Thraustochytrium 23B ATCC 20892 (SEQ ID NO: 66) en puntos de cruzamiento en 5’ y 3’ específicos mediante una combinación de extensión por solapamiento basada en PCR (“corte y empalme mediante extensión por solapamiento” o “SOEing” (Horton, R.M., (1993) In vitro Recombination and Mutagenesis of DNA. SOEing together tailor-made genes. Methods in molecular Biology, vol. 15: PCR Protocols: Current Methods and Applications, capítulo 25, págs. 251-266 (B.A.

55 White, Ed.) Humana Press, Totawa, NJ)) y clonación por restricción.

Más específicamente, en este ejemplo, los inventores construyeron una molécula de ácido nucleico que codificaba para un polipéptido OrfC híbrido (quimérico) (secuencia de aminoácidos representada en el presente documento por SEQ ID NO: 74), de 1493 residuos de aminoácido de longitud, en el que la región DH2, definida como los aminoácidos 516-1041 de este híbrido, consiste en la secuencia de aminoácidos de la región DH2 de la proteína orfC de Th.23B; es decir, los aminoácidos 491-1016 de SEQ ID NO: 62, lo que incluye la totalidad de SEQ ID NO: 66 (descrita como el dominio DH2 de Thraustochytrium 23B en el presente documento). El resto de la secuencia de aminoácidos de OrfC híbrida, los residuos 1-515 y 1042-1493 de SEQ ID NO: 74, son idénticos a los residuos 1-515 y 1051-1502 de OrfC de Schizochytrium de SEQ ID NO: 6, respectivamente.

65 La construcción del plásmido que codifica para esta proteína quimérica se ilustra en las figuras 3A-3C.

Etapa 1. Se usaron los cebadores prREZ197 (SEQ ID NO: 78) y prREZ198 (SEQ ID NO: 79) para amplificar aproximadamente 1,5 kb del marco de lectura orfC de Schizochytrium en el sentido de 5’ de la región DH2 usando el gen orfC de Schizochytrium sin modificar como molde:

5 prREZ197 CATATGGCGCTCCGTGTCAA

prREZ198 GCCAGGAAGCTTTGACATGGGGTGCCAGGACATCT.

El cebador prREZ197 creó un sitio de NdeI (subrayado) en el codón ATG de iniciación. El cebador inverso prREZ198 (35 meros) contenía el punto de cruzamiento en 5’ generado mediante 20 pb de homología con la secuencia de OrfC de Schizochytrium (en negrita) y 15 pb de homología con la secuencia de OrfC de Th.23B. Condiciones de PCR: reacción de 50 0l, 1 0l de polimerasa PfuUltra (Stratagene) y tampón PfuUltra 1X, DMSO al 2%, 0,5 0M de cada dNTP, 0,4 0M de cada uno de prRZ197 y prRZ198, 10 ng de molde (región codificante de orfC de Schizochytrium

15 clonada), 1 min de desnaturalización inicial a 94ºC, 20 ciclos de 1 min de desnaturalización a 94ºC, 1 min de hibridación a 52ºC, 90 s de extensión a 72ºC y 10 min de extensión final. Se purificó el producto de PCR siguiendo electroforesis en gel de agarosa usando el kit de extracción en gel QIAquick® (Qiagen, Valencia, CA).

Etapa 2. Se usaron los cebadores prREZ 199 (SEQ ID NO: 80) y prREZ200 (SEQ ID NO: 81) para amplificar la región DH2 de Th.23B (aproximadamente 1,5 KR) usando el gen orfC de Th.23B como molde.

prREZ199 TCCTGGCACCCCATGTCAAAGCTTCCTGGCAACCCTA

prREZ200 AGTATACAGAGGTGCTGACA

25 El cebador prREZ199 (37 meros) contenía el punto de cruzamiento en 5’ generado mediante 22 pb de homología con la secuencia de orfC de Th.23B (DH2) y 15 pb de homología con la secuencia de orfC de Schizochytrium (en negrita). Estos últimos 15 pb también proporcionaron solapamiento con prREZ198 y por tanto el producto de PCR de la etapa 1. El cebador inverso prREZ200 incorporó un sitio de BstZ17I natural en el orfC de Th.23B en el punto de cruzamiento en 3’ (subrayado). Las condiciones de PCR y purificación de fragmentos fueron como anteriormente excepto porque se usaron los cebadores prREZ199 y prREZ200 con 10 ng en la región codificante de orfC de Th.23B clonada como molde.

Etapa 3. Se usó la extensión por solapamiento para crear la fusión de longitud completa entre el extremo 5’ de la

35 región codificante de orfC de Schizochytrium y la región DH2 de Th.23B. Se realizó PCR con el producto de la etapa 1 (prREZ197 x prREZ198) y la etapa 2 (prREZ199 x prREZ200) como moldes y los cebadores externos prREZ197 y prREZ200. Condiciones de PCR: reacción de 50 μl, 1 μl de polimerasa PfuUltra (Stratagene) y tampón PfuUltra 1X, DMSO al 2%, 0,5 μM de cada dNTP, 0,4 μM de cada uno de prRZ197 y prRZ200, 50 ng de cada producto de PCR de la etapas 1 y 2, 1 min de desnaturalización inicial a 94ºC, 20 ciclos de 1 min de desnaturalización a 94ºC, 1 min de hibridación a 52ºC, 3,5 min de extensión a 72ºC y 10 min de extensión final. Se purificó el producto de PCR como en la etapa 1.

Etapa 4. Se clonó el producto de la reacción de PCR en la etapa 3 en pCR-BluntII-TOPO (Invitrogen) y se transformó en TOP10 E. coli (Invitrogen) usando las condiciones recomendadas por el fabricante para crear

45 pREZ171. Se confirmó que la secuencia del ADN insertado era tal como se había diseñado.

Etapa 5. Usando sitios de restricción en las secuencias de vector respectivas, se transfirió el ADN clonado en pREZ171 al vector pBC KS(+) (Stratagene) como un fragmento de XhaI/SpeI para crear pREZ175.

Etapa 6. Se digirió el plásmido pREZ175 (linealizado) con BstZ17I, entonces se digirió parcialmente con NdeI. Se clonó un fragmento de aproximadamente 6 Kb que representa la región en 5’ de orfC de Schizochytrium y la región DH2 de Th.23B fusionadas en el fragmento de vector pREZ172 NdeI/BstZ17I creando pREZ177. El plásmido pREZ172 contiene toda la región codificante de orfC de Schizochytrium clonada en el vector de expresión de E. coli pColADuet-1 (Novagen) de manera que el codón ATG de iniciación incorpora un sitio de NdeI. Se deriva de

55 pREZ101 (véase el ejemplo 5) y se había modificado mediante mutagénesis dirigida al sitio (kit Quik Change, Stratagene) para insertar un sitio de BstZ171 neutro para aminoácidos en el sitio de cruzamiento en 3’. Específicamente, se modificó a TAT el codón de tirosina TAC en la posición de aminoácido 1051.

Etapa 7. Tras el análisis de pREZ177 mediante secuenciación de ADN, se descubrió que se había delecionado un único par de bases en el sitio de BstZ171. Específicamente, el <GTATAC> esperado era, en vez de eso, <GTAAC>. Para corregir este error, se usó un fragmento de restricción de PciI que contenía el punto de cruzamiento de BstZ17I correcto de pDS26 para sustituir al fragmento de PciI defectuoso en pREZ177. El plásmido pDS26 contiene una región codificante de orfC híbrida que se había creado anteriormente para otros fines. El plásmido resultante, pREZ179, contiene por tanto una región codificante de orfC entera que es predominantemente de Schizochytrium 65 pero contiene una sustitución precisa de la región DH2 por la de Th.23B (la secuencia de aminoácidos representada en el presente documento por SEQ ID NO: 74). El plásmido pREZ179 representa además una herramienta única

para estudiar la función del gene híbrido en E. coli y proporciona un punto de partida para el desarrollo de vectores de expresión para otros organismos.

Las siguientes etapas adicionales (véase la figura 3C) describen la transferencia del gene híbrido de pREZ179 a un 5 vector para la sustitución génica en Schizochytrium.

Etapa 8. Se aisló la región codificante de orfC de Schizochytrium (sin modificar) más porciones cortas de secuencias flanqueantes en el sentido de 5’ y en el sentido de 3’ a partir de pBR002 (un clon de la región genómica de OrfC) como fragmento de NheI/BspEI. Entonces se clonó este fragmento en la parte de vector de pREZ31 digerido con NheI/BspEI (funcionalmente equivalente a pREZ33 descrito en la publicación de solicitud de patente estadounidense n.º 20050100995, ejemplo 8). El plásmido resultante, pDS48, contiene la región codificante de orfC de Schizochytrium (sin modificar) más las mismas secuencias en el sentido de 5’ y en el sentido de 3’ que se han usado para dirigir la sustitución génica en el locus de OrfC.

15 Etapa 9. Una porción del marco de lectura orfC híbrido que contenía la totalidad de la región DH2 de Th.23B intercambiada se aisló a partir de pREZ179 como fragmento de PstI/PflMI. Se clonó este fragmento en la porción de vector de pDS48 digerido con PstI/PflMI para proporcionar pDS49. Como resultado, el plásmido pDS49 contiene el orfC híbrido dentro del mismo contexto que pREZ33 (región codificante de orfC de Th.23B de longitud completa como una sustitución génica de “costura perfecta”; véase la publicación de solicitud de patente estadounidense n.º 20050100995, ejemplo 8). La secuencia de nucleótidos de la región codificante de pDS49 se representa en el presente documento por SEQ ID NO: 73. SEQ ID NO: 73 codifica para SEQ ID NO: 74. Se depositó el plásmido pDS49 con el n.º de registro de la ATCC PTA-8230, tal como se describió en detalle anteriormente en el presente documento.

25 Ejemplo 3

El siguiente ejemplo describe la construcción de un constructo que codifica para el OrfC de Schizochytrium que comprende un dominio DH2 de Thraustochytrium 23B, en el que el dominio DH2 se ha resintetizado para estar optimizado para el uso de codones de Schizochytrium.

En este ejemplo, los inventores construyeron una molécula de ácido nucleico que codificaba para un polipéptido OrfC híbrido (SEQ ID NO: 74), de 1493 residuos de aminoácido de longitud, en la que la región DH2, definida como los aminoácidos 516-1041 de este híbrido, consiste en la secuencia de aminoácidos de la región DH2 de la proteína orfC de Th.23B; es decir, los aminoácidos 491-1016 de SEQ ID NO: 62, lo que incluye la totalidad de SEQ ID NO: 66

35 (descrita como el dominio DH2 de Thraustochytrium 23B en el presente documento). El resto de la secuencia de aminoácidos de OrfC híbrida, los residuos 1-515 y 1042-1493 de SEQ ID NO: 74, son idénticos a los residuos 1-515 y 1051-1502 de OrfC de Schizochytrium de SEQ ID NO: 6, respectivamente. Además, en este constructo, se derivó la secuencia de ADN que codifica para los aminoácidos 516-1041 de la “secuencia génica sintética” para OrfC de Th.23B que está contenida en el plásmido pThOrfC synth y pThOrfC_synPS (véase el ejemplo 1 y SEQ ID NO: 70) y que emplea codones que se prefieren para la expresión génica en Schizochytrium. Los detalles de construcción se ilustran en las figuras 4A-4C y se describen a continuación.

Se amplificaron las secuencias de ADN que codifican para la región DH2 del polipéptido OrfC de T23B mediante PCR (reacción 59/60) a partir de pThOrfC synth usando los cebadores oligonucleotídicos dhd59 (5> G CAC CCC 45 ATG AGC AAG CTC CCC GGC AAC >3; SEQ ID NO: 82) y dhd60 (5> GT ATA CAG AGG CGC AGA CAC GTT GTA AG >3; SEQ ID NO: 83). El cebador “directo” o de cadena sentido dhd59 se solapa con la secuencia de ADN que codifica para los residuos de aminoácido 491-501 (WHPMSKLPGNP; posiciones 491-501 de SEQ ID NO: 62) de la proteína orfC de Th.23B. El cebador “inverso” o de cadena antisentido dhd60 se solapa con la secuencia de ADN que codifica para los residuos de aminoácido 1008-1017 (TYNVSAPLYT; posiciones 1008-1017 de SEQ ID NO: 62) de la proteína orfC de Th.23B. El cebador dhd60 contiene dos apareamientos erróneos con la secuencia de pThOrfC synth que se indican mediante los residuos encerrados en un recuadro en la secuencia de dhd60 anterior. Estos cambios crearon un sitio de endonucleasa de restricción BstZ17 I, indicado mediante la porción con subrayado doble de la secuencia de dhd60 anterior, con el fin de facilitar etapas de clonación posteriores y también introdujeron dos “mutaciones silenciosas” en la secuencia codificante de la proteína híbrida: de CTT(L) a CTG(L) y de TAC(Y) a

55 TAT(Y). Se llevó a cabo esta amplificación en un volumen de reacción de 40 μl de tampón de reacción HF PfuUltra™ 1X (Stratagene, La Jolla, CA) que contenía dhd59 y dhd60 a 0,5 μM cada uno, dNTP 200 μM, 2 unidades de ADN polimerasa de alta fidelidad PfuUltra™ (Stratagene, La Jolla, CA) y 1 ng de ADN de pThOrfC synth. Los parámetros de ciclos fueron: 1 vez [1 min a 94ºC], 28 veces [(1 min a 94ºC), (0,5 min a 60ºC), (1,5 min a 72ºC)], 1 vez [8,5 min a 72ºC] y mantener a 4ºC. Se realizó la reacción en un termociclador de sistema de PCR 2400 GeneAmp® de Perkin Elmer (Applied Biosystems, Foster City, CA).

Se amplificó la secuencia de ADN que codifica para los residuos de aminoácido 331-522 de la proteína OrfC híbrida codificada por pREZ179 mediante PCR (reacción 57/58) de pREZ179 usando los cebadores oligonucleotídicos dhd57 (5> C TGC AGC CAG ATG CTC AAG ATG TAC ATG >3; SEQ ID NO: 84) y dhd58 (5> G GAG CTT GCT 65 CAT GGG GTG CCA GGA CAT CTC >3; SEQ ID NO: 85). El cebador “directo” o de cadena sentido dhd57 se solapa con la secuencia de ADN que codifica para los residuos de aminoácido 330-339 (GCSQMLKMYM, SEQ ID NO: 101;

posiciones 330-339 de SEQ ID NO: 74) de la proteína OrfC híbrida codificada por pREZ179. El cebador “inverso” o de cadena antisentido dhd58 se solapa con la secuencia de ADN que codifica para los residuos de aminoácido 513523 (EMSWHPMSKLP, SEQ ID NO: 102; posiciones 513-523 de SEQ ID NO: 74) de la proteína OrfC híbrida. El extremo 5’ del cebador directo, dhd57, se solapa con el sitio de Pst I presente en la secuencia codificante de OrfC

5 híbrida contenida en pREZ179. Se llevó a cabo esta amplificación en un volumen de reacción de 40 0l de tampón de reacción HF PfuUltra™ 1X (Stratagene, La Jolla, CA) que contenía dhd57 y dhd58 a 0,5 0M cada uno, dNTP 200 0M, 2 unidades de ADN polimerasa de alta fidelidad PfuUltra™ (Stratagene, La Jolla, CA) y 1 ng de ADN de pREZ179. Los parámetros de ciclos fueron: 1 vez [1 min a 94ºC], 28 veces [(1 min a 94ºC), (0,5 min a 60ºC), (1,5 min a 72ºC)], 1 vez [8,5 min a 72ºC] y mantener a 4ºC. Se realizó la reacción en un termociclador de sistema 2400 GeneAmp de Perkin Elmer.

Se hicieron pasar cuatro microlitros de cada una de las reacciones 57/58 y 59/60 sobre gel de agarosa al 1,2%. Se observaron bandas de ADN en cada caso que concordaban con los tamaños de producto esperados: 578 pb para el producto de 57/58 y 1578 pb para el producto de 59/60. Se escindieron estas bandas del gel y se recuperó el ADN

15 de los cortes de agarosa usando un kit de extracción en gel QIAquick® (QIAGEN, Inc. Valencia, CA) según el protocolo del proveedor. Se recuperaron los productos de PCR en 40 0l de tampón de elución.

Los 20 nucleótidos en 5’ del cebador inverso dhd58 (subrayados anteriormente) comprenden el complemento inverso de los 20 nucleótidos en 5’ de dhd59, también subrayados anteriormente. Como resultado, hay un solapamiento idéntico de 20 pb entre el extremo 3’ del producto de la reacción 57/58 y el extremo 5’ del producto de la reacción 59/60 y este solapamiento permite el posterior corte y empalme mediante PCR de estos dos productos mediante la técnica de “corte y empalme mediante extensión por solapamiento” o “SOEing” mediante PCR [Horton, R.M., (1993) In vitro Recombination and Mutagenesis of DNA. SOEing together tailor-made genes. Methods in molecular Biology, vol. 15: PCR Protocols: Current Methods and Applications, capítulo 25, págs. 251-266 (B.A.

25 White, Ed.) Humana Press, Totawa, NJ]. Este fragmento sometido a corte y empalme contiene entonces sitios de restricción útiles en (BstZ17 I & Pst I) o cerca (BsiW I) de sus extremos.

Se realizó la reacción de corte y empalme mediante PCR (reacción 57/60) de la siguiente manera. Un volumen de reacción de 40 μl de tampón de reacción HF PfuUltra™ 1X contenía los cebadores dhd57 y dhd60 cada uno a 0,5 μM, dNTP 200 μM, 2 unidades de ADN polimerasa de alta fidelidad PfuUltra™ (Stratagene, La Jolla, CA) y 0,8 μl de una dilución de 50 veces de cada uno de los productos de PCR purificados en gel 57/58 y 59/60. Se realizó una serie de reacciones de corte y empalme mediante PCR en las que se hizo variar la temperatura de hibridación en incrementos de 1ºC entre 66-70ºC. Otros parámetros de ciclos fueron constantes: 1 vez [1 min a 98ºC], 33 veces [(1 min a 98ºC), (1 min a 66-70ºC), (2,5 min a 72ºC)], 1 vez [7,5 min a 72ºC] y mantener a 6ºC. Se realizó la reacción 35 en un ciclador de temperatura RoboCycler® (Stratagene, La Jolla, CA). Se hicieron pasar alícuotas de estas reacciones sobre gel de agarosa al 1% y se observó que todas las reacciones contenían un producto que concordaba en cuanto al tamaño con el producto esperado (2136 pb) pero también se observaron otras bandas a todas las temperaturas de hibridación. Por tanto, se combinaron las 3 reacciones con hibridaciones a 67, 68 y 69ºC, se hicieron pasar sobre un gel de agarosa al 1% y se escindió la banda de interés de aproximadamente 2,1 kb y se recuperó el fragmento de ADN usando un kit de extracción en gel QIAquick® (QIAGEN, Inc. Valencia, CA) según el protocolo del proveedor. Se recuperó el ADN eluido en 30 μl de tampón de elución y se clonó en el vector de clonación de fragmento de PCR pCR®-Blunt II TOPO® (Invitrogen Corp., Carlsbad, CA) usando el kit de clonación mediante PCR Zero Blunt® TOPO® (Invitrogen Corp., Carlsbad, CA) según los protocolos del proveedor. Se usaron los productos de la reacción de clonación de TOPO para transformar E. coli químicamente competente TOP10 One

45 Shot® (Invitrogen) según el protocolo del proveedor. Se hicieron crecer durante la noche ocho de los transformantes resultantes y se prepararon ADN de plásmido y se analizaron mediante digestión con endonucleasa de restricción y electroforesis en gel de agarosa. Se encontró que siete de los ocho contenían el producto de PCR 57/60 de 2,1 kb clonado. Se secuenció el producto de PCR 57/60 clonado de un aislado y se mostró que correspondía exactamente a la secuencia esperada. Se realizó una secuenciación de ADN por el Biotechnology Resource Center de la Cornell University (Ithaca, Nueva York) pagando una tarifa por sus servicios usando el analizador de ADN automatizado 3730 de Applied Biosystems, con química de terminador Big Dye y ADN polimerasa AmpliTaq-FS (Applied Biosystems, Foster City, CA). El plásmido que contenía el inserto verificado por la secuencia se denominó pDD21 y se usó en etapas de construcción adicionales descritas a continuación.

55 El segmento de ADN que codificaba para el dominio DH2 de Th.23B optimizado para el uso de codones de Schizochytrium se escindió de pDD21 y se clonó en pREZ179 (véase el ejemplo 2) de modo que sustituyó a la secuencia codificante de dominio DH2 de Th.23B nativa presente en ese constructo. Se construyó el plásmido resultante, pDD22, de la siguiente manera. Se digirió ADN de pDD21 purificado con BsiWI y BstZ17I (New England BioLabs, Beverly MA) según los protocolos del proveedor. Posteriormente se sometió la reacción a tratamiento usando el procedimiento de purificación por centrifugación QIAquick® y el kit de purificación mediante PCR QIAquick® (QIAGEN Inc., Valencia, CA) según el protocolo del proveedor. Se hicieron pasar los productos de digestión purificados sobre un gel de agarosa al 1% y se escindió el fragmento de BsiWI - BstZ17I de 1940 pb y se eluyó de la agarosa usando un kit de extracción en gel QIAEX II (QIAGEN Inc., Valencia, CA) según el protocolo del proveedor. También se digirió ADN de pREZ179 purificado, con BsiWI y BstZ17I y posteriormente se trató con

65 fosfatasa antártica (New England BioLabs, Beverly, MA) según el protocolo del proveedor. También se sometieron a tratamiento los productos de digestión tratados con fosfatasa usando el procedimiento QUIquick® tal como se describió anteriormente y se hicieron pasar sobre un gel de agarosa al 0,7%. Se escindió el fragmento de vector de BsiwI - BstZ17I de ~6,1 Kb del gel y se eluyó de la agarosa usando el kit de extracción en gel QIAEX II descrito anteriormente. Se ligaron estos dos fragmentos en tampón de reacción de ligasa de T4 1X usando ligasa de T4, ambos de New England BioLabs (Beverly, MA). Se usaron los productos de ligamiento para transformar E. coli

5 químicamente competente TOP10 One Shot® (Invitrogen) según el protocolo del proveedor. Se analizaron ADN de plásmido de tres de los transformantes resultantes mediante digestión con endonucleasa de restricción y electroforesis en gel de agarosa y se encontró que los tres tenían la estructura del recombinante esperado. Un plásmido se denominó pDD22 y se empleó en construcciones adicionales.

Con el fin de facilitar la introducción del ADN que codifica para el OrfC híbrido que contiene la región DH2 de Th.23B codificada por codones preferidos por Schizochytrium en el genoma de Schizochytrium, se escindió de pDD22 un segmento de ADN de PstI-PflMI que abarcaba la secuencia que codifica para la región DH2 y se clonó en pDS48 (véase el ejemplo 2), un vector diseñado para la sustitución génica en secuencias en el locus del gen OrfC en Schizochytrium. Se construyó el plásmido resultante, pDD24, que se usó en sustituciones génicas posteriores, de la 15 siguiente manera. Se escindió de pDD22 el segmento de ADN que codifica para el dominio DH2 de T23B y con el uso de codones optimizado y se clonó en pDS48 de modo que sustituyó a la secuencia codificante de dominio DH2 de Schizochytrium nativa presente en ese constructo. Se digirió ADN de pDD22 purificado con PstI, PflMI y ClaI (New England BioLabs, Beverly MA) según los protocolos del proveedor. La digestión con ClaI escindió un fragmento de PflMI-PfIMI que de lo contrario migraría cerca de la posición del fragmento de interés de ~3,2 Kb de PstI-PflMI. Posteriormente se sometió la reacción a tratamiento usando el procedimiento de purificación por centrifugación QIAquick® y el kit de purificación mediante PCR QIAquick® (QIAGEN Inc., Valencia, CA) según el protocolo del proveedor. Se hicieron pasar los productos de digestión purificados sobre un gel de agarosa al 0,7% y se escindió el fragmento de interés de PstI - PflMI de ~3,2 Kb y se eluyó de la agarosa usando un kit de extracción en gel QIAEX II (QIAGEN Inc., Valencia, CA) según el protocolo del proveedor. Se digirió de manera similar ADN de 25 pDS48 purificado, con PflMI y PstI, se sometió al tratamiento QIAquick® tal como se describió anteriormente y se hico pasar sobre un gel de agarosa al 0,7%. Se escindió el fragmento de vector de PstI -PflMI de ~8,0 Kb del gel y se eluyó de la agarosa usando el kit de extracción en gel QIAEX II descrito anteriormente. Se ligaron estos dos fragmentos en tampón de reacción de ligasa de T4 1X usando ligasa de T4, ambos de New England BioLabs (Beverly, MA). Se usaron los productos de ligamiento para transformar E. coli químicamente competente TOP10 One Shot® (Invitrogen) según el protocolo del proveedor. Se hicieron crecer durante la noche los transformantes resultantes, en cultivo líquido de medios LB que contenían 100 μg/ml de ampicilina a 30ºC. Se encontró que la propagación de estos transformantes a 37ºC en cultivos líquidos daba como resultado inestabilidad del plásmido en algunas circunstancias. Se analizaron ADN de plásmido de tres de los transformantes resultantes mediante digestión con endonucleasa de restricción y electroforesis en gel de agarosa y se encontró que los tres tenían la estructura del

35 recombinante esperado. Un plásmido se denominó pDD24 y se sometió a análisis con endonucleasa de restricción adicional y se empleó en experimentos de sustitución génica en Schizochytrium (véase el ejemplo 4). La secuencia de nucleótidos de la región codificante de pDD24 se representa en el presente documento por SEQ ID NO: 75. SEQ ID NO: 75 codifica para SEQ ID NO: 74. Se depositó el plásmido pDD24 con el n.º de registro de la ATCC PTA8226, tal como se describió anteriormente en el presente documento.

Ejemplo 4

El siguiente ejemplo describe la expresión de diversos constructos de orfC de Th.23B descritos en los ejemplos 1-3 anteriores en Schizochytrium, y el análisis de los AGPI producidos por tales organismos.

45 Expresión de genes orfC de Th.23B variantes en Schizochytrium

Se transformó la cepa B32-Z1 de Schizochytrium (véase anteriormente y el ejemplo 8 en la publicación de solicitud de patente estadounidense n.º 20050100995), que es un Schizochytrium con una deleción exacta de la región codificante de orfC de Schizochytrium, con el plásmido pThOrfC-synPS (orfC de Th.23B sintético de longitud completa; véase el ejemplo 1), pDS49 (región DH2 de Th.23B no sintética; véase el ejemplo 2) y pDD24 (región DH2 de Th.23B sintética; véase el ejemplo 3) mediante bombardeo de partículas usando técnicas anteriormente descritas (véase la publicación de solicitud de patente estadounidense n.º 2003/0166207). Se obtuvieron transformantes sensibles a Zeocin™ prototróficos. Tales transformantes surgieron de acontecimientos de sustitución génica de 55 doble cruzamiento tal como se confirmó mediante transferencia de tipo Southern y/o PCR para cepas seleccionadas.

En resumen, el bombardeo de partículas utilizó el sistema de suministro de partículas Biolistic® PDS-1000/He de BioRad (Hercules, CA). Se hicieron crecer cepas de Schizochytrium para la transformación a 29-30ºC en medio M2B (más DHA cuando era apropiado) sobre una plataforma giratoria (200 rpm) hasta DO600 = de 1 a 2,5 (BioPhotometer, Eppendorf). Se recogieron células mediante centrifugación (3000 rpm, 5 min) y se resuspendieron en Na2SO4 7,5 g/l estéril hasta DO600 = 30. Se extendió un volumen de 150 μl de células suspendidas en una pequeña zona circular (6 cm de diámetro) sobre una placa Petri que contenía agar M2B (sin DHA). Para el crecimiento de auxótrofos de AGPI, se complementó M2B con DHA hasta 0,25 mM a partir de una disolución madre de DHA 25 mM en β-ciclodextrina metilada al azar al 40% (p/v) (CTD Inc, High Springs, FL.). Cuando se realizaron 65 bombardeos para complementar la auxotrofia de DHA, se omitió DHA del medio de agar. Se llevaron a cabo bombardeos en una campana extractora de flujo laminar usando discos de ruptura de 1100 psi, un hueco de 0,25

pulgadas entre el tapón de retención del disco y la tapa de cubierta del macroportador, y el soporte de pantalla de detención en la posición central. La repisa diana está en la posición L2 (6 cm). Se incubaron a 29-30ºC placas Petri que contenían cepas de Schizochytrium auxótrofas para DHA sometidas a bombardeo hasta que se desarrollaron colonias (prototróficas prospectivas) (3-5 días). Se cultivaron en línea colonias elegidas al azar en placas de agar

5 M2B. Tras el crecimiento, se transfirieron diversas colonias bien aisladas a placas de M2B con y sin Zeocin® (50 0g/ml). Se seleccionaron protótrofos de DHA sensibles a Zeocin (lo que sugiere un acontecimiento de sustitución génica) para su estudio adicional.

Crecimiento de Schizochytrium para el análisis de ácidos grasos

Se inocularon matraces Erlenmeyer (250 ml) que contenían 50 ml de medio M50-20 con el contenido (1 ml) de un criovial de la cepa indicada. Se incubaron los matraces a 29-30ºC en un agitador rotativo a 200 rpm durante 72 horas. Se inocularon matraces similares que contenían medio SSFM con 0,5 ml del cultivo en M50-20 y se incubaron como anteriormente durante 5 días. Se recogieron las células mediante centrifugación (4000 g, 5 min) tras

15 dilución del caldo con un volumen igual de isopropanol al 70%. Se suspendieron los sedimentos celulares resultantes en un volumen original del 35% de isopropanol-agua y volvieron a centrifugarse. Se congelaron inmediatamente a -70ºC los sedimentos celulares lavados seguido por liofilización. Se determinó el contenido en ácidos grasos de la biomasa secada preparando ésteres metílicos de ácidos grasos (EMAG) usando metanol ácido, extrayéndolos en hexano y analizándolos mediante cromatografía gas-líquido.

Medio M50-20

Los componentes por litro del medio M50-20 son los siguientes: 12,5 g de NaCl, 2,5 g de MgSO4·7H2O, 0,5 g de KCI, 0,05 g de CaCl2, 20,0 g de glucosa, 20,0 g de Na-glutamato, 0,4 g de KH2PO4, 1,0 g de extracto de levadura,

25 0,4 g de NaHCO3, 5 ml de metales traza PII (la disolución de metales traza PII 200X contiene por litro: 6,0 g de Na2EDTA, 0,29 g de FeCl3·6H2O, 6,84 g de H3BO3, 0,86 g de MnCl2·4H2O, 60 mg de ZnCl2, 26 mg de CoCl2·6H2O, 52 mg de NiSO4·6H2O, 2 mg de CuSO4·5H2O y 5 mg de NaMoO4·2H2O, pH 8,0), 1 ml de mezcla de vitaminas PII (la mezcla de vitaminas PII 1000X contiene por litro: 100 mg de tiamina, 0,5 mg de biotina y 0,5 mg de vitamina B12), pH 7,0.

Medio SSFM

Los componentes por litro del medio SSFM son los siguientes: 13,62 g de Na2SO4, 0,72 g de K2SO4, 0,56 g de KCI, 2,27 g de MgSO4·7H2O, 0,19 g de CaCl2, 0,0565 g de KH2PO4, 0,57 g de (NH4)2SO4, 0,13 g de Na-glutamato, MES

35 100 mM (ácido 4-morfolin-etanosulfónico) pH 6,0, 50,0 g de glucosa, 0,16 mg de vitamina B12, 9,75 mg de tiamina, 3,33 mg de pantotenato de calcio, 10,3 mg de FeSO4·7H2O, 3,1 mg de MnCl2·4H2O, 1,93 mg de ZnSO4·7H2O, 0,04 mg de CoCl2·6H2O, 0,04 mg de NaMoO4·2H2O, 2,07 mg de CuSO4·5H2O, 2,07 mg de NiSO4·6H2O, 2,0 mg de ácido cítrico.

Medio M2B

Los componentes del medio M2B son los siguientes (por litro): 10 g de glucosa, 0,8 g de (NH4)2SO4, 5,0 g de Na2SO4, 2,0 g de MgSO4·7H2O, 0,5 g de KH2PO4, 0,5 g de KCl, 0,1 g de CaCl2-2H2O, 0,05 mg de vitamina B12, 0,2 mg de tiamina·HCl, 0,2 mg de pantotenato de calcio, 3,0 mg de FeSO4·7H2O, 1,0 mg de MnCl2-4H2O, 0,8 mg de

45 ZnSO4·7H2O, 0,02 mg de CoCl2·6H2O, 0,01 mg de Na2MoO4·2H2O, 0,6 mg de CuSO4·5H2O, 0,8 mg de NiSO4·6H2O, tampón MES 0,1 M, pH 6,0 (ajustado con NaOH).

Análisis de AGPI de cepas de Schizochytrium recombinantes

La tabla 2 muestra el contenido en ácidos grasos totales, DHA y DPAn-6 (expresado como EMAG (éster metílico de ácidos grasos)) de Schizochytrium ATCC 20888 y cepas derivadas en las que la región codificante de orfC nativa está sustituida por la totalidad o parte de la región codificante de OrfC de Thraustochytrium 23B (descrita en los ejemplos 1-3). La sustitución de la totalidad de la región codificante de orfC de Schizochytrium ATCC 20888 por la de Th.23B (cepa B34-1) da como resultado una razón DHA/DPAn-6 superior (más próxima a la de Th.23B) pero un

55 contenido en AGPI totales inferior. El hecho de que la expresión de proteínas es la causa probable del contenido en AGPI totales inferior se demuestra mediante el uso de la región codificante de orfC de Th.23B optimizada para codones (sintética) (por ejemplo, en la cepa B67-5; transformada con pThOrfC_syn-PS) en la que la producción de AGPI aumenta con respecto a los niveles de tipo natural mientras que se mantiene la razón DHA/DPAn-6 potenciada. Las sustituciones sólo de la región DH2 de Schizochytrium por la de Thraustochytrium muestran un patrón similar. La cepa con la región DH2 de Th.23B optimizada para codones (B69-2; transformada con pDD24) proporciona un contenido en AGPI superior al de la cepa con la región DH2 no optimizada (B105-1A1; transformada con pDS49). Sin embargo, la razón DHA/DPA en la cepa B105-1A1 (región DH2 no optimizada) era notablemente alta.

65 De manera interesante, la cepa B69-6 produce altos niveles de DHA y una razón DHA/DPA relativamente alta. Esta cepa se obtuvo como resultado de la misma transformación que la cepa B32-Z1 con el plásmido pDD24 que produjo la cepa B69-2. Sin embargo, la cepa B69-6 no tiene una integración/sustitución génica correcta de la región codificante de orfC modificada (tal como se determinó mediante análisis por PCR), aunque se desconoce la naturaleza exacta de la discrepancia.

Dados estos datos, pueden desarrollarse fermentaciones a escala de producción con la cepa B69-2 para lograr una producción de DHA máxima, o las cepas B69-6 o B105-1A1 si se desea la mayor razón DHA/DPA.

Tabla 2. Resumen de variantes de orfC

Cepa: EMAG (% de dcw) DHA (% de dcw) DPAn-6 (% de dcw) DHA (% de EMAG) DHA/DPA descripción de la cepa

Schizochytrium de tipo natural

ATCC20888: 71,4 16,5 3,64 22,9 4,5 orfC de Th. 23B (no sint.)

B34-1: 78,4 13,4 1,24 17,0 10,8 orfC de Th.23B sint.

B67-5: 73,0 21,3 1,85 28,9 11,5 DH2 de Th. 23B (no sint.)

B105-1A1: 73,5 19,4 1,31 26,4 14,8 DH2 de Th.23B sint.

B69-2: 73,0 23,0 2,31 31,6 10,0 DH2 de Th.23B sint.

B69-6: 73,8 22,4 1,76 30,3 12,7

Dcw peso celular seco EMAG éster metílico de ácidos grasos

10 Ejemplos 5

El siguiente ejemplo describe la producción de DHA y DPA en E. coli mediante un sistema de múltiples plásmidos y además ilustra que el dominio DH2 del sistema de PKS de AGPI controla la razón de producción de ácidos grasos

15 por el sistema.

Los inventores demostraron anteriormente la producción de DHA y DPA en E. coli mediante el uso de un sistema inducible por T7 para expresar OrfA, OrfB*, OrfC de Schizochytrium y HetI de Nostoc (ejemplo 3, página 41, publicación de solicitud de patente estadounidense n.º 20050100995). En este ejemplo anterior, OrfA, OrfB* y OrfC 20 estaban contenidos en un único plásmido. Con el fin de crear un sistema más susceptible de manipulación genética, se clonaron las regiones codificantes individuales de Schizochytrium en un conjunto de plásmidos de expresión compatibles diseñados para la coexpresión de múltiples genes diana. La expresión de los genes diana se dirige de manera similar por el promotor de T7 inducible en esta serie Duet de plásmidos (Novagen). Se clonó orfA de Schizochytrium como un fragmento de NdeI -XbaI de pBR115L1 en el vector de expresión pETDuet-1 para crear 25 pREZ91 (se hace referencia a pBR115L1 en la generación del plásmido de expresión final en el ejemplo 3, página 41, publicación de solicitud de patente estadounidense n.º 20050100995). Se clonó orfB* de Schizochytriuum como un fragmento de NdeI -XbaI de pJK780 en el vector de expresión pCDFDuet-1 para crear pREZ96 (se hace referencia a pJK780 en la generación del plásmido de expresión final en el ejemplo 3, página 41, publicación de solicitud de patente estadounidense n.º 20050100995). Se clonó orfC de Schizochytrium como un fragmento de 30 NdeI- XbaI de pJKS 10 en pColADuet-1 para crear pREZ101 (se hace referencia a pJK510 en la generación del plásmido de expresión final en el ejemplo 3, página 41, publicación de solicitud de patente estadounidense n.º 20050100995). El gen auxiliar requerido hetI, que codifica para una fosfopanteteína transferasa (PPTasa), se suministró en un plásmido basado en pACYC184, pJK737, anteriormente descrito (ejemplo 3, página 41, publicación de solicitud de patente estadounidense n.º 20050100995). Se transformaron OrfA, OrfB*, OrfC y hetI, contenidos por

35 separado en los plásmidos pREZ91, pREZ96, pREZ101 y pJK737 respectivamente, en la cepa BLR (DE3) de E. coli (Novagen) que contiene una ARN polimerasa de T7 inducible.

Se detectó la producción de DHA y DPA en células de E. coli que se hicieron crecer en caldo Luria (LB) tanto a 25ºC como a 30ºC (véase la tabla 3 a continuación) usando estas cepas de múltiples plásmidos. Se inocularon colonias individuales en caldo LB complementado con antibióticos para mantener cada plásmido en la cepa dada y se hicieron crecer durante la noche a la temperatura deseada (25ºC o 30ºC). Entonces se usaron volúmenes de 300 0l 5 de estos cultivos para inocular cultivos principales de 30 ml de LB con antibióticos apropiados. Se hicieron crecer los cultivos principales a la temperatura indicada hasta que la DO600 (BioPhotometer, Eppendorf) estaba entre 0,45 y 0,55, punto en el cual se indujeron los cultivos con IPTG hasta una concentración final de 1 mM. Entonces se mantuvieron los cultivos en estas condiciones de expresión durante 24 horas tras lo cual se recogieron las células mediante centrifugación y se prepararon para el análisis de EMAG. El nivel típico de AGPI producidos (como

10 porcentajes de EMAG totales) a 30ºC fue del 10% de DHA y el 6% de DPA (el 16% de AGPI totales) para la cepa que portaba orfC de Schizochytrium. La razón DHA/DPA de 1,7 se aproxima a lo que se observa en Schizochytrium (véase la tabla 2 a continuación).

La expresión de los genes de Schizochytrium requeridos para la producción de DHA y DPA en E. coli en plásmidos

15 separados proporcionó a los inventores la capacidad de estudiar más fácilmente y manipular genes de biosíntesis de AGPI. Tal como se describe en la publicación de solicitud de patente estadounidense n.º 2005/0100995, ejemplo 8, se demostró que en Schizochytrium, la sustitución del OrfC por el gen homólogo de Thraustochytrium 23B alteró el perfil de AGPI con un desplazamiento en la razón de DHA con respecto a DPA. Se llevó a cabo el experimento similar con el sistema de expresión de múltiples plásmidos de E. coli descrito anteriormente, en el que se sustituyó el

20 plásmido de expresión de orfC de Schizochytrium (pREZ101) por un plásmido de expresión de orfC de Thraustochytrium 23B similar (pREZ142).

Para crear pREZ142, se clonó la región codificante de orfC de Th.238 de pREZ31 como un fragmento de NcoI/SalI en el vector Duet pColADuet-1. El plásmido pREZ31 es una variante de pREZ33, el vector de sustitución génica con 25 “costura perfecta” (descrito en el ejemplo 1 anterior y en el ejemplo 8 de la publicación de solicitud de patente estadounidense n.º 2005/0100995), en el que se modificó por ingeniería genética un sitio de restricción de BamHI (subrayado a continuación) justo en el sentido de 5’ del ATG de iniciación (en minúsculas a continuación). Esta modificación por ingeniería genética creó de manera casual en pREZ31 un sitio de restricción de NcoI (en cursiva a continuación) que contenía el ATG de iniciación que estaba compuesto por las dos últimas bases del sitio de BamHI

30 y las cuatro primeras bases de la región codificante de orfC de Th.238:

GGATCCatgG (SEQ ID NO: 86)

El sitio de restricción de SalI usado en esta clonación es nativo para la región en el sentido de 3’ de orfC de

35 Schizochytrium y está aproximadamente 250 pb en el sentido de 3’ del codón de terminación TAA. Esta sustitución en el sistema de expresión de E. coli o del orfC de Schizochytrium por el orfC de Th.23B dio como resultado un perfil de AGPI alterado con un desplazamiento de la razón de DHA con respecto a DPA de 1,5 a 6,8 y la cantidad total de DHA + DPA se redujo del 10% al 4% cuando se hicieron crecer las cepas y se indujeron a 25ºC (véase la tabla a continuación).

40 Se generaron regiones codificantes de orfC híbridas con el fin de determinar la región o el dominio del gen responsable de controlar la razón de DHA con respecto a DPA. El orfC híbrido en el plásmido de expresión pREZ179 contiene una región DH2 central derivada del orfC de Thraustochytrium 23B y está flanqueada en el sentido de 5’ y en el sentido de 3’ por secuencias de orfC de Schizochytrium (véase el ejemplo 2). Cuando se

45 expresó pREZ179 en el sistema anterior en lugar de pREZ101, se observó una razón de DHA con respecto a DPA de 6,5, mientras que la cantidad de AGPI totales fue del 9% cuando se expresó y se indujo a 25ºC (véase la tabla a continuación). Este desplazamiento en la razón de DHA con respecto a DPA en la expresión en el modelo de E. coli y el mantenimiento del rendimiento indicaron que la región DH2 central de orfG controla la mayor parte o la totalidad de la razón de DHA con respecto a DPA en la biosíntesis de AGPI. Cuando se modificó entonces este constructo

50 con ADN flanqueante adicional y se transformó en Schizochytrium para sustituir al orfC nativo, se observó un desplazamiento similar en la razón de DHA con respecto a DPA así como ausencia de disminución en la producción (véase el ejemplo 4). De manera similar, cuando se expresó el orfC híbrido en un sistema de levadura, se observó de nuevo un desplazamiento en la razón de DHA con respecto a DPA (véase el ejemplo 6).

55 Tabla 3

forma de orfC (temperatura): plásmido de orfC DHA + DPA DHA/DPA

Schizochytrium (30º) Schizochytrium (25º) Th.23B (25º) Th.23B DH2 (25º): pREZ101 pREZ101 pREZ142 pREZ179 16% 10% 4% 9% 1,7 1,5 6,8 6,5

Uso del sistema de múltiples plásmidos de expresión

Los ejemplos anteriores, en los que se usaron los sistemas de modelo de expresión de múltiples plásmidos en E. coli y levadura para esclarecer el papel del OrfC y, en particular, la región DH2, en el control de la razón de DHA con respecto a DPA en la biosíntesis de AGPI, demuestran la utilidad de estos sistemas heterólogos. Los resultados

5 observados en E. coli y en levadura son análogos a los observados en Schizochytrium en cuanto al efecto relativo de la fuente de orfC sobre la razón DHA/DPA. De manera similar, se describen en el presente documento los sistemas de modelo de expresión de múltiples plásmidos en E. coli y levadura para investigar y modificar por ingeniería genética otros aspectos de la biosíntesis de AGPI incluyendo la longitud de cadena de AGPI, el grado de saturación de ácido graso y la posición de dobles enlaces. Estos sistemas también permitirán una fácil expresión de genes implicados en otros tipos de modificaciones de ácidos grasos tales como hidroxilación y glicosilación. De manera similar, pueden clonarse otros genes de biosíntesis de AGPI de un único organismo (tal como se ha hecho para la agrupación de Shewanella japonica descrita en el ejemplo 2, publicación de solicitud de patente estadounidense n.º 2005/0100995) o de más de un organismo en este sistema de E. coli para facilitar su estudio.

15 Ejemplo 6

El siguiente ejemplo describe el método mediante el cual se expresaron las subunidades A, B y C de AGPI sintasa de Schizochytrium y hetI de Nostoc en levadura y además ilustra que el dominio DH2 del sistema de PKS de AGPI controla la razón de la producción de ácidos grasos por el sistema.

Parte A

Experimentos de expresión preliminares indicaron que Het I y OrfC de Schizochytrium podían producirse como proteínas de longitud completa en levadura usando las regiones codificantes nativas. En cambio, la expresión de las 25 regiones codificantes nativas para OrfA y B de Schizochytrium no dio como resultado la producción de cantidades detectables de las proteínas esperadas. El problema parecía estar asociado con la traducción del ARNm. (Transferencias de tipo Northern mostraron la presencia de ARNm del tamaño correcto). Por consiguiente, se prepararon versiones sintéticas de esas dos regiones codificantes con el objetivo de mejorar su expresión en levadura. Las secuencias de aminoácidos de las proteínas codificadas por los genes sintéticos son idénticas a las codificadas por los genes nativos (es decir, SEQ ID NO: 2 y SEQ ID NO: 4). Se realizaron un diseño génico inicial y una síntesis génica completa de orfA y orfB por Blue Heron Biotechnology, Inc. (Bothell, WA). La optimización de codones tuvo en cuenta preferencias codónicas de S. cerevisiae. Las secuencias completas de las regiones codificantes sintéticas (denominadas; sOrfA y sOrfB) se indican como SEQ ID NO: 35 (sOrfA) y SEQ ID NO: 36 (sOrfB). A cada región codificante sintética se le agregó ADN de la siguiente manera para facilitar la clonación en los

35 vectores de transformación de levadura:

secuencia en el sentido de 5’ (SEQ ID NO: 87) AAGCTTGTGCAGTCAAGTGCGCAAAACCATG

secuencia en el sentido de 3’ (SEQ ID NO: 88) TAACCCGGGTCTAGA.

Las posiciones de los codones de iniciación y de terminación están subrayadas y los sitios de reconocimiento de enzimas de restricción para HindIII (en el sentido de 5’) y XbaI (en el sentido de 3’) se muestran en negrita.

Se usó la cepa InvSC1 de S. cerevisiae (MATa his3-Δ1, leu2, trp1-289, ura3-52) (Invitrogen, Carlsbad, CA) para

45 estos experimentos. Se mantuvo la cepa y se transformó según las recomendaciones del proveedor. Se hicieron crecer transformantes sobre medio sólido de glucosa, caldo de rafinosa y medio de inducción de galactosa según las instrucciones del fabricante (Invitrogen). Todos los componentes de medios de levadura se adquirieron de Q-BIOgene (Carlsbad, CA).

Se clonaron hetI y los genes de AGPI sintasa de Schizochytrium en los siguientes vectores de transformación: pYES-Leu* (sOrfA; SEQ ID NO: 35), pYES3-Tryp (sOrfB; SEQ ID NO: 36), pYES2/CT (OrfC; SEQ ID NO: 5) y pYESHis* (hetI; SEQ ID NO: 33). A continuación se describe en detalle la creación de estos vectores. Se modificaron algunos de los vectores y genes para adaptarse a requisitos de clonación y expresión específicos (descritos en detalle a continuación). Se usaron medios de selección apropiados, dependiendo del experimento

55 particular. Se clonaron los genes en cada caso detrás del promotor GAL1 y se indujo la expresión mediante resuspensión de células lavadas en medios que contenían galactosa según directrices proporcionadas por Invitrogen. Se hicieron crecer las células a 30ºC y se recogieron (mediante centrifugación) en los momentos indicados tras haberse transferido al medio de inducción. Se secaron por congelación los sedimentos celulares y se prepararon EMAG usando metanol ácido, se extrajeron en hexano y se analizaron mediante CG.

Constructo de expresión de sOrfA: Se clonó el sOrfA en un vector personalizado, pYES-Leu/CT, construido de la siguiente manera. Se modificó un vector pYES6/CT (Invitrogen) sustituyendo una región de su ADN que contenía un gen de resistencia a blasticidina por un segmento de ADN que contenía un gen leu2 (para la selección en medios que carecen de leucina). Se eliminó el gen de blasticidina mediante digestión de pYES6/CT con BglII y NheI y 65 purificación en gel del fragmento de vector de ~4913 pb resultante. Se obtuvo el gen leu2 a partir del vector de levadura pRS425 (ATCC 77106, n.º de GenBank U03452). Se usaron los cebadores PO-Leu5’ (SEQ ID NO: 89) y

PO-Leu3’ (SEQ ID NO: 90) en una reacción de PCR con pRS425 como molde para generar un fragmento de ADN de 01812 pb (desde el pb 664 hasta el 2475 de pRS425) que contenía el gen leu2.

PO-Leu5’ GACTGCTAGCTTAAGCAAGGATTTTCTTAAC 5 PO-Leu3’ GACTGGATCCTCCTGATGCGGTATTTTCTCC

Se incorporaron sitios de reconocimiento de enzimas de restricción en los cebadores para facilitar la clonación (5’ NheI y 3’ BamHI subrayados). Se digirió el fragmento de PCR con BamHI y NheI y se ligó al fragmento de vector de 4913 pb obtenido a partir del digesto de pYES6/CT BglII/NheI para formar pYES6-Leu. Se digirió este vector con HindIII y XbaI en la preparación para la inserción de sOrfA. Se digirió el plásmido de Blue Heron que contenía el sOrfA y el ADN flanqueante apropiado con HindIII y XbaI. Se purificó en gel el fragmento de 8,8 kb con el OrfA completo y se ligó al vector pYES6-Leu preparado para formar pBR882 (pYES6-Leu:sOrfA).

15 Constructo de expresión de sOrf B: Los inventores deseaban clonar el sOrfB en el vector de expresión de levadura pYES3 que tiene un marcador de selección de triptófano. Dado que el vector pYES3 contiene un segundo sitio de restricción de XbaI (el segundo sitio en el gen trpI), esa enzima de restricción no podía usarse convenientemente para la introducción del fragmento de ADN de sOrfB. Se modificó la región que contenía el sitio de XbaI en el sentido de 3’ del sOrf B para introducir un sitio de NotI único (también disponible como sitio de clonación de inserción génica en pYES3) de la siguiente manera. Se digirió el plásmido que contenía el fragmento de sOrfB de Blue Heron con HindIII y XbaI y se purificó en gel el fragmento de interés de 6,2 kb resultante. Se ligó ese fragmento en pYES2/CT (Invitrogen) que se había cortado con las mismas enzimas, proporcionando el plásmido pBR879. Se abrió este plásmido cortando en el sitio de XbaI único. Se usó el ligador oligomérico autocomplementario 5’-CTAGGCGGCCGC-3’ (SEQ ID NO: 91) para crear un sitio de NotI único (subrayado; también eliminó el sitio de

25 XbaI). Esto proporcionó el plásmido pJK894. Se digirió este constructo con HindIII y NotI y se purificó en gel el fragmento de interés de 6,2 kb resultante. Se ligó ese fragmento en pYES3/CT (Invitrogen) que se había cortado con las mismas enzimas para formar pJK908 (pYES3 aOrfB).

Constructo de expresión de OrfC: El orfC nativo se había clonado previamente en un vector de expresión bacteriano y esto sirvió como fuente para el gen para la expresión en levadura. El vector bacteriano era pBluescript II KS (Stratagene) y se clonó la región codificante más ADN flanqueante en los sitios de EcoRI (5’) y XbaI (3’) del vector. El ADN de inserto incluía un sitio de restricción de NdeI como parte del codón de iniciación ATG y el codón de terminación TAA justo antes del sitio de XbaI. Se incluyó una secuencia de sitio de unión a ribosoma bacteriano en la región entre el sitio de EcoRI y el sitio de NdeI que contenía el codón de iniciación. Antes de la clonación en el

35 vector de levadura, se eliminó el ADN del sitio de unión a ribosoma y se sustituyó por ADN apropiado para la expresión en el sistema de levadura. Se digirió con EcoRI y NdeI el plásmido pBluescript que albergaba el orfC y se ligó a los ligadores oligonucleotídicos FL5’ (AATTCAA) y FL3’ (TATTG). Se digirió el plásmido resultante (denominado pKCFL) con HindIII (justo en el sentido de 5’ del sitio de EcoRI en el poliligador pBluescript KS) y XbaI para liberar un fragmento de 04526 pb. Se ligó este fragmento a pYES2/CT digerido con HindIII/XbaI para generar: pYES2/ORFCwt (pYES2:OrfC).

Constructo de HetI: Se clonó el gene hetI de Nostoc, que codifica para una PPTasa, en un vector personalizado, pYES6-His/CT, que se construyó de la siguiente manera. Se modificó un vector pYES6/CT (Invitrogen) sustituyendo una región de su ADN que contenía un gen de resistencia a blasticidina por un segmento de ADN que contenía un

45 gen his3 (para la selección en medios que carecen de histidina). Se eliminó el gen de blasticidina mediante digestión de pYES6/CT con BglII y NheI y purificación en gel del fragmento de vector de ~4913 pb resultante. Se amplificó este gen his3 a partir del vector de levadura pRS423 (ATCC 77104, n.º de GenBank U03454) usando los cebadores PO-His5’ (SEQ ID NO: 92) y PO-His3 (SEQ ID NO: 93).

PO-His5’ GACTACTAGTCTAAGAAACCATTATTATCAT

PO-His3’ GACTGGATCCAGCTTTAAATAATCGGTGTCA

Esto generó una región de ~1251 pb del plásmido pRS423 que contenía este gen his3. Se incorporaron sitios de

55 reconocimiento de enzimas de restricción en los cebadores para facilitar la clonación (5’ SpeI y 3’ BamHI, subrayados). Se digirió el fragmento de PCR con SpeI y BamHI y se ligó al fragmento de vector de ~4913 pb obtenido a partir de pYES6/CT para formar pYES6-His. Se digirió este vector con BamHI y XbaI en la preparación para la inserción del gen hetI.

El gen hetI se había clonado anteriormente y usado con los genes de AGPI sintasa de Schizochytrium para la producción de AGPI en E. coli (publicación de solicitud de patente estadounidense n.º 20040235127, ejemplo 2). Tal como se indica en esa solicitud, no hay codones de metionina presentes en el marco de lectura abierto, pero hay varios posibles codones de iniciación alternativos (TTG y ATT) cerca del extremo 5’ (Black y Wolk, 1994, JBC 116, 2282 - 2292). Se usó PCR para amplificar el Orf del ADN genómico de Nostoc. Se diseñó el cebador en 5’ de modo 65 que se sustituyó la primera T del codón TTG en 5’ más alejado por una A para crear un codón de metionina (ATG). El cebador en 3’ incluía el codón de terminación TGA. La región amplificada se extendió desde el pb 3994 hasta el

3282 de la secuencia de nucleótidos de Nostoc depositada con el n.º de GenBank L22883 (siendo el nucleótido 3994 la segunda T del codón TTG alterado para formar el codón ATG). Se clonó este Orf de hetI amplificado en un vector pACYC 184 junto con elementos reguladores flanqueantes para la expresión en E. coli. Se usó este clon del Orf de hetI como ADN molde para amplificar el gen en la preparación para la clonación en pYES6-His. Se usaron los cebadores HetI 5’ (SEQ ID NO: 94) y HetI 3’ (SEQ ID NO: 95) para crear un fragmento de 740 pb que contenía el Orf de hetI.

HetI 5’ GACTGGATCCGCCACCATGTTGCAGCATACTTGGCTACCAAAACCC

HetI 3’ GACTTCTAGATCAATAATGCCAGAATTTTGGCTGC

Se incorporaron sitios de reconocimiento de enzimas de restricción en los cebadores para facilitar la clonación (5’ BamHI y 3’ XbaI, subrayados). El codón de iniciación de metionina ATG (cebador en 5’) y el codón de terminación TGA (mostrado como el triplete TCA inverso en el cebador en 3’) se muestran en negrita. Se digirió el producto de PCR con BamHI y XbaI y se ligó en el vector pYES6-His anteriormente preparado para formar pYES-His/Het/CT (pYES6-His:HetI).

Resultados de expresar pYES6-Leu:sOrfA, pYES3:sOrfb, pYES2:OrfC y pYES6-His:HetI en levadura.

La figura 7 muestra una comparación de perfiles de CG de EMAG derivados de células de levadura que expresaban el sistema de AGPI sintasa de Schizochytrium (sOrfA, sOrfB, OrfC y hetI) y uno obtenido a partir de células control (que carecían del gen sOrfA), denominadas tales cepas de levadura en el presente documento cepas BRY 4.5 y BRY 3.3, respectivamente. Se recogieron células ~20 h tras la inducción. Puede observarse que aparecieron dos picos de EMAG novedosos en el perfil de la cepa que expresaba el sistema de AGPI sintasa completo. Estos dos picos se identificaron como DPAn-6 y DHA mediante comparación del tiempo de elución con patrones auténticos y posteriormente mediante análisis de EM. Tal como se predijo a partir de la presente caracterización de la AGPI sintasa de Schizochytrium, aparte de DHA y DPAn-6, no resulta evidente ningún otro pico novedoso en el perfil. La figura 8 muestra la región del cromatograma de CG de la figura 8 que contiene los EMAG de AGPI. Tanto las células control como la célula que expresa la AGPI sintasa contienen un pico que eluye cerca del EMAG de DHA. Esto se ha identificado como EMAG C26:0 (mediante análisis de espectro de masas) y probablemente se deriva de esfingolípidos. Aunque eluye cerca del pico de DHA, la resolución es suficiente de modo que no interfiere con la cuantificación de DHA. El pico de DPAn-6 está bien separado de otros lípidos de levadura endógenos en el perfil de EMAG. En este ejemplo particular de la cepa BRY 4.5, las células que expresaban el sistema de AGPI sintasa de Schizochytrium acumularon el 2,4% de DHA y el 2,0% de DPAn-6 (como porcentaje de los EMAG totales; véase la tabla 4 a continuación). La suma de DHA y DPAn-6 es del 4,4% de los ácidos grasos medidos en las células. La razón de DHA con respecto a DPAn-6 observada en las células fue de ~1,2:1.

Los resultados presentados anteriormente que muestran la expresión de la AGPI sintasa Schizochytrium en levadura proporcionan una confirmación de la ruta propuesta en las anteriores solicitudes así como de las predicciones en cuanto a las alteraciones de los perfiles de ácidos grasos que pueden esperarse en levadura y también en plantas.

Parte B

Expresión de Orf A, B de AGPI sintasa de Schizochytrium y Het 1 de Nostoc en levadura en combinación con un gen híbrido que codifica para un OrfC que contiene una región DH2 derivada del homólogo de OrfC de Thraustochytrium 23B, y los efectos sobre los AGPI producidos en esas células.

Expresión de genes orfC de Schizochytrium/Th.23B híbridos en levadura: Tal como se describe en otras secciones de esta solicitud, los inventores han descubierto que los principales determinantes de la razón de productos de AGPI n-3 con respecto a n-6 de AGPI sintasas residen en la proteína OrfC y más específicamente en la región DH2 de esa proteína. Experimentos de sustitución génica tanto en E. coli como en Schizochytrium usando el homólogo de OrfC derivado de Th.23B en combinación con los genes de AGPI sintasa derivados de Schizochytrium dieron como resultado la alteración de la razón de DHA con respecto a DPAn-6 producida por esos sistemas mixtos. En E. coli, los productos de la AGPI sintasa se acumulan como ácidos grasos libres supuestamente sin influencia sobre la acumulación de los productos primarios de la enzima por parte de enzimas de síntesis de lípidos del organismo huésped. En Schizochytrium, los productos de AGPI se acumulan en los lípidos esterificados, pero es probable que las enzimas de síntesis de lípidos endógenas puedan admitir fácilmente tanto DHA como DPAn-6 ya que son componentes principales de la fracción lipídica del huésped sin modificar. La expresión del sistema de AGPI sintasa mixto en levadura proporcionará un modelo para huéspedes eucariotas heterólogos (por ejemplo, plantas).

Los intentos para expresar los genes orfC de Th.23B no sintéticos o completamente sintéticos en levadura fueron insatisfactorios, ya que no pudieron detectarse las proteínas esperadas. En cambio, la expresión de los constructos de orfC híbridos (descritos a continuación) dio como resultado la producción de proteínas activas.

OrfC de Schizochytrium / Th.23Bs híbridos en pYES2: Se digirió el plásmido que contenía el orfC de Schizochytrium nativo, pYES2:OrfC (descrito anteriormente), con BsiWI y PmlI para eliminar la sección de ADN que codifica para la región DH2 y algo del ADN flanqueante. La región eliminada fue de desde ~1179 pb (el sitio de BsiWI) hasta ~3256 pb (el sitio de PmlI) de la secuencia de orfC de Schizochytrium (SEQ ID NO: 5). Se purificó en gel el fragmento de 8,4 kb resultante (que contenía el vector así como las porciones en 5’ y en 3’ del OrfC). Se digirió un plásmido anteriormente descrito (véase el ejemplo 2) que contenía un orfC de Schizochytrium / Th.23B híbrido

5 (pREZ179 = híbrido de pColA DUET-orfC de Schizo.- DH2 de Th.23B) con BsiWI y PmlI y se purificó en gel un fragmento de 2 kb que contenía la región DH2 de Th.23B y el ADN de Schizochytrium flanqueante. Se ligaron entre sí los dos fragmentos purificados para formar pYES2: OrfC-23BDH2.

Se usó una estrategia similar para crear pYES2: OrfC-s23BDH2. En este caso el plásmido usado como fuente para

10 la región DH2 de Th.23B sintética (pDD22; véase el ejemplo 3) fue un orfC híbrido en el que el ADN que codifica para el dominio DH2 de Th.23B se derivó de una región codificante sintética cuyos codones se habían modificado para corresponder más estrechamente a las preferencias de Schizochytrium (véase el ejemplo 3).

Resultados de expresar pYES6-Leu:.sOrf A, pYES3:sOrf’ B, pYES6-His:Hetl y pYES2:OrfC-23BDH2 orpYES2: OrfC

15 s23BDH2 en levadura: La tabla 4 muestra los AGPI producidos en levadura que expresaba constructos de Orf C híbrido junto con las subunidades A y B de Schizochytrium y HetI de Nostoc. Tal como se observó anteriormente en la parte A, los únicos picos novedosos detectados en estas muestras de levadura fueron DHA y DPAn-6. Las condiciones de crecimiento y la preparación de muestras fueron tal como se describió anteriormente. Sólo se muestran los datos de AGPI relevantes (como EMAG facilitados como % de área). Las muestras marcadas como

20 BRY 4.21 contienen el orfC híbrido con la región DH2 de Th.23B nativa, mientras que la muestra marcada como BRY 4.23 contiene el orfC híbrido con la región DH2 de Th.23B derivada del gen sintético. Se sometieron a prueba dos muestras (a y b, de aislados independientes) para la cepa BRY 4.21 mientras que se sometió a prueba un aislado de la cepa BRY 4.23. Con respecto a las células que expresaban el orfC de Schizochytrium, aquellas células que expresaban cualquier forma del orfC híbrido tienen una razón DHA/DPAn-6 superior (un promedio de ~2,6 para

25 aquellas con la DH2 de Th.23B nativa y un valor de ~2,9 para la muestra con la DH2 de Th.23B sintética). La expresión del gen orfC híbrido en levadura dio claramente como resultado un aumento en la razón de DHA con respecto a DPAn-6 con relación a la levadura que expresaba el gen orfC de Schizochytrium nativo. El hecho de que la razón DHA/DPAn-6 en las células de Th.23B o en Schizochytrium que expresan el orfC híbrido sea muy superior (08-10) indica que otros factores están contribuyendo al sesgo hacia la acumulación de DHA con respecto a DPAn

30 6. La observación de que la razón sí que aumentó en levadura indica que este constructo es un modelo útil para expresar un sistema de AGPI sintasa en huéspedes eucariotas heterólogos (por ejemplo, levadura o plantas).

Tabla 4

Cepa: forma de orfC DHA DPAn-6 DHA + DPA DHA/DPA

BRY 4.5: Schizo. 2,4 2,0 4,4 1,2

BRY 4.21a: DH2 de Th.23B 4,30 1,51 5,81 2,85

BRY 4.21b: DH2 de Th.23B 4,36 1,67 6,03 2,61

BRY 4.23: DH2 de Th.23B sint. 2,71 0,92 3,63 2,95

35 Ejemplo 7

El siguiente ejemplo demuestra la producción de AGPI en experimentos a escala de fermentación usando diversas cepas de Schizochytrium modificadas genéticamente descritas en el ejemplo 4.

40 Experimento 1

Usando fermentadores de 2 litros en condiciones de fermentación típicas, se cultivaron dos cultivos de un Schizochytrium de tipo natural (ATCC 20888) y dos cultivos de un Schizochytrium transgénico (B67-5, que tiene una

45 región codificante de orfC de Th.23B optimizada para codones (sintética) en lugar de la región codificante de orfC de Schizochytrium nativa; véase el ejemplo 4) para comparar los perfiles de ácidos grasos. Se fermentó cada cepa en un medio que contenía carbono, nitrógeno, fósforo, sales, metales traza y vitaminas. Se inoculó cada fermentador con un cultivo de siembra típico, entonces se cultivó durante 80 horas y se le alimentó tanto una fuente de carbono como una fuente de nitrógeno durante el cultivo. La fuente de nitrógeno sólo se alimentó y se consumió durante la

50 fase de crecimiento, mientras que la fuente de carbono se alimentó y se consumió durante la totalidad de la fermentación. Tras 80 horas, se centrifugaron muestras de cada fermentador, se liofilizaron y se analizaron mediante cromatografía de gases para determinar el contenido en ácidos grasos.

Condiciones de fermentación típicas: Temperatura: 28 - 30ºC

pH: 5,0 - 7,5

flujo de aire: 0,25 - 2,0 vvm glucosa: 5 - 35 g/l (concentración) inóculo: 7,5% - 15%

Los resultados fueron tal como se muestran en la tabla 5 a continuación:

Tabla 5

agitación: 100 - 300 cps

Registro de cepa

horas: 20888 de tipo natural 20888 de tipo natural B67-5 transgénica B67-5 transgénica

fermentador: 80 80 80 80

BN25: BN28 BN26 BN27

% de 10:0: 0,02 0,01 0,01 0,01

% de 12:0: 0,20 0,18 0,20 0,20

% de 13:0: 0,00 0,00 0,07 0,00

% de 14:0: 9,57 8,89 9,76 9,80

% de 16:0: 33,68 32,58 34,62 34,51

% de 16:1: 0,13 0,12 0,18 0,17

% de 17:0: 0,08 0,09 0,07 0,07

% de 18:0: 0,78 0,76 0,77 0,76

% de 18:1 n-9: 0,00 0,00 0,08 0,08

% de 18:1 n-7: 0,14 0,12 0,11 0,11

% de 18:3 n-6: 0,14 0,15 0,08 0,08

% de 18:3 n-3: 0,03 0,04 0,08 0,08

% de 20:0: 0,09 0,08 0,08 0,08

% de 20:3 n-6: 0,32 0,33 0,09 0,09

% de 20:4 ARA: 0,25 0,30 0,10 0,11

% de 20:5 EPA: 0,36 0,38 0,60 0,60

% de 22:5 n-6: 14,98 15,37 6,52 6,52

% de 22:5 n-3 % de 22:6 DHA: 0,00 0,00 0,21 0,21

37,32: 38,64 44,47 44,58

DHA/DPA: 2,49 2,51 6,82 6,84

Tal como se muestra en la tabla 5, la cepa B67-5 que contiene la región codificante de orfC de Thraustochytrium 23B sintética en lugar de la región codificante de Schizochytrium nativa produjo más DHA y tuvo una mayor razón de

10 DHA con respecto a DPAn-6 que la cepa de Schizochytrium de tipo natural.

Experimento 2

Usando fermentadores de 10 litros en condiciones de fermentación típicas, se cultivaron un cultivo de un

15 Schizochytrium de tipo natural (ATCC 20888) y un cultivo de Schizochytrium transgénico (B105-1A1; que contiene una región codificante de DH2 de Th.23B no optimizada para codones (nativa de Thraustochytrium) en lugar de la región DH2 de Schizochytrium nativa; véase el ejemplo 4) para comparar los perfiles de ácidos grasos. Se hizo crecer cada cepa en un medio que contenía carbono, nitrógeno, fósforo, sales, metales traza y vitaminas. Se inoculó cada fermentador con un cultivo de siembra típico, entonces se cultivó durante 72 horas y se le alimentó tanto una fuente de carbono como una fuente de nitrógeno durante el cultivo. La fuente de nitrógeno sólo se alimentó y se consumió durante la fase de crecimiento, mientras que la fuente de carbono se alimentó y se consumió durante la totalidad de la fermentación. Tras 72 horas, se centrifugaron muestras de cada fermentador, se liofilizaron y se analizaron mediante cromatografía de gases para determinar el contenido en ácidos grasos.

Condiciones de fermentación típicas: Temperatura: 28 - 30ºC pH: 5,0 - 7,5 agitación: 100 - 300 cps flujo de aire: 0,25 - 2,0 vvm glucosa: 5 - 35 g/l (concentración) inóculo: 7,5%-15%

Los resultados se muestran en la tabla 6.

Registro de cepa

horas: 20888 de tipo natural B105-1A-1

recipiente: 72 72

BN23: BN24

% de 10:0: 0,00 0,00

% de 12:0: 0,26 0,28

% de 13:0: 0,09 0,10

% de 14:0: 11,36 12,39

% de 16:0: 37,10 40,02

% de 16:1: 0,13 0,15

% de 17:0: 0,07 0,06

% de 18:0: 0,83 0,86

% de 18:1 n-9: 0,00 0,11

% de 18:1 n-7: 0,08 0,08

% de 18:3 n-6: 0,13 0,05

% de 18:3 n-3: 0,00 0,00

% de 20:0: 0,08 0,10

% de 20:3 n-6: 0,28 0,00

% de 20:4 ARA: 0,26 0,00

% de 20:5 EPA: 0,34 0,35

% de 22:5 n-6: 14,48 4,40

% de 22:5 n-3: 0,00 0,00

% de 22:6 DHA: 34,07 39,56

DHA/DPA: 2,53 8,98

La tabla 6 muestra que la cepa que comprende una región DH2 de Thraustochytrium 23B en lugar de la región DH2 de Schizochytrium tiene una razón DHA/DPAn-6 muy superior, ilustrando de nuevo la razón de DHA mejorada que se alcanza mediante el uso de sistemas de PKS de AGPI quiméricos descritos en el presente documento.

15 Ejemplo 8

Este ejemplo describe la construcción y evaluación de todas las combinaciones de regiones codificantes de orfA, orfB y orfC de Th. 23B optimizadas para codones sintéticas expresadas en Schizochytrium.

Anteriormente (ejemplos 1 y 4) se han facilitado descripciones detalladas de métodos para la sustitución exacta de la región codificante de orfC de Schizochytrium por la región codificante de orfC de Th.23B optimizada para codones sintética. Los expertos en la técnica reconocen que estas técnicas pueden aplicarse generalmente a la mayoría de los genes de interés. Los expertos en la técnica reconocen además que tales diseños de genes y sustituciones pueden alcanzarse mediante variaciones de estos métodos u otros métodos totalmente diferentes. Por ejemplo, pueden delecionarse simultáneamente múltiples genes/regiones codificantes y sustituirse simultáneamente. En Schizochytrium, los genes orfA y orfB se encuentran próximos uno a otro (“ligados”) en el genoma separados por una región intergénica (que comprende SEQ ID NO: 76). Estas dos regiones codificantes (junto con la región intergénica) pueden delecionarse simultáneamente mediante métodos análogos a los descritos anteriormente para orfC (publicación de solicitud de patente estadounidense n.º 20050100995). Entonces pueden usarse métodos similares a los descritos en los ejemplos 1 y 4 anteriores para crear simultáneamente sustituciones de “costura perfecta” de regiones codificantes de orfA y orfB deTh.23B optimizadas para codones sintéticas (incluyendo la región intergénica de Schizochytrium completa) en el locus de orfA/orfB de Schizochytrium. De esta manera se crearon cepas tales como B80-1 y B80-20 (tabla 7).

En otro ejemplo, pueden crearse deleciones de región codificante mediante un método “en dos etapas” en el que un plásmido que porta la estructura de deleción marcada más un segundo marcador seleccionable se recombina inicialmente en su totalidad mediante un único acontecimiento de cruzamiento en el locus diana. Entonces, la estructura integrante “se resuelve” mediante un único acontecimiento de cruzamiento en un sitio en el lado opuesto de la estructura de deleción de manera que se pierde el segundo marcador seleccionable y la estructura de deleción permanece en lugar de la estructura génica original (Rothstein R., “Targeting, Disruption, Replacement, and Allele Rescue: Integrative DNA Transformation in Yeast”, págs. 281-301 en Methods in Enzymology, vol. 194 (1991), Elsevier/Academic Press, Ámsterdam). De esta manera se creó el precursor de la cepa B71-1 (tabla 7).

Mediante los métodos explicados en este documento, se creó un conjunto de cepas de Schizochytrium en las que se han sustituido todas las combinaciones de las regiones codificantes de orfA, orfB y orfC de Th.23B sintéticas (optimizadas para codones) por las regiones codificantes de Schizochytrium relacionadas. El miembro del conjunto que no contiene genes de Th.23B es Schizochytrium ATCC20888 de tipo natural, y el miembro del conjunto que sólo contiene la región codificante de orfC de Th.23B optimizada para codones sintética (de longitud completa), B67-5, se describió en el ejemplo 4 y en la tabla 1 anteriores. Se evaluó este conjunto de ocho cepas para determinar la producción de ácidos grasos durante el crecimiento en medio SSFM tal como se describió en el ejemplo 4 anterior y se facilitan los datos en la tabla 7.

El plásmido pDD26 contiene la región codificante de orfA de Th.23B sintética de longitud completa unida mediante costura perfecta a las regiones en el sentido de 5’ y en el sentido de 3’ del gen orfA de Schizochytrium. La secuencia de nucleótidos de la región codificante de pDD26 se representa en el presente documento por SEQ ID NO: 71. SEQ ID NO: 71 codifica para SEQ ID NO: 39. Se depositó pDD26 con el n.º de registro de la ATCC PTA-8411, tal como se describió anteriormente en el presente documento.

El plásmido pDD32 contiene la región codificante de orfB de Th.23B sintética de longitud completa unida mediante costura perfecta a las regiones en el sentido de 5’ y en el sentido de 3’ del gen orfB de Schizochytrium. La secuencia de nucleótidos de la región codificante de pDD32 se representa en el presente documento por SEQ ID NO: 72. SEQ ID NO: 72 codifica para SEQ ID NO: 52. Se depositó pDD32 con el n.º de registro de la ATCC PTA-8412, tal como se describió anteriormente en el presente documento.

Los productos proteicos de las tres regiones codificantes de orf de Th.23B optimizadas para codones sintéticas funcionan en Schizochytrium e interaccionan satisfactoriamente con otros componentes de AGPI sintasa independientemente de la fuente. La expresión de la proteína OrfC de Th.23B (cepa B67-5) provoca un aumento en la razón DHA/DPA hasta un valor que se aproxima al de la cepa de Th.23B nativa, un resultado anteriormente demostrado en el ejemplo 4. Este fenómeno se observa para todas las combinaciones que expresan la proteína OrfC de Th.23B (B67-5, B79-11, B79-1 y B80-20). Sorprendentemente, la combinación de regiones codificantes de orfC de Th.23B optimizada para codones sintética más de orfA de Th.23B optimizadas para codones sintéticas (cepa B79-1) conduce al mayor nivel de producción de DHA, mientras que se mantiene la alta razón DHA/DPA. El aumento de la producción de DHA en esta cepa de Schizochytrium parece deberse tanto al aumento de la razón n3/n-6 provocado por OrfC de Th.23B como al aumento de la producción de AGPI totales provocado por la interacción de OrfA de Th.23B con OrfC de Th.23B.

Estos datos demuestran que componentes del complejo de AGPI sintasa de diferentes organismos pueden funcionar conjuntamente de manera satisfactoria y pueden conferir características específicas del organismo fuente a un nuevo huésped. Además, la manipulación de la fuente y los niveles de expresión de componentes de AGPI sintasa pueden conducir a perfiles novedosos, productividades superiores y menores costes de ácidos grasos objetivo.

Tabla 7

EMAG: DHA

Gen(es) orf de Th. 23B: DPA (% de dcw) DHA (% de EMAG)

cepa: (% de dcw) (% de dcw) DHA/DPA

ATCC20888: (ninguno) 73,9 16,4 5,4 22,1 3,04

871-1: A 74,2 17,2 5,15 23,2 3,34

882-3: B 67,9 15,4 4,93 22,7 3,12

B67-5: C 76,2 22,2 2,88 29,2 7,71

B80-1: AB 77,9 12,8 3,20 16,4 4,00

B79-11: BC 79,1 23,4 2,72 29,6 8,60

B79-1: AC 79,0 31,1 2,90 39,4 10,72

B80-20: ABC 77,4 20,9 2,32 27,0 9,01

Aunque se han descrito en detalle diversas realizaciones de la presente invención, resulta evidente que a los expertos en la técnica se les ocurrirán modificaciones y adaptaciones de esas realizaciones. Sin embargo, debe 5 entenderse expresamente que tales modificaciones y adaptaciones se encuentran dentro del alcance de las reivindicaciones.

Lista de secuencias

10 <110> Martek Biosciences Corporation

<120> Sistemas de policétido sintasa de AGPI quiméricos y usos de los mismos

<130> P038919EP 15

<140> Documento 08755645.2

<141> 20 <150> Documento US 11/749686

<151>

<160> 102 25

<170> PatentIn versión 3.5

<210> 1 30 <211> 8733

<212> ADN

<213> Schizochytrium sp. 35

<220>

<221> CDS 40 <222> (1)..(8733)

<400> 1

<210> 2 5 <211> 2910

<212> PRT

<213> Schizochytrium sp.

<400> 2

<210> 3 5 <211> 6180

<212> ADN

<213> Schizochytrium sp.

<220>

<221> CDS 15 <222> (1)..(6180)

<400> 3

5 10: <210> 4 <211> 2059 <212> PRT <213> Schizochytrium sp. <400> 4

100

<210> 5 5 <211> 4509

<212> ADN

<213> Schizochytrium sp.

<220>

<221> CDS 15 <222> (1)..(4509)

<400> 5

<210> 6 5 <211> 1502

<212> PRT

<213> Schizochytrium sp.

<400> 6

<210> 7 5 <211> 1500

<212> ADN

<213> Schizochytrium sp.

<220>

<221> CDS 15 <222> (1)..(1500)

<400> 7

<210> 8 5 <211> 500

<212> PRT

<213> Schizochytrium sp.

<400> 8

<210> 9

<211> 1278 <212> ADN

<213> Schizochytrium sp.

<220>

<221> CDS 10 <222> (1)..(1278)

<400> 9 <212> PRT

<213> Schizochytrium sp.

<400> 10

<210> 11

<211> 5

<212> PRT

<213> Schizochytrium sp.

<220>

<221> MISC_FEATURE

<222> (4)..(4)

<223> Xaa puede ser cualquier aminoácido que se produce de manera natural

<400> 11

<210> 12

<211> 258

<212> ADN

<213> Schizochytrium sp.

<220> 5 <221> CDS

<222> (1)..(258)

<400> 12

<212> PRT

<213> Schizochytrium sp.

<400> 13

<210> 14

<211> 5

<212> PRT

<213> Schizochytrium sp. 10 <400> 14

<210> 15

<211> 21

<212> PRT 20 <213> Schizochytrium sp.

<400> 15

25: <210> 16

<211> 3006

30: <212> ADN

<213> Schizochytrium sp.

35: <400> 16

<210> 17 5 <211> 2133

<212> ADN

<213> Schizochytrium sp.

<220>

<221> CDS 15 <222> (1)..(2133)

<400> 17

<210> 18

<211> 711

<212> PRT

<213> Schizochytrium sp. 10 <400> 18

<210> 19

<211> 1350 <212> ADN

<213> Schizochytrium sp.

<220>

<221> CDS 10 <222> (1)..(1350)

<400> 19

<210> 20

<211> 450

<212> PRT

<213> Schizochytrium sp.

<400> 20

<210> 21

5: <211> 1323

<212> ADN

10: <213> Schizochytrium sp.

145

<220>

<221> CDS

<222> (1)..(1323)

<400> 21

<212> PRT

<213> Schizochytrium sp.

<400> 22

<212> ADN

<213> Schizochytrium sp.

<220>

<221> CDS 15 <222> (1)..(1500)

<400> 23

<212> PRT

<213> Schizochytrium sp.

<400> 24

<210> 25

<211> 1530 <212> ADN

<213> Schizochytrium sp.

<220>

<221> CDS 10 <222> (1)..(1530)

<400> 25

<212> PRT

<213> Schizochytrium sp.

<400> 26

<212> ADN

<213> Schizochytrium sp.

<220>

<221> CDS 15 <222> (1)..(1350)

<400> 27

<212> PRT

<213> Schizochytrium sp.

<400> 28

<212> ADN

<213> Schizochytrium sp.

<220>

<221> CDS 15 <222> (1)..(1497)

<400> 29

<212> PRT

<213> Schizochytrium sp.

<400> 30

<212> ADN

<213> Schizochytrium sp.

<220>

<221> CDS 15 <222> (1)..(1512)

<400> 31

<212> PRT

<213> Schizochytrium sp.

<400> 32

<212> ADN

<213> Nostoc sp.

<400> 33

<212> PRT

<213> Nostoc sp.

<400> 34

<212> ADN

<213> Secuencia artificial

<220>

<223> sintética 15 <400> 35

<212> ADN

<213> Secuencia artificial

<220>

<223> sintética 15 <400> 36

<212> ADN

<213> Secuencia artificial

<220>

<223> sintética 15 <400> 37

<212> ADN

<213> Thraustochytrium sp.

<220>

<221> CDS 15 <222> (1) .. (8433)

<400> 38

<212> PRT

<213> Thraustochytrium sp.

<400> 39

<212> ADN

<213> Thraustochytrium sp.

<220>

<221> CDS 15 <222> (1)..(1500)

<400> 40

<212> PRT

<213> Thraustochytrium sp.

<400> 41

<212> ADN

<213> Thraustochytrium sp.

<220>

<221> CDS 15 <222> (1) .. (1500)

<400> 42

<212> PRT

<213> Thraustochytrium sp.

<400> 43

<212> ADN

<213> Thraustochytrium sp.

<220>

<221> CDS 15 <222> (1) .. (351)

<400> 44 <212> PRT

<213> Thraustochytrium sp.

<400> 45

15 <210> 46

<211> 5

<212> PRT

<213> Thraustochytrium sp.

<220>

<221> MISC_FEATURE

<222> (1) .. (5)

<223> Xaa puede ser cualquier aminoácido que se produce de manera natural

<400> 46

<210> 47

<211> 2790

<212> ADN

<213> Thraustochytrium sp.

<220>

<221> CDS

<222> (1) .. (2790)

<400> 47

<212> PRT

<213> Thraustochytrium sp.

<400> 48

<210> 49

<211> 2433

<212> ADN

<213> Thraustochytrium sp.

<220>

<221> CDS

<222> (1)..(2433)

<400> 49

<212> PRT

<213> Thraustochytrium sp.

<400> 50

<210> 51

<211> 5808

<212> ADN

<213> Thraustochytrium sp.

<220>

<221> CDS

<222> (1)..(5805)

<220>

<221> misc_feature

<222> (743)..(743)

<223> n es a, c, g o t

<400> 51

<210> 52

5: <211> 1935

<212> PRT

10: <213> Thraustochytrium sp. <220>

<221> MISC_FEATURE

15: <222> (248)..(248)

<223> Xaa puede ser Asp, Gly, Ala o Val

20: <400> 52

<210> 53

<211> 1500

<212> ADN

<213> Thraustochytrium sp.

<220>

<221> CDS

<222> (1)..(1500)

<220>

<221> misc_feature

<222> (743)..(743)

<223> n es a, c, g o t

<400> 53

<210> 54

<211> 500

<212> PRT

<213> Thraustochytrium sp.

<220> 5 <221> MISC_FEATURE

<222> (248)..(248)

<223> Xaa puede ser Asp, Gly, Ala o Val

<400> 54

<212> ADN

<213> Thraustochytrium sp.

<220>

<221> CDS 15 <222> (1)..(1500)

<400> 55

<212> PRT

<213> Thraustochytrium sp.

<400> 56

<212> ADN

<213> Thraustochytrium sp.

<220>

<221>: CDS 15 <222> (1)..(1500)

<400> 57

<210> 58

<211> 500

<212> PRT

<213> Thraustochytrium sp.

<400> 58

<212> ADN

<213> Thraustochytrium sp.

<220>

<221>: CDS 15 <222> (1)..(1305)

<400> 59

<212> PRT

<213> Thraustochytrium sp.

<400> 60

<212> ADN

<213> Thraustochytrium sp.

<220>

<221>: CDS 15 <222> (1)..(4410)

<400> 61

<210> 62

<211> 1470

<212> PRT

<213> Thraustochytrium sp.

<400> 62

<212> ADN

<213> Thraustochytrium sp.

<220>

<221>: CDS 15 <222> (1)..(1500)

<400> 63

<212> PRT

<213> Thraustochytrium sp.

<400> 64

<212> ADN

<213> Thraustochytrium sp.

<220>

<221> CDS

<222> (1)..(1500)

<400> 65

<210> 66

<211> 500

<212> PRT

<213> Thraustochytrium sp. 10 <400> 66

<212> ADN

<213> Thraustochytrium sp.

<220>

<221> CDS 15 <222> (1)..(1410)

<400> 67

<212> PRT

<213> Thraustochytrium sp.

<400> 68

<212> ADN

<213> Secuencia artificial

<220>

<223> sintética 15 <400> 69

<210> 70

5: <211> 8394

<212> ADN

10: <213> Secuencia artificial <220>

<223> sintética

15: <220>

<221> misc_feature

20: <222> (227)..(227) <223> n es a, c, g o t

<400> 70

<212> ADN

<213> Secuencia artificial

<220>

<223> sintética 15 <400> 71

<210> 72

5: <211> 8647

<212> ADN

10: <213> Secuencia artificial

321

<220>

<223> sintética

<400> 72

<210> 73

5: <211> 4479

<212> ADN

10: <213> Secuencia artificial <220>

<223> sintética

15: <220>

<221> CDS

20: <222> (1)..(4479) <400> 73

<212> PRT

<213> Secuencia artificial

<220>

<223>: Constructo sintético 15 <400> 74

<210> 75

<211> 4479

<212> ADN

<213> Secuencia artificial

<220>

<223>: sintética 10 <400> 75

<212> ADN

<213> Schizochytrium sp.

<400> 76

<212> ADN

<213> Schizochytrium sp.

<220>

<221> misc_feature 15 <222> (2115)..(2115)

<223> n es a, c, g o t

<400> 77

<210> 78 <211> 20

<212> ADN

<213> Secuencia artificial

<220>

<223> sintética

<400> 78 catatggcgc tccgtgtcaa 20

<210> 79

<211> 35

<212> ADN

<213> Secuencia artificial

<220>

<223> sintética

<400> 79 gccaggaagc tttgacatgg ggtgccagga catct 35

<210> 80

<211> 37

<212> ADN

<213> Secuencia artificial

<220>

<223> sintética

<400> 80 tcctggcacc ccatgtcaaa gcttcctggc aacccta 37

<210> 81

<211> 20

<212> ADN

<213> Secuencia artificial

<220>

<223> sintética

<400> 81 agtatacaga ggtgctgaca 20

<210> 82

<211> 28

<212> ADN

<213> Secuencia artificial

<220>

<223> sintética

<400> 82 gcaccccatg agcaagctcc ccggcaac 28

<210> 83

<211> 28

<212> ADN

<213> Secuencia artificial

<220>

<223> sintética

<400> 83 gtatacagag gcgcagacac gttgtaag 28

<210> 84

<211> 28

<212> ADN

<213> Secuencia artificial

<220>

<223> sintética

<400> 84 ctgcagccag atgctcaaga tgtacatg 28

<210> 85

<211> 31

<212> ADN

<213> Secuencia artificial

<220>

<223> sintética

<400> 85 ggagcttgct catggggtgc caggacatct c 31

<210> 86

<211> 10

<212> ADN

<213> Secuencia artificial

<220>

<223> sintética

<400> 86 ggatccatgg 10

<210> 87

<211> 31

<212> ADN

<213> Secuencia artificial

<220>

<223> sintética

<400> 87 aagcttgtgc agtcaagtgc gcaaaaccat g 31

<210> 88

<211> 15

<212> ADN

<213> Secuencia artificial

<220>

<223> sintética

<400> 88 taacccgggt ctaga 15

<210> 89

<211> 31

<212> ADN

<213> Secuencia artificial

<220>

<223> sintética

<400> 89 gactgctagc ttaagcaagg attttcttaa c 31

<210> 90

<211> 31

<212> ADN

<213> Secuencia artificial <220>

<223> sintética

<400> 90 gactggatcc tcctgatgcg gtattttctc c 31

<210> 91

<211> 12

<212> ADN

<213> Secuencia artificial

<220>

<223> sintética

<400> 91 ctaggcggcc gc 12

<210> 92

<211> 31

<212> ADN

<213> Secuencia artificial

<220>

<223> sintética

<400> 92 gactactagt ctaagaaacc attattatca t 31

<210> 93

<211> 31

<212> ADN

<213> Secuencia artificial

<220>

<223> sintética

<400> 93 gactggatcc agctttaaat aatcggtgtc a 31

<210> 94

<211> 46

<212> ADN

<213> Secuencia artificial

<220> <223> sintética

<400> 94 gactggatcc gccaccatgt tgcagcatac ttggctacca aaaccc 46

<210> 95

<211> 35

<212> ADN

<213> Secuencia artificial

<220>

<223> sintética

<400> 95 gacttctaga tcaataatgc cagaattttg gctgc 35

<210> 96

<211> 5

<212> PRT

<213> Secuencia artificial

<220>

<223> Motivo de sitio activo

<220>

<221> misc_feature

<222> (2) .. (2)

<223> Xaa puede ser cualquier aminoácido que se produce de manera natural

<220>

<221> misc_feature

<222> (4) .. (4)

<223> Xaa puede ser cualquier aminoácido que se produce de manera natural

<400> 96

<210> 97

<211> 13

<212> PRT

<213> Secuencia artificial

<220>

<223> Motivo de sitio activo

<220>

<221> MISC_FEATURE

<222> (1) .. (1)

<223> Puede ser Ile

<220>

<221> misc_feature

<222> (2) .. (3)

<223> Xaa puede ser cualquier aminoácido que se produce de manera natural

<220>

<221> misc_feature

<222> (5) .. (7)

<223> Xaa puede ser cualquier aminoácido que se produce de manera natural

<220>

<221> misc_feature

<222> (9) .. (12)

<223> Xaa puede ser cualquier aminoácido que se produce de manera natural

<400> 97

<210> 98

<211> 4

<212> PRT

<213> Schizochytrium sp.

<220>

<221> misc_feature

<222> (2) .. (2)

<223> Xaa puede ser cualquier aminoácido que se produce de manera natural

<400> 98

<210> 99

<211> 4

<212> PRT

<213> Schizochytrium sp.

<400> 99

<210> 100

<211> 15

<212> PRT

<213> Schizochytrium sp.

<400> 100

<210> 101

<211> 10

<212> PRT

<213> Secuencia artificial

<220>

<223> Constructo sintético

<400> 101

<210> 102

<211> 11

<212> PRT

<213> Secuencia artificial

<220>

<223> Constructo sintético

<400> 102

Claims

REIVINDICACIONES

1.

Sistema de policétido sintasa (PKS) de ácidos grasos poliinsaturados (AGPI) quimérico, en el que un dominio deshidrasa-2 (DH2) de la proteína transportadora de β-hidroxiacil-acilo similar a FabA de un primer sistema de PKS de AGPI se sustituye por un dominio DH2 de un segundo sistema de PKS de AGPI diferente, para producir un sistema de PKS de AGPI quimérico que produce una razón diferente de AGPI omega-3 con respecto a omega-6 en comparación con el primer sistema de PKS de AGPI.
2.

Sistema de PKS de AGPI quimérico según la reivindicación 1, en el que una proteína que comprende el dominio DH2 del primer sistema de PKS de AGPI se sustituye por una proteína homóloga que comprende el dominio DH2 del segundo sistema de PKS de AGPI.
3.

Sistema de PKS de AGPI quimérico según la reivindicación 1 o la reivindicación 2, en el que el dominio DH2 del sistema de PKS de AGPI primero o segundo comprende un dominio DH2 de Schizochytrium o Thraustochytrium.
4.

Sistema de PKS de AGPI quimérico según cualquiera de las reivindicaciones 1-3, en el que:

(a)

el primer sistema de PKS de AGPI es un sistema de PKS de AGPI de Schizochytrium, y el segundo sistema de PKS de AGPI es un sistema de PKS de AGPI de Thraustochytrium,

(b)

el primer sistema de PKS de AGPI es un sistema de PKS de AGPI de Schizochytrium, y el segundo sistema de PKS de AGPI es de un traustoquitridio diferente, en el que un OrfC que comprende un dominio DH2 del sistema de PKS de AGPI de Schizochytrium se sustituye por un OrfC que comprende un dominio DH2 del traustoquitridio diferente,

(c)

el primer sistema de PKS de AGPI es un sistema de PKS de AGPI de Schizochytrium, y el segundo sistema de PKS de AGPI es de Thraustochytrium 23B, en el que un OrfC que comprende un dominio DH2 del sistema de PKS de AGPI de Schizochytrium se sustituye por un OrfC que comprende un dominio DH2 de Thraustochytrium 23B, o

(d)

el primer sistema de PKS de AGPI es un sistema de PKS de AGPI de Schizochytrium, y el segundo sistema de PKS de AGPI es de Thraustochytrium 23B, en el que el dominio DH2 del OrfC del sistema de PKS de AGPI de Schizochytrium se sustituye por el dominio DH2 de Thraustochytrium 23B para producir una proteína quimérica que comprende el dominio DH2 de Thraustochytrium 23B.
5.

Sistema de PKS de AGPI quimérico según la reivindicación 4, en el que el OrfC de Thraustochytrium 23B se codifica por una secuencia de ácido nucleico que está optimizada para el uso de codones de Schizochytrium.
6.

Sistema de PKS de AGPI quimérico según la reivindicación 5, en el que la secuencia de ácido nucleico comprende SEQ ID NO: 70.
7.

Sistema de PKS de AGPI quimérico según cualquiera de las reivindicaciones 4-6, en el que el OrfA del sistema de PKS de AGPI de Schizochytrium se sustituye por el OrfA de Thraustochytrium 23B.
8.

Sistema de PKS de AGPI quimérico según la reivindicación 7, en el que el OrfA de Thraustochytrium 23B se codifica por una secuencia de ácido nucleico que está optimizada para el uso de codones de Schizochytrium.
9.

Sistema de PKS de AGPI quimérico según la reivindicación 8, en el que la secuencia de ácido nucleico que codifica para OrfA comprende SEQ ID NO: 71.
10.

Sistema de PKS de AGPI quimérico según cualquiera de las reivindicaciones 4-6, en el que el OrfB del sistema de PKS de AGPI de Schizochytrium se sustituye por el OrfB de Thraustochytrium 23B.
11.

Sistema de PKS de AGPI quimérico según la reivindicación 10, en el que el OrfB de Thraustochytrium 23B se codifica por una secuencia de ácido nucleico que está optimizada para el uso de codones de Schizochytrium.
12.

Sistema de PKS de AGPI quimérico según la reivindicación 11, en el que la secuencia de ácido nucleico que codifica para OrfB comprende SEQ ID NO: 72.
13.

Sistema de PKS de AGPI quimérico según la reivindicación 4, en el que la proteína quimérica que comprende el dominio DH2 de Thraustochytrium 23B se codifica por una secuencia de ácido nucleico que comprende SEQ ID NO:
73.
14.

Sistema de PKS de AGPI quimérico según la reivindicación 4, en el que el DH2 de Thraustochytrium 23B se codifica por una secuencia de ácido nucleico que está optimizada para el uso de codones de Schizochytrium.
15.

Sistema de PKS de AGPI quimérico según la reivindicación 4 o la reivindicación 14, en el que la proteína

quimérica que comprende el dominio DH2 de Thraustochytrium 23B se codifica por una secuencia de ácido nucleico que comprende SEQ ID NO: 75.
16.

Sistema de PKS de AGPI quimérico según cualquiera de las reivindicaciones 1-4 ó 7-15, en el que el sistema de PKS de AGPI quimérico comprende una proteína que comprende: una secuencia de aminoácidos que es idéntica en al menos el 95%, 96%, 97%, 98% o el 99% a SEQ ID NO: 74, o una secuencia de aminoácidos de SEQ ID NO: 74.
17.

Sistema de PKS de AGPI quimérico según la reivindicación 1, en el que el sistema de PKS de AGPI quimérico:

(a)

comprende SEQ ID NO: 2, SEQ ID NO: 4 y SEQ ID NO: 74,

(b)

comprende SEQ ID NO: 39, SEQ ID NO: 4 y SEQ ID NO: 62,

(c)

comprende SEQ ID NO: 39, SEQ ID NO: 4 y SEQ ID NO: 74,

(d)

se codifica por moléculas de ácido nucleico que comprenden SEQ ID NO: 1, SEQ ID NO: 3 y SEQ ID NO: 70,

(e)

se codifica por moléculas de ácido nucleico que comprenden SEQ ID NO: 1, SEQ ID NO: 3 y SEQ ID NO: 73,

(f)

se codifica por moléculas de ácido nucleico que comprenden SEQ ID NO: 1, SEQ ID NO: 3 y SEQ ID NO: 75, o

(g)

se codifica por moléculas de ácido nucleico que comprenden SEQ ID NO: 71, SEQ ID NO: 3 y SEQ ID NO: 70.
18.

Método de alteración de la razón de omega-3 con respecto a omega-6 de AGPI producidos por un primer sistema de PKS de AGPI, que comprende expresar el sistema de PKS de AGPI quimérico según cualquiera de las reivindicaciones 1-17 en un organismo.
19.

Método según la reivindicación 18, en el que el sistema de PKS de AGPI quimérico se expresa por un microorganismo o una planta.
20.

Microorganismo o planta o parte de la planta modificado genéticamente, que comprende un sistema de PKS de AGPI quimérico según cualquiera de las reivindicaciones 1-17.
21.

Método de aumento de la producción de AGPI y de alteración de la razón de omega-3 con respecto a omega-6 de AGPI producidos por un primer sistema de PKS de AGPI, que comprende expresar un sistema de PKS de AGPI quimérico en un organismo, en el que el dominio DH2 de un primer sistema de PKS de AGPI se sustituye por un dominio DH2 de un segundo sistema de PKS de AGPI diferente, para producir un sistema de PKS de AGPI quimérico que produce una razón diferente de AGPI omega-3 con respecto a omega-6 en comparación con el primer sistema de PKS de AGPI, y en el que el dominio DH2 del segundo sistema de PKS de AGPI está optimizado para el uso de codones del organismo del que se deriva el primer sistema de PKS de AGPI.