[go: up one dir, main page]

PT975765E - Genes de apoxigenase de ácido gordo vegetal e suas utilizações - Google Patents

Genes de apoxigenase de ácido gordo vegetal e suas utilizações Download PDF

Info

Publication number
PT975765E
PT975765E PT98913438T PT98913438T PT975765E PT 975765 E PT975765 E PT 975765E PT 98913438 T PT98913438 T PT 98913438T PT 98913438 T PT98913438 T PT 98913438T PT 975765 E PT975765 E PT 975765E
Authority
PT
Portugal
Prior art keywords
leu
epoxygenase
phe
tyr
gly
Prior art date
Application number
PT98913438T
Other languages
English (en)
Inventor
Allan Green
Surinder Singh
Marit Lenman
Original Assignee
Basf Plant Science Gmbh
Commw Scient Ind Res Org
Commw Scient And Ind Res
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from AUPO6226A external-priority patent/AUPO622697A0/en
Priority claimed from AUPO6223A external-priority patent/AUPO622397A0/en
Application filed by Basf Plant Science Gmbh, Commw Scient Ind Res Org, Commw Scient And Ind Res filed Critical Basf Plant Science Gmbh
Publication of PT975765E publication Critical patent/PT975765E/pt

Links

Landscapes

  • Enzymes And Modification Thereof (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)

Description

DESCRIÇÃO "GENES DE EPOXIGENASE DE ÁCIDO GORDO VEGETAL E SUAS UTILIZAÇÕES"
CAMPO DA INVENÇÃO A presente invenção refere-se, de forma geral, a novas sequências genéticas que codificam enzimas epoxigenases de ácido gordo. Em particular, a presente invenção refere-se a sequências genéticas que codificam enzimas A12-epoxigenases de ácido gordo, como aqui definido. Mais particularmente, a presente invenção proporciona ADNc e sequências génicas genómicas que codificam epoxigenases de ácido gordo vegetais, de um modo preferido A12-epoxigenases de Crepis palaestina ou Euphorbia lagascae. As sequências genéticas da presente invenção proporcionam os meios através dos quais o metabolismo dos ácidos gordos pode ser alterado ou manipulado em organismos, tais como leveduras, bolores, bactérias, insectos, pássaros, mamíferos e plantas, em particular para converter aí ácidos gordos insaturados em ácidos gordos epoxigenados. A invenção estende-se a organismos acumuladores de óleo geneticamente modificados, transformados com as sequências genéticas em causa, e aos óleos derivados dos mesmos. Os óleos assim produzidos proporcionam os meios para a matéria-prima rentável para utilização na produção eficiente de revestimentos, resinas, colas, plásticos, tensioactivos e lubrificantes, entre outros.
Ao longo desta descrição e das reivindicações que se seguem, salvo se o contexto requerer o contrário, a palavra "compreende", ou variações, tais como "compreendem" ou "compreendendo", será entendida como implicando a inclusão de 1 uma entidade completa ou um grupo de entidades completas referidas, mas não a exclusão de qualquer outra entidade completa ou grupo de entidades completas.
Os detalhes bibliográficos das publicações referidas pelo autor, nesta descrição são reunidos no fim da descrição. Os números de identidade das sequências (SEQ ID Nos.) para as sequências de nucleótidos e aminoácidos referidas na descrição são definidos depois da bibliografia.
ANTECEDENTES DA INVENÇÃO
Existe mundialmente, interesse considerável na produção de matéria-prima química, tal como ácidos gordos, para utilização industrial a partir de fontes vegetais renováveis em vez de petroquímicos não renováveis. Este conceito tem uma vasta aceitação pelos fabricantes e consumidores com base na conservação de recursos e proporciona uma oportunidade significativa para desenvolver novas culturas industriais para a agricultura.
Existe um conjunto diverso de ácidos gordos invulgares na natureza e estes foram bem caracterizados (Badam & Patil, 1981/ Smith, 1970) . Muitos destes ácidos gordos invulgares têm potencial industrial e isto conduziu ao interesse na domesticação dessas espécies para permitir produção agrícola de ácidos gordos particulares.
Uma classe de ácidos gordos de particular interesse são os ácidos gordos epoxi, consistindo de uma cadeia acilo em que duas ligações de carbono adjacentes estão ligadas por uma ponte epoxi. Devido às suas elevadas reactividades, estes têm aplicação considerável na produção de revestimentos, resinas, 2 colas, plásticos, tensioactivos e lubrificantes. Estes ácidos gordos são actualmente produzidos por epoxidação quimica de óleos vegetais, principalmente óleo de soja e óleo de linhaça, contudo este processo produz misturas de formas múltiplas e isoméricas e envolve custos significativos de processamento.
Estão a ser feitas tentativas por outros para desenvolver algumas plantas selvagens que contêm ácidos gordos epoxi (e. g., Euphorbia lagascae, Vernonia galamensis) em fontes comerciais destes óleos. Contudo, problemas com aptidão agronómica e potencial de baixo rendimento limitam gravemente a utilidade comercial de abordagens tradicionais de cultivo e reprodução de plantas. A sofisticação, rapidamente crescente, da tecnologia de ADN recombinante está a facilitar grandemente a eficiência de processos industriais comercialmente importantes, através da expressão de genes isolados a partir de um primeiro organismo ou espécie num segundo organismo ou espécie para ai conferir novos fenótipos. Mais particularmente, os processos industriais convencionais podem ser tornados mais eficientes ou rentáveis, resultando em maiores rendimentos por custo de unidade, através da aplicação de técnicas de ADN recombinante.
Além disso, a escolha apropriada do organismo hospedeiro para a expressão de uma sequência genética de interesse proporciona a produção de compostos que não são normalmente produzidos ou sintetizados pelo hospedeiro, com um elevado rendimento e pureza.
Contudo, apesar da eficácia geral da tecnologia de ADN recombinante, o isolamento de sequências genéticas que codificam enzimas importantes no metabolismo dos ácidos gordos, em particular, os genes que codificam as enzimas A12-epoxigenases 3 de ácido gordo responsáveis para pela produção de ácido 12.13- epoxi-9-octadecenóico (ácido vernólico) e ácido 12.13- epoxi-9,15-octadecadienóico, entre outros, permanece um principal obstáculo ao desenvolvimento de organismos geneticamente manipulados gue produzem estes ácidos gordos.
Até à presente invenção, existiam apenas dados bioquímicos limitados indicando a natureza de enzimas epoxigenases de ácido gordo, em particular A12-epoxigenases. Contudo, em Euphorbia lagascae, a formação de ácido 12,13-epoxi-9-octadecenóico (ácido vernólico) a partir de ácido linoleico parece ser catalizada por uma enzima A12-epoxigenase dependente de citocromo-P450 (Bafor et al., 1993; Blee et al., 1994). Adicionalmente, a semente em desenvolvimento de plantas de linhaça tem a capacidade para converter ácido vernólico adicionado, em ácido 12,13-epoxi-9,15-octadecadienóico através de uma dessaturase Δ15 endógena (Engeseth e Stymne, 1996) . Os ácidos gordos epoxi também podem ser produzidos através de uma peroxigenase dependente de peróxido em tecidos vegetais (Blee e Schuber, 1990).
No trabalho que conduz à presente invenção, os requerentes procuraram isolar sequências genéticas que codificam genes que são importantes para a produção de ácidos gordos epoxi, tais como ácido 12,13-epoxi-9-octadecenóico (ácido vernólico) ou ácido 12,13-epoxi-9,15-octadecadienóico, e para transferir estas sequências genéticas em plantas comerciais de semente oleaginosa altamente produtivas e/ou outros organismos acumuladores de óleo.
SUMÁRIO DA INVENÇÃO 4
Um aspecto da invenção proporciona uma molécula de ácido nucleico isolada que codifica, ou é complementar a uma molécula de ácido nucleico isolada que codifica uma epoxigenase de ácido gordo.
Um segundo aspecto da invenção proporciona uma molécula de ácido nucleico isolada que híbrida sob condições de, pelo menos, baixa restringência com, pelo menos, 20 nucleótidos contíguos de SEQ ID Nos: 1 ou 3 ou 5 ou 19 ou 20, ou uma sua sequência complementar.
Um aspecto adicional da invenção proporciona uma molécula de ácido nucleico isolada que compreende uma sequência de nucleótidos que é, pelo menos, 65% idêntica à SEQ ID N°: 1 ou 3 ou 5 ou que é, pelo menos, 75% idêntica a, pelo menos, 200 nucleótidos contíguos em SEQ ID Nos: 19 ou 20, ou uma sua sequência complementar.
Um aspecto adicional da invenção proporciona uma construção genética que compreende a molécula de ácido nucleico isolada supra, quer seja na orientação sentido ou anti-sentido, em conexão operável com uma sequência promotora.
Um aspecto adicional da invenção proporciona um método de alteração do nível de ácidos gordos epoxi numa célula, tecido, órgão ou organismo, compreendendo o referido método a expressão de uma molécula de sentido, anti-sentido, ribozima ou de co-supressão compreendendo a molécula de ácido nucleico isolada supra na referida célula durante um período de tempo e sob condições suficientes para ser aumentado ou reduzido o nível dos ácidos gordos epoxi aí presentes.
Um aspecto adicional da invenção proporciona um método de produção de um polipéptido de epoxigenase recombinante enzimaticamente activo numa célula, compreendendo o referido 5 método a expressão da molécula de ácido nucleico isolada supra na referida célula durante um período de tempo e sob condições suficientes para a epoxigenase assim codificada ser produzida.
Um aspecto adicional da invenção proporciona um método de produção de um polipéptido de epoxigenase recombinante enzimaticamente activo numa célula, compreendendo o referido método os passos de: (i) produção de uma construção genética que compreende a molécula de ácido nucleico isolada supra colocada operacionalmente sob o controlo de um promotor capaz de conferir expressão na referida sequência genética na referida célula, e opcionalmente um elemento de intensificação da expressão; (ii) transformação da referida construção genética na referida célula; e (iii) selecção dos transformantes que expressam a um nível elevado uma epoxigenase funcional codificada através da sequência genética.
Ainda um aspecto adicional da invenção proporciona um método de produção de um polipéptido de epoxigenase recombinante enzimaticamente activo, numa planta transgénica compreendendo os passos de: (i) produção de uma construção genética que compreende a molécula de ácido nucleico isolada supra colocada operacionalmente sob o controlo de um promotor específico de semente e opcionalmente um elemento de intensificação da expressão, em que a referida sequência genética é também colocada a montante de uma sequência terminadora de transcrição; 6 (ii) transformação da referida construção genética numa célula ou tecido da referida planta; e (iii) selecção dos transformantes que expressam a um nivel elevado em sementes, uma epoxigenase funcional codificada através da sequência genética.
Um aspecto adicional da invenção proporciona um polipéptido de epoxigenase recombinante ou uma molécula enzimática funcional.
Um aspecto adicional da invenção proporciona uma epoxigenase recombinante que compreende uma sequência de aminoácidos apresentada em qualquer uma de SEQ ID Nos: 2 ou 4 ou 6 ou um seu homólogo, análogo ou derivado que seja, pelo menos, cerca de 50% idêntico a isso.
Ainda um aspecto adicional da invenção proporciona um método de produção de um ácido gordo epoxigenado numa célula, tecido, órgão ou organismo, compreendendo o referido método a incubação de uma célula, tecido, órgão ou organismo que expressa uma epoxigenase recombinante enzimaticamente activa com um substrato de ácido gordo e, de um modo preferido, um substrato de ácido gordo insaturado, durante um periodo de tempo e sob condições suficientes para, pelo menos, uma ligação de carbono, de um modo preferido, uma ligação dupla de carbono, do referido substrato ser convertida num grupo epoxi.
Um aspecto adicional da invenção proporciona uma molécula imunologicamente interactiva que se liga ao polipéptido de epoxigenase recombinante aqui descrito, ou um seu homólogo, análogo ou derivado.
BREVE DESCRIÇÃO DOS DESENHOS 7 A Figura 1 é uma representação linear de um plasmídeo de expressão compreendendo um gene estrutural de epoxigenase, colocado operacionalmente sob o controlo do promotor napin truncado (FP1; caixa a tracejado da direita) e colocado a montante da sequência do terminador NOS (caixa pontilhada da direita). A sequência genética da epoxigenase é indicada pela caixa rectangular a branco da direita. A construção também compreende o promotor NOS (caixa a tracejado da esquerda) que dirige a expressão do gene NPTII (caixa a branco da esquerda) e colocado a montante do terminador NOS (caixa pontilhada da esquerda). São também indicadas as sequências fronteira da esquerda e direita do plasmídeo Ti de Agrobacterium tumefaciens. A Figura 2 é uma representação esquemática mostrando o alinhamento das sequências de aminoácidos do polipéptido de epoxigenase de Crepis palaestina (Cpal2; SEQ ID N°: 2), uma epoxigenase adicional derivada a partir de Crepis sp., diferente de C. palaestina, que produz níveis elevados de ácido vernólico (CrepX; SEQ ID N°: 4), uma sequência de aminoácidos parcial de um polipéptido de epoxigenase derivado a partir de Vernonia galamensis (Vgall; SEQ ID N°: 6) , a sequência de aminoácidos da Δ12 acetilenase de Crepis alpina (Crepl; SEQ ID N°: 8), as Δ12 dessaturases de A. thaliana (L26296; SEQ ID N°: 9), Brassica juncea (X91139; SEQ ID N°: 10), Glycine max (L43921; SEQ ID N°: 11), Solanum commersoníi (X92847; SEQ ID N°: 12) e Glycine max (L43920; SEQ ID N°: 13), e a Δ12 hidroxilase de Ricinus communis (U22378; SEQ ID N°: 14). Estão sublinhados três motivos ricos em histidina que são conservados em monooxigenases de função mista não contendo hemo. A Figura 3 é uma cópia de uma representação fotográfica de uma hibridação de transferência de Northern mostrando a expressão especifica de semente do gene de epoxigenase de Crepis palaestina exemplificado através da SEQ ID N°: 1. Análise de transferência de Northern do ARN total de folhas (pista 1) e sementes em desenvolvimento (pista 2) de Crepis palaestina. 15 pg de ARN total foram migrados num gel de Northern e transferidos para membrana Hybond N+ da Amersham de acordo com as instruções do fabricante. A transferência foi hibridada a 60 °C com uma sonda preparada a partir da região 3' não traduzida da SEQ ID N°: 1. A transferência foi lavada duas vezes em 2 x SSC (tampão de Citrato de Sódio-NaCl) à temperatura ambiente durante 10 minutos, depois em 0,1 x SSC a 60 °C durante 20 minutos. A Figura 4 é uma representação esquemática mostrando a sequência de nucleótidos do iniciador de PCR degenerado (direcção 5' para 3' ) utilizado para isolar os genes de epoxigenase de Euphorbia lagascae aqui descritos. A Figura 5 é uma cópia de uma representação fotográfica de uma hibridação de transferência em gota de ARN mostrando a expressão do gene de epoxigenase exemplificado em SEQ ID N°: 3 em plantas que produzem ácido vernólico comparativamente a plantas que não produzem ácido vernólico. Foi isolado um pg de ARN total a partir do tecido especificado e submetido a transferência em gota na membrana Hybond N+ da Amersham de acordo com as instruções do fabricante. A transferência foi hibridada a 42 °C em 50% de formamida com a sonda relevante marcada com 32P preparada a partir da SEQ ID N°: 3 durante 16 horas. As transferências foram lavadas duas vezes em 2 x SSC (tampão de Citrato de Sódio-NaCl) à temperatura ambiente, depois em 0,5 x SSC a 55 °C durante 20 minutos. 9
Foram obtidas autorradiografias após uma exposição de um dia para o outro. 0 painel A mostra ARN total de semente em desenvolvimento de Euphorbia lagascae (1), Euphorbia cyparissus (2), Vernonia galamensis (3), e flax (Linum usitatissimum) (4) . 0 painel B mostra ARN total de vários tecidos de Euphorbia lagascae, incluindo semente em desenvolvimento (1), raiz (2) e folha (3). A Figura 6 é uma representação esquemática mostrando o método de hibridação subtractiva utilizado para isolar os genes de epoxigenase de Euphorbia lagascae aqui descritos. 0 agrupamento de +6ADNc consistiu predominantemente em sequências de tipo proteína de armazenamento de semente. Um agrupamento de 15 dessas sequências foi biotinilado e ainda subtraído do +6ADNc. HL = Hibridação Longa - 20 h; HC = Hibridação Curta - 3 h. A Figura 7 é uma cópia de uma representação fotográfica de uma hibridação de transferência em gota de ARN mostrando a expressão do gene de epoxigenase exemplificado em SEQ ID N°: 20 em plantas que produzem ácido vernólico comparativamente a plantas que não produzem ácido vernólico. Foi isolado um pg de ARN total a partir do tecido especificado e submetido a transferência em gota na membrana Hybond N+ da Amersham de acordo com as instruções do fabricante. A transferência foi hibridada a 42 °C em 50% de formamida com a sonda relevante marcada com 32P preparada a partir da SEQ ID N°: 20 durante 16 horas. As transferências foram lavadas duas vezes em 2 x SSC (tampão de Citrato de Sódio-NaCl) à temperatura ambiente, depois em 0,5 x SSC a 55 °C durante 20 minutos. Foram obtidas autorradiografias após uma exposição de um dia para o outro. O painel A mostra ARN total de semente em desenvolvimento de Euphorbia lagascae (1), Euphorbia 10 cyparissus (2), Vernonia galamensis (3), e flax (Linum usitatissimum) (4) . 0 painel B mostra ARN total de vários tecidos de Euphorbia lagascae, incluindo semente em desenvolvimento (1), raiz (2) e folha (3). A Figura 8 é uma representação esquemática de um vector plasmidico binário contendo uma cassete de expressão que compreende o promotor napin truncado especifico de semente (Napin) e o terminador de nopalina sintase (NT) , com um sitio de clonagem BamHI entre os dois, para além do gene de resistência à canamicina NPTII ligado operacionalmente às sequências do promotor da nopalina sintase (NP) e do terminador da nopalina sintase (NT) . A cassete de expressão é flanqueada por sequências de T-ADN da fronteira esquerda (LB) e fronteira direita (RB). A Figura 9 é uma representação esquemática de um vector plasmidico binário contendo uma cassete de expressão que compreende a SEQ ID N°: 1 colocada operacionalmente sob o controlo de um promotor napin truncado especifico de semente (Napin) e a montante do terminador da nopalina sintase (NT) , para além do gene de resistência à canamicina NPTII ligado operacionalmente às sequências do promotor da nopalina sintase (NP) e do terminador da nopalina sintase (NT) . A cassete de expressão é flanqueada por sequências fronteira de T-ADN da esquerda (LB) e da direita (RB) . Para produzir esta construção, a SEQ ID N°: 1 é introduzida no sítio BamHI do vector binário apresentado na Figura 8. A Figura 10 é uma representação gráfica dos perfis de cromatografia gasosa de ésteres metálicos de ácido gordo, preparados a partir de sementes oleaginosas de plantas não transformadas de Arabidopsis thaliana [painel (a)], ou 11 plantas de A. thaliana (linha transgénica Cpal-17) que foram transformadas com SEQ ID N°: 1, utilizando a construção genética apresentada na Figura 9 [painéis (b) e (c) ] . Nos painéis (a) e (b), os ésteres metilicos de ácido gordo foram separados utilizando separação em coluna empacotada. No painel (c) , os ésteres metilicos de ácido gordo foram separados utilizando separação em coluna capilar. São indicadas as posições de eluição do ácido vernólico. A Figura 11 é uma representação gráfica mostrando a distribuição conjunta de ácidos gordos epoxi em semente pura de plantas Ti, de plantas de Arabidopsis thaliana transformadas com Cpal2, como determinado utilizando cromatografia gasosa. Os níveis tanto do ácido vernólico (eixo x) como do ácido 12,13-epoxi-9,15-octadecadienóico (eixo y) foram determinados e traçados relativamente um ao outro. Os dados mostram uma correlação positiva entre os níveis destes ácidos gordos em plantas transgénicas. A Figura 12 é uma representação gráfica mostrando a incorporação de marcação com 14C na fase clorofórmica obtida a partir de extracção lipídica de cotilédones de semente de linhaça durante a alimentação com substrato marcado. Símbolos utilizados; ♦ , alimentação com ácido [14C]oleico; , alimentação com ácido [14C] vernólico. A Figura 13 é uma representação gráfica mostrando a incorporação de marcação com 14C na fosfatidilcolina de cotilédones de semente de linhaça durante a alimentação com substrato marcado. Símbolos utilizados; ♦, alimentação com ácido [14C]oleico; , alimentação com ácido [14C] vernólico. 12 A Figura 14 é uma representação gráfica mostrando a incorporação de marcação com 14C em triacilgliceróis de cotilédones de semente de linhaça durante a alimentação com substrato marcado. Símbolos utilizados; ♦, alimentação com ácido [14C]oleico; , alimentação com ácido [14C] vernólico.
DESCRIÇÃO DETALHADA DAS FORMAS DE REALIZAÇÃO PREFERIDAS
Um aspecto da presente invenção proporciona uma molécula de ácido nucleico isolada que codifica ou é complementar de uma molécula de ácido nucleico isolada que codifica uma epoxigenase de ácido gordo.
Em que a molécula de ácido nucleico isolada da invenção codifica uma enzima que está envolvida na epoxidação directa de ácido araquidónico, e é particularmente preferido que a molécula de ácido nucleico em causa seja derivada de uma fonte não mamífera.
Como aqui utilizado, o termo "derivado de" deve ser entendido para indicar que uma entidade completa particular ou grupo de entidades completas foi originada a partir da espécie especificada, mas não foi necessariamente obtida directamente a partir da fonte especificada. 0 termo "fonte não mamífera" refere-se a qualquer organismo diferente de um mamífero ou um tecido ou célula derivada do mesmo.
No presente contexto, o termo "derivado de uma fonte não mamífera" deve ser entendido para indicar que uma entidade completa particular ou um grupo de entidades completas foi 13 derivada a partir de bactérias, leveduras, pássaros, anfibios, répteis, insectos, plantas, fungos, bolores e algas ou outros não mamíferos.
Numa forma de realização preferida da presente invenção, o organismo fonte é um organismo possuindo a capacidade genética para sintetizar ácidos gordos epoxi. De um modo mais preferido, o organismo fonte é uma planta tal como, mas não limitada a, Chrysanthemum spp., Crepis spp., Euphorbia spp. e Vernonia spp., entre outros.
De um modo ainda mais preferido, o organismo fonte é seleccionado da lista compreendendo Crepis biennis, Crepis aurea, Crepis conyzaefolia, Crepis intermédia, Crepis occidentalis, Crepis palaestina, Crepis vesicaria, Crepis xacintha, Euphorbia lagascae e Vernonia galamensis. Não estão excluídas espécies adicionais.
Numa forma de realização particularmente preferida da presente invenção, o organismo fonte é Crepis sp. que contém niveis elevados de ácido vernólico, tal como Crepis palaestina, entre outros, ou alternativamente, Vernonia galamensis ou Euphorbia lagascae.
Em que a molécula de ácido nucleico isolada da invenção codifica uma enzima Δβ-epoxigenase ou A9-epoxigenase ou enzima A12-epoxigenase ou Al5-epoxigenase, ou codifica, pelo menos, uma enzima que não está envolvida na epoxidação directa de ácido araquidónico, e a molécula de ácido nucleico em causa pode ser derivada a partir de qualquer fonte produtora da referida enzima, incluindo, mas não se limitando a, leveduras, bolores, bactérias, insectos, pássaros, mamíferos e plantas. 14 A molécula de ácido nucleico da invenção de acordo com qualquer das formas de realização antecedentes pode ser ADN, tal como um gene, molécula de ADNc, molécula de ARN ou uma molécula sintética de oligonucleótido, quer seja de cadeia simples ou cadeia dupla e independentemente de quaisquer caracteristicas da estrutura secundária, salvo especificamente referido.
Aqui a referência a um "gene" deve ser entendida no seu contexto mais vasto e inclui: (i) um gene genómico clássico consistindo de sequências reguladoras de transcrição e/ou tradução e/ou uma região codificante e/ou sequências não traduzidas (i. e., intrões, sequências 5' e 3' não traduzidas); ou (ii) ARNm ou ADNc correspondente às regiões codificantes (i. e., exões) e sequências 5' e 3' não traduzidas do gene. O termo "gene" é também utilizado para descrever moléculas sintéticas ou de fusão codificando todo ou parte de um produto funcional. Os genes de epoxigenase preferidos da presente invenção podem ser derivados de um gene de epoxigenase de ocorrência natural através de técnicas recombinantes convencionais. Geralmente, um gene de epoxigenase pode ser submetido a mutagénese para produzir substituições, delecções e/ou adições nucleotidicas simples ou múltiplas.
Os derivados de inserção nucleotidica incluem fusões terminais 5' e 3' assim como inserções intra-sequência de nucleótidos simples e múltiplos. As variantes de sequência de inserção nucleotidica são aquelas em que um ou mais nucleótidos são introduzidos num sitio predeterminado na sequência de nucleótidos embora seja também possível inserção aleatória com rastreio adequado do produto resultante. 15
As variantes de delecção são caracterizadas pela remoção de um ou mais nucleótidos da sequência.
As variantes de substituição nucleotidica são aquelas em que, pelo menos, um nucleótido na sequência foi removido e um nucleótido diferente introduzido no seu lugar. Essa substituição pode ser "silenciosa" pelo que a substituição não altera o aminoácido definido pelo codão. Alternativamente, os substituintes são concebidos para alterar um aminoácido para outro aminoácido que actua de modo semelhante, ou aminoácido de carga, polaridade ou hidrofobicidade semelhante.
No contexto da presente invenção, o termo "epoxigenase de ácido gordo" deve ser entendido para referir qualquer enzima ou equivalente funcional ou seus derivados enzimaticamente activos que catalizam a biossintese de um ácido gordo epoxigenado, por conversão de uma ligação de carbono de um ácido gordo num grupo epoxi e, de um modo preferido, por conversão de uma ligação dupla de carbono de um ácido gordo insaturado num grupo epoxi. Embora não limitando a invenção, uma epoxigenase de ácido gordo pode catalizar a biossintese de um ácido gordo epoxi seleccionado da lista compreendendo ácido 12,13-epoxi-9-octadecenóico (ácido vernólico) , ácido 12,13-epoxi-9,15-octadecadienóico, ácido 15,16-epoxi-9,12-octadecadienóico, ácido 9,10-epoxi-12-octadecenóico e ácido 9,10-epoxi-octadecanóico, entre outros. 0 termo "epoxi", "grupo epoxi" e "resíduo epoxi" será conhecido dos especialistas na técnica para referir um anel de três membros compreendendo dois átomos de carbono e um átomo de oxigénio ligado através de ligações simples como se segue: 16 \/c ο
De acordo com o exposto, o termo "epóxido" refere-se a compostos que compreendem, pelo menos, um grupo epoxi, como aqui definido anteriormente.
Os especialistas na técnica estão cientes que a nomenclatura de ácidos gordos é baseada no comprimento da cadeia de carbono e na posição dos átomos de carbono insaturados dentro dessa cadeia de carbono. Assim, os ácidos gordos são designados utilizando a notação estenográfica:
Carbonototai: ligação duplatotalposiçâo da ligaçâo dupla (Δ), em que as ligações duplas são cis, salvo indicação em contrário. Por exemplo, o ácido palmítico (ácido n-hexadecanóico) é um ácido gordo saturado de 16 carbonos (i. e., 16:0), o ácido oleico (ácido octadecenóico) é um ácido gordo insaturado de 18 carbonos com uma ligação dupla entre C-9 e C-10 (i. e., 18:1Δ9) e o ácido linoleico (ácido octadecadienóico) é um ácido gordo insaturado de 18 carbonos com duas ligações duplas entre C-9 e C-10 e entre C-12 e C-13 (i. e., 18:2*9'12).
Contudo, no presente contexto uma enzima epoxigenase pode catalizar a conversão de qualquer ligação de carbono num grupo epoxi ou alternativamente, a conversão de qualquer dupla num substrato de ácido gordo insaturado num grupo epoxi. A este respeito, é bem conhecido dos especialistas na técnica que a maioria dos ácidos gordos mono-insaturados de organismos superiores são ácidos gordos insaturados de 18 carbonos (i. e., 18:1Δ9), enquanto que a maioria dos ácidos gordos poliinsaturados 17 derivados de organismos superiores sejam ácidos gordos de 18 carbonos com, pelo menos, uma das ligações duplas ai situadas entre C-9 e C-10. Adicionalmente, as bactérias também possuem ácidos gordos mono-insaturados em C16. Além disso, a epoxigenase da presente invenção pode actuar em mais do gue uma única molécula de substrato de ácido gordo e, consequentemente, a presente invenção não está limitada pela natureza da molécula de substrato sobre a qual actua a enzima epoxigenase em causa.
De um modo preferido, a molécula de substrato para a epoxigenase da presente invenção é um ácido gordo insaturado que contém, pelo menos, uma ligação dupla.
Além disso, as enzimas epoxigenases podem actuar sobre qualquer número de átomos de carbono em qualquer uma molécula de substrato. Por exemplo, podem ser caracterizadas como enzimas Δβ-epoxigenase, A9-epoxigenase, A12-epoxigenase ou ál5-epoxigenase, entre outras. De acordo com o exposto, a presente invenção não é limitada pela posição do átomo de carbono no substrato sobre o qual pode actuar uma enzima epoxigenase.
Como aqui utilizado, o termo "Δβ-epoxigenase" deve ser entendido para referir uma enzima epoxigenase que cataliza a conversão da ligação de carbono Δ6 de um substrato de ácido gordo num grupo epoxi Δ6 e, de um modo preferido, cataliza a conversão da ligação dupla Δ6 de, pelo menos, um ácido gordo insaturado num grupo epoxi Δ6.
Como aqui utilizado, o termo "A9-epoxigenase" deve ser entendido para referir uma enzima epoxigenase que cataliza a conversão da ligação de carbono Δ9 de um substrato de ácido gordo num grupo epoxi Δ9 e, de um modo preferido, cataliza a 18 conversão da ligação dupla Δ9 de, pelo menos, um ácido gordo insaturado num grupo epoxi Δ9.
Como aqui utilizado, o termo "A12-epoxigenase" deve ser entendido para referir uma enzima epoxigenase que cataliza a conversão da ligação de carbono Δ12 de um substrato de ácido gordo num grupo epoxi Δ12 e, de um modo preferido, cataliza a conversão da ligação dupla Δ12 de, pelo menos, um ácido gordo insaturado num grupo epoxi Δ12.
Como aqui utilizado, o termo "ál5-epoxigenase" deve ser entendido para referir uma enzima epoxigenase que cataliza a conversão da ligação de carbono Δ15 de um substrato de ácido gordo num grupo epoxi Δ15 e, de um modo preferido, cataliza a conversão da ligação dupla Δ15 de, pelo menos, um ácido gordo insaturado num grupo epoxi Δ15. A presente invenção estende-se claramente a sequências genéticas que codificam todas as enzimas epoxigenases listadas supra, entre outras.
Numa forma de realização preferida da invenção, a molécula de ácido nucleico isolada codifica uma enzima epoxigenase de ácido gordo que converte, pelo menos, uma ligação de carbono em ácido palmitoleico (16:1a9) , ácido oleico (18:1Δ9), ácido linoleico (18:2Δ9'12), ácido linolénico (18: 3Δ9'12'15) , ou ácido araquidónico (20 : 4á5'8'11,:L4) numa ligação epoxi. De um modo preferido, a ligação de carbono é uma ligação dupla de carbono.
De um modo mais preferido, a molécula de ácido nucleico isolada da invenção codifica uma enzima epoxigenase de ácido gordo que converte, pelo menos, uma ou ambas as ligações duplas em ácido linoleico num grupo epoxi. De acordo com esta forma de realização, uma epoxigenase que converte ambas as ligações 19 duplas Δ9 e Δ12 de ácido linoleico num grupo epoxi, pode catalizar essas conversões independentemente de cada uma, de modo que a referida epoxigenase é uma enzima A9-epoxigenase e/ou ál2-epoxigenase, como aqui definido anteriormente.
Numa forma de realização preferida alternativa, a epoxigenase de ácido gordo da presente invenção é uma ál2-epoxigenase, uma A15-epoxigenase ou uma A9-epoxigenase, como aqui definido anteriormente.
De um modo mais preferido, a epoxigenase de ácido gordo da invenção é uma A12-epoxigenase, como aqui definido anteriormente.
Numa forma de realização particularmente preferida da invenção, é proporcionada uma molécula de ácido nucleico isolada que codifica a linoleato A12-epoxigenase, a enzima que converte, pelo menos, a ligação dupla Δ12 de ácido linoleico num grupo Δ12-εροχί, produzindo assim ácido 12,13-epoxi-9-octadecenóico (ácido vernólico).
Embora não limitando a presente invenção, a fonte preferida da A12-epoxigenase da invenção é uma planta, em particular Crepis palaestina ou uma Crepis sp. adicional que é distinta da C. palaestina mas contém niveis elevados de ácido vernólico, Vernonia galamensis ou Euphorbia lagascae.
De acordo com esta forma de realização, uma Al2-epoxigenase pode catalizar a conversão de ácido palmitoleico em ácido 9, 10-epoxi-palmitico e/ou a conversão de ácido oleico em ácido 9, 10-epoxi-esteárico e/ou a conversão de ácido linoleico em qualquer um ou mais de ácido 9,10-epoxi-12-octadecenóico ou ácido 12,13-epoxi-9-octadecenóico ou ácido 9,10,12,13-diepoxiesteárico e/ou a conversão de ácido linolénico em 20 qualquer um ou mais de ácido 9,10-epoxi-12,15-octadecadienóico ou ácido 12,13-epoxi-9,15-octadecadienóico ou ácido 15,16-epoxi-octadecadienóico ou ácido 9,10,12,13-diepoxi-15-octadecenóico ou ácido 9,10,15,16-diepoxi-12-octadecenóico ou ácido 12,13,15,16-diepoxi-9-octadecenóico ou ácido 9,10,12,13,15,16-triepoxi-esteárico e/ou a conversão de ácido araquidónico em qualquer um ou mais de ácido 5,6-epoxi-8,11,14-tetracosatrienóico ou ácido 8,9-epoxi-5,11,14-tetracosatrienóico ou ácido 11,12-epoxi-5, 8,14-tetracosatrienóico ou ácido 14,15-epoxi-5,8,11 tetracosatrienóico ou ácido OD KD LO 9-diepoxi-ll,14- tetracosadienóico ou ácido 5,6,11, 12-diepoxi-8,14- tetracosadienóico ou ácido 5,6,14, 15-diepoxi-8,11- tetracosadienóico ou ácido 8,9,11, 12-diepoxi-5,14- tetracosadienóico ou 8,9,14,15-diepoxi-5,11-tetracosadienóico ou ácido 11,12,14,15-diepoxi-5,8-tetracosadienóico ou ácido 5, 6,8,9,11,12-triepoxi-14-tetracosenóico ou ácido 5,6,8,9,14,15-triepoxi-ll-tetracosenóico ou 5,6,11,12,14,15-triepoxi-8-tetracosenóico ácido ou ácido 8,9,11,12,14,15-triepoxi-5-tetracosenóico, entre outros.
Os especialistas na técnica podem estar cientes que nem todos os substratos listados supra podem ser deriváveis a partir de uma fonte natural, mas apesar disso, podem ser produzidos através de meios sintéticos químicos. A conversão de ácidos gordos insaturados tanto de ocorrência natural como sintetizados quimicamente para ácidos gordos epoxi está dentro do âmbito da presente invenção, sendo a única exigência que a molécula de ácido nucleico da presente invenção, como aqui descrita, codifique uma enzima ou parte funcional da mesma que seja capaz de catalizar a referida conversão.
De acordo com a discussão precedente, os especialistas na técnica estarão cientes que uma enzima epoxigenase de ácido gordo pode ser uma enzima monooxigenase dependente de citocromo- 21 Ρ450 ou uma enzima monooxigenase de função mista ou alternativamente uma enzima peroxigenase dependente de peróxido, ou enzima semelhante, entre outras. Contudo, a presente invenção é particularmente dirigida para aquelas enzimas epoxigenases que são enzimas monooxigenases de função mista e moléculas de ácidos nucleicos codificando as mesmas e suas utilizações. De acordo com o exposto, é particularmente preferido que a molécula de ácido nucleico da invenção codifique uma epoxigenase de ácido gordo que seja uma enzima monooxigenase de função mista.
No contexto da presente invenção, o termo "enzima monooxigenase de função mista" deve ser entendido para referir qualquer enzima que cataliza a epoxigenação de uma ligação de carbono ou ligação dupla de carbono num molécula de ácido gordo, em que a referida enzima compreende ainda uma sequência de aminoácidos que contém três regiões ricas em histidina como se seguem: (i) His-(Xaa) 3-4-His; (ii) His-(Xaa) 2-3-His-His; e (iii) His-(Xaa) 2-3-His-His, em que His designa histidina, Xaa designa qualquer residuo de aminoácido de ocorrência natural, como aqui apresentado na Tabela 1, a entidade completa (Xaa)3_4 refere-se a uma sequência de aminoácidos compreendendo três ou quatro repetições de Xaa, e a entidade completa (Xaa) 2-3 refere-se a uma sequência de aminoácidos compreendendo dois ou três repetições de Xaa. 0 termo "tipo enzima monooxigenase de função mista" deve ser entendido para referir qualquer enzima que compreende três das regiões ricas em histidina listadas supra. 22
Na exemplificação da invenção aqui descrita, os requerentes demonstraram que a sequência de aminoácidos de Crepis palaestina aqui proporcionada, compreende uma enzima A12-epoxigenase que incluí os motivos característicos de sequência de aminoácidos de uma enzima monooxigenase de função mista, como aqui definido anteriormente. A identidade próxima de sequência de aminoácidos entre a enzima A12-epoxigenase de C. palaestina (SEQ ID N°: 2) e as sequências de aminoácidos de polipéptidos derivados de uma Crepis sp. não identificada e Vernonia galamensis como aqui proporcionadas (SEQ ID Nos: 4 e 6), comparativamente às sequências de aminoácidos de outras monooxigenases de função mista, tais como dessaturases e hidroxilases, sugere que as referidas sequências de aminoácidos de Crepis sp. e V. galamensis são também enzimas epoxigenases de ácido gordo e podem ser enzimas A12-epoxigenase. A este respeito, a sequência de aminoácidos de Vernonia galamensis, aqui exemplificada, é uma sequência parcial que compreende apenas um motivo rico em histidina completo (i. e., His-Arg-Asn-His-His) e uma sequência parcial do primeiro motivo rico em histidina (i. e., compreende os dois últimos resíduos de histidina do motivo His-Glu-Cys-Gly-His-His), porque a sequência de nucleótidos correspondente codificando o mesmo foi amplificada por reacção em cadeia da polimerase como uma sequência de ADNc parcial, utilizando um primeiro iniciador para este primeiro motivo rico em histidina e um segundo iniciador de amplificação concebido para uma região a montante do terceiro motivo rico em histidina (i. e., His-Val-Met-His-His). Adicionalmente, o facto de a sequência de V. galamensis ter sido amplificada utilizando um iniciador específico para o primeiro motivo rico em histidina, indica que a sequência de tamanho total correspondente também compreenderia este motivo. 23
De acordo com o exposto, numa forma de realização particularmente preferida, a molécula de ácido nucleico da invenção codifica uma enzima epoxigenase monooxigenase de função mista ou enzima semelhante derivada de Crepis spp., incluindo Crepís palaestina ou alternativamente, derivada de Vernonia galamensis. De acordo com esta forma de realização, é ainda mais preferido que a epoxigenase em causa compreenda, pelo menos, uma sequência de aminoácidos que contém três ou mais regiões ricas em histidina como se seguem: (i) His-Glu-Cys-Gly-His-His (SEQ ID N°: 15); (ii) His-Arg-Asn-His-His (SEQ ID N°: 16); e (iii) His-Val-Met-His-His (SEQ ID N°: 17), ou homólogo, análogo ou derivado do mesmo, em que His designa histidina, Glu designa glutamato, Cys designa cisteina, Gly designa glicina, Arg designa arginina, Asn designa asparagina, Vai designa valina, Met designa metionina. A presente invenção estende-se claramente a genes de epoxigenase derivados de outras espécies, incluindo os genes de epoxigenase derivados de Chrysanthemum spp. e Euphorbia lagascae, entre outras.
Numa forma de realização preferida, embora não limitando a presente invenção, os genes de epoxigenase de outras espécies que estão abrangidos pela presente invenção codificam enzimas monooxigenases de função mista. A presente invenção estende-se ainda aos polipéptidos isolados ou recombinantes codificados por esses genes e utilizações dos referidos genes e polipéptidos. A invenção descrita de acordo com esta forma de realização não abrange moléculas de ácidos nucleicos que codifiquem actividades enzimáticas diferentes das actividades de 24 epoxigenase, como aqui definido, em particular as enzimas A12-dessaturase derivadas de Arabidopsis thaliana, Brassica juncea, Brassica napus ou Glycine max, entre outras, que são conhecidas por conter motivos ricos em histidina semelhantes.
No presente contexto, os "homólogos" de uma sequência de aminoácidos refere-se àquelas sequências de aminoácidos ou sequências de péptidos que são derivadas a partir de polipéptidos, enzimas ou proteínas da presente invenção ou alternativamente, correspondam substancialmente às sequências de aminoácidos listadas supra, apesar de quaisquer substituições, adições ou delecções de aminoácidos de ocorrência natural nos mesmos.
Por exemplo, os aminoácidos podem ser substituídos por outros aminoácidos possuindo propriedades semelhantes, por exemplo, hidrofobicidade, hidrofilicidade, momento hidrofóbico, antigenicidade, propensidade para formar ou quebrar estruturas α-helicoidais ou estruturas em folha β, e assim por diante. Alternativamente, ou além disso, os aminoácidos de uma sequência de aminoácidos homóloga pode ser substituída por outros aminoácidos possuindo propriedades semelhantes, por exemplo, hidrofobicidade, hidrofilicidade, momento hidrofóbico, carga ou antigenicidade, e assim por diante.
Os residuos de aminoácidos de ocorrência natural aqui contemplados são descritos na Tabela 1.
Um homólogo de uma sequência de aminoácidos pode ser um péptido sintético produzido através de qualquer método conhecido dos especialistas na técnica, tal como por utilização de quimica de Fmoc. 25
Alternativamente, um homólogo de uma sequência de aminoácidos pode ser derivado a partir de uma fonte natural, tal como a mesma ou uma outra espécie como os polipéptidos, enzimas ou proteínas da presente invenção. As fontes preferidas de homólogos das sequências de aminoácidos listadas supra incluem qualquer uma das fontes aqui contempladas.
Os "análogos" de uma sequência de aminoácidos abrangem aquelas sequências de aminoácidos que são substancialmente idênticas às sequências de aminoácidos listadas supra apesar da ocorrência aí de quaisquer análogos de aminoácidos de ocorrência não natural.
Os aminoácidos de ocorrência não natural preferidos aqui contemplados são listados abaixo na Tabela 2. 0 termo "derivado", relativamente a uma sequência de aminoácidos, deve ser entendido para referir aqui adiante mutantes, partes, fragmentos ou fusões de polipéptido das sequências de aminoácidos listadas supra. Os derivados incluem sequências de aminoácidos modificadas ou péptidos em que os ligandos estão ligados a um ou mais dos resíduos de aminoácidos aí contidos, tais como hidratos de carbono, enzimas, proteínas, polipéptidos ou moléculas repórter, tais como radionuclidos ou compostos fluorescentes. Estão também contemplados pela presente invenção as forma glicosiladas, fluorescentes, aciladas ou alquiladas dos péptidos em causa. Adicionalmente, os derivados podem compreender fragmentos ou partes de uma sequência de aminoácidos aqui divulgada e estão dentro do âmbito da invenção, como estão homopolímeros ou heteropolímeros compreendendo duas ou mais cópias das sequências em causa.
Os processos para derivatizar péptidos são bem conhecidos na técnica. 26
As substituições abrangem alterações de aminoácidos em que um aminoácido é substituído com um residuo de aminoácido de ocorrência natural ou não convencional diferente. Essas substituições podem ser classificadas como "conservadoras", que nesse caso um residuo de aminoácido é substituído com um outro aminoácido de ocorrência natural de carácter semelhante, por exemplo, Glye^Ala, Vale^Ilee^Leu, Asp<->Glu, Lys<->Arg, Asne^Gln ou Phe<->Trp<->Tyr.
As substituições abrangidas pela presente invenção também podem ser "não conservadoras", em que um resíduo de aminoácido que está presente num polipéptido repressor é substituído com um aminoácido possuindo propriedades diferentes, tais como um aminoácido de ocorrência natural a partir de um grupo diferente (e. g., um aminoácido carregado ou hidrofóbico substituído com alanina), ou alternativamente, em que um aminoácido de ocorrência natural é substituído com um aminoácido não convencional.
As substituições de aminoácidos são tipicamente de resíduos individuais, mas podem ser de resíduos múltiplos, quer estejam aglomerados ou dispersos.
As delecções de aminoácidos serão geralmente da ordem de cerca de 1-10 resíduos de aminoácidos, enquanto as inserções podem ser de qualquer comprimento. As delecções e inserções podem ser realizadas no terminal N, terminal C ou podem ser delecções ou inserções internas. Geralmente, as inserções dentro da sequência de aminoácidos serão menores do que fusões do terminal amino ou terminal carboxilo e da ordem de 1-4 resíduos de aminoácidos. 27 A presente invenção estende-se claramente à molécula de ácido nucleico isolada em causa quando integrada no genoma de uma célula como uma adição ao complemento celular endógeno de genes de epoxigenase. Alternativamente, em que a célula do hospedeiro não codifica normalmente enzimas requeridas para a biossintese de ácido gordo epoxi, a presente invenção estende-se à molécula de ácido nucleico isolada em causa quando integrada no genoma da referida célula como uma adição ao genoma celular endógeno. TABELA 1
Aminoácido Abreviatura de três letras Símbolo de uma letra Alanina Ala A Arginina Arg R Asparagina Asn N Ácido aspártico Asp D Cisteina Cys C Glutamina Gin Q Ácido glutâmico Glu E Glicina Gly G Histidina His H Isoleucina Ile I Leucina Leu L Lisina Lys K Metionina Met M Fenilalanina Phe F (continuação)
Aminoácido Abreviatura de Símbolo de três letras uma letra Prolina Pro P 28
Serina Ser S Treonina Thr T Triptofano Trp w Tirosina Tyr Y Valina Vai V Qualquer aminoácido como acima Xaa X TABELA 2
Aminoácido não convencional Código Aminoácido não convencional Código ácido α-aminobutírico Abu L-N-metilalanina Nmala a-amino-a-metilbutirato Mgabu L-N-metilarginina Nmarg aminociclopropano- Cpro L-N-metilasparagina Nmasn carboxilato ácido L-N-metilaspártico Nmasp ácido aminoisobutirico Aib L-N-metilcisteína Nmcys aminonorbornil- L-N-metilglutamina Nmgln carboxilato Norb ácido L-N-metilglutâmico Nmglu ciclo-hexilalanina Chexa L-N-metil-histidina Nmhis ciclopentilalanina Cpen L-N-metilisoleucina Nmile D-alanina Dal L-N-metileucina Nmleu D-arginina Darg L-N-metilisina Nmlys ácido D-aspártico Dasp L-N-metilmetionina Nmmet D-cisteina Dcys L-N-metilnorleucina Nmnle D-glutamina Dgln L-N-metilnorvalina Nmnva ácido D-glutâmico Dglu L-N-metilornitina Nmorn (continuação) Aminoácido não Código Aminoácido não Código convencional convencional D-histidina Dhis L-N-metilfenilalanina Nmphe D-isoleucina Dile L-N-metilprolina Nmpro 29 D-leucina Dleu L-N-metilserina Nmser D-lisina Dlys L-N-metiltreonina Nmthr D-metionina Dmet L-N-metiltriptofano mtrp D-ornitina Dorn L-N-metiltirosina Nmtyr D-fenilalanina Dphe L-N-metilvalina Nmval D-prolina Dpro L-N-metiletilglicina Nmetg D-serina Dser L-N-metil-t-butilglicina Nmtbug D-treonina Dthr L-norleucina Nle D-triptofano Dtrp L-norvalina Nva D-tirosina Dtyr a-metil-aminoisobutirato Maib D-valina Dval a-metil-y-aminobutirato Mgabu D-a-metilalanina Dmala a-metilciclo- hexilalanina Mchexa D-a-metilarginina Dmarg a-metilcilcopentil- alanina Mcpen D-a-metilasparagina Dmasn a-metil-a-naptilalanina Manap D-a-metilaspartato Dmasp α-metilpenicilamina Mpen D-a-metilcisteína Dmcys N-(4-aminobutil)glicina Nglu D-a-metiIglutamina Dmgln N-(2-aminoetil)glicina Naeg D-a-metil-histidina Dmhis N-(3-aminopropil)glicina Norn D-a-metilisoleucina Dmile N-amino-a-metilbutirato Nmaabu D-a-metileucina Dmleu α-naptilaianina Anap D-a-metilisina Dmlys N-benzilglicina Nphe D-a-metilmetionina Dmmet N- (2-carbamiletil)- glicina Ngln D-a-metilornitina Dmorn N-(carbamilmetil)glicina Nasn D-a-metilfenilalanina Dmphe N- (2-carboxietil)glicina Nglu D-a-metilprolina Dmpro N- (carboximetil)glicina Nasp (continuação) Aminoácido não Código Aminoácido não Código convencional convencional D-a-metilserina Dmser N-ciclobutilglicina Ncbut D-a-metiltreonina Dmthr N-ciclo-heptilglicina Nchep D-a-metiltriptofano Dmtrp N-ciclo-hexilglicina Nchex 30 D-a-metiltirosina Dmty N-ciclodecilglicina Ncdec D-a-metilvalina Dmval N-cilcododecilglicina Ncdod D-N-metilalanina Dnmala N-ciclooctilglicina Ncoct D-N-metilarginina Dnmarg N-ciclopropilglicina Ncpro D-N-metilasparagina Dnmasn N-cicloundecilglicina Ncund D-N-metilaspartato Dnmasp N-(2,2-difeniletil)- glicina Nbhm D-N-metilcisteína Dnmcys N-(3,3-difenilpropil)- glicina Nbhe D-N-metilglutamina Dnmgln N-(3-guanidinopropil)- glicina Narg D-N-metilglutamato Dnmglu N-(1-hidroxietil)glicina Nthr D-N-metil-histidina Dnmhis N-(hidroxietil))glicina Nser D-N-metilisoleucina Dnmile N-(imidazoliletil))- glicina Nhis D-N-metileucina Dnmleu N-(3-indolilietil)- glicina Nhtrp D-N-metilisina Dnmlys N-metil-y-aminobutirato Nmgabu N-metilciclo- D-N-metilmetionina Dnmmet hexilalanina Nmchexa D-N-metilornitina Dnmorn N-metilciclopentil- alanina Nmcpen N-metilglicina Nala D-N-metilfenilalanina Dnmphe N-metilaminoisobutirato Nmaib D-N-metilprolina Dnmpro N-(1-metilpropil)glicina Nile D-N-metilserina Dnmser N-(2-metilpropil)glicina Nleu D-N-metiltreonina Dnmthr D-N-metiltriptofano Dnmtrp N-(1-metiletil)glicina Nval (continuação) Aminoácido não Código Aminoácido não Código convencional convencional D-N-metiltirosina Dnmtyr N-metil-naptilalanina Nmanap D-N-metilvalina Dnmval N-metilpenicilamina Nmpen ácido γ-aminobutírico Gabu N-(p-hidroxifenil)- glicina Nhtyr 31 L-t-butilglicina Tbug L-etilglicina Etg L-homofenilalanina Hphe L-a-metilarginina Marg L-a-metilaspartato Masp L-a-metileisterna Mcys L-a-metiIglutamina Mgln L-a-metil-histidina Mhis L-a-metilisoleucina Mile L-a-metileucina Mleu L-a-metilmetionina Mmet L-a-metilnorvalina Mnva L-a-metilfenilalanina Mphe L-a-metilserina Mser L-a-metiltriptofano Mtrp L-a-metilvalina Mval N-(N-(2,2-difeniletil)- carbamilmetil)glicina Nnbhm 1-carboxi-l-(2,2- difeniletilamino)- ciclopropano Nmbc N-(tiometil)glicina Ncys penicilamina Pen L-a-metilalanina Mala L-a-metilasparagina Masn L-a-metil-t-butilglicina Mtbug L-metiletilglicina Metg L-a-metilglutamato Mglu L-a-metil- homofenilalanina Mhphe N- (2- metiltioetil)glicina Nmet L-a-metilisina Mlys L-a-metilnorleucina Mnle L-a-metilornitina Morn L-a-metilprolina Mpro L-a-metiltreonina Mthr L-a-metiltirosina Mtyr L-N-metil-homofenilalanina Nmhphe N-(N-(3,3-difenilpropil)- carbamilmetil)glicina Nnbhe
Um segundo aspecto da presente invenção proporciona uma molécula de ácido nucleico isolada que compreende a sequência de nucleótidos apresentada em qualquer uma de SEQ ID Nos: 1 ou 3 ou 5 ou 19 ou 2 0 ou uma sua sequência complementar, ou um seu homólogo, análogo ou derivado. 32
Para os objectivos da nomenclatura, a sequência de nucleótidos apresentada em SEQ ID N°: 1 é derivada de Crepis palaestina e codifica a sequência de monooxigenase de função mista ou a sequência de tipo monooxigenase de função mista apresentada em SEQ ID N°: 2. Como aqui exemplificado, a sequência de aminoácidos apresentada em SEQ ID N°: 2 tem actividade de epoxigenase, mais particularmente actividade de Δ12-epoxigenase. A sequência de nucleótidos apresentada em SEQ ID N°: 3 corresponde a um ADNc derivado de Crepis sp. diferente de C.
palaestina que contém niveis elevados de ácido vernólico. A sequência de aminoácidos apresentada em SEQ ID N°: 4 corresponde à sequência de aminoácidos derivada do gene de epoxigenase de
Crepis sp. proporcionado em SEQ ID N°: 3. A sequência de nucleótidos apresentada em SEQ ID N°: 5 corresponde a ADN amplificado derivado de Vernonia galamensis utilizando iniciadores de amplificação derivados de uma sequência de consenso de monooxigenases de função mista, incluindo as sequências do gene de epoxigenase de Crepis spp. da invenção. O ADN amplificado compreende uma sequência parcial do gene de epoxigenase, que inclui sequências de nucleótidos capazes de codificar o motivo rico em histidina His-Arg-Asn-His-His que é caracteristico de enzimas monooxigenases de função mista. A sequência de aminoácidos apresentada em SEQ ID N°: 6 corresponde à sequência de aminoácidos derivada do gene de epoxigenase do Vernonia galamensis proporcionado em SEQ ID N° : 5. A sequência de nucleótidos apresentada em SEQ ID N°: 7 refere-se à sequência parcial de um gene de acetilenase de Crepis alpina que foi utilizada como uma sonda para isolar a 33 molécula de ácido nucleico compreendendo a sequência de nucleótidos apresentada em SEQ ID N°: 1. A sequência de aminoácidos apresentada em SEQ ID N°: 8 corresponde à sequência de aminoácidos derivada da referida sequência parcial do gene de acetilenase de C. alpina.
Como aqui utilizado, o termo "acetilenase" deve ser entendido para referir uma enzima que seja capaz de catalizar a conversão de uma ligação dupla de carbono numa molécula de substrato de ácido gordo numa ligação tripla de carbono ou, alternativamente, que seja capaz de catalizar a formação de uma ligação tripla de carbono numa molécula de ácido gordo. A sequência de nucleótidos apresentada em SEQ ID N°: 18 corresponde a um iniciador de amplificação degenerado utilizado para amplificar sequências putativas do gene de epoxigenase de
Euphorbia lagascae. A este respeito, os resíduos de nucleótidos mostrados em SEQ ID N°: 18 são aqueles recomendados pela
IUPAC-IUB Nomenclature Biochemical Commission, em que A representa Adenina, C representa Citosina, G representa Guanina, T representa timina, Y representa um resíduo de pirimidina, R representa um resíduo de purina, M representa Adenina ou
Citosina, K representa Guanina ou Timina, S representa Guanina ou Citosina, W representa Adenina ou Timina, H representa um nucleótido diferente de Guanina, B representa um nucleótido diferente de Adenina, V representa um nucleótido diferente de
Timina, D representa um nucleótido diferente de Citosina e N representa qualquer resíduo de nucleótidos. A sequência de nucleótidos apresentada em SEQ ID N°: 19 é derivada de Euphorbia lagascae e codifica a sequência de monooxigenase dependente de citocromo P-450 ou a sequência de tipo monooxigenase dependente de citocromo P-450 putativa. 34 A sequência de nucleótidos apresentada em SEQ ID N°: 20 é derivada de Euphorbia lagascae e codifica uma sequência de monooxigenase dependente de citocromo P-450 ou uma sequência de tipo monooxigenase dependente de citocromo P-450 putativa. A presente invenção estende-se claramente aos equivalentes de genes genómicos das moléculas de ADNc exemplificadas em qualquer uma de SEQ ID Nos: 1, 3, 5, 19 ou 20.
Numa forma de realização muito particularmente preferida, a presente invenção proporciona uma molécula de ácido nucleico isolada que compreende a sequência de nucleótidos apresentada em qualquer uma de SEQ ID Nos: 1, 3, 5, 19 ou 20 ou um equivalente de gene genómico da referida sequência de nucleótidos ou um seu homólogo, análogo ou derivado.
Para o presente objectivo, "homólogos" de uma sequência de nucleótidos, deve ser entendido para referir uma molécula de ácido nucleico isolada que seja substancialmente a mesma que a molécula de ácido nucleico da presente invenção ou a sua sequência de nucleótidos complementar, apesar da ocorrência dentro da referida sequência, de uma ou mais substituições, inserções, delecções ou rearranjos de nucleótidos. "Análogos" de uma sequência de nucleótidos aqui apresentada deve ser entendido para referir uma molécula de ácido nucleico isolada que seja substancialmente a mesma que uma molécula de ácido nucleico da presente invenção ou a sua sequência de nucleótidos complementar, apesar da ocorrência de quaisquer constituintes não nucleotidicos não habitualmente presentes na referida molécula de ácido nucleico isolada, por exemplo, hidratos de carbono, radioquímicos, incluindo radionucleótidos, moléculas repórter, tais como, mas não limitadas a DIG, fosfatase alcalina ou peroxidase de rábano, entre outros. 35 "Derivados" de uma sequência de nucleótidos aqui apresentada deve ser entendido para referir qualquer molécula de ácido nucleico isolada que contiver similaridade de sequência significativa com a referida sequência ou uma sua parte.
Geralmente, os homólogos, análoqos ou derivados da molécula de ácido nucleico da invenção são produzidos através de meios sintéticos ou alternativamente, derivados de fontes de ocorrência natural. Por exemplo, a sequência de nucleótidos da presente invenção pode ser submetida a mutagénese para produzir substituições, delecções e/ou inserções simples ou múltiplas de nucleótidos, como indicado supra.
Numa forma de realização da invenção, os homólogos, análogos ou derivados preferidos das sequências de nucleótidos apresentadas em qualquer uma de SEQ ID Nos: 1, 3, 5, 19 ou 20 ou suas sequências complementares, codificam polipéptidos imunologicamente activos ou enzimaticamente-activos.
Como aqui utilizado, o termo "imunologicamente activo" deve ser entendido para referir a capacidade de uma molécula de polipéptido para induzir uma resposta imune num mamifero, em particular uma resposta imune suficiente para produzir uma molécula de anticorpo, tal como, mas não se limitando a, uma molécula de IgM ou IgG ou soro completo contendo a referida molécula de anticorpo. O termo "imunologicamente activo" estende-se também à capacidade de um polipéptido para induzir uma resposta imune suficiente para a produção de anticorpos monoclonais, fragmentos Fab sintéticos de uma molécula de anticorpo, molécula de anticorpo de cadeia simples ou outra molécula imunointeractiva. 36
Como aqui utilizado, o termo "enzimaticamente activo" deve ser entendido para referir a capacidade de uma molécula de polipéptido para catalizar uma reacção enzimática, em particular uma reacção enzimática que compreende a epoxigenação de uma ligação de carbono numa molécula de substrato de ácido gordo. Mais particularmente, embora não limitando a invenção, o termo "enzimaticamente activo" pode também referir a capacidade de uma molécula de polipéptido para catalizar a epoxigenação de Δ-9 ou Δ-12 numa molécula de substrato de ácido gordo, tal como ácido linoleico ou ácido vernólico.
Numa forma de realização alternativa, um homólogo, análogo ou derivado preferido da sequência de nucleótidos apresentada em qualquer uma de SEQ ID Nos: 1 ou 3 ou 5, ou uma sua sequência complementar, compreende uma sequência de nucleótidos que seja, pelo menos, 65% idêntica a, pelo menos, 20 nucleótidos contíguos aí presentes, diferente de uma sequência de nucleótidos que codifique uma enzima acetilenase de Crepis sp.
De um modo mais preferido, a percentagem de identidade para qualquer uma de SEQ ID Nos: 1 ou 3 ou 5 é, pelo menos, cerca de 85%. De um modo ainda mais preferido, um homólogo, análogo ou derivado de SEQ ID Nos: 1 ou 3 ou 5 é, pelo menos, cerca de 90% e, de um modo ainda mais preferido, pelo menos, cerca de 95% idêntico a, pelo menos, 100 ou 250 ou 500 ou 1000 nucleótidos contíguos aí presentes. A percentagem de identidade para SEQ ID Nos: 19 ou 20, ou suas sequências complementares, é, pelo menos, cerca de 75%, relativamente a, pelo menos, cerca de 200 nucleótidos contíguos, de um modo ainda mais preferido, pelo menos, cerca de 80%, ainda de um modo ainda mais preferido, pelo menos, cerca de 90% e ainda de um modo ainda mais preferido, pelo menos, cerca de 95%, incluindo, pelo menos, cerca de 99% de identidade. As sequências 37 de nucleótidos que são, pelo menos, 65% relativamente a, pelo menos, cerca de 400 nucleótidos contíguos em SEQ ID Nos: 19 ou 20 estão também dentro do âmbito da invenção.
Aqui a referência a uma percentagem de identidade ou percentagem de similaridade entre dois ou mais nucleótidos ou sequências de aminoácidos deve ser entendida para referir o número de resíduos idênticos ou semelhantes num alinhamento de sequências de nucleótidos ou aminoácidos, como determinado utilizando qualquer algoritmo padrão conhecido dos especialistas na técnica. Em particular, as identidades e similaridades de sequências de nucleótidos e/ou aminoácidos podem ser calculadas utilizando o programa Gap, que utiliza o algoritmo de Needleman e Wunsch (1970) para maximizar o número de resíduos condizentes e minimizar o número de lacunas de sequência. O programa Gap é parte do Sequence and Analysis Software Package do Computer Genetics Group Inc., University Research Park, Madison, Wisconsin, Estados Unidos da América (Devereux et al., 1984).
Numa forma de realização alternativa adicional, um homólogo, análogo ou derivado preferido da sequência de nucleótidos apresentada em qualquer uma de SEQ ID Nos: 1, 3, 5, 19 ou 20 ou uma sua sequência complementar, hibrida sob condições, pelo menos, de baixa restringência com, pelo menos, 20 nucleótidos contíguos derivados da referida sequência.
De um modo mais preferido, a restringência de hibridação é, pelo menos, restringência moderada, de um modo ainda mais preferido, pelo menos, restringência elevada.
Para os objectivos de definir o nível de restringência, os especialistas na técnica estarão cientes que podem ser utilizadas diversas condições de hibridação diferentes. Por exemplo, uma restringência baixa pode compreender uma hibridação 38 e/ou lavagem realizada em tampão 6 x SSC, 0,1% (p/v) de SDS a 28 °C. Uma restringência moderada pode compreender uma hibridação e/ou lavagem realizada em tampão 2 x SSC, 0,1% (p/v) de SDS a uma temperatura na gama de 45 °C a 65 °C. Uma restringência elevada pode compreender uma hibridação e/ou lavagem realizada em tampão 0,1 x SSC, 0,1% (p/v) de SDS a uma temperatura de, pelo menos, 65 °C.
Geralmente, a restringência é aumentada por redução da concentração do tampão SSC, e/ou aumentando a concentração de SDS no tampão de hibridação ou tampão de lavagem e/ou aumentando a temperatura em que a hibridação e/ou lavagem é realizada. As condições para hibridações e lavagens são bem compreendidas por um especialista na técnica. Para os objectivos de esclarecimento dos parâmetros que afectam a hibridação entre moléculas de ácido nucleico, pode ser feita convenientemente referência às páginas 2.10.8 até 2.10.16. de Ausubel et al. (1987), que é aqui incorporado por referência.
As moléculas de ácido nucleico isoladas aqui divulgadas podem ser utilizadas para isolar ou identificar os seus homólogos, análogos ou derivados a partir de outros tipos de células, tecidos ou órgãos, ou a partir das células, tecidos, órgãos de outras espécies utilizando qualquer um de uma variedade de meios conhecidos dos especialistas na técnica.
Por exemplo, o ADN genómico, ou ARNm, ou ADNc pode ser contactado, sob condições, pelo menos, de hibridação de baixa restringência ou equivalente, com uma quantidade de hibridação eficaz de uma molécula de ácido nucleico isolada que compreende a sequência de nucleótidos apresentada em qualquer uma de SEQ ID Nos: 1, 3, 5, 19 ou 20 ou uma sua sequência complementar, ou uma sua parte funcional, e a hibridação detectada utilizando meios de detecção. 39
Os meios de detecção podem ser uma molécula repórter capaz de dar um sinal identificável (e. g., um radioisótopo, tal como 32P ou 35S, ou uma molécula biotinilada) ligado covalentemente à molécula de ácido nucleico isolada da invenção.
Num método alternativo, o meio de detecção é qualquer formato conhecido da reacção em cadeia da polimerase (PCR). De acordo com este método, são concebidos agrupamentos degenerados de "moléculas iniciadoras" de ácido nucleico de cerca de 15-50 nucleótidos de comprimento com base nas sequências de nucleótidos divulgadas em SEQ ID Nos: 1, 3, 5, 19 ou 20 ou uma sua sequência complementar. Os homólogos, análogos ou derivados (i. e., a "molécula molde") são hibridados com duas das referidas moléculas iniciadoras, de modo que um primeiro iniciador híbrida com uma região numa cadeia da molécula molde e um segundo iniciador híbrida com uma sua sequência complementar, em que o primeiro e segundo iniciadores não estão hibridados dentro das mesmas ou sobrepostas regiões da molécula molde e em que cada iniciador está posicionado numa orientação 5' para 3' relativamente à posição em que o outro iniciador está hibridado na cadeia oposta. Cópias da molécula de ácido nucleico específicas da molécula molde são enzimaticamente amplificadas numa reacção em cadeia da polimerase, uma técnica que é bem conhecida de um especialista na técnica.
As moléculas iniciadoras podem compreender qualquer resíduo de nucleótido de ocorrência natural (i. e., adenina, citidina, guanina, timidina) e/ou compreendem inosina ou seus análogos ou derivados funcionais, capazes de serem incorporados numa molécula de polinucleótido. As moléculas iniciadoras de ácido nucleico podem também estar contidas numa mistura aquosa de outras moléculas iniciadoras de ácido nucleico ou estarem numa forma substancialmente pura. 40 A sequência detectada pode estar numa forma recombinante, numa partícula virai, partícula do bacteriófago, célula de levedura, célula animal, ou uma célula vegetal. De um modo preferido, a sequência genética relacionada é originária de outra espécie vegetal.
Um terceiro aspecto da presente invenção proporciona uma molécula de ácido nucleico isolada que codifica a sequência de aminoácidos apresentada em qualquer uma de SEQ ID Nos: 2 ou 4 ou 6 ou um seu homólogo, análogo ou derivado.
Numa forma de realização aqui contemplada, os homólogos, análogos ou derivados preferidos das sequências de aminoácidos apresentadas em SEQ ID Nos: 2, 4, ou 6, são polipéptidos imunologicamente activos ou enzimaticamente activos, como definido supra.
Numa forma de realização alternativa da invenção, os homólogos, análogos ou derivados preferidos da sequência de aminoácidos apresentada em qualquer uma de SEQ ID Nos: 2, 4 ou 6, compreendem uma sequência de aminoácidos que é, pelo menos, 60% idêntica à mesma, e diferente de um polipéptido de acetilenase de Crepis sp. De um modo mais preferido, os homólogos, análogos ou derivados de SEQ ID Nos: 2 ou 4 ou 6 que são abrangidos pela presente invenção são, pelo menos, cerca de 85% idênticos, de um modo ainda mais preferido, pelo menos, cerca de 90% idênticos e ainda de um modo ainda mais preferido, pelo menos, cerca de 95% idênticos, e de um modo ainda mais preferido, pelo menos, cerca de 99%-100% idênticos à mesma.
Os homólogos, análogos ou derivados de qualquer uma de SEQ ID Nos: 2 ou 4 ou 6 podem ainda compreender uma região rica em histidina como definido supra. De um modo ainda mais preferido, 41 a epoxigenase em causa compreende, pelo menos, uma sequência de aminoácidos que contém três ou mais regiões ricas em histidina como se seguem: (i) His-Glu-Cys-Gly-His-His (SEQ ID N°: 15); (ii) His-Arg-Asn-His-His (SEQ ID N°: 16); e (iii) His-Val-Met-His-His (SEQ ID N°: 17), ou um seu homólogo, análogo ou derivado. A invenção descrita de acordo com esta forma de realização alternativa não abrange as enzimas A12-dessaturases derivadas de Arabidopsis thaliana, Brassica juncea, Brassica napus ou Glycine max, entre outras. A molécula de ácido nucleico isolada da presente invenção é útil para desenvolver construções genéticas compreendendo uma molécula de sentido, em que as referidas construções genéticas são concebidas para a expressão numa célula que não expressa normalmente a referida molécula de ácido nucleico ou a sobreexpressão da referida molécula de ácido nucleico numa célula que expressa normalmente a referida molécula de ácido nucleico.
De acordo com o exposto, um aspecto adicional da invenção proporciona uma construção genética que compreende uma molécula de sentido que é ligada operacionalmente a uma sequência promotora. 0 termo "molécula de sentido" como aqui utilizado deve ser entendido para referir uma molécula de ácido nucleico isolada que codifica ou é complementar a uma molécula de ácido nucleico isolada que codifica uma epoxigenase de ácido gordo, em que a referida molécula de ácido nucleico é proporcionada num formato 42 adequado para a sua expressão, para produzir um polipéptido recombinante quando a referida molécula de sentido é introduzida numa célula hospedeira através de transfecção ou transformação.
Os especialistas na técnica estarão cientes que uma construção genética pode ser utilizada para "transfectar" uma célula, o que nesse caso é introduzida na referida célula sem integração no genoma da célula. Alternativamente, uma construção genética pode ser utilizada para "transformar" uma célula, o que nesse caso é integrado estavelmente no genoma da referida célula.
Uma molécula de sentido que corresponda a uma sequência do gene de epoxigenase de ácido gordo ou um seu homólogo, análogo ou derivado, pode ser introduzida numa célula utilizando qualquer método conhecido para a transfecção ou transformação da referida célula. Em que uma célula é transformada pela construção genética da invenção, um organismo inteiro pode ser regenerado a partir de uma única célula transformada, utilizando qualquer método conhecido dos especialistas na técnica.
Assim, os genes de epoxigenase aqui descritos podem ser utilizados para desenvolver células individuais ou organismos inteiros que sintetizam ácidos gordos epoxi não produzidos normalmente por organismos selvagens ou de ocorrência natural, pertencentes aos mesmos géneros ou espécies do que os géneros ou espécies dos quais é derivada a célula transfectada ou transformada, ou para aumentar os níveis desses ácidos gordos acima dos níveis normalmente encontrados nesses organismos selvagens ou de ocorrência natural.
Numa forma de realização preferida alternativa, a molécula de ácido nucleico isolada da invenção é capaz de reduzir o nível de ácidos gordos epoxi numa célula, quando aí expressa, na 43 orientação de anti-sentido ou como uma molécula de ribozima ou de co-supressão, sob o controlo de uma sequência promotora adequada. A co-supressão é a redução em expressão de um gene endógeno que ocorre quando uma ou mais cópias do referido gene, ou uma ou mais cópias de um gene substancialmente semelhante, é introduzida na célula. A presente invenção estende-se também à utilização de co-supressão para inibir a expressão de um gene de epoxigenase como o aqui descrito.
No contexto da presente invenção, uma molécula de anti-sentido é uma molécula de ARN que é transcrita a partir da cadeia complementar de um gene nuclear, o qual é normalmente transcrito para produzir uma molécula de ARNm de "sentido" capaz de ser traduzida num polipéptido. A molécula de anti-sentido é, deste modo complementar ao ARNm de sentido, ou uma sua parte. Embora não limitando o modo de acção das moléculas de anti-sentido da presente invenção em qualquer mecanismo específico, a molécula de ARN de anti-sentido possui a capacidade para formar um ARNm de cadeia dupla através de emparelhamento de bases com o ARNm de sentido, que pode prevenir a tradução do ARNm de sentido e subsequente síntese de um produto génico de polipéptido.
As ribozimas são moléculas de ARN sintéticas que compreendem uma região de hibridação complementar a duas regiões, cada uma de, pelo menos, 5 bases nucleotídicas contíguas no ARNm de sentido alvo. Além disso, as ribozimas possuem actividade endoribonuclease altamente específica, que cliva autocataliticamente o ARNm de sentido alvo. Uma descrição completa de função das ribozimas é apresentada por Haseloff e Gerlach (1988) e contida no Pedido de Patente Internacional N° WO89/05852. A presente invenção estende-se a ribozimas que se 44 dirigem a um ARNm de sentido codificando um polipéptido de epoxigenase aqui descrito, hibridando desse modo com o referido ARNm de sentido e clivando-o, de modo a não ser mais capaz de ser traduzido para sintetizar um produto polipeptídico funcional.
De acordo com esta forma de realização, a presente invenção proporciona uma ribozima ou molécula de anti-sentido compreendendo uma sequência de bases nucleotidicas contíguas que são capazes de formar um complexo ligado por pontes de hidrogénio com um ARNm de sentido, codificando uma epoxigenase aqui descrita para reduzir a tradução do referido ARNm. Embora as moléculas preferidas de anti-sentido e/ou de ribozima hibridem com, pelo menos, cerca de 10 a 20 nucleótidos da molécula alvo, a presente invenção estende-se a moléculas capazes de hibridar com, pelo menos, cerca de 50-100 bases nucleotidicas de comprimento, ou uma molécula capaz de hibridar com um ARNm de epoxigenase de tamanho total ou substancialmente tamanho total. É compreendido na técnica que determinadas modificações, incluindo substituições de nucleótidos, entre outras, podem ser realizadas nas moléculas de anti-sentido e/ou de ribozima da presente invenção, sem destruir a eficácia das referidas moléculas na inibição da expressão do gene de epoxigenase. Está, deste modo, dentro do âmbito da presente invenção a inclusão de todas as variantes, homólogos, análogos ou fragmentos da sequência de nucleótidos do referido gene que codifica o mesmo, sendo a única exigência que essa referida variante da sequência de nucleótidos, quando transcrita, produza uma molécula de anti-sentido e/ou de ribozima que seja capaz de hibridar com a referida molécula de ARNm de sentido. 45 A presente invenção estende-se a construções genéticas concebidas para facilitar a expressão de uma molécula de sentido, uma molécula de anti-sentido, molécula de ribozima ou molécula de co-supressão que é capaz de alterar o nivel de ácidos gordos epoxi numa célula.
Numa forma de realização particularmente preferida, a molécula de sentido, molécula de anti-sentido, molécula de ribozima, molécula de co-supressão, ou molécula dirigida ao gene que é capaz de alterar a composição de ácidos gordos epoxi de uma célula derivada de planta ou outro organismo, compreende uma sequência de nucleótidos apresentada em qualquer uma de SEQ ID Nos: 1, 3, 5, 19 ou 20 e, de um modo mais preferido, em qualquer uma de SEQ ID Nos: 1 ou 3 ou 5 e, de um modo ainda mais preferido em SEQ ID N°: 1 ou uma sua cadeia complementar, homólogo, análogo ou derivado.
Os especialistas na técnica estarão também cientes que a expressão de uma molécula de sentido, anti-sentido, ribozima ou co-supressão pode requerer que a molécula de ácido nucleico da invenção seja colocada em ligação operável com uma sequência promotora. A escolha do promotor para o presente objectivo pode variar dependendo do nivel de expressão da molécula de sentido requerida e/ou das espécies das quais a célula hospedeira é derivada e/ou da especificidade do tecido ou especificidade de desenvolvimento da expressão da molécula de sentido que é requerida.
Aqui a referência a um "promotor" deve ser entendida no seu contexto mais lato e inclui as sequências reguladores de transcrição de um gene genómico eucariótico clássico, incluindo a caixa TATA que é requerida para iniciação da transcrição rigorosa, com ou sem uma sequência da caixa CCAAT e elementos reguladores adicionais (i. e., sequências activadoras a 46 montante, intensificadores e silenciadores) que alteram a expressão génica em resposta aos estímulos de desenvolvimento e/ou externos, ou de um modo especifico de tecido. No contexto da presente invenção, o termo "promotor" inclui também as sequências reguladores de transcrição de um gene procariótico clássico, que nesse caso pode incluir uma sequência da caixa -35 e/ou sequências reguladores de transcrição da caixa -10.
No presente contexto, o termo "promotor" é também utilizado para descrever uma molécula sintética ou de fusão, ou derivada que confere, activa ou intensifica a expressão de referida molécula de sentido numa célula. Os promotores preferidos podem conter cópias adicionais de um ou mais elementos reguladores específicos, para intensificar adicionalmente a expressão da molécula de sentido e/ou para alterar a expressão espacial e/ou a expressão temporal da referida molécula de sentido. Por exemplo, podem ser colocados elementos reguladores responsivos a cobre adjacentemente a uma sequência promotora heteróloga que dirige a expressão de uma molécula de sentido para conferir ai expressão indutivel a cobre.
Colocando uma molécula de sentido, anti-sentido, ribozima ou co-supressão sob o controlo regulador de uma sequência promotora, significa posicionar a referida molécula de modo que a expressão seja controlada pela sequência promotora. Um promotor está geralmente, mas não necessariamente, posicionado a montante ou 5' de uma molécula de ácido nucleico que regula. Além disso, os elementos reguladores compreendendo um promotor estão geralmente posicionados no intervalo de 2 kb do sitio de inicio da transcrição da molécula de sentido, anti-sentido, ribozima ou co-supressão, ou gene quimérico, compreendendo os mesmos. Na construção de combinações heterólogas de gene estrutural/promotor é geralmente preferido posicionar o promotor a uma distância do sitio de inicio da transcrição génica que é 47 aproximadamente a mesma que a distância entre esse promotor e o gene que controla no seu contexto natural, i. e., o gene do qual o promotor é derivado. É sabido na técnica, que pode ser acomodada alguma variação nesta distância, sem perda da função do promotor. Do mesmo modo, o posicionamento preferido de um elemento de sequência regulador relativamente a um gene heterólogo a ser colocado sob seu controlo é definido pelo posicionamento do elemento no seu contexto natural, i. e., os genes dos quais o promotor é derivado. Novamente, como é sabido na técnica, pode também ocorrer alguma variação nesta distância.
Os exemplos de promotores adequados para utilização em construções genéticas da presente invenção incluem promotores derivados de genes de virus, leveduras, bolores, bactérias, insectos, pássaros, mamiferos e plantas que são capazes de funcionar em células isoladas ou organismos inteiros dai regenerados. 0 promotor pode regular a expressão da molécula de sentido, anti-sentido, ribozima ou co-supressão constitutivamente, ou diferencialmente, relativamente ao tecido em que ocorre a expressão ou, relativamente à fase de desenvolvimento em que a ocorre expressão, ou em resposta a estímulos externos, tais como stresses fisiológicos, patogenes, ou iões metálicos, entre outros.
Os exemplos de promotores incluem o promotor 35S de CaMV, promotor NOS, promotor da octopina sintase (OCS), promotor do gene SSU de Arabidopsis thaliana, promotor napin específico de semente, promotor P32, promotor imm de BK5-T, promotor lac, promotor tac, promotores do fago lambda XL ou XR, promotor CMV (Patente US N° 5168062), promotor T7, promotor lacUV5, promotor SV40 precoce (Patente US N° 5118627), promotor SV40 tardio (Patente US N° 5118627), promotor de adenovírus, promotor de baculovírus PIO ou poli-hedrina (Patentes US Nos 5243041, 5242687, 5266317, 4745051 e 5169784), e semelhantes. Para além 48 dos promotores específicos aqui identificados, são úteis promotores celulares para os denominados genes housekeeping.
Os promotores preferidos, de acordo com esta forma de realização, são aqueles promotores que são capazes de funcionar em células de levedura, bolor ou vegetais. De um modo mais preferido, os promotores adequados para utilização de acordo com esta forma de realização são capazes de funcionar em células derivadas de leveduras oleaginosas, bolores oleaginosos ou cultivares de semente oleoginosa, tais como linho vendido sob a marca registada Linola® (aqui referida adiante como "linho Linola®"), girassol, cártamo, soja, linhaça, sésamo, semente de algodão, amendoim, azeitona ou palma-de-azeite, entre outros. A Linola® é uma marca registada da Commonwealth Scientific and Industrial Research Organisation (CSIRO), Austrália.
Numa forma de realização mais preferida, o promotor pode ser derivado de um clone genómico codificando uma enzima epoxigenase, derivada, de um modo preferido, dos equivalentes do gene genómico de genes de epoxigenase derivados de Chrysanthemum spp.r Crepis spp., incluindo C. palaestina ou outros Crepis sp., Euphorbia lagascae ou Vernonia galamensis, que são aqui referidos.
Numa forma de realização mais preferida, o promotor pode ser derivado de um gene de semente altamente expresso, tal como o gene napin, entre outros. A construção genética da invenção pode ainda compreender uma sequência terminadora e ser introduzida numa célula hospedeira adequada onde seja capaz de ser expressa para produzir um produto génico de polipéptido recombinante ou alternativamente, uma ribozima ou molécula de anti-sentido. 49 0 termo "terminador" refere-se a uma sequência de ADN na extremidade de uma unidade de transcrição que sinaliza a terminação da transcrição. Os terminadores são sequências de ADN 3' não traduzidas contendo um sinal de poliadenilação que facilita a adição de sequências de poliadenilato à extremidade 3' de um transcripto primário. São conhecidos e descritos na literatura terminadores activos em células derivadas de virus, leveduras, bolores, bactérias, insectos, pássaros, mamíferos e plantas. Podem ser isolados a partir de bactérias, fungos, virus, animais e/ou plantas.
Os exemplos de terminadores particularmente adequados para utilização nas construções genéticas da presente invenção incluem o terminador do gene da nopalina sintase (NOS) de Agrobacterium tumefaciens, o terminador do gene 35S do virus do mosaico de Couve-flor (CaMV) , o terminador do gene zein de Zea mays, as sequências terminadoras do gene da subunidade pequena da Rubisco (SSU) , terminadores da sequência génica do stunt virus de trevo subterrâneo (SCSV), qualquer terminador de E. coli independente de rho, entre outros.
Os especialistas na técnica estarão cientes de sequências promotoras e sequências terminadoras adicionais que podem ser adequadas para utilização na realização da invenção. Essas sequências podem ser prontamente utilizadas sem qualquer experimentação supérflua.
As construções genéticas da invenção podem ainda incluir uma sequência de origem de replicação que é requerida para replicação num tipo especifico de célula, por exemplo, uma célula bacteriana, quando a referida construção genética é 50 requerida para ser mantida como um elemento genético epissomal (e. g., molécula de plasmideo ou cosmideo) na referida célula.
As origens de replicação preferidas incluem, mas não são limitadas, às origens de replicação fl-ori e colEl. A construção genética pode ainda compreender um gene ou genes marcadores de selecção que são funcionais numa célula em que é introduzida a referida construção genética.
Como aqui utilizado, o termo "gene marcador de selecção" inclui qualquer gene que confira um fenótipo numa célula em que é expresso para facilitar a identificação e/ou selecção de células que são transfectadas ou transformadas com uma construção genética da invenção ou um seu derivado.
Os genes marcadores de selecção adequados aqui contemplados incluem o de resistência à ampicilina (Ampr) , gene de resistência à tetraciclina (Tcr) , gene bacteriano de resistência à canamicina (Kanr) , gene de resistência à fosfinotricina, gene da neomicina fosfotransferase (nptll), gene de resistência à higromicina, gene da β-glucuronidase (GUS), gene da cloranfenicol acetiltransferase (CAT) e gene da luciferase, entre outros.
Um aspecto adicional da presente invenção proporciona uma célula, tecido, órgão ou organismo inteiro transfectado ou transformado que expressa um polipéptido de epoxigenase recombinante ou uma molécula de ribozima, anti-sentido ou co-supressão como aqui descritos, ou um seu homólogo, análogo ou derivado.
De um modo preferido, a molécula de ácido nucleico isolada está contida numa construção genética como a aqui descrita. A construção genética da presente invenção pode ser introduzida 51 numa célula através de várias técnicas conhecidas dos especialistas na técnica. A técnica utilizada pode variar dependendo das técnicas bem sucedidas conhecidas para esse organismo particular.
Os meios para introduzir ADN recombinante em células bacterianas, células de levedura, ou células ou tecidos de plantas, insectos, fungos (incluindo bolor), aves ou mamíferos incluem, mas não são limitados, a transformação utilizando CaCl2 e suas variações, em particular o método descrito por Hanahan (1983), incorporação directa de ADN em protoplastos (Krens et al., 1982/ Paszkowski et al., 1984), incorporação mediada por PEG em protoplastos (Armstrong et al., 1990) bombardeamento de microparticulas, electroporação (Fromm et al., 1985), microinjecção de ADN (Crossway et al., 1986), bombardeamento de microparticulas de explantes de tecido ou células (Christou et al., 1988; Sanford, 1988), infiltração por vácuo de tecido com ácido nucleico, ou no caso de plantas, transferência mediada por T-ADN de Agrobacterium para o tecido vegetal como essencialmente descrito por An et al. (1985), Herrera-Estrella et al. (1983a, 1983b, 1985).
Para o bombardeamento de microparticulas de células, uma microparticula é propulsionada numa célula para produzir uma célula transformada. Pode ser utilizada qualquer metodologia e dispositivo de transformação celular balística adequada na realização da presente invenção. São divulgados dispositivos e processos exemplares por Stomp et al. (Patente US N° 5122466) e Sanford e Wolf (Patente US N° 4945050). Ao utilizar processos de transformação balística, a construção genética pode incorporar um plasmídeo capaz de replicação na célula a ser transformada. 52
Os exemplos de micropartículas adequadas para utilização nesses sistemas incluem esferas de ouro de 1 a 5 pm. A construção de ADN pode ser depositada na micropartícula através de qualquer técnica adequada, tal como por precipitação.
Numa forma de realização particularmente preferida, em que a construção genética compreende uma molécula de "sentido", é particularmente preferido que o polipéptido de epoxigenase recombinante ai produzido seja enzimaticamente activo.
Alternativamente, um organismo inteiro pode ser regenerado a partir da célula transformada, em que a célula é derivada de um organismo multicelular e em que está disponível tecnologia relevante, de acordo com processos bem conhecidos na técnica.
Os especialistas na técnica estarão também cientes dos métodos para transformar, regenerar e propagar outros tipos de células, tais como aquelas de fungos.
No caso de plantas, pode ser transformado tecido vegetal capaz de subsequente propagação clonal, quer por organogénese ou embriogénese, com uma construção genética da presente invenção e daí regenerada uma planta inteira. 0 tecido particular escolhido variará dependendo dos sistemas de propagação clonal disponíveis, e mais adequados, para a espécie particular a ser transformada. Os alvos tecidulares exemplares incluem discos de folha, pólen, embriões, cotilédones, hipocótilos, megagametófitos, tecido de callus, tecido meristemático existente (e. g., meristema apical, rebentos axilares e meristemas radiculares) e tecido de meristema induzido (e. g., meristema de cotilédone e meristema de hipocótilo). 53 0 termo "organogénese", como aqui utilizado, significa um processo através do qual são sequencialmente desenvolvidos rebentos e raizes a partir de centros meristemáticos. 0 termo "embriogénese", como aqui utilizado, significa um processo através do qual que são desenvolvidos conjuntamente rebentos e raizes numa forma concertada (não sequencialmente) , quer a partir de células somáticas ou gâmetas.
As plantas transformadas regeneradas podem ser propagadas através de uma variedade de meios, tais como através de propagação clonal ou técnicas clássicas de reprodução. Por exemplo, uma planta transformada de primeira geração (ou Tl) pode ser auto-cruzada para produzir um transformante de segunda geração (ou T2) homozigótico, e as plantas T2 propagadas adicionalmente através de técnicas clássicas de reprodução.
Os organismos transformados regenerados, aqui contemplados, podem apresentar uma variedade de formas. Por exemplo, podem ser quimeras de células transformadas e células não transformadas; transformantes clonais (e. g., todas as células transformadas para conter a cassete de expressão); enxertos de tecidos transformados e não transformadas (e. g., em plantas, um raizame transformado enxertado com um rebento não transformado) .
Um aspecto adicional da invenção proporciona um método de alteração do nivel de ácidos gordos epoxi numa célula, tecido, órgão ou organismo, compreendendo o referido método a expressão de uma molécula de sentido, anti-sentido, ribozima ou co-supressão como aqui descrita, na referida célula durante um periodo de tempo e sob condições suficientes para ser aumentado ou reduzido o nivel de ácidos gordos ai presente. 54
Numa forma de realização preferida, o método em causa compreende o primeiro passo adicional de transformação da célula, tecido, órgão ou organismo com a molécula de sentido, anti-sentido, ribozima ou co-supressão.
Como discutido supra, a molécula de ácido nucleico isolada pode estar contida numa construção genética.
De acordo com esta forma de realização, a célula, órgão, tecido ou organismo em que a molécula de sentido, anti-sentido, ribozima ou co-supressão em causa é expressa, pode ser derivada de uma bactéria, levedura, fungo (incluindo um bolor), insecto, planta, pássaro ou mamífero.
Porque um polipéptido de epoxigenase recombinante pode ser produzido no transformante regenerado assim como ex vivo, uma forma de realização preferida alternativa da presente invenção proporciona um método de produção de um polipéptido de epoxigenase recombinante enzimaticamente activo numa célula, compreendendo o referido método os passos de: (i) produção de uma construção genética que compreende o ADNc ou a sequência genética genómica de epoxigenase da invenção colocada operacionalmente sob o controlo de um promotor capaz de conferir expressão na referida sequência genética na referida célula, e opcionalmente um elemento de intensificação da expressão; (ii) transformação da referida construção genética na referida célula; e (iii) selecção dos transformantes que expressam a um nível elevado, a epoxigenase codificada pela sequência genética.
Uma forma de realização particularmente preferida da presente invenção proporciona um método de produção de um 55 polipéptido de epoxigenase recombinante enzimaticamente activo numa planta transgénica compreendendo os passos de: (i) produção de uma construção genética que compreende o ADNc ou a sequência genética genómica de epoxigenase da invenção colocada operacionalmente sob o controlo de um promotor especifico de semente, e opcionalmente de um elemento de intensificação da expressão, em que a referida sequência genética é também colocada a montante de uma sequência terminadora de transcrição; (ii) transformação da referida construção genética numa célula ou tecido da referida planta; e (iii) selecção dos transformantes que expressam a um nivel elevado em sementes, a epoxigenase codificada pela sequência genética.
Numa forma de realização mais particularmente preferida, a planta é uma espécie de semente oleaginosa que produz normalmente niveis significativos de ácido linoleico, por exemplo, linho Linola®, colza de semente oleaginosa, girassol, cártamo, soja, linhaça, sésamo, semente de algodão, amendoim, azeitona ou palma-de-azeite, entre outras.
Numa forma de realização ainda mais particularmente preferida, a planta é uma espécie de semente oleaginosa que produz normalmente niveis significativos de ácido linoleico, por exemplo, linho Linola®, girassol ou cártamo, entre outras.
As epoxigenases recombinantes enzimaticamente activas, aqui descritas, são particularmente úteis para a produção de ácidos gordos epoxigenados a partir de substratos de ácidos gordos insaturados. A presente invenção contempla especialmente a produção de ácidos gordos epoxigenados específicos em células ou 56 organismos transformados regenerados que não produzem normalmente esse ácido gordo epoxigenado especifico.
De acordo com o exposto, um aspecto adicional da invenção proporciona um método de produção de um ácido gordo epoxigenado numa célula, tecido, órgão ou organismo, compreendendo o referido método a incubação de uma célula, tecido, órgão ou organismo que expressa uma epoxigenase recombinante enzimaticamente activa da presente invenção, com uma molécula de substrato de ácido gordo, de um modo preferido uma molécula de substrato de ácido gordo insaturado, durante um periodo de tempo e sob condições suficientes para, pelo menos, uma ligação de carbono do referido substrato ser convertida num grupo epoxi.
Numa forma de realização alternativa, o método em causa compreende ainda o primeiro passo adicional de transformar ou transfectar a célula, tecido, órgão ou organismo com uma molécula de ácido nucleico que codifica a referida epoxigenase recombinante ou um seu homólogo, análogo ou derivado, como aqui descrito anteriormente. Como discutido supra, a molécula de ácido nucleico isolada pode estar contida numa construção genética.
De acordo com esta forma de realização, a célula, órgão, tecido ou organismo em que a epoxigenase em causa é expressa, é derivada de bactéria, levedura, fungo (incluindo um bolor), insecto, planta, pássaro ou mamífero. De um modo mais preferido, a célula, órgão, tecido ou organismo é derivada de uma levedura, planta ou fungo, de um modo ainda mais preferido de uma levedura ou planta ou fungo oleaginosa, ou de uma planta de semente oleaginosa que não expressa normalmente a epoxigenase recombinante da invenção. 57
Entre as principais plantas de semente oleaginosa económicas, aqui contempladas, são alvos preferidos os genótipos de linoleico elevado de linho, girassol, milho e cártamo. A soja e a semente de colza são alvos alternativos mas são menos adequados para sintese máxima de ácido gordo epoxi por causa dos seus niveis inferiores de substrato de ácido linoleico e da presença de uma A15-dessaturase activa que compete com a epoxigenase para o substrato de ácido linoleico.
Uma forma de realização alternativa é a transformação de Linola® (= linho de baixo ácido linolénico) com a epoxigenase da invenção. 0 linho Linola® contém normalmente cerca de 70% de ácido linoleico, sendo muito pouco deste (< 2%) subsequentemente convertido em ácido linolénico pela A15-dessaturase (Green, 1986).
Os substratos de ácido gordo insaturado preferidos, aqui contemplados incluem, mas não são limitados a, ácido palmitoleico, ácido oleico, ácido linoleico, ácido linolénico e ácido araquidónico, entre outros.
Nas espécies vegetais que contêm naturalmente niveis elevados de ácido vernólico, a A12-epoxigenase ai presente pode ser muito eficiente na epoxidação do ácido linoleico. Consequentemente, a presente invenção contempla particularmente a expressão de A12-epoxigenase recombinante derivada de Euphorbia lagascae, Vernonia spp. e Crepis spp. a niveis elevados em sementes oleaginosas transgénicas durante a sintese de óleo de semente, para ai produzir niveis elevados de ácido vernólico.
De acordo com o exposto, o ácido linoleico é um substrato particularmente preferido, de acordo com esta forma de realização da invenção. Não são excluídos substratos adicionais. 58
Os produtos das moléculas de substrato listadas supra são prontamente determinados pelos especialistas na técnica, sem experimentação supérflua. Os ácidos gordos epoxi particularmente preferidos produzidos de acordo com a presente invenção incluem o ácido 12,13-epoxi-9-octadecenóico (ácido vernólico) e o ácido 12,13-epoxi-9,15-octadecadienóico, entre outros.
As condições para a incubação de células, órgãos, tecidos ou organismos que expressam a epoxigenase recombinante na presença da molécula de substrato vai variar dependendo, pelo menos, da incorporação do substrato na célula, tecido, órgão ou organismo, e da afinidade da epoxigenase para a molécula de substrato no ambiente particular seleccionado. As condições óptimas podem ser prontamente determinadas pelos especialistas na técnica relevante. A presente invenção estende-se claramente ao óleo isolado contendo os ácidos gordos epoxi, e/ou ao próprio ácido gordo epoxi isolado, produzido como aqui descrito, e a quaisquer produtos dai derivados, por exemplo, revestimentos, resinas, colas, plásticos, tensioactivos e lubrificantes, entre outros.
Os requerentes mostraram ainda que as monooxigenases de função mista (MMO) que realizam funções catalíticas, tais como dessaturação, acetilenação, hidroxilação e/ou epoxigenação, formam uma familia de genes que partilham considerável similaridade de sequência de nucleótidos e aminoácidos. Por exemplo, as enzimas dessaturase, acetilenase, hidroxilase e/ou epoxigenase que actuam sobre moléculas de substrato possuindo um comprimento de cadeia e posição de qual(ais)quer ligação (ões) dupla (s) de carbono (se presente) semelhantes estão mais intimamente relacionadas entre si do que as enzimas que actuam sobre outros substratos, e podem ser consideradas uma "familia". 59
Sem se estar ligado a qualquer teoria ou modo de acção, a similaridade de sequência entre os membros de qualquer família génica têm a sua base na identidade do substrato envolvido e na similaridade bioquímica dos eventos reaccionais que ocorrem na ligação de carbono alvo, durante a reacção de modificação, sugerindo que as sequências divergentes dentro de uma família podem compreender determinantes catalíticos ou, pelo menos, uma sua parte funcional que contribua para as propriedades catalíticas específicas dos membros da família.
Um exemplo de uma família é as enzimas dessaturase, acetilenase, hidroxilase e/ou epoxigenase que catalizam a dessaturação, acetilenação, hidroxilação e/ou epoxigenação, respectivamente, da posição Δ12 do ácido linoleico (aqui referida adiante como a "família C18 Δ12-ΜΜ0"). Os presentes requerentes compararam as sequências de nucleótidos e aminoácidos dos membros da família C18 A12-MM0 para determinar as suas regiões divergentes que compreendem potencialmente os determinantes de funções catalíticas alternativas na posição Δ12 (aqui referidos adiante como "determinantes catalíticos putativos").
Além disso, a presença dessas famílias de MMOs modificadoras de ácido gordo está contemplada relativamente a outros comprimentos da cadeia de ácido gordo e posições da ligação dupla. Por exemplo, a C18A15-dessaturase está contemplada pertencer a uma família de enzimas relacionadas capazes de dessaturação, acetilenação, hidroxilação e/ou epoxidação da posição Δ15 em substratos de ácido gordo C18, a família C18 Δ15-ΜΜ0.
Através da produção de genes sintéticos em que estes determinantes catalíticos foram permutados (referida como 60 "permuta de domínio") é possível converter genes codificando uma função catalítica naqueles, codificando funções catalíticas alternativas. Por exemplo, a Δ12 epoxigenase da presente invenção pode ser convertida numa AI 2 acetilenase por substituição de porções das suas sequências do terminal C e terminal N com os domínios equivalentes da Δ12 acetilenase de Crepis alpina. Do mesmo modo, também pode ser realizada permuta inversa de domínio.
Como um refinamento adicional, essas alterações na função catalítica podem ser igualmente efectuadas através da realização de alterações específicas (e. g., adição, substituição ou delecção) apenas naqueles aminoácidos dentro de cada domínio que são críticos para a determinação da função catalítica relevante (tal como por mutagénese dirigida).
De acordo com o exposto, um aspecto adicional da presente invenção contempla um gene de ácido gordo sintético compreendendo uma sequência de nucleótidos derivada de um gene de epoxigenase como aqui descrito, em que o referido gene de ácido gordo sintético codifica um polipéptido com actividade de epoxigenase ou acetilenase ou hidroxilase ou dessaturase, em que o referido polipéptido compreende quer uma sequência de aminoácidos que difere de uma enzima epoxigenase ou acetilenase ou hidroxilase ou dessaturase de ocorrência natural, ou o referido polipéptido apresenta propriedades catalíticas que são diferentes de uma enzima epoxigenase ou acetilenase ou hidroxilase ou dessaturase de ocorrência natural, ou o referido polipéptido compreende uma sequência de aminoácidos que é, pelo menos, cerca de 60% idêntica a uma parte de SEQ ID N°: 2 ou 4 ou 6 ou homólogo, análogo ou derivado da referida parte.
De um modo preferido, o gene de ácido gordo sintético da invenção é derivado de um gene de Δ12 epoxigenase. 61
Numa forma de realização, o gene de ácido gordo sintético da invenção codifica um polipéptido de fusão, no qual os aminoácidos do terminal N e/ou terminal C de qualquer uma de SEQ ID Nos: 2 ou 4 ou 6 são substituídos, em grelha, por sequências de aminoácidos de um membro diferente da mesma familia.
Numa forma de realização particularmente preferida, os aminoácidos do terminal N e/ou terminal C de SEQ ID N°: 2 ou 4 ou 6 são substituídos por regiões correspondentes dos polipéptidos de acetilenase, dessaturase ou hidroxilase apresentados na Figura 2. De um modo mais preferido, pelo menos, cerca de 30 resíduos de aminoácidos das regiões do terminal N e/ou terminal C de qualquer uma de SEQ ID Nos: 2 ou 4 ou 6 são substituídos, em grelha, pelas regiões correspondentes dos polipéptidos de acetilenase, dessaturase ou hidroxilase apresentados na Figura 2.
Numa forma de realização alternativa, o gene de ácido gordo sintético da invenção codifica um polipéptido de fusão, no qual os aminoácidos do terminal N e/ou terminal C de uma acetilenase de ácido gordo ou hidroxilase de ácido gordo ou dessaturase de ácido gordo são substituídos, em grelha, pela região do terminal N e/ou terminal C de qualquer uma de SEQ ID Nos: 2 ou 4 ou 6.
Numa forma de realização particularmente preferida, os aminoácidos do terminal N e/ou terminal C de uma acetilenase de ácido gordo ou dessaturase de ácido gordo ou hidroxilase de ácido gordo são substituídos, em grelha, pela região do terminal N e/ou terminal C de qualquer uma de SEQ ID Nos: 2 ou 4 ou 6. De um modo ainda mais preferido, a acetilenase de ácido gordo ou dessaturase de ácido gordo ou hidroxilase de ácido gordo é seleccionada da lista apresentada na Figura 2. 62
Ainda de um modo ainda mais preferido, pelo menos, cerca de 30 residuos de aminoácidos das regiões do terminal N e/ou terminal C de uma acetilenase de ácido gordo ou dessaturase de ácido gordo ou hidroxilase de ácido gordo são substituídos, em grelha, pela região do terminal N e/ou terminal C de qualquer uma de SEQ ID Nos: 2 ou 4 ou 6.
De acordo com o exposto, a presente invenção estende-se a quaisquer variantes das enzimas epoxigenases aqui referidas, em que as referidas variantes são derivadas de um polipéptido de epoxigenase como aqui descrito e apresentam actividade demonstrável de acetilenase ou hidroxilase ou dessaturase, e compreendem, quer uma sequência de aminoácidos que difere de uma enzima acetilenase ou hidroxilase ou dessaturase de ocorrência natural, ou apresentam propriedades catalíticas que são diferentes de uma enzima acetilenase ou hidroxilase ou dessaturase de ocorrência natural, ou compreendem uma sequência de aminoácidos que é, pelo menos, cerca de 60% idêntica a qualquer uma de SEQ ID Nos: 2 ou 4 ou 6.
Como com outros aspectos da invenção, as variantes aqui descritas pode ser produzidas como polipéptidos recombinantes ou em organismos transgénicos, assim que os genes sintéticos em causa sejam introduzidos numa célula hospedeira adequada e aí expressos.
Os polipéptidos recombinantes aqui descritos ou um seu homólogo, análogo ou derivado, também podem ser moléculas imunologicamente activas.
Um aspecto adicional da presente invenção proporciona uma molécula imunologicamente interactiva que é capaz de ligação a um polipéptido de epoxigenase recombinante da invenção. 63
De um modo preferido, o polipéptido de epoxigenase recombinante, ao qual a molécula imunologicamente interactiva é capaz de ligação compreende uma sequência de aminoácidos apresentada em qualquer uma de SEQ ID Nos: 2, 4 ou 6, ou um seu homólogo, análogo ou derivado.
Numa forma de realização, a molécula imunologicamente interactiva é uma molécula de anticorpo. A molécula de anticorpo pode ser monoclonal ou policlonal. Os anticorpos monoclonais ou policlonais podem ser seleccionados a partir de anticorpos de ocorrência natural para um epitopo, ou fragmento peptidico, ou péptido sintético de epoxigenase derivado de um produto génico recombinante ou pode ser produzido especificamente contra uma epoxigenase recombinante ou um seu homólogo, análogo ou derivado.
Ambos os anticorpos policlonais e monoclonais são obteníveis por imunização com um produto génico, ou epitopo, ou fragmento peptidico apropriado de um produto génico. Alternativamente, podem ser utilizados fragmentos de anticorpos, tais como fragmentos Fab. A presente invenção estende-se a anticorpos recombinantes e sintéticos e a híbridos de anticorpos. Um "anticorpo sintético" é aqui considerado como incluindo fragmentos e híbridos de anticorpos
Os anticorpos aqui contemplados podem ser utilizados para identificar sequências genéticas que expressam polipéptidos de epoxigenase relacionados, abrangidos pelas formas de realização aqui descritas. 0 único requisito para a detecção bem sucedida de uma sequência genética de epoxigenase relacionada é que a referida sequência genética seja expressa para produzir, pelo menos, um epitopo reconhecido pela molécula de anticorpo. De um modo 64 preferido, para o objectivo de obter expressão para facilitar a detecção, a sequência genética relacionada é colocada operacionalmente atrás de uma sequência promotora, por exemplo, o promotor lac bacteriano. De acordo com esta forma de realização preferida, os anticorpos são utilizados para detectar a presença de um plasmideo ou bacteriófago que expressa a epoxigenase relacionada. De acordo com o exposto, as moléculas de anticorpo são também úteis na purificação do plasmideo ou bacteriófago que expressa a epoxigenase relacionada.
As moléculas de anticorpo em causa podem também ser utilizadas para purificar a epoxigenase recombinante da invenção ou um equivalente de ocorrência natural ou um homólogo, análogo ou derivado da mesma. A presente invenção é ainda descrita por referência aos seguintes Exemplos não limitantes. EXEMPLO 1
Caracterização de ácidos gordos epoxi em Euphorbia lagascae e Crepis spp.
Sementes das espécies selvagens de Euphorbia lagascae e de várias espécies de Crepis foram rastreadas através de cromatografia liquida gasosa para a presença de ácidos gordos epoxi.
Como mostrado na Tabela 3, a Euphorbia lagascae contêm niveis muito elevados do ácido gordo epoxi ácido vernólico no 65 seu óleo de semente. Foi demonstrado que sementes de Crepis palaestina contêm 61,4% em peso de ácido vernólico e 0,71% em peso do ácido gordo acetilénico ácido crepeninico, de ácidos gordos totais (Tabela 3) . TABELA 3
Composição de ácidos gordos de lipidos derivados de sementes de Crepis alpina, Crepis palaestina e Euphorbia lagascae Ácido Gordo Distribui Crepis alpina .ção Relativa (% Crepis palaestina em peso)a Euphorbia lagascae Palmitico 3, 9 5,1 4,3 Esteárico 1,3 2,3 1,8 Oleico 1,8 6, 3 22,0 Linoleico 14,0 23, 0 10,0 Crepeninico 75, 0 0,7 0 Vernólico 0 61,4 58,0 Outro 4,0 1,2 3,9 (continuação) a Calculado a partir da % de área do total das áreas dos picos integrados na determinação de cromatografia liquida gasosa de derivados de éster metilico dos lipidos da semente EXEMPLO 2
Caracterização bioquímica de linoleato A12-epoxigenases em Euphorbia lagascae e Crepis palaestina 66 A enzima linoleato A12-epoxigenase sintetiza ácido vernólico a partir de ácido linoleico. As linoleato A12-epoxigenases derivadas de Euphorbia do e Crepis palaestina estão localizadas nos microssomas. As enzimas, pelo menos destas espécies, podem permanecer activas em fracções membranares (microssomais) preparadas a partir de sementes em desenvolvimento.
As preparações de membranas de Euphorbia lagascae e ensaios das suas actividades de epoxigenase foram realizadas como descrito por Bafor et ai. (1993), com incubações contendo NADPH, salvo indicação em contrário na Tabela 4. A extracção de lipidos, separação e metilação assim como as separações por GLC e rádio-GLC foram realizadas essencialmente como descrito por Kohn et ai. (1994) e Bafor et ai. (1993).
As preparações de membranas de Crepis alpina e Crepis palaestina foram obtidas como se segue. As plantas de Crepis alpina e Crepis palaestina foram cultivadas em estufas e as sementes foram recolhidas na fase intermédia de desenvolvimento (17-20 dias após floração) . Os cotilédones foram removidos dos seus revestimentos de semente por aperto e homogeneizados com almofariz e pilão em tampão fosfato a 0,1 M, pH 7,2 contendo sacarose a 0,33 M, NADH a 4 mM, CoASH a 2 mM, 1 mg de albumina de soro bovino/mL e 4000 unidades de catalase/mL. O homogenato foi centrifugado durante 10 minutos a 18000 x g e o sobrenadante resultante centrifugado durante 60 minutos a 150000 x g para obter um precipitado microssomal.
Os ensaios padrão de dessaturase, acetilenase e epoxigenase com membranas microssomais das espécies Crepis foram realizados a 25 °C com preparações microssomais equivalentes a 0,2 mg de proteina microssomal, ressuspensas em tampão de homogeneização fresco e 10 mmol quer de [ 1—14C] 18 :1-CoA ou [ 1—14C] 18 : 2-CoA 67 (actividade específica de 85000 d.p.m./nmol) num volume total de 360 pL. Quando foi utilizado NADPH como co-redutor, as membranas foram ressuspensas em tampão de homogeneização, em que NADH foi substituído por NADPH. A caracterização bioquímica da linoleato A12-epoxigenase microssomal derivada de Euphorbia lagascae e Crepis palaestina foi realizada e os dados obtidos foram comparados com as características bioquímicas das enzimas oleato A12-dessaturase e linoleato A12-acetilenase derivadas de preparações microssomais de Crepis alpina (Tabela 4).
Como mostrado na Tabela 4, a linoleato A12-epoxigenase de Crepis palaestina apresenta características bioquímicas semelhantes às da linoleato A12-acetilenase e oleato A12-dessaturase de Crepis alpina, no que diz respeito às três enzimas requererem 02, trabalharem igualmente bem, quer com NADH ou NADPH como co-redutores, e serem inibidas por cianeto mas não por monóxido de carbono. Adicionalmente, nenhumas destas enzimas são inibidas por anticorpos monoclonais contra a citocromo P450 redutase.
Os dados na Tabela 4 sugerem que a linoleato A12-epoxigenase de Crepis palaestina pertence à mesma classe enzimática que a oleato A12-dessaturase e linoleato A12-acetilenase microssomal de Crepis alpina.
Em contraste, a linoleato A12-epoxigenase de Euphorbia lagascae requer NADPH como co-redutor, não é inibida por cianeto, mas é inibida por monóxido de carbono (Tabela 4). Adicionalmente, os requerentes descobriram que a linoleato Al2-epoxigenase de Euphorbia lagascae é inibida por anticorpos monoclonais produzidos contra uma enzima citocromo P450 68 redutase. Estes dados sugerem que a linoleato A12-epoxigenase de Euphorbia lagascae pertence à classe proteica do citocromo P450 e não está, deste modo, relacionada bioquimicamente com a linoleato A12-epoxigenase de Crepis palaestina. TABELA 4
Comparação das caracteristicas bioquímicas das epoxigenases, acetilenases e dessaturases derivadas de Crepis spp. e Euphorbia lagascae Tratamento Actividade enzimática (% do controlo) Oleato A12- linoleato linoleato linoleato dessaturase A12- A12- Δ12- de C. acetilenase epoxigenase epoxigenase alpina de C. de C. de E. alpina palaestina lagascae monóxido de carbono 85 84 88 3 (continuação)
Comparação das caracteristicas bioquímicas das epoxigenases, acetilenases e dessaturases derivadas de Crepis spp. e Euphorbia lagascae
Tratamento
Actividade enzimática (% do controlo)
Oleato A12- linoleato linoleato linoleato dessaturase A12- A12- Δ12- de C. acetilenase epoxigenase epoxigenase alpina de C. de C. de E. alpina palaestina lagascae 69 anticorpos Anti-P450 redutase (CsA5) 96 91 94 33 KCN 16 0 35 92 menos NADH 100 mais NADPH 95 73 94 (controlo) menos NADPH 100 100 100 mais NADH (controlo) (controlo) (controlo) 11 EXEMPLO 3
Estratégia para clonagem de genes de epoxigenase de Crepis palaestina A clonagem dos genes de epoxigenase de Crepis palaestina baseou-se nas características das enzimas de C. palaestina e C. alpina descritas no Exemplos precedentes.
Em particular, foi isolado ARN poli (A)+ a partir de sementes em desenvolvimento de Crepis palaestina utilizando um kit de purificação de ARNm QuickPrep Micro (Pharmacia
Biotechnology) e utilizado para sintetizar um ADNc de dupla cadeia iniciado com oligossacárido d(T). 0 ADNc de cadeia dupla foi ligado a adaptadores EcoRI/Notl (Pharmacia Biotechnology) e foi construída uma biblioteca de ADNc utilizando o kit de clonagem ZAP-cDNA Gigapack (Stratagene).
Foi preparado ADNc de cadeia simples a partir de ARN derivado de sementes em desenvolvimento de Crepis alpina, utilizando processos convencionais. Um fragmento de PCR, designado como D12V (SEQ ID N°: 7), foi obtido por amplificação 70 do ADNc de cadeia simples utilizando iniciadores derivados a partir das sequências de aminoácidos deduzidas de monooxigenases de função mista vegetais. 0 fragmento D12V foi subsequentemente marcado aleatoriamente e utilizado para rastrear a biblioteca de ADNc de Crepis palaestina supra em filtros membranares Hybond N+ da Amersham, como prescrito pelo fabricante utilizando condições de hibridação padrão. Esta abordagem resultou na purificação de um bacteriófago recombinante, designado Cpal2. A sequência de nucleótidos do ADNc Cpal2 foi determinada e é apresentada em SEQ ID N°: 1. 0 ADNc Cpal2 pareceu ser de tamanho total. É apresentada na Figura 1 uma representação esquemática de um vector de expressão compreendendo o ADNc Cpal2. A construção genética ai apresentada é concebida para introdução em material vegetal, para a produção de uma planta transgénica que expresse a epoxigenase em causa. Os especialistas na técnica reconhecerão que podem ser produzidos vectores de expressão semelhantes, sem experimentação supérflua, e utilizados para a produção de plantas transgénicas que expressam quaisquer das sequências genéticas da presente invenção, por substituição do ADNc Cpal2 com outra sequência de gene estrutural.
Como mostrado na Figura 2, a sequência de nucleótidos do ADNc Crepl codificava um polipéptido que foi infimamente relacionado ao nivel de aminoácidos, pelo menos, com uma enzima acetilenase de C. alpina (Bafor et al. 1997/ Pedido de Patente
Internacional N° PCT/SE97/00247). A inserção de 1,4 kb de pCpal2 foi sequenciada (SEQ ID N° 1) e mostrada compreender um grelha de leitura aberta que codifica 71 um polipéptido de 374 aminoácidos em comprimento. A sequência de aminoácidos deduzida de Cpal2 mostrou 81% de identidade e 92% de similaridade com a A12-acetilenase de Crepis alpina e aproximadamente 60% de identidade e 80% de similaridade com proteínas A12-dessaturases microssomais vegetais (Figura 2). Contudo, o polipéptido codificado por Cpal2 compreendia diferenças significativas na sequência de aminoácidos comparativamente com enzimas não epoxigenases. Em particular, o Cpal2 tem uma delecção de seis aminoácidos contíguos na região terminal 5' comparativamente a todas as Δ12 dessaturases microssomais, e uma delecção de dois aminoácidos contíguos na região terminal 3' comparativamente à Δ12 acetilenase de Crepl (Figura 2) .
Embora os genes da dessaturase de ácidos gordos ligada à membrana mostre homologias de sequência limitadas, todos contêm três regiões de motivos ricos em histidina conservados, como se segue: (i) His-(Xaa) 3-4-His; (ii) His-(Xaa) 2-3-His-His; e (iii) His-(Xaa) 2-3-His-His, em que His designa histidina, Xaa designa qualquer resíduo de aminoácido de ocorrência natural como aqui apresentado na Tabela 1, a entidade completa (Xaa)3_4 refere-se a uma sequência de aminoácidos compreendendo três ou quatro repetições de Xaa, e a entidade completa (Xaa)2-3 refere-se a uma sequência de aminoácidos compreendendo dois ou três repetições de Xaa. É sugerido que estas regiões ricas em histidina sejam uma parte do centro activo da enzima (Shanklin et al., 1994). A sequência de aminoácidos codificada pelo ADNc Cpal2 compreende três motivos ricos em histidina semelhantes, mas não 72 idênticos, aos motivos ricos em histidina das enzimas Al2-dessaturases. Estes dados sugerem que o ADNc Cpal2 codifica uma enzima que pertence à classe de monooxigenase de função mista das enzimas. A análise dos ácidos gordos apresentados no Exemplo 1 supra indicava que o ácido vernólico estava, pelo menos, presente nas sementes de Crepis palaestina. Esta enzima pode de facto estar presente exclusivamente nas sementes de C. palaestina. A expressão do gene Cpal2 foi examinada utilizando a região 3' não traduzida do clone de ADNc Cpal2 como uma sonda de hibridação em transferências de Northern de ARNm derivado de sementes em desenvolvimento e folhas de C. palaestina. Como mostrado na Figura 3, o gene Cpal2 foi altamente expresso em sementes em desenvolvimento mas não foi detectada nenhuma expressão em folhas. Estes dados são consistentes com o perfil de actividade enzimática da linoleato A12-epoxigenase de C. palaestina nestes tecidos. EXEMPLO 4
Estratégia para clonagem de genes de epoxigenase de Euphorbia lagascae A clonagem dos genes de epoxigenase de Euphorbia lagascae baseou-se nas caracteristicas das enzimas de E. lagascae como descritas no Exemplos precedentes.
Numa abordagem realizada para clonar os genes de epoxigenase de Euphorbia lagascae, foi recolhido ARN a partir de embriões imaturos de Euphorbia lagascae obtidos numa fase de síntese 73 activa de ácido vernólico e utilizados para construir uma biblioteca de ADNc. A biblioteca de ADNc foi construída no vector Lambda Zap II (Stratagene) como descrito no Exemplo precedente, com a excepção de que as inserções de ADNc foram clonadas de um modo direccional em sitios EcoRI-Xhol do vector plasmidico embutido no vector lambda. O iniciador de PCR degenerado apresentado na Figura 4 (SEQ ID N°: 18) foi sintetizado e utilizado para amplificar sequências de nucleótidos que codificam sequências de enzimas P450 a partir da biblioteca de ADNc de Euphorbia lagascae. Para as reacções de amplificação de PCR, uma fracção de 100 pL da biblioteca de ADNc foi extraida com fenol [1:1 (v/v)] e o ADN foi precipitado por adição de 2 volumes de etanol e ressuspenso finalmente em 100 pL de água. Uma fracção (1 pL) do ADN ressuspenso foi utilizada como molde na reacção de amplificação por PCR. As reacções de PCR foram realizadas em 10 pL de tampão de polimerase Taql contendo 200 pM de cada dNTP, 10 pmol do iniciador degenerado, 1 pmol do iniciador do promotor da polimerase T7 e 0,4 unidades da polimerase Taql.
As condições de amplificação foram 2 min a 94 °C, e cinco ciclos, cada ciclo compreendendo 1 min a 48 °C, seguido por 2 min a 72 °C, seguido por 30 segundos a 93 °C, depois 28 ciclos, cada ciclo compreendendo 30 segundos a 55 °C, seguido por 90 segundos a 72 °C, seguido por 30 segundos a 93 °C, e finalmente um ciclo compreendendo 30 segundos a 55 °C, seguido por 10 min a 72 °C, seguido por 1 min a 25 °C.
Os produtos de PCR foram purificados e digeridos utilizando EcoRI e Xhol, e depois sub-clonados no vector Bluescript para caracterização da sequência. Verificou-se que um dos clones de PCR codifica uma sequência de P450 e foi utilizado como uma sonda para isolar um clone de ADNc de tamanho total. Esta 74 sequência de nucleótidos é apresentada em SEQ ID N°: 19. A SEQ ID N°: 19 tinha similaridade com outros membros da família 2C de genes P450. Em particular, a SEQ ID N°: 19 mostra em média uma identidade de 40% com as sequências de epoxigenase de araquidónico de humano e rato, utilizando o programa BLAST.
Adicionalmente, foi mostrado que o transcripto de SEQ ID N°: 19 é expresso em sementes de Euphorbia lagascae mas não em raízes ou folhas (Figura 5B). O transcripto de SEQ ID N°: 19 foi detectado nas sementes em desenvolvimento de Vernonia galamensis mas não nas de E. ciparissis. ou linho, duas espécies que não produzem ácidos gordos epoxi (Figuras 5A e 5B).
Numa abordagem alternativa realizada para clonar genes de epoxigenase de Euphorbia lagascae, foi utilizada uma estratégia de hibridação subtractiva para isolar genes que são especificamente expressos num organismo que produz níveis elevados de ácidos gordos epoxi.
Em particular, o método de hibridação subtractiva descrito na Figura 6 foi utilizado para isolar genes de epoxigenase que são expressos especificamente em Euphorbia lagascae, que produz níveis elevados do ácido gordo epoxi, ácido vernólico (Exemplo 1), e não nas espécies intimamente relacionadas de Euphorbia ciparissus, que não produz ácido vernólico.
De acordo com o exposto, foi isolado ARNm a partir de embriões em desenvolvimento de Euphorbia lagascae numa fase em que sintetizam activamente ácido vernólico, e utilizados para produzir o denominado ADNc "tester". Adicionalmente, foi isolado ARNm a partir de embriões em desenvolvimento de E. ciparissis (numa fase semelhante de desenvolvimento relativamente a E. lagascae) e utilizado para produzir o denominado ADNc "dríver". 75 0 processo de hibridação subtractiva conduziu a uma biblioteca que foi enriquecida para sequências expressas exclusivamente em Euphorbia lagascae. Foram sequenciados clones desta biblioteca e, pelo menos, duas sequências foram identificadas como codificando proteínas P450 com base na similaridade com outras sequências de P450 na base de dados. Estes dois clones de PCR de P450 foram utilizados como sondas para isolar os clones de ADNc de tamanho total correspondentes a partir da biblioteca de ADNc referida anteriormente.
Um dos ADNc isolados de P450, compreendendo a sequência de nucleótidos apresentada em SEQ ID N°: 20, pareceu ser expresso em tecidos de Euphorbia lagascae (Figura 7B) e não foram detectados transcriptos homólogos em tecido de semente de E. ciparrisus ou linho, duas espécies que não produzem ácidos gordos epoxi. A sequência de aminoácidos deduzida de SEQ ID N°: 20 indica que o clone de ADNc é de tamanho total e codifica uma enzima de P450. Estes dados sugerem que o ADNc exemplificado por SEQ ID N°: 20 pode codificar uma expoxigenase, por exemplo, a linoleato A12-epoxigenase que converte ácido linoleico em ácido vernólico. EXEMPLO 5
Demonstração da actividade de epoxigenase A confirmação de que os clones de ADNc, exemplificando a invenção, codificam actividades de epoxigenase foi obtida por transformação de Arabidopsis thaliana, que não produz ácidos gordos epoxi, em particular ácido vernólico, com cada clone candidato individual e examinando o tecido transformado para a 76 presença de ácidos gordos epoxigenados que de outra forma não produziriam, ou para ácidos gordos hidroxi que podem ser formados a partir do metabolismo de um ácido gordo epoxigenado por acção de epóxido hidrolases endógenas (Blee e Schuber, 1990) . O ADNc de epoxigenase compreendendo SEQ ID N°: 1 foi clonado na construção do vector Binário apresentada na Figura 8. Resumidamente, a sequência de ADN foi sub-clonada a partir do plasmideo pCpal2 (Figura 1) no plasmideo binário, por digestão de pCpal2 com FcoRI e preenchendo extremidades do fragmento de restrição utilizando a enzima T4 DNA polimerase. O vector Binário (Figura 8) foi linearizado utilizando BamRI e também preenchendo extremidades utilizando T4 DNA polimerase. Para as reacções de preenchimento de extremidades, foi ressuspenso 1 pg de inserção de ADNc ou ADN do vector Binário linearizado em 50 pL de tampão de T4 DNA polimerase (33 mM de Tris-acetato pH 7,9, 66 mM de acetato do potássio, 10 mM de acetato de magnésio e 5 mM de DDT) suplementado com 100 mM de cada dNTP e 0,1 mg/mL de BSA e 3 unidades da T4 DNA polimerase, e incubado durante 6 min de incubação a 37 °C. A reacção foi parada por aquecimento a 75 °C durante 10 min. O ADN de extremidades rombas e o ADN do vector Binário foram ligados utilizando T4 DNA ligase e condições padrão de ligação como recomendadas pela Promega. Foram seleccionados clones em que a sequência de SEQ ID N°: 1 foi introduzida atrás do promotor napin, na orientação de sentido, permitindo assim a expressão do polipéptido de epoxigenase. O plasmideo Binário abrigando SEQ ID N°: 1, na orientação de sentido, operacionalmente sob controlo do promotor napin truncado, é representado esquematicamente na Figura 9. O plasmideo Binário apresentado na Figura 9 foi transformado na estirpe AGLI de Agrobacterium utilizando electroporação e 77 utilizado para transformar Arabidopsis thaliana. Foram obtidas plantas de A. thaliana transgénicas de acordo com o método descrito por Valvekens et al. (1988) e Dolferus et al. (1994).
As plantas transgénicas e as plantas não transformadas (i. e., de controlo) foram cultivadas até à maturidade. Uma semente madura de cada planta foi analisada para a composição em ácidos gordos através de técnicas convencionais. Foram estabelecidas plantas transformantes primárias (To) e a semente TI foi recolhida a partir de cada planta e analisada para a composição de ácidos gordos através de cromatografia gasosa. Foi mostrado que doze plantas T0 continham ácido vernólico nos seus lipidos de semente TI a concentrações variando de 0,9% a 15,8% do total de ácidos gordo, enquanto que as plantas não transformadas de controlo não continham nenhum ácido vernólico (Tabela 5) . A linha vegetal de mais alta expressão foi Cpal-17, para a qual os perfis de eluição de GLC (a partir de análise de coluna empacotada e coluna capilar) são apresentados na Figura 10. O perfil de eluição de GLC a partir de coluna empacotada para o controlo não transformado é também mostrado na Figura 10. TABELA 5
Niveis de ácido Vernólico em linhas transgénicas de A. thaliana expressando SEQ ID N°: 1 Planta T0 N° Ácido Vernólico (% em peso de ácidos gordos totais da semente) Cpal-4 1,4 Cpal-5 1,1 Cpal-8 2,7 Cpal-9 0, 9 Cpal-13 0, 9 78
Cpal-15 1,1 Cpal-17 15, 8 Cpal-21 1,3 Cpal-23 1,4 Cpal-24 1,0 Cpal-25 CM V \—1 Cpal-2 6 1,1 linha de controlo 0,0 não transformada
Alternativamente, ou adicionalmente, as sequências putativas de epoxigenase de ácidos gordos aqui descritas são cada uma transformada em Linum usitatissimum (linho) e Arabidopsis thaliana sob o controlo do promotor napin específico de semente. As plantas transgénicas de linho e Arabidopsis thaliana são examinadas para a presença de ácidos gordos epoxi em óleos de semente em desenvolvimento. Trabalho precedente mostrou que se se fornecer ácidos gordos epoxi a embriões de linho em desenvolvimento, estes são incorporados em triglicéridos (Exemplo 10) .
Alternativamente, são também transformadas leveduras com os clones de epoxigenase da invenção e ensaiadas para a produção de ácidos gordos epoxi. EXEMPLO 6
Confirmação por espectroscopia de massa de ácidos gordos epoxi em semente Ti de Arabidopsis nascida em plantas transgénicas primárias T0 79 A cromatografia gasosa de ésteres metilicos preparados a partir de lipidos de semente, da semente TI de plantas de Arabidopsis thaliana transformadas com Cpal2 (Exemplo 5) revelou a presença de dois ácidos gordos adicionais comparativamente aos controlos não transformados. 0 primeiro destes compostos tinha um tempo de retenção equivalente àquele de um padrão de ácido vernólico. 0 segundo composto tinha um tempo de uma retenção mais longo e foi putativamente identificado como ácido 12,13-epoxi-9,15-octadecadienóico, um derivado esperado do ácido vernólico, resultando da dessaturação na posição A 15 pela A15-dessaturase de Arabidopsis thaliana endógena. A confirmação da identidade exacta dos dois picos foi obtida através de espectroscopia de massa de dióis que foram preparados a partir da fracção de ácido gordo epoxi derivada a partir de plantas transformadas com Cpal2. Os dióis foram adicionalmente convertidos em éteres trimetilsilílicos e analisados por GC-MS DB23 numa coluna capilar de silica fundida (Hewlett-packard 5890 II GC acoplado a um Hewlett Packard 5989A MS trabalhando em impacto electrónico a 70eV15). O cromatograma iónico total mostrou dois picos como se seguem: (i) O primeiro pico de eluição tinha iões proeminentes de massa 73, 172, 275 e 299, indicando que o grupo epoxi foi posicionado a C-12 de um ácido gordo C18 e que uma ligação dupla ocorreu entre o grupo epoxi e o terminal carboxilo. Este espectro de massa foi idêntico ao espectro de um derivado de éter trimetilsililico de dióis preparados a partir de ácido vernólico puro (ácido 12,13-epoxi-9-octadecenóico); e (ii) O segundo pico de eluição tinha iões proeminentes de massa 73, 171, 273 e 299, indicando a presença de duas ligações duplas e de um grupo epoxi posicionado a C-12 de um 80 ácido gordo C18, consistente com o espectro de massa para o ácido 12,13-epoxi-9,15-octadecadienóico . EXEMPLO 7
Análise de ácidos gordos de plantas de Arabidopsis transgénicas Cpal2 A semente Tl derivada a partir de plantas de Arabidopsis thaliana transformadas que expressam o clone de ADNc Cpal2 sob controlo do promotor napin foi germinada e foram estabelecidas plantas Tl a partir de cinco linhas T0 (Nos 4, 8, 13, 17 & 21 na Tabela 5). A semente T2 foi recolhida a partir de cada planta Tl e analisada para a composição de ácidos gordos. A progenia dos transf ormantes Nos 4, 8, 13 e 21 (Tabela 5) segregados como esperado para a presença de ácido vernólico, com aquelas plantas contendo ácido vernólico variando até 3,1% (Tabela 6).
Todas as plantas Tl que continham ácido vernólico (i. e., 18:1 epoxi na Tabela 6) também continham ácido 12,13-epoxi-9,15-octadecadienóico (i. e., 18:2 epoxi na Tabela 6; ver também
Figura 11), indicando que algum do ácido vernólico sintetizado pela epoxigenase Cpal2 foi subsequentemente dessaturado pela A15-dessaturase endógena. TABELA 6
Composição de ácidos gordos de sementes puras nascidas em plantas Ti derivadas de cinco transformantes Cpal2 primários de Arabidopsis thaliana
Plant
Acido gordo 81 Ácidos Ácidos gordos não epoxi gordos epoxi 16 .0 18:0 18:1 18:2 18:3 20:0 20:1 22:0 22:1 18:1 18:2 4-1 8, 3 3,9 15,5 23,9 20,6 2,8 16,5 1,7 1,6 — — 4-2 7, 6 4,1 20,3 17,8 18,0 3,4 19,7 1,8 2,0 0,82 0, 63 4-3 8 , 4 4,3 26, 0 13,5 16,1 2,8 19, 0 1,8 1,6 2,03 0,72 4-4 7, 6 4,0 25,2 14,3 16, 0 2,8 19, 8 2,1 1,7 1, 99 0, 92 4-5 7, 2 3,6 15,6 23,1 19,9 3,1 19,7 1,6 2,1 - - 4-6 7, 0 3,7 19,2 17,8 18,4 3,2 20,3 1,9 2,1 0,87 0,33 4-8 7, 4 3,9 16, 0 23,6 20,1 3,1 18,7 1,6 1,8 — — 4-9 7, 6 4,0 24,8 13,4 15,9 2,8 20,4 2,3 1,8 2,30 1,07 4-10 7, 6 4,2 24,0 13,5 16,2 3,1 20,4 1,9 1,8 1, 97 0,83 4-11 7, 4 3,9 15,0 23,2 20,4 3,3 18,8 1,7 2,0 — — 4-12 8, 7 4,0 20,7 17,0 17,5 2,6 17,2 1,7 1,5 1,38 0,74 4-13 7, 2 4,1 21,9 16,4 17, 7 3,2 21,0 1,7 1,9 1, 14 0,45 8-1 8, 1 3,9 26, 1 15,0 16, 0 2,6 19,5 2,0 1,6 1,79 0,82 (continuação)
Composição de ácidos gordos de sementes puras nascidas em plantas Ti derivadas de cinco transformantes Cpal2 primários de Arabidopsis thaliana
Plant Ácido gordo a N° Ácidos Ácidos gordos não epoxi gordos epoxi 16.0 18:0 18:1 18:2 18:3 20:0 20:1 22:0 22:1 18:1 18:2 8-3 8,7 4,2 31,6 11,5 14,0 2,2 18,5 1,9 1,4 2,38 1,13 1 00 8,5 4,1 27,2 15,1 16,1 2,5 18,9 1,8 1,4 1,70 0,84 LO 1 00 9,1 4,2 27,7 14, 7 16,2 2,4 18,3 1,7 1,5 1,70 0,82 co 1 <y\ 9,8 4,0 26, 0 17,2 17,2 2,3 16,9 1,6 1,2 1,36 0,71 8-7 10,0 3,5 15,2 25,3 22,3 2,3 14, 4 1,7 1,7 — — 00 1 00 8,4 4,3 32,2 10,7 13,3 2,5 20,3 1,6 1,5 1,92 0,82 1 00 9,8 3,6 15,9 25,3 22,0 2,4 14,5 1,6 1,3 — — 82 8-10 7,5 3,9 24,4 15,9 15,8 2,8 20,2 2,2 1,8 1,70 0,82 8-11 7,6 3,8 15,4 23,6 19, 8 2,9 19,4 1,5 1,8 — — 8-12 9, 4 3,7 24,2 16,7 16,7 2,2 17, 6 0,9 1,2 1,46 0, 65 8-13 10,3 4,3 25,3 17, 1 17, 9 2,2 16,0 1,8 1,3 1,48 0,73 13-1 7,0 4,3 33,3 8,1 11, 1 2,7 23,1 1,7 1,6 2,42 1,26 13-2 7,2 4,3 30,4 9, 6 12,7 2,8 22,0 1,8 1,6 2,48 1,37 13-3 7,6 3,9 15,6 23,6 19,7 3,0 19,1 1,7 1,8 — — 13-4 7,7 4,0 15,2 22,5 19,3 3,1 18,0 1,6 1,7 — — 13-5 8,0 4,2 16,3 22,2 17,5 4,4 19,4 2,0 2,0 — — 13-6 7,9 4,4 25,7 14, 7 15,8 2,9 21,2 1,6 1,7 1,56 0, 63 13-7 7,9 4,0 16, 0 23,3 19,6 3,0 19,1 1,6 1,8 — — 13-9 8,0 4,0 16, 1 23,6 20,0 2,9 18,7 1,6 1,6 — — 13-10 8,7 4,2 34,6 9, 6 12,5 2,2 19,1 1,5 1,2 2,21 1,01 13-11 8,7 4,0 17, 6 24,3 18,9 2,8 17, 1 1,6 1,4 — — 13-12 8,9 4,2 26, 4 14, 6 16, 0 2,5 17,5 1,6 1,2 1,62 0,74 13-13 9, 0 4,4 27,9 14,4 15,3 2,5 18,9 1,5 1,4 1,30 0,77 (continuação)
Composição de ácidos gordos de sementes puras nascidas em plantas Ti derivadas de cinco transformantes Cpal2 primários de Arabidopsis thaliana Plant a N° Ácido gordo Ácidos gordos não epoxi Ácidos gordos epoxi 16.0 18:0 18:1 18:2 18:3 20:0 20:1 22:0 22:1 18:1 18:2 13-14 9,2 4,2 17,2 23,8 18,8 2,7 17,9 1,7 1,5 — — 13-15 8,4 4,2 19,7 20,9 18,6 2,7 17, 7 1,4 1,5 0,40 0,16 13-16 8,2 4,3 23,0 17, 1 17,3 2,8 19,3 1,5 1,5 0,97 0,42 13-17 8,3 4,1 15,7 23,9 19,9 2,8 17, 6 1,6 1,9 — — 17-1 7,6 4,1 15,8 23,7 19, 6 2,6 20,3 1,7 1,7 — — 17-2 8,3 4,1 16,4 24,4 20,1 2,3 16, 8 1,5 1,4 — — 83 17-3 8,1 4,1 16, 4 24,3 20,0 2,5 17,6 1,6 1,4 — 21-1 8,1 4,3 26, 9 14,5 15,0 2,9 19, 9 1,5 1,5 1 ,64 0, 63 21-2 8,2 4,0 27,9 11,8 13,2 2,5 19, 8 1,7 1,5 2 ,18 0, 91 21-3 8,8 3,7 16, 4 24,4 20,6 2,5 17,3 1,7 1,4 — 21-4 7,9 3,9 19, 6 19, 8 17,8 2,7 18,7 1,7 1,7 0 , 66 0,46 21-5 7,2 4,2 26,5 12,9 14,4 3,0 21,5 0,9 1,8 1 ,78 0,84 21-6 8,3 4,2 27,4 13,9 15,4 2,6 19, 9 1,7 1,5 1 , 66 0, 65 21-7 7,2 4,2 26, 8 13,5 13,4 3,0 21,9 1,7 1,8 1 ,74 0,80 21-8 7,4 3,8 16,3 23,6 19, 4 3,2 19,2 1,7 1,9 21-9 7,2 4,0 28,1 11,8 13,5 3,0 22,5 1,9 1,9 2 ,15 1,05 21-10 7,2 4,2 26, 1 13,8 14,6 3,0 22,3 1,7 1,8 1 ,64 0,82 21-11 7,1 4,2 29,2 11,5 12,7 3,0 22,5 1,8 1,8 2 ,20 1,09 21-12 7,2 4,1 26,2 13,6 14,2 3,1 22,4 1,8 1,9 1 ,71 0,80 21-13 7,1 4,3 33,7 7,1 10,0 2,7 24,1 2,0 1,8 3 , 05 1,47 21-14 7,4 3,7 16, 9 21,9 19, 6 3,1 19,2 1,8 2,0 0 ,29 vg 21-15 7,7 3,6 15,6 24,3 20,2 2,9 18,1 1,8 1,8 EXEMPLO 8
Análise de ácidos gordos de plantas de Linola transgénica Cpal2 A construção de plasmídeo binário descrita acima compreendendo o clone de ADNc Cpal2 (Figura 9) foi transformada na estirpe AGLl de Agrobacterium tumefaciens, utilizando electroporação. 0 A. tumefaciens transformado foi utilizado para infectar explantes de Linum usitatissimum var. Eyre como descrito por Lawrence et al. (1989), excepto que foi utilizado meio MS como o meio basal para a indução de raízes no material de rebento regenerado. 84
Dois transformantes de Linola primários (plantas TO) designados AP20 e AP21 foram confirmados como sendo transgénicos por PCR utilizando iniciadores dirigidos contra o gene Cpal2 e mostrando que estas plantas eram resistentes à canamicina. Dez sementes TI de cada planta foram analisadas individualmente para a composição de ácidos gordos utilizando técnicas convencionais.
Como mostrado na Tabela 7, a semente de AP20 segregada em 3 classes, compreendidas de três sementes sem ácido vernólico, duas que têm mais que 0,7% de ácido vernólico, e cinco que têm niveis intermédios (0,13-0,47%) de ácido vernólico.
Do mesmo modo, sementes de AP21 segregadas em 3 classes compreendidas de cinco sementes sem ácido vernólico, duas que têm mais que 0,25% de ácido vernólico e três que têm um nivel intermédio (0,09-0,14%) de ácido vernólico (Tabela 8).
Assim, foi obtido um total de doze sementes que continham ácido vernólico. Oito das doze sementes de AP20 e AP21 contendo ácido vernólico continham também ácido 12,13-epoxi-9,15-octadecadienóico TABELA 7
Composição de ácidos gordos de transformante primário 10 sementes Tl individuais do Cpal2 de Linola ΆΡ20 Sement e Ti Ácidos gordos não epoxi Ácidos gordos epoxi 16:0 18:0 18:1 18:2 18:3 20:0 20:1 22:0 22:1 18:1 18:2 1 6,4 3, 6 17,8 68,1 2,0 0,2 - 0,6 — — 2 6, 0 3,5 25,4 60,8 1,4 0,2 0,2 0,70 0,23 3 6, 0 3,9 20,4 64,6 2,1 0,3 0, 6 - “ — — 85 4 6,3 3,5 28,3 57,3 1,3 0,2 0,2 1,4 - 0,34 0,28 5 5,2 4,8 24,9 61,2 1,6 0,3 0,2 ο,ι - 0,37 — 6 5,8 4,1 23,3 63,1 1,9 0,2 0,2 0,2 - 0,47 - 7 5,9 4,3 21,7 64,1 2,2 0,2 0,2 0,2 - 0,13 0,12 8 5,9 3,3 22,3 65,2 2,0 0,2 0,2 ο,ι 0,2 - - 9 5,6 4,0 25,2 61,4 1,7 0,2 0,2 ο,ι - 0,84 - 10 6,2 4,4 27,4 57,9 1,7 0,2 0,2 0,2 - 0,54 — TABELA 8
Composição de ácidos gordos de transformante primário 10 sementes Tl individuais do Cpal2 de Linola AP21 Sement e Ti Ácidos gordos não epoxi Ácidos gordos epoxi 16:0 18:0 18:1 18:2 18:3 20:0 20:1 22:0 22:1 18:1 18:2 1 6,1 4,2 35,2 50,8 1,3 - - - 2,0 - - 2 5,7 5,0 32,9 53,3 1,4 0,2 0,2 0,2 0,14 0,21 3 5,9 4,0 35,1 50,8 1,3 0,2 0,2 0,1 1,5 - - 4 7,5 4,1 38,8 45,5 1,2 0,2 0,3 - 1,7 - - 5 5,8 5,0 28,8 57,3 1,3 0,2 0,2 0,1 - 0,37 0,06 6 5,8 5,0 44, 1 41, 4 1,4 0,2 0,2 0,2 - - - 7 6,5 4,5 27,9 58,6 1,3 0,2 0,1 0,1 - - - 8 6, 9 4, 6 37,6 48,1 1,2 - - - - 0,10 0,19 9 6,2 4,7 33,7 52,1 1,3 0,2 0,2 0,2 - 0,09 0,07 10 6,1 4,8 29, 7 5 6,6 1,3 0,2 0,2 0,1 - 0,25 0,04 86
Quatro plantas TI foram estabelecidas a partir de plântulas resistentes à canamicina de AP20. Todas as quatro plantas foram subsequentemente mostradas produzir ácido vernólico na sua semente T2 (Tabela 9). Os niveis de ácidos gordos epoxi 18:2 não foram analisados nestas sementes T2. TABELA 9
Composição de progenia ácidos gordos de sementes Cpa.12 Tl de Linola de ΆΡ20 T2 da Sement e T2 Ácidos gordos não epoxi Ácidos gordos epoxi 16:0 18:0 18:1 18:2 18:3 20:0 20:1 22:0 22:1 18:1 A 3,4 3,0 27,4 65,5 0, 6 na na na Na 0,06 B 3,5 3,1 30,2 62,6 0, 6 na na na na 0,07 C 3,6 2,7 33,3 59, 8 0, 6 na na na na 0,07 D 3,4 3,1 28,2 64,6 0, 6 na na na na na = não analisado EXEMPLO 9
Produção de ácidos gordos epoxi em organismos transgénicos 87 A produção de um óleo rico em ácido vernólico foi conseguida por transformação do gene de epoxigenase aqui descrito, em particular SEQ ID N°: 1, em Arabidopsis thaliana, como descrito nos Exemplos precedentes. Como mostrado na Tabela 5, a linha transgénica de A. thaliana expressando SEQ ID N°: produz niveis elevados de ácido vernólico nas suas sementes relativamente a outros ácidos gordos. Em particular, numa linha transgénica (Cpal-17), o ácido vernólico produzido é tanto quanto 15,2% (p/p) do conteúdo total de ácidos gordos da semente. A produção de um óleo rico em ácido vernólico é também conseguida por transformação do gene de epoxigenase aqui descrito, em qualquer uma de SEQ ID Nos: 1, 3, 5, 19 ou 20 e, de um modo preferido, qualquer uma de SEQ ID Nos: 1 ou 3 ou 5, em qualquer organismo acumulador de óleo que tem normalmente niveis muito elevados de ácido linoleico e actividades mínimas de outras enzimas competitivas capazes de utilizar ácido linoleico como um substrato. As sequências genéticas da invenção são colocadas operacionalmente sob o controlo de um promotor que produza nível elevado de expressão em semente oleaginosa, por exemplo, o promotor napin específico de semente.
Numa abordagem alternativa à transformação de A. thaliana, são transformados com a epoxigenase da invenção genótipos de elevado linoleico de linho, girassol, milho ou cártamo. Os níveis elevados de ácido vernólico são produzidos pelas plantas transgénicas durante a síntese de óleo de semente, quando o gene de epoxigenase é expresso em níveis elevados.
Alternativamente, o linho Linola® (=ácido linolénico baixo) é transformado com a epoxigenase da invenção. São produzidos niveis elevados de ácido vernólico pelas plantas transgénicas de linho Linola® durante a síntese de óleo de semente, quando o gene de epoxigenase é expresso em níveis elevados.
Adicionalmente, os requerentes mostraram que ácido vernólico marcado fornecido a sementes de linho em desenvolvimento não é degradado mas é incorporado em lípidos de armazenamento em todas as três posições da molécula de triglicérido (ver Exemplo 10) . Consistente com estes dados, são prontamente depositados niveis elevados de ácido vernólico sintetizado pela epoxigenase introduzida, nos triglicéridos do óleo de semente desta espécie. EXEMPLO 10
Incorporação de ácido oleico e ácido vernólico nos lipidos de cotilédones de linhaça em desenvolvimento
Os cotilédones de linhaça em desenvolvimento destacados (seis pares em cada incubação, incubação em duplicado) na fase intermédia de desenvolvimento da semente (20 dias após floração) foram incubados com 10 nmol dos sais de amónio quer de ácido [1—14C]vernólico (actividade especifica de 3000 d.p.m./nmol) ou ácido [1 — 14C]oleico (actividade especifica de 5000 d.p.m./nmol) em 0,2 mL de tampão fosfato pH 7,2 durante 30 min a 30 °C. Os cotilédones foram depois lavados três vezes com 1 mL de água destilada e imediatamente extraídos numa Ultra Turrax de acordo com Bligh e Dyer (1959) ou incubados ainda em 0,5 m. de tampão fosfato a 0,1 M pH 7,2 durante 90 ou 270 min antes da extracção. Uma fracção dos lípidos na fase de clorofórmio foi metilada e separada em placas de TLC de sílica gel em n-hexano/dietiléter/ácido acético (85:15:1). O resto dos lípidos na fase de clorofórmio de cada amostra foi aplicado em duas 89 placas separadas de TLC de sílica gel e as placas foram reveladas em clorofórmio/metanol/ácido acético/água (85:15:10:3,5 em vol) para separação de lípidos polares e em n-hexano/dietiléter/ácido acético (60:40:1,5) para separação de lípidos neutros. As áreas lipídicas com migração correspondente a padrões autênticos foram removidas e a radioactividade em cada lípido foi quantificada por contagem de cintilação líquida. A recuperação da marcação de 14C na fase de clorofórmio é descrita na Figura 12. Um tanto mais do que metade da radioactividade adicionada, tanto de ácido [14C]oleico e ácido [14C]vernólico foi incorporada pelos cotilédones e recuperada como substâncias lipofílicas após a marcação em pulso de 30 min. Esta quantidade permaneceu virtualmente inalterada durante os 270 min adicionais de incubação com ambos os substratos. A separação dos ésteres metílicos radioactivos dos lípidos mostrou que a maioria da radioactividade (92%) do ácido [14C]vernólico fornecido às experiências residiu em compostos com a mesma migração que vernoleato de metilo indicando que o grupo epoxi permaneceu intacto nos cotilédones de linhaça ao longo da incubação de 270 min.
Cerca de 28% da actividade do fornecimento de ácido [14C]vernólico que estava presente na fase de clorofórmio residiu na fosfatidilcolina após 30 min e a radioactividade diminuiu para apenas 5% em 300 min de incubação (Figura 13).
Cerca de 22% da actividade do fornecimento de ácido [14C]oleico que estava presente na fase de clorofórmio residiu na fosfatidilcolina após 30 min e a radioactividade diminuiu para cerca de 11% em 300 min de incubação (Figura 13).
Cerca de 32% da actividade do fornecimento de ácido [14C]vernólico que estava presente na fase de clorofórmio residiu 90 em triacilgliceróis após 30 min e a radioactividade aumentou para mais de 60% em 300 min de incubação (Figura 14) . Os diacilgliceróis continham cerca de 24% da actividade nas experiências de fornecimento de ácido [14C]vernólico e esta guantidade permaneceu praticamente constante durante os períodos de incubação.
Cerca de 5% da actividade do fornecimento de ácido [14C]oleico gue estava presente na fase de clorofórmio residiu em triacilgliceróis após 30 min e a radioactividade aumentou para 18% em 300 min de incubação (Figura 14) . Os diacilgliceróis continham cerca de 19% da actividade após 30 min nas experiências de fornecimento de ácido [14C]oleico e esta quantidade permaneceu praticamente constante durante os períodos de incubação. A experiência acima mostra que os cotilédones de linhaça não metabolizam o grupo epoxi do ácido vernólico, em grande extensão. Adicionalmente, mostra que os cotilédones de linhaça possuem mecanismos para remover eficientemente ácido vernólico a partir de lípidos de membrana e incorpora-los em triacilgliceróis. EXEMPLO 11
Clonagem de genes de A12-epoxigenase a partir de outras espécies contendo ácido epoxi
Os homólogos do gene de Al2-epoxigenase Cpal2 são obtidos a partir de outras espécies que são ricas em ácidos gordos epoxi, por clonagem dos membros da família génica de monooxigenases de função mista A12 que são altamente expressas em sementes em desenvolvimento e comparando a sua sequência de aminoácidos com 91 àquelas de sequências conhecidas de A12-dessaturase e A12-epoxigenase. Esses genes são clonados quer por rastreio de bibliotecas de ADNc de sementes em desenvolvimento com sondas genética baseadas quer no gene Cpal2 (SEQ ID N°: 1) ou no fragmento D12V (SEQ ID N°: 7), ou por amplificação de fragmentos de PCR utilizando iniciadores concebidos contra sequências conservadas das monooxigenases de função mista A12 vegetais, como aqui descrito. As sequências putativas de A12-epoxigenase mostram uma identidade de sequência global superior para com as sequências de A12-epoxigenase aqui divulgadas, do que para as sequências conhecidas de A12-dessaturase.
Num exemplo desta abordagem, foi obtida uma sequência de tipo A12-epoxigenase de tamanho total a partir de uma Crepis sp. não identificada contendo niveis elevados de ácido vernólico nos seus óleos de semente e conhecida por não ser Crepis palaestina. Foi isolado ARN poli(A)+ a partir de sementes em desenvolvimento desta Crepis sp. utilizando um kit de purificação de ARNm QuickPrep Micro (Pharmacia Biotechnology) e utilizado para sintetizar um ADNc de cadeia dupla iniciado com oligosacárido d(T) . O ADNc de cadeia dupla assim obtido foi depois ligado a adaptadores EcoRl/Notl (Pharmacia Biotechnology) e foi construída uma biblioteca de ADNc utilizando o kit de clonagem ZAP-cDNA Gigapack (Stratagene). A biblioteca de ADNc em filtros membranares Hybond N+ (Amersham) foi rastreada com o fragmento D12V marcado aleatoriamente (SEQ ID N°: 7) derivado de Crepis alpina como prescrito pelo fabricante, utilizando condições de hibridação padrão. Isto resultou na purificação de um bacteriófago recombinante designado CrepX. A sequência de nucleótidos do ADNc de CrepX foi determinada e é apresentada em SEQ ID N°: 3. A sequência de aminoácidos deduzida de CrepX (SEQ ID N°: 4) compreende uma proteína de 374 92 aminoácidos que tem 97% de identidade com a sequência de A12-epoxigenase Cpal2, mas apenas 57% de identidade com a sequência de Δ12-dessaturase de Arabidopsis thaliana L26296. Isto demonstra claramente a presença de um gene noutra Crepis sp. que tem um conteúdo elevado de ácido vernólico, cujo gene é altamente homólogo com o gene de A12-epoxigenase Cpal2 e não é claramente um gene de dessaturase.
Num segundo exemplo desta abordagem, uma sequência de tipo A12-epoxigenase parcial foi obtida a partir da espécie contendo ácido vernólico Vernonia galamensis. Foram preparados moldes de ADNc de primeira cadeia a partir de ARN total isolado de sementes em desenvolvimento de V. galamensis, utilizando processos convencionais.
Um fragmento de PCR (550 nucleótidos em comprimento), designado como Vgall, foi obtido por amplificação do ADNc de cadeia simples utilizando iniciadores derivados a partir da sequência de aminoácidos deduzida de monooxigenases de função mista vegetais. A sequência de nucleótidos do ADN amplificado foi determinada utilizando processos convencionais e é apresentada em SEQ ID N°: 5. O alinhamento da sequência de aminoácidos deduzida do fragmento de PCR Vgall (SEQ ID N°: 6) com a sequência total de
A12-epoxigenase Cpal2 e a A12-dessaturase de Arabidopsis thaliana L26296 (Figura 2) demonstra que a sequência Vgall amplificada codifica uma sequência de aminoácidos que corresponda à região que cobre os residuos de aminoácidos 103-285 do polipéptido Cpal2. Dentro desta região, a sequência de Vgall mostrou uma maior identidade de aminoácidos com a sequência de Al2-epoxigenase Cpal2 (67%) do que com a sequência de A12-dessaturase de A. thaliana (60%), sugerindo que o ADN 93 amplificado corresponde a uma sequência de epoxigenase em vez de dessaturase.
Os especialistas na técnica estarão cientes que a presente invenção é submetida a variações e modificações diferentes daquelas aqui especificamente descritas. É para ser compreendido que a invenção inclui todas essas variações e modificações. A invenção também inclui todos esses passos, características, composições e compostos referidos ou indicados nesta descrição, individualmente ou colectivamente, e qualquer uma e todas as combinações de quaisquer dois ou mais dos referidos passos ou caracteristicas.
REFERÊNCIAS 1. An et al. (1985) EMBO J. 4:277-284. 2. Ausubel, F. M., Brent, R., Kingston, RE, Moore, D.D., Seidman, J.G., Smith, J.A., e Struhl, K. (1987). Em: Current Protocols in Molecular Biology. Wiley Interscience (ISBN 047150338). 3. Badami, R.C., e Patil, K.B. (1981) Progress in Lipid Research, 19, 119-53. 4. Bafor, M., Smith, M.A., Jonsson, L., Stobart, K. e
Stymne, S. (1993) Arch. Biochem. Biophys. 303, 145-151. 5. Bafor, M., Banas, A., Wiberg, E., Lenman, M., Stahl, U. e
Stymne, S. (1997) Em: Williams, J.P., Mobasher, K.U., Lem, N.W. (eds) Physiology, biochemistry and molecular biology of plant lipids. Kluwer Academic Publisher, Dordrecht. Em impressão. 6. Blee and Schuber (1990) J. Biol. Chem. 265, 12887-12894. 94 7. Blee, E., Wilcox, A.L., Marnett, J.M., Schuber, F. (1993) J. Biol. Chem. 268, 1798-1715. 8. Blee, E., Stahl, S., Schuber, F. e Stymne, S. (1994) Biochem. Biophys. Res. Comm. 197, 778-784 9. Bligh, E.G. e Dyer, W.J. (1959) Can. J. Biochem. Physiol. 230, 379-288. 10. Bozak, K.R., Yu, H., Sirevag, R. e Christoffersen, R.E. (1990) Proc. Natl. Acad. Sei. USA 87, 3904-3908. 11. Christou, P., McCabe, D.E., Swain, W.F. (1988). Plant Physiol 87, 671-674. 12. Crossway et al. (1986) Mol. Gen. Genet. 202,179-185. 13. Devereux, J., Haeberli, P. e Smithies, O. (1984) . Nucl. Acids Res. 12, 387-395. 14. Dolferus et al. Plant Physiol. (1994) 105, 1075-1087. 15. Engeseth, N. & Stymne, S. (1996) Planta 198, 238-245 16. Fromm et al. (1985) Proc. Natl. Acad Sei. (USA) 82, 5824-5828. 17. Haseloff, J. e Gerlach, W.L. (1988). Nature 334, 586-594. 18. Herrera-Estrella et al. (1983a) Nature 303, 209-213. 19. Herrera-Estrella et al. (1983b) EMBO J. 2, 987-995. 95 20. Herrera-Estrella et al. (1985) Em: Plant Genetic
Engineering, Cambridge University Press, NY, pp 63-93. 21. Kohn, G., Hartmann, E., Stymne, S. & Beutelmann, P. (1994) J. Plant Physiol. 144, 265-271 22. Krens, F.A., Molendijk, L., Wullems, G.J. e
Schilperoort, R.A. (1982). Nature 296, 72-74. 23. Lawrence, G.J., Ellis, J.G., Finnegan, E.J., Dennis, E.S. e Peacock, W. J. (1989) em: Breeding Research: The Key to Survival of the Earth (Iyama, S. e Takeda, G. eds) 6th International Congress of SABRAO. pp 535-538. 24. Lazo, G.R., Stein, P.A. e Ludwig, R.A. (1991).
Bio/technology 9, 963-967. 25. Needleman e Wunsch (1970) J. Mol. Biol. 48, 443-453. 26. Pazkowski et al. (1984) EMBO J. 3, 2717-2722. 27. Pietrzak, M., Shillito, R.D., Hohn, T. e Potrykus, I. (1986). Nucl. Acids Res. 14,5857-5868. 28. Sanger, F., Nicklin, S. e Coulson, A.R. (1977).Proc. Natl. Acad. Sei. (USA) 72, 5463-5467. 29. Shanklin, J., Whittle, E. e Fox, B.G. (1994) Biochemistry 33, 12787-12794. 30. Valvekens et al. (1988) Proc. Natl Acad. Sei. (USA) 85, 5536-5540. 96 LISTAGEM DE SEQUÊNCIAS (1) INFORMAÇÃO GERAL: (i) REQUERENTE: Commonwealth Scientific and Industrial Research Organisation AND Sten Stymne
(ii) TÍTULO DA INVENÇÃO: GENES DE EPOXIGENASE DE ÁCIDO GORDO VEGETAL E SUAS UTILIZAÇÕES (iii) NUMERO DE SEQUÊNCIAS: 20 (iv) ENDEREÇO DE CORRESPONDÊNCIA:
(A) DESTINATÁRIO: DAVIES COLISON CAVEARN
(B) RUA: 1 LITTLE COLINS STREET
(C) CIDADE: MELBOURNE
(D) ESTADO: VICTORIA
(E) PAÍS: AUSTRÁLIA (F) CÓDIGO POSTAL: 3000 (v) FORMA DE LEITURA POR COMPUTADOR: (A) TIPO DE MEIO: Disquete (B) COMPUTADOR: IBM PC compatível 97
(C) SISTEMA OPERATIVO: PC-DOS/MS-DOS (D) SOFTWARE: Patent In Release #1.0, Versão #1.25 (vi) DADOS DO PRESENTE PEDIDO: (A) NÚMERO DO PEDIDO: (B) DATA DE PEDIDO: (vii) DADOS DE PEDIDOS ANTERIORES: (A) NÚMERO DO PEDIDO: AU P06223 (B) DATA DE PEDIDO: 15-ABR-1997 (vii) DADOS DE PEDIDOS ANTERIORES: (A) NÚMERO DO PEDIDO: AU P06226 (B) DATA DE PEDIDO: 15-ABR-1997 (vii) DADOS DE PEDIDOS ANTERIORES: (A) NÚMERO DO PEDIDO: US 60/043706 (B) DATA DE PEDIDO: 16-ABR-1997 (vii) DADOS DE PEDIDOS ANTERIORES: (A) NÚMERO DO PEDIDO: US 60/050403 (B) DATA DE PEDIDO: 20-JUN-1997 (viii) INFORMAÇÃO DO MANDATÁRIO/AGENTE:
(A) NOME: HUGHES, DR. E JOHN L
(C) REFERÊNCIA/NÚMERO DE REGISTO: MRO/EJH/JMC 98 (ix) INFORMAÇÃO DE TELECOMUNICAÇÕES: (A) TELEFONE: +61 3 9254 2777 (B) TELEFAX: +61 3 9254 2770 (C) TELEX: AA 31787 (2) INFORMAÇÃO PARA SEQ ID N°: 1: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 1358 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: simples (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: ADN (ix) CARACTERÍSTICA:
(A) NOME/CHAVE: CDS (B) LOCALIZAÇÃO: 30..1151 (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID N°: 1 99 53
GAGAAGTTGA CCATAAATCA TTTATCAAC ATG GGT GCC GGC GGT CGT GGT CGG Met Gly Ala Gly Gly Arg Gly Arg 1 5 ACA TCG GAA AAA TCG GTC ATG GAA CGT GTC TCA GTT GAT CCA GTA ACC Thr Ser Glu Lys Ser Vai Met Glu Arg Vai Ser Vai Asp Pro Vai Thr 10 15 20 TTC TCA CTG AGT GAA TTG AAG CAA GCA ATC CCT CCC CAT TGC TTC CAG 100
Phe Ser Leu Ser Glu Leu Lys Gin Ala Ile Pro Pro His Cys Phe Gin 25 30 35 40 AGA TCT GTA ATC CGC TCA TCT TAC TAT GTT GTT CAA GAT CTC ATT ATT 197 Arg Ser Vai Ile Arg Ser Ser Tyr Tyr Vai Vai Gin Asp Leu Ile Ile 45 50 55 GCC TAC ATC TTC TAC TTC CTT GCC AAC ACA TAT ATC CCT ACT CTT CCT 245 Ala Tyr Ile Phe Tyr Phe Leu Ala Asn Thr Tyr ile Pro Thr Leu Pro 60 65 70 ACT AGT CTA GCC TAC TTA GCT TGG CCC GTT TAC TGG TTC TGT CAA GCT 293 Thr Ser Leu Ala Tyr Leu Ala Trp Pro Vai Tyr Trp Phe Cys Gin Ala 75 80 85 AGC GTC CTC ACT GGC TTA TGG ATC CTC GGC CAC GAA TGT GGT CAC CAT 341 Ser Vai Leu Thr Gly Leu Trp Ile Leu Gly His Glu Cys Gly His His 90 * 95 100 GCC TTT AGC AAC TAC ACA TGG TTT GAC GAC ACT GTG GGC TTC ATC CTC 389 Ala Phe Ser Asn Tyr Thr Trp Phe Asp Asp Thr Vai Gly Phe Ile Leu ‘105 110 115 120 CAC TCA TTT CTC CTC ACC CCG TAT TTC TCT TGG AAA TTC AGT CAC CGG 437 His Ser Phe Leu Leu Thr Pro Tyr Phe Ser Trp Lys Phe Ser His Arg 125 130 135 AAT CAC CAT TCC AAC ACA AGT TCG ATT GAT AAC GAT GAA GTT TAC ATT 485 Asn His His Ser Asn Thr Ser Ser lie Asp Asn Asp Glu Vai Tyr Ile 140 145 150 CCG AAA AGC AAG TCC AAA CTC GCG CGT ATC TAT AAA CTT CTT AAC AAC 533 Pro Lys Ser Lys Ser Lys Leu Ala Arg Ile Tyr Lys Leu Leu Asn Asn 155 160 165 CCA CCT GGT CGG CTG TTG GTT TTG ATT ATC ATG TTC ACC CTA GGA TTT 581 Pro Pro Gly Arg Leu Leu Vai Leu Ile Ile Met Phe Thr Leu Gly Phe 170 175 180 CCT TTA TAC CTC TTG ACA AAT ATT TCC GGC AAG AAA TAC GAC AGG TTT 629 101
Pro Leu Tyr Leu Leu Thr Asn Ile Ser Gly Lys Lys 185 190 195
Tyr Asp Arg Phe 200 GCC AAC CAC TTC GAC CCC ATG AGT CCA ATT TTC AAA GAA CGT GAG CGG 677 Ala Asn His Phe Asp Pro Met Ser Pro Ile Phe Lys Glu Arg Glu Arg 205 210 215 TTT CAG GTC TTC CTT TCG GAT CTT GGT CTT CTT GCC GTG TTT TAT GGA 725 Phe Gin Vai Phe Leu Ser Asp Leu Gly Leu Leu Ala Vai Phe Tyr Gly 220 225 230 ATT AAA GTT GCT GTA GCA AAT AAA GGA GCT GCT TGG GTA GCG TGC ATG 773 Ile Lys Vai Ala Vai Ala Asn Lys Gly Ala Ala Trp Vai Ala Cys Met 235 240 245 TAT GGA GTT CCG GTA TTA GGC GTA TTT ACC TTT TTC GAT GTG ATC ACC 821 Tyr Gly Vai Pro Vai Leu Gly Vai Phe Thr Phe Phe Asp Vai Ile Thr 250 255 260 TTC TTG CAC CAC ACC CAT CAG TCG TCG CCT CAT TAT GAT TCA ACT GAA 869 Phe Leu His His Thr His Gin Ser Ser Pro His Tyr Asp Ser Thr Glu 265 270 275 280 TGG AAC TGG ATC AGA GGG GCC TTG TCA GCA ATC GAT AGG GAC TTT GGA 917 Trp Asn Trp Ile Arg Gly Ala Leu Ser Ala Ile Asp Arg Asp Phe Gly 285 290 295 TTC CTG AAT AGT GTT TTC CAT GAT GTT ACA CAC ACT CAT GTC ATG CAT 965 Phe Leu Asn Ser Vai Phe His Asp Vai Thr His Thr His Vai Met His 300 305 310 CAT TTG TTT TCA TAC ATT CCA CAC TAT CAT GCA AAG GAG GCA AGG GAT 1013 His Leu Phe Ser Tyr Ile Pro His Tyr His Ala Lys Glu Ala Arg Asp 315 320 325 GCA ATC AAG CCA ATC TTG GGC GAC TTT TAT ATG ATC GAC AGG ACT CCA 1061 Ala Ile Lys Pro Ile Leu Gly Asp Phe Tyr Met Ile Asp Arg Thr Pro 330 335 340 ATT TTA AAA GCA ATG TGG AGA GAG GGC AGG GAG TGC ATG TAC ATC GAG 1109 102 1151
Ile Leu Lys Ala Met Trp Arg Glu Gly Arg Glu Cys Met Tyr Ile Glu 345 350 355 360
CCT GAT AGC AAG CTC AAA GGT GTT TAT TGG TAT CAT AAA TTG
Pro Asp Ser Lys Leu Lys Gly Vai Tyr Trp Tyr His Lys Leu 365 370 1211 1271 1331 1358
TGATCATATG CAAAATGCAC ATGCATTTTC AAACCCTCTA GTTACGTTTG TTCTATGTAT AATAAACCGC CGGTCCTTTG GTTGACTATG CCTAAGCCAG GCGAAACAGT TAAATAATAT CGGTATGATG TGTAATGAAA GTATGTGGTT GTCTGGTTTT GTTGCTATGA AAGAAAGTAT GTGGTTGTCG GTCAAAAAAA AAAAAAA (2) INFORMAÇÃO PARA SEQ ID N°: 2: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 374 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: proteína (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID N°: 2:
Met Gly Ala Gly Gly Arg Gly Arg Thr Ser Glu Lys Ser Vai Met Glu 15 10 15
Arg Val Ser Vai Asp Pro Vai Thr Phe Ser Leu Ser Glu Leu Lys Gin 20 25 30
Ala Ile Pro Pro His Cys Phe Gin Arg Ser Val Ile Arg Ser Ser Tyr 35 40 45
Tyr Val Val Gin Asp Leu Ile Ile Ala Tyr Ile Phe Tyr Phe Leu Ala 50 55 60 103
Asn Thr Tyr Ile Pro Thr Leu Pro Thr Ser Leu Ala Tyr Leu Ala Trp 65 70 75 80
Pro Vai Tyr Trp Phe Cys Gin Ala Ser Vai Leu Thr Gly Leu Trp Ile 85 90 95
Leu Gly His Glu Cys Gly His His Ala Phe Ser Asn Tyr Thr Trp Phe 100 105 110
Asp Asp Thr Vai Gly Phe Ile Leu His Ser Phe Leu Leu Thr Pro Tyr 115 120 125
Phe Ser Trp Lys Phe Ser His Arg Asn His His Ser Asn Thr Ser Ser 130 135 140
Ile Asp Asn Asp Glu Vai Tyr Ile Pro Lys Ser Lys Ser Lys Leu Ala 145 150 155 160
Arg Ile Tyr Lys Leu Leu Asn Asn Pro Pro Gly Arg Leu Leu Vai Leu 165 170 175
Ile Ile Met Phe Thr Leu Gly Phe Pro Leu Tyr Leu Leu Thr Asn Ile 1B0 185 190
Ser Gly Lys Lys Tyr Asp Arg Phe Ala Asn His Phe Asp Pro Met Ser 195 200 205
Pro Ile Phe Lys Glu Arg Glu Arg Phe Gin Vai Phe Leu Ser Asp Leu 210 215 220
Gly Leu Leu Ala Vai Phe Tyr Gly Ile Lys Vai Ala Vai Ala Asn Lys 225 230 235 240
Gly Ala Ala Trp Vai Ala Cys Met Tyr Gly Vai Pro Vai Leu Gly Vai 245 250 255
Phe Thr Phe Phe Asp Vai Ile Thr Phe Leu His His Thr His Gin Ser 260 265 270 104
Ser Pro His Tyr Asp Ser Thr Glu Trp Asn Trp Ile Arg Gly Ala Leu 275 280 285
Ser Ala Ile Asp Arg Asp Phe Gly Phe Leu Asn Ser Vai Phe His Asp 290 295 300
Vai Thr His Thr His Vai Met His His Leu Phe Ser Tyr Ile Pro His 305 310 315 320
Tyr His Ala Lys Glu Ala Arg Asp Ala Ile Lys Pro Ile Leu Gly Asp 325 330 335
Phe Tyr Met Ile Asp Arg Thr Pro Ile Leu Lys Ala Met Trp Arg Glu 340 345 350
Gly Arg Glu Cys Met Tyr Ile Glu Pro Asp Ser Lys Leu Lys Gly Vai 355 360 365
Tyr Trp Tyr His Lys Leu 370 (2) INFORMAÇÃO PARA SEQ ID N°: 3: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 1312 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: simples (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: ADN (vi) FONTE ORIGINAL: (A) ORGANISMO: Crepis sp. 105
(ix) CARACTERISTICA
(A) NOME/CHAVE: CDS (B) LOCALIZAÇÃO: 26..1147 (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID N°: 3: TGTTGACCAT AAATCATCTA TCAAC ATG GGT GCC GGC GGC CGT GGT CGG ACA 52 Met Gly Ala Gly Gly Arg Gly Arg Thr 1 5 TCG GAA AAG TCG GTC ATG GAA CGT GTC TCA GTT GAT CCA GTA ACC TTC 100 Ser Glu Lys Ser Vai Met Glu Arg Vai Ser Vai Asp Pro Vai Thr Phe 10 15 20 25 TCA CTG AGT GAT TTG AAG CAA GCA ATC CCT CCA CAT TGC TTC CAG CGA 148 Ser Leu Ser Asp Leu Lys Gin Ala Ile Pro Pro His Cys Phe Gin Arg 30 35 40 TCT GTC ATC CGT TCA TCT TAT TAC GTT GTT CAG GAT CTC ATA ATT GCC 196 Ser Vai Ile Arg Ser Ser Tyr Tyr Vai Vai Gin Asp Leu Ile Ile Ala 45 50 55 TAC ATC TTC TAC TTC CTT GCC AAC ACA TAT ATC CCT AAT CTC CCT CAT 244 Tyr Ile Phe Tyr Phe Leu Ala Asn Thr Tyr Ile Pro Asn Leu Pro His 60 65 70 CCT CTA GCC TAC TTA GCT TGG CCG CTT TAC TGG TTC TGT CAA GCT AGC 292 Pro Leu Ala Tyr Leu Ala Trp Pro Leu Tyr Trp Phe Cys Gin Ala Ser 75 80 85 GTC CTC ACT GGG TTA TGG ATC CTC GGC CAT GAA TGT GGT CAC CAT GCC 340 Vai Leu Thr Gly Leu Trp Ile Leu Gly His Glu Cys Gly His His Ala 90 95 100 105 TAT AGC AAC TAC ACA TGG GTT GAC GAC ACT GTG GGC TTC ATC ATC CAT 388 Tyr Ser Asn Tyr Thr Trp Vai Asp Asp Thr Vai Gly Phe Ile lie His 110 115 120 TCA TTT CTC CTC ACC CCG TAT TTC TCT TGG AAA TAC AGT CAC CGG AAT 436 Ser Phe Leu Leu Thr Pro Tyr Phe Ser Trp Lys Tyr Ser His Arg Asn 125 130 135 106 484 CAC CAT TCC AAC ACA AGT His His Ser Asn Thr Ser 140 AAA AGC AAG TCC AAA CTC Lys Ser Lys Ser Lys Leu 155 CCT GGT CGA CTG TTG GTT Pro Gly Arg Leu Leu Vai 170 175 TTA TAC CTC TTG ACA AAT Leu Tyr Leu Leu Thr Asn 190 AAC CAC TTC GAC CCC ATG Asn His Phe Asp Pro Met 205 CAG GTC TTC CTT TCG GAT Gin Vai Phe Leu Ser Asp 220 AAA GTT GCT GTA GCA AAT Lys Vai Ala Vai Ala Asn 235 GGA GTT CCG GTG CTA GGC Gly Vai Pro Vai Leu Gly 250 255 TTA CAC CAC ACC CAT CAG Leu His His Thr His Gin 270 AAC TGG ATC AGA GGG GCT Asn Trp Ile Arg Gly Ala 285 TCG ATT GAT AAC GAT GAA Ser Ile Asp Asn Asp Glu 145 AAG CGT ATC TAT AAA CTT Lys Arg Ile Tyr Lys Leu ieo 165 TTG GTT ATC ATG TTC ACC Leu Vai Ile Met Phe Thr 180 ATT TCC GGC AAG AAA TAC Ile Ser Gly Lys Lys Tyr 195 AGT CCA ATT TTC AAA GAA Ser Pro Ile Phe Lys Glu 210 CTT GGT CTT CTT GCT GTG Leu Gly Leu Leu Ala Vai 225 AAA GGA GCT GCT TGG GTG Lys Gly Ala Ala Trp Vai 240 245 GTA TTT ACC TTT TTC GAT Vai Phe Thr Phe Phe Asp 260 TCG TCG CCT CAT TAT GAT Ser Ser Pro His Tyr Asp 275 TTG TCA GCA ATC GAT AGN Leu Ser Ala Ile Asp Arg 290 GTT TAC ATT CCG vai Tyr ile Pro 150 CTT AAC AAC CCA 532 Leu Asn Asn Pro CTA GGA TTT CCT 580 Leu Gly Phe Pro 185 GAT AGG TTT GCC 628 Asp Arg Phe Ala 200 CGT GAG CGG TTT 676 Arg Glu Arg Phe 215 TTT TAT GGA ATT 724 Phe Tyr Gly Ile 230 GCG TGC ATG TAT 772 Ala Cys Met Tyr GTG ATC ACG TTC 820 Vai Ile Thr Phe 265 TCA ACT GAA TGG 868 Ser Thr Glu Trp 280 GAC TTT GGG TTC 916 Asp Phe Gly Phe 295 107 CTG AAT AGT GTT TTC CAT GAT GTN ACA CAC ACT CAC GTC ATG CAT CAT 964 Leu Asn Ser Vai Phe His Asp Vai Thr His Thr His Vai Met His His 300 305 310 TTG TTT TCA TAC ATT CCA CAC TAT CAT GCA AAG GAA GCA AGG GAT GCA 1012 Leu Phe Ser Tyr Ile Pro His Tyr His Ala Lys Glu Ala Arg Asp Ala 315 320 325 ATC AAA CCG ATC TTG GGC GAC TTT TAT ATG ATC GAT AGG ACT CCA ATT 1060 Xle Lys Pro Ile Leu Gly Asp Phe Tyr Met Ile Asp Arg Thr Pro Ile 330 335 340 345 TTA AAA GCA ATG TGG AGA GAG GGC AGG GAA TGC ATG TAC ATC GAG CCT 1108 Leu Lys Ala Met Trp Arg Glu Gly Arg Glu Cys Met Tyr Ile Glu Pro 350 355 360 GAT AGC AAG CTC AAA GGT GTT TAT TGG TAT CAT AAA TTG TGATCATATG 1157 Asp Ser Lys Leu Lys Gly Vai Tyr Trp Tyr His Lys Leu 365 370 CAAAATGCAC ATGCATTTTC AAACCCTCTA GTTACCTTTG TTCTATGTAT AATAAGACCG 1217 CCGGTCCTAT GGTTTTCTAT GCCTAAGCCA GGCGAAATAG TTAAATAATA TCGGTATGAT 1277 GTAATGAAAG TATGTGGTTG TCTAAAAAAA AAAAA 1312 (2) INFORMAÇÃO PARA SEQ ID N°: 4: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 374 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: proteína (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID N°: 4: 108
Met Gly Ala Gly Gly Arg Gly Arg Thr Ser Glu Lys Ser Vai Met Glu 15 10 15
Arg Vai Ser Vai Asp Pro Vai Thr Phe Ser Leu Ser Asp Leu Lys Gin 20 25 30
Ala Ile Pro Pro His Cys Phe Gin Arg Ser Vai Ile Arg Ser Ser Tyr 35 40 45
Tyr Vai Vai Gin Asp Leu Ile Ile Ala Tyr Ile Phe Tyr Phe Leu Ala 50 55 60
Asn Thr Tyr Ile Pro Asn Leu Pro His Pro Leu Ala Tyr Leu Ala Trp 65 70 75 80
Pro Leu Tyr Trp Phe Cys Gin Ala Ser Vai Leu Thr Gly Leu Trp Ile 85 90 95
Leu Gly His Glu Cys Gly His His Ala Tyr Ser Asn Tyr Thr Trp Vai 100 105 110
Asp Asp Thr Vai Gly Phe Ile Ile His Ser Phe Leu Leu Thr Pro Tyr 115 120 125
Phe Ser Trp Lys Tyr Ser His Arg Asn His His Ser Asn Thr Ser Ser 130 135 140
Ile Asp Asn Asp Glu Vai Tyr Ile 145 150
Arg Ile Tyr Lys Leu Leu Asn Asn 165
Vai Ile Met Phe Thr Leu Gly Phe 180
Ser Gly Lys Lys Tyr Asp Arg Phe 195 200
Pro Ile Phe Lys Glu Arg Glu Arg 210 215
Pro Lys Ser Lys Ser Lys Leu Lys 155 160
Pro Pro Gly Arg Leu Leu Vai Leu 170 175
Pro Leu Tyr Leu Leu Thr Asn Ile 185 190
Ala Asn His Phe Asp Pro Met Ser 205
Phe Gin Vai Phe Leu Ser Asp Leu 220 109
Gly Leu Leu Ala Vai Phe Tyr Gly 225 230
Gly Ala Ala Trp Vai Ala Cys Met 245
Phe Thr Phe Phe Asp Vai Ile Thr 260
Ser Pro His Tyr Asp Ser Thr Glu 275 280
Ser Ala Ile Asp Arg Asp Phe Gly 290 295
Ile Lys Vai Ala Vai Ala Asn Lys 235 240
Tyr Gly Vai Pro Vai Leu Gly Vai 250 255
Phe Leu His His Thr His Gin Ser 265 270
Trp Asn Trp Ile Arg Gly Ala Leu 285
Phe Leu Asn Ser Vai Phe His Asp 300
Vai Thr His Thr His Vai Met His His Leu Phe Ser Tyr Ile Pro His 305 310 315 320
Tyr His Ala Lys Glu Ala Arg Asp Ala Ile Lys Pro Ile Leu Gly Asp 325 330 335
Phe Tyr Met Ile Asp Arg Thr Pro Ile Leu Lys Ala Met Trp Arg Glu 340 345 350
Gly Arg Glu Cys Met Tyr Ile Glu Pro Asp Ser Lys Leu Lys Gly Vai 355 360 365
Tyr Trp Tyr His Lys Leu 370 (2) INFORMAÇÃO PARA SEQ ID N°: 5: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 550 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: simples (D) TOPOLOGIA: linear 110 (ii) TIPO DE MOLÉCULA: ADN (vi) FONTE ORIGINAL: (A) ORGANISMO: Vernonia galamensis (ix) CARACTERÍSTICA:
(A) NOME/CHAVE: CDS (B) LOCALIZAÇÃO: 1..549 (xi) DESCRIÇÃO DE SEQUÊNCIA: SEQ ID N°: 5: CAT CAC GCC TTC AGT GAC TAT CAA TGG ATA GAC GAC ACT GTG GGC TTC 48 His His Ala Phe Ser Asp Tyr Gin Trp Ile Asp Asp Thr Vai Gly Phe 1 5 10 15 ATC CTT CAC TTT GCA CTC TTC ACC CCT TAT TTC TCT TGG AAA TAC AGT 96 Ile Leu His Phe Ala Leu Phe Thr Pro Tyr Phe Ser Trp Lys Tyr Ser 20 25 30 CAC CGT AAT CAC CAT GCC AAC ACA AAC TCT CTT GTA ACC GAT GAA GTA 144 His Arg Asn His His Ala Asn Thr Asn Ser Leu Vai Thr Asp Glu Vai 35 40 45 TAC ATC CCT AAA GTT AAA TCC AAG GTC AAG ATT TAT TCC AAA ATC CTT 192 Tyr lie Pro Lys Vai Lys Ser Lys Vai Lys Ile Tyr Ser Lys Ile Leu 50 55 60 AAC AAC CCT CCT GGT CGC GTT TTC ACC TTG GCT TTC AGA TTG ATC GTG 240 Asn Asn Pro Pro Gly Arg Vai Phe Thr Leu Ala Phe Arg Leu Ile Vai 65 70 75 B0 GGT TTT CCT TTA TAC CTT TTC ACC AAT GTT TCA GGC AAG AAA TAC GAA 288 Gly Phe Pro Leu Tyr Leu Phe Thr Asn Vai Ser Gly Lys Lys Tyr Glu 85 90 95 CGT TTT GCC AAC CAT TTT GAT CCC ATG AGT CCC ATT TTC ACC GAG CGT 336 Arg Phe Ala Asn His Phe Asp Pro Met Ser Pro Ile Phe Thr Glu Arg 100 105 110 111 GAG CAT GTA CAA GTC TTG CTT TCT GAT TTT GGT CTC ATA GCA GTT GCT 384 Glu His Vai Gin Vai Leu Leu Ser Asp Phe Gly Leu Ile Ala Vai Ala 115 120 125 TAC GTG GTT CGT CAA GCT GTA CTG GCT ΑΆΑ GGA GGT GCT TGG GTG ATG 432 Tyr Vai Vai Arg Gin Ala Vai Leu Ala Lys Gly Gly Ala Trp Vai Met 130 135 140 TGC ATT TAC GGA GTT CCT GTG CTG GCC GTA AAC GCA TTC TTT GTT TTA 480 Cys Ile Tyr Gly Vai Pro Vai Leu Ala Vai Asn Ala Phe Phe Vai Leu 145 150 155 160 ATC ACT TAT CTT CAC CAC ACG CAT CTC TCA CTG CCC CAC TAT GAT AGC 528 Ile Thr Tyr Leu His His Thr His Leu Ser Leu Pro His Tyr Asp Ser 1C5 170 175 TCA GAA TGG GAC TGG CTA CGA G 550 Ser Glu Trp Asp Trp Leu Arg 180 (2) INFORMAÇÃO PARA SEQ ID N° : 6 (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 183 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: proteína (xi) DESCRIÇÃO DE SEQUÊNCIA: SEQ ID N°: 6: 112
His His Ala Phe Ser Asp Tyr Gin Trp Ile Asp Asp Thr Vai Gly Phe 15 10 15
Ile Leu His Phe Ala Leu Phe Thr Pro Tyr Phe Ser Trp Lys Tyr Ser 20 25 30
His Arg Asn His His Ala Asn Thr Asn Ser Leu Vai Thr Asp Glu Vai 35 40 45
Tyr Ile Pro Lys Vai Lys Ser Lys Vai Lys Ile Tyr Ser Lys Ile Leu 50 55 60
Asn Asn Pro Pro Gly Arg Vai Phe Thr Leu Ala Phe Arg Leu Ile Vai 65 70 75 80
Gly Phe Pro Leu Tyr Leu Phe Thr Asn Vai Ser Gly Lys Lys Tyr Glu 85 90 95
Arg Phe Ala Asn His Phe Asp Pro 100
Glu His Vai Gin Vai Leu Leu Ser 115 120
Tyr Vai Vai Arg Gin Ala Vai Leu 130 135
Cys Ile Tyr Gly Vai Pro Vai Leu 145 150
Ile Thr Tyr Leu His His Thr His 165
Met Ser Pro Ile Phe Thr Glu Arg 105 110
Asp Phe Gly Leu Ile Ala Vai Ala 125
Ala Lys Gly Gly Ala Trp Vai Met 140
Ala Vai Asn Ala Phe Phe Vai Leu 155 160
Leu Ser Leu Pro His Tyr Asp Ser 170 175
Ser Glu Trp Asp Trp Leu Arg 180 (2) INFORMAÇÃO PARA SEQ ID N°: 7: (i) CARACTERÍSTICAS DA SEQUÊNCIA: 113 (A) COMPRIMENTO: 177 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: simples (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: ADN (vi) FONTE ORIGINAL: (A) ORGANISMO: Crepis alpina (ix) CARACTERÍSTICA:
(A) NOME/CHAVE: CDS (B) LOCALIZAÇÃO: 1..177 (xi) DESCRIÇÃO DE SEQUÊNCIA: SEQ ID N°: 7: GAA TGC GGT CAC CAT GCC TTC AGC GAC TAC CAG TGG GTT GAC GAC AAT 48 Glu Cys Gly His His Ala Phe Ser Asp Tyr Gin Trp Val Asp Asp Asn 1 5 10 15 GTG GGC TTC ATC CTC CAC TCG TTT CTC ATG ACC CCG TAT TTC TCC TGG 96 Vai Gly Phe Ile Leu His Ser Phe Leu Met Thr Pro Tyr Phe Ser Trp 20 25 30 AAA TAC AGC CAC CGG AAC CAC CAT GCC AAC ACA AAT TCG CTT GAC AAC 144 Lys Tyr Ser His Arg Asn His His Ala Asn Thr Asn Ser Leu Asp Asn 35 40 45 GAT GAA GTT TAC ATC CCC AAA AGC AAG GCC AAA 177 Asp Glu Vai Tyr Ile Pro Lys Ser Lys Ala Lys 50 55 (2) INFORMAÇÃO PARA SEQ ID N°: 8: 114 (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 59 aminoácidos (B) TIPO: aminoácido (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: proteína (xi) DESCRIÇÃO DE SEQUÊNCIA: SEQ ID N°: 8:
Glu Cys Gly His His Ala Phe Ser Asp Tyr Gin Trp Vai Asp Asp Asn 15 10 15
Vai Gly Phe Ile Leu His Ser Phe Leu Met Thr Pro Tyr Phe Ser Trp 20 25 30
Lys Tyr Ser His Arg Asn His His Ala Asn Thr Asn Ser Leu Asp Asn 35 40 45
Asp Glu Vai Tyr Ile Pro Lys Ser Lys Ala Lys 50 55 (2) INFORMAÇÃO PARA SEQ ID N°: 9: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 383 aminoácidos (B) TIPO: aminoácido (C) TIPO DE CADEIA: simples (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: proteína (vi) FONTE ORIGINAL: 115 (A) ORGANISMO: Arabidopsis thaliana (xi) DESCRIÇÃO DE SEQUÊNCIA: SEQ ID N°: 9:
Met Gly Ala Gly Gly Arg Met Pro Vai Pro Thr Ser Ser Lys Lys Ser 15 10 15
Glu Thr Asp Thr Thr Lys Arg Vai Pro Cys Glu Lys Pro Pro Phe Ser 20 25 30 val Gly Asp Leu Lys Lys Ala Ile Pro Pro His Cys Phe Lys Arg Ser 35 40 45
Ile Pro Arg Ser Phe Ser Tyr Leu Ile Ser Asp Ile Ile Ile Ala Ser 50 55 60
Cys Phe Tyr Tyr Val Ala Thr Asn Tyr Phe Ser Leu Leu Pro Gin Pro 65 70 75 80
Leu Ser Tyr Leu Ala Trp Pro Leu Tyr Trp Ala Cys Gin Gly Cys Val 85 90 95
Leu Thr Gly Ile Trp Val Ile Ala His Glu Cys Gly His His Ala Phe 100 105 HO
Ser Asp Tyr Gin Trp Leu Asp Asp Thr Val Gly Leu Ile Phe His Ser 115 120 125
Phe Leu Leu Val Pro Tyr Phe Ser Trp Lys Tyr Ser His Arg Arg His 130 135 140
His Ser Asn Thr Gly Ser Leu Glu Arg Asp Glu Val Phe Val Pro Lys 145 150 155 160
Gin Lys Ser Ala Ile Lys Trp Tyr Gly Lys Tyr Leu Asn Asn Pro Leu 165 170 175 116
Gly Arg Ile Met Met Leu Thr Vai Gin Phe Vai Leu Gly Trp Pro Leu 180 185 190
Tyr Leu Ala Phe Asn Vai Ser Gly Arg Pro Tyr Asp Gly Phe Ala Cys 195 200 205
His Phe Phe Pro Asn Ala Pro Ile Tyr Asn Asp Arg Glu Arg Leu Gin 210 215 220
Ile Tyr Leu Ser Asp Ala Gly Ile Leu Ala Vai Cys Phe Gly Leu Tyr 225 230 235 240
Arg Tyr Ala Ala Ala Gin Gly Met Ala Ser Met Ile Cys Leu Tyr Gly 245 250 255
Vai Pro Leu Leu Ile Vai Asn Ala Phe Leu Vai Leu Ile Thr Tyr Leu 260 265 270
Gin His Thr His Pro Ser Leu Pro His Tyr Asp Ser Ser Glu Trp Asp 275 280 285
Trp Leu Arg Gly Ala Leu Ala Thr Vai Asp Arg Asp Tyr Gly Ile Leu 290 295 300
Asn Lys Vai Phe His Asn Ile Thr Asp Thr His Vai Ala His His Leu 305 310 315 320
Phe Ser Thr Met Pro His Tyr Asn Ala Met Glu Ala Thr Lys Ala Ile 325 330 335
Lys Pro Ile Leu Gly Asp Tyr Tyr Gin Phe Asp Gly Thr Pro Trp Tyr 340 345 350
Vai Ala Met Tyr Arg Glu Ala Lys Glu Cys Ile Tyr Vai Glu Pro Asp 355 360 365
Arg Glu Gly Asp Lys Lys Gly Vai Tyr Trp Tyr Asn Asn Lys Leu 370 375 380 117 (2) INFORMAÇÃO PARA SEQ ID N°: 10: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 384 aminoácidos (B) TIPO: aminoácido (C) TIPO DE CADEIA: simples (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: proteína (vi) FONTE ORIGINAL: (A) ORGANISMO: Brassica juncea (xi) DESCRIÇÃO DE SEQUÊNCIA: SEQ ID N°: 10:
Met Gly Ala Gly Gly Arg Met Gin Vai Ser Pro Ser Pro Lys Lys Ser 15 10 15
Glu Thr Asp Thr Leu Lys Arg Vai Pro Cys Glu Thr Pro Pro Phe Thr 20 25 30
Vai Gly Glu Leu Lys Lys Ala Ile Pro Pro His Cys Phe Lys Arg Ser 35 40 45
Ile Pro Arg Ser Phe Ser Tyr Leu Ile Trp Asp Ile Ile Vai Ala Ser 50 55 60
Cys Phe Tyr Tyr Vai Ala Thr Thr Tyr Phe Pro Leu Leu Pro His Pro 65 70 75 80
Leu Ser Tyr Vai Ala Trp Pro Leu Tyr Trp Ala Cys Gin Gly Vai Vai 85 90 95 118
Leu Thr Gly Vai Trp Vai Ile Ala His Glu Cys Gly His His Ala Phe 100 105 110
Ser Asp Tyr Gin Trp Leu Asp Asp Thr Vai Gly Leu Ile Phe His Ser 115 120 125
Phe Leu Leu Vai Pro Tyr Phe Ser Trp Lys Tyr Ser His Arg Arg His 130 135 140
His Ser Asn Thr Gly Ser Leu Glu Arg Asp Glu Vai Phe Vai Pro Lys 145 150 155 160
Lys Lys Ser Asp Ile Lys Trp Tyr Gly Lys Tyr Leu Asn Asn Pro Leu 165 170 175
Gly Arg Thr Vai Met Leu Thr Vai Gin Phe Thr Leu Gly Trp Pro Leu 180 185 190
Tyr Trp Ala Phe Asn Vai Ser Gly Arg Pro Tyr Pro Glu Gly Phe Ala 195 200 205
Cys His Phe His Pro Asn Ala Pro Ile Tyr Asn Asp Arg Glu Arg Leu 210 215 220
Gin Ile Tyr Vai Ser Asp Ala Gly Ile Leu Ala Vai Cys Tyr Gly Leu 225 230 235 240
Tyr Arg Tyr Ala Ala Ala Gin Gly Vai Ala Ser Met Vai Cys Leu Tyr 245 250 255
Gly Vai Pro Leu Leu Ile Vai Asn Ala Phe Leu Vai Leu Ile Thr Tyr 260 265 270
Leu Gin His Thr His Pro Ser Leu Pro His Tyr Asp Ser Ser Glu Trp 275 280 285
Asp Trp Leu Arg Gly Ala Leu Ala Thr Vai Asp Arg Asp Tyr Gly Ile 290 295 300 119
Leu Asn Lys Vai Phe His Asn Ile Thr Asp Thr His Vai Ala His His 305 310 315 320
Leu Phe Ser Thr Met Pro His Tyr His Ala Met Glu Vai Thr Lys Ala 325 330 335
Ile Lys Pro Ile Leu Gly Asp Tyr Tyr Gin Phe Asp Gly Thr Pro Trp 340 345 350
Vai Lys Ala Met Trp Arg Glu Ala Lys Glu Cys Ile Tyr Vai Glu Pro 355 360 365
Asp Arg Gin Gly Glu Lys Lys Gly Vai Phe Trp Tyr Asn Asn Lys Leu 370 375 380 (2) INFORMAÇÃO PARA SEQ ID N°: 11: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 383 aminoácidos (B) TIPO: aminoácido (C) TIPO DE CADEIA: simples (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: proteína (vi) FONTE ORIGINAL: (A) ORGANISMO: Glycine max (xi) DESCRIÇÃO DE SEQUÊNCIA: SEQ ID N°: 11: 120
Met Gly Ala Gly Gly Arg Thr Asp Vai Pro Pro Ala Asn Arg Lys Ser 1 S 10 15
Glu Vai Asp Pro Leu Lys Arg Vai Pro Phe Glu Lys Pro Gin Phe Ser 20 25 30
Leu Ser Gin Ile Lys Lys Ala Ile Pro Pro His Cys Phe Gin Arg Ser 35 40 45
Vai Leu Arg Ser Phe Ser Tyr Vai Vai Tyr Asp Leu Thr Ile Ala Phe 50 55 60
Cys Leu Tyr Tyr Vai Ala Thr His Tyr Phe His Leu Leu Pro Gly Pro 65 70 75 80
Leu Ser Phe Arg Gly Met Ala Ile Tyr Trp Ala Vai Gin Gly Cys Ile 85 90 95
Leu Thr Gly Vai Trp Vai Ile Ala His Glu Cys Gly His His Ala Phe 100 105 110
Ser Asp Tyr Gin Leu Leu Asp Asp Ile Vai Gly Leu Ile Leu His Ser 115 120 125
Ala Leu Leu Vai Pro Tyr Phe Ser Trp Lys Tyr Ser His Arg Arg His 130 135 140
His Ser Asn Thr Gly Ser Leu Glu Arg Asp Glu Vai Phe Vai Pro Lys 145 ISO 155 160
Gin Lys Ser Cys Ile Lys Trp Tyr Ser Lys Tyr Leu Asn Asn Pro Pro 165 170 175
Gly Arg Vai Leu Thr Leu Ala Vai Thr Leu Thr Leu Gly Trp Pro Leu 180 185 190
Tyr Leu Ala Leu Asn Vai Ser Gly Arg Pro Tyr Asp Arg Phe Ala Cys 195 200 205 121
His Tyr Asp Pro Tyr Gly Pro Ile Tyr Ser Asp Are Glu Arg Leu Gin 210 215 220
Ile Tyr Ile Ser Asp Ala Gly Vai Leu Ala Vai Vai Tyr Gly Leu Phe 225 230 235 240
Arg Leu Ala Met Ala Lys Gly Leu Ala Trp Vai Vai Cys Vai Tyr Gly 245 250 255
Vai Pro Leu Leu Vai Vai Asn Gly Phe Leu Vai Leu Ile Thr Phe Leu 260 265 270
Gin His Thr His Pro Ala Leu Pro His Tyr Thr Ser Ser Glu Trp Asp 275 280 285
Trp Leu Arg Gly Ala Leu Ala Thr Vai Asp Arg Asp Tyr Gly Ile Leu 290 295 300
Asn Lys Vai Phe His Asn Ile Thr Asp Thr His Vai Ala His His Leu 305 310 315 320
Phe Ser Thr Met Pro His Tyr His Ala Met Glu Ala Thr Lys Ala Ile 325 330 335
Lys Pro Ile Leu Gly Glu Tyr Tyr Arg Phe Asp Glu Thr Pro Phe Vai 340 345 350
Lys Ala Met Trp Arg Glu Ala Arg Glu Cys Ile ’yr Vai Glu Pro Asp 355 360 365
Gin Ser Thr Glu Ser Lys Gly Vai Phe Trp Tyr Asn Asn Lys Leu 370 375 380 (2) INFORMAÇÃO PARA SEQ ID N°: 12: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 383 aminoácidos (B) TIPO: aminoácido 122 (C) TIPO DE CADEIA: simples (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: proteína (vi) FONTE ORIGINAL: (A) ORGANISMO: Solanum commersonii (xi) DESCRIÇÃO DE SEQUÊNCIA: SEQ ID N°: 12:
Met Gly Ala Gly Gly Arg Met Ser Ala Pro Asn Gly Glu Thr Glu Vai 15 10 15
Lys Arg Asn Pro Leu Gin Lys Vai Pro Thr Ser Lys Pro Pro Phe Thr 20 25 30
Vai Gly Asp Ile Lys Lys Ala Ile Pro Pro His Cys Phe Gin Arg Ser 35 40 45
Leu Ile Arg Ser Phe Ser Tyr Vai Vai Tyr Asp Leu Ile Leu Vai Ser 50 55 60
Ile Met Tyr Tyr Vai Ala Asn Thr Tyr Phe His Leu Leu Pro Ser Pro 65 70 75 80
Tyr Cys Tyr Ile Ala Trp Pro Ile Tyr Trp Ile Cys Gin Gly Cys Vai 85 90 95
Cys Thr Gly Ile Trp Vai Asn Ala His Glu Cys Gly His His Ala Phe 100 105 110
Ser Asp Tyr Gin Trp Vai Asp Asp Thr Vai Gly Leu Ile Leu His Ser 115 120 125
Ala Leu Leu Vai Pro Tyr Phe Ser Trp Lys Tyr Ser His Arg Arg His 130 135 140 123
His Ser Asn Thr Gly Ser Leu Glu Arg Asp Glu Vai Phe Vai Pro Lys 145 150 155 160
Pro Lys Ser Gin Leu Gly Trp Tyr Ser Lys Tyr Leu Asn Asn Pro Pro 165 170 175
Gly Arg Vai Leu Ser Leu Thr Ile Thr Leu Thr Leu Gly Trp Pro Leu 180 185 190
Tyr Leu Ala Phe Asn Vai Ser Gly Arg Pro Tyr Asp Arg Phe Ala Cys 195 200 205
His Tyr Asp Pro Tyr Gly Pro Ile Tyr Asn Asn Arg Glu Arg Leu Gin 210 215 220
Ile Phe Ile Ser Asp Ala Gly Vai Leu Gly Vai Cys Tyr Leu Leu Tyr 225 230 235 240
Arg Ile Ala Leu Vai Lys Gly Leu Ala Trp Leu Vai Cys Vai Tyr Gly 245 250 255
Vai Pro Leu Leu Vai Vai Asn Gly Phe Leu Vai Leu Ile Thr Tyr Leu 260 265 270
Gin His Thr His Pro Ser Leu Pro His Tyr Asp Ser Thr Glu Trp Asp 275 280 285
Trp Leu Arg Gly Ala Leu Ala Thr Cys Asp Arg Asp Tyr Gly Vai Leu 290 295 300
Asn Lys Vai Phe His Asn Ile Thr Asp Thr His Vai Vai His His Leu 305 310 315 320
Phe Ser Thr Met Pro His Tyr Asn Ala Met Glu Ala Thr Lys Ala Vai 325 330 335
Lys Pro Leu Leu Gly Asp Tyr Tyr Gin Phe Asp Gly Thr Pro Ile Tyr 340 345 350 124
Lys Glu Met Trp Arg Glu Ala Lys Glu Cys Leu Tyr Vai Glu Lys Asp 355 360 365
Glu Ser Ser Gin Gly Lys Gly Vai Phe Trp Tyr Lys Asn Lys Leu 370 375 380 (2) INFORMAÇÃO PARA SEQ ID N°: 13: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 387 aminoácidos (B) TIPO: aminoácido (C) TIPO DE CADEIA: simples (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: proteína (vi) FONTE ORIGINAL: (A) ORGANISMO: Glycine max (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID N°: 13:
Met Gly Leu Ala Lys Glu Thr Thr Met Gly Gly Arg Gly Arg Vai Ala 15 10 15
Lys Vai Glu Vai Gin Gly Lys Lys Pro Leu Ser Arg Vai Pro Asn Thr 20 25 30
Lys Pro Pro Phe Thr Vai Gly Gin Leu Lys Lys Ala Ile Pro Pro His 35 40 45 125
Cys Phe Gin Arg Ser Leu Leu Thr Ser Phe Ser Tyr Vai Vai Tyr Asp 50 55 60
Leu Ser Phe Ala Phe Ile Phe Tyr 65 70 Leu Pro Gin Pro Phe Ser Leu Ile 85 Gin Gly Cys Leu Leu Thr Gly Vai 100 His His Ala Phe Ser Lys Tyr Gin 115 120 Thr Leu His Ser Thr Leu Leu Vai 130 135
Ile Ala Thr Thr Tyr Phe His Leu 75 80
Ala Trp Pro Ile Tyr Trp Vai Leu 90 95
Trp Vai Ile Ala His Glu Cys Gly 105 110
Trp Vai Asp Asp Vai Vai Gly Leu 125
Pro Tyr Phe Ser Trp Lys Ile Ser 140
His Arg Arg His His Ser Asn Thr Gly Ser Leu Asp Arg Asp Glu Vai 145 150 155 160
Phe Vai Pro Lys Pro Lys Ser Lys Vai Ala Trp Phe Ser Lys Tyr Leu 165 170 175
Asn Asn Pro Leu Gly Arg Ala Vai Ser Leu Leu Vai Thr Leu Thr Ile 180 185 190
Gly Trp Pro Met Tyr Leu Ala Phe Asn Vai Ser Gly Arg Pro Tyr Asp 195 200 205
Ser Phe Ala Ser His Tyr His Pro Tyr Ala Pro Ile Tyr Ser Asn Arg 210 215 220
Glu Arg Leu Leu Ile Tyr Vai Ser Asp Vai Ala Leu Phe Ser Vai Thr 225 230 235 240
Tyr Ser Leu Tyr Arg Vai Ala Thr Leu Lys Gly Leu Vai Trp Leu Leu 245 250 255 126
Cys Vai Tyr Gly Vai Pro Leu Leu Ile Vai Asn Gly Phe Leu Vai Thr 260 265 270
Ile Thr Tyr Leu Gin His Thr His Phe Ala Leu Pro His Tyr Asp Ser 275 280 285
Ser Glu Trp Asp Trp Leu Lys Gly Ala Leu Ala Thr Met Asp Arg Asp 290 295 300
Tyr Gly Ile Leu Asn Lys Vai Phe His His Ile Thr Asp Thr His Vai 305 310 315 320
Ala His His Leu Phe Ser Thr Met Pro His Tyr His Ala Met Glu Ala 325 330 335
Thr Asn Ala Ile Lys Pro Ile Leu Gly Glu Tyr Tyr Gin Phe Asp Asp 340 345 350
Thr Pro Phe Tyr Lys Ala Leu Trp Arg Glu Ala Arg Glu Cys Leu Tyr 355 360 365
Vai Glu Pro Asp Glu Gly Thr Ser Glu Lys Gly Vai Tyr Trp Tyr Arg 370 375 380
Asn Lys Tyr 385 (2) INFORMAÇÃO PARA SEQ ID N°: 14: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 387 aminoácidos (B) TIPO: aminoácido (C) TIPO DE CADEIA: simples (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: proteína 127 (vi) FONTE ORIGINAL: (A) ORGANISMO: Ricinus communis (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID N°: 14:
Met Gly Gly Gly Gly Arg Met Ser Thr Vai Ile Thr Ser Asn Asn Ser 15 10 15
Glu Lys Lys Gly Gly Ser Ser His Leu Lys Arg Ala Pro His Thr Lys 20 25 30
Pro Pro Phe Thr Leu Gly Asp Leu Lys Arg Ala Ile Pro Pro His Cys 35 40 45
Phe Glu Arg Ser Phe Vai Arg Ser Phe Ser Tyr Vai Ala Tyr Asp Vai 50 55 60
Cys Leu Ser Phe Leu Phe Tyr Ser Ile Ala Thr Asn Phe Phe Pro Tyr 65 70 75 80
Ile Ser Ser Pro Leu Ser Tyr Vai 85
Gin Gly Cys Ile Leu Thr Gly Leu 100
His His Ala Phe Ser Glu Tyr Gin 115 120
Ile Vai His Ser Ala Leu Leu Vai 130 135
His Arg Arg His His Ser Asn Ile 145 150
Ala Trp Leu Vai Tyr Trp Leu Phe 90 95
Trp Vai Ile Gly His Glu Cys Gly 105 110
Leu Ala Asp Asp Ile Vai Gly Leu 125
Pro Tyr Phe Ser Trp Lys Tyr Ser 140
Gly Ser Leu Glu Arg Asp Glu Vai 155 160
Phe Vai Pro Lys Ser Lys Ser Lys Ile Ser Trp Tyr Ser Lys Tyr Ser 165 170 175 128
Asn Asn Pro Pro Gly Arg Vai Leu Thr Leu Ala Ala Thr Leu Leu Leu 180 185 190
Gly Trp Pro Leu Tyr Leu Ala Phe Asn Vai Ser Gly Arg Pro Tyr Asp 195 200 205
Arg Phe Ala Cys His Tyr Asp Pro Tyr Gly Pro Ile Phe Ser Glu Arg 210 215 220
Glu Arg Leu Gin Ile Tyr Ile Ala Asp Leu Gly Ile Phe Ala Thr Thr 225 230 235 240
Phe Vai Leu Tyr Gin Ala Thr Met Ala Lys Gly Leu Ala Trp Vai Met 245 250 255
Arg Ile Tyr Gly Vai Pro Leu Leu Ile Vai Asn Cys Phe Leu Vai Met 260 265 270
Ile Thr Tyr Leu Gin His Thr His Pro Ala Ile Pro Arg Tyr Gly Ser 275 280 285
Ser Glu Trp Asp Trp Leu Arg Gly Ala Met Vai Thr Vai Asp Arg Asp 290 295 300
Tyr Gly Vai Leu Asn Lys Vai Phe His Asn Ile Ala Asp Thr His Vai 305 310 315 320
Ala His His Leu Phe Ala Thr Vai Pro His Tyr His Ala Met Glu Ala 325 330 335
Thr Lys Ala Ile Lys Pro Ile Met Gly Glu Tyr Tyr Arg Tyr Asp Gly 340 345 350
Thr Pro Phe Tyr Lys Ala Leu Trp Arg Glu Ala Lys Glu Cys Leu Phe 355 360 365 129
Vai Glu Pro Asp Glu Gly Ala Pro Thr Gin Gly Vai Phe Trp Tyr Arg 370 375 380
Asn Lys Tyr 385 (2) INFORMAÇÃO PARA SEQ ID N°: 15: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 6 aminoácidos (B) TIPO: aminoácido (C) TIPO DE CADEIA: simples (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: péptido (v) TIPO DE FRAGMENTO: interno (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID N°: 15:
His Glu Cys Gly His His 1 5 (2) INFORMAÇÃO PARA SEQ ID N°: 16: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 5 aminoácidos (B) TIPO: aminoácido (C) TIPO DE CADEIA: simples (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: péptido 130 (v) TIPO DE FRAGMENTO: interno (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID N°: 16
His Arg Asn His His 1 5 (2) INFORMAÇÃO PARA SEQ ID N°: 17: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 5 aminoácidos (B) TIPO: aminoácido (C) TIPO DE CADEIA: simples (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: péptido (v) TIPO DE FRAGMENTO: interno (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID N°: 17
His Vai Met His His 1 5 (2) INFORMAÇÃO PARA SEQ ID N°: 18: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 29 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: simples (D) TOPOLOGIA: linear 131 (ii) TIPO DE MOLÉCULA: oligonucleótido (xi) DESCRIÇÃO DE SEQUÊNCIA: SEQ ID N°: 18: TGGAATTCCY TBMGNNNNYT SGGNHTBGG 29 (2) INFORMAÇÃO PARA SEQ ID N°: 19: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 1610 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: simples (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: ADN (vi) FONTE ORIGINAL: (A) ORGANISMO: Euforbia lagascae (ix) CARACTERÍSTICA:
(A) NOME/CHAVE: CDS (B) LOCALIZAÇÃO: 8..1546 (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID N°: 19: AGTAACA ATG AAC ACT AAG GAG AAG AAG AAG AAG AAC AGG GTT TCT AAC 49
Met Asn Thr Lys Glu Lys Lys Lys Lys Asn Arg Vai Ser Asn 15 10 ATG TCT ATT CTT CTT TGC TTC CTT TGC CTT CTT CCA GTT TTC CTT GTT 97
Met Ser Ile Leu Leu Cys Phe Leu Cys Leu Leu Pro Vai Phe Leu Vai 15 20 25 30 132 145 TCT CTT TCT ATT CTT TCT AAG AGG CTT AAG Ser Leu Ser Ile Leu Ser Lys Arg Leu Lys 35 40 CCA CCA GGA CCA AAG ACT CTT CCA ATT ATT Pro Pro Gly Pro Lys Thr Leu Pro Ile Ile 50 55 AGG CAA GAT CCA GAG GCT TCT CTT TCT CAA Arg Gin Asp Pro Glu Ala Ser Leu Ser Gin 65 70 CCA GTT GTT CAT TGC GAG AAG CTT GAG TCT Pro Vai Vai His Cys Glu Lys Leu Glu Ser 80 85 ATT AAG GTT GGA CAT TAT GAT AAG AAC TGC Ile Lys Vai Gly His Tyr Asp Lys Asn Cys 95 100 GGA GAT GAG CTT CTT GGA AAG CCA TCT CCA Gly Asp Glu Leu Leu Gly Lys Pro Ser Pro 115 120 ACT GGA GGA TAT GGA CTT GAG AGG m^rp AAG Thr Gly Gly Tyr Gly Leu Glu Arg Ser Lys 130 135 AAG GAG ACT TGG TCT GCT TTC AGG CAA TAT Lys Glu Thr Trp Ser Ala Phe Arg Gin Tyr 145 150 GGA ATG GGA GGA AGG TCT TTC GAG CTT ATG Gly Met Gly Gly Arg Ser Phe Glu Leu Met 160 165 TGC CTT GTT GAT GGA TAT GTT TCT AGG AAG Cys Leu Vai Asp Gly Tyr Vai Ser Arg Lys 175 180 CCA TCT AAG TGG AAG CTT Pro Ser Lys Trp Lys Leu 45 GGA AAC CTT CAA GAT GAG 193 Gly Asn Leu Gin Asp Glu 60 GGA CAT ATT GCT AGG GGA 241 Gly His Ile Ala Arg Gly 75 TTC GGA ACT CAA CCA ACT 289 Phe Gly Thr Gin Pro Thr 90 GCT CTT CTT CAT GGA GCT 337 Ala Leu Leu His Gly Ala 105 110 CCA AAC GAT GCT TGG GAT 385 Pro Asn Asp Ala Trp Asp 125 AAC GAG AGG TGG AAG GAG 433 Asn Glu Arg Trp Lys Glu 140 AGG ACT CTT AGG GCT TTC 481 Arg Thr Leu Arg Ala Phe 155 AGG TGG CAA GAG GCT CAT 529 Arg Trp Gin Glu Ala His 170 GCT TCT GGA ACT GAT CCA 577 Ala Ser Gly Thr Asp Pro 185 190 133 625 ACT AAG GAT CTT GAG GAT TCT AGG TTC AAC ATT ATT ATG GGA GCT.ACT Thr Lys Asp Leu Glu Asp Ser Arg Phe Asn Ile Ile Met Gly Ala Thr 195 200 205 TTC AAC CAA GGA CTT GAT TAT AAG ATT AAG ACT TTC CTT GAT AGG CAT 673 Phe Asn Gin Gly Leu Asp Tyr Lys Ile Lys Thr Phe Leu Asp Arg His 210 215 220 GAG AGG AGG AAC TTC CAA TTC AAC AAC GTT GAT GCT GTT TAT CAT CAA 721 Glu Arg Arg Asn Phe Gin Phe Asn Asn Vai Asp Ala Vai Tyr His Gin 225 230 235 ATG AAG GAT GCT GAG AGG GGA TTC GTT GAT TCT AGG GGA TGG CAA GAT 769 Met Lys Asp Ala Glu Arg Gly Phe Vai Asp Ser Arg Gly Trp Gin Asp 240 245 250 GAG TTC GGA ATT GCT CTT CAA CAA GTT GTT GCT CAA ATT CTT GAT AAG 817 Glu Phe Gly Ile Ala Leu Gin Gin Vai Vai Ala Gin Ile Leu Asp Lys 255 260 265 270 CCA CTT GAT CAT CAA AAG GCT CTT GAG AGG TGG CAA CCA AGG GAT TCT 865 Pro Leu Asp His Gin Lys Ala Leu Glu Arg Trp Gin Pro Arg Asp Ser 275 280 285 CTT AAC CAT TTC ATT GGA GCT AGG GAT GAT GAG ATG GTT CAA ATT AAG 913 Leu Asn His Phe Ile Gly Ala Arg Asp Asp Glu Met Vai Gin Ile Lys 290 295 300 TAT GAT TTC TGC AAG GAT GCT CTT AGG ATG TTC GAT ACT GGA ATT CTT 961 Tyr Asp Phe Cys Lys Asp Ala Leu Arg Met Phe Asp Thr Gly .Ile Leu 305 310 315 GCT GCT GAT CTT CAA TCT TCT ACT TCT TCT ATT AGG TGG GAG CCA ATT 1009 Ala Ala Asp Leu Gin Ser Ser Thr Ser Ser Ile Arg Trp Glu Pro Ile 320 325 330 GTT GTT ATG CTT CAA GCT GAG GTT AAG GGA GAG ATT TGC GAG GAG CTT 1057 Vai Vai Met Leu Gin Ala Glu Vai Lys Gly Glu Ile Cys Glu Glu Leu 335 340 345 350 134 GAT AGG GTT ATT GCT AGG CAT CAA AGG CCA TCT ATG AAG GAT AAG ATG 1105 Asp Arg Vai Ile Ala Arg His Gin Arg Pro Ser Met Lys Asp Lys Met 355 360 365 GTT AAG AGG TAT ACT GCT GCT GTT GTT TGC GAG CTT GAT AGG TAT GCT 1153 Vai Lys Arg Tyr Thr Ala Ala Vai Vai Cys Glu Leu Asp Arg Tyr Ala 370 375 380 AAG CTT CTT CCA TCT TCT CTT AGG TGC GTT GCT GCT GAT GAG TGG AAG 1201 Lys Leu Leu Pro Ser Ser Leu Arg Cys Vai Ala Ala Asp Glu Trp Lys 385 390 395 TTC AGG GAG TAT CTT ATT CCA GTT GGA ATG ACT GTT GGA AAC CTT AAG 1249 Phe Arg Glu Tyr Leu Ile Pro Vai Gly Met Thr Vai Gly Asn Leu Lys 400 405 410 ACT ACT GTT ATG CTT GAT CAA AAG GAT CCA GTT GAT CCA GAG CTT TTC 1297 Thr Thr Vai Met Leu Asp Gin Lys Asp Pro Vai Asp Pro Glu Leu Phe 415 420 425 430 GAT GGA ATG TAT GGA CTT GAT GCT GAG GTT CAT TTC GAT AAG ACT GAT 1345 Asp Gly Met Tyr Gly Leu Asp Ala Glu Vai His Phe Asp Lys Thr Asp 435 440 445 AGG TTC ATG CCA CCA TTC TCT GCT GGG AGG ATT GCC TGC GCT GGA CAA 1393 Arg Phe Met Pro Pro Phe Ser Ala Gly Arg Ile Ala Cys Ala Gly Gin 450 455 460 CTT CTT GCT GCT TAT GAG CTT TTC CTT TTC TTC TGG ACT ATT GCT GAT 1441 Leu Leu Ala Ala Tyr Glu Leu Phe Leu Phe Phe Trp Thr Ile Ala Asp 465 470 475 GTT TTC CAA ATT TTC TCT CTT GCT CAA TTC AAG GAG GGA CAT TGC ACT 1489 Vai Phe Gin Ile Phe Ser Leu Ala Gin Phe Lys Glu Gly His Cys Thr 480 485 490 GCT GTT ACT CTT ATT ATT GAT TGC CTT GCT GTT AGG TAT GAT CTT TGC 1537 Ala Vai Thr Leu Ile Ile Asp Cys Leu Ala Vai Arg Tyr Asp Leu Cys 495 500 505 510 135 1586 1610 CTT GCT AGG TAGGGACCTT TACCGTTTGT GTGACCGTGT CAATGCTTGC Leu Ala Arg AATGGGCTTT TAATAATATT ATTA (2) INFORMAÇÃO PARA SEQ ID N°: 20: (i) CARACTERÍSTICAS DA SEQUÊNCIA: (A) COMPRIMENTO: 1698 pares de bases (B) TIPO: ácido nucleico (C) TIPO DE CADEIA: simples (D) TOPOLOGIA: linear (ii) TIPO DE MOLÉCULA: ADN (ix) CARACTERÍSTICA:
(A) NOME/CHAVE: CDS (B) LOCALIZAÇÃO: 8..1504 (xi) DESCRIÇÃO DA SEQUÊNCIA: SEQ ID N°: 20: GAGAACA ATG GCA CAA TTC GGC ACG AGG GAA ATT CTA GTC TCA CTC TTT 49 Met Ala Gin Phe Gly Thr Arg Glu Ile Leu Vai Ser Leu Phe 1 5 10 CTC TTT CTA ATA CTA ATA AAG TTC ACA TTT TTA AAA CTC AAA ACC CCC 97 Leu Phe Leu Ile Leu Ile Lys Phe Thr Phe Leu Lys Leu Lys Thr Pro 15 20 25 30 CAA AAC CTC CCC CCA TCA CCA CCA TCT TTT CCA ATC ACC GGC CAT CTC 145 Gin Asn Leu Pro Pro Ser Pro Pro Ser Phe Pro Ile Thr Gly His Leu 35 40 45 136 193 CAT CTC CTA AAA CAA CCA ATC CAC AGA ACT CTC CAC CAA ATC GCC ACC HiS Leu Leu Lys Gin Pro Ile His Arg Thr Leu His Gin Ile Ala Thr 50 55 60 AAG TAC GGG GAC ATC TTA TTC CTC CGA TTC GGA ACA CGA AAA GTC CTA Lys Tyr Gly Asp Ile Leu Phe Leu Arg Phe Gly Thr Arg Lys Vai Leu 65 70 75 GTC ATC TCC TCT CTC CCC GCC GTA CAA GAA TGT TTC ACT ATA AAC GAC Vai Ile Ser Ser Leu Pro Ala Vai Gin Glu Cys Phe Thr Ile Asn Asp 80 B5 90 ATC ATT TTC GCT AAC CGC CCA ACA ATT CTC GCC GGG AAG CAC CTC AAT Ile Ile Phe Ala Asn Arg Pro Thr Ile Leu Ala Gly Lys His Leu Asn 95 100 105 110 TAC AAT TCC ACC ACC ATG GGA TTC GCC TCC TAT GGC GAT CAC TGG CGT 385 Tyr Asn Ser Thr Thr Met Gly Phe Ala Ser Tyr Gly Asp His Trp Arg 115 120 125 CAT CTC CGA CGA CTC ACA ACA ATT GAG CTC TTC TCT GCA AAT CGT GTT 433 His Leu Arg Arg Leu Thr Thr Ile Glu Leu Phe Ser Ala Asn Arg Vai 130 135 140 GCC ATG TTT TCC GGG TTC CGG GCC GAT GAA AGT ACA GCT TTT TAT CAA 481 Ala Met Phe Ser Gly Phe Arg Ala Asp Glu Ser Thr Ala Phe Tyr Gin 145 150 155 ACA GTT GTT CCA GGA AAT CGG GAT TCG GGA AAG ATA GTA ACT TTG ACA 529 Thr Vai Vai Pro Gly Asn Arg Asp Ser Gly Lys Ile Vai Thr Leu Thr 160 165 170 TCG AAA CTG ATG GAG CTT ACA CTG AAT AAC ATA ATG AGA ATG GCT GCC 577 Ser Lys Leu Met Glu Leu Thr Leu Asn Asn Ile Met Arg Met Ala Ala 175 180 185 190 GGA AAA CGG TTT TAC GGG AAA GAA GTG AAG GAT GAA GAA GGT GAG TTG 625 Gly Lys Arg Phe Tyr Gly Lys Glu Vai Lys Asp Glu Glu Gly Glu Leu 195 200 205 137 673 TTG CAG GAT CTT ATG AAG AAA ATG GAG GCG CTC CGG GGG AAT TCA ACG Leu Gin Asp Leu Met Lys Lys Met Glu Ala Leu Arg Gly Asn Ser Thr 210 215 220 GTG AAA CGA GAT TAT TTT CCA GTA TTG CAG TGG ATT GAT ΤΑΓ CAG GGA Vai Lys Arg Asp Tyr Phe Pro Vai Leu Gin Trp Ile Asp Tyr Gin Gly 225 230 235 GTA AAG AAG AAG ATG AGG AAC CTG ATG AAG AAA ATG GAC GGG TTC TTG Vai Lys Lys Lys Met Arg Asn Leu Met Lys Lys Met Asp Gly Phe Leu 240 245 250 CAA AAT CTC ATT GAT GAA CAC CGA AAC ACG ACG TTG TGG ATC AAT CAA Gin Asn Leu Ile Asp Glu His Arg Asn Thr Thr Leu Trp Ile Asn Gin 255 260 265 270 721 769 817 GTT CGA GCA ACT CGG ACA AAA AGA GGA ACT TGG ACA CTG GTA GAT GTT Vai Arg Ala Thr Arg Thr Lys Arg Gly Thr Trp Thr Leu Vai Asp Vai 275 2Θ0 285 ATG TTG AAT CTT AAA AAG ACA CAA CCT GAC TTC TAC ACT GAT CTA ACT Met Leu Asn Leu Lys Lys Thr Gin Pro Asp Phe Tyr Thr Asp Leu Thr 290 295 300 ATC AAA GGT GTC ATT CAG ACA ACA CTG ACT GCA GGA TCT CAA ACG TCA Ile Lys Gly Vai Ile Gin Thr Thr Leu Thr Ala Gly Ser Gin Thr Ser 305 310 315 GCA GTT ACA CTA GAA TGG GCG CTG TCA CTT CTT CTC AAC CAT CCT CAA Ala Vai Thr Leu Glu Trp Ala Leu Ser Leu Leu Leu Asn His Pro Gin 320 325 330 GTA ATG CAC AAA GCT TAT GCC GAA ATA GAG GCG ATT GTC GGG ACC AAC Vai Met His Lys Ala Tyr Ala Glu Ile Glu Ala Ile Vai Gly Thr Asn 335 340 345 350 CGC TTA TTA AAC GAA GCC GAC TTA CCA CAT CTA AGC TAT TTA CAA AAC Arg Leu Leu Asn Glu Ala Asp Leu Pro His Leu Ser Tyr Leu Gin Asn 355 360 365 865 913 961 1009 1057 138 1105 1153 ATA ATC ACC GAG ACA TTT CGA CTC TTC CCA CCA GTA CCA CTT TTA CTA Ile Ile Thr Glu Thr Phe Arg Leu Phe Pro Pro Vai Pro Leu Leu Leu 370 375 380 ccc CAT AAA TCA TCA GCA GAT TGC ATA GTT TCC GGG TTT CAC ATA CCA 1201 Pro His Lys Ser Ser Ala Asp Cys Ile Vai Ser Gly Phe His Ile Pro 385 390 395 CGG GGC ACA ATG TTG CTA GTG AAC ACA TGG AGC ATG AAT AGA AAT CCA 1249 Arg Gly Thr Met Leu Leu Vai Asn Thr Trp Ser Met Asn Arg Asn Pro 400 405 410 AGA TTA TGG AAG GAA CCA GAG AAA TTC ATA CCA GAA AGA TTT GAA GGA 1297 Arg Leu Trp Lys Glu Pro Glu Lys Phe Ile Pro Glu Arg Phe Glu Gly 415 420 425 430 GGA GAA AAT ACT GAA GGG TGT AAC TAT AAA TTG CTT CCT TTC GGT GCA 1345 Gly Glu Asn Thr Glu Gly Cys Asn Tyr Lys Leu Leu Pro Phe Gly Ala 435 440 445 GGA AGG CGG GCT TGT CCG GGG GCC GGT GTG GCG AAA CGA ATG GTA GGA 1393 Gly Arg Arg Ala Cys Pro Gly Ala Gly Vai Ala Lys Arg Met Vai Gly 450 455 460 CTC ACT TTA GGT GCA TTG ATT CAG TGT TTT GAG TGG GAA AGA ATT GGG 1441 Leu Thr Leu Gly Ala Leu Ile Gin Cys Phe Glu Trp Glu Arg Ile Gly 465 470 4 5 GAA GAA GAA ATA GAT TTG AGT GAA GGA ACA GGT CTT ACT ATG CCA AAA 1489 Glu Glu Glu Ile Asp Leu Ser Glu Gly Thr Gly Leu Thr Met Pro Lys 480 485 490 GAT TTC CTT TGG AAG TAATATGCAA ACCTCGGCAA AACATGATTA ACTTTCTTTC 1544
Asp Phe Leu Trp Lys 495 TACATTGTTA TAAAAGGTGG GTTTCTTTGC AGGTGCCAAC CCTAATTCAA ATATCGCATT 1604 TTTTCCCTGC AACCCAGCTG CTAACCAAAT ATCACTGTTT CTCATTATTC CTTATATAAA 1664 139
ACCTTAAAGC ACTATTTGCC TCCTAAAAAA AAAA 1698
Lisboa, 14 de Dezembro de 2006 140

Claims (34)

  1. REIVINDICAÇÕES 1. Molécula de ácido nucleico isolada que codifica ou é complementar a uma molécula de ácido nucleico isolada que codifica uma epoxigenase que é um polipéptido de monooxigenase de função mista que é capaz de catalizar a epoxigenação de uma ligação de carbono numa molécula de ácido gordo, em que a referida epoxigenase compreende uma sequência de aminoácidos que tem os três motivos ricos em histidina: (i) His-(Xaa) 3-4-His; (ii) His-(Xaa) 2-3-His-His/ e (iii) His-(Xaa) 2-3_His-His .
  2. 2. Molécula de ácido nucleico isolada de acordo com a reivindicação 1, em que a ligação de carbono é uma ligação dupla numa molécula de ácido gordo insaturado.
  3. 3. Molécula de ácido nucleico isolada de acordo com as reivindicações 1 ou 2, em que a referida epoxigenase é uma enzima Δβ-epoxigenase, uma enzima A9-epoxigenase, uma enzima A12-epoxigenase ou uma Al5-epoxigenase.
  4. 4. Molécula de ácido nucleico isolada de acordo com qualquer uma das reivindicações 1 a 3, derivada de uma planta.
  5. 5. Molécula de ácido nucleico isolada de acordo com a reivindicação 4, em que a planta é seleccionada da lista compreendendo Crepis spp.r Euphorbia spp., Chrysanthemum spp. e Vernonia spp. 1
  6. 6. Molécula de ácido nucleico isolada de acordo com a reivindicação 4, em que a planta produz niveis elevados de ácido vernólico.
  7. 7. Molécula de ácido nucleico isolada de acordo com a reivindicação 5, em que a planta é seleccionada da lista compreendendo Crepis biennis, Crepis aurea, Crepis conyzaefolia, Crepis intermédia, Crepis occidentalis, Crepis palaestina, Crepis vesicaria, Crepis xacintha e Vernonia galamensis.
  8. 8. Molécula de ácido nucleico isolada de acordo com qualquer uma das reivindicações 1 a 7, compreendendo uma sequência de nucleótidos que é, pelo menos, cerca de 65% idêntica a qualquer uma de SEQ ID Nos: 1, 3 ou 5 ou uma sua sequência complementar.
  9. 9. Molécula de ácido nucleico isolada de acordo com qualquer uma das reivindicações 1 a 8 capaz de hibridar sob, pelo menos, condições de restringência moderada com, pelo menos, 20 nucleótidos contíguos contidos dentro de qualquer uma de SEQ ID Nos: 1, 3 ou 5 ou uma sua sequência complementar.
  10. 10. Molécula de ácido nucleico isolada de acordo com qualquer uma das reivindicações 1 a 9, compreendendo a sequência de nucleótidos apresentada em SEQ ID Nos: 1, 3 ou 5, ou uma sua sequência de nucleótidos complementar ou, pelo menos, 20 nucleótidos contíguos à mesma.
  11. 11. Construção genética que compreende a molécula de ácido nucleico isolada de acordo com qualquer uma das reivindicações 1 a 10, ligada operacionalmente a uma sequência promotora, em que a referida molécula de ácido 2 nucleico é capaz de ser transcrita na orientação de sentido ou anti-sentido relativamente à direcção de transcrição in vivo de um gene de epoxigenase monooxigenase de função mista de ocorrência natural.
  12. 12. Método de alteração do nivel de ácidos gordos epoxi numa célula, tecido, órgão, organismo não humano, ou microrganismo, compreendendo o referido método a introdução de uma molécula de sentido, anti-sentido, ribozima ou co-supressão compreendendo a molécula de ácido nucleico isolada de acordo com qualquer uma das reivindicações 1 a 10 numa célula, tecido, órgão ou num organismo não humano e a incubação da referida célula durante um período de tempo e sob condições suficientes para ocorrer a expressão da referida molécula de sentido, anti-sentido, ribozima ou co-supressão.
  13. 13. Método de acordo com a reivindicação 12, em que o passo de introdução da molécula de sentido, anti-sentido, ribozima ou co-supressão compreende a transformação estável da célula, tecido, órgão ou organismo não humano com a molécula de sentido, anti-sentido, ribozima ou co-supressão.
  14. 14. Método de produção de um polipéptido de epoxigenase monooxigenase de função mista enzimaticamente activo recombinante numa célula, compreendendo o referido método o cultivo de uma célula que compreende a molécula de ácido nucleico isolada de acordo com qualquer uma das reivindicações 1 a 10 durante um período de tempo e sob condições suficientes para ocorrer a expressão.
  15. 15. Método de acordo com a reivindicação 14, compreendendo o primeiro passo adicional de transformar a célula com a molécula de ácido nucleico isolada. 3
  16. 16. Método de produção de um polipéptido de epoxigenase monooxigenase de função mista enzimaticamente activo recombinante numa célula, compreendendo o referido método os passos de: (i) produção de uma construção genética que compreende a molécula de ácido nucleico isolada de acordo com qualquer uma das reivindicações 1 a 10, colocada operacionalmente sob o controlo de um promotor capaz de conferir expressão na referida sequência genética na referida célula, e opcionalmente um elemento de intensificação de expressão; (ii) transformação da referida construção genética na referida célula; e (iii) selecção de transformantes que expressam uma epoxigenase funcional codificada pela sequência genética a um nivel elevado.
  17. 17. Método de produção de um polipéptido de epoxigenase monooxigenase de função mista enzimaticamente activo recombinante numa planta transgénica compreendendo os passos de: (i) produção de uma construção genética que compreende a molécula de ácido nucleico isolada de acordo com qualquer uma das reivindicações 1 a 10 colocada operacionalmente sob o controlo de um promotor especifico de semente e opcionalmente um elemento de intensificação de expressão, em que a referida sequência genética é também colocada a montante de uma sequência terminadora de transcrição; (ii) transformação da referida construção genética numa célula ou tecido da referida planta; e 4 (iii) selecção de transformantes que expressam uma epoxigenase funcional codificada pela sequência genética a um nivel elevado em sementes.
  18. 18. Método de acordo com a reivindicação 17, em que a planta é uma espécie de semente oleaginosa que produz normalmente niveis elevados de ácido linoleico.
  19. 19. Método de acordo com as reivindicações 17 ou 18, em que a planta é seleccionada da lista compreendendo linho Linola®, colza de semente oleaginosa, girassol, cártamo, soja, linhaça, sésamo, semente de algodão, amendoim, azeitona ou palmeira-de-azeite.
  20. 20. Polipéptido de epoxigenase monooxigenase de função mista recombinante produzido de acordo com o método de acordo com qualquer uma das reivindicações 14 a 19.
  21. 21. Polipéptido de epoxigenase monooxigenase de função mista recombinante de acordo com a reivindicação 20, que compreende uma sequência de aminoácidos apresentada em qualquer uma de SEQ ID Nos: 2, 4 ou 6 ou que é, pelo menos, cerca de 50% idêntica à mesma.
  22. 22. Método de produção de um ácido gordo epoxigenado numa célula, tecido, órgão, organismo não humano, ou microrganismo, compreendendo o referido método a incubação de uma célula, tecido, órgão ou organismo não humano que expressa o polipéptido recombinante de acordo com as reivindicações 20 ou 21 com um substrato de ácido gordo durante um período de tempo e sob condições suficientes para, pelo menos, uma ligação de carbono do referido substrato seja convertida num grupo epoxi. 5
  23. 23. Método de acordo com a reivindicação 22, em que o substrato de ácido gordo é um ácido gordo insaturado e a ligação de carbono do referido substrato que é epoxigenada é uma ligação dupla de carbono.
  24. 24. Método de acordo com as reivindicações 22 ou 23, em que o substrato de ácido gordo é seleccionado da lista compreendendo ácido palmitoleico, ácido oleico, ácido linoleico, ácido linolénico, ácido 9,15-octadecadienóico e ácido araquidónico.
  25. 25. Método de acordo com qualquer uma das reivindicações 22 a 24, em que a ligação de carbono que é epoxigenada é uma ligação de carbono Δ6 ou uma ligação de carbono Δ9 ou uma ligação de carbono Δ12 ou uma ligação de carbono Δ15.
  26. 26. Método de acordo com qualquer uma das reivindicações 22 a 25, em que o ácido gordo epoxigenado que é produzido é ácido vernólico.
  27. 27. Método de acordo com qualquer uma das reivindicações 22 a 26, compreendendo o primeiro passo adicional de transformar ou transfectar a célula, tecido, órgão ou organismo não humano com uma molécula de ácido nucleico que codifica a epoxigenase monooxigenase de função mista recombinante.
  28. 28. Método de acordo com qualquer uma das reivindicações 22 a 27, em que célula, órgão, tecido ou organismo não humano em que a epoxigenase monooxigenase de função mista recombinante é expressa, é derivada a partir de bactéria, levedura, fungo, bolor, insecto, planta, pássaro ou mamifero não humano. 6
  29. 29. Método de acordo com a reivindicação 28, em que a levedura, planta, fungo ou bolor é uma levedura, planta, fungo ou bolor oleaginoso.
  30. 30. Método de acordo com a reivindicação 29, em que a planta é uma planta de semente oleaginosa que não expressa normalmente a epoxigenase monooxigenase de função mista recombinante a um nivel elevado.
  31. 31. Método de acordo com a reivindicação 30, em que a planta de semente oleaginosa é seleccionada da lista compreendendo linho Linola®, colza de semente oleaginosa, girassol, cártamo, soja, linhaça, sésamo, semente de algodão, amendoim, azeitona ou palma-de-azeite.
  32. 32. Planta transformada com a molécula de ácido nucleico isolada de acordo com qualquer uma das reivindicações 1 a 10 ou uma célula, tecido ou órgão dai derivada ou a progenia da referida planta que também compreende a referida molécula de ácido nucleico.
  33. 33. Planta transformada que é capaz de expressar o polipéptido recombinante de acordo com as reivindicações 20 ou 21 ou uma célula, tecido ou órgão dai derivado ou a progenia da referida planta que é também capaz de expressar o referido polipéptido recombinante.
  34. 34. Planta ou uma célula, tecido ou órgão dai derivado ou a sua progenia de acordo com as reivindicações 32 ou 33, que é ou é derivada de linho Linola®, colza de semente oleaginosa, girassol, cártamo, soja, linhaça, sésamo, semente de algodão, amendoim, azeitona ou palma-de-azeite. 7 Planta ou uma célula, tecido ou órgão daí derivado ou a sua progenia, de acordo com as reivindicações 32 ou 33, que é ou é derivada de Arabidopsis thaliana ou Linum usitatissimum. Lisboa, 14 de Dezembro de 2006
PT98913438T 1997-04-15 1998-04-09 Genes de apoxigenase de ácido gordo vegetal e suas utilizações PT975765E (pt)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
AUPO6226A AUPO622697A0 (en) 1997-04-15 1997-04-15 Plant fatty acid epoxygenase genes and uses therefor IIa
AUPO6223A AUPO622397A0 (en) 1997-04-15 1997-04-15 Plant fatty acid epoxygenase genes and uses therefor Ia
US4370697P 1997-04-16 1997-04-16
US5040397P 1997-06-20 1997-06-20

Publications (1)

Publication Number Publication Date
PT975765E true PT975765E (pt) 2007-01-31

Family

ID=42676768

Family Applications (1)

Application Number Title Priority Date Filing Date
PT98913438T PT975765E (pt) 1997-04-15 1998-04-09 Genes de apoxigenase de ácido gordo vegetal e suas utilizações

Country Status (1)

Country Link
PT (1) PT975765E (pt)

Similar Documents

Publication Publication Date Title
CA2286895C (en) Plant fatty acid epoxygenase genes and uses therefor
US7834248B2 (en) Plant seed comprising vernolic acid
MXPA99009476A (en) Plant fatty acid epoxygenase genes and uses therefor
AU2002310891B2 (en) New elongase gene and production of delta9-polyunsaturated fatty acids
US6884921B2 (en) ω-3 fatty acid desaturase
EP1656449B1 (en) Fatty acid desaturases from primula
AU2002310891A1 (en) New elongase gene and production of delta9-polyunsaturated fatty acids
JP2005526496A (ja) 新規エロンガーゼ遺伝子および高度不飽和脂肪酸の生産方法
JP2003518369A (ja) 多不飽和脂肪酸および脂質の合成に関与するタンパク質をコードするフィスコミトレラ・パテンス由来のコケの遺伝子
AU734232B2 (en) Plant fatty acid epoxygenase genes and uses therefor
PT975765E (pt) Genes de apoxigenase de ácido gordo vegetal e suas utilizações
US20210317467A1 (en) Improved method for the production of high levels of pufa in plants
US20050170478A1 (en) Expression of phospholipid:diacylglycerine acyltranssferase (pdat) for the production of plant storage lipids with polyunsaturated fatty acids
CN112996915A (zh) 用于在植物中产生高水平pufa的改进方法
Napier et al. New Elongase Gene And Production Of Delta-9-polyunsaturated Fatty Acids (Patent EP 1373519 B1)
Napier et al. Novel Method For The Production Of Polyunsaturated Fatty Acids (Patent WO 2004/057001 A2)
WO2000003006A1 (en) Sucrose biosynthesis genes and uses therefor
AU4762499A (en) Sucrose biosynthesis genes and uses therefor