BRPI0610521A2

BRPI0610521A2 - método para desenhar uma molécula de ácido nucléico, molécula de ácido nucléico, vetor, método para obtenção de uma planta transgênica e sua progênie

Info

Publication number: BRPI0610521A2
Application number: BRPI0610521-1A
Authority: BR
Inventors: Carl R Simmons; Andre R Abad; Ronald D Flannagan; Rafael Herrmann; Albert L Lu; Billy F Mccutchen
Original assignee: Pioneer Hi Bred Int; Du Pont
Priority date: 2005-04-05
Filing date: 2006-04-04
Publication date: 2010-06-29
Also published as: MX2007012344A; US20060236424A1; CN101238215A; WO2006107954A2; EP1866419A2; AU2006231503A1; WO2006107954A3; CA2605939A1

Abstract

A presente invenção está relacionada com métodos para desenhar moléculas de ácido nucléico para a expressão aumentada de polipeptídeos codificados em plantas. Em tais métodos, as freqüências de uso de códons são induzidas na direção de freqüências de uso de códons de um vírus vegetal, grupo de vírus vegetais, ou um subgrupo de moléculas de ácido nucléico provenientes destes. Em avanços preferidos, o polipeptídeo codificado afeta o fenótipo da planta. A invenção também compreende moléculas de ácido nucléico que codificam polipeptídeos onde as moléculas de ácido nucléico foram desenhadas para apresentar códons-tendenciosos de vírus vegetais. A invenção também faz uso de plantas transgênicas e progênie destas, com expressão aumentada de polipeptídeos inseticida para resistência aumentada a insetos e outras pragas que são prejudiciais a plantas de valor na agricultura. Refere-se ainda a presente invenção, a um método para obtenção de uma planta transgênica e sua progênie compreendendo a transformação de maneira estável de uma célula vegetal com uma molécula de ácido nucléico, o cultivo da referida célula vegetal transformada sob condições de crescimento vegetal e a regeneração da planta transgênica e sua progênie.

Description

MÉTODO PARA DESENHAR UMA MOLÉCULA DE ÁCIDO NUCLÉICO,MOLÉCULA DE ÁCIDO NUCLÉICO, VETOR, PLANTA TRANS6ÊNICA E APROGÊNIE DESTA

CAMPO DA INVENÇÃO

A pres.ente invenção está relacionada com métodos deprojetar moléculas de ácidos nucléicos para expressãomelhorada dos polipeptideos codificados em plantas. Em taismétodos, as freqüências de uso de códons são induzidas nadireção de freqüências de uso de códons de virus vegetais.Em avanços preferidos, o polipeptideo codificado afeta ofenótipo da planta. Em um avanço especifico, o polipeptideocodificado é um polipeptideo inseticida.

FUNDAMENTOS DA INVENÇÃO

Um alto nivel de expressão de polipeptideo transgênicoé freqüentemente dificil de alcançar em plantas,particularmente quando o transgene codificando umpolipeptideo estrangeiro é derivado de um organismo que éevolutivamente distante de plantas. Isso tem sido umimportante obstáculo à explotação bem-sucedida de genespolipeptideo inseticidas derivados de procariontes. Umarazão critica para baixos niveis de expressão depolipeptideo transgênico é a diferença significante no usode códon freqüentemente observada entre espécies altamentedivergentes, e.g., plantas e procariontes, comumentereferidos como tendência de códon. A tendência de códonfreqüentemente se correlaciona com a eficiência de traduçãode RNA mensageiro (RNAm), que é sucessivamente acreditadopor ser dependente de, inter alia, propriedades dos códonssendo traduzidos e a disponibilidade de molécula detransferência de RNA (tRNA) em particular. A predominânciade RNAs t selecionados em uma célula é geralmente umreflexo dos códons usados mais freqüentemente na sintesepeptidica. Conseqüentemente, genes podem ser cortados paraexpressão ótima em plantas, baseado nesses fatores detradução.

Em geral, tem havido duas abordagens principais paraseqüências gênicas sintéticas de indução de tendência decódon para expressão em plantas: indução de tendência defreqüência de uso de códon e indução de tendência de códonpreferido. A indução de tendência de freqüência de uso decódon refere-se a selecionar códons para . uma molécula deácido nucléico codificando a seqüência de aminoácidos de umpolipeptideo a ser expressado, de forma que as freqüênciasde uso de códon, para um ou mais tipos de aminoácidoscodificados em um gene sintético, pareçam as freqüências deuso de códon do hospedeiro de expressão de polipeptideo(e.g. uma planta). A tendência de códon preferida consistede selecionar códons para uma molécula de ácido nucléicoque codifica a seqüência de aminoácidos de um polipeptideoa ser expressado, de forma que um ou mais códons para um oumais tipos de aminoácidos em um gene sintético são osúnicos códons que mais freqüentemente codificam um tipo deaminoácido em um hospedeiro de expressão de polipeptideo(e.g. uma planta). Essas abordagens para melhorar aexpressão transgene em plantas, particularmente comrespeito à expressão de polipeptideos CRY Bacillusthuringiensis inseticida, foram usadas em um número decasos.

Adang et al. , US Pat. No. 5.380.831 refere-se a umvariante sintético de um gene de polipeptideo Cry Bacillusthuringiensis tenebrionsis (Btt) inseticida nativo, no qualas freqüências de uso de códon foram ajustadas para estarpróximas àquelas usadas em genes de plantas dicotiledôneas.

Adang et al. também indicam que a mesma abordagem pode serusada para gerar um gene Cry sintético adaptado a expressãoem plantas monocotiledôneas, usando as freqüências de usode códon de uma planta monocotiledônea. Adang et al.revelam que o gene sintético é projetado mudando-se códonsindividuais do gene Cry nativo, de forma que a freqüênciade uso de códon total se assemelhe àquela de um gene deplanta dicotiledônea.

Fischhoff et al. U.S. Pat. No. 5.500.365, referem-se agenes vegetais codificando o polipeptideo Cry inseticida deBacillus thuringiensis. As porcentagens listadas sãobaseadas em freqüências de uso de códon de genes de plantasdicotiledôneas. Fischoff et al. afirmam que, em geras,códons deveriam ser selecionados, preferencialmente, deforma que o conteúdo GC do gene sintético seja cerca de 50%.Barton et al., U.S. Pat. No. 5.177.308, é direcionadoà expressão de toxinas inseticida em plantas. Um gene depolipeptideo AaIT sintético inseticida derivado de um genenativo de escorpião é descrito, no qual o códon preferido érelatado por ser usado para cada aminoácido.

Koziel et al., U.S. Pat. No. 6.121.014, é direcionadono sentido de otimizar a expressão de polipeptideos emplantas e, particularmente, polipeptideos inseticida deBacillus thuringiensis. Koziel et al. indicam que odesenho de genes sintéticos otimizado para expressão emplantas monocotiledôneas ou dicotiledôneas é para serbaseado em mudar um número suficiente de códons de umaseqüência nativa para os códons preferidos da plantahospedeira.

Em geral, aumentar a eficiência de tradução detransgenes em plantas foi tentado gerando-se genessintéticos que usam tanto os códons preferidos de umhospedeiro vegetal ou a freqüência de uso de códon dohospedeiro vegetal. Deveria ser notado, contudo, que muitoda tendência de códon aparente, em milho, pode ser devido afatores não relacionados a eficiência de tradução per si,tal como pressão de seleção para metilação genômica deplantas e taxas de mutação de sitios metilados versus nãometilados. Assim, resta uma necessidade não encontrada naarte para abordagens alternativas para mudar freqüências deuso de códon para aumentar a expressão transgene vegetal.SUMÁRIO DA INVENÇÃO

A presente invenção está relacionada a métodos deprojetar moléculas de ácidos nucléicos para expressãomelhorada dos polipeptideos codificados em plantas.Conseqüentemente, pelo menos um códon da molécula de ácidonucléico a ser expressada é alterado para um códon que temuma freqüência de uso em um virus vegetal que é maior doque aquela do códon não alterado. Preferencialmente, asmoléculas de ácidos nucléicos desta invenção irão melhorara expressão do polipeptideo codificado, se comparada a umpolipeptideo codificado por uma molécula de ácido nucléicoque não foi alterada.

Em um avanço, o códon alterado foi alterado para umcódon que tem uma freqüência de uso em um virus vegetal queé maior do que 0,09. Em outro avanço, o códon alterado foialterado para um códon que tem uma freqüência de uso em umvirus vegetal que é igual a ou maior do que a mediana dafreqüência de uso de códon para aquele aminoácido emparticular, codificado pelo códon alterado. Tal mediana defreqüência de uso de códon é a mediana das freqüências deuso de códon no virus vegetal para todos códons codificandoum aminoácido em particular.

Em avanços preferidos, o polipeptideo codificado afetao fenótipo da planta. Em um avanço especifico, opolipeptideo codificado é um polipeptideo inseticidaincluindo, mas não limitado aos, polipeptideos 437N e Cryde Bacillus thuringiensis e polipeptideo de lipaseinseticida de Rhyzopus oryzae.

Também englobados pela presente invenção são vetores,células hospedeiras, plantas transgênicas e progênie dessascompreendendo moléculas de ácidos nucléicos feitas deacordo com os métodos da invenção. A invenção estárelacionada, ainda, material vegetal de propagação de umaplanta transformada incluindo, mas não limitando-se a,sementes, tubérculos, cormos, bulbos, folhas, e cortes deraizes e brotos.

BREVE DESCRIÇÃO DOS DESENHOS

As FIGS. 1A-1B mostram os resultados de um teste dedisco foliar contra a lagarta do milho européia. Discosfoliares de calos transformados com polipeptideo 473Ninseticida de códon otimizado de Bacillus thuringiensisforam incubados com uma lagarta do milho européia recém-nascida por 48 hrs. Discos foliares controle de plantasnão transgênicas foram incluídos para comparação de consumofoliar. (A) O disco foliar foi totalmente consumido empoços controle deixando apenas o disco de filtro de papelno qual o disco foliar foi colocado (ver coluna 1). Discosfoliares transformados com 473N de códon otimizado forammuito pouco consumidos (ver coluna 2). (B) Eventosadicionais de transformação com 473N de códon otimizadoapresentaram pouco consumo foliar.A FIG. 2 mostra uma análise de immunoblot de plantastransformadas com polipeptideo 473N inseticida de códonotimizado de Bacillus thuringiensis. Extrações depolipeptideo de plantas transgênicas foram sujeitas aanálise de immunoblot usando um anticorpo anti-473N. 473Npurificado recombinante é apresentado na faixa 1. Umaamostra controle de planta não transgênica mostra bandasreativas sem 437N em comum com amostras transgênicas (faixa2) . A presença de uma banda correspondente a 437N estevepresente em amostras foliares de eventos que demonstrarameficácia no teste de disco foliar (faixas 2, 3, 4, e 7).

A FIG. 3 mostra uma análise de immunoblot de plantastransformadas com lipase inseticida de códon otimizada deRhyzopus oryzae. Extrações de polipeptideo de plantastransgênicas de tecido (A) foliar e (B) radicular foramsujeitas a análise de immunoblot usando um anticorpo anti-Rolipase. A proteina precursora purificada recombinanteRolipase (ROL ~42 kD) foi incluída na análise de immunoblotcomo um controle positivo. A presença de uma bandacorrespondente a Rolipase madura (~31 kD) foi observada emplantas que foram positivas no teste de simulação de raiz(faixas 1-6) .

DESCRIÇÃO DETALHADA DA INVENÇÃO

Sistemas biológicos exibem freqüências característicasno uso de códons particulares ( i.e. freqüências de uso decódon) para especificar um dado tipo de aminoácido. Taisfreqüências de códon podem diferir grandemente de espéciepara espécie, um fenômeno conhecido como "tendência decódon". Diferenças de espécies em tendência de códon sãopossíveis devido à degeneração do código genético e são bemdocumentadas, na forma de tabelas de freqüência de uso decódon. A tendência de códon de uma molécula de ácidonucléico em particular determinará, a um alto grau, aeficiência com a qual o polipeptideo codificado éexpressado em um tipo de célula em particular.

O efeito de tendência de códon na eficiência deexpressão é uma consideração particularmente importantepara expressão transgene. Uma seqüência de RNAmcompreendendo vários códons que não são usadosfreqüentemente em uma espécie que deve ser o hospedeiro deexpressão é improvável de ser traduzida eficientemente. Aocontrário, uma seqüência de RNAm que consiste de códons quesão freqüentemente usados por um organismo hospedeiro éprovável de ser traduzida com alta eficiência.

A presente invenção está relacionada a métodos deprojetar moléculas de ácidos nucléicos para expressãomelhorada dos polipeptideos codificados em plantasconstruindo moléculas de ácidos nucléicos cuja tendência decódon é induzida na direção de códons que são usadosfreqüentemente em seqüências codificando moléculas deácidos nucléicos de virus vegetais. A tendência de códonde virus vegetais conhecidos por explorar o maquinário detradução do hospedeiro vegetal com alta eficiência é maisprovável de ser um reflexo de preferências de tradução dohospedeiro vegetal do que a tendência de códon dasseqüências genômicas nativas do hospedeiro vegetal.

Conseqüentemente, pelo menos um códon da molécula de ácidonucléico a ser expressada é alterado para um códon quepossui uma freqüência de uso em um virus vegetal, grupo devirus vegetais, ou subgrupo de moléculas de ácidosnucléicos desses, que é maior do que aquela do código códonnão alterado. Preferencialmente, as moléculas de ácidosnucléicos desta invenção irão melhorar a expressão dopolipeptideo codificado se comparado a um polipeptideocodificado por uma molécula de ácido nucléico que não foialterada.

Os métodos da presente invenção compreendem gerartabelas de freqüência de uso de códon de um virus vegetal,grupo de virus vegetais, ou um subgrupo de moléculas deácidos nucléicos desses, de interesse para determinarcódons com altas freqüências de uso em virus vegetais. Talfreqüência alta de uso códons pode ser substituída porcódons com baixas freqüências de uso que estão presentes emmoléculas de ácidos nucléicos a serem expressadas emplantas. Os códons com as maiores freqüências de uso queusaram as substituições são chamados "códons alterados".

Moléculas de ácidos nucléicos e seus polipeptideoscodificados que têm pelo menos um códon alterado são ditaspor serem "códon otimizadas". Não existe pré-requisito deque todo ou a maioria dos códons devem ser códons alteradospara que uma molécula de ácido nucléico ou polipeptídeoseja uma molécula códon otimizada.

DETERMINAR FREQÜÊNCIAS DE USO DE CÓDON

Para alterar uma molécula de ácido nucléico de formaque os códons alterados são aqueles com uma freqüência deuso maior em um virus vegetal, deve-se, primeiro,determinar freqüências de uso de códon para o virusvegetal. Em um avanço, a freqüência de uso de códon ébaseada em todos dos polipeptideos codificados pelasmoléculas de ácidos nucléicos do virus. Em outro avanço, afreqüência de uso de códon é baseada em um subgrupo dospolipeptideos codificados pelas moléculas de ácidosnucléicos do virus. Em outro avanço, a freqüência de usode códon é baseada no subgrupo dos polipeptideoscodificados pelas moléculas de ácidos nucléicos do virusque são similares função (e.g., os polipeptideos de capa,os polipeptideos de maquinário de transcrição ou detradução, os polipeptideos envelope, etc). A freqüênciade uso de códon pode ser baseada em um virus vegetal oumúltiplos virus vegetais. Em avanços onde múltiplos virusvegetais são usados para calcular freqüências de uso decódon, os virus infectam, preferencialmente, o mesmo tipode planta (e.g., monocotiledônea, dicotiledônea, milho,soja, etc.).

A freqüência de uso de códon é calculada para umaseqüência codificadora de molécula de ácido nucléico deacordo com o seguinte método. Primeiro, o número total detodos os códons codificando um tipo de aminoácido emparticular (ou um códon de parada) é determinado contando-se as ocorrências sobre uma ou mais seqüênciascodificadoras de moléculas de ácido nucléico. Segundo, onúmero total de ocorrências para cada códon codificando umtipo de aminoácido em particular (ou códon de parada) édeterminado para as mesmas seqüências codificadoras demoléculas de ácido nucléico. Terceiro, uma freqüência deuso de códon para cada códon é determinada dividindo-se onúmero total de ocorrências daquele códon pelo número totalde ocorrências de códons codificando o mesmo tipo deaminoácido daquele códon.

As tabelas reveladas nas Seções 5.1.1, 5.1.2, e 5.2podem ser usadas para selecionar os códons a serem usadoscomo códons alterados. Alternativamente, o especialistaversado pode gerar várias tabelas distintas com virus deinteresse usando os métodos aqui descritos.

VIRUS DE PLANTA MONOCOTILEDÔNEA CODON-TENDENCIADO

Em alguns avanços, um virus vegetal ou virus queinfectam plantas monocotiledôneas são usados para gerarfreqüências de uso de códon. Com um exemplo não limitante,freqüências de uso de códon de virus planta monocotiledôneaforam determinadas por 173 seqüências codificadoras demoléculas de ácidos nucléicos de virus de plantamonocotiledônea (listadas na Tabela 1). As seqüênciasusadas compreendem, como a Tabela 2 indica, as freqüênciasde uso de códon determinadas a partir das seqüênciascodificadoras de moléculas de ácidos nucléicos dos virus demonocotiledôneas listadas na Tabela 1. As freqüências deuso de códon de virus de planta monocotiledônea listadas naTabela 2 pode ser usada para guiar a seleção de códons parao desenho de uma seqüência codificadora de molécula deácido nucléico de virus vegetal códon-tendenciadocodificando um polipeptideo a ser expressada em uma planta.

Seqüências virais podem ser obtidas a partir de qualquerfonte, e.g., base de dados de taxonomia Genbank e NCBI. Sea expressão do polipeptideo codificado pela molécula deácido nucléico compreendendo códons alterados é desejada emuma planta monocotiledônea, virus vegetais que infectammonocotiledôneas são usados, preferencialmente, para geraras freqüências de uso de códon (como, e.g., na Tabela 2).

Tabela 1: Virus de planta monocotiledônea e número deseqüências de cada para cálculo de freqüência de uso decódon.

<table>table see original document page 13</column></row><table><table>table see original document page 14</column></row><table>Tabela 2: Freqüências de uso de códon em vírus de plantamonocotiledônea.

<table>table see original document page 15</column></row><table><table>table see original document page 16</column></row><table>

Em avanços específicos, freqüências de uso de códonsão baseadas em um virus de planta monocotiledônea ou virusque infectam um tipo especifico de planta monocotiledônea(e.g., milho). Em um avanço especifico, freqüências de usode códon foram calculadas usando seqüências codificadorasde moléculas de ácidos nucléicos de virus de milho,caracterizado pelo fato de que as moléculas de ácidosnucléicos têm os seguintes números de acesso: CAA68570,CAA68567, CAA68566, CAA68568, CAA68569, CAA12314, CAA12315,CAA12316, CAA12317, CAA12318, CAA12319, CAA12320,NP_115454, NP_115455, AAB22541, AAB22542, AAB26111,AAP80680, AAP80681, AAA46635, AAA4663.6, AAA46637,NP_569138, NP_619717, NP_619718, NP_619719, NP_619720,NP_619721, NP_619722, AAB50194, AAB50195, CAA39227, eCAA39228 (Tabela 3) . Em outro avanço especifico,freqüências de uso de códon são calculadas para um subgrupodas moléculas de ácidos nucléicos de virus especifico demilho ou específicos. Moléculas de ácidos nucléicoscodificando polipeptideos de capa para virus específicos demilho (tendo os números de acesso CAA68566, AAP80681,AAA46637, e NP_619722) foram usadas para gerar a Tabela 4.Se a expressão do polipeptideo codificado pela molécula deácido nucléico compreendendo códons alterados é desejada emmilho, preferencialmente, são usados virus vegetais queinfectam milho para gerar as freqüências de uso de códon(como, e.g., nas Tabelas 3 e 4).Tabela 3: Freqüências de uso de códon de virus específicosde milho.

<table>table see original document page 17</column></row><table><table>table see original document page 18</column></row><table>Tabela 4: Freqüências de uso de códon de polipeptideo decapa de virus especifico de milho

<table>table see original document page 19</column></row><table><table>table see original document page 20</column></row><table>VÍRUS de planta dicotiledonea cgdon-tendenciado

Em alguns avanços, um virus vegetal ou vegetais queinfectam plantas dicotiledôneas são usados para gerarfreqüências de uso de códon. Como um exemplo nãolimitante, freqüências de uso de códon de virus de plantadicotiledonea foram determinada para 321 seqüênciascodificadoras de moléculas de ácidos nucléicos a partir devirus de planta dicotiledonea (listadas na Tabela 5) . ATabela 6 indica as freqüências de uso de códon determinadasa partir das seqüências codificadoras de moléculas deácidos nucléicos dos virus de dicotiledôneas listados naTabela 5. As freqüências de uso de códon de virus deplantas dicotiledôneas listadas na Tabela 6 podem serusadas para guiar a seleção de códons para desenho de umaseqüência codificadora de molécula de ácido nucléico devirus vegetal códon-tendenciado um polipeptideo para serexpressado em uma planta. Se a expressão do polipeptideocodificado pela molécula de ácido nucléico compreendendocódons alterados é desejada em uma planta dicotiledonea,são usados, preferencialmente, virus vegetais que infectamdicotiledôneas para gerar as freqüências de uso de códon(como, e.g., na Tabela 6) .

Em um avanço especifico, freqüências de uso de códonsão calculadas para um subgrupo das moléculas de ácidosnucléicos de um virus de planta dicotiledonea ou virus.Moléculas de ácidos nucléicos codificando polipeptideos decapa de um número de diferentes virus de plantasdicotiledôneas (listados na Tabela 7) foram usados paragerar a Tabela 8.

Em outro avanço específicos, freqüências de uso decódon são baseadas em um virus de planta dicotiledônea ouvirus que infectam um tipo especifico de plantadicotiledônea (e.g., soja). Se a expressão do polipeptideocodificado pela molécula de ácido nucléico compreendendocódons alterados é desejada em um tipo de planta emparticular (e.g., soja), são usados, preferencialmente,virus vegetais que infectam aquele tipo de planta (e.g.,virus específicos de soja) para gerar as freqüências de usode códon.

Tabela 5: Virus de Plantas Dicotiledônea e Número deSeqüências de Cada Usadas para o Cálculo de Freqüência deUso de Códon.<table>table see original document page 23</column></row><table>Tabela 6: Freqüências de Uso de Códon de Virus de PlantasDicotiledôneas.

<table>table see original document page 24</column></row><table><table>table see original document page 25</column></row><table>Tabela 7: Vírus de Plantas Dicotiledônea e Número deSeqüências de Polipeptideo de Capa de Cada Usadas para oCálculo de Freqüência de Uso de Códon.

<table>table see original document page 26</column></row><table><table>table see original document page 27</column></row><table>Tabela 8: Freqüências de Uso de Códon de Polipeptideo deCapa de Virus de Plantas Dicotiledôneas

<table>table see original document page 28</column></row><table><table>table see original document page 29</column></row><table>CRITÉRIOS PARA SELECIONAR CODONS

Uma vez que as freqüências de uso de códon sãocalculadas para o virus em particular, grupo de virus, ousubgrupo de moléculas de ácidos nucléicos desses, códonspodem ser escolhidos para uso como códons alterados usandouma variedade de critérios. Deveria ser considerado queexistem critérios adicionais que não são baseados emfreqüências de uso de códon que podem afetar o desenhofinal da molécula de ácido nucléico (ver Seção 5.3) .

CRITÉRIO DE VALOR DE FREQÜÊNCIA AUMENTADO

Em um avanço, qualquer códon que possui uma maiorfreqüência de uso no virus vegetal ou vegetais, ou subgrupode moléculas de ácidos nucléicos desses usadas para criar atabela de freqüência de uso de códon do que o códonatualmente na molécula de ácido nucléico a ser projetada, éescolhido como um códon alterado. Por exemplo, se umamolécula de ácido nucléico, a ser projetada de acordo comos métodos de virus vegetais códon-tendenciados dainvenção, tem uma alanina que é codificada pelo códon GCG,aquele códon poderia ser modificado para um códon que émais freqüentemente usado em virus vegetais. Usando, e.g.,Tabela 2, um especialista na arte pode ver que quaisqueroutros três códons para alanina (e.g., GCA, GCC, ou GCT)são mais freqüentemente usados em virus vegetais e, assim,poderiam ser usados como o códon alterado. Deveria serconsiderado que isto não é necessário para escolher o códonque é mais freqüentemente usado em virus vegetais como ocódon alterado. Ao invés, é apenas necessário que o códonalterado tenha uma freqüência de uso maior no virusvegetal, virus vegetais, ou moléculas de ácidos nucléicosdesses, do que o códon originalmente presente na moléculade ácido nucléico.

CRITÉRIO DO VALOR MEDIANO

Em outro avanço, um códon alterado tem uma freqüênciade uso de códon no virus vegetal, virus vegetais, oumoléculas de ácidos nucléicos desses usados para criar atabela de freqüência de uso de códon que é igual a ou maiordo que a freqüência de uso de códon mediana para aqueleaminoácido em particular. O valor mediano para freqüênciasde uso de códon para um dado tipo de aminoácido édeterminado primeiro, ordenando todos os códons quecodificam aquele códon de aminoácido particular dos maisfreqüentemente usados aos menos freqüentemente usados.

Para casos onde existe um número impar de códonscodificando um tipo de aminoácido em particular, afreqüência de uso de códon mediana é aquela que tem umnúmero igual de códons usados mais freqüentemente e menosfreqüentemente do que a próprio. Por exemplo, isoleucina écodificada por três códons. Para encontrar o valor medianode freqüências de uso de códon, deve-se encontrar o códoncom um número igual de códons usados mais freqüentemente emenos freqüentemente do que o próprio (nesse caso ATAquando usando as freqüências listadas na Tabela 2). Quandoprojetando uma molécula de ácido nucléico, códons alteradospoderiam ser selecionados com freqüências de uso de .3 oumaiores para isoleucina.

Para casos onde existe um número par de códonscodificando . um tipo de aminoácido em particular, afreqüência de uso de códon mediana é a média dasfreqüências de uso de códon para os dois códons que têm umnúmero igual de códons usados mais freqüentemente e menosfreqüentemente do que os próprios. Por exemplo, alanina écodificada por quatro códons. Para encontrar o valormediano de freqüências de uso de códon, deve-se ordenar oscódons do mais freqüentemente usado ao menos freqüentementeusado (nesse caso GCT, GCA, GCC, GCG quando usando asfreqüências listadas na Tabela 2) . Como GCA e GCC têm umnúmero igual de códons usados mais freqüentemente e menosfreqüentemente do que os próprios, a média de seus valoresde freqüência é a freqüência de uso de códon mediana (i.e.,a média de.31 e .21 é .26). Quando projetando uma moléculade ácido nucléico, códons alterados poderia serselecionados com freqüências de uso de .26 ou maiores paraalanina.

Esse método leva a seqüência codificadora da moléculade ácido nucléico à tendência em direção ao uso de códonsque são mais freqüentemente usados em seqüênciascodificadoras de moléculas de ácidos nucléicos de virusvegetais, apesar de não necessariamente o códon único maisfreqüentemente usado, enquanto minimizando o uso de códonsque são menos freqüentemente usados (i.e., aqueles cujafreqüência de uso de códon cai abaixo da freqüência de usode códon mediana para um dado tipo de aminoácido).

A Tabela 9 indica os valores medianos para asfreqüências de uso de códon de virus de plantasmonocotiledôneas listadas na Tabela 2 e os códons que seencaixam nesse critério para cada tipo de aminoácido(chamados códons selecionáveis) baseado em suas freqüênciasde uso.

A Tabela 10 indica os valores medianos para asfreqüências de uso de códon de virus especifico de milholistadas na Tabela 3 e os códons que se encaixam nessecritério para cada tipo de aminoácido baseado em suasfreqüências de uso.

A Tabela 11 indica os valores medianos para asfreqüências de uso de códon de capa de virus especifico demilho listadas na Tabela 4 e os códons que se encaixamnesse critério para cada tipo de aminoácido baseado em suasfreqüências de uso.

A Tabela 12 indica os valores medianos para asfreqüências de uso de códon de virus de plantasdicotiledôneas listadas na Tabela 6 e os códons que seencaixam nesse critério para cada tipo de aminoácido.Tabela 13 indica os valores medianos para asfreqüências de uso de códon de polipeptideo de capa devirus de dicotiledônea listadas na Tabela 8 e os códons quese encaixam nesse critério para cada tipo de aminoácidobaseado em suas freqüências de uso.

Tabela 9: Possíveis códons selecionáveis baseados emvalores medianos de freqüências de uso de códon de virus deplantas monocotiledôneas

<table>table see original document page 34</column></row><table><table>table see original document page 35</column></row><table><table>table see original document page 36</column></row><table><table>table see original document page 37</column></row><table><table>table see original document page 38</column></row><table>

Tabela 11: Possíveis códons selecionáveis baseados emvalores medianos de freqüências de uso de códon depolipeptideo de capa de virus especifico de milho

<table>table see original document page 38</column></row><table><table>table see original document page 39</column></row><table><table>table see original document page 40</column></row><table>Tabela 12: Possíveis códons selecionáveis baseados emvalores medianos de freqüências de uso de códon de virus deplantas dicotiledôneas

<table>table see original document page 41</column></row><table><table>table see original document page 42</column></row><table>Tabela 13: Possíveis códons selecionáveis baseados emvalores medianos de freqüências de uso de códon depolipeptideo de capa de virus de plantas dicotiledôneas

<table>table see original document page 43</column></row><table><table>table see original document page 44</column></row><table>CRITÉRIO DE CORRESPONDÊNCIA DE FREQÜÊNCIA

Em outro avanço, códons alterados são selecionados deforma que a molécula de ácido nucléico resultantecompreendendo códons alterados tenha uma freqüência de usopara um tipo de aminoácido em particular que seja a mesmaou substancialmente similar à freqüência de uso de códon novirus vegetal, virus vegetais, ou moléculas de ácidosnucléicos desses, usadas para criar a tabela de freqüênciade uso de códon (tais como, e.g., aquelas nas Tabelas 2, 3,4, 6, ou 8) para aquele aminoácido. Por exemplo, umamolécula de ácido nucléico projetada de acordo com osmétodos da invenção poderia compreender códons alterados deforma que todo de um aminoácido em particular (e.g.,glicina) seja codificado por códons em freqüências quesejam as freqüências de uso de códon de virus vegetal ousubstancialmente similares (usando, e.g., glicina da Tabela2 seria codificada por GGA, GGT, GGC, GGG a freqüências de.37, .28, .20, e .14, respectivamente).

Freqüências de uso de códon podem ser correspondidas,dessa maneira, para freqüências de uso de códon no virusvegetal, virus vegetais, ou moléculas de ácidos nucléicosdesses usadas para criar a tabela freqüência de uso decódon par um ou mais tipos de aminoácidos. Qualquer númerode tipos de aminoácidos pode ser alterado para ser a mesmaou freqüências de códon de virus vegetais substancialmentesimilares. Em avanços específicos, pelo menos 2 tipos deaminoácidos, pelo menos 5 tipos de aminoácidos, pelo menos8 tipos de aminoacidos, pelo menos 12 tipos de aminoacidos,pelo menos 18 tipos de aminoacidos, ou todo os 20 tipos deaminoacidos biologicamente ocorrentes são codificados porcódons que são a freqüência ou são substancialmentesimilares à freqüência ou mais virus vegetais ou umsubgrupo de moléculas de ácidos nucleicos desses.

CRITÉRIO DE LIMITE MÍNIMO

Em outro avanço, códons de virus vegetais para osquais a freqüência de uso no virus vegetal, virus vegetais,ou moléculas de ácidos nucleicos desses usada para criar afreqüência de uso de códon tabela é 0,09 ou menor, sãoeliminados como possíveis códons alterados. Esseprocedimento elimina de consideração códons para os quaisuma freqüência de uso em virus vegetais é muito baixa (0,09ou menos) e, assim, improvável de serem traduzidoseficientemente em plantas. Qualquer códon que codifique omesmo aminoácido com uma freqüência de uso maior que 0,09pode ser usado como um códon alterado para substituir ocódon de baixa freqüência. Em avanços específicos, Oscódons remanescentes com freqüências de uso maiores que0,09 são substituídos de uma maneira que mantenha aproporcionalidade entre os códons remanescentes.

A Tabela 14 mostra freqüências de uso de códon paravirus de plantas monocotiledôneas onde aqueles códons comfreqüências de 0,09 ou menos(de acordo com a Tabela 2)foram eliminados e os códons remanescentes foram ajustadosproporcionalmente para cada tipo de aminoácido.

A Tabela 15 apresenta freqüências de uso de códon paraos polipeptideos de capa de virus especifico de milho ondeaqueles códons com freqüências de 0,09 ou menos (de acordocom a Tabela 4) foram eliminados e os códons remanescentesforam ajustados proporcionalmente para cada tipo deaminoácido.

A Tabela 16 apresenta freqüências de uso de códon paraos virus de plantas dicotiledôneas onde aqueles códons comfreqüências de 0,09 ou menos (de acordo com a Tabela 6)foram eliminados e os códons remanescentes foram ajustadosproporcionalmente para cada tipo de aminoácido.

A Tabela 17 shows freqüências de uso de códon para ospolipeptideos de capa de virus de plantas dicotiledôneasonde aqueles códons com freqüências de 0,09 ou menos (deacordo com a Tabela 8) foram eliminados e os códonsremanescentes foram ajustados proporcionalmente para cadatipo de aminoácido.

Por exemplo, na Tabela 14, existe um único códon, parao aminoácido arginina, CGG, para o qual a freqüência de usode códon original não é maior do que 0,09. A freqüência deuso de códon para CGG é, portanto, ajustada para 0,00, e ovalor de 0,09 é redistribuído entre as freqüências doscódons AGA, AGG, CGA, CGC, e CGT remanescentes, naproporção de suas freqüências de uso de códon originais,como indicado. Todas as freqüências de uso de códon paraseqüências codificadoras de moléculas de ácidos nucléicosde virus especifico de milho listadas na Tabela 3 sãomaiores do que 0,09, e, portanto, as freqüências de uso decódon para seqüências codificadoras de moléculas de ácidosnucléicos de virus específicos de milho permanece a mesmasob o critério de 0,09.

Tabela 14: Freqüências de uso de códon de virus de plantamonocotiledônea após eliminar códons com uma freqüência deuso de < 0.09 e ajustar, proporcionalmente, as freqüênciasde uso de códon remanescentes.

<table>table see original document page 48</column></row><table><table>table see original document page 49</column></row><table><table>table see original document page 50</column></row><table><table>table see original document page 51</column></row><table><table>table see original document page 52</column></row><table>

Tabela 16: Freqüências de uso de códon de vírus de plantasdicotiledôneas, após eliminar códons com uma freqüência deuso de < 0,09 e ajustar, proporcionalmente, as freqüênciasde uso de códon remanescentes.<table>table see original document page 53</column></row><table><table>table see original document page 54</column></row><table>

Tabela 17: Freqüências de uso de códon de capa de virus deplantas dicotiledôneas, após eliminar códons com umafreqüência de uso de < 0,09 e ajustar, proporcionalmente,as freqüências de uso de códon remanescentes.<table>table see original document page 55</column></row><table><table>table see original document page 56</column></row><table>CRITÉRIO DE CORTE DE LIMITE MEDIANO

Em outro avanço, códons de virus vegetais para osquais a freqüência de uso no virus vegetal, virus vegetais,ou moléculas de ácidos nucléicos desses, usada para criar atabela de freqüência de uso de códon é menor do que afreqüência de uso de códon mediana, são eliminados comopossíveis códons alterados (ver Seção 5.2.2 para cálculo dafreqüência de uso mediana). Qualquer códon que codifique omesmo aminoácido com uma freqüência de uso igual ou maiordo que a mediana para aquele aminoácido em particular podeser usado como um códon alterado para substituir o códon.Em avanços específicos, os códons remanescentes comfreqüências de uso iguais ou maiores do que a mediana sãosubstituídos de uma maneira que mantenha aproporcionalidade entre os códons remanescentes.

A Tabela 18 mostra freqüências de uso de códon paravirus de plantas monocotiledôneas, onde aqueles códons comfreqüências menores que a mediana (de acordo com a Tabela

2) foram eliminados e os códons remanescentes foramajustados proporcionalmente para cada tipo de aminoácido.

A Tabela 19 mostra freqüências de uso de códon para osvirus específicos de milho, onde aqueles códons comfreqüências menores que a mediana (de acordo com a Tabela

3) foram eliminados e os códons remanescentes foramajustados proporcionalmente para cada tipo de aminoácido.A Tabela 20 mostra freqüências de uso de códon para ospolipeptideos de capa de virus específicos de milho, ondeaqueles códons com freqüências menores que a mediana (deacordo com Tabela a 4) foram eliminados e os códonsremanescentes foram ajustados proporcionalmente para cadatipo de aminoácido.

A Tabela 21 mostra freqüências de uso de códon paravirus de plantas dicotiledôneas, onde aqueles códons comfreqüências menores que a mediana (de acordo com a Tabela6) foram eliminados e os códons remanescentes foramajustados proporcionalmente para cada tipo de aminoácido.

A Tabela 22 mostra freqüências de uso de códon para ospolipeptideos de capa de virus de dicotiledônea, ondeaqueles códons com freqüências menores que a mediana (deacordo com a Tabela 8) foram eliminados e os códonsremanescentes foram ajustados proporcionalmente para cadatipo de aminoácido.

Tabela 18: Freqüências de uso de códon de virus de plantamonocotiledônea, após eliminar códons com uma freqüência deuso menor do que a mediana e ajustar, proporcionalmente, asfreqüências de uso de códon remanescentes.

<table>table see original document page 58</column></row><table><table>table see original document page 59</column></row><table><table>table see original document page 60</column></row><table>Tabela 19: Freqüências de uso de códon de virus de milho,após eliminar códons com uma freqüência de uso menor do quea mediana e ajustar, proporcionalmente, as freqüências deuso de códon remanescentes.

<table>table see original document page 61</column></row><table><table>table see original document page 62</column></row><table><table>table see original document page 63</column></row><table>

Tabela 20: Freqüências de uso de códon de capa de virus demilho, após eliminar códons com uma freqüência de uso menordo que a mediana e ajustar, proporcionalmente, asfreqüências de uso de códon remanescentes.

<table>table see original document page 63</column></row><table><table>table see original document page 64</column></row><table><table>table see original document page 65</column></row><table>Tabela 21: freqüências de uso de códon de vírus de plantasdicotiledôneas, após eliminar códons com uma freqüência deuso menor do que a mediana e ajustar, proporcionalmente, asfreqüências de uso de códon remanescentes.

<table>table see original document page 66</column></row><table><table>table see original document page 67</column></row><table><table>table see original document page 68</column></row><table><table>table see original document page 69</column></row><table><table>table see original document page 70</column></row><table>MODIFICAÇÕES NÃO BASEADAS EM VÍRUS VEGETAL CÓDON-TENDENCIADO

No desenho de seqüências codificadoras de moléculas deácidos nucléicos códon-tendenciadas de virus vegetais deacordo com a presente invenção, após a seleção de códonbaseada nos critérios ilustrados acima, modificações deseqüência de nucleotideos adicionais pode ser feitas parai) diminuir uma característica desfavorável da molécula deácido nucléico e/ou ii) aumentar mais a expressão de umpolipeptideo codificado por uma seqüência codificadora damolécula de ácido nucléico códon-tendenciada de virusvegetal. Assim, apesar das moléculas de ácidos nucléicosprojetadas usando os métodos da invenção poderem nãocompreender todos os códons otimizados devido aconsiderações listadas abaixo, elas serão enriquecidas emcódons que são mais freqüentemente usados em virus vegetaisdo que uma molécula de ácido nucléico não-alterada.

Preferencialmente, a modificação não baseada emcódon-tendenciado não altera qualquer aminoácido que sejacodificado pela molécula de ácido nucléico. Em avançosonde um aminoácido é modificado devido a modificações nãobaseadas em códon-tendenciado. na molécula de ácidonucléico, tal mudança deveria, preferencialmente, manterpelo menos algumas das propriedades do aminoácido original(e.g., carga, tamanho, etc.)Em um avanço, o contexto Kozak é modificado. 0contexto Kozak é a seqüência de nucleotideos próxima docódon ATG de iniciação. Em milho e vários cereais, ocontexto Kozak preferido é ATGG. Essa quarta base daseqüência codificadora da molécula de ácido nucléico éditada pelo segundo aminoácido codificado. Se já presente,nenhuma mudança é necessária. Para criar um contexto KozakATGG (otimização Kozak) se ele não existe, contudo, poderequerer uma mudança no segundo aminoácido. Empolipeptideos que são processados no terminal N, tais comotendo seu peptideo de trânsito de terminal N removido, issonão afetaria a função do polipeptideo maduro. A abordagempreferida é mudar o segundo aminoácido para um que tenha umcódon G inicial, e que seja o mais quimicamente similardentre tais aminoácidos como códons G iniciais, contudo emavanços nos quais o segundo aminoácido é alterado isso éimportante para se ter certeza de que o polipeptideoretenha propriedades criticas (e.g. atividade enzimática,antigenicidade, etc.).

Em outro avanço, seqüências tipo intron criadas poradição dos códons alterados são abolidas. Quandoselecionando códons para uma seqüência codificadora damolécula de ácido nucléico de virus vegetal códon-tendenciado, pode-se inadvertidamente introduzir uma oumais seqüências intrônicas potencialmente funcionais. Naexpressão do transcrito codificado nas células, essesintrons podem ser cortados, causando uma deleção interna deuma porção da região codificadora ou deslocamento de quadrode leitura. Conseqüentemente, é desejável eliminarquaisquer sitios que são altamente prováveis de seremintrônicas. Sitios intron splice-doadores geralmenteseguem a regra GT-AG. Em uma dada seqüência codificadorada molécula de ácido nucléico, é provável de existiremvários sitios GT e AG e, assim, vários introns empotencial. Contudo, nem todas essas combinações GT-AG sãoprováveis de revelar um intron funcional.

Software de previsão gênica foi desenvolvido de formaa usar sofisticados heurísticos para decidir quais sequaisquer combinações GT-AG em potencial representamprováveis sitios intron splice-doadores. Ver, por exemplo,Brendel et al. (2004) Bioinformatics. 20(7):1157-69;Hermann et al. (1996) Nucl. Acids Res. 24(23): 4709-4718;Brendel et al. (1998) Nucl. Acids Res. 26(20): 4748-4757;üsuka et al. (2000) Bioinformatics 16(3), 203-211; Usuka etal. (2000) J. Mol. Biol. 297(5): 1075-1085, aquiincorporados por referência. Programas, tal como GeneSeqr,são particularmente úteis. GeneSeqr foi desenvolvido porVolker Brendel na ISU. O resultado do programa GeneSeqrindica se existem qualquer sitios intron altamenteprováveis na seqüência codificadora da molécula de ácidonucléico. Informações acerca do programa GeneSeqr a ainterpretação de seu resultado podem ser encontrados naarte (e.g., Schlueter et al., 2003, Nucl. Acids Res.31:3597-3600). Outro programa que pode ser usado para essepropósito é FgenesH. Usar mais do que uma eliminação deprograma de todos os sitios splice criticos é maisprovável. Remover esses introns em potencial pode serfeito mudando-se tanto as seqüências GT ou AG adjacentesaos introns. Isso pode ser feito de tal maneira, sepossível, de forma a não afetar o uso de aminoácidos.

Outra abordagem para efetuar a remoção desses sitios splicecriticos é mudar nucleotideos adjacentes no lado intrônicoputativo das fronteiras de sitios splice criticos.

Em outro avanço, seqüências que codificam um sinalputativo de poliadenilação são modificadas para prevenirpoliadenilação espuriosa na seqüência codificadora damolécula de ácido nucléico. Tais sitios incluem asseguintes seqüências: AATAAA, ATAAAA, e AATAAT.

Em outro avanço, estruturas de RNA secundário sãodiminuídas ou eliminadas. Transcritos que formamestruturas de RNA hairpin podem ser mais prováveis de seremvisadas para degradação e/ou captura de tradução.

Conseqüentemente, é desejável sujeitar a seqüênciacodificadora da molécula de ácido nucléico a um programa deprevisão de estrutura secundária de RNA e, então, romperquaisquer estruturas de RNA previstas por serem nãousualmente estáveis por alterar a seqüência. Qualquerprograma de previsão de estrutura secundária de RNAconhecido na arte pode ser usado. Um programa comumenteusado é o pacote de programa STEMLOOP da GCG Wisconsin.

Esse programa é desejável porque ele ranqueia as estruturasstem-loop da maior para a menor probabilidade de formar umestrutura secundária (essencialmente a partir decomprimento e qualidade) , e fornece suas coordenadas naseqüência. Dentre os resultados de saida, deve-se olharpor quaisquer estruturas previstas de RNA destacadas quesão incomumente longas e de alta qualidade. Essas devemser rompidas por trocas de base, freqüentemente na terceiraposição (posição "wobble") de códons, de forma a não mudasa seqüência de aminoácidos.

Em outro avanço, seqüências que diminuem aestabilidade de RNA são modificadas. Certos motivos deseqüência são conhecidos por desestabilizar o RNAm e são,portanto, apontadas e eliminadas onde possivel. Em umavanço especifico, seqüências "AUUUA" podem levar a umataxa aumentada de degradação de RNAm. Sendo assim, asseqüências codificadoras de moléculas de ácidos nucléicosde virus vegetal códon-tendenciado da invenção podem serprocuradas por quaisquer seqüências que são "ATTTA", eessas podem ser alteradas sem mudar a seqüência deaminoácidos, se possivel.

Em outro avanço especifico, a presença de sitios de"Elemento Abaixo" ("Downstream Element") (DST)desestabilizantes de RNAm pode dispor transcritos de RNAmna direção de degradação e alta renovação. Os elementosDST seguem o padrão geral de ATAGAT-N(15)-GTA. Seqüênciasseguindo o padrão ATAGAT-N(10-20)-GTA podem ser eliminadas.

Em outro avanço especifico, seqüências poli-A ou poli-T longas podem contribuir para instabilidade de RNAm.Conseqüentemente, trechos longos de um nucleotídeo,especialmente trechos longos de As ou Ts, deveriam seralterados. Trechos de três ou mais do mesmo nucleotideosão apontados para mitigação, contudo, maispreferencialmente, trechos de quatro ou mais sãomodificados. Adicionalmente, trechos de seqüências ricasem AT podem ser também modificados.

Em outro avanço, a molécula de ácido nucléico émodificada de forma que o polipeptideo de interesse é oúnico polipeptideo expressados a partir da molécula deácido nucléico. É desejável que um transgene expresseapenas o produto gênico desejado a partir do quadro deiniciação de leitura desejado (ORF), o qual será o quadrode tradução 1. Produtos polipeptidicos espuriosos surgindode qualquer das outras 5 traduções de quadro não sãodesejados, portanto a molécula de ácido nucléico dainvenção pode ser alterada de forma que a possibilidade detradução espuriosa de ORF é mitigada. A molécula de ácidonucléico projetada usando os métodos da invenção é sujeitaa uma análise de previsão de ORF de 6-quadros. Oscomprimentos dos ORFs nos cinco quadros não pretendendocodificar um polipeptideo podem ser medidos. Aqueles ORFs,particularmente aqueles com códon de inicio potencial demetionina (i.e. próximo à seqüência consenso de Kozak) eaqueles nos quadros 2 e 3 que são particularmente longos(tal como mais longos do que 50-100 códons ou qualquer queseja o limite de corte desejado) deveriam ser encurtadospor introdução de códons de parada ou remoção de códons deiniciação potenciais.

Em outro avanço, sitios de reconhecimento de enzima derestrição podem ser adicionados à molécula de ácidonucleico.

DESENHO DE MOLÉCULAS DE ÁCIDOS NUCLÉICOS CÓDON-TENDENCIADAS

A presente invenção engloba moléculas de ácidosnucléicos projetadas de acordo com os métodos da invenção.Moléculas de ácidos nucléicos codificando polipeptideos deinteresse para expressão em plantas podem ser projetadaspara expressão melhorada em plantas de acordo com osmétodos da presente invenção. Uma vez que as tabelas defreqüência de uso de códon são geradas para o virus emparticular, grupo de virus, ou subgrupo de moléculas deácidos nucléicos desses, de interesse, os códonsoriginalmente presentes na molécula de ácido nucleico podemser avaliados por seus valores de freqüência se comparado avirus vegetais. Os critérios de acordo com a Seção 5.2 sãousados para escolher quais códons podem ser modificados equais códons podem ser substituídos (e.g., códonsalterados) por eles. Moléculas de ácidos nucléicoscompreendendo códons alterados incluem 5%, 10%, 20%, 30%,50%, 75%, 85%, 95% de códons alterados relativo à moléculade ácido nucleico inalterada (original). Contudo,freqüências de uso de códon não são o critério único paramodificação de molécula de ácido nucleico (ver Seção 5.3).

Qualquer códon na molécula de ácido nucleico pode sersubstituído por um códon alterado que tenha uma maiorfreqüência de uso em virus vegetais. Em alguns avanços, oscódons alterados são "carregados anteriormente", i.e., onúmero de códons alterados é maior na primeira porção damolécula de ácido nucleico do que na segunda porção damolécula de ácido nucleico, caracterizado pelo fato de quea primeira porção está 5' à segunda porção. Em um avançomais especifico, a primeira porção e segunda porção damolécula de ácido nucleico são iguais, assim, existem maiscódons alterados na metade 5' da molécula de ácidonucleico. Em outro avanço especifico, a primeira porção éum terço da molécula de ácido nucleico e compreende umnúmero igual ou mais códons alterados do que a segundaporção que é dois terços da molécula de ácido nucleico.Assim, o terço 5' da molécula de ácido nucleico tem o mesmonúmero ou mais de códons alterados do que os dois terços3'. Em outro avanço especifico, a primeira porção é umquarto da molécula de ácido nucleico e compreende um númeroigual ou mais códons alterados do que a segunda porção queé três quartos da molécula de ácido nucleico. Assim, oquarto 5' da molécula de ácido nucleico tem o mesmo númeroou mais códons alterados do que os três quartos 3'.

Preferencialmente, moléculas de ácidos nucléicoscompreendendo códons al terados codificam um polipeptideocom uma seqüência que idêntica àquela de um polipeptideocodificado por uma molécula de ácido nucléico inalterada.

Em avanços onde a molécula de ácido nucléico compreendendocódons alterados codifica um polipeptideo que não éidêntico em seqüência a um polipeptideo inalterado, osaminoácidos alterados são preferencialmente substituiçõesconservativas. Técnicas padrão conhecidas daquelesespecialistas na arte pode ser usadas para testar quaisquerdiferenças em função do polipeptideo entre um polipeptideocom substituições de aminoácidos devido a alteração decódon e um polipeptideo codificado por uma molécula deácido nucléico inalterada. Preferencialmente, não existemmudanças na função do polipeptideo. Contudo, alteraçõesleves em função são toleráveis se tais polipeptideos têmfunções substancialmente similares (e.g., estão no desviopadrão um do outro).

Em um avanço especifico, as moléculas de ácidosnucléicos da invenção codificam polipeptideos inseticidas.

Em um avanço mais especifico, os polipeptideos inseticidassão de Bacillus thuringiensis ou Rhyzopus oryzae. Em umavanço ainda mais especifico, os polipeptideos inseticidasde Bacillus thuringiensis são os polipeptideos 437N e Cry.

Em outro avanço mais especifico, o polipeptideo inseticidade Rhyzopus oryzae é um polipeptideo lipase inseticida. Apresente invenção engloba moléculas de ácidos nucléicosprojetadas de acordo com os métodos incluindo, mas nãolimitando-se a, SEQ ID NOS: 1 e 3 que codificam 437N códonotimizado e lipase inseticida, respectivamente.Polipeptideos codificado pelas moléculas de ácidosnucléicos da invenção são também englobados pela invençãoincluindo, mas não limitando-se a, SEQ ID NOS:2 e 4 que são437N códon otimizado e lipase inseticida , respectivamente.

Também englobados pela presente invenção são vetores,células hospedeiras, plantas transgênicas e progênie dessacompreendendo moléculas de ácidos nucléicos feitas deacordo com os métodos da invenção.

A presente invenção não engloba moléculas de ácidosnucléicos que codificam moléculas de ácidos nucléicosnaturalmente ocorrentes (e.g., aquelas encontradas nanatureza e expressadas a partir dos genomas de organismosnão transgênicos). A presente invenção também não englobamoléculas de ácidos nucléicos das SEQ ID NOS: 7-16.

CONSTRUÇÃO DE MOLÉCULAS DE ÁCIDOS NUCLÉICOS CODON-TENDENCIADAS

As moléculas de ácidos nucléicos a serem alteradas deacordo com os métodos da invenção podem ser obtidas, e suaseqüência de nucleotideos determinadas, por qualquer métodoconhecido na arte. Tal molécula de ácido nucléico pode serreunida a partir de oligonucleotideos quimicamentesintetizados (e.g., como descrito em Kutmeier et al., 1994,BioTechniques 17:242), que, resumidamente, envolve asintese de oligonucleotideos sobrepostos contendo porçõesda seqüência codificando o polipeptideo, recozimento eligação daqueles oligonucleotideos e, então, amplificaçãodos oligonucleotideos ligados por PCR. Alternativamente,uma molécula de ácido nucléico pode ser gerada a partir damolécula de ácido nucléico de uma fonte adequada. Se umclone contendo uma molécula de ácido nucléico codificandoum polipeptideo em particular não está disponível, mas aseqüência do polipeptideo é conhecida, uma molécula deácido nucléico codificando o polipeptideo pode sersintetizada quimicamente ou obtida de uma fonte adequada(e.g., uma biblioteca de DNAc gerada do, ou molécula deácido nucléico, preferencialmente RNA, poli A+, isolado de,qualquer tecido ou células expressando o polipeptideo deinteresse) por amplificação por PCR usando primerssintéticos hibridizáveis às extremidades 3' e 5' daseqüência ou por clonagem usando uma sonda deoligonucleotideo especifica para a seqüência em particularpara identificar, e.g., um clone de DNAc de uma bibliotecade DNAc que codifica o polipeptideo de interesse.

Moléculas de ácidos nucléicos amplificadas geradas por PCRpodem, então, ser clonadas em vetores de clonagemreplicáveis usando qualquer método nem conhecido na arte.

Uma vez que a molécula de ácido nucléico é contida,ela pode ser manipulada usando métodos bem conhecidos naarte para a manipulação de seqüências de nucleotideos,e.g., técnicas de DNA recombinante, mutagênese sitio-direcionada, PCR, etc. (ver, por exemplo, as técnicasdescritas em Sambrook et al., 1990, Molecular Cloning, ALaboratory Manual, 2d Ed., Cold Spring Harbor Laboratory,Cold Spring Harbor, NY; Ausubel et al., eds., 1998, CurrentProtocols irr Molecular Biology, John Wiley & Sons, NY; U.S.Patent Nos: 5.789.166 e 6.391.548) para gerar as moléculasde ácidos nucléicos compreendendo códons alterados.

Técnicas padrão conhecidas daqueles especialistas na artepodem ser usadas para introduzir mutações na seqüência denucleotideos, ou fragmento, dessas, . incluindo, e.g.,mutagênese sitio-direcionada e mutagênese mediada por PCR,de forma que códons são alterados para aqueles códons tendouma freqüência maior de uso em virus vegetais.

Preferencialmente, as moléculas de ácidos nucléicoscompreendendo códons alterados incluem 5%, 10%, 20%, 30%,50%, 75%, 85%, 95% de códons alterados relativo à moléculade ácido nucléico inalterada (original).

Preferencialmente, moléculas de ácidos nucléicoscompreendendo códons alterados codificam um polipeptideocom uma seqüência que é idêntica àquela de um polipeptideocodificado por uma molécula de ácido nucléico inalterada.

Em avanços onde a molécula de ácido nucléico compreendendocódons alterados codifica um polipeptideo que não idênticoem seqüência a um polipeptideo inalterado, os aminoácidosalterados são preferencialmente substituiçõesconservativas. Técnicas padrão conhecidas daquelesespecialistas na arte pode ser usadas para testar quaisquerdiferenças na função de polipeptideo entre um polipeptideocom substituições de aminoácidos devido a alteração decódon e um polipeptideo codificado por uma molécula deácido nucléico inalterada. Preferencialmente, não existemmudanças na função do polipeptideo. Contudo, alteraçõesleves em função são toleráveis se tais polipeptideos têmfunções substancialmente similares (e.g., estão no desviopadrão um do outro).

Uma vez que a molécula de ácido nucléico foi projetadae obtida, um vetor compreendendo a molécula de ácidonucléico pode ser produzido por tecnologia de DNArecombinante usando técnicas bem conhecidas na arte.Métodos que são bem conhecidos daqueles especialistas naarte podem ser usados para construir vetores, incluindovetores de expressão, contendo moléculas de ácidosnucléicos compreendendo códons alterados operacionalmenteligados a sinais de controle de transcrição e traduçãoapropriados.

Em alguns avanços, moléculas de ácidos nucléicos dainvenção estão em vetores de expressão. Em outros avanços,moléculas de ácidos nucléicos da invenção estão em vetoresfeitos para facilitar a integração no DNA vegetal. Vetorescompreendendo moléculas de ácidos nucléicos da invençãopodem compreender, também aquelas regiões que iniciam outerminam a transcrição e/ou tradução. Os elementos dessasregiões podem ser naturalmente ocorrentes (tantoheterólogos ou nativos à célula vegetal hospedeira) ousintéticos.

Um número de promotores pode ser usado na prática dainvenção. Por exemplo, uma molécula de ácido nucléico dainvenção pode ser combinada com promotores constitutivos,preferenciais de tecido, induzidos, ou outros promotorespara expressão no organismo hospedeiro. Em um avanço, opromotor é um promotor constitutivo incluindo, mas nãolimitando-se ao, promotor núcleo do promotor Rsyn7 e outrospromotores constitutivos descritos em WO 99/43838 e U.S.Patent No. 6.072.050; o promotor núcleo CaMV 35S (Odell etal. (1985) Nature 313:810-812); de. actina de.arroz (McElroyet al. (1990) Plant Cell 2:163-171); ubiquitina(Christensen et al. (1989) Plant Mol. Biol. 12:619-632 eChristensen et al. (1992) Plant Mol. Biol. 18:675-689);pEMU (Last et al. (1991) Theor. Appl. Genet. 81:581-588);MAS (Velten et al. (1984) EMBO J. 3:2723-2730); promotorALS (U.S. Patent No. 5.659.026), e similares. Outrospromotores constitutivos incluem, por exemplo, aquelesdiscutidos nas U.S. Patent Nos. 5.608.149; 5.608.144;5.604.121; 5.569.597; 5.466.785; 5.399.680; 5.268.463;5.608.142; e 6.177.611.

Em outro avanço, o promotor é um promotor induzidoincluindo, mas não limitando-se a, promotores induzidospor ferimento (tais como aqueles promotores associados com,e.g., gene inibidor de polipeptidase de batata, wunl, wun2,winl, win2, sistemina, WIP1, gene MPI); promotoresinduzidos por patógenos (tais como aqueles promotoresassociados com, e.g., polipeptideos relacionados compatogêneses, polipeptideos SAR, beta-1,3-glucanase,quitinase, gene PRms (ver Redolfi et al. (1983) Neth. J.Plant Pathol. 89:245-254; Uknes et al. (1992) Plant Cell4:645-656; e Van Loon (1985) Plant Mol. Virol. 4:111-116,WO 99/43819, Cordero et al. (1992) Physiol. Mol. PlantPath. 41:189-200, U.S. Patent No. 5.750.386)); promotoresregulados quimicamente (tais como aqueles promotoresassociados com, e.g., promotor In2-de milho, promotor GSTde milho, promotor PR-la de tabaco (ver também Schena etal. (1991) Proc. Natl. Acad. Sei. USA 88:10421-10425;McNellis et al. (1998) Plant J. 14 (2):247-257); Gatz et al.(1991) Mol. Gen. Genet. 227:229-237, e U.S. Patent Nos.5.814.618 e 5.789.156)).

Em outro avanço, o promotor é um promotor tecidopreferencial incluindo, mas não limitando-se a, aquelesdescritos em Kawamata et al. (1997) Plant Cell Physiol.38 (7) :792-803; Hansen et al. (1997) Mol. Gen Genet.254(3):337-343; Russell et aí. (1997) Transgenic Res.6(2) :157-168; Rinehart et al. (1996) Plant Physiol.112(3):1331-1341; Van Camp et al. (1996) Plant Physiol.112(2):525-535; Canevascini et al. (1996) Plant Physiol.112(2):513-524; Yamamoto et al. (1994) Plant Cell Physiol.35 (5) :773-778; Lam (1994) Results Probl. Cell Differ.20:181-196; Orozco et al. (1993) Plant Mol Biol.23 (6) : 1129-1138; Matsuoka et al. (1993) Proc Natl. Acad.Sei. USA 90(20):9586-9590; and Guevara-Garcia et al. (1993)Plant J. 4(3):495-505.

Em outro avanço, o promotor é um tecido preferencialpromoter incluindo, mas não limitando-se a, promotoresespecíficos para folha (Yamamoto et al. (1997) Plant J.(2) :255-265; Kwon et al. (1994) Plant Physiol. 105:357-67; Yamamoto et al. (1994) Plant Cell Physiol. 35(5):773-778; Gotor et al. (1993) Plant J. 3:509-18; Orozco et al.(1993) Plant Mol. Biol. 23 (6) :1129-1138; e Matsuoka et al.(1993) Proc. Natl. Acad. Sei. USA 90 (20) :9586-9590); raiz(Hire et al. (1992) Plant Mol. Biol. 20(2):207-218, Kellerand Baumgartner (1991) Plant Cell 3 (10) :1051-1061, Sangeret al. (1990) Plant Mol. Biol. 14 (3) : 433-443, Miao et al.

(1991) Plant Cell 3(l):ll-22, Bogusz et al. (1990) PlantCell 2 (7) : 633-641, Kuster et al. (1995) Plant Mol. Biol.29 (4) :759-772, Capana et al. (1994) Plant Mol. Biol.25 (4):681-691, U.S. Patent Nos. 5.837.876; 5.750.386;5.633.363; 5.459.252; 5.401.836; 5.110.732; e 5.023.179);semente (incluindo aqueles promotores de, e.g., Ciml,CZ19B1, mio-inositol-l-fosfato sintase, Gama-zeina, Glob-1,celA, p-faseolina de feijão, napina, p-conglicinina,lectina de soja, cruciferina, zeina de 15 kDa de milho,zeina de 22 kDa, zeina de 27 kDa, g-zeina, cerósa, shrunken1, shrunken 2, e globulina 1 (ver também Thompson et al.(1989) BioEssays 10:108, WO 00/12733, WO 00/11177)).

Em outro avanço, o promotor é um promotor de baixonivel de expressão (e.g., causa expressão de cerca de1/1000 transcritos a cerca de 1/100,000 transcritos a cercade 1/500,000 transcritos) incluindo, mas não limitando-sea, WO 99/43838, U.S. Patent No. 6.072.050, U.S. Patent Nos.5.608.149; 5.608.144; 5.604.121; 5.569.597; 5.466.785;5.399.680; 5.268.463; 5.608.142; e 6.177.611.

POLIPEPTÍDEOS DA INVENÇÃOQualquer polipeptideo conhecido na arte pode serexpressado em uma planta usando os métodos da presenteinvenção para projetar a molécula de ácido nucléicocodificando o polipeptideo. 0 polipeptideo pode ocorrer nanatureza, ser uma modificação feita pelo homem de umpolipeptideo naturalmente ocorrente, se um polipeptideo queé projetado totalmente de novo, ou qualquer combinaçãodessa. Em avanços preferidos, expressão do polipeptideocodificado por uma molécula de ácido nucléico da presenteinvenção altera pelo menos um fenótipo da plantaexpressando o polipeptideo. Em avanços específicos, ofenótipo da planta expressando o polipeptideo é alterado secomparado à planta controle. A planta controle tanto i)não contém e/ou expressa a molécula de ácido nucléicocodificando o polipeptideo de interesse ou ii) contém e/ouexpressa a molécula de ácido nucléico codificandopolipeptideo de interesse, mas não compreende quaisquercódons alterados.

Exemplos de fenótipos que podem ser alterados porexpressão de um polipeptideo codificado por uma molécula deácido nucléico da invenção incluindo, mas não limitando-sea: resistência/tolerância a insetos (e.g., expressandopolipeptideos de Bacillus 437N ou Cry ou polipeptideoslipase inseticidas de Rhyzopus), resistência/tolerância adoenças (e.g., expressando Pps-AMPl),

resistência/tolerância a nematódeos (e.g., expressandociclostina), resistência/tolerância a seca (e.g.,expressando IPT), tolerância a sal, tolerância a metalpesado e desintoxicação, resistência/tolerância aherbicidas (e.g., expressando glifosato acetil transferaseou acetolactato sintase), baixo conteúdo de fitato, uso denitrogênio de alta eficiência, incremento à produção,estabilidade de produção aumentada, conteúdo nutricionalaumentado, conteúdo de açúcar aumentado, crescimento evigor aumentados, digestibilidade aumentada, expressão depolipeptideos terapêuticos, sintese de farmacêuticos nãopolipeptidicos, expressão de polipeptideos marcadores deseleção (e.g., GAT), expressão de polipeptideo repórter(e.g., GUS), e esterilidade de machos.

Em um avanço especifico, polipeptideos inseticidascodificados por moléculas de ácidos nucléicos de virusvegetais códon-tendenciados são de Bacillus thuringiensisou Rhyzopus oryzae. Em um avanço mais especifico, opolipeptideo inseticida de Bacillus thuringiensis é opolipeptideo 437N ou CRY. Em outro avanço maisespecifico, o polipeptideo de Rhyzopus oryzae é opolipeptideo lipase inseticida.

PLANTAS

Moléculas de ácidos nucléicos projetadas usandométodos da presente invenção podem ser usadas paratransformação de qualquer espécie de planta, incluindo, masnão limitando-se a, monocotiledôneas e dicotiledôneas.Exemplos de plantas de interesse incluem, mas não sãolimitados a, milho(Zea mays), Brassica sp. (e.g., B. napus,B. rapa, B. juncea), particularmente aquelas espécies deBrassica úteis como fontes de óleo de semente, alfafa(Medicago sativa), arroz (Oryza sativa), centeio (Secalecereale), sorgo (Sorghum bicolor, Sorghum vulgare) , milhete(e.g., milheto (Pennisetum glaucum), painço {Panicummiliaceum), painço português (Setaria itálica), capim{Eleusine coracana)), girassol [Helianthus annuus), cártamo(Carthainus tinctorius) , trigo (Triticum aestivura) , soja(Glycine max), tabaco (Nicotiana tabacum), batata {Solanumtuberosum), amendoins (Arachis hypogaea), algodão (Gossypiumbarbadense, Gossypium hirsutum), palma {Elaeis guinnesis),linho {Linum uistatissimum), ricino {Ricinus communis),guar (Athamantha sícula), lentilha (Lens culinaris),fenugreek (Trigonella corniculata), batata-doce (Ipomoeabatatus) , mandioca [Manihot esculenta) , café (Cor"f"ea spp. ) ,coco [Cocos nucifera) , abacaxi (Arianas comosus) , árvorescitricas (Citrus spp.), cacau (Theobroma cacao), chá{Camellia sinensis), banana {Musa spp.), abacate (Perseaamericana), figo {Ficus casica), goiaba (Psidium guajava),manga {Mangifera indica), azeitona (Olea europaea), mamão-papaia (Carica papaya) , caju (Anacardiu/n occidentale) ,macadâmia (Macadamia integrifolia) , amêndoa {Prunusamygdalus), beterraba (Beta vuigaris), cana-de-açúcar(Saccharum spp.), aveia, cevada, verduras e legumes,ornamentais, e coniferas.

Exemplos de verduras e legumes incluem, mas não sãolimitados a, tomates {Lycopersicon esculentum), repolho(e.g., Lactuca sativa), feijões {Phaseolus vulgaris,Phaseolus limensis e Ceratonia siliqua), ervilhas {Lathyrusspp.), caupi (Vigna unguiculata) , feijão-mungo {Vignaradiata), fava {Vicia faba) , grão-de-bico (Cicerarietinum), e membros do gênero Cucumis, tais como pepino(C. sativus), cantalupo (C. cantalupensis), e melão (C.melo).

Exemplos de ornamentais incluem, mas não são limitadosa, azaléia (Rhododendron spp.), hortênsia {Macrophyllahydrangea), hibisco {Hibiscus rosasanensis) , rosas (Rosaspp.), tulipas {Tulipa spp.), narcisos (Narcissus spp.),petúnias (Petunia hybrida), cravo {Dianthus caryophyllus) ,bico-de-papagaio {Euphorbia pulcherrima), e crisântemo.

Exemplos de coniferas incluem, mas não são limitadosa, pinheiros, tais como pinheiro da variedade loblolly{Pinus taeda), pinheiro slash (Pinus elliotíí), pinheiroponderosa {Pinus ponderosa) , pinheiro lodgepole {Pinuscontorta), e pinheiro de Monterey (Pinus radiata) ;Pseudotsuga (Pseudotsuga menziesii) ; cicuta do oeste (Tsugacanadensis); espruce Sitka (Picea glauca); sequóia (Seguoiasempervirens); abetos verdadeiros, tais como abeto prateado(Abies amabilis) e bálsamo (Abies balsamea); e cedros, taiscomo cedro vermelho (Thuja plicata) e cedro-amarelo doAlasca (Chamaecyparis nootkatensis).

Preferencialmente, plantas da presente invenção sãoplantas de cultivo (e.g., milho, alfafa, girassol,Brassica, soja, algodão, cártamo, amendoim, sorgo, trigo,milhete, tabaco, arroz, etc.).

Também englobadas pela presente invenção estão plantastransgênicas e progênie dessas compreendendo moléculas deácido nucléico feitas de acordo com os métodos da invenção.A invenção refere-se, ainda, a material de propagação daplanta de um planta transformada incluindo, mas nãolimitando-se a, sementes, tubérculos, cormos, bulbos,folhas, e cortes de raizes e brotos.

TRANSFORMAÇÃO DE PLANTAS

Qualquer método conhecido na arte pode ser usado paratransformar uma planta ou célula vegetal com uma moléculade ácido nucléico projetada de acordo com os métodos dapresente invenção. Moléculas de ácidos nucleicos podem serincorporadas no DNA vegetal (e.g., DNA genômico ou DNA decloroplasto) ou serem mantidas sem inserção no DNA vegetal(e.g., através do uso de cromossomos artificiais). Métodosadequados de introduzir seqüências de nucleotideos emcélulas vegetais incluem micro-injeção (Crossway et al.(1986) Biotechniques 4:320-334); eletroporação (Riggs etal. (1986) Proc. Natl. Acad. Sei. USA 83:5602-5606;D'Halluin et al. (1992) Plant Cell 4:14 95-1505);transformação mediada por Agrobacterium (U.S. Patent Nos.5.563.055 e 5,981,840, Osjoda et al. (1996) NatureBiotechnology 14:745-750); transferência de genes direta(Paszkowski et al. (1984) EMBO J. 3:2717-2722); aceleraçãobalística de partículas (Sanford et al., U.S. Patent No.4.945.050; Tomes et al., U.S. Patent No. 5.879.918; Tomeset al., U.S. Patent No. 5. 886.244; Bidney et al., U.S.Patent No. 5.932.782; Tomes et al. (1995) "Direct DNATransfer into Intact Plant Cells via MicroprojectileBombardment, in Plant Cell, Tissue, and Organ Culture:Fundamental Methods, ed. Gamborg and Phillips (Springer-Verlag, Berlin); e McCabe et al. (1988) Biotechnology6:923-926)); transformação mediada virus (U.S. Patent Nos.5.889.191, 5.889.190, 5.866.785, 5.589.367 e 5.316.931);transformação de pólen (De Wet et al. (1985) em TheExperimental Manipulation of Ovule Tissues, ed. Chapman etal. (Longman, New York), pp. 197-209); transformação Lec 1(U.S. Patent Application Ser. No. 09/435,054, WO 00/28058);transformação mediada por fios de carboneto de silicio(Kaeppler et al. (1990) Plant Cell Reports 9:415-418 eKaeppler et al. (1992) Theor. Appl. Genet. 84:560-566); etecnologia de transformação de cloroplasto (Bogorad, 2000,Trends in Biotechnology 18: 257-263; Ramesh et al., 2004,Methods Mol Biol. 274:301-7; Hou et al., 2003, TransgenicRes. 12(l):lll-4; Kindle et al., 1991, PNAS 88 (5) :1721-5;Bateman and Purton, 2000, Mol Gen Genet. 263 (3) :404-10;Sidorov et al., 1999, Plant J. 19(2):209-216)

A escolha de protocolos transformação usados paragerar plantas e células vegetais transgênicas pode variardependendo do tipo de planta ou célula vegetal, i.e.,monocotiledônea ou dicotiledônea, visadas paratransformação. Exemplos de protocolos de transformaçãoparticularmente adequados para um tipo particular de plantaincluem aqueles para: cebola (Weissinger et al. (1988)Ann. Rev. Genet. 22:421-477; Sanford et al. (1987)Particulate Science and Technology 5:27-37); batata (Tu etal. (1998) Plant Molecular Biology 37:829-838 e Chong etal. (2000) Transgenic Research 9:71-78); soja (Christou etal. (1988) Plant Physiol. 87:671-674, McCabe et al. (1988)Bio/'Technology 6:923-926, Finer and McMullen (1991) InVitro Cell Dev. Biol. 27P:175-182, e Singh et al. (1998)Theor. Appl. Genet. 96:319-324); arroz (Datta et al.(1990) Biotechnology 8:736-740, Li et al. (1993) Plant CellReports 12:250-255, e Christou and Ford (1995) Annals ofBotany 75:407-413); milho (Klein et al. (1988) Proc. Natl.Acad. Sei. USA 85:4305-4309, Klein et al. (1988)Biotechnology 6:559-563, Klein et al. (1988) Plant Physiol.91:440-444, Fromm et al. (1990) Biotechnology 8:833-839, eTomes et al. (1995) "Direct DNA Transfer into Intact PlantCells via Microprojectile Bombardment," in Plant Cell,Tissue, and Organ Culture: Fundamental Methods, ed. Gamborg(Springer-Verlag, Berlin); cereais (Hooykaas-Van Slogterenet al. (1984) Nature (London) 311:763-764, U.S. Patent No.5.736.369); Liliaceae (Bytebier et al. (1987) Proc. Natl.Acad. Sei. USA 84:5345-5349).

Em alguns avanços, mais do que um construto é usadopara transformação na geração de plantas e células vegetaistransgênicas. Múltiplos construtos podem ser incluídos nasposições eis ou trans. Em avanços preferidos, cadaconstruto tem um promotor e outras seqüências reguladoras.As células que foram transformadas podem sercultivadas em plantas em concordância com qualquer métodoconhecido na arte (e.g., McCormick et al. (1986) Plant CellReports 5:81-84). Essas plantas podem ser, então,cultivadas, e tanto polinizadas com a mesma linhagemtransformada ou linhagens diferentes. Duas ou maisgerações das plantas podem ser cultivadas para assegurarque a expressão da molécula de ácido nucléico, polipeptideoe/ou característica fenotipica desejada está estavelmentemantida e herdada.

DETERMINAÇÃO DE EXPRESSÃO

Qualquer método conhecido na arte pode ser usado paradeterminar o nivel de expressão em uma planta de umamolécula de ácido nucléico da invenção ou polipeptideocodificado a partir dessa. Por exemplo, o nivel deexpressão em uma planta de um polipeptideo codificado poruma molécula de ácido nucléico da invenção pode serdeterminado por teste imuno, eletroforese de gelquantitativa, etc. Adicionalmente, o nivel de expressão emuma planta de um polipeptideo codificado por uma moléculade ácido nucléico da invenção pode ser determinado pelograu com o qual o fenótipo vegetal é alterado.Determinações podem ser feitas usando plantas inteiras,tecidos dessas, ou cultura de células vegetais.Em um avanço, uma comparação de niveis de expressão depolipeptídeos é feita entre uma planta transformada com umamolécula de ácido nucleico compreendendo um ou mais códonsalterados e uma planta transformada com uma molécula deácido nucleico inalterada, caracterizado pelo fato de ambasmoléculas de ácido nucleico codificarem o mesmopolipeptideo ou polipeptideo substancialmente similar. Emoutro avanço, uma comparação de niveis de expressão depolipeptideos é feita entre uma planta transformada com umamolécula de ácido nucleico compreendendo um ou mais códonsalterados e uma planta não transgênica.

Os conteúdos de todas as patentes, aplicações depatentes, aplicações PCT publicadas e artigos, livros,referências, manuais de referência e resumos aqui citadossão aqui incorporados por referência em sua totalidade paradescrever mais completamente o estado da arte à qual ainvenção pertence.

Como várias mudanças podem ser feitas na matéria emquestão acima descrita sem deixar o escopo e espirito dapresente invenção, pretende-se que toda matéria objetocontida na descrição acima, ou definida nas reivindicaçõesanexas, seja interpretada como descritiva e ilustrativa dapresente invenção. Várias modificações e variações dapresente invenção são possíveis à luz dos ensinamentosacima.

EXEMPLOSOs seguintes exemplos, como aqui expostos, são feitospara ilustrar e exemplificar os vários aspectos de conduzira presente invenção e não pretendem limitar a invenção emqualquer forma.

EXEMPLO 1: Desenho de seqüência codificadora damolécula de ácido nucléico de virus de plantamonocotiledônea códon-tendenciado codificando variantes dospolipeptideos inseticidas 473N de Bacillus thuringiensis.

Códons para moléculas de ácidos nucléicos codificandoas seqüências de aminoácidos de 473N foram selecionadosinicialmente de acordo com o limite de 0,09 de freqüênciasde uso de códon de virus de planta monocotiledônea listadasna Tabela 14, e subseqüentemente otimizados pelo consensoKozak, e editados para eliminar sitios de splice criticos,seqüências que podem causar rápida degradação de RNAm,seqüências de sinais espuriosos de poliadenilação, equadros de leitura alternados longos. Além de códons quetêm maiores freqüências de uso de códon de virus vegetalterem sido posicionados na direção da extremidade 5' daseqüência codificadora. SEQ ID NO:l codifica Kozak-473N.SEQ ID NO:2 é a seqüência de aminoácidos de Kozak-473N.473N pré- otimização de códon é a SEQ ID NO:15.

A seguinte tabela indica as freqüências de uso decódon da seqüência codificadora da molécula de ácidonucléico de planta monocotiledônea códon-tendenciadalistadas como SEQ ID NO:l comparado às freqüências de usode códon de virus de planta monocotiledônea listadas naTabela 14.Tabela 23: Freqüências de uso de códon na SEQ ID NO:lcomparada a freqüências de uso de códon em virus de plantamonocotiledônea ajustadas com um limite de corte maior doque 0,09.

<table>table see original document page 98</column></row><table><table>table see original document page 99</column></row><table><table>table see original document page 100</column></row><table>

EXEMPLO 2: Assembléia de 473N de virus vegetal códon-tendenciado.

A versão sintética do gene 473N (SEQ ID NO: 1) foisintetizada por DNA2.0 (Menlo Park, CA). Sitios de enzimade restrição BamHI e Hpal foram adicionados às extremidades5' e 3' gene, respectivamente, para facilitar a clonagem emum vetor de transformação.EXEMPLO 3: Construção de um vetor de transformaçãovegetal de 473N.

Um fragmento de 2,1 kb correspondendo ao gene 473N foiisolado do vetor DNA2.0 após a digestão do plasmidio comBamHI e Hpal. Esse fragmento foi sub-clonados em um vetorintermediário, pSKNA-Ubi, usando BamHI e Hpal resultando empSKNA-Ubi:473N. pSKNA-Ubi: 473N contém o gene 473N sob ocontrole da combinação Ubi promotor 5'UTR-Ubi e intron 1 eé terminado pela seqüência terminadora pinll imediatamente3' ao gene 473N. pSKNA-Ubi: 473N foi digerido com Asei eNotl para liberar o cassete de expressão (Ubi Pro-5'UTR'Ubiintron 1:473N:pinll), e seu fragmento foi sub-clonado nossitios correspondentes no vetor de transformação finalposicionando-o acima e na orientação oposta ao genemarcador de seleção. O cassete inteiro entre LB e RB tevea seqüência verificada antes da transformação.

EXEMPLO 4: Transformação de Milho por Bombardeamentode Partícula e Regeneração de Plantas Transgênicas

Embriões de milho imaturos de plantas doadoras deestufas são bombardeadas com uma molécula de DNA contendouma seqüência codificadora da molécula de ácido nucléico devirus vegetal códon-tendenciado operacionalmente ligada aum promotor de ubiquitina e um gene marcador de seleção,tal como PAT (Wohlleben et al., 1988, Gene 70:25-37), queconfere resistência ao herbicida Bialaphos.

Alternativamente, o gene marcador de seleção pode serprovido em uma molécula de DNA separada. A transformação érealizada como se segue. Receitas de meio seguem abaixo.

PREPARAÇÃO DE TECIDO ALVO

É retirada a palha das espigas e sua superfície éesterilizada em alvejante Clorox™ 30% mais 0,5% de Microdetergente por 20 minutos, e enxaguadas duas vezes com águaestéril. Os embriões imaturos são excisados e colocadosde forma que o lado do eixo do embrião fique voltado parabaixo (escutelo voltado para cima), 25 embriões por placa,em meio 560Y por 4 horas e, então, alinhados na zona alvode 2,5 cm na preparação para o bombardeamento.

PREPARAÇÃO DE DNA

Um vetor plasmidio compreendendo a molécula de ácidonucléico de virus vegetal códon-tendenciado,operacionalmente ligada a um promotor de ubiquitina, éisolado. Por exemplo, um vetor de transformação adequadocompreende um promotor Ubil de Zea mays, uma UTR 5' de Ubile um intron Ubil, em combinação com um terminador PinlI. Ovetor contém, adicionalmente, um gene marcador de seleção,tal como GAT dirigido pelo promotor/intron/5'UTR Ubil comum intensificador 3x35S e um terminador PinlI.

Opcionalmente, o marcador de seleção pode residir em umplasmidio separado. Uma molécula de DNA compreendendo umamolécula de ácido nucléico de virus vegetal códon-tendenciado codificando seqüência, assim como um marcadorde seleção, tal como GAT é precipitado em pelotas detungstênio de 1,1 um (diâmetro médio) usando umprocedimento de precipitação de CaCl2 como se segue:100 |xl de preparado de particulas de tungstênioem água

10 ul (1 ug) de DNA em tampão Tris EDTA (1 ug DNAtotal)

100 fil de CaCl2 a 2,5 M

10 ul de spermidina a 0,1 M

Cada reagente é adicionado seqüencialmente a umasuspensão de particulas de tungstênio, enquanto mantido emum vórtex multi-tubo. A mistura final é sonicadabrevemente e deixada para incubar sob agitação por vdrtexconstante por 10 minutos. Após o periodo de precipitação,os tubos são rapidamente centrifugados, o liquido removido,lavado com 500 ml de etanol a 100%, e centrifugado por 30segundos. Novamente, o liquido é removido, e 105 ul deetanol a 100% é adicionado à pelota de partícula detungstênio final. Para bombardeamento de partícula comarma, as particulas tungstênio/DNA são rapidamentesonicadas e 10 ul colocados no centro de cada macrocarregador e secado por cerca de 2 minutos antes dobombardeamento.TRATAMENTO DE ARMA DE PARTÍCULAS

As placas de amostras são bombardeadas no nivel #4 daarma de partículas HE34-1 ou HE34-2. Todas as amostrasrecebem um único tiro a 650 PSI, com um total de dezalíquotas tiradas de cada tubo de preparado departicuias/DNA.

Seguindo o bombardeamento, os embriões são mantidos emmeio 560Y por 2 dias, então transferidos a meio de seleção560R contendo 3 mg/litro de glifosato a 3mM, e sub-cultivados a cada 2 semanas. Após aproximadamente 10semanas de seleção, clones de calo resistentes a seleçãosão transferidos para meio 288J para iniciar a regeneraçãovegetal. Seguindo o amadurecimento do embrião somático (2-4 semanas), embriões somáticos bem desenvolvidos sãotransferidos para meio para germinação e transferidos paraa sala de cultura iluminada. Aproximadamente 7-10 diasdepois, as plântulas em desenvolvimento são transferidaspara meio 272V sem hormônio em tubos por 7-10 dias até queas plântulas estejam bem estabelecidas. As plantas são,então, transferidas para inserções em flats (equivalente apote de 2,5") contendo solo de pote e cultivadas por 1semana em um câmara de crescimento, subseqüentementecultivadas por 1-2 semanas adicionais na estufa, entãotransferidas para potes classic 600 (1,6 gallon) ecultivadas até a maturidade. As plantas são monitoradas epontuadas para expressão do polipeptídeo codificado pelamolécula de ácido nucléico de vírus vegetal códon-tendenciado por testes conhecidos na arte, tais como, porexemplo, testes imuno e western blotting com um anticorpoque se liga ao polipeptideo codificado. A expressão depolipeptideo pode ser também monitorada em calo resistenteapós 10 semanas de seleção para avaliar os niveis dessespolipeptideos.

MEIO DE BOMBARDEAMENTO E CULTURA

Meio de bombardeamento (560Y) compreende 4,0 g/l desais basais N6 (SIGMA C-1416), 1,0 ml/l de mistura deVitamina Eriksson's (lOOOx SIGMA-1511), 0,5 mg/l de HC1tiamina, 120,0 g/l de sacarose, 1,0 mg/l de 2,4-D, e 2,88g/l de L-prolina (levado ao volume com H20 dl seguindo oajuste para pH 5,8 com KOH) ; 2,0 g/l Gelrite™ (adicionadoapós levar ao volume com H2O dl); e 8,5 mg/l de nitrato deprata (adicionados após esterilizar o meio e resfriar paratemperatura ambiente). Meio de seleção (560R) compreende4,0 g/l de sais basais N6 (SIGMA C-1416), 1,0 ml/l demistura de vitamina Eriksson's (lOOOx SIGMA-1511), 0,5 mg/lde HC1 tiamina, 30,0 g/l de sacarose, e 2,0 mg/l de 2,4-D(levados ao volume com H20 dl seguindo o ajuste para pH 5,8com KOH); 3,0 g/l de Gelrite™ (adicionado após levar aovolume com H20 dl); e 0,85 mg/l de nitrato de prata e 3,0mg/l de Bialaphos (ambos adicionados após esterilizar omeio e resfriar para temperatura ambiente).

Meio de regeneração vegetal (288J) compreende 4,3 g/lde sais MS (GIBCO 11117-074), 5,0 ml/l de solução deestoque de vitaminas MS (0,100 g de ácido nicotinico, 0,02g/l de HC1 tiamina, 0,10 g/l de HC1 piridoxina, e 0,40 g/lde Glicina levados ao volume com polished D-I H20)(Murashige and Skoog (1962) Physiol. Plant. 15:473), 100mg/l de mio-inositol, 0,5 mg/l de zeatina, 60 g/l desacarose, e 1,0 ml/l de 0,1 mM ácido abscisico (levados aovolume com polished dl H20 após ..ajustar para pH 5,6); 3,0g/l de Gelrite™ (adicionados após levar ao volume com H20dl); e 1,0 mg/l de ácido indoleacético e 3,0 mg/l deBialaphos (adicionados após esterilizar o meio e resfriarpara 60°C) . Meio sem hormônios (272V) compreende 4,3 g/lde sais MS (GIBCO 11117-074), 5, 0 ml/l de solução deestoque de vitaminas MS (0,100 g/l de ácido nicotinico,0,02 g/l de HC1 tiamina, 0,10 g/l de HC1 piridoxina, e 0,40g/l de Glicina levados ao volume com polished dl E20) , 0,1g/l de mio-inositol, e 40,0 g/l de sacarose (levados aovolume com polished dl H20 após ajustar o pH para 5,6); e 6g/l de Bacto^ágar (adicionado após levar ao volume compolished dl H20), esterilizados e resfriados a 60° C.

EXEMPLO 5: Transformação de milho mediada porAgrobacterium e regeneração de plantas transgênicas

A transformação de milho com um vetor contendo um gene473N de virus vegetal códon-tendenciado foi realizada pelométodo de Zhao (U.S. Patent No. 5.981.840 e publicação depatente PCT W098/32326; os conteúdos das quais são aquiincorporados por referência).Agrobacterium foram cultivadas em uma placa mestra demeio 800 e cultivados a 28°C no escuro por 3 dias, e depoisdisso armazenadas a 4°C por até um mês. Placas de trabalhode Agrobacterium foram cultivadas em placas de meio 810 eincubadas no escuro a 28°C pór um ou dois dias.

Resumidamente, os embriões foram dissecados a partirdas espigas de milho frescas, esterilizadas e mantidos emmeio 561Q até que todos os embriões necessários fossemcoletados. Os embriões foram, então, levados ao contatocom uma suspensão de Agrobacterium preparada a partir daplaca de trabalho, na qual as Agrobacterium continham umplasmidio compreendendo o gene 473N dos avanços. Osembriões foram co-cultivados com as Agrobacterium em placas562P, com os embriões colocados de eixo para baixo nasplacas, como pelo protocolo de patente *840.

Após uma semana em meio 562P, os embriões foramtransferidos para meio 5630. Os embriões foram sub-cultivados em meio fresco 5630 em intervalos de 2 semanas ea incubação foi continuada sob as mesmas condições.

Eventos de calos começaram a aparecer após 6 a 8 semanas emseleção.

Após os calos terem alcançado o tamanho apropriado, oscalos foram cultivados em meio de regeneração (288W) emantidos no escuro por 2-3 semanas para iniciar aregeneração vegetal. Seguindo o amadurecimento do embriãosomático, embriões somáticos bem desenvolvidos foramtransferidos para meio para germinação (272V) etransferidos para uma sala de cultura iluminada.Aproximadamente 7-10 dias depois, as plântulas emdesenvolvimento são transferidas para meio 272V semhormônio em tubos por 7-10 dias até que as plântulasestejam bem estabelecidas. As plantas foram, então,transferidas para inserções em flats (equivalente .a pote de2,5") contendo solo de pote e e cultivadas por 1 semana emum câmara de crescimento, subseqüentemente cultivadas por1-2 semanas adicionais na estufa, então transferidas parapotes classic 600 (1, 6 gallon) e cultivadas até amaturidade.

Os meios usados na transformação de milho mediada porAgrobacterium e regeneração de plantas transgênicas:

Meio 561Q compreende 4,0 g/L de sais basais N6 (SIGMAC-1416), 1,0 mL/L de mistura de Vitamina Eriksson's (lOOOxSIGMA-1511), 0,5 mg/L de HC1 tiamina, 68,5 g/L desacarose, 36,0 g/L de glicose, 1,5 mg/L de 2,4-D, e 0,69g/L de L-prolina (levados ao volume com dl H2O seguindo oajuste para pH 5,2 com KOH) ; 2,0 g/L de Gelrite™(adicionado após levar ao volume com H20 dl); e 8,5 mg/l denitrato de prata (adicionado após esterilizar o meio eresfriar para temperatura ambiente).

Meio 800 compreende 50,0 mL/L de solução de estoque Ae 850 mL de dl H20, levados ao volume menos 100 mL/L com dlH20, após o que é adicionado 9,0 g de fitágar. Apósesterilizar e resfriar, 50,0 mL/L de solução de estoque Bé adicionado-, junto com 5,0 g de glicose e 2,0 mL de umasolução de estoque espectinomicina a 50 mg/mL. A soluçãode estoque A compreende 60,0 g de K2HP04 dibásico e 20,0 gde fosfato de sódio monobásico, dissolvidos em 950 mL deágua, ajustados ao pH 7,0 com KOH, e levados ao volume de1,0 L com dl H2O. A solução de estoque B compreende 20,0 gde NH4CI, 6,0 g de MgS04»7H20, 3,0 g de cloreto de potássio,.0,2 g de CaCl2, e 0,05 g de FeS04*7H20, todos levados aovolume com dl H20, esterilizados, e resfriados.

Meio 810 compreende 5,0 g de extrato de levedura(Difco), 10,0 g de peptona (Difco), 5,0 g de NaCl,dissolvidos em dl H20, e levados ao volume após ajustar opH para 6,8. 15,0 g de bacto-ágar são, então, adicionadas,a solução é esterilizada e resfriada, e 1,0 mL de umasolução de estoque de espectinomicina a 50 mg/mL éadicionado.

Meio 562P compreende 4,0 g/L de sais basais N6 (SIGMAC-1416), 1,0 mL/L de mistura de Vitamina Eriksson's (lOOOxSIGMA-1511), 0,5 mg/L de HC1 tiamina, 30,0 g/L de sacarose,e 2,0 mg/L de 2,4-D (levados ao volume com dl H20 seguindoo ajuste para pH 5,8 com KOH); 3,0 g/L de Gelrite™(adicionado após levar ao volume com H20 dl); e 0,85 mg/lde nitrato de prata e 1,0 mL de um estoque deacetosiringona a lOOmM (ambos adicionados após esterilizaro meio e resfriar para temperatura ambiente).Meio 5630 compreende 4,0 g/L de sais basais N6 (SIGMAC-1416), 1,0 mL/L de mistura de Vitamina Eriksson's (lOOOxSIGMA-1511), 0,5 mg/L de HC1 tiamina, 30,0 g/L de sacarose,1,5 mg/L de 2,4-D, 0,69 g de L-prolina, e 0,5 g de tampãoMES (levados ao volume com dl H20 seguindo o ajuste para pH5,8 com KOH) . Então, 6,0 g/L de agar-agar Ultrapure™ (EMScience) são adicionadas e o meio é esterilizado eresfriado. Subseqüentemente, 0,85 mg/l de nitrato deprata, 3,0 mL de um estoque de Bialaphos al mg/mL, e 2,0 mLde um estoque de carbenicilina a 50 mg/mL são adicionadas.

Meio 288 W compreende 4,3 g/L de sais MS (GIBCO 11117-074), 5,0 mL/L de solução de estoque de vitaminas MS (0,100g de ácido nicotinico, 0,02 g/L de HC1 tiamina, 0,10 g/L deHC1 piridoxina, e 0,40 g/L de Glicina levados ao volume compolished D-I H20) (Murashige and Skoog (1962) Physiol.Plant. 15:473), 100 mg/L de mio-inositol, 0,5 mg/L dezeatina, e 60 g/L de sacarose, que é, então, levado aovolume com polished D-I H2O após ajustar para pH 5,6.

Seguindo, 6,0 g/L de agar-agar Ultrapure™ (EM Science) sãoadicionados e o meio é esterilizado e resfriado.Subseqüentemente, 1,0 mL/L de ácido abscisico a 0,1 mM; 1,0mg/l de ácido indoleacético e 3,0 mg/L Bialaphos sãoadicionados, junto com 2,0 mL de um estoque decarbenicilina a 50 mg/mL.

Meio sem hormônio (272V) compreende 4,3 g/L sais MS(GIBCO 11117-074), 5,0 mL/L de solução de estoque devitaminas MS (0,100 g/L de ácido nicotinico, 0,02 g/L deHC1 tiamina, 0,10 g/L de HC1 piridoxina, e 0,40 g/L deGlicina levados ao volume com polished dl H2O) , 0,1 g/L demio-inositol, e 40,0 g/L de sacarose (levados ao volume compolished dl H20 após ajustar o pH para 5,6); e 6 g/L deBacto-ágar (adicionado após levar ao volume com polished dlH20) , esterilizado e resfriado para 60° C.

EXEMPLO 6: Teste com insetos de 473N expressando calostransgênicos

Insetos foram testados em calos transgênicosexpressando 473N sob o promoter de Ubiquitina paradeterminar se houve expressão suficiente de toxina 473Nneste estágio para prover atividade inseticida. Esseteste, em combinação com a análise de western blot, proveuuma medida de quão bem o gene 473N de virus vegetal códon-tendenciado, codificando um polipeptideo inseticida, foiexpressado em tecidos vegetais.

O teste de calo foi realizado em bandejas Pitman queforam previamente esterilizadas por spray de etanol 95%.

Ágar (Serva) preparado de acordo com as instruções dofabricante e suplementado com uma solução tripla deantibiótico (70 mis/ 500 ml ágar) contendo penicilina,estreptomicina e anfotercina B, foi pulverizado em cadapoço e deixado resfriar. Um disco de papel filtro estérilfoi colocado em cima do ágar em cada poço e 200 ul de águaestéril dispensada no papel filtro. Calos (~ 1 cm emtamanho) foram adicionados no papel filtro e 2 lagartaseuropéias (ECB) recém-nascidas foram adicionadas por poço.As placas de teste foram incubadas a 27°C e os insetosforam pontuado para mortalidade, perturbação decrescimento, e mudanças comportamentais a 72-96 h após aadição dos insetos. O teste foi repetido para confirmar aspontuações.

Os resultados dos testes mostraram que as ECB recém-nascidas foram severamente perturbadas ou mortas em 30 dospoços testados. A correlação de atividade entre as duasrepetições foi de 100%. Nenhuma mortalidade ou perturbaçãofoi observada nos calos não transgênicos controle. Esseteste indicou que 473N foi expressado em quantidadesinseticidas em uma proporção do calo diferente e apoia aefetividade da tendência de códon de virus vegetal.

EXEMPLO 7: Testando a eficácia de disco foliar de ECBe CEW.

Calos transformados foram regenerados em plantas eenviados para a estufa para testar a eficácia de TO com ECBe larva da espiga do milho (CEW). Testes de discosfoliares foram realizados em todos os eventos no estágiosde desenvolvimento V6 para avaliar a proteção de plantabaseado na área de folha consumida por inseto recém-nascidoapós 48 hrs. Testes foram conduzidos puncionando múltiplosdiscos foliares para cada evento transgênico testado ecolocando um disco por poço de um placa de 24 poços.Quatro discos foliares por evento por inseto (8 total)foram usados no teste. Os discos foliares foram mantidosem um disco de papel filtro úmido que foi do mesmo diâmetrodo poço. Tampas foram colocadas em cada placa após aadição dos insetos para preveni-los de escapar do poço.Discos foliares controle de plantas não transgênicos foramincluídos para comparação de consumo foliar. Testes foramconduzidos a 27°C.

Os resultados desse teste estão sumarizados na Tabela24 abaixo. Proteção de folha foi observada em 45 doseventos testados no teste. Eventos que demonstraramproteção contra ECB também mostraram proteção contra CEW.O disco foliar foi totalmente consumido nos poços controlee nos outros eventos "não eficazes". Um exemplo do testede disco foliar é apresentado na Fig. 1. Esses resultadosapoiam a habilidade de expressar um gene 473N em niveisinseticidas que foram projetados com uma tendência de códonde virus vegetal.

Tabela 24: Resultados do teste de disco foliar para eventosexpressando um gene 473N de virus vegetal códon-otimizado.

<table>table see original document page 113</column></row><table>

EXEMPLO 8: Análise de Immunoblot de amostras de folhasde eventos 473N transgênicos.Extrações de polipeptídeo vegetal foram efetuadascoletando-se 4 discos foliares (-100 mg) de plantas deestágio V6 em um tubo raptor de 1,2 ml. Para cada amostra,duas bolas de ferro de moer e 200 ul de tampão de extração(100 mM de fosfato de potássio, pH 7,8, lmM EDTA, 10%glicerol, 1% Triton, 7mM beta mercaptoetanol (BME) ecoquetel de inibidor de protease) foram adicionados. Ostubos foram encapados e colocados em um moedor Geno/Grinder(BT&C/OPS Diagnostics, New Bridgewater, NJ) e esmagadasduas vezes a uma velocidade de 1650 por 30 seg. As amostrasforam centrifugadas a 4000 rpm por 15 minutos a 4°C, osobrenadante transferido a um novo tubo e re-centrifugado a13.000 rpm por 5 min a 4°C. 0 sobrenadante foi transferidopara um novo tubo e as amostras armazenadas a -20°C até ouso.

As amostras foram preparadas para eletroforese de gelSDS-PAGE adicionando-se 5 ul de 4X tampão de carregamento(Invitrogen, Carlsbad, CA) e 3,5 ul de BME e aquecendo-se a100°C por 5 minutos. As amostras foram carregadas em umgel 4-16 % NuPAGE precast (Invitrogen) com marcadores depeso molecular apropriados e corridas a -125 volts por -90minutos em tampão MES de corrimento.

A análise de Immunoblot foi realizada removendo o geldo lançador e colocando em um sanduíche de blottingconsistindo de 2 camadas esponja, papel de blotting(cortado ao tamanho do gel), o gel, a membrana pré-molhada,papel de blotting, e duas esponjas. O sanduíche foicolocado na caixa de transferência contendo tampão detransferência e corrido a 30 volts por 60 a 90 minutos.Após a transferência, a membrana foi removida do sanduíchee colocada em um recipiente ao qual IX PBST (10 mM fosfatosalino tamponado, pH7,4, 1% Tween 20) suplementado com 5%leite sem gordura seco. O bloqueio foi feito por lh a RTcom agitação suave. Após lha solução de bloqueio foisubstituída com 15 ml de 1XPBST + 5% leite seco contendo adiluição correta de anticorpo 473N primário e incubada comagitação suave a 4°C de um dia para o outro. Após aincubação, o anticorpo primário foi removido e a membranalavada 3 vezes (5 minutos cada) com 1XPBST + 5% leite seco.A membrana foi incubada com anticorpo secundário a umadiluição de 1/5000 em 25 ml de 1XPBST + 5% leite seco por 1h a RT com agitação suave. O Ab secundário foi removido damembrana e a membrana lavada 3 (5 min cada) com 1XPBST + 5%leite seco seguido por 3 lavagens (5 min. cada) de IXtampão de teste (fornecido no kit Western Light Kit TM,Applied Biosystems, Foster City, CA). O excesso de tampãofoi drenado da membrana e a membrana colocada em umembrulho plástico ao qual 3 ml de solução de substrato(CSPDTM - provido no kit) suplementado com 150 ul deintensificador Nitro-Block II TM (provido no kit) foiadicionado por 5 min no escuro. A membrana foi reveladadrenando-se o excesso de solução e expondo a membrana afilme de raio X Biomax Light X-ray film (Eastman Kodak Co.New Haven, CT) por diferentes tempos de exposição. O filmefoi, então, revelado, por métodos tradicionais.A análise Western de tecido foliar de eventostransgênicos 473N mostraram uma banda imuno-reativa ao Abque foi similar em tamanho à proteina 473N controlepurificada (ver Fig. 2). A presença dessa banda esteve emamostras de folhas de eventos que demonstraram eficácia noteste de disco foliar, suportando a expressão de um gene473N de virus vegetal códon-otimizado a niveis inseticidas.Essa banda esteve ausente em controles não transgênicos.Outras bandas reativas cruzadamente são em comum entreamostras transgênicas e controles não transgênicos.

EXEMPLO 9: Desenho de seqüência codificadora damolécula de ácido nucléico de virus de plantamonocotiledônea códon-tendenciado codificando uma lipaseinseticida de Rhyzopus oryzae (RoLipase)

Códons para a molécula de ácido nucléico codificandoas seqüências de aminoácidos de RoLipase com um peptideosinal de Alpha Amilase de cevada foram selecionadasinicialmente de acordo com o limite de 0,09 de freqüênciasde uso de códon de virus de planta monocotiledônea listadasna Tabela 14. Subseqüentemente a seqüência foi otimizadapelo consenso Kozak e editada para eliminar sitios desplíce críticos, seqüências que podem causar rápidadegradação de RNAm, seqüências com sinais de poliadenilaçãoespuriosos, e quadros de leitura alternados longos. Alémde códons que têm maiores freqüências de uso de códon devirus vegetal e foram posicionado na direção da extremidadeda seqüência codificadora. A SEQ ID NO: 3 codifica aRoLipase códon-otimizada. A SEQ ID NO: 4 é a seqüência deaminoácidos de RoLipase códon-otimizada. As SEQ ID NOS:5 e6 são o peptideo sinal de amilase Alpha de cevada (ácidonucléico e seqüência peptidica, respectivamente) que foramadicionadas à seqüência de RoLipase códon-otimizada eusadas por todos os experimentos descritos. A lipase pré-otimização de códons é a SEQ ID NO:16.

EXEMPLO 10: Assembléia de BAA-RoLipase de VirusVegetal Códon-Tendenciado.

A versão sintética da RoLipase (SEQ ID NO:3) com o foisintetizada por DNA2.0 (Menlo Park, CA). Sitios de enzimade restrição BamHI e Hpal foram adicionado às extremidades5' e 3' do gene, respectivamente, para facilitar a clonagemem um vetor de transformação vegetal.

EXEMPLO 11: Construção de um Vetor de TransformaçãoVegetal BAA-RoLipase.

Um fragmento de 1,2 kb correspondendo ao gene de BAA-RoLipase foi isolado a partir do vetor DNA2.0 após adigestão do plasmidio com BamHI e Hpal. Esse fragmento foisub-clonado em um vetor intermediário, pSKNA-Ubi, usandoBamHI e Hpal resultando em pSKNA-Ubi:BAA-RoLipase. pSKNA-Ubi:BAA-RoLipase continha o gene de BAA-RoLipase sob ocontrole da combinação Ubi promotor-5' UTR-Ubi intron 1 efoi terminado pela seqüência terminadora pin IIimediatamente 3' ao gene de Lipase. pSKNA-Ubi:BAA-RoLipasefoi digerida com Asei e Notl para liberar o cassette deexpressão (Ubi Pro-5'UTR'Ubi intron 1:BAA-RoLipase:pinll) eesse fragmento foi sub-clonado nos sitios correspondentesno vetor de transformação final colocando-o acima e naorientação oposta ao gene marcador de seleção. O cassetecompleto entre LB e RB teve sua seqüência verificada antesda transformação.

O vetor de transformação vegetal BAA-RoLipase foiusado para transformar milho por transformação mediada porAgrobacterium e plantas foram regeneradas de acordo com osprocedimentos detalhados no Exemplo 5.

EXEMPLO 12: Teste de larva-da-raiz do milho (CRW) emeventos de RoLipase transformada.

A avaliação de CRW foi efetuada em 45 eventos deRolipase transformada usando um teste de simulação de raiz.Plantulas de Rolipase de transformação foram transplantadasem raizes simuladas e as plantas foram infestadas noestágio V3-V4 com 100 ovos de CRW. As plantas forampontuadas para dano de raiz em 15-17 dias após a infestaçãoe passada na base de pontuações de raiz comparadas plantascontrole não transgênicas. Onze plantas foram pontuadascomo positivas baseado no grau de dano de raizrepresentando uma taxa de manutenção de 24% (Tabela 25) .

Um subgrupo dessas plantas foi selecionado para análiseWestern de expressão de Rolipase.Tabela 25: Eventos TO de Rolipase que passar no teste deCRW

<table>table see original document page 119</column></row><table>

EXEMPLO 13: Análise de Immunoblot de amostras de raize folhas de eventos BAA-RoLipase transgênicos.

Extrações de polipeptideos vegetais foram efetuadascoletando-se seções de raizes e folhas (~100 mg) de plantasdo estágio V6-8 em um tubo raptor 1,2 ml. Para cadaamostra duas bolas de ferro de moer e 200 ul de tampão deextração (fosfato de potássio a 100 mM, pH 7,8, lmM EDTA,10% glicerol, 1% Triton, 7mM beta mercaptoetanol (BME) ecoquetel inibidor de protease) foram adicionados. Os tubosforam encapados e colocados em um moedor Geno/Grinder(BT&C/OPS Diagnostics, New Bridgewater, NJ) e esmagadasduas vezes a uma velocidade de 1650 por 30 seg. as amostrasforam centrifugadas a 4000 rpm por 15 minutos a 4°C, osobrenadante transferido a um novo tubo e re-centrifugado a13.000 rpm por 5 min a 4°C. 0 sobrenadante foi transferidopara um novo tubo e as amostras armazenadas a -20°C até ouso.

As amostras foram preparadas para eletroforese de gelSDS-PAGE adicionando-se 5 ul de 4X tampão de carregamento(Invitrogen, Carlsbad, CA) e 3,5 ul de BME e aquecendo-se a100°C por 5 minutos. As amostras foram carregadas em umgel 4-16 % NuPAGE precast (Invitrogen) com marcadores depeso molecular apropriados e corridas a -125 volts por ~90minutos em tampão MES de corrimento.

A análise de Immunoblot foi realizada removendo o geldo lançador e colocando em um sanduíche de blottingconsistindo de 2 camadas esponja, papel de blotting(cortado ao tamanho do gel), o gel, a membrana pré-molhada,papel de blotting, e duas esponjas. O sanduíche foicolocado na caixa de transferência contendo tampão detransferência e corrido a 30 volts por 60 a 90 minutos.

Após a transferência, a membrana foi removida do sanduíchee colocada em um recipiente ao qual IX' PBST (10 mM fosfatosalino tamponado, pH7,4, 1% Tween 20) suplementado com 5%leite sem gordura seco. O bloqueio foi feito por Ih a RTcom agitação suave. Após lha solução de bloqueio foisubstituída com 15 ml de 1XPBST + 5% leite seco contendo adiluição correta de anticorpo 473N primário e incubada comagitação suave a 4°C de um dia para o outro. Após aincubação, o anticorpo primário foi removido e a membranalavada 3 vezes (5 minutos cada) com 1XPBST + 5% leite seco.

A membrana foi incubada com anticorpo secundário a umadiluição de 1/5000 em 25 ml de 1XPBST + 5% leite seco por 1h a RT com agitação suave. O Ab secundário foi removido damembrana e a membrana lavada 3 (5 min cada) com 1XPBST + 5%leite seco seguido por 3 lavagens (5 min. cada) de IXtampão de teste (fonecido no kit Western Light Kit TM,Applied Biosystems, Foster City, CA) . O excesso de tampãofoi drenado da membrana e a membrana colocada em umembrulho plástico ao qual 3 ml de solução de substrato(CSPDTM - provido no kit) suplementado com 150 ul deintensificador Nitro-Block II TM (provido no kit) foiadicionado por 5 min no escuro. A membrana foi reveladadrenando-se o excesso de solução e expondo a membrana afilme de raio X Biomax Light X-ray film (Eastman Kodak Co.New Haven, CT) por diferentes tempos de exposição. O filmefoi, então, revelado, por métodos tradicionais.

A análise Western de tecido foliar e radicular foirealizada em um subgrupo de eventos transgênicos RoLipaseque foram positivos ou negativos nos testes de simulação deraiz. Os resultados dessas análises mostraram uma bandaimuno-reativa correspondendo ao tamanho esperado deRoLipase madura (~31 kD) em eventos que foram positivos noteste (ver Fig. 3) . Um precursor de Rolipase purificado(ROL -42 kD) foi incluído na análise Western como umcontrole positivo. A correlação entre proteção de raiz e apresença da forma madura de Rolipase nos eventos testadosapoiam a expressão bem-sucedida de um gene de RoLipase devirus vegetal códon-otimizado.LISTAGEM DE SEQÜÊNCIAS

<110> Requerente: Pioneer Hi-Bred International, Inc.

E.I. DuPont de Nemours & Co.

<120> Titulo: Método para desenhar uma molécula de ácido nucléico, molécula deácido nucléico, vetor, planta transgênica e a progênie desta

<130> Referência do documento: 1877-PCT

<150> No. do pedido de prioridade: 60/668,734

<151> Data de depósito do pedido de prioridade: 05/04/2005

<160> Quantidade de SEQ ID Nos.: 16

<170> Software: Patentln version 3.3

<210> SEQ ID No: 1<211> Comprimento: 1905<212> Tipo: DNA

<213> Organismo: Seqüência Artificial<220> Características:

<223> Outras informações: Seqüência sintética baseada em Bacillus thuringiensis<400> Seqüência: 1

atgggacaca atgttttgaa taacgaaaga aatactgttt gtgaagcaca caatgttgca 60

gtgagagatc cattctcttt cgaacacaag agtcttaata cagttgaaaa ggagtggaca 120

gagtggaaga gaaatgatca ctcactttat gtggatccta ttgtcggaac agttgcctct 180

ttcttgctta agaaggttgg aagtttagtg ggtaagagaa tcttatcaga gttgagatca 240

ttgatcttcc cttctggttc tacaaatttg atgcaagata tcttaagaga gaccgagaaa 300

ttcttgaatc aaagacttaa taccgatact ctcgcccgtg ttaatgctga gctaacaggt 360

ctgcaagcaa acgtggagga gttcaacagg caagtcgaca acttcttaaa ccctaacaga 420

aacgccttac cattatcaat cacctctagt gtgaacacta tgcagcagtt attcttgaac 480

aggcttcctc agttccagat ccagggctat cagctcctac tcttaccatt gttcgctcag 540

gctgctaacc ttcacctctc cttcatccgt gacgttatcc taaacgctga cgaatgggga 600

atcagcgcag caactctgcg aacttaccgc aaccatctta gaaactacac tagagactac 660

tcgaactact gcattaacac ttaccagaca gctttcaggg gtttgaacac acgtcttcac 720

gacatgctcg agttccgaac atacatgttc ctaaacgtct tcgaatacgt gtcaatatgg 780

tcactgttca aataccagtc attattggtc tctagtggcg caaaccttta cgcctccgga 840

agcggaccac agcaaactca gtcgttcaca tcacaagact ggccatttct ctactctcta 900

ttccaagtaa acagtaacta tgttctgaac ggattctccg gagcgcgctt aagccaaacc 960

tttccaaaca tcgtgggttt gccaggaacg actactactc atgctcttct cgctgctaga 1020gtcaactact cgggaggcgt atcatctggc gacattgggg ctagtccttt caaccagaac 1080

ttctcctgta gcacatttct accaccgctg ttaacaccat ttgttaggtc gtggttggac 1140

tctggatctg atcgtggagg agtgaacacc gtcacgaact ggcaaactga aagctttgaa 1200

acaacccttg gtctccgatc cggcgcattc acggcccgcg ggaacagcaa ctactttcct 1260

gactatttca taagaaatat atcgggagta ccactagttg tgaggaacga agatctgcgt 1320

cgaccgttac attataatca aatacgcaat atagaatcac catctggaac tcctggcggt 1380

gcgagagctt atatggtcag tgtacataat aggaagaaca acatatatgc agttcatgaa 1440

aatggaacaa tgatacattt ggctcccgaa gattataccg gtttcacgat atcaccgata 1500

catgcgactc aagtgaacaa tcaaacacgt acctttattt cagaaaaatt tggcaatcaa 1560

ggggattcgc ttcgatttga acaatcaaat acgactgctc gctatacact cagaggaaat 1620

ggaaattctt ataatctata tctgagggtc agttccattg gcaatagcac cattcgtgta 1680

acgattaatg ggcgagttta tactgcaaca aatgtgaata ccacgactaa caatgatgga 1740

gtcaatgata atggtgcccg cttctcagat attaatattg gcaatgtagt tgcgtctgat 1800

aatagtaacg tgccacttga tattaatgtc acattgaatt ccgggaccca atttgatctt 1860

atgaatatta tgtttgtacc tacgaatctc ccaccgctat attag 1905

<210> SEQ ID No:2<211> Comprimento: 634<212> Tipo: PRT

<213> Organismo: Seqüência Artificial<220> Características:

<223> Outras informações: Seqüência sintética baseada em Bacillus thuringiensis<400> Seqüência: 2

Met Gly His Asn Vai Leu Asn Asn Glu Arg Asn Thr Vai Cys Glu Ala1 5 10 15

His Asn Vai Ala Vai Arg Asp Pro Phe Ser Phe Glu His Lys Ser Leu20 25 30

Asn Thr Vai Glu Lys Glu Trp Thr Glu Trp Lys Arg Asn Asp His Ser35 40 45

Leu Tyr Vai Asp Pro Ile Vai Gly Thr Vai Ala Ser Phe Leu Leu Lys50 55 60

Lys Vai Gly Ser Leu Vai Gly Lys Arg Ile Leu Ser Glu Leu Arg Ser65 70 75 80Leu lie Phe Pro Ser Gly Ser Thr Asn Leu Met Gln Asp lie Leu Arg85 90 95

Glu Thr Glu Lys Phe Leu Asn Gln Arg Leu Asn Thr Asp Thr Leu Ala100 105 110

Arg Vai Asn Ala Glu Leu Thr Gly Leu Gln Ala Asn Vai Glu Glu Phe115 120 125

Asn Arg Gln Vai Asp Asn Phe Leu Asn Pro Asn Arg Asn Ala Leu Pro130 135 140

Leu Ser lie Thr Ser Ser Vai Asn Thr Met Gln Gln Leu Phe Leu Asn145 150 155 160

Arg Leu Pro Gln Phe Gln lie Gln Gly Tyr Gln Leu Leu Leu Leu Pro165 170 175

Leu Phe Ala Gln Ala Ala Asn Leu His Leu Ser Phe lie Arg Asp Vai180 185 190

lie Leu Asn Ala Asp Glu Trp Gly lie Ser Ala Ala Thr Leu Arg Thr195 200 205

Tyr Arg Asn His Leu Arg Asn Tyr Thr Arg Asp Tyr Ser Asn Tyr Cys210 215 220

lie Asn Thr Tyr Gln Thr Ala Phe Arg Gly Leu Asn Thr Arg Leu His225 230 235 240

Asp Met Leu Glu Phe Arg Thr Tyr Met Phe Leu Asn Vai Phe Glu Tyr245 250 255

Vai Ser lie Trp Ser Leu Phe Lys Tyr Gln Ser Leu Leu Vai Ser Ser260 265 270

Gly Ala Asn Leu Tyr Ala Ser Gly Ser Gly Pro Gln Gln Thr Gln Ser275 280 285

Phe Thr Ser Gln Asp Trp Pro Phe Leu Tyr Ser Leu Phe Gln Vai Asn290 295 300

Ser Asn Tyr Vai Leu Asn Gly Phe Ser Gly Ala Arg Leu Ser Gln Thr305 310 315 320Phe Pro Asn lie Vai Gly Leu Pro Gly Thr Thr Thr Thr His Ala Leu325 330 335

Leu Ala Ala Arg Vai Asn Tyr Ser Gly Gly Vai Ser Ser Gly Asp lie340 345 350

Gly Ala Ser Pro Phe Asn Gln Asn Phe Ser Cys Ser Thr Phe Leu Pro355 360 365

Pro Leu Leu Thr Pro Phe Vai Arg Ser Trp Leu Asp Ser Gly Ser Asp370 375 380

Arg Gly Gly Vai Asn Thr Vai Thr Asn Trp Gln Thr Glu Ser Phe Glu385 390 395 400

Thr Thr Leu Gly Leu Arg Ser Gly Ala Phe Thr Ala Arg Gly Asn Ser405 410 415

Asn Tyr Phe Pro Asp Tyr Phe lie Arg Asn lie Ser Gly Vai Pro Leu420 425 430

Vai Vai Arg Asn Glu Asp Leu Arg Arg Pro Leu His Tyr Asn Gln lie435 440 445

Arg Asn lie Glu Ser Pro Ser Gly Thr Pro Gly Gly Ala Arg Ala Tyr450 455 460

Met Vai Ser Vai His Asn Arg Lys Asn Asn lie Tyr Ala Vai His Glu465 470 475 480

Asn Gly Thr Met lie His Leu Ala Pro Glu Asp Tyr Thr Gly Phe Thr485 490 495

lie Ser Pro lie His Ala Thr Gln Vai Asn Asn Gln Thr Arg Thr Phe500 505 510

lie Ser Glu Lys Phe Gly Asn Gln Gly Asp Ser Leu Arg Phe Glu Gln515 520 525

Ser Asn Thr Thr Ala Arg Tyr Thr Leu Arg Gly Asn Gly Asn Ser Tyr530 535 540

Asn Leu Tyr Leu Arg Vai Ser Ser lie Gly Asn Ser Thr lie Arg Vai545 550 555 560Thr Ile Asn Gly Arg Vai Tyr Thr Ala Thr Asn Vai Asn Thr Thr Thr565 570 575

Asn Asn Asp Gly Vai Asn Asp Asn Gly Ala Arg Phe Ser Asp Ile Asn580 585 590

Ile Gly Asn Vai Vai Ala Ser Asp Asn Ser Asn Vai Pro Leu Asp Ile595 600 605

Asn Vai Thr Leu Asn Ser Gly Thr Gln Phe Asp Leu Met Asn Ile Met610 615 620

Phe Vai Pro Thr Asn Leu Pro Pro Leu Tyr625 630

<210> SEQ ID No: 3<211> Comprimento: 1101<212> Tipo: DNA

<213> Organismo: Seqüência Artificial<220> Características:

<223> Outras informações: Seqüência sintética baseada em Rhyzopus oryzae<400> Seqüência: 3

gttccagtct caggaaagtc tggttcttca actacagctg tttctgcatc agataactcc 60

gccctacctc ctctgatttc atcgagatgc gctccacctt caaacaaggg atcaaagtca 120

gatttgcaag ctgaaccata ttatatgcaa aaaaacaccg agtggtacga gtctcacggt 180

ggcaacttaa ctagtatcgg aaagagagat gataacttgg ttggaggaat gacacttgac 240

cttccatccg acgctccacc aatcagccta tcgggttcaa ccaactctgc aagtgacgga 300

ggtaaggtcg ttgcagctac tactgcacaa atccaggagt tcacaaagta cgccggaatc 360

gcggctacag cttactgcag atccgttgtg cctgggaaca agtgggactg tgttcagtgc 420

cagaaatggg tgcccgacgg aaagattata actacattca ccagcctgtt atcggacacg 480

aatggatacg tcttgaggtc agataaacag aaaactatct accttgtatt ccgtggtact 540

aactctttcc gaagtgctat tactgacata gtcttcaatt tctccgatta taaaccggtt 600

aaaggcgcaa aggttcacgc cgggtttctc agctcgtacg agcaagtggt caatgattat 660

ttcccagtag ttcaggaaca actaacagcg aatcctacct ataaagtgat agtcacggga 720

cattcactgg gtggcgctca agcattattg gccgggatgg atctttatca acgcgagccc 780

agactctctc cgaagaatct aagtatattc actgtaggag gtccaagggt tggcaatcct 840

acatttgcgt attatgtgga atccaccggg ataccctttc aacgcacggt ccacaaacga 900

gatatagtac cgcatgttcc acctcaaagc tttggatttc tgcatcccgg tgtggaatca 960tggattaaat ctggcacttc aaatgtccaa atttgtacat ccgaaattga aaccaaagat 1020tgtagcaatt caattgtgcc gtttacgtct ttattggatc atcttagtta ctttgatatt 1080aatgaagggt cctgtctcta g 1101

<210> SEQ ID No: 4<211> Comprimento: 366<212> Tipo: PRT

<213> Organismo: Seqüência Artificial<220> Características:

<223> Outras informações: Seqüência sintética baseada em Rhyzopus oryzae<400> Seqüência: 4

Vai Pro Vai Ser Gly Lys Ser Gly Ser Ser Thr Thr Ala Vai Ser Ala1 5 10 15

Ser Asp Asn Ser Ala Leu Pro Pro Leu Ile Ser Ser Arg Cys Ala Pro20 25 30

Pro Ser Asn Lys Gly Ser Lys Ser Asp Leu Gln Ala Glu Pro Tyr Tyr35 40 45

Met Gln Lys Asn Thr Glu Trp Tyr Glu Ser His Gly Gly Asn Leu Thr50 55 60

Ser Ile Gly Lys Arg Asp Asp Asn Leu Vai Gly Gly Met Thr Leu Asp65 70 75 80

Leu Pro Ser Asp Ala Pro Pro Ile Ser Leu Ser Gly Ser Thr Asn Ser85 90 95

Ala Ser Asp Gly Gly Lys Vai Vai Ala Ala Thr Thr Ala Gln Ile Gln100 105 110

Glu Phe Thr Lys Tyr Ala Gly Ile Ala Ala Thr Ala Tyr Cys Arg Ser115 120 125

Vai Vai Pro Gly Asn Lys Trp Asp Cys Vai Gln Cys Gln Lys Trp Vai130 135 140

Pro Asp Gly Lys Ile Ile Thr Thr Phe Thr Ser Leu Leu Ser Asp Thr145 150 155 160

Asn Gly Tyr Vai Leu Arg Ser Asp Lys Gln Lys Thr Ile Tyr Leu Vai165 170 175Phe Arg Gly Thr Asn Ser Phe Arg Ser Ala lie Thr Asp lie Vai Phe180 185 190

Asn Phe Ser Asp Tyr Lys Pro Vai Lys Gly Ala Lys Vai His Ala Gly195 200 205

Phe Leu Ser Ser Tyr Glu Gln Vai Vai Asn Asp Tyr Phe Pro Vai Vai210 215 220

Gln Glu Gln Leu Thr Ala Asn Pro Thr Tyr Lys Vai lie Vai Thr Gly225 230 235 240

His Ser Leu Gly Gly Ala Gln Ala Leu Leu Ala Gly Met Asp Leu Tyr245 250 255

Gln Arg Glu Pro Arg Leu Ser Pro Lys Asn Leu Ser lie Phe Thr Vai260 265 270

Gly Gly Pro Arg Vai Gly Asn Pro Thr Phe Ala Tyr Tyr Vai Glu Ser275 280 285

Thr Gly lie Pro Phe Gln Arg Thr Vai His Lys Arg Asp lie Vai Pro290 295 300

His Vai Pro Pro Gln Ser Phe Gly Phe Leu His Pro Gly Vai Glu Ser305 310 315 320

Trp lie Lys Ser Gly Thr Ser Asn Vai Gln lie Cys Thr Ser Glu lie325 330 335

Glu Thr Lys Asp Cys Ser Asn Ser lie Vai Pro Phe Thr Ser Leu Leu340 345 350

Asp His Leu Ser Tyr Phe Asp lie Asn Glu Gly Ser Cys Leu355 360 365

<210> SEQ ID No: 5<211> Comprimento: 72<212> Tipo: DNA

<213> Organismo: Hordeum leporinum<400> Seqüência: 5

atggcaaata agcatttgtc acttagttta ttcttggtct tattgggact ttcagcatct 60

ctcgccagtg ga

72<210> SEQ ID No: 6<211> Comprimento: 24<212> Tipo: PRT

<213> Organismo: Hordeum leporinum<400> Seqüência: 6

Met Ala Asn Lys His Leu Ser Leu Ser Leu Phe Leu Vai Leu Leu Gly1 5 10 15

Leu Ser Ala Ser Leu Ala Ser Gly20

<210> SEQ ID No: 7<211> Comprimento: 3468<212> Tipo: DNA

<213> Organismo: Seqüência Artificial<220> Características:

<223> Outras informações: Seqüência sintética baseada em Bacillus thuringiensis<400> Seqüência: 7

atggataaca atccgaacat caatgaatgc attccttata attgtttaag taaccctgaa 60

gtagaagtat taggtggaga aagaatagaa actggttaca ccccaatcga tatttccttg 120

tcgctaacgc aatttctttt gagtgaattt gttcccggtg ctggatttgt gttaggacta 180

gttgatataa tatggggaat ttttggtccc tctcaatggg acgcatttct tgtacaaatt 240

gaacagttaa ttaaccaaag aatagaagaa ttcgctagga accaagccat ttctagatta 300

gaaggactaa gcaatcttta tcaaatttac gcagaatctt ttagagagtg ggaagcagat 360

cctactaatc cagcattaag agaagagatg cgtattcaat tcaatgacat gaacagtgcc 420

cttacaaccg ctattcctct ttttgcagtt caaaattatc aagttcctct tttatcagta 480

tatgttcaag ctgcaaattt acatttatca gttttgagag atgtttcagt gtttggacaa 540

aggtggggat ttgatgccgc gactatcaat agtcgttata atgatttaac taggcttatt 600

ggcaactata cagatcatgc tgtacgctgg tacaatacgg gattagagcg tgtatgggga 660

ccggattcta gagattggat aagatataat caatttagaa gagaattaac actaactgta 720

ttagatatcg tttctctatt tccgaactat gatagtagaa cgtatccaat tcgaacagtt 780

tcccaattaa caagagaaat ttatacaaac ccagtattag aaaattttga tggtagtttt 840

cgaggctcgg ctcagggcat agaaggaagt attaggagtc cacatttgat ggatatactt 900

aacagtataa ccatctatac ggatgctcat agaggagaat attattggtc agggcatcaa 960

ataatggctt ctcctgtagg gttttcgggg ccagaattca cttttccgct atatggaact 1020atgggaaatg cagctccaca acaacgtatt

acattatcgt ccactttata tagaagacct

tctgttcttg acgggacaga atttgcttat

tacagaaaaa gcggaacggt agattcgctg

ccacctaggc aaggatttag tcatcgatta

agtaatagta gtgtaagtat aataagagct

gaatttaata atataattcc ttcatcacaa

aatcttggct ctggaacttc tgtcgttaaa

cgaagaactt cacctggcca gatttcaacc

caaagatatc gggtaagaat tcgctacgct

attgacggaa gacctattaa tcaggggaat

ttacagtccg gaagctttag gactgtaggt

tcaagtgtat ttacgttaag tgctcatgtc

cgaattgaat ttgttccggc agaagtaacc

caaaaggcgg tgaatgagct gtttacttct

acggattatc atattgatca agtatccaat

ctggatgaaa aaaaagaatt gtccgagaaa

cggaatttac ttcaagatcc aaactttaga

agaggaagta cggatattac catccaagga

acgctattgg gtacctttga tgagtgctat

tcgaaattaa aagcctatac ccgttaccaa

ttagaaatct atttaattcg ctacaatgcc

ggttccttat ggccgctttc agccccaagt

catttctcct tggacattga tgttggatgt

gtgatattca agattaagac gcaagatggc

gaagagaaac cattagtagg agaagcacta

agagacaaac gtgaaaaatt ggaatgggaa

tctgtagatg ctttatttgt aaactctcaa

gcgatgattc atgcggcaga taaacgcgtt

ctgtctgtga ttccgggtgt caatgcggct

actgcattct ccctatatga tgcgagaaat

gttgctcaac taggtcaggg cgtgtataga 1080

tttaatatag ggataaataa tcaacaacta 1140

ggaacctcct caaatttgcc atccgctgta 1200

gatgaaatac cgccacagaa taacaacgtg 1260

agccatgttt caatgtttcg ttcaggcttt 1320

cctatgttct cttggataca tcgtagtgct 1380

attacacaaa tacctttaac aaaatctact 1440

ggaccaggat ttacaggagg agatattctt 1500

ttaagagtaa atattactgc accattatca 1560

tctaccacaa atttacaatt ccatacatca 1620

ttttcagcaa ctatgagtag tgggagtaat 1680

tttactactc cgtttaactt ttcaaatgga 1740

ttcaattcag gcaatgaagt ttatatagat 1800

tttgaggcag aatatgattt agaaagagca 1860

tccaatcaaa tcgggttaaa aacagatgtg 1920

ttagttgagt gtttatctga tgaattttgt 1980

gtcaaacatg cgaagcgact tagtgatgag 2040

gggatcaata gacaactaga ccgtggctgg 2100

ggcgatgacg tattcaaaga gaattacgtt 2160

ccaacgtatt tatatcaaaa aatagatgag 2220

ttaagagggt atatcgaaga tagtcaagac 2280

aaacacgaaa cagtaaatgt gccaggtacg 2340

ccaatcggaa aatgtgccca tcattcccat 2400

acagacttaa atgaggactt aggtgtatgg 24 60

catgcaagac taggaaatct agaatttctc 2520

gctcgtgtga aaagagcgga gaaaaaatgg 2580

acaaatattg tttataaaga ggcaaaagaa 2640

tatgatagat tacaagcgga taccaacatc 2700

catagcattc gagaagctta tctgcctgag 27 60

atttttgaag aattagaagg gcgtattttc 2820

gtcattaaaa atggtgattt taataatggc 2880ttatcctgct ggaacgtgaagtccttgttg ttccggaatgcgtggctata tccttcgtgtattcatgaga tcgagaacaagtatatccaa acaacacggtggtacgtaca cttctcgtaaccagctgatt atgcatcagcccttgtgaat ctaacagaggaaagaattag agtacttcccggaacattca tcgtggacag

<210> SEQ ID No: 8<211> Comprimento: 3468<212> Tipo: DNA

<213> Organismo: Seqüência Artificial<220> Características:

<223> Outras informações: Seqüência sintética baseada em Bacillus thuringiensis<400> Seqüência: 8

atggacaaca accccaacat caacgagtgc atcccctaca actgcctgag caaccccgag 60

gtggaggtgc tgggcggcga gcgcatcgag accggctaca cccccatcga catcagcctg 120

agcctgaccc agttcctgct gagcgagttc gtgcccggcg ccggcttcgt gctgggcctg 180

gtggacatca tctggggcat cttcggcccc agccagtggg acgccttcct ggtgcagatc 240

gagcagctga tcaaccagcg catcgaggag ttcgcccgca accaggccat cagccgcctg 300

gagggcctga gcaacctgta ccagatctac gccgagagct tccgcgagtg ggaggccgac 360

cccaccaacc ccgccctgcg cgaggagatg cgcatccagt tcaacgacat gaacagcgcc 420

ctgaccaccg ccatccccct gttcgccgtg cagaactacc aggtgcccct gctgagcgtg 480

tacgtgcagg ccgccaacct gcacctgagc gtgctgcgcg acgtgagcgt gttcggccag 540

cgctggggct tcgacgccgc caccatcaac agccgctaca acgacctgac ccgcctgatc 600

ggcaactaca ccgaccacgc cgtgcgctgg tacaacaccg gcctggagcg cgtgtggggc 660

cccgacagcc gcgactggat ccgctacaac cagttccgcc gcgagctgac cctgaccgtg 720

ctggacatcg tgagcctgtt ccccaactac gacagccgca cctaccccat ccgcaccgtg 780

agccagctga cccgcgagat ctacaccaac cccgtgctgg agaacttcga cggcagcttc 840

agggcatgta gatgtagaag aacaaaacaa ccaccgttcg 2940

ggaagcagaa gtgtcacaag aagttcgtgt ctgtccgggt 3000

cacagcgtac aaggagggat atggagaagg ttgcgtaacc 3060

tacagacgaa ctgaagttta gcaactgtgt agaagaggaa 3120

aacgtgtaat gattatactg cgactcaaga agaatatgag 3180

tcgaggatat gacggagcct atgaaagcaa ttcttctgta 3240

ctatgaagaa aaagcatata cagatggacg aagagacaat 3300

atatggggat tacacaccac taccagctgg ctatgtgaca 3360

agaaaccgat aaggtatgga ttgagatcgg agaaacggaa 3420

cgtggaatta cttcttatgg aggaataa 3468cgcggcagcg cccagggcat cgagggcagc atccgcagcc cccacctgat ggacatcctg 900

aacagcatca ccatctacac cgacgcccac cgcggcgagt actactggag cggccaccag 960

atcatggcca gccccgtggg cttcagcggc cccgagttca ccttccccct gtacggcacc 1020

atgggcaacg ccgcccccca gcagcgcatc gtggcccagc tgggccaggg cgtgtaccgc 1080

accctgagca gcaccctgta ccgccgcccc ttcaacatcg gcatcaacaa ccagcagctg 1140

agcgtgctgg acggcaccga gttcgcctac ggcaccagca gcaacctgcc cagcgccgtg 1200

taccgcaaga gcggcaccgt ggacagcctg gacgagatcc ccccccagaa caacaacgtg 1260

cccccccgcc agggcttcag ccaccgcctg agccacgtga gcatgttccg cagcggcttc 1320

agcaacagca gcgtgagcat catccgcgcc cccatgttca gctggatcca ccgcagcgcc 1380

gagttcaaca acatcatccc cagcagccag atcacccaga tccccctgac caagagcacc 1440

aacctgggca gcggcaccag cgtggtgaag ggccccggct tcaccggcgg cgacatcctg 1500

cgccgcacca gccccggcca gatcagcacc ctgcgcgtga acatcaccgc ccccctgagc 1560

cagcgctacc gcgtgcgcat ccgctacgcc agcaccacca acctgcagtt ccacaccagc 1620

atcgacggcc gccccatcaa ccagggcaac ttcagcgcca ccatgagcag cggcagcaac 1680

ctgcagagcg gcagcttccg caccgtgggc ttcaccaccc ccttcaactt cagcaacggc 1740

agcagcgtgt tcaccctgag cgcccacgtg ttcaacagcg gcaacgaggt gtacatcgac 1800

cgcatcgagt tcgtgcccgc cgaggtgacc ttcgaggccg agtacgacct ggagcgcgcc 1860

cagaaggccg tgaacgagct gttcaccagc agcaaccaga tcggcctgaa gaccgacgtg 1920

accgactacc acatcgacca ggtgagcaac ctggtggagt gcctgagcga cgagttctgc 1980

ctggacgaga agaaggagct gagcgagaag gtgaagcacg ccaagcgcct gagcgacgag 2040

cgcaacctgc tgcaggaccc caacttccgc ggcatcaacc gccagctgga ccgcggctgg 2100

cgcggcagca ccgacatcac catccagggc ggcgacgacg tgttcaagga gaactacgtg 2160

accctgctgg gcaccttcga cgagtgctac cccacctacc tgtaccagaa gatcgacgag 2220

agcaagctga aggcctacac ccgctaccag ctgcgcggct acatcgagga cagccaggac 2280

ctggagatct acctgatccg ctacaacgcc aagcacgaga ccgtgaacgt gcccggcacc 2340

ggcagcctgt ggcccctgag cgcccccagc cccatcggca agtgcgccca ccacagccac 2400

cacttcagcc tggacatcga cgtgggctgc accgacctga acgaggacct gggcgtgtgg 2460

gtgatcttca agatcaagac ccaggacggc cacgcccgcc tgggcaacct ggagttcctg 2520

gaggagaagc ccctggtggg cgaggccctg gcccgcgtga agcgcgccga gaagaagtgg 2580

cgcgacaagc gcgagaagct ggagtgggag accaacatcg tgtacaagga ggccaaggag 2640

agcgtggacg ccctgttcgt gaacagccag tacgaccgcc tgcaggccga caccaacatc 2700gccatgatcc acgccgccga caagcgcgtg cacagcatcc gcgaggccta cctgcccgag 2760

ctgagcgtga tccccggcgt gaacgccgcc atcttcgagg agctggaggg ccgcatcttc 2820

accgccttca gcctgtacga cgcccgcaac gtgatcaaga acggcgactt caacaacggc 2880

ctgagctgct ggaacgtgaa gggccacgtg gacgtggagg agcagaacaa ccaccgcagc 2940

gtgctggtgg tgcccgagtg ggaggccgag gtgagccagg aggtgcgcgt gtgccccggc 3000

cgcggctaca tcctgcgcgt gaccgcctac aaggagggct acggcgaggg ctgcgtgacc 3060

atccacgaga tcgagaacaa caccgacgag ctgaagttca gcaactgcgt ggaggaggag 3120

gtgtacccca acaacaccgt gacctgcaac gactacaccg ccacccagga ggagtacgag 3180

ggcacctaca ccagccgcaa ccgcggctac gacggcgcct acgagagcaa cagcagcgtg 3240

cccgccgact acgccagcgc ctacgaggag aaggcctaca ccgacggccg ccgcgacaac 3300

ccctgcgaga gcaaccgcgg ctacggcgac tacacccccc tgcccgccgg ctacgtgacc 3360

aaggagctgg agtacttccc cgagaccgac aaggtgtgga tcgagatcgg cgagaccgag 3420

ggcaccttca tcgtggacag cgtggagctg ctgctgatgg aggagtag 3468

<210> SEQ ID No: 9<211> Comprimento: 1947<212> Tipo: DNA

<213> Organismo: Seqüência Artificial<220> Caracteristicas:

<223> Outras informações: Seqüência sintética baseada em Bacillus thuringiensis<400> Seqüência: 9

atggacaaca accccaacat caacgagtgc atcccctaca actgcctgag caaccccgag 60

gtggaggtgc tgggcggcga gcgcatcgag accggctaca cccccatcga catcagcctg 120

agcctgaccc agttcctgct gagcgagttc gtgcccggcg ccggcttcgt gctgggcctg 180

gtggacatca tctggggcat cttcggcccc agccagtggg acgccttcct ggtgcagatc 240

gagcagctga tcaaccagcg catcgaggag ttcgcccgca accaggccat cagccgcctg 300

gagggcctga gcaacctgta ccaaatctac gccgagagct tccgcgagtg ggaggccgac 360

cccaccaacc ccgccctgcg cgaggagatg cgcatccagt tcaacgacat gaacagcgcc 420

ctgaccaccg ccatccccct gttcgccgtg cagaactacc aggtgcccct gctgagcgtg 480

tacgtgcagg ccgccaacct gcacctgagc gtgctgcgcg acgtcagcgt gttcggccag 540

cgctggggct tcgacgccgc caccatcaac agccgctaca acgacctgac ccgcctgatc 600

ggcaactaca ccgaccacgc cgtgcgctgg tacaacaccg gcctggagcg cgtgtggggt 660cccgacagcc gcgactggat caggtacaac cagttccgcc gcgagctgac cctgaccgtg 720

ctggacatcg tgagcctgtt ccccaactac gacagccgca cctaccccat ccgcaccgtg 780

agccagctga cccgcgagat ttacaccaac cccgtgctgg agaacttcga cggcagcttc 840

cgcggcagcg cccagggcat cgagggcagc atccgcagcc cccacctgat ggacatcctg 900

aacagcatca ccatctacac cgacgcccac cgcggcgagt actactggag cggccaccag 960

atcatggcca gccccgtcgg cttcagcggc cccgagttca ccttccccct gtacggcacc 1020

atgggcaacg ctgcacctca gcagcgcatc gtggcacagc tgggccaggg agtgtaccgc 1080

accctgagca gcaccctgta ccgtcgacct ttcaacatcg gcatcaacaa ccagcagctg 1140

agcgtgctgg acggcaccga gttcgcctac ggcaccagca gcaacctgcc cagcgccgtg 1200

taccgcaaga gcggcaccgt ggacagcctg gacgagatcc cccctcagaa caacaacgtg 1260

ccacctcgac agggcttcag ccaccgtctg agccacgtga gcatgttccg cagtggcttc 1320

agcaacagca gcgtgagcat catccgtgca cctatgttca gctggattca ccgcagtgcc 1380

gagttcaaca acatcatccc cagcagccaa atcacccaga tccccctgac caagagcacc 1440

aacctgggca gcggcaccag cgtggtgaag ggccccggct tcaccggcgg cgacatcctg 1500

cgccgcacca gccccggcca gatcagcacc ctgcgcgtga acatcaccgc ccccctgagc 1560

cagcgctacc gcgtccgcat ccgctacgcc agcaccacca acctgcagtt ccacaccagc 1620

atcgacggcc gccccatcaa ccagggcaac ttcagcgcca ccatgagcag cggcagcaac 1680

ctgcagagcg gcagcttccg caccgtgggc ttcaccaccc ccttcaactt cagcaacggc 1740

agcagcgtgt tcaccctgag cgcccacgtg ttcaacagcg gcaacgaggt gtacatcgac 1800

cgcatcgagt tcgtgcccgc cgaggtgacc ttcgaggccg agtacgacct ggagagggct 1860

cagaaggccg tgaacgagct gttcaccagc agcaaccaga tcggcctgaa gaccgacgtg 1920

accgactacc acatcgatca ggtgtag 1947

<210> SEQ ID No: 10<211> Comprimento: 3468<212> Tipo: DNA

<213> Organismo: Seqüência Artificial<220> Características:

<223> Outras informações: Seqüência sintética baseada em Bacillus thuringiensis<400> Seqüência: 10

atggacaaca accccaacat caacgagtgc atcccctaca actgcctgag caaccccgag 60gtggaggtgc tgggcggcga gcgcatcgag accggctaca cccccatcga catcagcctg 120agcctgaccc agttcctgct gagcgagttc gtgcccggcg ccggcttcgt gctgggcctg 180

gtggacatca tctggggcat cttcggcccc agccagtggg acgccttcct ggtgcagatc 240

gagcagctga tcaaccagcg catcgaggag ttcgcccgca accaggccat cagccgcctg 300

gagggcctga gcaacctgta ccaaatctac gccgagagct tccgcgagtg ggaggccgac 360

cccaccaacc ccgccctgcg cgaggagatg cgcatccagt tcaacgacat gaacagcgcc 420

ctgaccaccg ccatccccct gttcgccgtg cagaactacc aggtgcccct gctgagcgtg 480

tacgtgcagg ccgccaacct gcacctgagc gtgctgcgcg acgtcagcgt gttcggccag 540

cgctggggct tcgacgccgc caccatcaac agccgctaca acgacctgac ccgcctgatc 600

ggcaactaca ccgaccacgc cgtgcgctgg tacaacaccg gcctggagcg cgtgtggggt 660

cccgacagcc gcgactggat caggtacaac cagttccgcc gcgagctgac cctgaccgtg 720

ctggacatcg tgagcctgtt ccccaactac gacagccgca cctaccccat ccgcaccgtg 780

agccagctga cccgcgagat ttacaccaac cccgtgctgg agaacttcga cggcagcttc 840

cgcggcagcg cccagggcat cgagggcagc atccgcagcc cccacctgat ggacatcctg 900

aacagcatca ccatctacac cgacgcccac cgcggcgagt actactggag cggccaccag 960

atcatggcca gccccgtcgg cttcagcggc cccgagttca ccttccccct gtacggcacc 1020

atgggcaacg ctgcacctca gcagcgcatc gtggcacagc tgggccaggg agtgtaccgc 1080

accctgagca gcaccctgta ccgtcgacct ttcaacatcg gcatcaacaa ccagcagctg 1140

agcgtgctgg acggcaccga gttcgcctac ggcaccagca gcaacctgcc cagcgccgtg 1200

taccgcaaga gcggcaccgt ggacagcctg gacgagatcc cccctcagaa caacaacgtg 1260

ccacctcgac agggcttcag ccaccgtctg agccacgtga gcatgttccg cagtggcttc 1320

agcaacagca gcgtgagcat catccgtgca cctatgttca gctggattca ccgcagtgcc 1380

gagttcaaca acatcatccc cagcagccag atcacccaga tccccctgac caagagcacc 1440

aacctgggca gcggcaccag cgtggtgaag ggccccggct tcaccggcgg cgacatcctg 1500

cgccgcacca gccccggcca gatcagcacc ctgcgcgtga acatcaccgc ccccctgagc 1560

cagcgctacc gcgtccgcat ccgctacgcc agcaccacca acctgcagtt ccacaccagc 1620

atcgacggcc gccccatcaa ccagggcaac ttcagcgcca ccatgagcag cggcagcaac 1680

ctgcagagcg gcagcttccg caccgtgggc ttcaccaccc ccttcaactt cagcaacggc 1740

agcagcgtgt tcaccctgag cgcccacgtg ttcaacagcg gcaacgaggt gtacatcgac 1800

cgcatcgagt tcgtgcccgc cgaggtgacc ttcgaggccg agtacgacct ggagagggct 1860

cagaaggccg tgaacgagct gttcaccagc agcaaccaga tcggcctgaa gaccgacgtg 1920

accgactacc acatcgatca ggtgagcaac ctggtggagt gcctgagcga cgagttctgc 1980ctggacgaga agaaggagct gagcgagaag gtgaagcacg ccaagcgcct gagcgacgag 2040

cgcaacctgc tgcaggaccc caacttccgc ggcatcaacc gccagctgga ccgcggctgg 2100

cgcggcagca ccgacatcac catccagggc ggcgacgacg tgttcaagga gaactacgtg 2160

accctgctgg gcaccttcga cgagtgctac cccacctacc tgtaccagaa gatcgacgag 2220

agcaagctga aggcctacac ccgctaccag ctgcgcggct acatcgagga cagccaggac 2280

ctggagatct acctgatccg ctacaacgcc aagcacgaga ccgtgaacgt gcccggcacc 2340

ggcagcctgt ggcccctgag cgcccccagc cccatcggca agtgcgccca ccacagccac 2400

cacttcagcc tggacatcga cgtgggctgc accgacctga acgaggacct gggcgtgtgg 24 60

gtgatcttca agatcaagac ccaggacggc cacgcccgcc tgggcaacct ggagttcctg 2520

gaggagaagc ccctggtggg cgaggccctg gcccgcgtga agcgcgccga gaagaagtgg 2580

cgcgacaagc gcgagaagct ggagtgggag accaacatcg tgtacaagga ggccaaggag 2640

agcgtggacg ccctgttcgt gaacagccag tacgaccgcc tgcaggccga caccaacatc 2700

gccatgatcc acgccgccga caagcgcgtg cacagcattc gcgaggccta cctgcccgag 2760

ctgagcgtga tccccggcgt gaacgccgcc atcttcgagg agctggaggg ccgcatcttc 2820

accgccttca gcctgtacga cgcccgcaac gtgatcaaga acggcgactt caacaacggc 2880

ctgagctgct ggaacgtgaa gggccacgtg gacgtggagg agcagaacaa ccaccgcagc 2940

gtgctggtgg tgcccgagtg ggaggccgag gtgagccagg aggtgcgcgt gtgccccggc 3000

cgcggctaca tcctgcgcgt gaccgcctac aaggagggct acggcgaggg ctgcgtgacc 3060

atccacgaga tcgagaacaa caccgacgag ctcaagttca gcaactgcgt ggaggaggag 3120

gtgtacccca acaacaccgt gacctgcaac gactacaccg ccacccagga ggagtacgag 3180

ggcacctaca ccagccgcaa ccgcggctac gacggcgcct acgagagcaa cagcagcgtg 3240

cccgccgact acgccagcgc ctacgaggag aaggcctaca ccgacggccg ccgcgacaac 3300

ccctgcgaga gcaaccgcgg ctacggcgac tacacccccc tgcccgccgg ctacgtgacc 3360

aaggagctgg agtacttccc cgagaccgac aaggtgtgga tcgagatcgg cgagaccgag 3420

ggcaccttca tcgtggacag cgtggagctg ctgctgatgg aggagtag 3468

<210> SEQ ID No: 11<211> Comprimento: 1845<212> Tipo: DNA

<213> Organismo: Seqüência Artificial<220> Características:

<223> Outras informações: Seqüência sintética baseada em Bacillus thuringiensis<400> Seqüência: 11

atggacaaca acccaaacat caacgaatgc attccataca actgcttgag taacccagaa 60

gttgaagtac ttggtggaga acgcattgaa accggttaca ctcccatcga catctccttg 120

tccttgacac agtttctgct cagcgagttc gtgccaggtg ctgggttcgt tctcggacta 180

gttgacatca tctggggtat ctttggtcca tctcaatggg atgcattcct ggtgcaaatt 240

gagcagttga tcaaccagag gatcgaagag ttcgccagga accaggccat ctctaggttg 300

gaaggattga gcaatctcta ccaaatctat gcagagagct tcagagagtg ggaagccgat 360

cctactaacc cagctctccg cgaggaaatg cgtattcaat tcaacgacat gaacagcgcc 420

ttgaccacag ctatcccatt gttcgcagtc cagaactacc aagttcctct cttgtccgtg 480

tacgttcaag cagctaatct tcacctcagc gtgcttcgag acgttagcgt gtttgggcaa 540

aggtggggat tcgatgctgc aaccatcaat agccgttaca acgaccttac taggctgatt 600

ggaaactaca ccgaccacgc tgttcgttgg tacaacactg gcttggagcg tgtctggggt 660

cctgattcta gagattggat tagatacaac cagttcagga gagaattgac cctcacagtt 720

ttggacattg tgtctctctt cccgaactat gactccagaa cctaccctat ccgtacagtg 780

tcccaactta ccagagaaat ctatactaac ccagttcttg agaacttcga cggtagcttc 840

cgtggttctg cccaaggtat cgaaggctcc atcaggagcc cacacttgat ggacatcttg 900

aacagcataa ctatctacag cgatgctcac agaggagagt attactggtc tggacaccag 960

atcatggcct ctccagttgg attcagcggg cccgagttta cctttcctct ctatggaact 1020

atgggaaacg ccgctccaca acaacgtatc gttgctcaac taggtcaggg tgtctacaga 1080

accttgtctt ccaccttgta cagaagaccc ttcaatatcg gtatcaacaa ccagcaactt 1140

tccgttcttg acggaacaga gttcgcctat ggaacctctt ctaacttgcc atccgctgtt 1200

tacagaaaga gcggaaccgt tgattccttg gacgaaatcc caccacagaa caacaatgtg 1260

ccacccaggc aaggattctc ccacaggttg agccacgtgt ccatgttccg ttccggattc 1320

agcaacagtt ccgtgagcat catcagagct cctatgttct catggattca tcgtagtgct 1380

gagttcaaca atatcattcc ttcctctcaa atcacccaaa tcccattgac caagtctact 1440

aaccttggat ctggaacttc tgtcgtgaaa ggaccaggct tcacaggagg tgatattctt 1500

agaagaactt ctcctggcca gattagcacc ctcagagtta acatcactgc accactttct 1560

caaagatatc gtgtcaggat tcgttacgca tctaccacta acttgcaatt ccacacctcc 1620

atcgacggaa ggcctatcaa tcagggtaac ttctccgcaa ccatgtcaag cggcagcaac 1680

ttgcaatccg gcagcttcag aaccgtcggt ttcactactc ctttcaactt ctctaacgga 1740

tcaagcgttt tcacccttag cgctcatgtg ttcaattctg gcaatgaagt gtacattgac 1800cgtattgagt ttgtgcctgc cgaagttacc ttcgaggctg agtac 1845

<210> SEQ ID No: 12<211> Comprimento: 1833<212> Tipo: DNA

<213> Organismo: Seqüência Artificial<220> Características:

<223> Outras informações: Seqüência sintética baseada em Bacillus thuringiensis<400> Seqüência: 12

atggctgcag acaacaacac ggaggccctc gatagctcta ccaccaaaga tgtcattcag 60

aagggcatct ccgttgtggg tgatctcctt ggcgttgttg gtttcccctt tggtggtgcc 120

cttgtttcgt tctacactaa ctttctgaat actatttggc ccagcgaaga cccttggaag 180

gcttttatgg agcaagtgga agctttgatg gatcagaaga tcgctgatta tgcaaagaac 240

aaagctcttg ctgagctcca gggccttcag aacaacgtcg aagattatgt gagtgcactg 300

agttcatggc aaaagaatcc tgtgtcctca cgaaatccac atagccaggg gcgcataagg 360

gagctgttct ctcaagcaga aagtcacttc cggaattcaa tgccttcctt tgccatctct 420

gggtacgagg ttctctttct tacaacctac gctcaagctg ccaacacaca tctgttctta 480

ctaaaagacg ctcaaatcta tggtgaagaa tggggatacg agaaagaaga tatcgctgag 540

ttctacaagc gtcaactaaa acttactcaa gagtatactg accactgtgt caaatggtat 600

aatgttggat tggataagtt gagaggttca tcttatgaat cttgggtaaa ctttaaccgg 660

taccgcagag agatgacatt gacagtgctc gacttgattg cactatttcc attgtatgat 720

gttcgactct acccaaagga ggttaaaacc gaattgacta gagacgtttt aaccgatccc 780

attgtcggag tcaacaacct cagaggctac ggaacaacct tctctaacat agaaaactac 840

attcgtaaac cacatctatt cgactatctg cacagaattc agtttcacac gcggttccaa 900

ccaggatact atggaaatga ctctttcaac tattggtccg gtaattatgt ttcaactaga 960

cccagcatag gatctaatga catcatcacc tctccattct acggaaacaa gtcctccgag 1020

cctgtgcaaa acttggagtt taatggagag aaagtctata gagccgtggc caataccaat 1080

cttgccgtct ggccgtccgc tgtgtactca ggtgttacca aagtggaatt cagccaatac 1140

aatgatcaga cagatgaagc aagtactcaa acttacgact caaagaggaa tgttggcgcg 1200

gtcagctggg attctatcga tcaactccct ccagaaacca ccgatgaacc tctagagaag 1260

ggttatagcc atcaactcaa ttacgtaatg tgctttctca tgcagggtag tagaggtacc 1320

atcccagtgt taacttggac tcacaagagt gtagacttct tcaacatgat tgattcgaaa 1380aagattactc aacttccgtt ggtaaaggcc tacaagttac aatctggtgc ttccgttgtc 1440

gcaggtccta ggtttacagg aggagatatc attcaatgca ctgagaatgg gtccgcggca 1500

actatctacg ttacacctga tgtgtcgtac tctcaaaagt atcgtgctag aattcattat 1560

gcttctacct ctcagataac attcacacta agcttggacg gggctccatt caaccaatac 1620

tacttcgata agaccatcaa caaaggagac acactcacgt ataattcatt caacttagcc 1680

agcttcagca ctccattcga attgtcaggg aacaacttgc agataggcgt cacaggattg 1740

agtgctggtg acaaggttta catcgacaag attgagttca ttccagtgaa ccttaggtcc 1800

ccaggaaccg agcttgagtt catcgacatc tag 1833

<210> SEQ ID No: 13<211> Comprimento: 216<212> Tipo: DNA

<213> Organismo: Seqüência Artificial<220> Características:

<223> Outras informações: Seqüência sintética baseada em Bacillus thuringiensis<400> Seqüência: 13

atgaagaaga acggctacgc cgtggacagc agcggcaagg ccccagagtg cctcctcagc 60aactactgca acaaccagtg caccaaggtg cactacgccg acaagggcta ctgctgcctc 120ctcagctgct actgcttcgg cctcaacgac gacaagaagg tgcttgagat cagcgacacc 180aggaagagct actgcgacac caccatcatc aactaa 216

<210> SEQ ID No: 14<211> Comprimento: 192<212> Tipo: DNA

<213> Organismo: Seqüência Artificial<220> Características:

<223> Outras informações: Seqüência sintética baseada em Bacillus thuringiensis<400> Seqüência: 14

atggccgacg gctacgtgaa gggcaaaagc ggctgcaaaa tcagctgctt cctggacaac 60gacctgtgca acgccgactg caaatactac ggcggcaaac tgaacagctg gtgcatccca 120gacaaaagcg gctactgctg gtgcccaaac aaaggctgga acagcatcaa aagcgagacc 180aacacctgct aa 192

<210> SEQ ID No: 15<211> Comprimento: 1905<212> Tipo: DNA

<213> Organismo: Seqüência Artificial<220> Características:

<223> Outras informações: Seqüência sintética baseada em Bacillus thuringiensis<400> Seqüência: 15

atgggacaca acgtccttaa taacgaacgt aacacagtct gtgaagcaca caacgtggcc 60

gttcgcgacc ctttctcatt cgagcacaaa tcactaaaca ctgttgagaa ggagtggact 120

gagtggaaga gaaacgacca ttcgctatat gttgacccga tcgttggaac cgtggcttca 180

ttcttgctca agaaggtggg ttctctcgtt ggtaagagga ttctctcgga actaaggagc 240

ttgatcttcc cctccggtag cacaaatctc atgcaggata tactccgtga gaccgagaag 300

ttcctgaacc agcgactgaa cacggacacc ttggcacgag ttaatgctga attgacaggt 360

ctacaggcaa atgtcgagga gttcaatcgc caagttgaca acttcctaaa tcccaatcgt 420

aacgccttgc ctttgtctat tacgtcgtcc gtcaacacga tgcagcagct attcttgaac 480

cggttaccac aattccagat ccaaggctac caattgttgt tactcccgtt attcgcccaa 540

gctgctaatc ttcacctgag cttcatcagg gatgtcatcc taaatgcaga cgagtggggc 600

atatcggcag ctacactacg tacttatcga aaccatctga ggaactacac gcgtgactac 660

tcaaactact gtatcaacac ctatcagact gccttccgtg gcctgaatac aaggctccac 720

gatatgttgg agtttcggac atacatgttc ctgaacgtgt tcgagtatgt ctccatctgg 780

tcgcttttca agtaccagtc attgctggtc tcgtcaggtg ctaacctata cgcaagtgga 840

agtggacctc agcaaaccca atcgttcacg agtcaagact ggccattcct gtatagcttg 900

ttccaggtca actccaacta cgtgctgaac ggcttctcag gtgctcgatt gtcccagact 960

ttcccaaaca tcgttggact tccaggaaca actacgactc atgccttgct ggctgcacga 1020

gtcaactact ctggtggagt ttcaagtggc gatattggag cttcgccgtt caaccagaac 1080

ttcagttgca gcacattcct gcctcctttg cttacgccat tcgttagatc ctggctcgac 1140

agtggaagtg atcgaggggg agttaatact gtgaccaact ggcagacaga gagtttcgag 1200

acaacactcg gtctacgatc aggagcattc acagcaagag gaaacagcaa ctacttccca 1260

gactacttca tccgaaacat ctctggagta cctctagtcg ttaggaacga agaccttcgt 1320

cgtcctctgc actacaatca gatcaggaac attgagtcac cttcaggtac acctggtgga 1380

gcacgagcat acatggtctc agttcacaac cgtaagaaca acatctacgc agttcatgag 1440

aacggaacga tgatccactt ggctccagag gactacaccg gatttacaat cagtcctatc 1500

cacgccactc aggtgaacaa ccagactcga acgttcatca gtgagaagtt tggaaaccaa 1560

ggcgattctc tgaggtttga gcagagtaat accacggcaa ggtacactct caggggtaat 1620

ggaaactctt acaacctata cttgcgtgtc tccagcatag gcaattcaac tatcagggtt 1680accatcaacg gtcgagtgta cacagctaca aacgtcaata ccaccactaa caacgatggt 1740

gtaaacgaca atggtgctcg cttcagcgac atcaacatcg gaaacgtagt cgcgagcgac 1800

aacagcaacg tacctctgga cattaacgtt acgttgaact caggcacaca gttcgatttg 1860

atgaacatca tgtttgttcc gacaaaccta ccaccattgt attag 1905

<210> SEQ ID No: 16 <211> Comprimento: 1179 <212> Tipo: DNA <213> Organismo: Rhyzopus oryzae

<400> Seqüência: 16

atggtttcat tcatttccat ttctcaaggt gttagtcttt gtcttcttgt ctcttccatg 60

atgctcggtt catctgctgt tcctgtttct ggtaaatctg gatcttccac taccgccgtc 120

tctgcatctg acaattctgc cctccctcct ctcatttcca gccgttgtgc tcctccttct 180

aacaagggaa gtaaaagcga tcttcaagct gaaccttact acatgcaaaa gaatacagaa 240

tggtatgagt cccatggtgg caacctgaca tccatcggaa agcgagatga caatttggtt 300

ggtggcatga ctttggattt acctagcgat gctcctccta tcagcctctc tggatctacc 360

aacagcgcct ctgatggtgg taaggttgtt gctgctacta ctgctcaaat tcaagagttc 420

accaagtatg ctggtatcgc tgccactgcc tactgtcgtt ctgttgtccc tggtaacaag 480

tgggactgtg tccaatgtca aaagtgggtt cctgatggca agatcatcac tacctttacc 540

tccttgcttt ccgacacaaa tggttacgtc ttgagaagtg ataaacaaaa gaccatttat 600

cttgttttcc gtggtaccaa ctccttcaga agtgccatca ctgatattgt cttcaacttt 660

tccgactaca agcctgtcaa gggcgccaag gttcatgctg gtttcctttc ctcttatgag 720

caagttgtca atgactattt ccctgtcgtc caagaacaac tgaccgccaa ccctacttac 780

aaggtcatcg tcaccggtca ctcactcggt ggtgcacaag ctttgcttgc cggtatggat 840

ctctaccaac gtgaaccaag actgtctccc aagaatttga gcatcttcac tgttggtggt 900

cctcgtgttg gtaaccccac ctttgcttac tatgttgaat ctaccggtat tcctttccaa 960

cgtaccgttc acaagagaga tatcgttcct cacgttcctc ctcaatcctt cggattcctt 1020

catcccggtg ttgaatcttg gattaagtct ggtacctcca acgttcaaat ctgtacttct 1080

gaaattgaaa ccaaggattg cagtaactct atcgttcctt tcacctctct ccttgatcac 1140

ttgagttact ttgatatcaa cgaaggaagc tgtttgtaa 1179

Claims

1. Um método para desenhar uma molécula de ácido nucléicocodificando um polipeptideo para a expressão do referidopolipeptideo em uma planta, caracterizado por compreenderalterar pelo menos um códon de uma molécula de ácidonucléico para um códon alterado, onde o referido códonalterado é selecionado a partir de um grupo consistindo decódons apresentando uma freqüência de uso em um ou maisvírus vegetais que é maior do que aquela do referido códonda referida molécula de ácido nucléico.

2. Método de acordo com a reivindicação 1, caracterizadopelo fato de que o referido códon alterado apresenta umafreqüência de uso em um ou mais vírus vegetais que é maiordo que 0,09.

3. Método de acordo com a reivindicação 1, caracterizadopelo fato de que o referido códon alterado apresenta umafreqüência de uso em um ou mais vírus vegetais que é igualou maior do que a freqüência mediana de uso de códon para umaminoácido codificado pelo referido códon alterado em um oumais ditos vírus vegetais, onde a referida freqüênciamediana de uso de códon é a mediana das freqüências de usode códon em um ou mais vírus vegetais para todos os códonscodificando o referido aminoácido.

4. Método de acordo com a reivindicação 1, caracterizadopelo fato de que pelo menos 30% dos códons na referidamolécula de ácido nucléico compreendendo pelo menos um códonalterado são códons alterados.

5. Método de acordo com a reivindicação 1, caracterizadopelo fato de que um número igual ou maior de códonsalterados existe em uma primeira parte de uma molécula deácido nucléico compreendendo pelo menos um códon alterado doque em uma segunda parte da referida molécula de ácidonucléico, na qual a primeira parte está a 5' da referidasegunda parte.

6. Método de acordo com a reivindicação 5, caracterizadopelo fato de que a primeira parte consiste de um terço dareferida molécula de ácido nucléico e a referida segundaparte consiste de dois terços da referida molécula de ácidonucléico.

7. Método de acordo com a reivindicação 5, caracterizadopelo fato de que a primeira parte consiste de um quarto dareferida molécula de ácido nucléico e a referida segundaparte consiste de três quartos da referida molécula de ácidonucléico.

8. Método de acordo com a reivindicação 5, caracterizadopelo fato de que as ditas primeira e segunda partes dareferida molécula de ácido nucléico são iguais emcomprimento e a referida primeira parte tem um número maiordos referidos códons alterados.

9. Método de acordo com a reivindicação 1, caracterizadopelo fato de que a expressão do referido polipeptídeo em umaplanta, codificado por uma molécula de ácido nucléicocompreendendo pelo menos um códon alterado provoca a mudançaem um fenótipo da referida planta quando comparada com umaplanta que não expressa o referido polipeptídeo.

10. Método de acordo com a reivindicação 1, caracterizadopelo fato de que a expressão da referida molécula de ácidonucléico compreendendo pelo menos um códon alterado provocaa mudança em um fenótipo da referida planta quando comparadacom uma planta que expressa uma molécula de ácido nucléicoque não contém pelo menos um códon alterado, no qual asreferidas moléculas de ácido nucléico codificam o mesmopolipeptídeo.

11. Método de acordo com a reivindicação 9 ou 10,caracterizado pelo fato de que o referido fenótipo éselecionado a partir de um grupo consistindo de resistênciaa inseto, tolerância a inseto, resistência a doença,tolerância a doença, resistência a nematódeo, tolerância anematódeo, tolerância a seca, tolerância a sal, tolerância ametal pesado, desintoxicação de metais pesados, baixo teorde fitato, alta eficiência no uso de nitrogênio, aumento daprodução, estabilidade da produção aumentada, teornutricional aumentado; teor aumentado de açúcar,desenvolvimento e vigor aumentados, digestibilidadeaumentada, expressão de polipeptídeos terapêuticos, síntesede produtos farmacêuticos não-polipeptídeos, resistência aum agente de seleção, fluorescência, luminescência,atividade recombinase, e esterilidade masculina.

12. Método de acordo com a reivindicação 9 ou 10,caracterizado pelo fato de que o referido fenótipo é aexpressão aumentada do referido polipeptídeo na referidaplanta.

13. Método de acordo com a reivindicação 1, caracterizadopelo fato de que a referida planta é uma plantamonocotiledônea.

14. Método de acordo com a reivindicação 13, caracterizadopelo fato de que a referida planta monocotiledônea éselecionada de um grupo consistindo' de cevada, milho,milheto, aveia, arroz, e trigo.

15. Método de acordo com a reivindicação 14, caracterizadopelo fato de que a referida planta monocotiledônea é milho.

16. Método de acordo com a reivindicação 1, caracterizadopelo fato de que a referida planta é uma plantadicotiledônea.

17. Método de acordo com a reivindicação 16, caracterizadopelo fato de que a referida planta dicotiledônea éselecionada a partir de um grupo consistindo de batata,soja, tabaco, e tomate.

18. Método de acordo com a reivindicação 17, caracterizadopelo fato de que a referida planta dicotiledônea é umaplanta de soja.

19. Método de acordo com a reivindicação 1 ou 13,caracterizado pelo fato de que um ou mais vírus vegetais sãovírus de plantas monocotiledôneas.

20. Método de acordo com a reivindicação 19, caracterizadopelo fato de que pelo menos um códon codificaa) alanina e o referido códon alterado é selecionadoa partir de um grupo consistindo de GCA e GCT;b) arginina e o referido códon alterado é selecionadoa partir de um grupo consistindo de AGA, AGG, eCGT;c) asparagina e o referido códon alterado é AAT;d) ácido aspártico e o referido códon alterado é GAT;e) cisteína e o referido códon alterado é TGT;f) glutamina e o referido códon alterado é CAA;g) ácido glutâmico e o referido códon alterado é GAA;h) glicina e o referido códon alterado é selecionado a partir de um grupo consistindo GGA e GGT;i) histidina e o referido códon alterado é CAT;j) isoleucina e o referido códon alterado éselecionado a partir de um grupo consistindo ATA eATT;k) leucina e o referido códon alterado é selecionadoa partir de um grupo consistindo CTT, TTA, e TTG;l) lisina e o referido códon alterado é AAA;m) fenilalanina e o referido códon alterado é TTT;n) prolina e o referido códon alterado é selecionadoa partir de um grupo consistindo CCA e CCT;o) serina e o referido códon alterado é selecionado apartir de um grupo consistindo AGT, TCA, e TCT;p) treonina e o referido códon alterado é selecionadoa partir de um grupo consistindo ACA e ACT;q) tirosina e o referido códon alterado é TAT; our) valina e o referido códon alterado é selecionado apartir de um grupo consistindo GTG e GTT.

21. Método de acordo com a reivindicação 19, caracterizadopelo fato de que o referido vírus ou mais vírus de plantasmonocotiledôneas são vírus específicos de milho.

22. Método de acordo com a reivindicação 21, caracterizadopelo fato de que pelo menos um códon codificaa) alanina e o referido códon alterado é selecionadoa partir de um grupo consistindo de GCA e GCT;b) arginina e o referido códon alterado é selecionadoa partir de um grupo consistindo de AGA, AGG, eCGT;c) asparagina e o referido códon alterado é AAT;d) ácido aspártico e o referido códon alterado é GAT;e) cisteína e o referido códon alterado é TGT;f) glutamina e o referido códon alterado éselecionado a partir do grupo consistindo de CAA eCAG;g) ácido glutâmico e o referido códon alterado é GAA;h) glicina e o referido códon alterado é selecionadoa partir de um grupo consistindo GGA e GGT;i) histidina e o referido códon alterado é CAT;j) isoleucina e o referido códon alterado éselecionado a partir de um grupo consistindo ATA eATT;k) leucina e o referido códon alterado é selecionadoa partir de um grupo consistindo CTT, TTA, e TTG;1) lisina e o referido códon alterado é AAG;m) fenilalanina e o referido códon alterado é TTC;n) prolina e o referido códon alterado é selecionadoa partir de um grupo consistindo CCA e CCT;o) serina e o referido códon alterado é selecionado apartir de um grupo consistindo TCC, TCA, e TCT;p) treonina e o referido códon alterado é selecionadoa partir de um grupo consistindo ACA e ACT;q) tirosina e o referido códon alterado é TAT; our) valina e o referido códon alterado é selecionado apartir de um grupo consistindo GTG e GTT.

23. Método de acordo com a reivindicação 21, caracterizadopelo fato de que a referida freqüência de uso em um ou maisvírus vegetais é baseada em moléculas de ácido nucléicocodificando polipeptídeos da capa e polipeptídeos docapsídeo de vírus de milho.

24. Método de acordo com a reivindicação 23, caracterizadopelo fato de que pelo menos um códon codificaa) alanina e o referido códon alterado é selecionadoa partir do grupo consistindo de GCA e GCT;b) arginina e o referido códon alterado é selecionadoa partir do grupo consistindo de AGA, AGG, e CGA;c) asparagina e o referido códon alterado é AAC;d) ácido aspártico e o referido códon alterado é GAT;e) cisteína e o referido códon alterado é TGC;f) glutamina e o referido códon alterado é CAA;g) ácido glutâmico e o referido códon alterado é GAG;h) glicina e o referido códon alterado é selecionadoa partir do grupo consistindo GGA e GGG;i) histidina e o referido códon alterado é CAT;j) isoleucina e o referido códon alterado éselecionado a partir do grupo consistindo ATC eATT;k) leucina e o referido códon alterado é selecionadoa partir do grupo consistindo CTG, CTC, e TTG;l) lisina e o referido códon alterado é AAG;m) fenilalanina e o referido códon alterado é TTC;n) prolina e o referido códon alterado é selecionadoa partir do grupo consistindo CCA e CCT;o) serina e o referido códon alterado é selecionado apartir do grupo consistindo TCC, TCA, e AGC;p) treonina e o referido códon alterado é selecionadoa partir do grupo consistindo ACA e ACT;q) tirosina e o referido códon alterado é TAT; our) valina e o referido códon alterado é selecionado apartir do grupo consistindo GTC, GTG e GTT.

25. Método de acordo com a reivindicação 1 ou 16,caracterizado pelo fato de que o referido ou mais vírusvegetais são vírus de plantas dicotiledoneas.

26. Método de acordo com a reivindicação 25, caracterizadopelo fato de que o referido ou mais vírus de plantasdicotiledoneas são vírus específicos de soja.

27. Método de acordo com a reivindicação 25, caracterizadopelo fato de que a referida freqüência de uso em um ou maisvírus vegetais é baseada em moléculas de ácido nucléicocodificando polipeptídeos da capa e polipeptídeos docapsídeo de vírus de plantas dicotiledôneas.

28. Método de acordo com a reivindicação 27, caracterizadopelo fato de que pelo menos um códon codificaa) alanina e o referido códon alterado é selecionadoa partir do grupo consistindo de GCC e GCT;b) arginina e o referido códon alterado é selecionadoa partir do grupo consistindo de AGA, AGG, e CGT;c) asparagina e o referido códon alterado é AAT;d) ácido aspártico e o referido códon alterado é GAT;e) cisteína e o referido códon alterado é TGT;f) glutamina e o referido códon alterado é CAA;g) ácido glutâmico e o referido códon alterado é GAA;h) glicina e o referido códon alterado é selecionadoa partir do grupo consistindo GGA e GGT;i) histidina e o referido códon alterado é CAT;j) isoleucina e o referido códon alterado éselecionado a partir do grupo consistindo ATA eATT;k) leucina e o referido códon alterado é selecionadoa partir do grupo consistindo CTT, TTA, e TTG;1) lisina e o referido códon alterado é AAG;m) fenilalanina e o referido códon alterado é TTT;n) prolina e o referido códon alterado é selecionadoa parir do grupo consistindo CCA, CCC e CCT;-o) serina e o referido códon alterado é selecionado apartir do grupo consistindo AGT, TCA, e TCT;p) treonina e o referido códon alterado é selecionadoa partir do grupo consistindo ACA, ACC e ACT;q) tirosina e o referido códon alterado é TAT; our) valina e o referido códon alterado é selecionado apartir do grupo consistindo GTG e GTT.

29. Método de acordo com a reivindicação 1, caracterizadopelo fato de que uma molécula de ácido nucléicocompreendendo pelo menos um códon alterado tem umafreqüência de uso de códon alterado para todos os resíduosde aminoácidos de pelo menos um tipo de aminoácido que é amesma ou substancialmente similar a freqüência de uso em umou mais vírus vegetais.

30. Método de acordo com a reivindicação 29, caracterizadopelo fato de que o referido ou mais vírus vegetais são vírusde plantas monocotiledôneas.

31. Método de acordo com a reivindicação 30, caracterizadopelo fato de que o referido tipo de aminoácido éa) alanina e a referida freqüência de uso de códon éGCA (0.31), GCC (0.21), GCG (0.14), GCT (0.34);b) arginina e a referida freqüência de uso de códon éAGA (0.32), AGG (0.17), CGA(0.14), CGC (0.14), CGG(0.09), e CGT (0.16) ;c) asparagina e a referida freqüência de uso de códoné AAC (0.42) e AAT (0.58);d) ácido aspártico e a referida freqüência de uso decódon é GAC (0.38) e GAT(0.62);e) cisteína e a referida freqüência de uso de códon éTGC (0.44) e TGT (0.56);f) glutamina e a referida freqüência de uso de códoné CAA (0.58) e CAG (0.42);g) ácido glutâmico e a referida freqüência de uso decódon é GAA (0.60) e GAG(0.4 0);h) glicina e a referida freqüência de uso de códon éGGA (0.37), GGC (0.20), GGG(0.14), e GGT (0.28);i) histidina e a referida freqüência de uso de códoné CAC (0.43) e CAT (0.57);j) isoleucina e a referida freqüência de uso de códoné ATA (0.30), ATC (0.29), e ATT (0.41);k) leucina e referida freqüência de uso de códon éCTA (0.13), CTC (0.14), CTG(0.13), CTT (0.18), TTA(0.21), e TTG (0.21);l) lisina e a referida freqüência de uso de códon éAAA (0.53) e AAG (0.4 7);m) fenilalanina e a referida freqüência de uso decódon é TTC (0.46) e TTT (0.54);n) prolina e a referida freqüência de uso de códon éCCA (0.38), CCC (0.17), CCG (0.14), e CCT (0.31);o) serina e a referida freqüência de uso de códon éAGC (0.13), AGT (0.18), TCA (0.24), TCC (0.14),TCG (0.10), e TCT (0.21);p) treonina e a referida freqüência de uso de códon éACA (0.30), ACC (0.20), ACG(0.16), e ACT (0.34);q) tirosina e a referida freqüência de uso de códon éTAC (0.43) e TAT (0.57); OUr) valina e a referida freqüência de uso de códon éGTA (0.19), GTC (0.21) , GTG (0.25), e GTT (0.36).

32. Método de acordo com a reivindicação 30, caracterizadopelo fato de que os referidos vírus de plantasmonocotiledôneas são vírus específicos de milho.

33. Método de acordo com a reivindicação 32, caracterizadopelo fato de que o referido tipo de aminoácido éa) alanina e a referida freqüência de uso de códon éGCA (0.31), GCC (0.30), GCG (0.11), e GCT (0.28);b) arginina e a referida freqüência de uso de códon éAGA (0.27), AGG (0.17), CGA (0.12), CGC (0.19),CGG (0.12), e CGT (0.13);c) asparagina e a referida freqüência de uso de códoné AAC (0.44) e AAT (0.56);d) ácido aspártico e a referida freqüência de uso decódon é GAC (0.41) e GAT (0.59);e) cisteína e a referida freqüência de uso de códon éTGC (0.42) e TGT (0.58);f) glutamina e a referida freqüência de uso de códoné CAA (0.50) e CAG (0.50);g) ácido glutâmico e a referida freqüência de uso decódon é GAA (0.52) e GAG (0.48);h) glicina e a referida freqüência de uso de códon éGGA (0.36), GGC (0.23), GGG (0.17), e GGT (0.24);i) histidina e a referida freqüência de uso de códoné CAC (0.45), CAT (0.55);j) isoleucina e a referida freqüência de uso de códoné ATA (0.27), ATC (0.30), e ATT (0.43);k) leucina e referida freqüência de uso de códon éCTA (0.12), CTC (0.22), CTG (0.16), CTT (0.19),TTA (0.14), e TTG (0.18);-1) lisina e a referida freqüência de uso de códon éAAA (0.49) e AAG (0.51);m) fenilalanina e a referida freqüência de uso decódon é TTC (0.56) e TTT (0.44);n) prolina e a referida freqüência de uso de códon éCCA (0.31), CCC (0.20), CCG (0.17), e CCT (0.32);o) serina e a referida freqüência de uso de códon éAGC (0.12), AGT (0.12), TCA (0.22), TCC (0.21),TCG (0.10), e TCT (0.22);p) treonina e a referida freqüência de uso de códon éACA (0.32), ACC (0.26), ACG (0.13), e ACT (0.29);q) tirosina e a referida freqüência de uso de códonTAC (0.46) e TAT (0.54); our) valina e a referida freqüência de uso de códon éGTA (0.16), GTC (0.25) , GTG (0.26), e GTT (0.33).

34. Método de acordo com a reivindicação 32, caracterizadopelo fato de que a referida freqüência de uso de códon em umou mais vírus vegetais é baseada em moléculas de ácidonucléico que codificam polipeptídeo da capa e polipeptídeodo capsídeo de vírus que atacam milho.

35. Método de acordo com a reivindicação 32, caracterizadofato de que o referido tipo de aminoácido éa) alanina e a referida freqüência de uso de códon éGCA (0.38), GCC (0.22), GCG (0.14), e GCT (0.26);b) arginina e a referida freqüência de uso de códon éAGA (0.30), AGG (0.18), CGA (0.18), CGC (0.16),CGG (0.11), e CGT (0.07);c) asparagina e a referida freqüência de uso de códoné AAC (0.53) e AAT (0.47);d) ácido aspártico e a referida freqüência de uso decódon é GAC (0.45) e GAT (0.55);e) cisteína e a referida freqüência de uso de códon éTGC (0.53) e TGT (0.47) ;f) glutamina e a referida freqüência de uso de códoné CAA (0.52) e CAG (0.48);g) ácido glutâmico e a referida freqüência de uso decódon é GAA (0.44) e GAG (0.56);h) glicina e a referida freqüência de uso de códon éGGA (0.42), GGC (0.18), GGG (0.23), e GGT (0.18);i) histidina e a referida freqüência de uso de códoné CAC (0.35) e CAT (0.65);j) isoleucina e a referida freqüência de uso de códoné ATA (0.24), ATC (0.36), e ATT (0.40);k) leucina e a referida freqüência de uso de códon éCTA (0.12), CTC (0.18), CTG (0.25), CTT (0.12),TTA (0.10), e TTG (0.23);l) lisina e a referida freqüência de uso de códon éAAA (0.48) e AAG (0.52);m) fenilalanina e a referida freqüência de uso decódon é TTC (0.57) e TTT (0.43);n) prolina e a referida freqüência de uso de códon éCCA (0.32), CCC (0.24), CCG (0.12), e CCT (0.32);o) serina e a referida freqüência de uso de códon éAGC (0.19), AGT (0.13), TCA (0.21), TCC (0.26),TCG (0.06), e TCT (0.15);p) treonina e a referida freqüência de uso de códon éACA (0.36), ACC (0.27), ACG (0.06) e ACT (0.31);q) tirosina e a referida freqüência de uso de códon éTAC (0.41) e TAT (0.59), our) valina e a referida freqüência de uso de códon éGTA (0.15), GTC (0.26) , GTG (0.36), e GTT (0.23).

36. Método de acordo com a reivindicação 29, caracterizadopelo fato de que o referido vírus ou mais vírus vegetais sãovírus de plantas dicotiledôneas.

37. Método de acordo com a reivindicação 36, caracterizadopelo fato de que o referido tipo de aminoãcido éa) alanina e a referida freqüência de uso de códon éGCA (0.33), GCC (0.21), GCG (0.13), e GCT (0.33);b) arginina e a referida freqüência de uso de códon éAGA (0.34), AGG (0.23), CGA (0.11), CGC (0.09),CGG (0.08), e CGT (0.15);c) asparagina e a referida freqüência de uso de códoné AAC (0.41) e AAT (0.59);d) ácido aspártico e a referida freqüência de uso decódon é GAC (0.37) e GAT (0.63);e) cisteína e a referida freqüência de uso de códon éTGC (0.41) e TGT (0.59);f) glutamina e a referida freqüência de uso de códoné CAA (0.60) e CAG (0.40);g) ácido glutâmico e a referida freqüência de uso decódon é GAA (0.61) e GAG (0.39);h) glicina e a referida freqüência de uso de códon éGGA (0.35), GGC (0.18), GGG (0.18), e GGT (0.29);i) histidina e a referida freqüência de uso de códoné CAC (0.43) e CAT (0.57);j) isoleucina e a referida freqüência de uso de códoné ATA (0.31), ATC (0.28), e ATT (0.41);k) leucina e a referida freqüência de uso de códon éCTA (0.12), CTC (0.14), CTG (0.12), CTT (0.19),TTA (0.22), e TTG (0.21);l) lisina e a referida freqüência de uso de códon éAAA (0.54) e AAG (0.46);m) fenilalanina e a referida freqüência de uso decódon é TTC (0.44) e TTT (0.56);n) prolina e a referida freqüência de uso de códon éCCA (0.38), CCC (0.18), CCG (0.12), e CCT (0.31);o) serina e a referida freqüência de uso de códon éAGC (0.14), AGT (0.20), TCA (0.23), TCC (0.14),TCG (0.08), e TCT (0.21);p) treonina e a referida freqüência de uso de códon éACA (0.36), ACC (0.20), ACG (0.14) e ACT (0.31);q) tirosina e a referida freqüência de uso de códon éTAC (0.41) e TAT (0.59); our) valina e a referida freqüência de uso de códon éGTA (0.19), GTC (0.21) , GTG (0.25), e GTT (0.35).

38. Método de acordo com a reivindicação 36, caracterizadopelo fato de que a referida freqüência de uso em um ou maisvírus vegetais é baseada em moléculas de ácido nucléico quecodificam polipeptídeos da capa e polipeptídeos do capsídeode vírus vegetais que atacam dicotiledôneas.

39. Método de acordo com a reivindicação 38, caracterizadopelo fato de que o referido tipo de aminoácido éa) alanina e a referida freqüência de uso de códon éGCA (0.24), GCC (0.27), GCG (0.15), e GCT (0.34);arginina e a referida freqüência de uso de códon éAGA (0.24), AGG (0.22), CGA (0.12), CGC (0.10),CGG (0 .11) , e CGT (0.21) ;asparagina e a referida freqüência de uso de códoné AAC (0.44) e AAT (0.56);ácido aspártico e a referida freqüência de uso decódon é GAC (0.32) e GAT (0.68);cisteína e a referida freqüência de uso de códon éTGC (0.25) e TGT (0.75);glutamina e a referida freqüência de uso de códoné CAA (0.59) e CAG (0.41);ácido glutâmico e a referida freqüência de uso decódon é GAA (0.61) e GAG (0.39);glicina e a referida freqüência de uso de códon éGGA (0.32), GGC (0.20), GGG (0.18), e GGT (0.30);histidina e a referida freqüência de uso de códoné CAC (0.35) e CAT (0.65);isoleucina e a referida freqüência de uso de códoné ATA (0.39), ATC (0.26), e ATT (0.35);leucina e a referida freqüência de uso de códon éCTA (0.10), CTC (0.13), CTG (0.12), CTT (0.14),TTA (0.28), e TTG (0.23);lisina e a referida freqüência de uso de códon éAAA (0.45) e AAG (0.55);m) fenilalanina e a referida freqüência de uso decódon é TTC (0.47) e TTT (0.53) ;n) prolina e a referida freqüência de uso de códon éCCA (0.27), CCC (0.27), CCG (0.14), e CCT (0.33);-o) serina e a referida freqüência de uso de códon éAGC (0.15), AGT (0.19), TCA (0.18), TCC (0.14),TCG (0.11), e TCT (0.24) ;P) treonina e a referida freqüência de uso de códon éACA (0.25), ACC (0.25), ACG (0.16) e ACT (0.34);q) tirosina e a referida freqüência de uso de códon éTAC (0.37) e TAT (0.63), our) valina e a referida freqüência de uso de códon éGTA (0.17), GTC (0.23) , GTG (0.25), e GTT (0.35).

40. Método de acordo com a reivindicação 36, caracterizadopelo fato de que o referido vírus vegetal ou demais vírus dedicotiledôneas é um vírus específico para plantas de soja.

41. Método de acordo com a reivindicação 1, caracterizadopelo fato de que o referido polipeptídeo é um polipeptídeoinseticida.

42. Método de acordo com a reivindicação 41, caracterizadopelo fato de que o referido polipeptídeo inseticida é umpolipeptídeo códon-otimizado baseado em um polipeptídeo deBacillus thuringiensis ou Rhyzopus oryzae.

43. Método de acordo com a reivindicação 42, caracterizadopelo fato de que o referido polipeptideo inseticida deBacillus thuringiensis é 4 37N.

44. Método de acordo com a reivindicação 43, caracterizadopelo fato de que o referido polipeptideo inseticida códon-otimizado de Bacillus thuringiens compreende a seqüência deaminoácido de SEQ ID NO:2.

45. Método de acordo com a reivindicação 42, caracterizadopelo fato de que o referido polipeptideo inseticida deRhyzopus oryzae é lipase inseticida.

46. Método de acordo com a reivindicação 45, caracterizadopelo fato de que o referido polipeptideo inseticida códon-otimizado de Rhyzopus oryzae compreende a seqüência deaminoácido de SEQ ID NO:4.

47. Uma molécula de ácido nucléico caracterizada porcompreender pelo menos um códon alterado, no qual a referidamolécula de ácido nucléico é desenhada de acordo com ométodo da reivindicação 1.

48. Molécula de ácido nucléico de acordo com areivindicação 47, caracterizada pelo fato de que a referidamolécula de ácido nucléico codifica um polipeptideoinseticida.

49. Molécula de ácido nucléico de acordo com areivindicação 48, caracterizada pelo fato de que o referidopolipeptídeo inseticida é um polipeptídeo inseticida códon-otimizado com base em um polipeptídeo de Bacillusthuringiensis ou Rhyzopus oryzae.

50. Molécula de ácido nucléico de acordo com areivindicação 49, caracterizada pelo fato de que o referidopolipeptídeo inseticida de Bacillus thuringiensis é 437N.

51. Molécula de ácido nucléico de acordo com areivindicação 50, caracterizada pelo fato de que o referidopolipeptídeo inseticida códon-otimizado de Bacillusthuringiensis compreende a seqüência de SEQ ID NO:l.

52. Molécula de ácido nucléico de acordo com areivindicação 49, caracterizada pelo fato de que o referidopolipeptídeo de Rhyzopus oryzae é lipase inseticida.

53. Molécula de ácido nucléico de acordo com areivindicação 52, caracterizada pelo fato de que o referidopolipeptídeo inseticida códon-otimizado de Rhyzopus oryzaecompreende a seqüência de SEQ ID NO:3.

54. Uma molécula de ácido nucléico, caracterizada porcompreender SEQ ID NO:l ou o complemento desta.

55. Uma molécula de ácido nucléico, caracterizada porcompreender SEQ ID NO:3 ou o complemento desta.

56. Um vetor, caracterizado por compreender a molécula deácido nucléico de acordo com qualquer das reivindicações 53ou 54 .

57. Uma planta transgenica e a progênie desta,caracterizadas por compreenderem a molécula de ácidonucléico da reivindicação 56.

58. Planta transgenica de acordo com a reivindicação 57,caracterizada pelo fato de que a referida progênie sãosementes.

59. Planta transgenica de acordo com a reivindicação 57,caracterizada pelo fato de que a referida planta transgenicaé uma planta monocotiledônea.

60. Planta transgenica de acordo com a reivindicação 59,caracterizada pelo fato de que a referida planta transgenicaé selecionada a partir do grupo consistindo de cevada,milho, milheto, aveias, arroz, e trigo.

61. Planta transgenica de acordo com a reivindicação 57,caracterizada pelo fato de que a referida planta transgenicaé uma planta dicotiledônea.

62. Planta transgenica de acordo com a reivindicação 61,caracterizada pelo fato de que a referida planta transgenicaé selecionada a partir do grupo consistindo de batata, soja,tabaco, algodão, e tomate.