BRPI0414654B1

BRPI0414654B1 - regulação da biomassa de planta e tolerância ao estresse

Info

Publication number: BRPI0414654B1
Application number: BRPI0414654A
Authority: BR
Inventors: K Sherman Bradley; Jiang Cai-Zhong; D Hempel Frederick; E Heard Jacqueline; S Keddie James; M Libby Jeffrey; I Gutterson Neal; Ratcliffe Oliver; W Kumimoto Roderick
Original assignee: Mendel Biotechnology Inc
Priority date: 2003-09-23
Filing date: 2004-09-17
Publication date: 2017-03-07
Also published as: WO2005030966A2; US7897843B2; EP2298918A2; WO2005030966A3; US20050097638A1; EP1668140A2; BRPI0414654A; EP2298918B1; ES2502943T3; EP2298918A3; EP1668140B1

Abstract

"regulação da biomassa de planta e tolerância ao estresse". a invenção relaciona-se aos polipeptídeos do fator de transcrição da planta, aos polinucleotídeos que os codificam, aos homólogos de uma variedade de espécies de planta, e aos métodos de uso dos polinucleotídeos e polipeptídeos para produzir as plantas transgênicas que têm propriedades vantajosas, incluindo o aumento da biomassa ou tolerância melhorada ao frio ou outro estresse. a invenção pertence também aos sistemas de expressão que podem ser usados para regular estes polinucleotídeos do fator de transcrição, fornecendo regulação constitutiva, transiente, induzível e tecido-específico.

Description

Relatório Descritivo da Patente de Invenção para; "REGULAÇÃO DA BIOMASSA DE PLANTA 1 TOLERÂNCIA AO ESTRESSE", RELAÇÃO AOS DEPÓSITOS CO-PENDENTES

Este depósito reivindica o benefício dos geralmente atribuídos pedido provisório no. US 60/565.948, depositado em 26 de abril de 2004,- e ê uma continuação-em-parte do pedido de patente não provisório no. US 10/669.824, depositado em 23 de setembro de 2003 e do pedido de patente não provisório no. US 10/870.198, depositado em 16 de junho de 2004; os conteúdos inteiros destes depósitos são por este meio incorporados por referência.

CAMPO DA INVENÇÃO

Ά presente invenção relaciona-se ao aumento do tamanho, biomassa, ou do rendimento de uma planta, e o aumento da tolerância de uma planta aos estresses abiõtícos, incluindo estresses osmóticos e ao frio. ANTECEDENTES DA INVENÇÃO

Os traços de uma planta podem ser controlados com um número de processos celulares. Uma maneira importante para manipular esse controle é através dos fatores de transcrição - proteínas que influenciam a expressão de um gene particular ou de conjuntos dos genes. Porque os fatores de transcrição são elementos de controle chave das vias biológicas, alterando os níveis de expressão de um ou mais fatores de transcrição podem mudar as vias biológicas inteiramente em um organismo. As estratégias para manipular características bioquímicas, de desenvolvimento, ou fenotípicas de uma planta pela alteração da expressão de fator de transcrição pode resultar em plantas e colheitas com propriedades comercialmente valiosas novas e/ou melhoradas, incluindo os traços que melhoram o rendimento sob condições não estressantes, ou a sobrevivência e o rendimento durante períodos de estresse abiótico.

Desejabilidade de aumento de bíomassa. A habilidade de aumentar a biomassa ou o tamanho de uma planta teria diversas aplicações comerciais importantes. A espécie de colheita pode ser gerada para produzir cultivares maiores, gerando um rendimento mais elevado em, por exemplo, as plantas em que a porção vegetativa da planta é comestível. 0 tamanho aumentado da folha pode ser de interesse particular. Aumentar a biomassa da folha pode ser usado para aumentar a produção de produtos farmacêuticos ou industriais derivados de planta. Um aumento na fotossintese total da planta ê conseguido tipicamente aumentando a área da folha da planta. A capacidade fotosintética adicional pode ser usada para aumentar o rendimento derivado de um determinado tecido de planta, incluindo das folhas, das raízes, das frutas ou da semente, ou permite o crescimento de uma planta sob a intensidade de luz diminuída ou sob a intensidade de luz elevada. A modificação da biomassa do tecido da raiz pode ser útil para melhorar a habilidade de uma planta de crescer sob condições ambientais severas, incluindo a seca ou a privação de nutriente, porque as raízes maiores podem melhorar o alcance à ãgua ou aos nutrientes ou para absorver a ãgua ou nutrientes.

Para algumas plantas ornamentais, a habilidade de fornecer, variedades maiores seria altamente desejável. Para muitas plantas, incluindo árvores frutíferas, as árvores que são ussadas para produção de madeira, ou árvores e arbustos que servem para proteger do vento ou encobrir a vista, estatura aumentada fornece melhor benefícios nas formas de grande rendimento ou melhor seleção.

Problemas associados com a seca. Uma seca é um período anormal de tempo seco que persiste o suficiente para produzir um desequilíbrio hidrológico sério (por exemplo, danos na colheita, falta de fonte de ãgua, etc.). A seca ê o problema primário relacionado com o tempo na agricultura e também cotado como um dos principais desastres naturais de todos os tempos, causando não somente os danos econômicos, mas também a perda de vidas humanas. Por exemplo,- a seca de 1984 - 1985 no Horn da África conduziu a fome que matou 750.000 pessoas.

Os problemas para as plantas causadas pela baixa disponibilidade de água incluem os estresses mecânicos causados pela retirada da água celular. A seca faz também com que as plantas tornem-se mais suscetíveis às várias doenças (Simpson (1981) ín Water Stress on Plants, (Simpson, G. M., ed.), Praeger, NY, pp. 235 - 265). O fator mais importante na resistência à seca é a habilidade da planta de manter o status da água e a turgidez elevados ao manter a fixação do carbono. Os vários mecanismos adaptativos influenciam esta habilidade, incluindo o aumento da área de superfície ou a profundidade da raiz, o ajuste osmótico, e a acumulação de proteínas hídrofílicas. 0 ácido abscísico (ABA) é também um componente regulatório essencial de muitas destas características protetoras.

Além disso, para muitas regiões de terra do mundo que são demasiado áridos para a maioria, se não todas, as plantas de colheita, o uso demasiado e a utilização demasiada da água disponível está resultando em um aumento da perda da terra de uso agrícola, um processo que, no extremo,’ resulta na desertífícação. O problema é ainda composto pelo aumento da acumulação de sal nos solos, que adiciona-se à perda da água disponível nos solos.

Problemas associados com altos níveis de sal. Um em cada cinco hectares de terra irrigada é danificado pelo sal, um fator histórico importante no declínio de sociedades agrárias antigas. É esperado que esta condição piore, em seguida reduzindo a disponibilidade da terra arável e da produção de colheita, pois nenhuma das cinco colheitas de alimento principais - trigo, milho, arroz, batatas, e grão de soja - pode tolerar o sal excessivo.

Os efeitos prejudiciais do sal em plantas são uma conseqüência do déficit de água tendo por resultado o estresse osmótico (similar ao estresse da seca) e os efeitos de íons de sódio em excesso em processos bioquímicos críticos. Como no congelamento e seca, a alta concentração salina causa déficit de água. A presença de um alto nível sal torna difícil para as raízes da planta a extração de água de seu ambiente (Buchanan et al. (2000) in Biochemistry and Molecular Biology of Plants, American Society of Plant Physiologists, Rockville, MD) . A salinidade do solo é assim uma das variáveis mais importantes que determina onde uma planta pode prosperar. Em muitas partes do mundo, grandes áreas de terra não são cultivãveis devido à natural salinidade elevada do solo. Para compor o problema, a sal inação dos solos que são usados para a produção agrícola ê um problema significativo e crescente nas regiões que confiam pesadamente na agricultura. A tolerância de sal ê de particular importância precoce no ciclo de vida de uma planta, a medida que a evaporação da superfície do solo causa o movimento ascendente da água, e o sal acumula na camada superior do solo onde as sementes são colocadas. Assim, a germinação ocorre normalmente em uma concentração de sal muito mais alta do que o nível médio de sal no perfil inteiro do solo.

Problemas associados com o calor excessivo. A germinação de muitas colheitas é muito sensível à temperatura. Um fator de transcrição que realçasse a germinação em condições quentes seria útil para as colheitas que são plantadas tarde na estação ou em climas quentes. As plastas novas e plantas maduras que são expostas ao calor excessivo podem experimentar choque de calor, que pode se ocorrer em vários órgãos, incluindo as folhas e particularmente a fruta, quando a transpiração for insuficiente para superar o estresse de calor. 0 calor danifica· também estruturas celulares, incluindo organelas e o citoesqueleto, e prejudica a função da membrana (Buchanan et al. (2000) supra).

Choque de calor pode produzir uma diminuição na síntese total da proteína, acompanhada pela expressão de proteínas de choque de calor. As proteínas de choque de calor funcionam como chaperonas e estão envolvidas nas proteínas de redobramento desnaturadas pelo calor. 0 estresse de calor acompanha frequentemente condições da baixa disponibilidade de água. 0 calor próprio ê visto como um estresse de interação e se adiciona aos efeitos prejudiciais causados por condições de déficit de água. A demanda evaporativa exibe perto dos aumentos exponenciais com aumentos em temperaturas do dia, e pode resultar em taxas elevadas de transpiração e em potenciais baixos de água da planta {Hall et al. (2000) Plant Physiol. 123: 1449 - 1458), Os danos de alta temperatura ao pólen ocorrem quase sempre conjuntamente com o estresse da seca, e ocorrem raramente sob condições de abundânica de água.

Problemas associados com o frio excessivo ou condições de friagem. O termo "sensibilidade à friagem" foi usado para descrever muitos tipos dos danos fisiológicos produzidos as baixas, mas acima de zero, temperaturas. A maioria de colheitas de origens tropicais, tais como, o grão de soja, o arroz, o milho e o algodão são danificadas facilmente pela friagem. O dano ao frio típico inclui murchamento, necrose, clorose ou escapamento dos íons das membranas da célula. Os mecanismos subjacentes da sensibilidade a friagem não são compreendidos completamente ainda, mas envolvem provavelmente o nível de saturação da membrana e de outras deficiências fisiológicas. Por exemplo» a fotoinibição da fotossíntese (rompimento da fotossíntese devido às intensidades elevadas de luz) ocorre freqüentemente sob condições atmosféricas boas subsequentes às madrugadas de frio do verão/outono. A friagem pode conduzir a perdas de rendimento e baixa qualidade do produto através do amadurecimento tardio do milho. Uma outra cdnseqüência do crescimento pobre é sem dúvida pobre cobertura do solo dos campos de milho na primavera» freqüentemente tendo por resultado a erosão do solo» a ocorrência aumentada das ervas daninhas» e a absorção reduzida dos nutrientes. Uma absorção retardada do nitrogênio mineral podia também conduzir à perda aumentada de nitrato na água subterrânea. Por algumas estimativas» a friagem explica as perdas monetárias nos Estados Unidos (US) atrás somente da seca e da enchente.

Desejabilidade de percepção de açúcar (do inglês: sugar sensing) alterada. Os açúcares são as moléculas chaves regulatórias que afetam diversos processos em plantas superiores» incluindo a germinação, crescimento» florescência» senescência» metabolismo do açúcar e fotossíntese. A sucrose, por exemplo» ê a principal forma de transporte do fotoassimilado e seu fluxo através das células foi mostrado para afetar a expressão do gene e para alterar a armazenagem da acumulação de compostos nas sementes (relações de fonte e dreno). A percepção de hexose glucose-específica foi descrita também nas plantas e é implicado também na divisão da célula e no repression dos genes da "fome" (ciclos fotosintéticos ou do glioxilato). Déficit de água é um componente comum de muitos estresses de planta. 0 déficit de água ocorre em células da planta quando a taxa inteira de transpiração da planta excede a absorção de água. Além da seca, outros estresses, tais como, a salinidade e a temperatura baixa produzem a desidratação celular (McCue e Hanson (1990) Trends Biotechnol. 8; 358 - 362). O sal e o transdução do sinal do estresse da seca consistem de vias sinalizadoras da homeostase iônica e osmótica. O aspecto iônico do estresse de sal ê sinalizado através da via do SOS onde um complexo de proteína kinase SOS3 - SOS2 cálcio - responsivo controla a expressão e a atividade de transportadores de íon, tal como, o SOS1. A via de regulação da homeostase de íon em resposta ao estresse de sal tem sido revista recentemente por Xiong e por Zhu (Xiong e Zhu (2002) Plant Cell Environ. 25; 131 -139) . O componente osmótica do estresse de sal envolve as reações complexas da planta que se sobrepõem com a seca e/ou as respostas de estresse ao frio. Os aspectos comuns da resposta ao estresse da seca, do frio e de sal têm sido revistos recentemente por Xiong e por Zhu (2002) supra. Aqueles incluem: (a) mudanças transientes nos níveis citoplasmãticos de cálcio muito precocemente no evento de sinalização (Knight, (2000) Int. Rev. Cytol. 195: 269 - 324;

Sanders et al. (1999) Plant Cell 11: 691 - 706); (b) transdução de sinal via proteínas kinases dependents do cálcio e/ou mitogênio - ativado (CDPKs; veja Xiong e Zhu (2002) supra) e proteínas fosfatases (Merlot et al. (2001) Plant J. 25: 295 - 303; Tâhtiharju e Paiva (2001) Plant J. 26; 461 - 470); (c) aumentos nos níveis de ABA em resposta ao gatilho do estresse, uma subconjunto de respostas (Xiong e Zhu (2002) supra, e referências contidas nela) (d) fosfatos de inositol como moléculas de sinal (pelo menos para um subconjunto das mudanças transcricionaís em resposta ao estresse (Xiong et al. (2001) Genes Dev. 15: 1971 - 1984)); (e) ativação de fosfolipases que em turnos geram uma série diversa de moléculas de segundo mensageiro, algumas das quais poderíam regular a atividade de kinases de resposta ao estresse (funções das fosfolípases D em uma via independente de ABA, Frank et al. (2000) Plant Cell 12: 111 - 124); (f) indução de genes do tipo embriogênese abundante tardia (LEA) incluindo o CRT/DRE - contendo genes COR/RD (Xiong e Zhu (2002) supra),· (g) níveis aumentados de antioxidantes e osmólitos compatíveis, tais como, a prolina e açúcares solúveis (Hasegawa et al. (2000) Axmu. Rev. Plant Mol. Plant Physiol. 51: 463 - 499); (h) acúmulo de espécies reativas de oxigênio, tais como, o superóxido, o peróxido de hidrogênio e radicais hidroxilas (Hasegawa et al. (2000) supra). A biosíntese de ABA é regulada pelo estresse osmótico em etapas múltiplas. Ambas as sinalizações ao estresse osmótico dependente de ABA quanto a independente de ABA primeiramente modificam os fatores de transcrição constitutivamente expressados, conduzindo à expressão dos activadores de transcrição da resposta precoce, que ativam então à jusante os genes efetores da tolerância ao estresse.

Baseado na comunalidade de muitos aspectos das respostas do estresse do frio, da seca e de sal, pode-se concluir que os genes que aumentam a tolerância ao frio ou ao estresse de sal podem também melhorar a proteção do estresse da seca. De fato, isto jã tem sido demonstrado para fatores de transcrição (no caso do AtCBF/DREBl) e para outros genes, tais como, 0sCDPK7 (Saijo et ai. (2000) Plant J. 23: 319 - 327), ou AVP1 (uma bomba de próton -pirofosfatase vacuolarGaxiola et al. (2001) Proc. N&tl. Acad. Sei. USA 98: 11444 - 11449). A presente invenção relaciona-se aos métodos e as composições para produzir plantas transgênicas com traços modificados, particularmente os traços que se dirigem a tolerância ao estresse e biomassa aumentada. Estes traços podem fornecer o valor significativo em que um rendimento maior pode ser conseguido, e/ou a planta pode então prosperar nos ambientes hostis, onde, por exemplo, a alta ou baixa temperatura, a disponibilidade baixa de água ou a salinidade elevada podem limitar ou impedir o crescimento de plantas não-transgênicas. Nós identificamos os polinucleotídeos que codificam fatores de transcrição, incluindo G1073 (atHRCl), e equivalogs no clade G1073 de polipeptídeos do fator de transcrição, desenvolvemos numerosas plantas transgênicas usando estes polinucleotídeos, e analisamos as plantas quanto a sua biomassa e tolerância aos estresses abióticos. Assim ao' fazer, nós identificamos seqüências importantes de polinucleotídeos e de polipeptídeos para produzir plantas e colheitas comercialmente valiosas bem como os métodos para fazê-los e usá-los. Outros aspectos e modalidades da invenção são descritos abaixo e podem ser derivados dos ensinamentos desta descrição como um todo.

SUMÁRIO DA INVENÇÃO A invenção pertence às plantas transgênicas que têm a tolerância aumentada a um estresse abiõtico e/ou a biomassa aumentada. Estas plantas transgênicas foram transformadas com um polinucleotídeo recombinante que codifica um membro do clade G1Q73 de polipeptídeos do fator de transcrição. 0 clade G1Q73 pode ser caracterizado como um grupo de polipeptídeos que compreendem ao menos dois domínios conservados, incluindo um domínio AT-hook, e um segundo domínio (daqui por diante referido como "segundo domínio conservado") compreendendo a SEQ ID NO: 63 ou a SEQ ID NO; 64. A invenção pertence também a um método para aumentar a biomassa e a tolerância aos estresses abiõticos de uma planta. Isto é realizado fornecendo um vetor, plasraídeo ou outro constructo de ácido nucleico que contêm um polinucleotídeo do fator de transcrição e elementos regulatõrios para a regulação transcricional do polinucleotídeo. O polinucleotídeo é uma sequência que codifica um membro do clade G1Q73 dos polipeptídeos do fator de transcrição, os quais são derivados de um ancestral comum do polipeptídeo (figura 4) , e que compreendem um domínio AT-hook e um segundo domínio conservado. As seqüências do membro do clade G1073 que foram usadas com sucesso para conferir tolerância aumentada ao estresse abiótíco derivam-se de um número de espécies diversas,, incluindo dicotiledôneas, tais como, Arabiãopsis e soja, e de monocotiledôneas, tal como, o arroz. Os polipeptídeos do membro do clade G1G73 compreendem um domínio AT-hook e um segundo domínio conservado, que compreendem por sua vez as seqüências SEQ ID NO: 72 (no domínio AT-hook) e ou a SEQ ID NO: 63 ou a SEQ ID NO: 64 (no segundo domínio conservado). O vetor, plasmídeo ou constructo de ácido nucleico pode também conter um elemento regulatõrio. Este pode ser um promotor constitutivo, induzível ou tecido-específico que controla a expressão da sequência de polinucleotídeos. 0 vetor, plasmídeo ou constructo de ácido nucleico é introduzido então em uma planta alvo (uma planta que não seja transformada ainda com o vetor, plasmídeo ou constructo de ácido nucleico), assim transformando a planta em uma que tem a biomassa e/ou a tolerância a um estresse abíõtico aumentadas, em relação âs plantas do controle. Os promotores induzíveis podem incluir, por exemplo, os promotores DREB2A e RD29A. O promotor RD29A foi usado com sucesso para regular a expressão do polinucleotídeo G1073 e conferir tolerância abiótica aumentada ao estresse. Os exemplos dos promotores tecido-específicos que foram usados desta maneira incluem o promotor ARSK1 (específico da raiz), o promotor CUT1 (epiderme-específico), o promotor RBSC3 (específico da folha), e o promotor SUC2 (específico vascular). 0 uso de promotores tecido-específicos ou induzíveis mitiga os efeitos morfológicos indesejáveis que podem ser associados com a superexpressão constitutiva de membros do clade G1073 (por exemplo, quando o tamanho aumentado é indesejável). O método abrange também o aumento da biomassa e/ou da tolerância ao estresse abiótico de uma planta com uma abordagem de vetor múltiplo. Neste caso, um primeiro vetor que compreende um promotor clonado na frente de um domínio de ligação de DNA LexA fundido a um domínio de ativação GAL4 é introduzido na planta. Um segundo vetor é introduzido então na mesma planta; este segundo vetor compreende uma sequência de polinucleotídeos que codifica um membro do clade do polipeptídeo G1073. A planta é deixada então para superexpressar o polipeptídeo do membro G1073, que aumenta a biomassa e/ou tolerância ao estresse abiótico de uma planta. O promotor clonado na frente de um domínio de ligação de DNA LexA pode ser, por exemplo, o promotor RD29A, embora outros promotores que funcionam em uma capacidade similar e que podem ser expressados de modo induzível ou tecido-específico são prontamente perceptíveis e e também são abrangidos pela presente invenção.

Os métodos abrangidos pela invenção podem também ser estendidos âs técnicas de propagação usadas gerar plantas. Por exemplo, uma planta alvo que seja transformada com um polinucleotideo que codifica um membro do clade do polipeptídeo G1073 e que tenha uma maior biomassa e/ou tolerância abíótica ao estresse do que a um tipo-selvagem ou o controle não-transformada pode ser "auto" (isto é, autopolinizada) ou cruzada com uma outra planta para produzir a semente. As plantas da progênie podem ser crescidas desta semente, assim gerando plantas transformadas da progênie com tolerância aumentada ao estresse abiótico do que plantas do controle.

As plantas transgênicas (e a semente destas plantas transgênícas) produzidas pelos presentes métodos são abrangidas também pela invenção.

BREVE DESCRIÇÃO DA LISTAGEM DE SEQUÊNCIAS E DOS DESENHOS A listagem de seqüências fornece sequências exemplares de polinucleotídeos e de polipeptídeos da invenção. Os traços associados com o uso das seqüências são incluídos nos exemplos. 0 CD-R0M1 e CD-ROM2 são discos compactos lidos por memória de computador de leitura apenas. Cada um contém uma cópia da listagem de seqüêncías no formato de texto do ASCII, A listagem de seqüêncías ê nomeada "MBI0068PCT.ST25.txt" e tem 145 kilobytes no tamanho. As cópias da listagem de seqüêncías nos discos CD-ROM são incorporadas por este meio pela referência em sua totalidade. A figura 1 mostra uma estimativa conservadora de relações fílogenêtícas entre as ordens de plantas de florescência (modificadas da Angiosperm Phylogeny Group (1998) Aon. Missouri Bot. Gard. 84: 1 - 49) . Aquelas plantas com uma única cotilédone (monocotíledôneas) são um clade monofilética aninhado dentro ao menos de duas linhagens principais de dicotiledôneas; as eudicotiledôneas são divididos ainda em rosídeas e em asterídeas. Arabídopsís é uma eudicotiledônea rosídea classificada dentro da ordem Brassicaleso arroz é um membro da monocotiledônea da ordem Poales. A figura l foi adaptada de Daly et al. (2001) Plant Physiol. 127: 1328 - 1333. A figura 2 mostra um dendograma filogênico que descreve as relações filogenétícas de taxa de plantas superiores, incluindo clades que contêm o tomate e a Arabidopsis; adaptado de Ku et al. (2000) Proc. Natl. Acad, Sei. USA 97: 9121 - 9126? e Chase et al. (1993) Ann. Missouri Bot. Gard. 80: 528 - 580. A figura 3 descreve a estrutura do domínio de proteínas AT-hook, representada por uma respresentação esquemãtica da proteína G1Q73. As regiões que compreendem o domínio de ligação do DMA, o segundo domínio conservado e a região acídica são representadas pelas letras "A", "B", e "C", respectivamente. As setas indicam os potenciais sítios de fosforilação CK2 e PKC. Um domínio de ligação do DNA conservador é situado nas posições 34 a 42. A figura 4 mostra os ortologs da colheita que foram identificados com a análise BLAST de origem de dados privados e públicos. Uma árvore do filogênica foi gerada então usando ClustalX baseado em sequências inteiras da proteína. As seqüências que são marcados com um "número "GID" que começa com a letra maiúscula "G" seguida por "At" se referem às seqüências de Arabídopsis; as seqüências com "Gm" são seqüências de soja, e "Os" são seqüências de arroz. Vinte e quatro membros do clade G1073 derivados de Arabídopsis, de milho e de soja podem ser encontrados dentro da caixa grande? estas seqüências representam exemplos, do clade e não são pretendidas representar o clade inteiro, que tem muitos mais membros de outras espécies de plantas. Um número representativo de membros do clade G1Q73 foi mostrado para conferir propriedades vantajosas às plantas quando superexpressas ,* as sequências que aparecem com um sobrescrito T,a" foram mostradas para conferir tolerância aumentada ao estresse abiótico aumentado, e as seqüências que aparecem com um sobrescrito "b" foram mostradas para conferir a biomassa aumentada. Muitas das seqüências restantes não foram testadas ainda em plantas superexpressantes. Diversas seqüências do membro do clade G1Q73 que foram mostradas também para conferir estresse abiótico nas plantas não são mostradas na figura 4, mas são descritas no exemplo VII.

Nas figuras 5A - 5H, os alinhamentos de um número de proteínas AT-hook identificadas na figura 4 são mostrados, e incluem membros do clade de Arabidopsís (G1067, G1Q69, G1073, G1667, G2153, G2156, G2789) , de soja (G3456, G3459, G3460) , e de arroz (G3399, G34Q0, G3401, G3407) que foi mostrado para conferir traços similares nas plantas quando superexpressas (o clade é indicado pela caixa grande). São mostrados também os domínios conservados AT-hook (figura 5C) e os segundos domínios conservados que medem das figuras 5D através da 5F) , como indicado pelas barras no alto e no final da página, respectivamente.

As figuras 6A e 6B mostram as seções laterais do pé da Arabidopsís do tipo selvagem (à esquerda) e do G1073 - superexpressante (à direita), No pê da planta de G1Q73 -superexpressante, os feixes vasculares são maiores (contendo mais células nas áreas do floema e do xílema) e as células do cortex são ampliadas.

Muitas plantas de Arabidopsis que superexpressam o G1073 (figura 7A, exemplo na direita) são maiores do que plantas do controle do tipo selvagem (figura 7A, esquerda). Este distinção também é verdadeira para órgãos florais, que, como ê visto na figura 7B, são significativamente grandes planta G1073 - superexpressante na direita do que aquela planta do tipo selvagem na esquerda. A figura 8 ê um gráfico que compara o número de síliquas as plantas 35S::G1073 e no controle (tipo selvagem) indicando como o número da semente é associado com o número aumentado de síliquas por planta visto nas linhagens superexpressantes.

Como visto nas figuras 9A e 9B, G1073 funciona tanto no grão de soja e como no tomate para aumentar a biomassa. Na figura 9A, a planta de grão de soja maior na direita esta superexpressando G1073. As folhas de tomate de um número de linhagens superexpressoras de G1Q73 foram muito maiores do que aquelas plantas de tomate do tipo selvagem, como visto na figura 9B pela comparação das folhas da planta superexpressora na esquerda com aquela de uma planta do tipo selvagem na direita. A figura 10A é uma fotografia de uma planta de Arabidopsis que supe rexpre s s ando o gene G33 99 da monocoti1edônea, um arroz ortólogo de G1073. 0 fenõtipo do tamanho e da massa aumentados é o mesmo como o fenótipo conferido por Arabidopsis G1073 e suas seqüências parãlogas G1067, G2153 e G2157. A figura 10B mostra similarmente os efeitos -de um outro arroz ortólogo, G3407, em sete dias. A superexpressora na esquerda é aproximadamente 50 % maior do que a planta de controle na direita. A figura 11 mostra os efeitos da superexpressão do G3460, uma soja ortóloga de G1Q73, na morfologia da planta. Trinta e oito dias após o plantio, a superexpressora na esquerda tem folhas significativamente mais largas e mais massivas do que a planta de controle na direita. A superexpressora demonstra também o desenvolvimento tardio, uma característica vista também quando G1Q73 ou seus parálogos são superexpressos. A figura 12 mostra os efeitos da superexpressão de G3460, uma soja ortóloga de G1Q73, nas plantas de Arabidopsis sujeitadas a um ensaio de dessecação baseado em placa. Âs plantas novas superexpressando G3460 são mais tolerantes ao tratamento de dessecação, como evidenciado pelo tamanho maior, pela massa maior da raiz, e pela cor mais verde das plantas na esquerda do que as plantas do controle na direita.

DESCRIÇÃO DETALHADA A presente invenção relaciona-se aos polinucleotídeos e aos polipeptídeos para fenótipos modificantes das plantas, particularmente daquelas associadas com a biomassa e/ou tolerância ao estresse abiótico aumentadas. Durante todo esta descrição, as várias fontes de informação são consultadas a e/ou incorporadas especificamente. As fontes de informação incluem endereços de página de navegador -inativo da Rede Mundial, artigos de jornais científicos, documentos de patente e livros texto. Embora a referência a estas fontes de informação indica claramente que podem ser usados por uma pessoa com habilidade na técnica, cada e qualquer uma das fontes de informação citadas aqui ê incorporada especificamente em sua totalidade, se ou não tiver uma menção específica de "modalidade pela referência" estiver anotada. Os conteúdos e os ensinamentos de cada e qualquer uma das fontes de informação podem ser confiados sobre e usado para fazer e usar as modalidades da invenção.

Como usado aqui e nas reivindicações apensas, as formas singulares "um", "uma", e "o/a" incluem a referência no plural a menos que o contexto ditar claramente de outra maneira. Assim, por exemplo, uma referência a "uma célula hospedeira" inclui uma pluralidade de tais células hospedeiras, e uma referência a "um estresse" ê uma referência a um ou mais estresses e equivalentes conhecidos dos mesmos àqueles hábeis na técnica, e assim por diante. DEFINIÇÕES "Molécula de ácido nucleico" se refere a um oligonucleotídeo, polinucleotídeo ou qualquer fragmento deles. Pode ser DNA ou RNA de origem genômica ou sintética, de fita dupla ou fita simples, e combinada com o carboidrato, lipídeos, proteína, ou outros materiais para executar uma atividade particular, tal como, a transformação ou para formar uma composição útil, tal como, um ácido nucleico peptídico (PNA). "Polinucleotídeo" é uma molécula de ácido nucleico que compreende uma pluralidade de nucleotídeos polimerizados, por exemplo, ao menos aproximadamente 15 nucleotídeos polimerizados consecutivos. Um polinucleotídeo pode ser um ácido nucleico, oligonucleotídeo, nucleotídeo, ou qualquer fragmento destes. Em muitos exemplos, um polinucleotídeo compreende uma seqüência do nucleotídeo que codifica um polipeptídeo (ou a proteína) ou um domínio ou um fragmento dos mesmos. Adicionalmente, o polinucleotídeo pode compreender um promotor, um íntron, uma região melhoradora, um sitio de poliadenilação, um sítio de iniciação da tradução, regiões não traduzidas 5' ou 3', um gene repórter, um marcador selecionãvel, ou assemelhados, 0 polinucleotídeo pode ser DNA de fita simples ou dupla ou RNA. 0 polinucleotídeo compreende opcionalmente bases modificadas ou uma cadeia prncipal modificada. 0 polinucleotídeo pode ser, por exemplo, DNA ou RNA genômico, um transcrito (tal como, um mRNA) , um cDNA, um produto de PCR, um DNA clonado, um DNA ou um RNA sintético, ou assemelhados, 0 polinucleotídeo pode ser combinado com o carboidrato, os lipídeos, a proteína, ou outros materiais para executar uma atividade particular, tal como, a transformação ou para formar uma composição útil, tal como, um ácido nucleico peptídico (PNA). 0 polinucleotídeo pode compreender uma seqüência em orientações do sentido ou antísenso. "01igonucleotídeo" ê substancialmente equivalente aos termos amplimer, primer, oligômero, elemento', alvo, e sonda e é preferivelmente de fita simples, "Gene" ou "seqüência de gene" se refere à seqüência de codificação parcial ou completa de um gene, de seu complemento, e de suas regiões não traduzidas 5' ou 3', Um gene é também uma unidade funcional de não hereditariedade, e em termos físicos ê um segmento ou uma seqüência particular de nucleotídeos ao longo de uma molécula do DNA (ou do RNA, no exemplo de vírus RNA) envolvida em produzir uma corrente de polipeptídeo. 0 último pode ser sujeitado a processamento subsequente, tal como, uma modificação química ou dobradura para obter uma proteína ou um polipeptídeo funcional. Um gene pode ser isolado, parcialmente isolado, ou encontrado com genoma de um organismo. Por meio de exemplo, um gene do fator de transcrição codifica um polipeptídeo do fator de transcrição, que pode ser funcional ou requer processamento para funcionar como um iníciador de transcrição.

Operacionalmente, os genes podem ser definidos pelo teste cis - trans, um teste genético que determine se duas mutações ocorrem no mesmo gene e que pode ser usado para determinar os limites da unidade geneticamente ativa (Rieger et al. (1976) Glossary of Genetícs and Cytogenetics: Classical and Molecular, 4 th ed., Springer Verlag, Berlin). Um gene inclui geralmente as regiões precessoras ("líderes"; jusante) e seguir ("reboques" montante) a região codificante. Um gene pode também incluir a intervenção, sequências não codificantes, referidas como "íntrons", situados entre os segmentos codificantes individuais, referidos como "exons". A maioria dos genes têm uma região promotora associada, uma sequência regulatória 5' do codon de iniciação da transcrição (há alguns genes que não têm um promotor identificável). A função de um gene pode também ser regulada por melhoradores, por operadores, e por outros elementos regulatõrios.

Um "polinucleotídeo recombinante" ê um polinucleotídeo que não está em seu estado nativo, por exemplo, o polinucleotídeo compreende uma seqüência do nucleotídeo não encontrada na natureza, ou o polinucleotídeo está em um contexto à excepção daquele em que se encontra naturalmente, por exemplo, separado das seqüêncías de nucleotídeos com que estâ tipicamente na proximidade em sequências nucleotídicas na natureza, ou adjacentes (ou contíguas com) com as quais não está tipicamente em proximidade. Por exemplo, a seqüência na saída pode ser clonada ,em um vetor, ou de outra maneira recombinada com um ou mais ácidos nucleicos adicionais.

Um "polinucleotídeo isolado" é um polinucleotídeo, seja de ocorrência natural ou recombinante, que está presente fora da célula em que se encontra tipicamente na natureza, se purificado ou não. Opcionalmente, um polinucleotídeo isolado está sujeito a um ou mais procedimentos de enriquecimento ou de purificação, por exemplo, lise da célula, extração, centrifugação, precipitação, ou assemelhados.

Um "polipeptídeo" ê uma seqüência de aminoãeido que compreende uma pluralidade de resíduos de aminoãcidos polimerizados consecutivos, por exemplo, ao menos aproximadamente 15 resíduos de aminoãcidos polimerizados consecutivos. Em muitos exemplos, um polipeptídeo compreende uma seqüência do resíduo de aminoãeido polimerizado que ê um fator de transcrição ou um domínio ou uma porção ou um fragmento destes. Adicionalmente, o polipeptídeo pode compreender: (i) um domínio de localização; (ii) um domínio de ativação; (iii) um domínio de repressão; (iv) um domínio de oligomerização; (v) um domínio 'de ligação de DNA; ou assemelhados. 0 polipeptídeo compreende opcionalmente resíduos de aminoãcidos modificados, resíduos de aminoãcidos naturais não codificados por um códon, resíduos de aminoãcidos de ocorrência não natural. "Proteína" se refere a uma seqüência de aminoãeido, a oligopeptídeo, peptídeo, polipeptídeo ou porções dos mesmos seja de ocorrência natural ou sintética. "Porção", como usado aqui, se refere a qualquer parte de uma . proteína usada para qualquer finalidade, mas especialmente para a seleção de uma biblioteca das moléculas que se ligam especificamente a essa porção ou para a produção de anticorpos.

Um "polipeptídeo recombinante" ê um polipeptídeo produzido pela tradução de um polinucleotídeo recombinante. Um "polipeptídeo sintético" é um polipeptídeo criado pela polimerrzação consecutiva de resíduos de aminoãcidos isolados usando os métodos bem conhecidos na técnica. Um "polipeptídeo isolado", seja um de ocorrência natural ou um polipeptídeo recombinante, é mais enriquecido em (ou fora de) uma célula do que o polipeptídeo em seu estado natural em uma célula do tipo selvagem, por exemplo, mais do que aproximadamente 5 % enriquecido, mais do que aproximadamente 10 % enriquecido, ou mais do que aproximadamente 20 %, ou mais do que aproximadamente 50 %, ou mais, enriquecido, isto é, denotado alternativamente: 105 %, 110 %, 120 %, 150 % ou mais, enriquecidos relativos ao tipo selvagem padronizado em 100 %. Tal enriquecimento não é o resultado de uma resposta natural de uma planta do tipo selvagem. Alternativamente, ou adicionalmente, o polipeptídeo isolado ê separado de outros componentes celulares com que ê tipicamente associado, por exemplo, por qualquer dos vários métodos de purificação da proteína daqui, "Homologia" se refere à similaridade de sequência entre uma sequência de referência e ao menos um fragmento de uma inserção recentemente clonada da seqüência ou de sua sequência de aminoãcido codificada. "Identidade" ou "similaridade" se refere a similaridade de sequência entre duas seqüências de polinucleotídeo ou entre duas seqüências de polipeptídeo, com a identidade sendo uma comparação mais estrita. As frases "porcentagem de identidade" e "% de identidade" se referem â porcentagem de similaridade de seqüência encontrada em uma comparação de duas ou mais seqüências de polinucleotídeo ou de duas ou mais seqüências de polipeptídeo. "Similaridade de seqüência" se refere à porcentagem de similaridade na seqüência de par de base (como determinado por qualquer método apropriado) entre duas ou mais seqüências de polinucleotídeos. Duas ou mais seqüências podem ser em qualquer lugar de 0 - 100 % similares, ou qualquer valor inteiro entre estes. A identidade ou a similaridade pode ser determinada pela comparação de uma posição em cada seqüência que pode ser alinhada para finalidades de comparação. Quando uma posição na seqüência comparada é ocupada pela mesma base de nucleotídeo ou aminoãcido, então as moléculas são idênticas nessa posição. Um grau de similaridade ou de identidade entre seqüências de polinucleotídeos ê uma função do número de nucleotídeos idênticos, de combinação ou correspondentes nas posições compartilhadas pelas seqüências de polinucleotídeos. Um grau de identidade de sequências de polipept ideo ê uma função do número de aminoãcidos idênticos nas posições correspondentes compartilhadas pelas seqüências de polipeptídeo. Um grau de homologia ou de similaridade de seqüências de polipeptídeo é uma função do número dos aminoãcidos nas posições correspondentes compartilhadas pelas seqüências de polipeptídeo. "Alinhamento" se refere a um número de bases de nucleotídeo ou de seqüências de resíduo de aminoãcido alinhadas pela comparação longitudinal de modo que os componentes em comum (isto é, bases de nucleotídeos ou resíduos de aminoãcidos em posições correspondentes) podem ser visualmente e prontamente identificados. A fração ou a porcentagem dos componentes em comum ê relacionada à homologia ou â identidade entre as seqüências. Os alinhamentos, tais como, aqueles das figuras 5A - 5H podem ser usados para identificar domínios conservados e o relacionados dentro destes domínios. Um alinhamento pode apropriadamente ser determinado por meio dos programas de computador conhecidos na técnica, tal como, o software de MACVECTOR (1999) (Accelrys, Inc., San Diego, CA).

Um "domínio conservado" ou "região conservada" como usada aqui se refere a uma região nas seqüências heterolõlogas de polinucleotideo ou de polipeptídeo onde hã um grau relativamente elevado de identidade da sequência entre as seqüências distintas. Um "domínio "AT-hook", tal como ê encontrado em um membro do polipeptídeo da família do fator de transcrição do AT-hook, ê um exemplo de um domínio conservado. Com relação aos polínucleotídeos que codificam fatores presentemente descritos de transcrição, um domínio conservado ê preferivelmente ao menos nove pares de bases (bp) no comprimento. Um "domínio conservado", com relação aos polipeptídeos presentemente descritos do AT-hook se refere a um domínio dentro de uma família do fator de transcrição que exiba um grau mais elevado de homoiogia da seqüência, tal como, ao menos aproximadamente 62 % identidade da seqüência, incluindo substituições conservadoras, ou ao menos aproximadamente 63 %, ou ao menos de aproximadamente 65 %, ou ao menos de aproximadamente 67 %, ou ao menos de aproximadamente 68 %, ou ao menos de aproximadamente 69 %, ou ao menos de aproximadamente 71 %, ou ao menos de aproximadamente 78 %, ou ao menos aproximadamente 89 % de identidade da seqüência do resíduo do aminoãcido ao domínio conservado. As seqüências que possuem ou codificam para os domínios conservados que se encontram com estes critérios da identidade da porcentagem, e que têm a atividade biológica comparável âs presentes seqüências do fator de transcrição, assim sendo membros do clade G1Q73 de polipeptídeos do fator de transcrição, são abrangidas pela invenção. Um fragmento ou um domínio podem ser referidos como â parte externa de um domínio conservado, fora de uma seqüência consenso,, ou à parte externa de um sítio de ligação de DNA consenso que tem a existência conhecida ou que existe para uma classe, família, ou sub-família particular do fator de transcrição. Neste caso, o fragmento ou o domínio não incluirá os exatos aminoãcidos de uma seqüência consenso ou de um sítio de ligação de DNA consenso de uma classe, família ou sub-família do fator de transcrição, ou dos exatos aminoãcidos de uma seqüência particular do consenso do fator de transcrição ou de sítio de ligação de DNA consenso. Além disso, um fragmento, região, ou domínio particular de um polipeptídeo, ou de um polinucleotídeo que codifica um polipeptídeo, podem ser a "parte externa de um domínio conservado" se todos os aminoãcidos do fragmento, região, ou domínio caem da parte externa de um domínio(s) conservado(s} definido para um polipeptídeo ou uma proteína. As seqüências que têm poucos graus de identidade, mas de atividade biológica comparável são consideradas ser equivalentes.

Enquanto uma pessoa de habilidade ordinária na técnica reconhece, os domínios conservados podem ser identificados como regiões ou domínios da identidade a uma seqüência específica consenso (veja, por exemplo, Riechmann et al. (2000) Science 290: 2105 - 2110). Assim, pelo uso dos métodos de alinhamento bem conhecidos na técnica, os 5 domínios conservados dos fatores de transcrição da planta para as proteínas do AT-hook (Reeves e Beckerbauer (2001) Biochim. Biophys. Acta 1519: 13 - 29; e Reeves (2001) Gene 277: 63 - 81) podem ser determinados.

Os domínios conservados para SEQ ID NO: 2, 4, 6, 8, 3 10, 12, 14, 16, 18, 26, 30, 38, 40, 42, 67 e 69 são listadas na Tabela 1. Ainda, os polipeptídeos da Tabela l têm o domínio AT-hook e o segundo domínio conservado especificamente indicados pelo sítio de início e parada. Uma comparação das regiões dos polipeptídeos na SEQ 1D NO: 5 2, 4, 6, 8, 10, 12, 14, 16, 18, 26, 30, 38, 40, 42, 67 e 69 permite um com habilidade na ténica (veja, por exemplo, Reeves e Nisson (1995) Biol. Chem. 265: 8573 - 8582) para identificar o domínio AT-hook e o segundo domínio conservado para qualquer dos polipeptídeos listados ou 3 referidos nessa descrição. "Complementar" se refere à ligação natural do hidrogênio pelo pareamento de bases entre purinas e pirimidinas. Por exemplo, a seqüência A-C-G-T (5' -> 3') forma ligações de hidrogênio com seus complementos A-C-G-T {5' -> 3') ou A-C-G-U (5' -> 3’). Duas moléculas de fita simples podem ser consideradas parcialmente complementares, se somente alguns dos nucleotídeos se ligarem, ou "completamente complementares" se todos os nucleotídeos se ligarem. 0 grau de complementaridade entre as fitas de ácido nucleico afeta a eficiência e a força de reações de hibridização e de amplificação. "Inteiramente complementar" se refere ao caso onde a ligação ocorre entre cada par de bases e seu complemento em um par das seqüências, e as duas sequências têm o mesmo número de nucleotídeos.

Os termos "altamente estritos" ou "condição altamente estrita" se referem às condições que permitem a hibridização das fitas de DNA cujas seqüências são altamente complementares, em que estas mesmas condições excluem a hibridização de DNAs significativamente mal combinadas. As seqüências de polinucleotídeo capazes de hibridiz.ar sob condições estritas com os polinucleotídeos da presente invenção podem ser, por exemplo, variants das seqüências de polinucleotídeos descritas, incluindo variantes alélicas e "splice", ou as seqüências que codificam ortõlogos ou parãlogos de polipeptídeos presentemente descritos. Os métodos de hibridização do ácido nucleico são descritos em detalhes por Kashima et al. (1985) Nature 313: 402 - 404, Sambrook et al. (1989) Molecular Cloning: A Laboratory Manual, 2nd Ed. , Cold Spring Harbor Laboratory, Cold Spríng Harbor, N.Y. ("Sambrook"), e por Haymes et al. "Hucleico Acid Hibridização: A Practical Approach11, IRL Press, Washington, D.C. (1385) , cujas referências sao incorporadas aqui por referência.

No geral, a estringência ê determinada pela temperatura, pela força iônica, e pela concentração de agentes desnaturantes (por exemplo, formamida) usados em um procedimento de hibridização e de lavagem (para uma descrição mais detalhada para estabelecer e determinar a estringência, veja a seção "Identificar Polinucleotídeos ou Ácidos Nucleicos por Hibridização", abaixo). 0 grau a que dois ácidos nucleicos hibridizam sob várias condições de estringência ê correlacionado com a extensão de sua similaridade. Assim, as seqüências similares do ácido nucleico de uma variedade de fontes, tais como, dentro do genoma de uma planta (como no caso dos parálogos) ou de uma outra planta (como no caso dos ortólogos) que pode executar funções similares podem ser isoladas na base de sua habilidade para hibridizar com sequências conhecidas do fator de transcrição. Variações numerosas são possíveis nas condições e nos meios pela qual a hibridização do ácido nucleico pode ser executada para isolar as seqüências do fator de transcrição que têm similaridade às seqüências do fator de transcrição conhecidas na técnica e não são limitadas àquelas descritas explicitamente aqui. Tal abordagem pode ser usada para isolar as seqüências de polinucleotídeos que têm vários graus de similaridade com seqüências descritas do fator de transcrição, tal como, por exemplo, os fatores de transcrição codificados que têm 62 % ou mais de identidade com o domínio AT-hook de fatores de transcrição descritos.

Os termos "parãlogo" e "ortólogo" são definidos abaixo na seção intitulada "Ortólogos e Parálogos". No sumario, os ortólogos e os parálogos são os genes evolucionariamente relacionados que têm seqüências e funções similares. Os ortólogos são genes estruturalmente relacionados em espécies diferentes que são derivadas por um evento de especíação. Os parálogos são genes estruturalmente relacionados dentro de uma única espécie que seja derivada por um evento de duplicação. O termo "equivãlogo" (do inglês; equivalog) descreve membros - de um conjunto de proteínas homólogas que são conservadas com relação à função desde seu último ancestral comum. As proteínas relacionadas são agrupadas em famílias de equivãlogos, e de outra maneira dentro das famílias de proteínas com outros tipos de hotnologia hierarquicamente definidos. Esta definição ê fornecida na página virtual da World Wide Web (www) do Institute for Genômico Research (T1GR), ■ "tigr.org" sob o título "Terms assocíated with TIGRFAMs". O termo "variante", como usado aqui, pode se referir aos polinucleotídeos ou aos polipeptídeos, que diferem dos polínucleotídeos ou dos polipeptídeos presentemente descritos, respectivamente, em seqüência entre si, e como determinado abaixo, No que diz respeito âs variantes do polinucleotídeo, as diferenças entre polinucleotídeos e variantes presentemente descritas do polinucleotídeo são limitadas de modo que as sequências de nucleotídeos do anterior e do último sejam proximamente similares no total e, em muitas regiões, idênticas. Devido à degeneração do código genético, as diferenças entre as sequências anteriores e últimas 'do nucleotídeo pode ser silencioso (isto é, os aminoãcidos codificados pelo polinucleotídeo são os mesmos, e a seqüência variante do polinucleotídeo codifica a mesma sequência de aminoãcidos que o polinucleotídeo presentemente descrito). As seqüências variantes do nucleotídeo podem codificar seqüências de aminoãcidos diferentes, em que no caso tais diferenças de nucleotídeos resultarão em substituições, em adições, em deleções, em inserções, em truncagens ou em fusões do aminoãcido com relação às sequências descritas do polinucleotídeo similares. Estas variações podem resultar nas variantes do polinucleotídeo que codificam os polipeptídeos que compartilham ao menos uma característica funcional. A degeneração do código genético dita também que muitos polinucleotídeos variantes diferentes podem codificar polipeptídeos idênticos e/ou substancialmente similares além daquelas seqüências ilustradas na listagem de sequências.

Também dentro do escopo da invenção está uma variante de um ácido nucleico do fator de transcrição listado na listagem de sequências, isto ê, uma que tem uma sequência que difira dessa das seqüências de polinucleotídeos na listagem de seqüências, ou uma seqüência complementar, que codifique um polipeptídeo funcionalmente equivalente (isto ê, um polipeptídeo que tem algum grau de atividade biológica equivalente ou similar) mas difere em ordem da seqüência na listagem de seqüências, devido à degeneração no código genético. São incluídos dentro desta definição os polimorfísraos que podem ou não podem ser prontamente detectãveis usando uma sonda particular do oligonucleotídeo do polipeptídeo que codifica o polinucleotídeo, e a hibridização imprópria ou inesperada aos variantes alêlicos, com um locus â excepção do locus cromossomal normal para a seqüência de polínucleotídeos que codifica o polipeptídeo. "Variante Alélico" ou "variante alêlíco do pol inucl eot í deo" se refere a quaiquer de duas ou mais formas alternativas de um gene que ocupa o mesmo locus cromossomal. A variação alêlica cresce naturalmente com a mutação, e pode resultar no polimorfismo fenotípico dentro das populações. As mutações do gene podem ser "silenciosas" ou podem codificar polipeptídeos que alteram a seqüência dos aminoãcidos. "Variante Alélico" ou "variante alélico do polinucleotideo" pode também ser usado com relação aos polipeptídeos, e neste caso o termo se refere a um polipeptídeo codificados por um variante alélico de um gene. ■ "Variante splice" ou "variante splice de polinucleotideo" como usado aqui se refere às formas alternativas do RNA transcrito de um gene. A variação splice ocorre naturalmente em conseqüência dos sítios alternativos que estão sendo emendados dentro de uma única molécula transcrita do RNA ou entre moléculas separadas transcritas do RNA, e podem resultar em diversas formas diferentes do mRNA transcritos do mesmo gene. Assim, os variantes splice podem codificar os polipeptídeos que têm as sequências diferentes do aminoácido, que podem ou não podem ter funções similares no organismo. "Variante splice" ou "variante splice de polinucleotídeo" pode também se referir a um polipeptídeo codificado por um variante splice de um raRNA transcrito.

Como usado aqui, "variantes de polinucleotídeo" podem também se referir âs sequências de polinucleotídeos que codificam parãlogos e ortólogos das sequências presentemente descritas do polipeptídeo. "Variantes de polinucleotídeo" podem se referir âs sequências de polipeptídeo que são parãlogas e ortólogas das sequências presentemente descritas do polipeptídeo.

As diferenças entre polipeptídeos e variantes presentemente descritos do polipeptídeo são limitadas de modo que as seqüências do anterior e do último sejam proximamente similares no total e, em muitas regiões, idênticas. As seqüências presentemente descritas do polipeptídeo e os variantes similares do polipeptídeo podem diferir na seqüência de aminoãcidos por uma ou mais substituições, adições, deleções, fusões e truncagens, que podem estar presentes em qualquer combinação. Estas diferenças podem produzir mudanças silenciosas e o resultado em um fator funcionalmente equivalente da transcrição. Assim, será apreciado prontamente por aqueles com habilidade na técnica, que qualquer de uma variedade de sequências de polinucleotídeos é capaz de codificar os fatores de transcrição e os polipeptídeos homólogos do fator de transcrição da invenção. Um variante da sequência do polipeptídeo pode ter mudanças "conservadoras", em que um aminoãcido substituído tem propriedades estruturais ou químicas similares. As substituições deliberadas do aminoãcido podem assim ser feitas na base da similaridade na polaridade, na carga, na solubilidade, na hidrofobicidade, na hidrofilicidade, e/ou na natureza anfipãtica dos resíduos, uma vez que uma quantidade significativa da atividade funcional ou biológica do fator de transcrição ê retida. Por exemplo, os aminoácidos negativamente carregados podem incluir o ãcído aspãrtico e o ácido glutâmico, os aminoácidos positívamente carregados podem incluir a lisína e a arginina, e os aminoácidos com os grupos principais polares não carregados que têm valores similares de hidrofilicidade podem incluir a leucina, a isoleucina, e a valína,- glicina e alanina; asparagina e glutamina; serína e treonina,- e fenilalanina e tirosina (para mais detalhes em substituições conservadoras, veja a tabela 3). Mais raramente, um variante pode ter as mudanças "não-conservadoras", por exemplo, a recolocação de uma glicina com um triptofano. As variações menores similares podem também incluir deleções ou inserções de aminoãcidos, ou ambas. Os polipeptídeos relacionados podem compreender, por exemplo, adições e/ou deleções de um ou mais de sítios de glicosilação N - ligados ou O - ligados, ou uma adição e/ou uma deleção de um ou mais resíduos de cisteína. & orientação em determinar qual e quantos resíduos de aminoãcidos podem ser substituídos, introduzidos ou suprimidos sem abolir a atividade funcional ou biológica pode ser encontrado usando os programas de computador bem conhecidos na técnica, por exemplo, DNASTAR software (veja USPN 5,840,544). "Fragmento", com relação a um polinucleotídeo, se refere a um clone ou a qualquer parte de uma molécula do polinucleotídeo que retenha uma característica usável, funcional. Os fragmentos úteis incluem os oligonucleotídeos e os polinucleotídeos que podem ser usados em tecnologias de hibridização ou de amplificação ou na regulação da replicação, da transcrição ou da tradução. Um "fragmento de polinucleotídeo" se refere a qualquer subseqüência de um polinucleotídeo, tipicamente, ao menos de aproximadamente 9 nucleotídeos consecutivos, preferivelmente ao menos aproximadamente 30 nucleotídeos, mais preferivelmente ao menos aproximadamente 50 nucleotídeos, de qualquer das sequências fornecidas aqui. Os fragmentos exemplares do polinucleotídeo são os primeiros sessenta nucleotídeos consecutivos dos polinucleotídeos do fator de transcrição listados na listagem de sequências. Os fragmentos exemplares incluem também os fragmentos que compreendem uma região que codifica um domínio AT-hook de um fator de transcrição. Os fragmentos exemplares incluem também os fragmentos que compreendem um domínio conservado de um fator de transcrição. Os fragmentos exemplares incluem os fragmentos que compreendem um AT-hook ou um segundo domínio conservado de um fator de transcrição do AT-hook, por exemplo, resíduos de aminoãcidos 34 - 42 e 78 - 175 do G1073 (SEQ ID NO: 2), como anotado na Tabela 1.

Os fragmentos podem também incluir subseqüêncías dos pol ipept-í deos e das moléculas de proteína, ou uma subseqüência do polipeptideo. Os fragmentos podem ter usos que podem ter o potencial antigênico. Em alguns casos, o fragmento ou o domínio é uma subseqüência do polipeptideo que executa ao menos uma função biológica do polipeptxdeo intato substancialmente na mesma maneira, ou a uma extensão similar, como o polipeptideo intato. Por exemplo, um fragmento de polipeptideo pode compreender um motivo estrutural reconhecível ou um domínio funcional, tal como, um sítio de ligação de DNA ou um domínio que se ligue a uma região do promotor de DNA, a um domínio de ativação, ou a um domínio para interações da proteína - proteína, e pode iniciar a transcrição. Os fragmentos podem variar no tamanho de somente 3 resíduos de aminoãcidos ao comprimento completo do polipeptídeo intato, mas são preferivelmente ao menos aproximadamente 30 resíduos de aminoãcidos no comprimento e mais preferivelmente ao menos aproximadamente 60 resíduos de aminoãcidos no comprimento, A invenção abrange também a produção das sequências do DNA que codificam fatores de transcrição e derivativos do fator de transcrição, ou dos fragmentos dos mesmos, inteiramente pelo química sintética. Após a produção, a sequência sintética pode ser introduzida em qualquer de muitos vetores de expressão e sistemas de célula disponíveis usando os reagentes bem conhecidos na técnica. Além disso, a química sintética pode ser usada para introduzir mutações em uma sequência que codifica fatores de transcrição ou qualquer fragmento dos mesmos, "Derivativo1' se refere à modificação química de uma sequência de aminoãcidos ou molécula de ácido nucleico. As modificações químicas podem incluir a recolocação do hidrogênio por um alquil, um acil, ou um grupo amino ou glicosilação, por uma pegilação, ou qualquer processo similar que retiver ou realçar a atividade biológica ou o tempo de vida da molécula ou da seqüência. 0 termo "planta" inclui plantas inteiras, brotos vegetativos órgãos/estruturas (por exemplo, folhas, troncos e tubérculos), raizes, flores e órgãos/estruturas florais (por exemplo, as brãcteas, as sépalas, as pétalas, os estames, os carpelos, as antéras e os óvulos), semente (incluindo, o embrião, endosperma, e revestimento da semente) e a fruta (o ovário maduro), tecido de planta (por exemplo, o tecido vascular, o tecido da terra, e assemelhados) e células (por exemplo, as células protetoras, as células ovo, e assemelhados), e a progênie dos mesmos, A classe das plantas que podem ser usadas no método da invenção é geralmente tão larga quanto a classe de plantas superiores e inferiores receptivas às técnicas de transformação, incluindo as angiospermas (plantas monocotiledõneas e dicotiledôneas), as gimnospermas, as samambaias, as caudas-de-cavalo, as psilófítas, as licófitás, as briófitas, e às algas multicelulares (veja por exemplo, a figura 1, adaptada de Daly et al. (2001) Plant Physiol. 127: 1328 - 1333; a figura 2, adaptada de Ku et al. (2000) Proc. Natl. Acad. Sei. USA 37: 9121 - 9126; e veja também Tudge em The Variety of Life, Oxford üníversity Press, New York, NY (2000) pp. 547 - 606).

Uma "planta transgênica" se refere a uma planta que contenha o material genético não encontrado em uma planta do tipo selvagem da mesma espécie, variedade ou cultivar. 0 material genético pode incluir um transgene, um evento de mutagênese insercional (tais como, por transposon ou pela mutagênese insercional do T-DNA), uma sequência etiquetagem de ativação, uma seqüência mutada, um evento de recombínação homólogo ou uma seqüência modificada por quimeraplastia. Tipicamente, o material genético extrangeiro foi introduzido na planta pela manipulação humana, -mas qualquer método pode ser usado como uma pessoa com habilidade na técnica reconhece.

Uma planta transgênica pode conter um vetor de expressão ou cassete. 0 cassete de expressão compreende tipicamente uma seqüência que codifica o polipeptídeo operavelmente ligado (isto ê, sob o controle regulatório de) para adequar as sequências regulatórias constitutivas ou induzíveis que permitem a expressão controlada do polipeptídeo. 0 cassete de expressão pode ser introduzido em uma planta pela transformação ou pela procriação após a transformação de uma planta parental. Uma planta se refere a uma planta inteira bem como a uma parte da planta, tal como a semente, a fruta, a folha, ou a raiz, o tecido de planta, as células da planta ou qualquer outro material de planta, por exemplo, uma planta de explante, bem como para a progênie destas, e para os sistemas in vítro que imitam os processos ou componentes celulares ou bioquímicos em uma célula. "Tipo selvagem" ou "tipo - selvagem", como usado aqui, se refere a uma célula de planta, a uma semente, a um componente de planta, a um tecido de planta, a um órgão da planta ou a uma planta inteira que não foi geneticamente modificada ou tratada em um sentido experimental. As células tipo - selvagem, a semente, os componentes, o tecido, os órgãos ou as plantas inteiras podem ser usados como controles para comparar níveis de expressão e a extensão e natureza da modificação do traço com as células, o tecido ou as plantas da mesma espécie em que uma expressão de fator de transcrição é alterada, por exemplo, que estêve suprimido, superexpressado, ou expressado ectopicamente. · Uma "planta de controle" como usada na presente invenção se refere a uma célula de planta, a uma semente, a um componente da planta, a um tecido de planta, a um órgão da planta ou a uma planta inteira usada para comparar com as plantas transgênicas ou geneticamente modificadas com a finalidade de identificar um fenõtipo realçado nas plantas transgênicas ou geneticamente modificadas. Uma planta de controle pode em alguns casos ser uma linhagem de plantas transgênicas que compreende um gene marcador ou um vetor, mas não contém o polinucleotídeo recombinante da presente invenção que ê expressado na planta transgênica ou modificada geneticamente que estã sendo avaliada. No geral, uma planta de controle é uma planta da mesma linhagem ou variedade que a planta transgênica ou geneticamente modificada que estã sendo testada. Uma planta de controle apropriada incluiría uma planta geneticamente inalterada ou não - transgênica da linhagem parental usada para gerar uma planta transgênica aqui.

Um "traço" se refere a uma característica fisiológica, morfológíca, bioquímica, ou física de uma planta ou de um material de planta particular ou de uma célula. Em alguns exemplos, esta característica ê visível ao olho humano, tal como o tamanho da semente ou da planta, ou pode ser medida por técnicas bioquímicas, tais como a detecção de proteína, amido, ou o conteúdo de óleo da semente ou folhas, ou pela observação de um processo metabólico ou fisiológico, por exemplo, pela medição da tolerância a privação de água ou concentrações particulares de sal ou de açúcar, ou pela observação do nível da expressão de um gene ou de uns genes, por exemplo, pelo emprego da análise de Northern, RT-PCR, ensaios de microarranjo da expressão do gene, ou sistemas da expressão do gene repórter, ou por observações agriculturais, tais como, a tolerância do estresse do osmótico ou o rendimento. Qualquer técnica pode ser usada para medir a quantidade de, nível comparativo de, ou a diferença em qualquer composto químico selecionado ou macromolécula nas plantas transgênicas, no entanto. "Modificação do traço" se refere a uma diferença detectãvel em uma característica em uma planta que expressa ectopicamente um polinucleotídeo ou um polipeptídeo da presente invenção relativo a uma planta que não faz assim, como uma planta do tipo selvagem. Em alguns casos, a modificação do traço pode ser avaliada quantitativamente. por exemplo, a modificação do traço pode envolver ao menos aproximadamente um aumento ou uma diminuição de 2 %, ou uma diferença mesmo maior, em um traço observado em comparação a uma planta de controle ou do tipo selvagem. Sabe-se que pode haver uma variação natural no traço modificado. Consequentemente, a modificação do traço observada envolve uma mudança da distribuição normal e do valor do traço nas plantas em comparação às plantas de controle ou do tipo selvagem.

Quando duas ou os mais plantas têm "morfologias similares", "morfologias substancialmente similares", "uma morfologia que seja substancialmente similar", ou são "morfologicamente similares", as plantas têm formas ou aparências comparáveis, incluindo características análogas, tais como, dimensões totais, altura, largura, massa, massa da raiz, forma, brilho, cor, diâmetro do caule, tamanho da folha, dimensão da folha, densidade da folha, distância do internodo, ramificação, ramificação da raiz, número e forma das inflorescências, e outras características macroscópicas, e as plantas individuais não são prontamente distinguíveis baseadas em características morfológicas sozinhas. "Modula" se refere a uma mudança na atividade (biológica, química, ou imunológica) ou no tempo de vida resultando do ligação específica entre uma molécula e ou uma molécula de ácido nucleico ou uma proteína. O termo "perfil do transcrito" se refere aos níveis da expressão de um conjunto de genes em uma célula em um estado particular, particularmente pela comparação com os níveis da expressão daquela que o mesmo conjunto dos genes em uma célula do mesmo tipo dentro um estado de referência. Por exemplo, o perfil do transcrito de um fator particular de transcrição em uma célula em suspensão ê os níveis da expressão de um conjunto dos genes em uma célula suprimida ou que superexpressando esse fator de transcrição comparado com os níveis de expressão daquele mesmo conjunto dos genes em uma célula em suspensão que tenha níveis normais desse fator de transcrição. O perfil do transcrito pode ser apresentado como uma lista daqueles genes cujo o nível da expressão ê significativamente diferente entre os dois tratamentos, e das taxas da diferença. As diferenças e as similaridades entre níveis da expressão podem também ser avaliadas e calculado usando métodos estatísticos e agrupamento. "Expressão ectópica ou expressão alterada" em referência a um polinucleotídeo indica que o padrão de expressão em, por exemplo, uma planta transgênica ou um tecido de planta, é diferente do padrão da expressão em uma planta do tipo selvagem ou em uma planta de referência da mesma espécie. 0 padrão da expressão pode também ser comparado com um padrão da expressão da referência em uma planta do tipo selvagem da mesma espécie. Por exemplo, o polinucleotídeo ou o polipeptídeo são expressados em uma célula ou tipo de tecido à excepção de uma célula ou de um tipo de tecido em que a seqüência é expressada na planta do tipo selvagem, ou pela expressão em um momento outro que o momento em que a seqüência é expressada na planta do tipo selvagem, ou por uma resposta aos agentes induzíveis diferentes, tais como, hormônios ou sinais ambientais, ou nos níveis diferentes da expressão (ou mais elevado ou mais baixo) comparados com aqueles encontrados em uma planta do tipo selvagem. O termo se refere também aos padrões de expressão alterados que são produzidos pela redução dos níveis da expressão para abaixo do nível de deteção ou expressão completamente abolida. 0 padrão resultante da expressão pode ser transíente ou estável, constitutiva ou induzível. Na referência a um polipeptídeo, o termo "expressão ectópica ou expressão alterada" ainda pode relacionar-se aos níveis de atividade alterados resultando das interações dos polipeptídeos com os moduladores exógenos ou endõgenos ou das interações com fatores ou em consequência da modificação química dos polipeptídeos. 0 termo "superexpressão" como usado aqui se refere a um nível maior da expressão de um gene em um tecido da planta, da célula da planta ou de planta, comparado â expressão em uma planta, em uma célula ou em um tecido do tipo selvagem, a qualquer estágio de desenvolvimento ou temporal para o gene. A superexpressão pode ocorrer quando, por exemplo, os genes que codificam um ou os mais fatores de transcrição estão sob o controle de um promotor forte (por exemplo, a região da iniciação da transcrição 35S do vírus do mosaico da couve-flor). A superexpressão pode também estar sob o controle de um promotor induzível ou de tecido específico. Assim, a superexpressão pode ocorrer inteiramente na planta, em tecidos específicos da planta, ou na presença ou na ausência de sinais ambientais particulares, dependendo do promotor usado. A superexpressão pode ocorrer nas células da planta que faltam normalmente a expressão dos polipeptídeos funcionalmente equivalentes ou idênticos aos presentes fatores de transcrição. A superexpressão pode também ocorrer nas células da planta onde a expressão endõgena dos presentes fatores de transcrição ou das moléculas funcionalmente equivalentes ocorre normalmente, mas tal expressão normal está em um nível mais baixo. A superexpressão resulta assim em produção maior do que a normal, ou "superprodução" do fator de transcrição na planta, na célula ou no tecido. O termo da "região de regulação da transcrição" se refere a uma seqüêncía regulatôria do DNA que regula uma expressão de um ou mais genes em uma planta quando um fator de transcrição que tem um ou mais domínios de ligação específico liga ã seqüência regulatôria do DNA. Os fatores de transcrição da presente invenção possuem um domínio AT-book e um segundo domínio conservado. Os exemplos do AT-hook e do segundo domínio conservado similares das seqüêncías da invenção podem ser encontrados na tabela 1. Os fatores de transcrição da invenção compreendem também uma subseqüência de aminoãcidos que forma um domínio de ativação da transcrição que regula uma expressão de um ou mais genes abiõticos da tolerância do estresse em uma planta quando o fator de transcrição se liga à região de regulação.

DESCRIÇÃO DAS MODALIDADES ESPECÍFICAS

Fatores de Transcrição Modificam a Expressão de Genes Endógenos Um fator de transcrição pode incluir, mas não está limitado a, qualquer polipeptxdeo que puder ativar ou reprimir a transcrição de um único gene ou de um número de genes. Como uma pessoa com habilidade ordinária na técnica reconhece, os fatores de transcrição podem ser identificados pela presença de uma região ou de um domínio de similaridade ou de identidade estrutural a uma sequência específica consenso ou â presença de um sítio de ligação de DNA consenso específico ou de um motivo do sítio de ligação de DNA (veja, por exemplo, Riechmann et al. (2000) supra).

Os fatores de transcrição da planta da presente invenção pertencem â família do fator de transcrição do AT-hook (Reeves e Beckerbauer (2001) supra; e Reeves (2001) supra).

Geralmente, os fatores de transcrição codificados pelas presentes seqüências são envolvidos na diferenciação e na proliferação da célula e a regulação do crescimento. Conformemente, um tênico hábil na técnica reconhecería que pela expressão as presentes seqüências em uma planta, um técnico ^ pode mudar a expressão de genes autólogos ou induzir a expressão de genes introduzidos. Afetando a expressão das seqüências autólogas similares em uma planta que têm a atividade biológica das presentes seqüências, ou pela introdução das presentes seqüências em uma planta, um técnico pode alterar o fenótipo de uma planta a uma com os traços melhorados relacionados aos estresses osmóticos. As seqüências da invenção podem também ser usadas para transformar uma planta e introduzir os traços desejáveis não encontrados na cultivar ou na tensão do tipo selvagem. As plantas podem então ser selecionadas para aquelas que produzem o grau mais desejável de super ou de sub -expressão de genes alvo de interesse e da melhoria coincidente do traço.

As . seqüências da presente invenção podem ser de qualquer espécie, particularmente as espécies de planta, em um forma de ocorrência natural ou de qualquer fonte se natural, sintético, semi-sintética ou recombinante. As seqüências da invenção podem também incluir fragmentos das presentes seqüências de aminoácidos. Onde a 11 seqüência de aminoãcidos11 está recitada para se referir a uma seqüência de aminoãcidos de uma molécula natural da proteína, da "seqüência de aminoãcidos" e termos semelhantes não são intencionados para limitar a seqüência de aminoãcidos à seqüência nativa completa do aminoãcido associada com recitada molécula de proteína.

Além aos métodos para modificar um fenótipo da planta empregando um ou mais polinucleotídeos e polipeptídeos da invenção descrita aqui, os polinucleotídeos e os polipeptídeos da invenção tem uma variedade de usos adicionais. Estes usos incluem seu uso na produção recombinante (isto é, expressão) das proteínas; como reguladores da expressão do gene da planta, como as sondas de diagnóstico para a presença dos ácidos nucleícos complementares ou parcialmente complementares (incluindo para a deteção de ácidos nucleicos codificantes naturais); como substratos para reações adicionais, por exemplo, reações de mutação, reações de PCR, ou assemelhados,· como substratos para clonagem, por exemplo, incluindo reações de digestão ou ligação; e para identificar moduladores exõgenos ou endógenos dos fatores de transcrição. O polinucleotídeo pode ser, por exemplo, DNA ou RNA genômico, um transcrito (tal como, um mRNA) , um cDNA, um produto de PCR, um DNA clonado, um DNA ou um RNA sintético, ou assemelhados. O polinucleotídeo pode compreender uma seqüência em ou orientações senso ou antisenso. A expressão dos genes que codificam os fatores de transcrição que modificam a expressão de genes endógenos, dos polinucleotídeos, e das proteínas é bem conhecida na técnica. Além disso, as plantas transgênícas que compreendem os polinucleotídeos isolados que codificam fatores 'de transcrição podem também modificar a expressão > de genes, de polinucleotídeos, e de proteínas endógenos. Os exemplos incluem Peng et al. (1997) Genes Development 11: 3194 - 3205) e Peng et al. (1999) Nature, 400: 256 - 261).

Além disso, muitos outros demonstraram que um fator de transcrição de Arabidopsis expressado em uma espécie i exógena da planta elicía a mesma ou uma resposta fenotípica muito similar. Veja, por exemplo, Fu et al. (2001) Plant Cell 13: 1791 - 1802); Nandi et al. (2000) Curr. Biol. 10: 215 - 218); Coupland (1995) Nature 377: 482 - 483); e Weigel e Nilsson (1995) Nature 377: 482 - 500). 5 Em outro exemplo, Mandei et al. (1992) Cell 71 - 133 - 143, e Suzuki et al. (2001) Plant J, 28: 409 - 418, ensina que um fator de transcrição expressado em uma outra espécie da planta elicía a mesma ou a resposta fenotípica muito similar da sequência endõgena, como predito frequentemente i em estudos anteriores de fatores de transcrição de Arabidopsis em Arabidopsis (veja Mandei et al. (1992) supra; Suzuki et al. (2001) supra). Outros exemplos incluem Müller et al. (2001) Plant J. 28; 169 - 179; Kim et al. (2001) Plant J. 25; 247 - 259; Kyozuka e Shimamoto (2002) Plant Cell Physiol. 43: 130 - 135,- Boss e Thomas (2002) Na fure, 416: 847 - 850; He et al. (2000) Transgênicas Res. 9: 223 - 227; e Robson et al. (2001) Plant J, 28: 619 -631.

Em ainda outro exemplo, Gilmour et al. (1998) Plant J. 16: 433 - 442) ensina um fator de transcrição de Arabidopsis AP2, CBF1, que, quando superexpressas em plantas transgênicas, aumenta a tolerância ao congelamento da planta. Jaglo et al. (2001) Plant Physiol. 127; 910 -917, seqüências identificadas adicionais na Brassica napus que codifica os genes semelhantes a CBF e que os transcritos para estes genes acumularam rapidamente em resposta à temperatura baixa. Os transcritos que codificam as proteínas semelhantes a CBF foram encontradas também . para acumular rapidamente em resposta â temperatura baixa no trigo, bem como no tomate. Um alinhamento das proteínas de CBF do Arabidopsis, B. napus, do trigo, do centeio, e do tomate revelaram a presença dos resíduos de aminoãcidos consecutivos conservados, PKK/RPAGRxKFxETRHP e DSAWR, que suportam os domínios de ligaçãos do DNA de AP2/EREBP das proteínas e as distinguem de outros membros da família da proteína de AP2/EREBP. (Jaglo et al. (2001) supra) Os fatores de transcrição mediam as respostas celulares e traços de controle com a expressão alterada dos genes que contêm as sequências de nucleotídeos agindo como cis que são alvos do fator de transcrição introduzido. É bem apreciado na técnica que o efeito de um fator de transcrição em respostas celulares ou em um traço celular estã determinado pelos genes particulares cuja a expressão é ou diretamente ou indiretamente (por exemplo, por uma cascata de eventos de ligação do fator de transcrição e de mudanças transcricionais) é alterada pela ligação do fator de transcrição. Em uma análise global da transcrição comparando uma condição padrão com a uma em que um fator de transcrição está superexpresso, o perfil resultante do transcrito associado com a superexpressão do fator de transcrição é relacionado ao traço ou ao processo celular controlado por esse fator de transcrição. Por exemplo, o gene PAP2 (e outros genes na família de MYB) tem demonstrado controlar a biosíntese da antocíanina com a regulação da expressão dos genes conhecidos para ser envolvido na via biosintética da antocianina (Bruce et al. (2 000) Plant Cell 12: 65 - 79; e Borevítz et al. (2000) Plant Cell 12: 2383 - 2393) . Ainda, os perfis globais do transcrito foram usados com sucesso como ferramentas diagnosticas para os estados celulares específicos (por exemplo, câncer contra não-câncer; Bhattacharjee et al. (2001) Proc. Natl. Acad. Scí. USA 98; 13790 - 13795; e Xu et al, (2001) Proc. Natl. Acad. Sei, USA 98; 15089 -15094) . Consequentemente, ê evidente a um hábil na técnica que a similaridade do perfil do transcrito mediante a superexpressão de fatores diferentes da transcrição indicaria a similaridade da função do fator de transcrição. Polipeptídeos e Polinucleotídeos da Invenção A presente invenção fornece, entre outras coisas, fatores de transcrição (TFs), e polipeptídeos homólogos do fator de transcrição, e os polinucleotídeos isolados ou recombinante que codificam os polipeptídeos, ou os novos polipeptídeos ou polinucleotídeos variantes da seqüência que codificam novos variantes dos fatores de transcrição derivados das seqüências específicas fornecidas na listagem de seqüências. São fornecidos também os métodos para modificar a biomassa de uma planta modificando o tamanho ou o número de folhas ou semente de uma planta pelo controle de um número de processos celulares, e para aumentar a tolerância de uma planta aos estresses abióticos. Estes métodos são baseados na habilidade de alterar a expressão das moléculas críticas regulatórias que podem ser conservadas entre as diversas espécies de plantas. As moléculas regulatórias conservadas relacionadas podem originalmente ser descobertas em um sistema modelo, tais como, Arabidopsis e moléculas homólogas, funcionais então descobertas em outra espécie da planta, 0 ultimo pode então ser usado para conferir biomassa ou tolerância abiótica ao estresse aumentadas em diversas espécies de plantas.

Os ' polinucleotídeos exemplares que codificam os polipeptídeos da invenção foram identificados na base de dados do Banco Genético de Arabidopsis thaliana usando publicamente programas e parâmetros disponíveis da análise da seqüêncía. As seqüêncías identificadas inicialmente eram então ainda caracterizadas para identificar as seqüências que compreendem as séries de seqüência especificadas que correspondente aos motivos de seqüência presentes nas famílias de fatores de transcrição conhecidos. Além disso, polinucleotídeos exemplares adicionais que codificam os polipeptídeos da invenção foram identificados na base de dados do Banco Genético de planta usando publicamente programas e parâmetros disponíveis da análise da seqüência. As seqüências identificadas inicialmente eram então ainda caracterizadas para identificar as seqüências que compreendem as séries de seqüência especificadas que correspondem aos motivos de seqüência presentes nas famílias de fatores de transcrição conhecidos. As seqüências de polinucleotídeo que detinham tais critérios foram confirmadas como fatores de transcrição.

Os polinucleotídeos adicionais da invenção foram identificados pela avaliação da Arabidopsis thaliana e/ou outras bibliotecas do cDNA da planta com as sondas que correspondem aos fatores de transcrição conhecidos sob condições baixas de hibridização de estringência. As seqüências adicionais, incluindo sequências codificantes de comprimento completo, foram recuperadas subsequentemente pelo amplificação rápida do procedimento dos fins de cDNA (do inglês; rapid amplification of cDNA ends - RACE) usando um conjunto comercialmente disponível de acordo com as instruções do fabricante. Onde necessário, os círculos múltiplos da RACE são executados para isolar as extremidades 5' e 31 . 0 comprimento total do cDNA foi recuperado então por uma reação em cadeia de polimerase fim - a - fim rotineira (PCR) que usa os primers específicos para as extremidades 5' e 3' isoladas. As seqüências exemplares são fornecidas na listagem de seqüências.

As seqüências de polipeptídeo e polinucleotídeo do G1067 foram previamente identificadas no Pedido de Patente Provisório U.S. 60/135,134, depositado em 20 de maio de 1999. As seqüências de polipeptídeo e polínucleotídeo do G1073 foram previamente identificadas no Pedido de Patente Provisório U.S. 60/125,814, depositado em 2 3 de março de 1999. A -função do G1G73 no aumento da biomassa foi descrita no Pedido de Patente Provisório U.S. Ho. 60/227,439, depositado em 22 de agosto de 2000, e a utilidade para tolerância à seca aumentada observada nas linhagens transgênicas 35S::G1073 foi descrita no Pedido de Patente Não - Provisório U.S. No, 10/374,780, depositado em 25 de fevereiro de 2003. As sequências de polipeptídeo e polinucleotídeo do G2153 e G2156 foram previamente identificadas no Pedido de Patente Provisório U.S. No. 60/338,692, depositado em 11 de dezembro de 2001, e nos Pedidos de Patente Não - Provisórios U.S. 10/225,066 e 10/225,068, ambos os quais foram depositados em 9 de agosto de 2002. O fenótípo de tolerância ao estresse osmótico e a percepção do açúcar alterada conferida pela superexpressão do G2153' foi descrito nesses depósitos. Naquele tempo, cada um dos pedidos acima foram depositados, estas seqüências foram identificadas como codíficantes ou ser os fatores de transcrição, que foram definidos como os polipeptídeos que têm a habilidade de efetuar a transcrição de um gene alvo. Rs seqüências que têm a atividade de regulação de gene foram determinadas terem a utilidade específica e substancial pelo escritório americano de Marcas e Patentes (do inglês: U.S. Patent and Trademark Office) (Federal Register. (2001) 66(4): 1095).

Estas sequências e outras derivadas de diversas espécies e encontradas na listagem de sequências foram expressadas ectopicamente em plantas superexpressoras. As mudanças na(s) característica(s) ou no(s) traço(s) das plantas então foram observadas e descoberto que conferem biomassa aumentada ou tolerância ao estresse abíótico. Consequentemente, os polinucleotídeos e os pollpeptídeos podem ser usados para melhorar características desejáveis das plantas.

Os polinucleotídeos da invenção foram expressados também ectopicamente em células de planta superexpressora e as mudanças nos níveis da expressão de um número genes, polinucleotídeos, e/ou de proteínas das células da planta observadas. Consequentemente, os polinucleotídeos e os polipeptídeos podem ser usados para mudar os níveis da expressão de genes, polinucleotídeos, e/ou proteínas das células das plantas ou da planta.

Família do fator de transcrição AT-hook Em organismos superiores, o DNA genômico é montado em complexos multi-níveis com uma variedade de proteínas de ligação 'de DNA, incluindo as bem conhecidas histonas e as proteínas não histona, tais como, as proteínas do grupo de alta mobilidade (do inglês; High Mobility Group - HMG). As proteínas HMG são classificadas em grupos diferentes baseados em seus motivos de ligação de DNA, e um tal grupo ê o subgrupo HMG-I(y) (renomeado recentemente como HMGA). As proteínas neste grupo demonstraram se ligar ao sulco menor do DNA através de um peptídeo do aminoácido nove conservado (KRPRGRPKK) chamado o motivo do AT-hook (Reeves e Nisson (1995) supra). No centro deste AT-hook o motivo está um pequeno, tripeptídeo fortemente conservado da glicina - arginína - glicina - argínína - prolina (GRP). Este simples motivo do AT-hook pode estar presente em um número variável das cópias (1 - 15) em uma dada proteína do AT-hook. Por exemplo, a proteína HMGA1 de mamíferos tem três cópias deste motivo. As proteínas HMGA de mamíferos participam em uma variedade larga dos processos nucleares que variam da remolelação da cromatina e do cromossomo, para agir como os fatores de transcrição arquiteturais que regulam a expressão de numerosos genes in vivo. Em conseqüência, estas proteínas influenciam uma disposição diversa de processos celulares, incluindo do crescimento, da proliferação, da diferenciação e da morte através das interações proteína - proteína e DNA - proteína (para revisões, veja Reeves e Beckerbauer (2001) supra; e Reeves (20 01) supra) . Tem sido demonstrado que as proteínas de HMGA interagem especificamente com um grande número de outras proteínas, a maioria das quais são fatores de transcrição (Reeves (2001) supra). São também sujeitos a muitos tipos de modificação pós - traducionais. Um exemplo ê a fosforilação, que influenciam notavelmente sua habilidade de interagir com os substratos do DNA, outras proteínas, e a cromatina (Onate et al, (1994) Mol. Cell Biol. 14; 3376 - 3391; Falvo et al. (1995) Cell 83: 1101 -1111; Reeves e Níssen (1995) supra; Huth et al. (1997) Nat. Struct. Biol. 4, 657 - 665; e Girard et al. (1998) EMBO J. 17: 2079 - 2085) .

Em plantas, uma proteína com motivos de ligação de DNA AT-hook foi identificada na aveia (Nieto - Sotelo e Quail (1994) Biochem. Soc. Symp. 60, 265 - 275). Esta proteína se liga à região PE1 no promotor do gene do fitocromo A3, e pode estar envolvida na regulação positiva da expressão do gene PHYA3 (Nieto - Sotelo e Quail (1994) supra). As proteínas de ligação de DNA contendo domínios AT-hook foram também identificadas em uma variedade de espécies de plantas, incluindo o arroz, ervilha e Arabidopsis (Meijer et al. (1996) Plant Mol. Biol. 31: 607 - 618; e Gupta et al (1997a) Plant Mol. Biol. 35: 987 - 992) . Os genes AT-hook do arroz são expressados predominantemente nos tecidos novos e meristemãticos, sugerindo que as proteínas AT-hook podem afetar a expressão dos genes que determinam o status de diferenciação das células. 0 gene AT-hook da ervilha ê expressado em todos os órgãos incluindo raizes, caule, folhas, ' flores, em tendrilas e em sementes em desenvolvimento (Gupta et al. (1997a) supra). A análise de Northern blot revelou que um gene AT-hook da Arabidopsis foi expresso em todos os órgãos com uma expressão mais elevada em flores e siliquas em desenvolvimento (Gupta et al. (1997b) Plant Mol. Biol. 34; 529 - 536).

Recentemente, também mostrou-se que a expressão de uma proteína AT-hook do milho em células de fungo produz o melhor crescimento em um meio que contém concentrações elevadas, de níquel.

Novos genes do fator de transcrição do AT-hook e motivos de ligação em Arabidopsis e outras espécies diversas Nós identificamos ao menos trinta e quatro genes de Arabidopsis que codificam para proteínas com os motivos de ligação de DNA do AT-hook. Destes, hã vinte e dois genes que codificam um único motivo de ligação de DNA do AT-hook; oito genes que codificam dois motivos de ligação de DNA do AT-hook; três genes (G280, G1367 e G2787, SEQ ID NOs: 55, 57 e 59, respectivamente) que codificam quatro motivos de ligação de DNA do AT-hook e um único gene (G3045, NO. SEQ do ID: 61) que codificam três motivos de ligação de DNA do AT-hook. A G1073 (SEQ ID NO: 2) , por exemplo, contém um único típico motivo de ligação de DMA do AT-hook (RRPRGRPAG) que corresponde às posições 34 a 42 dentro da proteína. Um domínio altamente conservado do resíduo de aminoácidos 129 de função desconhecida (daqui por diante referida como " segundo domínio conservado") pode ser identificado no único subgrupo do domínio AT-hook, os "polipeptídeos do fator de transcrição do clade G1073", ou mais simplesmente o "clade G1073". Depois desta região, as extensões potenciais de um domínio acídica das posições 172 a 190. Adicionalmente, a análise da proteína que usa PROSITE revela três sítios potenciais de fosforilação da proteína kinase C em Ser32, em Thr83 e em Thrl02, e em três sítios potenciais de fosforilação da caseína kinase II em Ser6, em Ser70 e em Ser247 (figura 3) . Comparado a muitas outras proteínas do AT-hook, a proteína G1073 contém um N - terminal mais curto (figuras 5A - 5c).

Os membros do clade G1073 são estruturalmente distintos de outras proteínas relacionadas ao AT-hook, como pode ser visto nas figuras 5C - 5F, comparando com G1073 e seqüências acimas que estão compreendidas dentro do clade G1073 (dentro da grande caixa), e aquelas seqüências incluindo G1945, G2155, e G3408, representando as seqüências AT-hook que caíram fora do clade (grande caixa abaixo). A tabela 1 mostra os polipeptídeos identificados por: polipeptídeo SEQ 1D NO (primeira coluna) ; Gene ID ou "GID" No. (segunda coluna); as coordenadas do resíduo de aminoácido para o ΑΤ-hook e o segundo domínio conservado (terceira coluna) as seqüências do ΑΤ-hook dos polipeptídeos respectivos (quarta coluna); a identidade em termos de porcentagem para o domínio ΑΤ-hook de G1G73 (quinta coluna); seqüências do segundo domínio conservado dos polipeptídeos respectivos (sexta coluna); e a identidade em termos de porcentagem para o segundo domínio conservado de G1073 (sétima coluna). Muitas destas seqüências demostraram conferir fenótipos tolerantes ao estresse· abiõtico quando superexpressas nas plantas, como indicado na penúltima coluna da tabela 1. A última coluna indica as seqüências que foram observadas para aumentar a biomassa da planta em relativas linhagens superexpressantes para controles do tipo selvagem. As seqüências de polipeptídeo que mostram que a habilidade significativa de conferir tolerância ao estresse abiõtico e biomassa aumentada incluí o domínio ΑΤ-hook e segundo domínio conservado com 78 % e 62% ou identidade maior ao domínio ΑΤ-hook e ao segundo domínio conservado de G1073, respectivamente.

Tabela 1. Famílias de gene e domínios de ligação 1 Domínio AT-hook e segundo domínio conservado em coordenadas AA e coordenadas Base 2 Coordenadas do polipeptídeo 3 % ID para o Domínio AT-hook do G1073 4 % 1D para o segundo domínio conservado do G1073 5 Tolerância ao Estresse Abiótico 6 Biomassa aumentada * resultados de estudos anteriores, não mostrados ** observado em uma única linhagem Dentro dos polipeptídeos do fator de transcrição do clade G1073, o domínio AT-hook compreende a sequência consenso: RPRGRPXG (SEQ ID NO: 72) Arg - Pro - Arg - Gly - Arg - Pro - Xaa - Gly onde Xaa pode ser qualquer de um número de resíduos de aminoãcidos; nos exemplos que foram mostrados assim até agora para conferir tolerância ao estresse abiótico, Xaa foi mostrado representando uma alanína, um leucína, uma prolina, ou um resíduo de serína.

Também dentro do clade G1073, o segundo domínio conservado geralmente compreende a seqüência consenso: Gly - Xaa ~ Phe - Xaa - Ile - Leu - Ser - (Xaa) 2 - Gly - (Xaa) 2 - Leu - Pro - (Xaa) 3.4 - Pro - (Xaa) 5 - Leu - (Xaa) 2 - Tyr/Phe - (Xaa)2 - Gly - (Xaa)2 - Gly - Gin.

Uma menor subseqüência de interesse nas seqüências do clade G1073 compreendem: Pro - (Xaa)5 - Leu - (Xaa)2 - Tyr (SEQ ID NO: 63); ou Pro - (Xaa)5 - Leu - (Xaa)2 - Phe (SEQ ID NO: 64) . A décima posição de SEQ ID Nos.: 63 e 64 é um resíduo aromático, especificamente tirosina ou fenilalanina, nas seqüências do clade G1Q73 que foram examinadas atê aqui. Até aqui, os resíduos aromáticos não foram encontrados na posição correspondente nos fatores de transcrição do AT-hook que são fora do clade G1Q73.

Assim, os fatores de transcrição da invenção cada um possuem um domínio AT-hook e um segundo domínio conservado, e incluem parãlogos e ortôlogos de G1Q73 encontradas pela análise BLAST, como descrito abaixo. Como mostrado na tabela 1, os domínios AT-hook de G1073 e as seqüências relacionadas são ao menos 78 % idênticos aos domínios AT-hook de G1073 e ao menos 62 % idênticos ao segundo domínio conservado encontrado em G1073. Estes fatores de transcrição contam com a especialização de ligação de seus domínios AT-hook; muitos foram mostrados possuírem funções similares ou idênticas nas plantas pelo aumento do tamanho e biomassa de uma planta (veja também o exemplo VII, abaixo).

Produzindo Polipept ideos Os polinucleotídeos da invenção incluem as seqüências que codificam os fatores de transcrição e polipeptídeos homólogos do fator de transcrição e as seqüências complementares a estas, assim como fragmentos originais da sequência codificante, ou seqüência complementar a esta. Tais polinucleotídeos podem ser, por exemplo, DNA ou RNA, por exemplo, mRNA, cRNA, RNA sintético, DNA genômico, cDNA, DNA sintético, oligonucleotídeos, etc. Os polinucleotídeos ' são ou de fita simples ou dupla fita, e incluem uma, ou ambas as seqüências senso (isto ê, codificantes) e seqüências antisenso (isto ê, não codificantes, complementares). Os polinucleotídeos incluem a seqüência codificante de um fator de transcrição, ou o polipeptideo homólogo do fator de transcrição, isolado, em combinação com seqüências codificantes adicionais (por exemplo, um Tag de purificação, um sinal de localização, como uma fusão -proteína, como uma pré - proteína, ou assemelhados) , em combinação com sequências não codíficantes (por exemplo, íntrons ou inteínas, elementos regulatórios, tais como promotores, melhoradores, terminadores, e assemelhados), e/ou em um ambiente hospedeiro ou vetor em que o polinucleotídeo que codifica um polipeptídeo homólogo do fator de transcrição ou do fator de transcrição ê um gene endógeno ou exógeno.

Uma variedade de métodos existe para a produção dos polinucleotídeos da invenção. Os procedimentos para identificar e isolar os clones de DNA são bem conhecidos àqueles com habilidade na técnica e descritos em, por exemplo, Berger e Kimmel (1987) , "Guide to Molecular Cloning Techniques", in Methods ín Enzymology, vol. 152, Acaderaic Press, Inc., San Diego, CA ("Berger"); Sambrook et al. (1989) Molecular Cloning - A Laboratory Manual (2nd Edition), Vol. 1-3, Cold Spring Harbor Laboratory, Cold Spring Harbor, NY, and Current Protocols in Molecular Biology, Ausubel et al. editors, Current Protocols, Greene Publishing Associates, Inc. and John Wiley & Sons, Inc. (supplemented through 2000; "Ausubel").

Alternativamente, os polinucleotídeos da invenção, podem ser produzidos por uma variedade de métodos de amplificação ín vitro adaptados à presente invenção pela seleção 'apropriada de primers específicos ou degenerados.

Os exemplos dos protocolos suficientes para direcionar as pessoas .de habilidade em métodos de amplificação in vitro, incluindo a reação em cadeia de polimerase {PCR - do inglês polymerase chain reactíon) a reação em cadeia da ligase (RCL- do inglês ligase chain reactíon) , amplificação de Οβ-replícase e outras técnicas mediadas por polimerase do RNA (por exemplo, NASBA), por exemplo, para a produção dos ácidos nucleícos homólogos da invenção são encontrados em Berger {1987) supra, em Sambrook (1989) supra, e em Ausubel (ao longo de 2000) supra, bem como em Muilis et al. (1990) PCR Protocols A Guide to Methods and Applications (Innis et al., eds) Academíc Press Inc. San Diego, CA. Métodos melhorados para a clonagem in vitro de ácidos nucléicos amplificados são descritos em Wailace et al. U.S. Pat. No. 5,426,039. Métodos melhorados para a para a amplificação de ácidos nucléicos grandes são resumidos em Cheng et al. (1994) Jffature 369: 684 - 685 e as referências citadas no mesmo, em que os amplicons de PCR de até 40 kb são gerados. Alguém com habilidade apreciará que essencialmente todo o RNA pode ser convertido em um DNA de dupla fita apropriado para a digestão de restrição, a expansão de PCR e arranjar em sequência usando a transcríptase reversa e uma polimerase (Berger (19 87) supra,- Sambrook (198 9) supra; e Ausubel (through 2000) supra), Mternativamente, os polinucleotídeos e os oligonucleotídeos da invenção podem ser montados dos fragmentos produzidos pelos métodos da síntese de fase solida. Tipicamente, os fragmentos de até aproximadamente 100 bases synthesized individualmente e então ligados enzimaticamente ou quimicamente para produzir uma seqüêncía desejada, por exemplo, um polinucleotideo codificando o todo ou .uma parte de um fator de transcrição. Por exemplo, a síntese química que usa o método do fosforamidite é descrito, por exemplo, por Beaucage et al. (1981) Tetrahedron Letters 22: 1859 - 1869; e Matthes et al. (1984) EMBO J. 3: 801 - 805. De acordo com tais métodos, os oligonucleotídeos sintetizados, purificados, são recozidos a sua fita complementar, ligados e então clonado opcionalmente em vetores apropriados. E se desejados assim, os polinucleotídeos e os polipeptídeos da invenção podem ser requisitado sob medida por qualquer de um número de fornecedores comerciais.

Sequências Homologas As sequências homólogas àquelas fornecidas na listagem de seqüências derivada de Arabidopsis thaliana ou de outras plantas ‘da escolha, são também um aspecto da invenção. As seqüências homólogas podem ser derivadas de qualquer planta incluindo monoeotiledôneas e dicotiledôneas e em particular espécies da planta importantes na agricultura, incluindo mas não limitadas a, safras, tais como, o grão de soja, o trigo, o milho (milho), a batata, o algodão, o arroz, o nabo silvestre, o óleo de semnte de nabo silvestre (incluindo canola), o girassol, a alfalfa, o trevo, a cana de açúcar, e a relva,* ou frutas e vegetais, tais como, a banana, a amora, a uva-do-monte, o morango, e a framboesa, o cantalupo, a cenoura, a couve-flor, o café, o pepino, a berinjela, as uvas, o melão doce, a alface, a manga, o melão, a cebola, o papaia, as ervilhas, as pimentas, o abacaxi, a abóbora, o espinafre, a abóbora, o milho doce, o tabaco, o tomate, o tomate cereja, a melancia, as frutas rosaceous (tais como, a maçã, o pêssego, a pera, a cereja e a ameixa.) e os vegetais brassícas (tais como, o bróculos, o repolho, a couve-flor, a couve de Bruxelas, e a couve-rãbano). Outras safras, incluindo frutas e vegetais, cujo o fenótipo pode ser mudado e que compreendem seqüências homólogas incluem a cevada,- o centeio; o milhete,* o sorgo; a passa de Corinto; o abacate; as frutas cítricas tais como as laranjas, os limões, a toranja e as tangerinas, a alcachofra, as cerejas; nozes tais como a noz e o amendoim; a endivia; o alho-poro,· as raízes, tais como, a araruta, a beterraba, a mandioca, o nabo, o rabanete, o inhame, e a batata doce; e os feijões. As seqüências homólogas podem também ser derivadas da espécie arborizadas, do tal o pinho, o ãlamo e do eucalopto, ou da menta ou dos outros labiado. Além, as seqüências homólogas podem ser derivadas das plantas que são evolucionariamente relacionadas às plantas de safra, mas que não pode ainda ter sido usado como plantas de safra. Os exemplos incluem o beladona mortal {Ãtropa helladona) , relacionado ao tomate; a trombeta (Datura strommium), relacionada ao peyote? e teosinte (espécie de Zea), relacionado ao milho (milho). Ortólogos e Parálogos As 'seqüências homólogas como descritas acima podem compreender seqüências ortólogas ou parálogas. Diversos métodos diferentes são conhecidos por aqueles com habilidade na técnica para identificar e definir estas seqüências funcionalmente homólogas. Três métodos gerais para definir ortólogos e parálogos são descritos; um ortólogo ou um parálogo, incluindo equivãlogos podem ser identificados por um ou por mais dos métodos descritos abaixo.

Dentro de uma única espécie de planta, a duplicação do gene pode causar duas cópias de um gene particular, causando dois ou mais genes com seqüência similar e a função frequentemente similar conhecidas como parálogos. Um parálogo ê consequentemente um gene similar formado pela duplicação dentro da mesma espécie. Os Parãlogos tipicamente se agrupam juntos ou no mesmo clade (um grupo de genes similares) quando uma filogenia de família de gene ê analisado usando programas como CLUSTAL (Thompson et al. (1994) Nucleico Acíds Res. 22: 4673 - 4680,- Higgins et al. (1996) Methods Enzymol. 266: 383 - 402). Os grupos de genes similare.s podem também ser identificados com a análise BLAST em pares (Feng e Doolittle (1987) J. Mol. Evol. 25: 351 - 360). Por exemplo, num clade de muita similaridade de fatores de transcrição de domínio MADS de Arabidopsis, todos compartilham uma função comum no tempo da florescência (Ratcliffe et al. (2001) Plant Physiol. 126: 122 - 132), e um grupo de muita similaridade de fatores de transcrição de domínio AP2 de Arabidopsis estão envolvidos na tolerância de plantas ao congelamento (Gilmour et al. (1998) Plant J. 16: 433 - 442) . A análise dos grupos de genes similares com função similar que caem dentro de um clade pode render subseqüências que são particulares ao clade. Estas subseqüências, conhecidas como seqüências consenso, não podem somente ser usadas para definir as seqüências dentro de cada clade, mas definem as funções destes genes; os genes dentro de um clade podem conter seqüências parãlogas, ou as seqüências ortólogas que compartilham da mesma função (veja também, por exemplo, Mount (2001), em Bioinformatics: Sequence and Genome Analysis, Cold Spring Harbor Laboratory Press, Cold Spring Harbor, New York, página 543). A especiação, a produção de novas espécies de uma espécie parental, pode também causar dois ou mais genes com seqüêncías similares e funções similares. Estes genes, denominados ortólogos, frequentemente têm uma função idêntica dentro de suas plantas hospedeiras e são frequentemente permutáveis entre espécies sem função de perda. Porque as plantas têm antepassados comuns, muitos genes em quaisquer espécies da planta terão um gene ortõlogo correspondente em uma outra espécie da planta. Uma vez que uma árvore filogênica para uma família de gene de uma espécie foi construída uma vez usando um programa como CLUSTAL (Thompson et al. (1994) Nucleico Acids Res. 22: 4673 - 4680,· Higgins et al. (1996) supra) as seqüêncías ortólogás potenciais podem ser colocadas na árvore fílogenética e seu relacionamento aos genes de espécies de interesse podem ser determinados. As seqüêncías ortólogás podem também ser identificadas por uma estratégia recíproca BLAST. Uma vez que uma sequência ortóloga foi identificada, a função do ortólogo pode ser deduzida da função identificada da sequência de referência.

As seqüêncías dos genes do fator de transcrição são conservadas através de diversas linhagens de espécies eucarióticas (Goodrich et al, (1993) Cell 75: 519 - 530; Lin et al, (1991) Nature 353: 569 - 571; Sadowski et al, (1988) Nature 335: 563 - 564). As plantas não são nenhuma exceção a esta observação,* as diversas espécies de planta possuem fatores de transcrição que têm sequências e funções similares.

Os genes ortólogos de organismos diferentes tem funções · altamente conservadas e muito frequentemente e funções essencialmentidênticas (Lee et al. (2002) Genome Res. 12: 493 - 502; Remm et al. (2001) J. Mol. Biol. 314: 1041 - 1052). Os genes parãlogos, que tem divergido através da duplicação do gene, podem reter funções similares das proteínas codificadas. Nesses casos, os parãlogos podem ser usados permutaveImente com relação a determinadas modalidades de invenção instantânea (por exemplo, a expressão transgêníca de uma sequência codificante). Um exemplo de tais parãlogos altamente relacionados ê a família CBF, com três membros bem definidos em Arabidopsis e pelo menos um ortólogo em Brassica napus, todos dos quais controlam as vias envolvidas tanto em estresse de congelamento quanto de estiagem (Gilmour et al. (1998) Plant J. 16: 433 - 442,- Jaglo et al. (1998) Plant Physiol. 127: 910 - 917) .

As seguintes referências representam uma pequena amostragem de muitos estudos que demonstram que os genes do fator de transcrição conservados de espécies diversas são prováveis funcionar similarmente (isto ê, regular seqüências alvo similares e para controlar os mesmos traços) e que os podem ser transformados na espécie diversa para conferir ou melhorar traços. (1) Fatores de transcrição distintos de Arabídopsis, incluindo G28 (encontrado na Patente US 6,664,446), G482 (encontrado no Pedido de Patente US 20040045049), G867 (encontrado no Pedido de Patente US 20040098764), and G1073 (encontrado na Patente US 6,717,034), demonstraram conferir tolerância ao estresse ou biomassa aumentada quando as seqüências são sup.erexpressas. As seqüências dos pol ipept í deos pertencem aos clades distintos dos polipeptídeos do fator de transcrição que incluem membros de espécies diversas. Em cada caso, um número significativo das seqüências do membro do clade derivadas de ambas as dicotíledôneas e as monocotiledôneas demonstraram conferir biomassa aumentada ou a tolerância ao estresse quando as seqüências eram superexpressas (dados não publicados). (2) O gene NPR1 de Arabídopsis regula a resistência adquirida sistêmica (SAR); a superexpressão de NPR1 conduz à resistência melhorada em Arabidopsis. Quando Arabidopsis NPR1 ou o ortólogo do arroz NPR1 foram superexpressos no arroz (que, como uma monocotiledônea, é diverso de Arabidopsis) , a inoculação com o patógeno bacteriano de praga de plantas do arroz Xanthomonas oryzae do pv. Qryzae, de do pathogen do blight, as plantas transgênicas indicaram resistência melhorada {Chern et al. (2001) Plant J. 27: 101 - 113) . O NPR1 age através da ativação da expressão de genes do fator de transcrição, tal como, o TGA2 (Fan e Dong (2002) Plant Cell 14: 1377 - 1389). (3) Os genes 12F estão envolvidos na transcrição de genes de planta para a proliferação do antígeno nuclear da célula (PCNA). As plantas E2Fs partilha de um grau elevado de similaridade na sequência de aminoácidos entre monocotiledôneas e dicotiledôneas, e são mesmo similares aos domínios conservados dos E2Fs animal. Tal conservação indica uma similaridade funcional entre a planta e o animal E2Fs. Os fatores de transcrição de E2F que regulam o desenvolvimento do meristema agem através dos elementos - cis comuns, e regulam os genes relacionados (PCNA). (Kosugi e Ohashi, (2002) Plant J. 29; 45 - 59). (4) O gene ABI5 (ABA insensitivo 5) codifica um fator básico de fecho zip da leucina requerido para a resposta de ABA na semente e nos tecidos vegetativos. Os experimentos de co-transformação com as construções de cDNA ABI5 em protoplastos do arroz resultou em transativação específica do trigo induzível por ABA, Arabidopsis, feijão, e promotores da cevada. Estes resultados demonstram que sequencialmente os fatores similares da transcrição ABI5 são alvos chaves de uma via de sinalização de ABA conservado em plantas diversas. (Gampala et al. (2001) J. Biol. Chem. 277: 1689 - 1694). (5) As sequências de três genes semelhantes a GAMYB de Arabidopsis foram obtidas com base na similaridade da sequência aos genes de GAMYB da cevada, arroz, e L. temulentum. Esses três genes Arabidopsis foram determinados para codificar os fatores de transcrição (AtMYB33, AtMYB65, e AtMYBlOl) e poderíam substituir para uma GAMYB de cevada e controlar a expressão da alfa - amílase. (Gocal et al. (2001) Plant Physiol. 127: 1682 - 1693) . (6) O gene LEAFY de controle floral de Arabidopsis dramaticamente acelerar a florescência em numerosas plantas dicotiledôneas. A expressão constitutiva de LEAFY de Arabidopsis também causam florescência precoce no arroz transgênico (uma monocotiledônea), com uma data de titulo que fox 26 - 34 dias mais precoce do que aquelas de plantas do tipo selvagem. Estas observações indicam que os genes regulatórios florais de Arabidopsis são ferramentas úteis para dirigir a melhoria da data em colheitas do cereal. (He et al. (2000) Transgênicas Res. 9; 223 - 227). (7) As giberelinas bioativas (GAs) são reguladores endógenos essenciais do crescimento de planta. A sinalização de GA tende a ser conservado através do reino de planta. A sinalização de GA é mediada através da * via GAI, um membro nuclear da família GRAS de fatores de transcrição da planta. Arabidopsis GAI demonstrou funcionar no arroz para inibir vias da resposta de giberelina. (Fu et al. (2001) Plant Cell 13: 1791 - 1802) . (8) G gene SUPERMAN de Arabidopsis (SUP) , codifica um fator putativo da transcrição que mantém o limite entre estamens e carpelos. Pela superexpressão do Arabidopsis SUP no arroz, o efeito da presença do gene em .limites do whorl foi mostrado para ser conservado. Isto demonstrou que SUP ê um regulador conservado de limites florais do whorl e afeta a proliferação da célula, (Nandi et al. (2000) Curr. Biol. 10; 215 -218.) (9) os fatores de transcrição de milho, petúnia e Arabidopsis myb que regulam a biosíntese de flavonôides são muito similares geneticamente e afetam o mesmo traço em sua espécie nativa, consequentemente a seqüência e a função destes fatores de transcrição myb correlacionam-se entre si nestas espécies diversas (Borevitz et al. (2000) Plant Cell 12; 2383 - 2394). (10) Os genes de trigo de baixo peso - 1 (Rht - Bl/Rht -Dl) e de milho anão - 8 (d8) são ortôlogos do gene insensitivo de giberelina de Arabidopsis (GAI). Ambos estes genes foram usados para produzir as variedades dos grãos anões que melhoraram o rendimento do grão. Estes genes codificam as proteínas que se assemelham a fatores de transcrição nucleares e contêm um domínio semelhante a SH2, indicando que o fosfotirosina pode participar da sinalização da giberelina. As plantas transgênicas de arroz que contêm um alelo GAI mutante de Arabidopsis mostraram produzir respostas reduzidas a giberelina e são diminuídas indicando que os ortôlogos do mutante GAI poderíam ser usados para aumentar o rendimento em uma larga escala de espécies de colheita. (Peng et al. (1999) Fature 400: 256 -261.) Os ■ fatores de transcrição que são homólogos aos fatores de transcrição listados do AT-hook compartilharão tipicamente ao menos aproximadamente de 78 % e de 62 % de identidade da sequência de aminoãcidos em seus AT-hook e segundo domínio conservado, respectivamente. Os fatores de transcrição mais proximamente relacionados podem compartilhar ao menos aproximadamente 89 % ou aproximadamente 100 % de identidade em seus domínios do AT-hook, e ao menos aproximadamente 62 %, 63 %, 65 %, 66 %, 67 %, 68 %, 6 9 %, 71 %, ou uma identidade maior com o segundo domínio conservado de G1073, como visto pelos exemplos mostrados para conferir a tolerância ao estresse abiõtico na tabela l. Os fatores de transcrição que são homólogos às sequências listadas devem compartilhar ao menos de aproximadamente 50 %, ou ao menos de aproximadamente 75 %, ou ao menos de aproximadamente 80 %, ou ao menos de aproximadamente 90 %, ou ao menos de identidade da sequência de aminoãcidos de aproximadamente 95 % sobre o comprimento total do polipeptídeo ou do homólogo.

No nível do nucleotídeo, as seqüências da invenção compartilharão tipicamente ao menos de aproximadamente 40 % de identidade da seqüência de nucleotídeos, preferivelmente ao menos de aproximadamente 50 %, de aproximadamente 60 %, de aproximadamente 70 % ou de aproximadamente 80 %, e mais preferivelmente aproximadamente 85 %, aproximadamente 90 %, aproximadamente 95 % ou aproximadamente 97 % ou mais identidades da seqüência a uma ou mais das seqüências de comprimento total listadas, ou a uma seqüência listada, mas excluindo ou a parte externa da(s) região(ões) que codifica uma seqüência consenso conhecida ou um sítio de ligação de DNA consenso, ou a parte externa da(s) região(ões) que codifica um ou todo o domínio conservado. A degeneração do código genético permite variações principais na seqüência do nucleotídeo de um polinucleotídeo ao manter a seqüência de aminoãcidos da proteína codificada. A porcentagem de identidade pode ser determinada eletronicamente, por exemplo, usando o programa MEGALIGN (DNASTAR, Inc. Madison, Wis.). O programa MEGALIGN pode criar alinhamentos entre duas ou mais seqüências de acordo com métodos diferentes, por exemplo, o método clustal {veja, por exemplo, Higgins e Sharp (1988) Gene 73: 237 -244.) O algoritmo clustal de grupo seqüencia em conjuntos pelo exame as distâncias entre todos os pares. Os conjuntos são alinhados par a par e então em grupos. Outros algoritmos ou programas de alinhamento podem ser usados, incluindo FASTA, BLAST, ou o ENTREZ, o FASTA e a BLAST, e que pode ser usado para calcular a porcentagem de similaridade. Estes estão disponíveis como uma parte do pacote de análise da sequência de GCG (universidade de Wisconsin, de Madison, de MI), e podem ser usados com ou sem ajustes de defeito. 0 ENTREZ estã disponível através do National Center for Biotechnology Information. Em uma modalidade, a porcentagem de identidade de duas sequências pode ser determinada pelo programa de GCG com uma abertura de peso de 1, por exemplo, cada abertura de aminoãcido ê pesada como se fosse um único aminoãcido ou nucleotídeo mau combinado entre as duas seqüências (veja USPN 6,262,333).

Outras técnicas para alinhamento são descritas em Methods in Enzymology, vol. 266, Computer Methods for Macromolecular Sequence Analysis (1996), ed. Doolittle, Academic Press, Inc., San Diego, Calif., USA. Preferivelmente, um programa de alinhamento que permita aberturas na seqüência é utilizado para alinhar as seqüências. 0 Smith - Waterman é um tipo de algoritmo que permite aberturas em alinhamentos de seqüências (veja Shpaer (1997) Methods Mol. Biol. 70: 173 - 187). Também, o programa da GAP usando método de alinhamento de Needleman e Wunsch pode ser utilizado para alinhar as seqüências. Uma estratégia alternativa da busca usa o software de MPSRCH, que funciona em um computador de MAS PAR. MPSRCH usa um algoritmo de Smith - Watermarx para pontuar as sequências em um computador macivamente paralelo. Esta abordagem melhora a habilidade de pegar combinações distantemente relacionadas, e é especialmente tolerante a pequenas aberturas e erros de seqüência de nucleotídeos. As sequências de aminoãcidos codificadas pelo ácido nucleico podem ser usadas procurar a proteína e as bases de dados do DNA. A porcentagem de similaridade entre duas seqüências de polipeptídeos, por exemplo, seqüência A e seqüência B, é calculada dividindo o comprimento da seqüência A, menos o número de resíduos de abertura na seqüência A, menos o número de resíduos de abertura na seqüência B, na soma dos resíduos combinados entre a seqüência A e a seqüência B, marcam cem. As aberturas de pouca ou de nenhuma similaridade entre as duas seqüências de aminoãcidos não estão incluídas na determinação da porcentagem da similaridade. A porcentagem de identidade entre seqüências de polinucleotídeos pode também ser contada ou calculada por outros métodos conhecidos na técnica, por exemplo, o método de Jotun Hein (veja, por exemplo, Hein (1990) Methods Enzymol. 183: 626 - 645.) A identidade entre seqüências pode também ser determinada por outros métodos conhecidos na técnica, por exemplo, pela variação das condições de hibridização (veja o Pedido de Patente US No. 20010010913) .

Assim, a invenção fornece métodos para identificar uma sequência similar ou parãlogas ou ortólogas ou homólogas a um ou mais polinucleotideos como descrito aqui, ou um ou mais polipeptídeos alvos codificados pelos polinucleotideos, ou de outra maneira descrita aqui e pode incluir ligar ou associar uma dado fenótipo da planta ou função do gene com uma seqüência. Nos métodos, uma base de dados de sequências ê fornecida, (localmente ou através de uma Internet ou Intranet) e uma pergunta ê feita para a base de dados de seqüências usando as seqüências relevantes desta e fenótipos de planta associados ou funções do gene.

Além disso, um ou mais seqüências de polinucleotideos ou um ou mais polipeptídeos codificados pelas seqüências de polinucleotideos pode ser usado para procurar contra um BLOCKS (Bairoch et al. (1997) Nucleico Acids Res. 25: 217 -221) , PFAM, e outras bases de dados que contêm motivos, seqüências e funções previamente identificados e anotados do gene. Os métodos que procuram por padrões de seqüência primária modelaram com penalidades de abertura secundárias da estrutura (Smith et al. (1992) Proteína Engineering 5: 35 - 51) bem como algoritmos, tal como, o Basic Local Alignment Search Tool (Ferramenta de Busca de Alinhamento Local Básica) (BLAST; Altschul (1993) J, Mol. Evol. 36; 290 - 300; Altschul et al. (1990) J. Mol. Biol. 215; 403 -410), BLOCKS (Henikoff and Henikoff (1991) Nucleico Acids Res. 19: 6565 - 6572), Modelos Hidden Markov (HMM; Eddy (1996) Curr. Opin. Str. Biol. 6: 361 - 365; Sonnhammer et al. (1997) Proteins 28: 405 - 420), e assemelhados, podem ser usados para manipular e analisar as sequências de polinucleotídeos e do polipeptídeo codificado por polinucleotídeos. Estas bases de dados, os algoritmos e outros métodos são bem conhecidos na técnica e descritos no Ausubel et al. (1997) Short Protocols in Molecular Biology, John Wiley & Sons, New York, NY, unit 7.7, e em Meyers (1995) Molecular Biology and Biotechnology, Wiley VCH, New York, NY, p 856 - 853.

Um método adicional para identificar ou confirmar que as seqüências homólogas específicas controlam a mesma função é pela comparação do(s) perfil(is) do transcrito obtido era cima da superexpressão ou da supressão de dois ou mais fatores de transcrição relacionados. Desde que os perfis do transcrito sejam diagnósticos para estados celulares específicos, um hábil na técnica apreciará que os genes que têm um perfil altamente similar do transcrito (por exemplo, com maior que 50 % de transcritos regulados em comum, ou com maior que 70 % de transcritos regulados em comum, ou com maior que 90 % de transcritos regulados em comum) terão funções altamente similares, Fowler et al. (2002) Plant Ce 11 14; 1675 - 1679, mostraram que três genes parãlogos da família AP2 (CBF1, CBF2 e CBF3) , cada um do qual ê induzido mediante tratamento frio, e cada uma da qual pode condicionar a tolerância ao congelamento melhorada, tem perfis altamente similares do transcrito. Uma vez que um fator de transcrição foi mostrado para fornecer uma função específica, seu perfil do transcrito transforma-se uma ferramenta diagnostica para determinar se os parãlogos ou os ortólogos putativos têm a mesma função.

Além disso, os métodos usando o alinhamento manual das seqüências similares ou homólogas a uma ou mais seqüências de polinucleotídeos ou a um ou mais polipeptídeos codificados pelas seqüências de polinucleotídeos podem ser usados para identificar regiões de similaridade e domínios AT-hook. Tais métodos manuais são bem conhecidos daqueles com habilidade na técnica e podem incluir, por exemplo, comparações da estrutura terciária entre uma seqüência de polipeptídeos codificada por um polínucleotídeo que compreende uma função conhecida com uma seqüência do polipeptídeo codificada por uma seqüência de polinucleotídeos que tenha uma função ainda não determinada. Tais exemplos da estrutura terciária podem compreender alfa hélices preditas, folhas beta, hélices anfipãticas, motivos zipper de leucina, motivos finger de zinco, regiões ricas em prolina, motivos repetidos de cisteína, e assemelhados.

Os ortólogos e os parãlogos de fatores de transcrição presentemente descritos podem ser clonados usando as composições fornecidas pela presente invenção de acordo com os métodos bem conhecidos na tênica. Os cDNAs podem ser clonados usando o mRNA de uma célula ou de um tecido da planta que expressem um dos presentes fatores da transcrição. As fontes apropriadas do mRNA podem ser identificadas pela análise de Northern blots com as sondas projetadas das presentes seqüências do fator de transcrição, depois do qual uma biblioteca é preparada do mRNA obtido de uma célula ou de um tecido positivo. 0 fator de transcrição que codificam cDNA ê então isolado, por exemplo,· PCR, usando os primers projetados de uma seqüência presentemente descrita do gene do fator de transcrição, ou pela sondagem com um cDNA parcial ou completo ou com um ou mais conjuntos de sondas degeneradas baseadas nas seqüências descritas. A biblioteca de cDNA pode ser usada para transformar células da planta. A expressão dos cDNAs de interesse é detectada usando, por exemplo, os métodos descritos aqui como microarranjos, Northern blots, PCR quantitativo, ou qualquer outra técnica para monitorar mudanças na expressão. Os clones genômícos podem ser isolados usando técnicas similares àquelas.

Os exemplos de ortólogos de seqüências de polipeptídeo de Arabidopsis SEQ ID no.: 2, 4, 6, 8, 42 e 69, incluem SEQ 1D no.: 10, 12, 14, 16, 18, 26, 30, 38, 40, e outros ortólogos funcionalmente similares listados na listagem de seqüências. Além às seqüências na listagem de seqüências, a invenção abrange as seqüências isoladas do nucleotídeo que são sequencialmente e estruturalmente similares a G1Q73, a G1067, a G2153, a G2156, a G3399, a G3407, a G3456, a G3459, a G3460, a G3406, 3 G3400, a G34 01, a G3556, a G1069, a G2789 e a G1667 (SEQ ID NO.: 1, 3, 5, 7, 9, 11, 13, 15, 17, 25, 29, 37, 39, 41, 66 e 58, respectivamente) e pode funcionar em uma planta pelo aumento da biomassa e a tolerância ao estresse abiótico, particularmente quando superexpressas. Estas seqüências de polipeptideo representam os membros do clade que funcionam similarmente a G1073 por conferir tolerância ao estresse abiótico, e mostrar a similaridade significativa da sequência a G1073, particularmente em seus respectivos domínios conservados, como identificado na tabela 1.

Desde que um número representativo destas seqüências de polinucleotxdeos no clade G1073 de polipeptídeos do fator de transcrição são f ilogenet icamente (figura 4) e sequencialmente (figura 5A - 5H) relacionados e foram mostradas para aumentar a biomassa de uma planta e a tolerância ao estresse abiótico, um hábil na técnica prediría que outras sequências similares, filogeneticamente relacionadas que caem dentro do clade G1Q73 aumentariam também a biomassa de uma planta e a tolerância ao estresse abiótico quando superexpressas.

Identificação de Polinucleotídeos ou Ácidos Nucleicos por Hibridização Os polinucleotídeos homólogos às seqüências ilustradas na listagem de seqüências e nas tabelas pode ser identificado, por exemplo, pela hibridização entre si sob condições estringentes ou altamente estringentes. Os polinucleotídeos de fita simples hibrídizam quando eles se associam baseados em uma variedade de forças físicas -químicas bem caracterizadas, tais como, a ligação de hidrogênio, exclusão de solvente, empilhamento base e assemelhados. A estringência de uma hibridização reflete o grau de identidade de seqüência dos ácidos nucleicos envolvidos, tal que quanto maior a estringência mais similares são as duas fitas de polinucleotídeo. A estringência ê influenciada por uma variedade de fatores, incluindo a temperatura, concentração e composição de sal, aditivos orgânicos e não - orgânicos, solventes, etc. presentes em ambas na hibridização e em soluções de lavagem e incubações (e números dos mesmos), como descrito mais detalhadamente nas referências citadas abaixo {por exemplo, Sambrook et al. (1989); Berger e Kimmel (1987); e Anderson e Young (1985)). São abrangidas pela invenção as sequências de polinucleotídeos que são capazes de hibridizar com as sequências de polinucleotídeos reivindicadas, incluindo qualquer um dos polinucleotídeos de fator de transcrição dentro da listagem de sequências, e fragmentos dos mesmos sob várias condições de estringêncía (veja, por exemplo, Wahl e Berger (1987) Methods Enzymol. 152; 399 - 407,* e Kimmel (1987) Methods Enzymol. 152; 507 - 511). Além às seqüências de nucleotídeos listadas na listagem de sequências, comprimento total do cDNA, os ortõlogos, e os parãlogos das presentes sequências de nucleotídeos podem ser identificados e isolados usando métodos bem conhecidos. As bibliotecas de cDNA, os ortõlogos, e os parãlogos das presentes seqüências de nucleotídeos podem ser selecionados usando métodos de hibridização para determinar sua utilidade como alvo de hibridização ou sonda de amplificação. Não que diz respeito a hibridização, as condições que são altamente estringentes, e os meios para consegui-los» são bem conhecidos na técnica. Veja» por exemplo, Sambrook et al. (1989) "Molecular Cloning: Ά Laboratory Manual" (2nd ed., Cold Spring Harbor Laboratory); Berger (1987) supra, páginas 467 - 469; e Anderson e Young (1985) "Quantitative Filter Hybridisation", In: Hames and Higgins, ed.» Nucleico Acid Hybridisation, A Practícal Approach, Oxford, IRL Press, 7-3 ~ 111. A estabilidade de duplexes de DMA é afetada por fatores como a composição base, o comprimento, e o grau de pares de bases mau pareadas. As condições de hibridização podem ser ajustadas para permitir que DNAs de diferente seqüências de relatividade hibridizem. A temperatura de fusão (Tm) está definida como a temperatura quando 50 % das moléculas duplex dissociaram em suas fitas simples constituintes. A temperatura de fusão de um duplex perfeitamente combinado, onde o tampão de hibridização contém a formamida como um agente desnaturante, pode ser estimada pelas seguintes equações: (I) DNA - DNA: Tm(°C) = 81,5 + 16,6 (log [Na+]) + 0,41 (% G + C) - 0,62(% formamida) - 500/L (II) DNA - RNA: Tm(°C) = 79,8 + 18,5 (log [Na+]) + 0,58 {% G + C) + 0,12 (% G + C)2 - 0,5{% formamida) - 820/L (III) RNA - RNA: Tm(°C)=79,8 + 18,5 (log [Na+]) + 0,58 (% G + C) + 0,12 (% G + C)2 - 0,35(% formamida) - 820/L onde L ' é o comprimento do duplex formado, [Na+] é a concentração molar do íon de sõdio na hibridização ou solução de lavagem, e%deG + Céa porcentagem das bases (guanina + citosina) baseado no híbrido. Para híbridos imperfeitamente combinados, aproximadamente l°C ê requerido para reduzir a temperatura de fusão para cada 1 % de mã combinação.

As experiências de hibridização são conduzidas geralmente em um tampão de um pH entre 6,8 a 7,4, embora a taxa de ■ hibridização seja quase independente do pH nas forças iônícas provavelmente a ser usadas no tampão de hibridização (Anderson e Young (1985) supra). Além disso, um ou mais dos seguintes podem ser usados para reduzir a hibridização não - específica·. DMA de esperma de salmão sonicada ou um outro DNA não complementar, albumina de soro bovino, pirofosfato de sódio, dodecilsulfato de sõdio (SDS), polivinil - pírrolidona, solução de fícoll e de Denhardt. Sulfato de dextrana e políetileno glícol 6000 agem para excluir o DNA da solução, assim elevando a concentração eficaz da sonda do DNA e o sinal da hibridização dentro de uma dada unidade de tempo. Em alguns exemplos, as condições mesmo maiores de uma estringência podem ser desejáveis ou requeridas para reduzir a hibridização de fundo e/ou não específica. Estas condições podem ser criadas com o uso de uma temperatura mais alta, de uma força iônica mais baixa e de uma concentração mais elevada de um agente desnaturante, tal como, a formam!da.

As condições de estringência podem ser ajustadas para a seleção de fragmentos moderadamente similares, tais como, sequências homólogas dos organismos distantemente relacionados, ou aos fragmentos altamente similares, tais como, os genes que duplicam enzimas funcionais dos organismos proximamente relacionados. A estringência pode ser ajustada ou durante a etapa de hibridização ou nas lavagens pós - hibridização. A concentração de sal, concentração de formamida, temperatura de hibridização e os comprimentos das sondas são as variáveis que podem ser usadas para alterar a estringência (como descrito pela fórmula acima). Como diretrizes gerais, uma estringência elevada -é executada tipicamente em Tm - 5°C a Tm - 20°C, moderate estringência at Tm - 20°C a Tm - 35°C e baixa estringência a Tm - 35°C a Tm - 50°C para duplex >150 pares de base. A hibridização pode ser executada de baixa a moderada estringência (25 - 50°C abaixo Tm) , seguido por lavagens de pós - hibridízação a estringências crecentes. As taxas máximas de hibridízação na solução são determinadas empiricamente para ocorrer a TTO - 25°C para duplex DNA - DNA e Tm - 15 ° C para duplex RNA - DNA. Opcionalmente, o grau de dissociação pode ser avaliado depois que cada etapa da lavagem para determinar a necessidade de etapas de lavagem de alta estringência subsequente.

As condições de alta estringência podem ser usadas para selecionar sequências de ácido nucleico com graus elevados de identidade às sequências descritas. Um exemplo das condições de hibridízação estringentes obtidas em um método baseado em filtro, tal como, um Southern ou Northern blot para a hibridízação dos ácidos nucleicos complementares que têm mais de 100 resíduos complementares são cerca de 5°C a 20°C mais baixo do que o ponto de fusão térmico * (Tm) para a sequência específica em uma força iônica definida e pH. As condições usadas para a hibridízação pode incluir aproximadamente 0,02 M a aproximadamente 0,15 M de cloreto de sódio, de aproximadamente 0,5 % a aproximadamente 5 % de caseína, de aproximadamente 0,02 % de SDS ou aproximadamente 0,1 % de N - laurilsarcosina, de aproximadamente 0,001 M a aproximadamente 0,03 M de citrato de sódio, em temperaturas de hibridização entre aproximadamente 50°C e sobre 70°C. Mais preferivelmente, as condições elevadas de estringência são aproximadamente 0,02 M de cloreto de sódio, aproximadamente 0,5 % de caseína, aproximadamente 0,02 % de SDS, aproximadamente 0,001 M de extrato de sódio, em uma temperatura de aproximadamente 50°C. As moléculas de ácido nucleico que hibridizam sob condições estringentes hibridizarão tipicamente a uma sonda baseada na molécula inteira .do DNA ou em parcelas selecionadas, por exemplo, uma subseqüência original, do DNA. A concentração de sal estringente será ordinariamente menor do que aproximadamente 750 milímetros de NaCl e 75 milímetros de extrato trisódio. As condições cada vez mais estringentes podem ser obtidas com menos do que aproximadamente 500 milímetros de NaCl e 50 milímetros de extrato trisódio, para uma estringência ainda maior com menos do que aproximadamente 250 milímetros de NaCl e 25 milímetros de extrato trisódio. A hibridização de estringência baixa pode ser obtida na ausência do solvente orgânico, por exemplo, formamida, visto que a hibridização de alta estringência pode ser obtida na presença ao menos de formamida de aproximadamente 35 %, e mais preferivelmente ao menos aproximadamente 50 % de formamida. As condições de temperatura estringentes incluirão ordinariamente temperaturas ao menos aproximadamente de 30 °C, mais preferivelmente ao menos aproximadamente de 37°C, e mais preferivelmente ao menos aproximadamente de 42°C com formamida presente. Os parâmetros adicionais de variação, tais como, o tempo de hibridização, a concentração do detergente, por exemplo, dodecil sulfato de sódio (SDS) e força iôníca, são bem conhecidos aqueles hábeis na técnica. Os vários níveis de estringência são realizados combinando estas várias condições quando preciso.

As etapas de lavagem que seguem após a hibridização podem também variar em estringência; as etapas da lavagem do pós-hibridização determinam primeiramente a especificidade da hibridização, com os fatores mais críticos- que são temperatura e a força iônica da solução final da lavagem. A estringência da lavagem pode ser aumentada pela diminuição da concentração de sal ou pelo aumento da temperatura. A concentração estringente de sal para as etapas da lavagem será preferivelmente menor do que aproximadamente 30 milímetros de NaCl e 3 milímetros de citrato trisódio, e mais preferivelmente menos do que aproximadamente 15 milímetros de NaCl e 1,5 milímetros de citrato trisódio.

Assim, condições de hibridização e de lavagem que podem ser usadas para ligar e para remover os polinucleotídeos com menos do que a homologia desejada para as sequências de ácido nucleico ou seus complementos que codificam os presentes fatores de transcrição incluem, por exemplo: 6X SSC a 65 ° C; 50 % formamida, 4X SSC a 42°C; ou 0,5X SSC, 0,1 % SDS a 65 °C; com, por exemplo, duas etapas de lavagem de 10 - 30 minutos cada. As variações úteis nestas condições serão prontamente aparentes àqueles hábeis na técnica.

Uma' pessoa com habilidade na técnica não esperaria a variação substancial entre as espécies de polinucleotídeos abrangidas dentro do escopo da presente invenção porque as condições altamente estringentes determinadas nas formulas acima rendem estruturalmente polinucleotídeos similares.

Se desejado, um pode empregar etapas de lavagem de uma estringência mesmo maior, incluindo cerca de 0,2x SSC, 0,1 % SDS em 65°C e lavagem duas vezes, cada etapa da lavagem sendo de aproximadamente 30 minutos, ou aproximadamente 0,1 x SSC, ,0,1 % SDS em 65 °C e lavagem duas vezes por 3 0 minutos. A temperatura para as soluções da lavagem será ordinariamente ao menos cerca de 25°C, e para uma estringência maior ao menos cerca de 42°C. A estringência de hibridização pode ser aumentado em seguida usando as mesmas condições que nas etapas de hibridização, com a temperatura de lavagem aumentada de cerca de 3 °C para aproximadamente 5°C, e a estringência pode ser mesmo depois aumentada pelo uso das mesmas condições exceto que a temperatura da lavagem é aumentada de cerca de 6°C a cerca de 9 °C. Para a identificação de homólogos menos proximamente relacionados, as etapas da lavagem pode ser executadas em uma temperatura mais baixa, por exemplo, 50 °C.

Um exemplo de etapa de lavagem de baixa estringência emprega uma solução e condições ao menos de 25°C em 3 0 milímetros de NaCl, em 3 milímetros de citrato trisódio, e em 0,1 % SDS por mais de 30 minutos. Grande estringência pode ser obtida a 42°C em 15 milímetros de NaCl, com 1,5 milímetros de citrato de trisódio, e 0,1 % SDS por mais de 30 minutos. As condições de lavagem de estringência ainda maiores 'são obtidas em 65°C - 68°C em uma solução de 15 milímetros de NaCl, de 1,5 milímetros de citrato trisódio, e de 0,1 % SDS. Os procedimentos da lavagem empregarão geralmente ao menos duas etapas finais de lavagem. As variações adicionais nestas condições serão prontamente aparentes àqueles hábeis na técnica {veja, por exemplo, o pedido de patente US No. 20010010913}.

As condições de estringência podem ser selecionadas de modo que um oligonucleotídeo que é perfeitamente complementar ao oligonucleotídeo codificante hibridiza com o oligonucleotídeo codificante com ao menos um sinal cerca de 5 - lOx mais elevado para a taxa de ruído do que a taxa para a hibridização do oligonucleotídeo perfeitamente complementar a um ácido nucleico que codifica um fator de transcrição conhecido quando da data de depósito do pedido. Pode ser desejável selecionar condições para um ensaio particular, tal que, um sinal mais elevado para a taxa de ruído, isto ê, cerca de 15x ou mais, é obtido. Conformemente, um determinado ácido nucleico hibridiza com um oligonucleotídeo original codificante com ao menos um sinal 2x ou mais para a taxa de ruído em comparação a hibridização do oligonucleotídeo codificante a um ácido nucleico que codifica o polípeptídeo conhecido. O sinal particular dependerá do marcador usado no relevante ensaio, por exemplo, um marcador fluorescente, um marcador colorimétrico, uma marcador radioativo, ou assemelhados. A hibridização marcada ou as sondas de PCR para detectar sequências de polinucleotídeos relacionadas podem ser produzidas por oligomarcação, tradução do corte, marcação final, ou por amplificação por PCR usando um nucleotldeo marcado São abrangidas pela invenção as sequências de polinucleotídeos que são capazes de hibridizar com as sequências dos polinucleotxdeos reivindicadas, incluindo qualquer um dos polinucleotídeos do fator de transcrição dentro da listagem de sequências, e fragmentos dos mesmos sob várias condições de estringência (veja, por exemplo, Wahl e Berger (1987) supra, páginas 399 - 407; e Kimmel (1987) Methods Enzymol. 152: 507 - 511). Além das seqüências de nucleotídeos na listagem de seqüêncías, comprimento total do cDNA, ortólogos, e parãlogos das presentes seqüências de nucleotídeos podem ser identificados e isolados usando métodos bem conhecidos. As bibliotecas de cDNA, os ortólogos, e os parãlogos das presentes seqüências de nucleotídeos podem ser selecionados usando métodos de hibridízação para determinar sua utilidade como alvo de híbridização ou sondas de amplificação.

Identificando Polinucleotídeos ou Ácidos Nucleicos com as Bibliotecas de Expressão Além dos métodos de híbridização, polipeptídeos homólogos ao fator de transcrição podem ser obtidos pela seleção em uma biblioteca de expressão usando anticorpos específicos para um ou mais fatores de transcrição. Com a provisão daqui do fator de transcrição descrito, e seqüências de ácido nucleico homólogo do fator de transcrição, o(s) polipeptídeo(s) codificado(s) pode(m) ser expressado(s) e purificado{s) em um sistema de expressão heterólogo (por exemplo, E. colí) e usado(s) para produzir S anticorpos específicos (monoclonais ou policlonais) para o(s) polipeptídeo(s) em questão. Os anticorpos podem também ser produzidos contra os peptídeos sintéticos derivados do fator de transcrição, ou homólogo do fator de transcrição, seqüências de aminoãcidos, Os métodos de produzir 3 anticorpos são bem conhecidos na técnica e descritos em Harlow e Lane (1988), Antibodies: A Laboratory Manual, Cold Spring Harbor Laboratory, New York. Tais anticorpos podem então ser usados para selecionar uma biblioteca de expressão produzida da planta de que se deseja clonar 3 homólogos adicionais do fator de transcrição, usando os métodos descritos acima. Os cDNAs selecionados podem ser confirmados pelo sequenciamento e atividade enzimática. Variações das Seqüências Serã apreciado prontamente por aqueles com habilidade 3 na técnica, que qualquer uma de uma variedade de seqüências de polinucleotídeos ê capaz de codificar os fatores de transcrição e os polipeptídeos homólogos do fator de transcrição da invenção. Devido a degeneração do código genético, muitos polinucleotídeos diferentes podem codificar os polipeptídeos idênticos e/ou substancialmente similares além daquelas sequências ilustradas na listagem de seqüêncías. Os ácidos nucleicos que têm uma sequência que difira das seqüências mostradas na listagem de seqüêncías, ou as seqüências complementares, que codificam peptídeos funcionalmente equivalentes (isto é, peptídeos que têm algum grau de atividade biológica equivalente ou similar), mas diferem em seqüência da seqüência mostrada na listagem de seqüências devido a degeneração no código genético', estão também dentro do escopo da invenção.

As seqüências alteradas do polinucleotídeo que codificam polipeptídeos incluem aquelas seqüêncías com deleções, inserções, ou substituições de nucleotídeos diferentes, tendo por resultado um polinucleotídeo que codifica um polipeptídeo com ao menos uma característica funcional dos polipeptídeos do momento. São incluídos dentro desta definição os polimorfismos que podem ou não podem ser prontamente detectãveis usando uma sonda particular de o1igonuc1eot í deo do polinucleotídeo que codifica os presentes polipeptídeos, e a hibridização imprópria ou inesperada aos variantes alêlicos, com um locus â excepção do locus cromossomai normal para a seqüência de polinucleotídeos que codifica os presentes polipeptídeos. 0 variante alêlico se refere a qualquer de duas ou mais formas alternativas de ura gene que ocupa o mesmo locus cromossomal. Ά variação alélica gera-se naturalmente com a mutação, e pode resultar em polimorfismo fenotípico dentro das populações. As mutações do gene podem ser silenciosas (isto é, nenhuma mudança no polipeptídeo codificado) ou podem codificar os polipeptídeos que alteram a sequência de aminoãcidos. 0 termo variante alêlico ê usado também aqui para denotar uma proteína codificada por um variante alêlico de um gene. 0 variante splice se refere as formas alternativas do RNA transcrito de um gene. A variação splice ocorre naturalmente com o uso de sítios de splicing alternativos dentro de uma molécula transcrita do RNA, ou menos comumente entre moléculas separadamente transcritas do RNA, e pode resultar em diversos mRNAs transcritos do mesmo gene. Os variantes splice podem codificar os polipeptídeos que alteram a sequência de aminoãcidos. 0 termo variante splice ê usado também aqui para denotar uma proteína codificada por um variante splice de um mRNA transcrito de um gene.

Aqueles hábeis na técnica reconheceríam que, por exemplo, G1073, SEQ ID NO.; 2, representa um único fator de transcrição; variação alélica e splicing alternativo podem ser esperados que ocorram. Os variantes alélicos do SEQ 1D NO. : 1 pode ser clonado pela sondagem do cDNA ou bibliotecas genômicas dos organismos individuais diferentes de acordo cora procedimentos padrões. Os variantes alêlicos da sequência de DNA mostradas na SEQ XD NO. : 1, incluindo aqueles que contêm mutações silenciosas e aqueles em que as mutações resultam em mudanças na sequência de aminoãcidos, estão dentro do escopo da presente invenção, como são as proteínas que são variantes alêlicas da SEQ XD NO.: 2. Os cDNAs gerados dos mRNAs com splice alternativo, que retêm as propriedades do fator de transcrição são incluídos dentro do escopo da presente invenção, como são polipeptídeos codificados por tais cDNAs e mRNAs. Os variantes alêlicos e os variantes splice destas sequências podem ser domados pela sondagem do cDNA ou bibliotecas genômicas de diferentes organismos individuais ou dos tecidos de acordo com os procedimentos padrões conhecidos na técnica (veja USPN 6.388.064).

Assim, além das sequências determinadas na listagem de seqüências, a invenção abrange também as moléculas relacionadas do ácido nucleico que incluem variantes alêlicas ou splice, e as seqüências que são complementares. As moléculas de ácido nucleico relacionadas incluem também as seqüências de nucleotídeos que codificam um polipeptídeo que compreende uma substituição, uma modificação, uma 5 adição e/ou um deleção de um ou mais resíduos de aminoãcidos. Tais polipeptídeos relacionados podem compreender, por exemplo, adições e/ou deleções de um ou de mais sítios de glicosilação ligados ao 0 ou ligados ao N, ou uma adição e/ou um deleção de um ou mais resíduos de cisteína.

Por exemplo, a tabela 2 ilustra, por exemplo, que os códons AGC, AGT, TCA, TCC, TCG, e TCT todos codificam o mesmo aminoãcido: serina. Conformemente, em cada posição na sequência onde hã um códon codificando serina, qualquer das seqüências acima do trinucleotídeo podem ser usadas sem alterar o polipeptídeo codificado.

Tabela 2 As alterações de seqüências que não mudam a seqüência de aminoácidos codificada pelo polinucleotídeo são denominadas variações "silenciosas". À exceção dos códons ATG e TGG, codificando metionina e triptofano, respectivamente, qualquer dos códons possíveis para o mesmo aminoãcido podem ser substituídos por uma variedade de técnicas, por exemplo, mutagênese sítio-dirigida, disponível na técnica. Conformemente, quaisquer e todas as tais variações de uma seqüência selecionada da tabela acima são uma característica da invenção.

Além das variações silenciosas, outras variações conservadoras que alteram um, ou alguns amínoãcidos no polípeptídeo codificado, podem ser feitas sem alterar a função do polipeptídeo, estes variantes conservadores são, do mesmo modo, uma característica da invenção.

Por exemplo, as substituições, deleções e inserções introduzidas nas sequências fornecidas na listagem de sequências, são previstas também pela invenção. Tais modificações da seqüência podem ser projetadas em uma seqüência pelo mutagênese sítio-dirigida (Wu, editor Methods Enzymol. (1993) vol. 217, Academíc Press) ou os outros ‘métodos notáveis abaixo. As substituições de amínoãcidos são tipicamente de resíduos únicos; as inserções geralmente estarão na ordem de aproximadamente 1 a 10 resíduos de amínoãcidos; e as deleções variarão de aproximadamente 1 a 30 resíduos. Em modalidades preferidas, as deleções ou as inserções são feitas nos pares adjacentes, por exemplo, uma deleção de dois resíduos ou inserção de dois resíduos. As substituições, deleções, inserções ou qualquer combinação destas podem ser combinadas para chegar em uma seqüência. As mutações que são feitas no polínucleotídeo que codifica o fator de transcrição não devem colocar a seqüência fora do molde da leitura e não devem criar as regiões complementares que poderiam produzir a estrutura secundária do mRNA. Preferivelmente, o polipeptídeo codificado pelo DNA executa a função desejada.

As substituições conservadoras são aquelas em que ao menos um resíduo na seqüência de aminoãcidos foi removido e um resíduo diferente foi introduzido em seu lugar. Tais substituições são feitas geralmente de acordo com a tabela 3 quando se deseja manter a atividade da proteína. A tabela 3 mostra os aminoãcidos que podem ser substituídos para um amínoãcido em uma proteína e que são considerados tipicamente como substituições conservadoras. Em uma modalidade, os fatores das transcrições listados na listagem de seqüências podem ter atê 10 substituições conservadoras e reter sua função. Em uma outra modalidade, os fatores das transcrições listados na listagem de seqüências podem ter mais de 10 substituições conservadoras e ainda reter sua função.

Tabela 3 As substituições similares são aquelas em que ao menos um resíduo na seqüência de aminoãcidos foi removido e um resíduo diferente foi introduzido em seu lugar. Tais substituições são feitas geralmente de acordo com a tabela 4 guando' se deseja manter a atividade da proteína. A tabela 4 mostra aminoãcidos que podem ser substituídos para um aminoãcido em uma proteína e que são considerados tipicamente como substituições estruturais e funcionais. Por exemplo, um resíduo na coluna 1 da tabela 4 pode ser substituído com um resíduo na coluna 2,- além disso, um resíduo na coluna 2 da tabela 4 pode ser substituído com o resíduo da coluna 1.

Tabela 4 Substituições que são menos conservadoras do que aquelas na tabela 4 podem ser selecionadas escolhendo os resíduos que diferem mais significativamente em seu efeito em manter (a) a estrutura da da cadeia principal do polipeptídeo na área da substituição, por exemplo, como uma folha ou uma conformação helicoidal, (b) a carga ou a hidrofobicidade da molécula no sítio alvo, ou (c) o volume da cadeia lateral. As substituições que no geral se esperam produzir as maiores mudanças em propriedades da proteína serão aquelas em que (a) um resíduo hidrof ílico, por exemplo, seril ou treonil, é substituído para (ou por) um resíduo hidrofõbico, por exemplo, leucil, isoleucil, fenilalanil, valil ou alanil; (b) uma cisterna ou uma prolina é substituída para (ou por) qualquer outro resíduo (c) um resíduo que tem uma cadeia lateral eletropositiva, por exemplo, lisíl, o arginil, ou o histidil, é substituído para (ou por) um resíduo eletronegativo, por exemplo, glutamil ou aspartil; ou (d) um resíduo que tem uma cadeia lateral Volumosa, por exemplo, fenilalanina, ê substituído para (ou por) um que não tem uma cadeia lateral, por exemplo, glicina.

Seqüências de Modificação Adicionais da Invenção por Mutação/Evolução Forcada Além da geração de substituições silenciosas ou conservadoras como notado, acima, a presente invenção incluí opcionalmente métodos para modificar as seqüências da listagem de seqüências. Nos métodos, os métodos de modificação do ácido nucleico ou da proteína são usados para alterar as dadas seqüências para produzir novas seqüências e/ou para modificar quimicamente ou enzimaticamente as dadas seqüências para mudar as propriedades dos ácidos nucleicos ou das proteínas.

Assim, em uma modalidade, as dadas seqüências do ácido nucleico são modificadas, por exemplo, de acordo com a mutagênese padrão ou métodos de evolução artificiais para produzir sequências modificadas. As seqüências modificadas podem ser criadas usando polinucleotídeos naturais purificados isolados de qualquer organismo ou podem ser sintetizados das composições e dos produtos químicos purificados usando meios químicos bem conhecidos aqueles com habilidade na técnica. Por exemplo, Ausubel (1997 e 2000; supra), fornece detalhes adicionais em métodos de mutagênese. Os métodos de evolução artificiais forçados são descritos, por exemplo, por Stemmer (1994; Fature 370: 389 - 391), Stemmer (1994; Proc. Natl. Acad. Sei. EUA 91: 10747 - 10751), e patentes U.S. 5.811.238, 5.837.500, e 6.242.56¾. Os métodos para projetar fatores de transcrição sintéticos e outros polipeptídeos são descritos, por exemplo, por Zhang et al. (2000) J. Biol. Chem. 275: 33850 - 33860, Liu et al. (2001) J. Biol. Chem. 276: 11323 - 11334, e Isalan et al. (2001) Fature Biotechnol. 19: 656 - 660. Muitos outros métodos de mutação e de evolução são também disponíveis e esperados estar dentro da habilidade do técnico.

Similarmente, a alteração química ou enzimãtiea de ácidos nucleicos e de polipeptídeos expressados pode ser executada por métodos padrões. Por exemplo, a seqüência pode ser modificada por adição de lipídeos, açúcares, peptídeos, compostos orgânicos ou inorgânicos, pela inclusão de nucleotídeos ou de aminoãcidos modificados, ou de assemelhados. Por exemplo, as técnicas de modificação da proteína são ilustradas em Ausubel (1997 e 2000; supra). Detalhes adicionais em modificações químicas e enzimãticas podem ser encontradas aqui. Estes métodos de modificação podem ser usados para modificar qualquer dada seqüência, ou para modificar qualquer seqüência produzida por várias mutações e métodos de modificação de evolução artificiais conhecidos aqui.

Conformemente, a invenção fornece para a modificação de qualquer dado ácido nucleico por mutação, evolução, pela modificação química ou enzimãtica, ou outros métodos disponíveis, assim como para os produtos produzidos praticando tais métodos, por exemplo, usando as seqüências aqui como um substrato de partida para várias abordagens de modificação.

Por exemplo, a seqüência codificante otimizada que contém os códons preferidos por um hospedeiro procariótico ou eucariõtico particular pode ser usada, por exemplo, para aumentar a taxa de tradução ou para produzir os transcritos recombinante de RNA que têm propriedades desejáveis, tais como uma meia-vida mais longa, em comparação aos transcritos produzidos usando uma seqüência não otimizada. Os códons de parada (do inglês; stop) de tradução podem também ser modificados para refletir a preferência do hospedeiro. Por exemplo, os códons de parada preferidos para o Saccharomyces cerevisiae e mamíferos são TAA e TGA, respectivamente. O códon de parada preferido para plantas monocotiledôneas ê TGA, visto que os insetos e E. coli preferem usar TAA como o códon de parada.

As seqüências de polinucleotídeos da presente invenção podem também ser projetadas a fim de alterar uma seqüência codíficante para uma variedade de razões, incluindo, mas não limitado a, alterações que modificam a seqüência para facilitar a clonagem, processamento e/ou expressão do produto do, gene, Por exemplo, as alterações são introduzidas opcionalmente usando as técnicas que são bem conhecidas na técnica, por exemplo, mutagênese sitio -dirigida, para introduzir sítios de restrição novos, para alterar padrões de glicosilação, para mudar a preferência do códon', para introduzir sítios splice, etc..

Além disso, um fragmento ou um domínio derivado de qualquer dos polipeptídeos da invenção pode ser combinado com os domínios derivados de outros fatores de transcrição ou os domínios sintéticos para modificar a atividade biológica de um fator de transcrição. Por exemplo, um domínio de ligação de DNA derivado de um fator de transcrição da invenção pode ser combinado com o domínio de ativação de outro fator de transcrição ou com um domínio sintético de ativação. Um domínio de ativação de transcrição ajuda na inicialização da transcrição de um sítio de ligação de DNA. Os exemplos incluem a região de ativação da transcrição de VP16 ou de GAL4 (Moore et al. (1998) Proc. Natl. Acad. Sei. USA 95; 376 - 381,- Aoyama et al. (1995) Plant Cell 7: 1773 - 1785), os peptídeos derivados de seqüências bacterianas (Ma and Ptashne (1987) Cell 51: 113 - 119) e peptídeos sintéticos (Gíníger e Ptashne (1987) Nature 330; 670 - 672).

Expressão e Modificação de Polípeptídeos Tipicamente, as seqüências de polinucleotídeos da invenção_ são incorporadas nas moléculas recombinantes e DNA (ou RNA) que expressam diretamente os polípeptídeos da invenção nas células hospedeiras apropriadas, plantas transgênicas, em sistemas de tradução ín vitro, ou assemelhados. Devido a degeneração inerente do código genético', seqüências de ácido nucleíco que codificam substancialmente o mesmo ou uma sequência funcionalmente equivalente de aminoãcido pode ser substituída por qualquer sequência listada para fornecer a clonagem e expressão do homologo relevante.

As plantas transgênicas da presente invenção que compreendem sequências de polinucleotídeo recombinantes são derivadas geralmente das plantas parentais, que podem elas mesmas ser plantas não transformadas (ou não transgênicas). Estas plantas transgênicas podem ter um gene do fator de transcrição "silenciado" (do inglês: knocked out) (por exemplo, com uma inserção genômica pela recombinação homologa, por um antisenso ou pela construção da ribozima) ou expressado a uma extensão normal ou do tipo selvagem. No entanto, as plantas "progênie" transgênicas superexpressantes exibirão grandes níveis de mRNA, em que o mRNA codifica um fator de transcrição, isto ê, uma proteína de ligação de DNA que seja capaz de ligar a uma sequência regulatória do DNA e de induzir a transcrição, e preferivelmente, a expressão de um gene traço da planta. Preferivelmente, o nível da expressão do mRNA será ao menos 3 vezes maior do que aquele da planta parental, ou mais preferivelmente ao menos níveis 10 vezes maiores do mRNA comparados a dita planta parental, e ainda mais preferivelmente ao menos cinquenta vezes maior comparado a dita planta parental.

Vetores, Promotores, e Sistemas de Expressão A presente invenção inclui construções recombinantes que compreendem um ou mais das presentes sequências de ãcído nucleico. As construções compreendem tipicamente um vetor, tal como um plasmídeo, um cosmídeo, um fago, um vírus (por exemplo, um vírus de planta) , um cromossomo artificial bacteriano (BAC), um cromossomo artificial de fungo (YAC), ou assemelhados, em que uma sequência de ácido nucleico da invenção foi introduzida, em uma orientação sentido (forward) ou reversa. Em um aspecto preferido desta modalidade, a construção compreende ainda seqüências regulatõrías, incluindo, por exemplo, um promotor, operavelmente ligado à sequência. Um grande número de vetores e promotores apropriados são conhecidos daqueles com habilidade na técnica, e estão comercialmente disponíveis.

Os textos gerais que descrevem as técnicas de biologia molecular úteis aqui, incluindo o uso e a produção dos vetores, promotores e muitos outros tópicos relevantes, incluem Berger (1987) supra, Sambrook (1989), supra, e Ausubel -(por meio de 2000) supra. Qualquer das seqüências identificadas podem ser incorporadas em um cassete ou em um vetor, por exemplo, para a expressão nas plantas. Um número de vetores de expressão apropriados para a transformação estável de células da planta ou para o estabelecimento de plantas transgênicas foram descritos, incluindo aqueles descritos em 1989) métodos de Weissbach e Weissbach (1989) Methods ■ for Flant Molecular Biology, Academic Press, e Gelvin et al. (1990) Plant Molecular Biology Manual, Kluwer Academic Publishers. Os exemplos específicos incluem aqueles derivados de um plasmídeo ti de Agrobacterium tumefaciens, bem como aqueles descritos por Herrera-Estrella et al. (1983) Nature 303: 209, Bevan (1984) Nucleic Acids Res. 12: 8711 - 8721, Klee (1985) Bio/Technology 3: 637 - 642, para plantas dicotiledôneas.

Alternativamente, os vetores não - Ti podem ser usados para transferir o DNA em plantas monocoti1edôneas e em células usando técnicas de distribuição livres de DNA. Tais métodos podem envolver, por exemplo, o uso de liposomas, eletroporação, bombardeio de microproj étil, whiskers ("fios") de carbeto de silício, e vírus. Pelo uso desses métodos,- plantas transgênícas, tais como, o trigo, o arroz (Christou (1991) Bío/Technology 9: 957 - 962) e milho (Gordon-Kamm (1990) Plant Cell 2: 603 - 618) podem ser produzidos. Um embrião imaturo pode também ser um bom tecido alvo para monocotiledôneas para técnicas diretas de distribuição do DNA pelo uso do injetor de partícula (Weeks et al. (1993) Plant Physiol. 102: 1077 - 1084,- Vasil (1993) Bio/Technology 10: 667 - 674; Wan e Lemeaux (1994) Plant Physiol, 104: 37 - 48, e para transferência do DNA mediado por Agrobacterium (Ishida et al. (1996) Nature Biotechnol. 14: 745 - 750).

Tipicamente, os vetores de transformação da planta incluem uma ou mais sequências codificantes de planta clonadas (genômico ou cDNA) sob o controle transcricional de sequências regulatôrias 5' e 3' e um marcador selecionãvel dominante. Tais vetores de transformação da planta contêm tipicamente também um promotor (por exemplo, uma região regulatória de controle induzível ou constitutiva, regulada desenvolvimental ou ambientalmente, ou expressão tecido - específico ou de célula), um sítio de começo da iniciação da transcrição, um sinal de processamento de RNA (tais como, sítios splice de íntron), um sítio de terminação de transcrição, e/ou um sinal de poliadenilação.

Uma potencial utilidade para os polinucleotídeos de fator de transcrição descritos aqui ê o isolamento de elementos de promotor destes genes que podem ser usados programar a expressão nas plantas de quaisquer genes. Cada gene do fator de transcrição descrito aqui é expressado em uma forma única, como determinado pelos elementos do promotor situados à montante do começo da tradução, e adicionalmente dentro de um íntron do gene do fator de transcrição ou à jusante do códon de terminação do gene.

Como é bem conhecido na técnica, para uma porção significativa dos genes, as seqüências do promotor são situados inteiramente na região diretamente rio acima do começo da tradução. Nesses casos, as seqüências do promotor são localizadas tipicamente dentro de 2,0 kb do começo da tradução, ou dentro de 1,5 kb do começo da tradução, freqüentemente dentro de 1,0 kb do começo da tradução, e às vezes dentro de 0,5 kb do começo da tradução.

As seqüências do promotor podem ser isoladas de acordo com os métodos conhecidos para um hábil na técnica.

Os exemplos dos promotores de planta constitutivos que podem ser úteis para expressar a sequência do fator de transcrição incluem.· o promotor 3 5S, que do vírus do mosáico _ da couve-flor (CaMV), o qual confere expressão constitutiva, de alto nível na maioria de tecidos de planta (veja, por exemplo, Odell et al. (1985) Nature 313: 810 -812); o promotor sintase da nopalina (An et al. (1988) Plant Physiol. 88: 547 - 552); e o promotor sintase da octopina ((Fromm et al. (1989) Plant Cell 1: 977 - 984).

Os fatores de transcrição da invenção podem ser operavelmente ligados com um promotor específico que faça com que o fator de transcrição seja expressado em resposta aos sinais ambientais, tecido-específicos ou temporais. Uma variedade de promotores do gene da planta ê conhecida para regular a expressão do gene em resposta aos sinais ambientais, hormonais, químicos, de desenvolvimento, e em uma forma ativa em tecido; muitos destes podem ser usados para a expressão de uma seqüência do fator de transcrição nas plantas, A escolha de um promotor ê baseada em grande parte no fenõtipo de interesse e determinado por tais fatores como o tecido (por exemplo, semente, fruta, raiz, pólen, tecido vascular, flor, carpelo, etc,), inducibilidade (por exemplo, em resposta a ferimentos, ao calor, ao frio, a seca, a luz, a patógenos, etc.), sincronismo, estágio do desenvolvimento, e assemelhados. Os numerosos promotores conhecidos foram caracterizados e podem ser favoravelmente empregados para promover a expressão de um polinucleotídeo da invenção em uma planta ou em uma célula transgênicas de interesse. Por exemplo, os promotores tecido - específicos incluem; promotores semente - específicos (tais como, o promotor napina, faseolina ou DC3 descrito na patente U. S. No. 5.773.697), promotores fruto - específicos que são ativos durante o amadurecimento da fruta (tal como, o promotor dru 1 (patente U. S. No. 5.783.393), ou o promotor 2A11 (patente ü, S. No. 4.943.674) e o promotor da poligalacturonase do tomate (Bird et al. (1988) Plant Mol . Biol. 11: 651 - 662), os promotores raiz - específicos, tal como, o ARSK1, e aqueles descritos nas patentes U. S, nos. 5.618.988, 5.837.848 e 5.905.186, promotores epiderme - específicos, incluindo CUT1 (Kunst et al. (1999) Biochem. Soc, Trans. 28: 651 - 654), promotores pólen - ativos, tais como, PTA29, PTA26 e PTA13 (patente U. S. No. 5,792,929), promotores ativos no tecido vascular (Ringli e Keller (1998) Plant Mol. Biol. 37: 977 - 988), flor - específico (Kaiser et al. (1995) Plant Mol. Biol. 28: 231 - 243), pólen (Baerson et al. (1994) Plant Mol. Biol. 26: 1947 - 1959), carpelos (Ohl et al. (1990) Plant Cell 2: 837 - 848), pólen e óvulos (Baerson et al. (1993) Plant Mol. Biol. 22; 255 - 267), promotores induzíveis por auxína (tal como, aquele descrito em van der Kop et al. (1999) Plant Mol. Biol. 39; 979 - 990 ou Baumann et al. (1999) Plant Cell 11: 323 - 334), promotor induzível por citoquinina (Guevara-Garcia (1998) Plant Mol. Biol. 38: 743 - 753), promotores responsivos a giberelina (Shi et al. (1998) Plant Mol. Biol. 38: 1053 -1060, Willmott et al. (1998) Plant Mol. Biol. 38: 817 -825) e assemelhados. Os promotores adicionais são aqueles que elicíam a expressão em resposta ao calor (Ainley et al. (1993) Plant Mol. Biol. 22: 13 - 23), luz (por exemplo, o promotor rbcS - 3A da ervilha, Kuhlemeier et al. (1989) Plant Cell 1: 471 - 478, e o promotor rbcS do milho, Schaffner and Sheen (1991) Plant Cell 3; 997 - 1012); ferimentos (por exemplo, wunl, Siebertz et al. (1989) Plant Cell 1: 961 - 968)? patógenos (tal como, o promotor PR - 1 descrito em Buchel et al. (1999) Plant Mol. Biol. 40: 387 - 396, e o promotor PDF1.2 descrito em Manners et al. (1998) Plant Mol. Biol. 38: 1071 - 1080), e produtos químicos, tal como, o metil jasmonato ou o ácido salicílico (Gatz (1997) Annu. Rev. Plant Physiol. Plant Mol. Biol. 48: 89 - 108). Além disso, o sincronismo da expressão pode ser controlado usando os promotores, tais como, aqueles que agem em senescência (Gan e Amasino (1995) Science 270: 1986 -1988)? ou desenvolvimento tardio da semente (Qdell et al. (1994) Plant Physiol. 106: 447 - 458).

Os vetores de expressão da planta podem também incluir os sinais de processamento do RNA que podem ser posicionados dentro, ã montante ou â jusante da seqüência codificante. Além disso, os vetores de expressão podem incluir seqüências regulatórias adicionais da região 3' - não traduzida de genes de plantas, por exemplo, uma região terminal 31 para aumentar a estabilidade do mRNA do mRNA, tal como a região terminal PI - II da batata ou das regiões terminais da sintase 3' da octopina ou da nopalina. Elementos de Expressão Adicionais Os sinais de iniciação específicos podem ajudar na tradução eficiente de seqüências codificantes. Estes sinais podem incluir, por exemplo, o códon de iniciação ATG e as sequências adjacentes. Nos casos onde uma sequência codificante, seu códon da iniciação e as sequências a montante são introduzidas no vetor apropriado da expressão, nenhum sinal de controle de tradução adicional pode ser Necessário. No entanto, nos casos onde somente a seqüência codificantes (por exemplo, uma seqüência codificante madura da proteína), ou uma porção da mesma, é introduzida, os sinais de controle do transcricional exôgenos, incluindo o códon da iniciação ATG, podem ser fornecidos separadamente. O códon ' da iniciação ê fornecido em um quadro de leitura correto para facilitar a transcrição. Os elementos transcricionais exôgenos e os códons de iniciação podem ser de várias origens, tanto naturais quanto sintéticas. A eficiência da expressão pode ser acentuada pela inclusão dos acentuadores apropriados ao sistema da célula no uso.

Hospedeiro de expressão A presente invenção relaciona-se também às células hospedeiras que são traduzidas com os vetores da invenção, e a produção dos polipeptídeos da invenção {incluindo fragmentos dos mesmos) por técnicas recombinantes. As células hospedeiras são projetadas geneticamente {isto é, os ácidos nucleicos são introduzidos, por exemplo, traduzidos, transformados ou transfectados) com os vetores desta invenção, que podem ser, por exemplo, um vetor de clonagem ou um vetor de expressão que compreende os ácidos nucléico-s relevantes aqui. 0 vetor é opcionalmente um plasmídeo, uma partícula viral, um fago, um ácido nucléíco despido, etc.. As células hospedeiras projetadas podem ser cultivadas nos meios nutrientes convencionais modificados como apropriados para a ativação dos promotores, a seleção dos transformantes ou a amplificação do gene relevante. As condições da cultura, tais como a temperatura, o pH e assemelhados, são aquelas usadas previamente com a célula hospedeira selecionada para a expressão, e serão aparentes àquelas hábeis na técnica e nas referências citado aqui, incluindo Sambrook (1989) supra, e Ausubel (ao longo de 2000) supra. A célula hospedeira pode ser uma célula eucariõtica, tal como uma célula de fermento, ou uma célula da planta, ou a célula hospedeira pode ser uma célula procariõtica, tal como uma célula bacteríana. Os protoplastos de planta são também apropriados para algumas aplicações. Por exemplo, os fragmentos do DNA são introduzidos em tecidos de planta, em células cultivadas da planta ou em protoplastos da planta por métodos padrão incluindo a electroporação (Frotnm et al. (1985) Proc. Natl . Acad. Sei. EUA 82: 5824 - 5828) , infecção por vetores virais, tais como, o vírus do mosaico da couve - flor (CaMV) (Hohn et al (1982) Molecular Biology of Plant Tumors, Academic Press, Nova York, NY, pp. 549 - 560; US 4,407,956), penetração balística de velocidade elevada por partículas pequenas com o ácido nucléico dentro da matriz de grânulos pequenos ou por partículas, ou na superfície (Klein et al. (1987) Nature 327: 70 - 73), uso do pólen como o vetor (WO 85/01856), ou o uso de Agrobacterium tumefaciens ou de A. rhizogenes carregando um plasmídeo de T-DNA na qual fragmentos de DNA são clonados. 0 plasmídeo de T-DNA é transmitido às células de plantas sob infecção por Agrobacterium tumefaciens, e uma porção ê integrada estavelmente no genoma da planta (Horsch et al. (1984) Science 233: 496 - 498; Fraley et al. (1983) Proc. Natl.

Acad. Sei. EUA 80: 4803 - 4807). A célula pode incluir um ácido nucléico da invenção que codifica um polipeptídio, em que a célula expressa um polipeptídico da invenção. A célula pode também incluir seqüências do vetor, ou assemelhados. Além disso, as células e as plantas transgênicas que incluem todo o polipeptídeo ou o ácido nucléico acima ou ao longo desta especificação, por exemplo, produzido pela tradução de um vetor da invenção, são uma característica adicional da invenção.

Para a produção a longo prazo, com rendimento elevado de proteínas recombinantes, a expressão estável pode ser usada. As células hospedeiras transformadas com uma seqüência de nucleotídeos que codifica um polípeptídeo da invenção são cultivadas opcionalmente sob as condições apropriadas para a expressão e a recuperação da proteína codificada da cultura de célula. A proteína ou fragmento produzido da mesma por uma célula recombinante pode ser secretadas, no limite da membrana, ou contido intracelularmente, dependendo da seqüência e/ou do vetor usados. Como será compreendido por aqueles com habilidade na técnica, os vetores da expressão que contêm os polinucleotídeos que codificam as proteínas maduras da invenção podem ser projetados com sequências de sinal que dirigem .a secreção dos polipeptídeos maduros através de uma membrana de célula procariótica ou eucariótica.

Resíduos modificados de aminoácido Os polipeptídeos da invenção podem conter um ou mais resíduos modificados do aminoãcido. A presença de aminoãcidos modificados pode ser vantajosa em, por exemplo, aumentar a meía-vida do polípeptídeo, reduzir a antigenicidade ou a toxicidade do polípeptídeo, aumentar a estabilidade do armazenamento do polípeptídeo, ou assemelhados. 0(s) resíduo(s) do aminoãcido é(são) modificados, por exemplo, co-translacionalmente ou pós-translacionalmente durante a produção recombinante ou modificado por meios do sintéticos ou químicos.

Exemplos não limítantes de um resíduo modificado de aminoãcido incluem a modalidade ou o outro uso de aminoãcidos acetilados, aminoãcidos glicosilados, aminoãcidos sulfatados, preniladas (por exemplo, farnesilada, geranilgeranilada) aminoãcidos, PEG (por exemplo, o "PEGilatada") aminoãcidos modificados, aminoãcidos biotinilados, aminoãcidos carboxilados, aminoãcidos fosforilados, etc.. As referências adequadas para guiar alguém com habilidade na modificação de resíduos de aminoãcidos são repletas ao longo de toda a literatura.

Os resíduos modificados do aminoãcido podem impedir ou aumentar a afinidade do polipeptídeo para uma outra molécula, um incluindo, mas não limitado a, um polinucieotídeo, proteínas, hidratos de carbono, lipídeos e derivados de lipídeo, e outros compostos orgânicos ou sintéticos.

Identificação de fatores adicionais da proteína Um . fator de transcrição fornecido pela presente invenção pode também ser usado para identificar as moléculas endógenas ou exõgenas adicionais que podem afetar um fenõtipo ou um traço de interesse. Tais moléculas incluem as moléculas endógenas que são atuantes mediante ou em um nível transcricional por um fator de transcrição da invenção para modificar um fenótipo como desejado. Por exemplo,, os fatores de transcrição podem ser empregados para identificar um ou mais genes a jusante que são sujeitos a um efeito regulatório do fator de transcrição. Em uma abordagem, um homólogo do fator de transcrição ou do fator de transcrição da invenção é expresso em uma célula hospedeira, por exemplo, uma célula transgênica da planta, um tecido ou explante, e produtos da expressão, tanto RNA quanto proteína, de alvos prováveis ou aleatórios são monitorados, por exemplo, pela hibridização com um microarranjo das sondas do ácido nucleico que correspondem aos genes expressados em um tipo do tecido ou da célula de interesse, pela eletroforese bidimensional em gel de produtos da proteína, ou por qualquer outro método conhecido na técnica para avaliar a expressão de produtos do gene - no nível do RNA ou da proteína. Alternatívamente, um fator de transcrição da invenção pode ser usado para identificar as seqüências do promotor (tais como, sítios de ligação em seqüências do DNA) envolvidas no regulamento de um alvo a jusante. Após ter identificado uma sequência do promotor, as interações entre o fator de transcrição e a seqüência do promotor podem ser modificadas mudando nucleotídeos específicos na seqüência do promotor ou nos aminoãcidos específicos no fator de transcrição que interagem com a seqüência do promotor para alterar um traço da planta. Tipicamente, os sítios de ligação de DNA do fator de transcrição são identificados por ensaios do deslocamento em gel. Após ter identificado as regiões do promotor, as seqüências da região do promotor podem ser empregadas era disposições dupla fita do DNA para identificar as moléculas que afetam as interações dos fatores de transcrição com seus promotores (Bulyk et al. (1999) Nature Biotechnol. 17: 573 - 577).

Os fatores de transcrição identificados são também úteis para identificar as proteínas que modificara a atividade do fator de transcrição. Tal modificação pode ocorrer pela modificação covalente, como pela fosforilação, ou por interações proteína - proteína (homo ou -heteropolímero). Qualquer método apropriado para detectar interações proteína - proteína pode ser empregado. Entre os métodos que podem ser empregados são co- imunoprecipitação, ligação cruzada e o co- purificação através dos gradientes ou das colunas cromatogrãficas, e o sistema de fungo híbrido duplo. 0 sistema sistema de fungo híbrido duplo detecta interações da proteína ín vivo e tem sido descrito previamante (Chien et al. (1991) Proc. Natl. Acad. Sei. EUA 88: 9578 - 9582)f e está comercialmente disponível de Clontech (Paio Alto, Califórnia), Em tal sistema, os plasmídeos são construídos de modo a codificar duas proteínas híbridas: um consiste no domínio de ligação de DNA de uma proteína de ativação da transcrição fundida ao polipeptídeo do fator de transcrição e o outro consiste no domínio .de ativação da proteína de ativação da transcrição fundido a uma proteína desconhecida que seja codificada por um cDNA que fox recombinado no plasmídeo como parte de uma biblioteca de cDNA. 0 plasmídeo de ligação de DNA da fusão do domínio e a biblioteca do cDNA são transformados em uma linhagem do fungo Saccharomyces cerevísiae que contém um gene repórter (por exemplo, lacZ) cuja região regulatória contenha o sítio de ligação do ativador da transcrição. Ou a proteína híbrida sozinha não pode ativar a transcrição do gene repórter. A interação das duas proteínas híbridas reconstitui a proteína e os resultados funcionais do ativador na expressão do gene repórter, que ê detectado por um ensaio para o produto do gene repórter. Então, os plasmídeos da biblioteca responsáveis pela expressão do gene repórter são isolados e arranjados em seqüência para identificar as proteínas codificadas pelos plasmídeos da biblioteca. Após ter identificado as proteínas que interagem com os fatores de transcrição, os ensaios para os compostos que interferem com as interações da proteína -proteína do fator de transcrição podem ser executados. Subseqüênc ias Os 'usos dos polinucleotídeos, referidos também aqui como oligonucleotídeos, tipicamente tendo ao menos 12 bases, preferivelmente, ao menos 50 bases, que hibridizam sob condições estringentes com uma seqüência de polinucleotídeos descrita acima também são contemplados. Os polinucleotídeos podem ser usados como sondas, primers, agentes senso e antisenso, e assemelhados, de acordo com os métodos descritos acima.

Subseqüências dos polinucleotídeos da invenção, incluindo fragmentos de polinucleotídeo e oligonucleotídeos são üteís como sondas de ácido nucleico e primers. Um oligonucleotídeo apropriado para uso como uma sonda ou um primer está ao menos aproximadamente 15 nucleotídeos em comprimento, mais frequentemente ao menos aproximadamente 18 nucleotídeos, frequentemente ao menos aproximadamente 21 nucleotídeos, frequentemente ao menos aproximadamente 30 nucleotídeos, ou aproximadamente 40 nucleotídeos, ou mais em comprimento. Uma sonda de ácido nucleico é útil em protocolos de hibridização, por exemplo, para identificar os homólogos de polipeptídeo adicionais da invenção, incluindo protocolos para experimentos de mícroarranjo. Os primers podem ser recozidos a uma fita de DNA alvo complementar pela hibridização do ácido nucleico para formar um híbrido entre o primer e a fita de DNA alvo, e então ser estendidos ao longo da fita de DNA alvo por uma enzima polimerase do DNA. Os pares de primer podem ser usados para a amplificação de uma seqüência do ácido nucleico, por exemplo, pela reação em cadeia de polimerase (PCR) ou outros métodos de amplificação do ácido nucleico (Sambrook (1989) supra e Ausubel (ao longo de 2000) supra).

Além disso, a invenção inclui um polipeptídeo isolado ou recombinante incluindo uma subseqüência ao menos de aproximadamente 15 aminoácidos contíguos codificados pelos polinucleotídeos recombinantes ou isolados da invenção. Por exemplo, tais polipeptídeos, ou domínios ou fragmentos dos mesmos, podem ser usados como imunógenos, por exemplo, para produzir os anticorpos específicos para a seqüência do polipeptídeo, ou como sondas para detectar uma seqüência de interesse. Uma subseqüência pode variar no tamanho de aproximadamente 15 aminoácidos em comprimento até e incluindo o comprimento completo do polipeptídeo.

Para ser abrangido pela presente invenção, um polipeptídeo expressado que compreenda tal uma subseqüência de polipeptídeo executa ao menos uma função biológica do polipeptídeo intacto substancialmente da mesma maneira, ou até de certa forma, similar, como o polipeptídeo intacto. Por exemplo, um fragmento do polipeptídeo pode compreender um motivo estrutural reconhecível ou um domínio funcional, tal como, um domínio de ligação do DNA que ativa a transcrição, por exemplo, pela ligação a uma região específica do promotor do DNA, um domínio de ativação, ou um domínio para interações proteína - proteína.

Produção de Plantas Transgênicas Modificação de Traços Os polinucleotídeos da invenção são empregados favoravelmente para produzir plantas transgênicas com vários traços, ou características, que foram modificadas de uma maneira desejável, por exemplo, para melhorar as características da semente de uma planta. Por exemplo, a alteração de níveis da expressão ou os padrões (por exemplo,, padrões de expressão espaciais ou temporais) de um ou mais dos fatores de transcrição (ou de homólogos do fator de transcrição) da invenção, em comparação aos níveis da mesma proteína encontrada em uma planta do tipo selvagem, podem ser usados para modificar traços de uma planta. Um exemplo ilustrativo da modificação do traço, características melhoradas, pela alteração dos níveis da expressão de um fator de transcrição particular ê descrito em seguida nos exemplos e na listagem de seqüências.

Arabidopsis como um modelo de sistema Arabidopsis thaliana é o objeto da atenção rapidamente crescente como um modelo para genética e metabolismo nas plantas. Arabidopsis tem um genoma pequeno, e os estudos bem documentados estão disponíveis. É fácil para crescer em números grandes e os mutantes que definem mecanismos geneticamente controlados importantes estão disponíveis, ou podem prontamente ser obtidos. Os vários métodos para introduzir e expressar genes homólogos isolados estão disponíveis {veja Koncz et al., editores, Methods in Arabidopsis Research (1992) World Scientific, New Jersey NJ, no "prefácio"). Por causa de seu tamanho pequeno,· ciclo de vida curto, autogamia obrigatória e fertilidade elevada, a Arabidopsis ê também um organismo de escolha para isolamento de mutantes e estudos em vias morfogenéticas e de desenvolvimento, e controle destas vias pelos fatores de transcrição (Koncz (1992) supra, p. 72) .

Um número de estudos que introduzem fatores de transcrição na A. thaliana demonstrou a utilidade desta planta para compreender os mecanismos de regulação do gene e da alteração do traço nas plantas (veja, por exemplo, fatores (Koncz (1992) supra, e patente U.S. número 6.417.428).

Genes de Arabidopsis nas plantas transgênicas A expressão dos genes que codificam fatores de transcrição, modificam a expressão de genes, de polinucleotídeos, e de proteínas endógenas são bem conhecidos na técnica, Além disso, as plantas transgênicas que compreendem os polinucleotídeos isolados que codificam fatores de transcrição podem também modificar a expressão de genes, de polinucleotídeos, e de proteínas endógenas. Os exemplos incluem Peng et al. (1997) et al. Genes and Development 11: 3194 - 3205, e Peng et al. (1999) Nature 400*. 256 - 261, Além disso, muitos outros demonstraram que um fator de transcrição de Arabidopsis expressado em uma espécie de planta exógena elicia a mesma ou uma resposta fenotípica muito similar. Veja, por exemplo, Fu et al. (2001) Plant Cell 13: 1791 - 1802; Nandi et al. (2000) Curr. Biol. 10: 215 - 218; Coupland (1995) Nature 377: 482 - 483; e Weigel e Nilsson (1995) Nature 377: 482 - 500. Genes homólogos introduzidos em plantas transgênicas Os genes homólogos que podem ser derivados de qualquer planta, ou de qualquer fonte se natural, sintético, semi -sintética ou recombinante, e que compartilhe significativa identidade ou similaridade de sequência àquelas fornecidas pela presente invenção, podem ser introduzidos em plantas, por exemplo, plantas de colheita, para conferir traços desejáveis ou melhorados. Conseqüentemente, as plantas transgênicas podem ser produzidas de modo a compreender um vetor de expressão recombinante ou um cassete com um promotor operavelmente ligado a um ou mais sequências homólogas às seqüências presentemente descritas. 0 promotor pode ser, por exemplo, um promotor de planta ou viral. A invenção fornece assim métodos para preparar plantas transginicas, e traços modificados de planta. Estes métodos incluem introduzir em uma planta um vetor de expressão recombinante ou um cassete que compreendem um promotor funcional operavelmente ligado a uma ou mais sequências homólogas às seqüências presentemente descritas. As plantas e os kits para produzir estas plantas que resultam da aplicação destes métodos são abrangidos também pela presente invenção.

Fatores de transcrição de interesse para a modificação de traços da planta Atualmente, a existência de uma série de grupos de maturidade para latitudes diferentes representa uma barreira principal à introdução de traços novos valiosos. Qualquer traço (por exemplo, tolerância ao estresse abíótico ou biomassa aumentada) tem que ser produzido em cada um dos diferentes grupos de maturidade separadamente, um exercício trabalhoso e caro, A disponibilidade de linhagem única, que poderia crescer em qualquer latitude, conseqüentemente aumentaria extremamente o potencial para introduzir traços novos às espécies de colheita, tais como, o grão de soja e o algodão.

Para os efeitos específicos, os traços e as utilidades conferidas âs plantas, um ou mais genes do fator de transcrição da presente invenção podem ser usados para aumentar ou diminuir, ou melhore ou se mostrar deletério a um dado traço. Por exemplo, silenciando um gene do fator de transcri-ção que ocorra naturalmente em uma planta, ou suprimindo o gene (com, por exemplo, supressão antisenso), pode causar tolerância diminuída a um estresse osmõtico relativo a plantas não transformadas ou do tipo selvagem. Pela superexpressão deste gene, a planta pode experimentar tolerância aumentada ao mesmo estresse. Mais de um gene do fator de transcrição pode ser introduzido em uma planta, transformando a planta com um ou mais vetores que compreendem dois ou mais fatores de transcrição, ou pela produção, seletiva de plantas para render cruzamentos híbridos que compreendem mais de um fator de transcrição introduzido.

Genes, traços e utilitários que afetam as características das plantas Os 'fatores de transcrição da planta podem modular a expressão do gene, e por sua vez, ser modulado pela experiência ambiental de uma planta. As alterações significativas no ambiente de uma planta resultam invariavelmente em uma mudança no padrão da expressão do gene do fator de transcrição da planta. Os padrões de expressão do fator de transcrição alterados resultam geralmente em mudanças fenotlpicas na planta, 0 (s) produto(s) do gene do fator de transcrição em plantas transgênicas desse modo difere(m) em quantidades ou proporções daquela encontrada nas plantas do tipo selvagem ou não transformadas, e aqueles fatores de transcrição representam provavelmente os polipeptídeos que são usados para alterar a resposta à mudança ambiental. Por meio de exemplo, é bem aceito na técnica que os métodos analíticos baseados em padrões de expressão alterados podem ser usados para selecionar mudanças fenotípicas em uma planta muito mais eficazmente do que pode ser conseguido usando métodos tradicionais. I. Bíomassa aumentada.

As plantas que superexpressam nove distintamente relacionados fatores de transcrição AT-hook da invenção, incluindo seqüências de diversas espécies de monocot i1edônea s e dicotiledôneas, tais como, os polipeptídeos de Arabidopsis thaliana G1073, G1067, G1667, G2153, e G2156, G2157, polipeptídeos de Oryza sativa G3399, G3400, G3401, G3407, G3556, e polipeptídeos de Glycine max G3456, G3459 e G3460, se tornaram maiores do que plantas de controle ou do tipo selvagem, e geralmente produziram folhas mais largas do que plantas de controle ou do tipo selvagem. Para algumas plantas ornamentais, a habilidade de fornecer variedades maiores com estes genes ou seus equivãlogos pode ser altamente desejável. Mais sígnifícativamente, a espécie de colheita que superexpresse estes genes de espécies diversas produziría também cultivares maiores, e assim rendimentos mais elevados, particularmente, naquelas plantas cuja porção vegetativa da planta ê comestível (por exemplo, alface, acelga, etc.). Isto tem sido observado jã em Arabidopsis e tomateiros. Os tomateiros que superexpressam os polipept ídeos da A. thaliana G2153 e G2157 foram descobertos ser significativamente maiores do que tomateiros de controle do tipo selvagem. Numerosas linhagens de Arabidopsis que superexpressam G3399, G3400, G3401, G3407, ou G3556, que são genes do arroz, e G3456, G3459 ou G3460, que são genes de soja, desenvolvem rosetas e folhas significativamente maiores . do que os controles de Arabidopsis do tipo selvagem. II. Tolerância aumentada ao estresse abiótico. A superexpressão de muitos dos fatores de transcrição no clade G1Q73 de polipeptídeos do fator de transcrição confere tolerância aumentada ao estresse quando as sequências são superexpressas nas plantas. A biomassa aumentada observada em muitas destas plantas parece ser relacionado ao mecanismo particular da tolerância do estresse exibido por estes genes. A decisão para que um órgão lateral continue o crescimento e a expansão versus entrada tardia em fases de desenvolvimento (cessação e senescência do crescimento) ê controlada geneticamente e hormonalmente, incluindo a regulação em um ponto de verificação do tamanho do órgão (por exemplo, Mizukami (2001) Curr Opinion Plant Biol, 4; 533 - 39; Mizukami and Fisher (2000) Proc. Natl, Acad. Sei. USA 97; 942 - 947; Hu et al. 2003 Plant CelI 15; 1591). 0 tamanho do órgão é controlado pela competência meristemãtica de células do órgão, com a competência meristemãtica aumentada conduzindo ao tamanho aumentado do órgão (em ambos, folhas e caules). Os hormônios da planta podem impactar o tamanho do órgão da planta, com, por exemplo, superexpressão da via de etíleno que conduz ao tamanho reduzido do órgão. Existem também sugestões que a auxina possui um papel decisivo no tamanho do órgão. As respostas ao estresse podem impactar níveis do hormônio em tecidos de planta, incluindo ABA e níveis de etíleno, desse modo no modificando a competência meristemãtica e o tamanho final do órgão. Assim, a superexpressão de genes HRC relacionados ao G1073 altera as entradas ambientais (por exemplo, estresse) ao ponto de verificação do tamanho do órgão, assim realçando o tamanho do órgão sob condições de crescimento típicas.

Devido à exposição freqüente aos estresses sob condições de crescimento de planta típicas, o tamanho máximo geneticamente programado do órgão não é conseguido frequentemente. É bem apreciado que o tamanho aumentado do órgão da folha pode resultar no rendimento de semente aumentada, com a captação da energia e a atividade da fonte realçadas. Assim, uma estratégia principal para a otimização do rendimento ê alterar as características do sensor que integram entradas externas do estresse ambiental a competência meristemãtica e controle do tamanho do órgão. Os genes HRC que são o assunto da presente invenção representam um componente deste mecanismo de controle. A expressão aumentada de genes HRC conduz à sensibilidade diminuída do sensor ambiental para o controle do tamanho do órgão aquelas entradas do estresse. Este aumento no ponto inicial do estresse para a competência meristemãtica diminuída resulta no rendimento aumentado vegetativo e semente sob condições de crescimento de planta típicas. As proteínas AT-hook são conhecidas por modular a expressão do gene através de interações com outras proteínas. Assim, o mecanismo de integração ambiental para o controle do tamanho do órgão ligada por proteínas HRC que terão componentes adicionais cuja função será reconhecida pela habilidade das proteínas codificadas para participar na regulação dos conjuntos de gene que são regulados por proteínas HRC. A identificação de componentes adicionais da integração pode ser conseguida identificando outros fatores de transcrição que ligam às regiões regulatórias â montante, detectando as proteínas que interagem diretamente com as proteínas HRC. A. Respostas às concentrações elevadas de açúcar: detecção de açúcar.

Além do seu papel importante como uma fonte de energia e um componente estrutural da célula da planta, os açucares são moléculas regulatórias centrais que controlam diversos aspectos da fisiologia, metabolismo e desenvolvimento da planta (Hsieh et al. (1998) Proc. Natl. Acad. Sei. EUA 95: 13965 - 13970). Pensa-se que este controle ê conseguido pela regulação da expressão do gene e, em plantas superiores, os açúcares têm mostrado repressar ou ativar os genes da planta envolvidos em muitos processos essenciais, tais como, a fotossíntese, o metabolismo do glioxílato, a respiração, a síntese e a degradação do amido e da sacarose, resposta ao patógeno, resposta a ferimento, regulamento do ciclo da célula, pigmentação, florescência e senescência. Os mecanismos pelos quais os açúcares controlam a expressão do gene não são compreendidos.

Diversos mutantes de detecção de açúcar se tornaram alêlicos ao ABA e aos mutantes de etileno. 0 ABA ê encontrado em todos os organismos fotossintéticos e agem como um .regulador chave da transpiração, das respostas ao estresse, da embriogênese, e da germinação da semente. A maioria de efeitos do ABA estão relacionados a ação do composto como um sinal da disponibilidade diminuída da água, por meio do qual provoca uma redução na perda de água, retarda o crescimento, e medeia respostas adaptáveis. No entanto, o ABA influencia também o crescimento e o desenvolvimento de planta através das interações com outros fitohormônios. Os estudos fisiológicos e moleculares indicam que o milho e Arabidopsis têm vias quase idênticas no que diz respeito a transdução do sinal e biosíntese de ABA. Para uma revisão adicional, veja Finkelstein e Rock (2002) "Abscisic acid biosynthesis and response", in The Arabidopsis Book, Editors: Somerville e Meyerowitz (American Society of Plant Biologists, Roekvílle, MD).

Assim, G1067, G2153, G2156, G2789, G3401, G3406, G3456, e os fatores de transcrição relacionados são envolvidos provavelmente na sinalização do hormônio baseado no açúcar da sacarose que detecta o fenótipo de linhagens transgênicas superexpressantes. Por outro lado, o tratamento de sacarose usado nestes experimentos (9,5 % p/v) poderia também ser um estresse osmôtico, Conseqüentemente, poder-se-ia interpretar estes dados como uma indicação que estas linhagens transgênicas são mais tolerantes ao estresse osmôtico. No entanto, sabe-se bem que as respostas da planta â ΑΒΆ, estresse osmôtico e outros podem ser ligadas, e estes tratamentos diferentes podem mesmo agir de uma maneira sinergística para aumentar o grau de uma resposta. Por exemplo, Xiong, Ishitani, and Zhu ((1999) Plant Physiol. 119; 205 - 212) mostraram que os estudos genéticos e moleculares podem ser usados para mostrar a interação extensiva entre o estresse osmôtico, o estresse de temperatura, e as respostas do ABA nas plantas. Estes investigadores analisaram a expressão de RD29A-LUC em resposta aos vários regimes de tratamento em Arabidopsis. 0 promotor de RD29A contém o elemento de resposta a ABA e de resposta a desidratação - denominado também C - repetido -e pode ser ativado pelo estresse osmôtico, pela temperatura baixa, ou pelo tratamento de ABA; a transcrição do gene de RD29A em resposta ao estresse osmôtico e ao frio ê mediada por vias dependentes de ABA e independentes de ABA (Xiong, Ishitani, e Zhu (1999) supra) . LUC se refere ã sequência codificante de luciferase de vaga-lume, que, neste caso, foi dirigida pelo promotor de resposta ao estresse RD29A. Os resultados revelaram interações positivas e negativas, dependendo da natureza e da duração dos tratamentos. Descobriu-se que o estresse de temperatura baixa prejudica a sinalização osmótica, mas modera o estresse de calor, realça fortemente a indução do estresse osmótico, assim agindo sinergisticamente com as vias de sinalização osmótica. Neste estudo, os autores relataram que o estresse osmótico e ABA podem agir sinergisticamente mostrando que os tratamentos induzem simultaneamente o transgene e a expressão endógena do gene. Resultados similares foram relatados por Bostock e Quatrano ((1992) Plant Physiol. 98: 1356 - 1363) , que encontrou que o estresse osmótico e ABA agem sinergisticamente e induzem a expressão do gene do Em do milho. Ishitani et al (1997) Plant Ce11 9: 1935 - 1949) isolaram um grupo de mutações de gene-simples de Arabidopsis que conferem respostas realçadas em ambos o estresse osmótico e ΑΒΆ. A natureza da recuperação destes mutantes do estresse osmótico e do tratamento de ABA sugeriu ■ que embora as vias de sinalização separadas existissem para o estresse osmótico e ABA, as vias compartilham um número de componentes; estes componentes comuns podem mediar interações sinergísticas entre o estresse osmótico e ABA. Assim, contrário à opinião tida anteriormente que vias de sinalização do estresse dependente de ABA e independente de ABA agem de forma paralela, nossos dados revelam que essas vias se comunicam e convergem para ativar a expressão do gene do estresse.

Porque os açúcares são moléculas de sinalização importantes, a habilidade para controlar ou a concentração de um açúcar sinal de sinalização ou como a planta percebe ou responde a um açúcar de sinalização poderia ser usado para controlar o desenvolvimento, físíologia ou metabolismo da planta. Por exemplo, o fluxo de sacarose (um açúcar dissacarídeo usado para transportar sistematicamente o carbono ' e a energia na maioria das plantas) demonstrou afetar a expressão do gene e alterar o armazenamento da acumulação de compostos nas sementes. A manipulação da vía de sinalização de sacarose nas sementes pode consequentemente fazer com que as sementes tenham mais proteína, óleo ou carboidrato, dependendo do tipo de manipulação. Similarmente, nos tubérculos, a sacarose ê convertida a amido que ê usado como uma fonte de energia. Pensa-se as vias de sinalização de açúcar podem parcialmente determinar os niveís de amido sintetizado nos tubérculos. A manipulação da sinalização de açúcar nos tubérculos podia conduzir aos tubérculos com um conteúdo de amido mais alto.

Assim, os genes presentemente descritos do fator de transcrição que manipulam a via de transdução do sinal do açúcar, incluindo, por exemplo, G1073 e G2156, junto com seus equivãlogos, podem conduzir à expressão alterada do gene para produzir plantas com traços desejáveis. Em particular, a manipulação de vias de transdução do sinal de açúcar podia ser usada para alterar as relações fonte -dissípador nas sementes, nos tubérculos, nas raízes e nos outros órgãos de armazenamento que conduzem ao aumento no rendimento. B. Respostas aos estresses osmõticos (sal elevado, congelamento, desidratação e seca) As' plantas estão sujeitas a uma variedade de desafios ambientais. Diversos destes, incluindo estresse de sal, estresse osmótico geral, estresse da seca e estresse de congelamento, têm a habilidade de ímpactar a planta inteira e a disponibilidade celular da água. Não surpreendentemente, então, as respostas da planta a esta coleção dos estresses são relacionadas. Em uma revisão recente, Zhu destaca que "a maioria de estudos em sinalização do estresse da água focalizaram no estresse de sal primeiramente porque as respostas da planta ao sal e à seca são proximamente relacionadas e os mecanismos se sobrepõem" (Zhu (2002) Ann. Rev. Plant Biol. 53: 247 - 273). Muitos exemplos de respostas similares (isto ê, vias genéticas a este conjunto de estresses) foram documentados. Por exemplo, os fatores de transcrição de CBF foram mostrados à resistência da condição ao sal, congelamento e seca (Kasuga et al. (1999) Nature Bíotech. 17: 287 - 291). 0 gene de Arabidopsis rd29B ê induzido em resposta a ambos os estresses de sal e de desidratação, um processo que seja mediado pela maior parte com um processo de transdução do sinal de ABA (Uno et al. (2000) Proc. Natl. Acad. Sei. EUA 97: 11632 - 11637), tendo por resultado a atividade alterada dos fatores de transcrição que ligam a um elemento à montante dentro do promotor rd29B. Na Mesembryantbemum crystallínum (planta de gelo), Patharker e Cushman mostraram que uma proteína quinase dependente de cálcio (McCDPKl) ê induzida pela exposição aos estresses da seca e do sal (Patharker e Cushman (2000) Plant J. 24: 679 - 691) . 0 estresse induzido por quinase mostrou-se também fosforilar um fator de transcrição, alterando presumivelmente sua atividade, embora os níveis do transcrito do fator de transcrição alvo não fossem alterados em resposta ao sal ou ao estresse da seca. Similarmente, Saijo et al. demonstraram que uma proteína quinase dependente de calmodulina de arroz induzida por sal/seca (OsCDPK7) conferiu tolerância aumentada ao sal e seca para arroz quando superexpressada (Saijo et al. (2000) Plant J. 23; 319 - 327). A desidratação invoca estratégias similares de sobrevivência nas plantas como o estresse de congelamento (Yelenosky (1989) Plant Physiol 89: 444 - 451) e o estresse da seca induz a tolerância ao congelamento (Siminovitch et al. (1982) Plant Physiol 69: 250 - 255? e Guy et al. (1992) Planta 188: 265 - 270). Além da indução de proteínas de aclimação ao frio, as estratégias que reservam as plantas a sobreviver em condições baixas de água podem incluir a área de superfície reduzida, ou a produção de óleo ou cera na superfície.

Consequentemente, um hábil na técnica esperaria que algumas . vias envolvidas na resistência a um destes estresses, e por isso regulados por um fator de transcrição individual, estarão envolvidos também na resistência a outros destes estresses, regulados pelos mesmos fatores de transcrição ou homólogos. Naturalmente, as vias de resistência totais são relacionadas, não idênticas, e conseqüentemente nem todos os fatores de transcrição que controlam a resistência a um estresse controlarão a resistência aos outros estresses. Contudo, se um fator de transcrição condicionasse a resistência a um destes estresses, seria aparente a um hábil na técnica testar a resistência a estes estresses relacionados.

Assim, modificar a expressão de membros do clade G1Q73 pode ser usado para aumentar a tolerância de uma planta às baixas condições de água e fornecer os benefícios de sobrevivência melhorada, rendimento aumentado e uma faixa geográfica e temporal prolongada de plantio. As plantas que superexpressam G3399, G3400 e G346Q demonstram ser mais tolerantes à desidratação em ensaios de dessecação baseados em placa do que plantas de controle do tipo selvagem (exemplo VII) . As linhagens das plantas que superexpressam Arabidopsis G1Q73, G1067, G2153, G3399 de arroz, G3400, G3401, e G3460 de soja demonstraram ser significativamente mais tolerantes â seca do que plantas de controle do tipo selvagem em ensaios baseados em solo, confirmando os resultados baseados em placa.

Um número de seqüências do clade G1073 (por exemplo, G1G73, G1069, G2153, G2156, G2789, G3401 e G3460) demonstrou ter um fenôtipo alterado de tolerância ao estresse osmótico em virtude da germinação melhorada das plantas que superexpressam estas seqüências em meios contendo altos níveis de açúcar. A maioria destes genes demonstrou também conferir tolerância aumentada ao estresse de sal ou dessecação para as plantas superexpressantes (todas demonstraram aumentar a tolerância ao estresse osmõtico em Arabidopsis, e G2153 demonstrou fazer o mesmo em tomateiros maduros). Assim, a modificação da expressão destes e de outros genes do fator de transcrição estruturalmente relacionados descritos pode ser usada para aumentar a taxa ou o crescimento da germinação sob as condições osmõticas adversas, que poderiam impactar a sobrevivência e o rendimento das sementes e das plantas. Os estresses osmõticas podem ser regulados pelos mecanismos moleculares específicos de controle que incluem os genes que controlam movimentos da água e íon, proteínas induzidas pelo estresse funcionais e estruturais, percepção do sinal e transdução, e pela captação de radical livre, e por muitos outros (Wang et al. (2001) Acta Hort. (ISHS) 560; 285 - 292). Instigadores do estresse osmõtico incluem congelamento, seca e salinidade elevada, cada um deles é discutido mais detalhadamente abaixo.

Em muitas maneiras, congelamento, sal elevado e seca têm efeitos similares nas plantas, não o menos importante desses é a indução de polipeptídeos comuns que respondem a estes diferentes estresses. Por exemplo, o congelamento é similar 'ao déficit de agua em que o congelamento reduz a quantidade de agua disponível a uma planta. A exposição às temperaturas de congelamento pode conduzir â desidratação celular enquanto a água deixa células e forma cristais de gelo em espaços intercelulares (Buchanan (2000) supra) . Como com a concentração elevada de sal e congelamento, os problemas para as plantas causadas pela baixa disponibilidade de água. incluem os estresses mecânicos causados pela retirada da água celular. Assim, a incorporação dos fatores de transcrição que modificam a resposta de uma planta ao estresse osmõtico, por exemplo, uma colheita ou uma planta ornamental, pode ser útil em reduzir os danos ou a perda. Os efeitos específicos causados pelo congelamento, sal elevado e seca são detalhados abaixo.

Os genes da listagem de seqüências, incluindo, por exemplo, G1073, G2153, G2156, G3401, G3456, G3459, e G3460, que fornecem a tolerância ao sal podem ser usados para projetar as colheitas e as árvores tolerantes ao sal que podem florescer nos solos com elevados índices salinos ou sob condições de seca. Em particular, tolerância ao sal aumentada durante o estágio da germinação de uma planta realça a sobrevivência e o rendimento. Os genes presentemente descritos do fator de transcrição que fornecem tolerância ao sal aumentada durante a germinação, o estágio de árvore nova, e durante todo um ciclo de vida de planta, encontrariam o valor particular para sobreviver e render em áreas onde uma colheita particular não prosperaria normalmente. C. Respostas ao estresse de frio A tolerância realçada a friagem pode estender a faixa de crescimento eficaz de colheita de espécies sensíveis ã friagem por permitir o plantio mais cedo ou a colheita mais tarde. A tolerância melhorada a friagem pode ser conferida pela expressão aumentada do glicerol- 3- fosfato acetiltransferase nos cloroplastos (veja, por exemplo, Wolter et al. (1992) et al. EMBO J. 4685 - 4692, e Murata et al. (1992) Fature 356: 710 - 713). A tolerância a friagem poderia também servir como um modelo para compreender como as plantas se adaptam ao déficit de água. Ambos os estresses de água e friagem compartilham vias similares de transdução do sinal e mecanismos de tolerância/adaptação. Por exemplo, a aclimação às temperaturas de friagem pode ser induzida pelo estresse da água ou o tratamento com ABA. Genes induzidos pela temperatura baixa inclui estresse hídrico (dehydrins) (ou proteínas de LEA). 0 estresse hídrico é induzido também pela salinidade, ABA, estresse de água, e durante os estágios tardios da embriogênese.

Um outro grande impacto da friagem ocorre durante o armazenamento pós-colheita. Por exemplo, algumas frutas e vegetais não são bem armazenadas em temperaturas baixas (por exemplo, as bananas, os abacates, os melões, e os tomates). 0 processo de amadurecimento normal do tomate ê danificado se for exposto às temperaturas frias. Os genes do fator de transcrição que conferem resistência às temperaturas de friagem desse modo realçam a tolerância durante o armazenamento pós-colheíta. Diversos dos genes presentemente descritos do fator de transcrição demonstraram conferir germinação e crescimento melhores em condições frias. Por exemplo, a germinação melhorada nas condições frias vistas com G1073, G2153 G2156, G3400, G3401, G3456, G3459, e G3460 indicam um papel no regulamento de respostas ao frio por estes genes e por outros membros do clade G1073 de polipeptídeos do fator de transcrição. Estes genes assim podem ser superexpressos ou de outro modo projetados para manipular a resposta ao estresse de temperatura baixa. Os genes que permitiríam a germinação e o vigor da árvore nova no frio teriam a utilidade altamente significativa em propiciar que as sementes possam ser plantadas mais cedo na estação com uma taxa elevada de sobrevivência. Os genes do fator de transcrição que conferem melhor sobrevivência em climas mais frios permitem que um deslocamento do cultivo do tempo de plantio na primavera e estender a estação de crescimento ainda no outono para um rendimento de colheita mais elevado. Ά germinação das sementes e da sobrevivência em temperaturas significativamente abaixo desta da média da temperatura requerida para a germinação das sementes e da sobrevivência de plantas não transformadas aumentaria a escala potencial de uma planta de colheita nas regiões em que de outra maneira não prosperia.

Biomassa aumentada A superexpressão de G1073 e de um número de outros membros do clade G1073, incluindo G1667, G2153, G2156, G3399, G3400, G3401, G3407, G3456, G3459, G3460, e G3556, mostrou produzir plantas que são maiores do que o controle, particularmente em estágios mais tardios do crescimento. Para algumas plantas ornamentais, a habilidade de fornecer variedades maiores com estes genes ou seus equivãlogos pode ser altamente desejável. Para muitas plantas, incluindo árvores que carregam frutos, árvores que são usadas para a produção da madeira, ou árvores e arbustos que servem como vista ou proteção ao vento, a estatura aumentada fornece benefícios melhorados nas formas de um rendimento maior ou de proteção melhorada. A espécie de colheita pode também produzir rendimentos mais elevados em cultivares maiores, particularmente aquelas em que a porção vegetativa da planta ê comestível.

Florescência atrasada Em um número bastante grande de espécies, por exemplo, colheitas de raiz, onde as partes vegetativa das plantas constituem a colheita e os tecidos reprodutivos são rejeitados, ê vantajoso identificar e incorporar genes do fator de transcrição que atrasam ou impedem a florescência a fim de impedir os recursos que estão sendo desviados no desenvolvimento reprodutivo. Por exemplo, a superexpressão de G1073, G1067, G1667, G2153, G2156, G3399, G3401, G3406, G3459, G3460 ou G3556 atrasam o tempo de florescência em plantas transgênicas. 0 desenvolvimento vegetativo estendendo com os genes presentemente descritos do fator de transcrição podiam assim trazer aumentos aproximadamente grandes nos rendimentos. A prevenção de florescência pode ajudar a maximizar os rendimentos vegetativos e impedir o escape do pólen geneticamente modificado do organismo (GMO).

Sumário de características alteradas da planta. Os membros do clade G1Q73 dos polipeptídeos do fator de transcrição, que derivam de uma larga variedade de plantas, mostraram em experiências de laboratório e de campo para conferir tamanho aumentado, tolerância ao estresse abiótico e fenótipos de florescência atrasada nas plantas que superexpressam estas seqüências. A invenção fornece também os polinucleotídeos que codificam polipeptídeos do clade G1073, fragmentos dos mesmos, domínios conservados dos mesmos, parãlogos, ortólogos, equiválogos, e fragmentos dos mesmos. Estas seqüências são listadas na listagem de seqüências, e devido ao grau elevado de similaridade estrutural às seqüências da invenção, espera-se que muitas das seqüências para que os dados não foram gerados funcionarão também para aumentar a biomassa da planta e/ou a tolerância ao estresse abiótico. A invenção abrange também os complementos dos polinucleotídeos. Os polinucleotídeos são também úteis para seleção de bibliotecas das moléculas ou dos compostos para a ligação específica e para identificar outras seqüências do membro do clade G1073 pela identificação dos ortólogos que têm seqüências similares, particularmente nos domínios conservados.

Antisenso e Co-supressão Além da expressão dos ácidos nucleicos da invenção como recolocação de genes ou ácidos nucleicos de modificação do fenótipo da planta, os ácidos nucleicos são também úteis para a supressão senso e anti-senso da expressão, por exemplo, para subregular a expressão de um ácido nucleico da invenção, por exemplo, como um mecanismo adicional para o fenótipo de modulação da planta. Isto é, os ácidos nucleicos da invenção, ou as subseqüências ou seqüências antisenso dos mesmos, podem ser usados para obstruir a expressão de ácidos nucleicos homólogos naturais. Uma variedade de tecnologias senso e antísenso é conhecida na técnica, por exemplo, como determinado em Lichtenstein e Nellen (1997) Antisense Technology: A Practical Approach IRL Press at Oxford University Press, Oxford, U.K. A regulação antisenso é descrita também em Crowley .et al. (1985) Cell 43: 633 - 641,- Rosenberg et al. (1985) Nature 313: 703 - 706; Preiss et al. (1985) Nature 313: 27 - 32? Melton (1985) Proc. Natl. Acad. Sei. USA 82: 144 - 148; Izant e Weintraub (1985) Science 229: 345 - 352; e Kim e Wold (1985) Cell 42: 129 - 138. Os métodos adicionais para a regulação antisenso são conhecidos na técnica. A regulação antisenso foi usada para reduzir ou inibir a expressão de genes da planta, por exemplo na publicação da patente européia no. 271988. O RNA antisenso pode ser usado para reduzir a expressão do gene para produzir uma mudança fenotípica visível ou bioquímica em uma planta (Smith et al. (1988) Nature 334: 724 - 726?

Smith et al. (1990) Plant Mol. Bíol. 14: 369 - 379). Em geral, as seqüências senso ou antisenso são introduzidas em uma célula, onde sejam amplificadas opcionalmente, por exemplo, pela transcrição. Tais seqüências incluem seqüências simples de oligonucleotídeos e seqüências catalíticas, tais como, ribozimas.

Por exemplo, uma redução ou uma eliminação da expressão (isto ê, um "silenciamento" (do inglês: knockout) ) de um polipeptídeo homólogo do fator de transcrição ou do fator de transcrição em uma planta transgênica, por exemplo, para modificar um traço da planta, podem ser obtidos introduzindo uma construção antisenso que corresponde ao polipeptídeo de interesse como um cDNA. Para a supressão antisenso, o fator de transcrição ou o cDNA homólogo são arranjados na orientação reversa (com relação à sequência codificante) relativo à sequência do promotor no vetor da expressão. A sequência introduzida não necessita ser o cDNA ou o gene completo em comprimento, e não necessita ser idêntica ao cDNA ou ao gene encontrado no tipo da planta a ser transformada. Tipicamente, a seqüêncía antisenso necessita somente ser capaz de hibridizar com o gene alvo ou RNA de interesse. Assim, onde a seqüência introduzida ê de um comprimento mais curto, um grau mais elevado de homologia à seqüência endógena do fator de transcrição será requerido para a supressão eficaz antisenso. Quando as seqüências antisenso de vários comprimentos puderem ser utilizadas, preferivelmente, a seqüência introduzida do antisenso no vetor será ao menos 30 nucleotídeos em comprimento, e tanto a supressão melhorada do antisenso será tipicamente observada quanto o comprimento de a seqüência antisenso aumentar. Preferivelmente, o comprimento da seqüência do antisenso no vetor será maior de 100 nucleotideos. A transcrição de uma construção do antisenso como resultados descritos na produção das moléculas do RNA que são o complemento reverso de moléculas do mRNA transcreveu do gene endógeno do fator de transcrição na célula da planta. A supressão da expressão endógena do gene do fator de transcrição pode também ser conseguida usando uma ribozíma, As ribozimas são moléculas de RNA que possuem atividade altamente específica de endoribonuclease. A produção e o uso das ribozimas são descritos na patente U.S. no. 4.987.071 e patente U.S. no. 5.543.508. As sequências de ribozíma sintéticas incluindo RNAs antisenso podem ser usadas para conferir atividade de divagem de RNA no RNA antisenso, tal que moléculas de mRNA endógenas que híbridizam com o RNA antisenso são clivados, que conduz por sua vez a uma inibição realçada do antisenso da expressão endógena do gene.

Os vetores em que o RNA codificado por um cDNA homólogo do fator de transcrição ou do fator de transcrição são superexpressados podem também ser usados para obter a co- supressão de um gene endógeno correspondente, por exemplo, na maneira descrita na patente U.S. no. 5.231.020 a Jorgensen, Tal co- supressão (denominada também supressão senso) não requer que o cDNA inteiro do fator de transcrição esteja introduzido nas células da planta, nem requer que a seqüência introduzida seja exatamente idêntica ao gene.endõgeno do fator de transcrição de interesse. No entanto, tanto a supressão antisenso, a eficiência supressiva será realçada quanto a especificidade de hibridização for aumentada, por exemplo, tanto a seqüência introduzida ê alongada, e/ou quanto a similaridade da seqüência entre a seqüência introduzida e o gene endõgenos do fator de transcrição é aumentada.

Os vetores que expressam uma forma não traduzível do mRNA do fator de transcrição, por exemplo, sequências que compreendem um ou mais códons de parada, ou mutação nonsense, podem também ser usados para suprimir a expressão de um fator de transcrição endõgeno, desse modo reduzindo ou eliminando sua atividade e modificando um ou mais traços. Os métodos para produzir tais construções são descritos na patente U.S. no. 5.583.021. Preferivelmente, tais construções são feitas introduzindo um códon de parada prematuro no gene do fator de transcrição. Alternativamente, um traço da planta pode ser modificado pelo silenciamento do gene usando o RNA de fita dupla (Sharp (1999) Genes and Development 13: 139 - 141), Um outro método para abolir a expressão de um gene ê pela mutagênese de inserção usando o T-DNA de Agrohacterium tumefaciens. Apôs ter gerado os mutantes de inserção, os mutantes podem ser selecionados para identificar aqueles que contêm a inserção em um gene homólogo do fator de transcrição ou do fator de transcrição. As plantas que contêm um único evento de inserção do transgene no gene desejado podem ser cruzadas para gerar plantas homozigotas para a mutação. Tais métodos são bem conhecidos àqueles com habilidade na técnica (veja, por exemplo, Koncz et al. (1992) Hethods in Arabidopsís Research, World Scientific Publishing Co. Pte. Ltd., River Edge NJ). A supressão da expressão endógena do gene do fator de transcrição pode também ser conseguida usando a interferência do RNA, ou o RNAi. RNAí é uma técnica de silenciamento de gene alvo põs-transcricional que usa o RNA de fita dupla (dsRNA) para incitar a degradação do RNA mensageiro (mRNA) que contêm a mesma sequência que o dsRNA (Constans, (2002) The Scientist 16: 36). Pequenos RNAs de interferência, ou os siRNAs são produzidos ao menos em duas etapas: uma ribonuclease endógena cliva um dsRNA mais longo em mais curto, 21 - 23 RNAs nucleotídeo de comprimento. Os segmentos de siRNA medeiam então a degradação do mRNA alvo (Zamore, (2001) Fature Struct. Biol., 8; 746 - 50), RNAi foi usado para a determinação da função do gene em uma maneira similar aos oligonucleotídeos do antisenso (Constans, (2002) The Scientíst 16: 36). Vetores de expressão que expressam continuamente siRNAs em células transfectadas estável e transientemente foram projetados para expressar o grampo de cabelo (do inglês: hairpin) pequeno RNAs (shRNAs), que foram processados in vivo em moléculas semelhantes a siRNAs capazes de realizar o silenciamento gene- específico (Brummelkamp et al., (2002) Science 296: 550 - 553, e Paddison, et al. (2002) Genes & Dev. 16: 948 - 958). O silenciamento de gene pós- transcricional pelo RNA de fita dupla é discutido em detalhes adicionais por Hammond et al. (2001) Fature Rev Gen 2: 110 - 119, Fíre et al. (1998) Nature 391: 806 - 811 e Timmons e Fire (1998) Nature 395: 854.

Alternativamente, um fenótipo da planta pode ser alterado eliminando um gene endógeno, tal como um homólogo do fator de transcrição ou do fator de transcrição, por exemplo, pela recombinação homóloga (Kempin et al. Nature 389 (1997) : 802 - 803) .

Um traço da planta pode também ser modificado usando o sistema de Cre - lox (por exemplo, como descrito em Pat. U.S. no. 5.658.772) . Um genoma de planta pode ser modificado para incluir o primeiro e o segundo sítio lox que são contatados então com uma recombinase Cre. Se os sítios lox estiverem na mesma orientação, a seqüência de intervenção do DNA entre os dois sítios ê excisado. Se os sítios lox estiverem na orientação oposta, a seqüência de intervenção ê invertida.

Os polínucleotídeos e os polipeptídeos desta invenção podem também ser expressados em uma planta na ausência de um cassete de expressão pela manipulação da atividade ou do nível de expressão do gene endógeno por outros meios, como, por exemplo, ectopicamente expressando um gene marcador da ativação do T-DNA (Ichikawa et al. (1397) Nature 390 698 -701; Kakimoto et al. (1996) Science 274: 982 - 385). Este método envolve a transformação de uma planta com um Tag do gene que contêm melhoradores transcricionais múltiplos e uma vez que o Tag tenha se inserido no genoma, a expressão de uma seqüência codificante fIanqueando o gene torna-se desregularizada. Em um outro exemplo, a maquinaria transcricional em uma planta pode ser modificada para aumentar níveis da transcrição de um polinucleotideo da invenção (veja, por exemplo, as publicações WO 96/06166 e WO 98/53057 do PCT que descrevem a modificação de especificidade de ligação de DNA de proteínas do dedo de zinco pela mudança de aminoãcidos particulares no motivo de ligação de DNA). A planta transgênica pode também incluir a maquinaria necessária para expressar ou alterar a atividade de um polipeptídeo codificado por um gene endógeno, por exemplo, alterando o estado de fosforilação do polipeptídeo para mantê-lo em um estado ativado.

As plantas transgênicas (ou as células da planta, ou explantes da planta, ou tecidos de planta) incorporando os polinueleotídeos da invenção e/ou expressando os polipeptídeos da invenção podem ser produzidos por uma variedade de técnicas bem estabelecidas como descritos acima. Depois da construção de um vetor, mais tipicamente de um cassete de expressão, incluindo um polinucleotídeo, por exemplo, codificando um fator de transcrição ou um homólogo do fator de transcrição, da invenção, técnicas padrões podem ser usadas para introduzir o polinucleotídeo em uma planta, em uma célula da planta, em uma planta explante ou em um tecido de planta de interesse. Opcionalmente, a célula da planta, o explante ou tecido pode ser regenerado para produzir uma planta transgênica. A planta pode ser qualquer planta superior, incluindo gimnospermas, plantas monocoti1edôneas e dicotiledôneas. Os protocolos apropriados estão disponíveis para Legumínosae (alfalfa, grão de soja, trevo, etc.), Umbelliferae (cenoura, aipo, pastínaca) , Cruciferae (repolho, rabanete, colza, brocolis, etc»), Curcurbitaceae (melões e pepino), Gramineae (trigo, milho, arroz, cevada, mileto, etc»), Solanaceae (batata, tomate, tabaco, pimentas, etc.), e várias outras colheitas. Veja os protocolos descritos em Ammirato et al., Editors, (1984) Handbook of Plant Cell Culture, Vol. 2 and 3., Crop Species, Macmillan Publ. Co., New York ΝΎ; Shimamoto et al. (1989) Nature 338: 274 - 276; Fromm et al. (1990) Bio/Techxiol. 8; 833 - 839; and Vasil et al. (1990) Bio/Techxiol. 8: 429 - 434.

A transformação e a regeneração de células de plantas monocotiledôneas e dicotiledôneas são agora rotineiras, e a seleção da técnica mais apropriada de transformação será determinada pelo técnico. Ά escolha do método variará com o tipo de planta a ser transformada; aqueles hábeis na técnica reconhecerão a adequabilidade de métodos particulares para dados tipos de plantas. Os métodos apropriados podem incluir, mas não ser limitados a: eletroporação de protoplastos da planta; transformação mediada por lipossomos; transformação mediada por polietileno glicol (PEG); transformação usando vírus; micro- injeção de células da planta; bombardeio do micro-tnicro- projéteis de células da planta; infiltração à vácuo; e transformação mediada por Άgrobacterium tumefadens. A transformação significa introduzir uma seqüência de rxucleotídeos em uma planta de forma a causar a expressão estável ou transiente da seqüência.

Os exemplos bem sucedidos da modificação de características da planta pela transformação com seqüências clonadas, que servem para ilustrar o presente conhecimento neste campo da tecnologia, e que são incorporadas aqui por referência, incluem: Patente U.S. Nos. 5,571,706; 5,677,175; 5,510,471; 5,750,386; 5,597,945; 5,589,615; 5,750,871; 5,268,526; 5,780,708; 5,538,880; 5,773,269; 5,736,369 e 5,610,042.

Depois da transformação, as plantas são selecionadas, preferivelmente, usando um marcador selecionãvel dominante incorporado no vetor da transformação. Tipicamente, tal marcador conferirá resistência â antibiótico ou à herbicida nas plantas transformadas, e a seleção dos transformantes pode ser realizada expondo as plantas às concentrações apropriadas do antibiótico ou do herbicida.

Depois que as plantas transformadas são selecionadas e crescidas à maturidade, aquelas plantas que mostram um traço modificado são identificadas. O traço modificado pode ser alguns daqueles traços descritos acima. Adicionalmente, para confirmar que o traço modificado é devido às mudanças em níveis da expressão ou a atividade do polipeptídeo ou do polinucleotídeo da invenção pode ser determinada analisando a expressão do mRNA usando Northern blot, RT- PCR ou microarranjos, ou expressão da proteína usando immunoblots ou Western blots ou ensaios de deslocamento de gel.

Sistemas Integrados para Determinar a Sequência Identidade Além de fornecer composições e métodos para melhorar traços da planta, a presente invenção pode ser um sistema integrado, um computador ou um meio passível de ser reconhecido por computador que compreenda um conjunto de instruções para determinar a identidade de uma ou mais seqüências em uma base de dados. Além disso, o conjunto de instruções pode ser usado para gerar ou identificar as seqüências que se encontram com todos os critérios especificados. Além disso, o conjunto de instrução pode ser usado associar ou ligar determinados benefícios funcionais, tais características melhoradas, com uma ou mais seqüências ídenti f i cadas.

Por exemplo, o conjunto de instruções pode incluir, por exemplo, uma comparação de sequência ou outro programa de alinhamento, por exemplo, um programa disponível como, por exemplo, a versão 10.0 do pacote de Wisconsin, tais como, BLAST, FASTA, PILEUP, FINDPATTERNS ou assemelhados (GCG, Madison, Wl) . As bases de dados públicas de seqüências, tais como, GenBank, EMBL, Swiss- Prot e PIR ou bases de dados de sequências privados, tal como, a base de dados de sequências PHYIOSEQ (Incyte Genomics, Wilmington, DE) podem ser procuradas. 0 alinhamento das seqüências para a comparação pode ser conduzido pelo algoritmo de homologia local de Smith e Waterman (1981) Adv. Appl. Math. 2; 482 - 489, pelo algoritmo de alinhamento de homologia de Needleman e Wunsch (1970) J. Mol. Biol. 48: 443 - 453, pela busca pelo método de similaridade de Pearson e Lipman (1988) Proc. Natl, Acad. Sei. EUA 85: 2444 - 2448, por implementações computarizadas destes algoritmos. Após o alinhamento, as comparações da sequência entre dois (ou mais) polinucleotídeos ou os polipeptideos são executados tipicamente comparando seqüências das duas seqüências sobre uma janela de comparação para identificar e comparar regiões locais de similaridade da seqüência. A janela de comparação pode ser um segmento ao menos de aproximadamente 20 posições contíguas, geralmente aproximadamente 50 a aproximadamente 200, mais geralmente aproximadamente 100 a aproximadamente 150 posições contíguas. Uma descrição do método é fornecida em Ausubel et al. (ao longo de 2000) supra) .

Uma variedade de métodos para determinar as relações das seqüências pode ser usada, incluindo alinhamento manual do e alinhamento e analise de sequências auxiliados por computador. Esta ultima abordagem ê uma abordagem preferida na presente invenção, devido a alta capacidade de processamento pelos métodos auxiliados por computador. Como notado acima, uma variedade de programas de computador para executar· o alinhamento da seqüência esta disponível, ou pode ser produzido por um com habilidade.

Um algoritmo de exemplo que ê apropriado para determinar a porcentagem da seqüência identidade e similaridade da seqüência ê o algoritmo BLAST, que ê descrito em Altschul et al. {1990} supra. O software para executar análises BLAST está disponível publicamente, por exemplo, através da National Library of Medicine's National Center for Biotechnology Information (ncbi.nlm.nih; veja na rede mundial de computadores (www) na página virtual da National Institutes of Health US government (gov)). Este algoritmo envolve primeiramente identificar pares de seqüências de alta contagem (HSPs) pela identificação de palavras curtas de comprimento W na seqüência em questão, que ou ' combine ou satisfaça alguma contagem de valor positivo T do ponto inicial quando alinhado com uma palavra do mesmo comprimento em uma seqüência da base de dados. T ê referido como o ponto inicial da contagem da palavra da vizinhança (Altschul et al. (1990, 1993) supra). Estes acertos iniciais da palavra da vizinhança agem como sementes para iniciar as buscas para encontrar um HSPs mais longo contido neles. Os acertos de palavra são estendidos então em ambos os sentidos ao longo de cada seqüência até uma contagem cumulativa do alinhamento poder ser aumentada. As contagens cumulativas são calculadas usando, para seqüênci.as de nucleotídeos, os parâmetros M (contagem prêmio para um par de resíduos combinados; sempre > 0) e N (contagem da penalidade para resíduos mal combinados; sempre < 0). Para seqüências de aminoãcidos, uma matriz de contagem ê usada para calcular a contagem cumulativa. A extensão dos acertos de palavras em cada sentido ê parada quando: a contagem cumulativa do alinhamento cai pela quantidade X de seu valor máximo conseguido; a contagem cumulativa vai a zero ou abaixo, devido â acumulação de um ou de mais alinhamentos de resíduos de contagem negativa; ou o fim de uma ou outra seqüência ê alcançado. Os parâmetros W, T, e X do algoritmo BLAST determinam a sensibilidade e a velocidade do alinhamento. O programa BLASTN (para seqüências de nucleotídeos) usa como padrões um comprimento de palavra (W) de 11, uma expectativa (E) de 10, uma interrupção de 100, M= 5, N= -4, e uma comparação de ambas as fitas. Para seqüências de aminoãcidos, o programa de BLASTP usa como padrões um comprimento de palavra (W) de 3, uma expectativa (E) de 10, e a matriz de contagem BLGSUM62 (veja Henikoff e Henikoff (1992) Proc. Natl. Acad. Sei, EUA 39; 10915 - 10919). A menos que de outra maneira indicada, da "identidade de sequência" se refere aqui a % da identidade de seqüência gerada de um tblastx usando a versão de NCBI do algoritmo nos ajustes padrões usando alinhamentos abertos com a filtro "off" (veja, por exemplo, NIH NLM NCBI, página virtual na nebi.nlm.nih).

Além do calculo da porcentagem de identidade da seqüência, o algoritmo BLAST executa também uma análise estatística da similaridade entre duas seqüências (veja, por exemplo, Karlin e Altschul (1993) Proc. Natl. Acad. Sei. EUA 90; 5873 - 5787). Uma medida da similaridade fornecida pelo algoritmo BLAST é a menor probabilidade da soma (P(N)), que fornece uma indicação da probabilidade pela qual uma combinação entre dois nucleotídeos ou seqüências de aminoãcidos ocorrería por acaso. Por exemplo, um ácido nucleico ê considerado similar a uma seqüência de referência (e, conseqüentemente, neste contexto, homóloga) se a menor probabilidade da soma em uma comparação do ácido nucleico. de teste ao ácido nucleico da referência for menos do que aproximadamente 0,1, ou menos do que aproximadamente 0,01, e ou mesmo menos do que aproximadamente 0,001. Um exemplo adicional de um algoritmo útil do alinhamento da seqüência é PILEÜP. PILEUP cria um alinhamento múltiplo da seqüência de um grupo de seqüêncías relacionadas usando alinhamentos em pares progressivos. 0 programa pode alinhar, por exemplo, até 300 sequências de um comprimento máximo de 5.000 letras. O sistema integrado, ou o computador incluem tipicamente uma relação da entrada do usuário permitindo que um usuário veja seletivamente uma ou mais seqüências gravadas correspondendo a uma ou mais fileiras de caracteres, bem como um conjunto de instruções que alinhe uma ou mais fileiras de caracteres entre estas ou com uma fileira de caracteres adicional para identificar uma ou mais regiões de similaridade da seqüência. 0 sistema pode incluir uma ligação de uma ou mais fileiras de caracteres com um fenõtipo ou função do gene particular. Tipicamente, o sistema inclui um elemento de saída passível de ser lido pelo usuário que indique um alinhamento produzido pelo conjunto de instruções do alinhamento.

Os métodos desta invenção podem ser executados em um ambiente de computação localizado ou distribuído. Em um ambiente distribuído, os métodos podem ser executados em um único computador que compreende processadores múltiplos ou em uma multiplicidade de computadores. Os computadores podem estar conectados, por exemplo, através de bus comum, mas, mais preferivelmente, o (s) computador(s) é(são) conectados em uma rede. A rede pode ser generalizada ou uma rede dedicada local ou em uma ampla área e, em determinadas modalidades preferidas, os computadores podem ser componentes de uma Intranet ou de uma Internet.

Assim, a invenção fornece métodos identificando uma seqüência similar ou homólogas a um ou mais polinucleotídeos como mencionados aqui, ou um ou mais polipeptídeos alvo codificados pelos polinucleotídeos, ou de outra maneira mencionados aqui e pode incluir ligar ou associar uma dada função do fenõtipo ou do gene da planta com uma seqüência. Nos métodos, uma base de dados da seqüência ê fornecida (localmente ou através de uma internet ou intranet) e uma pergunta ê feita de encontro à base de dados da seqüência usando as seqüências relevantes aqui e fenôtipos da planta ou funções associadas do gene.

Qualquer seqüência aqui pode ser inserida na base de dados, antes ou depois de perguntar a base de dados. Isto fornece tanto para a expansão da base de dados e, se feito antes da etapa de pergunta, como para a inserção de seqüências de controle na base de dados. As seqüências de controle podem ser detectadas pela pergunta para assegurar a integridade geral da base de dados e a pergunta. Como notado, a pergunta pode ser executada usando uma interface baseada em navegador de rede (do inglês: web browser) . Por exemplo, a base de dados pode ser uma base de dados pública centralizada, tal como, aquelas mencionadas aqui, e a questão pode ser feita de um terminal remoto ou um computador através de uma Internet ou uma Intranet.

Qualquer seqüência aqui pode ser usada para identificar uma seqüência similar, homologa, parãloga, ou ortõloga em uma outra planta. Isto fornece meios para identificação de sequências endógenas em outras plantas que podem ser úteis para alterar um traço de plantas da progênie, a qual resulta do cruzamento de duas plantas de linhagens diferentes. Por exemplo, as seqüências que codificam um ortôlogo de algumas das sequências aqui que ocorrem .naturalmente em uma planta com um traço desejado podem ser identificadas usando as seqüências descritas aqui. A planta ê cruzada então com uma segunda planta da mesma espécie, mas que não tem o traço desejado para produzir a progênie que pode então ser usada em experimentos de cruzamento adicionais para produzir o traço desejado na segunda planta. Conseqüentemente, a planta resultante da progênie não contêm nenhum transgene; a expressão da seqüência endõgena pode também ser regulada pelo tratamento com um produto químico particular ou outros meios, tal como, EMR. Alguns exemplos de tais compostos bem conhecidos na técnica incluem; etileno; citoquininas compostos fenõlicos, que estimulam a transcrição dos genes necessários para a infecção; monossacarídeos específicos e ambientes acídicos que potencializam a indução do gene vir; polissacarídeos acídicos que induzem um ou mais genes eromossomais; e opinas,· outros mecanismos incluem o tratamento de luz ou escuro (para uma revisão dos exemplos de tais tratamentos, veja, Winans (1992) Microbiol. Rev. 56; 12 - 31; Eyal et al. (1992) Plant Mol, Biol, 19: 589 - 599; Chrispeels et al. (2000) Plant Mol. Biol. 42: 279 -290; Piazza et al, (2002) Plant Physiol. 128; 1077 - 1086), A tabela 5 lista as seqüências descobertas ser ortólogas a um número de fatores de transcrição representativos da presente invenção. Os títulos de coluna incluem ps fatores de transcrição listados por (a) a SEQ ID NO.: do ortõlogo ou do nucleotídeo que codifica o ortólogo; (b) o Identificador da Sequência ou (c) número de acesso do GenBank; (d) as espécies das quais os ortólogos dos fatores de transcrição são derivados; e (e) a menor probabilidade da soma duradoura pela análise BLAST.

Tabela 5. Parãlogos e Ortólogos e outros genes relacionados dos genes representativos do fator de transcrição de Arabidopsis identificados usando BLAST * Menor probabilidade da soma comparação para G1073 t Menor probabilidade da soma comparação para G1067 ** Menor probabilidade da soma comparação para G2153 tf Menor probabilidade da soma comparação para G2156 Modelagem Molecular Outros meios que podem ser usados para confirmar a utilidade e a função das sequências do fator de transcrição que são ortólogas ou parãlogas aos fatores presentemente descritos da transcrição são através do uso do software de modelagem molecular. Modelagem molecular é usado rotineiramente para predizer a estrutura do polipeptídeo, e uma variedade de programas de modelagem da estrutura da proteína, tal como o "Insight II" (Accelrys, Inc.) é comercialmente disponível para esta finalidade. A modelagem pode assim ser usada para predizer que resíduos de um polipeptídeo podem ser mudados sem alterar a função (Crameri et al. (2003) patente U.S. no. 6,521,453). Assim, os polipeptídeos que são sequencialmente similares podem mostrar possuir uma probabilidade elevada de função similar por sua similaridade estrutural, que pode, por exemplo, ser estabelecida pela comparação das regiões da superestrutura. As tendências relativas dos aminoãcidos para formar regiões da superestrutura (por exemplo, as hélices e β- folhas) são bem estabelecidas. Por exemplo, 0'Neil et al. ((1990) Science . 250: 646 - 651) discutiram em detalhes as tendências que formam hélice de aminoãcidos. As tabelas da estrutura relativa formadora de atividade para aminoãcidos podem ser usadas como tabelas de substituição para predizer que resíduos podem funcionalmente ser substituídos em uma dada região, por exemplo, em domínios de ligação de DNA de fatores de transcrição e de equivãlogos conhecidos. Homólogos que são prováveis ser funcionalmente similares então podem ser identificados.

De interesse particular ê a estrutura de um fator de transcrição na região de seus domínios conservados, tais como, aquelas identificadas na tabela 1. As análises estruturais podem ser executadas comparando a estrutura do fator de transcrição conhecido em torno de seu domínio conservado com aquelas dos ortólogos e dos parãlogos. A análise de um número de polipeptídeos dentro de um grupo do fator de transcrição ou de um clade, incluindo os polipeptídeos funcionalmente ou sequencialmente similares fornecidos na listagem de sequências, pode também fornecer uma compreensão dos elementos estruturais requeridos para regular a transcrição dentro de uma dada família.

EXEMPLOS

Deve ser compreendido que esta invenção não está limitada aos dispositivos, às máquinas, aos materiais e aos métodos particulares descritos. Embora as modalidades particulares sejam descritas, as modalidades equivalentes podem ser usadas para praticar a invenção. A invenção, agora será descrita geralmente, serã compreendida mais prontamente por referência aos seguintes exemplos, que são incluídos meramente para finalidades de ilustração de determinados aspectos e modalidades da presente invenção e não pretendidos como limitantes à invenção. Serã reconhecido por um com habilidade na técnica que um fator de transcrição que é associado com um primeiro traço particular pode também ser associado com ao menos um outro, não relacionado e inerente segundo traço que não foi predito pelo primeiro traço.

Exemplo Is Identificação e clonagem do comprimento total do gene As sequências do fator de transcrição putativo (genômíco ou ESTs) relacionadas aos fatores conhecidos de transcrição foram identificadas na base de dados do Banco Genético de Arabídopsis thaliana usando o programa da análise da seqüência tblastn usando parâmetros padrão e um valor P do ponto inicial da interrupção de e - 4 ou de - 5 ou mais baixo, dependendo do comprimento da seqüência da em questão. Os pontos da seqüência do fator de transcrição putativo foram selecionadas então para identificar aquelas que contêm séries de seqüência particulares. Se os pontos da seqüência contivessem tais séries de seqüência, as sequências eram confirmadas como fatores de transcrição.

Alternativamente, as bibliotecas do cDNA de Arabídopsis thaliana derivadas de tecidos ou tratamentos diferentes, ou as bibliotecas genômicas foram selecionadas para identificar novos membros de uma família de transcrição usando uma abordagem de hibridização de baixa estringência. As sondas foram sintetizadas usando primers específicos do gene em uma reação padrão de PCR (temperatura do recozimento 60°C) e marcado com 32P dCTP usando o High Prime DMA Labeiíng Kit (Roche Diagnostics Corp., Indianapolis, IN). As sondas purificadas radiomarcadas foram adicionadas aos filtros imersos no meio do hibridização Church (0,5 M NaP04 pH 7,0, 7 % de SDS, albumina do soro de bovinos de 1 % p/v) e hibridizado durante a noite em 60°C com agitação. Os filtros foram lavados duas vezes por 45 a 60 minutos com lx SCC, 1 % de SDS em 6.0 ° C.

Para identificar a seqüência adicional 5' ou 3' de uma seqüência parcial do cDNA em uma biblioteca do cDNA, e a conclusão da amplificação rápida 5' e 3' do cDNA (RACE) foram executados usando o kit de amplificação de cDNA de MARATHON (Clontech, Paio Alto, CA) . Geralmente, o método envolve primeiramente isolar o poli(A) mRNA, executar a síntese da primeira e sa segunda fita do cDNA para gerar o o cDNA de dupla fita, neutralizando asextremidades do cDNA, seguidas pela ligação do adaptador de MARATHON ao cDNA para formar uma biblioteca do adaptador - ligado do ds cDNA.

Os primers de gene específicos foram projetados para ser usados junto com os primers específicos do adaptador tanto para reações da RACE 51 quanto para 31 . Os primers aninhados, melhor que os primers simples, foram usados para aumentar a especificidade de PCR. Usando as reações da RACE 5' e 3', os fragmentos da RACE 5' e 3' foram obtidos, arranjados em seqüência e clonados. 0 processo pôde ser repetido atê que as extremidades 5' e 3' do gene comprimento total foram identificados. O cDNA de comprimento total foi gerado então por PCR usando os primers específicos para as extremidades 5' e 3' do gene por PCR extremidade a extremidade.

Exemplo II: Λ construção dos vetores de expressão A seqüência foi amplificada de uma biblioteca genômica ou de cDNA usando os primers específicos para as seqüências upstream e downstream da região do código. 0 vetor de expressão foi o pMEN20 ou o pMEN65, que são ambos derivados de pMON316 (Sanders et al. (1987) Nucleíc Acids Res. 15:1543 - 1558) e contêm o promotor CaMV 35S para expressar os transgenes. Para clonar a seqüência no vetor, ambos os pMEN20 e o fragmento amplificado do DNA foram digeridos separadamente com enzimas de restrição Sall e Notl em 37°C por 2 horas. Os produtos da digestão eram sujeitos a eletroforese em 0,8 % de gel do agarose e visualizado por coloração com brometo de etídio. Os fragmentos do DNA que contêm a seqüência e o plasraídeo linearizado foram cortados e purificados usando um kit da extração do gel de QIAQUICK (Qiagen,· Valencia, CA) . Os fragmentos do interesse foram ligados em uma relação de 3:1 (vetor à inserção) . As reações de ligação que usam a ligase T4DNA (New England Biolabs, Beverly MA) foram realizadas em 16°C por 16 horas. 0 DNAs ligados foram transformados em células competentes da linhagem DH5a de E. coli usando o método de choque de calor. As transformações foram plaqueadas nas placas da LB que contêm o canamicina de 50 mg/1 (Sigma Chemical Co. St.

Louis MO). As colônias individuais foram crescidas durante a noite em cinco mililitros do caldo de carne de LB que contêm o canamicina de 50 mg/1 em 37°C. O DNA do plasmídeo foi purificado usando kits Qiaquick Mini Prep (Qiagen, Valencia CA).

Para o sistema de dois componentes, duas construções separadas são usadas: pPromoter::LexA - GAL4TA e opLexA:: fator de transcrição. 0 primeiro destes {promotor::LexA -GAL4TA) compreende um promotor desejado clonado na frente de um domínio de ligação do DNA de LexA fundido a um domínio da ativação GAL4. A espinha dorsal do constructo de vetor CpMEN48, conhecido também como P5375) também carregado com um marcador da resistência do canamicina junto com um repórter de opLexA::GFP. As linhagens transgênicas foram obtidas contendo este primeiro componente e ao menos uma linhagem foi selecionada que mostrou a expressão reproduzível do gene do repórter no teste padrão desejado através de um número de gerações. Uma população homozigótica foi estabelecida para essa linhagem e a população era supertransformada (para produzir um supertransformação ou um "supTfn") com a segunda construção {opLexA:: fator de transcrição) que carrega o fator de transcrição de interesse clonado atrás de um sitio do operador de LexA. Esta segunda espinha dorsal dconstructo de vetor vetor (pMEN53, conhecido também como P5381) conteve também um marcador da resistência do sulfonamida.

Exemplo III: A transformação do Agrobacterium com o vetor da expressão Após o vetor do plasmídeo que contem o gene ser construído, o vetor foi usado para transformar as células de Agrobacterium tumefaciens que expressam os produtos do gene. 0 estoque de células de Agrobacterium tumefaciens para a transformação foi feito como descrito por Nagel et de al. ' (1990) FEMS Mícrobiol Letts. 67: 325 - 328. A linhagem ABI de Agrobacterium foi crescida 250 ml do meio LB (Sigma) durante a noite em 28°C com agitação ate que um absorbância de mais de 1 cm em 600 nm (ASqo) de 0,5 - 1,0 foram alcançados. As células foram colhidas por centrifugação em 4.000 x g por 15 minutos a 4°C. As células foram então ressuspendidas em 250 μΐ de tampão gelado (1 mM HEPES, pH ajustado a 7,0 com KOH). As células foram centrifugadas outra vez como descrito acima e resuspendidas em 125 . μΐ de tampão gelado. As células foram então centrifugadas e ressuspendidas duas mais vezes no mesmo tampão de HEPES como descrito acima em um volume dde 100 μΐ e de 750 μΐ, respectivamente. As células ressuspendidas foram distribuídas então em alíquotas de 40 pl, congeladas rapidamente em nitrogênio líquido, e armazenadas era -80°C.

As células de Agrobacterium foram transformadas com os plasmídeos preparados como descritos acima seguindo o protocolo descrito por Nagel et por al. 1990 supra. Para cada construção do DNA a ser transformada, 50 - 100 ng do DNA (ressuspendido geralmente em 10 mM de Tris - HCl, em 1 mM de EDTA, em pH 8,0} foi misturado com o 40 μΐ de células do Agrobacterium. A mistura de DNA/célula foi transferida então a uma cubeta gelada com uma abertura de do elétrodo 2 milímetros e submetida a uma carga de 2,5 quilovolts dissipada a 25 pF e 200 μΡ usando um instrumento de Gene Pulser II (Bio-Rad, Hercules, CA). Após a eletroporação, as células foram ressuspendidas imediatamente em 1,0 ml de LB e foram permitidas recuperar sem a seleção por antibiótico por 2-4 horas em 28°C em uma incubadora com agitação. Após a recuperação, as células foram plaqueadas no meio seletivo do caldo de carne LB que contém 100 pg/ml de espectinomicina (Sigma) e incubadas por 24 - 48 horas a 28 °C. As colônias simples então foram escolhidos e inoculados no meio fresco. A presença do constructo do plasmídeo foi verificada pela amplificação de PCR e pela anãlise da sequência.

Exemplo IV; A transformação de plantas de Arabidopsis com Agrobactex\ium tumefaciens com vetor da expressão Após a transformação de Agrobacterium tumefaciens com vetores de plasmídeo contendo o gene» as colônias únicas de Agrobactexium foram identificadas» propagadas, e usadas para transformar as plantas de Arabidopsis. Momentaneamente, 50 0 ml de culturas de meio LB que contêm 50 mg/1 de canamícina foram inoculadas com as colônias e crescidas em 28 °C com agitação por 2 dias até que uma absorbância ótica no comprimento de onda de 600 nm sobre 1 cm (Agoo) > de 2,0 seja alcançada. As células foram colhidas então pôr centrifugação em 4.000 x g por 10 minutos, e ressuspendidas no meio de infiltração (1/2 X Murashige e sais de Skoog (Sigma) , 1 X vitaminas B - 5 de Gamborg (Sigma), 5,0 % (p/v) de sacarose (Sigma), 0,044 μΜ de benzilamino purina (Sigma) » 200 μΐ/ΐ de Silwet L - 77 (sementes de Lehle) ) até que um A600 de 0,8 foi alcançado.

Antes da transformação, as sementes de Arabidopsis thaliana (ecotipo Colômbia) foram semeadas em uma densidade de -10 plantas por vaso de 4" em meio para vaso Pro - Mix BX (Hummert International) coberto com o engranzamento de fibra de vidro (18 milímetros X 16 milímetros) . As plantas foram crescidas sob a iluminação contínua (50 - 75 μΕ/τπ2/segundo) em 22 - 23°C cora umidade relativa de 65 - 70 %. Após aproximadamente 4 semanas, as caules preliminares do inflorescência (parafusos) são podadas para incentivar o crescimento dos parafusos secundários múltiplos. Após florescência dos parafusos secundários maduros, as plantas foram preparadas para a transformação pela remoção de todos os síliquas e flores abertas.

Os vasos foram então imersos de cabeça para baixo na mistura do meio de infiltração de Agrobacteríum como descritos acima por 30 segundos, e colocados em seus lados para permitir a drenagem em uma superfície plana de 1' x 2' coberta com o envoltório plástico. Após 24 horas, o envoltório plástico foi removido e os vasos são verticalmente girados. 0 procedimento da imersão foi repetido uma semana mais tarde, para um total de duas imersões por vaso. As sementes então foram coletadas de cada vaso da transformação e analisadas seguindo o protocolo descrito abaixo.

Exemplo V: A identificação de transformastes primários de Arabidopsis As sementes coletadas dos vasos de transformação foram esterilizadas essencialmente como segue. As sementes foram dispersadas dentro de uma solução que contem 0,1 % (v/v) de Triton X - 100 (Sigma) e água estéril e lavadas agitando a suspensão por 20 minutos. A solução da lavagem então foi drenada e substituída com a solução da lavagem fresca para lavar as sementes por 2 0 minutos com agitação. Após a remoção da solução de etanol/detergente, uma solução contendo 0,1 % (v/v) de Triton X - 100 e 30 % (v/v) de descorante (CLOROX; Clorox Corp, Oakland CA) foi adicionado às sementes, e a suspensão foi agitada por 10 minutos. Após a remoção da solução de descorante/detergente, as sementes foram lavadas então cinco vezes na água destilada estéril. As sementes foram armazenadas na última água de lavagem a 4 °C por 2 dias na obscuridade antes de ser plaque adas no meio de seleção antibiótico (1 X Murashige e de sais Skoog (pH ajustado a 5,7 com 1M de KOH) , 1 X vitaminas B - 5 de Gamborg, 0,9 % phytagar (Life technologies), e 50 mg/1 de canamicina). As sementes foram germinadas sob a iluminação contínua (50 - 75 μΕ/ηα2/segundo) em 22 - 23°C. Após 7-10 dias de crescimento sob estas condições, os transformantes primários resistentes à canamicina (geração Ti) eram visíveis e obtidos. Estes árvores novas foram transferidas primeiramente às placas frescas da seleção onde as árvores novas continuaram a crescer por mais 3-5 dias, e para o solo então (meio de vaso Pro - Mix BX).

Os transformantes primários foram cruzados e as sementes da progênie (T2) coletados,- as árvores novas resistentes ã canamicina foram selecionadas e analisadas. Os níveis da expressão dos polinucleotídeos recombinante nos transformantes variam aproximadamente de 5 % aumento do nível da expressão a pelo menos um aumento de 10 0 % de nível da expressão. As observações similares são feitas com relação â expressão do nível do polipeptídeo.

Exemplo VI: A identificação de fenótipos modificados em plantas superexpressantes Em alguns exemplos, os testes padrões de expressão dos genes induzidos por estresse podem ser monitorados por experiências de microarranjo. Nestas experiências, os cDNAs são gerados por PCR e ressuspendidos em uma concentração final de ~ 100 ng/μΐ em 3X SSC ou 150 mM de Na - fosfato (Eisen e Brown (1399) Methods Enzymol. 3 03: 179 - 205) . Os cDNAs são corados nas lâminas de vidro do microscópio revestidas com o polilisina. Os cDNAs preparados são aliquotados em placas de 384 poços e corado nas lâminas usando, por exemplo, um pórtico x - y - z (OmniGrid) que pode ser adquirido de GeneMachines (Menlo Park, CA) equipado com os pinos do tipo do espinho que podem ser comprados de Telechem internacional (Sunnyvale, CA) . Após corar - se, as disposições são curadas por um mínimo de uma semana na temperatura ambiente, reidratadas e bloqueadas seguindo do protocolo recomendado por Eisen e por Brown (1999; supra).

As amostras totais do RNA da amostra (10 pg) são marcadas usando as tinturas Cy3 e Cy5 fluorescentes. As amostras marcadas foram ressuspendidas 4X SSC / 0,03 % de SDS / 4 pg de DNA de esperma de salmão/2 pg de tRNA/ 50mM de Na - pírofosfato, são aquecidas para 95°C por 2,5 minutos, giradas para baixo e colocadas no arranjo. 0 arranjo então é coberto com um coverslip de vidro e colocada em uma câmara selada. A câmara ê mantida então em um banho da água em 62°C durante a noite. As disposições são lavadas como descrito em Eisen e em Brown (1999) supra e escaneadas em um escaner de laser General Scanning 3000. Os arquivos resultantes foram quantificados subseqüentemente usando IMAGENE, software (BioDiscovery, Los Angeles CA).

Os fenótipos modificados observados para plantas particulares superexpressoras podem incluir a biomassa aumentado, e/ou a tolerância ou a resistência a estresse abiótico aumentada ou diminuída. Para uma superexpressora particular que mostre uma característica menos benéfica, tal como a tolerância ou a resistência abiótico reduzida ao estresse, pode ser mais útil para selecionar uma planta com uma expressão diminuída do fator particular da transcrição. Para um knockout particular que mostre uma característica menos benéfica, tal como a tolerância abiótica diminuída ao estresse, pode ser mais útil selecionar uma planta com uma expressão aumentada do fator particular da transcrição.

Os ensaios da germinação neste exemplo seguiram modificações do mesmo protocolo básico. As sementes estéreis foram semeadas nos meios condicionais alistados abaixo. As placas foram incubadas em 22 °C sob luz 24 horas/dia (120 - 13 0 pEin/m2/s) em uma câmara de crescimento. A avaliação da germinação e do vigor da árvore nova foi conduzida 3 a 15 dias após o plantio. Os meios basais eram meio de 80 % de Murashige - Skoog (MS) + vitaminas.

Para as experiências do estresse conduzidas com as plantas mais maduras, as sementes foram germinadas e foram crescidas por sete dias no MS + as vitaminas + sacarose de 1 % em 22°C e transferidas então às condições do estresse do frio e de calor. As plantas eram tanto expostas ao estresse frio (uma exposição de 6 horas a 4 - 8°C) , ou ao estresse de calor (32° C foi aplicado por cinco dias, depois do quais as plantas eram transferidas de volta a 22°C para a recuperação e avaliado após 5 dias relativos aos controles dos não expostos à temperatura diminuída ou elevada).

Os ensaios do estresse de sal tinham por objetivo encontrar os genes que conferiam uma melhor germinação, vigor da árvore nova ou crescimento em presença de sal em grande quantidade. A evaporação da superfície do solo causa o movimento da água e o acúmulo ascendente de sal na camada superior do solo onde as sementes são colocadas. Desta forma, a germinação ocorre normalmente em uma concentração de sal muito mais alta do que a concentração média de sal no perfil inteiro do solo. As plantas diferem em sua tolerância ao NaCl dependendo de seu estágio do desenvolvimento, conseqüentemente a germinação da semente, o vigor do árvore nova, e as respostas do crescimento de planta foram avaliados.

Os ensaios do estresse osmótico (ensaios incluindo do NaCl e do manitol) foram conduzidos para determinar se ura fenôtipo de estresse do osmótico era específico para NaCl ou se era um fenôtipo relacionado ao estresse osmótico em geral. As plantas tolerantes ao estresse do osmótico podiam também ter mais tolerância à seca e/ou a congelamento.

Para as experiências de germinação sob estresse do osmótico e de sal, o meio fox suplementado com 150 mM de NaCl ou .os 300 mM de manitol. Os ensaios da sensibilidade do regulador de crescimento foram executados em meios do MS, vitaminas, e 0,3 μΜ de ABA, 9,4 % de sacarose, ou 5 % de glucose.

Os ensaios da seca foram executados para encontrar os genes que mediam uma melhor sobrevivência da planta após a privação severa da água a curto prazo. O escapamento do íon é medido se necessitado. Os resultados positivos da tolerância do estresse do osmótico suportam também um fenótipo tolerante a seca. as telas Solo - baseadas da seca foram executadas com as plantas de Arabídopsis que superexpressantes os fatores de transcrição alistados na listagem de sequências, onde notdo abaixo. As sementes das plantas de Arabídopsis do tipo selvagem, ou as plantas que superexpressam um polipeptídeo da invenção, eram estratifiçadas por três dias em 4 o C em 0,1 % de agarose. Quatorze· sementes de cada superexpressora ou tipo selvagem foram semeadas então em vasos de argila de três polegadas que contêm uma mistura de 50:50 de vermiculite:perlite coberto com uma camada pequena de MetroMix 200 e crescido por quinze dias sob luzes 24 hora/dia . Os vasos que contêm árvores novas do tipo selvagem e superexpressantes foram colocados nos planos na ordem aleatória. 0 estresse da seca foi iniciado colocando vasos no papel absorvente por sete a oito dias. As árvores novas foram consideradas ser forçados suficientemente quando a maioria dos vasos que contêm árvores novas do tipo selvagem dentro de um plano se tinha tornado murchas severamente. Os vasos foram molhados novamente então e a sobrevivência foi marcada quatro a sete dias mais tarde. As plantas foram ordenadas contra os controles do tipo selvagem para cada um de dois critérios: tolerância às condições da seca e a recuperação (sobrevivência) após se molhar novamente o vaso, No fim do período inicial da seca, a cada vaso foi atribuído uma contagem numérica do valor dependendo dos critérios acima. Um valor baixo foi atribuído às plantas com uma aparência extremamente pobre (isto é, as plantas eram uniformemente marrons) e um valor elevado dado às plantas gue eram avaliadas muito saudáveis na aparência (isto ê, todas as plantas eram verdes). Depois que as plantas foram molhadas novamente e incubadas quatro a sete dias adicionais, as plantas · foram reavaliadas para indicar o grau de recuperação do tratamento da privação da água. Uma análise foi conduzida então para determinar que plantas sobreviveram melhor a privação da água, identificando os transgenes que conferiam consistentemente fenótipos tolerantes a seca e sua habilidade de recuperar deste tratamento. Ά análise foi executada por classificação de comparações totais e dentro de planos com um conjunto de modelos estatísticos para esclarecer variações entre os grupos. . Diversas medidas da sobrevivência foram classificadas, incluindo; (a) a proporção média das plantas que sobrevivem relativo à sobrevivência do tipo selvagem dentro do mesmo plano; (b) a proporção mediana de sobrevivência relativo â sobrevivência do tipo selvagem dentro do mesmo plano; (c) a sobrevivência média total (tomando todos os grupos, planos, e vasos) ; (d) a sobrevivência média total relativo à sobrevivência total do tipo selvagem; e (e) a contagem visual media da saúde de planta antes de molhar novamente.

As experiências foram executadas para identificar aqueles transformantes que exibiram sensibilidade a açúcar modificado. Para tais estudos, as sementes dos transformantes foram germinadas nos meios com alto conteúdo de açúcar (5 % de glucose, 9,4 % de sacarose) que normalmente restringem parcialmente a elongação do hipocótilo. As plantas com sensibilidade a açúcar alterada podem ter hipocõtilos mais longos ou mais curtos do que plantas ' normais quando crescidas nestes meios. Adicionalmente, outros traços da planta podem ser variados como a massa da raiz. Ensaios para a sensibilidade a açúcar tinham por objetivo encontrar os genes envolvidos na sensibilidade a açúcar pela germinação de sementes em concentrações elevadas da sacarose e do glucose e procurando graus de elongação do hipocótilo. 0 ensaio da germinação no manitol controlado para respostas relacionou - se ao estresse do osmótico. Os açúcares são as moléculas chaves -regulatórias que afetam diversos processos em plantas superiores incluindo germinação, crescimento, florescência, senescência, metabolismo do açúcar e fotossíntese, A sacarose ê a forma principal do transporte do fotosintato e seu fluxo através das células tem demonstrado que afeta a expressão do gene e que altera a acumulação composta do armazenamento nas sementes (relacionamentos da fonte - dissipador), Sensibilidade a hexose específica para glucose foi descrito nas plantas e ê implicado também na divisão da célula e na repressão dos genes da "fome" (fotosintêtica ou ciclos do glioxilato).

Os ensaios do estresse de temperatura foram realizados para encontrar os genes que conferiam germinação, vigor da árvore nova ou crescimento de planta melhor sob o estresse de temperatura (frio, congelamento e calor). As experiências da germinação do estresse de temperatura frias foram realizadas e 8°C. As experiências da germinação do estresse de calor foram conduzidas a 32°C a 37°C por 6 horas da exposição, 0 tempo florescência foi medido pelo número de folhas de roseta presentes quando uma inflorescência visível de aproximadamente 3 cm é aparente. 0 número total de rosetas e o de folhas no caule da progêníe são correlacionados firmemente com o sincronismo de florescência (Koornneef et al. (1991) Mol. Gen Genet. 229: 57 - 66) . A resposta da vernalização foi medida também. Para tratamentos da vernalízação, as sementes foram semeadas às placas de ãgar do MS, seladas com fita adesiva do micropore, e colocadas em um quarto frio a 4°C com níveis da luz baixa por 6-8 semanas. As placas foram transferidas então aos quartos do crescimento ao lado das placas que contêm semeados recentemente de controles não vernalizados. As rosetas de folhas foraam contadas quando uma inflorescência visível de aproximadamente 3 cm era aparente.

As sequências do fator de transcrição da listagem de sequências, ou aquelas nas tabelas ou nas figuras presentes, e em seus equivãlogos, podem ser usadas preparar plantas transgênicas e plantas com traços alterados. As plantas transgênicas específicas alistaram são produzidas abaixo das sequências da listagem de seqüências, como notado. A listagem de seqüências, a tabela 5 e o exemplo VII fornecem seqüências exemplares do polinucleotídeo e do polipeptídeo da invenção.

Exemplo VII: Genes que conferem melhorias significativas às plantas Este exemplo fornece a evidência experimental para a biomassa aumentada e a tolerância ao estresse abiõtico controlado pelos polipeptídeos do fator de transcrição e por polipeptídeos da invenção.

As experiências foram executadas para identificar aqueles ■ transformantes que exibiram diferença morfológica relativa as plantas de controle do tipo selvagem , isto é, uma estrutura e/ou características do desenvolvimento modificados. Para tais estudos, os transformantes foram observados a olho nu para identificar novas características estruturais ou de desenvolvimento associadas com a expressão ectópica dos polinucleotídeos ou dos polipeptídeos da invenção. Os exemplos dos genes e dos equiválogos que conferem melhorias significativas ãs plantas superexpressantes são notados abaixo. As observações experimentais feitas no que diz respeito aos genes específicos cuja expressão foi modificada em plantas superexpressantes, e em aplicações potenciais baseadas nestas observações, são apresentadas também.

As sequências do fator de transcrição da listagem de seqüêncías podem ser usadas para preparar plantas transgênicas com traços alterados. Dos resultados experimentais dos ensaios de físiologia baseados em placa apresentados nas tabelas deste exemplo, pode-se inferir que um número representativo das seqüêncías das diversas espécies, da planta deu a tolerância ao estresse aumentada em uma escala de ensaios do estresse abíótico. Os efeitos observados da superexpressão em tempo florescência são anotados também no texto abaixo. Estes efeitos comparáveis indicam que as seqüêncías encontradas dentro do clade G1Q73 de polipeptídeos do fator de transcrição são funcionalmente relacionadas e podem ser usadas conferir vários tipos de tolerância ao estresse abiótico nas plantas. Vários destes genes conferem simultaneamente biomassa aumentada e tolerância aos estresses abióticos múltiplos aumentados. Como evidenciado pelas tabelas neste exemplo, não todos os transformantes são tolerantes a estresse abiótico, e não todas as linhagens eram tolerantes na mesma extensão. É geralmente vantajoso usar os métodos apresentados no exemplo VI para selecionar as linhagens superexpressantes mais tolerante e útil.

Resultados: Como notável abaixo e na figura 4, um número representativo dos membros do clade G1Q73 de polipeptídeos do fator de transcrição, incluindo as sequências de Arabidopsís G1G73, G1067, G1069, G2153, G2156, G2789, as sequências do arroz G3399, G3400, G3401, G3406, G34Q7, e as seqüências da soja G3456, G3459 e G3460, aumentaram a tolerância ao estresse abiótico quando estas seqüências são superexpressas. Várias seqüências do membro do clade aumentaram também a biomassa, como seqüências superexpressantes de plantas de Arabidopsís G1G73, G1067, G1G69, G1667, G2153, G2156, G2157, G2789, seqüências do arroz G3399, G3400, G3401, G3406, G3407, G3556, e seqüêncías da soja G3456, G3459 e G3460. G1Q73 (SEQ ID NO; 1 e 2) Nós demonstramos anteriormente que a superexpressão de G1073 dã tolerância de seca e o rendimento realçado em linhas 35::G1073. Indicamos agora este locus como HERCULES 1 (HRC1) . 0 alvo deste estudo era a re-avaliação das linhagens 3 5S:;G1073 e comparar seus efeitos de superexpressão àqueles de seus parãlogos e ortólogos putativos. Nós procuramos também testar se o uso de um sistema de superexpressão de dois componentes produziría algum fortalecimento do fenõtipo relativo ao uso de um promotor de fusão direto de 35S. A superexpressão de G1073 através do sistema de dois componentes resultou em fenótipos similares àqueles observados previamente com as experiências previamente executadas da fusão direta do promotor. Em ambos os projetos', as plantas de G1073 superexpressantes exibiram um aumento em biomassa relativo às plantas do tipo selvagem controle junto com mudanças na morfologia da folha e uma ligeira moderação no atraso no tempo florescência.

As plantas transgênicas superexpressantes G1Ü73 eram substancialmente maiores do que os controles do tipo selvagem, com ao menos um aumento de 60 % na biomassa {figuras 6A e 6B, 7A, e 7B) . A massa aumentada das plantas transgênícas 35S::G1073 foi atribuída à ampliação de múltiplos tipos de órgãos incluindo caules, raízes e órgãos florais; à exceção das diferenças do tamanho, estes órgãos nio foram afetados em sua morfologia total. As plantas 35S;:G1Q73 exibiram um aumento da largura (mas não do comprimento) de órgãos maduros da folha, produziram 2-3 mais roseta folhas, e tinham ampliado o cauline de folhas em comparação às folhas do tipo selvagem correspondente, A superexpressão de G1073 resultou em um aumento na massa da folha e na área da folha por planta, e a morfologia da folha (os superexpressoras G1073 tendem a produzir mais folhas serrilhadas). Nós encontramos também que a massa da raiz esteve aumentada nas plantas transgênicas, e que os órgãos florais estiveram ampliados também (figuras 7B) . Um aumento de aproximadamente 40 % no diâmetro do caule foi observado nas plantas transgênicas. As imagens das seções laterais do caule das plantas 35S-.;G1073 revelaram que as células corticais são grandes e que os feixes vasculares contiveram mais células nos floema que no xílema relativo aos controles do tipo selvagem {figuras 6A e 6B). 0 tamanho da pétala nas linhagens 35S::G1073 foi aumentado por 40 -50 % comparado aos controles do tipo selvagem. As células epidérmicas da pétala naquelas mesmas linhagens eram aproximadamente 25 - 30 % maior do que aqueles das plantas do controle. Além disso, 15 - 20 % mais de células epidêmicas por pétala foram produzidas comparadas aos controles do tipo selvagens. Desta forma, nas pétalas e nos caules, o aumento no tamanho foi associado com um aumento no tamanho de célula bem como no número da célula. O rendimento de semente foi aumentado também comparado às plantas do controle. As linhagens 35S::G1Q73 mostraram um aumento de ao menos 70 % no rendimento de semente. Esta produção, de semente aumentada foi associada com um número aumentado dos siliquas por planta, em vez de sementes por síliquas.

As linhagens de dois componente 35S.-G1G73 mostraram que um suave a moderar atrasa no início de florescência e desenvolveu folhas grande amplitude do que aqueles de controles do tipo selvagem. Estes efeitos eram de penetrância intermediária, sendo observado, às extensões variando em oito de vinte linhagens TI. G1073 funciona no grão de soja e no tomate para aumentar a biomassa. Na figura 9A, a planta maior do grão de soja na direita é superexpressante G1073. As folhas de tomate de várias linhagens do superexpressora G1073 era muito maior do que aquelas de plantas de tomate do tipo selvagem', como visto na figura 9B comparando folhas da planta do superexpressora na esquerda e naquela de uma planta do tipo selvagem na direita.

Como visto na tabela abaixo, os dois componentes de linhagens 35S::G1073 indicaram também uma tolerância marcada aumentada aos níveis elevados de sal e de sacarose durante a germinação. Os estudos com fusão do promotor 35S direto resultaram em plantas com tolerância significativamente maior à seca do que a do tipo selvagem em ensaios baseados em solo.

Como notável na figura 4, na tabela 1 e nas tabelas subseqüentes neste exemplo, nós obtivemos fenótipos morfológica e/ou fisiologicamente similares de superexpressão do G1073 - relacionados a genes de Arabidopsis (G1067, G1069, G1667, G2153, G2156, G2157, G2789), do arroz (G3399, G3400, G3401, G3406, G3407, G3556) e dos genes da soja (G3456, G3459, G3460), indicando que estes genes são prováveis de serem relacionados funcionalmente.

Tabela 6. Supertransformação (supTfn - do inglês supertrans format ion) de 2 componentes de Arabidopsis thaliana G1Q73 35S 1 Tipo de projeto 2 Linhagem 3 Germinação em NaCl em alto teor 4 Germinação em Manitol em alto teor 5 Germinação em Sacarose em alto teor 6 Germinação em calor 7 Germinação em frio 8 Crescimento em calor 9 Dessecação 10 Crescimento em frio 11 componentes * wt (do .inglês: wild type [tipo selvagem]) + mais tolerante do que plantas do controle do tipo selvagem ++ muito mais tolerante do que plantas do controle do tipo selvagem G1067 (SEQ ID HO: 3 e 4) 0 G1067 ê um parãlogo de G1G73. Baseado em nossa análise filogenética, este gene e o G2156 são os parãlogos mais relacionados de G1Q73. 0 G1067 corresponde a ESCAROLA (ESC) . Os efeitos morfológicos da superexpressão deste gene expressado sob o controle do promotor CaMV 35S, incluindo crescimento lento, florescência atrasado e ondulamento da folha, foram documentados por Weigel et de al. (2000) Plant Physiol 122; 1003 - 1013. Este estudo não considerou ou relatou alteração o açúcar que deteta ou aumento a tolerância ao estresse abiõtico.

As 'linhagens diretas da fusão do promotor 35S::G1067 demonstraram exibir uma variedade de fenótipos deletérios. No entanto, várias linhagens das plantas transgênícas que superexpressam o G1067 demonstraram ser grandes e tiveram folhas largas.

As linhagens de superexpressão foram obtidas também usando o sistema de dois componentes da expressão, e estas linhagens eram geralmente pequenas e com crescimento lento. As linhagens de dois componentes foram obtidas em freqüência muito baixa, indicando possivelmente que o nível elevado de superexpressão produziu letalidade. E possível que um nível mais elevado de atividade G1067 foi alcançado com uma abordagem de dois componentes e que este impediu a isolação dos trans formantes. Das linhagens de dois componentes que foram obtidas, quatro (# 301, 302, 441, 442) das cinco linhagens eram notavelmente menores e com desenvolvimento lento comparado aos controles. A linhagem final #3 03 era crescimento minúsculo e prendido cedo no desenvolvimento. Os efeitos morfológicos indesejáveis associaram com a superexpressão G1067 sugerem que as plantas -que superexpressam esta seqüência se beneficiariam da otimização pelo induzíve1 ou pelo controle tecido-específico do regulatório, como notável em um detalhe maior abaixo. Duas de quatro linhagens superexpressantes eram ABA. insensitive, e uma linhagem era uma tolerante mais frio do que controles em ensaios baseados placa. Os superexpressoras G1Q67 mostraram também uma tolerância significativamente maior da seca do que tipo selvagem em ensaios baseados em solo.

Tabela 7. Supertransformação de 2 componentes de Arabidopsis thaliana G1Q67 35S G1069 (SEQ ID NO: 41 e 42) A seqüência de G1069 foi obtida do projeto de seqüenciamento EU Arabidopsis, número de ascensão Z97336 de Banco Genético, baseado em sua similaridade da seqüência dentro do domínio conservado a outras proteínas relacionadas AT-hook em Arabidopsis. A seqüência de G1069 foi determinada experimentalmente e a função de G10S9 foi analisada usando as plantas transgênicas em que G10S9 foi expresso sob o controle do promotor 35S. As plantas que superexpressam o G1Q69 mostraram mudanças na arquitetura da folha, redução do tamanho total da planta, e progressão retardada ao longo do ciclo de vida. Este é um fenômeno comum para a maioria de plantas transgênicas em que as proteínas do AT-hook estão superexpressas se o gene for expressado predominantemente na raiz do tipo selvagem no ambiente. De fato, baseado na análise dos resultados do Rt-PCR o G1069 foi expressado predominantemente nas raízes. Para minimizar estes efeitos prejudiciais, o G1069 pode ser superexpresso sob um promotor induzível ou um promotor especifico do tecido tal como o promotor específico da raiz ou da folha.

Os G1069 superexpressores tenderam a ser lentos no desenvolvimento e a florescer mais tarde do que os controles do tipo selvagem. Várias linhagens tiveram folhas largas e curtas (é incerto se isto resultou em um aumento na biomassa total). Várias linhagens de G1069 superexpressantes mostraram mais tolerância ao estresse osmótico quando germinado em alto teor de sacarose contido em placas. Mostraram também insensibilidade ao ABA em um ensaio da germinação. Estas experiências foram repetidas e somente uma linhagem mostrou fenótipos insensível ao ABA e tolerantes ao estresse osmótico. G2153 (SEQ ID NO.: 5 e 6) Nós demonstramos que o G2153 conferia tolerância aumentada ao estresse osmótico em plantas superexpressantes. Baseado em uma análise filogenética, o G2153 é relacionado mais a G1069 do que os outros parálogos G1073 putativoa.

Em nossos estudos prévios, um número de linhagens G2153 superexpressantes eram maiores, e tinham folhas mais largas e lisas do que aquelas de plantas de controle do tipo selvagem. Algumas destas linhagens mostraram rosetas muito maiores do que plantas de controle do tipo selvagem. Nas experiências posteriores, nós geramos linhagens tanto para fusão direta e como para construções de dois componentes. As linhagens de ambas as aproximações exibiram efeitos similares. A maioria dos transformantes eram pequenos, lentos em desenvolvimento e tinha dado forma anormalmente as folhas. No entanto, uma proporção significativa das linhagens G2153 superexpressantes desenvolveu órgãos laterais ampliados (folhas e flores), particularmente em estágios de desenvolvimento posteriores. 2 particularmente interessante que os efeitos similares no crescimento do órgão e na tolerância ao estresse foram obtidos também com as linhagens 35S: .-G1073 e 35S: :G2156, sugerindo que estas sequências são funcionalmente relacionadas.

Deve ser notado que uma freqüência maior de fenótipos deletérios foram observados entre as linhagens de dois componentes, talvez indicando que estes possuem níveis mais elevados de atividade G2153 do que a linhagem de fusão direta. ' As plantas de tomate que superexpressam o polipeptídeo do A. thaliana G2153 tem demonstrado ser significativamente maiores do que plantas de tomate de controle do tipo selvagem.

Os ensaios de fisíologia com linhagens de fusão direta 35S::G2153 confirmaram realçada tolerância ao estresse abiótico. Os fenótipos positivos foram vistos nos ensaios de estresse com o NaCl, a sacarose, o ABA, e o frios. As experiências conduzidas com o sistema de dois componentes mostraram que estas superexpressoras eram também mais tolerantes ao estresse abiótico, como visto na tabela 8. As superexpressoras de G2153 mostraram também uma tolerância significativamente maior a seca do que o tipo selvagem em ensaios baseados solo.

Os efeitos morfológicos indesejáveis que podem ser associados com a superexpressão de G2153 sugerem que as plantas que superexpressam a seqüêncía se beneficiariam pela otimização com controle induzível ou regulatório específico de tecido, como notável abaixo.

Tabela 8. Supertransformação de 2 componentes fusão direta de promotor em Arabidopsis thaliana G2153 35S G2156 (SEQ ID NO; 7 e 8) O G2156 é um parãlogo a G1Q73. Baseado na seqüência de aminoãcidos, os polipeptídeos G2156 e G1067 são relacionados filogenéticamente mais próximos a G1073 do que os outros parãlogos putativos. Nossos estudos prévios caracterizaram as linhagens 35S::G2156 como tendo alterações morfológicas múltiplas. Um número de linhagens de Arabidopsis que superexpressam G2156 sob o controle do promotor 35S demonstraram ser maiores, com folhas mais largas e rosetas maiores do que as plantas de controle do tipo selvagem. 0 alvo deste estudo era re-examinar os efeitos da superexpressão de G2156, particularmente com relação as respostas ao estresse abiótico. Em experiências recentes, nós geramos linhagens tanto para fusão direta e como para construções de dois componentes. As linhagens de ambas as aproximações exibiram efeitos similares. A maioria dos transformantes eram pequenos, lentos em desenvolvimento e tinha dado forma anormalmente as folhas. No entanto, uma proporção significativa das linhagens desenvolveu órgãos laterais ampliados (folhas e flores), particularmente em estágios de desenvolvimento posteriores. Deve ser notado que uma freqüência maior de fenótipos deletérios foram observados entre as linhagens de dois componentes, talvez indicando que estes possuem níveis mais elevados de atividade G2156 do que a linhagem de fusão direta. A fisiología executada nas linhagens de fusão direta e de dois componentes mostraram a tolerância realçada em um ensaio da germinação em meios do cloreto de sódio, e a tolerância ao outro estresse abiótíco também. É particularmente interessante que os efeitos similares no crescimento do órgão e na tolerância ao estresse foram obtidos com as linhagens 35S;;G1073 e 35S::G2153, sugerindo que estes genes são funcionalmente relacionados.

Tabela 9. Supertransformação de 2 componentes fusão direta de promotor em Arabidopsis thaliana G2156 35S G27S9 (SEQ ID NO: 66 e 67) O G2789 é um parãlogo de G1G73. A superexpressão de G2789 em Arabidopsis resultou nas árvores novas que eram insensíveis ao ABA e tolerantes ao estresse osmótico. Em um ensaio da germinação em meios que continham ABA, as árvores novas G2789 transgênicas mostraram o vigor realçado da árvore nova. Em um ensaio similar da germinação em meios que continham concentrações elevadas da sacarose, ss superexpressoras G2789 mostraram também o vigor realçado da árvore nova. Em uma experiência de repetição em linhagens individuais, todas as três linhagens mostraram o fenõtipo. G1667 (SEQ ID NO.: 68 e 69) 0 G1667 ê um parãlogo de G1073. Um número de linhagens G1667 superexpressantes eram maiores do que as plantas de controle do tipo selvagem, com folhas onduladas e serrilhadas, folhas de roseta maior, floração mais longas, mais florações secundárias, e mais síliquas presentes. Este fenótipo era similar àquele observado nas plantas que superexpressam G1073 e outros membros do clade G1Q73 como notável como segue. G3456 (SEQ ID NO.: 13 e 14) O G3456 ê uma soja ortõloga de G1073. O alvo deste projeto ê determinar se a superexpressão de G3456 em Arabidopsis produz efeitos comparáveis àqueles da superexpressão de G1073.

As linhagem 35S::G3456 exibiam alterações no tamanho total, no coloração, na arquitetura da inflorescêncía, na forma da folha, e no tempo florescência. Em particular, em estágios posteriores do crescimento, um número de linhagens significativo desenvolveu folhas ampliadas e mostrou biomassa aumentada relativo aos controles do tipo selvagem.

As linhagens 321 - 337 em estágios adiantados pareceram normais. No entanto, 3/17 das linhagens (# 329, 334, 335} eram ligeiramente pequenas, tiveram internos curtos, e mostraram folhas mais onduladas com relação aos controles. Mais tarde no desenvolvimento, quatro de linhagens de dezessete (# 323, 325, 328, 332} exibiram rosetas substancialmente maiores do que os controles e pareceram também escuras na coloração. Estas plantas mostraram também um ligeiro atraso no início de florescência.

Nas linhagens 341 - 350, 2/10 das linhagens {# 348 e 350) mostraram folhas visivelmente ampliadas. Todas as linhagens eram um tanto escuras em estágios atrasados e tinham internos da inflorescêncía ligeiramente curtos conduzindo a uma arquitetura um tanto cerrada. As plantas ocasionais, tais como a # 349, exibiram defeitos florais.

Para as linhagens 3 61 - 380, todas as plantas eram ligeiramente maiores e mais escuras do que controles em estágios- anteriores. Em estágios posteriores, estas linhagens pareceram normais. A coloração escura exibida por algumas -das linhagens podia indicar níveis aumentados de clorofila; o G3456 pôde conseqüentemente também impactar a capacidade fotosintética, o rendimento, e o valor nutritivo.

Estes efeitos de desenvolvimento eram similares àqueles produzidos nas plantas de Arabidopsis que superexpressam o G1073 ou outros polipeptídeos de Arabidopsis do clade G1073.

Uma maioria das superexpressoras de G3456 demonstrou a tolerância ao estresse abiõtico aumentada (por exemplo, o crescimento em condições frias) relativo às plantas de controle do tipo selvagem, como indicado na tabela abaixo.

Tabela 10. Fusão direta do promotor de Glicina max G3456 35S G3399 (SEQ ID NO: 9 e 10) O G33 99 ê um ortõlogo do arroz de G1073. A análise filogenêtica identifica G3399 junto com G3400 como sendo os ortólogos do arroz mais próximos relacionados a G1073. 0 alvo deste projeto era determinar se a superexpressão de G3399 em Arabídopsis produz efeitos comparáveis àqueles da superexpressão de G1073. As linhagens 35S::G3399 foram obtidas que contêm qualquer uma de duas construções diferentes. Ambas as construções produziram fenótipos morfológicos similares; muitas das linhagens eram pequenas em estágios anteriores, mostravam alterações na forma da folha, e tinham a florescência ligeiramente atrasada. No entanto um número de linhagens significativo desenvolveu órgãos laterais ampliados -folhas, rosetas e flores - particularmente em estágios posteriores, em comparação às plantas do controle do tipo selvagem. É digno de nota que uma das construções (P21269; SEQ ID NO.: 65) continham uma conversão de aminoãcido (prolina a glutaraina no resíduo 198, em um domínio conservado) relativo à proteína nativa. As linhagens para esta proteína mutada mostraram poucas morfelogias indesejáveis do que a versão do tipo selvagem. Este estudo identificou desta forma unia região específica da proteína G3399 que pôde ser modificada a fim de optimizar a aquisição de fenótipos desejáveis.

Os efeitos morf©logicamente similares causados pela superexpressão deste gene do arroz contra G1073 e outros parãlogos de Arabídopsis sugerem que provavelmente tenham funções relacionadas.

Quatro linhagens da superexpressora G3399 demonstraram tolerância ao estresse abiótíco aumentada relativo as plantas de controle do tipo selvagem, como indicado na tabela abaixo. As superexpressoras mostraram também uma tolerância significativamente maior a seca do que o tipo selvagem em ensaios baseados em solo.

Tabela 11. Fusão direta do promotor de Oryza sativa (grupo cultivar japonica) G3399 35S G3400 (SEQ ID NO: 29 e 30) O G3400 é um ortólogo do arroz de G1073. A análise filogenética identifica G3400 junto com G3399como sendo os ortólogos do arroz mais próximos relacionados a G1073. 0 alvo deste projeto era determinar se a superexpressão de G3400 em Arabidopsis produz efeitos comparáveis àqueles da superexpressão de G1073.

Somente algumas linhagens da superexpressão 35S: .-G34QQ foram obtidas até aqui. Uma freqüência tão baixa dos transformantes sugere que o gene pôde ter efeitos letais quando superexpressos em níveis elevados. As linhagens que foram obtidas eram pequenas, de desenvolvimento lento e mostraram folhas onduladas. No entanto, em estágios posteriores, duas das linhagens formaram folhas e florasm um tanto ampliadas.

Deve ser notado que os efeitos morfologicamente similares causados pela superexpressão deste gene do arroz contra G1G73 e seus parãlogos de Arabidopsis sugerem que estas sequências provavelmente têm funções relacionadas.

Todas as superexpressoras de G3400 testadas até aqui demonstraram tolerância aumentada ao estresse abiótico relativo a plantas do controle do tipo selvagem (germinação e crescimento no frio), como indicado na tabela abaixo. As superexpressoras mostraram também uma tolerância significativamente maior a seca do que o tipo selvagem em ensaios baseados em solo.

Tabela 12. Fusão direta do promotor Oryza satíva (grupo cultivar japonica) G3400 35S G3401 (SEQ ID NO: 37 e 38) O G3401 ê um ortõlogo do arroz de G1G73. 0 alvo deste projeto era determinar se a superexpressão de G3401 em Arabídopsis produz efeitos comparáveis àqueles da superexpressão de G1073.

Um número significativo de linhagens 35S::G34Q1 obtidas atê aqui mostraram uma escala de mudanças no desenvolvimento incluindo redução no tamanho, crescimento lento, e forma alterada da folha. Ao menos uma linhagem exibiu folhas ampliadas ligeiramente em estágios posteriores. Um número de linhagens, incluindo diversos que mostram a tolerância ao estresse abiótico, pareceram normais em vários estágios do desenvolvimento.

Uma' maioria de superexpressoras demonstrou insensibilidade ao ΑΒΆ, e a tolerância a um número de estresses abióticos, como indicado na tabela abaixo. As superexpressoras mostraram também uma tolerância significativamente maior a seca do que o tipo selvagem em ensaios baseados em solo.

Tabela 13. Fusão direta do promotor em Oryza sativa (grupo cultivar japonica) G3401 35S G3459 (SEQ ID HO: 15 e 16) O G3459 ê uma soja ortóloga de G1Q73. Algumas das superexp.ressoras de G3459 exibiram anormalidades de desenvolvimento, incluindo asvfolhas deformadas, a estatura ligeiramente pequena, as rosetas pequenas, anormalidades florais e os internos florais pequenos o que conduz a inflorescências ajuntadas. im estágios posteriores do crescimento, um número de linhagens significativo teve rosetas maiores e folhas largas com mais serrilhas do que plantas de controle do tipo selvagem. Outras linhagens pareceram normais.

Uma maioria das superexpressoras G3459 demonstrou a tolerância ao sal elevado e a um número de outros estresses abióticos, como indicado na tabela abaixo.

Tabela 14. Fusão direta do promotor de Glicína max G3459 35S G3460 (SEQ ID NO: 17 e 18) O G3460 ê uma soja ortõloga de G1073. A análise filogenética baseada nos lugares de alinhamentos da proteina G3460 em um subclade um tanto distante dentro do clade G1Q73. O alvo deste projeto era determinar se a superexpressão de G3460 em Arabidopsis produz efeitos comparáveis àqueles da superexpressão de G1073.

As linhagens de superexpressão foram obtidas; a maioria das linhagens indicou uma variedade de anormalidades morfológicas incluindo a redução do tamanho, o crescimento lento, a florescência muito atrasada, as folhas severamente onduladas e defeitos florais, No entanto,, nove fora de um total de trinta seis linhagens TI mostraram um fenótipo um tanto diferente; estas plantas tiveram florescência ligeiramente atrasado, mas desenvolveram rosetas maiores e folhas extremamente amplas, particularmente em estágios posteriores do desenvolvimento. Isto resultou em um aumento muito substancial na biomassa vegetativa (possivelmente maior do que aquele visto na linhagem 35S::G1073 Arabidopsís) . É interessante destacar que alguns aspectos do fenótipo acima, tais como as folhas amplas, era similares àqueles vistos nas linhagens 35S::G1073. No entanto, outras características tais como as folhas extremamente torcidas, onduladas e escurecidas visto na maioria das linhagens 35S::G3460 não foram vistas nos transformantes 35S::G1073. Uma maioria das superexpressoras G3460 demonstrou a tolerância a um número de estresses abiótico, como indicado na tabela abaixo. Os superexpressoras G3460 mostraram também uma tolerância significativamente maior a seca do que tipo selvagem em ensaios baseados em solo.

Tabela 15. Glicína max G3460 35S Fusão direta do promotor. G3406 (SEQ ID NO: 25 e 26) O G3406 ê um ortólogo do arroz de G1073. 0 alvo deste projeto era determinar se a superexpressão de G3406 em Arabidopsis produz efeitos comparáveis àqueles da superexpressão G1073.

As linhagens 321 - 329 podem ter sido ligeiramente menores em relação aos controles do tipo selvagem no estágio da roseta. No estágio inicial da florescência, as linhagens 361 e 362 podem ter estado ligeiramente atrasadas no desenvolvimento. Ã excepção destas observações, as plantas G340S na tabela 16 eram morfologicamente indistinguíveis dos controles do tipo selvagem em todos estágios' restantes do crescimento. As linhagens 3 61 e 3 62 eram menos sensíveis ao ABA e a germinação em condições frias do que os controles do tipo selvagem. A linhagem 321 era também menos sensível ao frio em um ensaio do crescimento.

Tabela 16. Fusão direta do promotor Oryza sativa G3406 35S ' G3407 (SEQ ID NO: 11 e 12} O G3407 ê um ortólogo do arroz de G1073. No estágio da árvore nova, cerca da metade das linhagens pareceu maior do que os controles. Em estágios posteriores do crescimento, as linhagens que superexpressam G3407 não mostraram nenhuma diferença morfológica consistente das plantas do controle, a excecpção da linhagem 329, a qual era 50 % maior do que os controles no estágio de roseta.

Como visto na tabela 17, as linhagens 324 e 325 eram menos sensíveis a germinação em condições frias do que os controles do tipo selvagem.

Tabela 17. Fusão direta do promotor Oryza satíva G3407 35S G3556 (SEQ ID NO; 39 e 40) O G3556 é um ortólogo do arroz de G1Q73. Um número de linhagens de Arabidopsis que superexpressam G3556 tinham exibido folhas largas e onduladas e tiveram um desenvolvimento atrasado. Nenhum resultado de fisiologia está disponível no momento. G2157 (SEQ ID NO.; 70 e 71) Sumário total. Nos tomates transgênicos que expressam o G2157 sob a regulação dos promotores APETALA 1 (api ; Mandei et al. (1992a) Nature 360: 273-277), LIPID TRANSFER PROTEIN 1 (LTP1; Thoma et al. (1994) Plant Physíol. 105: 35-45) and SHOOT MERISTEMLESS (STM; Long e Barton (1998) Development 125: 3027 - 3035; Long e Barton (2000) Dev. Bíol. 218: 341-353), um aumento significativo no tamanho da planta foi observado. Os resultados com os promotores APl e STM eram particularmente notáveis porque o tamanho aumentado da planta 'foi associado também com a produção de fruta aumentada nestas linhagens. 0 G2157 ê estreitamente relacionado a subfamília dos fatores de transcrição bem caracterizados em sua habilidade de conferir tolerância a seca e de aumentar o tamanho do órgão. Os genes dentro deste subfamília exibiram também efeitos .morfoiõgicos deletérios como na superexpressão de G2157 em Arabidopsis. Tem sido predito que a expressão alvo dos genes nesta subfamília podería aumentar a eficácia ou a penetrância de fenótípos desejáveis.

Em nossos estudos da superexpressão de G1Q73( diferentes promotores foram usados para optimizar os fenótipos desejados. Nesta análise, nós descobrimos que a expressão localizada através de um promotor específico a folha jovem e primórdio de caule (SUC2) era mais eficaz do que um promotor (RbcS3) que falta a expressão no tecido meristemãtico. No tomate, um resultado similar foi obtido expressando G2157 em tecidos meristemãtico e primordial através dos promotores STM e AP1, respectivamente. 0 G2157 foi identificado também como sendo significativamente induzido sob condições severas da seca. Estes resultados são fortes evidências que o G2157, quando expressado em tecidos localizados nos tomates, pode funcionar mecanicamente funcionar em uma forma similar a seus parãlogos estreitamente relacionados.

Descobertas Genômicas. A seqüência completa de G2157 foi determinada. 0 G2157 ê expressado em níveis baixos e moderados ao longo da planta. Mostra a indução pela infecção de Fusarium e possivelmente pela auxina. A função deste gene foi analisada usando as plantas transgênicas em que G21S7 foi expressado sob o controle do promotor 35S.

Superexpressão de G2157 produz mudanças distintas no desenvolvimento da folha e reduziu severamente o tamanho total da planta e a fertilidade. Os transformantes primários 35S::G2157 mais fortemente afetados eram diminutos, com crescimento lento, e desenvolveu folhas verde escuras, pequenas que eram frequentemente onduladas, deformadas, ou tinha as margens serrilhado. Um número destas plantas interromperam o crescimento em um estágio vegetativo e falharam na floração. As linhagens com um fenótipo· mais moderado produziram caules finos de inflorescência; as flores carregadas nestas estruturas eram frequentemente estéreis e não abriam ou tinham dado forma mal aos estames. Devido a tais defeitos, a maioria vasta das plantas TI produziu muito poucas sementes. A progênie de três linhagens Tl que mostram um fenótipo moderadamente severo foi examinado; todas as três populações do T2, no entanto, indicaram a raorfologia do tipo selvagem, sugerindo que a atividade do transgene tinha sido reduzida entre as gerações. A expressão de G2157 tem sido ensaiadas usando microarranjos. Os ensaios em que as condições de seca foram aplicados a plantas de Arabidopsis com 6 semanas de idade resultaram no aumento da transcrição de G2157 aproximadamente em duas vezes acima das plantas do tipo selvagens, sob condições severas da seca.

Sumario do fenõtipo. Os tomates de transgênicos que expressam G2157 sob a regulação de AP1, de LTP e de STM um aumento significativo no volume foi observado.

Tabela 18. Sumário dos dados para G2157 ípolipeptídeo SEQ ID NO; 71) Utilidades dos Polipeptídeos de Fator de Transcrição da Cl ade- G1 - 73 Os resultados obtidos com estas experiências de estresse abiótico mostram que os membros do clade G1Q73 de diversas espécies de planta são hábeis para conferir a biomassa aumentada, a tolerância aumentada ao estresse e o rendimento aumentado sob condições do estresse quando superexpressas.

Os dados confirmam também nossas observações mais iniciais que os membros do clade G1073 mostram que um aumento na biomassa e no tempo florescência modificado quando estas seqüências são superexpressas. Os efeitos de desenvolvimento atribuíveis a superexpressão de membros da clade G1073 indicam que estes genes poderiam ser usados para modificar traços tais como tempo e tamanho do órgão de florescência. A coloração escura exibida por algumas das linhagens de G3456 podia indicar níveis aumentados de clorofila,* o G345S pôde consequentemente também impactar a capacidade fotosíntêtica, o rendimento, e o valor nutritivo.

Exemplo VIII. Mitigação de efeitos morfolõgicos indesejáveis pela superexpressão de polipeptídea da clade G1073.

Os resultados do estresse abiótico mostrados acima fornecem a evidência que os membros da clade G1073 de polipeptideos do fator de transcrição podem ser usados para criar plantas com características de rendimento, desempenho e/ou escala melhorados. No entanto, a superexpressão destes membros do clade pode trazer efeitos morfolõgicos não desejados, incluindo tamanho menor da planta. Isto foi observado com muitas, mas não em todas, as linhagens geradas no presente estudo. Desde que ê frequentemente desejável gerar plantas com estatura normal ou quase normal, uma redução ou uma eliminação de outras características morfológicas causadas pela superexpressão de um membro do clade G1073 sob o controle regulatório de um promotor constitutivo não podem sempre ser a melhor abordagem para melhorar a tolerância ao estresse.

Este presente estudo incluiu também uma investigação no uso de promotores alternativos do ou sistemas de superexpressão de dois componentes com o propósito de conferir tolerância realçada ao estresse e eliminar as anormalidades de desenvolvimento, tal como, o tamanho reduzido' que foi associado com a superexpressão constitutiva de G1G73. Neste sentido, a presente invenção relaciona-se também aos métodos e às composições para produzir plantas transgênicas com desempenho melhorado ao estresse conseguido pela alteração da expressão de G1Q73 e de seqüências relacionadas com combinações específicas do promotor - gene ou outros meios regulatórios. Estas combinações podem regular padrões da expressão de fator de transcrição de uma forma transeunte, induzível, ou órgão ou a tecido- específica. Como mostrado abaixo, esta abordagem pode ser usada para gerar as plantas que são morfologicamente as plantas similares do controle do tipo selvagem que não foram transformadas com um polínucleotídeo que codifica G1Q73 ou um equivãlogo. Desta forma, o tipo de elemento regulatõrio usado para controlar o regulamento do gene do fator de transcrição pode ser usado para aliviar os anormalidades de desenvolvimento indesejáveis ou os efeitos morfológicos adversos que resultariam de outra maneira superexpressão dos mesmos genes do fator de transcrição com um promotor constitutivo, tal como, o promotor 35S, Raiz ARSKl::G1073 (Arabidopsis) Nós obtivemos as linhagens ARSKl::G1073 usando uma abordagem de dois componentes; nenhum efeito consistente na morfologia era aparente entre estes transformantes e as alterações no tamanho da folha não foram observadas. Desta forma, ou a expressão do promotor ARSKl foi demasiada fraca ou a expressão da raiz não foi suficiente para provocar as alterações no tamanho da folha que são aparentes nas linhagens 35S::G1073.

Interessantemente, embora as linhagens ARSKl:G1Q73 não mostrassem nenhuma mudança morfológica clara, cinco das dez destas linhagens exibiram a tolerância realçada ao cloreto de sódio em um ensaio baseado de germinação em placa. Outras duas linhagens executaram os controles do tipo selvagens em um ensaio de germinação no frio. Estes fenótipos de tolerância ao estresse osmótico são de interesse particular, desde que mostrem que G1073 pode fornecer a tolerância do estresse independentemente das mudanças no tamanho do órgão. Adicionalmente, desde que ARSK1 não ê expresso significativamente no broto do tecido, os resultados sugerem que a expressão G1073 não é requerida no broto a fim de conseguir a tolerância ao estresse. Sumário da Morfologia As linhagens de Arabidopsis nas quais o G1073 foi expressado do promotor ARSK1 (através do sistema de dois componentes) não indicou nenhuma diferença consistente na morfologia comparada aos controles. Vinte linhagens TI foram examinadas (341 - 360); três linhagens (# 342, 346, 357) foram notadas possuir desenvolvimento lígeiramente pequeno e lento. No entanto, o restante das linhagens exibiu a morfologia do tipo selvagem em todos os estágios.

Das linhagens submetidas para ensaios fisiológicos, todas, exceto a linhagem 556, mostraram segregação em placas de seleção na geração T2 que era compatível com o transgene que está presente em um único locus. As linhagens 556 mostraram segregação que era compatível com inserções em loci múltiplos.

Sumário da Fisíologia As árvores novas de cinco linhagens ARSK1: -.G1Q73 tiveram mais vigor de árvore nova quando germinadas nas placas que contêm o cloreto de sódio. As outras árvores novas de duas linhagens executaram melhor do que controles do tipo selvagem em um ensaio de germinação no frio, e duas linhagens executaram melhor em um ensaio da seca.

Tabela 19. G1073 (Arabidopsis) - Resultados do Ensaio ao Estresse Abiótico na Raiz ARSK1 Epidérmica CUTl;:G1073 (Arahiãopsis) Nós obtivemos as linhagens CUT1::G1073 usando uma abordagem de dois componentes,* nenhum efeito consistente na morfologia era aparente entre estes transformantes e as alterações no tamanho da folha não foram observadas. Desta forma, uma ou outra expressão do promotor CUTl era demasiada fraca ou a expressão epidérmica não era suficiente para provocar as alterações no tamanho da folha que são aparentes nas linhagens 35S::G1Q73.

Embora as linhagens CUTl::G1073 não mostrassem nenhuma mudança morfolõgica clara, três de dez destas linhagens exibiram a tolerância realçada ao cloreto de sódio em um ensaio 'de germinação baseado em placa. Duas destas linhagens executaram também controles do tipo selvagem em um ensaio de germinação de sacarose, visto que a terceira linhagem germinou melhor do que controles do tipo selvagem em meios com manitol. Uma quarta linhagem CUTl: .-G10 73 deu um resultado positivo no ensaio de sacarose sozinho. Embora estes fenótipos da tolerância ao estresse osmótico sejam vistos em um número de linhagens relativamente pequeno, são de interesse particular, uma vez que sugerem que G1Q73 pode fornecer a tolerância ao estresse independentemente das mudanças no tamanho do órgão. Adicionalmente, a linhagem do excitador CUT1 não dã a expressão significativa na raiz, sugerindo que a expressão G1073 não ê requerida na raiz a fim de conseguir tal tolerância.

Sumário da morfologia As .linhagens de Arabidopsis que expressam G1073 do promotor CUT1 (que usa o sistema de dois componentes ; CUT1::LexA; opLexA::G1073) têm sido gerados agora. Um total de dezenove das linhagens foi obtido (381 - 399) . Alguma variação do tamanho era aparente em estágios adiantados do crescimento, mas no total, as plantas não mostraram nenhuma diferença consistente na morfologia em relação aos controles.

Das linhagens submetidas para ensaios fisiológicos, o seguinte mostrou uma segregação em placas de seleção na geração T2 que era compatível com o transgene que está presente em um único locus: 384, 391, 392, 394, 396. As linhagens 381, 390, 393, 395, 397 mostraram a segregação que era compatível com inserções em loci múltiplos.

Sumário da fisiologia (ensaios de placa) Três linhagens CUT1: :G1073 mostraram vigor de árvore nova aumentado quando germinado nas placas que contêm o cloreto de sódio. Destas três linhagens, os árvores novas de duas linhagens executaram também melhor do que controles do tipo selvagem quando germinado em sacarose visto que as árvores novas da terceira linhagem tiveram o vigor melhor quando germinado em placas contendo manitol. Uma quarta linhagem mostrou um desempenho melhor em um ensaio da germinação em sacarose.

Tabela 20. G1073 (Arabidopsís) - Resultados do Ensaio ao Estresse Abiótico em CUTl Epidérmico ■Vascular SIJC2 : :G1073 (Arabidopsis) Nós obtivemos as linhagens SUC2.-G1073 usando uma abordagem de dois componentes; a maioria destas linhagens mostraram morfologia do tipo selvagem, e diversas linhagens tinham tolerância aumentada ao estresse comparada às plantas ' de controle do tipo selvagem. Cinco de treze linhagens exibiram um ligeiro atraso no início da florescência, e desenvolveram folhas largas em relação aos controles. Este efeito tornou-se particularmente aparente nos últimos estágios do desenvolvimento. Os fenótípos similares foram obtidos em uma freqüência similar nas linhagens 35S::G1073; desta forma SUC2 e os promotores 35S produziram efeitos morfológicos comparáveis quando usados em combinação com G1073.

Sumário da Morfologia Dois conjuntos de linhagens 2- componentes foram obtidos (# 1081 - 1088, 1101 - 1105) para que uma construção opLexA;:G1073 fosse supertransformada em uma linhagem condutora do promotor de SUC2::LexA - GAL4TA. Um número destas linhagens exibiram folhas largas e um ligeiro atraso np início da florescência, como detalhado abaixo: Linhagens 1081 - 1088: todos pareceram normais em estágios adiantados. #1085 e #1088 tiveram florescência ligeiramente atrasada e desenvolveram folhas largas nos últimos estágios. #1082 tiveram também florescência ligeiramente atrasada. As linhagens restantes mostraram a morfologia do tipo selvagem em todos os estágios.

Linhagens 1101 - 1105: todos eram ligeiramente pequenos em estágios adiantados. #1102 e #1105 tiveram a florescência ligeiramente mais atrasada e #1102 desenvolveu a roseta de folhas largas em estágios atrasados. Todas as linhagens restantes pareceram normais mais tarde no desenvolvimento.

Deve-se notar que uma construção direta da construção promotor- fusão (P21521) para SUC2::G1073 estêve construída também, mas linhagens contendo essa construção não foram ainda selecionadas.

Sumário da Físiologia Três as linhagens SUC2: .-G1073 mostraram vigor aumentado de árvore nova quando germinadas em placas em condições frias. As arvores novas de duas destas linhagens executaram também melhor do que controles do tipo selvagem quando germinadas em placas contendo manitol. Uma quarta linhagem mostrou um desempenho melhor em um ensaio de seca baseado em placa.

Tabela 21. G1073 (Arabidopsis) - Resultados do Ensaio ao Estresse Abiótico SUC2 Vascular Folha RBCS3;:G1073 (Arabidopsis) Nós obtivemos linhagens de promotores tecido- específícos (folha) RBCS3::G1073 usando uma abordagem de dois componentes.

Sumário da Morfologia As 'linhagens 541 e 542 podem ter estado marginalmente x—iI Am atrasadas, mas de outra maneira não mostraram nenhuma diferença morfológica óbvia quanto a controles do tipo selvagem.

As linhagens 961 - 973 cresceram ligeiramente mais devagar do que controles do tipo selvaqem, mas foram de X—é mí, Am mmA r outra maneira morfologicamente semelhantes aos controles. Sumário da Fisiología Mais notavelmente, as árvores novas dessas super exp-ressoras mostraram tolerância aumentada aos estresses osmõticos de sal e calor em ensaios de germinação. Duas linhagens mostraram tolerância aumentada ao frio em ensaios de crescimento.

Tabela 22. G1073 (Arabidopsis) - Resultados do Ensaio ao Estresse Abíótico Folha RBCS3 Super Ativação (N - GAL4 - TA) de G1073 (Arabzdopsís) Nós temos agora isolado linhagens que superexpressam uma versão da proteína G1073 que tem um domínio de ativação GAL4 fundido ao terminal N, Sumário da Morfologia Em sua maioria, as linhagens foram morf©logicamente indistinguíveis dos controles de tipo selvagem, com um número de linhagens que têm fisiologia normal ou perto da normal. Contudo, houve um pequeno número de plantas que mostraram florescência atrasada e modificações na forma da folha. Além do mais, alguns foram observados possuir coloração escura.

Três lotes de linhagens foram gerados que superexpressaram uma forma super- ativa de G1073 que compreende um domínio de transativação GAL4 fundido ao terminal N da proteína; linhagens 841 - 852, 981 - 991, e 1441 - 1460. A maioria das plantas em cada uma das plantações acima mencionadas pareceu ser do tipo selvagem; contudo florescência atrasada, e modificações na forma da folha foram evidentes em um pequeno número das linhagens em cada conjunto. As plantas mostrando este fenótipo floriram até 3 - 4 semanas depois de controles do tipo selvagem (embaixo de 24 horas de luz), tinham coloração escura, e tiveram folhas que ficaram enroladas e torcidas (em particular nas últimas etapas do ciclo de vida).

Este fenótipo acima foi observado com as seguintes frequências: - linhagens 3/12 (846, 851, 852) do conjunto 841 - 852 - linhagens 2/11 (983, 989) do conjunto 981 - 991. - linhagens 7/20 (1442, 1443, 1449, 1452, 1453, 1454, 1455) do conjunto 1441 - 1460.

Das plantas neste conjunto final, contudo, sô #1442 mostrou um fenótipo forte ao passo que os outros expuseram efeitos 'relativamente brandos. É talvez digno de nota que além dos efeitos no tempo de florescência e desenvolvimento da folha, um número pequeno das linhagens TI obtidas no segundo grupo (981 -991) deonstraram ser mais avançados do que controles do tipo selvagem no estágio de 7 dias. No entanto, este efeito não foi observado na progênie T2 de algumas daquelas linhagens ou em qualquer um de outros dois conjuntos das plantas TI.

Sumário da Fisíologia As árvores novas de duas destas linhagens superativadas mostraram tolerância aumentada ao ABA, e germinaram em placas em condições frias. As árvores novas de duas linhagens executaram também melhor do que controles do tipo selvagem em um ensaio de seca baseado em placa. Outras linhagens mostraram um desempenho melhor em um ensaio de estresse osmótico baseado em sacarose, ou em ensaios de crescimento em condições frias ou quentes.

Tabela 23. G1Q73 (Arabidopsis) - Resultados do Ensaio ao Estresse Abiótico de Super- Ativação (N - GAL4 - TA} Super- Ativação (€ - GAL4 - TA) de G1073 (Ãrabidopsís) Nós temos isolado agora as linhagens que superexpressam uma versão da proteína G1073 que tem um domínio de ativação GAL4 fundido ao terminal C, Sumário da Morfologia Em vários estágios do crescimento, algumas das plantas com um domínio de ativação GAL4 fundido ao terminal C era um tanto pequeno. No entanto, muitas das plantas lã eram mais tolerantes aos estresses abióticos, indicados na tabela abaixo, eram somente ligeiramente menores do que controles do tipo selvagem em alguns estágios do crescimento, e muitas das linhagens eram morfologicamente plantas muito similares ao controle do tipo selvagem. Sumário da Fisiologia A maioria das linhagens C-GAL4 que superativaram as linhagens testadas eram mais tolerantes ao estresse osmõtico em um ensaio de dessecação severo baseado em placa do que plantas de controle do tipo selvagem. Duas linhagens eram mais tolerantes ao alto teor manitol.

Tabela 24. G1073 (Arabidopsis) - Super Ativação (C- GAL4-TA) Resultados do Ensaio de Estresse Abiótico Raiz ARSK1::G1067 (Arabidopsis) Nós obtivemos as linhagens ARSK1::G1067 específicas para tecido (raiz) usando uma abordagem de dois componentes, A maioria (18 de 26) destes transformantes apareceu tipo selvagem, e não indicou nenhuma evidência de folhas onduladas e diminuição severa. Oito de 26 linhagens mostraram reduções de tamanho e desenvolveram-se mais lentamente do que controles, âs várias extensões.

Nos ensaios do estresse baseados em placa, quatro de dez linhagens das linhagens ARSK1::G1067 mostraram a tolerância realçada em um ensaio de desidratação severa. Todas estas quatro linhagens tinham mostrado um fenótipo do tipo selvagem nas avaliações morfológicas, demonstrando que o G1067 podería realçar a tolerância a seca sem produzir efeitos negativos óbvios no tamanho da planta. Outras três linhagens ARSK1:;G1Q67 executaram plantas de controle do tipo selvagem em um ensaio da germinação em alto teor de NaCl.

Tabela 25. ARSK1::G1067 Resultados do Ensaio para Estresse Abiótico Folha RBCS3::G1Q67 (Arabidopsis) Nós obtivemos linhagens específicas de tecido {da folha) do promotor RBCS3:G1Q67 usando uma abordagem de dois componentes.

Um número de linhagens RBCS3::G1067 produzidas com uma abordagem de dois componentes eram geralmente pequenas nos estágios iniciais, tinham folhas curtas e arredondadas e floresceram ligeiramente atrasadas. Em estágios mais posteriores do crescimento, as folhas tornaram-se deformadas e onduladas, mas em linhagens ocasionais as folhas pareceram mais largas do que aquelas dos controles. A aparência das folhas largas, não obstante em uma freqüência baixa, sugere que G1073 e G1067 puderam, ao menos em alguma extensão, ser funcionalmente relacionados.

As linhagens 581 - 590 mostraram que um ligeiro atraso no início da florescência (aproximadamente 1-5 dias sob a luz de 24 horas).

Em estágios iniciais do crescimento, as linhagens 621 - 629 eram ligeiramente pequenas em estágios iniciais e tinham folhas curtas, redondas, um tanto largas. A florescência atrasada não foi notada neste conjunto de linhagens. Posteriormente no estágio de florescência, as linhagens 621 - 629 não tiveram nenhuma diferenças morfológica consistentes relativo a planta de controle do tipo selvagem, â exceção das linhagens 622, 624, que tiveram folhas ligeiramente largas e chatas. Em estágios posteriores do crescimento não havia nenhuma diferença consistente na morfologia entre linhagens superexpressantes 621 - 629 e plantas de controle do tipo selvagem. Diversas destas linhagens tiveram uma tolerância maior ao estresse do que as plantas do controle do tipo selvagem, como visto na seguinte tabela.

Tabela 26. RBCS3 .·;G1Q67 Resultados do Ensaio para Estresse Abiótico Estresse induzível RD29A::G1067 {Ar&bidopsis) Nós obtivemos linhagens de estresse induzível do promotor RD29A::G1067 usando uma abordagem de dois componentes. A maioria destas linhagens RD29A;:LexA;opLexA::G1067 da linhagem de RD29A de fundo 5 não mostrou nenhuma alteração consistente na morfologia em relação aos controles. Um número menor dos transformantes mostrou que uma redução pequena no tamanho e folhas ligeiramente mais arredondadas do que controles. Desta forma, nestas linhagens, a expressão baixa constitutiva produzida pela linhagem- condutora podería ter provocado tais efeitos. No entanto, nenhumas das linhagens mostraram diminuição extrema e folhas onduladas visto nas linhagens 35S::G1067.

Diversas destas linhagens tiveram uma tolerância maior ao estresse do que as plantas de controle do tipo selvagem, particularmente nos ensaios de dessecação severa baseados em placa, como visto na seguinte tabela.

Tabela 27. RD29A::G1Q67 Resultados do Ensaio para Estresse Abiótico Raiz ARSK1::G2156 {Arabidopsis) Nós obtivemos linhagens especificas de tecido (da raiz) do promotor ARSK1::G2156 usando uma abordagem de dois componentes.

Aproximadamente a metade das linhagens de um destes grupos indicou um atraso muito marqinal no início de florescência, mas a maioria das linhagens não indicou nenhuma diferença óbvia em crescimento e em desenvolvimento para os .controles do tipo selvagem. Desta forma, o uso de um promotor da raiz em combinação com G2156 eliminou pela maior parte as morfologias indesejáveis produzidas pela superexpressão desse gene.

Diversas destas linhagens tiveram também uma tolerância maior ao estresse do que as plantas do controle do tipo selvagem, particularmente em ensaios de dessecação severa baseados em placa, como visto na seguinte tabela.

Tabela 28. ARSK1::G2156 Resultados do Ensaio para Estresse Abiótico Folha RBCS3::G2156 (Arabidopsis) Nós obtivemos linhagens específicas de tecido (da folha) do promotor RBCS3::G2156 usando uma abordagem de dois componentes.

Em estágios iniciais, estas plantas eram ligeiramente pequenas e mostravam folhas um tanto arredondadas. No entanto, em nos últimos estágios, 50 % das linhagens desenvolveram folhas largas e mostraram uma aumentada biomassa da roseta em comparação com os controles. A maioria das linhagens que mostram este fenótípo indicou também um ligeiro atraso no início da florescência. Nós observamos anteriormente folhas largas em superexpressoras constitutivas 3 5S::G2156. No entanto, as ampliações da folha foram vistas em uma freqüência mais baixa no estudo 35S::G2156 do que no estudo RBCS3::G2156. Adicionalmente, muitas das linhagens da experiência 35S::G2156 eram muito pequenas e tinham defeitos múltiplos; estes efeitos parecem ter sido evitados pelo uso do promotor RBCS3. 0 tamanho aumentado da folha visto no presente estudo era comparável aos efeitos produzidos pela expressão G1073 aumentada e serve para fortalecer a conclusão que os dois genes tiveram uma atuação relativa. 0 RBCS3 produz a expressão no tecido relativamente maduro, fotosintetizante da folha. Desta forma, G2156 quando expressado em um estágio relativamente tardio do desenvolvimento da folha produziu os sinais de desenvolvimento que mantiveram o crescimento da folha. No entanto, remanesce a possibilidade que G2156 provocou a produção de sinais de desenvolvimento em folhas maduras que foram transmitidas então a um primordia folha mais nova, e os comprometeram ao supercrescimento em um estágio adiantado.

Diversas destas linhagens tiveram uma tolerância ao estresse abiótico maior do que controles do tipo selvagem (tabela 29).

Tabela 29. RBCS3::G2156 Resultados do Ensaio ao Estresse Abiótico Estresse - Induzível RD29A::G2156 (Arabidopsis) Nós obtivemos linhagens do promotor RD29A::G2156 induzível por estresse usando uma abordagem de dois componentes . A maioria dos transformantes de dois componentes RD29A:;LexA; opLexA::G2156 no fundo da linhagem 5 de RD29A não mostrou nenhuma diferença consistente na morfologia para os controles. Um número menor de linhagens floresceu ligeiramente tarde e desenvolveram folhas ampliadas mais tarde no desenvolvimento. Desta forma, nestas linhagens, a expressão baixa constitutiva produzida pela linhagem do promotor poderia ter provocado tais efeitos.

Diversas destas linhagens tiveram uma tolerância maior ao estrésse do que plantas de controle do tipo selvagem, como visto na seguinte tabela. Particularmente notáveis eram os resultados obtidos mostraram que uma maioria de linhagens era menos sensível no ensaio da germinação do ABA, indicando um fenótipo tolerante ao estresse osmótico.

Tabela 30. Resultados do Ensaio ao Estresse Abiótico - RD29A::G2156 Utilidades para os membros da clade G1073 sob controle regulatório não constitutivo Os resultados destes estudos com o controle regulatório não constitutivo de numerosos membros da clade G1073 indicam que as seqüências do polinucleotídeo e do polipeptídeo podem ser usadas para melhorar a tolerância ao estresse relacionado a seca enquanto mantem a morfologia normal ou quase normal sob condições livres de estresse ou baixo estresse, e o tamanho e melhorado vigor relativo as plantas do controle do tipo selvagem sob condições de estresse abiótico. Os dados confirmam também nossas conclusões que G1Q73 e outros membros do clade G1073 podem ser ferramentas valiosas a fim de aumentar o rendimento, a biomassa e modificar o tempo florescência. A análise das combinações do membro do clade G1073 com os elementos regulatõrios foi executada para 1) fornecer introspecções mecanicisticas na função do membro do clade G1073, e 2) identificar testes padrões otimizados da expressão do membro do clade G1073. A expressão diferencial de G1Q73 e de seqüências relacionadas revelou que algum grau de tolerância ao estresse do osmótico pode ser obtido sem um impacto significativo no tamanho da planta ou do órgão. Os exemplos específicos incluem a expressão com promotores tecido-específicos, incluindo o CUT1 (epiderme -específico) , O SUC2 (vascular - específico) , o ARSK1 (raiz - específico), os promotores RBCS3(específico da folha) , e os promotores do estresse induzível, incluindo o promotor de RD23A. As linhagens que superexpressam um forma super-ativa de G1073 que compreende um domínio de transactivação GAL4 fundido ou ao N ou ao C terminal do polipeptídeo era também mais tolerante aos estresses abiótico, e eram geralmente morfologicamente plantas similares do controle do tipo selvagem. Estas combinações do elemento da transcrição do fator regulatório demonstram que membros da clade G1073 tecido-específicos, induzíveis e transactivados podem ser usadas para fornecer a tolerância ao estresse abiótico com quase nenhum ou nenhum impacto no crescimento de planta total ou rendimento sob condições de baixo estresse abiótico, e melhoram significativamente o rendimento e o vigor nas condições de estresse abiótico.

Exemplo IX; Identificação de Sequências Homólogas pela Busca de Homologia por Computador Este exemplo descreve a identificação dos genes que são ortõlogos aos fatores de transcrição do Arabidopsis thaliana de uma busca de homologia por computador.

As sequências homólogas, incluindo aqueles dos parãlogos e os ortólogos de Arabidopsis e de outras espécies da planta, foram identificados usando ferramentas da busca da seqüência da base de dados, tais como a Basic Local Alignment Search Tool (BLAST) (Altschul et al. (1990) supra,- e Altschul et al. (1997) Nucleic Acid Res. 25; 3389 - 3402). Os programas da análise da seqüência do tblastx foram empregados usando a matriz de marcação BLOSUM-62 (Henikoff e Henikoff {1992) Proc. Natl. Acad. Sei. EUA 89; 10915 - ' 10919) . A base de dados de NCBI Banco Genético inteira foi filtrada para sequências de todas as plantas exceto a de Arabidopsis thaliana pela seleção de todas as entradas na base de dados de NCBI Banco Genético associada com o NCBI taxonomic 33030 ID (Viridiplantae; todas as plantas) e excluindo entradas associadas com o ID taxonomic 3701 (de Arabidopsis thaliana).

Istas seqüências são comparadas às sequências que representam os genes do fator de transcrição apresentados na Listagem de Seqüências, usando o algoritmo da universidade TBLASTX de Washington (versão 2.0al9MP) nos ajustes ‘padrões usando alinhamentos cruzados com o filtro "off". Para cada gene do fator de transcrição na listagem de seqüências, as comparações individuais foram requisitadas pela contagem da probabilidade (valor P), onde a contagem reflete a probabilidade que um alinhamento particular tenha ocorrido por acaso. Por exemplo, uma contagem de 3.6e - 59 ê 3,6 x 10 - 59. Além disso, para os valores P, as comparações foram marcadas também pela identidade da porcentagem. A identidade da porcentagem reflete ,o grau a que dois segmentos do DNA ou da proteína são idênticos sobre um comprimento particular. Os exemplos das seqüências desta forma que identificados são apresentados em, por exemplo, a listagem de seqüências, e a tabela 5. As seqüências parãlogas ou ortólogas estavam identificado prontamente e disponível em Banco Genético pelo número de ascensão (tabela 5; Identificador da seqüência ou número de ascensão). A identidade da seqüência de porcentagem entre estas sequências pode ser tão baixa quanto 49 %, ou mesmo identidade da seqüência mais baixas.

As sequências parãlogas do candidato foram identificadas entre os fatores de transcrição de Arabidopsis com o alinhamento, a identidade, e os relacionamentos filogenéticos. G1067, G2153 e G2156 (SEQ ID NO.; 4, 6, e 8, respectivamente), parãlogos de G1073, podem ser encontrados na listagem de seqüências.

As sequências ortólogas candidatas foram identificadas dos conjuntos proprietários do unigene de sequências de gene da planta de Zea mays, de Glícina max e de Oryza sativa baseado na homologia significativa aos fatores de transcrição de Arabidopsis. Estes candidatos foram comparados reciprocamente ao conjunto de fatores de transcrição de Arabidopsis. Se o candidato mostrasse a similaridade máxima no domínio da proteína para o fator de eliciação da transcrição ou para um parãlogo do fator de elicíação da transcrição, a seguir foi considerado como sendo um ortólogo. As seqüências identificadas de não Arabidopsis que foram mostradas nesta maneira para ser ortólogas às seqüências de Arabidopsis são fornecidas em, por exemplo, tabela 5.

Exemplo X: A identificação de seqüências de ortólogas e parãlogas por PCR

Os ortõlogos aos genes de Arabidopsis podem ser identificados por diversos métodos, incluindo a hibridização, a amplificação, ou bioinformaticamente, Este exemplo descreve como alguém pode identificar equivãlogos ao fator CBF1 da transcrição da família de Arabidopsis AP2, que confere tolerância aos estresses abióticos (Thomashow et al. (2002) patente U.S. no. 6.417.428), e um exemplo para confirmar a função de sequências homólogas. Neste exemplo, os ortólogos a CBF1 foram encontrados em canola (Brassica napus) que usa a reação da polimerase em cadeia (PCR - do inglês polimerase chain reactíon).

Os -primers degenerados foram projetados para regiões do domínio AP 2 e da parte externa de ligaçãos do AP 2 {domínio terminal carboxila);

Mol 368 (reversa) 5'- CAY CCN ATH TAY MGN GGN GT -3’ (Pedido de Patente Americano 20040098764) Mol 378 (forward) 5'- GGN ARN ARC ATM CCY TCN GCC -3' (Pedido de Patente Americano 20040098764) (Y: C/T, N: Ά/C/G/T, H; A/C/T, M: A/C, R; A/G) O primer Mol 36 8 está no domínio de ligação AP2 de CBF1 (sequência de aminoãcidos; Bis - Pro - Ile -Tyr - Arg - Gly - Vai - Ile - Tyr - Arg - Gly - Vai) enquanto o primer Mol 378 estiver fora do domínio AP2 (domínio carboxi- terminal) (seqüêncía de aminoácidos: Met - Ala - Glu - Gly - Met - Leu - Leu - Pro). 0 DNA genômico isolado do B. napus foi amplificado por PCR usando estes prímers seguindo estas condições: uma etapa inicial de desnaturação de 2 minutos em 93°C; 35 ciclos de 93°C para l minuto, 55 °C para 1 minuto, e 72°C para 1 minuto; e uma incubação final de 7 minutos em 72 °C no final do ciclo. ' Os produtos de PCR foram separados por eletroforese em um gel de agarose de 1,2 % e transferidos â membrana de nylon e hibridizados com a sonda AT CBF1 preparada do DNA genômico de Arabidopsis pela amplificação por PCR. Os produtos hibridizados foram visualizados pelo sistema colorimêtrico de detecção (Boehringer Mannheim) e as faixas correspondentes de um gel similar a agarose foram isoladas, usando o conjunto da extração de Qiagen (Qiagen, Valencia CA) . Os fragmentos do DNA foram ligados no vetor do clone de Ta do conjunto de clonagem do TOPO TA (Xnvítrogen Corporation, Carlsbad CA) e foram transformados na cepa TOPIO da E. coli (Invitrogen).

Sete colônias foram escolhidas e as inserções foram seqüencíadas em uma máquina de AB1 377 de ambas as fitas senso e antísenso apôs o isolamento do DNA do plasmídeo. A sequência de DNA foi editada pelo seqüenciador e alinhada com o AtCBFl pelo programa de computador GCG e busca blast NCBI» A sequência do ãcído nucléico e a sequência de aminoãcidos de um ortologo da canola encontrado desta maneira (bnCBFl) identificada por este processo são mostradas no deposito de patente dos Estados Unidos 20040098764.

As sequências alinhadas do aminoãcido mostram que o gene bnCBFl tem a identidade de 88 % com a sequência de Arabidopsis na região do domínio AP2 e identidade de 85 % com a seqüência de Arabidopsis fora do domínio AP2 quando alinhado para duas sequências da inserção que estão fora do domínio AP2.

Similarmente, as seqüências parãlogas aos genes de Arabidopsis, tal como CBF1, podem também ser identificadas. Dois parãlogos de CBF1 de Arabidopsis thaliana: CBF2 e CBF3. CBF2 e CBFB clonado e foram arranjados em seqüência como descrito abaixo.

Uma biblioteca de cDNA larnbda preparada do RNA isolado do ecotipo Columbia de Arabidopsis thaliana (Lin e Thomashow (1992) Plant Physiol. 99: 519 - 525) foi selecionado para clones recombinantes que carregam inserções relacionados ao gene CBF1 (Stockinger et al. (1997) Proc. Natl. Acad. Sei. USA 94; 1035 - 1040). CBF1 foi radiomarcado com 32P por iniciação aleatória (Sambrook et al. supra) e usado para selecionar a biblioteca pela técnica plaque-lift usando a hibridização padrão estringente e condições de lavagem (Hajela et al. (1990) Plant Physiol. 93: 1246 - 1252,-Sambrook et al. supra) tampão 6 X SSPE, 60°C para a hibridização e tampão 0,1 X SSPE e 60 °C para lavagens). Doze clones positivamente hibridizantes foram obtidos e as seqüências de DNA das inserções do cDNA foram determinadas. Os resultados indicaram que clones entraram em três classes. Uma classe carregou as inserções que correspondem a CBF1. As duas outras classes carregaram as seqüências que correspondem a dois homólogos diferentes de CBF1, denominados CBF2 e CBF3. As seqüências do ácido nucleico e as seqüências codificantes preditas da proteína para Arabidopsis CBF1, CBF2 e CBF3 podem ser encontradas, por exemplo, no depósito de patente dos Estados Unidos 20040098764, como são as seqüências do ácido nucleico e a seqüência codificante predita da proteína para o ortólogo bnCBFl do CBF da Brassica napus. Uma comparação das seqüêncías do ácido nucleico de Arabidopsis CBF1, CBF2 e CBF3 indica que são 83 a 85 % idênticos como mostrado na tabela 31. TABELA 31. Comparação da identidade da Arabidopsis CBF1, CBF2 e CBF3 a Porcentagem de identidade foi medida usando o algoritmo Clustal do programa Megalign {DNASTAR; Inc.). • b As comparações das sequências de ácido nucleico das estruturas abertas de leitura são mostradas.

Similarmente, as seqüências de aminoãcidos dos três polipeptídeos de CBF variam de 84 à identidade de 86 %. Um alinhamento das três seqüências de aminoãcidos revela que a maioria das diferenças na seqüência de aminoãcidos ocorre na metade acídica C- terminal do polipeptídeo. Esta região de CBF1 serve como um domínio de ativação em ambos no fungo e na Arabidopsis (não mostrados).

Os resíduos 47 a 106 de CBF1 correspondem ao domínio AP2 da proteína, um motivo de ligação de DNA que até o momento, foi encontrado somente em proteínas de planta. Uma comparação dos domínios AP 2 de CBF1, de CBF2 e de CBF3 indica que hã algumas diferenças na seqüência de arainoãcidos. Estas diferenças na seqüência de aminoãcidos puderam ter um efeito na especificidade de ligação do DNA.

Exemplo .XI: Transformação de Canola com um plasmídeo que contêm CBF1, CBF2, ou CBF3 Após ter identificado genes homólogos a CBF1, a canola foi transformada com um plasmídeo que contém Arabidopsis CBF1, CBF2, ou genes CBF3 clonados no vetor pGA643 (An (1987) Methods Enzymol. 253: 292). Nestas construções, os genes de CBF foram expressos constitutivamente sob o promotor CaMV 35S. Além disso, o gene CBF1 foi clonado sob o controle do promotor de Arabidopsis C0R15 no mesmo vetor pGAS43. Cada construção foi transformada na cepa GV3101 de Agrobacterium. Agrobacteria transformada foi crescida por 2 dias em meio mínimo AB que contêm antibióticos apropriados. A canola de primavera (B. napus cv. Westar) foi transformada usando o protocolo de Moloney et al. (1989) Plant Cell Reports 8: 238, com algumas modificações como descritas. Momentaneamente, as sementes foram esterilizadas e colocadas em placas com meio MS de meia força, contendo sacarose de 1 %. As placas incubadas em 20°C sob luz de 60 - 80 pE/m2s usando um fotoperíodo de 16 horas de luz /8 horas de escuro. Os cotilédones de árvores novas de 4 - 5 dias de idade foram coletados, os petioles foram cortados e mergulhados na solução de Agrobacterium. Os cotilédones mergulhados foram colocados em meio de co- cultivação em uma densidade de 20 cotilédones/placa e incubados como descrito acima por 3 dias. Explantes foram transferidos aos mesmos meios, mas contendo 300 mg/1 de timentina (SmithKline Beecham, PA) e diluído a 10 cotilédones/placa. Após 7 dias, os explantes foram transferidos ao meio de Seleção/Regeneração. As transferências foram continuadas a cada 2-3 semanas (2 ou 3 vezes) até que os brotos se desenvolveram. Os brotos foram transferidos ao meio do Elongação de broto a cada 2-3 semanas. Os brotos parecenco saudáveis foram transferidos ao meio para enraizar. Uma vez que as raízes boas se desenvolveram, as plantas foram colocadas em solo húmido no vaso. As plantas transformadas foram então analisadas para a presença do gene NPTII /resistência a canamicina por ELISA, usando o kit NPTII de ELISA de SPrime - 3Prime Inc. {Boulder, CO) . Aproximadamente 70 % das plantas selecionadas eram NPTII positivo. Somente aquelas plantas foram analisadas em seguida.

Da . análise de Northern blot das plantas que foram s, transformadas com as construções que expressam constitutivamente, mostraram expressão de genes CBF e todos os genes CBF foram capazes de induzir o gene BN115 regulado pelo frio de Brassíca napus (homólogo do gene COR 15 de Arabídopsis) . A maioria das plantas transgênicas parece exibir um fenótipo normal de crescimento. Como esperado, as plantas transgênicas são mais tolerantes ao congelamento do que as plantas de controle do tipo selvagem. Usando o escapamento de eletrõlito do teste de folhas, o controle mostrou um escapamento de 50 % a -2 a -3°C. A canola de primavera transformada com o CBF1 ou CBF2 mostrou que um escapamento de 50 % a -6 a -7°C. A canola de primavera transformada com o CBF3 mostrou que um escapamento de 50 % a -10 a -15°C. A canola de inverno transformada com o CBF3 mostrou ·que um escapamento de 50 % a -16 a -20°C. Além disso, se a canola de primavera ou inverno fosse aclimatada ao frio, as plantas transformadas poderíam exibir um aumento adicional na tolerância ao congelamento de ao menos -2 ° C.

Para testar a tolerância à salinidade das plantas transformadas, as plantas foram molhadas com 150 milímetros de NaCl. As Plantas superexpressando CBF1, CBF2, ou CBF3 cresceram melhor comparado com as plantas que não tinham sido transformadas com CBF1, CBF2, ou CBF3.

Estes resultados demonstram que os equivãlogos de fatores de transcrição de Arabidopsis podem ser identificados e mostrados para conferir funções similares em espécies de plantas não - Arabidopsis.

Exemplo XII: Ensaios de Deslocamento de Gel. A presença de um fator de transcrição que compreende um domínio de ligação do DNA que se ligue a um elemento de ligação do fator de transcrição do DNA é avaliada usando o seguinte ensaio de deslocamento de gel. 0 fator de transcrição é recombinantemente expressado e isolado de E. coli ou isolado do material de planta. A proteína solúvel total, incluindo o fator de transcrição, (40 ng) é incubado na temperatura ambiente em 10 μΐ de tampão de ligação IX (15 milímetros HEPES (pH 7,9), 1 milímetro de EDTA, 30 milímetros de kCl, 5 % de glicerol, 5 % de albumina de soro bovino, 1 milímetro DTT) mais 50 ng poli(dl - dC):poli(dl -dC) (Pharmacia, Piscataway NJ) com ou sem 100 ng de DNA concorrente. Após uma incubação de 10 minutos, a sonda de que compreende um elemento de ligação do fator de transcrição do DNA (1 ng) que foi marcado com 32P pelo enchimento da extremidade (Sambrook et al. (1989) supra) ê adicionado e a mistura incubada por mais 10 minutos. As amostras são carregadas nos géis de poliacrilamida (4 % p/v) e fracionadas por eletroforese em 150V por 2 h (Sambrook et al. supra) . O grau de ligação sonda de DNA -fator de transcrição ê visualizado usando a autoradiograf ia. As sondas e os DNAs concorrentes são preparados das inserções de oligonucleotídeo ligados no sítio BámHI de pUCllS (Vieira et al. (1987) Methods Enzymol. 153; 3 - 11). 0 número da orientação e concatenação das inserções ê determinado pela análise da sequência de DNA dideoxi (Sambrook et al. supra). As inserções são recuperadas após a digestão da limitação com EcoRI e HindIII e o f racionamento nos géis de poliacrilamida (12 % p/v) (Sambrook et al. supra).

Exemplo XIII. Transformação de dicotiledôneas Os membros superexpressantes de espécies de colheita do clade G1073 dos polipeptídeos do fator de transcrição (por exemplo» G2153) foram mostrados experimentamente para produzir plantas com biomassa aumentada em experimentos de campo. Esta observação indica que estes genes» quando superexpressos» resultarão em rendimentos maiores de varias espécies de plantas» que podem ser as mais significativas naquelas plantas em que a porção vegetativa da planta é comestível. Os tomateiros que superexpressam o polípeptídeo G2153 da A. thaliana foram descobertos ser maiores do que tomateiros de controle do tipo selvagem.

Desta forma, as seqüências do fator de transcrição listadas· na listagem de seqüências recombinadas em vetores de expressão pMEN20 ou pMEN65 podem ser transformadas em uma planta com a finalidade de modificar os traços da planta. 0 vetor de clonagem pode ser introduzido em uma variedade de plantas de cereal por meios bem conhecidos na técnica como, por exemplo, transferência direta do DNA ou transformação mediada por Agrobacterium tumefaciens. Ê agora rotina produzir plantas transgênicas usando a maioria de plantas dicotiledôneas (veja Weissbach e Weissbach, (1989) supra; Gelvin et al. (1990) supra; Herrera-Estrella et al. (1983) supra; Bevan (1984) supra; e Klee (1985) supra). Os métodos para análise dos traços são rotineiros na técnica e os exemplos são descritos acima.

Numerosos protocolos para a transformação de plantas de tomate e soja têm sido descritos previamente, e são bem conhecidos na técnica. Gruber et al. ((1993) em Methods in Plant Molecular Biology and Bíotechnology, p. 89 - 119, Glick e Thompson, eds., CRC Press, Inc., Boca Raton) descrevem diversos vetores de expressão e métodos de cultura que podem ser usados para a transformação da célula ou tecido e regeneração subsequente. Para a transformação do grão de soja, os métodos são descritos por Miki et al. (1993) em Methods in Plant Molecular Biology and Biotechnology, p. 67 - 88, Glíck e Thompson, eds., CRC Press, Inc., Boca Raton; e Patente U.S. No. 5,563,055, (Townsend e Thomas), publicada em 8 de outubro de 1996. Hã um número substancial de alternativas aos protocolos de transformação mediados por Agrobacterium, outros métodos com finalidade de transferir genes exógenos em grãos de soja ou em tomates. Um desses métodos ê a transformação mediada por microprojéteis, em que o DNA na superfície das partículas do microprojétil ê dirigido em tecidos de planta com um dispositivo de biobalística (veja, por exemplo, Sanford et al., (1987) Part. Scí. Technol. 5; 27 - 37; Christou et al. (1992) plant. J, 2: 275 - 281; Sanford (1993) Methods Enzymol. 217: 483 - 509; Klein et al. (1987) Nature 327: 70 - 73; Patente U.S. No. 5,015,580 (Christou et al) , publicada em 14 de maio de 1991; e Patente U.S. No. 5,322,783 (Tomes et al.), publicada em 21 de j unho de 1994.

Alternativamente, métodos de sonicação (veja, por exemplo, Zhang et al. (1991) Bio/Technology 9: 996 - 997); absorção direta do DNA em protoplastos usando a precipitação de CaCl2, o álcool de polivinila ou polí- L- ornitina (veja, por exemplo, Hain et al. (1985) Mol. Gen. Gene t. 199: 161 - 168; Draper et al. , Plant Cell Physiol. 23: 451 - 458 (1982)); lipossoma ou fusão de esferoplasto (veja, por exemplo, Deshayes et al. (1985) EMBO J., 4: 2731 - 2737; Christou et al. (1987) Proc. Natl, Acad. Sei . USA 84: 3962 - 3966); e eletroporação dos protoplastos e de células e tecidos inteiros (veja, por exemplo, Donn et al. (1990) em Abstracts of Vllth International Congress on Plant Cell and Tissue Culture IAPTC, A2 - 38: 53? D'Halluin et al. (1992) Plant Cell 4: 1495 - 1505,- e Spencer et al. (1994) Plant Mol. Biol. 24: 51 - 61) foram usados para introduzir vetores de expressão de DNA exõgeno em plantas.

Após uma planta ou célula de planta ser transformada (e o último ser regenerado em uma planta) , a planta transformada pode ser cruzada com ela mesma ou com uma planta da mesma linhagem, com uma planta não - transformada ou do tipo selvagem, ou com uma outra planta transformada de uma linhagem transgênica diferente das plantas. 0 cruzamento fornece as vantagens de produzir variedades transgênicas novas e frequentemente estáveis. Os genes e os traços que eles conferem que foram introduzidos em uma linhagem de tomate ou de grão de soja podem ser movidos em linhagem distinta de plantas usando as técnicas tradicionais de retrocruzamento conhecidas bem na técnica. A transformação de plantas de tomate pode ser conduzida usando os protocolos de Koornneef et al (1986) In Tomato Biotechnology: Alan R. Liss, Inc., 169 - 178» e na patente dos Estados Unidos 6.613.962» o último método descrito no sumário aqui. Explantes de cotilédone com oito dias de idade são pré-cultivados por 24 horas nos placas de petri contendo uma camada de nutrientes de suspensão de células de Petunia híbrida do plaqueadas no meio MS com 2 % de sacarose (p/v) e 0,8 % de âgar suplementados com ácido acêtico α-naftaleno a 10 μΜ e 6 - benzilaminopurina a 4,4 μΜ. Os explantes foram então infectados com uma cultura durante . à noite diluída de Agrobacterium tumefaciens que contêm um vetor da expressão que compreende um polinucleotídeo da invenção por 5-10 minutos» as manchas foram secas no papel de filtro estéril e cocultivado por 48 horas nas placas originais com camada de nutrientes. As condições da cultura são como descritas acima. As culturas overnight de Agrobacterium tumefaciens são diluídas no meio líquido do MS com 2 % de sacarose (p/v), pH 5,7) a um OD6Q0 de 0,8.

Depois do co-cultivação» os explantes de cotilédone são transferidos as placas de petri com meio compreendendo médio seletivo MS com zeatína de 4,56 μΜ» vancomicina de 67,3 μΜ, o cefotaxima de 418,9 μΜ e o sulfato de canamicina de 171,6 μΜ, e cultivados sob as condições da cultura descritas acima. Os explantes foram subcultivados a cada três semanas no meio fresco. Os brotos emergentes são dissecados do calo subjacente e são transferidos aos frascos de vidro com meio seletivo sem zeatina para formar a raízes. A formação das raízes em um mexo contendo sulfate de canamicina ê uma indicação positiva de uma transformação bem sucedida. A transformação de plantas do grão de soja pode ser conduzida usando os métodos encontrados em, por exemplo, patente dos Estados Unidos n. 5,563.055 (Townsend et al., emitido outubro 8, 1996), descrito no sumário aqui. Neste método a semente do grão de soja ê esterilizada na superfície pela exposição ao gãs de cloro emitido em um frasco de sino de vidro. As sementes são germinadas por plaqueamento no meio de ãgar l/io fortemente solidificado sem os reguladores de crescimento da planta e cultivadas em 28° C. com a dureção de um dia de 16 horas. Após três ou quatro dias, a semente pode ser preparada para a cocultívação. O revestimento da semente é removido e o radículo em elongação ê removido 3-4 milímetros abaixo das cotilédones.

As culturas overnight do Agrobacterium tumefacíens que abrigam o vetor da expressão que compreende um polinucleotídeo da invenção são crescidas em fase log, reunidas e concentradas pelo centrifugação. As inoculações são conduzidas em grupos tais que cada placa da semente foi tratada com um pellet recentemente ressuspendido do Agrobacterium. Os pellets são ressuspendidos no meio de inoculação de 20 ml. O inóculo ê derramado em uma placa de petri que contem a semente preparada e os nós cotiledonais macerados com uma lâmina cirúrgica. Após 30 minutos os explantes são transferidos ãs placas do mesmo meio que foram solidificados. Os explantes são encaixados com o lado adaxial acima e ao nível com a superfície do meio e cultivado em 22 °C por três dias sob a luz fluorescente branca. Estas plantas podem então ser regeneradas de acordo com os métodos estabelecidos bem na técnica, como pelo movimento dos explantes após três dias para um meio líquido de contagem da seleção {veja patente dos Estados Unidos n. 5.563.055).

Os explantes podem então ser escolhidos, encaixados e cultivados no meio solidificado da seleção. Após um mês nos meios seletivos o tecido transformado torna-se visível como setores .verdes do tecido regenerado contra um fundo de tecido descorado e menos saudável. Os explantes com setores verdes são transferidos para um meio de elongação. A cultura ê continuada neste meio com transferências para placas frescas a cada duas semanas. Quando os brotos estão com 0,5 cm de comprimento podem ser cortados na base e ser colocados em um meio de enraizamento.

Exemplo XIV; Aumento de biomassa e tolerância ao estresse abiõtico em monocotiledôneas Plantas de cereal tais como, mas não limitado a, milho, trigo, arroz, sorgo, ou cevada, podem ser transformadas com as presentes seqüências de polínucleotídeo, incluindo seqüências derivadas de monocotiledônea ou de dicotiledônea - tais como aquelas apresentadas nas tabelas 2 ou 5, clonadas em um vetor tal como pGA64 3 e contendo um marcador de resistência a canamicina, e expressadas constitutivamente sob, por exemplo, os promotores CaMV 35S ou COR15. pMEN20 ou pMEN65 e outros vetores da expressão podem também ser usadas com a finalidade de modificar traços da planta. Por exemplo, pMENQ20 pode ser modificado para substituir a região do código de NptII com o gene BAR do Streptomyces hygroscopicus que confere resistência ao fosfinotrícina. Os sítios de Kpnl e de BglII do gene BAR são removidos por mutagênese sítio - dirigido com as mudanças silenciosas do cõdon. ' O vetor de clonagem pode ser introduzido em uma variedade de plantas de cereal pelos meios bem conhecidos na técnica incluindo em transferência direta do DNA ou na transformação mediada por Agrobacterium tumefaciens. A última abordagem pode ser realizada por uma variedade de meios,. incluindo, por exemplo, aquele da patente dos Estados Unidos no. 5.591.616, em que o calo da monocotiledônea é transformado pelo contato do tecido de diferenciação com o Agrobacterium que contêm o vetor de clonagem.

Os ■tecidos da amostra imersos em uma suspensão de 3x1O'9 de células de Agrobacterium que contêm o vetor de clonagem por 3-10 minutos. O material do calo é cultivado no meio contínuo em 25°C no escuro por diversos dias. Os callos são crescidos neste meio são transferidos para o meio de Regeneração. Transferências são continuadas a cada 2-3 semanas (2 ou 3 vezes) até que os brotos se desenvolvam. Os brotos são transferidos então ao meio de Elongação de broto a cada 2-3 semanas. Os brotos parecendo saudáveis são transferidos ao meio de enraizamento e depois que as raízes se desenvolvam, as plantas são colocadas em solo húmido do vaso.

As plantas transformadas são analisadas então para a presença do gene NPTII / resistência â canamicina por ELISA, usando o kit NPTII de ELISA de 5Prime - 3Prime Inc. (Boulder, CO). É também rotina usar outros métodos para produzir plantas transgênicas da maioria de colheitas de cereal (Vasil (1994) Plant Mol. Biol. 25: 925 - 937) como o milho, trigo, arroz, sorgo (Cassas et al. (1993) Proc, Natl. Acad.

Sei. EUA 90; 11212 - 11216), e cevada (Wan e Lemeaux (1994) Plant Physiol, 104:37 - 48). Os métodos de transferência de DNA, tal como, o método de microprojétil pode ser usado para o milho (Fromm et al. (1990) Bio/Technol. 8: 833 - 839; Gordon - Kamm et al. (1990) Plant Cell 2: 603 - 618,-Ishida '(1990) Fature Biotechnol. 14: 745 - 750), trigo (Vasil et al. (1992) Bio/Technol, 10: 667 - 674; Vasil et al. (1993) Bio/Technol, 11: 1553 - 1558; Weeks et al. (1993) Plant Physiol. 102: 1077 - 1084), e arroz (Christou (1991) Bio/Technol, 9: 957 - 962; Hiei et al. (1994) Plant J. 6: 271 - 282; Aldemita e Hodges (1996) Planta 199: 612 -617; e Híei et al. (1997) Plant Mol, Biol. 35: 205 - 218). Para a maioria de plantas de cereal, as células embriogênicas derivadas dos tecidos immature do escutelo são os .alvos celulares preferidos para a transformação (Hiei et al. (1997) Plant Mol. Biol. 35: 205 - 218,- Vasil (1994) Plant Mol, Biol. 25: 925 - 937). Para a transformação das células embriogênicas de milho derivadas do tecido escutelar imaturo usando o bombardeio de microprojétil, o genotipo A188XB73 é o genotipo preferido (Fromm et al. (1990) Bio/Technol. 8: 833 - 839; Gordon -Gordon-Kamm et al. (1990) Plant Cell 2; 603 - 618). Após o bombardeio de microprojétil, os tecidos são selecionados em fosfínotricína para identificar as células transgênicas embriogênicas (Gordon-Kamm et al. (1990) Plant Cell 2: 603 - 618) . As plantas transgênicas são regeneradas por técnicas padrões de regeneração do milho (Fromm et al. (1990) Bio/Technol. 8: 833 - 83 9; Gordon - Gordon-Kamm et al. (1990) Plant Cell 2; 603 - 618). A analise de Northern blot, o RT-PCR ou a análise de microarranjo das plantas regeneradas, transformadas podem ser usados para mostrar a expressão de G1073 e dos genes relacionados que são capazes de induzir a tolerância ao estresse abiôtico e tamanho maior.

Para verificar a habilidade para conferir tolerância ao estresse abiôtico, as plantas maduras que superexpressem um G1073 ou equivãlogo, ou alternativamente, árvore nova da progênie destas plantas, podem ser desafiados por um estresse osmótico, tais como, a seca, calor, sal elevado, ou congelamento. Alternativamente, estas plantas podem ser desafiadas em uma condição de estresse osmótico que pode também medir a detecção de açúcar alterada, tal como, uma condição elevada de açúcar. Pela comparação do tipo selvagem e as plantas transgênicas tratadas similarmente, as plantas transgênícas podem mostrar ter uma tolerância maior ao estresse abiótico.

Após uma planta monocotiledônea ou célula de planta ter sido transformada (e o último for regenerado em uma planta) e mostrar ter um tamanho maior ou uma tolerância ao estresse abiótico, ou produzir um rendimento maior relativo a uma planta de controle sob condições de estresse, a planta monocotiledônea transformada pode ser cruzada com si mesma ou uma planta da mesma linhagem, uma planta monocotiledônea não - transformada ou do tipo selvagem, ou uma outra planta monocotiledônea transformada de uma linhagem transgênica diferente de plantas.

Estas experiências demonstrariam que os membros do clade G1073 de polipeptídeos do fator de transcrição podem ser identificados e mostrar que conferem tamanho maior, rendimento maior, e/ou tolerância maior ao estresse abiótico em monocotiledôneas, incluindo tolerância ou resistência aos estresses múltiplos.

Exemplo XV: Seqüências que conferem melhorias significativas às espécies não - Arabidopsis A função de ortólogos específicos de G1073 foi analisada e podem ser em seguida caracterizada e incorporada em plantas de colheita. A superexpressão ectópica destes ortólogos pode ser regulada usando elementos regulatõrios constitutivos, induzíveis, ou tecido - específicos. Genes que foram examinados e demonstraram modificar traços da planta (incluindo aumento de biomassa e tolerância ao estresse abiótico) codificam membros do clade G1Q73 de polipeptídeos do fator de transcrição, tais como, aqueles encontrados na Arabidopsis thaliana (SEQ ID NO.· 2, 4, 6, 8,. 42, 67 e 69} Oryza sativa (SEQ ID NO: 10, 12, 26, 30, e 38), e Glycine max (SEQ ID NO: 14, 16, 18, e 40). Além destas sequências, espera-se que as seqüências relacionadas do polinucleotídeo que codificam os polipeptídeos encontrados na listagem de seqüências podem também 'induzir traços alterados, incluindo biomassa aumentada e tolerância ao estresse abiótico, quando transformado em uma variedade considerável das plantas de espécies diferentes, e incluindo dicotiledôneas e monocotiledôneas. As seqüências do polinucleotídeo e do polipeptídeo derivadas de monocotiledôneas (por exemplo, as seqüências do arroz) podem ser usadas para transformar plantas monocotiledôneas e dicotiledôneas, e aqueles derivados de dicotiledôneas (por exemplo, os genes de Arabidopsis e de soja) podem ser usados para transformar um ou outro grupo, embora se espere que algumas destas seqüências funcionarão melhor se o gene for transformado em uma planta do mesmo grupo que aquela de que a seqüência ê derivada.

As sementes destas plantas transgênicas são sujeitadas aos ensaios de germinação para medir a detecção de sacarose. As sementes estéreis de monocotiledôneas, incluindo, mas não limitado a, milho, arroz, trigo, centeio e sorgo, bem como dicotiledôneas incluindo, mas não limitado ao grão de soja e â alfalfa, são semeadas em 80 % de meio MS mais vitaminas com 9,4 % de sacarose; no meio de controle falta sacarose. Todas as placas do ensaio foram então cultivadas a 22°C sob 24 horas de luz, 120 - 13 0 pEin/m2/s, em uma câmara de crescimento. A avaliação da germinação e do vigor da árvore nova ê conduzida então três dias apôs o plantio. Superexpressoras destes genes podem mostrar ser mais tolerantes a sacarose elevada por ter melhor germinação, radículos mais longos, e maior expansão da cotilédone. Estes resultados indicaram que as superexpressoras de G1073, G1Q67, G1Q69, G2153, G2156, G2789, G3401 e G3460 estão envolvidas na detecção de açúcar específica para sacarose; espera-se que ortólogos similares estruturalmente destas seqüências, incluindo aqueles encontrados na listagem de seqüências, estão envolvidos também na detecção de açúcar, uma indicação da tolerância alterada ao estresse osmótico.

As plantas superexpressando as seqüências do fator de transcrição da invenção podem também ser sujeitadas aos ensaios de seca baseados em solo para identificar aquelas linhagens que são mais tolerantes a privação da água do que plantas de controle do tipo selvagem. Um número de linhagens de plantas que superexpressam um membro do clade G1Q73 de polipeptídeos do fator de transcrição serão significativamente maiores e mais verdes, com menos murchamento ou dessecação, do que plantas de controle do tipo selvagem, particularmente depois que um período de privação da água ê seguido pela não privação de água e por um período subsequente de incubação. A seqüência do membro do clade G1Q73 pode ser superexpressa sob controle regulatório de promotores constitutivos, tecido específicos, ou induzíveis ou pode compreender um domínio de transativação GAL4 fundido ou ao terminal N ou C do polipeptídeo. Os resultados apresentados no exemplo VIII indicam que os membros do clade G1073 podem conferir tolerância ao estresse quando são superexpressos sob controle regulatório de promotores não - constitutivos ou domínio de transativação fundido ao membro do clade sem um impacto significativo na morfologia da planta. As linhagens que indicam traços úteis podem ser selecionadas para um estudo adicional ou desenvolvimento comercial.

As plantas monocotiledôneas, incluindo arroz, milho, trigo, centeio, sorgo, cevada e outros, podem ser transformadas com um plasmídeo que contêm um membro do clade G1Q73 de polipeptídeos do fator de transcrição. A seqüência do clade G1073 pode incluir seqüências derivadas de dicotiledôneas ou monocotiledôneas, tais como, aquelas apresentadas na tabela l ou tabela 5. Estes genes do fator de transcrição do AT-hook podem ser clonados em um vetor, tal como, pGA643 e conter um marcador de resistência à canamicina, e então ser expressados constitutivamente sob o promotor CaMV 35S ou promotor C0R15. 0 vetor de clonagem pode ser introduzido em monocotiledôneas por, por exemplo, os meios descritos em detalhes no exemplo XIV, incluindo transferência direta do DMA ou transformação mediada por Agrobacterium tumefaciens. A última abordagem pode ser realizada por uma variedade de meios, incluindo, por exemplo, o da patente dos ESTADOS UNIDOS no. 5.591.616, em que o calo de monocotiledônea ê transformado pelo contacto o tecido de diferenciação com o Agrobact.erium que contém o vetor de clonagem.

Os tecidos da amostra imersas em uma suspensão de 3x10'9 de células de Agrobacterium que contêm o vetor de clonagem por 3-10 minutos. O material do calo é cultivado em meio sólido a 25° c no escuro por diversos dias. Os calos crescidos neste meio são transferidos ao meio de Regeneração. Transferências são continuadas a cada 2-3 semanas (2 ou 3 vetes) até que os brotos se desenvolvam. Os brotos são transferidos então ao meio de Elongação do broto a cada 2-3 semanas. Os brotos parecendo saudáveis são transferidos ao meio de enraizamento e depois que as raízes se desenvolvem, as plantas são colocadas em solo húmido de vaso.

As plantas transformadas são analisadas então para a presença do gene NPTII / resistência à canamicina por ELISA, usando o kit NPTII de ELISA de SPrime - 3Prime Inc. (Boulder, CO). A análise de Northern blot, RT-PCR ou análise de microarranjo das plantas regeneradas, transformadas pode ser usada para mostrar a expressão de um membro do clade G1073 de polípeptídeos do fator de transcrição que ê capaz de induzir a tolerância ao estresse abiótico.

Para verificar a habilidade para conferir tolerância ao estresse abiótico, plantas maduras que expressam um gene equivãlogo derivado de mono c ot i1edônea, ou alternativamente, progênie de árvore nova destas plantas, podem ser desafiadas usando os métodos descritos no exemplo VI. Pela comparação de plantas do tipo selvagens e plantas transgênicas, as últimas demonstraram ser mais tolerantes ao estresse abiótico, e/ou possuem biomassa aumentada, em comparação às plantas de controle do tipo selvagem tratadas similarmente.

Estas experiências demonstram que um número de membros representativos do clade G1073 de polipeptideos do fator de transcrição, incluindo G1067, G1Q69, G1073, G1667, G2153, G2156, G2157, G2789, G3399, G34G0, G34Q1, G3406, G3407, G3456, G3459, G3460, e G3556, podem ser identificados e mostrado.s para aumento da biomassa e/ou melhorar a tolerância ao estresse abiótico, incluindo estresses osmóticos, tais como, a seca ou o estresse de sal. Espera-se que os mesmos métodos podem ser aplicados para identificar outros membros úteis e valiosos do clade de uma faxixa diversa de espécies.

Todas as publicações e pedidos de patente mencionados neste relatório são incorporados aqui por referência â mesma extensão como se cada publicação individual ou depósito de patente foi indicada especificamente e individualmente para ser incorporada por referência. A presente invenção não é limitada pelas modalidades específicas descritas aqui. A invenção agora sendo descrita inteiramente, serã aparente a um de habilidade ordinária na técnica que muitas mudanças e modificações podem ser feitas a esta sem partir do espírito ou do escopo das reivindicações apensas. As modificações que se tornam aparentes da descrição antecedente e figuras que a acompanham caem dentro do escopo das reivindicações.

REIVINDICAÇÕES

Claims

1. Método para produzir uma planta transformada com uma maior tolerância a um estresse abiótico do que uma planta de controle caracterizado pelo fato de que o método compreende: (a) fornecer um vetor de expressão compreendendo uma sequência de polinucleotideo que codifica um membro do clade G1073 de polipeptideos do fator de transcrição; em que o membro do clade G1073 de polipeptideos fator de transcrição compreende um domínio de AT-Hook (resíduos 74-82) da SEQ ID NO: 18, e um segundo domínio conservado (resíduos 118-213) da SEQ ID NO: 18; (b) transformar uma planta alvo com o vetor de expressão para a produção da planta transformada; e (c) crescer a planta transformada que compreende o vetor de expressão

2. Método, de acordo com a reivindicação 1, caracterizado pelo fato de que a referida tolerância ao estresse abiótico é frio ou um estresse osmótico.

3. Método, de acordo com a reivindicação 2, caracterizado pelo fato de que o referido estresse osmótico é selecionado a partir do grupo consistindo de calor, dessecação, seca, congelamento, e sal elevado.

4. Método, de acordo com as reivindicações 1 a 3, caracterizado pelo fato de que o elemento regulador é um promotor induzível ou tecido-específico.

5. Método, de acordo com a reivindicação 4, caracterizado pelo fato de que a planta transformada tem uma morfologia semelhante à da planta de controle.

6. Método, de acordo com a reivindicação 4, caracterizado pelo fato de que o promotor tecido-especifico é um promotor vascular, epidermal, de folha, ou de raiz.

7. Método, de acordo com a reivindicação 4, caracterizado pelo fato de que o promotor induzivel ou tecido-especifico é selecionado a partir do grupo que consiste de um promotor SUC2, um promotor CUTL, um promotor RBCS3, um promotor ARSK1 e um promotor RD29A.

8. Método, de acordo com as reivindicações 1 a 7, caracterizado pelo fato de que o método compreende ainda as etapas de: (d) autofecundação ou cruzamento da planta transformada com ela própria ou outra planta, respectivamente, para produzir a semente; e (e) crescer uma planta da progênie da semente; em que a planta da progênie tem maior tolerância ao estresse abiótico que a planta controle.

9. Método para produzir uma planta transformada com uma maior biomassa do que uma planta de controle, o método caracterizado pelo fato de que compreende: (a) fornecer um vetor de expressão compreendendo uma sequência de polinucleotideo que codifica um membro do clade G1073 de polipeptídeos do fator de transcrição; em que o membro do clade G1073 de polipeptídeos fator de transcrição compreende um domínio de AT-Hook (resíduos 74-82) da SEQ ID NO: 18, e um segundo domínio conservado (resíduos 118-213) da SEQ ID NO: 18; (b) transformar uma planta alvo com o vetor de expressão para a produção da planta transformada; e (c) crescer a planta transformada que compreende o vetor de expressão.

10. Método, de acordo com a reivindicação 9, caracterizado pelo fato de que o método compreende ainda as etapas de: (d) autofecundação ou cruzamento da planta transformada com ela própria ou outra planta, respectivamente, para produzir a semente; e(e) crescer uma planta da progênie da semente; em que a planta da progênie tem maior tolerância ao estresse abiótico que a planta controle.