[go: up one dir, main page]

BRPI0713646A2 - molécula de ácido nucleico isolada, célula hospedeira, planta e semente transgênicas, polipetìdeo isolado com atividade pesticida e método para sua produção, anticorpo, composição e métodos para controle de população de pragas, para exterminar uma praga de lepidópteros ou coleópteros, para proteger uma planta de uma praga e de uma praga de nematóides - Google Patents

molécula de ácido nucleico isolada, célula hospedeira, planta e semente transgênicas, polipetìdeo isolado com atividade pesticida e método para sua produção, anticorpo, composição e métodos para controle de população de pragas, para exterminar uma praga de lepidópteros ou coleópteros, para proteger uma planta de uma praga e de uma praga de nematóides Download PDF

Info

Publication number
BRPI0713646A2
BRPI0713646A2 BRPI0713646-3A BRPI0713646A BRPI0713646A2 BR PI0713646 A2 BRPI0713646 A2 BR PI0713646A2 BR PI0713646 A BRPI0713646 A BR PI0713646A BR PI0713646 A2 BRPI0713646 A2 BR PI0713646A2
Authority
BR
Brazil
Prior art keywords
asn
thr
ile
leu
gly
Prior art date
Application number
BRPI0713646-3A
Other languages
English (en)
Inventor
Nadine Carozzi
Nicholas B Duck
Theodore Kahn
Nalini Desai
Shruti Jain
Rong Guo
Julia Thissen
Daniel John Tomso
Original Assignee
Athenix Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Athenix Corp filed Critical Athenix Corp
Publication of BRPI0713646A2 publication Critical patent/BRPI0713646A2/pt
Publication of BRPI0713646B1 publication Critical patent/BRPI0713646B1/pt

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/195Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria
    • C07K14/32Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria from Bacillus (G)
    • C07K14/325Bacillus thuringiensis crystal peptides, i.e. delta-endotoxins
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8241Phenotypically and genetically modified plants via recombinant DNA technology
    • C12N15/8261Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield
    • C12N15/8271Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield for stress resistance, e.g. heavy metal resistance
    • C12N15/8279Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield for stress resistance, e.g. heavy metal resistance for biotic stress resistance, pathogen resistance, disease resistance
    • C12N15/8285Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield for stress resistance, e.g. heavy metal resistance for biotic stress resistance, pathogen resistance, disease resistance for nematode resistance
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8241Phenotypically and genetically modified plants via recombinant DNA technology
    • C12N15/8261Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield
    • C12N15/8271Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield for stress resistance, e.g. heavy metal resistance
    • C12N15/8279Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield for stress resistance, e.g. heavy metal resistance for biotic stress resistance, pathogen resistance, disease resistance
    • C12N15/8286Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield for stress resistance, e.g. heavy metal resistance for biotic stress resistance, pathogen resistance, disease resistance for insect resistance
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A40/00Adaptation technologies in agriculture, forestry, livestock or agroalimentary production
    • Y02A40/10Adaptation technologies in agriculture, forestry, livestock or agroalimentary production in agriculture
    • Y02A40/146Genetically Modified [GMO] plants, e.g. transgenic plants

Landscapes

  • Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • Wood Science & Technology (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biomedical Technology (AREA)
  • Zoology (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Microbiology (AREA)
  • Physics & Mathematics (AREA)
  • Plant Pathology (AREA)
  • Cell Biology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Medicinal Chemistry (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Insects & Arthropods (AREA)
  • Pest Control & Pesticides (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Peptides Or Proteins (AREA)
  • Breeding Of Plants And Reproduction By Means Of Culturing (AREA)
  • Pretreatment Of Seeds And Plants (AREA)

Abstract

MOLéCULA DE áCIDO NUCLéICO ISOLADA, VETOR, CéULA HOSPEDEIRA, PLANTA E SEMENTE TRANSGêNICAS, POLIPEPTìDEO ISOLADO COM ATIVIDDAE PESTICIDA E MéTODO PARA SUA PRODUçãO, ANTICORPO, COMPOISçãO E MéTODOS PARA CONTROLE DE POPULAçãO DE PRAGAS, PARA EXTERMINAR UM PRAGA DE LEPDóPTEROS OU COLéOPTEROS, PARA PROTEGER UMA PLANTA D EUMA PRAGA E DE UMA PRAGA DE NEMATóIDES. São fornecidos composições e métodos para conferir atividades pesticida a bactérias, plantas, células vegetais, tecidos e sementes. São fornecidas composições compreendendo uma sequência codificante de um polepeptídeo de delta-endotoxina. As sequências codificantes podem ser usadas em construções de DNA ou cassetes de expressão para transformação e expressão em plantas e bactérias. Composições também compreendem bactérias, plantas, células vegetais, tecidos e sementes transformadas. Em particular, são fornecidas moléculas de ácido nucléico de deltaendoxinas isoladas. Adicionalmente, são englobadas sequências de aminoácidos. Em particular, a presente invenção proporciona moléculas de ácido nucléico compreendendo as sequências de nucleotídeos codificantes das sequências de aminoácidos mostradas em SE ID NO:2, 4, 6, 8, 10, 12, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35 ou 38, ou a sequência de nucleotídeos apresentada em SE ID NO: 1, 3, 5, 7, 9, 11, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34 ou 37, bem como variantes e fragmentos destas.

Description

RELATÓRIO DESCRITIVO
MOLÉCULA DE ÁCIDO NUCLÉICO ISOLADA; VETOR; CÉLULA HOSPEDEIRA; PLANTA E SEMENTE TRANSGÊNICAS; POLIPEPTÍDEO ISOLADO COM ATIVIDADE PESTICIDA E MÉTODO PARA A SUA PRODUÇÃO; ANTICORPO; COMPOSIÇÃO E MÉTODO PARA CONTROLE DE POPULAÇÕES DE PRAGAS PARA EXTERMINAR UMA PRAGA DE LEPIDÓPTEROS OU COLEÓPTEROS; PARA PROTEGER UMA PLANTA DE UMA PRAGA DE UMA PRAGA DE NEMATÓIDE
CAMPO DA INVENÇÃO
Esta invenção diz respeito ao campo da biologia molecular. São fornecidos novos genes que codificam proteínas pesticidas. Estas proteínas e as seqüências de ácidos nucléicos que as codificam são úteis na preparação de formulações pesticidas e na produção de plantas transgênicas resistentes à praga.
FUNDAMENTOS DA INVENÇÃO
Bacillus thuringiensis é uma bactéria do solo Grara- positiva formadora de esporos caracterizada pela sua capacidade de produzir inclusões cristalinas que são especificamente tóxicas para certas espécies e ordens de insetos, mas são inofensivas para as plantas e outros organismos não-alvo. Por esta razão, composições incluindo cepas de Bacillus thuringiensis ou suas proteínas inseticidas podem ser utilizadas como inseticidas ambientalmente aceitáveis para controlar pragas agrícolas ou insetos vetores para uma variedade de doenças humanas ou animais. Proteínas Crystal (Cry) (endotoxinas delta) de Bacillus thuringiensis têm potente atividade inseticida predominantemente contra lepidópteros, dípteros, e larvas coleópteras. Estas proteínas também têm demonstrado atividade contra pragas das ordens Hymenoptera, Homoptera, Phthiraptera, Mallophaga e Acari, bem como de outros invertebrados, como os das ordens Nemathelminthes, Platyhelminthes, e Sarcomastigorphora (Feitelson (1993), The Bacillus Thuringiensis family tree. In Advanced Engineered Pesticides, Mareei Dekker, Inc., New York, N.Y.) Estas proteínas foram inicialmente classificadas como CryI a CryV baseado essencialmente em sua atividade inseticida. As principais classes foram Lepidoptera-específica (I) , Lepidoptera e Diptera-específica (II), Coleoptera-specífica (III), Díptera-específica (IV), e nematóide-específicas (V) e (VI) . As proteínas foram ainda classificadas em subfamílias; para proteínas mais fortemente relacionadas dentro de cada família foram atribuídas letras divisórias, como CrylA, CrylB, CrylC, etc. Para proteínas ainda mais estreitamente relacionadas dentro de cada divisão foram dados nomes como CrylCl, CrylC2, etc.
Uma nova nomenclatura foi descrita recentemente para os genes Cry com base em homologias de seqüência de aminoácidos, em vez de especificidade de insetos-alvo (Crickmore et al. (1998) Microbiol. Mol. Biol. Rev. 62:807-813). Na nova classificação, a cada toxina é atribuído um nome único incorporando uma categoria primária (um número arábico), uma categoria derivada (uma letra maiúscula), uma terceira categoria (uma letra minúscula), e uma categoria quaternária (outro número arábico). Na nova classificação, os numerais romanos foram trocados por números arábicos na primeira categoria. Proteínas com menos de 45% de identidade de seqüência têm diferentes categorias primárias, e os critérios para as categorias secundária e terciária são 78% e 95%, respectivamente.
A proteína cristal não apresenta atividade inseticida até ter sido ingerida e solubilizada no intestino médio do inseto. A protoxina ingerida é hidrolisada por proteases no trato digestivo do inseto a uma molécula ativa tóxica. (Hõfte e Whiteley (1989) Microbiol. Rev. 53: 242-255). Esta toxina se liga a escova apical dos receptores de borda no intestino médio das larvas alvo e se insere na membrana apical criando canais iônicos ou poros, resultando na morte larval.
Endotoxinas delta geralmente têm cinco domínios de seqüência conservados, e três domínios estruturais conservados (ver, por exemplo, de Maagd et al. (2001) Trends Genetics 17: 193-199). 0 primeiro domínio estrutural conservado consiste de sete alfa hélices e está envolvido na inserção da membrana e na formação dos poros. 0 domínio II consiste de três lâminas beta dispostas em uma configuração GreeK key, e o domínio III consiste de duas lâminas beta antiparalelas em formatoo "jelly-roll" (de Maagd et al., 2001, supra). Os domínios II e III estão envolvidos no reconhecimento e ligação do receptor, e, portanto, são considerados determinantes na especificidade da toxina.
Devido à devastação que os insetos podem conferir existe uma constante necessidade de descobrir novas formas de endotoxinas delta de Bacillus thuringiensis.
RESUMO DA INVENÇÃO
Composições e métodos para conferir resistência a pragas em bactérias, plantas, células vegetais, tecidos e sementes são fornecidos. Composições incluem moléculas de ácidos nucléicos codificando seqüências para polipeptídeos endotoxina delta, vetores compreendendo essas moléculas de ácidos nucléicos, e células hospedeiras compreendendo os vetores. Composições incluem também seqüências de polipeptídeo da endotoxina, e anticorpos para esses polipeptídeos. As seqüências nucleotídicas podem ser utilizadas em construções de DNA ou cassetes de expressão para transformação e expressão em organismos, incluindo microorganismos e plantas. Os nucleotídeos ou seqüências de aminoácidos podem ser sintéticos que tenham sido concebidos para a expressão em um organismo, incluindo, mas não se limitando a, um microorganismo ou uma planta. Composições também compreendem bactérias transformadas, plantas, células vegetais, tecidos e sementes.
Em particular, moléculas isoladas de ácidos nucléicos correspondentes a seqüências de ácido nucléico delta- endotoxina são fornecidas. Adicionalmente, seqüências de aminoácidos correspondentes aos polinucleotídeos são englobadas. Em particular, a presente invenção fornece uma molécula do ácido nucléico isolada compreendendo uma seqüência nucleotidica que codifica a seqüência de aminoácidos mostrada em SEQ ID NO: 2, 4, 6, 8, 10, 12, 15, -17, 19, 21, 23, 25, 27, 29, 31, 33, 35, ou 38, uma seqüência nucleotidica estabelecida em SEQ ID NO: 1, 3, 5, -7, 9, 11, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, ou -37, ou as seqüências nucleotídicas endotoxina delta depositadas nas bactérias hospedeiras com Na de Acesso Β- -30935, B-30936, B-30937, e B-50046, bem como as variantes e os fragmentos destas. Seqüências nucleotídicas que são complementares a uma seqüência nucleotidica da invenção, ou que hibridiza para uma seqüência da invenção também são englobadas.
Métodos são fornecidos para produzir os polipeptídeos da invenção, e para utilizar esses polipeptídeos para controlar ou matar uma praga lepidóptera ou coleóptera. Métodos e kits para a detecção em uma amostra de ácidos nucléicos e polipeptídeos da invenção também estão incluídos.
Métodos para controlar ou matar uma população de praga nematóide são ainda fornecidos. Os métodos incluem introduzir em uma planta um polinucleotídeo codificando um polipeptídeo nematóide-ativo com um tamanho molecular superior a 22 kDa. Estes polipeptídeos nematóide-ativos são úteis para controlar ou matar nematodos parasitas de plantas, particularmente cistos de nematóides. As composições e métodos da invenção são úteis para a produção de organismos com resistência aos pesticidas, especialmente bactérias e plantas. Estes organismos e composições derivados deles são desejáveis para fins agrícolas. As composições da invenção também são úteis para gerar proteínas endotoxina delta alteradas ou melhoradas que têm atividade pesticida, ou para detectar a presença de proteínas ou ácidos nucléicos endotoxina delta em produtos ou organismos.
DESCRIÇÃO DETALHADA DA INVENÇÃO
A presente invenção é projetada para composições e métodos para regulação de resistência a pragas nos organismos, particularmente plantas ou células vegetais. Os métodos envolvem organismos transformados com uma seqüência nucleotídica que codifica uma proteína endotoxina delta da invenção. Em particular, as seqüências nucleotídicas da invenção são úteis para preparar plantas e microorganismos que possuem atividade pesticida. Assim, bactérias transformadas, plantas, células vegetais, tecidos vegetais e sementes são fornecidos. Composições são ácidos nucléicos e proteínas endotoxina delta de Bacillus thuringiensis. As seqüências encontram uso na construção de vetores de expressão para posterior transformação em organismos de interesse, como sondas para o isolamento de outros genes endotoxina delta, e para a geração de proteínas pesticidas alteradas por métodos conhecidos na arte, como a troca de domínio ou embaralhamento de DNA. As proteínas encontram utilização no controle ou morte de lepdópteros, coleópteros, e populações de pragas nematóides e para a produção de composições com atividade pesticida.
Plasmídeos contendo a seqüência nucleotídica da invenção foram depositados na coleção permanente do Agricultural Research Service Culture Collection, Northern Regional Research Laboratory (NRRL), 1815 North University Street, Peoria, Illinois 61604, Estados Unidos da América, em9 de junho de 2 006, e atribuídos os Nos. de Acesso
NRRL B-30935 (para axmi-031), NRRL B-30936 (para axmi-039), NRRL B-3 0937 (para axmi-040) e em 29 de maio de 2 007 e atribuído o No. de Acesso NRRL B-50046 (axmi-049) . Estes depósitos serão mantidos nos termos do Tratado de Budapeste sobre o Reconhecimento Internacional do Depósito de Microorganismos para fins de Processo de Patente. Estes depósitos foram feitos apenas como uma conveniência para aqueles habilitados na arte e não são uma admissão de que um depósito seja necessário sob 35 USC §112.
Por "endotoxina delta" entende-se uma toxina de Bacillus thuringiensis que possui atividade tóxica contra uma ou várias pragas, incluindo mas não limitando-se a, membros das ordens Lepidoptera, Dipt era e Coleoptera e membros do filo Nematoda, ou uma proteína que tenha homologia com essa proteína. Em alguns casos, proteínas endotoxina delta têm sido isoladas de outros organismos, incluindo Clostridium bifermentans e Paenibacillus popilliae. Proteínas endotoxina delta incluem seqüências de aminoácidos deduzidas de seqüências nucleotídicas de comprimento total divulgadas aqui, e seqüências de aminoácidos que são mais curtos que as seqüências de comprimento total, quer devido à utilização de um suplente a jusante no inicio do sitio, ou devido ao tratamento que produz uma proteína menor com atividade pesticida. 0 tratamento pode ocorrer no organismo da proteína que é expressa, ou na praga após a ingestão da proteína. Endotoxinas delta incluem proteínas identificadas como cryl, através de cry43, cytl e cyü2, e toxina Cyt. Existem atualmente mais de 2 50 espécies conhecidas de endotoxinas delta com uma vasta gama de especificidades e toxicidades. Para uma lista extensa ver Crickmore et al. (1998), Microbiol. Mol. Biol. Rev. 62: 807-813, e para as atualizações regulares ver Crickmore et al. (2003) "Bacillus thuringiensis toxin nomenclature", no
www.biols.susx.ac.uk/ Home/Neil_Crickmore/Bt/index.
Aqui são fornecidas novas seqüências isoladas de nucleotídeos que conferem atividade pesticida. São fornecidas, também, as seqüências de aminoácidos de proteínas endotoxina delta. A proteína resultante da tradução deste gene permite às células controlar ou matar pragas que a ingere.
Moléculas Isoladas de Ácido Nucléico, e variantes e fragmentos destas
Um aspecto da invenção pertence a moléculas de ácidos nucléicos isoladas ou recombinantes compreendendo seqüências nucleotídicas codificando proteínas endotoxina delta e polipeptídeos ou partes biologicamente ativas dos mesmos, bem como moléculas de ácidos nucléicos suficientes para utilização como sondas de hibridização para identificar endotoxinas delta codificando ácidos nucléicos. Conforme utilizado aqui, o termo "molécula de ácido nucléico"
destina-se a incluir moléculas de DNA (por exemplo, DNA recombinante, cDNA ou DNA genômico) e moléculas de RNA (por exemplo, mRNA) e análogos do DNA ou RNA gerados utilizando nucleotideos análogos. A molécula de ácido nucléico pode ser de fita única ou de fita dupla, mas de preferência é um DNA de dupla fita.
Uma molécula de ácido nucléico ou proteína "isolada" ou "purificada", ou uma porção biologicamente ativa dela é praticamente isenta de outros materiais celulares, ou meio de cultura quando produzida por técnicas recombinantes, ou substancialmente livres de precursores químicos ou outros produtos químicos quando quimicamente sintetizados. De preferência, um ácido nucléico "isolado" é livre de seqüências (de preferência proteína codificando seqüências) que naturalmente f lanqueiam o ácido nucléico (ou seja, seqüências localizadas nas extremidades 5' e 3' do ácido nucléico) no DNA genômico do organismo do qual o ácido nucléico é derivado. Para efeitos da invenção, "isoladas" quando usado para referir-se a moléculas de ácido nucléico exclui cromossomos isolados. Por exemplo, em vários experimentos, a endotoxina delta isolada codificando a molécula de ácido nucléico pode conter menos de cerca de 5 kb, 4 kb, 3 kb, 2 kb, 1 kb, 0,5 kb, ou 0,1 kb de seqüências nucleotídicas que naturalmente flanqueiam a molécula de ácido nucléico no DNA genômico da célula a partir do qual o ácido nucléico é derivado. A proteína endotoxina delta que é substancialmente livre de materiais celulares inclui preparações de proteína com menos de cerca de 30%, 20%, 10%, ou 5% (em peso seco) de proteína endotoxina não-delta (também aqui referida como uma "proteína contaminante") .
Seqüências nucleotídicas codificando as proteínas da presente invenção incluem a seqüência estabelecida na
SEQ ID NO: 1, 3, 5, 34 e 37, as seqüências nucleotídicas endotoxina delta depositadas em bactérias hospedeiras como No. De Acesso NRRL B-30935, B-30936, B-30937, e B-50046, e variantes, fragmentos e complementos das mesmas (por exemplo, SEQ ID NO: 7, 9, 11, 14, 16, 18, 20, 22, 24, 26, 28, 30, e 32). Por "complementar" entende-se uma seqüência nucleotídica que seja suficientemente complementar a uma determinada seqüência nucleotídica que possa hibridizar a dada seqüência de nucleotídeos, para assim formar um duplex estável. A seqüência de aminoácidos correspondente a proteínas endotoxina delta codificada por esta seqüência nucleotídica é estabelecida na SEQ ID NO: 2, 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34 e 37.
Moléculas de ácidos nucléicos que são fragmentos destas seqüências nucleotídicas de codificação de endotoxina delta também são abrangidas pela presente invenção (por exemplo, SEQ ID NO: 9, 11, 14, 18, 20, 22 e 24). Por "fragmento" entende-se uma porção da seqüência nucleotídica que codifica uma proteína endotoxina delta. Um fragmento de uma seqüência nucleotídica pode codificar uma porção biologicamente ativa de uma proteína endotoxina delta, ou pode ser um fragmento que pode ser usado como uma sonda de hibridização ou iniciador de PCR utilizando métodos divulgados abaixo. Moléculas de ácidos nucléicos que são fragmentos de uma seqüência nucleotídica endotoxina delta compreende, pelo menos, cerca de 50, 100, 200, 300, .400, 500, 600, 700, 800, 900, 1000, 1050, 1100, 1150, 1200, .1250, 1300, 1350, 1400, 1450, 1500, 1550, 1600, 1650, 1700, .1750, 1800, 1850, 1900, 1950, 2000, 2050, 2100, 2150, 2200, .2250, 2300, 2350, 2400, 2450, 2500, 2550, 2600, 2650, 2700, .2750, 2800, 2850, 2900, 2950, 3000, 3050, 3100, 3150, 3200, .3250, 3300, 3350 nucleotídeos contíguos, ou até o número de nucleotídeos presentes em uma seqüência nucleotídica de codificação de endotoxina delta de comprimento total divulgada aqui (por exemplo, 3558 nucleotídeos para SEQ ID NO: 1,
.3984 nucleotídeos para SEQ ID NO: 3, 3720 nucleotídeos para SEQ ID NO: 5, e 3669 nucleotídeos para SEQ ID NO: 34), dependendo da uso pretendido. Por nucleotídeos "contíguos" é entendido resíduo de nucleotídeos que são imediatamente adjacentes um ao outro. Fragmentos das seqüências nucleotídicas da presente invenção irão codificar fragmentos de proteínas que mantêm a atividade biológica da proteína endotoxina delta e, consequentemente, manter a atividade pesticida. Por "manter atividade" entende-se que o fragmento terá pelo menos cerca de 3 0%, pelo menos cerca de 50%, pelo menos cerca de 70%, 80%, 90%, 95% ou mais de atividade pesticida da proteína endotoxina delta. Métodos para a medição da atividade pesticida são bem conhecidos na arte. Ver, por exemplo, Czapla e Lang (1990) J. Econ. Entomol. 83: 2480-2485; Andrews et al. (1988) Biochem. J. 252: 199-206; Marrone et al. (1985) J. of Economic Entomology 78: 290-293; e Patente US No. 5.743.477, todos os quais aqui incorporados por referência na sua totalidade.
Um fragmento de uma seqüência nucleotidica codificando uma endotoxina delta que codifica uma porção biologicamente ativa de uma proteína da invenção vai codificar, pelo menos, cerca de 15, 25, 30, 50, 75, 100, 125, 150, 175, 200, 250, 300, 350, 400, 450, 500, 550, 600, 650, 700, 750, 800, 850, 900, 950, 1000, 1050, 1100 aminoácidos contíguos, ou até o número total de aminoácidos presentes em uma proteína endotoxina delta de comprimento total da invenção (por exemplo, 1185 aminoácidos para SEQ ID NO: 2, 1327 aminoácidos para SEQ ID NO: 4, 123 9 aminoácidos para SEQ ID NO: 6, e
1223 aminoácidos de SEQ ID NO: 35).
Proteínas endotoxina delta preferidas da presente invenção são codificadas por uma seqüência nucleotidica suficientemente idêntica à seqüência de nucleotídeos SEQ ID NO: 1, 3, 5, 7, 9, 11, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, ou 37. Por "suficientemente idêntica" se entende um aminoácido ou seqüência nucleotidica que tem pelo menos cerca de 60% ou 65% de identidade de seqüência, cerca de 70% ou 75% de identidade de seqüência, cerca de 80% ou 85% de identidade de seqüência, cerca de 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% ou uma identidade de seqüência maior comparada com uma seqüência de referência usando um dos programas de alinhamento de seqüência descritos aqui utilizando parâmetros padrões. Um especialista na arte vai reconhecer que estes valores podem ser devidamente adaptados para determinar identidades correspondentes das proteínas codificadas por duas seqüências nucleotídicas, levando em conta a degeneração de códon, similaridade de aminoácidos, posicionamento do molde de leitura, e coisas do gênero.
Para determinar a identidade percentual de duas seqüências de aminoácidos ou de dois ácidos nucléicos, as seqüências são alinhadas para propósitos de uma comparação ótima. A identidade percentual entre as duas seqüências é uma função do número de posições idênticas partilhadas pelas seqüências (ou seja, identidade percentual = número de posições idênticas / número total de posições (por exemplo, sobreposição de posições) χ 100) . Em um experimento, as duas seqüências têm o mesmo comprimento. A identidade percentual entre as duas seqüências pode ser determinada utilizando técnicas semelhantes às descritas abaixo, com ou sem permitir espaços. No cálculo da identidade percentual, correspondências tipicamente exatas são contadas.
A determinação da identidade percentual entre duas seqüências pode ser realizada utilizando um algoritmo matemático. Um exemplo não limitante de um algoritmo matemático utilizado para a comparação das duas seqüências é o algoritmo de Karlin e Altschul (1990) Proc. Natl. Acad.
Sei. E.U.A. 87: 2264, modificado como no Karlin e Altschul (1993) Proc. Natl. Acad. Sei. E.U.A. 90: 5873-5877. Tal algoritmo é incorporado nos programas BLASTN e BLASTX de Altschul et al. (1990) J. Mol. Biol. 215: 403. Pesquisas de nucleotídeo BLAST podem ser realizadas com o programa BLASTN, escore = 100, comprimento de palavra = 12, para obter seqüências nucleotídicas homólogas de moléculas de ácido nucléico endotoxina delta da invenção. Pesquisas de proteína BLAST podem ser realizadas com o programa BLASTX, escore = 50, comprimento de palavra = 3, para obter aminoácidos homólogos às moléculas de proteína endotoxina delta da invenção. Para obter alinhamentos com lacunas para fins de comparação, Gapped BLAST (em BLAST 2.0) pode ser utilizado tal como descrito em Altschul et al. (1997) Nucleic Acids Res. 25: 3389. Alternativamente, PSI-Blast pode ser utilizado para a realização de uma pesquisa que detecta relações distantes entre as moléculas. Ver Altschul et al. (1997) supra. Quando se utilizar programas BLAST, Gapped BLAST, e PSI-Blast, os parâmetros padrão dos respectivos programas (por exemplo, BLASTX e BLASTN) podem ser utilizados. O alinhamento também pode ser realizado manualmente, por inspeção.
Outro exemplo não limitante de um algoritmo matemático utilizado para a comparação de seqüências é o algoritmo ClustalW (Higgins et al. (1994) Nucleie Aeids Res. 22:4673-4680). ClustalW compara seqüências, e alinha a totalidade dos aminoácidos ou seqüência de DNA, e assim pode fornecer dados sobre a conservação de toda a seqüência de aminoácidos. O algoritmo ClustalW é utilizado em vários software de soluções comercialmente disponíveis de análise de DNA/aminoácido, tais como o módulo ALIGNX do Vector NTI Program Suite (Invitrogen Corporation, Carlsbad, CA) . Após o alinhamento das seqüências de aminoácidos com ClustalW, a identidade percentual de aminoácidos pode ser avaliada. Um exemplo não-limitante de um programa de software útil para a análise de alinhamentos ClustalW é GENEDOC (TM). GENEDOC (TM) (Karl Nicholas) permite a avaliação de similaridade e de identidade de aminoácidos (ou DNA) entre várias proteínas. Outro exemplo não-limitante de algoritmo matemático utilizado para a comparação de seqüências é o algoritmo de Myers e Miller (1988) CABIOS 4:11-17. Tal algoritmo é incorporado no programa ALIGN (versão 2.0), que faz parte do Pacote de Software GCG Wisconsin Genetics, Versão 10 (disponível a partir de Accelrys, Inc., 9685 Scranton Rd., San Diego, CA, E.U.A.). Quando se utilizar o programa ALIGN para comparar seqüências de aminoácidos, uma mesa de resíduo PAM de peso 120, um comprimento de lacuna de 12, e um desnível de 4 podem ser usados.
Salvo indicação em contrário, o GAP Versão 10, que utiliza o algoritmo de Needleman e Wünsch (1970) J. Mol. Biol. 48 (3): 443-453, será utilizado para determinar a identidade de seqüência ou similaridade com os seguintes parâmetros: identidade % e similaridade % para uma seqüência nucleotídica usando peso de GAP de 50 e Comprimento de 3, e a matriz de pontuação nwsgapdna.cmp; identidade % e similaridade % de uma seqüência de aminoácidos utilizando peso de GAP de 8 e comprimento de 2, e o programa de escore BLOSUM62. Programas equivalentes também podem ser utilizados. Por "programa equivalente" entende-se qualquer programa de comparação de seqüência que, para quaisquer duas seqüências em questão, gera um alinhamento com resíduos de resíduos de nucleotídeos idênticos e uma identidade percentual de seqüência idêntica, quando comparada com o alinhamento correspondente gerado pelo GAP Versão 10. A invenção também engloba moléculas variantes de ácidos nucléicos (por exemplo, SEQ ID NO: 7, 9, 11, 16, 18, 22, 24, 26, 28, 30 e 32). "Variantes" de seqüências nucleotídicas de codificação de endotoxina delta incluem as seqüências que codificam as proteínas endotoxina delta divulgadas aqui, mas que diferem conservativãmente devido à degeneração do código genético, bem como aqueles que são suficientemente idênticos como discutido acima. Naturalmente variantes alélicos podem ser identificados com o uso das bem conhecidas técnicas de biologia molecular, tais como a reação em cadeia da polimerase (PCR) e técnicas de hibridização como descrito abaixo. Seqüências nucleotídicas variantes também incluem seqüências nucleotídicas derivadas sinteticamente que foram geradas, por exemplo, utilizando mutagênese sítio-dirigida, mas que ainda codificam proteínas endotoxina delta divulgadas na presente invenção como discutido abaixo. Proteínas variantes englobadas pela presente invenção são biologicamente ativas, isto é, elas continuam a possuir a atividade biológica desejada da proteína nativa, ou seja, mantendo atividade pesticida. Por "manter atividade" entende-se a variante que terá pelo menos cerca de 3 0%, pelo menos cerca de 50%, pelo menos cerca de 70%, ou pelo menos cerca de 80% da atividade pesticida da proteína nativa. Métodos para a medição da atividade pesticida são bem conhecidos na arte. Ver, por exemplo, Czapla e Lang (1990) J. Econ. Entomol. 83: 2480-2485; Andrews et al. (1988) Biochem. J. 252: 199-206; Marrone et al. (1985) J. of Economic Entomology 78: 290-293; e Patente US No.5.743.477, todos os quais são aqui incorporados por referência na sua totalidade.
0 especialista na arte irá apreciar ainda que as mudanças podem ser introduzidas por mutação das seqüências nucleotídicas da invenção, assim, levando a mudanças na seqüência de aminoácidos das proteínas endotoxina delta codificadas, sem alterar a atividade biológica das proteínas. Assim, variantes de moléculas de ácido nucléico isolado podem ser criadas através da introdução de um ou mais substituições de nucleotídeos, acréscimos ou supressões na seqüência nucleotídica correspondente divulgada aqui, de tal forma que uma ou mais substituições de aminoácidos, acréscimos ou supressões são introduzidas na proteína codificada. As mutações podem ser introduzidas pelas técnicas convencionais, tais como mutagênese sítio- dirigida e mutagênese mediada por PCR. Essas seqüências nucleotídicas variantes também são abrangidas pela presente invenção.
Por exemplo, substituições de aminoácidos
conservativas podem ser feitas em um ou mais resíduos de aminoácidos não essenciais previsíveis. Resíduo de aminoácidos "não essenciais" é um resíduo que pode ser alterado a partir da seqüência do tipo selvagem de uma proteína endotoxina delta, sem alterar a atividade biológica, enquanto que um resíduo de aminoácido "essencial" é necessário para a atividade biológica. Uma "substituição de aminoácido conservativa" é um aminoácido em que o resíduo é substituído por um resíduo de aminoácido com uma cadeia lateral semelhante. Famílias de resíduos de aminoácidos com cadeias laterais semelhantes foram definidas na arte. Essas famílias incluem aminoácidos com cadeias laterais básicas (por exemplo, lisina, arginina, histidina), cadeias laterais ácidas (por exemplo, ácido aspártico, ácido glutâmico), cadeias laterais polares não modificadas (por exemplo, glicina, asparagina, glutamina, serina, treonina, tirosina, cisteína), cadeias laterais não polares (por exemplo, alanina, valina, leucina, isoleucina, prolina, fenilalanina, metionina, triptofano), cadeias laterais beta-ramifiçadas (por exemplo, treonina, valina, isoleucina) e cadeias laterais aromáticas (por exemplo, tirosina, fenilalanina, triptofano, histidina).
Endotoxinas delta geralmente têm cinco domínios de seqüência conservados, e três domínios estruturais conservados (ver, por exemplo, de Maagd et al. (2001) Trends Genetics 17: 193-199). 0 primeiro domínio estrutural conservado consiste de sete alfa hélices e está envolvido na inserção da membrana e na formação dos poros. 0 domínio II é constituído por três beta-lâminas dispostas em uma configuração Greek key, e o domínio III é constituído por duas beta-lâminas antiparalelas em forma de "jelly-roll" (de Maagd et al., 2001, supra). Os domínios II e III estão envolvidos no reconhecimento e ligação de receptor, e, portanto, são considerados determinantes da especificidade da toxina.
Substituições de aminoácidos podem ser feitas em regiões não conservadas que mantêm função. Em geral, essas substituições não seriam feitas para resíduos de aminoácido conservados, ou para resíduos de aminoácidos residindo dentro de um motivo conservado, onde esses resíduos são essenciais para a atividade da proteína. Exemplos de resíduos que são conservados e que podem ser essenciais para a atividade da proteína incluem, por exemplo, resíduos que são idênticos entre todas as proteínas contidas em um alinhamento das seqüências de aminoácidos da presente invenção e seqüências endotoxina delta conhecidas. Exemplos de resíduos que são conservados, mas que podem permitir substituições conservativas de aminoácido e manter atividade incluem, por exemplo, resíduos que têm apenas substituições conservativas entre todas as proteínas contidas em um alinhamento das seqüências de aminoácidos da presente invenção e seqüências endotoxina delta conhecidas. No entanto, um habilitado na arte irá compreender que variantes funcionais podem ter menos alterações conservadas ou não conservadas nos resíduos conservados.
Alternativamente, seqüências nucleotídicas variantes podem ser feitas através da introdução de mutações aleatoriamente ao longo de todo ou parte do código da seqüência, tais como por mutagênese de saturação, e os mutantes resultantes podem ser rastreados para conferir capacidade de atividade endotoxina delta para identificar mutantes que mantenham a atividade. Após a mutagênese, as proteínas codificadas podem ser expressas recombinantemente e, a atividade da proteína pode ser determinada usando técnicas padrão de ensaio.
Utilizando métodos como PCR, hibridização, e as seqüências endotoxina delta correspondentes podem ser identificadas, tais seqüências tendo identidade substancial para as seqüências da invenção. Ver, por exemplo, Sambrook e Russell (2001) Molecular Cloning: A Laboratory Manual. (Cold Spring Harbor Laboratory Press, Cold Spring Harbor, NY) e Innis, et al. (1990) PCR Protocols: A Guide to Methods and Applications (Academic Press, NY).
Em um método de hibridização, o todo ou parte da
seqüência nucleotídica endotoxina delta pode ser utilizado para rastrear cDNA ou bibliotecas genômicas. Métodos para a construção de tais cDNA e bibliotecas genômicas são geralmente conhecidos na arte e são divulgados em Sambrook e Russell, 2001, supra. As chamadas sondas de hibridização podem ser fragmentos de DNA genômico, fragmentos de cDNA, fragmentos de RNA, ou outros oligonucleotídeos, e podem ser marcadas com um grupo detectável, como 32P, ou qualquer outro marcador detectável, como outros radioisótopos, um composto fluorescente, uma enzima, ou um co-fator enzimático. Sondas de hibridização podem ser feitas por marcação de oligonucleotídeos sintéticos baseados nas seqüências nucleotídicas que codificam a endotoxina delta divulgada aqui. Iniciadores degenerados concebidos com base nos nucleotídeos conservados ou resíduos de aminoácidos na seqüência nucleotídica ou seqüência codificada de aminoácidos podem também ser utilizados. A sonda tipicamente inclui uma região de seqüência nucleotídica que hibridiza sob rigorosas condições de, pelo menos, cerca de 12, pelo menos cerca de 25, pelo menos cerca de 50, 75,100, 125, 150, 175, 200, 250, 300, 350, ou 400 nucleotídeos consecutivos de seqüência nucleotídica de codificação da endotoxina delta da invenção ou um fragmento ou variante deste. Métodos para a preparação de sondas para hibridização são geralmente conhecidos na arte e são divulgados no Sambrook e Russell, 2001, supra, aqui incorporado por referência.
Por exemplo, uma seqüência endotoxina delta divulgada aqui, ou uma ou mais partes dos mesmos, pode ser usada como uma sonda capaz de hibridizar especificamente correspondentes seqüências endotoxina delta e RNAs mensageiros. Para atingir hibridização específica em uma variedade de condições, tais sondas incluem seqüências que são únicas e são de preferência pelo menos cerca de 10 nucleotídeos de comprimento, ou pelo menos cerca de 2 0 nucleotídeos de comprimento. Essas sondas podem ser usadas para amplificar seqüências endotoxina delta de um organismo escolhido por PCR. Esta técnica pode ser usada para isolar seqüências codificantes adicionais de um organismo desejado ou como um teste diagnóstico para determinar a presença de seqüências codificantes em um organismo. Técnicas de hibridização incluem triagem de hibridização de bibliotecas de DNA plaqueadas (ou placas ou colônias, ver, por exemplo, Sambrook et al. (1989) Molecular Cloning: A Laboratory Manual (2d ed., Cold Spring Harbor Laboratory Press, Cold Spring Harbor, New York ).
A hibridação de tais seqüências pode ser realizada sob condições severas. Por "condições severas" ou "condições severas de hibridização" entende-se as condições em que uma sonda irá hibridizar a sua seqüência alvo para um grau maior detectável do que de outras seqüências (por exemplo, pelo menos 2 vezes acima). Condições severas são dependentes da seqüência e serão diferentes em diferentes circunstâncias. Ao controlar o rigor da hibridização e/ou condições de lavagem, as seqüências alvo que são 100% complementar da sonda podem ser identificadas (sondagem homóloga). Alternativamente, condições severas podem ser ajustadas para permitir algumas inadequações nas seqüências para que menores graus de similaridade sejam detectados (sondagem heteróloga). Geralmente, uma sonda é inferior a cerca de 1000 nucleotideos de comprimento, de preferência com menos de 500 nucleotideos de comprimento.
Normalmente, condições severas serão aquelas em que a concentração de sal é inferior a cerca de 1,5 M de ion Na, tipicamente cerca de 0,01 a 1,0 M de concentração de ions Na (ou outros sais) em pH 7,0 a 8,3 e a temperatura é de pelo menos cerca de 30°C para sondas curtas(por exemplo, 10 a 50 nucleotideos) e pelo menos cerca de 60°C para sondas longas (como por exemplo, superior a 50 nucleotideos) . Condições severas também podem ser alcançadas com a adição de agentes desestabilizadores, como a formamida. Condições de baixa severidade exemplares incluem hibridização com uma solução-tampão de 3 0 a 3 5% de formamida, 1 M de NaCl, 1% SDS (dodecil sulfato de sódio) a 37°C, e uma lavagem em IX a 2X de SSC (20X de SSC = 3,0 M NaCl/0.3 M de citrato trissódico) em 50 a 55°C. Condições de moderada severidade exemplares incluem hibridização em 40 a 45% de formamida, 1,0 M de NaCl, 1% de SDS a 37°C, e uma lavagem em 0.5X a IX de SSC em 55 a 60°C. Condições de elevada severidade exemplar incluem hibridização em 50% de formamida, 1 M de NaCl, 1% de SDS a 37°C, e uma lavagem em 0.IX de SSC em 60 a 65°C. Opcionalmente, tampões de lavagem podem incluir cerca de 0,1% a cerca de 1% de SDS. A duração da hibridização é geralmente inferior a cerca de 24 horas, normalmente cerca de 4 a cerca de 12 horas.
Especificidade é normalmente a função de lavagens pós- hibridização, os fatores críticos sendo a força iônica e a temperatura da solução final de lavagem. Para híbridos DNA-DNA, a Tm pode ser aproximada a partir da equação de Meinkoth e Wahl (1984) Anal. Biochem. 138: 267-284: Tm = 81,5°C + 16,6 (log M) + 0,41 (% de GC) - 0,61 (% form) - 500/L, onde M é a molaridade de cátions monovalentes, % de GC é o percentual dos nucleotídeos guanosina e citosina no DNA, % form é a percentagem de formamida na solução de hibridização, e L é o comprimento da base, em pares mistos. A Tm é a temperatura (abaixo força iônica definida e pH) em que 50% de uma seqüência alvo complementar hibridiza para uma sonda marcada perfeitamente. A Tm é reduzida em cerca de 1°C para cada 1% de inadequações; assim, Tm, hibridação e/ou condições de lavagem podem ser adaptadas para hibridizar seqüências de identidade desejada. Por exemplo, se seqüências com identidade ^ a 90% são procuradas, a Tm pode ser diminuída IO0C. Geralmente, as condições severas são selecionadas para serem cerca de 50C mais baixas do que o ponto de fusão térmico (Tm) para a seqüência específica e seu complemento em uma força iônica definida e pH. No entanto, condições muito severas podem utilizar uma hibridação e/ou lavagem em 1, 2, 3 ou 4°C mais baixa do que o ponto de fusão térmico (Tm); condições moderadamente severas podem utilizar uma hibridização e/ou lavagem a 6, . 7, 8, 9 ou IO0C menor do que o mesmo ponto de fusão (Tm) ; condições de baixa severidade podem utilizar uma hibridização e/ou lavagem em 11, 12, 13, 14, 15 ou 20°C inferior ao ponto de fusão térmico (Tm). Usando a equação, hibridização e composições de lavagem, e Tm desejada, um especialista na arte irá entender que as variações na severidade da hibridização e/ou soluções de lavagem são inerentemente descritas. Se o grau desejado de inadequações resulta em um Tm de menos de 45°C (solução aquosa) ou 32°C (solução de formamida) , é preferível aumentar a concentração de SSC de modo que uma temperatura mais alta possa ser utilizada. Um extenso guia para a hibridização de ácidos nucléicos é encontrado em Tijssen (1993) Laboratory Techniques in Biochemistry and Molecular Biology Hybridization with Nucleic Aeid Probes, Parte I, Capítulo .2, (Elsevier, Nova Iorque) e Ausubel et al. , Eds. (1995) Current Protocols in Molecular Biology, Capítulo 2 (Greene Publishing and Wiley-Interscience, Nova Iorque). Ver Sambrook et al. (1989) Molecular Cloning: A Laboratory Manual (2d ed., Cold Spring Harbor Laboratory Press, Cold Spring Harbor, Nova Iorque) . Proteínas Isoladas e Variantes e Fragmentos Desta
Proteínas endotoxina delta também são englobadas no âmbito da presente invenção. Por "proteína endotoxina delta" entende-se uma proteína com seqüência de aminoácidos estabelecida na SEQ ID NO: 2, 4, 6, 8, 10, 12, 15, 17, 19,21, 23, 25, 27, 29, 31, 33, 35, ou 38. Fragmentos, biologicamente ativas porções, e variantes, são também fornecidos, e pode ser utilizada para praticar os métodos da presente invenção.
"Fragmentos" ou "partes biologicamente ativas" incluem fragmentos de polipeptídeo compreendendo seqüências de aminoácidos suficientemente idênticas à seqüência de aminoácidos estabelecida em SEQ ID NO: 2, 4, 6, 8, 10, 12,16, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35, ou 38 e que apresentam atividade pesticida (por exemplo, SEQ ID NO: 15,19, 21, 23 ou 25) . Uma porção biologicamente ativa de uma proteína endotoxina delta pode ser um polipeptídeo que é, por exemplo, 10, 25, 50, 100 ou mais aminoácidos em comprimento. Essas porções biologicamente ativas podem ser preparadas por técnicas recombinantes e avaliadas para atividade pesticida. Métodos de medição da atividade pesticida são bem conhecidos na arte. Veja, por exemplo, Czapla e Lang (1990) J. Econ. Entomol. 83: 2480-2485; Andrews et al. (1988) Biochem. J. 252: 199-206; Marrone et al. (1985) J. of Economic Entomology 78: 290-293; e Patente US No. 5.743.477, todos aqui incorporados por referência, na sua totalidade. Conforme utilizado aqui, um fragmento compreende pelo menos 8 aminoácidos contíguos da SEQ ID NO: 2, 4, 6, 8, 10, 12, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35, ou 38. A invenção engloba outros fragmentos, porém, tal como qualquer fragmento de proteína maior do que cerca de 10, 20, 30, 50, 100, 150, 200, 250, 300, 350, 400, 450, 500, 550, 600, 650, 700, 750, 800, 850, 900, 950, 1000, 1050, 1100, 1150, 1200, 1250, ou 1300 aminoácidos.
Por "variantes" é entendido polipeptídeos ou proteínas tendo uma seqüência de aminoácidos que é, pelo menos, cerca de 60%, 65%, cerca de 70%, 75%, cerca de 80%, 85%, cerca de 90%, 91%, 92%, 93 %, 94%, 95%, 96%, 97%, 98% ou 99% idêntica à seqüência de aminoácidos da SEQ ID NO: 2, 4, 6, 8, 10, 12, 16, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35, ou 38 (por exemplo, SEQ ID NO: 10, 12, 17, 19, 23, 25, 27, 29, 31, ou 33). Variantes incluem também polipeptídeos codificados por uma molécula de ácido nucléico que hibridiza a molécula de ácido nucléico da SEQ ID NO: 1, 3, 5, 7, 9, 11, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, ou 37, ou um complemento das mesmas, sob condições estritas. Variantes incluem polipeptídeos que diferem na seqüência de aminoácidos devido a mutagênese. Proteínas variantes englobadas pela presente invenção são biologicamente ativas, isto é, elas continuam a possuir a atividade biológica desejada da proteína nativa, ou seja, mantendo atividade pesticida. Métodos para a medição da atividade pesticida são bem conhecidos na arte. Ver, por exemplo, Czapla e Lang (1990) J. Econ. Entomol 83: 2480-2485; Andrews et al. (1988) Biochem. J. 252: 199-206; Marrone et al. (1985) J. of Economic Entomology 78: 290-293; e Patente US No. 5.743.477, os quais aqui incorporados por referência na sua totalidade.
Genes bacterianos, tais como os genes axmi-031, axmi-039, axmi-040, e axmi-049 desta invenção, muitas vezes possuem códons de iniciação de metionina múltiplos início na proximidade do início da abertura do molde de leitura. Muitas vezes, o início da tradução a um ou mais destes códons iniciadores levará à geração de uma proteína funcional. Estes códons iniciadores podem incluir códons ATG. No entanto, bactérias tais como bactérias Bacillus sp. também reconhecem o códon GTG como um códon de início, e as proteínas que iniciam a tradução de códons GTG contêm uma metionina no primeiro aminoácido. Além disso, não é muitas vezes determinada a priori qual destes códons são utilizados naturalmente na bactéria. Assim, é compreensível que a utilização de um dos códons de metionina alternativos possam também levar à geração de proteínas endotoxina delta que codificam atividade pesticida. Estas proteínas endotoxina delta são englobadas na presente invenção e podem ser utilizadas nos métodos da presente invenção.
Anticorpos contra os polipeptídeos da presente invenção, ou as variantes ou fragmentos destes, também estão englobados. Métodos de produção de anticorpos são bem conhecidos na arte (ver, por exemplo, Harlow e Lane (1988) Antibodies: A Laboratory Manual, Cold Spring Harbor Laboratory, Cold Spring Harbor, NY; Patente US No.4.196.265). Variantes Alteradas ou Aperfeiçoadas
É reconhecido que seqüências de DNA de uma endotoxina delta podem ser alteradas por vários métodos, e que estas alterações podem resultar em seqüências de DNA codificando proteínas com seqüências de aminoácidos diferentes do que codificadas por uma endotoxina delta da presente invenção. Esta proteína pode ser alterada de várias maneiras, incluindo substituições de aminoácidos, supressões, truncações, e inserções de um ou mais aminoácidos da SEQ ID NO: 2, 4, 6, 8, 10, 12, 15, 17, 19, 21, 23, 25, 27, 29, 31, .33, 35, ou 38, incluindo-se cerca de 2, cerca de 3, cerca de 4, cerca de 5, cerca de 6, cerca de 7, cerca de 8, cerca de 9, cerca de 10, cerca de 15, cerca de 20, cerca de 25, cerca de 30, cerca de 35, cerca de 40, cerca de 45, cerca de 50, cerca de 55, cerca de 60, cerca de 65, cerca de 70, cerca de 75, cerca de 80, cerca de 85, cerca de 90, cerca de 100, cerca de 105, cerca de 110, cerca de 115, cerca de .120, cerca de 125, cerca de 130 ou mais substituições de aminoácidos, supressões ou inserções.
Métodos para tais manipulações são geralmente conhecidos na arte. Por exemplo, variantes de seqüência de aminoácido uma proteína endotoxina delta podem ser preparadas por mutações no DNA. Isso também pode ser realizado por uma das várias formas de mutagênese e/ou em evolução dirigida. Em alguns aspectos, as alterações codificadas na seqüência de aminoácidos não irão afetar substancialmente a função da proteína. Essas variantes vão possuir a desejada atividade pesticida. No entanto, entende-se que a capacidade de uma endotoxina delta para conferir atividade pesticida pode ser melhorada através da utilização de tais técnicas sobre as composições da presente invenção. Por exemplo, um pode expressar uma endotoxina delta em células hospedeiras que apresentam elevadas taxas de incorporação de base durante a replicação do DNA, como o XL-I Red (Stratagene) . Depois de propagação nessas linhagens, pode-se isolar o DNA endotoxina delta (por exemplo, através da preparação do DNA plasmidial, ou por amplificação por PCR e clonagem do fragmento resultante da PCR em um vetor) , cultivar as mutações endotoxina delta em uma estirpe não-mutagênica, e identificar genes endotoxina delta mutados com atividade pesticida, por exemplo, realizando um ensaio para testar a atividade pesticida. Geralmente, a proteína é misturada e utilizada nos ensaios de alimentação. Ver, por exemplo, Marrone et al. (1985) J. of Economic Entomology 78: 290-293. Tais testes podem incluir contatar plantas com uma ou mais pragas e determinar a capacidade da planta para sobreviver e/ou causar a morte dos parasitas. Exemplos de mutações que resultam em aumento da toxicidade são encontrados em Schnepf et al. (1998) Microbiol. Mol. Biol. Rev. 62: 775-806.
Alternativamente, alterações podem ser feitas para a seqüência da proteína de muitas proteínas no amino ou carboxi terminal sem afetar sensivelmente a atividade. Isto pode incluir inserções, deleções, ou alterações introduzidas pelos modernos métodos moleculares, como PCR, incluindo a amplificação por PCR que alteram ou estendem a 30 seqüência codificante da proteína em virtude da inclusão de aminoácidos codificando seqüências nos oligonucleotídeos utilizados na amplificação por PCR. Alternativamente, as seqüências protéicas acrescentadas podem incluir toda a seqüência de codificação de proteínas, como as usadas comumente na arte de produzir fusões de proteína. Essas proteínas fusionadas são freqüentemente utilizadas para (1) aumentar a expressão de uma proteína de interesse (2) introduzir um domínio de ligação, atividade enzimática, ou epítopo para facilitar a purificação de proteína, detecção de proteína, ou outras utilizações experimentais conhecidas na arte (3) secreção alvo ou tradução de uma proteína de uma organela subcelular, tais como o espaço periplasmático de bactérias gram-negativas, ou do retículo endoplasmático das células eucarióticas, o último dos quais muitas vezes resulta em glicosilação da proteína.
Nucleotídeos variantes e aminoácidos da presente invenção também englobam seqüências derivadas de procedimentos mutagênicos e recombinogênicos tais como embaralhamento de DNA. Com tal procedimento, uma ou mais proteínas endotoxina delta diferentes codificando regiões de podem ser usadas para criar uma nova proteína endotoxina delta que possua as propriedades desejadas. Desta forma, bibliotecas de polinucleotídeos recombinantes são geradas a partir de uma população de polinucleotídeos de seqüências relacionadas compreendendo regiões da seqüência que têm uma identidade de seqüência substancial e que podem ser homologamente recombinadas in vitro ou in vivo. Por exemplo, usando esta abordagem, motivos de seqüência codificando um domínio de interesse podem ser embaralhados entre um gene endotoxina delta da invenção e outros genes endotoxina delta conhecidos para obter um novo gene que codifica para uma proteína com uma melhoria da propriedade de interesse, tais como um aumento da atividade inseticida. Estratégias para tal embaralhamento de DNA são conhecidas na arte. Ver, por exemplo, Stemmer (1994) Proc. Natl. Acad. Sei. E.U.A. 91: 10747-10751; Stemmer (1994) Nature 370: .389-391; Crameri et al. (1997) Nature Biotech. 15: 436-438; Moore et al. (1997) J. Mol. Biol. 272: 336-347; Zhang et al. (1997) Proc. Natl. Acad. Sei. E.U.A. 94: 4504-4509; Crameri et al. (1998) Nature 391: 288-291, e Patentes US na .5.605.793 e 5.837.458.
A troca ou embaralhamento de domínio é outro mecanismo de geração de proteínas endotoxina delta alteradas. Os domínios II e III podem ser trocados entre proteínas endotoxina delta, resultando em toxinas híbridas ou quiméricas com melhor atividade pesticida ou espectro alvo. Métodos para a geração de proteínas recombinantes e teste da atividade pesticida são bem conhecidos na arte (ver, por exemplo, Naimov et al. (2001) Appl. Environ. Microbiol. 67: .5328-5330; de Maagd et al. (1996) Appl. Environ. Microbiol. .62: 1537-1543, Ge et al. (1991) J. Biol. Chem. 266: 17954- .17958; Schnepf et al. (1990), J. Biol. Chem. 265: 20923- .20930; Rang et al. (1999) Appl. Environ. Microbiol. 65: .2918-2925) .
Vetores
A seqüência endotoxina delta da invenção pode ser feita em um cassete de expressão para a expressão em uma planta de interesse. Por "cassete de expressão vegetal" entende-se uma construção de DNA que é capaz de resultar na expressão de uma proteína a partir de um molde de leitura aberta na célula vegetal. Tipicamente, estes contêm um promotor e uma seqüência codificante. Muitas vezes, essas construções também irão conter uma região 3' não traduzida. Essas construções podem conter uma "seqüência sinal" ou "seqüência líder" (ou seja, SEQ ID NO: 9, 11, 28, 30 e 32) para facilitar o transporte co-traducional ou pós- traducional do peptídeo a certas estruturas intracelulares, tais como o cloroplasto (ou outros plastídeos), retículo endoplasmático, ou aparelho de Golgi.
Por "seqüência sinal" entende-se uma seqüência que é conhecida ou suspeita para resultar em transporte de peptídeo co-traducional ou pós-traducional através da membrana celular. Em eucariotos, este normalmente envolve secreção no aparelho de Golgi, com alguns resultando em glicosilação. Por "seqüência líder" entende-se qualquer seqüência que, quando traduzida, resulta em uma seqüência de aminoácidos (ou seja, SEQ ID NO: 10, 12, 29, 31 e 33) suficiente para acionar o transporte co-traducional da cadeia peptídica para uma organela sub-celular. Assim, este inclui seqüências líder objetivando transporte e/ou glicosilação através da passagem para o retículo endoplasmático, passagem de vacúolos, plastídeos incluindo cloroplastos, mitocôndrias, e coisas do gênero.
Por "vetor de transformação de plantas" entende-se uma molécula de DNA que é necessária para transformação eficiente de uma célula vegetal. Essa molécula pode ser constituída por um ou mais cassetes de expressão vegetais, e pode ser organizada em mais de uma molécula de DNA "vetor". Por exemplo, vetores binários são vetores de transformação de plantas que utilizam dois vetores de DNA não contíguos para codificar todas as funções e operações eis- de transformação de células vegetais (Hellens e Mullineaux (2000) Trends in Plant Science 5: 446-451). "Vetor" refere-se a uma construção de ácido nucléico concebido para o transporte entre as diferentes células hospedeiras. "Vetor de expressão" refere-se a um vetor que tem a capacidade de incorporar, integrar e expressar seqüências de DNA heterólogas ou fragmentos de uma célula externa. O cassete incluirá seqüências reguladoras 5' e 3' operacionalmente ligadas a uma seqüência da invenção. Por "operacionalmente ligadas" entende-se uma ligação funcional entre um promotor e uma segunda seqüência, onde a seqüência do promotor inicia e medeia a transcrição da seqüência de DNA correspondente à segunda seqüência. Geralmente, operacionalmente ligado significa que as seqüências de ácido nucléico estando ligadas são contíguas e, quando necessário juntam duas regiões codificadoras de proteínas, contíguas e no mesmo molde de leitura. O cassete pode também conter, pelo menos, um gene adicional a ser co- transformado para o organismo. Alternativamente, o(s) gene(s) adicional(s) pode ser fornecido em múltiplos cassetes de expressão.
"Promotor" refere-se a uma seqüência de ácidos nucléicos que funciona para dirigir a transcrição a jusante de uma seqüência codificante. 0 promotor, juntamente com outras seqüências de ácidos nucléicos reguladoras transcricionais e traducionais (também denominadas "seqüências controle") são necessários para a expressão de uma seqüência de DNA de interesse.
Tal cassete de expressão é fornecido com uma pluralidade de restrições locais para a inserção de a seqüência endotoxina delta estar sob regulação transcricional das regiões reguladoras.
O cassete de expressão vai incluir na direção 5' -3 ' de transcrição, uma região de iniciação transcricional e traducional (ou seja, um promotor), uma seqüência de DNA da invenção, e uma região terminal traducional e transcricional (ou seja, região de terminação) funcional nas plantas. O promotor pode ser nativo ou análogo, ou externo ou heterólogo, para a planta hospedeira e/ou para a seqüência de DNA da invenção. Adicionalmente, o promotor pode ser a seqüência natural ou, alternativamente, uma seqüência sintética. Onde o promotor é "nativo" ou "homólogo" para a planta hospedeira, pretende-se que o promotor seja encontrado na planta nativa em que o promotor é introduzido. Onde o promotor é "externo" ou "heterólogo" para a seqüência de DNA da invenção, pretende-se que o promotor não seja o nativo ou de ocorrência natural para a seqüência de DNA operacionalmente ligada da invenção.
A região terminal pode ser nativa com a região de iniciação transcricional, pode ser nativo com a seqüência de DNA de interesse operacionalmente ligada, pode ser nativa com a planta hospedeira, ou pode ser derivada de uma outra fonte (ou seja, externa ou heteróloga para o promotor, a seqüência de DNA de interesse, a planta hospedeira, ou qualquer combinação das mesmas). Regiões de terminação convenientes encontram-se disponíveis a partir do plasmídeo-Ti de A. tumefaciens, tais como as regiões de terminação octopina sintase e nopalina sintase. Veja também Guerineau et al. (1991) Mol Gen. Genet. 262: 141-144;
Proudfoot (1991) Cell 64: 671-674; Sanfacon et al. (1991) Genes Dev. 5: 141-149; Mogm et al. (1990) Plant Cell 2: 1261-1272; Munroe et al. (1990) Gene 91: 51-158; Bailas et al. (1989) Nucleic Acids Res. 17: 7891-7903; e Joshi et al. (1987) Nucleic Acid Res. 15: 9627-9639.
Quando apropriado, o(s) gene(s) pode ser otimizado para uma maior expressão na célula hospedeira transformada. Ou seja, os genes podem ser sintetizados utilizando códons de células hospedeiras preferenciais para uma melhor expressão, ou podem ser sintetizados utilizando códons em um códon hospedeiro preferido de freqüência útil. Geralmente, o conteúdo GC do gene será alimentado. Ver, por exemplo, Campbell e Gowri (1990) Plant Physiol. 92: 1-11 para uma discussão de uso de códon hospedeiro preferido.
Métodos estão disponíveis na arte para síntese de genes vegetais preferidos. Ver, por exemplo, Patente US na 5.380.831 e 5.436.391, e Murray et al. (1989) Nueleie Aeids Res. 17: 477-498, aqui incorporados por referência. Em um experimento, a endotoxina delta é orientada para o cloroplasto para expressão. Desta forma, quando a endotoxina delta não está diretamente inserida no cloroplasto, o cassete de expressão irá conter adicionalmente um ácido nucléico codificando um peptídeo de trânsito para orientar a endotoxina delta aos cloroplastos. Esses peptideos de trânsito são conhecidos na arte. Ver, por exemplo, Von Heijne et al. (1991) Plant Mol. Biol. Rep.9: 104-126; Clark et al. (1989) J. Biol. Chein. 264: 17544-17550; Della-Cioppa et al. (1987) Plant Physiol. 84:965-968; Romer et al. (1993) Biochem. Biophys. Res. Cowmun.196: 1414-1421; e Shah et al. (1986) Science 233: 478-481.
0 gene endotoxina delta a ser orientado para a cloroplasto pode ser otimizado para a expressão em cloroplasto para levar em conta as diferenças do códon utilizado entre o núcleo da planta e esta organela. Desta forma, os ácidos nucléicos de interesse podem ser sintetizados utilizando códons de cloroplastos preferidos. Ver, por exemplo, Patente US No. 5.380.831, aqui incorporada por referência.
Transformação de Plantas
Métodos da invenção envolvem a introdução de uma construção de nucleotídeo em uma planta. Por "introdução" entende-se apresentar à planta a construção de nucleotídeo de tal forma que o constructo tenha acesso ao interior de uma célula da planta. Os métodos da invenção não exigem que um determinado método para a introdução de uma construção de nucleotídeo em uma planta seja utilizado, só que a construção de nucleotídeo ganhe acesso ao interior de, pelo menos, uma célula da planta. Métodos para introduzir construções de nucleotídeos em plantas são conhecidos na arte, incluindo, mas não se limitando a, métodos de transformação estável, métodos de transformação transientes, e métodos mediados por vírus.
Por "planta" entende-se a planta inteira, órgãos vegetais (por exemplo, folhas, caules, raízes, etc.), sementes, células vegetais, propágulos, embriões e descendentes do mesmo. Células vegetais podem ser diferenciadas ou indiferenciadas (por exemplo, calos, cultura de células em suspensão, protoplastos, células foliares, células de raiz, células de floema, pólen).
"Plantas transgênicas" ou "plantas transformadas" ou plantas "estavelmente transformadas" ou células ou tecidos se referem às plantas que têm incorporado ou integrado seqüências de ácido nucléico exógena ou fragmentos de DNA na célula vegetal. Estas seqüências de ácidos nucléicos incluem as que são exógenas, ou não presentes na célula vegetal não transformada, bem como aquelas que podem ser endógenas, ou presentes na célula vegetal não transformada. "Heterólogas" geralmente se refere às seqüências de ácido nucléico que não são endógenas para a célula ou parte do genoma nativo em que estão presentes, e foram adicionados à célula por infecção, transfecção, microinjeção, eletroporação, microprojeção, ou coisas do gênero.
Transformação de células vegetais pode ser realizada por uma das várias técnicas conhecidas na arte. 0 gene endotoxina delta da invenção pode ser modificado para obter ou melhorar a expressão em células vegetais. Normalmente, um construto que expressa uma proteína irá conter um promotor para conduzir uma transcrição do gene, assim como uma região 3' não traduzida para permitir o término da transcrição e poliadenilação. A organização de tais construções é bem conhecida na arte. Em alguns casos, pode ser útil para a engenharia o gene, tal que o peptídeo resultante seja secretado, ou outra forma segmentada dentro da célula vegetal. Por exemplo, o gene pode ser projetado para conter um peptídeo sinal para facilitar a transferência do peptídeo para o retículo endoplasmático. Também pode ser preferível a engenharia do cassete de expressão vegetal para conter um íntron, de tal forma que o processamento do mRNA no íntron seja necessário para a expressão.
Normalmente este "cassete de expressão vegetal" será inserido em um "vetor de transformação vegetal". Este vetor de transformação vegetal pode ser composto apenas por um ou mais vetores de DNA necessários para a realização da transformação de plantas. Por exemplo, é uma prática comum na arte utilizar vetores de transformação vegetal que são compostos por mais de um segmento de DNA contíguos. Esses vetores são muitas vezes referidos na arte como "vetores binários". Vetores binários, bem como vetores com plasmídios de socorro são mais freqüentemente utilizados para transformação mediada por Agrobacterium, onde a dimensão e complexidade dos segmentos de DNA necessários para alcançar a eficiente transformação é muito grande, e é vantajoso para separar funções nas moléculas de DNA separadas. Vetores binários normalmente contêm um vetor plasmidial que contém seqüências de ação eis exigidas para a transferência do T-DNA (tal como borda esquerda e borda direita), um marcador selecionável que está projetado para ser capaz de expressão em uma célula vegetal, e um "gene de interesse" (um gene projetado para ser capaz de expressão em uma célula vegetal para geração de plantas transgênicas é desejado). Também presentes neste vetor plasmidial estão seqüências necessárias para a replicação bacteriana. As seqüências de ação eis- são dispostas em uma forma eficiente para permitir a transferência em células vegetais e expressão. Por exemplo, o gene marcador selecionável e a endotoxina delta estão localizados entre a borda esquerda e a direita. Muitas vezes um segundo vetor plasmidial contém os fatores de ação trans- que medeiam a transferência de T- DNA de Agrobacterium para as células vegetais. Este plasmídeo freqüentemente contém as funções de virulência (genes Vir) que permitem a infecção das células vegetais por Agrobacterium, e a transferência de DNA pela clivagem das seqüências das bordas e transferência de DNA mediada por vir, como é entendida na arte (Hellens e Mullineaux (2000) Trends in Plant Science 5: 446-451). Vários tipos de cepas de Agrobacterium (por exemplo, LBA4404, GV3101, EHAlOl, EHAl05, etc.) podem ser utilizados para transformação de plantas. 0 segundo vetor plasmidial não é necessário para transformar as plantas através de outros métodos, tais como microprojeção, microinjeção, eletroporação, polietileno glicol, etc. Em geral, métodos de transformação vegetal envolvem transferência de DNA heterólogo em células vegetais alvo (por exemplo, embriões imaturos ou maduros, culturas em suspensão, calos indiferenciados, protoplastos, etc.), seguida pela aplicação de um limiar máximo de nível de seleção adequado (em função do gene marcador selecionável) para recuperar as células vegetais transformadas a partir de um grupo de massa de células não transformadas. Explantes normalmente são transferidos para um suprimento fresco do mesmo meio e cultivados rotineiramente. Posteriormente, as células transformadas são diferenciadas em brotações após a colocação no meio de regeneração suplementado com um limite máximo de nível de agente de seleção. Os brotos são então transferidos para um meio seletivo de enraizamento para recuperar a raiz ou broto. Os brotos transgênicos então crescem em uma planta madura e produzem sementes férteis (por exemplo, Hiei et al. (1994) The Plant Journal 6: 271-2 82; Ishida et al. (1996) Nature Biotechnology 14: 745-750). Explantes normalmente são transferidos para um suprimento fresco de um mesmo meio e cultivados rotineiramente. Uma descrição geral das técnicas e métodos para a geração de plantas transgênicas é encontrada em Ayres e Park (1994) Criticai Reviews in Plant Science 13: 219-239 e Bommineni e Jauhar (1997) Maydica 42:107-120. Uma vez que o material transformado contém muitas células, ambas as células transformadas e não transformadas estão presentes em qualquer parte do calo objeto alvo ou tecido ou grupo de células. A capacidade de matar células não transformadas e permitir células transformadas de 30 multiplicar resulta em culturas de plantas transformadas. Muitas vezes, a capacidade de eliminar células não transformadas é uma limitação a uma cobertura rápida de células vegetais transformadas e de geração bem sucedida de plantas transgênicas.
Protocolos de transformação, bem como protocolos para a introdução de seqüências nucleotidicas em plantas podem variar dependendo do tipo de planta ou de células vegetais, ou seja, monocotiledôneas ou dicotiledôneas, orientadas para a transformação. A geração de plantas transgênicas pode ser realizada por um de vários métodos, incluindo, mas não limitados a, microinjeção, eletroporação, transferência direta de genes, introdução de DNA heterólogo por Agrobacterium em células vegetais (transformação mediada por Agrobacterium), bombardeamento de células vegetais com DNA externo heterólogo aderido às partículas, aceleração de partícula balística, transformação por feixe de aerossóis (Pedido US Publicado No. 20010026941; Patente US No. 4.945.050; Internacional Publication No. WO 91/00915, Pedido US Publicado No. 2002015066), transformação Led, e diversos outros métodos mediados diretamente por não partículas de transferência de DNA.
Métodos de transformação de cloroplastos são conhecidos na arte. Ver, por exemplo, Svab et al. (1990) Proc. Natl. Acad. Sei USA 87: 8526-8530; Svab e Maliga (1993) Proe. Natl. Acad. Sci USA 90: 913-917; Svab e Maliga (1993) EMBO J. 12: 601-606. O método baseia-se na entrega de partícula de DNA que contém um marcador selecionável e segmentação do DNA para o genoma plastidial através de recombinação homóloga. Além disso, a transformação Pl astidial pode ser realizada por transativação de um transgene plastidial silencioso através da expressão do tecido preferido do núcleo codificado e da RNA polimerase dirigida pelo plastídio. Esse sistema tem sido relatado em McBride et al. (1994) Proc. Natl. Acad. Sci USA 91: 7301- 7305.
Seguindo a integração do DNA externo heterólogo em células vegetais, aplica-se um limite máximo de nível de seleção adequado a meio para matar as células não transformadas e separar e proliferar as células putativamente transformadas que sobrevivem a este tratamento de seleção regularmente pela transferência regular para um meio fresco. Por passagem e troca contínua com a seleção adequada, uma identifica e prolifera as células que são transformadas com o vetor plasmidial. Métodos moleculares e bioquímicos podem então ser utilizados para confirmar a presença do gene heterólogo integrado de interesse para o genoma da planta transgênica.
As células que foram transformadas podem ser cultivadas em plantas de acordo com as formas convencionais. Ver, por exemplo, McCormick et al. (1986) Plant Cell Reports 5: 81-84. Estas plantas podem então ser cultivadas, e polinizadas com a mesma linhagem transformada ou linhagens diferentes, e o híbrido resultante tendo expressão constitutiva da característica fenotípica pretendida identificada. Duas ou mais gerações podem ser cultivadas para garantir que a expressão das características fenotípicas desejadas sejam mantidas estáveis e herdáveis e, em seguida, as sementes colhidas a fim de garantir que a expressão das características fenotípicas pretendidas tenha sido alcançada. Desta forma, a presente invenção prevê sementes transformadas (também referidas como "sementes transgênicas"), com um constructo de nucleotídeo do invento, por exemplo, um cassete de expressão da invenção, estavelmente incorporado em seu genoma.
Avaliação da Transformação Vegetal
Após a introdução do DNA heterólogo externo em células vegetais, a transformação ou integração de genes heterólogos no genoma vegetal é confirmada por vários métodos, como a análise de ácidos nucléicos, proteínas e metabólitos associados com o gene integrado.
Análise por PCR é um método rápido para escanear células transformadas, tecidos ou ramo para a presença de genes incorporados na fase anterior, antes de transplantar para o solo (Sambrook e Russell (2001) Molecular Cloning: A Laboratory Manual. Cold Spring Harbor Laboratory Press, Cold Spring Harbor, NY) . A PCR é realizada utilizando iniciadores oligonucleotídeos específicos para o gene de interesse ou vetor Agrobacterium, etc.
A transformação vegetal pode ser confirmada por análise de Southern blot do DNA genômico (Sambrook e Russell, 2001, supra). Em geral, o DNA total é extraído do transformante, digerido com enzimas de restrição apropriadas, fracionado em um gel de agarose e transferido para uma membrana de nitrocelulose ou nylon. A membrana ou "blot" é, então, analisada, por exemplo, com fragmento de DNA alvo radiomarcado com 32P para confirmar a integração do gene introduzido no genoma vegetal, de acordo com as técnicas padrão (Sambrook e Russell, 2 001, supra).
Na análise de Northern blot, o RNA é isolado a partir de tecidos específicos de transformantes, fracionado em um gel de agarose de formaldeído, e repassado para um filtro de nylon, de acordo com procedimentos padrão que são rotineiramente utilizados na arte (Sambrook e Russell, 2001, supra). A expressão de RNA codificada pela endotoxina delta é então testada por hibridização do filtro para uma sonda radioativa proveniente de uma endotoxina delta, através de métodos conhecidos na arte (Sambrook e Russell, 2001, supra).
Western Blot, ensaios bioquímicos e semelhantes podem ser realizados sobre as plantas transgênicas para confirmar a presença da proteína codificada pelo gene endotoxina delta por procedimentos padrão (Sambrook e Russell, 2 001, supra) , utilizando anticorpos que se ligam a um ou mais epítopos presentes na proteína endotoxina delta.
Atividade Pesticida em Plantas
Em outro aspecto da invenção, um pode gerar plantas transgênicas expressando uma endotoxina delta que tenha atividade pesticida. Métodos descritos acima, a título de exemplo podem ser utilizados para gerar plantas transgênicas, mas a maneira em que as células da planta transgênica são geradas não é crítica para esta invenção. Métodos conhecidos ou descritos na arte, como transformação mediada por Agrobacterium, transformação por biobalística, e métodos mediados por não-partículas podem ser utilizados a critério do experimentador. Plantas expressando uma endotoxina delta podem ser isoladas por métodos comuns descritos na arte, por exemplo, por transformação de calos, seleção de calos transformados, e regeneração de plantas férteis de tais calos transgênicos. Nesse processo, pode utilizar qualquer gene como um marcador selecionável tão longo quanto a sua expressão nas células vegetais conferindo a capacidade de identificar e selecionar para células transformadas.
Um certo número de marcadores tem sido desenvolvido para uso com células vegetais, tais como resistência ao cloranfenicol, a aminoglicosídeos G418, higromicina, ou coisas do gênero. Outros genes que codificam um produto envolvido no metabolismo do cloroplasto também podem ser utilizados como marcadores selecionáveis. Por exemplo, genes que oferecem resistência a herbicidas como o glifosato, bromoxinil, ou imidazolinona podem encontrar uso particular. Esses genes têm sido relatados (Stalker et al. (1985) J. Biol. Chew. 263: 6310-6314 (gene nitrilase com resistência ao bromoxinil) e Sathasivan et al. (1990) Nucl. Acids Res. 18: 2188 (gene com resistência a imidazolinona AHAS). Adicionalmente, os genes divulgados aqui são úteis como indicadores para avaliar a transformação de bactérias ou células vegetais. Métodos para detectar a presença de um transgene em uma planta, órgão vegetal (por exemplo, folhas, caules, raízes, etc.), sementes, células vegetais, propágulo, embrião ou descendentes dos mesmos são bem conhecidos na arte. Em um experimento, a presença do transgene é detectada pelo teste da atividade pesticida.
Plantas férteis expressando uma endotoxina delta podem ser testadas para atividade pesticida, e as plantas que apresentam ótima atividade selecionadas para posterior reprodução. Métodos estão disponíveis na arte para ensaio da atividade de pragas. Geralmente, a proteína é misturada e utilizada nos ensaios de alimentação. Ver, por exemplo Marrone et al. (1985) J. of Economic Entomology 78: 290- 293.
A presente invenção pode ser utilizada para transformação de qualquer espécie vegetal, incluindo mas não limitada a, monocotiledôneas e dicotiledôneas. Exemplos de plantas de interesse incluem, mas não estão limitados a, cereais (milho), sorgo, trigo, girassol, tomate, crucíferas, pimentão, batata, algodão, arroz, soja, sacarina de beterraba, cana-de-açúcar, tabaco, cevada e colza, Brassica sp., alfafa, centeio, gramínea, cártamo, amendoim, batata doce, mandioca, café, coco, abacaxi, citros, cacau, chá, banana, abacate, figo, goiaba, manga, azeitona, mamão, caju, macadâmia, amêndoa, aveia, legumes, plantas ornamentais, e coníferas.
Legumes incluem, mas não estão limitados a, tomate, alface, feijão verde, feijões, ervilhas, e os membros do gênero Curcumis tais como pepino, melão, melancia e almíscar. Plantas ornamentais incluem, mas não estão limitadas a, azaléia, hortência, hibisco, rosas, tulipas, narcisos, petúnias, cravo, poinsétia e crisântemo. Preferencialmente, as plantas da presente invenção são espécies vegetais (por exemplo, milho, sorgo, trigo, girassol, tomate, crucíferas, pimentão, batata, algodão, arroz, soja, sacarina de beterraba, cana-de-açúcar, tabaco, cevada, colza, etc.).
Utilização em Controle de Peste
Métodos gerais para empregar linhagens compreendendo uma seqüência de nucleotideo da presente invenção, ou uma variante da mesma, em controle pesticida ou em engenharia de outros organismos como agentes pesticidas são conhecidos na arte. Ver, por exemplo, Patente US No. 5.039.523 e EP 0480762A2.
As linhagens de Bacillus contendo uma seqüência de nucleotideo da presente invenção, ou uma variante, ou os microorganismos que foram geneticamente alterados para conter um gene pesticida e proteína podem ser utilizados para proteger culturas agrícolas e produtos de pestes. Em um aspecto da invenção, células inteiras, ou seja, não lisadas, de um organismo produzindo uma toxina (pesticidas) são tratadas com reagentes que prolongam a atividade da toxina produzida na célula quando a célula é aplicada para o ambiente das pragas-alvo(s). Alternativamente, o pesticida é produzido através da introdução de um gene endotoxina delta em um hospedeiro celular. Expressão do gene endotoxina delta resulta, direta ou indiretamente, na produção e manutenção intracelular do pesticida. Em um aspecto da invenção, estas células são, em seguida, tratadas em condições que prolongam a atividade da toxina produzida na célula quando a célula é aplicada no ambiente das pragas-alvo. O produto resultante mantém a toxicidade da toxina. Estes pesticidas naturalmente encapsulados podem então ser formulados de acordo com técnicas convencionais de aplicação no ambiente das pragas hospedeiras alvo, por exemplo, solo, água e folhagem das plantas. Ver, por exemplo EPA 0192319, e as referências aí citadas. Alternativamente, pode formular as células para expressar o gene da presente invenção, como para permitir a aplicação do material resultante como um pesticida.
Controle de nematóide
Nematóides parasitas de plantas, incluindo cisto de nematóides, nematóides de nó de raiz, e outros nematóides, causam bilhões de dólares em danos para as culturas anuais . Nematóides parasitas de plantas furam paredes de células vegetais com seu estilete, que é formado por algumas das partes da boca e esôfago, e uma bomba até a célula vegetal em seu sistema digestivo. Numerosas publicações na arte concluem que nematóides parasitas de plantas sedentários não ingerem moléculas maiores que cerca de 23-28 kDa in vivo. Isto levou à crença generalizada de que o tubo de alimentação produzido por estes nematóides age como uma peneira molecular, restringindo o tamanho das moléculas que podem ser ingeridas. Bõckenhoff e Grundler ((1994) Parasitology 109: 249-254) injetaram dextranos fluorescentemente etiquetados em um sincício que estava sendo alimentado por Heterodera schachtii. Eles descobriram que os nematóides ingeriram 22 kDa de dextranos, mas não 40 kDa de dextranos. Urwin et al. ((1998) Plant 204:472-479) descobriram que uma proteína de fusão de 23 kDa expressa em Arabidopsis transgênica não pode ser ingerida por H. schachtii, apesar de uma proteína de cerca de 11 kDa poder ser ingerida. Do mesmo modo, Unwin et al. ((1997) Molecular Plant-Microbe Interactions 10: 394-400) constataram que uma proteína verde fluorescente (GFP) de 28 kDa, expressa em Arabidopsis transgênica não pode ser ingerida por H. schachtii. Assim, não foi anteriormente reconhecido ou demonstrado que nematóides podem ser controlados pela expressão de uma proteína maior do que 22 kDa em uma planta, uma vez que foi entendido que nematóides não ingerem essa proteína.
São fornecidos aqui métodos e composições para conferir resistência à nematóide em plantas. Os métodos incluem introdução, em uma planta de pelo menos uma seqüência nucleotídica que codifica um polipeptídeo nematóide-ativo e cultivo da planta em um campo contendo nematóides. Por "polipeptídeo nematóide-ativo" entende-se um polipeptídeo que, quando ingerido pelo nematóide, resulta na morte ou nanismo de crescimento ou proliferação de pelo menos um nematóide. Em um experimento, o polipeptídeo nematóide-ativo tem um peso molecular superior a cerca de 22 kDa, cerca de 23 kDa, cerca de 24, cerca de 25, cerca de 26, cerca de 27, cerca de 28, cerca de 29, cerca de 30, cerca de 31, cerca de 32, cerca de 33, cerca de 34, cerca de 35, cerca de 36, cerca de 37, cerca de 38, cerca de 39, cerca de 40, cerca de 41, cerca de 42, cerca de 43, cerca de 44, cerca de 45, cerca de 46, cerca de 47, cerca de 48, cerca de 49 , cerca de 50, cerca de 51, cerca de 52, cerca de 53, cerca de 54, cerca de 55, cerca de 56, cerca de 57, cerca de 58, cerca de 59, cerca de 60, cerca de 61, cerca de 62, cerca de 63, cerca de 64, cerca de 65, cerca de 66, cerca de 67, cerca de 68, cerca de 69, cerca de 70, cerca de 71, cerca de 72, cerca de 73, cerca de 74, cerca de 75, cerca de 76, cerca de 77, cerca de 78, cerca de 79, cerca de 80 kDa, ou maior.
Em outra incorporação, o polipeptídeo nematóide-ativo tem atividade contra nematóides parasitas de plantas. A expressão do polipeptídeo nematóide-ativo em uma planta reduz a capacidade dos nematóides para infestar ou alimentar raízes da planta. Exemplos de nematóides parasitas de plantas sensíveis às composições da presente invenção incluem nematóides de nó de raiz (Meloidogyne spp.), nematóide dublê (Tylenchorhynchus sp.), nematóide lança (Hoplolaimus sp.), nematóide em espiral (Helicotylenchus sp.), nematóide de lesão (Pratylenehus sp.), cisto de nematóide (Heterodera sp. e Globodera sp.), e nematóide anel (Crieonema sp.).
Composições pesticidas
Os ingredientes ativos da presente invenção são normalmente aplicados na forma de composições e podem ser aplicados para a área ou planta a ser tratada, simultaneamente ou em sucessão, com outros compostos. Estes compostos podem ser adubos, matadores de ervas daninhas, crioprotetores, tensoativos, detergentes, sabonetes pesticidas, óleos latentes, polímeros, e/ou formulações transportadoras biodegradáveis e com tempo de liberação que permitam dosagem a longo prazo de uma área-alvo seguida de uma única aplicação da formulação. Eles também podem ser herbicidas seletivos, inseticidas químicos, virucidas, microbicidas, amebicidas, pesticidas, fungicidas, bacteriocidas, nematocidas, moluscicidas ou misturas de várias destas preparações, se o desejar, juntamente com outras veículos agronomicamente aceitáveis, tensoativos ou adjuvantes de promoção de aplicação habitualmente empregados na arte da formulação. Veículos adequados e adjuvantes podem ser sólidos ou líquidos e correspondem às substâncias comumente empregadas na tecnologia da formulação, por exemplo, substâncias minerais naturais ou regeneradas, solventes, dispersantes, agentes molhantes, tackifiers, adesivos ou fertilizantes. As formulações também podem ser preparadas em "iscas" comestíveis ou em "armadilhas" de pragas para permitir a alimentação ou ingestão por uma praga alvo da formulação pesticida.
Métodos de aplicação de iam ingrediente ativo da presente invenção ou uma composição agroquímica da presente invenção que contêm pelo menos uma das proteínas pesticidas produzidas pelas cepas bacterianas da presente invenção incluem aplicação foliar, aplicação nas sementes do solo e aplicação de revestimento. O número de aplicações e a taxa de aplicação dependem da intensidade de infestação pela praga correspondente.
A composição pode ser formulada como um pó, poeira, sedimento, grânulo, spray, emulsão, colóide, solução, ou afins, e pode ser preparada por meios convencionais, tais como desidratação, Iiofilização, homogeneização, extração, filtração, centrifugação, decantação, ou concentração de uma cultura de células compreendendo o polipeptídeo. Em todas essas composições que contenham pelo menos um desses polipeptídeos pesticidas, o polipeptídeo pode estar presente em uma concentração de cerca de 1% para cerca de .99% em peso.
Parasitas lepidópteros, coleópteros, ou nematóides podem ser mortos ou reduzidos em número em uma dada área através dos métodos da invenção, ou pode ser aplicada profilaticamente a uma área ambiental para evitar a infestação de pragas suscetíveis. De preferência a praga ingere, ou é contatada com uma quantidade pesticidamente efetiva do polipeptídeo. Por "quantidade pesticidamente efetiva" entende-se uma quantidade de pesticida que é capaz de levar a morte a pelo menos uma praga, ou reduzir visivelmente o crescimento de pragas, alimentação, ou desenvolvimento fisiológico normal. Essa quantidade irá variar dependendo de fatores como, por exemplo, as pragas- alvo específicas a serem controladas, o ambiente específico, localização, planta, cultura, ou local agrícola a ser tratado, as condições ambientais, bem como o método, ritmo, concentração, estabilidade, e quantidade de aplicação da composição do polipeptídeo pesticidamente efetivo. As formulações também podem variar em relação às condições climáticas, ambientais, e/ou a freqüência de aplicação e/ou severidade da infestação por pragas. As composições pesticidas descritas podem ser feitas pela formulação tanto pela célula bacteriana, cristal e/ou suspensão de esporos, ou componente protéicos isolados com o veículo agronomicamente aceitável desejado. As composições podem ser formuladas antes da administração, em um meio adequado, como liofilizado, congelado a seco, desidratado, ou em um veículo aquoso, meio ou diluente adequado, como o soro fisiológico ou outros tampões. As composições podem ser formuladas sob a forma de um pó granular ou material, ou uma suspensão em óleo (vegetal ou mineral), ou água ou emulsões óleo/água, ou como um pó molhável, ou em combinação com qualquer outro material veículo adequado para aplicação agrícola. Veículos agrícolas adequados podem ser sólidos ou líquidos e são bem conhecidos na arte. 0 termo "veículo agronomicamente aceitável" abrange todos os adjuvantes, componentes inertes, dispersantes, agentes tensoativos, tackifiers, capas, etc., que são normalmente utilizados na tecnologia de formulação pesticida; estes são bem conhecidos para aqueles especialistas na formulação pesticida. As formulações podem ser misturadas com um ou mais adjuvantes sólidos ou líquidos e preparadas por diferentes meios, por exemplo, por misturar homogeneamente, misturar e/ou triturar a composição pesticidal com adjuvantes adequados utilizando técnicas convencionais de formulação. Formulações adequadas e métodos de aplicação são descritos na Patente US No. 6.468.523, aqui incorporada por referência.
"Pragas" incluem, mas não está limitado a, insetos, fungos, bactérias, nematóides, ácaros, carrapatos, e coisas do gênero. Insetos pragas incluem insetos selecionados a partir das ordens Coleoptera, Diptera, Hymenoptera, Lepidoptera, Mallophaga, Homopterar Hemiptera, Orthroptera, Thysanoptera, Dermaptera, Isoptera, Anoplurar Siphonaptera, Trichoptera, etc, especialmente Coleoptera, Lepidoptera e Diptera.
A ordem Coleoptera inclui as subordens Adephaga e Polyphaga. A subordem Adephaga inclui as superfamílias Caraboidea e Gyrinoidea, enquanto a subordem Polyphaga inclui as superfamílias Hydrophiloidea, Staphylinoideaf Cantharoidea, Cleroidea, Elateroidea, Dascilloidea, Dryopoidear Byrrhoidea, Cucujoidear Meloidear Mordelloidear Tenebrionoidear Bostrichoidea, Scarabaeoidear
Cerambycoidear Chrysomeloidear e Curculionoidea. A superfamília Caraboidea compreende as famílias Cieindelidaer Carabidae e Dytiseidae. A superfamília Gyrinoidea inclui a família Gyrinidae. A superfamília Hydrophiloidea inclui a família Hydrophilidae. A superfamília Staphylinoidea inclui as famílias Silphidae e Staphylinidae. A superfamília Cantharoidea inclui as famílias Cantharidae e Lampyridae. A superfamília Cleroidea inclui as famílias Cleridae e Dermestidae. A superfamília Elateroidea inclui as famílias Elateridae e Buprestidae. A superfamília Cucujoidea inclui a família Coccinellidae. A superfamília Meloidea inclui a família Meloidae. A superfamília Tenebrionoidea inclui a família Tenebrionidae. A superfamília Scarabaeoidea inclui as famílias Passalidae e Searabaeidae. A superfamília Cerambyeoidea inclui a família Cerambyeidae. A superfamília Chrysomeloidea inclui a família Chrysornelidae. A superfamília Curculionoidea inclui as famílias Cureulionidae e Seolytidae.
A ordem Diptera inclui as subordens Nematoeera,
Braehyeera, e Cyelorrhapha. A subordem Nematoeera inclui as famílias Tipulidae, Psyehodidae, Culieidael
Ceratopogonidae, Chironomidae, Simuliidae, Bibionidae, e Ceeidomyiidae. A subordem Braehyeera inclui as famílias
Stratiomyidae, Tabanidael Therevidael Asilidae, Mydidae, Bombyliidae, e Dolichopodidae. A subordem Cyelorrhapha inclui as divisões Asehiza e Asehiza. A divisão Asehiza inclui a famílias Phoridae, Syrphidae e Conopidae. A divisão Asehiza inclui as seções Aealyptratae e Calyptratae. A seção Acalyptratae inclui as famílias Otitidae, Tephritidae, Agromyzidae, e Drosophilidae. A seção Calyptratae inclui as famílias Hippoboscidae, Oestridaef Taehinidae, Anthomyiidaef Museidaef
Calliphoridae e Sareophagidae. A ordem Lepidoptera compreende as famílias Papilionidae, Pieridae, Lycaenidaef Nymphalidae, Danaidaef Satyridaef Hesperiidae, Sphingidae, Saturniidaef
Geometridaef Aretiidaef Noetuidaef Lymantriidaef Sesiidaef
e Tineidae. Os insetos-praga da invenção para as principais culturas são: Milho: Ostrinia nubilalis, broca do milho europeu; Agrotis ipsilon, lagarta-rosca; Helicoverpa zea, lagarta da espiga; Spodoptera frugiperda, lagarta militar; Diatraea grandiosella, lagarta do cartucho; Elasmopalpus lignosellus, broca do colo, Diatraea saccharalis, broca da cana-de-açúcar; Diabrotica virgifera, lagarta da raiz do milho; Diabrotica longicornis barberi, vaquinha do norte; Diabrotica undecimpunctata howardi, vaquinha do sul; Melanotus spp. Larva arame; Cyclocephala borealis, besouro mascarado do norte (grub branco); Cyeloeephala imnaculata, besouro mascarados do sul (grub branco); Popillia japoniea, besouro japonês; Chaetoenema puliearia, pulguinha do milho e do arroz; Sphenophorus maidis, broca do colmo; Rhopalosiphum maidis, pulgão das folhas do milho; Anuraphis maidiradieis, afideo da raiz do milho; Blissus leueopterus leueopterus, percevejo das gramíneas; Melanoplus femurrubrum, gafanhoto; Melanoplus sanguinipes, gafanhoto migratório; Hylemya platura, verme das sementes do milho; Agromyza parvieornis, traça do milho; Anaphothrips obserurus, tripés de erva; Solenopsis milesta, formigas ladrão; Tetranyehus urtieae, ácaro rajado; Sorgo: Chilo partellus, broca do sorgo; Spodoptera frugiperda, lagarta militar, Helieoverpa zea, lagarta da espiga; Elasmopalpus lignosellus, broca do colo; Feltia subterranea, vermes granulados; Phyllophaga erinita, grub branco; Eleodes, Conoderus, e Aeolus spp. vermes fio; Oulema melanopus, besouro da folha de cereais; Chaetoenema puliearia, pulguinha do milho e do arroz; Sphenophorus maidis, broca do colmo; Rhopalosiphum maidis; pulgão das folhas do milho; Siphaflava, afídeo amarelo da cana; Blissus leucopterus leucopterus, percevejo; Contarinia sorghicola, sorgo anão; Tetranychus cinnabarinus, ácaro vermelho; Tetranychus urticae, ácaro rajado; Trigo: Pseudaletia unipunctata, verme exército; Spodoptera frugiperda, lagarta militar, Elasmopalpus lignosellus, broca do colo; Agrotis orthogonia, lagarta do oeste; Elasmopalpus lignosellus, broca do colo; Oulema melanopus, besouro de cereais; Hypera
punctata, gorgulho da folha do trevo; Diabrotica undecimpunetata howardi, vaquinha do sul; afideo russo do trigo; Sehizaphis graminum, pulgão; Maerosiphum avenae, afideo inglês de grão; Melanoplus femurrubrum, gafanhoto vermelho; Melanoplus differentialis, gafanhoto diferencial;
Melanoplus sanguinipes, gafanhoto migratório; Mayetiola destruetor, Mosca Hesse; Sitodiplosis mosellana, trigo anão; Meromyza americana, verme do caule do trigo; Hylemya coarctata, mosca do bulbo do trigo; Frankliniella fusca, tripés do tabaco; Cephus cinctus, mosca do caule do trigo;
Aceria tulipae, ácaro do trigo; Girassol: Suleima helianthana, mariposa das gemas do girassol; Homoeosoma electellum, mariposa do girassol; Zygogramma exelamationis, besouro do girassol; Bothyrus gibbosus, besouro cenoura; Neolasioptera murtfeldtiana, praga da semente de girassol;
Algodão: Heliothis virescens, lagarta do algodão, Helicoverpa zea, lagarta do algodão; Spodoptera exígua, lagarta da beterraba; Peetinophora gossypiella, lagarta rosada; Anthonomus grandis, bicudo; Aphis gossypii, afídeo do algodão; Pseudatomoscelis seriatus, praga do algodoeiro;
Trialeurodes abutilonea, mosca branca da asa com banda; Lygus lineolaris, inseto manchado de planta; Melanoplus femurrubrum, gafanhoto vermelho; Melanoplus differentialis, gafanhoto diferencial, Thrips tabaci, tripés da cebola; Franklinkiella fusca, tripés do tabaco; Tetranychus cinnabarinus, ácaro carmim; Tetranychus urticae, ácaro rajado; Arroz: Diatraea saccharalis, broca da cana-de- açúcar; Spodoptera frugiperda, lagarta militar, Helicoverpa zea, lagarta da espiga; Colaspis brunnea, colaspis da uva; Lissorhoptrus oryzophilus, gorgulho aquático do arroz, Sitophilus oryzae, gorgulho do arroz; Nephotettix nigropictus, cigarrinha do arroz; Blissus leucopterus leucopterus, percevejo; Acrosternum hilare, percevejo verde; Soja: Pseudoplusia includens, lagarta mede-palmo da soja, Antiearsia gemmatalis, parasitóide de ovos; Plathypena seabra, verme verde do trevo; Ostrinia nubilalis, broca do milho europeu; Agrotis ipsilon, lagarta rosca; Spodoptera exigua, lagarta da beterraba; Heliothis virescens , lagarta das maçãs; Helieoverpa zea, lagarta do algodão; Epilaehna varivestis, besouro do feijão mexicano; Myzus persieae, pulgão; Empoasea fabae, cigarrinha da batata; Aerosternum hilare, percevejo verde; Melanoplus femurrubrum, gafanhoto vermelho; Melanoplus differentialis, gafanhoto diferencial; Hylemya platura, verme das sementes do milho; Serieothrips variabilis, tripés da soja, Thrips tabaci, tripés da cebola; Tetranychus turkestani, ácaro do morango; Tetranychus urticae, ácaro rajado; Cevada: Ostrinia nubilalis, broca do milho europeu; Agrotis ipsilon, lagarta rosca; Schizaphis graminum, pulgão ; Blissus leucopterus leucopterus, percevejo; Acrosternum hilare, percevejo verde; Euschistus servus, percevejo marrom; Delia platura, mosca da semente do milho; Mayetiola
destructor, Mosca Hesse; Petrobia latens, ácaro marrom do
trigo; Semente de colza: Brevicoryne brassicae, afídeo do
besouro; Phyllotreta cruciferae, besouro; Mamestra
configurata, lagarta Bertha; Plutella xylostella, traça das crucíferas; Delia ssp., vermes da raiz.
Nematóides incluem nematóides parasitas, como vermes de raiz, cisto, e nematóides de lesão, incluindo Heterodera spp., Meloidogyne spp., e Globodera spp.; em particular os membros dos nematóides do cisto, incluindo mas não limitados a, Heterodera glycines (nematóide de cisto da soja); Heterodera schachtii (nematóide de cisto da beterraba); Heterodera avenae (nematóide de cisto de cereais) e Globodera rostochiensis e Globodera pailida (nematóide de cisto da batateira). Nematóides de lesão incluem Pratylenchus spp. Métodos para aumento da produção vegetal
Métodos para aumentar as características de produção são fornecidos. Os métodos incluem introdução em uma planta ou em uma célula vegetal um polinucleotídeo compreendendo uma seqüência pesticida aqui divulgada. Tal como definido aqui, o "rendimento" da planta se refere à qualidade e/ou a quantidade de biomassa produzida pelas plantas. Por "biomassa" entende-se qualquer medida do produto vegetal. Um aumento na produção de biomassa é uma melhora no rendimento medido do produto vegetal. Aumentar a produção vegetal tem várias aplicações comerciais. Por exemplo, o aumento da biomassa vegetal da folha pode aumentar o rendimento das hortaliças folhosas para consumo humano ou animal. Adicionalmente, o aumento da biomassa foliar pode ser usado para aumentar a produção de produtos farmacêuticos ou produtos industriais derivados de plantas. Um aumento no rendimento pode incluir qualquer aumento estatisticamente significativo, incluindo, mas não se limitando a, pelo menos um aumento de 1%, pelo menos um 3% de aumento, pelo menos um aumento de 5%, pelo menos um aumento de 10%, pelo menos um aumento de 2 0%, pelo menos 30%, pelo menos 50%, pelo menos 70%, pelo menos 100%, ou um maior aumento na produtividade em comparação com uma planta não expressando a seqüência pesticida.
Nos métodos específicos, o rendimento vegetal é aumentado como resultado de uma melhoria da resistência a pragas em uma planta expressando uma proteína pesticida aqui divulgada. Expressão da proteína pesticida resulta em uma redução da capacidade de uma praga para infestar ou se alimentar da planta, assim, melhorando as características de produção.
Os seguintes exemplos são oferecidos a título de ilustração e não por meio de limitação.
EXPERIMENTAL
Exemplo 1. Crescimento de ATX9387, e preparação dos extratos.
A estirpe ATX93 87, identificada como um membro do grupo de Bacillus cereus/Bacillus thuringiensis pela análise de MIDI, foi cultivada em meio T3 a 30 graus por períodos variando de 16 horas a 5 dias. As culturas foram centrifugadas e os sobrenadantes foram passados através de filtros de 0,2 mícron, resultando em sobrenadantes estéreis
Exemplo 2. Bioensaio com C. elegans.
Caenorhabitis elegans ("C. elegans") hermafroditas foram criados como conhecido na arte, para gerar populações de animais saudáveis para bioensaio. Procedimentos gerais para o crescimento, a colheita, e a manipulação genética de C. elegans, incluindo o crescimento em meio, etc podem ser encontrados na arte, por exemplo, em Wood, ed. (1988) A Nematode Caenorhabditis elegans (Cold Spring Harbor Laboratory Press, Cold Spring Harbor, NY).
Sobrenadantes estéreis da estirpe ATX93 87 foram testados para a atividade em C. elegans. Os bioensaios foram realizados em 96 placas. Cinco a dez nematóides foram adicionados aos 80 μΐ de meio S (Wood, supra) e foram misturadas com 20 μΐ de sobrenadante estéril, 0.5 μΐ de HBlOl concentrado (preparado conforme descrito em Wood, supra) e rifampicina (concentração final de 0,1 μg/μl). Os ensaios foram autorizados a proceder em temperatura ambiente durante 3 dias e nematóides foram quantificados. Amostras de controle negativo (meio T3 estéril ou sobrenadantes inativos de cepas) continham centenas de nematóides ativos, enquanto amostras (contendo sobrenadantes ATX93 87) continham 5 a 10 nematóides que estavam letárgicos ou mortos. Os resultados do bioensaio de extratos de ATX9387 em C. elegans são apresentados na Tabela 1. Tabela 1. Atividade de extratos de ATX9387 em C. elegans
<table>table see original document page 63</column></row><table>
Exemplo 3. Atividade de ATX9387 sobre nematóides do cisto da soja.
Um sobrenadante estéril de uma cultura de 5 dias de ATX93 87 foi concentrado em 40 vezes e alimentado à nematóides SCN J2. Nematóides que se alimentaram do sobrenadante estéril foram reprodutivelmente observados por estarem lentos, e apresentaram maior motilidade que nematóides alimentados com o extrato de um controle negativo concentrado na mesma medida.
Exemplo 4. Atividade anti-nematóide a partir de ATX9387 é conferida por uma proteína.
Para identificar a atividade anti-nematóide em ATX9387, os seguintes testes foram realizados. Em primeiro lugar, a capacidade da atividade a ser destruída pelo calor foi testada por aquecimento a partir de amostras de sobrenadante estéril de ATX9387 a IOO0C durante 10 minutos e, em seguida, o material avaliado foi aquecido em um bioensaio com nematóide. 0 tratamento térmico de sobrenadantes estéreis de ATX9387 resultou em uma perda da atividade anti-nematóide. Em seguida, as amostras ativas foram tratadas com pronase para degradar proteínas. Este resultou em perda da atividade. Sobrenadantes estéreis de ATX93 87 foram passados através de 3 kDa de peso molecular de corte ("MWCO") de unidade de concentração. 0 ingrediente ativo foi mantido pelo filtro de 3 kDa de MWCO enquanto o que passou pelo fluxo não mostrou nenhuma atividade. Isso indica que a molécula ativa foi maior do que 3 kDa em tamanho.
Exemplo 5. Fracionamento de atividade a partir de ATX9387
O sobrenadante estéril de uma cultura de 4 dias de ATX9387 foi fracionado por cromatografia líquida em uma coluna de troca aniônica em 20 mM de Tris a pH 8, um gradiente de 0 a 1 mM de NaCl. Várias frações consecutivas foram ativadas. A fração mais ativa foi submetida a SDS-PAGE, e duas bandas proeminentes de aproximadamente 13Okd e aproximadamente 7 Okd foram observadas.
Em outro experimento a cepa ATX9387 foi cultivada durante 5 dias em meio T3 em 3 0°C. A cultura foi centrifugada a 8000 χ g por 10 minutos, e o sobrenadante foi passado através de um filtro de 0,2 |im. O sobrenadante filtrado foi dializado contra 20 mM de Tris em pH 8 usando Spectra/Por 1 tubulação de diálise (6-8000 MWCO), e foi então fracionado em uma coluna de troca de ânion (Mono Q), utilizando um gradiente de 0 a 1 M de NaCl mais de 2 0 volumes. As frações foram dializadas contra 20 mM de Tris em pH 8 em slides -A-Lyzer (Pierce Biotechnology, Rockford, IL) unidades de mini diálise (7000 MWCO), e bioensaiado em C. elegans utilizando 20μ1 da amostra em iam ΙΟΟμΙ de volume de bioensaio, conforme descrito a seguir. Frações 12 e 13 foram encontradas para ser ativas, e, em seguida, foram reunidas e concentradas 7 vezes usando uma Amicon concentrador Ultra-4 5000 MWCO. 0 material concentrado foi fracionado em uma coluna de filtração em gel (Superdex 200) em 50 mM de fosfato de sódio, 150 mM de NaCl, em pH 7.
Frações foram concentradas 10 vezes utilizando concentradores Centricon YM-3, e foram bioensaiados em C. elegans como acima. As frações 5 e 6 foram as mais ativas, e a fração 7 foi um pouco ativa. 0 SDS-PAGE das frações revelou que frações 5-7 partilharam várias proteínas: uma proteína com cerca de 130 kDa, um gibão com cerca de 75 kDa, e uma proteína com cerca de 53 kDa. As bandas mais proeminentes foram submetidas a sequenciamento da proteína N-terminal por degradação de Edman. A proteína de 13 0 kDa e a proteína de 70 kDa tinham muitas seqüências N-terminal semelhantes (a cisteína poderia não ser detectada pelo método utilizado) , e, portanto, são susceptíveis de resultar da mesma proteína inicial. Esta proteína foi designada AXMI-031 (SEQ ID NO: 2).
Tabela 2. Seqüência N-terminal da proteína de aproximadamentel30kDa de ATX9387
1 A, S+S', M
2 D, Q
3 ?, Ρ, N <table>table see original document page 66</column></row><table>
Tabela 3. Seqüência N-terminal da proteína de cerca de 7OkDa de ATX93 87
<table>table see original document page 66</column></row><table> 15 ?, V
Uma pesquisa das bases de dados de proteína com as seqüências N-terminal da proteína de ~130kDa e da proteína de ~70kDa demonstrou que os aminoácidos N-terminal de proteínas AXMI-031 têm grande semelhança com o N-terminal da endotoxina Cry 14Aa (SEQ ID NO: 13).
A seqüência N-terminal de Cryl4A: MDCNLQSQQNIPYNV (resíduos de aminoácido de 1 a 15 da SEQ ID NO: 13).
Exemplo 6. Clonagem da região codificadora axmi-031 de ATX9387.
Uma biblioteca de fragmento aleatório de ATX9387 foi gerada, e um clone de DNA (pAX031) que contém a seqüência de DNA codificando o N-terminal de axmi-031 foi identificado. Um segundo clone, pAX032, foi identificado como contendo o C-terminal de axmi-031. Clones pAX031 e pAX032 sobrepuseram substancialmente, de tal forma que é evidente para um técnico no assunto que os dois clones juntos compreendem toda a região codificadora axmi-031.
Para confirmar a natureza de AXMI-031, um clone genômico foi amplificado usando uma polimerase PFU ULTRA (TM) (Stratagene) de alta fidelidade do DNA total usando iniciadores desenhados para a extremidade de axmi-031 do molde de leitura aberta. O produto resultante da PCR foi clonado no vetor PCR-TOPOII Blunt (Invitrogen) para criar pAX980. A seqüência de DNA de pAX980 foi determinada e verificou-se que contém o mesmo molde de leitura aberta como na biblioteca de fragmento aleatório de clones de pAX031 e ρΑΧ032. A tradução deste molde de leitura aberta gera uma seqüência de proteína coerente com a seqüência N- terminal obtida a partir da proteína purificada AXMI-031. Assim, este molde de leitura aberta foi designado axmi-031 (SEQ ID NO: 1). 0 clone plasmidial pAX2515, contendo axmi-031 foi depositado em 9 de junho de 2006 e atribuído o número de acesso NRRL B-30935.
Exemplo 7. Comparação de AXMI-031 com outras endotoxinas conhecidas
Buscas no banco de dados usando seqüências de proteínas AXMI-031 demonstraram que AXMI-031 é um membro da classe de proteínas inseticidas endotoxina delta. AXMI-031 é muito semelhante a endotoxina cryl4Aal. A seqüência de aminoácidos AXMI-031 é 86,6% idêntica à CRYl4Aal (SEQ ID NO: 13).
Exemplo 8. Expressão do polipeptídeo AXMI-031 em E. coli
Para expressão solúvel em E. coli, iniciadores foram desenhados a fim de incluir o início da tradução e os códons de parada do ORF de axmi-031. Os iniciadores foram acrescentados em um RBS ótimo e em sítios de recombinação Gateway attB. A polimerase I Stratagene PFU foi utilizada para amplificar consistentemente o ORF de pAX980, e recombinada com pDONR221 (Invitrogen, Carlsbad, CA) para criar o vetor de entrada pAX2515 (como por protocolos da Invitrogen). 0 clone foi seqüenciado para verificação. Uma nova recombinação foi realizada para introduzir o ORF em pDESTl7 para ser expresso pelo promotor T7, rendendo pAX2530. A presença e orientação do fragmento inserido de axmi-031 foram verificadas pela digestão de restrição, e transformadas em células de E. coli BL21 (DE3) . Este vetor produz uma fusão traducional de 26 aminoácidos (3,17 kDa) , incluindo um His tag de 6x, sobre o N-terminal de AXMI-031.
0 His-AXMI-031 foi expresso a partir de pAX2530 em células BL21*(DE3) como se segue. Uma cultura de inicio de pAX2530 foi cultivado por toda a noite a 37°C em LB com 50 μg/ml de carbenicilina. No dia seguinte a cultura saturada foi diluída em meio fresco 1:100, e as novas culturas cultivadas a 37° para um OD de 0,4, no qual o tempo de cultura foi colocada em temperatura ambiente com agitação durante a noite. Como controle, um vetor de expressão axmi- .004 portador do gene (pAX253 0) foi construído como para axmi-031, e as proteínas AXMI-004 (Depósito de Patente US No. 10/782.020) foram expressas a partir de pAX2504 na mesma E. coli hospedeira. As culturas inteiras foram analisadas por SDS-PAGE. As culturas contendo pAX253 0 produziram uma banda proeminente da proteína em aproximadamente 135 kDa, o tamanho esperado para a proteína His-AXMI-031, enquanto culturas contendo pAX2504 não.
Exemplo 9. Anticorpos contra AXMI-031
Para gerar anticorpos anti-AXMI-031, afinidade purificada de AXMI-031 (SEQ ID NO: 2) a proteína foi inoculada em coelhos e, antisoros para AXMI-031 isolados e titulados tal como é conhecido na arte. Os antisoros selecionados foram encontrados para também reagir com proteínas SYNAXMI-031 (SEQ ID NO: 8).
Exemplo 10. Atividade de AXMI-031 em C. elegans. Culturas de Ε. coli contendo pAX2530, foram preparadas, e encontradas para produzir uma proteína 13 5kDa não presente nas cepas controle, sugerindo a expressão de AXMI-031 em pAX2530 contendo as cepas. Essas culturas foram testadas para a atividade em C. elegans e foram ativadas contra C. elegans, enquanto culturas controle não mostraram nenhuma atividade contra C. elegans.
Exemplo 11. Expressão de AXMI A-031 em Bacillus
O gene inseticida axmi-031 é amplificado por PCR a partir de pAX980, e o produto da PCR é clonado no vetor de expressão pAX916 de Bacillus, ou outro vetor adequado, através de métodos bem conhecidos na arte. A estirpe resultante de Bacillus, contendo o vetor com axmi-031 é cultivado em meio de crescimento convencional, como o meio CYS (10 g/l de Bacto-casitone; 3 g/l de extrato de levedura; 6 g/l de KH2PO4; 14 g/l de K2HPO4, 0,5 mM de MgSO4; 0,05 mM de MnCl2; 0,05 mM de FeSO4), até esporulação ser evidente pelo exame microscópico. As amostras são preparadas, e a proteína AXMI-031 foi testada para a atividade em bioensaios contra C. elegans, e verificou-se que tinham atividade.
Exemplo 12. synaxmi-031, synaxmi-031 (apo) e synaxmi-031 (ER)
Em um aspecto da invenção, seqüências sintéticas de axmi-031 são geradas, por exemplo, synaxmi-031 (SEQ ID NO: 7). Estas seqüências sintéticas têm uma seqüência de DNA modificada em relação à seqüência axmi-031, e codifica uma proteína que é colinear com a proteína original AXMI-031, mas falta o "domínio cristal" C-terminal presente em AXMI-031. A seqüência do gene synaxmi-031 codifica proteínas SYNAXMI-031 (SEQ ID NO: 8), que compreende os primeiros 685 aminoácidos da proteína AXMI-031.
Em outro aspecto da invenção, versões modificadas do synaxmi-031 são projetadas tais que o peptídeo resultante é direcionado para uma organela vegetal, como o retículo endoplasmático ou o apoplasto. Seqüências peptídicas conhecidas para resultar no direcionamento da fusão de proteínas para organelas vegetais são conhecidas na arte. Por exemplo, a região N-terminal do gene da fosfatase ácida de White Lupin Lupinus albus (Genebank ID GI: 14276838, Miller et al. (2001) Plant Physiology 127: 594-606) é conhecida na arte de conduzir o retículo endoplasmático direcionando para proteínas heterólogas. Se a proteína de fusão resultante também contém uma seqüência de retenção endoplasmática compreendendo o peptídeo N-terminal lisina- ácido aspártico-ácido glutâmico-leucina (isto é, o motivo "KDEL" (SEQ ID NO: 36), o C-terminal, a proteína de fusão será orientada para o retículo endoplasmático. Se a proteína de fusão não tem um retículo endoplasmático direcionando a seqüência para o C-terminal, a proteína será orientada para o retículo endoplasmático, mas acabará por ser seqüestrado no apoplasto.
Assim, o gene synaxmi-03 IER (SEQ ID NO: 11) codifica uma proteína de fusão que contém trinta e um aminoácidos N- terminais do gene da fosfatase ácida de White Lupin Lupinus albus fundido para o N-terminal de SYNAXMI - 031, bem como a seqüência KDEL no C-terminal. Assim, a proteína resultante AXMI-03 IER (SEQ ID NO: 12) está prevista para ser direcionada para o retículo endoplasmático vegetal mediante a expressão em uma célula vegetal.
0 gene synaxmi-031 (apo) (SEQ ID NO: 9) codifica uma proteína de fusão que contém trinta e um aminoácidos N- terminais do gene da fosfatase ácida de White Lupin Lupinus albus fundido para o N-terminal de S YNAXMI - 031, mas carece da seqüência KDEL no C-terminal. Assim, a proteína resultante AXMI-031 (APO) (SEQ ID NO: 10) está prevista para ser direcionada para o apoplasto vegetal após expressão em uma célula vegetal.
Exemplo 13. Truncações de synaxmi-031 para o rendimento alternativo de proteínas AXMI-031
Construtos de DNA que resultaram na expressão de proteínas variantes AXMI-031 foram desenvolvidos e expressos, além de seqüências sintéticas de codificação de AXMI-031 e variantes e fragmentos destas (SEQ ID NO: 15- 27). Um subconjunto destes genes foi testado para atividade nematóide in vitro.
Tabela 4. Atividade nematicida de variantes de AXMI-
031 in vitro <table>table see original document page 73</column></row><table> NT = Não testado
Exemplo 14. Truncações e adição de domínio(s) celulares direcionando para expressão vegetal
Em outro aspecto da invenção, versões modificadas das seqüências synaxmi-031 são projetadas tais que o peptídeo resultante é direcionado para uma organela vegetal, como o retículo endoplasmático ou o apoplasto. Em outro aspecto da invenção, os genes são truncados, tais que o peptideo resultante é uma versão truncada do AXMI-031, que pode ou não ser modificado para direcionamento para organelas vegetais, tais como o apoplasto ou o retículo endoplasmático.
Em outro aspecto da invenção, versões modificadas são desenvolvidas, que resultam na expressão de variantes truncadas que contêm domínios concebidos para orientar as proteínas resultantes para organelas vegetais.
As seguintes seqüências nucleotídicas variantes foram concebidas:
aposynaxmi -031 (A-D) (SEQ ID NO: 28) codifica a
proteína APOAXMI-031 (A-D) (SEQ ID NO: 29) . apoSyn2axmi-031 (A-D) (SEQ ID NO: 30) codifica a proteína APOAXMI-031 (A-D) (SEQ ID NO: 31) . aposynaxmi-031 (fl) (SEQ ID NO: 37) codifica a proteína APOSYNAXMI-031 (FL) (SEQ ID NO: 38) . Synaxmi 031 (fl) -ER (SEQ ID NO: 32) codifica a proteína SYNAXMI-031 (FL)-ER (SEQ ID NO: 33).
Exemplo 15. Extração de DNA plasmidial de cepas ATX16538, ATXl6093 e ATX21049 Cepas ATX16538, ATX16093, e ATX21049 foram
selecionadas para análise. Culturas puras de cada linhagem foram cultivadas em grandes quantidades de meio rico. As culturas foram centrifugadas para colheita de células do sedimento. O sedimento celular foi então preparado por tratamento com EDS por métodos conhecidos na arte, resultando na quebra da parede celular e libertação de DNA. Proteínas e grandes DNAs genômicos foram então precipitados por uma elevada concentração de sal. 0 DNA plasmidial foi então precipitado com etanol. Em vários casos, o DNA plasmidial foi separado dos demais DNAs cromossômicos por centrifugação de alta velocidade através de um gradiente de cloreto de césio. Alternativamente, o DNA plasmidial foi purificado através da ligação a uma resina, tal como é conhecido na arte. Para cada cepa, a qualidade do DNA foi verificada pela visualização de um gel de agarose por métodos conhecidos na arte.
Exemplo 16. Clonagem de genes das cepas ATX 16538, ATX 16093, ATX21049 Bibl iotecas de DNA plasmidial foram preparadas a
partir do DNA de cada cepa. Isto pode ser alcançado de várias maneiras como conhecido na arte. Por exemplo, o DNA plasmidial purificado pode ser cisalhado em fragmentos de 5-10 kb e os fragmentos 5' e 3' de fita única reparados usando DNA polimerase T4 e fragmento de Klenow na presença de todos os quatro dNTPs, tal como é conhecido na arte. Fosfatos podem então ser anexados a extremidade 5' por tratamento com polinucleotídeo quinase T4, tal como é conhecido na arte. A reparação dos fragmentos de DNA podem então ser ligada por toda a noite em um vetor de cópia de padrão elevado (ou seja, pBLUESCRIPT®SK+), devidamente preparado para aceitar as inserções tal como é conhecido na arte (por exemplo, digestão com uma enzima de restrição produzindo extremidades blunt). A qualidade do DNA resultando bibliotecas digestão foi analisado por um subconjunto de clones com uma enzima de restrição conhecida por ter uma clivagem sítios flanqueiam a clonagem sítios. Uma alta porcentagem de clones foram determinados para conter inserções, geralmente com uma média inserir tamanho de 5-6 kb.
Exemplo 17. Sequenciamento através de Biblioteca de Placas Uma vez que a qualidade da biblioteca de DNA foi verificada e confirmada, colônias foram cultivadas em um caldo rico em 2ml de 96 blocos por toda a noite a 37°C, normalmente a uma velocidade de agitação de 3 50 rpm. Os blocos foram centrifugados para coletar as células, na parte inferior do bloco. Os blocos foram então preparados por Iise alcalina padrão em um formato de alto padrão.
As seqüências finais dos clones desta biblioteca foram, então, determinadas para um grande número de clones a partir de cada bloco da seguinte maneira: A seqüência do DNA de cada clone escolhido para análise foi determinada utilizando a técnica de sequenciamento com corante fluorescente terminal (Applied Biosystems), por métodos conhecidos na arte utilizando uma máquina automática de sequenciamento de DNA, e oligonucleotídeos iniciadores padrão que anelam o vetor plasmidial na região de flanqueamento do inserto.
Exemplo 18. Montagem e Análise de Dados do Sequenciamento
Seqüências de DNA obtidas foram compiladas em um projeto conjunto e alinhadas para formar contigs. Isto pode ser feito de forma eficiente usando um programa de computador, tais como Vector NTI, ou, em alternativa, utilizando os programas Pred/Phrap de alinhamento e análise de DNA, tal como descrito aqui. Estes contigs, juntamente com qualquer leitura individual que pode não ter sido adicionada a um contig, foram comparados com uma compilação de dados de todas as classes de genes pesticidas conhecidos. Contigs ou leituras individuais identificadas como tendo uma identidade para uma endotoxina ou gene pesticida conhecido foram analisados mais detalhadamente.
Da estirpe ATXl 6538, pAX2579 foi encontrado para conter uma um molde de leitura aberta com homologia para endotoxinas delta do tipo "cry". Este molde de leitura aberta (ORF) foi designado como axmi-039 (SEQ ID NO: 3), e a proteína codificada foi designada AXMI-039 (SEQ ID NO:5) . 0 ORF axmi-039 e a seqüência de acompanhamento (151 pb a montante do códon de início e 29 pb a jusante do códon de parada) foi amplificado por PCR, clonado em pRSFIB e sequenciado para gerar pAX2579. pAX2579 foi depositado junto ao ARS Patent Strain Collection em 9 de junho de2006, e atribuído o n2 NRRL B-30936. AXMI-039 é 43,9% de identidade de seqüência de aminoácidos para Cry5Bal, que é o homólogo mais próximo identificado.
Da estirpe ATX 16093, pAX4313 foi encontrado para conter um molde de 1 eitura aberto com homologia com a endotoxina delta do tipo "cry". Este molde de leitura aberto (ORF) foi designado axmi-040 (SEQ ID NO: 7) , e a proteína codificada foi designada AXMI-040 (SEQ ID NO: 8) . ΡΑΧ4313 foi depositada junto do ARS Patent Strain Collection em 9 de junho de 2006, e atribuído o na NRRL B-30937. AXMI-040 é 42,9% de identidade de seqüência de aminoácidos para Cry2lBal, que é o homólogo mais próximo identificado.
Da estirpe ATX21049, um molde de leitura aberto foi identificado que apresentou homologia com endotoxina delta do tipo "cry" . Este molde de leitura aberto foi designado axmi-049 (SEQ ID NO: 34) , e a proteína codificada foi designada AXMI-049 (SEQ ID NO: 35) . Este molde de leitura aberto foi amplificado por PCR e clonado em um vetor de rendimento pAX5039. pAX5039 foi depositado junto do ARS Patent Strain Collection em 29 de maio de 2 007, e atribuído o n2 NRRL B-50046. AXMI-049 tem 46,1% de identidade de seqüência de aminoácidos para Cry2lBal, que é o homólogo mais próximo identificado.
Exemplo 19. Vetorização dos genes pesticidas da invenção para expressão vegetal Cada uma das regiões codificantes dos genes da invenção estão conectadas independentemente com o promotor adequado e as seqüências terminadoras de expressão em plantas. Tais seqüências são bem conhecidas na arte e podem incluir o promotor actina do arroz ou o promotor ubiquitina do milho para expressão em monocotiledôneas, um promotor Arabidopsis UBQ 3 ou promotor CaMV 3 5S de expressão em dicotiledôneas, e os terminadores NSA ou PinII. Técnicas para produzir e confirmar construções promotor-gene- terminador também são bem conhecidas na arte. Exemplo 20. Transformação dos genes da invenção em células vegetais por Transformação mediada por Agrobacterium
Espigas foram colhidas 8-12 dias após a polinização.
Embriões foram isolados das espigas, e estes embriões de0,8-1,5 mm de tamanho foram utilizados para a transformação. Embriões foram plaqueados com o escutelo para cima sobre meios de incubação adequados, e incubados por toda a noite a 2 5 2C no escuro. No entanto, não é necessário, por si só para incubar os embriões durante a noite. Embriões são contatados com uma estirpe de Agrobacterium contendo os vetores adequados para transferência mediada por plasmidio Ti por 5-10 minutos e, em seguida, plaqueados em meio de co-cultura durante 3 dias (25°C no escuro). Depois do co-cultivo, os explantes são transferidos para o meio de recuperação por cinco dias (a250C no escuro). Explantes são incubados em meios de seleção por até oito semanas, dependendo da natureza e característica de cada seleção utilizada. Após o período de seleção, o calo resultante é transferido para o meio de maturação de embrião, até a formação de embriões somáticos maduros ser observada. Os embriões somáticos maduros resultantes são então colocados sob baixa luminosidade, e o processo de regeneração é iniciado como conhecido na arte. Os ramos resultantes são possibilitados de enraizar sobre o meio de enraizamento, e as plantas resultantes são transferidas para os potes creche e propagadas como plantas transgênicas. Exemplo 21. Plantas transgênicas expressando AXMI-031 e variantes.
Os cassetes de expressão vegetal descritos aqui são combinados com um marcador vegetal selecionável adequado para auxiliar nas seleções de células e tecidos transformados, e ligados em vetores de transformação vegetal. Estes podem incluir vetores binários de transformação mediada por Agrobacterium ou vetores plasmidiais simples para aerossol ou transformação por biobalística, synaxmi-031 (apo) foi clonado em um vetor de expressão vegetal, e esse vetor foi introduzido em Agrobacterium tumefaciens tal como é conhecido na arte. A região de codificação synaxmi-031 (apo) sob controle do promotor Arabidopsis UBQ3 (Norris et al. (1993) J. Plant Mol. Biol. 21: 895-906) foi introduzida em Arabidopsis thaliana por métodos florais conhecidos na arte, e plantas transgênicas foram selecionadas. A presença de synaxmi-031 (apo) na população transgênica Tl foi confirmada por análise por PCR tal como é conhecido na arte, utilizando oligonucleotídeos derivados da seqüência de synaxmi-031, que também anelam para synaxmi-031 (apo).
Tecido foliar e raiz de synaxmi-031 (apo) transgênicos contendo plantas foram preparados e separados em gel de poliacrilamida por controles não-transgênicos e diluições de proteínas AXMI-031, e transferidos para uma membrana como conhecido na arte. As amostras foram testadas para a presença do produto da expressão de synaxmi-031 (apo) por análise de Western Blot como conhecido na arte, utilizando anticorpos anti-AXMI-031 descritos a seguir. 0 produto de expressão de synaxmi-031 (apo) de tamanho esperado foi detectado em amostras de ambos os tecidos das folhas e raízes para plantas contendo synaxmi-031 (apo) transgênicos, mas não foi detectado nos controles não- transgênicos.
Tabela 5. Detecção de anticorpos SYNAXMI-031 (APO) em plantas transgênicas
<table>table see original document page 81</column></row><table>
Exemplo 22. Formação de cisto reduzido por plantas expressando AXMI-031.
Plantas transgênicas expressando synaxmi-031 (apo) foram testadas para a capacidade de resistir a infestação de Heterodera schachtii, em comparação com plantas controle. Plantas transgênicas, bem como plantas controle transformadas com vetor sozinho, foram infestadas com aproximadamente 100 hatchlings J2, e o número de nematóides entrando nas raízes, bem como o número de cistos formados, foram medidos. Plantas transgênicas expressando SYNAXMI-031 (APO) foram encontradas para ter reduzido consistentemente o número de nematóides que entram nas raízes, e reduzido o número de cistos formados em relação aos controles.
Tabela 6. Formação de cisto reduzido em plantas expressando AXMI-031
Formação de cisto Planta controle ++ Plantas expressando AXMI-031 (APO) +
Exemplo 23. Ensaios adicionais para atividade pesticida
A capacidade de uma proteína pesticida para agir como um pesticida sobre uma praga é freqüentemente avaliada de várias maneiras. Uma forma bem conhecida na arte é realizar um ensaio de alimentação. Nesse ensaio de alimentação, um expõe as pragas de uma amostra contendo compostos para serem testados, ou amostras controle. Freqüentemente este é feito colocando o material a ser ensaiado, ou uma diluição adequada de tais materiais, em um material que irá ingerir as pragas, tais como uma dieta artificial. O material a ser testado pode ser composto por um líquido, sólido ou chorume. O material a ser testado pode ser colocado sobre a superfície e, em seguida, secado. Alternativamente, o material a ser testado pode ser misturado com uma dieta artificial liqüefeita e, em seguida, dispensado na câmara de ensaio. A câmara de ensaio pode ser, por exemplo, um copo, um prato, ou uma placa de microplacas.
Ensaios para pragas sugadoras (pulgões, por exemplo) podem envolver a separação do material de teste para o inseto por uma divisão, idealmente uma porção que pode ser fracionada pelas partes bucais sugadoras dos insetos sugadores, a fim de permitir a ingestão de material de ensaio. Muitas vezes o material teste é misturado com um estimulante alimentar, como a sacarose, para promover a ingestão do composto teste.
Outros tipos de ensaios podem incluir microinjeção do material teste na boca, ou intestino das pragas, bem como o desenvolvimento de plantas transgênicas, seguido pelo teste da capacidade das pragas para se alimentar a partir da planta transgênica. Testes vegetais podem envolver isolamento das partes das plantas normalmente consumidas, por exemplo, pequenas gaiolas anexadas a uma folha, ou isolamento de plantas inteiras em gaiolas contendo insetos.
Outros métodos e abordagens para a análise de pragas são conhecidos na arte, e podem ser encontrados, por exemplo, em Robertson, J. L.& Η. K. Preisler. 1992. Pesticide bioassays with arthropods. CRC, Boca Raton, FL. Alternativamente, ensaios são comumente descritos nas revistas "Arthropod Management Tests" e "Journal of Economic Entomology" ou pela discussão com os membros da Sociedade Entomológica da América (ESA).
Exemplo 24. Transformação de células de milho com genes pesticidas da invenção
Espigas de milho foram colhidas 8-12 dias após a polinização. Embriões foram isolados das espigas, e os embriões de tamanho 0,8-1,5 mm foram utilizadas para a transformação. Embriões foram plaqueados com o escutelo para cima sobre um meio de incubação adequado, tais como meio DN62A5S (3,98 g/L de Sais N6; 1 mL/L (IOOOx de solução estoque) Vitaminas N6; 800 mg/L de L-asparagina; 100 mg/L de Mio-inositol, 1,4 g/L de L-prolina, 100 mg/L de Casaminoácidos, 50 g/L de sucrose; 1 mL/L (de 1 mg/ml de solução estoque) 2,4-D), e incubados por toda a noite a25°C no escuro.
Os explantes resultantes são transferidos para uma malha quadrada (3 0-40 por placa) , transferidos para meios osmóticos por 30-45 minutos e, em seguida, transferidos para uma placa irradiante (ver, por exemplo, Publicação PCT e No. WO/ 0138514 e Patente US No. 5.240.842).
Construções de DNA destinados para expressar os genes da invenção em células vegetais são acelerados em tecido vegetal utilizando um acelerador de feixe de aerossol, utilizando condições essencialmente como descritas na Publicação PCT No. WO/0138514. Após o irradiamento, os embriões são incubados por 3 0 min em meio osmótico e, em seguida, colocados sobre meios de incubação por toda a noite, a 25°C no escuro. Para evitar danificar os explantes irradiados, eles são incubados por pelo menos 24 horas antes da transferência para o meio de recuperação. Os embriões são então espalhados em um meio para o período de recuperação, por 5 dias, a 250C, no escuro, e em seguida, transferidos para iam meio de seleção. Explantes são incubados em meios de seleção por até oito semanas, dependendo da natureza e característica de cada seleção utilizada. Após o período de seleção, o calo resultante é transferido para o meio de maturação de embrião, até a formação de embriões somáticos maduros ser observada. Os embriões somáticos maduros resultantes são então colocados sob baixa luminosidade, e o processo de regeneração é iniciado através de métodos conhecidos na arte. Os ramos resultantes são possibilitados de enraizar sobre o meio de enraizamento, e as plantas resultantes são transferidas para os potes creche e propagadas como plantas transgênicas.
Materiais
Meio DN62A5S
<table>table see original document page 85</column></row><table> Ajustar o pH da solução para pH 5,8 com IN de KOH/IN de KCl, adicionar Gelrite (Sigma) para 3g/L, e autoclavar. Após arrefecimento a 50°C, adicionar 2 ml/L a 5 mg/ml de solução de nitrato de prata (Phytotechnology Labs). A receita produz cerca de 20 placas.
Todas as publicações e pedidos de patentes mencionados na especificação são indicativos do nível de habilidade das pessoas qualificadas na arte à qual pertence esta invenção. Todas as publicações e pedidos de patentes são aqui incorporados por referência à mesma medida, como se cada publicação ou pedido de patente fosse especificamente e individualmente indicado a ser incorporado por referência.
Apesar de a invenção exposta ter sido descrita em algum detalhe a título de ilustração e de exemplo para fins de clareza de entendimento, será evidente que algumas modificações e alterações possam ser praticadas no âmbito das reivindicações anexadas. LISTAGEM DE SEQÜÊNCIAS
<110> Depositante: Athenix Corporation
Nadine Carozzi Nicholas Duck Theodore Kahn Nalini Desai Shruti Jain Daniel John Tomso Rong Guo Julia Thissen
<120> Título da Invenção: AXMI-031, AXMI-039, AXMI-040 E AXMI-049, UMA FAMÍLIA
DE NOVOS GENES DE DELTA-ENDOTOXINA E MÉTODOS PARA SEU USO
<130> Referência do documento: 45600/329694
<150> Número do Documento de Prioridade: 60/813.774
<151> Data de Depósito do Documento de Prioridade: 14-06-2006
<160> Quantidade de SEQ ID NOs.: 38
<170> Software: FastSEQ for Windows Version 4.0
<210> SEQ ID NO: 1 <211> Comprimento: 3 558 <212> Tipo: DNA
<213> Organismo: Bacillus cereus/Bacillus thuringiensis
<220> Características:
<221> Nome/Chave: CDS
<222> Localização: (1)...(3558)
<400> Seqüência: 1
atg gat tgt aat tta caa tca caa caa aat att cca tat aat gta tta 48 Met Asp Cys Asn Leu Gln Ser Gln Gln Asn IlePro Tyr Asn Val Leu .1 5 10 15
gca ata cca gta tct aat gtt aat tcg ttg act gat aca gtt gga gat 96 Ala Ile Pro Val Ser Asn Val Asn Ser Leu Thr Asp Thr Val Gly Asp 20 25 30
tta aaa aaa gca tgg gaa gaa ttt caa aaa act ggt tct ttt tca tta 144 Leu Lys Lys Ala Trp Glu Glu Phe Gln Lys Thr Gly Ser Phe Ser Leu 35 40 45
aca gct tta caa caa gga ttt tct gct tca caa gga gga aca ttc aat 192 Thr Ala Leu Gln Gln Gly Phe Ser Ala Ser Gln Gly Gly Thr Phe Asn 50 55 60
tat tta aca tta cta caa tca gga ata tca tta gct ggt tct ttt gtt 240 Tyr Leu Thr Leu Leu Gln Ser Gly Ile Ser Leu Ala Gly Ser Phe Val .65 70 75 80 cct gga ggt act ttt gta gca cct att att aat atg gtt att ggt tgg 288 Pro Gly Gly Thr Phe Val Ala Pro Ile Ile Asn Met Val Ile Gly Trp 85 90 95
tta tgg cca cat aaa aac aaa aat gcg gat aca gaa aat tta ata aat Leu Trp Pro His Lys Asn Lys Asn Ala Asp Thr Glu Asn Leu Ile Asn 100 105 HO
tta att gat tca gaa att caa aaa caa tta aac aaa gct tta tta gat Leu Ile Asp Ser Glu Ile Gln Lys Gln Leu Asn Lys Ala Leu Leu Asp 115 120 125
gca gat aga aat gag tgg age tet tat tta gaa tet ata ttt gat tet Ala Asp Arg Asn Glu Trp Ser Ser Tyr Leu Glu Ser Ile Phe Asp Ser 130 135 140
tca aat aac cta aat ggt gca att gta gat gca cag tgg tca ggc act Ser Asn Asn Leu Asn Gly Ala Ile Val Asp Ala Gln Trp Ser Gly Thr 145 150 155 160
gta aat act aca aat aga aca cta aga aat cca aca gaa tca gat tat Val Asn Thr Thr Asn Arg Thr Leu Arg Asn Pro Thr Glu Ser Asp Tyr 165 170 175
aca aat gtt gtt aca aat ttt att gca gcg gat ggt gac att gca aat 576 Thr Asn Val Val Thr Asn Phe Ile Ala Ala Asp Gly Asp Ile Ala Asn 180 185 190
aat gaa aat cac ata atg aat ggc aac ttt gac gta gct gca gca cct Asn Glu Asn His Ile Met Asn Gly Asn Phe Asp Val Ala Ala Ala Pro 195 200 205
tat ttt gtt ata gga gca aca gca cgt ttt gca gca atg caa tet tat Tyr Phe Val Ile Gly Ala Thr Ala Arg Phe Ala Ala Met Gln Ser Tyr 210 215 220
att aaa ttt tgt aat gct tgg att gat aaa gtt gga ttg agt gac gca Ile Lys Phe Cys Asn Ala Trp Ile Asp Lys Val Gly Leu Ser Asp Ala 225 230 235 240
cag ctt act aca caa aag gct aat tta gat cgc acg aaa caa aat atg Gln Leu Thr Thr Gln Lys Ala Asn Leu Asp Arg Thr Lys Gln Asn Met 245 250 255
336
384
432
480
528
624
672
720
768
cgt aat gca att ctt aac tat aca caa caa gtt atg aaa gtt ttt aaa 816 Arg Asn Ala Ile Leu Asn Tyr Thr Gln Gln Val Met Lys Val Phe Lys 260 265 270
gat tcc aaa aat atg cct aca ata ggt act aat aaa ttt agt gtt gat Asp Ser Lys Asn Met Pro Thr Ile Gly Thr Asn Lys Phe Ser Val Asp 275 280 285
acc tat aat gta tat att aaa gga atg aca tta aat gtt tta gat att Thr Tyr Asn Val Tyr Ile Lys Gly Met Thr Leu Asn Val Leu Asp Ile 290 295 300
864
912 gta gca Val Ala 305
gcc tta Ala Leu
gaa ggt Glu Gly
agt tat Ser Tyr
tat tat Tyr Tyr 370
cct aaa Pro Lys 385
tat gca Tyr Ala
c ta gga Leu Gly
gca act Ala Thr
gga gca Gly Ala 450
cca cct Pro Pro 465
aat cct Asn Pro
caa gct Gln Ala
ctt gtt Leu Val
ata tgg Ile Trp
gaa caa Glu Gln
aca gat Thr Asp 340
caa cat Gln His 355
aat gat Asn Asp
aaa gga Lys Gly
aac agt Asn Ser
gga tta Gly Leu 420
caa aac Gln Asn 435
tcc tta Ser Leu
ttt agt Phe Ser
tca gat Ser Asp
aat gta Asn Val 500
tca tat Ser Tyr 515
cct tca Pro Ser 310
aca cgt Thr Arg 325
gga age Gly Ser
agt cca Ser Pro
gaa tta Glu Leu
agt gga Ser Gly 390
aaa tat Lys Tyr 405
tet aca Ser Thr
agt aaa Ser Lys
cct ggt Pro Gly
tgt act Cys Thr 470
aca aat Thr Asn 485
aag gga Lys Gly
gat tta Asp Leu
tta tat Leu Tyr
gtc act Val Thr
cta aga Leu Arg
ata cct Ile Pro 360
caa aat Gln Asn 375
tac tet Tyr Ser
aaa tat Lys Tyr
cta tet Leu Ser
tat cta Tyr Leu 440
tat tgt Tyr Cys 455
tet acc Ser Thr
caa aaa Gln Lys
aac aca Asn Thr
aat cct Asn Pro 520
cca gat Pro Asp
ttt tca Phe Ser 330
att tac Ile Tyr 345
aat aat Asn Asn
cta gaa Leu Glu
tat cct Tyr Pro
ggt gat Gly Asp 410
gca cct Ala Pro 425
gat gga Asp Gly
act aca Thr Thr
gct aat Ala Asn
att aac Ile Asn 490
gga aaa Gly Lys 505
aaa aat Lys Asn
gat tat Asp Tyr 315
aat atg Asn Met
aat act Asn Thr
aat gtt Asn Val
tta gga Leu Gly 380
tat gga Tyr Gly 395
age aat Ser Asn
ata caa Ile Gln
gaa ate Glu Ile
gga tgt Gly Cys 460
ggc tat Gly Tyr 475
gct tta Ala Leu
tta gga Leu Gly
gta ttt Val Phe
act tca Thr Ser
gtt ggc Val Gly
ttt gat Phe Asp 350
aat tta Asn Leu 365
gta tat Val Tyr
ttt gtt Phe Val
gat cca Asp Pro
caa gtt Gln Val 430
cta aat Leu Asn 445
tca cca Ser Pro
aaa gca Lys Ala
tat cct Tyr Pro
gta ctg Val Leu 510
ggt gaa Gly Glu 525
caa aca Gln Thr 320
caa gaa Gln Glu 335
tet ttt Ser Phe
att tet Ile Ser
acc cct Thr Pro
tta aat Leu Asn 400
gaa tet Glu Ser 415
aat gca Asn Ala
gga ata Gly Ile
aca gaa Thr Glu
age tgt Ser Cys 480
ttt aca Phe Thr 495
gca agt Ala Ser
tta gat Leu Asp
960
1008
1056
1104
1152
1200
1248
1296
1344
1392
1440
1488
1536
1584 tca gat aca aat aat gtt atc tta aaa gga att cct gca gaa aaa gga 1632 Ser Asp Thr Asn Asn Val Ile Leu Lys Gly Ile Pro Ala Glu Lys Gly 530 535 540
tat ttt cct aat aat gcg cgt cct act gtt gta aaa gaa tgg att aat 1680 Tyr Phe Pro Asn Asn Ala Arg Pro Thr Val Val Lys Glu Trp Ile Asn 545 550 555 560
ggt gca agt gct gta cca ctt gat tca gga aat acc tta ttt atg acg 1728 Gly Ala Ser Ala Val Pro Leu Asp Ser Gly Asn Thr Leu Phe Met Thr 565 570 575
gat att aca tta caa att aca gga gga gat caa aaa ata ttt att gat 2016 Asp Ile Thr Leu Gln Ile Thr Gly Gly Asp Gln Lys Ile Phe Ile Asp 660 665 670
cga ata gaa ttt gtt cct act atg cct gta cct ggt aat act aac aac 2064 Arg Ile Glu Phe Val Pro Thr Met Pro Val Pro Gly Asn Thr Asn Asn 675 680 685
gct acg aat tta aca gct act caa tat aga att aga ata cgt tat gca 1776 Ala Thr Asn Leu Thr Ala Thr Gln Tyr Arg Ile Arg Ile Arg Tyr Ala 580 585 590
aat cca aat tca aat act caa atc ggt gta cga att aca caa aat ggt 1824 Asn Pro Asn Ser Asn Thr Gln Ile Gly Val Arg Ile Thr Gln Asn Gly 595 600 605
tct cta att tcc agt agt aat cta aca ctt tat agt act act gat atg 1872 Ser Leu Ile Ser Ser Ser Asn Leu Thr Leu Tyr Ser Thr Thr Asp Met 610 615 620
aat aat act tta cca cta aat gta tat gta ata gga gaa aat gga aat 1920 Asn Asn Thr Leu Pro Leu Asn Val Tyr Val Ile Gly Glu Asn Gly Asn 625 630 635 640
tat aca ctt caa gat tta tat aat act act aat gtt tta tca aca gga 1968 Tyr Thr Leu Gln Asp Leu Tyr Asn Thr Thr Asn Val Leu Ser Thr Gly 645 650 655
aat aac ggt aat aat aac ggt aat aat aat ccc cca cac cac gtt tgt 2112 Asn Asn Gly Asn Asn Asn Gly Asn Asn Asn Pro Pro His His Val Cys 690 695 700
gca ata gct ggt aca caa caa tct tgt tct gga ccg ccc aaa ttt gaa 2160 Ala Ile Ala Gly Thr Gln Gln Ser Cys Ser Gly Pro Pro Lys Phe Glu 705 710 715 720
caa gta agt gat tta gaa aaa att aca aca caa gta tat atg tta ttc 2208 Gln Val Ser Asp Leu Glu Lys Ile Thr Thr Gln Val Tyr Met Leu Phe 725 730 735
aaa tct tet ccg tat gaa gaa tta gct cta gaa gtt tcc agc tat caa 2256 Lys Ser Ser Pro Tyr Glu Glu Leu Ala Leu Glu Val Ser Ser Tyr Gln 740 745 750 att agt caa gta gca tta aaa gtt atg gca tta tct gat gaa cta ttt 2304 Ile Ser Gln Val Ala Leu Lys Val Met Ala Leu Ser Asp Glu Leu Phe 755 760 765
tgt gaa gaa aaa aac gta tta cga aaa tta gtc aat aaa gca aaa caa 23 52 Cys Glu Glu Lys Asn Val Leu Arg Lys Leu Val Asn Lys Ala Lys Gln 770 775 780
tta tta gaa gca agt aac tta cta gta ggt gga aat ttt gaa aca act 2400 Leu Leu Glu Ala Ser Asn Leu Leu Val Gly Gly Asn Phe Glu Thr Thr 785 790 795 800
caa aat tgg gta ctt gga aca aat gct tat ata aat tat gat tcg ttt 2448 Gln Asn Trp Val Leu Gly Thr Asn Ala Tyr Ile Asn Tyr Asp Ser Phe 805 810 815
tta ttt aat gga aat tat tta tct tta caa cca gca agt gga ttt ttc 2496 Leu Phe Asn Gly Asn Tyr Leu Ser Leu Gln Pro Ala Ser Gly Phe Phe 820 825 830
aca tct tat gct tat caa aaa ata gat gag tca aca tta aaa cca tat 2544 Thr Ser Tyr Ala Tyr Gln Lys Ile Asp Glu Ser Thr Leu Lys Pro Tyr 835 840 845
aca cga tat aaa gtt tct ggg ttc att ggg caa agt aat caa gta gaa 2 592 Thr Arg Tyr Lys Val Ser Gly Phe Ile Gly Gln Ser Asn Gln Val Glu 850 855 860
ctt att att tct cgt tat gga aaa gaa att gat aaa ata tta aat gtt 2640 Leu Ile Ile Ser Arg Tyr Gly Lys Glu Ile Asp Lys Ile Leu Asn Val 865 870 875 880
cca tat gca gga cct ctt cct ate act gct gat gca tca ata act tgt 2688 Pro Tyr Ala Gly Pro Leu Pro Ile Thr Ala Asp Ala Ser Ile Thr Cys 885 890 895
tgt gca cca gaa ata ggc caa tgt gat ggg gaa caa tct gat tct cat 2736 Cys Ala Pro Glu Ile Gly Gln Cys Asp Gly Glu Gln Ser Asp Ser His 900 905 910
ttc ttt aac tat age ate gat gta ggt gca ctt cac cca gaa tta aac 2784 Phe Phe Asn Tyr Ser Ile Asp Val Gly Ala Leu His Pro Glu Leu Asn 915 920 925
cct ggc att gaa att ggt ctt aaa att gtg caa tca aat ggt tat ata 2832 Pro Gly Ile Glu Ile Gly Leu Lys Ile Val Gln Ser Asn Gly Tyr Ile 930 935 940
aca att agt aat cta gaa att att gaa gaa cgt cca ctt aca gaa atg 2880 Thr Ile Ser Asn Leu Glu Ile Ile Glu Glu Arg Pro Leu Thr Glu Met 945 950 955 960
gaa att caa gca gtc aat cga aaa aat caa aaa tgg gaa aga gaa aaa 2 928 Glu Ile Gln Ala Val Asn Arg Lys Asn Gln Lys Trp Glu Arg Glu Lys 965 970 975 ctt cta gaa tgt gca agt att agt gaa ctt tta caa cca att att aat Leu Leu Glu Cys Ala Ser Ile Ser Glu Leu Leu Gln Pro Ile Ile Asn 980 985 990
caa ate gat tca ttg ttt aaa gat gga aac tgg tat aat gat att ctt Gln Ile Asp Ser Leu Phe Lys Asp Gly Asn Trp Tyr Asn Asp Ile Leu 995 1000 1005
cct cat gtc aca tat caa gat tta aaa aat att ata ata ccc gag tta Pro His Val Thr Tyr Gln Asp Leu Lys Asn Ile Ile Ile Pro Glu Leu 1010 1015 1020
cca aaa tta aaa cat tgg ttc ata gag aat ctc cca ggt gaa tat cat Pro Lys Leu Lys His Trp Phe Ile Glu Asn Leu Pro Gly Glu Tyr His 1025 1030 1035 1040
gaa att gaa caa aaa atg aaa gaa gct cta aaa tat gca ttt aca caa Glu Ile Glu Gln Lys Met Lys Glu Ala Leu Lys Tyr Ala Phe Thr Gln 1045 1050 1055
tta gac gag aaa aat tta ate cac aat ggt cac ttt aca act aac tta Leu Asp Glu Lys Asn Leu Ile His Asn Gly His Phe Thr Thr Asn Leu 1060 1065 1070
2976
3024
3072
3120
3168
3216
ata gat tgg caa gta gaa ggt gat gct caa atg aaa gta tta gaa aat Ile Asp Trp Gln Val Glu Gly Asp Ala Gln Met Lys Val Leu Glu Asn 1075 1080 1085
gat gct ctt gca tta caa ctt ttc aac tgg gat gct agt gct tca caa Asp Ala Leu Ala Leu Gln Leu Phe Asn Trp Asp Ala Ser Ala Ser Gln 1090 1095 1100
3264
3312
tet ata aat ata tta gaa ttt gat gaa gat aag gca tat aaa ctt cgc 3360 Ser Ile Asn Ile Leu Glu Phe Asp Glu Asp Lys Ala Tyr Lys Leu Arg 1105 1110 1115 1120
gta tat gct caa gga age gga aca ate caa ttt gga aac tgt gaa gat 3408 Val Tyr Ala Gln Gly Ser Gly Thr Ile Gln Phe Gly Asn Cys Glu Asp 1125 1130 1135
gaa gct ate caa ttt aat aca aac tca ttc ata tat caa gaa aaa ata Glu Ala Ile Gln Phe Asn Thr Asn Ser Phe Ile Tyr Gln Glu Lys Ile 1140 1145 1150
gtc tat ttc gat acc cca tca gtt aat tta cac ata caa tca gaa ggt Val Tyr Phe Asp Thr Pro Ser Val Asn Leu His Ile Gln Ser Glu Gly 1155 1160 1165
tet gaa ttt att gta agt agt ate gat cta att gaa tta tca gac gac Ser Glu Phe Ile Val Ser Ser Ile Asp Leu Ile Glu Leu Ser Asp Asp 1170 1175 1180
caa taa Gln * 1185
3456
3504
3552
3558 <210> SEQ ID NO: 2 <211> Comprimento: 1185 <212> Tipo: PRT
<213> Organismo: Bacillus cereus/Bacillus thuringiensis <400> Seqüência: 2
Met Asp Cys Asn Leu Gln Ser Gln Gln Asn Ile Pro Tyr Asn Val Leu
1 5 10 15
Ala Ile Pro Val Ser Asn Val Asn Ser Leu Thr Asp Thr Val Gly Asp
20 25 30
Leu Lys Lys Ala Trp Glu Glu Phe Gln Lys Thr Gly Ser Phe Ser Leu
35 40 45
Thr Ala Leu Gln Gln Gly Phe Ser Ala Ser Gln Gly Gly Thr Phe Asn
50 55 60
Tyr Leu Thr Leu Leu Gln Ser Gly Ile Ser Leu Ala Gly Ser Phe Val 65 70 75 80
Pro Gly Gly Thr Phe Val Ala Pro Ile Ile Asn Met Val Ile Gly Trp
85 90 95
Leu Trp Pro His Lys Asn Lys Asn Ala Asp Thr Glu Asn Leu Ile Asn
100 105 HO
Leu Ile Asp Ser Glu Ile Gln Lys Gln Leu Asn Lys Ala Leu Leu Asp
115 120 125
Ala Asp Arg Asn Glu Trp Ser Ser Tyr Leu Glu Ser Ile Phe Asp Ser
130 135 140
Ser Asn Asn Leu Asn Gly Ala Ile Val Asp Ala Gln Trp Ser Gly Thr 145 150 155 160
Val Asn Thr Thr Asn Arg Thr Leu Arg Asn Pro Thr Glu Ser Asp Tyr
165 170 175
Thr Asn Val Val Thr Asn Phe Ile Ala Ala Asp Gly Asp Ile Ala Asn
180 185 190
Asn Glu Asn His Ile Met Asn Gly Asn Phe Asp Val Ala Ala Ala Pro
195 200 205
Tyr Phe Val Ile Gly Ala Thr Ala Arg Phe Ala Ala Met Gln Ser Tyr
210 215 220
Ile Lys Phe Cys Asn Ala Trp Ile Asp Lys Val Gly Leu Ser Asp Ala 225 230 235 240
Gln Leu Thr Thr Gln Lys Ala Asn Leu Asp Arg Thr Lys Gln Asn Met
245 250 255
Arg Asn Ala Ile Leu Asn Tyr Thr Gln Gln Val Met Lys Val Phe Lys
260 265 270
Asp Ser Lys Asn Met Pro Thr Ile Gly Thr Asn Lys Phe Ser Val Asp
275 280 285
Thr Tyr Asn Val Tyr Ile Lys Gly Met Thr Leu Asn Val Leu Asp Ile
290 295 300
Val Ala Ile Trp Pro Ser Leu Tyr Pro Asp Asp Tyr Thr Ser Gln Thr 305 310 315 320
Ala Leu Glu Gln Thr Arg Val Thr Phe Ser Asn Met Val Gly Gln Glu
325 330 335
Glu Gly Thr Asp Gly Ser Leu Arg Ile Tyr Asn Thr Phe Asp Ser Phe
340 345 350
Ser Tyr Gln His Ser Pro Ile Pro Asn Asn Asn Val Asn Leu Ile Ser
355 360 365
Tyr Tyr Asn Asp Glu Leu Gln Asn Leu Glu Leu Gly Val Tyr Thr Pro
370 375 380
Pro Lys Lys Gly Ser Gly Tyr Ser Tyr Pro Tyr Gly Phe Val Leu Asn 385 390 395 400 Tyr Ala Asn Ser Lys Tyr Lys Tyr Gly Asp Ser Asn Asp Pro Glu Ser
405 410 415
Leu Gly Gly Leu Ser Thr Leu Ser Ala Pro Ile Gln Gln Val Asn Ala
420 425 430
Ala Thr Gln Asn Ser Lys Tyr Leu Asp Gly Glu Ile Leu Asn Gly Ile
435 440 445
Gly Ala Ser Leu Pro Gly Tyr Cys Thr Thr Gly Cys Ser Pro Thr Glu
450 455 460
Pro Pro Phe Ser Cys Thr Ser Thr Ala Asn Gly Tyr Lys Ala Ser Cys 465 470 475 480
Asn Pro Ser Asp Thr Asn Gln Lys Ile Asn Ala Leu Tyr Pro Phe Thr
485 490 495
Gln Ala Asn Val Lys Gly Asn Thr Gly Lys Leu Gly Val Leu Ala Ser
500 505 510
Leu Val Ser Tyr Asp Leu Asn Pro Lys Asn Val Phe Gly Glu Leu Asp
515 520 525
Ser Asp Thr Asn Asn Val Ile Leu Lys Gly Ile Pro Ala Glu Lys Gly
530 535 540
Tyr Phe Pro Asn Asn Ala Arg Pro Thr Val Val Lys Glu Trp Ile Asn 545 550 555 560
Gly Ala Ser Ala Val Pro Leu Asp Ser Gly Asn Thr Leu Phe Met Thr
565 570 575
Ala Thr Asn Leu Thr Ala Thr Gln Tyr Arg Ile Arg Ile Arg Tyr Ala
580 585 590
Asn Pro Asn Ser Asn Thr Gln Ile Gly Val Arg Ile Thr Gln Asn Gly
595 600 605
Ser Leu Ile Ser Ser Ser Asn Leu Thr Leu Tyr Ser Thr Thr Asp Met
610 615 620
Asn Asn Thr Leu Pro Leu Asn Val Tyr Val Ile Gly Glu Asn Gly Asn 625 630 635 640
Tyr Thr Leu Gln Asp Leu Tyr Asn Thr Thr Asn Val Leu Ser Thr Gly
645 650 655
Asp Ile Thr Leu Gln Ile Thr Gly Gly Asp Gln Lys Ile Phe Ile Asp
660 665 670
Arg Ile Glu Phe Val Pro Thr Met Pro Val Pro Gly Asn Thr Asn Asn
675 680 685
Asn Asn Gly Asn Asn Asn Gly Asn Asn Asn Pro Pro His His Val Cys
690 695 700
Ala Ile Ala Gly Thr Gln Gln Ser Cys Ser Gly Pro Pro Lys Phe Glu 705 710 715 720
Gln Val Ser Asp Leu Glu Lys Ile Thr Thr Gln Val Tyr Met Leu Phe
725 730 735
Lys Ser Ser Pro Tyr Glu Glu Leu Ala Leu Glu Val Ser Ser Tyr Gln
740 745 750
Ile Ser Gln Val Ala Leu Lys Val Met Ala Leu Ser Asp Glu Leu Phe
755 760 765
Cys Glu Glu Lys Asn Val Leu Arg Lys Leu Val Asn Lys Ala Lys Gln
770 775 780
Leu Leu Glu Ala Ser Asn Leu Leu Val Gly Gly Asn Phe Glu Thr Thr 785 790 795 800
Gln Asn Trp Val Leu Gly Thr Asn Ala Tyr Ile Asn Tyr Asp Ser Phe
805 810 815
Leu Phe Asn Gly Asn Tyr Leu Ser Leu Gln Pro Ala Ser Gly Phe Phe
820 825 830
Thr Ser Tyr Ala Tyr Gln Lys Ile Asp Glu Ser Thr Leu Lys Pro Tyr 835 840 845 <formula>formula see original document page 95</formula> <400> Seqüência: 3
atg gca aca ctt aat aat atg ttt tca gtt cct tat aat gta cta gct
Met Ala Thr Leu Asn Asn Met Phe Ser Val Pro Tyr Asn Val Leu Ala 1 5 10 15
48
cta ccc att ate ccc aat tet ate tta act ttt gaa gat aat cga aaa 96 Leu Pro Ile Ile Pro Asn Ser Ile Leu Thr Phe Glu Asp Asn Arg Lys 20 25 30
aaa ata gaa gag ggt att aaa gag ttt gaa aag act gga cgt ata aaa Lys Ile Glu Glu Gly Ile Lys Glu Phe Glu Lys Thr Gly Arg Ile Lys 35 40 45
144
ccc ctt aaa gat tta ata gag ctc ata ttc aaa ggg tat agt gac gat 192 Pro Leu Lys Asp Leu Ile Glu Leu Ile Phe Lys Gly Tyr Ser Asp Asp 50 55 60
gaa tet tet tac gca gca tta gtt caa act atg ctt gtc gtt att ccc 240 Glu Ser Ser Tyr Ala Ala Leu Val Gln Thr Met Leu Val Val Ile Pro 65 70 75 80
ttg gcg ttc cct gaa tta gcc cca gtt ctt cca att att ggc gta gta 288 Leu Ala Phe Pro Glu Leu Ala Pro Val Leu Pro Ile Ile Gly Val Val 85 90 95
att aat ttc gtt ttt cca ggt ttg aag ggt tet gct aaa tca acc tat 336 Ile Asn Phe Val Phe Pro Gly Leu Lys Gly Ser Ala Lys Ser Thr Tyr 100 105 110
aca atg att aca gag atg gtt gat aaa gcc att aac caa tca ttc acg 384 Thr Met Ile Thr Glu Met Val Asp Lys Ala Ile Asn Gln Ser Phe Thr 115 120 125
gcc cag att aca aat ata tta aca aac aat att act ggt ata caa aat 432 Ala Gln Ile Thr Asn Ile Leu Thr Asn Asn Ile Thr Gly Ile Gln Asn 130 135 140
aat ata caa tet gtt tac gac gca atg age aat gcc att gga aca aat 480 Asn Ile Gln Ser Val Tyr Asp Ala Met Ser Asn Ala Ile Gly Thr Asn 145 150 155 160
gac aca att cat aat ttc ate aga aat aat gat aca aca cct tgc tet 52 8 Asp Thr Ile His Asn Phe Ile Arg Asn Asn Asp Thr Thr Pro Cys Ser 165 170 175
caa aac aat cag cca gct tgt cct tgt cct cca aat aat caa tgt tta 576 Gln Asn Asn Gln Pro Ala Cys Pro Cys Pro Pro Asn Asn Gln Cys Leu 180 185 190
caa aaa gtt gtt gat gaa tat act aaa gca ata gct aat ate gat ctc 624 Gln Lys Val Val Asp Glu Tyr Thr Lys Ala Ile Ala Asn Ile Asp Leu 195 200 205
att ate cct caa ttt cat gat cca ctt act ggt gta att tcc gat tta 672 Ile Ile Pro Gln Phe His Asp Pro Leu Thr Gly Val Ile Ser Asp Leu 210 215 220 gct act gca aac atg tat att tta cct tta tac gct caa act gtt aat Ala Thr Ala Asn Met Tyr Ile Leu Pro Leu Tyr Ala Gln Thr Val Asn 225 230 235 240
tta aaa tta att ttg cgt cag agt ttc att gaa ttt atg gag aaa tat Leu Lys Leu Ile Leu Arg Gln Ser Phe Ile Glu Phe Met Glu Lys Tyr 245 250 255
aaa tat gat gaa aaa gaa act gtt ttt cag gct ttt att aat gct gat Lys Tyr Asp Glu Lys Glu Thr Val Phe Gln Ala Phe Ile Asn Ala Asp 260 265 270
att cca gaa caa att aaa aaa ctt cgt caa gat att ate acg tat aca Ile Pro Glu Gln Ile Lys Lys Leu Arg Gln Asp Ile Ile Thr Tyr Thr 275 280 285
aaa gat att tat atg caa ttt gaa gct cac gct ccc tac ccg act tat Lys Asp Ile Tyr Met Gln Phe Glu Ala His Ala Pro Tyr Pro Thr Tyr 290 295 300
aat tca aaa aaa caa cta aat gac tat ate cgt tat aca aga att ate Asn Ser Lys Lys Gln Leu Asn Asp Tyr Ile Arg Tyr Thr Arg Ile Ile 305 310 315 320
caa gta tat tgt ttg gat tta gta gca atg tgg cct acg ctt gat cga Gln Val Tyr Cys Leu Asp Leu Val Ala Met Trp Pro Thr Leu Asp Arg 325 330 335
gtg aat tat gca tta cct gtc caa caa aat atg aca cgc att ata ttt Val Asn Tyr Ala Leu Pro Val Gln Gln Asn Met Thr Arg Ile Ile Phe 340 345 350
gga gat ctt att ggc cct gta gaa act gtg cct cag gtt ccc cgc caa Gly Asp Leu Ile Gly Pro Val Glu Thr Val Pro Gln Val Pro Arg Gln 355 360 365
aat tca gat aac ttt cat ttt aat ttg tet gat gtt tat aga aac ccc Asn Ser Asp Asn Phe His Phe Asn Leu Ser Asp Val Tyr Arg Asn Pro 370 375 380
tta cct aat aat gat att ttt aat tac cgt tat ggc ggg ctt caa att Leu Pro Asn Asn Asp Ile Phe Asn Tyr Arg Tyr Gly Gly Leu Gln Ile 385 390 395 400
tet aaa gcg caa ttt atg aca tat tat aaa aaa ttc gga gct ttc agt Ser Lys Ala Gln Phe Met Thr Tyr Tyr Lys Lys Phe Gly Ala Phe Ser 405 410 415
acc cat gat gaa tat tat tat gta gat ggg cat cgc cta agt ttt aat Thr His Asp Glu Tyr Tyr Tyr Val Asp Gly His Arg Leu Ser Phe Asn 420 425 430
act tca gat aaa aaa aca att gaa ate aat gct cat caa aat tet cat Thr Ser Asp Lys Lys Thr Ile Glu Ile Asn Ala His Gln Asn Ser His 435 440 445
720
768
816
864
912
960
1008
1056
1104
1152
1200
1248
1296
1344 <formula>formula see original document page 98</formula> caa ggt aat tat ata gta ttt cca cag cca aac att gat act gtc aca 2064 Gln Gly Asn Tyr Ile Val Phe Pro Gln Pro Asn Ile Asp Thr Val Thr 675 680 685
ggc acc agt tta cct cct acc gaa aac att atg aat ttt cca gta gga Gly Thr Ser Leu Pro Pro Thr Glu Asn Ile Met Asn Phe Pro Val Gly 690 695 700
aca ttt gat ttt acc att gta aat tct gga aac tca gat act att tta Thr Phe Asp Phe Thr Ile Val Asn Ser Gly Asn Ser Asp Thr Ile Leu 705 710 715 720
gat cga att gaa ttt gtt cct att gta act tct aat aaa att caa caa Asp Arg Ile Glu Phe Val Pro Ile Val Thr Ser Asn Lys Ile Gln Gln 725 730 735
gat ttc act att tct cct gga aca agt caa gta att tgg acc gga aat Asp Phe Thr Ile Ser Pro Gly Thr Ser Gln Val Ile Trp Thr Gly Asn 740 745 750
tca gct aac act ata gat att aca att att gac aac gta gat aca age Ser Ala Asn Thr Ile Asp Ile Thr Ile Ile Asp Asn Val Asp Thr Ser 755 760 765
ggt tta ttc gtt caa att ttc caa aaa ggt aag caa ctg cat gga gaa 23 52 Gly Leu Phe Val Gln Ile Phe Gln Lys Gly Lys Gln Leu His Gly Glu 770 775 780
2112
2160
2208
2256
2304
cta act ttg att gat ccc gct cat att caa cgt aca ttc tct gaa aaa Leu Thr Leu Ile Asp Pro Ala His Ile Gln Arg Thr Phe Ser Glu Lys 785 790 795 800
ttt gat caa att gtt ttg tat aac cca ggt tat aat agt tct ata tct Phe Asp Gln Ile Val Leu Tyr Asn Pro Gly Tyr Asn Ser Ser Ile Ser 805 810 815
ggt aca gtg agt ggt tca gta age tct att cct aag aaa ttc gaa tta Gly Thr Val Ser Gly Ser Val Ser Ser Ile Pro Lys Lys Phe Glu Leu 820 825 830
tct age gac tta caa aat ate aca aac caa gtt aat aac tta ttt gea Ser Ser Asp Leu Gln Asn Ile Thr Asn Gln Val Asn Asn Leu Phe Ala 835 840 845
tcg age gaa cat gat aca ctt gcc aca gat gta agt gat tat gat att Ser Ser Glu His Asp Thr Leu Ala Thr Asp Val Ser Asp Tyr Asp Ile 850 855 860
gaa gaa gtg att cta aaa gta gat gea tta tct gat gaa gtg ttt gga Glu Glu Val Ile Leu Lys Val Asp Ala Leu Ser Asp Glu Val Phe Gly 865 870 875 880
aaa gag aaa aaa gea cta cgt aaa ttg gta aat caa gcg aag cgt tta Lys Glu Lys Lys Ala Leu Arg Lys Leu Val Asn Gln Ala Lys Arg Leu 885 890 895
2400
2448
2496
2544
2592
2640
2688 agt aaa gcg cgt aat ctt ctc cta gga gga agt ttt gat aat ttg gat 2736 Ser Lys Ala Arg Asn Leu Leu Leu Gly Gly Ser Phe Asp Asn Leu Asp 900 905 910
gct tgg tat agg gga cga aat gta gta act gta tct gat cat gaa ctg Ala Trp Tyr Arg Gly Arg Asn Val Val Thr Val Ser Asp His Glu Leu 915 920 925
ttt aaa agt gat cat ata tta tta cca cta cca aca aca ttg tat cca Phe Lys Ser Asp His Ile Leu Leu Pro Leu Pro Thr Thr Leu Tyr Pro 930 935 940
aag gtg caa cgt gct gct aga gat tgg aaa caa aag tat gat caa gag Lys Val Gln Arg Ala Ala Arg Asp Trp Lys Gln Lys Tyr Asp Gln Glu 1075 1080 1085
2784
2832
tct tat ctt ttc caa aaa gta gag gaa tct aaa tta aaa gca aat aca 2880 Ser Tyr Leu Phe Gln Lys Val Glu Glu Ser Lys Leu Lys Ala Asn Thr 945 950 955 960
cgt tat act gtc tct ggt ttc ate gcg cat gca gag gat tta gaa att Arg Tyr Thr Val Ser Gly Phe Ile Ala His Ala Glu Asp Leu Glu Ile 965 970 975
gtt gtt tct cgt tat ggg caa gaa ata aag aaa gtg gtg caa gtt cca Val Val Ser Arg Tyr Gly Gln Glu Ile Lys Lys Val Val Gln Val Pro 980 985 990
tat ggt gaa gca ttc cca ttg aca tcg age gga cca att tgt tgt aga Tyr Gly Glu Ala Phe Pro Leu Thr Ser Ser Gly Pro Ile Cys Cys Arg 995 1000 1005
cca cgt tct aga gta aat ggt aaa cct gct gat cca cat ttc ttt agt Pro Arg Ser Arg Val Asn Gly Lys Pro Ala Asp Pro His Phe Phe Ser 1010 1015 1020
tac age att gat gta ggt gca tta gat gtg gaa gca aat cct ggt att Tyr Ser Ile Asp Val Gly Ala Leu Asp Val Glu Ala Asn Pro Gly Ile 1025 1030 1035 1040
gaa tta ggg ttt cgt att gta gag cca act gga atg gca cgt gta agt Glu Leu Gly Phe Arg Ile Val Glu Pro Thr Gly Met Ala Arg Val Ser 1045 1050 1055
2928
2976
3024
3072
3120
3168
aac tta gaa att cgt gag gat cgc cca tta acg gca aat gaa ata cgt 3216 Asn Leu Glu Ile Arg Glu Asp Arg Pro Leu Thr Ala Asn Glu Ile Arg 1060 1065 1070
3264
cgt gcg gaa gta aga gcc ctg att caa cct gtt tta aat caa ate aat 3312 Arg Ala Glu Val Arg Ala Leu Ile Gln Pro Val Leu Asn Gln Ile Asn 1090 1095 1100
gcg ttg tat gaa aat gaa gat tgg aat gga gca att cgt tct gga gtt Ala Leu Tyr Glu Asn Glu Asp Trp Asn Gly Ala Ile Arg Ser Gly Val 1105 1110 1115 1120
3360 tct tat cat gac tta gaa gca att gtt tta cca aca tta cca aaa tta Ser Tyr His Asp Leu Glu Ala Ile Val Leu Pro Thr Leu Pro Lys Leu 1125 1130 1135
gct caa ttc caa gaa gca tta aat cgt gcg tat acg caa ctc gaa gga Ala Gln Phe Gln Glu Ala Leu Asn Arg Ala Tyr Thr Gln Leu Glu Gly 1155 1160 1165
gtg gaa aca cac ccg cat aag ttt gcg aat ttt aca act tct caa cgt Val Glu Thr His Pro His Lys Phe Ala Asn Phe Thr Thr Ser Gln Arg 1250 1255 1260
3408
aat cat tgg ttt atg tcc gat atg tta ggg gaa caa ggt tcc att tta 3456 Asn His Trp Phe Met Ser Asp Met Leu Gly Glu Gln Gly Ser Ile Leu 1140 1145 1150
3504
agt aca att ctg cat aat ggc cat ttc aca aca gat gca gca aat tgg 3 552 Ser Thr Ile Leu His Asn Gly His Phe Thr Thr Asp Ala Ala Asn Trp 1170 1175 1180
acg ata gaa ggc gat gca cat cag gta gta tta gaa gat ggt aga cgt Thr Ile Glu Gly Asp Ala His Gln Val Val Leu Glu Asp Gly Arg Arg 1185 1190 1195 1200
gta tta cga ttg cca gat tgg tct tcg agt ttg tct caa acg att gaa Val Leu Arg Leu Pro Asp Trp Ser Ser Ser Leu Ser Gln Thr Ile Glu 1205 1210 1215
ate gag aat ttt gat cca gat aaa gaa tat caa tta gta ttt cat ggg Ile Glu Asn Phe Asp Pro Asp Lys Glu Tyr Gln Leu Val Phe His Gly 1220 1225 1230
3600
3648
3696
caa gga gaa gga acg gtt acg ttg gag cat ggt gaa gaa gga gaa tat 3744 Gln Gly Glu Gly Thr Val Thr Leu Glu His Gly Glu Glu Gly Glu Tyr 1235 1240 1245
3792
caa gga att acg ttt gaa tca aat aaa gtg aca gtg act att tct tca 3 840 Gln Gly Ile Thr Phe Glu Ser Asn Lys Val Thr Val Thr Ile Ser Ser 1265 1270 1275 1280
gaa gat gga gaa ttc tta gcg gat aat att gca att gtg gaa gtt cct Glu Asp Gly Glu Phe Leu Ala Asp Asn Ile Ala Ile Val Glu Val Pro 1285 1290 1295
3888
atg ttt aac aag aat caa atg gtc aat gaa aat aga ggt gta aat ata 3 93 6 Met Phe Asn Lys Asn Gln Met Val Asn Glu Asn Arg Gly Val Asn Ile 1300 1305 1310
aat age aat aca aat atg aat agt age aat aac age aat aac caa taa Asn Ser Asn Thr Asn Met Asn Ser Ser Asn Asn Ser Asn Asn Gln * 1315 1320 1325
3984
<210> SEQ ID NO: 4 <211> Comprimento: 1327 <212> Tipo: PRT <213> Organismo: Desconhecido <220> Características:
<223> Outras Informações: Isolado de amostra de solo
<400> Seqüência: 4 Ala Met Ala Thr Leu Asn Asn Met Phe Ser Val Pro Tyr Asn Val Leu 1 5 10 15 Leu Pro Ile Ile Pro Asn Ser Ile Leu Thr Phe Glu Asp Asn Arg Lys 20 25 30 Lys Ile Glu Glu Gly Ile Lys Glu Phe Glu Lys Thr Gly Arg Ile Lys 35 40 45 Pro Leu Lys Asp Leu Ile Glu Leu Ile Phe Lys Gly Tyr Ser Asp Asp 50 55 60 Glu Ser Ser Tyr Ala Ala Leu Val Gln Thr Met Leu Val Val Ile Pro 65 70 75 80 Leu Ala Phe Pro Glu Leu Ala Pro Val Leu Pro Ile Ile Gly Val Val 85 90 95 Ile Asn Phe Val Phe Pro Gly Leu Lys Gly Ser Ala Lys Ser Thr Tyr 100 105 110 Thr Met Ile Thr Glu Met Val Asp Lys Ala Ile Asn Gln Ser Phe Thr 115 120 125 Ala Gln Ile Thr Asn Ile Leu Thr Asn Asn Ile Thr Gly Ile Gln Asn 130 135 140 Asn Ile Gln Ser Val Tyr Asp Ala Met Ser Asn Ala Ile Gly Thr Asn 145 150 155 160 Asp Thr Ile His Asn Phe Ile Arg Asn Asn Asp Thr Thr Pro Cys Ser 165 170 175 Gln Asn Asn Gln Pro Ala Cys Pro Cys Pro Pro Asn Asn Gln Cys Leu 180 185 190 Gln Lys Val Val Asp Glu Tyr Thr Lys Ala Ile Ala Asn Ile Asp Leu 195 200 205 Ile Ile Pro Gln Phe His Asp Pro Leu Thr Gly Val Ile Ser Asp Leu 210 215 220 Ala Thr Ala Asn Met Tyr Ile Leu Pro Leu Tyr Ala Gln Thr Val Asn 225 230 235 240 Leu Lys Leu Ile Leu Arg Gln Ser Phe Ile Glu Phe Met Glu Lys Tyr 245 250 255 Lys Tyr Asp Glu Lys Glu Thr Val Phe Gln Ala Phe Ile Asn Ala Asp 260 265 270 Ile Pro Glu Gln Ile Lys Lys Leu Arg Gln Asp Ile Ile Thr Tyr Thr 275 280 285 Lys Asp Ile Tyr Met Gln Phe Glu Ala His Ala Pro Tyr Pro Thr Tyr 290 295 300 Asn Ser Lys Lys Gln Leu Asn Asp Tyr Ile Arg Tyr Thr Arg Ile Ile 305 310 315 320 Gln Val Tyr Cys Leu Asp Leu Val Ala Met Trp Pro Thr Leu Asp Arg 325 330 335 Val Asn Tyr Ala Leu Pro Val Gln Gln Asn Met Thr Arg Ile Ile Phe 340 345 350 Gly Asp Leu Ile Gly Pro Val Glu Thr Val Pro Gln Val Pro Arg Gln 355 360 365 Asn Ser Asp Asn Phe His Phe Asn Leu Ser Asp Val Tyr Arg Asn Pro 370 375 380 Leu Pro Asn Asn Asp Ile Phe Asn Tyr Arg Tyr Gly Gly Leu Gln Ile
385 390 395 400 Ser Lys Ala Gln Phe Met Thr Tyr Tyr Lys Lys Phe Gly Ala Phe Ser
405 410 415
Thr His Asp Glu Tyr Tyr Tyr Val Asp Gly His Arg Leu Ser Phe Asn
420 425 430
Thr Ser Asp Lys Lys Thr Ile Glu Ile Asn Ala His Gln Asn Ser His
435 440 445
Asp Thr Ile Glu Lys Asp Val Ile Asp Gln Leu Gly Gly Tyr Val Thr
450 455 460
Arg Met Asn Met Val Ser Gln Glu Ile Gly Ser Gly Ser Ile Leu Gly 465 470 475 480
Gly Asn Ala Ile Asp Arg Thr Ala Leu Thr Thr Ser Thr Gly Asp Lys
485 490 495
Asp Ile Leu Ala Ala Gly Phe Asn Ala Ile Asn Asn Gly Asn Tyr Lys
500 505 510
Thr Glu Gly Arg Gly Ala Ser His Asn Gln Asp Val Pro Asn His Lys
515 520 525
Val Gln Ala Ile Tyr Pro Val Gln Pro Asn Lys Tyr Glu Tyr Asp Asp
530 535 540
Tyr Gly Ser Glu Glu Lys Tyr Gly Tyr Leu Tyr Thr Leu Ile Pro Met 545 550 555 560
Asp Val Ser Phe Ile Pro Gln Leu Asn Ala Glu Asp Val Ile Thr Thr
565 570 575
Ile Pro Ala Glu Gln Ala Val Lys Ile Asn Gly Gln Ser Val Ile Asp
580 585 590
Thr Val Asn Thr Asn Ser Leu Leu Glu Phe Val Asn Gly Ala Asn Ala
595 600 605
Ile Lys Leu Ser Pro Gly Glu Thr Ala Gln Tyr Thr Met Ile Asn Pro
610 615 620
Val Asn Arg Ser Tyr Gln Val Arg Val Arg Val Ala Thr Glu Gly Glu 625 630 635 640
Thr Gln Leu Asp Ile Ile Ala Pro Val Asp Ser Asn Thr Leu Asn Leu
645 650 655
Ser Asn Thr Lys Thr Thr Ala Asn Asp Gln Asn Gly Ile Leu Gly Lys
660 665 670
Gln Gly Asn Tyr Ile Val Phe Pro Gln Pro Asn Ile Asp Thr Val Thr
675 680 685
Gly Thr Ser Leu Pro Pro Thr Glu Asn Ile Met Asn Phe Pro Val Gly
690 695 700
Thr Phe Asp Phe Thr Ile Val Asn Ser Gly Asn Ser Asp Thr Ile Leu 705 710 715 720
Asp Arg Ile Glu Phe Val Pro Ile Val Thr Ser Asn Lys Ile Gln Gln
725 730 735
Asp Phe Thr Ile Ser Pro Gly Thr Ser Gln Val Ile Trp Thr Gly Asn
740 745 750
Ser Ala Asn Thr Ile Asp Ile Thr Ile Ile Asp Asn Val Asp Thr Ser
755 760 765
Gly Leu Phe Val Gln Ile Phe Gln Lys Gly Lys Gln Leu His Gly Glu
770 775 780
Leu Thr Leu Ile Asp Pro Ala His Ile Gln Arg Thr Phe Ser Glu Lys 785 790 795 800
Phe Asp Gln Ile Val Leu Tyr Asn Pro Gly Tyr Asn Ser Ser Ile Ser
805 810 815
Gly Thr Val Ser Gly Ser Val Ser Ser Ile Pro Lys Lys Phe Glu Leu
820 825 830
Ser Ser Asp Leu Gln Asn Ile Thr Asn Gln Val Asn Asn Leu Phe Ala 835 840 845 <formula>formula see original document page 104</formula> Met Phe Asn Lys Asn Gln Met Val Asn Glu Asn Arg Gly Val Asn Ile
1300 1305 1310
Asn Ser Asn Thr Asn Met Asn Ser Ser Asn Asn Ser Asn Asn Gln 1315 1320 1325
<210> SEQ ID NO: 5
<211> Comprimento: 3720
<212> Tipo: DNA <213> Organismo: Desconhecido
<220> Características:
<223> Outras Informações: Isolado de amostra de solo
<221> Nome/Chave: CDS
<222> Localização: (1) ... (3720)
<400> Seqüência: 5
atg aat gat atg aca aat tta tct aaa tta tat tca cct gta cca tac 48 Met Asn Asp Met Thr Asn Leu Ser Lys Leu Tyr Ser Pro Val Pro Tyr 15 10 15
aat gtg tta gca act cca aat gtc tta gca aca aac aaa caa cca cta Asn Val Leu Ala Thr Pro Asn Val Leu Ala Thr Asn Lys Gln Pro Leu 20 25 30
gca gat aca gat gca tta aat aaa ttt tac aac gat ttg caa att gga Ala Asp Thr Asp Ala Leu Asn Lys Phe Tyr Asn Asp Leu Gln Ile Gly 35 40 45
aaa gtt tca gct ttt aca att gat gca tta tgg age ctt atg aca acc Lys Val Ser Ala Phe Thr Ile Asp Ala Leu Trp Ser Leu Met Thr Thr 50 55 60
96
144
192
gga aaa tat gac tgg tcg tca att gct aaa ttt tgt tgg tct ctt gga 240 Gly Lys Tyr Asp Trp Ser Ser Ile Ala Lys Phe Cys Trp Ser Leu Gly 65 70 75 80
act ggt gta aca cct ctg tta ggt ata ttt tca cct att ata gat ata 288 Thr Gly Val Thr Pro Leu Leu Gly Ile Phe Ser Pro Ile Ile Asp Ile 85 90 95
att ttc cct gct tta ttc ggt ggt aac aaa cta agt cta ttt gaa caa Ile Phe Pro Ala Leu Phe Gly Gly Asn Lys Leu Ser Leu Phe Glu Gln 100 105 110
cta aaa cct caa ata gaa aaa ctg att att gaa aaa tta aca gat gaa Leu Lys Pro Gln Ile Glu Lys Leu Ile Ile Glu Lys Leu Thr Asp Glu 115 120 125
gaa aaa aat ttc tta gct caa aaa act agt gat att caa tcc tat tta 432 Glu Lys Asn Phe Leu Ala Gln Lys Thr Ser Asp Ile Gln Ser Tyr Leu 130 135 140
aat gat tat aaa agt gca gtt tct aaa att aat aat cca aat gtt ata 480 Asn Asp Tyr Lys Ser Ala Val Ser Lys Ile Asn Asn Pro Asn Val Ile 145 150 155 160
336
384 gat age gat ttt gaa tet tta cat gea aca att aat cta aca tta tca Asp Ser Asp Phe Glu Ser Leu His Ala Thr Ile Asn Leu Thr Leu Ser 165 170 175
aaa ata aaa gga tca tta tet tat ttc tet ate ttt aac cag cca gat Lys Ile Lys Gly Ser Leu Ser Tyr Phe Ser Ile Phe Asn Gln Pro Asp 180 185 190
gat aga aaa cca att tat aca ata cta ggt tta cct tat tat acc ctt Asp Arg Lys Pro Ile Tyr Thr Ile Leu Gly Leu Pro Tyr Tyr Thr Leu 195 200 205
atg gcc act atg tat tta aca tta tta cga gac gtt att tta aat aca Met Ala Thr Met Tyr Leu Thr Leu Leu Arg Asp Val Ile Leu Asn Thr 210 215 220
aca aaa tgg aaa ata tca cca gct tet aat att tcc tat cgt caa caa Thr Lys Trp Lys Ile Ser Pro Ala Ser Asn Ile Ser Tyr Arg Gln Gln 225 230 235 240
ttt aaa caa aac atg aat tca ttt gtt ctt aca att aaa aat aat tat Phe Lys Gln Asn Met Asn Ser Phe Val Leu Thr Ile Lys Asn Asn Tyr 245 250 255
caa act ggt ttt aat tat ata aca aat gaa gct tac aaa gea cat cct Gln Thr Gly Phe Asn Tyr Ile Thr Asn Glu Ala Tyr Lys Ala His Pro 260 265 270
aca aat cct tca aag act ata ctt cca ttt gaa aat aaa atg aca ttg Thr Asn Pro Ser Lys Thr Ile Leu Pro Phe Glu Asn Lys Met Thr Leu 275 280 285
gac tgt ttt gac tat gtt gea atg tgg ccc act tta tat cca gat gat Asp Cys Phe Asp Tyr Val Ala Met Trp Pro Thr Leu Tyr Pro Asp Asp 290 295 300
tat tat act gaa aaa aca aat ttg caa aaa act cgc tta tta ttt tcc Tyr Tyr Thr Glu Lys Thr Asn Leu Gln Lys Thr Arg Leu Leu Phe Ser 305 310 315 320
cca ata tta ggt cgt atg cca gat tet cga agt caa tgg ctt cat agt Pro Ile Leu Gly Arg Met Pro Asp Ser Arg Ser Gln Trp Leu His Ser 325 330 335
aaa cct tat tcc tgg gat agt aat aaa act ttt acg ttc gat cac tat Lys Pro Tyr Ser Trp Asp Ser Asn Lys Thr Phe Thr Phe Asp His Tyr 340 345 350
tat atg gct gaa ctc aca cac att gac act aaa gaa ttt gat cga gta Tyr Met Ala Glu Leu Thr His Ile Asp Thr Lys Glu Phe Asp Arg Val 355 360 365
gac aga ate cgt cag att tat caa gaa gga tat caa aaa gaa caa caa Asp Arg Ile Arg Gln Ile Tyr Gln Glu Gly Tyr Gln Lys Glu Gln Gln 370 375 380
528
576
624
672
720
768
816
864
912
960
1008
1056
1104
1152 acg tat gat gat tat tac act tat ggc gga gat tct gct caa aat act 1200 Thr Tyr Asp Asp Tyr Tyr Thr Tyr Gly Gly Asp Ser Ala Gln Asn Thr 385 390 395 400
tct ttt aca aca gat aat cca ctt gca ate atg tat cct act cga ggt Ser Phe Thr Thr Asp Asn Pro Leu Ala Ile Met Tyr Pro Thr Arg Gly 405 410 415
ggt aat tat gta ggt acc gct att aaa tgg ttt gat gac aca gtg caa Gly Asn Tyr Val Gly Thr Ala Ile Lys Trp Phe Asp Asp Thr Val Gln 420 425 430
ggt ggt cga tct tca gga tat aca act cca tat tct gga gac cct gat Gly Gly Arg Ser Ser Gly Tyr Thr Thr Pro Tyr Ser Gly Asp Pro Asp 435 440 445
cct ata ata act cct gat gat cat aaa gtt aat ttt ctc tat aca gta Pro Ile Ile Thr Pro Asp Asp His Lys Val Asn Phe Leu Tyr Thr Val 450 455 460
aaa gat gaa tta aaa gga att gat gca tgg gtc aat tca tgg gtt ccc Lys Asp Glu Leu Lys Gly Ile Asp Ala Trp Val Asn Ser Trp Val Pro 465 470 475 480
att tat aca act gtt cca aat ata att gaa aat gaa atg ttc ctc act Ile Tyr Thr Thr Val Pro Asn Ile Ile Glu Asn Glu Met Phe Leu Thr 485 490 495
aca cta ggt ttt cct ttt gaa aaa gga ata att gat aca ggc gga gct 1536 Thr Leu Gly Phe Pro Phe Glu Lys Gly Ile Ile Asp Thr Gly Gly Ala 500 505 510
1248
1296
1344
1392
1440
1488
ggt gga gat aaa ata tat caa cta gaa cga tta aat gga tcc atg gct Gly Gly Asp Lys Ile Tyr Gln Leu Glu Arg Leu Asn Gly Ser Met Ala 515 520 525
ate aac tta aaa ttt aaa caa ata att aaa tta cca ttt aca aat cta Ile Asn Leu Lys Phe Lys Gln Ile Ile Lys Leu Pro Phe Thr Asn Leu 530 535 540
aca acc ggt aat tat cta att cgt tta cgt tat gca agt cat tcg gat Thr Thr Gly Asn Tyr Leu Ile Arg Leu Arg Tyr Ala Ser His Ser Asp 545 550 555 560
ata aat gca ttt act cac att cac tct gaa aat gga gct gat ate age Ile Asn Ala Phe Thr His Ile His Ser Glu Asn Gly Ala Asp Ile Ser 565 570 575
agt act cct tta gga aat att act ctt cct aac acg caa aat ttc act Ser Thr Pro Leu Gly Asn Ile Thr Leu Pro Asn Thr Gln Asn Phe Thr 580 585 590
ttt cct act aac gat gaa tac caa ccc aat caa ccc caa tat acg acc Phe Pro Thr Asn Asp Glu Tyr Gln Pro Asn Gln Pro Gln Tyr Thr Thr 595 600 605
1584
1632
1680
1728
1776
1824 tat ata gag gga aat gct ggt aaa tat gct tta tat caa ttt aca caa Tyr He Glu Gly Asn Ala Gly Lys Tyr Ala Leu Tyr Gln Phe Thr Gln 610 615 620
aat ate tcg ctc aca tet gga caa tat act ttc tat att caa aat aat Asn Ile Ser Leu Thr Ser Gly Gln Tyr Thr Phe Tyr Ile Gln Asn Asn 625 630 635 640
agt aat act gat ctc ttt tta gat cgg att gaa ttt gtt cct atg ccg Ser Asn Thr Asp Leu Phe Leu Asp Arg Ile Glu Phe Val Pro Met Pro 645 650 655
cct tet tca ata tca tta cct gat att gaa ata act aac aca gat tat Pro Ser Ser Ile Ser Leu Pro Asp Ile Glu Ile Thr Asn Thr Asp Tyr 660 665 670
gaa att tgg aaa agt gat cgt cca tat ggc cat tet ata aat gga ata Glu Ile Trp Lys Ser Asp Arg Pro Tyr Gly His Ser Ile Asn Gly Ile 675 680 685
ttc ata gtc age gtg cca ttt gga aac cag aca gat act gta act ata Phe Ile Val Ser Val Pro Phe Gly Asn Gln Thr Asp Thr Val Thr Ile 690 695 700
aca tat tgg aat aat ggg gaa aaa gtc cat aca gac tet caa aca ttt Thr Tyr Trp Asn Asn Gly Glu Lys Val His Thr Asp Ser Gln Thr Phe 705 710 715 720
gat atg gea aga ttc caa ggt caa gat ctt aca caa tgg caa gga gct Asp Met Ala Arg Phe Gln Gly Gln Asp Leu Thr Gln Trp Gln Gly Ala 725 730 735
ttt gat cgt gta act att cgt aga act cat tet gat ggt aca ttg tca Phe Asp Arg Val Thr Ile Arg Arg Thr His Ser Asp Gly Thr Leu Ser 740 745 750
tta aca agt gea acc cta tac ttt gtt ate cca aaa tca tcc ttt agt Leu Thr Ser Ala Thr Leu Tyr Phe Val Ile Pro Lys Ser Ser Phe Ser 755 760 765
acc cca gaa gat tta gaa aaa ate aca aac caa gtc aat cag tta ttt Thr Pro Glu Asp Leu Glu Lys Ile Thr Asn Gln Val Asn Gln Leu Phe 770 775 780
act tcc tca tcc caa aca gaa tta gct aac acc gta acc gat tac gga Thr Ser Ser Ser Gln Thr Glu Leu Ala Asn Thr Val Thr Asp Tyr Gly 785 790 795 800
att gat caa gtt ttg atg aaa gta gat gcg tta tca gac gat gta ttt Ile Asp Gln Val Leu Met Lys Val Asp Ala Leu Ser Asp Asp Val Phe 805 810 815
ggg gta gag aaa aaa gea tta cgt aaa ctt gtc aat cag gcc aaa caa Gly Val Glu Lys Lys Ala Leu Arg Lys Leu Val Asn Gln Ala Lys Gln 820 825 830
1872
1920
1968
2016
2064
2112
2160
2208
2256
2304
2352
2400
2448
2496 ctg agt aaa gca cgc aat gta tta gtc ggt gga aac ttt gaa gga aat 2 544 Leu Ser Lys Ala Arg Asn Val Leu Val Gly Gly Asn Phe Glu Gly Asn 835 840 845
cat gaa tgg gta ctc ggt cgt aaa gcg gtc atg gtc gca aat gat gag 2 592 His Glu Trp Val Leu Gly Arg Lys Ala Val Met Val Ala Asn Asp Glu 850 855 860
tta ttt aaa ggc aat cat tta tta tta cca cct cca agt cta tat cca 2640 Leu Phe Lys Gly Asn His Leu Leu Leu Pro Pro Pro Ser Leu Tyr Pro 865 870 875 880
tcg tat gcg tat caa aaa gtg gat gaa tcc aaa tta aaa ccg aat aca 2688 Ser Tyr Ala Tyr Gln Lys Val Asp Glu Ser Lys Leu Lys Pro Asn Thr 885 890 895
cga tat acc gtt tct ggt ttt gtg gcg caa agt gaa caa tta gaa gtc 273 6 Arg Tyr Thr Val Ser Gly Phe Val Ala Gln Ser Glu Gln Leu Glu Val 900 905 910
gtt gtt tcc cgt tat ggt aaa gaa gta cat gac atg tta aat gtt cct 2784 Val Val Ser Arg Tyr Gly Lys Glu Val His Asp Met Leu Asn Val Pro 915 920 925
tat gaa gaa gcg tta ccg att tct tca aat gaa aag tca aat tgt tgt 2832 Tyr Glu Glu Ala Leu Pro Ile Ser Ser Asn Glu Lys Ser Asn Cys Cys 930 935 940
aaa ccg gct act tgc aac tat aca tct tgt gag ggg aaa gaa cca gat 2 880 Lys Pro Ala Thr Cys Asn Tyr Thr Ser Cys Glu Gly Lys Glu Pro Asp 945 950 955 960
tct cat ttc ttc cgt tat agt ate gat gtc ggt gct tta caa cca gaa 2928 Ser His Phe Phe Arg Tyr Ser Ile Asp Val Gly Ala Leu Gln Pro Glu 965 970 975
gca aat cta gga att gaa ttc ggt ctt cgt att gtg aaa tca aat gga Ala Asn Leu Gly Ile Glu Phe Gly Leu Arg Ile Val Lys Ser Asn Gly 980 985 990
2976
ttt gca aaa ate agt aat tta gaa ate aaa gaa gat cgt cca tta aca 3024
Phe Ala Lys Ile Ser Asn Leu Glu Ile Lys Glu Asp Arg Pro Leu Thr 995 1000 1005
gac caa gaa att aaa aaa gta caa cac aaa gaa caa aag tgg aaa aaa 3 072
Asp Gln Glu Ile Lys Lys Val Gln His Lys Glu Gln Lys Trp Lys Lys 1010 1015 1020
gca ttt aac aaa gaa caa gca gag tta acg gca aca ctc caa cca aca Ala Phe Asn Lys Glu Gln Ala Glu Leu Thr Ala Thr Leu Gln Pro Thr 1025 1030 1035 1040
3120
ctg aat caa ate aat gcc ttg tat caa cag gaa gat tgg aat ggt tcg 3168 Leu Asn Gln Ile Asn Ala Leu Tyr Gln Gln Glu Asp Trp Asn Gly Ser 1045 1050 1055 att cat cct cat gtg acg tat caa cat ctg tct gat gtt gtc tta cca 3126 Ile His Pro His Val Thr Tyr Gln His Leu Ser Asp Val Val Leu Pro 1060 1065 1070
acg tta cca aaa caa aca cat tgg ttt atg gaa aat cga gaa ggc gaa 3264 Thr Leu Pro Lys Gln Thr His Trp Phe Met Glu Asn Arg Glu Gly Glu 1075 1080 1085 cat gtt gtt ctg acg caa caa ttc caa caa gca tta gat cgt gct ttc 3312 His Val Val Leu Thr Gln Gln Phe Gln Gln Ala Leu Asp Arg Ala Phe 1090 1095 1100
caa caa ate gaa gaa caa aac ttg ate cac aat ggt age ttt aca agt 3360 Gln Gln Ile Glu Glu Gln Asn Leu Ile His Asn Gly Ser Phe Thr Ser .1105 1110 1115 1120
gga tta aca gat tgg act gta aca gga gat gca cag att act ate tat 3408 Gly Leu Thr Asp Trp Thr Val Thr Gly Asp Ala Gln Ile Thr Ile Tyr 1125 1130 1135
gat gaa gat cca gta tta gaa cta gca cat tgg gat gca age gtc tct 3456 Asp Glu Asp Pro Val Leu Glu Leu Ala His Trp Asp Ala Ser Val Ser 1140 1145 1150
caa acg att gag att act gat ttt gaa gaa gaa aaa gaa tac aaa ctt 3504 Gln Thr Ile Glu Ile Thr Asp Phe Glu Glu Glu Lys Glu Tyr Lys Leu 1155 1160 1165
cgt gta cgc gga aaa ggc aaa gga acg gtt acc gtt caa cat gaa gaa 3552 Arg Val Arg Gly Lys Gly Lys Gly Thr Val Thr Val Gln His Glu Glu 1170 1175 1180
gag tta gaa aca atg aca ttt aac aca act agt ttt aca acg aaa gaa 3600 Glu Leu Glu Thr Met Thr Phe Asn Thr Thr Ser Phe Thr Thr Lys Glu .1185 1190 1195 1200
caa acc ttc tat ttc gaa gga aat aca ata gat gta cac gtt caa tca 3648 Gln Thr Phe Tyr Phe Glu Gly Asn Thr Ile Asp Val His Val Gln Ser 1205 1210 1215
gag aat aat gca ttc ctt gta gac agt gtg gaa ctc att gaa gtt gta 3696 Glu Asn Asn Ala Phe Leu Val Asp Ser Val Glu Leu Ile Glu Val Val 1220 1225 1230
aaa gaa caa gaa gaa aaa caa taa 3720 Lys Glu Gln Glu Glu Lys Gln * 1235
<210> SEQ ID NO: 6
<211> Comprimento: 1239
<212> Tipo: PRT
<213> Organismo: Desconhecido
<220> Características:
<223> Outras Informações: Isolado de amostra de solo <400> Seqüência: 6
Met Asn Asp Met Thr Asn Leu Ser Lys Leu Tyr Ser Pro Val Pro Tyr
1 5 10 15
Asn Val Leu Ala Thr Pro Asn Val Leu Ala Thr Asn Lys Gln Pro Leu
20 25 30
Ala Asp Thr Asp Ala Leu Asn Lys Phe Tyr Asn Asp Leu Gln Ile Gly
35 40 45
Lys Val Ser Ala Phe Thr Ile Asp Ala Leu Trp Ser Leu Met Thr Thr
50 55 60
Gly Lys Tyr Asp Trp Ser Ser Ile Ala Lys Phe Cys Trp Ser Leu Gly 65 70 75 80
Thr Gly Val Thr Pro Leu Leu Gly Ile Phe Ser Pro Ile Ile Asp Ile
85 90 95
Ile Phe Pro Ala Leu Phe Gly Gly Asn Lys Leu Ser Leu Phe Glu Gln
100 105 110
Leu Lys Pro Gln Ile Glu Lys Leu Ile Ile Glu Lys Leu Thr Asp Glu
115 120 125
Glu Lys Asn Phe Leu Ala Gln Lys Thr Ser Asp Ile Gln Ser Tyr Leu
130 135 140
Asn Asp Tyr Lys Ser Ala Val Ser Lys Ile Asn Asn Pro Asn Val Ile 145 150 155 160
Asp Ser Asp Phe Glu Ser Leu His Ala Thr Ile Asn Leu Thr Leu Ser
165 170 175
Lys Ile Lys Gly Ser Leu Ser Tyr Phe Ser Ile Phe Asn Gln Pro Asp
180 185 190
Asp Arg Lys Pro Ile Tyr Thr Ile Leu Gly Leu Pro Tyr Tyr Thr Leu
195 200 205
Met Ala Thr Met Tyr Leu Thr Leu Leu Arg Asp Val Ile Leu Asn Thr
210 215 220
Thr Lys Trp Lys Ile Ser Pro Ala Ser Asn Ile Ser Tyr Arg Gln Gln 225 230 235 240
Phe Lys Gln Asn Met Asn Ser Phe Val Leu Thr Ile Lys Asn Asn Tyr
245 250 255
Gln Thr Gly Phe Asn Tyr Ile Thr Asn Glu Ala Tyr Lys Ala His Pro
260 265 270
Thr Asn Pro Ser Lys Thr Ile Leu Pro Phe Glu Asn Lys Met Thr Leu
275 280 285
Asp Cys Phe Asp Tyr Val Ala Met Trp Pro Thr Leu Tyr Pro Asp Asp
290 295 300
Tyr Tyr Thr Glu Lys Thr Asn Leu Gln Lys Thr Arg Leu Leu Phe Ser 305 310 315 320
Pro Ile Leu Gly Arg Met Pro Asp Ser Arg Ser Gln Trp Leu His Ser
325 330 335
Lys Pro Tyr Ser Trp Asp Ser Asn Lys Thr Phe Thr Phe Asp His Tyr
340 345 350
Tyr Met Ala Glu Leu Thr His Ile Asp Thr Lys Glu Phe Asp Arg Val
355 360 365
Asp Arg Ile Arg Gln Ile Tyr Gln Glu Gly Tyr Gln Lys Glu Gln Gln
370 375 380
Thr Tyr Asp Asp Tyr Tyr Thr Tyr Gly Gly Asp Ser Ala Gln Asn Thr 385 390 395 400
Ser Phe Thr Thr Asp Asn Pro Leu Ala Ile Met Tyr Pro Thr Arg Gly
405 410 415
Gly Asn Tyr Val Gly Thr Ala Ile Lys Trp Phe Asp Asp Thr Val Gln
420 425 430
Gly Gly Arg Ser Ser Gly Tyr Thr Thr Pro Tyr Ser Gly Asp Pro Asp 435 440 445 Pro Ile Ile Thr Pro Asp Asp His Lys Val Asn Phe Leu Tyr Thr Val
Lys Asp Glu Leu Lys Gly Ile Asp Ala Trp Val Asn Ser Trp Val Pro
Ile Tyr Thr Thr Val Pro Asn Ile Ile Glu Asn Glu Met Phe Leu Thr
Thr Leu Gly Phe Pro Phe Glu Lys Gly Ile Ile Asp Thr Gly Gly Ala
Gly Gly Asp Lys Ile Tyr Gln Leu Glu Arg Leu Asn Gly Ser Met Ala
Ile Asn Leu Lys Phe Lys Gln Ile Ile Lys Leu Pro Phe Thr Asn Leu
Thr Thr Gly Asn Tyr Leu Ile Arg Leu Arg Tyr Ala Ser His Ser Asp
Ile Asn Ala Phe Thr His Ile His Ser Glu Asn Gly Ala Asp Ile Ser
Ser Thr Pro Leu Gly Asn Ile Thr Leu Pro Asn Thr Gln Asn Phe Thr
Phe Pro Thr Asn Asp Glu Tyr Gln Pro Asn Gln Pro Gln Tyr Thr Thr
Tyr Ile Glu Gly Asn Ala Gly Lys Tyr Ala Leu Tyr Gln Phe Thr Gln
Asn Ile Ser Leu Thr Ser Gly Gln Tyr Thr Phe Tyr Ile Gln Asn Asn
Ser Asn Thr Asp Leu Phe Leu Asp Arg Ile Glu Phe Val Pro Met Pro
Pro Ser Ser Ile Ser Leu Pro Asp Ile Glu Ile Thr Asn Thr Asp Tyr
Glu Ile Trp Lys Ser Asp Arg Pro Tyr Gly His Ser Ile Asn Gly Ile
Phe Ile Val Ser Val Pro Phe Gly Asn Gln Thr Asp Thr Val Thr Ile
Thr Tyr Trp Asn Asn Gly Glu Lys Val His Thr Asp Ser Gln Thr Phe
Asp Met Ala Arg Phe Gln Gly Gln Asp Leu Thr Gln Trp Gln Gly Ala
Phe Asp Arg Val Thr Ile Arg Arg Thr His Ser Asp Gly Thr Leu Ser
Leu Thr Ser Ala Thr Leu Tyr Phe Val Ile Pro Lys Ser Ser Phe Ser
Thr Pro Glu Asp Leu Glu Lys Ile Thr Asn Gln Val Asn Gln Leu Phe
Thr Ser Ser Ser Gln Thr Glu Leu Ala Asn Thr Val Thr Asp Tyr Gly
Ile Asp Gln Val Leu Met Lys Val Asp Ala Leu Ser Asp Asp Val Phe
Gly Val Glu Lys Lys Ala Leu Arg Lys Leu Val Asn Gln Ala Lys Gln
Leu Ser Lys Ala Arg Asn Val Leu Val Gly Gly Asn Phe Glu Gly Asn
His Glu Trp Val Leu Gly Arg Lys Ala Val Met Val Ala Asn Asp Glu
Leu Phe Lys Gly Asn His Leu Leu Leu Pro Pro Pro Ser Leu Tyr Pro
Ser Tyr Ala Tyr Gln Lys Val Asp Glu Ser Lys Leu Lys Pro Asn Thr Arg Tyr Thr Val Ser Gly Phe Val Ala Gln Ser Glu Gln Leu Glu Val
900 905 910
Val Val Ser Arg Tyr Gly Lys Glu Val His Asp Met Leu Asn Val Pro
915 920 925
Tyr Glu Glu Ala Leu Pro Ile Ser Ser Asn Glu Lys Ser Asn Cys Cys
930 935 940
Lys Pro Ala Thr Cys Asn Tyr Thr Ser Cys Glu Gly Lys Glu Pro Asp 945 950 955 960
Ser His Phe Phe Arg Tyr Ser Ile Asp Val Gly Ala Leu Gln Pro Glu
965 970 975
Ala Asn Leu Gly Ile Glu Phe Gly Leu Arg Ile Val Lys Ser Asn Gly
980 985 990
Phe Ala Lys Ile Ser Asn Leu Glu Ile Lys Glu Asp Arg Pro Leu Thr
995 1000 1005
Asp Gln Glu Ile Lys Lys Val Gln His Lys Glu Gln Lys Trp Lys Lys
1010 1015 1020
Ala Phe Asn Lys Glu Gln Ala Glu Leu Thr Ala Thr Leu Gln Pro Thr 1025 1030 1035 1040
Leu Asn Gln Ile Asn Ala Leu Tyr Gln Gln Glu Asp Trp Asn Gly Ser
1045 1050 1055
Ile His Pro His Val Thr Tyr Gln His Leu Ser Asp Val Val Leu Pro
1060 1065 1070
Thr Leu Pro Lys Gln Thr His Trp Phe Met Glu Asn Arg Glu Gly Glu
1075 1080 1085
His Val Val Leu Thr Gln Gln Phe Gln Gln Ala Leu Asp Arg Ala Phe
1090 1095 HOO
Gln Gln Ile Glu Glu Gln Asn Leu Ile His Asn Gly Ser Phe Thr Ser 1105 HlO 1H5 H20
Gly Leu Thr Asp Trp Thr Val Thr Gly Asp Ala Gln Ile Thr Ile Tyr
1125 1130 1135
Asp Glu Asp Pro Val Leu Glu Leu Ala His Trp Asp Ala Ser Val Ser
1140 1145 1150
Gln Thr Ile Glu Ile Thr Asp Phe Glu Glu Glu Lys Glu Tyr Lys Leu
1155 1160 1165
Arg Val Arg Gly Lys Gly Lys Gly Thr Val Thr Val Gln His Glu Glu
1170 1175 1180
Glu Leu Glu Thr Met Thr Phe Asn Thr Thr Ser Phe Thr Thr Lys Glu 1185 U90 1195 1200
Gln Thr Phe Tyr Phe Glu Gly Asn Thr Ile Asp Val His Val Gln Ser
1205 1210 1215
Glu Asn Asn Ala Phe Leu Val Asp Ser Val Glu Leu Ile Glu Val Val
1220 1225 1230
Lys Glu Gln Glu Glu Lys Gln 1235
<210> SEQ ID NO: 7 <211> Comprimento: 2059 <212> Tipo: DNA
<213> Organismo: Seqüência Artificial
<220> Características:
<223> Outras Informações: synaxmi-031
<221> Nome/Chave: CDS
<222> Localização: (1)...(2058) <400> Seqüência: 7
atg gat tgc aat ctc cag age cag cag aat ate cca tac aat gtg ctt Met Asp Cys Asn Leu Gln Ser Gln Gln Asn Ile Pro Tyr Asn Val Leu 1 5 10 15
gct ate cct gtt age aat gtt aat age ctt acg gat acg gtt ggc gat Ala Ile Pro Val Ser Asn Val Asn Ser Leu Thr Asp Thr Val Gly Asp 20 25 30
cta aag aag gea tgg gaa gag ttc cag aag acg ggc age ttc tcc ctt Leu Lys Lys Ala Trp Glu Glu Phe Gln Lys Thr Gly Ser Phe Ser Leu 35 40 45
acc gea ctc cag cag ggc ttc age gct tcc cag ggc ggg acg ttc aat Thr Ala Leu Gln Gln Gly Phe Ser Ala Ser Gln Gly Gly Thr Phe Asn 50 55 60
tac ctc acc ctc ctc cag tcc ggg ate tcc ctg gct ggc age ttc gtg Tyr Leu Thr Leu Leu Gln Ser Gly Ile Ser Leu Ala Gly Ser Phe Val 65 70 75 80
cct ggc ggc acc ttc gtt gct cca ate ate aat atg gtg ate ggc tgg Pro Gly Gly Thr Phe Val Ala Pro Ile Ile Asn Met Val Ile Gly Trp 85 90 95
ctc tgg cct cat aag aat aag aat gea gat acg gaa aat ctg ate aat Leu Trp Pro His Lys Asn Lys Asn Ala Asp Thr Glu Asn Leu Ile Asn 100 105 HO
ctg ate gat tca gaa ate cag aag cag ctg aat aag gct ctg ctg gat Leu Ile Asp Ser Glu Ile Gln Lys Gln Leu Asn Lys Ala Leu Leu Asp 115 120 125
gct gat cgc aat gaa tgg age age tac ctc gag tcc ate ttc gat age Ala Asp Arg Asn Glu Trp Ser Ser Tyr Leu Glu Ser Ile Phe Asp Ser 130 135 140
age aat aat ctg aat ggc gea ate gtt gat gct cag tgg tcc ggc acc Ser Asn Asn Leu Asn Gly Ala Ile Val Asp Ala Gln Trp Ser Gly Thr 145 150 155 160
gtg aat acg acc aat cgt acg ctt cgt aat cct acg gaa tca gat tac Val Asn Thr Thr Asn Arg Thr Leu Arg Asn Pro Thr Glu Ser Asp Tyr 165 170 175
acc aat gtg gtg acg aat ttc ate gea gea gat ggg gat ate gct aat Thr Asn Val Val Thr Asn Phe Ile Ala Ala Asp Gly Asp Ile Ala Asn 180 185 190
aat gaa aat cat ate atg aat ggg aat ttc gat gtg gea gea gct cca Asn Glu Asn His Ile Met Asn Gly Asn Phe Asp Val Ala Ala Ala Pro 195 200 205
tac ttc gtt ate ggg gct acc gct aga ttc gea gct atg cag tcc tac Tyr Phe Val Ile Gly Ala Thr Ala Arg Phe Ala Ala Met Gln Ser Tyr 210 215 220
48
96
144
192
240
288
336
384
432
480
528
576
624
672 ate aag ttc tgc aat gea tgg ate gat aag gtt ggg ctg tca gat gct 720 Ile Lys Phe Cys Asn Ala Trp Ile Asp Lys Val Gly Leu Ser Asp Ala 225 230 235 240
cag ctg acc acg cag aag gct aat ctg gat aga acg aag cag aat atg Gln Leu Thr Thr Gln Lys Ala Asn Leu Asp Arg Thr Lys Gln Asn Met 245 250 255
cgt aat gct ate ctt aat tac acc cag cag gtt atg aag gtt ttc aag Arg Asn Ala Ile Leu Asn Tyr Thr Gln Gln Val Met Lys Val Phe Lys 260 265 270
gat tcc aag aat atg cca acg ate ggc acg aat aag ttc age gtt gat Asp Ser Lys Asn Met Pro Thr Ile Gly Thr Asn Lys Phe Ser Val Asp 275 280 285
acc tac aat gtt tac ate aag ggg atg acg ctt aat gtg ctt gat ate Thr Tyr Asn Val Tyr Ile Lys Gly Met Thr Leu Asn Val Leu Asp Ile 290 295 300
gtt gct ate tgg cca age ctg tac cca gat gat tac acg tca cag acg Val Ala Ile Trp Pro Ser Leu Tyr Pro Asp Asp Tyr Thr Ser Gln Thr 305 310 315 320
gct ctg gaa cag acc cgc gtg acg ttc tcc aat atg gtg ggg cag gaa Ala Leu Glu Gln Thr Arg Val Thr Phe Ser Asn Met Val Gly Gln Glu 325 330 335
gaa ggc acg gat ggc age cte aga ate tac aat acc ttc gat age ttc Glu Gly Thr Asp Gly Ser Leu Arg Ile Tyr Asn Thr Phe Asp Ser Phe 340 345 350
tcc tac cag cat age cct ate cct aat aat aat gtg aat etc ate age Ser Tyr Gln His Ser Pro Ile Pro Asn Asn Asn Val Asn Leu Ile Ser 355 360 365
tac tac aat gat gaa ctt cag aat ctg gaa etc ggg gtt tac acc cca 1152 Tyr Tyr Asn Asp Glu Leu Gln Asn Leu Glu Leu Gly Val Tyr Thr Pro 370 375 380
768
816
864
912
960
100Í
1056
1104
cca aag aag ggc tca ggc tac age tac cca tac ggg ttc gtg ctg aat Pro Lys Lys Gly Ser Gly Tyr Ser Tyr Pro Tyr Gly Phe Val Leu Asn 385 390 395 400
tac gea aat age aag tac aag tac ggc gat tcc aat gat cca gaa tcc Tyr Ala Asn Ser Lys Tyr Lys Tyr Gly Asp Ser Asn Asp Pro Glu Ser 405 410 415
ctc ggc ggg ctt tcc acc ctt age gct cca ate caa cag gtt aat gct Leu Gly Gly Leu Ser Thr Leu Ser Ala Pro Ile Gln Gln Val Asn Ala 420 425 430
1200
1248
1296
gct acc cag aat age aag tac ctt gat ggc gaa ate ctg aat ggg ate 1344 Ala Thr Gln Asn Ser Lys Tyr Leu Asp Gly Glu Ile Leu Asn Gly Ile 435 440 445 ggc gca age ctg cct ggc tac tgc acg acc ggg tgc tca cct acc gaa 1392 Gly Ala Ser Leu Pro Gly Tyr Cys Thr Thr Gly Cys Ser Pro Thr Glu 450 455 460
cca cca ttc age tgc acg age acg gca aat ggg tac aag gca age tgc 1440 Pro Pro Phe Ser Cys Thr Ser Thr Ala Asn Gly Tyr Lys Ala Ser Cys 465 470 475 480
aat cca age gat acc aat cag aag ate aat gct ctc tac cca ttc acg 1488 Asn Pro Ser Asp Thr Asn Gln Lys Ile Asn Ala Leu Tyr Pro Phe Thr 485 490 495
cag gca aat gtg aag ggg aat acc ggg aag ctg ggc gtt ctc gca age 153 6 Gln Ala Asn Val Lys Gly Asn Thr Gly Lys Leu Gly Val Leu Ala Ser 500 505 510
ctt gtt age tac gat ctg aat cct aag aat gtt ttc ggg gaa ctc gat 1584 Leu Val Ser Tyr Asp Leu Asn Pro Lys Asn Val Phe Gly Glu Leu Asp 515 520 525
tca gat acc aat aat gtt ate ctt aag ggc ate cca gca gaa aag ggc 163 2 Ser Asp Thr Asn Asn Val Ile Leu Lys Gly Ile Pro Ala Glu Lys Gly 530 535 540
tac ttc cca aat aat gca aga cca acc gtt gtg aag gaa tgg ate aat 1680 Tyr Phe Pro Asn Asn Ala Arg Pro Thr Val Val Lys Glu Trp Ile Asn 545 550 555 560
ggg gct tcc gca gtt cca ctt gat tcc ggc aat acc ctg ttc atg acg 1728 Gly Ala Ser Ala Val Pro Leu Asp Ser Gly Asn Thr Leu Phe Met Thr 565 570 575
gct acg aac ctg acg gct acc cag tac aga ate cgc ate cgt tac gct 1776 Ala Thr Asn Leu Thr Ala Thr Gln Tyr Arg Ile Arg Ile Arg Tyr Ala 580 585 590
aac cca aac tca aac acg cag ate ggc gtt aga ate acg cag aac ggg 1824 Asn Pro Asn Ser Asn Thr Gln Ile Gly Val Arg Ile Thr Gln Asn Gly 595 600 605
age ctc ate tcc tcc tcc aac ctc acg ctg tac tca acc acc gat atg 1872 Ser Leu Ile Ser Ser Ser Asn Leu Thr Leu Tyr Ser Thr Thr Asp Met 610 615 620
aac aac acc ctg cca ctg aac gtt tac gtg ate ggg gaa aac ggg aac 192 0 Asn Asn Thr Leu Pro Leu Asn Val Tyr Val Ile Gly Glu Asn Gly Asn 625 630 635 640
tac acc ctc cag gat ctc tac aac acg acg aac gtt ctg tcc acg ggc 1968 Tyr Thr Leu Gln Asp Leu Tyr Asn Thr Thr Asn Val Leu Ser Thr Gly 645 650 655
gat ate acc ctg cag ate acc ggc ggg gat cag aag ata ttc ate gat 2016 Asp Ile Thr Leu Gln Ile Thr Gly Gly Asp Gln Lys Ile Phe Ile Asp 660 665 670 cgc ate gag ttc gtg cct acg atg cca gtg cca ggc aac taa Arg Ile Glu Phe Val Pro Thr Met Pro Val Pro Gly Asn *
2058
675
680
685
a
2059
<210> SEQ ID NO: 8 <211> Comprimento: 685 <212> Tipo: PRT
<213> Organismo: Seqüência Artificial
<220> Características:
<223> Outras Informações: SYNAXMI-031
<400> Seqüência: 8
Met Asp Cys Asn Leu Gln Ser Gln Gln Asn Ile Pro Tyr Asn Val Leu
15 10 15
Ala Ile Pro Val Ser Asn Val Asn Ser Leu Thr Asp Thr Val Gly Asp
20 25 30
Leu Lys Lys Ala Trp Glu Glu Phe Gln Lys Thr Gly Ser Phe Ser Leu
35 40 45
Thr Ala Leu Gln Gln Gly Phe Ser Ala Ser Gln Gly Gly Thr Phe Asn
50 55 60
Tyr Leu Thr Leu Leu Gln Ser Gly Ile Ser Leu Ala Gly Ser Phe Val 65 70 75 80
Pro Gly Gly Thr Phe Val Ala Pro Ile Ile Asn Met Val Ile Gly Trp
85 90 95
Leu Trp Pro His Lys Asn Lys Asn Ala Asp Thr Glu Asn Leu Ile Asn
100 105 110
Leu Ile Asp Ser Glu Ile Gln Lys Gln Leu Asn Lys Ala Leu Leu Asp
115 120 125
Ala Asp Arg Asn Glu Trp Ser Ser Tyr Leu Glu Ser Ile Phe Asp Ser
130 135 140
Ser Asn Asn Leu Asn Gly Ala Ile Val Asp Ala Gln Trp Ser Gly Thr 145 150 155 160
Val Asn Thr Thr Asn Arg Thr Leu Arg Asn Pro Thr Glu Ser Asp Tyr
165 170 175
Thr Asn Val Val Thr Asn Phe Ile Ala Ala Asp Gly Asp Ile Ala Asn
180 185 190
Asn Glu Asn His Ile Met Asn Gly Asn Phe Asp Val Ala Ala Ala Pro
195 200 205
Tyr Phe Val Ile Gly Ala Thr Ala Arg Phe Ala Ala Met Gln Ser Tyr
210 215 220
Ile Lys Phe Cys Asn Ala Trp Ile Asp Lys Val Gly Leu Ser Asp Ala 225 230 235 240
Gln Leu Thr Thr Gln Lys Ala Asn Leu Asp Arg Thr Lys Gln Asn Met
245 250 255
Arg Asn Ala Ile Leu Asn Tyr Thr Gln Gln Val Met Lys Val Phe Lys
260 265 270
Asp Ser Lys Asn Met Pro Thr Ile Gly Thr Asn Lys Phe Ser Val Asp
275 280 285
Thr Tyr Asn Val Tyr Ile Lys Gly Met Thr Leu Asn Val Leu Asp Ile
290 295 300
Val Ala Ile Trp Pro Ser Leu Tyr Pro Asp Asp Tyr Thr Ser Gln Thr 305 310 315 320
Ala Leu Glu Gln Thr Arg Val Thr Phe Ser Asn Met Val Gly Gln Glu
325
330
335 Glu Gly Thr Asp Gly Ser Leu Arg Ile Tyr Asn Thr Phe Asp Ser Phe 340 345 350 Ser Tyr Gln His Ser Pro Ile Pro Asn Asn Asn Val Asn Leu Ile Ser 355 360 365 Tyr Tyr Asn Asp Glu Leu Gln Asn Leu Glu Leu Gly Val Tyr Thr Pro 370 375 380 Pro Lys Lys Gly Ser Gly Tyr Ser Tyr Pro Tyr Gly Phe Val Leu Asn 385 390 395 400 Tyr Ala Asn Ser Lys Tyr Lys Tyr Gly Asp Ser Asn Asp Pro Glu Ser 405 410 415 Leu Gly Gly Leu Ser Thr Leu Ser Ala Pro Ile Gln Gln Val Asn Ala 420 425 430 Ala Thr Gln Asn Ser Lys Tyr Leu Asp Gly Glu Ile Leu Asn Gly Ile 435 440 445 Gly Ala Ser Leu Pro Gly Tyr Cys Thr Thr Gly Cys Ser Pro Thr Glu 450 455 460 Pro Pro Phe Ser Cys Thr Ser Thr Ala Asn Gly Tyr Lys Ala Ser Cys 465 470 475 480 Asn Pro Ser Asp Thr Asn Gln Lys Ile Asn Ala Leu Tyr Pro Phe Thr 485 490 495 Gln Ala Asn Val Lys Gly Asn Thr Gly Lys Leu Gly Val Leu Ala Ser 500 505 510 Leu Val Ser Tyr Asp Leu Asn Pro Lys Asn Val Phe Gly Glu Leu Asp 515 520 525 Ser Asp Thr Asn Asn Val Ile Leu Lys Gly Ile Pro Ala Glu Lys Gly 530 535 540 Tyr Phe Pro Asn Asn Ala Arg Pro Thr Val Val Lys Glu Trp Ile Asn 545 550 555 560 Gly Ala Ser Ala Val Pro Leu Asp Ser Gly Asn Thr Leu Phe Met Thr 565 570 575 Ala Thr Asn Leu Thr Ala Thr Gln Tyr Arg Ile Arg Ile Arg Tyr Ala 580 585 590 Asn Pro Asn Ser Asn Thr Gln Ile Gly Val Arg Ile Thr Gln Asn Gly 595 600 605 Ser Leu Ile Ser Ser Ser Asn Leu Thr Leu Tyr Ser Thr Thr Asp Met 610 615 620 Asn Asn Thr Leu Pro Leu Asn Val Tyr Val Ile Gly Glu Asn Gly Asn 625 630 635 640 Tyr Thr Leu Gln Asp Leu Tyr Asn Thr Thr Asn Val Leu Ser Thr Gly 645 650 655 Asp Ile Thr Leu Gln Ile Thr Gly Gly Asp Gln Lys Ile Phe Ile Asp 660 665 670 Arg Ile Glu Phe Val Pro Thr Met Pro Val Pro Gly Asn 675 680 685
<210> SEQ ID NO: 9 <211> Comprimento: 2148 <212> Tipo: DNA
<213> Organismo: Seqüência Artificial <220> Características:
<223> Outras Informações: synaxmi-031(apo)
<221> Nome/Chave: CDS
<222> Localização: (1) . . . (2148) <400> Seqüência: 9
atg ggg tac tcc age ttc gtt gct ate gct ctt ctt atg age gtg gtt
Met Gly Tyr Ser Ser Phe Val Ala Ile Ala Leu Leu Met Ser Val Val
1 5 10 15
gtt gtt tgc aat ggg ggc aag acg tcc acc tac gtg cgt aat ctg gat
Val Val Cys Asn Gly Gly Lys Thr Ser Thr Tyr Val Arg Asn Leu Asp
20 25 30
tgc aat ctc cag age cag cag aat ate cca tac aat gtg ctt gct ate
Cys Asn Leu Gln Ser Gln Gln Asn Ile Pro Tyr Asn Val Leu Ala Ile
35 40 45
cct gtt age aat gtt aat age ctt acg gat acg gtt ggc gat cta aag
Pro Val Ser Asn Val Asn Ser Leu Thr Asp Thr Val Gly Asp Leu Lys
50 55 60
aag gea tgg gaa gag ttc cag aag acg ggc age ttc tcc ctt acc gea
Lys Ala Trp Glu Glu Phe Gln Lys Thr Gly Ser Phe Ser Leu Thr Ala
65 70 75 80
48
96
144
192
240
288
ctc cag cag ggc ttc age gct tcc cag ggc ggg acg ttc aat tac ctc Leu Gln Gln Gly Phe Ser Ala Ser Gln Gly Gly Thr Phe Asn Tyr Leu 85 90 95
acc ctc ctc cag tcc ggg ate tcc ctg gct ggc age ttc gtg cct ggc 336 Thr Leu Leu Gln Ser Gly Ile Ser Leu Ala Gly Ser Phe Val Pro Gly 100 105 110
ggc acc ttc gtt gct cca ate ate aat atg gtg ate ggc tgg ctc tgg 3 84 Gly Thr Phe Val Ala Pro Ile Ile Asn Met Val Ile Gly Trp Leu Trp 115 120 125
cct cat aag aat aag aat gea gat acg gaa aat ctg ate aat ctg ate Pro His Lys Asn Lys Asn Ala Asp Thr Glu Asn Leu Ile Asn Leu Ile 130 135 140
gat tca gaa ate cag aag cag ctg aat aag gct ctg ctg gat gct gat Asp Ser Glu Ile Gln Lys Gln Leu Asn Lys Ala Leu Leu Asp Ala Asp 145 150 155 160
cgc aat gaa tgg age age tac ctc gag tcc ate ttc gat age age aat Arg Asn Glu Trp Ser Ser Tyr Leu Glu Ser Ile Phe Asp Ser Ser Asn 165 170 175
aat ctg aat ggc gea ate gtt gat gct cag tgg tcc ggc acc gtg aat 576 Asn Leu Asn Gly Ala Ile Val Asp Ala Gln Trp Ser Gly Thr Val Asn 180 185 190
432
480
528
acg acc aat cgt acg ctt cgt aat cct acg gaa tca gat tac acc aat Thr Thr Asn Arg Thr Leu Arg Asn Pro Thr Glu Ser Asp Tyr Thr Asn 195 200 205
gtg gtg acg aat ttc ate gea gea gat ggg gat ate gct aat aat gaa Val Val Thr Asn Phe Ile Ala Ala Asp Gly Asp Ile Ala Asn Asn Glu 210 215 220
624
672 aat cat ate atg aat ggg aat ttc gat gtg gea gea gct cca tac ttc Asn His Ile Met Asn Gly Asn Phe Asp Val Ala Ala Ala Pro Tyr Phe
230 235 240
225
720
768
816
864
912
960
1008
1056
gtt ate ggg gct acc gct aga ttc gea gct atg cag tcc tac ate aag Val Ile Gly Ala Thr Ala Arg Phe Ala Ala Met Gln Ser Tyr Ile Lys 245 250 255
ttc tgc aat gea tgg ate gat aag gtt ggg ctg tca gat gct cag ctg Phe Cys Asn Ala Trp Ile Asp Lys Val Gly Leu Ser Asp Ala Gln Leu 260 265 270
acc acg cag aag gct aat ctg gat aga acg aag cag aat atg cgt aat Thr Thr Gln Lys Ala Asn Leu Asp Arg Thr Lys Gln Asn Met Arg Asn 275 280 285
gct ate ctt aat tac acc cag cag gtt atg aag gtt ttc aag gat tcc Ala Ile Leu Asn Tyr Thr Gln Gln Val Met Lys Val Phe Lys Asp Ser 290 295 300
aag aat atg cca acg ate ggc acg aat aag ttc age gtt gat acc tac Lys Asn Met Pro Thr Ile Gly Thr Asn Lys Phe Ser Val Asp Thr Tyr 305 310 315 320
aat gtt tac ate aag ggg atg acg ctt aat gtg ctt gat ate gtt gct Asn Val Tyr Ile Lys Gly Met Thr Leu Asn Val Leu Asp Ile Val Ala 325 330 335
ate tgg cca age ctg tac cca gat gat tac acg tca cag acg gct ctg Ile Trp Pro Ser Leu Tyr Pro Asp Asp Tyr Thr Ser Gln Thr Ala Leu 340 345 350
gaa cag acc cgc gtg acg ttc tcc aat atg gtg ggg cag gaa gaa ggc 1104 Glu Gln Thr Arg Val Thr Phe Ser Asn Met Val Gly Gln Glu Glu Gly 355 360 365
acg gat ggc age ctc aga ate tac aat acc ttc gat age ttc tcc tac 1152 Thr Asp Gly Ser Leu Arg Ile Tyr Asn Thr Phe Asp Ser Phe Ser Tyr 370 375 380
cag cat age cct ate cct aat aat aat gtg aat ctc ate age tac tac 1200 Gln His Ser Pro Ile Pro Asn Asn Asn Val Asn Leu Ile Ser Tyr Tyr 385 390 395 400
aat gat gaa ctt cag aat ctg gaa ctc ggg gtt tac acc cca cca aag Asn Asp Glu Leu Gln Asn Leu Glu Leu Gly Val Tyr Thr Pro Pro Lys 405 410 415
aag ggc tca ggc tac age tac cca tac ggg ttc gtg ctg aat tac gea 1296 Lys Gly Ser Gly Tyr Ser Tyr Pro Tyr Gly Phe Val Leu Asn Tyr Ala 420 425 430
aat age aag tac aag tac ggc gat tcc aat gat cca gaa tcc ctc ggc 1344 Asn Ser Lys Tyr Lys Tyr Gly Asp Ser Asn Asp Pro Glu Ser Leu Gly 435 440 445
1248 ggg ctt tcc acc ctt age gct cca ate caa cag gtt aat gct gct acc 1392
Gly Leu Ser Thr Leu Ser Ala Pro Ile Gln Gln Val Asn Ala Ala Thr 450 455 460
cag aat age aag tac ctt gat ggc gaa ate ctg aat ggg ate ggc gea
Gln Asn Ser Lys Tyr Leu Asp Gly Glu Ile Leu Asn Gly Ile Gly Ala
465 470 475 480
age ctg cct ggc tac tgc acg acc ggg tgc tca cct acc gaa cca cca
Ser Leu Pro Gly Tyr Cys Thr Thr Gly Cys Ser Pro Thr Glu Pro Pro 485 490 495
ttc age tgc acg age acg gea aat ggg tac aag gea age tgc aat cca 153 6 Phe Ser Cys Thr Ser Thr Ala Asn Gly Tyr Lys Ala Ser Cys Asn Pro 500 505 510
age gat acc aat cag aag ate aat gct ctc tac cca ttc acg cag gea Ser Asp Thr Asn Gln Lys Ile Asn Ala Leu Tyr Pro Phe Thr Gln Ala 515 520 525
1440
1488
1584
aat gtg aag ggg aat acc ggg aag ctg ggc gtt ctc gea age ctt gtt 1632 Asn Val Lys Gly Asn Thr Gly Lys Leu Gly Val Leu Ala Ser Leu Val 530 535 540
age tac gat ctg aat cct aag aat gtt ttc ggg gaa ctc gat tca gat 1680 Ser Tyr Asp Leu Asn Pro Lys Asn Val Phe Gly Glu Leu Asp Ser Asp 545 550 555 560
acc aat aat gtt ate ctt aag ggc ate cca gea gaa aag ggc tac ttc Thr Asn Asn Val Ile Leu Lys Gly Ile Pro Ala Glu Lys Gly Tyr Phe 565 570 575
cca aat aat gea aga cca acc gtt gtg aag gaa tgg ate aat ggg gct 177 6 Pro Asn Asn Ala Arg Pro Thr Val Val Lys Glu Trp Ile Asn Gly Ala 580 585 590
1728
tcc gea gtt cca ctt gat tcc ggc aat acc ctg ttc atg acg gct acg Ser Ala Val Pro Leu Asp Ser Gly Asn Thr Leu Phe Met Thr Ala Thr 595 600 605
aac ctg acg gct acc cag tac aga ate cgc ate cgt tac gct aac cca Asn Leu Thr Ala Thr Gln Tyr Arg Ile Arg Ile Arg Tyr Ala Asn Pro 610 615 620
aac tca aac acg cag ate ggc gtt aga ate acg cag aac ggg age ctc Asn Ser Asn Thr Gln Ile Gly Val Arg Ile Thr Gln Asn Gly Ser Leu 625 630 635 640
ate tcc tcc tcc aac ctc acg ctg tac tca acc acc gat atg aac aac Ile Ser Ser Ser Asn Leu Thr Leu Tyr Ser Thr Thr Asp Met Asn Asn 645 650 655
acc ctg cca ctg aac gtt tac gtg ate ggg gaa aac ggg aac tac acc Thr Leu Pro Leu Asn Val Tyr Val Ile Gly Glu Asn Gly Asn Tyr Thr 660 665 670
1824
1872
1920
1968
2016 ctc cag gat ctc tac aac Leu Gln Asp Leu Tyr Asn 675
acc ctg cag ate acc ggc Thr Leu Gln Ile Thr Gly 690
gag ttc gtg cct acg atg Glu Phe Val Pro Thr Met 705 710
acg acg aac gtt ctg tcc Thr Thr Asn Val Leu Ser 680
ggg gat cag aag ata ttc Gly Asp Gln Lys Ile Phe 695 700
cca gtg cca ggc aac taa Pro Val Pro Gly Asn * 715
acg ggc gat ate 2 064
Thr Gly Asp Ile
685
ate gat cgc ate 2112 Ile Asp Arg Ile
2148
<210> SEQ ID NO: 10 <211> Comprimento: 715 <212> Tipo: PRT
<213> Organismo: Seqüência Artificial <220> Características:
<223> Outras Informações: SYNAXMI-031(APO)
<400> Seqüência: 10
Met Gly Tyr Ser Ser Phe Val Ala Ile Ala Leu Leu Met Ser Val Val 1 5 10 15 Val Val Cys Asn Gly Gly Lys Thr Ser Thr Tyr Val Arg Asn Leu Asp 20 25 30 Cys Asn Leu Gln Ser Gln Gln Asn Ile Pro Tyr Asn Val Leu Ala Ile 35 40 45 Pro Val Ser Asn Val Asn Ser Leu Thr Asp Thr Val Gly Asp Leu Lys 50 55 60 Lys Ala Trp Glu Glu Phe Gln Lys Thr Gly Ser Phe Ser Leu Thr Ala 65 70 75 80 Leu Gln Gln Gly Phe Ser Ala Ser Gln Gly Gly Thr Phe Asn Tyr Leu 85 90 95 Thr Leu Leu Gln Ser Gly Ile Ser Leu Ala Gly Ser Phe Val Pro Gly 100 105 110 Gly Thr Phe Val Ala Pro Ile Ile Asn Met Val Ile Gly Trp Leu Trp 115 120 125 Pro His Lys Asn Lys Asn Ala Asp Thr Glu Asn Leu Ile Asn Leu Ile 130 135 140 Asp Ser Glu Ile Gln Lys Gln Leu Asn Lys Ala Leu Leu Asp Ala Asp 145 150 155 160 Arg Asn Glu Trp Ser Ser Tyr Leu Glu Ser Ile Phe Asp Ser Ser Asn 165 170 175 Asn Leu Asn Gly Ala Ile Val Asp Ala Gln Trp Ser Gly Thr Val Asn 180 185 190 Thr Thr Asn Arg Thr Leu Arg Asn Pro Thr Glu Ser Asp Tyr Thr Asn 195 200 205 Val Val Thr Asn Phe Ile Ala Ala Asp Gly Asp Ile Ala Asn Asn Glu 210 215 220 Asn His Ile Met Asn Gly Asn Phe Asp Val Ala Ala Ala Pro Tyr Phe 225 230 235 240 Val Ile Gly Ala Thr Ala Arg Phe Ala Ala Met Gln Ser Tyr Ile Lys 245 250 255 Phe Cys Asn Ala Trp Ile Asp Lys Val Gly Leu Ser Asp Ala Gln Leu 260 265 270 Thr Thr Gln Lys Ala Asn Leu Asp Arg Thr Lys Gln Asn Met Arg Asn 275 280 285
Ala Ile Leu Asn Tyr Thr Gln Gln Val Met Lys Val Phe Lys Asp Ser
290 295 300
Lys Asn Met Pro Thr Ile Gly Thr Asn Lys Phe Ser Val Asp Thr Tyr 305 310 315 320
Asn Val Tyr Ile Lys Gly Met Thr Leu Asn Val Leu Asp Ile Val Ala
325 330 335
Ile Trp Pro Ser Leu Tyr Pro Asp Asp Tyr Thr Ser Gln Thr Ala Leu
340 345 350
Glu Gln Thr Arg Val Thr Phe Ser Asn Met Val Gly Gln Glu Glu Gly
355 360 365
Thr Asp Gly Ser Leu Arg Ile Tyr Asn Thr Phe Asp Ser Phe Ser Tyr
370 375 380
Gln His Ser Pro Ile Pro Asn Asn Asn Val Asn Leu Ile Ser Tyr Tyr 385 390 395 400
Asn Asp Glu Leu Gln Asn Leu Glu Leu Gly Val Tyr Thr Pro Pro Lys
405 410 415
Lys Gly Ser Gly Tyr Ser Tyr Pro Tyr Gly Phe Val Leu Asn Tyr Ala
420 425 430
Asn Ser Lys Tyr Lys Tyr Gly Asp Ser Asn Asp Pro Glu Ser Leu Gly
435 440 445
Gly Leu Ser Thr Leu Ser Ala Pro Ile Gln Gln Val Asn Ala Ala Thr
450 455 460
Gln Asn Ser Lys Tyr Leu Asp Gly Glu Ile Leu Asn Gly Ile Gly Ala 465 470 475 480
Ser Leu Pro Gly Tyr Cys Thr Thr Gly Cys Ser Pro Thr Glu Pro Pro
485 490 495
Phe Ser Cys Thr Ser Thr Ala Asn Gly Tyr Lys Ala Ser Cys Asn Pro
500 505 510
Ser Asp Thr Asn Gln Lys Ile Asn Ala Leu Tyr Pro Phe Thr Gln Ala
515 520 525
Asn Val Lys Gly Asn Thr Gly Lys Leu Gly Val Leu Ala Ser Leu Val
530 535 540
Ser Tyr Asp Leu Asn Pro Lys Asn Val Phe Gly Glu Leu Asp Ser Asp 545 550 555 560
Thr Asn Asn Val Ile Leu Lys Gly Ile Pro Ala Glu Lys Gly Tyr Phe
565 570 575
Pro Asn Asn Ala Arg Pro Thr Val Val Lys Glu Trp Ile Asn Gly Ala
580 585 590
Ser Ala Val Pro Leu Asp Ser Gly Asn Thr Leu Phe Met Thr Ala Thr
595 600 605
Asn Leu Thr Ala Thr Gln Tyr Arg Ile Arg Ile Arg Tyr Ala Asn Pro
610 615 620
Asn Ser Asn Thr Gln Ile Gly Val Arg Ile Thr Gln Asn Gly Ser Leu 625 630 635 640
Ile Ser Ser Ser Asn Leu Thr Leu Tyr Ser Thr Thr Asp Met Asn Asn
645 650 655
Thr Leu Pro Leu Asn Val Tyr Val Ile Gly Glu Asn Gly Asn Tyr Thr
660 665 670
Leu Gln Asp Leu Tyr Asn Thr Thr Asn Val Leu Ser Thr Gly Asp Ile
675 680 685
Thr Leu Gln Ile Thr Gly Gly Asp Gln Lys Ile Phe Ile Asp Arg Ile
690 695 700
Glu Phe Val Pro Thr Met Pro Val Pro Gly Asn 705 710 715 <210> SEQ ID NO: 11 <211> Comprimento: 2160 <212> Tipo: DNA
<213> Organismo: Seqüência Artificial <220> Características:
<223> Outras Informações: synaxmi-031(ER)
<221> Nome/Chave: CDS
<222> Localização: (1)...(2160)
<400> Seqüência: 11
atg ggg tac tcc age ttc gtt gct ate gct ctt ctt atg age gtg gtt Met Gly Tyr Ser Ser Phe Val Ala Ile Ala Leu Leu Met Ser Val Val 15 10 15
gtt gtt tgc aat ggg ggc aag acg tcc acc tac gtg cgt aat ctg gat Val Val Cys Asn Gly Gly Lys Thr Ser Thr Tyr Val Arg Asn Leu Asp 20 25 30
tgc aat ctc cag age cag cag aat ate cca tac aat gtg ctt gct ate Cys Asn Leu Gln Ser Gln Gln Asn Ile Pro Tyr Asn Val Leu Ala Ile 35 40 45
cet gtt age aat gtt aat age ctt acg gat acg gtt ggc gat cta aag Pro Val Ser Asn Val Asn Ser Leu Thr Asp Thr Val Gly Asp Leu Lys 50 55 60
aag gea tgg gaa gag ttc cag aag acg ggc age ttc tcc ctt acc gea Lys Ala Trp Glu Glu Phe Gln Lys Thr Gly Ser Phe Ser Leu Thr Ala 65 70 75 80
ctc cag cag ggc ttc age gct tcc cag ggc ggg acg ttc aat tac ctc Leu Gln Gln Gly Phe Ser Ala Ser Gln Gly Gly Thr Phe Asn Tyr Leu 85 90 95
acc ctc ctc cag tcc ggg ate tcc ctg gct ggc age ttc gtg cet ggc Thr Leu Leu Gln Ser Gly Ile Ser Leu Ala Gly Ser Phe Val Pro Gly 100 105 HO
ggc acc ttc gtt gct cca ate ate aat atg gtg ate ggc tgg ctc tgg Gly Thr Phe Val Ala Pro Ile Ile Asn Met Val Ile Gly Trp Leu Trp 115 120 125
cet cat aag aat aag aat gea gat acg gaa aat ctg ate aat ctg ate Pro His Lys Asn Lys Asn Ala Asp Thr Glu Asn Leu Ile Asn Leu Ile 130 135 140
gat tca gaa ate cag aag cag ctg aat aag gct ctg ctg gat gct gat Asp Ser Glu Ile Gln Lys Gln Leu Asn Lys Ala Leu Leu Asp Ala Asp 145 150 155 160
cgc aat gaa tgg age age tac ctc gag tcc ate ttc gat age age aat Arg Asn Glu Trp Ser Ser Tyr Leu Glu Ser Ile Phe Asp Ser Ser Asn 165 170 175
48
96
144
192
240
288
336
384
432
480
528 aat ctg aat ggc gca ate gtt gat gct cag tgg tcc ggc acc gtg aat 57 6 Asn Leu Asn Gly Ala Ile Val Asp Ala Gln Trp Ser Gly Thr Val Asn 180 185 190
acg acc aat cgt acg ctt cgt aat cct acg gaa tca gat tac acc aat 624 Thr Thr Asn Arg Thr Leu Arg Asn Pro Thr Glu Ser Asp Tyr Thr Asn 195 200 205
gtg gtg acg aat ttc ate gca gca gat ggg gat ate gct aat aat gaa Val Val Thr Asn Phe Ile Ala Ala Asp Gly Asp Ile Ala Asn Asn Glu 210 215 220
aat cat ate atg aat ggg aat ttc gat gtg gca gca gct cca tac ttc Asn His Ile Met Asn Gly Asn Phe Asp Val Ala Ala Ala Pro Tyr Phe 225 230 235 240
gtt ate ggg gct acc gct aga ttc gca gct atg cag tcc tac ate aag Val Ile Gly Ala Thr Ala Arg Phe Ala Ala Met Gln Ser Tyr Ile Lys 245 250 255
ttc tgc aat gca tgg ate gat aag gtt ggg ctg tca gat gct cag ctg Phe Cys Asn Ala Trp Ile Asp Lys Val Gly Leu Ser Asp Ala Gln Leu 260 265 270
acc acg cag aag gct aat ctg gat aga acg aag cag aat atg cgt aat Thr Thr Gln Lys Ala Asn Leu Asp Arg Thr Lys Gln Asn Met Arg Asn 275 280 285
gct ate ctt aat tac acc cag cag gtt atg aag gtt ttc aag gat tcc Ala Ile Leu Asn Tyr Thr Gln Gln Val Met Lys Val Phe Lys Asp Ser 290 295 300
aag aat atg cca acg ate ggc acg aat aag ttc age gtt gat acc tac Lys Asn Met Pro Thr Ile Gly Thr Asn Lys Phe Ser Val Asp Thr Tyr 305 310 315 320
aat gtt tac ate aag ggg atg acg ctt aat gtg ctt gat ate gtt gct Asn Val Tyr Ile Lys Gly Met Thr Leu Asn Val Leu Asp Ile Val Ala 325 330 335
ate tgg cca age ctg tac cca gat gat tac acg tca cag acg gct ctg Ile Trp Pro Ser Leu Tyr Pro Asp Asp Tyr Thr Ser Gln Thr Ala Leu 340 345 350
gaa cag acc cgc gtg acg ttc tcc aat atg gtg ggg cag gaa gaa ggc Glu Gln Thr Arg Val Thr Phe Ser Asn Met Val Gly Gln Glu Glu Gly 355 360 365
acg gat ggc age ctc aga ate tac aat acc ttc gat age ttc tcc tac 1152 Thr Asp Gly Ser Leu Arg Ile Tyr Asn Thr Phe Asp Ser Phe Ser Tyr 370 375 380
672
720
768
816
864
912
960
1008
1056
1104
cag cat age cct ate cct aat aat aat gtg aat ctc ate age tac tac Gln His Ser Pro Ile Pro Asn Asn Asn Val Asn Leu Ile Ser Tyr Tyr 385 390 395 400
1200 aat gat Asn Asp
aag ggc Lys Gly
aat age Asn Ser
ggg ctt Gly Leu 450
cag aat Gln Asn 465
age ctg Ser Leu
ttc age Phe Ser
age gat Ser Asp
aat gtg Asn Val 530
age tac Ser Tyr 545
acc aat Thr Asn
cca aat Pro Asn
tcc gea Ser Ala
aac ctg Asn Leu 610
gaa ctt Glu Leu
tca ggc Ser Gly 420
aag tac Lys Tyr 435
tcc acc Ser Thr
age aag Ser Lys
cct ggc Pro Gly
tgc acg Cys Thr 500
acc aat Thr Asn 515
aag ggg Lys Gly
gat ctg Asp Leu
aat gtt Asn Val
aat gea Asn Ala 580
gtt cca Val Pro 595
acg gct Thr Ala
cag aat Gln Asn 405
tac age Tyr Ser
aag tac Lys Tyr
ctt age Leu Ser
tac ctt Tyr Leu 470
tac tgc Tyr Cys 485
age acg Ser Thr
cag aag Gln Lys
aat acc Asn Thr
aat cct Asn Pro 550
ate ctt Ile Leu 565
aga cca Arg Pro
ctt gat Leu Asp
acc cag Thr Gln
ctg gaa Leu Glu
tac cca Tyr Pro
ggc gat Gly Asp 440
gct cca Ala Pro 455
gat ggc Asp Gly
acg acc Thr Thr
gea aat Ala Asn
ate aat Ile Asn 520
ggg aag Gly Lys 535
aag aat Lys Asn
aag ggc Lys Gly
acc gtt Thr Val
tcc ggc Ser Gly 600
tac aga Tyr Arg 615
ctc ggg Leu Gly 410
tac ggg Tyr Gly 425
tcc aat Ser Asn
ate caa Ile Gln
gaa ate Glu Ile
ggg tgc Gly Cys 490
ggg tac Gly Tyr 505
gct ctc Ala Leu
ctg ggc Leu Gly
gtt ttc Val Phe
ate cca Ile Pro 570
gtg aag Val Lys 585
aat acc Asn Thr
ate cgc Ile Arg
gtt tac Val Tyr
ttc gtg Phe Val
gat cca Asp Pro
cag gtt Gln Val 460
ctg aat Leu Asn 475
tca cct Ser Pro
aag gea Lys Ala
tac cca Tyr Pro
gtt ctc Val Leu 540
ggg gaa Gly Glu 555
gea gaa Ala Glu
gaa tgg Glu Trp
ctg ttc Leu Phe
ate cgt Ile Arg 620
acc cca Thr Pro
ctg aat Leu Asn 430
gaa tcc Glu Ser 445
aat gct Asn Ala
ggg ate Gly Ile
acc gaa Thr Glu
age tgc Ser Cys 510
ttc acg Phe Thr 525
gea age Ala Ser
ctc gat Leu Asp
aag ggc Lys Gly
ate aat Ile Asn 590
atg acg Met Thr 605
tac gct Tyr Ala
cca aag Pro Lys 415
tac gea Tyr Ala
ctc ggc Leu Gly
gct acc Ala Thr
ggc gea Gly Ala 480
cca cca Pro Pro 495
aat cca Asn Pro
cag gea Gln Ala
ctt gtt Leu Val
tca gat Ser Asp 560
tac ttc Tyr Phe 575
ggg gct Gly Ala
gct acg Ala Thr
aac cca Asn Pro
1248
1296
1344
1392
1440
1488
1536
1584
1632
1680
1728
1776
1824
1872 aac tca aac acg cag ate ggc gtt aga Asn Ser Asn Thr Gln Ile Gly Val Arg 625 630
ate tcc tcc tcc aac ctc acg ctg tac
Ile Ser Ser Ser Asn Leu Thr Leu Tyr 645
acc ctg cca ctg aac gtt tac gtg ate
Thr Leu Pro Leu Asn Val Tyr Val Ile
660 665
ctc cag gat ctc tac aac acg acg aac Leu Gln Asp Leu Tyr Asn Thr Thr Asn 675 680
acc ctg cag ate acc ggc ggg gat cag Thr Leu Gln Ile Thr Gly Gly Asp Gln 690 695
gag ttc gtg cct acg atg cca gtg cca Glu Phe Val Pro Thr Met Pro Val Pro 705 710
ate acg cag aac ggg age ctc 1920 Ile Thr Gln Asn Gly Ser Leu 635 640
tca acc acc gat atg aac aac 1968 Ser Thr Thr Asp Met Asn Asn 650 655
ggg gaa aac ggg aac tac acc 2016 Gly Glu Asn Gly Asn Tyr Thr 670
gtt ctg tcc acg ggc gat ate 2064 Val Leu Ser Thr Gly Asp Ile 685
aag ata ttc ate gat cgc ate 2112 Lys Ile Phe Ile Asp Arg Ile 700
ggc aac aag gat gaa ctg taa 2160 Gly Asn Lys Asp Glu Leu * 715
<210> SEQ ID NO: 12 <211> Comprimento: 719 <212> Tipo: PRT
<213> Organismo: Seqüência Artificial <220> Características:
<223> Outras Informações: SYNAXMI-031(ER) <400> Seqüência: 12
Met Gly Tyr Ser Ser Phe Val Ala Ile Ala Leu Leu Met Ser Val Val
15 10 15
Val Val Cys Asn Gly Gly Lys Thr Ser Thr Tyr Val Arg Asn Leu Asp
20 25 30
Cys Asn Leu Gln Ser Gln Gln Asn Ile Pro Tyr Asn Val Leu Ala Ile
35 40 45
Pro Val Ser Asn Val Asn Ser Leu Thr Asp Thr Val Gly Asp Leu Lys
50 55 60
Lys Ala Trp Glu Glu Phe Gln Lys Thr Gly Ser Phe Ser Leu Thr Ala 65 70 75 80
Leu Gln Gln Gly Phe Ser Ala Ser Gln Gly Gly Thr Phe Asn Tyr Leu
85 90 95
Thr Leu Leu Gln Ser Gly Ile Ser Leu Ala Gly Ser Phe Val Pro Gly
100 105 HO
Gly Thr Phe Val Ala Pro Ile Ile Asn Met Val Ile Gly Trp Leu Trp
115 120 125
Pro His Lys Asn Lys Asn Ala Asp Thr Glu Asn Leu Ile Asn Leu Ile
130 135 140
Asp Ser Glu Ile Gln Lys Gln Leu Asn Lys Ala Leu Leu Asp Ala Asp 145 150 155 160
Arg Asn Glu Trp Ser Ser Tyr Leu Glu Ser Ile Phe Asp Ser Ser Asn 165 170 175 Asn Leu Asn Gly 180
Thr Thr Asn Arg 195
Val Val Thr Asn 210
Asn His Ile Met 225
Val Ile Gly Ala
Phe Cys Asn Ala 260
Thr Thr Gln Lys 275
Ala Ile Leu Asn 290
Lys Asn Met Pro 305
Asn Val Tyr Ile
Ile Trp Pro Ser 340
Glu Gln Thr Arg 355
Thr Asp Gly Ser 370
Gln His Ser Pro 385
Asn Asp Glu Leu
Lys Gly Ser Gly 420
Asn Ser Lys Tyr 435
Gly Leu Ser Thr 450
Gln Asn Ser Lys 465
Ser Leu Pro Gly
Phe Ser Cys Thr 500
Ser Asp Thr Asn 515
Asn Val Lys Gly 530
Ser Tyr Asp Leu 545
Thr Asn Asn Val
Pro Asn Asn Ala 580
Ser Ala Val Pro 595
Asn Leu Thr Ala 610
Ala Ile Val Asp
Thr Leu Arg Asn 200
Phe Ile Ala Ala 215
Asn Gly Asn Phe 230
Thr Ala Arg Phe 245
Trp Ile Asp Lys
Ala Asn Leu Asp 280
Tyr Thr Gln Gln 295
Thr Ile Gly Thr 310
Lys Gly Met Thr 325
Leu Tyr Pro Asp
Val Thr Phe Ser 360
Leu Arg Ile Tyr 375
Ile Pro Asn Asn 390
Gln Asn Leu Glu 405
Tyr Ser Tyr Pro
Lys Tyr Gly Asp 440
Leu Ser Ala Pro 455
Tyr Leu Asp Gly 470
Tyr Cys Thr Thr 485
Ser Thr Ala Asn
Gln Lys Ile Asn 520
Asn Thr Gly Lys 535
Asn Pro Lys Asn 550
Ile Leu Lys Gly 565
Arg Pro Thr Val
Leu Asp Ser Gly 600
Thr Gln Tyr Arg 615
Ala Gln Trp Ser 185
Pro Thr Glu Ser
Asp Gly Asp Ile 220
Asp Val Ala Ala 235
Ala Ala Met Gln 250
Val Gly Leu Ser 265
Arg Thr Lys Gln
Val Met Lys Val 300
Asn Lys Phe Ser 315
Leu Asn Val Leu 330
Asp Tyr Thr Ser 345
Asn Met Val Gly
Asn Thr Phe Asp 380
Asn Val Asn Leu 395
Leu Gly Val Tyr 410
Tyr Gly Phe Val 425
Ser Asn Asp Pro
Ile Gln Gln Val 460
Glu Ile Leu Asn 475
Gly Cys Ser Pro 490
Gly Tyr Lys Ala 505
Ala Leu Tyr Pro
Leu Gly Val Leu 540
Val Phe Gly Glu 555
Ile Pro Ala Glu 570
Val Lys Glu Trp 585
Asn Thr Leu Phe
Ile Arg Ile Arg 620
Gly Thr Val Asn 190
Asp Tyr Thr Asn 205
Ala Asn Asn Glu
Ala Pro Tyr Phe 240
Ser Tyr Ile Lys 255
Asp Ala Gln Leu 270
Asn Met Arg Asn 285
Phe Lys Asp Ser
Val Asp Thr Tyr 320
Asp Ile Val Ala 335
Gln Thr Ala Leu 350
Gln Glu Glu Gly 365
Ser Phe Ser Tyr
Ile Ser Tyr Tyr 400
Thr Pro Pro Lys 415
Leu Asn Tyr Ala 430
Glu Ser Leu Gly 445
Asn Ala Ala Thr
Gly Ile Gly Ala 480
Thr Glu Pro Pro 495
Ser Cys Asn Pro 510
Phe Thr Gln Ala 525
Ala Ser Leu Val
Leu Asp Ser Asp 560
Lys Gly Tyr Phe 575
Ile Asn Gly Ala 590
Met Thr Ala Thr 605
Tyr Ala Asn Pro Asn Ser Asn Thr Gln Ile Gly Val Arg Ile Thr Gln Asn Gly Ser Leu 625 630 635 640 Ile Ser Ser Ser Asn Leu Thr Leu Tyr Ser Thr Thr Asp Met Asn Asn 645 650 655 Thr Leu Pro Leu Asn Val Tyr Val Ile Gly Glu Asn Gly Asn Tyr Thr 660 665 670 Leu Gln Asp Leu Tyr Asn Thr Thr Asn Val Leu Ser Thr Gly Asp Ile 675 680 685 Thr Leu Gln Ile Thr Gly Gly Asp Gln Lys Ile Phe Ile Asp Arg Ile 690 695 700 Glu Phe Val Pro Thr Met Pro Val Pro Gly Asn Lys Asp Glu Leu 705 710 715
<210> SEQ ID NO: 13 <211> Comprimento: 1186 <212> Tipo: PRT
<213> Organismo: Bacillus thuringiensis
<400> Seqüência: 13 Met Asp Cys Asn Leu Gln Ser Gln Gln Asn Ile Pro Tyr Asn Val Leu 1 5 10 15 Ala Ile Pro Val Ser Asn Val Asn Ala Leu Val Asp Thr Ala Gly Asp 20 25 30 Leu Lys Lys Ala Trp Glu Glu Phe Gln Lys Thr Gly Ser Phe Ser Leu 35 40 45 Thr Ala Leu Gln Gln Gly Phe Ser Ala Ser Gln Gly Gly Ala Phe Asn 50 55 60 Tyr Leu Thr Leu Leu Gln Ser Gly Ile Ser Leu Ala Gly Ser Phe Val 65 70 75 80 Pro Gly Gly Thr Phe Val Ala Pro Ile Val Asn Met Val Ile Gly Trp 85 90 95 Leu Trp Pro His Lys Asn Lys Thr Ala Asp Thr Glu Asn Leu Ile Lys 100 105 110 Leu Ile Asp Glu Glu Ile Gln Lys Gln Leu Asn Lys Ala Leu Leu Asp 115 120 125 Gln Asp Arg Asn Asn Trp Thr Ser Phe Leu Glu Ser Ile Phe Asp Thr 130 135 140 Ser Ala Thr Val Ser Asn Ala Ile Ile Asp Ala Gln Trp Ser Gly Thr 145 150 155 160 Val Asp Thr Thr Asn Arg Gln Gln Lys Thr Pro Thr Thr Ser Asp Tyr 165 170 175 Leu Asn Val Val Gly Lys Phe Asp Ser Ala Asp Ser Ser Ile Ile Thr 180 185 190 Asn Glu Asn Gln Ile Met Asn Gly Asn Phe Asp Val Ala Ala Ala Pro 195 200 205 Tyr Phe Val Ile Gly Ala Thr Leu Arg Leu Ser Leu Tyr Gln Ser Tyr 210 215 220 Ile Lys Phe Cys Asn Ser Trp Ile Asp Ala Val Gly Phe Ser Thr Asn 225 230 235 240 Asp Ala Asn Thr Gln Lys Ala Asn Leu Ala Arg Thr Lys Leu Thr Met 245 250 255 Arg Thr Thr Ile Asn Glu Tyr Thr Gln Arg Val Met Lys Val Phe Lys 260 265 270 Asp Ser Lys Asn Met Pro Thr Ile Gly Thr Asn Lys Phe Ser Val Asp 275 280 285 Ala Tyr Asn Val Tyr Val Lys Gly Met Thr Leu Asn Val Leu Asp Met
290 295 300
Val Ala Ile Trp Ser Ser Leu Tyr Pro Asn Asp Tyr Thr Ser Gln Thr 305 310 315 320
Ala Ile Glu Gln Thr Arg Val Thr Phe Ser Asn Met Val Gly Gln Glu
325 330 335
Glu Gly Thr Asp Gly Thr Leu Lys Ile Tyr Asn Thr Phe Asp Ser Leu
340 345 350
Ser Tyr Gln His Ser Leu Ile Pro Asn Asn Asn Val Asn Leu Ile Ser
355 360 365
Tyr Tyr Thr Asp Glu Leu Gln Asn Leu Glu Leu Ala Val Tyr Thr Pro
370 375 380
Lys Gly Gly Ser Gly Tyr Ala Tyr Pro Tyr Gly Phe Ile Leu Asn Tyr 385 390 395 400
Ala Asn Ser Asn Tyr Lys Tyr Gly Asp Asn Asp Pro Thr Gly Lys Pro
405 410 415
Leu Asn Lys Gln Asp Gly Pro Ile Gln Gln Ile Asn Ala Ala Thr Gln
420 425 430
Asn Ser Lys Tyr Leu Asp Gly Glu Thr Ile Asn Gly Ile Gly Ala Ser
435 440 445
Leu Pro Gly Tyr Cys Thr Thr Gly Cys Ser Ala Thr Glu Gln Pro Phe
450 455 460
Ser Cys Thr Ser Thr Ala Asn Ser Tyr Lys Ala Ser Cys Asn Pro Ser 465 470 475 480
Asp Thr Asn Gln Lys Ile Asn Ala Leu Tyr Ala Phe Thr Gln Thr Asn
485 490 495
Val Lys Gly Ser Thr Gly Lys Leu Gly Val Leu Ala Ser Leu Val Pro
500 505 510
Tyr Asp Leu Asn Pro Lys Asn Val Phe Gly Glu Leu Asp Ser Asp Thr
515 520 525
Asn Asn Val Ile Leu Lys Gly Ile Pro Ala Glu Lys Gly Tyr Phe Pro
530 535 540
Asn Asn Ala Arg Pro Thr Val Val Lys Glu Trp Ile Asn Gly Ala Ser 545 550 555 560
Ala Val Pro Phe Tyr Ser Gly Asn Thr Leu Phe Met Thr Ala Thr Asn
565 570 575
Leu Thr Ala Thr Gln Tyr Lys Ile Arg Ile Arg Tyr Ala Asn Pro Asn
580 585 590
Ser Asp Thr Gln Ile Gly Val Leu Ile Thr Gln Asn Gly Ser Gln Ile
595 600 605
Ser Asn Ser Asn Leu Thr Leu Tyr Ser Thr Thr Asp Ser Ser Met Ser
610 615 620
Ser Asn Leu Pro Gln Asn Val Tyr Val Thr Gly Glu Asn Gly Asn Tyr 625 630 635 640
Thr Leu Leu Asp Leu Tyr Ser Thr Thr Asn Val Leu Ser Thr Gly Asp
645 650 655
Ile Thr Leu Lys Leu Thr Gly Gly Asn Gln Lys Ile Phe Ile Asp Arg
660 665 670
Ile Glu Phe Ile Pro Thr Met Pro Val Pro Ala Pro Thr Asn Asn Thr
675 680 685
Asn Asn Asn Asn Gly Asp Asn Gly Asn Asn Asn Pro Pro His His Gly
690 695 700
Cys Ala Ile Ala Gly Thr Gln Gln Leu Cys Ser Gly Pro Pro Lys Phe 705 710 715 720
Glu Gln Val Ser Asp Leu Glu Lys Ile Thr Thr Gln Val Tyr Met Leu 725 730 735 Phe Lys Ser Ser Ser Tyr Glu Glu Leu Ala Leu Lys Val Ser Ser Tyr
Gln Ile Asn Gln Val Ala Leu Lys Val Met Ala Leu Ser Asp Glu Lys
Phe Cys Glu Glu Lys Arg Leu Leu Arg Lys Leu Val Asn Lys Ala Asn
Gln Leu Leu Glu Ala Arg Asn Leu Leu Val Gly Gly Asn Phe Glu Thr
Thr Gln Asn Trp Val Leu Gly Thr Asn Ala Tyr Ile Asn Tyr Asp Ser
Phe Leu Phe Asn Gly Asn Tyr Leu Ser Leu Gln Pro Ala Ser Gly Phe
Phe Thr Ser Tyr Ala Tyr Gln Lys Ile Asp Glu Ser Thr Leu Lys Pro
Tyr Thr Arg Tyr Lys Val Ser Gly Phe Ile Gly Gln Ser Asn Gln Val
Glu Leu Ile Ile Ser Arg Tyr Gly Lys Glu Ile Asp Lys Ile Leu Asn
Val Pro Tyr Ala Gly Pro Leu Pro Ile Thr Ala Asp Ala Ser Ile Thr
Cys Cys Ala Pro Glu Ile Asp Gln Cys Asp Gly Gly Gln Ser Asp Ser
His Phe Phe Asn Tyr Ser Ile Asp Val Gly Ala Leu His Pro Glu Leu
Asn Pro Gly Ile Glu Ile Gly Leu Lys Ile Val Gln Ser Asn Gly Tyr
Ile Thr Ile Ser Asn Leu Glu Ile Ile Glu Glu Arg Pro Leu Thr Glu
Met Glu Ile Gln Ala Val Asn Arg Lys Asp Gln Lys Trp Lys Arg Glu
Lys Leu Leu Glu Cys Ala Ser Val Ser Glu Leu Leu Gln Pro Ile Ile
Asn Gln Ile Asp Ser Leu Phe Lys Asp Ala Asn Trp Tyr Asn Asp Ile
Leu Pro His Val Thr Tyr Gln Thr Leu Lys Asn Ile Ile Val Pro Asp
Leu Pro Lys Leu Lys His Trp Phe Ile Asp His Leu Pro Gly Glu Tyr
His Glu Ile Glu Gln Lys Met Lys Glu Ala Leu Lys His Ala Phe Thr
Gln Leu Asp Glu Lys Asn Leu Ile His Asn Gly His Phe Ala Thr Asn
Leu Ile Asp Trp Gln Val Glu Gly Asp Ala Arg Met Lys Val Leu Glu
Asn Asn Ala Leu Ala Leu Gln Leu Ser Asn Trp Asp Ser Ser Val Ser
Gln Ser Ile Asp Ile Leu Glu Phe Asp Glu Asp Lys Ala Tyr Lys Leu
Arg Val Tyr Ala Gln Gly Ser Gly Thr Ile Gln Phe Gly Asn Cys Glu
Asp Glu Ala Ile Gln Phe Asn Thr Asn Ser Phe Val Tyr Lys Glu Lys
Ile Ile Tyr Phe Asp Thr Pro Ser Ile Asn Leu His Ile Gln Ser Glu
Gly Ser Glu Phe Val Val Ser Ser Ile Asp Leu Val Glu Leu Ser Asp Asp Glu 1185
<210> SEQ ID NO: 14 <211> Comprimento: 2190 <212> Tipo: DNA
<213> Organismo: Seqüência Artificial <220> Características:
<223> Outras Informações: axmi-031(truncado)
<221> Nome/Chave: CDS
<222> Localização: (1)...(2190)
<400> Seqüência: 14
atg tcg tac tac cat cac cat cac cat cac ctc gaa tca aca agt ttg
Met Ser Tyr Tyr His His His His His His Leu Glu Ser Thr Ser Leu 15 10 15
tac aaa aaa gca ggc ttc att gaa gga cgt atg gat tgt aat tta caa Tyr Lys Lys Ala Gly Phe Ile Glu Gly Arg Met Asp Cys Asn Leu Gln 20 25 30
tca caa caa aat att cca tat aat gta tta gca ata cca gta tct aat Ser Gln Gln Asn Ile Pro Tyr Asn Val Leu Ala Ile Pro Val Ser Asn 35 40 45
gtt aat tcg ttg act gat aca gtt gga gat tta aaa aaa gca tgg gaa Val Asn Ser Leu Thr Asp Thr Val Gly Asp Leu Lys Lys Ala Trp Glu 50 55 60
gaa ttt caa aaa act ggt tct ttt tca tta aca gct tta caa caa gga Glu Phe Gln Lys Thr Gly Ser Phe Ser Leu Thr Ala Leu Gln Gln Gly 65 70 75 80
ttt tct gct tca caa gga gga aca ttc aat tat tta aca tta cta caa Phe Ser Ala Ser Gln Gly Gly Thr Phe Asn Tyr Leu Thr Leu Leu Gln 85 90 95
tca gga ata tca tta gct ggt tct ttt gtt cct gga ggt act ttt gta Ser Gly Ile Ser Leu Ala Gly Ser Phe Val Pro Gly Gly Thr Phe Val 100 105 HO
gca cct att att aat atg gtt att ggt tgg tta tgg cca cat aaa aac Ala Pro Ile Ile Asn Met Val Ile Gly Trp Leu Trp Pro His Lys Asn 115 120 125
aaa aat gcg gat aca gaa aat tta ata aat tta att gat tca gaa att Lys Asn Ala Asp Thr Glu Asn Leu Ile Asn Leu Ile Asp Ser Glu Ile 130 135 140
caa aaa caa tta aac aaa gct tta tta gat gca gat aga aat gag tgg Gln Lys Gln Leu Asn Lys Ala Leu Leu Asp Ala Asp Arg Asn Glu Trp 145 150 155 160
48
96
144
192
240
288
336
384
432
480 624
672
720
age tet tat tta gaa tet ata ttt gat tet tca aat aac cta aat ggt 528 Ser Ser Tyr Leu Glu Ser Ile Phe Asp Ser Ser Asn Asn Leu Asn Gly 165 170 175
gea att gta gat gea cag tgg tca ggc act gta aat act aca aat aga 576 Ala Ile Val Asp Ala Gln Trp Ser Gly Thr Val Asn Thr Thr Asn Arg 180 185 190
aca cta aga aat cca aca gaa tca gat tat aca aat gtt gtt aca aat Thr Leu Arg Asn Pro Thr Glu Ser Asp Tyr Thr Asn Val Val Thr Asn 195 200 205
ttt att gea gcg gat ggt gac att gea aat aat gaa aat cac ata atg Phe Ile Ala Ala Asp Gly Asp Ile Ala Asn Asn Glu Asn His Ile Met 210 215 220
aat ggc aac ttt gac gta gct gea gea cct tat ttt gtt ata gga gea Asn Gly Asn Phe Asp Val Ala Ala Ala Pro Tyr Phe Val Ile Gly Ala 225 230 235 240
aca gea cgt ttt gea gea atg caa tet tat att aaa ttt tgt aat gct 768 Thr Ala Arg Phe Ala Ala Met Gln Ser Tyr Ile Lys Phe Cys Asn Ala 245 250 255
tgg att gat aaa gtt gga ttg agt gac gea cag ctt act aca caa aag 816 Trp Ile Asp Lys Val Gly Leu Ser Asp Ala Gln Leu Thr Thr Gln Lys 260 265 270
gct aat tta gat cgc acg aaa caa aat atg cgt aat gea att ctt aac Ala Asn Leu Asp Arg Thr Lys Gln Asn Met Arg Asn Ala Ile Leu Asn 275 280 285
tat aca caa caa gtt atg aaa gtt ttt aaa gat tcc aaa aat atg cct 912 Tyr Thr Gln Gln Val Met Lys Val Phe Lys Asp Ser Lys Asn Met Pro 290 295 300
aca ata ggt act aat aaa ttt agt gtt gat acc tat aat gta tat att 9 60 Thr Ile Gly Thr Asn Lys Phe Ser Val Asp Thr Tyr Asn Val Tyr Ile 305 310 315 320
864
aaa gga atg aca tta aat gtt tta gat att gta gea ata tgg cct tca 1008 Lys Gly Met Thr Leu Asn Val Leu Asp Ile Val Ala Ile Trp Pro Ser 325 330 335
tta tat cca gat gat tat act tca caa aca gcc tta gaa caa aca cgt Leu Tyr Pro Asp Asp Tyr Thr Ser Gln Thr Ala Leu Glu Gln Thr Arg 340 345 350
gtc act ttt tca aat atg gtt ggc caa gaa gaa ggt aca gat gga age Val Thr Phe Ser Asn Met Val Gly Gln Glu Glu Gly Thr Asp Gly Ser 355 360 365
cta aga att tac aat act ttt gat tet ttt agt tat caa cat agt cca 1152 Leu Arg Ile Tyr Asn Thr Phe Asp Ser Phe Ser Tyr Gln His Ser Pro 370 375 380
1056
1104 ata cct aat aat aat gtt aat tta att tct tat tat aat gat gaa tta 1200
Ile Pro Asn Asn Asn Val Asn Leu Ile Ser Tyr Tyr Asn Asp Glu Leu
385 390 395 400
caa aat cta gaa tta gga gta tat acc cct cct aaa aaa gga agt gga 1248
Gln Asn Leu Glu Leu Gly Val Tyr Thr Pro Pro Lys Lys Gly Ser Gly
405 410 415
tac tct tat cct tat gga ttt gtt tta aat tat gca aac agt aaa tat 1296
Tyr Ser Tyr Pro Tyr Gly Phe Val Leu Asn Tyr Ala Asn Ser Lys Tyr
420 425 430
aaa tat ggt gat age aat gat cca gaa tct cta gga gga tta tct aca 1344
Lys Tyr Gly Asp Ser Asn Asp Pro Glu Ser Leu Gly Gly Leu Ser Thr
435 440 445
cta tct gca cct ata caa caa gtt aat gca gca act caa aac agt aaa 1392
Leu Ser Ala Pro Ile Gln Gln Val Asn Ala Ala Thr Gln Asn Ser Lys
450 455 460
tat cta gat gga gaa ate cta aat gga ata gga gca tcc tta cct ggt 1440
Tyr Leu Asp Gly Glu Ile Leu Asn Gly Ile Gly Ala Ser Leu Pro Gly
465 470 475 480
tat tgt act aca gga tgt tca cca aca gaa cca cct ttt agt tgt act 1488
Tyr Cys Thr Thr Gly Cys Ser Pro Thr Glu Pro Pro Phe Ser Cys Thr
485 490 495
tct acc gct aat ggc tat aaa gca age tgt aat cct tca gat aca aat 1536
Ser Thr Ala Asn Gly Tyr Lys Ala Ser Cys Asn Pro Ser Asp Thr Asn
500 505 510
caa aaa att aac gct tta tat cct ttt aca caa gct aat gta aag gga 1584
Gln Lys Ile Asn Ala Leu Tyr Pro Phe Thr Gln Ala Asn Val Lys Gly
515 520 525
aac aca gga aaa tta gga gta ctg gca agt ctt gtt tca tat gat tta 1632
Asn Thr Gly Lys Leu Gly Val Leu Ala Ser Leu Val Ser Tyr Asp Leu
530 535 540
aat cct aaa aat gta ttt ggt gaa tta gat tca gat aca aat aat gtt 1680
Asn Pro Lys Asn Val Phe Gly Glu Leu Asp Ser Asp Thr Asn Asn Val
545 550 555 560
ate tta aaa gga att cct gca gaa aaa gga tat ttt cct aat aat gcg 1728
Ile Leu Lys Gly Ile Pro Ala Glu Lys Gly Tyr Phe Pro Asn Asn Ala
565 570 575
cgt cct act gtt gta aaa gaa tgg att aat ggt gca agt gct gta cca 1776
Arg Pro Thr Val Val Lys Glu Trp Ile Asn Gly Ala Ser Ala Val Pro
580 585 590
ctt gat tca gga aat acc tta ttt atg acg gct acg aat tta aca gct 1824
Leu Asp Ser Gly Asn Thr Leu Phe Met Thr Ala Thr Asn Leu Thr Ala
595 600 605 act caa tat aga att aga ata cgt tat gca aat cca aat tca aat act 1872 Thr Gln Tyr Arg Ile Arg Ile Arg Tyr Ala Asn Pro Asn Ser Asn Thr 610 615 620
caa ate ggt gta cga att aca caa aat ggt tet cta att tcc agt agt 1920 Gln Ile Gly Val Arg Ile Thr Gln Asn Gly Ser Leu Ile Ser Ser Ser 625 630 635 640
aat cta aca ctt tat agt act act gat atg aat aat act tta cca cta 1968 Asn Leu Thr Leu Tyr Ser Thr Thr Asp Met Asn Asn Thr Leu Pro Leu 645 650 655
aat gta tat gta ata gga gaa aat gga aat tat aca ctt caa gat tta 2016 Asn Val Tyr Val Ile Gly Glu Asn Gly Asn Tyr Thr Leu Gln Asp Leu 660 665 670
tat aat act act aat gtt tta tca aca gga gat att aca tta caa att 2064 Tyr Asn Thr Thr Asn Val Leu Ser Thr Gly Asp Ile Thr Leu Gln Ile 675 680 685
aca gga gga gat caa aaa ata ttt att gat cga ata gaa ttt gtt cct 2112 Thr Gly Gly Asp Gln Lys Ile Phe Ile Asp Arg Ile Glu Phe Val Pro 690 695 700
act atg cct gta cct ggt aat act aac aac aat aac ggt aat aat aac 2160 Thr Met Pro Val Pro Gly Asn Thr Asn Asn Asn Asn Gly Asn Asn Asn 705 710 715 720
ggt aat aat aat ccc cca cac cac gtc tag 2190
Gly Asn Asn Asn Pro Pro His His Val * 725
<210> SEQ ID NO: 15 <211> Comprimento: 729 <212> Tipo: PRT
<213> Organismo: Seqüência Artificial <220> Características:
<223> Outras Informações: AXMI-031(TRUNCADO) <400> Seqüência: 15
Met Ser Tyr Tyr His His His His His His Leu Glu Ser Thr Ser Leu
15 10 15
Tyr Lys Lys Ala Gly Phe Ile Glu Gly Arg Met Asp Cys Asn Leu Gln
20 25 30
Ser Gln Gln Asn Ile Pro Tyr Asn Val Leu Ala Ile Pro Val Ser Asn
35 40 45
Val Asn Ser Leu Thr Asp Thr Val Gly Asp Leu Lys Lys Ala Trp Glu
50 55 60
Glu Phe Gln Lys Thr Gly Ser Phe Ser Leu Thr Ala Leu Gln Gln Gly 65 70 75 80
Phe Ser Ala Ser Gln Gly Gly Thr Phe Asn Tyr Leu Thr Leu Leu Gln
85 90 95
Ser Gly Ile Ser Leu Ala Gly Ser Phe Val Pro Gly Gly Thr Phe Val 100 105 110 Ala Pro Ile Ile Asn Met Val Ile Gly Trp Leu Trp Pro His Lys Asn
115 120 125
Lys Asn Ala Asp Thr Glu Asn Leu Ile Asn Leu Ile Asp Ser Glu Ile
130 135 140
Gln Lys Gln Leu Asn Lys Ala Leu Leu Asp Ala Asp Arg Asn Glu Trp 145 150 155 160
Ser Ser Tyr Leu Glu Ser Ile Phe Asp Ser Ser Asn Asn Leu Asn Gly
165 170 175
Ala Ile Val Asp Ala Gln Trp Ser Gly Thr Val Asn Thr Thr Asn Arg
180 185 190
Thr Leu Arg Asn Pro Thr Glu Ser Asp Tyr Thr Asn Val Val Thr Asn
195 200 205
Phe Ile Ala Ala Asp Gly Asp Ile Ala Asn Asn Glu Asn His Ile Met
210 215 220
Asn Gly Asn Phe Asp Val Ala Ala Ala Pro Tyr Phe Val Ile Gly Ala 225 230 235 240
Thr Ala Arg Phe Ala Ala Met Gln Ser Tyr Ile Lys Phe Cys Asn Ala
245 250 255
Trp Ile Asp Lys Val Gly Leu Ser Asp Ala Gln Leu Thr Thr Gln Lys
260 265 270
Ala Asn Leu Asp Arg Thr Lys Gln Asn Met Arg Asn Ala Ile Leu Asn
275 280 285
Tyr Thr Gln Gln Val Met Lys Val Phe Lys Asp Ser Lys Asn Met Pro
290 295 300
Thr Ile Gly Thr Asn Lys Phe Ser Val Asp Thr Tyr Asn Val Tyr Ile 305 310 315 320
Lys Gly Met Thr Leu Asn Val Leu Asp Ile Val Ala Ile Trp Pro Ser
325 330 335
Leu Tyr Pro Asp Asp Tyr Thr Ser Gln Thr Ala Leu Glu Gln Thr Arg
340 345 350
Val Thr Phe Ser Asn Met Val Gly Gln Glu Glu Gly Thr Asp Gly Ser
355 360 365
Leu Arg Ile Tyr Asn Thr Phe Asp Ser Phe Ser Tyr Gln His Ser Pro
370 375 380
Ile Pro Asn Asn Asn Val Asn Leu Ile Ser Tyr Tyr Asn Asp Glu Leu 385 390 395 400
Gln Asn Leu Glu Leu Gly Val Tyr Thr Pro Pro Lys Lys Gly Ser Gly
405 410 415
Tyr Ser Tyr Pro Tyr Gly Phe Val Leu Asn Tyr Ala Asn Ser Lys Tyr
420 425 430
Lys Tyr Gly Asp Ser Asn Asp Pro Glu Ser Leu Gly Gly Leu Ser Thr
435 440 445
Leu Ser Ala Pro Ile Gln Gln Val Asn Ala Ala Thr Gln Asn Ser Lys
450 455 460
Tyr Leu Asp Gly Glu Ile Leu Asn Gly Ile Gly Ala Ser Leu Pro Gly 465 470 475 480
Tyr Cys Thr Thr Gly Cys Ser Pro Thr Glu Pro Pro Phe Ser Cys Thr
485 490 495
Ser Thr Ala Asn Gly Tyr Lys Ala Ser Cys Asn Pro Ser Asp Thr Asn
500 505 510
Gln Lys Ile Asn Ala Leu Tyr Pro Phe Thr Gln Ala Asn Val Lys Gly
515 520 525
Asn Thr Gly Lys Leu Gly Val Leu Ala Ser Leu Val Ser Tyr Asp Leu
530 535 540
Asn Pro Lys Asn Val Phe Gly Glu Leu Asp Ser Asp Thr Asn Asn Val 545 550 555 560 Ile Leu Lys Gly Ile Pro Ala Glu Lys Gly Tyr Phe Pro Asn Asn Ala
565 570 575
Arg Pro Thr Val Val Lys Glu Trp Ile Asn Gly Ala Ser Ala Val Pro
580 585 590
Leu Asp Ser Gly Asn Thr Leu Phe Met Thr Ala Thr Asn Leu Thr Ala
595 600 605
Thr Gln Tyr Arg Ile Arg Ile Arg Tyr Ala Asn Pro Asn Ser Asn Thr
610 615 620
Gln Ile Gly Val Arg Ile Thr Gln Asn Gly Ser Leu Ile Ser Ser Ser 625 630 635 640
Asn Leu Thr Leu Tyr Ser Thr Thr Asp Met Asn Asn Thr Leu Pro Leu
645 650 655
Asn Val Tyr Val Ile Gly Glu Asn Gly Asn Tyr Thr Leu Gln Asp Leu
660 665 670
Tyr Asn Thr Thr Asn Val Leu Ser Thr Gly Asp Ile Thr Leu Gln Ile
675 680 685
Thr Gly Gly Asp Gln Lys Ile Phe Ile Asp Arg Ile Glu Phe Val Pro
690 695 700
Thr Met Pro Val Pro Gly Asn Thr Asn Asn Asn Asn Gly Asn Asn Asn 705 710 715 720
Gly Asn Asn Asn Pro Pro His His Val 725
<210> SEQ ID NO: 16 <211> Comprimento: 3 5 58 <212> Tipo: DNA
<213> Organismo: Seqüência Artificial <220> Características:
<223> Outras Informações: axmi-031(ml)
<221> Nome/Chave: CDS
<222> Localização: (1)...(3558)
<400> Seqüência: 16
atg gat tgt aat tta caa tca caa caa aat att cca tat aat gta tta 48 Met Asp Cys Asn Leu Gln Ser Gln Gln Asn Ile Pro Tyr Asn Val Leu 15 10 15
gca ata cca gta tct aat gtt aat tcg ttg act gat aca gtt gga gat 96 Ala Ile Pro Val Ser Asn Val Asn Ser Leu Thr Asp Thr Val Gly Asp 20 25 30
tta aaa aaa gca tgg gaa gaa ttt caa aaa act ggt tct ttt tca tta 144 Leu Lys Lys Ala Trp Glu Glu Phe Gln Lys Thr Gly Ser Phe Ser Leu 35 40 45
aca gct tta caa caa gga ttt tct gct tca caa gga gga aca ttc aat 192 Thr Ala Leu Gln Gln Gly Phe Ser Ala Ser Gln Gly Gly Thr Phe Asn 50 55 60
tat tta aca tta cta caa tca gga ata tca tta gct ggt tct ttt gtt 240 Tyr Leu Thr Leu Leu Gln Ser Gly Ile Ser Leu Ala Gly Ser Phe Val 65 70 75 80 cct gga ggt act ttt gta gca cct att att aat atg gtt att ggt tgg 2 88
Pro Gly Gly Thr Phe Val Ala Pro Ile Ile Asn Met Val Ile Gly Trp 85 90 95
tta tgg cca cat aaa aac aaa aat gcg gat aca gaa aat tta ata aat 336
Leu Trp Pro His Lys Asn Lys Asn Ala Asp Thr Glu Asn Leu Ile Asn 100 105 110
tta att gat tca gaa att caa aaa caa tta aac aaa gct tta tta gat 3 84
Leu Ile Asp Ser Glu Ile Gln Lys Gln Leu Asn Lys Ala Leu Leu Asp 115 120 125
gca gat aga aat gag tgg age tet tat tta gaa tet ata ttt gat tet 432
Ala Asp Arg Asn Glu Trp Ser Ser Tyr Leu Glu Ser Ile Phe Asp Ser 130 135 140
tca aat aac cta aat ggt gca att gta gat gca cag tgg tca ggc act 480
Ser Asn Asn Leu Asn Gly Ala Ile Val Asp Ala Gln Trp Ser Gly Thr
145 150 155 160
gta aat act aca aat aga aca cta aga aat cca aca gaa tca gat tat 528
Val Asn Thr Thr Asn Arg Thr Leu Arg Asn Pro Thr Glu Ser Asp Tyr 165 170 175
aca aat gtt gtt aca aat ttt att gca gcg gat ggt gac att gca aat 576
Thr Asn Val Val Thr Asn Phe Ile Ala Ala Asp Gly Asp Ile Ala Asn 180 185 190
aat gaa aat cac ata atg aat ggc aac ttt gac gta gct gca gca cct 624
Asn Glu Asn His Ile Met Asn Gly Asn Phe Asp Val Ala Ala Ala Pro 195 200 205
tat ttt gct ata gga gca aca gca cgt ttt gca gca atg caa tet tat 672
Tyr Phe Ala Ile Gly Ala Thr Ala Arg Phe Ala Ala Met Gln Ser Tyr 210 215 220
att aaa ttt tgt aat gct tgg att gat aaa gtt gga ttg agt gac gca 720
Ile Lys Phe Cys Asn Ala Trp Ile Asp Lys Val Gly Leu Ser Asp Ala
225 230 235 240
cag ctt act aca caa aag gct aat tta gat cgc acg aaa caa aat atg 768
Gln Leu Thr Thr Gln Lys Ala Asn Leu Asp Arg Thr Lys Gln Asn Met 245 250 255
cgt aat gca att ctt aac tat aca caa caa gtt atg aaa gtt ttt aaa 816
Arg Asn Ala Ile Leu Asn Tyr Thr Gln Gln Val Met Lys Val Phe Lys 260 265 270
gat tcc aaa aat atg cct aca ata ggt act aat aaa ttt agt gtt gat 864
Asp Ser Lys Asn Met Pro Thr Ile Gly Thr Asn Lys Phe Ser Val Asp 275 280 285
acc tat aat gta tat att aaa gga atg aca tta aat gtt tta gat att 912
Thr Tyr Asn Val Tyr Ile Lys Gly Met Thr Leu Asn Val Leu Asp Ile 290 295 300 gta gca ata tgg cct tca tta tat cca gat gat tat act tca caa aca 960 Val Ala Ile Trp Pro Ser Leu Tyr Pro Asp Asp Tyr Thr Ser Gln Thr 305 310 315 320
gcc tta gaa caa aca cgt gtc act ttt tca aat atg gtt ggc caa gaa 1008 Ala Leu Glu Gln Thr Arg Val Thr Phe Ser Asn Met Val Gly Gln Glu 325 330 335
gaa ggt aca gat gga age cta aga att tac aat act ttt gat tet ttt 1056 Glu Gly Thr Asp Gly Ser Leu Arg Ile Tyr Asn Thr Phe Asp Ser Phe 340 345 350
agt tat caa cat agt cca ata cct aat aat aat gtt aat tta att tet 1104 Ser Tyr Gln His Ser Pro Ile Pro Asn Asn Asn Val Asn Leu Ile Ser 355 360 365
tat tat aat gat gaa tta caa aat cta gaa tta gga gta tat acc cct 1152 Tyr Tyr Asn Asp Glu Leu Gln Asn Leu Glu Leu Gly Val Tyr Thr Pro 370 375 380
cct aaa aaa gga agt gga tac tet tat cct tat gga ttt gtt tta aat 1200 Pro Lys Lys Gly Ser Gly Tyr Ser Tyr Pro Tyr Gly Phe Val Leu Asn 385 390 395 400
tat gca aac agt aaa tat aaa tat ggt gat age aat gat cca gaa tet 1248 Tyr Ala Asn Ser Lys Tyr Lys Tyr Gly Asp Ser Asn Asp Pro Glu Ser 405 410 415
cta gga gga tta tet aca cta tet gca cct ata caa caa gtt aat gca Leu Gly Gly Leu Ser Thr Leu Ser Ala Pro Ile Gln Gln Val Asn Ala 420 425 430
gca act caa aac agt aaa tat cta gat gga gaa ate cta aat gga ata Ala Thr Gln Asn Ser Lys Tyr Leu Asp Gly Glu Ile Leu Asn Gly Ile 435 440 445
gga gca tcc tta cct ggt tat tgt act aca gga tgt tca cca aca gaa Gly Ala Ser Leu Pro Gly Tyr Cys Thr Thr Gly Cys Ser Pro Thr Glu 450 455 460
cca cct ttt agt tgt act tet acc gct aat ggc tat aaa gca age tgt Pro Pro Phe Ser Cys Thr Ser Thr Ala Asn Gly Tyr Lys Ala Ser Cys 465 470 475 480
aat cct tca gat aca aat caa aaa att aac gct tta tat cct ttt aca 1488 Asn Pro Ser Asp Thr Asn Gln Lys Ile Asn Ala Leu Tyr Pro Phe Thr 485 490 495
caa gct aat gta aag gga aac aca gga aaa tta gga gta ctg gca agt 1536 Gln Ala Asn Val Lys Gly Asn Thr Gly Lys Leu Gly Val Leu Ala Ser 500 505 510
1296
1344
1392
1440
ctt gtt tca tat gat tta aat cct aaa aat gta ttt ggt gag tta gat Leu Val Ser Tyr Asp Leu Asn Pro Lys Asn Val Phe Gly Glu Leu Asp 515 520 525
1584 tca gat Ser Asp 530
tat ttt Tyr Phe 545
ggt gca Gly Ala
gct acg Ala Thr
aat cca Asn Pro
tct cta Ser Leu 610
aat aat Asn Asn 625
tat aca Tyr Thr
gat att Asp Ile
cga ata Arg Ile
aat aac Asn Asn 690
gca ata Ala Ile 705
caa gta Gln Val
aaa tct Lys Ser
aca aat Thr Asn
cct aat Pro Asn
agt gct Ser Ala
aat tta Asn Leu 580
aat tca Asn Ser 595
att tcc Ile Ser
act tta Thr Leu
ctt caa Leu Gln
aca tta Thr Leu 660
gaa ttt Glu Phe 675
ggt aat Gly Asn
gct ggt Ala Gly
agt gat Ser Asp
tct ccg Ser Pro 740
aat gtt Asn Val
aat gcg Asn Ala 550
gta cca Val Pro 565
aca gct Thr Ala
aat act Asn Thr
agt agt Ser Ser
cca cta Pro Leu 630
gat tta Asp Leu 645
caa att Gln Ile
gtt cct Val Pro
aat aac Asn Asn
aca caa Thr Gln 710
tta gaa Leu Glu 725
tat gaa Tyr Glu
ate tta Ile Leu 535
cgt cct Arg Pro
ctt gat Leu Asp
act caa Thr Gln
caa ate Gln Ile 600
aat cta Asn Leu 615
aat gta Asn Val
tat aat Tyr Asn
aca gga Thr Gly
act atg Thr Met 680
ggt aat Gly Asn 695
caa tct Gln Ser
aaa att Lys Ile
gaa tta Glu Leu
aaa gga Lys Gly
act gtt Thr Val
tca gga Ser Gly 570
tat aga Tyr Arg 585
ggt gta Gly Val
aca ctt Thr Leu
tat gta Tyr Val
act act Thr Thr 650
gga gat Gly Asp 665
cct gta Pro Val
aat aat Asn Asn
tgt tct Cys Ser
aca aca Thr Thr 730
gct cta Ala Leu 745
att cct Ile Pro 540
gta aaa Val Lys 555
aat acc Asn Thr
att aga Ile Arg
cga att Arg Ile
tat agt Tyr Ser 620
ata gga Ile Gly 635
aat gtt Asn Val
caa aaa Gln Lys
cct ggt Pro Gly
ccc cca Pro Pro 700
gga ccg Gly Pro 715
caa gta Gln Val
gaa gtt Glu Val
gca gaa Ala Glu
gaa tgg Glu Trp
tta ttt Leu Phe
ata cgt Ile Arg 590
aca caa Thr Gln 605
act act Thr Thr
gaa aat Glu Asn
tta tca Leu Ser
ata ttt Ile Phe 670
aat act Asn Thr 685
cac cac His His
ccc aaa Pro Lys
tat atg Tyr Met
tcc age Ser Ser 750
aaa gga Lys Gly
att aat Ile Asn 560
atg acg Met Thr 575
tat gca Tyr Ala
aat ggt Asn Gly
gat atg Asp Met
gga aat Gly Asn 640
aca gga Thr Gly 655
att gat Ile Asp
aac aac Asn Asn
gtt tgt Val Cys
ttt gaa Phe Glu 720
tta ttc Leu Phe 735
tat caa Tyr Gln
1632
1680
1728
1776
1824
1872
1920
1968
2016
2064
2112
2160
2208
2256 att agt caa gta gca tta aaa gtt atg gca tta tct gat gaa cta ttt Ile Ser Gln Val Ala Leu Lys Val Met Ala Leu Ser Asp Glu Leu Phe 755 760 765
tgt gaa gaa aaa aac gta tta cga aaa tta gtc aat aaa gca aaa caa Cys Glu Glu Lys Asn Val Leu Arg Lys Leu Val Asn Lys Ala Lys Gln 770 775 780
tta tta gaa gca agt aac tta cta gta ggt gga aat ttt gaa aca act Leu Leu Glu Ala Ser Asn Leu Leu Val Gly Gly Asn Phe Glu Thr Thr 785 790 795 800
caa aat tgg gta ctt gga aca aat gct tat ata aat tat gat tcg ttt Gln Asn Trp Val Leu Gly Thr Asn Ala Tyr Ile Asn Tyr Asp Ser Phe 805 810 815
tta ttt aat gga aat tat tta tct tta caa cca gca agt gga ttt ttc Leu Phe Asn Gly Asn Tyr Leu Ser Leu Gln Pro Ala Ser Gly Phe Phe 820 825 830
aca tct tat gct tat caa aaa ata gat gag tca aca tta aaa cca tat Thr Ser Tyr Ala Tyr Gln Lys Ile Asp Glu Ser Thr Leu Lys Pro Tyr 835 840 845
aca cga tat aaa gtt tct ggg ttc att ggg caa agt aat caa gta gaa Thr Arg Tyr Lys Val Ser Gly Phe Ile Gly Gln Ser Asn Gln Val Glu 850 855 860
ctt att att tct cgt tat gga aaa gaa att gat aaa ata tta aat gtt Leu Ile Ile Ser Arg Tyr Gly Lys Glu Ile Asp Lys Ile Leu Asn Val 865 870 875 880
cca tat gca gga cct ctt cct ate act gct gat gca tca ata act tgt Pro Tyr Ala Gly Pro Leu Pro Ile Thr Ala Asp Ala Ser Ile Thr Cys 885 890 895
tgt gca cca gaa ata ggc caa tgt gat ggg gaa caa tct gat tct cat Cys Ala Pro Glu Ile Gly Gln Cys Asp Gly Glu Gln Ser Asp Ser His 900 905 910
ttc ttt aac tat age ate gat gta ggt gca ctt cac cca gaa tta aac Phe Phe Asn Tyr Ser Ile Asp Val Gly Ala Leu His Pro Glu Leu Asn 915 920 925
cct ggc att gaa att ggt ctt aaa att gtg caa tca aat ggt tat ata Pro Gly Ile Glu Ile Gly Leu Lys Ile Val Gln Ser Asn Gly Tyr Ile 930 935 940
aca att agt aat cta gaa att att gaa gaa cgt cca ctt aca gaa atg Thr Ile Ser Asn Leu Glu Ile Ile Glu Glu Arg Pro Leu Thr Glu Met 945 950 955 960
gaa att caa gca gtc aat cga aaa aat caa aaa tgg gaa aga gaa aaa Glu Ile Gln Ala Val Asn Arg Lys Asn Gln Lys Trp Glu Arg Glu Lys 965 970 975
2304
2352
2400
2448
2496
2544
2592
2640
2688
2736
2784
2832
2880
2928 ctt cta gaa tgt gca agt att agt gaa ctt tta caa cca att att aat 2976 Leu Leu Glu Cys Ala Ser Ile Ser Glu Leu Leu Gln Pro Ile Ile Asn 980 985 990
caa ate gat tca ttg ttt aaa gat gga aac tgg tat aat gat att ctt 3 024 Gln Ile Asp Ser Leu Phe Lys Asp Gly Asn Trp Tyr Asn Asp Ile Leu 995 1000 1005
cct cat gtc aca tat caa gat tta aaa aat att ata ata ccc gag tta 3072 Pro His Val Thr Tyr Gln Asp Leu Lys Asn Ile Ile Ile Pro Glu Leu 1010 1015 1020
cca aaa tta aaa cat tgg ttc ata gag aat ctc cca ggt gaa tat cat 312 0 Pro Lys Leu Lys His Trp Phe Ile Glu Asn Leu Pro Gly Glu Tyr His 1025 1030 1035 1040
gaa att gaa caa aaa atg aaa gaa gct cta aaa tat gca ttt aca caa 3168 Glu Ile Glu Gln Lys Met Lys Glu Ala Leu Lys Tyr Ala Phe Thr Gln 1045 1050 1055
tta gac gag aaa aat tta ate cac aat ggt cac ttt aca act aac tta 3216 Leu Asp Glu Lys Asn Leu Ile His Asn Gly His Phe Thr Thr Asn Leu 1060 1065 1070
ata gat tgg caa gta gaa ggt gat gct caa atg aaa gta tta gaa aat 3264 Ile Asp Trp Gln Val Glu Gly Asp Ala Gln Met Lys Val Leu Glu Asn 1075 1080 1085
gat gct ctt gca tta caa ctt ttc aac tgg gat gct aat gct tca caa 3312 Asp Ala Leu Ala Leu Gln Leu Phe Asn Trp Asp Ala Asn Ala Ser Gln 1090 1095 1100
tet ata aat ata tta gaa ttt gat gaa gat aag gca tat aaa ctt cgc 3360 Ser Ile Asn Ile Leu Glu Phe Asp Glu Asp Lys Ala Tyr Lys Leu Arg 1105 1110 1115 1120
gta tat gct caa gga age gga aca ate caa ttt gga aac tgt gaa gat 3 408 Val Tyr Ala Gln Gly Ser Gly Thr Ile Gln Phe Gly Asn Cys Glu Asp 1125 1130 1135
gaa gct ate caa ttt aat aca aac tca ttc ata tat caa gaa aaa ata 3456 Glu Ala Ile Gln Phe Asn Thr Asn Ser Phe Ile Tyr Gln Glu Lys Ile 1140 1145 1150
gtc tat ttc gat acc cca tca gtt aat tta cac ata caa tca gaa ggt 3 504 Val Tyr Phe Asp Thr Pro Ser Val Asn Leu His Ile Gln Ser Glu Gly 1155 1160 1165
tet gaa ttt att gta agt agt ate gat cta att gaa tta tca gac gac 3 552 Ser Glu Phe Ile Val Ser Ser Ile Asp Leu Ile Glu Leu Ser Asp Asp 1170 1175 1180
caa taa 3558
Gln *
1185 <210> SEQ ID NO: 17 <211> Comprimento: 1185 <212> Tipo: PRT
<213> Organismo: Seqüência Artificial
<220> Características:
<223> Outras Informações: AXMI-031(M1)
<400> Seqüência: 17
Met Asp Cys Asn Leu Gln Ser Gln Gln Asn Ile Pro
15 10
Ala Ile Pro Val Ser Asn Val Asn Ser Leu Thr Asp
20 25
Leu Lys Lys Ala Trp Glu Glu Phe Gln Lys Thr Gly
35 40
Thr Ala Leu Gln Gln Gly Phe Ser Ala Ser Gln Gly
50 55 60
Tyr Leu Thr Leu Leu Gln Ser Gly Ile Ser Leu Ala 65 70 75
Pro Gly Gly Thr Phe Val Ala Pro Ile Ile Asn Met
85 90
Leu Trp Pro His Lys Asn Lys Asn Ala Asp Thr Glu
100 105
Leu Ile Asp Ser Glu Ile Gln Lys Gln Leu Asn Lys
115 120
Ala Asp Arg Asn Glu Trp Ser Ser Tyr Leu Glu Ser 130 135 140
Ser Asn Asn Leu Asn Gly Ala Ile Val Asp Ala Gln 145 150 155
Val Asn Thr Thr Asn Arg Thr Leu Arg Asn Pro Thr
165 170
Thr Asn Val Val Thr Asn Phe Ile Ala Ala Asp Gly
180 185
Asn Glu Asn His Ile Met Asn Gly Asn Phe Asp Val
195 200
Tyr Phe Ala Ile Gly Ala Thr Ala Arg Phe Ala Ala 210 215 220
Ile Lys Phe Cys Asn Ala Trp Ile Asp Lys Val Gly 225 230 235
Gln Leu Thr Thr Gln Lys Ala Asn Leu Asp Arg Thr
245 250
Arg Asn Ala Ile Leu Asn Tyr Thr Gln Gln Val Met
260 265
Asp Ser Lys Asn Met Pro Thr Ile Gly Thr Asn Lys
275 280
Thr Tyr Asn Val Tyr Ile Lys Gly Met Thr Leu Asn 290 295 300
Val Ala Ile Trp Pro Ser Leu Tyr Pro Asp Asp Tyr 305 310 315
Ala Leu Glu Gln Thr Arg Val Thr Phe Ser Asn Met
325 330
Glu Gly Thr Asp Gly Ser Leu Arg Ile Tyr Asn Thr
340 345
Ser Tyr Gln His Ser Pro Ile Pro Asn Asn Asn Val
355 360
Tyr Tyr Asn Asp Glu Leu Gln Asn Leu Glu Leu Gly 370 375 380
Tyr Asn Val Leu 15
Thr Val Gly Asp 30
Ser Phe Ser Leu 45
Gly Thr Phe Asn
Gly Ser Phe Val 80
Val Ile Gly Trp 95
Asn Leu Ile Asn 110
Ala Leu Leu Asp 125
Ile Phe Asp Ser
Trp Ser Gly Thr 160
Glu Ser Asp Tyr 175
Asp Ile Ala Asn 190
Ala Ala Ala Pro 205
Met Gln Ser Tyr
Leu Ser Asp Ala 240
Lys Gln Asn Met 255
Lys Val Phe Lys 270
Phe Ser Val Asp 285
Val Leu Asp Ile
Thr Ser Gln Thr 320
Val Gly Gln Glu 335
Phe Asp Ser Phe 350
Asn Leu Ile Ser 365
Val Tyr Thr Pro Pro Lys Lys Gly 385
Tyr Ala Asn Ser
Leu Gly Gly Leu 420
Ala Thr Gln Asn 435
Gly Ala Ser Leu 450
Pro Pro Phe Ser 465
Asn Pro Ser Asp
Gln Ala Asn Val 500
Leu Val Ser Tyr 515
Ser Asp Thr Asn 530
Tyr Phe Pro Asn 545
Gly Ala Ser Ala
Ala Thr Asn Leu 580
Asn Pro Asn Ser 595
Ser Leu Ile Ser 610
Asn Asn Thr Leu 625
Tyr Thr Leu Gln
Asp Ile Thr Leu 660
Arg Ile Glu Phe 675
Asn Asn Gly Asn 690
Ala Ile Ala Gly 705
Gln Val Ser Asp
Lys Ser Ser Pro 740
Ile Ser Gln Val 755
Cys Glu Glu Lys 770
Leu Leu Glu Ala 785
Gln Asn Trp Val
Leu Phe Asn Gly 820
Ser Gly Tyr Ser 390
Lys Tyr Lys Tyr 405
Ser Thr Leu Ser
Ser Lys Tyr Leu 440
Pro Gly Tyr Cys 455
Cys Thr Ser Thr 470
Thr Asn Gln Lys 485
Lys Gly Asn Thr
Asp Leu Asn Pro 520
Asn Val Ile Leu 535
Asn Ala Arg Pro 550
Val Pro Leu Asp 565
Thr Ala Thr Gln
Asn Thr Gln Ile 600
Ser Ser Asn Leu 615
Pro Leu Asn Val 630
Asp Leu Tyr Asn 645
Gln Ile Thr Gly
Val Pro Thr Met 680
Asn Asn Gly Asn 695
Thr Gln Gln Ser 710
Leu Glu Lys Ile 725
Tyr Glu Glu Leu
Ala Leu Lys Val 760
Asn Val Leu Arg 775
Ser Asn Leu Leu 790
Leu Gly Thr Asn 805
Asn Tyr Leu Ser
58/123
Tyr Pro Tyr Gly 395
Gly Asp Ser Asn 410
Ala Pro Ile Gln 425
Asp Gly Glu Ile
Thr Thr Gly Cys 460
Ala Asn Gly Tyr 475
Ile Asn Ala Leu 490
Gly Lys Leu Gly 505
Lys Asn Val Phe
Lys Gly Ile Pro 540
Thr Val Val Lys 555
Ser Gly Asn Thr 570
Tyr Arg Ile Arg 585
Gly Val Arg Ile
Thr Leu Tyr Ser 620
Tyr Val Ile Gly 635
Thr Thr Asn Val 650
Gly Asp Gln Lys 665
Pro Val Pro Gly
Asn Asn Pro Pro 700
Cys Ser Gly Pro 715
Thr Thr Gln Val 730
Ala Leu Glu Val 745
Met Ala Leu Ser
Lys Leu Val Asn 780
Val Gly Gly Asn 795
Ala Tyr Ile Asn 810
Leu Gln Pro Ala 825
Phe Val Leu Asn 400
Asp Pro Glu Ser 415
Gln Val Asn Ala 430
Leu Asn Gly Ile 445
Ser Pro Thr Glu
Lys Ala Ser Cys 480
Tyr Pro Phe Thr 495
Val Leu Ala Ser 510
Gly Glu Leu Asp 525
Ala Glu Lys Gly
Glu Trp Ile Asn 560
Leu Phe Met Thr 575
Ile Arg Tyr Ala 590
Thr Gln Asn Gly 605
Thr Thr Asp Met
Glu Asn Gly Asn 640
Leu Ser Thr Gly 655
Ile Phe Ile Asp 670
Asn Thr Asn Asn 685
His His Val Cys
Pro Lys Phe Glu 720
Tyr Met Leu Phe 735
Ser Ser Tyr Gln 750
Asp Glu Leu Phe 765
Lys Ala Lys Gln
Phe Glu Thr Thr 800
Tyr Asp Ser Phe 815 Ser Gly Phe Phe 830 Thr Ser Tyr Ala Tyr Gln Lys Ile Asp Glu Ser Thr Leu Lys Pro Tyr 835 840 845 Thr Arg Tyr Lys Val Ser Gly Phe Ile Gly Gln Ser Asn Gln Val Glu 850 855 860 Leu Ile Ile Ser Arg Tyr Gly Lys Glu Ile Asp Lys Ile Leu Asn Val 865 870 875 880 Pro Tyr Ala Gly Pro Leu Pro Ile Thr Ala Asp Ala Ser Ile Thr Cys 885 890 895 Cys Ala Pro Glu Ile Gly Gln Cys Asp Gly Glu Gln Ser Asp Ser His 900 905 910 Phe Phe Asn Tyr Ser Ile Asp Val Gly Ala Leu His Pro Glu Leu Asn 915 920 925 Pro Gly Ile Glu Ile Gly Leu Lys Ile Val Gln Ser Asn Gly Tyr Ile 930 935 940 Thr Ile Ser Asn Leu Glu Ile Ile Glu Glu Arg Pro Leu Thr Glu Met 945 950 955 960 Glu Ile Gln Ala Val Asn Arg Lys Asn Gln Lys Trp Glu Arg Glu Lys 965 970 975 Leu Leu Glu Cys Ala Ser Ile Ser Glu Leu Leu Gln Pro Ile Ile Asn 980 985 990 Gln Ile Asp Ser Leu Phe Lys Asp Gly Asn Trp Tyr Asn Asp Ile Leu 995 1000 1005 Pro His Val Thr Tyr Gln Asp Leu Lys Asn Ile Ile Ile Pro Glu Leu 1010 1015 1020 Pro Lys Leu Lys His Trp Phe Ile Glu Asn Leu Pro Gly Glu Tyr His 1025 1030 1035 1040 Glu Ile Glu Gln Lys Met Lys Glu Ala Leu Lys Tyr Ala Phe Thr Gln 1045 1050 1055 Leu Asp Glu Lys Asn Leu Ile His Asn Gly His Phe Thr Thr Asn Leu 1060 1065 1070 Ile Asp Trp Gln Val Glu Gly Asp Ala Gln Met Lys Val Leu Glu Asn 1075 1080 1085 Asp Ala Leu Ala Leu Gln Leu Phe Asn Trp Asp Ala Asn Ala Ser Gln 1090 1095 1100 Ser Ile Asn Ile Leu Glu Phe Asp Glu Asp Lys Ala Tyr Lys Leu Arg
1105 1110 1115 1120
Val Tyr Ala Gln Gly Ser Gly Thr Ile Gln Phe Gly Asn Cys Glu Asp
1125 1130 1135
Glu Ala Ile Gln Phe Asn Thr Asn Ser Phe Ile Tyr Gln Glu Lys Ile
1140 1145 1150
Val Tyr Phe Asp Thr Pro Ser Val Asn Leu His Ile Gln Ser Glu Gly
1155 1160 1165
Ser Glu Phe Ile Val Ser Ser Ile Asp Leu Ile Glu Leu Ser Asp Asp 1170 1175 1180
Gln 1185
<210> SEQ ID NO: 18 <211> Comprimento: 2112 <212> Tipo: DNA
<213> Organismo: Seqüência Artificial <220> Características:
<223> Outras Informações: axmi-031(ml)truncado <221> Nome/Chave: CDS
<222> Localização: (1) . . . (2112)
<400> Seqüência: 18
atg gat tgt aat tta caa tca caa caa aat att cca tat aat gta tta Met Asp Cys Asn Leu Gln Ser Gln Gln Asn Ile Pro Tyr Asn Val Leu
gca ata cca gta tct aat gtt aat tcg ttg act gat aca gtt gga gat Ala Ile Pro Val Ser Asn Val Asn Ser Leu Thr Asp Thr Val Gly Asp
tta aaa aaa gca tgg gaa gaa ttt caa aaa act ggt tct ttt tca tta Leu Lys Lys Ala Trp Glu Glu Phe Gln Lys Thr Gly Ser Phe Ser Leu
aca gct tta caa caa gga ttt tct gct tca caa gga gga aca ttc aat Thr Ala Leu Gln Gln Gly Phe Ser Ala Ser Gln Gly Gly Thr Phe Asn
tat tta aca tta cta caa tca gga ata tca tta gct ggt tct ttt gtt Tyr Leu Thr Leu Leu Gln Ser Gly Ile Ser Leu Ala Gly Ser Phe Val
cct gga ggt act ttt gta gca cct att att aat atg gtt att ggt tgg Pro Gly Gly Thr Phe Val Ala Pro Ile Ile Asn Met Val Ile Gly Trp
tta tgg cca cat aaa aac aaa aat gcg gat aca gaa aat tta ata aat Leu Trp Pro His Lys Asn Lys Asn Ala Asp Thr Glu Asn Leu Ile Asn
tta att gat tca gaa att caa aaa caa tta aac aaa gct tta tta gat Leu Ile Asp Ser Glu Ile Gln Lys Gln Leu Asn Lys Ala Leu Leu Asp
gca gat aga aat gag tgg age tct tat tta gaa tct ata ttt gat tct Ala Asp Arg Asn Glu Trp Ser Ser Tyr Leu Glu Ser Ile Phe Asp Ser
tca aat aac cta aat ggt gca att gta gat gca cag tgg tca ggc act Ser Asn Asn Leu Asn Gly Ala Ile Val Asp Ala Gln Trp Ser Gly Thr gta aat act aca aat aga aca cta aga aat cca aca gaa tca gat tat Val Asn Thr Thr Asn Arg Thr Leu Arg Asn Pro Thr Glu Ser Asp Tyr
aca aat gtt gtt aca aat ttt att gca gcg gat ggt gac att gca aat Thr Asn Val Val Thr Asn Phe Ile Ala Ala Asp Gly Asp Ile Ala Asn
aat gaa aat cac ata atg aat ggc aac ttt gac gta gct gca gca cct Asn Glu Asn His Ile Met Asn Gly Asn Phe Asp Val Ala Ala Ala Pro tat ttt Tyr Phe 210
att aaa Ile Lys 225
cag ctt Gln Leu
cgt aat Arg Asn
gat tcc Asp Ser
acc tat Thr Tyr 290
gta gca Val Ala 305
gcc tta Ala Leu
gaa ggt Glu Gly
agt tat Ser Tyr
tat tat Tyr Tyr 370
cct aaa Pro Lys 385
tat gca Tyr Ala
cta gga Leu Gly
gct ata Ala Ile
ttt tgt Phe Cys
act aca Thr Thr
gca att Ala Ile 260
aaa aat Lys Asn 275
aat gta Asn Val
ata tgg Ile Trp
gaa caa Glu Gln
aca gat Thr Asp 340
caa cat Gln His 355
aat gat Asn Asp
aaa gga Lys Gly
aac agt Asn Ser
gga tta Gly Leu 420
gga gca Gly Ala
aat gct Asn Ala 230
caa aag Gln Lys 245
ctt aac Leu Asn
atg cct Met Pro
tat att Tyr Ile
cct tca Pro Ser 310
aca cgt Thr Arg 325
gga age Gly Ser
agt cca Ser Pro
gaa tta Glu Leu
agt gga Ser Gly 390
aaa tat Lys Tyr 405
tet aca Ser Thr
aca gca Thr Ala 215
tgg att Trp Ile
gct aat Ala Asn
tat aca Tyr Thr
aca ata Thr Ile 280
aaa gga Lys Gly 295
tta tat Leu Tyr
gtc act Val Thr
cta aga Leu Arg
ata cct Ile Pro 360
caa aat Gln Asn 375
tac tet Tyr Ser
aaa tat Lys Tyr
cta tet Leu Ser
cgt ttt Arg Phe
gat aaa Asp Lys
tta gat Leu Asp 250
caa caa Gln Gln 265
ggt act Gly Thr
atg aca Met Thr
cca gat Pro Asp
ttt tca Phe Ser 330
att tac Ile Tyr 345
aat aat Asn Asn
cta gaa Leu Glu
tat cct Tyr Pro
ggt gat Gly Asp 410
gca cct Ala Pro 425
gca gca Ala Ala 220
gtt gga Val Gly 235
cgc acg Arg Thr
gtt atg Val Met
aat aaa Asn Lys
tta aat Leu Asn 300
gat tat Asp Tyr 315
aat atg Asn Met
aat act Asn Thr
aat gtt Asn Val
tta gga Leu Gly 380
tat gga Tyr Gly 395
age aat Ser Asn
ata caa Ile Gln
atg caa Met Gln
ttg agt Leu Ser
aaa caa Lys Gln
aaa gtt Lys Val 270
ttt agt Phe Ser 285
gtt tta Val Leu
act tca Thr Ser
gtt ggc Val Gly
ttt gat Phe Asp 350
aat tta Asn Leu 365
gta tat Val Tyr
ttt gtt Phe Val
gat cca Asp Pro
caa gtt Gln Val 430
tet tat Ser Tyr
gac gca Asp Ala 240
aat atg Asn Met 255
ttt aaa Phe Lys
gtt gat Val Asp
gat att Asp Ile
caa aca Gln Thr 320
caa gaa Gln Glu 335
tet ttt Ser Phe
att tet Ile Ser
acc cct Thr Pro
tta aat Leu Asn 400
gaa tet Glu Ser 415
aat gca Asn Ala
672
720
768
816
864
912
960
1008
1056
1104
1152
1200
1248
1296 gca act Ala Thr
gga gca Gly Ala 450
cca cct Pro Pro 465
aat cct Asn Pro
caa gct Gln Ala
ctt gtt Leu Val
tca gat Ser Asp 530
tat ttt Tyr Phe 545
ggt gca Gly Ala
gct acg Ala Thr
aat cca Asn Pro
tct cta Ser Leu 610
aat aat Asn Asn 625
tat aca Tyr Thr
caa aac Gln Asn 435
tcc tta Ser Leu
ttt agt Phe Ser
tca gat Ser Asp
aat gta Asn Val 500
tca tat Ser Tyr 515
aca aat Thr Asn
cct aat Pro Asn
agt gct Ser Ala
aat tta Asn Leu 580
aat tca Asn Ser 595
att tcc Ile Ser
act tta Thr Leu
ctt caa Leu Gln
agt aaa Ser Lys
cct ggt Pro Gly
tgt act Cys Thr 470
aca aat Thr Asn 485
aag gga Lys Gly
gat tta Asp Leu
aat gtt Asn Val
aat gcg Asn Ala 550
gta cca Val Pro 565
aca gct Thr Ala
aat act Asn Thr
agt agt Ser Ser
cca cta Pro Leu 630
gat tta Asp Leu 645
tat cta Tyr Leu 440
tat tgt Tyr Cys 455
tct acc Ser Thr
caa aaa Gln Lys
aac aca Asn Thr
aat cct Asn Pro 520
ate tta Ile Leu 535
cgt cct Arg Pro
ctt gat Leu Asp
act caa Thr Gln
caa ate Gln Ile 600
aat cta Asn Leu 615
aat gta Asn Val
tat aat Tyr Asn
gat gga Asp Gly
act aca Thr Thr
gct aat Ala Asn
att aac Ile Asn 490
gga aaa Gly Lys 505
aaa aat Lys Asn
aaa gga Lys Gly
act gtt Thr Val
tca gga Ser Gly 570
tat aga Tyr Arg 585
ggt gta Gly Val
aca ctt Thr Leu
tat gta Tyr Val
act act Thr Thr 650
gaa ate Glu Ile
gga tgt Gly Cys 460
ggc tat Gly Tyr 475
gct tta Ala Leu
tta gga Leu Gly
gta ttt Val Phe
att cct Ile Pro 540
gta aaa Val Lys 555
aat acc Asn Thr
att aga Ile Arg
cga att Arg Ile
tat agt Tyr Ser 620
ata gga Ile Gly 635
aat gtt Asn Val
cta aat Leu Asn 445
tca cca Ser Pro
aaa gca Lys Ala
tat cct Tyr Pro
gta ctg Val Leu 510
ggt gag Gly Glu 525
gca gaa Ala Glu
gaa tgg Glu Trp
tta ttt Leu Phe
ata cgt Ile Arg 590
aca caa Thr Gln 605
act act Thr Thr
gaa aat Glu Asn
tta tca Leu Ser
gga ata Gly Ile
aca gaa Thr Glu
age tgt Ser Cys 480
ttt aca Phe Thr 495
gca agt Ala Ser
tta gat Leu Asp
aaa gga Lys Gly
att aat Ile Asn 560
atg acg Met Thr 575
tat gca Tyr Ala
aat ggt Asn Gly
gat atg Asp Met
gga aat Gly Asn 640
aca gga Thr Gly 655
1344
1392
1440
1488
1536
1584
1632
1680
1728
1776
1824
1872
1920
1968 gat att aca Asp Ile Thr
cga ata gaa Arg Ile Glu 675
aat aac ggt Asn Asn Gly 690
tta caa att Leu Gln Ile 660
ttt gtt cct Phe Val Pro
aat aat aac Asn Asn Asn
aca gga gga Thr Gly Gly 665
act atg cct Thr Met Pro 680
ggt aat aat Gly Asn Asn 695
gat caa aaa Asp Gln Lys
gta cct ggt Val Pro Gly
aat ccc cca Asn Pro Pro 700
ata ttt att Ile Phe Ile 670
aat act aac Asn Thr Asn 685
cac cac gtc His His Val
gat 2016 Asp
aac 2064 Asn
tag 2112
<210> SEQ ID NO: 19 <211> Comprimento: 703 <212> Tipo: PRT
<213> Organismo: Seqüência Artificial <220> Características:
<223> Outras Informações: AXMI-031(Ml)TRUNCADO <400> Seqüência: 19
Met Asp Cys Asn Leu Gln Ser Gln Gln Asn Ile Pro Tyr Asn Val Leu 1 5 10 15 Ala Ile Pro Val 20 Ser Asn Val Asn Ser 25 Leu Thr Asp Thr Val 30 Gly Asp Leu Lys Lys 35 Ala Trp Glu Glu Phe 40 Gln Lys Thr Gly Ser 45 Phe Ser Leu Thr Ala 50 Leu Gln Gln Gly Phe 55 Ser Ala Ser Gln Gly 60 Gly Thr Phe Asn Tyr Leu Thr Leu Leu Gln Ser Gly Ile Ser Leu Ala Gly Ser Phe Val 65 70 75 80 Pro Gly Gly Thr Phe 85 Val Ala Pro Ile Ile 90 Asn Met Val Ile Gly 95 Trp Leu Trp Pro His 100 Lys Asn Lys Asn Ala 105 Asp Thr Glu Asn Leu 110 Ile Asn Leu Ile Asp 115 Ser Glu Ile Gln Lys 120 Gln Leu Asn Lys Ala 125 Leu Leu Asp Ala Asp 130 Arg Asn Glu Trp Ser 135 Ser Tyr Leu Glu Ser 140 Ile Phe Asp Ser Ser Asn Asn Leu Asn Gly Ala Ile Val Asp Ala Gln Trp Ser Gly Thr 145 150 155 160 Val Asn Thr Thr Asn 165 Arg Thr Leu Arg Asn 170 Pro Thr Glu Ser Asp 175 Tyr Thr Asn Val Val 180 Thr Asn Phe Ile Ala 185 Ala Asp Gly Asp Ile 190 Ala Asn Asn Glu Asn 195 His Ile Met Asn Gly 200 Asn Phe Asp Val Ala 205 Ala Ala Pro Tyr Phe 210 Ala Ile Gly Ala Thr 215 Ala Arg Phe Ala Ala 220 Met Gln Ser Tyr Ile Lys Phe Cys Asn Ala Trp Ile Asp Lys Val Gly Leu Ser Asp Ala 225 230 235 240 Gln Leu Thr Thr Gln 245 Lys Ala Asn Leu Asp 250 Arg Thr Lys Gln Asn 255 Met Arg Asn Ala Ile 260 Leu Asn Tyr Thr Gln 265 Gln Val Met Lys Val 270 Phe Lys Asp Ser Lys Asn Met Pro Thr Ile Gly Thr Asn Lys Phe Ser Val Asp
275 280 285
Thr Tyr Asn Val Tyr Ile Lys Gly Met Thr Leu Asn Val Leu Asp Ile
290 295 300
Val Ala Ile Trp Pro Ser Leu Tyr Pro Asp Asp Tyr Thr Ser Gln Thr 305 310 315 320
Ala Leu Glu Gln Thr Arg Val Thr Phe Ser Asn Met Val Gly Gln Glu
325 330 335
Glu Gly Thr Asp Gly Ser Leu Arg Ile Tyr Asn Thr Phe Asp Ser Phe
340 345 350
Ser Tyr Gln His Ser Pro Ile Pro Asn Asn Asn Val Asn Leu Ile Ser
355 360 365
Tyr Tyr Asn Asp Glu Leu Gln Asn Leu Glu Leu Gly Val Tyr Thr Pro
370 375 380
Pro Lys Lys Gly Ser Gly Tyr Ser Tyr Pro Tyr Gly Phe Val Leu Asn 385 390 395 400
Tyr Ala Asn Ser Lys Tyr Lys Tyr Gly Asp Ser Asn Asp Pro Glu Ser
405 410 415
Leu Gly Gly Leu Ser Thr Leu Ser Ala Pro Ile Gln Gln Val Asn Ala
420 425 430
Ala Thr Gln Asn Ser Lys Tyr Leu Asp Gly Glu Ile Leu Asn Gly Ile
435 440 445
Gly Ala Ser Leu Pro Gly Tyr Cys Thr Thr Gly Cys Ser Pro Thr Glu
450 455 460
Pro Pro Phe Ser Cys Thr Ser Thr Ala Asn Gly Tyr Lys Ala Ser Cys 465 470 475 480
Asn Pro Ser Asp Thr Asn Gln Lys Ile Asn Ala Leu Tyr Pro Phe Thr
485 490 495
Gln Ala Asn Val Lys Gly Asn Thr Gly Lys Leu Gly Val Leu Ala Ser
500 505 510
Leu Val Ser Tyr Asp Leu Asn Pro Lys Asn Val Phe Gly Glu Leu Asp
515 520 525
Ser Asp Thr Asn Asn Val Ile Leu Lys Gly Ile Pro Ala Glu Lys Gly
530 535 540
Tyr Phe Pro Asn Asn Ala Arg Pro Thr Val Val Lys Glu Trp Ile Asn 545 550 555 560
Gly Ala Ser Ala Val Pro Leu Asp Ser Gly Asn Thr Leu Phe Met Thr
565 570 575
Ala Thr Asn Leu Thr Ala Thr Gln Tyr Arg Ile Arg Ile Arg Tyr Ala
580 585 590
Asn Pro Asn Ser Asn Thr Gln Ile Gly Val Arg Ile Thr Gln Asn Gly
595 600 605
Ser Leu Ile Ser Ser Ser Asn Leu Thr Leu Tyr Ser Thr Thr Asp Met
610 615 620
Asn Asn Thr Leu Pro Leu Asn Val Tyr Val Ile Gly Glu Asn Gly Asn 625 630 635 640
Tyr Thr Leu Gln Asp Leu Tyr Asn Thr Thr Asn Val Leu Ser Thr Gly
645 650 655
Asp Ile Thr Leu Gln Ile Thr Gly Gly Asp Gln Lys Ile Phe Ile Asp
660 665 670
Arg Ile Glu Phe Val Pro Thr Met Pro Val Pro Gly Asn Thr Asn Asn
675 680 685
Asn Asn Gly Asn Asn Asn Gly Asn Asn Asn Pro Pro His His Val 690 695 700 <210> SEQ ID NO: 20 <211> Comprimento: 2219 <212> Tipo: DNA
<213> Organismo: Seqüência Artificial <220> Características:
<223> Outras Informações: axmi-031(A-D)
<221> Nome/Chave: CDS
<222> Localização: (1)...(2216)
<400> Seqüência: 20
atg gat tgt aat tta caa tca caa caa aat att cca tat aat gta tta Met Asp Cys Asn Leu Gln Ser Gln Gln Asn Ile Pro Tyr Asn Val Leu 15 10 15
gca ata cca gta tct aat gtt aat tcg ttg act gat aca gtt gga gat Ala Ile Pro Val Ser Asn Val Asn Ser Leu Thr Asp Thr Val Gly Asp 20 25 30
tta aaa aaa gca tgg gaa gaa ttt caa aaa act ggt tct ttt tca tta Leu Lys Lys Ala Trp Glu Glu Phe Gln Lys Thr Gly Ser Phe Ser Leu 35 40 45
48
96
144
aca gct tta caa caa gga ttt tct gct tca caa gga gga aca ttc aat 192 Thr Ala Leu Gln Gln Gly Phe Ser Ala Ser Gln Gly Gly Thr Phe Asn 50 55 60
tat tta aca tta cta caa tca gga ata tca tta gct ggt tct ttt gtt 240 Tyr Leu Thr Leu Leu Gln Ser Gly Ile Ser Leu Ala Gly Ser Phe Val 65 70 75 80
cct gga ggt act ttt gta gca cct att att aat atg gtt att ggt tgg 2 88 Pro Gly Gly Thr Phe Val Ala Pro Ile Ile Asn Met Val Ile Gly Trp 85 90 95
tta tgg cca cat aaa aac aaa aat gcg gat aca gaa aat tta ata aat 336 Leu Trp Pro His Lys Asn Lys Asn Ala Asp Thr Glu Asn Leu Ile Asn 100 105 110
tta att gat tca gaa att caa aaa caa tta aac aaa gct tta tta gat 384 Leu Ile Asp Ser Glu Ile Gln Lys Gln Leu Asn Lys Ala Leu Leu Asp 115 120 125
gca gat aga aat gag tgg age tct tat tta gaa tct ata ttt gat tct
Ala Asp Arg Asn Glu Trp Ser Ser Tyr Leu Glu Ser Ile Phe Asp Ser
130 135 140
tca aat aac cta aat ggt gca att gta gat gca cag tgg tca ggc act
Ser Asn Asn Leu Asn Gly Ala Ile Val Asp Ala Gln Trp Ser Gly Thr
145 150 155 160
gta aat act aca aat aga aca cta aga aat cca aca gaa tca gat tat Val Asn Thr Thr Asn Arg Thr Leu Arg Asn Pro Thr Glu Ser Asp Tyr
165 170 175
432
480
528 aca aat Thr Asn
aat gaa Asn Glu
tat ttt Tyr Phe 210
att aaa Ile Lys 225
cag ctt Gln Leu
cgt aat Arg Asn
gat tcc Asp Ser
acc tat Thr Tyr 290
gta gca Val Ala 305
gcc tta Ala Leu
gaa ggt Glu Gly
agt tat Ser Tyr
tat tat Tyr Tyr 370
cct aaa Pro Lys 385
gtt gtt Val Val 180
aat cac Asn His 195
gtt ata Val Ile
ttt tgt Phe Cys
act aca Thr Thr
gca att Ala Ile 260
aaa aat Lys Asn 275
aat gta Asn Val
ata tgg Ile Trp
gaa caa Glu Gln
aca gat Thr Asp 340
caa cat Gln His 355
aat gat Asn Asp
aaa gga Lys Gly
aca aat Thr Asn
ata atg Ile Met
gga gca Gly Ala
aat gct Asn Ala 230
caa aag Gln Lys 245
ctt aac Leu Asn
atg cct Met Pro
tat att Tyr Ile
cct tca Pro Ser 310
aca cgt Thr Arg 325
gga age Gly Ser
agt cca Ser Pro
gaa tta Glu Leu
agt gga Ser Gly 390
ttt att Phe Ile
aat ggc Asn Gly 200
aca gca Thr Ala 215
tgg att Trp Ile
gct aat Ala Asn
tat aca Tyr Thr
aca ata Thr Ile 280
aaa gga Lys Gly 295
tta tat Leu Tyr
gtc act Val Thr
cta aga Leu Arg
ata cct Ile Pro 360
caa aat Gln Asn 375
tac tet Tyr Ser
gca gcg Ala Ala 185
aac ttt Asn Phe
cgt ttt Arg Phe
gat aaa Asp Lys
tta gat Leu Asp 250
caa caa Gln Gln 265
ggt act Gly Thr
atg aca Met Thr
cca gat Pro Asp
ttt tca Phe Ser 330
att tac Ile Tyr 345
aat aat Asn Asn
cta gaa Leu Glu
tat cct Tyr Pro
gat ggt Asp Gly
gac gta Asp Val
gca gca Ala Ala 220
gtt gga Val Gly 235
cgc acg Arg Thr
gtt atg Val Met
aat aaa Asn Lys
tta aat Leu Asn 300
gat tat Asp Tyr 315
aat atg Asn Met
aat act Asn Thr
aat gtt Asn Val
tta gga Leu Gly 380
tat gga Tyr Gly 395
gac att Asp Ile 190
gct gca Ala Ala 205
atg caa Met Gln
ttg agt Leu Ser
aaa caa Lys Gln
aaa gtt Lys Val 270
ttt agt Phe Ser 285
gtt tta Val Leu
act tca Thr Ser
gtt ggc Val Gly
ttt gat Phe Asp 350
aat tta Asn Leu 365
gta tat Val Tyr
ttt gtt Phe Val
gca aat Ala Asn
gca cct Ala Pro
tet tat Ser Tyr
gac gca Asp Ala 240
aat atg Asn Met 255
ttt aaa Phe Lys
gtt gat Val Asp
gat att Asp Ile
caa aca Gln Thr 320
caa gaa Gln Glu 335
tet ttt Ser Phe
att tet Ile Ser
acc cct Thr Pro
tta aat Leu Asn 400
576
624
672
720
768
816
864
912
960
1008
1056
1104
1152
1200 tat gca aac agt aaa tat aaa tat ggt gat age aat gat cca gaa tet Tyr Ala Asn Ser Lys Tyr Lys Tyr Gly Asp Ser Asn Asp Pro Glu Ser 405 410 415
cta gga gga tta tet aca cta tet gca cct ata caa caa gtt aat gca Leu Gly Gly Leu Ser Thr Leu Ser Ala Pro Ile Gln Gln Val Asn Ala 420 425 430
gca act caa aac agt aaa tat cta gat gga gaa ate cta aat gga ata Ala Thr Gln Asn Ser Lys Tyr Leu Asp Gly Glu Ile Leu Asn Gly Ile 435 440 445
gga gca tcc tta cct ggt tat tgt act aca gga tgt tca cca aca gaa Gly Ala Ser Leu Pro Gly Tyr Cys Thr Thr Gly Cys Ser Pro Thr Glu 450 455 460
cca cct ttt agt tgt act tet acc gct aat ggc tat aaa gca age tgt Pro Pro Phe Ser Cys Thr Ser Thr Ala Asn Gly Tyr Lys Ala Ser Cys 465 470 475 480
aat cct tca gat aca aat caa aaa att aac gct tta tat cct ttt aca Asn Pro Ser Asp Thr Asn Gln Lys Ile Asn Ala Leu Tyr Pro Phe Thr 485 490 495
caa gct aat gta aag gga aac aca gga aaa tta gga gta ctg gca agt Gln Ala Asn Val Lys Gly Asn Thr Gly Lys Leu Gly Val Leu Ala Ser 500 505 510
ctt gtt tca tat gat tta aat cct aaa aat gta ttt ggt gaa tta gat Leu Val Ser Tyr Asp Leu Asn Pro Lys Asn Val Phe Gly Glu Leu Asp 515 520 525
tca gat aca aat aat gtt ate tta aaa gga att cct gca gaa aaa gga Ser Asp Thr Asn Asn Val Ile Leu Lys Gly Ile Pro Ala Glu Lys Gly 530 535 540
tat ttt cct aat aat gcg cgt cct act gtt gta aaa gaa tgg att aat Tyr Phe Pro Asn Asn Ala Arg Pro Thr Val Val Lys Glu Trp Ile Asn 545 550 · 555 560
ggt gca agt gct gta cca ctt gat tca gga aat acc tta ttt atg acg Gly Ala Ser Ala Val Pro Leu Asp Ser Gly Asn Thr Leu Phe Met Thr 565 570 575
gct acg aat tta aca gct act caa tat aga att aga ata cgt tat gca Ala Thr Asn Leu Thr Ala Thr Gln Tyr Arg Ile Arg Ile Arg Tyr Ala 580 585 590
aat cca aat tca aat act caa ate ggt gta cga att aca caa aat ggt Asn Pro Asn Ser Asn Thr Gln Ile Gly Val Arg Ile Thr Gln Asn Gly 595 600 605
tet cta att tcc agt agt aat cta aca ctt tat agt act act gat atg Ser Leu Ile Ser Ser Ser Asn Leu Thr Leu Tyr Ser Thr Thr Asp Met 610 615 620
1248
1296
1344
1392
1440
1488
1536
1584
1632
1680
1728
1776
1824
1872 aat aat act tta cca cta aat gta tat gta ata gga gaa aat gga aat 192 0 Asn Asn Thr Leu Pro Leu Asn Val Tyr Val Ile Gly Glu Asn Gly Asn 625 630 635 640
tat aca ctt caa gat tta tat aat act act aat gtt tta tca aca gga 1968 Tyr Thr Leu Gln Asp Leu Tyr Asn Thr Thr Asn Val Leu Ser Thr Gly 645 650 655
gat att aca tta caa att aca gga gga gat caa aaa ata ttt att gat 2016 Asp Ile Thr Leu Gln Ile Thr Gly Gly Asp Gln Lys Ile Phe Ile Asp 660 665 670
cga ata gaa ttt gtt cct act atg cct gta cct ggt aat act aac aac 2064 Arg Ile Glu Phe Val Pro Thr Met Pro Val Pro Gly Asn Thr Asn Asn 675 680 685
aat aac ggt aat aat aac ggt aat aat aat ccc cca cac cac gtt tgt 2112 Asn Asn Gly Asn Asn Asn Gly Asn Asn Asn Pro Pro His His Val Cys 690 695 700
gca ata gct ggt aca caa caa tct tgt tct gga ccg ccc aaa ttt gaa 2160 Ala Ile Ala Gly Thr Gln Gln Ser Cys Ser Gly Pro Pro Lys Phe Glu 705 710 715 720
caa gta agt gat tta gaa aaa att aca aca caa gta tat atg tta ttc 2 2 08 Gln Val Ser Asp Leu Glu Lys Ile Thr Thr Gln Val Tyr Met Leu Phe 725 730 735
7719
aaa tct ta tag ^x*
Lys Ser
<210> SEQ ID NO: 21 <211> Comprimento: 738 <212> Tipo: PRT
<213> Organismo: Seqüência Artificial <220> Características:
<223> Outras Informações: AXMI-031(A-D)
<400> Seqüência: 21 Val Leu Met Asp Cys Asn Leu Gln Ser Gln Gln Asn Ile Pro Tyr Asn 1 5 10 15 Ala Ile Pro Val Ser Asn Val Asn Ser Leu Thr Asp Thr Val Gly Asp 20 25 30 Leu Lys Lys Ala Trp Glu Glu Phe Gln Lys Thr Gly Ser Phe Ser Leu 35 40 45 Thr Ala Leu Gln Gln Gly Phe Ser Ala Ser Gln Gly Gly Thr Phe Asn 50 55 60 Val Tyr Leu Thr Leu Leu Gln Ser Gly Ile Ser Leu Ala Gly Ser Phe 65 70 75 Gly 80 Pro Gly Gly Thr Phe Val Ala Pro Ile Ile Asn Met Val Ile Trp 85 90 95 Leu Trp Pro His Lys Asn Lys Asn Ala Asp Thr Glu Asn Leu Ile Asn 100 105 110 Leu Ile Asp Ser Glu Ile Gln Lys Gln Leu Asn Lys Ala Leu Leu Asp
115 120 125
Ala Asp Arg Asn Glu Trp Ser Ser Tyr Leu Glu Ser Ile Phe Asp Ser
130 135 140
Ser Asn Asn Leu Asn Gly Ala Ile Val Asp Ala Gln Trp Ser Gly Thr 145 150 155 160
Val Asn Thr Thr Asn Arg Thr Leu Arg Asn Pro Thr Glu Ser Asp Tyr
165 170 175
Thr Asn Val Val Thr Asn Phe Ile Ala Ala Asp Gly Asp Ile Ala Asn
180 185 190
Asn Glu Asn His Ile Met Asn Gly Asn Phe Asp Val Ala Ala Ala Pro
195 200 205
Tyr Phe Val Ile Gly Ala Thr Ala Arg Phe Ala Ala Met Gln Ser Tyr
210 215 220
Ile Lys Phe Cys Asn Ala Trp Ile Asp Lys Val Gly Leu Ser Asp Ala 225 230 235 240
Gln Leu Thr Thr Gln Lys Ala Asn Leu Asp Arg Thr Lys Gln Asn Met
245 250 255
Arg Asn Ala Ile Leu Asn Tyr Thr Gln Gln Val Met Lys Val Phe Lys
260 265 270
Asp Ser Lys Asn Met Pro Thr Ile Gly Thr Asn Lys Phe Ser Val Asp
275 280 285
Thr Tyr Asn Val Tyr Ile Lys Gly Met Thr Leu Asn Val Leu Asp Ile
290 295 300
Val Ala Ile Trp Pro Ser Leu Tyr Pro Asp Asp Tyr Thr Ser Gln Thr 305 310 315 320
Ala Leu Glu Gln Thr Arg Val Thr Phe Ser Asn Met Val Gly Gln Glu
325 330 335
Glu Gly Thr Asp Gly Ser Leu Arg Ile Tyr Asn Thr Phe Asp Ser Phe
340 345 350
Ser Tyr Gln His Ser Pro Ile Pro Asn Asn Asn Val Asn Leu Ile Ser
355 360 365
Tyr Tyr Asn Asp Glu Leu Gln Asn Leu Glu Leu Gly Val Tyr Thr Pro
370 375 380
Pro Lys Lys Gly Ser Gly Tyr Ser Tyr Pro Tyr Gly Phe Val Leu Asn 385 390 395 400
Tyr Ala Asn Ser Lys Tyr Lys Tyr Gly Asp Ser Asn Asp Pro Glu Ser
405 410 415
Leu Gly Gly Leu Ser Thr Leu Ser Ala Pro Ile Gln Gln Val Asn Ala
420 425 430
Ala Thr Gln Asn Ser Lys Tyr Leu Asp Gly Glu Ile Leu Asn Gly Ile
435 440 445
Gly Ala Ser Leu Pro Gly Tyr Cys Thr Thr Gly Cys Ser Pro Thr Glu
450 455 460
Pro Pro Phe Ser Cys Thr Ser Thr Ala Asn Gly Tyr Lys Ala Ser Cys 465 470 475 480
Asn Pro Ser Asp Thr Asn Gln Lys Ile Asn Ala Leu Tyr Pro Phe Thr
485 490 495
Gln Ala Asn Val Lys Gly Asn Thr Gly Lys Leu Gly Val Leu Ala Ser
500 505 510
Leu Val Ser Tyr Asp Leu Asn Pro Lys Asn Val Phe Gly Glu Leu Asp
515 520 525
Ser Asp Thr Asn Asn Val Ile Leu Lys Gly Ile Pro Ala Glu Lys Gly
530 535 540
Tyr Phe Pro Asn Asn Ala Arg Pro Thr Val Val Lys Glu Trp Ile Asn 545 550 555 560 Gly Ala Ser Ala Val Pro Leu Asp Ser Gly Asn Thr Leu Phe Met Thr 565 570 575 Ala Thr Asn Leu 580 Thr Ala Thr Gln Tyr 585 Arg Ile Arg Ile Arg 590 Tyr Ala Asn Pro Asn 595 Ser Asn Thr Gln Ile 600 Gly Val Arg Ile Thr 605 Gln Asn Gly Ser Leu 610 Ile Ser Ser Ser Asn 615 Leu Thr Leu Tyr Ser 620 Thr Thr Asp Met Asn Asn Thr Leu Pro Leu Asn Val Tyr Val Ile Gly Glu Asn Gly Asn 625 630 635 640 Tyr Thr Leu Gln Asp Leu Tyr Asn Thr Thr Asn Val Leu Ser Thr Gly 645 650 655 Asp Ile Thr Leu Gln Ile Thr Gly Gly Asp Gln Lys Ile Phe Ile Asp 660 665 670 Arg Ile Glu Phe Val Pro Thr Met Pro Val Pro Gly Asn Thr Asn Asn 675 680 685 Asn Asn 690 Gly Asn Asn Asn Gly 695 Asn Asn Asn Pro Pro 700 His His Val Cys Ala Ile Ala Gly Thr Gln Gln Ser Cys Ser Gly Pro Pro Lys Phe Glu 705 710 715 720 Gln Val Ser Asp Leu Glu Lys Ile Thr Thr Gln Val Tyr Met Leu Phe
725 730 735
Lys Ser
<210> SEQ ID NO: 22 <211> Comprimento: 2 015 <212> Tipo: DNA
<213> Organismo: Seqüência Artificial <220> Características:
<223> Outras Informações: axmi-031(B-C)
<221> Nome/Chave: CDS
<222> Localização: (1) . . . (2012)
<400> Seqüência: 22
atg gca ata cca gta tct aat gtt aat tcg ttg act gat aca gtt gga 48
Met Ala Ile Pro Val Ser Asn Val Asn Ser Leu Thr Asp Thr Val Gly
15 10 15
gat tta aaa aaa gca tgg gaa gaa ttt caa aaa act ggt tct ttt tca 96
Asp Leu Lys Lys Ala Trp Glu Glu Phe Gln Lys Thr Gly Ser Phe Ser
20 25 30
tta aca gct tta caa caa gga ttt tct gct tca caa gga gga aca ttc 144
Leu Thr Ala Leu Gln Gln Gly Phe Ser Ala Ser Gln Gly Gly Thr Phe
35 40 45
aat tat tta aca tta cta caa tca gga ata tca tta gct ggt tct ttt 192 Asn Tyr Leu Thr Leu Leu Gln Ser Gly Ile Ser Leu Ala Gly Ser Phe
50 55 60
gtt cct gga ggt act ttt gta gca cct att att aat atg gtt att ggt 240 Val Pro Gly Gly Thr Phe Val Ala Pro Ile Ile Asn Met Val Ile Gly
65 70 75 80 tgg tta tgg cca cat aaa aac aaa aat gcg gat aca gaa aat tta ata Trp Leu Trp Pro His Lys Asn Lys Asn Ala Asp Thr Glu Asn Leu Ile 85 90 95
aat tta att gat tca gaa att caa aaa caa tta aac aaa gct tta tta Asn Leu Ile Asp Ser Glu Ile Gln Lys Gln Leu Asn Lys Ala Leu Leu 100 105 HO
gat gca gat aga aat gag tgg age tet tat tta gaa tet ata ttt gat Asp Ala Asp Arg Asn Glu Trp Ser Ser Tyr Leu Glu Ser Ile Phe Asp 115 120 125
tet tca aat aac cta aat ggt gca att gta gat gca cag tgg tca ggc Ser Ser Asn Asn Leu Asn Gly Ala Ile Val Asp Ala Gln Trp Ser Gly 130 135 140
act gta aat act aca aat aga aca cta aga aat cca aca gaa tca gat Thr Val Asn Thr Thr Asn Arg Thr Leu Arg Asn Pro Thr Glu Ser Asp 145 150 155 160
tat aca aat gtt gtt aca aat ttt att gca gcg gat ggt gac att gca Tyr Thr Asn Val Val Thr Asn Phe Ile Ala Ala Asp Gly Asp Ile Ala 165 170 175
aat aat gaa aat cac ata atg aat ggc aac ttt gac gta gct gca gca Asn Asn Glu Asn His Ile Met Asn Gly Asn Phe Asp Val Ala Ala Ala 180 185 190
cct tat ttt gtt ata gga gca aca gca cgt ttt gca gca atg caa tet Pro Tyr Phe Val Ile Gly Ala Thr Ala Arg Phe Ala Ala Met Gln Ser 195 200 205
tat att aaa ttt tgt aat gct tgg att gat aaa gtt gga ttg agt gac Tyr Ile Lys Phe Cys Asn Ala Trp Ile Asp Lys Val Gly Leu Ser Asp 210 215 220
gca cag ctt act aca caa aag gct aat tta gat cgc acg aaa caa aat Ala Gln Leu Thr Thr Gln Lys Ala Asn Leu Asp Arg Thr Lys Gln Asn 225 230 235 240
atg cgt aat gca att ctt aac tat aca caa caa gtt atg aaa gtt ttt Met Arg Asn Ala Ile Leu Asn Tyr Thr Gln Gln Val Met Lys Val Phe 245 250 255
aaa gat tcc aaa aat atg cct aca ata ggt act aat aaa ttt agt gtt Lys Asp Ser Lys Asn Met Pro Thr Ile Gly Thr Asn Lys Phe Ser Val 260 265 270
gat acc tat aat gta tat att aaa gga atg aca tta aat gtt tta gat Asp Thr Tyr Asn Val Tyr Ile Lys Gly Met Thr Leu Asn Val Leu Asp 275 280 285
att gta gca ata tgg cct tca tta tat cca gat gat tat act tca caa Ile Val Ala Ile Trp Pro Ser Leu Tyr Pro Asp Asp Tyr Thr Ser Gln 290 295 300
288
336
384
432
480
528
576
624
672
720
768
816
864
912 aca gcc tta gaa caa aca cgt gtc act ttt tca aat atg gtt ggc caa 960 Thr Ala Leu Glu Gln Thr Arg Val Thr Phe Ser Asn Met Val Gly Gln 305 310 315 320
gaa gaa ggt aca gat gga age cta aga att tac aat act ttt gat tet Glu Glu Gly Thr Asp Gly Ser Leu Arg Ile Tyr Asn Thr Phe Asp Ser 325 330 335
ttt agt tat caa cat agt cca ata cct aat aat aat gtt aat tta att Phe Ser Tyr Gln His Ser Pro Ile Pro Asn Asn Asn Val Asn Leu Ile 340 345 350
tet tat tat aat gat gaa tta caa aat cta gaa tta gga gta tat acc Ser Tyr Tyr Asn Asp Glu Leu Gln Asn Leu Glu Leu Gly Val Tyr Thr 355 360 365
cct cct aaa aaa gga agt gga tac tet tat cct tat gga ttt gtt tta 1152 Pro Pro Lys Lys Gly Ser Gly Tyr Ser Tyr Pro Tyr Gly Phe Val Leu 370 375 380
aat tat gea aac agt aaa tat aaa tat ggt gat age aat gat cca gaa Asn Tyr Ala Asn Ser Lys Tyr Lys Tyr Gly Asp Ser Asn Asp Pro Glu 385 390 395 400
tet cta gga gga tta tet aca cta tet gea cct ata caa caa gtt aat Ser Leu Gly Gly Leu Ser Thr Leu Ser Ala Pro Ile Gln Gln Val Asn 405 410 415
gea gea act caa aac agt aaa tat cta gat gga gaa ate cta aat gga Ala Ala Thr Gln Asn Ser Lys Tyr Leu Asp Gly Glu Ile Leu Asn Gly 420 425 430
1008
1056
1104
1200
1248
1296
ata gga gea tcc tta cct ggt tat tgt act aca gga tgt tca cca aca 1344 Ile Gly Ala Ser Leu Pro Gly Tyr Cys Thr Thr Gly Cys Ser Pro Thr 435 440 445
gaa cca cct ttt agt tgt act tet acc gct aat ggc tat aaa gea age 1392 Glu Pro Pro Phe Ser Cys Thr Ser Thr Ala Asn Gly Tyr Lys Ala Ser 450 455 460
tgt aat cct tca gat aca aat caa aaa att aac gct tta tat cct ttt Cys Asn Pro Ser Asp Thr Asn Gln Lys Ile Asn Ala Leu Tyr Pro Phe 465 470 475 480
aca caa gct aat gta aag gga aac aca gga aaa tta gga gta ctg gea Thr Gln Ala Asn Val Lys Gly Asn Thr Gly Lys Leu Gly Val Leu Ala 485 490 495
agt ctt gtt tca tat gat tta aat cct aaa aat gta ttt ggt gaa tta Ser Leu Val Ser Tyr Asp Leu Asn Pro Lys Asn Val Phe Gly Glu Leu 500 505 510
gat tca gat aca aat aat gtt ate tta aaa gga att cct gea gaa aaa 1584 Asp Ser Asp Thr Asn Asn Val Ile Leu Lys Gly Ile Pro Ala Glu Lys 515 520 525
1440
1488
1536 gga tat ttt cct aat aat gcg cgt cct act gtt gta aaa gaa tgg att 1632 Gly Tyr Phe Pro Asn Asn Ala Arg Pro Thr Val Val Lys Glu Trp Ile 530 535 540
aat ggt gca agt gct gta cca ctt gat tca gga aat acc tta ttt atg 1680
Asn Gly Ala Ser Ala Val Pro Leu Asp Ser Gly Asn Thr Leu Phe Met
545 550 555 560
acg gct acg aat tta aca gct act caa tat aga att aga ata cgt tat 1728
Thr Ala Thr Asn Leu Thr Ala Thr Gln Tyr Arg Ile Arg Ile Arg Tyr 565 570 575
gca aat cca aat tca aat act caa ate ggt gta cga att aca caa aat 1776 Ala Asn Pro Asn Ser Asn Thr Gln Ile Gly Val Arg Ile Thr Gln Asn
580 585 590
ggt tet cta att tcc agt agt aat cta aca ctt tat agt act act gat Gly Ser Leu Ile Ser Ser Ser Asn Leu Thr Leu Tyr Ser Thr Thr Asp 595 600 605
1824
atg aat aat act tta cca cta aat gta tat gta ata gga gaa aat gga 1872 Met Asn Asn Thr Leu Pro Leu Asn Val Tyr Val Ile Gly Glu Asn Gly 610 615 620
aat tat aca ctt caa gat tta tat aat act act aat gtt tta tca aca 1920 Asn Tyr Thr Leu Gln Asp Leu Tyr Asn Thr Thr Asn Val Leu Ser Thr 625 630 635 640
gga gat att aca tta caa att aca gga gga gat caa aaa ata ttt att 1968 Gly Asp Ile Thr Leu Gln Ile Thr Gly Gly Asp Gln Lys Ile Phe Ile 645 650 655
gat cga ata gaa ttt gtt cct act atg cct gta cct ggt aat ta 2012
Asp Arg Ile Glu Phe Val Pro Thr Met Pro Val Pro Gly Asn 660 665 670
tag 2015
<210> SEQ ID NO: 23 <211> Comprimento: 670 <212> Tipo: PRT
<213> Organismo: Seqüência Artificial <220> Características:
<223> Outras Informações: AXMI-031(B-C)
<400> Seqüência: : 23 Met Ala Ile Pro Val Ser Asn Val Asn Ser Leu Thr Asp Thr Val Gly 1 5 10 15 Asp Leu Lys Lys 20 Ala Trp Glu Glu Phe 25 Gln Lys Thr Gly Ser 30 Phe Ser Leu Thr Ala 35 Leu Gln Gln Gly Phe 40 Ser Ala Ser Gln Gly 45 Gly Thr Phe Asn Tyr 50 Leu Thr Leu Leu Gln 55 Ser Gly Ile Ser Leu 60 Ala Gly Ser Phe Val Pro Gly Gly Thr Phe Val Ala Pro Ile Ile Asn Met Val Ile Gly 65 70 75 80 Trp Leu Trp Pro His Lys Asn Lys Asn Ala Asp Thr Glu Asn Leu Ile
85 90 95
Asn Leu Ile Asp Ser Glu Ile Gln Lys Gln Leu Asn Lys Ala Leu Leu
100 105 HO
Asp Ala Asp Arg Asn Glu Trp Ser Ser Tyr Leu Glu Ser Ile Phe Asp
115 120 125
Ser Ser Asn Asn Leu Asn Gly Ala Ile Val Asp Ala Gln Trp Ser Gly
130 135 140
Thr Val Asn Thr Thr Asn Arg Thr Leu Arg Asn Pro Thr Glu Ser Asp 145 150 155 160
Tyr Thr Asn Val Val Thr Asn Phe Ile Ala Ala Asp Gly Asp Ile Ala
165 170 175
Asn Asn Glu Asn His Ile Met Asn Gly Asn Phe Asp Val Ala Ala Ala
180 185 190
Pro Tyr Phe Val Ile Gly Ala Thr Ala Arg Phe Ala Ala Met Gln Ser
195 200 205
Tyr Ile Lys Phe Cys Asn Ala Trp Ile Asp Lys Val Gly Leu Ser Asp
210 215 220
Ala Gln Leu Thr Thr Gln Lys Ala Asn Leu Asp Arg Thr Lys Gln Asn 225 230 235 240
Met Arg Asn Ala Ile Leu Asn Tyr Thr Gln Gln Val Met Lys Val Phe
245 250 255
Lys Asp Ser Lys Asn Met Pro Thr Ile Gly Thr Asn Lys Phe Ser Val
260 265 270
Asp Thr Tyr Asn Val Tyr Ile Lys Gly Met Thr Leu Asn Val Leu Asp
275 280 285
Ile Val Ala Ile Trp Pro Ser Leu Tyr Pro Asp Asp Tyr Thr Ser Gln
290 295 300
Thr Ala Leu Glu Gln Thr Arg Val Thr Phe Ser Asn Met Val Gly Gln 305 310 315 320
Glu Glu Gly Thr Asp Gly Ser Leu Arg Ile Tyr Asn Thr Phe Asp Ser
325 330 335
Phe Ser Tyr Gln His Ser Pro Ile Pro Asn Asn Asn Val Asn Leu Ile
340 345 350
Ser Tyr Tyr Asn Asp Glu Leu Gln Asn Leu Glu Leu Gly Val Tyr Thr
355 360 365
Pro Pro Lys Lys Gly Ser Gly Tyr Ser Tyr Pro Tyr Gly Phe Val Leu
370 375 380
Asn Tyr Ala Asn Ser Lys Tyr Lys Tyr Gly Asp Ser Asn Asp Pro Glu 385 390 395 400
Ser Leu Gly Gly Leu Ser Thr Leu Ser Ala Pro Ile Gln Gln Val Asn
405 410 415
Ala Ala Thr Gln Asn Ser Lys Tyr Leu Asp Gly Glu Ile Leu Asn Gly
420 425 430
Ile Gly Ala Ser Leu Pro Gly Tyr Cys Thr Thr Gly Cys Ser Pro Thr
435 440 445
Glu Pro Pro Phe Ser Cys Thr Ser Thr Ala Asn Gly Tyr Lys Ala Ser
450 455 460
Cys Asn Pro Ser Asp Thr Asn Gln Lys Ile Asn Ala Leu Tyr Pro Phe 465 470 475 480
Thr Gln Ala Asn Val Lys Gly Asn Thr Gly Lys Leu Gly Val Leu Ala 485 490 495
Ser Leu Val Ser Tyr Asp Leu Asn Pro Lys Asn Val Phe Gly Glu Leu
500 505 510
Asp Ser Asp Thr Asn Asn Val Ile Leu Lys Gly Ile Pro Ala Glu Lys
515 520 525 Glv Tyr Phe Pro Asn Asn Ala Arg Pro Thr Val Val Lys Glu Trp Ile
530 535 540
Asn Gly Ala Ser Ala Val Pro Leu Asp Ser Gly Asn Thr Leu Phe Met 545 550 555 560
Thr Ala Thr Asn Leu Thr Ala Thr Gln Tyr Arg Ile Arg Ile Arg Tyr
565 570 575
Ala Asn Pro Asn Ser Asn Thr Gln Ile Gly Val Arg Ile Thr Gln Asn
580 585 590
Gly Ser Leu Ile Ser Ser Ser Asn Leu Thr Leu Tyr Ser Thr Thr Asp
595 600 605
Met Asn Asn Thr Leu Pro Leu Asn Val Tyr Val Ile Gly Glu Asn Gly
610 615 620
Asn Tyr Thr Leu Gln Asp Leu Tyr Asn Thr Thr Asn Val Leu Ser Thr 625 630 635 640
Gly Asp Ile Thr Leu Gln Ile Thr Gly Gly Asp Gln Lys Ile Phe Ile
645 650 655
Asp Arg Ile Glu Phe Val Pro Thr Met Pro Val Pro Gly Asn 660 665 670
<210> SEQ ID NO: 24 <211> Comprimento: 2174 <212> Tipo: DNA
<213> Organismo: Seqüência Artificial <220> Características:
<223> Outras Informações: axmi-031(B-D)
<221> Nome/Chave: CDS
<222> Localização: (1) ... (2171)
<400> Seqüência: 24
atg gca ata cca gta tct aat gtt aat tcg ttg act gat aca gtt gga 48 Met Ala Ile Pro Val Ser Asn Val Asn Ser Leu Thr Asp Thr Val Gly 1 5 10 15
gat tta aaa aaa gca tgg gaa gaa ttt caa aaa act ggt tct ttt tca 9 6 Asp Leu Lys Lys Ala Trp Glu Glu Phe Gln Lys Thr Gly Ser Phe Ser 20 25 30
tta aca gct tta caa caa gga ttt tct gct tca caa gga gga aca ttc 144 Leu Thr Ala Leu Gln Gln Gly Phe Ser Ala Ser Gln Gly Gly Thr Phe 35 40 45
aat tat tta aca tta cta caa tca gga ata tca tta gct ggt tct ttt 192 Asn Tyr Leu Thr Leu Leu Gln Ser Gly Ile Ser Leu Ala Gly Ser Phe
50
55 60
gtt cct gga ggt act ttt gta gca cct att att aat atg gtt att ggt Val Pro Gly Gly Thr Phe Val Ala Pro Ile Ile Asn Met Val Ile Gly
240
65
70 75
tgg tta tgg cca cat aaa aac aaa aat gcg gat aca gaa aat tta ata 288 Trp Leu Trp Pro His Lys Asn Lys Asn Ala Asp Thr Glu Asn Leu Ile 85 90 95 aat tta att gat tca gaa att caa aaa caa tta aac aaa gct tta tta Asn Leu Ile Asp Ser Glu Ile Gln Lys Gln Leu Asn Lys Ala Leu Leu 100 105 HO
gat gca gat aga aat gag tgg age tet tat tta gaa tet ata ttt gat Asp Ala Asp Arg Asn Glu Trp Ser Ser Tyr Leu Glu Ser Ile Phe Asp 115 120 125
tet tca aat aac cta aat ggt gca att gta gat gca cag tgg tca ggc Ser Ser Asn Asn Leu Asn Gly Ala Ile Val Asp Ala Gln Trp Ser Gly 130 135 140
act gta aat act aca aat aga aca cta aga aat cca aca gaa tca gat Thr Val Asn Thr Thr Asn Arg Thr Leu Arg Asn Pro Thr Glu Ser Asp 145 150 155 160
tat aca aat gtt gtt aca aat ttt att gca gcg gat ggt gac att gca Tyr Thr Asn Val Val Thr Asn Phe Ile Ala Ala Asp Gly Asp Ile Ala 165 170 175
aat aat gaa aat cac ata atg aat ggc aac ttt gac gta gct gca gca Asn Asn Glu Asn His Ile Met Asn Gly Asn Phe Asp Val Ala Ala Ala 180 185 190
cct tat ttt gtt ata gga gca aca gca cgt ttt gca gca atg caa tet Pro Tyr Phe Val Ile Gly Ala Thr Ala Arg Phe Ala Ala Met Gln Ser 195 200 205
tat att aaa ttt tgt aat gct tgg att gat aaa gtt gga ttg agt gac Tyr Ile Lys Phe Cys Asn Ala Trp Ile Asp Lys Val Gly Leu Ser Asp 210 215 220
gca cag ctt act aca caa aag gct aat tta gat cgc acg aaa caa aat Ala Gln Leu Thr Thr Gln Lys Ala Asn Leu Asp Arg Thr Lys Gln Asn 225 230 235 240
atg cgt aat gca att ctt aac tat aca caa caa gtt atg aaa gtt ttt Met Arg Asn Ala Ile Leu Asn Tyr Thr Gln Gln Val Met Lys Val Phe 245 250 255
aaa gat tcc aaa aat atg cct aca ata ggt act aat aaa ttt agt gtt Lys Asp Ser Lys Asn Met Pro Thr Ile Gly Thr Asn Lys Phe Ser Val 260 265 270
gat acc tat aat gta tat att aaa gga atg aca tta aat gtt tta gat Asp Thr Tyr Asn Val Tyr Ile Lys Gly Met Thr Leu Asn Val Leu Asp 275 280 285
att gta gca ata tgg cct tca tta tat cca gat gat tat act tca caa Ile Val Ala Ile Trp Pro Ser Leu Tyr Pro Asp Asp Tyr Thr Ser Gln 290 295 300
aca gcc tta gaa caa aca cgt gtc act ttt tca aat atg gtt ggc caa Thr Ala Leu Glu Gln Thr Arg Val Thr Phe Ser Asn Met Val Gly Gln 305 310 315 320
336
384
432
480
528
576
624
672
720
768
816
864
912
960 gaa gaa ggt aca gat gga age cta aga att tac aat act ttt gat tet Glu Glu Gly Thr Asp Gly Ser Leu Arg Ile Tyr Asn Thr Phe Asp Ser 325 330 335
ttt agt tat caa cat agt cca ata cct aat aat aat gtt aat tta att Phe Ser Tyr Gln His Ser Pro Ile Pro Asn Asn Asn Val Asn Leu Ile 340 345 350
tet tat tat aat gat gaa tta caa aat cta gaa tta gga gta tat acc Ser Tyr Tyr Asn Asp Glu Leu Gln Asn Leu Glu Leu Gly Val Tyr Thr 355 360 365
aat tat gea aac agt aaa tat aaa tat ggt gat age aat gat cca gaa Asn Tyr Ala Asn Ser Lys Tyr Lys Tyr Gly Asp Ser Asn Asp Pro Glu 385 390 395 400
tet cta gga gga tta tet aca cta tet gea cct ata caa caa gtt aat Ser Leu Gly Gly Leu Ser Thr Leu Ser Ala Pro Ile Gln Gln Val Asn 405 410 415
gea gea act caa aac agt aaa tat cta gat gga gaa ate cta aat gga Ala Ala Thr Gln Asn Ser Lys Tyr Leu Asp Gly Glu Ile Leu Asn Gly 420 425 430
ata gga gea tcc tta cct ggt tat tgt act aca gga tgt tca cca aca Ile Gly Ala Ser Leu Pro Gly Tyr Cys Thr Thr Gly Cys Ser Pro Thr 435 440 445
gaa cca cct ttt agt tgt act tet acc gct aat ggc tat aaa gea age Glu Pro Pro Phe Ser Cys Thr Ser Thr Ala Asn Gly Tyr Lys Ala Ser 450 455 460
tgt aat cct tca gat aca aat caa aaa att aac gct tta tat cct ttt Cys Asn Pro Ser Asp Thr Asn Gln Lys Ile Asn Ala Leu Tyr Pro Phe 465 470 475 480
aca caa gct aat gta aag gga aac aca gga aaa tta gga gta ctg gea Thr Gln Ala Asn Val Lys Gly Asn Thr Gly Lys Leu Gly Val Leu Ala 485 490 495
1008
1056
1104
cct cct aaa aaa gga agt gga tac tet tat cct tat gga ttt gtt tta 1152 Pro Pro Lys Lys Gly Ser Gly Tyr Ser Tyr Pro Tyr Gly Phe Val Leu 370 375 380
1200
1248
1296
1344
1392
1440
1488
agt ctt gtt tca tat gat tta aat cct aaa aat gta ttt ggt gaa tta 1536 Ser Leu Val Ser Tyr Asp Leu Asn Pro Lys Asn Val Phe Gly Glu Leu 500 505 510
gat tca gat aca aat aat gtt ate tta aaa gga att cct gea gaa aaa Asp Ser Asp Thr Asn Asn Val Ile Leu Lys Gly Ile Pro Ala Glu Lys 515 520 525
gga tat ttt cct aat aat gcg cgt cct act gtt gta aaa gaa tgg att Gly Tyr Phe Pro Asn Asn Ala Arg Pro Thr Val Val Lys Glu Trp Ile 530 535 540
1584
1632 aat ggt gca agt gct gta cca ctt gat tca gga aat acc tta ttt atg 1680 Asn Gly Ala Ser Ala Val Pro Leu Asp Ser Gly Asn Thr Leu Phe Met 545 550 555 560
acg gct acg aat tta aca gct act caa tat aga att aga ata cgt tat Thr Ala Thr Asn Leu Thr Ala Thr Gln Tyr Arg Ile Arg Ile Arg Tyr 565 570 575
gca aat cca aat tca aat act caa ate ggt gta cga att aca caa aat Ala Asn Pro Asn Ser Asn Thr Gln Ile Gly Val Arg Ile Thr Gln Asn 580 585 590
ggt tet cta att tcc agt agt aat cta aca ctt tat agt act act gat Gly Ser Leu Ile Ser Ser Ser Asn Leu Thr Leu Tyr Ser Thr Thr Asp 595 600 605
atg aat aat act tta cca cta aat gta tat gta ata gga gaa aat gga Met Asn Asn Thr Leu Pro Leu Asn Val Tyr Val Ile Gly Glu Asn Gly 610 615 620
aat tat aca ctt caa gat tta tat aat act act aat gtt tta tca aca 1920 Asn Tyr Thr Leu Gln Asp Leu Tyr Asn Thr Thr Asn Val Leu Ser Thr 625 630 635 640
1728
1776
1824
1872
gga gat att aca tta caa att aca gga gga gat caa aaa ata ttt att Gly Asp Ile Thr Leu Gln Ile Thr Gly Gly Asp Gln Lys Ile Phe Ile 645 650 655
gat cga ata gaa ttt gtt cct act atg cct gta cct ggt aat act aac Asp Arg Ile Glu Phe Val Pro Thr Met Pro Val Pro Gly Asn Thr Asn 660 665 670
aac aat aac ggt aat aat aac ggt aat aat aat ccc cca cac cac gtt Asn Asn Asn Gly Asn Asn Asn Gly Asn Asn Asn Pro Pro His His Val 675 680 685
tgt gca ata gct ggt aca caa caa tet tgt tet gga ccg ccc aaa ttt Cys Ala Ile Ala Gly Thr Gln Gln Ser Cys Ser Gly Pro Pro Lys Phe 690 695 700
gaa caa gta agt gat tta gaa aaa att aca aca caa gta tat atg tta Glu Gln Val Ser Asp Leu Glu Lys Ile Thr Thr Gln Val Tyr Met Leu 705 710 715 720
ttc aaa tet ta tag Phe Lys Ser
1968
2016
2064
2112
2160
2174
<210> SEQ ID NO: 25 <211> Comprimento: 723 <212> Tipo: PRT
<213> Organismo: Seqüência Artificial <220> Características:
<223> Outras Informações: AXMI-031(B-D) <400> Seqüência: 25 Met Ala Ile Pro Val Ser Asn Val Asn Ser Leu Thr Asp Thr Val Gly 1 5 10 15 Asp Leu Lys Lys Ala Trp Glu Glu Phe Gln Lys Thr Gly Ser Phe Ser 20 25 30 Leu Thr Ala Leu Gln Gln Gly Phe Ser Ala Ser Gln Gly Gly Thr Phe 35 40 45 Asn Tyr Leu Thr Leu Leu Gln Ser Gly Ile Ser Leu Ala Gly Ser Phe 50 55 60 Val Pro Gly Gly Thr Phe Val Ala Pro Ile Ile Asn Met Val Ile Gly 65 70 75 80 Trp Leu Trp Pro His Lys Asn Lys Asn Ala Asp Thr Glu Asn Leu Ile 85 90 95 Asn Leu Ile Asp Ser Glu Ile Gln Lys Gln Leu Asn Lys Ala Leu Leu 100 105 110 Asp Ala Asp Arg Asn Glu Trp Ser Ser Tyr Leu Glu Ser Ile Phe Asp 115 120 125 Ser Ser Asn Asn Leu Asn Gly Ala Ile Val Asp Ala Gln Trp Ser Gly 130 135 140 Thr Val Asn Thr Thr Asn Arg Thr Leu Arg Asn Pro Thr Glu Ser Asp 145 150 155 160 Tyr Thr Asn Val Val Thr Asn Phe Ile Ala Ala Asp Gly Asp Ile Ala 165 170 175 Asn Asn Glu Asn His Ile Met Asn Gly Asn Phe Asp Val Ala Ala Ala 180 185 190 Pro Tyr Phe Val Ile Gly Ala Thr Ala Arg Phe Ala Ala Met Gln Ser 195 200 205 Tyr Ile Lys Phe Cys Asn Ala Trp Ile Asp Lys Val Gly Leu Ser Asp 210 215 220 Ala Gln Leu Thr Thr Gln Lys Ala Asn Leu Asp Arg Thr Lys Gln Asn 225 230 235 240 Met Arg Asn Ala Ile Leu Asn Tyr Thr Gln Gln Val Met Lys Val Phe 245 250 255 Lys Asp Ser Lys Asn Met Pro Thr Ile Gly Thr Asn Lys Phe Ser Val 260 265 270 Asp Thr Tyr Asn Val Tyr Ile Lys Gly Met Thr Leu Asn Val Leu Asp 275 280 285 Ile Val Ala Ile Trp Pro Ser Leu Tyr Pro Asp Asp Tyr Thr Ser Gln 290 295 300 Thr Ala Leu Glu Gln Thr Arg Val Thr Phe Ser Asn Met Val Gly Gln 305 310 315 320 Glu Glu Gly Thr Asp Gly Ser Leu Arg Ile Tyr Asn Thr Phe Asp Ser 325 330 335 Phe Ser Tyr Gln His Ser Pro Ile Pro Asn Asn Asn Val Asn Leu Ile 340 345 350 Ser Tyr Tyr Asn Asp Glu Leu Gln Asn Leu Glu Leu Gly Val Tyr Thr 355 360 365 Pro Pro Lys Lys Gly Ser Gly Tyr Ser Tyr Pro Tyr Gly Phe Val Leu 370 375 380 Asn Tyr Ala Asn Ser Lys Tyr Lys Tyr Gly Asp Ser Asn Asp Pro Glu 385 390 395 400 Ser Leu Gly Gly Leu Ser Thr Leu Ser Ala Pro Ile Gln Gln Val Asn 405 410 415 Ala Ala Thr Gln Asn Ser Lys Tyr Leu Asp Gly Glu Ile Leu Asn Gly 420 425 430 Ile Gly Ala Ser Leu Pro Gly Tyr Cys Thr Thr Gly Cys Ser Pro Thr 435 440 445 Glu Pro Pro Phe Ser Cys Thr Ser Thr Ala Asn Gly Tyr Lys Ala Ser
450 455 460
Cys Asn Pro Ser Asp Thr Asn Gln Lys Ile Asn Ala Leu Tyr Pro Phe 465 470 475 480
Thr Gln Ala Asn Val Lys Gly Asn Thr Gly Lys Leu Gly Val Leu Ala
485 490 495
Ser Leu Val Ser Tyr Asp Leu Asn Pro Lys Asn Val Phe Gly Glu Leu
500 505 510
Asp Ser Asp Thr Asn Asn Val Ile Leu Lys Gly Ile Pro Ala Glu Lys
515 520 525
Gly Tyr Phe Pro Asn Asn Ala Arg Pro Thr Val Val Lys Glu Trp Ile
530 535 540
Asn Gly Ala Ser Ala Val Pro Leu Asp Ser Gly Asn Thr Leu Phe Met 545 550 555 560
Thr Ala Thr Asn Leu Thr Ala Thr Gln Tyr Arg Ile Arg Ile Arg Tyr
565 570 575
Ala Asn Pro Asn Ser Asn Thr Gln Ile Gly Val Arg Ile Thr Gln Asn
580 585 590
Gly Ser Leu Ile Ser Ser Ser Asn Leu Thr Leu Tyr Ser Thr Thr Asp
595 600 605
Met Asn Asn Thr Leu Pro Leu Asn Val Tyr Val Ile Gly Glu Asn Gly
610 615 620
Asn Tyr Thr Leu Gln Asp Leu Tyr Asn Thr Thr Asn Val Leu Ser Thr 625 630 635 640
Gly Asp Ile Thr Leu Gln Ile Thr Gly Gly Asp Gln Lys Ile Phe Ile
645 650 655
Asp Arg Ile Glu Phe Val Pro Thr Met Pro Val Pro Gly Asn Thr Asn
660 665 670
Asn Asn Asn Gly Asn Asn Asn Gly Asn Asn Asn Pro Pro His His Val
675 680 685
Cys Ala Ile Ala Gly Thr Gln Gln Ser Cys Ser Gly Pro Pro Lys Phe
690 695 700
Glu Gln Val Ser Asp Leu Glu Lys Ile Thr Thr Gln Val Tyr Met Leu 705 710 715 720
Phe Lys Ser
<210> SEQ ID NO: 26 <211> Comprimento: 2226 <212> Tipo: DNA
<213> Organismo: Seqüência Artificial <220> Características:
<223> Outras Informações: synaxmi-031(A-D)
<221> Nome/Chave: CDS
<222> Localização: (1)...(2226)
<400> Seqüência: 26
atg cag ate ctt gat tgc aat ctc cag age cag cag aat ate cca tac
Met Gln Ile Leu Asp Cys Asn Leu Gln Ser Gln Gln Asn Ile Pro Tyr 15 10 15
aat gtg ctt gct ate cct gtt age aat gtt aat age ctt acg gat acg Asn Val Leu Ala Ile Pro Val Ser Asn Val Asn Ser Leu Thr Asp Thr gtt ggc gat cta aag aag gca tgg gaa gag ttc cag aag acg ggc age 144
Val Gly Asp Leu Lys Lys Ala Trp Glu Glu Phe Gln Lys Thr Gly Ser 35 40 45
ttc tcc ctt acc gca ctc cag cag ggc ttc age gct tcc cag ggc ggg 192
Phe Ser Leu Thr Ala Leu Gln Gln Gly Phe Ser Ala Ser Gln Gly Gly
50 55 60
acg ttc aat tac ctc acc ctc ctc cag tcc ggg ate tcc ctg gct ggc Thr Phe Asn Tyr Leu Thr Leu Leu Gln Ser Gly Ile Ser Leu Ala Gly 65 70 75 80
tcc ggc acc gtg aat acg acc aat cgt acg ctt cgt aat cct acg gaa Ser Gly Thr Val Asn Thr Thr Asn Arg Thr Leu Arg Asn Pro Thr Glu 165 170 175
240
age ttc gtg cct ggc ggc acc ttc gtt gct cca ate ate aat atg gtg 2 88
Ser Phe Val Pro Gly Gly Thr Phe Val Ala Pro Ile Ile Asn Met Val 85 90 95
ate ggc tgg ctc tgg cct cat aag aat aag aat gca gat acg gaa aat 336
Ile Gly Trp Leu Trp Pro His Lys Asn Lys Asn Ala Asp Thr Glu Asn 100 105 110
ctg ate aat ctg ate gat tca gaa ate cag aag cag ctg aat aag gct 3 84
Leu Ile Asn Leu Ile Asp Ser Glu Ile Gln Lys Gln Leu Asn Lys Ala
115 120 125
ctg ctg gat gct gat cgc aat gaa tgg age age tac ctc gag tcc ate Leu Leu Asp Ala Asp Arg Asn Glu Trp Ser Ser Tyr Leu Glu Ser Ile 130 135 140
ttc gat age age aat aat ctg aat ggc gca ate gtt gat gct cag tgg 480 Phe Asp Ser Ser Asn Asn Leu Asn Gly Ala Ile Val Asp Ala Gln Trp 145 150 155 160
432
528
tca gat tac acc aat gtg gtg acg aat ttc ate gca gca gat ggg gat 576 Ser Asp Tyr Thr Asn Val Val Thr Asn Phe Ile Ala Ala Asp Gly Asp 180 185 190
ate gct aat aat gaa aat cat ate atg aat ggg aat ttc gat gtg gca 624 Ile Ala Asn Asn Glu Asn His Ile Met Asn Gly Asn Phe Asp Val Ala 195 200 205
gca gct cca tac ttc gtt ate ggg gct acc gct aga ttc gca gct atg 672 Ala Ala Pro Tyr Phe Val Ile Gly Ala Thr Ala Arg Phe Ala Ala Met 210 215 220
cag tcc tac ate aag ttc tgc aat gca tgg ate gat aag gtt ggg ctg Gln Ser Tyr Ile Lys Phe Cys Asn Ala Trp Ile Asp Lys Val Gly Leu 225 230 235 240
tca gat gct cag ctg acc acg cag aag gct aat ctg gat aga acg aag Ser Asp Ala Gln Leu Thr Thr Gln Lys Ala Asn Leu Asp Arg Thr Lys 245 250 255
720
768 cag aat atg cgt aat gct ate ctt aat tac acc cag cag gtt atg aag 816
Gln Asn Met Arg Asn Ala Ile Leu Asn Tyr Thr Gln Gln Val Met Lys 260 265 270
gtt ttc aag gat tcc aag aat atg cca acg ate ggc acg aat aag ttc 864
Val Phe Lys Asp Ser Lys Asn Met Pro Thr Ile Gly Thr Asn Lys Phe 275 280 285
age gtt gat acc tac aat gtt tac ate aag ggg atg acg ctt aat gtg 912
Ser Val Asp Thr Tyr Asn Val Tyr Ile Lys Gly Met Thr Leu Asn Val 290 295 300
ctt gat ate gtt gct ate tgg cca age ctg tac cca gat gat tac acg 960
Leu Asp Ile Val Ala Ile Trp Pro Ser Leu Tyr Pro Asp Asp Tyr Thr
305 310 315 320
tca cag acg gct ctg gaa cag acc cgc gtg acg ttc tcc aat atg gtg 1008
Ser Gln Thr Ala Leu Glu Gln Thr Arg Val Thr Phe Ser Asn Met Val 325 330 335
ggg cag gaa gaa ggc acg gat ggc age ctc aga ate tac aat acc ttc 1056
Gly Gln Glu Glu Gly Thr Asp Gly Ser Leu Arg Ile Tyr Asn Thr Phe 340 345 350
gat age ttc tcc tac cag cat age cct ate cct aat aat aat gtg aat 1104
Asp Ser Phe Ser Tyr Gln His Ser Pro Ile Pro Asn Asn Asn Val Asn 355 360 365
ctc ate age tac tac aat gat gaa ctt cag aat ctg gaa ctc ggg gtt 1152
Leu Ile Ser Tyr Tyr Asn Asp Glu Leu Gln Asn Leu Glu Leu Gly Val 370 375 380
tac acc cca cca aag aag ggc tca ggc tac age tac cca tac ggg ttc 12 00
Tyr Thr Pro Pro Lys Lys Gly Ser Gly Tyr Ser Tyr Pro Tyr Gly Phe
385 390 395 400
gtg ctg aat tac gea aat age aag tac aag tac ggc gat tcc aat gat 1248
Val Leu Asn Tyr Ala Asn Ser Lys Tyr Lys Tyr Gly Asp Ser Asn Asp 405 410 415
cca gaa tcc ctc ggc ggg ctt tcc acc ctt age gct cca ate caa cag 1296
Pro Glu Ser Leu Gly Gly Leu Ser Thr Leu Ser Ala Pro Ile Gln Gln 420 425 430
gtt aat gct gct acc cag aat age aag tac ctt gat ggc gaa ate ctg 1344
Val Asn Ala Ala Thr Gln Asn Ser Lys Tyr Leu Asp Gly Glu Ile Leu 435 440 445
aat ggg ate ggc gea age ctg cct ggc tac tgc acg acc ggg tgc tca 1392
Asn Gly Ile Gly Ala Ser Leu Pro Gly Tyr Cys Thr Thr Gly Cys Ser 450 455 460
cct acc gaa cca cca ttc age tgc acg age acg gea aat ggg tac aag 1440
Pro Thr Glu Pro Pro Phe Ser Cys Thr Ser Thr Ala Asn Gly Tyr Lys
465 470 475 480 gca age tgc aat cca age gat acc aat cag aag ate aat gct etc tac 1488 Ala Ser Cys Asn Pro Ser Asp Thr Asn Gln Lys Ile Asn Ala Leu Tyr 485 490 495
cca ttc acg cag gca aat gtg aag ggg aat acc ggg aag ctg ggc gtt Pro Phe Thr Gln Ala Asn Val Lys Gly Asn Thr Gly Lys Leu Gly Val 500 505 510
ctc gca age ctt gtt age tac gat ctg aat cct aag aat gtt ttc ggg Leu Ala Ser Leu Val Ser Tyr Asp Leu Asn Pro Lys Asn Val Phe Gly 515 520 525
gaa ctc gat tca gat acc aat aat gtt ate ctt aag ggc ate cca gca Glu Leu Asp Ser Asp Thr Asn Asn Val Ile Leu Lys Gly Ile Pro Ala 530 535 540
gaa aag ggc tac ttc cca aat aat gca aga cca acc gtt gtg aag gaa Glu Lys Gly Tyr Phe Pro Asn Asn Ala Arg Pro Thr Val Val Lys Glu 545 550 555 560
tgg ate aat ggg gct tcc gca gtt cca ctt gat tcc ggc aat acc ctg Trp Ile Asn Gly Ala Ser Ala Val Pro Leu Asp Ser Gly Asn Thr Leu 565 570 575
ttc atg acg gct acg aac ctg acg gct acc cag tac aga ate cgc ate 1776 Phe Met Thr Ala Thr Asn Leu Thr Ala Thr Gln Tyr Arg Ile Arg Ile 580 585 590
1536
1584
1632
1680
1728
cgt tac gct aac cca aac tca aac acg cag ate ggc gtt aga ate acg Arg Tyr Ala Asn Pro Asn Ser Asn Thr Gln Ile Gly Val Arg Ile Thr 595 600 605
cag aac ggg age ctc ate tcc tcc tcc aac ctc acg ctg tac tca acc Gln Asn Gly Ser Leu Ile Ser Ser Ser Asn Leu Thr Leu Tyr Ser Thr 610 615 620
acc gat atg aac aac acc ctg cca ctg aac gtt tac gtg ate ggg gaa Thr Asp Met Asn Asn Thr Leu Pro Leu Asn Val Tyr Val Ile Gly Glu 625 630 635 640
aac ggg aac tac acc ctc cag gat ctc tac aac acg acg aac gtt ctg Asn Gly Asn Tyr Thr Leu Gln Asp Leu Tyr Asn Thr Thr Asn Val Leu 645 650 655
tcc acg ggc gat ate acc ctg cag ate acc ggc ggg gat cag aag ata Ser Thr Gly Asp Ile Thr Leu Gln Ile Thr Gly Gly Asp Gln Lys Ile 660 665 670
ttc ate gat cgc ate gag ttc gtg cct acg atg cca gtg cca ggc aac Phe Ile Asp Arg Ile Glu Phe Val Pro Thr Met Pro Val Pro Gly Asn 675 680 685
acc aac aac aac aac ggc aac aac aac ggc aac aac aac ccc ccc cat Thr Asn Asn Asn Asn Gly Asn Asn Asn Gly Asn Asn Asn Pro Pro His 690 695 700
1824
1872
1920
1968
2016
2064
2112 cat gtc tgc gct ata gct ggt act cag cag tct tgc tca ggt cct cct His Val Cys Ala Ile Ala Gly Thr Gln Gln Ser Cys Ser Gly Pro Pro 705 710 715 720
aag ttc gag cag gtt tct gat ctc gag aag ate acc acc cag gtc tac Lys Phe Glu Gln Val Ser Asp Leu Glu Lys Ile Thr Thr Gln Val Tyr 725 730 735
atg ctg ttc aag tcc taa Met Leu Phe Lys Ser * 740
2160
2208
2226
<210> SEQ ID NO: 27 <211> Comprimento: 741 <212> Tipo: PRT
<213> Organismo: Seqüência Artificial <220> Características:
<223> Outras Informações: SYNAXMI-031(A-D)
<400> Seqüência: 27
Met Gln Ile Leu Asp Cys Asn Leu Gln Ser Gln Gln Asn Ile Pro Tyr 1 5 10 15 Asn Val Leu Ala 20 Ile Pro Val Ser Asn 25 Val Asn Ser Leu Thr 30 Asp Thr Val Gly Asp Leu Lys Lys Ala Trp Glu Glu Phe Gln Lys Thr Gly Ser 35 40 45 Phe Ser Leu Thr Ala Leu Gln Gln Gly Phe Ser Ala Ser Gln Gly Gly 50 55 60 Gly Thr Phe Asn Tyr Leu Thr Leu Leu Gln Ser Gly Ile Ser Leu Ala 65 70 75 80 Ser Phe Val Pro Gly 85 Gly Thr Phe Val Ala 90 Pro Ile Ile Asn Met 95 Val Ile Gly Trp Leu Trp Pro His Lys Asn Lys Asn Ala Asp Thr Glu Asn 100 105 110 Leu Ile Asn Leu Ile Asp Ser Glu Ile Gln Lys Gln Leu Asn Lys Ala 115 120 125 Ile Leu Leu 130 Asp Ala Asp Arg Asn 135 Glu Trp Ser Ser Tyr 140 Leu Glu Ser Phe Asp Ser Ser Asn Asn Leu Asn Gly Ala Ile Val Asp Ala Gln Trp 145 150 155 160 Ser Gly Thr Val Asn Thr Thr Asn Arg Thr Leu Arg Asn Pro Thr Glu 165 170 175 Ser Asp Tyr Thr Asn Val Val Thr Asn Phe Ile Ala Ala Asp Gly Asp 180 185 190 Ile Ala Asn 195 Asn Glu Asn His Ile 200 Met Asn Gly Asn Phe 205 Asp Val Ala Ala Ala 210 Pro Tyr Phe Val Ile 215 Gly Ala Thr Ala Arg 220 Phe Ala Ala Met Gln Ser Tyr Ile Lys Phe Cys Asn Ala Trp Ile Asp Lys Val Gly Leu 225 230 235 240 Ser Asp Ala Gln Leu Thr Thr Gln Lys Ala Asn Leu Asp Arg Thr Lys 245 250 255 Gln Asn Met Arg 260 Asn Ala Ile Leu Asn 265 Tyr Thr Gln Gln Val 270 Met Lys Val Phe Lys Asp Ser Lys Asn Met Pro Thr Ile Gly Thr Asn Lys Phe
Ser Val Asp Thr Tyr Asn Val Tyr Ile Lys Gly Met Thr Leu Asn Val
Leu Asp Ile Val Ala Ile Trp Pro Ser Leu Tyr Pro Asp Asp Tyr Thr
Ser Gln Thr Ala Leu Glu Gln Thr Arg Val Thr Phe Ser Asn Met Val
Gly Gln Glu Glu Gly Thr Asp Gly Ser Leu Arg Ile Tyr Asn Thr Phe
Asp Ser Phe Ser Tyr Gln His Ser Pro Ile Pro Asn Asn Asn Val Asn
Leu Ile Ser Tyr Tyr Asn Asp Glu Leu Gln Asn Leu Glu Leu Gly Val
Tyr Thr Pro Pro Lys Lys Gly Ser Gly Tyr Ser Tyr Pro Tyr Gly Phe
Val Leu Asn Tyr Ala Asn Ser Lys Tyr Lys Tyr Gly Asp Ser Asn Asp
Pro Glu Ser Leu Gly Gly Leu Ser Thr Leu Ser Ala Pro Ile Gln Gln
Val Asn Ala Ala Thr Gln Asn Ser Lys Tyr Leu Asp Gly Glu Ile Leu
Asn Gly Ile Gly Ala Ser Leu Pro Gly Tyr Cys Thr Thr Gly Cys Ser
Pro Thr Glu Pro Pro Phe Ser Cys Thr Ser Thr Ala Asn Gly Tyr Lys
Ala Ser Cys Asn Pro Ser Asp Thr Asn Gln Lys Ile Asn Ala Leu Tyr
Pro Phe Thr Gln Ala Asn Val Lys Gly Asn Thr Gly Lys Leu Gly Val
Leu Ala Ser Leu Val Ser Tyr Asp Leu Asn Pro Lys Asn Val Phe Gly
Glu Leu Asp Ser Asp Thr Asn Asn Val Ile Leu Lys Gly Ile Pro Ala
Glu Lys Gly Tyr Phe Pro Asn Asn Ala Arg Pro Thr Val Val Lys Glu
Trp Ile Asn Gly Ala Ser Ala Val Pro Leu Asp Ser Gly Asn Thr Leu
Phe Met Thr Ala Thr Asn Leu Thr Ala Thr Gln Tyr Arg Ile Arg Ile
Arg Tyr Ala Asn Pro Asn Ser Asn Thr Gln Ile Gly Val Arg Ile Thr
Gln Asn Gly Ser Leu Ile Ser Ser Ser Asn Leu Thr Leu Tyr Ser Thr
Thr Asp Met Asn Asn Thr Leu Pro Leu Asn Val Tyr Val Ile Gly Glu
Asn Gly Asn Tyr Thr Leu Gln Asp Leu Tyr Asn Thr Thr Asn Val Leu
Ser Thr Gly Asp Ile Thr Leu Gln Ile Thr Gly Gly Asp Gln Lys Ile
Phe Ile Asp Arg Ile Glu Phe Val Pro Thr Met Pro Val Pro Gly Asn
Thr Asn Asn Asn Asn Gly Asn Asn Asn Gly Asn Asn Asn Pro Pro His
His Val Cys Ala Ile Ala Gly Thr Gln Gln Ser Cys Ser Gly Pro Pro Lys Phe Glu Gln Val Ser Asp Leu Glu Lys Ile Thr Thr Gln Val Tyr
725 730 735
Met Leu Phe Lys Ser 740
<210> SEQ ID NO: 28 <211> Comprimento: 2316 <212> Tipo: DNA
<213> Organismo: Seqüência Artificial <220> Características:
<223> Outras Informações: aposynaxmi-031(A-D)
<221> Nome/Chave: CDS
<222> Localização: (1) . . . (2316)
<400> Seqüência: 28
atg cag ate ctt ggg tac tcc age ttc gtt gct ate gct ctt ctt atg 48
Met Gln Ile Leu Gly Tyr Ser Ser Phe Val Ala Ile Ala Leu Leu Met 15 10 15
age gtg gtt gtt gtt tgc aat ggg ggc aag acg tcc acc tac gtg cgt 96 Ser Val Val Val Val Cys Asn Gly Gly Lys Thr Ser Thr Tyr Val Arg 20 25 30
aat ctg gat tgc aat ctc cag age cag cag aat ate cca tac aat gtg Asn Leu Asp Cys Asn Leu Gln Ser Gln Gln Asn Ile Pro Tyr Asn Val 35 40 45
ctt gct ate cct gtt age aat gtt aat age ctt acg gat acg gtt ggc Leu Ala Ile Pro Val Ser Asn Val Asn Ser Leu Thr Asp Thr Val Gly 50 55 60
gat cta aag aag gea tgg gaa gag ttc cag aag acg ggc age ttc tcc Asp Leu Lys Lys Ala Trp Glu Glu Phe Gln Lys Thr Gly Ser Phe Ser 65 70 75 80
ctt acc gea ctc cag cag ggc ttc age gct tcc cag ggc ggg acg ttc Leu Thr Ala Leu Gln Gln Gly Phe Ser Ala Ser Gln Gly Gly Thr Phe 85 90 95
aat tac ctc acc ctc ctc cag tcc ggg ate tcc ctg gct ggc age ttc Asn Tyr Leu Thr Leu Leu Gln Ser Gly Ile Ser Leu Ala Gly Ser Phe 100 105 HO
gtg cct ggc ggc acc ttc gtt gct cca ate ate aat atg gtg ate ggc 384 Val Pro Gly Gly Thr Phe Val Ala Pro Ile Ile Asn Met Val Ile Gly 115 120 125
144
192
240
288
336
tgg ctc tgg cct cat aag aat aag aat gea gat acg gaa aat ctg ate Trp Leu Trp Pro His Lys Asn Lys Asn Ala Asp Thr Glu Asn Leu Ile 130 135 140
aat ctg ate gat tca gaa ate cag aag cag ctg aat aag gct ctg ctg Asn Leu Ile Asp Ser Glu Ile Gln Lys Gln Leu Asn Lys Ala Leu Leu 145 150 155 160
432
480 gat gct gat cgc aat gaa tgg age age tac ctc gag tcc ate ttc gat Asp Ala Asp Arg Asn Glu Trp Ser Ser Tyr Leu Glu Ser Ile Phe Asp 165 170 175
age age aat aat ctg aat ggc gea ate gtt gat gct cag tgg tcc ggc Ser Ser Asn Asn Leu Asn Gly Ala Ile Val Asp Ala Gln Trp Ser Gly 180 185 190
acc gtg aat acg acc aat cgt acg ctt cgt aat cct acg gaa tca gat Thr Val Asn Thr Thr Asn Arg Thr Leu Arg Asn Pro Thr Glu Ser Asp 195 200 205
tac acc aat gtg gtg acg aat ttc ate gea gea gat ggg gat ate gct Tyr Thr Asn Val Val Thr Asn Phe Ile Ala Ala Asp Gly Asp Ile Ala 210 215 220
aat aat gaa aat cat ate atg aat ggg aat ttc gat gtg gea gea gct Asn Asn Glu Asn His Ile Met Asn Gly Asn Phe Asp Val Ala Ala Ala 225 230 235 240
cca tac ttc gtt ate ggg gct acc gct aga ttc gea gct atg cag tcc Pro Tyr Phe Val Ile Gly Ala Thr Ala Arg Phe Ala Ala Met Gln Ser 245 250 255
tac ate aag ttc tgc aat gea tgg ate gat aag gtt ggg ctg tca gat Tyr Ile Lys Phe Cys Asn Ala Trp Ile Asp Lys Val Gly Leu Ser Asp 260 265 270
gct cag ctg acc acg cag aag gct aat ctg gat aga acg aag cag aat Ala Gln Leu Thr Thr Gln Lys Ala Asn Leu Asp Arg Thr Lys Gln Asn 275 280 285
atg cgt aat gct ate ctt aat tac acc cag cag gtt atg aag gtt ttc Met Arg Asn Ala Ile Leu Asn Tyr Thr Gln Gln Val Met Lys Val Phe 290 295 300
aag gat tcc aag aat atg cca acg ate ggc acg aat aag ttc age gtt Lys Asp Ser Lys Asn Met Pro Thr Ile Gly Thr Asn Lys Phe Ser Val 305 310 315 320
gat acc tac aat gtt tac ate aag ggg atg acg ctt aat gtg ctt gat Asp Thr Tyr Asn Val Tyr Ile Lys Gly Met Thr Leu Asn Val Leu Asp 325 330 335
ate gtt gct ate tgg cca age ctg tac cca gat gat tac acg tca cag Ile Val Ala Ile Trp Pro Ser Leu Tyr Pro Asp Asp Tyr Thr Ser Gln 340 345 350
acg gct ctg gaa cag acc cgc gtg acg ttc tcc aat atg gtg ggg cag Thr Ala Leu Glu Gln Thr Arg Val Thr Phe Ser Asn Met Val Gly Gln 355 360 365
gaa gaa ggc acg gat ggc age ctc aga ate tac aat acc ttc gat age Glu Glu Gly Thr Asp Gly Ser Leu Arg Ile Tyr Asn Thr Phe Asp Ser 370 375 380
528
576
624
672
720
768
816
864
912
960
1008
1056
1104
1152 ttc tcc Phe Ser 385
age tac Ser Tyr
cca cca Pro Pro
aat tac Asn Tyr
tcc ctc Ser Leu 450
gct gct Ala Ala 465
ate ggc Ile Gly
gaa cca Glu Pro
tgc aat Cys Asn
acg cag Thr Gln 530
age ctt Ser Leu 545
gat tca Asp Ser
ggc tac Gly Tyr
aat ggg Asn Gly
tac cag Tyr Gln
tac aat Tyr Asn
aag aag Lys Lys 420
gea aat Ala Asn 435
ggc ggg Gly Gly
acc cag Thr Gln
gea age Ala Ser
cca ttc Pro Phe 500
cca age Pro Ser 515
gea aat Ala Asn
gtt age Val Ser
gat acc Asp Thr
ttc cca Phe Pro 580
gct tcc Ala Ser 595
cat age His Ser 390
gat gaa Asp Glu 405
ggc tca Gly Ser
age aag Ser Lys
ctt tcc Leu Ser
aat age Asn Ser 470
ctg cct Leu Pro 485
age tgc Ser Cys
gat acc Asp Thr
gtg aag Val Lys
tac gat Tyr Asp 550
aat aat Asn Asn 565
aat aat Asn Asn
gea gtt Ala Val
cct ate Pro Ile
ctt cag Leu Gln
ggc tac Gly Tyr
tac aag Tyr Lys 440
acc ctt Thr Leu 455
aag tac Lys Tyr
ggc tac Gly Tyr
acg age Thr Ser
aat cag Asn Gln 520
ggg aat Gly Asn 535
ctg aat Leu Asn
gtt ate Val Ile
gea aga Ala Arg
cca ctt Pro Leu 600
cct aat Pro Asn
aat ctg Asn Leu 410
age tac Ser Tyr 425
tac ggc Tyr Gly
age gct Ser Ala
ctt gat Leu Asp
tgc acg Cys Thr 490
acg gea Thr Ala 505
aag ate Lys Ile
acc ggg Thr Gly
cct aag Pro Lys
ctt aag Leu Lys 570
cca acc Pro Thr 585
gat tcc Asp Ser
aat aat Asn Asn 395
gaa ctc Glu Leu
cca tac Pro Tyr
gat tcc Asp Ser
cca ate Pro Ile 460
ggc gaa Gly Glu 475
acc ggg Thr Gly
aat ggg Asn Gly
aat gct Asn Ala
aag ctg Lys Leu 540
aat gtt Asn Val 555
ggc ate Gly Ile
gtt gtg Val Val
ggc aat Gly Asn
gtg aat Val Asn
ggg gtt Gly Val
ggg ttc Gly Phe 430
aat gat Asn Asp 445
caa cag Gln Gln
ate ctg Ile Leu
tgc tca Cys Ser
tac aag Tyr Lys 510
ctc tac Leu Tyr 525
ggc gtt Gly Val
ttc ggg Phe Gly
cca gea Pro Ala
aag gaa Lys Glu 590
acc ctg Thr Leu 605
ctc ate Leu Ile 400
tac acc Tyr Thr 415
gtg ctg Val Leu
cca gaa Pro Glu
gtt aat Val Asn
aat ggg Asn Gly 480
cct acc Pro Thr 495
gea age Ala Ser
cca ttc Pro Phe
ctc gea Leu Ala
gaa ctc Glu Leu 560
gaa aag Glu Lys 575
tgg ate Trp Ile
ttc atg Phe Met
1200
1248
1296
1344
1392
1440
1488
1536
1584
1632
1680
1728
1776
1824 acg gct acg aac ctg acg gct acc cag tac aga ate cgc ate cgt tac 1872
Thr Ala Thr Asn Leu Thr Ala Thr Gln Tyr Arg Ile Arg Ile Arg Tyr
610 615 620
gct aac eea aae tca aac acg cag ate ggc gtt aga ate acg cag aac 192 0
Ala Asn Pro Asn Ser Asn Thr Gln Ile Gly Val Arg Ile Thr Gln Asn 625 630 635 640
ggg age etc ate tcc tcc tcc aac ctc acg ctg tac tca acc acc gat 1968
Gly Ser Leu Ile Ser Ser Ser Asn Leu Thr Leu Tyr Ser Thr Thr Asp 645 650 655
atg aac aac acc ctg cca ctg aac gtt tac gtg ate ggg gaa aac ggg 2 016
Met Asn Asn Thr Leu Pro Leu Asn Val Tyr Val Ile Gly Glu Asn Gly 660 665 670
aac tac acc ctc cag gat ctc tac aac acg acg aac gtt ctg tcc acg 2064
Asn Tyr Thr Leu Gln Asp Leu Tyr Asn Thr Thr Asn Val Leu Ser Thr
675 680 685
ggc gat ate acc ctg cag ate acc ggc ggg gat cag aag ata ttc ate 2112
Gly Asp Ile Thr Leu Gln Ile Thr Gly Gly Asp Gln Lys Ile Phe Ile
690 695 700
gat cgc ate gag ttc gtg cct acg atg cca gtg cca ggc aac acc aac 2160
Asp Arg Ile Glu Phe Val Pro Thr Met Pro Val Pro Gly Asn Thr Asn 705 710 715 720
aac aac aac ggc aac aac aac ggc aac aac aac ccc ccc cat cat gtc 2 2 08
Asn Asn Asn Gly Asn Asn Asn Gly Asn Asn Asn Pro Pro His His Val 725 730 735
tgc gct ata gct ggt act cag cag tet tgc tca ggt cct cct aag ttc 2256
Cys Ala Ile Ala Gly Thr Gln Gln Ser Cys Ser Gly Pro Pro Lys Phe 740 745 750
gag cag gtt tet gat ctc gag aag ate acc acc cag gtc tac atg ctg 2304
Glu Gln Val Ser Asp Leu Glu Lys Ile Thr Thr Gln Val Tyr Met Leu
755 760 765
ttc aag tcc taa 2316
Phe Lys Ser * 770
<210> SEQ ID NO: 29 <211> Comprimento: 771 <212> Tipo: PRT
<213> Organismo: Seqüência Artificial <220> Características:
<223> Outras Informações: APOSYNAXMI-031(A-D)
<400> Seqüência: 29
Met Gln Ile Leu Gly Tyr Ser Ser Phe Val Ala Ile Ala Leu Leu Met 15 10 15 Ser Val Val Val Val 20
Asn Leu Asp Cys Asn 35
Leu Ala Ile Pro Val 50
Asp Leu Lys Lys Ala 65
Leu Thr Ala Leu Gln 85
Asn Tyr Leu Thr Leu 100
Val Pro Gly Gly Thr 115
Trp Leu Trp Pro His 130
Asn Leu Ile Asp Ser 145
Asp Ala Asp Arg Asn 165
Ser Ser Asn Asn Leu 180
Thr Val Asn Thr Thr 195
Tyr Thr Asn Val Val 210
Asn Asn Glu Asn His 225
Pro Tyr Phe Val Ile 245
Tyr Ile Lys Phe Cys 260
Ala Gln Leu Thr Thr 275
Met Arg Asn Ala Ile 290
Lys Asp Ser Lys Asn 305
Asp Thr Tyr Asn Val 325
Ile Val Ala Ile Trp 340
Thr Ala Leu Glu Gln 355
Glu Glu Gly Thr Asp 370
Phe Ser Tyr Gln His 385
Ser Tyr Tyr Asn Asp 405
Pro Pro Lys Lys Gly 420
Asn Tyr Ala Asn Ser 435
Ser Leu Gly Gly Leu 450
Cys Asn Gly Gly Lys Thr 25
Leu Gln Ser Gln Gln Asn 40
Ser Asn Val Asn Ser Leu 55
Trp Glu Glu Phe Gln Lys 70 75
Gln Gly Phe Ser Ala Ser 90
Leu Gln Ser Gly Ile Ser 105
Phe Val Ala Pro Ile Ile 120
Lys Asn Lys Asn Ala Asp 135
Glu Ile Gln Lys Gln Leu 150 155
Glu Trp Ser Ser Tyr Leu 170
Asn Gly Ala Ile Val Asp 185
Asn Arg Thr Leu Arg Asn 200
Thr Asn Phe Ile Ala Ala 215
Ile Met Asn Gly Asn Phe 230 235
Gly Ala Thr Ala Arg Phe 250
Asn Ala Trp Ile Asp Lys 265
Gln Lys Ala Asn Leu Asp 280
Leu Asn Tyr Thr Gln Gln 295
Met Pro Thr Ile Gly Thr 310 315
Tyr Ile Lys Gly Met Thr 330
Pro Ser Leu Tyr Pro Asp 345
Thr Arg Val Thr Phe Ser 360
Gly Ser Leu Arg Ile Tyr 375
Ser Pro Ile Pro Asn Asn 390 395
Glu Leu Gln Asn Leu Glu 410
Ser Gly Tyr Ser Tyr Pro 425
Lys Tyr Lys Tyr Gly Asp 440
Ser Thr Leu Ser Ala Pro 455
Ser Thr Tyr Val Arg 30
Ile Pro Tyr Asn Val 45
Thr Asp Thr Val Gly 60
Thr Gly Ser Phe Ser 80
Gln Gly Gly Thr Phe 95
Leu Ala Gly Ser Phe 110
Asn Met Val Ile Gly 125
Thr Glu Asn Leu Ile 140
Asn Lys Ala Leu Leu 160
Glu Ser Ile Phe Asp 175
Ala Gln Trp Ser Gly 190
Pro Thr Glu Ser Asp 205
Asp Gly Asp Ile Ala 220
Asp Val Ala Ala Ala 240
Ala Ala Met Gln Ser 255
Val Gly Leu Ser Asp 270
Arg Thr Lys Gln Asn 285
Val Met Lys Val Phe 300
Asn Lys Phe Ser Val 320
Leu Asn Val Leu Asp 335
Asp Tyr Thr Ser Gln 350
Asn Met Val Gly Gln 365
Asn Thr Phe Asp Ser 380
Asn Val Asn Leu Ile 400
Leu Gly Val Tyr Thr 415
Tyr Gly Phe Val Leu 430
Ser Asn Asp Pro Glu 445
Ile Gln Gln Val Asn 460 Ala Ala Thr Gln Asn Ser Lys Tyr Leu Asp Gly Glu Ile Leu Asn Gly 465 470 475 480 Ile Gly Ala Ser Leu 485 Pro Gly Tyr Cys Thr 490 Thr Gly Cys Ser Pro 495 Thr Glu Pro Pro Phe 500 Ser Cys Thr Ser Thr 505 Ala Asn Gly Tyr Lys 510 Ala Ser Cys Asn Pro 515 Ser Asp Thr Asn Gln 520 Lys Ile Asn Ala Leu 525 Tyr Pro Phe Thr Gln 530 Ala Asn Val Lys Gly 535 Asn Thr Gly Lys Leu 540 Gly Val Leu Ala Ser Leu Val Ser Tyr Asp Leu Asn Pro Lys Asn Val Phe Gly Glu Leu 545 550 555 560 Asp Ser Asp Thr Asn 565 Asn Val Ile Leu Lys 570 Gly Ile Pro Ala Glu 575 Lys Gly Tyr Phe Pro Asn Asn Ala Arg Pro Thr Val Val Lys Glu Trp Ile 580 585 590 Asn Gly Ala 595 Ser Ala Val Pro Leu 600 Asp Ser Gly Asn Thr 605 Leu Phe Met Thr Ala 610 Thr Asn Leu Thr Ala 615 Thr Gln Tyr Arg Ile 620 Arg Ile Arg Tyr Ala Asn Pro Asn Ser Asn Thr Gln Ile Gly Val Arg Ile Thr Gln Asn 625 630 635 640 Gly Ser Leu Ile Ser Ser Ser Asn Leu Thr Leu Tyr Ser Thr Thr Asp 645 650 655 Met Asn Asn Thr 660 Leu Pro Leu Asn Val 665 Tyr Val Ile Gly Glu 670 Asn Gly Asn Tyr Thr 675 Leu Gln Asp Leu Tyr 680 Asn Thr Thr Asn Val 685 Leu Ser Thr Gly Asp Ile Thr Leu Gln Ile Thr Gly Gly Asp Gln Lys Ile Phe Ile 690 695 700 Asp Arg Ile Glu Phe Val Pro Thr Met Pro Val Pro Gly Asn Thr Asn 705 710 715 720 Asn Asn Asn Gly Asn Asn Asn Gly Asn Asn Asn Pro Pro His His Val 725 730 735 Cys Ala Ile Ala Gly Thr Gln Gln Ser Cys Ser Gly Pro Pro Lys Phe 740 745 750 Glu Gln Val Ser Asp Leu Glu Lys Ile Thr Thr Gln Val Tyr Met Leu
755 760 765
Phe Lys Ser 770
<210> SEQ ID NO: 30 <211> Comprimento: 23 07 <212> Tipo: DNA
<213> Organismo: Seqüência Artificial <220> Características:
<223> Outras Informações: aposyn2axmi-031 (A-D)
<221> Nome/Chave: CDS
<222> Localização: (1)...(2307)
<400> Seqüência: 30
atg ggc tac age age ttc gtc gcc ate gcg ctg ctg atg age gtg gtg
Met Gly Tyr Ser Ser Phe Val Ala Ile Ala Leu Leu Met Ser Val Val 15 10 15 gtg gtg tgc Val Val Cys
tgc aac ctc Cys Asn Leu 35
ccc gtc tca Pro Val Ser 50
aag gca tgg Lys Ala Trp 65
ctg caa caa Leu Gln Gln
acc ttg ctg Thr Leu Leu
ggc acc ttc Gly Thr Phe 115
ccg cac aag Pro His Lys 130
gat tca gag Asp Ser Glu 145
aga aat gaa Arg Asn Glu
aac ctc aac Asn Leu Asn
acc acc aac Thr Thr Asn 195
gtg gtg acc Val Val Thr 210
aac cac ate Asn His Ile 225
aac ggc ggc aag Asn Gly Gly Lys 20
cag age cag cag Gln Ser Gln Gln
aat gtc aac age Asn Val Asn Ser 55
gag gag ttc cag Glu Glu Phe Gln 70
ggc ttc tca gca Gly Phe Ser Ala 85
caa age ggc ate Gln Ser Gly Ile 100
gtg gcg ccc ate Val Ala Pro Ile
aac aag aat gct Asn Lys Asn Ala 135
ate cag aag cag Ile Gln Lys Gln 150
tgg age age tac Trp Ser Ser Tyr 165
ggc gcc ate gtg Gly Ala Ile Val 180
agg acg ctg agg Arg Thr Leu Arg
aac ttc att gct Asn Phe Ile Ala 215
atg aat gga aat Met Asn Gly Asn 230
aca age acc Thr Ser Thr 25
aac ate ccc Asn Ile Pro 40
ttg aca gat Leu Thr Asp
aag acc ggc Lys Thr Gly
age caa gga Ser Gln Gly 90
age ttg gcc Ser Leu Ala 105
ate aac atg Ile Asn Met 120
gac aca gaa Asp Thr Glu
ctc aac aag Leu Asn Lys
ctg gag age Leu Glu Ser 170
gat gct caa Asp Ala Gln 185
aat cca aca Asn Pro Thr 200
gct gat gga Ala Asp Gly
ttt gat gtt Phe Asp Val
tat gtg agg aac Tyr Val Arg Asn 30
tac aat gtg ctg Tyr Asn Val Leu 45
act gtt ggt gat Thr Val Gly Asp 60
age ttc age ttg Ser Phe Ser Leu 75
ggc acc ttc aac Gly Thr Phe Asn
ggc age ttc gtg Gly Ser Phe Val 110
gtg att gga tgg Val Ile Gly Trp 125
aat ttg ate aac Asn Leu Ile Asn 140
gcg ctg ctg gat Ala Leu Leu Asp 155
ate ttt gat tca Ile Phe Asp Ser
tgg tca ggc acc Trp Ser Gly Thr 190
gaa agt gac tac Glu Ser Asp Tyr 205
gac ate gcc aac Asp Ile Ala Asn 220
gct gct gct cca Ala Ala Ala Pro 235
ctg gac 9 6 Leu Asp
gcc ate 144 Ala Ile
ttg aag 192 Leu Lys
acg gcg 240 Thr Ala 80
tac ctc 288 Tyr Leu 95
ccc ggc 33 6 Pro Gly
ctg tgg 384 Leu Trp
ctc att 432 Leu Ile
gct gac 480 Ala Asp 160
age aac 528 Ser Asn 175
gtc aac 576 Val Asn
acc aat 624 Thr Asn
aat gag 672 Asn Glu
tat ttt 720 Tyr Phe 240 gtg att gga gca aca gca aga ttt gct gcc atg caa tca tac ate aag 768 Val Ile Gly Ala Thr Ala Arg Phe Ala Ala Met Gln Ser Tyr Ile Lys 245 250 255
ttc tgc aat gca tgg ate gac aag gtg ggc etc tet gat gct cag etc Phe Cys Asn Ala Trp Ile Asp Lys Val Gly Leu Ser Asp Ala Gln Leu 260 265 270
acc acc cag aag gcc aac ctg gac agg acc aag cag aac atg agg aat Thr Thr Gln Lys Ala Asn Leu Asp Arg Thr Lys Gln Asn Met Arg Asn 275 280 285
gcc ate ttg aat tac acc cag cag gtg atg aag gtg ttc aag gac age Ala Ile Leu Asn Tyr Thr Gln Gln Val Met Lys Val Phe Lys Asp Ser 290 295 300
aag aac atg cca acc ate ggc acc aac aag ttc tca gtg gac acc tac Lys Asn Met Pro Thr Ile Gly Thr Asn Lys Phe Ser Val Asp Thr Tyr 305 310 315 320
aat gtc tac ate aag ggc atg acg ctc aat gtg ctg gac ate gtc gcc Asn Val Tyr Ile Lys Gly Met Thr Leu Asn Val Leu Asp Ile Val Ala 325 330 335
ate tgg cca age ctc tac cct gat gac tac acc tca cag acg gcg ctg Ile Trp Pro Ser Leu Tyr Pro Asp Asp Tyr Thr Ser Gln Thr Ala Leu 340 345 350
gag caa aca agg gtg acc ttc age aac atg gtg ggc caa gaa gaa gga 1104 Glu Gln Thr Arg Val Thr Phe Ser Asn Met Val Gly Gln Glu Glu Gly 355 360 365
act gat ggc age ttg agg ate tac aac acc ttc gac age ttc age tac 1152 Thr Asp Gly Ser Leu Arg Ile Tyr Asn Thr Phe Asp Ser Phe Ser Tyr 370 375 380
cag cat tet ccc ate ccc aac aac aat gtc aac ctc ate age tac tac Gln His Ser Pro Ile Pro Asn Asn Asn Val Asn Leu Ile Ser Tyr Tyr 385 390 395 400
aat gat gag ctg caa aat ttg gag cta gga gtc tac acg ccg cca aag Asn Asp Glu Leu Gln Asn Leu Glu Leu Gly Val Tyr Thr Pro Pro Lys 405 410 415
aaa gga agt gga tat tet tat cct tat ggc ttc gtg ctc aac tac gcc Lys Gly Ser Gly Tyr Ser Tyr Pro Tyr Gly Phe Val Leu Asn Tyr Ala 420 425 430
816
864
912
960
1008
1056
1200
1248
1296
aac age aag tac aag tat gga gat tca aat gat cca gaa age ctc ggc 1344 Asn Ser Lys Tyr Lys Tyr Gly Asp Ser Asn Asp Pro Glu Ser Leu Gly 435 440 445
ggc ctc tcc acc ttg tcg gcg ccc ate cag cag gtg aac gcc gcc acc Gly Leu Ser Thr Leu Ser Ala Pro Ile Gln Gln Val Asn Ala Ala Thr 450 455 460
1392 cag aac age aag tac ctt gat gga gag ate etc aat ggc att gga gct 1440 Gln Asn Ser Lys Tyr Leu Asp Gly Glu Ile Leu Asn Gly Ile Gly Ala 465 470 475 480
tet ctt cct ggc tac tgc acc acc ggc tgc tcg ccg acg gag ccg ccc 1488 Ser Leu Pro Gly Tyr Cys Thr Thr Gly Cys Ser Pro Thr Glu Pro Pro 485 490 495
ttc age tgc acc tca aca gea aat ggc tac aag gea age tgc aac ccc 153 6 Phe Ser Cys Thr Ser Thr Ala Asn Gly Tyr Lys Ala Ser Cys Asn Pro 500 505 510
tcc gac acc aac cag aag ate aac gcg etc tac ccc ttc acc caa gct 1584 Ser Asp Thr Asn Gln Lys Ile Asn Ala Leu Tyr Pro Phe Thr Gln Ala 515 520 525
aat gtg aag ggc aac acc ggc aag ctc ggc gtg ctg gcc age ttg gtg 1632 Asn Val Lys Gly Asn Thr Gly Lys Leu Gly Val Leu Ala Ser Leu Val 530 535 540
age tac gac ctc aac ccc aag aat gtt ttt gga gag ctg gac age gac 1680 Ser Tyr Asp Leu Asn Pro Lys Asn Val Phe Gly Glu Leu Asp Ser Asp 545 550 555 560
acc aac aat gtc ate cta aag ggc ate ccg gcg gag aag ggc tac ttc 1728 Thr Asn Asn Val Ile Leu Lys Gly Ile Pro Ala Glu Lys Gly Tyr Phe 565 570 575
ccc aac aat gea agg ccg acg gtg gtg aag gag tgg ate aat gga gct 177 6 Pro Asn Asn Ala Arg Pro Thr Val Val Lys Glu Trp Ile Asn Gly Ala 580 585 590
tcg gcg gtg cct ctt gat tca ggc aac acc ttg ttc atg aca gea aca 1824 Ser Ala Val Pro Leu Asp Ser Gly Asn Thr Leu Phe Met Thr Ala Thr 595 600 605
aat ttg acg gcg acg cag tac agg ate agg ate aga tat gcc aac ccc 1872 Asn Leu Thr Ala Thr Gln Tyr Arg Ile Arg Ile Arg Tyr Ala Asn Pro 610 615 620
aac age aac acc cag ate ggc gtg agg ate acc caa aat gga age ctc 1920 Asn Ser Asn Thr Gln Ile Gly Val Arg Ile Thr Gln Asn Gly Ser Leu 625 630 635 640
ate age age age aac ctc acc ctc tac tca aca act gac atg aac aac 1968 Ile Ser Ser Ser Asn Leu Thr Leu Tyr Ser Thr Thr Asp Met Asn Asn 645 650 655
acc ttg ccg ctc aat gtt tat gtg att gga gaa aat ggc aac tac acc 2016 Thr Leu Pro Leu Asn Val Tyr Val Ile Gly Glu Asn Gly Asn Tyr Thr 660 665 670
ttg caa gat ctc tac aac acc acc aac gtg ctg age acc ggc gac ate 2064 Leu Gln Asp Leu Tyr Asn Thr Thr Asn Val Leu Ser Thr Gly Asp Ile 675 680 685 acc cta cag ate act gga gga gat cag aag ate ttc ate gac agg att 2112 Thr Leu Gln Ile Thr Gly Gly Asp Gln Lys Ile Phe Ile Asp Arg Ile 690 695 700
gaa ttt gtt cca aca atg cca gtt cct ggc aac acc aac aac aac aat 2160 Glu Phe Val Pro Thr Met Pro Val Pro Gly Asn Thr Asn Asn Asn Asn 705 710 715 720
ggc aac aac aat ggc aac aac aac ccg ccg cac cat gtt tgt gcc ata Gly Asn Asn Asn Gly Asn Asn Asn Pro Pro His His Val Cys Ala Ile 725 730 735
tca gat ctg gag aag ate acc acc caa gtc tac atg ctc ttc aag age Ser Asp Leu Glu Lys Ile Thr Thr Gln Val Tyr Met Leu Phe Lys Ser 755 760 765
2208
gct gga act caa caa age tgc tet ggg ccg cca aaa ttt gag caa gtt 2256 Ala Gly Thr Gln Gln Ser Cys Ser Gly Pro Pro Lys Phe Glu Gln Val 740 745 750
taa
2304
2307
<210> SEQ ID NO: 31 <211> Comprimento: 7 68 <212> Tipo: PRT
<213> Organismo: Seqüência Artificial <220> Características:
<223> Outras Informações: APQSYN2AXMI-031 (A-D)
<400> Seqüência: 31
Met Gly Tyr Ser Ser Phe Val Ala Ile Ala Leu Leu Met Ser Val Val
15 10 15
Val Val Cys Asn Gly Gly Lys Thr Ser Thr Tyr Val Arg Asn Leu Asp
20 25 30
Cys Asn Leu Gln Ser Gln Gln Asn Ile Pro Tyr Asn Val Leu Ala Ile
35 40 45
Pro Val Ser Asn Val Asn Ser Leu Thr Asp Thr Val Gly Asp Leu Lys
50 55 60
Lys Ala Trp Glu Glu Phe Gln Lys Thr Gly Ser Phe Ser Leu Thr Ala 65 70 75 80
Leu Gln Gln Gly Phe Ser Ala Ser Gln Gly Gly Thr Phe Asn Tyr Leu
85 90 95
Thr Leu Leu Gln Ser Gly Ile Ser Leu Ala Gly Ser Phe Val Pro Gly
100 105 HO
Gly Thr Phe Val Ala Pro Ile Ile Asn Met Val Ile Gly Trp Leu Trp
115 120 125
Pro His Lys Asn Lys Asn Ala Asp Thr Glu Asn Leu Ile Asn Leu Ile
130 135 140
Asp Ser Glu Ile Gln Lys Gln Leu Asn Lys Ala Leu Leu Asp Ala Asp 145 150 155 160
Arg Asn Glu Trp Ser Ser Tyr Leu Glu Ser Ile Phe Asp Ser Ser Asn 165 170 175 Asn Leu Asn Gly Ala Ile Val Asp Ala Gln Trp Ser Gly Thr Val Asn 180 185 190 Thr Thr Asn Arg Thr Leu Arg Asn Pro Thr Glu Ser Asp Tyr Thr Asn 195 200 205 Val Val Thr Asn Phe Ile Ala Ala Asp Gly Asp Ile Ala Asn Asn Glu 210 215 220 Asn His Ile Met Asn Gly Asn Phe Asp Val Ala Ala Ala Pro Tyr Phe 225 230 235 240 Val Ile Gly Ala Thr Ala Arg Phe Ala Ala Met Gln Ser Tyr Ile Lys 245 250 255 Phe Cys Asn Ala Trp Ile Asp Lys Val Gly Leu Ser Asp Ala Gln Leu 260 265 270 Thr Thr Gln Lys Ala Asn Leu Asp Arg Thr Lys Gln Asn Met Arg Asn 275 280 285 Ala Ile Leu Asn Tyr Thr Gln Gln Val Met Lys Val Phe Lys Asp Ser 290 295 300 Lys Asn Met Pro Thr Ile Gly Thr Asn Lys Phe Ser Val Asp Thr Tyr 305 310 315 320 Asn Val Tyr Ile Lys Gly Met Thr Leu Asn Val Leu Asp Ile Val Ala 325 330 335 Ile Trp Pro Ser Leu Tyr Pro Asp Asp Tyr Thr Ser Gln Thr Ala Leu 340 345 350 Glu Gln Thr Arg Val Thr Phe Ser Asn Met Val Gly Gln Glu Glu Gly 355 360 365 Thr Asp Gly Ser Leu Arg Ile Tyr Asn Thr Phe Asp Ser Phe Ser Tyr 370 375 380 Gln His Ser Pro Ile Pro Asn Asn Asn Val Asn Leu Ile Ser Tyr Tyr 385 390 395 400 Asn Asp Glu Leu Gln Asn Leu Glu Leu Gly Val Tyr Thr Pro Pro Lys 405 410 415 Lys Gly Ser Gly Tyr Ser Tyr Pro Tyr Gly Phe Val Leu Asn Tyr Ala 420 425 430 Asn Ser Lys Tyr Lys Tyr Gly Asp Ser Asn Asp Pro Glu Ser Leu Gly 435 440 445 Gly Leu Ser Thr Leu Ser Ala Pro Ile Gln Gln Val Asn Ala Ala Thr 450 455 460 Gln Asn Ser Lys Tyr Leu Asp Gly Glu Ile Leu Asn Gly Ile Gly Ala 465 470 475 480 Ser Leu Pro Gly Tyr Cys Thr Thr Gly Cys Ser Pro Thr Glu Pro Pro 485 490 495 Phe Ser Cys Thr Ser Thr Ala Asn Gly Tyr Lys Ala Ser Cys Asn Pro 500 505 510 Ser Asp Thr Asn Gln Lys Ile Asn Ala Leu Tyr Pro Phe Thr Gln Ala 515 520 525 Asn Val Lys Gly Asn Thr Gly Lys Leu Gly Val Leu Ala Ser Leu Val 530 535 540 Ser Tyr Asp Leu Asn Pro Lys Asn Val Phe Gly Glu Leu Asp Ser Asp 545 550 555 560 Thr Asn Asn Val Ile Leu Lys Gly Ile Pro Ala Glu Lys Gly Tyr Phe 565 570 575 Pro Asn Asn Ala Arg Pro Thr Val Val Lys Glu Trp Ile Asn Gly Ala 580 585 590 Ser Ala Val Pro Leu Asp Ser Gly Asn Thr Leu Phe Met Thr Ala Thr 595 600 605 Asn Leu Thr Ala Thr Gln Tyr Arg Ile Arg Ile Arg Tyr Ala Asn Pro 610 615 620 Asn Ser Asn Thr Gln Ile Gly Val Arg Ile Thr Gln Asn Gly Ser Leu 625 630 635 640
Ile Ser Ser Ser Asn Leu Thr Leu Tyr Ser Thr Thr Asp Met Asn Asn
645 650 655
Thr Leu Pro Leu Asn Val Tyr Val Ile Gly Glu Asn Gly Asn Tyr Thr
660 665 670
Leu Gln Asp Leu Tyr Asn Thr Thr Asn Val Leu Ser Thr Gly Asp Ile
675 680 685
Thr Leu Gln Ile Thr Gly Gly Asp Gln Lys Ile Phe Ile Asp Arg Ile
690 695 700
Glu Phe Val Pro Thr Met Pro Val Pro Gly Asn Thr Asn Asn Asn Asn 705 710 715 720
Gly Asn Asn Asn Gly Asn Asn Asn Pro Pro His His Val Cys Ala Ile
725 730 735
Ala Gly Thr Gln Gln Ser Cys Ser Gly Pro Pro Lys Phe Glu Gln Val
740 745 750
Ser Asp Leu Glu Lys Ile Thr Thr Gln Val Tyr Met Leu Phe Lys Ser 755 760 765
<210> SEQ ID NO: 32 <211> Comprimento: 3 57 0 <212> Tipo: DNA
<213> Organismo: Seqüência Artificial <220> Características:
<223> Outras Informações: synaxmi-031(fl)-ER
<221> Nome/Chave: CDS
<222> Localização: (1)...(3570)
<400> Seqüência: 32
atg gat tgc aat ctc cag age cag cag aat ate cca tac aat gtg ctt 48 Met Asp Cys Asn Leu Gln Ser Gln Gln Asn Ile Pro Tyr Asn Val Leu 15 10 15
gct ate CCt gtt age aat gtt aat age ctt acg gat acg gtt ggc gat 96 Ala Ile Pro Val Ser Asn Val Asn Ser Leu Thr Asp Thr Val Gly Asp 20 25 30
cta aag aag gea tgg gaa gag ttc cag aag acg ggc age ttc tcc ctt 144 Leu Lys Lys Ala Trp Glu Glu Phe Gln Lys Thr Gly Ser Phe Ser Leu 35 40 45
acc gea ctc cag cag ggc ttc age gct tcc cag ggc ggg acg ttc aat 192 Thr Ala Leu Gln Gln Gly Phe Ser Ala Ser Gln Gly Gly Thr Phe Asn 50 55 60
tac ctc acc ctc ctc cag tcc ggg ate tcc ctg gct ggc age ttc gtg 240 Tyr Leu Thr Leu Leu Gln Ser Gly Ile Ser Leu Ala Gly Ser Phe Val 65 70 75 80
cct ggc ggc acc ttc gtt gct cca ate ate aat atg gtg ate ggc tgg Pro Gly Gly Thr Phe Val Ala Pro Ile Ile Asn Met Val Ile Gly Trp 85 90 95
288 ctc tgg cct cat aag aat aag aat gca gat acg gaa aat ctg ate aat 336 Leu Trp Pro His Lys Asn Lys Asn Ala Asp Thr Glu Asn Leu Ile Asn
100 105 110
ctg ate gat tca gaa ate cag aag cag ctg aat aag gct ctg ctg gat 384 Leu Ile Asp Ser Glu Ile Gln Lys Gln Leu Asn Lys Ala Leu Leu Asp 115 120 125
gct gat cgc aat gaa tgg age age tac ctc gag tcc ate ttc gat age 432 Ala Asp Arg Asn Glu Trp Ser Ser Tyr Leu Glu Ser Ile Phe Asp Ser 130 135 140
age aat aat ctg aat ggc gca ate gtt gat gct cag tgg tcc ggc acc 480 Ser Asn Asn Leu Asn Gly Ala Ile Val Asp Ala Gln Trp Ser Gly Thr 145 150 155 160
gtg aat acg acc aat cgt acg ctt cgt aat cct acg gaa tca gat tac 528 Val Asn Thr Thr Asn Arg Thr Leu Arg Asn Pro Thr Glu Ser Asp Tyr 165 170 175
acc aat gtg gtg acg aat ttc ate gca gca gat ggg gat ate gct aat 57 6 Thr Asn Val Val Thr Asn Phe Ile Ala Ala Asp Gly Asp Ile Ala Asn
180 185 190
aat gaa aat cat ate atg aat ggg aat ttc gat gtg gca gca gct cca 624
Asn Glu Asn His Ile Met Asn Gly Asn Phe Asp Val Ala Ala Ala Pro 195 200 205
tac ttc gtt ate ggg gct acc gct aga ttc gca gct atg cag tcc tac 672
Tyr Phe Val Ile Gly Ala Thr Ala Arg Phe Ala Ala Met Gln Ser Tyr 210 215 220
ate aag ttc tgc aat gca tgg ate gat aag gtt ggg ctg tca gat gct 720
Ile Lys Phe Cys Asn Ala Trp Ile Asp Lys Val Gly Leu Ser Asp Ala 225 230 235 240
cag ctg acc acg cag aag gct aat ctg gat aga acg aag cag aat atg 768
Gln Leu Thr Thr Gln Lys Ala Asn Leu Asp Arg Thr Lys Gln Asn Met 245 250 255
cgt aat gct ate ctt aat tac acc cag cag gtt atg aag gtt ttc aag 816
Arg Asn Ala Ile Leu Asn Tyr Thr Gln Gln Val Met Lys Val Phe Lys
260 265 270
gat tcc aag aat atg cca acg ate ggc acg aat aag ttc age gtt gat 8 64
Asp Ser Lys Asn Met Pro Thr Ile Gly Thr Asn Lys Phe Ser Val Asp 275 280 285
acc tac aat gtt tac ate aag ggg atg acg ctt aat gtg ctt gat ate 912
Thr Tyr Asn Val Tyr Ile Lys Gly Met Thr Leu Asn Val Leu Asp Ile 290 295 300
gtt gct ate tgg cca age ctg tac cca gat gat tac acg tca cag acg 960
Val Ala Ile Trp Pro Ser Leu Tyr Pro Asp Asp Tyr Thr Ser Gln Thr 305 310 315 320 gct ctg gaa cag acc cgc gtg acg ttc tcc aat atg gtg ggg cag gaa 1008
Ala Leu Glu Gln Thr Arg Val Thr Phe Ser Asn Met Val Gly Gln Glu 325 330 335
gaa ggc acg gat ggc age ctc aga ate tac aat acc ttc gat age ttc 1056
Glu Gly Thr Asp Gly Ser Leu Arg Ile Tyr Asn Thr Phe Asp Ser Phe 340 345 350
tcc tac cag cat age cct ate cct aat aat aat gtg aat ctc ate age 1104
Ser Tyr Gln His Ser Pro Ile Pro Asn Asn Asn Val Asn Leu Ile Ser 355 360 365
tac tac aat gat gaa ctt cag aat ctg gaa ctc ggg gtt tac acc cca 1152
Tyr Tyr Asn Asp Glu Leu Gln Asn Leu Glu Leu Gly Val Tyr Thr Pro
370 375 380
cca aag aag ggc tca ggc tac age tac cca tac ggg ttc gtg ctg aat 1200
Pro Lys Lys Gly Ser Gly Tyr Ser Tyr Pro Tyr Gly Phe Val Leu Asn
385 390 395 400
tac gea aat age aag tac aag tac ggc gat tcc aat gat cca gaa tcc 1248
Tyr Ala Asn Ser Lys Tyr Lys Tyr Gly Asp Ser Asn Asp Pro Glu Ser 405 410 415
ctc ggc ggg ctt tcc acc ctt age gct cca ate caa cag gtt aat gct 1296
Leu Gly Gly Leu Ser Thr Leu Ser Ala Pro Ile Gln Gln Val Asn Ala 420 425 430
gct acc cag aat age aag tac ctt gat ggc gaa ate ctg aat ggg ate 1344
Ala Thr Gln Asn Ser Lys Tyr Leu Asp Gly Glu Ile Leu Asn Gly Ile 435 440 445
ggc gea age ctg cct ggc tac tgc acg acc ggg tgc tca cct acc gaa 1392
Gly Ala Ser Leu Pro Gly Tyr Cys Thr Thr Gly Cys Ser Pro Thr Glu
450 455 460
cca cca ttc age tgc acg age acg gea aat ggg tac aag gea age tgc 1440
Pro Pro Phe Ser Cys Thr Ser Thr Ala Asn Gly Tyr Lys Ala Ser Cys
465 470 475 480
aat cca age gat acc aat cag aag ate aat gct ctc tac cca ttc acg 1488
Asn Pro Ser Asp Thr Asn Gln Lys Ile Asn Ala Leu Tyr Pro Phe Thr 485 490 495
cag gea aat gtg aag ggg aat acc ggg aag ctg ggc gtt ctc gea age 1536
Gln Ala Asn Val Lys Gly Asn Thr Gly Lys Leu Gly Val Leu Ala Ser 500 505 510
ctt gtt age tac gat ctg aat cct aag aat gtt ttc ggg gaa ctc gat 1584
Leu Val Ser Tyr Asp Leu Asn Pro Lys Asn Val Phe Gly Glu Leu Asp 515 520 525
tca gat acc aat aat gtt ate ctt aag ggc ate cca gea gaa aag ggc 1632
Ser Asp Thr Asn Asn Val Ile Leu Lys Gly Ile Pro Ala Glu Lys Gly
530 535 540 tac ttc cca aat aat gca aga cca acc gtt gtg aag gaa tgg ate aat 1680 Tyr Phe Pro Asn Asn Ala Arg Pro Thr Val Val Lys Glu Trp Ile Asn 545 550 555 560
ggg gct tcc gca gtt cca ctt gat tcc ggc aat acc ctg ttc atg acg 1728 Gly Ala Ser Ala Val Pro Leu Asp Ser Gly Asn Thr Leu Phe Met Thr 565 570 575
gct acg aac ctg acg gct acc cag tac aga ate cgc ate cgt tac gct 1776 Ala Thr Asn Leu Thr Ala Thr Gln Tyr Arg Ile Arg Ile Arg Tyr Ala 580 585 590
aac cca aac tca aac acg cag ate ggc gtt aga ate acg cag aac ggg 1824 Asn Pro Asn Ser Asn Thr Gln Ile Gly Val Arg Ile Thr Gln Asn Gly 595 600 605
age etc ate tcc tcc tcc aac ctc acg ctg tac tca acc acc gat atg 1872 Ser Leu Ile Ser Ser Ser Asn Leu Thr Leu Tyr Ser Thr Thr Asp Met 610 615 620
aac aac acc ctg cca ctg aac gtt tac gtg ate ggg gaa aac ggg aac 192 0 Asn Asn Thr Leu Pro Leu Asn Val Tyr Val Ile Gly Glu Asn Gly Asn 625 630 635 640
tac acc ctc cag gat ctc tac aac acg acg aac gtt ctg tcc acg ggc 1968 Tyr Thr Leu Gln Asp Leu Tyr Asn Thr Thr Asn Val Leu Ser Thr Gly 645 650 655
gat ate acc ctg cag ate acc ggc ggg gat cag aag ata ttc ate gat 2016 Asp Ile Thr Leu Gln Ile Thr Gly Gly Asp Gln Lys Ile Phe Ile Asp 660 665 670
cgc ate gag ttc gtg cct acg atg cca gtg cca ggc aac acc aac aac 2 064 Arg Ile Glu Phe Val Pro Thr Met Pro Val Pro Gly Asn Thr Asn Asn 675 680 685
aac aac ggg aac aac aac ggc aac aac aac cct cct cat cat gtt tgc 2112 Asn Asn Gly Asn Asn Asn Gly Asn Asn Asn Pro Pro His His Val Cys 690 695 700
gct ate gca ggc acc cag cag tcc tgc tcc ggc cca cca aag ttc gag 2160 Ala Ile Ala Gly Thr Gln Gln Ser Cys Ser Gly Pro Pro Lys Phe Glu 705 710 715 720
cag gtg tcc gat tta gaa aag ata acc acg cag gtt tac atg ctc ttc 2208 Gln Val Ser Asp Leu Glu Lys Ile Thr Thr Gln Val Tyr Met Leu Phe 725 730 735
aag tcc tcc cca tac gaa gaa ctt gct ctt gaa gtt age age tac cag 2256 Lys Ser Ser Pro Tyr Glu Glu Leu Ala Leu Glu Val Ser Ser Tyr Gln 740 745 750
ate age cag gtt gca ctg aag gtt atg gct ctc age gat gaa cta ttc 2304 Ile Ser Gln Val Ala Leu Lys Val Met Ala Leu Ser Asp Glu Leu Phe 755 760 765 tgc gaa gaa aag aac gtg ctg aga aag ctc gtg aac aag gca aag cag 2 3 52 Cys Glu Glu Lys Asn Val Leu Arg Lys Leu Val Asn Lys Ala Lys Gln
ctt ctc gaa gca age aac ctt ctc gtt ggg ggg aac ttc gag acg act 2400 Leu Leu Glu Ala Ser Asn Leu Leu Val Gly Gly Asn Phe Glu Thr Thr
cag aac tgg gtg ctc ggc acg aac gct tac ate aac tat gat tca ttc 2448 Gln Asn Trp Val Leu Gly Thr Asn Ala Tyr Ile Asn Tyr Asp Ser Phe
ctg ttc aac ggg aac tac ctg age ctc cag cca gca tcc ggc ttc ttc 2496 Leu Phe Asn Gly Asn Tyr Leu Ser Leu Gln Pro Ala Ser Gly Phe Phe
acg age tac gct tac cag aag ate gat gaa tcc acg ctt aag cct tac 2 544 Thr Ser Tyr Ala Tyr Gln Lys Ile Asp Glu Ser Thr Leu Lys Pro Tyr
acg cgc tac aag gtg tcc ggg ttc ate ggg cag tca aac cag gtt gaa 2592 Thr Arg Tyr Lys Val Ser Gly Phe Ile Gly Gln Ser Asn Gln Val Glu
ctg ate ate age cgc tac ggg aag gaa ate gat aag ate ctt aac gtg 2640 Leu Ile Ile Ser Arg Tyr Gly Lys Glu Ile Asp Lys Ile Leu Asn Val
cca tac gca ggg cca ctc cca ate acc gca gat gca age ate acc tgc 2688 Pro Tyr Ala Gly Pro Leu Pro Ile Thr Ala Asp Ala Ser Ile Thr Cys
tgc gct cca gaa ata ggg cag tgc gat ggg gaa cag tca gat tcc cat 2736 Cys Ala Pro Glu Ile Gly Gln Cys Asp Gly Glu Gln Ser Asp Ser His
ttc ttc aac tac age ate gat gtt ggc gca ctc cat cca gaa ctt aac 2784 Phe Phe Asn Tyr Ser Ile Asp Val Gly Ala Leu His Pro Glu Leu Asn
cca ggg ate gaa ate ggg ctg aag ate gtt cag age aac ggc tac ate 2832 Pro Gly Ile Glu Ile Gly Leu Lys Ile Val Gln Ser Asn Gly Tyr Ile
acc ate tcc aac ctt gaa ate ate gaa gaa aga cca tta acg gaa atg 2880 Thr Ile Ser Asn Leu Glu Ile Ile Glu Glu Arg Pro Leu Thr Glu Met
gaa att caa gca gtg aac cgc aag aac cag aag tgg gaa cgc gaa aag 2928 Glu Ile Gln Ala Val Asn Arg Lys Asn Gln Lys Trp Glu Arg Glu Lys
ctg ctt gaa tgc gca tcc ate tcc gaa ctc ctc cag cct ate ate aac 2976 Leu Leu Glu Cys Ala Ser Ile Ser Glu Leu Leu Gln Pro Ile Ile Asn cag ata gat age ctc ttc aag gat ggc aac tgg tac aac gat ate cta Gln Ile Asp Ser Leu Phe Lys Asp Gly Asn Trp Tyr Asn Asp Ile Leu 995 1000 1005
3024
cca cat gtt acc tac cag gat ctt aag aac ate ate ate cca gaa ctt Pro His Val Thr Tyr Gln Asp Leu Lys Asn Ile Ile Ile Pro Glu Leu 1010 1015 1020
3072
cct aag ctc aag cat tgg ttc ate gaa aac ctg cct ggg gaa tac cat Pro Lys Leu Lys His Trp Phe Ile Glu Asn Leu Pro Gly Glu Tyr His 1025 1030 1035 1040
3120
gaa ate gaa cag aag atg aag gaa gea tta aag tac gea ttc act cag Glu Ile Glu Gln Lys Met Lys Glu Ala Leu Lys Tyr Ala Phe Thr Gln 1045 1050 1055
3168
ctc gat gaa aag aac ctg ate cat aac ggc cat ttc acc acc aac ctc Leu Asp Glu Lys Asn Leu Ile His Asn Gly His Phe Thr Thr Asn Leu 1060 1065 1070
3216
ate gat tgg cag gtg gaa ggc gat gct cag atg aag gtg ctt gaa aac Ile Asp Trp Gln Val Glu Gly Asp Ala Gln Met Lys Val Leu Glu Asn 1075 1080 1085
3264
gat gea ctc gct ctc cag cta ttc aac tgg gat gct tcc gea tcc cag Asp Ala Leu Ala Leu Gln Leu Phe Asn Trp Asp Ala Ser Ala Ser Gln 1090 1095 1100
3312
age ate aac ate cta gag ttc gat gaa gat aag gct tac aag ctg cgt Ser Ile Asn Ile Leu Glu Phe Asp Glu Asp Lys Ala Tyr Lys Leu Arg 1105 1110 1115 1120
3360
gtg tac gea cag ggc tcc ggg acg ate cag ttc ggc aac tgc gaa gat Val Tyr Ala Gln Gly Ser Gly Thr Ile Gln Phe Gly Asn Cys Glu Asp 1125 1130 1135
3408
gaa gct ate cag ttc aac acc aac tca ttc ate tac cag gaa aag ata Glu Ala Ile Gln Phe Asn Thr Asn Ser Phe Ile Tyr Gln Glu Lys Ile 1140 1145 1150
3456
gtg tac ttc gat acg cca tcc gtt aac ctt cat ate cag age gaa ggc Val Tyr Phe Asp Thr Pro Ser Val Asn Leu His Ile Gln Ser Glu Gly 1155 1160 1165
3504
tcc gag ttc ate gtg age age ate gat ctc ate gaa ctc age gat gat Ser Glu Phe Ile Val Ser Ser Ile Asp Leu Ile Glu Leu Ser Asp Asp 1170 1175 1180
3552
cag aag gat gaa ctg taa Gln Lys Asp Glu Leu * 1185
3570
<210> SEQ ID NO: 33 <211> Comprimento: 1189
<212> Tipo: PRT
<213> Organismo: Seqüência Artificial <220> Características:
<223> Outras Informações: SYNAXMI-031(FL)-ER
<400> Seqüência: 33
Met Asp Cys Asn Leu Gln Ser Gln Gln Asn Ile Pro Tyr Asn Val Leu 1 5 10 15 Ala Ile Pro Val Ser Asn Val Asn Ser Leu Thr Asp Thr Val Gly Asp 20 25 30 Leu Lys Lys Ala Trp Glu Glu Phe Gln Lys Thr Gly Ser Phe Ser Leu 35 40 45 Thr Ala Leu Gln Gln Gly Phe Ser Ala Ser Gln Gly Gly Thr Phe Asn 50 55 60 Tyr Leu Thr Leu Leu Gln Ser Gly Ile Ser Leu Ala Gly Ser Phe Val 65 70 75 80 Pro Gly Gly Thr Phe Val Ala Pro Ile Ile Asn Met Val Ile Gly Trp 85 90 95 Leu Trp Pro His Lys Asn Lys Asn Ala Asp Thr Glu Asn Leu Ile Asn 100 105 110 Leu Ile Asp Ser Glu Ile Gln Lys Gln Leu Asn Lys Ala Leu Leu Asp 115 120 125 Ala Asp Arg Asn Glu Trp Ser Ser Tyr Leu Glu Ser Ile Phe Asp Ser 130 135 140 Ser Asn Asn Leu Asn Gly Ala Ile Val Asp Ala Gln Trp Ser Gly Thr 145 150 155 160 Val Asn Thr Thr Asn Arg Thr Leu Arg Asn Pro Thr Glu Ser Asp Tyr 165 170 175 Thr Asn Val Val Thr Asn Phe Ile Ala Ala Asp Gly Asp Ile Ala Asn 180 185 190 Asn Glu Asn His Ile Met Asn Gly Asn Phe Asp Val Ala Ala Ala Pro 195 200 205 Tyr Phe Val Ile Gly Ala Thr Ala Arg Phe Ala Ala Met Gln Ser Tyr 210 215 220 Ile Lys Phe Cys Asn Ala Trp Ile Asp Lys Val Gly Leu Ser Asp Ala 225 230 235 240 Gln Leu Thr Thr Gln Lys Ala Asn Leu Asp Arg Thr Lys Gln Asn Met 245 250 255 Arg Asn Ala Ile Leu Asn Tyr Thr Gln Gln Val Met Lys Val Phe Lys 260 265 270 Asp Ser Lys Asn Met Pro Thr Ile Gly Thr Asn Lys Phe Ser Val Asp 275 280 285 Thr Tyr Asn Val Tyr Ile Lys Gly Met Thr Leu Asn Val Leu Asp Ile 290 295 300 Val Ala Ile Trp Pro Ser Leu Tyr Pro Asp Asp Tyr Thr Ser Gln Thr 305 310 315 320 Ala Leu Glu Gln Thr Arg Val Thr Phe Ser Asn Met Val Gly Gln Glu 325 330 335 Glu Gly Thr Asp Gly Ser Leu Arg Ile Tyr Asn Thr Phe Asp Ser Phe 340 345 350 Ser Tyr Gln His Ser Pro Ile Pro Asn Asn Asn Val Asn Leu Ile Ser 355 360 365 Tyr Tyr Asn Asp Glu Leu Gln Asn Leu Glu Leu Gly Val Tyr Thr Pro 370 375 380 Pro Lys Lys Gly Ser Gly Tyr Ser Tyr Pro Tyr Gly Phe Val Leu Asn 385 390 395 400 Tyr Ala Asn Ser Lys Tyr Lys Tyr Gly Asp Ser Asn Asp Pro Glu Ser
405 410 415 Leu Gly Gly Leu Ser Thr Leu Ser Ala Pro Ile Gln Gln Val Asn Ala
420 425 430
Ala Thr Gln Asn Ser Lys Tyr Leu Asp Gly Glu Ile Leu Asn Gly Ile
435 440 445
Gly Ala Ser Leu Pro Gly Tyr Cys Thr Thr Gly Cys Ser Pro Thr Glu
450 455 460
Pro Pro Phe Ser Cys Thr Ser Thr Ala Asn Gly Tyr Lys Ala Ser Cys 465 470 475 480
Asn Pro Ser Asp Thr Asn Gln Lys Ile Asn Ala Leu Tyr Pro Phe Thr
485 490 495
Gln Ala Asn Val Lys Gly Asn Thr Gly Lys Leu Gly Val Leu Ala Ser
500 505 510
Leu Val Ser Tyr Asp Leu Asn Pro Lys Asn Val Phe Gly Glu Leu Asp
515 520 525
Ser Asp Thr Asn Asn Val Ile Leu Lys Gly Ile Pro Ala Glu Lys Gly
530 535 540
Tyr Phe Pro Asn Asn Ala Arg Pro Thr Val Val Lys Glu Trp Ile Asn 545 550 555 560
Gly Ala Ser Ala Val Pro Leu Asp Ser Gly Asn Thr Leu Phe Met Thr
565 570 575
Ala Thr Asn Leu Thr Ala Thr Gln Tyr Arg Ile Arg Ile Arg Tyr Ala
580 585 590
Asn Pro Asn Ser Asn Thr Gln Ile Gly Val Arg Ile Thr Gln Asn Gly
595 600 605
Ser Leu Ile Ser Ser Ser Asn Leu Thr Leu Tyr Ser Thr Thr Asp Met
610 615 620
Asn Asn Thr Leu Pro Leu Asn Val Tyr Val Ile Gly Glu Asn Gly Asn 625 630 635 640
Tyr Thr Leu Gln Asp Leu Tyr Asn Thr Thr Asn Val Leu Ser Thr Gly
645 650 655
Asp Ile Thr Leu Gln Ile Thr Gly Gly Asp Gln Lys Ile Phe Ile Asp
660 665 670
Arg Ile Glu Phe Val Pro Thr Met Pro Val Pro Gly Asn Thr Asn Asn
675 680 685
Asn Asn Gly Asn Asn Asn Gly Asn Asn Asn Pro Pro His His Val Cys
690 695 700
Ala Ile Ala Gly Thr Gln Gln Ser Cys Ser Gly Pro Pro Lys Phe Glu 705 710 715 720
Gln Val Ser Asp Leu Glu Lys Ile Thr Thr Gln Val Tyr Met Leu Phe
725 730 735
Lys Ser Ser Pro Tyr Glu Glu Leu Ala Leu Glu Val Ser Ser Tyr Gln
740 745 750
Ile Ser Gln Val Ala Leu Lys Val Met Ala Leu Ser Asp Glu Leu Phe
755 760 765
Cys Glu Glu Lys Asn Val Leu Arg Lys Leu Val Asn Lys Ala Lys Gln
770 775 780
Leu Leu Glu Ala Ser Asn Leu Leu Val Gly Gly Asn Phe Glu Thr Thr 785 790 795 800
Gln Asn Trp Val Leu Gly Thr Asn Ala Tyr Ile Asn Tyr Asp Ser Phe
805 810 815
Leu Phe Asn Gly Asn Tyr Leu Ser Leu Gln Pro Ala Ser Gly Phe Phe
820 825 830
Thr Ser Tyr Ala Tyr Gln Lys Ile Asp Glu Ser Thr Leu Lys Pro Tyr
835 840 845
Thr Arg Tyr Lys Val Ser Gly Phe Ile Gly Gln Ser Asn Gln Val Glu 850 855 860 Leu Ile Ile Ser Arg Tyr Gly Lys Glu Ile Asp Lys Ile Leu Asn Val 865 870 875 880 Pro Tyr Ala Gly Pro Leu Pro Ile Thr Ala Asp Ala Ser Ile Thr Cys 885 890 895 Cys Ala Pro Glu Ile Gly Gln Cys Asp Gly Glu Gln Ser Asp Ser His 900 905 910 Phe Phe Asn Tyr Ser Ile Asp Val Gly Ala Leu His Pro Glu Leu Asn 915 920 925 Pro Gly Ile Glu Ile Gly Leu Lys Ile Val Gln Ser Asn Gly Tyr Ile 930 935 940 Thr Ile Ser Asn Leu Glu Ile Ile Glu Glu Arg Pro Leu Thr Glu Met 945 950 955 960 Glu Ile Gln Ala Val Asn Arg Lys Asn Gln Lys Trp Glu Arg Glu Lys 965 970 975 Leu Leu Glu Cys Ala Ser Ile Ser Glu Leu Leu Gln Pro Ile Ile Asn 980 985 990 Gln Ile Asp Ser Leu Phe Lys Asp Gly Asn Trp Tyr Asn Asp Ile Leu 995 1000 1005 Pro His Val Thr Tyr Gln Asp Leu Lys Asn Ile Ile Ile Pro Glu Leu 1010 1015 1020 Pro Lys Leu Lys His Trp Phe Ile Glu Asn Leu Pro Gly Glu Tyr His 1025 1030 1035 1040 Glu Ile Glu Gln Lys Met Lys Glu Ala Leu Lys Tyr Ala Phe Thr Gln 1045 1050 1055 Leu Asp Glu Lys Asn Leu Ile His Asn Gly His Phe Thr Thr Asn Leu 1060 1065 1070 Ile Asp Trp Gln Val Glu Gly Asp Ala Gln Met Lys Val Leu Glu Asn 1075 1080 1085 Asp Ala Leu Ala Leu Gln Leu Phe Asn Trp Asp Ala Ser Ala Ser Gln 1090 1095 1100 Ser Ile Asn Ile Leu Glu Phe Asp Glu Asp Lys Ala Tyr Lys Leu Arg 1105 1110 1115 1120 Val Tyr Ala Gln Gly Ser Gly Thr Ile Gln Phe Gly Asn Cys Glu Asp 1125 1130 1135 Glu Ala Ile Gln Phe Asn Thr Asn Ser Phe Ile Tyr Gln Glu Lys Ile 1140 1145 1150 Val Tyr Phe Asp Thr Pro Ser Val Asn Leu His Ile Gln Ser Glu Gly
1155 1160 1165
Ser Glu Phe Ile Val Ser Ser Ile Asp Leu Ile Glu Leu Ser Asp Asp
1170 1175 1180
Gln Lys Asp Glu Leu 1185
<210> SEQ ID NO: 34
<211> Comprimento: 3669 <212> Tipo: DNA <213> Organismo: Desconhecido
<220> Características:
<223> Outras Informações: Isolado de amostra de solo (AXMI-049)
<221> Nome/Chave: CDS
<222> Localização: (1) ... (3669) <400> Seqüência: 34
atg gat gac atg aca aat tta tcc gat gta tat tca ccc gta cct tcc 48
Met Asp Asp Met Thr Asn Leu Ser Asp Val Tyr Ser Pro Val Pro Ser 1 5 10 15
aat gta tta gca gct cca ctt att ctt gaa gaa aca aag aaa aaa aca 96 Asn Val Leu Ala Ala Pro Leu Ile Leu Glu Glu Thr Lys Lys Lys Thr 20 25 30
ccg gct gaa caa gca aaa gaa gat tta gaa aag gca ttg aga aca gga 144 Pro Ala Glu Gln Ala Lys Glu Asp Leu Glu Lys Ala Leu Arg Thr Gly 35 40 45
aag ttt tcc gat gca att gca caa att tta aat gat gtt ctt att aac 192 Lys Phe Ser Asp Ala Ile Ala Gln Ile Leu Asn Asp Val Leu Ile Asn 50 55 60
caa aag ttc age tat caa aca gcg gtt aca gtt tcc tta tet ttg gct 240 Gln Lys Phe Ser Tyr Gln Thr Ala Val Thr Val Ser Leu Ser Leu Ala 65 70 75 80
agt ata gtt ctt cca gaa ata ggt ttt ttt gcc ccc ttt gtt ggt tta 288 Ser Ile Val Leu Pro Glu Ile Gly Phe Phe Ala Pro Phe Val Gly Leu 85 90 95
ttt ttt tet gct tta aat aaa tet caa aat ata cct acg act tca gat 336 Phe Phe Ser Ala Leu Asn Lys Ser Gln Asn Ile Pro Thr Thr Ser Asp 100 105 110
att ttt gaa gcg atg aaa cca gct att caa aca atg att gat cgt agt 384 Ile Phe Glu Ala Met Lys Pro Ala Ile Gln Thr Met Ile Asp Arg Ser 115 120 125
tta aca gat gct gaa aac aag gag atg gat gat cag gcg cac aac cta 432 Leu Thr Asp Ala Glu Asn Lys Glu Met Asp Asp Gln Ala His Asn Leu 130 135 140
ttt acg cga tta caa act tat caa gag caa ata gat ctc tat aaa cat 480 Phe Thr Arg Leu Gln Thr Tyr Gln Glu Gln Ile Asp Leu Tyr Lys His 145 150 155 160
att tta gat gca aaa caa aaa cca act ctt aac gat ata gga gat ctt 52 8 Ile Leu Asp Ala Lys Gln Lys Pro Thr Leu Asn Asp Ile Gly Asp Leu 165 170 175
cac act tcg ate gac gaa act ctc aga aca tta gat tcc aat tta gca 576 His Thr Ser Ile Asp Glu Thr Leu Arg Thr Leu Asp Ser Asn Leu Ala 180 185 190
ttt ttc caa aca gaa ggc tat caa gat ctc ggg tta cca tat tac aca 624 Phe Phe Gln Thr Glu Gly Tyr Gln Asp Leu Gly Leu Pro Tyr Tyr Thr 195 200 205
att ttt gcc aca caa tat ttg tta ate ctt tca gat aaa att aaa act 672 Ile Phe Ala Thr Gln Tyr Leu Leu Ile Leu Ser Asp Lys Ile Lys Thr 210 215 220 ggt ate aca tgg gga tat aat cct att aac att cca gat ttt caa aac 720 Gly Ile Thr Trp Gly Tyr Asn Pro Ile Asn Ile Pro Asp Phe Gln Asn 225 230 235 240
caa ttt aat aat aga ata ctt tta ttt aca aaa tac att agt ggt caa 768 Gln Phe Asn Asn Arg Ile Leu Leu Phe Thr Lys Tyr Ile Ser Gly Gln 245 250 255
ctt aag aaa atg tat gac aac ggt gta cat cca gea ctt tta tat caa 816 Leu Lys Lys Met Tyr Asp Asn Gly Val His Pro Ala Leu Leu Tyr Gln 260 265 270
aac tgt ate caa ttt gtt gct tta tgg cct act ttt tet ccc gea gat 864 Asn Cys Ile Gln Phe Val Ala Leu Trp Pro Thr Phe Ser Pro Ala Asp 275 280 285
tat aac ctt agt aac age aca gat tta gaa caa aca ata agt ttt aag 912 Tyr Asn Leu Ser Asn Ser Thr Asp Leu Glu Gln Thr Ile Ser Phe Lys 290 295 300
agt ttc ate tcc tat aag agt tta aat gat tat aat tat gea ctt cct 960 Ser Phe Ile Ser Tyr Lys Ser Leu Asn Asp Tyr Asn Tyr Ala Leu Pro 305 310 315 320
gaa att aat aca tgg aca aat ttt gaa atg aca aaa tca ctt gat ttt 1008 Glu Ile Asn Thr Trp Thr Asn Phe Glu Met Thr Lys Ser Leu Asp Phe 325 330 335
aac aac tgt aga tcc atg gat aat tat ggt ate gcg ggt gac ctt cgt 1056 Asn Asn Cys Arg Ser Met Asp Asn Tyr Gly Ile Ala Gly Asp Leu Arg 340 345 350
ata aca aat cat aaa aat gaa ate cat gaa ata tet gct cct tcg gta 1104 Ile Thr Asn His Lys Asn Glu Ile His Glu Ile Ser Ala Pro Ser Val 355 360 365
ctc tac atg aca tca aat cag tgt aac tca aga ctt gtt ttt cca ttc 1152 Leu Tyr Met Thr Ser Asn Gln Cys Asn Ser Arg Leu Val Phe Pro Phe 370 375 380
gat gat cct att gtt aaa ttc gaa gga aca agt agt gtt ttc ata ggg 1200 Asp Asp Pro Ile Val Lys Phe Glu Gly Thr Ser Ser Val Phe Ile Gly 385 390 395 400
aca cct gga tta cct caa ttt tat aca aat ttt cag ttg act tet ggt 1248 Thr Pro Gly Leu Pro Gln Phe Tyr Thr Asn Phe Gln Leu Thr Ser Gly 405 410 415
aaa agt tta ata ttc cct cct cct tca gga gtt aat caa caa ggt ttc 1296 Lys Ser Leu Ile Phe Pro Pro Pro Ser Gly Val Asn Gln Gln Gly Phe 420 425 430
aca caa aat tat tcg gta ate cct cat cct gga ttt aaa ata gea ggt 1344 Thr Gln Asn Tyr Ser Val Ile Pro His Pro Gly Phe Lys Ile Ala Gly 435 440 445 att aca aat atg tca tat tta cct act cat cac gat agt aat gcg cgg 1392
Ile Thr Asn Met Ser Tyr Leu Pro Thr His His Asp Ser Asn Ala Arg 450 455 460
aca caa ata gaa cat ate caa gtt cct gaa aaa ate ttt cca gaa aat 1440
Thr Gln Ile Glu His Ile Gln Val Pro Glu Lys Ile Phe Pro Glu Asn
465 470 475 480
att ate ggg gtt cca gat cca gat aat aac aat cta ate cca ate aaa 1488
Ile Ile Gly Val Pro Asp Pro Asp Asn Asn Asn Leu Ile Pro Ile Lys 485 490 495
ggt att ccc gea gaa aaa gga tat ggt gac tca att gea tat gtg tca 1536
Gly Ile Pro Ala Glu Lys Gly Tyr Gly Asp Ser Ile Ala Tyr Val Ser 500 505 510
gaa ccg gta aat ggt gcg agt gea gtt aaa ctt act tca aat caa att 1584 Glu Pro Val Asn Gly Ala Ser Ala Val Lys Leu Thr Ser Asn Gln Ile 515 520 525
etc caa atg gaa att aca aat gta aca act caa aaa tat caa gtt cgc 1632
Leu Gln Met Glu Ile Thr Asn Val Thr Thr Gln Lys Tyr Gln Val Arg 530 535 540
ata cgt tat gct aca gct gga gat aca gag gct aat ata agg ttc cat 1680
Ile Arg Tyr Ala Thr Ala Gly Asp Thr Glu Ala Asn Ile Arg Phe His
545 550 555 560
att att gat cca aat gaa aat aat tta ata aat ggg cct aat cat ttc 1728
Ile Ile Asp Pro Asn Glu Asn Asn Leu Ile Asn Gly Pro Asn His Phe 565 570 575
aca gct gta tet aat act caa acg tet gtc caa ggt gaa aat gga aaa 1776
Thr Ala Val Ser Asn Thr Gln Thr Ser Val Gln Gly Glu Asn Gly Lys 580 585 590
tat gta cta aac aca ctt gta aat tca ata ata tta cca tca gga aaa 1824
Tyr Val Leu Asn Thr Leu Val Asn Ser Ile Ile Leu Pro Ser Gly Lys 595 600 605
caa aag gtc ttt att caa aac act ggt tet caa gat ctc ttt tta gac 1872
Gln Lys Val Phe Ile Gln Asn Thr Gly Ser Gln Asp Leu Phe Leu Asp 610 615 620
cgt att gaa ttt att cca tta caa cta gaa ctt cct ttc act tca aaa 1920
Arg Ile Glu Phe Ile Pro Leu Gln Leu Glu Leu Pro Phe Thr Ser Lys
625 630 635 640
tta cct gaa act act aca caa cca aat aca aca aaa aca att tgg tca 1968
Leu Pro Glu Thr Thr Thr Gln Pro Asn Thr Thr Lys Thr Ile Trp Ser 645 650 655
ggt caa aaa cct gct aat aca ctt tet ctt caa ggt aca gtt tat aat 2016
Gly Gln Lys Pro Ala Asn Thr Leu Ser Leu Gln Gly Thr Val Tyr Asn 660 665 670 gat gct tct ate gaa tta caa ctt tat atg aac gat aac tta gtc caa 2064 Asp Ala Ser Ile Glu Leu Gln Leu Tyr Met Asn Asp Asn Leu Val Gln 675 680 685
aaa ate cct gea caa ggt cct ggt cct agt ttt gac tgt gac gac caa 2112 Lys Ile Pro Ala Gln Gly Pro Gly Pro Ser Phe Asp Cys Asp Asp Gln 690 695 700
tct aaa cct att aat caa cca aat ata aaa act gaa gaa ttt aac aaa 2160 Ser Lys Pro Ile Asn Gln Pro Asn Ile Lys Thr Glu Glu Phe Asn Lys 705 710 715 720
ctt gtc tta aaa gaa tta agt agt acc tat tcg tat tgt atg gga gga 2208 Leu Val Leu Lys Glu Leu Ser Ser Thr Tyr Ser Tyr Cys Met Gly Gly 725 730 735
gct ttt gaa aac act tac caa att gat att aca ata gac age aaa tcc 2256 Ala Phe Glu Asn Thr Tyr Gln Ile Asp Ile Thr Ile Asp Ser Lys Ser 740 745 750
caa tct ttt act act cca gaa gat tta gaa aaa ate aca aac caa gtc 2304 Gln Ser Phe Thr Thr Pro Glu Asp Leu Glu Lys Ile Thr Asn Gln Val 755 760 765
aac cag tta ttt act tcc tca tcc caa aca aaa ttg gtt caa acc gta 2352 Asn Gln Leu Phe Thr Ser Ser Ser Gln Thr Lys Leu Val Gln Thr Val 770 775 780
acg gat tat gga att gat caa atg gta atg aaa gta gat gcg tta tca 2400 Thr Asp Tyr Gly Ile Asp Gln Met Val Met Lys Val Asp Ala Leu Ser 785 790 795 800
gac gat gta ttt ggt gtc gag aaa aaa gea tta cgt aaa ctt gtc aat 2448 Asp Asp Val Phe Gly Val Glu Lys Lys Ala Leu Arg Lys Leu Val Asn 805 810 815
cag gcc aaa caa tta agt aaa gta cga aat gta ctg gtc ggt gga aac 2496 Gln Ala Lys Gln Leu Ser Lys Val Arg Asn Val Leu Val Gly Gly Asn 820 825 830
ttt gaa aaa ggt cat aaa tgg gta cta ggt cgt aaa gcg aca acg gta 2 544 Phe Glu Lys Gly His Lys Trp Val Leu Gly Arg Lys Ala Thr Thr Val 835 840 845
gcg gat cat gat tta ttc aaa ggg gat cat tta tta tta cca cca cca 2592 Ala Asp His Asp Leu Phe Lys Gly Asp His Leu Leu Leu Pro Pro Pro 850 855 860
acc ctg tat cca tcg tat gcg tat caa aaa ate gat gaa tct aaa tta 2640 Thr Leu Tyr Pro Ser Tyr Ala Tyr Gln Lys Ile Asp Glu Ser Lys Leu 865 870 875 880
aaa tcc aat aca cgc tat acg gtt tcc ggt ttt gtt gcg caa agt gaa 2 688 Lys Ser Asn Thr Arg Tyr Thr Val Ser Gly Phe Val Ala Gln Ser Glu 885 890 895 cat tta gaa gtt gtt gtt tct cgc tat ggg aaa gaa gta aat acc ctg 273 6
His Leu Glu Val Val Val Ser Arg Tyr Gly Lys Glu Val Asn Thr Leu 900 905 910
tta cat gtc cct tat gaa gaa gca tta ccg att tct tcc gat gag cgt 2784
Leu His Val Pro Tyr Glu Glu Ala Leu Pro Ile Ser Ser Asp Glu Arg
915 920 925
cca aat tgc tgt aaa cca gct gct tgt cag tgt cca tct tgc aat ggt 2832
Pro Asn Cys Cys Lys Pro Ala Ala Cys Gln Cys Pro Ser Cys Asn Gly
930 935 940
gat gca cca gac tcc cat ttc ttt age tat agt ate gat gtt ggt tcc 2880
Asp Ala Pro Asp Ser His Phe Phe Ser Tyr Ser Ile Asp Val Gly Ser 945 950 955 960
tta caa gca gat gta aat tta gga att gag ttt ggt ctt cgt att gtg 2928
Leu Gln Ala Asp Val Asn Leu Gly Ile Glu Phe Gly Leu Arg Ile Val 965 970 975
aaa tcc aac gga ttt gca aaa ate agt aac cta gaa ate aaa gaa gac 2 97 6
Lys Ser Asn Gly Phe Ala Lys Ile Ser Asn Leu Glu Ile Lys Glu Asp 980 985 990
cgt cca tta aca gaa aaa gaa att aag aaa ata caa cgc aaa gaa caa 3024
Arg Pro Leu Thr Glu Lys Glu Ile Lys Lys Ile Gln Arg Lys Glu Gln
995 1000 1005
aag tgg aaa aaa gca ttt gac aaa gaa cag gca gag tta acg gca aca 3 072
Lys Trp Lys Lys Ala Phe Asp Lys Glu Gln Ala Glu Leu Thr Ala Thr
1010 1015 1020
ctc caa cca acc ctg aac caa ate aat gcc tta tat caa aat gaa gat 3120
Leu Gln Pro Thr Leu Asn Gln Ile Asn Ala Leu Tyr Gln Asn Glu Asp 1025 1030 1035 1040
tgg aac ggt tcg att cac cct cat gta acg tat caa cat cta tcc gat 3168
Trp Asn Gly Ser Ile His Pro His Val Thr Tyr Gln His Leu Ser Asp 1045 1050 1055
gtt gtc gta cca gca tta cca aaa caa aga cat tgg ttt atg gaa gat 3216
Val Val Val Pro Ala Leu Pro Lys Gln Arg His Trp Phe Met Glu Asp 1060 1065 1070
cga caa ggt gaa cat tac aat gta aca caa caa ttc caa caa gca tta 3264
Arg Gln Gly Glu His Tyr Asn Val Thr Gln Gln Phe Gln Gln Ala Leu
1075 1080 1085
gat cgt gct ttc caa caa ate gaa gaa caa aac tta att cac aat ggt 3312
Asp Arg Ala Phe Gln Gln Ile Glu Glu Gln Asn Leu Ile His Asn Gly
1090 1095 1100
age ttt gcg aat gga ttg aca gat tgg act gtc aca ggg gat gca cat 3360
Ser Phe Ala Asn Gly Leu Thr Asp Trp Thr Val Thr Gly Asp Ala His 1105 1110 1115 1120 gtt act ate cag gat gat gat caa gta tta gaa cta tet cat tgg gat 3408 Val Thr Ile Gln Asp Asp Asp Gln Val Leu Glu Leu Ser His Trp Asp 1125 1130 1135
gea agt gtc tet caa acg att gaa att att gat ttt gaa gaa gaa aaa 3456 Ala Ser Val Ser Gln Thr Ile Glu Ile Ile Asp Phe Glu Glu Glu Lys 1140 1145 1150
gaa tac aaa ctt cgt gta cgt gga aaa ggt aaa gga acg gta acc gtt 3 504 Glu Tyr Lys Leu Arg Val Arg Gly Lys Gly Lys Gly Thr Val Thr Val 1155 1160 1165
caa cat gga gaa gaa gag tta gaa aca atg aca ttt aat gea acg agt 3552 Gln His Gly Glu Glu Glu Leu Glu Thr Met Thr Phe Asn Ala Thr Ser 1170 1175 1180
ttt aca acg caa gaa caa acc ttc tat ttc gaa gga aat aca gtg gat 3600 Phe Thr Thr Gln Glu Gln Thr Phe Tyr Phe Glu Gly Asn Thr Val Asp 1185 1190 1195 1200
ata cac gtt caa tca gag aat aat aca ttc ctg gta gac agt gta gaa 3 648 Ile His Val Gln Ser Glu Asn Asn Thr Phe Leu Val Asp Ser Val Glu 1205 1210 1215
ctc att gaa att ata gaa aag 3 669
Leu Ile Glu Ile Ile Glu Lys 1220
<210> SEQ ID NO: 35 <211> Comprimento: 1223 <212> Tipo: PRT <213> Organismo: Desconhecido
<220> Características:
<223> Outras Informações: Isolado de amostra de solo (AXMI-049) <400> Seqüência: 35
Met Asp Asp Met Thr Asn Leu Ser Asp Val Tyr Ser Pro Val Pro Ser
15 10 15
Asn Val Leu Ala Ala Pro Leu Ile Leu Glu Glu Thr Lys Lys Lys Thr
20 25 30
Pro Ala Glu Gln Ala Lys Glu Asp Leu Glu Lys Ala Leu Arg Thr Gly
35 40 45
Lys Phe Ser Asp Ala Ile Ala Gln Ile Leu Asn Asp Val Leu Ile Asn
50 55 60
Gln Lys Phe Ser Tyr Gln Thr Ala Val Thr Val Ser Leu Ser Leu Ala 65 70 75 80
Ser Ile Val Leu Pro Glu Ile Gly Phe Phe Ala Pro Phe Val Gly Leu
85 90 95
Phe Phe Ser Ala Leu Asn Lys Ser Gln Asn Ile Pro Thr Thr Ser Asp
100 105 110
Ile Phe Glu Ala Met Lys Pro Ala Ile Gln Thr Met Ile Asp Arg Ser
115 120 125
Leu Thr Asp Ala Glu Asn Lys Glu Met Asp Asp Gln Ala His Asn Leu 130 135 140 Phe Thr Arg Leu 145
Ile Leu Asp Ala
His Thr Ser Ile 180
Phe Phe Gln Thr 195
Ile Phe Ala Thr 210
Gly Ile Thr Trp 225
Gln Phe Asn Asn
Leu Lys Lys Met 260
Asn Cys Ile Gln 275
Tyr Asn Leu Ser 290
Ser Phe Ile Ser 305
Glu Ile Asn Thr
Asn Asn Cys Arg 340
Ile Thr Asn His 355
Leu Tyr Met Thr 370
Asp Asp Pro Ile 385
Thr Pro Gly Leu
Lys Ser Leu Ile 420
Thr Gln Asn Tyr 435
Ile Thr Asn Met 450
Thr Gln Ile Glu 465
Ile Ile Gly Val
Gly Ile Pro Ala 500
Glu Pro Val Asn 515
Leu Gln Met Glu 530
Ile Arg Tyr Ala 545
Ile Ile Asp Pro
Thr Ala Val Ser 580
Gln Thr Tyr Gln 150
Lys Gln Lys Pro 165
Asp Glu Thr Leu
Glu Gly Tyr Gln 200
Gln Tyr Leu Leu 215
Gly Tyr Asn Pro 230
Arg Ile Leu Leu 245
Tyr Asp Asn Gly
Phe Val Ala Leu 280
Asn Ser Thr Asp 295
Tyr Lys Ser Leu 310
Trp Thr Asn Phe 325
Ser Met Asp Asn
Lys Asn Glu Ile 360
Ser Asn Gln Cys 375
Val Lys Phe Glu 390
Pro Gln Phe Tyr 405
Phe Pro Pro Pro
Ser Val Ile Pro 440
Ser Tyr Leu Pro 455
His Ile Gln Val 470
Pro Asp Pro Asp 485
Glu Lys Gly Tyr
Gly Ala Ser Ala 520
Ile Thr Asn Val 535
Thr Ala Gly Asp 550
Asn Glu Asn Asn 565
Asn Thr Gln Thr
Glu Gln Ile Asp 155
Thr Leu Asn Asp 170
Arg Thr Leu Asp 185
Asp Leu Gly Leu
Ile Leu Ser Asp 220
Ile Asn Ile Pro 235
Phe Thr Lys Tyr 250
Val His Pro Ala 265
Trp Pro Thr Phe
Leu Glu Gln Thr 300
Asn Asp Tyr Asn 315
Glu Met Thr Lys 330
Tyr Gly Ile Ala 345
His Glu Ile Ser
Asn Ser Arg Leu 380
Gly Thr Ser Ser 395
Thr Asn Phe Gln 410
Ser Gly Val Asn 425
His Pro Gly Phe
Thr His His Asp 460
Pro Glu Lys Ile 475
Asn Asn Asn Leu 490
Gly Asp Ser Ile 505
Val Lys Leu Thr
Thr Thr Gln Lys 540
Thr Glu Ala Asn 555
Leu Ile Asn Gly 570
Ser Val Gln Gly 585
Leu Tyr Lys His 160 Ile Gly Asp Leu 175 Ser Asn Leu Ala 190 Pro Tyr Tyr Thr 205 Lys Ile Lys Thr Asp Phe Gln Asn 240 Ile Ser Gly Gln 255 Leu Leu Tyr Gln 270 Ser Pro Ala Asp 285 Ile Ser Phe Lys Tyr Ala Leu Pro 320 Ser Leu Asp Phe 335 Gly Asp Leu Arg 350 Ala Pro Ser Val 365 Val Phe Pro Phe Val Phe Ile Gly 400 Leu Thr Ser Gly 415 Gln Gln Gly Phe 430 Lys Ile Ala Gly 445 Ser Asn Ala Arg Phe Pro Glu Asn 480 Ile Pro Ile Lys 495 Ala Tyr Val Ser 510 Ser Asn Gln Ile 525 Tyr Gln Val Arg Ile Arg Phe His 560 Pro Asn His Phe 575 Glu Asn Gly Lys 590 Tyr Val Leu Asn Thr Leu Val Asn Ser Ile Ile Leu Pro Ser Gly Lys
595 600 605
Gln Lys Val Phe Ile Gln Asn Thr Gly Ser Gln Asp Leu Phe Leu Asp
610 615 620
Arg Ile Glu Phe Ile Pro Leu Gln Leu Glu Leu Pro Phe Thr Ser Lys 625 630 635 640
Leu Pro Glu Thr Thr Thr Gln Pro Asn Thr Thr Lys Thr Ile Trp Ser
645 650 655
Gly Gln Lys Pro Ala Asn Thr Leu Ser Leu Gln Gly Thr Val Tyr Asn
660 665 670
Asp Ala Ser Ile Glu Leu Gln Leu Tyr Met Asn Asp Asn Leu Val Gln
675 680 685
Lys Ile Pro Ala Gln Gly Pro Gly Pro Ser Phe Asp Cys Asp Asp Gln
690 695 700
Ser Lys Pro Ile Asn Gln Pro Asn Ile Lys Thr Glu Glu Phe Asn Lys 705 710 715 720
Leu Val Leu Lys Glu Leu Ser Ser Thr Tyr Ser Tyr Cys Met Gly Gly
725 730 735
Ala Phe Glu Asn Thr Tyr Gln Ile Asp Ile Thr Ile Asp Ser Lys Ser
740 745 750
Gln Ser Phe Thr Thr Pro Glu Asp Leu Glu Lys Ile Thr Asn Gln Val
755 760 765
Asn Gln Leu Phe Thr Ser Ser Ser Gln Thr Lys Leu Val Gln Thr Val
770 775 780
Thr Asp Tyr Gly Ile Asp Gln Met Val Met Lys Val Asp Ala Leu Ser 785 790 795 800
Asp Asp Val Phe Gly Val Glu Lys Lys Ala Leu Arg Lys Leu Val Asn
805 810 815
Gln Ala Lys Gln Leu Ser Lys Val Arg Asn Val Leu Val Gly Gly Asn
820 825 830
Phe Glu Lys Gly His Lys Trp Val Leu Gly Arg Lys Ala Thr Thr Val
835 840 845
Ala Asp His Asp Leu Phe Lys Gly Asp His Leu Leu Leu Pro Pro Pro
850 855 860
Thr Leu Tyr Pro Ser Tyr Ala Tyr Gln Lys Ile Asp Glu Ser Lys Leu 865 870 875 880
Lys Ser Asn Thr Arg Tyr Thr Val Ser Gly Phe Val Ala Gln Ser Glu
885 890 895
His Leu Glu Val Val Val Ser Arg Tyr Gly Lys Glu Val Asn Thr Leu
900 905 910
Leu His Val Pro Tyr Glu Glu Ala Leu Pro Ile Ser Ser Asp Glu Arg
915 920 925
Pro Asn Cys Cys Lys Pro Ala Ala Cys Gln Cys Pro Ser Cys Asn Gly
930 935 940
Asp Ala Pro Asp Ser His Phe Phe Ser Tyr Ser Ile Asp Val Gly Ser 945 950 955 960
Leu Gln Ala Asp Val Asn Leu Gly Ile Glu Phe Gly Leu Arg Ile Val
965 970 975
Lys Ser Asn Gly Phe Ala Lys Ile Ser Asn Leu Glu Ile Lys Glu Asp
980 985 990
Arg Pro Leu Thr Glu Lys Glu Ile Lys Lys Ile Gln Arg Lys Glu Gln
995 1000 1005
Lys Trp Lys Lys Ala Phe Asp Lys Glu Gln Ala Glu Leu Thr Ala Thr
1010 1015 1020
Leu Gln Pro Thr Leu Asn Gln Ile Asn Ala Leu Tyr Gln Asn Glu Asp 1025 1030 1035 1040 Trp Asn Gly Ser Ile His Pro His Val Thr Tyr Gln His Leu Ser Asp
1045 1050 1055
Val Val Val Pro Ala Leu Pro Lys Gln Arg His Trp Phe Met Glu Asp
1060 1065 1070
Arg Gln Gly Glu His Tyr Asn Val Thr Gln Gln Phe Gln Gln Ala Leu
1075 1080 1085
Asp Arg Ala Phe Gln Gln Ile Glu Glu Gln Asn Leu Ile His Asn Gly
1090 1095 1100
Ser Phe Ala Asn Gly Leu Thr Asp Trp Thr Val Thr Gly Asp Ala His 1105 1110 1115 1120
Val Thr Ile Gln Asp Asp Asp Gln Val Leu Glu Leu Ser His Trp Asp
1125 1130 1135
Ala Ser Val Ser Gln Thr Ile Glu Ile Ile Asp Phe Glu Glu Glu Lys
1140 1145 1150
Glu Tyr Lys Leu Arg Val Arg Gly Lys Gly Lys Gly Thr Val Thr Val
1155 1160 1165
Gln His Gly Glu Glu Glu Leu Glu Thr Met Thr Phe Asn Ala Thr Ser
1170 1175 1180
Phe Thr Thr Gln Glu Gln Thr Phe Tyr Phe Glu Gly Asn Thr Val Asp 1185 1190 1195 1200
Ile His Val Gln Ser Glu Asn Asn Thr Phe Leu Val Asp Ser Val Glu
1205 1210 1215
Leu Ile Glu Ile Ile Glu Lys 1220
<210> SEQ ID NO: 36 <211> Comprimento: 4 <212> Tipo: PRT
<213> Organismo: Seqüência Artificial <220> Características:
<223> Outras Informações: Peptídeo sinal
<400> Seqüência: 36 Lys Asp Glu Leu 1
<210> SEQ ID NO: 37 <211> Comprimento: 3657 <212> Tipo: DNA
<213> Organismo: Seqüência Artificial <220> Características:
<223> Outras Informações: aposynaxmi-031(f1)
<221> Nome/Chave: CDS
<222> Localização: (1) . ..(3657)
<400> Seqüência: 37
atg cag ate ctt ggg tac tcc age ttc gtt gct ate gct ctt ctt atg Met Gln Ile Leu Gly Tyr Ser Ser Phe Val Ala Ile Ala Leu Leu Met 1 5 10 15 age gtg gtt gtt gtt tgc aat ggg ggc aag acg tcc acc tac gtg cgt 96 Ser Val Val Val Val Cys Asn Gly Gly Lys Thr Ser Thr Tyr Val Arg 20 25 30
aat ctg gat tgc aat ctc cag age cag cag aat ate cca tac aat gtg 144 Asn Leu Asp Cys Asn Leu Gln Ser Gln Gln Asn Ile Pro Tyr Asn Val 35 40 45
ctt gct ate cct gtt age aat gtt aat age ctt acg gat acg gtt ggc 192 Leu Ala Ile Pro Val Ser Asn Val Asn Ser Leu Thr Asp Thr Val Gly 50 55 60
gat cta aag aag gea tgg gaa gag ttc cag aag acg ggc age ttc tcc 240 Asp Leu Lys Lys Ala Trp Glu Glu Phe Gln Lys Thr Gly Ser Phe Ser 65 70 75 80
ctt acc gea ctc cag cag ggc ttc age gct tcc cag ggc ggg acg ttc 2 88 Leu Thr Ala Leu Gln Gln Gly Phe Ser Ala Ser Gln Gly Gly Thr Phe 85 90 95
aat tac ctc acc ctc ctc cag tcc ggg ate tcc ctg gct ggc age ttc 336 Asn Tyr Leu Thr Leu Leu Gln Ser Gly Ile Ser Leu Ala Gly Ser Phe 100 105 110
gtg cct ggc ggc acc ttc gtt gct cca ate ate aat atg gtg ate ggc 3 84 Val Pro Gly Gly Thr Phe Val Ala Pro Ile Ile Asn Met Val Ile Gly 115 120 125
tgg ctc tgg cct cat aag aat aag aat gea gat acg gaa aat ctg ate 432 Trp Leu Trp Pro His Lys Asn Lys Asn Ala Asp Thr Glu Asn Leu Ile 130 135 140
aat ctg ate gat tca gaa ate cag aag cag ctg aat aag gct ctg ctg 480 Asn Leu Ile Asp Ser Glu Ile Gln Lys Gln Leu Asn Lys Ala Leu Leu 145 150 155 160
gat gct gat cgc aat gaa tgg age age tac ctc gag tcc ate ttc gat 528 Asp Ala Asp Arg Asn Glu Trp Ser Ser Tyr Leu Glu Ser Ile Phe Asp 165 170 175
age age aat aat ctg aat ggc gea ate gtt gat gct cag tgg tcc ggc 576 Ser Ser Asn Asn Leu Asn Gly Ala Ile Val Asp Ala Gln Trp Ser Gly 180 185 190
acc gtg aat acg acc aat cgt acg ctt cgt aat cct acg gaa tca gat 624 Thr Val Asn Thr Thr Asn Arg Thr Leu Arg Asn Pro Thr Glu Ser Asp 195 200 205
tac acc aat gtg gtg acg aat ttc ate gea gea gat ggg gat ate gct 672 Tyr Thr Asn Val Val Thr Asn Phe Ile Ala Ala Asp Gly Asp Ile Ala 210 215 220
aat aat gaa aat cat ate atg aat ggg aat ttc gat gtg gea gea gct 720 Asn Asn Glu Asn His Ile Met Asn Gly Asn Phe Asp Val Ala Ala Ala 225 230 235 240 cca tac ttc gtt ate ggg gct acc gct aga ttc gea gct atg cag tcc 768
Pro Tyr Phe Val Ile Gly Ala Thr Ala Arg Phe Ala Ala Met Gln Ser 245 250 255
tac ate aag ttc tgc aat gea tgg ate gat aag gtt ggg ctg tca gat 816
Tyr Ile Lys Phe Cys Asn Ala Trp Ile Asp Lys Val Gly Leu Ser Asp 260 265 270
gct cag ctg acc acg cag aag gct aat ctg gat aga acg aag cag aat 864
Ala Gln Leu Thr Thr Gln Lys Ala Asn Leu Asp Arg Thr Lys Gln Asn 275 280 285
atg cgt aat gct ate ctt aat tac acc cag cag gtt atg aag gtt ttc 912
Met Arg Asn Ala Ile Leu Asn Tyr Thr Gln Gln Val Met Lys Val Phe 290 295 300
aag gat tcc aag aat atg cca acg ate gge acg aat aag ttc age gtt 960 Lys Asp Ser Lys Asn Met Pro Thr Ile Gly Thr Asn Lys Phe Ser Val
305 310 315 320
gat acc tac aat gtt tac ate aag ggg atg acg ctt aat gtg ctt gat 1008
Asp Thr Tyr Asn Val Tyr Ile Lys Gly Met Thr Leu Asn Val Leu Asp 325 330 335
ate gtt gct ate tgg cca age ctg tac cca gat gat tac acg tca cag 1056
Ile Val Ala Ile Trp Pro Ser Leu Tyr Pro Asp Asp Tyr Thr Ser Gln 340 345 350
acg gct ctg gaa cag acc cgc gtg acg ttc tcc aat atg gtg ggg cag 1104 Thr Ala Leu Glu Gln Thr Arg Val Thr Phe Ser Asn Met Val Gly Gln 355 360 365
gaa gaa gge acg gat ggc age etc aga ate tac aat acc ttc gat age 1152
Glu Glu Gly Thr Asp Gly Ser Leu Arg Ile Tyr Asn Thr Phe Asp Ser 370 375 380
ttc tcc tac cag cat age cct ate cct aat aat aat gtg aat ctc ate 1200
Phe Ser Tyr Gln His Ser Pro Ile Pro Asn Asn Asn Val Asn Leu Ile
385 390 395 400
age tac tac aat gat gaa ctt cag aat ctg gaa ctc ggg gtt tac acc 1248
Ser Tyr Tyr Asn Asp Glu Leu Gln Asn Leu Glu Leu Gly Val Tyr Thr 405 410 415
cca cca aag aag ggc tca ggc tac age tac cca tac ggg ttc gtg ctg 1296 Pro Pro Lys Lys Gly Ser Gly Tyr Ser Tyr Pro Tyr Gly Phe Val Leu 420 425 430
aat tac gea aat age aag tac aag tac ggc gat tcc aat gat cca gaa 1344
Asn Tyr Ala Asn Ser Lys Tyr Lys Tyr Gly Asp Ser Asn Asp Pro Glu 435 440 445
tcc ctc ggc ggg ctt tcc acc ctt age gct cca ate caa cag gtt aat 1392
Ser Leu Gly Gly Leu Ser Thr Leu Ser Ala Pro Ile Gln Gln Val Asn 450 455 460 tgc aat cca age gat acc aat cag aag ate aat gct etc tac cca ttc Cys Asn Pro Ser Asp Thr Asn Gln Lys Ile Asn Ala Leu Tyr Pro Phe 515 520 525
age ctt gtt age tac gat ctg aat cct aag aat gtt ttc ggg gaa etc Ser Leu Val Ser Tyr Asp Leu Asn Pro Lys Asn Val Phe Gly Glu Leu
550 555 560
545
gct gct acc cag aat age aag tac ctt gat ggc gaa ate ctg aat ggg 1440
Ala Ala Thr Gln Asn Ser Lys Tyr Leu Asp Gly Glu Ile Leu Asn Gly
465 470 475 480
ate ggc gea age ctg cct ggc tac tgc acg acc ggg tgc tca cct acc 1488
Ile Gly Ala Ser Leu Pro Gly Tyr Cys Thr Thr Gly Cys Ser Pro Thr 485 490 495
gaa cca cca ttc age tgc acg age acg gea aat ggg tac aag gea age 153 6 Glu Pro Pro Phe Ser Cys Thr Ser Thr Ala Asn Gly Tyr Lys Ala Ser 500 505 510
1584
acg cag gea aat gtg aag ggg aat acc ggg aag ctg ggc gtt etc gea 1632 Thr Gln Ala Asn Val Lys Gly Asn Thr Gly Lys Leu Gly Val Leu Ala 530 535 540
1680
1728
gat tca gat acc aat aat gtt ate ctt aag ggc ate cca gea gaa aag
Asp Ser Asp Thr Asn Asn Val Ile Leu Lys Gly Ile Pro Ala Glu Lys
565 570 575
ggc tac ttc cca aat aat gea aga cca acc gtt gtg aag gaa tgg ate 177 6 Gly Tyr Phe Pro Asn Asn Ala Arg Pro Thr Val Val Lys Glu Trp Ile 580 585 590
aat ggg gct tcc gea gtt cca ctt gat tcc ggc aat acc ctg ttc atg Asn Gly Ala Ser Ala Val Pro Leu Asp Ser Gly Asn Thr Leu Phe Met 595 600 605
acg gct acg aac ctg acg gct acc cag tac aga ate cgc ate cgt tac Thr Ala Thr Asn Leu Thr Ala Thr Gln Tyr Arg Ile Arg Ile Arg Tyr 610 615 620
gct aac cca aac tca aac acg cag ate ggc gtt aga ate acg cag aac Ala Asn Pro Asn Ser Asn Thr Gln Ile Gly Val Arg Ile Thr Gln Asn 625 630 635 640
ggg age etc ate tcc tcc tcc aac ctc acg ctg tac tca acc acc gat Gly Ser Leu Ile Ser Ser Ser Asn Leu Thr Leu Tyr Ser Thr Thr Asp 645 650 655
atg aac aac acc ctg cca ctg aac gtt tac gtg ate ggg gaa aac ggg Met Asn Asn Thr Leu Pro Leu Asn Val Tyr Val Ile Gly Glu Asn Gly 660 665 670
1824
1872
1920
1968
2016
aac tac acc ctc cag gat ctc tac aac acg acg aac gtt ctg tcc acg 2064 Asn Tyr Thr Leu Gln Asp Leu Tyr Asn Thr Thr Asn Val Leu Ser Thr 675 680 685 ggc gat Gly Asp 690
gat cgc Asp Arg 705
aac aac Asn Asn
tgc gct Cys Ala
gag cag Glu Gln
ttc aag Phe Lys 770
cag ate Gln Ile 785
ttc tgc Phe Cys
cag ctt Gln Leu
act cag Thr Gln
ttc ctg Phe Leu 850
ttc acg Phe Thr 865
tac acg Tyr Thr
gaa ctg Glu Leu
ate acc Ile Thr
ate gag Ile Glu
aac ggg Asn Gly
ate gea Ile Ala 740
gtg tcc Val Ser 755
tcc tcc Ser Ser
age cag Ser Gln
gaa gaa Glu Glu
ctc gaa Leu Glu 820
aac tgg Asn Trp 835
ttc aac Phe Asn
age tac Ser Tyr
cgc tac Arg Tyr
ate ate Ile Ile 900
ctg cag Leu Gln
ttc gtg Phe Val 710
aac aac Asn Asn 725
ggc acc Gly Thr
gat tta Asp Leu
cca tac Pro Tyr
gtt gea Val Ala 790
aag aac Lys Asn 805
gea age Ala Ser
gtg ctc Val Leu
ggg aac Gly Asn
gct tac Ala Tyr 870
aag gtg Lys Val 885
age cgc Ser Arg
ate acc Ile Thr 695
cct acg Pro Thr
aac ggc Asn Gly
cag cag Gln Gln
gaa aag Glu Lys 760
gaa gaa Glu Glu 775
ctg aag Leu Lys
gtg ctg Val Leu
aac ctt Asn Leu
ggc acg Gly Thr 840
tac ctg Tyr Leu 855
cag aag Gln Lys
tcc ggg Ser Gly
tac ggg Tyr Gly
ggc ggg Gly Gly
atg cca Met Pro
aac aac Asn Asn 730
tcc tgc Ser Cys 745
ata acc Ile Thr
ctt gct Leu Ala
gtt atg Val Met
aga aag Arg Lys 810
ctc gtt Leu Val 825
aac gct Asn Ala
age ctc Ser Leu
ate gat Ile Asp
ttc ate Phe Ile 890
aag gaa Lys Glu 905
gat cag Asp Gln 700
gtg cca Val Pro 715
aac cct Asn Pro
tcc ggc Ser Gly
acg cag Thr Gln
ctt gaa Leu Glu 780
gct ctc Ala Leu 795
ctc gtg Leu Val
ggg ggg Gly Gly
tac ate Tyr Ile
cag cca Gln Pro 860
gaa tcc Glu Ser 875
ggg cag Gly Gln
ate gat Ile Asp
aag ata Lys Ile
ggc aac Gly Asn
cct cat Pro His
cca cca Pro Pro 750
gtt tac Val Tyr 765
gtt age Val Ser
age gat Ser Asp
aac aag Asn Lys
aac ttc Asn Phe 830
aac tat Asn Tyr 845
gea tcc Ala Ser
acg ctt Thr Leu
tca aac Ser Asn
aag ate Lys Ile 910
ttc ate Phe Ile
acc aac Thr Asn 720
cat gtt His Val 735
aag ttc Lys Phe
atg ctc Met Leu
age tac Ser Tyr
gaa cta Glu Leu 800
gea aag Ala Lys 815
gag acg Glu Thr
gat tca Asp Ser
ggc ttc Gly Phe
aag cct Lys Pro 880
cag gtt Gln Val 895
ctt aac Leu Asn
2112
2160
2208
2256
2304
2352
2400
2448
2496
2544
2592
2640
2688
2736 gtg cca tac gca ggg cca ctc cca ate acc gea gat gea age ate acc Val Pro Tyr Ala Gly Pro Leu Pro Ile Thr Ala Asp Ala Ser Ile Thr 915 920 925
2784
tgc tgc gct cca gaa ata ggg cag tgc gat ggg gaa cag tca gat tcc Cys Cys Ala Pro Glu Ile Gly Gln Cys Asp Gly Glu Gln Ser Asp Ser 930 935 940
2832
cat ttc ttc aac tac age ate gat gtt ggc gca ctc cat cca gaa ctt His Phe Phe Asn Tyr Ser Ile Asp Val Gly Ala Leu His Pro Glu Leu 945 950 955 960
2880
aac cca ggg ate gaa ate ggg ctg aag ate gtt cag age aac ggc tac Asn Pro Gly Ile Glu Ile Gly Leu Lys Ile Val Gln Ser Asn Gly Tyr 965 970 975
2928
ate acc ate tcc aac ctt gaa ate ate gaa gaa aga cca tta acg gaa Ile Thr Ile Ser Asn Leu Glu Ile Ile Glu Glu Arg Pro Leu Thr Glu 980 985 990
2976
atg gaa att caa gca gtg aac cgc aag aac cag aag tgg gaa cgc gaa Met Glu Ile Gln Ala Val Asn Arg Lys Asn Gln Lys Trp Glu Arg Glu 995 1000 1005
3024
aag ctg ctt gaa tgc gca tcc ate tcc gaa ctc ctc cag cct ate ate Lys Leu Leu Glu Cys Ala Ser Ile Ser Glu Leu Leu Gln Pro Ile Ile 1010 1015 1020
3072
aac cag ata gat age ctc ttc aag gat ggc aac tgg tac aac gat ate Asn Gln Ile Asp Ser Leu Phe Lys Asp Gly Asn Trp Tyr Asn Asp Ile 1025 1030 1035 1040
3120
cta cca cat gtt acc tac cag gat ctt aag aac ate ate ate cca gaa Leu Pro His Val Thr Tyr Gln Asp Leu Lys Asn Ile Ile Ile Pro Glu 1045 1050 1055
3168
ctt cct aag ctc aag cat tgg ttc ate gaa aac ctg cct ggg gaa tac Leu Pro Lys Leu Lys His Trp Phe Ile Glu Asn Leu Pro Gly Glu Tyr 1060 1065 1070
3216
cat gaa ate gaa cag aag atg aag gaa gca tta aag tac gca ttc act His Glu Ile Glu Gln Lys Met Lys Glu Ala Leu Lys Tyr Ala Phe Thr 1075 1080 1085
3264
cag ctc gat gaa aag aac ctg ate cat aac ggc cat ttc acc acc aac Gln Leu Asp Glu Lys Asn Leu Ile His Asn Gly His Phe Thr Thr Asn 1090 1095 1100
3312
ctc ate gat tgg cag gtg gaa ggc gat gct cag atg aag gtg ctt gaa Leu Ile Asp Trp Gln Val Glu Gly Asp Ala Gln Met Lys Val Leu Glu 1105 1110 1115 1120
3360
aac gat gca ctc gct ctc cag cta ttc aac tgg gat gct tcc gca tcc Asn Asp Ala Leu Ala Leu Gln Leu Phe Asn Trp Asp Ala Ser Ala Ser 1125 1130 1135
3408 cag age ate aac ate cta gag ttc gat gaa gat aag gct tac aag ctg 3456 Gln Ser Ile Asn Ile Leu Glu Phe Asp Glu Asp Lys Ala Tyr Lys Leu 1140 1145 1150
cgt gtg tac gea cag ggc tcc ggg acg ate cag ttc ggc aac tgc gaa 3 504 Arg Val Tyr Ala Gln Gly Ser Gly Thr Ile Gln Phe Gly Asn Cys Glu 1155 1160 1165
gat gaa gct ate cag ttc aac acc aac tca ttc ate tac cag gaa aag 3552 Asp Glu Ala Ile Gln Phe Asn Thr Asn Ser Phe Ile Tyr Gln Glu Lys 1170 1175 1180
ata gtg tac ttc gat acg cca tcc gtt aac ctt cat ate cag age gaa 3600 Ile Val Tyr Phe Asp Thr Pro Ser Val Asn Leu His Ile Gln Ser Glu 1185 1190 1195 1200
ggc tcc gag ttc ate gtg age age ate gat etc ate gaa ctc age gat 3648 Gly Ser Glu Phe Ile Val Ser Ser Ile Asp Leu Ile Glu Leu Ser Asp 1205 1210 1215
gat cag tag 3657
Asp Gln *
<210> SEQ ID NO: 38 <211> Comprimento: 1218 <212> Tipo: PRT
<213> Organismo: Seqüência Artificial <220> Características:
<223> Outras Informações: APOSYNAXMI-031(FL) <400> Seqüência: 38
Met Gln Ile Leu Gly Tyr Ser Ser Phe Val Ala Ile Ala Leu Leu Met
15 10 15
Ser Val Val Val Val Cys Asn Gly Gly Lys Thr Ser Thr Tyr Val Arg
20 25 30
Asn Leu Asp Cys Asn Leu Gln Ser Gln Gln Asn Ile Pro Tyr Asn Val
35 40 45
Leu Ala Ile Pro Val Ser Asn Val Asn Ser Leu Thr Asp Thr Val Gly
50 55 60
Asp Leu Lys Lys Ala Trp Glu Glu Phe Gln Lys Thr Gly Ser Phe Ser 65 70 75 80
Leu Thr Ala Leu Gln Gln Gly Phe Ser Ala Ser Gln Gly Gly Thr Phe
85 90 95
Asn Tyr Leu Thr Leu Leu Gln Ser Gly Ile Ser Leu Ala Gly Ser Phe
100 105 110
Val Pro Gly Gly Thr Phe Val Ala Pro Ile Ile Asn Met Val Ile Gly
115 120 125
Trp Leu Trp Pro His Lys Asn Lys Asn Ala Asp Thr Glu Asn Leu Ile
130 135 140
Asn Leu Ile Asp Ser Glu Ile Gln Lys Gln Leu Asn Lys Ala Leu Leu 145 150 155 160
Asp Ala Asp Arg Asn Glu Trp Ser Ser Tyr Leu Glu Ser Ile Phe Asp 165 170 175 Ser Ser Asn Asn Leu Asn Gly Ala Ile Val Asp Ala Gln Trp Ser Gly
180 185 190
Thr Val Asn Thr Thr Asn Arg Thr Leu Arg Asn Pro Thr Glu Ser Asp
195 200 205
Tyr Thr Asn Val Val Thr Asn Phe Ile Ala Ala Asp Gly Asp Ile Ala
210 215 220
Asn Asn Glu Asn His Ile Met Asn Gly Asn Phe Asp Val Ala Ala Ala 225 230 235 240
Pro Tyr Phe Val Ile Gly Ala Thr Ala Arg Phe Ala Ala Met Gln Ser
245 250 255
Tyr Ile Lys Phe Cys Asn Ala Trp Ile Asp Lys Val Gly Leu Ser Asp
260 265 270
Ala Gln Leu Thr Thr Gln Lys Ala Asn Leu Asp Arg Thr Lys Gln Asn
275 280 285
Met Arg Asn Ala Ile Leu Asn Tyr Thr Gln Gln Val Met Lys Val Phe
290 295 300
Lys Asp Ser Lys Asn Met Pro Thr Ile Gly Thr Asn Lys Phe Ser Val 305 310 315 320
Asp Thr Tyr Asn Val Tyr Ile Lys Gly Met Thr Leu Asn Val Leu Asp
325 330 335
Ile Val Ala Ile Trp Pro Ser Leu Tyr Pro Asp Asp Tyr Thr Ser Gln
340 345 350
Thr Ala Leu Glu Gln Thr Arg Val Thr Phe Ser Asn Met Val Gly Gln
355 360 365
Glu Glu Gly Thr Asp Gly Ser Leu Arg Ile Tyr Asn Thr Phe Asp Ser
370 375 380
Phe Ser Tyr Gln His Ser Pro Ile Pro Asn Asn Asn Val Asn Leu Ile 385 390 395 400
Ser Tyr Tyr Asn Asp Glu Leu Gln Asn Leu Glu Leu Gly Val Tyr Thr
405 410 415
Pro Pro Lys Lys Gly Ser Gly Tyr Ser Tyr Pro Tyr Gly Phe Val Leu
420 425 430
Asn Tyr Ala Asn Ser Lys Tyr Lys Tyr Gly Asp Ser Asn Asp Pro Glu
435 440 445
Ser Leu Gly Gly Leu Ser Thr Leu Ser Ala Pro Ile Gln Gln Val Asn
450 455 460
Ala Ala Thr Gln Asn Ser Lys Tyr Leu Asp Gly Glu Ile Leu Asn Gly 465 470 475 480
Ile Gly Ala Ser Leu Pro Gly Tyr Cys Thr Thr Gly Cys Ser Pro Thr
485 490 495
Glu Pro Pro Phe Ser Cys Thr Ser Thr Ala Asn Gly Tyr Lys Ala Ser
500 505 510
Cys Asn Pro Ser Asp Thr Asn Gln Lys Ile Asn Ala Leu Tyr Pro Phe
515 520 525
Thr Gln Ala Asn Val Lys Gly Asn Thr Gly Lys Leu Gly Val Leu Ala
530 535 540
Ser Leu Val Ser Tyr Asp Leu Asn Pro Lys Asn Val Phe Gly Glu Leu 545 550 555 560
Asp Ser Asp Thr Asn Asn Val Ile Leu Lys Gly Ile Pro Ala Glu Lys
565 570 575
Gly Tyr Phe Pro Asn Asn Ala Arg Pro Thr Val Val Lys Glu Trp Ile
580 585 590
Asn Gly Ala Ser Ala Val Pro Leu Asp Ser Gly Asn Thr Leu Phe Met
595 600 605
Thr Ala Thr Asn Leu Thr Ala Thr Gln Tyr Arg Ile Arg Ile Arg Tyr 610 615 620 Ala Asn Pro Asn Ser Asn Thr Gln Ile Gly Val Arg Ile Thr Gln Asn 625 630 635 640 Gly Ser Leu Ile Ser Ser Ser Asn Leu Thr Leu Tyr Ser Thr Thr Asp 645 650 655 Met Asn Asn Thr Leu Pro Leu Asn Val Tyr Val Ile Gly Glu Asn Gly 660 665 670 Asn Tyr Thr Leu Gln Asp Leu Tyr Asn Thr Thr Asn Val Leu Ser Thr 675 680 685 Gly Asp Ile Thr Leu Gln Ile Thr Gly Gly Asp Gln Lys Ile Phe Ile 690 695 700 Asp Arg Ile Glu Phe Val Pro Thr Met Pro Val Pro Gly Asn Thr Asn 705 710 715 720 Asn Asn Asn Gly Asn Asn Asn Gly Asn Asn Asn Pro Pro His His Val 725 730 735 Cys Ala Ile Ala Gly Thr Gln Gln Ser Cys Ser Gly Pro Pro Lys Phe 740 745 750 Glu Gln Val Ser Asp Leu Glu Lys Ile Thr Thr Gln Val Tyr Met Leu 755 760 765 Phe Lys Ser Ser Pro Tyr Glu Glu Leu Ala Leu Glu Val Ser Ser Tyr 770 775 780 Gln Ile Ser Gln Val Ala Leu Lys Val Met Ala Leu Ser Asp Glu Leu 785 790 795 800 Phe Cys Glu Glu Lys Asn Val Leu Arg Lys Leu Val Asn Lys Ala Lys 805 810 815 Gln Leu Leu Glu Ala Ser Asn Leu Leu Val Gly Gly Asn Phe Glu Thr 820 825 830 Thr Gln Asn Trp Val Leu Gly Thr Asn Ala Tyr Ile Asn Tyr Asp Ser 835 840 845 Phe Leu Phe Asn Gly Asn Tyr Leu Ser Leu Gln Pro Ala Ser Gly Phe 850 855 860 Phe Thr Ser Tyr Ala Tyr Gln Lys Ile Asp Glu Ser Thr Leu Lys Pro 865 870 875 880 Tyr Thr Arg Tyr Lys Val Ser Gly Phe Ile Gly Gln Ser Asn Gln Val 885 890 895 Glu Leu Ile Ile Ser Arg Tyr Gly Lys Glu Ile Asp Lys Ile Leu Asn 900 905 910 Val Pro Tyr Ala Gly Pro Leu Pro Ile Thr Ala Asp Ala Ser Ile Thr 915 920 925 Cys Cys Ala Pro Glu Ile Gly Gln Cys Asp Gly Glu Gln Ser Asp Ser 930 935 940 His Phe Phe Asn Tyr Ser Ile Asp Val Gly Ala Leu His Pro Glu Leu 945 950 955 960 Asn Pro Gly Ile Glu Ile Gly Leu Lys Ile Val Gln Ser Asn Gly Tyr 965 970 975 Ile Thr Ile Ser Asn Leu Glu Ile Ile Glu Glu Arg Pro Leu Thr Glu 980 985 990 Met Glu Ile Gln Ala Val Asn Arg Lys Asn Gln Lys Trp Glu Arg Glu 995 1000 1005 Lys Leu Leu Glu Cys Ala Ser Ile Ser Glu Leu Leu Gln Pro Ile Ile 1010 1015 1020 Asn Gln Ile Asp Ser Leu Phe Lys Asp Gly Asn Trp Tyr Asn Asp Ile 1025 1030 1035 1040 Leu Pro His Val Thr Tyr Gln Asp Leu Lys Asn Ile Ile Ile Pro Glu 1045 1050 1055 Leu Pro Lys Leu Lys His Trp Phe Ile Glu Asn Leu Pro Gly Glu Tyr 1060 1065 1070 His Glu Ile Glu Gln Lys Met Lys Glu Ala Leu Lys Tyr Ala Phe Thr
1075 1080 1085
Gln Leu Asp Glu Lys Asn Leu Ile His Asn Gly His Phe Thr Thr Asn
1090 1095 1100
Leu Ile Asp Trp Gln Val Glu Gly Asp Ala Gln Met Lys Val Leu Glu 1105 1110 1115 1120
Asn Asp Ala Leu Ala Leu Gln Leu Phe Asn Trp Asp Ala Ser Ala Ser
1125 1130 1135
Gln Ser Ile Asn Ile Leu Glu Phe Asp Glu Asp Lys Ala Tyr Lys Leu
1140 1145 1150
Arg Val Tyr Ala Gln Gly Ser Gly Thr Ile Gln Phe Gly Asn Cys Glu
1155 1160 1165
Asp Glu Ala Ile Gln Phe Asn Thr Asn Ser Phe Ile Tyr Gln Glu Lys
1170 1175 1180
Ile Val Tyr Phe Asp Thr Pro Ser Val Asn Leu His Ile Gln Ser Glu 1185 1190 1195 1200
Gly Ser Glu Phe Ile Val Ser Ser Ile Asp Leu Ile Glu Leu Ser Asp 1205 1210 1215
Asp Gln

Claims (31)

1. Molécula de ácido nucléico isolada caracterizada por compreender uma seqüência de nucleotídeos selecionada do grupo que consiste em: a) seqüência de nucleotídeos das SEQ ID N0:1, 3, 5,7, 9, 11, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34 ou 37, ou um complemento destas; b) seqüência de nucleotídeos tendo pelo menos 90% de identidade de seqüência com a seqüência de nucleotídeos de SEQ ID NO: 1, 3, 5, 7, 9, 11, 14, 16, 18, 20, 22, 24, 26,28, 30, 32, 34 ou 37, ou um complemento destas; c) seqüência de nucleotídeos que codifica um polipeptídeo compreendendo a seqüência de aminoácidos de SEQ ID NO: 2, 4, 6, 8, 10, 12, 15, 17, 19, 21, 23, 25, 27,29, 31, 33, 35 ou 38; d) seqüência de nucleotídeos que codifica um polipeptídeo compreendendo uma seqüência de aminoácidos tendo pelo menos 90% de identidade de seqüência com a seqüência de aminoácidos de SEQ ID NO: 2, 4, 6, 8, 10, 12,15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35 ou 38; e, e) seqüência de nucleotídeos da endotoxina delta do inserto de DNA do plasmídeo depositado com Nos. de Acesso B-30935, B-30936, B-30937 ou B-50046, ou um complemento destas.
2. Molécula de ácido nucléico isolada de acordo com a reivindicação 1, caracterizada pelo fato de que a seqüência de nucleotídeos citada é uma seqüência sintética que foi projetada para expressão em uma planta.
3. Vetor caracterizado por compreender a molécula de ácido nucléico de acordo com a reivindicação 1.
4. Vetor de acordo com a reivindicação 3, caracterizado por compreender adicionalmente uma molécula de ácido nucléico codificando um polipeptídeo heterólogo.
5. Célula hospedeira caracterizada por conter o vetor de acordo com a reivindicação 3.
6. Célula hospedeira de acordo com a reivindicação 5, caracterizada por ser uma célula hospedeira bacteriana.
7. Célula hospedeira de acordo com a reivindicação 5, caracterizada por ser uma célula vegetal.
8. Planta transgênica caracterizada por compreender a célula hospedeira de acordo com a reivindicação 7.
9. Planta transgênica de acordo com a reivindicação 8, caracterizada pelo fato de que a planta citada é selecionada do grupo que consiste em milho, sorgo, trigo, repolho, girassol, tomate, crucíferas, pimentas, batata, algodão, arroz, soja, beterraba, cana-de-açúcar, tabaco, cevada e colza.
10. Semente transgênica caracterizada por compreender a molécula de ácido nucléico de acordo com a reivindicação 1.
11. Polipeptídeo isolado com atividade pesticida caracterizado por ser selecionado do grupo que consiste em: a) polipeptídeo compreendendo a seqüência de aminoácidos de SEQ ID NO: 2, 4, 6, 8, 10, 12, 15, 17, 19,21, 23, 25, 27, 29, 31, 33, 35 ou 38; b) polipeptídeo compreendendo uma seqüência de aminoácidos tendo pelo menos 90% de identidade de seqüência com a seqüência de aminoácidos de SEQ ID NO:2, 4, 6, 8, 10,12. 15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35 ou 38; c) polipeptídeo que é codificado por uma seqüência de nucleotídeos de SEQ ID NO:l, 3, 5, 7, 9, 11, 14, 16, 18,20, 22, 24, 26, 28, 30, 32, 34 ou 37; d) polipeptídeo que é codificado por uma seqüência de nucleotídeos que é pelo menos 90% idêntica à seqüência de nucleotídeos de SEQ ID NO:l, 3, 5, 7, 9, 11, 14, 16, 18,20 20, 22, 24, 26, 28, 30, 32, 34 ou 37; e, e) polipeptídeo codificado pela seqüência de nucleotídeos da endotoxina delta do inserto de DNA do plasmídeo depositado com Nos. de Acesso B-30935, B-30936, B-30937 ou B-50046.
12. Polipeptídeo de acordo com a reivindicação 11, caracterizado por compreender adicionalmente seqüências de aminoácido heterólogas.
13. Anticorpo caracterizado por se ligar seletivamente ao polipeptídeo de acordo com a reivindicação 11.
14. Composição caracterizada por compreender o polipeptídeo de acordo com a reivindicação 11.
15. Composição de acordo com a reivindicação 14, caracterizada por ser selecionada do grupo que consiste em um pó, poeira, pellet, grânulo, spray, emulsão, colóide e solução.
16. Composição de acordo com a reivindicação 14, caracterizada por ser preparada por dessecação, Iiofilização, homogeneização, extração, filtração, centrifugação, sedimentação ou concentração de uma cultura de células de Bacillus thuringiensis.
17. Composição de acordo com a reivindicação 14, caracterizada por compreender de cerca de 1% a cerca de 99% em peso do polipeptídeo citado.
18. Método para controle de população de pragas de lepidópteros ou coleópteros caracterizado por compreender pôr em contato a população citada com uma quantidade que tenha efeito de pesticida do polipeptídeo de acordo com a reivindicação 11.
19. Método para exterminar uma praga de lepidópteros ou coleópteros caracterizado por compreender pôr em contato a praga citada com, ou alimentar a praga citada com, uma quantidade que tenha efeito de pesticida do polipeptideo de acordo com a reivindicação 11.
20. Método para produzir um polipeptideo com atividade pesticida caracterizado por compreender cultivar a célula hospedeira de acordo com a reivindicação 4 sob condições nas quais a molécula de ácido nucléico codificando o polipeptideo é expressa.
21. Planta caracterizada por ter incorporado de maneira estável no seu genoma uma construção de DNA compreendendo uma seqüência de nucleotídeos que codifica uma proteína tendo atividade pesticida, em que a seqüência de nucleotídeo citada é selecionada do grupo que consiste em: a) seqüência de nucleotídeos das SEQ ID NO:l, 3, 5,7, 9, 11, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34 ou 37; b) seqüência de nucleotídeos tendo pelo menos 90% de identidade de seqüência com a seqüência de nucleotídeos de SEQ ID NO: 1, 3, 5, 7, 9, 11, 14, 16, 18, 20, 22, 24, 26,28, 30, 32, 34 ou 37; c) seqüência de nucleotídeos que codifica um polipeptideo compreendendo a seqüência de aminoácidos de SEQ ID NO: 2, 4, 6, 8, 10, 12, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35 ou 38; d) seqüência de nucleotídeos que codifica um polipeptideo tendo pelo menos 90% de identidade de seqüência de aminoácidos com a seqüência de aminoácidos de SEQ ID NO: 2, 4, 6, 8, 10, 12, 15, 17, 19, 21, 23, 25, 27,29, 31, 33, 35 ou 38; e, e) seqüência de nucleotídeos da endotoxina delta do inserto de DNA do plasmídeo depositado com Nos. de Acesso B-30935, B-30936, B-30937, B-50046, ou um complemento destas; em que a seqüência de nucleotídeos citada está operacionalmente ligada a um promotor que dirige a expressão de uma seqüência codificante em uma célula vegetal.
22. Planta de acordo com a reivindicação 21, caracterizada por ser uma célula vegetal.
23. Método para proteger uma planta de uma praga caracterizado por introduzir na planta citada ou célula desta pelo menos um vetor de expressão compreendendo uma seqüência de nucleotídeos que codifique um polipeptídeo pesticida, em que a seqüência de nucleotídeos é selecionada do grupo que consiste em: a) seqüência de nucleotídeos das SEQ ID NO:l, 3, 5, .7, 9, 11, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34 ou 37; b) seqüência de nucleotídeos tendo pelo menos 90% de identidade de seqüência com a seqüência de nucleotídeos de SEQ ID NO: 1, 3, 5, 7, 9, 11, 14, 16, 18, 20, 22, 24, 26, .28, 30, 32, 34 ou 37; c) seqüência de nucleotídeos que codifica um polipeptídeo compreendendo a seqüência de aminoácidos de SEQ ID NO: 2, 4, 6, 8, 10, 12, 15, 17, 19, 21, 23, 25, 27, .29, 31, 33, 35 ou 38; d) seqüência de nucleotídeos que codifica um polipeptídeo tendo pelo menos 90% de identidade de seqüência com a seqüência de aminoácidos de SEQ ID NO:2, 4,6, 8, 10, 12, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35 ou 38; e, e) seqüência de nucleotídeos da endotoxina delta do inserto de DNA do plasmídeo depositado com Nos. de Acesso B-30935, B-30936, B-30937 ou B-50046, ou um complemento destas.
24. Método de acordo com a reivindicação 23, caracterizado pelo fato de que a planta citada produz um polipeptídeo pesticida tendo atividade pesticida contra uma praga de lepidópteros ou coleópteros.
25. Método para proteger uma planta de uma praga de nematóides caracterizado por compreender: a) introduzir na planta citada ou célula desta pelo menos um vetor de expressão compreendendo uma seqüência de nucleotídeos que codifique um polipeptídeo pesticida, em que o polipeptídeo pesticida citado possui um tamanho molecular maior que 22 kDa; e, b) cultivar a planta citada em um campo contendo nematóides de cisto.
26. Método de acordo com a reivindicação 25, caracterizado pelo fato de que o nematóide de cisto citado é Heterodera sp.
27. Método de acordo com a reivindicação 26, caracterizado pelo fato de que o nematóide de cisto citado é Heterodera schactii.
28. Método de acordo com a reivindicação 25, caracterizado pelo fato de que o polipeptídeo pesticida citado é maior que cerca de 4OkDa.
29. Método de acordo com a reivindicação 28, caracterizado pelo fato de que o polipeptídeo pesticida citado é maior que cerca de 7OkDa.
30. Método de acordo com a reivindicação 29, caracterizado pelo fato de que o polipeptídeo citado é selecionado do grupo que consiste em: a) polipeptídeo compreendendo a seqüência de aminoácidos de SEQ ID NO: 2, 4, 6, 8, 10, 12, 15, 17, 19,21, 23, 25, 27, 29, 31, 33, 35 ou 38; b) polipeptídeo compreendendo uma seqüência de aminoácidos tendo pelo menos 90% de identidade de seqüência com a seqüência de aminoácidos de SEQ ID NO:2, 4, 6, 8, 10,12, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35 ou 38; c) polipeptídeo que é codificado por uma seqüência de nucleotídeos de SEQ ID NO:l, 3, 5, 7, 9, 11, 14, 16, 18,20, 22, 24, 26, 28, 30, 32, 34 ou 37; d) polipeptídeo que é codificado por uma seqüência de nucleotídeos que é pelo menos 90% idêntica à seqüência de nucleotídeos de SEQ ID NO:l, 3, 5, 7, 9, 11, 14, 16, 18,20, 22, 24, 26, 28, 30, 32, 34 ou 37; e, e) polipeptídeo codificado pela seqüência de nucleotideos da endotoxina delta do inserto de DNA do plasmídeo depositado com Nos. de Acesso B-3 093 5, B-3 093 6, B-30937 ou B-50046, ou um complemento destas.
31. Método de acordo com a reivindicação 25, caracterizado pelo fato de que a planta citada possui uma produção aumentada comparada a uma planta que não expressa a seqüência de nucleotideos codificando uma proteína pesticida.
BRPI0713646-3A 2006-06-14 2007-06-14 Nucleic acid molecule; vector; hospedeira cell; polipeptídeo with pesticide activity and method for their production; composition; method for obtaining a plant, as well as methods for control of pest populations; to exterminate a plague of lepidópteros or coleópteros; to protect a plant of a nematode prague BRPI0713646B1 (pt)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US81377406P 2006-06-14 2006-06-14
US60/813,774 2006-06-14
PCT/US2007/071173 WO2007147029A2 (en) 2006-06-14 2007-06-14 Axmi-031, axmi-039, axmi-040 and axmi-049, a family of delta-endotoxin genes and methods for their use

Publications (2)

Publication Number Publication Date
BRPI0713646A2 true BRPI0713646A2 (pt) 2012-10-23
BRPI0713646B1 BRPI0713646B1 (pt) 2017-11-21

Family

ID=38832836

Family Applications (1)

Application Number Title Priority Date Filing Date
BRPI0713646-3A BRPI0713646B1 (pt) 2006-06-14 2007-06-14 Nucleic acid molecule; vector; hospedeira cell; polipeptídeo with pesticide activity and method for their production; composition; method for obtaining a plant, as well as methods for control of pest populations; to exterminate a plague of lepidópteros or coleópteros; to protect a plant of a nematode prague

Country Status (12)

Country Link
US (3) US7923602B2 (pt)
EP (1) EP2032598B1 (pt)
CN (1) CN101501066B (pt)
AR (2) AR061467A1 (pt)
AU (1) AU2007260716B2 (pt)
BR (1) BRPI0713646B1 (pt)
DK (1) DK2032598T3 (pt)
ES (1) ES2397118T3 (pt)
HK (1) HK1129396A1 (pt)
NZ (2) NZ594744A (pt)
PL (1) PL2032598T3 (pt)
WO (1) WO2007147029A2 (pt)

Families Citing this family (129)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102066408B (zh) * 2008-06-25 2015-07-01 阿森尼克斯公司 毒素基因及其使用方法
MX2011007157A (es) * 2009-01-23 2011-09-01 Pioneer Hi Bred Int Nuevo gen de bacillus thuringiensis con actividad lepidoptera.
EP2525658B1 (de) 2010-01-22 2017-03-01 Bayer Intellectual Property GmbH Akarizide und/oder insektizide wirkstoffkombinationen
AR080201A1 (es) * 2010-02-18 2012-03-21 Athenix Corp Genes delta-endotoxinicos de bacillus thuringiensis (axmi218, axmi219, axmi220, axmi226, axmi227, axmi228, axmi229, axmi230, y axmi231), y metodos para su uso
US8933299B2 (en) * 2010-08-20 2015-01-13 Pioneer Hi Bred International Inc Bacillus thuringiensis gene with coleopteran activity
JP2012082186A (ja) 2010-09-15 2012-04-26 Bayer Cropscience Ag 殺虫性アリールピロリジン類
CN103298341B (zh) * 2010-09-22 2016-06-08 拜耳知识产权有限责任公司 活性成分在抗线虫作物中用于防治线虫的用途
JP5860471B2 (ja) 2010-11-15 2016-02-16 バイエル・インテレクチュアル・プロパティ・ゲゼルシャフト・ミット・ベシュレンクテル・ハフツングBayer Intellectual Property GmbH N−アリールピラゾール(チオ)カルボキサミド類
US10851387B1 (en) * 2011-04-21 2020-12-01 Basf Agricultural Solutions Seed, Us Llc AXMI253 and AXMI254 toxin genes and methods for their use
US9139843B2 (en) * 2011-05-24 2015-09-22 Pioneer Hi Bred International Inc Endotoxins having nematocidal activity and methods of use thereof
EP2721153B1 (en) 2011-06-16 2019-08-28 The Regents of The University of California Synthetic gene clusters
BR112013033592A8 (pt) * 2011-06-30 2022-07-05 Athenix Corp Toxina nematoide axmi277 e métodos para a sua utilização
US9265252B2 (en) 2011-08-10 2016-02-23 Bayer Intellectual Property Gmbh Active compound combinations comprising specific tetramic acid derivatives
UA117731C2 (uk) * 2012-06-29 2018-09-25 Атенікс Корп. Токсин axmi277 проти нематод та його застосування
TWI654180B (zh) 2012-06-29 2019-03-21 美商艾佛艾姆希公司 殺真菌之雜環羧醯胺
MY196630A (en) 2012-09-14 2023-04-23 BASF Agricultural Solutions Seed US LLC Hppd Variants and Methods of use
CA2887575A1 (en) 2012-10-15 2014-04-24 Pioneer Hi-Bred International, Inc. Methods and compositions to enhance activity of cry endotoxins
WO2014071182A1 (en) 2012-11-01 2014-05-08 Massachusetts Institute Of Technology Directed evolution of synthetic gene cluster
EP2735231A1 (en) 2012-11-23 2014-05-28 Bayer CropScience AG Active compound combinations
BR112015012055B1 (pt) 2012-11-30 2021-01-12 Bayer Cropscience Ag composição fungicida ternária, seu processo de preparação, método para controlar um ou mais microrganismos nocivos, semente resistente a microrganismos nocivos e seu método de tratamento
CA2892712A1 (en) 2012-11-30 2014-06-05 Bayer Cropscience Ag Ternary fungicidal and pesticidal mixtures
WO2014083031A2 (en) 2012-11-30 2014-06-05 Bayer Cropscience Ag Binary pesticidal and fungicidal mixtures
WO2014090765A1 (en) 2012-12-12 2014-06-19 Bayer Cropscience Ag Use of 1-[2-fluoro-4-methyl-5-(2,2,2-trifluoroethylsulfinyl)phenyl]-5-amino-3-trifluoromethyl)-1 h-1,2,4 tfia zole for controlling nematodes in nematode-resistant crops
CN105247054B (zh) * 2013-03-07 2019-06-18 阿则耐克斯公司 毒素基因及其使用方法
EP3744727A1 (en) 2013-03-14 2020-12-02 Pioneer Hi-Bred International, Inc. Compositions and methods to control insect pests
BR112015023709A2 (pt) 2013-03-15 2017-07-18 Pioneer Hi Bred Int polipeptídeo phi-4, polinucleotídeo, composição, método para inibir o crescimento, método para controlar uma população, planta, semente, cassete de expressão, método para expressar em uma planta um polinucleotídeo, método para proteger uma planta, proteína de fusão
AR097280A1 (es) * 2013-08-09 2016-03-02 Athenix Corp Gen de la toxina axmi422 y sus métodos de empleo
WO2015023846A2 (en) 2013-08-16 2015-02-19 Pioneer Hi-Bred International, Inc. Insecticidal proteins and methods for their use
MX359027B (es) 2013-09-13 2018-09-12 Pioneer Hi Bred Int Proteinas insecticidas y metodos para su uso.
EA033842B1 (ru) * 2013-12-09 2019-12-02 Атеникс Корп. Гены токсинов axmi477, axmi482, axmi486 и axmi525 и способы их применения
EP3705489A1 (en) 2014-02-07 2020-09-09 Pioneer Hi-Bred International, Inc. Insecticidal proteins and methods for their use
EP3102684B1 (en) 2014-02-07 2020-05-06 Pioneer Hi-Bred International, Inc. Insecticidal proteins and methods for their use
BR112016020889B1 (pt) 2014-03-11 2022-10-04 BASF Agricultural Solutions Seed US LLC Molécula de ácido nucleico recombinante, célula hospedeira bacteriana, proteína hppd recombinante, uso do ácido nucleico recombinante e produto de base
WO2016000237A1 (en) 2014-07-03 2016-01-07 Pioneer Overseas Corporation Plants having enhanced tolerance to insect pests and related constructs and methods involving insect tolerance genes
WO2016007355A1 (en) * 2014-07-07 2016-01-14 Aroian Raffi Van Anthelmintic probiotic compositions and methods
US10940170B2 (en) 2014-07-07 2021-03-09 University Of Massachusetts Anthelmintic probiotic compositions and methods
US20170247719A1 (en) 2014-09-17 2017-08-31 Pioneer Hi-Bred International, Inc. Compositions and methods to control insect pests
CN107108705B (zh) 2014-10-16 2021-05-25 先锋国际良种公司 杀昆虫蛋白及其使用方法
AU2015369927A1 (en) * 2014-12-22 2017-07-06 AgBiome, Inc. Pesticidal genes and methods of use
RU2740312C2 (ru) 2015-01-15 2021-01-13 Пайониэ Хай-Бред Интернешнл, Инк. Инсектицидные белки и способы их применения
BR112017019419B1 (pt) 2015-03-11 2022-10-11 E. I. Du Pont De Nemours And Company Construto de dna, método de obtenção de uma planta transgênica e método para controlar uma população de praga de verme da raiz do milho
US20160304898A1 (en) 2015-04-17 2016-10-20 AgBiome, Inc. Pesticidal Genes and Methods of Use
UA126058C2 (uk) 2015-04-22 2022-08-10 Аґбайомі, Інк. Інсектицидний ген і спосіб його застосування
CN116333064A (zh) 2015-05-19 2023-06-27 先锋国际良种公司 杀昆虫蛋白及其使用方法
MA46313A (fr) 2015-06-03 2021-04-28 Agbiome Inc Gènes pesticides et leurs procédés d'utilisation
AU2016278142A1 (en) 2015-06-16 2017-11-30 E. I. Du Pont De Nemours And Company Compositions and methods to control insect pests
CN107849097A (zh) 2015-06-22 2018-03-27 农业生物群落股份有限公司 杀虫基因和使用方法
RU2769873C2 (ru) 2015-07-13 2022-04-07 Пивот Байо, Инк. Способы и композиции для улучшения признаков растений
CN116003550A (zh) 2015-08-06 2023-04-25 先锋国际良种公司 植物来源的杀昆虫蛋白及其使用方法
MA45638A (fr) 2015-08-07 2019-05-22 BASF Agricultural Solutions Seed US LLC Utilisation du promoteur de l'annexine pour améliorer le rendement de plantes soumises à des conditions de stress
DK3341483T3 (da) 2015-08-28 2020-03-16 Pioneer Hi Bred Int Ochrobactrum-medieret transformation af planter
JP2018537119A (ja) 2015-10-05 2018-12-20 マサチューセッツ インスティテュート オブ テクノロジー リファクターされたnifクラスターを使用する窒素固定
JP6873984B2 (ja) * 2015-10-14 2021-05-19 バイエル クロップサイエンス エルピーBayer Cropscience Lp Axmi554デルタ−エンドトキシン遺伝子およびその使用方法
WO2017105987A1 (en) 2015-12-18 2017-06-22 Pioneer Hi-Bred International, Inc. Insecticidal proteins and methods for their use
US10358654B2 (en) 2015-12-22 2019-07-23 AgBiome, Inc. Pesticidal genes and methods of use
RU2018137045A (ru) 2016-04-14 2020-05-14 Пайонир Хай-Бред Интернэшнл, Инк. Инсектицидные полипептиды, обладающие улучшенным спектром активности, и пути их применения
US11028407B2 (en) 2016-04-19 2021-06-08 Pioneer Hi-Bred International, Inc. Insecticidal combinations of polypeptides having improved activity spectrum and uses thereof
EP3960863B1 (en) 2016-05-04 2024-11-13 Pioneer Hi-Bred International, Inc. Insecticidal proteins and methods for their use
CN109312359A (zh) 2016-06-16 2019-02-05 先锋国际良种公司 用以防治昆虫有害生物的组合物和方法
EP4083215A1 (en) 2016-06-24 2022-11-02 Pioneer Hi-Bred International, Inc. Plant regulatory elements and methods of use thereof
US11155829B2 (en) 2016-07-01 2021-10-26 Pioneer Hi-Bred International, Inc. Insecticidal proteins from plants and methods for their use
WO2018013333A1 (en) 2016-07-12 2018-01-18 Pioneer Hi-Bred International, Inc. Compositions and methods to control insect pests
EP3510159B1 (en) 2016-09-06 2023-03-01 AgBiome, Inc. Pesticidal genes and methods of use
EP3535285B1 (en) 2016-11-01 2022-04-06 Pioneer Hi-Bred International, Inc. Insecticidal proteins and methods for their use
CN118256514A (zh) 2016-11-23 2024-06-28 巴斯夫农业种子解决方案美国有限责任公司 Axmi669和axmi991毒素基因及其使用方法
EP3555118B1 (en) 2016-12-14 2021-08-18 Pioneer Hi-Bred International Inc. Insecticidal proteins and methods for their use
EP3559240A1 (en) 2016-12-22 2019-10-30 Basf Agricultural Solutions Seed Us Llc Elite event ee-gm4 and methods and kits for identifying such event in biological samples
MX2019007593A (es) 2016-12-22 2019-12-02 BASF Agricultural Solutions Seed US LLC Evento de elíte ee-gm5 y métodos y kits para identificar dicho evento en muestras biológicas.
CA3046226A1 (en) 2016-12-22 2018-06-28 Pioneer Hi-Bred International, Inc. Insecticidal proteins and methods for their use
CN110225974B (zh) 2016-12-22 2024-03-29 巴斯夫农业种子解决方案美国有限责任公司 使用cry14来控制线虫害虫
MX2019008285A (es) 2017-01-12 2019-11-11 Pivot Bio Inc Métodos y composiciones para mejorar atributos de plantas.
BR112019014727A2 (pt) 2017-01-18 2020-04-07 BASF Agricultural Solutions Seed US LLC molécula de ácido nucleico, vector, célula, planta, semente, polipeptídeo, composição, métodos para o controle de uma população de pragas, para matar uma praga, para produzir um polipeptídeo, para proteger uma planta e para aumentar o rendimento em uma planta, uso do ácido nucleico e produto de base
AR110756A1 (es) 2017-01-18 2019-05-02 Bayer Cropscience Lp Uso de bp005 para el control de patógenos de planta
WO2018140214A1 (en) 2017-01-24 2018-08-02 Pioneer Hi-Bred International, Inc. Nematicidal protein from pseudomonas
CN110506117A (zh) 2017-01-30 2019-11-26 农业生物群落股份有限公司 杀虫基因及使用方法
WO2018148001A1 (en) 2017-02-08 2018-08-16 Pioneer Hi-Bred International Inc Insecticidal combinations of plant derived insecticidal proteins and methods for their use
CA3055396A1 (en) 2017-03-07 2018-09-13 BASF Agricultural Solutions Seed US LLC Hppd variants and methods of use
CA3055317A1 (en) 2017-03-07 2018-09-13 BASF Agricultural Solutions Seed US LLC Hppd variants and methods of use
BR112019018175A2 (pt) 2017-03-07 2020-04-07 BASF Agricultural Solutions Seed US LLC molécula, célula, planta, sementes, polipeptídeos recombinantes, método para produzir um polipeptídeo, planta, método para controlar ervas, uso do ácido nucleico e produto de utilidade
CA3058757A1 (en) 2017-04-11 2018-10-18 AgBiome, Inc. Pesticidal genes and methods of use
WO2018217807A1 (en) 2017-05-23 2018-11-29 University Of Massachusetts Purified anthelmintic compositions and related methods
EA201992824A1 (ru) 2017-05-26 2020-05-06 Пайонир Хай-Бред Интернэшнл, Инк. Инсектицидные полипептиды, обладающие улучшенным спектром активности, и пути их применения
US20190040411A1 (en) 2017-08-03 2019-02-07 AgBiome, Inc. Pesticidal genes and methods of use
CN107828817B (zh) * 2017-09-29 2021-02-19 杭州瑞丰生物科技有限公司 一种利用Bt蛋白防治农作物半翅目害虫的方法
US20200165626A1 (en) 2017-10-13 2020-05-28 Pioneer Hi-Bred International, Inc. Virus-induced gene silencing technology for insect control in maize
WO2019083808A1 (en) 2017-10-24 2019-05-02 Basf Se IMPROVING HERBICIDE TOLERANCE AGAINST HPPD INHIBITORS BY REGULATION OF PUTATIVE REDUCED 4-HYDROXYPHENYLPYRUVATE REDUCES IN SOYBEANS
WO2019083810A1 (en) 2017-10-24 2019-05-02 Basf Se IMPROVING HERBICIDE TOLERANCE FOR 4-HYDROXYPHENYLPYRUVATE DIOXYGENASE (HPPD) INHIBITORS BY NEGATIVE REGULATION OF HPPD EXPRESSION IN SOYBEANS
JP7420712B2 (ja) 2017-10-25 2024-01-23 ピボット バイオ, インコーポレイテッド 窒素を固定する操作された微生物を改良するための方法および組成物
US12151988B2 (en) 2017-10-25 2024-11-26 Pivot Bio, Inc. Gene targets for nitrogen fixation targeting for improving plant traits
US10907173B2 (en) 2017-12-22 2021-02-02 AgBiome, Inc. Pesticidal genes and methods of use
EP3755797A1 (en) 2018-02-22 2020-12-30 Zymergen, Inc. Method for creating a genomic library enriched for bacillus and identification of novel cry toxins
CA3087861A1 (en) 2018-03-02 2019-09-06 Pioneer Hi-Bred International, Inc. Plant health assay
WO2019169227A1 (en) 2018-03-02 2019-09-06 Zymergen Inc. Insecticidal protein discovery platform and insecticidal proteins discovered therefrom
EP3764798A4 (en) 2018-03-14 2021-12-22 Pioneer Hi-Bred International, Inc. PROTEIN INSECTICIDES FROM PLANTS AND PROCESSES FOR THEIR USE
CN116410286A (zh) 2018-03-14 2023-07-11 先锋国际良种公司 来自植物的杀昆虫蛋白及其使用方法
CA3097621A1 (en) 2018-04-20 2019-10-24 AgBiome, Inc. Pesticidal proteins and methods of use
US11702668B2 (en) 2018-05-22 2023-07-18 Pioneer Hi-Bred International, Inc. Plant regulatory elements and methods of use thereof
UY38241A (es) * 2018-05-25 2019-11-29 BASF Agricultural Solutions Seed US LLC Evento elite ee-gm5, y métodos y kits para identificar dicho evento en muestras biológicas, y tratamiento de estas
UY38240A (es) * 2018-05-25 2019-11-29 BASF Agricultural Solutions Seed US LLC Evento elite ee-gm4, y métodos y kits para identificar dicho evento en muestras biológicas, y tratamiento de estas
KR20210089629A (ko) 2018-06-05 2021-07-16 라이프에디트 테라퓨틱스, 인크. Rna-가이드된 뉴클레아제 및 그의 활성 단편 및 변이체 및 사용 방법
CA3106444A1 (en) 2018-08-29 2020-03-05 Pioneer Hi-Bred International, Inc. Insecticidal proteins and methods for conferring pesticidal activity to plants
CN113631704A (zh) 2018-12-27 2021-11-09 生命编辑制药股份有限公司 可用于基因编辑的多肽及使用方法
US20220364074A1 (en) 2019-08-12 2022-11-17 LifeEDIT Therapeutics, Inc. Rna-guided nucleases and active fragments and variants thereof and methods of use
MX2022004552A (es) 2019-10-14 2022-10-10 BASF Agricultural Solutions Seed US LLC Nuevos genes de resistencia a insectos y métodos de uso.
US20230242935A1 (en) 2019-10-14 2023-08-03 BASF Agricultural Solutions Seed US LLC Novel insect resistant genes and methods of use
WO2021076346A1 (en) 2019-10-18 2021-04-22 Pioneer Hi-Bred International, Inc. Maize event dp-202216-6 and dp-023211-2 stack
EP4085133A1 (en) 2019-12-30 2022-11-09 Lifeedit Therapeutics, Inc. Rna-guided nucleases and active fragments and variants thereof and methods of use
WO2021202513A1 (en) 2020-03-31 2021-10-07 Elo Life Systems Modulation of endogenous mogroside pathway genes in watermelon and other cucurbits
TW202208626A (zh) 2020-04-24 2022-03-01 美商生命編輯公司 Rna引導核酸酶及其活性片段與變體,以及使用方法
CA3173882A1 (en) 2020-05-11 2021-11-18 Alexandra Briner CRAWLEY Rna-guided nucleic acid binding proteins and active fragments and variants thereof and methods of use
BR112022027035A2 (pt) 2020-07-14 2023-04-11 Pioneer Hi Bred Int Proteínas inseticidas e métodos para uso das mesmas
CA3173949A1 (en) 2020-07-15 2022-01-20 LifeEDIT Therapeutics, Inc. Uracil stabilizing proteins and active fragments and variants thereof and methods of use
BR112023002603A2 (pt) 2020-08-10 2023-04-04 Pioneer Hi Bred Int Elementos reguladores de plantas e métodos de uso dos mesmos
IL301139A (en) 2020-09-11 2023-05-01 Lifeedit Therapeutics Inc Dna modifying enzymes and active fragments and variants thereof and methods of use
CR20230175A (es) 2020-10-23 2023-07-26 Elo Life Systems Inc Métodos para producir plantas de vainilla con mejor sabor y producción agronómica
CA3198940A1 (en) 2020-11-24 2022-06-02 Rebekah Deter Kelly Pesticidal genes and methods of use
TW202300649A (zh) 2021-03-22 2023-01-01 美商生命編輯治療學公司 Dna修飾酶及活性片段及其變體及使用方法
BR112023023044A2 (pt) 2021-05-06 2024-01-23 Agbiome Inc Genes pesticidas e métodos de uso
AU2022290278A1 (en) 2021-06-11 2024-01-04 LifeEDIT Therapeutics, Inc. Rna polymerase iii promoters and methods of use
EP4444890A1 (en) 2021-12-07 2024-10-16 Agbiome, Inc. Pesticidal genes and methods of use
IL314488A (en) 2022-01-24 2024-09-01 Lifeedit Therapeutics Inc RNA-directed nucleases and active fragments and their variants and methods of use
CN118843637A (zh) 2022-02-11 2024-10-25 东北农业大学 用于增加植物中蛋白质和/或油含量和改变油特性的方法和组合物
IL318914A (en) 2022-08-12 2025-04-01 Life Edit Therapeutics Inc RNA-guided nucleases and active fragments and variants thereof and methods of use
WO2024044596A1 (en) 2022-08-23 2024-02-29 AgBiome, Inc. Pesticidal genes and methods of use
AU2023331255A1 (en) 2022-08-25 2025-03-27 Life Edit Therapeutics, Inc. Chemical modification of guide rnas with locked nucleic acid for rna guided nuclease-mediated gene editing
WO2024095245A2 (en) 2022-11-04 2024-05-10 LifeEDIT Therapeutics, Inc. Evolved adenine deaminases and rna-guided nuclease fusion proteins with internal insertion sites and methods of use
WO2024129674A1 (en) 2022-12-13 2024-06-20 AgBiome, Inc. Pesticidal genes and methods of use
WO2024137438A2 (en) 2022-12-19 2024-06-27 BASF Agricultural Solutions Seed US LLC Insect toxin genes and methods for their use
WO2025022367A2 (en) 2023-07-27 2025-01-30 Life Edit Therapeutics, Inc. Rna-guided nucleases and active fragments and variants thereof and methods of use

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5753492A (en) * 1987-08-12 1998-05-19 Mycogen Corporation Genes encoding nematode-active toxins from Bacillus thuringiensis strains
US5281530A (en) * 1987-08-12 1994-01-25 Mycogen Corporation Genes encoding nematode-active toxins cloned from bacillus thuringiensis isolate PS17
US5831011A (en) * 1990-07-27 1998-11-03 Mycogen Corporation Bacillus thuringiensis genes encoding nematode-active toxins
US5589382A (en) * 1990-07-27 1996-12-31 Mycogen Corporation Bacillus thuringiensis genes encoding nematode-active toxins
US5743477A (en) 1992-08-27 1998-04-28 Dowelanco Insecticidal proteins and method for plant protection
US6468523B1 (en) 1998-11-02 2002-10-22 Monsanto Technology Llc Polypeptide compositions toxic to diabrotic insects, and methods of use
US7253343B2 (en) * 2003-08-28 2007-08-07 Athenix Corporation AXMI-003, a delta-endotoxin gene and methods for its use
US20050183161A1 (en) 2003-10-14 2005-08-18 Athenix Corporation AXMI-010, a delta-endotoxin gene and methods for its use

Also Published As

Publication number Publication date
ES2397118T3 (es) 2013-03-04
EP2032598A2 (en) 2009-03-11
WO2007147029A3 (en) 2008-06-19
US20070294787A1 (en) 2007-12-20
US7923602B2 (en) 2011-04-12
US20120167251A1 (en) 2012-06-28
PL2032598T3 (pl) 2013-08-30
US20090181116A1 (en) 2009-07-16
AU2007260716B2 (en) 2013-05-02
HK1129396A1 (pt) 2009-11-27
AR061467A1 (es) 2008-08-27
CN101501066A (zh) 2009-08-05
WO2007147029A2 (en) 2007-12-21
BRPI0713646B1 (pt) 2017-11-21
US8147856B2 (en) 2012-04-03
DK2032598T3 (da) 2013-01-21
AU2007260716A1 (en) 2007-12-21
NZ573398A (en) 2011-11-25
AR111197A2 (es) 2019-06-12
NZ594744A (en) 2013-03-28
EP2032598B1 (en) 2012-10-17
CN101501066B (zh) 2012-05-30

Similar Documents

Publication Publication Date Title
ES2397118T3 (es) AXMI-031, AXMI-039 ,AXMI-040 y AXMI-049, una familia de genes de endotoxina delta y métodos para su uso
ES2316963T3 (es) Genes delta-entotoxino y los metodos para su uso.
ES2864641T3 (es) Una familia de proteínas pesticidas y procedimientos para su uso
US9909140B2 (en) AXMI-115, AXMI-113, AXMI-005, AXMI-163 and AXMI-184: insecticidal proteins and methods for their use
ES2911327T3 (es) Genes de toxinas y procedimientos para su uso
US7674959B2 (en) Axmi-027, axmi-036 and axmi-038, a family of delta-endotoxin genes and methods for their use
US7622572B2 (en) AXMI-028 and AXMI-029, a family of novel delta-endotoxin genes and methods for their use
BR112012020705B1 (pt) molécula de ácido nucleico recombinante, vetor, célula hospedeira microbiana, polipeptídeo recombinante com atividade pesticida, composição, bem como métodos para o controle de uma população de pragas de lepidópteros, para matar uma praga de lepidóptero, para a produção de um polipeptídeo com atividade pesticida, para a proteção de uma planta de uma praga, e para aumentar o rendimento em uma planta
BR112012002275B1 (pt) Genes pesticidas axmi-192, cassete de expressão, célula hospedeira bacteriana, polipeptídeo com atividade pesticida e seu método de produção, composição, bem como métodos para controle e morte de pragas de lepidópteros, coleópteros ou nematódeos
JP6888044B2 (ja) Axmi477、axmi482、axmi486およびaxmi525毒素遺伝子およびそれらの使用方法
BR112016002131B1 (pt) Molécula de ácido nucleico recombinante, vetor compreendendo a referida molécula de ácido nucleico, célula hospedeira de microrganismo, polipeptídeo recombinante com atividade pesticida, composição e métodos para aplicação dos mesmos
BRPI0916829B1 (pt) Cassete de expressão, célula hospedeira bacteriana, polipeptídeo inseticida, composição e métodos para controle, morte de peste lepidóptera ou coleóptera e para proteção de uma planta contra uma peste de inseto
BR112013033592A2 (pt) toxina nematoide axmi277 e métodos para a sua utilização

Legal Events

Date Code Title Description
B06F Objections, documents and/or translations needed after an examination request according [chapter 6.6 patent gazette]
B25G Requested change of headquarter approved

Owner name: ATHENIX CORPORATION (US)

B07A Technical examination (opinion): publication of technical examination (opinion) [chapter 7.1 patent gazette]
B09A Decision: intention to grant [chapter 9.1 patent gazette]
B16A Patent or certificate of addition of invention granted
B25A Requested transfer of rights approved
B25A Requested transfer of rights approved