BRPI0610521A2 - método para desenhar uma molécula de ácido nucléico, molécula de ácido nucléico, vetor, método para obtenção de uma planta transgênica e sua progênie - Google Patents
método para desenhar uma molécula de ácido nucléico, molécula de ácido nucléico, vetor, método para obtenção de uma planta transgênica e sua progênie Download PDFInfo
- Publication number
- BRPI0610521A2 BRPI0610521A2 BRPI0610521-1A BRPI0610521A BRPI0610521A2 BR PI0610521 A2 BRPI0610521 A2 BR PI0610521A2 BR PI0610521 A BRPI0610521 A BR PI0610521A BR PI0610521 A2 BRPI0610521 A2 BR PI0610521A2
- Authority
- BR
- Brazil
- Prior art keywords
- codon
- altered
- codon usage
- plant
- nucleic acid
- Prior art date
Links
- 108020004707 nucleic acids Proteins 0.000 title claims abstract description 206
- 102000039446 nucleic acids Human genes 0.000 title claims abstract description 206
- 150000007523 nucleic acids Chemical class 0.000 title claims abstract description 206
- 238000000034 method Methods 0.000 title claims abstract description 96
- 230000009261 transgenic effect Effects 0.000 title claims abstract description 42
- 239000013598 vector Substances 0.000 title claims description 26
- 108020004705 Codon Proteins 0.000 claims abstract description 330
- 108700010070 Codon Usage Proteins 0.000 claims abstract description 180
- 108090000765 processed proteins & peptides Proteins 0.000 claims abstract description 167
- 102000004196 processed proteins & peptides Human genes 0.000 claims abstract description 164
- 229920001184 polypeptide Polymers 0.000 claims abstract description 163
- 241000700605 Viruses Species 0.000 claims abstract description 160
- 239000002917 insecticide Substances 0.000 claims abstract description 22
- 241000238631 Hexapoda Species 0.000 claims abstract description 12
- 241000196324 Embryophyta Species 0.000 claims description 271
- 150000001413 amino acids Chemical class 0.000 claims description 75
- 235000001014 amino acid Nutrition 0.000 claims description 66
- 229940024606 amino acid Drugs 0.000 claims description 64
- 240000008042 Zea mays Species 0.000 claims description 42
- 235000002017 Zea mays subsp mays Nutrition 0.000 claims description 40
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 claims description 36
- 241000193388 Bacillus thuringiensis Species 0.000 claims description 28
- 229940097012 bacillus thuringiensis Drugs 0.000 claims description 28
- 230000000749 insecticidal effect Effects 0.000 claims description 22
- 235000005824 Zea mays ssp. parviglumis Nutrition 0.000 claims description 20
- 235000016383 Zea mays subsp huehuetenangensis Nutrition 0.000 claims description 20
- 235000005822 corn Nutrition 0.000 claims description 20
- 235000009973 maize Nutrition 0.000 claims description 20
- 239000004471 Glycine Substances 0.000 claims description 15
- WHUUTDBJXJRKMK-UHFFFAOYSA-N Glutamic acid Natural products OC(=O)C(N)CCC(O)=O WHUUTDBJXJRKMK-UHFFFAOYSA-N 0.000 claims description 14
- 244000068988 Glycine max Species 0.000 claims description 13
- 235000010469 Glycine max Nutrition 0.000 claims description 12
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 claims description 12
- 235000004279 alanine Nutrition 0.000 claims description 12
- 229960002429 proline Drugs 0.000 claims description 12
- AGPKZVBTJJNPAG-WHFBIAKZSA-N L-isoleucine Chemical compound CC[C@H](C)[C@H](N)C(O)=O AGPKZVBTJJNPAG-WHFBIAKZSA-N 0.000 claims description 11
- AGPKZVBTJJNPAG-UHFFFAOYSA-N isoleucine Natural products CCC(C)C(N)C(O)=O AGPKZVBTJJNPAG-UHFFFAOYSA-N 0.000 claims description 11
- 229960000310 isoleucine Drugs 0.000 claims description 11
- 239000004475 Arginine Substances 0.000 claims description 10
- 108090001060 Lipase Proteins 0.000 claims description 10
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 claims description 10
- 230000008859 change Effects 0.000 claims description 10
- 241000209510 Liliopsida Species 0.000 claims description 9
- 102000004882 Lipase Human genes 0.000 claims description 9
- 239000004367 Lipase Substances 0.000 claims description 9
- 235000019421 lipase Nutrition 0.000 claims description 9
- 235000007164 Oryza sativa Nutrition 0.000 claims description 7
- 244000062793 Sorghum vulgare Species 0.000 claims description 7
- 241001233957 eudicotyledons Species 0.000 claims description 7
- 235000019713 millet Nutrition 0.000 claims description 7
- 235000002637 Nicotiana tabacum Nutrition 0.000 claims description 6
- 244000061176 Nicotiana tabacum Species 0.000 claims description 6
- 235000002595 Solanum tuberosum Nutrition 0.000 claims description 6
- 244000061456 Solanum tuberosum Species 0.000 claims description 6
- 239000003795 chemical substances by application Substances 0.000 claims description 6
- 235000009566 rice Nutrition 0.000 claims description 6
- 235000007340 Hordeum vulgare Nutrition 0.000 claims description 5
- 241000209140 Triticum Species 0.000 claims description 5
- 235000021307 Triticum Nutrition 0.000 claims description 5
- 235000007688 Lycopersicon esculentum Nutrition 0.000 claims description 4
- 240000003768 Solanum lycopersicum Species 0.000 claims description 4
- 238000004519 manufacturing process Methods 0.000 claims description 4
- 238000003786 synthesis reaction Methods 0.000 claims description 4
- 235000007319 Avena orientalis Nutrition 0.000 claims description 3
- 244000075850 Avena orientalis Species 0.000 claims description 3
- 229920000742 Cotton Polymers 0.000 claims description 3
- 230000015572 biosynthetic process Effects 0.000 claims description 3
- 230000000694 effects Effects 0.000 claims description 3
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 claims description 2
- 241000193830 Bacillus <bacterium> Species 0.000 claims description 2
- 206010021929 Infertility male Diseases 0.000 claims description 2
- IMQLKJBTEOYOSI-GPIVLXJGSA-N Inositol-hexakisphosphate Chemical compound OP(O)(=O)O[C@H]1[C@H](OP(O)(O)=O)[C@@H](OP(O)(O)=O)[C@H](OP(O)(O)=O)[C@H](OP(O)(O)=O)[C@@H]1OP(O)(O)=O IMQLKJBTEOYOSI-GPIVLXJGSA-N 0.000 claims description 2
- 208000007466 Male Infertility Diseases 0.000 claims description 2
- 241000244206 Nematoda Species 0.000 claims description 2
- 238000001784 detoxification Methods 0.000 claims description 2
- 238000011161 development Methods 0.000 claims description 2
- 235000019621 digestibility Nutrition 0.000 claims description 2
- 201000010099 disease Diseases 0.000 claims description 2
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 claims description 2
- 239000003814 drug Substances 0.000 claims description 2
- 230000015784 hyperosmotic salinity response Effects 0.000 claims description 2
- 235000016709 nutrition Nutrition 0.000 claims description 2
- 235000002949 phytic acid Nutrition 0.000 claims description 2
- 230000001225 therapeutic effect Effects 0.000 claims description 2
- DCXYFEDJOCDNAF-UHFFFAOYSA-N Asparagine Natural products OC(=O)C(N)CC(N)=O DCXYFEDJOCDNAF-UHFFFAOYSA-N 0.000 claims 9
- DCXYFEDJOCDNAF-REOHCLBHSA-N L-asparagine Chemical compound OC(=O)[C@@H](N)CC(N)=O DCXYFEDJOCDNAF-REOHCLBHSA-N 0.000 claims 9
- CKLJMWTZIZZHCS-REOHCLBHSA-N L-aspartic acid Chemical compound OC(=O)[C@@H](N)CC(O)=O CKLJMWTZIZZHCS-REOHCLBHSA-N 0.000 claims 9
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 claims 9
- COLNVLDHVKWLRT-QMMMGPOBSA-N L-phenylalanine Chemical compound OC(=O)[C@@H](N)CC1=CC=CC=C1 COLNVLDHVKWLRT-QMMMGPOBSA-N 0.000 claims 9
- OUYCCCASQSFEME-QMMMGPOBSA-N L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-QMMMGPOBSA-N 0.000 claims 9
- KZSNJWFQEVHDMF-BYPYZUCNSA-N L-valine Chemical compound CC(C)[C@H](N)C(O)=O KZSNJWFQEVHDMF-BYPYZUCNSA-N 0.000 claims 9
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 claims 9
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 claims 9
- 239000004472 Lysine Substances 0.000 claims 9
- ONIBWKKTOPOVIA-UHFFFAOYSA-N Proline Natural products OC(=O)C1CCCN1 ONIBWKKTOPOVIA-UHFFFAOYSA-N 0.000 claims 9
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 claims 9
- AYFVYJQAPQTCCC-UHFFFAOYSA-N Threonine Natural products CC(O)C(N)C(O)=O AYFVYJQAPQTCCC-UHFFFAOYSA-N 0.000 claims 9
- 239000004473 Threonine Substances 0.000 claims 9
- KZSNJWFQEVHDMF-UHFFFAOYSA-N Valine Natural products CC(C)C(N)C(O)=O KZSNJWFQEVHDMF-UHFFFAOYSA-N 0.000 claims 9
- 235000009582 asparagine Nutrition 0.000 claims 9
- 229960001230 asparagine Drugs 0.000 claims 9
- 235000003704 aspartic acid Nutrition 0.000 claims 9
- OQFSQFPPLPISGP-UHFFFAOYSA-N beta-carboxyaspartic acid Natural products OC(=O)C(N)C(C(O)=O)C(O)=O OQFSQFPPLPISGP-UHFFFAOYSA-N 0.000 claims 9
- 235000018417 cysteine Nutrition 0.000 claims 9
- XUJNEKJLAYXESH-UHFFFAOYSA-N cysteine Natural products SCC(N)C(O)=O XUJNEKJLAYXESH-UHFFFAOYSA-N 0.000 claims 9
- 235000013922 glutamic acid Nutrition 0.000 claims 9
- 239000004220 glutamic acid Substances 0.000 claims 9
- ZDXPYRJPNDTMRX-UHFFFAOYSA-N glutamine Natural products OC(=O)C(N)CCC(N)=O ZDXPYRJPNDTMRX-UHFFFAOYSA-N 0.000 claims 9
- HNDVDQJCIGZPNO-UHFFFAOYSA-N histidine Natural products OC(=O)C(N)CC1=CN=CN1 HNDVDQJCIGZPNO-UHFFFAOYSA-N 0.000 claims 9
- COLNVLDHVKWLRT-UHFFFAOYSA-N phenylalanine Natural products OC(=O)C(N)CC1=CC=CC=C1 COLNVLDHVKWLRT-UHFFFAOYSA-N 0.000 claims 9
- OUYCCCASQSFEME-UHFFFAOYSA-N tyrosine Natural products OC(=O)C(N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-UHFFFAOYSA-N 0.000 claims 9
- 239000004474 valine Substances 0.000 claims 9
- 241000209094 Oryza Species 0.000 claims 3
- 210000000234 capsid Anatomy 0.000 claims 3
- IJGRMHOSHXDMSA-UHFFFAOYSA-N Atomic nitrogen Chemical compound N#N IJGRMHOSHXDMSA-UHFFFAOYSA-N 0.000 claims 2
- 240000005979 Hordeum vulgare Species 0.000 claims 2
- 230000000295 complement effect Effects 0.000 claims 2
- OJHZNMVJJKMFGX-RNWHKREASA-N (4r,4ar,7ar,12bs)-9-methoxy-3-methyl-1,2,4,4a,5,6,7a,13-octahydro-4,12-methanobenzofuro[3,2-e]isoquinoline-7-one;2,3-dihydroxybutanedioic acid Chemical compound OC(=O)C(O)C(O)C(O)=O.O=C([C@@H]1O2)CC[C@H]3[C@]4([H])N(C)CC[C@]13C1=C2C(OC)=CC=C1C4 OJHZNMVJJKMFGX-RNWHKREASA-N 0.000 claims 1
- 241000341965 Decodon <angiosperm> Species 0.000 claims 1
- 208000035240 Disease Resistance Diseases 0.000 claims 1
- 241000219146 Gossypium Species 0.000 claims 1
- 102000018120 Recombinases Human genes 0.000 claims 1
- 108010091086 Recombinases Proteins 0.000 claims 1
- 125000000539 amino acid group Chemical group 0.000 claims 1
- 230000024346 drought recovery Effects 0.000 claims 1
- DEFVIWRASFVYLL-UHFFFAOYSA-N ethylene glycol bis(2-aminoethyl)tetraacetic acid Chemical compound OC(=O)CN(CC(O)=O)CCOCCOCCN(CC(O)=O)CC(O)=O DEFVIWRASFVYLL-UHFFFAOYSA-N 0.000 claims 1
- 229910001385 heavy metal Inorganic materials 0.000 claims 1
- 238000004020 luminiscence type Methods 0.000 claims 1
- 229910052757 nitrogen Inorganic materials 0.000 claims 1
- 230000008929 regeneration Effects 0.000 abstract description 8
- 238000011069 regeneration method Methods 0.000 abstract description 8
- 230000001131 transforming effect Effects 0.000 abstract description 2
- 241000607479 Yersinia pestis Species 0.000 abstract 1
- 230000001627 detrimental effect Effects 0.000 abstract 1
- 230000008635 plant growth Effects 0.000 abstract 1
- 238000012360 testing method Methods 0.000 description 29
- 210000004027 cell Anatomy 0.000 description 28
- 108090000623 proteins and genes Proteins 0.000 description 28
- 230000009466 transformation Effects 0.000 description 28
- 108020004414 DNA Proteins 0.000 description 24
- 239000012528 membrane Substances 0.000 description 20
- 108091026890 Coding region Proteins 0.000 description 14
- 210000002257 embryonic structure Anatomy 0.000 description 14
- 229910001868 water Inorganic materials 0.000 description 13
- 210000001519 tissue Anatomy 0.000 description 12
- 238000004458 analytical method Methods 0.000 description 11
- 108020004999 messenger RNA Proteins 0.000 description 11
- 235000013336 milk Nutrition 0.000 description 10
- 239000008267 milk Substances 0.000 description 10
- 210000004080 milk Anatomy 0.000 description 10
- 238000013519 translation Methods 0.000 description 10
- 230000014616 translation Effects 0.000 description 10
- 235000013311 vegetables Nutrition 0.000 description 10
- 241000589158 Agrobacterium Species 0.000 description 9
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 9
- 206010020649 Hyperkeratosis Diseases 0.000 description 9
- 238000013461 design Methods 0.000 description 9
- 238000003119 immunoblot Methods 0.000 description 9
- 150000003839 salts Chemical class 0.000 description 9
- 239000011550 stock solution Substances 0.000 description 9
- 229960003495 thiamine Drugs 0.000 description 9
- 229940088594 vitamin Drugs 0.000 description 9
- 229930003231 vitamin Natural products 0.000 description 9
- 235000013343 vitamin Nutrition 0.000 description 9
- 239000011782 vitamin Substances 0.000 description 9
- 150000003722 vitamin derivatives Chemical class 0.000 description 9
- 229920001817 Agar Polymers 0.000 description 8
- PVNIIMVLHYAWGP-UHFFFAOYSA-N Niacin Chemical compound OC(=O)C1=CC=CN=C1 PVNIIMVLHYAWGP-UHFFFAOYSA-N 0.000 description 8
- JZRWCGZRTZMZEH-UHFFFAOYSA-N Thiamine Natural products CC1=C(CCO)SC=[N+]1CC1=CN=C(C)N=C1N JZRWCGZRTZMZEH-UHFFFAOYSA-N 0.000 description 8
- 239000008272 agar Substances 0.000 description 8
- 239000003550 marker Substances 0.000 description 8
- 239000002245 particle Substances 0.000 description 8
- 239000000243 solution Substances 0.000 description 8
- 235000019157 thiamine Nutrition 0.000 description 8
- KYMBYSLLVAOCFI-UHFFFAOYSA-N thiamine Chemical compound CC1=C(CCO)SCN1CC1=CN=C(C)N=C1N KYMBYSLLVAOCFI-UHFFFAOYSA-N 0.000 description 8
- 239000011721 thiamine Substances 0.000 description 8
- 238000012546 transfer Methods 0.000 description 8
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Chemical compound O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 8
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 7
- 229930006000 Sucrose Natural products 0.000 description 7
- CZMRCDWAGMRECN-UGDNZRGBSA-N Sucrose Chemical compound O[C@H]1[C@H](O)[C@@H](CO)O[C@@]1(CO)O[C@@H]1[C@H](O)[C@@H](O)[C@H](O)[C@@H](CO)O1 CZMRCDWAGMRECN-UGDNZRGBSA-N 0.000 description 7
- 239000012634 fragment Substances 0.000 description 7
- 230000001404 mediated effect Effects 0.000 description 7
- 238000012986 modification Methods 0.000 description 7
- 239000002773 nucleotide Substances 0.000 description 7
- 125000003729 nucleotide group Chemical group 0.000 description 7
- 239000005720 sucrose Substances 0.000 description 7
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 6
- 108700005078 Synthetic Genes Proteins 0.000 description 6
- 108700019146 Transgenes Proteins 0.000 description 6
- 238000013459 approach Methods 0.000 description 6
- 239000000872 buffer Substances 0.000 description 6
- 238000001816 cooling Methods 0.000 description 6
- 230000004048 modification Effects 0.000 description 6
- 241000894007 species Species 0.000 description 6
- 230000001954 sterilising effect Effects 0.000 description 6
- 238000004659 sterilization and disinfection Methods 0.000 description 6
- DGVVWUTYPXICAM-UHFFFAOYSA-N β‐Mercaptoethanol Chemical compound OCCS DGVVWUTYPXICAM-UHFFFAOYSA-N 0.000 description 6
- 229920002148 Gellan gum Polymers 0.000 description 5
- 240000007594 Oryza sativa Species 0.000 description 5
- GINJFDRNADDBIN-FXQIFTODSA-N bilanafos Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCP(C)(O)=O GINJFDRNADDBIN-FXQIFTODSA-N 0.000 description 5
- 230000015556 catabolic process Effects 0.000 description 5
- 238000006731 degradation reaction Methods 0.000 description 5
- 230000006698 induction Effects 0.000 description 5
- 239000000203 mixture Substances 0.000 description 5
- LXNHXLLTXMVWPM-UHFFFAOYSA-N pyridoxine Chemical compound CC1=NC=C(CO)C(CO)=C1O LXNHXLLTXMVWPM-UHFFFAOYSA-N 0.000 description 5
- 238000006467 substitution reaction Methods 0.000 description 5
- 238000001262 western blot Methods 0.000 description 5
- JLIDBLDQVAYHNE-YKALOCIXSA-N (+)-Abscisic acid Chemical compound OC(=O)/C=C(/C)\C=C\[C@@]1(O)C(C)=CC(=O)CC1(C)C JLIDBLDQVAYHNE-YKALOCIXSA-N 0.000 description 4
- 239000005631 2,4-Dichlorophenoxyacetic acid Substances 0.000 description 4
- 108091092195 Intron Proteins 0.000 description 4
- XEEYBQQBJWHFJM-UHFFFAOYSA-N Iron Chemical compound [Fe] XEEYBQQBJWHFJM-UHFFFAOYSA-N 0.000 description 4
- 108091034117 Oligonucleotide Proteins 0.000 description 4
- 108700001094 Plant Genes Proteins 0.000 description 4
- 240000006394 Sorghum bicolor Species 0.000 description 4
- 108090000848 Ubiquitin Proteins 0.000 description 4
- 102000044159 Ubiquitin Human genes 0.000 description 4
- 229920002494 Zein Polymers 0.000 description 4
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 4
- 239000002253 acid Substances 0.000 description 4
- 238000004364 calculation method Methods 0.000 description 4
- 238000010367 cloning Methods 0.000 description 4
- 229920005618 ethylene copolymer bitumen Polymers 0.000 description 4
- 238000000605 extraction Methods 0.000 description 4
- 239000000499 gel Substances 0.000 description 4
- SEOVTRFCIGRIMH-UHFFFAOYSA-N indole-3-acetic acid Chemical compound C1=CC=C2C(CC(=O)O)=CNC2=C1 SEOVTRFCIGRIMH-UHFFFAOYSA-N 0.000 description 4
- 229960003512 nicotinic acid Drugs 0.000 description 4
- 235000001968 nicotinic acid Nutrition 0.000 description 4
- 239000011664 nicotinic acid Substances 0.000 description 4
- 239000013612 plasmid Substances 0.000 description 4
- 238000002360 preparation method Methods 0.000 description 4
- 239000000523 sample Substances 0.000 description 4
- SQGYOTSLMSWVJD-UHFFFAOYSA-N silver(1+) nitrate Chemical compound [Ag+].[O-]N(=O)=O SQGYOTSLMSWVJD-UHFFFAOYSA-N 0.000 description 4
- 230000000392 somatic effect Effects 0.000 description 4
- 239000006228 supernatant Substances 0.000 description 4
- LWIHDJKSTIGBAC-UHFFFAOYSA-K tripotassium phosphate Chemical compound [K+].[K+].[K+].[O-]P([O-])([O-])=O LWIHDJKSTIGBAC-UHFFFAOYSA-K 0.000 description 4
- 229940011671 vitamin b6 Drugs 0.000 description 4
- 239000005019 zein Substances 0.000 description 4
- 229940093612 zein Drugs 0.000 description 4
- 244000283070 Abies balsamea Species 0.000 description 3
- 235000007173 Abies balsamea Nutrition 0.000 description 3
- 244000105624 Arachis hypogaea Species 0.000 description 3
- VBKIFHUVGLOJKT-FKZODXBYSA-N Asn-Thr Chemical compound C[C@@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)N)O VBKIFHUVGLOJKT-FKZODXBYSA-N 0.000 description 3
- 235000011331 Brassica Nutrition 0.000 description 3
- UXVMQQNJUSDDNG-UHFFFAOYSA-L Calcium chloride Chemical compound [Cl-].[Cl-].[Ca+2] UXVMQQNJUSDDNG-UHFFFAOYSA-L 0.000 description 3
- 244000241257 Cucumis melo Species 0.000 description 3
- 102000053602 DNA Human genes 0.000 description 3
- 244000299507 Gossypium hirsutum Species 0.000 description 3
- 244000020551 Helianthus annuus Species 0.000 description 3
- 235000003222 Helianthus annuus Nutrition 0.000 description 3
- 241000209219 Hordeum Species 0.000 description 3
- ONIBWKKTOPOVIA-BYPYZUCNSA-N L-Proline Chemical compound OC(=O)[C@@H]1CCCN1 ONIBWKKTOPOVIA-BYPYZUCNSA-N 0.000 description 3
- 229930182821 L-proline Natural products 0.000 description 3
- 239000007987 MES buffer Substances 0.000 description 3
- 240000004658 Medicago sativa Species 0.000 description 3
- 235000010627 Phaseolus vulgaris Nutrition 0.000 description 3
- 244000046052 Phaseolus vulgaris Species 0.000 description 3
- NYQBYASWHVRESG-MIMYLULJSA-N Phe-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 NYQBYASWHVRESG-MIMYLULJSA-N 0.000 description 3
- 108020005120 Plant DNA Proteins 0.000 description 3
- 235000011684 Sorghum saccharatum Nutrition 0.000 description 3
- DSGIVWSDDRDJIO-ZXXMMSQZSA-N Thr-Thr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O DSGIVWSDDRDJIO-ZXXMMSQZSA-N 0.000 description 3
- 150000007513 acids Chemical class 0.000 description 3
- 238000013019 agitation Methods 0.000 description 3
- 230000000903 blocking effect Effects 0.000 description 3
- 239000001110 calcium chloride Substances 0.000 description 3
- 235000011148 calcium chloride Nutrition 0.000 description 3
- 229910001628 calcium chloride Inorganic materials 0.000 description 3
- 239000002299 complementary DNA Substances 0.000 description 3
- 238000010276 construction Methods 0.000 description 3
- 230000037430 deletion Effects 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 230000001976 improved effect Effects 0.000 description 3
- 238000011534 incubation Methods 0.000 description 3
- CDAISMWEOUEBRE-GPIVLXJGSA-N inositol Chemical compound O[C@H]1[C@H](O)[C@@H](O)[C@H](O)[C@H](O)[C@@H]1O CDAISMWEOUEBRE-GPIVLXJGSA-N 0.000 description 3
- 238000005457 optimization Methods 0.000 description 3
- 239000008188 pellet Substances 0.000 description 3
- 230000008488 polyadenylation Effects 0.000 description 3
- 235000019171 pyridoxine hydrochloride Nutrition 0.000 description 3
- 239000011764 pyridoxine hydrochloride Substances 0.000 description 3
- 108091008146 restriction endonucleases Proteins 0.000 description 3
- 238000004088 simulation Methods 0.000 description 3
- 238000010561 standard procedure Methods 0.000 description 3
- WFKWXMTUELFFGS-UHFFFAOYSA-N tungsten Chemical compound [W] WFKWXMTUELFFGS-UHFFFAOYSA-N 0.000 description 3
- 229910052721 tungsten Inorganic materials 0.000 description 3
- 239000010937 tungsten Substances 0.000 description 3
- 244000144725 Amygdalus communis Species 0.000 description 2
- 235000011437 Amygdalus communis Nutrition 0.000 description 2
- 235000010777 Arachis hypogaea Nutrition 0.000 description 2
- JSLGXODUIAFWCF-WDSKDSINSA-N Arg-Asn Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CC(N)=O)C(O)=O JSLGXODUIAFWCF-WDSKDSINSA-N 0.000 description 2
- FYRVDDJMNISIKJ-UWVGGRQHSA-N Asn-Tyr Chemical compound NC(=O)C[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 FYRVDDJMNISIKJ-UWVGGRQHSA-N 0.000 description 2
- 241000894006 Bacteria Species 0.000 description 2
- 241000219198 Brassica Species 0.000 description 2
- 235000009467 Carica papaya Nutrition 0.000 description 2
- 240000006432 Carica papaya Species 0.000 description 2
- 235000003255 Carthamus tinctorius Nutrition 0.000 description 2
- 244000020518 Carthamus tinctorius Species 0.000 description 2
- 235000010523 Cicer arietinum Nutrition 0.000 description 2
- 244000045195 Cicer arietinum Species 0.000 description 2
- 241000207199 Citrus Species 0.000 description 2
- 235000013162 Cocos nucifera Nutrition 0.000 description 2
- 244000060011 Cocos nucifera Species 0.000 description 2
- 241000218631 Coniferophyta Species 0.000 description 2
- 240000008067 Cucumis sativus Species 0.000 description 2
- 235000009355 Dianthus caryophyllus Nutrition 0.000 description 2
- 240000006497 Dianthus caryophyllus Species 0.000 description 2
- KCXVZYZYPLLWCC-UHFFFAOYSA-N EDTA Chemical compound OC(=O)CN(CC(O)=O)CCN(CC(O)=O)CC(O)=O KCXVZYZYPLLWCC-UHFFFAOYSA-N 0.000 description 2
- 108700007698 Genetic Terminator Regions Proteins 0.000 description 2
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Natural products OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 description 2
- FUESBOMYALLFNI-VKHMYHEASA-N Gly-Asn Chemical compound NCC(=O)N[C@H](C(O)=O)CC(N)=O FUESBOMYALLFNI-VKHMYHEASA-N 0.000 description 2
- OLIFSFOFKGKIRH-WUJLRWPWSA-N Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CN OLIFSFOFKGKIRH-WUJLRWPWSA-N 0.000 description 2
- 239000005562 Glyphosate Substances 0.000 description 2
- 235000005206 Hibiscus Nutrition 0.000 description 2
- 235000007185 Hibiscus lunariifolius Nutrition 0.000 description 2
- 244000284380 Hibiscus rosa sinensis Species 0.000 description 2
- 241001299819 Hordeum vulgare subsp. spontaneum Species 0.000 description 2
- CSNNHWWHGAXBCP-UHFFFAOYSA-L Magnesium sulfate Chemical compound [Mg+2].[O-][S+2]([O-])([O-])[O-] CSNNHWWHGAXBCP-UHFFFAOYSA-L 0.000 description 2
- 235000014826 Mangifera indica Nutrition 0.000 description 2
- 240000007228 Mangifera indica Species 0.000 description 2
- 240000003183 Manihot esculenta Species 0.000 description 2
- 235000017587 Medicago sativa ssp. sativa Nutrition 0.000 description 2
- 229910002651 NO3 Inorganic materials 0.000 description 2
- 241000234479 Narcissus Species 0.000 description 2
- NHNBFGGVMKEFGY-UHFFFAOYSA-N Nitrate Chemical compound [O-][N+]([O-])=O NHNBFGGVMKEFGY-UHFFFAOYSA-N 0.000 description 2
- 108091028043 Nucleic acid sequence Proteins 0.000 description 2
- 240000007817 Olea europaea Species 0.000 description 2
- 229910019142 PO4 Inorganic materials 0.000 description 2
- 244000025272 Persea americana Species 0.000 description 2
- 235000008673 Persea americana Nutrition 0.000 description 2
- 240000007377 Petunia x hybrida Species 0.000 description 2
- 241000218606 Pinus contorta Species 0.000 description 2
- 235000008577 Pinus radiata Nutrition 0.000 description 2
- 241000218621 Pinus radiata Species 0.000 description 2
- 235000008566 Pinus taeda Nutrition 0.000 description 2
- 241000218679 Pinus taeda Species 0.000 description 2
- 229920001213 Polysorbate 20 Polymers 0.000 description 2
- WCUXLLCKKVVCTQ-UHFFFAOYSA-M Potassium chloride Chemical compound [Cl-].[K+] WCUXLLCKKVVCTQ-UHFFFAOYSA-M 0.000 description 2
- 108010076504 Protein Sorting Signals Proteins 0.000 description 2
- 108020005067 RNA Splice Sites Proteins 0.000 description 2
- 108020004511 Recombinant DNA Proteins 0.000 description 2
- 241000208422 Rhododendron Species 0.000 description 2
- 235000007238 Secale cereale Nutrition 0.000 description 2
- 244000082988 Secale cereale Species 0.000 description 2
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 2
- 108091081024 Start codon Proteins 0.000 description 2
- 244000269722 Thea sinensis Species 0.000 description 2
- 244000299461 Theobroma cacao Species 0.000 description 2
- 235000009470 Theobroma cacao Nutrition 0.000 description 2
- MFEVVAXTBZELLL-GGVZMXCHSA-N Tyr-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 MFEVVAXTBZELLL-GGVZMXCHSA-N 0.000 description 2
- 235000010749 Vicia faba Nutrition 0.000 description 2
- 240000006677 Vicia faba Species 0.000 description 2
- 241000219977 Vigna Species 0.000 description 2
- 240000004922 Vigna radiata Species 0.000 description 2
- 235000010726 Vigna sinensis Nutrition 0.000 description 2
- 235000007244 Zea mays Nutrition 0.000 description 2
- 102000004139 alpha-Amylases Human genes 0.000 description 2
- 108090000637 alpha-Amylases Proteins 0.000 description 2
- 229940024171 alpha-amylase Drugs 0.000 description 2
- 108010050025 alpha-glutamyltryptophan Proteins 0.000 description 2
- 238000000137 annealing Methods 0.000 description 2
- 235000013339 cereals Nutrition 0.000 description 2
- -1 charge Chemical class 0.000 description 2
- 235000020971 citrus fruits Nutrition 0.000 description 2
- 101150086784 cry gene Proteins 0.000 description 2
- 238000005520 cutting process Methods 0.000 description 2
- 230000003247 decreasing effect Effects 0.000 description 2
- 238000012217 deletion Methods 0.000 description 2
- FCRACOPGPMPSHN-UHFFFAOYSA-N desoxyabscisic acid Natural products OC(=O)C=C(C)C=CC1C(C)=CC(=O)CC1(C)C FCRACOPGPMPSHN-UHFFFAOYSA-N 0.000 description 2
- 238000010790 dilution Methods 0.000 description 2
- 239000012895 dilution Substances 0.000 description 2
- 210000005069 ears Anatomy 0.000 description 2
- 238000001962 electrophoresis Methods 0.000 description 2
- 239000011536 extraction buffer Substances 0.000 description 2
- 235000013861 fat-free Nutrition 0.000 description 2
- 230000002068 genetic effect Effects 0.000 description 2
- 239000008103 glucose Substances 0.000 description 2
- 108010089804 glycyl-threonine Proteins 0.000 description 2
- 108010015792 glycyllysine Proteins 0.000 description 2
- XDDAORKBJWWYJS-UHFFFAOYSA-N glyphosate Chemical compound OC(=O)CNCP(O)(O)=O XDDAORKBJWWYJS-UHFFFAOYSA-N 0.000 description 2
- 229940097068 glyphosate Drugs 0.000 description 2
- 238000010438 heat treatment Methods 0.000 description 2
- 230000002363 herbicidal effect Effects 0.000 description 2
- 108010025306 histidylleucine Proteins 0.000 description 2
- 235000015243 ice cream Nutrition 0.000 description 2
- 238000003018 immunoassay Methods 0.000 description 2
- 239000003617 indole-3-acetic acid Substances 0.000 description 2
- 239000003112 inhibitor Substances 0.000 description 2
- 230000000977 initiatory effect Effects 0.000 description 2
- 229910052742 iron Inorganic materials 0.000 description 2
- 239000007788 liquid Substances 0.000 description 2
- 239000012160 loading buffer Substances 0.000 description 2
- 210000001161 mammalian embryo Anatomy 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 230000035800 maturation Effects 0.000 description 2
- VNWKTOKETHGBQD-UHFFFAOYSA-N methane Chemical compound C VNWKTOKETHGBQD-UHFFFAOYSA-N 0.000 description 2
- 230000035772 mutation Effects 0.000 description 2
- 210000000056 organ Anatomy 0.000 description 2
- 235000020232 peanut Nutrition 0.000 description 2
- NBIIXXVUZAFLBC-UHFFFAOYSA-K phosphate Chemical compound [O-]P([O-])([O-])=O NBIIXXVUZAFLBC-UHFFFAOYSA-K 0.000 description 2
- 239000010452 phosphate Substances 0.000 description 2
- 229920003023 plastic Polymers 0.000 description 2
- 239000000256 polyoxyethylene sorbitan monolaurate Substances 0.000 description 2
- 235000010486 polyoxyethylene sorbitan monolaurate Nutrition 0.000 description 2
- 239000013641 positive control Substances 0.000 description 2
- 229910000160 potassium phosphate Inorganic materials 0.000 description 2
- 235000011009 potassium phosphates Nutrition 0.000 description 2
- 238000001556 precipitation Methods 0.000 description 2
- 239000002243 precursor Substances 0.000 description 2
- 239000000047 product Substances 0.000 description 2
- 235000018102 proteins Nutrition 0.000 description 2
- 102000004169 proteins and genes Human genes 0.000 description 2
- 230000001105 regulatory effect Effects 0.000 description 2
- 230000008653 root damage Effects 0.000 description 2
- 229910001961 silver nitrate Inorganic materials 0.000 description 2
- 238000002741 site-directed mutagenesis Methods 0.000 description 2
- 239000002689 soil Substances 0.000 description 2
- UNFWWIHTNXNPBV-WXKVUWSESA-N spectinomycin Chemical compound O([C@@H]1[C@@H](NC)[C@@H](O)[C@H]([C@@H]([C@H]1O1)O)NC)[C@]2(O)[C@H]1O[C@H](C)CC2=O UNFWWIHTNXNPBV-WXKVUWSESA-N 0.000 description 2
- 229960000268 spectinomycin Drugs 0.000 description 2
- ATHGHQPFGPMSJY-UHFFFAOYSA-N spermidine Chemical compound NCCCCNCCCN ATHGHQPFGPMSJY-UHFFFAOYSA-N 0.000 description 2
- 239000008223 sterile water Substances 0.000 description 2
- UCSJYZPVAKXKNQ-HZYVHMACSA-N streptomycin Chemical compound CN[C@H]1[C@H](O)[C@@H](O)[C@H](CO)O[C@H]1O[C@@H]1[C@](C=O)(O)[C@H](C)O[C@H]1O[C@@H]1[C@@H](NC(N)=N)[C@H](O)[C@@H](NC(N)=N)[C@H](O)[C@H]1O UCSJYZPVAKXKNQ-HZYVHMACSA-N 0.000 description 2
- 239000000758 substrate Substances 0.000 description 2
- 239000000725 suspension Substances 0.000 description 2
- 239000003053 toxin Substances 0.000 description 2
- 231100000765 toxin Toxicity 0.000 description 2
- 108700012359 toxins Proteins 0.000 description 2
- 238000013518 transcription Methods 0.000 description 2
- 230000035897 transcription Effects 0.000 description 2
- GPRLSGONYQIRFK-MNYXATJNSA-N triton Chemical compound [3H+] GPRLSGONYQIRFK-MNYXATJNSA-N 0.000 description 2
- GOJUJUVQIVIZAV-UHFFFAOYSA-N 2-amino-4,6-dichloropyrimidine-5-carbaldehyde Chemical group NC1=NC(Cl)=C(C=O)C(Cl)=N1 GOJUJUVQIVIZAV-UHFFFAOYSA-N 0.000 description 1
- 108020003589 5' Untranslated Regions Proteins 0.000 description 1
- 235000004507 Abies alba Nutrition 0.000 description 1
- 235000014081 Abies amabilis Nutrition 0.000 description 1
- 244000101408 Abies amabilis Species 0.000 description 1
- 108010000700 Acetolactate synthase Proteins 0.000 description 1
- 102000007469 Actins Human genes 0.000 description 1
- 108010085238 Actins Proteins 0.000 description 1
- SITWEMZOJNKJCH-WDSKDSINSA-N Ala-Arg Chemical compound C[C@H](N)C(=O)N[C@H](C(O)=O)CCCN=C(N)N SITWEMZOJNKJCH-WDSKDSINSA-N 0.000 description 1
- 244000291564 Allium cepa Species 0.000 description 1
- 235000002732 Allium cepa var. cepa Nutrition 0.000 description 1
- APKFDSVGJQXUKY-KKGHZKTASA-N Amphotericin-B Natural products O[C@H]1[C@@H](N)[C@H](O)[C@@H](C)O[C@H]1O[C@H]1C=CC=CC=CC=CC=CC=CC=C[C@H](C)[C@@H](O)[C@@H](C)[C@H](C)OC(=O)C[C@H](O)C[C@H](O)CC[C@@H](O)[C@H](O)C[C@H](O)C[C@](O)(C[C@H](O)[C@H]2C(O)=O)O[C@H]2C1 APKFDSVGJQXUKY-KKGHZKTASA-N 0.000 description 1
- 244000226021 Anacardium occidentale Species 0.000 description 1
- 244000099147 Ananas comosus Species 0.000 description 1
- 235000007119 Ananas comosus Nutrition 0.000 description 1
- 101000634158 Androctonus australis Beta-insect excitatory toxin 1 Proteins 0.000 description 1
- 235000017060 Arachis glabrata Nutrition 0.000 description 1
- 235000018262 Arachis monticola Nutrition 0.000 description 1
- OVVUNXXROOFSIM-SDDRHHMPSA-N Arg-Arg-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCCN=C(N)N)N)C(=O)O OVVUNXXROOFSIM-SDDRHHMPSA-N 0.000 description 1
- RVDVDRUZWZIBJQ-CIUDSAMLSA-N Arg-Asn-Glu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O RVDVDRUZWZIBJQ-CIUDSAMLSA-N 0.000 description 1
- ZTKHZAXGTFXUDD-VEVYYDQMSA-N Arg-Asn-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O ZTKHZAXGTFXUDD-VEVYYDQMSA-N 0.000 description 1
- MFAMTAVAFBPXDC-LPEHRKFASA-N Arg-Asp-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCCN=C(N)N)N)C(=O)O MFAMTAVAFBPXDC-LPEHRKFASA-N 0.000 description 1
- FBLMOFHNVQBKRR-IHRRRGAJSA-N Arg-Asp-Tyr Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 FBLMOFHNVQBKRR-IHRRRGAJSA-N 0.000 description 1
- DQNLFLGFZAUIOW-FXQIFTODSA-N Arg-Cys-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CS)C(=O)N[C@@H](C)C(O)=O DQNLFLGFZAUIOW-FXQIFTODSA-N 0.000 description 1
- PNIGSVZJNVUVJA-BQBZGAKWSA-N Arg-Gly-Asn Chemical compound NC(N)=NCCC[C@H](N)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O PNIGSVZJNVUVJA-BQBZGAKWSA-N 0.000 description 1
- CYXCAHZVPFREJD-LURJTMIESA-N Arg-Gly-Gly Chemical compound NC(=N)NCCC[C@H](N)C(=O)NCC(=O)NCC(O)=O CYXCAHZVPFREJD-LURJTMIESA-N 0.000 description 1
- KRQSPVKUISQQFS-FJXKBIBVSA-N Arg-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CCCN=C(N)N KRQSPVKUISQQFS-FJXKBIBVSA-N 0.000 description 1
- NMRHDSAOIURTNT-RWMBFGLXSA-N Arg-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N NMRHDSAOIURTNT-RWMBFGLXSA-N 0.000 description 1
- COXMUHNBYCVVRG-DCAQKATOSA-N Arg-Leu-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O COXMUHNBYCVVRG-DCAQKATOSA-N 0.000 description 1
- DPLFNLDACGGBAK-KKUMJFAQSA-N Arg-Phe-Glu Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N DPLFNLDACGGBAK-KKUMJFAQSA-N 0.000 description 1
- XHFXZQHTLJVZBN-FXQIFTODSA-N Asn-Arg-Asn Chemical compound C(C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N)CN=C(N)N XHFXZQHTLJVZBN-FXQIFTODSA-N 0.000 description 1
- CIBWFJFMOBIFTE-CIUDSAMLSA-N Asn-Arg-Gln Chemical compound C(C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N)CN=C(N)N CIBWFJFMOBIFTE-CIUDSAMLSA-N 0.000 description 1
- KSBHCUSPLWRVEK-ZLUOBGJFSA-N Asn-Asn-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O KSBHCUSPLWRVEK-ZLUOBGJFSA-N 0.000 description 1
- RCENDENBBJFJHZ-ACZMJKKPSA-N Asn-Asn-Gln Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O RCENDENBBJFJHZ-ACZMJKKPSA-N 0.000 description 1
- LJUOLNXOWSWGKF-ACZMJKKPSA-N Asn-Asn-Glu Chemical compound C(CC(=O)O)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC(=O)N)N LJUOLNXOWSWGKF-ACZMJKKPSA-N 0.000 description 1
- PIWWUBYJNONVTJ-ZLUOBGJFSA-N Asn-Asp-Asn Chemical compound C([C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N)C(=O)N PIWWUBYJNONVTJ-ZLUOBGJFSA-N 0.000 description 1
- HUAOKVVEVHACHR-CIUDSAMLSA-N Asn-Asp-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC(=O)N)N HUAOKVVEVHACHR-CIUDSAMLSA-N 0.000 description 1
- PAXHINASXXXILC-SRVKXCTJSA-N Asn-Asp-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC(=O)N)N)O PAXHINASXXXILC-SRVKXCTJSA-N 0.000 description 1
- XWFPGQVLOVGSLU-CIUDSAMLSA-N Asn-Gln-Arg Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N XWFPGQVLOVGSLU-CIUDSAMLSA-N 0.000 description 1
- IIFDPDVJAHQFSR-WHFBIAKZSA-N Asn-Glu Chemical compound NC(=O)C[C@H](N)C(=O)N[C@H](C(O)=O)CCC(O)=O IIFDPDVJAHQFSR-WHFBIAKZSA-N 0.000 description 1
- GNKVBRYFXYWXAB-WDSKDSINSA-N Asn-Glu-Gly Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O GNKVBRYFXYWXAB-WDSKDSINSA-N 0.000 description 1
- JQSWHKKUZMTOIH-QWRGUYRKSA-N Asn-Gly-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CC(=O)N)N JQSWHKKUZMTOIH-QWRGUYRKSA-N 0.000 description 1
- RAQMSGVCGSJKCL-FOHZUACHSA-N Asn-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC(N)=O RAQMSGVCGSJKCL-FOHZUACHSA-N 0.000 description 1
- UDSVWSUXKYXSTR-QWRGUYRKSA-N Asn-Gly-Tyr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)NCC(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O UDSVWSUXKYXSTR-QWRGUYRKSA-N 0.000 description 1
- MYCSPQIARXTUTP-SRVKXCTJSA-N Asn-Leu-His Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CC(=O)N)N MYCSPQIARXTUTP-SRVKXCTJSA-N 0.000 description 1
- TZFQICWZWFNIKU-KKUMJFAQSA-N Asn-Leu-Tyr Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 TZFQICWZWFNIKU-KKUMJFAQSA-N 0.000 description 1
- NYGILGUOUOXGMJ-YUMQZZPRSA-N Asn-Lys-Gly Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O NYGILGUOUOXGMJ-YUMQZZPRSA-N 0.000 description 1
- RZNAMKZJPBQWDJ-SRVKXCTJSA-N Asn-Lys-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CC(=O)N)N RZNAMKZJPBQWDJ-SRVKXCTJSA-N 0.000 description 1
- OMSMPWHEGLNQOD-UWVGGRQHSA-N Asn-Phe Chemical compound NC(=O)C[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 OMSMPWHEGLNQOD-UWVGGRQHSA-N 0.000 description 1
- IDUUACUJKUXKKD-VEVYYDQMSA-N Asn-Pro-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O IDUUACUJKUXKKD-VEVYYDQMSA-N 0.000 description 1
- JXMREEPBRANWBY-VEVYYDQMSA-N Asn-Thr-Arg Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O JXMREEPBRANWBY-VEVYYDQMSA-N 0.000 description 1
- HPASIOLTWSNMFB-OLHMAJIHSA-N Asn-Thr-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(O)=O HPASIOLTWSNMFB-OLHMAJIHSA-N 0.000 description 1
- ZUFPUBYQYWCMDB-NUMRIWBASA-N Asn-Thr-Glu Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O ZUFPUBYQYWCMDB-NUMRIWBASA-N 0.000 description 1
- XIDSGDJNUJRUHE-VEVYYDQMSA-N Asn-Thr-Met Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCSC)C(O)=O XIDSGDJNUJRUHE-VEVYYDQMSA-N 0.000 description 1
- UXHYOWXTJLBEPG-GSSVUCPTSA-N Asn-Thr-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O UXHYOWXTJLBEPG-GSSVUCPTSA-N 0.000 description 1
- KZYSHAMXEBPJBD-JRQIVUDYSA-N Asn-Thr-Tyr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O KZYSHAMXEBPJBD-JRQIVUDYSA-N 0.000 description 1
- RGGVDKVXLBOLNS-JQWIXIFHSA-N Asn-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CC(N)=O)N)C(O)=O)=CNC2=C1 RGGVDKVXLBOLNS-JQWIXIFHSA-N 0.000 description 1
- QUCCLIXMVPIVOB-BZSNNMDCSA-N Asn-Tyr-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CC2=CC=C(C=C2)O)NC(=O)[C@H](CC(=O)N)N QUCCLIXMVPIVOB-BZSNNMDCSA-N 0.000 description 1
- XEGZSHSPQNDNRH-JRQIVUDYSA-N Asn-Tyr-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XEGZSHSPQNDNRH-JRQIVUDYSA-N 0.000 description 1
- VGRHZPNRCLAHQA-IMJSIDKUSA-N Asp-Asn Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(N)=O)C(O)=O VGRHZPNRCLAHQA-IMJSIDKUSA-N 0.000 description 1
- UGKZHCBLMLSANF-CIUDSAMLSA-N Asp-Asn-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O UGKZHCBLMLSANF-CIUDSAMLSA-N 0.000 description 1
- HOQGTAIGQSDCHR-SRVKXCTJSA-N Asp-Asn-Phe Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O HOQGTAIGQSDCHR-SRVKXCTJSA-N 0.000 description 1
- NURJSGZGBVJFAD-ZLUOBGJFSA-N Asp-Cys-Ser Chemical compound C([C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CO)C(=O)O)N)C(=O)O NURJSGZGBVJFAD-ZLUOBGJFSA-N 0.000 description 1
- GISFCCXBVJKGEO-QEJZJMRPSA-N Asp-Glu-Trp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O GISFCCXBVJKGEO-QEJZJMRPSA-N 0.000 description 1
- OMMIEVATLAGRCK-BYPYZUCNSA-N Asp-Gly-Gly Chemical compound OC(=O)C[C@H](N)C(=O)NCC(=O)NCC(O)=O OMMIEVATLAGRCK-BYPYZUCNSA-N 0.000 description 1
- WSXDIZFNQYTUJB-SRVKXCTJSA-N Asp-His-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(O)=O WSXDIZFNQYTUJB-SRVKXCTJSA-N 0.000 description 1
- BSWHERGFUNMWGS-UHFFFAOYSA-N Asp-Ile Chemical compound CCC(C)C(C(O)=O)NC(=O)C(N)CC(O)=O BSWHERGFUNMWGS-UHFFFAOYSA-N 0.000 description 1
- QNIACYURSSCLRP-GUBZILKMSA-N Asp-Lys-Gln Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(O)=O QNIACYURSSCLRP-GUBZILKMSA-N 0.000 description 1
- HXVILZUZXFLVEN-DCAQKATOSA-N Asp-Met-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(C)C)C(O)=O HXVILZUZXFLVEN-DCAQKATOSA-N 0.000 description 1
- MVRGBQGZSDJBSM-GMOBBJLQSA-N Asp-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](CC(=O)O)N MVRGBQGZSDJBSM-GMOBBJLQSA-N 0.000 description 1
- BJDHEININLSZOT-KKUMJFAQSA-N Asp-Tyr-Lys Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCCN)C(O)=O BJDHEININLSZOT-KKUMJFAQSA-N 0.000 description 1
- 239000004857 Balsam Substances 0.000 description 1
- 235000016068 Berberis vulgaris Nutrition 0.000 description 1
- 241000335053 Beta vulgaris Species 0.000 description 1
- 244000178993 Brassica juncea Species 0.000 description 1
- 240000002791 Brassica napus Species 0.000 description 1
- 240000007124 Brassica oleracea Species 0.000 description 1
- 235000003899 Brassica oleracea var acephala Nutrition 0.000 description 1
- 235000011301 Brassica oleracea var capitata Nutrition 0.000 description 1
- 235000001169 Brassica oleracea var oleracea Nutrition 0.000 description 1
- 240000008100 Brassica rapa Species 0.000 description 1
- 241000220243 Brassica sp. Species 0.000 description 1
- 235000004936 Bromus mango Nutrition 0.000 description 1
- 101100342815 Caenorhabditis elegans lec-1 gene Proteins 0.000 description 1
- 101100505161 Caenorhabditis elegans mel-32 gene Proteins 0.000 description 1
- 241001674345 Callitropsis nootkatensis Species 0.000 description 1
- 208000003643 Callosities Diseases 0.000 description 1
- 244000025254 Cannabis sativa Species 0.000 description 1
- 241000218645 Cedrus Species 0.000 description 1
- 235000013912 Ceratonia siliqua Nutrition 0.000 description 1
- 240000008886 Ceratonia siliqua Species 0.000 description 1
- 108010022172 Chitinases Proteins 0.000 description 1
- 102000012286 Chitinases Human genes 0.000 description 1
- 235000007516 Chrysanthemum Nutrition 0.000 description 1
- 244000189548 Chrysanthemum x morifolium Species 0.000 description 1
- 108091035707 Consensus sequence Proteins 0.000 description 1
- 101710190853 Cruciferin Proteins 0.000 description 1
- 241000219112 Cucumis Species 0.000 description 1
- 235000015510 Cucumis melo subsp melo Nutrition 0.000 description 1
- 235000009847 Cucumis melo var cantalupensis Nutrition 0.000 description 1
- 235000010071 Cucumis prophetarum Nutrition 0.000 description 1
- 235000010799 Cucumis sativus var sativus Nutrition 0.000 description 1
- 244000007835 Cyamopsis tetragonoloba Species 0.000 description 1
- BUXAPSQPMALTOY-WHFBIAKZSA-N Cys-Glu Chemical compound SC[C@H](N)C(=O)N[C@H](C(O)=O)CCC(O)=O BUXAPSQPMALTOY-WHFBIAKZSA-N 0.000 description 1
- WYVKPHCYMTWUCW-YUPRTTJUSA-N Cys-Thr Chemical compound C[C@@H]([C@@H](C(=O)O)NC(=O)[C@H](CS)N)O WYVKPHCYMTWUCW-YUPRTTJUSA-N 0.000 description 1
- 235000001942 Elaeis Nutrition 0.000 description 1
- 241000512897 Elaeis Species 0.000 description 1
- 235000007349 Eleusine coracana Nutrition 0.000 description 1
- 244000078127 Eleusine coracana Species 0.000 description 1
- 240000002395 Euphorbia pulcherrima Species 0.000 description 1
- 241000218218 Ficus <angiosperm> Species 0.000 description 1
- LZRMPXRYLLTAJX-GUBZILKMSA-N Gln-Arg-Glu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O LZRMPXRYLLTAJX-GUBZILKMSA-N 0.000 description 1
- PONUFVLSGMQFAI-AVGNSLFASA-N Gln-Asn-Phe Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O PONUFVLSGMQFAI-AVGNSLFASA-N 0.000 description 1
- DHNWZLGBTPUTQQ-QEJZJMRPSA-N Gln-Asp-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCC(=O)N)N DHNWZLGBTPUTQQ-QEJZJMRPSA-N 0.000 description 1
- CXFUMJQFZVCETK-FXQIFTODSA-N Gln-Cys-Gln Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](CS)C(=O)N[C@@H](CCC(N)=O)C(O)=O CXFUMJQFZVCETK-FXQIFTODSA-N 0.000 description 1
- KVXVVDFOZNYYKZ-DCAQKATOSA-N Gln-Gln-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O KVXVVDFOZNYYKZ-DCAQKATOSA-N 0.000 description 1
- ZQPOVSJFBBETHQ-CIUDSAMLSA-N Gln-Glu-Gln Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O ZQPOVSJFBBETHQ-CIUDSAMLSA-N 0.000 description 1
- YXQCLIVLWCKCRS-RYUDHWBXSA-N Gln-Gly-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CCC(=O)N)N)O YXQCLIVLWCKCRS-RYUDHWBXSA-N 0.000 description 1
- XITLYYAIPBBHPX-ZKWXMUAHSA-N Gln-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H](N)CCC(N)=O XITLYYAIPBBHPX-ZKWXMUAHSA-N 0.000 description 1
- XFAUJGNLHIGXET-AVGNSLFASA-N Gln-Leu-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O XFAUJGNLHIGXET-AVGNSLFASA-N 0.000 description 1
- HHRAEXBUNGTOGZ-IHRRRGAJSA-N Gln-Phe-Gln Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(N)=O)C(O)=O HHRAEXBUNGTOGZ-IHRRRGAJSA-N 0.000 description 1
- YRHZWVKUFWCEPW-GLLZPBPUSA-N Gln-Thr-Gln Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CCC(=O)N)N)O YRHZWVKUFWCEPW-GLLZPBPUSA-N 0.000 description 1
- 101710186901 Globulin 1 Proteins 0.000 description 1
- CYHBMLHCQXXCCT-AVGNSLFASA-N Glu-Asp-Tyr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O CYHBMLHCQXXCCT-AVGNSLFASA-N 0.000 description 1
- KOSRFJWDECSPRO-WDSKDSINSA-N Glu-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(O)=O KOSRFJWDECSPRO-WDSKDSINSA-N 0.000 description 1
- BCYGDJXHAGZNPQ-DCAQKATOSA-N Glu-Lys-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O BCYGDJXHAGZNPQ-DCAQKATOSA-N 0.000 description 1
- MFNUFCFRAZPJFW-JYJNAYRXSA-N Glu-Lys-Phe Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 MFNUFCFRAZPJFW-JYJNAYRXSA-N 0.000 description 1
- XMBSYZWANAQXEV-QWRGUYRKSA-N Glu-Phe Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 XMBSYZWANAQXEV-QWRGUYRKSA-N 0.000 description 1
- KJBGAZSLZAQDPV-KKUMJFAQSA-N Glu-Phe-Arg Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](CCC(=O)O)N KJBGAZSLZAQDPV-KKUMJFAQSA-N 0.000 description 1
- ITVBKCZZLJUUHI-HTUGSXCWSA-N Glu-Phe-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O ITVBKCZZLJUUHI-HTUGSXCWSA-N 0.000 description 1
- ARIORLIIMJACKZ-KKUMJFAQSA-N Glu-Pro-Tyr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O ARIORLIIMJACKZ-KKUMJFAQSA-N 0.000 description 1
- QCMVGXDELYMZET-GLLZPBPUSA-N Glu-Thr-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O QCMVGXDELYMZET-GLLZPBPUSA-N 0.000 description 1
- DTLLNDVORUEOTM-WDCWCFNPSA-N Glu-Thr-Lys Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(O)=O DTLLNDVORUEOTM-WDCWCFNPSA-N 0.000 description 1
- BRFJMRSRMOMIMU-WHFBIAKZSA-N Gly-Ala-Asn Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(O)=O BRFJMRSRMOMIMU-WHFBIAKZSA-N 0.000 description 1
- WJZLEENECIOOSA-WDSKDSINSA-N Gly-Asn-Gln Chemical compound NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)O WJZLEENECIOOSA-WDSKDSINSA-N 0.000 description 1
- XRTDOIOIBMAXCT-NKWVEPMBSA-N Gly-Asn-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC(=O)N)NC(=O)CN)C(=O)O XRTDOIOIBMAXCT-NKWVEPMBSA-N 0.000 description 1
- SCCPDJAQCXWPTF-VKHMYHEASA-N Gly-Asp Chemical compound NCC(=O)N[C@H](C(O)=O)CC(O)=O SCCPDJAQCXWPTF-VKHMYHEASA-N 0.000 description 1
- QPCVIQJVRGXUSA-LURJTMIESA-N Gly-Gly-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)CNC(=O)CN QPCVIQJVRGXUSA-LURJTMIESA-N 0.000 description 1
- BUEFQXUHTUZXHR-LURJTMIESA-N Gly-Gly-Pro zwitterion Chemical compound NCC(=O)NCC(=O)N1CCC[C@H]1C(O)=O BUEFQXUHTUZXHR-LURJTMIESA-N 0.000 description 1
- KGVHCTWYMPWEGN-FSPLSTOPSA-N Gly-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)CN KGVHCTWYMPWEGN-FSPLSTOPSA-N 0.000 description 1
- NSTUFLGQJCOCDL-UWVGGRQHSA-N Gly-Leu-Arg Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N NSTUFLGQJCOCDL-UWVGGRQHSA-N 0.000 description 1
- UUYBFNKHOCJCHT-VHSXEESVSA-N Gly-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)CN UUYBFNKHOCJCHT-VHSXEESVSA-N 0.000 description 1
- CLNSYANKYVMZNM-UWVGGRQHSA-N Gly-Lys-Arg Chemical compound NCCCC[C@H](NC(=O)CN)C(=O)N[C@H](C(O)=O)CCCN=C(N)N CLNSYANKYVMZNM-UWVGGRQHSA-N 0.000 description 1
- PDUHNKAFQXQNLH-ZETCQYMHSA-N Gly-Lys-Gly Chemical compound NCCCC[C@H](NC(=O)CN)C(=O)NCC(O)=O PDUHNKAFQXQNLH-ZETCQYMHSA-N 0.000 description 1
- OJNZVYSGVYLQIN-BQBZGAKWSA-N Gly-Met-Asp Chemical compound [H]NCC(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(O)=O)C(O)=O OJNZVYSGVYLQIN-BQBZGAKWSA-N 0.000 description 1
- HJARVELKOSZUEW-YUMQZZPRSA-N Gly-Pro-Gln Chemical compound [H]NCC(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O HJARVELKOSZUEW-YUMQZZPRSA-N 0.000 description 1
- LCRDMSSAKLTKBU-ZDLURKLDSA-N Gly-Ser-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)CN LCRDMSSAKLTKBU-ZDLURKLDSA-N 0.000 description 1
- CQMFNTVQVLQRLT-JHEQGTHGSA-N Gly-Thr-Gln Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(O)=O CQMFNTVQVLQRLT-JHEQGTHGSA-N 0.000 description 1
- MYXNLWDWWOTERK-BHNWBGBOSA-N Gly-Thr-Pro Chemical compound C[C@H]([C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)CN)O MYXNLWDWWOTERK-BHNWBGBOSA-N 0.000 description 1
- TVTZEOHWHUVYCG-KYNKHSRBSA-N Gly-Thr-Thr Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O TVTZEOHWHUVYCG-KYNKHSRBSA-N 0.000 description 1
- 240000000047 Gossypium barbadense Species 0.000 description 1
- 235000009429 Gossypium barbadense Nutrition 0.000 description 1
- 235000009432 Gossypium hirsutum Nutrition 0.000 description 1
- 235000017367 Guainella Nutrition 0.000 description 1
- RVKIPWVMZANZLI-UHFFFAOYSA-N H-Lys-Trp-OH Natural products C1=CC=C2C(CC(NC(=O)C(N)CCCCN)C(O)=O)=CNC2=C1 RVKIPWVMZANZLI-UHFFFAOYSA-N 0.000 description 1
- WSDOHRLQDGAOGU-BQBZGAKWSA-N His-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CN=CN1 WSDOHRLQDGAOGU-BQBZGAKWSA-N 0.000 description 1
- QZAFGJNKLMNDEM-DCAQKATOSA-N His-Asn-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CC1=CN=CN1 QZAFGJNKLMNDEM-DCAQKATOSA-N 0.000 description 1
- FDQYIRHBVVUTJF-ZETCQYMHSA-N His-Gly-Gly Chemical compound [O-]C(=O)CNC(=O)CNC(=O)[C@@H]([NH3+])CC1=CN=CN1 FDQYIRHBVVUTJF-ZETCQYMHSA-N 0.000 description 1
- SKYULSWNBYAQMG-IHRRRGAJSA-N His-Leu-Arg Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O SKYULSWNBYAQMG-IHRRRGAJSA-N 0.000 description 1
- SKOKHBGDXGTDDP-MELADBBJSA-N His-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CN=CN2)N SKOKHBGDXGTDDP-MELADBBJSA-N 0.000 description 1
- GJMHMDKCJPQJOI-IHRRRGAJSA-N His-Lys-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC1=CN=CN1 GJMHMDKCJPQJOI-IHRRRGAJSA-N 0.000 description 1
- LNCFUHAPNTYMJB-IUCAKERBSA-N His-Pro Chemical compound C([C@H](N)C(=O)N1[C@@H](CCC1)C(O)=O)C1=CN=CN1 LNCFUHAPNTYMJB-IUCAKERBSA-N 0.000 description 1
- PZAJPILZRFPYJJ-SRVKXCTJSA-N His-Ser-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O PZAJPILZRFPYJJ-SRVKXCTJSA-N 0.000 description 1
- SWBUZLFWGJETAO-KKUMJFAQSA-N His-Tyr-Asn Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CC2=CN=CN2)N)O SWBUZLFWGJETAO-KKUMJFAQSA-N 0.000 description 1
- 101000742054 Homo sapiens Protein phosphatase 1D Proteins 0.000 description 1
- 235000014486 Hydrangea macrophylla Nutrition 0.000 description 1
- 244000267823 Hydrangea macrophylla Species 0.000 description 1
- UAVQIQOOBXFKRC-BYULHYEWSA-N Ile-Asn-Gly Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O UAVQIQOOBXFKRC-BYULHYEWSA-N 0.000 description 1
- SLQVFYWBGNNOTK-BYULHYEWSA-N Ile-Gly-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)N[C@@H](CC(=O)N)C(=O)O)N SLQVFYWBGNNOTK-BYULHYEWSA-N 0.000 description 1
- 206010061217 Infestation Diseases 0.000 description 1
- 108010065920 Insulin Lispro Proteins 0.000 description 1
- 244000017020 Ipomoea batatas Species 0.000 description 1
- 235000002678 Ipomoea batatas Nutrition 0.000 description 1
- 241000721662 Juniperus Species 0.000 description 1
- 235000014556 Juniperus scopulorum Nutrition 0.000 description 1
- 235000014560 Juniperus virginiana var silicicola Nutrition 0.000 description 1
- HHSJMSCOLJVTCX-ZDLURKLDSA-N L-Glutaminyl-L-threonine Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H](N)CCC(N)=O HHSJMSCOLJVTCX-ZDLURKLDSA-N 0.000 description 1
- HGCNKOLVKRAVHD-UHFFFAOYSA-N L-Met-L-Phe Natural products CSCCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 HGCNKOLVKRAVHD-UHFFFAOYSA-N 0.000 description 1
- SITWEMZOJNKJCH-UHFFFAOYSA-N L-alanine-L-arginine Natural products CC(N)C(=O)NC(C(O)=O)CCCNC(N)=N SITWEMZOJNKJCH-UHFFFAOYSA-N 0.000 description 1
- KFKWRHQBZQICHA-STQMWFEESA-N L-leucyl-L-phenylalanine Natural products CC(C)C[C@H](N)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 KFKWRHQBZQICHA-STQMWFEESA-N 0.000 description 1
- 235000003228 Lactuca sativa Nutrition 0.000 description 1
- 240000008415 Lactuca sativa Species 0.000 description 1
- 108091026898 Leader sequence (mRNA) Proteins 0.000 description 1
- 108090001090 Lectins Proteins 0.000 description 1
- 102000004856 Lectins Human genes 0.000 description 1
- 240000004322 Lens culinaris Species 0.000 description 1
- 235000014647 Lens culinaris subsp culinaris Nutrition 0.000 description 1
- 244000043158 Lens esculenta Species 0.000 description 1
- 235000010666 Lens esculenta Nutrition 0.000 description 1
- MLTRLIITQPXHBJ-BQBZGAKWSA-N Leu-Asn Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(O)=O)CC(N)=O MLTRLIITQPXHBJ-BQBZGAKWSA-N 0.000 description 1
- WGNOPSQMIQERPK-GARJFASQSA-N Leu-Asn-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N1CCC[C@@H]1C(=O)O)N WGNOPSQMIQERPK-GARJFASQSA-N 0.000 description 1
- WGNOPSQMIQERPK-UHFFFAOYSA-N Leu-Asn-Pro Natural products CC(C)CC(N)C(=O)NC(CC(=O)N)C(=O)N1CCCC1C(=O)O WGNOPSQMIQERPK-UHFFFAOYSA-N 0.000 description 1
- ZDBMWELMUCLUPL-QEJZJMRPSA-N Leu-Phe-Ala Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C)C(O)=O)CC1=CC=CC=C1 ZDBMWELMUCLUPL-QEJZJMRPSA-N 0.000 description 1
- DRWMRVFCKKXHCH-BZSNNMDCSA-N Leu-Phe-Leu Chemical compound CC(C)C[C@H]([NH3+])C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C([O-])=O)CC1=CC=CC=C1 DRWMRVFCKKXHCH-BZSNNMDCSA-N 0.000 description 1
- PJWOOBTYQNNRBF-BZSNNMDCSA-N Leu-Phe-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCCN)C(=O)O)N PJWOOBTYQNNRBF-BZSNNMDCSA-N 0.000 description 1
- IWMJFLJQHIDZQW-KKUMJFAQSA-N Leu-Ser-Phe Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 IWMJFLJQHIDZQW-KKUMJFAQSA-N 0.000 description 1
- KLSUAWUZBMAZCL-RHYQMDGZSA-N Leu-Thr-Pro Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@H]1C(O)=O KLSUAWUZBMAZCL-RHYQMDGZSA-N 0.000 description 1
- RIHIGSWBLHSGLV-CQDKDKBSSA-N Leu-Tyr-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C)C(O)=O RIHIGSWBLHSGLV-CQDKDKBSSA-N 0.000 description 1
- 241000234280 Liliaceae Species 0.000 description 1
- 241000208202 Linaceae Species 0.000 description 1
- 241000208204 Linum Species 0.000 description 1
- 235000004431 Linum usitatissimum Nutrition 0.000 description 1
- 241000290142 Lotus berthelotii Species 0.000 description 1
- GQUDMNDPQTXZRV-DCAQKATOSA-N Lys-Arg-Asp Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O GQUDMNDPQTXZRV-DCAQKATOSA-N 0.000 description 1
- ABHIXYDMILIUKV-CIUDSAMLSA-N Lys-Asn-Asn Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O ABHIXYDMILIUKV-CIUDSAMLSA-N 0.000 description 1
- HGNRJCINZYHNOU-LURJTMIESA-N Lys-Gly Chemical compound NCCCC[C@H](N)C(=O)NCC(O)=O HGNRJCINZYHNOU-LURJTMIESA-N 0.000 description 1
- JYXBNQOKPRQNQS-YTFOTSKYSA-N Lys-Ile-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JYXBNQOKPRQNQS-YTFOTSKYSA-N 0.000 description 1
- DLCAXBGXGOVUCD-PPCPHDFISA-N Lys-Thr-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O DLCAXBGXGOVUCD-PPCPHDFISA-N 0.000 description 1
- KTINOHQFVVCEGQ-XIRDDKMYSA-N Lys-Trp-Asp Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](Cc1c[nH]c2ccccc12)C(=O)N[C@@H](CC(O)=O)C(O)=O KTINOHQFVVCEGQ-XIRDDKMYSA-N 0.000 description 1
- 101150050813 MPI gene Proteins 0.000 description 1
- 241000208467 Macadamia Species 0.000 description 1
- 235000018330 Macadamia integrifolia Nutrition 0.000 description 1
- 240000007575 Macadamia integrifolia Species 0.000 description 1
- 235000004456 Manihot esculenta Nutrition 0.000 description 1
- 235000016735 Manihot esculenta subsp esculenta Nutrition 0.000 description 1
- 101000763602 Manilkara zapota Thaumatin-like protein 1 Proteins 0.000 description 1
- 101000763586 Manilkara zapota Thaumatin-like protein 1a Proteins 0.000 description 1
- 235000010624 Medicago sativa Nutrition 0.000 description 1
- QXEVZBXTDTVPCP-GMOBBJLQSA-N Met-Asn-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCSC)N QXEVZBXTDTVPCP-GMOBBJLQSA-N 0.000 description 1
- HLYIDXAXQIJYIG-CIUDSAMLSA-N Met-Gln-Asp Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O HLYIDXAXQIJYIG-CIUDSAMLSA-N 0.000 description 1
- NCVJJAJVWILAGI-SRVKXCTJSA-N Met-Gln-Lys Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N NCVJJAJVWILAGI-SRVKXCTJSA-N 0.000 description 1
- XKJUFUPCHARJKX-UWVGGRQHSA-N Met-Gly-His Chemical compound CSCC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC1=CNC=N1 XKJUFUPCHARJKX-UWVGGRQHSA-N 0.000 description 1
- 241000234295 Musa Species 0.000 description 1
- 101000966653 Musa acuminata Glucan endo-1,3-beta-glucosidase Proteins 0.000 description 1
- 240000005561 Musa balbisiana Species 0.000 description 1
- 235000018290 Musa x paradisiaca Nutrition 0.000 description 1
- 102000018463 Myo-Inositol-1-Phosphate Synthase Human genes 0.000 description 1
- 108091000020 Myo-Inositol-1-Phosphate Synthase Proteins 0.000 description 1
- XMBSYZWANAQXEV-UHFFFAOYSA-N N-alpha-L-glutamyl-L-phenylalanine Natural products OC(=O)CCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 XMBSYZWANAQXEV-UHFFFAOYSA-N 0.000 description 1
- 108010087066 N2-tryptophyllysine Proteins 0.000 description 1
- 108010047562 NGR peptide Proteins 0.000 description 1
- 229910017917 NH4 Cl Inorganic materials 0.000 description 1
- 101710202365 Napin Proteins 0.000 description 1
- 235000002725 Olea europaea Nutrition 0.000 description 1
- 238000012408 PCR amplification Methods 0.000 description 1
- 240000008114 Panicum miliaceum Species 0.000 description 1
- 235000007199 Panicum miliaceum Nutrition 0.000 description 1
- 229930182555 Penicillin Natural products 0.000 description 1
- JGSARLDLIJGVTE-MBNYWOFBSA-N Penicillin G Chemical compound N([C@H]1[C@H]2SC([C@@H](N2C1=O)C(O)=O)(C)C)C(=O)CC1=CC=CC=C1 JGSARLDLIJGVTE-MBNYWOFBSA-N 0.000 description 1
- 244000038248 Pennisetum spicatum Species 0.000 description 1
- 235000007195 Pennisetum typhoides Nutrition 0.000 description 1
- 108091005804 Peptidases Proteins 0.000 description 1
- 239000001888 Peptone Substances 0.000 description 1
- 108010080698 Peptones Proteins 0.000 description 1
- 235000010617 Phaseolus lunatus Nutrition 0.000 description 1
- 244000100170 Phaseolus lunatus Species 0.000 description 1
- CGOMLCQJEMWMCE-STQMWFEESA-N Phe-Arg-Gly Chemical compound NC(N)=NCCC[C@@H](C(=O)NCC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 CGOMLCQJEMWMCE-STQMWFEESA-N 0.000 description 1
- KLAONOISLHWJEE-QWRGUYRKSA-N Phe-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 KLAONOISLHWJEE-QWRGUYRKSA-N 0.000 description 1
- JXWLMUIXUXLIJR-QWRGUYRKSA-N Phe-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 JXWLMUIXUXLIJR-QWRGUYRKSA-N 0.000 description 1
- AKJAKCBHLJGRBU-JYJNAYRXSA-N Phe-Glu-His Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N AKJAKCBHLJGRBU-JYJNAYRXSA-N 0.000 description 1
- NHCKESBLOMHIIE-IRXDYDNUSA-N Phe-Gly-Phe Chemical compound C([C@H](N)C(=O)NCC(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 NHCKESBLOMHIIE-IRXDYDNUSA-N 0.000 description 1
- KBVJZCVLQWCJQN-KKUMJFAQSA-N Phe-Leu-Asn Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O KBVJZCVLQWCJQN-KKUMJFAQSA-N 0.000 description 1
- YTILBRIUASDGBL-BZSNNMDCSA-N Phe-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 YTILBRIUASDGBL-BZSNNMDCSA-N 0.000 description 1
- WEQJQNWXCSUVMA-RYUDHWBXSA-N Phe-Pro Chemical compound C([C@H]([NH3+])C(=O)N1[C@@H](CCC1)C([O-])=O)C1=CC=CC=C1 WEQJQNWXCSUVMA-RYUDHWBXSA-N 0.000 description 1
- YFXXRYFWJFQAFW-JHYOHUSXSA-N Phe-Thr-Thr Chemical compound C[C@H]([C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N)O YFXXRYFWJFQAFW-JHYOHUSXSA-N 0.000 description 1
- 241000218657 Picea Species 0.000 description 1
- 240000000020 Picea glauca Species 0.000 description 1
- 235000008127 Picea glauca Nutrition 0.000 description 1
- 241000218594 Picea pungens Species 0.000 description 1
- 235000005205 Pinus Nutrition 0.000 description 1
- 241000218602 Pinus <genus> Species 0.000 description 1
- 235000008331 Pinus X rigitaeda Nutrition 0.000 description 1
- 235000011613 Pinus brutia Nutrition 0.000 description 1
- 241000018646 Pinus brutia Species 0.000 description 1
- 235000008593 Pinus contorta Nutrition 0.000 description 1
- 235000011334 Pinus elliottii Nutrition 0.000 description 1
- 241000142776 Pinus elliottii Species 0.000 description 1
- 235000013267 Pinus ponderosa Nutrition 0.000 description 1
- 241000555277 Pinus ponderosa Species 0.000 description 1
- 235000010582 Pisum sativum Nutrition 0.000 description 1
- 240000004713 Pisum sativum Species 0.000 description 1
- JQOHKCDMINQZRV-WDSKDSINSA-N Pro-Asn Chemical compound NC(=O)C[C@@H](C([O-])=O)NC(=O)[C@@H]1CCC[NH2+]1 JQOHKCDMINQZRV-WDSKDSINSA-N 0.000 description 1
- SGCZFWSQERRKBD-BQBZGAKWSA-N Pro-Asp-Gly Chemical compound OC(=O)CNC(=O)[C@H](CC(O)=O)NC(=O)[C@@H]1CCCN1 SGCZFWSQERRKBD-BQBZGAKWSA-N 0.000 description 1
- DEDANIDYQAPTFI-IHRRRGAJSA-N Pro-Asp-Tyr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O DEDANIDYQAPTFI-IHRRRGAJSA-N 0.000 description 1
- SHAQGFGGJSLLHE-BQBZGAKWSA-N Pro-Gln Chemical compound NC(=O)CC[C@@H](C([O-])=O)NC(=O)[C@@H]1CCC[NH2+]1 SHAQGFGGJSLLHE-BQBZGAKWSA-N 0.000 description 1
- UUHXBJHVTVGSKM-BQBZGAKWSA-N Pro-Gly-Asn Chemical compound [H]N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O UUHXBJHVTVGSKM-BQBZGAKWSA-N 0.000 description 1
- SXMSEHDMNIUTSP-DCAQKATOSA-N Pro-Lys-Asn Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O SXMSEHDMNIUTSP-DCAQKATOSA-N 0.000 description 1
- VGVCNKSUVSZEIE-IHRRRGAJSA-N Pro-Phe-Asn Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(N)=O)C(O)=O VGVCNKSUVSZEIE-IHRRRGAJSA-N 0.000 description 1
- MLKVIVZCFYRTIR-KKUMJFAQSA-N Pro-Phe-Gln Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(N)=O)C(O)=O MLKVIVZCFYRTIR-KKUMJFAQSA-N 0.000 description 1
- DWPXHLIBFQLKLK-CYDGBPFRSA-N Pro-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 DWPXHLIBFQLKLK-CYDGBPFRSA-N 0.000 description 1
- CGSOWZUPLOKYOR-AVGNSLFASA-N Pro-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 CGSOWZUPLOKYOR-AVGNSLFASA-N 0.000 description 1
- 239000004365 Protease Substances 0.000 description 1
- 229940124158 Protease/peptidase inhibitor Drugs 0.000 description 1
- 102100038675 Protein phosphatase 1D Human genes 0.000 description 1
- 241000218683 Pseudotsuga Species 0.000 description 1
- 235000008572 Pseudotsuga menziesii Nutrition 0.000 description 1
- 240000001416 Pseudotsuga menziesii Species 0.000 description 1
- 241000508269 Psidium Species 0.000 description 1
- 240000001679 Psidium guajava Species 0.000 description 1
- 235000013929 Psidium pyriferum Nutrition 0.000 description 1
- 102100037486 Reverse transcriptase/ribonuclease H Human genes 0.000 description 1
- 240000000528 Ricinus communis Species 0.000 description 1
- 235000004443 Ricinus communis Nutrition 0.000 description 1
- 235000004789 Rosa xanthina Nutrition 0.000 description 1
- 241000109329 Rosa xanthina Species 0.000 description 1
- 235000008691 Sabina virginiana Nutrition 0.000 description 1
- 101000924393 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) Vacuolar aminopeptidase 1 Proteins 0.000 description 1
- 241000209051 Saccharum Species 0.000 description 1
- 240000000111 Saccharum officinarum Species 0.000 description 1
- 235000007201 Saccharum officinarum Nutrition 0.000 description 1
- 241000239226 Scorpiones Species 0.000 description 1
- 241001116459 Sequoia Species 0.000 description 1
- HRNQLKCLPVKZNE-CIUDSAMLSA-N Ser-Ala-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O HRNQLKCLPVKZNE-CIUDSAMLSA-N 0.000 description 1
- ICHZYBVODUVUKN-SRVKXCTJSA-N Ser-Asn-Tyr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O ICHZYBVODUVUKN-SRVKXCTJSA-N 0.000 description 1
- OHKLFYXEOGGGCK-ZLUOBGJFSA-N Ser-Asp-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O OHKLFYXEOGGGCK-ZLUOBGJFSA-N 0.000 description 1
- WOUIMBGNEUWXQG-VKHMYHEASA-N Ser-Gly Chemical compound OC[C@H](N)C(=O)NCC(O)=O WOUIMBGNEUWXQG-VKHMYHEASA-N 0.000 description 1
- UIGMAMGZOJVTDN-WHFBIAKZSA-N Ser-Gly-Ser Chemical compound OC[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O UIGMAMGZOJVTDN-WHFBIAKZSA-N 0.000 description 1
- IFPBAGJBHSNYPR-ZKWXMUAHSA-N Ser-Ile-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O IFPBAGJBHSNYPR-ZKWXMUAHSA-N 0.000 description 1
- WBAXJMCUFIXCNI-WDSKDSINSA-N Ser-Pro Chemical compound OC[C@H](N)C(=O)N1CCC[C@H]1C(O)=O WBAXJMCUFIXCNI-WDSKDSINSA-N 0.000 description 1
- QYBRQMLZDDJBSW-AVGNSLFASA-N Ser-Tyr-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O QYBRQMLZDDJBSW-AVGNSLFASA-N 0.000 description 1
- ZVBCMFDJIMUELU-BZSNNMDCSA-N Ser-Tyr-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CC2=CC=C(C=C2)O)NC(=O)[C@H](CO)N ZVBCMFDJIMUELU-BZSNNMDCSA-N 0.000 description 1
- 240000005498 Setaria italica Species 0.000 description 1
- 235000007226 Setaria italica Nutrition 0.000 description 1
- BQCADISMDOOEFD-UHFFFAOYSA-N Silver Chemical compound [Ag] BQCADISMDOOEFD-UHFFFAOYSA-N 0.000 description 1
- 108091027967 Small hairpin RNA Proteins 0.000 description 1
- 235000007230 Sorghum bicolor Nutrition 0.000 description 1
- 235000009184 Spondias indica Nutrition 0.000 description 1
- 235000006468 Thea sinensis Nutrition 0.000 description 1
- WFUAUEQXPVNAEF-ZJDVBMNYSA-N Thr-Arg-Thr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H]([C@@H](C)O)C(O)=O)CCCN=C(N)N WFUAUEQXPVNAEF-ZJDVBMNYSA-N 0.000 description 1
- UQTNIFUCMBFWEJ-IWGUZYHVSA-N Thr-Asn Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(O)=O)CC(N)=O UQTNIFUCMBFWEJ-IWGUZYHVSA-N 0.000 description 1
- SKHPKKYKDYULDH-HJGDQZAQSA-N Thr-Asn-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O SKHPKKYKDYULDH-HJGDQZAQSA-N 0.000 description 1
- IOWJRKAVLALBQB-IWGUZYHVSA-N Thr-Asp Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(O)=O)CC(O)=O IOWJRKAVLALBQB-IWGUZYHVSA-N 0.000 description 1
- BWUHENPAEMNGQJ-ZDLURKLDSA-N Thr-Gln Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(O)=O)CCC(N)=O BWUHENPAEMNGQJ-ZDLURKLDSA-N 0.000 description 1
- BIYXEUAFGLTAEM-WUJLRWPWSA-N Thr-Gly Chemical compound C[C@@H](O)[C@H](N)C(=O)NCC(O)=O BIYXEUAFGLTAEM-WUJLRWPWSA-N 0.000 description 1
- QQWNRERCGGZOKG-WEDXCCLWSA-N Thr-Gly-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O QQWNRERCGGZOKG-WEDXCCLWSA-N 0.000 description 1
- ZTPXSEUVYNNZRB-CDMKHQONSA-N Thr-Gly-Phe Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O ZTPXSEUVYNNZRB-CDMKHQONSA-N 0.000 description 1
- AMXMBCAXAZUCFA-RHYQMDGZSA-N Thr-Leu-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O AMXMBCAXAZUCFA-RHYQMDGZSA-N 0.000 description 1
- WNQJTLATMXYSEL-OEAJRASXSA-N Thr-Phe-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O WNQJTLATMXYSEL-OEAJRASXSA-N 0.000 description 1
- QJIODPFLAASXJC-JHYOHUSXSA-N Thr-Thr-Phe Chemical compound C[C@H]([C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N)O QJIODPFLAASXJC-JHYOHUSXSA-N 0.000 description 1
- VMSSYINFMOFLJM-KJEVXHAQSA-N Thr-Tyr-Met Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CCSC)C(=O)O)N)O VMSSYINFMOFLJM-KJEVXHAQSA-N 0.000 description 1
- 235000008109 Thuja occidentalis Nutrition 0.000 description 1
- 240000003243 Thuja occidentalis Species 0.000 description 1
- 241000218638 Thuja plicata Species 0.000 description 1
- 235000007253 Trigonella corniculata Nutrition 0.000 description 1
- 240000004336 Trigonella corniculata Species 0.000 description 1
- 235000001484 Trigonella foenum graecum Nutrition 0.000 description 1
- 244000250129 Trigonella foenum graecum Species 0.000 description 1
- 239000007984 Tris EDTA buffer Substances 0.000 description 1
- ZHZLQVLQBDBQCQ-WDSOQIARSA-N Trp-Lys-Arg Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N ZHZLQVLQBDBQCQ-WDSOQIARSA-N 0.000 description 1
- DTPWXZXGFAHEKL-NWLDYVSISA-N Trp-Thr-Glu Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O DTPWXZXGFAHEKL-NWLDYVSISA-N 0.000 description 1
- CRCHQCUINSOGFD-JBACZVJFSA-N Trp-Tyr-Glu Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC3=CC=C(C=C3)O)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N CRCHQCUINSOGFD-JBACZVJFSA-N 0.000 description 1
- 235000008554 Tsuga heterophylla Nutrition 0.000 description 1
- 240000003021 Tsuga heterophylla Species 0.000 description 1
- AKFLVKKWVZMFOT-IHRRRGAJSA-N Tyr-Arg-Asn Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(O)=O AKFLVKKWVZMFOT-IHRRRGAJSA-N 0.000 description 1
- KLGFILUOTCBNLJ-IHRRRGAJSA-N Tyr-Cys-Arg Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N)O KLGFILUOTCBNLJ-IHRRRGAJSA-N 0.000 description 1
- JAQGKXUEKGKTKX-HOTGVXAUSA-N Tyr-Tyr Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=C(O)C=C1 JAQGKXUEKGKTKX-HOTGVXAUSA-N 0.000 description 1
- 235000002098 Vicia faba var. major Nutrition 0.000 description 1
- 235000006582 Vigna radiata Nutrition 0.000 description 1
- 235000010721 Vigna radiata var radiata Nutrition 0.000 description 1
- 235000011469 Vigna radiata var sublobata Nutrition 0.000 description 1
- 244000042314 Vigna unguiculata Species 0.000 description 1
- 235000010722 Vigna unguiculata Nutrition 0.000 description 1
- 208000027418 Wounds and injury Diseases 0.000 description 1
- 101001036768 Zea mays Glucose-1-phosphate adenylyltransferase large subunit 1, chloroplastic/amyloplastic Proteins 0.000 description 1
- 101001040871 Zea mays Glutelin-2 Proteins 0.000 description 1
- 101000662549 Zea mays Sucrose synthase 1 Proteins 0.000 description 1
- FJJCIZWZNKZHII-UHFFFAOYSA-N [4,6-bis(cyanoamino)-1,3,5-triazin-2-yl]cyanamide Chemical compound N#CNC1=NC(NC#N)=NC(NC#N)=N1 FJJCIZWZNKZHII-UHFFFAOYSA-N 0.000 description 1
- 230000001133 acceleration Effects 0.000 description 1
- 102000005421 acetyltransferase Human genes 0.000 description 1
- 108020002494 acetyltransferase Proteins 0.000 description 1
- MKUXAQIIEYXACX-UHFFFAOYSA-N aciclovir Chemical compound N1C(N)=NC(=O)C2=C1N(COCCO)C=N2 MKUXAQIIEYXACX-UHFFFAOYSA-N 0.000 description 1
- 108010086434 alanyl-seryl-glycine Proteins 0.000 description 1
- 108010044940 alanylglutamine Proteins 0.000 description 1
- 235000020224 almond Nutrition 0.000 description 1
- KOSRFJWDECSPRO-UHFFFAOYSA-N alpha-L-glutamyl-L-glutamic acid Natural products OC(=O)CCC(N)C(=O)NC(CCC(O)=O)C(O)=O KOSRFJWDECSPRO-UHFFFAOYSA-N 0.000 description 1
- APKFDSVGJQXUKY-INPOYWNPSA-N amphotericin B Chemical compound O[C@H]1[C@@H](N)[C@H](O)[C@@H](C)O[C@H]1O[C@H]1/C=C/C=C/C=C/C=C/C=C/C=C/C=C/[C@H](C)[C@@H](O)[C@@H](C)[C@H](C)OC(=O)C[C@H](O)C[C@H](O)CC[C@@H](O)[C@H](O)C[C@H](O)C[C@](O)(C[C@H](O)[C@H]2C(O)=O)O[C@H]2C1 APKFDSVGJQXUKY-INPOYWNPSA-N 0.000 description 1
- 229960003942 amphotericin b Drugs 0.000 description 1
- 230000003321 amplification Effects 0.000 description 1
- 108010062796 arginyllysine Proteins 0.000 description 1
- 229910052785 arsenic Inorganic materials 0.000 description 1
- 210000004507 artificial chromosome Anatomy 0.000 description 1
- 108010040443 aspartyl-aspartic acid Proteins 0.000 description 1
- 108010047857 aspartylglycine Proteins 0.000 description 1
- 230000003542 behavioural effect Effects 0.000 description 1
- 239000007844 bleaching agent Substances 0.000 description 1
- 244000309466 calf Species 0.000 description 1
- 229940041514 candida albicans extract Drugs 0.000 description 1
- FPPNZSSZRUTDAP-UWFZAAFLSA-N carbenicillin Chemical compound N([C@H]1[C@H]2SC([C@@H](N2C1=O)C(O)=O)(C)C)C(=O)C(C(O)=O)C1=CC=CC=C1 FPPNZSSZRUTDAP-UWFZAAFLSA-N 0.000 description 1
- 229960003669 carbenicillin Drugs 0.000 description 1
- 235000020226 cashew nut Nutrition 0.000 description 1
- 238000004113 cell culture Methods 0.000 description 1
- 239000003153 chemical reaction reagent Substances 0.000 description 1
- 210000003763 chloroplast Anatomy 0.000 description 1
- 239000000470 constituent Substances 0.000 description 1
- 239000013068 control sample Substances 0.000 description 1
- 244000038559 crop plants Species 0.000 description 1
- 230000006378 damage Effects 0.000 description 1
- 230000007850 degeneration Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 230000000368 destabilizing effect Effects 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 230000029087 digestion Effects 0.000 description 1
- 229910000396 dipotassium phosphate Inorganic materials 0.000 description 1
- 235000013601 eggs Nutrition 0.000 description 1
- 238000004520 electroporation Methods 0.000 description 1
- 239000003623 enhancer Substances 0.000 description 1
- 230000002255 enzymatic effect Effects 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 239000013604 expression vector Substances 0.000 description 1
- 239000004744 fabric Substances 0.000 description 1
- 108010063718 gamma-glutamylaspartic acid Proteins 0.000 description 1
- 238000001502 gel electrophoresis Methods 0.000 description 1
- 108010078144 glutaminyl-glycine Proteins 0.000 description 1
- 108010055341 glutamyl-glutamic acid Proteins 0.000 description 1
- JYPCXBJRLBHWME-UHFFFAOYSA-N glycyl-L-prolyl-L-arginine Natural products NCC(=O)N1CCCC1C(=O)NC(CCCN=C(N)N)C(O)=O JYPCXBJRLBHWME-UHFFFAOYSA-N 0.000 description 1
- 108010019832 glycyl-asparaginyl-glycine Proteins 0.000 description 1
- 108010051307 glycyl-glycyl-proline Proteins 0.000 description 1
- YMAWOPBAYDPSLA-UHFFFAOYSA-N glycylglycine Chemical compound [NH3+]CC(=O)NCC([O-])=O YMAWOPBAYDPSLA-UHFFFAOYSA-N 0.000 description 1
- 239000004009 herbicide Substances 0.000 description 1
- 108010085325 histidylproline Proteins 0.000 description 1
- 208000014674 injury Diseases 0.000 description 1
- 229960000367 inositol Drugs 0.000 description 1
- 238000003780 insertion Methods 0.000 description 1
- 230000037431 insertion Effects 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- BAUYGSIQEAFULO-UHFFFAOYSA-L iron(2+) sulfate (anhydrous) Chemical compound [Fe+2].[O-]S([O-])(=O)=O BAUYGSIQEAFULO-UHFFFAOYSA-L 0.000 description 1
- 229910000359 iron(II) sulfate Inorganic materials 0.000 description 1
- 108010044374 isoleucyl-tyrosine Proteins 0.000 description 1
- 239000002523 lectin Substances 0.000 description 1
- 108010044311 leucyl-glycyl-glycine Proteins 0.000 description 1
- 108010044056 leucyl-phenylalanine Proteins 0.000 description 1
- 108010073472 leucyl-prolyl-proline Proteins 0.000 description 1
- 108010057821 leucylproline Proteins 0.000 description 1
- 235000014684 lodgepole pine Nutrition 0.000 description 1
- 210000002751 lymph Anatomy 0.000 description 1
- 108010003700 lysyl aspartic acid Proteins 0.000 description 1
- 108010076718 lysyl-glutamyl-tryptophan Proteins 0.000 description 1
- 108010064235 lysylglycine Proteins 0.000 description 1
- 108010038320 lysylphenylalanine Proteins 0.000 description 1
- 229910052943 magnesium sulfate Inorganic materials 0.000 description 1
- 235000019341 magnesium sulphate Nutrition 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 108010068488 methionylphenylalanine Proteins 0.000 description 1
- 230000011987 methylation Effects 0.000 description 1
- 238000007069 methylation reaction Methods 0.000 description 1
- 238000000520 microinjection Methods 0.000 description 1
- 238000003801 milling Methods 0.000 description 1
- 230000000116 mitigating effect Effects 0.000 description 1
- 238000002156 mixing Methods 0.000 description 1
- 238000010369 molecular cloning Methods 0.000 description 1
- 229940045641 monobasic sodium phosphate Drugs 0.000 description 1
- 229910000403 monosodium phosphate Inorganic materials 0.000 description 1
- 235000019799 monosodium phosphate Nutrition 0.000 description 1
- 238000002703 mutagenesis Methods 0.000 description 1
- 231100000350 mutagenesis Toxicity 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- 244000052769 pathogen Species 0.000 description 1
- 230000001717 pathogenic effect Effects 0.000 description 1
- 229940049954 penicillin Drugs 0.000 description 1
- 239000000137 peptide hydrolase inhibitor Substances 0.000 description 1
- 235000019319 peptone Nutrition 0.000 description 1
- 108010012581 phenylalanylglutamate Proteins 0.000 description 1
- 239000013600 plasmid vector Substances 0.000 description 1
- 239000001103 potassium chloride Substances 0.000 description 1
- 235000011164 potassium chloride Nutrition 0.000 description 1
- 108010020755 prolyl-glycyl-glycine Proteins 0.000 description 1
- 108010020432 prolyl-prolylisoleucine Proteins 0.000 description 1
- 108010004914 prolylarginine Proteins 0.000 description 1
- 108010029020 prolylglycine Proteins 0.000 description 1
- 230000001902 propagating effect Effects 0.000 description 1
- 238000005086 pumping Methods 0.000 description 1
- 235000008160 pyridoxine Nutrition 0.000 description 1
- 239000011677 pyridoxine Substances 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 235000001520 savin Nutrition 0.000 description 1
- 108010026333 seryl-proline Proteins 0.000 description 1
- 235000000673 shore pine Nutrition 0.000 description 1
- HBMJWWWQQXIZIP-UHFFFAOYSA-N silicon carbide Chemical compound [Si+]#[C-] HBMJWWWQQXIZIP-UHFFFAOYSA-N 0.000 description 1
- 229910010271 silicon carbide Inorganic materials 0.000 description 1
- 229910052709 silver Inorganic materials 0.000 description 1
- 239000004332 silver Substances 0.000 description 1
- 239000011780 sodium chloride Substances 0.000 description 1
- AJPJDKMHJJGVTQ-UHFFFAOYSA-M sodium dihydrogen phosphate Chemical compound [Na+].OP(O)([O-])=O AJPJDKMHJJGVTQ-UHFFFAOYSA-M 0.000 description 1
- SUKJFIGYRHOWBL-UHFFFAOYSA-N sodium hypochlorite Chemical compound [Na+].Cl[O-] SUKJFIGYRHOWBL-UHFFFAOYSA-N 0.000 description 1
- 229940063673 spermidine Drugs 0.000 description 1
- 239000007921 spray Substances 0.000 description 1
- 238000003756 stirring Methods 0.000 description 1
- 239000010902 straw Substances 0.000 description 1
- 229960005322 streptomycin Drugs 0.000 description 1
- 230000008093 supporting effect Effects 0.000 description 1
- DPJRMOMPQZCRJU-UHFFFAOYSA-M thiamine hydrochloride Chemical compound Cl.[Cl-].CC1=C(CCO)SC=[N+]1CC1=CN=C(C)N=C1N DPJRMOMPQZCRJU-UHFFFAOYSA-M 0.000 description 1
- 108010061238 threonyl-glycine Proteins 0.000 description 1
- UZKQTCBAMSWPJD-UQCOIBPSSA-N trans-Zeatin Natural products OCC(/C)=C\CNC1=NC=NC2=C1N=CN2 UZKQTCBAMSWPJD-UQCOIBPSSA-N 0.000 description 1
- UZKQTCBAMSWPJD-FARCUNLSSA-N trans-zeatin Chemical compound OCC(/C)=C/CNC1=NC=NC2=C1N=CN2 UZKQTCBAMSWPJD-FARCUNLSSA-N 0.000 description 1
- 230000002103 transcriptional effect Effects 0.000 description 1
- 238000010361 transduction Methods 0.000 description 1
- 230000026683 transduction Effects 0.000 description 1
- 235000001019 trigonella foenum-graecum Nutrition 0.000 description 1
- 108010084932 tryptophyl-proline Proteins 0.000 description 1
- 108010038745 tryptophylglycine Proteins 0.000 description 1
- 108010051110 tyrosyl-lysine Proteins 0.000 description 1
- 108010003137 tyrosyltyrosine Proteins 0.000 description 1
- 235000015112 vegetable and seed oil Nutrition 0.000 description 1
- 230000003612 virological effect Effects 0.000 description 1
- 239000012138 yeast extract Substances 0.000 description 1
- 229940023877 zeatin Drugs 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/82—Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
- C12N15/8216—Methods for controlling, regulating or enhancing expression of transgenes in plant cells
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/82—Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
- C12N15/8241—Phenotypically and genetically modified plants via recombinant DNA technology
- C12N15/8261—Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield
- C12N15/8271—Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield for stress resistance, e.g. heavy metal resistance
- C12N15/8279—Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield for stress resistance, e.g. heavy metal resistance for biotic stress resistance, pathogen resistance, disease resistance
- C12N15/8286—Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield for stress resistance, e.g. heavy metal resistance for biotic stress resistance, pathogen resistance, disease resistance for insect resistance
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A40/00—Adaptation technologies in agriculture, forestry, livestock or agroalimentary production
- Y02A40/10—Adaptation technologies in agriculture, forestry, livestock or agroalimentary production in agriculture
- Y02A40/146—Genetically Modified [GMO] plants, e.g. transgenic plants
Landscapes
- Genetics & Genomics (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Engineering & Computer Science (AREA)
- Chemical & Material Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Organic Chemistry (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Biomedical Technology (AREA)
- Biotechnology (AREA)
- General Engineering & Computer Science (AREA)
- Molecular Biology (AREA)
- Microbiology (AREA)
- Plant Pathology (AREA)
- Biophysics (AREA)
- Physics & Mathematics (AREA)
- Biochemistry (AREA)
- General Health & Medical Sciences (AREA)
- Cell Biology (AREA)
- Pest Control & Pesticides (AREA)
- Insects & Arthropods (AREA)
- Breeding Of Plants And Reproduction By Means Of Culturing (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Agricultural Chemicals And Associated Chemicals (AREA)
Abstract
A presente invenção está relacionada com métodos para desenhar moléculas de ácido nucléico para a expressão aumentada de polipeptídeos codificados em plantas. Em tais métodos, as freqüências de uso de códons são induzidas na direção de freqüências de uso de códons de um vírus vegetal, grupo de vírus vegetais, ou um subgrupo de moléculas de ácido nucléico provenientes destes. Em avanços preferidos, o polipeptídeo codificado afeta o fenótipo da planta. A invenção também compreende moléculas de ácido nucléico que codificam polipeptídeos onde as moléculas de ácido nucléico foram desenhadas para apresentar códons-tendenciosos de vírus vegetais. A invenção também faz uso de plantas transgênicas e progênie destas, com expressão aumentada de polipeptídeos inseticida para resistência aumentada a insetos e outras pragas que são prejudiciais a plantas de valor na agricultura. Refere-se ainda a presente invenção, a um método para obtenção de uma planta transgênica e sua progênie compreendendo a transformação de maneira estável de uma célula vegetal com uma molécula de ácido nucléico, o cultivo da referida célula vegetal transformada sob condições de crescimento vegetal e a regeneração da planta transgênica e sua progênie.
Description
MÉTODO PARA DESENHAR UMA MOLÉCULA DE ÁCIDO NUCLÉICO,MOLÉCULA DE ÁCIDO NUCLÉICO, VETOR, PLANTA TRANS6ÊNICA E APROGÊNIE DESTA
CAMPO DA INVENÇÃO
A pres.ente invenção está relacionada com métodos deprojetar moléculas de ácidos nucléicos para expressãomelhorada dos polipeptideos codificados em plantas. Em taismétodos, as freqüências de uso de códons são induzidas nadireção de freqüências de uso de códons de virus vegetais.Em avanços preferidos, o polipeptideo codificado afeta ofenótipo da planta. Em um avanço especifico, o polipeptideocodificado é um polipeptideo inseticida.
FUNDAMENTOS DA INVENÇÃO
Um alto nivel de expressão de polipeptideo transgênicoé freqüentemente dificil de alcançar em plantas,particularmente quando o transgene codificando umpolipeptideo estrangeiro é derivado de um organismo que éevolutivamente distante de plantas. Isso tem sido umimportante obstáculo à explotação bem-sucedida de genespolipeptideo inseticidas derivados de procariontes. Umarazão critica para baixos niveis de expressão depolipeptideo transgênico é a diferença significante no usode códon freqüentemente observada entre espécies altamentedivergentes, e.g., plantas e procariontes, comumentereferidos como tendência de códon. A tendência de códonfreqüentemente se correlaciona com a eficiência de traduçãode RNA mensageiro (RNAm), que é sucessivamente acreditadopor ser dependente de, inter alia, propriedades dos códonssendo traduzidos e a disponibilidade de molécula detransferência de RNA (tRNA) em particular. A predominânciade RNAs t selecionados em uma célula é geralmente umreflexo dos códons usados mais freqüentemente na sintesepeptidica. Conseqüentemente, genes podem ser cortados paraexpressão ótima em plantas, baseado nesses fatores detradução.
Em geral, tem havido duas abordagens principais paraseqüências gênicas sintéticas de indução de tendência decódon para expressão em plantas: indução de tendência defreqüência de uso de códon e indução de tendência de códonpreferido. A indução de tendência de freqüência de uso decódon refere-se a selecionar códons para . uma molécula deácido nucléico codificando a seqüência de aminoácidos de umpolipeptideo a ser expressado, de forma que as freqüênciasde uso de códon, para um ou mais tipos de aminoácidoscodificados em um gene sintético, pareçam as freqüências deuso de códon do hospedeiro de expressão de polipeptideo(e.g. uma planta). A tendência de códon preferida consistede selecionar códons para uma molécula de ácido nucléicoque codifica a seqüência de aminoácidos de um polipeptideoa ser expressado, de forma que um ou mais códons para um oumais tipos de aminoácidos em um gene sintético são osúnicos códons que mais freqüentemente codificam um tipo deaminoácido em um hospedeiro de expressão de polipeptideo(e.g. uma planta). Essas abordagens para melhorar aexpressão transgene em plantas, particularmente comrespeito à expressão de polipeptideos CRY Bacillusthuringiensis inseticida, foram usadas em um número decasos.
Adang et al. , US Pat. No. 5.380.831 refere-se a umvariante sintético de um gene de polipeptideo Cry Bacillusthuringiensis tenebrionsis (Btt) inseticida nativo, no qualas freqüências de uso de códon foram ajustadas para estarpróximas àquelas usadas em genes de plantas dicotiledôneas.
Adang et al. também indicam que a mesma abordagem pode serusada para gerar um gene Cry sintético adaptado a expressãoem plantas monocotiledôneas, usando as freqüências de usode códon de uma planta monocotiledônea. Adang et al.revelam que o gene sintético é projetado mudando-se códonsindividuais do gene Cry nativo, de forma que a freqüênciade uso de códon total se assemelhe àquela de um gene deplanta dicotiledônea.
Fischhoff et al. U.S. Pat. No. 5.500.365, referem-se agenes vegetais codificando o polipeptideo Cry inseticida deBacillus thuringiensis. As porcentagens listadas sãobaseadas em freqüências de uso de códon de genes de plantasdicotiledôneas. Fischoff et al. afirmam que, em geras,códons deveriam ser selecionados, preferencialmente, deforma que o conteúdo GC do gene sintético seja cerca de 50%.Barton et al., U.S. Pat. No. 5.177.308, é direcionadoà expressão de toxinas inseticida em plantas. Um gene depolipeptideo AaIT sintético inseticida derivado de um genenativo de escorpião é descrito, no qual o códon preferido érelatado por ser usado para cada aminoácido.
Koziel et al., U.S. Pat. No. 6.121.014, é direcionadono sentido de otimizar a expressão de polipeptideos emplantas e, particularmente, polipeptideos inseticida deBacillus thuringiensis. Koziel et al. indicam que odesenho de genes sintéticos otimizado para expressão emplantas monocotiledôneas ou dicotiledôneas é para serbaseado em mudar um número suficiente de códons de umaseqüência nativa para os códons preferidos da plantahospedeira.
Em geral, aumentar a eficiência de tradução detransgenes em plantas foi tentado gerando-se genessintéticos que usam tanto os códons preferidos de umhospedeiro vegetal ou a freqüência de uso de códon dohospedeiro vegetal. Deveria ser notado, contudo, que muitoda tendência de códon aparente, em milho, pode ser devido afatores não relacionados a eficiência de tradução per si,tal como pressão de seleção para metilação genômica deplantas e taxas de mutação de sitios metilados versus nãometilados. Assim, resta uma necessidade não encontrada naarte para abordagens alternativas para mudar freqüências deuso de códon para aumentar a expressão transgene vegetal.SUMÁRIO DA INVENÇÃO
A presente invenção está relacionada a métodos deprojetar moléculas de ácidos nucléicos para expressãomelhorada dos polipeptideos codificados em plantas.Conseqüentemente, pelo menos um códon da molécula de ácidonucléico a ser expressada é alterado para um códon que temuma freqüência de uso em um virus vegetal que é maior doque aquela do códon não alterado. Preferencialmente, asmoléculas de ácidos nucléicos desta invenção irão melhorara expressão do polipeptideo codificado, se comparada a umpolipeptideo codificado por uma molécula de ácido nucléicoque não foi alterada.
Em um avanço, o códon alterado foi alterado para umcódon que tem uma freqüência de uso em um virus vegetal queé maior do que 0,09. Em outro avanço, o códon alterado foialterado para um códon que tem uma freqüência de uso em umvirus vegetal que é igual a ou maior do que a mediana dafreqüência de uso de códon para aquele aminoácido emparticular, codificado pelo códon alterado. Tal mediana defreqüência de uso de códon é a mediana das freqüências deuso de códon no virus vegetal para todos códons codificandoum aminoácido em particular.
Em avanços preferidos, o polipeptideo codificado afetao fenótipo da planta. Em um avanço especifico, opolipeptideo codificado é um polipeptideo inseticidaincluindo, mas não limitado aos, polipeptideos 437N e Cryde Bacillus thuringiensis e polipeptideo de lipaseinseticida de Rhyzopus oryzae.
Também englobados pela presente invenção são vetores,células hospedeiras, plantas transgênicas e progênie dessascompreendendo moléculas de ácidos nucléicos feitas deacordo com os métodos da invenção. A invenção estárelacionada, ainda, material vegetal de propagação de umaplanta transformada incluindo, mas não limitando-se a,sementes, tubérculos, cormos, bulbos, folhas, e cortes deraizes e brotos.
BREVE DESCRIÇÃO DOS DESENHOS
As FIGS. 1A-1B mostram os resultados de um teste dedisco foliar contra a lagarta do milho européia. Discosfoliares de calos transformados com polipeptideo 473Ninseticida de códon otimizado de Bacillus thuringiensisforam incubados com uma lagarta do milho européia recém-nascida por 48 hrs. Discos foliares controle de plantasnão transgênicas foram incluídos para comparação de consumofoliar. (A) O disco foliar foi totalmente consumido empoços controle deixando apenas o disco de filtro de papelno qual o disco foliar foi colocado (ver coluna 1). Discosfoliares transformados com 473N de códon otimizado forammuito pouco consumidos (ver coluna 2). (B) Eventosadicionais de transformação com 473N de códon otimizadoapresentaram pouco consumo foliar.A FIG. 2 mostra uma análise de immunoblot de plantastransformadas com polipeptideo 473N inseticida de códonotimizado de Bacillus thuringiensis. Extrações depolipeptideo de plantas transgênicas foram sujeitas aanálise de immunoblot usando um anticorpo anti-473N. 473Npurificado recombinante é apresentado na faixa 1. Umaamostra controle de planta não transgênica mostra bandasreativas sem 437N em comum com amostras transgênicas (faixa2) . A presença de uma banda correspondente a 437N estevepresente em amostras foliares de eventos que demonstrarameficácia no teste de disco foliar (faixas 2, 3, 4, e 7).
A FIG. 3 mostra uma análise de immunoblot de plantastransformadas com lipase inseticida de códon otimizada deRhyzopus oryzae. Extrações de polipeptideo de plantastransgênicas de tecido (A) foliar e (B) radicular foramsujeitas a análise de immunoblot usando um anticorpo anti-Rolipase. A proteina precursora purificada recombinanteRolipase (ROL ~42 kD) foi incluída na análise de immunoblotcomo um controle positivo. A presença de uma bandacorrespondente a Rolipase madura (~31 kD) foi observada emplantas que foram positivas no teste de simulação de raiz(faixas 1-6) .
DESCRIÇÃO DETALHADA DA INVENÇÃO
Sistemas biológicos exibem freqüências característicasno uso de códons particulares ( i.e. freqüências de uso decódon) para especificar um dado tipo de aminoácido. Taisfreqüências de códon podem diferir grandemente de espéciepara espécie, um fenômeno conhecido como "tendência decódon". Diferenças de espécies em tendência de códon sãopossíveis devido à degeneração do código genético e são bemdocumentadas, na forma de tabelas de freqüência de uso decódon. A tendência de códon de uma molécula de ácidonucléico em particular determinará, a um alto grau, aeficiência com a qual o polipeptideo codificado éexpressado em um tipo de célula em particular.
O efeito de tendência de códon na eficiência deexpressão é uma consideração particularmente importantepara expressão transgene. Uma seqüência de RNAmcompreendendo vários códons que não são usadosfreqüentemente em uma espécie que deve ser o hospedeiro deexpressão é improvável de ser traduzida eficientemente. Aocontrário, uma seqüência de RNAm que consiste de códons quesão freqüentemente usados por um organismo hospedeiro éprovável de ser traduzida com alta eficiência.
A presente invenção está relacionada a métodos deprojetar moléculas de ácidos nucléicos para expressãomelhorada dos polipeptideos codificados em plantasconstruindo moléculas de ácidos nucléicos cuja tendência decódon é induzida na direção de códons que são usadosfreqüentemente em seqüências codificando moléculas deácidos nucléicos de virus vegetais. A tendência de códonde virus vegetais conhecidos por explorar o maquinário detradução do hospedeiro vegetal com alta eficiência é maisprovável de ser um reflexo de preferências de tradução dohospedeiro vegetal do que a tendência de códon dasseqüências genômicas nativas do hospedeiro vegetal.
Conseqüentemente, pelo menos um códon da molécula de ácidonucléico a ser expressada é alterado para um códon quepossui uma freqüência de uso em um virus vegetal, grupo devirus vegetais, ou subgrupo de moléculas de ácidosnucléicos desses, que é maior do que aquela do código códonnão alterado. Preferencialmente, as moléculas de ácidosnucléicos desta invenção irão melhorar a expressão dopolipeptideo codificado se comparado a um polipeptideocodificado por uma molécula de ácido nucléico que não foialterada.
Os métodos da presente invenção compreendem gerartabelas de freqüência de uso de códon de um virus vegetal,grupo de virus vegetais, ou um subgrupo de moléculas deácidos nucléicos desses, de interesse para determinarcódons com altas freqüências de uso em virus vegetais. Talfreqüência alta de uso códons pode ser substituída porcódons com baixas freqüências de uso que estão presentes emmoléculas de ácidos nucléicos a serem expressadas emplantas. Os códons com as maiores freqüências de uso queusaram as substituições são chamados "códons alterados".
Moléculas de ácidos nucléicos e seus polipeptideoscodificados que têm pelo menos um códon alterado são ditaspor serem "códon otimizadas". Não existe pré-requisito deque todo ou a maioria dos códons devem ser códons alteradospara que uma molécula de ácido nucléico ou polipeptídeoseja uma molécula códon otimizada.
DETERMINAR FREQÜÊNCIAS DE USO DE CÓDON
Para alterar uma molécula de ácido nucléico de formaque os códons alterados são aqueles com uma freqüência deuso maior em um virus vegetal, deve-se, primeiro,determinar freqüências de uso de códon para o virusvegetal. Em um avanço, a freqüência de uso de códon ébaseada em todos dos polipeptideos codificados pelasmoléculas de ácidos nucléicos do virus. Em outro avanço, afreqüência de uso de códon é baseada em um subgrupo dospolipeptideos codificados pelas moléculas de ácidosnucléicos do virus. Em outro avanço, a freqüência de usode códon é baseada no subgrupo dos polipeptideoscodificados pelas moléculas de ácidos nucléicos do virusque são similares função (e.g., os polipeptideos de capa,os polipeptideos de maquinário de transcrição ou detradução, os polipeptideos envelope, etc). A freqüênciade uso de códon pode ser baseada em um virus vegetal oumúltiplos virus vegetais. Em avanços onde múltiplos virusvegetais são usados para calcular freqüências de uso decódon, os virus infectam, preferencialmente, o mesmo tipode planta (e.g., monocotiledônea, dicotiledônea, milho,soja, etc.).
A freqüência de uso de códon é calculada para umaseqüência codificadora de molécula de ácido nucléico deacordo com o seguinte método. Primeiro, o número total detodos os códons codificando um tipo de aminoácido emparticular (ou um códon de parada) é determinado contando-se as ocorrências sobre uma ou mais seqüênciascodificadoras de moléculas de ácido nucléico. Segundo, onúmero total de ocorrências para cada códon codificando umtipo de aminoácido em particular (ou códon de parada) édeterminado para as mesmas seqüências codificadoras demoléculas de ácido nucléico. Terceiro, uma freqüência deuso de códon para cada códon é determinada dividindo-se onúmero total de ocorrências daquele códon pelo número totalde ocorrências de códons codificando o mesmo tipo deaminoácido daquele códon.
As tabelas reveladas nas Seções 5.1.1, 5.1.2, e 5.2podem ser usadas para selecionar os códons a serem usadoscomo códons alterados. Alternativamente, o especialistaversado pode gerar várias tabelas distintas com virus deinteresse usando os métodos aqui descritos.
VIRUS DE PLANTA MONOCOTILEDÔNEA CODON-TENDENCIADO
Em alguns avanços, um virus vegetal ou virus queinfectam plantas monocotiledôneas são usados para gerarfreqüências de uso de códon. Com um exemplo não limitante,freqüências de uso de códon de virus planta monocotiledôneaforam determinadas por 173 seqüências codificadoras demoléculas de ácidos nucléicos de virus de plantamonocotiledônea (listadas na Tabela 1). As seqüênciasusadas compreendem, como a Tabela 2 indica, as freqüênciasde uso de códon determinadas a partir das seqüênciascodificadoras de moléculas de ácidos nucléicos dos virus demonocotiledôneas listadas na Tabela 1. As freqüências deuso de códon de virus de planta monocotiledônea listadas naTabela 2 pode ser usada para guiar a seleção de códons parao desenho de uma seqüência codificadora de molécula deácido nucléico de virus vegetal códon-tendenciadocodificando um polipeptideo a ser expressada em uma planta.
Seqüências virais podem ser obtidas a partir de qualquerfonte, e.g., base de dados de taxonomia Genbank e NCBI. Sea expressão do polipeptideo codificado pela molécula deácido nucléico compreendendo códons alterados é desejada emuma planta monocotiledônea, virus vegetais que infectammonocotiledôneas são usados, preferencialmente, para geraras freqüências de uso de códon (como, e.g., na Tabela 2).
Tabela 1: Virus de planta monocotiledônea e número deseqüências de cada para cálculo de freqüência de uso decódon.
<table>table see original document page 13</column></row><table><table>table see original document page 14</column></row><table>Tabela 2: Freqüências de uso de códon em vírus de plantamonocotiledônea.
<table>table see original document page 15</column></row><table><table>table see original document page 16</column></row><table>
Em avanços específicos, freqüências de uso de códonsão baseadas em um virus de planta monocotiledônea ou virusque infectam um tipo especifico de planta monocotiledônea(e.g., milho). Em um avanço especifico, freqüências de usode códon foram calculadas usando seqüências codificadorasde moléculas de ácidos nucléicos de virus de milho,caracterizado pelo fato de que as moléculas de ácidosnucléicos têm os seguintes números de acesso: CAA68570,CAA68567, CAA68566, CAA68568, CAA68569, CAA12314, CAA12315,CAA12316, CAA12317, CAA12318, CAA12319, CAA12320,NP_115454, NP_115455, AAB22541, AAB22542, AAB26111,AAP80680, AAP80681, AAA46635, AAA4663.6, AAA46637,NP_569138, NP_619717, NP_619718, NP_619719, NP_619720,NP_619721, NP_619722, AAB50194, AAB50195, CAA39227, eCAA39228 (Tabela 3) . Em outro avanço especifico,freqüências de uso de códon são calculadas para um subgrupodas moléculas de ácidos nucléicos de virus especifico demilho ou específicos. Moléculas de ácidos nucléicoscodificando polipeptideos de capa para virus específicos demilho (tendo os números de acesso CAA68566, AAP80681,AAA46637, e NP_619722) foram usadas para gerar a Tabela 4.Se a expressão do polipeptideo codificado pela molécula deácido nucléico compreendendo códons alterados é desejada emmilho, preferencialmente, são usados virus vegetais queinfectam milho para gerar as freqüências de uso de códon(como, e.g., nas Tabelas 3 e 4).Tabela 3: Freqüências de uso de códon de virus específicosde milho.
<table>table see original document page 17</column></row><table><table>table see original document page 18</column></row><table>Tabela 4: Freqüências de uso de códon de polipeptideo decapa de virus especifico de milho
<table>table see original document page 19</column></row><table><table>table see original document page 20</column></row><table>VÍRUS de planta dicotiledonea cgdon-tendenciado
Em alguns avanços, um virus vegetal ou vegetais queinfectam plantas dicotiledôneas são usados para gerarfreqüências de uso de códon. Como um exemplo nãolimitante, freqüências de uso de códon de virus de plantadicotiledonea foram determinada para 321 seqüênciascodificadoras de moléculas de ácidos nucléicos a partir devirus de planta dicotiledonea (listadas na Tabela 5) . ATabela 6 indica as freqüências de uso de códon determinadasa partir das seqüências codificadoras de moléculas deácidos nucléicos dos virus de dicotiledôneas listados naTabela 5. As freqüências de uso de códon de virus deplantas dicotiledôneas listadas na Tabela 6 podem serusadas para guiar a seleção de códons para desenho de umaseqüência codificadora de molécula de ácido nucléico devirus vegetal códon-tendenciado um polipeptideo para serexpressado em uma planta. Se a expressão do polipeptideocodificado pela molécula de ácido nucléico compreendendocódons alterados é desejada em uma planta dicotiledonea,são usados, preferencialmente, virus vegetais que infectamdicotiledôneas para gerar as freqüências de uso de códon(como, e.g., na Tabela 6) .
Em um avanço especifico, freqüências de uso de códonsão calculadas para um subgrupo das moléculas de ácidosnucléicos de um virus de planta dicotiledonea ou virus.Moléculas de ácidos nucléicos codificando polipeptideos decapa de um número de diferentes virus de plantasdicotiledôneas (listados na Tabela 7) foram usados paragerar a Tabela 8.
Em outro avanço específicos, freqüências de uso decódon são baseadas em um virus de planta dicotiledônea ouvirus que infectam um tipo especifico de plantadicotiledônea (e.g., soja). Se a expressão do polipeptideocodificado pela molécula de ácido nucléico compreendendocódons alterados é desejada em um tipo de planta emparticular (e.g., soja), são usados, preferencialmente,virus vegetais que infectam aquele tipo de planta (e.g.,virus específicos de soja) para gerar as freqüências de usode códon.
Tabela 5: Virus de Plantas Dicotiledônea e Número deSeqüências de Cada Usadas para o Cálculo de Freqüência deUso de Códon.<table>table see original document page 23</column></row><table>Tabela 6: Freqüências de Uso de Códon de Virus de PlantasDicotiledôneas.
<table>table see original document page 24</column></row><table><table>table see original document page 25</column></row><table>Tabela 7: Vírus de Plantas Dicotiledônea e Número deSeqüências de Polipeptideo de Capa de Cada Usadas para oCálculo de Freqüência de Uso de Códon.
<table>table see original document page 26</column></row><table><table>table see original document page 27</column></row><table>Tabela 8: Freqüências de Uso de Códon de Polipeptideo deCapa de Virus de Plantas Dicotiledôneas
<table>table see original document page 28</column></row><table><table>table see original document page 29</column></row><table>CRITÉRIOS PARA SELECIONAR CODONS
Uma vez que as freqüências de uso de códon sãocalculadas para o virus em particular, grupo de virus, ousubgrupo de moléculas de ácidos nucléicos desses, códonspodem ser escolhidos para uso como códons alterados usandouma variedade de critérios. Deveria ser considerado queexistem critérios adicionais que não são baseados emfreqüências de uso de códon que podem afetar o desenhofinal da molécula de ácido nucléico (ver Seção 5.3) .
CRITÉRIO DE VALOR DE FREQÜÊNCIA AUMENTADO
Em um avanço, qualquer códon que possui uma maiorfreqüência de uso no virus vegetal ou vegetais, ou subgrupode moléculas de ácidos nucléicos desses usadas para criar atabela de freqüência de uso de códon do que o códonatualmente na molécula de ácido nucléico a ser projetada, éescolhido como um códon alterado. Por exemplo, se umamolécula de ácido nucléico, a ser projetada de acordo comos métodos de virus vegetais códon-tendenciados dainvenção, tem uma alanina que é codificada pelo códon GCG,aquele códon poderia ser modificado para um códon que émais freqüentemente usado em virus vegetais. Usando, e.g.,Tabela 2, um especialista na arte pode ver que quaisqueroutros três códons para alanina (e.g., GCA, GCC, ou GCT)são mais freqüentemente usados em virus vegetais e, assim,poderiam ser usados como o códon alterado. Deveria serconsiderado que isto não é necessário para escolher o códonque é mais freqüentemente usado em virus vegetais como ocódon alterado. Ao invés, é apenas necessário que o códonalterado tenha uma freqüência de uso maior no virusvegetal, virus vegetais, ou moléculas de ácidos nucléicosdesses, do que o códon originalmente presente na moléculade ácido nucléico.
CRITÉRIO DO VALOR MEDIANO
Em outro avanço, um códon alterado tem uma freqüênciade uso de códon no virus vegetal, virus vegetais, oumoléculas de ácidos nucléicos desses usados para criar atabela de freqüência de uso de códon que é igual a ou maiordo que a freqüência de uso de códon mediana para aqueleaminoácido em particular. O valor mediano para freqüênciasde uso de códon para um dado tipo de aminoácido édeterminado primeiro, ordenando todos os códons quecodificam aquele códon de aminoácido particular dos maisfreqüentemente usados aos menos freqüentemente usados.
Para casos onde existe um número impar de códonscodificando um tipo de aminoácido em particular, afreqüência de uso de códon mediana é aquela que tem umnúmero igual de códons usados mais freqüentemente e menosfreqüentemente do que a próprio. Por exemplo, isoleucina écodificada por três códons. Para encontrar o valor medianode freqüências de uso de códon, deve-se encontrar o códoncom um número igual de códons usados mais freqüentemente emenos freqüentemente do que o próprio (nesse caso ATAquando usando as freqüências listadas na Tabela 2). Quandoprojetando uma molécula de ácido nucléico, códons alteradospoderiam ser selecionados com freqüências de uso de .3 oumaiores para isoleucina.
Para casos onde existe um número par de códonscodificando . um tipo de aminoácido em particular, afreqüência de uso de códon mediana é a média dasfreqüências de uso de códon para os dois códons que têm umnúmero igual de códons usados mais freqüentemente e menosfreqüentemente do que os próprios. Por exemplo, alanina écodificada por quatro códons. Para encontrar o valormediano de freqüências de uso de códon, deve-se ordenar oscódons do mais freqüentemente usado ao menos freqüentementeusado (nesse caso GCT, GCA, GCC, GCG quando usando asfreqüências listadas na Tabela 2) . Como GCA e GCC têm umnúmero igual de códons usados mais freqüentemente e menosfreqüentemente do que os próprios, a média de seus valoresde freqüência é a freqüência de uso de códon mediana (i.e.,a média de.31 e .21 é .26). Quando projetando uma moléculade ácido nucléico, códons alterados poderia serselecionados com freqüências de uso de .26 ou maiores paraalanina.
Esse método leva a seqüência codificadora da moléculade ácido nucléico à tendência em direção ao uso de códonsque são mais freqüentemente usados em seqüênciascodificadoras de moléculas de ácidos nucléicos de virusvegetais, apesar de não necessariamente o códon único maisfreqüentemente usado, enquanto minimizando o uso de códonsque são menos freqüentemente usados (i.e., aqueles cujafreqüência de uso de códon cai abaixo da freqüência de usode códon mediana para um dado tipo de aminoácido).
A Tabela 9 indica os valores medianos para asfreqüências de uso de códon de virus de plantasmonocotiledôneas listadas na Tabela 2 e os códons que seencaixam nesse critério para cada tipo de aminoácido(chamados códons selecionáveis) baseado em suas freqüênciasde uso.
A Tabela 10 indica os valores medianos para asfreqüências de uso de códon de virus especifico de milholistadas na Tabela 3 e os códons que se encaixam nessecritério para cada tipo de aminoácido baseado em suasfreqüências de uso.
A Tabela 11 indica os valores medianos para asfreqüências de uso de códon de capa de virus especifico demilho listadas na Tabela 4 e os códons que se encaixamnesse critério para cada tipo de aminoácido baseado em suasfreqüências de uso.
A Tabela 12 indica os valores medianos para asfreqüências de uso de códon de virus de plantasdicotiledôneas listadas na Tabela 6 e os códons que seencaixam nesse critério para cada tipo de aminoácido.Tabela 13 indica os valores medianos para asfreqüências de uso de códon de polipeptideo de capa devirus de dicotiledônea listadas na Tabela 8 e os códons quese encaixam nesse critério para cada tipo de aminoácidobaseado em suas freqüências de uso.
Tabela 9: Possíveis códons selecionáveis baseados emvalores medianos de freqüências de uso de códon de virus deplantas monocotiledôneas
<table>table see original document page 34</column></row><table><table>table see original document page 35</column></row><table><table>table see original document page 36</column></row><table><table>table see original document page 37</column></row><table><table>table see original document page 38</column></row><table>
Tabela 11: Possíveis códons selecionáveis baseados emvalores medianos de freqüências de uso de códon depolipeptideo de capa de virus especifico de milho
<table>table see original document page 38</column></row><table><table>table see original document page 39</column></row><table><table>table see original document page 40</column></row><table>Tabela 12: Possíveis códons selecionáveis baseados emvalores medianos de freqüências de uso de códon de virus deplantas dicotiledôneas
<table>table see original document page 41</column></row><table><table>table see original document page 42</column></row><table>Tabela 13: Possíveis códons selecionáveis baseados emvalores medianos de freqüências de uso de códon depolipeptideo de capa de virus de plantas dicotiledôneas
<table>table see original document page 43</column></row><table><table>table see original document page 44</column></row><table>CRITÉRIO DE CORRESPONDÊNCIA DE FREQÜÊNCIA
Em outro avanço, códons alterados são selecionados deforma que a molécula de ácido nucléico resultantecompreendendo códons alterados tenha uma freqüência de usopara um tipo de aminoácido em particular que seja a mesmaou substancialmente similar à freqüência de uso de códon novirus vegetal, virus vegetais, ou moléculas de ácidosnucléicos desses, usadas para criar a tabela de freqüênciade uso de códon (tais como, e.g., aquelas nas Tabelas 2, 3,4, 6, ou 8) para aquele aminoácido. Por exemplo, umamolécula de ácido nucléico projetada de acordo com osmétodos da invenção poderia compreender códons alterados deforma que todo de um aminoácido em particular (e.g.,glicina) seja codificado por códons em freqüências quesejam as freqüências de uso de códon de virus vegetal ousubstancialmente similares (usando, e.g., glicina da Tabela2 seria codificada por GGA, GGT, GGC, GGG a freqüências de.37, .28, .20, e .14, respectivamente).
Freqüências de uso de códon podem ser correspondidas,dessa maneira, para freqüências de uso de códon no virusvegetal, virus vegetais, ou moléculas de ácidos nucléicosdesses usadas para criar a tabela freqüência de uso decódon par um ou mais tipos de aminoácidos. Qualquer númerode tipos de aminoácidos pode ser alterado para ser a mesmaou freqüências de códon de virus vegetais substancialmentesimilares. Em avanços específicos, pelo menos 2 tipos deaminoácidos, pelo menos 5 tipos de aminoácidos, pelo menos8 tipos de aminoacidos, pelo menos 12 tipos de aminoacidos,pelo menos 18 tipos de aminoacidos, ou todo os 20 tipos deaminoacidos biologicamente ocorrentes são codificados porcódons que são a freqüência ou são substancialmentesimilares à freqüência ou mais virus vegetais ou umsubgrupo de moléculas de ácidos nucleicos desses.
CRITÉRIO DE LIMITE MÍNIMO
Em outro avanço, códons de virus vegetais para osquais a freqüência de uso no virus vegetal, virus vegetais,ou moléculas de ácidos nucleicos desses usada para criar afreqüência de uso de códon tabela é 0,09 ou menor, sãoeliminados como possíveis códons alterados. Esseprocedimento elimina de consideração códons para os quaisuma freqüência de uso em virus vegetais é muito baixa (0,09ou menos) e, assim, improvável de serem traduzidoseficientemente em plantas. Qualquer códon que codifique omesmo aminoácido com uma freqüência de uso maior que 0,09pode ser usado como um códon alterado para substituir ocódon de baixa freqüência. Em avanços específicos, Oscódons remanescentes com freqüências de uso maiores que0,09 são substituídos de uma maneira que mantenha aproporcionalidade entre os códons remanescentes.
A Tabela 14 mostra freqüências de uso de códon paravirus de plantas monocotiledôneas onde aqueles códons comfreqüências de 0,09 ou menos(de acordo com a Tabela 2)foram eliminados e os códons remanescentes foram ajustadosproporcionalmente para cada tipo de aminoácido.
A Tabela 15 apresenta freqüências de uso de códon paraos polipeptideos de capa de virus especifico de milho ondeaqueles códons com freqüências de 0,09 ou menos (de acordocom a Tabela 4) foram eliminados e os códons remanescentesforam ajustados proporcionalmente para cada tipo deaminoácido.
A Tabela 16 apresenta freqüências de uso de códon paraos virus de plantas dicotiledôneas onde aqueles códons comfreqüências de 0,09 ou menos (de acordo com a Tabela 6)foram eliminados e os códons remanescentes foram ajustadosproporcionalmente para cada tipo de aminoácido.
A Tabela 17 shows freqüências de uso de códon para ospolipeptideos de capa de virus de plantas dicotiledôneasonde aqueles códons com freqüências de 0,09 ou menos (deacordo com a Tabela 8) foram eliminados e os códonsremanescentes foram ajustados proporcionalmente para cadatipo de aminoácido.
Por exemplo, na Tabela 14, existe um único códon, parao aminoácido arginina, CGG, para o qual a freqüência de usode códon original não é maior do que 0,09. A freqüência deuso de códon para CGG é, portanto, ajustada para 0,00, e ovalor de 0,09 é redistribuído entre as freqüências doscódons AGA, AGG, CGA, CGC, e CGT remanescentes, naproporção de suas freqüências de uso de códon originais,como indicado. Todas as freqüências de uso de códon paraseqüências codificadoras de moléculas de ácidos nucléicosde virus especifico de milho listadas na Tabela 3 sãomaiores do que 0,09, e, portanto, as freqüências de uso decódon para seqüências codificadoras de moléculas de ácidosnucléicos de virus específicos de milho permanece a mesmasob o critério de 0,09.
Tabela 14: Freqüências de uso de códon de virus de plantamonocotiledônea após eliminar códons com uma freqüência deuso de < 0.09 e ajustar, proporcionalmente, as freqüênciasde uso de códon remanescentes.
<table>table see original document page 48</column></row><table><table>table see original document page 49</column></row><table><table>table see original document page 50</column></row><table><table>table see original document page 51</column></row><table><table>table see original document page 52</column></row><table>
Tabela 16: Freqüências de uso de códon de vírus de plantasdicotiledôneas, após eliminar códons com uma freqüência deuso de < 0,09 e ajustar, proporcionalmente, as freqüênciasde uso de códon remanescentes.<table>table see original document page 53</column></row><table><table>table see original document page 54</column></row><table>
Tabela 17: Freqüências de uso de códon de capa de virus deplantas dicotiledôneas, após eliminar códons com umafreqüência de uso de < 0,09 e ajustar, proporcionalmente,as freqüências de uso de códon remanescentes.<table>table see original document page 55</column></row><table><table>table see original document page 56</column></row><table>CRITÉRIO DE CORTE DE LIMITE MEDIANO
Em outro avanço, códons de virus vegetais para osquais a freqüência de uso no virus vegetal, virus vegetais,ou moléculas de ácidos nucléicos desses, usada para criar atabela de freqüência de uso de códon é menor do que afreqüência de uso de códon mediana, são eliminados comopossíveis códons alterados (ver Seção 5.2.2 para cálculo dafreqüência de uso mediana). Qualquer códon que codifique omesmo aminoácido com uma freqüência de uso igual ou maiordo que a mediana para aquele aminoácido em particular podeser usado como um códon alterado para substituir o códon.Em avanços específicos, os códons remanescentes comfreqüências de uso iguais ou maiores do que a mediana sãosubstituídos de uma maneira que mantenha aproporcionalidade entre os códons remanescentes.
A Tabela 18 mostra freqüências de uso de códon paravirus de plantas monocotiledôneas, onde aqueles códons comfreqüências menores que a mediana (de acordo com a Tabela
2) foram eliminados e os códons remanescentes foramajustados proporcionalmente para cada tipo de aminoácido.
A Tabela 19 mostra freqüências de uso de códon para osvirus específicos de milho, onde aqueles códons comfreqüências menores que a mediana (de acordo com a Tabela
3) foram eliminados e os códons remanescentes foramajustados proporcionalmente para cada tipo de aminoácido.A Tabela 20 mostra freqüências de uso de códon para ospolipeptideos de capa de virus específicos de milho, ondeaqueles códons com freqüências menores que a mediana (deacordo com Tabela a 4) foram eliminados e os códonsremanescentes foram ajustados proporcionalmente para cadatipo de aminoácido.
A Tabela 21 mostra freqüências de uso de códon paravirus de plantas dicotiledôneas, onde aqueles códons comfreqüências menores que a mediana (de acordo com a Tabela6) foram eliminados e os códons remanescentes foramajustados proporcionalmente para cada tipo de aminoácido.
A Tabela 22 mostra freqüências de uso de códon para ospolipeptideos de capa de virus de dicotiledônea, ondeaqueles códons com freqüências menores que a mediana (deacordo com a Tabela 8) foram eliminados e os códonsremanescentes foram ajustados proporcionalmente para cadatipo de aminoácido.
Tabela 18: Freqüências de uso de códon de virus de plantamonocotiledônea, após eliminar códons com uma freqüência deuso menor do que a mediana e ajustar, proporcionalmente, asfreqüências de uso de códon remanescentes.
<table>table see original document page 58</column></row><table><table>table see original document page 59</column></row><table><table>table see original document page 60</column></row><table>Tabela 19: Freqüências de uso de códon de virus de milho,após eliminar códons com uma freqüência de uso menor do quea mediana e ajustar, proporcionalmente, as freqüências deuso de códon remanescentes.
<table>table see original document page 61</column></row><table><table>table see original document page 62</column></row><table><table>table see original document page 63</column></row><table>
Tabela 20: Freqüências de uso de códon de capa de virus demilho, após eliminar códons com uma freqüência de uso menordo que a mediana e ajustar, proporcionalmente, asfreqüências de uso de códon remanescentes.
<table>table see original document page 63</column></row><table><table>table see original document page 64</column></row><table><table>table see original document page 65</column></row><table>Tabela 21: freqüências de uso de códon de vírus de plantasdicotiledôneas, após eliminar códons com uma freqüência deuso menor do que a mediana e ajustar, proporcionalmente, asfreqüências de uso de códon remanescentes.
<table>table see original document page 66</column></row><table><table>table see original document page 67</column></row><table><table>table see original document page 68</column></row><table><table>table see original document page 69</column></row><table><table>table see original document page 70</column></row><table>MODIFICAÇÕES NÃO BASEADAS EM VÍRUS VEGETAL CÓDON-TENDENCIADO
No desenho de seqüências codificadoras de moléculas deácidos nucléicos códon-tendenciadas de virus vegetais deacordo com a presente invenção, após a seleção de códonbaseada nos critérios ilustrados acima, modificações deseqüência de nucleotideos adicionais pode ser feitas parai) diminuir uma característica desfavorável da molécula deácido nucléico e/ou ii) aumentar mais a expressão de umpolipeptideo codificado por uma seqüência codificadora damolécula de ácido nucléico códon-tendenciada de virusvegetal. Assim, apesar das moléculas de ácidos nucléicosprojetadas usando os métodos da invenção poderem nãocompreender todos os códons otimizados devido aconsiderações listadas abaixo, elas serão enriquecidas emcódons que são mais freqüentemente usados em virus vegetaisdo que uma molécula de ácido nucléico não-alterada.
Preferencialmente, a modificação não baseada emcódon-tendenciado não altera qualquer aminoácido que sejacodificado pela molécula de ácido nucléico. Em avançosonde um aminoácido é modificado devido a modificações nãobaseadas em códon-tendenciado. na molécula de ácidonucléico, tal mudança deveria, preferencialmente, manterpelo menos algumas das propriedades do aminoácido original(e.g., carga, tamanho, etc.)Em um avanço, o contexto Kozak é modificado. 0contexto Kozak é a seqüência de nucleotideos próxima docódon ATG de iniciação. Em milho e vários cereais, ocontexto Kozak preferido é ATGG. Essa quarta base daseqüência codificadora da molécula de ácido nucléico éditada pelo segundo aminoácido codificado. Se já presente,nenhuma mudança é necessária. Para criar um contexto KozakATGG (otimização Kozak) se ele não existe, contudo, poderequerer uma mudança no segundo aminoácido. Empolipeptideos que são processados no terminal N, tais comotendo seu peptideo de trânsito de terminal N removido, issonão afetaria a função do polipeptideo maduro. A abordagempreferida é mudar o segundo aminoácido para um que tenha umcódon G inicial, e que seja o mais quimicamente similardentre tais aminoácidos como códons G iniciais, contudo emavanços nos quais o segundo aminoácido é alterado isso éimportante para se ter certeza de que o polipeptideoretenha propriedades criticas (e.g. atividade enzimática,antigenicidade, etc.).
Em outro avanço, seqüências tipo intron criadas poradição dos códons alterados são abolidas. Quandoselecionando códons para uma seqüência codificadora damolécula de ácido nucléico de virus vegetal códon-tendenciado, pode-se inadvertidamente introduzir uma oumais seqüências intrônicas potencialmente funcionais. Naexpressão do transcrito codificado nas células, essesintrons podem ser cortados, causando uma deleção interna deuma porção da região codificadora ou deslocamento de quadrode leitura. Conseqüentemente, é desejável eliminarquaisquer sitios que são altamente prováveis de seremintrônicas. Sitios intron splice-doadores geralmenteseguem a regra GT-AG. Em uma dada seqüência codificadorada molécula de ácido nucléico, é provável de existiremvários sitios GT e AG e, assim, vários introns empotencial. Contudo, nem todas essas combinações GT-AG sãoprováveis de revelar um intron funcional.
Software de previsão gênica foi desenvolvido de formaa usar sofisticados heurísticos para decidir quais sequaisquer combinações GT-AG em potencial representamprováveis sitios intron splice-doadores. Ver, por exemplo,Brendel et al. (2004) Bioinformatics. 20(7):1157-69;Hermann et al. (1996) Nucl. Acids Res. 24(23): 4709-4718;Brendel et al. (1998) Nucl. Acids Res. 26(20): 4748-4757;üsuka et al. (2000) Bioinformatics 16(3), 203-211; Usuka etal. (2000) J. Mol. Biol. 297(5): 1075-1085, aquiincorporados por referência. Programas, tal como GeneSeqr,são particularmente úteis. GeneSeqr foi desenvolvido porVolker Brendel na ISU. O resultado do programa GeneSeqrindica se existem qualquer sitios intron altamenteprováveis na seqüência codificadora da molécula de ácidonucléico. Informações acerca do programa GeneSeqr a ainterpretação de seu resultado podem ser encontrados naarte (e.g., Schlueter et al., 2003, Nucl. Acids Res.31:3597-3600). Outro programa que pode ser usado para essepropósito é FgenesH. Usar mais do que uma eliminação deprograma de todos os sitios splice criticos é maisprovável. Remover esses introns em potencial pode serfeito mudando-se tanto as seqüências GT ou AG adjacentesaos introns. Isso pode ser feito de tal maneira, sepossível, de forma a não afetar o uso de aminoácidos.
Outra abordagem para efetuar a remoção desses sitios splicecriticos é mudar nucleotideos adjacentes no lado intrônicoputativo das fronteiras de sitios splice criticos.
Em outro avanço, seqüências que codificam um sinalputativo de poliadenilação são modificadas para prevenirpoliadenilação espuriosa na seqüência codificadora damolécula de ácido nucléico. Tais sitios incluem asseguintes seqüências: AATAAA, ATAAAA, e AATAAT.
Em outro avanço, estruturas de RNA secundário sãodiminuídas ou eliminadas. Transcritos que formamestruturas de RNA hairpin podem ser mais prováveis de seremvisadas para degradação e/ou captura de tradução.
Conseqüentemente, é desejável sujeitar a seqüênciacodificadora da molécula de ácido nucléico a um programa deprevisão de estrutura secundária de RNA e, então, romperquaisquer estruturas de RNA previstas por serem nãousualmente estáveis por alterar a seqüência. Qualquerprograma de previsão de estrutura secundária de RNAconhecido na arte pode ser usado. Um programa comumenteusado é o pacote de programa STEMLOOP da GCG Wisconsin.
Esse programa é desejável porque ele ranqueia as estruturasstem-loop da maior para a menor probabilidade de formar umestrutura secundária (essencialmente a partir decomprimento e qualidade) , e fornece suas coordenadas naseqüência. Dentre os resultados de saida, deve-se olharpor quaisquer estruturas previstas de RNA destacadas quesão incomumente longas e de alta qualidade. Essas devemser rompidas por trocas de base, freqüentemente na terceiraposição (posição "wobble") de códons, de forma a não mudasa seqüência de aminoácidos.
Em outro avanço, seqüências que diminuem aestabilidade de RNA são modificadas. Certos motivos deseqüência são conhecidos por desestabilizar o RNAm e são,portanto, apontadas e eliminadas onde possivel. Em umavanço especifico, seqüências "AUUUA" podem levar a umataxa aumentada de degradação de RNAm. Sendo assim, asseqüências codificadoras de moléculas de ácidos nucléicosde virus vegetal códon-tendenciado da invenção podem serprocuradas por quaisquer seqüências que são "ATTTA", eessas podem ser alteradas sem mudar a seqüência deaminoácidos, se possivel.
Em outro avanço especifico, a presença de sitios de"Elemento Abaixo" ("Downstream Element") (DST)desestabilizantes de RNAm pode dispor transcritos de RNAmna direção de degradação e alta renovação. Os elementosDST seguem o padrão geral de ATAGAT-N(15)-GTA. Seqüênciasseguindo o padrão ATAGAT-N(10-20)-GTA podem ser eliminadas.
Em outro avanço especifico, seqüências poli-A ou poli-T longas podem contribuir para instabilidade de RNAm.Conseqüentemente, trechos longos de um nucleotídeo,especialmente trechos longos de As ou Ts, deveriam seralterados. Trechos de três ou mais do mesmo nucleotideosão apontados para mitigação, contudo, maispreferencialmente, trechos de quatro ou mais sãomodificados. Adicionalmente, trechos de seqüências ricasem AT podem ser também modificados.
Em outro avanço, a molécula de ácido nucléico émodificada de forma que o polipeptideo de interesse é oúnico polipeptideo expressados a partir da molécula deácido nucléico. É desejável que um transgene expresseapenas o produto gênico desejado a partir do quadro deiniciação de leitura desejado (ORF), o qual será o quadrode tradução 1. Produtos polipeptidicos espuriosos surgindode qualquer das outras 5 traduções de quadro não sãodesejados, portanto a molécula de ácido nucléico dainvenção pode ser alterada de forma que a possibilidade detradução espuriosa de ORF é mitigada. A molécula de ácidonucléico projetada usando os métodos da invenção é sujeitaa uma análise de previsão de ORF de 6-quadros. Oscomprimentos dos ORFs nos cinco quadros não pretendendocodificar um polipeptideo podem ser medidos. Aqueles ORFs,particularmente aqueles com códon de inicio potencial demetionina (i.e. próximo à seqüência consenso de Kozak) eaqueles nos quadros 2 e 3 que são particularmente longos(tal como mais longos do que 50-100 códons ou qualquer queseja o limite de corte desejado) deveriam ser encurtadospor introdução de códons de parada ou remoção de códons deiniciação potenciais.
Em outro avanço, sitios de reconhecimento de enzima derestrição podem ser adicionados à molécula de ácidonucleico.
DESENHO DE MOLÉCULAS DE ÁCIDOS NUCLÉICOS CÓDON-TENDENCIADAS
A presente invenção engloba moléculas de ácidosnucléicos projetadas de acordo com os métodos da invenção.Moléculas de ácidos nucléicos codificando polipeptideos deinteresse para expressão em plantas podem ser projetadaspara expressão melhorada em plantas de acordo com osmétodos da presente invenção. Uma vez que as tabelas defreqüência de uso de códon são geradas para o virus emparticular, grupo de virus, ou subgrupo de moléculas deácidos nucléicos desses, de interesse, os códonsoriginalmente presentes na molécula de ácido nucleico podemser avaliados por seus valores de freqüência se comparado avirus vegetais. Os critérios de acordo com a Seção 5.2 sãousados para escolher quais códons podem ser modificados equais códons podem ser substituídos (e.g., códonsalterados) por eles. Moléculas de ácidos nucléicoscompreendendo códons alterados incluem 5%, 10%, 20%, 30%,50%, 75%, 85%, 95% de códons alterados relativo à moléculade ácido nucleico inalterada (original). Contudo,freqüências de uso de códon não são o critério único paramodificação de molécula de ácido nucleico (ver Seção 5.3).
Qualquer códon na molécula de ácido nucleico pode sersubstituído por um códon alterado que tenha uma maiorfreqüência de uso em virus vegetais. Em alguns avanços, oscódons alterados são "carregados anteriormente", i.e., onúmero de códons alterados é maior na primeira porção damolécula de ácido nucleico do que na segunda porção damolécula de ácido nucleico, caracterizado pelo fato de quea primeira porção está 5' à segunda porção. Em um avançomais especifico, a primeira porção e segunda porção damolécula de ácido nucleico são iguais, assim, existem maiscódons alterados na metade 5' da molécula de ácidonucleico. Em outro avanço especifico, a primeira porção éum terço da molécula de ácido nucleico e compreende umnúmero igual ou mais códons alterados do que a segundaporção que é dois terços da molécula de ácido nucleico.Assim, o terço 5' da molécula de ácido nucleico tem o mesmonúmero ou mais de códons alterados do que os dois terços3'. Em outro avanço especifico, a primeira porção é umquarto da molécula de ácido nucleico e compreende um númeroigual ou mais códons alterados do que a segunda porção queé três quartos da molécula de ácido nucleico. Assim, oquarto 5' da molécula de ácido nucleico tem o mesmo númeroou mais códons alterados do que os três quartos 3'.
Preferencialmente, moléculas de ácidos nucléicoscompreendendo códons al terados codificam um polipeptideocom uma seqüência que idêntica àquela de um polipeptideocodificado por uma molécula de ácido nucléico inalterada.
Em avanços onde a molécula de ácido nucléico compreendendocódons alterados codifica um polipeptideo que não éidêntico em seqüência a um polipeptideo inalterado, osaminoácidos alterados são preferencialmente substituiçõesconservativas. Técnicas padrão conhecidas daquelesespecialistas na arte pode ser usadas para testar quaisquerdiferenças em função do polipeptideo entre um polipeptideocom substituições de aminoácidos devido a alteração decódon e um polipeptideo codificado por uma molécula deácido nucléico inalterada. Preferencialmente, não existemmudanças na função do polipeptideo. Contudo, alteraçõesleves em função são toleráveis se tais polipeptideos têmfunções substancialmente similares (e.g., estão no desviopadrão um do outro).
Em um avanço especifico, as moléculas de ácidosnucléicos da invenção codificam polipeptideos inseticidas.
Em um avanço mais especifico, os polipeptideos inseticidassão de Bacillus thuringiensis ou Rhyzopus oryzae. Em umavanço ainda mais especifico, os polipeptideos inseticidasde Bacillus thuringiensis são os polipeptideos 437N e Cry.
Em outro avanço mais especifico, o polipeptideo inseticidade Rhyzopus oryzae é um polipeptideo lipase inseticida. Apresente invenção engloba moléculas de ácidos nucléicosprojetadas de acordo com os métodos incluindo, mas nãolimitando-se a, SEQ ID NOS: 1 e 3 que codificam 437N códonotimizado e lipase inseticida, respectivamente.Polipeptideos codificado pelas moléculas de ácidosnucléicos da invenção são também englobados pela invençãoincluindo, mas não limitando-se a, SEQ ID NOS:2 e 4 que são437N códon otimizado e lipase inseticida , respectivamente.
Também englobados pela presente invenção são vetores,células hospedeiras, plantas transgênicas e progênie dessacompreendendo moléculas de ácidos nucléicos feitas deacordo com os métodos da invenção.
A presente invenção não engloba moléculas de ácidosnucléicos que codificam moléculas de ácidos nucléicosnaturalmente ocorrentes (e.g., aquelas encontradas nanatureza e expressadas a partir dos genomas de organismosnão transgênicos). A presente invenção também não englobamoléculas de ácidos nucléicos das SEQ ID NOS: 7-16.
CONSTRUÇÃO DE MOLÉCULAS DE ÁCIDOS NUCLÉICOS CODON-TENDENCIADAS
As moléculas de ácidos nucléicos a serem alteradas deacordo com os métodos da invenção podem ser obtidas, e suaseqüência de nucleotideos determinadas, por qualquer métodoconhecido na arte. Tal molécula de ácido nucléico pode serreunida a partir de oligonucleotideos quimicamentesintetizados (e.g., como descrito em Kutmeier et al., 1994,BioTechniques 17:242), que, resumidamente, envolve asintese de oligonucleotideos sobrepostos contendo porçõesda seqüência codificando o polipeptideo, recozimento eligação daqueles oligonucleotideos e, então, amplificaçãodos oligonucleotideos ligados por PCR. Alternativamente,uma molécula de ácido nucléico pode ser gerada a partir damolécula de ácido nucléico de uma fonte adequada. Se umclone contendo uma molécula de ácido nucléico codificandoum polipeptideo em particular não está disponível, mas aseqüência do polipeptideo é conhecida, uma molécula deácido nucléico codificando o polipeptideo pode sersintetizada quimicamente ou obtida de uma fonte adequada(e.g., uma biblioteca de DNAc gerada do, ou molécula deácido nucléico, preferencialmente RNA, poli A+, isolado de,qualquer tecido ou células expressando o polipeptideo deinteresse) por amplificação por PCR usando primerssintéticos hibridizáveis às extremidades 3' e 5' daseqüência ou por clonagem usando uma sonda deoligonucleotideo especifica para a seqüência em particularpara identificar, e.g., um clone de DNAc de uma bibliotecade DNAc que codifica o polipeptideo de interesse.
Moléculas de ácidos nucléicos amplificadas geradas por PCRpodem, então, ser clonadas em vetores de clonagemreplicáveis usando qualquer método nem conhecido na arte.
Uma vez que a molécula de ácido nucléico é contida,ela pode ser manipulada usando métodos bem conhecidos naarte para a manipulação de seqüências de nucleotideos,e.g., técnicas de DNA recombinante, mutagênese sitio-direcionada, PCR, etc. (ver, por exemplo, as técnicasdescritas em Sambrook et al., 1990, Molecular Cloning, ALaboratory Manual, 2d Ed., Cold Spring Harbor Laboratory,Cold Spring Harbor, NY; Ausubel et al., eds., 1998, CurrentProtocols irr Molecular Biology, John Wiley & Sons, NY; U.S.Patent Nos: 5.789.166 e 6.391.548) para gerar as moléculasde ácidos nucléicos compreendendo códons alterados.
Técnicas padrão conhecidas daqueles especialistas na artepodem ser usadas para introduzir mutações na seqüência denucleotideos, ou fragmento, dessas, . incluindo, e.g.,mutagênese sitio-direcionada e mutagênese mediada por PCR,de forma que códons são alterados para aqueles códons tendouma freqüência maior de uso em virus vegetais.
Preferencialmente, as moléculas de ácidos nucléicoscompreendendo códons alterados incluem 5%, 10%, 20%, 30%,50%, 75%, 85%, 95% de códons alterados relativo à moléculade ácido nucléico inalterada (original).
Preferencialmente, moléculas de ácidos nucléicoscompreendendo códons alterados codificam um polipeptideocom uma seqüência que é idêntica àquela de um polipeptideocodificado por uma molécula de ácido nucléico inalterada.
Em avanços onde a molécula de ácido nucléico compreendendocódons alterados codifica um polipeptideo que não idênticoem seqüência a um polipeptideo inalterado, os aminoácidosalterados são preferencialmente substituiçõesconservativas. Técnicas padrão conhecidas daquelesespecialistas na arte pode ser usadas para testar quaisquerdiferenças na função de polipeptideo entre um polipeptideocom substituições de aminoácidos devido a alteração decódon e um polipeptideo codificado por uma molécula deácido nucléico inalterada. Preferencialmente, não existemmudanças na função do polipeptideo. Contudo, alteraçõesleves em função são toleráveis se tais polipeptideos têmfunções substancialmente similares (e.g., estão no desviopadrão um do outro).
Uma vez que a molécula de ácido nucléico foi projetadae obtida, um vetor compreendendo a molécula de ácidonucléico pode ser produzido por tecnologia de DNArecombinante usando técnicas bem conhecidas na arte.Métodos que são bem conhecidos daqueles especialistas naarte podem ser usados para construir vetores, incluindovetores de expressão, contendo moléculas de ácidosnucléicos compreendendo códons alterados operacionalmenteligados a sinais de controle de transcrição e traduçãoapropriados.
Em alguns avanços, moléculas de ácidos nucléicos dainvenção estão em vetores de expressão. Em outros avanços,moléculas de ácidos nucléicos da invenção estão em vetoresfeitos para facilitar a integração no DNA vegetal. Vetorescompreendendo moléculas de ácidos nucléicos da invençãopodem compreender, também aquelas regiões que iniciam outerminam a transcrição e/ou tradução. Os elementos dessasregiões podem ser naturalmente ocorrentes (tantoheterólogos ou nativos à célula vegetal hospedeira) ousintéticos.
Um número de promotores pode ser usado na prática dainvenção. Por exemplo, uma molécula de ácido nucléico dainvenção pode ser combinada com promotores constitutivos,preferenciais de tecido, induzidos, ou outros promotorespara expressão no organismo hospedeiro. Em um avanço, opromotor é um promotor constitutivo incluindo, mas nãolimitando-se ao, promotor núcleo do promotor Rsyn7 e outrospromotores constitutivos descritos em WO 99/43838 e U.S.Patent No. 6.072.050; o promotor núcleo CaMV 35S (Odell etal. (1985) Nature 313:810-812); de. actina de.arroz (McElroyet al. (1990) Plant Cell 2:163-171); ubiquitina(Christensen et al. (1989) Plant Mol. Biol. 12:619-632 eChristensen et al. (1992) Plant Mol. Biol. 18:675-689);pEMU (Last et al. (1991) Theor. Appl. Genet. 81:581-588);MAS (Velten et al. (1984) EMBO J. 3:2723-2730); promotorALS (U.S. Patent No. 5.659.026), e similares. Outrospromotores constitutivos incluem, por exemplo, aquelesdiscutidos nas U.S. Patent Nos. 5.608.149; 5.608.144;5.604.121; 5.569.597; 5.466.785; 5.399.680; 5.268.463;5.608.142; e 6.177.611.
Em outro avanço, o promotor é um promotor induzidoincluindo, mas não limitando-se a, promotores induzidospor ferimento (tais como aqueles promotores associados com,e.g., gene inibidor de polipeptidase de batata, wunl, wun2,winl, win2, sistemina, WIP1, gene MPI); promotoresinduzidos por patógenos (tais como aqueles promotoresassociados com, e.g., polipeptideos relacionados compatogêneses, polipeptideos SAR, beta-1,3-glucanase,quitinase, gene PRms (ver Redolfi et al. (1983) Neth. J.Plant Pathol. 89:245-254; Uknes et al. (1992) Plant Cell4:645-656; e Van Loon (1985) Plant Mol. Virol. 4:111-116,WO 99/43819, Cordero et al. (1992) Physiol. Mol. PlantPath. 41:189-200, U.S. Patent No. 5.750.386)); promotoresregulados quimicamente (tais como aqueles promotoresassociados com, e.g., promotor In2-de milho, promotor GSTde milho, promotor PR-la de tabaco (ver também Schena etal. (1991) Proc. Natl. Acad. Sei. USA 88:10421-10425;McNellis et al. (1998) Plant J. 14 (2):247-257); Gatz et al.(1991) Mol. Gen. Genet. 227:229-237, e U.S. Patent Nos.5.814.618 e 5.789.156)).
Em outro avanço, o promotor é um promotor tecidopreferencial incluindo, mas não limitando-se a, aquelesdescritos em Kawamata et al. (1997) Plant Cell Physiol.38 (7) :792-803; Hansen et al. (1997) Mol. Gen Genet.254(3):337-343; Russell et aí. (1997) Transgenic Res.6(2) :157-168; Rinehart et al. (1996) Plant Physiol.112(3):1331-1341; Van Camp et al. (1996) Plant Physiol.112(2):525-535; Canevascini et al. (1996) Plant Physiol.112(2):513-524; Yamamoto et al. (1994) Plant Cell Physiol.35 (5) :773-778; Lam (1994) Results Probl. Cell Differ.20:181-196; Orozco et al. (1993) Plant Mol Biol.23 (6) : 1129-1138; Matsuoka et al. (1993) Proc Natl. Acad.Sei. USA 90(20):9586-9590; and Guevara-Garcia et al. (1993)Plant J. 4(3):495-505.
Em outro avanço, o promotor é um tecido preferencialpromoter incluindo, mas não limitando-se a, promotoresespecíficos para folha (Yamamoto et al. (1997) Plant J.(2) :255-265; Kwon et al. (1994) Plant Physiol. 105:357-67; Yamamoto et al. (1994) Plant Cell Physiol. 35(5):773-778; Gotor et al. (1993) Plant J. 3:509-18; Orozco et al.(1993) Plant Mol. Biol. 23 (6) :1129-1138; e Matsuoka et al.(1993) Proc. Natl. Acad. Sei. USA 90 (20) :9586-9590); raiz(Hire et al. (1992) Plant Mol. Biol. 20(2):207-218, Kellerand Baumgartner (1991) Plant Cell 3 (10) :1051-1061, Sangeret al. (1990) Plant Mol. Biol. 14 (3) : 433-443, Miao et al.
(1991) Plant Cell 3(l):ll-22, Bogusz et al. (1990) PlantCell 2 (7) : 633-641, Kuster et al. (1995) Plant Mol. Biol.29 (4) :759-772, Capana et al. (1994) Plant Mol. Biol.25 (4):681-691, U.S. Patent Nos. 5.837.876; 5.750.386;5.633.363; 5.459.252; 5.401.836; 5.110.732; e 5.023.179);semente (incluindo aqueles promotores de, e.g., Ciml,CZ19B1, mio-inositol-l-fosfato sintase, Gama-zeina, Glob-1,celA, p-faseolina de feijão, napina, p-conglicinina,lectina de soja, cruciferina, zeina de 15 kDa de milho,zeina de 22 kDa, zeina de 27 kDa, g-zeina, cerósa, shrunken1, shrunken 2, e globulina 1 (ver também Thompson et al.(1989) BioEssays 10:108, WO 00/12733, WO 00/11177)).
Em outro avanço, o promotor é um promotor de baixonivel de expressão (e.g., causa expressão de cerca de1/1000 transcritos a cerca de 1/100,000 transcritos a cercade 1/500,000 transcritos) incluindo, mas não limitando-sea, WO 99/43838, U.S. Patent No. 6.072.050, U.S. Patent Nos.5.608.149; 5.608.144; 5.604.121; 5.569.597; 5.466.785;5.399.680; 5.268.463; 5.608.142; e 6.177.611.
POLIPEPTÍDEOS DA INVENÇÃOQualquer polipeptideo conhecido na arte pode serexpressado em uma planta usando os métodos da presenteinvenção para projetar a molécula de ácido nucléicocodificando o polipeptideo. 0 polipeptideo pode ocorrer nanatureza, ser uma modificação feita pelo homem de umpolipeptideo naturalmente ocorrente, se um polipeptideo queé projetado totalmente de novo, ou qualquer combinaçãodessa. Em avanços preferidos, expressão do polipeptideocodificado por uma molécula de ácido nucléico da presenteinvenção altera pelo menos um fenótipo da plantaexpressando o polipeptideo. Em avanços específicos, ofenótipo da planta expressando o polipeptideo é alterado secomparado à planta controle. A planta controle tanto i)não contém e/ou expressa a molécula de ácido nucléicocodificando o polipeptideo de interesse ou ii) contém e/ouexpressa a molécula de ácido nucléico codificandopolipeptideo de interesse, mas não compreende quaisquercódons alterados.
Exemplos de fenótipos que podem ser alterados porexpressão de um polipeptideo codificado por uma molécula deácido nucléico da invenção incluindo, mas não limitando-sea: resistência/tolerância a insetos (e.g., expressandopolipeptideos de Bacillus 437N ou Cry ou polipeptideoslipase inseticidas de Rhyzopus), resistência/tolerância adoenças (e.g., expressando Pps-AMPl),
resistência/tolerância a nematódeos (e.g., expressandociclostina), resistência/tolerância a seca (e.g.,expressando IPT), tolerância a sal, tolerância a metalpesado e desintoxicação, resistência/tolerância aherbicidas (e.g., expressando glifosato acetil transferaseou acetolactato sintase), baixo conteúdo de fitato, uso denitrogênio de alta eficiência, incremento à produção,estabilidade de produção aumentada, conteúdo nutricionalaumentado, conteúdo de açúcar aumentado, crescimento evigor aumentados, digestibilidade aumentada, expressão depolipeptideos terapêuticos, sintese de farmacêuticos nãopolipeptidicos, expressão de polipeptideos marcadores deseleção (e.g., GAT), expressão de polipeptideo repórter(e.g., GUS), e esterilidade de machos.
Em um avanço especifico, polipeptideos inseticidascodificados por moléculas de ácidos nucléicos de virusvegetais códon-tendenciados são de Bacillus thuringiensisou Rhyzopus oryzae. Em um avanço mais especifico, opolipeptideo inseticida de Bacillus thuringiensis é opolipeptideo 437N ou CRY. Em outro avanço maisespecifico, o polipeptideo de Rhyzopus oryzae é opolipeptideo lipase inseticida.
PLANTAS
Moléculas de ácidos nucléicos projetadas usandométodos da presente invenção podem ser usadas paratransformação de qualquer espécie de planta, incluindo, masnão limitando-se a, monocotiledôneas e dicotiledôneas.Exemplos de plantas de interesse incluem, mas não sãolimitados a, milho(Zea mays), Brassica sp. (e.g., B. napus,B. rapa, B. juncea), particularmente aquelas espécies deBrassica úteis como fontes de óleo de semente, alfafa(Medicago sativa), arroz (Oryza sativa), centeio (Secalecereale), sorgo (Sorghum bicolor, Sorghum vulgare) , milhete(e.g., milheto (Pennisetum glaucum), painço {Panicummiliaceum), painço português (Setaria itálica), capim{Eleusine coracana)), girassol [Helianthus annuus), cártamo(Carthainus tinctorius) , trigo (Triticum aestivura) , soja(Glycine max), tabaco (Nicotiana tabacum), batata {Solanumtuberosum), amendoins (Arachis hypogaea), algodão (Gossypiumbarbadense, Gossypium hirsutum), palma {Elaeis guinnesis),linho {Linum uistatissimum), ricino {Ricinus communis),guar (Athamantha sícula), lentilha (Lens culinaris),fenugreek (Trigonella corniculata), batata-doce (Ipomoeabatatus) , mandioca [Manihot esculenta) , café (Cor"f"ea spp. ) ,coco [Cocos nucifera) , abacaxi (Arianas comosus) , árvorescitricas (Citrus spp.), cacau (Theobroma cacao), chá{Camellia sinensis), banana {Musa spp.), abacate (Perseaamericana), figo {Ficus casica), goiaba (Psidium guajava),manga {Mangifera indica), azeitona (Olea europaea), mamão-papaia (Carica papaya) , caju (Anacardiu/n occidentale) ,macadâmia (Macadamia integrifolia) , amêndoa {Prunusamygdalus), beterraba (Beta vuigaris), cana-de-açúcar(Saccharum spp.), aveia, cevada, verduras e legumes,ornamentais, e coniferas.
Exemplos de verduras e legumes incluem, mas não sãolimitados a, tomates {Lycopersicon esculentum), repolho(e.g., Lactuca sativa), feijões {Phaseolus vulgaris,Phaseolus limensis e Ceratonia siliqua), ervilhas {Lathyrusspp.), caupi (Vigna unguiculata) , feijão-mungo {Vignaradiata), fava {Vicia faba) , grão-de-bico (Cicerarietinum), e membros do gênero Cucumis, tais como pepino(C. sativus), cantalupo (C. cantalupensis), e melão (C.melo).
Exemplos de ornamentais incluem, mas não são limitadosa, azaléia (Rhododendron spp.), hortênsia {Macrophyllahydrangea), hibisco {Hibiscus rosasanensis) , rosas (Rosaspp.), tulipas {Tulipa spp.), narcisos (Narcissus spp.),petúnias (Petunia hybrida), cravo {Dianthus caryophyllus) ,bico-de-papagaio {Euphorbia pulcherrima), e crisântemo.
Exemplos de coniferas incluem, mas não são limitadosa, pinheiros, tais como pinheiro da variedade loblolly{Pinus taeda), pinheiro slash (Pinus elliotíí), pinheiroponderosa {Pinus ponderosa) , pinheiro lodgepole {Pinuscontorta), e pinheiro de Monterey (Pinus radiata) ;Pseudotsuga (Pseudotsuga menziesii) ; cicuta do oeste (Tsugacanadensis); espruce Sitka (Picea glauca); sequóia (Seguoiasempervirens); abetos verdadeiros, tais como abeto prateado(Abies amabilis) e bálsamo (Abies balsamea); e cedros, taiscomo cedro vermelho (Thuja plicata) e cedro-amarelo doAlasca (Chamaecyparis nootkatensis).
Preferencialmente, plantas da presente invenção sãoplantas de cultivo (e.g., milho, alfafa, girassol,Brassica, soja, algodão, cártamo, amendoim, sorgo, trigo,milhete, tabaco, arroz, etc.).
Também englobadas pela presente invenção estão plantastransgênicas e progênie dessas compreendendo moléculas deácido nucléico feitas de acordo com os métodos da invenção.A invenção refere-se, ainda, a material de propagação daplanta de um planta transformada incluindo, mas nãolimitando-se a, sementes, tubérculos, cormos, bulbos,folhas, e cortes de raizes e brotos.
TRANSFORMAÇÃO DE PLANTAS
Qualquer método conhecido na arte pode ser usado paratransformar uma planta ou célula vegetal com uma moléculade ácido nucléico projetada de acordo com os métodos dapresente invenção. Moléculas de ácidos nucleicos podem serincorporadas no DNA vegetal (e.g., DNA genômico ou DNA decloroplasto) ou serem mantidas sem inserção no DNA vegetal(e.g., através do uso de cromossomos artificiais). Métodosadequados de introduzir seqüências de nucleotideos emcélulas vegetais incluem micro-injeção (Crossway et al.(1986) Biotechniques 4:320-334); eletroporação (Riggs etal. (1986) Proc. Natl. Acad. Sei. USA 83:5602-5606;D'Halluin et al. (1992) Plant Cell 4:14 95-1505);transformação mediada por Agrobacterium (U.S. Patent Nos.5.563.055 e 5,981,840, Osjoda et al. (1996) NatureBiotechnology 14:745-750); transferência de genes direta(Paszkowski et al. (1984) EMBO J. 3:2717-2722); aceleraçãobalística de partículas (Sanford et al., U.S. Patent No.4.945.050; Tomes et al., U.S. Patent No. 5.879.918; Tomeset al., U.S. Patent No. 5. 886.244; Bidney et al., U.S.Patent No. 5.932.782; Tomes et al. (1995) "Direct DNATransfer into Intact Plant Cells via MicroprojectileBombardment, in Plant Cell, Tissue, and Organ Culture:Fundamental Methods, ed. Gamborg and Phillips (Springer-Verlag, Berlin); e McCabe et al. (1988) Biotechnology6:923-926)); transformação mediada virus (U.S. Patent Nos.5.889.191, 5.889.190, 5.866.785, 5.589.367 e 5.316.931);transformação de pólen (De Wet et al. (1985) em TheExperimental Manipulation of Ovule Tissues, ed. Chapman etal. (Longman, New York), pp. 197-209); transformação Lec 1(U.S. Patent Application Ser. No. 09/435,054, WO 00/28058);transformação mediada por fios de carboneto de silicio(Kaeppler et al. (1990) Plant Cell Reports 9:415-418 eKaeppler et al. (1992) Theor. Appl. Genet. 84:560-566); etecnologia de transformação de cloroplasto (Bogorad, 2000,Trends in Biotechnology 18: 257-263; Ramesh et al., 2004,Methods Mol Biol. 274:301-7; Hou et al., 2003, TransgenicRes. 12(l):lll-4; Kindle et al., 1991, PNAS 88 (5) :1721-5;Bateman and Purton, 2000, Mol Gen Genet. 263 (3) :404-10;Sidorov et al., 1999, Plant J. 19(2):209-216)
A escolha de protocolos transformação usados paragerar plantas e células vegetais transgênicas pode variardependendo do tipo de planta ou célula vegetal, i.e.,monocotiledônea ou dicotiledônea, visadas paratransformação. Exemplos de protocolos de transformaçãoparticularmente adequados para um tipo particular de plantaincluem aqueles para: cebola (Weissinger et al. (1988)Ann. Rev. Genet. 22:421-477; Sanford et al. (1987)Particulate Science and Technology 5:27-37); batata (Tu etal. (1998) Plant Molecular Biology 37:829-838 e Chong etal. (2000) Transgenic Research 9:71-78); soja (Christou etal. (1988) Plant Physiol. 87:671-674, McCabe et al. (1988)Bio/'Technology 6:923-926, Finer and McMullen (1991) InVitro Cell Dev. Biol. 27P:175-182, e Singh et al. (1998)Theor. Appl. Genet. 96:319-324); arroz (Datta et al.(1990) Biotechnology 8:736-740, Li et al. (1993) Plant CellReports 12:250-255, e Christou and Ford (1995) Annals ofBotany 75:407-413); milho (Klein et al. (1988) Proc. Natl.Acad. Sei. USA 85:4305-4309, Klein et al. (1988)Biotechnology 6:559-563, Klein et al. (1988) Plant Physiol.91:440-444, Fromm et al. (1990) Biotechnology 8:833-839, eTomes et al. (1995) "Direct DNA Transfer into Intact PlantCells via Microprojectile Bombardment," in Plant Cell,Tissue, and Organ Culture: Fundamental Methods, ed. Gamborg(Springer-Verlag, Berlin); cereais (Hooykaas-Van Slogterenet al. (1984) Nature (London) 311:763-764, U.S. Patent No.5.736.369); Liliaceae (Bytebier et al. (1987) Proc. Natl.Acad. Sei. USA 84:5345-5349).
Em alguns avanços, mais do que um construto é usadopara transformação na geração de plantas e células vegetaistransgênicas. Múltiplos construtos podem ser incluídos nasposições eis ou trans. Em avanços preferidos, cadaconstruto tem um promotor e outras seqüências reguladoras.As células que foram transformadas podem sercultivadas em plantas em concordância com qualquer métodoconhecido na arte (e.g., McCormick et al. (1986) Plant CellReports 5:81-84). Essas plantas podem ser, então,cultivadas, e tanto polinizadas com a mesma linhagemtransformada ou linhagens diferentes. Duas ou maisgerações das plantas podem ser cultivadas para assegurarque a expressão da molécula de ácido nucléico, polipeptideoe/ou característica fenotipica desejada está estavelmentemantida e herdada.
DETERMINAÇÃO DE EXPRESSÃO
Qualquer método conhecido na arte pode ser usado paradeterminar o nivel de expressão em uma planta de umamolécula de ácido nucléico da invenção ou polipeptideocodificado a partir dessa. Por exemplo, o nivel deexpressão em uma planta de um polipeptideo codificado poruma molécula de ácido nucléico da invenção pode serdeterminado por teste imuno, eletroforese de gelquantitativa, etc. Adicionalmente, o nivel de expressão emuma planta de um polipeptideo codificado por uma moléculade ácido nucléico da invenção pode ser determinado pelograu com o qual o fenótipo vegetal é alterado.Determinações podem ser feitas usando plantas inteiras,tecidos dessas, ou cultura de células vegetais.Em um avanço, uma comparação de niveis de expressão depolipeptídeos é feita entre uma planta transformada com umamolécula de ácido nucleico compreendendo um ou mais códonsalterados e uma planta transformada com uma molécula deácido nucleico inalterada, caracterizado pelo fato de ambasmoléculas de ácido nucleico codificarem o mesmopolipeptideo ou polipeptideo substancialmente similar. Emoutro avanço, uma comparação de niveis de expressão depolipeptideos é feita entre uma planta transformada com umamolécula de ácido nucleico compreendendo um ou mais códonsalterados e uma planta não transgênica.
Os conteúdos de todas as patentes, aplicações depatentes, aplicações PCT publicadas e artigos, livros,referências, manuais de referência e resumos aqui citadossão aqui incorporados por referência em sua totalidade paradescrever mais completamente o estado da arte à qual ainvenção pertence.
Como várias mudanças podem ser feitas na matéria emquestão acima descrita sem deixar o escopo e espirito dapresente invenção, pretende-se que toda matéria objetocontida na descrição acima, ou definida nas reivindicaçõesanexas, seja interpretada como descritiva e ilustrativa dapresente invenção. Várias modificações e variações dapresente invenção são possíveis à luz dos ensinamentosacima.
EXEMPLOSOs seguintes exemplos, como aqui expostos, são feitospara ilustrar e exemplificar os vários aspectos de conduzira presente invenção e não pretendem limitar a invenção emqualquer forma.
EXEMPLO 1: Desenho de seqüência codificadora damolécula de ácido nucléico de virus de plantamonocotiledônea códon-tendenciado codificando variantes dospolipeptideos inseticidas 473N de Bacillus thuringiensis.
Códons para moléculas de ácidos nucléicos codificandoas seqüências de aminoácidos de 473N foram selecionadosinicialmente de acordo com o limite de 0,09 de freqüênciasde uso de códon de virus de planta monocotiledônea listadasna Tabela 14, e subseqüentemente otimizados pelo consensoKozak, e editados para eliminar sitios de splice criticos,seqüências que podem causar rápida degradação de RNAm,seqüências de sinais espuriosos de poliadenilação, equadros de leitura alternados longos. Além de códons quetêm maiores freqüências de uso de códon de virus vegetalterem sido posicionados na direção da extremidade 5' daseqüência codificadora. SEQ ID NO:l codifica Kozak-473N.SEQ ID NO:2 é a seqüência de aminoácidos de Kozak-473N.473N pré- otimização de códon é a SEQ ID NO:15.
A seguinte tabela indica as freqüências de uso decódon da seqüência codificadora da molécula de ácidonucléico de planta monocotiledônea códon-tendenciadalistadas como SEQ ID NO:l comparado às freqüências de usode códon de virus de planta monocotiledônea listadas naTabela 14.Tabela 23: Freqüências de uso de códon na SEQ ID NO:lcomparada a freqüências de uso de códon em virus de plantamonocotiledônea ajustadas com um limite de corte maior doque 0,09.
<table>table see original document page 98</column></row><table><table>table see original document page 99</column></row><table><table>table see original document page 100</column></row><table>
EXEMPLO 2: Assembléia de 473N de virus vegetal códon-tendenciado.
A versão sintética do gene 473N (SEQ ID NO: 1) foisintetizada por DNA2.0 (Menlo Park, CA). Sitios de enzimade restrição BamHI e Hpal foram adicionados às extremidades5' e 3' gene, respectivamente, para facilitar a clonagem emum vetor de transformação.EXEMPLO 3: Construção de um vetor de transformaçãovegetal de 473N.
Um fragmento de 2,1 kb correspondendo ao gene 473N foiisolado do vetor DNA2.0 após a digestão do plasmidio comBamHI e Hpal. Esse fragmento foi sub-clonados em um vetorintermediário, pSKNA-Ubi, usando BamHI e Hpal resultando empSKNA-Ubi:473N. pSKNA-Ubi: 473N contém o gene 473N sob ocontrole da combinação Ubi promotor 5'UTR-Ubi e intron 1 eé terminado pela seqüência terminadora pinll imediatamente3' ao gene 473N. pSKNA-Ubi: 473N foi digerido com Asei eNotl para liberar o cassete de expressão (Ubi Pro-5'UTR'Ubiintron 1:473N:pinll), e seu fragmento foi sub-clonado nossitios correspondentes no vetor de transformação finalposicionando-o acima e na orientação oposta ao genemarcador de seleção. O cassete inteiro entre LB e RB tevea seqüência verificada antes da transformação.
EXEMPLO 4: Transformação de Milho por Bombardeamentode Partícula e Regeneração de Plantas Transgênicas
Embriões de milho imaturos de plantas doadoras deestufas são bombardeadas com uma molécula de DNA contendouma seqüência codificadora da molécula de ácido nucléico devirus vegetal códon-tendenciado operacionalmente ligada aum promotor de ubiquitina e um gene marcador de seleção,tal como PAT (Wohlleben et al., 1988, Gene 70:25-37), queconfere resistência ao herbicida Bialaphos.
Alternativamente, o gene marcador de seleção pode serprovido em uma molécula de DNA separada. A transformação érealizada como se segue. Receitas de meio seguem abaixo.
PREPARAÇÃO DE TECIDO ALVO
É retirada a palha das espigas e sua superfície éesterilizada em alvejante Clorox™ 30% mais 0,5% de Microdetergente por 20 minutos, e enxaguadas duas vezes com águaestéril. Os embriões imaturos são excisados e colocadosde forma que o lado do eixo do embrião fique voltado parabaixo (escutelo voltado para cima), 25 embriões por placa,em meio 560Y por 4 horas e, então, alinhados na zona alvode 2,5 cm na preparação para o bombardeamento.
PREPARAÇÃO DE DNA
Um vetor plasmidio compreendendo a molécula de ácidonucléico de virus vegetal códon-tendenciado,operacionalmente ligada a um promotor de ubiquitina, éisolado. Por exemplo, um vetor de transformação adequadocompreende um promotor Ubil de Zea mays, uma UTR 5' de Ubile um intron Ubil, em combinação com um terminador PinlI. Ovetor contém, adicionalmente, um gene marcador de seleção,tal como GAT dirigido pelo promotor/intron/5'UTR Ubil comum intensificador 3x35S e um terminador PinlI.
Opcionalmente, o marcador de seleção pode residir em umplasmidio separado. Uma molécula de DNA compreendendo umamolécula de ácido nucléico de virus vegetal códon-tendenciado codificando seqüência, assim como um marcadorde seleção, tal como GAT é precipitado em pelotas detungstênio de 1,1 um (diâmetro médio) usando umprocedimento de precipitação de CaCl2 como se segue:100 |xl de preparado de particulas de tungstênioem água
10 ul (1 ug) de DNA em tampão Tris EDTA (1 ug DNAtotal)
100 fil de CaCl2 a 2,5 M
10 ul de spermidina a 0,1 M
Cada reagente é adicionado seqüencialmente a umasuspensão de particulas de tungstênio, enquanto mantido emum vórtex multi-tubo. A mistura final é sonicadabrevemente e deixada para incubar sob agitação por vdrtexconstante por 10 minutos. Após o periodo de precipitação,os tubos são rapidamente centrifugados, o liquido removido,lavado com 500 ml de etanol a 100%, e centrifugado por 30segundos. Novamente, o liquido é removido, e 105 ul deetanol a 100% é adicionado à pelota de partícula detungstênio final. Para bombardeamento de partícula comarma, as particulas tungstênio/DNA são rapidamentesonicadas e 10 ul colocados no centro de cada macrocarregador e secado por cerca de 2 minutos antes dobombardeamento.TRATAMENTO DE ARMA DE PARTÍCULAS
As placas de amostras são bombardeadas no nivel #4 daarma de partículas HE34-1 ou HE34-2. Todas as amostrasrecebem um único tiro a 650 PSI, com um total de dezalíquotas tiradas de cada tubo de preparado departicuias/DNA.
Seguindo o bombardeamento, os embriões são mantidos emmeio 560Y por 2 dias, então transferidos a meio de seleção560R contendo 3 mg/litro de glifosato a 3mM, e sub-cultivados a cada 2 semanas. Após aproximadamente 10semanas de seleção, clones de calo resistentes a seleçãosão transferidos para meio 288J para iniciar a regeneraçãovegetal. Seguindo o amadurecimento do embrião somático (2-4 semanas), embriões somáticos bem desenvolvidos sãotransferidos para meio para germinação e transferidos paraa sala de cultura iluminada. Aproximadamente 7-10 diasdepois, as plântulas em desenvolvimento são transferidaspara meio 272V sem hormônio em tubos por 7-10 dias até queas plântulas estejam bem estabelecidas. As plantas são,então, transferidas para inserções em flats (equivalente apote de 2,5") contendo solo de pote e cultivadas por 1semana em um câmara de crescimento, subseqüentementecultivadas por 1-2 semanas adicionais na estufa, entãotransferidas para potes classic 600 (1,6 gallon) ecultivadas até a maturidade. As plantas são monitoradas epontuadas para expressão do polipeptídeo codificado pelamolécula de ácido nucléico de vírus vegetal códon-tendenciado por testes conhecidos na arte, tais como, porexemplo, testes imuno e western blotting com um anticorpoque se liga ao polipeptideo codificado. A expressão depolipeptideo pode ser também monitorada em calo resistenteapós 10 semanas de seleção para avaliar os niveis dessespolipeptideos.
MEIO DE BOMBARDEAMENTO E CULTURA
Meio de bombardeamento (560Y) compreende 4,0 g/l desais basais N6 (SIGMA C-1416), 1,0 ml/l de mistura deVitamina Eriksson's (lOOOx SIGMA-1511), 0,5 mg/l de HC1tiamina, 120,0 g/l de sacarose, 1,0 mg/l de 2,4-D, e 2,88g/l de L-prolina (levado ao volume com H20 dl seguindo oajuste para pH 5,8 com KOH) ; 2,0 g/l Gelrite™ (adicionadoapós levar ao volume com H2O dl); e 8,5 mg/l de nitrato deprata (adicionados após esterilizar o meio e resfriar paratemperatura ambiente). Meio de seleção (560R) compreende4,0 g/l de sais basais N6 (SIGMA C-1416), 1,0 ml/l demistura de vitamina Eriksson's (lOOOx SIGMA-1511), 0,5 mg/lde HC1 tiamina, 30,0 g/l de sacarose, e 2,0 mg/l de 2,4-D(levados ao volume com H20 dl seguindo o ajuste para pH 5,8com KOH); 3,0 g/l de Gelrite™ (adicionado após levar aovolume com H20 dl); e 0,85 mg/l de nitrato de prata e 3,0mg/l de Bialaphos (ambos adicionados após esterilizar omeio e resfriar para temperatura ambiente).
Meio de regeneração vegetal (288J) compreende 4,3 g/lde sais MS (GIBCO 11117-074), 5,0 ml/l de solução deestoque de vitaminas MS (0,100 g de ácido nicotinico, 0,02g/l de HC1 tiamina, 0,10 g/l de HC1 piridoxina, e 0,40 g/lde Glicina levados ao volume com polished D-I H20)(Murashige and Skoog (1962) Physiol. Plant. 15:473), 100mg/l de mio-inositol, 0,5 mg/l de zeatina, 60 g/l desacarose, e 1,0 ml/l de 0,1 mM ácido abscisico (levados aovolume com polished dl H20 após ..ajustar para pH 5,6); 3,0g/l de Gelrite™ (adicionados após levar ao volume com H20dl); e 1,0 mg/l de ácido indoleacético e 3,0 mg/l deBialaphos (adicionados após esterilizar o meio e resfriarpara 60°C) . Meio sem hormônios (272V) compreende 4,3 g/lde sais MS (GIBCO 11117-074), 5, 0 ml/l de solução deestoque de vitaminas MS (0,100 g/l de ácido nicotinico,0,02 g/l de HC1 tiamina, 0,10 g/l de HC1 piridoxina, e 0,40g/l de Glicina levados ao volume com polished dl E20) , 0,1g/l de mio-inositol, e 40,0 g/l de sacarose (levados aovolume com polished dl H20 após ajustar o pH para 5,6); e 6g/l de Bacto^ágar (adicionado após levar ao volume compolished dl H20), esterilizados e resfriados a 60° C.
EXEMPLO 5: Transformação de milho mediada porAgrobacterium e regeneração de plantas transgênicas
A transformação de milho com um vetor contendo um gene473N de virus vegetal códon-tendenciado foi realizada pelométodo de Zhao (U.S. Patent No. 5.981.840 e publicação depatente PCT W098/32326; os conteúdos das quais são aquiincorporados por referência).Agrobacterium foram cultivadas em uma placa mestra demeio 800 e cultivados a 28°C no escuro por 3 dias, e depoisdisso armazenadas a 4°C por até um mês. Placas de trabalhode Agrobacterium foram cultivadas em placas de meio 810 eincubadas no escuro a 28°C pór um ou dois dias.
Resumidamente, os embriões foram dissecados a partirdas espigas de milho frescas, esterilizadas e mantidos emmeio 561Q até que todos os embriões necessários fossemcoletados. Os embriões foram, então, levados ao contatocom uma suspensão de Agrobacterium preparada a partir daplaca de trabalho, na qual as Agrobacterium continham umplasmidio compreendendo o gene 473N dos avanços. Osembriões foram co-cultivados com as Agrobacterium em placas562P, com os embriões colocados de eixo para baixo nasplacas, como pelo protocolo de patente *840.
Após uma semana em meio 562P, os embriões foramtransferidos para meio 5630. Os embriões foram sub-cultivados em meio fresco 5630 em intervalos de 2 semanas ea incubação foi continuada sob as mesmas condições.
Eventos de calos começaram a aparecer após 6 a 8 semanas emseleção.
Após os calos terem alcançado o tamanho apropriado, oscalos foram cultivados em meio de regeneração (288W) emantidos no escuro por 2-3 semanas para iniciar aregeneração vegetal. Seguindo o amadurecimento do embriãosomático, embriões somáticos bem desenvolvidos foramtransferidos para meio para germinação (272V) etransferidos para uma sala de cultura iluminada.Aproximadamente 7-10 dias depois, as plântulas emdesenvolvimento são transferidas para meio 272V semhormônio em tubos por 7-10 dias até que as plântulasestejam bem estabelecidas. As plantas foram, então,transferidas para inserções em flats (equivalente .a pote de2,5") contendo solo de pote e e cultivadas por 1 semana emum câmara de crescimento, subseqüentemente cultivadas por1-2 semanas adicionais na estufa, então transferidas parapotes classic 600 (1, 6 gallon) e cultivadas até amaturidade.
Os meios usados na transformação de milho mediada porAgrobacterium e regeneração de plantas transgênicas:
Meio 561Q compreende 4,0 g/L de sais basais N6 (SIGMAC-1416), 1,0 mL/L de mistura de Vitamina Eriksson's (lOOOxSIGMA-1511), 0,5 mg/L de HC1 tiamina, 68,5 g/L desacarose, 36,0 g/L de glicose, 1,5 mg/L de 2,4-D, e 0,69g/L de L-prolina (levados ao volume com dl H2O seguindo oajuste para pH 5,2 com KOH) ; 2,0 g/L de Gelrite™(adicionado após levar ao volume com H20 dl); e 8,5 mg/l denitrato de prata (adicionado após esterilizar o meio eresfriar para temperatura ambiente).
Meio 800 compreende 50,0 mL/L de solução de estoque Ae 850 mL de dl H20, levados ao volume menos 100 mL/L com dlH20, após o que é adicionado 9,0 g de fitágar. Apósesterilizar e resfriar, 50,0 mL/L de solução de estoque Bé adicionado-, junto com 5,0 g de glicose e 2,0 mL de umasolução de estoque espectinomicina a 50 mg/mL. A soluçãode estoque A compreende 60,0 g de K2HP04 dibásico e 20,0 gde fosfato de sódio monobásico, dissolvidos em 950 mL deágua, ajustados ao pH 7,0 com KOH, e levados ao volume de1,0 L com dl H2O. A solução de estoque B compreende 20,0 gde NH4CI, 6,0 g de MgS04»7H20, 3,0 g de cloreto de potássio,.0,2 g de CaCl2, e 0,05 g de FeS04*7H20, todos levados aovolume com dl H20, esterilizados, e resfriados.
Meio 810 compreende 5,0 g de extrato de levedura(Difco), 10,0 g de peptona (Difco), 5,0 g de NaCl,dissolvidos em dl H20, e levados ao volume após ajustar opH para 6,8. 15,0 g de bacto-ágar são, então, adicionadas,a solução é esterilizada e resfriada, e 1,0 mL de umasolução de estoque de espectinomicina a 50 mg/mL éadicionado.
Meio 562P compreende 4,0 g/L de sais basais N6 (SIGMAC-1416), 1,0 mL/L de mistura de Vitamina Eriksson's (lOOOxSIGMA-1511), 0,5 mg/L de HC1 tiamina, 30,0 g/L de sacarose,e 2,0 mg/L de 2,4-D (levados ao volume com dl H20 seguindoo ajuste para pH 5,8 com KOH); 3,0 g/L de Gelrite™(adicionado após levar ao volume com H20 dl); e 0,85 mg/lde nitrato de prata e 1,0 mL de um estoque deacetosiringona a lOOmM (ambos adicionados após esterilizaro meio e resfriar para temperatura ambiente).Meio 5630 compreende 4,0 g/L de sais basais N6 (SIGMAC-1416), 1,0 mL/L de mistura de Vitamina Eriksson's (lOOOxSIGMA-1511), 0,5 mg/L de HC1 tiamina, 30,0 g/L de sacarose,1,5 mg/L de 2,4-D, 0,69 g de L-prolina, e 0,5 g de tampãoMES (levados ao volume com dl H20 seguindo o ajuste para pH5,8 com KOH) . Então, 6,0 g/L de agar-agar Ultrapure™ (EMScience) são adicionadas e o meio é esterilizado eresfriado. Subseqüentemente, 0,85 mg/l de nitrato deprata, 3,0 mL de um estoque de Bialaphos al mg/mL, e 2,0 mLde um estoque de carbenicilina a 50 mg/mL são adicionadas.
Meio 288 W compreende 4,3 g/L de sais MS (GIBCO 11117-074), 5,0 mL/L de solução de estoque de vitaminas MS (0,100g de ácido nicotinico, 0,02 g/L de HC1 tiamina, 0,10 g/L deHC1 piridoxina, e 0,40 g/L de Glicina levados ao volume compolished D-I H20) (Murashige and Skoog (1962) Physiol.Plant. 15:473), 100 mg/L de mio-inositol, 0,5 mg/L dezeatina, e 60 g/L de sacarose, que é, então, levado aovolume com polished D-I H2O após ajustar para pH 5,6.
Seguindo, 6,0 g/L de agar-agar Ultrapure™ (EM Science) sãoadicionados e o meio é esterilizado e resfriado.Subseqüentemente, 1,0 mL/L de ácido abscisico a 0,1 mM; 1,0mg/l de ácido indoleacético e 3,0 mg/L Bialaphos sãoadicionados, junto com 2,0 mL de um estoque decarbenicilina a 50 mg/mL.
Meio sem hormônio (272V) compreende 4,3 g/L sais MS(GIBCO 11117-074), 5,0 mL/L de solução de estoque devitaminas MS (0,100 g/L de ácido nicotinico, 0,02 g/L deHC1 tiamina, 0,10 g/L de HC1 piridoxina, e 0,40 g/L deGlicina levados ao volume com polished dl H2O) , 0,1 g/L demio-inositol, e 40,0 g/L de sacarose (levados ao volume compolished dl H20 após ajustar o pH para 5,6); e 6 g/L deBacto-ágar (adicionado após levar ao volume com polished dlH20) , esterilizado e resfriado para 60° C.
EXEMPLO 6: Teste com insetos de 473N expressando calostransgênicos
Insetos foram testados em calos transgênicosexpressando 473N sob o promoter de Ubiquitina paradeterminar se houve expressão suficiente de toxina 473Nneste estágio para prover atividade inseticida. Esseteste, em combinação com a análise de western blot, proveuuma medida de quão bem o gene 473N de virus vegetal códon-tendenciado, codificando um polipeptideo inseticida, foiexpressado em tecidos vegetais.
O teste de calo foi realizado em bandejas Pitman queforam previamente esterilizadas por spray de etanol 95%.
Ágar (Serva) preparado de acordo com as instruções dofabricante e suplementado com uma solução tripla deantibiótico (70 mis/ 500 ml ágar) contendo penicilina,estreptomicina e anfotercina B, foi pulverizado em cadapoço e deixado resfriar. Um disco de papel filtro estérilfoi colocado em cima do ágar em cada poço e 200 ul de águaestéril dispensada no papel filtro. Calos (~ 1 cm emtamanho) foram adicionados no papel filtro e 2 lagartaseuropéias (ECB) recém-nascidas foram adicionadas por poço.As placas de teste foram incubadas a 27°C e os insetosforam pontuado para mortalidade, perturbação decrescimento, e mudanças comportamentais a 72-96 h após aadição dos insetos. O teste foi repetido para confirmar aspontuações.
Os resultados dos testes mostraram que as ECB recém-nascidas foram severamente perturbadas ou mortas em 30 dospoços testados. A correlação de atividade entre as duasrepetições foi de 100%. Nenhuma mortalidade ou perturbaçãofoi observada nos calos não transgênicos controle. Esseteste indicou que 473N foi expressado em quantidadesinseticidas em uma proporção do calo diferente e apoia aefetividade da tendência de códon de virus vegetal.
EXEMPLO 7: Testando a eficácia de disco foliar de ECBe CEW.
Calos transformados foram regenerados em plantas eenviados para a estufa para testar a eficácia de TO com ECBe larva da espiga do milho (CEW). Testes de discosfoliares foram realizados em todos os eventos no estágiosde desenvolvimento V6 para avaliar a proteção de plantabaseado na área de folha consumida por inseto recém-nascidoapós 48 hrs. Testes foram conduzidos puncionando múltiplosdiscos foliares para cada evento transgênico testado ecolocando um disco por poço de um placa de 24 poços.Quatro discos foliares por evento por inseto (8 total)foram usados no teste. Os discos foliares foram mantidosem um disco de papel filtro úmido que foi do mesmo diâmetrodo poço. Tampas foram colocadas em cada placa após aadição dos insetos para preveni-los de escapar do poço.Discos foliares controle de plantas não transgênicos foramincluídos para comparação de consumo foliar. Testes foramconduzidos a 27°C.
Os resultados desse teste estão sumarizados na Tabela24 abaixo. Proteção de folha foi observada em 45 doseventos testados no teste. Eventos que demonstraramproteção contra ECB também mostraram proteção contra CEW.O disco foliar foi totalmente consumido nos poços controlee nos outros eventos "não eficazes". Um exemplo do testede disco foliar é apresentado na Fig. 1. Esses resultadosapoiam a habilidade de expressar um gene 473N em niveisinseticidas que foram projetados com uma tendência de códonde virus vegetal.
Tabela 24: Resultados do teste de disco foliar para eventosexpressando um gene 473N de virus vegetal códon-otimizado.
<table>table see original document page 113</column></row><table>
EXEMPLO 8: Análise de Immunoblot de amostras de folhasde eventos 473N transgênicos.Extrações de polipeptídeo vegetal foram efetuadascoletando-se 4 discos foliares (-100 mg) de plantas deestágio V6 em um tubo raptor de 1,2 ml. Para cada amostra,duas bolas de ferro de moer e 200 ul de tampão de extração(100 mM de fosfato de potássio, pH 7,8, lmM EDTA, 10%glicerol, 1% Triton, 7mM beta mercaptoetanol (BME) ecoquetel de inibidor de protease) foram adicionados. Ostubos foram encapados e colocados em um moedor Geno/Grinder(BT&C/OPS Diagnostics, New Bridgewater, NJ) e esmagadasduas vezes a uma velocidade de 1650 por 30 seg. As amostrasforam centrifugadas a 4000 rpm por 15 minutos a 4°C, osobrenadante transferido a um novo tubo e re-centrifugado a13.000 rpm por 5 min a 4°C. 0 sobrenadante foi transferidopara um novo tubo e as amostras armazenadas a -20°C até ouso.
As amostras foram preparadas para eletroforese de gelSDS-PAGE adicionando-se 5 ul de 4X tampão de carregamento(Invitrogen, Carlsbad, CA) e 3,5 ul de BME e aquecendo-se a100°C por 5 minutos. As amostras foram carregadas em umgel 4-16 % NuPAGE precast (Invitrogen) com marcadores depeso molecular apropriados e corridas a -125 volts por -90minutos em tampão MES de corrimento.
A análise de Immunoblot foi realizada removendo o geldo lançador e colocando em um sanduíche de blottingconsistindo de 2 camadas esponja, papel de blotting(cortado ao tamanho do gel), o gel, a membrana pré-molhada,papel de blotting, e duas esponjas. O sanduíche foicolocado na caixa de transferência contendo tampão detransferência e corrido a 30 volts por 60 a 90 minutos.Após a transferência, a membrana foi removida do sanduíchee colocada em um recipiente ao qual IX PBST (10 mM fosfatosalino tamponado, pH7,4, 1% Tween 20) suplementado com 5%leite sem gordura seco. O bloqueio foi feito por lh a RTcom agitação suave. Após lha solução de bloqueio foisubstituída com 15 ml de 1XPBST + 5% leite seco contendo adiluição correta de anticorpo 473N primário e incubada comagitação suave a 4°C de um dia para o outro. Após aincubação, o anticorpo primário foi removido e a membranalavada 3 vezes (5 minutos cada) com 1XPBST + 5% leite seco.A membrana foi incubada com anticorpo secundário a umadiluição de 1/5000 em 25 ml de 1XPBST + 5% leite seco por 1h a RT com agitação suave. O Ab secundário foi removido damembrana e a membrana lavada 3 (5 min cada) com 1XPBST + 5%leite seco seguido por 3 lavagens (5 min. cada) de IXtampão de teste (fornecido no kit Western Light Kit TM,Applied Biosystems, Foster City, CA). O excesso de tampãofoi drenado da membrana e a membrana colocada em umembrulho plástico ao qual 3 ml de solução de substrato(CSPDTM - provido no kit) suplementado com 150 ul deintensificador Nitro-Block II TM (provido no kit) foiadicionado por 5 min no escuro. A membrana foi reveladadrenando-se o excesso de solução e expondo a membrana afilme de raio X Biomax Light X-ray film (Eastman Kodak Co.New Haven, CT) por diferentes tempos de exposição. O filmefoi, então, revelado, por métodos tradicionais.A análise Western de tecido foliar de eventostransgênicos 473N mostraram uma banda imuno-reativa ao Abque foi similar em tamanho à proteina 473N controlepurificada (ver Fig. 2). A presença dessa banda esteve emamostras de folhas de eventos que demonstraram eficácia noteste de disco foliar, suportando a expressão de um gene473N de virus vegetal códon-otimizado a niveis inseticidas.Essa banda esteve ausente em controles não transgênicos.Outras bandas reativas cruzadamente são em comum entreamostras transgênicas e controles não transgênicos.
EXEMPLO 9: Desenho de seqüência codificadora damolécula de ácido nucléico de virus de plantamonocotiledônea códon-tendenciado codificando uma lipaseinseticida de Rhyzopus oryzae (RoLipase)
Códons para a molécula de ácido nucléico codificandoas seqüências de aminoácidos de RoLipase com um peptideosinal de Alpha Amilase de cevada foram selecionadasinicialmente de acordo com o limite de 0,09 de freqüênciasde uso de códon de virus de planta monocotiledônea listadasna Tabela 14. Subseqüentemente a seqüência foi otimizadapelo consenso Kozak e editada para eliminar sitios desplíce críticos, seqüências que podem causar rápidadegradação de RNAm, seqüências com sinais de poliadenilaçãoespuriosos, e quadros de leitura alternados longos. Alémde códons que têm maiores freqüências de uso de códon devirus vegetal e foram posicionado na direção da extremidadeda seqüência codificadora. A SEQ ID NO: 3 codifica aRoLipase códon-otimizada. A SEQ ID NO: 4 é a seqüência deaminoácidos de RoLipase códon-otimizada. As SEQ ID NOS:5 e6 são o peptideo sinal de amilase Alpha de cevada (ácidonucléico e seqüência peptidica, respectivamente) que foramadicionadas à seqüência de RoLipase códon-otimizada eusadas por todos os experimentos descritos. A lipase pré-otimização de códons é a SEQ ID NO:16.
EXEMPLO 10: Assembléia de BAA-RoLipase de VirusVegetal Códon-Tendenciado.
A versão sintética da RoLipase (SEQ ID NO:3) com o foisintetizada por DNA2.0 (Menlo Park, CA). Sitios de enzimade restrição BamHI e Hpal foram adicionado às extremidades5' e 3' do gene, respectivamente, para facilitar a clonagemem um vetor de transformação vegetal.
EXEMPLO 11: Construção de um Vetor de TransformaçãoVegetal BAA-RoLipase.
Um fragmento de 1,2 kb correspondendo ao gene de BAA-RoLipase foi isolado a partir do vetor DNA2.0 após adigestão do plasmidio com BamHI e Hpal. Esse fragmento foisub-clonado em um vetor intermediário, pSKNA-Ubi, usandoBamHI e Hpal resultando em pSKNA-Ubi:BAA-RoLipase. pSKNA-Ubi:BAA-RoLipase continha o gene de BAA-RoLipase sob ocontrole da combinação Ubi promotor-5' UTR-Ubi intron 1 efoi terminado pela seqüência terminadora pin IIimediatamente 3' ao gene de Lipase. pSKNA-Ubi:BAA-RoLipasefoi digerida com Asei e Notl para liberar o cassette deexpressão (Ubi Pro-5'UTR'Ubi intron 1:BAA-RoLipase:pinll) eesse fragmento foi sub-clonado nos sitios correspondentesno vetor de transformação final colocando-o acima e naorientação oposta ao gene marcador de seleção. O cassetecompleto entre LB e RB teve sua seqüência verificada antesda transformação.
O vetor de transformação vegetal BAA-RoLipase foiusado para transformar milho por transformação mediada porAgrobacterium e plantas foram regeneradas de acordo com osprocedimentos detalhados no Exemplo 5.
EXEMPLO 12: Teste de larva-da-raiz do milho (CRW) emeventos de RoLipase transformada.
A avaliação de CRW foi efetuada em 45 eventos deRolipase transformada usando um teste de simulação de raiz.Plantulas de Rolipase de transformação foram transplantadasem raizes simuladas e as plantas foram infestadas noestágio V3-V4 com 100 ovos de CRW. As plantas forampontuadas para dano de raiz em 15-17 dias após a infestaçãoe passada na base de pontuações de raiz comparadas plantascontrole não transgênicas. Onze plantas foram pontuadascomo positivas baseado no grau de dano de raizrepresentando uma taxa de manutenção de 24% (Tabela 25) .
Um subgrupo dessas plantas foi selecionado para análiseWestern de expressão de Rolipase.Tabela 25: Eventos TO de Rolipase que passar no teste deCRW
<table>table see original document page 119</column></row><table>
EXEMPLO 13: Análise de Immunoblot de amostras de raize folhas de eventos BAA-RoLipase transgênicos.
Extrações de polipeptideos vegetais foram efetuadascoletando-se seções de raizes e folhas (~100 mg) de plantasdo estágio V6-8 em um tubo raptor 1,2 ml. Para cadaamostra duas bolas de ferro de moer e 200 ul de tampão deextração (fosfato de potássio a 100 mM, pH 7,8, lmM EDTA,10% glicerol, 1% Triton, 7mM beta mercaptoetanol (BME) ecoquetel inibidor de protease) foram adicionados. Os tubosforam encapados e colocados em um moedor Geno/Grinder(BT&C/OPS Diagnostics, New Bridgewater, NJ) e esmagadasduas vezes a uma velocidade de 1650 por 30 seg. as amostrasforam centrifugadas a 4000 rpm por 15 minutos a 4°C, osobrenadante transferido a um novo tubo e re-centrifugado a13.000 rpm por 5 min a 4°C. 0 sobrenadante foi transferidopara um novo tubo e as amostras armazenadas a -20°C até ouso.
As amostras foram preparadas para eletroforese de gelSDS-PAGE adicionando-se 5 ul de 4X tampão de carregamento(Invitrogen, Carlsbad, CA) e 3,5 ul de BME e aquecendo-se a100°C por 5 minutos. As amostras foram carregadas em umgel 4-16 % NuPAGE precast (Invitrogen) com marcadores depeso molecular apropriados e corridas a -125 volts por ~90minutos em tampão MES de corrimento.
A análise de Immunoblot foi realizada removendo o geldo lançador e colocando em um sanduíche de blottingconsistindo de 2 camadas esponja, papel de blotting(cortado ao tamanho do gel), o gel, a membrana pré-molhada,papel de blotting, e duas esponjas. O sanduíche foicolocado na caixa de transferência contendo tampão detransferência e corrido a 30 volts por 60 a 90 minutos.
Após a transferência, a membrana foi removida do sanduíchee colocada em um recipiente ao qual IX' PBST (10 mM fosfatosalino tamponado, pH7,4, 1% Tween 20) suplementado com 5%leite sem gordura seco. O bloqueio foi feito por Ih a RTcom agitação suave. Após lha solução de bloqueio foisubstituída com 15 ml de 1XPBST + 5% leite seco contendo adiluição correta de anticorpo 473N primário e incubada comagitação suave a 4°C de um dia para o outro. Após aincubação, o anticorpo primário foi removido e a membranalavada 3 vezes (5 minutos cada) com 1XPBST + 5% leite seco.
A membrana foi incubada com anticorpo secundário a umadiluição de 1/5000 em 25 ml de 1XPBST + 5% leite seco por 1h a RT com agitação suave. O Ab secundário foi removido damembrana e a membrana lavada 3 (5 min cada) com 1XPBST + 5%leite seco seguido por 3 lavagens (5 min. cada) de IXtampão de teste (fonecido no kit Western Light Kit TM,Applied Biosystems, Foster City, CA) . O excesso de tampãofoi drenado da membrana e a membrana colocada em umembrulho plástico ao qual 3 ml de solução de substrato(CSPDTM - provido no kit) suplementado com 150 ul deintensificador Nitro-Block II TM (provido no kit) foiadicionado por 5 min no escuro. A membrana foi reveladadrenando-se o excesso de solução e expondo a membrana afilme de raio X Biomax Light X-ray film (Eastman Kodak Co.New Haven, CT) por diferentes tempos de exposição. O filmefoi, então, revelado, por métodos tradicionais.
A análise Western de tecido foliar e radicular foirealizada em um subgrupo de eventos transgênicos RoLipaseque foram positivos ou negativos nos testes de simulação deraiz. Os resultados dessas análises mostraram uma bandaimuno-reativa correspondendo ao tamanho esperado deRoLipase madura (~31 kD) em eventos que foram positivos noteste (ver Fig. 3) . Um precursor de Rolipase purificado(ROL -42 kD) foi incluído na análise Western como umcontrole positivo. A correlação entre proteção de raiz e apresença da forma madura de Rolipase nos eventos testadosapoiam a expressão bem-sucedida de um gene de RoLipase devirus vegetal códon-otimizado.LISTAGEM DE SEQÜÊNCIAS
<110> Requerente: Pioneer Hi-Bred International, Inc.
E.I. DuPont de Nemours & Co.
<120> Titulo: Método para desenhar uma molécula de ácido nucléico, molécula deácido nucléico, vetor, planta transgênica e a progênie desta
<130> Referência do documento: 1877-PCT
<150> No. do pedido de prioridade: 60/668,734
<151> Data de depósito do pedido de prioridade: 05/04/2005
<160> Quantidade de SEQ ID Nos.: 16
<170> Software: Patentln version 3.3
<210> SEQ ID No: 1<211> Comprimento: 1905<212> Tipo: DNA
<213> Organismo: Seqüência Artificial<220> Características:
<223> Outras informações: Seqüência sintética baseada em Bacillus thuringiensis<400> Seqüência: 1
atgggacaca atgttttgaa taacgaaaga aatactgttt gtgaagcaca caatgttgca 60
gtgagagatc cattctcttt cgaacacaag agtcttaata cagttgaaaa ggagtggaca 120
gagtggaaga gaaatgatca ctcactttat gtggatccta ttgtcggaac agttgcctct 180
ttcttgctta agaaggttgg aagtttagtg ggtaagagaa tcttatcaga gttgagatca 240
ttgatcttcc cttctggttc tacaaatttg atgcaagata tcttaagaga gaccgagaaa 300
ttcttgaatc aaagacttaa taccgatact ctcgcccgtg ttaatgctga gctaacaggt 360
ctgcaagcaa acgtggagga gttcaacagg caagtcgaca acttcttaaa ccctaacaga 420
aacgccttac cattatcaat cacctctagt gtgaacacta tgcagcagtt attcttgaac 480
aggcttcctc agttccagat ccagggctat cagctcctac tcttaccatt gttcgctcag 540
gctgctaacc ttcacctctc cttcatccgt gacgttatcc taaacgctga cgaatgggga 600
atcagcgcag caactctgcg aacttaccgc aaccatctta gaaactacac tagagactac 660
tcgaactact gcattaacac ttaccagaca gctttcaggg gtttgaacac acgtcttcac 720
gacatgctcg agttccgaac atacatgttc ctaaacgtct tcgaatacgt gtcaatatgg 780
tcactgttca aataccagtc attattggtc tctagtggcg caaaccttta cgcctccgga 840
agcggaccac agcaaactca gtcgttcaca tcacaagact ggccatttct ctactctcta 900
ttccaagtaa acagtaacta tgttctgaac ggattctccg gagcgcgctt aagccaaacc 960
tttccaaaca tcgtgggttt gccaggaacg actactactc atgctcttct cgctgctaga 1020gtcaactact cgggaggcgt atcatctggc gacattgggg ctagtccttt caaccagaac 1080
ttctcctgta gcacatttct accaccgctg ttaacaccat ttgttaggtc gtggttggac 1140
tctggatctg atcgtggagg agtgaacacc gtcacgaact ggcaaactga aagctttgaa 1200
acaacccttg gtctccgatc cggcgcattc acggcccgcg ggaacagcaa ctactttcct 1260
gactatttca taagaaatat atcgggagta ccactagttg tgaggaacga agatctgcgt 1320
cgaccgttac attataatca aatacgcaat atagaatcac catctggaac tcctggcggt 1380
gcgagagctt atatggtcag tgtacataat aggaagaaca acatatatgc agttcatgaa 1440
aatggaacaa tgatacattt ggctcccgaa gattataccg gtttcacgat atcaccgata 1500
catgcgactc aagtgaacaa tcaaacacgt acctttattt cagaaaaatt tggcaatcaa 1560
ggggattcgc ttcgatttga acaatcaaat acgactgctc gctatacact cagaggaaat 1620
ggaaattctt ataatctata tctgagggtc agttccattg gcaatagcac cattcgtgta 1680
acgattaatg ggcgagttta tactgcaaca aatgtgaata ccacgactaa caatgatgga 1740
gtcaatgata atggtgcccg cttctcagat attaatattg gcaatgtagt tgcgtctgat 1800
aatagtaacg tgccacttga tattaatgtc acattgaatt ccgggaccca atttgatctt 1860
atgaatatta tgtttgtacc tacgaatctc ccaccgctat attag 1905
<210> SEQ ID No:2<211> Comprimento: 634<212> Tipo: PRT
<213> Organismo: Seqüência Artificial<220> Características:
<223> Outras informações: Seqüência sintética baseada em Bacillus thuringiensis<400> Seqüência: 2
Met Gly His Asn Vai Leu Asn Asn Glu Arg Asn Thr Vai Cys Glu Ala1 5 10 15
His Asn Vai Ala Vai Arg Asp Pro Phe Ser Phe Glu His Lys Ser Leu20 25 30
Asn Thr Vai Glu Lys Glu Trp Thr Glu Trp Lys Arg Asn Asp His Ser35 40 45
Leu Tyr Vai Asp Pro Ile Vai Gly Thr Vai Ala Ser Phe Leu Leu Lys50 55 60
Lys Vai Gly Ser Leu Vai Gly Lys Arg Ile Leu Ser Glu Leu Arg Ser65 70 75 80Leu lie Phe Pro Ser Gly Ser Thr Asn Leu Met Gln Asp lie Leu Arg85 90 95
Glu Thr Glu Lys Phe Leu Asn Gln Arg Leu Asn Thr Asp Thr Leu Ala100 105 110
Arg Vai Asn Ala Glu Leu Thr Gly Leu Gln Ala Asn Vai Glu Glu Phe115 120 125
Asn Arg Gln Vai Asp Asn Phe Leu Asn Pro Asn Arg Asn Ala Leu Pro130 135 140
Leu Ser lie Thr Ser Ser Vai Asn Thr Met Gln Gln Leu Phe Leu Asn145 150 155 160
Arg Leu Pro Gln Phe Gln lie Gln Gly Tyr Gln Leu Leu Leu Leu Pro165 170 175
Leu Phe Ala Gln Ala Ala Asn Leu His Leu Ser Phe lie Arg Asp Vai180 185 190
lie Leu Asn Ala Asp Glu Trp Gly lie Ser Ala Ala Thr Leu Arg Thr195 200 205
Tyr Arg Asn His Leu Arg Asn Tyr Thr Arg Asp Tyr Ser Asn Tyr Cys210 215 220
lie Asn Thr Tyr Gln Thr Ala Phe Arg Gly Leu Asn Thr Arg Leu His225 230 235 240
Asp Met Leu Glu Phe Arg Thr Tyr Met Phe Leu Asn Vai Phe Glu Tyr245 250 255
Vai Ser lie Trp Ser Leu Phe Lys Tyr Gln Ser Leu Leu Vai Ser Ser260 265 270
Gly Ala Asn Leu Tyr Ala Ser Gly Ser Gly Pro Gln Gln Thr Gln Ser275 280 285
Phe Thr Ser Gln Asp Trp Pro Phe Leu Tyr Ser Leu Phe Gln Vai Asn290 295 300
Ser Asn Tyr Vai Leu Asn Gly Phe Ser Gly Ala Arg Leu Ser Gln Thr305 310 315 320Phe Pro Asn lie Vai Gly Leu Pro Gly Thr Thr Thr Thr His Ala Leu325 330 335
Leu Ala Ala Arg Vai Asn Tyr Ser Gly Gly Vai Ser Ser Gly Asp lie340 345 350
Gly Ala Ser Pro Phe Asn Gln Asn Phe Ser Cys Ser Thr Phe Leu Pro355 360 365
Pro Leu Leu Thr Pro Phe Vai Arg Ser Trp Leu Asp Ser Gly Ser Asp370 375 380
Arg Gly Gly Vai Asn Thr Vai Thr Asn Trp Gln Thr Glu Ser Phe Glu385 390 395 400
Thr Thr Leu Gly Leu Arg Ser Gly Ala Phe Thr Ala Arg Gly Asn Ser405 410 415
Asn Tyr Phe Pro Asp Tyr Phe lie Arg Asn lie Ser Gly Vai Pro Leu420 425 430
Vai Vai Arg Asn Glu Asp Leu Arg Arg Pro Leu His Tyr Asn Gln lie435 440 445
Arg Asn lie Glu Ser Pro Ser Gly Thr Pro Gly Gly Ala Arg Ala Tyr450 455 460
Met Vai Ser Vai His Asn Arg Lys Asn Asn lie Tyr Ala Vai His Glu465 470 475 480
Asn Gly Thr Met lie His Leu Ala Pro Glu Asp Tyr Thr Gly Phe Thr485 490 495
lie Ser Pro lie His Ala Thr Gln Vai Asn Asn Gln Thr Arg Thr Phe500 505 510
lie Ser Glu Lys Phe Gly Asn Gln Gly Asp Ser Leu Arg Phe Glu Gln515 520 525
Ser Asn Thr Thr Ala Arg Tyr Thr Leu Arg Gly Asn Gly Asn Ser Tyr530 535 540
Asn Leu Tyr Leu Arg Vai Ser Ser lie Gly Asn Ser Thr lie Arg Vai545 550 555 560Thr Ile Asn Gly Arg Vai Tyr Thr Ala Thr Asn Vai Asn Thr Thr Thr565 570 575
Asn Asn Asp Gly Vai Asn Asp Asn Gly Ala Arg Phe Ser Asp Ile Asn580 585 590
Ile Gly Asn Vai Vai Ala Ser Asp Asn Ser Asn Vai Pro Leu Asp Ile595 600 605
Asn Vai Thr Leu Asn Ser Gly Thr Gln Phe Asp Leu Met Asn Ile Met610 615 620
Phe Vai Pro Thr Asn Leu Pro Pro Leu Tyr625 630
<210> SEQ ID No: 3<211> Comprimento: 1101<212> Tipo: DNA
<213> Organismo: Seqüência Artificial<220> Características:
<223> Outras informações: Seqüência sintética baseada em Rhyzopus oryzae<400> Seqüência: 3
gttccagtct caggaaagtc tggttcttca actacagctg tttctgcatc agataactcc 60
gccctacctc ctctgatttc atcgagatgc gctccacctt caaacaaggg atcaaagtca 120
gatttgcaag ctgaaccata ttatatgcaa aaaaacaccg agtggtacga gtctcacggt 180
ggcaacttaa ctagtatcgg aaagagagat gataacttgg ttggaggaat gacacttgac 240
cttccatccg acgctccacc aatcagccta tcgggttcaa ccaactctgc aagtgacgga 300
ggtaaggtcg ttgcagctac tactgcacaa atccaggagt tcacaaagta cgccggaatc 360
gcggctacag cttactgcag atccgttgtg cctgggaaca agtgggactg tgttcagtgc 420
cagaaatggg tgcccgacgg aaagattata actacattca ccagcctgtt atcggacacg 480
aatggatacg tcttgaggtc agataaacag aaaactatct accttgtatt ccgtggtact 540
aactctttcc gaagtgctat tactgacata gtcttcaatt tctccgatta taaaccggtt 600
aaaggcgcaa aggttcacgc cgggtttctc agctcgtacg agcaagtggt caatgattat 660
ttcccagtag ttcaggaaca actaacagcg aatcctacct ataaagtgat agtcacggga 720
cattcactgg gtggcgctca agcattattg gccgggatgg atctttatca acgcgagccc 780
agactctctc cgaagaatct aagtatattc actgtaggag gtccaagggt tggcaatcct 840
acatttgcgt attatgtgga atccaccggg ataccctttc aacgcacggt ccacaaacga 900
gatatagtac cgcatgttcc acctcaaagc tttggatttc tgcatcccgg tgtggaatca 960tggattaaat ctggcacttc aaatgtccaa atttgtacat ccgaaattga aaccaaagat 1020tgtagcaatt caattgtgcc gtttacgtct ttattggatc atcttagtta ctttgatatt 1080aatgaagggt cctgtctcta g 1101
<210> SEQ ID No: 4<211> Comprimento: 366<212> Tipo: PRT
<213> Organismo: Seqüência Artificial<220> Características:
<223> Outras informações: Seqüência sintética baseada em Rhyzopus oryzae<400> Seqüência: 4
Vai Pro Vai Ser Gly Lys Ser Gly Ser Ser Thr Thr Ala Vai Ser Ala1 5 10 15
Ser Asp Asn Ser Ala Leu Pro Pro Leu Ile Ser Ser Arg Cys Ala Pro20 25 30
Pro Ser Asn Lys Gly Ser Lys Ser Asp Leu Gln Ala Glu Pro Tyr Tyr35 40 45
Met Gln Lys Asn Thr Glu Trp Tyr Glu Ser His Gly Gly Asn Leu Thr50 55 60
Ser Ile Gly Lys Arg Asp Asp Asn Leu Vai Gly Gly Met Thr Leu Asp65 70 75 80
Leu Pro Ser Asp Ala Pro Pro Ile Ser Leu Ser Gly Ser Thr Asn Ser85 90 95
Ala Ser Asp Gly Gly Lys Vai Vai Ala Ala Thr Thr Ala Gln Ile Gln100 105 110
Glu Phe Thr Lys Tyr Ala Gly Ile Ala Ala Thr Ala Tyr Cys Arg Ser115 120 125
Vai Vai Pro Gly Asn Lys Trp Asp Cys Vai Gln Cys Gln Lys Trp Vai130 135 140
Pro Asp Gly Lys Ile Ile Thr Thr Phe Thr Ser Leu Leu Ser Asp Thr145 150 155 160
Asn Gly Tyr Vai Leu Arg Ser Asp Lys Gln Lys Thr Ile Tyr Leu Vai165 170 175Phe Arg Gly Thr Asn Ser Phe Arg Ser Ala lie Thr Asp lie Vai Phe180 185 190
Asn Phe Ser Asp Tyr Lys Pro Vai Lys Gly Ala Lys Vai His Ala Gly195 200 205
Phe Leu Ser Ser Tyr Glu Gln Vai Vai Asn Asp Tyr Phe Pro Vai Vai210 215 220
Gln Glu Gln Leu Thr Ala Asn Pro Thr Tyr Lys Vai lie Vai Thr Gly225 230 235 240
His Ser Leu Gly Gly Ala Gln Ala Leu Leu Ala Gly Met Asp Leu Tyr245 250 255
Gln Arg Glu Pro Arg Leu Ser Pro Lys Asn Leu Ser lie Phe Thr Vai260 265 270
Gly Gly Pro Arg Vai Gly Asn Pro Thr Phe Ala Tyr Tyr Vai Glu Ser275 280 285
Thr Gly lie Pro Phe Gln Arg Thr Vai His Lys Arg Asp lie Vai Pro290 295 300
His Vai Pro Pro Gln Ser Phe Gly Phe Leu His Pro Gly Vai Glu Ser305 310 315 320
Trp lie Lys Ser Gly Thr Ser Asn Vai Gln lie Cys Thr Ser Glu lie325 330 335
Glu Thr Lys Asp Cys Ser Asn Ser lie Vai Pro Phe Thr Ser Leu Leu340 345 350
Asp His Leu Ser Tyr Phe Asp lie Asn Glu Gly Ser Cys Leu355 360 365
<210> SEQ ID No: 5<211> Comprimento: 72<212> Tipo: DNA
<213> Organismo: Hordeum leporinum<400> Seqüência: 5
atggcaaata agcatttgtc acttagttta ttcttggtct tattgggact ttcagcatct 60
ctcgccagtg ga
72<210> SEQ ID No: 6<211> Comprimento: 24<212> Tipo: PRT
<213> Organismo: Hordeum leporinum<400> Seqüência: 6
Met Ala Asn Lys His Leu Ser Leu Ser Leu Phe Leu Vai Leu Leu Gly1 5 10 15
Leu Ser Ala Ser Leu Ala Ser Gly20
<210> SEQ ID No: 7<211> Comprimento: 3468<212> Tipo: DNA
<213> Organismo: Seqüência Artificial<220> Características:
<223> Outras informações: Seqüência sintética baseada em Bacillus thuringiensis<400> Seqüência: 7
atggataaca atccgaacat caatgaatgc attccttata attgtttaag taaccctgaa 60
gtagaagtat taggtggaga aagaatagaa actggttaca ccccaatcga tatttccttg 120
tcgctaacgc aatttctttt gagtgaattt gttcccggtg ctggatttgt gttaggacta 180
gttgatataa tatggggaat ttttggtccc tctcaatggg acgcatttct tgtacaaatt 240
gaacagttaa ttaaccaaag aatagaagaa ttcgctagga accaagccat ttctagatta 300
gaaggactaa gcaatcttta tcaaatttac gcagaatctt ttagagagtg ggaagcagat 360
cctactaatc cagcattaag agaagagatg cgtattcaat tcaatgacat gaacagtgcc 420
cttacaaccg ctattcctct ttttgcagtt caaaattatc aagttcctct tttatcagta 480
tatgttcaag ctgcaaattt acatttatca gttttgagag atgtttcagt gtttggacaa 540
aggtggggat ttgatgccgc gactatcaat agtcgttata atgatttaac taggcttatt 600
ggcaactata cagatcatgc tgtacgctgg tacaatacgg gattagagcg tgtatgggga 660
ccggattcta gagattggat aagatataat caatttagaa gagaattaac actaactgta 720
ttagatatcg tttctctatt tccgaactat gatagtagaa cgtatccaat tcgaacagtt 780
tcccaattaa caagagaaat ttatacaaac ccagtattag aaaattttga tggtagtttt 840
cgaggctcgg ctcagggcat agaaggaagt attaggagtc cacatttgat ggatatactt 900
aacagtataa ccatctatac ggatgctcat agaggagaat attattggtc agggcatcaa 960
ataatggctt ctcctgtagg gttttcgggg ccagaattca cttttccgct atatggaact 1020atgggaaatg cagctccaca acaacgtatt
acattatcgt ccactttata tagaagacct
tctgttcttg acgggacaga atttgcttat
tacagaaaaa gcggaacggt agattcgctg
ccacctaggc aaggatttag tcatcgatta
agtaatagta gtgtaagtat aataagagct
gaatttaata atataattcc ttcatcacaa
aatcttggct ctggaacttc tgtcgttaaa
cgaagaactt cacctggcca gatttcaacc
caaagatatc gggtaagaat tcgctacgct
attgacggaa gacctattaa tcaggggaat
ttacagtccg gaagctttag gactgtaggt
tcaagtgtat ttacgttaag tgctcatgtc
cgaattgaat ttgttccggc agaagtaacc
caaaaggcgg tgaatgagct gtttacttct
acggattatc atattgatca agtatccaat
ctggatgaaa aaaaagaatt gtccgagaaa
cggaatttac ttcaagatcc aaactttaga
agaggaagta cggatattac catccaagga
acgctattgg gtacctttga tgagtgctat
tcgaaattaa aagcctatac ccgttaccaa
ttagaaatct atttaattcg ctacaatgcc
ggttccttat ggccgctttc agccccaagt
catttctcct tggacattga tgttggatgt
gtgatattca agattaagac gcaagatggc
gaagagaaac cattagtagg agaagcacta
agagacaaac gtgaaaaatt ggaatgggaa
tctgtagatg ctttatttgt aaactctcaa
gcgatgattc atgcggcaga taaacgcgtt
ctgtctgtga ttccgggtgt caatgcggct
actgcattct ccctatatga tgcgagaaat
gttgctcaac taggtcaggg cgtgtataga 1080
tttaatatag ggataaataa tcaacaacta 1140
ggaacctcct caaatttgcc atccgctgta 1200
gatgaaatac cgccacagaa taacaacgtg 1260
agccatgttt caatgtttcg ttcaggcttt 1320
cctatgttct cttggataca tcgtagtgct 1380
attacacaaa tacctttaac aaaatctact 1440
ggaccaggat ttacaggagg agatattctt 1500
ttaagagtaa atattactgc accattatca 1560
tctaccacaa atttacaatt ccatacatca 1620
ttttcagcaa ctatgagtag tgggagtaat 1680
tttactactc cgtttaactt ttcaaatgga 1740
ttcaattcag gcaatgaagt ttatatagat 1800
tttgaggcag aatatgattt agaaagagca 1860
tccaatcaaa tcgggttaaa aacagatgtg 1920
ttagttgagt gtttatctga tgaattttgt 1980
gtcaaacatg cgaagcgact tagtgatgag 2040
gggatcaata gacaactaga ccgtggctgg 2100
ggcgatgacg tattcaaaga gaattacgtt 2160
ccaacgtatt tatatcaaaa aatagatgag 2220
ttaagagggt atatcgaaga tagtcaagac 2280
aaacacgaaa cagtaaatgt gccaggtacg 2340
ccaatcggaa aatgtgccca tcattcccat 2400
acagacttaa atgaggactt aggtgtatgg 24 60
catgcaagac taggaaatct agaatttctc 2520
gctcgtgtga aaagagcgga gaaaaaatgg 2580
acaaatattg tttataaaga ggcaaaagaa 2640
tatgatagat tacaagcgga taccaacatc 2700
catagcattc gagaagctta tctgcctgag 27 60
atttttgaag aattagaagg gcgtattttc 2820
gtcattaaaa atggtgattt taataatggc 2880ttatcctgct ggaacgtgaagtccttgttg ttccggaatgcgtggctata tccttcgtgtattcatgaga tcgagaacaagtatatccaa acaacacggtggtacgtaca cttctcgtaaccagctgatt atgcatcagcccttgtgaat ctaacagaggaaagaattag agtacttcccggaacattca tcgtggacag
<210> SEQ ID No: 8<211> Comprimento: 3468<212> Tipo: DNA
<213> Organismo: Seqüência Artificial<220> Características:
<223> Outras informações: Seqüência sintética baseada em Bacillus thuringiensis<400> Seqüência: 8
atggacaaca accccaacat caacgagtgc atcccctaca actgcctgag caaccccgag 60
gtggaggtgc tgggcggcga gcgcatcgag accggctaca cccccatcga catcagcctg 120
agcctgaccc agttcctgct gagcgagttc gtgcccggcg ccggcttcgt gctgggcctg 180
gtggacatca tctggggcat cttcggcccc agccagtggg acgccttcct ggtgcagatc 240
gagcagctga tcaaccagcg catcgaggag ttcgcccgca accaggccat cagccgcctg 300
gagggcctga gcaacctgta ccagatctac gccgagagct tccgcgagtg ggaggccgac 360
cccaccaacc ccgccctgcg cgaggagatg cgcatccagt tcaacgacat gaacagcgcc 420
ctgaccaccg ccatccccct gttcgccgtg cagaactacc aggtgcccct gctgagcgtg 480
tacgtgcagg ccgccaacct gcacctgagc gtgctgcgcg acgtgagcgt gttcggccag 540
cgctggggct tcgacgccgc caccatcaac agccgctaca acgacctgac ccgcctgatc 600
ggcaactaca ccgaccacgc cgtgcgctgg tacaacaccg gcctggagcg cgtgtggggc 660
cccgacagcc gcgactggat ccgctacaac cagttccgcc gcgagctgac cctgaccgtg 720
ctggacatcg tgagcctgtt ccccaactac gacagccgca cctaccccat ccgcaccgtg 780
agccagctga cccgcgagat ctacaccaac cccgtgctgg agaacttcga cggcagcttc 840
agggcatgta gatgtagaag aacaaaacaa ccaccgttcg 2940
ggaagcagaa gtgtcacaag aagttcgtgt ctgtccgggt 3000
cacagcgtac aaggagggat atggagaagg ttgcgtaacc 3060
tacagacgaa ctgaagttta gcaactgtgt agaagaggaa 3120
aacgtgtaat gattatactg cgactcaaga agaatatgag 3180
tcgaggatat gacggagcct atgaaagcaa ttcttctgta 3240
ctatgaagaa aaagcatata cagatggacg aagagacaat 3300
atatggggat tacacaccac taccagctgg ctatgtgaca 3360
agaaaccgat aaggtatgga ttgagatcgg agaaacggaa 3420
cgtggaatta cttcttatgg aggaataa 3468cgcggcagcg cccagggcat cgagggcagc atccgcagcc cccacctgat ggacatcctg 900
aacagcatca ccatctacac cgacgcccac cgcggcgagt actactggag cggccaccag 960
atcatggcca gccccgtggg cttcagcggc cccgagttca ccttccccct gtacggcacc 1020
atgggcaacg ccgcccccca gcagcgcatc gtggcccagc tgggccaggg cgtgtaccgc 1080
accctgagca gcaccctgta ccgccgcccc ttcaacatcg gcatcaacaa ccagcagctg 1140
agcgtgctgg acggcaccga gttcgcctac ggcaccagca gcaacctgcc cagcgccgtg 1200
taccgcaaga gcggcaccgt ggacagcctg gacgagatcc ccccccagaa caacaacgtg 1260
cccccccgcc agggcttcag ccaccgcctg agccacgtga gcatgttccg cagcggcttc 1320
agcaacagca gcgtgagcat catccgcgcc cccatgttca gctggatcca ccgcagcgcc 1380
gagttcaaca acatcatccc cagcagccag atcacccaga tccccctgac caagagcacc 1440
aacctgggca gcggcaccag cgtggtgaag ggccccggct tcaccggcgg cgacatcctg 1500
cgccgcacca gccccggcca gatcagcacc ctgcgcgtga acatcaccgc ccccctgagc 1560
cagcgctacc gcgtgcgcat ccgctacgcc agcaccacca acctgcagtt ccacaccagc 1620
atcgacggcc gccccatcaa ccagggcaac ttcagcgcca ccatgagcag cggcagcaac 1680
ctgcagagcg gcagcttccg caccgtgggc ttcaccaccc ccttcaactt cagcaacggc 1740
agcagcgtgt tcaccctgag cgcccacgtg ttcaacagcg gcaacgaggt gtacatcgac 1800
cgcatcgagt tcgtgcccgc cgaggtgacc ttcgaggccg agtacgacct ggagcgcgcc 1860
cagaaggccg tgaacgagct gttcaccagc agcaaccaga tcggcctgaa gaccgacgtg 1920
accgactacc acatcgacca ggtgagcaac ctggtggagt gcctgagcga cgagttctgc 1980
ctggacgaga agaaggagct gagcgagaag gtgaagcacg ccaagcgcct gagcgacgag 2040
cgcaacctgc tgcaggaccc caacttccgc ggcatcaacc gccagctgga ccgcggctgg 2100
cgcggcagca ccgacatcac catccagggc ggcgacgacg tgttcaagga gaactacgtg 2160
accctgctgg gcaccttcga cgagtgctac cccacctacc tgtaccagaa gatcgacgag 2220
agcaagctga aggcctacac ccgctaccag ctgcgcggct acatcgagga cagccaggac 2280
ctggagatct acctgatccg ctacaacgcc aagcacgaga ccgtgaacgt gcccggcacc 2340
ggcagcctgt ggcccctgag cgcccccagc cccatcggca agtgcgccca ccacagccac 2400
cacttcagcc tggacatcga cgtgggctgc accgacctga acgaggacct gggcgtgtgg 2460
gtgatcttca agatcaagac ccaggacggc cacgcccgcc tgggcaacct ggagttcctg 2520
gaggagaagc ccctggtggg cgaggccctg gcccgcgtga agcgcgccga gaagaagtgg 2580
cgcgacaagc gcgagaagct ggagtgggag accaacatcg tgtacaagga ggccaaggag 2640
agcgtggacg ccctgttcgt gaacagccag tacgaccgcc tgcaggccga caccaacatc 2700gccatgatcc acgccgccga caagcgcgtg cacagcatcc gcgaggccta cctgcccgag 2760
ctgagcgtga tccccggcgt gaacgccgcc atcttcgagg agctggaggg ccgcatcttc 2820
accgccttca gcctgtacga cgcccgcaac gtgatcaaga acggcgactt caacaacggc 2880
ctgagctgct ggaacgtgaa gggccacgtg gacgtggagg agcagaacaa ccaccgcagc 2940
gtgctggtgg tgcccgagtg ggaggccgag gtgagccagg aggtgcgcgt gtgccccggc 3000
cgcggctaca tcctgcgcgt gaccgcctac aaggagggct acggcgaggg ctgcgtgacc 3060
atccacgaga tcgagaacaa caccgacgag ctgaagttca gcaactgcgt ggaggaggag 3120
gtgtacccca acaacaccgt gacctgcaac gactacaccg ccacccagga ggagtacgag 3180
ggcacctaca ccagccgcaa ccgcggctac gacggcgcct acgagagcaa cagcagcgtg 3240
cccgccgact acgccagcgc ctacgaggag aaggcctaca ccgacggccg ccgcgacaac 3300
ccctgcgaga gcaaccgcgg ctacggcgac tacacccccc tgcccgccgg ctacgtgacc 3360
aaggagctgg agtacttccc cgagaccgac aaggtgtgga tcgagatcgg cgagaccgag 3420
ggcaccttca tcgtggacag cgtggagctg ctgctgatgg aggagtag 3468
<210> SEQ ID No: 9<211> Comprimento: 1947<212> Tipo: DNA
<213> Organismo: Seqüência Artificial<220> Caracteristicas:
<223> Outras informações: Seqüência sintética baseada em Bacillus thuringiensis<400> Seqüência: 9
atggacaaca accccaacat caacgagtgc atcccctaca actgcctgag caaccccgag 60
gtggaggtgc tgggcggcga gcgcatcgag accggctaca cccccatcga catcagcctg 120
agcctgaccc agttcctgct gagcgagttc gtgcccggcg ccggcttcgt gctgggcctg 180
gtggacatca tctggggcat cttcggcccc agccagtggg acgccttcct ggtgcagatc 240
gagcagctga tcaaccagcg catcgaggag ttcgcccgca accaggccat cagccgcctg 300
gagggcctga gcaacctgta ccaaatctac gccgagagct tccgcgagtg ggaggccgac 360
cccaccaacc ccgccctgcg cgaggagatg cgcatccagt tcaacgacat gaacagcgcc 420
ctgaccaccg ccatccccct gttcgccgtg cagaactacc aggtgcccct gctgagcgtg 480
tacgtgcagg ccgccaacct gcacctgagc gtgctgcgcg acgtcagcgt gttcggccag 540
cgctggggct tcgacgccgc caccatcaac agccgctaca acgacctgac ccgcctgatc 600
ggcaactaca ccgaccacgc cgtgcgctgg tacaacaccg gcctggagcg cgtgtggggt 660cccgacagcc gcgactggat caggtacaac cagttccgcc gcgagctgac cctgaccgtg 720
ctggacatcg tgagcctgtt ccccaactac gacagccgca cctaccccat ccgcaccgtg 780
agccagctga cccgcgagat ttacaccaac cccgtgctgg agaacttcga cggcagcttc 840
cgcggcagcg cccagggcat cgagggcagc atccgcagcc cccacctgat ggacatcctg 900
aacagcatca ccatctacac cgacgcccac cgcggcgagt actactggag cggccaccag 960
atcatggcca gccccgtcgg cttcagcggc cccgagttca ccttccccct gtacggcacc 1020
atgggcaacg ctgcacctca gcagcgcatc gtggcacagc tgggccaggg agtgtaccgc 1080
accctgagca gcaccctgta ccgtcgacct ttcaacatcg gcatcaacaa ccagcagctg 1140
agcgtgctgg acggcaccga gttcgcctac ggcaccagca gcaacctgcc cagcgccgtg 1200
taccgcaaga gcggcaccgt ggacagcctg gacgagatcc cccctcagaa caacaacgtg 1260
ccacctcgac agggcttcag ccaccgtctg agccacgtga gcatgttccg cagtggcttc 1320
agcaacagca gcgtgagcat catccgtgca cctatgttca gctggattca ccgcagtgcc 1380
gagttcaaca acatcatccc cagcagccaa atcacccaga tccccctgac caagagcacc 1440
aacctgggca gcggcaccag cgtggtgaag ggccccggct tcaccggcgg cgacatcctg 1500
cgccgcacca gccccggcca gatcagcacc ctgcgcgtga acatcaccgc ccccctgagc 1560
cagcgctacc gcgtccgcat ccgctacgcc agcaccacca acctgcagtt ccacaccagc 1620
atcgacggcc gccccatcaa ccagggcaac ttcagcgcca ccatgagcag cggcagcaac 1680
ctgcagagcg gcagcttccg caccgtgggc ttcaccaccc ccttcaactt cagcaacggc 1740
agcagcgtgt tcaccctgag cgcccacgtg ttcaacagcg gcaacgaggt gtacatcgac 1800
cgcatcgagt tcgtgcccgc cgaggtgacc ttcgaggccg agtacgacct ggagagggct 1860
cagaaggccg tgaacgagct gttcaccagc agcaaccaga tcggcctgaa gaccgacgtg 1920
accgactacc acatcgatca ggtgtag 1947
<210> SEQ ID No: 10<211> Comprimento: 3468<212> Tipo: DNA
<213> Organismo: Seqüência Artificial<220> Características:
<223> Outras informações: Seqüência sintética baseada em Bacillus thuringiensis<400> Seqüência: 10
atggacaaca accccaacat caacgagtgc atcccctaca actgcctgag caaccccgag 60gtggaggtgc tgggcggcga gcgcatcgag accggctaca cccccatcga catcagcctg 120agcctgaccc agttcctgct gagcgagttc gtgcccggcg ccggcttcgt gctgggcctg 180
gtggacatca tctggggcat cttcggcccc agccagtggg acgccttcct ggtgcagatc 240
gagcagctga tcaaccagcg catcgaggag ttcgcccgca accaggccat cagccgcctg 300
gagggcctga gcaacctgta ccaaatctac gccgagagct tccgcgagtg ggaggccgac 360
cccaccaacc ccgccctgcg cgaggagatg cgcatccagt tcaacgacat gaacagcgcc 420
ctgaccaccg ccatccccct gttcgccgtg cagaactacc aggtgcccct gctgagcgtg 480
tacgtgcagg ccgccaacct gcacctgagc gtgctgcgcg acgtcagcgt gttcggccag 540
cgctggggct tcgacgccgc caccatcaac agccgctaca acgacctgac ccgcctgatc 600
ggcaactaca ccgaccacgc cgtgcgctgg tacaacaccg gcctggagcg cgtgtggggt 660
cccgacagcc gcgactggat caggtacaac cagttccgcc gcgagctgac cctgaccgtg 720
ctggacatcg tgagcctgtt ccccaactac gacagccgca cctaccccat ccgcaccgtg 780
agccagctga cccgcgagat ttacaccaac cccgtgctgg agaacttcga cggcagcttc 840
cgcggcagcg cccagggcat cgagggcagc atccgcagcc cccacctgat ggacatcctg 900
aacagcatca ccatctacac cgacgcccac cgcggcgagt actactggag cggccaccag 960
atcatggcca gccccgtcgg cttcagcggc cccgagttca ccttccccct gtacggcacc 1020
atgggcaacg ctgcacctca gcagcgcatc gtggcacagc tgggccaggg agtgtaccgc 1080
accctgagca gcaccctgta ccgtcgacct ttcaacatcg gcatcaacaa ccagcagctg 1140
agcgtgctgg acggcaccga gttcgcctac ggcaccagca gcaacctgcc cagcgccgtg 1200
taccgcaaga gcggcaccgt ggacagcctg gacgagatcc cccctcagaa caacaacgtg 1260
ccacctcgac agggcttcag ccaccgtctg agccacgtga gcatgttccg cagtggcttc 1320
agcaacagca gcgtgagcat catccgtgca cctatgttca gctggattca ccgcagtgcc 1380
gagttcaaca acatcatccc cagcagccag atcacccaga tccccctgac caagagcacc 1440
aacctgggca gcggcaccag cgtggtgaag ggccccggct tcaccggcgg cgacatcctg 1500
cgccgcacca gccccggcca gatcagcacc ctgcgcgtga acatcaccgc ccccctgagc 1560
cagcgctacc gcgtccgcat ccgctacgcc agcaccacca acctgcagtt ccacaccagc 1620
atcgacggcc gccccatcaa ccagggcaac ttcagcgcca ccatgagcag cggcagcaac 1680
ctgcagagcg gcagcttccg caccgtgggc ttcaccaccc ccttcaactt cagcaacggc 1740
agcagcgtgt tcaccctgag cgcccacgtg ttcaacagcg gcaacgaggt gtacatcgac 1800
cgcatcgagt tcgtgcccgc cgaggtgacc ttcgaggccg agtacgacct ggagagggct 1860
cagaaggccg tgaacgagct gttcaccagc agcaaccaga tcggcctgaa gaccgacgtg 1920
accgactacc acatcgatca ggtgagcaac ctggtggagt gcctgagcga cgagttctgc 1980ctggacgaga agaaggagct gagcgagaag gtgaagcacg ccaagcgcct gagcgacgag 2040
cgcaacctgc tgcaggaccc caacttccgc ggcatcaacc gccagctgga ccgcggctgg 2100
cgcggcagca ccgacatcac catccagggc ggcgacgacg tgttcaagga gaactacgtg 2160
accctgctgg gcaccttcga cgagtgctac cccacctacc tgtaccagaa gatcgacgag 2220
agcaagctga aggcctacac ccgctaccag ctgcgcggct acatcgagga cagccaggac 2280
ctggagatct acctgatccg ctacaacgcc aagcacgaga ccgtgaacgt gcccggcacc 2340
ggcagcctgt ggcccctgag cgcccccagc cccatcggca agtgcgccca ccacagccac 2400
cacttcagcc tggacatcga cgtgggctgc accgacctga acgaggacct gggcgtgtgg 24 60
gtgatcttca agatcaagac ccaggacggc cacgcccgcc tgggcaacct ggagttcctg 2520
gaggagaagc ccctggtggg cgaggccctg gcccgcgtga agcgcgccga gaagaagtgg 2580
cgcgacaagc gcgagaagct ggagtgggag accaacatcg tgtacaagga ggccaaggag 2640
agcgtggacg ccctgttcgt gaacagccag tacgaccgcc tgcaggccga caccaacatc 2700
gccatgatcc acgccgccga caagcgcgtg cacagcattc gcgaggccta cctgcccgag 2760
ctgagcgtga tccccggcgt gaacgccgcc atcttcgagg agctggaggg ccgcatcttc 2820
accgccttca gcctgtacga cgcccgcaac gtgatcaaga acggcgactt caacaacggc 2880
ctgagctgct ggaacgtgaa gggccacgtg gacgtggagg agcagaacaa ccaccgcagc 2940
gtgctggtgg tgcccgagtg ggaggccgag gtgagccagg aggtgcgcgt gtgccccggc 3000
cgcggctaca tcctgcgcgt gaccgcctac aaggagggct acggcgaggg ctgcgtgacc 3060
atccacgaga tcgagaacaa caccgacgag ctcaagttca gcaactgcgt ggaggaggag 3120
gtgtacccca acaacaccgt gacctgcaac gactacaccg ccacccagga ggagtacgag 3180
ggcacctaca ccagccgcaa ccgcggctac gacggcgcct acgagagcaa cagcagcgtg 3240
cccgccgact acgccagcgc ctacgaggag aaggcctaca ccgacggccg ccgcgacaac 3300
ccctgcgaga gcaaccgcgg ctacggcgac tacacccccc tgcccgccgg ctacgtgacc 3360
aaggagctgg agtacttccc cgagaccgac aaggtgtgga tcgagatcgg cgagaccgag 3420
ggcaccttca tcgtggacag cgtggagctg ctgctgatgg aggagtag 3468
<210> SEQ ID No: 11<211> Comprimento: 1845<212> Tipo: DNA
<213> Organismo: Seqüência Artificial<220> Características:
<223> Outras informações: Seqüência sintética baseada em Bacillus thuringiensis<400> Seqüência: 11
atggacaaca acccaaacat caacgaatgc attccataca actgcttgag taacccagaa 60
gttgaagtac ttggtggaga acgcattgaa accggttaca ctcccatcga catctccttg 120
tccttgacac agtttctgct cagcgagttc gtgccaggtg ctgggttcgt tctcggacta 180
gttgacatca tctggggtat ctttggtcca tctcaatggg atgcattcct ggtgcaaatt 240
gagcagttga tcaaccagag gatcgaagag ttcgccagga accaggccat ctctaggttg 300
gaaggattga gcaatctcta ccaaatctat gcagagagct tcagagagtg ggaagccgat 360
cctactaacc cagctctccg cgaggaaatg cgtattcaat tcaacgacat gaacagcgcc 420
ttgaccacag ctatcccatt gttcgcagtc cagaactacc aagttcctct cttgtccgtg 480
tacgttcaag cagctaatct tcacctcagc gtgcttcgag acgttagcgt gtttgggcaa 540
aggtggggat tcgatgctgc aaccatcaat agccgttaca acgaccttac taggctgatt 600
ggaaactaca ccgaccacgc tgttcgttgg tacaacactg gcttggagcg tgtctggggt 660
cctgattcta gagattggat tagatacaac cagttcagga gagaattgac cctcacagtt 720
ttggacattg tgtctctctt cccgaactat gactccagaa cctaccctat ccgtacagtg 780
tcccaactta ccagagaaat ctatactaac ccagttcttg agaacttcga cggtagcttc 840
cgtggttctg cccaaggtat cgaaggctcc atcaggagcc cacacttgat ggacatcttg 900
aacagcataa ctatctacag cgatgctcac agaggagagt attactggtc tggacaccag 960
atcatggcct ctccagttgg attcagcggg cccgagttta cctttcctct ctatggaact 1020
atgggaaacg ccgctccaca acaacgtatc gttgctcaac taggtcaggg tgtctacaga 1080
accttgtctt ccaccttgta cagaagaccc ttcaatatcg gtatcaacaa ccagcaactt 1140
tccgttcttg acggaacaga gttcgcctat ggaacctctt ctaacttgcc atccgctgtt 1200
tacagaaaga gcggaaccgt tgattccttg gacgaaatcc caccacagaa caacaatgtg 1260
ccacccaggc aaggattctc ccacaggttg agccacgtgt ccatgttccg ttccggattc 1320
agcaacagtt ccgtgagcat catcagagct cctatgttct catggattca tcgtagtgct 1380
gagttcaaca atatcattcc ttcctctcaa atcacccaaa tcccattgac caagtctact 1440
aaccttggat ctggaacttc tgtcgtgaaa ggaccaggct tcacaggagg tgatattctt 1500
agaagaactt ctcctggcca gattagcacc ctcagagtta acatcactgc accactttct 1560
caaagatatc gtgtcaggat tcgttacgca tctaccacta acttgcaatt ccacacctcc 1620
atcgacggaa ggcctatcaa tcagggtaac ttctccgcaa ccatgtcaag cggcagcaac 1680
ttgcaatccg gcagcttcag aaccgtcggt ttcactactc ctttcaactt ctctaacgga 1740
tcaagcgttt tcacccttag cgctcatgtg ttcaattctg gcaatgaagt gtacattgac 1800cgtattgagt ttgtgcctgc cgaagttacc ttcgaggctg agtac 1845
<210> SEQ ID No: 12<211> Comprimento: 1833<212> Tipo: DNA
<213> Organismo: Seqüência Artificial<220> Características:
<223> Outras informações: Seqüência sintética baseada em Bacillus thuringiensis<400> Seqüência: 12
atggctgcag acaacaacac ggaggccctc gatagctcta ccaccaaaga tgtcattcag 60
aagggcatct ccgttgtggg tgatctcctt ggcgttgttg gtttcccctt tggtggtgcc 120
cttgtttcgt tctacactaa ctttctgaat actatttggc ccagcgaaga cccttggaag 180
gcttttatgg agcaagtgga agctttgatg gatcagaaga tcgctgatta tgcaaagaac 240
aaagctcttg ctgagctcca gggccttcag aacaacgtcg aagattatgt gagtgcactg 300
agttcatggc aaaagaatcc tgtgtcctca cgaaatccac atagccaggg gcgcataagg 360
gagctgttct ctcaagcaga aagtcacttc cggaattcaa tgccttcctt tgccatctct 420
gggtacgagg ttctctttct tacaacctac gctcaagctg ccaacacaca tctgttctta 480
ctaaaagacg ctcaaatcta tggtgaagaa tggggatacg agaaagaaga tatcgctgag 540
ttctacaagc gtcaactaaa acttactcaa gagtatactg accactgtgt caaatggtat 600
aatgttggat tggataagtt gagaggttca tcttatgaat cttgggtaaa ctttaaccgg 660
taccgcagag agatgacatt gacagtgctc gacttgattg cactatttcc attgtatgat 720
gttcgactct acccaaagga ggttaaaacc gaattgacta gagacgtttt aaccgatccc 780
attgtcggag tcaacaacct cagaggctac ggaacaacct tctctaacat agaaaactac 840
attcgtaaac cacatctatt cgactatctg cacagaattc agtttcacac gcggttccaa 900
ccaggatact atggaaatga ctctttcaac tattggtccg gtaattatgt ttcaactaga 960
cccagcatag gatctaatga catcatcacc tctccattct acggaaacaa gtcctccgag 1020
cctgtgcaaa acttggagtt taatggagag aaagtctata gagccgtggc caataccaat 1080
cttgccgtct ggccgtccgc tgtgtactca ggtgttacca aagtggaatt cagccaatac 1140
aatgatcaga cagatgaagc aagtactcaa acttacgact caaagaggaa tgttggcgcg 1200
gtcagctggg attctatcga tcaactccct ccagaaacca ccgatgaacc tctagagaag 1260
ggttatagcc atcaactcaa ttacgtaatg tgctttctca tgcagggtag tagaggtacc 1320
atcccagtgt taacttggac tcacaagagt gtagacttct tcaacatgat tgattcgaaa 1380aagattactc aacttccgtt ggtaaaggcc tacaagttac aatctggtgc ttccgttgtc 1440
gcaggtccta ggtttacagg aggagatatc attcaatgca ctgagaatgg gtccgcggca 1500
actatctacg ttacacctga tgtgtcgtac tctcaaaagt atcgtgctag aattcattat 1560
gcttctacct ctcagataac attcacacta agcttggacg gggctccatt caaccaatac 1620
tacttcgata agaccatcaa caaaggagac acactcacgt ataattcatt caacttagcc 1680
agcttcagca ctccattcga attgtcaggg aacaacttgc agataggcgt cacaggattg 1740
agtgctggtg acaaggttta catcgacaag attgagttca ttccagtgaa ccttaggtcc 1800
ccaggaaccg agcttgagtt catcgacatc tag 1833
<210> SEQ ID No: 13<211> Comprimento: 216<212> Tipo: DNA
<213> Organismo: Seqüência Artificial<220> Características:
<223> Outras informações: Seqüência sintética baseada em Bacillus thuringiensis<400> Seqüência: 13
atgaagaaga acggctacgc cgtggacagc agcggcaagg ccccagagtg cctcctcagc 60aactactgca acaaccagtg caccaaggtg cactacgccg acaagggcta ctgctgcctc 120ctcagctgct actgcttcgg cctcaacgac gacaagaagg tgcttgagat cagcgacacc 180aggaagagct actgcgacac caccatcatc aactaa 216
<210> SEQ ID No: 14<211> Comprimento: 192<212> Tipo: DNA
<213> Organismo: Seqüência Artificial<220> Características:
<223> Outras informações: Seqüência sintética baseada em Bacillus thuringiensis<400> Seqüência: 14
atggccgacg gctacgtgaa gggcaaaagc ggctgcaaaa tcagctgctt cctggacaac 60gacctgtgca acgccgactg caaatactac ggcggcaaac tgaacagctg gtgcatccca 120gacaaaagcg gctactgctg gtgcccaaac aaaggctgga acagcatcaa aagcgagacc 180aacacctgct aa 192
<210> SEQ ID No: 15<211> Comprimento: 1905<212> Tipo: DNA
<213> Organismo: Seqüência Artificial<220> Características:
<223> Outras informações: Seqüência sintética baseada em Bacillus thuringiensis<400> Seqüência: 15
atgggacaca acgtccttaa taacgaacgt aacacagtct gtgaagcaca caacgtggcc 60
gttcgcgacc ctttctcatt cgagcacaaa tcactaaaca ctgttgagaa ggagtggact 120
gagtggaaga gaaacgacca ttcgctatat gttgacccga tcgttggaac cgtggcttca 180
ttcttgctca agaaggtggg ttctctcgtt ggtaagagga ttctctcgga actaaggagc 240
ttgatcttcc cctccggtag cacaaatctc atgcaggata tactccgtga gaccgagaag 300
ttcctgaacc agcgactgaa cacggacacc ttggcacgag ttaatgctga attgacaggt 360
ctacaggcaa atgtcgagga gttcaatcgc caagttgaca acttcctaaa tcccaatcgt 420
aacgccttgc ctttgtctat tacgtcgtcc gtcaacacga tgcagcagct attcttgaac 480
cggttaccac aattccagat ccaaggctac caattgttgt tactcccgtt attcgcccaa 540
gctgctaatc ttcacctgag cttcatcagg gatgtcatcc taaatgcaga cgagtggggc 600
atatcggcag ctacactacg tacttatcga aaccatctga ggaactacac gcgtgactac 660
tcaaactact gtatcaacac ctatcagact gccttccgtg gcctgaatac aaggctccac 720
gatatgttgg agtttcggac atacatgttc ctgaacgtgt tcgagtatgt ctccatctgg 780
tcgcttttca agtaccagtc attgctggtc tcgtcaggtg ctaacctata cgcaagtgga 840
agtggacctc agcaaaccca atcgttcacg agtcaagact ggccattcct gtatagcttg 900
ttccaggtca actccaacta cgtgctgaac ggcttctcag gtgctcgatt gtcccagact 960
ttcccaaaca tcgttggact tccaggaaca actacgactc atgccttgct ggctgcacga 1020
gtcaactact ctggtggagt ttcaagtggc gatattggag cttcgccgtt caaccagaac 1080
ttcagttgca gcacattcct gcctcctttg cttacgccat tcgttagatc ctggctcgac 1140
agtggaagtg atcgaggggg agttaatact gtgaccaact ggcagacaga gagtttcgag 1200
acaacactcg gtctacgatc aggagcattc acagcaagag gaaacagcaa ctacttccca 1260
gactacttca tccgaaacat ctctggagta cctctagtcg ttaggaacga agaccttcgt 1320
cgtcctctgc actacaatca gatcaggaac attgagtcac cttcaggtac acctggtgga 1380
gcacgagcat acatggtctc agttcacaac cgtaagaaca acatctacgc agttcatgag 1440
aacggaacga tgatccactt ggctccagag gactacaccg gatttacaat cagtcctatc 1500
cacgccactc aggtgaacaa ccagactcga acgttcatca gtgagaagtt tggaaaccaa 1560
ggcgattctc tgaggtttga gcagagtaat accacggcaa ggtacactct caggggtaat 1620
ggaaactctt acaacctata cttgcgtgtc tccagcatag gcaattcaac tatcagggtt 1680accatcaacg gtcgagtgta cacagctaca aacgtcaata ccaccactaa caacgatggt 1740
gtaaacgaca atggtgctcg cttcagcgac atcaacatcg gaaacgtagt cgcgagcgac 1800
aacagcaacg tacctctgga cattaacgtt acgttgaact caggcacaca gttcgatttg 1860
atgaacatca tgtttgttcc gacaaaccta ccaccattgt attag 1905
<210> SEQ ID No: 16 <211> Comprimento: 1179 <212> Tipo: DNA <213> Organismo: Rhyzopus oryzae
<400> Seqüência: 16
atggtttcat tcatttccat ttctcaaggt gttagtcttt gtcttcttgt ctcttccatg 60
atgctcggtt catctgctgt tcctgtttct ggtaaatctg gatcttccac taccgccgtc 120
tctgcatctg acaattctgc cctccctcct ctcatttcca gccgttgtgc tcctccttct 180
aacaagggaa gtaaaagcga tcttcaagct gaaccttact acatgcaaaa gaatacagaa 240
tggtatgagt cccatggtgg caacctgaca tccatcggaa agcgagatga caatttggtt 300
ggtggcatga ctttggattt acctagcgat gctcctccta tcagcctctc tggatctacc 360
aacagcgcct ctgatggtgg taaggttgtt gctgctacta ctgctcaaat tcaagagttc 420
accaagtatg ctggtatcgc tgccactgcc tactgtcgtt ctgttgtccc tggtaacaag 480
tgggactgtg tccaatgtca aaagtgggtt cctgatggca agatcatcac tacctttacc 540
tccttgcttt ccgacacaaa tggttacgtc ttgagaagtg ataaacaaaa gaccatttat 600
cttgttttcc gtggtaccaa ctccttcaga agtgccatca ctgatattgt cttcaacttt 660
tccgactaca agcctgtcaa gggcgccaag gttcatgctg gtttcctttc ctcttatgag 720
caagttgtca atgactattt ccctgtcgtc caagaacaac tgaccgccaa ccctacttac 780
aaggtcatcg tcaccggtca ctcactcggt ggtgcacaag ctttgcttgc cggtatggat 840
ctctaccaac gtgaaccaag actgtctccc aagaatttga gcatcttcac tgttggtggt 900
cctcgtgttg gtaaccccac ctttgcttac tatgttgaat ctaccggtat tcctttccaa 960
cgtaccgttc acaagagaga tatcgttcct cacgttcctc ctcaatcctt cggattcctt 1020
catcccggtg ttgaatcttg gattaagtct ggtacctcca acgttcaaat ctgtacttct 1080
gaaattgaaa ccaaggattg cagtaactct atcgttcctt tcacctctct ccttgatcac 1140
ttgagttact ttgatatcaa cgaaggaagc tgtttgtaa 1179
Claims (62)
1. Um método para desenhar uma molécula de ácido nucléicocodificando um polipeptideo para a expressão do referidopolipeptideo em uma planta, caracterizado por compreenderalterar pelo menos um códon de uma molécula de ácidonucléico para um códon alterado, onde o referido códonalterado é selecionado a partir de um grupo consistindo decódons apresentando uma freqüência de uso em um ou maisvírus vegetais que é maior do que aquela do referido códonda referida molécula de ácido nucléico.
2. Método de acordo com a reivindicação 1, caracterizadopelo fato de que o referido códon alterado apresenta umafreqüência de uso em um ou mais vírus vegetais que é maiordo que 0,09.
3. Método de acordo com a reivindicação 1, caracterizadopelo fato de que o referido códon alterado apresenta umafreqüência de uso em um ou mais vírus vegetais que é igualou maior do que a freqüência mediana de uso de códon para umaminoácido codificado pelo referido códon alterado em um oumais ditos vírus vegetais, onde a referida freqüênciamediana de uso de códon é a mediana das freqüências de usode códon em um ou mais vírus vegetais para todos os códonscodificando o referido aminoácido.
4. Método de acordo com a reivindicação 1, caracterizadopelo fato de que pelo menos 30% dos códons na referidamolécula de ácido nucléico compreendendo pelo menos um códonalterado são códons alterados.
5. Método de acordo com a reivindicação 1, caracterizadopelo fato de que um número igual ou maior de códonsalterados existe em uma primeira parte de uma molécula deácido nucléico compreendendo pelo menos um códon alterado doque em uma segunda parte da referida molécula de ácidonucléico, na qual a primeira parte está a 5' da referidasegunda parte.
6. Método de acordo com a reivindicação 5, caracterizadopelo fato de que a primeira parte consiste de um terço dareferida molécula de ácido nucléico e a referida segundaparte consiste de dois terços da referida molécula de ácidonucléico.
7. Método de acordo com a reivindicação 5, caracterizadopelo fato de que a primeira parte consiste de um quarto dareferida molécula de ácido nucléico e a referida segundaparte consiste de três quartos da referida molécula de ácidonucléico.
8. Método de acordo com a reivindicação 5, caracterizadopelo fato de que as ditas primeira e segunda partes dareferida molécula de ácido nucléico são iguais emcomprimento e a referida primeira parte tem um número maiordos referidos códons alterados.
9. Método de acordo com a reivindicação 1, caracterizadopelo fato de que a expressão do referido polipeptídeo em umaplanta, codificado por uma molécula de ácido nucléicocompreendendo pelo menos um códon alterado provoca a mudançaem um fenótipo da referida planta quando comparada com umaplanta que não expressa o referido polipeptídeo.
10. Método de acordo com a reivindicação 1, caracterizadopelo fato de que a expressão da referida molécula de ácidonucléico compreendendo pelo menos um códon alterado provocaa mudança em um fenótipo da referida planta quando comparadacom uma planta que expressa uma molécula de ácido nucléicoque não contém pelo menos um códon alterado, no qual asreferidas moléculas de ácido nucléico codificam o mesmopolipeptídeo.
11. Método de acordo com a reivindicação 9 ou 10,caracterizado pelo fato de que o referido fenótipo éselecionado a partir de um grupo consistindo de resistênciaa inseto, tolerância a inseto, resistência a doença,tolerância a doença, resistência a nematódeo, tolerância anematódeo, tolerância a seca, tolerância a sal, tolerância ametal pesado, desintoxicação de metais pesados, baixo teorde fitato, alta eficiência no uso de nitrogênio, aumento daprodução, estabilidade da produção aumentada, teornutricional aumentado; teor aumentado de açúcar,desenvolvimento e vigor aumentados, digestibilidadeaumentada, expressão de polipeptídeos terapêuticos, síntesede produtos farmacêuticos não-polipeptídeos, resistência aum agente de seleção, fluorescência, luminescência,atividade recombinase, e esterilidade masculina.
12. Método de acordo com a reivindicação 9 ou 10,caracterizado pelo fato de que o referido fenótipo é aexpressão aumentada do referido polipeptídeo na referidaplanta.
13. Método de acordo com a reivindicação 1, caracterizadopelo fato de que a referida planta é uma plantamonocotiledônea.
14. Método de acordo com a reivindicação 13, caracterizadopelo fato de que a referida planta monocotiledônea éselecionada de um grupo consistindo' de cevada, milho,milheto, aveia, arroz, e trigo.
15. Método de acordo com a reivindicação 14, caracterizadopelo fato de que a referida planta monocotiledônea é milho.
16. Método de acordo com a reivindicação 1, caracterizadopelo fato de que a referida planta é uma plantadicotiledônea.
17. Método de acordo com a reivindicação 16, caracterizadopelo fato de que a referida planta dicotiledônea éselecionada a partir de um grupo consistindo de batata,soja, tabaco, e tomate.
18. Método de acordo com a reivindicação 17, caracterizadopelo fato de que a referida planta dicotiledônea é umaplanta de soja.
19. Método de acordo com a reivindicação 1 ou 13,caracterizado pelo fato de que um ou mais vírus vegetais sãovírus de plantas monocotiledôneas.
20. Método de acordo com a reivindicação 19, caracterizadopelo fato de que pelo menos um códon codificaa) alanina e o referido códon alterado é selecionadoa partir de um grupo consistindo de GCA e GCT;b) arginina e o referido códon alterado é selecionadoa partir de um grupo consistindo de AGA, AGG, eCGT;c) asparagina e o referido códon alterado é AAT;d) ácido aspártico e o referido códon alterado é GAT;e) cisteína e o referido códon alterado é TGT;f) glutamina e o referido códon alterado é CAA;g) ácido glutâmico e o referido códon alterado é GAA;h) glicina e o referido códon alterado é selecionado a partir de um grupo consistindo GGA e GGT;i) histidina e o referido códon alterado é CAT;j) isoleucina e o referido códon alterado éselecionado a partir de um grupo consistindo ATA eATT;k) leucina e o referido códon alterado é selecionadoa partir de um grupo consistindo CTT, TTA, e TTG;l) lisina e o referido códon alterado é AAA;m) fenilalanina e o referido códon alterado é TTT;n) prolina e o referido códon alterado é selecionadoa partir de um grupo consistindo CCA e CCT;o) serina e o referido códon alterado é selecionado apartir de um grupo consistindo AGT, TCA, e TCT;p) treonina e o referido códon alterado é selecionadoa partir de um grupo consistindo ACA e ACT;q) tirosina e o referido códon alterado é TAT; our) valina e o referido códon alterado é selecionado apartir de um grupo consistindo GTG e GTT.
21. Método de acordo com a reivindicação 19, caracterizadopelo fato de que o referido vírus ou mais vírus de plantasmonocotiledôneas são vírus específicos de milho.
22. Método de acordo com a reivindicação 21, caracterizadopelo fato de que pelo menos um códon codificaa) alanina e o referido códon alterado é selecionadoa partir de um grupo consistindo de GCA e GCT;b) arginina e o referido códon alterado é selecionadoa partir de um grupo consistindo de AGA, AGG, eCGT;c) asparagina e o referido códon alterado é AAT;d) ácido aspártico e o referido códon alterado é GAT;e) cisteína e o referido códon alterado é TGT;f) glutamina e o referido códon alterado éselecionado a partir do grupo consistindo de CAA eCAG;g) ácido glutâmico e o referido códon alterado é GAA;h) glicina e o referido códon alterado é selecionadoa partir de um grupo consistindo GGA e GGT;i) histidina e o referido códon alterado é CAT;j) isoleucina e o referido códon alterado éselecionado a partir de um grupo consistindo ATA eATT;k) leucina e o referido códon alterado é selecionadoa partir de um grupo consistindo CTT, TTA, e TTG;1) lisina e o referido códon alterado é AAG;m) fenilalanina e o referido códon alterado é TTC;n) prolina e o referido códon alterado é selecionadoa partir de um grupo consistindo CCA e CCT;o) serina e o referido códon alterado é selecionado apartir de um grupo consistindo TCC, TCA, e TCT;p) treonina e o referido códon alterado é selecionadoa partir de um grupo consistindo ACA e ACT;q) tirosina e o referido códon alterado é TAT; our) valina e o referido códon alterado é selecionado apartir de um grupo consistindo GTG e GTT.
23. Método de acordo com a reivindicação 21, caracterizadopelo fato de que a referida freqüência de uso em um ou maisvírus vegetais é baseada em moléculas de ácido nucléicocodificando polipeptídeos da capa e polipeptídeos docapsídeo de vírus de milho.
24. Método de acordo com a reivindicação 23, caracterizadopelo fato de que pelo menos um códon codificaa) alanina e o referido códon alterado é selecionadoa partir do grupo consistindo de GCA e GCT;b) arginina e o referido códon alterado é selecionadoa partir do grupo consistindo de AGA, AGG, e CGA;c) asparagina e o referido códon alterado é AAC;d) ácido aspártico e o referido códon alterado é GAT;e) cisteína e o referido códon alterado é TGC;f) glutamina e o referido códon alterado é CAA;g) ácido glutâmico e o referido códon alterado é GAG;h) glicina e o referido códon alterado é selecionadoa partir do grupo consistindo GGA e GGG;i) histidina e o referido códon alterado é CAT;j) isoleucina e o referido códon alterado éselecionado a partir do grupo consistindo ATC eATT;k) leucina e o referido códon alterado é selecionadoa partir do grupo consistindo CTG, CTC, e TTG;l) lisina e o referido códon alterado é AAG;m) fenilalanina e o referido códon alterado é TTC;n) prolina e o referido códon alterado é selecionadoa partir do grupo consistindo CCA e CCT;o) serina e o referido códon alterado é selecionado apartir do grupo consistindo TCC, TCA, e AGC;p) treonina e o referido códon alterado é selecionadoa partir do grupo consistindo ACA e ACT;q) tirosina e o referido códon alterado é TAT; our) valina e o referido códon alterado é selecionado apartir do grupo consistindo GTC, GTG e GTT.
25. Método de acordo com a reivindicação 1 ou 16,caracterizado pelo fato de que o referido ou mais vírusvegetais são vírus de plantas dicotiledoneas.
26. Método de acordo com a reivindicação 25, caracterizadopelo fato de que o referido ou mais vírus de plantasdicotiledoneas são vírus específicos de soja.
27. Método de acordo com a reivindicação 25, caracterizadopelo fato de que a referida freqüência de uso em um ou maisvírus vegetais é baseada em moléculas de ácido nucléicocodificando polipeptídeos da capa e polipeptídeos docapsídeo de vírus de plantas dicotiledôneas.
28. Método de acordo com a reivindicação 27, caracterizadopelo fato de que pelo menos um códon codificaa) alanina e o referido códon alterado é selecionadoa partir do grupo consistindo de GCC e GCT;b) arginina e o referido códon alterado é selecionadoa partir do grupo consistindo de AGA, AGG, e CGT;c) asparagina e o referido códon alterado é AAT;d) ácido aspártico e o referido códon alterado é GAT;e) cisteína e o referido códon alterado é TGT;f) glutamina e o referido códon alterado é CAA;g) ácido glutâmico e o referido códon alterado é GAA;h) glicina e o referido códon alterado é selecionadoa partir do grupo consistindo GGA e GGT;i) histidina e o referido códon alterado é CAT;j) isoleucina e o referido códon alterado éselecionado a partir do grupo consistindo ATA eATT;k) leucina e o referido códon alterado é selecionadoa partir do grupo consistindo CTT, TTA, e TTG;1) lisina e o referido códon alterado é AAG;m) fenilalanina e o referido códon alterado é TTT;n) prolina e o referido códon alterado é selecionadoa parir do grupo consistindo CCA, CCC e CCT;-o) serina e o referido códon alterado é selecionado apartir do grupo consistindo AGT, TCA, e TCT;p) treonina e o referido códon alterado é selecionadoa partir do grupo consistindo ACA, ACC e ACT;q) tirosina e o referido códon alterado é TAT; our) valina e o referido códon alterado é selecionado apartir do grupo consistindo GTG e GTT.
29. Método de acordo com a reivindicação 1, caracterizadopelo fato de que uma molécula de ácido nucléicocompreendendo pelo menos um códon alterado tem umafreqüência de uso de códon alterado para todos os resíduosde aminoácidos de pelo menos um tipo de aminoácido que é amesma ou substancialmente similar a freqüência de uso em umou mais vírus vegetais.
30. Método de acordo com a reivindicação 29, caracterizadopelo fato de que o referido ou mais vírus vegetais são vírusde plantas monocotiledôneas.
31. Método de acordo com a reivindicação 30, caracterizadopelo fato de que o referido tipo de aminoácido éa) alanina e a referida freqüência de uso de códon éGCA (0.31), GCC (0.21), GCG (0.14), GCT (0.34);b) arginina e a referida freqüência de uso de códon éAGA (0.32), AGG (0.17), CGA(0.14), CGC (0.14), CGG(0.09), e CGT (0.16) ;c) asparagina e a referida freqüência de uso de códoné AAC (0.42) e AAT (0.58);d) ácido aspártico e a referida freqüência de uso decódon é GAC (0.38) e GAT(0.62);e) cisteína e a referida freqüência de uso de códon éTGC (0.44) e TGT (0.56);f) glutamina e a referida freqüência de uso de códoné CAA (0.58) e CAG (0.42);g) ácido glutâmico e a referida freqüência de uso decódon é GAA (0.60) e GAG(0.4 0);h) glicina e a referida freqüência de uso de códon éGGA (0.37), GGC (0.20), GGG(0.14), e GGT (0.28);i) histidina e a referida freqüência de uso de códoné CAC (0.43) e CAT (0.57);j) isoleucina e a referida freqüência de uso de códoné ATA (0.30), ATC (0.29), e ATT (0.41);k) leucina e referida freqüência de uso de códon éCTA (0.13), CTC (0.14), CTG(0.13), CTT (0.18), TTA(0.21), e TTG (0.21);l) lisina e a referida freqüência de uso de códon éAAA (0.53) e AAG (0.4 7);m) fenilalanina e a referida freqüência de uso decódon é TTC (0.46) e TTT (0.54);n) prolina e a referida freqüência de uso de códon éCCA (0.38), CCC (0.17), CCG (0.14), e CCT (0.31);o) serina e a referida freqüência de uso de códon éAGC (0.13), AGT (0.18), TCA (0.24), TCC (0.14),TCG (0.10), e TCT (0.21);p) treonina e a referida freqüência de uso de códon éACA (0.30), ACC (0.20), ACG(0.16), e ACT (0.34);q) tirosina e a referida freqüência de uso de códon éTAC (0.43) e TAT (0.57); OUr) valina e a referida freqüência de uso de códon éGTA (0.19), GTC (0.21) , GTG (0.25), e GTT (0.36).
32. Método de acordo com a reivindicação 30, caracterizadopelo fato de que os referidos vírus de plantasmonocotiledôneas são vírus específicos de milho.
33. Método de acordo com a reivindicação 32, caracterizadopelo fato de que o referido tipo de aminoácido éa) alanina e a referida freqüência de uso de códon éGCA (0.31), GCC (0.30), GCG (0.11), e GCT (0.28);b) arginina e a referida freqüência de uso de códon éAGA (0.27), AGG (0.17), CGA (0.12), CGC (0.19),CGG (0.12), e CGT (0.13);c) asparagina e a referida freqüência de uso de códoné AAC (0.44) e AAT (0.56);d) ácido aspártico e a referida freqüência de uso decódon é GAC (0.41) e GAT (0.59);e) cisteína e a referida freqüência de uso de códon éTGC (0.42) e TGT (0.58);f) glutamina e a referida freqüência de uso de códoné CAA (0.50) e CAG (0.50);g) ácido glutâmico e a referida freqüência de uso decódon é GAA (0.52) e GAG (0.48);h) glicina e a referida freqüência de uso de códon éGGA (0.36), GGC (0.23), GGG (0.17), e GGT (0.24);i) histidina e a referida freqüência de uso de códoné CAC (0.45), CAT (0.55);j) isoleucina e a referida freqüência de uso de códoné ATA (0.27), ATC (0.30), e ATT (0.43);k) leucina e referida freqüência de uso de códon éCTA (0.12), CTC (0.22), CTG (0.16), CTT (0.19),TTA (0.14), e TTG (0.18);-1) lisina e a referida freqüência de uso de códon éAAA (0.49) e AAG (0.51);m) fenilalanina e a referida freqüência de uso decódon é TTC (0.56) e TTT (0.44);n) prolina e a referida freqüência de uso de códon éCCA (0.31), CCC (0.20), CCG (0.17), e CCT (0.32);o) serina e a referida freqüência de uso de códon éAGC (0.12), AGT (0.12), TCA (0.22), TCC (0.21),TCG (0.10), e TCT (0.22);p) treonina e a referida freqüência de uso de códon éACA (0.32), ACC (0.26), ACG (0.13), e ACT (0.29);q) tirosina e a referida freqüência de uso de códonTAC (0.46) e TAT (0.54); our) valina e a referida freqüência de uso de códon éGTA (0.16), GTC (0.25) , GTG (0.26), e GTT (0.33).
34. Método de acordo com a reivindicação 32, caracterizadopelo fato de que a referida freqüência de uso de códon em umou mais vírus vegetais é baseada em moléculas de ácidonucléico que codificam polipeptídeo da capa e polipeptídeodo capsídeo de vírus que atacam milho.
35. Método de acordo com a reivindicação 32, caracterizadofato de que o referido tipo de aminoácido éa) alanina e a referida freqüência de uso de códon éGCA (0.38), GCC (0.22), GCG (0.14), e GCT (0.26);b) arginina e a referida freqüência de uso de códon éAGA (0.30), AGG (0.18), CGA (0.18), CGC (0.16),CGG (0.11), e CGT (0.07);c) asparagina e a referida freqüência de uso de códoné AAC (0.53) e AAT (0.47);d) ácido aspártico e a referida freqüência de uso decódon é GAC (0.45) e GAT (0.55);e) cisteína e a referida freqüência de uso de códon éTGC (0.53) e TGT (0.47) ;f) glutamina e a referida freqüência de uso de códoné CAA (0.52) e CAG (0.48);g) ácido glutâmico e a referida freqüência de uso decódon é GAA (0.44) e GAG (0.56);h) glicina e a referida freqüência de uso de códon éGGA (0.42), GGC (0.18), GGG (0.23), e GGT (0.18);i) histidina e a referida freqüência de uso de códoné CAC (0.35) e CAT (0.65);j) isoleucina e a referida freqüência de uso de códoné ATA (0.24), ATC (0.36), e ATT (0.40);k) leucina e a referida freqüência de uso de códon éCTA (0.12), CTC (0.18), CTG (0.25), CTT (0.12),TTA (0.10), e TTG (0.23);l) lisina e a referida freqüência de uso de códon éAAA (0.48) e AAG (0.52);m) fenilalanina e a referida freqüência de uso decódon é TTC (0.57) e TTT (0.43);n) prolina e a referida freqüência de uso de códon éCCA (0.32), CCC (0.24), CCG (0.12), e CCT (0.32);o) serina e a referida freqüência de uso de códon éAGC (0.19), AGT (0.13), TCA (0.21), TCC (0.26),TCG (0.06), e TCT (0.15);p) treonina e a referida freqüência de uso de códon éACA (0.36), ACC (0.27), ACG (0.06) e ACT (0.31);q) tirosina e a referida freqüência de uso de códon éTAC (0.41) e TAT (0.59), our) valina e a referida freqüência de uso de códon éGTA (0.15), GTC (0.26) , GTG (0.36), e GTT (0.23).
36. Método de acordo com a reivindicação 29, caracterizadopelo fato de que o referido vírus ou mais vírus vegetais sãovírus de plantas dicotiledôneas.
37. Método de acordo com a reivindicação 36, caracterizadopelo fato de que o referido tipo de aminoãcido éa) alanina e a referida freqüência de uso de códon éGCA (0.33), GCC (0.21), GCG (0.13), e GCT (0.33);b) arginina e a referida freqüência de uso de códon éAGA (0.34), AGG (0.23), CGA (0.11), CGC (0.09),CGG (0.08), e CGT (0.15);c) asparagina e a referida freqüência de uso de códoné AAC (0.41) e AAT (0.59);d) ácido aspártico e a referida freqüência de uso decódon é GAC (0.37) e GAT (0.63);e) cisteína e a referida freqüência de uso de códon éTGC (0.41) e TGT (0.59);f) glutamina e a referida freqüência de uso de códoné CAA (0.60) e CAG (0.40);g) ácido glutâmico e a referida freqüência de uso decódon é GAA (0.61) e GAG (0.39);h) glicina e a referida freqüência de uso de códon éGGA (0.35), GGC (0.18), GGG (0.18), e GGT (0.29);i) histidina e a referida freqüência de uso de códoné CAC (0.43) e CAT (0.57);j) isoleucina e a referida freqüência de uso de códoné ATA (0.31), ATC (0.28), e ATT (0.41);k) leucina e a referida freqüência de uso de códon éCTA (0.12), CTC (0.14), CTG (0.12), CTT (0.19),TTA (0.22), e TTG (0.21);l) lisina e a referida freqüência de uso de códon éAAA (0.54) e AAG (0.46);m) fenilalanina e a referida freqüência de uso decódon é TTC (0.44) e TTT (0.56);n) prolina e a referida freqüência de uso de códon éCCA (0.38), CCC (0.18), CCG (0.12), e CCT (0.31);o) serina e a referida freqüência de uso de códon éAGC (0.14), AGT (0.20), TCA (0.23), TCC (0.14),TCG (0.08), e TCT (0.21);p) treonina e a referida freqüência de uso de códon éACA (0.36), ACC (0.20), ACG (0.14) e ACT (0.31);q) tirosina e a referida freqüência de uso de códon éTAC (0.41) e TAT (0.59); our) valina e a referida freqüência de uso de códon éGTA (0.19), GTC (0.21) , GTG (0.25), e GTT (0.35).
38. Método de acordo com a reivindicação 36, caracterizadopelo fato de que a referida freqüência de uso em um ou maisvírus vegetais é baseada em moléculas de ácido nucléico quecodificam polipeptídeos da capa e polipeptídeos do capsídeode vírus vegetais que atacam dicotiledôneas.
39. Método de acordo com a reivindicação 38, caracterizadopelo fato de que o referido tipo de aminoácido éa) alanina e a referida freqüência de uso de códon éGCA (0.24), GCC (0.27), GCG (0.15), e GCT (0.34);arginina e a referida freqüência de uso de códon éAGA (0.24), AGG (0.22), CGA (0.12), CGC (0.10),CGG (0 .11) , e CGT (0.21) ;asparagina e a referida freqüência de uso de códoné AAC (0.44) e AAT (0.56);ácido aspártico e a referida freqüência de uso decódon é GAC (0.32) e GAT (0.68);cisteína e a referida freqüência de uso de códon éTGC (0.25) e TGT (0.75);glutamina e a referida freqüência de uso de códoné CAA (0.59) e CAG (0.41);ácido glutâmico e a referida freqüência de uso decódon é GAA (0.61) e GAG (0.39);glicina e a referida freqüência de uso de códon éGGA (0.32), GGC (0.20), GGG (0.18), e GGT (0.30);histidina e a referida freqüência de uso de códoné CAC (0.35) e CAT (0.65);isoleucina e a referida freqüência de uso de códoné ATA (0.39), ATC (0.26), e ATT (0.35);leucina e a referida freqüência de uso de códon éCTA (0.10), CTC (0.13), CTG (0.12), CTT (0.14),TTA (0.28), e TTG (0.23);lisina e a referida freqüência de uso de códon éAAA (0.45) e AAG (0.55);m) fenilalanina e a referida freqüência de uso decódon é TTC (0.47) e TTT (0.53) ;n) prolina e a referida freqüência de uso de códon éCCA (0.27), CCC (0.27), CCG (0.14), e CCT (0.33);-o) serina e a referida freqüência de uso de códon éAGC (0.15), AGT (0.19), TCA (0.18), TCC (0.14),TCG (0.11), e TCT (0.24) ;P) treonina e a referida freqüência de uso de códon éACA (0.25), ACC (0.25), ACG (0.16) e ACT (0.34);q) tirosina e a referida freqüência de uso de códon éTAC (0.37) e TAT (0.63), our) valina e a referida freqüência de uso de códon éGTA (0.17), GTC (0.23) , GTG (0.25), e GTT (0.35).
40. Método de acordo com a reivindicação 36, caracterizadopelo fato de que o referido vírus vegetal ou demais vírus dedicotiledôneas é um vírus específico para plantas de soja.
41. Método de acordo com a reivindicação 1, caracterizadopelo fato de que o referido polipeptídeo é um polipeptídeoinseticida.
42. Método de acordo com a reivindicação 41, caracterizadopelo fato de que o referido polipeptídeo inseticida é umpolipeptídeo códon-otimizado baseado em um polipeptídeo deBacillus thuringiensis ou Rhyzopus oryzae.
43. Método de acordo com a reivindicação 42, caracterizadopelo fato de que o referido polipeptideo inseticida deBacillus thuringiensis é 4 37N.
44. Método de acordo com a reivindicação 43, caracterizadopelo fato de que o referido polipeptideo inseticida códon-otimizado de Bacillus thuringiens compreende a seqüência deaminoácido de SEQ ID NO:2.
45. Método de acordo com a reivindicação 42, caracterizadopelo fato de que o referido polipeptideo inseticida deRhyzopus oryzae é lipase inseticida.
46. Método de acordo com a reivindicação 45, caracterizadopelo fato de que o referido polipeptideo inseticida códon-otimizado de Rhyzopus oryzae compreende a seqüência deaminoácido de SEQ ID NO:4.
47. Uma molécula de ácido nucléico caracterizada porcompreender pelo menos um códon alterado, no qual a referidamolécula de ácido nucléico é desenhada de acordo com ométodo da reivindicação 1.
48. Molécula de ácido nucléico de acordo com areivindicação 47, caracterizada pelo fato de que a referidamolécula de ácido nucléico codifica um polipeptideoinseticida.
49. Molécula de ácido nucléico de acordo com areivindicação 48, caracterizada pelo fato de que o referidopolipeptídeo inseticida é um polipeptídeo inseticida códon-otimizado com base em um polipeptídeo de Bacillusthuringiensis ou Rhyzopus oryzae.
50. Molécula de ácido nucléico de acordo com areivindicação 49, caracterizada pelo fato de que o referidopolipeptídeo inseticida de Bacillus thuringiensis é 437N.
51. Molécula de ácido nucléico de acordo com areivindicação 50, caracterizada pelo fato de que o referidopolipeptídeo inseticida códon-otimizado de Bacillusthuringiensis compreende a seqüência de SEQ ID NO:l.
52. Molécula de ácido nucléico de acordo com areivindicação 49, caracterizada pelo fato de que o referidopolipeptídeo de Rhyzopus oryzae é lipase inseticida.
53. Molécula de ácido nucléico de acordo com areivindicação 52, caracterizada pelo fato de que o referidopolipeptídeo inseticida códon-otimizado de Rhyzopus oryzaecompreende a seqüência de SEQ ID NO:3.
54. Uma molécula de ácido nucléico, caracterizada porcompreender SEQ ID NO:l ou o complemento desta.
55. Uma molécula de ácido nucléico, caracterizada porcompreender SEQ ID NO:3 ou o complemento desta.
56. Um vetor, caracterizado por compreender a molécula deácido nucléico de acordo com qualquer das reivindicações 53ou 54 .
57. Uma planta transgenica e a progênie desta,caracterizadas por compreenderem a molécula de ácidonucléico da reivindicação 56.
58. Planta transgenica de acordo com a reivindicação 57,caracterizada pelo fato de que a referida progênie sãosementes.
59. Planta transgenica de acordo com a reivindicação 57,caracterizada pelo fato de que a referida planta transgenicaé uma planta monocotiledônea.
60. Planta transgenica de acordo com a reivindicação 59,caracterizada pelo fato de que a referida planta transgenicaé selecionada a partir do grupo consistindo de cevada,milho, milheto, aveias, arroz, e trigo.
61. Planta transgenica de acordo com a reivindicação 57,caracterizada pelo fato de que a referida planta transgenicaé uma planta dicotiledônea.
62. Planta transgenica de acordo com a reivindicação 61,caracterizada pelo fato de que a referida planta transgenicaé selecionada a partir do grupo consistindo de batata, soja,tabaco, algodão, e tomate.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US66873405P | 2005-04-05 | 2005-04-05 | |
US60/668,734 | 2005-04-05 | ||
PCT/US2006/012478 WO2006107954A2 (en) | 2005-04-05 | 2006-04-04 | Methods and compositions for designing nucleic acid molecules for polypeptide expression in plants using plant virus codon-bias |
Publications (1)
Publication Number | Publication Date |
---|---|
BRPI0610521A2 true BRPI0610521A2 (pt) | 2010-06-29 |
Family
ID=37074037
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
BRPI0610521-1A BRPI0610521A2 (pt) | 2005-04-05 | 2006-04-04 | método para desenhar uma molécula de ácido nucléico, molécula de ácido nucléico, vetor, método para obtenção de uma planta transgênica e sua progênie |
Country Status (8)
Country | Link |
---|---|
US (1) | US20060236424A1 (pt) |
EP (1) | EP1866419A2 (pt) |
CN (1) | CN101238215A (pt) |
AU (1) | AU2006231503A1 (pt) |
BR (1) | BRPI0610521A2 (pt) |
CA (1) | CA2605939A1 (pt) |
MX (1) | MX2007012344A (pt) |
WO (1) | WO2006107954A2 (pt) |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8912392B2 (en) | 2007-06-29 | 2014-12-16 | Pioneer Hi-Bred International, Inc. | Methods for altering the genome of a monocot plant cell |
CA2849382C (en) | 2010-09-22 | 2021-02-16 | The Regents Of The University Of Colorado, A Body Corporate | Therapeutic applications of smad7 for the treatment of oral mucositis |
SG11201507045TA (en) * | 2013-03-08 | 2015-10-29 | Univ Colorado Regents | Ptd-smad7 therapeutics |
WO2016086988A1 (en) * | 2014-12-03 | 2016-06-09 | Wageningen Universiteit | Optimisation of coding sequence for functional protein expression |
CN108753629B (zh) * | 2018-04-03 | 2021-05-04 | 山东农业大学 | 一株具有耐盐能力的米根霉及其应用 |
KR102117811B1 (ko) | 2018-12-05 | 2020-06-02 | 대한민국(농림축산식품부 농림축산검역본부장) | 재조합 돼지파보바이러스 항원 단백질 및 이의 용도 |
CN110055263B (zh) * | 2019-03-13 | 2023-07-18 | 河南省农业科学院 | 编码Bt杀虫蛋白的基因Cry1Ab-MR、其表达载体及其应用 |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB9108386D0 (en) * | 1991-04-19 | 1991-06-05 | Agricultural Genetics Co | Modified plant viruses as vectors |
UA48104C2 (uk) * | 1991-10-04 | 2002-08-15 | Новартіс Аг | Фрагмент днк, який містить послідовність,що кодує інсектицидний протеїн, оптимізовану для кукурудзи,фрагмент днк, який забезпечує направлену бажану для серцевини стебла експресію зв'язаного з нею структурного гена в рослині, фрагмент днк, який забезпечує специфічну для пилку експресію зв`язаного з нею структурного гена в рослині, рекомбінантна молекула днк, спосіб одержання оптимізованої для кукурудзи кодуючої послідовності інсектицидного протеїну, спосіб захисту рослин кукурудзи щонайменше від однієї комахи-шкідника |
NZ308772A (en) * | 1995-05-17 | 1999-04-29 | Du Pont | Recombinant baculovirus insecticides |
US6489542B1 (en) * | 1998-11-04 | 2002-12-03 | Monsanto Technology Llc | Methods for transforming plants to express Cry2Ab δ-endotoxins targeted to the plastids |
US6982155B1 (en) * | 1999-11-26 | 2006-01-03 | Kansai Chemical Engineering Co., Ltd. | Process for producing fatty acid lower alcohol ester |
JP4404549B2 (ja) * | 2001-01-09 | 2010-01-27 | バイエル・バイオサイエンス・エヌ・ヴェー | 新規バチルス・チューリンゲンシス殺虫性タンパク質 |
WO2006028495A2 (en) * | 2004-02-20 | 2006-03-16 | Pioneer Hi-Bred International, Inc. | Lipases and methods of use |
CA2556927A1 (en) * | 2004-02-20 | 2005-09-09 | Pioneer Hi-Bred International, Inc. | Methods for enhancing insect resistance in plants |
US7208474B2 (en) * | 2004-02-25 | 2007-04-24 | Pioneer Hi-Bred International, Inc. | Bacillus thuringiensis crystal polypeptides, polynucleotides, and compositions thereof |
-
2006
- 2006-04-04 WO PCT/US2006/012478 patent/WO2006107954A2/en active Application Filing
- 2006-04-04 EP EP06749232A patent/EP1866419A2/en not_active Withdrawn
- 2006-04-04 CA CA002605939A patent/CA2605939A1/en not_active Abandoned
- 2006-04-04 CN CNA2006800199201A patent/CN101238215A/zh active Pending
- 2006-04-04 BR BRPI0610521-1A patent/BRPI0610521A2/pt not_active IP Right Cessation
- 2006-04-04 MX MX2007012344A patent/MX2007012344A/es not_active Application Discontinuation
- 2006-04-04 AU AU2006231503A patent/AU2006231503A1/en not_active Abandoned
- 2006-04-05 US US11/399,028 patent/US20060236424A1/en not_active Abandoned
Also Published As
Publication number | Publication date |
---|---|
MX2007012344A (es) | 2007-12-13 |
US20060236424A1 (en) | 2006-10-19 |
CN101238215A (zh) | 2008-08-06 |
WO2006107954A2 (en) | 2006-10-12 |
EP1866419A2 (en) | 2007-12-19 |
AU2006231503A1 (en) | 2006-10-12 |
WO2006107954A3 (en) | 2007-02-22 |
CA2605939A1 (en) | 2006-10-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
RU2234531C2 (ru) | Способы трансформации растений для экспрессии дельта-эндотоксинов bacillus thuringiensis | |
AU2011289286B2 (en) | Methods and compositions for targeting sequences of interest to the chloroplast | |
Ye et al. | Development of insect‐resistant transgenic rice with Cry1C*‐free endosperm | |
BRPI0706368A2 (pt) | composição, vetor, método para fornecer resistência ao cisto nematódeo a uma planta, proteìna de fusão, método para inibir atividade biológica, ácido nucléico isolado | |
US9994621B2 (en) | Genes encoding insecticidal proteins | |
BRPI0615087A2 (pt) | métodos e composições para a expressão de um polinucleotìdeo de interesse | |
BRPI0810672A2 (pt) | polinucleotídeo codificando uma proteína inibitória de inseto tic807, métodos para expressá-lo em uma planta, e para detectá-lo, identificá-lo ou isolá-lo assim como kit para tal, célula hospedeira transformada, métodos para controle e proteção de planta de um inseto-praga, proteína isolada, kit para sua detecção, vetor de dna recombinante para expressá-la, produto de consumo e anticorpo | |
BRPI9913089B1 (pt) | sequencia de polinucleotídeos recombinante para expressão aumentada da proteína inseticida cry3b em plantas, bem como processo para controle da infestação de insetos coleópteros | |
BRPI0610521A2 (pt) | método para desenhar uma molécula de ácido nucléico, molécula de ácido nucléico, vetor, método para obtenção de uma planta transgênica e sua progênie | |
BR122018000387B1 (pt) | Molécula de ácido nucleico isolada, vetor, célula hospedeira bacteriana, e método para proteção de uma planta contra uma praga | |
CN111433363A (zh) | 非生物胁迫耐性提高的植物和提高植物非生物胁迫耐性的多聚核苷酸及方法 | |
BR112021004034A2 (pt) | plantas terrestres geneticamente modificadas que expressam uma proteína de rendimento de sementes aumentado e/ou um rna de rendimento de sementes aumentado | |
AU2009212130B2 (en) | Methods and compositions for plant pest control | |
BR112020008931B1 (pt) | Molécula de ácido nucleico recombinante, polipeptídeo recombinante,composição, uso de uma planta transgênica, parte da planta, célula vegetal,semente ou progênie da mesma e métodos para controlar uma população de praga de insetos, para inibir o crescimento ou exterminar uma praga de insetos e para controlar uma população de pragas de inseto resistente a uma proteína pesticida | |
CN111295445A (zh) | 非生物胁迫耐性提高的植物和提高植物非生物胁迫耐性的多聚核苷酸及方法 | |
JP4527527B2 (ja) | 植物での創傷誘導発現 | |
US20190345513A1 (en) | Stacking of Insecticidal and Herbicide Resistant Triple Gene [Kalgin-4] Expression in Plant | |
US20220403403A1 (en) | Genetically modified plants that exhibit an increase in seed yield comprising a first homeolog of sugar-dependent1 ( sdp1) homozygous for a wild-type allele and a second homeolog of sdp1 homozygous for a mutant allele | |
KR20200111696A (ko) | 제미니바이러스 저항성 식물 | |
CN114667345A (zh) | 用于检测转基因事件的多核苷酸、引物和方法,遗传构建体,用于检测来自植物样品的材料的试剂盒,事件ctc91087-6,抗虫甘蔗植物,以及用于产生抗虫甘蔗植物、植物细胞、植物部分或种子的方法 | |
BRPI0807573A2 (pt) | Composições e métodos úteis para recombinação sítio-dirigida em plantas. | |
WO2017044372A1 (en) | Chloroplast transit peptides and methods of their use | |
HK1139176A (en) | Novel genes encoding insecticidal proteins | |
MXPA01001788A (en) | Improved expression of cry3b insecticidal protein in plants |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
B06F | Objections, documents and/or translations needed after an examination request according [chapter 6.6 patent gazette] | ||
B06F | Objections, documents and/or translations needed after an examination request according [chapter 6.6 patent gazette] | ||
B08F | Application fees: application dismissed [chapter 8.6 patent gazette] | ||
B08K | Patent lapsed as no evidence of payment of the annual fee has been furnished to inpi [chapter 8.11 patent gazette] |