CN101238215A - 利用植物病毒密码子偏爱性设计用于在植物中的多肽表达的核酸分子的方法和组合物 - Google Patents
利用植物病毒密码子偏爱性设计用于在植物中的多肽表达的核酸分子的方法和组合物 Download PDFInfo
- Publication number
- CN101238215A CN101238215A CNA2006800199201A CN200680019920A CN101238215A CN 101238215 A CN101238215 A CN 101238215A CN A2006800199201 A CNA2006800199201 A CN A2006800199201A CN 200680019920 A CN200680019920 A CN 200680019920A CN 101238215 A CN101238215 A CN 101238215A
- Authority
- CN
- China
- Prior art keywords
- codon
- usage frequency
- codon usage
- nucleic acid
- change
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 108700010070 Codon Usage Proteins 0.000 title claims abstract description 266
- 241000700605 Viruses Species 0.000 title claims abstract description 244
- 108020004707 nucleic acids Proteins 0.000 title claims abstract description 191
- 102000039446 nucleic acids Human genes 0.000 title claims abstract description 191
- 150000007523 nucleic acids Chemical class 0.000 title claims abstract description 191
- 108090000765 processed proteins & peptides Proteins 0.000 title claims abstract description 186
- 102000004196 processed proteins & peptides Human genes 0.000 title claims abstract description 181
- 229920001184 polypeptide Polymers 0.000 title claims abstract description 180
- 238000000034 method Methods 0.000 title claims abstract description 98
- 239000000203 mixture Substances 0.000 title description 21
- 230000000361 pesticidal effect Effects 0.000 claims abstract description 43
- 230000009261 transgenic effect Effects 0.000 claims abstract description 38
- 108020004705 Codon Proteins 0.000 claims description 404
- 241000196324 Embryophyta Species 0.000 claims description 240
- 230000008859 change Effects 0.000 claims description 143
- 150000001413 amino acids Chemical class 0.000 claims description 107
- 229940024606 amino acid Drugs 0.000 claims description 97
- 235000001014 amino acid Nutrition 0.000 claims description 97
- 240000008042 Zea mays Species 0.000 claims description 69
- 235000002017 Zea mays subsp mays Nutrition 0.000 claims description 67
- 235000005824 Zea mays ssp. parviglumis Nutrition 0.000 claims description 66
- 235000005822 corn Nutrition 0.000 claims description 66
- 241001233957 eudicotyledons Species 0.000 claims description 64
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 claims description 44
- 241000209510 Liliopsida Species 0.000 claims description 42
- 241000193388 Bacillus thuringiensis Species 0.000 claims description 32
- 229940097012 bacillus thuringiensis Drugs 0.000 claims description 32
- 238000013461 design Methods 0.000 claims description 20
- 210000000234 capsid Anatomy 0.000 claims description 18
- 235000010469 Glycine max Nutrition 0.000 claims description 16
- 244000068988 Glycine max Species 0.000 claims description 16
- 239000004471 Glycine Substances 0.000 claims description 15
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 claims description 13
- 108090001060 Lipase Proteins 0.000 claims description 13
- 240000005384 Rhizopus oryzae Species 0.000 claims description 13
- 235000013752 Rhizopus oryzae Nutrition 0.000 claims description 13
- 239000004367 Lipase Substances 0.000 claims description 12
- 102000004882 Lipase Human genes 0.000 claims description 12
- 235000019421 lipase Nutrition 0.000 claims description 12
- 229960002429 proline Drugs 0.000 claims description 12
- AGPKZVBTJJNPAG-WHFBIAKZSA-N L-isoleucine Chemical compound CC[C@H](C)[C@H](N)C(O)=O AGPKZVBTJJNPAG-WHFBIAKZSA-N 0.000 claims description 11
- 229960000310 isoleucine Drugs 0.000 claims description 11
- AGPKZVBTJJNPAG-UHFFFAOYSA-N isoleucine Natural products CCC(C)C(N)C(O)=O AGPKZVBTJJNPAG-UHFFFAOYSA-N 0.000 claims description 11
- 239000004475 Arginine Substances 0.000 claims description 10
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 claims description 10
- 229930182817 methionine Natural products 0.000 claims description 10
- 235000007688 Lycopersicon esculentum Nutrition 0.000 claims description 9
- 240000003768 Solanum lycopersicum Species 0.000 claims description 9
- 240000007594 Oryza sativa Species 0.000 claims description 7
- 235000007164 Oryza sativa Nutrition 0.000 claims description 7
- 235000013339 cereals Nutrition 0.000 claims description 7
- 235000002637 Nicotiana tabacum Nutrition 0.000 claims description 6
- 244000061176 Nicotiana tabacum Species 0.000 claims description 6
- 235000002595 Solanum tuberosum Nutrition 0.000 claims description 6
- 244000061456 Solanum tuberosum Species 0.000 claims description 6
- 239000003795 chemical substances by application Substances 0.000 claims description 6
- 235000009566 rice Nutrition 0.000 claims description 6
- 235000007340 Hordeum vulgare Nutrition 0.000 claims description 5
- 244000299507 Gossypium hirsutum Species 0.000 claims description 4
- 235000021307 Triticum Nutrition 0.000 claims description 4
- 201000010099 disease Diseases 0.000 claims description 4
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 claims description 4
- 235000007319 Avena orientalis Nutrition 0.000 claims description 3
- 229920000742 Cotton Polymers 0.000 claims description 3
- 230000000295 complement effect Effects 0.000 claims description 3
- 230000001679 anti-nematodal effect Effects 0.000 claims description 2
- 238000001784 detoxification Methods 0.000 claims description 2
- 235000019621 digestibility Nutrition 0.000 claims description 2
- 230000024346 drought recovery Effects 0.000 claims description 2
- 229940079593 drug Drugs 0.000 claims description 2
- 239000003814 drug Substances 0.000 claims description 2
- 229910001385 heavy metal Inorganic materials 0.000 claims description 2
- 230000015784 hyperosmotic salinity response Effects 0.000 claims description 2
- 239000005645 nematicide Substances 0.000 claims description 2
- 230000014075 nitrogen utilization Effects 0.000 claims description 2
- 235000015097 nutrients Nutrition 0.000 claims description 2
- 230000002194 synthesizing effect Effects 0.000 claims description 2
- 230000001225 therapeutic effect Effects 0.000 claims description 2
- WHUUTDBJXJRKMK-VKHMYHEASA-N L-glutamic acid Chemical compound OC(=O)[C@@H](N)CCC(O)=O WHUUTDBJXJRKMK-VKHMYHEASA-N 0.000 claims 16
- ZDXPYRJPNDTMRX-UHFFFAOYSA-N glutamine Natural products OC(=O)C(N)CCC(N)=O ZDXPYRJPNDTMRX-UHFFFAOYSA-N 0.000 claims 10
- XUJNEKJLAYXESH-REOHCLBHSA-N L-Cysteine Chemical compound SC[C@H](N)C(O)=O XUJNEKJLAYXESH-REOHCLBHSA-N 0.000 claims 9
- DCXYFEDJOCDNAF-REOHCLBHSA-N L-asparagine Chemical compound OC(=O)[C@@H](N)CC(N)=O DCXYFEDJOCDNAF-REOHCLBHSA-N 0.000 claims 9
- CKLJMWTZIZZHCS-REOHCLBHSA-N L-aspartic acid Chemical compound OC(=O)[C@@H](N)CC(O)=O CKLJMWTZIZZHCS-REOHCLBHSA-N 0.000 claims 9
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 claims 9
- COLNVLDHVKWLRT-QMMMGPOBSA-N L-phenylalanine Chemical compound OC(=O)[C@@H](N)CC1=CC=CC=C1 COLNVLDHVKWLRT-QMMMGPOBSA-N 0.000 claims 9
- OUYCCCASQSFEME-QMMMGPOBSA-N L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-QMMMGPOBSA-N 0.000 claims 9
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 claims 9
- XUYPXLNMDZIRQH-LURJTMIESA-N N-acetyl-L-methionine Chemical compound CSCC[C@@H](C(O)=O)NC(C)=O XUYPXLNMDZIRQH-LURJTMIESA-N 0.000 claims 9
- ONIBWKKTOPOVIA-UHFFFAOYSA-N Proline Natural products OC(=O)C1CCCN1 ONIBWKKTOPOVIA-UHFFFAOYSA-N 0.000 claims 9
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 claims 9
- AYFVYJQAPQTCCC-UHFFFAOYSA-N Threonine Natural products CC(O)C(N)C(O)=O AYFVYJQAPQTCCC-UHFFFAOYSA-N 0.000 claims 9
- 239000004473 Threonine Substances 0.000 claims 9
- 235000003704 aspartic acid Nutrition 0.000 claims 9
- OQFSQFPPLPISGP-UHFFFAOYSA-N beta-carboxyaspartic acid Natural products OC(=O)C(N)C(C(O)=O)C(O)=O OQFSQFPPLPISGP-UHFFFAOYSA-N 0.000 claims 9
- HNDVDQJCIGZPNO-UHFFFAOYSA-N histidine Natural products OC(=O)C(N)CC1=CN=CN1 HNDVDQJCIGZPNO-UHFFFAOYSA-N 0.000 claims 9
- COLNVLDHVKWLRT-UHFFFAOYSA-N phenylalanine Natural products OC(=O)C(N)CC1=CC=CC=C1 COLNVLDHVKWLRT-UHFFFAOYSA-N 0.000 claims 9
- OUYCCCASQSFEME-UHFFFAOYSA-N tyrosine Natural products OC(=O)C(N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-UHFFFAOYSA-N 0.000 claims 9
- 229960002989 glutamic acid Drugs 0.000 claims 8
- 235000007558 Avena sp Nutrition 0.000 claims 2
- 240000005979 Hordeum vulgare Species 0.000 claims 2
- 241000209140 Triticum Species 0.000 claims 2
- 102000018120 Recombinases Human genes 0.000 claims 1
- 108010091086 Recombinases Proteins 0.000 claims 1
- 125000000539 amino acid group Chemical group 0.000 claims 1
- 241000238631 Hexapoda Species 0.000 abstract description 10
- 241000607479 Yersinia pestis Species 0.000 abstract description 2
- 108090000623 proteins and genes Proteins 0.000 description 37
- 210000004027 cell Anatomy 0.000 description 29
- 108020004414 DNA Proteins 0.000 description 26
- 238000012360 testing method Methods 0.000 description 25
- 238000006243 chemical reaction Methods 0.000 description 24
- 238000004458 analytical method Methods 0.000 description 21
- COYHRQWNJDJCNA-NUJDXYNKSA-N Thr-Thr-Thr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O COYHRQWNJDJCNA-NUJDXYNKSA-N 0.000 description 18
- 239000000523 sample Substances 0.000 description 17
- 210000001161 mammalian embryo Anatomy 0.000 description 14
- 239000003550 marker Substances 0.000 description 13
- 108020004999 messenger RNA Proteins 0.000 description 12
- 238000004659 sterilization and disinfection Methods 0.000 description 11
- 210000001519 tissue Anatomy 0.000 description 11
- 206010020649 Hyperkeratosis Diseases 0.000 description 10
- UQLDLKMNUJERMK-UHFFFAOYSA-L di(octadecanoyloxy)lead Chemical compound [Pb+2].CCCCCCCCCCCCCCCCCC([O-])=O.CCCCCCCCCCCCCCCCCC([O-])=O UQLDLKMNUJERMK-UHFFFAOYSA-L 0.000 description 10
- SQGYOTSLMSWVJD-UHFFFAOYSA-N silver(1+) nitrate Chemical compound [Ag+].[O-]N(=O)=O SQGYOTSLMSWVJD-UHFFFAOYSA-N 0.000 description 10
- 230000001954 sterilising effect Effects 0.000 description 10
- 239000011550 stock solution Substances 0.000 description 10
- 244000287680 Garcinia dulcis Species 0.000 description 9
- 229930006000 Sucrose Natural products 0.000 description 9
- CZMRCDWAGMRECN-UGDNZRGBSA-N Sucrose Chemical compound O[C@H]1[C@H](O)[C@@H](CO)O[C@@]1(CO)O[C@@H]1[C@H](O)[C@@H](O)[C@H](O)[C@@H](CO)O1 CZMRCDWAGMRECN-UGDNZRGBSA-N 0.000 description 9
- 238000003556 assay Methods 0.000 description 9
- 238000013016 damping Methods 0.000 description 9
- 239000012530 fluid Substances 0.000 description 9
- 238000003119 immunoblot Methods 0.000 description 9
- 238000011534 incubation Methods 0.000 description 9
- 235000008476 powdered milk Nutrition 0.000 description 9
- 239000000243 solution Substances 0.000 description 9
- 239000005720 sucrose Substances 0.000 description 9
- 239000011782 vitamin Substances 0.000 description 9
- 229920001817 Agar Polymers 0.000 description 8
- 241000193830 Bacillus <bacterium> Species 0.000 description 8
- PVNIIMVLHYAWGP-UHFFFAOYSA-N Niacin Chemical compound OC(=O)C1=CC=CN=C1 PVNIIMVLHYAWGP-UHFFFAOYSA-N 0.000 description 8
- 244000046052 Phaseolus vulgaris Species 0.000 description 8
- 239000008272 agar Substances 0.000 description 8
- 239000000499 gel Substances 0.000 description 8
- 239000002773 nucleotide Substances 0.000 description 8
- 125000003729 nucleotide group Chemical group 0.000 description 8
- LXNHXLLTXMVWPM-UHFFFAOYSA-N pyridoxine Chemical compound CC1=NC=C(CO)C(CO)=C1O LXNHXLLTXMVWPM-UHFFFAOYSA-N 0.000 description 8
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 7
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 7
- 238000005516 engineering process Methods 0.000 description 7
- 239000012634 fragment Substances 0.000 description 7
- 239000007788 liquid Substances 0.000 description 7
- 238000007670 refining Methods 0.000 description 7
- 230000008929 regeneration Effects 0.000 description 7
- 238000011069 regeneration method Methods 0.000 description 7
- 235000013311 vegetables Nutrition 0.000 description 7
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 6
- 108700005078 Synthetic Genes Proteins 0.000 description 6
- GINJFDRNADDBIN-FXQIFTODSA-N bilanafos Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCP(C)(O)=O GINJFDRNADDBIN-FXQIFTODSA-N 0.000 description 6
- 238000001816 cooling Methods 0.000 description 6
- 238000005457 optimization Methods 0.000 description 6
- 230000001105 regulatory effect Effects 0.000 description 6
- 238000010023 transfer printing Methods 0.000 description 6
- 238000013519 translation Methods 0.000 description 6
- 230000014616 translation Effects 0.000 description 6
- 230000003612 virological effect Effects 0.000 description 6
- DGVVWUTYPXICAM-UHFFFAOYSA-N β‐Mercaptoethanol Chemical compound OCCS DGVVWUTYPXICAM-UHFFFAOYSA-N 0.000 description 6
- 239000005631 2,4-Dichlorophenoxyacetic acid Substances 0.000 description 5
- WIGIZIANZCJQQY-UHFFFAOYSA-N 4-ethyl-3-methyl-N-[2-[4-[[[(4-methylcyclohexyl)amino]-oxomethyl]sulfamoyl]phenyl]ethyl]-5-oxo-2H-pyrrole-1-carboxamide Chemical compound O=C1C(CC)=C(C)CN1C(=O)NCCC1=CC=C(S(=O)(=O)NC(=O)NC2CCC(C)CC2)C=C1 WIGIZIANZCJQQY-UHFFFAOYSA-N 0.000 description 5
- 229920002148 Gellan gum Polymers 0.000 description 5
- 108091034117 Oligonucleotide Proteins 0.000 description 5
- 229920002494 Zein Polymers 0.000 description 5
- 150000001447 alkali salts Chemical class 0.000 description 5
- 239000003292 glue Substances 0.000 description 5
- 229910001961 silver nitrate Inorganic materials 0.000 description 5
- WFKWXMTUELFFGS-UHFFFAOYSA-N tungsten Chemical compound [W] WFKWXMTUELFFGS-UHFFFAOYSA-N 0.000 description 5
- 229910052721 tungsten Inorganic materials 0.000 description 5
- 239000010937 tungsten Substances 0.000 description 5
- 238000005406 washing Methods 0.000 description 5
- 238000001262 western blot Methods 0.000 description 5
- 239000005019 zein Substances 0.000 description 5
- 229940093612 zein Drugs 0.000 description 5
- SQUHHTBVTRBESD-UHFFFAOYSA-N Hexa-Ac-myo-Inositol Natural products CC(=O)OC1C(OC(C)=O)C(OC(C)=O)C(OC(C)=O)C(OC(C)=O)C1OC(C)=O SQUHHTBVTRBESD-UHFFFAOYSA-N 0.000 description 4
- 241000219743 Lotus Species 0.000 description 4
- 235000008331 Pinus X rigitaeda Nutrition 0.000 description 4
- 235000011613 Pinus brutia Nutrition 0.000 description 4
- 241000018646 Pinus brutia Species 0.000 description 4
- 241000709769 Potato leafroll virus Species 0.000 description 4
- 108010076504 Protein Sorting Signals Proteins 0.000 description 4
- 108020004566 Transfer RNA Proteins 0.000 description 4
- 108700019146 Transgenes Proteins 0.000 description 4
- 108090000848 Ubiquitin Proteins 0.000 description 4
- 102000044159 Ubiquitin Human genes 0.000 description 4
- 239000002253 acid Substances 0.000 description 4
- LOKCTEFSRHRXRJ-UHFFFAOYSA-I dipotassium trisodium dihydrogen phosphate hydrogen phosphate dichloride Chemical compound P(=O)(O)(O)[O-].[K+].P(=O)(O)([O-])[O-].[Na+].[Na+].[Cl-].[K+].[Cl-].[Na+] LOKCTEFSRHRXRJ-UHFFFAOYSA-I 0.000 description 4
- 230000000694 effects Effects 0.000 description 4
- 239000005556 hormone Substances 0.000 description 4
- 229940088597 hormone Drugs 0.000 description 4
- 229960000367 inositol Drugs 0.000 description 4
- CDAISMWEOUEBRE-GPIVLXJGSA-N inositol Chemical compound O[C@H]1[C@H](O)[C@@H](O)[C@H](O)[C@H](O)[C@@H]1O CDAISMWEOUEBRE-GPIVLXJGSA-N 0.000 description 4
- 239000002609 medium Substances 0.000 description 4
- 230000004048 modification Effects 0.000 description 4
- 238000012986 modification Methods 0.000 description 4
- 229960003512 nicotinic acid Drugs 0.000 description 4
- 235000001968 nicotinic acid Nutrition 0.000 description 4
- 239000011664 nicotinic acid Substances 0.000 description 4
- 239000002953 phosphate buffered saline Substances 0.000 description 4
- 239000013612 plasmid Substances 0.000 description 4
- 230000008488 polyadenylation Effects 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- RADKZDMFGJYCBB-UHFFFAOYSA-N pyridoxal hydrochloride Natural products CC1=NC=C(CO)C(C=O)=C1O RADKZDMFGJYCBB-UHFFFAOYSA-N 0.000 description 4
- 150000003839 salts Chemical class 0.000 description 4
- CDAISMWEOUEBRE-UHFFFAOYSA-N scyllo-inosotol Natural products OC1C(O)C(O)C(O)C(O)C1O CDAISMWEOUEBRE-UHFFFAOYSA-N 0.000 description 4
- 230000000392 somatic effect Effects 0.000 description 4
- 241000894007 species Species 0.000 description 4
- 239000006228 supernatant Substances 0.000 description 4
- LWIHDJKSTIGBAC-UHFFFAOYSA-K tripotassium phosphate Chemical compound [K+].[K+].[K+].[O-]P([O-])([O-])=O LWIHDJKSTIGBAC-UHFFFAOYSA-K 0.000 description 4
- 229940088594 vitamin Drugs 0.000 description 4
- 235000013343 vitamin Nutrition 0.000 description 4
- 229930003231 vitamin Natural products 0.000 description 4
- 235000019158 vitamin B6 Nutrition 0.000 description 4
- 239000011726 vitamin B6 Substances 0.000 description 4
- 229940011671 vitamin b6 Drugs 0.000 description 4
- 150000003722 vitamin derivatives Chemical class 0.000 description 4
- 244000105624 Arachis hypogaea Species 0.000 description 3
- 235000010777 Arachis hypogaea Nutrition 0.000 description 3
- 235000003255 Carthamus tinctorius Nutrition 0.000 description 3
- 244000020518 Carthamus tinctorius Species 0.000 description 3
- 244000241257 Cucumis melo Species 0.000 description 3
- 235000003222 Helianthus annuus Nutrition 0.000 description 3
- 244000020551 Helianthus annuus Species 0.000 description 3
- 241000209219 Hordeum Species 0.000 description 3
- 108091092195 Intron Proteins 0.000 description 3
- ONIBWKKTOPOVIA-BYPYZUCNSA-N L-Proline Chemical compound OC(=O)[C@@H]1CCCN1 ONIBWKKTOPOVIA-BYPYZUCNSA-N 0.000 description 3
- 229930182821 L-proline Natural products 0.000 description 3
- 235000003228 Lactuca sativa Nutrition 0.000 description 3
- 240000008415 Lactuca sativa Species 0.000 description 3
- 240000004658 Medicago sativa Species 0.000 description 3
- 241001147398 Ostrinia nubilalis Species 0.000 description 3
- 235000010627 Phaseolus vulgaris Nutrition 0.000 description 3
- UIGMAMGZOJVTDN-WHFBIAKZSA-N Ser-Gly-Ser Chemical compound OC[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O UIGMAMGZOJVTDN-WHFBIAKZSA-N 0.000 description 3
- 108091081024 Start codon Proteins 0.000 description 3
- 108020005038 Terminator Codon Proteins 0.000 description 3
- 244000098338 Triticum aestivum Species 0.000 description 3
- 150000007513 acids Chemical class 0.000 description 3
- 239000002299 complementary DNA Substances 0.000 description 3
- 239000000284 extract Substances 0.000 description 3
- 238000000605 extraction Methods 0.000 description 3
- 238000001502 gel electrophoresis Methods 0.000 description 3
- 208000015181 infectious disease Diseases 0.000 description 3
- 239000002245 particle Substances 0.000 description 3
- 238000002360 preparation method Methods 0.000 description 3
- 238000004321 preservation Methods 0.000 description 3
- 239000000047 product Substances 0.000 description 3
- 102000004169 proteins and genes Human genes 0.000 description 3
- 108091008146 restriction endonucleases Proteins 0.000 description 3
- 238000010561 standard procedure Methods 0.000 description 3
- 238000012546 transfer Methods 0.000 description 3
- 230000009466 transformation Effects 0.000 description 3
- 230000001131 transforming effect Effects 0.000 description 3
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Chemical compound O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 3
- JLIDBLDQVAYHNE-YKALOCIXSA-N (+)-Abscisic acid Chemical compound OC(=O)/C=C(/C)\C=C\[C@@]1(O)C(C)=CC(=O)CC1(C)C JLIDBLDQVAYHNE-YKALOCIXSA-N 0.000 description 2
- 244000283070 Abies balsamea Species 0.000 description 2
- 235000007173 Abies balsamea Nutrition 0.000 description 2
- 244000144725 Amygdalus communis Species 0.000 description 2
- 235000011437 Amygdalus communis Nutrition 0.000 description 2
- 244000226021 Anacardium occidentale Species 0.000 description 2
- 244000099147 Ananas comosus Species 0.000 description 2
- 235000007119 Ananas comosus Nutrition 0.000 description 2
- 235000017060 Arachis glabrata Nutrition 0.000 description 2
- 235000018262 Arachis monticola Nutrition 0.000 description 2
- PNIGSVZJNVUVJA-BQBZGAKWSA-N Arg-Gly-Asn Chemical compound NC(N)=NCCC[C@H](N)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O PNIGSVZJNVUVJA-BQBZGAKWSA-N 0.000 description 2
- IDUUACUJKUXKKD-VEVYYDQMSA-N Asn-Pro-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O IDUUACUJKUXKKD-VEVYYDQMSA-N 0.000 description 2
- CYCKJEFVFNRWEZ-UGYAYLCHSA-N Asp-Ile-Asn Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(O)=O CYCKJEFVFNRWEZ-UGYAYLCHSA-N 0.000 description 2
- 235000002566 Capsicum Nutrition 0.000 description 2
- 235000009467 Carica papaya Nutrition 0.000 description 2
- 240000006432 Carica papaya Species 0.000 description 2
- 235000013912 Ceratonia siliqua Nutrition 0.000 description 2
- 240000008886 Ceratonia siliqua Species 0.000 description 2
- 235000010523 Cicer arietinum Nutrition 0.000 description 2
- 244000045195 Cicer arietinum Species 0.000 description 2
- 235000013162 Cocos nucifera Nutrition 0.000 description 2
- 244000060011 Cocos nucifera Species 0.000 description 2
- 241000723377 Coffea Species 0.000 description 2
- 241000218631 Coniferophyta Species 0.000 description 2
- 235000009847 Cucumis melo var cantalupensis Nutrition 0.000 description 2
- 235000009355 Dianthus caryophyllus Nutrition 0.000 description 2
- 240000006497 Dianthus caryophyllus Species 0.000 description 2
- KCXVZYZYPLLWCC-UHFFFAOYSA-N EDTA Chemical compound OC(=O)CN(CC(O)=O)CCN(CC(O)=O)CC(O)=O KCXVZYZYPLLWCC-UHFFFAOYSA-N 0.000 description 2
- 244000078127 Eleusine coracana Species 0.000 description 2
- 108700007698 Genetic Terminator Regions Proteins 0.000 description 2
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Natural products OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 description 2
- 239000005562 Glyphosate Substances 0.000 description 2
- 101000619708 Homo sapiens Peroxiredoxin-6 Proteins 0.000 description 2
- 241001299819 Hordeum vulgare subsp. spontaneum Species 0.000 description 2
- 244000267823 Hydrangea macrophylla Species 0.000 description 2
- 235000014486 Hydrangea macrophylla Nutrition 0.000 description 2
- 108091026898 Leader sequence (mRNA) Proteins 0.000 description 2
- 241000880493 Leptailurus serval Species 0.000 description 2
- DRWMRVFCKKXHCH-BZSNNMDCSA-N Leu-Phe-Leu Chemical compound CC(C)C[C@H]([NH3+])C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C([O-])=O)CC1=CC=CC=C1 DRWMRVFCKKXHCH-BZSNNMDCSA-N 0.000 description 2
- 235000014826 Mangifera indica Nutrition 0.000 description 2
- 240000007228 Mangifera indica Species 0.000 description 2
- 240000003183 Manihot esculenta Species 0.000 description 2
- 235000017587 Medicago sativa ssp. sativa Nutrition 0.000 description 2
- 241000234479 Narcissus Species 0.000 description 2
- 240000007817 Olea europaea Species 0.000 description 2
- 235000007195 Pennisetum typhoides Nutrition 0.000 description 2
- 239000006002 Pepper Substances 0.000 description 2
- 102100022239 Peroxiredoxin-6 Human genes 0.000 description 2
- 244000025272 Persea americana Species 0.000 description 2
- 235000008673 Persea americana Nutrition 0.000 description 2
- 240000007377 Petunia x hybrida Species 0.000 description 2
- 235000010617 Phaseolus lunatus Nutrition 0.000 description 2
- 235000005205 Pinus Nutrition 0.000 description 2
- 241000218602 Pinus <genus> Species 0.000 description 2
- 235000016761 Piper aduncum Nutrition 0.000 description 2
- 235000017804 Piper guineense Nutrition 0.000 description 2
- 240000003889 Piper guineense Species 0.000 description 2
- 235000008184 Piper nigrum Nutrition 0.000 description 2
- 229920001213 Polysorbate 20 Polymers 0.000 description 2
- CGSOWZUPLOKYOR-AVGNSLFASA-N Pro-Pro-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 CGSOWZUPLOKYOR-AVGNSLFASA-N 0.000 description 2
- 229940124158 Protease/peptidase inhibitor Drugs 0.000 description 2
- 235000008572 Pseudotsuga menziesii Nutrition 0.000 description 2
- 240000001416 Pseudotsuga menziesii Species 0.000 description 2
- 108020004511 Recombinant DNA Proteins 0.000 description 2
- 240000000528 Ricinus communis Species 0.000 description 2
- 235000004443 Ricinus communis Nutrition 0.000 description 2
- 235000007238 Secale cereale Nutrition 0.000 description 2
- 244000082988 Secale cereale Species 0.000 description 2
- ICHZYBVODUVUKN-SRVKXCTJSA-N Ser-Asn-Tyr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O ICHZYBVODUVUKN-SRVKXCTJSA-N 0.000 description 2
- SFTZWNJFZYOLBD-ZDLURKLDSA-N Ser-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CO SFTZWNJFZYOLBD-ZDLURKLDSA-N 0.000 description 2
- IFPBAGJBHSNYPR-ZKWXMUAHSA-N Ser-Ile-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O IFPBAGJBHSNYPR-ZKWXMUAHSA-N 0.000 description 2
- SQHKXWODKJDZRC-LKXGYXEUSA-N Ser-Thr-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(O)=O SQHKXWODKJDZRC-LKXGYXEUSA-N 0.000 description 2
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 2
- 240000006394 Sorghum bicolor Species 0.000 description 2
- 244000062793 Sorghum vulgare Species 0.000 description 2
- 244000046109 Sorghum vulgare var. nervosum Species 0.000 description 2
- 229910000831 Steel Inorganic materials 0.000 description 2
- 244000269722 Thea sinensis Species 0.000 description 2
- 244000299461 Theobroma cacao Species 0.000 description 2
- 235000009470 Theobroma cacao Nutrition 0.000 description 2
- AHERARIZBPOMNU-KATARQTJSA-N Thr-Ser-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O AHERARIZBPOMNU-KATARQTJSA-N 0.000 description 2
- 241001312519 Trigonella Species 0.000 description 2
- PVPAOIGJYHVWBT-KKHAAJSZSA-N Val-Asn-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](C(C)C)N)O PVPAOIGJYHVWBT-KKHAAJSZSA-N 0.000 description 2
- 235000010749 Vicia faba Nutrition 0.000 description 2
- 240000006677 Vicia faba Species 0.000 description 2
- 240000004922 Vigna radiata Species 0.000 description 2
- 235000007244 Zea mays Nutrition 0.000 description 2
- OJOBTAOGJIWAGB-UHFFFAOYSA-N acetosyringone Chemical compound COC1=CC(C(C)=O)=CC(OC)=C1O OJOBTAOGJIWAGB-UHFFFAOYSA-N 0.000 description 2
- 238000013019 agitation Methods 0.000 description 2
- 108010086434 alanyl-seryl-glycine Proteins 0.000 description 2
- 108010050025 alpha-glutamyltryptophan Proteins 0.000 description 2
- 108010047857 aspartylglycine Proteins 0.000 description 2
- 239000002585 base Substances 0.000 description 2
- 238000004166 bioassay Methods 0.000 description 2
- 239000000872 buffer Substances 0.000 description 2
- RTYJTGSCYUUYAL-YCAHSCEMSA-L carbenicillin disodium Chemical compound [Na+].[Na+].N([C@H]1[C@H]2SC([C@@H](N2C1=O)C([O-])=O)(C)C)C(=O)C(C([O-])=O)C1=CC=CC=C1 RTYJTGSCYUUYAL-YCAHSCEMSA-L 0.000 description 2
- 101150086784 cry gene Proteins 0.000 description 2
- 238000012258 culturing Methods 0.000 description 2
- 238000005520 cutting process Methods 0.000 description 2
- 230000006378 damage Effects 0.000 description 2
- 230000034994 death Effects 0.000 description 2
- 238000005238 degreasing Methods 0.000 description 2
- 230000029087 digestion Effects 0.000 description 2
- 210000002257 embryonic structure Anatomy 0.000 description 2
- 239000013604 expression vector Substances 0.000 description 2
- 239000008103 glucose Substances 0.000 description 2
- VPZXBVLAVMBEQI-UHFFFAOYSA-N glycyl-DL-alpha-alanine Natural products OC(=O)C(C)NC(=O)CN VPZXBVLAVMBEQI-UHFFFAOYSA-N 0.000 description 2
- 108010078326 glycyl-glycyl-valine Proteins 0.000 description 2
- 108010050848 glycylleucine Proteins 0.000 description 2
- XDDAORKBJWWYJS-UHFFFAOYSA-N glyphosate Chemical compound OC(=O)CNCP(O)(O)=O XDDAORKBJWWYJS-UHFFFAOYSA-N 0.000 description 2
- 229940097068 glyphosate Drugs 0.000 description 2
- 239000001963 growth medium Substances 0.000 description 2
- 238000010438 heat treatment Methods 0.000 description 2
- 238000005286 illumination Methods 0.000 description 2
- 238000003018 immunoassay Methods 0.000 description 2
- SEOVTRFCIGRIMH-UHFFFAOYSA-N indole-3-acetic acid Chemical compound C1=CC=C2C(CC(=O)O)=CNC2=C1 SEOVTRFCIGRIMH-UHFFFAOYSA-N 0.000 description 2
- 230000001939 inductive effect Effects 0.000 description 2
- 108010073472 leucyl-prolyl-proline Proteins 0.000 description 2
- 108010057821 leucylproline Proteins 0.000 description 2
- 239000012160 loading buffer Substances 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 230000035800 maturation Effects 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 235000019713 millet Nutrition 0.000 description 2
- 238000002703 mutagenesis Methods 0.000 description 2
- 231100000350 mutagenesis Toxicity 0.000 description 2
- 230000035772 mutation Effects 0.000 description 2
- 239000012785 packaging film Substances 0.000 description 2
- 229920006280 packaging film Polymers 0.000 description 2
- 235000020232 peanut Nutrition 0.000 description 2
- 239000011049 pearl Substances 0.000 description 2
- 239000000137 peptide hydrolase inhibitor Substances 0.000 description 2
- 108010051242 phenylalanylserine Proteins 0.000 description 2
- 239000004033 plastic Substances 0.000 description 2
- 229920003023 plastic Polymers 0.000 description 2
- 239000000256 polyoxyethylene sorbitan monolaurate Substances 0.000 description 2
- 235000010486 polyoxyethylene sorbitan monolaurate Nutrition 0.000 description 2
- 229910000160 potassium phosphate Inorganic materials 0.000 description 2
- 229940093916 potassium phosphate Drugs 0.000 description 2
- 235000011009 potassium phosphates Nutrition 0.000 description 2
- 238000001556 precipitation Methods 0.000 description 2
- 239000002243 precursor Substances 0.000 description 2
- 235000018102 proteins Nutrition 0.000 description 2
- 238000007789 sealing Methods 0.000 description 2
- 238000002415 sodium dodecyl sulfate polyacrylamide gel electrophoresis Methods 0.000 description 2
- 239000002689 soil Substances 0.000 description 2
- 239000010959 steel Substances 0.000 description 2
- 238000003860 storage Methods 0.000 description 2
- 239000000758 substrate Substances 0.000 description 2
- 239000003053 toxin Substances 0.000 description 2
- 231100000765 toxin Toxicity 0.000 description 2
- UZKQTCBAMSWPJD-UQCOIBPSSA-N trans-Zeatin Natural products OCC(/C)=C\CNC1=NC=NC2=C1N=CN2 UZKQTCBAMSWPJD-UQCOIBPSSA-N 0.000 description 2
- UZKQTCBAMSWPJD-FARCUNLSSA-N trans-zeatin Chemical compound OCC(/C)=C/CNC1=NC=NC2=C1N=CN2 UZKQTCBAMSWPJD-FARCUNLSSA-N 0.000 description 2
- GPRLSGONYQIRFK-MNYXATJNSA-N triton Chemical compound [3H+] GPRLSGONYQIRFK-MNYXATJNSA-N 0.000 description 2
- 238000002525 ultrasonication Methods 0.000 description 2
- 238000011144 upstream manufacturing Methods 0.000 description 2
- 238000009736 wetting Methods 0.000 description 2
- 229940023877 zeatin Drugs 0.000 description 2
- OJHZNMVJJKMFGX-RNWHKREASA-N (4r,4ar,7ar,12bs)-9-methoxy-3-methyl-1,2,4,4a,5,6,7a,13-octahydro-4,12-methanobenzofuro[3,2-e]isoquinoline-7-one;2,3-dihydroxybutanedioic acid Chemical compound OC(=O)C(O)C(O)C(O)=O.O=C([C@@H]1O2)CC[C@H]3[C@]4([H])N(C)CC[C@]13C1=C2C(OC)=CC=C1C4 OJHZNMVJJKMFGX-RNWHKREASA-N 0.000 description 1
- PIDRBUDUWHBYSR-UHFFFAOYSA-N 1-[2-[[2-[(2-amino-4-methylpentanoyl)amino]-4-methylpentanoyl]amino]-4-methylpentanoyl]pyrrolidine-2-carboxylic acid Chemical compound CC(C)CC(N)C(=O)NC(CC(C)C)C(=O)NC(CC(C)C)C(=O)N1CCCC1C(O)=O PIDRBUDUWHBYSR-UHFFFAOYSA-N 0.000 description 1
- WTLNOANVTIKPEE-UHFFFAOYSA-N 2-acetyloxypropanoic acid Chemical compound OC(=O)C(C)OC(C)=O WTLNOANVTIKPEE-UHFFFAOYSA-N 0.000 description 1
- 235000004507 Abies alba Nutrition 0.000 description 1
- 235000014081 Abies amabilis Nutrition 0.000 description 1
- 244000101408 Abies amabilis Species 0.000 description 1
- 244000178606 Abies grandis Species 0.000 description 1
- 235000017894 Abies grandis Nutrition 0.000 description 1
- 240000005020 Acaciella glauca Species 0.000 description 1
- RZVAJINKPMORJF-UHFFFAOYSA-N Acetaminophen Chemical compound CC(=O)NC1=CC=C(O)C=C1 RZVAJINKPMORJF-UHFFFAOYSA-N 0.000 description 1
- QTBSBXVTEAMEQO-UHFFFAOYSA-M Acetate Chemical compound CC([O-])=O QTBSBXVTEAMEQO-UHFFFAOYSA-M 0.000 description 1
- 102000007469 Actins Human genes 0.000 description 1
- 108010085238 Actins Proteins 0.000 description 1
- 241000702449 African cassava mosaic virus Species 0.000 description 1
- HHGYNJRJIINWAK-FXQIFTODSA-N Ala-Ala-Arg Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N HHGYNJRJIINWAK-FXQIFTODSA-N 0.000 description 1
- FVSOUJZKYWEFOB-KBIXCLLPSA-N Ala-Gln-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](C)N FVSOUJZKYWEFOB-KBIXCLLPSA-N 0.000 description 1
- HXNNRBHASOSVPG-GUBZILKMSA-N Ala-Glu-Leu Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O HXNNRBHASOSVPG-GUBZILKMSA-N 0.000 description 1
- PEIBBAXIKUAYGN-UBHSHLNASA-N Ala-Phe-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=CC=C1 PEIBBAXIKUAYGN-UBHSHLNASA-N 0.000 description 1
- RMAWDDRDTRSZIR-ZLUOBGJFSA-N Ala-Ser-Asp Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O RMAWDDRDTRSZIR-ZLUOBGJFSA-N 0.000 description 1
- OEVCHROQUIVQFZ-YTLHQDLWSA-N Ala-Thr-Ala Chemical compound C[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](C)C(O)=O OEVCHROQUIVQFZ-YTLHQDLWSA-N 0.000 description 1
- KUFVXLQLDHJVOG-SHGPDSBTSA-N Ala-Thr-Thr Chemical compound C[C@H]([C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](C)N)O KUFVXLQLDHJVOG-SHGPDSBTSA-N 0.000 description 1
- IYKVSFNGSWTTNZ-GUBZILKMSA-N Ala-Val-Arg Chemical compound C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N IYKVSFNGSWTTNZ-GUBZILKMSA-N 0.000 description 1
- CLOMBHBBUKAUBP-LSJOCFKGSA-N Ala-Val-His Chemical compound C[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N CLOMBHBBUKAUBP-LSJOCFKGSA-N 0.000 description 1
- REWSWYIDQIELBE-FXQIFTODSA-N Ala-Val-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O REWSWYIDQIELBE-FXQIFTODSA-N 0.000 description 1
- 244000291564 Allium cepa Species 0.000 description 1
- 235000002732 Allium cepa var. cepa Nutrition 0.000 description 1
- 235000001274 Anacardium occidentale Nutrition 0.000 description 1
- 101000634158 Androctonus australis Beta-insect excitatory toxin 1 Proteins 0.000 description 1
- OVVUNXXROOFSIM-SDDRHHMPSA-N Arg-Arg-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCCN=C(N)N)N)C(=O)O OVVUNXXROOFSIM-SDDRHHMPSA-N 0.000 description 1
- QPOARHANPULOTM-GMOBBJLQSA-N Arg-Asn-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCCN=C(N)N)N QPOARHANPULOTM-GMOBBJLQSA-N 0.000 description 1
- ZTKHZAXGTFXUDD-VEVYYDQMSA-N Arg-Asn-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O ZTKHZAXGTFXUDD-VEVYYDQMSA-N 0.000 description 1
- FBLMOFHNVQBKRR-IHRRRGAJSA-N Arg-Asp-Tyr Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 FBLMOFHNVQBKRR-IHRRRGAJSA-N 0.000 description 1
- DQNLFLGFZAUIOW-FXQIFTODSA-N Arg-Cys-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CS)C(=O)N[C@@H](C)C(O)=O DQNLFLGFZAUIOW-FXQIFTODSA-N 0.000 description 1
- CYXCAHZVPFREJD-LURJTMIESA-N Arg-Gly-Gly Chemical compound NC(=N)NCCC[C@H](N)C(=O)NCC(=O)NCC(O)=O CYXCAHZVPFREJD-LURJTMIESA-N 0.000 description 1
- NMRHDSAOIURTNT-RWMBFGLXSA-N Arg-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N NMRHDSAOIURTNT-RWMBFGLXSA-N 0.000 description 1
- SSZGOKWBHLOCHK-DCAQKATOSA-N Arg-Lys-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCCN=C(N)N SSZGOKWBHLOCHK-DCAQKATOSA-N 0.000 description 1
- DPLFNLDACGGBAK-KKUMJFAQSA-N Arg-Phe-Glu Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N DPLFNLDACGGBAK-KKUMJFAQSA-N 0.000 description 1
- AOHKLEBWKMKITA-IHRRRGAJSA-N Arg-Phe-Ser Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N AOHKLEBWKMKITA-IHRRRGAJSA-N 0.000 description 1
- XRNXPIGJPQHCPC-RCWTZXSCSA-N Arg-Thr-Val Chemical compound CC(C)[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)CCCNC(N)=N)[C@@H](C)O)C(O)=O XRNXPIGJPQHCPC-RCWTZXSCSA-N 0.000 description 1
- PSUXEQYPYZLNER-QXEWZRGKSA-N Arg-Val-Asn Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O PSUXEQYPYZLNER-QXEWZRGKSA-N 0.000 description 1
- VYZBPPBKFCHCIS-WPRPVWTQSA-N Arg-Val-Gly Chemical compound OC(=O)CNC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCCN=C(N)N VYZBPPBKFCHCIS-WPRPVWTQSA-N 0.000 description 1
- CPTXATAOUQJQRO-GUBZILKMSA-N Arg-Val-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O CPTXATAOUQJQRO-GUBZILKMSA-N 0.000 description 1
- 235000006264 Asimina triloba Nutrition 0.000 description 1
- XYOVHPDDWCEUDY-CIUDSAMLSA-N Asn-Ala-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O XYOVHPDDWCEUDY-CIUDSAMLSA-N 0.000 description 1
- CIBWFJFMOBIFTE-CIUDSAMLSA-N Asn-Arg-Gln Chemical compound C(C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC(=O)N)N)CN=C(N)N CIBWFJFMOBIFTE-CIUDSAMLSA-N 0.000 description 1
- KSBHCUSPLWRVEK-ZLUOBGJFSA-N Asn-Asn-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O KSBHCUSPLWRVEK-ZLUOBGJFSA-N 0.000 description 1
- RCENDENBBJFJHZ-ACZMJKKPSA-N Asn-Asn-Gln Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O RCENDENBBJFJHZ-ACZMJKKPSA-N 0.000 description 1
- LJUOLNXOWSWGKF-ACZMJKKPSA-N Asn-Asn-Glu Chemical compound C(CC(=O)O)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC(=O)N)N LJUOLNXOWSWGKF-ACZMJKKPSA-N 0.000 description 1
- HUAOKVVEVHACHR-CIUDSAMLSA-N Asn-Asp-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC(=O)N)N HUAOKVVEVHACHR-CIUDSAMLSA-N 0.000 description 1
- PAXHINASXXXILC-SRVKXCTJSA-N Asn-Asp-Tyr Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CC(=O)N)N)O PAXHINASXXXILC-SRVKXCTJSA-N 0.000 description 1
- XWFPGQVLOVGSLU-CIUDSAMLSA-N Asn-Gln-Arg Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N XWFPGQVLOVGSLU-CIUDSAMLSA-N 0.000 description 1
- VJTWLBMESLDOMK-WDSKDSINSA-N Asn-Gln-Gly Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O VJTWLBMESLDOMK-WDSKDSINSA-N 0.000 description 1
- UPALZCBCKAMGIY-PEFMBERDSA-N Asn-Gln-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O UPALZCBCKAMGIY-PEFMBERDSA-N 0.000 description 1
- HCAUEJAQCXVQQM-ACZMJKKPSA-N Asn-Glu-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O HCAUEJAQCXVQQM-ACZMJKKPSA-N 0.000 description 1
- RAQMSGVCGSJKCL-FOHZUACHSA-N Asn-Gly-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)CNC(=O)[C@@H](N)CC(N)=O RAQMSGVCGSJKCL-FOHZUACHSA-N 0.000 description 1
- UDSVWSUXKYXSTR-QWRGUYRKSA-N Asn-Gly-Tyr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)NCC(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O UDSVWSUXKYXSTR-QWRGUYRKSA-N 0.000 description 1
- SEKBHZJLARBNPB-GHCJXIJMSA-N Asn-Ile-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O SEKBHZJLARBNPB-GHCJXIJMSA-N 0.000 description 1
- JQBCANGGAVVERB-CFMVVWHZSA-N Asn-Ile-Tyr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)NC(=O)[C@H](CC(=O)N)N JQBCANGGAVVERB-CFMVVWHZSA-N 0.000 description 1
- DJIMLSXHXKWADV-CIUDSAMLSA-N Asn-Leu-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(N)=O DJIMLSXHXKWADV-CIUDSAMLSA-N 0.000 description 1
- TZFQICWZWFNIKU-KKUMJFAQSA-N Asn-Leu-Tyr Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 TZFQICWZWFNIKU-KKUMJFAQSA-N 0.000 description 1
- YXVAESUIQFDBHN-SRVKXCTJSA-N Asn-Phe-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CO)C(O)=O YXVAESUIQFDBHN-SRVKXCTJSA-N 0.000 description 1
- NPZJLGMWMDNQDD-GHCJXIJMSA-N Asn-Ser-Ile Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O NPZJLGMWMDNQDD-GHCJXIJMSA-N 0.000 description 1
- HNXWVVHIGTZTBO-LKXGYXEUSA-N Asn-Ser-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC(N)=O HNXWVVHIGTZTBO-LKXGYXEUSA-N 0.000 description 1
- ZUFPUBYQYWCMDB-NUMRIWBASA-N Asn-Thr-Glu Chemical compound NC(=O)C[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O ZUFPUBYQYWCMDB-NUMRIWBASA-N 0.000 description 1
- UXHYOWXTJLBEPG-GSSVUCPTSA-N Asn-Thr-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O UXHYOWXTJLBEPG-GSSVUCPTSA-N 0.000 description 1
- BCADFFUQHIMQAA-KKHAAJSZSA-N Asn-Thr-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O BCADFFUQHIMQAA-KKHAAJSZSA-N 0.000 description 1
- QUCCLIXMVPIVOB-BZSNNMDCSA-N Asn-Tyr-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CC2=CC=C(C=C2)O)NC(=O)[C@H](CC(=O)N)N QUCCLIXMVPIVOB-BZSNNMDCSA-N 0.000 description 1
- XEGZSHSPQNDNRH-JRQIVUDYSA-N Asn-Tyr-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XEGZSHSPQNDNRH-JRQIVUDYSA-N 0.000 description 1
- CBHVAFXKOYAHOY-NHCYSSNCSA-N Asn-Val-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O CBHVAFXKOYAHOY-NHCYSSNCSA-N 0.000 description 1
- GHWWTICYPDKPTE-NGZCFLSTSA-N Asn-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)N)N GHWWTICYPDKPTE-NGZCFLSTSA-N 0.000 description 1
- XOQYDFCQPWAMSA-KKHAAJSZSA-N Asn-Val-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O XOQYDFCQPWAMSA-KKHAAJSZSA-N 0.000 description 1
- XPGVTUBABLRGHY-BIIVOSGPSA-N Asp-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC(=O)O)N XPGVTUBABLRGHY-BIIVOSGPSA-N 0.000 description 1
- GWTLRDMPMJCNMH-WHFBIAKZSA-N Asp-Asn-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O GWTLRDMPMJCNMH-WHFBIAKZSA-N 0.000 description 1
- UGKZHCBLMLSANF-CIUDSAMLSA-N Asp-Asn-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O UGKZHCBLMLSANF-CIUDSAMLSA-N 0.000 description 1
- KNMRXHIAVXHCLW-ZLUOBGJFSA-N Asp-Asn-Ser Chemical compound C([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CO)C(=O)O)N)C(=O)O KNMRXHIAVXHCLW-ZLUOBGJFSA-N 0.000 description 1
- NURJSGZGBVJFAD-ZLUOBGJFSA-N Asp-Cys-Ser Chemical compound C([C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CO)C(=O)O)N)C(=O)O NURJSGZGBVJFAD-ZLUOBGJFSA-N 0.000 description 1
- WSXDIZFNQYTUJB-SRVKXCTJSA-N Asp-His-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(O)=O WSXDIZFNQYTUJB-SRVKXCTJSA-N 0.000 description 1
- HOBNTSHITVVNBN-ZPFDUUQYSA-N Asp-Ile-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)O)NC(=O)[C@H](CC(=O)O)N HOBNTSHITVVNBN-ZPFDUUQYSA-N 0.000 description 1
- KYQNAIMCTRZLNP-QSFUFRPTSA-N Asp-Ile-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O KYQNAIMCTRZLNP-QSFUFRPTSA-N 0.000 description 1
- XUVTWGPERWIERB-IHRRRGAJSA-N Asp-Pro-Phe Chemical compound N[C@@H](CC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](Cc1ccccc1)C(O)=O XUVTWGPERWIERB-IHRRRGAJSA-N 0.000 description 1
- QSFHZPQUAAQHAQ-CIUDSAMLSA-N Asp-Ser-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O QSFHZPQUAAQHAQ-CIUDSAMLSA-N 0.000 description 1
- JSNWZMFSLIWAHS-HJGDQZAQSA-N Asp-Thr-Leu Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)O)NC(=O)[C@H](CC(=O)O)N)O JSNWZMFSLIWAHS-HJGDQZAQSA-N 0.000 description 1
- BJDHEININLSZOT-KKUMJFAQSA-N Asp-Tyr-Lys Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCCN)C(O)=O BJDHEININLSZOT-KKUMJFAQSA-N 0.000 description 1
- 235000005638 Austrian pine Nutrition 0.000 description 1
- 235000000832 Ayote Nutrition 0.000 description 1
- 241000702286 Bean golden mosaic virus Species 0.000 description 1
- 241000702325 Beet curly top virus Species 0.000 description 1
- 235000021533 Beta vulgaris Nutrition 0.000 description 1
- 241000335053 Beta vulgaris Species 0.000 description 1
- 241000219310 Beta vulgaris subsp. vulgaris Species 0.000 description 1
- 240000002791 Brassica napus Species 0.000 description 1
- 240000008100 Brassica rapa Species 0.000 description 1
- 241000219193 Brassicaceae Species 0.000 description 1
- 235000004936 Bromus mango Nutrition 0.000 description 1
- 241001674345 Callitropsis nootkatensis Species 0.000 description 1
- 244000045232 Canavalia ensiformis Species 0.000 description 1
- 241001515826 Cassava vein mosaic virus Species 0.000 description 1
- 241000701489 Cauliflower mosaic virus Species 0.000 description 1
- 102000012286 Chitinases Human genes 0.000 description 1
- 108010022172 Chitinases Proteins 0.000 description 1
- 241000702481 Chloris striate mosaic virus Species 0.000 description 1
- 108020004998 Chloroplast DNA Proteins 0.000 description 1
- 235000007516 Chrysanthemum Nutrition 0.000 description 1
- 244000189548 Chrysanthemum x morifolium Species 0.000 description 1
- 241000207199 Citrus Species 0.000 description 1
- 241001672694 Citrus reticulata Species 0.000 description 1
- 241000037488 Coccoloba pubescens Species 0.000 description 1
- 108091026890 Coding region Proteins 0.000 description 1
- 241000220457 Crotalaria Species 0.000 description 1
- 241000710137 Cucumber necrosis virus Species 0.000 description 1
- 241000219112 Cucumis Species 0.000 description 1
- 235000010071 Cucumis prophetarum Nutrition 0.000 description 1
- 240000008067 Cucumis sativus Species 0.000 description 1
- 235000010799 Cucumis sativus var sativus Nutrition 0.000 description 1
- 240000004244 Cucurbita moschata Species 0.000 description 1
- 235000009854 Cucurbita moschata Nutrition 0.000 description 1
- 235000009804 Cucurbita pepo subsp pepo Nutrition 0.000 description 1
- 244000050510 Cunninghamia lanceolata Species 0.000 description 1
- 235000003392 Curcuma domestica Nutrition 0.000 description 1
- 244000008991 Curcuma longa Species 0.000 description 1
- 241000702290 Digitaria streak virus Species 0.000 description 1
- 208000035240 Disease Resistance Diseases 0.000 description 1
- 241001057636 Dracaena deremensis Species 0.000 description 1
- 102000002322 Egg Proteins Human genes 0.000 description 1
- 108010000912 Egg Proteins Proteins 0.000 description 1
- 235000001942 Elaeis Nutrition 0.000 description 1
- 241000512897 Elaeis Species 0.000 description 1
- 235000007349 Eleusine coracana Nutrition 0.000 description 1
- 235000013499 Eleusine coracana subsp coracana Nutrition 0.000 description 1
- 240000002395 Euphorbia pulcherrima Species 0.000 description 1
- 241000218218 Ficus <angiosperm> Species 0.000 description 1
- 241000628997 Flos Species 0.000 description 1
- WUAYFMZULZDSLB-ACZMJKKPSA-N Gln-Ala-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(N)=O WUAYFMZULZDSLB-ACZMJKKPSA-N 0.000 description 1
- KVYVOGYEMPEXBT-GUBZILKMSA-N Gln-Ala-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(N)=O KVYVOGYEMPEXBT-GUBZILKMSA-N 0.000 description 1
- LZRMPXRYLLTAJX-GUBZILKMSA-N Gln-Arg-Glu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O LZRMPXRYLLTAJX-GUBZILKMSA-N 0.000 description 1
- PONUFVLSGMQFAI-AVGNSLFASA-N Gln-Asn-Phe Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O PONUFVLSGMQFAI-AVGNSLFASA-N 0.000 description 1
- DHNWZLGBTPUTQQ-QEJZJMRPSA-N Gln-Asp-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCC(=O)N)N DHNWZLGBTPUTQQ-QEJZJMRPSA-N 0.000 description 1
- ZQPOVSJFBBETHQ-CIUDSAMLSA-N Gln-Glu-Gln Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O ZQPOVSJFBBETHQ-CIUDSAMLSA-N 0.000 description 1
- DAAUVRPSZRDMBV-KBIXCLLPSA-N Gln-Ile-Cys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CCC(=O)N)N DAAUVRPSZRDMBV-KBIXCLLPSA-N 0.000 description 1
- CELXWPDNIGWCJN-WDCWCFNPSA-N Gln-Lys-Thr Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O CELXWPDNIGWCJN-WDCWCFNPSA-N 0.000 description 1
- AMHIFFIUJOJEKJ-SZMVWBNQSA-N Gln-Lys-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CCC(=O)N)N AMHIFFIUJOJEKJ-SZMVWBNQSA-N 0.000 description 1
- HHRAEXBUNGTOGZ-IHRRRGAJSA-N Gln-Phe-Gln Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(N)=O)C(O)=O HHRAEXBUNGTOGZ-IHRRRGAJSA-N 0.000 description 1
- LPIKVBWNNVFHCQ-GUBZILKMSA-N Gln-Ser-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O LPIKVBWNNVFHCQ-GUBZILKMSA-N 0.000 description 1
- YRHZWVKUFWCEPW-GLLZPBPUSA-N Gln-Thr-Gln Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CCC(=O)N)N)O YRHZWVKUFWCEPW-GLLZPBPUSA-N 0.000 description 1
- SOEXCCGNHQBFPV-DLOVCJGASA-N Gln-Val-Val Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C(C)C)C(O)=O SOEXCCGNHQBFPV-DLOVCJGASA-N 0.000 description 1
- CYHBMLHCQXXCCT-AVGNSLFASA-N Glu-Asp-Tyr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O CYHBMLHCQXXCCT-AVGNSLFASA-N 0.000 description 1
- RAUDKMVXNOWDLS-WDSKDSINSA-N Glu-Gly-Ser Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O RAUDKMVXNOWDLS-WDSKDSINSA-N 0.000 description 1
- VSRCAOIHMGCIJK-SRVKXCTJSA-N Glu-Leu-Arg Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O VSRCAOIHMGCIJK-SRVKXCTJSA-N 0.000 description 1
- BCYGDJXHAGZNPQ-DCAQKATOSA-N Glu-Lys-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O BCYGDJXHAGZNPQ-DCAQKATOSA-N 0.000 description 1
- ITVBKCZZLJUUHI-HTUGSXCWSA-N Glu-Phe-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O ITVBKCZZLJUUHI-HTUGSXCWSA-N 0.000 description 1
- ARIORLIIMJACKZ-KKUMJFAQSA-N Glu-Pro-Tyr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O ARIORLIIMJACKZ-KKUMJFAQSA-N 0.000 description 1
- BXSZPACYCMNKLS-AVGNSLFASA-N Glu-Ser-Phe Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O BXSZPACYCMNKLS-AVGNSLFASA-N 0.000 description 1
- HMJULNMJWOZNFI-XHNCKOQMSA-N Glu-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)[C@H](CCC(=O)O)N)C(=O)O HMJULNMJWOZNFI-XHNCKOQMSA-N 0.000 description 1
- QCMVGXDELYMZET-GLLZPBPUSA-N Glu-Thr-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O QCMVGXDELYMZET-GLLZPBPUSA-N 0.000 description 1
- DTLLNDVORUEOTM-WDCWCFNPSA-N Glu-Thr-Lys Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(O)=O DTLLNDVORUEOTM-WDCWCFNPSA-N 0.000 description 1
- PUUYVMYCMIWHFE-BQBZGAKWSA-N Gly-Ala-Arg Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N PUUYVMYCMIWHFE-BQBZGAKWSA-N 0.000 description 1
- BRFJMRSRMOMIMU-WHFBIAKZSA-N Gly-Ala-Asn Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@@H](CC(N)=O)C(O)=O BRFJMRSRMOMIMU-WHFBIAKZSA-N 0.000 description 1
- JBRBACJPBZNFMF-YUMQZZPRSA-N Gly-Ala-Lys Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN JBRBACJPBZNFMF-YUMQZZPRSA-N 0.000 description 1
- LJPIRKICOISLKN-WHFBIAKZSA-N Gly-Ala-Ser Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O LJPIRKICOISLKN-WHFBIAKZSA-N 0.000 description 1
- WKJKBELXHCTHIJ-WPRPVWTQSA-N Gly-Arg-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCN=C(N)N WKJKBELXHCTHIJ-WPRPVWTQSA-N 0.000 description 1
- JVWPPCWUDRJGAE-YUMQZZPRSA-N Gly-Asn-Leu Chemical compound [H]NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O JVWPPCWUDRJGAE-YUMQZZPRSA-N 0.000 description 1
- OCDLPQDYTJPWNG-YUMQZZPRSA-N Gly-Asn-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)CN OCDLPQDYTJPWNG-YUMQZZPRSA-N 0.000 description 1
- XCLCVBYNGXEVDU-WHFBIAKZSA-N Gly-Asn-Ser Chemical compound NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O XCLCVBYNGXEVDU-WHFBIAKZSA-N 0.000 description 1
- XBWMTPAIUQIWKA-BYULHYEWSA-N Gly-Asp-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)CN XBWMTPAIUQIWKA-BYULHYEWSA-N 0.000 description 1
- CCQOOWAONKGYKQ-BYPYZUCNSA-N Gly-Gly-Ala Chemical compound OC(=O)[C@H](C)NC(=O)CNC(=O)CN CCQOOWAONKGYKQ-BYPYZUCNSA-N 0.000 description 1
- QITBQGJOXQYMOA-ZETCQYMHSA-N Gly-Gly-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)CNC(=O)CN QITBQGJOXQYMOA-ZETCQYMHSA-N 0.000 description 1
- BUEFQXUHTUZXHR-LURJTMIESA-N Gly-Gly-Pro zwitterion Chemical compound NCC(=O)NCC(=O)N1CCC[C@H]1C(O)=O BUEFQXUHTUZXHR-LURJTMIESA-N 0.000 description 1
- SWQALSGKVLYKDT-ZKWXMUAHSA-N Gly-Ile-Ala Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O SWQALSGKVLYKDT-ZKWXMUAHSA-N 0.000 description 1
- SWQALSGKVLYKDT-UHFFFAOYSA-N Gly-Ile-Ala Natural products NCC(=O)NC(C(C)CC)C(=O)NC(C)C(O)=O SWQALSGKVLYKDT-UHFFFAOYSA-N 0.000 description 1
- NSTUFLGQJCOCDL-UWVGGRQHSA-N Gly-Leu-Arg Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N NSTUFLGQJCOCDL-UWVGGRQHSA-N 0.000 description 1
- IUZGUFAJDBHQQV-YUMQZZPRSA-N Gly-Leu-Asn Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O IUZGUFAJDBHQQV-YUMQZZPRSA-N 0.000 description 1
- CLNSYANKYVMZNM-UWVGGRQHSA-N Gly-Lys-Arg Chemical compound NCCCC[C@H](NC(=O)CN)C(=O)N[C@H](C(O)=O)CCCN=C(N)N CLNSYANKYVMZNM-UWVGGRQHSA-N 0.000 description 1
- GGAPHLIUUTVYMX-QWRGUYRKSA-N Gly-Phe-Ser Chemical compound OC[C@@H](C([O-])=O)NC(=O)[C@@H](NC(=O)C[NH3+])CC1=CC=CC=C1 GGAPHLIUUTVYMX-QWRGUYRKSA-N 0.000 description 1
- HJARVELKOSZUEW-YUMQZZPRSA-N Gly-Pro-Gln Chemical compound [H]NCC(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O HJARVELKOSZUEW-YUMQZZPRSA-N 0.000 description 1
- CQMFNTVQVLQRLT-JHEQGTHGSA-N Gly-Thr-Gln Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(O)=O CQMFNTVQVLQRLT-JHEQGTHGSA-N 0.000 description 1
- YDIDLLVFCYSXNY-RCOVLWMOSA-N Gly-Val-Asn Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)CN YDIDLLVFCYSXNY-RCOVLWMOSA-N 0.000 description 1
- SYOJVRNQCXYEOV-XVKPBYJWSA-N Gly-Val-Glu Chemical compound [H]NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O SYOJVRNQCXYEOV-XVKPBYJWSA-N 0.000 description 1
- YGHSQRJSHKYUJY-SCZZXKLOSA-N Gly-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)CN YGHSQRJSHKYUJY-SCZZXKLOSA-N 0.000 description 1
- 240000000047 Gossypium barbadense Species 0.000 description 1
- 235000009429 Gossypium barbadense Nutrition 0.000 description 1
- 235000009432 Gossypium hirsutum Nutrition 0.000 description 1
- 235000017367 Guainella Nutrition 0.000 description 1
- RVKIPWVMZANZLI-UHFFFAOYSA-N H-Lys-Trp-OH Natural products C1=CC=C2C(CC(NC(=O)C(N)CCCCN)C(O)=O)=CNC2=C1 RVKIPWVMZANZLI-UHFFFAOYSA-N 0.000 description 1
- 241000255967 Helicoverpa zea Species 0.000 description 1
- 235000005206 Hibiscus Nutrition 0.000 description 1
- 235000007185 Hibiscus lunariifolius Nutrition 0.000 description 1
- 244000284380 Hibiscus rosa sinensis Species 0.000 description 1
- 102100037907 High mobility group protein B1 Human genes 0.000 description 1
- 101710168537 High mobility group protein B1 Proteins 0.000 description 1
- MDBYBTWRMOAJAY-NHCYSSNCSA-N His-Asn-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC1=CN=CN1)N MDBYBTWRMOAJAY-NHCYSSNCSA-N 0.000 description 1
- SKYULSWNBYAQMG-IHRRRGAJSA-N His-Leu-Arg Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O SKYULSWNBYAQMG-IHRRRGAJSA-N 0.000 description 1
- GJMHMDKCJPQJOI-IHRRRGAJSA-N His-Lys-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC1=CN=CN1 GJMHMDKCJPQJOI-IHRRRGAJSA-N 0.000 description 1
- CKRJBQJIGOEKMC-SRVKXCTJSA-N His-Lys-Ser Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O CKRJBQJIGOEKMC-SRVKXCTJSA-N 0.000 description 1
- PZAJPILZRFPYJJ-SRVKXCTJSA-N His-Ser-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O PZAJPILZRFPYJJ-SRVKXCTJSA-N 0.000 description 1
- FBOMZVOKCZMDIG-XQQFMLRXSA-N His-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CN=CN2)N FBOMZVOKCZMDIG-XQQFMLRXSA-N 0.000 description 1
- 101000615334 Homo sapiens Antileukoproteinase Proteins 0.000 description 1
- 101001051053 Homo sapiens Mannose-6-phosphate isomerase Proteins 0.000 description 1
- 101000742054 Homo sapiens Protein phosphatase 1D Proteins 0.000 description 1
- AZEYWPUCOYXFOE-CYDGBPFRSA-N Ile-Arg-Val Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](C(C)C)C(=O)O)N AZEYWPUCOYXFOE-CYDGBPFRSA-N 0.000 description 1
- NCSIQAFSIPHVAN-IUKAMOBKSA-N Ile-Asn-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N NCSIQAFSIPHVAN-IUKAMOBKSA-N 0.000 description 1
- CYHJCEKUMCNDFG-LAEOZQHASA-N Ile-Gln-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)NCC(=O)O)N CYHJCEKUMCNDFG-LAEOZQHASA-N 0.000 description 1
- SLQVFYWBGNNOTK-BYULHYEWSA-N Ile-Gly-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)N[C@@H](CC(=O)N)C(=O)O)N SLQVFYWBGNNOTK-BYULHYEWSA-N 0.000 description 1
- JLWLMGADIQFKRD-QSFUFRPTSA-N Ile-His-Ala Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C)C(O)=O)CC1=CN=CN1 JLWLMGADIQFKRD-QSFUFRPTSA-N 0.000 description 1
- GVKKVHNRTUFCCE-BJDJZHNGSA-N Ile-Leu-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)O)N GVKKVHNRTUFCCE-BJDJZHNGSA-N 0.000 description 1
- VEPIBPGLTLPBDW-URLPEUOOSA-N Ile-Phe-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N VEPIBPGLTLPBDW-URLPEUOOSA-N 0.000 description 1
- ZNOBVZFCHNHKHA-KBIXCLLPSA-N Ile-Ser-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N ZNOBVZFCHNHKHA-KBIXCLLPSA-N 0.000 description 1
- JNLSTRPWUXOORL-MMWGEVLESA-N Ile-Ser-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N1CCC[C@@H]1C(=O)O)N JNLSTRPWUXOORL-MMWGEVLESA-N 0.000 description 1
- PXKACEXYLPBMAD-JBDRJPRFSA-N Ile-Ser-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)O)N PXKACEXYLPBMAD-JBDRJPRFSA-N 0.000 description 1
- GVEODXUBBFDBPW-MGHWNKPDSA-N Ile-Tyr-Leu Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C(O)=O)CC1=CC=C(O)C=C1 GVEODXUBBFDBPW-MGHWNKPDSA-N 0.000 description 1
- KXUKTDGKLAOCQK-LSJOCFKGSA-N Ile-Val-Gly Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O KXUKTDGKLAOCQK-LSJOCFKGSA-N 0.000 description 1
- APQYGMBHIVXFML-OSUNSFLBSA-N Ile-Val-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N APQYGMBHIVXFML-OSUNSFLBSA-N 0.000 description 1
- 108010065920 Insulin Lispro Proteins 0.000 description 1
- 244000017020 Ipomoea batatas Species 0.000 description 1
- 235000002678 Ipomoea batatas Nutrition 0.000 description 1
- 241000710162 Kennedya yellow mosaic virus Species 0.000 description 1
- FFEARJCKVFRZRR-BYPYZUCNSA-N L-methionine Chemical compound CSCC[C@H](N)C(O)=O FFEARJCKVFRZRR-BYPYZUCNSA-N 0.000 description 1
- 241000219729 Lathyrus Species 0.000 description 1
- 240000004322 Lens culinaris Species 0.000 description 1
- 235000010666 Lens esculenta Nutrition 0.000 description 1
- WNGVUZWBXZKQES-YUMQZZPRSA-N Leu-Ala-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O WNGVUZWBXZKQES-YUMQZZPRSA-N 0.000 description 1
- WSGXUIQTEZDVHJ-GARJFASQSA-N Leu-Ala-Pro Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N1CCC[C@@H]1C(O)=O WSGXUIQTEZDVHJ-GARJFASQSA-N 0.000 description 1
- WGNOPSQMIQERPK-UHFFFAOYSA-N Leu-Asn-Pro Natural products CC(C)CC(N)C(=O)NC(CC(=O)N)C(=O)N1CCCC1C(=O)O WGNOPSQMIQERPK-UHFFFAOYSA-N 0.000 description 1
- OGCQGUIWMSBHRZ-CIUDSAMLSA-N Leu-Asn-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O OGCQGUIWMSBHRZ-CIUDSAMLSA-N 0.000 description 1
- FIJMQLGQLBLBOL-HJGDQZAQSA-N Leu-Asn-Thr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O FIJMQLGQLBLBOL-HJGDQZAQSA-N 0.000 description 1
- KTFHTMHHKXUYPW-ZPFDUUQYSA-N Leu-Asp-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O KTFHTMHHKXUYPW-ZPFDUUQYSA-N 0.000 description 1
- VQPPIMUZCZCOIL-GUBZILKMSA-N Leu-Gln-Ala Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O VQPPIMUZCZCOIL-GUBZILKMSA-N 0.000 description 1
- WRLPVDVHNWSSCL-MELADBBJSA-N Leu-His-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N2CCC[C@@H]2C(=O)O)N WRLPVDVHNWSSCL-MELADBBJSA-N 0.000 description 1
- HMDDEJADNKQTBR-BZSNNMDCSA-N Leu-His-Tyr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O HMDDEJADNKQTBR-BZSNNMDCSA-N 0.000 description 1
- QLDHBYRUNQZIJQ-DKIMLUQUSA-N Leu-Ile-Phe Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O QLDHBYRUNQZIJQ-DKIMLUQUSA-N 0.000 description 1
- YOKVEHGYYQEQOP-QWRGUYRKSA-N Leu-Leu-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)NCC(O)=O YOKVEHGYYQEQOP-QWRGUYRKSA-N 0.000 description 1
- KXCMQWMNYQOAKA-SRVKXCTJSA-N Leu-Met-Gln Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N KXCMQWMNYQOAKA-SRVKXCTJSA-N 0.000 description 1
- UCBPDSYUVAAHCD-UWVGGRQHSA-N Leu-Pro-Gly Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O UCBPDSYUVAAHCD-UWVGGRQHSA-N 0.000 description 1
- CHJKEDSZNSONPS-DCAQKATOSA-N Leu-Pro-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O CHJKEDSZNSONPS-DCAQKATOSA-N 0.000 description 1
- IRMLZWSRWSGTOP-CIUDSAMLSA-N Leu-Ser-Ala Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O IRMLZWSRWSGTOP-CIUDSAMLSA-N 0.000 description 1
- IZPVWNSAVUQBGP-CIUDSAMLSA-N Leu-Ser-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O IZPVWNSAVUQBGP-CIUDSAMLSA-N 0.000 description 1
- AKVBOOKXVAMKSS-GUBZILKMSA-N Leu-Ser-Gln Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(O)=O AKVBOOKXVAMKSS-GUBZILKMSA-N 0.000 description 1
- RGUXWMDNCPMQFB-YUMQZZPRSA-N Leu-Ser-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O RGUXWMDNCPMQFB-YUMQZZPRSA-N 0.000 description 1
- MVHXGBZUJLWZOH-BJDJZHNGSA-N Leu-Ser-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O MVHXGBZUJLWZOH-BJDJZHNGSA-N 0.000 description 1
- SBANPBVRHYIMRR-UHFFFAOYSA-N Leu-Ser-Pro Natural products CC(C)CC(N)C(=O)NC(CO)C(=O)N1CCCC1C(O)=O SBANPBVRHYIMRR-UHFFFAOYSA-N 0.000 description 1
- ZJZNLRVCZWUONM-JXUBOQSCSA-N Leu-Thr-Ala Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O ZJZNLRVCZWUONM-JXUBOQSCSA-N 0.000 description 1
- RIHIGSWBLHSGLV-CQDKDKBSSA-N Leu-Tyr-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C)C(O)=O RIHIGSWBLHSGLV-CQDKDKBSSA-N 0.000 description 1
- VKVDRTGWLVZJOM-DCAQKATOSA-N Leu-Val-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O VKVDRTGWLVZJOM-DCAQKATOSA-N 0.000 description 1
- 102000003960 Ligases Human genes 0.000 description 1
- 108090000364 Ligases Proteins 0.000 description 1
- 241000234435 Lilium Species 0.000 description 1
- 235000004431 Linum usitatissimum Nutrition 0.000 description 1
- 240000006240 Linum usitatissimum Species 0.000 description 1
- 241000322338 Loeseliastrum Species 0.000 description 1
- GQUDMNDPQTXZRV-DCAQKATOSA-N Lys-Arg-Asp Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O GQUDMNDPQTXZRV-DCAQKATOSA-N 0.000 description 1
- FHIAJWBDZVHLAH-YUMQZZPRSA-N Lys-Gly-Ser Chemical compound NCCCC[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O FHIAJWBDZVHLAH-YUMQZZPRSA-N 0.000 description 1
- OWRUUFUVXFREBD-KKUMJFAQSA-N Lys-His-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(C)C)C(O)=O OWRUUFUVXFREBD-KKUMJFAQSA-N 0.000 description 1
- JYXBNQOKPRQNQS-YTFOTSKYSA-N Lys-Ile-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JYXBNQOKPRQNQS-YTFOTSKYSA-N 0.000 description 1
- MSSJJDVQTFTLIF-KBPBESRZSA-N Lys-Phe-Gly Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](Cc1ccccc1)C(=O)NCC(O)=O MSSJJDVQTFTLIF-KBPBESRZSA-N 0.000 description 1
- LNMKRJJLEFASGA-BZSNNMDCSA-N Lys-Phe-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O LNMKRJJLEFASGA-BZSNNMDCSA-N 0.000 description 1
- MGKFCQFVPKOWOL-CIUDSAMLSA-N Lys-Ser-Asp Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(=O)O)C(=O)O)N MGKFCQFVPKOWOL-CIUDSAMLSA-N 0.000 description 1
- SUZVLFWOCKHWET-CQDKDKBSSA-N Lys-Tyr-Ala Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C)C(O)=O SUZVLFWOCKHWET-CQDKDKBSSA-N 0.000 description 1
- VKCPHIOZDWUFSW-ONGXEEELSA-N Lys-Val-Gly Chemical compound OC(=O)CNC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCCCN VKCPHIOZDWUFSW-ONGXEEELSA-N 0.000 description 1
- 241000208467 Macadamia Species 0.000 description 1
- 235000018330 Macadamia integrifolia Nutrition 0.000 description 1
- 240000007575 Macadamia integrifolia Species 0.000 description 1
- 235000016735 Manihot esculenta subsp esculenta Nutrition 0.000 description 1
- 235000010624 Medicago sativa Nutrition 0.000 description 1
- 244000050427 Melilotus officinalis subsp suaveolens Species 0.000 description 1
- 235000000839 Melilotus officinalis subsp suaveolens Nutrition 0.000 description 1
- LMKSBGIUPVRHEH-FXQIFTODSA-N Met-Ala-Asn Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC(N)=O LMKSBGIUPVRHEH-FXQIFTODSA-N 0.000 description 1
- QXEVZBXTDTVPCP-GMOBBJLQSA-N Met-Asn-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CCSC)N QXEVZBXTDTVPCP-GMOBBJLQSA-N 0.000 description 1
- OSOLWRWQADPDIQ-DCAQKATOSA-N Met-Asp-Leu Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O OSOLWRWQADPDIQ-DCAQKATOSA-N 0.000 description 1
- JYCQGAGDJQYEDB-GUBZILKMSA-N Met-Gln-Gln Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O JYCQGAGDJQYEDB-GUBZILKMSA-N 0.000 description 1
- NCVJJAJVWILAGI-SRVKXCTJSA-N Met-Gln-Lys Chemical compound CSCC[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N NCVJJAJVWILAGI-SRVKXCTJSA-N 0.000 description 1
- XKJUFUPCHARJKX-UWVGGRQHSA-N Met-Gly-His Chemical compound CSCC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC1=CNC=N1 XKJUFUPCHARJKX-UWVGGRQHSA-N 0.000 description 1
- NLHSFJQUHGCWSD-PYJNHQTQSA-N Met-Ile-His Chemical compound N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CNC=N1)C(O)=O NLHSFJQUHGCWSD-PYJNHQTQSA-N 0.000 description 1
- QQPMHUCGDRJFQK-RHYQMDGZSA-N Met-Thr-Leu Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC(C)C QQPMHUCGDRJFQK-RHYQMDGZSA-N 0.000 description 1
- LBSWWNKMVPAXOI-GUBZILKMSA-N Met-Val-Ser Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CO)C(O)=O LBSWWNKMVPAXOI-GUBZILKMSA-N 0.000 description 1
- 241000702475 Miscanthus streak virus Species 0.000 description 1
- 241000234295 Musa Species 0.000 description 1
- 240000005561 Musa balbisiana Species 0.000 description 1
- 235000018290 Musa x paradisiaca Nutrition 0.000 description 1
- 108010079364 N-glycylalanine Proteins 0.000 description 1
- 108010087066 N2-tryptophyllysine Proteins 0.000 description 1
- 108010047562 NGR peptide Proteins 0.000 description 1
- 101710202365 Napin Proteins 0.000 description 1
- 108091028043 Nucleic acid sequence Proteins 0.000 description 1
- 235000002725 Olea europaea Nutrition 0.000 description 1
- 108020005187 Oligonucleotide Probes Proteins 0.000 description 1
- 240000008114 Panicum miliaceum Species 0.000 description 1
- 235000007199 Panicum miliaceum Nutrition 0.000 description 1
- 229930182555 Penicillin Natural products 0.000 description 1
- JGSARLDLIJGVTE-MBNYWOFBSA-N Penicillin G Chemical compound N([C@H]1[C@H]2SC([C@@H](N2C1=O)C(O)=O)(C)C)C(=O)CC1=CC=CC=C1 JGSARLDLIJGVTE-MBNYWOFBSA-N 0.000 description 1
- 244000038248 Pennisetum spicatum Species 0.000 description 1
- 244000115721 Pennisetum typhoides Species 0.000 description 1
- 239000001888 Peptone Substances 0.000 description 1
- 108010080698 Peptones Proteins 0.000 description 1
- 244000100170 Phaseolus lunatus Species 0.000 description 1
- NOFBJKKOPKJDCO-KKXDTOCCSA-N Phe-Ala-Tyr Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O NOFBJKKOPKJDCO-KKXDTOCCSA-N 0.000 description 1
- RIYZXJVARWJLKS-KKUMJFAQSA-N Phe-Asp-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 RIYZXJVARWJLKS-KKUMJFAQSA-N 0.000 description 1
- MFQXSDWKUXTOPZ-DZKIICNBSA-N Phe-Gln-Val Chemical compound CC(C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC1=CC=CC=C1)N MFQXSDWKUXTOPZ-DZKIICNBSA-N 0.000 description 1
- NHCKESBLOMHIIE-IRXDYDNUSA-N Phe-Gly-Phe Chemical compound C([C@H](N)C(=O)NCC(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 NHCKESBLOMHIIE-IRXDYDNUSA-N 0.000 description 1
- FXPZZKBHNOMLGA-HJWJTTGWSA-N Phe-Ile-Arg Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N FXPZZKBHNOMLGA-HJWJTTGWSA-N 0.000 description 1
- KBVJZCVLQWCJQN-KKUMJFAQSA-N Phe-Leu-Asn Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O KBVJZCVLQWCJQN-KKUMJFAQSA-N 0.000 description 1
- YCCUXNNKXDGMAM-KKUMJFAQSA-N Phe-Leu-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O YCCUXNNKXDGMAM-KKUMJFAQSA-N 0.000 description 1
- BSHMIVKDJQGLNT-ACRUOGEOSA-N Phe-Lys-Tyr Chemical compound C([C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=CC=C1 BSHMIVKDJQGLNT-ACRUOGEOSA-N 0.000 description 1
- RVEVENLSADZUMS-IHRRRGAJSA-N Phe-Pro-Asn Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(O)=O RVEVENLSADZUMS-IHRRRGAJSA-N 0.000 description 1
- ZLAKUZDMKVKFAI-JYJNAYRXSA-N Phe-Pro-Val Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(O)=O ZLAKUZDMKVKFAI-JYJNAYRXSA-N 0.000 description 1
- GMWNQSGWWGKTSF-LFSVMHDDSA-N Phe-Thr-Ala Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O GMWNQSGWWGKTSF-LFSVMHDDSA-N 0.000 description 1
- GNRMAQSIROFNMI-IXOXFDKPSA-N Phe-Thr-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O GNRMAQSIROFNMI-IXOXFDKPSA-N 0.000 description 1
- VIIRRNQMMIHYHQ-XHSDSOJGSA-N Phe-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CC=CC=C2)N VIIRRNQMMIHYHQ-XHSDSOJGSA-N 0.000 description 1
- 241000351396 Picea asperata Species 0.000 description 1
- 240000000020 Picea glauca Species 0.000 description 1
- 235000008127 Picea glauca Nutrition 0.000 description 1
- 235000008565 Pinus banksiana Nutrition 0.000 description 1
- 235000011334 Pinus elliottii Nutrition 0.000 description 1
- 241000142776 Pinus elliottii Species 0.000 description 1
- 244000019397 Pinus jeffreyi Species 0.000 description 1
- 235000013264 Pinus jeffreyi Nutrition 0.000 description 1
- 235000008577 Pinus radiata Nutrition 0.000 description 1
- 241000218621 Pinus radiata Species 0.000 description 1
- 235000008578 Pinus strobus Nutrition 0.000 description 1
- 235000008566 Pinus taeda Nutrition 0.000 description 1
- 241000218679 Pinus taeda Species 0.000 description 1
- 235000008585 Pinus thunbergii Nutrition 0.000 description 1
- 240000008135 Piscidia piscipula Species 0.000 description 1
- 108700001094 Plant Genes Proteins 0.000 description 1
- 235000014030 Podocarpus spicatus Nutrition 0.000 description 1
- 101000616469 Polybia paulista Mastoparan-1 Proteins 0.000 description 1
- WCUXLLCKKVVCTQ-UHFFFAOYSA-M Potassium chloride Chemical compound [Cl-].[K+] WCUXLLCKKVVCTQ-UHFFFAOYSA-M 0.000 description 1
- 241000709994 Potato aucuba mosaic virus Species 0.000 description 1
- 241000710179 Potato virus S Species 0.000 description 1
- 241000259980 Potato yellow mosaic virus-[Guadeloupe] Species 0.000 description 1
- 206010036590 Premature baby Diseases 0.000 description 1
- VCYJKOLZYPYGJV-AVGNSLFASA-N Pro-Arg-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O VCYJKOLZYPYGJV-AVGNSLFASA-N 0.000 description 1
- VPVHXWGPALPDGP-GUBZILKMSA-N Pro-Asn-Arg Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O VPVHXWGPALPDGP-GUBZILKMSA-N 0.000 description 1
- SGCZFWSQERRKBD-BQBZGAKWSA-N Pro-Asp-Gly Chemical compound OC(=O)CNC(=O)[C@H](CC(O)=O)NC(=O)[C@@H]1CCCN1 SGCZFWSQERRKBD-BQBZGAKWSA-N 0.000 description 1
- DEDANIDYQAPTFI-IHRRRGAJSA-N Pro-Asp-Tyr Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O DEDANIDYQAPTFI-IHRRRGAJSA-N 0.000 description 1
- DIFXZGPHVCIVSQ-CIUDSAMLSA-N Pro-Gln-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O DIFXZGPHVCIVSQ-CIUDSAMLSA-N 0.000 description 1
- HAAQQNHQZBOWFO-LURJTMIESA-N Pro-Gly-Gly Chemical compound OC(=O)CNC(=O)CNC(=O)[C@@H]1CCCN1 HAAQQNHQZBOWFO-LURJTMIESA-N 0.000 description 1
- UREQLMJCKFLLHM-NAKRPEOUSA-N Pro-Ile-Ser Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O UREQLMJCKFLLHM-NAKRPEOUSA-N 0.000 description 1
- XYSXOCIWCPFOCG-IHRRRGAJSA-N Pro-Leu-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O XYSXOCIWCPFOCG-IHRRRGAJSA-N 0.000 description 1
- VGVCNKSUVSZEIE-IHRRRGAJSA-N Pro-Phe-Asn Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(N)=O)C(O)=O VGVCNKSUVSZEIE-IHRRRGAJSA-N 0.000 description 1
- MLKVIVZCFYRTIR-KKUMJFAQSA-N Pro-Phe-Gln Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(N)=O)C(O)=O MLKVIVZCFYRTIR-KKUMJFAQSA-N 0.000 description 1
- WHNJMTHJGCEKGA-ULQDDVLXSA-N Pro-Phe-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O WHNJMTHJGCEKGA-ULQDDVLXSA-N 0.000 description 1
- OWQXAJQZLWHPBH-FXQIFTODSA-N Pro-Ser-Asn Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O OWQXAJQZLWHPBH-FXQIFTODSA-N 0.000 description 1
- BGWKULMLUIUPKY-BQBZGAKWSA-N Pro-Ser-Gly Chemical compound OC(=O)CNC(=O)[C@H](CO)NC(=O)[C@@H]1CCCN1 BGWKULMLUIUPKY-BQBZGAKWSA-N 0.000 description 1
- IIRBTQHFVNGPMQ-AVGNSLFASA-N Pro-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@@H]1CCCN1 IIRBTQHFVNGPMQ-AVGNSLFASA-N 0.000 description 1
- 102100038675 Protein phosphatase 1D Human genes 0.000 description 1
- 240000001679 Psidium guajava Species 0.000 description 1
- 235000013929 Psidium pyriferum Nutrition 0.000 description 1
- 235000010580 Psophocarpus tetragonolobus Nutrition 0.000 description 1
- 244000046095 Psophocarpus tetragonolobus Species 0.000 description 1
- 238000000505 RNA structure prediction Methods 0.000 description 1
- 101000962158 Ralstonia sp Maleylpyruvate isomerase Proteins 0.000 description 1
- 241000245165 Rhododendron ponticum Species 0.000 description 1
- 235000011449 Rosa Nutrition 0.000 description 1
- 241000220317 Rosa Species 0.000 description 1
- 241000209051 Saccharum Species 0.000 description 1
- 240000000111 Saccharum officinarum Species 0.000 description 1
- 235000007201 Saccharum officinarum Nutrition 0.000 description 1
- 241000239226 Scorpiones Species 0.000 description 1
- 241001138418 Sequoia sempervirens Species 0.000 description 1
- HRNQLKCLPVKZNE-CIUDSAMLSA-N Ser-Ala-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O HRNQLKCLPVKZNE-CIUDSAMLSA-N 0.000 description 1
- UGJRQLURDVGULT-LKXGYXEUSA-N Ser-Asn-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O UGJRQLURDVGULT-LKXGYXEUSA-N 0.000 description 1
- TYYBJUYSTWJHGO-ZKWXMUAHSA-N Ser-Asn-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O TYYBJUYSTWJHGO-ZKWXMUAHSA-N 0.000 description 1
- OHKLFYXEOGGGCK-ZLUOBGJFSA-N Ser-Asp-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O OHKLFYXEOGGGCK-ZLUOBGJFSA-N 0.000 description 1
- BYIROAKULFFTEK-CIUDSAMLSA-N Ser-Asp-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CO BYIROAKULFFTEK-CIUDSAMLSA-N 0.000 description 1
- MOVJSUIKUNCVMG-ZLUOBGJFSA-N Ser-Cys-Ser Chemical compound C([C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CO)C(=O)O)N)O MOVJSUIKUNCVMG-ZLUOBGJFSA-N 0.000 description 1
- UQFYNFTYDHUIMI-WHFBIAKZSA-N Ser-Gly-Ala Chemical compound OC(=O)[C@H](C)NC(=O)CNC(=O)[C@@H](N)CO UQFYNFTYDHUIMI-WHFBIAKZSA-N 0.000 description 1
- YMTLKLXDFCSCNX-BYPYZUCNSA-N Ser-Gly-Gly Chemical compound OC[C@H](N)C(=O)NCC(=O)NCC(O)=O YMTLKLXDFCSCNX-BYPYZUCNSA-N 0.000 description 1
- WSTIOCFMWXNOCX-YUMQZZPRSA-N Ser-Gly-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CO)N WSTIOCFMWXNOCX-YUMQZZPRSA-N 0.000 description 1
- QGAHMVHBORDHDC-YUMQZZPRSA-N Ser-His-Gly Chemical compound OC[C@H](N)C(=O)N[C@H](C(=O)NCC(O)=O)CC1=CN=CN1 QGAHMVHBORDHDC-YUMQZZPRSA-N 0.000 description 1
- FUMGHWDRRFCKEP-CIUDSAMLSA-N Ser-Leu-Ala Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O FUMGHWDRRFCKEP-CIUDSAMLSA-N 0.000 description 1
- YUJLIIRMIAGMCQ-CIUDSAMLSA-N Ser-Leu-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O YUJLIIRMIAGMCQ-CIUDSAMLSA-N 0.000 description 1
- IXZHZUGGKLRHJD-DCAQKATOSA-N Ser-Leu-Val Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O IXZHZUGGKLRHJD-DCAQKATOSA-N 0.000 description 1
- BUYHXYIUQUBEQP-AVGNSLFASA-N Ser-Phe-Glu Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CO)N BUYHXYIUQUBEQP-AVGNSLFASA-N 0.000 description 1
- NMZXJDSKEGFDLJ-DCAQKATOSA-N Ser-Pro-Lys Chemical compound C1C[C@H](N(C1)C(=O)[C@H](CO)N)C(=O)N[C@@H](CCCCN)C(=O)O NMZXJDSKEGFDLJ-DCAQKATOSA-N 0.000 description 1
- VLMIUSLQONKLDV-HEIBUPTGSA-N Ser-Thr-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O VLMIUSLQONKLDV-HEIBUPTGSA-N 0.000 description 1
- QYBRQMLZDDJBSW-AVGNSLFASA-N Ser-Tyr-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O QYBRQMLZDDJBSW-AVGNSLFASA-N 0.000 description 1
- ZVBCMFDJIMUELU-BZSNNMDCSA-N Ser-Tyr-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CC2=CC=C(C=C2)O)NC(=O)[C@H](CO)N ZVBCMFDJIMUELU-BZSNNMDCSA-N 0.000 description 1
- 235000005775 Setaria Nutrition 0.000 description 1
- 241000232088 Setaria <nematode> Species 0.000 description 1
- 235000008515 Setaria glauca Nutrition 0.000 description 1
- 108091027967 Small hairpin RNA Proteins 0.000 description 1
- 235000007230 Sorghum bicolor Nutrition 0.000 description 1
- 235000011684 Sorghum saccharatum Nutrition 0.000 description 1
- 235000009184 Spondias indica Nutrition 0.000 description 1
- 235000021536 Sugar beet Nutrition 0.000 description 1
- 235000006468 Thea sinensis Nutrition 0.000 description 1
- MQCPGOZXFSYJPS-KZVJFYERSA-N Thr-Ala-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O MQCPGOZXFSYJPS-KZVJFYERSA-N 0.000 description 1
- VFEHSAJCWWHDBH-RHYQMDGZSA-N Thr-Arg-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O VFEHSAJCWWHDBH-RHYQMDGZSA-N 0.000 description 1
- WFUAUEQXPVNAEF-ZJDVBMNYSA-N Thr-Arg-Thr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@H](C(=O)N[C@@H]([C@@H](C)O)C(O)=O)CCCN=C(N)N WFUAUEQXPVNAEF-ZJDVBMNYSA-N 0.000 description 1
- SKHPKKYKDYULDH-HJGDQZAQSA-N Thr-Asn-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O SKHPKKYKDYULDH-HJGDQZAQSA-N 0.000 description 1
- PZVGOVRNGKEFCB-KKHAAJSZSA-N Thr-Asn-Val Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](C(C)C)C(=O)O)N)O PZVGOVRNGKEFCB-KKHAAJSZSA-N 0.000 description 1
- DKDHTRVDOUZZTP-IFFSRLJSSA-N Thr-Gln-Val Chemical compound CC(C)[C@H](NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)[C@@H](C)O)C(O)=O DKDHTRVDOUZZTP-IFFSRLJSSA-N 0.000 description 1
- IMULJHHGAUZZFE-MBLNEYKQSA-N Thr-Gly-Ile Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H]([C@@H](C)CC)C(O)=O IMULJHHGAUZZFE-MBLNEYKQSA-N 0.000 description 1
- QQWNRERCGGZOKG-WEDXCCLWSA-N Thr-Gly-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CC(C)C)C(O)=O QQWNRERCGGZOKG-WEDXCCLWSA-N 0.000 description 1
- ZTPXSEUVYNNZRB-CDMKHQONSA-N Thr-Gly-Phe Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O ZTPXSEUVYNNZRB-CDMKHQONSA-N 0.000 description 1
- SIMKLINEDYOTKL-MBLNEYKQSA-N Thr-His-Ala Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](C)C(=O)O)N)O SIMKLINEDYOTKL-MBLNEYKQSA-N 0.000 description 1
- PAXANSWUSVPFNK-IUKAMOBKSA-N Thr-Ile-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H]([C@@H](C)O)N PAXANSWUSVPFNK-IUKAMOBKSA-N 0.000 description 1
- WNQJTLATMXYSEL-OEAJRASXSA-N Thr-Phe-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O WNQJTLATMXYSEL-OEAJRASXSA-N 0.000 description 1
- OLFOOYQTTQSSRK-UNQGMJICSA-N Thr-Pro-Phe Chemical compound C[C@@H](O)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 OLFOOYQTTQSSRK-UNQGMJICSA-N 0.000 description 1
- XHWCDRUPDNSDAZ-XKBZYTNZSA-N Thr-Ser-Glu Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N)O XHWCDRUPDNSDAZ-XKBZYTNZSA-N 0.000 description 1
- WPSKTVVMQCXPRO-BWBBJGPYSA-N Thr-Ser-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O WPSKTVVMQCXPRO-BWBBJGPYSA-N 0.000 description 1
- BBPCSGKKPJUYRB-UVOCVTCTSA-N Thr-Thr-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O BBPCSGKKPJUYRB-UVOCVTCTSA-N 0.000 description 1
- QJIODPFLAASXJC-JHYOHUSXSA-N Thr-Thr-Phe Chemical compound C[C@H]([C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)N)O QJIODPFLAASXJC-JHYOHUSXSA-N 0.000 description 1
- 235000008109 Thuja occidentalis Nutrition 0.000 description 1
- 240000003243 Thuja occidentalis Species 0.000 description 1
- 241000218638 Thuja plicata Species 0.000 description 1
- 241000702292 Tobacco yellow dwarf virus Species 0.000 description 1
- 241000702305 Tomato mottle virus Species 0.000 description 1
- 241000016010 Tomato spotted wilt orthotospovirus Species 0.000 description 1
- 241001098122 Tomato yellow leaf curl China virus Species 0.000 description 1
- 241001638347 Tomato yellow leaf curl Malaga virus Species 0.000 description 1
- 241000702308 Tomato yellow leaf curl virus Species 0.000 description 1
- 235000015724 Trifolium pratense Nutrition 0.000 description 1
- 239000007984 Tris EDTA buffer Substances 0.000 description 1
- NBHGNEJMBNQQKZ-UBHSHLNASA-N Trp-Asp-Cys Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CS)C(=O)O)N NBHGNEJMBNQQKZ-UBHSHLNASA-N 0.000 description 1
- GWQUSADRQCTMHN-NWLDYVSISA-N Trp-Gln-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N)O GWQUSADRQCTMHN-NWLDYVSISA-N 0.000 description 1
- ILDJYIDXESUBOE-HSCHXYMDSA-N Trp-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N ILDJYIDXESUBOE-HSCHXYMDSA-N 0.000 description 1
- OGZRZMJASKKMJZ-XIRDDKMYSA-N Trp-Leu-Asp Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](CC1=CNC2=CC=CC=C21)N OGZRZMJASKKMJZ-XIRDDKMYSA-N 0.000 description 1
- ZHZLQVLQBDBQCQ-WDSOQIARSA-N Trp-Lys-Arg Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N ZHZLQVLQBDBQCQ-WDSOQIARSA-N 0.000 description 1
- BOBZBMOTRORUPT-XIRDDKMYSA-N Trp-Ser-Leu Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O)=CNC2=C1 BOBZBMOTRORUPT-XIRDDKMYSA-N 0.000 description 1
- DTPWXZXGFAHEKL-NWLDYVSISA-N Trp-Thr-Glu Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O DTPWXZXGFAHEKL-NWLDYVSISA-N 0.000 description 1
- CRCHQCUINSOGFD-JBACZVJFSA-N Trp-Tyr-Glu Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC3=CC=C(C=C3)O)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N CRCHQCUINSOGFD-JBACZVJFSA-N 0.000 description 1
- 240000003021 Tsuga heterophylla Species 0.000 description 1
- 235000008554 Tsuga heterophylla Nutrition 0.000 description 1
- 241000722923 Tulipa Species 0.000 description 1
- 241000714211 Turnip crinkle virus Species 0.000 description 1
- AKFLVKKWVZMFOT-IHRRRGAJSA-N Tyr-Arg-Asn Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(O)=O AKFLVKKWVZMFOT-IHRRRGAJSA-N 0.000 description 1
- KLGFILUOTCBNLJ-IHRRRGAJSA-N Tyr-Cys-Arg Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N)O KLGFILUOTCBNLJ-IHRRRGAJSA-N 0.000 description 1
- TWAVEIJGFCBWCG-JYJNAYRXSA-N Tyr-Gln-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC1=CC=C(C=C1)O)N TWAVEIJGFCBWCG-JYJNAYRXSA-N 0.000 description 1
- MPKPIWFFDWVJGC-IRIUXVKKSA-N Tyr-Gln-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC1=CC=C(C=C1)O)N)O MPKPIWFFDWVJGC-IRIUXVKKSA-N 0.000 description 1
- PMHLLBKTDHQMCY-ULQDDVLXSA-N Tyr-Lys-Val Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O PMHLLBKTDHQMCY-ULQDDVLXSA-N 0.000 description 1
- MQGGXGKQSVEQHR-KKUMJFAQSA-N Tyr-Ser-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 MQGGXGKQSVEQHR-KKUMJFAQSA-N 0.000 description 1
- XUIOBCQESNDTDE-FQPOAREZSA-N Tyr-Thr-Ala Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](C)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N)O XUIOBCQESNDTDE-FQPOAREZSA-N 0.000 description 1
- PWKMJDQXKCENMF-MEYUZBJRSA-N Tyr-Thr-Leu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O PWKMJDQXKCENMF-MEYUZBJRSA-N 0.000 description 1
- PQPWEALFTLKSEB-DZKIICNBSA-N Tyr-Val-Glu Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O PQPWEALFTLKSEB-DZKIICNBSA-N 0.000 description 1
- AZSHAZJLOZQYAY-FXQIFTODSA-N Val-Ala-Ser Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O AZSHAZJLOZQYAY-FXQIFTODSA-N 0.000 description 1
- VMRFIKXKOFNMHW-GUBZILKMSA-N Val-Arg-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CO)C(=O)O)N VMRFIKXKOFNMHW-GUBZILKMSA-N 0.000 description 1
- IQQYYFPCWKWUHW-YDHLFZDLSA-N Val-Asn-Tyr Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)N IQQYYFPCWKWUHW-YDHLFZDLSA-N 0.000 description 1
- CGGVNFJRZJUVAE-BYULHYEWSA-N Val-Asp-Asn Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N CGGVNFJRZJUVAE-BYULHYEWSA-N 0.000 description 1
- KOPBYUSPXBQIHD-NRPADANISA-N Val-Cys-Glu Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CS)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N KOPBYUSPXBQIHD-NRPADANISA-N 0.000 description 1
- LMSBRIVOCYOKMU-NRPADANISA-N Val-Gln-Cys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CS)C(=O)O)N LMSBRIVOCYOKMU-NRPADANISA-N 0.000 description 1
- SZTTYWIUCGSURQ-AUTRQRHGSA-N Val-Glu-Glu Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O SZTTYWIUCGSURQ-AUTRQRHGSA-N 0.000 description 1
- PIFJAFRUVWZRKR-QMMMGPOBSA-N Val-Gly-Gly Chemical compound CC(C)[C@H]([NH3+])C(=O)NCC(=O)NCC([O-])=O PIFJAFRUVWZRKR-QMMMGPOBSA-N 0.000 description 1
- FEFZWCSXEMVSPO-LSJOCFKGSA-N Val-His-Ala Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](Cc1cnc[nH]1)C(=O)N[C@@H](C)C(O)=O FEFZWCSXEMVSPO-LSJOCFKGSA-N 0.000 description 1
- OACSGBOREVRSME-NHCYSSNCSA-N Val-His-Asn Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](Cc1cnc[nH]1)C(=O)N[C@@H](CC(N)=O)C(O)=O OACSGBOREVRSME-NHCYSSNCSA-N 0.000 description 1
- OTJMMKPMLUNTQT-AVGNSLFASA-N Val-Leu-Arg Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)NC(=O)[C@H](C(C)C)N OTJMMKPMLUNTQT-AVGNSLFASA-N 0.000 description 1
- FEXILLGKGGTLRI-NHCYSSNCSA-N Val-Leu-Asn Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](C(C)C)N FEXILLGKGGTLRI-NHCYSSNCSA-N 0.000 description 1
- QIVPZSWBBHRNBA-JYJNAYRXSA-N Val-Pro-Phe Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](Cc1ccccc1)C(O)=O QIVPZSWBBHRNBA-JYJNAYRXSA-N 0.000 description 1
- QSPOLEBZTMESFY-SRVKXCTJSA-N Val-Pro-Val Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(O)=O QSPOLEBZTMESFY-SRVKXCTJSA-N 0.000 description 1
- PGQUDQYHWICSAB-NAKRPEOUSA-N Val-Ser-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](C(C)C)N PGQUDQYHWICSAB-NAKRPEOUSA-N 0.000 description 1
- PZTZYZUTCPZWJH-FXQIFTODSA-N Val-Ser-Ser Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)O)N PZTZYZUTCPZWJH-FXQIFTODSA-N 0.000 description 1
- PQSNETRGCRUOGP-KKHAAJSZSA-N Val-Thr-Asn Chemical compound CC(C)[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC(N)=O PQSNETRGCRUOGP-KKHAAJSZSA-N 0.000 description 1
- IWADHXDXSQONEL-GUBZILKMSA-N Val-Val-Ala Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O IWADHXDXSQONEL-GUBZILKMSA-N 0.000 description 1
- RTJPAGFXOWEBAI-SRVKXCTJSA-N Val-Val-Arg Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N RTJPAGFXOWEBAI-SRVKXCTJSA-N 0.000 description 1
- JSOXWWFKRJKTMT-WOPDTQHZSA-N Val-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N JSOXWWFKRJKTMT-WOPDTQHZSA-N 0.000 description 1
- 235000002098 Vicia faba var. major Nutrition 0.000 description 1
- 241000219977 Vigna Species 0.000 description 1
- 235000006582 Vigna radiata Nutrition 0.000 description 1
- 235000010721 Vigna radiata var radiata Nutrition 0.000 description 1
- 235000011469 Vigna radiata var sublobata Nutrition 0.000 description 1
- 235000010726 Vigna sinensis Nutrition 0.000 description 1
- 244000042314 Vigna unguiculata Species 0.000 description 1
- 235000010722 Vigna unguiculata Nutrition 0.000 description 1
- 101001036768 Zea mays Glucose-1-phosphate adenylyltransferase large subunit 1, chloroplastic/amyloplastic Proteins 0.000 description 1
- 101000662549 Zea mays Sucrose synthase 1 Proteins 0.000 description 1
- 235000016383 Zea mays subsp huehuetenangensis Nutrition 0.000 description 1
- QWXOJIDBSHLIFI-UHFFFAOYSA-N [3-(1-chloro-3'-methoxyspiro[adamantane-4,4'-dioxetane]-3'-yl)phenyl] dihydrogen phosphate Chemical compound O1OC2(C3CC4CC2CC(Cl)(C4)C3)C1(OC)C1=CC=CC(OP(O)(O)=O)=C1 QWXOJIDBSHLIFI-UHFFFAOYSA-N 0.000 description 1
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 1
- 102000005421 acetyltransferase Human genes 0.000 description 1
- 108020002494 acetyltransferase Proteins 0.000 description 1
- 108010005233 alanylglutamic acid Proteins 0.000 description 1
- 108010044940 alanylglutamine Proteins 0.000 description 1
- 108010087924 alanylproline Proteins 0.000 description 1
- 239000003513 alkali Substances 0.000 description 1
- 235000020224 almond Nutrition 0.000 description 1
- 238000000137 annealing Methods 0.000 description 1
- 108010059459 arginyl-threonyl-phenylalanine Proteins 0.000 description 1
- 108010036533 arginylvaline Proteins 0.000 description 1
- 210000001367 artery Anatomy 0.000 description 1
- 210000004507 artificial chromosome Anatomy 0.000 description 1
- 108010040443 aspartyl-aspartic acid Proteins 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000003115 biocidal effect Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 229940041514 candida albicans extract Drugs 0.000 description 1
- 239000000969 carrier Substances 0.000 description 1
- 235000020226 cashew nut Nutrition 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 238000004113 cell culture Methods 0.000 description 1
- 239000003153 chemical reaction reagent Substances 0.000 description 1
- 210000003763 chloroplast Anatomy 0.000 description 1
- 210000000349 chromosome Anatomy 0.000 description 1
- 235000020971 citrus fruits Nutrition 0.000 description 1
- 239000013599 cloning vector Substances 0.000 description 1
- 150000001875 compounds Chemical class 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 208000018999 crinkle Diseases 0.000 description 1
- 230000009260 cross reactivity Effects 0.000 description 1
- 235000003373 curcuma longa Nutrition 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 239000003085 diluting agent Substances 0.000 description 1
- 238000010790 dilution Methods 0.000 description 1
- 239000012895 dilution Substances 0.000 description 1
- 108010054813 diprotin B Proteins 0.000 description 1
- 230000008034 disappearance Effects 0.000 description 1
- 238000004520 electroporation Methods 0.000 description 1
- 230000002068 genetic effect Effects 0.000 description 1
- 108010057083 glutamyl-aspartyl-leucine Proteins 0.000 description 1
- 108010049041 glutamylalanine Proteins 0.000 description 1
- JYPCXBJRLBHWME-UHFFFAOYSA-N glycyl-L-prolyl-L-arginine Natural products NCC(=O)N1CCCC1C(=O)NC(CCCN=C(N)N)C(O)=O JYPCXBJRLBHWME-UHFFFAOYSA-N 0.000 description 1
- XBGGUPMXALFZOT-UHFFFAOYSA-N glycyl-L-tyrosine hemihydrate Natural products NCC(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 XBGGUPMXALFZOT-UHFFFAOYSA-N 0.000 description 1
- 108010075431 glycyl-alanyl-phenylalanine Proteins 0.000 description 1
- 108010019832 glycyl-asparaginyl-glycine Proteins 0.000 description 1
- 108010051307 glycyl-glycyl-proline Proteins 0.000 description 1
- 108010015792 glycyllysine Proteins 0.000 description 1
- 230000002363 herbicidal effect Effects 0.000 description 1
- 239000004009 herbicide Substances 0.000 description 1
- 108010025306 histidylleucine Proteins 0.000 description 1
- 108010018006 histidylserine Proteins 0.000 description 1
- 238000000338 in vitro Methods 0.000 description 1
- 230000006698 induction Effects 0.000 description 1
- 239000003112 inhibitor Substances 0.000 description 1
- 230000000749 insecticidal effect Effects 0.000 description 1
- 108010044311 leucyl-glycyl-glycine Proteins 0.000 description 1
- 108010087810 leucyl-seryl-glutamyl-leucine Proteins 0.000 description 1
- 108010003700 lysyl aspartic acid Proteins 0.000 description 1
- 108010076718 lysyl-glutamyl-tryptophan Proteins 0.000 description 1
- 108010017391 lysylvaline Proteins 0.000 description 1
- 235000009973 maize Nutrition 0.000 description 1
- 235000005739 manihot Nutrition 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 239000012528 membrane Substances 0.000 description 1
- 238000000520 microinjection Methods 0.000 description 1
- 239000011859 microparticle Substances 0.000 description 1
- 235000013336 milk Nutrition 0.000 description 1
- 239000008267 milk Substances 0.000 description 1
- 210000004080 milk Anatomy 0.000 description 1
- 238000010369 molecular cloning Methods 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 210000004940 nucleus Anatomy 0.000 description 1
- 239000003921 oil Substances 0.000 description 1
- 239000002751 oligonucleotide probe Substances 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 210000000056 organ Anatomy 0.000 description 1
- 210000004681 ovum Anatomy 0.000 description 1
- 229940049954 penicillin Drugs 0.000 description 1
- 235000019319 peptone Nutrition 0.000 description 1
- 108010012581 phenylalanylglutamate Proteins 0.000 description 1
- 210000000745 plant chromosome Anatomy 0.000 description 1
- 239000013600 plasmid vector Substances 0.000 description 1
- 239000013641 positive control Substances 0.000 description 1
- 125000002924 primary amino group Chemical group [H]N([H])* 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 108010020755 prolyl-glycyl-glycine Proteins 0.000 description 1
- 108010029020 prolylglycine Proteins 0.000 description 1
- 108010090894 prolylleucine Proteins 0.000 description 1
- 235000015136 pumpkin Nutrition 0.000 description 1
- 238000004080 punching Methods 0.000 description 1
- 238000000746 purification Methods 0.000 description 1
- 235000013526 red clover Nutrition 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 235000003499 redwood Nutrition 0.000 description 1
- 230000008521 reorganization Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 239000011435 rock Substances 0.000 description 1
- 235000017985 rocky mountain lodgepole pine Nutrition 0.000 description 1
- 108010026333 seryl-proline Proteins 0.000 description 1
- 239000011780 sodium chloride Substances 0.000 description 1
- SUKJFIGYRHOWBL-UHFFFAOYSA-N sodium hypochlorite Chemical compound [Na+].Cl[O-] SUKJFIGYRHOWBL-UHFFFAOYSA-N 0.000 description 1
- 239000001488 sodium phosphate Substances 0.000 description 1
- 229910000162 sodium phosphate Inorganic materials 0.000 description 1
- 238000005507 spraying Methods 0.000 description 1
- 238000011146 sterile filtration Methods 0.000 description 1
- 239000008223 sterile water Substances 0.000 description 1
- QTENRWWVYAAPBI-YCRXJPFRSA-N streptomycin sulfate Chemical compound OS(O)(=O)=O.OS(O)(=O)=O.OS(O)(=O)=O.CN[C@H]1[C@H](O)[C@@H](O)[C@H](CO)O[C@H]1O[C@@H]1[C@](C=O)(O)[C@H](C)O[C@H]1O[C@@H]1[C@@H](N=C(N)N)[C@H](O)[C@@H](N=C(N)N)[C@H](O)[C@H]1O.CN[C@H]1[C@H](O)[C@@H](O)[C@H](CO)O[C@H]1O[C@@H]1[C@](C=O)(O)[C@H](C)O[C@H]1O[C@@H]1[C@@H](N=C(N)N)[C@H](O)[C@@H](N=C(N)N)[C@H](O)[C@H]1O QTENRWWVYAAPBI-YCRXJPFRSA-N 0.000 description 1
- 239000000725 suspension Substances 0.000 description 1
- 108010050014 systemin Proteins 0.000 description 1
- HOWHQWFXSLOJEF-MGZLOUMQSA-N systemin Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)OC(=O)[C@@H]1CCCN1C(=O)[C@H]1N(C(=O)[C@H](CC(O)=O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CO)NC(=O)[C@H]2N(CCC2)C(=O)[C@H]2N(CCC2)C(=O)[C@H](CCCCN)NC(=O)[C@H](CO)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](NC(=O)[C@H](C)N)C(C)C)CCC1 HOWHQWFXSLOJEF-MGZLOUMQSA-N 0.000 description 1
- 108010061238 threonyl-glycine Proteins 0.000 description 1
- 238000013518 transcription Methods 0.000 description 1
- 230000035897 transcription Effects 0.000 description 1
- 230000017105 transposition Effects 0.000 description 1
- RYFMWSXOAZQYPI-UHFFFAOYSA-K trisodium phosphate Chemical compound [Na+].[Na+].[Na+].[O-]P([O-])([O-])=O RYFMWSXOAZQYPI-UHFFFAOYSA-K 0.000 description 1
- 108010084932 tryptophyl-proline Proteins 0.000 description 1
- 235000013976 turmeric Nutrition 0.000 description 1
- 230000007306 turnover Effects 0.000 description 1
- 229940072651 tylenol Drugs 0.000 description 1
- 108010005834 tyrosyl-alanyl-glycine Proteins 0.000 description 1
- 108010015385 valyl-prolyl-proline Proteins 0.000 description 1
- 210000003462 vein Anatomy 0.000 description 1
- 239000012138 yeast extract Substances 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/82—Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
- C12N15/8216—Methods for controlling, regulating or enhancing expression of transgenes in plant cells
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/82—Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
- C12N15/8241—Phenotypically and genetically modified plants via recombinant DNA technology
- C12N15/8261—Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield
- C12N15/8271—Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield for stress resistance, e.g. heavy metal resistance
- C12N15/8279—Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield for stress resistance, e.g. heavy metal resistance for biotic stress resistance, pathogen resistance, disease resistance
- C12N15/8286—Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield for stress resistance, e.g. heavy metal resistance for biotic stress resistance, pathogen resistance, disease resistance for insect resistance
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A40/00—Adaptation technologies in agriculture, forestry, livestock or agroalimentary production
- Y02A40/10—Adaptation technologies in agriculture, forestry, livestock or agroalimentary production in agriculture
- Y02A40/146—Genetically Modified [GMO] plants, e.g. transgenic plants
Landscapes
- Health & Medical Sciences (AREA)
- Genetics & Genomics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Wood Science & Technology (AREA)
- Biomedical Technology (AREA)
- Organic Chemistry (AREA)
- Biotechnology (AREA)
- General Engineering & Computer Science (AREA)
- Chemical & Material Sciences (AREA)
- Zoology (AREA)
- Molecular Biology (AREA)
- Microbiology (AREA)
- Cell Biology (AREA)
- Plant Pathology (AREA)
- Physics & Mathematics (AREA)
- Biochemistry (AREA)
- General Health & Medical Sciences (AREA)
- Biophysics (AREA)
- Insects & Arthropods (AREA)
- Pest Control & Pesticides (AREA)
- Breeding Of Plants And Reproduction By Means Of Culturing (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Agricultural Chemicals And Associated Chemicals (AREA)
Abstract
本发明涉及设计核酸的方法以提高植物中所编码的多肽的表达。在所述方法中,密码子使用频率偏好于植物病毒、植物病毒组或源自其的一组核酸分子的密码子使用频率。在优选实施方式中,所编码的多肽影响所述植物的表型。本发明还涉及对杀虫性多肽进行编码的核酸分子,其中所述核酸分子经设计是植物病毒密码子偏好的。本发明还涉及具有提高的杀虫性多肽表达的转基因植物及其后代以具有对昆虫或其他害虫的提高的抵抗力,所述昆虫或其他害虫对具有农业价值的植物有害。
Description
技术领域
[0001]本发明涉及设计核酸的方法以提高植物中所编码的多肽的表达。在所述方法中,密码子使用频率偏好于植物病毒的密码子使用频率。在优选实施方式中,所编码的多肽影响所述植物的表型。在具体实施方式中,所述被编码的多肽是杀虫性多肽。
背景技术
[0002]高水平的转基因多肽表达通常在植物中难以实现,尤其是当所述转基因编码的外源多肽衍生自进化上与植物相距甚远的生物体。这已成为成功开发利用衍生自原核生物的杀虫性多肽基因的主要障碍。转基因多肽表达的低水平的关键原因是在高度分化的物种,例如植物和原核生物之间通常观察到的密码子使用的显著差异,通常称为密码子偏好。密码子偏好通常与信使RNA(mRNA)的翻译效率相关,因而,可认为这尤其取决于被翻译的密码子的性质和可供使用的特定转移RNA(tRNA)分子。所选择的tRNA在细胞的优势通常反映出在肽合成中使用最频繁的密码子。因此,依据这些翻译因素,为最佳的表达可对植物中的基因进行修改。
[0003]通常有两种方法对在植物中表达的合成基因序列实现密码子偏好:密码子使用频率偏好和优选密码子偏好。密码子使用频率偏好指选择用于对被表达的多肽的氨基酸序列进行编码的核酸分子的密码子,使得在合成基因中编码的一种或多种类型的氨基酸的密码子使用频率类似于多肽表达宿主(例如植物)的密码子使用频率。优选密码子偏好包括选择用于对被表达的多肽的氨基酸序列进行编码的核酸分子的密码子,使得在合成基因中的一种或多种类型的氨基酸的一种或多种密码子是在多肽表达宿主(例如植物)中最频繁地对一种类型的氨基酸进行编码的单一密码子。这些改善植物中转基因表达的方法,尤其是与杀虫性苏云金杆菌CRY多肽的表达相关的方法已在大量实例中采用。
[0004]Adang等,美国专利第5,380,831号提及原生Bacillusthuringiensis tenebrionsis(Btt)Cry杀虫性多肽基因的合成变体,其中密码子使用频率经调整与在双子叶植物基因中使用的密码子使用频率相近。Adang等还指出通过采用单子叶植物的密码子使用频率,相同的方法可用于生成适用于在单子叶植物中表达的合成Cry基因。Adang等披露所述合成基因是如下合成的,即通过改变所述原生Cry基因的密码子个体使得总体密码子使用频率类似双子叶植物基因的密码子使用频率。
[0005]Fischhoff等,美国专利第5,500,365号提及对来自苏云金杆菌的Cry杀虫性多肽进行编码的植物基因。所列百分比基于双子叶植物基因密码子使用频率。Fischoff等,在总述中指出,应当优选选择密码子使得合成基因的GC含量为约50%。
[0006]Barton等,美国专利第5,177,308号涉及植物中杀虫性毒素的表达。衍生自原生性蝎子基因的合成AaIT杀虫性多肽基因得以描述,其中声称最优选的密码子用于每种氨基酸。
[0007]Koziel等,美国专利第6,121,014号涉及优化植物中的多肽表达,尤其是来自于苏云金杆菌的杀虫性多肽。Koziel等指出对在单子叶或双子叶植物中表达进行了优化的合成基因的设计是基于将原生序列中的足够数目的密码子改变为宿主植物的优选密码子。
[0008]通常,已尝试通过或者使用植物宿主的优选密码子,或者使用所述植物宿主的密码子使用频率提高植物中转基因的翻译效率。然而,应当注意的是,许多表面上的玉米密码子偏好可归因于与翻译效率本身无关的因素,诸如植物染色体甲基化选择压力和甲基化位点相对非甲基化位点的突变率。因此,在本领域中依然存在未能得到满足的对替代性的方法的需求以改变密码子使用频率从而提高植物转基因表达。
发明内容
[0009]本发明涉及设计核酸的方法以提高植物中所编码的多肽的表达。因此,被表达的核酸分子的至少一个密码子将被更改为另一种密码子,其具有的在植物病毒中的密码子使用频率将比为更改的密码子要高。优选的是,与由未被改变的核酸分子所编码的多肽相比,本发明的核酸分子将提高所编码的多肽的表达。
[0010]在一个实施方式中,被更改的密码子已改变为在植物病毒中的密码子使用频率大于0.09的密码子。在另一个实施方式中,被更改的密码子已被改变为另一种密码子,其具有的在植物病毒中的密码子使用频率等于或者大于由被更改的密码子所编码的特定氨基酸的密码子使用频率中值。该密码子使用频率中值是在植物病毒中对特定氨基酸进行编码的所有密码子的密码子使用频率的中值。
[0011]在优选实施方式中,所编码的多肽影响所述植物的表型。在具体实施方式中,所述被编码的多肽是杀虫性多肽,包括但不限制于来自苏云金杆菌的437N和Cry多肽以及来自米根霉杀虫性脂肪酶多肽。
[0012]本发明还涵盖含有本发明的方法所制造的核酸分子的载体、宿主细胞、转基因植物及其后代。本发明进一步涉及被转化植物的植物繁殖材料,包括但不限制于种子、块茎、球茎、鳞茎、叶子以及根和芽的切割部分。
附图说明
[0013]图1A~1B显示了抵抗欧洲玉米螟的叶圆盘试验的结果。用密码子经最优化的苏云金杆菌杀虫性多肽473N转化的calli的叶圆盘与欧洲玉米螟幼虫一同温育48小时。还包括来自非转基因植物的对照叶圆盘以比较叶消耗量。(A)在对照孔中的叶圆盘被完全消耗仅残余下叶圆盘曾放置其上的过滤纸圆盘(见第1行)。用密码子经最优化的473N转化的叶圆盘仅被消耗很少(见第2行)。(B)其他具有用密码子经最优化的473N的转化事例显示非常少的叶消耗。
[0014]图2显示用密码子经最优化的苏云金杆菌杀虫性多肽473N转化的植物的免疫印迹分析。采用抗-473N抗体对转基因植物多肽提取物进行免疫印迹分析。重组纯化473N显示在道1中。对照非转基因植物样品显示与转基因样品相同的非-437N交叉反应性带。在叶圆盘测试中显示了有效性的事例的样品中,存在对应于437N的带(道2、3、4和7)。
[0015]图3显示用来自米根霉的密码子经最优化的杀虫性脂肪酶转化的植物的免疫印迹分析。用抗Rolipase抗体对来自于(A)叶组织和(B)根组织的转基因植物多肽提取物进行免疫印迹分析。纯化重组Rolipase前体蛋白(ROL,~42kD)在免疫印迹分析中保温作为正对照。在根培育株分析中为正反应的植物中观察到与成熟Rolipase(~31kD)对应的带(道1~6)。
具体实施方式
[0016]生物系统在确定指定类型的氨基酸的特定密码子的使用中显示出特征性的使用频率(即密码子使用频率)。所述密码子频率在物种间可显著不同,此现象已知为“密码子偏好”。密码子偏好的物种差异可能归因于遗传密码的兼并,并已很好地记录在密码子使用频率表的形式中。特定核酸分子的密码子偏好很大程度上将决定所编码的多肽在特定类型的细胞内表达的效率。
[0017]密码子偏好对表达效率的影响是转基因表达非常重要的考虑。在将作为表达宿主的物种内不经常使用的含有许多密码子的mRNA序列不太可能有效地进行翻译。相反,由宿主生物体频繁使用的密码子构成的mRNA序列很可能高效地进行翻译。
[0018]本发明涉及设计核酸分子的方法以提高所编码的多肽在植物中的表达,所述方法通过构建其密码子偏好于在植物病毒的核酸分子编码序列中频繁使用的密码子的核酸分子实现核酸分子的设计。已知的高效利用植物宿主翻译机制的植物病毒的密码子偏好对比原生植物宿主染色体序列的密码子偏好更可能是植物宿主翻译优选性的反映。因此,被表达的核酸分子的至少一个密码子被更改为另一种密码子,其具有在植物病毒、植物病毒组或源自其的一组核酸分子中比未更改的密码子更高的使用频率。优选的是,与由未被改变的核酸分子所编码的多肽相比,本发明的核酸分子将提高所编码的多肽的表达。
[0019]本发明的方法包括生成来自感兴趣的植物病毒、植物病毒组或源自其的一组核酸分子的密码子使用频率表以确定在植物病毒中高使用频率的密码子。这些高使用频率密码子可用于替代将在植物中进行表达的核酸分子中存在的低使用频率密码子。在所述替代中用到的具有更高使用频率的密码子被称为“更改密码子”。具有至少一个更改密码子的核酸分子及其编码的多肽被称之为“密码子经最优化”的。对于核酸分子或多肽,并没有要求所有或者大多数密码子必须是更改密码子才能称为密码子经最优化的分子。
确定密码子使用频率
[0020]为改变核酸分子使得被更改的密码子是那些具有在植物病毒中较高使用频率的密码子,必须首先决定所述植物病毒的密码子使用频率。在一个实施方式中,所述密码子使用频率是基于由所述病毒核酸分子所编码的所有多肽。在另一个实施方式中,所述密码子使用频率是基于由所述病毒核酸分子所编码的功能相近的一部分多肽(例如,外壳多肽、转录或翻译机制多肽、膜多肽等)。所述密码子使用频率可基于一种植物病毒或多种植物病毒。在采用多种植物病毒计算密码子使用频率的实施方式中,所述病毒优选感染相同类型的植物(例如单子叶、双子叶、玉米、大豆等)
[0021]根据以下方法计算核酸分子编码序列的密码子使用频率。首先,通过计算在一个或多个核酸分子编码序列中的出现确定编码特定类型的氨基酸的所有密码子(或终止密码子)的总数。其次,确定同一核酸分子编码序列的每种编码特定氨基酸的密码子(或终止密码子)的出现总数。再三,将该密码子出现总次数除以与该密码子编码相同类型的氨基酸的密码子出现的总次数从而确定每种密码子的密码子使用频率。
[0022]在节5.1.1、5.1.2和5.2中披露的表格可用于选择密码子作为更改密码子。作为另外一种选择,有经验的技术人员可采用此处描述的方法对感兴趣的病毒生成截然不同的表格。
单子叶植物病毒密码子偏好
[0023]在一些实施方式中,感染单子叶植物的一种病毒或多种病毒被用于生成密码子使用频率。作为非限制性实施例,为来自单子叶植物病毒的173个核酸分子编码序列确定了单子叶植物病毒密码子使用频率(列子表1中)。如表2所示,所使用的序列包括由从表1中列出的单子叶病毒的核酸分子编码序列确定的密码子使用频率。在表2中列出的单子叶植物病毒密码子使用频率可用于指导密码子的选择以用于设计对在植物中进行表达的多肽进行编码的具有植物病毒密码子偏好的核酸分子。病毒序列可得自任何来源,例如Genbank和NCBI分类数据库(NCBI taxonomy database)。如果由含有更改密码子的核酸分子编码的多肽需要在单子叶植物中表达,优选为使用感染单子叶植物的植物病毒生成所述密码子使用频率(例如在表2中所列)。
表1:单子叶植物病毒和来自用于密码子使用频率计算的每种病毒的序列数
表2:单子叶植物病毒使用频率
[0024]在具体实施方式中,密码子使用频率是基于单子叶植物病毒或者感染特定单子叶植物类型(例如,玉米)的病毒。在一个具体实施方式中,利用来自玉米病毒的核酸分子编码序列计算密码子使用频率,其中所述核酸分子具有以下登记编号:CAA68570、CAA68567、CAA68566、CAA68568、CAA68569、CAA12314、CAA12315、CAA12316、CAA12317、CAA12318、CAA12319、CAA12320,NP_115454、NP_115455、AAB22541、AAB22542、AAB26111、AAP80680、AAP80681、AAA46635、AAA46636、AAA46637、NP_569138、NP_619717、NP_619718、NP_619719、NP_619720、NP_619721、NP_619722、AAB50194、AAB50195、CAA39227和CAA39228(表3)。在另一具体实施方式中,对一种或多种来自玉米特异性病毒的一组核酸分子进行计算密码子使用频率。编码玉米特异性病毒外壳多肽的核酸分子(具有编号CAA68566、AAP80681、AAA46637和NP_619722)用于生成表4。如果希望在玉米中表达由包含更改密码子的核酸分子编码的多肽,优选使用感染玉米的病毒以生成所述密码子使用频率(例如在表3和4中)。
表3:玉米特异性病毒密码子使用频率
表4:玉米特异性病毒衣壳/外壳多肽密码子使用频率
双子叶植物病毒密码子偏好
[0025]在一些实施方式中,感染双子叶植物的一种或多种植物病毒用于生成密码子使用频率。作为非限制性例子,由321种来自于双子叶植物病毒的核酸分子编码序列确定双子叶植物病毒密码子使用频率(列在表5中)。表6显示由列在表5中的所述双子叶植物病毒的核酸分子解码序列确定的密码子使用频率。列在表6中的双子叶植物病毒密码子使用频率可用于指导密码子的选择以用于设计对在植物中进行表达的多肽进行编码的具有植物病毒密码子偏好的核酸分子。如果希望在双子叶植物中表达由包含更改密码子的核酸分子编码的多肽,优选使用感染双子叶植物的病毒以生成所述密码子使用频率(例如在表6中)。
[0026]在一个具体实施方式中,由一种或多种双子叶植物病毒的一组核酸分子计算密码子使用频率。来自大量不同的双子叶植物病毒(列在表7中)的编码外壳多肽的核酸分子用于生成表8。
[0027]在另一个具体实施方式中,密码子使用频率是基于感染特定双子叶植物类型(例如,大豆)的一种或多种双子叶植物病毒。如果希望在特定类型的植物(例如大豆)中表达由包含更改密码子的核酸分子编码的多肽,优选使用感染所述类型植物的病毒(例如大豆特异性病毒)以生成所述密码子使用频率。
表5:双子叶植物病毒和来自用于密码子使用频率计算的每种病毒的序列数
表6:双子叶植物病毒密码子使用频率
表7:双子叶植物病毒和来自用于密码子使用频率计算的衣壳/外壳多肽的序列数
双子叶植物病毒 | 序列数 |
朝鲜蓟斑驳皱缩病毒 | 1 |
菜豆calico mosaic virus | 1 |
菜豆矮花叶病毒 | 2 |
菜豆金花叶病毒 | 1 |
菜豆金黄花叶病毒 | 1 |
菜豆卷叶病毒 | 1 |
Beet curly top virus | 1 |
木薯脉花叶病毒 | 1 |
花椰菜花叶病毒 | 1 |
Chloris striate花叶病毒 | 1 |
黄瓜坏死病毒 | 1 |
葫芦卷叶病毒-[亚利桑那州] | 1 |
Digitaria streak virus | 1 |
Kennedya yellow花叶病毒 | 1 |
莴苣传染性枯黄病毒 | 2 |
大翼豆花叶病毒 | 1 |
Miscanthus streak virus | 1 |
胡椒金花叶病毒-[CR] | 1 |
胡椒脉黄化马里病毒 | 1 |
Potato aucuba花叶病毒 | 1 |
马铃薯病毒S | 2 |
马铃薯黄花叶病毒-[Guadeloupe] | 1 |
李矮缩病毒 | 4 |
红三叶草坏死花叶病毒 | 2 |
南非木薯花叶病毒 | 1 |
大豆萎黄斑驳病毒 | 1 |
南瓜温和卷叶病毒 | 1 |
草木樨坏死花叶病毒 | 1 |
烟草黄矮缩病毒 | 1 |
西红柿金花叶病毒 | 1 |
西红柿卷叶马里病毒 | 1 |
西红柿斑驳泰诺病毒 | 1 |
西红柿斑驳病毒 | 1 |
Tomato spotted wilt virus | 1 |
西红柿黄卷叶中国病毒 | 1 |
西红柿黄叶卷曲病毒北碧府病毒-[泰国Kan2] | 1 |
西红柿黄卷叶马拉加病毒 | 1 |
西红柿黄卷叶病毒 | 3 |
芜菁皱缩病毒 | 1 |
西红柿金花叶病毒 | 1 |
表8:双子叶植物病毒衣壳/外壳多肽密码子使用频率
密码子选择标准
[0028]一定对于特定病毒、病毒组,或源自其的一组核酸分子计算了密码子使用频率,可利用多种标准选择密码子作为更改密码子。应当理解还有其他并非基于密码子使用频率的条件能影响所述核酸分子的最终设计(参见节5.3)。
提高的频率值标准
[0029] 在一种实施方式中,相比在被设计的核酸分子中的密码子,在用于创建所述密码子使用频率表的一种或多种植物病毒或源自其的一组核酸分子中具有更高使用频率的任何密码子被选作更改密码子。例如,根据本发明的植物病毒密码子偏好法进行设计的核酸分子含有由GCG密码子编码的丙氨酸,该密码子能被更改为在病毒中使用更频繁的密码子。例如,利用表2,本领域技术人员能够看出丙氨酸的其他三种密码子(例如,GCA、GCC或GCT)中的任一种在植物病毒中使用的更加频繁,因此可用作更改密码子。应当理解的是并非必须选择在植物病毒中使用最频繁的密码子作为所述更改密码子。更准确地是,仅仅要求所述更改密码子相比在所述核酸分子中原先存在的密码子,在所述一种或多种植物病毒,或源自其的核酸分子中具有更高的使用频率。
中值标准
[0030]在其他实施方式中,更改密码子在用于创建所述密码子使用频率表的一种或多种植物病毒或源自其的一组核酸分子中具有的密码子使用频率等于或大于对于该特定氨基酸的密码子使用频率的中值。对于指定类型的氨基酸的密码子使用频率的中值可通过首先将对所述特定氨基酸的所有密码子按使用最频繁至使用最不频繁进行排序而确定。
[0031]对于其中有偶数个密码子对特定类型的氨基酸进行编码的时候,所述密码子使用频率中值是比其使用更频繁的密码子数目和比其使用更不频繁的密码子数目相同的那一个。例如,异亮氨酸由三个密码子编码。为找出密码子使用频率的中值,将找出比其使用更频繁的密码子数目和比其使用更不频繁的密码子数目相同的那个密码子(在该情况下,当使用在表2中所列的频率时为ATA)。当设计核酸分子时,可选择对于异亮氨酸使用频率为0.3或0.3以上的更改密码子。
[0032]对于其中由偶数个密码子对特定类型的氨基酸进行编码的情况下,所述密码子使用频率中值是比其使用更频繁的密码子数目和比其使用更不频繁的密码子数目相同的两个密码子的密码子使用频率的中值。例如,丙氨酸由四种密码子编码。为找出密码子使用频率的中值,将所述密码子按照使用最频繁至使用最不频繁进行排序(在该情况下,使用表2中所列的频率时为GCT、GCA、GCC、GCG)。由于GCA和GCC具有相同数目的比其使用更频繁的密码子和比其使用更不频繁的密码子,它们的频率值的平均值是所述密码子使用频率中值(即0.31和0.21的平均值是0.26)。当设计核酸分子时,可以选择对于丙氨酸使用频率为0.26或0.26以上的更改密码子。
[0033]该方法偏好于使所述核酸分子编码序列采用在植物病毒核酸分子编码序列中更频繁使用的密码子,尽管并非必须是最频繁使用的密码子,同时尽可能不使用较不频繁的密码子(即那些密码子使用频率在特定氨基酸的密码子使用频率中值以下的密码子)
[0034]表9显示列在表2中的单子叶植物病毒密码子使用频率的中值,以及对于每种类型的氨基酸而言,根据其使用频率满足该标准的密码子。
[0035]表10显示列在表3中的玉米特异性病毒密码子使用频率的中值,以及对于每种类型的氨基酸而言,根据其使用频率满足该标准的密码子。
[0036]表11显示列在表4中的玉米特异性病毒外壳/衣壳多肽密码子使用频率的中值,以及对于每种类型的氨基酸而言,根据其使用频率满足该标准的密码子。
[0037]表12显示列在表6中的双子叶植物病毒密码子使用频率的中值,以及对于每种类型的氨基酸而言,根据其使用频率满足该标准的密码子。
[0038]表13显示列在表6中的双子叶植物病毒外壳/衣壳多肽密码子使用频率的中值,以及对于每种类型的氨基酸而言,根据其使用频率满足该标准的密码子。
表9:根据单子叶植物病毒密码子使用频率中值的可能可选择的密码子
氨基酸 | 密码子 | 单子叶植物病毒密码子频率 | 单子叶植物病毒密码子中值 | 可供选择的密码子 |
Ala | GCA | 0.31 | 0.26 | GCA |
GCC | 0.21 | |||
GCG | 0.14 | |||
GCT | 0.34 | GCT | ||
Arg | AGA | 0.32 | 0.15 | AGA |
AGG | 0.17 | AGG | ||
CGA | 0.14 | |||
CGC | 0.14 | |||
CGG | 0.09 | |||
CGT | 0.16 | CGT | ||
Asn | AAC | 0.42 | 0.50 | |
AAT | 0.58 | AAT | ||
Asp | GAC | 0.38 | 0.50 | |
GAT | 0.62 | GAT | ||
Cys | TGC | 0.44 | 0.50 | |
TGT | 0.56 | TGT | ||
Gln | CAA | 0.58 | 0.50 | CAA |
CAG | 0.42 | |||
Glu | GAA | 0.60 | 0.50 | GAA |
GAG | 0.40 | |||
Gly | GGA | 0.37 | 0.24 | GGA |
GGC | 0.20 | |||
GGG | 0.14 | |||
GGT | 0.28 | GGT | ||
His | CAC | 0.43 | 0.50 | |
CAT | 0.57 | CAT | ||
Ile | ATA | 0.30 | 0.30 | ATA |
ATC | 0.29 | |||
ATT | 0.41 | ATT | ||
Leu | CTA | 0.13 | 0.16 | |
CTC | 0.14 | |||
CTG | 0.13 | |||
CTT | 0.18 | CTT | ||
TTA | 0.21 | TTA | ||
TTG | 0.21 | TTG | ||
Lys | AAA | 0.53 | 0.5 | AAA |
AAG | 0.47 | |||
Met | ATG | 1.00 | 1.00 | ATG |
Phe | TTC | 0.46 | 0.50 | |
TTT | 0.54 | TTT | ||
Pro | CCA | 0.38 | 0.27 | CCA |
CCC | 0.17 |
氨基酸 | 密码子 | 单子叶植物病毒密码子频率 | 单子叶植物病毒密码子中值 | 可供选择的密码子 |
CCG | 0.14 | |||
CCT | 0.31 | CCT | ||
终止 | TAA | 0.34 | 0.34 | TAA |
TAG | 0.25 | |||
TGA | 0.41 | TGA | ||
Ser | AGC | 0.13 | 0.16 | |
AGT | 0.18 | AGT | ||
TCA | 0.24 | TCA | ||
TCC | 0.14 | |||
TGC | 0.10 | |||
TCT | 0.21 | TCT | ||
Thr | ACA | 0.30 | 0.25 | ACA |
ACC | 0.20 | |||
ACG | 0.16 | |||
ACT | 0.34 | ACT | ||
Trp | TGG | 1.00 | 1.00 | TGG |
Tyr | TAC | 0.43 | 0.50 | |
TAT | 0.57 | TAT | ||
Val | GTA | 0.19 | 0.23 | |
GTC | 0.21 | |||
GTG | 0.25 | GTG | ||
GTT | 0.36 | GTT |
表10:根据玉米特异性病毒密码子使用频率中值可能可选择的密码子
氨基酸 | 密码子 | 玉米病毒密码子频率 | 玉米病毒中值 | 可供选择的密码子 |
Ala | GCA | 0.31 | 0.29 | GCA |
GCC | 0.3 | GCC | ||
GCG | 0.11 | |||
GCT | 0.28 | |||
Arg | AGA | 0.27 | 0.15 | AGA |
AGG | 0.17 | AGG | ||
CGA | 0.12 | |||
CGC | 0.19 | CGC | ||
CGG | 0.12 | |||
CGT | 0.13 | |||
Asn | AAC | 0.44 | 0.5 | |
AAT | 0.56 | AAT | ||
Asp | GAC | 0.41 | 0.5 | |
GAT | 0.59 | GAT | ||
Cys | TGC | 0.42 | 0.5 | |
TGT | 0.58 | TGT | ||
Gln | CAA | 0.5 | 0.5 | CAA |
CAG | 0.5 | CAG | ||
Glu | GAA | 0.52 | 0.5 | GAA |
GAG | 0.48 | |||
Gly | GGA | 0.36 | 0.24 | GGA |
氨基酸 | 密码子 | 玉米病毒密码子频率 | 玉米病毒中值 | 可供选择的密码子 |
GGC | 0.23 | |||
GGG | 0.17 | |||
GGT | 0.24 | GGT | ||
His | CAC | 0.45 | 0.5 | |
CAT | 0.55 | CAT | ||
Ile | ATA | 0.27 | 0.3 | |
ATC | 0.3 | ATC | ||
ATT | 0.43 | ATT | ||
Leu | CTA | 0.12 | 0.17 | |
CTC | 0.22 | CTC | ||
CTG | 0.16 | |||
CTT | 0.19 | CTT | ||
TTA | 0.14 | |||
TTG | 0.18 | TTG | ||
Lys | AAA | 0.49 | 0.5 | |
AAG | 0.51 | AAG | ||
Met | ATG | 1 | 1 | ATG |
Phe | TTC | 0.56 | 0.5 | TTC |
TTT | 0.44 | |||
Pro | CCA | 0.31 | 0.26 | CCA |
CCC | 0.2 | |||
CCG | 0.17 | |||
CCT | 0.32 | CCT | ||
终止 | TAA | 0.33 | 0.33 | TAA |
TAG | 0.42 | TAG | ||
TGA | 0.24 | |||
Ser | AGC | 0.12 | 0.17 | |
AGT | 0.12 | |||
TCA | 0.22 | TCA | ||
TCC | 0.21 | TCC | ||
TCG | 0.10 | |||
TCT | 0.22 | TCT | ||
Thr | ACA | 0.32 | 0.28 | ACA |
ACC | 0.26 | |||
ACG | 0.13 | |||
ACT | 0.29 | ACT | ||
Trp | TGG | 1 | 1 | TGG |
Tyr | TAC | 0.46 | 0.5 | |
TAT | 0.54 | TAT | ||
Val | GTA | 0.16 | 0.26 | |
GTC | 0.25 | |||
GTG | 0.26 | GTG | ||
GTT | 0.33 | GTT |
表11:根据玉米特异性病毒外壳/衣壳多肽密码子使用频率中值可能可选择的密码子
氨基酸 | 密码子 | 玉米病毒外壳(4Seqs)密码子频率 | 玉米病毒外壳中值 | 可供选择的密码子 |
Ala | GCA | 0.38 | 0.24 | GCA |
GCC | 0.22 | |||
GCG | 0.14 | |||
GCT | 0.26 | GCT | ||
Arg | AGA | 0.3 | 0.18 | AGA |
AGG | 0.18 | AGG | ||
CGA | 0.18 | CGA | ||
CGC | 0.16 | |||
CGG | 0.11 | |||
CGT | 0.07 | |||
Asn | AAC | 0.53 | 0.5 | AAC |
AAT | 0.47 | |||
Asp | GAC | 0.45 | 0.5 | |
GAT | 0.55 | GAT | ||
Cys | TGC | 0.53 | 0.5 | TGC |
TGT | 0.47 | |||
Gln | CAA | 0.52 | 0.5 | CAA |
CAG | 0.48 | |||
Glu | GAA | 0.44 | 0.5 | |
GAG | 0.56 | GAG | ||
Gly | GGA | 0.42 | 0.23 | GGA |
GGC | 0.18 | |||
GGG | 0.23 | GGG | ||
GGT | 0.18 | |||
His | CAC | 0.35 | 0.5 | |
CAT | 0.65 | CAT | ||
Ile | ATA | 0.24 | 0.36 | |
ATC | 0.36 | ATC | ||
ATT | 0.4 | ATT | ||
Leu | CTA | 0.12 | 0.15 | |
CTC | 0.18 | CTC | ||
CTG | 0.25 | CTG | ||
CTT | 0.12 | |||
TTA | 0.1 | |||
TTG | 0.23 | TTG | ||
Lys | AAA | 0.48 | 0.5 | |
AAG | 0.52 | AAG | ||
Met | ATG | 1 | 1 | ATG |
Phe | TTC | 0.57 | 0.5 | TTC |
TTT | 0.43 |
氨基酸 | 密码子 | 玉米病毒外壳(4Seqs)密码子频率 | 玉米病毒外壳中值 | 可供选择的密码子 |
Pro | CCA | 0.32 | 0.28 | CCA |
CCC | 0.24 | |||
CCG | 0.12 | |||
CCT | 0.32 | CCT | ||
Stop | TAA | 0.5 | 0.5 | TAA |
TAG | 0 | |||
TGA | 0.5 | TGA | ||
Ser | AGC | 0.19 | 0.17 | AGC |
AGT | 0.13 | |||
TCA | 0.21 | TCA | ||
TCC | 0.26 | TCC | ||
TCG | 0.06 | |||
TCT | 0.15 | |||
Thr | ACA | 0.36 | 0.29 | ACA |
ACC | 0.27 | |||
ACG | 0.06 | |||
ACT | 0.31 | ACT | ||
Trp | TGG | 1 | 1 | TGG |
Tyr | TAC | 0.41 | 0.5 | |
TAT | 0.59 | TAT | ||
Val | GTA | 0.15 | 0.25 | |
GTC | 0.26 | GTC | ||
GTG | 0.36 | GTG | ||
GTT | 0.23 |
表12:根据双子叶植物病毒密码子使用频率中值可能可选择的密码子
氨基酸 | 密码子 | 双子叶植物病毒密码子频率 | 双子叶植物病毒中值 | 可供选择的密码子 |
Ala | GCA | 0.33 | 0.27 | GCA |
GCC | 0.21 | |||
GCG | 0.13 | |||
GCT | 0.33 | GCT | ||
Arg | AGA | 0.34 | 0.13 | AGA |
AGG | 0.23 | AGG | ||
CGA | 0.11 | |||
CGC | 0.09 | |||
CGG | 0.08 | |||
CGT | 0.15 | CGT | ||
Asn | AAC | 0.41 | 0.50 | |
AAT | 0.59 | AAT | ||
Asp | GAC | 0.37 | 0.50 | |
GAT | 0.63 | GAT | ||
Cys | TGC | 0.41 | 0.50 | |
TGT | 0.59 | TGT | ||
Gln | CAA | 0.61 | 0.50 | CAA |
CAG | 0.40 |
氨基酸 | 密码子 | 双子叶植物病毒密码子频率 | 双子叶植物病毒中值 | 可供选择的密码子 |
Glu | GAA | 0.61 | 0.50 | GAA |
GAG | 0.39 | |||
Gly | GGA | 0.35 | 0.24 | GGA |
GGC | 0.18 | |||
GGG | 0.18 | |||
GGT | 0.29 | GGT | ||
His | CAC | 0.43 | ||
CAT | 0.57 | CAT | ||
Ile | ATA | 0.31 | 0.31 | ATA |
ATC | 0.28 | |||
ATT | 0.41 | ATT | ||
Leu | CTA | 0.12 | 0.16 | |
CTC | 0.14 | |||
CTG | 0.12 | |||
CTT | 0.19 | CTT | ||
TTA | 0.22 | TTA | ||
TTG | 0.21 | TTG | ||
Lys | AAA | 0.54 | 0.50 | AAA |
AAG | 0.46 | |||
Met | ATG | 1 | 1.00 | ATG |
Phe | TTC | 0.44 | 0.50 | |
TTT | 0.56 | TTT | ||
Pro | CCA | 0.38 | 0.25 | CCA |
CCC | 0.18 | |||
CCG | 0.12 | |||
CCT | 0.31 | CCT | ||
终止 | TAA | 0.46 | 0.30 | TAA |
TAG | 0.24 | |||
TGA | 0.30 | TGA | ||
Ser | AGC | 0.14 | 0.17 | |
AGT | 0.20 | AGT | ||
TCA | 0.23 | TCA | ||
TCC | 0.14 | |||
TCG | 0.08 | |||
TCT | 0.21 | TCT | ||
Thr | ACA | 0.36 | 0.25 | ACA |
ACC | 0.20 | |||
ACG | 0.14 | |||
ACT | 0.31 | ACT | ||
Trp | TGG | 1 | 1.00 | TGG |
Tyr | TAC | 0.41 | 0.50 | |
TAT | 0.59 | TAT | ||
Val | GTA | 0.19 | 0.23 | |
GTC | 0.21 | |||
GTG | 0.25 | GTG | ||
GTT | 0.35 | GTT |
表13:根据双子叶植物病毒外壳/衣壳多肽密码子使用频率中值可能可选择的密码子
氨基酸 | 密码子 | 双子叶植物病毒外壳密码子频率 | 双子叶植物病毒外壳中值 | 可供选择的密码子 |
Ala | GCA | 0.24 | 0.255 | |
GCC | 0.27 | GCC | ||
GCG | 0.15 | |||
GCT | 0.34 | GCT | ||
Arg | AGA | 0.24 | 0.165 | AGA |
AGG | 0.22 | AGG | ||
CGA | 0.12 | |||
CGC | 0.1 | |||
CGG | 0.11 | |||
CGT | 0.21 | CGT | ||
Asn | AAC | 0.44 | 0.5 | |
AAT | 0.56 | AAT | ||
Asp | GAC | 0.32 | 0.5 | |
GAT | 0.68 | GAT | ||
Cys | TGC | 0.25 | 0.5 | |
TGT | 0.75 | TGT | ||
Gln | CAA | 0.59 | 0.5 | CAA |
CAG | 0.41 | |||
Glu | GAA | 0.61 | 0.5 | GAA |
GAG | 0.39 | |||
Gly | GGA | 0.32 | 0.25 | GGA |
GGC | 0.2 | |||
GGG | 0.18 | |||
GGT | 0.3 | GGT | ||
His | CAC | 0.35 | 0.5 | |
CAT | 0.65 | CAT | ||
Ile | ATA | 0.39 | 0.35 | ATA |
ATC | 0.26 | |||
ATT | 0.35 | ATT | ||
Leu | CTA | 0.1 | 0.135 | |
CTC | 0.13 | |||
CTG | 0.12 | |||
CTT | 0.14 | CTT | ||
TTA | 0.28 | TTA | ||
TTG | 0.23 | TTG | ||
Lys | AAA | 0.45 | 0.5 | |
AAG | 0.55 | AAG | ||
Met | ATG | 1 | 1 | ATG |
Phe | TTC | 0.47 | 0.5 | |
TTT | 0.53 | TTT | ||
Pro | CCA | 0.27 | 0.27 | CCA |
CCC | 0.27 | CCC | ||
CCG | 0.14 | |||
CCT | 0.33 | CCT | ||
终止 | TAA | 0.62 | 0.24 | TAA |
TAG | 0.14 | |||
TGA | 0.24 | TGA |
氨基酸 | 密码子 | 双子叶植物病毒外壳密码子频率 | 双子叶植物病毒外壳中值 | 可供选择的密码子 |
Ser | AGC | 0.15 | 0.165 | |
AGT | 0.19 | AGT | ||
TCA | 0.18 | TCA | ||
TCC | 0.14 | |||
TCG | 0.11 | |||
TCT | 0.24 | TCT | ||
Thr | ACA | 0.25 | 0.25 | ACA |
ACC | 0.25 | ACC | ||
ACG | 0.16 | |||
ACT | 0.34 | ACT | ||
Trp | TGG | 1 | 1 | TGG |
Tyr | TAC | 0.37 | 0.5 | |
TAT | 0.63 | TAT | ||
Val | GTA | 0.17 | 0.24 | |
GTC | 0.23 | |||
GTG | 0.25 | GTG | ||
GTT | 0.35 | GTT |
频率匹配标准
[0039]在另一实施方式中,更改密码子可经选择使得所得包含更改密码子的核酸分子具有的特定类型的氨基酸的使用频率与在所述用于创建所述密码子使用频率表的一种或多种植物病毒,或源自其的一组核酸分子中的该氨基酸的密码子使用频率相同或者基本相似(例如诸如在表2、3、4、6或8所示)。例如,根据本发明的方法设计的核酸分子可包括更改密码子使得特定的氨基酸(例如甘氨酸)全部由其频率与植物病毒密码子使用频率类似或者基本类似的密码子所编码(例如,使用表2,甘氨酸分别由GGA、GGT、GGC、GGG以0.37、0.28、0.20和0.14的频率进行编码)。
[0040]对于一种或多种类型的氨基酸,密码子使用频率可按此方式与所述用于创建所述密码子使用频率表的一种或多种植物病毒,或源自其的一组核酸分子中的密码子使用频率相匹配。任何多种类型的氨基酸可更改为与植物病毒密码子频率相同或者基本相似。在具体实施方式中,至少2种类型的氨基酸、至少5种类型的氨基酸、至少8种类型的氨基酸、至少12种类型的氨基酸、至少18种类型的氨基或者所有20种类型的生物存在氨基酸可由与在一种或多种植物病毒,或源自其的一组核酸分子中的频率相似或基本相似的密码子进行编码。
最小阈值标准
[0041]在另一实施方式中,在所述用于创建所述密码子使用频率表的一种或多种植物病毒,或源自其的一组核酸分子中的使用频率为0.09或0.09以下的植物病毒密码子被去掉不可选作更改密码子。经考虑该步骤去掉在植物病毒中使用频率太低(0.09或0.09以下)而不可能在植物中有效翻译的密码子。任何具有0.09以上的使用频率的对相同氨基酸进行编码的密码子可用作更改密码子以取代低频率密码子。在具体实施方式中,余下的使用频率高于0.09的密码子以保持余下的密码子的比例性的方式进行替代。
[0042]表14显示单子叶植物病毒的密码子使用频率,其中对于每种氨基酸类型,频率在0.09或0.09以下(根据表2)的密码子已被去掉,而余下的密码子已成比例地进行调整。
[0043]表15显示玉米特异性病毒的密码子使用频率,其中对于每种氨基酸类型,频率在0.09或0.09以下(根据表4)的密码子已被去掉,而余下的密码子已成比例地进行调整。
[0044]表16显示双子叶植物病毒的密码子使用频率,其中对于每种氨基酸类型,频率在0.09或0.09以下的密码子(根据表6)已被去掉,而余下的密码子已成比例地进行调整。
[0045]表16显示双子叶植物病毒外壳/衣壳多肽的密码子使用频率,其中对于每种氨基酸类型,频率在0.09或0.09以下的密码子(根据表8)已被去掉,而余下的密码子已成比例地进行调整。
[0046]例如,在表14中,对于氨基酸精氨酸,有一个密码子CGG,其原始密码子使用频率不大于0.09。因此CGG的密码子使用频率被设为0.00,而所述值0.09则在余下的密码子AGA、AGG、CGA、CGC和CGT的频率之间,根据显示的它们的原始密码子使用频率进行重新分配。在表3中列出的玉米特异性病毒核酸分子编码序列的所有密码子使用频率大于0.09,因此在所述0.09标准下,玉米特异性病毒核酸分子编码序列的密码子使用频率保持相同。
表14:在去掉使用频率<0.09的密码子和按比例调整余下密码子使用频率之后的单子叶植物病毒密码子使用频率
氨基酸 | 密码子 | 单子叶植物病毒密码子频率 | 经>0.09阈值调整的密码子频率 |
Ala | GCA | 0.31 | 0.31 |
GCC | 0.21 | 0.21 | |
GCG | 0.14 | 0.14 | |
GCT | 0.34 | 0.34 | |
Arg | AGA | 0.32 | 0.35 |
AGG | 0.17 | 0.18 | |
CGA | 0.13 | 0.15 | |
CGC | 0.13 | 0.15 | |
CGG | 0.09 | 0.00 | |
CGT | 0.16 | 0.17 | |
Asn | AAC | 0.42 | 0.42 |
AAT | 0.58 | 0.58 | |
Asp | GAC | 0.38 | 0.38 |
GAT | 0.62 | 0.62 | |
Cys | TGC | 0.44 | 0.44 |
TGT | 0.56 | 0.56 | |
Gln | CAA | 0.58 | 0.58 |
CAG | 0.42 | 0.42 | |
Glu | GAA | 0.60 | 0.60 |
GAG | 0.40 | 0.40 | |
Gly | GGA | 0.37 | 0.37 |
GGC | 0.20 | 0.20 | |
GGG | 0.14 | 0.14 | |
GGT | 0.28 | 0.28 | |
His | CAC | 0.43 | 0.43 |
CAT | 0.57 | 0.57 | |
Ile | ATA | 0.30 | 0.30 |
ATC | 0.29 | 0.29 | |
ATT | 0.41 | 0.41 | |
Leu | CTA | 0.13 | 0.13 |
CTC | 0.14 | 0.14 | |
CTG | 0.13 | 0.13 | |
CTT | 0.18 | 0.18 | |
TTA | 0.21 | 0.21 | |
TTG | 0.21 | 0.21 | |
Lys | AAA | 0.53 | 0.53 |
AAG | 0.47 | 0.47 |
氨基酸 | 密码子 | 单子叶植物病毒密码子频率 | 经>0.09阈值调整的密码子频率 |
Met | ATG | 1.00 | 1.00 |
Phe | TTC | 0.46 | 0.46 |
TTT | 0.54 | 0.54 | |
Pro | CCA | 0.38 | 0.38 |
CCC | 0.17 | 0.17 | |
CCG | 0.14 | 0.14 | |
CCT | 0.31 | 0.31 | |
终止 | TAA | 0.34 | 0.34 |
TAG | 0.25 | 0.25 | |
TGA | 0.41 | 0.41 | |
Ser | AGC | 0.13 | 0.13 |
AGT | 0.18 | 0.18 | |
TCA | 0.24 | 0.24 | |
TCC | 0.14 | 0.14 | |
TCG | 0.10 | 0.10 | |
TCT | 0.21 | 0.21 | |
Thr | ACA | 0.30 | 0.30 |
ACC | 0.20 | 0.20 | |
ACG | 0.16 | 0.16 | |
ACT | 0.34 | 0.34 | |
Trp | TGG | 1.00 | 1.00 |
Tyr | TAC | 0.43 | 0.43 |
TAT | 0.57 | 0.57 | |
Val | GTA | 0.19 | 0.19 |
GTC | 0.21 | 0.21 | |
GTG | 0.25 | 0.25 | |
GTT | 0.36 | 0.36 |
表15:在去掉使用频率≤0.09的密码子和按比例调整余下密码子使用频率之后的玉米病毒外壳/衣壳多肽密码子使用频率
氨基酸 | 密码子 | 玉米病毒外壳密码子频率 | 经>0.09阈值调整的密码子频率 |
Ala | GCA | 0.38 | 0.38 |
GCC | 0.22 | 0.22 | |
GCG | 0.14 | 0.14 | |
GCT | 0.26 | 0.26 | |
Arg | AGA | 0.30 | 0.32 |
AGG | 0.18 | 0.19 | |
CGA | 0.18 | 0.19 | |
CGC | 0.16 | 0.18 | |
CGG | 0.11 | 0.12 | |
CGT | 0.07 | 0.00 | |
Asn | AAC | 0.53 | 0.53 |
氨基酸 | 密码子 | 玉米病毒外壳密码子频率 | 经>0.09阈值调整的密码子频率 |
AAT | 0.47 | 0.47 | |
Asp | GAC | 0.45 | 0.45 |
GAT | 0.55 | 0.55 | |
Cys | TGC | 0.53 | 0.53 |
TGT | 0.47 | 0.47 | |
Gln | CAA | 0.52 | 0.52 |
CAG | 0.48 | 0.48 | |
Glu | GAA | 0.44 | 0.44 |
GAG | 0.56 | 0.56 | |
Gly | GGA | 0.42 | 0.42 |
GGC | 0.18 | 0.18 | |
GGG | 0.23 | 0.23 | |
GGT | 0.18 | 0.18 | |
His | CAC | 0.35 | 0.35 |
CAT | 0.65 | 0.65 | |
Ile | ATA | 0.24 | 0.24 |
ATC | 0.36 | 0.36 | |
ATT | 0.40 | 0.40 | |
Leu | CTA | 0.12 | 0.12 |
CTC | 0.18 | 0.18 | |
CTG | 0.25 | 0.25 | |
CTT | 0.12 | 0.12 | |
TTA | 0.10 | 0.10 | |
TTG | 0.23 | 0.23 | |
Lys | AAA | 0.48 | 0.48 |
AAG | 0.52 | 0.52 | |
Met | ATG | 1.00 | 1.00 |
Phe | TTC | 0.57 | 0.57 |
TTT | 0.43 | 0.43 | |
Pro | CCA | 0.32 | 0.32 |
CCC | 0.24 | 0.24 | |
CCG | 0.12 | 0.12 | |
CCT | 0.32 | 0.32 | |
终止 | TAA | 0.50 | 0.50 |
TAG | 0.00 | 0.00 | |
TGA | 0.50 | 0.50 | |
Ser | AGC | 0.19 | 0.20 |
AGT | 0.13 | 0.14 | |
TCA | 0.21 | 0.22 | |
TCC | 0.26 | 0.28 | |
TCG | 0.06 | 0.00 | |
TCT | 0.15 | 0.16 | |
Thr | ACA | 0.36 | 0.39 |
ACC | 0.27 | 0.28 | |
ACG | 0.06 | 0.00 | |
ACT | 0.31 | 0.33 | |
Trp | TGG | 1.00 | 1.00 |
Tyr | TAC | 0.41 | 0.41 |
TAT | 0.59 | 0.59 |
氨基酸 | 密码子 | 玉米病毒外壳密码子频率 | 经>0.09阈值调整的密码子频率 |
Val | GTA | 0.15 | 0.15 |
GTC | 0.26 | 0.26 | |
GTG | 0.36 | 0.36 | |
GTT | 0.23 | 0.23 |
表16:在去掉使用频率≤0.09的密码子和按比例调整余下密码子使用频率之后的双子叶植物病毒密码子使用频率
氨基酸 | 密码子 | 双子叶植物病毒密码子频率 | 经>0.09阈值调整的密码子频率 |
Ala | GCA | 0.33 | 0.33 |
GCC | 0.21 | 0.21 | |
GCG | 0.13 | 0.13 | |
GCT | 0.33 | 0.33 | |
Arg | AGA | 0.34 | 0.41 |
AGG | 0.23 | 0.28 | |
CGA | 0.11 | 0.13 | |
CGC | 0.09 | 0.00 | |
CGG | 0.08 | 0.00 | |
CGT | 0.15 | 0.18 | |
Asn | AAC | 0.41 | 0.41 |
AAT | 0.59 | 0.59 | |
Asp | GAC | 0.37 | 0.37 |
GAT | 0.63 | 0.63 | |
Cys | TGC | 0.41 | 0.41 |
TGT | 0.59 | 0.59 | |
Gln | CAA | 0.61 | 0.61 |
CAG | 0.40 | 0.40 | |
Glu | GAA | 0.61 | 0.61 |
GAG | 0.39 | 0.39 | |
Gly | GGA | 0.35 | 0.35 |
GGC | 0.18 | 0.18 | |
GGG | 0.18 | 0.18 | |
GGT | 0.29 | 0.29 | |
His | CAC | 0.43 | 0.43 |
CAT | 0.57 | 0.57 | |
Ile | ATA | 0.31 | 0.31 |
ATC | 0.28 | 0.28 | |
ATT | 0.41 | 0.41 | |
Leu | CTA | 0.12 | 0.12 |
CTC | 0.14 | 0.14 | |
CTG | 0.12 | 0.12 | |
CTT | 0.19 | 0.19 | |
TTA | 0.22 | 0.22 | |
TTG | 0.21 | 0.21 |
氨基酸 | 密码子 | 双子叶植物病毒密码子频率 | 经>0.09阈值调整的密码子频率 |
Lys | AAA | 0.54 | 0.54 |
AAG | 0.46 | 0.46 | |
Met | ATG | 1 | 1 |
Phe | TTC | 0.44 | 0.44 |
TTT | 0.56 | 0.56 | |
Pro | CCA | 0.38 | 0.38 |
CCC | 0.18 | 0.18 | |
CCG | 0.12 | 0.12 | |
CCT | 0.31 | 0.31 | |
终止 | TAA | 0.46 | 0.46 |
TAG | 0.24 | 0.24 | |
TGA | 0.30 | 0.30 | |
Ser | AGC | 0.14 | 0.15 |
AGT | 0.20 | 0.22 | |
TCA | 0.23 | 0.25 | |
TCC | 0.14 | 0.15 | |
TCG | 0.08 | 0.00 | |
TCT | 0.21 | 0.23 | |
Thr | ACA | 0.36 | 0.36 |
ACC | 0.20 | 0.20 | |
ACG | 0.14 | 0.14 | |
ACT | 0.31 | 0.31 | |
Trp | TGG | 1 | 1 |
Tyr | TAC | 0.41 | 0.41 |
TAT | 0.59 | 0.59 | |
Val | GTA | 0.19 | 0.19 |
GTC | 0.21 | 0.21 | |
GTG | 0.25 | 0.25 | |
GTT | 0.35 | 0.35 |
表17:在去掉使用频率≤0.09的密码子和按比例调整余下密码子使用频率之后的双子叶植物病毒衣壳/外壳密码子使用频率
氨基酸 | 密码子 | 双子叶植物病毒外壳密码子频率 | 经>0.09阈值调整的密码子频率 |
Ala | GCA | 0.24 | 0.24 |
GCC | 0.27 | 0.27 | |
GCG | 0.15 | 0.15 | |
GCT | 0.34 | 0.34 | |
Arg | AGA | 0.24 | 0.24 |
AGG | 0.22 | 0.22 | |
CGA | 0.12 | 0.12 | |
CGC | 0.10 | 0.10 | |
CGG | 0.11 | 0.11 | |
CGT | 0.21 | 0.21 | |
Asn | AAC | 0.44 | 0.44 |
氨基酸 | 密码子 | 双子叶植物病毒外壳密码子频率 | 经>0.09阈值调整的密码子频率 |
AAT | 0.56 | 0.56 | |
Asp | GAC | 0.32 | 0.32 |
GAT | 0.68 | 0.68 | |
Cys | TGC | 0.25 | 0.25 |
TGT | 0.75 | 0.75 | |
Gln | CAA | 0.59 | 0.59 |
CAG | 0.41 | 0.41 | |
Glu | GAA | 0.61 | 0.61 |
GAG | 0.39 | 0.39 | |
Gly | GGA | 0.32 | 0.32 |
GGC | 0.2 | 0.2 | |
GGG | 0.18 | 0.18 | |
GGT | 0.3 | 0.3 | |
His | CAC | 0.35 | 0.35 |
CAT | 0.65 | 0.65 | |
Ile | ATA | 0.39 | 0.39 |
ATC | 0.26 | 0.26 | |
ATT | 0.35 | 0.35 | |
Leu | CTA | 0.10 | 0.10 |
CTC | 0.13 | 0.13 | |
CTG | 0.12 | 0.12 | |
CTT | 0.14 | 0.14 | |
TTA | 0.28 | 0.28 | |
TTG | 0.23 | 0.23 | |
Lys | AAA | 0.24 | 0.24 |
AAG | 0.27 | 0.27 | |
Met | ATG | 0.15 | 0.15 |
Phe | TTC | 0.34 | 0.34 |
TTT | 0.24 | 0.24 | |
Pro | CCA | 0.22 | 0.22 |
CCC | 0.12 | 0.12 | |
CCG | 0.10 | 0.10 | |
CCT | 0.11 | 0.11 | |
终止 | TAA | 0.21 | 0.21 |
TAG | 0.44 | 0.44 | |
TGA | 0.56 | 0.56 | |
Ser | AGC | 0.14 | 0.15 |
AGT | 0.20 | 0.22 | |
TCA | 0.23 | 0.25 | |
TCC | 0.14 | 0.15 | |
TCG | 0.08 | 0.00 | |
TCT | 0.21 | 0.23 | |
Thr | ACA | 0.36 | 0.36 |
ACC | 0.20 | 0.20 | |
ACG | 0.14 | 0.14 | |
ACT | 0.31 | 0.31 | |
Trp | TGG | 1 | 1 |
Tyr | TAC | 0.41 | 0.41 |
TAT | 0.59 | 0.59 |
氨基酸 | 密码子 | 双子叶植物病毒外壳密码子频率 | 经>0.09阈值调整的密码子频率 |
Val | GTA | 0.19 | 0.19 |
GTC | 0.21 | 0.21 | |
GTG | 0.25 | 0.25 | |
GTT | 0.35 | 0.35 |
中值阈值截止标准
[0047]在另一实施方式中,在所述用于创建所述密码子使用频率表的一种或多种植物病毒,或源自其的一组核酸分子中的使用频率小于密码子使用频率中值的植物病毒密码子被去掉不可作为更改密码子(使用频率中值的计算参见节5.2.2)。对于特定氨基酸使用频率等于或者大于所述中值的任何对相同氨基酸进行编码的密码子可用作更改密码子以取代所述密码子。在具体实施方式中,余下的使用频率等于或者大于所述中值的密码子以保持余下的密码子之间的比例性的方式进行替代。
[0048]表18显示单子叶植物病毒的密码子使用频率,其中对于每种氨基酸类型,频率在中值以下(根据表2)的密码子已被去掉,而余下的密码子已成比例地进行调整。
[0049]表19显示玉米特异性病毒的密码子使用频率,其中对于每种氨基酸类型,频率在中值以下(根据表3)的密码子已被去掉,而余下的密码子已成比例地进行调整。
[0050]表20显示玉米特异性病毒外壳/衣壳多肽的密码子使用频率,其中对于每种氨基酸类型,频率在中值以下(根据表4)的密码子已被去掉,而余下的密码子已成比例地进行调整。
[0051]表20显示双子叶植物病毒的密码子使用频率,其中对于每种氨基酸类型,频率在中值以下(根据表6)的密码子已被去掉,而余下的密码子已成比例地进行调整。
[0052]表22显示双子叶植物病毒外壳/衣壳多肽的密码子使用频率,其中对于每种氨基酸类型,频率在中值以下(根据表8)的密码子已被去掉,而余下的密码子已成比例地进行调整。
表18:在去掉使用频率小于中值的密码子和按比例调整余下密码子使用频率之后的单子叶植物病毒密码子使用频率
氨基酸 | 密码子 | 单子叶植物病毒密码子频率 | 单子叶植物病毒中值密码子频率 | 中值标准密码子频率 |
Ala | GCA | 0.31 | 0.26 | 0.48 |
GCC | 0.21 | 0.00 | ||
GCG | 0.14 | 0.00 | ||
GCT | 0.34 | 0.52 | ||
Arg | AGA | 0.32 | 0.15 | 0.50 |
AGG | 0.17 | 0.27 | ||
CGA | 0.14 | 0.00 | ||
CGC | 0.14 | 0.00 | ||
CGG | 0.09 | 0.00 | ||
CGT | 0.16 | 0.23 | ||
Asn | AAC | 0.42 | 0.50 | 0.00 |
AAT | 0.58 | 1.00 | ||
Asp | GAC | 0.38 | 0.50 | 0.00 |
GAT | 0.62 | 1.00 | ||
Cys | TGC | 0.44 | 0.50 | 0.00 |
TGT | 0.56 | 1.00 | ||
Gln | CAA | 0.58 | 0.50 | 1.00 |
CAG | 0.42 | 0.00 | ||
Glu | GAA | 0.60 | 0.50 | 1.00 |
GAG | 0.40 | 0.00 | ||
Gly | GGA | 0.37 | 0.24 | 0.57 |
GGC | 0.20 | 0.00 | ||
GGG | 0.14 | 0.00 | ||
GGT | 0.28 | 0.43 | ||
His | CAC | 0.43 | 0.50 | 0.00 |
CAT | 0.57 | 1.00 | ||
Ile | ATA | 0.30 | 0.30 | 0.47 |
ATC | 0.29 | 0.00 | ||
ATT | 0.41 | 0.53 | ||
Leu | CTA | 0.13 | 0.16 | 0.00 |
CTC | 0.14 | 0.00 | ||
CTG | 0.13 | 0.00 | ||
CTT | 0.18 | 0.30 | ||
TTA | 0.21 | 0.35 | ||
TTG | 0.21 | 0.35 | ||
Lys | AAA | 0.53 | 0.50 | 1.00 |
氨基酸 | 密码子 | 单子叶植物病毒密码子频率 | 单子叶植物病毒中值密码子频率 | 中值标准密码子频率 |
AAG | 0.47 | 0.00 | ||
Met | ATG | 1.00 | 1.00 | 1.00 |
Phe | TTC | 0.46 | 0.50 | 0.00 |
TTT | 0.54 | 1.00 | ||
Pro | CCA | 0.38 | 0.24 | 0.55 |
CCC | 0.17 | 0.00 | ||
CCG | 0.14 | 0.00 | ||
CCT | 0.31 | 0.45 | ||
终止 | TAA | 0.34 | 0.34 | 0.45 |
TAG | 0.25 | 0.00 | ||
TGA | 0.41 | 0.55 | ||
Ser | AGC | 0.13 | 0.16 | 0.00 |
AGT | 0.18 | 0.28 | ||
TCA | 0.24 | 0.38 | ||
TCC | 0.14 | 0.00 | ||
TCG | 0.10 | 0.00 | ||
TCT | 0.21 | 0.34 | ||
Thr | ACA | 0.30 | 0.25 | 0.47 |
ACC | 0.20 | 0.00 | ||
ACG | 0.16 | 0.00 | ||
ACT | 0.34 | 0.53 | ||
Trp | TGG | 1.00 | 1.00 | 1.00 |
Tyr | TAC | 0.43 | 0.50 | 0.00 |
TAT | 0.57 | 1.00 | ||
Val | GTA | 0.19 | 0.23 | 0.00 |
GTC | 0.21 | 0.00 | ||
GTG | 0.25 | 0.47 | ||
GTT | 0.36 | 0.53 |
表19:在去掉使用频率小于中值的密码子和按比例调整余下密码子使用频率之后的玉米病毒密码子使用频率
氨基酸 | 密码子 | 玉米病毒密码子频率 | 玉米病毒中值密码子频率 | 中值标准密码子频率 |
Ala | GCA | 0.31 | 0.29 | 0.51 |
GCC | 0.3 | 0.49 | ||
GCG | 0.11 | 0.00 | ||
GCT | 0.28 | 0.00 | ||
Arg | AGA | 0.27 | 0.15 | 0.43 |
AGG | 0.17 | 0.27 | ||
CGA | 0.12 | 0.00 | ||
CGC | 0.19 | 0.3 | ||
CGG | 0.12 | 0.00 | ||
CGT | 0.13 | 0.00 | ||
Asn | AAC | 0.44 | 0.5 | 0.00 |
AAT | 0.56 | 1.00 |
氨基酸 | 密码子 | 玉米病毒密码子频率 | 玉米病毒中值密码子频率 | 中值标准密码子频率 |
Asp | GAC | 0.41 | 0.5 | 0.00 |
GAT | 0.59 | 1 | ||
Cys | TGC | 0.42 | 0.5 | 0.00 |
TGT | 0.58 | 1.00 | ||
Gln | CAA | 0.50 | 0.5 | 0.50 |
CAG | 0.50 | 0.50 | ||
Glu | GAA | 0.52 | 0.5 | 1.0 |
GAG | 0.48 | 0.00 | ||
Gly | GGA | 0.36 | 0.235 | 0.60 |
GGC | 0.23 | 0.00 | ||
GGG | 0.17 | 0.00 | ||
GGT | 0.24 | 0.40 | ||
His | CAC | 0.45 | 0.5 | 0.00 |
CAT | 0.55 | 1.0 | ||
Ile | ATA | 0.27 | 0.3 | 0.00 |
ATC | 0.3 | 0.41 | ||
ATT | 0.43 | 0.59 | ||
Leu | CTA | 0.12 | 0.17 | 0.00 |
CTC | 0.22 | 0.37 | ||
CTG | 0.16 | 0.00 | ||
CTT | 0.19 | 0.33 | ||
TTA | 0.14 | |||
TTG | 0.18 | 0.30 | ||
Lys | AAA | 0.49 | 0.5 | 0.00 |
AAG | 0.51 | 1 | ||
Met | ATG | 1 | 1 | 1 |
Phe | TTC | 0.56 | 0.5 | 1 |
TTT | 0.44 | 0.00 | ||
Pro | CCA | 0.31 | 0.255 | 0.49 |
CCC | 0.2 | 0.00 | ||
CCG | 0.17 | 0.00 | ||
CCT | 0.32 | 0.51 | ||
终止 | TAA | 0.33 | 0.33 | 0.43 |
TAG | 0.42 | 0.57 | ||
TGA | 0.24 | 0.00 | ||
Ser | AGC | 0.12 | 0.165 | 0.00 |
AGT | 0.12 | 0.00 | ||
TCA | 0.22 | 0.34 | ||
TCC | 0.21 | 0.32 | ||
TCG | 0.10 | 0.00 | ||
TCT | 0.22 | 0.34 | ||
Thr | ACA | 0.32 | 0.275 | 0.52 |
ACC | 0.26 | 0.00 | ||
ACG | 0.13 | 0.00 | ||
ACT | 0.29 | 0.48 | ||
Trp | TGG | 1.00 | 1.00 | 1.00 |
Tyr | TAC | 0.46 | 0.50 | 0.00 |
TAT | 0.54 | 1.00 | ||
Val | GTA | 0.16 | 0.255 | 0.00 |
氨基酸 | 密码子 | 玉米病毒密码子频率 | 玉米病毒中值密码子频率 | 中值标准密码子频率 |
GTC | 0.25 | 0.00 | ||
GTG | 0.26 | 0.44 | ||
GTT | 0.33 | 0.56 |
表20:在去掉使用频率小于中值的密码子和按比例调整余下密码子使用频率之后的玉米病毒衣壳/外壳密码子使用频率
氨基酸 | 密码子 | 玉米病毒外壳密码子频率 | 玉米病毒中值外壳密码子频率 | 中值标准密码子频率 |
Ala | GCA | 0.38 | 0.24 | 0.60 |
GCC | 0.22 | 0.00 | ||
GCG | 0.14 | 0.00 | ||
GCT | 0.26 | 0.40 | ||
Arg | AGA | 0.30 | 0.18 | 0.46 |
AGG | 0.18 | 0.27 | ||
CGA | 0.18 | 0.27 | ||
CGC | 0.16 | 0.00 | ||
CGG | 0.11 | 0.00 | ||
CGT | 0.07 | 0.00 | ||
Asn | AAC | 0.53 | 0.50 | 1.00 |
AAT | 0.47 | 0.00 | ||
Asp | GAC | 0.45 | 0.50 | 0.00 |
GAT | 0.55 | 1.00 | ||
Cys | TGC | 0.53 | 0.50 | 1.00 |
TGT | 0.47 | 0.00 | ||
Gln | CAA | 0.52 | 0.50 | 1.00 |
CAG | 0.48 | 0.00 | ||
Glu | GAA | 0.44 | 0.50 | 0.00 |
GAG | 0.56 | 1.00 | ||
Gly | GGA | 0.42 | 0.23 | 0.65 |
GGC | 0.18 | 0.00 | ||
GGG | 0.23 | 0.35 | ||
GGT | 0.18 | 0.00 | ||
His | CAC | 0.35 | 0.50 | 0.00 |
CAT | 0.65 | 1.00 | ||
Ile | ATA | 0.24 | 0.36 | 0.00 |
ATC | 0.36 | 0.47 | ||
ATT | 0.40 | 0.53 | ||
Leu | CTA | 0.12 | 0.15 | 0.00 |
CTC | 0.18 | 0.27 | ||
CTG | 0.25 | 0.38 | ||
CTT | 0.12 | 0.00 | ||
TTA | 0.10 | 0.00 | ||
TTG | 0.23 | 0.35 | ||
Lys | AAA | 0.48 | 0.50 | 0.00 |
AAG | 0.52 | 1.00 |
氨基酸 | 密码子 | 玉米病毒外壳密码子频率 | 玉米病毒中值外壳密码子频率 | 中值标准密码子频率 |
Met | ATG | 1.00 | 1.00 | 1.00 |
Phe | TTC | 0.57 | 0.50 | 1.00 |
TTT | 0.43 | |||
Pro | CCA | 0.32 | 0.28 | 0.50 |
CCC | 0.24 | 0.00 | ||
CCG | 0.12 | 0.00 | ||
CCT | 0.32 | 0.50 | ||
终止 | TAA | 0.50 | 0.50 | 0.50 |
TAG | 0.00 | 0.00 | ||
TGA | 0.50 | 0.50 | ||
Ser | AGC | 0.19 | 0.17 | 0.28 |
AGT | 0.13 | 0.00 | ||
TCA | 0.21 | 0.32 | ||
TCC | 0.26 | 0.40 | ||
TCG | 0.06 | 0.00 | ||
TCT | 0.15 | 0.00 | ||
Thr | ACA | 0.36 | 0.29 | 0.54 |
ACC | 0.27 | 0.00 | ||
ACG | 0.06 | 0.00 | ||
ACT | 0.31 | 0.46 | ||
Trp | TGG | 1.00 | 1.00 | 1.00 |
Tyr | TAC | 0.41 | 0.50 | 0.00 |
TAT | 0.59 | 1.00 | ||
Val | GTA | 0.15 | 0.25 | 0.00 |
GTC | 0.26 | 0.31 | ||
GTG | 0.36 | 0.42 | ||
GTT | 0.23 | 0.27 |
表21:在去掉使用频率小于中值的密码子和按比例调整余下密码子使用频率之后的双子叶植物病毒密码子使用频率
氨基酸 | 密码子 | 双子叶植物病毒密码子频率 | 双子叶植物病毒中值密码子频率 | 中值标准密码子频率 |
Ala | GCA | 0.33 | 0.27 | 0.50 |
GCC | 0.21 | 0.00 | ||
GCG | 0.13 | 0.00 | ||
GCT | 0.33 | 0.50 | ||
Arg | AGA | 0.34 | 0.13 | 0.47 |
AGG | 0.23 | 0.32 | ||
CGA | 0.11 | 0.00 | ||
CGC | 0.09 | 0.00 | ||
CGG | 0.08 | 0.00 | ||
CGT | 0.15 | 0.21 | ||
Asn | AAC | 0.41 | 0.5 | 0.00 |
AAT | 0.59 | 1 | ||
Asp | GAC | 0.37 | 0.5 | 0.00 |
GAT | 0.63 | 1 | ||
Cys | TGC | 0.41 | 0.5 | 0.00 |
TGT | 0.59 | 059 | ||
Gln | CAA | 0.61 | 0.5 | 1 |
CAG | 0.40 | 0.00 | ||
Glu | GAA | 0.61 | 0.5 | 1 |
GAG | 0.39 | 0.00 | ||
Gly | GGA | 0.35 | 0.24 | 0.55 |
GGC | 0.18 | 0.00 | ||
GGG | 0.18 | 0.00 | ||
GGT | 0.29 | 0.45 | ||
His | CAC | 0.43 | 0.00 | |
CAT | 0.57 | 1 | ||
Ile | ATA | 0.31 | 0.31 | 0.43 |
ATC | 0.28 | 0.00 | ||
ATT | 0.41 | 0.57 | ||
Leu | CTA | 0.12 | 0.16 | 0.00 |
CTC | 0.14 | 0.00 | ||
CTG | 0.12 | 0.00 | ||
CTT | 0.19 | 0.3 | ||
TTA | 0.22 | 0.36 | ||
TTG | 0.21 | 0.34 | ||
Lys | AAA | 0.54 | 0.50 | 1 |
AAG | 0.46 | 0.00 | ||
Met | ATG | 1.00 | 1.00 | 1.00 |
Phe | TTC | 0.44 | 0.50 | 0.00 |
TTT | 0.56 | 1 | ||
Pro | CCA | 0.38 | 0.25 | 0.54 |
CCC | 0.18 | 0.00 | ||
CCG | 0.12 | 0.00 | ||
CCT | 0.31 | 0.46 | ||
终止 | TAA | 0.46 | 0.30 | 0.60 |
氨基酸 | 密码子 | 双子叶植物病毒密码子频率 | 双子叶植物病毒中值密码子频率 | 中值标准密码子频率 |
TAG | 0.24 | 0.00 | ||
TGA | 0.30 | 0.40 | ||
Ser | AGC | 0.14 | 0.17 | 0.00 |
AGT | 0.20 | 0.32 | ||
TCA | 0.23 | 0.33 | ||
TCC | 0.14 | 0.00 | ||
TCG | 0.08 | 0.00 | ||
TCT | 0.21 | 0.35 | ||
Thr | ACA | 0.36 | 0.25 | 0.54 |
ACC | 0.20 | |||
ACG | 0.14 | |||
ACT | 0.31 | 0.46 | ||
Trp | TGG | 1 | 1 | 1 |
Tyr | TAC | 0.41 | 0.5 | 0.00 |
TAT | 0.59 | 1 | ||
Val | GTA | 0.19 | 0.23 | 0.00 |
GTC | 0.21 | 0.00 | ||
GTG | 0.25 | 0.42 | ||
GTT | 0.35 | 0.58 |
表22:在去掉使用频率小于中值的密码子和按比例调整余下密码子使用频率之后的双子叶植物病毒衣壳/外壳密码子使用频率
氨基酸 | 密码子 | 双子叶植物病毒外壳密码子频率 | 双子叶植物病毒外壳中值密码子频率 | 中值标准密码子频率 |
Ala | GCA | 0.24 | 0.255 | 0.00 |
GCC | 0.27 | 0.44 | ||
GCG | 0.15 | 0.00 | ||
GCT | 0.34 | 0.56 | ||
Arg | AGA | 0.24 | 0.165 | 0.36 |
AGG | 0.22 | 0.33 | ||
CGA | 0.12 | 0.00 | ||
CGC | 0.10 | 0.00 | ||
CGG | 0.11 | 0.00 | ||
CGT | 0.21 | 0.31 | ||
Asn | AAC | 0.44 | 0.50 | 0.00 |
AAT | 0.56 | 1.00 | ||
Asp | GAC | 0.32 | 0.50 | 0.00 |
GAT | 0.68 | 1.00 | ||
Cys | TGC | 0.25 | 0.50 | 0.00 |
TGT | 0.75 | 1.00 | ||
Gln | CAA | 0.59 | 0.50 | 1 |
CAG | 0.41 | 0.00 | ||
Glu | GAA | 0.61 | 0.50 | 1 |
GAG | 0.39 | 0.00 |
氨基酸 | 密码子 | 双子叶植物病毒外壳密码子频率 | 双子叶植物病毒外壳中值密码子频率 | 中值标准密码子频率 |
Gly | GGA | 0.32 | 0.25 | 0.52 |
GGC | 0.2 | 0.00 | ||
GGG | 0.18 | 0.00 | ||
GGT | 0.3 | 0.48 | ||
His | CAC | 0.35 | 0.50 | 0.00 |
CAT | 0.65 | 1.00 | ||
Ile | ATA | 0.39 | 0.35 | 0.53 |
ATC | 0.26 | 0.00 | ||
ATT | 0.35 | 0.47 | ||
Leu | CTA | 0.10 | 0.135 | 0.00 |
CTC | 0.13 | 0.00 | ||
CTG | 0.12 | 0.00 | ||
CTT | 0.14 | 0.22 | ||
TTA | 0.28 | 0.43 | ||
TTG | 0.23 | 0.35 | ||
Lys | AAA | 0.45 | 0.50 | 0.00 |
AAG | 0.55 | 1.00 | ||
Met | ATG | 1.00 | 1 | 1.00 |
Phe | TTC | 0.47 | 0.50 | 0.00 |
TTT | 0.53 | 1.00 | ||
Pro | CCA | 0.27 | 0.27 | 0.31 |
CCC | 0.27 | 0.31 | ||
CCG | 0.14 | 0.00 | ||
CCT | 0.33 | 0.38 | ||
终止 | TAA | 0.62 | 0.24 | 0.72 |
TAG | 0.14 | 0.00 | ||
TGA | 0.24 | 0.28 | ||
Ser | AGC | 0.15 | 0.165 | 0.00 |
AGT | 0.19 | 0.32 | ||
TCA | 0.18 | 0.29 | ||
TCC | 0.14 | 0.00 | ||
TCG | 0.11 | 0.00 | ||
TCT | 0.24 | 0.39 | ||
Thr | ACA | 0.25 | 0.25 | 0.29 |
ACC | 0.25 | 0.29 | ||
ACG | 0.16 | 0.00 | ||
ACT | 0.34 | 0.42 | ||
Trp | TGG | 1.00 | 1 | 1.00 |
Tyr | TAC | 0.37 | 0.5 | 0.00 |
TAT | 0.63 | 1.00 | ||
Val | GTA | 0.17 | 0.24 | 0.00 |
GTC | 0.23 | 0.00 | ||
GTG | 0.25 | 0.42 | ||
GTT | 0.35 | 0.58 |
基于非植物病毒密码子偏好的修饰
[0053]在根据本发明设计植物病毒密码子偏好的核酸分子编码序列中,在根据上述标准选择密码子之后,可进行其他核苷酸序列修饰以i)减少所述核酸分子所具有的不利的特性和/或ii)进一步提高由植物病毒密码子偏好的核酸分子编码序列编码的多肽的表达。因此,虽然由于以下考虑采用本发明的方法所设计的核酸分子并不包括所有经优化的密码子,但其仍富含与在未更改的核酸分子中相比在植物病毒中使用更加频繁的密码子。
[0054]优选为,所述基于非密码子偏好的修饰不改变任何由所述核酸分子编码的氨基酸。在由于所述核酸分子中基于非密码子偏好的修饰而改变氨基酸的实施方式中,这样的更改应优选至少保留原始氨基酸的一些性质(例如电荷、尺寸等)。
[0055]在一个实施方式中,Kozak context发生变化。所述Kozakcontext是在起始密码子ATG附近的核苷酸序列。在玉米和许多谷物中,优选的Kozak context是ATGG。所述核酸分子编码序列的第四个碱基是由所编码的第二个氨基酸所指示。如果已经存在,则无需变化。然而如果不存在,为新建ATGG Kozak context(Kozak优化)则要求改变第二氨基酸。在多肽中,这发生在N端,例如将其N-端的转运肽移除,这将不影响成熟多肽的功能。将所述第二个氨基酸更改为密码子由G开头并且在这些密码子由G开头的氨基酸中与之化学上最相似的氨基酸则是优选的方案,然而,在其中第二个氨基酸被更改的实施例中,重要的是确保所述多肽保留关键性质(例如酶活性、抗原性等)。
[0056]在另一实施方式中,由加入更改密码子产生的类似内含子的序列被废弃。在选择用于植物病毒密码子偏好核酸分子编码序列的密码子时,可能不利地引入一个或多个潜在的功能性内含子序列。所编码的转录产物在细胞中表达时,这些内含子可能被排除在外,导致一部分编码区域的内部缺失或者阅读框架的移动。结果,所希望的是去掉任何高度类似于内含子的位点。内含子移接供体位点通常遵从GT-AG规则。在指定的核酸分子编码序列,可存在很多GT和AG位点,因此有许多潜在的内含子。然而,不是所有这些GT-AG组合都表现为功能性的内含子。
[0057]已开发出采用精密复杂的试探法的基因预测软件以判定是否有任何潜在的GT-AG组合代表着可能的内含子移接供体位点。例如参见Brendel et al.(2004)Bioinformatics.20(7):1157-69;Hermann et al.(1996)Nucl.Acids Res.24(23):4709-4718;Brendel et al.(1998)Nucl.Acids Res.26(20):4748-4757;Usuka et al.(2000)Bioinformatics 16(3),203-211;Usuka et al.(2000)J.Mol.Biol.297(5):1075-1085,以引用的方式在此处引入。程序例如GeneSeqr特别有用。GeneSeqr由ISU的VolkerBrendel开发。所述GeneSeqr程序的输出指出在所述核酸分子编码序列中是否有任何高度可能的内含子位点。有关所述GeneSeqr程序的信息及其输出的解释可在本领域内找到(例如Schlueter et al.,2003,Nucl.Acids Res.31:3597-3600)。另一个可用于该目的的程序是FgenesH。通过使用一个以上的程序可更大可能地除掉所有隐蔽的移接位点。可通过改变内含子边界的GT或AG序列从而去掉这些潜在的内含子。如果可能,这可在不影响氨基酸使用的情况下完成。另一个影响移除这些隐蔽移接位点的方法是改变在所推定的隐蔽移接位点边界的推定内含子一侧的边界核苷酸。
[0058]在另一实施方式中,对推定的聚腺苷酸化信号进行编码的序列被改变以防止在所述核酸分子编码序列内的假聚腺苷酸化。这样的位点包括以下序列:AATAAA、ATAAAA和AATAAT。
[0059]在另一实施方式中,二级RNA结构被减少或者消除。形成发卡RNA结构的转录物更可能成为降解和/或translational arrest的目标。因此,希望将所述核酸分子编码序列经二级RNA结构预测程序处理并通过改变所述序列破坏任何经预测非常稳定的RNA结构。可以使用任何在本领域内已知的RNA二级结构预测程序。通常使用的一个程序是GCG威斯康星打包程序(GCG Wisconsin packageprogram)STEMLOOP。该程序是理想的,因为它将stem-loop结构按照形成二级结构可能性从高到低进行排列(基本按照长度和性质),并且给出其在序列中的坐标。在输出结果中,可找出任何完美预测的具有非同寻常的长度和高质量的RNA结构。这些RNA结构通过通常在密码子的第三个位置(“wobble”位置)进行的碱基变化被破坏,但不改变氨基酸序列。
[0060]在另一实施方式中,降低RNA稳定性的序列被改变。已知某些基序使mRNA不稳定,因此将被挑出并尽可能地去掉。在具体实施方式中,″AUUUA″序列导致mRNA降解速率提高。同样,将检查本发明的植物病毒密码子偏好核酸分子编码序列寻找任何的″ATTTA″序列,并尽可能地对其进行更改而不改变氨基酸序列。
[0061]在另一具体实施方式中,“下游元素”(DST)mRNA不稳定化位点的存在可使mRNA转录物倾向于降解或高turn over。所述DST元素跟随常见序列式样ATAGAT-N(15)-GTA。序列式样ATAGAT-N(10-20)-GTA后跟随的序列可被去掉。
[0062]在另一具体实施方式中,长的聚-A或聚-T序列可使mRNA不稳定。因此,一个核苷酸的长序列,尤其是A或T的长序列将被改变。同一核苷酸的三个或三个以上的延伸序列被找出并缓解该情况,然而,更优选的是改变四个或四个以上的延伸序列。此外,富含AT序列的延伸序列也可被改变。
[0063]在另一实施方式中,所述核酸分子经修饰使得感兴趣的多肽是由所述核苷酸分子表达的唯一多肽。希望的是转基因仅仅从开放解读码组(ORF)中表达所希望的基因产品,这将是组1翻译。由任一其他5组翻译得到的假多肽产品是不希望的,因此本发明的核酸分子将被改变使得假ORF翻译的可能性降低。利用本发明的方法设计的核酸分子经6-组ORF预测分析。在不用于编码多肽的五组中的ORF的长度得以测量。这些ORF,尤其是具有潜在的甲硫氨酸起始密码子(即与Kozak适合序列相近)的ORF,以及在组2和3中特别长(例如超过50~100个密码子或者任何希望的截止阈值)的ORF将通过引入终止密码子或者去掉潜在的起始密码子被缩短。
[0064]在另一实施方式中,限制性酶识别位点可被加入到所述核酸分子中。
密码子偏好核酸分子的设计
[0065]本发明包括根据本发明的方法设计的核酸分子。对在植物中进行表达的感兴趣的多肽进行编码的核酸分子可根据本发明的方法进行设计以提高表达。一旦对于感兴趣的特定病毒、病毒组或源自其的一组核酸分子建立起密码子使用频率表,原先在所述核酸分子中存在的密码子可对比植物病毒对其频率进行评估。节5.2的标准可用以选择哪一个密码子能被改变,哪一个密码子可用于对其进行取代(例如更改密码子)。相对于未更改的(原始)核酸分子,含有更改密码子的核酸分子包括5%、10%、20%、30%、50%、75%、85%、95%的更改密码子。然而,密码子使用频率并非进行核酸分子修改的唯一标准(见节5.3)。
[0066]所述核酸分子中的任何密码子都可被在植物病毒中具有更高使用频率的更改密码子进行替换。在一些实施方式中,所述更改密码子是“前置”的,即在所述核酸分子的第一部份中的更改密码子的数目比第二部份多,其中所述第一部份在所述第二部分的5’一侧。在更具体的实施方式中,所述核酸分子的第一部分和第二部分是相等的,因此在所述核酸分子的5’侧的一半有更多的更改密码子。在另一具体实施方式中,所述第一部分为所述核酸分子的三分之一,而含有与占所述核酸分子三分之二的第二部分相等或者更多的更改密码子。因此,所述核酸分子的5’端的三分之一部分含有与3’端的三分之二部分相等或者更多的更改密码子。在另一具体实施方式中,所述第一部分为所述核酸分子的四分之一,并含有与占核酸分子四分之三的第二部分相等或者更多的更改密码子。因此,所述核酸分子的5’端的四分之一部分含有与3’端的四分之三部分相等或者更多的更改密码子。
[0067]优选为,含有更改密码子的核酸分子对多肽进行编码,所述多肽具有的序列与未更改的核酸分子所编码的多肽的序列相同。在所述含有更改密码子的核酸对与未更改的多肽的序列不相同的多肽进行编码的实施方式中,被更改的氨基酸优选为保守取代。本领域技术人员已知的标准技术可用于分析在由于密码子改变而含有氨基酸替代物的多肽和由为改变的核酸分子编码的多肽之间在多肽功能上的任何差异。优选为,多肽功能没有任何变化。然而,如果这些多肽具有基本相似的功能,则轻微的功能变化也是可以忍受的(例如在相互的一个标准偏差之内)。
[0068]在具体实施方式中,本发明的核酸分子编码杀虫性多肽。在更具体的实施方式中,所述杀虫性多肽来自于于苏云金杆菌(Bacillusthuringiensis)或米根霉。在更具体的实施方式中,来自苏云金杆菌的杀虫性多肽是437N和Cry多肽。在另一更具体的实施方式中,来自米根霉的杀虫性多肽是杀虫性脂肪酶多肽。本发明包括根据本发明的方法设计的核酸分子,其中包括但不限制于分别对密码子优化的437N和杀虫性脂肪酶进行编码的SEQ ID NO:1和3。由本发明的核酸分子编码的多肽也包括在本发明中,其中包括但不限制于分别对密码子优化的437N和杀虫性脂肪酶进行编码的SEQ ID NO:2和4。
[0069]本发明还包括的是含有根据本发明的方法制得的核酸分子的载体、宿主细胞、转基因植物及其后代。
[0070]本发明不包括对天然形成的核酸分子(例如天然发现的或者由非转基因生物体的基因组表达的)进行编码的核酸分子。本发明也不包括SEQ ID NO:7~16的核酸分子。
密码子偏好核酸分子的构建
[0071]由本领域中任何已知的方法可以得到根据本发明的方法改变的核酸分子,并确定其核苷酸序列。如此的核酸可由化学合成的寡聚核苷酸组装而成(例如在Kutmeier et al,1994,BioTechniques 17:242中所述),简言之,其涉及的合成包括将含有对所述多肽进行编码的序列的一部分的寡聚核苷酸搭接,并将这些寡聚核苷酸退火和连接,然后通过PCR将这些连接的寡聚核苷酸扩增。作为另外一种选择,也有由来自于适宜来源的核酸分子生成核酸分子。如果不能提供含有对特定多肽进行编码的核酸分子的克隆,但所述多肽的序列是已知的,对所述多肽进行编码的核酸分子可化学合成或者从合适的来源获得(例如由表达所述感兴趣的多肽的组织或细胞生成的cDNA库,或者从中分离的核酸分子,优选为poly-A+RNA),这是通过使用能与所述序列的3’和5’端进行杂交的引物所进行的PCR增殖,或者通过克隆,所述克隆使用对特定序列具有特异性的寡聚核苷酸探针以例如从对所述感兴趣的多肽进行编码的cDNA中鉴别出cDNA克隆。随后可以使用本领域内任何已知的方法将PCR产生的增殖核酸分子克隆进入可复制的克隆载体。
[0072]一旦获得核酸分子,可采用本领域内已知的核苷酸序列操作对其进行操作处理,例如重组DNA技术、定点突变、PCR等(例如参见在Sambrook et al,1990,Molecular Cloning,A Laboratory Manual,2d Ed.,Cold Spring Harbor Laboratory,Cold Spring Harbor,NY;Ausubel et ah,eds.,1998,Current Protocols in Molecular Biology,John Wiley&Sons,NY;美国专利第5,789,166号和第6,391,548号中描述的技术)以生成含有更改密码子的核酸分子。本领域技术人员已知的标准技术可用于在核苷酸序列或其片段中引入突变,例如定点突变和PCR调节的突变,从而将密码子更改为在植物病毒中使用频率更高的那些密码子。优选为,相对于未更改(原始)的核酸分子,所述含有更改密码子的核酸分子包括5%、10%、20%、30%、50%、75%、85%、95%的更改密码子。优选为,含有更改密码子的核酸分子对多肽进行编码,所述多肽具有的序列与未更改的核酸分子所编码的多肽的序列相同。在所述含有更改密码子的核酸对与未更改的多肽的序列不相同的多肽进行编码的实施方式中,被更改的氨基酸优选为保守取代。本领域技术人员已知的标准技术可用于分析在由于密码子改变而含有氨基酸替代物的多肽和由为改变的核酸分子编码的多肽之间在多肽功能上的任何差异。优选为,多肽功能没有任何变化。然而,如果这些多肽具有基本相似的功能,则轻微的功能变化也是可以忍受的(例如在相互的一个标准偏差之内)。
[0073]一旦设计并得到核酸分子,含有所述核酸分子的载体可通过采用本领域内已知技术的重组DNA技术进行制造。本领域内技术人员已知的方法可用于构建载体,包括表达载体,其中包含有含更改密码子的核酸分子,所述载体与适当的转录和翻译调控信号可操作地相连。
[0074]在一些实施方式中,本发明的核酸分子在表达载体中。在其他实施方式中,本发明的核酸分子位于可助于集成入植物DNA之中的载体之中。含有本发明的核酸分子的载体也可包含能引发活终止转录和/或翻译的区域。这些区域的元素可以是天然生成的(与植物宿主细胞或者是异源或者同源)或者合成的。
[0075]在本发明的实践中可使用大量启动子。例如,本发明的核酸分子可以与在宿主有机体表达的组成型、组织优选的、诱导型或其他启动子相结合。在一个实施方式中,所述启动子是组成型启动子,包括但不限制于Rsyn 7的核心启动子和其他在WO 99/43838和美国专利第6,072,050号中披露的组成型启动子;核心CaMV 35S启动子(Odell et al.(1985)Nature 313:810-812);水稻肌动蛋白(McElroy et al.(1990)PlantCell 2:163-171);泛素(Christensen et al.(1989)Plant Mol.Biol.12:619-632and Christensen et al.(1992)Plant Mol.Biol.18:675-689);pEMU(Lastetal.(1991)Theor.Appl.Genet.81:581-588);MAS(Velten etal.(1984)EMBOJ.3:2723-2730);ALS启动子(美国专利第5,659,026号)等。其他组成型启动子包括例如在美国专利第5,608,149号;第5,608,144号;第5,604,121号;第5,569,597号;第5,466,785号;第5,399,680号;第5,268,463号;第5,608,142号和第6,177,611号中所讨论的那些启动子。
[0076]在另一实施方式中,所述启动子是诱导型启动子,包括但不限制于损伤诱导型启动子(诸如与例如马铃薯多肽抑制剂基因、wun1、wun2、win1、win2、系统素、WIP1、MPI基因相关的启动子);病原体诱导型启动子(诸如与例如致病相关多肽、SAR多肽、beta-1,3-葡聚糖酶、壳多糖酶、PRms基因相关的那些启动子(参见Redolfi et al.(1983)Neth.J.Plant Pathol.89:245-254;Uknes et al.(1992)Plant Cell 4:645-656;andVan Loon(1985)Plant Mol.Virol.4:111-116,WO 99/43819,Cordero etal.(1992)Physiol.Mol.Plant Path.41:189-200,美国专利第5,750,386));化合物调节启动子(诸如与例如玉米In2-2启动子、玉米GST启动子、烟草PR-la启动子相关的那些启动子(也参见Schena et al.(1991)Proc.Natl.Acad.Sci.USA 88:10421-10425;McNellis etal.(1998)Plant J.14(2):247-257);Gatz et al.(1991)Mol.Gen.Genet.227:229-237,和美国专利第5,814,618号和第5,789,156号))。
[0077]在另一实施方式中,所述启动子是组织优选启动子,包括但不限制于在Kawamata et al.(1997)Plant Cell Physiol.38(7):792-803;Hansen etal.(1997)Mol.Gen Genet.254(3):337-343;Russell etal.(1997)Transgenic Res.6(2):157-168;Rinehart et al.(1996)Plant Physiol.112(3):1331-1341;Van Camp et al.(1996)Plant Physiol.112(2):525-535;Canevascini et al.(1996)Plant Physiol.112(2):513-524;Yamamoto etal.(1994)Plant Cell Physiol.35(5):773-778;Lam (1994)Results Probl.CellDiffer.20:181-196;Orozco etal.(1993)Plant Mol Biol.23(6):1129-1138;Matsuoka el al.(1993)Proc Natl.Acad.Sci.USA 90(20);9586-9590;和Guevara-Garcia et al.(1993)Plant J.4(3):495-505中所描述的启动子。
[0078]在另一实施方式中,所述启动子是组织特异性启动子,包括但不限制于叶特异性启动子(Yamamoto et al.(1997)Plant J.12(2):255-265;Kwon et al.(1994)Plant Physiol.105:357-67;Yamamoto et al.(1994)Plant Cell Physiol.35(5):773-778;Gotor et al.(1993)Plant J.3:509-18;Orozco et al.(1993)Plant Mol.Biol.23(6):1129-1138;and Matsuoka et al.(1993)Proc.Natl.Acad.Sci.USA 90(20):9586-9590);根特异性启动子(Hire et al.(1992)Plant Mol.Biol.20(2):207-218,Keller and Baumgartner(1991)Plant Cell 3(10):1051-1061,Sanger et al.(1990)Plant Mol.Biol.14(3):433-443,Miao et al.(1991)Plant Cell 3(1):11-22,Bogusz et al.(1990)Plant Cell 2(7):633-641,Kuster etal.(1995)Plant Mol.Biol.29(4):759-772,Capanae^/.(1994)Plant Mol.Biol.25(4):681-691,美国专利第5,837,876号;第5,750,386号;第5,633,363号;第5,459,252号;第5,401,836号;第5,110,732号和第5,023,179号);种子特异性启动子(例如包括Ciml、cZ19B1、肌醇-1磷酸酯合成酶、Gama-玉米蛋白、Glob-1、celA、菜豆p-菜豆蛋白、napin、p-伴大豆球蛋白、大豆凝血素、十字花科蛋白、玉米15kDa玉米蛋白、22kDa玉米蛋白、27kDa玉米蛋白、g-玉米蛋白、waxy、shrunken 1、shrunken 2、和球蛋白1的启动子(也参见Thompson et al.(1989)BioEssays 10:108,WO 00/12733,WO00/11177))。
[0079]在另一实施方式中,所述启动子是低水平表达启动子(例如,引起约1/1000~约/100,000~约/500,000的转录物表达),包括但不限制于WO 99/43838,美国专利第6,072,050号;第美国专利第5,608,149号;第5,608,144号;第5,604,121号;第5,569,597号;第5,466,785号;第5,399,680号;第5,268,463号;第5,608,142号;和第6,177,611号
本发明的多肽
[0080]采用本发明设计对多肽进行编码的核酸分子可以在植物中表达本领域内已知的任何多肽。所述多肽可以是天然产生的,是天然产生的多肽的人工修饰物,是完全重新设计的多肽或者上述的组合。在优选实施方式中,由本发明的核酸分子编码的多肽的表达改变表达所述多肽的植物的至少一个表型。在具体实施方式中,表达所述多肽的植物表型与对照植物相比发生变化。所述对照植物或者i)不含有和/或表达对感兴趣的多肽进行编码的核酸分子或者ii)含有和/或表达不含有任何更改密码子的对感兴趣的多肽进行编码的核酸分子。
[0081]通过表达由本发明的核酸分子所编码的多肽而改变的表型的例子包括但不限制于抗虫性/耐虫性(例如通过表达苏云金杆菌437N或Cry多肽或者根霉抗虫性脂肪酶多肽),抗病性/耐病性(例如通过表达Pps-AMP1),抗线虫性/耐线虫性(例如通过表达cyclostine),抗旱性/耐旱性(例如通过表达IPT),耐盐性、耐重金属性和重金属解毒性,抗除草剂性和耐除草剂性(例如通过表达草甘膦乙酰转移酶或乙酰乳酸合成酶),低肌醇六磷酸含量、高效氮利用、产率提高、提高的产量稳定性、改善的营养含量、提高的糖含量、提高生长和活力、改善的消化性、治疗性多肽的表达、非多肽药物的合成、选择性标记多肽的表达(例如GAT),报道多肽的表达(例如GUS)和雄性不育。
[0082]在具体实施方式中,由植物病毒密码子偏好核酸分子编码的杀虫性多肽来自苏云金杆菌或米根霉。在更具体的实施方式中,所述苏云金杆菌杀虫性多肽是437N或者CRY多肽。在另一更具体的实施方式中,所述米根霉多肽是杀虫性脂肪酶多肽。
植物
[0083]采用本发明的方法设计的核酸分子可用于任何植物物种的转化,包括但不限制于单子叶植物和双子叶植物。感兴趣的植物的例子包括但不限制于玉米(Zea mays)、芸苔sp.(例如,B.napus,B.rapa,B.junced),尤其是那些用作植物油来源的芸苔,紫花苜蓿(Medicagosativa),水稻(Oryza sativa),黑麦(Secale cereale),高粱(Sorghumbicolor,Sorghum vulgare),粟(例如珍珠粟(Pennisetum glaucum),小米(Panicum miliaceum),谷子(Setaria italicd),finger millet(Eleusinecoracana)),向日葵(Helianthus annuus),红花(Carthamus tinctorius),小麦(Triticum aestivum),大豆(Glycine max),烟草(Nicotiana tabacum),马铃薯(Solanum tuberosum),花生(Arachis hypogaea),棉花(Gossypiumbarbadense,Gossypium hirsutum),棕榈(Elaeis guinnesis),亚麻(Linumuistatissimum),蓖麻(Ricinus communis),瓜尔豆(Athamantha sicula),小扁豆(Lens culinaris),葫芦巴(Trigonella corniculatd),甜马铃薯(Ipomoeabatatus),木薯(Manihot esculentd),咖啡(Coffea spp.),椰子(Cocosnucifera),菠萝(Ananas comosus),柑橘树(Citrus spp.),可可豆(Theobroma cacao),茶(Camellia sinensis),香蕉(Musa spp.),鳄梨(Perseaamericana),无花果(Ficus casica),番石榴(Psidium guajava),芒果(Mangifera indica),橄榄(Olea europaea),木瓜(Carica papaya),腰果(Anacardium occidentale),澳大利亚坚果(Macadamia integrifolia),杏仁(Prunus amygdalus),糖用甜菜(Beta vulgaris),甘蔗(Saccharum spp.),燕麦,大麦,蔬菜,观赏植物和松类。
[0084]蔬菜的例子包括但不限制于,西红柿(Lycopersiconesculentum),莴苣(Lactuca sativa),青豆(phaseolus vulgaris),利马豆(Phaseolus limensis),豌豆(Lathyrus spp.),槐豆(Ceratonia siliqua),豇豆(Vigna unguiculata),绿豆(Vigna radiata),蚕豆(Viciafaba),鹰嘴豆(Cicerarietinum),和Cucumis属的成员,例如黄瓜(C sativus),香瓜(Ccantalupensis),和甜瓜(C.melo)。
[0085]观赏植物的例子包括但不限制于杜鹃花(Rhododendronspp.),八仙花(Macrophylla hydrangea),芙蓉花(Hibiscus rosasanensis),玫瑰(Rosa spp.),郁金香(Tulipa spp.),水仙花(Narcissus spp.),矮牵牛花(Petunia hybrida),康乃馨(Dianthus caryophyllus),猩猩木Euphorbiapulcherrimd),和菊花。
[0086]松类的例子包括但不限制于,松树诸如火炬松(Pinustaeda),沼泽松(Pinus elliotii),美国黄松(Pinus ponderosd),黑松(Pinuscontortd),和辐射松(Pinus radiata);花期松(Pseudotsuga menziesii);美国西部铁杉(Tsuga canadensis);美国云杉(Picea glauca);红木(Sequoia sempervirens);真杉诸如银枞(Abies amabilis)和胶枞(Abiesbalsamea);和雪松诸如大侧柏(Thujaplicatd)和黄扁柏(Chamaecyparisnootkatensis)。
[0087]优选为,本发明的植物是谷物(例如玉米、紫花苜蓿、向日葵、芸苔、大豆、棉花、红花、花生、高粱、小麦、粟、烟草、水稻等)。
[0088]本发明还包括的是含有根据本发明的方法制得的核酸分子的转基因植物及其后代。本发明进一步涉及被转化植物的植物繁殖材料,包括但不限制于种子、块茎、球茎、鳞茎、叶子以及根和芽的切割部分。
植物的转化
[0089]任何本领域内已知的方法可用于利用本发明的方法设计的核酸分子转化植物或植物细胞。核酸分子可整合入植物DNA(例如基因组DNA叶绿体DNA)或保持完整也不插入到植物DNA中(例如通过利用人造染色体)。将核酸序列引入植物细胞的合适方法包括微注射(Crossway et al.(1986)Biotechniques 4:320-334);电穿孔(Riggs etal.(1986)Proc.Natl.Acad.Sci.USA 83:5602-5606;D′Halluin et al.(1992)Plant Cell 4:1495-1505);土壤杆菌-调节的转化(美国专利第5,563,055号和第5,981,840号,Osjoda et al.(1996)Nature Biotechnology 14:745-750);直接基因转移(Paszkowski et al.(1984)EMBOJ.3:2717-2722);弹道微粒加速(Sanford et al,美国专利第4,945,050;Tomes et al,美国专利第5,879,918号;Tomes et al,美国专利第5,886,244号;Bidney et al,美国专利第5,932,782号;Tomes et al.(1995)″Direct DNA Transfer into IntactPlant Cells via Microprojectile Bombardment,in Plant Cell,Tissue,andOrgan Culture:Fundamental Methods,ed.Gamborg and Phillips(Springer-Verlag,Berlin);and McCabe et al.(1988)Biotechnology 6:923-926));病毒调节的转化(美国专利第5,889,191号,第5,889,190号,第5,866,785号,第5,589,367号和第5,316,931号);花粉转化(De Wet et al.(1985)in TheExperimental Manipulation of Ovule Tissues,ed.Chapman et al.(Longman,New York),pp.197-209);Lee 1转化(U.S.Patent Application Ser.No.09/435,054,WO 00/28058);whisker-调节的转化(Kaeppler et al.(1990)Plant Cell Reports 9:415-418 and Kaeppler et al.(1992)Theor.Appl.Genet.84:560-566);和叶绿体转化技术(Bogorad,2000,Trends in Biotechnology18:257-263;Ramesh et al,2004,Methods Mol Biol.274:301-7;Hou et al,2003,Transgenic Res.12(1):111-4;Kindle et al,1991,PNAS 88(5):1721-5;Bateman and Purton,2000,Mol Gen Genet.263(3):404-10;Sidorov et al.,1999,Plant J.19(2):209-216)
[0090]根据被选作进行转化的植物或植物细胞的类型,即单子叶或双子叶,对用于制造转基因植物和植物细胞的转化方案的选择可不同。对特定植物类型而言特别适合的转化方案的例子包括为以下类型的植物进行转化的方案:洋葱(Weissinger et al.(1988)Ann.Rev.Genet.22:421-477;Sanford et al.(1987)Particulate Science and Technology 5:27-37);potato(Tu et al.(1998)Plant Molecular Biology 37:829-838 andChong et al.(2000)Transgenic Research 9:71-78);大豆(Christou et al.(1988)Plant Physiol.87:671-674,McCabe et al.(1988)Bio/Technology6:923-926,Finer and McMullen(1991)In Vitro Cell Dev.Biol.27P:175-182,and Singh et al(1998)Theor.Appl.Genet.96:319-324);水稻(Datta etal.(1990)Biotechnology 8:736-740,Li et al(1993)Plant Cell Reports12:250-255,and Christou and Ford(1995)Annals of Botany 75:407-413);玉米(Klein etal.(1988)Proc.Natl.Acad.Sci.USA 85:4305-4309,Klein etal(1988)Biotechnology 6:559-563,Klein et al(1988)Plant Physiol.91:440-444,Fromm et al(1990)Biotechnology 8:833-839,and Tomes et al.(1995)″Direct DNA Transfer into Intact Plant Cells via MicroprojectileBombardment,″in Plant Cell,Tissue,and Organ Culture:FundamentalMethods,ed.Gamborg(Springer-Verlag,Berlin);谷类(Hooykaas-VanSlogteren et al(1984)Nature(London)311:763-764,美国专利第5,736,369号);百合(Bytebier et al(1987)Proc.Natl.Acad.Sci.USA84:5345-5349)。
[0091]在一些实施方式中,在转基因植物和植物细胞的产生中,多个构建体可用于转化。多重构建体可包括在顺式或反式位置中。在优选实施方式中,每个构建体具有启动子和其他调节序列。
[0092]已被转化的细胞可根据本领域内任何已知的方法培育植物(例如,McCormick et al.(1986)Plant Cell Reports 5:81-84)。可培育这些植物用相同转化的品系或不同的品系进行授粉。可培育两代或两代以上的植物以确保所需核酸分子、多肽和/或表型特征的表达被稳定保留并遗传。
表达的测定
[0093]本领域内任何已知的方法可用于测定植物中本发明的核酸或其编码的多肽的表达水平。例如,在植物中本发明的核酸所编码的多肽的表达水平可由免疫分析、定量凝胶电泳等确定。另外,在植物中本发明的核酸分子所编码的多肽的表达水平可由所述植物表型改变的程度来确定。可由整株植物、其组织或植物细胞培养物进行测定。
[0094]在一实施方式中,在用含有一个或多个更改密码子的核酸分子进行转化的植物和用未更改的核酸分子进行转化的植物之间进行了多肽表达水平的比较,其中两种核酸分子编码相同或者基本相同的多肽。在另一实施方式中,在用含有一个或多个更改密码子的核酸分子进行转化的植物和非转基因植物之间进行了多肽表达水平的比较。
[0095]此处引用的所有专利、专利申请、已公开的PCT申请和文章、书籍、参考、参考说明书和摘要的内容在此以引用的方式整体引入更完整地描述本发明所属领域的现状。
[0096]由于在不背离本发明的范围和精神的情况下可在上述主体内容中做出各种变化,因此以上描述的,或在所附权利要求中包含的所有主体内容均被视为本发明的描述和说明。根据上述教学,本发明的许多修改和变化是可能的。
实施例
[0097]此处提出的以下实施例旨在描述和例举实现本发明的各个方面,而并非以任何方式限制本发明。
实施例1对苏云金杆菌杀虫性多肽473N的变种进行编码的单子叶植物病毒密码子偏好核酸分子编码序列的设计
[0098]根据列在表14中的0.09阈值单子叶植物病毒密码子使用频率进行初步选择对473N的氨基酸序列进行编码的核酸分子的密码子,随后进行Kozak-共有序列优化,并进行编辑以去掉隐蔽拼接位点、可导致mRNA快速降解的序列,假聚腺苷酸化信号序列以及长替代性阅读框。另外,具有更高植物病毒密码子使用频率的密码子放置在所述编码序列的5’端。SEQ ID NO:1编码Kozak-473N。SEQ ID NO:2是Kozak-473N的氨基酸序列。密码子优化前的473N是SEQ ID NO:15。
[0099]下表显示列在SEQ ID NO:1中的单子叶植物病毒密码子偏好核酸分子编码序列的密码子使用频率与列在表14中的单子叶植物病毒密码子使用频率的比较。
表23:在SEQ ID NO:1中的密码子使用频率与经过大于0.09截止阈值调整的单子叶植物病毒密码子使用频率的对比。
实施例2植物病毒密码子偏好473N的组装
[00100]通过DNA2.0(Menlo Park,CA)合成所述473N基因(SEQ IDNO:1)的合成版本。将限制性酶位点BamHI和HpaI分别加到所述基因的5′和3′端以协助克隆入转化载体。
实施例3 473N植物转化载体的构建
[00101]在用BamHI和HpaI消化质粒后,从DNA2.0载体中分离对应于473N基因的2.1kb片段。该片段亚克隆入中间载体,pSKNA-Ubi,利用BamHI和HpaI得到pSKNA-Ubi:473N。pSKNA-Ubi:473N含有在玉米Ubi启动子-5’UTR-Ubi内含子1组合所调控的473N基因并由位于473N基因紧邻3’侧的pinII终止序列所终止。pSKNA-Ubi:473N用AscI和NotI消化释放表达盒(Ubi Pro-5′UTR′Ubi内含子1:473N:pinII),该片段亚克隆入最终转化载体的相应位点将其放置在标记基因上游,并处于与选择标记基因相反的取向。在转化前核对LB和RB之间的完整基因框的序列。
实施例4通过粒子轰击进行的玉米转化和转基因植物的再生
[00102]来自温室供体植物的未成熟玉米胚胎用与泛素启动子和选择标记基因诸如PAT(Wohlleben et al,1988,Gene 70:25-37)可操作地相连的含有植物病毒密码子偏好核酸分子编码序列的DNA分子进行轰击,该选择标记基因使之具有对除草剂双丙氨酰膦(Bialaphos)的抵抗力。作为另外一种选择,所述选择标记基因可以单独的DNA分子提供。如下进行所述转化。培养基配方如下。
准备靶组织
[00103]将穗去壳并在30%CloroxTM漂白剂+0.5%微去污剂中灭菌表面20分钟,并用无菌水清洗两次。所述未成熟的胚胎被切开并将胚胎轴侧向下放置(胚子叶侧向上),每块板上25个胚胎,在560Y培养基中4小时然后排列在2.5cm的靶区域以准备进行轰击。
准备DNA
[00104]分离含有与泛素启动子可操作地相连的植物病毒密码子偏好核酸分子的质粒载体。例如,合适的转化载体含有来自于玉米(zeamays)的Ubi1启动子,来自Ubi1的5′UTR和Ubi1内含子,以及PinII终止子。所述载体另外含有由玉米UbiI启动子/内含子/5’UTR驱动的选择标记基因诸如GAT和3×35S增强子以及PinII终止子。可选地,所述可选择标记可位于单独的质粒中。利用如下CaCl2沉淀过程将含有植物病毒密码子偏好核酸分子编码序列以及可选择标记诸如GAT的DNA分子沉淀到1.1μm(平均直径)钨球上:
100μl在水中制备好的钨颗粒
10μl(1μg)在Tris EDTA缓冲液中的DNA(1μg总DNA)
100μl 2.5M CaCl2
10μl 0.1M亚精胺
[00105]保持在多管式漩涡振动器上时,将每种试剂顺序加入钨微粒悬浮液。最终混合物经短暂超声波处理并在恒定漩涡振动下温育10分钟。在沉淀期之后,短暂离心试管,弃去液体,用500ml 100%乙醇洗涤,并离心30秒。再次弃去液体,并向最终钨微粒球中加入105μl100%乙醇。对于微粒枪轰击,所述钨/DNA微粒经短暂超声波处理后,以10μl的量点击在每个巨大载体的中心并在轰击前干燥约2分钟。
微粒枪处理
[00106]在微粒枪HE34-1或HE34-2中以水平#4对样品板进行轰击。所有样品接受650PSI的单次射击,从每管制备好的微粒/DNA中取出共10份等分样品。
[00107]在轰击后,所述胚胎保持在560Y培养基上两天,然后转移到含有3mg/升3mM草甘膦的560R选择培养基,并每两个星期进行传代培养。在大约选择10周后,选择抗性愈伤组织克隆转移至288J培养基以启始植物再生。在体细胞胚胎成熟(2~4周)后,良好发育的体细胞胚胎转移至用于萌芽的培养基上并转移至有光照的培养室内。大约7~10天以后,发育的植物苗转移至试管中不含激素的272V培养基7~10天直至植物苗良好发育。然后将植物转移至含有盆栽土壤的平板上的嵌入物(等同于2.5”盆)并在生长箱中生长1星期,然后在温室中再生长1~2星期,然后转移至标准600盆中(1.6加仑)并生长至完全成熟。通过本领域内已知的分析手段监测植物并对由所述植物病毒密码子偏好核酸分子编码的多肽的表达进行评分,诸如例如,用与所述编码的多肽结合的抗体进行的免疫分析和蛋白质印迹法。也可在选择10周之后监测抗性愈伤组织(resistant callus)的多肽表达以评价这些多肽的水平。
轰击和培养基
[00108]轰击培养基(560Y)含有4.0g/l N6碱性盐(SIGMA C-1416),1.0ml/l Eriksson维生素混合物(1000×SIGMA-1511),0.5mg/l维生素B1 HCl,120.0g/l蔗糖,1.0mg/l 2,4-D,和2.88g/l L-脯氨酸(在用KOH调节至pH 5.8之后用dI H2O补足体积);2.0g/l GelriteTM(在用dIH2O补足体积后加入);和8.5mg/l硝酸银(在对所述培养基灭菌并冷却至室温后加入)。选择培养基(560R)含有4.0g/l N6碱性盐(SIGMA C-1416),1.0ml/l Eriksson维生素混合物(1000×SIGMA-1511),0.5mg/l维生素B1 HCl,30.0g/l蔗糖,和2.0mg/l 2,4-D(在用KOH调节至pH 5.8之后用dI H2O补足体积);3.0g/l GelriteTM(在用dI H2O补足体积后加入);和0.85mg/l硝酸银和3.0mg/l双丙氨酰膦(在对所述培养基灭菌并冷却至室温后加入)。
[00109]植物再生培养基(288J)含有4.3g/l MS盐(GIBCO 11117-074),5.0ml/l MS维生素储备溶液(0.100g/l烟酸,0.02g/l维生素B1HCl,0.10g/l维生素B6HCl,和0.40g/l甘氨酸,用精制D-I H2O补足体积)(Murashige and Skoog(1962)Physiol.Plant.75:473),100mg/l肌醇,0.5mg/l玉米素,60g/l蔗糖,和1.0ml/l的0.1mM脱落酸(在调节至pH5.6之后用精制dI H2O补足体积);3.0g/l GelriteTM(在用dI H2O补足体积后加入);和1.0mg/l吲哚乙酸和3.0mg/l双丙氨酰膦(在将所述培养基灭菌并冷却至60℃之后加入)。无激素培养基(272V)含有4.3g/lMS盐(GIBCO 11117-074),5.0ml/l MS维生素储备溶液(0.100g/l烟酸,0.02g/l维生素B1 HCl,0.10g/l维生素B6HCl,和0.40g/l甘氨酸,用精制DI H2O补足体积),0.1g/l肌醇和40.0g/l蔗糖(在调节至pH5.6之后用精制dI H2O补足体积);和6g/l Bacto-agar(在用dI H2O补足体积后加入),灭菌并冷却至60℃。
实施例5土壤杆菌调节的玉米的转化和转基因植物的再生
[00110]用Zhao的方法用含有植物病毒密码子偏好473N基因的载体对玉米进行转化(美国专利第5,981,840号和PCT专利公开WO98/32326;其中每件的内容在此以引用的方式引入)。
[00111]土壤杆菌在800培养基的母板上生长并在28℃,黑暗中培养3天,之后在4℃保存达一个月。土壤杆菌的工作板在810培养板上生长,并在28℃,黑暗中温育1~2天。
[00112]简言之,从新鲜无菌玉米穗中切下胚胎并保持在561Q培养基中直至收集到所有必需的胚胎。然后将胚胎与由工作板所得的土壤杆菌悬浮液接触,其中所述土壤杆菌含有含所述实施方式的473N基因的质粒。所述胚胎与土壤杆菌在562P培养基上共培养,所述胚胎轴向下放置在板上,正如′840专利方案。
[00113]在562P培养基上1周以后,将所述胚胎转移至563O培养基。以2周的间隔在新鲜563O培养基上对胚胎进行传代培养并在相同条件下继续温育。在选择6~8周后出现愈伤组织事件(Callus events)。
[00114]在愈伤组织长至合适尺寸之后,在再生(288W)培养基中培养所述愈伤组织并保持在黑暗中2~3周以启始植物再生。在体细胞胚胎成熟之后,良好发育的体细胞胚胎被转移至用于萌芽的培养基(272V)并转移至有光照的培养室。大约7~10天以后,发育的植物苗转移至试管中不含激素的272V培养基7~10天直至植物苗良好发育。然后将植物转移至含有盆栽土壤的平板上的嵌入物(等同于2.5”盆)并在生长箱中生长1星期,然后在温室中再生长1~2星期,然后转移至标准600盆中(1.6加仑)并生长至完全成熟。
[00115]在土壤杆菌调节的转化和转基因玉米植物再生中使用的培养基
[00116]561Q培养基含有4.0g/L N6碱性盐(SIGMA C-1416),1.0mL/L Eriksson维生素混合物(1000×SIGMA-1511),0.5mg/L维生素B1HCl,68.5g/L蔗糖,36.0g/L葡萄糖,1.5mg/L 2,4-D,和0.69g/L L-脯氨酸(在用KOH调节至pH 5.2后用dI H2O补足体积);2.0g/l GelriteTM(在用dI H2O补足体积后加入);和8.5mg/L硝酸银(在对所述培养基灭菌并冷却至室温后加入)。
[00117]800培养基含有50.0mL/L储备溶液A和850mL dI H2O,并用dI H2O补充至离满体积差100ml/L,然后加入9.0g的phytagar。在灭菌和冷却后,加入50.0mL/L储备溶液B,以及5.0g的葡萄糖和2.0mL的50mg/mL奇霉素储备溶液。储备溶液A含有60.0g的二碱价K2HPO4和20.0g的一碱价磷酸钠,溶解在950mL的水中,并用KOH调节至pH 7.0,用dI H2O补足至1.0L体积。储备溶液B含有20.0gNH4Cl,6.0g MgSO4·7H2O,3.0g氯化钾,0.2g CaCl2,和0.05g的FeSO4·7H2O,用dI H2O补足体积并灭菌冷却。
[00118]810培养基含有5.0g酵母提取物(Difco),10.0g蛋白胨(Difco),5.0g NaCl,溶解在dI H2O中,并在调节pH至6.8之后补足体积,然后加入15.0g的bacto-agar,所述溶液经灭菌并冷却,然后加入1.0mL的50mg/mL奇霉素储备溶液。
[00119]562P培养基含有4.0g/L N6碱性盐(SIGMA C-1416),1.0mL/L Eriksson维生素混合物(1000×SIGMA-1511),0.5mg/l维生素B1HCl,30.0g/l蔗糖,和2.0mg/l 2,4-D(在用KOH调节至pH 5.8之后用dI H2O补足体积);3.0g/l GelriteTM(在用dI H2O补足体积后加入);和0.85mg/l硝酸银和1.0mL的100mM乙酸丁香酮(acetosyringone)储液(均在所述培养基经灭菌,冷却至室温以后加入)。
[00120]5630培养基含有4.0g/L N6碱性盐(SIGMA C-1416),1.0mL/L Eriksson维生素混合物(1000×SIGMA-1511),0.5mg/L维生素B1HCl,30.0g/L蔗糖,1.5mg/L 2,4-D,0.69g L-脯氨酸和0.5g MES缓冲液(在用KOH调节至pH 5.8之后用dI H2O补足体积)。然后加入6.0g/LUltrapureTM琼脂-琼脂(EM Science),然后所述培养基经灭菌和冷却。然后,加入0.85mg/L硝酸银,3.0mL的1mg/mL双丙氨酰膦储备液和2.0mL的50mg/mL羧苄青霉素储备液。
[00121]288W培养基含有4.3g/L MS盐(GIBCO 11117-074),5.0mL/L MS维生素储备溶液(0.100g/l烟酸,0.02g/L维生素B1 HCl,0.10g/L维生素B6 HCl,和0.40g/L甘氨酸,用精制dI H2O补足体积)(Murashige and Skoog(1962)Physiol Plant.15:473),100mg/L肌醇,0.5mg/L玉米素和60g/L蔗糖,在调节至pH 5.6之后用dI H2O补足体积。随后,加入6.0g/L of UltrapureTM琼脂-琼脂(EM Science),所述培养基经灭菌和冷却。然后加入1.0mL/L的0.1mM脱落酸;1.0mg/L吲哚乙酸和3.0mg/L双丙氨酰膦,以及2.0mL的50mg/mL羧苄青霉素储备液。
[00122]无荷尔蒙培养基(272V)含有4.3g/l MS盐(GIBCO 11117-074),5.0ml/l MS维生素储备溶液(0.100g/l烟酸,0.02g/l维生素B1HCl,0.10g/l维生素B6HCl,和0.40g/l甘氨酸,用精制DI H2O补足体积),0.1g/l肌醇和40.0g/l蔗糖(在调节至pH5.6之后用精制dI H2O补足体积);和6g/l Bacto-agar(在用dI H2O补足体积后加入),灭菌并冷却至60℃。
实施例6转基因473N表达愈伤组织的昆虫生物测试
[00123]在表达泛素启动子控制下的473N的转基因愈伤组织上,对昆虫进行生物测试以判断在此阶段是否表达足够的473N毒素以提供杀虫活性。该测试与蛋白质印迹分析共同提供了所述对杀虫性多肽进行编码的植物病毒密码偏好473N基因在植物组织中表达程度的测量标准。
[00124]在之前用95%乙醇喷雾进行消毒的Pitman盘上进行愈伤组织分析。按照制造商的说明书制备琼脂(Serva),并补充含有青霉素、链霉素和amphoterin B的三重抗生素溶液(70mls/500ml琼脂)加入到每个孔中并冷却。在每个孔中,将无菌过滤纸圆盘放置在琼脂上并将200μl的灭菌水洒在过滤纸上。将愈伤组织(~1cm的尺寸)放在过滤纸上并在每个孔中放入2条欧洲玉米蛀虫(ECB)幼虫。将所述分析板在27℃下温育并在加入昆虫后72~96小时对昆虫的死亡率、发育不全和行为变化打分。所述分析重复2次以确认得分。
[00125]所述分析结果显示在30%的测试孔中,ECB幼虫严重发育不全或者死亡。两次重复之间的活性相关性为100%。在非转基因对照愈伤组织上没有观察到死亡或发育不全。该分析表明473N在一定比例的不同愈伤组织中以杀虫性剂量表达,并支持所述植物病毒密码偏好的有效性。
实施例7ECB和CEW的叶圆盘功效测试
[00126]转化愈伤组织经再生为植物并送至温室中进行ECB和棉铃虫(CEW)的TO有效性测试。在V6发育阶段对所有事件进行叶圆盘分析以评估48小时以后在昆虫幼虫消耗的叶区域的植物保护。测试如下进行,即对每个转基因事件打孔获得多个叶圆盘并在24孔板的每个孔中放入一片叶圆盘。在测试分析中,每种昆虫每个事件取4片叶圆盘(总数为8)。将所述叶圆盘放置在与孔直径相同的潮湿过滤纸盘上。在放入昆虫后在每块板上加盖以放置昆虫从孔中逃出。也包括来自非转基因植物的对照叶圆盘以比较叶消耗量。测试在27℃进行。
[00127]该分析的结果总结在以下的表24中。在45%的所测试的事件(event)中观察到叶保护。在显示出抗ECB的保护效果的事件中也显示出抗CEW的保护效果。在对照孔和其他“无效”事件中的叶圆盘被完全消耗。所述叶圆盘分析测试的例子显示在图1中。这些结果证实了利用植物病毒密码偏好设计的杀虫水平473N基因的表达。
表24:表达植物病毒密码优化473基因的事件的叶圆盘分析结果
构建体 | ECB阳性 | CEW阳性 |
PHP25637 | 21/47 | 21/41 |
实施例8来自473N转基因事件的叶样品的免疫印迹分析
[00128]通过收集来自V6阶段植物的4片叶圆盘(~100mg)放入1.2ml raptor试管进行植物多肽提取。对于每份样品将两颗钢制磨珠和200μl的提取缓冲液(100mM磷酸钾,pH 7.8,1mM EDTA,10%丙三醇,1%Triton,7mM β-巯基乙醇(BME)和蛋白酶抑制剂混合物)加入。将试管盖上并放置在Geno/Grinder(BT&C/OPS Diagnostics,NewBridgewater,NJ)中,并在1650的速度下进行两次30秒钟rapetted。在4℃,4000rpm下离心15分钟,将上清液转移至新试管并在4℃,13,000下再次离心5分钟。将上清液转移至新试管并在-20℃保存直至使用。
[00129]通过加入5μl的4×加样缓冲液(Invitrogen,Carlsbad,CA)和3.5μl的BME并在100℃加热5分钟制备用于SDS-PAGE凝胶电泳的样品。用合适的分子量标记在4~16%的NuPAGE预制凝胶(Invitrogen)上装样,在MES跑胶缓冲液中在~125V下跑胶~90分钟。
[00130]通过从架子上取下凝胶并放置在由两层海绵层、印迹纸(切割至所述凝胶的大小)、凝胶、预润湿的膜、印迹纸和两层海绵构成的印迹夹心结构中进行免疫印迹分析。将所述夹心结构放置在含有转印缓冲液的转印箱中,在30伏下进行60~90分钟。在转印后,从所述夹心结构中取出膜并放置在容器中,向其中加入1×PBST(10mM磷酸盐缓冲盐水,pH7.4,1%Tween 20)和5%脱脂干牛奶。轻微搅动在室温下进行1小时的封闭。在一小时后封闭液被15mL含有经恰当稀释的473N一抗的1X PBST+5%干牛奶所置换并在4℃下轻微晃动温育过夜。在温育后,移除一抗并用1×PBST+5%干牛奶洗涤膜三次(每次5分钟)。在25ml 1×PBST+5%干牛奶中稀释的1/5000的二抗与所述膜在室温下轻微晃动温育1小时。从所述膜上移除二抗,用1×PBST+5%干牛奶洗涤膜三次(每次5分钟),然后用1×分析缓冲液(在Western Light KitTM中提供,Applied Biosystems,Foster City,CA)洗涤三次(每次5分钟)。从膜上移除过量的缓冲液,并将所述膜放在塑料包装膜上5分钟,在黑暗中向其加入3ml的底物溶液(CSPDTM-在试剂盒中提供),其中补充150μl的Nitro-Block IITM增强子(在试剂盒中提供)。通过除去过量溶液并将所述膜曝光于Biomax Light X-射线胶片(Eastman Kodak Co.New Haven,CT)下不同的曝光时间以进行显影。然后通过传统方法对所述胶片进行显影。
来自473N转基因事件的叶组织的蛋白质印迹分析显示出一种尺寸上与纯化473N蛋白对照相类似的针对抗体的免疫活性带(参见图2)。在叶圆盘分析中表现出有效性的事件的叶样品中存在该带进一步证实植物病毒密码优化473N基因在抗虫性水平的表达。在非转基因对照中没有此带。其他交叉反应带在转基因样品和非转基因对照中是相同的。
实施例9对来自于米根霉的杀虫性脂肪酶(RoLipase)进行编码的单子叶植物病毒密码子偏好核酸分子编码序列的设计
[00131]根据列在表14中的0.09阈值单子叶植物病毒密码子使用频率初步选择对带有大麦α淀粉酶信号肽的RoLipase的氨基酸序列进行编码的核酸分子的密码子。随后进行Kozak-共有序列优化,并进行编辑以去掉隐蔽拼接位点、可导致mRNA快速降解的序列,假聚腺苷酸化信号序列以及长替代性阅读框。另外,具有更高植物病毒密码子使用频率的密码子放置在所述编码序列的5’端。SEQ ID NO:3编码密码子优化RoLipase。SEQ ID NO:4是密码子优化RoLipase的氨基酸序列。SEQ IDNO:5和6是加入到所述密码子优化RoLipase序列中并用于所有描述的试验的大麦α淀粉酶信号肽(分别是核酸序列和肽序列)。密码子优化前的脂肪酶是SEQ ID NO:16。
实施例10植物病毒密码子偏好BAA-Ro Lipase的组装。
[00132]通过DNA2.0(Menlo Park,CA)合成所述RoLipase(SEQ IDNO:3)的合成版本。将限制性酶位点BamHI和HpaI分别加到所述基因的5′和3′端以协助克隆入植物转化载体。
实施例11BAA-RoLipase植物转化载体的构建
[00133]在用BamHI和HpaI消化质粒后,从提供的DNA2.0载体中分离对应于BAA-RoLipase基因的1.2kb片段。将该片段亚克隆入中间载体,pSKNA-Ubi,利用BamHI和HpaI得到pSKNA-Ubi:BAA-RoLipase。pSKNA-Ubi:BAA-RoLipase含有在玉米Ubi启动子-5’UTR-Ubi内含子1组合所调控下的BAA-RoLipase基因并由位于Lipase基因紧邻3’侧的pinII终止序列所终止。pSKNA-Ubi:BAA-RoLipase用AscI和NotI消化释放表达盒(Ubi Pro-5UTR′Ubi内含子1:BAA-RoLipase:pinII),该片段亚克隆入最终转化载体的相应位点将其放置在选择标记基因上游,并处于与选择标记基因相反的取向。在转化前核对LB和RB之间的完整盒的序列。
[00134]通过土壤杆菌调节的转化,所述BAA-RoLipase植物转化载体用于转化玉米,并按照实施例5中详细描述的过程再生植物。
实施例12Rolipase转化事件的玉米食虫分析试验(CRW)
[00135]采用根培育株分析对45个RoLipase转化事件进行CRW评估。经转化的Rolipase植物苗移栽至根培育株(root trainers)中并在V3~V4阶段感染100个CRW卵。在感染后15~17天对植物根破坏进行评价并根据根评分标准对比非转基因对照植物。根据根破坏程度将11株植物评定为阳性结果,代表了24%的保存率(表25)。这些植物中的一部分被选用于RoLipase表达的蛋白质印迹分析。
表25:通过CRW分析测试的Rolipase TO事件
评估事件总数 | 通过测试的事件数目 | Kept事件百分比 |
45 | 11 | 24 |
实施例13来自BAA-RoLipase转基因事件的叶样品和根样品的免疫印迹分析
[00136]通过收集来自V6~V8阶段植物的根部分和叶部分(~100mg)放入1.2ml raptor试管进行植物多肽提取。对于每份样品将两颗钢制磨珠和200μl的提取缓冲液(100mM磷酸钾,pH 7.8,1mM EDTA,10%丙三醇,1%Triton,7mM β-巯基乙醇(BME)和蛋白酶抑制剂混合物)加入。将试管盖上并放置在Geno/Grinder(BT&C/OPS Diagnostics,New Bridgewater,NJ)中,并在1650的速度下进行两次30秒钟rapetted。在4℃,4000rpm下离心样品15分钟,将上清液转移至新试管并在4℃,13,000下再次离心5分钟。所述上清液转移至新试管中并将所述样品在-20℃保存直至使用。
[00137]通过加入5μl的4×加样缓冲液(Invitrogen,Carlsbad,CA)和3.5μl的BME并在100℃加热5分钟制备用于SDS-PAGE凝胶电泳的样品。用合适的分子量标记在4~16%的NuPAGE预制凝胶(Invitrogen)上装样,在MES跑胶缓冲液中在~125V下跑胶~90分钟。
[00138]通过从架子上取下凝胶并放置在由两层海绵层、印迹纸(切割至所述凝胶的大小)、凝胶、预润湿的膜、印迹纸和两层海绵构成的印迹夹心结构中进行免疫印迹分析。将所述夹心结构放置在含有转印缓冲液的转印箱中,在30伏下进行60~90分钟。在转印后,从所述夹心结构中取出膜并放置在容器中,向其中加入1×PBST(10mM磷酸盐缓冲盐水,pH7.4,1%Tween 20)和5%脱脂干牛奶。轻微搅动在室温下进行1小时的封闭。在一小时后封闭液被15mL含有1∶1000 RoLipase一抗稀释液的1X PBST+5%干牛奶所置换并在4℃下轻微晃动温育过夜。在温育后,移除一抗并用1×PBST+5%干牛奶洗涤膜三次(每次5分钟)。在25ml 1×PBST+5%干牛奶中稀释的1/5000的二抗与所述膜在室温下轻微晃动温育1小时。从所述膜上移除二抗,用1×PBST+5%干牛奶洗涤膜三次(每次5分钟),然后用1×分析缓冲液(在Western Light KitTM中提供,Applied Biosystems,Foster City,CA)洗涤三次(每次5分钟)。从膜上移除过来的缓冲液,并将所述膜放在塑料包装膜上,在黑暗中向其加入3ml的底物溶液(CSPDTM-在试剂盒中提供)和150μl的Nitro-Block IITM增强子(在试剂盒中提供)5分钟。通过除去过量溶液并将所述膜曝光于Biomax Light X-射线胶片(Eastman Kodak Co.New Haven,CT)下不同的曝光时间以进行显影。然后通过传统方法对所述胶片进行显影
[00139]在所述根培育株分析试验中呈阳性或阴性的RoLipase转基因事件中的一部分进行叶和根组织的蛋白质印迹分析。这些分析的结果显示,在所述分析中显示阳性的事件中,存在对应于成熟RoLipase预期大小(~31kD)的免疫反应性带(参见图3)。在所述蛋白质印迹分析中包括纯化的Rolipase前体蛋白(ROL~42kD)作为阳性对照。在所测试的事件中根保护和RoLipase成熟形式的存在之间的相关性证实植物病毒密码子优化RoLipase基因的成功表达。
序列表
<110> Pioneer Hi-Bred International,Inc.
E.I.DuPont de Nemours&Co.
<120>利用植物病毒密码子偏爱性设计用于在植物中的多肽表达的核酸分子的方法和组合
物
<130>1877-PCT
<150>60/668,734
<151>2005-04 05
<160>16
<170>PatentIn version 3.3
<210>1
<211>1905
<212>DNA
<213>人工序列
<220>
<223>基于Bacillus thuringiensis的合成序列
<400>1
atgggacaca atgttttgaa taacgaaaga aatactgttt gtgaagcaca caatgttgca 60
gtgagagatc cattctcttt cgaacacaag agtcttaata cagttgaaaa ggagtggaca 120
gagtggaaga gaaatgatca ctcactttat gtggatccta ttgtcggaac agttgcctct 180
ttcttgctta agaaggttgg aagtttagtg ggtaagagaa tcttatcaga gttgagatca 240
ttgatcttcc cttctggttc tacaaatttg atgcaagata tcttaagaga gaccgagaaa 300
ttcttgaatc aaagacttaa taccgatact ctcgcccgtg ttaatgctga gctaacaggt 360
ctgcaagcaa acgtggagga gttcaacagg caagtcgaca acttcttaaa ccctaacaga 420
aacgccttac cattatcaat cacctctagt gtgaacacta tgcagcagtt attcttgaac 480
aggcttcctc agttccagat ccagggctat cagctcctac tcttaccatt gttcgctcag 540
gctgctaacc ttcacctctc cttcatccgt gacgttatcc taaacgctga cgaatgggga 600
atcagcgcag caactctgcg aacttaccgc aaccatctta gaaactacac tagagactac 660
tcgaactact gcattaacac ttaccagaca gctttcaggg gtttgaacac acgtcttcac 720
gacatgctcg agttccgaac atacatgttc ctaaacgtct tcgaatacgt gtcaatatgg 780
tcactgttca aataccagtc attattggtc tctagtggcg caaaccttta cgcctccgga 840
agcggaccac agcaaactca gtcgttcaca tcacaagact ggccatttct ctactctcta 900
ttccaagtaa acagtaacta tgttctgaac ggattctccg gagcgcgctt aagccaaacc 960
tttccaaaca tcgtgggttt gccaggaacg actactactc atgctcttct cgctgctaga 1020
gtcaactact cgggaggcgt atcatctggc gacattgggg ctagtccttt caaccagaac 1080
ttctcctgta gcacatttct accaccgctg ttaacaccat ttgttaggtc gtggttggac 1140
tctggatctg atcgtggagg agtgaacacc gtcacgaact ggcaaactga aagctttgaa 1200
acaacccttg gtctccgatc cggcgcattc acggcccgcg ggaacagcaa ctactttcct 1260
gactatttca taagaaatat atcgggagta ccactagttg tgaggaacga agatctgcgt 1320
cgaccgttac attataatca aatacgcaat atagaatcac catctggaac tcctggcggt 1380
gcgagagctt atatggtcag tgtacataat aggaagaaca acatatatgc agttcatgaa 1440
aatggaacaa tgatacattt ggctcccgaa gattataccg gtttcacgat atcaccgata 1500
catgcgactc aagtgaacaa tcaaacacgt acctttattt cagaaaaatt tggcaatcaa 1560
ggggattcgc ttcgatttga acaatcaaat acgactgctc gctatacact cagaggaaat 1620
ggaaattctt ataatctata tctgagggtc agttccattg gcaatagcac cattcgtgta 1680
acgattaatg ggcgagttta tactgcaaca aatgtgaata ccacgactaa caatgatgga 1740
gtcaatgata atggtgcccg cttctcagat attaatattg gcaatgtagt tgcgtctgat 1800
aatagtaacg tgccacttga tattaatgtc acattgaatt ccgggaccca atttgatctt 1860
atgaatatta tgtttgtacc tacgaatctc ccaccgctat attag 1905
<210>2
<211>634
<212>PRT
<213>人工序列
<220>
<223>基于Bacillus thuringiensis的合成序列
<400>2
Met Gly His Asn Val Leu Asn Asn Glu Arg Asn Thr Val Cys Glu Ala
1 5 10 15
His Asn Val Ala Val Arg Asp Pro Phe Ser Phe Glu His Lys Ser Leu
20 25 30
Asn Thr Val Glu Lys Glu Trp Thr Glu Trp Lys Arg Asn Asp His Ser
35 40 45
Leu Tyr Val Asp Pro Ile Val Gly Thr Val Ala Ser Phe Leu Leu Lys
50 55 60
Lys Val Gly Ser Leu Val Gly Lys Arg Ile Leu Ser Glu Leu Arg Ser
65 70 75 80
Leu Ile Phe Pro Ser Gly Ser Thr Asn Leu Met Gln Asp Ile Leu Arg
85 90 95
Glu Thr Glu Lys Phe Leu Asn Gln Arg Leu Asn Thr Asp Thr Leu Ala
100 105 110
Arg Val Asn Ala Glu Leu Thr Gly Leu Gln Ala Asn Val Glu Glu Phe
115 120 125
Asn Arg Gln Val Asp Asn Phe Leu Asn Pro Asn Arg Asn Ala Leu Pro
130 135 140
Leu SerIle Thr Ser Ser Val Asn Thr Met Gln Gln Leu Phe Leu Asn
145 150 155 160
Arg Leu Pro Gln Phe Gln Ile Gln Gly Tyr Gln Leu Leu Leu Leu Pro
165 170 175
Leu Phe Ala Gln Ala Ala Asn Leu His Leu Ser Phe Ile Arg Asp Val
180 185 190
Ile Leu Asn Ala Asp Glu Trp Gly Ile Ser Ala Ala Thr Leu Arg Thr
195 200 205
Tyr Arg Asn His Leu Arg Asn Tyr Thr Arg Asp Tyr Ser Asn Tyr Cys
210 215 220
Ile Asn Thr Tyr Gln Thr Ala Phe Arg Gly Leu Asn Thr Arg Leu His
225 230 235 240
Asp Met Leu Glu Phe Arg Thr Tyr Met Phe Leu Asn Val Phe Glu Tyr
245 250 255
Val Ser Ile Trp Ser Leu Phe Lys Tyr Gln Ser Leu Leu Val Ser Ser
260 265 270
Gly Ala Asn Leu Tyr Ala Ser Gly Ser Gly Pro Gln Gln Thr Gln Ser
275 280 285
Phe Thr Ser Gln Asp Trp Pro Phe Leu Tyr Ser Leu Phe Gln Val Asn
290 295 300
Ser Asn Tyr Val Leu Asn Gly Phe Ser Gly Ala Arg Leu Ser Gln Thr
305 310 315 320
Phe Pro Asn Ile Val Gly Leu Pro Gly Thr Thr Thr Thr His Ala Leu
325 330 335
Leu Ala Ala Arg Val Asn Tyr Ser Gly Gly Val Ser Ser Gly Asp Ile
340 345 350
Gly Ala Ser Pro Phe Asn Gln Asn Phe Ser Cys Ser Thr Phe Leu Pro
355 360 365
Pro Leu Leu Thr Pro Phe Val Arg Ser Trp Leu Asp Ser Gly Ser Asp
370 375 380
Arg Gly Gly Val Asn Thr Val Thr Asn Trp Gln Thr Glu Ser Phe Glu
385 390 395 400
Thr Thr Leu Gly Leu Arg Ser Gly Ala Phe Thr Ala Arg Gly Asn Ser
405 410 415
Asn Tyr Phe Pro Asp Tyr Phe Ile Arg Asn Ile Ser Gly Val Pro Leu
420 425 430
Val Val Arg Asn Glu Asp Leu Arg Arg Pro Leu His Tyr Asn Gln Ile
435 440 445
Arg Asn Ile Glu Ser Pro Ser Gly Thr Pro Gly Gly Ala Arg Ala Tyr
450 455 460
Met Val Ser Val His Asn Arg Lys Asn Asn Ile Tyr Ala Val His Glu
465 470 475 480
Asn Gly Thr Met Ile His Leu Ala Pro Glu Asp Tyr Thr Gly Phe Thr
485 490 495
Ile Ser Pro Ile His Ala Thr Gln Val Asn Asn Gln Thr Arg Thr Phe
500 505 510
Ile Ser Glu Lys Phe Gly Asn Gln Gly Asp Ser Leu Arg Phe Glu Gln
515 520 525
Ser Asn Thr Thr Ala Arg Tyr Thr Leu Arg Gly Asn Gly Asn Ser Tyr
530 535 540
Asn Leu Tyr Leu Arg Val Ser Ser Ile Gly Asn Ser Thr Ile Arg Val
545 550 555 560
Thr Ile Asn Gly Arg Val Tyr Thr Ala Thr Asn Val Asn Thr Thr Thr
565 570 575
Asn Asn Asp Gly Val Asn Asp Asn Gly Ala Arg Phe Ser Asp Ile Asn
580 585 590
Ile Gly Asn Val Val Ala Ser Asp Asn Ser Asn Val Pro Leu Asp Ile
595 600 605
Asn Val Thr Leu Asn Ser Gly Thr Gln Phe Asp Leu Met Asn Ile Met
610 615 620
Phe Val Pro Thr Asn Leu Pro Pro Leu Tyr
625 630
<210>3
<211>1101
<212>DNA
<213>人工序列
<220>
<223>基于Rhyzopus oryzae的合成序列
<400>3
gttccagtct caggaaagtc tggttcttca actacagctg tttctgcatc agataactcc 60
gccctacctc ctctgatttc atcgagatgc gctccacctt caaacaaggg atcaaagtca 120
gatttgcaag ctgaaccata ttatatgcaa aaaaacaccg agtggtacga gtctcacggt 180
ggcaacttaa ctagtatcgg aaagagagat gataacttgg ttggaggaat gacacttgac 240
cttccatccg acgctccacc aatcagccta tcgggttcaa ccaactctgc aagtgacgga 300
ggtaaggtcg ttgcagctac tactgcacaa atccaggagt tcacaaagta cgccggaatc 360
gcggctacag cttactgcag atccgttgtg cctgggaaca agtgggactg tgttcagtgc 420
cagaaatggg tgcccgacgg aaagattata actacattca ccagcctgtt atcggacacg 480
aatggatacg tcttgaggtc agataaacag aaaactatct accttgtatt ccgtggtact 540
aactctttcc gaagtgctat tactgacata gtcttcaatt tctccgatta taaaccggtt 600
aaaggcgcaa aggttcacgc cgggtttctc agctcgtacg agcaagtggt caatgattat 660
ttcccagtag ttcaggaaca actaacagcg aatcctacct ataaagtgat agtcacggga 720
cattcactgg gtggcgctca agcattattg gccgggatgg atctttatca acgcgagccc 780
agactctctc cgaagaatct aagtatattc actgtaggag gtccaagggt tggcaatcct 840
acatttgcgt attatgtgga atccaccggg ataccctttc aacgcacggt ccacaaacga 900
gatatagtac cgcatgttcc acctcaaagc tttggatttc tgcatcccgg tgtggaatca 960
tggattaaat ctggcacttc aaatgtccaa atttgtacat ccgaaattga aaccaaagat 1020
tgtagcaatt caattgtgcc gtttacgtct ttattggatc atcttagtta ctttgatatt 1080
aatgaagggt cctgtctcta g 1101
<210>4
<211>366
<212>PRT
<213>人工序列
<220>
<223>基于Rhyzopus oryzae的合成序列
<400>4
Val Pro Val Ser Gly Lys Ser Gly Ser Ser Thr Thr Ala Val Ser Ala
1 5 10 15
Ser Asp Asn Ser Ala Leu Pro Pro Leu Ile Ser Ser Arg Cys Ala Pro
20 25 30
Pro Ser Asn Lys Gly Ser Lys Ser Asp Leu Gln Ala Glu Pro Tyr Tyr
35 40 45
Met Gln Lys Asn Thr Glu Trp Tyr Glu Ser His Gly Gly Asn Leu Thr
50 55 60
Ser Ile Gly Lys Arg Asp Asp Asn Leu Val Gly Gly Met Thr Leu Asp
65 70 75 80
Leu Pro Ser Asp Ala Pro Pro Ile Ser Leu Ser Gly Ser Thr Asn Ser
85 90 95
Ala Ser Asp Gly Gly Lys ValVal Ala Ala Thr Thr Ala Gln Ile Gln
100 105 110
Glu Phe Thr Lys Tyr Ala Gly Ile Ala Ala Thr Ala Tyr Cys Arg Ser
115 120 125
Val Val Pro Gly Asn Lys Trp Asp Cys Val Gln Cys Gln Lys Trp Val
130 135 140
Pro Asp Gly Lys Ile Ile Thr Thr Phe Thr Ser Leu Leu Ser Asp Thr
145 150 155 160
Asn Gly Tyr Val Leu Arg Ser Asp Lys Gln Lys Thr Ile Tyr Leu Val
165 170 175
Phe Arg Gly Thr Asn Ser Phe Arg Ser Ala Ile Thr Asp Ile Val Phe
180 185 190
Asn Phe Ser Asp Tyr Lys Pro Val Lys Gly Ala Lys Val His Ala Gly
195 200 205
Phe Leu Ser Ser Tyr Glu Gln Val Val Asn Asp Tyr Phe Pro Val Val
210 215 220
Gln Glu Gln Leu Thr Ala Asn Pro Thr Tyr Lys Val Ile Val Thr Gly
225 230 235 240
His Ser Leu Gly Gly Ala Gln Ala Leu Leu Ala Gly Met Asp Leu Tyr
245 250 255
Gln Arg Glu Pro Arg Leu Ser Pro Lys Asn Leu Ser Ile Phe Thr Val
260 265 270
Gly Gly Pro Arg Val Gly Asn Pro Thr Phe Ala Tyr Tyr Val Glu Ser
275 280 285
Thr Gly Ile Pro Phe Gln Arg Thr Val His Lys Arg Asp Ile Val Pro
290 295 300
His Val Pro Pro Gln Ser Phe Gly Phe Leu His Pro Gly Val Glu Ser
305 310 315 320
Trp Ile Lys Ser Gly Thr Ser Asn Val Gln Ile Cys Thr Ser Glu Ile
325 330 335
Glu Thr Lys Asp Cys Ser Asn Ser Ile Val Pro Phe Thr Ser Leu Leu
340 345 350
Asp His Leu Ser Tyr Phe Asp Ile Asn Glu Gly Ser Cys Leu
355 360 365
<210>5
<211>72
<212>DNA
<213>Hordeum leporinum
<400>5
atggcaaata agcatttgtc acttagttta ttcttggtct tattgggact ttcagcatct 60
ctcgccagtg ga 72
<210>6
<211>24
<212>PRT
<213>Hordeum leporinum
<400>6
Met Ala Asn Lys His Leu Ser Leu Ser Leu Phe Leu Val Leu Leu Gly
1 5 10 15
Leu Ser Ala Ser Leu Ala Ser Gly
20
<210>7
<211>3468
<212>DNA
<213>人工序列
<220>
<223>基于Bacillus thuringiensis的合成序列
<400>7
atggataaca atccgaacat caatgaatgc attccttata attgtttaag taaccctgaa 60
gtagaagtat taggtggaga aagaatagaa actggttaca ccccaatcga tatttccttg 120
tcgctaacgc aatttctttt gagtgaattt gttcccggtg ctggatttgt gttaggacta 180
gttgatataa tatggggaat ttttggtccc tctcaatggg acgcatttct tgtacaaatt 240
gaacagttaa ttaaccaaag aatagaagaa ttcgctagga accaagccat ttctagatta 300
gaaggactaa gcaatcttta tcaaatttac gcagaatctt ttagagagtg ggaagcagat 360
cctactaatc cagcattaag agaagagatg cgtattcaat tcaatgacat gaacagtgcc 420
cttacaaccg ctattcctct ttttgcagtt caaaattatc aagttcctct tttatcagta 480
tatgttcaag ctgcaaattt acatttatca gttttgagag atgtttcagt gtttggacaa 540
aggtggggat ttgatgccgc gactatcaat agtcgttata atgatttaac taggcttatt 600
ggcaactata cagatcatgc tgtacgctgg tacaatacgg gattagagcg tgtatgggga 660
ccggattcta gagattggat aagatataat caatttagaa gagaattaac actaactgta 720
ttagatatcg tttctctatt tccgaactat gatagtagaa cgtatccaat tcgaacagtt 780
tcccaattaa caagagaaat ttatacaaac ccagtattag aaaattttga tggtagtttt 840
cgaggctcgg ctcagggcat agaaggaagt attaggagtc cacatttgat ggatatactt 900
aacagtataa ccatctatac ggatgctcat agaggagaat attattggtc agggcatcaa 960
ataatggctt ctcctgtagg gttttcgggg ccagaattca cttttccgct atatggaact 1020
atgggaaatg cagctccaca acaacgtatt gttgctcaac taggtcaggg cgtgtataga 1080
acattatcgt ccactttata tagaagacct tttaatatag ggataaataa tcaacaacta 1140
tctgttcttg acgggacaga atttgcttat ggaacctcct caaatttgcc atccgctgta 1200
tacagaaaaa gcggaacggt agattcgctg gatgaaatac cgccacagaa taacaacgtg 1260
ccacctaggc aaggatttag tcatcgatta agccatgttt caatgtttcg ttcaggcttt 1320
agtaatagta gtgtaagtat aataagagct cctatgttet cttggataca tcgtagtgct 1380
gaatttaata atataattcc ttcatcacaa attacacaaa tacctttaac aaaatctact 1440
aatcttggct ctggaacttc tgtcgttaaa ggaccaggat ttacaggagg agatattctt 1500
cgaagaactt cacctggcca gatttcaacc ttaagagtaa atattactgc accattatca 1560
caaagatatc gggtaagaat tcgctacgct tctaccacaa atttacaatt ccatacatca 1620
attgacggaa gacctattaa tcaggggaat ttttcagcaa ctatgagtag tgggagtaat 1680
ttacagtccg gaagctttag gactgtaggt tttactactc cgtttaactt ttcaaatgga 1740
tcaagtgtat ttacgttaag tgctcatgtc ttcaattcag gcaatgaagt ttatatagat 1800
cgaattgaat ttgttccggc agaagtaacc tttgaggcag aatatgattt agaaagagca 1860
caaaaggcgg tgaatgagct gtttacttct tccaatcaaa tcgggttaaa aacagatgtg 1920
acggattatc atattgatca agtatccaat ttagttgagt gtttatctga tgaattttgt 1980
ctggatgaaa aaaaagaatt gtccgagaaa gtcaaacatg cgaagcgact tagtgatgag 2040
cggaatttac ttcaagatcc aaactttaga gggatcaata gacaactaga ccgtggctgg 2100
agaggaagta cggatattac catccaagga ggcgatgacg tattcaaaga gaattacgtt 2160
acgctattgg gtacctttga tgagtgctat ccaacgtatt tatatcaaaa aatagatgag 2220
tcgaaattaa aagcctatac ccgttaccaa ttaagagggt atatcgaaga tagtcaagac 2280
ttagaaatct atttaattcg ctacaatgcc aaacacgaaa cagtaaatgt gccaggtacg 2340
ggttccttat ggccgctttc agccccaagt ccaatcggaa aatgtgccca tcattcccat 2400
catttctcct tggacattga tgttggatgt acagacttaa atgaggactt aggtgtatgg 2460
gtgatattca agattaagac gcaagatggc catgcaagac taggaaatct agaatttctc 2520
gaagagaaac cattagtagg agaagcacta gctcgtgtga aaagagcgga gaaaaaatgg 2580
agagacaaac gtgaaaaatt ggaatgggaa acaaatattg tttataaaga ggcaaaagaa 2640
tctgtagatg ctttatttgt aaactctcaa tatgatagat tacaagcgga taccaacatc 2700
gcgatgattc atgcggcaga taaacgcgtt catagcattc gagaagctta tctgcctgag 2760
ctgtctgtga ttccgggtgt caatgcggct atttttgaag aattagaagg gcgtattttc 2820
actgcattct ccctatatga tgcgagaaat gtcattaaaa atggtgattt taataatggc 2880
ttatcctgct ggaacgtgaa agggcatgta gatgtagaag aacaaaacaa ccaccgttcg 2940
gtccttgttg ttccggaatg ggaagcagaa gtgtcacaag aagttcgtgt ctgtccgggt 3000
cgtggctata tccttcgtgt cacagcgtac aaggagggat atggagaagg ttgcgtaacc 3060
attcatgaga tcgagaacaa tacagacgaa ctgaagttta gcaactgtgt agaagaggaa 3120
gtatatccaa acaacacggt aacgtgtaat gattatactg cgactcaaga agaatatgag 3180
ggtacgtaca cttctcgtaa tcgaggatat gacggagcct atgaaagcaa ttcttctgta 3240
ccagctgatt atgcatcagc ctatgaagaa aaagcatata cagatggacg aagagacaat 3300
ccttgtgaat ctaacagagg atatggggat tacacaccac taccagctgg ctatgtgaca 3360
aaagaattag agtacttccc agaaaccgat aaggtatgga ttgagatcgg agaaacggaa 3420
ggaacattca tcgtggacag cgtggaatta cttcttatgg aggaataa 3468
<210>8
<211>3468
<212>DNA
<213>人工序列
<220>
<223>基于Bacillus thuringiensis的合成序列
<400>8
atggacaaca accccaacat caacgagtgc atcccctaca actgcctgag caaccccgag 60
gtggaggtgc tgggcggcga gcgcatcgag accggctaca cccccatcga catcagcctg 120
agcctgaccc agttcctgct gagcgagttc gtgcccggcg ccggcttcgt gctgggcctg 180
gtggacatca tctggggcat cttcggcccc agccagtggg acgccttcct ggtgcagatc 240
gagcagctga tcaaccagcg catcgaggag ttcgcccgca accaggccat cagccgcctg 300
gagggcctga gcaacctgta ccagatctac gccgagagct tccgcgagtg ggaggccgac 360
cccaccaacc ccgccctgcg cgaggagatg cgcatccagt tcaacgacat gaacagcgcc 420
ctgaccaccg ccatccccct gttcgccgtg cagaactacc aggtgcccct gctgagcgtg 480
tacgtgcagg ccgccaacct gcacctgagc gtgctgcgcg acgtgagcgt gttcggccag 540
cgctggggct tcgacgccgc caccatcaac agccgctaca acgacctgac ccgcctgatc 600
ggcaactaca ccgaccacgc cgtgcgctgg tacaacaccg gcctggagcg cgtgtggggc 660
cccgacagcc gcgactggat ccgctacaac cagttccgcc gcgagctgac cctgaccgtg 720
ctggacatcg tgagcctgtt ccccaactac gacagccgca cctaccccat ccgcaccgtg 780
agccagctga cccgcgagat ctacaccaac cccgtgctgg agaacttcga cggcagcttc 840
cgcggcagcg cccagggcat cgagggcagc atccgcagcc cccacctgat ggacatcctg 900
aacagcatca ccatctacac cgacgcccac cgcggcgagt actactggag cggccaccag 960
atcatggcca gccccgtggg cttcagcggc cccgagttca ccttccccct gtacggcacc 1020
atgggcaacg ccgcccccca gcagcgcatc gtggcccagc tgggccaggg cgtgtaccgc 1080
accctgagca gcaccctgta ccgccgcccc ttcaacatcg gcatcaacaa ccagcagctg 1140
agcgtgctgg acggcaccga gttcgcctac ggcaccagca gcaacctgcc cagcgccgtg 1200
taccgcaaga gcggcaccgt ggacagcctg gacgagatcc ccccccagaa caacaacgtg 1260
cccccccgcc agggcttcag ccaccgcctg agccacgtga gcatgttccg cagcggcttc 1320
agcaacagca gcgtgagcat catccgcgcc cccatgttca gctggatcca ccgcagcgcc 1380
gagttcaaca acatcatccc cagcagccag atcacccaga tccccctgac caagagcacc 1440
aacctgggca gcggcaccag cgtggtgaag ggccccggct tcaccggcgg cgacatcctg 1500
cgccgcacca gccccggcca gatcagcacc ctgcgcgtga acatcaccgc ccccctgagc 1560
cagcgctacc gcgtgcgcat ccgctacgcc agcaccacca acctgcagtt ccacaccagc 1620
atcgacggcc gccccatcaa ccagggcaac ttcagcgcca ccatgagcag cggcagcaac 1680
ctgcagagcg gcagcttccg caccgtgggc ttcaccaccc ccttcaactt cagcaacggc 1740
agcagcgtgt tcaccctgag cgcccacgtg ttcaacagcg gcaacgaggt gtacatcgac 1800
cgcatcgagt tcgtgcccgc cgaggtgacc ttcgaggccg agtacgacct ggagcgcgcc 1860
cagaaggccg tgaacgagct gttcaccagc agcaaccaga tcggcctgaa gaccgacgtg 1920
accgactacc acatcgacca ggtgagcaac ctggtggagt gcctgagcga cgagttctgc 1980
ctggacgaga agaaggagct gagcgagaag gtgaagcacg ccaagcgcct gagcgacgag 2040
cgcaacctgc tgcaggaccc caacttccgc ggcatcaacc gccagctgga ccgcggctgg 2100
cgcggcagca ccgacatcac catccagggc ggcgacgacg tgttcaagga gaactacgtg 2160
accctgctgg gcaccttcga cgagtgctac cccacctacc tgtaccagaa gatcgacgag 2220
agcaagctga aggcctacac ccgctaccag ctgcgcggct acatcgagga cagccaggac 2280
ctggagatct acctgatccg ctacaacgcc aagcacgaga ccgtgaacgt gcccggcacc 2340
ggcagcctgt ggcccctgag cgcccccagc cccatcggca agtgcgccca ccacagccac 2400
cacttcagcc tggacatcga cgtgggctgc accgacctga acgaggacct gggcgtgtgg 2460
gtgatcttca agatcaagac ccaggacggc cacgcccgcc tgggcaacct ggagttcctg 2520
gaggagaagc ccctggtggg cgaggccctg gcccgcgtga agegcgccga gaagaagtgg 2580
cgcgacaagc gcgagaagct ggagtgggag accaacatcg tgtacaagga ggccaaggag 2640
agcgtggacg ccctgttcgt gaacagccag tacgaccgcc tgcaggccga caccaacatc 2700
gccatgatcc acgccgccga caagcgcgtg cacagcatcc gcgaggccta cctgcccgag 2760
ctgagcgtga tccccggcgt gaacgccgcc atcttcgagg agctggaggg ccgcatcttc 2820
accgccttca gcctgtacga cgcccgcaac gtgatcaaga acggcgactt caacaacggc 2880
ctgagctgct ggaacgtgaa gggccacgtg gacgtggagg agcagaacaa ccaccgcagc 2940
gtgctggtgg tgcccgagtg ggaggccgag gtgagccagg aggtgcgcgt gtgccccggc 3000
cgcggctaca tcctgcgcgt gaccgcctac aaggagggct acggcgaggg ctgcgtgacc 3060
atccacgaga tcgagaacaa caccgacgag ctgaagttca gcaactgcgt ggaggaggag 3120
gtgtacccca acaacaccgt gacctgcaac gactacaccg ccacccagga ggagtacgag 3180
ggcacctaca ccagccgcaa ccgcggctac gacggcgcct acgagagcaa cagcagcgtg 3240
cccgccgact acgccagcgc ctacgaggag aaggcctaca ccgacggccg ccgcgacaac 3300
ccctgcgaga gcaaccgcgg ctacggcgac tacacccccc tgcccgccgg ctacgtgacc 3360
aaggagctgg agtacttccc cgagaccgac aaggtgtgga tcgagatcgg cgagaccgag 3420
ggcaccttca tcgtggacag cgtggagctg ctgctgatgg aggagtag 3468
<210>9
<211>1947
<212>DNA
<213>人工序列
<220>
<223>基于Bacillus thuringiensis的合成序列
<400>9
atggacaaca accccaacat caacgagtgc atcccctaca actgcctgag caaccccgag 60
gtggaggtgc tgggcggcga gcgcatcgag accggctaca cccccatcga catcagcctg 120
agcctgaccc agttcctgct gagcgagttc gtgcccggcg ccggcttcgt gctgggcctg 180
gtggacatca tctggggcat cttcggcccc agccagtggg acgccttcct ggtgcagatc 240
gagcagctga tcaaccagcg catcgaggag ttcgcccgca accaggccat cagccgcctg 300
gagggcctga gcaacctgta ccaaatctac gccgagagct tccgcgagtg ggaggccgac 360
cccaccaacc ccgccctgcg cgaggagatg cgcatccagt tcaacgacat gaacagcgcc 420
ctgaccaccg ccatccccct gttcgccgtg cagaactacc aggtgcccct gctgagcgtg 480
tacgtgcagg ccgccaacct gcacctgagc gtgctgcgcg acgtcagcgt gttcggccag 540
cgctggggct tcgacgccgc caccatcaac agccgctaca acgacctgac ccgcctgatc 600
ggcaactaca ccgaccacgc cgtgcgctgg tacaacaccg gcctggagcg cgtgtggggt 660
cccgacagcc gcgactggat caggtacaac cagttccgcc gcgagctgac cctgaccgtg 720
ctggacatcg tgagcctgtt ccccaactac gacagccgca cctaccccat ccgcaccgtg 780
agccagctga cccgcgagat ttacaccaac cccgtgctgg agaacttcga cggcagcttc 840
cgcggcagcg cccagggcat cgagggcagc atccgcagcc cccacctgat ggacatcctg 900
aacagcatca ccatctacac cgacgcccac cgcggcgagt actactggag cggccaccag 960
atcatggcca gccccgtcgg cttcagcggc cccgagttca ccttccccct gtacggcacc 1020
atgggcaacg ctgcacctca gcagcgcatc gtggcacagc tgggccaggg agtgtaccgc 1080
accctgagca gcaccctgta ccgtcgacct ttcaacatcg gcatcaacaa ccagcagctg 1140
agcgtgctgg acggcaccga gttcgcctac ggcaccagca gcaacctgcc cagcgccgtg 1200
taccgcaaga gcggcaccgt ggacagcctg gacgagatcc cccctcagaa caacaacgtg 1260
ccacctcgac agggcttcag ccaccgtctg agccacgtga gcatgttccg cagtggcttc 1320
agcaacagca gcgtgagcat catccgtgca cctatgttca gctggattca ccgcagtgcc 1380
gagttcaaca acatcatccc cagcagccaa atcacccaga tccccctgac caagagcacc 1440
aacctgggca gcggcaccag cgtggtgaag ggccccggct tcaccggcgg cgacatcctg 1500
cgccgcacca gccccggcca gatcagcacc ctgcgcgtga acatcaccgc ccccctgagc 1560
cagcgctacc gcgtccgcat ccgctacgcc agcaccacca acctgcagtt ccacaccagc 1620
atcgacggcc gccccatcaa ccagggcaac ttcagcgcca ccatgagcag cggcagcaac 1680
ctgcagagcg gcagcttccg caccgtgggc ttcaccaccc ccttcaactt cagcaacggc 1740
agcagcgtgt tcaccctgag cgcccacgtg ttcaacagcg gcaacgaggt gtacatcgac 1800
cgcatcgagt tcgtgcccgc cgaggtgacc ttcgaggccg agtacgacct ggagagggct 1860
cagaaggccg tgaacgagct gttcaccagc agcaaccaga tcggcctgaa gaccgacgtg 1920
accgactacc acatcgatca ggtgtag 1947
<210>10
<211>3468
<212>DNA
<213>人工序列
<220>
<223>基于Bacillus thuringiensis的合成序列
<400>10
atggacaaca accccaacat caacgagtgc atcccctaca actgcctgag caaccccgag 60
gtggaggtgc tgggcggcga gcgcatcgag accggctaca cccccatcga catcagcctg 120
agcctgaccc agttcctgct gagcgagttc gtgcccggcg ccggcttcgt gctgggcctg 180
gtggacatca tctggggcat cttcggcccc agccagtggg acgccttcct ggtgcagatc 240
gagcagctga tcaaccagcg catcgaggag ttcgcccgca accaggccat cagccgcctg 300
gagggcctga gcaacctgta ccaaatctac gccgagagct tccgcgagtg ggaggccgac 360
cccaccaacc ccgccctgcg cgaggagatg cgcatccagt tcaacgacat gaacagcgcc 420
ctgaccaccg ccatccccct gttcgccgtg cagaactacc aggtgcccct gctgagcgtg 480
tacgtgcagg ccgccaacct gcacctgagc gtgctgcgcg acgtcagcgt gttcggccag 540
cgctggggct tcgacgccgc caccatcaac agccgctaca acgacctgac ccgcctgatc 600
ggcaactaca ccgaccacgc cgtgcgctgg tacaacaccg gcctggagcg cgtgtggggt 660
cccgacagcc gcgactggat caggtacaac cagttccgcc gcgagctgac cctgaccgtg 720
ctggacatcg tgagcctgtt ccccaactac gacagccgca cctaccccat ccgcaccgtg 780
agccagctga cccgcgagat ttacaccaac cccgtgctgg agaacttcga cggcagcttc 840
cgcggcagcg cccagggcat cgagggcagc atccgcagcc cccacctgat ggacatcctg 900
aacagcatca ccatctacac cgacgcccac cgcggcgagt actactggag cggccaccag 960
atcatggcca gccccgtcgg cttcagcggc cccgagttca ccttccccct gtacggcacc 1020
atgggcaacg ctgcacctca gcagcgcatc gtggcacagc tgggccaggg agtgtaccgc 1080
accctgagca gcaccctgta ccgtcgacct ttcaacatcg gcatcaacaa ccagcagctg 1140
agcgtgctgg acggcaccga gttcgcctac ggcaccagca gcaacctgcc cagcgccgtg 1200
taccgcaaga gcggcaccgt ggacagcctg gacgagatcc cccctcagaa caacaacgtg 1260
ccacctcgac agggcttcag ccaccgtctg agccacgtga gcatgttccg cagtggcttc 1320
agcaacagca gcgtgagcat catccgtgca cctatgttca gctggattca ccgcagtgcc 1380
gagttcaaca acatcatccc cagcagccag atcacccaga tccccctgac caagagcacc 1440
aacctgggca gcggcaccag cgtggtgaag ggccccggct tcaccggcgg cgacatcctg 1500
cgccgcacca gccccggcca gatcagcacc ctgcgcgtga acatcaccgc ccccctgagc 1560
cagcgctacc gcgtccgcat ccgctacgcc agcaccacca acctgcagtt ccacaccagc 1620
atcgacggcc gccccatcaa ccagggcaac ttcagcgcca ccatgagcag cggcagcaac 1680
ctgcagagcg gcagcttccg caccgtgggc ttcaccaccc ccttcaactt cagcaacggc 1740
agcagcgtgt tcaccctgag cgcccacgtg ttcaacagcg gcaacgaggt gtacatcgac 1800
cgcatcgagt tcgtgcccgc cgaggtgacc ttcgaggccg agtacgacct ggagagggct 1860
cagaaggccg tgaacgagct gttcaccagc agcaaccaga tcggcctgaa gaccgacgtg 1920
accgactacc acatcgatca ggtgagcaac ctggtggagt gcctgagcga cgagttctgc 1980
ctggacgaga agaaggagct gagcgagaag gtgaagcacg ccaagcgcct gagcgacgag 2040
cgcaacctgc tgcaggaccc caacttccgc ggcatcaacc gccagctgga ccgcggctgg 2100
cgcggcagca ccgacatcac catccagggc ggcgacgacg tgttcaagga gaactacgtg 2160
accctgctgg gcaccttcga cgagtgctac cccacctacc tgtaccagaa gatcgacgag 2220
agcaagctga aggcctacac ccgctaccag ctgcgcggct acatcgagga cagccaggac 2280
ctggagatct acctgatccg ctacaacgcc aagcacgaga ccgtgaacgt gcccggcacc 2340
ggcagcctgt ggcccctgag cgcccccagc cccatcggca agtgcgccca ccacagccac 2400
cacttcagcc tggacatcga cgtgggctgc accgacctga acgaggacct gggcgtgtgg 2460
gtgatcttca agatcaagac ccaggacggc cacgcccgcc tgggcaacct ggagttcctg 2520
gaggagaagc ccctggtggg cgaggccctg gcccgcgtga agcgcgccga gaagaagtgg 2580
cgcgacaagc gcgagaagct ggagtgggag accaacatcg tgtacaagga ggccaaggag 2640
agcgtggacg ccctgttcgt gaacagccag tacgaccgcc tgcaggccga caccaacatc 2700
gccatgatcc acgccgccga caagcgcgtg cacagcattc gcgaggccta cctgcccgag 2760
ctgagcgtga tccccggcgt gaacgccgcc atcttcgagg agctggaggg ccgcatcttc 2820
accgccttca gcctgtacga cgcccgcaac gtgatcaaga acggcgactt caacaacggc 2880
ctgagctgct ggaacgtgaa gggccacgtg gacgtggagg agcagaacaa ccaccgcagc 2940
gtgctggtgg tgcccgagtg ggaggccgag gtgagccagg aggtgcgcgt gtgccccggc 3000
cgcggctaca tcctgcgcgt gaccgcctac aaggagggct acggcgaggg ctgcgtgacc 3060
atccacgaga tcgagaacaa caccgacgag ctcaagttca gcaactgcgt ggaggaggag 3120
gtgtacccca acaacaccgt gacctgcaac gactacaccg ccacccagga ggagtacgag 3180
ggcacctaca ccagccgcaa ccgcggctac gacggcgcct acgagagcaa cagcagcgtg 3240
cccgccgact acgccagcgc ctacgaggag aaggcctaca ccgacggccg ccgcgacaac 3300
ccctgcgaga gcaaccgcgg ctacggcgac tacacccccc tgcccgccgg ctacgtgacc 3360
aaggagctgg agtacttccc cgagaccgac aaggtgtgga tcgagatcgg cgagaccgag 3420
ggcaccttca tcgtggacag cgtggagctg ctgctgatgg aggagtag 3468
<210>11
<211>1845
<212>DNA
<213>人工序列
<220>
<223>基于Bacillus thuringiensis的合成序列
<400>11
atggacaaca acccaaacat caacgaatgc attccataca actgcttgag taacccagaa 60
gttgaagtac ttggtggaga acgcattgaa accggttaca ctcccatcga catctccttg 120
tccttgacac agtttctgct cagcgagttc gtgccaggtg ctgggttcgt tctcggacta 180
gttgacatca tctggggtat ctttggtcca tctcaatggg atgcattcct ggtgcaaatt 240
gagcagttga tcaaccagag gatcgaagag ttcgccagga accaggccat ctctaggttg 300
gaaggattga gcaatctcta ccaaatctat gcagagagct tcagagagtg ggaagccgat 360
cctactaacc cagctctccg cgaggaaatg cgtattcaat tcaacgacat gaacagcgcc 420
ttgaccacag ctatcccatt gttcgcagtc cagaactacc aagttcctct cttgtccgtg 480
tacgttcaag cagctaatct tcacctcagc gtgcttcgag acgttagcgt gtttgggcaa 540
aggtggggat tcgatgctgc aaccatcaat agccgttaca acgaccttac taggctgatt 600
ggaaactaca ccgaccacgc tgttcgttgg tacaacactg gcttggagcg tgtctggggt 660
cctgattcta gagattggat tagatacaac cagttcagga gagaattgac cctcacagtt 720
ttggacattg tgtctctctt cccgaactat gactccagaa cctaccctat ccgtacagtg 780
tcccaactta ccagagaaat ctatactaac ccagttcttg agaacttcga cggtagcttc 840
cgtggttctg cccaaggtat cgaaggctcc atcaggagcc cacacttgat ggacatcttg 900
aacagcataa ctatctacag cgatgctcac agaggagagt attactggtc tggacaccag 960
atcatggcct ctccagttgg attcagcggg cccgagttta cctttcctct ctatggaact 1020
atgggaaacg ccgctccaca acaacgtatc gttgctcaac taggtcaggg tgtctacaga 1080
accttgtctt ccaccttgta cagaagaccc ttcaatatcg gtatcaacaa ccagcaactt 1140
tccgttcttg acggaacaga gttcgcctat ggaacctctt ctaacttgcc atccgctgtt 1200
tacagaaaga gcggaaccgt tgattccttg gacgaaatcc caccacagaa caacaatgtg 1260
ccacccaggc aaggattctc ccacaggttg agccacgtgt ccatgttccg ttccggattc 1320
agcaacagtt ccgtgagcat catcagagct cctatgttct catggattca tcgtagtgct 1380
gagttcaaca atatcattcc ttcctctcaa atcacccaaa tcccattgac caagtctact 1440
aaccttggat ctggaacttc tgtcgtgaaa ggaccaggct tcacaggagg tgatattctt 1500
agaagaactt ctcctggcca gattagcacc ctcagagtta acatcactgc accactttct 1560
caaagatatc gtgtcaggat tcgttacgca tctaccacta acttgcaatt ccacacctcc 1620
atcgacggaa ggcctatcaa tcagggtaac ttctccgcaa ccatgtcaag cggcagcaac 1680
ttgcaatccg gcagcttcag aaccgtcggt ttcactactc ctttcaactt ctctaacgga 1740
tcaagcgttt tcacccttag cgctcatgtg ttcaattctg gcaatgaagt gtacattgac 1800
cgtattgagt ttgtgcctgc cgaagttacc ttcgaggctg agtac 1845
<210>12
<211>1833
<212>DNA
<213>人工序列
<220>
<223>基于Bacillus thuringiensis的合成序列
<400>12
atggctgcag acaacaacac ggaggccctc gatagctcta ccaccaaaga tgtcattcag 60
aagggcatct ccgttgtggg tgatctcctt ggcgttgttg gtttcccctt tggtggtgcc 120
cttgtttcgt tctacactaa ctttctgaat actatttggc ccagcgaaga cccttggaag 180
gcttttatgg agcaagtgga agctttgatg gatcagaaga tcgctgatta tgcaaagaac 240
aaagctcttg ctgagctcca gggccttcag aacaacgtcg aagattatgt gagtgcactg 300
agttcatggc aaaagaatcc tgtgtcctca cgaaatccac atagccaggg gcgcataagg 360
gagctgttct ctcaagcaga aagtcacttc cggaattcaa tgccttcctt tgccatctct 420
gggtacgagg ttctctttct tacaacctac gctcaagctg ccaacacaca tctgttctta 480
ctaaaagacg ctcaaatcta tggtgaagaa tggggatacg agaaagaaga tatcgctgag 540
ttctacaagc gtcaactaaa acttactcaa gagtatactg accactgtgt caaatggtat 600
aatgttggat tggataagtt gagaggttca tcttatgaat cttgggtaaa ctttaaccgg 660
taccgcagag agatgacatt gacagtgctc gacttgattg cactatttcc attgtatgat 720
gttcgactct acccaaagga ggttaaaacc gaattgacta gagacgtttt aaccgatccc 780
attgtcggag tcaacaacct cagaggctac ggaacaacct tctctaacat agaaaactac 840
attcgtaaac cacatctatt cgactatctg cacagaattc agtttcacac gcggttccaa 900
ccaggatact atggaaatga ctctttcaac tattggtccg gtaattatgt ttcaactaga 960
cccagcatag gatctaatga catcatcacc tctccattct acggaaacaa gtcctccgag 1020
cctgtgcaaa acttggagtt taatggagag aaagtctata gagccgtggc caataccaat 1080
cttgccgtct ggccgtccgc tgtgtactca ggtgttacca aagtggaatt cagccaatac 1140
aatgatcaga cagatgaagc aagtactcaa acttacgact caaagaggaa tgttggcgcg 1200
gtcagctggg attctatcga tcaactccct ccagaaacca ccgatgaacc tctagagaag 1260
ggttatagcc atcaactcaa ttacgtaatg tgctttctca tgcagggtag tagaggtacc 1320
atcccagtgt taacttggac tcacaagagt gtagacttct tcaacatgat tgattcgaaa 1380
aagattactc aacttccgtt ggtaaaggcc tacaagttac aatctggtgc ttccgttgtc 1440
gcaggtccta ggtttacagg aggagatatc attcaatgca ctgagaatgg gtccgcggca 1500
actatctacg ttacacctga tgtgtcgtac tctcaaaagt atcgtgctag aattcattat 1560
gcttctacct ctcagataac attcacacta agcttggacg gggctccatt caaccaatac 1620
tacttcgata agaccatcaa caaaggagac acactcacgt ataattcatt caacttagcc 1680
agcttcagca ctccattcga attgtcaggg aacaacttgc agataggcgt cacaggattg 1740
agtgctggtg acaaggttta catcgacaag attgagttca ttccagtgaa ccttaggtcc 1800
ccaggaaccg agcttgagtt catcgacatc tag 1833
<210>13
<211>216
<212>DNA
<213>人工序列
<220>
<223>基于Bacillus thuringiensis的合成序列
<400>13
atgaagaaga acggctacgc cgtggacagc agcggcaagg ccccagagtg cctcctcagc 60
aactactgca acaaccagtg caccaaggtg cactacgccg acaagggcta ctgctgcctc 120
ctcagctgct actgcttcgg cctcaacgac gacaagaagg tgcttgagat cagcgacacc 180
aggaagagct actgcgacac caccatcatc aactaa 216
<210>14
<211>192
<212>DNA
<213>人工序列
<220>
<223>基于Bacillus thuringiensis的合成序列
<400>14
atggccgacg gctacgtgaa gggcaaaagc ggctgcaaaa tcagctgctt cctggacaac 60
gacctgtgca acgccgactg caaatactac ggcggcaaac tgaacagctg gtgcatccca 120
gacaaaagcg gctactgctg gtgcccaaac aaaggctgga acagcatcaa aagcgagacc 180
aacacctgct aa 192
<210>15
<211>1905
<212>DNA
<213>人工序列
<220>
<223>基于Bacillus thuringiensis的合成序列
<400>15
atgggacaca acgtccttaa taacgaacgt aacacagtct gtgaagcaca caacgtggcc 60
gttcgcgacc ctttctcatt cgagcacaaa tcactaaaca ctgttgagaa ggagtggact 120
gagtggaaga gaaacgacca ttcgctatat gttgacccga tcgttggaac cgtggcttca 180
ttcttgctca agaaggtggg ttctctcgtt ggtaagagga ttctctcgga actaaggagc 240
ttgatcttcc cctccggtag cacaaatctc atgcaggata tactccgtga gaccgagaag 300
ttcctgaacc agcgactgaa cacggacacc ttggcacgag ttaatgctga attgacaggt 360
ctacaggcaa atgtcgagga gttcaatcgc caagttgaca acttcctaaa tcccaatcgt 420
aacgccttgc ctttgtctat tacgtcgtcc gtcaacacga tgcagcagct attcttgaac 480
cggttaccac aattccagat ccaaggctac caattgttgt tactcccgtt attcgcccaa 540
gctgctaatc ttcacctgag cttcatcagg gatgtcatcc taaatgcaga cgagtggggc 600
atatcggcag ctacactacg tacttatcga aaccatctga ggaactacac gcgtgactac 660
tcaaactact gtatcaacac ctatcagact gccttccgtg gcctgaatac aaggctccac 720
gatatgttgg agtttcggac atacatgttc ctgaacgtgt tcgagtatgt ctccatctgg 780
tcgcttttca agtaccagtc attgctggtc tcgtcaggtg ctaacctata cgcaagtgga 840
agtggacctc agcaaaccca atcgttcacg agtcaagact ggccattcct gtatagcttg 900
ttccaggtca actccaacta cgtgctgaac ggcttctcag gtgctcgatt gtcccagact 960
ttcccaaaca tcgttggact tccaggaaca actacgactc atgccttgct ggctgcacga 1020
gtcaactact ctggtggagt ttcaagtggc gatattggag cttcgccgtt caaccagaac 1080
ttcagttgca gcacattcct gcctcctttg cttacgccat tcgttagatc ctggctcgac 1140
agtggaagtg atcgaggggg agttaatact gtgaccaact ggcagacaga gagtttcgag 1200
acaacactcg gtctacgatc aggagcattc acagcaagag gaaacagcaa ctacttccca 1260
gactacttca tccgaaacat ctctggagta cctctagtcg ttaggaacga agaccttcgt 1320
cgtcctctgc actacaatca gatcaggaac attgagtcac cttcaggtac acctggtgga 1380
gcacgagcat acatggtctc agttcacaac cgtaagaaca acatctacgc agttcatgag 1440
aacggaacga tgatccactt ggctccagag gactacaccg gatttacaat cagtcctatc 1500
cacgccactc aggtgaacaa ccagactcga acgttcatca gtgagaagtt tggaaaccaa 1560
ggcgattctc tgaggtttga gcagagtaat accacggcaa ggtacactct caggggtaat 1620
ggaaactctt acaacctata cttgcgtgtc tccagcatag gcaattcaac tatcagggtt 1680
accatcaacg gtcgagtgta cacagctaca aacgtcaata ccaccactaa caacgatggt 1740
gtaaacgaca atggtgctcg cttcagcgac atcaacatcg gaaacgtagt cgcgagcgac 1800
aacagcaacg tacctctgga cattaacgtt acgttgaact caggcacaca gttcgatttg 1860
atgaacatca tgtttgttcc gacaaaccta ccaccattgt attag 1905
<210>16
<211>1179
<212>DNA
<213>Rhyzopus oryzae
<400>16
atggtttcat tcatttccat ttctcaaggt gttagtcttt gtcttcttgt ctcttccatg 60
atgctcggtt catctgctgt tcctgtttct ggtaaatctg gatcttccac taccgccgtc 120
tctgcatctg acaattctgc cctccctcct ctcatttcca gccgttgtgc tcctccttct 180
aacaagggaa gtaaaagcga tcttcaagct gaaccttact acatgcaaaa gaatacagaa 240
tggtatgagt cccatggtgg caacctgaca tccatcggaa agcgagatga caatttggtt 300
ggtggcatga ctttggattt acctagcgat gctcctccta tcagcctctc tggatctacc 360
aacagcgcct ctgatggtgg taaggttgtt gctgctacta ctgctcaaat tcaagagttc 420
accaagtatg ctggtatcgc tgccactgcc tactgtcgtt ctgttgtccc tggtaacaag 480
tgggactgtg tccaatgtca aaagtgggtt cctgatggca agatcatcac tacctttacc 540
tccttgcttt ccgacacaaa tggttacgtc ttgagaagtg ataaacaaaa gaccatttat 600
cttgttttcc gtggtaccaa ctccttcaga agtgccatca ctgatattgt cttcaacttt 660
tccgactaca agcctgtcaa gggcgccaag gttcatgctg gtttcctttc ctcttatgag 720
caagttgtca atgactattt ccctgtcgtc caagaacaac tgaccgccaa ccctacttac 780
aaggtcatcg tcaccggtca ctcactcggt ggtgcacaag ctttgcttgc cggtatggat 840
ctctaccaac gtgaaccaag actgtctccc aagaatttga gcatcttcac tgttggtggt 900
cctcgtgttg gtaaccccac ctttgcttac tatgttgaat ctaccggtat tcctttccaa 960
cgtaccgttc acaagagaga tatcgttcct cacgttcctc ctcaatcctt cggattcctt 1020
catcccggtg ttgaatcttg gattaagtct ggtacctcca acgttcaaat ctgtacttct 1080
gaaattgaaa ccaaggattg cagtaactct atcgttcctt tcacctctct ccttgatcac 1140
ttgagttact ttgatatcaa cgaaggaagc tgtttgtaa 1179
Claims (62)
1. 一种设计核酸分子的方法,所述核酸分子对多肽进行编码以在植物中表达所述多肽,所述方法包括将核酸分子的至少一个密码子更改为更改的密码子,其中所述更改的密码子选自在一种或多种植物病毒中的使用频率大于所述核酸分子的所述密码子的使用频率的密码子。
2. 如权利要求1所述的方法,其中所述更改的密码子在一种或多种植物病毒中的使用频率大于0.09。
3. 如权利要求1所述的方法,其中所述更改的密码子在一种或多种植物病毒中使用频率等于或大于在所述一种或多种植物病毒中所述更改的密码子编码的氨基酸的密码子使用频率中值,其中所述密码子使用频率中值是在一种或多种植物病毒中对所述氨基酸进行编码的所有密码子的密码子使用频率的中值。
4. 如权利要求1所述的方法,其中在所述含有至少一个更改密码子的核酸分子中,至少30%的密码子是更改的密码子。
5. 权利要求1所述的方法,其中在含有至少一种更改密码子的核酸分子的第一部分中存在的更改密码子的数目等于或大于在所述核酸分子的第二部分中的数目,其中所述第一部分位于所述第二部分的5’。
6. 如权利要求5所述的方法,其中所述第一部分构成所述核酸分子的三分之一,所述第二部分构成所述核酸分子的三分之二。
7. 如权利要求5所述的方法,其中所述第一部分构成所述核酸分子的四分之一,所述第二部分构成所述核酸分子的四分之三。
8. 如权利要求5所述的方法,其中所述核酸分子的所述第一部分和第二部分在长度上相同,所述第一部分具有更多数目的所述更改密码子。
9. 如权利要求1所述的方法,其中与没有表达所述多肽的植物相比,由含有至少一个更改密码子的核酸分子编码的所述多肽在植物中的表达导致所述植物表型的变化。
10. 如权利要求1所述的方法,其中与表达不含有至少一个更改密码子的核酸分子的植物相比,含有至少一个更改密码子的核酸分子的表达导致所述植物表型的变化,其中所述核酸分子编码相同的多肽。
11. 如权利要求9或10所述的方法,其中所述表型选自由抗昆虫性、耐昆虫性、抗疾病性、耐疾病性、抗线虫性、耐线虫性、耐旱性、耐盐性、耐重金属性、重金属解毒性、低肌醇六磷酸含量、高效氮利用、产率提高、提高的产量稳定性、改善的营养含量、提高的糖含量、改善的生长和活力、改善的消化性、治疗性多肽的表达、非多肽药物的合成、对选择剂的抗性、荧光、发光、重组酶活性和雄性不育组成的组。
12. 如权利要求9或10所述的方法,其中所述表型是所述多肽在所述植物中提高的表达。
13. 如权利要求1所述的方法,其中所述植物是单子叶植物。
14. 如权利要求13所述的方法,其中所述单子叶植物选自由大麦、玉米、粟、燕麦、水稻和小麦组成的组。
15. 如权利要求14所述的方法,其中所述单子叶植物是玉米。
16. 如权利要求1所述的方法,其中所述植物是双子叶植物。
17. 如权利要求16所述的方法,其中所述双子叶植物选自由马铃薯、大豆、烟草和西红柿组成的组。
18. 如权利要求17所述的方法,其中所述双子叶植物是大豆。
19. 如权利要求1或13所述的方法,其中所述一种或多种植物病毒是单子叶植物病毒。
20. 如权利要求19所述的方法,其中所述至少一个密码子编码
a)丙氨酸而所述更改的密码子选自由GCA和GCT组成的组;
b)精氨酸而所述更改的密码子选自由AGA、AGG和CGT组成的组;
c)天冬酰胺而所述更改的密码子是AAT;
d)天冬氨酸而所述更改的密码子是GAT;
e)半胱氨酸而所述更改的密码子是TGT;
f)谷氨酰胺而所述更改的密码子是CAA;
g)谷氨酸而所述更改的密码子是GAA;
h)甘氨酸而所述更改的密码子选自由GGA和GGT组成的组;
i)组氨酸而所述更改的密码子是CAT;
j)异亮氨酸而所述更改的密码子选自由ATA和ATT组成的组;
k)亮氨酸而所述更改的密码子选自由CTT、TTA和TTG组成的组;
l)赖氨酸而所述更改的密码子是AAA;
m)苯丙氨酸而所述更改的密码子是TTT;
n)脯氨酸而所述更改的密码子选自由CCA和CCT组成的组;
o)丝氨酸而所述更改的密码子选自由AGT、TCA和TCT组成的组;
p)苏氨酸而所述更改的密码子选自由AGA和ACT组成的组;
q)酪氨酸而所述更改的密码子是TAT;或者
r)缬氨酸而所述更改的密码子选自由GTG和GTT组成的组。
21. 如权利要求19所述的方法,其中所述一种或多种单子叶植物病毒是玉米特异性病毒。
22. 如权利要求21所述的方法,其中所述至少一个密码子编码
a)丙氨酸而所述更改的密码子选自由GCA和GCC组成的组;
b)精氨酸而所述更改的密码子选自由AGA、AGG和CGC组成的组;
c)天冬酰胺而所述更改的密码子是AAT;
d)天冬氨酸而所述更改的密码子是GAT;
e)半胱氨酸而所述更改的密码子是TGT;
f)谷氨酰胺而所述更改的密码子选自由CAA和CAG组成的组;
g)谷氨酸而所述更改的密码子是GAA;
h)甘氨酸而所述更改的密码子选自由GGA和GGT组成的组;
i)组氨酸而所述更改的密码子是CAT;
j)异亮氨酸而所述更改的密码子选自由ATC和ATT组成的组;
k)亮氨酸而所述更改的密码子选自由CTT、CTC和TTG组成的组;
l)赖氨酸而所述更改的密码子是AAG;
m)苯丙氨酸而所述更改的密码子是TTC;
n)脯氨酸而所述更改的密码子选自由CCA和CCT组成的组;
o)丝氨酸而所述更改的密码子选自由TCC、TCA和TCT组成的组;
p)苏氨酸而所述更改的密码子选自由AGA和ACT组成的组;
q)酪氨酸而所述更改的密码子是TAT;或者
r)缬氨酸而所述更改的密码子选自由GTG和GTT组成的组。
23. 如权利要求21所述的方法,其中所述在一种或多种植物病毒中的使用频率是基于编码玉米病毒外壳多肽和衣壳多肽的核酸分子。
24. 如权利要求23所述的方法,其中所述至少一个密码子编码
a)丙氨酸而所述更改的密码子选自由GCA和GCT组成的组;
b)精氨酸而所述更改的密码子选自由AGA、AGG和CGA组成的组;
c)天冬酰胺而所述更改的密码子是AAC;
d)天冬氨酸而所述更改的密码子是GAT;
e)半胱氨酸而所述更改的密码子是TGC;
f)谷氨酰胺而所述更改的密码子是CAA;
g)谷氨酸而所述更改的密码子是GAG;
h)甘氨酸而所述更改的密码子选自由GGA和GGG组成的组;
i)组氨酸而所述更改的密码子是CAT;
j)异亮氨酸而所述更改的密码子选自由ATC和ATT组成的组;
k)亮氨酸而所述更改的密码子选自由CTG、CTC和TTG组成的组;
l)赖氨酸而所述更改的密码子是AAG;
m)苯丙氨酸而所述更改的密码子是TTC;
n)脯氨酸而所述更改的密码子选自由CCA和CCT组成的组;
o)丝氨酸而所述更改的密码子选自由TCC、TCA和AGC组成的组;
p)苏氨酸而所述更改的密码子选自由ACA和ACT组成的组;
q)酪氨酸而所述更改的密码子是TAT;或者
r)缬氨酸而所述更改的密码子选自由GTC、GTG和GTT组成的组。
25. 如权利要求1或16所述的方法,其中所述一种或多种植物病毒是双子叶植物病毒。
26. 如权利要求25所述的方法,其中所述一种或多种双子叶病毒是大豆特异性病毒。
27. 如权利要求25所述的方法,其中所述在一种或多种植物病毒中的使用频率是基于编码双子叶植物病毒外壳多肽和衣壳多肽的核酸分子。
28. 如权利要求27所述的方法,其中所述至少一个密码子编码
a)丙氨酸而所述更改的密码子选自由GCC和GCT组成的组;
b)精氨酸而所述更改的密码子选自由AGA、AGG和CGT组成的组;
c)天冬酰胺而所述更改的密码子是AAT;
d)天冬氨酸而所述更改的密码子是GAT;
e)半胱氨酸而所述更改的密码子是TGT;
f)谷氨酰胺而所述更改的密码子是CAA;
g)谷氨酸而所述更改的密码子是GAA;
h)甘氨酸而所述更改的密码子选自由GGA和GGT组成的组;
i)组氨酸而所述更改的密码子是CAT;
j)异亮氨酸而所述更改的密码子选自由ATA和ATT组成的组;
k)亮氨酸而所述更改的密码子选自由CTT、TTA和TTG组成的组;
l)赖氨酸而所述更改的密码子是AAG;
m)苯丙氨酸而所述更改的密码子是TTT;
n)脯氨酸而所述更改的密码子选自由CCA、CCC和CCT组成的组;
o)丝氨酸而所述更改的密码子选自由AGT、TCA和TCT组成的组;
p)苏氨酸而所述更改的密码子选自由ACA、ACC和ACT组成的组;
q)酪氨酸而所述更改的密码子是TAT;或者
r)缬氨酸而所述更改的密码子选自由GTG和GTT组成的组。
29. 如权利要求1所述的方法,其中含有至少一个更改密码子的核酸分子所具有的至少一种类型的氨基酸的所有氨基酸残基的密码子使用频率与在一种或多种病毒中的使用频率相同或者基本相似。
30. 如权利要求29所述的方法,其中所述一种或多种病毒是单子叶植物病毒。
31. 如权利要求30所述的方法,其中所述氨基酸类型是
a)丙氨酸而所述密码子使用频率是GCA(0.31)、GCC(0.21)、GCG(0.14)和GCT(0.34);
b)精氨酸而所述密码子使用频率是AGA(0.32)、AGG(0.17)、CGA(0.14)、CGC(0.14)、CGG(0.09)和CGT(0.16);
c)天冬酰胺而所述密码子使用频率是AAC(0.42)和AAT(0.58);
d)天冬氨酸而所述密码子使用频率是GAC(0.38)和GAT(0.62);
e)半胱氨酸而所述密码子使用频率是TGC(0.44)和TGT(0.56);
f)谷氨酰胺而所述密码子使用频率是CAA(0.58)和CAG(0.42);
g)谷氨酸而所述密码子使用频率是GAA(0.60)和GAG(0.40);
h)甘氨酸而所述密码子使用频率是GGA(0.37)、GGC(0.20)、GGG(0.14)和GGT(0.28);
i)组氨酸而所述密码子使用频率是CAC(0.43)和CAT(0.57);
j)异亮氨酸而所述密码子使用频率是ATA(0.30)、ATC(0.29)和ATT(0.41);
k)亮氨酸而所述密码子使用频率是CTA(0.13)、CTC(0.14)、CTG(0.13)、CTT(0.18)、TTA(0.21)和TTG(0.21);
l)赖氨酸而所述密码子使用频率是AAA(0.53)和AAG(0.47);
m)苯丙氨酸而所述密码子使用频率是TTC(0.46)和TTT(0.54);
n)脯氨酸而所述密码子使用频率是CCA(0.38)、CCC(0.17)、CCG(0.14)和CCT(0.31);
o)丝氨酸而所述密码子使用频率是AGC (0.13)、AGT(0.18)、TCA、(0.24)、TCC(0.14)、TCG(0.10)和TCT(0.21);
p)苏氨酸而所述密码子使用频率是AC A(0.30)、ACC(0.20)、ACG (0.16)和ACT(0.34);
q)酪氨酸而所述密码子使用频率是TAC(0.43)和TAT(0.57);或者
r)缬氨酸而所述密码子使用频率是GTA(0.19)、GTC(0.21)、GTG(0.25)和GTT(0.36)。
32. 如权利要求30所述的方法,其中所述单子叶植物病毒是玉米特异性病毒。
33. 如权利要求32所述的方法,其中所述氨基酸的类型是
a)丙氨酸而所述密码子使用频率是GCA(0.31)、GCC(0.30)、GCG(0.11)和GCT(0.28);
b)精氨酸而所述密码子使用频率是AGA(0.27)、AGG(0.17)、CGA(0.12)、CGC(0.19)、CGG(0.12)和CGT(0.13);
c)天冬酰胺而所述密码子使用频率是AAC(0.44)和AAT(0.56);
d)天冬氨酸而所述密码子使用频率是GAC(0.41)和GAT(0.59);
e)半胱氨酸而所述密码子使用频率是TGC(0.42)和TGT(0.58);
f)谷氨酰胺而所述密码子使用频率是CAA(0.50)和CAG(0.50);
g)谷氨酸而所述密码子使用频率是GAA(0.52)和GAG(0.48);
h)甘氨酸而所述密码子使用频率是GGA(0.36)、GGC(0.23)、GGG(0.17)和GGT(0.24);
i)组氨酸而所述密码子使用频率是CAC(0.45)、CAT(0.55);
j)异亮氨酸而所述密码子使用频率是ATA(0.27)、ATC(0.30)和ATT(0.43);
k)亮氨酸而所述密码子使用频率是CTA(0.12)、CTC(0.22)、CTG(0.16)、CTT(0.19)、TTA(0.14)和TTG(0.18);
l)赖氨酸而所述密码子使用频率是AAA(0.49)和AAG(0.51);
m)苯丙氨酸而所述密码子使用频率是TTC(0.56)和TTT(0.44);
n)脯氨酸而所述密码子使用频率是CCA(0.31)、CCC(0.20)、CCG(0.17)和CCT(0.32);
o)丝氨酸而所述密码子使用频率是AGC(0.12)、AGT(0.12)、TCA(0.22)、TCC(0.21)、TCG(0.10)和TCT(0.22);
p)苏氨酸而所述密码子使用频率是ACA(0.32)、ACC(0.26)、(0.13)和ACT(0.29);
q)酪氨酸而所述密码子使用频率是TAC(0.46)和TAT(0.54);或者
r)缬氨酸而所述密码子使用频率是GTA(0.16)、GTC(0.25),GTG(0.26)和GTT(0.33)。
34. 如权利要求32所述的方法,其中所述在一种或多种植物病毒中的使用频率是基于编码玉米病毒外壳多肽和衣壳多肽的核酸分子。
35. 如权利要求32所述的方法,其中所述氨基酸类型是
a)丙氨酸而所述密码子使用频率是GCA(0.38)、GCC(0.22)、GCG(0.14)和GCT(0.26);
b)精氨酸而所述密码子使用频率是AGA(0.30)、AGG(0.18)、CGA(0.18)、CGC(0.16)、CGG(0.11)和CGT(0.07);
c)天冬酰胺而所述密码子使用频率是AAC(0.53)和AAT(0.47);
d)天冬氨酸而所述密码子使用频率是GAC(0.45)和GAT(0.55);
e)半胱氨酸而所述密码子使用频率是TGC(0.53)和TGT(0.47);
f)谷氨酰胺而所述密码子使用频率是CAA(0.52)和CAG(0.48);
f)谷氨酰胺而所述密码子使用频率是GAA(0.44)和GAG(0.56);
h)甘氨酸而所述密码子使用频率是GGA(0.42)、GGC(0.18)、GGG(0.23)和GGT(0.18);
i)组氨酸而所述密码子使用频率是CAC(0.35)和CAT(0.65);
j)异亮氨酸而所述密码子使用频率是ATA(0.24)、ATC(0.36)和ATT(0.40);
k)亮氨酸而所述密码子使用频率是CTA(0.12)、CTC(0.18)、CTG(0.25)、CTT(0.12)、TTA(0.10)和TTG(0.23);
l)赖氨酸而所述密码子使用频率是AAA(0.48)和AAG(0.52);
m)苯丙氨酸而所述密码子使用频率是TTC(0.57)和TTT(0.43);
n)脯氨酸而所述密码子使用频率是CCA(0.32)、CCC(0.24)、CCG(0.12)和CCT(0.32);
o)丝氨酸而所述密码子使用频率是AGC(0.19)、AGT(0.13)、TCA(0.21)、TCC(0.26)、TCG(0.06)和TCT(0.15);
p)苏氨酸而所述密码子使用频率是ACA(0.36)、ACC(0.27)、ACG(0.06)和ACT(0.31);
q)酪氨酸而所述密码子使用频率是TAC(0.41)和TAT(0.59);或者
r)缬氨酸而所述密码子使用频率是GTA(0.15)、GTC(0.26),GTG(0.36)和GTT(0.23)。
36. 如权利要求29所述的方法,其中所述一种或多种植物病毒是双子叶植物病毒。
37. 如权利要求36所述的方法,其中所述氨基酸类型是
a)丙氨酸而所述密码子使用频率是GCA(0.33)、GCC(0.21)、GCG(0.13)和GCT(0.33);
b)精氨酸而所述密码子使用频率是AGA(0.34)、AGG(0.23)、CGA(0.11)、CGC(0.09)、CGG(0.08)和CGT(0.15);
c)天冬酰胺而所述密码子使用频率是AAC(0.41)和AAT(0.59);
d)天冬氨酸而所述密码子使用频率是GAC(0.37)和GAT(0.63);
e)半胱氨酸而所述密码子使用频率是TGC(0.41)和TGT(0.59);
f)谷氨酰胺而所述密码子使用频率是CAA(0.60)和CAG(0.40);
g)谷氨酸而所述密码子使用频率是GAA(0.61)和GAG(0.39);
h)甘氨酸而所述密码子使用频率是GGA(0.35)、GGC(0.18)、GGG(0.18)和GGT(0.29);
i)组氨酸而所述密码子使用频率是CAC(0.43)和CAT(0.57);
j)异亮氨酸而所述密码子使用频率是ATA(0.31)、ATC(0.28)和ATT(0.41);
k)亮氨酸而所述密码子使用频率是CTA(0.12)、CTC(0.14)、CTG(0.12)、CTT(0.19)、TTA(0.22)和TTG(0.21);
l)赖氨酸而所述密码子使用频率是AAA(0.54)和AAG(0.46);
m)苯丙氨酸而所述密码子使用频率是TTC(0.44)和TTT(0.56);
n)脯氨酸而所述密码子使用频率是CCA(0.38)、CCC(0.18)、CCG(0.12)和CCT(0.31);
o)丝氨酸而所述密码子使用频率是AGC(0.14)、AGT(0.20)、TCA(0.23)、TCC(0.14)、TCG(0.08)和TCT(0.21);
p)苏氨酸而所述密码子使用频率是ACA(0.36)、ACC(0.20)、ACG(0.14)和ACT(0.31);
q)酪氨酸而所述密码子使用频率是TAC(0.41)和TAT(0.59);或者
r)缬氨酸而所述密码子使用频率是GTA(0.19)、GTC(0.21),GTG(0.25)和GTT(0.35).
38. 如权利要求36所述的方法,其中所述在一种或多种植物病毒中的使用频率是基于编码双子叶植物病毒外壳多肽和衣壳多肽的核酸分子。
39. 如权利要求38所述的方法,其中所述氨基酸类型是
a)丙氨酸而所述密码子使用频率是GCA(0.24)、GCC(0.27)、GCG(0.15)和GCT(0.34);
b)精氨酸而所述密码子使用频率是AGA(0.24)、AGG(0.22)、CGA(0.12)、CGC(0.10)、CGG(0.11)和CGT(0.21);
c)天冬酰胺而所述密码子使用频率是AAC(0.44)和AAT(0.56);
d)天冬氨酸而所述密码子使用频率是GAC(0.32)和GAT(0.68);
e)半胱氨酸而所述密码子使用频率是TGC(0.25)和TGT(0.75);
f)谷氨酰胺而所述密码子使用频率是CAA(0.59)和CAG(0.41);
g)谷氨酸而所述密码子使用频率是GAA(0.61)和GAG(0.39);
h)甘氨酸而所述密码子使用频率是GGA(0.32)、GGC(0.20)、GGG(0.18)和GGT(0.30);
i)组氨酸而所述密码子使用频率是CAC(0.35)和CAT(0.65);
j)异亮氨酸而所述密码子使用频率是ATA(0.39)、ATC(0.26)和ATT(0.35);
k)亮氨酸而所述密码子使用频率是CTA(0.10)、CTC(0.13)、CTG(0.12)、CTT(0.14)、TTA(0.28)和TTG(0.23);
l)赖氨酸而所述密码子使用频率是AAA(0.45)和AAG(0.55);
m)苯丙氨酸而所述密码子使用频率是TTC(0.47)和TTT(0.53);
n)脯氨酸而所述密码子使用频率是CCA(0.27)、CCC(0.27)、CCG(0.14)和CCT(0.33);
o)丝氨酸而所述密码子使用频率是AGC(0.15)、AGT(0.19)、TCA(0.18)、TCC(0.14)、TCG(0.11)和TCT(0.24);
p)苏氨酸而所述密码子使用频率是ACA(0.25)、ACC(0.25)、ACG(0.16)和ACT(0.34);
q)酪氨酸而所述密码子使用频率是TAG(0.37)和TAT(0.63);或者
r)缬氨酸而所述密码子使用频率是GTA(0.17)、GTC(0.23)、GTG(0.25)和GTT(0.35)。
40. 如权利要求36所述的方法,其中所述一种或多种双子叶植物病毒是大豆特异性病毒。
41. 如权利要求1所述的方法,其中所述多肽是杀虫性多肽。
42. 如权利要求41所述的方法,其中所述杀虫性多肽是基于来自于苏云金杆菌(Bacillus thuringiensis)或米根霉(Rhyzopus oryzae)的多肽进行过密码子优化的多肽。
43. 如权利要求42所述的方法,其中所述杀虫性苏云金杆菌多肽是437N。
44. 如权利要求43所述的方法,其中所述密码子优化的多肽杀虫性苏云金杆菌多肽包含SEQ ID NO:2的氨基酸序列。
45. 如权利要求42所述的方法,其中所述杀虫性米根霉多肽是杀虫性脂肪酶。
46. 如权利要求45所述的方法,其中所述密码子优化杀虫性米根霉多肽包含SEQ ID NO:4的氨基酸序列。
47. 含有至少一个更改密码子的核酸分子,其中所述核酸分子根据权利要求1所述的方法进行设计。
48. 如权利要求47所述的核酸分子,其中所述核酸分子编码杀虫性多肽。
49. 如权利要求48所述的核酸分子,其中所述杀虫性多肽是基于来自于苏云金杆菌或米根霉的多肽进行过密码子优化的多肽。
50. 如权利要求49所述的核酸分子,其中所述杀虫性苏云金杆菌多肽是437N。
51. 如权利要求50所述的核酸分子,其中所述密码子优化的杀虫性苏云金杆菌多肽包含SEQ ID NO:1的序列。
52. 如权利要求49所述的核酸分子,其中所述杀虫性米根霉多肽是杀虫性脂肪酶。
53. 如权利要求52所述的核酸分子,其中所述密码子优化杀虫性米根霉多肽包含SEQ ID NO:3的序列。
54. 含有序列SEQ ID NO:1或其互补物的核酸分子。
55. 含有序列SEQ ID NO:3或其互补物的核酸分子。
56. 包含权利要求53或54中任一项所述的核酸分子的载体。
57. 含有权利要求56所述的核酸分子的转基因植物及其后代。
58. 如权利要求57所述的转基因植物,其中所述后代是种子。
59. 如权利要求57所述的转基因植物,其中所述转基因植物是单子叶植物。
60. 如权利要求59所述的转基因植物,其中所述转基因植物选自由大麦、玉米、粟、燕麦、水稻和小麦组成的组。
61. 如权利要求57所述的转基因植物,其中所述转基因植物是双子叶植物。
62. 如权利要求61所述的转基因植物,其中所述转基因植物选自由马铃薯、大豆、烟草、棉花和西红柿组成的组。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US66873405P | 2005-04-05 | 2005-04-05 | |
US60/668,734 | 2005-04-05 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN101238215A true CN101238215A (zh) | 2008-08-06 |
Family
ID=37074037
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CNA2006800199201A Pending CN101238215A (zh) | 2005-04-05 | 2006-04-04 | 利用植物病毒密码子偏爱性设计用于在植物中的多肽表达的核酸分子的方法和组合物 |
Country Status (8)
Country | Link |
---|---|
US (1) | US20060236424A1 (zh) |
EP (1) | EP1866419A2 (zh) |
CN (1) | CN101238215A (zh) |
AU (1) | AU2006231503A1 (zh) |
BR (1) | BRPI0610521A2 (zh) |
CA (1) | CA2605939A1 (zh) |
MX (1) | MX2007012344A (zh) |
WO (1) | WO2006107954A2 (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105358704A (zh) * | 2013-03-08 | 2016-02-24 | 科罗拉多大学董事会 | Ptd-smad7治疗剂 |
US10350265B2 (en) | 2010-09-22 | 2019-07-16 | The Regents Of The University Of Colorado, A Body Corporate | Therapeutic applications of Smad7 |
CN110055263A (zh) * | 2019-03-13 | 2019-07-26 | 河南省农业科学院 | 编码Bt杀虫蛋白的基因Cry1Ab-MR、其表达载体及其应用 |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101849010A (zh) | 2007-06-29 | 2010-09-29 | 先锋高级育种国际公司 | 用于改变单子叶植物细胞的基因组的方法 |
WO2016086988A1 (en) * | 2014-12-03 | 2016-06-09 | Wageningen Universiteit | Optimisation of coding sequence for functional protein expression |
CN108753629B (zh) * | 2018-04-03 | 2021-05-04 | 山东农业大学 | 一株具有耐盐能力的米根霉及其应用 |
KR102117811B1 (ko) * | 2018-12-05 | 2020-06-02 | 대한민국(농림축산식품부 농림축산검역본부장) | 재조합 돼지파보바이러스 항원 단백질 및 이의 용도 |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB9108386D0 (en) * | 1991-04-19 | 1991-06-05 | Agricultural Genetics Co | Modified plant viruses as vectors |
UA48104C2 (uk) * | 1991-10-04 | 2002-08-15 | Новартіс Аг | Фрагмент днк, який містить послідовність,що кодує інсектицидний протеїн, оптимізовану для кукурудзи,фрагмент днк, який забезпечує направлену бажану для серцевини стебла експресію зв'язаного з нею структурного гена в рослині, фрагмент днк, який забезпечує специфічну для пилку експресію зв`язаного з нею структурного гена в рослині, рекомбінантна молекула днк, спосіб одержання оптимізованої для кукурудзи кодуючої послідовності інсектицидного протеїну, спосіб захисту рослин кукурудзи щонайменше від однієї комахи-шкідника |
NZ308772A (en) * | 1995-05-17 | 1999-04-29 | Du Pont | Recombinant baculovirus insecticides |
US6489542B1 (en) * | 1998-11-04 | 2002-12-03 | Monsanto Technology Llc | Methods for transforming plants to express Cry2Ab δ-endotoxins targeted to the plastids |
WO2001038553A1 (fr) * | 1999-11-26 | 2001-05-31 | Kansai Chemical Engineering Co., Ltd. | Fabrication d'alcool ester inferieur d'acide gras |
ES2315360T3 (es) * | 2001-01-09 | 2009-04-01 | Bayer Bioscience N.V. | Proteinas insecticidas de bacillus thuringiensis. |
EP1716239A2 (en) * | 2004-02-20 | 2006-11-02 | Pioneer Hi-Bred International, Inc. | Methods for enhancing insect resistance in plants |
EP1716230A2 (en) * | 2004-02-20 | 2006-11-02 | Pioneer Hi-Bred International, Inc. | Lipases and methods of use |
ES2552053T3 (es) * | 2004-02-25 | 2015-11-25 | Pioneer Hi-Bred International Inc. | Nuevos polipéptidos cristalinos de Bacillus thuringiensis, polinucleótidos, y composiciones de los mismos |
-
2006
- 2006-04-04 WO PCT/US2006/012478 patent/WO2006107954A2/en active Application Filing
- 2006-04-04 AU AU2006231503A patent/AU2006231503A1/en not_active Abandoned
- 2006-04-04 CN CNA2006800199201A patent/CN101238215A/zh active Pending
- 2006-04-04 BR BRPI0610521-1A patent/BRPI0610521A2/pt not_active IP Right Cessation
- 2006-04-04 EP EP06749232A patent/EP1866419A2/en not_active Withdrawn
- 2006-04-04 MX MX2007012344A patent/MX2007012344A/es not_active Application Discontinuation
- 2006-04-04 CA CA002605939A patent/CA2605939A1/en not_active Abandoned
- 2006-04-05 US US11/399,028 patent/US20060236424A1/en not_active Abandoned
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10350265B2 (en) | 2010-09-22 | 2019-07-16 | The Regents Of The University Of Colorado, A Body Corporate | Therapeutic applications of Smad7 |
CN105358704A (zh) * | 2013-03-08 | 2016-02-24 | 科罗拉多大学董事会 | Ptd-smad7治疗剂 |
US10456448B2 (en) | 2013-03-08 | 2019-10-29 | The Regents Of The University Of Colorado, A Body Corporate | PTD-SMAD7 therapeutics |
CN105358704B (zh) * | 2013-03-08 | 2020-01-03 | 科罗拉多大学董事会 | Ptd-smad7治疗剂 |
CN110055263A (zh) * | 2019-03-13 | 2019-07-26 | 河南省农业科学院 | 编码Bt杀虫蛋白的基因Cry1Ab-MR、其表达载体及其应用 |
CN110055263B (zh) * | 2019-03-13 | 2023-07-18 | 河南省农业科学院 | 编码Bt杀虫蛋白的基因Cry1Ab-MR、其表达载体及其应用 |
Also Published As
Publication number | Publication date |
---|---|
MX2007012344A (es) | 2007-12-13 |
WO2006107954A3 (en) | 2007-02-22 |
US20060236424A1 (en) | 2006-10-19 |
EP1866419A2 (en) | 2007-12-19 |
AU2006231503A1 (en) | 2006-10-12 |
CA2605939A1 (en) | 2006-10-12 |
BRPI0610521A2 (pt) | 2010-06-29 |
WO2006107954A2 (en) | 2006-10-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CA2571369C (en) | Antifungal polypeptides | |
CA2611539C (en) | Insect-specific protease recognition sequences | |
US20190316145A1 (en) | Methods And Compositions For Providing Resistance To Glufosinate | |
MXPA06009411A (es) | Lipasas y metodos de uso. | |
MX2008002615A (es) | Metodos y composiciones para la expresion de un polinucleotido de interes. | |
KR20120096571A (ko) | 곤충 내성 관리를 위한 CRY1Ca 및 CRY1Fa 단백질의 조합 용도 | |
CN102395674A (zh) | 调节acc合酶改善低氮条件下的植物产量 | |
AU2005336142A1 (en) | A transgenic plant having enhanced drought tolerance | |
BRPI0706368A2 (pt) | composição, vetor, método para fornecer resistência ao cisto nematódeo a uma planta, proteìna de fusão, método para inibir atividade biológica, ácido nucléico isolado | |
CA2652461C (en) | Antifungal polypeptides and uses thereof in inducing fungal resistance in plants | |
CN101238215A (zh) | 利用植物病毒密码子偏爱性设计用于在植物中的多肽表达的核酸分子的方法和组合物 | |
US20050070697A1 (en) | Pathogen-responsive genes, promoters, regulatory elements, and methods of use for same | |
WO2014028426A1 (en) | Compositions and methods for increasing pest resistance in plants | |
US8853490B2 (en) | Antifungal proteins and methods of use | |
CN101479294A (zh) | 对应于玉米d9基因的突变等位基因和野生型等位基因的分离的多核苷酸分子和使用方法 | |
WO2025019221A1 (en) | Broad-spectrum polerovirus resistance gene | |
CN120358939A (zh) | 亚洲大豆锈病抗性基因 | |
McCutchen et al. | Altifier et al. | |
LT et al. | Antimykotische Polypeptide Polypeptides antifongiques | |
MXPA99010882A (en) | Proteins having insecticidal activities and method of use | |
HUP0003403A2 (hu) | Rovarírtó aktivitású fehérjék és alkalmazásuk |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C12 | Rejection of a patent application after its publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20080806 |