CN104745608A - 具有增强的产量相关性状的植物及其制备方法 - Google Patents
具有增强的产量相关性状的植物及其制备方法 Download PDFInfo
- Publication number
- CN104745608A CN104745608A CN201510013277.2A CN201510013277A CN104745608A CN 104745608 A CN104745608 A CN 104745608A CN 201510013277 A CN201510013277 A CN 201510013277A CN 104745608 A CN104745608 A CN 104745608A
- Authority
- CN
- China
- Prior art keywords
- polypeptide
- nucleic acid
- plant
- seq
- sequence
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 346
- 108090000765 processed proteins & peptides Proteins 0.000 claims abstract description 646
- 102000004196 processed proteins & peptides Human genes 0.000 claims abstract description 614
- 229920001184 polypeptide Polymers 0.000 claims abstract description 608
- 150000007523 nucleic acids Chemical class 0.000 claims abstract description 451
- 102000039446 nucleic acids Human genes 0.000 claims abstract description 439
- 108020004707 nucleic acids Proteins 0.000 claims abstract description 439
- 108090000623 proteins and genes Proteins 0.000 claims abstract description 270
- 230000014509 gene expression Effects 0.000 claims abstract description 157
- 101000950981 Bacillus subtilis (strain 168) Catabolic NAD-specific glutamate dehydrogenase RocG Proteins 0.000 claims abstract description 120
- 102000016901 Glutamate dehydrogenase Human genes 0.000 claims abstract description 120
- 102000004169 proteins and genes Human genes 0.000 claims abstract description 108
- 230000002708 enhancing effect Effects 0.000 claims abstract description 42
- 241000196324 Embryophyta Species 0.000 claims description 541
- 125000003729 nucleotide group Chemical group 0.000 claims description 144
- 239000002773 nucleotide Substances 0.000 claims description 140
- 125000003275 alpha amino acid group Chemical group 0.000 claims description 131
- 230000001965 increasing effect Effects 0.000 claims description 129
- 235000018102 proteins Nutrition 0.000 claims description 91
- 230000002596 correlated effect Effects 0.000 claims description 82
- 238000009396 hybridization Methods 0.000 claims description 81
- 230000012010 growth Effects 0.000 claims description 49
- 235000001014 amino acid Nutrition 0.000 claims description 47
- 150000001413 amino acids Chemical class 0.000 claims description 47
- 230000001105 regulatory effect Effects 0.000 claims description 47
- 240000007594 Oryza sativa Species 0.000 claims description 44
- 239000002028 Biomass Substances 0.000 claims description 42
- 230000000694 effects Effects 0.000 claims description 40
- 235000007164 Oryza sativa Nutrition 0.000 claims description 39
- 230000035882 stress Effects 0.000 claims description 38
- 230000002068 genetic effect Effects 0.000 claims description 37
- 238000004519 manufacturing process Methods 0.000 claims description 37
- 235000009566 rice Nutrition 0.000 claims description 37
- 102000018997 Growth Hormone Human genes 0.000 claims description 34
- 108010051696 Growth Hormone Proteins 0.000 claims description 34
- 239000000122 growth hormone Substances 0.000 claims description 34
- 230000000295 complement effect Effects 0.000 claims description 33
- 230000009261 transgenic effect Effects 0.000 claims description 33
- 230000000875 corresponding effect Effects 0.000 claims description 26
- 240000008042 Zea mays Species 0.000 claims description 19
- 101150104463 GOS2 gene Proteins 0.000 claims description 18
- 238000005728 strengthening Methods 0.000 claims description 18
- 150000003839 salts Chemical class 0.000 claims description 17
- 108091028043 Nucleic acid sequence Proteins 0.000 claims description 16
- 239000002253 acid Substances 0.000 claims description 16
- 235000013311 vegetables Nutrition 0.000 claims description 14
- 230000012743 protein tagging Effects 0.000 claims description 12
- 238000000926 separation method Methods 0.000 claims description 12
- 235000002017 Zea mays subsp mays Nutrition 0.000 claims description 11
- IJGRMHOSHXDMSA-UHFFFAOYSA-N Atomic nitrogen Chemical compound N#N IJGRMHOSHXDMSA-UHFFFAOYSA-N 0.000 claims description 10
- 235000005824 Zea mays ssp. parviglumis Nutrition 0.000 claims description 10
- 235000005822 corn Nutrition 0.000 claims description 10
- 244000075850 Avena orientalis Species 0.000 claims description 9
- 238000007899 nucleic acid hybridization Methods 0.000 claims description 9
- 230000008635 plant growth Effects 0.000 claims description 9
- 235000013339 cereals Nutrition 0.000 claims description 8
- 244000038559 crop plants Species 0.000 claims description 8
- 235000007319 Avena orientalis Nutrition 0.000 claims description 7
- 241001233957 eudicotyledons Species 0.000 claims description 7
- 235000021307 Triticum Nutrition 0.000 claims description 6
- 244000025254 Cannabis sativa Species 0.000 claims description 5
- 240000005979 Hordeum vulgare Species 0.000 claims description 5
- 241000209510 Liliopsida Species 0.000 claims description 5
- 230000008641 drought stress Effects 0.000 claims description 5
- 229910052757 nitrogen Inorganic materials 0.000 claims description 5
- 230000005030 transcription termination Effects 0.000 claims description 5
- 108020004705 Codon Proteins 0.000 claims description 4
- 235000007340 Hordeum vulgare Nutrition 0.000 claims description 4
- 239000003795 chemical substances by application Substances 0.000 claims description 4
- 241000209056 Secale Species 0.000 claims description 3
- 235000007238 Secale cereale Nutrition 0.000 claims description 3
- 241000209140 Triticum Species 0.000 claims description 3
- 240000000581 Triticum monococcum Species 0.000 claims description 3
- 238000002360 preparation method Methods 0.000 claims description 3
- 235000005254 Allium ampeloprasum Nutrition 0.000 claims description 2
- 240000006108 Allium ampeloprasum Species 0.000 claims description 2
- 101100207325 Arabidopsis thaliana TPPE gene Proteins 0.000 claims description 2
- 240000006394 Sorghum bicolor Species 0.000 claims description 2
- 244000046109 Sorghum vulgare var. nervosum Species 0.000 claims description 2
- 235000019714 Triticale Nutrition 0.000 claims description 2
- 102000006602 glyceraldehyde-3-phosphate dehydrogenase Human genes 0.000 claims description 2
- 108020004445 glyceraldehyde-3-phosphate dehydrogenase Proteins 0.000 claims description 2
- 230000001737 promoting effect Effects 0.000 claims description 2
- 241000228158 x Triticosecale Species 0.000 claims description 2
- 235000011684 Sorghum saccharatum Nutrition 0.000 claims 1
- 235000009430 Thespesia populnea Nutrition 0.000 claims 1
- 240000000359 Triticum dicoccon Species 0.000 claims 1
- 235000001468 Triticum dicoccon Nutrition 0.000 claims 1
- 240000003834 Triticum spelta Species 0.000 claims 1
- 235000004240 Triticum spelta Nutrition 0.000 claims 1
- 230000001143 conditioned effect Effects 0.000 claims 1
- 108090000038 Glutathione dehydrogenase (ascorbate) Proteins 0.000 abstract description 5
- 230000004936 stimulating effect Effects 0.000 abstract description 2
- 230000009918 complex formation Effects 0.000 abstract 1
- 101100063346 Arabidopsis thaliana DHAR2 gene Proteins 0.000 description 95
- 101100063345 Oryza sativa subsp. japonica DHAR1 gene Proteins 0.000 description 95
- 239000000523 sample Substances 0.000 description 80
- 210000004027 cell Anatomy 0.000 description 69
- 229940024606 amino acid Drugs 0.000 description 44
- 108700028369 Alleles Proteins 0.000 description 37
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 33
- 238000006243 chemical reaction Methods 0.000 description 32
- 108020004999 messenger RNA Proteins 0.000 description 30
- 230000004927 fusion Effects 0.000 description 28
- 230000008859 change Effects 0.000 description 25
- 230000000692 anti-sense effect Effects 0.000 description 24
- 230000004071 biological effect Effects 0.000 description 24
- 230000008569 process Effects 0.000 description 24
- 108020004414 DNA Proteins 0.000 description 23
- 238000005516 engineering process Methods 0.000 description 23
- 210000001519 tissue Anatomy 0.000 description 23
- 238000004422 calculation algorithm Methods 0.000 description 22
- 240000003768 Solanum lycopersicum Species 0.000 description 20
- 241000894007 species Species 0.000 description 20
- 125000003440 L-leucyl group Chemical group O=C([*])[C@](N([H])[H])([H])C([H])([H])C(C([H])([H])[H])([H])C([H])([H])[H] 0.000 description 19
- 125000003338 L-glutaminyl group Chemical group O=C([*])[C@](N([H])[H])([H])C([H])([H])C([H])([H])C(=O)N([H])[H] 0.000 description 18
- CIWBSHSKHKDKBQ-JLAZNSOCSA-N Ascorbic acid Chemical compound OC[C@H](O)[C@H]1OC(=O)C(O)=C1O CIWBSHSKHKDKBQ-JLAZNSOCSA-N 0.000 description 17
- WHUUTDBJXJRKMK-VKHMYHEASA-N L-glutamic acid Chemical compound OC(=O)[C@@H](N)CCC(O)=O WHUUTDBJXJRKMK-VKHMYHEASA-N 0.000 description 16
- 239000000203 mixture Substances 0.000 description 16
- 230000009466 transformation Effects 0.000 description 16
- 235000007688 Lycopersicon esculentum Nutrition 0.000 description 14
- 238000013507 mapping Methods 0.000 description 14
- 125000002435 L-phenylalanyl group Chemical group O=C([*])[C@](N([H])[H])([H])C([H])([H])C1=C([H])C([H])=C([H])C([H])=C1[H] 0.000 description 13
- 239000003550 marker Substances 0.000 description 13
- 230000002441 reversible effect Effects 0.000 description 12
- 241000589158 Agrobacterium Species 0.000 description 11
- 241000219194 Arabidopsis Species 0.000 description 11
- 244000098338 Triticum aestivum Species 0.000 description 11
- 230000009615 deamination Effects 0.000 description 11
- 238000006481 deamination reaction Methods 0.000 description 11
- 230000006870 function Effects 0.000 description 11
- 230000030279 gene silencing Effects 0.000 description 11
- 229960002989 glutamic acid Drugs 0.000 description 11
- 230000036961 partial effect Effects 0.000 description 11
- 235000010469 Glycine max Nutrition 0.000 description 10
- 244000068988 Glycine max Species 0.000 description 10
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 10
- 230000036579 abiotic stress Effects 0.000 description 10
- 210000004899 c-terminal region Anatomy 0.000 description 10
- -1 L-glutamic acid compound Chemical class 0.000 description 9
- 125000000539 amino acid group Chemical group 0.000 description 9
- 230000001276 controlling effect Effects 0.000 description 9
- 238000003780 insertion Methods 0.000 description 9
- 230000037431 insertion Effects 0.000 description 9
- 108091070501 miRNA Proteins 0.000 description 9
- 210000000056 organ Anatomy 0.000 description 9
- 238000012225 targeting induced local lesions in genomes Methods 0.000 description 9
- 230000035897 transcription Effects 0.000 description 9
- 238000013518 transcription Methods 0.000 description 9
- 108091035707 Consensus sequence Proteins 0.000 description 8
- 108010029485 Protein Isoforms Proteins 0.000 description 8
- 102000001708 Protein Isoforms Human genes 0.000 description 8
- 235000007244 Zea mays Nutrition 0.000 description 8
- 238000006206 glycosylation reaction Methods 0.000 description 8
- 210000004185 liver Anatomy 0.000 description 8
- 210000001161 mammalian embryo Anatomy 0.000 description 8
- 239000002609 medium Substances 0.000 description 8
- 230000036542 oxidative stress Effects 0.000 description 8
- 238000012797 qualification Methods 0.000 description 8
- 238000011160 research Methods 0.000 description 8
- 108091092562 ribozyme Proteins 0.000 description 8
- 230000017260 vegetative to reproductive phase transition of meristem Effects 0.000 description 8
- 238000005406 washing Methods 0.000 description 8
- 108090000994 Catalytic RNA Proteins 0.000 description 7
- 102000053642 Catalytic RNA Human genes 0.000 description 7
- 125000003580 L-valyl group Chemical group [H]N([H])[C@]([H])(C(=O)[*])C(C([H])([H])[H])(C([H])([H])[H])[H] 0.000 description 7
- 108700008625 Reporter Genes Proteins 0.000 description 7
- 150000007513 acids Chemical class 0.000 description 7
- 238000009395 breeding Methods 0.000 description 7
- 230000001488 breeding effect Effects 0.000 description 7
- 230000008034 disappearance Effects 0.000 description 7
- 230000013595 glycosylation Effects 0.000 description 7
- 238000003306 harvesting Methods 0.000 description 7
- 238000002744 homologous recombination Methods 0.000 description 7
- 230000006801 homologous recombination Effects 0.000 description 7
- 230000006698 induction Effects 0.000 description 7
- 230000004048 modification Effects 0.000 description 7
- 238000012986 modification Methods 0.000 description 7
- 231100000350 mutagenesis Toxicity 0.000 description 7
- 230000004044 response Effects 0.000 description 7
- 239000000243 solution Substances 0.000 description 7
- 230000002103 transcriptional effect Effects 0.000 description 7
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 7
- 101150116940 AGPS gene Proteins 0.000 description 6
- 241000219193 Brassicaceae Species 0.000 description 6
- 108091026890 Coding region Proteins 0.000 description 6
- 102000004190 Enzymes Human genes 0.000 description 6
- 108090000790 Enzymes Proteins 0.000 description 6
- 241000208125 Nicotiana Species 0.000 description 6
- 235000002637 Nicotiana tabacum Nutrition 0.000 description 6
- 108700001094 Plant Genes Proteins 0.000 description 6
- 238000004458 analytical method Methods 0.000 description 6
- 108091036078 conserved sequence Proteins 0.000 description 6
- 229940088598 enzyme Drugs 0.000 description 6
- 239000012634 fragment Substances 0.000 description 6
- 238000012226 gene silencing method Methods 0.000 description 6
- 230000006872 improvement Effects 0.000 description 6
- 230000000442 meristematic effect Effects 0.000 description 6
- 238000002703 mutagenesis Methods 0.000 description 6
- 210000002706 plastid Anatomy 0.000 description 6
- 108091033319 polynucleotide Proteins 0.000 description 6
- 102000040430 polynucleotide Human genes 0.000 description 6
- 239000002157 polynucleotide Substances 0.000 description 6
- 230000009467 reduction Effects 0.000 description 6
- 230000008929 regeneration Effects 0.000 description 6
- 238000011069 regeneration method Methods 0.000 description 6
- 238000009331 sowing Methods 0.000 description 6
- 238000012546 transfer Methods 0.000 description 6
- 230000001131 transforming effect Effects 0.000 description 6
- 238000011144 upstream manufacturing Methods 0.000 description 6
- 102000040650 (ribonucleotides)n+m Human genes 0.000 description 5
- 241000894006 Bacteria Species 0.000 description 5
- 241000219000 Populus Species 0.000 description 5
- WCUXLLCKKVVCTQ-UHFFFAOYSA-M Potassium chloride Chemical compound [Cl-].[K+] WCUXLLCKKVVCTQ-UHFFFAOYSA-M 0.000 description 5
- 108091036066 Three prime untranslated region Proteins 0.000 description 5
- 230000004913 activation Effects 0.000 description 5
- 235000010323 ascorbic acid Nutrition 0.000 description 5
- 229960005070 ascorbic acid Drugs 0.000 description 5
- 239000011668 ascorbic acid Substances 0.000 description 5
- 230000033228 biological regulation Effects 0.000 description 5
- 210000003763 chloroplast Anatomy 0.000 description 5
- 238000013461 design Methods 0.000 description 5
- 230000008014 freezing Effects 0.000 description 5
- 238000007710 freezing Methods 0.000 description 5
- 150000004676 glycans Chemical class 0.000 description 5
- SEOVTRFCIGRIMH-UHFFFAOYSA-N indole-3-acetic acid Chemical compound C1=CC=C2C(CC(=O)O)=CNC2=C1 SEOVTRFCIGRIMH-UHFFFAOYSA-N 0.000 description 5
- VNWKTOKETHGBQD-UHFFFAOYSA-N methane Natural products C VNWKTOKETHGBQD-UHFFFAOYSA-N 0.000 description 5
- 235000018343 nutrient deficiency Nutrition 0.000 description 5
- 230000006798 recombination Effects 0.000 description 5
- 238000005215 recombination Methods 0.000 description 5
- 230000028327 secretion Effects 0.000 description 5
- 238000002864 sequence alignment Methods 0.000 description 5
- 238000002741 site-directed mutagenesis Methods 0.000 description 5
- 239000011780 sodium chloride Substances 0.000 description 5
- 239000000126 substance Substances 0.000 description 5
- 238000013519 translation Methods 0.000 description 5
- 241000589155 Agrobacterium tumefaciens Species 0.000 description 4
- 241000219195 Arabidopsis thaliana Species 0.000 description 4
- 108091026821 Artificial microRNA Proteins 0.000 description 4
- 229930192334 Auxin Natural products 0.000 description 4
- OYPRJOBELJOOCE-UHFFFAOYSA-N Calcium Chemical compound [Ca] OYPRJOBELJOOCE-UHFFFAOYSA-N 0.000 description 4
- 235000001950 Elaeis guineensis Nutrition 0.000 description 4
- 102000010834 Extracellular Matrix Proteins Human genes 0.000 description 4
- 108010037362 Extracellular Matrix Proteins Proteins 0.000 description 4
- 108700007698 Genetic Terminator Regions Proteins 0.000 description 4
- XEEYBQQBJWHFJM-UHFFFAOYSA-N Iron Chemical compound [Fe] XEEYBQQBJWHFJM-UHFFFAOYSA-N 0.000 description 4
- 108091092724 Noncoding DNA Proteins 0.000 description 4
- NBIIXXVUZAFLBC-UHFFFAOYSA-N Phosphoric acid Chemical compound OP(O)(O)=O NBIIXXVUZAFLBC-UHFFFAOYSA-N 0.000 description 4
- 108020004459 Small interfering RNA Proteins 0.000 description 4
- 235000002560 Solanum lycopersicum Nutrition 0.000 description 4
- 241000700605 Viruses Species 0.000 description 4
- 239000002363 auxin Substances 0.000 description 4
- 230000015572 biosynthetic process Effects 0.000 description 4
- 239000011575 calcium Substances 0.000 description 4
- 229910052791 calcium Inorganic materials 0.000 description 4
- 150000001720 carbohydrates Chemical class 0.000 description 4
- 210000002421 cell wall Anatomy 0.000 description 4
- 238000005520 cutting process Methods 0.000 description 4
- 230000006378 damage Effects 0.000 description 4
- 239000003623 enhancer Substances 0.000 description 4
- 230000035784 germination Effects 0.000 description 4
- 230000001939 inductive effect Effects 0.000 description 4
- KWGKDLIKAYFUFQ-UHFFFAOYSA-M lithium chloride Chemical compound [Li+].[Cl-] KWGKDLIKAYFUFQ-UHFFFAOYSA-M 0.000 description 4
- 230000007246 mechanism Effects 0.000 description 4
- 230000002503 metabolic effect Effects 0.000 description 4
- 239000002207 metabolite Substances 0.000 description 4
- 230000035772 mutation Effects 0.000 description 4
- 238000012545 processing Methods 0.000 description 4
- 108020001580 protein domains Proteins 0.000 description 4
- 230000010076 replication Effects 0.000 description 4
- 239000013598 vector Substances 0.000 description 4
- 240000002791 Brassica napus Species 0.000 description 3
- 102000000584 Calmodulin Human genes 0.000 description 3
- 108010041952 Calmodulin Proteins 0.000 description 3
- 241001070941 Castanea Species 0.000 description 3
- 244000127993 Elaeis melanococca Species 0.000 description 3
- 101150099894 GDHA gene Proteins 0.000 description 3
- 102000053187 Glucuronidase Human genes 0.000 description 3
- 108010060309 Glucuronidase Proteins 0.000 description 3
- 101100277701 Halobacterium salinarum gdhX gene Proteins 0.000 description 3
- 240000006240 Linum usitatissimum Species 0.000 description 3
- 241001465754 Metazoa Species 0.000 description 3
- 240000002853 Nelumbo nucifera Species 0.000 description 3
- 108091034117 Oligonucleotide Proteins 0.000 description 3
- 108010038807 Oligopeptides Proteins 0.000 description 3
- 102000015636 Oligopeptides Human genes 0.000 description 3
- 108700026244 Open Reading Frames Proteins 0.000 description 3
- 102000003992 Peroxidases Human genes 0.000 description 3
- 101100392454 Picrophilus torridus (strain ATCC 700027 / DSM 9790 / JCM 10055 / NBRC 100828) gdh2 gene Proteins 0.000 description 3
- 241000219843 Pisum Species 0.000 description 3
- 101100116769 Saccharolobus solfataricus (strain ATCC 35092 / DSM 1617 / JCM 11322 / P2) gdhA-2 gene Proteins 0.000 description 3
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 3
- 235000002595 Solanum tuberosum Nutrition 0.000 description 3
- 244000061456 Solanum tuberosum Species 0.000 description 3
- 108700019146 Transgenes Proteins 0.000 description 3
- 235000002041 Triticum macha Nutrition 0.000 description 3
- 244000102426 Triticum macha Species 0.000 description 3
- 108010050181 aleurone Proteins 0.000 description 3
- 108010005774 beta-Galactosidase Proteins 0.000 description 3
- 230000027455 binding Effects 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 3
- 235000014633 carbohydrates Nutrition 0.000 description 3
- 230000001413 cellular effect Effects 0.000 description 3
- 230000007423 decrease Effects 0.000 description 3
- 235000013399 edible fruits Nutrition 0.000 description 3
- 239000013604 expression vector Substances 0.000 description 3
- 210000002744 extracellular matrix Anatomy 0.000 description 3
- 230000002349 favourable effect Effects 0.000 description 3
- BRZYSWJRSDMWLG-CAXSIQPQSA-N geneticin Chemical compound O1C[C@@](O)(C)[C@H](NC)[C@@H](O)[C@H]1O[C@@H]1[C@@H](O)[C@H](O[C@@H]2[C@@H]([C@@H](O)[C@H](O)[C@@H](C(C)O)O2)N)[C@@H](N)C[C@H]1N BRZYSWJRSDMWLG-CAXSIQPQSA-N 0.000 description 3
- 239000005556 hormone Substances 0.000 description 3
- 229940088597 hormone Drugs 0.000 description 3
- 230000003993 interaction Effects 0.000 description 3
- 239000000463 material Substances 0.000 description 3
- 230000001404 mediated effect Effects 0.000 description 3
- 238000002887 multiple sequence alignment Methods 0.000 description 3
- 235000015097 nutrients Nutrition 0.000 description 3
- 239000003921 oil Substances 0.000 description 3
- 235000019198 oils Nutrition 0.000 description 3
- 108040007629 peroxidase activity proteins Proteins 0.000 description 3
- 239000013612 plasmid Substances 0.000 description 3
- 230000008488 polyadenylation Effects 0.000 description 3
- 150000004804 polysaccharides Polymers 0.000 description 3
- 230000002829 reductive effect Effects 0.000 description 3
- 238000012216 screening Methods 0.000 description 3
- 230000003584 silencer Effects 0.000 description 3
- 239000004055 small Interfering RNA Substances 0.000 description 3
- 239000000725 suspension Substances 0.000 description 3
- 238000003786 synthesis reaction Methods 0.000 description 3
- 230000000007 visual effect Effects 0.000 description 3
- KPGXRSRHYNQIFN-UHFFFAOYSA-N 2-oxoglutaric acid Chemical compound OC(=O)CCC(=O)C(O)=O KPGXRSRHYNQIFN-UHFFFAOYSA-N 0.000 description 2
- 241001075517 Abelmoschus Species 0.000 description 2
- 241000219068 Actinidia Species 0.000 description 2
- 244000198134 Agave sisalana Species 0.000 description 2
- 235000011624 Agave sisalana Nutrition 0.000 description 2
- 240000007241 Agrostis stolonifera Species 0.000 description 2
- 241000234282 Allium Species 0.000 description 2
- 241000219318 Amaranthus Species 0.000 description 2
- 241000380131 Ammophila arenaria Species 0.000 description 2
- 244000296825 Amygdalus nana Species 0.000 description 2
- 244000099147 Ananas comosus Species 0.000 description 2
- 235000007119 Ananas comosus Nutrition 0.000 description 2
- 240000007087 Apium graveolens Species 0.000 description 2
- 101100227202 Arabidopsis thaliana FLA4 gene Proteins 0.000 description 2
- 244000105624 Arachis hypogaea Species 0.000 description 2
- 244000018217 Artocarpus elasticus Species 0.000 description 2
- 241000351920 Aspergillus nidulans Species 0.000 description 2
- 235000010082 Averrhoa carambola Nutrition 0.000 description 2
- 240000006063 Averrhoa carambola Species 0.000 description 2
- 244000036905 Benincasa cerifera Species 0.000 description 2
- 235000011274 Benincasa cerifera Nutrition 0.000 description 2
- 241000335053 Beta vulgaris Species 0.000 description 2
- ZOXJGFHDIHLPTG-UHFFFAOYSA-N Boron Chemical compound [B] ZOXJGFHDIHLPTG-UHFFFAOYSA-N 0.000 description 2
- 241000219198 Brassica Species 0.000 description 2
- 235000011293 Brassica napus Nutrition 0.000 description 2
- 241001237259 Campanella <basidiomycete fungus> Species 0.000 description 2
- 240000008574 Capsicum frutescens Species 0.000 description 2
- 235000009467 Carica papaya Nutrition 0.000 description 2
- 240000006432 Carica papaya Species 0.000 description 2
- 240000004927 Carissa macrocarpa Species 0.000 description 2
- 235000001479 Carissa macrocarpa Nutrition 0.000 description 2
- 235000003255 Carthamus tinctorius Nutrition 0.000 description 2
- 244000020518 Carthamus tinctorius Species 0.000 description 2
- 241000723418 Carya Species 0.000 description 2
- 235000014036 Castanea Nutrition 0.000 description 2
- 108700031407 Chloroplast Genes Proteins 0.000 description 2
- 244000241235 Citrullus lanatus Species 0.000 description 2
- 241000207199 Citrus Species 0.000 description 2
- 241000723377 Coffea Species 0.000 description 2
- 244000205754 Colocasia esculenta Species 0.000 description 2
- 235000006481 Colocasia esculenta Nutrition 0.000 description 2
- 235000002787 Coriandrum sativum Nutrition 0.000 description 2
- 244000018436 Coriandrum sativum Species 0.000 description 2
- 241000723382 Corylus Species 0.000 description 2
- 244000024469 Cucumis prophetarum Species 0.000 description 2
- 241000219122 Cucurbita Species 0.000 description 2
- 108010066133 D-octopine dehydrogenase Proteins 0.000 description 2
- SRBFZHDQGSBBOR-IOVATXLUSA-N D-xylopyranose Chemical compound O[C@@H]1COC(O)[C@H](O)[C@H]1O SRBFZHDQGSBBOR-IOVATXLUSA-N 0.000 description 2
- 208000005156 Dehydration Diseases 0.000 description 2
- 240000001008 Dimocarpus longan Species 0.000 description 2
- 244000281702 Dioscorea villosa Species 0.000 description 2
- 235000011511 Diospyros Nutrition 0.000 description 2
- 241000723267 Diospyros Species 0.000 description 2
- 108010016626 Dipeptides Proteins 0.000 description 2
- 241000192043 Echinochloa Species 0.000 description 2
- 240000003133 Elaeis guineensis Species 0.000 description 2
- 244000078127 Eleusine coracana Species 0.000 description 2
- 235000009008 Eriobotrya japonica Nutrition 0.000 description 2
- 244000061508 Eriobotrya japonica Species 0.000 description 2
- 241000588724 Escherichia coli Species 0.000 description 2
- LYCAIKOWRPUZTN-UHFFFAOYSA-N Ethylene glycol Chemical compound OCCO LYCAIKOWRPUZTN-UHFFFAOYSA-N 0.000 description 2
- 235000000235 Euphoria longan Nutrition 0.000 description 2
- 240000008620 Fagopyrum esculentum Species 0.000 description 2
- 241000220223 Fragaria Species 0.000 description 2
- 241000233866 Fungi Species 0.000 description 2
- 235000008100 Ginkgo biloba Nutrition 0.000 description 2
- 244000194101 Ginkgo biloba Species 0.000 description 2
- 108090000288 Glycoproteins Proteins 0.000 description 2
- 102000003886 Glycoproteins Human genes 0.000 description 2
- 244000299507 Gossypium hirsutum Species 0.000 description 2
- 241000208818 Helianthus Species 0.000 description 2
- 235000003222 Helianthus annuus Nutrition 0.000 description 2
- 244000020551 Helianthus annuus Species 0.000 description 2
- 235000002941 Hemerocallis fulva Nutrition 0.000 description 2
- 240000009206 Hemerocallis fulva Species 0.000 description 2
- 241000209219 Hordeum Species 0.000 description 2
- 206010020649 Hyperkeratosis Diseases 0.000 description 2
- 108091092195 Intron Proteins 0.000 description 2
- 244000017020 Ipomoea batatas Species 0.000 description 2
- 235000002678 Ipomoea batatas Nutrition 0.000 description 2
- 241000758789 Juglans Species 0.000 description 2
- 235000003228 Lactuca sativa Nutrition 0.000 description 2
- 240000008415 Lactuca sativa Species 0.000 description 2
- 241000219729 Lathyrus Species 0.000 description 2
- 108091026898 Leader sequence (mRNA) Proteins 0.000 description 2
- 240000004322 Lens culinaris Species 0.000 description 2
- 235000010666 Lens esculenta Nutrition 0.000 description 2
- 235000004431 Linum usitatissimum Nutrition 0.000 description 2
- 241000219745 Lupinus Species 0.000 description 2
- FYYHWMGAXLPEAU-UHFFFAOYSA-N Magnesium Chemical compound [Mg] FYYHWMGAXLPEAU-UHFFFAOYSA-N 0.000 description 2
- TWRXJAOTZQYOKJ-UHFFFAOYSA-L Magnesium chloride Chemical compound [Mg+2].[Cl-].[Cl-] TWRXJAOTZQYOKJ-UHFFFAOYSA-L 0.000 description 2
- 240000003394 Malpighia glabra Species 0.000 description 2
- 235000014837 Malpighia glabra Nutrition 0.000 description 2
- 241000220225 Malus Species 0.000 description 2
- 235000014826 Mangifera indica Nutrition 0.000 description 2
- 240000007228 Mangifera indica Species 0.000 description 2
- 240000003183 Manihot esculenta Species 0.000 description 2
- 244000061354 Manilkara achras Species 0.000 description 2
- 241000213996 Melilotus Species 0.000 description 2
- 241001072983 Mentha Species 0.000 description 2
- 241000218984 Momordica Species 0.000 description 2
- 240000000249 Morus alba Species 0.000 description 2
- 235000008708 Morus alba Nutrition 0.000 description 2
- 241000234295 Musa Species 0.000 description 2
- 235000006508 Nelumbo nucifera Nutrition 0.000 description 2
- 235000006510 Nelumbo pentapetala Nutrition 0.000 description 2
- 101100329389 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) cre-1 gene Proteins 0.000 description 2
- 244000061176 Nicotiana tabacum Species 0.000 description 2
- 108020004711 Nucleic Acid Probes Proteins 0.000 description 2
- 241000795633 Olea <sea slug> Species 0.000 description 2
- 241000209094 Oryza Species 0.000 description 2
- 235000007199 Panicum miliaceum Nutrition 0.000 description 2
- 241001520808 Panicum virgatum Species 0.000 description 2
- 244000288157 Passiflora edulis Species 0.000 description 2
- 240000004370 Pastinaca sativa Species 0.000 description 2
- 241000218196 Persea Species 0.000 description 2
- 240000009164 Petroselinum crispum Species 0.000 description 2
- 235000002770 Petroselinum crispum Nutrition 0.000 description 2
- 241000219833 Phaseolus Species 0.000 description 2
- 235000014676 Phragmites communis Nutrition 0.000 description 2
- 244000064622 Physalis edulis Species 0.000 description 2
- 235000003447 Pistacia vera Nutrition 0.000 description 2
- 240000006711 Pistacia vera Species 0.000 description 2
- 241000209504 Poaceae Species 0.000 description 2
- ZLMJMSJWJFRBEC-UHFFFAOYSA-N Potassium Chemical compound [K] ZLMJMSJWJFRBEC-UHFFFAOYSA-N 0.000 description 2
- 241001494501 Prosopis <angiosperm> Species 0.000 description 2
- 241000508269 Psidium Species 0.000 description 2
- 244000294611 Punica granatum Species 0.000 description 2
- 235000014360 Punica granatum Nutrition 0.000 description 2
- 240000001987 Pyrus communis Species 0.000 description 2
- 235000014443 Pyrus communis Nutrition 0.000 description 2
- 241000219492 Quercus Species 0.000 description 2
- 244000088415 Raphanus sativus Species 0.000 description 2
- 102000018120 Recombinases Human genes 0.000 description 2
- 108010091086 Recombinases Proteins 0.000 description 2
- 235000009411 Rheum rhabarbarum Nutrition 0.000 description 2
- 244000193032 Rheum rhaponticum Species 0.000 description 2
- 108010083644 Ribonucleases Proteins 0.000 description 2
- 102000006382 Ribonucleases Human genes 0.000 description 2
- 108091028664 Ribonucleotide Proteins 0.000 description 2
- 240000000528 Ricinus communis Species 0.000 description 2
- 235000004443 Ricinus communis Nutrition 0.000 description 2
- 241001092459 Rubus Species 0.000 description 2
- 241000209051 Saccharum Species 0.000 description 2
- 108091081021 Sense strand Proteins 0.000 description 2
- 108091027967 Small hairpin RNA Proteins 0.000 description 2
- 241000208292 Solanaceae Species 0.000 description 2
- 241000207763 Solanum Species 0.000 description 2
- 241000736851 Tagetes Species 0.000 description 2
- 240000004584 Tamarindus indica Species 0.000 description 2
- 235000004298 Tamarindus indica Nutrition 0.000 description 2
- 244000269722 Thea sinensis Species 0.000 description 2
- 244000299461 Theobroma cacao Species 0.000 description 2
- 235000009470 Theobroma cacao Nutrition 0.000 description 2
- 102000008579 Transposases Human genes 0.000 description 2
- 108010020764 Transposases Proteins 0.000 description 2
- 241000219793 Trifolium Species 0.000 description 2
- 235000007264 Triticum durum Nutrition 0.000 description 2
- 235000007251 Triticum monococcum Nutrition 0.000 description 2
- 241000209143 Triticum turgidum subsp. durum Species 0.000 description 2
- 235000004424 Tropaeolum majus Nutrition 0.000 description 2
- 240000001260 Tropaeolum majus Species 0.000 description 2
- ZQOOYCZQENFIMC-STQMWFEESA-N Tyr-His Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1N=CNC=1)C(O)=O)C1=CC=C(O)C=C1 ZQOOYCZQENFIMC-STQMWFEESA-N 0.000 description 2
- 241000736767 Vaccinium Species 0.000 description 2
- 241000219873 Vicia Species 0.000 description 2
- 241000219977 Vigna Species 0.000 description 2
- 240000009038 Viola odorata Species 0.000 description 2
- 235000013487 Viola odorata Nutrition 0.000 description 2
- 241000219095 Vitis Species 0.000 description 2
- 241001247821 Ziziphus Species 0.000 description 2
- DPDMMXDBJGCCQC-UHFFFAOYSA-N [Na].[Cl] Chemical compound [Na].[Cl] DPDMMXDBJGCCQC-UHFFFAOYSA-N 0.000 description 2
- XJLXINKUBYWONI-DQQFMEOOSA-N [[(2r,3r,4r,5r)-5-(6-aminopurin-9-yl)-3-hydroxy-4-phosphonooxyoxolan-2-yl]methoxy-hydroxyphosphoryl] [(2s,3r,4s,5s)-5-(3-carbamoylpyridin-1-ium-1-yl)-3,4-dihydroxyoxolan-2-yl]methyl phosphate Chemical compound NC(=O)C1=CC=C[N+]([C@@H]2[C@H]([C@@H](O)[C@H](COP([O-])(=O)OP(O)(=O)OC[C@@H]3[C@H]([C@@H](OP(O)(O)=O)[C@@H](O3)N3C4=NC=NC(N)=C4N=C3)O)O2)O)=C1 XJLXINKUBYWONI-DQQFMEOOSA-N 0.000 description 2
- 238000009825 accumulation Methods 0.000 description 2
- DZBUGLKDJFMEHC-UHFFFAOYSA-N acridine Chemical compound C1=CC=CC2=CC3=CC=CC=C3N=C21 DZBUGLKDJFMEHC-UHFFFAOYSA-N 0.000 description 2
- 229910000147 aluminium phosphate Inorganic materials 0.000 description 2
- 230000003321 amplification Effects 0.000 description 2
- 238000000137 annealing Methods 0.000 description 2
- 239000000427 antigen Substances 0.000 description 2
- 102000036639 antigens Human genes 0.000 description 2
- 230000003078 antioxidant effect Effects 0.000 description 2
- 238000009305 arable farming Methods 0.000 description 2
- 230000001580 bacterial effect Effects 0.000 description 2
- 230000008827 biological function Effects 0.000 description 2
- 244000022203 blackseeded proso millet Species 0.000 description 2
- 229910052796 boron Inorganic materials 0.000 description 2
- 239000000872 buffer Substances 0.000 description 2
- 239000000969 carrier Substances 0.000 description 2
- 150000001768 cations Chemical class 0.000 description 2
- 230000021164 cell adhesion Effects 0.000 description 2
- 210000000170 cell membrane Anatomy 0.000 description 2
- 231100000045 chemical toxicity Toxicity 0.000 description 2
- 239000002299 complementary DNA Substances 0.000 description 2
- 150000001875 compounds Chemical class 0.000 description 2
- 238000013523 data management Methods 0.000 description 2
- 230000007547 defect Effects 0.000 description 2
- 238000012217 deletion Methods 0.000 description 2
- 230000037430 deletion Effects 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000018109 developmental process Effects 0.000 description 2
- 230000009025 developmental regulation Effects 0.000 description 2
- 238000007598 dipping method Methods 0.000 description 2
- 238000009826 distribution Methods 0.000 description 2
- 238000004520 electroporation Methods 0.000 description 2
- 230000002255 enzymatic effect Effects 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- 238000012239 gene modification Methods 0.000 description 2
- 230000005017 genetic modification Effects 0.000 description 2
- 235000013617 genetically modified food Nutrition 0.000 description 2
- 229930004094 glycosylphosphatidylinositol Natural products 0.000 description 2
- 239000005090 green fluorescent protein Substances 0.000 description 2
- 230000002363 herbicidal effect Effects 0.000 description 2
- 239000004009 herbicide Substances 0.000 description 2
- 238000003384 imaging method Methods 0.000 description 2
- 230000001976 improved effect Effects 0.000 description 2
- 238000000126 in silico method Methods 0.000 description 2
- 238000001727 in vivo Methods 0.000 description 2
- 230000000977 initiatory effect Effects 0.000 description 2
- 238000002347 injection Methods 0.000 description 2
- 239000007924 injection Substances 0.000 description 2
- 230000010354 integration Effects 0.000 description 2
- 230000000968 intestinal effect Effects 0.000 description 2
- 229910052742 iron Inorganic materials 0.000 description 2
- 239000011777 magnesium Substances 0.000 description 2
- 229910052749 magnesium Inorganic materials 0.000 description 2
- WPBNNNQJVZRUHP-UHFFFAOYSA-L manganese(2+);methyl n-[[2-(methoxycarbonylcarbamothioylamino)phenyl]carbamothioyl]carbamate;n-[2-(sulfidocarbothioylamino)ethyl]carbamodithioate Chemical compound [Mn+2].[S-]C(=S)NCCNC([S-])=S.COC(=O)NC(=S)NC1=CC=CC=C1NC(=S)NC(=O)OC WPBNNNQJVZRUHP-UHFFFAOYSA-L 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 238000002844 melting Methods 0.000 description 2
- 230000008018 melting Effects 0.000 description 2
- 239000012528 membrane Substances 0.000 description 2
- 230000004060 metabolic process Effects 0.000 description 2
- 239000002679 microRNA Substances 0.000 description 2
- 244000005700 microbiome Species 0.000 description 2
- 238000010369 molecular cloning Methods 0.000 description 2
- 238000012544 monitoring process Methods 0.000 description 2
- 231100000219 mutagenic Toxicity 0.000 description 2
- 230000003505 mutagenic effect Effects 0.000 description 2
- 108010058731 nopaline synthase Proteins 0.000 description 2
- 238000003199 nucleic acid amplification method Methods 0.000 description 2
- 238000003499 nucleic acid array Methods 0.000 description 2
- 239000002853 nucleic acid probe Substances 0.000 description 2
- 210000004940 nucleus Anatomy 0.000 description 2
- 230000008723 osmotic stress Effects 0.000 description 2
- 230000003647 oxidation Effects 0.000 description 2
- 238000007254 oxidation reaction Methods 0.000 description 2
- 230000026731 phosphorylation Effects 0.000 description 2
- 238000006366 phosphorylation reaction Methods 0.000 description 2
- 230000035479 physiological effects, processes and functions Effects 0.000 description 2
- 230000037039 plant physiology Effects 0.000 description 2
- 229920000642 polymer Polymers 0.000 description 2
- 229920001282 polysaccharide Polymers 0.000 description 2
- 239000005017 polysaccharide Substances 0.000 description 2
- 239000011591 potassium Substances 0.000 description 2
- 229910052700 potassium Inorganic materials 0.000 description 2
- 239000002243 precursor Substances 0.000 description 2
- 238000005316 response function Methods 0.000 description 2
- 238000007894 restriction fragment length polymorphism technique Methods 0.000 description 2
- 239000002336 ribonucleotide Substances 0.000 description 2
- 230000002786 root growth Effects 0.000 description 2
- 230000019491 signal transduction Effects 0.000 description 2
- 230000008054 signal transmission Effects 0.000 description 2
- 239000002689 soil Substances 0.000 description 2
- 238000007619 statistical method Methods 0.000 description 2
- 230000000638 stimulation Effects 0.000 description 2
- 230000004083 survival effect Effects 0.000 description 2
- 230000005026 transcription initiation Effects 0.000 description 2
- 239000005418 vegetable material Substances 0.000 description 2
- NWXMGUDVXFXRIG-WESIUVDSSA-N (4s,4as,5as,6s,12ar)-4-(dimethylamino)-1,6,10,11,12a-pentahydroxy-6-methyl-3,12-dioxo-4,4a,5,5a-tetrahydrotetracene-2-carboxamide Chemical compound C1=CC=C2[C@](O)(C)[C@H]3C[C@H]4[C@H](N(C)C)C(=O)C(C(N)=O)=C(O)[C@@]4(O)C(=O)C3=C(O)C2=C1O NWXMGUDVXFXRIG-WESIUVDSSA-N 0.000 description 1
- MPCAJMNYNOGXPB-SLPGGIOYSA-N 1,5-anhydro-D-glucitol Chemical compound OC[C@H]1OC[C@H](O)[C@@H](O)[C@@H]1O MPCAJMNYNOGXPB-SLPGGIOYSA-N 0.000 description 1
- 108020004463 18S ribosomal RNA Proteins 0.000 description 1
- CAAMSDWKXXPUJR-UHFFFAOYSA-N 3,5-dihydro-4H-imidazol-4-one Chemical compound O=C1CNC=N1 CAAMSDWKXXPUJR-UHFFFAOYSA-N 0.000 description 1
- OPIFSICVWOWJMJ-AEOCFKNESA-N 5-bromo-4-chloro-3-indolyl beta-D-galactoside Chemical compound O[C@@H]1[C@@H](O)[C@@H](O)[C@@H](CO)O[C@H]1OC1=CNC2=CC=C(Br)C(Cl)=C12 OPIFSICVWOWJMJ-AEOCFKNESA-N 0.000 description 1
- 241001290610 Abildgaardia Species 0.000 description 1
- 241000208140 Acer Species 0.000 description 1
- 102000005869 Activating Transcription Factors Human genes 0.000 description 1
- 108010005254 Activating Transcription Factors Proteins 0.000 description 1
- 229920001817 Agar Polymers 0.000 description 1
- 241000209136 Agropyron Species 0.000 description 1
- HOVPGJUNRLMIOZ-CIUDSAMLSA-N Ala-Ser-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@H](C)N HOVPGJUNRLMIOZ-CIUDSAMLSA-N 0.000 description 1
- QGZKDVFQNNGYKY-UHFFFAOYSA-O Ammonium Chemical compound [NH4+] QGZKDVFQNNGYKY-UHFFFAOYSA-O 0.000 description 1
- 235000003840 Amygdalus nana Nutrition 0.000 description 1
- 235000007755 Annona Nutrition 0.000 description 1
- 235000011518 Annona purpurea Nutrition 0.000 description 1
- 240000006199 Annona purpurea Species 0.000 description 1
- 101710117679 Anthocyanidin 3-O-glucosyltransferase Proteins 0.000 description 1
- 235000002764 Apium graveolens Nutrition 0.000 description 1
- 235000015849 Apium graveolens Dulce Group Nutrition 0.000 description 1
- 241001605719 Appias drusilla Species 0.000 description 1
- 235000010591 Appio Nutrition 0.000 description 1
- 101100490659 Arabidopsis thaliana AGP17 gene Proteins 0.000 description 1
- 101100012983 Arabidopsis thaliana FLA1 gene Proteins 0.000 description 1
- 101000755584 Arabidopsis thaliana Non-classical arabinogalactan protein 30 Proteins 0.000 description 1
- 235000003911 Arachis Nutrition 0.000 description 1
- 102000008682 Argonaute Proteins Human genes 0.000 description 1
- 108010088141 Argonaute Proteins Proteins 0.000 description 1
- 241001167018 Aroa Species 0.000 description 1
- 108090000328 Arrestin Proteins 0.000 description 1
- 102000003916 Arrestin Human genes 0.000 description 1
- OVPHVTCDVYYTHN-AVGNSLFASA-N Asp-Glu-Phe Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 OVPHVTCDVYYTHN-AVGNSLFASA-N 0.000 description 1
- 235000005340 Asparagus officinalis Nutrition 0.000 description 1
- 241000972773 Aulopiformes Species 0.000 description 1
- 235000005781 Avena Nutrition 0.000 description 1
- 235000009393 Avena byzantina Nutrition 0.000 description 1
- 235000007320 Avena fatua Nutrition 0.000 description 1
- 241000209764 Avena fatua Species 0.000 description 1
- 235000018410 Avena fatua var sativa Nutrition 0.000 description 1
- 240000000372 Avena hybrida Species 0.000 description 1
- 235000009123 Avena hybrida Nutrition 0.000 description 1
- 241000193830 Bacillus <bacterium> Species 0.000 description 1
- 241000209128 Bambusa Species 0.000 description 1
- 235000016068 Berberis vulgaris Nutrition 0.000 description 1
- 235000021533 Beta vulgaris Nutrition 0.000 description 1
- 108010006654 Bleomycin Proteins 0.000 description 1
- 235000004480 Bombax malabaricum Nutrition 0.000 description 1
- 235000011331 Brassica Nutrition 0.000 description 1
- 235000014698 Brassica juncea var multisecta Nutrition 0.000 description 1
- 235000011297 Brassica napobrassica Nutrition 0.000 description 1
- 235000006008 Brassica napus var napus Nutrition 0.000 description 1
- 240000000385 Brassica napus var. napus Species 0.000 description 1
- 240000008100 Brassica rapa Species 0.000 description 1
- 235000011292 Brassica rapa Nutrition 0.000 description 1
- 235000006618 Brassica rapa subsp oleifera Nutrition 0.000 description 1
- 235000000540 Brassica rapa subsp rapa Nutrition 0.000 description 1
- 235000004977 Brassica sinapistrum Nutrition 0.000 description 1
- 235000004936 Bromus mango Nutrition 0.000 description 1
- 235000008635 Cadaba farinosa Nutrition 0.000 description 1
- 241000628166 Cadaba farinosa Species 0.000 description 1
- UXVMQQNJUSDDNG-UHFFFAOYSA-L Calcium chloride Chemical compound [Cl-].[Cl-].[Ca+2] UXVMQQNJUSDDNG-UHFFFAOYSA-L 0.000 description 1
- 101100227198 Campylobacter jejuni flaA gene Proteins 0.000 description 1
- 244000292211 Canna coccinea Species 0.000 description 1
- 235000005273 Canna coccinea Nutrition 0.000 description 1
- 241000684239 Canna x generalis Species 0.000 description 1
- 235000008697 Cannabis sativa Nutrition 0.000 description 1
- 235000012766 Cannabis sativa ssp. sativa var. sativa Nutrition 0.000 description 1
- 235000012765 Cannabis sativa ssp. sativa var. spontanea Nutrition 0.000 description 1
- 235000002566 Capsicum Nutrition 0.000 description 1
- 101710132601 Capsid protein Proteins 0.000 description 1
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 1
- 241000973255 Carex elata Species 0.000 description 1
- 244000146553 Ceiba pentandra Species 0.000 description 1
- 235000003301 Ceiba pentandra Nutrition 0.000 description 1
- 108010001857 Cell Surface Receptors Proteins 0.000 description 1
- 241001148660 Cenchrus sp. Species 0.000 description 1
- 108091092236 Chimeric RNA Proteins 0.000 description 1
- 240000006740 Cichorium endivia Species 0.000 description 1
- 235000018536 Cichorium endivia Nutrition 0.000 description 1
- 241000723347 Cinnamomum Species 0.000 description 1
- 235000009831 Citrullus lanatus Nutrition 0.000 description 1
- 235000012828 Citrullus lanatus var citroides Nutrition 0.000 description 1
- 244000175448 Citrus madurensis Species 0.000 description 1
- 101710094648 Coat protein Proteins 0.000 description 1
- 241000737241 Cocos Species 0.000 description 1
- 244000060011 Cocos nucifera Species 0.000 description 1
- 108091033380 Coding strand Proteins 0.000 description 1
- 244000228088 Cola acuminata Species 0.000 description 1
- 241000020428 Colea Species 0.000 description 1
- 108020004394 Complementary RNA Chemical group 0.000 description 1
- 241000332384 Corchorus Species 0.000 description 1
- 235000014493 Crataegus Nutrition 0.000 description 1
- 241001092040 Crataegus Species 0.000 description 1
- 240000000171 Crataegus monogyna Species 0.000 description 1
- 235000015655 Crocus sativus Nutrition 0.000 description 1
- 244000124209 Crocus sativus Species 0.000 description 1
- 241000195493 Cryptophyta Species 0.000 description 1
- 235000010071 Cucumis prophetarum Nutrition 0.000 description 1
- 235000003198 Cynara Nutrition 0.000 description 1
- 241000208947 Cynara Species 0.000 description 1
- 244000019459 Cynara cardunculus Species 0.000 description 1
- IGXWBGJHJZYPQS-SSDOTTSWSA-N D-Luciferin Chemical compound OC(=O)[C@H]1CSC(C=2SC3=CC=C(O)C=C3N=2)=N1 IGXWBGJHJZYPQS-SSDOTTSWSA-N 0.000 description 1
- 230000004544 DNA amplification Effects 0.000 description 1
- 102000004163 DNA-directed RNA polymerases Human genes 0.000 description 1
- 108090000626 DNA-directed RNA polymerases Proteins 0.000 description 1
- 240000004585 Dactylis glomerata Species 0.000 description 1
- 244000000626 Daucus carota Species 0.000 description 1
- 235000002767 Daucus carota Nutrition 0.000 description 1
- CYCGRDQQIOGCKX-UHFFFAOYSA-N Dehydro-luciferin Natural products OC(=O)C1=CSC(C=2SC3=CC(O)=CC=C3N=2)=N1 CYCGRDQQIOGCKX-UHFFFAOYSA-N 0.000 description 1
- 101000802895 Dendroaspis angusticeps Fasciculin-1 Proteins 0.000 description 1
- 241000522190 Desmodium Species 0.000 description 1
- 102000040623 Dicer family Human genes 0.000 description 1
- 108091070648 Dicer family Proteins 0.000 description 1
- 241001163054 Dichelachne Species 0.000 description 1
- 235000000525 Dimocarpus longan Nutrition 0.000 description 1
- 235000005903 Dioscorea Nutrition 0.000 description 1
- 235000000504 Dioscorea villosa Nutrition 0.000 description 1
- 244000236655 Diospyros kaki Species 0.000 description 1
- 241001057636 Dracaena deremensis Species 0.000 description 1
- 241000255601 Drosophila melanogaster Species 0.000 description 1
- 241000512897 Elaeis Species 0.000 description 1
- 235000001942 Elaeis Nutrition 0.000 description 1
- 235000018060 Elaeis melanococca Nutrition 0.000 description 1
- 235000007349 Eleusine coracana Nutrition 0.000 description 1
- 235000013499 Eleusine coracana subsp coracana Nutrition 0.000 description 1
- 101000925662 Enterobacteria phage PRD1 Endolysin Proteins 0.000 description 1
- YQYJSBFKSSDGFO-UHFFFAOYSA-N Epihygromycin Natural products OC1C(O)C(C(=O)C)OC1OC(C(=C1)O)=CC=C1C=C(C)C(=O)NC1C(O)C(O)C2OCOC2C1O YQYJSBFKSSDGFO-UHFFFAOYSA-N 0.000 description 1
- 235000014966 Eragrostis abyssinica Nutrition 0.000 description 1
- 244000140063 Eragrostis abyssinica Species 0.000 description 1
- 108700039887 Essential Genes Proteins 0.000 description 1
- 108090000371 Esterases Proteins 0.000 description 1
- 244000004281 Eucalyptus maculata Species 0.000 description 1
- 244000080545 Eucalyptus sp Species 0.000 description 1
- 235000006914 Eucalyptus sp Nutrition 0.000 description 1
- 235000013420 Eugenia uniflora Nutrition 0.000 description 1
- 240000003813 Eugenia uniflora Species 0.000 description 1
- 101710129170 Extensin Proteins 0.000 description 1
- 235000009419 Fagopyrum esculentum Nutrition 0.000 description 1
- 241001070947 Fagus Species 0.000 description 1
- 101710172176 Fasciclin-1 Proteins 0.000 description 1
- 241000234643 Festuca arundinacea Species 0.000 description 1
- 235000008730 Ficus carica Nutrition 0.000 description 1
- 244000025361 Ficus carica Species 0.000 description 1
- BJGNCJDXODQBOB-UHFFFAOYSA-N Fivefly Luciferin Natural products OC(=O)C1CSC(C=2SC3=CC(O)=CC=C3N=2)=N1 BJGNCJDXODQBOB-UHFFFAOYSA-N 0.000 description 1
- 235000017317 Fortunella Nutrition 0.000 description 1
- 108700028146 Genetic Enhancer Elements Proteins 0.000 description 1
- CEAZRRDELHUEMR-URQXQFDESA-N Gentamicin Chemical compound O1[C@H](C(C)NC)CC[C@@H](N)[C@H]1O[C@H]1[C@H](O)[C@@H](O[C@@H]2[C@@H]([C@@H](NC)[C@@](C)(O)CO2)O)[C@H](N)C[C@@H]1N CEAZRRDELHUEMR-URQXQFDESA-N 0.000 description 1
- 229930182566 Gentamicin Natural products 0.000 description 1
- 235000011201 Ginkgo Nutrition 0.000 description 1
- TWHDOEYLXXQYOZ-FXQIFTODSA-N Gln-Asn-Gln Chemical compound C(CC(=O)N)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N TWHDOEYLXXQYOZ-FXQIFTODSA-N 0.000 description 1
- SDSMVVSHLAAOJL-UKJIMTQDSA-N Gln-Val-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CCC(=O)N)N SDSMVVSHLAAOJL-UKJIMTQDSA-N 0.000 description 1
- 108010070675 Glutathione transferase Proteins 0.000 description 1
- 102000005720 Glutathione transferase Human genes 0.000 description 1
- QCTLGOYODITHPQ-WHFBIAKZSA-N Gly-Cys-Ser Chemical compound [H]NCC(=O)N[C@@H](CS)C(=O)N[C@@H](CO)C(O)=O QCTLGOYODITHPQ-WHFBIAKZSA-N 0.000 description 1
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 1
- 239000005562 Glyphosate Substances 0.000 description 1
- 102100021181 Golgi phosphoprotein 3 Human genes 0.000 description 1
- 235000009429 Gossypium barbadense Nutrition 0.000 description 1
- 235000009432 Gossypium hirsutum Nutrition 0.000 description 1
- 108010043121 Green Fluorescent Proteins Proteins 0.000 description 1
- 102000004144 Green Fluorescent Proteins Human genes 0.000 description 1
- 101150105462 HIS6 gene Proteins 0.000 description 1
- 108090001102 Hammerhead ribozyme Proteins 0.000 description 1
- 241000227166 Harrimanella hypnoides Species 0.000 description 1
- 102000002812 Heat-Shock Proteins Human genes 0.000 description 1
- 108010004889 Heat-Shock Proteins Proteins 0.000 description 1
- 241000238631 Hexapoda Species 0.000 description 1
- 244000284380 Hibiscus rosa sinensis Species 0.000 description 1
- RNAYRCNHRYEBTH-IHRRRGAJSA-N His-Met-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(C)C)C(O)=O RNAYRCNHRYEBTH-IHRRRGAJSA-N 0.000 description 1
- 229930010555 Inosine Natural products 0.000 description 1
- UGQMRVRMYYASKQ-KQYNXXCUSA-N Inosine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C2=NC=NC(O)=C2N=C1 UGQMRVRMYYASKQ-KQYNXXCUSA-N 0.000 description 1
- 235000013757 Juglans Nutrition 0.000 description 1
- 101100288095 Klebsiella pneumoniae neo gene Proteins 0.000 description 1
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 description 1
- 125000000570 L-alpha-aspartyl group Chemical group [H]OC(=O)C([H])([H])[C@]([H])(N([H])[H])C(*)=O 0.000 description 1
- 125000002842 L-seryl group Chemical group O=C([*])[C@](N([H])[H])([H])C([H])([H])O[H] 0.000 description 1
- 125000003798 L-tyrosyl group Chemical group [H]N([H])[C@]([H])(C(=O)[*])C([H])([H])C1=C([H])C([H])=C(O[H])C([H])=C1[H] 0.000 description 1
- KUIDCYNIEJBZBU-AJNGGQMLSA-N Leu-Ile-Leu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O KUIDCYNIEJBZBU-AJNGGQMLSA-N 0.000 description 1
- 108060001084 Luciferase Proteins 0.000 description 1
- 239000005089 Luciferase Substances 0.000 description 1
- DDWFXDSYGUXRAY-UHFFFAOYSA-N Luciferin Natural products CCc1c(C)c(CC2NC(=O)C(=C2C=C)C)[nH]c1Cc3[nH]c4C(=C5/NC(CC(=O)O)C(C)C5CC(=O)O)CC(=O)c4c3C DDWFXDSYGUXRAY-UHFFFAOYSA-N 0.000 description 1
- 235000018780 Luffa acutangula Nutrition 0.000 description 1
- 244000280244 Luffa acutangula Species 0.000 description 1
- 241000605547 Luzula sylvatica Species 0.000 description 1
- 241000227653 Lycopersicon Species 0.000 description 1
- 235000002262 Lycopersicon Nutrition 0.000 description 1
- 244000276497 Lycopersicon esculentum Species 0.000 description 1
- 241001300479 Macroptilium Species 0.000 description 1
- 241000219816 Macrotyloma Species 0.000 description 1
- 101710125418 Major capsid protein Proteins 0.000 description 1
- 101710175625 Maltose/maltodextrin-binding periplasmic protein Proteins 0.000 description 1
- 235000000889 Mammea americana Nutrition 0.000 description 1
- 240000005984 Mammea americana Species 0.000 description 1
- 235000011339 Manilkara zapota Nutrition 0.000 description 1
- 235000000088 Maracuja Nutrition 0.000 description 1
- 241000219823 Medicago Species 0.000 description 1
- 240000004658 Medicago sativa Species 0.000 description 1
- 235000010624 Medicago sativa Nutrition 0.000 description 1
- 235000017587 Medicago sativa ssp. sativa Nutrition 0.000 description 1
- 235000014435 Mentha Nutrition 0.000 description 1
- 108700011259 MicroRNAs Proteins 0.000 description 1
- 241000878006 Miscanthus sinensis Species 0.000 description 1
- 235000009815 Momordica Nutrition 0.000 description 1
- 101710135898 Myc proto-oncogene protein Proteins 0.000 description 1
- 102100038895 Myc proto-oncogene protein Human genes 0.000 description 1
- 230000004988 N-glycosylation Effects 0.000 description 1
- KZNQNBZMBZJQJO-UHFFFAOYSA-N N-glycyl-L-proline Natural products NCC(=O)N1CCCC1C(O)=O KZNQNBZMBZJQJO-UHFFFAOYSA-N 0.000 description 1
- 101710138959 NAD-specific glutamate dehydrogenase Proteins 0.000 description 1
- 101710089878 NADP-specific glutamate dehydrogenase Proteins 0.000 description 1
- 241001230286 Narenga Species 0.000 description 1
- 241000244206 Nematoda Species 0.000 description 1
- 244000183278 Nephelium litchi Species 0.000 description 1
- 235000015742 Nephelium litchi Nutrition 0.000 description 1
- 101100049938 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) exr-1 gene Proteins 0.000 description 1
- 101100395023 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) his-7 gene Proteins 0.000 description 1
- 239000000020 Nitrocellulose Substances 0.000 description 1
- 101710141454 Nucleoprotein Proteins 0.000 description 1
- 239000004677 Nylon Substances 0.000 description 1
- 229930182473 O-glycoside Natural products 0.000 description 1
- 150000008444 O-glycosides Chemical class 0.000 description 1
- 230000004989 O-glycosylation Effects 0.000 description 1
- 240000001439 Opuntia Species 0.000 description 1
- 241001446528 Ornithopus Species 0.000 description 1
- 240000001516 Oryza latifolia Species 0.000 description 1
- 108700023764 Oryza sativa OSH1 Proteins 0.000 description 1
- 101710160107 Outer membrane protein A Proteins 0.000 description 1
- 102000004316 Oxidoreductases Human genes 0.000 description 1
- 108090000854 Oxidoreductases Proteins 0.000 description 1
- 238000012408 PCR amplification Methods 0.000 description 1
- 235000000370 Passiflora edulis Nutrition 0.000 description 1
- 235000002769 Pastinaca sativa Nutrition 0.000 description 1
- 241000209046 Pennisetum Species 0.000 description 1
- 108091005804 Peptidases Proteins 0.000 description 1
- 102000035195 Peptidases Human genes 0.000 description 1
- 241000405070 Percophidae Species 0.000 description 1
- 206010034719 Personality change Diseases 0.000 description 1
- 241000745991 Phalaris Species 0.000 description 1
- 244000081757 Phalaris arundinacea Species 0.000 description 1
- RVRRHFPCEOVRKQ-KKUMJFAQSA-N Phe-His-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)N[C@@H](CC(=O)N)C(=O)O)N RVRRHFPCEOVRKQ-KKUMJFAQSA-N 0.000 description 1
- 241000746983 Phleum pratense Species 0.000 description 1
- 241000233805 Phoenix Species 0.000 description 1
- IAJOBQBIJHVGMQ-UHFFFAOYSA-N Phosphinothricin Natural products CP(O)(=O)CCC(N)C(O)=O IAJOBQBIJHVGMQ-UHFFFAOYSA-N 0.000 description 1
- 108091000080 Phosphotransferase Proteins 0.000 description 1
- 244000273256 Phragmites communis Species 0.000 description 1
- 241000195888 Physcomitrella Species 0.000 description 1
- 241000195887 Physcomitrella patens Species 0.000 description 1
- 241000218602 Pinus <genus> Species 0.000 description 1
- 241000209048 Poa Species 0.000 description 1
- 229920003171 Poly (ethylene oxide) Polymers 0.000 description 1
- 241000218976 Populus trichocarpa Species 0.000 description 1
- QMABBZHZMDXHKU-FKBYEOEOSA-N Pro-Tyr-Trp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O QMABBZHZMDXHKU-FKBYEOEOSA-N 0.000 description 1
- 101710083689 Probable capsid protein Proteins 0.000 description 1
- 101800004937 Protein C Proteins 0.000 description 1
- 108010076504 Protein Sorting Signals Proteins 0.000 description 1
- 235000011432 Prunus Nutrition 0.000 description 1
- 235000019057 Raphanus caudatus Nutrition 0.000 description 1
- 235000011380 Raphanus sativus Nutrition 0.000 description 1
- 235000006140 Raphanus sativus var sativus Nutrition 0.000 description 1
- 108020004511 Recombinant DNA Proteins 0.000 description 1
- 108091027981 Response element Proteins 0.000 description 1
- 235000011483 Ribes Nutrition 0.000 description 1
- 241000220483 Ribes Species 0.000 description 1
- 244000281247 Ribes rubrum Species 0.000 description 1
- 241000124033 Salix Species 0.000 description 1
- 241000921305 Salix sp. Species 0.000 description 1
- 241000208829 Sambucus Species 0.000 description 1
- 101800001700 Saposin-D Proteins 0.000 description 1
- 102400000827 Saposin-D Human genes 0.000 description 1
- 244000082988 Secale cereale Species 0.000 description 1
- 241000228160 Secale cereale x Triticum aestivum Species 0.000 description 1
- 241000125165 Selinum Species 0.000 description 1
- CWHJIJJSDGEHNS-MYLFLSLOSA-N Senegenin Chemical compound C1[C@H](O)[C@H](O)[C@@](C)(C(O)=O)[C@@H]2CC[C@@]3(C)C(CC[C@]4(CCC(C[C@H]44)(C)C)C(O)=O)=C4[C@@H](CCl)C[C@@H]3[C@]21C CWHJIJJSDGEHNS-MYLFLSLOSA-N 0.000 description 1
- 229920002684 Sepharose Polymers 0.000 description 1
- 235000009367 Sesamum alatum Nutrition 0.000 description 1
- 240000000452 Sesamum alatum Species 0.000 description 1
- 235000003434 Sesamum indicum Nutrition 0.000 description 1
- 241000220261 Sinapis Species 0.000 description 1
- 241000543826 Sinobambusa Species 0.000 description 1
- 235000002634 Solanum Nutrition 0.000 description 1
- 244000244100 Solanum integrifolium Species 0.000 description 1
- 235000000099 Solanum integrifolium Nutrition 0.000 description 1
- 235000002597 Solanum melongena Nutrition 0.000 description 1
- 244000061458 Solanum melongena Species 0.000 description 1
- 235000006745 Sonchus oleraceus Nutrition 0.000 description 1
- 244000113428 Sonchus oleraceus Species 0.000 description 1
- 235000007230 Sorghum bicolor Nutrition 0.000 description 1
- 238000002105 Southern blotting Methods 0.000 description 1
- 241000219315 Spinacia Species 0.000 description 1
- 244000300264 Spinacia oleracea Species 0.000 description 1
- 235000009184 Spondias indica Nutrition 0.000 description 1
- 229920002472 Starch Polymers 0.000 description 1
- 108091081024 Start codon Proteins 0.000 description 1
- 101710172711 Structural protein Proteins 0.000 description 1
- 244000045719 Syzygium Species 0.000 description 1
- 108700026226 TATA Box Proteins 0.000 description 1
- 235000012308 Tagetes Nutrition 0.000 description 1
- 108700007696 Tetrahydrofolate Dehydrogenase Proteins 0.000 description 1
- 235000006468 Thea sinensis Nutrition 0.000 description 1
- RYYWUUFWQRZTIU-UHFFFAOYSA-N Thiophosphoric acid Chemical class OP(O)(S)=O RYYWUUFWQRZTIU-UHFFFAOYSA-N 0.000 description 1
- 101710150448 Transcriptional regulator Myc Proteins 0.000 description 1
- 235000007218 Tripsacum dactyloides Nutrition 0.000 description 1
- 244000082267 Tripsacum dactyloides Species 0.000 description 1
- 235000007247 Triticum turgidum Nutrition 0.000 description 1
- 240000002805 Triticum turgidum Species 0.000 description 1
- 241001530121 Trollius Species 0.000 description 1
- 235000018946 Tropaeolum minus Nutrition 0.000 description 1
- 240000008573 Tropaeolum minus Species 0.000 description 1
- ZKVANNIVSDOQMG-HKUYNNGSSA-N Trp-Tyr-Gly Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC3=CC=C(C=C3)O)C(=O)NCC(=O)O)N ZKVANNIVSDOQMG-HKUYNNGSSA-N 0.000 description 1
- CRHFOYCJGVJPLE-AVGNSLFASA-N Tyr-Gln-Asn Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC(=O)N)C(=O)O)N)O CRHFOYCJGVJPLE-AVGNSLFASA-N 0.000 description 1
- 235000012511 Vaccinium Nutrition 0.000 description 1
- PAPWZOJOLKZEFR-AVGNSLFASA-N Val-Arg-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCCN)C(=O)O)N PAPWZOJOLKZEFR-AVGNSLFASA-N 0.000 description 1
- GBESYURLQOYWLU-LAEOZQHASA-N Val-Glu-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N GBESYURLQOYWLU-LAEOZQHASA-N 0.000 description 1
- 240000004922 Vigna radiata Species 0.000 description 1
- 235000010721 Vigna radiata var radiata Nutrition 0.000 description 1
- 235000011469 Vigna radiata var sublobata Nutrition 0.000 description 1
- 241001464837 Viridiplantae Species 0.000 description 1
- 235000009392 Vitis Nutrition 0.000 description 1
- 241000307523 Xenostegia media Species 0.000 description 1
- 108700040099 Xylose isomerases Proteins 0.000 description 1
- 235000016383 Zea mays subsp huehuetenangensis Nutrition 0.000 description 1
- 241000746966 Zizania Species 0.000 description 1
- 235000002636 Zizania aquatica Nutrition 0.000 description 1
- 241001478412 Zizania palustris Species 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 230000003213 activating effect Effects 0.000 description 1
- 239000013543 active substance Substances 0.000 description 1
- 230000010933 acylation Effects 0.000 description 1
- 238000005917 acylation reaction Methods 0.000 description 1
- 239000008272 agar Substances 0.000 description 1
- 244000193174 agave Species 0.000 description 1
- 101150099105 alien gene Proteins 0.000 description 1
- WQZGKKKJIJFFOK-PQMKYFCFSA-N alpha-D-mannose Chemical compound OC[C@H]1O[C@H](O)[C@@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-PQMKYFCFSA-N 0.000 description 1
- 238000004176 ammonification Methods 0.000 description 1
- KLOHDWPABZXLGI-YWUHCJSESA-M ampicillin sodium Chemical compound [Na+].C1([C@@H](N)C(=O)N[C@H]2[C@H]3SC([C@@H](N3C2=O)C([O-])=O)(C)C)=CC=CC=C1 KLOHDWPABZXLGI-YWUHCJSESA-M 0.000 description 1
- 238000004873 anchoring Methods 0.000 description 1
- 235000019728 animal nutrition Nutrition 0.000 description 1
- 239000003242 anti bacterial agent Substances 0.000 description 1
- 229940088710 antibiotic agent Drugs 0.000 description 1
- 108091007433 antigens Proteins 0.000 description 1
- 239000002246 antineoplastic agent Substances 0.000 description 1
- 229940041181 antineoplastic drug Drugs 0.000 description 1
- 239000003963 antioxidant agent Substances 0.000 description 1
- 235000006708 antioxidants Nutrition 0.000 description 1
- 239000000074 antisense oligonucleotide Substances 0.000 description 1
- 238000012230 antisense oligonucleotides Methods 0.000 description 1
- 239000001387 apium graveolens Substances 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 108010054251 arabinogalactan proteins Proteins 0.000 description 1
- PYMYPHUHKUWMLA-UHFFFAOYSA-N arabinose Natural products OCC(O)C(O)C(O)C=O PYMYPHUHKUWMLA-UHFFFAOYSA-N 0.000 description 1
- 238000000211 autoradiogram Methods 0.000 description 1
- 239000011324 bead Substances 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- SRBFZHDQGSBBOR-UHFFFAOYSA-N beta-D-Pyranose-Lyxose Natural products OC1COC(O)C(O)C1O SRBFZHDQGSBBOR-UHFFFAOYSA-N 0.000 description 1
- 238000004166 bioassay Methods 0.000 description 1
- 239000002551 biofuel Substances 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 229930189065 blasticidin Natural products 0.000 description 1
- 229960001561 bleomycin Drugs 0.000 description 1
- OYVAGSVQBOHSSS-UAPAGMARSA-O bleomycin A2 Chemical compound N([C@H](C(=O)N[C@H](C)[C@@H](O)[C@H](C)C(=O)N[C@@H]([C@H](O)C)C(=O)NCCC=1SC=C(N=1)C=1SC=C(N=1)C(=O)NCCC[S+](C)C)[C@@H](O[C@H]1[C@H]([C@@H](O)[C@H](O)[C@H](CO)O1)O[C@@H]1[C@H]([C@@H](OC(N)=O)[C@H](O)[C@@H](CO)O1)O)C=1N=CNC=1)C(=O)C1=NC([C@H](CC(N)=O)NC[C@H](N)C(N)=O)=NC(N)=C1C OYVAGSVQBOHSSS-UAPAGMARSA-O 0.000 description 1
- 239000012267 brine Substances 0.000 description 1
- 239000001110 calcium chloride Substances 0.000 description 1
- 229910001628 calcium chloride Inorganic materials 0.000 description 1
- 235000011148 calcium chloride Nutrition 0.000 description 1
- 235000009120 camo Nutrition 0.000 description 1
- 239000001390 capsicum minimum Substances 0.000 description 1
- 229910052799 carbon Inorganic materials 0.000 description 1
- 238000006555 catalytic reaction Methods 0.000 description 1
- 230000022131 cell cycle Effects 0.000 description 1
- 230000010261 cell growth Effects 0.000 description 1
- 230000036978 cell physiology Effects 0.000 description 1
- 230000008614 cellular interaction Effects 0.000 description 1
- 230000036755 cellular response Effects 0.000 description 1
- 235000005607 chanvre indien Nutrition 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 238000007385 chemical modification Methods 0.000 description 1
- 239000003153 chemical reaction reagent Substances 0.000 description 1
- WIIZWVCIJKGZOK-RKDXNWHRSA-N chloramphenicol Chemical compound ClC(Cl)C(=O)N[C@H](CO)[C@H](O)C1=CC=C([N+]([O-])=O)C=C1 WIIZWVCIJKGZOK-RKDXNWHRSA-N 0.000 description 1
- 230000002759 chromosomal effect Effects 0.000 description 1
- 210000000349 chromosome Anatomy 0.000 description 1
- 239000001407 cinnamomum spp. Substances 0.000 description 1
- 235000020971 citrus fruits Nutrition 0.000 description 1
- 238000003776 cleavage reaction Methods 0.000 description 1
- 238000010367 cloning Methods 0.000 description 1
- 239000005515 coenzyme Substances 0.000 description 1
- 238000004737 colorimetric analysis Methods 0.000 description 1
- 230000006854 communication Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 239000003184 complementary RNA Chemical group 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 239000012297 crystallization seed Substances 0.000 description 1
- 238000012258 culturing Methods 0.000 description 1
- YPHMISFOHDHNIV-FSZOTQKASA-N cycloheximide Chemical compound C1[C@@H](C)C[C@H](C)C(=O)[C@@H]1[C@H](O)CC1CC(=O)NC(=O)C1 YPHMISFOHDHNIV-FSZOTQKASA-N 0.000 description 1
- 230000006837 decompression Effects 0.000 description 1
- 230000008260 defense mechanism Effects 0.000 description 1
- 238000000326 densiometry Methods 0.000 description 1
- 239000005547 deoxyribonucleotide Substances 0.000 description 1
- 125000002637 deoxyribonucleotide group Chemical group 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 235000005911 diet Nutrition 0.000 description 1
- 230000000378 dietary effect Effects 0.000 description 1
- 102000004419 dihydrofolate reductase Human genes 0.000 description 1
- 238000010790 dilution Methods 0.000 description 1
- 239000012895 dilution Substances 0.000 description 1
- 235000004879 dioscorea Nutrition 0.000 description 1
- 238000006073 displacement reaction Methods 0.000 description 1
- 230000003828 downregulation Effects 0.000 description 1
- 238000005553 drilling Methods 0.000 description 1
- 238000004043 dyeing Methods 0.000 description 1
- 230000008030 elimination Effects 0.000 description 1
- 238000003379 elimination reaction Methods 0.000 description 1
- 230000013020 embryo development Effects 0.000 description 1
- 230000006353 environmental stress Effects 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 238000013213 extrapolation Methods 0.000 description 1
- 230000004720 fertilization Effects 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 235000004426 flaxseed Nutrition 0.000 description 1
- 235000013312 flour Nutrition 0.000 description 1
- 235000013305 food Nutrition 0.000 description 1
- 238000006062 fragmentation reaction Methods 0.000 description 1
- PGBHMTALBVVCIT-VCIWKGPPSA-N framycetin Chemical compound N[C@@H]1[C@@H](O)[C@H](O)[C@H](CN)O[C@@H]1O[C@H]1[C@@H](O)[C@H](O[C@H]2[C@@H]([C@@H](N)C[C@@H](N)[C@@H]2O)O[C@@H]2[C@@H]([C@@H](O)[C@H](O)[C@@H](CN)O2)N)O[C@@H]1CO PGBHMTALBVVCIT-VCIWKGPPSA-N 0.000 description 1
- ZZUFCTLCJUWOSV-UHFFFAOYSA-N furosemide Chemical compound C1=C(Cl)C(S(=O)(=O)N)=CC(C(O)=O)=C1NCC1=CC=CO1 ZZUFCTLCJUWOSV-UHFFFAOYSA-N 0.000 description 1
- 101150019455 gdh gene Proteins 0.000 description 1
- 238000012252 genetic analysis Methods 0.000 description 1
- 238000011331 genomic analysis Methods 0.000 description 1
- 229960002518 gentamicin Drugs 0.000 description 1
- 239000011521 glass Substances 0.000 description 1
- IAJOBQBIJHVGMQ-BYPYZUCNSA-N glufosinate-P Chemical compound CP(O)(=O)CC[C@H](N)C(O)=O IAJOBQBIJHVGMQ-BYPYZUCNSA-N 0.000 description 1
- 229960003180 glutathione Drugs 0.000 description 1
- 108010077515 glycylproline Proteins 0.000 description 1
- XDDAORKBJWWYJS-UHFFFAOYSA-N glyphosate Chemical compound OC(=O)CNCP(O)(O)=O XDDAORKBJWWYJS-UHFFFAOYSA-N 0.000 description 1
- 229940097068 glyphosate Drugs 0.000 description 1
- 230000012447 hatching Effects 0.000 description 1
- 239000011487 hemp Substances 0.000 description 1
- 238000004128 high performance liquid chromatography Methods 0.000 description 1
- 238000013537 high throughput screening Methods 0.000 description 1
- HNDVDQJCIGZPNO-UHFFFAOYSA-N histidine Natural products OC(=O)C(N)CC1=CN=CN1 HNDVDQJCIGZPNO-UHFFFAOYSA-N 0.000 description 1
- 238000003898 horticulture Methods 0.000 description 1
- 229910052739 hydrogen Inorganic materials 0.000 description 1
- 239000001257 hydrogen Substances 0.000 description 1
- WGCNASOHLSPBMP-UHFFFAOYSA-N hydroxyacetaldehyde Natural products OCC=O WGCNASOHLSPBMP-UHFFFAOYSA-N 0.000 description 1
- 238000007654 immersion Methods 0.000 description 1
- 230000001771 impaired effect Effects 0.000 description 1
- 238000007901 in situ hybridization Methods 0.000 description 1
- 230000008595 infiltration Effects 0.000 description 1
- 238000001764 infiltration Methods 0.000 description 1
- 239000004615 ingredient Substances 0.000 description 1
- 239000003112 inhibitor Substances 0.000 description 1
- 238000011081 inoculation Methods 0.000 description 1
- 229960003786 inosine Drugs 0.000 description 1
- 102000006495 integrins Human genes 0.000 description 1
- 108010044426 integrins Proteins 0.000 description 1
- 230000008611 intercellular interaction Effects 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 150000002500 ions Chemical class 0.000 description 1
- 238000003973 irrigation Methods 0.000 description 1
- 230000002262 irrigation Effects 0.000 description 1
- 101150066555 lacZ gene Proteins 0.000 description 1
- 230000014634 leaf senescence Effects 0.000 description 1
- 230000003902 lesion Effects 0.000 description 1
- 239000002502 liposome Substances 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 229910001629 magnesium chloride Inorganic materials 0.000 description 1
- 235000009973 maize Nutrition 0.000 description 1
- 235000005739 manihot Nutrition 0.000 description 1
- 230000035800 maturation Effects 0.000 description 1
- 235000013622 meat product Nutrition 0.000 description 1
- 102000006240 membrane receptors Human genes 0.000 description 1
- 238000002493 microarray Methods 0.000 description 1
- 238000010208 microarray analysis Methods 0.000 description 1
- 230000002906 microbiologic effect Effects 0.000 description 1
- 238000000520 microinjection Methods 0.000 description 1
- 239000011859 microparticle Substances 0.000 description 1
- 238000002715 modification method Methods 0.000 description 1
- 108091005601 modified peptides Proteins 0.000 description 1
- VYQNWZOUAUKGHI-UHFFFAOYSA-N monobenzone Chemical compound C1=CC(O)=CC=C1OCC1=CC=CC=C1 VYQNWZOUAUKGHI-UHFFFAOYSA-N 0.000 description 1
- 230000007498 myristoylation Effects 0.000 description 1
- 229920001220 nitrocellulos Polymers 0.000 description 1
- 108091027963 non-coding RNA Proteins 0.000 description 1
- 102000042567 non-coding RNA Human genes 0.000 description 1
- 230000009871 nonspecific binding Effects 0.000 description 1
- 231100001221 nontumorigenic Toxicity 0.000 description 1
- 238000010899 nucleation Methods 0.000 description 1
- 230000035764 nutrition Effects 0.000 description 1
- 235000016709 nutrition Nutrition 0.000 description 1
- 229920001778 nylon Polymers 0.000 description 1
- 229920001542 oligosaccharide Polymers 0.000 description 1
- 150000002482 oligosaccharides Chemical class 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 229940049547 paraxin Drugs 0.000 description 1
- 239000002245 particle Substances 0.000 description 1
- 244000052769 pathogen Species 0.000 description 1
- 230000001717 pathogenic effect Effects 0.000 description 1
- 229920001277 pectin Polymers 0.000 description 1
- 239000001814 pectin Substances 0.000 description 1
- 235000010987 pectin Nutrition 0.000 description 1
- 238000010647 peptide synthesis reaction Methods 0.000 description 1
- 239000000575 pesticide Substances 0.000 description 1
- 229910052698 phosphorus Inorganic materials 0.000 description 1
- 230000000865 phosphorylative effect Effects 0.000 description 1
- 102000020233 phosphotransferase Human genes 0.000 description 1
- 238000000206 photolithography Methods 0.000 description 1
- 238000013081 phylogenetic analysis Methods 0.000 description 1
- 239000001739 pinus spp. Substances 0.000 description 1
- 230000001863 plant nutrition Effects 0.000 description 1
- 230000013823 prenylation Effects 0.000 description 1
- 125000001500 prolyl group Chemical group [H]N1C([H])(C(=O)[*])C([H])([H])C([H])([H])C1([H])[H] 0.000 description 1
- 229960000856 protein c Drugs 0.000 description 1
- 235000014774 prunus Nutrition 0.000 description 1
- 238000000746 purification Methods 0.000 description 1
- 230000005855 radiation Effects 0.000 description 1
- 101150101384 rat1 gene Proteins 0.000 description 1
- 238000003753 real-time PCR Methods 0.000 description 1
- 108020003175 receptors Proteins 0.000 description 1
- 102000005962 receptors Human genes 0.000 description 1
- 230000003014 reinforcing effect Effects 0.000 description 1
- 230000008521 reorganization Effects 0.000 description 1
- 239000011347 resin Substances 0.000 description 1
- 229920005989 resin Polymers 0.000 description 1
- 230000003938 response to stress Effects 0.000 description 1
- 108091008146 restriction endonucleases Proteins 0.000 description 1
- 238000003757 reverse transcription PCR Methods 0.000 description 1
- 210000000614 rib Anatomy 0.000 description 1
- 125000002652 ribonucleotide group Chemical group 0.000 description 1
- 235000019515 salmon Nutrition 0.000 description 1
- 230000007017 scission Effects 0.000 description 1
- 230000008117 seed development Effects 0.000 description 1
- 230000007226 seed germination Effects 0.000 description 1
- 210000000582 semen Anatomy 0.000 description 1
- 125000003607 serino group Chemical group [H]N([H])[C@]([H])(C(=O)[*])C(O[H])([H])[H] 0.000 description 1
- 238000004904 shortening Methods 0.000 description 1
- 101150039622 so gene Proteins 0.000 description 1
- 239000001509 sodium citrate Substances 0.000 description 1
- 239000001488 sodium phosphate Substances 0.000 description 1
- HPALAKNZSZLMCH-UHFFFAOYSA-M sodium;chloride;hydrate Chemical compound O.[Na+].[Cl-] HPALAKNZSZLMCH-UHFFFAOYSA-M 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000010532 solid phase synthesis reaction Methods 0.000 description 1
- 230000009870 specific binding Effects 0.000 description 1
- 229960000268 spectinomycin Drugs 0.000 description 1
- UNFWWIHTNXNPBV-WXKVUWSESA-N spectinomycin Chemical compound O([C@@H]1[C@@H](NC)[C@@H](O)[C@H]([C@@H]([C@H]1O1)O)NC)[C@]2(O)[C@H]1O[C@H](C)CC2=O UNFWWIHTNXNPBV-WXKVUWSESA-N 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 238000005507 spraying Methods 0.000 description 1
- 238000003153 stable transfection Methods 0.000 description 1
- 238000010561 standard procedure Methods 0.000 description 1
- 239000008107 starch Substances 0.000 description 1
- 235000019698 starch Nutrition 0.000 description 1
- 230000001954 sterilising effect Effects 0.000 description 1
- 238000004659 sterilization and disinfection Methods 0.000 description 1
- 238000003860 storage Methods 0.000 description 1
- QTENRWWVYAAPBI-YCRXJPFRSA-N streptomycin sulfate Chemical compound OS(O)(=O)=O.OS(O)(=O)=O.OS(O)(=O)=O.CN[C@H]1[C@H](O)[C@@H](O)[C@H](CO)O[C@H]1O[C@@H]1[C@](C=O)(O)[C@H](C)O[C@H]1O[C@@H]1[C@@H](N=C(N)N)[C@H](O)[C@@H](N=C(N)N)[C@H](O)[C@H]1O.CN[C@H]1[C@H](O)[C@@H](O)[C@H](CO)O[C@H]1O[C@@H]1[C@](C=O)(O)[C@H](C)O[C@H]1O[C@@H]1[C@@H](N=C(N)N)[C@H](O)[C@@H](N=C(N)N)[C@H](O)[C@H]1O QTENRWWVYAAPBI-YCRXJPFRSA-N 0.000 description 1
- 239000000758 substrate Substances 0.000 description 1
- 235000000346 sugar Nutrition 0.000 description 1
- WVAKABMNNSMCDK-UHFFFAOYSA-N sulfacarbamide Chemical compound NC(=O)NS(=O)(=O)C1=CC=C(N)C=C1 WVAKABMNNSMCDK-UHFFFAOYSA-N 0.000 description 1
- 229950010053 sulfacarbamide Drugs 0.000 description 1
- 230000019635 sulfation Effects 0.000 description 1
- 238000005670 sulfation reaction Methods 0.000 description 1
- 230000001629 suppression Effects 0.000 description 1
- 238000004114 suspension culture Methods 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
- 230000009897 systematic effect Effects 0.000 description 1
- 230000002123 temporal effect Effects 0.000 description 1
- 239000009871 tenuigenin Substances 0.000 description 1
- 238000010998 test method Methods 0.000 description 1
- OHKOGUYZJXTSFX-KZFFXBSXSA-N ticarcillin Chemical compound C=1([C@@H](C(O)=O)C(=O)N[C@H]2[C@H]3SC([C@@H](N3C2=O)C(O)=O)(C)C)C=CSC=1 OHKOGUYZJXTSFX-KZFFXBSXSA-N 0.000 description 1
- 238000001890 transfection Methods 0.000 description 1
- 230000014621 translational initiation Effects 0.000 description 1
- 230000032258 transport Effects 0.000 description 1
- 230000001960 triggered effect Effects 0.000 description 1
- HRXKRNGNAMMEHJ-UHFFFAOYSA-K trisodium citrate Chemical compound [Na+].[Na+].[Na+].[O-]C(=O)CC(O)(CC([O-])=O)C([O-])=O HRXKRNGNAMMEHJ-UHFFFAOYSA-K 0.000 description 1
- 229940038773 trisodium citrate Drugs 0.000 description 1
- RYFMWSXOAZQYPI-UHFFFAOYSA-K trisodium phosphate Chemical compound [Na+].[Na+].[Na+].[O-]P([O-])([O-])=O RYFMWSXOAZQYPI-UHFFFAOYSA-K 0.000 description 1
- 229910000406 trisodium phosphate Inorganic materials 0.000 description 1
- 235000019801 trisodium phosphate Nutrition 0.000 description 1
- 230000007306 turnover Effects 0.000 description 1
- 241001515965 unidentified phage Species 0.000 description 1
- 235000018322 upland cotton Nutrition 0.000 description 1
- 230000009385 viral infection Effects 0.000 description 1
- 238000001262 western blot Methods 0.000 description 1
- 238000009736 wetting Methods 0.000 description 1
- 239000002023 wood Substances 0.000 description 1
- 238000001086 yeast two-hybrid system Methods 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/82—Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
- C12N15/8241—Phenotypically and genetically modified plants via recombinant DNA technology
- C12N15/8261—Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/415—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from plants
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A40/00—Adaptation technologies in agriculture, forestry, livestock or agroalimentary production
- Y02A40/10—Adaptation technologies in agriculture, forestry, livestock or agroalimentary production in agriculture
- Y02A40/146—Genetically Modified [GMO] plants, e.g. transgenic plants
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Genetics & Genomics (AREA)
- Chemical & Material Sciences (AREA)
- Organic Chemistry (AREA)
- Molecular Biology (AREA)
- Engineering & Computer Science (AREA)
- Wood Science & Technology (AREA)
- Biochemistry (AREA)
- Biotechnology (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biophysics (AREA)
- Biomedical Technology (AREA)
- Zoology (AREA)
- Microbiology (AREA)
- Physics & Mathematics (AREA)
- Plant Pathology (AREA)
- Cell Biology (AREA)
- Botany (AREA)
- Gastroenterology & Hepatology (AREA)
- Medicinal Chemistry (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Breeding Of Plants And Reproduction By Means Of Culturing (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Peptides Or Proteins (AREA)
- Enzymes And Modification Thereof (AREA)
Abstract
本发明一般地涉及分子生物学领域,涉及通过调节编码SAUR多肽、或GDH(谷氨酸脱氢酶)多肽、或FlA样(成束蛋白样,Fasciclin-like)多肽、或脱氢抗坏血酸还原酶(DHAR)多肽的核酸在植物中的表达来增强产量相关性状的方法。本发明还涉及具有经调节的该核酸表达的植物,所述植物相对于相应的野性型植物或对照植物具有增强的产量相关性状。本发明还提供了可以用于本发明方法的构建体。此外,本发明还涉及基于SAUR的蛋白质复合物。本发明还涉及使用该复合物来增强产量相关性状,涉及通过表达该复合物的至少两个组分来促进复合物形成的方法。
Description
本申请是申请日为2010年9月22日的、发明名称为“具有增强的产量相关性状的植物及其制备方法”的中国专利申请201080053318.6(PCT/EP2010/063931)的分案申请。
技术领域
本发明一般地涉及分子生物学领域,涉及通过调节编码GDH(谷氨酸脱氢酶)多肽的核酸在植物中的表达来改善多种植物生长特性的方法。本发明还涉及具有经调节的GDH多肽编码核酸表达的植物,所述植物相对于相应的野生型植物或其它对照植物具有改善的生长特性。本发明还提供了可以用于本发明方法的构建体。
本发明一般地涉及分子生物学领域,涉及增强植物的多种经济上重要的产量相关性状的方法。更具体地,本发明涉及通过调节编码FLA样(成束蛋白样,Fasciclin-like)多肽的核酸在植物中的表达来增强产量相关性状的方法。本发明还涉及具有经调节的FLA样多肽编码核酸表达的植物,所述植物相对于对照植物具有增强的产量相关性状。本发明还提供了可以用于实施本发明方法的包含FLA样编码核酸的构建体。
本发明一般地涉及分子生物学领域,涉及通过调节编码SAUR多肽的核酸在植物中的表达来增强植物的产量相关性状的方法。本发明还涉及具有经调节的SAUR多肽编码核酸表达的植物,所述植物相对于相应的野性型植物或其他对照植物具有增强的产量相关性状。本发明还提供了可以用于本发明方法的构建体。此外,本发明还涉及基于SAUR的蛋白质复合物。本发明还涉及使用该复合物来增强产量相关性状,涉及通过过表达该复合物的至少两个成员来刺激复合物形成的方法。
本发明一般地涉及分子生物学领域,涉及通过调节编码脱氢抗坏血酸还原酶(DHAR)多肽的核酸在植物中的表达来植物的增强产量性状的方法。本发明还涉及具有经调节的DHAR多肽编码核酸表达的植物,所述植物相对于相应的野性型植物或其他对照植物具有增强的产量性状。本发明还提供了可以用于本发明方法的构建体。
背景技术
不断增长的世界人口和逐渐减少的农业可用耕地推动了提高农业效率研究之势。传统的作物和园艺学改良方法利用选育技术来鉴定具有期望特征的植物。然而,此类选育技术有若干缺陷,即这些技术一般为劳动密集型的,而且产生的植物通常含有异质的遗传组分,这些异质的遗传组分可能不总是导致期望的性状自亲本植物传递。分子生物学的进展已经使人类能够修饰动物和植物的种质。植物遗传工程需要分离和操作遗传物质(一般为DNA或RNA的形式)以及随后将遗传物质引入植物。此类技术有能力输送具有多种改良的经济、农业或园艺性状的作物或植物。
具有特别经济利益的性状是增加的产量。产量通常定义为作物的可测量的具有经济价值的产出。这可以以数量和/或质量的方式进行定义。产量直接取决于若干因素,例如器官的数量和大小、植物构造(例如,分枝的数量)、种子生产、叶子衰老等等。根的发育、营养吸收、胁迫耐受性和早期活力也可以是决定产量的重要因素。因此优化上述因素可以促进作物产量的增加。
种子产量是特别重要的性状,这是因为许多植物的种子对于人类和动物营养而言至关重要。诸如玉米、稻、小麦、芸苔(canola)和大豆等作物占人类总卡路里摄取量的一半以上,或是通过对种子本身的直接消耗,或是通过对饲养自加工的种子的肉类产品的消耗。它们也可以是工业加工中所用的糖类、油类和多类代谢物的来源。种子含有胚(新的枝条和根的来源)和胚乳(萌发期和幼苗早期生长过程中胚生长的营养源)。种子的发育涉及许多基因,并且需要代谢物自根、叶和茎转移至正在生长的种子。特别是胚乳可以同化糖类、油类和蛋白质的代谢前体,将其合成为贮存高分子,以充盈籽粒。
对于许多作物而言,另一重要的性状是早期活力。提高早期活力是温带和热带稻类栽培种的现代稻类育种项目的重要目标。长根对于水栽稻的土壤锚固至关重要。在直接向涝地里播种稻米的情况下,以及在植物必须迅速透水出苗的情况下,较长的枝条均与活力有关。在进行条播的情况下,较长的中胚轴和胚芽鞘对于优良的出苗至关重要。将早期活力改造入植物的能力在农业上将具有极其重要的意义。例如,早期活力弱已经限制了在欧洲大西洋地区引入基于玉米带种质的玉米(玉蜀黍,Zeamays L.)杂交种。
再一重要的性状为提高的非生物胁迫耐受性。非生物胁迫是全世界作物损失的主要原因,使大多数主要作物植物平均产量降低50%以上(Wang等,Planta(2003)218:1-14)。非生物胁迫可以因为干旱、盐度、极端温度、化学毒性及氧化胁迫引起。提高植物的非生物胁迫耐受性的能力将对全世界农场主带来重大的经济利益,并将使人们能够在否则将不可能进行作物栽培的地区和不利条件下进行作物栽培。
因此通过优化上述因素之一,可以增加作物产量。
视最终用途而定,对某些产量性状的修饰可能优于对其它产量性状的修饰。例如,对于诸如饲料或木材生产或者生物燃料源等应用,可能期望植物营养部分的增加,而对于诸如面粉、淀粉或油料生产等应用,可能特别期望种子参数的增强。即便是在种子参数之中,取决于应用,一些参数也可能优于其它参数。多种机制可以促成增加的种子产量,无论是以增加的种子大小还是以增加的种子数量的形式。
增强植物产量(种子产量和/或生物量)的一种方法可以是修饰植物的内在生长机制,如细胞周期或者参与植物生长或防御机制的多种信号传递路径。
发明概述
现已发现,可通过在植物中调节GDH(谷氨酸脱氢酶)编码核酸在植物中的表达来改善植物的多种生长特征。
现已发现,可通过在植物中调节FLA样多肽编码核酸在植物中的表达来改善(在本文中也被称为增强)植物的多种产量相关性状。
现已发现,可通过在植物中调节SAUR多肽编码核酸在植物中的表达或调节基于SAUR的蛋白质复合物在植物中的表达来改善植物的多种产量相关性状。
现已发现,可通过在植物中调节DHAR多肽编码核酸在植物中的表达来改善植物的多种产量相关性状。
背景
1.谷氨酸脱氢酶(GDH)多肽
谷氨酸脱氢酶催化谷氨酸可逆脱氨为2-酮戊二酸。取决于所使用的辅酶,其以至少3种形式存在:NAD(EC1.4.1.2)、NAD(P)(EC1.4.1.3)或NADP(EC1.4.1.4)。在植物中,尽管有NADP-GDH形式存在的迹象,仅NAD-GDH形式的存在被报道。植物GDH作为α和β亚基的六聚体以7种同工型,即同工型1(6xβ亚基)至同工型7(6xα亚基),存在(Turano等,Plant Physiol.113,1329-1341,1997)。α和β亚基在氨基酸序列水平上彼此相关,其通常具有75%和85%之间的序列同一性。GDH同工型7具有高的谷氨酸脱氨活性和小的氨化活性,而GDH同工型1仅具有脱氨活性(Turano等,1997)。体内谷氨酸脱氢酶活性主要位于线粒体中;反应主要是朝谷氨酸脱氨和2-酮戊二酸产生的方向,而不是朝谷氨酸合成方向。
在烟草中,β亚基的下调或过表达(具有正常活性水平0.5至34倍的DGH活性的转基因株系)除了使叶片中Asp大量减少外,对叶片的铵或叶片的游离氨基酸库具有很小的影响;此外,植物的生长和发育没有受到影响(Purnell等,Planta 222,167-180,2005)。对于过表达α亚基的植物,没有植物表型的描述(Skopelitis等,Plant Physiol.145,1726-1734,2007)。在另一方面,来自大肠杆菌(Escherichia coli)的gdhA(编码NADPH-GDH)的强过表达导致增加的生物质,以及导致改变的代谢物水平(Ameziane等,Plant and Soil 221,47-57,2000)。其它研究也报道了在玉米中过表达来自大肠杆菌(Escherichia coli)的gdhA时(Guthrie等,J.Anim.Sci.82,1693-1698,2004),或过表达来自构巢曲霉(Aspergillus nidulans)的NADP依赖型谷氨酸脱氢酶(gdhA)(Kisaka和Kida,Plant Science 164,35-42,2003)时,代谢物水平的改变。
2.成束蛋白样AGP(FLA)多肽
细胞与细胞间的相互作用和通讯提供了植物发育期间关键的结构、位置和环境信号。在植物细胞中,这种信号必须穿过包围质膜的细胞壁。植物细胞壁主要由多糖纤维素、交联聚糖、果胶和一些蛋白质组成,它们一起形成被称为细胞外基质(ECM)的复杂的相互作用网络。相互作用的性质随发育时期变化,并受生物和非生物胁迫的影响,导致改变的壁组成和结构。细胞壁蛋白质,其一般占初生壁干重的不到10%,被认为是维持植物ECM的物理学和生物学功能中的关键组分。大多数ECM蛋白质属于大家族,其包括酶例如水解酶、蛋白酶、糖苷酶、过氧化物酶和酯酶,扩展蛋白、壁相关激酶和富羟脯氨酸(Hyp)的糖蛋白(Arabidopsis Genome Initiative[AGI],2000)。
阿拉伯半乳聚糖蛋白(AGPs)是一类富含Hyp的糖蛋白,它高度糖基化,在植物细胞壁和质膜中丰富。II型阿拉伯半乳聚糖(AG)多糖链占主要,其通过O-糖苷连接到蛋白质骨架中的Hyp残基,从而使该分子总质量的90%至99%由碳水化合物组成。越来越多的证据显示,Hyp(阿拉伯)半乳糖基化依赖于Hyp残基的成簇的、非连续的排列。相反地,连续Hyp残基的区块,例如存在于伸展蛋白中的那些,被短的寡糖进行阿拉伯糖基化。在拟南芥中,带糖基磷脂酰肌醇(GPI)锚的AGPs可以被分为4个亚类,包括经典的AGPs,那些具有富Lys的结构域的AGPs,和具有短蛋白质骨架的AG肽。成束蛋白样AGPs(FLAs)构成AGPs的第4个截然不同的亚类。具有可变数量(一般为1到4个)的成束蛋白结构域的蛋白质最初在果蝇(Drosophila melanogaster)中被鉴定出来,此后在来自动物、酵母、细菌、藻类、苔藓和高等植物的蛋白质中被鉴定出来(Johnson等,2003 Plant physiology 133,1911-1925)。
成束蛋白结构域长110至150个氨基酸,具有低的序列相似性。这种低的序列相似性可以解释为何成束蛋白结构域缺乏单个共有序列。然而,所有的成束蛋白结构域都包含两个高度保守的区域(H1和H2),每个区域大约10个氨基酸。来自广泛生物体的包含成束蛋白结构域的蛋白质已被证实起粘附分子的作用。来自果蝇的成束蛋白1(Fas1)能够通过嗜同性相互作用促进细胞粘着。通过来自拟南芥的FLAs的所有成束蛋白结构域和共有序列(smart00554)的多序列比对,鉴定出了所有成束蛋白结构域共有的保守区域,称为H1和H2(Johnson等,2003)。大多数拟南芥FLAs包含其它的保守残基,例如H1结构域附近的Leu和Ile,其被认为参与维持成束蛋白结构域的结构和/或细胞粘着(Johnson等,2003)。
拟南芥FLAs中的许多突变已经被表征。单倍体机能不全突变体,rat1(抗农杆菌转化),抵抗致瘤性和非致瘤性农杆菌菌株对根区段的短暂的和稳定的转化。该突变体在AGP17的起始密码子上游具有T-DNA插入。已表明来自拟南芥的根特异性非经典(嵌合的)AGP,AtAGP30,涉及根的再生和种子萌发。其它的AGP突变体,sos5/fla4,显示出盐过度敏感的表型,在高盐浓度下增加的细胞膨胀(Gaspar等;2004;Shi 2003 PlantCell.2003 Jan;15(1):19-32.)。
3.生长素上调小RNA(SAUR)多肽
在施用生长素数分钟内被特异诱导的早期生长素反应基因被广泛地分为3个主要类别:生长素/吲哚乙酸(Aux/IAA)、GH3和生长素上调小RNA(SAUR)基因家族。SAURs可以被翻译抑制剂放线酮诱导,表明其转录受短寿阻遏物的调节。在首先从大豆中鉴定出SAUR基因后,该类别的成员已经从绿豆、豌豆、拟南芥、烟草中、和最近从玉米中被鉴定出来。在拟南芥基因组中,SAURs为包含超过70个成员的多基因大家族。SAURs编码高度不稳定的mRNAs,该mRNAs在施用生长素数分钟内被诱导,具有非常高的更新率。
SAUR mRNAs的不稳定性归因于其3′非翻译区中存在的保守下游(DST)元件。有证据表明,SAURs在转录后和翻译后水平上被调控。最近,已经证明了SAUR蛋白与钙调素的钙依赖体外结合,这提供了Ca2+/钙调素第二信使系统和生长素信号之间的联系(Jain等,2006Genomics 88,360–371;Hagen和Guilfoyle Plant Molecular Biology 49:373–385,2002)。对来自稻和拟南芥的SAURs进行了系统发生分析,以理解基因家族扩张的可能机制。最近,Kant等,Plant Physiol.2009在线出版物表征了稻SAUR39蛋白(SAUR39)的作用,作为水稻中生长素合成和运输的负调控因子。
4.脱氢抗坏血酸还原酶(DHAR)多肽
脱氢抗坏血酸还原酶(DHAR)的作用广泛涉及抗坏血酸-谷胱甘肽循环和从氧化的抗坏血酸再生抗坏血酸(ASC)。该酶对维持抗坏血酸和因此细胞的恰当氧化还原态非常关键,在抗由干旱胁迫引起的氧化性损伤的防御过程中起着重要作用(Secenji,M.等,2008-Transcriptional changes inascorbate-glutathione cycle under drought conditions.Acta BiologicaSzegediensis,52(1):93-94)。
美国专利6,903,246公开了来自小麦(Triticum aestivum)的DAHR基因及其用于在植物中调节抗坏血酸的水平。Lee,Y.P.等(Enhancedtolerance to oxidative stress in transgenic tobacco plants expressing threeantioxidant enzymes in chloroplasts.Plant Cell Rep.26:591-8,2007)揭示了DHAR、SOD和APX在烟草叶绿体中同时表达的作用,其增加了对氧化胁迫的耐受性。Ushimaru,T.等(Transgenic Arabidopsis plantsexpressing the rice dehydroascorbate reductase gene are resistant to saltstress.J.Plant Physiol.163:1179-84,2006)也揭示了DAHR与植物的胁迫响应间的相关性。在该研究中,观察到了具35S启动子的水稻DHAR在拟南芥中的胞质表达对植物增加的抗坏血酸含量起着贡献,这导致了增强的盐胁迫抗性。Kwon,S.Y.等,(Enhanced stress-tolerance of transgenictobacco plants expressing a human dehydroascorbate reductase gene.J.Plant Physiol.160:347-53,2003)公开了人DHAR在烟草叶绿体中的过表达及其所导致的对氧化性胁迫、冷和盐胁迫增加的抗性。Zou,L.等(Cloning and mapping of genes involved in tomato ascorbic acidbiosynthesis and metabolism.Plant Sci.170(1),120-127,2006)公开了为了筛选与番茄抗坏血酸生物合成和新陈代谢相关联的候选基因,对几个涉及抗坏血酸生物合成和新陈代谢的番茄基因,包括两个DHAR基因,进行的克隆和作图。Kato,Y.等(Purification and characterization ofdehydroascorbate reductase from rice.Plant and Cell Physiology,38,No.2173-178,1997)公开了用于评估DHAR活性的酶测定试验方法。
概述
1.谷氨酸脱氢酶(GDH)多肽
令人惊讶地,现已发现,调节编码GDH多肽的核酸的表达可以产生相对于对照植物具有增强的产量相关性状,特别是增加的产量和改善的早期活力的植物。
根据一个实施方案,本发明提供用于相对于对照植物增强植物产量相关性状的方法,包括调节编码GDH多肽的核酸在植物中的表达。
2.成束蛋白样AGP(FLA)多肽
令人惊讶地,现已发现,调节编码FLA样多肽的核酸的表达可以产生相对于对照植物具有增强的产量相关性状的植物。
根据一个实施方案,本发明提供用于相对于对照植物增强植物产量相关性状的方法,包括调节编码FLA样多肽的核酸在植物中的表达。
3.生长素上调小RNA(SAUR)多肽
令人惊讶地,现已发现,调节编码SAUR多肽的核酸的表达可以产生相对于对照植物具有增强的产量相关性状的植物。
根据一个实施方案,本发明提供用于相对于对照植物增强(改善)植物的产量相关性状的方法,包括调节编码SAUR多肽的核酸在植物中的表达或调节基于SAUR的蛋白质复合物在植物中的表达。
为了解译影响植物产量性状的生物学网络,采用以SAUR蛋白为中心的方法来研究拟南芥(Arabidopsis thaliana)中SAUR的相互作用蛋白。SAUR蛋白的该相互作用组(interactome)和调节子(regulon)被用于选择在增强植物产量相关性状中与SAUR蛋白一同起作用的基因,在本文中称为SYNP(SAUR产量网络蛋白,SAUR Yield Network protein)蛋白。
令人惊讶地,可以鉴定出属于蛋白质的SYNP蛋白组的蛋白质子集。
4.脱氢抗坏血酸还原酶(DHAR)多肽
令人惊讶地,现已发现,调节编码DHAR多肽的核酸的表达可以产生相对于对照植物具有增强的产量相关性状,特别是增加的产量的植物。
根据一个实施方案,本发明提供用于相对于对照植物在植物中改善产量相关性状的方法,包括调节编码DHAR多肽的核酸在植物中的表达。
定义
以下定义将在整个本说明书中使用。
多肽/蛋白质
术语“多肽”和“蛋白质”在文中可互换使用,是指通过肽键连接起来的、任意长度的氨基酸的聚合物。
多核苷酸/核酸/核酸序列/核苷酸序列
术语“多核苷酸”、“核酸序列”、“核苷酸序列”、“核酸”、“核酸分子”在文中可互换使用,是指任何长度的无支链形式的核苷酸聚合物,所述核苷酸可以为核糖核苷酸或脱氧核糖核苷酸或者两者的组合。
同源物
蛋白质的“同源物”包括肽、寡肽、多肽、蛋白质和酶,其相对于所讨论的未修饰蛋白质具有氨基酸取代、缺失和/或插入,并且与其源自的未修饰蛋白质具有相似的生物活性和功能活性。
缺失是指从蛋白质中除去一个或多个氨基酸。
插入是指在蛋白质的预定位置引入一个或多个氨基酸残基。插入可以包括N-末端和/或C-末端融合,以及单个或多个氨基酸的序列内插入。一般,氨基酸序列内的插入将小于N-或C-末端的融合,约1到10个残基左右。N-或C-末端融合蛋白或肽的实例包括在酵母双杂交系统中应用的转录激活因子的结合结构域或激活结构域、噬菌体外壳蛋白、(组氨酸)-6-标签、谷胱甘肽S-转移酶标签、蛋白质A、麦芽糖结合蛋白、二氢叶酸还原酶、Tag·100表位、c-myc表位、表位、lacZ、CMP(钙调蛋白结合肽)、HA表位、蛋白质C表位和VSV表位。
取代是指蛋白质中的氨基酸用具有相似特性(如相似的疏水性、亲水性、抗原性、形成或打破α螺旋结构或β片层结构的倾向)的其它氨基酸替换。氨基酸取代一般是单残基的取代,但是视施加于多肽上的功能性限制而定也可以是成簇取代,并且可以是1到10个氨基酸;插入通常在大约1到10个氨基酸残基的数量级。氨基酸取代优选为保守氨基酸取代。保守取代表在本领域公知(参见例如Creighton(1984)Proteins.W.H.Freeman and Company(编辑)和下表1)。
表1:保守氨基酸取代的实例
残基 | 保守取代 | 残基 | 保守取代 |
Ala | Ser | Leu | Ile;Val |
Arg | Lys | Lys | Arg;Gln |
Asn | Gln;His | Met | Leu;Ile |
Asp | Glu | Phe | Met;Leu;Tyr |
Gln | Asn | Ser | Thr;Gly |
Cys | Ser | Thr | Ser;Val |
Glu | Asp | Trp | Tyr |
Gly | Pro | Tyr | Trp;Phe |
His | Asn;Gln | Val | Ile;Leu |
Ile | Leu;Val |
可通过本领域公知的肽合成技术,如固相肽合成法等,或通过重组DNA操作,容易地进行氨基酸取代、缺失和/或插入。用于产生蛋白质的取代、插入或缺失变体的DNA序列操作方法在本领域公知。例如,本领域的技术人员公知在DNA预定位置进行取代突变的技术,包括M13诱变、T7-Gen体外诱变(USB,Cleveland,OH)、QuickChange定点诱变(Stratagene,San Diego,CA)、PCR介导的定点诱变或其它定点诱变方案。
衍生物
“衍生物”包括肽、寡肽、多肽,与蛋白质如目的蛋白质的天然形式的氨基酸序列相比,其可以包括用非天然氨基酸残基进行的氨基酸取代、或者添加非天然氨基酸残基。蛋白质的“衍生物”还包括肽、寡肽、多肽,与多肽的天然形式的氨基酸序列相比,其可以包括天然改变的(糖基化、酰基化、异戊烯化、磷酸化、肉豆蔻酰化、硫酸化等)或非天然改变的氨基酸残基。衍生物与其源自的氨基酸序列相比,还可以包括一个或多个非氨基酸取代或添加,例如共价或非共价地结合于氨基酸序列的报告分子或其它配体,例如与氨基酸序列结合以有利于其检测的报告分子,以及相对于天然蛋白质的氨基酸序列而言非天然存在的氨基酸残基。此外,“衍生物”还可以包括天然形式的蛋白质与标签肽(taggingpeptide)例如FLAG、HIS6或硫氧还蛋白的融合物(关于标签肽的综述,参见Terpe,Appl.Microbiol.Biotechnol.60,523-533,2003)。
直向同源物/旁系同源物
直向同源物和旁系同源物涵盖用于描述基因的祖先关系的进化概念。旁系同源物为相同物种内的基因,其起源自祖先基因的复制;而直向同源物为来自不同生物体的基因,其通过物种形成起源,并且也源自于共同的祖先基因。
结构域、基序/共有序列/标签序列(Signature)
术语“结构域”是指在进化相关蛋白质的序列比对中,在特定位置上保守的一组氨基酸。尽管其它位置上的氨基酸可能因同源物不同而改变,但是在特定位置上高度保守的氨基酸则意味着对于蛋白质结构、稳定性或功能而言很可能是必不可少的氨基酸。“结构域”通过在蛋白质同源物家族的比对序列中其高度的保守性而鉴定,其能够用作为标识符以确定任何所讨论的多肽是否属于先前鉴定到的多肽家族。
术语“基序”或“共有序列”或“标签序列”是指进化相关蛋白质序列中短的保守区域。基序常常是结构域的高度保守的部分,但也可以包括仅仅部分的结构域,或者可以是位于保守结构域之外(若基序的所有氨基酸都落在所定义的结构域之外的话)。
存在用于鉴定结构域的专家数据库,例如SMART(Schultz等(1998)Proc.Natl.Acad.Sci.USA 95,5857-5864;Letunic等(2002)Nucleic AcidsRes 30,242-244)、InterPro(Mulder等,(2003)Nucl.Acids.Res.31,315-318)、Prosite(Bucher和Bairoch(1994),A generalized profile syntax forbiomolecular sequences motifs and its function in automatic sequenceinterpretation.(In)ISMB-94;第二届分子生物学智能系统国际会议记录(Proceedings 2nd International Conference on Intelligent Systems forMolecular Biology)Altman R.,Brutlag D.,Karp P.,Lathrop R.,Searls D.编辑,53-61页,AAAIPress,Menlo Park;Hulo等,Nucl.Acids.Res.32:D134-D137,(2004))或者Pfam(Bateman等,Nucleic Acids Research 30(1):276-280(2002))。进行蛋白质序列芯片(in silico)分析的一组工具可以从ExPASy蛋白质组学服务器获得(瑞士生物信息学研究所(Swiss Institute ofBioinformatics)(Gasteiger等ExPASy:the proteomics server for in-depthprotein knowledge and analysis.Nucleic Acids Res 31:3784-3788(2003))。结构域或基序也可以利用常规技术例如通过序列比对来鉴定。
为比较而进行序列比对的方法是本领域公知的,此类方法包括GAP、BESTFIT、BLAST、FASTA和TFASTA。GAP使用Needleman和Wunsch的算法((1970)J.Mol.Biol.48:443-453)来寻找两序列之间匹配数最大化且空位数最小化的全局(即跨越完整序列)的比对。BLAST算法(Altschul等(1990)J Mol Biol 215:403-10)计算序列同一性百分比,并对两序列之间的相似性进行统计学分析。执行BLAST分析的软件可通过美国国家生物技术信息中心(NCBI)公开地获得。同源物可以例如,使用ClustalW多重序列比对算法(1.83版),采用默认的成对比对参数以及百分比的记分方法而容易地鉴定。利用可获自MatGAT软件包(Campanella等,(2003)BMC Bioinformatics,10:29.2003 Jul 10;4:29.MatGAT:anapplication that generates similarity/identity matrices using protein orDNA sequences)的方法之一,也可以确定全局相似性和同一性百分比。可以进行微小的人工编辑以优化保守基序之间的比对,这对于所属领域的技术人员而言将是显而易见的。此外,除了利用全长序列进行同源物鉴定以外,还可以利用特定的结构域。可以利用上述程序采用默认参数针对完整核酸或氨基酸序列或者选择的结构域或保守基序来确定序列同一性值。对于局部比对,Smith-Waterman算法是特别有用的(Smith TF,Waterman MS(1981)J.Mol.Biol 147(1);195-7)。
交互BLAST
通常,这包括一次BLAST,即以查询序列(例如,利用实施例部分表A中所列的任何序列)针对任何序列数据库如可公共获得的NCBI数据库进行BLAST。当从核苷酸序列开始时,通常使用BLASTN或TBLASTX(利用标准默认值),而当从蛋白质序列开始时,则使用BLASTP或TBLASTN(利用标准默认值)。BLAST结果可以任选地过滤。接着使用过滤的结果或者未过滤的结果中的全长序列针对查询序列来源生物的序列进行反向BLAST(二次BLAST)。然后比较一次和二次BLAST的结果。如果一次BLAST中分值靠前的命中事件来自查询序列源自的相同物种,而理想地反向BLAST导致查询序列在最高命中事件中,则鉴定到了旁系同源物;如果一次BLAST中分值靠前的命中事件不是来自查询序列源自的相同物种,且优选地反向BLAST导致查询序列处于最高命中事件之列,则找到了直向同源物。
分值靠前的命中事件是E值低的命中事件。E值越低,分值越具有显著性(或者换句话说,偶然发现此命中事件的几率越低)。E值的计算是本领域众所周知的。除了E值之外,还可以对比较进行同一性百分比记分。同一性百分比是指两比较核酸(或多肽)序列之间在特定长度上的相同核苷酸(或氨基酸)数。在大家族的情况下,可以使用ClustalW,继之以邻接树来辅助对相关基因的聚类进行可视化和鉴定直向同源物和旁系同源物。
杂交
本文定义的术语“杂交”指其中基本同源互补的核苷酸序列彼此退火的过程。杂交过程能够完全在溶液中发生,即互补的核酸都处在溶液中。杂交过程也能够这样进行,即互补核酸之一固定于基质,如磁珠、琼脂糖珠或任何其它树脂上。此外,杂交过程也能够这样进行,即其中互补核酸之一固定在固相支持物如硝酸纤维素或尼龙膜上,或者通过例如照相平板印刷术固定在例如硅质玻璃支持物上(后者称为核酸阵列或微阵列,或称为核酸芯片)。为了使杂交发生,通常使核酸分子热变性或化学变性,以使双链解链成两条单链,和/或除去单链核酸中的发夹结构或其它二级结构。
术语“严格性”是指进行杂交的条件。杂交的严格性受诸如温度、盐浓度、离子强度和杂交缓冲液组成等条件的影响。通常,在确定的离子强度和pH,对于特定序列而言,低严格条件选择为比热解链温度(Tm)低大约30℃。中等严格条件为温度比Tm低20℃,而高严格条件为温度比Tm低10℃。高严格杂交条件通常用于分离与靶核酸序列具有高序列相似性的杂交序列。不过,由于遗传密码的简并性,核酸可以在序列上有偏差而依然编码基本上相同的多肽。因此有时可能需要中等严格杂交条件来鉴定这样的核酸分子。
Tm是在确定的离子强度和pH值时,50%的靶序列与完美匹配的探针杂交的温度。Tm取决于溶液条件和探针的碱基组成及长度。例如,较长的序列在较高温度特异性杂交。在低于Tm值大约16℃到32℃获得最大杂交速率。在杂交溶液中存在一价阳离子会减少两核酸链之间的静电排斥作用,从而促进杂交体形成;当钠浓度不超过0.4M时,这一作用明显(对于更高的浓度,此效应可以忽略不计)。每个百分点的甲酰胺可使DNA-DNA和DNA-RNA双链体的解链温度降低0.6到0.7℃,加入50%甲酰胺能够使杂交在30到45℃进行,尽管这将降低杂交速率。碱基对错配降低杂交速率和双链体的热稳定性。平均而言,对于大的探针,每个百分点碱基错配使Tm值下降约1℃。取决于杂交体的类型,Tm值可以利用下列公式计算:
1)DNA-DNA杂交体(Meinkoth和Wahl,Anal.Biochem.,138:267-284,1984):
Tm=81.5℃+16.6×log10[Na+]a+0.41×%[G/Cb]-500×[Lc]-1-0.61×%甲酰胺
2)DNA-RNA或RNA-RNA杂交体:
Tm=79.8℃+18.5(log10[Na+]a)+0.58(%G/Cb)+11.8(%G/Cb)2-820/Lc
3)寡DNA或寡RNAd杂交体:
<20个核苷酸:Tm=2(ln)
20-35个核苷酸:Tm=22+1.46(ln)
a或用于其它一价阳离子,但是仅在0.01-0.4M范围内准确。
b仅对于在30%到75%范围内的%GC是准确的。
cL=双链体的碱基对长度。
d寡,寡核苷酸;ln,=引物的有效长度=2×(G/C数)+(A/T数)。
非特异性结合可以通过许多已知技术中的任一种来控制,例如用含蛋白质的溶液封闭膜,在杂交缓冲液中添加异源RNA、DNA和SDS,以及用RNA酶处理。对于非同源探针,可以通过改变如下条件之一来进行一系列杂交:(i)逐渐降低退火温度(例如从68℃降至42℃),或(ii)逐渐降低甲酰胺浓度(例如从50%降至0%)。熟练技术人员知晓可以在杂交过程中改变而保持或者改变严格条件的各种参数。
除杂交条件外,杂交特异性通常还是杂交后洗涤的函数。为了除去非特异杂交产生的背景,用稀释的盐溶液洗涤样品。这类洗涤的关键因素包括最终洗涤溶液的离子强度和温度:盐浓度越低、洗涤温度越高,洗涤的严格性就越高。洗涤条件通常在等于或低于杂交严格性的条件下进行。阳性杂交给出至少为背景两倍的信号。一般,适用于核酸杂交测定或基因扩增检测操作的适宜严格条件如上文所示设置。也可以选择更高或更低的严格条件。熟练技术人员知晓可以在洗涤过程中改变从而保持或者改变严格条件的各种参数。
例如,长于50个核苷酸的DNA杂交体的典型的高严格杂交条件包括在1×SSC中于65℃杂交或者在1×SSC和50%甲酰胺中于42℃杂交,接着在0.3×SSC中于65℃洗涤。长于50个核苷酸的DNA杂交体的中等严格杂交条件的实例包括在4×SSC中于50℃杂交或者在6×SSC和50%甲酰胺中于40℃杂交,接着在2×SSC中于50℃洗涤。杂交体的长度是杂交核酸的预期长度。当已知序列的核酸进行杂交时,杂交体的长度可以通过比对序列并鉴定本文所述的保守区域来确定。1×SSC是0.15M NaCl和15mM柠檬酸钠;杂交溶液和洗涤溶液可以另外地包括5×Denhardt试剂、0.5-1.0%SDS、100μg/ml片段化的变性鲑精DNA、0.5%焦磷酸钠。
为了定义严格性水平,可以参考Sambrook等(2001)的《分子克隆:实验室手册》,第三版,冷泉港实验室出版,冷泉港,纽约,或者Current Protocols in Molecular Biology,John Wiley&Sons,N.Y.(1989及年度更新资料)。
剪接变体
本文所用的术语“剪接变体”包括这样的核酸序列变体,其中选择的内含子和/或外显子已被切除、替换、置换或添加,或者其中内含子已被缩短或增长。这样的变体基本上保持了蛋白质的生物活性;这可以通过选择性地保留蛋白质的功能性区段来实现。这样的剪接变体可以是天然的或人工的。预测和分离这类剪接变体的方法是本领域众所周知的(参见例如Foissac和Schiex(2005)BMC Bioinformatics 6:25)。
等位基因变体
等位基因或等位基因变体为位于相同的染色体位置的给定基因的可选形式。等位基因变体包括单核苷酸多态性(SNP),以及小型插入/缺失多态性(INDEL)。INDEL的大小通常小于100bp。在大多数生物体的天然多态性品系中SNP和INDEL形成最大的一组序列变体。
内源基因
本文述及“内源”基因不仅指见于植物之中的天然形式的所讨论基因(即未经人为干预),而且指随后(重新)引入到植物中的分离形式的所述基因(或基本上同源的核酸/基因)(转基因)。例如,含有这样的转基因的转基因植物可遭遇该转基因表达的实质性下降和/或该内源基因表达的实质性下降。该分离的基因可从生物体分离或可以例如通过化学合成进行人造。
基因改组/定向进化
基因改组或定向进化是重复进行DNA改组以及继之的适当筛选和/或选择,以产生编码具有修饰生物活性的蛋白质的核酸或其部分的变体(Castle等(2004)Science 304(5674):1151-4;美国专利5,811,238和6,395,547)。
构建体
另外的调控元件可以包括转录和翻译的增强子。本领域技术人员会知道适合用于实施本发明的终止子和增强子的序列。如“定义”部分所说明的那样,也可以向5’非翻译区(UTR)或在编码序列中加入内含子序列,来增加在胞质中累积的成熟信使的量。其它控制序列(除启动子、增强子、沉默子、内含子序列、3’UTR和/或5’UTR区域之外)可以有蛋白质和/或RNA稳定元件。这类序列为本领域技术人员公知或者可以容易地获得。
本发明的遗传构建体可以还包括为在特定细胞类型中维持和/或复制所需的复制起点序列。一个实例是需要将遗传构建体作为染色体外遗传元件(如质粒或粘粒分子)在细菌细胞中维持的情况。优选的复制起点包括但不限于f1-ori和colE1。
为检测本发明方法中所用核酸序列的成功转移和/或选择含有这些核酸的转基因植物,最好使用标记基因(或报告基因)。因此,遗传构建体可以任选地含有可选择标记基因。可选择标记在本文“定义”部分有更详细的说明。一旦不再需要标记基因,可从转基因细胞将其除去或切除。用于标记去除的技术在本领域内是已知的,有用的技术描述于上文中定义部分。
调控元件/控制序列/启动子
术语“调控元件”、“控制序列”和“启动子”在文中均可互换使用,取其广义,是指能够影响与之相连的序列表达的调控性核酸序列。术语“启动子”通常是指位于基因转录起点上游的核酸控制序列,其参与识别和结合RNA聚合酶及其它蛋白质,由此指导有效连接的核酸进行转录。上述术语包括源自经典真核生物基因组基因的转录调控序列(包括对于精确的转录起始是必需的TATA盒,带或不带CCAAT盒序列),以及其它调控元件(即上游激活序列、增强子和沉默子)——它们通过应答发育刺激和/或外部刺激或以组织特异的方式改变基因表达。该术语还包括经典原核生物基因的转录调控序列,在此情况下可以包括-35盒序列和/或-10盒转录调控序列。术语“调控元件”也涵盖合成的融合分子或衍生物,其赋予、激活或增强细胞、组织或器官中核酸序列分子的表达。
“植物启动子”包括可以介导编码序列区段在植物细胞中表达的调控元件。因此,植物启动子不必是植物来源的,还可来源于病毒或微生物,例如来自攻击植物细胞的病毒。“植物启动子”还可来源于植物细胞,例如,来源于待用欲在本发明方法中表达的以及本文所述的核酸序列转化的植物。这对于其它“植物”调控信号同样适用,例如“植物”终止子。位于可用于本发明方法的核苷酸序列上游的启动子可以通过一个或多个核苷酸取代、插入和/或缺失进行修饰,而不干扰启动子、开放读框(ORF)或者3’调控区如终止子或远离ORF的其它3’调控区的功能或活性。此外,还可以通过修饰启动子的序列而增加其活性,或者将其完全替换为活性更强的启动子、甚至是来自异源生物体的启动子。为在植物中表达,核酸分子必须,如上文所述的那样,有效连接于或者包含适宜的启动子,所述启动子将在恰当的时间点以所需的空间表达模式表达所述基因。
为鉴定功能上等同的启动子,可以例如通过将候选启动子与报告基因有效连接、测定所述报告基因在植物多种组织中的表达水平和模式,来分析候选启动子的启动子强度和/或表达模式。公知的适宜报告基因包括例如β-葡糖醛酸糖苷酶或β-半乳糖苷酶。通过测量β-葡糖醛酸糖苷酶或β-半乳糖苷酶的酶活来测定启动子活性。然后可以将该启动子强度和/或表达模式与参照启动子(如本发明方法中所用的启动子)相比较。可选地,可以利用本领域公知的方法,如Northern印迹(RNA分析)结合放射自显影图的密度计量分析、定量实时PCR或RT-PCR(Heid等,1996Genome Methods 6:986-994),通过定量mRNA水平或者将本发明方法所用核酸的mRNA水平与持家基因如18S rRNA的mRNA水平进行比较,来测定启动子强度。通常,“弱启动子”表示驱动编码序列低水平表达的启动子。“低水平”表示每个细胞约1/10,000个转录物到约1/100,000个转录物、到约1/500,0000个转录物的水平。相反,“强启动子”驱动编码序列高水平表达,或者说每个细胞约1/10个转录物到约1/100个转录物、到约1/1000个转录物。一般,“中等强度启动子”表示以低于强启动子的水平,尤其是以在所有情况下都低于在35S CaMV启动子控制下所获得水平的水平,驱动编码序列表达的启动子。
有效连接
本文所用的术语“有效连接”是指启动子序列和目的基因之间的功能性连接,从而启动子序列能够起始目的基因的转录。
组成型启动子
“组成型启动子”是指在生长和发育的大多数但不必然是所有阶段,在大多数环境条件下,在至少一种细胞、组织或器官中具有转录活性的启动子。下表2a给出了组成型启动子的实例。
表2a:组成型启动子的实例
遍在启动子
遍在启动子基本上在生物体所有的组织或细胞中都有活性。
发育调控型启动子
发育调控型启动子在某些发育阶段或在经历发育改变的植物部分有活性。
诱导型启动子
诱导型启动子响应化学品(综述参见Gatz 1997,Annu.Rev.PlantPhysiol.Plant Mol.Biol.,48:89-108)、环境或物理刺激而诱导或增加转录起始,或者可以是“胁迫诱导型”,即当植物接触多种胁迫条件时被激活,或者是“病原体诱导型”,即当植物接触多种病原体时被激活。
器官特异性/组织特异性启动子
器官特异性或组织特异性的启动子是能够在某些器官或组织(如叶、根、种子组织等)中优先起始转录的启动子。例如,“根特异性启动子”是主要在植物根中,基本上排除在植物的任何其它部分中,具有转录活性的启动子,但仍允许在这些其它植物部分中的任何渗漏表达。能够仅在某些细胞中起始转录的启动子在文中称为“细胞特异性”启动子。
根特异性启动子的实例列于下表2b。
表2b:根特异性启动子的实例
种子特异性启动子主要在种子组织中,但不必仅在种子组织中(渗漏表达的情况下),具有转录活性。种子特异性启动子可以在种子发育和/或萌发期间具有活性。种子特异性启动子可以是胚乳/糊粉层/胚特异性的。种子特异性启动子(胚乳/糊粉层/胚特异性的)的实例列于下表2c至表2f中。种子特异性启动子的更多实例在Qing Qu和Takaiwa(PlantBiotechnol.J.2,113-125,2004)中给出,其公开内容作为参考并入本文,如同充分阐述的那样。
表2c:种子特异性启动子的实例
表2d:胚乳特异性启动子的实例
表2e:胚特异性启动子的实例
基因来源 | 参考文献 |
稻OSH1 | Sato等,Proc.Natl.Acad.Sci.USA,93:8117-8122,1996 |
KNOX | Postma-Haarsma等,Plant Mol.Biol.39:257-71,1999 |
PRO0151 | WO 2004/070039 |
PRO0175 | WO 2004/070039 |
PRO005 | WO 2004/070039 |
PRO0095 | WO 2004/070039 |
表2f:糊粉特异性启动子的实例
如文中所定义的绿色组织特异性启动子是主要在绿色组织中,基本上排除在任何其它植物部分中,具有转录活性的启动子,但仍允许在这些其它植物部分中的任何渗漏表达。
可以用来实施本发明方法的绿色组织特异性启动子的实例示于下表2g。
表2g:绿色组织特异性启动子的实例
组织特异性启动子的另一实例是分生组织特异性启动子,其主要在分生组织中,基本上排除在任何其它植物部分中,具有转录活性,但仍允许在这些其它植物部分的任何渗漏表达。可以用来实施本发明方法的绿色分生组织特异性启动子的实例示于下表2h。
表2h:分生组织特异性启动子的实例
终止子
术语“终止子”包括这样的控制序列,其为位于转录单位末端的DNA序列,发送初级转录物进行3’加工和多聚腺苷酸化以及终止转录的信号。终止子可以源自天然基因、多种其它植物基因、或T-DNA。例如,待加入的终止子可以源自胭脂碱合酶或章鱼碱合酶基因、或可选地源自其它植物基因、或次优选地源自任何其它真核基因。
可选择标记(基因)/报告基因
“可选择标记”、“可选择标记基因”或“报告基因”包括赋予细胞表型的任何基因,其中该表型在细胞中的表达有利于鉴定和/或选择经本发明的核酸构建体转染或转化的细胞。这些标记基因通过一系列不同的原理使得能够鉴定核酸分子的成功转移。适宜的标记可以选自赋予抗生素或除草剂抗性、引入新的代谢性状或允许可视选择的标记。可选择标记基因的实例包括赋予抗生素抗性的基因(例如磷酸化新霉素和卡那霉素的nptII,或磷酸化潮霉素的hpt,或赋予抗例如博来霉素、链霉素、四环素、氯霉素、氨苄青霉素、庆大霉素、遗传霉素(G418)、壮观霉素或杀稻瘟素抗性的基因)、赋予除草剂抗性的基因(例如提供抗抗性的bar;提供抗草甘膦抗性的aroA或gox,或赋予抗例如咪唑啉酮、膦丝菌素或磺胺脲抗性的基因)、或者提供代谢性状的基因(如允许植物使用甘露糖作为唯一碳源的manA,或有关木糖利用的木糖异构酶,或抗营养标记如对2-脱氧葡萄糖的抗性)。可视标记基因的表达导致形成颜色(例如β-葡糖醛酸糖苷酶GUS,或β-半乳糖苷酶及其有色底物,例如X-Gal)、发光(如萤光素/萤光素酶系统)或荧光(绿色荧光蛋白GFP及其衍生物)。这仅仅是一小部分可能标记的名单。技术人员熟悉此类标记。取决于生物体和选择方法,优选不同的标记。
已知对于核酸在植物细胞中的稳定或瞬时整合,取决于所用的表达载体和所用的转染技术,仅少数细胞可以摄入该外来DNA,以及,如果期望的话,整合进其基因组。为鉴定并选择这些整合体,通常将编码可选择标记(例如上文所述的那些)的基因与目的基因一起引入宿主细胞中。这些标记能够在例如突变体中使用,所述突变体中原有的这些基因例如通过常规方法缺失而没有功能。此外,编码可选择标记的核酸分子可与编码本发明多肽的或用于本发明方法的序列包含在同一个载体中,或者在分开的载体中引入宿主细胞。已经稳定转染了所引入的核酸的细胞可以例如通过选择(例如,整合有可选择标记的细胞存活而其它细胞死去)予以鉴定。
由于一旦成功引入了核酸后将不再需要或不期望转基因宿主细胞中存在标记基因,特别是抗生素和除草剂抗性基因,所以根据本发明用于引入核酸的方法最好采用能够除去或切除这些标记基因的技术。一种这样的方法是称为共转化的方法。共转化法采用两个载体同时进行转化,一个载体携带根据本发明的核酸,而第二个携带标记基因。很大比例的转化体接收,或者在植物的情况下含有(高达40%或以上的转化体),两个载体。对于农杆菌转化,转化体通常只接收载体的一部分,即被T-DNA侧翼包围的序列,其通常是表达盒。随后可通过杂交从转化植物中除去标记基因。在另一种方法中,利用整合在转座子中的标记基因与期望的核酸一起进行转化(称为Ac/Ds技术)。转化体可与转座酶来源杂交,或者用赋予转座酶表达的核酸构建体来瞬时或稳定转化转化体。在有些情况下(约10%),一旦成功进行了转化,转座子会跳离宿主细胞基因组并丢失。在另外一些情况下,转座子会跳至不同的位置。在这些情况下,必须通过杂交以消除标记基因。在微生物学领域,已经研发了使得可以或便于检测此类事件的技术。另一有利的方法有赖于所谓的重组系统;其优势在于可以免除杂交消除。最著名的这类系统是称为Cre/lox系统的系统。Cre1为重组酶,其切除位于loxP序列之间的序列。如果标记基因整合在loxP序列之间,一旦转化成功后,其会因Cre1重组酶的表达而得以切除。其它重组系统有HIN/HIX、FLP/FRT和REP/STB系统(Tribble等,J.Biol.Chem.,275,2000:22255-22267;Velmurugan等,J.Cell Biol.,149,2000:553-566)。根据本发明的核酸序列可以位点特异性地整合进植物基因组。这些方法自然也可以应用于微生物如酵母、真菌或细菌。
转基因的/转基因/重组
出于本发明的目的,就例如本发明的核酸序列、含有所述核酸序列的表达盒、基因构建体或载体、或用所述核酸序列、表达盒或载体转化的生物体而言,“转基因的”、“转基因”或“重组”是指所有这些构建体通过重组方法产生,其中:
(a)编码可用于本发明方法的蛋白质的核酸序列,或
(b)有效连接于本发明核酸序列的遗传控制序列,例如启动子,或
(c)(a)和(b)
不存在于其天然遗传环境中,或者已通过重组方法修饰,该修饰可以采取的形式为例如一个或多个核苷酸残基的取代、添加、缺失、倒位或插入。天然遗传环境应理解为指在原始植物中天然的基因组或染色体座位或者存在于基因组文库之中。在基因组文库的情况下,优选保持、至少是部分地保持核酸序列的天然遗传环境。该环境至少位于核酸序列的一侧,长度至少为50bp、优选至少500bp、特别优选至少1000bp、最优选至少5000bp。当天然存在的表达盒——例如编码可用于本发明方法的多肽的相应核酸序列与该核酸序列的天然启动子之间的天然组合——经非天然的合成(“人工”)方法例如诱变处理而被修饰时,此表达盒变成转基因表达盒。合适的方法描述在例如,US 5,565,350或WO 00/15815中。
因此,如上文所述,用于本发明目的的转基因植物应理解为指:本发明方法中所用的核酸不存在于、或来源于所述植物的基因组,或虽然存在于所述植物的基因组中,但在所述植物的基因组中不位于其天然基因座上,其中所述核酸可以进行同源或异源表达。不过,正如所提到的那样,转基因也表示:尽管在植物基因组中根据本发明的或本发明方法中所用的核酸在其天然位置上,但是所述序列已相对于天然序列而被修饰,和/或天然序列的调控序列已被修饰。转基因优选理解为表示:根据本发明的核酸在基因组中非天然的座位上表达,即同源表达,或者优选发生核酸的异源表达。优选的转基因植物在文中述及。
此外,应注意的是,在本发明的上下文中,术语“分离的核酸”或“分离的多肽”在某些情况下可以被认为分别是“重组核酸”或“重组多肽”的同义词,其指不位于其天然遗传环境中和/或已经以重组方法进行过修饰的核酸或多肽。
调节
与表达或基因表达相关的术语“调节”是指与对照植物相比,所述基因表达的表达水平被改变的过程,其中表达水平可增加或降低。原始未调节的表达可以是结构RNA(rRNA、tRNA)或随后进行翻译的mRNA的任何类型的表达。用于本发明目的,原始的未经调节的表达也可以是缺乏任何表达。术语“调节活性”应理解为指:本发明核酸序列或编码蛋白质的任何表达改变,该改变导致植物产量增加和/或生长增加。表达可以从零(缺乏,或不可测量的表达)增加到一定的量,或可以从一定的量减少到不可测量的小量或零。
表达
术语“表达”或“基因表达”是指特定基因或特定基因构建体的转录。术语“表达”或“基因表达”特别地是指基因(一个或多个)或基因构建体至结构RNA(rRNA、tRNA)或mRNA的转录,有或无后者至蛋白质的随后翻译。该过程包括DNA的转录和所获得的mRNA产物的加工。
增加的表达/过表达
如本文所用的术语“增加的表达”或“过表达”表示超出原始野生型表达水平的任何形式的表达。用于本发明目的,原始的野生型表达水平也可以是零,即缺乏表达或不可测量的表达。
增加基因或基因产物表达的方法在本领域有充分的文献记载,且包括,例如由适当的启动子驱动的过表达、转录增强子或翻译增强子的使用。可以将用作启动子或增强子元件的分离的核酸引入非异源形式的多核苷酸的适当位置(一般是上游),从而上调编码目的多肽的核酸序列的表达。例如,可以通过突变、缺失和/或取代,在体内改变内源启动子(见Kmiec,US 5,565,350;Zarling等,WO9322443),或者可以将分离的启动子在相对于本发明基因的适当方向和距离引入植物细胞中,从而控制基因的表达。
如果期望多肽表达,通常期望在多核苷酸编码区的3’末端纳入多聚腺苷酸化区域。多聚腺苷酸化区域可以源自天然基因、多种其它植物基因或T-DNA。例如,待加入的3’末端序列可以源自胭脂碱合酶或章鱼碱合酶基因、或可选地源自其它植物基因、或次优选地源自任何其它真核基因。
也可以在5’非翻译区(UTR)或部分编码序列的编码序列中加入内含子序列,来增加在胞质中累积的成熟信使的量。已显示,在植物和动物表达构建体的转录单位中纳入可剪接内含子,可以在mRNA和蛋白质水平使基因表达增加高达1000倍(Buchman和Berg(1988)Mol.Cell biol.8:4395-4405;Callis等(1987)Genes Dev.1:1183-1200)。通常内含子放置在转录单位5’末端附近时,增强基因表达的作用最大。玉蜀黍内含子Adh1-S内含子1、2和6,Bronze-1内含子的使用是本领域公知的。一般信息请参见The Maize Handbook,第116章,Freeling和Walbot编辑,Springer,N.Y.(1994)。
降低的表达
本文述及“降低的表达”或者表达“减小或基本上消除”应理解为表示,内源基因表达和/或多肽水平和/或多肽活性相对于对照植物降低。所述减小或基本上消除按照递增的优选顺序为,与对照植物相比,减小至少10%、20%、30%、40%或50%、60%、70%、80%、85%、90%或95%、96%、97%、98%、99%或更多。
为减小或基本上消除植物中内源基因的表达,需要一段足够长度的、基本上连续核苷酸的核酸序列。为进行基因沉默,这可以少至20、19、18、17、16、15、14、13、12、11、10或更少的核苷酸,可选地,这可以多至完整的基因(包括部分或完整的5’和/或3’UTR)。此基本上连续的核苷酸链可以源自编码目的蛋白质的核酸(靶基因),或者源自能够编码目的蛋白质的直向同源物、旁系同源物或同源物的任何核酸。优选地,基本上连续的核苷酸链能够与靶基因(有义链或反义链)形成氢键,更优选地,基本上连续的核苷酸链按照递增的优选顺序与靶基因(有义链或反义链)50%、60%、70%、80%、85%、90%、95%、96%、97%、98%、99%、100%序列相同。对于本文所讨论的用于减小或基本上消除内源基因表达的各种方法而言,编码(功能性)多肽的核酸序列并非必需的。
减小或基本上消除表达可以利用常规工具和技术来实现。减小或基本上消除内源基因表达的一个优选方法是通过向植物中引入和表达基因构建体,其中,核酸(在此情况中,源自目的基因、或者源自能够编码任一目的蛋白质的直向同源物、旁系同源物或同源物的任何核酸的、一段基本上连续核苷酸的链)以被间隔子(非编码DNA)分隔开的、(部分或完全地)反向重复的形式克隆在该构建体中。
在这样的优选方法中,利用核酸或其部分(在此情况中,源自目的基因、或者源自能够编码目的蛋白质的直向同源物、旁系同源物或同源物的任何核酸的、一段基本上连续核苷酸的链)的反向重复(优选能够形成发夹结构),通过RNA介导的沉默,实现减小或基本上消除内源基因的表达。将该反向重复序列克隆进包含控制序列的表达载体中。非编码DNA核酸序列(间隔子,例如基质附着区片段(MAR)、内含子、多接头等)位于形成该反向重复的两个反向核酸之间。该反向重复序列转录后,形成具有(部分或完全)自我互补结构的嵌合RNA。该双链RNA结构称为发夹RNA(hpRNA)。hpRNA被植物加工成可以整合入RNA诱导的沉默复合物(RISC)中的siRNA。RISC进而切割mRNA转录物,从而显著减少待翻译成多肽的mRNA转录物的数量。关于其它一般细节,参见例如Grierson等(1998)WO 98/53083;Waterhouse等(1999)WO 99/53050)。
本发明的方法的实施不依赖于向植物中引入和表达其中以反向重复形式克隆了核酸分子的基因构建体,而是可以使用几种公知的“基因沉默”法中的任一个或多个来实现相同的效应。
用于减小内源基因表达的一个这样的方法是RNA介导的基因表达的沉默(下调)。在该情况下沉默在植物中由双链RNA序列(dsRNA)触发,所述双链RNA序列基本上与靶内源基因相似。该dsRNA被植物进一步加工成称为短干扰RNA(siRNA)的大约20至大约26个核苷酸。siRNA整合入RNA诱导的沉默复合物(RISC),该复合物切割内源靶基因的mRNA转录物,从而实质性减少待翻译成多肽的mRNA转录物的数量。优选,双链RNA序列相应于靶基因。
RNA沉默法的另一实例包括以有义取向,向植物中引入核酸序列或其部分(在这种情况下,源自目的基因、或者源自能够编码目的蛋白质的直向同源物、旁系同源物或同源物的任何核酸的、一段基本上连续核苷酸的链)。“有义取向”是指与其mRNA转录物同源的DNA序列。从而至少一个拷贝的核酸序列被引入植物。该额外的核酸序列将减小内源基因的表达,从而产生称为共抑制的现象。如果将几个额外拷贝的核酸序列引入植物,则基因表达的减小将更明显,因为在高转录水平与共抑制的触发之间存在正相关。
RNA沉默法的另一实例包括使用反义核酸序列。“反义”核酸序列包含这样的核苷酸序列,所述核苷酸序列与编码蛋白质的“有义”核酸序列互补,即与双链cDNA分子的编码链互补或与mRNA转录物序列互补。反义核酸序列优选与待沉默的内源基因互补。互补性可位于基因的“编码区”和/或“非编码区”中。术语“编码区”是指包含将翻译成氨基酸残基的密码子的核苷酸序列的区域。术语“非编码区”是指连接在编码区侧翼的5'和3'序列,其可被转录但不被翻译成氨基酸(也称为5'和3'非翻译区)。
可根据沃尔森和克里克碱基配对法则设计反义核酸序列。反义核酸序列可与整个核酸序列(在这种情况下,源自目的基因、或者源自能够编码目的蛋白质的直向同源物、旁系同源物或同源物的任何核酸的、一段基本上连续核苷酸的链)互补,但也可以是仅对核酸序列的部分(包括mRNA 5’和3’UTR)反义的寡核苷酸。例如,反义寡核苷酸序列可与围绕编码多肽的mRNA转录物的翻译起始位点的区域互补。适宜的反义寡核苷酸序列的长度在本领域内是已知的并且可以开始于长大约50、45、40、35、30、25、20、15或10个核苷酸或更少。可使用本领域内已知的方法,使用化学合成和酶促连接反应,构建根据本发明的反义核酸序列。例如,反义核酸序列(例如,反义寡核苷酸序列)可使用天然存在的核苷酸或各种修饰核苷酸来化学合成,所述修饰核苷酸经设计用以增加分子的生物学稳定性或增加反义与有义核酸序列之间形成的双链体的物理稳定性,例如可使用硫代磷酸酯衍生物和吖啶取代的核苷酸。可用于产生反义核酸序列的修饰核苷酸的实例在本领域是公知的。已知的核苷酸修饰包括甲基化、环化和“加帽”和用类似物例如肌苷对一个或多个天然存在的核苷酸的取代。核苷酸的其它修饰在本领域是公知的。
可使用已将核酸序列以反义取向(即,从插入的核酸转录的RNA针对目的靶核酸是反义取向)亚克隆入其中的表达载体,生物学地产生反义核酸序列。优选,植物中,通过稳定地整合的包含启动子、有效连接的反义寡核苷酸和终止子的核酸构建体,产生反义核酸序列。
用于在本发明的方法中进行沉默的核酸分子(无论引入植物的还是原位产生的)与编码多肽的mRNA转录物和/或基因组DNA杂交或结合,从而例如通过抑制转录和/或翻译来抑制蛋白质的表达。杂交可通过常规核苷酸互补性以形成稳定的双链体或者,例如在结合DNA双链体的反义核酸序列的情况下,通过双螺旋的大沟中的特定相互作用而产生。可通过转化或在特定组织位置直接注射,将反义核酸序列引入植物。可选地,可修饰反义核酸序列以靶向选择的细胞,然后全身性施用。例如,为了进行全身性施用,可以修饰反义核酸序列,以便其特异性结合选择的细胞表面上表达的受体或抗原(例如,通过将反义核酸序列连接到结合细胞表面受体或抗原的肽或抗体)。还可使用本文中描述的载体将反义核酸序列递送至细胞。
根据另一个方面,反义核酸序列是α-异头物核酸序列。α-异头物核酸序列与互补RNA形成特定的双链杂交体,其中与常见的b单元(b-units)不同,链走向彼此平行(Gaultier等(1987)Nucl Ac Res 15:6625-6641)。反义核酸序列还可包含2'-o-甲基核糖核苷酸(Inoue等(1987)NuclAc Res 15,6131-6148)或嵌合RNA-DNA类似物(Inoue等(1987)FEBSLett.215,327-330)。
还可使用核酶减少或基本上消除内源基因的表达。核酶是具有核糖核酸酶活性的催化性RNA分子,该分子能够切割与其具有互补区的单链核酸序列例如mRNA。因此,核酶(例如,锤头核酶(Haselhoff和Gerlach(1988)Nature 334,585-591)中描述的)可用于催化切割编码多肽的mRNA转录物,从而显著减少待翻译成多肽的mRNA的数量。可设计具有对于核酸序列的特异性的核酶(参见例如:Cech等美国专利号4,987,071;和Cech等美国专利号5,116,742)。可选择地,可以使用相应于核酸序列的mRNA转录物,从RNA分子库中选择具有特定核糖核酸酶活性的催化性RNA(Bartel和Szostak(1993)Science 261,1411-1418)。核酶用于在植物中进行基因沉默的用途在本领域是已知的(例如,Atkins等(1994)WO94/00012;Lenne等(1995)WO 95/03404;Lutziger等(2000)WO 00/00619;Prinsen等(1997)WO 97/13865和Scott等(1997)WO 97/38116)。
基因沉默还可以通过插入诱变(例如,T-DNA插入或转座子插入)或通过Angell和Baulcombe((1999)Plant J 20(3):357-62)、(AmpliconVIGS WO 98/36083)或Baulcombe(WO 99/15682)等所述的策略来实现。
如果在内源基因上存在突变和/或在随后引入植物的分离基因/核酸上存在突变,那么基因沉默也可发生。减少或基本上消除可通过非功能性多肽引起。例如,多肽可能结合多种相互作用的蛋白质;因此,可以通过一个或多个突变和/或截短,提供仍然能够结合相互作用的蛋白质(例如受体蛋白)但不能展示其正常功能(例如信号转导配体)的多肽。
进行基因沉默的另一个方法是通过用与基因的调控区(例如启动子和/或增强子)互补的核酸序列来打靶以形成三螺旋结构,所述结构阻止基因在靶细胞中的转录。参见Helene,C.,Anticancer Drug Res.6,569-84,1991;Helene等,Ann.N.Y.Acad.Sci.660,27-361992;和Maher,L.J.Bioassays 14,807-15,1992。
其它方法,例如应用针对内源多肽的抗体在植物原位(in planta)抑制其功能、或干扰多肽所参与的信号传递通路,对于技术人员是公知的。特别地,可预期人造分子可用于抑制靶多肽的生物功能,或用于干扰其中靶多肽参与的信号转导途径。
可选择地,可设置筛选程序以鉴定植物群体中基因的天然变体,该变体编码具有减少的活性的多肽。这样的天然变体也可用于例如进行同源重组。
人工和/或天然微小RNA(miRNA)可以用来敲除基因表达和/或mRNA翻译。内源miRNA为单链小RNA,一般长度19-24个核苷酸。它们主要用于调控基因表达和/或mRNA翻译。大多数植物microRNA(miRNA)具有与其靶序列完全或几乎完全的互补性。然而,存在具有达到5个错配的天然靶。miRNA利用Dicer家族的双链特异性RNA酶从具有特征性折回结构的更长的非编码RNA加工而来。一旦加工后,它们通过结合RNA诱导的沉默复合物(RISC)的主要成分Argonaute蛋白,而掺入到RNA诱导沉默复合物中。miRNA充当RISC的特异性组件,因为它们与细胞质中的靶核酸(大多数为mRNA)碱基配对。随后的调控事件包括靶mRNA切割和破坏和/或翻译抑制。因此,miRNA过表达的效应常反映为靶基因的降低的mRNA水平。
人工微小RNA(amiRNA)一般长度21个核苷酸,可以特异地遗传改造以负调控单个或多个目的基因的基因表达。植物微小RNA靶标选择的决定因素在本领域公知。已经定义了靶标识别的经验参数,并且可用来辅助设计特异性amiRNA(Schwab等,(2005)Dev Cell 8:517-527,2005)。设计和生成amiRNA及其前体的便利工具也是公众可获得的(Schwab等,(2006)Plant Cell 18(5):1121-1133,2006)。
为优化性能,用来减小植物中内源基因表达的基因沉默技术需要应用来自单子叶植物的核酸序列转化单子叶植物,而使用来自双子叶植物的核酸序列转化双子叶植物。优选,将来自任何给定植物物种的核酸序列引入到相同物种中。例如,来自稻的核酸序列转化到稻植物中。然而,待引入的核酸序列来源于与其待引入的植物相同的植物物种并非是绝对必需的。内源靶基因与待引入的核酸之间基本上同源就足够了。
上文描述了减小或基本上消除植物中内源基因表达的多种方法的实例。本领域技术人员将能够容易地调整上述沉默方法,以便例如通过应用适当的启动子而实现内源基因在整株植物或其部分中的表达减小。
转化
本文述及的术语“引入”或“转化”包括将外源多核苷酸转移进宿主细胞,不考虑转移所用的方法。能够随后通过器官发生或者胚胎发生进行克隆增殖的植物组织都可以使用本发明的遗传构建体转化,并从其再生整个植物。具体的组织选择将因可用于和最适于待转化的具体物种的克隆增殖系统而变。示例性的组织靶标包括叶盘、花粉、胚、子叶、下胚轴、雌配子、愈伤组织、既有的分生组织(例如顶端分生组织、腋芽和根分生组织),以及诱导的分生组织(例如子叶分生组织和下胚轴分生组织)。可以将多核苷酸瞬时地或稳定地引入宿主细胞,并且可以,例如作为质粒以非整合的状态维持。可选地,其可以整合进入宿主基因组。得到的转化植物细胞可以接着以本领域技术人员已知的方式再生为转化的植物。
外来基因转移进入植物基因组中称为转化。植物物种的转化目前是一种相当常规的技术。有利地,可以使用若干转化方法的任一种向适当的祖先细胞引入目的基因。可以利用公开的转化方法以及由植物组织或植物细胞再生植物的方法来进行瞬时或稳定转化。转化方法包括应用脂质体、电穿孔、增加游离DNA摄取的化学物质、直接向植物注射DNA、粒子枪轰击、用病毒或花粉转化和微粒轰击。方法可以选自用于原生质体的钙/聚乙二醇方法(Krens,F.A.等,(1882)Nature 296,72-74;Negrutiu I.等,(1987)Plant Mol.Biol.8:363-373);原生质体的电穿孔法(Shillito R.D.等,(1985)Bio/Technol 3,1099-1102);植物材料的显微注射(Crossway A.等,(1986)Mol.Gen Genet 202:179-185);DNA或RNA包被的粒子轰击(Klein T.M.等,(1987)Nature 327:70);用(非整合型)病毒感染,等等。优选通过农杆菌介导的转化,产生转基因植物,包括转基因作物植物。有利的转化法是植物原位转化。为此,可以例如使农杆菌作用于植物种子,或用农杆菌接种植物分生组织。已经证明,根据本发明尤为有利的是使转化的农杆菌悬液作用于完整植株或至少花原基。随后培养植物,直至获得所处理植物的种子(Clough和Bent,Plant J.(1998)16,735–743)。农杆菌介导的稻转化方法包括公知的稻转化方法,例如在任一如下文献中描述的那些:欧洲专利申请EP 1198985A1,Aldemita和Hodges(Planta,199:612-617,1996);Chan等(Plant Mol.Biol.22(3)491-506,1993),Hiei等(Plant J.6(2):271-282,1994),其公开内容并入本文作为参考,如同充分阐述的那样。至于玉米转化,优选的方法如Ishida等(Nat.Biotechnol.14(6):745-50,1996)或Frame等(Plant Physiol.129(1):13-22,2002)中所述,其公开内容并入本文作为参考,如同充分阐述的那样。作为举例说明,所述方法还由B.Jenes等,Techniques for GeneTransfer,在Transgenic Plants,卷1,Engineering and Utilization,编辑S.D.Kung和R.Wu,Academic Press(1993)128-143以及Potrykus Annu.Rev.Plant Physiol.Plant Molec.Biol.42(1991)205-225)中进一步描述。优选将待表达的核酸或构建体克隆到载体中,所述载体适用于转化根癌农杆菌(Agrobacterium tumefaciens),例如pBin19(Bevan等,Nucl.Acids Res.12(1984)8711)。然后以已知的方式利用由这样的载体转化的农杆菌来转化植物,例如模式植物,像拟南芥属植物(拟南芥(Arabidopsis thaliana)在本发明范围内不视为作物植物);或者作物植物,例如烟草植物,例如通过将擦伤的叶子或切碎的叶子浸在农杆菌溶液中,然后在合适的培养基中培养之。通过根癌农杆菌的植物转化由例如,和Willmitzer在Nucl.Acid Res.(1988)16,9877中描述,或者尤其可以参见F.F.White,Vectors for Gene Transfer in Higher Plants在Transgenic Plants,卷1,Engineering and Utilization,编辑S.D.Kung和R.Wu,Academic Press,1993,第15-38页。
除了转化体细胞(其之后不得不再生为完整植株),还可以转化植物分生组织的细胞,特别是可以发育成配子的那些细胞。在这种情况下,转化的配子循着天然植物的发育而产生转基因植物。因此,例如,用农杆菌处理拟南芥的种子,并从发育中的植物获得种子,其中一定比例的植物被转化因而是转基因的[Feldman,KA和Marks MD(1987).MolGen Genet 208:1-9;Feldmann K(1992).在C Koncz,N-H Chua和J Shell编辑Methods in Arabidopsis Research.Word Scientific,Singapore,第274-289页]。可选的方法基于花序的反复去除以及莲座中心切割部位与转化农杆菌一起进行的孵育,由此在随后的时间点同样能够获得转化的种子(Chang(1994).Plant J.5:551-558;Katavic(1994).Mol Gen Genet,245:363-370)。然而,特别有效的方法是改良的真空浸润法,如“浸花法”(floral dip)。对于拟南芥的真空浸润,减压下用农杆菌悬液处理完整植株[Bechthold,N(1993).C R Acad Sci Paris Life Sci,316:1194-1199],而对于“浸花法”,将发育中的花组织与表面活性剂处理的农杆菌悬液短暂孵育[Clough,SJ和Bent,AF(1998).The Plant J.16,735-743]。在两种情况下均收获一定比例的转基因种子,且可通过在上述选择性条件下培养而将这些种子与非转基因种子区分开来。另外,质体的稳定转化是有利的,因为质体在多数作物中为母系遗传,从而降低或消除了转基因通过花粉流失的风险。叶绿体基因组的转化通常通过Klaus等,2004[NatureBiotechnology 22(2),225-229]系统展示的方法实现。简言之,将待转化的序列与可选择的标记基因一起克隆到同源于叶绿体基因组的侧翼序列之间。这些同源侧翼序列指导转基因位点特异性整合到质体基因组中。质体转化已在许多不同的植物物种中描述,且综述由Bock(2001)Transgenic plastids in basic research and plant biotechnology.J Mol Biol.2001年9月21日;312(3):425-38或Maliga,P(2003)Progress towardscommercialization of plastid transformation technology.Trends Biotechnol.21,20-28给出。最近报道了其它生物技术进步,无标记的质体转化体,这可通过瞬时共整合的标记基因产生(Klaus等,2004,NatureBiotechnology 22(2),225-229)。
遗传修饰的植物细胞能够通过技术人员熟悉的所有方法再生。合适的方法可见于上述S.D.Kung和R.Wu、Potrykus或者和Willmitzer的出版物。
通常在转化以后,选出存在一个或多个标记的植物细胞或细胞群,所述标记由与目的基因共转移的植物可表达基因编码,接着使转化的材料再生成整个植物。为选择转化的植物,通常将在转化中获得的植物材料置于选择性条件下,从而可将转化的植物与未转化的植物区分开来。例如,可以种植以上述方式获得的种子,并在最初的生长期之后,通过喷雾对其进行合适的选择。另一可能性方案是在使用合适的选择剂的琼脂板上生长种子(酌情在灭菌后),从而仅转化的种子能够长成植物。可选地,针对可选择标记例如上文所述标记的存在,筛选转化的植物。
DNA转移和再生之后,还可例如用Southern分析(DNA印迹),评价推定转化的植物,评价目的基因的存在、拷贝数和/或基因组构造。可选的或额外地,可用Northern和/或Western分析(蛋白质印迹)监测新引入的DNA的表达水平,这两种技术都是本领域普通技术人员所公知的。
产生的转化植物可以通过多种方式繁殖,如通过克隆繁殖或经典的育种技术。例如,第一代(或T1)转化的植物可自交,选择纯合的第二代(或T2)转化体,而T2植物可进一步通过经典育种技术繁殖。产生的转化生物体可以呈多种形式。例如,它们可以是转化细胞和非转化细胞的嵌合体;克隆的转化体(例如所有细胞已转化而含有表达盒);转化的和非转化的组织的嫁接体(例如在植物中,转化的砧木嫁接到非转化的接穗上)。
T-DNA激活标记
T-DNA激活标记(Hayashi等Science(1992)1350-1353)包括将T-DNA[通常含有启动子(也可以是翻译增强子或内含子)]插入在目的基因的基因组区或基因编码区上游或下游10kb处,从而在构型上使启动子能够指导靶基因的表达。通常破坏天然启动子对靶基因表达的调控,而使基因落入新引入的启动子的控制下。启动子一般包含于T-DNA中。此T-DNA可以例如通过农杆菌感染而随机插入植物基因组中,并导致所插入T-DNA附近的基因的表达被修饰。得到的转基因植物由于位于引入的启动子附近的基因的修饰表达而表现出显性表型。
TILLING
术语“TILLING”为“靶向诱导的基因组局部损伤”(Targeted InducedLocal Lesions In Genomes)的缩写,是一种用于生成和/或鉴定编码具有修饰的表达和/或活性的蛋白质的核酸的诱变技术。TILLING还允许选择携带此类突变变体的植物。这些突变变体可以在强度、位置或时间(例如,如果突变影响启动子的话)上呈现出修饰的表达。这些突变变体可以比其天然形式基因呈现更高的活性。TILLING将高密度诱变和高通量筛选方法结合在一起。TILLING一般遵循的步骤有:(a)EMS诱变(Redei GP和Koncz C,(1992)In Methods in Arabidopsis Research,Koncz C,Chua NH,Schell J编辑,新加坡,World Scientific Publishing Co,第16-82页;Feldmann等,(1994)In Meyerowitz EM,Somerville CR编辑,Arabidopsis.冷泉港实验室出版社,冷泉港,纽约,第137-172页;Lightner J和Caspar T,(1998)In J Martinez-Zapater,J Salinas编辑,Methods on MolecularBiology,82卷Humana Press,Totowa,NJ,第91-104页);(b)DNA制备和个体合并;(c)目的区域的PCR扩增;(d)变性和退火以形成杂双链体;(e)DHPLC,其中合并物中存在的杂双链体在色谱图上检测为额外的峰;(f)突变个体的鉴定;和(g)突变PCR产物的测序。TILLING的方法是本领域公知的(McCallum等(2002)Nat Biotechnol 18:455-457,由Stemple综述(2004)Nat Rev Genet 5(2):145-50)。
同源重组
同源重组允许向基因组中的规定选定位置引入所选的核酸。同源重组是生物科学中常规用于低等生物体如酵母或剑叶藓(physcomitrella)的标准技术。在植物中进行同源重组的方法已经不仅在模式植物中描述(Offringa等(1990)EMBO J.9(10):3077-84),而且也在作物植物,如稻中描述(Terada等(2002)Nat Biotech 20(10):1030-4;Iida和Terada(2004)Curr Opin Biotechnol 15(2):132-8),并且存在无论靶生物种类的通常可应用的方法(Miller等,Nature Biotechnol.25,778-785,2007)。
产量相关性状
产量相关性状是与植物产量相关的性状或特征。产量相关性状可以包括如下非限制性的特征列表中的一或多种:早期开花时间、产量、生物量、种子产量、早期活力、绿度指数、增加的生长速率、改善的农艺性状(例如,提高的水利用效率(WUE),提高的氮利用效率(NUE)等)。
产量
术语“产量”通常表示具有经济价值的可测量产出,其一般是与规定的作物、面积和/或时期相关的。各植物部分基于其数量、大小和/或重量对产量直接做出贡献,或者实际产量是年作物每平方米的产量,用总产量(既包括收获的产量也包括估定的产量)除以种植的平方米来确定。
术语植物的“产量”和“植物产量”在本文中可互换使用,意指该植物的营养性生物质(例如根和/或枝条生物质),指繁殖器官,和/或指繁殖体(例如种子)。
以玉米为例,雄性花序(雄穗)和雌性花序(雌穗(ear))。雌性花序在中心轴(穗轴)的表面上形成成对的小穗。每个雌性小穗包含两个可育的小花,其中一个一旦受精后通常将会成熟为玉米粒。由此,在玉米中,产量增加可以表现为如下一个或多个方面:每平方米建植的植物数的增加、每株植物的雌穗数的增加、行数、行粒数、粒重、千粒重、雌穗长度/直径的增加、种子饱满率(为充实的小花(即,包含种子的小花)数除以小花的总数并乘以100)的增加,等等。
稻植物中的花序被称为圆锥花序。圆锥花序带小穗。小穗是圆锥花序的基本单元,其由花梗和小花组成。小花长在花梗上。小花包括被两个保护性颖片(一个较大的颖片(外稃)和一个较小的颖片(内稃))覆盖的花朵。由此,以稻为例,产量增加可以表现为如下一个或多个方面的增加:每平方米的植物数、每株植物的圆锥花序数、圆锥花序长度、每圆锥花序的小穗数、每圆锥花序的花朵(或小花)数、种子饱满率(为包含种子的小花(饱满的小花)数除以小花的总数并乘以100)的增加、千粒重的增加,等等。在稻中,耐淹性也可以导致增加的产量。
早期开花时间
在本文中使用时,具有“早期开花时间”的植物是比对照植物早开始开花的植物。由此,该术语指表现出较早开始开花的植物。可以通过计算播种和第一个花序出现之间的天数(“至开花的时间”)来估计植物的开花时间。可以例如使用WO 2007/093444中描述的方法来确定植物的“开花时间”。
早期活力
“早期活力”是指活跃健康充分均衡的生长(特别是在植物生长的早期阶段),其可以因植物适应性(fitness)增强引起,例如,由于植物更好地适应其环境(即,优化能源资源的利用以及在枝条和根之间的分配)引起。具有早期活力的植物也显示出增加的幼苗存活和更佳的作物齐苗,这往往产生高均匀度的田地(作物以齐整的方式生长,即大多数植物基本上同时达到各发育阶段),以及往往是更优更高的产量。因此,早期活力可以通过测量多种因素来确定,如千粒重、萌发率、出苗率、幼苗生长、幼苗高度、根长度、根和枝条生物量,等等。
增加的生长速率
增加的生长速率可以特异于植物的一个或多个部分(包括种子),或者可以基本上遍及整株植物。具有增加生长速率的植物可以具有更短的生命周期。植物的生命周期可以理解为指,从成熟干种子生长至植物已经产生类似于起始材料的成熟干种子的阶段所需的时间。此生命周期可以受到诸如萌发速度、早期活力、生长速率、绿度指数、开花时间和种子成熟速度等因素的影响。生长速率的增加可以发生在植物生命周期的一个或多个阶段,或者发生在基本上整个植物生命周期的过程中。在植物生命周期的早期阶段,生长速率的增加可以反映出增强的活力。生长速率的增加可以改变植物的收获周期,使植物能够比原可能的情况更晚播种和/或更快收获(类似的效果可以通过较早的开花时间获得)。如果生长速率充分增加,可以允许再次播种同种植物物种的种子(例如完全在一个常规的生长期内,播种和收获稻类植物、接着再次播种和收获稻类植物)。与此类似,如果生长速率充分地增加,可以允许再播种不同植物物种的种子(例如播种和收获玉米植物,随后,例如,播种和任选的收获大豆、马铃薯或任何其它适宜的植物)。在一些作物植物的情况下也可能从同一砧木收获增加的次数。改变植物的收获周期可以导致每平方米年生物量产量的增加(这是由于(比方说在一年中)任何特定植物可以生长和收获的次数增加)。与野生型对应物相比,生长速率的增加还允许在更广阔的地域栽培转基因植物,这是因为种植作物的地域限制常由种植时(早季)或收获时(晚季)不利的环境条件所决定。如果缩短收获周期,就可以避免这类不利条件。可以通过自生长曲线获得多种参数,确定生长速率,这类参数可以是:T-Mid(植物达到其最大大小的50%所需的时间)和T-90(植物达到其最大大小的90%所需的时间)等等。
胁迫抗性
相对于对照植物,产量和/或生长速率的增加可以发生在植物处于非胁迫条件下或发生在植物暴露于各种胁迫的情况下。通常植物通过更加缓慢的生长来应答胁迫接触。在重度胁迫条件下,植物甚至可以完全停止生长。另一方面,轻度胁迫在文中定义为当植物接触时不导致植物完全停止生长且丧失重新开始生长的能力的任何胁迫。本发明意义上的轻度胁迫导致受胁迫植物的生长,与非胁迫条件下的对照植物相比,下降不到40%、35%、30%或25%、更优选下降不到20%或15%。由于农业实践(灌溉、施肥、农药处理)的发展,栽培的作物植物往往并不会遇到重度胁迫。因此,由轻度胁迫诱发的受损的生长通常成为农业中不期望的性质。“轻度胁迫”是植物接触的日常的生物和/或非生物(环境)胁迫。非生物胁迫可以因干旱或过量的水、缺氧胁迫、盐胁迫、化学毒性、氧化胁迫以及热、冷或冰冻温度而引起。
“生物胁迫”一般是由病原体例如细菌、病毒、真菌、线虫和昆虫所引起的那些胁迫。
“非生物胁迫”可以是由水胁迫,例如由于干旱、盐胁迫或冰冻胁迫,引起的渗透胁迫。非生物胁迫也可以是氧化胁迫或冷胁迫。“冰冻胁迫”意指由于冰冻温度(即,使可用水分子冻结并转化成冰的温度)引起的胁迫。“冷胁迫”,也称为“寒胁迫”,意指冷的温度,例如低于10℃,或优选低于5℃的温度,但是在该温度下,水分子不冻结。如Wang等(Planta(2003)218:1-14)所报道的那样,非生物胁迫引起一系列的形态学、生理学、生物化学和分子的变化,对植物生长和生产力造成不利影响。已知干旱、盐度、极端温度和氧化胁迫相互联系,并可以通过相似的机制诱发生长和细胞损害。Rabbani等(Plant Physiol(2003)133:1755-1767)描述了干旱胁迫和高盐度胁迫之间存在着的特别高程度的“交叉对话”。例如,干旱和/或盐度主要表现为渗透胁迫,导致破坏细胞中的稳态和离子分布。氧化胁迫通常与高温或低温、盐度或干旱胁迫相伴,可以引起功能及结构蛋白质的变性。所以,这些多种多样的环境胁迫通常激活相似的细胞信号传递通路和细胞应答,如应激蛋白的产生、抗氧化剂的上调、可混溶溶质的累积以及生长阻抑。如本文中所用的术语“非胁迫”条件是允许植物最佳生长的那些环境条件。本领域技术人员知道给定位置的正常土壤条件和气候条件。具有最佳生长条件(在非胁迫条件下生长)的植物通常按照递增的优选次序产生这样的植物在给定的环境中的平均产量的至少97%、95%、92%、90%、87%、85%、83%、80%、77%或75%。可基于收获和/或季节,计算平均产量。本领域技术人员将知晓作物的平均产量产出。
特别地,可以在非胁迫条件下实施本发明的方法。在一个实施例中,可以在例如轻度干旱的非胁迫条件下实施本发明的方法,以产生相对于对照植物具有增加的产量的植物。
在另一个实施方案中,可以在胁迫条件下实施本发明的方法。
在一个实施例中,可以在例如干旱的胁迫条件下实施本发明的方法,以产生相对于对照植物具有增加的产量的植物。
在另一个实施例中,可以在例如养分缺乏的胁迫条件下实施本发明的方法,以产生相对于对照植物具有增加的产量的植物。
养分缺乏可以因诸如氮、磷酸及其它含磷化合物、钾、钙、镁、锰、铁和硼等养分的缺乏所致。
在另一个实施例中,可以在例如盐胁迫的胁迫条件下实施本发明的方法,以产生相对于对照植物具有增加的产量的植物。术语盐胁迫不局限于氯化钠(NaCl),而可以是如下之任一种或多种:NaCl、KCl、LiCl、MgCl2、CaCl2等等。
在另一个实施例中,可以在例如冷胁迫或冰冻胁迫的胁迫条件下实施本发明的方法,以产生相对于对照植物具有增加的产量的植物。
增加/提高/增强
术语“增加”、“提高”或“增强”可互换,且在本申请意义上表示与文中所定义的对照植物相比,产量和/或生长多出至少3%、4%、5%、6%、7%、8%、9%或10%,优选至少15%或20%,更优选25%、30%、35%或40%。
种子产量
增加的种子产量可表现为如下一项或多项:
a)种子生物量(种子总重量)的增加,这可以是基于单粒种子和/或每植株和/或每平方米的增加;
b)每植株花数的增加;
c)增加的种子数;
d)增加的种子饱满率(其表达为充实的小花数与小花总数的比率);
e)增加的收获指数,其表达为可收获部分(例如种子)的产量除以地上植物部分生物量的比率;和
f)增加的千粒重(TKW),这通过计数种子数和它们的总重量外推得到。TKW增加可来自于种子大小和/或种子重量的增加,并且也可来自胚和/或胚乳大小的增加。
种子产量的增加也可表现为种子大小和/或种子体积的增加。此外,种子产量的增加也可表现为种子面积和/或种子长度和/或种子宽度和/或种子周长的增加。
绿度指数
如本文所用的“绿度指数”根据植物的数字图像计算。对于图像中属于植物目标的每一个像素,计算绿值与红值(在RGB模型中用于色度编码)之比。绿度指数表达为绿红比超过给定阈值的像素百分比。在正常生长条件下、在盐胁迫生长条件下、在养分可利用度下降的生长条件下,在开花前的末次成像中测量植物绿度指数。相反,在干旱胁迫生长条件下,在干旱后的首次成像中测量植物绿度指数。
生物量
在本文中使用时,术语“生物量”意指植物的总重量。在生物量的定义范围内,可以区分植物的一个或多个部分的生物量,它们可以包括下列之任一或多个:
-地上部分,例如但不限于,枝条生物量、种子生物量、叶生物量等;
-地上可收获部分,例如但不限于,枝条生物量、种子生物量、叶生物量等;
-地下部分,例如但不限于,根生物量等;
-地下可收获部分,例如但不限于,根生物量等;
-营养体生物量,例如根生物量、枝条生物量等;
-繁殖器官;和
-繁殖体,例如种子。
标记辅助育种
这类育种程序有时需要使用例如EMS诱变,通过植物诱变处理引入等位基因变异;可选的,此类程序可以起始于一系列无意产生的所谓“天然”起源的等位基因变体。然后通过例如PCR进行等位基因变体的鉴定。随后是选择步骤,用以选择所讨论序列的较好等位基因变体,该变体提供增加的产量。一般通过监测含有所讨论序列的不同等位基因变体的植物的生长行为来进行选择。可以在温室或田地中监测生长行为。更多任选的步骤包括使经鉴定含有较好等位基因变体的植物与另一植物杂交。例如,可使用这种方法产生感兴趣表型特征的组合。
在(遗传作图)中用作探针
利用编码目的蛋白质的核酸进行基因的遗传和物理作图仅需要长度至少15个核苷酸的核酸序列。此类核酸可以用作限制性片段长度多态性(RFLP)标记。可以用编码目的蛋白质的核酸探测限制酶切消化的植物基因组DNA的Southern印迹(Sambrook J,Fritsch EF和Maniatis T(1989)《分子克隆:实验室手册》)。随后使用计算机程序如MapMaker(Lander等(1987)Genomics 1:174-181)对产生的带型进行遗传分析,以构建遗传图谱。另外,可以使用所述核酸探测含有一组如下个体的限制性内切酶处理的基因组DNA的Southern印迹,所述该组个体为规定的遗传杂交的亲本和子代。记录DNA多态性的分离,并用于计算编码目的蛋白质的核酸在先前用此群体所获得的遗传图谱中的位置(Botstein等(1980)Am.J.Hum.Genet.32:314-331)。
有关在遗传作图中使用的植物基因衍生探针的产生和使用,描述于Bernatzky和Tanksley(1986)Plant Mol.Biol.Reporter 4:37-41中。众多出版物中描述过用上述方法或其变通形式对特定cDNA克隆进行的遗传作图。例如,可以使用F2杂交群体、回交群体、随机交配群体、近等基因系和其它个体组作图。这类方法是本领域技术人员公知的。
核酸探针也可以用来进行物理作图(即在物理图谱上安置序列;参见Hoheisel等In:Non-mammalian Genomic Analysis:A Practical Guide,Academic press 1996,第319-346页,及其中引用的参考文献)。
在另一个实施方案中,核酸探针可用于直接荧光原位杂交(FISH)作图(Trask(1991)Trends Genet.7:149-154)。尽管目前FISH作图的方法倾向使用大的克隆(几个kb到几百个kb;参见Laan等(1995)Genome Res.5:13-20),但是灵敏性的提高可以允许在FISH作图中应用较短的探针。
用于遗传和物理作图的多种基于核酸扩增的方法可以使用所述核酸序列进行。实例包括等位基因特异性扩增(Kazazian(1989)J.Lab.Clin.Med 11:95-96)、PCR扩增片段的多态性(CAPS;Sheffield等(1993)Genomics 16:325-332)、等位基因特异性连接(Landegren等(1988)Science241:1077-1080)、核苷酸延伸反应(Sokolov(1990)Nucleic Acid Res.18:3671)、放射杂交作图(Walter等(1997)Nat.Genet.7:22-28)和Happy作图(Dear和Cook(1989)Nucleic Acid Res.17:6795-6807)。为实施这些方法,使用核酸的序列设计和产生用于扩增反应或引物延伸反应的引物对。这类引物的设计是本领域技术人员公知的。在采用基于PCR的遗传作图的方法中,可能需要鉴定作图杂交的亲本之间在相应于本发明核酸序列的区域中的DNA序列差异。然而,这对作图方法通常不是必要的。
植物
本文所用术语“植物”涵盖整株植物、植物的祖先和后代以及植物部分,包括种子、枝条、茎、叶、根(包括块茎)、花以及组织和器官,其中上述每一种都含有目的基因/核酸。术语“植物”也涵盖植物细胞、悬浮培养物、愈伤组织、胚、分生组织区、配子体、孢子体、花粉和小孢子,同样其中上述每一种都含有目的基因/核酸。
尤其可用于本发明方法的植物包括属于植物界(Viridiplantae)超家族的所有植物,尤其是单子叶植物和双子叶植物,包括饲料或饲料豆科植物、观赏植物、粮食作物、乔木或灌木,选自包括如下的列表:槭树属物种(Acer spp.)、猕猴桃属物种(Actinidia spp.)、秋葵属物种(Abelmoschus spp.)、剑麻(Agave sisalana)、冰草属物种(Agropyronspp.)、匍茎剪股颖(Agrostis stolonifera)、葱芹属物种(Allium spp.)、苋属物种(Amaranthus spp.)、滨草(Ammophila arenaria)、凤梨(Ananascomosus)、番荔枝属物种(Annona spp.)、芹菜(Apium graveolens)、落花生属物种(Arachis spp.)、木波罗属物种(Artocarpus spp.)、石刁柏(Asparagus officinalis)、燕麦属物种(Avena spp.)(如燕麦(Avena sativa)、野燕麦(Avena fatua)、比赞燕麦(Avena byzantina)、Avena fatua var.sativa、杂种燕麦(Avena hybrida))、阳桃(Averrhoa carambola)、簕竹属物种(Bambusa sp.)、冬瓜(Benincasa hispida)、巴西栗(Bertholletiaexcelsea)、甜菜(Beta vulgaris)、芸苔属物种(Brassica spp.)(如欧洲油菜(Brassica napus)、甘蓝型油菜(Brassica rapa ssp.)[芸苔、油菜籽油菜、芜菁])、Cadaba farinosa、大叶茶(Camellia sinensis)、美人蕉(Cannaindica)、大麻(Cannabis sativa)、辣椒属物种(Capsicum spp.)、苔草(Carex elata)、番木瓜(Carica papaya)、大果假虎刺(Carissamacrocarpa)、山核桃属物种(Carya spp.)、红花(Carthamus tinctorius)、栗属物种(Castanea spp.)、Ceiba pentandra、苦苣(Cichorium endivia)、樟属物种(Cinnamomum spp.)、西瓜(Citrullus lanatus)、柑橘属物种(Citrus spp.)、椰子属物种(Cocos spp.)、咖啡属物种(Coffea spp.)、芋(Colocasia esculenta)、可拉属物种(Cola spp.)、黄麻属物种(Corchorussp.)、芫荽(Coriandrum sativum)、榛属物种(Corylus spp.)、山楂属物种(Crataegus spp.)、番红花(Crocus sativus)、南瓜属物种(Cucurbita spp.)、香瓜属物种(Cucumis spp.)、菜蓟属物种(Cynara spp.)、胡萝卜(Daucuscarota)、山马蟥属物种(Desmodium spp.)、龙眼(Dimocarpus longan)、薯蓣属物种(Dioscorea spp.)、柿树属物种(Diospyros spp.)、稗属物种(Echinochloa spp.)、油棕属(Elaeis)(如非洲油棕(Elaeis guineensis)、美洲油棕(Elaeis oleifera))、穇子(Eleusine coracana)、埃塞俄比亚画眉草(Eragrostis tef)、蔗茅属物种(Erianthus sp.)、枇杷(Eriobotryajaponica)、桉属物种(Eucalyptus sp)、红仔果(Eugenia uniflora)、荞麦属物种(Fagopyrum spp.)、山毛榉属物种(Fagus spp.)、苇状羊茅(Festucaarundinacea)、无花果(Ficus carica)、金桔属物种(Fortunella spp.)、草莓属物种(Fragaria spp.)、银杏(Ginkgo biloba)、大豆属物种(Glycinespp.)(如大豆(Glycine max)、黄豆(Soja hispida)或大豆(Soja max))、陆地棉(Gossypium hirsutum)、向日葵属物种(Helianthus spp.)(如向日葵(Helianthus annus))、萱草(Hemerocallis fulva)、木槿属物种(Hibiscusspp.)、大麦属物种(Hordeum spp.)(如大麦(Hordeum vulgare))、甘薯(Ipomoea batatas)、核桃属物种(Juglans spp.)、莴苣(Lactuca sativa)、山黧豆属物种(Lathyrus spp.)、兵豆(Lens culinaris)、亚麻(Linumusitatissimum)、荔枝(Litchi chinensis)、百脉根属物种(Lotus spp.)、棱角丝瓜(Luffa acutangula)、羽扇豆属物种(Lupinus spp.)、地杨梅(Luzulasylvatica)、番茄属物种(Lycopersicon spp.)(如番茄(Lycopersiconesculentum、Lycopersicon lycopersicum、Lycopersicon pyriforme)、硬皮豆属物种(Macrotyloma spp.)、苹果属物种(Malus spp.)、西印度樱桃(Malpighia emarginata)、曼密苹果(Mammea americana)、芒果(Mangifera indica)、木薯属物种(Manihot spp.)、人心果(Manilkarazapota)、紫花苜蓿(Medicago sativa)、草木樨属物种(Melilotus spp.)、薄荷属物种(Mentha spp.)、芒(Miscanthus sinensis)、苦瓜属物种(Momordica spp.)、黑桑(Morus nigra)、芭蕉属物种(Musa spp.)、烟草属物种(Nicotiana spp.)、木犀榄属物种(Olea spp.)、仙人掌属物种(Opuntiaspp.)、Ornithopus spp.、稻属物种(Oryza spp.)(如稻(Oryza sativa),阔叶稻(Oryza latifolia))、黍糜(Panicum miliaceum)、柳枝稷(Panicumvirgatum)、鸡蛋果(Passiflora edulis)、欧防风(Pastinaca sativa)、狼尾草属物种(Pennisetum sp.)、鳄梨属物种(Persea spp.)、香芹(Petroselinumcrispum)、虉草(Phalaris arundinacea)、菜豆属物种(Phaseolus spp.)、梯牧草(Phleum pratense)、刺葵属物种(Phoenix spp.)、南方芦苇(Phragmites australis)、酸浆属物种(Physalis spp.)、松属物种(Pinusspp.)、阿月浑子(Pistacia vera)、豌豆属物种(Pisum spp.)、早熟禾属物种(Poa spp.)、杨属物种(Populus spp.)、牧豆树属物种(Prosopis spp.)、李属物种(Prunus spp.)、番石榴属物种(Psidium spp.)、石榴(Punicagranatum)、西洋梨(Pyrus communis)、栎属物种(Quercus spp.)、萝卜(Raphanus sativus)、波叶大黄(Rheum rhabarbarum)、茶藨子属物种(Ribes spp.)、蓖麻(Ricinus communis)、悬钩子属物种(Rubus spp.)、甘蔗属物种(Saccharum spp.)、柳属物种(Salix sp.)、接骨木属物种(Sambucusspp.)、黑麦(Secale cereale)、胡麻属物种(Sesamum spp.)、白芥属物种(Sinapis sp.)、茄属物种(Solanum spp.)(如马铃薯(Solanum tuberosum)、红茄(Solanum integrifolium)或番柿(Solanum lycopersicum))、两色蜀黍(Sorghum bicolor)、菠菜属物种(Spinacia spp.)、蒲桃属物种(Syzygiumspp.)、万寿菊属物种(Tagetes spp.)、酸豆(Tamarindus indica)、可可树(Theobroma cacao)、车轴草属物种(Trifolium spp.)、鸭茅状磨擦禾(Tripsacum dactyloides)、小黑麦(Triticosecale rimpaui)、小麦属物种(Triticum spp.)(如小麦(Triticum aestivum)、硬粒小麦(Triticumdurum)、圆锥小麦(Triticum turgidum)、Triticum hybernum、马卡小麦(Triticum macha)、面包小麦(Triticum sativum)、一粒小麦(Triticummonococcum)或普通小麦(Triticum vulgare))、小金莲花(Tropaeolumminus)、旱金莲(Tropaeolum majus)、越桔属物种(Vaccinium spp.)、野豌豆属物种(Vicia spp.)、豇豆属物种(Vigna spp.)、香堇菜(Viola odorata)、葡萄属物种(Vitis spp.)、玉蜀黍(Zea mays)、北美洲野生稻(Zizaniapalustris)、枣属物种(Ziziphus spp.)等等。
对照植物
选择适宜的对照植物是实验设置的常规部分,并且可以包括相应的野生型植物或不含目的基因的相应植物。对照植物一般与待评估植物为相同的植物物种,或者甚至为同一品种。对照植物还可以是待评估植物的无效合子。无效合子是因分离而失去转基因的个体。如本文所用的“对照植物”不仅指完整植物,而且还指植物部分,包括种子和种子部分。
发明详述
现已令人惊讶地发现,在植物中调节编码GDH多肽的核酸的表达可以产生相对于对照植物具有增强的产量相关性状的植物。根据第一实施方案,本发明提供了相对于对照植物增强植物的产量相关性状的方法,包括调节编码GDH多肽的核酸在植物中的表达以及任选地选择具有增强的产量相关性状的植物。
本发明还提供了迄今未知的GDH编码核酸和GDH多肽。根据本发明的另一个实施方案,由此提供了分离的核酸分子,其选自:
(i)SEQ ID NO:99所示的核酸;
(ii)SEQ ID NO:99所示的核酸的互补序列;
(iii)编码GDH多肽的核酸,所述多肽按照递增的优选次序与SEQID NO:100所示的氨基酸序列具有至少50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或更高的序列同一性,且按照递增的优选次序与基序1至6之任一具有至少50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或更高的序列同一性。
根据本发明的另一个实施方案,提供了分离的多肽,其选自:
(i)SEQ ID NO:176所示的氨基酸序列;
(ii)按照递增的优选次序与SEQ ID NO:176所示的氨基酸序列具有至少50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或更高的序列同一性,且按照递增的优选次序与基序1至6之任一具有至少50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或更高的序列同一性的氨基酸序列;
(iii)上文(i)或(ii)所给出的任何氨基酸序列的衍生物。
此外,现已令人惊讶地发现,在植物中调节编码FLA样多肽的核酸的表达可以产生相对于对照植物具有增强的产量相关性状的植物。根据第一实施方案,本发明提供了相对于对照植物增强植物的产量相关性状的方法,包括调节编码FLA样多肽的核酸在植物中的表达和任选地选择具有增强的产量相关性状的植物。
根据本发明的另一个实施方案,由此提供了分离的核酸分子,其选自:
(i)表A2中所列核酸之任一或多个所示的核酸;
(ii)(i)的核酸的互补序列;
(iii)编码FLA样多肽的核酸,所述多肽按照递增的优选次序与表A2的任何多肽序列所表示的氨基酸序列具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%的序列同一性,且另外地,或作为替代,包含按照递增的优选次序与SEQ ID NO:487至SEQ ID NO:497中给出的结构域和基序序列之任一或多个具有至少50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%的序列同一性的一个或多个基序,并优选地还赋予相对于对照植物增强的产量相关性状;
(iv)在高严紧杂交条件下与(i)至(iii)的核酸分子杂交并优选赋予相对于对照植物增强的产量相关性状的核酸分子。
根据本发明的另一个实施方案,还提供了分离的多肽,其选自:
(i)选自表A2中所列多肽的任何氨基酸序列;
(ii)按照递增的优选次序与表A2中所示多肽之任一或多个的氨基酸序列具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的序列同一性、且另外地,或作为替代地,包含按照递增的优选次序与SEQ ID NO:487至SEQ ID NO:497中给出的基序之任一或多个具有至少50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或100%的序列同一性的一个或多个基序、并优选地还赋予相对于对照植物增强的产量相关性状的、氨基酸序列;
(iii)上文(i)或(ii)所给出的任何氨基酸序列的衍生物。
此外,现已令人惊讶地发现,在植物中调节编码SAUR多肽的核酸的表达可以产生相对于对照植物具有增强的产量相关性状的植物。根据第一实施方案,本发明提供了相对于对照植物增强植物的产量相关性状的方法,包括调节编码SAUR多肽的核酸在植物中的表达和任选地选择具有增强的产量相关性状的植物。
本发明还提供了可以用于相对于对照植物赋予植物增强的产量相关性状的、迄今未知的SAUR编码核酸和SAUR多肽。
根据本发明的另一个实施方案,由此提供了分离的核酸分子,其选自:
(i)由表A3的任一核酸所表示的核酸;
(ii)(i)所示的核酸的互补序列;
(iii)编码SAUR多肽的核酸,所述多肽按照递增的优选次序与表A3的任何多肽的氨基酸序列具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的序列同一性,且另外地、或作为替代地、包含按照递增的优选次序与SEQ ID NO:1155至SEQ ID NO:1160中给出的基序之任一或多个具有至少50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或更高的序列同一性的一个或多个基序,并优选地还赋予相对于对照植物增强的产量相关性状;
(iv)在高严紧杂交条件下与(i)至(iii)的核酸分子杂交并优选赋予相对于对照植物增强的产量相关性状的核酸分子。
根据本发明的另一个实施方案,还提供了分离的多肽,其选自:
(i)表A3的任一多肽所表示的氨基酸序列;
(ii)按照递增的优选次序与表A3的任一多肽的氨基酸序列具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的序列同一性、且另外地,或作为替代地,包含按照递增的优选次序与SEQID NO:1155至SEQ ID NO:1160中给出的基序之任一或多个具有至少50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或更高的序列同一性的一个或多个基序、并优选地还赋予相对于对照植物增强的产量相关性状的、氨基酸序列;
(iii)上文(i)或(ii)所给出的任何氨基酸序列的衍生物。
此外,现已令人惊讶地发现,在植物中调节编码SAUR多肽的核酸的表达可以产生相对于对照植物具有增强的产量相关性状的植物。根据第一实施方案,本发明提供了相对于对照植物增强植物的产量相关性状的方法,包括调节编码至少一个SAUR多肽的第一核酸和编码一个或多个SYNP多肽的第二核酸、或编码至少一个SAUR和一个或多个SYNP多肽之间的蛋白质融合物的核酸在植物中的表达,其中第一和第二核酸包含在单个核酸分子中或多个(至少两个)核酸分子中,和任选地选择具有增强的产量相关性状的植物。
此外,现已令人惊讶地发现,在植物中调节编码DHAR多肽的核酸的表达可以产生相对于对照植物具有增强的产量相关性状的植物。根据第一实施方案,本发明提供了相对于对照植物增强植物的产量相关性状的方法,包括调节编码DHAR多肽的核酸在植物中的表达和任选地选择具有增强的产量相关性状的植物。
本发明还提供了迄今未知的DHAR编码核酸和DHAR多肽。
根据本发明的另一个实施方案,由此提供了分离的核酸分子,其选自:
(i)SEQ ID NO:1997、SEQ ID NO:2121和SEQ ID NO:2193所示的核酸;
(ii)SEQ ID NO:1997、SEQ ID NO:2121和SEQ ID NO:2193所示核酸的互补序列;
(iii)编码SEQ ID NO:1998、SEQ ID NO:2122和SEQ ID NO:2194之任一所示的DHAR多肽的核酸,优选地由于遗传密码子简并性的结果,所述分离的核酸可以源自所述SEQ IDs之任一所示的多肽序列,和优选还赋予相对于对照植物增强的产量相关性状;
(iv)按照递增的优选次序与表A5的任何核酸序列具有至少50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或更高的序列同一性、且优选地还赋予相对于对照植物增强的产量相关性状的核酸分子;
(v)在严紧杂交条件下与(i)至(iv)的核酸分子杂交并优选赋予相对于对照植物增强的产量相关性状的核酸分子;
(vi)编码DHAR多肽的核酸,所述多肽按照递增的优选次序与SEQID NO:1998、SEQ ID NO:2122和SEQ ID NO:2194之任一或表A5中任何其它氨基酸序列具有至少50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或更高的序列同一性并优选赋予相对于对照植物增强的产量相关性状。
根据本发明的另一个实施方案,也提供了分离的多肽,其选自:
(i)SEQ ID NO:1998、SEQ ID NO:2122和SEQ ID NO:2194所示的氨基酸序列;
(ii)按照递增的优选次序与SEQ ID NO:1998、SEQ ID NO:2122和SEQ ID NO:2194所示的氨基酸序列具有至少50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或更高的序列同一性,且按照递增的优选次序与SEQ ID NO:1998、SEQID NO:2122和SEQ ID NO:2194的具有至少50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或更高的序列同一性的氨基酸序列;
(iii)上文(i)或(ii)所给出的任何氨基酸序列的衍生物。
用于调节(优选地,增加)编码GDH多肽的核酸的表达的优选方法是向植物中引入和表达编码GDH多肽的核酸。另一用于调节(优选地,增加)编码FLA样多肽的核酸的表达的优选方法是向植物中引入和表达编码FLA样多肽的核酸。另一用于调节(优选地,增加)编码SAUR多肽的核酸的表达的优选方法是向植物中引入和表达编码SAUR多肽的核酸。另一用于调节(优选地,增加)编码SAUR和SYNP多肽的核酸的表达的优选方法是向植物中引入和表达编码至少一个SAUR多肽的第一核酸和编码一个或多个SYNP多肽的第二核酸、或编码至少一个SAUR和一个或多个SYNP多肽之间的蛋白质融合物的核酸,其中第一和第二核酸包含在单个核酸分子或多个(至少两个)核酸分子中。另一用于调节(优选地,增加)编码DHAR多肽的核酸的表达的优选方法是向植物中引入和表达编码DHAR多肽的核酸。
在一个实施方案中,“用于本发明方法的蛋白质”旨在指如本文中定义的GDH多肽。下文中对“用于本发明方法的核酸”的任何提及,均旨在指能够编码这样的GDH多肽的核酸。待引入植物中(并因此可以用于实施本发明方法)的核酸是编码现将进行描述的此类蛋白质的任何核酸,在下文中也称为“GDH核酸”或“GDH基因”。
如本文中定义的“GDH多肽”是指具有谷氨酸脱氢酶活性、优选地具有NAD依赖性谷氨酸脱氢酶活性(EC1.4.1.2)的任何多肽。典型地,用于本发明方法的GDH多肽包含Glu/Phe/Leu/Val脱氢酶C端结构域(Pfam条目PF00208)和Glu/Phe/Leu/Val脱氢酶二聚化区域(Pfam条目PF02812)。
优选地,GDH多肽包含一个或多个下列基序:
基序1,SEQ ID NO:3:
L(L/M)IP(Y/F/L)RE(I/V)KVEC(T/S)(I/L)P(K/R)DDG
基序2,SEQ ID NO:4:
EVNALAQLMTWK(T/S)AV
基序3,SEQ ID NO:5:
PAPDMGT(N/G)(A/S/P)QTMAW(I/M)(L/F)DEYSKFHG(H/Y)(T/S)PA(V/I)VTGKP
基序4,SEQ ID NO:6:
CD(V/I)L(I/V/L)P(A/C)ALGGV
基序5,SEQ ID NO:7:
LPD(I/V)(Y/F/L)AN(S/C/A)GGV(T/I/V)V(S/G)YFEWVQN(I/T/K)QGF(M/P/R)W(D/E/N)E
基序6,SEQ ID NO:8,在C-末端:
RGW
基序7,SEQ ID NO:9:
F(R/K)V(P/S/V)W(V/I/L/M/E)DD(R/K/S/N)G(E/V/Q/R/K)(T/A/K/L/I/C)(H/C/R/Q)(V/I/F)N(R/K)G(F/W/Y)RV(H/Q)(F/W)
基序8,SEQ ID NO:10:
GP(C/Y/F)(R/K)GG(I/L/M)R(F/L)(H/R)
基序9,SEQ ID NO:11:
GG(S/A)DF(D/N/E)PKG(K/R)(T/S)(D/E)
基序10,SEQ ID NO:12:
VGX(R/K)E(M/I/L)GY(L/M)(L/F/Y)GQ(Y/W)(R/K)R(L/I)
其中第3位的X可以为任何氨基酸,优选X为T,P,F,A,G之一
基序11,SEQ ID NO:13:
P(A/G/S)(I/M/K)A(A/T/V/S)(G/A/N)AGGV
基序12,SEQ ID NO:14:
YR(V/A)QH(N/D/S)(N/H)(A/V/S/H)(L/R)(G/L/M)P(F/Y/V)KGG(I/L)
基序13,SEQ ID NO:15:
LA(S/A)L(N/M)T(W/F)K
基序14,SEQ ID NO:16:
(F/Y)GG(A/S)KGG(V/I)
基序15,SEQ ID NO:17:
VTGKP(T/V/L)(W/Y/E)(L/E)(H/G)G(I/S)(V/L/D/H)GR(D/E/T/Q)(K/S/A/E)A(G/T)G(R/L)G
基序16,SEQ ID NO:18:
P(A/C)DV(F/L)IP(C/A)A(V/I/L)
基序17,SEQ ID NO:19:
EAAN(G/S)(A/P)(L/T/V)TP
基序18,SEQ ID NO:20:
LPD(L/I)(I/Y/L)(A/T/C/L)N(G/A)G(A/G)V(V/I/T)VS(F/Y)FEW(V/L)(Q/K)N
更优选地,GDH多肽包含按照递增的优选次序至少2个、至少3个、至少4个、至少5个上列基序。最优选地,GDH多肽还具有下列基序之一:
基序19,SEQ ID NO:21:
MNAL(A/V)AT(N/S)R(N/S)F
或
基序20,SEQ ID NO:22:
RIFCTVC(K/R)EYGRKHRRNPYGNEGSRNMQ
作为替代地或此外,GDH蛋白的同源物按照递增的优选次序与SEQID NO:2所示的氨基酸具有至少25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的全序列同一性,条件是同源蛋白包含上文所列保守基序。可以使用全局比对算法,例如程序GAP(GCG Wisconsin Package,Accelrys)中的Needleman Wunsch算法,优选利用缺省参数和优选利用成熟蛋白质的序列(即,不考虑分泌信号或转运肽),确定全序列同一性。与全序列同一性相比,当只考虑保守结构域或基序时,序列同一性通常更高。优选地,GDH多肽中的基序按照递增的优选次序与SEQ ID NO:3至SEQ IDNO:22所示的基序(基序1至20)具有至少70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的序列同一性。
优选地,所述多肽序列,当用于构建系统发生树,例如图3中描述的系统发生树时,与GDH多肽,优选地与类型I的GDH多肽或与类型I相关的苔藓GDH多肽,更优选地与包含SEQ ID NO:2所示氨基酸序列的β亚基GDH多肽组,而非任何其它组聚类。几个苔藓GDH序列与类型I的GDH序列聚类(例如展叶剑叶藓(Physcomitrella patens)126976,SEQ ID NO:77),因此它们同样可以用于本发明的方法。
在另一个实施方案中,“用于本发明方法的蛋白质”旨在指如本文中定义的FLA样多肽。下文中对“用于本发明方法的核酸”的任何提及,均旨在指能够编码这样的FLA样多肽的核酸。待引入植物中(并因此可以用于实施本发明方法)的核酸是编码现将进行描述的此类蛋白质的任何核酸,在下文中也称为“FLA样多肽核酸”或“FLA样多肽基因”。
如本文中定义的“FLA样多肽”是指任何成束蛋白样阿拉伯半乳聚糖多肽,其典型地具有在细胞中被糖基化的能力。
用于本发明方法的FLA样多肽包含,按照递增的优选次序,1个、2个、3个、4个或更多个的:
(i)AGP-样(阿拉伯半乳聚糖样)糖基化区域;和
(ii)成束蛋白样(FLA样)结构域。
如本文中所提及,成束蛋白样结构域指,在来源于不同生物体的FLA样多肽中存在和保守的蛋白质结构域,其由在例如SMART(Schultz等(1998)Proc.Natl.Acad.Sci.USA 95,5857-5864;Letunic等(2008)Nucleic Acids Res,doi:10.1093/nar/gkn808)等用于保守蛋白质结构域的专门数据库中具有登录号Smart00554、或在pfam中具有结构域登录索引名“成束蛋白”和登录号PF02469(Finn等,Nucleic Acids Research(2008)Database Issue 36:D281-D288;Pfam:the protein families database R.D.Finn(eds M.J.Dunn,L.B.Jorde,P.F.R.Little,S.Subramaniam)Genetics,Genomics,Proteomics and Bioinformatics,Section 6:Protein Families(2005)ISBN 978-0-470-84974-3)的序列之任一代表。其它结构域数据库,例如整合在Intepro(Hunter等,2009Nucleic Acids Res.37(DatabaseIssue):D224-228;Quevillon 2005Nucleic Acids Res.33(Web Serverissue):W116-W120)中的那些,包含成束蛋白样结构域的氨基酸序列的另外例子。查询包含成束蛋白样结构域的序列的蛋白质结构域数据库中的序列的方法、和在多肽中鉴定FLA样结构域的方法在本领域公知。在实施例部分提供了关于该方法更详细的说明。
用于本发明方法的优选的FLA样多肽包含至少1个、2个、3个或4个成束蛋白样结构域,所述成束蛋白样结构域按照递增的优选次序与下列氨基酸具有至少25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的序列同一性:
(i)TITVCAVDNAGMSDLLSKQLSIYTIKNVLSFRVLLDYFDAKKLHQITNGTALAATMFQATGSATGSSGFVNITDLRGGKVGLSPADYNGPPPAKFVKSIAEIPYNISVIQISTIL(SEQ ID NO:487),
相应于SEQ ID NO:172中N端FLA样结构域;或
(ii)VDGGVTIFCPRDDAMKKFLPKFKNLTAEGKQSLLEYHGIPIYQSISNLKSNNGDMNTLATDGAKKYAVVIQNDGEDVTIKTKIVTAKITATVVDKLPLAIYSLDKVL(SEQ ID NO:488),
相应于SEQ ID NO:2中C端FLA样结构域;或
(iii)表A2的任何多肽中存在的任何FLA样结构域的氨基酸序列。
已在成束蛋白样结构域中鉴定出了两个高度保守的肽,即所谓的H1和H2区域(Johnson等,Plant Physiol.(2003)133(4)1911-1925)。
用于本发明方法的FLA样多肽中存在的优选FLA样结构域包括下列之任一或多个:
(i)H1区,所述H1区,按照递增的优选次序,与分别代表SEQ IDNO:172的N末端和C末端FLA样结构域中的H1区的氨基酸序列ITVCAVDNAGM(SEQ ID NO:491)或氨基酸序列GVTIFCPRDDAM(SEQ ID NO:492),或与[Ser/Thr]-[Val/Leu/Ile]-Phe-Ala-Pro-X-[Asp/Glu/Asn]-X-Ala(SEQ ID NO:489)(其中X代表任何氨基酸)所示的共有H1序列,具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%的序列同一性;
(ii)H2区,所述H2区,按照递增的优选次序,与分别代表SEQ IDNO:172的N末端和C末端FLA样结构域中的H2区的氨基酸序列ISVIQISTIL(SEQ ID NO:493)或氨基酸序列LAIYSLDK(SEQ ID NO:494),或与[Val/Leu/Ile]-[Phe/Tyr/His/Gln]-X-[Val/Leu/Ile]-X-X-[Val/Leu/Ile]-[Val/Leu/Ile]-[Val/Leu/Ile]-Pro Ala(SEQ ID NO:320)(其中X代表任何氨基酸)所示的共有H2序列,具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%的序列同一性。
最近在拟南芥中鉴定到在FLA4的H2区中具有氨基酸取代的sos5(盐过度敏感)突变体(Shi等,2003,Plant Cell.2003Jan;15(1):19-32),表明该结构域对FLA的功能起着重要作用。位于第二个成束蛋白样结构域和第二个AGP样糖基化区域之间的连接区域在FLA样多肽中非常保守。该区域包含在SOS5的正确功能中高度保守的Ser-348。sos5突变体表型清楚地表明了Ser-348的关键作用。
典型地存在于糖基化的FLA样多肽中的糖残基为阿拉伯寡糖和大的阿拉伯半乳聚糖多糖链。在FLA样多肽的蛋白质骨架中,被丙氨酸或丝氨酸残基分隔开的成簇的、非连续的脯氨酸残基的存在,通常导致在细胞环境中以大的阿拉伯半乳聚糖多糖链的糖基化。FLA1样多肽在成束蛋白结构域中包含N-糖基化位点,在该多肽的其它区域中存在包括O-糖基化位点在内的其它位点。通常,可以基于存在至少两个非连续的Pro残基(例如,序列(A/S)P(A/S)P)来鉴定糖基化位点。在体内,这些区域被预测为被羟脯氨酸(HYP)糖基化(Hyp-O-糖基化),并越来越多地被称为“glycomodules”(糖模块)。
根据另一个实施方案,用于本发明方法的FLA样多肽典型地具有一个或多个AGP样糖基化区域,所述AGP样糖基化区域优选包含任一或多个下列基序的复数个,两个、三个或更多个:
(i)SPAD/E(SEQ ID NO:495)
(ii)SPPAPA(SEQ ID NO:496)
(iii)PAPAP(SEQ ID NO:497)
根据另一个实施方案,除了上述结构域、区域和基序之任一或多个以外,用于本发明方法的FLA样多肽还包含Tyr-His二肽,所述Tyr-His二肽的侧翼通常为[Leu/Val/Ile]-[Leu/Val/Ile]残基。已表明这些残基在动物细胞中在整联蛋白结合中起作用。
根据另一个实施方案,用于本发明方法的优选的FLA样多肽包含两个FLA样结构域和下列基序之任一或多个:
(i)SPAD/E(SEQ ID NO:495)
(ii)SPPAPA(SEQ ID NO:496)
(iii)PAPAP(SEQ ID NO:497)
此外或作为替代地,用于本发明方法的FLA样蛋白的同源物按照递增的优选次序与SEQ ID NO:172所示的氨基酸具有至少25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的全序列同一性,条件是同源蛋白质包含上文所列保守结构域、区域或基序之任一或多个。可以使用全局比对算法,例如程序GAP(GCG Wisconsin Package,Accelrys)中的Needleman Wunsch算法,优选利用缺省参数和优选利用成熟蛋白质的序列(即,不考虑分泌信号或转运肽),确定全序列同一性。与全序列同一性相比,当只考虑保守结构域或基序时,序列同一性通常更高。优选地,FLA样多肽中的基序按照递增的优选次序与SEQ ID NO:487至SEQ ID NO:497所示的结构域和基序之任一或多个具有至少70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的序列同一性。
在另一个实施方案中,“用于本发明方法的蛋白质”旨在指如本文中定义的SAUR多肽。下文中对“用于本发明方法的核酸”的任何提及,均旨在指能够编码这样的SAUR多肽的核酸。待引入植物中(并因此可以用于实施本发明方法)的核酸是编码现将进行描述的此类蛋白质的任何核酸,在下文中也称为“SAUR核酸”或“SAUR基因”。
如本文中定义的“SAUR多肽”是指任何包含生长素可诱导结构域的多肽。生长素可诱导结构域在本领域公知为存在于植物来源的生长素可诱导蛋白质中的保守蛋白质结构域。它们在例如Pfam结构域等保守结构域数据库中被称为“生长素可诱导的”或“生长素响应的”,其中该结构域描述于登录号PF02519(Pfam 23.0(10340家族;R.D.Finn e等,Nucleic AcidsResearch(2008)Database Issue 36:D281-D288)之下。Pfam中用于PF02519的数据管理(curation)和HMM(隐马尔可夫模型)构建模型,描述如下:
HMM信息
PF02519
包含生长素可诱导结构域的蛋白质涉及植物和植物细胞对激素生长素的应答。
用于本发明方法的优选的SAUR多肽包含保守结构域,所述保守结构域,按照递增的优选次序,与SEQ ID NO:502的氨基酸1至95(SEQID NO:2中的生长素可诱导结构域),或与表3A或表3A(i)的任何一个或多个多肽中存在的任何生长素可诱导结构域,具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%的序列同一性。
在另一个优选的实施方案中,用于本发明方法的SAUR多肽包含基序,所述基序按照递增的优选次序具有下列保守基序之任一或多个基序中的至少1、2、3、4、5、6、7、8、9、10个直至基序的最大残基数的氨基酸残基:
(i)基序23:
LAVYVGEMMQKRRFVVPVTYLSHPCFQKLLRKAEEEFGFDHPMGGL TIPC(SEQ ID NO:1155)(对应于SEQ ID NO:502的基序23);
(ii)基序24:
KHxxGVYTAEKxxYxxxIxxxxxxxxxAxxxxSxxxYxxxxPMPIx LxxC(SEQID NO:1156)(对应于SAUR多肽中发现的与基序23等价的基序的保守序列);
(iii)基序25:LQSSKQLLKSLSHSSNNVAIP(SEQ ID NO:1157)(对应于SEQ ID NO:502的基序2);
(iv)基序26:VxxxKIAxKSQ(SEQ ID NO:1158)(对应于SAUR多肽中发现的与基序25等价的基序的保守序列);
(v)基序27:EQIFIDLASRL(SEQ ID NO:1159)(对应于SEQ ID NO:502的基序27);
(vi)基序28:VExxxVxxxxL(SEQ ID NO:1160)(对应于SAUR多肽中发现的与基序27等效的基序的保守序列);
其中X代表任何氨基酸。
基序23至28与SAUR多肽的生长素响应功能相关。
使用MEME算法,利用表A3或A3(i)的多肽序列的子集,鉴定出了基序23至28。鉴定保守基序的方法在本领域公知,例如MEME算法(Bailey和Elkan,第二届分子生物学智能系统国际会议记录(Proceedingsof the Second International Conference on Intelligent Systems forMolecular Biology),第28-36页,AAAI Press,Menlo Park,California,1994.)。
更优选地,SAUR多肽包含,按照递增的优选次序,至少2个、至少3个、至少4个、至少5个或所有6个上述基序。
用于本发明方法的优选的SAUR多肽由植物界的生物体的生长素上调小RNA编码。此前已描述过生长素上调小RNA及其鉴定方法,它们在本领域公知(Jain 2006;Hagen和Guilfoyle 2002)。
此外或作为替代地,用于本发明方法的SAUR多肽指SAUR蛋白的同源物。SAUR蛋白的优选同源物按照递增的优选次序与表A3或A3(i)的任何一个多肽所示的氨基酸,更优选地与SEQ ID NO:502所示的氨基酸,具有至少25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的全序列同一性。可以使用全局比对算法,例如程序GAP(GCG Wisconsin Package,Accelrys)中的Needleman Wunsch算法,优选利用缺省参数和优选利用成熟蛋白质的序列(即,不考虑分泌信号或转运肽),确定全序列同一性。与全序列同一性相比,当只考虑保守结构域或基序时,序列同一性通常更高。优选地,SAUR多肽中的基序按照递增的优选次序与SEQ ID NO:1155至SEQ ID NO:1160所示的基序(基序23至28)之任一或多个具有至少70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的序列同一性。
在本发明的另一个实施方案中,提供了可以用于本发明方法的SAUR多肽,所述SAUR多肽按照递增的优选次序与SEQ ID NO:X所示的SAUR多肽,或与表A3(i)所列的任何SAUR多肽序列,具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%的序列同一性。SEQ ID NO:X所示的SAUR多肽和表A3(i)所列的SAUR多肽序列是SAUR33样多肽的例子。
更优选地,SAUR33样多肽包含下列基序I和II以及可选地还包含基序III和IV之一或两者,或包含按照递增的优选次序与基序I至IV具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%的序列同一性的任何序列。
基序47(SEQ ID NO:2284)
CEVVLFEHLLWMLENADPQ
基序48(SEQ ID NO:2285)
PESLDELVEYYAC
基序49(SEQ ID NO:2286)
GLSKLRCMIRRWHSSSRI
基序50(SEQ ID NO:2287)
SFHGADEVPKGLHPVYVGKSRRRYLIAEELVGHPLFQNLVDRT
本发明还提供了迄今未知的、可以用于赋予植物相对于对照植物增强的产量相关性状的SAUR编码核酸和SAUR多肽。
根据本发明的另一个实施方案,由此提供了分离的核酸分子,其选自:
(i)表A3或A3(i)的任一核酸所代表的核酸;
(ii)(i)所示的核酸的互补序列;
(iii)编码SAUR多肽的核酸,所述多肽按照递增的优选次序与表A3或A3(i)的任何多肽的氨基酸序列具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的序列同一性,且另外地、或作为替代地、包含按照递增的优选次序与SEQ ID NO:1155至SEQ ID NO:1160中所给出的基序之任一或多个具有至少50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或更高的序列同一性的一个或多个基序,并优选地还赋予相对于对照植物增强的产量相关性状;
(iv)在高严紧杂交条件下与(i)至(iii)的核酸分子杂交并优选赋予相对于对照植物增强的产量相关性状的核酸分子。
根据本发明的另一个实施方案,还提供了分离的多肽,其选自:
(i)表A3或A3(i)的任一多肽所示的氨基酸序列;
(ii)按照递增的优选次序与表A3或A3(i)的任一多肽的氨基酸序列具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的序列同一性、且另外地,或作为替代地,包含按照递增的优选次序与SEQ ID NO:1155至SEQ ID NO:1160中所给出的基序之任一或多个具有至少50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或更高的序列同一性的一个或多个基序、并优选地还赋予相对于对照植物增强的产量相关性状的、氨基酸序列;
(iii)上文(i)或(ii)所给出的任何氨基酸序列的衍生物。
在另一个实施方案中,“用于本发明方法的蛋白质”旨在指选自如本文中定义的SAUR多肽、如本文中定义的SYNP多肽、和/或至少一个SAUR和一个或多个SYNP多肽之间的蛋白质融合物的任何一个或多个多肽。下文中对“用于本发明方法的核酸”的任何提及均旨在指,选自能够编码这样的SAUR、SYNP或其融合物的核酸的任何一个或多个核酸。待引入植物中(并因此可以用于实施本发明方法)的核酸是编码现将进行描述的此类蛋白质的任何核酸,在下文中也称为“SAUR核酸”或“SAUR基因”、或“SYNP核酸”或“SYNP基因”、或“SAUR-SYNP融合核酸”或“SAUR-SYNP融合基因”。
关于SAUR多肽
如本文中定义的“SAUR多肽”是指任何包含生长素可诱导结构域的多肽。生长素可诱导结构域在本领域公知为存在于植物来源的生长素可诱导蛋白质中的保守蛋白质结构域。它们在例如Pfam结构域等保守结构域数据库中被称为“生长素可诱导的”或“生长素响应的”,其中该结构域描述于登录号PF02519(Pfam 23.0(10340家族;R.D.Finn e等,Nucleic AcidsResearch(2008)Database Issue 36:D281-D288)之下。Pfam中用于PF02519的数据管理(curation)和HMM(隐马尔可夫模型)构建模型,描述如下:
HMM信息
PF02519
包含生长素可诱导结构域的蛋白质涉及植物和植物细胞对激素生长素的应答。
用于本发明方法的优选的SAUR多肽包含保守结构域,所述保守结构域,按照递增的优选次序,与SEQ ID NO:1164的氨基酸1至95(SEQID NO:1164中的生长素可诱导结构域),或与表3A和表3A(i)的任何一个或多个多肽中存在的任何生长素可诱导结构域,具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%的序列同一性。
在另一个优选的实施方案中,用于本发明方法的SAUR多肽包含基序,所述基序按照递增的优选次序具有下列保守基序之任一或多个中的至少1、2、3、4、5、6、7、8、9、10个直至该基序的最大残基数的氨基酸残基:
(i)基序29:
LAVYVGEMMQKRRFVVPVTYLSHPCFQKLLRKAEEEFGFDHPMGGLTI PC(SEQ ID NO:1817)(对应于SEQ ID NO:1164的基序29);
(ii)基序30:
KHxxGVYTAEKxxYxxxIxxxxxxxxxAxxxxSxxxYxxxxPMPIx LxxC(SEQID NO:1818)(对应于在SAUR多肽中发现的与基序29等价的基序的保守序列);
(iii)基序31:LQSSKQLLKSLSHSSNNVAIP(SEQ ID NO:1819)(对应于SEQ ID NO:1164的基序30);
(iv)基序32:VxxxKIAxKSQ(SEQ ID NO:1820)(对应于在SAUR多肽中发现的与基序31等价的基序的保守序列);
(v)基序33:EQIFIDLASRL(SEQ ID NO:1821)(对应于SEQ ID NO:1164的基序33);
(vi)基序34:VExxxVxxxxL(SEQ ID NO:1822)(对应于在SAUR多肽中发现的与基序34等价的基序的保守序列);
其中X代表任何氨基酸。
基序29至34与SAUR多肽的生长素响应功能相关。
使用MEME算法,利用表A3的多肽序列的子集,鉴定出了基序29至34。鉴定保守基序的方法在本领域公知,例如MEME算法(Bailey和Elkan,第二届分子生物学智能系统国际会议记录(Proceedings of theSecond International Conference on Intelligent Systems for MolecularBiology),第28-36页,AAAI Press,Menlo Park,California,1994.)。
更优选地,SAUR多肽包含,按照递增的优选次序,至少2个、至少3个、至少4个、至少5个或所有6个上述基序。
用于本发明方法的更优选的SAUR多肽由植物界的生物体的生长素上调小RNA编码。此前已描述过生长素上调小RNA及其鉴定方法,它们在本领域公知(Jain 2006;Hagen和Guilfoyle 2002)。
此外或作为替代地,用于本发明方法的SAUR多肽指SAUR蛋白的同源物。SAUR蛋白的优选同源物,按照递增的优选次序,与表A3和A3(i)的任何一个多肽所示的氨基酸,更优选地与SEQ ID NO:1164所示的氨基酸,具有至少25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的全序列同一性。可以使用全局比对算法,例如程序GAP(GCG Wisconsin Package,Accelrys)中的Needleman Wunsch算法,优选利用缺省参数和优选利用成熟蛋白质的序列(即,不考虑分泌信号或转运肽),确定全序列同一性。与全序列同一性相比,当只考虑保守结构域或基序时,序列同一性通常更高。优选地,SAUR多肽中的基序按照递增的优选次序与SEQ IDNO:1817至SEQ ID NO:1822所示的基序(基序29至34)之任一或多个具有至少70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的序列同一性。
在本发明的另一个实施方案中,提供了用于本发明方法的SAUR多肽,所述SAUR多肽按照递增的优选次序与SEQ ID NO:X所示的SAUR多肽,或与表A3(i)所列的任何SAUR多肽序列,具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%的序列同一性。SEQ ID NO:X所示的SAUR多肽和表A3(i)所列的SAUR多肽序列是SAUR33样多肽的例子。
更优选地,SAUR33样多肽包含下列基序I和II以及可选地也包含基序III和IV之一或两者,或包含按照递增的优选次序与基序47至50具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%的序列同一性的任何序列。
基序47(SEQ ID NO:2284)
CEVVLFEHLLWMLENADPQ
基序48(SEQ ID NO:2285)
PESLDELVEYYAC
基序49(SEQ ID NO:2286)
GLSKLRCMIRRWHSSSRI
基序50(SEQ ID NO:2287)
SFHGADEVPKGLHPVYVGKSRRRYLIAEELVGHPLFQNLVDRT
关于SYNP多肽
如本文中定义的“SYNP(SAUR产量网络蛋白)多肽”是指在与SAUR蛋白调节的植物产量性状相同的生物学网络中起作用的任何多肽。
如本文中定义的“SYNP多肽”优选指具有一个或多个pfam结构域的蛋白质,所述pfam结构域按照递增的优选次序与选自表E和表F的任何多肽中存在的pfam结构域的pfam结构域的氨基酸序列具有至少25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%的序列同一性。
用于鉴定多肽中的pfam结构域的方法在本领域公知,本文提供了该鉴定方法的例子。
更优选地,如本文中定义的“SYNP多肽”是指,按照递增的优选次序与表E和表F的任一多肽所示的氨基酸序列具有至少25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%的全序列同一性的蛋白质。
在另一个实施方案中,“用于本发明方法的蛋白质”旨在指如本文中定义的DHAR多肽。下文中对“用于本发明方法的核酸”的任何提及,均旨在指能够编码这样的DHAR多肽的核酸。待引入植物中(并因此可以用于实施本发明方法)的核酸是编码现将进行描述的此类蛋白质的任何核酸,在下文中也称为“DHAR核酸”或“DHAR基因”。
如本文中定义的“DHAR多肽”是指包含至少具有登录号PTHR11260:SF15(HMMPanther数据库)的脱氢抗坏血酸还原酶结构域的任何多肽。包含DHAR多肽的蛋白质涉及在抗坏血酸-谷胱甘肽循环中从氧化的抗坏血酸再生抗坏血酸。DHAR多肽通常属于酶分类号EC1.8.5.1。
优选地,DHAR多肽的DHAR结构域按照递增的优选次序与SEQID NO:1958中位于第19至210位氨基酸之间的序列具有至少49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、或99%或更高的序列同一性。
此外或作为替代地,用于本发明方法的DHAR多肽包含按照递增的优选次序与基序35至37之任一或多个具有至少49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、或99%或更高的序列同一性的一个或多个序列基序。
在本文中方括号内所示的氨基酸代表特定位置上可选的氨基酸。
基序35:P[DN]KLGDCPF[SC]QRVLLTLEEK[KH][VL]PY[KD][ML][KH]L[IV](SEQ ID NO:2239)
基序36:D[DEG]KW[VI][PAS]DSDVI[TV][QG][IL][LI]EEK[YF]PEP[SP]L[VA]TPPE(SEQ IDNO:2240)
基序37:P[FY][IV][NA]GE[KN][IV][ST]A[VA]DLSL[AG]PKLYHLE[VI]ALGH[FY]K[KN]W[ST][VI]P(SEQ ID NO:2241)
基序35至37典型地存在于任何来源的任何DHAR多肽中。
在本发明的另一个优选的实施方案中,除上述基序35、基序36和基序37以外,本发明的DHAR多肽还可以包含基序38、39和40,或可以包含按照递增的优选次序与基序38至40之任一或多个具有至少49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、或99%或更高的序列同一性的基序。
基序38:E[VI]CVKA[AS]V[GT]AP[DN][KV]LGDCPF[SC]QRVLLTLEE(SEQ ID NO:2242)
基序39:PPE[FK]ASVGSKIF[PS][TS]F[VI][GT]FLKSKD[PA][NS]DG[TS]EQ(SEQ ID NO:2243)
基序40:[IV][ST]A[VA]DLSL[AG]PKLYHL[EQ][VI]ALGH[FY]K[KN]W[ST][VI]P[ED]SL[TP]HV[HK][NS]Y[MT]K[ALS][LI]FS[RL][ED]SF[EV]KT(SEQ ID NO:2244)
基序38、39和40对应于代表番茄(S.lycopersicum)和大麦(H.vulgare)所属的叶绿体(CHL)和胞质(CYT)类来源的DHAR多肽中保守蛋白质区域的共有序列。
最优选地,除以上所定义的基序35、基序36、基序37、基序38、基序39和基序40之任一或多个,优选所有基序以外,本发明的DHAR多肽还包含基序41、42和43。基序41、42和43也可以按照递增的优选次序包含与以下基序41至43之任一或多个具有至少49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、或99%或更高的序列同一性的基序:
基序41:E[IV]CVKAA[VT]GAPD[VIT]LGDCPF[SC]QRVLLTLEE(SEQ ID NO:2245)
基序42:PPE[FY]ASVGSKIF[PG][ST]FV[TK]FLKSKD[AP][NS]DG[TS]E[QK](SEQ ID NO:2246)
基序43:[IV][TS]AVDLSLAPKLYHL[EQ]VAL[GE]HFK[KG]W[TSK][VI]PE[SN]LTHVH[NA]Y[TM]K[LAS]LFSRESFEKT(SEQ ID NO:2247)
基序41、42和43对应于代表番茄(S.lycopersicum)和稻(O.sativa)所属的胞质(CYT)类DHAR多肽中保守蛋白质区域的共有序列。
在本发明的另一个最优选实施方案中,除以上所定义的基序1、基序2、基序3、基序4、基序5和基序6以外,本发明的DHAR多肽还包含基序10、11和12。基序10、11和12也可以包含按照递增的优选次序与以下基序10至12之任一或多个具有至少49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、或99%或更高的序列同一性的基序:
基序44:PLE[VI]C[VA]KAS[ILV]T[TV]P[ND][KR]LGDCPF[TC]QRVLLTLEEKHLPY[DE][ML]KLVDL[SG]NKP[ED]WF(SEQ ID NO:2248)
基序45:W[VI][PA]DSDVITQ[AST]LEEK[YF]P[ED]P[PS]L[AV]TPPEKASVGSKIFSTF[IV]GFLKSKDP[SN]DG(SEQ ID NO:2249)
基序46:QALL[ND]EL[ST][SA]FNDY[LI]KENGPFING[KE][KDE][IV]SAADLSL[GA]PKLYH[LM]EIALGH[YF]K[NK]W(SEQ ID NO:2250)
基序44、45和46对应于代表番茄和稻所属的叶绿体(CHL)类DHAR多肽中保守蛋白质区域的共有序列。
应理解的是,如本文述及的基序35、36、37、38、39、40、41、42、43、44、45和46代表存在于表A5中DHAR多肽、特别是SEQ IDNO:1958中的基序的共有序列。然而,应理解的是,如本文中定义的基序不限于它们各自的序列,而是涵盖存在于任何DHAR多肽中的相应基序。
更优选地,用于本发明方法的DHAR多肽包含,按照递增的优选次序,至少2个、至少3个、至少4个、至少5个、至少6个、至少7个、至少8个、至少9个、至少10个、至少11或所有12个基序。
作为替代地,DHAR蛋白的同源物按照递增的优选次序与SEQ IDNO:1958所示的氨基酸具有至少25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的全序列同一性,条件是该DHAR多肽包含上述12个保守基序之任一或多个。可以使用全局比对算法,例如程序GAP(GCG Wisconsin Package,Accelrys)中的Needleman Wunsch算法,优选利用缺省参数和优选利用成熟蛋白质的序列(即,不考虑分泌信号或转运肽),确定全序列同一性。与全序列同一性相比,当只考虑保守结构域或基序时,序列同一性通常更高。优选地,DHAR多肽中的基序按照递增的优选次序与SEQ IDNO:2239至SEQ ID NO:2250所示的基序(基序35至46)具有至少70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的序列同一性。
优选地,所述多肽序列,当用于构建系统发生树,例如图8中描述的系统发生树时,与包含SEQ ID NO:1958所示的氨基酸序列的DHAR多肽组而非与任何其它组聚类。
术语“结构域”、“标签序列”和“基序”在本文“定义”部分定义。存在用于鉴定结构域的专家数据库,例如SMART(Schultz等(1998)Proc.Natl.Acad.Sci.USA 95,5857-5864;Letunic等(2002)Nucleic Acids Res 30,242-244)、InterPro(Mulder等,(2003)Nucl.Acids.Res.31,315-318)、Prosite(Bucher和Bairoch(1994),A generalized profile syntax for biomolecularsequences motifs and its function in automatic sequence interpretation.(In)ISMB-94;第二届分子生物学智能系统国际会议记录(Proceedings 2ndInternational Conference on Intelligent Systems for Molecular Biology)Altman R.,Brutlag D.,Karp P.,Lathrop R.,Searls D.编辑,53-61页,AAAIPress,Menlo Park;Hulo等,Nucl.Acids.Res.32:D134-D137,(2004))或者Pfam(Bateman等,Nucleic Acids Research 30(1):276-280(2002))。进行蛋白质序列芯片(in silico)分析的一组工具可以从ExPASy蛋白质组学服务器获得(瑞士生物信息学研究所(Swiss Institute ofBioinformatics)(Gasteiger等ExPASy:the proteomics server for in-depthprotein knowledge and analysis.Nucleic Acids Res 31:3784-3788(2003))。结构域或基序也可以利用常规技术例如通过序列比对来鉴定。
为比较而进行序列比对的方法是本领域公知的,此类方法包括GAP、BESTFIT、BLAST、FASTA和TFASTA。GAP使用Needleman和Wunsch的算法((1970)J.Mol.Biol.48:443-453)来寻找两序列之间匹配数最大化且空位数最小化的全局(即跨越完整序列)的比对。BLAST算法(Altschul等(1990)J Mol Biol 215:403-10)计算序列同一性百分比,并对两序列之间的相似性进行统计学分析。执行BLAST分析的软件可通过美国国家生物技术信息中心(NCBI)公开地获得。同源物可以例如,使用ClustalW多重序列比对算法(1.83版),采用默认的成对比对参数以及百分比的记分方法而容易地鉴定。利用可获自MatGAT软件包(Campanella等,(2003)BMC Bioinformatics,10:29.2003Jul 10;4:29.MatGAT:anapplication that generates similarity/identity matrices using protein orDNA sequences)的方法之一,也可以确定全局相似性和同一性百分比。可以进行微小的人工编辑以优化保守基序之间的比对,这对于所属领域的技术人员而言将是显而易见的。此外,除了利用全长序列进行同源物鉴定以外,还可以利用特定的结构域。可以利用上述程序采用默认参数针对完整核酸或氨基酸序列或者选择的结构域或保守基序来确定序列同一性值。对于局部比对,Smith-Waterman算法是特别有用的(Smith TF,Waterman MS(1981)J.Mol.Biol 147(1);195-7)。
此外,GDH多肽(至少以其天然形式)通常具有谷氨酸脱氨活性。用于确定谷氨酸脱氨活性的工具和技术在本领域公知(Purnell等,2005;Skopelitis等,2007)。在实施例6中提供了更详细的说明。
此外,GDH多肽,当如实施例7和8中所述的按照本发明方法在稻中表达时,产生具有增加的产量相关性状,特别是增加的种子产量(例如(饱满的)种子的数量、种子重量和/或收获指数)的植物。
此外,FLA样多肽(至少以其天然形式)通常具有糖基化活性,即它们在细胞环境中易于被糖基化。用于确定糖基化活性的工具和技术在本领域公知。例如,可以通过HPLC分级分离和其后比色分析法来检测糖(例如Johnson等在Plant Physiol.(2003)133(4)1911–1925中描述),对在拟南芥细胞中表达的N-糖基化的FLA样多肽进行检测。
此外,FLA样多肽,当如实施例部分所述根据本发明的方法在稻中表达时,产生具有增加的产量相关性状,特别是在种子产量、种子饱满率、根生物量和收获指数之任一或多个上具有增加,的植物。
此外,SAUR多肽具有增加植物产量的活性,即,当如实施例部分所述根据本发明的方法在稻中表达时,产生具有增加的产量相关性状的植物,所述增加的产量相关性状优选选自:增加的出苗活力、增加的种子数量、增加的饱满种子数、增加的一级圆锥花序数、增加的株冠和/或根生物量、增加的出苗活力和增加的种子重量。
此外,DHAR多肽(至少以其天然形式)通常具有脱氢抗坏血酸还原酶活性。用于确定脱氢抗坏血酸还原酶活性的工具和技术在本领域公知(Kato,1997-Plant Cell Physiol.38(2):173-178)。
此外,DHAR多肽,当如实施例7和8中所述的按照本发明方法在稻中表达时,产生具有相对于对照植物增加的产量相关性状,特别是增加的饱满种子数量、增加的小花数、增加的产量,的植物。
关于GDH多肽,本发明以编码SEQ ID NO:2的多肽序列的SEQ IDNO:1所示核酸序列转化植物来进行举例说明。然而,本发明的实施并不局限于这些序列;本发明的方法可以有利地利用本文所定义的任何GDH编码核酸或GDH多肽来实施。
编码GDH多肽的核酸的实例在本文实施例部分表A1中给出。这样的核酸可用于实施本发明的方法。实施例部分表A1所给出的氨基酸序列为SEQ ID NO:2所示的GDH多肽的直向同源物和旁系同源物的示例序列,其中术语“直向同源物”和“旁系同源物”如本文所定义。其它的直向同源物和旁系同源物可以通过进行所谓的交互BLAST搜索,容易地找到。通常,这包括一次BLAST,即以查询序列(例如,利用实施例部分表A1中所列的任何序列)针对任何序列数据库如可公共获得的NCBI数据库进行BLAST。当从核苷酸序列开始时,通常使用BLASTN或TBLASTX(利用标准默认值),而当从蛋白质序列开始时,则使用BLASTP或TBLASTN(利用标准默认值)。BLAST结果可以任选地过滤。接着使用过滤的结果或者未过滤的结果中的全长序列针对查询序列来源生物的序列进行反向BLAST(二次BLAST)(在查询序列为SEQ ID NO:1或SEQID NO:2的情况下,二次BLAST因此将会针对玉蜀黍(Zea mays)序列进行)。然后比较一次和二次BLAST的结果。如果一次BLAST中分值靠前的命中事件来自查询序列源自的相同物种,而理想地反向BLAST导致查询序列在最高命中事件中,则鉴定到了旁系同源物;如果一次BLAST中分值靠前的命中事件不是来自查询序列源自的相同物种,且优选地反向BLAST导致查询序列处于最高命中事件之列,则找到了直向同源物。
关于FLA样多肽,本发明以编码SEQ ID NO:172的多肽序列的SEQ ID NO:171所示核酸序列转化植物来进行举例说明。然而,本发明的实施并不局限于这些序列;本发明的方法可以有利地利用本文所定义的任何FLA样编码核酸或FLA样多肽来实施。
编码FLA样多肽的核酸的实例在本文实施例部分表A2中给出。这样的核酸可用于实施本发明的方法。实施例部分表A2所给出的氨基酸序列为SEQ ID NO:172所示的FLA样多肽的直向同源物和旁系同源物的示例序列,其中术语“直向同源物”和“旁系同源物”如本文所定义。其它的直向同源物和旁系同源物可以通过进行在定义部分中描述的所谓交互BLAST搜索,容易地找到;当查询序列为SEQ ID NO:171或SEQ IDNO:172时,二次BLAST(反向BLAST)将针对番茄(Lycopersicumesculentum)序列进行。
关于SAUR多肽,本发明以编码SEQ ID NO:502的多肽序列的SEQ ID NO:501所示核酸序列转化植物来进行举例说明。然而,本发明的实施并不局限于这些序列;本发明的方法可以有利地利用本文所定义的任何SAUR编码核酸或SAUR多肽来实施。
编码SAUR多肽的核酸的实例在本文实施例部分表A3或A3(i)中给出。这样的核酸可用于实施本发明的方法。实施例部分表A3或A3(i)所给出的氨基酸序列为SEQ ID NO:502所示的SAUR多肽的直向同源物和旁系同源物的示例序列,其中术语“直向同源物”和“旁系同源物”如本文所定义。其它的直向同源物和旁系同源物可以通过进行在定义部分中描述的所谓交互BLAST搜索,容易地找到;当查询序列为SEQ ID NO:501或SEQ ID NO:502时,二次BLAST(反向BLAST)将针对拟南芥(Arabidopsis)序列进行。
关于SAUR多肽,本发明可以以编码SEQ ID NO:1164的多肽序列的SEQ ID NO:1163所示核酸序列和编码表E和表F的任何多肽的核酸转化植物来进行举例说明。然而,本发明的实施并不局限于这些序列;本发明的方法可以有利地利用本文所定义的任何SAUR编码核酸、任何SYNP编码核酸、或SAUR、SYNP多肽来实施。
编码SAUR多肽的核酸的实例在本文实施例部分表A4中给出。这样的核酸可用于实施本发明的方法。实施例部分表A4所给出的氨基酸序列为SEQ ID NO:1164所示的SAUR多肽的直向同源物和旁系同源物的示例序列,其中术语“直向同源物”和“旁系同源物”如本文所定义。其它的直向同源物和旁系同源物可以通过进行在定义部分中描述的所谓交互BLAST搜索,容易地找到;当查询序列为SEQ ID NO:1163或SEQ IDNO:1164时,二次BLAST(反向BLAST)将针对拟南芥(Arabidopsis)序列进行。
编码SYNP多肽的核酸的实例在本文实施例部分表E中给出。这样的核酸可用于实施本发明的方法。实施例部分表F所给出的氨基酸序列为表E的多肽所示的SYNP多肽的直向同源物和旁系同源物的示例序列,其中术语“直向同源物”和“旁系同源物”如本文所定义。其它的直向同源物和旁系同源物可以通过进行在定义部分中描述的所谓交互BLAST搜索,容易地找到。
关于DHAR多肽,本发明以编码SEQ ID NO:1958的多肽序列的SEQ ID NO:1957所示核酸序列转化植物来进行举例说明。然而,本发明的实施并不局限于这些序列;本发明的方法可以有利地利用本文所定义的任何DHAR编码核酸或DHAR多肽来实施。
编码DHAR多肽的核酸的实例在本文实施例部分表A5中给出。这样的核酸可用于实施本发明的方法。实施例部分表A5所给出的氨基酸序列为SEQ ID NO:1958所示的DHAR多肽的直向同源物和旁系同源物的示例序列,其中术语“直向同源物”和“旁系同源物”如本文所定义。其它的直向同源物和旁系同源物可以通过进行如在定义部分中所描述的所谓交互BLAST搜索,容易地找到;当查询序列为SEQ ID NO:1957或SEQID NO:1958时,二次BLAST(反向BLAST)将针对番茄序列进行。
分值靠前的命中事件是E值低的命中事件。E值越低,分值越具有显著性(或者换句话说,偶然发现此命中事件的几率越低)。E值的计算是本领域众所周知的。除了E值之外,还可以对比较进行同一性百分比记分。同一性百分比是指两比较核酸(或多肽)序列之间在特定长度上的相同核苷酸(或氨基酸)数。在大家族的情况下,可以使用ClustalW,继之以邻接树来辅助对相关基因的聚类进行可视化和鉴定直向同源物和旁系同源物。
核酸变体也可用于实施本发明的方法。这类变体的实例包括编码实施例部分表A1至A5、表E和表F中给出的任一氨基酸序列的同源物和衍生物的核酸,其中“同源物”和“衍生物”如本文所定义。同样可用于本发明方法的有,编码实施例部分表A1至A5、表E和表F所给出的任一氨基酸序列的直向同源物或旁系同源物的同源物和衍生物的核酸。可用于本发明方法的同源物和衍生物与其源自的未修饰蛋白质具有基本上相同的生物活性和功能活性。用于实施本发明的方法的其它变体可以为密码子使用经优化或miRNA靶位点被移去的变体。
可用于实施本发明方法的其它核酸变体包括编码GDH多肽、或FLA多肽、或SAUR多肽、或DHAR多肽的核酸的部分,与编码GDH多肽、或FLA多肽、或SAUR多肽、或DHAR多肽的核酸杂交的核酸,编码GDH多肽的核酸的剪接变体,编码GDH多肽、或FLA多肽、或SAUR多肽、或DHAR多肽的核酸的等位基因变体,以及通过基因改组获得的编码GDH多肽、或FLA多肽、或SAUR多肽、或DHAR多肽的核酸的变体。术语杂交序列、剪接变体、等位基因变体和基因改组如本文所述。
可用于实施本发明方法的其它核酸变体包括编码SAUR多肽-SYNP多肽的蛋白质融合物中的SAUR多肽、SYNP多肽的核酸的部分。也可用的是:与编码SAUR多肽-SYNP多肽的蛋白质融合物中的SAUR多肽、SYNP多肽的核酸杂交的核酸;编码SAUR多肽-SYNP多肽的蛋白质融合物中的SAUR多肽、SYNP多肽的核酸的剪接变体;编码SAUR多肽-SYNP多肽的蛋白质融合物中的SAUR多肽、SYNP多肽的核酸的等位基因变体;以及通过基因改组获得的、编码SAUR多肽-SYNP多肽的蛋白质融合物中的SAUR多肽、SYNP多肽的核酸的变体。术语杂交序列、剪接变体、等位基因变体和基因改组如本文所述。
编码GDH多肽、或FLA多肽、或SAUR多肽、或SYNP多肽、或SAUR多肽与SYNP多肽的融合蛋白、或DHAR多肽的核酸无需是全长核酸,因为本发明方法的实施不依赖于全长核酸序列的使用。根据本发明,提供了增强植物产量相关性状的方法,包括在植物中引入和表达实施例部分表A1至A5、表E和表F所给出的任一核酸序列的部分、或者编码实施例部分表A1至A5、表E和表F所给出的任一氨基酸序列的直向同源物、旁系同源物或同源物的核酸的部分。
可以例如,通过对核酸进行一个或多个缺失来制备核酸的“部分”。“部分”可以以分离的形式使用,或者可将其与其它编码(或非编码)序列融合,以便例如,产生组合了几种活性的蛋白质。当与其它编码序列融合时,经翻译后所产生的多肽可能比针对该蛋白质部分预测的大小要大。
关于GDH多肽,可用于本发明方法的“部分”编码如本文所定义的GDH多肽,并与实施例部分表A1所给出的氨基酸序列具有基本上相同的生物活性。优选“部分”是实施例部分表A1所给出的任一核酸的部分,或是编码实施例部分表A1所给出的任一氨基酸序列的直向同源物或旁系同源物的核酸的部分。优选“部分”为长度至少500、550、600、650、700、750、800、850、900、950、1000、1050、1100、1150、1200、1250、1300、1350、1400个连续核苷酸,该连续核苷酸来自实施例部分表A1所给出的任一核酸序列,或编码实施例部分表A1所给出任一氨基酸序列的直向同源物或旁系同源物的核酸。最优选“部分”是SEQ ID NO:1所示核酸的部分。优选,“部分”编码氨基酸序列的片段,其包含Glu/Phe/Leu/Val脱氢酶的C末端结构域(Pfam条目PF00208)和Glu/Phe/Leu/Val脱氢酶的二聚化区域(Pfam条目PF02812),具有谷氨酸脱氨活性,当将其用于构建系统发生树例如图3中描述的系统发生树时,其与GDH多肽、优选与类型I的GDH多肽或与和类型I相关的苔藓GDH多肽、更优选与包含SEQ ID NO:2所示的氨基酸序列的β亚基GDH多肽组,而非与任何其它组聚类。
关于FLA样多肽,可用于本发明方法的“部分”编码如本文所定义的FLA样多肽,并与实施例部分表A2所给出的氨基酸序列具有基本上相同的生物活性。优选“部分”是实施例部分表A2所给出的任一核酸的部分,或是编码实施例部分表A2所给出的任一氨基酸序列的直向同源物或旁系同源物的核酸的部分。优选“部分”为长度至少100、200、300、400、500、550、600、650、700、750、800、850、900、950、1000个连续核苷酸,该连续核苷酸来自实施例部分表A2所给出的任一核酸序列,或编码实施例部分表A2所给出任一氨基酸序列的直向同源物或旁系同源物的核酸。最优选“部分”是SEQ ID NO:171的核酸的部分。优选,“部分”编码含至少一个成束蛋白结构域的氨基酸序列的片段。
关于SAUR多肽,可用于本发明方法的“部分”编码如本文所定义的SAUR多肽,并与实施例部分表A3或A3(i)所给出的氨基酸序列具有基本上相同的生物活性。优选“部分”是实施例部分表A3或A3(i)所给出的任一核酸的部分,或是编码实施例部分表A3或A3(i)所给出的任一氨基酸序列的直向同源物或旁系同源物的核酸的部分。优选“部分”为长度至少50、100、200、300、400、500、550、600、650、700、750、800、850、900、950、1000个连续核苷酸,该连续核苷酸来自实施例部分表A3或A3(i)所给出的任一核酸序列,或编码实施例部分表A3或A3(i)所给出任一氨基酸序列的直向同源物或旁系同源物的核酸。最优选“部分”是SEQID NO:501的核酸的部分。优选,“部分”编码含生长素可诱导结构域的氨基酸序列的片段。
关于SAUR多肽,可用于本发明方法的“部分”编码如本文所定义的SAUR多肽、SYNP多肽或它们的蛋白质融合物,并与实施例部分表A4、表E和表F所给出的氨基酸序列具有基本上相同的生物活性。优选“部分”是实施例部分表A、表E和表F所给出的任一核酸的部分,或是编码实施例部分表A、表E和表F所给出的任一氨基酸序列的直向同源物或旁系同源物的核酸的部分。优选“部分”为长度至少50、100、200、300、400、500、550、600、650、700、750、800、850、900、950、1000个连续核苷酸,该连续核苷酸来自实施例部分表A、表E或表F所给出的任一核酸序列,或编码实施例部分表表A、表E或表F所给出任一氨基酸序列的直向同源物或旁系同源物的核酸。
关于DHAR多肽,可用于本发明方法的“部分”编码如本文所定义的DHAR多肽,并与实施例部分表A5所给出的氨基酸序列具有基本上相同的生物活性。优选“部分”是实施例部分表A5所给出的任一核酸的部分,或是编码实施例部分表A5所给出的任一氨基酸序列的直向同源物或旁系同源物的核酸的部分。优选“部分”为长度至少500、550、600、650、700、750、800、850、900、950、1000个连续核苷酸,该连续核苷酸来自实施例部分表A5所给出的任一核酸序列,或编码实施例部分表A5所给出任一氨基酸序列的直向同源物或旁系同源物的核酸。最优选“部分”是SEQ ID NO:1957的核酸的部分。优选“部分”编码氨基酸序列的片段,所述氨基酸片段当将其用于构建系统发生树例如图8中描述的系统发生树时,其与包含SEQ ID NO:1958所示的氨基酸序列的DHAR多肽组而非与任何其它组聚类。聚类的序列优选包含基序35至46之任一或多个;和/或具有脱氢抗坏血酸还原酶生物学活性;和/或与SEQ ID NO:1958或与表A5中描述的任何多肽具有至少49%的序列同一性。
可以用于本发明方法的另一核酸变体是这样的核酸,所述核酸能够在降低的严紧条件下,优选在严紧条件下与编码本文中定义的GDH多肽、或FLA多肽、或SAUR多肽、或SYNP多肽、或SAUR多肽与SYNP多肽的融合蛋白、或DHAR多肽的核酸,或者与本文中定义的“部分”杂交。
根据本发明,提供了增强植物的产量相关性状的方法,包括向植物中引入和表达能够与实施例部分表A1至A5、表E和表F所给出的任一核酸杂交的核酸,或包括向植物中引入和表达能够与编码实施例部分表A1至A5、表E和表F所给出的任何核酸序列的直向同源物、旁系同源物或同源物的核酸杂交的核酸。
关于GDH多肽,用于本发明方法的杂交序列编码本文中定义的GDH多肽,所述多肽与实施例部分表A1所给出的氨基酸序列具有基本上相同的生物活性。优选,杂交序列能够与实施例部分表A1所给出的任一核酸的互补序列杂交,或与这些序列之任一的部分杂交,其中“部分”如上文所定义,或者所述杂交序列能够与编码实施例部分表A1所给出的任一氨基酸序列的直向同源物或旁系同源物的核酸的互补序列杂交。最优选,所述杂交序列能够与SEQ ID NO:1所示的核酸的互补序列或与其部分杂交。
优选,所述杂交序列编码具有这样的氨基酸序列的多肽,所述氨基酸序列包含Glu/Phe/Leu/Val脱氢酶的C末端结构域(Pfam条目PF00208)和Glu/Phe/Leu/Val脱氢酶的二聚化区域(Pfam条目PF02812),具有谷氨酸脱氨活性,当全长用于构建系统发生树例如图3中描述的系统发生树时,其与GDH多肽、优选与类型I的GDH多肽或与和类型I相关的苔藓GDH多肽、更优选与包含SEQ ID NO:2所示的氨基酸序列的β亚基GDH多肽组,而非与任何其它组聚类。
关于FLA样多肽,用于本发明方法的杂交序列编码本文中定义的FLA样多肽,所述多肽与实施例部分表A2所给出的氨基酸序列具有基本上相同的生物活性。优选,杂交序列能够与实施例部分表A2所给出的任一核酸的互补序列杂交,或与这些序列之任一的部分杂交,其中“部分”如上文所定义,或者所述杂交序列能够与编码实施例部分表A2所给出的任一氨基酸序列的直向同源物或旁系同源物的核酸的互补序列杂交。最优选,所述杂交序列能够与SEQ ID NO:171所示的核酸的互补序列或与其部分杂交。
优选,所述杂交序列编码包含至少一个成束蛋白结构域的多肽。
关于SAUR多肽,用于本发明方法的杂交序列编码本文中定义的SAUR多肽,所述多肽与实施例部分表A3或A3(i)所给出的氨基酸序列具有基本上相同的生物活性。优选,杂交序列能够与实施例部分表A3或A3(i)所给出的任一核酸的互补序列杂交,或与这些序列之任一的部分杂交,其中“部分”如上文所定义,或者所述杂交序列能够与编码实施例部分表A3或A3(i)所给出的任一氨基酸序列的直向同源物或旁系同源物的核酸的互补序列杂交。最优选,所述杂交序列能够与SEQ ID NO:501所示的核酸的互补序列或与其部分杂交。
优选,所述杂交序列编码具有包含生长素可诱导结构域的氨基酸序列的多肽。
关于SAUR多肽、或SYNP多肽、或SAUR多肽与SYNP多肽的融合蛋白,用于本发明方法的杂交序列编码本文中定义的SAUR多肽,所述多肽与实施例部分表A4、E、F所给出的氨基酸序列具有基本上相同的生物活性。优选,杂交序列能够与实施例部分表A4、E、F所给出的任一核酸的互补序列杂交,或与这些序列之任一的部分杂交,其中“部分”如上文所定义,或者所述杂交序列能够与编码实施例部分表A4、E、F所给出的任一氨基酸序列的直向同源物或旁系同源物的核酸的互补序列杂交。
关于DHAR多肽,用于本发明方法的杂交序列编码本文中定义的DHAR多肽,所述多肽与实施例部分表A5所给出的氨基酸序列具有基本上相同的生物活性。优选,杂交序列能够与实施例部分表A5所给出的任一核酸的互补序列杂交,或与这些序列之任一的部分杂交,其中“部分”如上文所定义,或者所述杂交序列能够与编码实施例部分表A5所给出的任一氨基酸序列的直向同源物或旁系同源物的核酸的互补序列杂交。最优选,所述杂交序列能够与SEQ ID NO:1957所示的核酸的互补序列或与其部分杂交。
优选,所述杂交序列编码具有这样的氨基酸序列的多肽,所述氨基酸序列,当全长用于构建系统发生树例如图8中描述的系统发生树时,与包含SEQ ID NO:1958所示的氨基酸序列的DHAR多肽(EC 1.8.5.1.)的组而非与任何其它组聚类。杂交序列优选编码这样的多肽,所述多肽包含基序35至46之任一或多个,和/或具有脱氢抗坏血酸还原酶生物学活性,和/或与SEQ ID NO:1958或与表A5中描述的任何多肽具有至少49%的序列同一性。
可以用于本发明方法的另一核酸变体是编码上文中定义的GDH多肽、或FLA多肽、或SAUR多肽、或DHAR多肽的剪接变体,剪接变体如本文中定义。可以用于本发明方法的另一核酸变体是编码上文中定义的SAUR多肽、SYNP多肽、或此两种多肽的融合物的剪接变体,剪接变体如本文中定义。
根据本发明,提供了增强植物产量相关性状的方法,包括在植物中引入和表达实施例部分表A1至A5、表E和表F所给出的任一核酸序列的剪接变体,或编码实施例部分表A1至A5、表E和表F所给出的任一氨基酸序列的直向同源物、旁系同源物或同源物的核酸的剪接变体。
关于GDH多肽,优选剪接变体是如SEQ ID NO:1所示的核酸的剪接变体,或编码SEQ ID NO:2的直向同源物或旁系同源物的核酸的剪接变体。优选,由所述剪接变体编码的氨基酸序列包含Glu/Phe/Leu/Val脱氢酶的C末端结构域(Pfam条目PF00208)和Glu/Phe/Leu/Val脱氢酶的二聚化区域(Pfam条目PF02812),具有谷氨酸脱氨活性,当用于构建系统发生树例如图3中描述的系统发生树时,其与GDH多肽、优选与类型I的GDH多肽或与和类型I相关的苔藓GDH多肽、更优选与包含SEQ IDNO:2所示的氨基酸序列的β亚基GDH多肽组,而非与任何其它组聚类。
关于FLA样多肽,优选剪接变体是如SEQ ID NO:171所示的核酸的剪接变体,或编码SEQ ID NO:172的直向同源物或旁系同源物的核酸的剪接变体。优选,由剪接变体编码的氨基酸序包含至少一个成束蛋白结构域。
关于SAUR多肽,优选剪接变体是如SEQ ID NO:501所示的核酸的剪接变体,或编码SEQ ID NO:502的直向同源物或旁系同源物的核酸的剪接变体。优选,由剪接变体编码的氨基酸序列包含生长素可诱导结构域。
关于DHAR多肽,优选剪接变体是如SEQ ID NO:1957所示的核酸的剪接变体,或编码SEQ ID NO:1958的直向同源物或旁系同源物的核酸的剪接变体。优选,由所述剪接变体编码的氨基酸序列,当用于构建系统发生树例如图8中描述的系统发生树时,其与包含SEQ ID NO:1958所示的氨基酸序列的DHAR多肽的组而非与任何其它组聚类。剪接变体优选包含基序35至46之任一或多个,和/或具有脱氢抗坏血酸还原酶生物学活性,和/或编码与SEQ ID NO:1958或与表A5中描述的任何DHAR多肽具有至少49%的序列同一性的多肽。
可用于本发明方法的另一核酸变体为编码前文所定义的GDH多肽、或FLA多肽、或SAUR多肽、或DHAR多肽的核酸的等位基因变体,等位基因变体如本文所定义。
关于SAUR多肽、或SYNP多肽、或SAUR多肽与SYNP多肽的融合蛋白,可用于实施本发明方法的另一核酸变体为编码前文所定义的SAUR多肽、SYNP多肽、或两种多肽的融合物的核酸的等位基因变体,等位基因变体如本文所定义。
根据本发明,提供了增强植物产量相关性状的方法,包括在植物中引入和表达实施例部分表A1至A5、表E和表F所给出的任一核酸的等位基因变体,或包括在植物中引入和表达编码实施例部分表A1至A5、表E和表F所给出的任一氨基酸序列的直向同源物、旁系同源物或同源物的核酸的等位基因变体。
关于GDH多肽,由可用于本发明方法的等位基因变体编码的多肽与SEQ ID NO:2的GDH多肽及实施例部分表A1中描述的任何氨基酸序列具有基本上相同的生物活性。等位基因变体天然存在,并且对这些天然等位基因的应用包含于本发明的方法中。优选等位基因变体为SEQ IDNO:1的等位基因变体,或编码SEQ ID NO:2的直向同源物或旁系同源物的核酸的等位基因变体。优选,由所述等位基因变体编码的氨基酸序列包含Glu/Phe/Leu/Val脱氢酶的C末端结构域(Pfam条目PF00208)和Glu/Phe/Leu/Val脱氢酶的二聚化区域(Pfam条目PF02812),具有谷氨酸脱氨活性,当将其用于构建系统发生树例如图3中描述的系统发生树时,其与GDH多肽、优选与类型I的GDH多肽或与和类型I相关的苔藓GDH多肽、更优选与包含SEQ ID NO:2所示的氨基酸序列的β亚基GDH多肽的组,而非与任何其它组聚类。
关于FLA样多肽,由可用于本发明方法的等位基因变体编码的多肽与SEQ ID NO:172的FLA样多肽及实施例部分表A2中描述的任何氨基酸序列具有基本上相同的生物活性。等位基因变体天然存在,并且对这些天然等位基因的应用包含于本发明的方法中。优选等位基因变体为SEQ ID NO:171的等位基因变体,或编码SEQ ID NO:172的直向同源物或旁系同源物的核酸的等位基因变体。优选,由所述等位基因变体编码的氨基酸序列包含至少一个成束蛋白结构域。
关于SAUR多肽,由可用于本发明方法的等位基因变体编码的多肽与SEQ ID NO:502的SAUR多肽及实施例部分表A3或A3(i)中描述的任何氨基酸序列具有基本上相同的生物活性。等位基因变体天然存在,并且对这些天然等位基因的应用包含于本发明的方法中。优选等位基因变体为SEQ ID NO:501的等位基因变体,或编码SEQ ID NO:502的直向同源物或旁系同源物的核酸的等位基因变体。优选,由所述等位基因变体编码的氨基酸序列包含生长素可诱导结构域。
关于SAUR多肽、或SYNP多肽、或SAUR多肽与SYNP多肽的融合蛋白,由可用于本发明方法的等位基因变体编码的多肽与SAUR多肽、或SYNP多肽、或SAUR多肽与SYNP多肽的融合蛋白及实施例部分表A4、表E和表F中描述的任何氨基酸序列具有基本上相同的生物活性。等位基因变体天然存在,并且对这些天然等位基因的应用包含于本发明的方法中。
关于DHAR多肽,由可用于本发明方法的等位基因变体编码的多肽与SEQ ID NO:1958的DHAR多肽及实施例部分表A5中描述的任何氨基酸序列具有基本上相同的生物活性。等位基因变体天然存在,并且对这些天然等位基因的应用包含于本发明的方法中。优选等位基因变体为SEQ ID NO:1957的等位基因变体,或编码SEQ ID NO:1958的直向同源物或旁系同源物的核酸的等位基因变体。优选,由等位基因变体编码的氨基酸序列,当用于构建系统发生树例如图8中描述的系统发生树时,其与包含SEQ ID NO:1958所示的氨基酸序列的DHAR多肽的组而非与任何其它组聚类。聚类的序列优选包含基序35至46之任一或多个,和/或具有脱氢抗坏血酸还原酶生物学活性,和/或与SEQ ID NO:1958或与表A5中描述的任何多肽具有至少49%的序列同一性。
基因改组或定向进化也可用于产生编码上文所定义的GDH多肽、或FLA多肽、或SAUR多肽、或SYNP多肽、或SAUR多肽与SYNP多肽的融合蛋白、或DHAR多肽的核酸的变体;术语“基因改组”如本文所定义。
根据本发明,提供了用于增强植物的产量相关性状的方法,包括向植物中引入和表达实施例部分的表A1至A5、表E和表F所给出的任一核酸序列的变体,或包括向植物中引入和表达编码实施例部分的表A1至A5、表E和表F所给出的任何氨基酸序列的直向同源物、旁系同源物或同源物的核酸的变体,其中所述变体核酸通过基因改组获得。
关于GDH多肽,优选,由通过基因改组获得的变体核酸编码的氨基酸序列包含Glu/Phe/Leu/Val脱氢酶的C末端结构域(Pfam条目PF00208)和Glu/Phe/Leu/Val脱氢酶的二聚化区域(Pfam条目PF02812),具有谷氨酸脱氨活性,当将其用于构建系统发生树例如图3中描述的系统发生树时,其与GDH多肽、优选与类型I的GDH多肽或与和类型I相关的苔藓GDH多肽、更优选与包含SEQ ID NO:2所示的氨基酸序列的β亚基GDH多肽的组,而非与任何其它组聚类。
关于FLA样多肽,优选,由通过基因改组获得的变体核酸编码的氨基酸序列包含至少一个成束蛋白结构域。
关于SAUR多肽,优选,由通过基因改组获得的变体核酸编码的氨基酸序列包含生长素可诱导结构域。
关于DHAR多肽,优选,由通过基因改组获得的变体核酸编码的氨基酸序列,当将其用于构建系统发生树例如图8中描述的系统发生树时,其与包含SEQ ID NO:1958所示的氨基酸序列的DHAR多肽的组而非与任何其它组聚类,和/或包含基序35至46之任一或多个,和/或具有脱氢抗坏血酸还原酶生物学活性,和/或与SEQ ID NO:1958或与表A5中描述的多肽之任一或多个具有至少49%的序列同一性。
此外,还可利用定点诱变获得核酸变体。若干方法可用来实现定点诱变,最常见的是基于PCR的方法(Current Protocols in MolecularBiology.Wiley编辑)。
编码GDH多肽的核酸可以源自任何天然或人工来源。该核酸可以通过有意的人为操作而在组成和/或基因组环境上不同于其天然形式。优选,编码GDH多肽的核酸可以来自植物,更优选来自单子叶植物,更优选来自禾本科(Poaceae),最优选核酸来自玉蜀黍(Zea mays)。
编码FLA样多肽的核酸可以源自任何天然或人工来源。该核酸可以通过有意的人为操作而在组成和/或基因组环境上不同于其天然形式。优选,编码FLA样多肽的核酸可以来自植物,更优选来自双子叶植物,更优选来自十字花科(Brassicaceae)或来自杨属(Populus),最优选核酸来自番茄(Lycopersicum esculentum)或来自毛果杨(Populus trichocarpa)。
编码SAUR多肽的核酸可以源自任何天然或人工来源。该核酸可以通过有意的人为操作而在组成和/或基因组环境上不同于其天然形式。优选,编码SAUR多肽的核酸可以来自植物,更优选来自双子叶植物,更优选来自自十字花科(Brassicaceae),最优选核酸来自拟南芥(Arabidopsisthaliana)。
编码用于本发明方法的多肽的核酸可以源自任何天然或人工来源。该核酸可以通过有意的人为操作而在组成和/或基因组环境上不同于其天然形式。优选,编码SAUR、SYNP或它们的融合物多肽的核酸可以来自植物,更优选来自双子叶植物,更优选来自十字花科(Brassicaceae),最优选核酸来自拟南芥(Arabidopsis thaliana)。
编码DHAR多肽的核酸可以源自任何天然或人工来源。该核酸可以通过有意的人为操作而在组成和/或基因组环境上不同于其天然形式。优选,编码DHAR多肽的核酸可以来自植物,更优选来自双子叶植物,更优选来自茄科(Solanaceae),最优选核酸来自番茄(Solanumlycopersicum)。
关于GDH多肽,本发明方法的实施产生具有增强的产量相关性状的植物。尤其是,本发明方法的实施产生在非胁迫条件或在胁迫条件下与对照植物相比较,具有增加的产量,特别是增加的种子产量和/或增强的根生长和/或增加的早期活力的植物,条件是胁迫条件不包括氮缺乏。术语“产量”、“种子产量”和“早期活力”在本文“定义”部分有更详细的说明。
关于FLA样多肽,本发明方法的实施产生具有增强的产量相关性状的植物。尤其是,本发明方法的实施产生与对照植物相比较具有增加的产量,特别是增加的种子产量的植物。术语“产量”和“种子产量”在本文“定义”部分有更详细的说明。
关于SAUR多肽,本发明方法的实施产生具有增强的产量相关性状的植物。尤其是,本发明方法的实施产生与对照植物相比较具有增加的产量,特别是增加的种子产量的植物。术语“产量”和“种子产量”在本文“定义”部分有更详细的说明。
关于SAUR多肽、或SYNP多肽、或SAUR多肽与SYNP多肽的融合蛋白,本发明方法的实施产生具有增强的产量相关性状的植物。尤其是,本发明方法的实施产生与对照植物相比较具有增加的产量,特别是增加的种子产量的植物。术语“产量”和“种子产量”在本文“定义”部分有更详细的说明。
关于DHAR多肽,本发明方法的实施产生具有增强的产量相关性状的植物。尤其是,本发明方法的实施产生与对照植物相比较具有增加的产量,特别是增加的种子产量的植物。术语“产量”和“种子产量”在本文“定义”部分有更详细的说明。
本文中提及增强的产量相关性状,旨在表示植物的一个或多个部分的生物量(重量)的增加,所述部分可以包括地上(可收获的)部分和/或地下(可收获的)部分。特别地,该可收获部分是种子和/或根,并且本发明方法的实施导致,与对照植物的种子产量相比较,具有增加的种子产量,和/或与对照植物相比较,具有增加的根生长的植物。
本文中提及增强的产量相关性状,旨在表示植物的一个或多个部分的早期活力和/或生物量(重量)的增加,所述部分可以包括地上(可收获的)部分和/或地下(可收获的)部分。特别地,该可收获部分是种子,并且本发明方法的实施导致与对照植物的种子产量相比较具有增加的种子产量的植物。
以玉米为例,产量增加可以表现为如下一个或多个方面:每平方米建植的植物数的增加、每株植物的雌穗数的增加、行数、行粒数、粒重、千粒重、雌穗长度/直径的增加、种子饱满率(为饱满种子数除以种子总数并乘以100)的增加,等等。
以稻为例,产量增加可以表现为如下一个或多个方面的增加:每平方米的植物数、每株植物的圆锥花序数、每圆锥花序的小穗数、每圆锥花序的花朵(小花)数(表达为饱满种子数占一级圆锥花序数的比率)、种子饱满率(为饱满种子数除以种子总数并乘以100)的增加、千粒重的增加,等等。
关于GDH多肽,本发明提供了相对于对照植物增加产量,特别是种子产量和/或根产量的方法,所述方法包括调节编码本文所定义的GDH多肽的核酸在植物中的表达。
关于FLA样多肽,本发明提供了相对于对照植物增加产量相关性状,特别是植物的种子产量的方法,所述方法包括调节编码本文所定义的FLA样多肽的核酸在植物中的表达。
根据本发明优选的方面,实施本发明方法产生相对于对照植物具有增加的生长速率的植物。因此,根据本发明,提供了增加植物生长速率的方法,所述方法包括调节编码本文所定义的FLA样多肽的核酸在植物中的表达。
关于SAUR多肽,本发明提供了相对于对照植物增加产量相关性状,特别是植物的种子产量的方法,所述方法包括调节编码本文所定义的SAUR多肽的核酸在植物中的表达。
根据本发明优选的方面,实施本发明方法产生相对于对照植物具有增加的生长速率的植物。因此,根据本发明,提供了增加植物生长速率的方法,所述方法包括调节编码本文所定义的SAUR多肽的核酸在植物中的表达。
关于SAUR多肽、或SYNP多肽、或SAUR多肽与SYNP多肽的融合蛋白,本发明提供了相对于对照植物增加产量相关性状,特别是植物的种子产量的方法,所述方法包括调节编码本文所定义的SAUR多肽和SYNP多肽或它们的融合物的核酸在植物中的表达。
根据本发明优选的方面,实施本发明方法产生相对于对照植物具有增加的生长速率的植物。因此,根据本发明,提供了增加植物生长速率的方法,所述方法包括调节编码本文所定义的用于本发明方法的多肽的核酸在植物中的表达。
关于DHAR多肽,本发明提供了相对于对照植物增加产量,特别是植物的种子产量,的方法,所述方法包括调节编码本文所定义的DHAR多肽的核酸在植物中的表达。
根据本发明优选的方面,实施本发明方法产生相对于对照植物具有增加的生长速率的植物。因此,根据本发明,提供了增加植物生长速率的方法,所述方法包括调节编码本文所定义的DHAR多肽的核酸在植物中的表达。
由于本发明的转基因植物具有增强的产量和/或产量相关性状,故,相对于对照植物在其生命周期的相应阶段的生长速率而言,这些植物可能呈现增加的生长速率(至少在其部分生命周期中)。
实施本发明方法产生,在非胁迫条件下或在轻度干旱条件下生长时相对于在相当条件下生长的对照植物具有增加的产量的植物。因此,根据本发明,提供了用于在非胁迫条件下或轻度干旱条件下生长的植物中增加产量的方法,所述方法包括调节编码GDH多肽的核酸在植物中的表达。
实施本发明方法产生,生长在养分缺乏的条件下、特别是氮缺乏条件下,相对于在相当条件下生长的对照植物,具有增加的产量的植物。因此,根据本发明,提供了用于在养分缺乏条件下生长的植物中增加产量的方法,所述方法包括调节编码GDH多肽、FLA多肽、或SAUR多肽、或SYNP多肽、或SAUR多肽与SYNP多肽的融合蛋白、或DHAR多肽的核酸在植物中的表达。养分缺乏可以因诸如磷酸及其它含磷化合物、钾、钙、镁、锰、铁和硼等养分的缺乏所致。
实施本发明方法产生,生长在盐胁迫的条件下,相对于在相当条件下生长的对照植物,具有增加的产量的植物。因此,根据本发明,提供了用于在盐胁迫的条件下生长的植物中增加产量的方法,所述方法包括调节编码GDH多肽、或FLA多肽、或SAUR多肽、或SYNP多肽、或SAUR多肽与SYNP多肽的融合蛋白、或DHAR多肽的核酸在植物中的表达。术语盐胁迫不局限于氯化钠(NaCl),而可以是如下一种或多种盐:NaCl、KCl、LiCl、MgCl2、CaCl2等。
本发明包括可由根据本发明的方法获得的植物或其部分(包括种子)。所述植物或其部分含有编码如上文所定义的GDH多肽的核酸转基因。
本发明还提供遗传构建体和载体,以利于编码GDH多肽、或FLA多肽、或SAUR多肽、或DHAR多肽的核酸在植物中的引入和/或表达。可以将基因构建体插入适于转化进入植物并适于在转化的细胞中表达目的基因的载体(可商购获得)中。本发明还提供了如本文所定义的基因构建体在本发明方法中的用途。
更特别地,本发明提供这样的构建体,其含有:
(a)编码如上文所定义的GDH多肽的核酸;
(b)一个或多个能够驱动(a)中核酸序列表达的控制序列;和任选
(c)转录终止序列。
优选地,编码GDH多肽、或FLA多肽、或SAUR多肽、或DHAR多肽的核酸如以上所定义。术语“控制序列”和“终止序列”如本文所定义。
更特别地,本发明提供这样的构建体,其含有:
(i)编码至少一个SAUR多肽的第一核酸和编码一个或多个SYNP多肽的第二核酸,其中第一和第二核酸包含在单个核酸分子中或多个(至少两个)核酸分子中;
(ii)能够驱动(i)中核酸序列表达的一个或多个控制序列,优选植物启动子,更优选组成型启动子,甚至更优选GOS2启动子,最优选来自稻的GOS2启动子;和任选
(iii)转录终止序列。
优选地,编码用于本发明方法的多肽的核酸如以上所定义。术语“控制序列”和“终止序列”如本文所定义。
本发明还提供了用于例如在植物中同时引入和表达2个或3个编码如本文中所定义的SAUR和SYNP多肽的核酸序列的构建体混合物,其中至少一个构建体包含:
(a)编码SAUR多肽的核酸序列;
(b)一个或多个能够驱动(a)中核酸序列表达的控制序列;和任选
(c)转录终止序列,
以及其中至少一个其它的构建体包含:
(d)编码如本文所定义的SYNP多肽的核酸序列;
(e)一个或多个能够驱动(d)中核酸序列表达的控制序列;和任选
(f)转录终止序列。
可以使用含有任何上述核酸的载体转化植物。技术人员充分知晓载体中必须存在的遗传元件,以便成功进行转化、选择并繁殖含目的序列的宿主细胞。目的序列将有效连接于一个或多个控制序列(至少连接于启动子)。
有利地,可以使用任何类型的天然或合成启动子来驱动核酸序列的表达,但优选启动子是植物来源的。组成型启动子在本发明方法中特别有用。优选组成型启动子是中等强度的遍在组成型启动子。有关各种启动子类型的定义,参见本文中“定义”部分。
关于GDH多肽,也可用于本发明方法的是根特异性启动子。
关于SAUR多肽,也可用于本发明方法的是叶特异性启动子。可用于本发明方法的其它启动子是生长素可诱导启动子。优选所述生长素可诱导启动子包含公知的生长素反应元件TGTCTC和GGTCCCAT,它们分别如SEQ ID NO:1151和1152所示。可由激素生长素诱导的启动子的实例在本领域公知,例如天然存在的SAUR基因的启动子。
关于DHAR多肽,也可用于本发明方法的是根特异性启动子。
关于GDH多肽,应当清楚,本发明的实施并不局限于SEQ ID NO:1所示的GDH多肽编码核酸,而且本发明的实施也不局限于由组成型启动子所驱动的、或由根特异性启动子所驱动的GDH多肽编码核酸的表达。
所述组成型启动子优选是中等强度的启动子,更优选选自植物来源的启动子,例如GOS2启动子,更优选GOS2启动子来自稻。更优选组成型启动子为与SEQ ID NO:23基本上相似的核酸序列,最优选组成型启动子如SEQ ID NO:23所示。有关组成型启动子的其它实例,参见本文中“定义”部分。
根据本发明的另一个优选方面,将编码GDH多肽的核酸有效连接到根特异性启动子上。根特异性启动子优选为RCc3启动子(Plant Mol Biol.1995Jan;27(2):237-48),更优选RCc3启动子来自稻,更优选RCc3启动子为与SEQ ID NO:24基本相似的核酸序列,最优选启动子如SEQ IDNO:24所示。也可用于实施本发明方法的其它根特异性启动子的实例示于以上“定义”部分的表3中。
任选的,可以在引入植物的构建体中使用一个或多个终止子序列。优选,构建体包含表达盒,所述表达盒包含GOS2启动子或包含RCc3、和编码GDH多肽的核酸。
关于FLA样多肽,应当清楚,本发明的实施并不局限于SEQ ID NO:171所示的FLA样多肽编码核酸,而且本发明的实施也不局限于由组成型启动子所驱动的FLA样多肽编码核酸的表达。
所述组成型启动子优选是中等强度的启动子,更优选选自植物来源的启动子,例如GOS2启动子,更优选GOS2启动子来自稻。更优选组成型启动子为与SEQ ID NO:500基本上相似的核酸序列,最优选组成型启动子如SEQ ID NO:500所示。有关组成型启动子的其它实例,参见本文中“定义”部分。
根据本发明的优选方面,表达的调节是表达的增加。增加核酸或基因或基因产物表达的方法在本领域有充分的文献记载,并且实例在“定义”部分提供。
应当清楚,本发明的实施并不局限于SEQ ID NO:501所示的SAUR多肽编码核酸,而且本发明的实施也不局限于由组成型启动子所驱动的、或由叶特异性启动子驱动的SAUR多肽编码核酸的表达。
更优选叶启动子为与SEQ ID NO:1163基本上相似的核酸序列,最优选组成型启动子如SEQ ID NO:1163所示。有关叶启动子的其它实例,参见本文中“定义”部分。
所述组成型启动子优选是中等强度的启动子,更优选选自植物来源的启动子,例如GOS2启动子,更优选GOS2启动子是来自稻。
根据本发明的优选方面,表达的调节是表达的增加。增加核酸或基因或基因产物表达的方法在本领域有充分的文献记载,并且实例在“定义”部分提供。
关于SAUR多肽、或SYNP多肽、或SAUR多肽与SYNP多肽的融合蛋白,应当清楚,本发明的实施并不局限于表A4、E和F所示的SAUR、SYNP多肽和它们的融合物编码核酸,而且本发明的实施也不局限于由组成型启动子所驱动的、或由叶特异性启动子驱动的、SAUR、SYNP多肽和它们的融合物编码核酸的表达。
所述组成型启动子优选是中等强度的启动子,更优选选自植物来源的启动子,例如GOS2启动子,更优选GOS2启动子是来自稻。
更优选叶启动子为与SEQ ID NO:1825基本上相似的核酸序列,最优选组成型启动子如SEQ ID NO:1825所示。有关叶启动子的其它实例,参见本文中“定义”部分。
根据本发明的优选方面,表达的调节是表达的增加。增加核酸或基因或基因产物表达的方法在本领域有充分的文献记载,并且实例在“定义”部分提供。
应当清楚,本发明的实施并不局限于SEQ ID NO:1957所示的DHAR多肽编码核酸,而且本发明的实施也不局限于由组成型启动子所驱动的DHAR多肽编码核酸的表达。
所述组成型启动子优选是中等强度的启动子,更优选选自植物来源的启动子,例如GOS2启动子,更优选GOS2启动子来自稻。更优选组成型启动子为与SEQ ID NO:2251基本上相似的核酸序列,最优选组成型启动子如SEQ ID NO:2251所示。有关组成型启动子的其它实例,参见本文中“定义”部分。
任选的,可以在引入植物的构建体中使用一个或多个终止子序列。优选,构建体包含表达盒,所述表达盒包含和SEQ ID NO:2251基本相似的GOS2启动子和编码DHAR多肽的核酸。
根据本发明的优选方面,表达的调节是表达的增加。增加核酸或基因或基因产物表达的方法在本领域有充分的文献记载,并且实例在“定义”部分提供。
另外的调控元件可以包括转录和翻译的增强子。本领域技术人员会知道适合用于实施本发明的终止子和增强子的序列。如“定义”部分所说明的那样,也可以向5’非翻译区(UTR)或在编码序列中加入内含子序列,来增加在胞质中累积的成熟信使的量。其他控制序列(除启动子、增强子、沉默子、内含子序列、3’UTR和/或5’UTR区域之外)可以有蛋白质和/或RNA稳定元件。这类序列为本领域技术人员公知或者可以容易地获得。
本发明的遗传构建体可以还包括为在特定细胞类型中维持和/或复制所需的复制起点序列。一个实例是需要将遗传构建体作为染色体外遗传元件(如质粒或粘粒分子)在细菌细胞中维持的情况。优选的复制起点包括但不限于f1-ori和colE1。
为检测本发明方法中所用核酸序列的成功转移和/或选择含有这些核酸的转基因植物,最好使用标记基因(或报告基因)。因此,遗传构建体可以任选地含有可选择标记基因。可选择标记在本文“定义”部分有更详细的说明。一旦不再需要标记基因可从转基因细胞将其除去或切除。用于标记去除的技术在本领域内是已知的,有用的技术描述于上文中定义部分。
如上文所述,调节编码GDH多肽、或FLA多肽、或SAUR多肽、或DHAR多肽的核酸表达的一个优选方法是,在植物中引入和表达编码GDH多肽、或FLA多肽、或SAUR多肽、或DHAR多肽的核酸;然而,实施所述方法的效果,即增强产量相关性状,也可以利用其他众所周知的技术实现,包括但不限于:T-DNA激活标记、TILLING、同源重组。这些技术的说明在“定义”部分提供。
为了调节编码SAUR多肽的核酸的表达,所述引入的核酸可以例如包含一个或多个DST元件,所述元件优选包含保守的DST基序ATAGAT和GAT(SEQ ID NO:653和654)。优选DST元件位于编码SAUR多肽的核酸的编码区域下游的3’UTR中。DST元件在本领域公知,其在编码SAUR多肽的转录本的稳定性中起着重要作用。DST元件指通常存在于mRNA的3’UTR(非翻译区)的约40个核苷酸的长元件,其涉及调节mRNA衰变(M.A.Perez-Amador等,New molecularphenotypes in the dst mutants of Arabidopsis revealed by DNA microarrayanalysis,Plant Cell 13(2001)2703–2717)。在另一个实施例中,可以通过例如TILLING,改变内源SAUR核酸中的DST元件来调节编码SAUR多肽的核酸的表达。
如上文所述,调节编码用于本发明方法的多肽的核酸的表达的一个优选方法是,在植物中引入和表达编码SAUR、SYNP多肽或它们的融合物的核酸;然而,实施所述方法的效果,即增强产量相关性状,也可以利用其它众所周知的技术实现,包括但不限于T-DNA激活标记、TILLING、同源重组。这些技术的说明在“定义”部分提供。
本发明还提供了产生相对于对照植物具有增强的产量相关性状的转基因植物的方法,包括在植物中引入和表达编码如前文所定义的GDH多肽、或FLA多肽、或SAUR多肽、或DHAR多肽的任何核酸。
更具体地,本发明提供了产生具有增强的产量相关性状,特别是增加的产量和/或增加的早期活力,的转基因植物的方法,所述方法包括:
(i)向植物或植物细胞中引入和表达编码GDH多肽、或FLA多肽、或SAUR多肽、或DHAR多肽的核酸;和
(ii)在促进植物生长和发育的条件下培养所述植物细胞。
(i)中的核酸可以为任何能够编码如本文定义的GDH多肽、或FLA多肽、或SAUR多肽、或DHAR多肽的核酸。
本发明还提供了产生相对于对照植物具有增强的产量相关性状的转基因植物的方法,包括在植物中引入和表达编码如前文所定义的用于本发明方法的多肽的任何核酸。
用于在转基因植物中引入和表达两个或更多个转基因的方法(也称为基因堆积)在本领域公知(见例如,Halpin(2005)Plant Biotech J(3):141-155综述)。可以通过重复的步骤进行基因堆积,其中通过将含有一个转基因的植物与包含其它转基因的个体进行杂交,或作为替代地,通过以新基因对包含一个转基因的植物进行再转化(或超转化),将两个或更多个转基因顺序地引入到植物中。可以通过以例如包含每个待引入到植物中的转基因的根癌农杆菌菌株的混合培养物进行转化,同时引入两个或更多个转基因。
关于SAUR多肽、或SYNP多肽、或SAUR多肽与SYNP多肽的融合蛋白,根据本发明,还提供了用于增强植物产量相关性状的方法,所述方法包括向植物中同时引入和表达:(i)编码至少一个SAUR多肽的第一核酸序列;和(ii)编码SYNP多肽的第二核酸序列;或(iii)引入和表达编码SAUR和SYNP多肽的融合物的核酸,所述植物相对于具有下列核酸之一的增加表达的植物,具有增强的产量相关性状:
(i)编码至少一个SAUR多肽的第一核酸;或
(ii)编码一个或多个SYNP多肽的第二核酸;或
(iii)根据(i)的核酸和根据(ii)的核酸,
其中优选所述SAUR多肽选自表A中的任何多肽及其同源物;其中优选所述SYNP多肽选自表E和F中的任何多肽。
被同时引入的和表达的核酸序列包含于一个或多个核酸分子中。因此,根据本发明,提供了增加植物产量相关性状的方法,所述方法包括向植物中同时引入和表达:
(i)编码SAUR和SYNP多肽的核酸分子;或
(ii)任何两个或三个核酸,每一个编码至少一个SAUR或一个SYNP多肽;或
(iii)编码SAUR和SYNP多肽的融合物的核酸,
其中优选所述SAUR多肽选自表A中的任何多肽及其同源物,所述SYNP多肽选自表E和F中的任何多肽及其同源物。
更具体地,本发明提供了产生具有增强的产量相关性状的植物的方法,所述方法包括:
(i)向植物中引入和表达编码至少一个SAUR多肽的第一核酸和编码一个或多个SYNP多肽的第二核酸、或编码至少一个SAUR和一个或多个SYNP多肽之间的蛋白质融合物的核酸,其中第一和第二核酸包含在单个核酸分子或多个(至少两个)核酸分子中;和
(ii)在促进植物生长和发育的条件下培养所述植物细胞。
引入到植物中的核酸序列优选为包含编码至少一个SAUR或其部分和至少一个SYNP多肽或其部分的融合物的核酸序列的核酸分子。制备编码蛋白质融合物的核酸的方法在本领域公知,其包括但不限于PCR、DNA限制性酶切和连接。编码SAUR和SYNP多肽的核酸序列可以彼此融合,或被编码或非编码DNA分隔,所述非编码DNA例如启动子、内含子、亚细胞定位信号、或填充DNA(例如MARs(基质附着区)区域)。SAUR编码部分可以在融合蛋白的N末端,或反之亦然。
优选地,通过杂交,将(i)的核酸序列顺序地引入和表达。可以在包含已引入和表达的编码至少一个SAUR多肽的分离核酸的母本植物,与包含已引入和表达的编码一个或两个SYNP多肽的分离核酸序列的父本植物之间,进行杂交,和优选在后代中选择两个转基因的存在和表达。因此,根据本发明,提供了用于增强植物产量相关性状的方法,所述方法通过将包含已引入和表达的编码至少一个SAUR多肽的分离核酸序列的母本或父本植物,与包含已引入和表达的编码一个或多个SYNP多肽的分离核酸序列的父本或母本植物杂交,和优选在后代中选择编码相应的SAUR和SYNP多肽的至少两个已引入的转基因的存在和表达,其中所述植物相对于亲本植物或相对于如本文中定义的任何其它对照植物,具有增强的产量相关性状。
可以将核酸直接引入植物细胞或植物本身(包括引入植物的组织、器官或任何其它部分)。根据本发明优选的方面,优选通过转化将核酸引入植物。术语“转化”在本文“定义”部分有更详细的说明。
遗传修饰的植物细胞可以通过技术人员熟悉的所有方法再生。合适的方法可见于上述S.D.Kung和R.Wu、Potrykus或者和Willmitzer的出版物。
通常在转化以后,选出存在一个或多个标记的植物细胞或细胞群,所述标记由与目的基因共转移的植物可表达基因编码,接着使转化的材料再生成整个植物。为选择转化的植物,通常将在转化中获得的植物材料置于选择性条件下,从而可将转化的植物与未转化的植物区分开来。例如,可以种植以上述方式获得的种子,并在最初的生长期之后,通过喷雾对其进行合适的选择。另一可能性方案是在使用合适的选择剂的琼脂板上生长种子(酌情在灭菌后),从而仅转化的种子能够长成植物。作为替代地,针对转化的植物筛选可选择标记例如上文所述标记的存在。
DNA转移和再生之后,还可例如用Southern分析(DNA印迹),评价推定转化的植物,评价目的基因的存在、拷贝数和/或基因组构造。可选的或额外地,可用Northern和/或Western分析(蛋白质印迹)监测新引入的DNA的表达水平,这两种技术都是本领域普通技术人员所公知的。
关于SAUR多肽、或SYNP多肽、或SAUR多肽与SYNP多肽的融合蛋白,作为替代地,可以通过再转化,顺序地引入和表达编码用于本发明方法的多肽的核酸序列。再转化通过如下方式进行:向包含已引入和表达的编码一个或多个SYNP多肽的核酸序列的植物部分或植物细胞中,引入和表达编码至少一个SAUR多肽的第一核酸序列,和优选地在后代中选择两个转基因的存在和表达;或反之亦然,向已经包含编码SAUR多肽的分离核酸的植物中,引入编码SYNP多肽的核酸。因此,根据本发明,提供了通过再转化来增强植物产量相关性状的方法,所述再转化通过如下方式实施:向包含已引入和表达的编码一个或多个SYNP多肽的核酸的植物、植物部分或植物细胞中,引入和表达编码至少一个SAUR多肽的核酸序列,和优选地在后代中选择两个转基因的存在和表达,其中所述植物,相对于具有下列之一的增加表达的植物,具有增强的产量相关性状:
(i)编码至少一个SAUR多肽的第一核酸;或
(ii)编码一个或多个SYNP多肽的第二核酸;或
(iii)根据(i)的核酸和根据(ii)的核酸,
其中优选所述SAUR多肽选自表A4中的任何多肽及其同源物;其中优选所述SYNP多肽选自表E和F中的任何多肽。
作为替代地,如本文中“定义”部分所描述的那样,可以通过同时转化或共转化来进行基因堆积,这比较快速,且可以用于全部的转化技术中。
当考虑直接遗传转化时,使用物理的或化学的输送系统(例如,微弹轰击、PEG、电穿孔、脂质体、玻璃针等),转基因(至少两个)也可以以多种构象存在,但基本上不需要其包含于能够在农杆菌或病毒(遗传转化的中间体)中复制的载体中。两个转基因可以包含于一个或多个核酸分子中,而所述核酸分子同时用于遗传转化过程。
产生的转化植物可以通过多种方式繁殖,如通过克隆繁殖或经典的育种技术。例如,第一代(或T1)转化的植物可自交,选择纯合的第二代(或T2)转化体,而T2植物可进一步通过经典育种技术繁殖。产生的转化生物体可以呈多种形式。例如,它们可以是转化细胞和非转化细胞的嵌合体;克隆的转化体(例如所有细胞已转化而含有表达盒);转化的和非转化的组织的嫁接体(例如在植物中,转化的砧木嫁接到非转化的接穗上)。
本发明显然延及由本文所述任何方法产生的任何植物细胞或植物,以及其所有的植物部分及繁殖体。本发明包括可由根据本发明的方法获得的植物或其部分(包括种子)。所述植物或其部分含有编码如上文所定义的GDH多肽、或FLA多肽、或SAUR多肽、或DHAR多肽的核酸转基因。本发明还延及由任何上述方法产生的原代转化或转染的细胞、组织、器官或整个植物的后代,所述后代的唯一要求是与根据本发明方法所产生的亲本呈现相同的基因型和/或表型特征。
关于SAUR多肽、或SYNP多肽、或SAUR多肽与SYNP多肽的融合蛋白,本发明显然延及由本文所述任何方法产生的任何植物细胞或植物,以及其所有的植物部分及繁殖体。本发明包括可由根据本发明的方法获得的植物或其部分(包括种子)。所述植物或其部分含有编码如上文所定义的(分离的)SAUR多肽和(分离的)SYNP多肽的核酸转基因。本发明还延及由任何上述方法产生的原代转化或转染的细胞、组织、器官或整个植物的后代,所述后代的唯一要求是与根据本发明方法所产生的亲本呈现相同的基因型和/或表型特征。
本发明也包括包含编码上文所定义的GDH多肽、或FLA多肽、或SAUR多肽、或DHAR多肽的分离核酸的宿主细胞。根据本发明优选的宿主细胞是植物细胞。对于在本发明方法中使用的核酸或载体、表达盒或构建体或载体,宿主植物原则上有利地为能够合成用于本发明方法的多肽的所有植物。
本发明方法有利地适用于任何植物。尤其可用于本发明方法的植物包括属于植物界超家族的所有植物,尤其是单子叶植物和双子叶植物,包括饲料或牧草豆科植物、观赏植物、粮食作物、乔木或灌木。根据本发明优选的实施方案,植物为作物植物。作物植物的实例包括大豆、向日葵、芸苔(canola)、苜蓿、油菜籽、亚麻籽(linseed)、棉花、番茄、马铃薯和烟草。还优选植物是单子叶植物。单子叶植物的实例包括甘蔗。更优选植物是谷类。谷类的实例包括稻、玉米、小麦、大麦、粟、黑麦、黑小麦、高粱、二粒小麦、斯佩耳特小麦(spelt)、黑麦属植物(secale)、单粒小麦、埃塞俄比亚画眉草、买罗高粱(milo)和燕麦。
本发明也延及植物的可收获部分,例如但不限于:种子、叶、果实、花、茎、根、根茎、块茎和球茎,所述可收获部分含有编码GDH多肽、或FLA多肽、或SAUR多肽、或SYNP多肽、或SAUR多肽与SYNP多肽的融合蛋白、或DHAR多肽的重组核酸。本发明还涉及由这样的植物的可收获部分衍生的、优选直接衍生的产品,如干丸(pellets)或粉、油类、脂肪和脂肪酸、淀粉或蛋白质。
关于SAUR多肽、或SYNP多肽、或SAUR多肽与SYNP多肽的融合蛋白,本发明还提供了构建体的用途,所述构建体包括:
(i)编码至少一个SAUR多肽的第一核酸和编码一个或多个SYNP多肽的第二核酸,其中第一和第二核酸包含在单个核酸分子或多个(至少两个)核酸分子中;
(ii)能够驱动(i)中核酸序列表达的一个或多个控制序列,优选植物启动子,更优选组成型启动子,更优选GOS2启动子,最优选来自稻的GOS2启动子;和任选
(iii)转录终止序列,
或上述构建体的混合物的用途,用于制备具有增强的产量相关性状的植物的方法中,所述增加的产量相关性状是相对于具有编码对应的SAUR和SYNP多肽的核酸之一的增加表达的植物而言的,其中所述增加的产量相关性状为下列之一或多个:(i)增加的早期活力;(ii)增加的地上部分生物量或根生物量;(iii)增加的每株植物的总种子产量;(iv)增加的种子饱满率;(v)增加的(饱满)种子数;(vi)增加的收获指数;或(vii)增加的千粒重(TKW)。
本发明还包括,在增强植物的任一上述产量相关性状中,编码如本文所述的GDH多肽、或FLA多肽、或SAUR多肽、或SYNP多肽、或SAUR多肽与SYNP多肽的融合蛋白、或DHAR多肽的核酸的用途,以及这些GDH多肽、或FLA多肽、或SAUR多肽、或SYNP多肽、或SAUR多肽与SYNP多肽的融合蛋白、或DHAR多肽的用途。例如,可以在育种程序中使用编码本文所述的GDH多肽、或FLA多肽、或SAUR多肽、或SYNP多肽、或SAUR多肽与SYNP多肽的融合蛋白、或DHAR多肽的核酸、或所述GDH多肽、或FLA多肽、或SAUR多肽、或SYNP多肽、或SAUR多肽与SYNP多肽的融合蛋白、或DHAR多肽本身,其中鉴定可与编码GDH多肽、或FLA多肽、或SAUR多肽、或SYNP多肽、或SAUR多肽与SYNP多肽的融合蛋白、或DHAR多肽的基因遗传连锁的DNA标记。可以使用所述核酸/基因、或所述GDH多肽、或FLA多肽、或SAUR多肽、或SYNP多肽、或SAUR多肽与SYNP多肽的融合蛋白、或DHAR多肽本身,来定义分子标记。接着可以在育种程序中使用此DNA或蛋白质标记,以在本发明方法中选择具有如上文所定义的增强的产量相关性状的植物。此外,编码GDH多肽、或FLA多肽、或SAUR多肽、或SYNP多肽、或SAUR多肽与SYNP多肽的融合蛋白、或DHAR多肽的核酸/基因的等位基因变体也可以用于标记辅助的育种程序。编码GDH多肽、或FLA多肽、或SAUR多肽、或SYNP多肽、或SAUR多肽与SYNP多肽的融合蛋白、或DHAR多肽的核酸还可以用作探针,来对包含其的基因进行遗传和物理作图,以及用作与这些基因连锁的性状的标记。这样的信息可以在植物育种中使用,以培育具有所期望表型的株系。
关于SAUR多肽、或SYNP多肽、或SAUR多肽与SYNP多肽的融合蛋白,本发明包括下述实施方案:
项目1.分离的基于SAUR的蛋白质复合物,其包含至少一个选自表A的多肽及其同源物和部分的SAUR多肽,和一个或多个选自表E和F的多肽及其同源物和部分的SYNP多肽。
项目2.包含编码项目1的复合物的蛋白质的序列的核酸。
项目3.根据项目1的蛋白质复合物在增强产量相关性状中的用途。
项目4.根据项目2的核酸在增强产量相关性状中的用途。
项目5.通过同时过表达该复合物的至少两个蛋白质来促进基于SAUR的蛋白质复合物形成的方法。
项目6.通过调节基于SAUR的蛋白质复合物的水平和/或活性来增强产量相关性状的方法,所述复合物包含至少一个SAUR多肽和一个SYNP多肽,所述复合物的水平和/或活性的调节通过调节包含SAUR多肽或其同源物或部分的编码区和SYNP多肽或其同源物或部分的编码区的一个或多个核酸来进行。
项目
1.谷氨酸脱氢酶(GDH)多肽
1.用于相对于对照植物增强植物的产量相关性状的方法,包括调节编码谷氨酸脱氢酶(GDH)多肽的核酸在植物中的表达,其中所述GDH多肽是具有谷氨酸脱氢酶活性的NAD依赖性GDH。
2.根据项1的方法,其中所述GDH多肽包含基序1至20(SEQ IDNO:3至SEQ ID NO:22)的一个或多个。
3.根据项1或2的方法,其中所述调节的表达通过向植物中引入和表达编码GDH多肽的核酸来实现。
4.根据项1至3之任一的方法,其中所述编码GDH多肽的核酸编码表A1中所列的任一蛋白质,或是该核酸的部分,或是能够与该核酸杂交的核酸。
5.根据项1至4之任一的方法,其中所述核酸序列编码表A1中所给出的任何蛋白质的直向同源物或旁系同源物。
6.根据任何前述项的方法,其中所述增强的产量相关性状包括,相对于对照植物,增加的产量,优选增加的生物量、增加的早期活力和/或增加的种子产量。
7.根据项1至6之任一的方法,其中在非胁迫条件下获得所述增强的产量相关性状。
8.根据项1至6之任一的方法,其中在缺氮的条件下获得所述增强的产量相关性状。
9.根据项3至8之任一的方法,其中所述核酸有效连接到下列之一:
(i)组成型启动子,优选GOS2启动子,最优选来自稻的GOS2启动子;
(ii)根特异性启动子,优选RCc3启动子,最优选来自稻的RCc3启动子。
10.根据项1至9之任一的方法,其中所述编码GDH多肽的核酸是植物来源的,优选来自双子叶植物,再优选来自禾本科,更优选来自玉蜀黍属(Zea)或稻属(Oryza),最优选来自玉米或稻。
11.可通过根据项1至10之任一的方法获得的植物或其部分,包括种子,其中所述植物或其部分包含编码GDH多肽的重组核酸。
12.构建体,其包含:
(i)编码如项1或2中定义的GDH多肽的核酸;
(ii)能够驱动(i)的核酸序列表达的一个或多个控制序列;和任选地
(iii)转录终止序列。
13.根据项12的构建体,其中所述控制序列之一为下列之一:
(i)组成型启动子,优选GOS2启动子,最优选来自稻的GOS2启动子;
(ii)根特异性启动子,优选RCc3启动子,最优选来自稻的RCc3启动子。
14.根据项12或13的构建体在用于制备相对于对照植物具有增加的产量,特别是增加的生物量、增加的早期活力和/或增加的种子产量的植物的方法中的用途。
15.转化了根据项12或13的构建体的植物、植物部分或植物细胞。
16.用于产生相对于对照植物具有增加的产量,特别是增加的生物量、增加的早期活力和/或增加的种子产量的转基因植物的方法,其包括:
(i)向植物中引入和表达编码如项1或2中定义的GDH多肽的核酸;和
(ii)在促进植物生长和发育的条件下培养所述植物细胞。
17.相对于对照植物具有增加的产量,特别是增加的生物量、增加的早期活力和/或增加的种子产量的转基因植物,或源于所述转基因植物的转基因植物细胞,所述增加的产量因编码如项1或2中定义的GDH多肽的核酸的被调节的表达而产生。
18.根据项11、15或17的转基因植物或源于其的转基因植物细胞,其中所述植物是作物植物或单子叶植物或谷类植物,例如稻、玉米、小麦、大麦、粟、黑麦(rye)、黑小麦、高粱、二粒小麦、斯佩耳特小麦、黑麦属植物(secale)、单粒小麦、埃塞俄比亚画眉草、买罗高梁和燕麦。
19.根据项18的植物的可收获部分,其中所述可收获部分优选是枝条生物量、根生物量和/或种子。
20.从根据项18的植物和/或从根据项19的植物的可收获部分产生的产品。
21.编码GDH多肽的核酸在相对于对照植物增加植物的产量,特别是增加种子产量、早期活力和/或生物量中的用途。
22.分离的核酸分子,其包含:
(i)SEQ ID NO:99所示的核酸;
(ii)SEQ ID NO:99所示的核酸的互补序列;
(iii)与SEQ ID NO:176所示的氨基酸序列具有至少50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或更高的序列同一性,且按照递增的优选次序,与基序4至6之任一具有至少50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或更高的序列同一性。
23.分离的多肽,其包含:
(i)SEQ ID NO:176所示的氨基酸序列;
(ii)按照递增的优选次序,与SEQ ID NO:176所示的氨基酸序列具有至少50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或更高的序列同一性,且按照递增的优选次序,与基序4至6之任一具有至少50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或更高的序列同一性的氨基酸序列;
(iii)上文(i)或(ii)所给出的任何氨基酸序列的衍生物。
2.成束蛋白样AGP(FLA)多肽
1.用于相对于对照植物增强植物的产量相关性状的方法,包括调节编码成束蛋白样(FLA样)多肽的核酸在植物中的表达。
2.根据项1的方法,其中所述FLA样多肽包含至少1个、2个、3个或4个成束蛋白样结构域,所述成束蛋白样结构域按照递增的优选次序与如下所示氨基酸具有至少25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的序列同一性:
(i)TITVCAVDNAGMSDLLSKQLSIYTIKNVLSFRVLLDYFDAKKLHQITNGTALAATMFQATGSATGSSGFVNITDLRGGKVGLSPADYNGPPPAKFVKSIAEIPYNISVIQISTIL(SEQ ID NO:487),
其对应于SEQ ID NO:172中N端FLA样结构域;或
(ii)VDGGVTIFCPRDDAMKKFLPKFKNLTAEGKQSLLEYHGIPIYQSISNLKSNNGDMNTLATDGAKKYAVVIQNDGEDVTIKTKIVTAKITATVVDKLPLAIYSLDKVL(SEQ ID NO:488),
其对应于SEQ ID NO:172中C端FLA样结构域。
3.根据项1或2的方法,其中所述调节的表达通过向植物中引入和表达编码FLA样多肽的核酸来实现。
4.根据项1至3之任一的方法,其中所述编码FLA样多肽的核酸编码表A2中所列的任一蛋白质,或是该核酸的部分,或是能够与该核酸杂交的核酸。
5.根据项1至4之任一的方法,其中所述核酸序列编码表A2中所给出的任何蛋白质的直向同源物或旁系同源物。
6.根据任何前述项的方法,其中所述增强的产量相关性状包括相对于对照植物增加的产量,优选增加的生物量和/或增加的种子产量。
7.根据项1至6之任一的方法,其中在干旱条件下获得所述增强的产量相关性状。
8.根据项1至6之任一的方法,其中在非胁迫或在缺氮的条件下获得所述增强的产量相关性状。
9.根据项3至8之任一的方法,其中所述核酸有效地连接到组成型启动子,优选连接到GOS2启动子,最优选连接到来自稻的GOS2启动子。
10.根据项1至9之任一的方法,其中所述编码FLA样多肽的核酸是植物来源的,优选来自双子叶植物,再优选来自茄科(Solanaceae),更优选来自番茄属(Lycopersicum),最优选来自番茄(Lycopersicum esculentum)。
11.可通过根据项1至10之任一的方法获得的植物或其部分,包括种子,其中所述植物或其部分包含编码FLA样多肽的重组核酸。
12.构建体,其包含:
(i)编码如项1或2中定义的FLA样多肽的核酸;
(ii)能够驱动(i)的核酸序列表达的一个或多个控制序列;和任选地
(iii)转录终止序列。
13.根据项12的构建体,其中所述控制序列之一是组成型启动子,优选GOS2启动子,最优选来自稻的GOS2启动子。
14.根据项12或13的构建体在用于制备相对于对照植物具有增加的产量,特别是增加的生物量和/或增加的种子产量的植物的方法中的用途。
15.转化了根据项12或13的构建体的植物、植物部分或植物细胞。
16.用于产生相对于对照植物具有增加的产量,特别是增加的生物量和/或增加的种子产量的转基因植物的方法,其包括:
(i)向植物中引入和表达编码如项1或2中定义的FLA样多肽的核酸;和
(ii)在促进植物生长和发育的条件下培养所述植物细胞。
17.相对于对照植物具有增加的产量,特别是增加的生物量和/或增加的种子产量的转基因植物,或源于所述转基因植物的转基因植物细胞,所述增加的产量因编码如项1或2中定义的FLA样多肽的核酸的被调节的表达而产生。
18.根据项11、15或17的转基因植物或源于其的转基因植物细胞,其中所述植物是作物植物或单子叶植物或谷类植物,例如稻、玉米、小麦、大麦、粟、黑麦(rye)、黑小麦、高粱、二粒小麦、斯佩耳特小麦、黑麦属植物(secale)、单粒小麦、埃塞俄比亚画眉草、买罗高梁和燕麦。
19.根据项18的植物的可收获部分,其中所述可收获部分优选是枝条生物量和/或种子。
20.从根据项18的植物和/或从根据项19的植物的可收获部分产生的产品。
21.编码FLA样多肽的核酸在相对于对照植物增加植物的产量,特别是增加种子产量和/或枝条生物量中的用途。
3.生长素上调小RNA(SAUR)多肽
1.用于相对于对照植物增强植物的产量相关性状的方法,包括调节编码SAUR多肽的核酸在植物中的表达,其中所述SAUR多肽包含生长素可诱导结构域。
2.根据项1的方法,其中所述SAUR多肽包含一个或多个下列基序:
(i)基序23:
LAVYVGEMMQKRRFVVPVTYLSHPCFQKLLRKAEEEFGFDHPMGGLTIPC(SEQ ID NO:1155);
(ii)基序24:KHxxGVYTAEKxxYxxxIxxxxxxxxxAxxxxS xxxYxxxxPMPIx LxxC(SEQID NO:1156);
(iii)基序25:LQSSKQLLKSLSHSSNNVAIP(SEQ ID NO:1157);
(iv)基序26:VxxxKIAxKSQ(SEQ ID NO:1158);
(v)基序27:EQIFIDLASRL(SEQ ID NO:1159);
(vi)基序28:VExxxVxxxxL(SEQ ID NO:1159);
其中X代表任何氨基酸。
3.根据项1的方法,其中所述SAUR多肽为SAUR33样多肽,其包含下列基序47和48以及可选地还有基序49和50之一或两者,或按照递增的优选次序与基序47至50具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%的序列同一性的任何序列:
基序47(SEQ ID NO:2284)
CEVVLFEHLLWMLENADPQ
基序48(SEQ ID NO:2285)
PESLDELVEYYAC
基序49(SEQ ID NO:2286)
GLSKLRCMIRRWHSSSRI
基序50(SEQ ID NO:2287)
SFHGADEVPKGLHPVYVGKSRRRYLIAEELVGHPLFQNLVDRT
4.根据项1至3之任一的方法,其中所述调节的表达通过向植物中引入和表达编码SAUR多肽的核酸来实现。
5.根据项1至4之任一的方法,其中所述编码SAUR多肽的核酸编码表A3或A3(i)中所列的任一蛋白质,或是该核酸的部分,或是能够与该核酸杂交的核酸。
6.根据项1至5之任一的方法,其中所述核酸序列编码表A3或A3(i)中所给出的任何蛋白质的直向同源物或旁系同源物。
7.根据任何前述项的方法,其中所述增强的产量相关性状包括相对于对照植物增加的产量、增加的早期活力、增加的生物量和增加的种子产量之任一或多个。
8.根据项1至7之任一的方法,其中在非胁迫条件下获得所述增强的产量相关性状。
9.根据项1至8之任一的方法,其中在干旱胁迫、盐胁迫或缺氮的条件下获得所述增强的产量相关性状。
10.根据项4至9之任一的方法,其中将所述核酸有效连接到组成型启动子,优选连接到叶特异性启动子,最优选连接到SEQ ID NO:1163所示的启动子。
11.根据项1至9之任一的方法,其中所述编码SAUR多肽的核酸是植物来源的,优选来自双子叶植物,再优选来自十字花科(Brassicaceae),更优选来自拟南芥属(Arabidopsis),最优选来自拟南芥(Arabidopsis thaliana)。
12.可通过根据项1至11之任一的方法获得的植物或其部分,包括种子,其中所述植物或其部分包含编码SAUR多肽的重组核酸。
13.构建体,其包含:
(i)编码如项1至3中定义的SAUR多肽的核酸;
(ii)能够驱动(i)的核酸序列表达的一个或多个控制序列;和任选地
(iii)转录终止序列。
14.根据项13的构建体,其中所述控制序列之一是组成型启动子,优选叶特异性启动子,最优选SEQ ID NO:1163所示的启动子
15.根据项13或14的构建体在用于制备相对于对照植物具有增加的产量,特别是增加的生物量和/或增加的种子产量的植物的方法中的用途。
16.转化了根据项13或14的构建体的植物、植物部分或植物细胞。
17.用于产生相对于对照植物具有增加的产量,特别是增加的生物量和/或增加的种子产量的转基因植物的方法,其包括:
(i)向植物中引入和表达编码如项1至3中定义的SAUR多肽的核酸;和
(ii)在促进植物生长和发育的条件下培养所述植物细胞。
18.相对于对照植物具有增加的产量,特别是增加的生物量和/或增加的种子产量的转基因植物,或源于所述转基因植物的转基因植物细胞,所述增加的产量因编码如项1至3中定义的SAUR多肽的核酸的被调节的表达而产生。
19.根据项12、16或18的转基因植物或源于其的转基因植物细胞,其中所述植物是作物植物或单子叶植物或谷类植物,例如稻、玉米、小麦、大麦、粟、黑麦(rye)、黑小麦、高粱、二粒小麦、斯佩耳特小麦、黑麦属植物(secale)、单粒小麦、埃塞俄比亚画眉草、买罗高梁和燕麦。
20.根据项18的植物的可收获部分,其中所述可收获部分优选是枝条生物量和/或种子。
21.从根据项19的植物和/或从根据项20的植物的可收获部分产生的产品。
22.编码SAUR多肽的核酸在相对于对照植物增加植物的产量,特别是增加种子产量和/或枝条生物量中的用途。
4.SAUR多肽、或SYNP多肽、或SAUR多肽与SYNP多肽的融合
蛋白
1.用于相对于对照植物增强植物的产量相关性状的方法,包括调节编码至少一个SAUR多肽的第一核酸和编码一个或多个SYNP多肽的第二核酸、或编码至少一个SAUR和一个或多个SYNP多肽之间的蛋白质融合物的核酸在植物中的表达,其中第一和第二核酸包含在单个核酸分子或多个(至少两个)核酸分子中。
2.根据项1的方法,其中:
(i)用于本发明方法中的SAUR多肽按照递增的优选次序与表A4的多肽序列之任一所示的氨基酸序列,更优选与SEQ ID NO:1164或其变体所示的氨基酸序列具有至少25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%的全序列同一性;
(ii)用于本发明方法中的SYNP多肽按照递增的优选次序与表E或表F的多肽序列之任一所示的氨基酸序列具有至少25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%的全序列同一性。
3.根据项1或2的方法,其中所述调节的表达通过向植物中引入和表达编码至少一个SAUR多肽的第一核酸和编码一个或多个SYNP多肽的第二核酸、或编码至少一个SAUR和一个或多个SYNP多肽之间的蛋白质融合物的核酸来实现,其中第一和第二核酸包含在单个核酸分子或多个(至少两个)核酸分子中。
4.根据任何前述项的方法,其中所述增强的产量相关性状包括相对于对照植物增加的产量,优选增加的生物量和/或增加的种子产量。
5.根据任何前述项的方法,其中在非胁迫条件下获得所述增强的产量相关性状。
6.根据任何前述项的方法,其中在干旱胁迫、盐胁迫或缺氮的条件下获得所述增强的产量相关性状。
7.根据项3至6之任一的方法,其中所述一个或多个核酸有效地连接到植物启动子,优选连接到组成型启动子,更优选连接到GOS2启动子,最优选连接到来自稻的GOS2启动子。
8.根据任何前述项的方法,其中所述一个或多个核酸是植物来源的,优选来自双子叶植物,再优选来自十字花科(Brassicaceae),更优选来自拟南芥属(Arabidopsis),最优选来自拟南芥(Arabidopsis thaliana)。
9.可通过根据任何前述项的方法获得的植物或其部分,包括种子,其中所述植物或其部分包含:
(i)编码至少一个SAUR多肽的第一核酸,所述SAUR多肽优选选自表A4的多肽或其同源物或衍生物;和
(ii)编码一个或多个SYNP多肽的第二核酸,所述SYNP多肽优选选自表E和F的多肽或其同源物或衍生物;或
(iii)编码(i)和(ii)的任何两个多肽之间的蛋白质融合物的核酸;
其中第一和第二核酸包含在单个核酸分子或多个(至少两个)核酸分子中。
10.构建体,其包含:
(i)编码至少一个SAUR多肽的第一核酸和编码一个或多个SYNP多肽的第二核酸,其中第一和第二核酸包括在单个核酸分子或多个(至少两个)核酸分子中;
(ii)能够驱动(i)中核酸序列表达的一个或多个控制序列,优选植物启动子,更优选组成型启动子,更优选GOS2启动子,最优选来自稻的GOS2启动子;和任选
(iii)转录终止序列。
11.根据项10的构建体在用于制备相对于对照植物具有增加的产量,特别是增加的生物量和/或增加的种子产量的植物的方法中的用途。
12.转化了根据项11的构建体的植物、植物部分或植物细胞。
13.用于产生相对于对照植物具有增加的产量,特别是增加的生物量和/或增加的种子产量的转基因植物的方法,其包括:
(i)向植物中引入和表达编码至少一个SAUR多肽的第一核酸和编码一个或多个SYNP多肽的第二核酸、或编码至少一个SAUR和一个或多个SYNP多肽之间的蛋白质融合物的核酸,其中第一和第二核酸包括在单个核酸分子或多个(至少两个)核酸分子中;和
(ii)在促进植物生长和发育的条件下培养所述植物细胞。
14.相对于对照植物具有增加的产量,特别是增加的生物量和/或增加的种子产量的转基因植物,或源于所述转基因植物的转基因植物细胞,所述增加的产量因编码至少一个SAUR多肽的第一核酸和编码一个或多个SYNP多肽的第二核酸、或编码至少一个SAUR和一个或多个SYNP多肽之间的蛋白质融合物的核酸的被调节的表达而产生,其中第一和第二核酸包括在单个核酸分子或多个(至少两个)核酸分子中。
15.根据项9、12或14的转基因植物或源于其的转基因植物细胞,其中所述植物是作物植物或单子叶植物或谷类植物,例如稻、玉米、小麦、大麦、粟、黑麦(rye)、黑小麦、高粱、二粒小麦、斯佩耳特小麦、黑麦属植物(secale)、单粒小麦、埃塞俄比亚画眉草、买罗高梁和燕麦。
16.根据项15的植物的可收获部分,其中所述可收获部分优选是枝条生物量和/或种子。
17.从根据项14或15的植物和/或从根据项16的植物的可收获部分产生的产品。
18.根据项1的任何一个、两个或更多个核酸在相对于对照植物增加植物的产量,特别是增加种子产量和/或枝条生物量中的用途。
5.脱氢抗坏血酸还原酶(DHAR)多肽
1.用于相对于对照植物增强植物的产量相关性状的方法,包括调节编码DHAR多肽的核酸在植物中的表达,其中所述多肽包含至少具有登录号PTHR11260:SF15的脱氢抗坏血酸还原酶结构域。
2.根据项1的方法,其中DHAR多肽的DHAR结构域按照递增的优选次序与SEQ ID NO:1958中位于第19至210位氨基酸之间的序列具有至少49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、或99%或更高的序列同一性。
3.根据项1的方法,其中所述DHAR多肽包含按照递增的优选次序与下列基序之任一具有至少49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、或99%或更高的序列同一性的基序:
(i)基序35:P[DN]KLGDCPF[SC]QRVLLTLEEK[KH][VL]PY[KD][ML][KH]L[IV](SEQID NO:2238),
(ii)基序36:D[DEG]KW[VI][PAS]DSDVI[TV][QG][IL][LI]EEK[YF]PEP[SP]L[VA]TPPE(SEQ ID NO:2240),
(iii)基序37:P[FY][IV][NA]GE[KN][IV][ST]A[VA]DLSL[AG]PKLYHLE[VI]ALGH[FY]K[KN]W[ST][VI]P(SEQ ID NO:2241)
4.根据项1至3之任一的方法,其中所述DHAR多肽包含按照递增的优选次序与下列基序之任一具有至少49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、或99%或更高的序列同一性的任何一个或多个序列基序:
(i)基序38:E[VI]CVKA[AS]V[CT]AP[DN][KV]LGDCPF[SC]QRVLLTLEE(SEQ IDNO:2242),
(ii)基序39:PPE[FK]ASVGSKIF[PS][TS]F[VI][CT]FLKSKD[PA][NS]DG[TS]EQ(SEQ ID NO:2243),
(iii)基序40:
[IV][ST]A[VA]DLSL[AG]PKLYHL[EQ][VI]ALGH[FY]K[KN]W[ST][VI]P[ED]SL[TP]HV[HK][NS]Y[MT]K[ALS][LI]FS[RL][ED]SF[EV]KT(SEQ ID NO:2243)
5.根据项1至4之任一的方法,其中所述DHAR多肽包含按照递增的优选次序与下列基序之任一具有至少49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、或99%或更高的序列同一性的任何一个或多个序列基序:
(i)基序41:E[IV]CVKAA[VT]GAPD[VIT]LGDCPF[SC]QRVLLTLEE(SEQ ID NO:2244),
(ii)基序42:PPE[FY]ASVGSKIF[PG][ST]FV[TK]FLKSKD[AP][NS]DG[TS]E[QK](SEQ ID NO:2245),
(iii)基序43:
[IV][TS]AVDLSLAPKLYHL[EQ]VAL[GE]HFK[KG]W[TSK][VI]PE[SN]LTHVH[NA]Y[TM]K[LAS]LFSRESFEKT(SEQ ID NO:2246).
6.根据项1至4之任一的方法,其中所述DHAR多肽包含按照递增的优选次序与下列基序之任一具有至少49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、或99%或更高的序列同一性的任何一个或多个序列基序:
(i)基序44:
PLE[VI]C[VA]KAS[ILV]T[TV]P[ND][KR]LGDCPF[TC]QRVLLTLEEKHLPY
[DE][ML]KLVDL[SG]NKP[ED]WF(SEQ ID NO:2247),
(ii)基序45:
PPE[VI][PA]DSDVITQ[AST]LEEK[YF]P[ED]P[PS]L[AV]TPPEKASVGSKIFSTF[IV]GFLKSKDP[SN]DG(SEQ ID NO:2248),
(iii)基序46:
QALL[ND]EL[ST][SA]FNDY[LI]KENGPFINC[KE][KDE][IV]SAADLSL[GA]PKLYH[LM]EIALGH[YF]K[NK]W(SEQ ID NO:2249).
7.根据项1至6之任一的方法,其中DHAR多肽按照递增的优选次序与表A中所示的任何氨基酸序列,优选SEQ ID NO:1958所示的氨基酸序列具有至少25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的全序列同一性。
8.根据项1至7之任一的方法,其中所述调节的表达通过向植物中引入和表达编码如任何前述项所定义的DHAR多肽的核酸来实现。
9.根据项1至8之任一的方法,其中所述编码DHAR多肽的核酸编码表A5中所列的任一蛋白质,或是该核酸的部分,或是能够与该核酸杂交的核酸。
10.根据项1至9之任一的方法,其中所述核酸序列编码表A5中所给出的任何蛋白质的直向同源物或旁系同源物。
11.根据任何前述项的方法,其中所述增强的产量相关性状包括相对于对照植物增加的产量,优选增加的种子产量。
12.根据项1至11之任一的方法,其中在非胁迫条件下获得所述增强的产量相关性状。
13.根据项1至12之任一的方法,其中在干旱胁迫、盐胁迫或缺氮的条件下获得所述增强的产量相关性状。
14.根据项8至10之任一的方法,其中所述核酸有效地连接到组成型启动子,优选连接到GOS2启动子,最优选连接到来自稻的GOS2启动子。
15.根据项1至14之任一的方法,其中所述编码DHAR多肽的核酸是植物来源的。
16.根据项15的方法,其中所述编码DHAR多肽的核酸来自双子叶植物,再优选来自茄科(Solanaceae),更优选来自茄属(Solanum),最优选来自番茄(Solanum lycopersicum)。
17.根据项15的方法,其中所述编码DHAR多肽的核酸来自单子叶植物,再优选来自禾本科(Poaceae),更优选来自稻属(Oryza),最优选核酸来自稻(Oryza sativa)。
18.根据项15的方法,其中所述编码DHAR多肽的核酸来自单子叶植物,再优选来自禾本科(Poaceae),更优选来自大麦属(Hordeum),最优选核酸来自大麦(Hordeum vulgare)。
19.可通过根据项1至18之任一的方法获得的植物或其部分,包括种子,其中所述植物或其部分包含编码DHAR多肽的重组核酸。
20.构建体,其包含:
(i)编码如项1至7中定义的DHAR多肽的核酸;
(ii)能够驱动(i)的核酸序列表达的一个或多个控制序列;和任选地
(iii)转录终止序列。
21.根据项20的构建体,其中所述控制序列之一是组成型启动子,优选GOS2启动子,最优选来自稻的GOS2启动子。
22.根据项20或21的构建体在用于制备相对于对照植物具有增加的产量,特别是增加的种子产量的植物的方法中的用途。
23.转化了根据项20或21的构建体的植物、植物部分或植物细胞。
24.用于产生相对于对照植物具有增加的产量,特别是增加的生物量和/或增加的种子产量的转基因植物的方法,其包括:
(i)向植物中引入和表达编码如项1至7中定义的DHAR多肽的核酸;和
(ii)在促进植物生长和发育的条件下培养所述植物细胞。
25.相对于对照植物具有增加的产量,特别是增加的生物量和/或增加的种子产量的转基因植物,或源于所述转基因植物的转基因植物细胞,所述增加的产量因编码如项1至7中定义的DHAR多肽的核酸的被调节的表达而产生。
26.根据项19、23或25的转基因植物或源于其的转基因植物细胞,其中所述植物是作物植物或单子叶植物或谷类植物,例如稻、玉米、小麦、大麦、粟、黑麦(rye)、黑小麦、高粱、二粒小麦、斯佩耳特小麦、黑麦属植物(secale)、单粒小麦、埃塞俄比亚画眉草、买罗高梁和燕麦。
27.根据项26的植物的可收获部分,其中所述可收获部分优选是种子。
28.从根据项26的植物和/或从根据项27的植物的可收获部分产生的产品。
29.编码DHAR多肽的核酸在相对于对照植物增强植物的产量特性,特别是增加种子产量中的用途。
30.分离的核酸分子,其选自:
(i)SEQ ID NO:1997、SEQ ID NO:2121和SEQ ID NO:2193所示的核酸;
(ii)SEQ ID NO:1997、SEQ ID NO:2121和SEQ ID NO:2193所示核酸的互补序列;
(iii)编码SEQ ID NO:1998、SEQ ID NO:2122和SEQ ID NO:2194之任一所示的DHAR多肽的核酸,优选地由于遗传密码子简并性的结果,所述分离的核酸可以源自所述SEQ IDs之任一所示多肽序列,并优选地还赋予相对于对照植物增强的产量相关性状。
(iv)按照递增的优选次序,与表A5的任何核酸序列具有至少50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或更高的序列同一性,且优选地还赋予相对于对照植物增强的产量相关性状的核酸;
(v)在严紧杂交条件下与(i)至(iv)的核酸分子杂交并优选赋予相对于对照植物增强的产量相关性状的核酸分子;
(vi)编码DHAR多肽的核酸,所述多肽按照递增的优选次序与SEQID NO:1998、SEQ ID NO:2122和SEQ ID NO:2194之任一和表A5中任何其它氨基酸序列具有至少50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或更高的序列同一性并优选赋予相对于对照植物增强的产量相关性状。
31.根据本发明的另一个实施方案,也提供了分离的多肽,其选自:
(i)SEQ ID NO:1998、SEQ ID NO:2122和SEQ ID NO:2194所示的氨基酸序列;
(ii)按照递增的优选次序与SEQ ID NO:Y所示的氨基酸序列具有至少50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或更高的序列同一性,且按照递增的优选次序与SEQ ID NO:1998、SEQ ID NO:2122和SEQ ID NO:2194具有至少50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或更高的序列同一性的氨基酸序列;
(iii)上文(i)或(ii)所给出的任何氨基酸序列的衍生物。
附图说明
现参考以下附图描述本发明,其中:
图1显示具有保守结构域PF02812和PF00208的SEQ ID NO:2的结构域结构。
图2显示多种GDH多肽的多重比对。图2a显示类型I GDH多肽的比对,图2b显示类型II GDH多肽的比对,图2c显示藻类GDH多肽的比对,图2d显示苔藓GDH多肽的比对。星号表示在多种蛋白质序列中相同的氨基酸,冒号表示高度保守的氨基酸取代,点表示较低保守的氨基酸取代;在其它位置上没有序列保守性。当利用保守氨基酸时,这些比对可用于定义另外的基序。
图3显示GDH多肽的系统发生树。使用MUSCLE(Edgar(2004),Nucleic Acids Research 32(5):1792-97)比对蛋白质。使用QuickTree(Howe等.(2002),Bioinformatics 18(11):1546-7)计算邻接树。显示在100次自展重复后主分枝的支持率。使用Dendroscope(Huson等.(2007),BMC Bioinformatics 8(1):460)绘制环状系统发生图。类型I为常规EC1.4.1.2分支,该分支被分为α和β亚基。几个苔藓GDH序列与类型I的DGH序列聚类,它们同等地可以用于本发明方法中。
图4显示双元载体,用于在稻GOS2启动子(pGOS2)控制之下增加GDH编码核酸在稻(Oryza sativa)中的表达。用于在稻RCc3启动子控制下的GDH表达的载体,除了该启动子序列以外,具有相同的结构。
图5显示双元载体,用于在稻GOS2启动子(pGOS2)控制之下增加FLA样编码核酸在稻(Oryza sativa)中的表达。
图6显示双元载体,用于在包含SEQ ID NO:1163所示序列的叶特异性启动子控制之下增加SAUR编码核酸在稻(Oryza sativa)中的表达。
图7显示番茄中L-抗坏血酸生物合成和氧化途径的一部分,其显示了DHAR的作用。
图8显示DHAR多肽的系统发生树。H.vulgare_c62776255(CHL),H.vulgare_gi_21150952(CYT),S.lycopersicum_TC196877(CYT)和S.lycopersicum_AY971874(CHL);CHL=叶绿体;CYT=胞质。
图9显示双元载体,用于在稻GOS2启动子(pGOS2)控制之下增加DHAR编码核酸在稻(Oryza sativa)中的表达。
实施例
现参考以下实施例描述本发明,所述实施例仅意在举例说明。如下实施例并非旨在完全限定或以其他方式限制本发明的范围。
DNA操作:除非另外说明,重组DNA技术根据描述于(Sambrook(2001)《分子克隆:实验室手册》,第三版,冷泉港实验室出版,冷泉港,纽约)或者Ausubel等(1994),Current Protocols in Molecular Biology,Current Protocols第一卷和第二卷的标准方案进行。用于植物分子工作的标准材料和方法由R.D.D.Croy描述于Plant Molecular Biology Labfase(1993),由BIOS Scientific Publications Ltd(UK)和Blackwell ScientificPublications(UK)出版。
实施例1:鉴定与本发明方法所用核酸序列相关的序列
利用了数据库序列搜索工具,例如基本局部比对工具(BLAST)(Altschul等(1990)J.Mol.Biol.215:403-410;和Altschul等(1997)NucleicAcids Res.25:3389-3402),在美国国家生物技术信息中心(NCBI)的Entrez核苷酸数据库所保持的序列中,鉴定了与用于本发明方法的核酸序列相关的序列(全长cDNA、EST或基因组序列)。该程序通过将核酸或多肽序列与序列数据库进行比较,以及通过计算匹配的统计学显著性,用于寻找序列之间的局部相似的区域。例如,在TBLASTN算法中,利用了用于本发明的核酸编码的多肽,其中使用默认设置,开启过滤器以忽略低复杂度序列。分析的输出视窗为两两比较,并根据概率分值(E值)排序,其中分值反映特定比对偶然发生的概率(E值越低,命中事件的显著性越高)。除了E值之外,还对比较进行同一性百分比记分。同一性百分比是指两比较核酸(或多肽)序列之间在特定长度上的相同核苷酸(或氨基酸)数。在一些情况下,可调整缺省参数来改变搜索的严格性。例如增加E值以显示不太严格的匹配。这样,可鉴定到短的几乎完全的匹配。
1.谷氨酸脱氢酶(GDH)多肽
表A1提供了与用于本发明方法的核酸序列相关的核酸序列的列表。
表A1:GDH多肽的实例:
在一些情况下,相关序列已经由研究机构如基因组研究机构(Institutefor Genomic Research,TIGR;始于TA)尝试性地进行了装配并向公众公开。可以通过关键词搜索,或是采用BLAST算法,运用目的核酸序列或多肽序列,利用真核基因直向同源物(Eukaryotic Gene Orthologs,EGO)数据库来鉴定这样的相关序列。在其他情况下,已经针对特定的生物创建了特定的核酸序列数据库,例如由联合基因组研究所(Joint GenomeInstitute)创建。此外,对私有数据库的使用也已允许鉴定新型核酸和多肽序列。
2.成束蛋白样AGP(FLA)多肽
表A2提供了与SEQ ID NO:171和SEQ ID NO:172相关的核酸序列的列表。
表A2:FLA样核酸和多肽的实例:
序列已经由研究机构如基因组研究机构(Institute for Genomic Research,TIGR;始于TA)尝试性地进行了装配并向公众公开。可以通过关键词搜索,或是采用BLAST算法,运用目的核酸序列或多肽序列,利用真核基因直向同源物(Eukaryotic Gene Orthologs,EGO)数据库来鉴定这样的相关序列。已经针对特定的生物创建了特定的核酸序列数据库,例如由联合基因组研究所(Joint Genome Institute)创建。此外,对私有数据库的使用也已允许鉴定新型核酸和多肽序列。
3.生长素上调小RNA(SAUR)多肽
表A3提供了与SEQ ID NO:501和SEQ ID NO:502相关的核酸序列的列表。
表A3:SAUR多肽的实例:
表A3(i):SAUR多肽的例子:
序列已经由研究机构如基因组研究机构(Institute for Genomic Research,TIGR;始于TA)尝试性地进行了装配并向公众公开。可以通过关键词搜索,或是采用BLAST算法,运用目的核酸序列或多肽序列,利用真核基因直向同源物(Eukaryotic Gene Orthologs,EGO)数据库来鉴定这样的相关序列。已经针对特定的生物创建了特定的核酸序列数据库,例如由联合基因组研究所(Joint Genome Institute)创建。此外,对私有数据库的使用也已允许鉴定新型核酸和多肽序列。
4.SAUR多肽、或SYNP多肽、或SAUR多肽与SYNP多肽的融合蛋
白
表A4提供了与SEQ ID NO:1163和SEQ ID NO:1164相关的核酸序列的列表。
表A4:SAUR多肽的实例:
序列已经由研究机构如基因组研究机构(Institute for Genomic Research,TIGR;始于TA)尝试性地进行了装配并向公众公开。可以通过关键词搜索,或是采用BLAST算法,运用目的核酸序列或多肽序列,利用真核基因直向同源物(Eukaryotic Gene Orthologs,EGO)数据库来鉴定这样的相关序列。已经针对特定的生物创建了特定的核酸序列数据库,例如由联合基因组研究所(Joint Genome Institute)创建。此外,对私有数据库的使用也已允许鉴定新型核酸和多肽序列。
5.脱氢抗坏血酸还原酶(DHAR)多肽
表A5提供了与SEQ ID NO 1957和SEQ ID NO 1958相关的核酸序列的列表。
表A5:DHAR核酸和多肽的实例:
序列已经由研究机构如基因组研究机构(Institute for Genomic Research,TIGR;始于TA)尝试性地进行了装配并向公众公开。可以通过关键词搜索,或是采用BLAST算法,运用目的核酸序列或多肽序列,利用真核基因直向同源物(Eukaryotic Gene Orthologs,EGO)数据库来鉴定这样的相关序列。已经针对特定的生物创建了特定的核酸序列数据库,例如由联合基因组研究所(Joint Genome Institute)创建。此外,对私有数据库的使用也已允许鉴定新型核酸和多肽序列。
实施例2:比对与本发明方法所用的多肽序列相关的序列
1.谷氨酸脱氢酶(GDH)多肽
在以MUSCLE(Edgar(2004),Nucleic Acids Research 32(5):1792-97)比对GDH多肽后,构建GDH多肽的系统发生树(图3)。使用Quick-Tree(Howe等.(2002),Bioinformatics 18(11):1546-7)计算邻接树。使用Dendroscope(Huson等.(2007),BMC Bioinformatics 8(1):460)绘制环状系统发生图。该树显示了GDH多肽内亚组的清楚界定:类型I、类型II、藻类和苔藓GDH蛋白。在类型I内,α和β亚基多肽聚类在一起。上文表A列出了每个序列所属的亚组。
当对亚组的蛋白质进行比对时,序列的保守性高,如图2中所示;比对利用Clustal W 2.0渐近比对算法(Thompson等(1997)Nucleic Acids Res 25:4876-4882;Chenna等(2003).Nucleic Acids Res 31:3497-3500),使用标准设置(慢比对,相似性矩阵:Gonnet、空位开放罚分10,空位延伸罚分0.2))来进行。进行微小的手工编辑以进一步优化比对。根据这些比对,本领域技术人员可以容易地获得用于鉴定可用于本发明方法的其它GDH蛋白的基序,特别是包含相同氨基酸(以星号标示的)或具有保守取代(以冒号或点标示)的氨基酸区段。
2.成束蛋白样AGP(FLA)多肽
多肽序列的比对利用Clustal W 2.0渐近比对算法(Thompson等(1997)Nucleic Acids Res 25:4876-4882;Chenna等(2003).Nucleic Acids Res 31:3497-3500),使用标准设置(慢比对,相似性矩阵:Gonnet(或Blosum 62(如果比对多肽))、空位开放罚分10,空位延伸罚分0.2))来进行。
使用Vector NTI(Invitrogen)的AlignX程序中提供的邻接聚类算法,构建了FLA样多肽的系统发生树。
3.生长素上调小RNA(SAUR)多肽
多肽序列的比对利用Clustal W 2.0渐近比对算法(Thompson等(1997)Nucleic Acids Res 25:4876-4882;Chenna等(2003).Nucleic Acids Res 31:3497-3500),使用标准设置(慢比对,相似性矩阵:Gonnet(或Blosum 62(如果比对多肽))、空位开放罚分10,空位延伸罚分0.2))来进行。进行微小的手工编辑以进一步优化比对。
4.SAUR多肽、或SYNP多肽、或SAUR多肽与SYNP多肽的融合
蛋白
多肽序列的比对利用Clustal W 2.0渐近比对算法(Thompson等(1997)Nucleic Acids Res 25:4876-4882;Chenna等(2003).Nucleic Acids Res 31:3497-3500),使用标准设置(慢比对,相似性矩阵:Gonnet(或Blosum 62(如果比对多肽))、空位开放罚分10,空位延伸罚分0.2))来进行。进行微小的手工编辑以进一步优化比对。
5.脱氢抗坏血酸还原酶(DHAR)多肽
采用MAFFT(Katoh和Toh(2008)Briefings in Bioinformatics 9:286-298)进行比对。使用QuickTree(Howe等.(2002),Bioinformatics 18(11):1546-7)计算邻接树,100次自展重复。使用Dendroscope(Huson等.(2007),BMC Bioinformatics 8(1):460)绘制环状系统发生图–图8。显示主分枝的100次自展重复的置信水平。
实施例3:计算可以用于实施本发明方法的多肽序列之间的全局同一性百分比
用于本发明方法的全长多肽序列之间的全局相似性和同一性百分比,利用本领域可获得的方法之一MatGAT(矩阵全局比对工具)软件(BMC Bioinformatics.2003 4:29.MatGAT:an application that generates similarity/identity matrices using protein or DNA sequences.Campanella JJ,Bitincka L,Smalley J;软件由Ledion Bitincka托管)来确定。MatGAT软件无需对数据进行预比对,即可产生DNA或蛋白质序列的相似性/同一性矩阵。该程序利用Myers和Miller全局比对算法(空位开放罚分为12,而空位延伸罚分为2)进行一系列的两两比对,利用例如Blosum 62(对于多肽而言)计算相似性和同一性,然后将结果排列成距离矩阵。序列相似性示于对角线下半部,而序列同一性示于对角线上半部。
1.谷氨酸脱氢酶(GDH)多肽
比较所用的参数为:
记分矩阵:Blosum 62
首个空位:12
延伸空位:2
来自类型I和苔藓亚组的多肽序列全长范围的全局相似性和同一性的分析结果示于表B1中。同一性百分比示于对角线上方,而相似性百分比示于对角线下方。
表B1:类型I和苔藓亚组内多肽序列全长范围的全局相似性和同一性的MatGAT结果。
SEQ ID NO:2(AY106054第48行)与类型I和苔藓亚组内其它GDH多肽序列之间的百分比同一性不低于73%,而SEQ ID NO:110(Os02g0650900第11行)与类型I和苔藓亚组内其它GDH多肽序列之间的百分比同一性不低于72%,这表明高度的序列保守性。在GDH蛋白的α亚基亚类内的序列的最小同一性为75%。GDH的β亚基亚类内的最小同一性为82%。α和β亚基亚组之间的同一性为75至85%。大多数α和β亚基序列与AY106054和Os02g0650900具有80%或更高的同一性。类型II的GDH蛋白内的最小同一性为26%。
2.生长素上调小RNA(SAUR)多肽
比较所用的参数为:
记分矩阵:Blosum 62
首个空位:12
延伸空位:2
多肽序列全长范围的全局相似性和同一性的软件分析结果示于表B2中。选自表A3的SAUR多肽序列之间的序列同一性(%)。与SEQ ID NO:502(A.thaliana_AT2G21210)相比较,用于实施本发明方法的SAUR多肽通常高于22.8%。
表B2:多肽序列全长范围的全局相似性和同一性的MatGAT结果。
1. | 2. | 77. | 111. | 112. | 113. | 114. | 128. | |
1.O.sativa_OsSAUR1 | 31,7 | 23,9 | 26 | 22,8 | 26,5 | 24,8 | 23,4 | |
2.O.sativa_OsSAUR2 | 38,5 | 30,1 | 22,8 | 25,8 | 23,6 | 24,8 | 22,1 | |
77.A.thaliana_AT2G21210 | 44,9 | 41,8 | 49 | 68,9 | 49,5 | 43,6 | 39,4 | |
112.A.thaliana_AT4G38840 | 42,4 | 41 | 82,8 | 69,7 | 53,5 | 46,2 | 41,9 | |
113.A.thaliana_AT4G38850 | 47,3 | 35,2 | 68,4 | 77,5 | 68,7 | 43,5 | 39,8 | |
114.A.thaliana_AT4G38860 | 40 | 41,8 | 65,7 | 52,4 | 62,9 | 58,1 | 57,5 | |
128.A.thaliana_AT5G66260 | 38,4 | 36,9 | 57,6 | 55,6 | 56,6 | 55,6 | 67,6 |
3.SAUR多肽、或SYNP多肽、或SAUR多肽与SYNP多肽的融合
蛋白
多肽序列全长范围的全局相似性和同一性的软件分析结果示于表B3中。选自表A4的SAUR多肽序列之间的序列同一性(%)。与SEQ ID NO:1164(A.thaliana_AT2G21210)相比较,用于实施本发明方法的SAUR多肽通常高于22.8%。
表B3:多肽序列全长范围的全局相似性和同一性的MatGAT结果。
1. | 2. | 77. | 111. | 112. | 113. | 114. | 128. | |
1.O.sativa_OsSAUR1 | 31,7 | 23,9 | 26 | 22,8 | 26,5 | 24,8 | 23,4 | |
2.O.sativa_OsSAUR2 | 38,5 | 30,1 | 22,8 | 25,8 | 23,6 | 24,8 | 22,1 | |
77.A.thaliana_AT2G21210 | 44,9 | 41,8 | 49 | 68,9 | 49,5 | 43,6 | 39,4 | |
112.A.thaliana_AT4G38840 | 42,4 | 41 | 82,8 | 69,7 | 53,5 | 46,2 | 41,9 | |
113.A.thaliana_AT4G38850 | 47,3 | 35,2 | 68,4 | 77,5 | 68,7 | 43,5 | 39,8 | |
114.A.thaliana_AT4G38860 | 40 | 41,8 | 65,7 | 52,4 | 62,9 | 58,1 | 57,5 | |
128.A.thaliana_AT5G66260 | 38,4 | 36,9 | 57,6 | 55,6 | 56,6 | 55,6 | 67,6 |
4.脱氢抗坏血酸还原酶(DHAR)多肽
比较所用的参数为:
记分矩阵:Blosum 62
首个空位:12
延伸空位:2
多肽序列全长范围的全局相似性和同一性的软件分析结果示于表B4
与SEQ ID NO:1958相比较,用于实施本发明方法的DHAR多肽序列之间的百分比同一性可以低至49%的氨基酸同一性。
表B4:多肽序列全长范围的全局相似性和同一性的MatGAT结果。
名称 | 101 | 102 | 103 | 104 | 105 | 106 | 107 | 108 | 109 | 110 |
101.S.aethnensis_TA30_121540 | 52,6 | 70,4 | 78,5 | 75,2 | 74,8 | 66,7 | 69,8 | 75,7 | 83,7 | |
102.S.bicolor_Sb09g001690.1 | 64 | 55,4 | 55,8 | 55,4 | 62,2 | 65,2 | 55,1 | 51,3 | ||
103.S.bicolor_Sb09g001700.1 | 74,3 | 69,6 | 69,2 | 95,8 | 82,7 | 71 | 69,8 | |||
104.S.indicum_DQ287974 | 78,3 | 78,3 | 70,6 | 72,8 | 79,7 | 78,4 | ||||
105.S.lycopersicum_TC196877 | 97,6 | 67,5 | 72,3 | 75,9 | 72,3 | |||||
106.S.tuberosum_TC167795 | 67 | 71,4 | 75,9 | 72,3 | ||||||
107.T.aestivum_CA484858 | 79 | 67,3 | 66 | |||||||
108.T.aestivum_TC278165 | 73,2 | 67,8 | ||||||||
109.T.hispida_TA863_189793 | 76,1 | |||||||||
11O.T.kok-saghyz_TA971_333970 |
实施例4:鉴定可以用于实施本发明方法的多肽序列中所含的结构域
蛋白质家族、结构域和位点整合资源(Integrated Resource 0f ProteinFamilies,Domains and Sites(InterPro))数据库是进行基于文本以及序列的搜索的、常用标签数据库的一个整合界面。InterPro数据库将这些数据库结合起来,这些数据库利用不同的方法学和有关充分表征的蛋白质的不同程度的生物信息来产生蛋白质标签。合作数据库包括SWISS-PROT、PROSITE、TrEMBL、PRINTS、ProDom和Pfam、Smart和TIGRFAMs。Pfam是覆盖许多常见蛋白质结构域和家族的、多重序列比对和隐马尔可夫模型的大集合。Pfam由位于英国的桑格研究所服务器(Sanger Institute server)托管。Interpro由位于英国的欧洲生物信息学研究所(European Bioinformatics Institute)托管。
1.谷氨酸脱氢酶(GDH)多肽
SEQ ID NO:2所示的多肽序列的InterPro扫描结果示于表C1中。
表C1:SEQ ID NO:2所示的多肽序列的InterPro扫描结果(主登录号)。
2.成束蛋白样AGP(FLA)多肽
SEQ ID NO:172所示的多肽序列的Pfam搜索结果示于表C2中。
表C2:SEQ ID NO:172所示的多肽序列的InterPro扫描结果(主登录号)。
作为替代地,通过搜索或扫描InterPro数据库可以发现保守的结构域。蛋白质家族、结构域和位点整合资源(Integrated Resource of ProteinFamilies,Domains and Sites(InterPro))数据库是进行基于文本以及序列的搜索的、常用标签数据库的一个整合界面。InterPro数据库将这些数据库结合起来,这些数据库利用不同的方法学和有关充分表征的蛋白质的不同程度的生物信息来产生蛋白质标签。合作数据库包括SWISS-PROT、PROSITE、TrEMBL、PRINTS、ProDom和Pfam、Smart和TIGRFAMs。
3.生长素上调小RNA(SAUR)多肽
SEQ ID NO:502所示的多肽序列的InterPro扫描结果示于表C3中.
表C3:SEQ ID NO:502所示的多肽序列的InterPro扫描结果(主登录号)。
生长素可诱导结构域也称为生长素响应的。
4.SAUR多肽、或SYNP多肽、或SAUR多肽与SYNP多肽的融合
蛋白
SEQ ID NO:1164所示的多肽序列的InterPro扫描结果示于表C4中。
表C4:SEQ ID NO:1164所示的多肽序列的InterPro扫描结果(主登录号)。
生长素可诱导结构域也称为生长素响应的。
5.脱氢抗坏血酸还原酶(DHAR)多肽
SEQ ID NO:1958所示的多肽序列的InterPro扫描结果示于表C5中。
表C5:SEQ ID NO:1958所示的多肽序列的InterPro扫描结果(主登录号)。
实施例5:用于实施本发明方法的多肽序列的拓扑学预测
1.谷氨酸脱氢酶(GDH)多肽
TargetP 1.1预测真核蛋白质的亚细胞定位。位置分配所基于的是如下任一N-末端前序列的预测性存在:叶绿体转运肽(cTP)、线粒体靶向肽(mTP)或分泌途径信号肽(SP)。最终预测所基于的分值并非真正的概率,且加起来并不必为1。不过,根据TargetP,得分最高的定位是最可能的,且分值之间的关系(可靠性级别)可作为所述预测的可靠性的指标。可靠性级别(RC)范围从1到5,其中1表示最强的预测。TargetP由丹麦技术大学(Technical University of Denmark)的服务器维护。
对于经预测包含N末端前序列的序列,还可预测潜在切割位点。
可以选择许多参数,例如生物组别(非植物或植物)、截断值设置(无、预定的截断值设置、或用户指定的截断值设置)和预测切割位点的计算(是或否)。
SEQ ID NO:2所示多肽序列的TargetP 1.1分析结果显示于表D1。选择了“植物”生物组别,规定无截断值,要求预测长度的转运肽。未预测到多肽序列的特定的亚细胞定位。
表D1:SEQ ID NO:2所示多肽序列的TargetP 1.1分析。缩写词:Len,长度;cTP,叶绿体转运肽;mTP,线粒体转运肽,SP,分泌途径信号肽,other,其它亚细胞靶向,Loc,预测的定位;RC,可靠级别;TPlen,预测的转运肽长度。
当使用其它算法时,预测到线粒体定位(例如psort:线粒体:0.508,胞质0.450;MitoP2:0.6568),这与文献的数据一致。
许多其他算法可用于实施此类分析,包括:
-在丹麦技术大学的服务器上托管的ChloroP 1.1;
-在澳大利亚布里斯班的昆士兰大学分子生物科学学院(Institute forMolecular Bioscience)的服务器上托管的Protein Prowler SubcellularLocalisation Predictor 1.2版;
-在Edmonton,Alberta,Canada的阿尔伯特大学(University ofAlberta)的服务器上托管的PENCE Proteome Analyst PA-GOSUB 2.5;
-在丹麦技术大学的服务器上托管的TMHMM;
-PSORT(URL:psort.org)
-PLOC(Park和Kanehisa,Bioinformatics,19,1656-1663,2003)。
2.成束蛋白样AGP(FLA)多肽
TargetP 1.1预测真核蛋白质的亚细胞定位。位置分配所基于的是如下任一N-末端前序列的预测性存在:叶绿体转运肽(cTP)、线粒体靶向肽(mTP)或分泌途径信号肽(SP)。最终预测所基于的分值并非真正的概率,且加起来并不必为1。不过,根据TargetP,得分最高的定位是最可能的,且分值之间的关系(可靠性级别)可作为所述预测的可靠性的指标。可靠性级别(RC)范围从1到5,其中1表示最强的预测。TargetP由丹麦技术大学(Technical University of Denmark)的服务器维护。
FLA样多肽典型地被发现锚定于膜上,更通常于质膜上。
3.生长素上调小RNA(SAUR)多肽
TargetP 1.1预测真核蛋白质的亚细胞定位。位置分配所基于的是如下任一N-末端前序列的预测性存在:叶绿体转运肽(cTP)、线粒体靶向肽(mTP)或分泌途径信号肽(SP)。最终预测所基于的分值并非真正的概率,且加起来并不必为1。不过,根据TargetP,得分最高的定位是最可能的,且分值之间的关系(可靠性级别)可作为所述预测的可靠性的指标。可靠性级别(RC)范围从1到5,其中1表示最强的预测。TargetP由丹麦技术大学(Technical University of Denmark)的服务器维护。
对于经预测包含N末端前序列的序列,还可预测潜在切割位点。
作为替代地,许多其他算法可用于实施此类分析,包括:
-在丹麦技术大学的服务器上托管的ChloroP 1.1;
-在澳大利亚布里斯班的昆士兰大学分子生物科学学院(Institute forMolecular Bioscience)的服务器上托管的Protein Prowler Subcellular Localisation Predictor 1.2版;
-在Edmonton,Alberta,Canada的阿尔伯特大学(University of Alberta)的服务器上托管的PENCE Proteome Analyst PA-GOSUB 2.5;
-在丹麦技术大学的服务器上托管的TMHMM;
-PSORT(URL:psort.org)
-PLOC(Park和Kanehisa,Bioinformatics,19,1656-1663,2003)。
4.SAUR多肽、或SYNP多肽、或SAUR多肽与SYNP多肽的融合
蛋白
TargetP 1.1预测真核蛋白质的亚细胞定位。位置分配所基于的是如下任一N-末端前序列的预测性存在:叶绿体转运肽(cTP)、线粒体靶向肽(mTP)或分泌途径信号肽(SP)。最终预测所基于的分值并非真正的概率,且加起来并不必为1。不过,根据TargetP,得分最高的定位是最可能的,且分值之间的关系(可靠性级别)可作为所述预测的可靠性的指标。可靠性级别(RC)范围从1到5,其中1表示最强的预测。TargetP由丹麦技术大学(Technical University of Denmark)的服务器维护。
对于经预测包含N末端前序列的序列,还可预测潜在切割位点。
作为替代地,许多其他算法可用于实施此类分析,包括:
-在丹麦技术大学的服务器上托管的ChloroP 1.1;
-在澳大利亚布里斯班的昆士兰大学分子生物科学学院(Institute forMolecular Bioscience)的服务器上托管的Protein Prowler Subcellular Localisation Predictor 1.2版;
-在Edmonton,Alberta,Canada的阿尔伯特大学(University of Alberta)的服务器上托管的PENCE Proteome Analyst PA-GOSUB 2.5;
-在丹麦技术大学的服务器上托管的TMHMM;
-PSORT(URL:psort.org)
-PLOC(Park和Kanehisa,Bioinformatics,19,1656-1663,2003)。
5.脱氢抗坏血酸还原酶(DHAR)多肽
TargetP 1.1预测真核蛋白质的亚细胞定位。位置分配所基于的是如下任一N-末端前序列的预测性存在:叶绿体转运肽(cTP)、线粒体靶向肽(mTP)或分泌途径信号肽(SP)。最终预测所基于的分值并非真正的概率,且加起来并不必为1。不过,根据TargetP,得分最高的定位是最可能的,且分值之间的关系(可靠性级别)可作为所述预测的可靠性的指标。可靠性级别(RC)范围从1到5,其中1表示最强的预测。TargetP由丹麦技术大学(Technical University of Denmark)的服务器维护。
对于经预测包含N末端前序列的序列,还可预测潜在切割位点。
许多其他算法可用于实施此类分析,包括:
-在丹麦技术大学的服务器上托管的ChloroP 1.1;
-在澳大利亚布里斯班的昆士兰大学分子生物科学学院(Institute forMolecular Bioscience)的服务器上托管的Protein Prowler Subcellular Localisation Predictor 1.2版;
-在Edmonton,Alberta,Canada的阿尔伯特大学(University of Alberta)的服务器上托管的PENCE Proteome Analyst PA-GOSUB 2.5;
-在丹麦技术大学的服务器上托管的TMHMM;
-PSORT(URL:psort.org)
-PLOC(Park和Kanehisa,Bioinformatics,19,1656-1663,2003)。
实施例6:与用于实施本发明方法的多肽序列相关的测定法
1.谷氨酸脱氢酶(GDH)多肽
在液氮中研磨组织,于5倍体积的GDH提取缓冲液(100mM Tris[pH 8.0],2mM EDTA,5%不溶性PVPP,5%可溶的PVP-40,1mM DTT,1mM还原性谷胱甘肽,0.1%v/v Triton X-100)中进行提取,通过离心(13,000g,15分钟,4℃)澄清提取物。
可以在氨化和脱氨两个方向上测定GDH活性。标准的氨化反应混合物包含100mM Tris-HCl,pH 8.0,20mMα-酮戊二酸,200mM NH4Cl,1mM CaCl2,0.2mM NAD(P)H,酶溶液,和去离子水至终体积为1立方厘米。标准的脱氨反应混合物包含100mM Tris-HCl,pH 9.3,100mM L-Glu,1mM NAD(P)+,0.5mM CaCl2,酶溶液,和去离子水至终体积为1立方厘米。所有的测定均在30℃下进行。使用Perkin-Elmer UV/VIS分光光度计,测定340nm处吸收值的改变。一个单位的GDH活性定义为在30℃每分钟1mmol的辅酶[分别为NAD(P)+,NAD(P)H]的还原或氧化。
2.成束蛋白样AGP(FLA)多肽
可以按Johnson等,Plant Physiol.(2003)133(4)1911–1925的描述检测FLA样多肽的N-糖基化活性。
3.脱氢抗坏血酸还原酶(DHAR)多肽
用于DAHR多肽的功能测定试验描述于:Kato,Y.(1997)-Plant Cell Physiol.38(2):173-178。
实施例7:用于本发明方法的核酸序列的克隆
1.谷氨酸脱氢酶(GDH)多肽
a)克隆Zm_GDH(SEQ ID NO:1/2)
使用定制的玉米(Zea mays)幼苗cDNA文库(在pCMV Sport 6.0中;Invitrogen,Paisley,UK)作为模板,通过PCR扩增用于本发明方法的核酸序列。在标准条件下使用Hifi Taq DNA聚合酶,在50μl PCR mix中使用200ng模板进行PCR。使用的引物是:prm7065(SEQ ID NO:27;有义,起始密码子以加粗表示):5’-ggggacaagtttgtacaaaaaagcaggcttaaacaatgaatgcattggcagca-3’和prm7066(SEQ ID NO:28;反向,互补):5’-ggggaccactttgta caagaaagctgggtggaggtcatgcttcccatc-3’,其包括用于Gateway重组的AttB位点。也使用标准方法纯化扩增的PCR片段。接着进行Gateway操作的第一步,即BP反应,在此期间PCR片段与pDONR201质粒体内重组以产生Gateway术语所称的“进入(entry)克隆”,pZmGDH。作为技术一部分的质粒pDONR201购自Invitrogen。
含有SEQ ID NO:1的进入克隆随后与用于稻转化的Destination载体一起用于LR反应。此载体在T-DNA边界内包含如下功能性元件:植物可选择的标记;可筛选的标记表达盒;和旨在与已克隆到进入克隆中的目的核酸序列进行LR体内重组的Gateway盒。用于组成型特异表达的稻GOS2启动子(SEQ ID NO:23)(或用于根特异表达的稻RCc3启动子(SEQ ID NO:24))位于此Gateway盒的上游。
在LR重组步骤之后,根据本领域公知的方法,将所产生的表达载体pGOS2::ZmGDH(图4)或pRCc3::ZmGDH转化到农杆菌菌株LBA4044中。
b)克隆Os_GDH(SEQ ID NO:39/116)
使用定制的稻(Oryza sativa)幼苗cDNA文库(在pCMV Sport 6.0中;Invitrogen,Paisley,UK)作为模板,通过PCR扩增用于本发明方法的核酸序列。在标准条件下使用Hifi Taq DNA聚合酶,在50μl PCR mix中使用200ng模板进行PCR。使用的引物是:prm7063(SEQ ID NO:25;有义,起始密码子以加粗表示):5’-ggggacaagtttgtacaaaaaagcaggcttaaacaatgaacgcgctagccg-3’and prm7064(SEQ ID NO:26;反向,互补):5’-ggggaccactttgtacaagaaagctgggtcctcaacagattctcatgcc t-3’,其包括用于Gateway重组的AttB位点。也使用标准方法纯化扩增的PCR片段。接着进行Gateway操作的第一步,即BP反应,在此期间PCR片段与pDONR201质粒体内重组以产生Gateway术语所称的“进入(entry)克隆”,pOsGDH。作为技术一部分的质粒pDONR201购自Invitrogen。
含有SEQ ID NO:39的进入克隆随后与用于稻转化的Destination载体一起用于LR反应。此载体在T-DNA边界内包含如下功能性元件:植物可选择的标记;可筛选的标记表达盒;和旨在与已克隆到进入克隆中的目的核酸序列进行LR体内重组的Gateway盒。用于组成型特异表达的稻GOS2启动子(SEQ ID NO:23)(或用于根特异表达的稻RCc3启动子(SEQ ID NO:24))位于此Gateway盒的上游。
在LR重组步骤之后,根据本领域公知的方法,将所产生的表达载体pGOS2::OsGDH或pRCc3::OsGDH转化到农杆菌菌株LBA4044中。
2.成束蛋白样AGP(FLA)多肽
使用定制的番茄(Lycopersicum esculentum)幼苗cDNA文库(在pCMVSport 6.0中;Invitrogen,Paisley,UK)作为模板,通过PCR扩增核酸序列。在标准条件下使用Hifi Taq DNA聚合酶,在50μl PCR mix中使用200ng模板进行PCR。使用的引物是(在SEQ ID NO:498中;有义):5’-ggggacaagtttgtacaaaaaagcaggcttaaacaatgcagcttccgtcgtc-3’和(在SEQID NO:499中;反向,互补):5’-ggggaccactttgtacaagaaagctgggtttctttttcaaacttccatcaa-3’,其包括用于Gateway重组的AttB位点。也使用标准方法纯化扩增的PCR片段。接着进行Gateway操作的第一步,即BP反应,在此期间PCR片段与pDONR201质粒体内重组以产生Gateway术语所称的“进入(entry)克隆”,pFLA-like。作为技术一部分的质粒pDONR201购自Invitrogen。
含有SEQ ID NO:171的进入克隆随后与用于稻转化的Destination载体一起用于LR反应。此载体在T-DNA边界内包含如下功能性元件:植物可选择的标记;可筛选的标记表达盒;和旨在与已克隆到进入克隆中的目的核酸序列进行LR体内重组的Gateway盒。用于组成型特异表达的稻GOS2启动子(SEQ ID NO:500)位于此Gateway盒的上游。
在LR重组步骤之后,根据本领域公知的方法,将所产生的表达载体pGOS2::FLA-like转化进农杆菌菌株LBA4044。
3.生长素上调小RNA(SAUR)多肽
使用定制的拟南芥(Arabidopsis thaliana)幼苗cDNA文库(在pCMVSport 6.0中;Invitrogen,Paisley,UK)作为模板,通过PCR扩增用于本发明方法的核酸序列。在标准条件下使用Hifi Taq DNA聚合酶,在50μlPCR mix中使用200ng模板进行PCR。使用的引物如SEQ ID NO:1161和1162所示,其包括用于Gateway重组的AttB位点。也使用标准方法纯化扩增的PCR片段。接着进行Gateway操作的第一步,即BP反应,在此期间PCR片段与pDONR201质粒体内重组以产生Gateway术语所称的“进入(entry)克隆”,pSAUR。作为技术一部分的质粒pDONR201购自Invitrogen。
含有SEQ ID NO:501的编码区的进入克隆随后与用于稻转化的Destination载体一起用于LR反应。此载体在T-DNA边界内包含如下功能性元件:植物可选择的标记;可筛选的标记表达盒;和旨在与已克隆到进入克隆中的目的核酸序列进行LR体内重组的Gateway盒。用于叶特异表达的叶特异性启动子(SEQ ID NO:1163)位于此Gateway盒的上游。
在LR重组步骤之后,根据本领域公知的方法,将所产生的表达载体ppCpR::SAUR转化到农杆菌菌株LBA4044中。
对在SEQ ID NO:2288所示的gos2启动子控制下的SEQ ID NO:2210所示的SAUR-33,执行了和以上相同的程序。
4.SAUR多肽、或SYNP多肽、或SAUR多肽与SYNP多肽的融合
蛋白
使用定制的拟南芥(Arabidopsis thaliana)幼苗cDNA文库(在pCMVSport 6.0中;Invitrogen,Paisley,UK)作为模板,通过PCR扩增用于本发明方法的核酸序列。在标准条件下使用Hifi Taq DNA聚合酶,在50μlPCR mix中使用200ng模板进行PCR。使用的引物如SEQ ID NO:1823和1824所示,其包括用于Gateway重组的AttB位点。也使用标准方法纯化扩增的PCR片段。接着进行Gateway操作的第一步,即BP反应,在此期间PCR片段与pDONR201质粒体内重组以产生Gateway术语所称的“进入(entry)克隆”,pSAUR。作为技术一部分的质粒pDONR201购自Invitrogen。
含有SEQ ID NO:1163的编码区的进入克隆随后与用于稻转化的Destination载体一起用于LR反应。此载体在T-DNA边界内包含如下功能性元件:植物可选择的标记;可筛选的标记表达盒;和旨在与已克隆到进入克隆中的目的核酸序列进行LR体内重组的Gateway盒。用于叶特异表达的叶特异性启动子(SEQ ID NO:1825)位于此Gateway盒的上游。
在LR重组步骤之后,根据本领域公知的方法,将所产生的表达载体pGOS2::SAUR转化到农杆菌菌株LBA4044中。
5.脱氢抗坏血酸还原酶(DHAR)多肽
使用定制的番茄(Solanum lycopersicum)幼苗cDNA文库(在pCMVSport 6.0中;Invitrogen,Paisley,UK)作为模板,通过PCR扩增核酸序列。在标准条件下使用Hifi Taq DNA聚合酶,在50μl PCR mix中使用200ng模板进行PCR。使用的引物是:prm12191(SEQ ID NO:2252;有义,起始密码子以加粗表示):5’-ggggacaagtttgtacaaaaaagcaggctt aaacaatggttgttgaagtttgtgtc-3’和prm12192(SEQ ID NO:2253;反向,互补):5’-ggggaccactttgtacaagaa agctgggttcatacgttaaacctttg gag-3’,其包括用于Gateway重组的AttB位点。也使用标准方法纯化扩增的PCR片段。接着进行Gateway操作的第一步,即BP反应,在此期间PCR片段与pDONR201质粒体内重组以产生Gateway术语所称的“进入(entry)克隆”,pDHAR。作为技术一部分的质粒pDONR201购自Invitrogen。
含有SEQ ID NO:1957的进入克隆随后与用于稻转化的Destination载体一起用于LR反应。此载体在T-DNA边界内包含如下功能性元件:植物可选择的标记;可筛选的标记表达盒;和旨在与已克隆到进入克隆中的目的核酸序列进行LR体内重组的Gateway盒。用于组成型特异表达的稻GOS2启动子(SEQ ID NO:2251)位于此Gateway盒的上游。
在LR重组步骤之后,根据本领域公知的方法,将所产生的表达载体pGOS2::DHAR(图9)转化进农杆菌菌株LBA4044。
实施例8:植物转化
稻转化
用含表达载体的农杆菌转化稻(Oryza sativa)植物。使粳稻栽培种日本晴(Nipponbare)的成熟干种子脱壳。通过在70%乙醇中孵育1分钟,接着在0.2%HgCl2中孵育30分钟,接着用无菌蒸馏水洗6次,每次15分钟进行消毒。然后使消毒的种子在含有2,4-D的培养基(愈伤组织诱导培养基)上萌发。在黑暗中孵育四周之后,切下盾片来源的胚发生愈伤组织,并在相同的培养基中增殖。两周之后,通过在相同培养基中传代培养另外2周来扩增或者增殖愈伤组织。在共培养之前3天,在新鲜培养基上传代培养胚发生愈伤组织块(以加强细胞分裂活性)。
含有表达载体的农杆菌菌株LBA4404用于共培养。农杆菌接种于含有合适抗生素的AB培养基上,并在28℃培养3天。接着收集细菌并悬浮在液体共培养培养基中至光密度(OD600)约为1。接着将悬浮液转移至培养皿,并将愈伤组织浸于悬浮液中15分钟。随后将愈伤组织在滤纸上沾干,转移至固化的共培养培养基中,并在黑暗中于25℃孵育3天。在选择剂的存在下,共培养的愈伤组织在含有2,4-D的培养基上于28℃暗培养四周。在此期间,发育出快速生长的抗性愈伤组织岛。将此材料转移至再生培养基并在光照下孵育之后,释放了胚发生潜力,在接下来的四至五周发育出芽。将芽从愈伤组织切下,并在含生长素的培养基中孵育2到3周,将其从培养基转移至土壤。变硬的芽在高湿度和短白昼条件下在温室中培养。
一个构建体产生约35个独立的T0稻转化体。将原代转化体从组织培养室转移到温室。在定量PCR分析验证T-DNA插入物的拷贝数后,只保留对选择剂表现出耐受性的单拷贝转基因植物用以收获T1种子。在移植后三至五个月收获种子。该方法以超过50%的比率产生了单基因座转化体(Aldemita和Hodges 1996,Chan等,1993,Hiei等,1994)。
实施例9:其他作物的转化
玉米转化
用Ishida等(1996)Nature Biotech 14(6):745-50所述方法的改良方案进行玉米(玉蜀黍)转化。在玉米中转化是基因型依赖性的,并且只有特定的基因型适于转化和再生。近交系A188(明尼苏达大学)或以A188为亲本的杂种是转化供体材料的优良来源,但是也可以成功使用其它基因型。授粉后约11天(DAP),当未成熟胚的长度是约1至1.2mm时,从玉米植物收获穗。共培养未成熟胚和含有表达载体的根癌农杆菌,并通过器官发生回收转基因植物。切离的胚依次生长在含有选择剂(例如咪唑啉酮,但可使用多种选择标记)的愈伤组织诱导培养基、和玉米再生培养基上。培养板在光照下于25℃孵育2-3周,或直到芽发育。从每个胚中将绿芽转移到玉米生根培养基上并在25℃孵育2-3周,直到根发育。将生根的芽移植到温室的土壤中。从表现出对选择剂具有耐受性且含有单拷贝T-DNA插入片段的植物产生T1种子。
小麦转化
运用Ishida等(1996)Nature Biotech 14(6):745-50描述的方法,进行小麦的转化。栽培种Bobwhite(可从CIMMYT,Mexico(墨西哥)获得)常用来进行转化。共培养未成熟胚和含有表达载体的根癌农杆菌,并通过器官发生回收转基因植株。与农杆菌孵育后,胚依次体外生长在含有选择试剂(例如咪唑啉酮,但可使用多种选择标记)的愈伤组织诱导培养基,和再生培养基上。培养板在光照下于25℃孵育2-3周,或直到芽发育。从每个胚中将绿芽转移到生根培养基上并在25℃孵育2-3周,直到根发育。将生根的芽移植到温室的土壤中。从表现出对选择剂具有耐受性且含有单拷贝T-DNA插入片段的植物产生T1种子。
大豆转化
根据Texas A&M专利US 5,164,310所述方法的改良方案转化大豆。若干商业大豆品种可以通过该方法转化。栽培种Jack(可以得自伊利诺斯种子公司(the Illinois Seed foundation))常用来进行转化。对大豆种子消毒以进行体外播种。从七日龄幼苗中切出下胚轴、胚根和一个子叶。进一步培养上胚轴和剩下的子叶以发育腋结。切离这些腋结并与含有表达载体的根癌农杆菌孵育。在共培养处理后,洗涤外植体并转移到选择培养基中。切离再生的芽,置于芽伸长培养基中。将长度不超过1cm的芽置于生根培养基中直到发育出根。将生根的芽移植到温室的土壤中。从对选择剂表现出耐受性且含有单拷贝T-DNA插入片段的植物产生T1种子。
油菜籽/芸苔转化
利用5-6日龄幼苗的子叶柄和下胚轴作为外植体进行组织培养并根据Babic等(1998,Plant Cell Rep 17:183-188)进行转化。商业栽培种Westar(加拿大农业(Agriculture Canada))是用作转化的标准品种,但是也可以使用其它品种。对芸苔种子表面消毒以进行体外播种。从体外幼苗中切离附着有子叶的子叶柄外植体,并通过将子叶柄外植体的切割端浸入细菌悬浮液中来接种农杆菌(含有表达载体)。随后外植体在含有3mg/l BAP、3%蔗糖、0.7%植物琼脂(Phytagar)的MSBAP-3培养基中于23℃、16小时光照培养2天。与农杆菌共培养2天后,将子叶柄外植体转移到含有3mg/l BAP、头孢噻肟、羧苄青霉素或特美汀(300mg/l)的MSBAP-3培养基中7天,然后在含有头孢噻肟、羧苄青霉素或特美汀和选择剂的MSBAP-3培养基上培养直到芽再生。当芽长5-10mm时,将其切下并转移到芽伸长培养基(MSBAP-0.5,含有0.5mg/l BAP)中。将约2cm长的芽转移到生根培养基(MS0)中进行根诱导。将生根的芽移植到温室的土壤中。从对选择剂表现出耐受性且含有单拷贝T-DNA插入片段的植物产生T1种子。
苜蓿转化
利用(McKersie等1999Plant Physiol 119:839–847)的方法转化苜蓿(紫花苜蓿(Medicago sativa))的再生克隆。苜蓿的再生和转化是基因型依赖性的,因此需要再生植株。获得再生植株的方法已有描述。例如,这些可以选自栽培种Rangelander(加拿大农业(Agriculture Canada))或如Brown DCW和A Atanassov(1985.Plant Cell Tissue Organ Culture 4:111-112)所述的任何其它商业苜蓿品种。可选的,选择RA3品种(威斯康辛大学(University of Wisconsin))用于组织培养(Walker等,1978Am J Bot65:654-659)。子叶柄外植体与含有表达载体的根癌农杆菌C58C1 pMP90(McKersie等,1999Plant Physiol 119:839–847)或LBA4404的过夜培养物进行共培养。外植体在含有288mg/L Pro、53mg/L硫代脯氨酸、4.35g/L K2SO4和100μm乙酰丁香酮的SH诱导培养基上在黑暗中共培养3天。外植体在半强度Murashige-Skoog培养基(Murashige和Skoog,1962)中洗涤,并置于相同的SH诱导培养基中,但该培养基不含乙酰丁香酮而含有合适的选择剂和合适的抗生素以抑制农杆菌生长。数周后,体细胞胚转移到不含生长调节剂、不含抗生素、含有50g/L蔗糖的BOi2Y发育培养基中。体细胞胚随后在半强度Murashige-Skoog培养基上萌发。生根的幼苗移植到花盆中并在温室中生长。从对选择剂表现出耐受性且含有单拷贝T-DNA插入片段的植物产生T1种子。
棉花转化
按照US 5,159,135中描述的方法使用根癌农杆菌转化棉花。于3%次氯酸钠溶液中20分钟,对棉花种子表面消毒,并且在具有500μg/ml头孢噻肟的蒸馏水中进行洗涤。然后将种子转移至具有50μg/ml苯菌灵(benomyl)的SH培养基中进行萌发。从4至6日龄的幼苗中取出下胚轴,切成0.5厘米的小块,置于0.8%琼脂上。将农杆菌悬浮液(每ml大约108个细胞,从用目的基因和适当的选择标记转化的过夜培养物稀释的)用于接种下胚轴外植体。在室温和光照下3天后,将组织转移至具有Murashige和Skoog盐和B5维生素(Gamborg等,Exp.Cell Res.50:151-158(1968))、0.1mg/l 2,4-D、0.1mg/l 6-糠氨基嘌呤(6-furfurylaminopurine)和750μg/ml MgCL2、以及50至100μg/ml头孢噻肟和400-500μg/ml羧苄青霉素(以杀死残留细菌)的固体培养基(1.6g/lGelrite)。在2至3个月(每4至6周进行一次传代培养)后分离单细胞系并且将其在选择培养基上进一步培养以进行组织扩增(30℃,16小时光周期)。接着将转化的组织在非选择培养基上进一步培养2至3个月以产生体细胞胚。将至少4mm长的健康外貌的胚转移至具有SH培养基(于细小蛭石中)的试管中,所述培养基补充有0.1mg/l吲哚乙酸、6-糠氨基嘌呤和赤霉酸。将胚在30℃和16小时的光周期下进行培养,将2至3叶期的小植株转移入具有蛭石和营养物的花盆。植物变硬,然后转移至温室以进一步栽培。
实施例10:表型评估方法
10.1评估设置
产生大约35个独立的T0稻转化体。原代转化体由组织培养室转移到温室进行生长并收获T1种子。保留6或8个其中T1代发生转基因的存在/缺乏的3:1分离的事件。对于每一个此类事件,通过监测可视标记的表达,选出大约10个含转基因(杂合子和纯合子)的T1幼苗、以及大约10个缺少转基因(无效合子)的T1幼苗。转基因植物和相应的无效合子在随机位置上并排生长。温室条件为短白昼(12小时光照),日间28℃,夜间22℃,相对湿度70%。对在非胁迫条件下生长的植物定期浇水,以确保水和养分是非限制性的以及满足完成生长和发育的植物需要。
对于一些T1试验,按照与T1代相同的评估程序,对4个T1事件在T2代中进行了进一步的评估,但是每个事件采用了更多的个体。从播种期到成熟期,植物数次通过数码成像箱。在每个时间点上对每株植物从至少6个不同的角度获取数码图像(2048×1536像素,1千6百万色)。
干旱筛选(FLA样多肽–DHAR多肽)
在正常条件下在花盆土中培养来自T2种子的植物,直到进入抽穗期。然后将其转移到“干”区,停止灌溉。向随机选择的花盆中插入湿度探测仪,以监测土壤水含量(SWC)。当SWC降至一定的阈值时,自动向植物持续补水,直到再次达到正常水平。然后将植物再次重新转移到正常条件下。其余的栽培(植物成熟、种子收获)与不在非生物胁迫条件下培养的植物相同。如针对在正常条件下生长所详述的那样,记录了生长和产量参数。
氮利用效率筛选(GDH多肽–SAUR多肽)
在除营养液以外为正常的条件下在花盆土中栽培来自T2种子的稻植物。从植物移植到成熟,用特定的营养液对花盆进行灌溉,所述营养液含有减小的氮(N)含量,通常少7到8倍。其余的栽培(植物成熟、种子收获)与不在非生物胁迫条件下培养的植物相同。如对正常条件下生长所详细描述的那样,记录了生长和产量参数。
盐胁迫筛选(SAUR多肽)
植物生长在由椰壳纤维和argex(3:1)制成的基质上。在小植株移植到温室后的头两周期间应用正常营养液。过了头两周之后,向营养液中添加25mM盐(NaCl),直至收获植物。然后测量种子相关参数。
10.2统计学分析:F检验
利用双因素ANOVA(方差分析)作为统计模型,对植物表型特征进行总体评估。对用本发明基因转化的所有事件的所有植株的所有测量参数进行了F检验。进行F检验以检查基因在所有转化事件上的效应,并检验基因的总体效应,亦称为“整体基因效应”。真实整体基因效应的显著性阈值设置为F检验的5%概率水平。显著性F检验值指示存在基因效应,这意味着引起表型上差异的不仅仅是基因的存在或位置。
在进行了具有重叠事件的两个实验(T1和T2事件)时,进行组合分析。这可以用于检查效应在两个实验中的一致性,并且如果确是如此的话,积累来自两个实验的证据以增加结论的可靠性。所使用的方法是考虑数据的多层次结构(即实验-事件-分离子)的混合模型法。通过将似然比检验与卡方分布相比较来获得P值。
10.3测量的参数
生物量相关参数测量
从播种期到成熟期,植物数次通过数码成像箱。在每个时间点上对每株植物从至少6个不同的角度获取数码图像(2048×1536像素,1千6百万色)。
植物地上面积(或者说叶生物量,areamax)通过计数数码图像中区别于背景的地上植物部分的像素总数而确定。此值取同一时间点从不同的角度拍摄的照片的平均值,并通过校准转换为以平方毫米表示的物理表面值。实验表明通过这种方法测量的地上植物面积与植物地上部分的生物量相关。该地上面积是在植物达到其最大叶生物量的时间点测量的面积。早期活力是萌发后三周的植物(幼苗)地上面积。根生物量增加表达为根总生物量(测量为在植物一生中观察到的最大根生物量,rootmax)的增加;或者表达为根/枝条指数(测量为在根和枝条活跃生长期中根生物量和枝条生物量之间的比值)的增加。
通过计数区别于背景的地上植物部分的像素总数,测定了早期活力(EmerVigor)。此值取同一时间点从不同的角度拍摄的照片的平均值,并通过校准转换为以平方毫米表示的物理表面值。下面描述的结果是针对萌发后3周的植物的。
种子相关参数测量
收获成熟的一级圆锥花序(primary panicles)、计数、装袋、贴上条形码标记,然后在烤箱中于37℃干燥三天。随后使圆锥花序脱粒,收集所有的种子并计数(firstpan)。使用鼓风装置使饱满谷壳和空壳分开。弃去空壳,再次计数剩下的部分。在分析天平上称重饱满的谷壳。通过计数在分离步骤之后剩下的饱满谷壳数,确定饱满种子数。通过称重从植物收获的所有饱满谷壳来测量种子总产量(totalwgseeds)。通过计数从植物收获的谷壳数来测量每株植物的种子总数。根据计数的饱满种子数及其总重量外推得出千粒重(TKW)。收获指数(HI)在本发明中定义为种子总产量和地上面积(mm2)之间的比值再乘以因子106。每圆锥花序的花总数在本发明中定义为种子总数与成熟一级圆锥花序数之间的比率。种子饱满率在本发明中定义为饱满种子数占种子(或小花)总数的比例(以%表示)。
实施例11:转基因植物表型评估结果
1.谷氨酸脱氢酶(GDH)多肽
a)转化了pGOS2::ZmGDH的稻(Oryza sativa)
在T1和T2代评估植物。当在非胁迫条件下生长时,转基因植物显示出地上面积(areamax)、早期活力、根生长和种子产量的增加。以下表G1和G2中给出了详细数据:
表G1:T1代pGOS2::ZmGDH转基因在非胁迫条件下评估的数据总结。对于每一个参数,显示总体增加百分比,对于每一个,p值为≤0.05。
参数 | 总体 |
EmerVigor | 10.9 |
firstpan | 14.8 |
nrtotalseed | 11.8 |
表G2:T2代pGOS2::ZmGDH转基因在非胁迫条件下评估的数据总结。对于每一个参数,显示总体增加百分比,对于每一个,p值为≤0.05。
参数 | 总体 |
EmerVigor | 21.4 |
RootMax | 9.5 |
totalwgseeds | 11.9 |
nrfilledseed | 13.0 |
harvestindex | 9.1 |
nrtotalseed | 11.9 |
RootThickMax | 10.1 |
当pGOS2::ZmGDH转基因在氮素限制(养分胁迫)条件下生长时,有增加的TKW和早期活力的趋势。
b)转化了pRCc3::ZmGDH的稻(Oryza sativa)
在T1代评估植物。当在非胁迫条件下生长时,转基因植物显示出地上面积(areamax)、早期活力、根生长和种子产量的增加。以下表G3中给出了详细数据:
表G3:T1代pRCc3::ZmGDH转基因在非胁迫条件下评估的数据总结。对于每一个参数,显示总体增加百分比,对于每一个,p值为≤0.05。
参数 | 总体 |
totalwgseeds | 9.2 |
nrfilledseed | 7.9 |
harvestindex | 7.9 |
nrtotalseed | 6.7 |
当在氮素限制条件下生长时,观察到了早期活力、根生长(根/枝条指数)、和种子产量(较高的种子总重、饱满种子数、饱满率、收获指数和每圆锥花序的花数)的增加。
c)转化了pGOS2::OsGDH的稻(Oryza sativa)
在T1代评估植物。当在非胁迫条件下生长时,转基因植物显示出地上面积(areamax)和种子产量(种子总重、饱满种子数、饱满率、每圆锥花序的花数、收获指数、TKW、一级圆锥花序(first panicle)的数)的增加。表G4中给出了详细数据:
表G4:T1代pGOS2::OsGDH转基因在非胁迫条件下评估的数据总结。对于每一个参数,显示总体增加百分比,对于每一个,p值为≤0.05。
参数 | 总体 |
AreaMax | 6.5 |
totalwgseeds | 11.5 |
nrfilledseed | 12.1 |
flowerperpan | 6.3 |
nrtotalseed | 7.6 |
当在氮素限制条件下生长时,观察到了地上面积、早期活力、根生长(rootmax和根/枝条指数)、和种子产量(较高的种子总重、饱满种子数、饱满率、和每圆锥花序的花数)的增加。
d)转化了pRCc3::OsGDH的稻(Oryza sativa)
在T1代评估植物。当在非胁迫条件下生长时,转基因植物显示出地上面积(areamax)的增加并具有增加的每圆锥花序的花数和一级圆锥花序数。
当在氮素限制条件下生长时,观察到了饱满种子数和饱满率的增加(6.2%的总体增加,p值≤0.05)。
2.成束蛋白样AGP(FLA)多肽
在非胁迫条件下,对表达包含编码SEQ ID NO:172的SEQ ID NO:171的开放阅读框的核酸的T1代转基因稻植物的评估结果如下(表G5)。关于转基因植株产生的细节,参见之前的实施例。
在干旱条件(以上的干旱筛选)下对转基因稻植物的评估结果如下(表G5)。观察到了种子总产量(totalwgseeds)、饱满种子数(nrfilledseed)、饱满率(fillrate)、每圆锥花序的花数、收获指数(harvestindex)的至少5%增加。
表G5:转基因稻植物的数据总结;对于每一个参数,显示与对照植物相比较,转基因植物中的总体效应(T1代),对于每一个参数,p值为<0.05。
性状 | 转基因与对照植物相比较(%) |
RootMax | 5.4 |
totalwgseeds | 34.9 |
fillrate | 50.1 |
harvestindex | 50.3 |
nrfilledseed | 35.1 |
3.生长素上调小RNA(SAUR)多肽
在非胁迫条件下,对表达包含编码SEQ ID NO:502的SEQ ID NO:501中最长区域的核酸的T1代转基因稻植物的评估结果如下。关于转基因植株产生的细节,参见之前的实施例。
在非胁迫条件下对转基因稻植物的评估结果如下。观察到了地上生物量(AreaMax)、早期活力(EmerVigor)、种子总产量(totalwgseeds)、饱满种子数(nrfilledseed)、一级圆锥花序数(firstpan)、饱满率、每圆锥花序的花数(nrtotalseed)的至少5%增加(表G6)。
表G6:与对照植物相比较,转基因稻植物的数据总结,以百分比表示;对于每一个参数,显示用于进行确认(T2代)的总体百分比增加,对于每一个参数,p值为<0.05。
参数:产量性状 | 总体 |
AreaMax | 13.0 |
EmerVigor | 11.2 |
totalwgseeds | 12.5 |
nrfilledseed | 14.6 |
firstpan | 20.2 |
nrtotalseed | 18.2 |
当植物在如上所述的氮筛选中的氮素限制条件下生长时,转基因植物相对于对照植物显示出增强的一级圆锥花序产生(11.3%的增加)。
在低氮条件下,对表达包含编码SEQ ID NO:2211的SEQ ID NO:2210中最长区域的核酸的转基因稻植物的评估结果,给出了TKW至少5%的增加(F-检验中P值为0)。大多数事件也显示出与对应的无效合子相比株高的增加。
在非胁迫条件下,对表达包含编码SEQ ID NO:2211的SEQ ID NO:2210中最长区域的核酸的转基因稻植物的评估结果,给出了种子总重和TKW至少5%的增加。与对应的无效合子相比,下列参数也显示出了增加:地上生物量、根生物量、收获指数、饱满率、种子总数和一级圆锥花序数。
4.SAUR多肽、或SYNP多肽、或SAUR多肽与SYNP多肽的融合
蛋白
在非胁迫条件下,对表达包含编码SEQ ID NO:1164的SEQ ID NO:1163中最长区域的核酸的T1代转基因稻植物的评估结果如下。关于转基因植株产生的细节,参见之前的实施例。
在非胁迫条件下对转基因稻植物的评估结果如下。观察到了地上生物量(AreaMax)、早期活力(EmerVigor)、种子总产量(totalwgseeds)、饱满种子数(nrfilledseed)、一级圆锥花序数(firstpan)、饱满率、每圆锥花序的花数(nrtotalseed)的至少5%增加(表G7)。
表G7:与对照植物相比较,转基因稻植物的数据总结,以百分比表示;对于每一个参数,显示用于进行确认(T2代)的总体百分比增加,对于每一个参数,p值为<0.05。
参数:产量性状 | 总体 |
AreaMax | 13.0 |
EmerVigor | 11.2 |
totalwgseeds | 12.5 |
nrfilledseed | 14.6 |
firstpan | 20.2 |
nrtotalseed | 18.2 |
当植物在如上的氮筛选中所述的氮素限制条件下生长时,转基因植物相对于对照植物显示出了增强的一级圆锥花序产生(11.3%的增加)。
5.脱氢抗坏血酸还原酶(DHAR)多肽
在非胁迫条件下,对表达包含SEQ ID NO:1957中最长开放阅读框的核酸的T2代转基因稻植物的评估结果如下。关于转基因植株产生的细节,参见之前的实施例。
在非胁迫条件下,对表达编码SEQ ID NO:1958的多肽的核酸的T2代转基因稻植物的评估结果如下表G8。当在非胁迫条件下生长时,观察到了根生物量(RootMax–根总生物量和RootThickMax-粗根数)和种子产量(Totalwgseeds–种子总重,Nrfilledseed–饱满种子数,Harvestindex–收获指数,EmerVigor–幼苗活力,Nrtotalseed–植物小花数,和Firstpan–一级分蘖(first flush)中圆锥花序数)至少5%的增加。
表G8:转基因稻植物的数据总结;对于每一个参数,显示用于进行确认(T2代)的总体增加百分比,对于每一个参数,p值为<0.05和在该5%阈值以上。
参数 | 总体 |
EmerVigor | 20.8 |
RootMax | 12.3 |
totalwgseeds | 26.3 |
nrtotalseed | 20.3 |
harvestindex | 15.0 |
firstpan | 20.9 |
nrfilledseed | 28.9 |
RootThickMax | 9.1 |
实施例12:转化了展叶剑叶藓(Physcomitrella patens)126976的GDH的转基因植物显示出了增强的产量相关性状。
基本上按实施例7和8的描述,以包含编码PpGDH(SEQ ID NO:77)的核酸的构建体转化稻植物,按实施例10中的描述进行评估。与对照植物相比较,转化了的稻植物显示出增加的产量相关性状。
实施例13:鉴定SAUR相互作用蛋白
利用计算机模拟相互作用技术(silico interaction techniques)“AtPID”(ian Cui,Peng Li,Guang Li,Feng Xu,Chen Zhao,Yuhua Li,ZhongnanYang,Guang Wang,Qingbo Yu,Yixue Li和Tieliu Shi AtPID:Arabidopsis thaliana protein interactome database an integrative platformfor plant systems biology.Nucleic Acids Research,2008,Vol.36,Databaseissue D999-D1008),使用SEQ ID NO:2n(其中“n”为从1至81的任何数字)所示的来源于拟南芥(Arabidopsis thaliana)的表A中的SAUR多肽,鉴定与任何所述SAUR蛋白相互作用的蛋白质。使用第3版的AtPID。该数据库包括28,062个蛋白质-蛋白质相互作用对,涉及12,506个蛋白质,其中23,396对来自预测方法,而其它涉及2,285个蛋白质的4,666对是从文献手工整理的。此外,也包括了5,562个蛋白质的亚细胞定位。鉴定出了许多SAUR相互作用蛋白质:“全部SAUR相互作用组”。
如本文中使用的“计算机模拟相互作用技术”(“In silico interactiontechnique”)指,由计算机支持所介导的、鉴定与查询序列相互作用的蛋白质的任何方法。这样的相互作用可以通过生物化学方法进行实验验证或可以使用专门的算法进行计算机预测。一个“计算机模拟相互作用技术”的实例包括对AtPID数据库的搜索。AtPID(拟南芥蛋白质相互作用组数据库)是一个集中化的平台,描绘和整合与拟南芥蛋白质组中蛋白质-蛋白质相互作用网络、结构域构造、直向同源基因信息和GO(Gene onthology)注释相关的信息。通过将几种方法与朴素贝叶斯分类(Naive BaysianClassifier)整合,预测蛋白质-蛋白质相互作用对。AtPID中管理的所有其它相关信息人工提取自发表的文献和来自一些生物学专家的其它资源。
实施例14:鉴定SAUR共表达基因
利用ATTED-II平台(Obayashi 2007.Nucleic Acids Res.2007Jan;35(Database issue):D863-9),使用SEQ ID NO:2n+1(其中“n”为从1至80的任何数字)所示的来源于拟南芥的表A4中的SAUR多核苷酸,鉴定了拟南芥中的共调节基因。Atted-II平台指由Obayashi等,2007描述的数据库ATTED-II,其包含拟南芥反式因子和顺式元件预测数据库(ATTED-II),基于从实验报道的微阵列数据和预测的顺式元件推导的共表达基因,提供共调节的基因相互关系。ATTED-II(http://www.atted.bio.titech.ac.jp)包括以下特点:(i)从58个可公开获取的实验系列计算出的共表达基因的列表和网络,由1388个拟南芥GeneChip数据组成;(ii)转录起始点上游200bp区域中顺式调控元件的预测,以在共表达基因中预测共调节的基因;和(iii)各单个基因的表达模式的可视化显示。鉴定出了许多SAUR共调节基因:“全部SAUR共调节基因”。
实施例15:鉴定SAUR产量网络蛋白
如本文中使用的术语“SAUR产量网络蛋白”指具有增强产量相关性状能力的蛋白质,所述能力由SAUR基因或SAUR多肽的效应介导。
在选择步骤中,从两组数据集“全部SAUR共调节基因”和“全部SAUR相互作用组”中,挑选出具有由SAUR基因或SAUR多肽介导的增强产量相关性状能力的基因和/或蛋白质(表E)。该组所选基因和蛋白质是拟南芥的SAUR产量网络蛋白(SYNP)。
表E:拟南芥SAUR产量网络蛋白(SYNP)
实施例16:鉴定拟南芥SAUR产量网络蛋白(SYNP)的同源物:旁系同源和直向同源蛋白及其编码基因
使用实施例1中描述的方法,鉴定了表E的基因的旁系同源和直向同源基因。旁系同源和直向同源蛋白及其编码基因选自源于植物界生物的那些(表F)。
Claims (23)
1.用于相对于对照植物增强植物的产量相关性状的方法,包括调节如下(a)-(e)之一所述的核酸在植物中的表达:
a.编码至少一个SAUR多肽的第一核酸和编码一个或多个SYNP多肽的第二核酸、或编码至少一个SAUR和一个或多个SYNP多肽之间的蛋白质融合物的核酸,其中第一和第二核酸包含在单个核酸分子或多个,至少两个,核酸分子中;
b.编码谷氨酸脱氢酶(GDH)多肽的核酸,其中所述GDH多肽是具有谷氨酸脱氢酶活性的NAD依赖性GDH;
c.编码成束蛋白样(FLA样)多肽的核酸;
d.编码SAUR多肽的核酸,其中所述SAUR多肽包含生长素可诱导结构域;或
e.编码DHAR多肽的核酸,其中所述多肽包含至少一个具有登录号PTHR11260:SF15的脱氢抗坏血酸还原酶结构域。
2.根据权利要求1的方法,
a.其中
(i)用于本发明方法中的SAUR多肽按照递增的优选次序与表A4的多肽序列之任一所示的氨基酸序列,更优选与SEQ ID NO:1164或其变体所示的氨基酸序列,具有至少25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%的全序列同一性;
(ii)用于本发明方法中的SYNP多肽按照递增的优选次序与表E或表F的多肽序列之任一所示的氨基酸序列具有至少25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%的全序列同一性;或者
b.其中所述GDH多肽包含基序1至20(SEQ ID NO:3至SEQ IDNO:22)的一个或多个;或者
c.其中所述FLA样多肽包含至少1个、2个、3个或4个成束蛋白样结构域,所述成束蛋白样结构域按照递增的优选次序与以下(i)或(ii)所示的氨基酸具有至少25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的序列同一性:
(i)TITVCAVDNAGMSDLLSKQLSIYTIKNVLSFRVLLDYFDAKKLHQITNGTALAATMFQATGSATGSSGFVNITDLRGGKVGLSPADYNGPPPAKFVKSIAEIPYNISVIQISTIL(SEQ ID NO:487),
相应于SEQ ID NO:172中N端FLA样结构域,或
(ii)VDGGVTIFCPRDDAMKKFLPKFKNLTAEGKQSLLEYHGIPIYQSISNLKSNNGDMNTLATDGAKKYAVVIQNDGEDVTIKTKIVTAKITATVVDKLPLAIYSLDKVL(SEQ ID NO:488),
相应于SEQ ID NO:172中C端FLA样结构域;或者
d.其中所述SAUR多肽包含一个或多个下列基序:
(i)基序23:
LAVYVGEMMQKRRFVVPVTYLSHPCFQKLLRKAEEEFGFDHPMGGLTIPC(SEQ ID NO:1155);
(ii)基序24:KHxxGVYTAEKxxYxxxIxxxxxxxxxAxxxxS xxxYxxxxPMPIx LxxC(SEQID NO:1156);
(iii)基序25:LQSSKQLLKSLSHSSNNVAIP(SEQ ID NO:1157);
(iv)基序26:VxxxKIAxKSQ(SEQ ID NO:1158);
(v)基序27:EQIFIDLASRL(SEQ ID NO:1159);
(vi)基序28:VExxxVxxxxL(SEQ ID NO:1159);
其中X代表任何氨基酸;或者
e.其中所述SAUR多肽为SAUR33样多肽,其包含下列基序47和48以及可选地也包括基序49和50之一或两者,或包含按照递增的优选次序与基序47至50具有至少50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%的序列同一性的任何序列:
基序47(SEQ ID NO:2284)
CEVVLFEHLLWMLENADPQ
基序48(SEQ ID NO:2285)
PESLDELVEYYAC
基序49(SEQ ID NO:2286)
GLSKLRCMIRRWHSSSRI
基序50(SEQ ID NO:2287)
SFHGADEVPKGLHPVYVGKSRRRYLIAEELVGHPLFQNLVDRT;或者
f.DHAR多肽的DHAR结构域按照递增的优选次序与SEQ ID NO:1958中位于第19至210位氨基酸之间的序列具有至少49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、或99%或更高的序列同一性;或者
g.其中所述DHAR多肽包含按照递增的优选次序与下列基序之任一具有至少49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、或99%或更高的序列同一性的基序:
(i)基序35:P[DN]KLGDCPF[SC]QRVLLTLEEK[KH][VL]PY[KD][ML][KH]L[IV](SEQID NO:2239),
(ii)基序36:D[DEG]KW[VI][PAS]DSDVI[TV][QG][IL][LI]EEK[YF]PEP[SP]L[VA]TPPE(SEQ ID NO:2240),
(iii)基序37:P[FY][IV][NA]GE[KN][IV][ST]A[VA]DLSL[AG]PKLYHLE[VI]ALGH[FY]K[KN]W[ST][VI]P(SEQ ID NO:2241);或者
h.其中所述DHAR多肽包含按照递增的优选次序与下列基序之任一具有至少49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、或99%或更高的序列同一性的任何一个或多个序列基序:
(i)基序38:E[VI]CVKA[AS]V[GT]AP[DN][KV]LGDCPF[SC]QRVLLTLEE(SEQ IDNO:2242),
(ii)基序39:PPE[FK]ASVGSKIF[PS][TS]F[VI][GT]FLKSKD[PA][NS]DG[TS]EQ(SEQ ID NO:2243),
(iii)基序40:
[IV][ST]A[VA]DLSL[AG]PKLYHL[EQ][VI]ALGH[FY]K[KN]W[ST][VI]P[ED]S
L[TP]HV[HK][NS]Y[MT]K[ALS][LI]FS[RL][ED]SF[EV]KT(SEQ ID NO:2243);或者
i.其中所述DHAR多肽包含按照递增的优选次序与下列基序之任一具有至少49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、或99%或更高的序列同一性的任何一个或多个序列基序:
(i)基序41:E[IV]CVKAA[VT]GAPD[VIT]LGDCPF[SC]QRVLLTLEE(SEQ ID NO:2244),
(ii)基序42:PPE[FY]ASVGSKIF[PG][ST]FV[TK]FLKSKD[AP][NS]DG[TS]E[QK](SEQ ID NO:2245),
(iii)基序43:[IV][TS]AVDLSLAPKLYHL[EQ]VAL[GE]HFK[KG]W[TSK][VI]PE[SN]LTHVH[NA]Y[TM]K[LAS]LFSRESFEKT(SEQ ID NO:2246);或者
j.其中所述DHAR多肽包含按照递增的优选次序与下列基序之任一具有至少49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、或99%或更高的序列同一性的任何一个或多个序列基序:
(i)基序44:PLE[VI]C[VA]KAS[ILV]T[TV]P[ND][KR]LGDCPF[TC]QRVLLTLEEKHLPY[DE][ML]KLVDL[SG]NKP[ED]WF(SEQ ID NO:2247),
(ii)基序45:PPE[VI][PA]DSDVITQ[AST]LEEK[YF]P[ED]P[PS]L[AV]TPPEKASVGSKIFSTF[IV]GFLKSKDP[SN]DG(SEQ I D NO:2248),
(iii)基序46:QALL[ND]EL[ST][SA]FNDY[LI]KENGPFING[KE][KDE][IV]SAADLSL[GA]PKLYH[LM]EIALGH[YF]K[NK]W(SEQ ID NO:2249);或者
k.其中DHAR多肽按照递增的优选次序与表A中所示的任何氨基酸序列,优选SEQ ID NO:1958所示的氨基酸序列,具有至少25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的全序列同一性。
3.根据权利要求1或2的方法,其中所述调节的表达通过向植物中引入和表达以下(a)-(e)之一的核酸来实现:
a.编码至少一个SAUR多肽的第一核酸和编码一个或多个SYNP多肽的第二核酸、或编码至少一个SAUR和一个或多个SYNP多肽之间的蛋白质融合物的核酸,其中第一和第二核酸包含在单个核酸分子或多个,至少两个,核酸分子中;
b.编码GDH多肽的核酸;
c.编码FLA样多肽的核酸;
d.编码SAUR多肽的核酸;或者
e.编码如任何前述权利要求所定义的DHAR多肽的核酸。
4.根据权利要求1至3之任一的方法,其中
a.所述编码SAUR多肽的核酸编码表A3或A3(i)中所列的任一蛋白质,或是该核酸的部分,或是能够与该核酸杂交的核酸;
b.所述编码GDH多肽的核酸编码表A1中所列的任一蛋白质,或是该核酸的部分,或是能够与该核酸杂交的核酸;
c.所述编码FLA样多肽的核酸编码表A2中所列的任一蛋白质,或是该核酸的部分,或是能够与该核酸杂交的核酸;或者
d.所述编码DHAR多肽的核酸编码表A5中所列的任一蛋白质,或是该核酸的部分,或是能够与该核酸杂交的核酸。
5.根据权利要求1至4之任一的方法,
a.其中所述核酸序列编码表A3或A3(i)中所给出的任何蛋白质的直向同源物或旁系同源物;
b.其中所述核酸序列编码表A1中所给出的任何蛋白质的直向同源物或旁系同源物;
c.其中所述核酸序列编码表A2中所给出的任何蛋白质的直向同源物或旁系同源物;或者
d.所述核酸序列编码表A5中所给出的任何蛋白质的直向同源物或旁系同源物。
6.根据任何前述权利要求的方法,其中所述增强的产量相关性状包括相对于对照植物增加的早期活力和/或增加的产量,优选增加的生物量、和/或增加的种子产量。
7.根据权利要求1至6之任一的方法,其中在非胁迫条件下获得所述增强的产量相关性状。
8.根据权利要求1至6之任一的方法,其中在缺氮的条件下、或在干旱胁迫条件下、或在盐胁迫条件下,获得所述增强的产量相关性状。
9.根据权利要求3至8之任一的方法,其中将所述核酸有效连接到下列之一:
(i)组成型启动子,优选GOS2启动子,最优选来自稻的GOS2启动子;
(ii)根特异性启动子,优选RCc3启动子,最优选来自稻的RCc3启动子;或
(iii)组成型启动子,优选叶特异性启动子,最优选SEQ ID NO:1163所示的启动子。
10.根据权利要求1至9之任一的方法,其中所述核酸是植物来源的,优选来自双子叶植物或单子叶植物。
11.可通过根据权利要求1至10之任一的方法获得的植物或其部分,包括种子,其中所述植物或其部分包含以下(a)-(e)之一:
a.(i)编码至少一个SAUR多肽的第一核酸,所述SAUR多肽优选选自表A4的多肽或其同源物或衍生物,和(ii)编码一个或多个SYNP多肽的第二核酸,所述SYNP多肽优选选自表E和F的多肽或其同源物或衍生物;或者,编码(i)和(ii)的任何两个多肽之间的蛋白质融合物的核酸,其中第一和第二核酸包含在单个核酸分子或多个,至少两个,核酸分子中;
b.编码GDH多肽的重组核酸;
c.编码FLA样多肽的重组核酸;
d.编码SAUR多肽的重组核酸;或者
e.编码DHAR多肽的重组核酸。
12.构建体,其包含:
(i)编码如权利要求1或2中定义的多肽的核酸;
(ii)能够驱动(i)的核酸序列表达的一个或多个控制序列;和任选地
(iii)转录终止序列。
13.根据权利要求12的构建体,其中所述控制序列之一为下列之一:
(i)组成型启动子,优选GOS2启动子,最优选来自稻的GOS2启动子;
(ii)根特异性启动子,优选RCc3启动子,最优选来自稻的RCc3启动子;或者
(iii)组成型启动子,优选叶特异性启动子,最优选SEQ ID NO:1163所示的启动子。
14.根据权利要求12或13的构建体在用于制备相对于对照植物具有增加的早期活力和/或增加的产量,特别是增加的生物量、和/或增加的种子产量的植物的方法中的用途。
15.转化了根据权利要求12或13的构建体的植物、植物部分或植物细胞。
16.用于产生相对于对照植物具有增加的早期活力和/或增加的产量,特别是增加的生物量、和/或增加的种子产量的转基因植物的方法,其包括:
(i)向植物中引入和表达编码如权利要求1或2中定义的多肽的核酸;和
(ii)在促进植物生长和发育的条件下培养所述植物细胞。
17.相对于对照植物具有增加的早期活力和/或增加的产量,特别是增加的生物量、和/或增加的种子产量的转基因植物,或源于所述转基因植物的转基因植物细胞,所述增加因编码如权利要求1或2中定义的多肽的核酸的被调节的表达而产生。
18.根据权利要求11、15或17的转基因植物或源于其的转基因植物细胞,其中所述植物是作物植物或单子叶植物或谷类植物,例如稻、玉米、小麦、大麦、粟、黑麦、黑小麦、高粱、二粒小麦、斯佩耳特小麦、黑麦属植物、单粒小麦、埃塞俄比亚画眉草、买罗高梁和燕麦。
19.根据权利要求18的植物的可收获部分,其中所述可收获部分优选是枝条生物量、根生物量和/或种子。
20.从根据权利要求18的植物和/或从根据权利要求19的植物的可收获部分产生的产品。
21.编码如权利要求1中所定义的多肽的核酸在相对于对照植物增加植物的早期活力和/或产量,特别是增加种子产量和/或生物量中的用途。
22.分离的核酸分子,其包含以下项之一:
(i)SEQ ID NO:99、SEQ ID NO:1997、SEQ ID NO:2121或SEQ IDNO:2193所示的核酸;或
(ii)SEQ ID NO:99、SEQ ID NO:1997、SEQ ID NO:2121或SEQID NO:2193所示的核酸的互补序列;
(iii)编码多肽的核酸,所述多肽与SEQ ID NO:176所示的氨基酸序列具有至少50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或更高的序列同一性,且按照递增的优选次序与基序4至6之任一具有至少50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或更高的序列同一性;或
(iv)编码SEQ ID NO:1998、SEQ ID NO:2122和SEQ ID NO:2194之任一所示的DHAR多肽的核酸,优选地由于遗传密码子简并性的结果,所述分离的核酸可以源自所述SEQ IDs之任一所示多肽序列且优选地还赋予相对于对照植物增强的产量相关性状;或
(v)按照递增的优选次序与表A5的任何核酸序列具有至少50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或更高的序列同一性、且优选地还赋予相对于对照植物增强的产量相关性状的核酸;
(vi)编码DHAR多肽的核酸,所述多肽按照递增的优选次序与SEQID NO:1998、SEQ ID NO:2122和SEQ ID NO:2194之任一以及表A5中任何其它氨基酸序列具有至少50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或更高的序列同一性并优选赋予相对于对照植物增强的产量相关性状;或
(vii)在严紧杂交条件下与(i)至(vi)的核酸分子杂交并优选赋予相对于对照植物增强的产量相关性状的核酸分子。
23.分离的多肽,其包含以下项之一:
(i)SEQ ID NO:176、SEQ ID NO:1998、SEQ ID NO:2122或SEQID NO:2194所示的氨基酸序列;
(ii)按照递增的优选次序与SEQ ID NO:176所示的氨基酸序列具有至少50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或更高的序列同一性、且按照递增的优选次序与基序4至6之任一具有至少50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或更高的序列同一性的氨基酸序列;
(iii)按照递增的优选次序与SEQ ID NO:1998、SEQ ID NO:2122和SEQ ID NO:2194具有至少50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、99%或更高的序列同一性的氨基酸序列;或
(iv)上文(i)至(iii)所给出的任何氨基酸序列的衍生物。
Applications Claiming Priority (21)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP09171331.3 | 2009-09-25 | ||
EP09171353.7 | 2009-09-25 | ||
EP09171353 | 2009-09-25 | ||
EP09171331 | 2009-09-25 | ||
US24929009P | 2009-10-07 | 2009-10-07 | |
US24928209P | 2009-10-07 | 2009-10-07 | |
US61/249,282 | 2009-10-07 | ||
US61/249,290 | 2009-10-07 | ||
EP09172707 | 2009-10-09 | ||
EP09172713.1 | 2009-10-09 | ||
EP09172707.3 | 2009-10-09 | ||
EP09172713 | 2009-10-09 | ||
US25218309P | 2009-10-16 | 2009-10-16 | |
US25223609P | 2009-10-16 | 2009-10-16 | |
US25220809P | 2009-10-16 | 2009-10-16 | |
EP09173350 | 2009-10-16 | ||
EP09173350.1 | 2009-10-16 | ||
US61/252,208 | 2009-10-16 | ||
US61/252,183 | 2009-10-16 | ||
US61/252,236 | 2009-10-16 | ||
CN2010800533186A CN102686605A (zh) | 2009-09-25 | 2010-09-22 | 具有增强的产量相关性状的植物及其制备方法 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2010800533186A Division CN102686605A (zh) | 2009-09-25 | 2010-09-22 | 具有增强的产量相关性状的植物及其制备方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN104745608A true CN104745608A (zh) | 2015-07-01 |
Family
ID=43014318
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201510013277.2A Pending CN104745608A (zh) | 2009-09-25 | 2010-09-22 | 具有增强的产量相关性状的植物及其制备方法 |
CN2010800533186A Pending CN102686605A (zh) | 2009-09-25 | 2010-09-22 | 具有增强的产量相关性状的植物及其制备方法 |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2010800533186A Pending CN102686605A (zh) | 2009-09-25 | 2010-09-22 | 具有增强的产量相关性状的植物及其制备方法 |
Country Status (11)
Country | Link |
---|---|
US (1) | US20120180165A1 (zh) |
EP (1) | EP2480566A1 (zh) |
CN (2) | CN104745608A (zh) |
AR (1) | AR080339A1 (zh) |
AU (1) | AU2010299960A1 (zh) |
BR (1) | BR112012006616A2 (zh) |
CA (1) | CA2772983A1 (zh) |
EA (1) | EA201270440A1 (zh) |
MX (1) | MX2012003451A (zh) |
WO (1) | WO2011036160A1 (zh) |
ZA (1) | ZA201202950B (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111560381A (zh) * | 2020-05-21 | 2020-08-21 | 扬州大学 | 一种杨树不定根形成关键基因PeSAUR72及其应用 |
CN115838408A (zh) * | 2022-12-09 | 2023-03-24 | 中国农业大学 | 一种钙调素结合蛋白MxIQM3及其编码基因与应用 |
Families Citing this family (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB201007834D0 (en) * | 2010-05-11 | 2010-06-23 | Vib Vzw | Growth promoting fusion proteins |
AU2013221486A1 (en) * | 2012-02-14 | 2014-08-21 | Sapphire Energy, Inc. | Sodium hypochlorite resistant genes |
US9701975B2 (en) | 2012-08-22 | 2017-07-11 | Pioneer Hi-Bred International, Inc. | Down-regulation of auxin responsive genes for improved plant performance |
US9650646B2 (en) | 2013-01-11 | 2017-05-16 | University Of Florida Research Foundation, Inc. | Materials and methods to increase plant growth and yield |
US9133470B2 (en) | 2013-01-11 | 2015-09-15 | University Of Florida Research Foundation, Inc. | Material and methods to increase plant growth and yield |
CN107699563B (zh) | 2013-03-14 | 2022-02-22 | 孟山都技术有限公司 | 植物调控元件和其用途 |
CN103820408B (zh) * | 2014-01-26 | 2016-08-24 | 湖南大学 | 提高氮素高效利用的真菌PcGDH蛋白及其应用 |
CN107858371B (zh) * | 2017-12-25 | 2019-06-25 | 浙江大学 | 番茄基因SlSAUR58在调控番茄生长和抗旱性中的应用 |
WO2019157522A1 (en) * | 2018-02-12 | 2019-08-15 | Curators Of The University Of Missouri | Small auxin upregulated (saur) gene for the improvement of plant root system architecture, waterlogging tolerance, drought resistance and yield |
CN109576392B (zh) * | 2019-01-15 | 2022-05-06 | 河南农业大学 | 一种辅助选择高千粒重小麦品种的引物对及其应用 |
WO2021004938A1 (en) | 2019-07-05 | 2021-01-14 | Biogemma | Method for increasing yield in plants |
CN111321153B (zh) * | 2020-04-26 | 2021-08-17 | 广西大学 | 一种来源于玉米的黑暗响应gd2基因及其应用 |
CN114774465A (zh) * | 2022-05-31 | 2022-07-22 | 张家口市农业科学院(河北省高寒作物研究所) | 一种提高杏树坐果率的方法 |
CN115976047B (zh) * | 2022-10-19 | 2024-10-15 | 山东省农业科学院作物研究所 | 一种根发育相关基因IbSAUR36及其应用 |
WO2025003105A1 (en) * | 2023-06-29 | 2025-01-02 | Philip Morris Products S.A. | Modulation of genes coding for glutamate dehydrogenase |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1198777A (zh) * | 1995-10-06 | 1998-11-11 | 佛罗里达大学 | 有关谷氨酸脱氢酶α-和β-亚基的新多肽和多核苷酸及用法 |
Family Cites Families (23)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4987071A (en) | 1986-12-03 | 1991-01-22 | University Patents, Inc. | RNA ribozyme polymerases, dephosphorylases, restriction endoribonucleases and methods |
US5004863B2 (en) | 1986-12-03 | 2000-10-17 | Agracetus | Genetic engineering of cotton plants and lines |
US5116742A (en) | 1986-12-03 | 1992-05-26 | University Patents, Inc. | RNA ribozyme restriction endoribonucleases and methods |
AU3756889A (en) | 1988-06-01 | 1990-01-05 | The Texas A & M University System | Method for transforming plants via the shoot apex |
DE69333955D1 (de) | 1992-04-24 | 2006-02-02 | Stanford Res Inst Int | Targeting homologer sequenzen in eukaryotenzellen |
DE69333937T2 (de) | 1992-06-29 | 2006-08-31 | Gene Shears Pty. Ltd. | Nukleinsäuren und sie verwendende verfahren zur bekämpfung viraler pathogene |
KR960705036A (ko) | 1993-07-22 | 1996-10-09 | 리 비. 패어렐 | Dna 바이러스 리보자임 |
DK0733059T3 (da) | 1993-12-09 | 2000-10-16 | Univ Jefferson | Forbindelser og fremgangsmåder til site-rettede mutationer i eukaryote celler |
US6395547B1 (en) | 1994-02-17 | 2002-05-28 | Maxygen, Inc. | Methods for generating polynucleotides having desired characteristics by iterative selection and recombination |
US5605793A (en) | 1994-02-17 | 1997-02-25 | Affymax Technologies N.V. | Methods for in vitro recombination |
JPH11513256A (ja) | 1995-10-06 | 1999-11-16 | プラント ジエネテイツク システムズ エヌ.ブイ | 種子粉砕 |
US20020062495A1 (en) * | 1998-05-01 | 2002-05-23 | Robert R. Schmidt | Novel polypeptides and polynucleotides relating to the a- and b-subunits of glutamate dehydrogenases and methods of use |
GB9607517D0 (en) | 1996-04-11 | 1996-06-12 | Gene Shears Pty Ltd | The use of DNA Sequences |
GB9703146D0 (en) | 1997-02-14 | 1997-04-02 | Innes John Centre Innov Ltd | Methods and means for gene silencing in transgenic plants |
GB9710475D0 (en) | 1997-05-21 | 1997-07-16 | Zeneca Ltd | Gene silencing |
GB9720148D0 (en) | 1997-09-22 | 1997-11-26 | Innes John Centre Innov Ltd | Gene silencing materials and methods |
SI1068311T1 (sl) | 1998-04-08 | 2011-07-29 | Commw Scient Ind Res Org | Postopki in sredstva za pridobivanje modificiranih fenotipov |
CA2331327A1 (en) | 1998-06-26 | 2000-01-06 | Iowa State University Research Foundation, Inc. | Materials and methods for the alteration of enzyme and acetyl coa levels in plants |
US6555732B1 (en) | 1998-09-14 | 2003-04-29 | Pioneer Hi-Bred International, Inc. | Rac-like genes and methods of use |
AU775233B2 (en) | 1999-07-22 | 2004-07-22 | National Institute Of Agrobiological Sciences | Method for superrapid transformation of monocotyledon |
US6903246B2 (en) | 2002-05-28 | 2005-06-07 | The Regents Of The University Of California | Dehydroascorbate reductase (“DHAR”) genes from Triticum aestivum and their use to modulate ascorbic acid levels in plants |
EP1820391A1 (en) | 2006-02-17 | 2007-08-22 | CropDesign N.V. | Method and apparatus to determine the start of flowering in plants |
US20110265221A1 (en) * | 2007-07-10 | 2011-10-27 | Monsanto Technology Llc | Transgenic plants with enhanced agronomic traits |
-
2010
- 2010-09-22 CA CA2772983A patent/CA2772983A1/en not_active Abandoned
- 2010-09-22 AU AU2010299960A patent/AU2010299960A1/en not_active Abandoned
- 2010-09-22 BR BR112012006616A patent/BR112012006616A2/pt not_active IP Right Cessation
- 2010-09-22 EP EP10757195A patent/EP2480566A1/en not_active Withdrawn
- 2010-09-22 CN CN201510013277.2A patent/CN104745608A/zh active Pending
- 2010-09-22 EA EA201270440A patent/EA201270440A1/ru unknown
- 2010-09-22 MX MX2012003451A patent/MX2012003451A/es not_active Application Discontinuation
- 2010-09-22 CN CN2010800533186A patent/CN102686605A/zh active Pending
- 2010-09-22 US US13/497,854 patent/US20120180165A1/en not_active Abandoned
- 2010-09-22 WO PCT/EP2010/063931 patent/WO2011036160A1/en active Application Filing
- 2010-09-24 AR ARP100103483A patent/AR080339A1/es unknown
-
2012
- 2012-04-23 ZA ZA2012/02950A patent/ZA201202950B/en unknown
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1198777A (zh) * | 1995-10-06 | 1998-11-11 | 佛罗里达大学 | 有关谷氨酸脱氢酶α-和β-亚基的新多肽和多核苷酸及用法 |
Non-Patent Citations (4)
Title |
---|
HU, Y.等: "Lotus corniculatus var. japonicus dehydroascorbate reductase (DHAR) mRNA, complete cds", 《GENBANK DATABASE》 * |
TAIR: "Arabidopsis thaliana auxin-responsive protein, putative (AT2G21210) mRNA, complete cds", 《GENBANK DATABASE》 * |
TAIR: "Arabidopsis thaliana FLA8 (FASCICLIN-LIKE ARABINOGALACTAN PROTEIN 8) (FLA8) mRNA, complete cds", 《GENBANK DATABASE》 * |
YU, Y.等: "Zea mays full-length cDNA clone ZM_BFb0033M06 mRNA, complete cds", 《GENBANK DATABASE》 * |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111560381A (zh) * | 2020-05-21 | 2020-08-21 | 扬州大学 | 一种杨树不定根形成关键基因PeSAUR72及其应用 |
CN111560381B (zh) * | 2020-05-21 | 2021-09-07 | 扬州大学 | 一种杨树不定根形成关键基因PeSAUR72及其应用 |
CN115838408A (zh) * | 2022-12-09 | 2023-03-24 | 中国农业大学 | 一种钙调素结合蛋白MxIQM3及其编码基因与应用 |
Also Published As
Publication number | Publication date |
---|---|
ZA201202950B (en) | 2013-07-31 |
CA2772983A1 (en) | 2011-03-31 |
BR112012006616A2 (pt) | 2018-07-10 |
US20120180165A1 (en) | 2012-07-12 |
CN102686605A (zh) | 2012-09-19 |
MX2012003451A (es) | 2012-05-22 |
EP2480566A1 (en) | 2012-08-01 |
AR080339A1 (es) | 2012-04-04 |
AU2010299960A1 (en) | 2012-04-12 |
EA201270440A1 (ru) | 2012-10-30 |
WO2011036160A1 (en) | 2011-03-31 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN102656270B (zh) | 具有增强的产量相关性状的植物和用于产生该植物的方法 | |
CN102131934B (zh) | 具有增强的产量相关性状的植物及其制备方法 | |
CN104745608A (zh) | 具有增强的产量相关性状的植物及其制备方法 | |
CN104232679A (zh) | 具有增强的产量相关性状的植物及其制备方法 | |
CN104789573A (zh) | 具有增强的产量相关性状的植物及其制备方法 | |
CN103987848A (zh) | 具有增强的产量相关性状的植物及其制备方法 | |
CN104024415A (zh) | 具有增强的产量相关性状的植物及其制备方法 | |
CN102143971A (zh) | 通过过表达编码tfl-1 样蛋白的多核苷酸而具有增强的产量相关性状的植物及其制备方法 | |
CN103249836A (zh) | 具有增强的产量相关性状的植物和用于产生该植物的方法 | |
CN104530202A (zh) | 具有增强的产量相关性状的植物和用于产生该植物的方法 | |
CN102666858A (zh) | 具有增强的产量相关性状的植物和用于产生该植物的方法 | |
CN104404078A (zh) | 具有增强的产率相关性状的植物及其制备方法 | |
CN102066568A (zh) | 具有增强的产量相关性状的植物和用于产生该植物的方法 | |
CN104531751A (zh) | 具有增强的产量相关性状的植物和用于产生该植物的方法 | |
CN102257142A (zh) | 具有增强的产量相关性状的植物及其制备方法 | |
CN102317312A (zh) | 具有增强的产量相关性状和/或非生物胁迫耐受性的植物和用于制备此类植物的方法 | |
CN102099480A (zh) | 具有增强的产量相关性状的植物和用于产生该植物的方法 | |
CN104328137A (zh) | 具有增强的非生物胁迫耐受性和/或增强的产量相关性状的植物及其制备方法 | |
CN103119167A (zh) | 具有增强的产量相关性状的植物和用于产生该植物的方法 | |
CN102482333A (zh) | 具有增强的产量相关性状的植物及其制备方法 | |
CN103154254A (zh) | 具有增强的产量相关性状的植物和产生该植物的方法 | |
CN102753693B (zh) | 具有增强的产量相关性状的植物和用于产生该植物的方法 | |
CN103003432A (zh) | 具有增强的产量相关性状的植物和用于产生该植物的方法 | |
CN102892891A (zh) | 具有增强的产量相关性状的植物和用于产生该植物的方法 | |
CN103298943A (zh) | 产量相关性状增强的植物及其制备方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20150701 |
|
WD01 | Invention patent application deemed withdrawn after publication |