CN105189760A - 用于将rna聚合酶和非编码rna生物发生靶向特定基因座的方法和组合物 - Google Patents
用于将rna聚合酶和非编码rna生物发生靶向特定基因座的方法和组合物 Download PDFInfo
- Publication number
- CN105189760A CN105189760A CN201480024967.1A CN201480024967A CN105189760A CN 105189760 A CN105189760 A CN 105189760A CN 201480024967 A CN201480024967 A CN 201480024967A CN 105189760 A CN105189760 A CN 105189760A
- Authority
- CN
- China
- Prior art keywords
- domain
- protein
- nucleic acid
- recombinant
- nucleic acids
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 108
- 108090000626 DNA-directed RNA polymerases Proteins 0.000 title claims description 51
- 102000004163 DNA-directed RNA polymerases Human genes 0.000 title claims description 51
- 230000008685 targeting Effects 0.000 title description 54
- 108091027963 non-coding RNA Proteins 0.000 title description 2
- 102000042567 non-coding RNA Human genes 0.000 title description 2
- 230000008436 biogenesis Effects 0.000 title 1
- 239000000203 mixture Substances 0.000 title 1
- 230000014509 gene expression Effects 0.000 claims abstract description 124
- 230000030279 gene silencing Effects 0.000 claims abstract description 18
- 150000007523 nucleic acids Chemical class 0.000 claims description 523
- 102000039446 nucleic acids Human genes 0.000 claims description 507
- 108020004707 nucleic acids Proteins 0.000 claims description 507
- 125000003275 alpha amino acid group Chemical group 0.000 claims description 294
- 239000011701 zinc Substances 0.000 claims description 290
- HCHKCACWOHOZIP-UHFFFAOYSA-N Zinc Chemical compound [Zn] HCHKCACWOHOZIP-UHFFFAOYSA-N 0.000 claims description 287
- 229910052725 zinc Inorganic materials 0.000 claims description 287
- 230000004568 DNA-binding Effects 0.000 claims description 201
- 108090000765 processed proteins & peptides Proteins 0.000 claims description 187
- 239000012634 fragment Substances 0.000 claims description 178
- 102000004196 processed proteins & peptides Human genes 0.000 claims description 172
- 229920001184 polypeptide Polymers 0.000 claims description 168
- 108010073062 Transcription Activator-Like Effectors Proteins 0.000 claims description 56
- 101100043937 Arabidopsis thaliana SUVH9 gene Proteins 0.000 claims description 53
- 101100095738 Arabidopsis thaliana SHH1 gene Proteins 0.000 claims description 52
- 101100043929 Arabidopsis thaliana SUVH2 gene Proteins 0.000 claims description 45
- 230000007067 DNA methylation Effects 0.000 claims description 36
- 239000013604 expression vector Substances 0.000 claims description 16
- 108010048671 Homeodomain Proteins Proteins 0.000 claims description 8
- 102000009331 Homeodomain Proteins Human genes 0.000 claims description 8
- 230000008635 plant growth Effects 0.000 claims description 5
- 235000013311 vegetables Nutrition 0.000 claims description 5
- LEVWYRKDKASIDU-QWWZWVQMSA-N D-cystine Chemical compound OC(=O)[C@H](N)CSSC[C@@H](N)C(O)=O LEVWYRKDKASIDU-QWWZWVQMSA-N 0.000 claims 4
- 229960003067 cystine Drugs 0.000 claims 4
- 239000000969 carrier Substances 0.000 claims 2
- 108090000623 proteins and genes Proteins 0.000 abstract description 622
- 102000004169 proteins and genes Human genes 0.000 abstract description 554
- 108010008281 Recombinant Fusion Proteins Proteins 0.000 abstract description 28
- 102000007056 Recombinant Fusion Proteins Human genes 0.000 abstract description 28
- 230000001973 epigenetic effect Effects 0.000 abstract description 18
- 238000012226 gene silencing method Methods 0.000 abstract description 5
- 235000018102 proteins Nutrition 0.000 description 551
- 235000001014 amino acid Nutrition 0.000 description 312
- 229940024606 amino acid Drugs 0.000 description 301
- 150000001413 amino acids Chemical group 0.000 description 301
- 241000196324 Embryophyta Species 0.000 description 217
- 210000004027 cell Anatomy 0.000 description 60
- 102100020802 D(1A) dopamine receptor Human genes 0.000 description 36
- 101000931925 Homo sapiens D(1A) dopamine receptor Proteins 0.000 description 36
- 108700039010 SET domains Proteins 0.000 description 36
- 102000051614 SET domains Human genes 0.000 description 36
- 101100346178 Arabidopsis thaliana MORC6 gene Proteins 0.000 description 34
- 101100043940 Arabidopsis thaliana SUVR2 gene Proteins 0.000 description 34
- 101000927339 Pithecopus azureus Dermaseptin-H3 Proteins 0.000 description 34
- 101150117307 DRM3 gene Proteins 0.000 description 33
- 101000580370 Homo sapiens RAD52 motif-containing protein 1 Proteins 0.000 description 32
- 102100027420 RAD52 motif-containing protein 1 Human genes 0.000 description 32
- 230000027455 binding Effects 0.000 description 32
- 102100037577 FERM, ARHGEF and pleckstrin domain-containing protein 2 Human genes 0.000 description 31
- 108020004459 Small interfering RNA Proteins 0.000 description 31
- 125000003729 nucleotide group Chemical group 0.000 description 29
- 239000002773 nucleotide Substances 0.000 description 28
- 240000008042 Zea mays Species 0.000 description 26
- 239000004055 small Interfering RNA Substances 0.000 description 26
- 240000007594 Oryza sativa Species 0.000 description 25
- 235000007164 Oryza sativa Nutrition 0.000 description 25
- 235000010469 Glycine max Nutrition 0.000 description 23
- 244000068988 Glycine max Species 0.000 description 23
- 235000002017 Zea mays subsp mays Nutrition 0.000 description 23
- 235000009566 rice Nutrition 0.000 description 23
- 241000219194 Arabidopsis Species 0.000 description 22
- 108050009021 Bromodomains Proteins 0.000 description 22
- 102000001805 Bromodomains Human genes 0.000 description 22
- VYZAMTAEIAYCRO-UHFFFAOYSA-N Chromium Chemical group [Cr] VYZAMTAEIAYCRO-UHFFFAOYSA-N 0.000 description 22
- 240000006394 Sorghum bicolor Species 0.000 description 22
- 239000000539 dimer Substances 0.000 description 22
- 230000011987 methylation Effects 0.000 description 22
- 238000007069 methylation reaction Methods 0.000 description 22
- 108010077051 polycysteine Proteins 0.000 description 22
- 102000014011 SANT domains Human genes 0.000 description 21
- 108050003888 SANT domains Proteins 0.000 description 21
- 108091028043 Nucleic acid sequence Proteins 0.000 description 20
- 230000006870 function Effects 0.000 description 20
- 230000003993 interaction Effects 0.000 description 20
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 19
- 235000004443 Ricinus communis Nutrition 0.000 description 19
- 108020004414 DNA Proteins 0.000 description 17
- 210000001519 tissue Anatomy 0.000 description 17
- 241000195887 Physcomitrella patens Species 0.000 description 15
- 235000011684 Sorghum saccharatum Nutrition 0.000 description 15
- 230000002829 reductive effect Effects 0.000 description 15
- 230000001105 regulatory effect Effects 0.000 description 15
- 108700019146 Transgenes Proteins 0.000 description 14
- 241000209510 Liliopsida Species 0.000 description 13
- 235000016383 Zea mays subsp huehuetenangensis Nutrition 0.000 description 13
- 241001233957 eudicotyledons Species 0.000 description 13
- 235000009973 maize Nutrition 0.000 description 13
- 241000219828 Medicago truncatula Species 0.000 description 12
- 239000013598 vector Substances 0.000 description 12
- 230000001939 inductive effect Effects 0.000 description 11
- 102000040430 polynucleotide Human genes 0.000 description 11
- 108091033319 polynucleotide Proteins 0.000 description 11
- 239000002157 polynucleotide Substances 0.000 description 11
- 230000001568 sexual effect Effects 0.000 description 11
- 235000005824 Zea mays ssp. parviglumis Nutrition 0.000 description 10
- 235000005822 corn Nutrition 0.000 description 10
- 241001149092 Arabidopsis sp. Species 0.000 description 9
- 240000008067 Cucumis sativus Species 0.000 description 9
- ZJUKTBDSGOFHSH-WFMPWKQPSA-N S-Adenosylhomocysteine Chemical compound O[C@@H]1[C@H](O)[C@@H](CSCC[C@H](N)C(O)=O)O[C@H]1N1C2=NC=NC(N)=C2N=C1 ZJUKTBDSGOFHSH-WFMPWKQPSA-N 0.000 description 9
- 125000000539 amino acid group Chemical group 0.000 description 9
- 235000010799 Cucumis sativus var sativus Nutrition 0.000 description 8
- 238000013518 transcription Methods 0.000 description 8
- 230000035897 transcription Effects 0.000 description 8
- 101100517196 Arabidopsis thaliana NRPE1 gene Proteins 0.000 description 7
- 108010033040 Histones Proteins 0.000 description 7
- 241000218976 Populus trichocarpa Species 0.000 description 7
- 235000007230 Sorghum bicolor Nutrition 0.000 description 7
- 108050000178 Tudor domains Proteins 0.000 description 7
- 102000009322 Tudor domains Human genes 0.000 description 7
- 239000013078 crystal Substances 0.000 description 7
- 230000004048 modification Effects 0.000 description 7
- 238000012986 modification Methods 0.000 description 7
- 241000743774 Brachypodium Species 0.000 description 6
- 102000004190 Enzymes Human genes 0.000 description 6
- 108090000790 Enzymes Proteins 0.000 description 6
- 241000219823 Medicago Species 0.000 description 6
- 229910052739 hydrogen Inorganic materials 0.000 description 6
- 239000001257 hydrogen Substances 0.000 description 6
- 230000002209 hydrophobic effect Effects 0.000 description 6
- 230000007115 recruitment Effects 0.000 description 6
- 244000105624 Arachis hypogaea Species 0.000 description 5
- 108010077544 Chromatin Proteins 0.000 description 5
- 244000064895 Cucumis melo subsp melo Species 0.000 description 5
- 244000046052 Phaseolus vulgaris Species 0.000 description 5
- 241000209140 Triticum Species 0.000 description 5
- 235000021307 Triticum Nutrition 0.000 description 5
- 210000003483 chromatin Anatomy 0.000 description 5
- 230000001186 cumulative effect Effects 0.000 description 5
- 238000010586 diagram Methods 0.000 description 5
- 230000000694 effects Effects 0.000 description 5
- 230000002068 genetic effect Effects 0.000 description 5
- 229910052751 metal Inorganic materials 0.000 description 5
- 239000002184 metal Substances 0.000 description 5
- 239000013612 plasmid Substances 0.000 description 5
- 238000003753 real-time PCR Methods 0.000 description 5
- 241000894007 species Species 0.000 description 5
- 238000006467 substitution reaction Methods 0.000 description 5
- 230000017260 vegetative to reproductive phase transition of meristem Effects 0.000 description 5
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 4
- 244000299507 Gossypium hirsutum Species 0.000 description 4
- 235000017587 Medicago sativa ssp. sativa Nutrition 0.000 description 4
- 101000931108 Mus musculus DNA (cytosine-5)-methyltransferase 1 Proteins 0.000 description 4
- 241000208125 Nicotiana Species 0.000 description 4
- 235000002637 Nicotiana tabacum Nutrition 0.000 description 4
- 240000007377 Petunia x hybrida Species 0.000 description 4
- 235000010617 Phaseolus lunatus Nutrition 0.000 description 4
- 108700001094 Plant Genes Proteins 0.000 description 4
- 108091027981 Response element Proteins 0.000 description 4
- 235000002595 Solanum tuberosum Nutrition 0.000 description 4
- 244000061456 Solanum tuberosum Species 0.000 description 4
- 102000006467 TATA-Box Binding Protein Human genes 0.000 description 4
- 108010044281 TATA-Box Binding Protein Proteins 0.000 description 4
- 241000219793 Trifolium Species 0.000 description 4
- 125000003118 aryl group Chemical group 0.000 description 4
- 239000011324 bead Substances 0.000 description 4
- 230000015572 biosynthetic process Effects 0.000 description 4
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical compound NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 description 4
- 244000013123 dwarf bean Species 0.000 description 4
- 230000007613 environmental effect Effects 0.000 description 4
- 238000003780 insertion Methods 0.000 description 4
- 230000037431 insertion Effects 0.000 description 4
- 238000004519 manufacturing process Methods 0.000 description 4
- 239000013642 negative control Substances 0.000 description 4
- 230000037361 pathway Effects 0.000 description 4
- 238000002864 sequence alignment Methods 0.000 description 4
- 238000012360 testing method Methods 0.000 description 4
- 230000009261 transgenic effect Effects 0.000 description 4
- 241000589155 Agrobacterium tumefaciens Species 0.000 description 3
- 235000010777 Arachis hypogaea Nutrition 0.000 description 3
- 241000219198 Brassica Species 0.000 description 3
- 240000002791 Brassica napus Species 0.000 description 3
- 244000045232 Canavalia ensiformis Species 0.000 description 3
- 241000207199 Citrus Species 0.000 description 3
- 108020004705 Codon Proteins 0.000 description 3
- 229920000742 Cotton Polymers 0.000 description 3
- 235000009847 Cucumis melo var cantalupensis Nutrition 0.000 description 3
- 101710159156 DNA polymerase IV Proteins 0.000 description 3
- 102000052510 DNA-Binding Proteins Human genes 0.000 description 3
- -1 DRM2 Proteins 0.000 description 3
- 244000078127 Eleusine coracana Species 0.000 description 3
- 108010022894 Euchromatin Proteins 0.000 description 3
- 108700039691 Genetic Promoter Regions Proteins 0.000 description 3
- 244000020551 Helianthus annuus Species 0.000 description 3
- 235000003222 Helianthus annuus Nutrition 0.000 description 3
- 108010034791 Heterochromatin Proteins 0.000 description 3
- 206010020649 Hyperkeratosis Diseases 0.000 description 3
- 244000207740 Lemna minor Species 0.000 description 3
- 235000006439 Lemna minor Nutrition 0.000 description 3
- 235000007688 Lycopersicon esculentum Nutrition 0.000 description 3
- 239000004472 Lysine Substances 0.000 description 3
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 3
- 240000003183 Manihot esculenta Species 0.000 description 3
- 235000010627 Phaseolus vulgaris Nutrition 0.000 description 3
- 241000219843 Pisum Species 0.000 description 3
- 235000001855 Portulaca oleracea Nutrition 0.000 description 3
- 240000000528 Ricinus communis Species 0.000 description 3
- BQCADISMDOOEFD-UHFFFAOYSA-N Silver Chemical compound [Ag] BQCADISMDOOEFD-UHFFFAOYSA-N 0.000 description 3
- 240000003768 Solanum lycopersicum Species 0.000 description 3
- 244000299461 Theobroma cacao Species 0.000 description 3
- 235000009470 Theobroma cacao Nutrition 0.000 description 3
- 108700029229 Transcriptional Regulatory Elements Proteins 0.000 description 3
- 235000007244 Zea mays Nutrition 0.000 description 3
- 238000001369 bisulfite sequencing Methods 0.000 description 3
- 235000020971 citrus fruits Nutrition 0.000 description 3
- 235000005489 dwarf bean Nutrition 0.000 description 3
- 210000000632 euchromatin Anatomy 0.000 description 3
- 239000000284 extract Substances 0.000 description 3
- 210000004458 heterochromatin Anatomy 0.000 description 3
- 235000018977 lysine Nutrition 0.000 description 3
- 150000002739 metals Chemical class 0.000 description 3
- 235000020232 peanut Nutrition 0.000 description 3
- 229920000642 polymer Polymers 0.000 description 3
- 239000000047 product Substances 0.000 description 3
- 238000003259 recombinant expression Methods 0.000 description 3
- 238000011160 research Methods 0.000 description 3
- 229910052709 silver Inorganic materials 0.000 description 3
- 239000004332 silver Substances 0.000 description 3
- 230000005026 transcription initiation Effects 0.000 description 3
- ZBMRKNMTMPPMMK-UHFFFAOYSA-N 2-amino-4-[hydroxy(methyl)phosphoryl]butanoic acid;azane Chemical compound [NH4+].CP(O)(=O)CCC(N)C([O-])=O ZBMRKNMTMPPMMK-UHFFFAOYSA-N 0.000 description 2
- 235000007173 Abies balsamea Nutrition 0.000 description 2
- 244000283070 Abies balsamea Species 0.000 description 2
- 101710197650 Actin-7 Proteins 0.000 description 2
- 108700028369 Alleles Proteins 0.000 description 2
- 244000144725 Amygdalus communis Species 0.000 description 2
- 235000011437 Amygdalus communis Nutrition 0.000 description 2
- 244000226021 Anacardium occidentale Species 0.000 description 2
- 244000099147 Ananas comosus Species 0.000 description 2
- 235000007119 Ananas comosus Nutrition 0.000 description 2
- 101100095739 Arabidopsis thaliana SHH2 gene Proteins 0.000 description 2
- 235000017060 Arachis glabrata Nutrition 0.000 description 2
- 235000018262 Arachis monticola Nutrition 0.000 description 2
- 244000075850 Avena orientalis Species 0.000 description 2
- 108091032955 Bacterial small RNA Proteins 0.000 description 2
- 235000011331 Brassica Nutrition 0.000 description 2
- 235000011293 Brassica napus Nutrition 0.000 description 2
- 235000004977 Brassica sinapistrum Nutrition 0.000 description 2
- 241000209200 Bromus Species 0.000 description 2
- 241001674345 Callitropsis nootkatensis Species 0.000 description 2
- 244000025254 Cannabis sativa Species 0.000 description 2
- 235000009467 Carica papaya Nutrition 0.000 description 2
- 240000006432 Carica papaya Species 0.000 description 2
- 235000003255 Carthamus tinctorius Nutrition 0.000 description 2
- 244000020518 Carthamus tinctorius Species 0.000 description 2
- 108091026890 Coding region Proteins 0.000 description 2
- 241000723377 Coffea Species 0.000 description 2
- 241000218631 Coniferophyta Species 0.000 description 2
- 108700020911 DNA-Binding Proteins Proteins 0.000 description 2
- 235000009355 Dianthus caryophyllus Nutrition 0.000 description 2
- 240000006497 Dianthus caryophyllus Species 0.000 description 2
- 235000013499 Eleusine coracana subsp coracana Nutrition 0.000 description 2
- 101000939283 Escherichia coli (strain K12) Protein UmuC Proteins 0.000 description 2
- 101000939288 Escherichia coli (strain K12) Protein UmuD Proteins 0.000 description 2
- 240000002395 Euphorbia pulcherrima Species 0.000 description 2
- 239000004471 Glycine Substances 0.000 description 2
- 235000005206 Hibiscus Nutrition 0.000 description 2
- 235000007185 Hibiscus lunariifolius Nutrition 0.000 description 2
- 244000284380 Hibiscus rosa sinensis Species 0.000 description 2
- 108091016366 Histone-lysine N-methyltransferase EHMT1 Proteins 0.000 description 2
- 101000760417 Homo sapiens E3 ubiquitin-protein ligase UHRF1 Proteins 0.000 description 2
- 101001070498 Homo sapiens Golgin subfamily A member 6A Proteins 0.000 description 2
- 101000877314 Homo sapiens Histone-lysine N-methyltransferase EHMT1 Proteins 0.000 description 2
- 244000267823 Hydrangea macrophylla Species 0.000 description 2
- 235000014486 Hydrangea macrophylla Nutrition 0.000 description 2
- XUJNEKJLAYXESH-REOHCLBHSA-N L-Cysteine Chemical compound SC[C@H](N)C(O)=O XUJNEKJLAYXESH-REOHCLBHSA-N 0.000 description 2
- FFEARJCKVFRZRR-BYPYZUCNSA-N L-methionine Chemical compound CSCC[C@H](N)C(O)=O FFEARJCKVFRZRR-BYPYZUCNSA-N 0.000 description 2
- 235000003228 Lactuca sativa Nutrition 0.000 description 2
- 240000008415 Lactuca sativa Species 0.000 description 2
- 235000014647 Lens culinaris subsp culinaris Nutrition 0.000 description 2
- 241000209082 Lolium Species 0.000 description 2
- 241000219745 Lupinus Species 0.000 description 2
- 241000208467 Macadamia Species 0.000 description 2
- 235000014826 Mangifera indica Nutrition 0.000 description 2
- 240000007228 Mangifera indica Species 0.000 description 2
- 238000000585 Mann–Whitney U test Methods 0.000 description 2
- 108060004795 Methyltransferase Proteins 0.000 description 2
- 102000016397 Methyltransferase Human genes 0.000 description 2
- 241000234479 Narcissus Species 0.000 description 2
- 240000002853 Nelumbo nucifera Species 0.000 description 2
- 235000006508 Nelumbo nucifera Nutrition 0.000 description 2
- 235000006510 Nelumbo pentapetala Nutrition 0.000 description 2
- 241000207746 Nicotiana benthamiana Species 0.000 description 2
- 240000007817 Olea europaea Species 0.000 description 2
- 240000008114 Panicum miliaceum Species 0.000 description 2
- 235000007199 Panicum miliaceum Nutrition 0.000 description 2
- 235000007195 Pennisetum typhoides Nutrition 0.000 description 2
- 108091093037 Peptide nucleic acid Proteins 0.000 description 2
- 244000025272 Persea americana Species 0.000 description 2
- 235000008673 Persea americana Nutrition 0.000 description 2
- 241000219833 Phaseolus Species 0.000 description 2
- 241000218606 Pinus contorta Species 0.000 description 2
- 235000013267 Pinus ponderosa Nutrition 0.000 description 2
- 235000008577 Pinus radiata Nutrition 0.000 description 2
- 241000218621 Pinus radiata Species 0.000 description 2
- 235000008566 Pinus taeda Nutrition 0.000 description 2
- 241000218679 Pinus taeda Species 0.000 description 2
- 235000010582 Pisum sativum Nutrition 0.000 description 2
- 241000209504 Poaceae Species 0.000 description 2
- 240000001416 Pseudotsuga menziesii Species 0.000 description 2
- 241000208422 Rhododendron Species 0.000 description 2
- 235000011449 Rosa Nutrition 0.000 description 2
- 241000220317 Rosa Species 0.000 description 2
- 235000007238 Secale cereale Nutrition 0.000 description 2
- 244000082988 Secale cereale Species 0.000 description 2
- 240000005498 Setaria italica Species 0.000 description 2
- 244000062793 Sorghum vulgare Species 0.000 description 2
- 244000269722 Thea sinensis Species 0.000 description 2
- 241000218638 Thuja plicata Species 0.000 description 2
- 241000723573 Tobacco rattle virus Species 0.000 description 2
- 108020004566 Transfer RNA Proteins 0.000 description 2
- 241000219873 Vicia Species 0.000 description 2
- 240000006677 Vicia faba Species 0.000 description 2
- 235000002096 Vicia faba var. equina Nutrition 0.000 description 2
- 241000219977 Vigna Species 0.000 description 2
- 241000700605 Viruses Species 0.000 description 2
- 241000219095 Vitis Species 0.000 description 2
- 235000009392 Vitis Nutrition 0.000 description 2
- PTFCDOFLOPIGGS-UHFFFAOYSA-N Zinc dication Chemical compound [Zn+2] PTFCDOFLOPIGGS-UHFFFAOYSA-N 0.000 description 2
- 238000009825 accumulation Methods 0.000 description 2
- DZBUGLKDJFMEHC-UHFFFAOYSA-N acridine Chemical compound C1=CC=CC2=CC3=CC=CC=C3N=C21 DZBUGLKDJFMEHC-UHFFFAOYSA-N 0.000 description 2
- PYMYPHUHKUWMLA-LMVFSUKVSA-N aldehydo-D-ribose Chemical compound OC[C@@H](O)[C@@H](O)[C@@H](O)C=O PYMYPHUHKUWMLA-LMVFSUKVSA-N 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 2
- 238000003491 array Methods 0.000 description 2
- 230000024245 cell differentiation Effects 0.000 description 2
- 230000000295 complement effect Effects 0.000 description 2
- 229940104302 cytosine Drugs 0.000 description 2
- 230000001419 dependent effect Effects 0.000 description 2
- 239000003599 detergent Substances 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000018109 developmental process Effects 0.000 description 2
- 238000010828 elution Methods 0.000 description 2
- 210000002257 embryonic structure Anatomy 0.000 description 2
- 230000002255 enzymatic effect Effects 0.000 description 2
- 238000011049 filling Methods 0.000 description 2
- 102000055817 human GOLGA6A Human genes 0.000 description 2
- 102000046888 human UHRF1 Human genes 0.000 description 2
- 125000001165 hydrophobic group Chemical group 0.000 description 2
- 230000009878 intermolecular interaction Effects 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 229930182817 methionine Natural products 0.000 description 2
- 235000019713 millet Nutrition 0.000 description 2
- 108091005573 modified proteins Proteins 0.000 description 2
- 102000035118 modified proteins Human genes 0.000 description 2
- 230000035772 mutation Effects 0.000 description 2
- 210000000056 organ Anatomy 0.000 description 2
- ZCCUUQDIBDJBTK-UHFFFAOYSA-N psoralen Chemical compound C1=C2OC(=O)C=CC2=CC2=C1OC=C2 ZCCUUQDIBDJBTK-UHFFFAOYSA-N 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 150000003384 small molecules Chemical class 0.000 description 2
- 238000003786 synthesis reaction Methods 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 239000010981 turquoise Substances 0.000 description 2
- 238000011179 visual inspection Methods 0.000 description 2
- 102000040650 (ribonucleotides)n+m Human genes 0.000 description 1
- ASJSAQIRZKANQN-CRCLSJGQSA-N 2-deoxy-D-ribose Chemical compound OC[C@@H](O)[C@@H](O)CC=O ASJSAQIRZKANQN-CRCLSJGQSA-N 0.000 description 1
- VXGRJERITKFWPL-UHFFFAOYSA-N 4',5'-Dihydropsoralen Natural products C1=C2OC(=O)C=CC2=CC2=C1OCC2 VXGRJERITKFWPL-UHFFFAOYSA-N 0.000 description 1
- 241000218642 Abies Species 0.000 description 1
- 235000004507 Abies alba Nutrition 0.000 description 1
- 244000178606 Abies grandis Species 0.000 description 1
- 235000017894 Abies grandis Nutrition 0.000 description 1
- 235000004710 Abies lasiocarpa Nutrition 0.000 description 1
- 240000005020 Acaciella glauca Species 0.000 description 1
- 102000007469 Actins Human genes 0.000 description 1
- 108010085238 Actins Proteins 0.000 description 1
- 240000007241 Agrostis stolonifera Species 0.000 description 1
- 101710187578 Alcohol dehydrogenase 1 Proteins 0.000 description 1
- 102100034035 Alcohol dehydrogenase 1A Human genes 0.000 description 1
- 235000001274 Anacardium occidentale Nutrition 0.000 description 1
- 241000207875 Antirrhinum Species 0.000 description 1
- 108700040321 Arabidopsis SPP Proteins 0.000 description 1
- 108700030646 Arabidopsis SUVR2 Proteins 0.000 description 1
- 241000219195 Arabidopsis thaliana Species 0.000 description 1
- 101100055685 Arabidopsis thaliana AP1 gene Proteins 0.000 description 1
- 101100422775 Arabidopsis thaliana SUP gene Proteins 0.000 description 1
- 235000003911 Arachis Nutrition 0.000 description 1
- 235000007826 Arachis sp Nutrition 0.000 description 1
- 244000298916 Arachis sp Species 0.000 description 1
- 239000004475 Arginine Substances 0.000 description 1
- DCXYFEDJOCDNAF-UHFFFAOYSA-N Asparagine Natural products OC(=O)C(N)CC(N)=O DCXYFEDJOCDNAF-UHFFFAOYSA-N 0.000 description 1
- 235000005340 Asparagus officinalis Nutrition 0.000 description 1
- 241001106067 Atropa Species 0.000 description 1
- 235000005781 Avena Nutrition 0.000 description 1
- 235000007319 Avena orientalis Nutrition 0.000 description 1
- 108010077805 Bacterial Proteins Proteins 0.000 description 1
- 208000035143 Bacterial infection Diseases 0.000 description 1
- 235000021533 Beta vulgaris Nutrition 0.000 description 1
- 241000335053 Beta vulgaris Species 0.000 description 1
- 241000219310 Beta vulgaris subsp. vulgaris Species 0.000 description 1
- LSNNMFCWUKXFEE-UHFFFAOYSA-M Bisulfite Chemical compound OS([O-])=O LSNNMFCWUKXFEE-UHFFFAOYSA-M 0.000 description 1
- ZOXJGFHDIHLPTG-UHFFFAOYSA-N Boron Chemical compound [B] ZOXJGFHDIHLPTG-UHFFFAOYSA-N 0.000 description 1
- 235000014698 Brassica juncea var multisecta Nutrition 0.000 description 1
- 235000006008 Brassica napus var napus Nutrition 0.000 description 1
- 240000000385 Brassica napus var. napus Species 0.000 description 1
- 240000008100 Brassica rapa Species 0.000 description 1
- 235000011292 Brassica rapa Nutrition 0.000 description 1
- 235000006618 Brassica rapa subsp oleifera Nutrition 0.000 description 1
- 235000000540 Brassica rapa subsp rapa Nutrition 0.000 description 1
- 235000004936 Bromus mango Nutrition 0.000 description 1
- 101100507655 Canis lupus familiaris HSPA1 gene Proteins 0.000 description 1
- 235000002566 Capsicum Nutrition 0.000 description 1
- 240000008574 Capsicum frutescens Species 0.000 description 1
- 235000013912 Ceratonia siliqua Nutrition 0.000 description 1
- 240000008886 Ceratonia siliqua Species 0.000 description 1
- 108010004539 Chalcone isomerase Proteins 0.000 description 1
- 235000007516 Chrysanthemum Nutrition 0.000 description 1
- 244000189548 Chrysanthemum x morifolium Species 0.000 description 1
- 235000010523 Cicer arietinum Nutrition 0.000 description 1
- 244000045195 Cicer arietinum Species 0.000 description 1
- 108010061190 Cinnamyl-alcohol dehydrogenase Proteins 0.000 description 1
- 235000013162 Cocos nucifera Nutrition 0.000 description 1
- 244000060011 Cocos nucifera Species 0.000 description 1
- 108700010070 Codon Usage Proteins 0.000 description 1
- 241000522193 Coronilla Species 0.000 description 1
- 241000219112 Cucumis Species 0.000 description 1
- 235000015510 Cucumis melo subsp melo Nutrition 0.000 description 1
- 235000010071 Cucumis prophetarum Nutrition 0.000 description 1
- 241000219122 Cucurbita Species 0.000 description 1
- 244000007835 Cyamopsis tetragonoloba Species 0.000 description 1
- 101150059141 DMS3 gene Proteins 0.000 description 1
- 230000030933 DNA methylation on cytosine Effects 0.000 description 1
- 101710096438 DNA-binding protein Proteins 0.000 description 1
- 101150110160 DRD1 gene Proteins 0.000 description 1
- 101150053091 DRM2 gene Proteins 0.000 description 1
- 241000208296 Datura Species 0.000 description 1
- 241000208175 Daucus Species 0.000 description 1
- 101100477411 Dictyostelium discoideum set1 gene Proteins 0.000 description 1
- 240000001879 Digitalis lutea Species 0.000 description 1
- 235000014466 Douglas bleu Nutrition 0.000 description 1
- 235000007349 Eleusine coracana Nutrition 0.000 description 1
- 241000234643 Festuca arundinacea Species 0.000 description 1
- 241000220223 Fragaria Species 0.000 description 1
- 108700007698 Genetic Terminator Regions Proteins 0.000 description 1
- 241000208152 Geranium Species 0.000 description 1
- 229930191978 Gibberellin Natural products 0.000 description 1
- 101710166358 Globin-1 Proteins 0.000 description 1
- WHUUTDBJXJRKMK-UHFFFAOYSA-N Glutamic acid Natural products OC(=O)C(N)CCC(O)=O WHUUTDBJXJRKMK-UHFFFAOYSA-N 0.000 description 1
- 102000005720 Glutathione transferase Human genes 0.000 description 1
- 108010070675 Glutathione transferase Proteins 0.000 description 1
- 101710115777 Glycine-rich cell wall structural protein 2 Proteins 0.000 description 1
- 101710168683 Glycine-rich protein 1 Proteins 0.000 description 1
- 240000000047 Gossypium barbadense Species 0.000 description 1
- 235000009429 Gossypium barbadense Nutrition 0.000 description 1
- 235000009432 Gossypium hirsutum Nutrition 0.000 description 1
- HVLSXIKZNLPZJJ-TXZCQADKSA-N HA peptide Chemical compound C([C@@H](C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](C)C(O)=O)NC(=O)[C@H]1N(CCC1)C(=O)[C@@H](N)CC=1C=CC(O)=CC=1)C1=CC=C(O)C=C1 HVLSXIKZNLPZJJ-TXZCQADKSA-N 0.000 description 1
- 108010004889 Heat-Shock Proteins Proteins 0.000 description 1
- 102000002812 Heat-Shock Proteins Human genes 0.000 description 1
- 241000208818 Helianthus Species 0.000 description 1
- 108010093488 His-His-His-His-His-His Proteins 0.000 description 1
- 102000006947 Histones Human genes 0.000 description 1
- 101000615488 Homo sapiens Methyl-CpG-binding domain protein 2 Proteins 0.000 description 1
- 241000209219 Hordeum Species 0.000 description 1
- 240000005979 Hordeum vulgare Species 0.000 description 1
- 235000007340 Hordeum vulgare Nutrition 0.000 description 1
- 241000208278 Hyoscyamus Species 0.000 description 1
- 206010021143 Hypoxia Diseases 0.000 description 1
- 244000017020 Ipomoea batatas Species 0.000 description 1
- 235000002678 Ipomoea batatas Nutrition 0.000 description 1
- 241000758789 Juglans Species 0.000 description 1
- 235000013757 Juglans Nutrition 0.000 description 1
- FAIXYKHYOGVFKA-UHFFFAOYSA-N Kinetin Natural products N=1C=NC=2N=CNC=2C=1N(C)C1=CC=CO1 FAIXYKHYOGVFKA-UHFFFAOYSA-N 0.000 description 1
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 description 1
- DCXYFEDJOCDNAF-REOHCLBHSA-N L-asparagine Chemical compound OC(=O)[C@@H](N)CC(N)=O DCXYFEDJOCDNAF-REOHCLBHSA-N 0.000 description 1
- CKLJMWTZIZZHCS-REOHCLBHSA-N L-aspartic acid Chemical compound OC(=O)[C@@H](N)CC(O)=O CKLJMWTZIZZHCS-REOHCLBHSA-N 0.000 description 1
- AGPKZVBTJJNPAG-WHFBIAKZSA-N L-isoleucine Chemical compound CC[C@H](C)[C@H](N)C(O)=O AGPKZVBTJJNPAG-WHFBIAKZSA-N 0.000 description 1
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 description 1
- COLNVLDHVKWLRT-QMMMGPOBSA-N L-phenylalanine Chemical compound OC(=O)[C@@H](N)CC1=CC=CC=C1 COLNVLDHVKWLRT-QMMMGPOBSA-N 0.000 description 1
- QIVBCDIJIAJPQS-VIFPVBQESA-N L-tryptophane Chemical compound C1=CC=C2C(C[C@H](N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-VIFPVBQESA-N 0.000 description 1
- OUYCCCASQSFEME-QMMMGPOBSA-N L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-QMMMGPOBSA-N 0.000 description 1
- KZSNJWFQEVHDMF-BYPYZUCNSA-N L-valine Chemical compound CC(C)[C@H](N)C(O)=O KZSNJWFQEVHDMF-BYPYZUCNSA-N 0.000 description 1
- 241000208822 Lactuca Species 0.000 description 1
- 241000219729 Lathyrus Species 0.000 description 1
- 108090001090 Lectins Proteins 0.000 description 1
- 102000004856 Lectins Human genes 0.000 description 1
- 241000209499 Lemna Species 0.000 description 1
- 240000004322 Lens culinaris Species 0.000 description 1
- 244000043158 Lens esculenta Species 0.000 description 1
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 description 1
- 241000208204 Linum Species 0.000 description 1
- 241000227653 Lycopersicon Species 0.000 description 1
- 235000002262 Lycopersicon Nutrition 0.000 description 1
- 101150039887 MORC6 gene Proteins 0.000 description 1
- 241000121629 Majorana Species 0.000 description 1
- 101710175625 Maltose/maltodextrin-binding periplasmic protein Proteins 0.000 description 1
- 241000124008 Mammalia Species 0.000 description 1
- 235000004456 Manihot esculenta Nutrition 0.000 description 1
- 235000016735 Manihot esculenta subsp esculenta Nutrition 0.000 description 1
- VPRLICVDSGMIKO-UHFFFAOYSA-N Mannopine Natural products NC(=O)CCC(C(O)=O)NCC(O)C(O)C(O)C(O)CO VPRLICVDSGMIKO-UHFFFAOYSA-N 0.000 description 1
- 241001565331 Margarodes Species 0.000 description 1
- 240000004658 Medicago sativa Species 0.000 description 1
- 235000010624 Medicago sativa Nutrition 0.000 description 1
- 241000213996 Melilotus Species 0.000 description 1
- 101100409013 Mesembryanthemum crystallinum PPD gene Proteins 0.000 description 1
- 102100021299 Methyl-CpG-binding domain protein 2 Human genes 0.000 description 1
- 241000234295 Musa Species 0.000 description 1
- 240000005561 Musa balbisiana Species 0.000 description 1
- 235000018290 Musa x paradisiaca Nutrition 0.000 description 1
- 102100038895 Myc proto-oncogene protein Human genes 0.000 description 1
- 101710135898 Myc proto-oncogene protein Proteins 0.000 description 1
- 229930182474 N-glycoside Natural products 0.000 description 1
- 241001282315 Nemesis Species 0.000 description 1
- 206010028980 Neoplasm Diseases 0.000 description 1
- 244000061176 Nicotiana tabacum Species 0.000 description 1
- 108010047956 Nucleosomes Proteins 0.000 description 1
- 235000002725 Olea europaea Nutrition 0.000 description 1
- 108010038807 Oligopeptides Proteins 0.000 description 1
- 102000015636 Oligopeptides Human genes 0.000 description 1
- 102000043276 Oncogene Human genes 0.000 description 1
- 108700020796 Oncogene Proteins 0.000 description 1
- 241000219830 Onobrychis Species 0.000 description 1
- 241000209094 Oryza Species 0.000 description 1
- 101710091688 Patatin Proteins 0.000 description 1
- 241000208181 Pelargonium Species 0.000 description 1
- 241000209046 Pennisetum Species 0.000 description 1
- 244000038248 Pennisetum spicatum Species 0.000 description 1
- 229930046231 Phaseol Natural products 0.000 description 1
- 235000006089 Phaseolus angularis Nutrition 0.000 description 1
- 244000100170 Phaseolus lunatus Species 0.000 description 1
- 108091000041 Phosphoenolpyruvate Carboxylase Proteins 0.000 description 1
- ABLZXFCXXLZCGV-UHFFFAOYSA-N Phosphorous acid Chemical class OP(O)=O ABLZXFCXXLZCGV-UHFFFAOYSA-N 0.000 description 1
- 240000000020 Picea glauca Species 0.000 description 1
- 235000008127 Picea glauca Nutrition 0.000 description 1
- 241000218595 Picea sitchensis Species 0.000 description 1
- 235000008593 Pinus contorta Nutrition 0.000 description 1
- 235000011334 Pinus elliottii Nutrition 0.000 description 1
- 241000142776 Pinus elliottii Species 0.000 description 1
- 244000019397 Pinus jeffreyi Species 0.000 description 1
- 241000555277 Pinus ponderosa Species 0.000 description 1
- 235000013269 Pinus ponderosa var ponderosa Nutrition 0.000 description 1
- 235000013268 Pinus ponderosa var scopulorum Nutrition 0.000 description 1
- 240000004713 Pisum sativum Species 0.000 description 1
- 108020005120 Plant DNA Proteins 0.000 description 1
- 108700040121 Protein Methyltransferases Proteins 0.000 description 1
- 102000055027 Protein Methyltransferases Human genes 0.000 description 1
- 108010076504 Protein Sorting Signals Proteins 0.000 description 1
- 108091008109 Pseudogenes Proteins 0.000 description 1
- 102000057361 Pseudogenes Human genes 0.000 description 1
- 235000008572 Pseudotsuga menziesii Nutrition 0.000 description 1
- 235000005386 Pseudotsuga menziesii var menziesii Nutrition 0.000 description 1
- 241000508269 Psidium Species 0.000 description 1
- 240000001679 Psidium guajava Species 0.000 description 1
- 235000013929 Psidium pyriferum Nutrition 0.000 description 1
- KDCGOANMDULRCW-UHFFFAOYSA-N Purine Natural products N1=CNC2=NC=NC2=C1 KDCGOANMDULRCW-UHFFFAOYSA-N 0.000 description 1
- CZPWVGJYEJSRLH-UHFFFAOYSA-N Pyrimidine Chemical compound C1=CN=CN=C1 CZPWVGJYEJSRLH-UHFFFAOYSA-N 0.000 description 1
- 244000184734 Pyrus japonica Species 0.000 description 1
- 101150090155 R gene Proteins 0.000 description 1
- 101150018532 RDM1 gene Proteins 0.000 description 1
- 241000232299 Ralstonia Species 0.000 description 1
- 241000218206 Ranunculus Species 0.000 description 1
- 241000220259 Raphanus Species 0.000 description 1
- 108700005075 Regulator Genes Proteins 0.000 description 1
- 108010003581 Ribulose-bisphosphate carboxylase Proteins 0.000 description 1
- 101150083106 SHH1 gene Proteins 0.000 description 1
- 101150105265 SUVH2 gene Proteins 0.000 description 1
- 101150072195 SUVH9 gene Proteins 0.000 description 1
- 101150004238 SUVR2 gene Proteins 0.000 description 1
- 241000209051 Saccharum Species 0.000 description 1
- 240000000111 Saccharum officinarum Species 0.000 description 1
- 235000007201 Saccharum officinarum Nutrition 0.000 description 1
- 241001106018 Salpiglossis Species 0.000 description 1
- 241000209056 Secale Species 0.000 description 1
- 241000780602 Senecio Species 0.000 description 1
- 241001138418 Sequoia sempervirens Species 0.000 description 1
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 description 1
- 235000008515 Setaria glauca Nutrition 0.000 description 1
- 235000007226 Setaria italica Nutrition 0.000 description 1
- 241000220261 Sinapis Species 0.000 description 1
- 108091027967 Small hairpin RNA Proteins 0.000 description 1
- 235000002634 Solanum Nutrition 0.000 description 1
- 241000207763 Solanum Species 0.000 description 1
- 235000009184 Spondias indica Nutrition 0.000 description 1
- 235000021536 Sugar beet Nutrition 0.000 description 1
- 235000006468 Thea sinensis Nutrition 0.000 description 1
- 235000009430 Thespesia populnea Nutrition 0.000 description 1
- AYFVYJQAPQTCCC-UHFFFAOYSA-N Threonine Natural products CC(O)C(N)C(O)=O AYFVYJQAPQTCCC-UHFFFAOYSA-N 0.000 description 1
- 239000004473 Threonine Substances 0.000 description 1
- 101710150448 Transcriptional regulator Myc Proteins 0.000 description 1
- 241001312519 Trigonella Species 0.000 description 1
- 235000001484 Trigonella foenum graecum Nutrition 0.000 description 1
- 244000250129 Trigonella foenum graecum Species 0.000 description 1
- QIVBCDIJIAJPQS-UHFFFAOYSA-N Tryptophan Natural products C1=CC=C2C(CC(N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-UHFFFAOYSA-N 0.000 description 1
- 235000008554 Tsuga heterophylla Nutrition 0.000 description 1
- 240000003021 Tsuga heterophylla Species 0.000 description 1
- 241000722923 Tulipa Species 0.000 description 1
- 241000722921 Tulipa gesneriana Species 0.000 description 1
- 108090000848 Ubiquitin Proteins 0.000 description 1
- 102000044159 Ubiquitin Human genes 0.000 description 1
- KZSNJWFQEVHDMF-UHFFFAOYSA-N Valine Natural products CC(C)C(N)C(O)=O KZSNJWFQEVHDMF-UHFFFAOYSA-N 0.000 description 1
- 235000010749 Vicia faba Nutrition 0.000 description 1
- 235000002098 Vicia faba var. major Nutrition 0.000 description 1
- 235000010711 Vigna angularis Nutrition 0.000 description 1
- 240000007098 Vigna angularis Species 0.000 description 1
- 240000004922 Vigna radiata Species 0.000 description 1
- 235000010721 Vigna radiata var radiata Nutrition 0.000 description 1
- 235000011469 Vigna radiata var sublobata Nutrition 0.000 description 1
- 235000010726 Vigna sinensis Nutrition 0.000 description 1
- 208000036142 Viral infection Diseases 0.000 description 1
- 235000014787 Vitis vinifera Nutrition 0.000 description 1
- 240000006365 Vitis vinifera Species 0.000 description 1
- 241000589634 Xanthomonas Species 0.000 description 1
- 229920002494 Zein Polymers 0.000 description 1
- 108010017070 Zinc Finger Nucleases Proteins 0.000 description 1
- 101710185494 Zinc finger protein Proteins 0.000 description 1
- 102100023597 Zinc finger protein 816 Human genes 0.000 description 1
- FJJCIZWZNKZHII-UHFFFAOYSA-N [4,6-bis(cyanoamino)-1,3,5-triazin-2-yl]cyanamide Chemical compound N#CNC1=NC(NC#N)=NC(NC#N)=N1 FJJCIZWZNKZHII-UHFFFAOYSA-N 0.000 description 1
- 239000002253 acid Substances 0.000 description 1
- 230000002378 acidificating effect Effects 0.000 description 1
- 150000007513 acids Chemical class 0.000 description 1
- 238000007792 addition Methods 0.000 description 1
- 244000193174 agave Species 0.000 description 1
- 235000004279 alanine Nutrition 0.000 description 1
- 235000020224 almond Nutrition 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- PYMYPHUHKUWMLA-UHFFFAOYSA-N arabinose Natural products OCC(O)C(O)C(O)C=O PYMYPHUHKUWMLA-UHFFFAOYSA-N 0.000 description 1
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 description 1
- 235000009582 asparagine Nutrition 0.000 description 1
- 229960001230 asparagine Drugs 0.000 description 1
- 235000003704 aspartic acid Nutrition 0.000 description 1
- 208000022362 bacterial infectious disease Diseases 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- SRBFZHDQGSBBOR-UHFFFAOYSA-N beta-D-Pyranose-Lyxose Natural products OC1COC(O)C(O)C1O SRBFZHDQGSBBOR-UHFFFAOYSA-N 0.000 description 1
- OQFSQFPPLPISGP-UHFFFAOYSA-N beta-carboxyaspartic acid Natural products OC(=O)C(N)C(C(O)=O)C(O)=O OQFSQFPPLPISGP-UHFFFAOYSA-N 0.000 description 1
- 230000033228 biological regulation Effects 0.000 description 1
- 229910052796 boron Inorganic materials 0.000 description 1
- 210000004899 c-terminal region Anatomy 0.000 description 1
- 239000001390 capsicum minimum Substances 0.000 description 1
- 150000004657 carbamic acid derivatives Chemical class 0.000 description 1
- 235000020226 cashew nut Nutrition 0.000 description 1
- 238000004113 cell culture Methods 0.000 description 1
- 210000002421 cell wall Anatomy 0.000 description 1
- 229920002678 cellulose Polymers 0.000 description 1
- 239000001913 cellulose Substances 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 239000002738 chelating agent Substances 0.000 description 1
- 238000007385 chemical modification Methods 0.000 description 1
- 210000003763 chloroplast Anatomy 0.000 description 1
- 102000022628 chromatin binding proteins Human genes 0.000 description 1
- 108091013410 chromatin binding proteins Proteins 0.000 description 1
- 238000002487 chromatin immunoprecipitation Methods 0.000 description 1
- 230000019113 chromatin silencing Effects 0.000 description 1
- 108091006090 chromatin-associated proteins Proteins 0.000 description 1
- 230000002759 chromosomal effect Effects 0.000 description 1
- 238000010367 cloning Methods 0.000 description 1
- 230000008645 cold stress Effects 0.000 description 1
- 230000001276 controlling effect Effects 0.000 description 1
- 244000038559 crop plants Species 0.000 description 1
- 238000002425 crystallisation Methods 0.000 description 1
- 230000008025 crystallization Effects 0.000 description 1
- 238000005520 cutting process Methods 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 230000002939 deleterious effect Effects 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 230000017858 demethylation Effects 0.000 description 1
- 238000010520 demethylation reaction Methods 0.000 description 1
- 230000001066 destructive effect Effects 0.000 description 1
- NAGJZTKCGNOGPW-UHFFFAOYSA-K dioxido-sulfanylidene-sulfido-$l^{5}-phosphane Chemical compound [O-]P([O-])([S-])=S NAGJZTKCGNOGPW-UHFFFAOYSA-K 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 230000009977 dual effect Effects 0.000 description 1
- 235000013399 edible fruits Nutrition 0.000 description 1
- 239000012636 effector Substances 0.000 description 1
- 230000009881 electrostatic interaction Effects 0.000 description 1
- 239000003623 enhancer Substances 0.000 description 1
- 210000001339 epidermal cell Anatomy 0.000 description 1
- 108010060641 flavanone synthetase Proteins 0.000 description 1
- 238000010230 functional analysis Methods 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 102000037865 fusion proteins Human genes 0.000 description 1
- 108020001507 fusion proteins Proteins 0.000 description 1
- 230000037440 gene silencing effect Effects 0.000 description 1
- 239000003448 gibberellin Substances 0.000 description 1
- IXORZMNAPKEEDV-OBDJNFEBSA-N gibberellin A3 Chemical class C([C@@]1(O)C(=C)C[C@@]2(C1)[C@H]1C(O)=O)C[C@H]2[C@]2(C=C[C@@H]3O)[C@H]1[C@]3(C)C(=O)O2 IXORZMNAPKEEDV-OBDJNFEBSA-N 0.000 description 1
- 235000013922 glutamic acid Nutrition 0.000 description 1
- 239000004220 glutamic acid Substances 0.000 description 1
- ZDXPYRJPNDTMRX-UHFFFAOYSA-N glutamine Natural products OC(=O)C(N)CCC(N)=O ZDXPYRJPNDTMRX-UHFFFAOYSA-N 0.000 description 1
- 235000002532 grape seed extract Nutrition 0.000 description 1
- 235000021331 green beans Nutrition 0.000 description 1
- 230000012010 growth Effects 0.000 description 1
- 238000003306 harvesting Methods 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 230000008642 heat stress Effects 0.000 description 1
- HNDVDQJCIGZPNO-UHFFFAOYSA-N histidine Natural products OC(=O)C(N)CC1=CN=CN1 HNDVDQJCIGZPNO-UHFFFAOYSA-N 0.000 description 1
- 230000006197 histone deacetylation Effects 0.000 description 1
- 238000002744 homologous recombination Methods 0.000 description 1
- 230000006801 homologous recombination Effects 0.000 description 1
- 230000007954 hypoxia Effects 0.000 description 1
- 230000001900 immune effect Effects 0.000 description 1
- 238000012001 immunoprecipitation mass spectrometry Methods 0.000 description 1
- 230000008676 import Effects 0.000 description 1
- 230000001976 improved effect Effects 0.000 description 1
- 238000001727 in vivo Methods 0.000 description 1
- 230000006698 induction Effects 0.000 description 1
- 208000015181 infectious disease Diseases 0.000 description 1
- 230000002401 inhibitory effect Effects 0.000 description 1
- 230000000977 initiatory effect Effects 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 239000013067 intermediate product Substances 0.000 description 1
- 229960000310 isoleucine Drugs 0.000 description 1
- AGPKZVBTJJNPAG-UHFFFAOYSA-N isoleucine Natural products CCC(C)C(N)C(O)=O AGPKZVBTJJNPAG-UHFFFAOYSA-N 0.000 description 1
- 238000002334 isothermal calorimetry Methods 0.000 description 1
- QANMHLXAZMSUEX-UHFFFAOYSA-N kinetin Chemical compound N=1C=NC=2N=CNC=2C=1NCC1=CC=CO1 QANMHLXAZMSUEX-UHFFFAOYSA-N 0.000 description 1
- 229960001669 kinetin Drugs 0.000 description 1
- 239000002523 lectin Substances 0.000 description 1
- 235000021374 legumes Nutrition 0.000 description 1
- 235000014684 lodgepole pine Nutrition 0.000 description 1
- 235000005739 manihot Nutrition 0.000 description 1
- VPRLICVDSGMIKO-SZWOQXJISA-N mannopine Chemical compound NC(=O)CC[C@@H](C(O)=O)NC[C@@H](O)[C@@H](O)[C@H](O)[C@H](O)CO VPRLICVDSGMIKO-SZWOQXJISA-N 0.000 description 1
- 239000003550 marker Substances 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 230000001404 mediated effect Effects 0.000 description 1
- 210000000473 mesophyll cell Anatomy 0.000 description 1
- 230000004060 metabolic process Effects 0.000 description 1
- MYWUZJCMWCOHBA-VIFPVBQESA-N methamphetamine Chemical compound CN[C@@H](C)CC1=CC=CC=C1 MYWUZJCMWCOHBA-VIFPVBQESA-N 0.000 description 1
- 125000002496 methyl group Chemical group [H]C([H])([H])* 0.000 description 1
- 230000003278 mimic effect Effects 0.000 description 1
- 230000004899 motility Effects 0.000 description 1
- 210000003205 muscle Anatomy 0.000 description 1
- 108010058731 nopaline synthase Proteins 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 210000001623 nucleosome Anatomy 0.000 description 1
- 230000001590 oxidative effect Effects 0.000 description 1
- 235000002252 panizo Nutrition 0.000 description 1
- 244000052769 pathogen Species 0.000 description 1
- 230000001717 pathogenic effect Effects 0.000 description 1
- COLNVLDHVKWLRT-UHFFFAOYSA-N phenylalanine Natural products OC(=O)C(N)CC1=CC=CC=C1 COLNVLDHVKWLRT-UHFFFAOYSA-N 0.000 description 1
- 150000008298 phosphoramidates Chemical class 0.000 description 1
- 230000000243 photosynthetic effect Effects 0.000 description 1
- 230000008121 plant development Effects 0.000 description 1
- 230000037039 plant physiology Effects 0.000 description 1
- 229920000729 poly(L-lysine) polymer Polymers 0.000 description 1
- 230000008488 polyadenylation Effects 0.000 description 1
- 239000013641 positive control Substances 0.000 description 1
- 230000004481 post-translational protein modification Effects 0.000 description 1
- 101150063097 ppdK gene Proteins 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 230000012846 protein folding Effects 0.000 description 1
- 210000001938 protoplast Anatomy 0.000 description 1
- IGFXRKMLLMBKSA-UHFFFAOYSA-N purine Chemical compound N1=C[N]C2=NC=NC2=C1 IGFXRKMLLMBKSA-UHFFFAOYSA-N 0.000 description 1
- NHDHVHZZCFYRSB-UHFFFAOYSA-N pyriproxyfen Chemical compound C=1C=CC=NC=1OC(C)COC(C=C1)=CC=C1OC1=CC=CC=C1 NHDHVHZZCFYRSB-UHFFFAOYSA-N 0.000 description 1
- 230000002285 radioactive effect Effects 0.000 description 1
- 235000003499 redwood Nutrition 0.000 description 1
- 230000022532 regulation of transcription, DNA-dependent Effects 0.000 description 1
- 230000003252 repetitive effect Effects 0.000 description 1
- 230000008672 reprogramming Effects 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 230000035939 shock Effects 0.000 description 1
- 235000000673 shore pine Nutrition 0.000 description 1
- 239000000243 solution Substances 0.000 description 1
- 230000009870 specific binding Effects 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 150000003431 steroids Chemical class 0.000 description 1
- 239000000758 substrate Substances 0.000 description 1
- 230000001629 suppression Effects 0.000 description 1
- 238000004114 suspension culture Methods 0.000 description 1
- RYYWUUFWQRZTIU-UHFFFAOYSA-K thiophosphate Chemical compound [O-]P([O-])([O-])=S RYYWUUFWQRZTIU-UHFFFAOYSA-K 0.000 description 1
- 239000003053 toxin Substances 0.000 description 1
- 231100000765 toxin Toxicity 0.000 description 1
- 108700012359 toxins Proteins 0.000 description 1
- 230000005030 transcription termination Effects 0.000 description 1
- 230000002103 transcriptional effect Effects 0.000 description 1
- 238000012033 transcriptional gene silencing Methods 0.000 description 1
- 238000010361 transduction Methods 0.000 description 1
- 230000026683 transduction Effects 0.000 description 1
- 235000001019 trigonella foenum-graecum Nutrition 0.000 description 1
- OUYCCCASQSFEME-UHFFFAOYSA-N tyrosine Natural products OC(=O)C(N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-UHFFFAOYSA-N 0.000 description 1
- 125000001493 tyrosinyl group Chemical group [H]OC1=C([H])C([H])=C(C([H])=C1[H])C([H])([H])C([H])(N([H])[H])C(*)=O 0.000 description 1
- 238000011144 upstream manufacturing Methods 0.000 description 1
- 239000004474 valine Substances 0.000 description 1
- 235000015112 vegetable and seed oil Nutrition 0.000 description 1
- 230000009385 viral infection Effects 0.000 description 1
- 230000003612 virological effect Effects 0.000 description 1
- 108700026215 vpr Genes Proteins 0.000 description 1
- 239000002023 wood Substances 0.000 description 1
- 229940093612 zein Drugs 0.000 description 1
- 239000005019 zein Substances 0.000 description 1
- 230000004572 zinc-binding Effects 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/82—Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
- C12N15/8216—Methods for controlling, regulating or enhancing expression of transgenes in plant cells
- C12N15/8218—Antisense, co-suppression, viral induced gene silencing [VIGS], post-transcriptional induced gene silencing [PTGS]
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/415—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from plants
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/82—Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
- C12N15/8216—Methods for controlling, regulating or enhancing expression of transgenes in plant cells
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Genetics & Genomics (AREA)
- Chemical & Material Sciences (AREA)
- Organic Chemistry (AREA)
- Engineering & Computer Science (AREA)
- Biomedical Technology (AREA)
- Zoology (AREA)
- Biotechnology (AREA)
- General Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Molecular Biology (AREA)
- Wood Science & Technology (AREA)
- Biochemistry (AREA)
- Biophysics (AREA)
- General Health & Medical Sciences (AREA)
- Microbiology (AREA)
- Plant Pathology (AREA)
- Physics & Mathematics (AREA)
- Cell Biology (AREA)
- Botany (AREA)
- Gastroenterology & Hepatology (AREA)
- Medicinal Chemistry (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Virology (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Breeding Of Plants And Reproduction By Means Of Culturing (AREA)
- Peptides Or Proteins (AREA)
- Enzymes And Modification Thereof (AREA)
Abstract
本公开内容涉及引起表观遗传的基因沉默的重组蛋白,并涉及使用此类蛋白降低植物中基因表达的方法。
Description
相关申请的交叉引用
本申请要求2013年3月1日提交的美国临时申请号61/771,743和2014年1月20日提交的美国临时申请号61/929,414的权益,这些申请通过引用以其整体特此并入本文。
关于联邦赞助的研究的声明
本发明根据由美国国立卫生研究院(NationalInstituteofHealth)授予的合约号GM60398在政府支持下进行。政府在本发明中具有某些权利。
以ASCII文本文件的序列表提交
以下以ASCII文本文件提交的内容通过引用以其整体并入本文:计算机可读形式(CRF)的序列表(文件名:262232000440SEQLISTING.txt,记录的日期:2014年2月28日,大小:712KB)。
领域
本公开内容涉及引起表观遗传的基因沉默的重组蛋白并涉及利用此类蛋白用于减少植物中基因表达的方法。
背景
表观遗传标志是酶介导的DNA和其相关的染色质蛋白的化学修饰。尽管表观遗传标志不改变DNA的一级序列,它们的确包含可遗传的信息并在调节基因组功能中起关键作用。此类修饰,包括胞嘧啶甲基化、组蛋白尾部和组蛋白核心的翻译后修饰、以及核小体(DNA包裹的组蛋白八聚体)的定位,影响染色质的转录状态和其他功能方面。例如,DNA和组蛋白H3N末端尾部上某些残基诸如H3赖氨酸9(H3K9)的甲基化,对于转录基因沉默和异染色质的形成是重要的。此类标志对于非基因序列的沉默是重要的,所述非基因序列包括转座子、假基因、重复序列和整合的病毒,所述非基因序列如果被表达并因此被活化会变得对细胞有害。表观遗传基因沉默在发育现象诸如植物和哺乳动物中的印记中以及在细胞分化和重编程中也是重要的。
参与表观遗传沉默的不同途径此前已被描述,并包括组蛋白脱乙酰化、H3K27和H3K9甲基化、H3K4脱甲基化、以及启动子的DNA甲基化。实现DNA甲基化的一种手段是经由称为RNA指导的DNA甲基化的现象,其中非编码RNA发挥作用以指导DNA序列的甲基化。在植物中,没有被描述的将特定DNA序列的识别与表观遗传状态的建立联系起来的蛋白。因此,植物表观遗传调节子通常不能用于植物中特定基因或转基因的表观遗传沉默。
一种解决方案是鉴定或工程化包含序列特异性锌指结构域的表观遗传调节子,因为锌指首先被鉴定为DNA结合基序(Miller等,1985),且它们的许多其他变化已被表征。已经进行了最近的进展,其允许工程化特异性识别任何期望的DNA序列的DNA结合蛋白。例如,最近显示,三-指锌指蛋白可被构建以阻断被转化到小鼠细胞系中的人类癌基因的表达(Choo和Klug,1994)。然而,工程化包含工程化的锌指结构域的表观遗传调节子的潜在问题包括确保工程化的蛋白将具有正确的折叠以行使功能,和确保锌指结构域与表观遗传调节子的融合不会干扰锌指结构域的DNA特异性结合或表观遗传调节子的活性。
因此,对能够结合特定DNA序列、正确地折叠、且当在植物中表达时保留序列特异性DNA结合活性和表观遗传基因沉默活性二者的改进的表观遗传调节子存在需求。
概述
本公开内容涉及用于减少植物中一种或更多种靶核酸的表达的方法,所述方法包括:a)提供包含重组核酸的植物,其中所述重组核酸编码包含第一氨基酸序列和第二氨基酸序列的重组多肽,所述第一氨基酸序列包含DNA-结合结构域,所述第二氨基酸序列包含SHH1多肽或其片段;以及b)在其中由所述重组核酸编码的重组多肽藉以被表达并与所述一种或更多种靶核酸结合的条件下使所述植物生长,从而减少所述一种或更多种靶核酸的表达。在一些实施方案中,DNA结合结构域包含锌指结构域。在一些实施方案中,锌指结构域包含2个、3个、4个、5个、6个、7个、8个或9个锌指。在一些实施方案中,锌指结构域为锌指阵列。在一些实施方案中,锌指结构域选自Cys2His2(C2H2)锌指结构域、CCCH锌指结构域、多半胱氨酸锌指结构域和锌双核簇结构域。在可与前述实施方案的任一个组合的一些实施方案中,DNA结合结构域选自TAL效应子靶向结构域、螺旋-转角-螺旋家族DNA结合结构域、碱性结构域、带-螺旋-螺旋结构域、TBP结构域、桶状二聚体结构域、真实同源结构域(realhomologydomain)、BAH结构域、SANT结构域、克罗莫结构域、Tudor结构域、布罗莫结构域、PHD结构域、WD40结构域和MBD结构域。在可与前述实施方案的任一个组合的一些实施方案中,DNA结合结构域包含TAL效应子靶向结构域。在可与前述实施方案的任一个组合的一些实施方案中,DNA结合结构域包含3个C2H2锌指结构域。在可与前述实施方案的任一个组合的一些实施方案中,第二氨基酸序列包含同源结构域或SAWADEE结构域中的至少一个。在可与前述实施方案的任一个组合的一些实施方案中,第二氨基酸序列包含与SEQIDNO:1至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或至少99%相同的氨基酸序列。在可与前述实施方案的任一个组合的一些实施方案中,第二氨基酸序列包含与SEQIDNO:1100%相同的氨基酸序列。在可与前述实施方案的任一个组合的一些实施方案中,重组多肽与RNA聚合酶相互作用。在一些实施方案中,RNA聚合酶为RNA聚合酶IV。在可与前述实施方案的任一个组合的一些实施方案中,重组多肽与甲基化H3K9相互作用。在可与前述实施方案的任一个组合的一些实施方案中,重组多肽与H3K9me1、H3K9me2和/或H3K9me3相互作用。在可与前述实施方案的任一个组合的一些实施方案中,重组多肽引起RNA指导的DNA甲基化。在可与前述实施方案的任一个组合的一些实施方案中,一种或更多种靶核酸为内源核酸。在可与前述实施方案的任一个组合的一些实施方案中,一种或更多种靶核酸为异源核酸。在可与前述实施方案的任一个组合的一些实施方案中,一种或更多种靶核酸被沉默。
本公开内容还涉及编码包含第一氨基酸序列和第二氨基酸序列的SHH1样蛋白的重组核酸,所述第一氨基酸序列包含DNA结合结构域,所述第二氨基酸序列包含SHH1多肽或其片段。在一些实施方案中,第二氨基酸序列包含与SEQIDNO:1至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%相同的氨基酸序列。在一些实施方案中,第二氨基酸序列包含与SEQIDNO:1100%相同的氨基酸序列。在可与前述实施方案的任一个组合的一些实施方案中,DNA结合结构域包含锌指结构域。在一些实施方案中,锌指结构域包含2个、3个、4个、5个、6个、7个、8个或9个锌指。在一些实施方案中,锌指结构域为锌指阵列。在一些实施方案中,锌指结构域选自C2H2锌指结构域、CCCH锌指结构域、多半胱氨酸锌指结构域和锌双核簇结构域。在可与前述实施方案的任一个组合的一些实施方案中,DNA结合结构域选自TAL效应子靶向结构域、螺旋-转角-螺旋家族DNA结合结构域、碱性结构域、带-螺旋-螺旋结构域、TBP结构域、桶状二聚体结构域、真实同源结构域、BAH结构域、SANT结构域、克罗莫结构域、Tudor结构域、布罗莫结构域、PHD结构域、WD40结构域和MBD结构域。在可与前述实施方案的任一个组合的一些实施方案中,DNA结合结构域包含TAL效应子靶向结构域。在可与前述实施方案的任一个组合的一些实施方案中,DNA结合结构域结合一种或更多种靶核酸。在可与前述实施方案的任一个组合的一些实施方案中,DNA结合结构域结合一种或更多种靶核酸。在一些实施方案中,一种或更多种靶核酸为编码多肽的核酸。在一些实施方案中,一种或更多种靶核酸为内源植物核酸。在一些实施方案中,一种或更多种靶核酸为异源核酸。在可与前述实施方案的任一个组合的一些实施方案中,SHH1样蛋白减少一种或更多种靶核酸的表达。在可与前述实施方案的任一个组合的一些实施方案中,SHH1样蛋白使一种或更多种靶核酸的表达沉默。
本公开内容的其他方面涉及包含重组核酸的载体,所述重组核酸编码前述实施方案的任一个的SHH1样蛋白,其中所述重组核酸被可操作地连接至调节序列。本公开内容的其他方面涉及包含前述实施方案的表达载体的宿主细胞。在某些实施方案中,宿主细胞为植物细胞。本公开内容的其他方面涉及包含前述实施方案的任一个的重组核酸的重组植物。
本公开内容还涉及用于减少植物中一种或更多种靶核酸的表达的方法,所述方法包括:a)提供包含重组核酸的植物,其中所述重组核酸编码包含第一氨基酸序列和第二氨基酸序列的重组多肽,所述第一氨基酸序列包含DNA-结合结构域,所述第二氨基酸序列包含SUVH2多肽或其片段、或SUVH9多肽或其片段;以及b)在其中由所述重组核酸编码的重组多肽藉以被表达并与所述一种或更多种靶核酸结合的条件下使所述植物生长,从而减少所述一种或更多种靶核酸的表达。在一些实施方案中,DNA结合结构域包含锌指结构域。在一些实施方案中,锌指结构域包含2个、3个、4个、5个、6个、7个、8个或9个锌指。在一些实施方案中,锌指结构域为锌指阵列。在一些实施方案中,锌指结构域选自Cys2His2(C2H2)锌指结构域、CCCH锌指结构域、多半胱氨酸锌指结构域和锌双核簇结构域。在可与前述实施方案的任一个组合的一些实施方案中,DNA结合结构域选自TAL效应子靶向结构域、螺旋-转角-螺旋家族DNA结合结构域、碱性结构域、带-螺旋-螺旋结构域、TBP结构域、桶状二聚体结构域、真实同源结构域、BAH结构域、SANT结构域、克罗莫结构域、Tudor结构域、布罗莫结构域、PHD结构域、WD40结构域和MBD结构域。在可与前述实施方案的任一个组合的一些实施方案中,DNA结合结构域包含TAL效应子靶向结构域。在可与前述实施方案的任一个组合的一些实施方案中,DNA结合结构域包含3个C2H2锌指结构域。在可与前述实施方案的任一个组合的一些实施方案中,第二氨基酸序列包含选自双螺旋束结构域、SRA结构域、pre-SET结构域或SET结构域的结构域。在可与前述实施方案的任一个组合的一些实施方案中,第二氨基酸序列包含与SEQIDNO:14或SEQIDNO:27至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或至少99%相同的氨基酸序列。在可与前述实施方案的任一个组合的一些实施方案中,第二氨基酸序列包含与SEQIDNO:14或SEQIDNO:27100%相同的氨基酸序列。在可与前述实施方案的任一个组合的一些实施方案中,重组多肽与RNA聚合酶相互作用。在一些实施方案中,RNA聚合酶为RNA聚合酶V。在可与前述实施方案的任一个组合的一些实施方案中,重组多肽引起RNA指导的DNA甲基化。在可与前述实施方案的任一个组合的一些实施方案中,一种或更多种靶核酸为内源核酸。在可与前述实施方案的任一个组合的一些实施方案中,一种或更多种靶核酸为异源核酸。在可与前述实施方案的任一个组合的一些实施方案中,一种或更多种靶核酸的表达被沉默。在可与前述实施方案的任一个组合的一些实施方案中,所述方法包括提供还包含另外的重组核酸的植物,其中所述另外的重组核酸编码包含第一氨基酸序列和第二氨基酸序列的重组多肽,所述第一氨基酸序列包含DNA-结合结构域,所述第二氨基酸序列包含SHH1多肽或其片段;以及在其中由所述另外的重组核酸编码的另外的重组多肽藉以被表达并与所述一种或更多种靶核酸结合的条件下使所述植物生长,从而减少所述一种或更多种靶核酸的表达。
本公开内容还涉及编码包含第一氨基酸序列和第二氨基酸序列的SUVH2样蛋白或SUVH9样蛋白的重组核酸,所述第一氨基酸序列包含DNA结合结构域,所述第二氨基酸序列包含SUVH2多肽或其片段、或SUVH9多肽或其片段。在一些实施方案中,第二氨基酸序列包含与SEQIDNO:14或SEQIDNO:27至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%相同的氨基酸序列。在一些实施方案中,第二氨基酸序列包含与SEQIDNO:14或SEQIDNO:27100%相同的氨基酸序列。在可与前述实施方案的任一个组合的一些实施方案中,DNA结合结构域包含锌指结构域。在一些实施方案中,锌指结构域包含2个、3个、4个、5个、6个、7个、8个或9个锌指。在一些实施方案中,锌指结构域为锌指阵列。在一些实施方案中,锌指结构域选自C2H2锌指结构域、CCCH锌指结构域、多半胱氨酸锌指结构域和锌双核簇结构域。在可与前述实施方案的任一个组合的一些实施方案中,DNA结合结构域选自TAL效应子靶向结构域、螺旋-转角-螺旋家族DNA结合结构域、碱性结构域、带-螺旋-螺旋结构域、TBP结构域、桶状二聚体结构域、真实同源结构域、BAH结构域、SANT结构域、克罗莫结构域、Tudor结构域、布罗莫结构域、PHD结构域、WD40结构域和MBD结构域。在可与前述实施方案的任一个组合的一些实施方案中,DNA结合结构域包含TAL效应子靶向结构域。在可与前述实施方案的任一个组合的一些实施方案中,DNA结合结构域结合一种或更多种靶核酸。在可与前述实施方案的任一个组合的一些实施方案中,DNA结合结构域结合一种或更多种靶核酸。在一些实施方案中,一种或更多种靶核酸为编码多肽的核酸。在一些实施方案中,一种或更多种靶核酸为内源植物核酸。在一些实施方案中,一种或更多种靶核酸为异源核酸。在可与前述实施方案的任一个组合的一些实施方案中,SUVH2样蛋白和/或SUVH9样蛋白减少一种或更多种靶核酸的表达。在可与前述实施方案的任一个组合的一些实施方案中,SUVH2样蛋白和/或SUVH9样蛋白使一种或更多种靶核酸的表达沉默。
本公开内容的其他方面涉及包含重组核酸的载体,所述重组核酸编码前述实施方案的任一个的SUVH2样蛋白和/或SUVH9样蛋白,其中所述重组核酸被可操作地连接至调节序列。本公开内容的其他方面涉及包含前述实施方案的表达载体的宿主细胞。在某些实施方案中,宿主细胞为植物细胞。本公开内容的其他方面涉及包含前述实施方案的任一个的重组核酸的重组植物。
本公开内容还涉及用于减少植物中一种或更多种靶核酸的表达的方法,所述方法包括:a)提供包含第一重组核酸和第二重组核酸的植物,所述第一重组核酸编码包含第一氨基酸序列和第二氨基酸序列的第一重组多肽,所述第一氨基酸序列包含DNA结合结构域,所述第二氨基酸序列包含SHH1多肽或其片段,所述第二重组核酸编码包含第一氨基酸序列和第二氨基酸序列的第二重组多肽,所述第一氨基酸序列包含DNA结合结构域,所述第二氨基酸序列包含SUVH2多肽或其片段、或SUVH9多肽或其片段;以及b)在其中由所述第一重组核酸编码的第一重组多肽和由所述第二重组核酸编码的第二重组多肽藉以被表达并与所述一种或更多种靶核酸结合的条件下使所述植物生长,从而减少所述一种或更多种靶核酸的表达。在一些实施方案中,重组多肽的至少一个的DNA结合结构域包含锌指结构。在一些实施方案中,锌指结构域包含2个、3个、4个、5个、6个、7个、8个或9个锌指。在一些实施方案中,锌指结构域为锌指阵列。在一些实施方案中,锌指结构域选自Cys2His2(C2H2)锌指结构域、CCCH锌指结构域、多半胱氨酸锌指结构域和锌双核簇结构域。在可与前述实施方案的任一个组合的一些实施方案中,来自重组多肽的至少一个的DNA结合结构域选自TAL效应子靶向结构域、螺旋-转角-螺旋家族DNA结合结构域、碱性结构域、带-螺旋-螺旋结构域、TBP结构域、桶状二聚体结构域、真实同源结构域、BAH结构域、SANT结构域、克罗莫结构域、Tudor结构域、布罗莫结构域、PHD结构域、WD40结构域和MBD结构域。在可与前述实施方案的任一个组合的一些实施方案中,重组多肽的至少一个的DNA结合结构域包含TAL效应子靶向结构域。在可与前述实施方案的任一个组合的一些实施方案中,重组多肽的至少一个的DNA结合结构域包含3个C2H2锌指结构域。在可与前述实施方案的任一个组合的一些实施方案中,第一重组多肽的第二氨基酸序列包含同源结构域或SAWADEE结构域中的至少一个。在可与前述实施方案的任一个组合的一些实施方案中,第一重组多肽的第二氨基酸序列包含与SEQIDNO:1至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或至少99%相同的氨基酸序列。在可与前述实施方案的任一个组合的一些实施方案中,第一重组多肽的第二氨基酸序列包含与SEQIDNO:1100%相同的氨基酸序列。在可与前述实施方案的任一个组合的一些实施方案中,重组多肽中的至少一个与RNA聚合酶相互作用。在一些实施方案中,RNA聚合酶为RNA聚合酶IV。在可与前述实施方案的任一个组合的一些实施方案中,第一重组多肽与甲基化H3K9相互作用。在可与前述实施方案的任一个组合的一些实施方案中,第一重组多肽与H3K9me1、H3K9me2和/或H3K9me3相互作用。在可与前述实施方案的任一个组合的一些实施方案中,第一重组多肽引起RNA指导的DNA甲基化。在可与前述实施方案的任一个组合的一些实施方案中,第二重组多肽的第二氨基酸序列包含选自双螺旋束结构域、SRA结构域、pre-SET结构域或SET结构域的结构域。在可与前述实施方案的任一个组合的一些实施方案中,来自第二重组多肽的第二氨基酸序列包含与SEQIDNO:14或SEQIDNO:27至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或至少99%相同的氨基酸序列。在可与前述实施方案的任一个组合的一些实施方案中,第二重组多肽的第二氨基酸序列包含与SEQIDNO:14或SEQIDNO:27100%相同的氨基酸序列。在可与前述实施方案的任一个组合的一些实施方案中,第二重组多肽与RNA聚合酶相互作用。在一些实施方案中,RNA聚合酶为RNA聚合酶V。在可与前述实施方案的任一个组合的一些实施方案中,第二重组多肽引起RNA指导的DNA甲基化。在可与前述实施方案的任一个组合的一些实施方案中,重组多肽的至少一个引起RNA指导的DNA甲基化。在可与前述实施方案的任一个组合的一些实施方案中,一种或更多种靶核酸为内源核酸。在可与前述实施方案的任一个组合的一些实施方案中,一种或更多种靶核酸为异源核酸。在可与前述实施方案的任一个组合的一些实施方案中,一种或更多种靶核酸被沉默。
本公开内容的其他方面涉及包含重组核酸的载体,所述重组核酸编码前述实施方案的任一个的SHH1样蛋白、SUVH2样蛋白和/或SUVH9样蛋白,其中所述重组核酸被可操作地连接至调节序列。本公开内容的其他方面涉及包含前述实施方案的表达载体的宿主细胞。在某些实施方案中,宿主细胞为植物细胞。本公开内容的其他方面涉及包含前述实施方案的任一个的重组核酸的重组植物。
本公开内容还涉及用于减少植物中一种或更多种靶核酸的表达的方法,所述方法包括:a)提供包含重组核酸的植物,其中所述重组核酸编码包含第一氨基酸序列和第二氨基酸序列的重组多肽,所述第一氨基酸序列包含DNA-结合结构域,所述第二氨基酸序列包含DMS3多肽或其片段;以及b)在其中由所述重组核酸编码的重组多肽藉以被表达并与所述一种或更多种靶核酸结合的条件下使所述植物生长,从而减少所述一种或更多种靶核酸的表达。在一些实施方案中,DNA结合结构域包含锌指结构域。在一些实施方案中,锌指结构域包含2个、3个、4个、5个、6个、7个、8个或9个锌指。在一些实施方案中,锌指结构域为锌指阵列。在一些实施方案中,锌指结构域选自Cys2His2(C2H2)锌指结构域、CCCH锌指结构域、多半胱氨酸锌指结构域和锌双核簇结构域。在可与前述实施方案的任一个组合的一些实施方案中,DNA结合结构域选自TAL效应子靶向结构域、螺旋-转角-螺旋家族DNA结合结构域、碱性结构域、带-螺旋-螺旋结构域、TBP结构域、桶状二聚体结构域、真实同源结构域、BAH结构域、SANT结构域、克罗莫结构域、Tudor结构域、布罗莫结构域、PHD结构域、WD40结构域和MBD结构域。在可与前述实施方案的任一个组合的一些实施方案中,DNA结合结构域包含TAL效应子靶向结构域。在可与前述实施方案的任一个组合的一些实施方案中,DNA结合结构域包含3个C2H2锌指结构域。在可与前述实施方案的任一个组合的一些实施方案中,第二氨基酸序列包含选自双螺旋束结构域、SRA结构域、pre-SET结构域或SET结构域的结构域。在可与前述实施方案的任一个组合的一些实施方案中,第二氨基酸序列包含与SEQIDNO:41至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或至少99%相同的氨基酸序列。在可与前述实施方案的任一个组合的一些实施方案中,第二氨基酸序列包含与SEQIDNO:41100%相同的氨基酸序列。在可与前述实施方案的任一个组合的一些实施方案中,重组多肽与RNA聚合酶相互作用。在可与前述实施方案的任一个组合的一些实施方案中,RNA聚合酶为RNA聚合酶V。在可与前述实施方案的任一个组合的一些实施方案中,重组多肽引起RNA指导的DNA甲基化。在可与前述实施方案的任一个组合的一些实施方案中,一种或更多种靶核酸为内源核酸。在可与前述实施方案的任一个组合的一些实施方案中,一种或更多种靶核酸为异源核酸。在可与前述实施方案的任一个组合的一些实施方案中,一种或更多种靶核酸的表达被沉默。
本公开内容还涉及编码包含第一氨基酸序列和第二氨基酸序列的DMS3样蛋白的重组核酸,所述第一氨基酸序列包含DNA结合结构域,所述第二氨基酸序列包含DMS3多肽或其片段。在一些实施方案中,第二氨基酸序列包含与SEQIDNO:41至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%相同的氨基酸序列。在一些实施方案中,第二氨基酸序列包含与SEQIDNO:41100%相同的氨基酸序列。在可与前述实施方案的任一个组合的一些实施方案中,DNA结合结构域包含锌指结构域。在一些实施方案中,锌指结构域包含2个、3个、4个、5个、6个、7个、8个或9个锌指。在一些实施方案中,锌指结构域为锌指阵列。在一些实施方案中,锌指结构域选自C2H2锌指结构域、CCCH锌指结构域、多半胱氨酸锌指结构域和锌双核簇结构域。在可与前述实施方案的任一个组合的一些实施方案中,DNA结合结构域选自TAL效应子靶向结构域、螺旋-转角-螺旋家族DNA结合结构域、碱性结构域、带-螺旋-螺旋结构域、TBP结构域、桶状二聚体结构域、真实同源结构域、BAH结构域、SANT结构域、克罗莫结构域、Tudor结构域、布罗莫结构域、PHD结构域、WD40结构域和MBD结构域。在可与前述实施方案的任一个组合的一些实施方案中,DNA结合结构域包含TAL效应子靶向结构域。在可与前述实施方案的任一个组合的一些实施方案中,DNA结合结构域结合一种或更多种靶核酸。在可与前述实施方案的任一个组合的一些实施方案中,DNA结合结构域结合一种或更多种靶核酸。在一些实施方案中,一种或更多种靶核酸为编码多肽的核酸。在一些实施方案中,一种或更多种靶核酸为内源植物核酸。在一些实施方案中,一种或更多种靶核酸为异源核酸。在可与前述实施方案的任一个组合的一些实施方案中,DMS3样蛋白减少一种或更多种靶核酸的表达。在可与前述实施方案的任一个组合的一些实施方案中,DMS3样蛋白使一种或更多种靶核酸的表达沉默。
本公开内容还涉及用于减少植物中一种或更多种靶核酸的表达的方法,所述方法包括:a)提供包含重组核酸的植物,其中所述重组核酸编码包含第一氨基酸序列和第二氨基酸序列的重组多肽,所述第一氨基酸序列包含DNA结合结构域,所述第二氨基酸序列包含MORC6多肽或其片段;以及b)在其中由所述重组核酸编码的重组多肽藉以被表达并与所述一种或更多种靶核酸结合的条件下使所述植物生长,从而减少所述一种或更多种靶核酸的表达。在一些实施方案中,DNA结合结构域包含锌指结构域。在一些实施方案中,锌指结构域包含2个、3个、4个、5个、6个、7个、8个或9个锌指。在一些实施方案中,锌指结构域为锌指阵列。在一些实施方案中,锌指结构域选自Cys2His2(C2H2)锌指结构域、CCCH锌指结构域、多半胱氨酸锌指结构域和锌双核簇结构域。在可与前述实施方案的任一个组合的一些实施方案中,DNA结合结构域选自TAL效应子靶向结构域、螺旋-转角-螺旋家族DNA结合结构域、碱性结构域、带-螺旋-螺旋结构域、TBP结构域、桶状二聚体结构域、真实同源结构域、BAH结构域、SANT结构域、克罗莫结构域、Tudor结构域、布罗莫结构域、PHD结构域、WD40结构域和MBD结构域。在可与前述实施方案的任一个组合的一些实施方案中,DNA结合结构域包含TAL效应子靶向结构域。在可与前述实施方案的任一个组合的一些实施方案中,DNA结合结构域包含3个C2H2锌指结构域。在可与前述实施方案的任一个组合的一些实施方案中,第二氨基酸序列包含选自双螺旋束结构域、SRA结构域、pre-SET结构域或SET结构域的结构域。在可与前述实施方案的任一个组合的一些实施方案中,第二氨基酸序列包含与SEQIDNO:53至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或至少99%相同的氨基酸序列。在可与前述实施方案的任一个组合的一些实施方案中,第二氨基酸序列包含与SEQIDNO:53100%相同的氨基酸序列。在可与前述实施方案的任一个组合的一些实施方案中,重组多肽与RNA聚合酶相互作用。在可与前述实施方案的任一个组合的一些实施方案中,RNA聚合酶为RNA聚合酶V。在可与前述实施方案的任一个组合的一些实施方案中,重组多肽引起RNA指导的DNA甲基化。在可与前述实施方案的任一个组合的一些实施方案中,一种或更多种靶核酸为内源核酸。在可与前述实施方案的任一个组合的一些实施方案中,一种或更多种靶核酸为异源核酸。在可与前述实施方案的任一个组合的一些实施方案中,一种或更多种靶核酸的表达被沉默。
本公开内容还涉及编码包含第一氨基酸序列和第二氨基酸序列的MORC6样蛋白的重组核酸,所述第一氨基酸序列包含DNA结合结构域,所述第二氨基酸序列包含MORC6多肽或其片段。在一些实施方案中,第二氨基酸序列包含与SEQIDNO:53至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%相同的氨基酸序列。在一些实施方案中,第二氨基酸序列包含与SEQIDNO:53100%相同的氨基酸序列。在可与前述实施方案的任一个组合的一些实施方案中,DNA结合结构域包含锌指结构域。在一些实施方案中,锌指结构域包含2个、3个、4个、5个、6个、7个、8个或9个锌指。在一些实施方案中,锌指结构域为锌指阵列。在一些实施方案中,锌指结构域选自C2H2锌指结构域、CCCH锌指结构域、多半胱氨酸锌指结构域和锌双核簇结构域。在可与前述实施方案的任一个组合的一些实施方案中,DNA结合结构域选自TAL效应子靶向结构域、螺旋-转角-螺旋家族DNA结合结构域、碱性结构域、带-螺旋-螺旋结构域、TBP结构域、桶状二聚体结构域、真实同源结构域、BAH结构域、SANT结构域、克罗莫结构域、Tudor结构域、布罗莫结构域、PHD结构域、WD40结构域和MBD结构域。在可与前述实施方案的任一个组合的一些实施方案中,DNA结合结构域包含TAL效应子靶向结构域。在可与前述实施方案的任一个组合的一些实施方案中,DNA结合结构域结合一种或更多种靶核酸。在可与前述实施方案的任一个组合的一些实施方案中,DNA结合结构域结合一种或更多种靶核酸。在一些实施方案中,一种或更多种靶核酸为编码多肽的核酸。在一些实施方案中,一种或更多种靶核酸为内源植物核酸。在一些实施方案中,一种或更多种靶核酸为异源核酸。在可与前述实施方案的任一个组合的一些实施方案中,MORC6样蛋白减少一种或更多种靶核酸的表达。在可与前述实施方案的任一个组合的一些实施方案中,MORC6样蛋白使一种或更多种靶核酸的表达沉默。
本公开内容还涉及用于减少植物中一种或更多种靶核酸的表达的方法,所述方法包括:a)提供包含重组核酸的植物,其中所述重组核酸编码包含第一氨基酸序列和第二氨基酸序列的重组多肽,所述第一氨基酸序列包含DNA结合结构域,所述第二氨基酸序列包含SUVR2多肽或其片段;以及b)在其中由所述重组核酸编码的重组多肽藉以被表达并与所述一种或更多种靶核酸结合的条件下使所述植物生长,从而减少所述一种或更多种靶核酸的表达。在一些实施方案中,DNA结合结构域包含锌指结构域。在一些实施方案中,锌指结构域包含2个、3个、4个、5个、6个、7个、8个或9个锌指。在一些实施方案中,锌指结构域为锌指阵列。在一些实施方案中,锌指结构域选自Cys2His2(C2H2)锌指结构域、CCCH锌指结构域、多半胱氨酸锌指结构域和锌双核簇结构域。在可与前述实施方案的任一个组合的一些实施方案中,DNA结合结构域选自TAL效应子靶向结构域、螺旋-转角-螺旋家族DNA结合结构域、碱性结构域、带-螺旋-螺旋结构域、TBP结构域、桶状二聚体结构域、真实同源结构域、BAH结构域、SANT结构域、克罗莫结构域、Tudor结构域、布罗莫结构域、PHD结构域、WD40结构域和MBD结构域。在可与前述实施方案的任一个组合的一些实施方案中,DNA结合结构域包含TAL效应子靶向结构域。在可与前述实施方案的任一个组合的一些实施方案中,DNA结合结构域包含3个C2H2锌指结构域。在可与前述实施方案的任一个组合的一些实施方案中,第二氨基酸序列包含选自双螺旋束结构域、SRA结构域、pre-SET结构域或SET结构域的结构域。在可与前述实施方案的任一个组合的一些实施方案中,第二氨基酸序列包含与SEQIDNO:66至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或至少99%相同的氨基酸序列。在可与前述实施方案的任一个组合的一些实施方案中,第二氨基酸序列包含与SEQIDNO:66100%相同的氨基酸序列。在可与前述实施方案的任一个组合的一些实施方案中,重组多肽与RNA聚合酶相互作用。在可与前述实施方案的任一个组合的一些实施方案中,RNA聚合酶为RNA聚合酶V。在可与前述实施方案的任一个组合的一些实施方案中,重组多肽引起RNA指导的DNA甲基化。在可与前述实施方案的任一个组合的一些实施方案中,一种或更多种靶核酸为内源核酸。在可与前述实施方案的任一个组合的一些实施方案中,一种或更多种靶核酸为异源核酸。在可与前述实施方案的任一个组合的一些实施方案中,一种或更多种靶核酸的表达被沉默。
本公开内容还涉及编码包含第一氨基酸序列和第二氨基酸序列的SUVR2样蛋白的重组核酸,所述第一氨基酸序列包含DNA结合结构域,所述第二氨基酸序列包含SUVR2多肽或其片段。在一些实施方案中,第二氨基酸序列包含与SEQIDNO:66至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%相同的氨基酸序列。在一些实施方案中,第二氨基酸序列包含与SEQIDNO:66100%相同的氨基酸序列。在可与前述实施方案的任一个组合的一些实施方案中,DNA结合结构域包含锌指结构域。在一些实施方案中,锌指结构域包含2个、3个、4个、5个、6个、7个、8个或9个锌指。在一些实施方案中,锌指结构域为锌指阵列。在一些实施方案中,锌指结构域选自C2H2锌指结构域、CCCH锌指结构域、多半胱氨酸锌指结构域和锌双核簇结构域。在可与前述实施方案的任一个组合的一些实施方案中,DNA结合结构域选自TAL效应子靶向结构域、螺旋-转角-螺旋家族DNA结合结构域、碱性结构域、带-螺旋-螺旋结构域、TBP结构域、桶状二聚体结构域、真实同源结构域、BAH结构域、SANT结构域、克罗莫结构域、Tudor结构域、布罗莫结构域、PHD结构域、WD40结构域和MBD结构域。在可与前述实施方案的任一个组合的一些实施方案中,DNA结合结构域包含TAL效应子靶向结构域。在可与前述实施方案的任一个组合的一些实施方案中,DNA结合结构域结合一种或更多种靶核酸。在可与前述实施方案的任一个组合的一些实施方案中,DNA结合结构域结合一种或更多种靶核酸。在一些实施方案中,一种或更多种靶核酸为编码多肽的核酸。在一些实施方案中,一种或更多种靶核酸为内源植物核酸。在一些实施方案中,一种或更多种靶核酸为异源核酸。在可与前述实施方案的任一个组合的一些实施方案中,SUVR2样蛋白减少一种或更多种靶核酸的表达。在可与前述实施方案的任一个组合的一些实施方案中,SUVR2样蛋白使一种或更多种靶核酸的表达沉默。
本公开内容的其他方面涉及包含重组核酸的载体,所述重组核酸编码前述实施方案的任一个的DMS3样蛋白、MORC6样蛋白和/或SUVR2样蛋白,其中所述重组核酸被可操作地连接至调节序列。本公开内容的其他方面涉及包含前述实施方案的表达载体的宿主细胞。在某些实施方案中,宿主细胞为植物细胞。本公开内容的其他方面涉及包含前述实施方案的任一个的重组核酸的重组植物。
本公开内容还涉及用于减少植物中一种或更多种靶核酸的表达的方法,所述方法包括:(a)提供包含第一重组核酸和一种或更多种另外的重组核酸的植物,所述第一重组核酸编码包含第一氨基酸序列和第二氨基酸序列的第一重组多肽,所述第一氨基酸序列包含DNA结合结构域,所述第二氨基酸序列包含SHH1多肽或其片段,所述一种或更多种另外的重组核酸编码一种或更多种另外的多肽,所述一种或更多种另外的多肽的每种包含第一氨基酸序列和第二氨基酸序列,所述第一氨基酸序列包含DNA结合结构域,所述第二氨基酸序列包含选自由SUVH2多肽或其片段、SUVH9多肽或其片段、DMS3多肽或其片段、MORC6多肽或其片段、SUVR2多肽或其片段、DRD1多肽或其片段、RDM1多肽或其片段、DRM3多肽或其片段、DRM2多肽或其片段和FRG多肽或其片段组成的组的多肽以及;以及b)在其中由所述第一重组核酸编码的第一重组多肽和由所述一种或更多种另外的重组核酸编码的一种或更多种另外的多肽藉以被表达并与所述一种或更多种靶核酸结合的条件下使所述植物生长,从而减少所述一种或更多种靶核酸的表达。在一些实施方案中,重组多肽中的至少一个引起RNA指导的DNA甲基化。在一些实施方案中,一种或更多种靶核酸为内源核酸。在一些实施方案中,一种或更多种靶核酸为异源核酸。在一些实施方案中,一种或更多种靶核酸的表达被沉默。
本公开内容的其他方面涉及包含表达载体的宿主细胞,所述表达载体包含编码前述实施方案的任一个的重组多肽的重组核酸。在一些实施方案中,宿主细胞为植物细胞。本公开内容的其他方面涉及包含前述实施方案的任一个的重组核酸的重组植物。
本公开内容还涉及用于减少植物中一种或更多种靶核酸的表达的方法,所述方法包括提供植物,所述植物包含:(a)靶向一种或更多种靶核酸的小干扰RNA(siRNA),和编码一种或更多种多肽的一种或更多种重组核酸,所述一种或更多种多肽的每种包含第一氨基酸序列和第二氨基酸序列,所述第一氨基酸序列包含DNA结合结构域,所述第二氨基酸序列包含选自由SUVH2多肽或其片段、SUVH9多肽或其片段、DMS3多肽或其片段、MORC6多肽或其片段、SUVR2多肽或其片段、DRD1多肽或其片段、RDM1多肽或其片段、DRM3多肽或其片段、DRM2多肽或其片段、和FRG多肽或其片段组成的组的多肽,以及b)在siRNA藉以与一种或更多种靶核酸相互作用并且由所述一种或更多种重组核酸编码的一种或更多种多肽藉以被表达的条件下使所述植物生长,从而减少所述一种或更多种靶核酸的表达。
本公开内容还涉及用于减少植物中一种或更多种靶核酸的表达的方法,所述方法包括:a)提供包含重组核酸的植物,其中所述重组核酸编码包含第一氨基酸序列和第二氨基酸序列的重组多肽,所述第一氨基酸序列包含DNA结合结构域,所述第二氨基酸序列包含DRD1多肽或其片段;以及b)在其中由所述重组核酸编码的重组多肽藉以被表达并与所述一种或更多种靶核酸结合的条件下使所述植物生长,从而减少所述一种或更多种靶核酸的表达。在一些实施方案中,DNA结合结构域包含锌指结构域。在一些实施方案中,锌指结构域包含2个、3个、4个、5个、6个、7个、8个或9个锌指。在一些实施方案中,锌指结构域为锌指阵列。在一些实施方案中,锌指结构域选自Cys2His2(C2H2)锌指结构域、CCCH锌指结构域、多半胱氨酸锌指结构域和锌双核簇结构域。在可与前述实施方案的任一个组合的一些实施方案中,DNA结合结构域选自TAL效应子靶向结构域、螺旋-转角-螺旋家族DNA结合结构域、碱性结构域、带-螺旋-螺旋结构域、TBP结构域、桶状二聚体结构域、真实同源结构域、BAH结构域、SANT结构域、克罗莫结构域、Tudor结构域、布罗莫结构域、PHD结构域、WD40结构域和MBD结构域。在可与前述实施方案的任一个组合的一些实施方案中,DNA结合结构域包含TAL效应子靶向结构域。在可与前述实施方案的任一个组合的一些实施方案中,DNA结合结构域包含3个C2H2锌指结构域。在可与前述实施方案的任一个组合的一些实施方案中,第二氨基酸序列包含选自双螺旋束结构域、SRA结构域、pre-SET结构域或SET结构域的结构域。在可与前述实施方案的任一个组合的一些实施方案中,第二氨基酸序列包含与SEQIDNO:79至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或至少99%相同的氨基酸序列。在可与前述实施方案的任一个组合的一些实施方案中,第二氨基酸序列包含与SEQIDNO:79100%相同的氨基酸序列。在可与前述实施方案的任一个组合的一些实施方案中,重组多肽与RNA聚合酶相互作用。在可与前述实施方案的任一个组合的一些实施方案中,RNA聚合酶为RNA聚合酶V。在可与前述实施方案的任一个组合的一些实施方案中,重组多肽引起RNA指导的DNA甲基化。在可与前述实施方案的任一个组合的一些实施方案中,一种或更多种靶核酸为内源核酸。在可与前述实施方案的任一个组合的一些实施方案中,一种或更多种靶核酸为异源核酸。在可与前述实施方案的任一个组合的一些实施方案中,一种或更多种靶核酸的表达被沉默。
本公开内容还涉及编码包含第一氨基酸序列和第二氨基酸序列的DRD1样蛋白的重组核酸,所述第一氨基酸序列包含DNA结合结构域,所述第二氨基酸序列包含DRD1多肽或其片段。在一些实施方案中,第二氨基酸序列包含与SEQIDNO:79至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%相同的氨基酸序列。在一些实施方案中,第二氨基酸序列包含与SEQIDNO:79100%相同的氨基酸序列。在可与前述实施方案的任一个组合的一些实施方案中,DNA结合结构域包含锌指结构域。在一些实施方案中,锌指结构域包含2个、3个、4个、5个、6个、7个、8个或9个锌指。在一些实施方案中,锌指结构域为锌指阵列。在一些实施方案中,锌指结构域选自C2H2锌指结构域、CCCH锌指结构域、多半胱氨酸锌指结构域和锌双核簇结构域。在可与前述实施方案的任一个组合的一些实施方案中,DNA结合结构域选自TAL效应子靶向结构域、螺旋-转角-螺旋家族DNA结合结构域、碱性结构域、带-螺旋-螺旋结构域、TBP结构域、桶状二聚体结构域、真实同源结构域、BAH结构域、SANT结构域、克罗莫结构域、Tudor结构域、布罗莫结构域、PHD结构域、WD40结构域和MBD结构域。在可与前述实施方案的任一个组合的一些实施方案中,DNA结合结构域包含TAL效应子靶向结构域。在可与前述实施方案的任一个组合的一些实施方案中,DNA结合结构域结合一种或更多种靶核酸。在可与前述实施方案的任一个组合的一些实施方案中,DNA结合结构域结合一种或更多种靶核酸。在一些实施方案中,一种或更多种靶核酸为编码多肽的核酸。在一些实施方案中,一种或更多种靶核酸为内源植物核酸。在一些实施方案中,一种或更多种靶核酸为异源核酸。在可与前述实施方案的任一个组合的一些实施方案中,DRD1样蛋白减少一种或更多种靶核酸的表达。在可与前述实施方案的任一个组合的一些实施方案中,DRD1样蛋白使一种或更多种靶核酸的表达沉默。
本公开内容还涉及用于减少植物中一种或更多种靶核酸的表达的方法,所述方法包括:a)提供包含重组核酸的植物,其中所述重组核酸编码包含第一氨基酸序列和第二氨基酸序列的重组多肽,所述第一氨基酸序列包含DNA结合结构域,所述第二氨基酸序列包含RDM1多肽或其片段;以及b)在其中由所述重组核酸编码的重组多肽藉以被表达并与所述一种或更多种靶核酸结合的条件下使所述植物生长,从而减少所述一种或更多种靶核酸的表达。在一些实施方案中,DNA结合结构域包含锌指结构域。在一些实施方案中,锌指结构域包含2个、3个、4个、5个、6个、7个、8个或9个锌指。在一些实施方案中,锌指结构域为锌指阵列。在一些实施方案中,锌指结构域选自Cys2His2(C2H2)锌指结构域、CCCH锌指结构域、多半胱氨酸锌指结构域和锌双核簇结构域。在可与前述实施方案的任一个组合的一些实施方案中,DNA结合结构域选自TAL效应子靶向结构域、螺旋-转角-螺旋家族DNA结合结构域、碱性结构域、带-螺旋-螺旋结构域、TBP结构域、桶状二聚体结构域、真实同源结构域、BAH结构域、SANT结构域、克罗莫结构域、Tudor结构域、布罗莫结构域、PHD结构域、WD40结构域和MBD结构域。在可与前述实施方案的任一个组合的一些实施方案中,DNA结合结构域包含TAL效应子靶向结构域。在可与前述实施方案的任一个组合的一些实施方案中,DNA结合结构域包含3个C2H2锌指结构域。在可与前述实施方案的任一个组合的一些实施方案中,第二氨基酸序列包含选自双螺旋束结构域、SRA结构域、pre-SET结构域或SET结构域的结构域。在可与前述实施方案的任一个组合的一些实施方案中,第二氨基酸序列包含与SEQIDNO:91至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或至少99%相同的氨基酸序列。在可与前述实施方案的任一个组合的一些实施方案中,第二氨基酸序列包含与SEQIDNO:91100%相同的氨基酸序列。在可与前述实施方案的任一个组合的一些实施方案中,重组多肽与RNA聚合酶相互作用。在可与前述实施方案的任一个组合的一些实施方案中,RNA聚合酶为RNA聚合酶V。在可与前述实施方案的任一个组合的一些实施方案中,重组多肽引起RNA指导的DNA甲基化。在可与前述实施方案的任一个组合的一些实施方案中,一种或更多种靶核酸为内源核酸。在可与前述实施方案的任一个组合的一些实施方案中,一种或更多种靶核酸为异源核酸。在可与前述实施方案的任一个组合的一些实施方案中,一种或更多种靶核酸的表达被沉默。
本公开内容还涉及编码包含第一氨基酸序列和第二氨基酸序列的RDM1样蛋白的重组核酸,所述第一氨基酸序列包含DNA结合结构域,所述第二氨基酸序列包含RDM1多肽或其片段。在一些实施方案中,第二氨基酸序列包含与SEQIDNO:91至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%相同的氨基酸序列。在一些实施方案中,第二氨基酸序列包含与SEQIDNO:91100%相同的氨基酸序列。在可与前述实施方案的任一个组合的一些实施方案中,DNA结合结构域包含锌指结构域。在一些实施方案中,锌指结构域包含2个、3个、4个、5个、6个、7个、8个或9个锌指。在一些实施方案中,锌指结构域为锌指阵列。在一些实施方案中,锌指结构域选自C2H2锌指结构域、CCCH锌指结构域、多半胱氨酸锌指结构域和锌双核簇结构域。在可与前述实施方案的任一个组合的一些实施方案中,DNA结合结构域选自TAL效应子靶向结构域、螺旋-转角-螺旋家族DNA结合结构域、碱性结构域、带-螺旋-螺旋结构域、TBP结构域、桶状二聚体结构域、真实同源结构域、BAH结构域、SANT结构域、克罗莫结构域、Tudor结构域、布罗莫结构域、PHD结构域、WD40结构域和MBD结构域。在可与前述实施方案的任一个组合的一些实施方案中,DNA结合结构域包含TAL效应子靶向结构域。在可与前述实施方案的任一个组合的一些实施方案中,DNA结合结构域结合一种或更多种靶核酸。在可与前述实施方案的任一个组合的一些实施方案中,DNA结合结构域结合一种或更多种靶核酸。在一些实施方案中,一种或更多种靶核酸为编码多肽的核酸。在一些实施方案中,一种或更多种靶核酸为内源植物核酸。在一些实施方案中,一种或更多种靶核酸为异源核酸。在可与前述实施方案的任一个组合的一些实施方案中,RDM1样蛋白减少一种或更多种靶核酸的表达。在可与前述实施方案的任一个组合的一些实施方案中,RDM1样蛋白使一种或更多种靶核酸的表达沉默。
本公开内容还涉及用于减少植物中一种或更多种靶核酸的表达的方法,所述方法包括:a)提供包含重组核酸的植物,其中所述重组核酸编码包含第一氨基酸序列和第二氨基酸序列的重组多肽,所述第一氨基酸序列包含DNA结合结构域,所述第二氨基酸序列包含DRM3多肽或其片段;以及b)在其中由所述重组核酸编码的重组多肽藉以被表达并与所述一种或更多种靶核酸结合的条件下使所述植物生长,从而减少所述一种或更多种靶核酸的表达。在一些实施方案中,DNA结合结构域包含锌指结构域。在一些实施方案中,锌指结构域包含2个、3个、4个、5个、6个、7个、8个或9个锌指。在一些实施方案中,锌指结构域为锌指阵列。在一些实施方案中,锌指结构域选自Cys2His2(C2H2)锌指结构域、CCCH锌指结构域、多半胱氨酸锌指结构域和锌双核簇结构域。在可与前述实施方案的任一个组合的一些实施方案中,DNA结合结构域选自TAL效应子靶向结构域、螺旋-转角-螺旋家族DNA结合结构域、碱性结构域、带-螺旋-螺旋结构域、TBP结构域、桶状二聚体结构域、真实同源结构域、BAH结构域、SANT结构域、克罗莫结构域、Tudor结构域、布罗莫结构域、PHD结构域、WD40结构域和MBD结构域。在可与前述实施方案的任一个组合的一些实施方案中,DNA结合结构域包含TAL效应子靶向结构域。在可与前述实施方案的任一个组合的一些实施方案中,DNA结合结构域包含3个C2H2锌指结构域。在可与前述实施方案的任一个组合的一些实施方案中,第二氨基酸序列包含选自双螺旋束结构域、SRA结构域、pre-SET结构域或SET结构域的结构域。在可与前述实施方案的任一个组合的一些实施方案中,第二氨基酸序列包含与SEQIDNO:101至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或至少99%相同的氨基酸序列。在可与前述实施方案的任一个组合的一些实施方案中,第二氨基酸序列包含与SEQIDNO:101100%相同的氨基酸序列。在可与前述实施方案的任一个组合的一些实施方案中,重组多肽与RNA聚合酶相互作用。在可与前述实施方案的任一个组合的一些实施方案中,RNA聚合酶为RNA聚合酶V。在可与前述实施方案的任一个组合的一些实施方案中,重组多肽引起RNA指导的DNA甲基化。在可与前述实施方案的任一个组合的一些实施方案中,一种或更多种靶核酸为内源核酸。在可与前述实施方案的任一个组合的一些实施方案中,一种或更多种靶核酸为异源核酸。在可与前述实施方案的任一个组合的一些实施方案中,一种或更多种靶核酸的表达被沉默。
本公开内容还涉及编码包含第一氨基酸序列和第二氨基酸序列的DRM3样蛋白的重组核酸,所述第一氨基酸序列包含DNA结合结构域,所述第二氨基酸序列包含DRM3多肽或其片段。在一些实施方案中,第二氨基酸序列包含与SEQIDNO:101至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%相同的氨基酸序列。在一些实施方案中,第二氨基酸序列包含与SEQIDNO:101100%相同的氨基酸序列。在可与前述实施方案的任一个组合的一些实施方案中,DNA结合结构域包含锌指结构域。在一些实施方案中,锌指结构域包含2个、3个、4个、5个、6个、7个、8个或9个锌指。在一些实施方案中,锌指结构域为锌指阵列。在一些实施方案中,锌指结构域选自C2H2锌指结构域、CCCH锌指结构域、多半胱氨酸锌指结构域和锌双核簇结构域。在可与前述实施方案的任一个组合的一些实施方案中,DNA结合结构域选自TAL效应子靶向结构域、螺旋-转角-螺旋家族DNA结合结构域、碱性结构域、带-螺旋-螺旋结构域、TBP结构域、桶状二聚体结构域、真实同源结构域、BAH结构域、SANT结构域、克罗莫结构域、Tudor结构域、布罗莫结构域、PHD结构域、WD40结构域和MBD结构域。在可与前述实施方案的任一个组合的一些实施方案中,DNA结合结构域包含TAL效应子靶向结构域。在可与前述实施方案的任一个组合的一些实施方案中,DNA结合结构域结合一种或更多种靶核酸。在可与前述实施方案的任一个组合的一些实施方案中,DNA结合结构域结合一种或更多种靶核酸。在一些实施方案中,一种或更多种靶核酸为编码多肽的核酸。在一些实施方案中,一种或更多种靶核酸为内源植物核酸。在一些实施方案中,一种或更多种靶核酸为异源核酸。在可与前述实施方案的任一个组合的一些实施方案中,DRM3样蛋白减少一种或更多种靶核酸的表达。在可与前述实施方案的任一个组合的一些实施方案中,DRM3样蛋白使一种或更多种靶核酸的表达沉默。
本公开内容还涉及用于减少植物中一种或更多种靶核酸的表达的方法,所述方法包括:a)提供包含重组核酸的植物,其中所述重组核酸编码包含第一氨基酸序列和第二氨基酸序列的重组多肽,所述第一氨基酸序列包含DNA结合结构域,所述第二氨基酸序列包含DRM2多肽或其片段;以及b)在其中由所述重组核酸编码的重组多肽藉以被表达并与所述一种或更多种靶核酸结合的条件下使所述植物生长,从而减少所述一种或更多种靶核酸的表达。在一些实施方案中,DNA结合结构域包含锌指结构域。在一些实施方案中,锌指结构域包含2个、3个、4个、5个、6个、7个、8个或9个锌指。在一些实施方案中,锌指结构域为锌指阵列。在一些实施方案中,锌指结构域选自Cys2His2(C2H2)锌指结构域、CCCH锌指结构域、多半胱氨酸锌指结构域和锌双核簇结构域。在可与前述实施方案的任一个组合的一些实施方案中,DNA结合结构域选自TAL效应子靶向结构域、螺旋-转角-螺旋家族DNA结合结构域、碱性结构域、带-螺旋-螺旋结构域、TBP结构域、桶状二聚体结构域、真实同源结构域、BAH结构域、SANT结构域、克罗莫结构域、Tudor结构域、布罗莫结构域、PHD结构域、WD40结构域和MBD结构域。在可与前述实施方案的任一个组合的一些实施方案中,DNA结合结构域包含TAL效应子靶向结构域。在可与前述实施方案的任一个组合的一些实施方案中,DNA结合结构域包含3个C2H2锌指结构域。在可与前述实施方案的任一个组合的一些实施方案中,第二氨基酸序列包含选自双螺旋束结构域、SRA结构域、pre-SET结构域或SET结构域的结构域。在可与前述实施方案的任一个组合的一些实施方案中,第二氨基酸序列包含与SEQIDNO:113至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或至少99%相同的氨基酸序列。在可与前述实施方案的任一个组合的一些实施方案中,第二氨基酸序列包含与SEQIDNO:113100%相同的氨基酸序列。在可与前述实施方案的任一个组合的一些实施方案中,重组多肽与RNA聚合酶相互作用。在可与前述实施方案的任一个组合的一些实施方案中,RNA聚合酶为RNA聚合酶V。在可与前述实施方案的任一个组合的一些实施方案中,重组多肽引起RNA指导的DNA甲基化。在可与前述实施方案的任一个组合的一些实施方案中,一种或更多种靶核酸为内源核酸。在可与前述实施方案的任一个组合的一些实施方案中,一种或更多种靶核酸为异源核酸。在可与前述实施方案的任一个组合的一些实施方案中,一种或更多种靶核酸的表达被沉默。
本公开内容还涉及编码包含第一氨基酸序列和第二氨基酸序列的DRM2样蛋白的重组核酸,所述第一氨基酸序列包含DNA结合结构域,所述第二氨基酸序列包含DRM2多肽或其片段。在一些实施方案中,第二氨基酸序列包含与SEQIDNO:113至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%相同的氨基酸序列。在一些实施方案中,第二氨基酸序列包含与SEQIDNO:113100%相同的氨基酸序列。在可与前述实施方案的任一个组合的一些实施方案中,DNA结合结构域包含锌指结构域。在一些实施方案中,锌指结构域包含2个、3个、4个、5个、6个、7个、8个或9个锌指。在一些实施方案中,锌指结构域为锌指阵列。在一些实施方案中,锌指结构域选自C2H2锌指结构域、CCCH锌指结构域、多半胱氨酸锌指结构域和锌双核簇结构域。在可与前述实施方案的任一个组合的一些实施方案中,DNA结合结构域选自TAL效应子靶向结构域、螺旋-转角-螺旋家族DNA结合结构域、碱性结构域、带-螺旋-螺旋结构域、TBP结构域、桶状二聚体结构域、真实同源结构域、BAH结构域、SANT结构域、克罗莫结构域、Tudor结构域、布罗莫结构域、PHD结构域、WD40结构域和MBD结构域。在可与前述实施方案的任一个组合的一些实施方案中,DNA结合结构域包含TAL效应子靶向结构域。在可与前述实施方案的任一个组合的一些实施方案中,DNA结合结构域结合一种或更多种靶核酸。在可与前述实施方案的任一个组合的一些实施方案中,DNA结合结构域结合一种或更多种靶核酸。在一些实施方案中,一种或更多种靶核酸为编码多肽的核酸。在一些实施方案中,一种或更多种靶核酸为内源植物核酸。在一些实施方案中,一种或更多种靶核酸为异源核酸。在可与前述实施方案的任一个组合的一些实施方案中,DRM2样蛋白减少一种或更多种靶核酸的表达。在可与前述实施方案的任一个组合的一些实施方案中,DRM2样蛋白使一种或更多种靶核酸的表达沉默。
本公开内容还涉及用于减少植物中一种或更多种靶核酸的表达的方法,所述方法包括:a)提供包含重组核酸的植物,其中所述重组核酸编码包含第一氨基酸序列和第二氨基酸序列的重组多肽,所述第一氨基酸序列包含DNA结合结构域,所述第二氨基酸序列包含FRG多肽或其片段;以及b)在其中由所述重组核酸编码的重组多肽藉以被表达并与所述一种或更多种靶核酸结合的条件下使所述植物生长,从而减少所述一种或更多种靶核酸的表达。在一些实施方案中,DNA结合结构域包含锌指结构域。在一些实施方案中,锌指结构域包含2个、3个、4个、5个、6个、7个、8个或9个锌指。在一些实施方案中,锌指结构域为锌指阵列。在一些实施方案中,锌指结构域选自Cys2His2(C2H2)锌指结构域、CCCH锌指结构域、多半胱氨酸锌指结构域和锌双核簇结构域。在可与前述实施方案的任一个组合的一些实施方案中,DNA结合结构域选自TAL效应子靶向结构域、螺旋-转角-螺旋家族DNA结合结构域、碱性结构域、带-螺旋-螺旋结构域、TBP结构域、桶状二聚体结构域、真实同源结构域、BAH结构域、SANT结构域、克罗莫结构域、Tudor结构域、布罗莫结构域、PHD结构域、WD40结构域和MBD结构域。在可与前述实施方案的任一个组合的一些实施方案中,DNA结合结构域包含TAL效应子靶向结构域。在可与前述实施方案的任一个组合的一些实施方案中,DNA结合结构域包含3个C2H2锌指结构域。在可与前述实施方案的任一个组合的一些实施方案中,第二氨基酸序列包含选自双螺旋束结构域、SRA结构域、pre-SET结构域或SET结构域的结构域。在可与前述实施方案的任一个组合的一些实施方案中,第二氨基酸序列包含与SEQIDNO:125至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或至少99%相同的氨基酸序列。在可与前述实施方案的任一个组合的一些实施方案中,第二氨基酸序列包含与SEQIDNO:125100%相同的氨基酸序列。在可与前述实施方案的任一个组合的一些实施方案中,重组多肽与RNA聚合酶相互作用。在可与前述实施方案的任一个组合的一些实施方案中,RNA聚合酶为RNA聚合酶V。在可与前述实施方案的任一个组合的一些实施方案中,重组多肽引起RNA指导的DNA甲基化。在可与前述实施方案的任一个组合的一些实施方案中,一种或更多种靶核酸为内源核酸。在可与前述实施方案的任一个组合的一些实施方案中,一种或更多种靶核酸为异源核酸。在可与前述实施方案的任一个组合的一些实施方案中,一种或更多种靶核酸的表达被沉默。
本公开内容还涉及编码包含第一氨基酸序列和第二氨基酸序列的FRG样蛋白的重组核酸,所述第一氨基酸序列包含DNA结合结构域,所述第二氨基酸序列包含FRG多肽或其片段。在一些实施方案中,第二氨基酸序列包含与SEQIDNO:125至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%相同的氨基酸序列。在一些实施方案中,第二氨基酸序列包含与SEQIDNO:125100%相同的氨基酸序列。在可与前述实施方案的任一个组合的一些实施方案中,DNA结合结构域包含锌指结构域。在一些实施方案中,锌指结构域包含2个、3个、4个、5个、6个、7个、8个或9个锌指。在一些实施方案中,锌指结构域为锌指阵列。在一些实施方案中,锌指结构域选自C2H2锌指结构域、CCCH锌指结构域、多半胱氨酸锌指结构域和锌双核簇结构域。在可与前述实施方案的任一个组合的一些实施方案中,DNA结合结构域选自TAL效应子靶向结构域、螺旋-转角-螺旋家族DNA结合结构域、碱性结构域、带-螺旋-螺旋结构域、TBP结构域、桶状二聚体结构域、真实同源结构域、BAH结构域、SANT结构域、克罗莫结构域、Tudor结构域、布罗莫结构域、PHD结构域、WD40结构域和MBD结构域。在可与前述实施方案的任一个组合的一些实施方案中,DNA结合结构域包含TAL效应子靶向结构域。在可与前述实施方案的任一个组合的一些实施方案中,DNA结合结构域结合一种或更多种靶核酸。在可与前述实施方案的任一个组合的一些实施方案中,DNA结合结构域结合一种或更多种靶核酸。在一些实施方案中,一种或更多种靶核酸为编码多肽的核酸。在一些实施方案中,一种或更多种靶核酸为内源植物核酸。在一些实施方案中,一种或更多种靶核酸为异源核酸。在可与前述实施方案的任一个组合的一些实施方案中,FRG样蛋白减少一种或更多种靶核酸的表达。在可与前述实施方案的任一个组合的一些实施方案中,FRG样蛋白使一种或更多种靶核酸的表达沉默。
本公开内容的其他方面涉及根据前述实施方案的任一个的方法具有一种或更多种靶核酸的减少的表达的植物,以及前述实施方案的植物的后代植物。在一些实施方案中,后代植物具有一种或更多种靶核酸的减少的表达并且不包含本公开内容的重组核酸。
附图简述
本专利或申请文件包含以彩色展示的至少一幅图。具有彩色附图的本专利或专利申请公布的副本经请求并支付必要的费用后将由专利局提供。
图1A-图1G阐释了RdDM突变体中受影响的sRNA簇的表观遗传谱。图1A阐释了饼状图,显示所示的分类中24ntsiRNA读段的丰度(共5,967,213个独特映射的读段)。图1B阐释了维恩图,显示每个基因型中减少的24ntsiRNA簇与用于下游分析的亚类的近似关系。图1C阐释了饼状图,显示所示的亚类中受影响的siRNA簇的染色体分布(基于此前描述的近着丝粒异染色质和常染色质的定义)。图1D和图1E阐释了在图1B中所示的亚类针对不同RdDM突变体的siRNA和CHH甲基化模式的箱形图(*指示显著减少;P<1e-10Mann-WhitneyU检验)。图1F阐释了metaplot,显示在受影响的siRNA簇(从sRNA簇的中点+/-5000bp)处CMT3和Pol-V的富集。图1G阐释了跨受影响的siRNA簇的Pol-V富集的热图。
图2A-图2B阐释了在界定的siRNA簇处的聚合酶IV水平。图2A阐释了在所示的遗传背景中跨界定的siRNA簇的Pol-IV富集的metaplot且图2B阐释了在所示的遗传背景中跨界定的siRNA簇的Pol-IV富集的热图。Metaplot和热图从siRNA簇的中点延伸+/-5000bp。
图3A-图3D阐释了SHH1SAWADEE结构域识别H3K9甲基化并采取独特的串联Tudor结构域样折叠。图3A和图3B阐释了结合至如所示的修饰或未修饰的组蛋白肽的SAWADEE结构域的基于ITC的测量。列出了Kd值。图3C阐释了metaplot分析,显示跨所示的Pol-IVChIP-seq峰种类的H3K9me2富集。图3D阐释了以游离形式的SHH1SAWADEE结构域的总体结构。两个串联Tudor结构域以品红(Tudor1)和绿色(Tudor2)显示。SAWADEE结构域的独特的锌结合基序显示为放大的球棒模型(ball-and-stickmodel),突出显示金属配位的细节。来自结晶条件的结合的去垢剂分子4-环己基-1-丁基-β-D-麦芽糖苷(HamptonResearch)部分显示为黄色以棒展示。
图4A-图4J阐释了用于SHH1SAWADEE结构域识别H3(1-15)K9me2肽的结构基础和体内(invivo)功能分析结果。图4A阐释了H3(1-15)K9me2-SAWADEE复合体的总体结构。SAWADEE结构域显示为带状图且肽以棒展示。还显示了模拟的退火复合物,省略了结合的肽在1σ水平的电子密度图。Tudor结构域1和2分别显示为品红和绿色。图4B阐释了立体视图,突出显示SAWADEE结构域与结合的H3(1-15)K9me2肽之间的分子间相互作用的细节。分子间氢键相互作用由红色虚线标出。还显示了识别二甲基化的K9的芳香族笼(aromaticcage)。图4C阐释了SAWADEE结构域与结合的H3(1-15)K9me2肽之间的分子间相互作用的展示。图4D阐释了H3K9me2肽结合的SAWADEE结构域(Tudor1呈品红且Tudor2呈绿色)与游离形式的SAWADEE结构域(呈银色)的叠加揭示肽结合后没有显著的总体构象变化。图4E阐释了未甲基化的K4插入由来自Tudor1的Glu130和Asp141、以及来自Tudor2的Leu201和Tyr212形成的窄袋,并与Glu130和Asp141形成两个氢键、以及静电相互作用。图4F阐释了由三个芳香族残基形成的芳香族笼识别二甲基化的K9的详细视图。图4G阐释了单甲基化的K4为SAWADEE结构域的K4结合袋所容许,如由H3(1-15)K4me1K9me1-SAWADEE复合物的晶体结构揭示的。另外的甲基破坏与Glu130的一个氢键并引入与其他残基的更多范德华接触。图4H和图4I阐释了箱形图,分别显示在野生型和shh1突变体以及用具有野生型SHH1序列或K9(F162AF165A和Y140A)或K4(D141A和Y212A)结合袋中的点突变的SHH1构建体转化的shh1突变体中的%CHH甲基化和siRNA水平。(*指示显著性减少;P<1e-10Mann-WhitneyU检验)。图4J阐释了定量PCR结果,显示Pol-IV在野生型和SHH1突变体背景中的富集。蓝色条指示对输入物和肌动蛋白水平标准化之后两个生物学重复的平均值。黑色条指示标准偏差。
图5A-图5F阐释了SUVH2和SUVH9是PolV染色质结合、转录、和产生DNA甲基化所需的。图5A阐释了IGN22和P6相对于肌动蛋白7并对哥伦比亚(WT)标准化的定量PCR(qPCR)。两个生物学重复的平均值+/-标准偏差(SD)。图5B阐释了来自FlagChIP的IGN22和IGN5的qPCR,显示为NRPE1-Flag/WT和NRPE1-Flag/suvh2suvh9系中IP/输入物相对于肌动蛋白7的富集。两个生物学重复的平均值+/-SD。图5C阐释了NRPE1-Flag/WT或NRPE1-Flag/suvh2suvh9中在由FlagChIP-seq确定的界定的NRPE1位点处的NRPE1富集的热图,以哥伦比亚中的FlagChIP作为阴性对照。图5D阐释了在C中显示的NRPE1-Flag/WT和NRPE1-Flag/suvh2suvh9的位点处的NRPE1富集的箱形图(胡须(whisker)延伸至±1.5四分位差(IQR))。图5E阐释了在所有界定的NRPE1结合位点处的甲基化百分比(平均值+/-SD),如由全基因组亚硫酸氢盐测序确定的。图5F阐释了WT、suvh2suvh9和suvh4suvh5suvh6中H3K9me1ChIP-seq读段的密度,由在80个选择的常染色质位点处的平均组蛋白甲基化水平标准化。
图6A-图6E阐释了拴系的SUVH2吸引DNA甲基化并导致晚开花表型。图6A,上图阐释了具有在N末端紧邻HA标签之前插入的Zn指的SUVH2的图。图6A,下图阐释了FWA基因的示意图,显示两个小的和两个大的重复段(蓝色箭头)、由PCR扩增的区域(启动子和转录物)、转录的开始(红色箭头)和由Zn指结合的位点(由两个橙色箭头指示)。图6B阐释了并排生长的植物,以阐释fwa-4中ZF-SUVH2(T2植物)与fwa-4相比的早开花。图6C阐释了哥伦比亚(WT)、fwa-4中ZF-SUVH2、fwa-4中HA-SUVH2和fwa-4的开花时间。平均值+/-SD。图6D阐释了FWA重复区域中在每个C处的甲基化百分比。数字指示单个C残基,两条黑色线显示ZF结合位点的位置,红色箭头显示转录物的位置。甲基化百分比从亚硫酸氢盐处理的DNA的20-25个克隆确定。图6E阐释了来自三个单独的T1植物的FWA重复区域中在每个C处的甲基化百分比。
图7A-图7C阐释了ZF-SUVH2将PolV而非组蛋白甲基化募集至FWA。图7A阐释了WT(阳性对照)、nrpe1突变体(阴性对照)、fwa-4表观等位基因、和ZF-SUVH2/fwa-4中的NRPE1ChIP。两个表征的NRPE位点(IGN5和IGN22)和FWA中的两个区域(FWAp-启动子和FWAt-转录物)的qPCR显示为IP/输入物相对于阴性对照的富集。两个生物学重复的平均值+/-SD。图7B阐释了WT、fwa-4和ZF-SUVH2/fwa-4T1花中的H3K9me1ChIP。阴性对照是常染色质中缺乏DNA甲基化的区域。富集是相对于异染色质逆转录转座子Ta3。两个生物学重复的平均值+/-SD。图7C阐释了与图7B相同的内容,但ZF-SUVH2/fwa-4来自T2花。
图8A-图8H阐释了处于游离状态的SUVH9和结构域之间相互作用的晶体结构。图8A阐释了用于结晶的全长SUVH9和N末端截短的构建体的颜色编码示意图。图8B阐释了SUVH9的晶体结构的带状图,包含分别以粉色、绿色、橙色和蓝色显示的朝向N末端的双螺旋束、SRA结构域、pre-SET结构域和SET结构域。无序区域以虚线显示。Zn3Cys9簇(图的右下)以球棒模型突出显示。图8C阐释了旋转180°的两个替代视图中显示的双螺旋束内的疏水性相互作用和电荷相互作用。参与螺旋间疏水性相互作用的残基以黄色突出显示。图8D阐释了第一α-螺旋的N末端部分与SRA结构域和SET结构域形成电荷和氢键相互作用。相互作用的残基以棒展示显示且氢键相互作用以红色虚线显示。图8E阐释了第一α-螺旋的C末端部分展现与SRA结构域和pre-SET/SET结构域的广泛疏水性相互作用。来自SET结构域的长环的尖端覆盖在第一α-螺旋上并与之形成疏水性相互作用。相互作用的残基以棒展示显示。图8F阐释了第二α-螺旋与SRA结构域形成一些相互作用。相互作用的残基以棒展示显示且氢键相互作用以红色虚线显示。图8G阐释了SRA结构域形成与pre-SET/SET结构域和双螺旋束相互作用的疏水性核。相互作用的残基以棒展示显示。图8H阐释了SUVH9SET结构域的长插入环(以品红突出显示)富含疏水性残基并与双螺旋束、pre-SET和SET结构域形成广泛疏水性相互作用。
图9A-图9E阐释了SAH-和肽-结合的GLP和以游离状态的SUVH9的结构比较和对于SUVH9缺少甲基转移酶活性的潜在结构基础。图9A阐释了人类GLP与结合的SAH(PDB编码:2IGQ)复合的晶体结构在上图中以银色带展示来显示,其SAH结合位点的展开视图在下图中以静电表面展示(electrostaticsurfacerepresentataion)显示。辅因子SAH在上图和下图中以空间-填充展示来显示。GLP的SAH结合袋是相对窄的并以结构和形状互补结合SAH。图9B阐释了处于游离状态的SUVH9的晶体结构在上图中以彩色编码带展示来显示,推测的SAH结合位点的展开视图在下图中以静电表面展示来显示。SUVH9的推测的SAH结合袋是相对开放的和不会提供SAH分子的良好配合。图9C阐释了人类GLP与SAH和H3K9me2肽(PDB编码:2RFI)复合的晶体结构在上图中以银色带展示来显示,其肽结合位点的展开视图在下图中以静电表面展示来显示。参与肽底物结合的post-SET结构域和SET结构域的酸性环分别以蓝绿色和深蓝色突出显示。结合的肽在上图和下图中以空间-填充展示来显示。肽被结合在post-SET和SET结构域之间的表面裂缝中。图9D阐释了处于游离状态的SUVH9的晶体结构在上图中以彩色编码带展示来显示,推测的肽-结合位点的展开视图在下图中以静电表面展示来显示。SET结构域的长插入环以品红突出显示。推测的肽-结合位点被长插入环部分地封闭且蛋白表面上没有显著的肽-结合裂缝。图9E阐释了在叠加SUVH5SRA-mCHH复合体[PDB编码:3Q0F)和处于游离状态的SUVH9的结构之后,将mCHHDNA放置到SUVH9SRA结构域的活性位点的模型。DNA良好地配合到SRA结构域中而没有显著的空间位阻。在双螺旋束的第二α-螺旋上的一些周围残基以棒展示突出显示,所述残基可潜在地参与对DNA的结合。
图10阐释了拟南芥(Arabidopsisthaliana)SHH1、SHH2和SAWADEE结构域与来自其他物种包括蓖麻(Ricinuscommunis)、葡萄(Vitisvinifera)、北美云杉(Piceasitchensis)和玉蜀黍(Zeamays)中的SHH1直系同源物的基于结构的序列比对。还包括了人类UHRF1的串联Tudor结构域用于比较。SHH1SAWADEE结构域和人类UHRF1串联Tudor结构域的二级结构分别展示在比对的上方和下方。SAWADEE结构域的参与结合去垢剂的非极性尾部的部分保守的疏水性残基以绿色星号标出。参与识别甲基化的K9的保守的芳香族残基以紫色六边形标出。参与配位锌离子的保守的SAWADEE残基以黑色圆圈标出。
图11阐释了来自拟南芥的SUVH家族蛋白的基于结构的序列比对。SUVH9的二级结构元件在序列比对的上方标出。结构域边界在上方标出。参与与翻转的5mC碱基相互作用的保守残基以及从公开的SUVH5-DNA复合物结构可得的DNA骨架分别以蓝绿色圆圈和蓝色六边形突出显示。SET结构域中的插入物以紫色框突出显示。锌配位的Cys残基在SET结构域中以黑色星号且在post-SET结构域中以灰色星号突出显示。保守并对于酶活性通常重要的两个酪氨酸残基以红色点突出显示。
图12A-图12C阐释了SUVH2和SUVH9全基因组地冗余作用。图12A阐释了跨各种SUVH突变体中鉴定的DMR的CHH甲基化的metaplot。图12B阐释了跨PolV结合位点的CHH甲基化的metaplot。图12C阐释了维恩图,详述SUVH突变体中CHH低-甲基化的区域之间的重叠。
图13A-图13E阐释了PolV结合依赖于DNA甲基化。图13A阐释了在所有界定的NRPE1结合位点处的CHH甲基化百分比的metaplot,如由野生型(WT)、nrpe1和suvh2suvh9中的BS-seq确定的。图13B阐释了箱形图,显示WT和met1中在界定的NRPE1结合位点处每个胞嘧啶环境中的DNA甲基化。图13C阐释了met1中的PolV占据在NRPE1位点处减少。图13D阐释了met1中界定为高-甲基化的位点处的DNA甲基化的metaplot。图13E阐释了met1中PolV占据在界定的高-甲基化的位点处增加。
图14A-图14B阐释了拴系的SUVH2通过DRD1募集PolV,导致DNA甲基化和晚开花表型。图14A阐释了与T2ZF-KYP/fwa-4(未甲基化的)和WT(标准甲基化模式)相比,在FWA重复区域中的每个胞嘧啶处的甲基化百分比,如由T2和T3ZF-SUVH2/fwa-4植物中BS-seq确定的。ZF结合位点显示为绿色且FWA基因显示为蓝色。图14B阐释了以ZF-SUVH2拉下DRD1-Flag的结果。输入物:来自拟南芥的DRD1-Flag提取物;珠模拟物:从使用预结合本氏烟草(Nicotianabenthamiana)提取物的HA磁珠的DRD1-Flag拉下洗脱;珠-ZFSUVH2:从使用预结合本氏烟草ZF-SUVH2提取物的HA-磁珠的DRD1-Flag拉下洗脱。上图:Flag印迹;下图:HA印迹。
图15A-图15C阐释了ZF-SUVH2构建体通过与DRD1直接相互作用将PolV稳定地募集至FWA。图15A阐释了WT相比于ZF-KYP(加flag标签的)中的Flag-ChIP,显示在启动子和转录物区域二者中在FWA处的富集。图15B阐释了来自含有ZF-SUVH2转基因的Basta-抗性系和已经丢失ZF-SUVH2转基因的两个Basta-敏感性姊妹株的FWA的BS-Seq。图15C阐释了利用Flag-DRD1拟南芥中HA-SUVH2的拉下。左图是来自两个亲本株系(表达HA-SUVH2(HA-2)或Flag-DRD1(Flag-D))和表达HA-SUVH2和FlagDRD1(HA-2xFlag-d)二者的F2系的输入物。右图显示洗脱Flag-磁珠。上图是HA印迹,下图是Flag印迹。
图16阐释了由DRD1免疫沉淀-质谱鉴定的蛋白列表。
图17阐释了野生型、fwa-4和DMS3-ZF和MORC6-ZF早开花系中在FWA基因处的CG、CHG和CHH甲基化。红色代表CHH甲基化,其中H是C、A或T。绿色代表CG甲基化。蓝色代表CHG甲基化。浅蓝色代表与polV突变体相比,野生型中的PolV结合,显示PolV结合至野生型植物中FWA的启动子区域。FWA基因的示意图在下方以深蓝色展示。
图18阐释了野生型植物(上半部分)或含有TAL-SHH1的植物(下半部分)中在APETALA1(At1g69120)启动子区域处存在的小RNA。在上方链上的siRNA为红色且在下方链上的siRNA为蓝色。
图19阐释了仅包含TAL-SUVH2、TAL-SHH1或包含TAL-SHH1和TAL-SUVH2二者(TAL-SHH1/TAL-SUVH2)的F1植物中在SUPERMAN基因(At3g23130)启动子区域处的CHHDNA甲基化。
详述
综述
提出以下描述是为了使本领域普通技术人员能够制造和使用多个实施方案。仅作为实例提供具体的装置、技术、方法和应用的描述。对本文记载的实例的多种改变对本领域普通技术人员是显而易见的,并且本文定义的一般性原则可以应用于其他实例和应用中,而不会与多个实施方案的精神和范围相背离。因此,不意欲将多个实施方案限制为本文记载和显示的实例。
本公开内容涉及引起表观遗传基因沉默的重组蛋白,和使用所述蛋白用于降低植物中基因表达的方法。
在拟南芥(Arabidopsis)中,DNA甲基化由被称为DRM2的蛋白质确立,并被24nt的小干扰RNA(siRNA)通过称为RNA指导的DNA甲基化(RdDM)的途径靶向,所述途径包括两个植物特异性的RNA聚合酶:RNA聚合酶IV(PolIV),其功能是起始siRNA的生物合成;和RNA聚合酶V(PolV),其功能是在RdDM途径的下游DNA甲基转移酶靶向阶段产生募集下游RdDM因子的非编码支架转录物。因此,拟南芥中的RNA指导的DNA甲基化(RdDM)包括通过PolIV的非编码小干扰RNA的合成和通过PolV的非编码支架RNA的合成二者。
本公开内容(至少部分)基于申请人的发现:称为SHH1的蛋白在RdDM途径中起作用以使能够从RdDM靶产生siRNA,和SHH1是RNA聚合酶IV(PolIV)占据在这些靶基因座基因座处所必需的。本公开内容还(至少部分)基于申请人的发现:PolV与染色质的缔合依赖于被称为SUVH2和SUVH9的两个蛋白。此外,可以通过将异源DNA结合结构域引入所述蛋白或所述蛋白的片段(例如异源性锌指结构域或TAL效应子靶向结构域)中,将修饰的SHH1、SUVH2和/或SUVH9蛋白工程化,以特异性结合不同的DNA序列。有利的是,所述重组蛋白可用于将PolIV(用于SHH1样蛋白)或PolV(用于SUVH2样蛋白和/或SUVH9样蛋白)募集到靶基因座,以在靶基因座处诱导RNA指导的DNA甲基化,并因此沉默所述靶基因座。
在本公开内容的方法中有用的用于将PolV、DNA甲基化和基因沉默靶向到特定基因座的其他蛋白包括修饰的的DMS3、MORC6和/或SUVR2蛋白的任何一个,该其他蛋白也可以通过将异源DNA结合结构域引入所述蛋白或所述蛋白的片段(例如异源性锌指结构域或TAL效应子靶向结构域)中,而被工程化,以特异性结合不同的DNA序列。
因此,本公开内容提供了使用SHH1蛋白、SUVH2蛋白、SUVH9蛋白、DMS3蛋白、MORC6蛋白和/或SUVR2蛋白中的一种或更多种沉默植物中的特定基因座的方法,所述SHH1蛋白、SUVH2蛋白、SUVH9蛋白、DMS3蛋白、MORC6蛋白和/或SUVR2蛋白已经通过将异源DNA结合结构域引入所述蛋白而被工程化,以特异性结合不同的DNA序列。前述修饰的蛋白中的每一个可以单独或以不同组合方式在宿主细胞中表达,以起作用来沉默靶基因座。例如,具有异源DNA结合结构域的修饰的SHH1蛋白可以在宿主细胞中表达以将PolIV靶向至靶基因座,联合具有异源DNA结合结构域的修饰的SUVH2蛋白、SUVH9蛋白、DMS3蛋白、MORC6蛋白和/或SUVR2蛋白中的一种或更多种将PolV靶向至所述相同的靶基因座,以触发所述靶基因座的RNA指导的DNA甲基化和外遗传沉默。
可用于根据本公开内容的方法沉默植物中特定基因座的其他蛋白包括另外的参与RNA指导的DNA甲基化的蛋白。例如,适合用于本公开内容的方法中的其他蛋白可以包括例如DRD1、RDM1、DRM3、DRM2和FRG中的任意一个。因此,本公开内容还提供了使用SHH1蛋白、SUVH2蛋白、SUVH9蛋白、DMS3蛋白、MORC6蛋白、SUVR2蛋白、DRD1蛋白、RDM1蛋白、DRM3蛋白、DRM2蛋白和/或FRG蛋白中的一种或更多种沉默植物中的特定基因座的方法,所述SHH1蛋白、SUVH2蛋白、SUVH9蛋白、DMS3蛋白、MORC6蛋白、SUVR2蛋白、DRD1蛋白、RDM1蛋白、DRM3蛋白、DRM2蛋白和/或FRG蛋白已经通过将异源DNA结合结构域引入所述蛋白而被工程化,以特异性结合不同的DNA序列。前述修饰的蛋白中的每一个可以单独或以不同组合方式在宿主细胞中表达,以起作用来沉默靶基因座。
本公开内容的用于沉默宿主细胞中靶基因座的方法还可包括在靶基因座引入小干扰RNA(siRNA),联合PolV通过SUVH2蛋白、SUVH9蛋白、DMS3蛋白、MORC6蛋白、SUVR2蛋白、DRD1蛋白、RDM1蛋白、DRM3蛋白、DRM2蛋白和/或FRG蛋白中的一种或更多种靶向所述基因座。产生siRNA的方法是本领域熟知的。这些方法包括例如在细胞中被天然加工为小干扰RNA的发夹RNA的表达。制造小干扰RNA的发夹构建体是本领域已知的(EMBOReports,2006Nov;7(11):1168-75)。另外的用于产生siRNA的方法包括例如将来自外源性来源的小干扰RNA直接引入细胞中。描述将siRNA轰击到植物中的方法是本领域已知的(Science328,912(2010))。RNA分子还可以被喷洒(外源应用)到植物上以使得此后小RNA可以在植物细胞中产生(参见美国专利申请2014/0018241)。因此,本公开内容的用于沉默宿主细胞中靶基因座的方法还可包括在靶基因座引入小干扰RNA(siRNA),联合PolV通过含有异源DNA结合结构域的SUVH2蛋白、SUVH9蛋白、DMS3蛋白、MORC6蛋白、SUVR2蛋白、DRD1蛋白、RDM1蛋白、DRM3蛋白、DRM2蛋白和/或FRG蛋白中的一种或更多种靶向所述基因座。
通过靶向本公开内容的不同重组蛋白(诸如,例如SHH1样蛋白、SUVH2样蛋白、SUVH9样蛋白、DMS3样蛋白、MORC6样蛋白、SUVR2样蛋白、DRD1样蛋白、RDM1样蛋白、DRM3样蛋白、DRM2样蛋白和/或FRG样蛋白)引起的沉默甚至在不存在这些重组蛋白的情况下也可在植物中稳定。因此,本公开内容的方法可以允许植物中的一种或更多种靶核酸在本公开内容的重组多核苷酸已经被从所述植物中除去之后保持沉默。例如,在siRNA和本公开内容的募集PolV的重组蛋白一起靶向特定区域之后,所述靶区域的沉默和DNA甲基化甚至在除去该转基因之后可以保持稳定。本公开内容的目的是提供根据本公开内容的方法的具有降低的表达的一种或更多种靶核酸的植物。由于本公开内容的方法可以允许植物中的一种或更多种靶核酸在本公开内容的重组多核苷酸已经被从所述植物中除去之后保持沉默,这些植物的后代植物甚至在不存在产生本公开内容的重组多肽的重组多核苷酸的情况下可以具有降低的表达的一种或更多种靶核酸。
定义
除非另有限定,所有科学和技术术语应理解为具有与它们所属领域中通常所用相同的含义。为了本公开内容的目的,定义了以下术语。
如本文所用的,“靶核酸”是指有利地与蛋白质结合的双链多核苷酸的一部分,所述双链多核苷酸例如RNA、DNA、PNA(肽核酸)或其组合。在一个实施方案中,“靶核酸”是一个基因的转录调控元件的全部或部分,所述基因的所需表型结果可以通过改变其表达的程度而获得。转录调控元件包括正调控元件和负调控元件例如启动子、增强子、其他应答元件,阻抑蛋白结合位点、操纵基因和/或沉默基因,所述其他应答元件例如类固醇应答元件、热激应答元件、金属应答元件。转录调控元件可以是病毒的、真核的或原核的。“靶核酸”还包括编码区域或蛋白编码基因的全部或部分。“靶核酸”还包括可结合蛋白并且其表达从而被调节(通常阻止转录)的下游核酸。
如本文所用的,“靶基因”是指其表达被蛋白质降低的基因,所述蛋白质诸如,例如SHH1样蛋白、SUVH2样蛋白、SUVH9样蛋白、DMS3样蛋白、MORC6样蛋白、SUVR2样蛋白、DRD1样蛋白、RDM1样蛋白、DRM3样蛋白、DRM2样蛋白和/或FRG样蛋白。
如本文所用的,术语“多核苷酸”、“核酸”、“核酸序列”、“核酸的序列”和其变化应该与以下术语是通用的:多脱氧核糖核苷酸(包括2-脱氧-D-核糖)、多核糖核苷酸(包括D-核糖)、任何其他类型的为嘌呤或嘧啶碱基的N-糖苷的多核苷酸,和其他包含非核苷酸骨架的聚合物,条件是所述聚合物包含呈允许见于DNA和RNA中的碱基配对和碱基堆叠(basestack)的构象的核碱基。因此,这些术语包括已知类型的核酸序列修饰,例如用类似物置换一种或更多种天然存在的核苷酸;核苷酸间的修饰,诸如,例如具有不带电荷的连接(例如甲基膦酸酯类、磷酸三酯类、氨基磷酸酯类、氨基甲酸酯类等)的那些,具有带负电荷的连接(例如硫代磷酸酯类、二硫代磷酸酯类等)的那些,和具有带正电荷的连接(例如氨基烷基氨基磷酸酯类、氨基烷基磷酸三酯类)的那些;包含附连部分(pendantmoieties)的那些,所述附连部分诸如,例如蛋白质(包括核酸酶、毒素、抗体、信号肽、聚L-赖氨酸等);具有嵌入剂(例如吖啶、补骨脂素等)的那些;和包含螯合剂(例如金属、放射性金属、硼、氧化性金属等)的那些。如本文所用的,用于核苷酸和多核苷酸的符号是IUPAC-IUB生物化学命名法委员会推荐的那些(Biochem.9,4022(1970)。
如本文所用的,“多肽”是包含多个连续聚合的氨基酸残基(例如,可选择地,至少约15个连续聚合的氨基酸残基,至少约30个连续聚合的氨基酸残基,或至少约50个连续聚合的氨基酸残基)的氨基酸序列。在许多情况下,多肽包含聚合的氨基酸残基序列,所述聚合的氨基酸残基序列为酶、甲基转移酶、脱甲基酶、脱乙酰酶、具有未知功能的预测蛋白、或者其结构域或部分或片段。多肽可选择地包含修饰的氨基酸残基、不是由密码子编码的天然存在的氨基酸残基和非天然存在的氨基酸残基。
如本文所用的,“蛋白质”是指天然存在的或合成的氨基酸序列、寡肽、肽、多肽或其部分。
可用于本公开内容的基因和蛋白质包括编码保守性修饰变体的基因,和为遍及本申请所记载的那些基因和蛋白质的保守性修饰变体的蛋白质。本文使用的“保守性修饰变体”包括导致氨基酸被化学性质类似的氨基酸置换的对多肽序列的单个置换、缺失或添加。提供功能上类似的氨基酸的保守性置换表是本领域熟知的。这类保守性修饰变体是对本公开内容的多态性变体、种间同源物和等位基因的补充,并且不将本公开内容的多态性变体、种间同源物和等位基因的补充排除在外。以下八组包含相互间为保守性置换的氨基酸:1)丙氨酸(A)、甘氨酸(G);2)天冬氨酸(D)、谷氨酸(E);3)天冬酰胺(N)、谷氨酰胺(Q);4)精氨酸(R)、赖氨酸(K);5)异亮氨酸(I)、亮氨酸(L)、甲硫氨酸(M)、缬氨酸(V);6)苯丙氨酸(F)、酪氨酸(Y)、色氨酸(W);7)丝氨酸(S)、苏氨酸(T);和8)半胱氨酸(C)、甲硫氨酸(M)(参见,例如Creighton,Proteins(1984))。
本文记载的基因和蛋白的同源物也可用于本公开内容中。如本文所用的,“同源性”是指参考序列与第二序列的至少一个片段之间的序列相似性。可以通过任何本领域已知的方法鉴定同源物,优选通过使用BLAST工具以将参考序列与单个第二序列或序列片段或序列数据库比对。如下文所述,BLAST基于同一性和相似性百分比比对序列。如本文所用的,“直系同源”是指不同物种中的衍生自一个共同祖先基因的基因。
在两个或更多核酸或多肽序列的上下文中,术语“相同的”或“同一性”百分比是指相同的两个或更多序列或子序列。当使用以下序列比较算法中的一个或通过人工比对和目视检查进行测量,比较并比对一个比较窗口或指定区域中的最大一致性时,如果两个序列具有指定百分比的相同的氨基酸残基或核苷酸(即在指定区域上或者当未指定时在整条序列上具有29%同一性,可选择地30%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、99%或100%同一性),那么两个序列“基本上相同”。可选择地,同一性存在于长度为至少约50个核苷酸(或10个氨基酸)的区域,或者更优选长度为100至500或1000或更多个核苷酸(或20、50、200或更多个氨基酸)的区域。
对于序列比较,通常一个序列充当参考序列,测试序列与所述参考序列比较。当使用序列比较算法时,将测试序列和参考序列输入计算机中,如果需要的话指定子序列坐标,并指定序列算法程序参数。可以使用默认程序参数,或者可以指定替代性参数。然后序列比较算法基于程序参数,计算测试序列相对于参考序列的序列同一性百分比。当比较两个序列的一致性时,不需要序列是连续的,但是任何空位会为其产生罚分,所述罚分会降低整体一致性百分比。对于blastn,默认参数是空位开口罚分=5,空位延伸罚分=2。对于blastp,默认参数是空位开口罚分=11,空位延伸罚分=1。
如本文所用的,“比较窗口”包括以下含义:具有任一数目的连续位置的区段,所述数量包括但不限于从20至600,通常约50至约200,更通常约100至约150,在所述区段中,序列可以与相同数目的连续位置的参考序列在将这两个序列最佳比对之后进行比较。用于比较的序列比对方法是本领域熟知的。用于比较的最佳序列比对可以例如通过Smith和Waterman(1981)的本地同源性算法、通过Needleman和Wunsch(1970)JMolBiol48(3):443-453的同源性比对算法、通过Pearson和Lipman(1988)ProcNatlAcadSciUSA85(8):2444-2448的寻找相似性方法,通过这些算法的计算机化工具(Wisconsin遗传软件包中的GAP、BESTFIT、FASTA和TFASTA,GeneticsComputerGroup,575ScienceDr.,Madison,WI),或者通过人工比对和目视检查[参见,例如,Brent等人,(2003)CurrentProtocolsinMolecularBiology,JohnWiley&Sons,Inc.(Ringbou编辑)]进行。
适用于确定序列同一性百分比和序列相似性的算法的两个实例是BLAST和BLAST2.0算法,这两个算法分别记载于Altschul等人(1997)NucleicAcidsRes25(17):3389-3402和Altschul等人(1990)J.MolBiol215(3)-403-410中。用于进行BLAST分析的软件是公众通过国家生物技术信息中心可得的。该算法包括首先通过识别查询序列中具有长度W的短字段而识别高得分序列对(HSP),所述短字段在当所述短字段与数据库序列中的具有相同长度的字段比对时,匹配或满足一些正值阈值得分(positive-valuedthresholdscore)T。T被称为邻字段得分阈值(neighborhoodwoodscorethreshold)(Altschul等人,如上所述)。这些最初邻字段命中(hit)作为用于起始找到包含它们的更长HSP的搜索的种子。只要累计比对得分可以增加,字段命中就沿着每个序列在两个方向延伸。对于核苷酸序列,使用参数M(对于一对匹配残基的奖励得分,一直>0)和N(对于错配残基的罚分,一直<0)计算累计得分。对于氨基酸序列,使用打分矩阵计算累计得分。当累计比对得分从其最大达到值下降了数量X时;由于一个或更多个负得分残基比对的积累而使累计致使得分为0或低于0时;或达到任一序列的末端时,字段命中在每个方向的延伸终止。BLAST算法参数W、T和X决定比对的灵敏度和速度。BLASTN程序(对于核苷酸序列)使用字段长度(W)=11,期望值(E)=10,M=5,N=5,和两条链的比较作为默认。对于氨基酸序列,BLASTP程序使用字段长度=3,和期望值(E)=10,和BLOSUM62打分矩阵(参见Henikoff和Henikoff,(1992)ProcNatlAcadSciUSA89(22):10915-10919)比对(B)=50,期望值(E)=10,M=5,N=-4,以及两条链的比较作为默认。
BLAST算法还进行两个序列间的相似性的统计学分析(参见,例如Karlin和Altschul,(1993)ProcNatlAcadSciUSA90(12):5873-5877)。一种由BLAST算法提供的相似性测量是最小总和可能性(P(N)),其提供两条核苷酸或氨基酸序列之间的匹配会随机出现的可能性的指示。例如,如果在测试核酸与参考核酸的比较中最小总和可能性小于约0.2,更优选小于约0.01,以及最优选小于约0.001,那么就认为核酸与参考序列相似。
除了上文所述的序列同一性百分比之外,两个核酸序列或多肽基本上相同的另外的指示是由第一核酸编码的多肽与针对由第二核酸编码的多肽所产生的抗体在免疫学上具有交叉反应性。因此,例如当两条肽的差异仅在于保守性置换时,一条多肽通常与第二多肽基本上相同。两条核酸序列基本上相同的另外的指示是两个分子或它们的互补序列在严格条件下相互杂交。两条核酸序列基本上相同的又一指示是可以使用相同引物扩增所述序列。
本公开内容的重组蛋白
本文提供了用于降低植物中靶核酸的表达的重组蛋白。在一些实施方案中,本公开内容的重组蛋白与RNA聚合酶相互作用。该相互作用可以是直接的,或者它可以是间接的。不论本公开内容的重组蛋白与RNA聚合酶的相互作用是直接的还是间接的,所述相互作用都促进RNA聚合酶募集到核酸。在一些实施方案中,一种或更多种另外的蛋白还可以参与促进本公开内容的重组蛋白与RNA聚合酶的相互作用以及RNA聚合酶募集到核酸。在一些实施方案中,SHH1样蛋白直接地或间接地与RNAPolIV相互作用,并且该相互作用促进RNAPolIV募集到核酸。在一些实施方案中,SUVH2样蛋白和/或SUVH9样蛋白直接地或间接地与RNAPolV相互作用,并且该相互作用促进RNAPolV募集到核酸。在一些实施方案中,DMS3样蛋白、MORC6样蛋白和/或SUVR2样蛋白直接地或间接地与RNAPolV相互作用,并且该相互作用促进RNAPolV募集到核酸。在一些实施方案中,DMS3样蛋白、MORC6样蛋白、SUVR2样蛋白、DRD1样蛋白、RDM1样蛋白、DRM3样蛋白、DRM2样蛋白和/或FRG样蛋白直接地或间接地与RNAPolV相互作用,并且该相互作用促进RNAPolV募集到核酸。在一些实施方案中,本公开内容的重组蛋白促进核酸的RNA指导的DNA甲基化。
在一些实施方案中,SHH1样蛋白、SUVH2样蛋白、SUVH9样蛋白、DMS3样蛋白、MORC6样蛋白、SUVR2样蛋白、DRD1样蛋白、RDM1样蛋白、DRM3样蛋白、DRM2样蛋白和/或FRG样蛋白被靶向到同一核酸,并且协同作用以沉默靶核酸的表达。本公开内容的重组蛋白例如SHH1样蛋白、SUVH2样蛋白、SUVH9样蛋白、DMS3样蛋白、MORC6样蛋白、SUVR2样蛋白、DRD1样蛋白、RDM1样蛋白、DRM3样蛋白、DRM2样蛋白和/或FRG样蛋白可以单独或组合地在细胞中重组表达。
SHH1蛋白
本公开内容的某些方面涉及SHH1样蛋白。在一些实施方案中,SHH1样蛋白是指重组SHH1蛋白或其片段,以及包含异源DNA结合结构域的重组SHH1蛋白或其片段。SHH1样蛋白可以用于降低植物中一种或更多种靶核酸例如基因的表达。
本公开内容的SHH1蛋白是SAWADEE同源异型域同源物1(SAWADEEHOMEODOMAINHOMOLOG1)(SHH1)蛋白。全长SHH1蛋白包含染色质结合SAWADEE结构域。SAWADEE染色质结合结构域采取独特的串联Tudor样折叠,并且起探查组氨酸3(H3)尾上的未甲基化的K4和甲基化的K9修饰的双赖氨酸读码器的作用。SHH1蛋白还包含同源异型域。在一些实施方案中,本公开内容的SHH1样蛋白是染色质结合蛋白。
在一些实施方案中,本公开内容的SHH1样蛋白包括全长SHH1蛋白的功能片段,其中所述片段保持将RNAPolIV募集到DNA的能力。在一些实施方案中,SHH1蛋白片段包含全长SHH1蛋白的至少20个连续氨基酸、至少30个连续氨基酸、至少40个连续氨基酸、至少50个连续氨基酸、至少60个连续氨基酸、至少70个连续氨基酸、至少80个连续氨基酸、至少90个连续氨基酸、至少100个连续氨基酸、至少120个连续氨基酸、至少140个连续氨基酸、至少160个连续氨基酸、至少180个连续氨基酸、至少200个连续氨基酸、至少220个连续氨基酸、至少240个连续氨基酸、或241或更多个连续氨基酸。在一些实施方案中,SHH1蛋白片段可以包括从全长SHH1蛋白的连续氨基酸序列中除去了一个或更多个氨基酸的序列。在一些实施方案中,SHH1蛋白片段可以包括在全长SHH1蛋白的连续氨基酸序列中一个或更多个氨基酸被用与存在于给定氨基酸位点的内源性氨基酸不同的氨基酸替换/置换的序列。在一些实施方案中,SHH1蛋白片段可以包括一个或更多个氨基酸被添加到全长SHH1蛋白的另外的连续氨基酸序列中的序列。
可以从单子叶植物和双子叶植物中鉴定和分离合适的SHH1蛋白。这类植物的实例包括,例如,拟南芥属种(Arabidopsisspp.)、蓖麻(Ricinuscommunis)、大豆(Glycinemax)、玉蜀黍(ZeaMays)、蒺藜苜蓿(Medicagotruncatula)、小立碗藓(Physcomitrellapatens)、双色蜀黍(Sorghumbicolor)和稻(Oryzasativa)。合适的SHH1蛋白的实例可包括,例如,表1中列出的那些、其同源物和其直系同源物。
表1:SHH1蛋白
在一些实施方案中,本公开内容的SHH1蛋白或其片段具有与拟南芥(A.thaliana)SHH1蛋白的氨基酸序列(即,SEQIDNO:1)具有至少约20%、至少约25%、至少约30%、至少约40%、至少约50%、至少约55%、至少约60%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%、或至少约100%氨基酸同一性的氨基酸序列。
在一些实施方案中,SHH1蛋白的同源物或SHH1蛋白的片段的同源物是拟南芥SHH2蛋白的氨基酸序列(SEQIDNO:40)。
SHH1样蛋白可以包括任何SHH1同源物或直系同源物,例如表1中列出的那些的任意一个,的氨基酸序列或其片段。技术人员会容易地认识到另外的SHH1同源物和/或直系同源物可以存在,并且可用于本文。
SUVH2蛋白和SUVH9蛋白
本公开内容的某些方面涉及SUVH2样蛋白和SHVU9样蛋白。在一些实施方案中,SUVH2样蛋白是指重组SUVH2蛋白或其片段,以及包含异源DNA结合结构域的重组SUVH2蛋白或其片段。在一些实施方案中,SUVH9样蛋白是指重组SUVH9蛋白或其片段,以及包含异源DNA结合结构域的重组SUVH9蛋白或其片段。SUVH2样蛋白和/或SUVH9样蛋白可以用于降低植物中一种或更多种靶核酸例如基因的表达。
本公开内容的SUVH2和SUVH9蛋白是SU-VAR(3-9)同源物。全长SUVH2和SUVH9蛋白包含一个朝向N末端的双螺旋束结构域、一个SRA结构域以及朝向C末端的pre-SET和SET结构域。SUVH结构域的结构和序列特征是本领域已知的,并且在本文中提供。在一些实施方案中,本公开内容的SUVH2样蛋白和/或SUVH9样蛋白可以包含标准的SUVH结构域的一个或更多个,所述SUVH结构域包括一个双螺旋束结构域、一个SRA结构域、一个pre-SET结构域和/或一个SET结构域。
在一些实施方案中,本公开内容的SUVH2样蛋白包括全长SUVH2蛋白的功能片段,其中所述片段保持将RNAPolV募集到DNA的能力。在一些实施方案中,SUVH2蛋白片段包含全长SUVH2蛋白的至少20个连续氨基酸、至少30个连续氨基酸、至少40个连续氨基酸、至少50个连续氨基酸、至少60个连续氨基酸、至少70个连续氨基酸、至少80个连续氨基酸、至少90个连续氨基酸、至少100个连续氨基酸、至少120个连续氨基酸、至少140个连续氨基酸、至少160个连续氨基酸、至少180个连续氨基酸、至少200个连续氨基酸、至少220个连续氨基酸、至少240个连续氨基酸、至少260个连续氨基酸、至少280个连续氨基酸、至少300个连续氨基酸、至少325个连续氨基酸、至少350个连续氨基酸、至少375个连续氨基酸、至少400个连续氨基酸、至少425个连续氨基酸、至少450个连续氨基酸、至少475个连续氨基酸、至少500个连续氨基酸、至少525个连续氨基酸、至少550个连续氨基酸、至少575个连续氨基酸、至少600个连续氨基酸、至少625个连续氨基酸、或626或更多个连续氨基酸。在一些实施方案中,SUVH2蛋白片段可以包括从全长SUVH2蛋白的连续氨基酸序列中除去了一个或更多个氨基酸的序列。在一些实施方案中,SUVH2蛋白片段可以包括在全长SUVH2蛋白的连续氨基酸序列中一个或更多个氨基酸被用与存在于给定氨基酸位点的内源性氨基酸不同的氨基酸替换/置换的序列。在一些实施方案中,SUVH2蛋白片段可以包括一个或更多个氨基酸被添加到全长SUVH2蛋白的另外的连续氨基酸序列中的序列。
可以从单子叶植物和双子叶植物中鉴定和分离合适的SUVH2蛋白。这类植物的实例包括,例如,拟南芥属种、蓖麻、大豆、玉蜀黍、蒺藜苜蓿、小立碗藓、双色蜀黍和稻。合适的SUVH2蛋白的实例可包括,例如,表2中列出的那些、其同源物和其直系同源物。
表2:SUVH2蛋白
生物体 | 基因名 | SEQ ID NO. |
拟南芥 | NP_180887.1 | 14 |
蓖麻 | XP_002528332.1 | 15 |
大豆 | XP_003530311.1 | 16 |
玉蜀黍 | DAA60407.1 | 17 |
蒺藜苜蓿 | XP_003619209.1 | 18 |
小立碗藓 | XP_001753516.1 | 19 |
双色蜀黍 | XP_002459773.1 | 20 |
稻 | EAZ03669.1 | 21 |
二穗短柄草 | XP_003563196.1 | 22 |
毛果杨 | XP_002315593.1 | 23 |
葡萄 | XP_002282386.1 | 24 |
黄瓜 | XP_004134031.1 | 25 |
琴叶拟南芥 | XP_002879445.1 | 26 |
在一些实施方案中,本公开内容的SUVH2蛋白或其片段具有与拟南芥SUVH2蛋白的氨基酸序列(即,SEQIDNO:14)具有至少约20%、至少约25%、至少约30%、至少约40%、至少约50%、至少约55%、至少约60%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%、或至少约100%氨基酸同一性的氨基酸序列。
SUVH2样蛋白可以包括任何SUVH2同源物或直系同源物,例如表2中列出的那些的任意一个,的氨基酸序列或其片段。技术人员会容易地认识到另外的SUVH2同源物和/或直系同源物可以存在,并且可用于本文。
在一些实施方案中,本公开内容的SUVH9样蛋白包括全长SUVH9蛋白的功能片段,其中所述片段保持将RNAPolV募集到DNA的能力。在一些实施方案中,SUVH9蛋白片段包含全长SUVH9蛋白的至少20个连续氨基酸、至少30个连续氨基酸、至少40个连续氨基酸、至少50个连续氨基酸、至少60个连续氨基酸、至少70个连续氨基酸、至少80个连续氨基酸、至少90个连续氨基酸、至少100个连续氨基酸、至少120个连续氨基酸、至少140个连续氨基酸、至少160个连续氨基酸、至少180个连续氨基酸、至少200个连续氨基酸、至少220个连续氨基酸、至少240个连续氨基酸、至少260个连续氨基酸、至少280个连续氨基酸、至少300个连续氨基酸、至少325个连续氨基酸、至少350个连续氨基酸、至少375个连续氨基酸、至少400个连续氨基酸、至少425个连续氨基酸、至少450个连续氨基酸、至少475个连续氨基酸、至少500个连续氨基酸、至少525个连续氨基酸、至少550个连续氨基酸、至少575个连续氨基酸、至少600个连续氨基酸、至少625个连续氨基酸、或626或更多个连续氨基酸。在一些实施方案中,SUVH9蛋白片段可以包括从全长SUVH9蛋白的连续氨基酸序列中除去了一个或更多个氨基酸的序列。在一些实施方案中,SUVH9蛋白片段可以包括在全长SUVH9蛋白的连续氨基酸序列中一个或更多个氨基酸被用与存在于给定氨基酸位点的内源性氨基酸不同的氨基酸替换/置换的序列。在一些实施方案中,SUVH9蛋白片段可以包括一个或更多个氨基酸被添加到全长SUVH9蛋白的另外的连续氨基酸序列中的序列。
可以从单子叶植物和双子叶植物中鉴定和分离合适的SUVH9蛋白。这类植物的实例包括,例如,拟南芥属种、蓖麻、大豆、玉蜀黍、蒺藜苜蓿、小立碗藓、双色蜀黍和稻。合适的SUVH9蛋白的实例可包括,例如,表3中列出的那些、其同源物和其直系同源物。
表3:SUVH9蛋白
生物体 | 基因名 | SEQ ID NO: |
拟南芥 | AF344452.1 | 27 |
蓖麻 | XP_002528332.1 | 28 |
大豆 | XP_003530311.1 | 29 |
玉蜀黍 | DAA60407.1 | 30 |
蒺藜苜蓿 | XP_003619209.1 | 31 |
小立碗藓 | XP_001753516.1 | 32 |
双色蜀黍 | XP_002459773.1 | 33 |
稻 | EAZ03669.1 | 34 |
二穗短柄草 | XP_003563196.1 | 35 |
毛果杨 | XP_002315593.1 | 36 |
葡萄 | XP_002282386.1 | 37 |
黄瓜 | XP_004134031.1 | 38 |
琴叶拟南芥 | XP_002863127.1 | 39 |
在一些实施方案中,本公开内容的SUVH9蛋白或其片段具有与拟南芥SUVH9蛋白的氨基酸序列(即,SEQIDNO:27)具有至少约20%、至少约25%、至少约30%、至少约40%、至少约50%、至少约55%、至少约60%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%、或至少约100%氨基酸同一性的氨基酸序列。
SUVH9样蛋白可以包括任何SUVH9同源物或直系同源物,例如表3中列出的那些的任意一个,的氨基酸序列或其片段。技术人员会容易地认识到另外的SUVH9同源物和/或直系同源物可以存在,并且可用于本文。
DMS3蛋白
本公开内容的某些方面涉及DMS3样蛋白。在一些实施方案中,DMS3样蛋白是指重组DMS3蛋白或其片段,以及包含异源DNA结合结构域的重组DMS3蛋白或其片段。DMS3样蛋白可以用于降低植物中一种或更多种靶核酸例如基因的表达。
DMS3蛋白是本领域已知的,并记载于本文中。在一些实施方案中,本公开内容的DMS3样蛋白包括全长DMS3蛋白的功能片段,其中所述片段保持所述全长蛋白的一种或更多种功能。在一些实施方案中,DMS3蛋白片段包含全长DMS3蛋白的至少20个连续氨基酸、至少30个连续氨基酸、至少40个连续氨基酸、至少50个连续氨基酸、至少60个连续氨基酸、至少70个连续氨基酸、至少80个连续氨基酸、至少90个连续氨基酸、至少100个连续氨基酸、至少120个连续氨基酸、至少140个连续氨基酸、至少160个连续氨基酸、至少180个连续氨基酸、至少200个连续氨基酸、至少220个连续氨基酸、至少240个连续氨基酸、或241或更多个连续氨基酸。在一些实施方案中,DMS3蛋白片段可以包括从全长DMS3蛋白的连续氨基酸序列中除去了一个或更多个氨基酸的序列。在一些实施方案中,DMS3蛋白片段可以包括在全长DMS3蛋白的连续氨基酸序列中一个或更多个氨基酸被用与存在于给定氨基酸位点的内源性氨基酸不同的氨基酸替换/置换的序列。在一些实施方案中,DMS3蛋白片段可以包括一个或更多个氨基酸被添加到全长DMS3蛋白的另外的连续氨基酸序列中的序列。
可以从单子叶植物和双子叶植物中鉴定和分离合适的DMS3蛋白。这类植物的实例包括,例如,拟南芥属种、蓖麻、大豆、玉蜀黍、蒺藜苜蓿、小立碗藓、双色蜀黍和稻。合适的DMS3蛋白的实例可包括,例如,表4中列出的那些、其同源物和其直系同源物。
表4:DMS3蛋白
在一些实施方案中,本公开内容的DMS3蛋白或其片段具有与拟南芥DMS3蛋白的氨基酸序列(即,SEQIDNO:41)具有至少约20%、至少约25%、至少约30%、至少约40%、至少约50%、至少约55%、至少约60%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%、或至少约100%氨基酸同一性的氨基酸序列。
在一些实施方案中,DMS3蛋白的同源物,或DMS3蛋白的片段的同源物也可用于本公开内容的方法中。
DMS3样蛋白可以包括任何DMS3同源物或直系同源物,诸如例如表4中列出的那些的任意一个,的氨基酸序列或其片段。技术人员会容易地认识到另外的DMS3同源物和/或直系同源物可以存在,并且可用于本文。
MORC6蛋白
本公开内容的某些方面涉及MORC6样蛋白。在一些实施方案中,MORC6样蛋白是指重组MORC6蛋白或其片段,以及包含异源DNA结合结构域的重组MORC6蛋白或其片段。MORC6样蛋白可以用于降低植物中一种或更多种靶核酸例如基因的表达。
MORC6蛋白是本领域已知的,并记载于本文中。在一些实施方案中,本公开内容的MORC6样蛋白包括全长MORC6蛋白的功能片段,其中所述片段保持所述全长蛋白的一种或更多种功能。在一些实施方案中,MORC6蛋白片段包含全长MORC6蛋白的至少20个连续氨基酸、至少30个连续氨基酸、至少40个连续氨基酸、至少50个连续氨基酸、至少60个连续氨基酸、至少70个连续氨基酸、至少80个连续氨基酸、至少90个连续氨基酸、至少100个连续氨基酸、至少120个连续氨基酸、至少140个连续氨基酸、至少160个连续氨基酸、至少180个连续氨基酸、至少200个连续氨基酸、至少220个连续氨基酸、至少240个连续氨基酸、或241或更多个连续氨基酸。在一些实施方案中,MORC6蛋白片段可以包括从全长MORC6蛋白的连续氨基酸序列中除去了一个或更多个氨基酸的序列。在一些实施方案中,MORC6蛋白片段可以包括在全长MORC6蛋白的连续氨基酸序列中一个或更多个氨基酸被用与存在于给定氨基酸位点的内源性氨基酸不同的氨基酸替换/置换的序列。在一些实施方案中,MORC6蛋白片段可以包括一个或更多个氨基酸被添加到全长MORC6蛋白的另外的连续氨基酸序列中的序列。
可以从单子叶植物和双子叶植物中鉴定和分离合适的MORC6蛋白。这类植物的实例包括,例如,拟南芥属种、蓖麻、大豆、玉蜀黍、蒺藜苜蓿、小立碗藓、双色蜀黍和稻。合适的MORC6蛋白的实例可包括,例如,表5中列出的那些、其同源物和其直系同源物。
表5:MORC6蛋白
在一些实施方案中,本公开内容的MORC6蛋白或其片段具有与拟南芥MORC6蛋白的氨基酸序列(即,SEQIDNO:53)具有至少约20%、至少约25%、至少约30%、至少约40%、至少约50%、至少约55%、至少约60%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%、或至少约100%氨基酸同一性的氨基酸序列。
在一些实施方案中,MORC6蛋白的同源物,或MORC6蛋白的片段的同源物也可用于本公开内容的方法中。
MORC6样蛋白可以包括任何MORC6同源物或直系同源物,诸如例如表5中列出的那些的任意一个,的氨基酸序列或其片段。技术人员会容易地认识到另外的MORC6同源物和/或直系同源物可以存在,并且可用于本文。
SUVR2蛋白
本公开内容的某些方面涉及SUVR2样蛋白。在一些实施方案中,SUVR2样蛋白是指重组SUVR2蛋白或其片段,以及包含异源DNA结合结构域的重组SUVR2蛋白或其片段。SUVR2样蛋白可以用于降低植物中一种或更多种靶核酸例如基因的表达。
SUVR2蛋白是本领域已知的,并记载于本文中。在一些实施方案中,本公开内容的SUVR2样蛋白包括全长SUVR2蛋白的功能片段,其中所述片段保持所述全长蛋白的一种或更多种功能。在一些实施方案中,SUVR2蛋白片段包含全长SUVR2蛋白的至少20个连续氨基酸、至少30个连续氨基酸、至少40个连续氨基酸、至少50个连续氨基酸、至少60个连续氨基酸、至少70个连续氨基酸、至少80个连续氨基酸、至少90个连续氨基酸、至少100个连续氨基酸、至少120个连续氨基酸、至少140个连续氨基酸、至少160个连续氨基酸、至少180个连续氨基酸、至少200个连续氨基酸、至少220个连续氨基酸、至少240个连续氨基酸、或241或更多个连续氨基酸。在一些实施方案中,SUVR2蛋白片段可以包括从全长SUVR2蛋白的连续氨基酸序列中除去了一个或更多个氨基酸的序列。在一些实施方案中,SUVR2蛋白片段可以包括在全长SUVR2蛋白的连续氨基酸序列中一个或更多个氨基酸被用与存在于给定氨基酸位点的内源性氨基酸不同的氨基酸替换/置换的序列。在一些实施方案中,SUVR2蛋白片段可以包括一个或更多个氨基酸被添加到全长SUVR2蛋白的另外的连续氨基酸序列中的序列。
可以从单子叶植物和双子叶植物中鉴定和分离合适的SUVR2蛋白。这类植物的实例包括,例如,拟南芥属种、蓖麻、大豆、玉蜀黍、蒺藜苜蓿、小立碗藓、双色蜀黍和稻。合适的SUVR2蛋白的实例可包括,例如,表6中列出的那些、其同源物和其直系同源物。
表6:SUVR2蛋白
生物体 | 基因名 | SEQ ID NO: |
拟南芥 | SUVR2 | 66 |
番茄 | XP_004247936.1 | 67 |
马铃薯 | XP_006358446.1 | 68 |
菜豆 | ESW16847.1 | 69 |
葡萄 | XP_002270320.2 | 70 |
可可 | EOX94338.1 | 71 |
乌拉尔图小麦 | EMS67506.1 | 72 |
大豆 | XP_003541369.1 | 73 |
水稻粳型 | NP_001047458.1 | 74 |
水稻籼型 | EEC78330.1 | 75 |
玉蜀黍 | DAA48520.1 | 76 |
双色蜀黍 | XP_002445655.1 | 77 |
在一些实施方案中,本公开内容的SUVR2蛋白或其片段具有与拟南芥SUVR2蛋白的氨基酸序列(即,SEQIDNO:66)具有至少约20%、至少约25%、至少约30%、至少约40%、至少约50%、至少约55%、至少约60%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%、或至少约100%氨基酸同一性的氨基酸序列。
在一些实施方案中,SUVR2蛋白的同源物,或SUVR2蛋白的片段的同源物也可用于本公开内容的方法中。
SUVR2样蛋白可以包括任何SUVR2同源物或直系同源物,诸如例如表6中列出的那些的任意一个,的氨基酸序列或其片段。技术人员会容易地认识到另外的SUVR2同源物和/或直系同源物可以存在,并且可用于本文。
DRD1蛋白
本公开内容的某些方面涉及DRD1样蛋白。在一些实施方案中,DRD1样蛋白是指重组DRD1蛋白或其片段,以及包含异源DNA结合结构域的重组DRD1蛋白或其片段。DRD1样蛋白可以用于降低植物中一种或更多种靶核酸例如基因的表达。
DRD1蛋白是本领域已知的,并记载于本文中。在一些实施方案中,本公开内容的DRD1样蛋白包括全长DRD1蛋白的功能片段,其中所述片段保持所述全长蛋白的一种或更多种功能。在一些实施方案中,DRD1蛋白片段包含全长DRD1蛋白的至少20个连续氨基酸、至少30个连续氨基酸、至少40个连续氨基酸、至少50个连续氨基酸、至少60个连续氨基酸、至少70个连续氨基酸、至少80个连续氨基酸、至少90个连续氨基酸、至少100个连续氨基酸、至少120个连续氨基酸、至少140个连续氨基酸、至少160个连续氨基酸、至少180个连续氨基酸、至少200个连续氨基酸、至少220个连续氨基酸、至少240个连续氨基酸、或241或更多个连续氨基酸。在一些实施方案中,DRD1蛋白片段可以包括从全长DRD1蛋白的连续氨基酸序列中除去了一个或更多个氨基酸的序列。在一些实施方案中,DRD1蛋白片段可以包括在全长DRD1蛋白的连续氨基酸序列中一个或更多个氨基酸被用与存在于给定氨基酸位点的内源性氨基酸不同的氨基酸替换/置换的序列。在一些实施方案中,DRD1蛋白片段可以包括一个或更多个氨基酸被添加到全长DRD1蛋白的另外的连续氨基酸序列中的序列。
可以从单子叶植物和双子叶植物中鉴定和分离合适的DRD1蛋白。这类植物的实例包括,例如,拟南芥属种、蓖麻、大豆、玉蜀黍、小立碗藓、双色蜀黍和稻。合适的DRD1蛋白的实例可包括,例如,表7中列出的那些、其同源物和其直系同源物。
表7:DRD1蛋白
生物体 | 基因名 | SEQ ID NO: |
拟南芥 | NP_179232.1 | 79 |
蓖麻 | XP_002530324.1 | 80 |
大豆 | XP_003540522.1 | 81 |
玉蜀黍 | AFW57413.1 | 82 |
小立碗藓 | XP_001752976.1 | 83 |
双色蜀黍 | XP_002445019.1 | 84 |
稻 | BAC84084.1 | 85 |
二穗短柄草 | XP_003571619.1 | 86 |
毛果杨 | XP_002313774.2 | 87 |
葡萄 | XP_002273814.1 | 88 |
黄瓜 | XP_004170971.1 | 89 |
琴叶拟南芥 | XP_002884170.1 | 90 |
在一些实施方案中,本公开内容的DRD1蛋白或其片段具有与拟南芥DRD1蛋白的氨基酸序列(即,SEQIDNO:79)具有至少约20%、至少约25%、至少约30%、至少约40%、至少约50%、至少约55%、至少约60%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%、或至少约100%氨基酸同一性的氨基酸序列。
在一些实施方案中,DRD1蛋白的同源物,或DRD1蛋白的片段的同源物也可用于本公开内容的方法中。
DRD1样蛋白可以包括任何DRD1同源物或直系同源物,诸如例如表7中列出的那些的任意一个,的氨基酸序列或其片段。技术人员会容易地认识到另外的DRD1同源物和/或直系同源物可以存在,并且可用于本文。
RDM1蛋白
本公开内容的某些方面涉及RDM1样蛋白。在一些实施方案中,RDM1样蛋白是指重组RDM1蛋白或其片段,以及包含异源DNA结合结构域的重组RDM1蛋白或其片段。RDM1样蛋白可以用于降低植物中一种或更多种靶核酸例如基因的表达。
RDM1蛋白是本领域已知的,并记载于本文中。在一些实施方案中,本公开内容的RDM1样蛋白包括全长RDM1蛋白的功能片段,其中所述片段保持所述全长蛋白的一种或更多种功能。在一些实施方案中,RDM1蛋白片段包含全长RDM1蛋白的至少20个连续氨基酸、至少30个连续氨基酸、至少40个连续氨基酸、至少50个连续氨基酸、至少60个连续氨基酸、至少70个连续氨基酸、至少80个连续氨基酸、至少90个连续氨基酸、至少100个连续氨基酸、至少120个连续氨基酸、至少140个连续氨基酸、至少160个连续氨基酸、至少180个连续氨基酸、至少200个连续氨基酸、至少220个连续氨基酸、至少240个连续氨基酸、或241或更多个连续氨基酸。在一些实施方案中,RDM1蛋白片段可以包括从全长RDM1蛋白的连续氨基酸序列中除去了一个或更多个氨基酸的序列。在一些实施方案中,RDM1蛋白片段可以包括在全长RDM1蛋白的连续氨基酸序列中一个或更多个氨基酸被用与存在于给定氨基酸位点的内源性氨基酸不同的氨基酸替换/置换的序列。在一些实施方案中,RDM1蛋白片段可以包括一个或更多个氨基酸被添加到全长RDM1蛋白的另外的连续氨基酸序列中的序列。
可以从单子叶植物和双子叶植物中鉴定和分离合适的RDM1蛋白。这类植物的实例包括,例如,拟南芥属种、蓖麻、大豆、玉蜀黍和稻。合适的RDM1蛋白的实例可包括,例如,表8中列出的那些、其同源物和其直系同源物。
表8:RDM1蛋白
生物体 | 基因名 | SEQ ID NO: |
拟南芥 | NP_188907.2 | 91 |
蓖麻 | XP_002517093.1 | 92 |
大豆 | NP_001237231.1 | 93 |
生物体 | 基因名 | SEQ ID NO: |
玉蜀黍 | NP_001170520.1 | 94 |
蒺藜苜蓿 | XP_003610752.1 | 95 |
稻 | BAD38576.1 | 96 |
毛果杨 | XP_002311634.1 | 97 |
葡萄 | XP_002279112.2 | 98 |
黄瓜 | XP_004134127.1 | 99 |
琴叶拟南芥 | XP_002883375.1 | 100 |
在一些实施方案中,本公开内容的RDM1蛋白或其片段具有与拟南芥RDM1蛋白的氨基酸序列(即,SEQIDNO:91)具有至少约20%、至少约25%、至少约30%、至少约40%、至少约50%、至少约55%、至少约60%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%、或至少约100%氨基酸同一性的氨基酸序列。
在一些实施方案中,RDM1蛋白的同源物,或RDM1蛋白的片段的同源物也可用于本公开内容的方法中。
RDM1样蛋白可以包括任何RDM1同源物或直系同源物,诸如例如表8中列出的那些的任意一个,的氨基酸序列或其片段。技术人员会容易地认识到另外的RDM1同源物和/或直系同源物可以存在,并且可用于本文。
DRM3蛋白
本公开内容的某些方面涉及DRM3样蛋白。在一些实施方案中,DRM3样蛋白是指重组DRM3蛋白或其片段,以及包含异源DNA结合结构域的重组DRM3蛋白或其片段。DRM3样蛋白可以用于降低植物中一种或更多种靶核酸例如基因的表达。
DRM3蛋白是本领域已知的,并记载于本文中。在一些实施方案中,本公开内容的DRM3样蛋白包括全长DRM3蛋白的功能片段,其中所述片段保持所述全长蛋白的一种或更多种功能。在一些实施方案中,DRM3蛋白片段包含全长DRM3蛋白的至少20个连续氨基酸、至少30个连续氨基酸、至少40个连续氨基酸、至少50个连续氨基酸、至少60个连续氨基酸、至少70个连续氨基酸、至少80个连续氨基酸、至少90个连续氨基酸、至少100个连续氨基酸、至少120个连续氨基酸、至少140个连续氨基酸、至少160个连续氨基酸、至少180个连续氨基酸、至少200个连续氨基酸、至少220个连续氨基酸、至少240个连续氨基酸、或241或更多个连续氨基酸。在一些实施方案中,DRM3蛋白片段可以包括从全长DRM3蛋白的连续氨基酸序列中除去了一个或更多个氨基酸的序列。在一些实施方案中,DRM3蛋白片段可以包括在全长DRM3蛋白的连续氨基酸序列中一个或更多个氨基酸被用与存在于给定氨基酸位点的内源性氨基酸不同的氨基酸替换/置换的序列。在一些实施方案中,DRM3蛋白片段可以包括一个或更多个氨基酸被添加到全长DRM3蛋白的另外的连续氨基酸序列中的序列。
可以从单子叶植物和双子叶植物中鉴定和分离合适的DRM3蛋白。这类植物的实例包括,例如,拟南芥属种、蓖麻、大豆、玉蜀黍、小立碗藓、双色蜀黍和稻。合适的DRM3蛋白的实例可包括,例如,表9中列出的那些、其同源物和其直系同源物。
表9:DRM3蛋白
生物 | 基因名 | SEQ ID NO: |
拟南芥 | NP_566573.1 | 101 |
蓖麻 | XP_002519294.1 | 102 |
大豆 | XP_006583974.1 | 103 |
玉蜀黍 | NP_001105094.1 | 104 |
蒺藜苜蓿 | XP_003609841.1 | 105 |
双色蜀黍 | XP_002468285.1 | 106 |
稻 | AAT85176.1 | 107 |
二穗短柄草 | XP_003569077.1 | 108 |
毛果杨 | XP_002316067.2 | 109 |
葡萄 | XP_002264226.1 | 110 |
黄瓜 | XP_004138523.1 | 111 |
琴叶拟南芥 | XP_002885200.1 | 112 |
在一些实施方案中,本公开内容的DRM3蛋白或其片段具有与拟南芥DRM3蛋白的氨基酸序列(即,SEQIDNO:101)具有至少约20%、至少约25%、至少约30%、至少约40%、至少约50%、至少约55%、至少约60%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%、或至少约100%氨基酸同一性的氨基酸序列。
在一些实施方案中,DRM3蛋白的同源物,或DRM3蛋白的片段的同源物也可用于本公开内容的方法中。
DRM3样蛋白可以包括任何DRM3同源物或直系同源物,诸如例如表9中列出的那些的任意一个,的氨基酸序列或其片段。技术人员会容易地认识到另外的DRM3同源物和/或直系同源物可以存在,并且可用于本文。
DRM2蛋白
本公开内容的某些方面涉及DRM2样蛋白。在一些实施方案中,DRM2样蛋白是指重组DRM2蛋白或其片段,以及包含异源DNA结合结构域的重组DRM2蛋白或其片段。DRM2样蛋白可以用于降低植物中一种或更多种靶核酸例如基因的表达。
DRM2蛋白是本领域已知的,并记载于本文中。在一些实施方案中,本公开内容的DRM2样蛋白包括全长DRM2蛋白的功能片段,其中所述片段保持所述全长蛋白的一种或更多种功能。在一些实施方案中,DRM2蛋白片段包含全长DRM2蛋白的至少20个连续氨基酸、至少30个连续氨基酸、至少40个连续氨基酸、至少50个连续氨基酸、至少60个连续氨基酸、至少70个连续氨基酸、至少80个连续氨基酸、至少90个连续氨基酸、至少100个连续氨基酸、至少120个连续氨基酸、至少140个连续氨基酸、至少160个连续氨基酸、至少180个连续氨基酸、至少200个连续氨基酸、至少220个连续氨基酸、至少240个连续氨基酸、或241或更多个连续氨基酸。在一些实施方案中,DRM2蛋白片段可以包括从全长DRM2蛋白的连续氨基酸序列中除去了一个或更多个氨基酸的序列。在一些实施方案中,DRM2蛋白片段可以包括在全长DRM2蛋白的连续氨基酸序列中一个或更多个氨基酸被用与存在于给定氨基酸位点的内源性氨基酸不同的氨基酸替换/置换的序列。在一些实施方案中,DRM2蛋白片段可以包括一个或更多个氨基酸被添加到全长DRM2蛋白的另外的连续氨基酸序列中的序列。
可以从单子叶植物和双子叶植物中鉴定和分离合适的DRM2蛋白。这类植物的实例包括,例如,拟南芥属种、蓖麻、大豆、玉蜀黍、小立碗藓、双色蜀黍和稻。合适的DRM2蛋白的实例可包括,例如,表10中列出的那些、其同源物和其直系同源物。
表10:DRM2蛋白
生物 | 基因名 | SEQ ID NO: |
拟南芥 | NP_196966.2 | 113 |
蓖麻 | XP_002521449.1 | 114 |
大豆 | XP_003524549.1 | 115 |
玉蜀黍 | NP_001104977.1 | 116 |
蒺藜苜蓿 | XP_003618189.1 | 117 |
双色蜀黍 | XP_002468660.1 | 118 |
稻 | ABF93591.1 | 119 |
二穗短柄草 | XP_003575456.1 | 120 |
毛果杨 | XP_002300046.2 | 121 |
葡萄 | XP_002273972.2 | 122 |
黄瓜 | XP_004141100.1 | 123 |
琴叶拟南芥 | XP_002873681.1 | 124 |
在一些实施方案中,本公开内容的DRM2蛋白或其片段具有与拟南芥DRM2蛋白的氨基酸序列(即,SEQIDNO:113)具有至少约20%、至少约25%、至少约30%、至少约40%、至少约50%、至少约55%、至少约60%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%、或至少约100%氨基酸同一性的氨基酸序列。
在一些实施方案中,DRM2蛋白的同源物,或DRM2蛋白的片段的同源物也可用于本公开内容的方法中。
DRM2样蛋白可以包括任何DRM2同源物或直系同源物,诸如例如表10中列出的那些的任意一个,的氨基酸序列或其片段。技术人员会容易地认识到另外的DRM2同源物和/或直系同源物可以存在,并且可用于本文。
FRG蛋白
本公开内容的某些方面涉及FRG样蛋白。在一些实施方案中,FRG样蛋白是指重组FRG蛋白或其片段,以及包含异源DNA结合结构域的重组FRG蛋白或其片段。FRG样蛋白可以用于降低植物中一种或更多种靶核酸例如基因的表达。
FRG蛋白是本领域已知的,并记载于本文中。在一些实施方案中,本公开内容的FRG样蛋白包括全长FRG蛋白的功能片段,其中所述片段保持所述全长蛋白的一种或更多种功能。在一些实施方案中,FRG蛋白片段包含全长FRG蛋白的至少20个连续氨基酸、至少30个连续氨基酸、至少40个连续氨基酸、至少50个连续氨基酸、至少60个连续氨基酸、至少70个连续氨基酸、至少80个连续氨基酸、至少90个连续氨基酸、至少100个连续氨基酸、至少120个连续氨基酸、至少140个连续氨基酸、至少160个连续氨基酸、至少180个连续氨基酸、至少200个连续氨基酸、至少220个连续氨基酸、至少240个连续氨基酸、或241或更多个连续氨基酸。在一些实施方案中,FRG蛋白片段可以包括从全长FRG蛋白的连续氨基酸序列中除去了一个或更多个氨基酸的序列。在一些实施方案中,FRG蛋白片段可以包括在全长FRG蛋白的连续氨基酸序列中一个或更多个氨基酸被用与存在于给定氨基酸位点的内源性氨基酸不同的氨基酸替换/置换的序列。在一些实施方案中,FRG蛋白片段可以包括一个或更多个氨基酸被添加到全长FRG蛋白的另外的连续氨基酸序列中的序列。
可以从单子叶植物和双子叶植物中鉴定和分离合适的FRG蛋白。这类植物的实例包括,例如,拟南芥属种、蓖麻、大豆、玉蜀黍、小立碗藓、双色蜀黍和稻。合适的FRG蛋白的实例可包括,例如,表11中列出的那些、其同源物和其直系同源物。
表11:FRG蛋白
生物 | 基因名 | SEQ ID NO: |
拟南芥 | NP_188635.1 | 125 |
蓖麻 | XP_002513133.1 | 126 |
大豆 | XP_003555190.1 | 127 |
玉蜀黍 | AFW61101.1 | 128 |
蒺藜苜蓿 | XP_003593498.1 | 129 |
小立碗藓 | XP_001770987.1 | 130 |
双色蜀黍 | XP_002458594.1 | 131 |
稻 | NP_001061138.1 | 132 |
生物 | 基因名 | SEQ ID NO: |
二穗短柄草 | XP_003560909.1 | 133 |
毛果杨 | XP_002305010.2 | 134 |
葡萄 | XP_002267403 | 135 |
黄瓜 | XP_004134959 | 136 |
琴叶拟南芥 | XP_002883222.1 | 137 |
在一些实施方案中,本公开内容的FRG蛋白或其片段具有与拟南芥FRG蛋白的氨基酸序列(即,SEQIDNO:125)具有至少约20%、至少约25%、至少约30%、至少约40%、至少约50%、至少约55%、至少约60%、至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%、或至少约100%氨基酸同一性的氨基酸序列。
在一些实施方案中,FRG蛋白的同源物,或FRG蛋白的片段的同源物也可用于本公开内容的方法中。
FRG样蛋白可以包括任何FRG同源物或直系同源物,诸如例如表11中列出的那些的任意一个的氨基酸序列或其片段。技术人员会容易地认识到另外的FRG同源物和/或直系同源物可以存在,并且可用于本文。
DNA结合结构域
本公开内容的SHH1样蛋白、SUVH2样蛋白、SUVH9样蛋白、DMS3样蛋白、MORC6样蛋白、SUVR2样蛋白、DRD1样蛋白、RDM1样蛋白、DRM3样蛋白、DRM2样蛋白和/或FRG样蛋白具有DNA结合活性。该DNA结合活性通过异源DNA结合结构域实现。在一些实施方案中,本公开内容的重组蛋白包含DNA结合结构域。本公开内容的重组蛋白可以包含一个DNA结合结构域,或者它们可以包含多于一个DNA结合结构域。
在一些实施方案中,DNA结合结构域是锌指结构域。如本文所公开,“锌指结构域”是指包含锌指的DNA结合蛋白质结构域,所述锌指是能够配合一个或更多个锌离子以帮助稳定它们的蛋白质折叠的小的蛋白质结构基序。锌指一般可被分类为若干不同的结构家族,并且一般作为结合DNA、RNA、蛋白质或小分子的相互作用模块起作用。本公开内容的合适的锌指结构域可包含2个、3个、4个、5个、6个、7个、8个或9个锌指。合适的锌指结构域的实例可包括例如Cys2His2(C2H2)锌指结构域、C-x8-C-x5-C-x3-H(CCCH)锌指结构域、多半胱氨酸锌指结构域和锌双核簇结构域。
在一些实施方案中,所述DNA结合结构域结合特定的核酸序列。例如,所述DNA结合结构域可结合长度为至少5个核苷酸、至少6个核苷酸、至少7个核苷酸、至少8个核苷酸、至少9个核苷酸、至少10个核苷酸、至少11个核苷酸、至少12个核苷酸、至少13个核苷酸、至少14个核苷酸、至少15个核苷酸、至少20个核苷酸、至少25个核苷酸、至少30个核苷酸、至少35个核苷酸、至少40个核苷酸、至少45个核苷酸、至少50个核苷酸或更高数目的核苷酸的序列。在一些实施方案中,DNA结合结构域结合长度为8个核苷酸的序列。
在一些实施方案中,本公开内容的重组蛋白还包含两个N末端CCCH锌指结构域。
在一些实施方案中,锌指结构域是工程化的锌指阵列,例如C2H2锌指阵列。工程化的C2H2锌指的阵列能够用于产生能够靶向所需基因组DNA序列的DNA结合蛋白。工程化锌指阵列的方法是本领域公知的,并且包括,例如组合具有已知特异性的较小锌指。
在一些实施方案中,重组蛋白可以包含除了锌指结构域之外的DNA结合结构域。这种DNA结合结构域的实例可包括,例如,TAL(转录激活因子样)效应子靶向结构域、螺旋-转角-螺旋家族DNA结合结构域、碱性结构域、带-螺旋-螺旋结构域、TBP(TATA-盒结合蛋白)结构域、桶状二聚体结构域、RHB结构域(真实同源结构域、BAH(布罗莫临近同源性(bromo-adjacenthomology))结构域、SANT结构域、克罗莫结构域、Tudor结构域、布罗莫结构域、PHD结构域(植物同源异型结构域)、WD40结构域和MBD结构域(甲基-CpG-结合结构域)。
在一些实施方案中,DNA结合结构域是TAL效应子靶向结构域。如本文所用的,TAL效应子是指分泌的细菌蛋白,例如由黄单胞菌属(Xanthomonas)或罗尔斯通菌属(Ralstonia)细菌感染多种植物物种时分泌的那些。通常,TAL效应子能够结合宿主植物中的启动子序列,并且激活有助于细菌感染的植物基因的表达。TAL效应子通过中心重复靶向结构域识别植物DNA序列,所述中心重复靶向结构域包含可变数量的约34个氨基酸重复。此外,TAL效应子靶向结构域可以被工程化以靶向特定的DNA序列。修饰TAL效应子靶向结构域的方法是本领域公知的,并且记载于Bogdanove和Voytas,Science.2011Sep30;333(6051):1843-6)。
本公开内容的靶核酸
本公开内容的其他方面涉及利用重组蛋白通过与感兴趣的基因相关的一种或更多种靶核酸结合而降低植物中一种或更多种感兴趣的基因的表达。重组蛋白可以是SHH1样蛋白、SUVH2样蛋白、SUVH9样蛋白、DMS3样蛋白、MORC6样蛋白、SUVR2样蛋白、DRD1样蛋白、RDM1样蛋白、DRM3样蛋白、DRM2样蛋白和/或FRG样蛋白。在一些实施方案中,SHH1样蛋白、SUVH2样蛋白、SUVH9样蛋白、DMS3样蛋白、MORC6样蛋白、SUVR2样蛋白、DRD1样蛋白、RDM1样蛋白、DRM3样蛋白、DRM2样蛋白和/或FRG样蛋白通过与靶核酸结合而降低感兴趣的基因的表达。在一些实施方案中,SHH1样蛋白、SUVH2样蛋白、SUVH9样蛋白、DMS3样蛋白、MORC6样蛋白、SUVR2样蛋白、DRD1样蛋白、RDM1样蛋白、DRM3样蛋白、DRM2样蛋白和/或FRG样蛋白通过与靶核酸结合而使感兴趣的基因的表达沉默。
在一些实施方案中,本公开内容的靶核酸是位于靶基因内任何位置处的提供用于降低靶基因表达的适合位置的核酸。靶核酸可以位于靶基因的编码区或其上游或下游。此外,靶核酸可以内源性地存在于靶基因中,或者可以例如使用诸如同源重组的技术被插入到基因中(例如异源性的)。例如,本公开内容的靶基因可以被可操作地连接至控制区,例如启动子,所述控制区包含被本公开内容的SHH1样蛋白、SUVH2样蛋白、SUVH9样蛋白、DMS3样蛋白、MORC6样蛋白、SUVR2样蛋白、DRD1样蛋白、RDM1样蛋白、DRM3样蛋白、DRM2样蛋白和/或FRG样蛋白识别并结合的序列。
靶核酸可以是能够被本公开内容的SHH1样蛋白、SUVH2样蛋白、SUVH9样蛋白、DMS3样蛋白、MORC6样蛋白、SUVR2样蛋白、DRD1样蛋白、RDM1样蛋白、DRM3样蛋白、DRM2样蛋白和/或FRG样蛋白结合的任何给定的感兴趣的核酸。在一些实施方案中,靶核酸对于植物是内源性的,在所述植物中一种或更多种基因的表达被本公开内容的SHH1样蛋白、SUVH2样蛋白、SUVH9样蛋白、DMS3样蛋白、MORC6样蛋白、SUVR2样蛋白、DRD1样蛋白、RDM1样蛋白、DRM3样蛋白、DRM2样蛋白和/或FRG样蛋白降低。在一些实施方案中,靶核酸是已经被插入到植物中的感兴趣的转基因。将转基因引入植物中的方法是本领域熟知的。可以将转基因插入植物中以提供用于所需蛋白的生产系统,或者可以将转基因添加到遗传互补物中以调节植物的代谢。
其表达可以被本公开内容的SHH1样蛋白、SUVH2样蛋白、SUVH9样蛋白、DMS3样蛋白、MORC6样蛋白、SUVR2样蛋白、DRD1样蛋白、RDM1样蛋白、DRM3样蛋白、DRM2样蛋白和/或FRG样蛋白降低的合适的内源性植物基因的实例可以包括,例如,阻止一种或更多种所需特性的增强的基因和阻止增加的作物产量的基因。例如,本公开内容的SHH1样蛋白、SUVH2样蛋白、SUVH9样蛋白、DMS3样蛋白、MORC6样蛋白、SUVR2样蛋白、DRD1样蛋白、RDM1样蛋白、DRM3样蛋白、DRM2样蛋白和/或FRG样蛋白可以用于降低植物中基因GAI的表达,这会产生对赤霉素较不敏感的植物。在与研究相关的实施方案中,本公开内容的SHH1样蛋白、SUVH2样蛋白、SUVH9样蛋白、DMS3样蛋白、MORC6样蛋白、SUVR2样蛋白、DRD1样蛋白、RDM1样蛋白、DRM3样蛋白、DRM2样蛋白和/或FRG样蛋白可以用于使感兴趣的内源性基因的表达沉默,以产生在其中研究所述感兴趣的基因的功能的突变植物。
存在于植物中的其表达可以被本公开内容的SHH1样蛋白、SUVH2样蛋白、SUVH9样蛋白、DMS3样蛋白、MORC6样蛋白、SUVR2样蛋白、DRD1样蛋白、RDM1样蛋白、DRM3样蛋白、DRM2样蛋白和/或FRG样蛋白降低的合适的转基因的实例可以包括,例如,在某些遗传背景中没有用处的转基因、在某些遗传背景中有害的转基因以及在某些不期望的组织中表达的转基因。例如,在某些不期望的组织中表达的转基因的情况下,本公开内容的SHH1样蛋白、SUVH2样蛋白、SUVH9样蛋白、DMS3样蛋白、MORC6样蛋白、SUVR2样蛋白、DRD1样蛋白、RDM1样蛋白、DRM3样蛋白、DRM2样蛋白和/或FRG样蛋白能够用于通过将组织特异性启动子可操作地连接至本公开内容的重组多肽,而在特定时间在特定组织中使此类转基因的表达沉默。在与研究相关的实施方案中,本公开内容的SHH1样蛋白、SUVH2样蛋白、SUVH9样蛋白、DMS3样蛋白、MORC6样蛋白、SUVR2样蛋白、DRD1样蛋白、RDM1样蛋白、DRM3样蛋白、DRM2样蛋白和/或FRG样蛋白可以用于通过控制转基因的诱导/沉默,而动态研究感兴趣的转基因。
本公开内容的植物
本公开内容的某些方面涉及包含一种或更多种SHH1样蛋白、SUVH2样蛋白、SUVH9样蛋白、DMS3样蛋白、MORC6样蛋白、SUVR2样蛋白、DRD1样蛋白、RDM1样蛋白、DRM3样蛋白、DRM2样蛋白和/或FRG样蛋白的植物。在某些实施方案中,SHH1样蛋白、SUVH2样蛋白、SUVH9样蛋白、DMS3样蛋白、MORC6样蛋白、SUVR2样蛋白、DRD1样蛋白、RDM1样蛋白、DRM3样蛋白、DRM2样蛋白和/或FRG样蛋白与植物中的一种或更多种靶核酸结合,并降低一种或更多种靶核酸的表达。
如本文所用的,“植物”是指植物界的多种光合作用的、真核多细胞生物的任一种,特征为产生胚、包含叶绿体、具有纤维素细胞壁并缺乏运动性。如本文所用的,“植物”包括在任何发育阶段的任何植物或植物部分,包括种子、悬浮培养物、植物细胞、胚、分生区、愈伤组织、叶、根、嫩枝、配子体、孢子体、花粉、小孢子及其后代。还包括插条以及细胞或组织培养物。如与本公开内容联合使用的,植物组织包括,不限于,全植物、植物细胞、植物器官(例如叶、茎、根)、分生组织、植物种子、原生质体、愈伤组织、细胞培养物以及组成结构和/或功能单位的任何植物细胞群体。
任何植物细胞可以用于本公开内容中,只要其在用核酸序列转化之后保持活力。优选地,植物细胞不会受到必需核酸序列的转导、后续的蛋白表达或得到中间产物的负面影响。
如本文公开的,宽范围的植物类型可以被修饰以并入SHH1样蛋白、SUVH2样蛋白、SUVH9样蛋白、DMS3样蛋白、MORC6样蛋白、SUVR2样蛋白、DRD1样蛋白、RDM1样蛋白、DRM3样蛋白、DRM2样蛋白和/或FRG样蛋白。可以被修饰的合适的植物包括单子叶(monocotyledonous)(单子叶(monocot))植物和双子叶(dicotyledonous)(双子叶(dicot))植物。
合适的植物的实例可以包括,例如,禾本科(Gramineae)的物种,包括两色蜀黍(Sorghumbicolor)和玉蜀黍(Zeamays);以下属的物种:南瓜属(Cucurbita)、蔷薇属(Rosa)、葡萄属(Vitis)、胡桃属(Juglans)、草莓属(Fragaria)、百脉根属(Lotus)、苜蓿属(Medicago)、驴食草属(Onobrychis)、三叶草属(Trifolium)、葫芦巴属(Trigonella)、豇豆属(Vigna)、柑橘属(Citrus)、亚麻属(Linum)、老鹳草属(Geranium)、木薯属(Manihot)、胡萝卜属(Daucus)、拟南芥属(Arabidopsis)、芸苔属(Brassica)、萝卜属(Raphanus)、白芥属(Sinapis)、颠茄属(Atropa)、辣椒属(Capsicum)、曼陀罗属(Datura)、莨菪属(Hyoscyamus)、番茄属(Lycopersicon)、烟草属(Nicotiana)、茄属(Solanum)、碧冬茄属(Petunia)、毛地黄属(Digitalis)、Majorana、菊苣属(Ciahorium)、向日葵属(Helianthus)、莴苣属(Lactuca)、雀麦属(Bromus)、天门冬属(Asparagus)、金鱼草属(Antirrhinum)、Heterocallis、Nemesis、天竺葵属(Pelargonium)、黍属(Panieum)、狼尾草属(Pennisetum)、毛茛属(Ranunculus)、千里光属(Senecio)、喇叭舌属(Salpiglossis)、甜瓜属(Cucumis)、蓝英花属(Browaalia)、大豆属(Glycine)、豌豆属(Pisum)、菜豆属(Phaseolus)、黑麦草属(Lolium)、稻属(Oryza)、燕麦属(Avena)、大麦属(Hordeum)、黑麦属(Secale)和小麦属(Triticum)。
在一些实施方案中,植物细胞可以包括,例如,来自玉米(玉蜀黍)、油菜(甘蓝型油菜(Brassicanapus)、芜菁(Brassicarapaspp.)、用作种子油来源的芸苔属种、紫花苜蓿(alfalfa)(紫花苜蓿(Medicagosativa))、稻(rice)(稻(Oryzasativa))、黑麦(rye)(黑麦(Secalecereale))、高粱(sorghum)(两色蜀黍、高粱(Sorghumvulgare))、稷(millet)(例如御谷(pearlmillet)(御谷(Pennisetumglaucum))、黍(prosomillet)(黍(Panicummiliaceum))、粟(foxtailmillet)(粟(Setariaitalica))、龙爪稷(fingermillet)(龙爪稷(Eleusinecoracana)))、向日葵(sunflower)(向日葵(Helianthusannuus))、红花(safflower)(红花(Carthamustinctorius))、小麦(wheat)(小麦(Triticumaestivum))、浮萍(duckweed)(浮萍属(Lemna))、大豆(soybean)(大豆(Glycinemax))、烟草(tobacco)(烟草(Nicotianatabacum))、马铃薯(potato)(马铃薯(Solanumtuberosum))、花生(pwanuts)(花生(Arachishypogaea))、棉花(cotton)(海岛棉(Gossypiumbarbadense)、陆地棉(Gossypiumhirsutum))、番薯(sweetpotato)(番薯(Ipomoeabatatus))、木薯(cassava)(木薯(Manihotesculenta))、咖啡(咖啡属种(Coffeaspp.))、椰子(cocnut)(Cocosnucijra)、凤梨(pineapple)(凤梨(Ananascomosus))、柑橘树(柑橘属种(Citrusspp.))、可可(cocoa)(可可(Theobromacacao))、茶(野茶树(Camelliasinensis))、香蕉(芭蕉属种(Musaspp.))、鳄梨(avocado)(鳄梨(Perseaamericana))、无花果(fig)(无花果(Ficuscasica))、番石榴(guava)(番石榴(Psidiumguajava))、芒果(mango)(芒果(Mangiferaindica))、橄榄(olive)(橄榄(Oleaeuropaea))、番木瓜(papaya)(番木瓜(Caricapapaya))、腰果(cashew)(腰果(Anacardiumoccidentale))、澳洲坚果(澳洲坚果属种(Macadamiaspp.))、巴旦杏(almond)(巴旦杏(Prunusamygdalus))、甜菜(sugarbeets)(甜菜(Betavulgaris))、甘蔗(甘蔗属种(Saccharumspp.))、燕麦、大麦、蔬菜、观赏植物和松柏类植物的那些。
合适的蔬菜植物的实例可以包括,例如,番茄(tomatoes)(番茄(Lycopersiconesculentum))、莴苣(lettuce)(例如莴苣(Lactucasativa))、青豆(菜豆(Phaseolusvulgaris))、利马豆(limabeans)(利马豆(Phaseoluslimensis))、豌豆(山黧豆属种(Lathyrusspp.))以及甜瓜属的成员例如黄瓜(cucumber)(黄瓜(C.sativus))、甜瓜(罗马甜瓜(C.cantalupensis))和香瓜(muskmelon)(香瓜(C.melo))。
合适的观赏植物的实例可以包括,例如,杜鹃花(杜鹃花属种(Rhododendronspp.))、绣球花(hydrangea)(绣球花(Macrophyllahydrangea))、木槿(hibiscus)(木槿(Hibiscusrosasanensis))、蔷薇(蔷薇属种(Rosaspp.))、郁金香(郁金香属种(Tulipaspp.))、水仙(水仙属种(Narcissusspp.))、矮牵牛(petunias)(矮牵牛(Petuniahybrida))、康乃馨(carnation)(康乃馨(Dianthuscaryophyllus))、一品红(poinsettia)(一品红(Euphorbiapulcherrima))和菊花。
合适的松柏类植物的实例可以包括,例如,火炬松(loblollypine)(火炬松(Pinustaeda))、湿地松(slashpine)(湿地松(Pinuselliotii))、西黄松(ponderosapine)(西黄松(Pinusponderosa))、美国黑松(lodgepolepine)(美国黑松(Pinuscontorta))、辐射松(Montereypine)(辐射松(Pinusradiata))、花旗松(Douglas-fir)(花旗松(Pseudotsugamenziesii))、西部铁杉(Isugacanadensis)、西加云杉(Siktaspruce)(白云杉(Piceaglauca))、红杉(北美红杉(Sequoiasempervirens)、银杉(太平洋银冷杉(Abiesamabilis))、香脂冷杉(balsamfir)(香脂冷杉(Abiesbalsamea))、西部红松(Westernredcedar)(西部红松(Thujaplicata))和阿拉斯加黄柏(Alaskayellow-cedar)(拿加逊扁柏(Chamaecyparisnootkatensis))。
合适的豆科植物的实例可以包括,例如,瓜尔豆、槐豆、葫芦巴、大豆、四季豆(gardenbeans)、豇豆、绿豆、利马豆、蚕豆、扁豆、鹰嘴豆、花生(花生属种(Arachissp.))、多变小冠花(crownvetch)(蚕豆属种(Viciasp.))、毛叶苕子、小豆、羽扇豆(羽扇豆属种(Lupinussp.))、三叶草、菜豆(菜豆属种(Phaseolussp.))、菜豆(fieldbean)(豌豆属种(Pisumsp.))、三叶草(clover)(草木樨属种(Melilotussp.))百脉根属(Lotus)、车轴草、兵豆属和紫穗槐。
合适的牧草和草坪草的实例可以包括,例如,紫花苜蓿(苜蓿属种(Medicagospp.))、野茅、高羊茅、黑麦草、匍匐翦股颖和小糠草。
合适的作物植物和模式植物的实例可以包括,例如,拟南芥、玉米、稻、紫花苜蓿、向日葵、油菜、大豆、棉花、花生、高粱、小麦、烟草和浮萍属。
本公开内容的植物可以被遗传修饰是由于重组核酸已经被引入所述植物中,并且如此遗传修饰的植物不会在天然状态下出现。本公开内容的合适的植物是能够表达编码一种或更多种重组蛋白的一种或更多种核酸构建体的植物。核酸编码的重组蛋白可以是SHH1样蛋白、SUVH2样蛋白、SUVH9样蛋白、DMS3样蛋白、MORC6样蛋白、SUVR2样蛋白、DRD1样蛋白、RDM1样蛋白、DRM3样蛋白、DRM2样蛋白和/或FRG样蛋白。
如本文所用的,术语“转基因植物”和“遗传修饰的植物”可以互换使用,并且是指在其基因组中包含重组核酸的植物。一般来说,重组核酸被稳定地整合在基因组中,使得多核苷酸能够被传递到连续世代。但是,在某些实施方案中,重组核酸在植物中瞬时表达。重组核酸可以单独或作为重组表达盒的一部分被整合到基因组中。在本文中使用“转基因(transgenic)”以包括其基因型已经通过外源核酸的存在而被改变的任何细胞、细胞系、愈伤组织、组织、植物部分或植物,所述外源核酸的存在包括最初如此改变的那些转基因产物,以及通过有性杂交或无性繁殖从最初转基因产物产生的那些。
如本文使用的“重组核酸”或“异源核酸”或“重组多核苷酸”是指核酸的聚合物,其中以下的至少一种是真实的:(a)核酸序列对于给定的宿主细胞是外来的(即,不是天然存在于给定的宿主细胞中的);(b)序列可以天然存在于给定的宿主细胞,但是是以非天然(例如比预期更高)的量存在;或(c)核酸序列包含两个或更多个子序列,所述子序列在天然条件下不存在于相同的相互关系中。例如,关于情况(c),重组核酸序列将具有来自不相关基因的两个或更多个序列,所述两个或更多个序列被排列以制成新的功能性核酸。具体地,本公开内容描述了将表达载体引入植物细胞,其中表达载体包含编码通常不存在于植物细胞中的蛋白的核酸序列,或包含编码通常存在于植物细胞但是在不同调节序列的控制下的蛋白的核酸。然后,参照植物细胞的基因组,编码蛋白的核酸序列是重组的。被称为重组体的蛋白通常暗示其是由植物细胞中的重组核酸序列编码的。
本公开内容的“重组”多肽、蛋白或酶是由“重组核酸”或“异源性核酸”或“重组多核苷酸”编码的多肽、蛋白或酶。
在一些实施方案中,植物细胞中编码重组蛋白的基因相对于所述植物细胞可以是异源性的。在某些实施方案中,植物细胞不会天然地产生重组蛋白,并包含能够表达用于产生那些分子所必需的一种或更多种基因的异源核酸构建体。
植物中重组蛋白的表达
可以经由本领域已知的任何合适的方法将本公开内容的SHH1样蛋白、SUVH2样蛋白、SUVH9样蛋白、DMS3样蛋白、MORC6样蛋白、SUVR2样蛋白、DRD1样蛋白、RDM1样蛋白、DRM3样蛋白、DRM2样蛋白和/或FRG样蛋白引入植物细胞中。例如,可以将SHH1样蛋白、SUVH2样蛋白、SUVH9样蛋白、DMS3样蛋白、MORC6样蛋白、SUVR2样蛋白、DRD1样蛋白、RDM1样蛋白、DRM3样蛋白、DRM2样蛋白和/或FRG样蛋白外源性地添加至植物细胞,并且将植物细胞维持在使得SHH1样蛋白、SUVH2样蛋白、SUVH9样蛋白、DMS3样蛋白、MORC6样蛋白、SUVR2样蛋白、DRD1样蛋白、RDM1样蛋白、DRM3样蛋白、DRM2样蛋白和/或FRG样蛋白与一种或更多种靶核酸结合并降低植物细胞中靶核酸的表达的条件下。可选地,本公开内容的编码SHH1样蛋白、SUVH2样蛋白、SUVH9样蛋白、DMS3样蛋白、MORC6样蛋白、SUVR2样蛋白、DRD1样蛋白、RDM1样蛋白、DRM3样蛋白、DRM2样蛋白和/或FRG样蛋白的重组核酸能够在植物细胞中表达,并且将植物细胞维持在使得所表达的SHH1样蛋白、SUVH2样蛋白、SUVH9样蛋白、DMS3样蛋白、MORC6样蛋白、SUVR2样蛋白、DRD1样蛋白、RDM1样蛋白、DRM3样蛋白、DRM2样蛋白和/或FRG样蛋白与一种或更多种靶核酸结合并降低植物细胞中靶基因的表达的条件下。此外,在一些实施方案中,可以经由病毒感染植物或通过将SHH1样蛋白编码RNA、SUVH2样蛋白编码RNA、SUVH9样蛋白编码RNA、DMS3样蛋白编码RNA、MORC6样蛋白编码RNA、SUVR2样蛋白编码RNA、DRD1样蛋白编码RNA、RDM1样蛋白编码RNA、DRM3样蛋白编码RNA、DRM2样蛋白编码RNA和/或FRG样蛋白编码RNA引入植物中,而在植物细胞中瞬时表达本公开内容的SHH1样蛋白、SUVH2样蛋白、SUVH9样蛋白、DMS3样蛋白、MORC6样蛋白、SUVR2样蛋白、DRD1样蛋白、RDM1样蛋白、DRM3样蛋白、DRM2样蛋白和/或FRG样蛋白,以暂时性降低感兴趣的基因的表达或使感兴趣的基因的表达沉默。经由病毒感染或经由将RNA引入植物中而引入重组蛋白的方法是本领域公知的。例如,烟草脆裂病毒(TRV)已被成功地用于将锌指核酸酶引入植物中以引起基因组修饰(“NontransgenicGenomeModificationinPlantCells”,PlantPhysiology154:1079-1087(2010))。
本公开内容的编码SHH1样蛋白、SUVH2样蛋白、SUVH9样蛋白、DMS3样蛋白、MORC6样蛋白、SUVR2样蛋白、DRD1样蛋白、RDM1样蛋白、DRM3样蛋白、DRM2样蛋白和/或FRG样蛋白的重组核酸可使用任何合适的植物表达载体在植物中表达。可用于在高等植物中表达重组核酸的典型载体是本领域公知的,并且包括,不限于,衍生自根癌农杆菌(Agrobacteriumtumefaciens)的肿瘤诱导(Ti)质粒的载体(例如,参见Rogers等人,Meth.inEnzymol.(1987),153:253-277)。这些载体是植物整合载体的原因在于,在转化中,载体将载体DNA的部分整合到宿主植物的基因组中。可用于本文的示例性根癌农杆菌载体是质粒pKYLX6和pKYLX7(例如,参见Schardl等人,Gene(1987)61:1-11,和Berger等人,Proc.Natl.Acad.Sci.USA(1989)86:8402-8406);以及从ClontechLaboratories,Inc.(PaloAlto,CA)可得的质粒pBI101.2。
除了调节结构域之外,可将本公开内容的SHH1样蛋白、SUVH2样蛋白、SUVH9样蛋白、DMS3样蛋白、MORC6样蛋白、SUVR2样蛋白、DRD1样蛋白、RDM1样蛋白、DRM3样蛋白、DRM2样蛋白和/或FRG样蛋白作为与以下偶联的融合蛋白表达:例如以便于纯化、监测表达或监测细胞和亚细胞定位的麦芽糖结合蛋白(“MBP”)、谷胱甘肽S转移酶(GST)、六聚组氨酸、c-myc或FLAG表位。
此外,可通过使用密码子偏好性修饰本公开内容的编码SHH1样蛋白、SUVH2样蛋白、SUVH9样蛋白、DMS3样蛋白、MORC6样蛋白、SUVR2样蛋白、DRD1样蛋白、RDM1样蛋白、DRM3样蛋白、DRM2样蛋白和/或FRG样蛋白的重组核酸,以提高植物中重组蛋白的表达。当合成性地制备或改变重组核酸时,可利用核酸待在其中表达的预期的植物宿主的已知密码子偏好性。例如,可修饰本公开内容的重组核酸以产生单子叶植物和双子叶植物的特定的密码子偏好性和GC含量偏好性,因为已经表明这些偏好性有差异(Murray等人,Nucl.AcidsRes.(1989)17:477-498)。
在一些实施方案中,本公开内容的SHH1样蛋白、SUVH2样蛋白、SUVH9样蛋白、DMS3样蛋白、MORC6样蛋白、SUVR2样蛋白、DRD1样蛋白、RDM1样蛋白、DRM3样蛋白、DRM2样蛋白和/或FRG样蛋白可用于通过抑制靶基因表达而在植物中产生功能性的“基因敲除”突变。抑制可以是对结构基因的抑制,所述结构基因例如编码具有例如酶活性的蛋白的基因,或是对调节基因的抑制,所述调节基因例如编码转而调节结构基因表达的蛋白的基因。
本公开内容还提供了表达载体,所述表达载体包含本公开内容的SHH1样蛋白编码核酸、SUVH2样蛋白编码核酸、SUVH9样蛋白编码核酸、DMS3样蛋白编码核酸、MORC6样蛋白编码核酸、SUVR2样蛋白编码核酸、DRD1样蛋白编码核酸、RDM1样蛋白编码核酸、DRM3样蛋白编码核酸、DRM2样蛋白编码核酸和/或FRG样蛋白编码核酸。可将编码本公开内容的期望的重组核酸的核酸序列用于构建可被引入期望的宿主细胞中的重组表达载体。重组表达载体将通常包含可操作地连接至转录起始调节序列的本公开内容的编码重组蛋白的核酸,所述转录起始调节序列将指导核酸在期望的宿主细胞例如转化的植物的组织中的转录。
例如,植物表达载体可包括(1)在5'和3'调节序列的转录调控下的克隆的植物基因和(2)显性可选择标记。如果需要的话,这类植物表达载体还可包含启动子调控区(例如,赋予诱导型的或组成型的,环境或发育调控的,或细胞或组织特异性的/选择性的表达的启动子调控区)、转录起始开始位点、核糖体结合位点、RNA加工信号、转录终止位点和/或聚腺苷酸化信号。
可采用植物启动子或其功能片段调控再生植物中本公开内容的重组核酸的表达。表达载体中使用的启动子的选择将决定改造的植物中重组核酸的时空表达模式,例如,SHH1样蛋白编码核酸、SUVH2样蛋白编码核酸、SUVH9样蛋白编码核酸、DMS3样蛋白编码核酸、MORC6样蛋白编码核酸、SUVR2样蛋白编码核酸、DRD1样蛋白编码核酸、RDM1样蛋白编码核酸、DRM3样蛋白编码核酸、DRM2样蛋白编码核酸和/或FRG样蛋白编码核酸仅在期望的组织中表达,或仅在植物发育或生长的特定时间表达。某些启动子将在所有植物组织中表达重组核酸,并且在大多数的环境条件和发育状态或细胞分化状态下是有活性的(即,组成型启动子)。其他启动子将在特定细胞类型(例如叶表皮细胞、叶肉细胞、根皮层细胞)中或在特定组织或器官(例如根、叶或花)中表达重组核酸,并且该选择将反映基因产物积累的期望位置。可选地,所选择的启动子可在多种诱导条件下驱动重组核酸的表达。
合适的组成型启动子的实例可以包括,例如,Rsyn7的核心启动子、核心CaMV35S启动子(Odell等人,Nature(1985)313:810-812)、CaMV19S(Lawton等人,1987)、水稻肌动蛋白(Wang等人,1992;美国专利号5,641,876;和McElroy等人,PlantCell(1985)2:163-171);泛素(Christensen等人,PlantMol.Biol.(1989)12:619-632;和Christensen等人,PlantMol.Biol.(1992)18:675-689)、pEMU(Last等人,Theor.Appl.Genet.(1991)81:581-588)、MAS(Velten等人,EMBOJ.(1984)3:2723-2730)、nos(Ebert等人,1987)、Adh(Walker等人,1987)、衍生自根癌农杆菌的T-DNA的P-或2'-启动子、Smas启动子、肉桂醇脱氢酶启动子(美国专利号5,683,439)、Nos启动子、pEmu启动子、rubisco启动子、GRP1-8启动子以及技术人员已知的来自多个植物基因的其他转录起始区、和例如美国专利号5,608,149、5,608,144、5,604,121、5,569,597、5,466,785、5,399,680、5,268,463和5,608,142中描述的组成型启动子。
合适的组织特异性启动子的实例可包括,例如,凝集素启动子(Vodkin等人,1983;Lindstrom等人,1990)、玉米醇脱氢酶1启动子(Vogel等人,1989;Dennis等人,1984)、玉米捕光复合物启动子(Simpson,1986;Bansal等人,1992)、玉米热休克蛋白启动子(Odell等人,Nature(1985)313:810-812;Rochester等人,1986)、豌豆小亚基RuBP羧化酶启动子(Poulsen等人,1986;Cashmore等人,1983)、Ti质粒甘露碱型(mannopine)合酶启动子(Langridge等人,1989)、Ti质粒胭脂碱合酶启动子(Langridge等人,1989)、矮牵牛查尔酮异构酶启动子(VanTunen等人,1988)、豆富含甘氨酸蛋白1启动子(Keller等人,1989)、截短的CaMV35s启动子(Odell等人,Nature(1985)313:810-812)、马铃薯patatin启动子(Wenzler等人,1989)、根细胞启动子(Conkling等人,1990)、玉米醇溶蛋白启动子(Reina等人,1990;Kriz等人,1987;Wandelt和Feix,1989;Langridge和Feix,1983;Reina等人,1990)、球蛋白-1启动子(Belanger和Kriz等人,1991)、α-微管蛋白启动子、cab启动子(Sullivan等人,1989)、PEPC酶启动子(Hudspeth&Grula,1989)、R基因复合物相关的启动子(Chandler等人,1989)、和查尔酮合酶启动子(Franken等人,1991)。
可选地,植物启动子能够指导本公开内容的重组核酸在特定组织中表达或可另外地在更加精确的环境或发育控制下表达。这类启动子在本文中被称为“诱导型”启动子。可以通过诱导型启动子影响转录的环境条件包括,不限于,病原体攻击、厌氧条件或光的存在。诱导型启动子的实例包括,不限于,可由低氧或冷应激诱导的AdhI启动子、可由热应激诱导的Hsp70启动子和可由光诱导的PPDK启动子。在发育控制下的启动子的实例包括,不限于,仅或优先在特定组织中起始转录的启动子,所述特定组织例如叶、根、果实、种子或花。一个示例性的启动子是花药特异性启动子5126(美国专利号5,689,049和5,689,051)。启动子的操作还可取决于其在基因组中的位置而不同。因此,诱导型启动子可以在某些位置变为完全或部分组成型的。
此外,组成型或诱导型启动子与非组织特异性或组织特异性启动子的任意组合可用于调控SHH1样蛋白、SUVH2样蛋白、SUVH9样蛋白、DMS3样蛋白、MORC6样蛋白、SUVR2样蛋白、DRD1样蛋白、RDM1样蛋白、DRM3样蛋白、DRM2样蛋白和/或FRG样蛋白的表达。
异源性和内源性启动子二者均可用于指导本公开内容的重组核酸的表达。因此,在某些实施方案中,本公开内容的SHH1样蛋白编码核酸、SUVH2样蛋白编码核酸、SUVH9样蛋白编码核酸、DMS3样蛋白编码核酸、MORC6样蛋白编码核酸、SUVR2样蛋白编码核酸、DRD1样蛋白编码核酸、RDM1样蛋白编码核酸、DRM3样蛋白编码核酸、DRM2样蛋白编码核酸和/或FRG样蛋白编码核酸的表达在其各自内源性启动子的调控下。在其他实施方案中,本公开内容的SHH1样蛋白编码核酸、SUVH2样蛋白编码核酸、SUVH9样蛋白编码核酸、DMS3样蛋白编码核酸、MORC6样蛋白编码核酸、SUVR2样蛋白编码核酸、DRD1样蛋白编码核酸、RDM1样蛋白编码核酸、DRM3样蛋白编码核酸、DRM2样蛋白编码核酸和/或FRG样蛋白编码核酸的表达在异源性启动子的调控下。另外,可使用敲入方法修饰本公开内容的内源性SHH1基因、SUVH2基因、SUVH9基因、DMS3基因、MORC6基因、SUVR2基因、DRD1基因、RDM1基因、DRM3基因、DRM2基因和/或FRG基因,使得修饰的基因将在其各自的内源性元件的调控下。可选地,可以将完整的SHH1、SUVH2、SUVH9、DMS3、MORC6、SUVR2、DRD1、RDM1、DRM3、DRM2和/或FRG基因组序列的修饰形式引入植物中,使得修饰的/重组的基因将在其内源性元件的调控下,并且野生型基因保持完整。还可将这些技术的任一种或全部组合以指导本公开内容的重组核酸的表达。
本公开内容的重组核酸,例如SHH1样蛋白编码核酸、SUVH2样蛋白编码核酸、SUVH9样蛋白编码核酸、DMS3样蛋白编码核酸、MORC6样蛋白编码核酸、SUVR2样蛋白编码核酸、DRD1样蛋白编码核酸、RDM1样蛋白编码核酸、DRM3样蛋白编码核酸、DRM2样蛋白编码核酸和/或FRG样蛋白编码核酸,和/或具有本公开内容的重组核酸的载体,还可以包含作为3’终止子序列的调节序列。本领域技术人员会容易地认识到可用于本公开内容的重组核酸的多种终止子。例如,本公开内容的重组核酸可以包含3’NOS终止子。此外,来自SHH1样蛋白编码核酸、SUVH2样蛋白编码核酸、SUVH9样蛋白编码核酸、DMS3样蛋白编码核酸、MORC6样蛋白编码核酸、SUVR2样蛋白编码核酸、DRD1样蛋白编码核酸、RDM1样蛋白编码核酸、DRM3样蛋白编码核酸、DRM2样蛋白编码核酸和/或FRG样蛋白编码核酸的天然终止子也可用于本公开内容的重组核酸。
植物转化方案以及将本公开内容的重组核酸引入植物的方案可取决于用于转化的靶植物或植物细胞的类型例如单子叶植物或双子叶植物而不同。将本公开内容的重组核酸引入植物细胞以及随后插入植物基因组中的合适的方法包括,不限于,显微注射(Crossway等人,Biotechniques(1986)4:320-334)、电穿孔(Riggs等人,Proc.Natl.AcadSci.USA(1986)83:5602-5606)、农杆菌介导的转化(美国专利号5,563,055)、直接基因转移(Paszkowski等人,EMBOJ.(1984)3:2717-2722)和弹道颗粒加速(ballisticparticleacceleration)(美国专利号4,945,050;Tomes等人1995."DirectDNATransferintoIntactPlantCellsviaMicroprojectileBombardment,"inPlantCell,Tissue,andOrganCulture:FundamentalMethods,编辑Gamborg和Phillips(Springer-Verlag,Berlin);和McCabe等人,Biotechnology(1988)6:923-926)。
另外,本公开内容的SHH1样蛋白、SUVH2样蛋白、SUVH9样蛋白、DMS3样蛋白、MORC6样蛋白、SUVR2样蛋白、DRD1样蛋白、RDM1样蛋白、DRM3样蛋白、DRM2样蛋白和/或FRG样蛋白可靶向至植物细胞内的特定细胞器。可通过为重组蛋白提供合适的靶向性肽序列而实现靶向。这类靶向性肽的实例包括,不限于,分泌型信号肽(用于分泌或细胞壁或膜靶向)、质粒转运肽、叶绿体转运肽、线粒体靶向性肽、液泡靶向性肽、核靶向性肽等(例如,参见Reiss等人,Mol.Gen.Genet.(1987)209(1):116-121;Settles和Martienssen,TrendsCellBiol(1998)12:494-501;Scott等人,JBiolChem(2000)10:1074;以及Luque和Correas,JCellSci(2000)113:2485-2495)。
可根据常规方法(例如,参见McCormick等人,PlantCell.Reports(1986)81-84.)使改造的植物生长成植株。然后使这些植株生长,并用相同的转化植株或不同的植株授粉,获得的杂合体具有期望的表型特征。可以生长两代或更多代以确保受试的表型特征被稳定保留并被遗传,且然后收获种子以确保已经实现期望的表型或其他性质。
降低植物中的基因表达的方法
本公开内容的另外的方面涉及通过利用SHH1样蛋白、SUVH2样蛋白、SUVH9样蛋白、DMS3样蛋白、MORC6样蛋白、SUVR2样蛋白、DRD1样蛋白、RDM1样蛋白、DRM3样蛋白、DRM2样蛋白和/或FRG样蛋白而降低植物中一种或更多种靶核酸例如基因的表达的方法。在一个方面,本公开内容提供了用于降低植物中一种或更多种靶核酸的表达的方法,所述方法通过提供包含本公开内容的一种或更多种重组多肽的植物,并在所述重组多肽藉以与本公开内容的一种或更多种靶核酸结合的条件下使所述植物生长,从而降低所述一种或更多种靶基因的表达。可以使用本文描述的并包含本公开内容的重组多肽的任何植物。
足以使植物中表达的重组多肽与本公开内容的一种或更多种靶核酸结合并降低所述一种或更多种靶核酸的表达的生长条件是本领域公知的,并且包括本文公开的任何合适的生长条件。通常,在足以表达本公开内容的重组多肽例如SHH1样蛋白、SUVH2样蛋白、SUVH9样蛋白、DMS3样蛋白、MORC6样蛋白、SUVR2样蛋白、DRD1样蛋白、RDM1样蛋白、DRM3样蛋白、DRM2样蛋白和/或FRG样蛋白,并且足以使所表达的重组多肽定位至植物的细胞核以与靶核酸结合并降低靶核酸的表达的条件下,使所述植物生长。一般来说,足以表达重组多肽的条件将取决于用于控制重组多肽的表达的启动子。例如,如果利用诱导型启动子,植物中重组多肽的表达将需要使植物在存在诱导物的情况下生长。
应理解,尽管已经结合其优选的具体实施方案描述了本公开内容,前述描述意欲举例说明本公开内容,并非限制本公开内容的范围。在本公开内容的范围内的其他方面、优势和修改对本公开内容所属技术领域的技术人员将是明显的。
提供以下实施例以举例说明所提供的实施方案,并且不意欲限制本公开内容的范围。
实施例
实施例1
以下实施例涉及拟南芥蛋白SHH1的表征和其参与促进RNA指导的DNA甲基化和基因沉默。
材料和方法
ChIP-seq、BS-seq和siRNA-seq文库构建和测序
使用OvationUltralowILMultiplexSystem(NuGEN)产生ChIP-seq文库的第一重复(replicate)(NRPD1-Flag和Col),同时使用OvationUltralowDRMultiplexSystem(NuGEN)产生第二重复(NRPD1-Flag、NRPD1-Flag;shh1和Col)。对于文库扩增步骤,两组ChIP-seq文库使用18个循环。如之前报道的(Cokus等人,2008)产生BS-seq文库。使用小RNATruSeq试剂盒(Illumina)除了在扩增步骤过程中使用15个循环之外遵循制造商的说明产生siRNA-seq文库。本研究中使用的野生型(Col)和nrpe1BS-seq文库以前已被公布(Zhong等人,2012),且随后进行再分析。使用HiSeq2000平台遵循制造商的说明(Illumina)以50bp的长度对所有文库进行测序。
读段的映射(mapping)和处理
使用标准Illuminapipeline对测序的读段进行碱基调用(base-called)。对于ChIP-seq和BS-seq文库,只保留全长50nt的读段,而对于siRNA-seq文库,剪掉读段的衔接子序列,并且如果读段的长度在18nt和28nt之间就保留它们。对于ChIP-seq和siRNA-seq文库,使用Bowtie(Langmead等人,2009)将读段映射到拟南芥基因组上(TAIR8),并且尽管当将siRNA-seq文库针对每个文库的读段总数标准化时使用独特的和非独特的映射读段的总数,只保留独特地映射到基因组上的完全匹配序列用于进一步分析。对于BS-seq文库,使用用于Bowtie的BSseekerwrapper映射读段(Chen等人,2010)。对于ChIP-seq和BS-seq,将相同读段缩减为一个读段,而对于siRNA-seq,保留相同的读段。对于甲基化分析,使用未甲基化的叶绿体基因组作为非亚硫酸氢盐转化的背景甲基化的测量结果,如以前报道的(Cokus等人,2008)计算甲基化百分比。对于ChIP-seq的第二重复,对NRPD1-Flag和Col文库进行取样直到匹配较小文库(NRPD1-Flag;shh1文库)的读段总数。
DNA甲基化分析
对于在siRNA簇处的DNA甲基化的评价,仅考虑在被测定的各类中具有至少一个胞嘧啶(CG、CHG或CHH)的那些簇。为了通过甲基化水平的Mann-WhitneyU检验计算不同亚类中的簇的甲基化改变的显著性水平(图1E),对每个亚类中的簇的数目进行降低取样(downsample)至最小亚类(drm2/nrpe1亚类)以允许亚类之间的相当的显著性值。
siRNA簇的鉴定
以与以前公布的方法(Heisel等人,2008)类似的方式界定拟南芥基因组中的小RNA簇。简言之,将基因组分为200bp的格(bin),并计算野生型(Col)文库的两个技术重复中不同的siRNA读段的每格平均覆盖度。使用该平均值测定野生型植物中在给定格处的不同读段的数目的显著性,呈现此类计数的Poisson分布。在R环境中,对每个格进行Poisson精确检验,并且认为在每个野生型技术重复中都具有小于1e-5的P值的格是簇。
界定了簇之后,使用Fisher精确检验对每个突变体和野生型(Col)文库进行读段(包括相同读段)计数之间的比较。对所得的P值进行Benjamini-Hochberg调整以评价FDR,并然后认为FDR<1e-10的突变体背景中减少的簇依赖于野生型功能的突变体蛋白。对于siRNA水平的箱形图分析,使用Col文库的第一技术重复作为ColsiRNA水平的代表。为了通过siRNA水平的Mann-WhitneyU检验计算不同基因型亚类中的簇的siRNA改变的显著性水平(图1D),对每个亚类中的簇的数目进行降低取样至最小亚类(drm2/nrpe1亚类)以允许亚类之间的相当的显著性值。
NRPD1峰的鉴定
使用R包BayesPeak(Spyrou等人,2009;Cairns等人,2011)以鉴定与平行进行的配对ColChIP-seq对照文库相比,NRPD1-FlagChIP-seq文库中Pol-IV富集的区域。只保留在两个NRPD1-FlagChIP-seq重复中都鉴定出的高得分峰(PP>0.999)(928个峰),用于进一步分析。为了测定PolIV峰与siRNA簇的重叠的目的,当峰与基因座重叠>=1bp时,就被称为“重叠”。
为了将峰分类为SHH1-依赖性的、-非依赖性的或-增强性的,比较NRPD1-Flag与NRPD1-Flag;shh1ChIP-seq文库之间的跨PolIV峰的读段计数,并使用Fisher精确检验评价显著性。对所得的P值进行Benjamini-Hochberg调整以评价FDR。认为FDR<0.001的shh1文库中具有NRPD1信号损失的峰是SHH1-依赖性的。类似地,认为FDR<0.001的shh1中增加的信号的峰是SHH1-增强性的。认为未落入这些分类任一个中的峰是SHH1-非依赖性的。
蛋白制备
将编码SHH1的SAWADEE结构域(残基125-258)的基因克隆到自我修饰的载体中,所述载体将六聚组氨酸标签和酵母sumo标签融合到靶基因的N末端。将质粒转化到大肠杆菌(E.coli)菌株BL21(DE3)RIL(Stratagene)中。在37℃下培养细胞直至OD600达到0.8,且然后将培养基冷却至20℃,并添加0.2mMIPTG以诱导蛋白质表达过夜。首先使用HisTrapFF柱(GEHealthcare)纯化重组表达的蛋白。通过Ulp1蛋白酶裂解六聚组氨酸-sumo标签,并通过第二HisTrapFF柱而去除所述标签。使用QFastFlow柱和HiloadSuperdexG20016/60柱(GEHealthcare)使用缓冲液(150mMNaCl,20mMTrispH8.0和5mMDTT)进一步纯化汇集的靶蛋白。为了制备Se-甲硫氨酸置换的蛋白,使用QuikChange定点突变试剂盒(Stratagene)将SAWADEE结构域的Leu200和Leu218突变为甲硫氨酸。使用与野生型蛋白相同的方案纯化Se-甲硫氨酸置换的SAWADEE蛋白。在肽合成设备上合成肽。
结晶
在4℃下使用坐滴气相扩散法通过混合1μl的浓度为5mg/ml的蛋白样品和1μl的储液器溶液(reservoirsolution)(0.2MNH4F和20%PEG3350)进行SAWADEE结构域的结晶,所述结晶在0.4ml储液器中平衡。在液滴中添加终浓度为7.6mM的4-环己基-1-丁基-β-D-麦芽糖苷(HamptonResearch)作为添加剂,这导致晶体质量的相当大的改进。在2天内出现薄板形晶体。为了产生SAWADEE结构域与修饰的H3肽的复合物的晶体,在4℃下以1:2的摩尔比混合SAWADEE结构域和肽,持续1小时。在与描述用于游离的SAWADEE蛋白的相同条件下,生长不同复合物的晶体。将所有晶体浸入补充有20%甘油的储液器溶液中,持续2分钟。然后将晶体安装在尼龙环上,用于衍射数据的采集。在芝加哥阿贡国家实验室先进光子源(APS)的NE-CAT光束线24ID-C处采集来自天然SAWADEE蛋白和其Se-甲硫氨酸置换的配对物的分别在锌峰和硒峰处的衍射数据。在纽约布鲁克海文国家实验室国家同步幅射光源(NSLS)的光束线X29A处采集与SAWADEE结构域结合的H3K9me3肽的复合物的数据。在APS24ID-E处采集关于在与H3K9me2、H3K9me1和H3K4me1K9me1肽的复合物中的SAWADEE结构域的数据。使用HKL2000程序(Otwinowski等人,2011)处理所有结晶学数据。
结构确定和精修
使用在Phenix程序(Adams等人,2010)中执行的单波长反常散射(SAD)法,解析硒代甲硫氨酸置换的SAWADEE结构域的结构。使用Coot程序(Emsley等人,2010)进行模型建立,并使用Phenix程序进行结构精修。使用Phenix程序使用分子置换法解析游离状态的野生型SAWADEE结构域的结构。鉴定Zn2+离子并通过异常信号散射进一步证实。使用分子置换法以与天然蛋白相同的方案解析所有在与不同的修饰的H3肽的复合物中的SAWADEE结构域的结构。整个精修过程中,使用5%随机选择的反射(randomchosenreflection)来计算自由R因子(freeRfactor)。使用Procheck程序(Laskowski等人,1993)分析立体化学的结构模型。使用Pymol程序(DeLanoScientificLLC)生成所有的分子图。
等温滴定量热法
6℃下在Microcal量热计ITC200仪器上进行所有的结合实验。首先,将蛋白样品在4℃下相对于100mMNaCl、2mMβ-巯基乙醇和20mMHEPES的缓冲液pH7.5透析过夜。然后稀释蛋白样品,并用相同缓冲液溶解冻干的肽。根据标准方案进行滴定,并使用Origin7.0程序以1:1结合模型拟合数据。
修饰的肽阵列结合
在pENTR/TEV/D质粒(Invitrogen)中产生GST-SHH1SAWADEE结构域(125-258aa)构建体,重组入pDEST15质粒(Invitrogen)中,并转化到Rosetta2(DE3)细菌细胞系(Novagen)中。通过在OD为0.6时每500mL添加500μL的1MIPTG,诱导蛋白表达,并在16℃下过夜培养培养物。诱导时,向培养基中补充500μL的500mMZnSO4。然后如以前描述的(Johnson等人,2008)纯化GST融合蛋白,并透析到贮存缓冲液(50mMTrispH6.8,300mMNaCl,40%甘油,2mMDTT,0.1%tritonX-100)中。在以下条件下将纯化的GST-SHH1(125-258aa)蛋白用于探测MODifiedTM组蛋白肽阵列(ActiveMotif):在25℃下在5%牛奶1xTBS溶液中封闭阵列45min,在25℃下在1xTBS-T溶液中洗涤三次,持续5分钟,并且然后在4℃下用在结合缓冲液(50mMHEPESpH7.5,50mMNaCl,5%甘油,0.4mg/mLBSA,2mMDTT)中的浓度为6.5μg/mL的GST-SHH1SAWADEE探测过夜。然后如上洗涤阵列三次,并在25℃下用1:5000稀释的HRP缀合的GST抗体探测1小时。然后如上描述的洗涤阵列,并使用ECLPlus试剂盒(GEhealthcare)显影。
株系、定点诱变、DNA印迹和蛋白质印迹
使用的多种以前表征的拟南芥RdDM突变体等位基因、互补SHH1-3xMyc-BLRP转基因株系和pSHH1::SHH1-3xMyc-BLRP构建体是以前描述的(Law等人,2011)。pol-iv和pol-v突变体分别对应于这些聚合酶的nrpd1和nrpe1亚基内的突变。使用QuikChange定点诱变试剂盒(Stratagene)在pSHH1::SHH1-3xMyc-BLRP构建体中产生基于结构的突变,并经由蘸花法将其转化到shh1-1突变体背景中。使用花组织在Col和RdDM突变体系中进行siRNA-seq和ChIP-seq实验,并使用10天龄的幼苗进行BS-seq实验。使用来自T1代的同一个体株系的组织并使用以前描述的探针(Johnson等人,2008)和抗体(Law等人,2010)进行DNA印迹和蛋白质印迹实验。分别使用来自多个pSHH1::SHH1-3xMyc-BLRP转基因纯合的T3植株的花组织或10天龄的幼苗,在SAWADEE结构域点突变体系中进行siRNA-seq和BS-seq实验。使用来自shh1突变体等位基因纯合的F1植株的花组织,在多种SAWADEE结构域点突变体背景中进行PolIVChIP实验和免疫共沉淀实验。
结果
为了研究SHH1在基因组范围内对RdDM通路中的作用,产生了野生型Col植株、shh1突变植株和一些其它RdDM突变体的siRNA谱,用于进行比较。在野生型植株中,界定了~12,500个siRNA簇,代表全部独特地映射的24ntsiRNA的84.2%。与以前的发现结果一致,这些siRNA的81.4%是Pol-IV依赖性的(Mosher等人,2008;Zhang等人,2007)(图1A)。在shh1突变体中减少的siRNA簇的分析证实了SHH1是siRNA水平的主要调控因子,影响了44%的Pol-IV依赖性簇,这代表了全部24ntsiRNA的大多数,包括在两个下游RdDM突变体(drm2和pol-v)中减少的簇的大多数(图1B)。在这些突变体中减少的siRNA簇的重叠形成四个主要亚类(称为仅pol-iv、shh1、shh1/drm2/pol-v和drm2/pol-v;图1B),将其用于后续分析。仅依赖于Pol-IV的簇比还依赖于SHH1、DRM2和Pol-V的那些在近着丝粒异染色质(pericentromericheterochromatin)中更加丰富(图1C),表明在常染色质臂和近着丝粒异染色质中,不同的机制可能控制siRNA产生。
在shh1突变体中,SHH1-依赖性簇(shh1和shh1/drm2/pol-v亚类)处的siRNA水平被降低到接近于零,而SHH1-非依赖性簇处的siRNA水平经历很少至没有变化(图1D)。这些结果证明,SHH1是基因座特异性的RdDM组分,其在RdDM基因座的一个大子集处具有强烈的影响。值得注意的是,两个下游RdDM突变体(drm2和pol-v)对在还需要SHH1的簇(shh1/drm2/pol-v亚类)处的siRNA水平具有最强的影响,并且这些相同的簇在产生最高siRNA的簇之中,并且对应于基因组中CHH甲基化的最高水平(Cokus等人,2008)(图1D、1E)。总之,这些发现结果表明,SHH1和下游RdDM突变体特异性地趋同(converge)以控制在RdDM的最具活性的位点处的siRNA水平。
使用全基因组亚硫酸氢盐测序(BS-seq),我们评价了在显示出降低的siRNA水平的基因座处的DNA甲基化水平,并发现和SHH1与Pol-IV的相互作用一致,SHH1是上游RdDM组分;shh1突变体只影响其中siRNA水平降低的位点处的DNA甲基化(图1E)。此外,如对上游RdDM组分预测的,在shh1突变体中存在的残留的siRNA表现出靶向一些甲基化,这与下游突变体drm2和pol-v相反,其将甚至大量保留siRNA的位点处的DNA甲基化降低到接近pol-iv水平(图1E),这可能是由于不能利用siRNA靶向DNA甲基化的缘故。
在对应于siRNA簇的shh1/drm2/pol-v和drm2/pol-v亚类的基因座处,所观察到的siRNA的损失伴随着相应较大的DNA甲基化损失(图1E)。但是,在仅pol-iv和shh1亚类处,siRNA的较大损失伴随着相对较小的DNA甲基化损失。不希望囿于理论,认为对于该发现结果的可能的解释是其它DNA甲基化通路在对应于仅pol-iv和shh1siRNA簇的位点处更加有活性。除了RdDM通路之外,DNA甲基化还受两个维持性甲基转移酶通路控制(Law和Jacobson,2010):作用是维持CG甲基化的DNA甲基转移酶1(MET1)通路,并且与一些H3K9组蛋白甲基转移酶一起作用以维持CHG和一些CHH甲基化的染色质甲基化转移酶3(CMT3)通路(Cao等人,2003)。与甲基转移酶冗余的这个见解一致,具有减少的siRNA簇的仅pol-iv和shh1亚类表现出最高水平的CMT3占据(Du等人,2012)(图1F),表明在不存在功能性RdDM通路的情况下,CMT3通路能够在这些基因座处将DNA甲基化维持在接近野生型的水平。相反,在RdDM突变体中表现出大幅度DNA甲基化损失的shh1/drm2/pol-v和drm2/pol-v亚类,表现出更低水平的CMT3富集(图1F),并且更为高度地且精确地富集Pol-V聚合酶(Zhong等人,2012)(图1F、1G),表明它们主要被RdDM通路靶向。
通过最大Pol-IV亚基NRPD1的加Flag标签形式的染色质免疫沉淀(Law等人,2011)以及随后的高通量测序(ChIP-seq),确定野生型和shh1突变体背景中Pol-IV占据的全基因组谱。与Pol-IV依赖性siRNA簇的谱一致,Pol-IV在近着丝粒异染色质处以及在界定的siRNA簇的亚类处广泛富集(图2A、2B)。在shh1突变体背景中,Pol-IV水平大幅度降低,或在shh1依赖性siRNA簇处被特异性消除(图2A),进一步支持了ChIP-seq谱的生物相关性,并证实了shh1突变体的siRNA减少的表型是由于改变的Pol-IV染色质缔合。在shh1非依赖性siRNA簇处,Pol-IV水平与siRNA水平类似,在shh1突变体中未减少(图2A),表明Pol-IV靶向这些基因座需要替代性的机制。
除了评价Pol-IV跨受影响的siRNA簇亚类的富集水平,使用多重ChIP-seq数据集界定了928个可重复的高可信度的Pol-IV峰。这些峰针对siRNA和DNA甲基化被富集,并且与仅pol-iv和shh1簇相比优选与产生高siRNA的shh1/drm2/pol-v或drm2/pol-v簇重叠(P<2.2e-16,Fisher精确检验),表明ChIP程序优选鉴定了其中Pol-IV最有活性的位点。在928个界定的Pol-IV峰中,观察到可变水平的SHH1-依赖性,提示将这些峰分为三个种类,SHH1-非依赖性的,SHH1-依赖性的和SHH1-增强性的。在shh1突变体中,DNA甲基化和siRNA水平在SHH1-依赖性的位点处降低,并且在被界定为SHH1-非依赖性的位点处为更小的程度的降低。但是,siRNA和Pol-IV水平在shh1突变体中的SHH1-增强性位点处增加,表明Pol-IV重新分布至shh1突变体中的这些位点。这些SHH1-增强性位点在Pol-IV峰中是独特的,因为它们表现出非常低水平的Pol-V富集,这能够解释在野生型植株中的这些位点处观察到的相应低水平的CHH甲基化。与SHH1-依赖性的siRNA簇的分析一起,这些发现结果证实了SHH1在促进RdDM的最活跃位点的子集处的Pol-IV染色质缔合中起到至关重要的作用。因此,SHH1代表已知影响Pol-IV的靶向作用的第一个因子,控制了RdDM的起始。
为了深入研究SHH1藉以促进Pol-IV靶向作用的机制,研究了它的SAWADEE结构域的功能,所述SAWADEE结构域是具有未知功能的植物特有的结构域(Mukherjee等人,2009)。图10中示出了来自不同物种的SHH1蛋白的序列比对。使用活性基序修饰的肽阵列测试了SAWADEE结构域结合修饰的组蛋白尾部的能力。该测定表明,SAWADEE结构域具有对H3K9甲基化的偏好性,但是还受到H3K4残基的甲基化状态的影响,只有未修饰的或H3K4me1修饰被容许。为了证实这些结果,使用修饰的组蛋白尾肽进行等温量热法(ITC)实验(图3A、3B)。这些分析表明,SAWADEE结构域在其与所有三种H3K9甲基化状态(me1、me2和me3)结合的能力方面是非常独特的,具有非常相似的亲和力,Kd≈2μM,所述亲和力比使用未修饰的H3肽所观察到的高大约17倍(图3A)。ITC实验还证实,尽管SAWADEE结构域将结合包含H3K4me1修饰的H3K9me2肽,H3K4me2或H3K4me3修饰的存在导致降低的结合亲和力。最后,使用修饰的肽的ITC实验证实了SHH1SAWADEE结构域对于H3K9甲基化的特异性,所述修饰的肽对应于在核心组蛋白蛋白质的N末端尾部的所有其它已知的甲基化的赖氨酸残基(图3B)。总之,这些结合研究证实,SAWADEE结构域是一种新的染色质结合模块,其探测H3尾部的K4和K9位置,并且特异性结合抑制性H3K9甲基修饰。
与体外观察到的SHH1SAWADEE结构域的结合特异性一致,对于H3K9me2,SHH1-依赖性的Pol-IVChIP-seq峰被富集(图3B)。对于H3K4甲基化,Pol-IVChIP-seq峰被耗尽。
为了确定SHH1SAWADEE结构域识别甲基-赖氨酸的模式,解析了游离状态的或在与修饰的H3尾部的复合物中的该结构域的晶体结构。在游离状态中,SHH1SAWADEE结构域采用串联Tudor结构域样折叠,其在Tudor2亚结构域中包含独特的锌结合基序(图3D),使得SHH1成为串联Tudor结构域折叠的新亚类的创始成员(Bian等人,2011)。在该结构中,锌离子被高度保守的半胱氨酸和组氨酸残基配位(Mukherjee等人,2009)。DALI检索表明,尽管仅共享11.8%的序列同一性,SAWADEE结构域的总体结构类似于UHRF1串联Tudor结构域,具有r.m.s.d.为(Holm和Rosenstrom,2010;Nady等人,2011)。该发现结果证实了虽然SAWADEE结构域的序列是植物特有的,但是它的折叠在真核生物中高度保守的。
还解析了在与H3K9me1、H3K9me2和H3K9me3肽的复合物中的SHH1SAWADEE结构域的结构,并且所有三种肽以相似的方式被结合。进一步分析了解析的具有H3(1-15)K9me2肽的结构(图4A)。该肽定向性地结合在两个Tudor亚结构域之间的沟中,与两个亚结构域形成接触(图4A、4B、4C)。SAWADEE结构域的游离的和H3K9me2结合的结构能够被很好地叠合(图4D),证实了配体结合后SAWADEE结构域中不存在显著的构象变化,这一发现与报道的UHRF1的情况(Nady等人,2011)不同。
在SHH1SAWADEE结构域中,存在两个口袋,所述两个口袋与被结合的肽的未修饰的K4和K9me2侧链形成分子间相互作用(图4E、4F)。未修饰的H3K4侧链插入到由来自Tudor1和Tudor2亚结构域二者的残基形成的界面口袋中。在该口袋中,经由与Glu130和Asp141的侧链的分子间氢键和静电相互作用,稳定K4侧链(图4E)。H3K9me2侧链插入由Tudor1亚结构域的残基形成的疏水性芳香族笼中(图4F),其中通过阳离子-π相互作用以与之前报道的甲基化的赖氨酸结合模块的那些(Taverna等人,2007)的类似方式稳定所述H3K9me2侧链。H3K9me3-SAWADEE和H3K9me1-SAWADEE复合物也将甲基化的赖氨酸置于相同的芳香族笼中。不希望囿于理论,认为SAWADEE结构域与所有三种H3K9甲基化状态等同结合的能力,可以被结构观察结果良好地解释:通过常见的与芳香族笼的疏水性相互作用,甲基化的赖氨酸识别性芳香族笼能够容纳H3K9me2和H3K9me3侧链二者,导致这两个甲基化状态之间缺乏差异。在H3K9me1复合物中,虽然更低的赖氨酸甲基化状态具有降低的与芳香族笼的疏水性相互作用,His169的侧链经历了小的但是显著的构象变化以与K9me1铵质子形成氢键,从而有助于结合亲和力的恢复。这种对K9甲基化状态的特异性的缺乏,与观察到的对UHRF1的串联Tubor结构域的更高水平的甲基化特异性相反,所述UHRF1的串联Tubor结构域具有稍微更宽的芳香族笼结合口袋,所述芳香族笼结合口袋包含Phe和Tyr残基的不同组合。不希望囿于理论,认为这导致不同的形状互补性需求。结构分析指示了在串联Tudor结构域折叠中非常精细的变化如何能够导致甲基-赖氨酸特异性的精细转变。
还解析了在与H3(1-15)K4me1K9me1肽的复合物中的SAWADEE结构域的结构。总体来说,该结构类似于具有H3K9me2肽的结构,在相同的K4结合口袋中容纳K4me1。但是,甲基基团与Leu201形成稳定的疏水性相互作用,取代了未甲基化的K4的铵质子与Glu130侧链之间形成氢键(图4G)。由于该K4结合口袋相对封闭和窄,K4的更高的甲基化状态可能会引起空间冲突和/或干扰所有氢键相互作用。不希望囿于理论,认为这解释了观察到的亲和力的降低。
为了测试观察到的SHH1SAWADEE结构域的甲基-H3K9结合活性的生物学显著性,在两个赖氨酸结合口袋中以及锌结合基序中产生点突变。分析了这些突变对体内DNA甲基化、siRNA水平和Pol-IV募集的影响。具体地,将这些点突变工程化到SHH1-3xMyc-BLRP-构建体中,并转化到shh1突变背景中。通过DNA印迹评价了良好表征的基因座MEA-ISR处的DNA甲基化水平,并通过BS-seq实验评价基因组范围的DNA甲基化水平(图4H)。添加了野生型SHH1-3xMyc-BLRP转基因恢复的DNA甲基化,但是,尽管以与野生型SHH1-3xMyc-BLRP蛋白相当的水平表达,具有在H3K9或H3K4口袋中的突变的构建体不能够完全弥补在shh1突变体中观察到的甲基化缺陷(图4H)。锌配位残基中的突变导致几乎不可检测的水平的蛋白,并因此未被进一步表征。
与shh1无效突变体相似,在SHH1赖氨酸结合口袋突变体中的DNA甲基化缺陷在受影响的siRNA簇的shh1/drm2/pol-v亚类中是最显著的(图4H),并且与它们的位置和预测的对SHH1SAWADEE结构域的结合亲和力的贡献一致,F162AF165A和D141A突变体表现出更强的DNA甲基化缺陷(图4H)。与观察到的DNA甲基化的减少相一致,经由siRNA-seq实验对赖氨酸结合口袋突变体的siRNA水平的评价表明F162AF165A和D141A突变体的类似模式的缺陷,再次表现出更强的表型(图4I)。为了确定观察到的siRNA和DNA甲基化的损失是否反应Pol-IV在染色质处的活性的缺陷,在SAWADEE结构域点突变体背景中进行Pol-IVChIP实验。所有四个点突变体表现出降低水平的Pol-IV在两个生物重复中的占据(图4J)。另外,免疫共沉淀表明,SHH1SAWADEE结构域点突变体仍然能够与PolIV相互作用,证明了SHH1与PolIV复合物之间的相互作用不依赖于它的H3K9me结合活性。总之,这些发现结果表明,在K4和K9结合口袋中的残基对于SHH1的体内功能是至关重要的,并且证实了通过SHH1的甲基-H3K9结合在PolIV与染色质缔合的水平的作用。
发现H3K4结合口袋对于SHH1的体内功能是重要的。在不存在H3K9甲基化的情况下SHH1SAWADEE不会结合H3K4甲基化,并且向K4添加甲基基团不会给予任何另外的结合亲和力。不希望囿于理论,认为在从甲基化的H3K9残基往回5个残基的位置处仅存在赖氨酸是SAWADEE结构域结合所必需的。这类双赖氨酸读取能够用来帮助确认,SAWADEE结构域仅在当赖氨酸甲基化存在于H3尾部的K9位置处时才结合赖氨酸甲基化,这与甲基化的赖氨酸在H3尾部上或甚至在不同组蛋白或非组蛋白蛋白质上的不同位置处相反。使用具有H3K4A突变的H3尾部,在存在或不存在H3K9me2修饰的情况下,进行ITC实验。SAWADEE结构域以比与H3K9me2肽的约30倍更弱的亲和力结合H3K4AK9me2肽。此外,SHH1SAWADEE结构域以比与野生型H3尾部的更弱的亲和力结合H3K4A肽,证实了K4残基独立于K9残基的甲基化状态而促成结合。
总之,这些体内和体外分析证实了SHH1SAWADEE结构域在K4和K9位置处探测H3尾部,并且对于存在于转座子和其他重复DNA元件处的组蛋白修饰的组合,即未修饰的H3K4和甲基化的H3K9具有非常高的选择性。虽然在基因组范围内,H3K9甲基化与H3K4甲基化呈反相关(Zhang等人,2009)。不希望囿于理论,认为SAWADEE结构域对更高等级的H3K4甲基化的排斥能够用来允许与H3K4甲基化相关的转录,目的是以发育特异性或基因座特异性的方式克服DNA甲基化和相关的抑制性H3K9甲基修饰。同样,SAWADEE结构域的特异性能够抑制在体内被甲基化的基因处的siRNA的产生,所述被甲基化的基因包含CG甲基化和H3K4甲基修饰,但是缺乏CHG和CHH甲基化以及siRNA(Cokus等人,2008;Zhang等人,2009;Zhang等人,2006)。
综上所述,证实了SHH1是一种新的染色质结合蛋白,其在RdDM中发挥功能以使Pol-IV能够在最活跃地靶向的基因座处的募集和/或稳定,以促进siRNA生物发生。不希望囿于理论,认为SHH1与抑制性组蛋白修饰结合的发现结果,以及SHH1是在与下游RdDM突变体类似的一组基因座处的Pol-IV染色质缔合所必需的观察结果,能够解释之前观察到的自我加强环路(self-reinforcingloop),其中下游RdDM突变体是从一个亚组的基因座产生完全水平的siRNA所必需的(Zilberman等人,2004;Xie等人,2004;Li等人,2006;Pontes等人,2006),因为已经表明下游RdDM突变体能够引起RdDM基因座处的DNA甲基化和H3K9甲基化二者的降低(Zilberman等人,2003)。
实施例2
以下实施例涉及拟南芥蛋白SUVH2和SUVH9的表征和其参与促进RNA指导的DNA甲基化和基因沉默。
引言
所有DNA甲基化和很多非CG甲基化的维持的确立涉及RNA指导的DNA甲基化(RdDM)通路(Aufsatz等人,2002;Pelissier和Wassenegger,2000)。不希望囿于理论,认为在该通路中存在两个主要步骤,所述两个主要步骤被认为靶向DNA甲基转移酶、结构域重排甲基转移酶2(DRM2)(Cao和Jacobsen,2002)。第一个上游步骤涉及通过RNA聚合酶IV(PolIV或NRPD)、RNA指导的RNA聚合酶2(RDR2)和DICER样3(DCL3)的协同作用合成24个核苷酸的小干扰RNA(siRNA)(Pontier等人,2005)。第二个下游步骤涉及通过RNA聚合酶V(PolV或NRPE)在DDR复合物(DRD1,一种SWI/SNF2染色质重塑酶(remodeler);DMS3,一种染色体架构蛋白;RDM1,未知功能)的帮助下,产生支架转录物。不希望囿于理论,然后认为负载有24个核苷酸siRNA的ARGONAUTE4(AGO4)与PolV转录物结合,并且以未知方式发挥作用以指导DRM2至DNA用于甲基化(Law等人,2010;Pikaard等人,2008;Wierzbicki等人,2009)。
该实施例证实了PolV转录以及其与染色质的稳定结合依赖于基因组范围内的SUVH2/SUVH9。这些PolV结合位点在DNA甲基化且在许多情况下,在组蛋白H3K9甲基化的情况下被富集。此外,表明将SUVH2拴系至未甲基化的表观等位基因fwa-4导致FWA基因的DNA甲基化和沉默的确立。该甲基化的确立与PolV的募集一致,但是与组蛋白甲基化的立即富集不一致,表明组蛋白甲基化对于DNA甲基化的确立是次要的。还显示出了SUVH9的晶体结构,从而明确了该酶家族中的组成结构域的折叠和相对朝向。在N末端附近的双螺旋束位于SRA和pre-SET/SET结构域之间,并与SRA和pre-SET/SET结构域相互作用。观察到不完全形成的SAM辅因子结合口袋以及在SUVH9的结构中不存在组蛋白肽底物结合裂缝,表明在该酶中不存在post-SET结构域。不希望囿于理论,认为这可以解释其缺乏体外甲基转移酶活性。这些结果表明,SUVH2和SUVH9在将PolV募集至染色质中发挥作用,为PolV提供了一种读取表观遗传标志以指导其活性的方法。
材料和方法
生物材料
使用的所有植株都具有拟南芥哥伦比亚型(Col-0)登记,WT指亲本植株。之前描述了nrpe1-12T-DNA(SALK_033852)、suvh2suvh9双突变体株系、suvh4suvh5suvh6三突变体株系(Johnson等人,2008;Pontier等人,2005)。将NRPE1-FLAG转基因植株(El-Shami等人,2007)与suvh2suvh9双突变体杂交,并鉴定了纯合的F2植株。从哥伦比亚背景中的met1分离群中分离fwa-4表观等位基因。
PolV转录和染色质免疫沉淀
使用TRIzol试剂(Invitrogen)从花中分离总RNA,并用于使用SuperScriptIII(Invitrogen)合成第一链cDNA。在MxPro3000qPCR仪(Stratagene)中遵循制造商的说明使用SYBRGreenSuperMix(Bio-Rad)进行实时PCR。使用1-2克的3周龄的植物或花进行ChIP,并如以前描述的(Zhong等人,2012)在体内或体外用1%甲醛交联。从Upstate(#07-450)获得抗-H3K9me1,从Abcam(ab1220)获得抗-H3K9me2,并且抗-NRPE1来自CraigPikaard的惠赠。
文库产生
使用来自NEB的配对末端试剂和来自Illumina的衔接子产生组蛋白ChIP-seq的文库。使用NuGenmultiplex试剂盒产生NRPEChIP-seq的文库。如以前报道的(Feng,2011)产生BS-seq文库。使用HiSeq2000平台遵循制造商的说明(Illumina)以50bp的长度对所有文库测序。
比对
分别使用BS-seeker和bowtie将亚硫酸氢盐-Seq和ChIP-seq比对到TAIR8版本的拟南芥参考基因组上,允许多达2个错配。只考虑独特映射的读段。标准化ChIP-seq文库,使得所有文库会包含相等数目的读段。将跨NRPE1位点的NRPE1-Flag的富集(Zhong等人,2012)针对在哥伦比亚中的FlagChIP(阴性对照)标准化。将跨NRPE位点的组蛋白甲基化针对确定包含基线水平的组蛋白甲基化的80个位点甲基化。这些精心挑选的位点在明确可以映射的区域,但是还具有低组蛋白甲基化的其他特征性的标志,例如接近基因和低DNA甲基化。
Zn指构建体
如Segal等人(Segal等人,2003)中的描述的设计包含6个Zn指的肽,并克隆到pUC57中,所述肽的两端为XhoI位点(Genewiz)。切下该XhoI片段,并插入到pENTR-SUVH2构建体(Johnson等人,2008)中的位于BLRP肽和HA标签之间的唯一XhoI位点中,所述pENTR-SUVH2构建体编码由内源性SUVH2启动子驱动的HA-加标签的SUVH2。然后将该ZF-SUVH2重组到JP726(Johnson等人,2008)中,并使用农杆菌介导的转化将其引入fwa-4中。使用BASTA筛选转化的株系。
开花时间
通过计数直至最后开花的所有莲座叶和茎生叶,确定在短白昼的条件下生长的植物的开花时间。确定20-30个植株的平均叶片数。
蛋白质制备
将N-末端截短的SUVH9(残基134-650)克隆到pFastBacHTB载体(Invitrogen)中,其将后面带有TEV裂解位点的六组氨酸标签融合至靶基因的N-末端。将质粒转化到大肠杆菌菌株DH10Bac(Invitrogen)中,以产生杆粒。通过遵循标准Bac-to-Bac方案(Invitrogen)用杆粒转染Sf9细胞,产生杆状病毒。随后将收获的病毒用于感染悬浮的Hi5细胞,用于重组蛋白表达。使用镍亲和层析柱(GEHealthcare)首先纯化重组蛋白。通过TEV蛋白酶裂解六组氨酸标签。使用Qsepharose柱和SuperdexG200凝胶过滤柱(GEHealthcare)进一步纯化靶蛋白。将纯化的蛋白浓缩至15mg/ml,并保存于-80℃。
结晶
晶体筛选之前,在4℃下将SUVH9蛋白与推测的辅因子S-腺苷-L-同型半胱氨酸(SAH)以1:3的摩尔比混合,或将SUVH9蛋白与SAH和组蛋白H3(1-15)肽以1:3:3的摩尔比混合,持续2小时。在20℃下使用悬滴气相扩散法,通过混合1μl的浓度为11.5mg/ml的蛋白样品和1μl储液器溶液并对500μl储液器溶液平衡,进行SUVH9的结晶。在0.2M硫氰酸钾、0.1MBis-Tris丙烷pH7.5和20%游离形式的PEG3350的条件下,以及在存在SAH的情况下或在存在SAH和H3(1-15)肽的条件下,进行SUVH9结晶。2周内出现方形晶体。将所有晶体浸入补充有15%甘油的储液器溶液中,并快速冷却到液氮中,用于衍射数据的采集。在纽约Brookhaven国家实验室(BNL)的国家同步幅射光源(NSLS)的光束线X29A处在锌峰波长处采集衍射数据。使用程序HKL2000(Otwinowski和Minor,1997)对数据进行索引、整合和进一步依比例处理。
结构确定和精修
用在程序Phenix(Adams等人,2010)中执行的单波长反常散射法,解析游离状态的SUVH9的结构。使用程序Coot(Emsley等人,2010)进行模型建立,并使用程序Phenix(Adams等人,2010)进行结构精修。在整个精修过程中,使用5%随机选择的反射来计算自由R因子。使用程序Procheck(Laskowski等人,1993)分析立体化学的结构模型。数据表明,在存在SAH的情况下以及在存在SAH和H3(1-15)肽的情况下,SUVH9的晶体事实上是游离形式SUVH9的晶体。使用程序Pymol(DeLanoScientificLLC)生成所有的分子图。
结果
通过PolV合成非编码RNA对RdDM中的下游步骤是重要的。为了确定SUVH2/SUVH9在这些转录物的合成之前或之后是否起作用,在若干表征的位点(图5A中所示的IGN22和P6)处测定PolV转录(Wierzbicki等人,2008;Zhong等人,2012)。发现双突变体suvh2suvh9使PolV转录物降低至与PolV突变体nrpe1相同的程度(图5A)。这些结果表明,SUVH2/SUVH9是PolV活性或PolV募集至染色质所需要的。使用Flag-加标签的PolV的染色质免疫沉淀(ChIP)观察到,与野生型中的6倍富集相比,发现在suvh2suvh9双突变体中在IGN5和IGN22处只有背景水平的PolV结合(图5B)。通过下一代测序进一步分析ChIP数据(ChIP-seq),并发现PolV在所有之前鉴定的位点(Zhong等人,2012)处的结合在suvh2suvh9背景中显著降低(图5C、5D)。因此,SUVH2和SUVH9不仅是PolV活性所需要的,还是PolV与染色质的稳定缔合所需要的。
为了确定多个突变体中的PolV结合位点处的DNA甲基化水平,进行全基因组亚硫酸氢盐测序。发现suvh2suvh9突变体株系使CHH甲基化减少了85%,这接近在nrpe1突变体株系中测量的甲基化降低(图5E)。这些相同的突变体株系使CHG甲基化减少了多于50%,强调了RdDM通路也部分负责CHG甲基化(Law和Jacobsen,2010)。这些结果证实了在基因组范围内的PolV位点处的RNA指导的DNA甲基化依赖于SUVH2和SUVH9。发现在PolV位点处的甲基化还部分依赖于SUVH4/SUVH5/SUVH6/CMT3通路,因为suvh4suvh5suvh6三突变体使在PolV位点处的CHG甲基化减少了大约75%(图5E;在cmt3突变体中观察到类似的降低)。
由于SUVH2/SUVH9与SUVH4/SUVH5/SUVH6在同一SET蛋白质家族中,通过ChIP-seq使用对H3K9me1和H3K9me2特异性的抗体,分析基因组范围内的组蛋白H3K9甲基化。观察到非CGDNA甲基化与H3K9me1和H3K9me2之间的高度相关性。双突变体suvh2suvh9未显著影响基因组范围内的H3K9me1或H3K9me2的水平,而三突变体suvh4suvh5suvh6的H3K9me1和H3K9me2都具有显著降低。映射跨PolV结合位点的H3K9me1和H3K9me2,并发现二者相对于基因组平均值均被富集,虽然发现H3K9me1处于比H3K9me2更高的水平。在suvh4suvh5suvh6三突变体植株中,在所有PolV位点处的H3K9me1都被降低至背景水平,而suvh2suvh9双突变体导致组蛋白甲基化的显著损失(图5F)。任何突变体中的H3K9me2都未显著改变。
不希望囿于理论,认为虽然在suvh2suvh9双突变体中观察到的损失可能是直接的,但是若干证据线索支持组蛋白甲基化的这些降低是降低的DNA甲基化的次级结果。首先,在一些位点处,H3K9me1是一片较大的异染色质的部分,并且不受suvh2suvh9的影响,而在其他位点处,DNA甲基化和H3K9me1均损失。此外,发现第三类位点不具有可检测的H3K9me1,但是其具有SUVH2/SUVH9依赖性的DNA甲基化。第二,在另一个RdDM突变体rdr2中,在这些相同的位点处观察到组蛋白甲基化的类似的减少。因此,可能的是,SUVH2/SUVH9发挥功能以募集PolV,导致RdDM,其然后募集活性组蛋白甲基转移酶SUVH4、SUVH5和SUVH6。这些酶通过它们的SRA结构域结合甲基化的DNA,并甲基化缔合的组蛋白。不希望囿于理论,认为最可能的是,suvh2suvh9双突变体中H3K9甲基化的损失是RNA指导的DNA甲基化的损失的间接结果。
为了直接测试SUVH2/SUVH9的作用是否可以足以靶向RNA指导的DNA甲基化,工程化了特定的锌指(ZF),所述锌指(ZF)将SUVH2拴系至FWA的未甲基化的表观等位基因fwa-4(fwa-4是哥伦比亚中的未甲基化的FWA表观等位基因,fwa-1是Landsbergerecta生态型中的未甲基化的表观等位基因)。FWA基因编码同源结构域转录因子,所述同源结构域转录因子由于其启动子中的DNA甲基化而通常被沉默(Soppe等人,2000)。FWA表观等位基因损失了全部DNA甲基化,导致FWA的异位表达和可遗传的晚开花(Kakutani,1997;Soppe等人,2000)。通常参与靶向DNA甲基化的siRNA仍然存在于FWA表观等位基因中,但是似乎不能指导下游因子以甲基化启动子(Chan等人,2006)。不希望囿于理论,认为在一个模型中,虽然存在siRNA,但是丢失了转录它的PolV支架。FWA启动子区包含两个小的同向重复段,其后是两个较大的重复段(Kinoshita等人,2007)。设计包含六个ZF的肽,以识别在两个小的重复段的每一个中可见的序列(CGGAAAGATGTATGGGCT)(SEQIDNO:141)(Kolb等人,2005;Segal等人,2003)。然后将该肽的编码区插入到由内源性SUVH2启动子驱动的HA-加标签的SUVH2转基因中(ZF-SUVH2),并使用农杆菌介导的转化将其引入fwa-4株系中(图6A)。
在T1植株中,大约75%的ZF-SUVH2转化株与亲本fwa-4株系相比开花早。不包含Zn指的HA-加标签的SUVH2(HA-SUVH2)对照株系的转化株在与fwa-4亲本相同的时间开花,表明该作用是ZF-SUVH2融合物特有的。对包含ZF-SUVH2或HA-SUVH2的T1植株执行至T2代,并确定开花时间(图6A、6B)。包含ZF-SUVH2的株系开花仅比哥伦比亚(WT)对照稍晚,而不包含Zn指的HA-SUVH2在与fwa-4亲本大约相同的时间开花。这些结果表明,ZF-SUVH2事实上靶向FWA启动子,并且引起转录抑制。
使用亚硫酸氢盐测序分析FWA启动子区域中的DNA甲基化。在野生型株系中,检测到大区域的DNA甲基化,具有特别高水平的CG甲基化(图6D)。在fwa-4中,该区域完全没有DNA甲基化。在fwa-4中包含ZF-SUVH2的三个独立的T1株系中,观察到不同于WT的甲基化谱。在所有三个序列环境中,在紧邻Zn指结合位点周围的DNA甲基化处于高水平。然后DNA甲基化随着下游被转录区域而逐渐减少(图6E)。在对照HA-SUVH2T1植株中,在FWA处未观察到DNA甲基化。这些结果表明,使用ZF将SUVH2靶向至FWA足以引起DNA甲基化和基因沉默。
为了确定PolV是否存在于fwa-4表观突变体中的FWA处,在野生型、nrpe1和fwa-4株系的ChIP实验中使用针对NRPE1的内源性抗体。在野生型和fwa-4株系中观察到在两个已知的PolV位点IGN5和IGN22处的PolV的富集,但是在nrpe1突变体植株中则未观察到(图7A)。当检查FWA基因座时,在野生型中观察到在启动子和转录区二者处的富集,但是在nrpe1或fwa-4中则未观察到(图7A)。因此,当PolV在野生型中处于其DNA甲基化的和沉默的状态时PolV存在于FWA位置处,但是当PolV在fwa-4表观等位基因中处于未甲基化的状态时则不存在于FWA位置处。为了确定ZF-SUVH2与FWA启动子的结合是否募集PolV,在fwa-4中包含ZF-SUVH2的T2株系中进行NRPE1ChIP。与亲本fwa-4株系不同,在存在ZF-SUVH2的情况下,观察到PolV在FWA处的富集(图7A),表明ZF-SUVH2靶向作用起作用以募集PolV或稳定在FWA处的PolV。
还测定了不同株系中FWA的组蛋白甲基化状态。在野生型株系中,观察到H3K9me1在FWA启动子区中的轻微富集以及在FWA转录区中的4倍富集(图7B)。在fwa-4株系中,未观察到富集。未检测到在早开花的ZF-SUVH2/fwa-4T1植株中的H3K9me1的富集(图7B)。但是,在来自这些植株的下一代(T2)中,观察到H3K9me1的轻微富集,启动子区比转录区稍强(图7C)。这些结果表明,虽然在第一代中ZF-SUVH2立即募集PolV和DNA甲基化,组蛋白甲基化未立即恢复,但是在将植株同系交配获得另一代之后会累积。
为了获得对SUVH2/SUVH9功能的另外的研究,进行了两个蛋白质的结构分析。通过蛋白质结晶,解析了N-末端截短的SUVH9构建体(残基134-650)的结构,所述结构代表拟南芥SUVH家族包含SRA-SET盒的蛋白质的第一结构视图。预测SUVH9的前130个残基是无序的并且与任何已知的结构域不具有同源性,同时其余的残基包含SUVH9的所有已知的功能性结构域(SRA、pre-SET和SET结构域)(图8A)。使用单波长反常散射法确定SUVH9的结构,并精修至的分辨率,R因子为18.7%,并且Rfree为22.3%(图8B)。SUVH9的结构包含三个区段:朝向N-末端的双-螺旋束(残基138-194)、SRA结构域(残基195-379)和pre-SET/SET结构域(残基380-637)(图8B)。
SUVH9结构的独特特征是朝向N-末端的双-螺旋束的形成和定位,所述双-螺旋束夹在SRA结构域和pre-SET/SET结构域之间,从而与它们二者相互作用。两个α-螺旋之间的界面富含疏水性残基,所述疏水性残基参与广泛的范德华相互作用,补充有在较短的第二螺旋的Arg178和Lys182之间插入较长的第一螺旋的Glu166后的盐桥形成(图8C)。这些疏水性相互作用和盐桥使两个螺旋的相对位置稳定,并充当用于将SRA结构域和pre-SET/SET结构域锚定在双-螺旋束的任一侧的支架,从而导致形成整个蛋白的总体牢固的拓扑结构。
双-螺旋束深埋在SRA结构域和pre-SET/SET结构域的界面处,其相对排列通过形成广泛的疏水性和亲水性相互作用而被稳定。双-螺旋束的较长的第一螺旋(残基138-169)插入SRA和pre-SET/SET结构域之间的界面。较长的螺旋的N-末端区段非常疏水,并与周围残基形成若干对盐桥和氢键(图8D)。相比之下,该螺旋的C-末端部分包含大的且连续疏水性的表面,所述表面与较短的第二螺旋(图8C)和蛋白的其他结构域(图8E)相互作用。一个长环从SET结构域中延伸出来(图8E),并覆盖较长的螺旋的外表面。该环的尖端包含若干疏水性残基(Leu559、Val562和Leu563),所述疏水性残基与较长的螺旋的一个面上的疏水性残基(Ile154、Leu158、Phe161和Leu162)形成广泛的范德华相互作用。不希望囿于理论,认为较长的螺旋区段可能在SUVH9蛋白的总体架构的稳定化中起重要的作用。较短的第二螺旋主要与较长的螺旋的C-末端部分相互作用(图8B、8C),辅以与SRA结构域的少许氢键和疏水性相互作用(图8F)。
SUVH9的SRA结构域类似于报道的来自UHRF1和SUVH5的SRA结构域的结构(Arita等人,2008;Avvakumov等人,2008;Hashimoto等人,2008;Rajakumara等人,2011)。SUVH9和SUVH5SRA结构域的叠合产生145个排列的α碳原子的的RMSD,与两个蛋白几乎相同的折叠一致,所述两个蛋白的核心元件包括六条链的扭曲的β-桶和两个α-螺旋。与在SUVH5SRA结构域中观察到的无序环不同,SUVH9SRA结构域的C末端形成α-螺旋,随后是短转角,且然后直接连接至pre-SET结构域。
通过SRA与pre-SET/SET结构域之间的广泛直接的相互作用以及通过与双-螺旋束的相互作用,使SRA与pre-SET/SET结构域之间的相对朝向稳定。SRA结构域与pre-SET/SET结构域之间的直接相互作用主要由疏水性相互作用占主导(图8G)。具体地,SRA结构域的C-末端延伸的α-螺旋使用疏水性表面以与pre-SET/SET结构域的连续疏水性表面相互作用,SRA结构域的α-螺旋侧翼的残基也有助于疏水性界面的形成。SUVH9的pre-SET/SET结构域的结构类似于发表的H3K9组蛋白甲基转移酶例如Dim5、G9a和GLP的结构(Wu等人,2010;Zhang等人,2002;Zhang等人,2003)。SUVH9的pre-SET/SET结构域与人类H3K9甲基转移酶GLP的叠合产生252个排列的α碳原子的的RMSD,虽然它们仅共有34%的序列同一性。如在其他SET结构域蛋白中通常观察到的,SUVH9的pre-SET结构域的9个保守的Cys残基与三个Zn2+离子配位以形成等边三角形簇(图8B)。
虽然SUVH9包含组蛋白甲基转移酶样pre-SET和SET结构域,它既未表现出可检测的组蛋白甲基转移酶活性,也未表现出对SAM辅因子的体外结合能力(Johnson等人,2008)。在一级序列中,虽然SUVH9保留有助于甲基转移酶活性的对应于人类GLP的Tyr1124和Tyr1211的两个Tyr残基(Tyr522和Tyr636)(Wu等人,2010;Zhang等人,2002;Zhang等人,2003),SUVH9缺乏对于辅因子和肽底物结合以及催化重要的post-SET结构域。人类GLP和SUVH9的pre-SET和SET结构域采取相似的折叠拓扑结构(Wu等人,2010)。在人类GLP中,SAH结合口袋相对窄,并且表现出显著的对SAH的结构和化学互补性(图9A)。此外,具有覆盖SAH的腺嘌呤部分能力的post-SET结构域的存在发挥作用以使该辅因子分子的结合稳定。相比之下,SUVH9的推测的SAH结合口袋开口很大(图9B),并且不能保持结合的SAH分子,特别是在不存在post-SET结构域的稳定作用的情况下。另外,通常SUV家族活性甲基转移酶利用来自SET结构域的一个Cys残基以及来自post-SET结构域的三个Cys残基以与Zn2+离子配位,以使post-SET结构域的富含环的区域的相对位置和构象稳定。相比之下,在SUVH9的SET结构域中,Cys残基被Thr替换,使得即使伴侣蛋白带来三个Cys残基,它仍然不可能形成Zn2+稳定的配位中心。
在包含SET结构域的H3K9甲基转移酶中,肽底物位于SET和post-SET结构域之间(图9C),并通过与酶形成广泛的主链和侧链分子间相互作用而被稳定。在人类H3K9甲基转移酶GLP中,SET结构域的酸性环区(残基1145-1153)参与识别肽底物(图9C)。相比之下,SUVH9中的对应区段包含富含疏水性残基的25个残基的插入环(图8H)。因为插入环通过与来自SET和pre-SET结构域的残基形成广泛的疏水性相互作用而被稳定(图8H),特别是环的尖端,其覆盖双-螺旋束并与双-螺旋束广泛地相互作用(图8H),插入环采取良好界定的拓扑结构。SUVH9结构的检查鉴定了在插入环和推测结合的肽底物之间具有空间位阻的可能性,从而阻止肽底物进入SUVH9蛋白的肽结合裂缝中(图9D)。
该实施例证实了SUVH2和SUVH9是将PolV募集至包含DNA甲基化的区域所需要的。此外,使用ZF-SUVH2融合物表明,SUVH2靶向作用足以将PolV和DNA甲基化募集至未甲基化的靶基因。不希望囿于理论,认为SUVH2和SUVH9的作用机制提供了之前存在的DNA甲基化和随后一轮的RAN指导的DNA甲基化之间的加强环路。
实施例3
以下实施例涉及修饰的拟南芥SHH1蛋白的产生和表征,所述SHH1蛋白被功能化以包含将所修饰的SHH1蛋白靶向至特定核酸序列的核酸结合结构域。在该实施例中,SHH1靶向至APETALA1基因座的启动子区域与伴随siRNA在APETALA1处的富集。
材料和方法
TAL-SHH1的构建
以前(Law等人,2011)描述了包含SHH1的Gateway入门克隆(entryclone),所述克隆包括1.4kb的启动子区域以及具有C末端的BLRP和3xMyc标签的ORF。通过定点诱变(QuickchangeII,Agilent)使用引物SHH1deltaBsaI_fo,5’-GGGAGAGTGAACGTTGGTGACCTGCTTCTATGTTT-3’(SEQIDNO:142)、SHH1deltaBsaI_re和5’AAACATAGAAGCAGGTCACCAACGTTCACTCTCCC3’(SEQIDNO:143)从SHH1入门克隆中去除BsaI识别位点。去除BsaI位点之后,通过用XhoI限制性消化而线性化入门克隆。为了将编码修饰的基于Hax3的转录激活因子样效应子(TALE)(Sanjana等人,2012)的DNA序列符合读框地插入到SHH1的C末端BLRP和3xMyc标签之间,其中所述转录激活因子样效应子排除了C末端核定位信号和酸性激活结构域、侧翼为GSSGSS接头,使用引物TALETFintotag_fo,5’-CCAAGGACCTCTCGAGGGATCTTCAGGTTCATCTTCGCGGACCCGGCTCCCT-3’(SEQIDNO:144)和TALETFintoSHH1Myc_re,5’-CATAGATCCCTCGAGTGAAGAACCAGATGATCCGCTAGCTGACGCGCGA-3’(SEQIDNO:145)从TALE转录激活因子(TALE-TF)质粒(Addgene)扩增包括ccdB选择盒的2.8kb的TALE骨架。使用In-FusionHD克隆系统(Clontech)将扩增的产物与线性化的入门克隆融合。通过GoldenGate克隆从18个单体-重复序列(Addgene)组装TALEDNA结合结构域,所述TALEDNA结合结构域靶向对应于APETALA1(AT1G69120)的启动子区域中1号染色体核苷酸位置25986363至25986381的序列5’-TTAGGATTTGCGTGTCGAC-3’(SEQIDNO:146),并将所述TALEDNA结合结构域插到ccdB选择盒侧翼的BsaI位点之间(Sanjana等人,2012)。列出了编码TALE靶重复序列的DNA序列(SEQIDNO:140)。为了促进TAL-SHH1融合蛋白与甲基化的胞嘧啶结合,使用重复可变的“双残基”(RVD)N*(Valton等人,2012)。通过分别使用引物NN>N*_fo,5’-GTGGCAATTGCGAGCAACGGGGGAAAGCAG-3’(SEQIDNO:147),NN>N*_re,5’-CTGCTTTCCCCCGTTGCTCGCAATTGCCAC-3’(SEQIDNO:148),NN>NH_fo,5’-GGCAATTGCGAGCAACCATGGGGGAAAGCAGGCAC-3’(SEQIDNO:149)和NN>NH_re,5’-GTGCCTGCTTTCCCCCATGGTTGCTCGCAATTGCC-3’(SEQIDNO:150),对TALE单体模板质粒pNN_v2(Addgene)定点诱变,产生编码单体RVDN*和NH的质粒。通过使用引物TALETF_NN>N*_fo,5’-TGGCTATTGCATCCAACGGGGGCAGACC-3’(SEQIDNO:151)和TALETF_NN>N*_re,5’-GGTCTGCCCCCGTTGGATGCAATAGCCA-3’(SEQIDNO:152)对pTALE-TF_v2(NN)(Addgene)定点诱变,产生编码RVDN*的TALE-TF质粒。使用LRclonaseII(LifeTechnologies)和包含hph选择标记的修饰的pEarlyGate302目标载体产生双元载体(Law等人,2011)。
植物材料
使用蘸花法通过根癌农杆菌菌株ABL0将TAL-SHH1构建体转化到生态型Col-0的shh1(SALK_074540)中(Clough和Bent,1998)。分别用潮霉素B选择T1植株,并通过蛋白质分离和使用针对3xMyc的抗体的蛋白质印迹测试嵌合TAL-SHH1蛋白的表达。选择表现出强的转基因表达的T1植株。
结果
选择包含被导向APETALA1基因的TAL-SHH1的植株之后,产生小RNA文库,并使用已确定的方案(Law等人,2013)对所述文库进行深度测序,以检测响应于将SHH1靶向启动子而在APETALA1基因处产生的小RNA的存在。作为对照,对来自野生型植株的小RNA进行测序,预测其不会包含存在于APETALA1的启动子区域中的siRNA。如图18所示,检测到了对应于TAL-SHH1植株而非野生型植株中的DNA的两条链的小RNA,表明修饰的SHH1蛋白能够将小RNA靶向至AP1启动子。
实施例4
以下实施例强调了经由SUVH2/SUVH9的DNA甲基化与PolV结合之间的关系,并证实了SUVH2与DRD1相互作用。
材料和方法
拟南芥中的实验方案
除了在以下缓冲液中使磨碎的组织与甲醛交联之外,按照Bernatavichute等人(2008)中的步骤,进行染色质免疫沉淀:10mMHEPESpH8.0、1M蔗糖、5mMKCl、5mMMgCl2、5mMEDTA,和0.6%TritonX-100。使用的所有引物列于以下表12中。使用OvationUltralowDRMultiplexSystem(NuGen)产生用于NRPE1ChIP-Seq的文库。如在Johnson等人(2008)中进行的,使用EZDNAMethylation-Gold试剂盒(ZymoResearch)进行亚硫酸氢盐测序,随后进行PCR扩增和FWA片段的克隆。按照实施例1中的描述产生BS-Seq文库,并使用HiSeq2000平台遵循制造商的说明(Illumina)以50bp的长度对所有文库进行测序。按照实施例2所述产生锌指构建体。
表12:引物列表
数据分析
使用BS-seeker将亚硫酸氢盐-Seq(BS-Seq)读段比对至TAIR10版本的拟南芥参考基因组。对于BS-Seq,允许最高达2个错配,并仅使用独特映射的读段。
免疫共沉淀实验
用pLJ322(JP7468中的ZF-HA-SUVH2)浸润本氏烟草(Nicotianabenthamiana),三天后收集叶片。将未浸润的叶片用作阴性对照。在液氮中磨碎3g组织,并将其重悬于12ml的包含1μg/ml抑肽素、1mMPMSF和1X完全蛋白酶抑制剂tab-EDTA(Roche)的IP缓冲液(50mMTrispH8.0、150mMNaCl、5mMMgCl2、10%甘油和0.1%NP40)中。将提取物过滤通过神奇滤布(miracloth),以3,000g离心5min。添加200μlHA-磁珠(MRL),并在4℃下旋转45min。用IP缓冲液洗涤3次后,然后将这些与以相同方式制备的DRD1-Flag拟南芥花提取物一起孵育。在4℃下旋转孵育持续45min。用IP缓冲液洗涤珠子3次,并在60μlSDS染料中煮沸。用抗-Flag-HRP或抗-HA-HRP抗体探测蛋白质印迹。进行拟南芥的免疫共沉淀(co-IP)实验,所述实验以来自表达HA-SUVH2、Flag-DRD1的植株,或包含HA-SUVH2和Flag-DRD1二者的T2植株的2g花起始。如上所述制备提取物,添加100μl的Flag-磁珠(Sigma),在4℃下旋转孵育45min。如上所述进行洗涤和蛋白质印迹。
结果
实施例2中呈现的结果阐明了与DNA结合结构域基序融合的SUVH蛋白如何能够被靶向至未甲基化的靶基因,以及将PolV和DNA甲基化募集至未甲基化的靶基因。图11中示出了多种SUVH蛋白的序列比对。实施例2还确立了SUVH2和SUVH9不仅是PolV活性所需要的,而且是它与整个基因组染色质稳定缔合所需要的。
为了确定SUVH2和SUVH9对限定的PolV结合位点处的DNA甲基化的影响,如实施例2所见利用全基因组亚硫酸氢盐测序(BS-Seq)。还分析了单突变体suvh2和suvh9的BS-Seq结果,以确定SUVH2/SUVH9是否在所有位点都冗余地作用,或者是否在它们发挥作用时具有非重叠位点。发现在PolV位点以及在suvh2或suvh9单突变体或者在suvh2suvh9双突变体中限定的差异性甲基化区域(DMR),suvh2具有比suvh9更强的作用(图12)。这些结果表明,SUVH2和SUVH9在整个基因组冗余地作用,以控制RNA指导的DNA甲基化。
不希望囿于理论,实施例2呈现的结果还表明,经由SUVH2/SUVH9的DNA甲基化和PolV结合之间存在加强的环路。为了进一步研究这一理论,利用保持性甲基转移酶MET1的突变,所述突变消除基因组范围内的CG甲基化,还减少CHG和CHH甲基化(Aufsatz等人,2004;Stroud等人,2013;Lister等人,2008)(图13B)。使用内源性NRPE1抗体,ChIP-seq表明,与野生型的通常被PolV占据的位点相比,PolV在met1中的占据基本上被消除(图13C)。相反,在met1中以前被鉴定为获得甲基化的一系列位点(Stroud等人,2013),观察到PolV结合的增加(图13D和图13E)。这些结果表明,DNA甲基化是PolV募集的一个重要组成部分。示出SUVH2和SUVH9二者的SRA结构域中的点突变引起RNA指导的DNA甲基化的丧失,表明SRA结构域有助于发挥作用(Johnson等人,2008)。总之,并且不希望囿于理论,这些结果表明,SUVH2/SUVH9与甲基化的DNA的结合募集PolV,从而在之前存在的DNA甲基化和随后通过RdDM通路的甲基化募集之间提供联系。
还发现,与观察到的ZF-SUVH2/fwa-4植株系的结果不同,在fwa-4背景中与靶向FWA的锌指融合的KYP蛋白(ZF-KYP/fwa-4)以与fwa-4突变体类似的时间开花(与野生型相比开花较晚)。包括ZF-KYP作为另外的阴性对照,因为KYP(也被称为SUVH4)是RdDM不需要的SUVH蛋白。还通过ChIP表明在FWA处存在对照ZF-KYP(图15A)。
为了进一步研究该靶向,使用如图6所述的来自实施例2的植株系,使用亚硫酸氢盐测序以确定FWA基因沉默是否与DNA甲基化相关。在野生型株系中,检测到很大区域的DNA甲基化,具有特别高水平的CG甲基化(图14A)。在fwa-4和包含ZF-KYP或HA-SUVH2的转化体中,该区域均完全没有DNA甲基化(参见ZF-KYP,图14A)。在三个独立的被分析的在fwa-4中包含ZF-SUVH2的T1株系中,在所有胞嘧啶序列背景中紧靠Zn指位点的位置观察到高水平的DNA甲基化,所述DNA甲基化随着下游被转录区域而逐渐减少(实施例2,图6E)。将所述株系中的一个传代(ZF-SUVH2-2)至T2和T3代,并使用BS-seq以确定甲基化延伸的范围(图14A)。发现甲基化从结合位点在任一方向延伸了大约150个碱基对,并且不会在代之间显著扩张。还观察到,在已经失去ZF-SUVH2转基因的T2分离株中保留了该DNA甲基化和沉默(图15B)。这些结果表明,将SUVH2靶向至FWA足以诱导DNA甲基化和基因沉默,并且该表观遗传沉默状态可以在不存在ZF-SUVH2的情况下被保留。
从实施例2中,实验被设计以测试ZF-SUVH2是否募集PolV。使用NRPE1ChIP以检查野生型、nrpe1和wa-4株系中FWA处的PolV水平。在野生型和fwa-4株系中观察到在两个已知的PolV位点IGN5和IGN22处的PolV的富集,但是在nrpe1突变体株系中则未观察到(图7A)。在野生型中观察到在FWA的启动子和转录区域二者处的PolV的富集,但是在nrpe1或fwa-4中则未观察到(图7A)。因此,PolV存在于野生型的处于其DNA甲基化和沉默状态的FWA处,但是不存在于其fwa-4表观等位基因的未甲基化状态中。为了确定ZF-SUVH2与FWA的结合是否募集PolV,在fwa-4中包含ZF-SUVH2的T2株系中进行NRPE1ChIP。与亲本fwa-4株系不同,ZF-SUVH2株系表现出在FWA处的PolV富集(图7A)。总之,这些结果表明,SUVH2足以将PolV定位在FWA启动子处,导致DNA甲基化和基因沉默。
为了得到SUVH2或SUVH9靶向RdDM的可能机制,查询通过利用多种表位-加标记的RdDM的免疫沉淀蛋白复合物产生的质谱数据集。虽然在来自PolV纯化的一些IP-质谱研究(利用NRPE1-Flag)中尚未观察到SUVH2/9肽,但是在两个独立的DRD1质谱数据集中鉴定了SUVH2肽(图16)。DRD1是DDR复合物(还包含DMS3和RDM1)的组分,所述DDR复合物与PolV相互作用(Law等人,2010),并且是在整个基因组范围内PolV占据所需要的。(Zhong等人,2012)。观察到的SUVH2肽的数量比来自是DDR复合物的化学计量组分DMS3和RDM1蛋白的那些更低,并且也比多数PolV复合物组分的肽的水平更低,表明SUVH2与DRD1的相互作用比DDR组分之间或DDR与PolV之间的相互作用更弱或者更加短暂。为了证实DRD1与SUVH2之间的相互作用,在本氏烟草的叶子中表达表位加标签的SUVH2,并且在HA磁珠上对其纯化。使用此作为SUVH2的来源,特异性地且可重复地从转基因拟南芥蛋白质提取物中拉下DRD1-Flag(图14B:珠子-SUVH2)。作为阴性对照,使用不表达加标签的SUVH2的本氏烟草进行相同测定,并且在该测定中不能检测到DRD1-Flag(图14B:磁珠-假试验)。另外,使用转基因拟南芥植株中的HA加标签的SUVH2和Flag加标签的DRD1进行免疫沉淀实验,并且也观察到这些蛋白质之间的相互作用(图15C)。这些结果证实,不希望囿于理论,IP-质谱观察结果与以下模型一致:SUVH2经由与包括DRD1在内的DDR复合物组分短暂相互作用而间接发挥作用以募集PolV。
实施例5
该实施例证实了RNA指导的DNA甲基化途径的不同组分的靶向将PolV募集至特定基因座。
简介
RNA指导的DNA甲基化(RdDM)途径介导植物中的从头开始的DNA甲基化。实施例2和4证实了ZF-SUVH2用于特异性靶向靶基因座的甲基化和沉默的用途。这通过利用FWA基因作为靶而实现。FWA的表达引起拟南芥中强的晚开花表型。野生型植株中存在的该基因的启动子处的甲基化,引起FWA的转录沉默,并导致相对于fwa-4突变体的早开花表型。fwa-4拟南芥表观遗传突变体表现出在FWA基因的启动子中无甲基化,并因此表现出典型的晚开花表型(相对于野生型)。实施例2和4描述了与锌指(ZF)蛋白ZF108融合的嵌合SUVH2蛋白,所述锌指蛋白被设计为靶向拟南芥中FWA的启动子,并且证实了该融合蛋白能够促进fwa-4植株中该基因组位点处的甲基化。该甲基化靶向伴随着PolV募集被至该(FWA)位点,并且导致产生引起甲基化、基因沉默所需要的非编码RNA,并因此产生早开花表型。
材料和方法
融合蛋白构建
为了产生该实例中描述的不同融合蛋白,用限制性酶XhoI消化实施例2中描述的pUC57质粒中的ZF108片段,并将其直接插入不同基因中的独特XhoI位点中,或者插入到包含Flag-BLRP或HA-BLRP融合物的pCR2质粒中,所述Flag-BLRP或HA-BLRP融合物包含位于标签和BLRP之间的XhoI位点并且侧翼为AscI限制性位点。如下所述构建各个构建体。
DRD1-HA-ZF:用AscI消化pCR2质粒中的HA-ZF108-BLRP融合物,并将其插入pENTR-DRD1质粒的单个AscI位点中(Law等人,2010),所述AscI位点位于DRD1编码序列末端之后6个碱基对处。
DMS3-Flag-ZF:用AscI消化pCR2质粒中的Flag-ZF108-BLRP融合物,并将其插入pENTR-DMS3质粒的单个AscI位点中(Law等人,2010),所述AscI位点位于DMS3编码序列末端之后6个碱基对处。
RDM1-Flag-ZF:为了这个目的,产生质粒pENTR-RDM1,其包含RDM1的基因组序列,所述FRG的基因组序列包括350个碱基对的5'启动子序列。然后用AscI消化pCR2质粒中的Flag-ZF108-BLRP融合物,并将其插入pENTR-RDM1质粒的单个AscI位点中,所述单个AscI位点位于RDM1编码序列末端之后6个碱基对处。
RDM1-HA-ZF:为了这个目的,产生质粒pENTR-RDM1,其包含RDM1的基因组序列,所述RDM1的基因组序列包括350个碱基对的5'启动子序列。然后用AscI消化pCR2质粒中的HA-ZF108-BLRP融合物,并将其插入pENTR-RDM1质粒的单个AscI位点中,所述单个AscI位点位于RDM1编码序列末端之后6个碱基对处。
HA-ZF-DRM3:为了这个目的,使用质粒pENTR-BLRP-HA-DRM3,其包含DRM3的基因组序列,所述DRM3的基因组序列包括2500个碱基对的5'启动子序列和在起始密码子前的BLRP-HA融合物。然后用XhoI消化pUC57质粒中的ZF108片段,并将其插入pENTR-BLRP-HA-DRM3质粒的单个XhoI位点中,所述单个XhoI位点位于BLRP和HA标签之间。
HA-2XZF-DRM3:为了这个目的,使用质粒pENTR-BLRP-HA-DRM3,其包含DRM3的基因组序列,所述DRM3的基因组序列包括2500个碱基对的5'启动子序列和在起始密码子前的BLRP-HA融合物。然后用XhoI消化pUC57质粒中的ZF108片段,并将两个拷贝的ZF108串联插入pENTR-BLRP-HA-DRM3质粒的单个XhoI位点中,所述单个XhoI位点位于BLRP和HA标签之间。
ZF-3F9M-DRM2:用EcoRI消化pUC57中侧翼为EcoRI位点的ZF108片段,并将其插入质粒pENTR-3F9M-DRM2(Henderson等人,2010)中的单个EcoRI位点中,该EcoRI位点位于3xFlag-9xMyc标签的5'起始端。
FRG-Flag-ZF:为了这个目的,使用质粒pENTR-FRG,其包含FRG的基因组序列,所述基因组序列包括800个碱基对的5'启动子序列。用AscI消化pCR2质粒中的Flag-ZF108-BLRP融合物,并将其插入pENTR-FRG质粒的单个AscI位点中,所述AscI位点位于FRG编码序列末端之后6个碱基对处。
SUVR2-Flag-ZF:使用质粒pENTR-SUVR2,其包含SUVR2的基因组序列,所述基因组序列包括2000个碱基对的5'启动子序列。用AscI消化pCR2质粒中的Flag-ZF108-BLRP融合物,并将其插入pENTR-SUVR2质粒的单个AscI位点中,所述AscI位点位于SUVR2编码序列末端之后6个碱基对处。
SUVR2-HA-ZF:使用质粒pENTR-SUVR2,其包含SUVR2的基因组序列,所述基因组序列包括2000个碱基对的5'启动子序列。用AscI消化pCR2质粒中的HA-ZF108-BLRP融合物,并将其插入pENTR-SUVR2质粒的单个AscI位点中,所述AscI位点位于SUVR2编码序列末端之后6个碱基对处。
MORC6-HA-ZF:使用质粒pENTR-MORC6,其包含MORC6的基因组序列,所述基因组序列包括2463个碱基对的5'启动子序列。用AscI消化pCR2质粒中的HA-ZF108-BLRP融合物,并将其插入pENTR-MORC6质粒的单个AscI位点中,所述AscI位点位于MORC6编码序列末端之后6个碱基对处。
Flag-ZF-CMT2:产生质粒pENTR-Flag-CMT2,其包含CMT2的基因组序列,所述基因组序列包括1032个碱基对的5'启动子序列和在起始密码子前的BLRP-Flag融合物。用XhoI消化pUC57质粒中的ZF108片段,并将其插入pENTR-BLRP-Flag-CMT2质粒的单个XhoI位点中,所述XhoI位点位于BLRP和Flag标签之间。
将融合蛋白引入fwa-4
将上文描述的所有ZN-108融合蛋白构建体重组到载体JP726中,并使用农杆菌介导的转化将其引入fwa-4。用BASTA选择转化的株系。
结果
为了探测多种其它的RdDM蛋白是否具有在fwa-4突变体中的FWA基因座处触发从头开始的DNA甲基化的能力,进行了一系列实验试图将RdDM通路的不同组分靶向至拟南芥中FWA基因的启动子。选择参与RdDM的多种蛋白,并将所述蛋白融合至靶向FWA启动子的ZF108锌指(参见实施例2),并转化到fwa-4突变体中。如上文所述以与实施例2和4中所述的那些类似的方法构建ZF-靶向株系。对~30个独立的转基因株系的开花时间评分。下表13中示出了选择的不同RdDM组分和开花时间结果的列表。
表13:与fwa-4相比T1株系中的早开花
表13中所示的结果证实了DMS3-ZF和MORC6-ZF可在fwa-4突变体背景中有效地促进早开花。SUVR2-Flag-ZF靶向在30个植株中产生了3个早开花植株,但是这些植株的开花不如由DMS3或MORC6靶向的植株早。并且,SUVR2-HA-ZF未产生早开花植株。SUVR2结果表明,当被融合至靶向FWA的DNA结合结构域时,SUVR2具有至少部分靶向和沉默FWA的能力。重要的是,在这些第一代T1植株中,DDR复合物中的三个蛋白质(DRD1、DMS3和RDM1)中,只有DMS3在有效地引起相对于fwa-4的早开花中有效。并且,DRM2的直接靶向无效。因此,结果表明,至少在第一代T1植株中,并非所有的RdDM组分都在有效地靶向DNA甲基化中有效。
还从表13可见,MORC6-HA-ZF在fwa-4突变体中引起早开花的方面有效。MORC1(At4g36290)和MORC2(AT4G36280)是与MORC6相关的蛋白,并且申请人已经表明它们与MORC6形成稳定的异源二聚体。申请人之前表明MORC6和MORC1参与基因沉默(Moissiard等人,2012)。申请人还表明,MORC1MORC2双突变体具有与MORC6突变体非常相似的表型。因此,认为MORC1和MORC1b非常可能也成功地靶向PolV、DNA甲基化和基因沉默。
为了分析表13中所述的早开花株系的早开花表型是否归因于FWA启动子的甲基化,在表现出相对于fwa-4的早开花表型的两个独立的DMS3-ZF株系和3个独立的MORC6-ZF株系中进行全基因组亚硫酸氢盐测序测定。以与实施例4中描述的方法类似的方法进行亚硫酸氢盐测序实验。结果表明,以与之前实施例4中所示用于SUVH2的方法非常类似的方式在FWA处再确立了DNA甲基化(图17)。因此,DMS3和MORC6有效地将甲基化靶向FWA启动子。如上文所述,ZF-SUVR2株系在引起fwa-4突变体中早开花中稍微有效,从而也可能将DNA甲基化靶向至FWA。
为了进一步分析这些转基因植物中FWA沉默的稳定性,以及测试这些融合蛋白是否可能仅在较后代表现出影响,允许每个株系的大量T1植株自花传粉,并测定T2代的开花时间,如表14所示。衍生自早开花的来自DMS3-ZF转化株的T1植株的T2植株T2世代中表现出100%的早开花植株,证实了FWA基因沉默的有效性和稳定性。衍生自早开花的来自MORC6-ZF转化株的T1植株的T2植株表现出一些变化,但是仍有大多数在T2代中表现出100%的早开花植株。衍生自早开花的来自SUVR2-ZF转化株的T1植株的T2植株表现出更多变化,并且只有一个在T2代中表现出100%的早开花植株。
表14:T2株系中早开花
对于其它融合蛋白的T2代的分析表明,甚至对于在T1代中未表现出影响的一些RdDM因子,在T2代中可见到部分影响。这可见于DRD1-ZF、RDM1-ZF、DRM3-ZF、DRM2-ZF和FRG-ZF(FRG是申请人已经表明参与RdDM的基因At3g20010)融合物构建体。这证实了DRD1、RDM1、DRM3、DRM2和FRG基因也可以用于靶向PolV、DNA甲基化和基因沉默,虽然这些基因的有效性可能比较低,并且它可能需要多个植物世代才能观察到影响。作为对照,包括不参与RdDM的CMT2蛋白,并且观察到所有T2植株表现出100%晚开花,表明CMT2在靶向FWA沉默中不是有效的。
申请人已经表明,不同的RdDM蛋白可以被靶向以便以不同程度的沉默功效沉默特异性的基因座。具有可以提供一系列不同的基因沉默功效的一组蛋白质可能会有优势。例如,取决于待沉默的靶核酸,选择具有不同沉默功效的本公开内容的重组蛋白可以是有利的。例如,通过选择非常有效的RdDM组分以将尽可能多的甲基化定向至靶基因而完全沉默所述靶基因的表达,可能是有利的。在其它情况下,靶向功效较低的RdDM组分以将较少的甲基化靶向至基因以引起仅部分沉默效应,可能是有利的。当基因以不同水平表达时,它们通常对植物表型表现出不同影响,并且可能植物基因的部分沉默的情况是最有利的。
实施例6
以下实施例涉及修饰的拟南芥SHH1蛋白的产生和表征,所述修饰的拟南芥SHH1蛋白被工程化为包含将修饰的SHH1蛋白靶向至特定的核酸序列的核酸结合结构域,还涉及修饰的拟南芥SUVH2蛋白的产生和表征,所述修饰的拟南芥SUVH2蛋白被工程化为包含将修饰的SUVH2蛋白靶向至特定的核酸序列的核酸结合结构域。在该实施例中,SHH1和SUVH2同时靶向至SUPERMAN启动子区域与SUPERMAN处的DNA甲基化富集相关。
材料和方法
TAL-SHH1和TAL-SUVH2嵌合体的构建
以前(Johnson等人,2008)描述了包含SUVH2的Gateway入门克隆,所述克隆包括1.4kb的启动子区域以及具有N末端的3xHA和BLRP标签的ORF。以前(Law等人,2011)描述了包含SHH1的Gateway入门克隆,所述克隆包括1.4kb的启动子区域以及具有C末端的BLRP和3xMyc标签的ORF。通过定点诱变(Quickchangemulti,Agilent)使用引物SUVH2deltaBsaI1,5’-TCGTTGTCTCGCCGAAATTCGAAAGACCGAGAGAG-3’(SEQIDNO:168)、SUVH2deltaBsaI2,5’-TCATCATAGTGTTGTTATATCTTTGGTGTCTCTGTCTTGCTTC-3’(SEQIDNO:175)和SUVH2deltaBsaI3,5’-CCTTTAATTTCCTTTTTTGTTTGCGTCTCTACTCTCTACAATCTATA-3’(SEQIDNO:169)从SHH1入门克隆中去除BsaI识别位点。通过定点诱变(QuickchangeII,Agilent)使用引物SHH1deltaBsaI_fo,5’-GGGAGAGTGAACGTTGGTGACCTGCTTCTATGTTT-3’(SEQIDNO:170)、SHH1deltaBsaI_re,5’AAACATAGAAGCAGGTCACCAACGTTCACTCTCCC3’(SEQIDNO:171)从SHH1入门克隆中去除BsaI识别位点。去除BsaI位点之后,通过用XhoI限制性消化而线性化入门克隆。为了将编码修饰的基于Hax3的转录激活因子样效应子(TALE)(Sanjana等人,2012)的DNA序列符合读框地插入到SHH1的C末端BLRP和3xMyc标签之间,其中所述转录激活因子样效应子排除了C末端核定位信号和酸性激活结构域、侧翼为GSSGSS接头,使用引物TALETFintotag_fo,5’-CCAAGGACCTCTCGAGGGATCTTCAGGTTCATCTTCGCGGACCCGGCTCCCT-3’(SEQIDNO:144)和分别TALETFintoSHH1Myc_re,5’-CATAGATCCCTCGAGTGAAGAACCAGATGATCCGCTAGCTGACGCGCGA-3’(SEQIDNO:145)或TALETFintoSUVH2tag_re,5’-GGTATCCCATCTCGAGTGAAGAACCAGATGATCCGCTAGCTGACGCGCGA-3’(SEQIDNO:172)从TALE转录激活因子(TALE-TF)质粒(Addgene)扩增包括ccdB选择盒的2.8kb的TALE骨架。使用In-FusionHD克隆系统(Clontech)将扩增子与线性化的入门克隆融合。通过GoldenGate克隆从18个单体-重复序列(Addgene)组装两个TALEDNA结合结构域,所述TALEDNA结合结构域靶向对应于SUPERMAN(AT3G23130)的启动子区域中3号染色体的核苷酸位置8242204至8242222的序列5’-GGGGATTTGATAATGCGTC-3’(SEQIDNO:173)和3号染色体的核苷酸位置8242251至8242233的序列5’-GTTAAGACTGTGAAAGAGA-3’(SEQIDNO:174),并将所述两个TALEDNA结合结构域插到ccdB选择盒侧翼的BsaI位点之间(Sanjana等人,2012)。列出了编码TALE靶重复序列的DNA序列(SEQIDNO:140),所述TALE靶重复序列对应于SUP_D(SEQIDNO:138)和SUP_P(SEQIDNO:139)。为了促进TALE融合蛋白与甲基化的胞嘧啶结合,使用重复可变的“双残基”(RVD)N*(Valton等人,2012)。通过分别使用引物NN>N*_fo,5’-GTGGCAATTGCGAGCAACGGGGGAAAGCAG-3’(SEQIDNO:147)、NN>N*_re,5’-CTGCTTTCCCCCGTTGCTCGCAATTGCCAC-3’(SEQIDNO:148)、NN>NH_fo,5’-GGCAATTGCGAGCAACCATGGGGGAAAGCAGGCAC-3’(SEQIDNO:149)和NN>NH_re,5’-GTGCCTGCTTTCCCCCATGGTTGCTCGCAATTGCC-3’(SEQIDNO:150),对TALE单体模板质粒pNN_v2(Addgene)定点诱变,产生编码单体RVDN*和NH的质粒。通过使用引物TALETF_NN>N*_fo,5’-TGGCTATTGCATCCAACGGGGGCAGACC-3’(SEQIDNO:151)和TALETF_NN>N*_re,5’-GGTCTGCCCCCGTTGGATGCAATAGCCA-3’(SEQIDNO:152),对pTALE-TF_v2(NN)(Addgene)定点诱变,
产生编码RVDN*的TALE-TF质粒。使用LR克隆酶II(LifeTechnologies)和包含Bar或hph选择标记的修饰的pEarlyGate302目标载体产生双元载体(Law等人,2011)。
植物材料
使用蘸花法通过根癌农杆菌菌株ABL0将TAL-SHH1构建体转化到生态型Col-0的shh1(SALK_074540)中,并将TAL-SUVH2转化到生态型Col-0的suvh2(SALK_079574)中(Clough和Bent,1998)。用草铵磷或潮霉素B选择T1植株,并通过蛋白质分离和分别使用抗3xMyc或3xHA标签的抗体的蛋白质印迹,测试嵌合TAL-SHH1或TAL-SUVH2蛋白的表达。将表现出强的转基因表达的T1植株杂交,目的是结合TAL-SUVH2和TAL-SHH1或者用于SUPERMAN(At3g23130)基因靶区域的发夹构建体。通过PCR测定F1植株的基因型,以确定所述转基因的存在。
结果
选择包含被导向SUPERMAN基因的TAL-SHH1、被导向SUPERMAN基因的TAL-SUVH2任一种的F1植株,或包含TAL-SHH1和TAL-SUVH2转基因二者的植株之后,使用已确定的方案(Law等人,2013)制备全基因组亚硫酸氢盐文库。对这些文库进行深度测序,如之前所述将读段映射到拟南芥基因组上(Law等人,2013)。如图19所示,在包含TAL-SHH1和TAL-SUVH2转基因二者的植株中在SUPERMAN基因处检测到CHHDNA甲基化,但是在单独包含TAL-SHH1或者TAL-SUVH2转基因的植株中则未检测到。这些结果表明,将SHH1和SUVH2靶向至SUPERMAN启动子区域足以引起CHHDNA甲基化。
参考文献
Law,J.A.&Jacobsen,S.E.Establishing,maintainingandmodifyingDNAmethylationpatternsinplantsandanimals.NatRevGenet11,204-220(2010).
Haag,J.R.&Pikaard,C.S.MultisubunitRNApolymerasesIVandV:purveyorsofnon-codingRNAforplantgenesilencing.NatRevMolCellBiol12,483-492,doi:10.1038/nrm3152(2011).
Law,J.A.,Vashisht,A.A.,Wohlschlegel,J.A.&Jacobsen,S.E.SHH1,aHomeodomainProteinRequiredforDNAMethylation,AsWellAsRDR2,RDM4,andChromatinRemodelingFactors,AssociatewithRNAPolymeraseIV.PLoSGenet7,e1002195,doi:10.1371/journal.pgen.1002195(2011).
Liu,J.etal.AnatypicalcomponentofRNA-directedDNAmethylationmachineryhasbothDNAmethylation-dependentand-independentrolesinlocus-specifictranscriptionalgenesilencing.CellRes21,1691-1700,doi:10.1038/cr.2011.173(2011).
Olovnikov,I.,Aravin,A.A.&FejesToth,K.SmallRNAinthenucleus:theRNA-chromatinping-pong.CurrOpinGenetDev22,164-171,doi:10.1016/j.gde.2012.01.002(2012).
Mosher,R.A.,Schwach,F.,Studholme,D.&Baulcombe,D.C.PolIVbinfluencesRNA-directedDNAmethylationindependentlyofitsroleinsiRNAbiogenesis.ProcNatlAcadSciUSA105,3145-3150(2008).
Zhang,X.,Henderson,I.R.,Lu,C.,Green,P.J.&Jacobsen,S.E.RoleofRNApolymeraseIVinplantsmallRNAmetabolism.ProcNatlAcadSciUSA104,4536-4541(2007).
Cokus,S.J.etal.ShotgunbisulphitesequencingoftheArabidopsisgenomerevealsDNAmethylationpatterning.Nature452,215-219(2008).
Cao,X.etal.RoleoftheDRMandCMT3methyltransferasesinRNA-directedDNAmethylation.CurrBiol13,2212-2217(2003).
Du,J.etal.DualBindingofChromomethylaseDomainstoH3K9me2-containingNucleosomesDirectsDNAMethylationinPlants.CellAccepted(2012).
Zhong,X.etal.DDRcomplexfacilitatesglobalassociationofRNApolymeraseVtopromotersandevolutionarilyyoungtransposons.NatStructMolBiol,doi:10.1038/nsmb.2354(2012).
Mukherjee,K.,Brocchieri,L.&Burglin,T.R.Acomprehensiveclassificationandevolutionaryanalysisofplanthomeoboxgenes.MolBiolEvol26,2775-2794(2009).
Cedar,H.&Bergman,Y.LinkingDNAmethylationandhistonemodification:patternsandparadigms.NatRevGenet10,295-304(2009).
Zhang,X.,Bernatavichute,Y.V.,Cokus,S.,Pellegrini,M.&Jacobsen,S.E.Genome-wideanalysisofmono-,di-andtrimethylationofhistoneH3lysine4inArabidopsisthaliana.GenomeBiol10,R62(2009).
Bian,C.etal.Sgf29bindshistoneH3K4me2/3andisrequiredforSAGAcomplexrecruitmentandhistoneH3acetylation.EMBOJ30,2829-2842,doi:10.1038/emboj.2011.193(2011).
Holm,L.&Rosenstrom,P.Daliserver:conservationmappingin3D.NucleicAcidsRes38,W545-549,doi:10.1093/nar/gkq366(2010).
Nady,N.etal.RecognitionofmultivalenthistonestatesassociatedwithheterochromatinbyUHRF1protein.JournalofBiologicalChemistry286,24300-24311,doi:10.1074/jbc.M111.234104(2011).
Bernatavichute,Y.V.,Zhang,X.,Cokus,S.,Pellegrini,M.&Jacobsen,S.E.Genome-wideassociationofhistoneH3lysineninemethylationwithCHGDNAmethylationinArabidopsisthaliana.PLoSONE3,e3156(2008).
Taverna,S.D.,Li,H.,Ruthenburg,A.J.,Allis,C.D.&Patel,D.J.Howchromatin-bindingmodulesinterprethistonemodifications:lessonsfromprofessionalpocketpickers.NatStructMolBiol14,1025-1040,doi:10.1038/nsmb1338(2007).
Zhang,X.etal.Genome-widehigh-resolutionmappingandfunctionalanalysisofDNAmethylationinarabidopsis.Cell126,1189-1201(2006).
Zilberman,D.etal.RoleofArabidopsisARGONAUTE4inRNA-directedDNAmethylationtriggeredbyinvertedrepeats.CurrBiol14,1214-1220(2004).
Xie,Z.etal.GeneticandfunctionaldiversificationofsmallRNApathwaysinplants.PLoSBiol2,E104(2004).
Li,C.F.etal.AnARGONAUTE4-containingnuclearprocessingcentercolocalizedwithCajalbodiesinArabidopsisthaliana.Cell126,93-106(2006).
Pontes,O.etal.TheArabidopsischromatin-modifyingnuclearsiRNApathwayinvolvesanucleolarRNAprocessingcenter.Cell126,79-92(2006).
Zilberman,D.,Cao,X.&Jacobsen,S.E.ARGONAUTE4controloflocus-specificsiRNAaccumulationandDNAandhistonemethylation.Science299,716-719(2003).
Adams,P.D.,Afonine,P.V.,Bunkoczi,G.,Chen,V.B.,Davis,I.W.,Echols,N.,Headd,J.J.,Hung,L.W.,Kapral,G.J.,Grosse-Kunstleve,R.W.,etal.(2010).PHENIX:acomprehensivePython-basedsystemformacromolecularstructuresolution.ActacrystallographicaSectionD,Biologicalcrystallography66,213-221.
Arita,K.,Ariyoshi,M.,Tochio,H.,Nakamura,Y.,andShirakawa,M.(2008).Recognitionofhemi-methylatedDNAbytheSRAproteinUHRF1byabase-flippingmechanism.Nature455,818-821.
Aufsatz,W.,Mette,M.F.,vanderWinden,J.,Matzke,A.J.,andMatzke,M.(2002).RNA-directedDNAmethylationinArabidopsis.ProceedingsoftheNationalAcademyofSciencesoftheUnitedStatesofAmerica99Suppl4,16499-16506.
Aufsatz,W.,Mette,M.F.,Matzke,A.J.&Matzke,M.TheroleofMET1inRNA-directeddenovoandmaintenancemethylationofCGdinucleotides.PlantMolecularBiology54,793-804(2004).
Avvakumov,G.V.,Walker,J.R.,Xue,S.,Li,Y.,Duan,S.,Bronner,C.,Arrowsmith,C.H.,andDhe-Paganon,S.(2008).Structuralbasisforrecognitionofhemi-methylatedDNAbytheSRAdomainofhumanUHRF1.Nature455,822-825.
Bernatavichute,Y.V.,Zhang,X.,Cokus,S.,Pellegrini,M.,andJacobsen,S.E.(2008).Genome-wideassociationofhistoneH3lysineninemethylationwithCHGDNAmethylationinArabidopsisthaliana.PloSone3,e3156.
Black,J.C.,VanRechem,C.,andWhetstine,J.R.(2012).Histonelysinemethylationdynamics:establishment,regulation,andbiologicalimpact.Molecularcell48,491-507.
Bostick,M.,Kim,J.K.,Esteve,P.O.,Clark,A.,Pradhan,S.,andJacobsen,S.E.(2007).UHRF1playsaroleinmaintainingDNAmethylationinmammaliancells.Science317,1760-1764.
Brzeski,J.,andJerzmanowski,A.(2003).DeficientinDNAmethylation1(DDM1)definesanovelfamilyofchromatin-remodelingfactors.TheJournalofbiologicalchemistry278,823-828.
Cao,X.,andJacobsen,S.E.(2002).RoleofthearabidopsisDRMmethyltransferasesindenovoDNAmethylationandgenesilencing.Currentbiology:CB12,1138-1144.
Chan,S.W.,Zhang,X.,Bernatavichute,Y.V.,andJacobsen,S.E.(2006).Two-steprecruitmentofRNA-directedDNAmethylationtotandemrepeats.PLoSbiology4,e363.
Du,J.,Zhong,X.,Bernatavichute,Y.V.,Stroud,H.,Feng,S.,Caro,E.,Vashisht,A.A.,Terragni,J.,Chin,H.G.,Tu,A.,etal.(2012).DualBindingofChromomethylaseDomainstoH3K9me2-ContainingNucleosomesDirectsDNAMethylationinPlants.Cell151,167-180.
Ebbs,M.L.,andBender,J.(2006).Locus-specificcontrolofDNAmethylationbytheArabidopsisSUVH5histonemethyltransferase.ThePlantcell18,1166-1176.
El-Shami,M.,Pontier,D.,Lahmy,S.,Braun,L.,Picart,C.,Vega,D.,Hakimi,M.A.,Jacobsen,S.E.,Cooke,R.,andLagrange,T.(2007).ReiteratedWG/GWmotifsformfunctionallyandevolutionarilyconservedARGONAUTE-bindingplatformsinRNAi-relatedcomponents.Genes&development21,2539-2544.
Emsley,P.,Lohkamp,B.,Scott,W.G.,andCowtan,K.(2010).FeaturesanddevelopmentofCoot.ActacrystallographicaSectionD,Biologicalcrystallography66,486-501.
Feng,S.,Rubbi,L.,Jacobsen,S.E.,andPellegrini,P.(2011).DeterminingDNAMethylationProfilesUsingSequencing.MethodsinMolecularBiology733,223-238.
Finnegan,E.J.,andDennis,E.S.(1993).IsolationandidentificationbysequencehomologyofaputativecytosinemethyltransferasefromArabidopsisthaliana.Nucleicacidsresearch21,2383-2388.
Gouet,P.,Courcelle,E.,Stuart,D.I.,andMetoz,F.(1999).ESPript:analysisofmultiplesequencealignmentsinPostScript.Bioinformatics15,305-308.
Greenberg,M.V.,Ausin,I.,Chan,S.W.,Cokus,S.J.,Cuperus,J.T.,Feng,S.,Law,J.A.,Chu,C.,Pellegrini,M.,Carrington,J.C.,etal.(2011).IdentificationofgenesrequiredfordenovoDNAmethylationinArabidopsis.Epigenetics:officialjournaloftheDNAMethylationSociety6,344-354.
Hashimoto,H.,Horton,J.R.,Zhang,X.,Bostick,M.,Jacobsen,S.E.,andCheng,X.(2008).TheSRAdomainofUHRF1flips5-methylcytosineoutoftheDNAhelix.Nature455,826-829.
Jackson,J.P.,Lindroth,A.M.,Cao,X.,andJacobsen,S.E.(2002).ControlofCpNpGDNAmethylationbytheKRYPTONITEhistoneH3methyltransferase.Nature416,556-560.
Johnson,L.M.,Bostick,M.,Zhang,X.,Kraft,E.,Henderson,I.,Callis,J.,andJacobsen,S.E.(2007).TheSRAmethyl-cytosine-bindingdomainlinksDNAandhistonemethylation.Currentbiology:CB17,379-384.
Johnson,L.M.,Law,J.A.,Khattar,A.,Henderson,I.R.,andJacobsen,S.E.(2008).SRA-domainproteinsrequiredforDRM2-mediateddenovoDNAmethylation.PLoSgenetics4,e1000280.
Jones,P.A.(2012).FunctionsofDNAmethylation:islands,startsites,genebodiesandbeyond.NaturereviewsGenetics13,484-492.
Kakutani,T.(1997).Geneticcharacterizationoflate-floweringtraitsinducedbyDNAhypomethylationmutationinArabidopsisthaliana.ThePlantjournal:forcellandmolecularbiology12,1447-1451.
Kinoshita,Y.,Saze,H.,Kinoshita,T.,Miura,A.,Soppe,W.J.,Koornneef,M.,andKakutani,T.(2007).ControlofFWAgenesilencinginArabidopsisthalianabySINE-relateddirectrepeats.ThePlantjournal:forcellandmolecularbiology49,38-45.
Kolb,A.F.,Coates,C.J.,Kaminski,J.M.,Summers,J.B.,Miller,A.D.,andSegal,D.J.(2005).Site-directedgenomemodification:nucleicacidandproteinmodulesfortargetedintegrationandgenecorrection.Trendsinbiotechnology23,399-406.
Kuhlmann,M.,andMette,M.F.(2012).Developmentallynon-redundantSETdomainproteinsSUVH2andSUVH9arerequiredfortranscriptionalgenesilencinginArabidopsisthaliana.Plantmolecularbiology.
Larkin,M.A.,Blackshields,G.,Brown,N.P.,Chenna,R.,McGettigan,P.A.,McWilliam,H.,Valentin,F.,Wallace,I.M.,Wilm,A.,Lopez,R.,etal.(2007).ClustalWandClustalXversion2.0.Bioinformatics23,2947-2948.
Laskowski,R.A.,Macarthur,M.W.,Moss,D.S.,andThornton,J.M.(1993).PROCHECK:aprogramtocheckthestereochemicalqualityofproteinstructures.JApplCrystallogr26,283-291.
Law,J.A.,Ausin,I.,Johnson,L.M.,Vashisht,A.A.,Zhu,J.K.,Wohlschlegel,J.A.,andJacobsen,S.E.(2010).AproteincomplexrequiredforpolymeraseVtranscriptsandRNA-directedDNAmethylationinArabidopsis.Currentbiology:CB20,951-956.
Law,J.A.,andJacobsen,S.E.(2010).Establishing,maintainingandmodifyingDNAmethylationpatternsinplantsandanimals.NaturereviewsGenetics11,204-220.
Lindroth,A.M.,Cao,X.,Jackson,J.P.,Zilberman,D.,McCallum,C.M.,Henikoff,S.,andJacobsen,S.E.(2001).RequirementofCHROMOMETHYLASE3formaintenanceofCpXpGmethylation.Science292,2077-2080.
Lindroth,A.M.,Shultis,D.,Jasencakova,Z.,Fuchs,J.,Johnson,L.,Schubert,D.,Patnaik,D.,Pradhan,S.,Goodrich,J.,Schubert,I.,etal.(2004).DualhistoneH3methylationmarksatlysines9and27requiredforinteractionwithCHROMOMETHYLASE3.TheEMBOjournal23,4286-4296.
Lister,R.etal.Highlyintegratedsingle-baseresolutionmapsoftheepigenomeinArabidopsis.Cell133,523-536(2008).
Malagnac,F.,Bartee,L.,andBender,J.(2002).AnArabidopsisSETdomainproteinrequiredformaintenancebutnotestablishmentofDNAmethylation.TheEMBOjournal21,6842-6852.
Otwinowski,Z.,andMinor,W.(1997).ProcessingofX-raydiffractiondatacollectedinoscillationmode.MethodsEnzymol276,307-326.
Pelissier,T.,andWassenegger,M.(2000).ADNAtargetof30bpissufficientforRNA-directedDNAmethylation.RNA6,55-65.
Pikaard,C.S.,Haag,J.R.,Ream,T.,andWierzbicki,A.T.(2008).RolesofRNApolymeraseIVingenesilencing.Trendsinplantscience13,390-397.
Pontier,D.,Yahubyan,G.,Vega,D.,Bulski,A.,Saez-Vasquez,J.,Hakimi,M.A.,Lerbs-Mache,S.,Colot,V.,andLagrange,T.(2005).ReinforcementofsilencingattransposonsandhighlyrepeatedsequencesrequirestheconcertedactionoftwodistinctRNApolymerasesIVinArabidopsis.Genes&development19,2030-2040.
Rajakumara,E.,Law,J.A.,Simanshu,D.K.,Voigt,P.,Johnson,L.M.,Reinberg,D.,Patel,D.J.,andJacobsen,S.E.(2011).Adualflip-outmechanismfor5mCrecognitionbytheArabidopsisSUVH5SRAdomainanditsimpactonDNAmethylationandH3K9dimethylationinvivo.Genes&development25,137-152.
Rincon-Arano,H.,Halow,J.,Delrow,J.J.,Parkhurst,S.M.,andGroudine,M.(2012).UpSETRecruitsHDACComplexesandRestrictsChromatinAccessibilityandAcetylationatPromoterRegions.Cell151,1214-1228.
Segal,D.J.,Beerli,R.R.,Blancafort,P.,Dreier,B.,Effertz,K.,Huber,A.,Koksch,B.,Lund,C.V.,Magnenat,L.,Valente,D.,etal.(2003).EvaluationofamodularstrategyfortheconstructionofnovelpolydactylzincfingerDNA-bindingproteins.Biochemistry42,2137-2148.
Smith,E.,andShilatifard,A.(2010).Thechromatinsignalingpathway:diversemechanismsofrecruitmentofhistone-modifyingenzymesandvariedbiologicaloutcomes.Molecularcell40,689-701.
Soppe,W.J.,Jacobsen,S.E.,Alonso-Blanco,C.,Jackson,J.P.,Kakutani,T.,Koornneef,M.,andPeeters,A.J.(2000).Thelatefloweringphenotypeoffwamutantsiscausedbygain-of-functionepigeneticallelesofahomeodomaingene.Molecularcell6,791-802.
Springer,N.M.,Napoli,C.A.,Selinger,D.A.,Pandey,R.,Cone,K.C.,Chandler,V.L.,Kaeppler,H.F.,andKaeppler,S.M.(2003).ComparativeanalysisofSETdomainproteinsinmaizeandArabidopsisrevealsmultipleduplicationsprecedingthedivergenceofmonocotsanddicots.Plantphysiology132,907-925.
Stroud,H.,Greenberg,M.V.,Feng,S.,Bernatavichute,Y.V.,andJacobsen,S.E.(2013).ComprehensiveanalysisofsilencingmutantsrevealscomplexregulationoftheArabidopsismethylome.Cell152,352-364.
Wierzbicki,A.T.,Haag,J.R.,andPikaard,C.S.(2008).NoncodingtranscriptionbyRNApolymerasePolIVb/PolVmediatestranscriptionalsilencingofoverlappingandadjacentgenes.Cell135,635-648.
Wierzbicki,A.T.,Ream,T.S.,Haag,J.R.,andPikaard,C.S.(2009).RNApolymeraseVtranscriptionguidesARGONAUTE4tochromatin.Naturegenetics41,630-634.
Woo,H.R.,Dittmer,T.A.,andRichards,E.J.(2008).ThreeSRA-domainmethylcytosine-bindingproteinscooperatetomaintainglobalCpGmethylationandepigeneticsilencinginArabidopsis.PLoSgenetics4,e1000156.
Wu,H.,Min,J.,Lunin,V.V.,Antoshenko,T.,Dombrovski,L.,Zeng,H.,Allali-Hassani,A.,Campagna-Slater,V.,Vedadi,M.,Arrowsmith,C.H.,etal.(2010).StructuralbiologyofhumanH3K9methyltransferases.PloSone5,e8570.
Zhang,X.,Tamaru,H.,Khan,S.I.,Horton,J.R.,Keefe,L.J.,Selker,E.U.,andCheng,X.(2002).StructureoftheNeurosporaSETdomainproteinDIM-5,ahistoneH3lysinemethyltransferase.Cell111,117-127.
Zhang,X.,Yang,Z.,Khan,S.I.,Horton,J.R.,Tamaru,H.,Selker,E.U.,andCheng,X.(2003).Structuralbasisfortheproductspecificityofhistonelysinemethyltransferases.Molecularcell12,177-185.
Zhong,X.,Hale,C.J.,Law,J.A.,Johnson,L.M.,Feng,S.,Tu,A.,andJacobsen,S.E.(2012).DDRcomplexfacilitatesglobalassociationofRNApolymeraseVtopromotersandevolutionarilyyoungtransposons.Naturestructural&molecularbiology.
Clough,S.J.,andBent,A.F.(1998).Floraldip:asimplifiedmethodforAgrobacterium-mediatedtransformationofArabidopsisthaliana.ThePlantjournal:forcellandmolecularbiology16,735-743.
Law,J.A.,Du,J.,Hale,C.J.,Feng,S.,Krajewski,K.,Palanca,A.M.,Strahl,B.D.,Patel,D.J.,andJacobsen,S.E.(2013).PolymeraseIVoccupancyatRNA-directedDNAmethylationsitesrequiresSHH1.Nature498,385-389.
Sanjana,N.E.,Cong,L.,Zhou,Y.,Cunniff,M.M.,Feng,G.,andZhang,F.(2012).Atranscriptionactivator-likeeffectortoolboxforgenomeengineering.Natureprotocols7,171-192.
Valton,J.,Dupuy,A.,Daboussi,F.,Thomas,S.,Marechal,A.,Macmaster,R.,Melliand,K.,Juillerat,A.,andDuchateau,P.(2012).Overcomingtranscriptionactivator-likeeffector(TALE)DNAbindingdomainsensitivitytocytosinemethylation.TheJournalofbiologicalchemistry287,38427-38432.
GuillaumeMoissiard,ShawnJ.Cokus,JoshuaCary,SuhuaFeng,AllisonC.Billi,HumeStroud,DylanHusmann,YeZhan,BryanR.Lajoie,RachelPattonMcCord,ChristopherJ.Hale,WeiFeng,ScottD.Michaels,AlisonR.Frand,MatteoPellegrini,JobDekker,JohnK.Kim,andStevenE.Jacobsen.(2012)MORCFamilyATPasesRequiredforHeterochromatinCondensationandGeneSilencing.Science,336:1448-1451.
IanR.Henderson,AngeliqueDeleris,WilliamWong,XuehuaZhong,HangGyeongChin,GregoryA.Horwitz,KrystynaA.Kelly,SriharsaPradhan,StevenE.Jacobsen.(2010)TheDeNovoCytosineMethyltransferaseDRM2RequiresIntactUBADomainsandaCatalyticallyMutatedParalogDRM3duringRNA–DirectedDNAMethylationinArabidopsisthaliana.PLoSGenetics,(6)10:e1001182.
实施方案的陈述
1.一种用于减少植物中一种或更多种靶核酸的表达的方法,所述方法包括:
(a)提供包含重组核酸的植物,其中所述重组核酸编码包含第一氨基酸序列和第二氨基酸序列的重组多肽,所述第一氨基酸序列包含DNA结合结构域,所述第二氨基酸序列包含SHH1多肽或其片段;以及
(b)在由所述重组核酸编码的所述重组多肽藉以被表达并与所述一种或更多种靶核酸结合的条件下使所述植物生长,从而减少所述一种或更多种靶核酸的表达。
2.实施方案1的方法,其中所述DNA结合结构域包含锌指结构域。
3.实施方案2的方法,其中所述锌指结构域包含2个、3个、4个、5个、6个、7个、8个或9个锌指。
4.实施方案2的方法,其中所述锌指结构域为锌指阵列。
5.实施方案2的方法,其中所述锌指结构域选自由以下组成的组:Cys2His2(C2H2)锌指结构域、CCCH锌指结构域、多半胱氨酸锌指结构域和锌双核簇结构域。
6.实施方案1的方法,其中所述DNA结合结构域选自由以下组成的组:TAL效应子靶向结构域、螺旋-转角-螺旋家族DNA结合结构域、碱性结构域、带-螺旋-螺旋结构域(ribbon-helix-helixdomain)、TBP结构域、桶状二聚体结构域(barreldimerdomain)、真实同源结构域(realhomologydomain)、BAH结构域、SANT结构域、克罗莫结构域(Chromodomain)、Tudor结构域、布罗莫结构域(Bromodomain)、PHD结构域、WD40结构域和MBD结构域。
7.实施方案1的方法,其中所述DNA结合结构域包含TAL效应子靶向结构域。
8.实施方案1的方法,其中所述DNA结合结构域包含3个C2H2锌指结构域。
9.实施方案1-8任一项的方法,其中所述第二氨基酸序列包含同源结构域或SAWADEE结构域中的至少一个。
10.实施方案1的方法,其中所述第二氨基酸序列包含与SEQIDNO:1至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%相同的氨基酸序列。
11.实施方案1的方法,其中所述第二氨基酸序列包含与SEQIDNO:1100%相同的氨基酸序列。
12.实施方案1-11任一项的方法,其中所述重组多肽与RNA聚合酶相互作用。
13.实施方案12的方法,其中所述RNA聚合酶为RNA聚合酶IV。
14.实施方案1-13任一项的方法,其中所述重组多肽引起RNA指导的DNA甲基化。
15.实施方案1-14任一项的方法,其中所述一种或更多种靶核酸为内源核酸。
16.实施方案1-14任一项的方法,其中所述一种或更多种靶核酸为异源核酸。
17.实施方案1-16任一项的方法,其中所述一种或更多种靶核酸的表达被沉默。
18.一种重组核酸,所述重组核酸编码包含第一氨基酸序列和第二氨基酸序列的SHH1样蛋白,所述第一氨基酸序列包含DNA结合结构域,所述第二氨基酸序列包含SHH1多肽或其片段。
19.实施方案18的重组核酸,其中所述第二氨基酸序列包含与SEQIDNO:1至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%相同的氨基酸序列。
20.实施方案18的重组核酸,其中所述第二氨基酸序列包含与SEQIDNO:1100%相同的氨基酸序列。
21.实施方案18-20任一项的重组核酸,其中所述DNA结合结构域包含锌指结构域。
22.实施方案21的重组核酸,其中所述锌指结构域包含2个、3个、4个、5个、6个、7个、8个或9个锌指。
23.实施方案21的重组核酸,其中所述锌指结构域为锌指阵列。
24.实施方案21的重组核酸,其中所述锌指结构域选自由以下组成的组:C2H2锌指结构域、CCCH锌指结构域、多半胱氨酸锌指结构域和锌双核簇结构域。
25.实施方案18-20任一项的重组核酸,其中所述DNA结合结构域选自由以下组成的组:TAL效应子靶向结构域、螺旋-转角-螺旋家族DNA结合结构域、碱性结构域、带-螺旋-螺旋结构域、TBP结构域、桶状二聚体结构域、真实同源结构域、BAH结构域、SANT结构域、克罗莫结构域、Tudor结构域、布罗莫结构域、PHD结构域、WD40结构域和MBD结构域。
26.实施方案18-20任一项的重组核酸,其中所述DNA结合结构域包含TAL效应子靶向结构域。
27.实施方案18-20任一项的重组核酸,其中所述DNA结合结构域结合一种或更多种靶核酸。
28.实施方案27的重组核酸,其中所述一种或更多种靶核酸为编码多肽的核酸。
29.实施方案27的重组核酸,其中所述一种或更多种靶核酸为内源植物核酸。
30.实施方案27的重组核酸,其中所述一种或更多种靶核酸为异源核酸。
31.实施方案27-30任一项的重组核酸,其中所述SHH1样蛋白减少所述一种或更多种靶核酸的表达。
32.实施方案27-30任一项的重组核酸,其中所述SHH1样蛋白使所述一种或更多种靶核酸的表达沉默。
33.一种载体,所述载体包含实施方案18-32任一项的重组核酸,其中所述重组核酸被可操作地连接至调节序列。
34.一种宿主细胞,所述宿主细胞包含实施方案33的表达载体。
35.实施方案34的宿主细胞,其中所述宿主细胞为植物细胞。
36.一种重组植物,所述重组植物包含实施方案18-32任一项的重组核酸。
37.一种用于减少植物中一种或更多种靶核酸的表达的方法,所述方法包括:
(a)提供包含重组核酸的植物,其中所述重组核酸编码包含第一氨基酸序列和第二氨基酸序列的重组多肽,所述第一氨基酸序列包含DNA结合结构域,所述第二氨基酸序列包含SUVH2多肽或其片段、或SUVH9多肽或其片段;以及
(b)在由所述重组核酸编码的所述重组多肽藉以被表达并与所述一种或更多种靶核酸结合的条件下使所述植物生长,从而减少所述一种或更多种靶核酸的表达。
38.实施方案37的方法,其中所述DNA结合结构域包含锌指结构域。
39.实施方案38的方法,其中所述锌指结构域包含2个、3个、4个、5个、6个、7个、8个或9个锌指。
40.实施方案38的方法,其中所述锌指结构域为锌指阵列。
41.实施方案38的方法,其中所述锌指结构域选自由以下组成的组:Cys2His2(C2H2)锌指结构域、CCCH锌指结构域、多半胱氨酸锌指结构域和锌双核簇结构域。
42.实施方案37的方法,其中所述DNA结合结构域选自由以下组成的组:TAL效应子靶向结构域、螺旋-转角-螺旋家族DNA结合结构域、碱性结构域、带-螺旋-螺旋结构域、TBP结构域、桶状二聚体结构域、真实同源结构域、BAH结构域、SANT结构域、克罗莫结构域、Tudor结构域、布罗莫结构域、PHD结构域、WD40结构域和MBD结构域。
43.实施方案37的方法,其中所述DNA结合结构域包含TAL效应子靶向结构域。
44.实施方案37的方法,其中所述DNA结合结构域包含3个C2H2锌指结构域。
45.实施方案37-45任一项的方法,其中所述第二氨基酸序列包含选自由以下组成的组的结构域:双螺旋束结构域、SRA结构域、pre-SET结构域和SET结构域。
46.实施方案37的方法,其中所述第二氨基酸序列包含与SEQIDNO:14或SEQIDNO:27至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%相同的氨基酸序列。
47.实施方案37的方法,其中所述第二氨基酸序列包含与SEQIDNO:14或SEQIDNO:27100%相同的氨基酸序列。
48.实施方案37-47任一项的方法,其中所述重组多肽与RNA聚合酶相互作用。
49.实施方案48的方法,其中所述RNA聚合酶为RNA聚合酶V。
50.实施方案37-49任一项的方法,其中所述重组多肽引起RNA指导的DNA甲基化。
51.实施方案37-50任一项的方法,其中所述一种或更多种靶核酸为内源核酸。
52.实施方案37-50任一项的方法,其中所述一种或更多种靶核酸为异源核酸。
53.实施方案37-52任一项的方法,其中所述一种或更多种靶核酸的表达被沉默。
54.一种重组核酸,所述重组核酸编码包含第一氨基酸序列和第二氨基酸序列的SUVH2样蛋白或SUVH9样蛋白,所述第一氨基酸序列包含DNA结合结构域,所述第二氨基酸序列包含SUVH2多肽或其片段、或SUVH9多肽或其片段。
55.实施方案54的重组核酸,其中所述第二氨基酸序列包含与SEQIDNO:14或SEQIDNO:27至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%相同的氨基酸序列。
56.实施方案54的重组核酸,其中所述第二氨基酸序列包含与SEQIDNO:14或SEQIDNO:27100%相同的氨基酸序列。
57.实施方案54-56任一项的重组核酸,其中所述DNA结合结构域包含锌指结构域。
58.实施方案57的重组核酸,其中所述锌指结构域包含2个、3个、4个、5个、6个、7个、8个或9个锌指。
59.实施方案57的重组核酸,其中所述锌指结构域为锌指阵列。
60.实施方案57的重组核酸,其中所述锌指结构域选自由以下组成的组:C2H2锌指结构域、CCCH锌指结构域、多半胱氨酸锌指结构域和锌双核簇结构域。
61.实施方案54-56任一项的重组核酸,其中所述DNA结合结构域选自由以下组成的组:TAL效应子靶向结构域、螺旋-转角-螺旋家族DNA结合结构域、碱性结构域、带-螺旋-螺旋结构域、TBP结构域、桶状二聚体结构域、真实同源结构域、BAH结构域、SANT结构域、克罗莫结构域、Tudor结构域、布罗莫结构域、PHD结构域、WD40结构域和MBD结构域。
62.实施方案54-56任一项的重组核酸,其中所述DNA结合结构域包含TAL效应子靶向结构域。
63.实施方案54-62任一项的重组核酸,其中所述DNA结合结构域结合一种或更多种靶核酸。
64.实施方案63的重组核酸,其中所述一种或更多种靶核酸为编码多肽的核酸。
65.实施方案63的重组核酸,其中所述一种或更多种靶核酸为内源植物核酸。
66.实施方案63的重组核酸,其中所述一种或更多种靶核酸为异源核酸。
67.实施方案63-66任一项的重组核酸,其中所述SUVH2样蛋白或SUVH9样蛋白减少所述一种或更多种靶核酸的表达。
68.一种载体,所述载体包含实施方案54-67任一项的重组核酸,其中所述重组核酸被可操作地连接至调节序列。
69.一种宿主细胞,所述宿主细胞包含实施方案68的表达载体。
70.实施方案69的宿主细胞,其中所述宿主细胞为植物细胞。
71.一种重组植物,所述重组植物包含实施方案54-67任一项的重组核酸。
72.一种用于减少植物中一种或更多种靶核酸的表达的方法,所述方法包括:
(a)提供植物,所述植物包含:
第一重组核酸,所述第一重组核酸编码包含第一氨基酸序列和第二氨基酸序列的第一重组多肽,所述第一氨基酸序列包含DNA结合结构域,所述第二氨基酸序列包含SHH1多肽或其片段,和
第二重组核酸,所述第二重组核酸编码包含第一氨基酸序列和第二氨基酸序列的第二重组多肽,所述第一氨基酸序列包含DNA结合结构域,所述第二氨基酸序列包含SUVH2多肽或其片段、或SUVH9多肽或其片段;以及
(b)在由所述第一重组核酸编码的所述第一重组多肽和由所述第二重组核酸编码的所述第二重组多肽藉以被表达并与所述一种或更多种靶核酸结合的条件下使所述植物生长,从而减少所述一种或更多种靶核酸的表达。
73.实施方案72的方法,其中所述第一重组多肽或第二重组多肽的至少一个引起RNA指导的DNA甲基化。
74.实施方案72-73任一项的方法,其中所述一种或更多种靶核酸为内源核酸。
75.实施方案72-73任一项的方法,其中所述一种或更多种靶核酸为异源核酸。
76.实施方案72-75任一项的方法,其中所述一种或更多种靶核酸的表达被沉默。
77.一种宿主细胞,所述宿主细胞包含实施方案33和68的表达载体。
78.实施方案77的宿主细胞,其中所述宿主细胞为植物细胞。
79.一种重组植物,所述重组植物包含实施方案18-32任一项和实施方案54-67任一项的重组核酸。
80.一种用于减少植物中一种或更多种靶核酸的表达的方法,所述方法包括:
(a)提供包含重组核酸的植物,其中所述重组核酸编码包含第一氨基酸序列和第二氨基酸序列的重组多肽,所述第一氨基酸序列包含DNA结合结构域,所述第二氨基酸序列包含DMS3多肽或其片段;以及
(b)在由所述重组核酸编码的所述重组多肽藉以被表达并与所述一种或更多种靶核酸结合的条件下使所述植物生长,从而减少所述一种或更多种靶核酸的表达。
81.实施方案80的方法,其中所述DNA结合结构域包含锌指结构域。
82.实施方案81的方法,其中所述锌指结构域包含2个、3个、4个、5个、6个、7个、8个或9个锌指。
83.实施方案81的方法,其中所述锌指结构域为锌指阵列。
84.实施方案81的方法,其中所述锌指结构域选自由以下组成的组:Cys2His2(C2H2)锌指结构域、CCCH锌指结构域、多半胱氨酸锌指结构域和锌双核簇结构域。
85.实施方案80的方法,其中所述DNA结合结构域选自由以下组成的组:TAL效应子靶向结构域、螺旋-转角-螺旋家族DNA结合结构域、碱性结构域、带-螺旋-螺旋结构域、TBP结构域、桶状二聚体结构域、真实同源结构域、BAH结构域、SANT结构域、克罗莫结构域、Tudor结构域、布罗莫结构域、PHD结构域、WD40结构域和MBD结构域。
86.实施方案80的方法,其中所述DNA结合结构域包含TAL效应子靶向结构域。
87.实施方案80的方法,其中所述DNA结合结构域包含3个C2H2锌指结构域。
88.实施方案80的方法,其中所述第二氨基酸序列包含与SEQIDNO:41至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%相同的氨基酸序列。
89.实施方案80的方法,其中所述第二氨基酸序列包含与SEQIDNO:41100%相同的氨基酸序列。
90.实施方案80-89任一项的方法,其中所述重组多肽与RNA聚合酶相互作用。
91.实施方案80-90任一项的方法,其中所述重组多肽引起RNA指导的DNA甲基化。
92.实施方案80-91任一项的方法,其中所述一种或更多种靶核酸为内源核酸。
93.实施方案80-91任一项的方法,其中所述一种或更多种靶核酸为异源核酸。
94.实施方案80-93任一项的方法,其中所述一种或更多种靶核酸的表达被沉默。
95.一种重组核酸,所述重组核酸编码包含第一氨基酸序列和第二氨基酸序列的DMS3样蛋白,所述第一氨基酸序列包含DNA结合结构域,所述第二氨基酸序列包含DMS3多肽或其片段。
96.实施方案95的重组核酸,其中所述第二氨基酸序列包含与SEQIDNO:41至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%相同的氨基酸序列。
97.实施方案96的重组核酸,其中所述第二氨基酸序列包含与SEQIDNO:41100%相同的氨基酸序列。
98.实施方案95-97任一项的重组核酸,其中所述DNA结合结构域包含锌指结构域。
99.实施方案98的重组核酸,其中所述锌指结构域包含2个、3个、4个、5个、6个、7个、8个或9个锌指。
100.实施方案98的重组核酸,其中所述锌指结构域为锌指阵列。
101.实施方案98的重组核酸,其中所述锌指结构域选自由以下组成的组:C2H2锌指结构域、CCCH锌指结构域、多半胱氨酸锌指结构域和锌双核簇结构域。
102.实施方案95-97任一项的重组核酸,其中所述DNA结合结构域选自由以下组成的组:TAL效应子靶向结构域、螺旋-转角-螺旋家族DNA结合结构域、碱性结构域、带-螺旋-螺旋结构域、TBP结构域、桶状二聚体结构域、真实同源结构域、BAH结构域、SANT结构域、克罗莫结构域、Tudor结构域、布罗莫结构域、PHD结构域、WD40结构域和MBD结构域。
103.实施方案95-97任一项的重组核酸,其中所述DNA结合结构域包含TAL效应子靶向结构域。
104.实施方案95-97任一项的重组核酸,其中所述DNA结合结构域结合一种或更多种靶核酸。
105.实施方案104的重组核酸,其中所述一种或更多种靶核酸为编码多肽的核酸。
106.实施方案104的重组核酸,其中所述一种或更多种靶核酸为内源植物核酸。
107.实施方案104的重组核酸,其中所述一种或更多种靶核酸为异源核酸。
108.实施方案104-107任一项的重组核酸,其中所述DMS3样蛋白减少所述一种或更多种靶核酸的表达。
109.实施方案104-107任一项的重组核酸,其中所述DMS3样蛋白使所述一种或更多种靶核酸的表达沉默。
110.一种载体,所述载体包含实施方案95-109任一项的重组核酸,其中所述重组核酸被可操作地连接至调节序列。
111.一种宿主细胞,所述宿主细胞包含实施方案110的表达载体。
112.实施方案111的宿主细胞,其中所述宿主细胞为植物细胞。
113.一种重组植物,所述重组植物包含实施方案95-112任一项的重组核酸。
114.一种用于减少植物中一种或更多种靶核酸的表达的方法,所述方法包括:
(a)提供包含重组核酸的植物,其中所述重组核酸编码包含第一氨基酸序列和第二氨基酸序列的重组多肽,所述第一氨基酸序列包含DNA结合结构域,所述第二氨基酸序列包含MORC6多肽或其片段;以及
(b)在由所述重组核酸编码的所述重组多肽藉以被表达并与所述一种或更多种靶核酸结合的条件下使所述植物生长,从而减少所述一种或更多种靶核酸的表达。
115.实施方案114的方法,其中所述DNA结合结构域包含锌指结构域。
116.实施方案115的方法,其中所述锌指结构域包含2个、3个、4个、5个、6个、7个、8个或9个锌指。
117.实施方案115的方法,其中所述锌指结构域为锌指阵列。
118.实施方案115的方法,其中所述锌指结构域选自由以下组成的组:Cys2His2(C2H2)锌指结构域、CCCH锌指结构域、多半胱氨酸锌指结构域和锌双核簇结构域。
119.实施方案114的方法,其中所述DNA结合结构域选自由以下组成的组:TAL效应子靶向结构域、螺旋-转角-螺旋家族DNA结合结构域、碱性结构域、带-螺旋-螺旋结构域、TBP结构域、桶状二聚体结构域、真实同源结构域、BAH结构域、SANT结构域、克罗莫结构域、Tudor结构域、布罗莫结构域、PHD结构域、WD40结构域和MBD结构域。
120.实施方案114的方法,其中所述DNA结合结构域包含TAL效应子靶向结构域。
121.实施方案114的方法,其中所述DNA结合结构域包含3个C2H2锌指结构域。
122.实施方案114的方法,其中所述第二氨基酸序列包含与SEQIDNO:53至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%相同的氨基酸序列。
123.实施方案114的方法,其中所述第二氨基酸序列包括与SEQIDNO:53100%相同的氨基酸序列。
124.实施方案114-123任一项的方法,其中所述重组多肽与RNA聚合酶相互作用。
125.实施方案114-123任一项的方法,其中所述重组多肽引起RNA指导的DNA甲基化。
126.实施方案114-125任一项的方法,其中所述一种或更多种靶核酸为内源核酸。
127.实施方案114-125任一项的方法,其中所述一种或更多种靶核酸为异源核酸。
128.实施方案114-127任一项的方法,其中所述一种或更多种靶核酸的表达被沉默。
129.一种重组核酸,所述重组核酸编码包含第一氨基酸序列和第二氨基酸序列的MORC6样蛋白,所述第一氨基酸序列包含DNA结合结构域,所述第二氨基酸序列包含MORC6多肽或其片段。
130.实施方案129的重组核酸,其中所述第二氨基酸序列包含与SEQIDNO:53至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%相同的氨基酸序列。
131.实施方案130的重组核酸,其中所述第二氨基酸序列包含与SEQIDNO:53100%相同的氨基酸序列。
132.实施方案129-131任一项的重组核酸,其中所述DNA结合结构域包含锌指结构域。
133.实施方案132的重组核酸,其中所述锌指结构域包含2个、3个、4个、5个、6个、7个、8个或9个锌指。
134.实施方案132的重组核酸,其中所述锌指结构域为锌指阵列。
135.实施方案132的重组核酸,其中所述锌指结构域选自由以下组成的组:C2H2锌指结构域、CCCH锌指结构域、多半胱氨酸锌指结构域和锌双核簇结构域。
136.实施方案129-131任一项的重组核酸,其中所述DNA结合结构域选自由以下组成的组:TAL效应子靶向结构域、螺旋-转角-螺旋家族DNA结合结构域、碱性结构域、带-螺旋-螺旋结构域、TBP结构域、桶状二聚体结构域、真实同源结构域、BAH结构域、SANT结构域、克罗莫结构域、Tudor结构域、布罗莫结构域、PHD结构域、WD40结构域和MBD结构域。
137.实施方案129-131任一项的重组核酸,其中所述DNA结合结构域包含TAL效应子靶向结构域。
138.实施方案129-131任一项的重组核酸,其中所述DNA结合结构域结合一种或更多种靶核酸。
139.实施方案138的重组核酸,其中所述一种或更多种靶核酸为编码多肽的核酸。
140.实施方案138的重组核酸,其中所述一种或更多种靶核酸为内源植物核酸。
141.实施方案138的重组核酸,其中所述一种或更多种靶核酸为异源核酸。
142.实施方案138-141任一项的重组核酸,其中所述MORC6样蛋白减少所述一种或更多种靶核酸的表达。
143.实施方案138-141任一项的重组核酸,其中所述MORC6样蛋白使所述一种或更多种靶核酸的表达沉默。
144.一种载体,所述载体包含实施方案114-143任一项的重组核酸,其中所述重组核酸被可操作地连接至调节序列。
145.一种宿主细胞,所述宿主细胞包含实施方案144的表达载体。
146.实施方案145的宿主细胞,其中所述宿主细胞为植物细胞。
147.一种重组植物,所述重组植物包含实施方案114-143任一项的重组核酸。
148.一种用于减少植物中一种或更多种靶核酸的表达的方法,所述方法包括:
(a)提供包含重组核酸的植物,其中所述重组核酸编码包含第一氨基酸序列和第二氨基酸序列的重组多肽,所述第一氨基酸序列包含DNA结合结构域,所述第二氨基酸序列包含SUVR2多肽或其片段;以及
(b)在由所述重组核酸编码的所述重组多肽藉以被表达并与所述一种或更多种靶核酸结合的条件下使所述植物生长,从而减少所述一种或更多种靶核酸的表达。
149.实施方案148的方法,其中所述DNA结合结构域包含锌指结构域。
150.实施方案149的方法,其中所述锌指结构域包含2个、3个、4个、5个、6个、7个、8个或9个锌指。
151.实施方案149的方法,其中所述锌指结构域为锌指阵列。
152.实施方案149的方法,其中所述锌指结构域选自由以下组成的组:Cys2His2(C2H2)锌指结构域、CCCH锌指结构域、多半胱氨酸锌指结构域和锌双核簇结构域。
153.实施方案148的方法,其中所述DNA结合结构域选自由以下组成的组:TAL效应子靶向结构域、螺旋-转角-螺旋家族DNA结合结构域、碱性结构域、带-螺旋-螺旋结构域、TBP结构域、桶状二聚体结构域、真实同源结构域、BAH结构域、SANT结构域、克罗莫结构域、Tudor结构域、布罗莫结构域、PHD结构域、WD40结构域和MBD结构域。
154.实施方案148的方法,其中所述DNA结合结构域包含TAL效应子靶向结构域。
155.实施方案148的方法,其中所述DNA结合结构域包含3个C2H2锌指结构域。
156.实施方案148的方法,其中所述第二氨基酸序列包含与SEQIDNO:66至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%相同的氨基酸序列。
157.实施方案148的方法,其中所述第二氨基酸序列包含与SEQIDNO:66100%相同的氨基酸序列。
158.实施方案148-157任一项的方法,其中所述重组多肽与RNA聚合酶相互作用。
159.实施方案148-157任一项的方法,其中所述重组多肽诱导RNA指导的DNA甲基化。
160.实施方案148-159任一项的方法,其中所述一种或更多种靶核酸为内源核酸。
161.实施方案148-159任一项的方法,其中所述一种或更多种靶核酸为异源核酸。
162.实施方案148-161任一项的方法,其中所述一种或更多种靶核酸的表达被沉默。
163.一种重组核酸,所述重组核酸编码包含第一氨基酸序列和第二氨基酸序列的SUVR2样蛋白,所述第一氨基酸序列包含DNA结合结构域,所述第二氨基酸序列包含SUVR2多肽或其片段。
164.实施方案163的重组核酸,其中所述第二氨基酸序列包含与SEQIDNO:66至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%相同的氨基酸序列。
165.实施方案164的重组核酸,其中所述第二氨基酸序列包含与SEQIDNO:66100%相同的氨基酸序列。
166.实施方案163-165任一项的重组核酸,其中所述DNA结合结构域包含锌指结构域。
167.实施方案166的重组核酸,其中所述锌指结构域包含2个、3个、4个、5个、6个、7个、8个或9个锌指。
168.实施方案166的重组核酸,其中所述锌指结构域为锌指阵列。
169.实施方案166的重组核酸,其中所述锌指结构域选自由以下组成的组:C2H2锌指结构域、CCCH锌指结构域、多半胱氨酸锌指结构域和锌双核簇结构域。
170.实施方案163-165任一项的重组核酸,其中所述DNA结合结构域选自由以下组成的组:TAL效应子靶向结构域、螺旋-转角-螺旋家族DNA结合结构域、碱性结构域、带-螺旋-螺旋结构域、TBP结构域、桶状二聚体结构域、真实同源结构域、BAH结构域、SANT结构域、克罗莫结构域、Tudor结构域、布罗莫结构域、PHD结构域、WD40结构域和MBD结构域。
171.实施方案163-165任一项的重组核酸,其中所述DNA结合结构域包含TAL效应子靶向结构域。
172.实施方案163-165任一项的重组核酸,其中所述DNA结合结构域结合一种或更多种靶核酸。
173.实施方案172的重组核酸,其中所述一种或更多种靶核酸为编码多肽的核酸。
174.实施方案172的重组核酸,其中所述一种或更多种靶核酸为内源植物核酸。
175.实施方案172的重组核酸,其中所述一种或更多种靶核酸为异源核酸。
176.实施方案172-175任一项的重组核酸,其中所述SUVR2样蛋白减少所述一种或更多种靶核酸的表达。
177.实施方案172-175任一项的重组核酸,其中所述SUVR2样蛋白使所述一种或更多种靶核酸的表达沉默。
178.一种载体,所述载体包含实施方案163-177任一项的重组核酸,其中所述重组核酸被可操作地连接至调节序列。
179.一种宿主细胞,所述宿主细胞包含实施方案178的表达载体。
180.实施方案179的宿主细胞,其中所述宿主细胞为植物细胞。
181.一种重组植物,所述重组植物包含实施方案163-177任一项的重组核酸。
182.一种用于减少植物中一种或更多种靶核酸的表达的方法,所述方法包括:
(a)提供植物,所述植物包含:
第一重组核酸,所述第一重组核酸编码包含第一氨基酸序列和第二氨基酸序列的第一重组多肽,所述第一氨基酸序列包含DNA结合结构域,所述第二氨基酸序列包含SHH1多肽或其片段,和
一种或更多种另外的重组核酸,所述一种或更多种另外的重组核酸编码一种或更多种另外的多肽,所述一种或更多种另外的多肽的每种包含第一氨基酸序列和第二氨基酸序列,所述第一氨基酸序列包含DNA结合结构域,所述第二氨基酸序列包含选自由以下组成的组的多肽:SUVH2多肽或其片段、SUVH9多肽或其片段、DMS3多肽或其片段、MORC6多肽或其片段和SUVR2多肽或其片段;以及
(b)在由所述第一重组核酸编码的所述第一重组多肽和由所述一种或更多种另外的重组核酸编码的所述一种或更多种另外的多肽藉以被表达并与所述一种或更多种靶核酸结合的条件下使所述植物生长,从而减少所述一种或更多种靶核酸的表达。
183.实施方案182的方法,其中所述重组多肽的至少一个引起RNA指导的DNA甲基化。
184.实施方案182-183任一项的方法,其中所述一种或更多种靶核酸为内源核酸。
185.实施方案182-183任一项的方法,其中所述一种或更多种靶核酸为异源核酸。
186.实施方案182-185任一项的方法,其中所述一种或更多种靶核酸的表达被沉默。
187.一种宿主细胞,所述宿主细胞包含表达载体,所述表达载体包含编码实施方案182的重组多肽的重组核酸。
188.实施方案187的宿主细胞,其中所述宿主细胞为植物细胞。
189.一种重组植物,所述重组植物包含实施方案182的重组核酸。
190.一种用于减少植物中一种或更多种靶核酸的表达的方法,所述方法包括:
(a)提供包含重组核酸的植物,其中所述重组核酸编码包含第一氨基酸序列和第二氨基酸序列的重组多肽,所述第一氨基酸序列包含DNA结合结构域,所述第二氨基酸序列包含DRD1多肽或其片段;以及
(b)在由所述重组核酸编码的所述重组多肽藉以被表达并与所述一种或更多种靶核酸结合的条件下使所述植物生长,从而减少所述一种或更多种靶核酸的表达。
191.实施方案190的方法,其中所述DNA结合结构域包含锌指结构域。
192.实施方案191的方法,其中所述锌指结构域包含2个、3个、4个、5个、6个、7个、8个或9个锌指。
193.实施方案191的方法,其中所述锌指结构域为锌指阵列。
194.实施方案191的方法,其中所述锌指结构域选自由以下组成的组:Cys2His2(C2H2)锌指结构域、CCCH锌指结构域、多半胱氨酸锌指结构域和锌双核簇结构域。
195.实施方案190的方法,其中所述DNA结合结构域选自由以下组成的组:TAL效应子靶向结构域、螺旋-转角-螺旋家族DNA结合结构域、碱性结构域、带-螺旋-螺旋结构域、TBP结构域、桶状二聚体结构域、真实同源结构域、BAH结构域、SANT结构域、克罗莫结构域、Tudor结构域、布罗莫结构域、PHD结构域、WD40结构域和MBD结构域。
196.实施方案190的方法,其中所述DNA结合结构域包含TAL效应子靶向结构域。
197.实施方案190的方法,其中所述DNA结合结构域包含3个C2H2锌指结构域。
198.实施方案190的方法,其中所述第二氨基酸序列包含与SEQIDNO:79至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%相同的氨基酸序列。
199.实施方案100的方法,其中所述第二氨基酸序列包含与SEQIDNO:79100%相同的氨基酸序列。
200.实施方案190-199任一项的方法,其中所述重组多肽与RNA聚合酶相互作用。
201.实施方案190-199任一项的方法,其中所述重组多肽引起RNA指导的DNA甲基化。
202.实施方案190-201任一项的方法,其中所述一种或更多种靶核酸为内源核酸。
203.实施方案190-201任一项的方法,其中所述一种或更多种靶核酸为异源核酸。
204.实施方案190-203任一项的方法,其中所述一种或更多种靶核酸的表达被沉默。
205.一种重组核酸,所述重组核酸编码包含第一氨基酸序列和第二氨基酸序列的DRD1样蛋白,所述第一氨基酸序列包含DNA结合结构域,所述第二氨基酸序列包含DRD1多肽或其片段。
206.实施方案205的重组核酸,其中所述第二氨基酸序列包含与SEQIDNO:79至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%相同的氨基酸序列。
207.实施方案206的重组核酸,其中所述第二氨基酸序列包含与SEQIDNO:79100%相同的氨基酸序列。
208.实施方案205-207任一项的重组核酸,其中所述DNA结合结构域包含锌指结构域。
209.实施方案208的重组核酸,其中所述锌指结构域包含2个、3个、4个、5个、6个、7个、8个或9个锌指。
210.实施方案208的重组核酸,其中所述锌指结构域为锌指阵列。
211.实施方案208的重组核酸,其中所述锌指结构域选自由以下组成的组:C2H2锌指结构域、CCCH锌指结构域、多半胱氨酸锌指结构域和锌双核簇结构域。
212.实施方案205-207任一项的重组核酸,其中所述DNA结合结构域选自由以下组成的组:TAL效应子靶向结构域、螺旋-转角-螺旋家族DNA结合结构域、碱性结构域、带-螺旋-螺旋结构域、TBP结构域、桶状二聚体结构域、真实同源结构域、BAH结构域、SANT结构域、克罗莫结构域、Tudor结构域、布罗莫结构域、PHD结构域、WD40结构域和MBD结构域。
213.实施方案205-207任一项的重组核酸,其中所述DNA结合结构域包含TAL效应子靶向结构域。
214.实施方案205-207任一项的重组核酸,其中所述DNA结合结构域结合一种或更多种靶核酸。
215.实施方案214的重组核酸,其中所述一种或更多种靶核酸为编码多肽的核酸。
216.实施方案214的重组核酸,其中所述一种或更多种靶核酸为内源植物核酸。
217.实施方案214的重组核酸,其中所述一种或更多种靶核酸为异源核酸。
218.实施方案214-217任一项的重组核酸,其中所述DRD1样蛋白减少所述一种或更多种靶核酸的表达。
219.实施方案214-217任一项的重组核酸,其中所述DRD1样蛋白使所述一种或更多种靶核酸的表达沉默。
220.一种载体,所述载体包含实施方案205-219任一项的重组核酸,其中所述重组核酸被可操作地连接至调节序列。
221.一种宿主细胞,所述宿主细胞包含实施方案220的表达载体。
222.实施方案221的宿主细胞,其中所述宿主细胞为植物细胞。
223.一种重组植物,所述重组植物包含实施方案205-219任一项的重组核酸。
224.一种用于减少植物中一种或更多种靶核酸的表达的方法,所述方法包括:
(a)提供包含重组核酸的植物,其中所述重组核酸编码包含第一氨基酸序列和第二氨基酸序列的重组多肽,所述第一氨基酸序列包含DNA结合结构域,所述第二氨基酸序列包含RDM1多肽或其片段;以及
(b)在由所述重组核酸编码的所述重组多肽藉以被表达并与所述一种或更多种靶核酸结合的条件下使所述植物生长,从而减少所述一种或更多种靶核酸的表达。
225.实施方案224的方法,其中所述DNA结合结构域包含锌指结构域。
226.实施方案225的方法,其中所述锌指结构域包含2个、3个、4个、5个、6个、7个、8个或9个锌指。
227.实施方案225的方法,其中所述锌指结构域为锌指阵列。
228.实施方案225的方法,其中所述锌指结构域选自由以下组成的组:Cys2His2(C2H2)锌指结构域、CCCH锌指结构域、多半胱氨酸锌指结构域和锌双核簇结构域。
229.实施方案224的方法,其中所述DNA结合结构域选自由以下组成的组:TAL效应子靶向结构域、螺旋-转角-螺旋家族DNA结合结构域、碱性结构域、带-螺旋-螺旋结构域、TBP结构域、桶状二聚体结构域、真实同源结构域、BAH结构域、SANT结构域、克罗莫结构域、Tudor结构域、布罗莫结构域、PHD结构域、WD40结构域和MBD结构域。
230.实施方案224的方法,其中所述DNA结合结构域包含TAL效应子靶向结构域。
231.实施方案224的方法,其中所述DNA结合结构域包含3个C2H2锌指结构域。
232.实施方案224的方法,其中所述第二氨基酸序列包含与SEQIDNO:91至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%相同的氨基酸序列。
233.实施方案232的方法,其中所述第二氨基酸序列包含与SEQIDNO:91100%相同的氨基酸序列。
234.实施方案224-233任一项的方法,其中所述重组多肽与RNA聚合酶相互作用。
235.实施方案224-233任一项的方法,其中所述重组多肽引起RNA指导的DNA甲基化。
236.实施方案224-235任一项的方法,其中所述一种或更多种靶核酸为内源核酸。
237.实施方案224-235任一项的方法,其中所述一种或更多种靶核酸为异源核酸。
238.实施方案224-237任一项的方法,其中所述一种或更多种靶核酸的表达被沉默。
239.一种重组核酸,所述重组核酸编码包含第一氨基酸序列和第二氨基酸序列的RDM1样蛋白,所述第一氨基酸序列包含DNA结合结构域,所述第二氨基酸序列包含RDM1多肽或其片段。
240.实施方案239的重组核酸,其中所述第二氨基酸序列包含与SEQIDNO:91至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%相同的氨基酸序列。
241.实施方案240的重组核酸,其中所述第二氨基酸序列包含与SEQIDNO:91100%相同的氨基酸序列。
242.实施方案239-241任一项的重组核酸,其中所述DNA结合结构域包含锌指结构域。
243.实施方案242的重组核酸,其中所述锌指结构域包含2个、3个、4个、5个、6个、7个、8个或9个锌指。
244.实施方案242的重组核酸,其中所述锌指结构域为锌指阵列。
245.实施方案242的重组核酸,其中所述锌指结构域选自由以下组成的组:C2H2锌指结构域、CCCH锌指结构域、多半胱氨酸锌指结构域和锌双核簇结构域。
246.实施方案239-241任一项的重组核酸,其中所述DNA结合结构域选自由以下组成的组:TAL效应子靶向结构域、螺旋-转角-螺旋家族DNA结合结构域、碱性结构域、带-螺旋-螺旋结构域、TBP结构域、桶状二聚体结构域、真实同源结构域、BAH结构域、SANT结构域、克罗莫结构域、Tudor结构域、布罗莫结构域、PHD结构域、WD40结构域和MBD结构域。
247.实施方案239-241任一项的重组核酸,其中所述DNA结合结构域包含TAL效应子靶向结构域。
248.实施方案239-241任一项的重组核酸,其中所述DNA结合结构域结合一种或更多种靶核酸。
249.实施方案248的重组核酸,其中所述一种或更多种靶核酸为编码多肽的核酸。
250.实施方案248的重组核酸,其中所述一种或更多种靶核酸为内源植物核酸。
251.实施方案248的重组核酸,其中所述一种或更多种靶核酸为异源核酸。
252.实施方案248-251任一项的重组核酸,其中所述RDM1样蛋白减少所述一种或更多种靶核酸的表达。
253.实施方案248-251任一项的重组核酸,其中所述RDM1样蛋白使所述一种或更多种靶核酸的表达沉默。
254.一种载体,所述载体包含实施方案239-253任一项的重组核酸,其中所述重组核酸被可操作地连接至调节序列。
255.一种宿主细胞,所述宿主细胞包含实施方案254的表达载体。
256.实施方案255的宿主细胞,其中所述宿主细胞为植物细胞。
257.一种重组植物,所述重组植物包含实施方案239-253任一项的重组核酸。
258.一种用于减少植物中一种或更多种靶核酸的表达的方法,所述方法包括:
(a)提供包含重组核酸的植物,其中所述重组核酸编码包含第一氨基酸序列和第二氨基酸序列的重组多肽,所述第一氨基酸序列包含DNA结合结构域,所述第二氨基酸序列包含DRM3多肽或其片段;以及
(b)在由所述重组核酸编码的所述重组多肽藉以被表达并与所述一种或更多种靶核酸结合的条件下使所述植物生长,从而减少所述一种或更多种靶核酸的表达。
259.实施方案258的方法,其中所述DNA结合结构域包含锌指结构域。
260.实施方案259的方法,其中所述锌指结构域包含2个、3个、4个、5个、6个、7个、8个或9个锌指。
261.实施方案259的方法,其中所述锌指结构域为锌指阵列。
262.实施方案259的方法,其中所述锌指结构域选自由以下组成的组:Cys2His2(C2H2)锌指结构域、CCCH锌指结构域、多半胱氨酸锌指结构域和锌双核簇结构域。
263.实施方案258的方法,其中所述DNA结合结构域选自由以下组成的组:TAL效应子靶向结构域、螺旋-转角-螺旋家族DNA结合结构域、碱性结构域、带-螺旋-螺旋结构域、TBP结构域、桶状二聚体结构域、真实同源结构域、BAH结构域、SANT结构域、克罗莫结构域、Tudor结构域、布罗莫结构域、PHD结构域、WD40结构域和MBD结构域。
264.实施方案258的方法,其中所述DNA结合结构域包含TAL效应子靶向结构域。
265.实施方案258的方法,其中所述DNA结合结构域包含3个C2H2锌指结构域。
266.实施方案258的方法,其中所述第二氨基酸序列包含与SEQIDNO:101至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%相同的氨基酸序列。
267.实施方案266的方法,其中所述第二氨基酸序列包含与SEQIDNO:101100%相同的氨基酸序列。
268.实施方案258-267任一项的方法,其中所述重组多肽与RNA聚合酶相互作用。
269.实施方案258-267任一项的方法,其中所述重组多肽引起RNA指导的DNA甲基化。
270.实施方案258-269任一项的方法,其中所述一种或更多种靶核酸为内源核酸。
271.实施方案258-269任一项的方法,其中所述一种或更多种靶核酸为异源核酸。
272.实施方案258-271任一项的方法,其中所述一种或更多种靶核酸的表达被沉默。
273.一种重组核酸,所述重组核酸编码包含第一氨基酸序列和第二氨基酸序列的DRM3样蛋白,所述第一氨基酸序列包含DNA结合结构域,所述第二氨基酸序列包含DRM3多肽或其片段。
274.实施方案273的重组核酸,其中所述第二氨基酸序列包含与SEQIDNO:101至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%相同的氨基酸序列。
275.实施方案274的重组核酸,其中所述第二氨基酸序列包含与SEQIDNO:101100%相同的氨基酸序列。
276.实施方案273-275任一项的重组核酸,其中所述DNA结合结构域包含锌指结构域。
277.实施方案276的重组核酸,其中所述锌指结构域包含2个、3个、4个、5个、6个、7个、8个或9个锌指。
278.实施方案276的重组核酸,其中所述锌指结构域为锌指阵列。
279.实施方案276的重组核酸,其中所述锌指结构域选自由以下组成的组:C2H2锌指结构域、CCCH锌指结构域、多半胱氨酸锌指结构域和锌双核簇结构域。
280.实施方案273-275任一项的重组核酸,其中所述DNA结合结构域选自由以下组成的组:TAL效应子靶向结构域、螺旋-转角-螺旋家族DNA结合结构域、碱性结构域、带-螺旋-螺旋结构域、TBP结构域、桶状二聚体结构域、真实同源结构域、BAH结构域、SANT结构域、克罗莫结构域、Tudor结构域、布罗莫结构域、PHD结构域、WD40结构域和MBD结构域。
281.实施方案273-275任一项的重组核酸,其中所述DNA结合结构域包含TAL效应子靶向结构域。
282.实施方案273-275任一项的重组核酸,其中所述DNA结合结构域结合一种或更多种靶核酸。
283.实施方案282的重组核酸,其中所述一种或更多种靶核酸为编码多肽的核酸。
284.实施方案282的重组核酸,其中所述一种或更多种靶核酸为内源植物核酸。
285.实施方案282的重组核酸,其中所述一种或更多种靶核酸为异源核酸。
286.实施方案282-285任一项的重组核酸,其中所述DRM3样蛋白减少所述一种或更多种靶核酸的表达。
287.实施方案282-285任一项的重组核酸,其中所述DRM3样蛋白使所述一种或更多种靶核酸的表达沉默。
288.一种载体,所述载体包含实施方案273-287任一项的重组核酸,其中所述重组核酸被可操作地连接至调节序列。
289.一种宿主细胞,所述宿主细胞包含实施方案288的表达载体。
290.实施方案289的宿主细胞,其中所述宿主细胞为植物细胞。
291.一种重组植物,所述重组植物包含实施方案273-287任一项的重组核酸。
292.一种用于减少植物中一种或更多种靶核酸的表达的方法,所述方法包括:
(a)提供包含重组核酸的植物,其中所述重组核酸编码包含第一氨基酸序列和第二氨基酸序列的重组多肽,所述第一氨基酸序列包含DNA结合结构域,所述第二氨基酸序列包含DRM2多肽或其片段;以及
(b)在由所述重组核酸编码的所述重组多肽藉以被表达并与所述一种或更多种靶核酸结合的条件下使所述植物生长,从而减少所述一种或更多种靶核酸的表达。
293.实施方案292的方法,其中所述DNA结合结构域包含锌指结构域。
294.实施方案293的方法,其中所述锌指结构域包含2个、3个、4个、5个、6个、7个、8个或9个锌指。
295.实施方案293的方法,其中所述锌指结构域为锌指阵列。
296.实施方案293的方法,其中所述锌指结构域选自由以下组成的组:Cys2His2(C2H2)锌指结构域、CCCH锌指结构域、多半胱氨酸锌指结构域和锌双核簇结构域。
297.实施方案292的方法,其中所述DNA结合结构域选自由以下组成的组:TAL效应子靶向结构域、螺旋-转角-螺旋家族DNA结合结构域、碱性结构域、带-螺旋-螺旋结构域、TBP结构域、桶状二聚体结构域、真实同源结构域、BAH结构域、SANT结构域、克罗莫结构域、Tudor结构域、布罗莫结构域、PHD结构域、WD40结构域和MBD结构域。
298.实施方案292的方法,其中所述DNA结合结构域包含TAL效应子靶向结构域。
299.实施方案292的方法,其中所述DNA结合结构域包含3个C2H2锌指结构域。
300.实施方案292的方法,其中所述第二氨基酸序列包含与SEQIDNO:113至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%相同的氨基酸序列。
301.实施方案300的方法,其中所述第二氨基酸序列包含与SEQIDNO:113100%相同的氨基酸序列。
302.实施方案292-301任一项的方法,其中所述重组多肽与RNA聚合酶相互作用。
303.实施方案292-301任一项的方法,其中所述重组多肽引起RNA指导的DNA甲基化。
304.实施方案292-303任一项的方法,其中所述一种或更多种靶核酸为内源核酸。
305.实施方案292-303任一项的方法,其中所述一种或更多种靶核酸为异源核酸。
306.实施方案292-305任一项的方法,其中所述一种或更多种靶核酸的表达被沉默。
307.一种重组核酸,所述重组核酸编码包含第一氨基酸序列和第二氨基酸序列的DRM2样蛋白,所述第一氨基酸序列包含DNA结合结构域,所述第二氨基酸序列包含DRM2多肽或其片段。
308.实施方案307的重组核酸,其中所述第二氨基酸序列包含与SEQIDNO:113至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%相同的氨基酸序列。
309.实施方案308的重组核酸,其中所述第二氨基酸序列包含与SEQIDNO:113100%相同的氨基酸序列。
310.实施方案307-309任一项的重组核酸,其中所述DNA结合结构域包含锌指结构域。
311.实施方案310的重组核酸,其中所述锌指结构域包含2个、3个、4个、5个、6个、7个、8个或9个锌指。
312.实施方案310的重组核酸,其中所述锌指结构域为锌指阵列。
313.实施方案310的重组核酸,其中所述锌指结构域选自由以下组成的组:C2H2锌指结构域、CCCH锌指结构域、多半胱氨酸锌指结构域和锌双核簇结构域。
314.实施方案307-309任一项的重组核酸,其中所述DNA结合结构域选自由以下组成的组:TAL效应子靶向结构域、螺旋-转角-螺旋家族DNA结合结构域、碱性结构域、带-螺旋-螺旋结构域、TBP结构域、桶状二聚体结构域、真实同源结构域、BAH结构域、SANT结构域、克罗莫结构域、Tudor结构域、布罗莫结构域、PHD结构域、WD40结构域和MBD结构域。
315.实施方案307-309任一项的重组核酸,其中所述DNA结合结构域包含TAL效应子靶向结构域。
316.实施方案307-309任一项的重组核酸,其中所述DNA结合结构域结合一种或更多种靶核酸。
317.实施方案316的重组核酸,其中所述一种或更多种靶核酸为编码多肽的核酸。
318.实施方案316的重组核酸,其中所述一种或更多种靶核酸为内源植物核酸。
319.实施方案316的重组核酸,其中所述一种或更多种靶核酸为异源核酸。
320.实施方案316-319任一项的重组核酸,其中所述DRM2样蛋白减少所述一种或更多种靶核酸的表达。
321.实施方案316-319任一项的重组核酸,其中所述DRM2样蛋白使所述一种或更多种靶核酸的表达沉默。
322.一种载体,所述载体包含实施方案307-321任一项的重组核酸,其中所述重组核酸被可操作地连接至调节序列。
323.一种宿主细胞,所述宿主细胞包含实施方案322的表达载体。
324.实施方案323的宿主细胞,其中所述宿主细胞为植物细胞。
325.一种重组植物,所述重组植物包含实施方案307-321任一项的重组核酸。
326.一种用于减少植物中一种或更多种靶核酸的表达的方法,所述方法包括:
(a)提供包含重组核酸的植物,其中所述重组核酸编码包含第一氨基酸序列和第二氨基酸序列的重组多肽,所述第一氨基酸序列包含DNA结合结构域,第二氨基酸序列包含FRG多肽或其片段;以及
(b)在由所述重组核酸编码的所述重组多肽藉以被表达并与所述一种或更多种靶核酸结合的条件下使所述植物生长,从而减少所述一种或更多种靶核酸的表达。
327.实施方案326的方法,其中所述DNA结合结构域包含锌指结构域。
328.实施方案327的方法,其中所述锌指结构域包含2个、3个、4个、5个、6个、7个、8个或9个锌指。
329.实施方案327的方法,其中所述锌指结构域为锌指阵列。
330.实施方案327的方法,其中所述锌指结构域选自由以下组成的组:Cys2His2(C2H2)锌指结构域、CCCH锌指结构域、多半胱氨酸锌指结构域和锌双核簇结构域。
331.实施方案326的方法,其中所述DNA结合结构域选自由以下组成的组:TAL效应子靶向结构域、螺旋-转角-螺旋家族DNA结合结构域、碱性结构域、带-螺旋-螺旋结构域、TBP结构域、桶状二聚体结构域、真实同源结构域、BAH结构域、SANT结构域、克罗莫结构域、Tudor结构域、布罗莫结构域、PHD结构域、WD40结构域和MBD结构域。
332.实施方案326的方法,其中所述DNA结合结构域包含TAL效应子靶向结构域。
333.实施方案326的方法,其中所述DNA结合结构域包含3个C2H2锌指结构域。
334.实施方案326的方法,其中所述第二氨基酸序列包含与SEQIDNO:125至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%相同的氨基酸序列。
335.实施方案334的方法,其中所述第二氨基酸序列包含与SEQIDNO:125100%相同的氨基酸序列。
336.实施方案326-335任一项的方法,其中所述重组多肽与RNA聚合酶相互作用。
337.实施方案326-335任一项的方法,其中所述重组多肽引起RNA指导的DNA甲基化。
338.实施方案326-337任一项的方法,其中所述一种或更多种靶核酸为内源核酸。
339.实施方案326-337任一项的方法,其中所述一种或更多种靶核酸为异源核酸。
340.实施方案326-339任一项的方法,其中所述一种或更多种靶核酸的表达被沉默。
341.一种重组核酸,所述重组核酸编码包含第一氨基酸序列和第二氨基酸序列的FRG样蛋白,所述第一氨基酸序列包含DNA结合结构域,所述第二氨基酸序列包含FRG多肽或其片段。
342.实施方案341的重组核酸,其中所述第二氨基酸序列包含与SEQIDNO:125至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%相同的氨基酸序列。
343.实施方案342的重组核酸,其中所述第二氨基酸序列包含与SEQIDNO:125100%相同的氨基酸序列。
344.实施方案341-343任一项的重组核酸,其中所述DNA结合结构域包含锌指结构域。
345.实施方案344的重组核酸,其中所述锌指结构域包含2个、3个、4个、5个、6个、7个、8个或9个锌指。
346.实施方案344的重组核酸,其中所述锌指结构域为锌指阵列。
347.实施方案344的重组核酸,其中所述锌指结构域选自由以下组成的组:C2H2锌指结构域、CCCH锌指结构域、多半胱氨酸锌指结构域和锌双核簇结构域。
348.实施方案341-343任一项的重组核酸,其中所述DNA结合结构域选自由以下组成的组:TAL效应子靶向结构域、螺旋-转角-螺旋家族DNA结合结构域、碱性结构域、带-螺旋-螺旋结构域、TBP结构域、桶状二聚体结构域、真实同源结构域、BAH结构域、SANT结构域、克罗莫结构域、Tudor结构域、布罗莫结构域、PHD结构域、WD40结构域和MBD结构域。
349.实施方案341-343任一项的重组核酸,其中所述DNA结合结构域包含TAL效应子靶向结构域。
350.实施方案341-343任一项的重组核酸,其中所述DNA结合结构域结合一种或更多种靶核酸。
351.实施方案350的重组核酸,其中所述一种或更多种靶核酸为编码多肽的核酸。
352.实施方案350的重组核酸,其中所述一种或更多种靶核酸为内源植物核酸。
353.实施方案350的重组核酸,其中所述一种或更多种靶核酸为异源核酸。
354.实施方案350-353任一项的重组核酸,其中所述FRG样蛋白减少所述一种或更多种靶核酸的表达。
355.实施方案350-353任一项的重组核酸,其中所述FRG样蛋白使所述一种或更多种靶核酸的表达沉默。
356.一种载体,所述载体包含实施方案341-355任一项的重组核酸,其中所述重组核酸被可操作地连接至调节序列。
357.一种宿主细胞,所述宿主细胞包含实施方案356的表达载体。
358.实施方案357的宿主细胞,其中所述宿主细胞为植物细胞。
359.一种重组植物,所述重组植物包含实施方案341-355任一项的重组核酸。
360.一种用于减少植物中一种或更多种靶核酸的表达的方法,所述方法包括:
(a)提供植物,所述植物包含:
第一重组核酸,所述第一重组核酸编码包含第一氨基酸序列和第二氨基酸序列的第一重组多肽,所述第一氨基酸序列包含DNA结合结构域,所述第二氨基酸序列包含SHH1多肽或其片段,和
一种或更多种另外的重组核酸,所述一种或更多种另外的重组核酸编码一种或更多种另外的多肽,所述一种或更多种另外的多肽的每种包含第一氨基酸序列和第二氨基酸序列,所述第一氨基酸序列包含DNA结合结构域,所述第二氨基酸序列包含选自由以下组成的组的多肽:SUVH2多肽或其片段、SUVH9多肽或其片段、DMS3多肽或其片段、MORC6多肽或其片段、SUVR2多肽或其片段、DRD1多肽或其片段、RDM1多肽或其片段、DRM3多肽或其片段、DRM2多肽或其片段和FRG多肽或其片段,以及
(b)在由所述第一重组核酸编码的所述第一重组多肽和由所述一种或更多种另外的重组核酸编码的所述一种或更多种另外的多肽藉以被表达并与所述一种或更多种靶核酸结合的条件下使所述植物生长,从而减少所述一种或更多种靶核酸的表达。
361.实施方案360的方法,其中所述重组多肽的至少一种引起RNA指导的DNA甲基化。
362.实施方案360-361任一项的方法,其中所述一种或更多种靶核酸为内源核酸。
363.实施方案360-361任一项的方法,其中所述一种或更多种靶核酸为异源核酸。
364.实施方案360-363任一项的方法,其中所述一种或更多种靶核酸的表达被沉默。
365.一种宿主细胞,所述宿主细胞包含编码实施方案360的重组多肽的重组核酸的表达载体。
366.实施方案365的宿主细胞,其中所述宿主细胞为植物细胞。
367.一种重组植物,所述重组植物包含实施方案360的重组核酸。
368.一种植物,所述植物由于实施方案1-17、37-53、80-94、114-128、148-162、190-204、224-238、258-272、292-306和326-340任一项的方法而具有一种或更多种靶核酸的减少的表达。
369.实施方案368的植物的后代植物。
370.实施方案369的后代植物,其中所述后代植物具有所述一种或更多种靶核酸的减少的表达且不包含所述重组核酸。
371.一种植物,所述植物由于实施方案72-76任一项的方法而具有一种或更多种靶核酸的减少的表达。
372.实施方案371的植物的后代植物。
373.实施方案372的后代植物,其中所述后代植物具有所述一种或更多种靶核酸的减少的表达且不包含所述第一重组核酸或第二重组核酸。
374.一种植物,所述植物由于实施方案182-186和360-364任一项的方法而具有一种或更多种靶核酸的减少的表达。
375.实施方案374的植物的后代植物。
376.实施方案375的后代植物,其中所述后代植物具有所述一种或更多种靶核酸的减少的表达且不包含所述第一重组核酸或所述一种或更多种另外的重组核酸。
Claims (79)
1.一种用于减少植物中一种或更多种靶核酸的表达的方法,所述方法包括:
(a)提供包含重组核酸的植物,其中所述重组核酸编码包含第一氨基酸序列和第二氨基酸序列的重组多肽,所述第一氨基酸序列包含DNA结合结构域,所述第二氨基酸序列包含SHH1多肽或其片段;以及
b)在由所述重组核酸编码的所述重组多肽藉以被表达并与所述一种或更多种靶核酸结合的条件下使所述植物生长,从而减少所述一种或更多种靶核酸的表达。
2.根据权利要求1所述的方法,其中所述DNA结合结构域包含锌指结构域。
3.根据权利要求2所述的方法,其中所述锌指结构域包含2个、3个、4个、5个、6个、7个、8个或9个锌指。
4.根据权利要求2所述的方法,其中所述锌指结构域为锌指阵列。
5.根据权利要求2所述的方法,其中所述锌指结构域选自由以下组成的组:Cys2His2(C2H2)锌指结构域、CCCH锌指结构域、多半胱氨酸锌指结构域和锌双核簇结构域。
6.根据权利要求1所述的方法,其中所述DNA结合结构域选自由以下组成的组:TAL效应子靶向结构域、螺旋-转角-螺旋家族DNA结合结构域、碱性结构域、带-螺旋-螺旋结构域、TBP结构域、桶状二聚体结构域、真实同源结构域、BAH结构域、SANT结构域、克罗莫结构域、Tudor结构域、布罗莫结构域、PHD结构域、WD40结构域和MBD结构域。
7.根据权利要求1所述的方法,其中所述DNA结合结构域包含TAL效应子靶向结构域。
8.根据权利要求1所述的方法,其中所述DNA结合结构域包含3个C2H2锌指结构域。
9.根据权利要求1-8中任一项所述的方法,其中所述第二氨基酸序列包含同源结构域或SAWADEE结构域中的至少一个。
10.根据权利要求1所述的方法,其中所述第二氨基酸序列包含与SEQIDNO:1至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%相同的氨基酸序列。
11.根据权利要求1所述的方法,其中所述第二氨基酸序列包含与SEQIDNO:1100%相同的氨基酸序列。
12.根据权利要求1-11中任一项所述的方法,其中所述重组多肽与RNA聚合酶相互作用。
13.根据权利要求12所述的方法,其中所述RNA聚合酶为RNA聚合酶IV。
14.根据权利要求1-13中任一项所述的方法,其中所述重组多肽引起RNA指导的DNA甲基化。
15.根据权利要求1-14中任一项所述的方法,其中所述一种或更多种靶核酸为内源核酸。
16.根据权利要求1-14中任一项所述的方法,其中所述一种或更多种靶核酸为异源核酸。
17.根据权利要求1-16中任一项所述的方法,其中所述一种或更多种靶核酸的表达被沉默。
18.一种重组核酸,所述重组核酸编码包含第一氨基酸序列和第二氨基酸序列的SHH1样蛋白,所述第一氨基酸序列包含DNA结合结构域,所述第二氨基酸序列包含SHH1多肽或其片段。
19.根据权利要求18所述的重组核酸,其中所述第二氨基酸序列包含与SEQIDNO:1至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%相同的氨基酸序列。
20.根据权利要求18所述的重组核酸,其中所述第二氨基酸序列包含与SEQIDNO:1100%相同的氨基酸序列。
21.根据权利要求18-20中任一项所述的重组核酸,其中所述DNA结合结构域包含锌指结构域。
22.根据权利要求21所述的重组核酸,其中所述锌指结构域包含2个、3个、4个、5个、6个、7个、8个或9个锌指。
23.根据权利要求21所述的重组核酸,其中所述锌指结构域为锌指阵列。
24.根据权利要求21所述的重组核酸,其中所述锌指结构域选自由以下组成的组:C2H2锌指结构域、CCCH锌指结构域、多半胱氨酸锌指结构域和锌双核簇结构域。
25.根据权利要求18-20中任一项所述的重组核酸,其中所述DNA结合结构域选自由以下组成的组:TAL效应子靶向结构域、螺旋-转角-螺旋家族DNA结合结构域、碱性结构域、带-螺旋-螺旋结构域、TBP结构域、桶状二聚体结构域、真实同源结构域、BAH结构域、SANT结构域、克罗莫结构域、Tudor结构域、布罗莫结构域、PHD结构域、WD40结构域和MBD结构域。
26.根据权利要求18-20中任一项所述的重组核酸,其中所述DNA结合结构域包含TAL效应子靶向结构域。
27.根据权利要求18-20中任一项所述的重组核酸,其中所述DNA结合结构域结合一种或更多种靶核酸。
28.根据权利要求27所述的重组核酸,其中所述一种或更多种靶核酸为编码多肽的核酸。
29.根据权利要求27所述的重组核酸,其中所述一种或更多种靶核酸为内源植物核酸。
30.根据权利要求27所述的重组核酸,其中所述一种或更多种靶核酸为异源核酸。
31.根据权利要求27-30中任一项所述的重组核酸,其中所述SHH1样蛋白减少所述一种或更多种靶核酸的表达。
32.根据权利要求27-30中任一项所述的重组核酸,其中所述SHH1样蛋白使所述一种或更多种靶核酸的表达沉默。
33.一种载体,所述载体包含根据权利要求18-32中任一项所述的重组核酸,其中所述重组核酸被可操作地连接至调节序列。
34.一种宿主细胞,所述宿主细胞包含根据权利要求33所述的表达载体。
35.根据权利要求34所述的宿主细胞,其中所述宿主细胞为植物细胞。
36.一种重组植物,所述重组植物包含根据权利要求18-32中任一项所述的重组核酸。
37.一种用于减少植物中一种或更多种靶核酸的表达的方法,所述方法包括:
(a)提供包含重组核酸的植物,其中所述重组核酸编码包含第一氨基酸序列和第二氨基酸序列的重组多肽,所述第一氨基酸序列包含DNA结合结构域,所述第二氨基酸序列包含SUVH2多肽或其片段、或SUVH9多肽或其片段;以及
b)在由所述重组核酸编码的所述重组多肽藉以被表达并与所述一种或更多种靶核酸结合的条件下使所述植物生长,从而减少所述一种或更多种靶核酸的表达。
38.根据权利要求37所述的方法,其中所述DNA结合结构域包含锌指结构域。
39.根据权利要求38所述的方法,其中所述锌指结构域包含2个、3个、4个、5个、6个、7个、8个或9个锌指。
40.根据权利要求38所述的方法,其中所述锌指结构域为锌指阵列。
41.根据权利要求38所述的方法,其中所述锌指结构域选自由以下组成的组:Cys2His2(C2H2)锌指结构域、CCCH锌指结构域、多半胱氨酸锌指结构域和锌双核簇结构域。
42.根据权利要求37所述的方法,其中所述DNA结合结构域选自由以下组成的组:TAL效应子靶向结构域、螺旋-转角-螺旋家族DNA结合结构域、碱性结构域、带-螺旋-螺旋结构域、TBP结构域、桶状二聚体结构域、真实同源结构域、BAH结构域、SANT结构域、克罗莫结构域、Tudor结构域、布罗莫结构域、PHD结构域、WD40结构域和MBD结构域。
43.根据权利要求37所述的方法,其中所述DNA结合结构域包含TAL效应子靶向结构域。
44.根据权利要求37所述的方法,其中所述DNA结合结构域包含3个C2H2锌指结构域。
45.根据权利要求37-45中任一项所述的方法,其中所述第二氨基酸序列包含选自由以下组成的组的结构域:双螺旋束结构域、SRA结构域、pre-SET结构域和SET结构域。
46.根据权利要求37所述的方法,其中所述第二氨基酸序列包含与SEQIDNO:14或SEQIDNO:27至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%相同的氨基酸序列。
47.根据权利要求37所述的方法,其中所述第二氨基酸序列包含与SEQIDNO:14或SEQIDNO:27100%相同的氨基酸序列。
48.根据权利要求37-47中任一项所述的方法,其中所述重组多肽与RNA聚合酶相互作用。
49.根据权利要求48所述的方法,其中所述RNA聚合酶为RNA聚合酶V。
50.根据权利要求37-49中任一项所述的方法,其中所述重组多肽引起RNA指导的DNA甲基化。
51.根据权利要求37-50中任一项所述的方法,其中所述一种或更多种靶核酸为内源核酸。
52.根据权利要求37-50中任一项所述的方法,其中所述一种或更多种靶核酸为异源核酸。
53.根据权利要求37-52中任一项所述的方法,其中所述一种或更多种靶核酸的表达被沉默。
54.一种重组核酸,所述重组核酸编码包含第一氨基酸序列和第二氨基酸序列的SUVH2样蛋白或SUVH9样蛋白,所述第一氨基酸序列包含DNA结合结构域,所述第二氨基酸序列包含SUVH2多肽或其片段、或SUVH9多肽或其片段。
55.根据权利要求54所述的重组核酸,其中所述第二氨基酸序列包含与SEQIDNO:14或SEQIDNO:27至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%相同的氨基酸序列。
56.根据权利要求54所述的重组核酸,其中所述第二氨基酸序列包含与SEQIDNO:14或SEQIDNO:27100%相同的氨基酸序列。
57.根据权利要求54-56中任一项所述的重组核酸,其中所述DNA结合结构域包含锌指结构域。
58.根据权利要求57所述的重组核酸,其中所述锌指结构域包含2个、3个、4个、5个、6个、7个、8个或9个锌指。
59.根据权利要求57所述的重组核酸,其中所述锌指结构域为锌指阵列。
60.根据权利要求57所述的重组核酸,其中所述锌指结构域选自由以下组成的组:C2H2锌指结构域、CCCH锌指结构域、多半胱氨酸锌指结构域和锌双核簇结构域。
61.根据权利要求54-56中任一项所述的重组核酸,其中所述DNA结合结构域选自由以下组成的组:TAL效应子靶向结构域、螺旋-转角-螺旋家族DNA结合结构域、碱性结构域、带-螺旋-螺旋结构域、TBP结构域、桶状二聚体结构域、真实同源结构域、BAH结构域、SANT结构域、克罗莫结构域、Tudor结构域、布罗莫结构域、PHD结构域、WD40结构域和MBD结构域。
62.根据权利要求54-56中任一项所述的重组核酸,其中所述DNA结合结构域包含TAL效应子靶向结构域。
63.根据权利要求54-62中任一项所述的重组核酸,其中所述DNA结合结构域结合一种或更多种靶核酸。
64.根据权利要求63所述的重组核酸,其中所述一种或更多种靶核酸为编码多肽的核酸。
65.根据权利要求63所述的重组核酸,其中所述一种或更多种靶核酸为内源植物核酸。
66.根据权利要求63所述的重组核酸,其中所述一种或更多种靶核酸为异源核酸。
67.根据权利要求63-66中任一项所述的重组核酸,其中所述SUVH2样蛋白或SUVH9样蛋白减少所述一种或更多种靶核酸的表达。
68.一种载体,所述载体包含根据权利要求54-67中任一项所述的重组核酸,其中所述重组核酸被可操作地连接至调节序列。
69.一种宿主细胞,所述宿主细胞包含根据权利要求68所述的表达载体。
70.根据权利要求69所述的宿主细胞,其中所述宿主细胞为植物细胞。
71.一种重组植物,所述重组植物包含根据权利要求54-67中任一项所述的重组核酸。
72.一种用于减少植物中一种或更多种靶核酸的表达的方法,所述方法包括:
a)提供植物,所述植物包含:
第一重组核酸,所述第一重组核酸编码包含第一氨基酸序列和第二氨基酸序列的第一重组多肽,所述第一氨基酸序列包含DNA结合结构域,所述第二氨基酸序列包含SHH1多肽或其片段,和
第二重组核酸,所述第二重组核酸编码包含第一氨基酸序列和第二氨基酸序列的第二重组多肽,所述第一氨基酸序列包含DNA结合结构域,所述第二氨基酸序列包含SUVH2多肽或其片段、或SUVH9多肽或其片段;以及
b)在由所述第一重组核酸编码的所述第一重组多肽和由所述第二重组核酸编码的所述第二重组多肽藉以被表达并与所述一种或更多种靶核酸结合的条件下使所述植物生长,从而减少所述一种或更多种靶核酸的表达。
73.根据权利要求72所述的方法,其中所述第一重组多肽或第二重组多肽中的至少一个引起RNA指导的DNA甲基化。
74.根据权利要求72-73中任一项所述的方法,其中所述一种或更多种靶核酸为内源核酸。
75.根据权利要求72-73中任一项所述的方法,其中所述一种或更多种靶核酸为异源核酸。
76.根据权利要求72-75中任一项所述的方法,其中所述一种或更多种靶核酸的表达被沉默。
77.一种宿主细胞,所述宿主细胞包含根据权利要求33和68所述的表达载体。
78.根据权利要求77所述的宿主细胞,其中所述宿主细胞为植物细胞。
79.一种重组植物,所述重组植物包含根据权利要求18-32中任一项和权利要求54-67中任一项所述的重组核酸。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710084543.XA CN106995820B (zh) | 2013-03-01 | 2014-02-28 | 用于将rna聚合酶和非编码rna生物发生靶向特定基因座的方法和组合物 |
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201361771743P | 2013-03-01 | 2013-03-01 | |
US61/771,743 | 2013-03-01 | ||
US201461929414P | 2014-01-20 | 2014-01-20 | |
US61/929,414 | 2014-01-20 | ||
PCT/US2014/019666 WO2014134567A1 (en) | 2013-03-01 | 2014-02-28 | Methods and compositions for targeting rna polymerases and non-coding rna biogenesis to specific loci |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710084543.XA Division CN106995820B (zh) | 2013-03-01 | 2014-02-28 | 用于将rna聚合酶和非编码rna生物发生靶向特定基因座的方法和组合物 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN105189760A true CN105189760A (zh) | 2015-12-23 |
Family
ID=51428873
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201480024967.1A Pending CN105189760A (zh) | 2013-03-01 | 2014-02-28 | 用于将rna聚合酶和非编码rna生物发生靶向特定基因座的方法和组合物 |
CN201710084543.XA Active CN106995820B (zh) | 2013-03-01 | 2014-02-28 | 用于将rna聚合酶和非编码rna生物发生靶向特定基因座的方法和组合物 |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710084543.XA Active CN106995820B (zh) | 2013-03-01 | 2014-02-28 | 用于将rna聚合酶和非编码rna生物发生靶向特定基因座的方法和组合物 |
Country Status (5)
Country | Link |
---|---|
US (2) | US10351867B2 (zh) |
EP (2) | EP3181694A1 (zh) |
CN (2) | CN105189760A (zh) |
BR (1) | BR112015021210B8 (zh) |
WO (1) | WO2014134567A1 (zh) |
Families Citing this family (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105189760A (zh) * | 2013-03-01 | 2015-12-23 | 加利福尼亚大学董事会 | 用于将rna聚合酶和非编码rna生物发生靶向特定基因座的方法和组合物 |
US11286493B2 (en) | 2016-05-27 | 2022-03-29 | The Regents Of The University Of California | Methods and compositions for targeting RNA polymerases and non-coding RNA biogenesis to specific loci |
EP3535416A4 (en) | 2016-11-04 | 2020-05-13 | Flagship Pioneering Innovations V. Inc. | NEW PLANT CELLS, PLANTS AND SEEDS |
CA3051585A1 (en) | 2017-01-28 | 2018-08-02 | Inari Agriculture, Inc. | Novel plant cells, plants, and seeds |
US11926835B1 (en) | 2018-01-29 | 2024-03-12 | Inari Agriculture Technology, Inc. | Methods for efficient tomato genome editing |
US11866719B1 (en) | 2018-06-04 | 2024-01-09 | Inari Agriculture Technology, Inc. | Heterologous integration of regulatory elements to alter gene expression in wheat cells and wheat plants |
CN112639096B (zh) * | 2018-07-25 | 2024-12-31 | 国立研究开发法人产业技术综合研究所 | 抑制植物中的靶dna的甲基化的方法 |
MX2021006937A (es) * | 2018-12-13 | 2021-07-15 | Synthetic Genomics Inc | Evitar el silenciamiento epigenetico del acido nucleico exogeno en las algas. |
CN110054670A (zh) * | 2019-04-04 | 2019-07-26 | 华中农业大学 | 一种可减小作物叶夹角的蛋白及其应用 |
CN114835816B (zh) * | 2021-01-14 | 2023-12-22 | 中国科学院遗传与发育生物学研究所 | 一种调控植物基因组dna特定区域甲基化水平的方法 |
WO2023028598A1 (en) * | 2021-08-26 | 2023-03-02 | Donald Danforth Plant Science Center | Engineering disease resistance by editing the epigenome |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2003010308A2 (en) * | 2001-07-24 | 2003-02-06 | Gene Expression Technologies Limited | Control of gene expression |
Family Cites Families (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4945050A (en) | 1984-11-13 | 1990-07-31 | Cornell Research Foundation, Inc. | Method for transporting substances into living cells and tissues and apparatus therefor |
US5569597A (en) | 1985-05-13 | 1996-10-29 | Ciba Geigy Corp. | Methods of inserting viral DNA into plant material |
US5268463A (en) | 1986-11-11 | 1993-12-07 | Jefferson Richard A | Plant promoter α-glucuronidase gene construct |
US5608142A (en) | 1986-12-03 | 1997-03-04 | Agracetus, Inc. | Insecticidal cotton plants |
US5641876A (en) | 1990-01-05 | 1997-06-24 | Cornell Research Foundation, Inc. | Rice actin gene and promoter |
ATE225853T1 (de) | 1990-04-12 | 2002-10-15 | Syngenta Participations Ag | Gewebe-spezifische promotoren |
US5498830A (en) | 1990-06-18 | 1996-03-12 | Monsanto Company | Decreased oil content in plant seeds |
US5399680A (en) | 1991-05-22 | 1995-03-21 | The Salk Institute For Biological Studies | Rice chitinase promoter |
JPH06510187A (ja) | 1991-08-27 | 1994-11-17 | ノバルティス アクチエンゲゼルシャフト | 同翅類昆虫に対する殺虫性質を有したタンパク質及び植物保護におけるそれらの用法 |
EP0652965A1 (en) | 1992-07-27 | 1995-05-17 | Pioneer Hi-Bred International, Inc. | An improved method of agrobacterium-mediated transformation of cultured soybean cells |
US5470353A (en) | 1993-10-20 | 1995-11-28 | Hollister Incorporated | Post-operative thermal blanket |
US5608144A (en) | 1994-08-12 | 1997-03-04 | Dna Plant Technology Corp. | Plant group 2 promoters and uses thereof |
US5750868A (en) | 1994-12-08 | 1998-05-12 | Pioneer Hi-Bred International, Inc. | Reversible nuclear genetic system for male sterility in transgenic plants |
US5967213A (en) | 1998-02-11 | 1999-10-19 | Springs Window Fashions Division, Inc. | Window cornice assembly |
WO2000047754A1 (en) | 1999-02-09 | 2000-08-17 | Rhobio | A method for inhibiting the expression of target genes in plants |
US20060041957A1 (en) * | 2004-06-09 | 2006-02-23 | Mcgonigle Brian | Recombinant constructs for use in reducing gene expression |
KR101034562B1 (ko) | 2009-06-03 | 2011-05-12 | 경희대학교 산학협력단 | 배추 유래의 su(var)3―9 호몰로그 2 단백질 및 이를 코딩하는 유전자 |
NZ599351A (en) * | 2009-10-22 | 2014-02-28 | Dow Agrosciences Llc | Engineered zinc finger proteins targeting plant genes involved in fatty acid biosynthesis |
EP3231872B1 (en) | 2010-03-08 | 2020-05-06 | Monsanto Technology LLC | Polynucleotide molecules for gene regulation in plants |
CN105189760A (zh) * | 2013-03-01 | 2015-12-23 | 加利福尼亚大学董事会 | 用于将rna聚合酶和非编码rna生物发生靶向特定基因座的方法和组合物 |
-
2014
- 2014-02-28 CN CN201480024967.1A patent/CN105189760A/zh active Pending
- 2014-02-28 US US14/772,066 patent/US10351867B2/en active Active
- 2014-02-28 BR BR112015021210A patent/BR112015021210B8/pt active IP Right Grant
- 2014-02-28 EP EP17154259.0A patent/EP3181694A1/en active Pending
- 2014-02-28 WO PCT/US2014/019666 patent/WO2014134567A1/en active Application Filing
- 2014-02-28 EP EP14757085.7A patent/EP2961845A4/en not_active Withdrawn
- 2014-02-28 CN CN201710084543.XA patent/CN106995820B/zh active Active
-
2019
- 2019-07-03 US US16/503,300 patent/US11479781B2/en active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2003010308A2 (en) * | 2001-07-24 | 2003-02-06 | Gene Expression Technologies Limited | Control of gene expression |
Non-Patent Citations (2)
Title |
---|
KUHLMANN,MARKUS ET AL.: "Developmentally non-redundant SET domain proteins SUVH2 and SUVH9 are required for transcriptional gene silencing in Arabidopsis thaliana,", 《PLANT MOLECULAR BIOLOGY》 * |
LAW JULIE ET AL.: "SHH1,a homeodomain protein required for DNA methylation,as well as RD42,RDM4,and chromatin remodeling factors,associate with RNA polymerase IV", 《PLOS GENETICS》 * |
Also Published As
Publication number | Publication date |
---|---|
BR112015021210B1 (pt) | 2022-10-18 |
WO2014134567A1 (en) | 2014-09-04 |
US20160017348A1 (en) | 2016-01-21 |
US20190390211A1 (en) | 2019-12-26 |
EP3181694A1 (en) | 2017-06-21 |
EP2961845A4 (en) | 2016-08-10 |
CN106995820B (zh) | 2020-12-01 |
US10351867B2 (en) | 2019-07-16 |
US11479781B2 (en) | 2022-10-25 |
BR112015021210A2 (pt) | 2017-10-10 |
BR112015021210B8 (pt) | 2022-11-16 |
EP2961845A1 (en) | 2016-01-06 |
CN106995820A (zh) | 2017-08-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11479781B2 (en) | Methods and compositions for targeting RNA polymerases and non-coding RNA biogenesis to specific loci | |
US11624070B2 (en) | Compositions and methods for modifying genomes | |
CN109312316B (zh) | 修饰基因组的组合物和方法 | |
US12043839B2 (en) | Methods and compositions for targeting RNA polymerases and non-coding RNA biogenesis to specific loci | |
US9624502B2 (en) | Methods of controlling plant seed and organ size | |
EP2422615B1 (en) | Dominant negative mutant krp protein protection of active cyclin-cdk complex inhibition by wild-type krp | |
Pegoraro et al. | Importance of heat shock proteins in maize | |
BR112016003776B1 (pt) | Polinucleotídeo, planta ou semente, complexo de polinucleotídeo,método para modificação de um sítio-alvo no genoma de uma célula, método para introduzir um polinucleotídeo de interesse, método para editar uma sequência de nucleotídeos, célula vegetal, método para selecionar uma planta | |
TW200844233A (en) | Optimized non-canonical zinc finger proteins | |
US10385356B1 (en) | Nitrogen uptake in plants | |
US10428336B2 (en) | Method for modulating plant growth | |
EP3150626A1 (en) | Means and methods for accelerated breeding by inducing targeted stimulation of meiotic recombination | |
US20250042956A1 (en) | Tools for gene silencing | |
WO2025038948A2 (en) | Alpha-crystalline domain proteins and their use in genome modification | |
US20150150156A1 (en) | Methods and compositions for reducing gene expression in plants | |
BR102014013302A2 (pt) | vetor de dna recombinante, método para produção de plantas geneticamente modificadas e seu uso |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
CB03 | Change of inventor or designer information |
Inventor after: Steve E Jacobsen Inventor after: Julie Law Inventor after: Leonna Johnson Inventor after: Javier Gallegos Inventor before: Steve E Jacobsen Inventor before: Julie Law Inventor before: Leonna Johnson |
|
COR | Change of bibliographic data | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20151223 |
|
WD01 | Invention patent application deemed withdrawn after publication |