CN112105732A - 用于多核苷酸的靶向编辑的方法和组合物 - Google Patents
用于多核苷酸的靶向编辑的方法和组合物 Download PDFInfo
- Publication number
- CN112105732A CN112105732A CN201880093322.1A CN201880093322A CN112105732A CN 112105732 A CN112105732 A CN 112105732A CN 201880093322 A CN201880093322 A CN 201880093322A CN 112105732 A CN112105732 A CN 112105732A
- Authority
- CN
- China
- Prior art keywords
- dna
- molecule
- seq
- sequence
- crrna
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 95
- 102000040430 polynucleotide Human genes 0.000 title claims description 61
- 108091033319 polynucleotide Proteins 0.000 title claims description 61
- 239000002157 polynucleotide Substances 0.000 title claims description 61
- 239000000203 mixture Substances 0.000 title abstract description 9
- 108020004414 DNA Proteins 0.000 claims abstract description 366
- 102000053602 DNA Human genes 0.000 claims abstract description 346
- 108091028113 Trans-activating crRNA Proteins 0.000 claims abstract description 205
- 230000004048 modification Effects 0.000 claims abstract description 39
- 238000012986 modification Methods 0.000 claims abstract description 39
- 108091032973 (ribonucleotides)n+m Proteins 0.000 claims abstract description 38
- 238000002703 mutagenesis Methods 0.000 claims abstract description 20
- 231100000350 mutagenesis Toxicity 0.000 claims abstract description 20
- 150000007523 nucleic acids Chemical group 0.000 claims description 221
- 210000004027 cell Anatomy 0.000 claims description 172
- 102000039446 nucleic acids Human genes 0.000 claims description 151
- 108020004707 nucleic acids Proteins 0.000 claims description 151
- 239000002773 nucleotide Substances 0.000 claims description 147
- 125000003729 nucleotide group Chemical group 0.000 claims description 146
- 241000196324 Embryophyta Species 0.000 claims description 131
- 108091028043 Nucleic acid sequence Proteins 0.000 claims description 126
- 230000014509 gene expression Effects 0.000 claims description 122
- 108090000765 processed proteins & peptides Proteins 0.000 claims description 110
- 102000004196 processed proteins & peptides Human genes 0.000 claims description 108
- 229920001184 polypeptide Polymers 0.000 claims description 107
- 230000000694 effects Effects 0.000 claims description 96
- 230000008685 targeting Effects 0.000 claims description 68
- 230000000295 complement effect Effects 0.000 claims description 62
- 108091033409 CRISPR Proteins 0.000 claims description 58
- 230000009466 transformation Effects 0.000 claims description 54
- 101710163270 Nuclease Proteins 0.000 claims description 51
- 238000003776 cleavage reaction Methods 0.000 claims description 47
- 230000007017 scission Effects 0.000 claims description 47
- 240000007594 Oryza sativa Species 0.000 claims description 41
- 235000007164 Oryza sativa Nutrition 0.000 claims description 40
- 235000009566 rice Nutrition 0.000 claims description 38
- 230000001404 mediated effect Effects 0.000 claims description 28
- 108010078067 RNA Polymerase III Proteins 0.000 claims description 20
- 102000014450 RNA Polymerase III Human genes 0.000 claims description 20
- 241000589158 Agrobacterium Species 0.000 claims description 17
- 108010009460 RNA Polymerase II Proteins 0.000 claims description 17
- 102000009572 RNA Polymerase II Human genes 0.000 claims description 17
- 230000002255 enzymatic effect Effects 0.000 claims description 17
- 230000004570 RNA-binding Effects 0.000 claims description 12
- 102000004190 Enzymes Human genes 0.000 claims description 11
- 108090000790 Enzymes Proteins 0.000 claims description 11
- 230000006780 non-homologous end joining Effects 0.000 claims description 11
- 240000000111 Saccharum officinarum Species 0.000 claims description 10
- 235000007201 Saccharum officinarum Nutrition 0.000 claims description 10
- 125000003275 alpha amino acid group Chemical group 0.000 claims description 10
- 238000010354 CRISPR gene editing Methods 0.000 claims description 9
- 230000008439 repair process Effects 0.000 claims description 9
- 210000000349 chromosome Anatomy 0.000 claims description 8
- 108060004795 Methyltransferase Proteins 0.000 claims description 7
- 230000015572 biosynthetic process Effects 0.000 claims description 7
- 210000003527 eukaryotic cell Anatomy 0.000 claims description 7
- 244000025254 Cannabis sativa Species 0.000 claims description 6
- 230000005782 double-strand break Effects 0.000 claims description 6
- 230000001172 regenerating effect Effects 0.000 claims description 5
- 101000615488 Homo sapiens Methyl-CpG-binding domain protein 2 Proteins 0.000 claims description 4
- 240000005979 Hordeum vulgare Species 0.000 claims description 4
- 235000007340 Hordeum vulgare Nutrition 0.000 claims description 4
- 241000209510 Liliopsida Species 0.000 claims description 4
- 102100021299 Methyl-CpG-binding domain protein 2 Human genes 0.000 claims description 4
- 102000016397 Methyltransferase Human genes 0.000 claims description 4
- CZPWVGJYEJSRLH-UHFFFAOYSA-N Pyrimidine Chemical compound C1=CN=CN=C1 CZPWVGJYEJSRLH-UHFFFAOYSA-N 0.000 claims description 4
- 210000003763 chloroplast Anatomy 0.000 claims description 4
- 241001233957 eudicotyledons Species 0.000 claims description 4
- 235000007319 Avena orientalis Nutrition 0.000 claims description 3
- 241000209763 Avena sativa Species 0.000 claims description 3
- 235000007558 Avena sp Nutrition 0.000 claims description 3
- 241000219310 Beta vulgaris subsp. vulgaris Species 0.000 claims description 3
- 235000014698 Brassica juncea var multisecta Nutrition 0.000 claims description 3
- 235000006008 Brassica napus var napus Nutrition 0.000 claims description 3
- 240000000385 Brassica napus var. napus Species 0.000 claims description 3
- 235000006618 Brassica rapa subsp oleifera Nutrition 0.000 claims description 3
- 235000004977 Brassica sinapistrum Nutrition 0.000 claims description 3
- 235000002566 Capsicum Nutrition 0.000 claims description 3
- 229920000742 Cotton Polymers 0.000 claims description 3
- 230000005778 DNA damage Effects 0.000 claims description 3
- 231100000277 DNA damage Toxicity 0.000 claims description 3
- 230000033616 DNA repair Effects 0.000 claims description 3
- 108010046331 Deoxyribodipyrimidine photo-lyase Proteins 0.000 claims description 3
- 244000068988 Glycine max Species 0.000 claims description 3
- 235000010469 Glycine max Nutrition 0.000 claims description 3
- 241000219146 Gossypium Species 0.000 claims description 3
- 244000020551 Helianthus annuus Species 0.000 claims description 3
- 235000003222 Helianthus annuus Nutrition 0.000 claims description 3
- 102100034343 Integrase Human genes 0.000 claims description 3
- 108010061833 Integrases Proteins 0.000 claims description 3
- 102000003960 Ligases Human genes 0.000 claims description 3
- 108090000364 Ligases Proteins 0.000 claims description 3
- 235000004431 Linum usitatissimum Nutrition 0.000 claims description 3
- 240000006240 Linum usitatissimum Species 0.000 claims description 3
- 235000007688 Lycopersicon esculentum Nutrition 0.000 claims description 3
- 244000061176 Nicotiana tabacum Species 0.000 claims description 3
- 235000002637 Nicotiana tabacum Nutrition 0.000 claims description 3
- 230000010718 Oxidation Activity Effects 0.000 claims description 3
- 239000006002 Pepper Substances 0.000 claims description 3
- 235000016761 Piper aduncum Nutrition 0.000 claims description 3
- 235000017804 Piper guineense Nutrition 0.000 claims description 3
- 235000008184 Piper nigrum Nutrition 0.000 claims description 3
- 108091093078 Pyrimidine dimer Proteins 0.000 claims description 3
- 102000018120 Recombinases Human genes 0.000 claims description 3
- 108010091086 Recombinases Proteins 0.000 claims description 3
- 240000003768 Solanum lycopersicum Species 0.000 claims description 3
- 244000061458 Solanum melongena Species 0.000 claims description 3
- 235000002597 Solanum melongena Nutrition 0.000 claims description 3
- 244000061456 Solanum tuberosum Species 0.000 claims description 3
- 235000002595 Solanum tuberosum Nutrition 0.000 claims description 3
- 240000006394 Sorghum bicolor Species 0.000 claims description 3
- 235000011684 Sorghum saccharatum Nutrition 0.000 claims description 3
- 235000021536 Sugar beet Nutrition 0.000 claims description 3
- 102000008579 Transposases Human genes 0.000 claims description 3
- 108010020764 Transposases Proteins 0.000 claims description 3
- 235000021307 Triticum Nutrition 0.000 claims description 3
- 240000008042 Zea mays Species 0.000 claims description 3
- 235000016383 Zea mays subsp huehuetenangensis Nutrition 0.000 claims description 3
- 235000002017 Zea mays subsp mays Nutrition 0.000 claims description 3
- 230000029936 alkylation Effects 0.000 claims description 3
- 238000005804 alkylation reaction Methods 0.000 claims description 3
- 230000009615 deamination Effects 0.000 claims description 3
- 238000006481 deamination reaction Methods 0.000 claims description 3
- 230000027832 depurination Effects 0.000 claims description 3
- 235000009973 maize Nutrition 0.000 claims description 3
- 239000013635 pyrimidine dimer Substances 0.000 claims description 3
- 210000003470 mitochondria Anatomy 0.000 claims description 2
- 244000203593 Piper nigrum Species 0.000 claims 1
- 244000098338 Triticum aestivum Species 0.000 claims 1
- 230000002538 fungal effect Effects 0.000 claims 1
- 238000003780 insertion Methods 0.000 abstract description 19
- 230000037431 insertion Effects 0.000 abstract description 19
- 108700019146 Transgenes Proteins 0.000 abstract description 18
- 108700028369 Alleles Proteins 0.000 abstract description 5
- 229920002477 rna polymer Polymers 0.000 description 221
- 108090000623 proteins and genes Proteins 0.000 description 114
- 241000193996 Streptococcus pyogenes Species 0.000 description 104
- 108020004566 Transfer RNA Proteins 0.000 description 82
- 230000035772 mutation Effects 0.000 description 63
- 102000004169 proteins and genes Human genes 0.000 description 60
- 125000006850 spacer group Chemical group 0.000 description 43
- 108091028664 Ribonucleotide Proteins 0.000 description 36
- 230000027455 binding Effects 0.000 description 36
- 239000002336 ribonucleotide Substances 0.000 description 36
- 125000002652 ribonucleotide group Chemical group 0.000 description 36
- 239000000523 sample Substances 0.000 description 31
- 238000009396 hybridization Methods 0.000 description 23
- 239000013598 vector Substances 0.000 description 23
- 108091026890 Coding region Proteins 0.000 description 21
- 238000003752 polymerase chain reaction Methods 0.000 description 21
- 230000001105 regulatory effect Effects 0.000 description 19
- 108020004999 messenger RNA Proteins 0.000 description 16
- 108020005004 Guide RNA Proteins 0.000 description 15
- DBMJMQXJHONAFJ-UHFFFAOYSA-M Sodium laurylsulphate Chemical compound [Na+].CCCCCCCCCCCCOS([O-])(=O)=O DBMJMQXJHONAFJ-UHFFFAOYSA-M 0.000 description 15
- 230000009977 dual effect Effects 0.000 description 15
- 210000001519 tissue Anatomy 0.000 description 15
- 238000012360 testing method Methods 0.000 description 14
- 238000012217 deletion Methods 0.000 description 12
- 230000037430 deletion Effects 0.000 description 12
- 238000013518 transcription Methods 0.000 description 12
- 230000035897 transcription Effects 0.000 description 12
- 102000040650 (ribonucleotides)n+m Human genes 0.000 description 11
- 238000004422 calculation algorithm Methods 0.000 description 10
- 230000009261 transgenic effect Effects 0.000 description 10
- 241000589155 Agrobacterium tumefaciens Species 0.000 description 9
- 241000702302 Wheat dwarf virus Species 0.000 description 9
- 238000006243 chemical reaction Methods 0.000 description 9
- 239000012634 fragment Substances 0.000 description 9
- 230000006870 function Effects 0.000 description 9
- 239000000463 material Substances 0.000 description 9
- 239000002245 particle Substances 0.000 description 9
- 238000003753 real-time PCR Methods 0.000 description 9
- 108020004705 Codon Proteins 0.000 description 8
- 101000606506 Homo sapiens Receptor-type tyrosine-protein phosphatase eta Proteins 0.000 description 8
- 108091034117 Oligonucleotide Proteins 0.000 description 8
- 102100039808 Receptor-type tyrosine-protein phosphatase eta Human genes 0.000 description 8
- 230000001965 increasing effect Effects 0.000 description 8
- 241000894007 species Species 0.000 description 8
- 108020005098 Anticodon Proteins 0.000 description 7
- 102100031780 Endonuclease Human genes 0.000 description 7
- 108010042407 Endonucleases Proteins 0.000 description 7
- 238000004458 analytical method Methods 0.000 description 7
- 238000010362 genome editing Methods 0.000 description 7
- 230000001976 improved effect Effects 0.000 description 7
- 238000012384 transportation and delivery Methods 0.000 description 7
- KOSRFJWDECSPRO-UHFFFAOYSA-N alpha-L-glutamyl-L-glutamic acid Natural products OC(=O)CCC(N)C(=O)NC(CCC(O)=O)C(O)=O KOSRFJWDECSPRO-UHFFFAOYSA-N 0.000 description 6
- 238000003556 assay Methods 0.000 description 6
- 150000001875 compounds Chemical class 0.000 description 6
- 108010034529 leucyl-lysine Proteins 0.000 description 6
- 238000003199 nucleic acid amplification method Methods 0.000 description 6
- 239000002777 nucleoside Substances 0.000 description 6
- -1 rRNA Proteins 0.000 description 6
- 230000008929 regeneration Effects 0.000 description 6
- 238000011069 regeneration method Methods 0.000 description 6
- 238000012546 transfer Methods 0.000 description 6
- 230000014616 translation Effects 0.000 description 6
- 238000005406 washing Methods 0.000 description 6
- 241000894006 Bacteria Species 0.000 description 5
- KCXVZYZYPLLWCC-UHFFFAOYSA-N EDTA Chemical compound OC(=O)CN(CC(O)=O)CCN(CC(O)=O)CC(O)=O KCXVZYZYPLLWCC-UHFFFAOYSA-N 0.000 description 5
- 241000588724 Escherichia coli Species 0.000 description 5
- 108091092195 Intron Proteins 0.000 description 5
- 108091093037 Peptide nucleic acid Proteins 0.000 description 5
- 241000700605 Viruses Species 0.000 description 5
- 230000003321 amplification Effects 0.000 description 5
- 230000001186 cumulative effect Effects 0.000 description 5
- 108010055341 glutamyl-glutamic acid Proteins 0.000 description 5
- 230000000670 limiting effect Effects 0.000 description 5
- 230000008569 process Effects 0.000 description 5
- 238000012545 processing Methods 0.000 description 5
- 210000001938 protoplast Anatomy 0.000 description 5
- 238000011160 research Methods 0.000 description 5
- 238000006467 substitution reaction Methods 0.000 description 5
- 238000013519 translation Methods 0.000 description 5
- 238000011144 upstream manufacturing Methods 0.000 description 5
- 241000219195 Arabidopsis thaliana Species 0.000 description 4
- ZHNUHDYFZUAESO-UHFFFAOYSA-N Formamide Chemical compound NC=O ZHNUHDYFZUAESO-UHFFFAOYSA-N 0.000 description 4
- 108091022912 Mannose-6-Phosphate Isomerase Proteins 0.000 description 4
- 238000007792 addition Methods 0.000 description 4
- 150000001413 amino acids Chemical class 0.000 description 4
- 108010092854 aspartyllysine Proteins 0.000 description 4
- 238000004113 cell culture Methods 0.000 description 4
- 230000001413 cellular effect Effects 0.000 description 4
- 239000003795 chemical substances by application Substances 0.000 description 4
- 238000001514 detection method Methods 0.000 description 4
- 125000003843 furanosyl group Chemical group 0.000 description 4
- 230000002068 genetic effect Effects 0.000 description 4
- 125000000623 heterocyclic group Chemical group 0.000 description 4
- 230000003993 interaction Effects 0.000 description 4
- 239000003550 marker Substances 0.000 description 4
- 125000002467 phosphate group Chemical group [H]OP(=O)(O[H])O[*] 0.000 description 4
- 239000013612 plasmid Substances 0.000 description 4
- 230000001131 transforming effect Effects 0.000 description 4
- 101100277553 Caenorhabditis elegans dep-1 gene Proteins 0.000 description 3
- 101150022074 DEP1 gene Proteins 0.000 description 3
- JBCLFWXMTIKCCB-UHFFFAOYSA-N H-Gly-Phe-OH Natural products NCC(=O)NC(C(O)=O)CC1=CC=CC=C1 JBCLFWXMTIKCCB-UHFFFAOYSA-N 0.000 description 3
- 108010033040 Histones Proteins 0.000 description 3
- 206010020649 Hyperkeratosis Diseases 0.000 description 3
- DRRXXZBXDMLGFC-IHRRRGAJSA-N Lys-Val-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCCCN DRRXXZBXDMLGFC-IHRRRGAJSA-N 0.000 description 3
- 238000012300 Sequence Analysis Methods 0.000 description 3
- 241000710145 Tomato bushy stunt virus Species 0.000 description 3
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 3
- 238000009825 accumulation Methods 0.000 description 3
- 230000000692 anti-sense effect Effects 0.000 description 3
- 108010062796 arginyllysine Proteins 0.000 description 3
- 230000008859 change Effects 0.000 description 3
- 230000001419 dependent effect Effects 0.000 description 3
- 238000009826 distribution Methods 0.000 description 3
- 230000034431 double-strand break repair via homologous recombination Effects 0.000 description 3
- 238000004520 electroporation Methods 0.000 description 3
- 239000003623 enhancer Substances 0.000 description 3
- 230000030279 gene silencing Effects 0.000 description 3
- 108010050848 glycylleucine Proteins 0.000 description 3
- 239000005090 green fluorescent protein Substances 0.000 description 3
- 108010025306 histidylleucine Proteins 0.000 description 3
- 238000002744 homologous recombination Methods 0.000 description 3
- 230000006801 homologous recombination Effects 0.000 description 3
- 230000001939 inductive effect Effects 0.000 description 3
- 108010057821 leucylproline Proteins 0.000 description 3
- 108010054155 lysyllysine Proteins 0.000 description 3
- 238000004519 manufacturing process Methods 0.000 description 3
- 230000011987 methylation Effects 0.000 description 3
- 238000007069 methylation reaction Methods 0.000 description 3
- 238000007899 nucleic acid hybridization Methods 0.000 description 3
- 150000003833 nucleoside derivatives Chemical class 0.000 description 3
- 125000003835 nucleoside group Chemical group 0.000 description 3
- 210000000056 organ Anatomy 0.000 description 3
- 230000008488 polyadenylation Effects 0.000 description 3
- 229920001223 polyethylene glycol Polymers 0.000 description 3
- 229920000642 polymer Polymers 0.000 description 3
- 210000001236 prokaryotic cell Anatomy 0.000 description 3
- 239000000126 substance Substances 0.000 description 3
- 239000000758 substrate Substances 0.000 description 3
- 108091029536 tRNA precursor Proteins 0.000 description 3
- 230000001052 transient effect Effects 0.000 description 3
- 108010073969 valyllysine Proteins 0.000 description 3
- 230000003612 virological effect Effects 0.000 description 3
- KDCGOANMDULRCW-UHFFFAOYSA-N 7H-purine Chemical compound N1=CNC2=NC=NC2=C1 KDCGOANMDULRCW-UHFFFAOYSA-N 0.000 description 2
- MDNAVFBZPROEHO-UHFFFAOYSA-N Ala-Lys-Val Natural products CC(C)C(C(O)=O)NC(=O)C(NC(=O)C(C)N)CCCCN MDNAVFBZPROEHO-UHFFFAOYSA-N 0.000 description 2
- 108020005544 Antisense RNA Proteins 0.000 description 2
- VNFWDYWTSHFRRG-SRVKXCTJSA-N Arg-Gln-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O VNFWDYWTSHFRRG-SRVKXCTJSA-N 0.000 description 2
- FSNVAJOPUDVQAR-AVGNSLFASA-N Arg-Lys-Arg Chemical compound NC(=N)NCCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O FSNVAJOPUDVQAR-AVGNSLFASA-N 0.000 description 2
- BDMIFVIWCNLDCT-CIUDSAMLSA-N Asn-Arg-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(O)=O BDMIFVIWCNLDCT-CIUDSAMLSA-N 0.000 description 2
- OPEPUCYIGFEGSW-WDSKDSINSA-N Asn-Gly-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O OPEPUCYIGFEGSW-WDSKDSINSA-N 0.000 description 2
- UJGRZQYSNYTCAX-SRVKXCTJSA-N Asp-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(O)=O UJGRZQYSNYTCAX-SRVKXCTJSA-N 0.000 description 2
- LTCKTLYKRMCFOC-KKUMJFAQSA-N Asp-Phe-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O LTCKTLYKRMCFOC-KKUMJFAQSA-N 0.000 description 2
- 108091079001 CRISPR RNA Proteins 0.000 description 2
- 241000218631 Coniferophyta Species 0.000 description 2
- 241000195493 Cryptophyta Species 0.000 description 2
- 229920000858 Cyclodextrin Polymers 0.000 description 2
- 101710135281 DNA polymerase III PolC-type Proteins 0.000 description 2
- 230000007018 DNA scission Effects 0.000 description 2
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 description 2
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 description 2
- 102000004163 DNA-directed RNA polymerases Human genes 0.000 description 2
- 108090000626 DNA-directed RNA polymerases Proteins 0.000 description 2
- 238000002965 ELISA Methods 0.000 description 2
- 108700024394 Exon Proteins 0.000 description 2
- 241000233866 Fungi Species 0.000 description 2
- NTBOEZICHOSJEE-YUMQZZPRSA-N Gly-Lys-Ser Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(O)=O NTBOEZICHOSJEE-YUMQZZPRSA-N 0.000 description 2
- 239000005562 Glyphosate Substances 0.000 description 2
- 101710154606 Hemagglutinin Proteins 0.000 description 2
- 238000009015 Human TaqMan MicroRNA Assay kit Methods 0.000 description 2
- BCISUQVFDGYZBO-QSFUFRPTSA-N Ile-Val-Asp Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC(O)=O BCISUQVFDGYZBO-QSFUFRPTSA-N 0.000 description 2
- FADYJNXDPBKVCA-UHFFFAOYSA-N L-Phenylalanyl-L-lysin Natural products NCCCCC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FADYJNXDPBKVCA-UHFFFAOYSA-N 0.000 description 2
- 241000880493 Leptailurus serval Species 0.000 description 2
- WUFYAPWIHCUMLL-CIUDSAMLSA-N Leu-Asn-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(O)=O WUFYAPWIHCUMLL-CIUDSAMLSA-N 0.000 description 2
- DBSLVQBXKVKDKJ-BJDJZHNGSA-N Leu-Ile-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C)C(O)=O DBSLVQBXKVKDKJ-BJDJZHNGSA-N 0.000 description 2
- YRRCOJOXAJNSAX-IHRRRGAJSA-N Leu-Pro-Lys Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCCN)C(=O)O)N YRRCOJOXAJNSAX-IHRRRGAJSA-N 0.000 description 2
- HQVDJTYKCMIWJP-YUMQZZPRSA-N Lys-Asn-Gly Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O HQVDJTYKCMIWJP-YUMQZZPRSA-N 0.000 description 2
- FACUGMGEFUEBTI-SRVKXCTJSA-N Lys-Asn-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)[C@@H](N)CCCCN FACUGMGEFUEBTI-SRVKXCTJSA-N 0.000 description 2
- WVJNGSFKBKOKRV-AJNGGQMLSA-N Lys-Leu-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WVJNGSFKBKOKRV-AJNGGQMLSA-N 0.000 description 2
- LJADEBULDNKJNK-IHRRRGAJSA-N Lys-Leu-Val Chemical compound CC(C)C[C@H](NC(=O)[C@@H](N)CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O LJADEBULDNKJNK-IHRRRGAJSA-N 0.000 description 2
- JMNRXRPBHFGXQX-GUBZILKMSA-N Lys-Ser-Glu Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CCC(O)=O JMNRXRPBHFGXQX-GUBZILKMSA-N 0.000 description 2
- RRIHXWPHQSXHAQ-XUXIUFHCSA-N Met-Ile-Lys Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCCN)C(O)=O RRIHXWPHQSXHAQ-XUXIUFHCSA-N 0.000 description 2
- 108010047562 NGR peptide Proteins 0.000 description 2
- 206010028980 Neoplasm Diseases 0.000 description 2
- 108010077850 Nuclear Localization Signals Proteins 0.000 description 2
- 108020004711 Nucleic Acid Probes Proteins 0.000 description 2
- 101710093908 Outer capsid protein VP4 Proteins 0.000 description 2
- 101710135467 Outer capsid protein sigma-1 Proteins 0.000 description 2
- WEMYTDDMDBLPMI-DKIMLUQUSA-N Phe-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N WEMYTDDMDBLPMI-DKIMLUQUSA-N 0.000 description 2
- IPFXYNKCXYGSSV-KKUMJFAQSA-N Phe-Ser-Lys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)O)N IPFXYNKCXYGSSV-KKUMJFAQSA-N 0.000 description 2
- 240000003889 Piper guineense Species 0.000 description 2
- 101710176177 Protein A56 Proteins 0.000 description 2
- 108091008103 RNA aptamers Proteins 0.000 description 2
- MIJWOJAXARLEHA-WDSKDSINSA-N Ser-Gly-Glu Chemical compound OC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCC(O)=O MIJWOJAXARLEHA-WDSKDSINSA-N 0.000 description 2
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 2
- 108091081024 Start codon Proteins 0.000 description 2
- 238000010459 TALEN Methods 0.000 description 2
- 108010043645 Transcription Activator-Like Effector Nucleases Proteins 0.000 description 2
- 241000209140 Triticum Species 0.000 description 2
- 102100033254 Tumor suppressor ARF Human genes 0.000 description 2
- 108010017070 Zinc Finger Nucleases Proteins 0.000 description 2
- 230000004075 alteration Effects 0.000 description 2
- 150000001408 amides Chemical class 0.000 description 2
- 230000001580 bacterial effect Effects 0.000 description 2
- 230000000975 bioactive effect Effects 0.000 description 2
- 230000003115 biocidal effect Effects 0.000 description 2
- 230000007321 biological mechanism Effects 0.000 description 2
- 239000001506 calcium phosphate Substances 0.000 description 2
- 229910000389 calcium phosphate Inorganic materials 0.000 description 2
- 235000011010 calcium phosphates Nutrition 0.000 description 2
- 201000011510 cancer Diseases 0.000 description 2
- 230000015556 catabolic process Effects 0.000 description 2
- 230000003197 catalytic effect Effects 0.000 description 2
- 235000013339 cereals Nutrition 0.000 description 2
- 230000002759 chromosomal effect Effects 0.000 description 2
- 239000002299 complementary DNA Substances 0.000 description 2
- 239000003184 complementary RNA Substances 0.000 description 2
- 230000000536 complexating effect Effects 0.000 description 2
- 230000003247 decreasing effect Effects 0.000 description 2
- 238000006731 degradation reaction Methods 0.000 description 2
- FSXRLASFHBWESK-UHFFFAOYSA-N dipeptide phenylalanyl-tyrosine Natural products C=1C=C(O)C=CC=1CC(C(O)=O)NC(=O)C(N)CC1=CC=CC=C1 FSXRLASFHBWESK-UHFFFAOYSA-N 0.000 description 2
- 201000010099 disease Diseases 0.000 description 2
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 2
- 210000005069 ears Anatomy 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- 239000013604 expression vector Substances 0.000 description 2
- 230000004720 fertilization Effects 0.000 description 2
- 108010063718 gamma-glutamylaspartic acid Proteins 0.000 description 2
- 238000003209 gene knockout Methods 0.000 description 2
- 238000010353 genetic engineering Methods 0.000 description 2
- XDDAORKBJWWYJS-UHFFFAOYSA-N glyphosate Chemical compound OC(=O)CNCP(O)(O)=O XDDAORKBJWWYJS-UHFFFAOYSA-N 0.000 description 2
- 229940097068 glyphosate Drugs 0.000 description 2
- 230000012010 growth Effects 0.000 description 2
- 239000000185 hemagglutinin Substances 0.000 description 2
- 230000002363 herbicidal effect Effects 0.000 description 2
- 239000004009 herbicide Substances 0.000 description 2
- 108010018006 histidylserine Proteins 0.000 description 2
- 238000000338 in vitro Methods 0.000 description 2
- 238000001727 in vivo Methods 0.000 description 2
- 208000015181 infectious disease Diseases 0.000 description 2
- 230000008595 infiltration Effects 0.000 description 2
- 238000001764 infiltration Methods 0.000 description 2
- 230000000977 initiatory effect Effects 0.000 description 2
- 238000011005 laboratory method Methods 0.000 description 2
- 239000002502 liposome Substances 0.000 description 2
- 108010064235 lysylglycine Proteins 0.000 description 2
- 108010026228 mRNA guanylyltransferase Proteins 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- 230000021121 meiosis Effects 0.000 description 2
- 239000012528 membrane Substances 0.000 description 2
- 238000000520 microinjection Methods 0.000 description 2
- 238000010369 molecular cloning Methods 0.000 description 2
- 239000002105 nanoparticle Substances 0.000 description 2
- 239000002853 nucleic acid probe Substances 0.000 description 2
- 150000004713 phosphodiesters Chemical class 0.000 description 2
- 125000004437 phosphorous atom Chemical group 0.000 description 2
- 229910052698 phosphorus Inorganic materials 0.000 description 2
- 238000004161 plant tissue culture Methods 0.000 description 2
- 101150082349 pmi gene Proteins 0.000 description 2
- 239000002243 precursor Substances 0.000 description 2
- 238000011002 quantification Methods 0.000 description 2
- 150000003839 salts Chemical class 0.000 description 2
- HFHDHCJBZVLPGP-UHFFFAOYSA-N schardinger α-dextrin Chemical compound O1C(C(C2O)O)C(CO)OC2OC(C(C2O)O)C(CO)OC2OC(C(C2O)O)C(CO)OC2OC(C(O)C2O)C(CO)OC2OC(C(C2O)O)C(CO)OC2OC2C(O)C(O)C1OC2CO HFHDHCJBZVLPGP-UHFFFAOYSA-N 0.000 description 2
- 230000005783 single-strand break Effects 0.000 description 2
- 229910001415 sodium ion Inorganic materials 0.000 description 2
- 210000001082 somatic cell Anatomy 0.000 description 2
- 238000000527 sonication Methods 0.000 description 2
- 230000002269 spontaneous effect Effects 0.000 description 2
- 238000003786 synthesis reaction Methods 0.000 description 2
- 238000011426 transformation method Methods 0.000 description 2
- 230000007704 transition Effects 0.000 description 2
- QORWJWZARLRLPR-UHFFFAOYSA-H tricalcium bis(phosphate) Chemical compound [Ca+2].[Ca+2].[Ca+2].[O-]P([O-])([O-])=O.[O-]P([O-])([O-])=O QORWJWZARLRLPR-UHFFFAOYSA-H 0.000 description 2
- VGONTNSXDCQUGY-RRKCRQDMSA-N 2'-deoxyinosine Chemical group C1[C@H](O)[C@@H](CO)O[C@H]1N1C(N=CNC2=O)=C2N=C1 VGONTNSXDCQUGY-RRKCRQDMSA-N 0.000 description 1
- PIINGYXNCHTJTF-UHFFFAOYSA-N 2-(2-azaniumylethylamino)acetate Chemical group NCCNCC(O)=O PIINGYXNCHTJTF-UHFFFAOYSA-N 0.000 description 1
- GOJUJUVQIVIZAV-UHFFFAOYSA-N 2-amino-4,6-dichloropyrimidine-5-carbaldehyde Chemical group NC1=NC(Cl)=C(C=O)C(Cl)=N1 GOJUJUVQIVIZAV-UHFFFAOYSA-N 0.000 description 1
- 108020005345 3' Untranslated Regions Proteins 0.000 description 1
- 108020003589 5' Untranslated Regions Proteins 0.000 description 1
- 101710169336 5'-deoxyadenosine deaminase Proteins 0.000 description 1
- 102000055025 Adenosine deaminases Human genes 0.000 description 1
- FJVAQLJNTSUQPY-CIUDSAMLSA-N Ala-Ala-Lys Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN FJVAQLJNTSUQPY-CIUDSAMLSA-N 0.000 description 1
- LWUWMHIOBPTZBA-DCAQKATOSA-N Ala-Arg-Lys Chemical compound NC(=N)NCCC[C@H](NC(=O)[C@@H](N)C)C(=O)N[C@@H](CCCCN)C(O)=O LWUWMHIOBPTZBA-DCAQKATOSA-N 0.000 description 1
- XEXJJJRVTFGWIC-FXQIFTODSA-N Ala-Asn-Arg Chemical compound C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N XEXJJJRVTFGWIC-FXQIFTODSA-N 0.000 description 1
- FVSOUJZKYWEFOB-KBIXCLLPSA-N Ala-Gln-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@H](C)N FVSOUJZKYWEFOB-KBIXCLLPSA-N 0.000 description 1
- MVBWLRJESQOQTM-ACZMJKKPSA-N Ala-Gln-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O MVBWLRJESQOQTM-ACZMJKKPSA-N 0.000 description 1
- YIGLXQRFQVWFEY-NRPADANISA-N Ala-Gln-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O YIGLXQRFQVWFEY-NRPADANISA-N 0.000 description 1
- NWVVKQZOVSTDBQ-CIUDSAMLSA-N Ala-Glu-Arg Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O NWVVKQZOVSTDBQ-CIUDSAMLSA-N 0.000 description 1
- NJPMYXWVWQWCSR-ACZMJKKPSA-N Ala-Glu-Asn Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O NJPMYXWVWQWCSR-ACZMJKKPSA-N 0.000 description 1
- ZBLQIYPCUWZSRZ-QEJZJMRPSA-N Ala-Phe-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@H](C)N)CC1=CC=CC=C1 ZBLQIYPCUWZSRZ-QEJZJMRPSA-N 0.000 description 1
- HOVPGJUNRLMIOZ-CIUDSAMLSA-N Ala-Ser-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@H](C)N HOVPGJUNRLMIOZ-CIUDSAMLSA-N 0.000 description 1
- VRTOMXFZHGWHIJ-KZVJFYERSA-N Ala-Thr-Arg Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O VRTOMXFZHGWHIJ-KZVJFYERSA-N 0.000 description 1
- IOFVWPYSRSCWHI-JXUBOQSCSA-N Ala-Thr-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@H](C)N IOFVWPYSRSCWHI-JXUBOQSCSA-N 0.000 description 1
- IETUUAHKCHOQHP-KZVJFYERSA-N Ala-Thr-Val Chemical compound CC(C)[C@H](NC(=O)[C@@H](NC(=O)[C@H](C)N)[C@@H](C)O)C(O)=O IETUUAHKCHOQHP-KZVJFYERSA-N 0.000 description 1
- QRIYOHQJRDHFKF-UWJYBYFXSA-N Ala-Tyr-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=C(O)C=C1 QRIYOHQJRDHFKF-UWJYBYFXSA-N 0.000 description 1
- 108091093088 Amplicon Proteins 0.000 description 1
- 241000219194 Arabidopsis Species 0.000 description 1
- 241000203069 Archaea Species 0.000 description 1
- MUXONAMCEUBVGA-DCAQKATOSA-N Arg-Arg-Gln Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(N)=O)C(O)=O MUXONAMCEUBVGA-DCAQKATOSA-N 0.000 description 1
- IIABBYGHLYWVOS-FXQIFTODSA-N Arg-Asn-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O IIABBYGHLYWVOS-FXQIFTODSA-N 0.000 description 1
- RRGPUNYIPJXJBU-GUBZILKMSA-N Arg-Asp-Met Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCSC)C(O)=O RRGPUNYIPJXJBU-GUBZILKMSA-N 0.000 description 1
- TTXYKSADPSNOIF-IHRRRGAJSA-N Arg-Asp-Phe Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O TTXYKSADPSNOIF-IHRRRGAJSA-N 0.000 description 1
- JCAISGGAOQXEHJ-ZPFDUUQYSA-N Arg-Gln-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCCN=C(N)N)N JCAISGGAOQXEHJ-ZPFDUUQYSA-N 0.000 description 1
- QAODJPUKWNNNRP-DCAQKATOSA-N Arg-Glu-Arg Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O QAODJPUKWNNNRP-DCAQKATOSA-N 0.000 description 1
- RKRSYHCNPFGMTA-CIUDSAMLSA-N Arg-Glu-Asn Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O RKRSYHCNPFGMTA-CIUDSAMLSA-N 0.000 description 1
- MZRBYBIQTIKERR-GUBZILKMSA-N Arg-Glu-Gln Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O MZRBYBIQTIKERR-GUBZILKMSA-N 0.000 description 1
- GOWZVQXTHUCNSQ-NHCYSSNCSA-N Arg-Glu-Val Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O GOWZVQXTHUCNSQ-NHCYSSNCSA-N 0.000 description 1
- RKQRHMKFNBYOTN-IHRRRGAJSA-N Arg-His-Lys Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N RKQRHMKFNBYOTN-IHRRRGAJSA-N 0.000 description 1
- OTZMRMHZCMZOJZ-SRVKXCTJSA-N Arg-Leu-Glu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O OTZMRMHZCMZOJZ-SRVKXCTJSA-N 0.000 description 1
- MJINRRBEMOLJAK-DCAQKATOSA-N Arg-Lys-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCCN=C(N)N MJINRRBEMOLJAK-DCAQKATOSA-N 0.000 description 1
- GRRXPUAICOGISM-RWMBFGLXSA-N Arg-Lys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCCN)NC(=O)[C@H](CCCN=C(N)N)N)C(=O)O GRRXPUAICOGISM-RWMBFGLXSA-N 0.000 description 1
- PAPSMOYMQDWIOR-AVGNSLFASA-N Arg-Lys-Val Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O PAPSMOYMQDWIOR-AVGNSLFASA-N 0.000 description 1
- PYZPXCZNQSEHDT-GUBZILKMSA-N Arg-Met-Asn Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N PYZPXCZNQSEHDT-GUBZILKMSA-N 0.000 description 1
- KSUALAGYYLQSHJ-RCWTZXSCSA-N Arg-Met-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O KSUALAGYYLQSHJ-RCWTZXSCSA-N 0.000 description 1
- CZUHPNLXLWMYMG-UBHSHLNASA-N Arg-Phe-Ala Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](C)C(O)=O)CC1=CC=CC=C1 CZUHPNLXLWMYMG-UBHSHLNASA-N 0.000 description 1
- YTMKMRSYXHBGER-IHRRRGAJSA-N Arg-Phe-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N YTMKMRSYXHBGER-IHRRRGAJSA-N 0.000 description 1
- NGYHSXDNNOFHNE-AVGNSLFASA-N Arg-Pro-Leu Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O NGYHSXDNNOFHNE-AVGNSLFASA-N 0.000 description 1
- FRBAHXABMQXSJQ-FXQIFTODSA-N Arg-Ser-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CO)C(O)=O FRBAHXABMQXSJQ-FXQIFTODSA-N 0.000 description 1
- AOJYORNRFWWEIV-IHRRRGAJSA-N Arg-Tyr-Asp Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(O)=O)C(O)=O)CC1=CC=C(O)C=C1 AOJYORNRFWWEIV-IHRRRGAJSA-N 0.000 description 1
- XWGJDUSDTRPQRK-ZLUOBGJFSA-N Asn-Ala-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC(N)=O XWGJDUSDTRPQRK-ZLUOBGJFSA-N 0.000 description 1
- WPOLSNAQGVHROR-GUBZILKMSA-N Asn-Gln-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC(=O)N)N WPOLSNAQGVHROR-GUBZILKMSA-N 0.000 description 1
- HCAUEJAQCXVQQM-ACZMJKKPSA-N Asn-Glu-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O HCAUEJAQCXVQQM-ACZMJKKPSA-N 0.000 description 1
- QYXNFROWLZPWPC-FXQIFTODSA-N Asn-Glu-Gln Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O QYXNFROWLZPWPC-FXQIFTODSA-N 0.000 description 1
- BZMWJLLUAKSIMH-FXQIFTODSA-N Asn-Glu-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O BZMWJLLUAKSIMH-FXQIFTODSA-N 0.000 description 1
- FTCGGKNCJZOPNB-WHFBIAKZSA-N Asn-Gly-Ser Chemical compound NC(=O)C[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O FTCGGKNCJZOPNB-WHFBIAKZSA-N 0.000 description 1
- SPCONPVIDFMDJI-QSFUFRPTSA-N Asn-Ile-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O SPCONPVIDFMDJI-QSFUFRPTSA-N 0.000 description 1
- DJIMLSXHXKWADV-CIUDSAMLSA-N Asn-Leu-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC(N)=O DJIMLSXHXKWADV-CIUDSAMLSA-N 0.000 description 1
- LSJQOMAZIKQMTJ-SRVKXCTJSA-N Asn-Phe-Asp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O LSJQOMAZIKQMTJ-SRVKXCTJSA-N 0.000 description 1
- RAUPFUCUDBQYHE-AVGNSLFASA-N Asn-Phe-Glu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O RAUPFUCUDBQYHE-AVGNSLFASA-N 0.000 description 1
- HZZIFFOVHLWGCS-KKUMJFAQSA-N Asn-Phe-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O HZZIFFOVHLWGCS-KKUMJFAQSA-N 0.000 description 1
- YUUIAUXBNOHFRJ-IHRRRGAJSA-N Asn-Phe-Met Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCSC)C(O)=O YUUIAUXBNOHFRJ-IHRRRGAJSA-N 0.000 description 1
- NJSNXIOKBHPFMB-GMOBBJLQSA-N Asn-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](CC(=O)N)N NJSNXIOKBHPFMB-GMOBBJLQSA-N 0.000 description 1
- VHQSGALUSWIYOD-QXEWZRGKSA-N Asn-Pro-Val Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](C(C)C)C(O)=O VHQSGALUSWIYOD-QXEWZRGKSA-N 0.000 description 1
- KTDWFWNZLLFEFU-KKUMJFAQSA-N Asn-Tyr-His Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)NC(=O)[C@H](CC(=O)N)N)O KTDWFWNZLLFEFU-KKUMJFAQSA-N 0.000 description 1
- CGYKCTPUGXFPMG-IHPCNDPISA-N Asn-Tyr-Trp Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O CGYKCTPUGXFPMG-IHPCNDPISA-N 0.000 description 1
- XBQSLMACWDXWLJ-GHCJXIJMSA-N Asp-Ala-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O XBQSLMACWDXWLJ-GHCJXIJMSA-N 0.000 description 1
- BLQBMRNMBAYREH-UWJYBYFXSA-N Asp-Ala-Tyr Chemical compound N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O BLQBMRNMBAYREH-UWJYBYFXSA-N 0.000 description 1
- MFMJRYHVLLEMQM-DCAQKATOSA-N Asp-Arg-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@H](CC(=O)O)N MFMJRYHVLLEMQM-DCAQKATOSA-N 0.000 description 1
- UGKZHCBLMLSANF-CIUDSAMLSA-N Asp-Asn-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O UGKZHCBLMLSANF-CIUDSAMLSA-N 0.000 description 1
- KNMRXHIAVXHCLW-ZLUOBGJFSA-N Asp-Asn-Ser Chemical compound C([C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CO)C(=O)O)N)C(=O)O KNMRXHIAVXHCLW-ZLUOBGJFSA-N 0.000 description 1
- RDRMWJBLOSRRAW-BYULHYEWSA-N Asp-Asn-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O RDRMWJBLOSRRAW-BYULHYEWSA-N 0.000 description 1
- SBHUBSDEZQFJHJ-CIUDSAMLSA-N Asp-Asp-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC(O)=O SBHUBSDEZQFJHJ-CIUDSAMLSA-N 0.000 description 1
- CELPEWWLSXMVPH-CIUDSAMLSA-N Asp-Asp-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CC(O)=O CELPEWWLSXMVPH-CIUDSAMLSA-N 0.000 description 1
- QXHVOUSPVAWEMX-ZLUOBGJFSA-N Asp-Asp-Ser Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O QXHVOUSPVAWEMX-ZLUOBGJFSA-N 0.000 description 1
- DXQOQMCLWWADMU-ACZMJKKPSA-N Asp-Gln-Ser Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CO)C(O)=O DXQOQMCLWWADMU-ACZMJKKPSA-N 0.000 description 1
- VILLWIDTHYPSLC-PEFMBERDSA-N Asp-Glu-Ile Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O VILLWIDTHYPSLC-PEFMBERDSA-N 0.000 description 1
- RRKCPMGSRIDLNC-AVGNSLFASA-N Asp-Glu-Tyr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O RRKCPMGSRIDLNC-AVGNSLFASA-N 0.000 description 1
- TVIZQBFURPLQDV-DJFWLOJKSA-N Asp-His-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CN=CN1)NC(=O)[C@H](CC(=O)O)N TVIZQBFURPLQDV-DJFWLOJKSA-N 0.000 description 1
- CYCKJEFVFNRWEZ-UGYAYLCHSA-N Asp-Ile-Asn Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(O)=O CYCKJEFVFNRWEZ-UGYAYLCHSA-N 0.000 description 1
- SEMWSADZTMJELF-BYULHYEWSA-N Asp-Ile-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)NCC(O)=O SEMWSADZTMJELF-BYULHYEWSA-N 0.000 description 1
- KYQNAIMCTRZLNP-QSFUFRPTSA-N Asp-Ile-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](C(C)C)C(O)=O KYQNAIMCTRZLNP-QSFUFRPTSA-N 0.000 description 1
- JNNVNVRBYUJYGS-CIUDSAMLSA-N Asp-Leu-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O JNNVNVRBYUJYGS-CIUDSAMLSA-N 0.000 description 1
- CLUMZOKVGUWUFD-CIUDSAMLSA-N Asp-Leu-Asn Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O CLUMZOKVGUWUFD-CIUDSAMLSA-N 0.000 description 1
- XWSIYTYNLKCLJB-CIUDSAMLSA-N Asp-Lys-Asn Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(O)=O XWSIYTYNLKCLJB-CIUDSAMLSA-N 0.000 description 1
- LBOVBQONZJRWPV-YUMQZZPRSA-N Asp-Lys-Gly Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O LBOVBQONZJRWPV-YUMQZZPRSA-N 0.000 description 1
- GKWFMNNNYZHJHV-SRVKXCTJSA-N Asp-Lys-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC(O)=O GKWFMNNNYZHJHV-SRVKXCTJSA-N 0.000 description 1
- JDDYEZGPYBBPBN-JRQIVUDYSA-N Asp-Thr-Tyr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O JDDYEZGPYBBPBN-JRQIVUDYSA-N 0.000 description 1
- SQIARYGNVQWOSB-BZSNNMDCSA-N Asp-Tyr-Phe Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O SQIARYGNVQWOSB-BZSNNMDCSA-N 0.000 description 1
- WAEDSQFVZJUHLI-BYULHYEWSA-N Asp-Val-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O WAEDSQFVZJUHLI-BYULHYEWSA-N 0.000 description 1
- 108091032955 Bacterial small RNA Proteins 0.000 description 1
- 101000804670 Beet necrotic yellow vein virus (isolate Japan/S) Probable suppressor of RNA silencing Proteins 0.000 description 1
- 102100035875 C-C chemokine receptor type 5 Human genes 0.000 description 1
- 101710149870 C-C chemokine receptor type 5 Proteins 0.000 description 1
- 108010040467 CRISPR-Associated Proteins Proteins 0.000 description 1
- 238000010356 CRISPR-Cas9 genome editing Methods 0.000 description 1
- 238000010453 CRISPR/Cas method Methods 0.000 description 1
- 241001531266 Carnation Italian ringspot virus Species 0.000 description 1
- 108700015761 Cauliflower mosaic virus gene VI Proteins 0.000 description 1
- 108010051109 Cell-Penetrating Peptides Proteins 0.000 description 1
- 102000020313 Cell-Penetrating Peptides Human genes 0.000 description 1
- 108020004635 Complementary DNA Proteins 0.000 description 1
- 241000710147 Cymbidium ringspot virus Species 0.000 description 1
- WQZGKKKJIJFFOK-QTVWNMPRSA-N D-mannopyranose Chemical compound OC[C@H]1OC(O)[C@@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-QTVWNMPRSA-N 0.000 description 1
- 238000007400 DNA extraction Methods 0.000 description 1
- 230000007067 DNA methylation Effects 0.000 description 1
- 230000008265 DNA repair mechanism Effects 0.000 description 1
- 108010008532 Deoxyribonuclease I Proteins 0.000 description 1
- 102000007260 Deoxyribonuclease I Human genes 0.000 description 1
- 208000035240 Disease Resistance Diseases 0.000 description 1
- 101150111720 EPSPS gene Proteins 0.000 description 1
- 102100033238 Elongation factor Tu, mitochondrial Human genes 0.000 description 1
- 108091029865 Exogenous DNA Proteins 0.000 description 1
- 206010064571 Gene mutation Diseases 0.000 description 1
- PHZYLYASFWHLHJ-FXQIFTODSA-N Gln-Asn-Glu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O PHZYLYASFWHLHJ-FXQIFTODSA-N 0.000 description 1
- ZPDVKYLJTOFQJV-WDSKDSINSA-N Gln-Asn-Gly Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O ZPDVKYLJTOFQJV-WDSKDSINSA-N 0.000 description 1
- XEYMBRRKIFYQMF-GUBZILKMSA-N Gln-Asp-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O XEYMBRRKIFYQMF-GUBZILKMSA-N 0.000 description 1
- KVXVVDFOZNYYKZ-DCAQKATOSA-N Gln-Gln-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O KVXVVDFOZNYYKZ-DCAQKATOSA-N 0.000 description 1
- SNLOOPZHAQDMJG-CIUDSAMLSA-N Gln-Glu-Glu Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O SNLOOPZHAQDMJG-CIUDSAMLSA-N 0.000 description 1
- KDXKFBSNIJYNNR-YVNDNENWSA-N Gln-Glu-Ile Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O KDXKFBSNIJYNNR-YVNDNENWSA-N 0.000 description 1
- PNENQZWRFMUZOM-DCAQKATOSA-N Gln-Glu-Leu Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O PNENQZWRFMUZOM-DCAQKATOSA-N 0.000 description 1
- NNXIQPMZGZUFJJ-AVGNSLFASA-N Gln-His-Lys Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)N)N NNXIQPMZGZUFJJ-AVGNSLFASA-N 0.000 description 1
- GIVHPCWYVWUUSG-HVTMNAMFSA-N Gln-Ile-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CCC(=O)N)N GIVHPCWYVWUUSG-HVTMNAMFSA-N 0.000 description 1
- FTIJVMLAGRAYMJ-MNXVOIDGSA-N Gln-Ile-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCC(N)=O FTIJVMLAGRAYMJ-MNXVOIDGSA-N 0.000 description 1
- PSERKXGRRADTKA-MNXVOIDGSA-N Gln-Leu-Ile Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O PSERKXGRRADTKA-MNXVOIDGSA-N 0.000 description 1
- IULKWYSYZSURJK-AVGNSLFASA-N Gln-Leu-Lys Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(O)=O IULKWYSYZSURJK-AVGNSLFASA-N 0.000 description 1
- ZBKUIQNCRIYVGH-SDDRHHMPSA-N Gln-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCC(=O)N)N ZBKUIQNCRIYVGH-SDDRHHMPSA-N 0.000 description 1
- WTJIWXMJESRHMM-XDTLVQLUSA-N Gln-Tyr-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C)C(O)=O WTJIWXMJESRHMM-XDTLVQLUSA-N 0.000 description 1
- JJKKWYQVHRUSDG-GUBZILKMSA-N Glu-Ala-Lys Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCCN)C(O)=O JJKKWYQVHRUSDG-GUBZILKMSA-N 0.000 description 1
- YKLNMGJYMNPBCP-ACZMJKKPSA-N Glu-Asn-Asp Chemical compound C(CC(=O)O)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)O)C(=O)O)N YKLNMGJYMNPBCP-ACZMJKKPSA-N 0.000 description 1
- CKRUHITYRFNUKW-WDSKDSINSA-N Glu-Asn-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O CKRUHITYRFNUKW-WDSKDSINSA-N 0.000 description 1
- RDPOETHPAQEGDP-ACZMJKKPSA-N Glu-Asp-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O RDPOETHPAQEGDP-ACZMJKKPSA-N 0.000 description 1
- HJIFPJUEOGZWRI-GUBZILKMSA-N Glu-Asp-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCC(=O)O)N HJIFPJUEOGZWRI-GUBZILKMSA-N 0.000 description 1
- PAQUJCSYVIBPLC-AVGNSLFASA-N Glu-Asp-Phe Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 PAQUJCSYVIBPLC-AVGNSLFASA-N 0.000 description 1
- ZXQPJYWZSFGWJB-AVGNSLFASA-N Glu-Cys-Phe Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)O)NC(=O)[C@H](CS)NC(=O)[C@H](CCC(=O)O)N ZXQPJYWZSFGWJB-AVGNSLFASA-N 0.000 description 1
- SJPMNHCEWPTRBR-BQBZGAKWSA-N Glu-Glu-Gly Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O SJPMNHCEWPTRBR-BQBZGAKWSA-N 0.000 description 1
- VOORMNJKNBGYGK-YUMQZZPRSA-N Glu-Gly-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CCC(=O)O)N VOORMNJKNBGYGK-YUMQZZPRSA-N 0.000 description 1
- XOFYVODYSNKPDK-AVGNSLFASA-N Glu-His-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)NC(=O)[C@H](CCC(=O)O)N XOFYVODYSNKPDK-AVGNSLFASA-N 0.000 description 1
- CXRWMMRLEMVSEH-PEFMBERDSA-N Glu-Ile-Asn Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(O)=O CXRWMMRLEMVSEH-PEFMBERDSA-N 0.000 description 1
- WTMZXOPHTIVFCP-QEWYBTABSA-N Glu-Ile-Phe Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 WTMZXOPHTIVFCP-QEWYBTABSA-N 0.000 description 1
- ZSWGJYOZWBHROQ-RWRJDSDZSA-N Glu-Ile-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O ZSWGJYOZWBHROQ-RWRJDSDZSA-N 0.000 description 1
- HVYWQYLBVXMXSV-GUBZILKMSA-N Glu-Leu-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O HVYWQYLBVXMXSV-GUBZILKMSA-N 0.000 description 1
- DNPCBMNFQVTHMA-DCAQKATOSA-N Glu-Leu-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O DNPCBMNFQVTHMA-DCAQKATOSA-N 0.000 description 1
- MWMJCGBSIORNCD-AVGNSLFASA-N Glu-Leu-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O MWMJCGBSIORNCD-AVGNSLFASA-N 0.000 description 1
- NJCALAAIGREHDR-WDCWCFNPSA-N Glu-Leu-Thr Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O NJCALAAIGREHDR-WDCWCFNPSA-N 0.000 description 1
- GJBUAAAIZSRCDC-GVXVVHGQSA-N Glu-Leu-Val Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(O)=O GJBUAAAIZSRCDC-GVXVVHGQSA-N 0.000 description 1
- ILWHFUZZCFYSKT-AVGNSLFASA-N Glu-Lys-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O ILWHFUZZCFYSKT-AVGNSLFASA-N 0.000 description 1
- ZGEJRLJEAMPEDV-SRVKXCTJSA-N Glu-Lys-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CCC(=O)O)N ZGEJRLJEAMPEDV-SRVKXCTJSA-N 0.000 description 1
- ZQYZDDXTNQXUJH-CIUDSAMLSA-N Glu-Met-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CCSC)NC(=O)[C@H](CCC(=O)O)N ZQYZDDXTNQXUJH-CIUDSAMLSA-N 0.000 description 1
- SYAYROHMAIHWFB-KBIXCLLPSA-N Glu-Ser-Ile Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O SYAYROHMAIHWFB-KBIXCLLPSA-N 0.000 description 1
- BXSZPACYCMNKLS-AVGNSLFASA-N Glu-Ser-Phe Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O BXSZPACYCMNKLS-AVGNSLFASA-N 0.000 description 1
- TWYSSILQABLLME-HJGDQZAQSA-N Glu-Thr-Arg Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O TWYSSILQABLLME-HJGDQZAQSA-N 0.000 description 1
- RGJKYNUINKGPJN-RWRJDSDZSA-N Glu-Thr-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H]([C@@H](C)O)NC(=O)[C@H](CCC(=O)O)N RGJKYNUINKGPJN-RWRJDSDZSA-N 0.000 description 1
- KIEICAOUSNYOLM-NRPADANISA-N Glu-Val-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](C)C(O)=O KIEICAOUSNYOLM-NRPADANISA-N 0.000 description 1
- YQPFCZVKMUVZIN-AUTRQRHGSA-N Glu-Val-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O YQPFCZVKMUVZIN-AUTRQRHGSA-N 0.000 description 1
- ZYRXTRTUCAVNBQ-GVXVVHGQSA-N Glu-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CCC(=O)O)N ZYRXTRTUCAVNBQ-GVXVVHGQSA-N 0.000 description 1
- SOYWRINXUSUWEQ-DLOVCJGASA-N Glu-Val-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CCC(O)=O SOYWRINXUSUWEQ-DLOVCJGASA-N 0.000 description 1
- VSVZIEVNUYDAFR-YUMQZZPRSA-N Gly-Ala-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)CN VSVZIEVNUYDAFR-YUMQZZPRSA-N 0.000 description 1
- LJPIRKICOISLKN-WHFBIAKZSA-N Gly-Ala-Ser Chemical compound NCC(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O LJPIRKICOISLKN-WHFBIAKZSA-N 0.000 description 1
- OVSKVOOUFAKODB-UWVGGRQHSA-N Gly-Arg-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCN=C(N)N OVSKVOOUFAKODB-UWVGGRQHSA-N 0.000 description 1
- XCLCVBYNGXEVDU-WHFBIAKZSA-N Gly-Asn-Ser Chemical compound NCC(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O XCLCVBYNGXEVDU-WHFBIAKZSA-N 0.000 description 1
- FMNHBTKMRFVGRO-FOHZUACHSA-N Gly-Asn-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@H](CC(N)=O)NC(=O)CN FMNHBTKMRFVGRO-FOHZUACHSA-N 0.000 description 1
- LCNXZQROPKFGQK-WHFBIAKZSA-N Gly-Asp-Ser Chemical compound NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O LCNXZQROPKFGQK-WHFBIAKZSA-N 0.000 description 1
- YYPFZVIXAVDHIK-IUCAKERBSA-N Gly-Glu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)CN YYPFZVIXAVDHIK-IUCAKERBSA-N 0.000 description 1
- ZQIMMEYPEXIYBB-IUCAKERBSA-N Gly-Glu-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)CN ZQIMMEYPEXIYBB-IUCAKERBSA-N 0.000 description 1
- CCQOOWAONKGYKQ-BYPYZUCNSA-N Gly-Gly-Ala Chemical compound OC(=O)[C@H](C)NC(=O)CNC(=O)CN CCQOOWAONKGYKQ-BYPYZUCNSA-N 0.000 description 1
- UFPXDFOYHVEIPI-BYPYZUCNSA-N Gly-Gly-Asp Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CC(O)=O UFPXDFOYHVEIPI-BYPYZUCNSA-N 0.000 description 1
- XPJBQTCXPJNIFE-ZETCQYMHSA-N Gly-Gly-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)CNC(=O)CN XPJBQTCXPJNIFE-ZETCQYMHSA-N 0.000 description 1
- SXJHOPPTOJACOA-QXEWZRGKSA-N Gly-Ile-Arg Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@H](C(O)=O)CCCN=C(N)N SXJHOPPTOJACOA-QXEWZRGKSA-N 0.000 description 1
- SCWYHUQOOFRVHP-MBLNEYKQSA-N Gly-Ile-Thr Chemical compound NCC(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SCWYHUQOOFRVHP-MBLNEYKQSA-N 0.000 description 1
- LHYJCVCQPWRMKZ-WEDXCCLWSA-N Gly-Leu-Thr Chemical compound [H]NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LHYJCVCQPWRMKZ-WEDXCCLWSA-N 0.000 description 1
- AFWYPMDMDYCKMD-KBPBESRZSA-N Gly-Leu-Tyr Chemical compound NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 AFWYPMDMDYCKMD-KBPBESRZSA-N 0.000 description 1
- VBOBNHSVQKKTOT-YUMQZZPRSA-N Gly-Lys-Ala Chemical compound [H]NCC(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O VBOBNHSVQKKTOT-YUMQZZPRSA-N 0.000 description 1
- FXGRXIATVXUAHO-WEDXCCLWSA-N Gly-Lys-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CCCCN FXGRXIATVXUAHO-WEDXCCLWSA-N 0.000 description 1
- GAFKBWKVXNERFA-QWRGUYRKSA-N Gly-Phe-Asp Chemical compound OC(=O)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CC=CC=C1 GAFKBWKVXNERFA-QWRGUYRKSA-N 0.000 description 1
- DBUNZBWUWCIELX-JHEQGTHGSA-N Gly-Thr-Glu Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(O)=O DBUNZBWUWCIELX-JHEQGTHGSA-N 0.000 description 1
- RCHFYMASWAZQQZ-ZANVPECISA-N Gly-Trp-Ala Chemical compound C1=CC=C2C(C[C@@H](C(=O)N[C@@H](C)C(O)=O)NC(=O)CN)=CNC2=C1 RCHFYMASWAZQQZ-ZANVPECISA-N 0.000 description 1
- PNUFMLXHOLFRLD-KBPBESRZSA-N Gly-Tyr-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)CN)CC1=CC=C(O)C=C1 PNUFMLXHOLFRLD-KBPBESRZSA-N 0.000 description 1
- DNVDEMWIYLVIQU-RCOVLWMOSA-N Gly-Val-Asp Chemical compound NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O DNVDEMWIYLVIQU-RCOVLWMOSA-N 0.000 description 1
- 108010043121 Green Fluorescent Proteins Proteins 0.000 description 1
- 102000004144 Green Fluorescent Proteins Human genes 0.000 description 1
- 108050008753 HNH endonucleases Proteins 0.000 description 1
- 102000000310 HNH endonucleases Human genes 0.000 description 1
- 101800000653 Helper component proteinase Proteins 0.000 description 1
- HTTJABKRGRZYRN-UHFFFAOYSA-N Heparin Chemical compound OC1C(NC(=O)C)C(O)OC(COS(O)(=O)=O)C1OC1C(OS(O)(=O)=O)C(O)C(OC2C(C(OS(O)(=O)=O)C(OC3C(C(O)C(O)C(O3)C(O)=O)OS(O)(=O)=O)C(CO)O2)NS(O)(=O)=O)C(C(O)=O)O1 HTTJABKRGRZYRN-UHFFFAOYSA-N 0.000 description 1
- 241000238631 Hexapoda Species 0.000 description 1
- IPIVXQQRZXEUGW-UWJYBYFXSA-N His-Ala-His Chemical compound C([C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CC=1NC=NC=1)C(O)=O)C1=CN=CN1 IPIVXQQRZXEUGW-UWJYBYFXSA-N 0.000 description 1
- XINDHUAGVGCNSF-QSFUFRPTSA-N His-Ala-Ile Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O XINDHUAGVGCNSF-QSFUFRPTSA-N 0.000 description 1
- SVHKVHBPTOMLTO-DCAQKATOSA-N His-Arg-Asp Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(O)=O SVHKVHBPTOMLTO-DCAQKATOSA-N 0.000 description 1
- MVADCDSCFTXCBT-CIUDSAMLSA-N His-Asp-Asp Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O MVADCDSCFTXCBT-CIUDSAMLSA-N 0.000 description 1
- IMCHNUANCIGUKS-SRVKXCTJSA-N His-Glu-Arg Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O IMCHNUANCIGUKS-SRVKXCTJSA-N 0.000 description 1
- XMENRVZYPBKBIL-AVGNSLFASA-N His-Glu-His Chemical compound N[C@@H](Cc1cnc[nH]1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](Cc1cnc[nH]1)C(O)=O XMENRVZYPBKBIL-AVGNSLFASA-N 0.000 description 1
- JCOSMKPAOYDKRO-AVGNSLFASA-N His-Glu-Lys Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N JCOSMKPAOYDKRO-AVGNSLFASA-N 0.000 description 1
- ZSKJIISDJXJQPV-BZSNNMDCSA-N His-Leu-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CN=CN1 ZSKJIISDJXJQPV-BZSNNMDCSA-N 0.000 description 1
- SVVULKPWDBIPCO-BZSNNMDCSA-N His-Phe-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O SVVULKPWDBIPCO-BZSNNMDCSA-N 0.000 description 1
- WCHONUZTYDQMBY-PYJNHQTQSA-N His-Pro-Ile Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WCHONUZTYDQMBY-PYJNHQTQSA-N 0.000 description 1
- DAKSMIWQZPHRIB-BZSNNMDCSA-N His-Tyr-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(C)C)C(O)=O DAKSMIWQZPHRIB-BZSNNMDCSA-N 0.000 description 1
- 101000922061 Homo sapiens Beta-catenin-like protein 1 Proteins 0.000 description 1
- 101000922348 Homo sapiens C-X-C chemokine receptor type 4 Proteins 0.000 description 1
- 101000686685 Homo sapiens Ribonuclease P protein subunit p14 Proteins 0.000 description 1
- 101000616188 Homo sapiens Splicing factor 3B subunit 6 Proteins 0.000 description 1
- LQSBBHNVAVNZSX-GHCJXIJMSA-N Ile-Ala-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](C)C(=O)N[C@@H](CC(=O)N)C(=O)O)N LQSBBHNVAVNZSX-GHCJXIJMSA-N 0.000 description 1
- YOTNPRLPIPHQSB-XUXIUFHCSA-N Ile-Arg-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCCN)C(=O)O)N YOTNPRLPIPHQSB-XUXIUFHCSA-N 0.000 description 1
- NBJAAWYRLGCJOF-UGYAYLCHSA-N Ile-Asp-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N NBJAAWYRLGCJOF-UGYAYLCHSA-N 0.000 description 1
- RGSOCXHDOPQREB-ZPFDUUQYSA-N Ile-Asp-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(C)C)C(=O)O)N RGSOCXHDOPQREB-ZPFDUUQYSA-N 0.000 description 1
- KUHFPGIVBOCRMV-MNXVOIDGSA-N Ile-Gln-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC(C)C)C(=O)O)N KUHFPGIVBOCRMV-MNXVOIDGSA-N 0.000 description 1
- LKACSKJPTFSBHR-MNXVOIDGSA-N Ile-Gln-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N LKACSKJPTFSBHR-MNXVOIDGSA-N 0.000 description 1
- LGMUPVWZEYYUMU-YVNDNENWSA-N Ile-Glu-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N LGMUPVWZEYYUMU-YVNDNENWSA-N 0.000 description 1
- MTFVYKQRLXYAQN-LAEOZQHASA-N Ile-Glu-Gly Chemical compound [H]N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O MTFVYKQRLXYAQN-LAEOZQHASA-N 0.000 description 1
- PNDMHTTXXPUQJH-RWRJDSDZSA-N Ile-Glu-Thr Chemical compound N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H]([C@H](O)C)C(=O)O PNDMHTTXXPUQJH-RWRJDSDZSA-N 0.000 description 1
- KFVUBLZRFSVDGO-BYULHYEWSA-N Ile-Gly-Asp Chemical compound CC[C@H](C)[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC(O)=O KFVUBLZRFSVDGO-BYULHYEWSA-N 0.000 description 1
- NYEYYMLUABXDMC-NHCYSSNCSA-N Ile-Gly-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)N[C@@H](CC(C)C)C(=O)O)N NYEYYMLUABXDMC-NHCYSSNCSA-N 0.000 description 1
- HYLIOBDWPQNLKI-HVTMNAMFSA-N Ile-His-Gln Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N HYLIOBDWPQNLKI-HVTMNAMFSA-N 0.000 description 1
- HUWYGQOISIJNMK-SIGLWIIPSA-N Ile-Ile-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N HUWYGQOISIJNMK-SIGLWIIPSA-N 0.000 description 1
- CSQNHSGHAPRGPQ-YTFOTSKYSA-N Ile-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCCCN)C(=O)O)N CSQNHSGHAPRGPQ-YTFOTSKYSA-N 0.000 description 1
- PKGGWLOLRLOPGK-XUXIUFHCSA-N Ile-Leu-Arg Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N PKGGWLOLRLOPGK-XUXIUFHCSA-N 0.000 description 1
- OUUCIIJSBIBCHB-ZPFDUUQYSA-N Ile-Leu-Asp Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O OUUCIIJSBIBCHB-ZPFDUUQYSA-N 0.000 description 1
- HUORUFRRJHELPD-MNXVOIDGSA-N Ile-Leu-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N HUORUFRRJHELPD-MNXVOIDGSA-N 0.000 description 1
- ADDYYRVQQZFIMW-MNXVOIDGSA-N Ile-Lys-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N ADDYYRVQQZFIMW-MNXVOIDGSA-N 0.000 description 1
- GVNNAHIRSDRIII-AJNGGQMLSA-N Ile-Lys-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)O)N GVNNAHIRSDRIII-AJNGGQMLSA-N 0.000 description 1
- GLYJPWIRLBAIJH-UHFFFAOYSA-N Ile-Lys-Pro Natural products CCC(C)C(N)C(=O)NC(CCCCN)C(=O)N1CCCC1C(O)=O GLYJPWIRLBAIJH-UHFFFAOYSA-N 0.000 description 1
- RVNOXPZHMUWCLW-GMOBBJLQSA-N Ile-Met-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(=O)N)C(=O)O)N RVNOXPZHMUWCLW-GMOBBJLQSA-N 0.000 description 1
- RCMNUBZKIIJCOI-ZPFDUUQYSA-N Ile-Met-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N RCMNUBZKIIJCOI-ZPFDUUQYSA-N 0.000 description 1
- CIDLJWVDMNDKPT-FIRPJDEBSA-N Ile-Phe-Phe Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC2=CC=CC=C2)C(=O)O)N CIDLJWVDMNDKPT-FIRPJDEBSA-N 0.000 description 1
- BJECXJHLUJXPJQ-PYJNHQTQSA-N Ile-Pro-His Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N BJECXJHLUJXPJQ-PYJNHQTQSA-N 0.000 description 1
- ZNOBVZFCHNHKHA-KBIXCLLPSA-N Ile-Ser-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N ZNOBVZFCHNHKHA-KBIXCLLPSA-N 0.000 description 1
- ZLFNNVATRMCAKN-ZKWXMUAHSA-N Ile-Ser-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)NCC(=O)O)N ZLFNNVATRMCAKN-ZKWXMUAHSA-N 0.000 description 1
- JSLIXOUMAOUGBN-JUKXBJQTSA-N Ile-Tyr-His Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N JSLIXOUMAOUGBN-JUKXBJQTSA-N 0.000 description 1
- DLEBSGAVWRPTIX-PEDHHIEDSA-N Ile-Val-Ile Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)[C@@H](C)CC DLEBSGAVWRPTIX-PEDHHIEDSA-N 0.000 description 1
- SWNRZNLXMXRCJC-VKOGCVSHSA-N Ile-Val-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)[C@@H](C)CC)C(O)=O)=CNC2=C1 SWNRZNLXMXRCJC-VKOGCVSHSA-N 0.000 description 1
- UGQMRVRMYYASKQ-KQYNXXCUSA-N Inosine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C2=NC=NC(O)=C2N=C1 UGQMRVRMYYASKQ-KQYNXXCUSA-N 0.000 description 1
- 229930010555 Inosine Natural products 0.000 description 1
- 108010065920 Insulin Lispro Proteins 0.000 description 1
- 108010015268 Integration Host Factors Proteins 0.000 description 1
- LHSGPCFBGJHPCY-UHFFFAOYSA-N L-leucine-L-tyrosine Natural products CC(C)CC(N)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 LHSGPCFBGJHPCY-UHFFFAOYSA-N 0.000 description 1
- SENJXOPIZNYLHU-UHFFFAOYSA-N L-leucyl-L-arginine Natural products CC(C)CC(N)C(=O)NC(C(O)=O)CCCN=C(N)N SENJXOPIZNYLHU-UHFFFAOYSA-N 0.000 description 1
- 108091026898 Leader sequence (mRNA) Proteins 0.000 description 1
- LJHGALIOHLRRQN-DCAQKATOSA-N Leu-Ala-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N LJHGALIOHLRRQN-DCAQKATOSA-N 0.000 description 1
- MJOZZTKJZQFKDK-GUBZILKMSA-N Leu-Ala-Gln Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCC(N)=O MJOZZTKJZQFKDK-GUBZILKMSA-N 0.000 description 1
- WNGVUZWBXZKQES-YUMQZZPRSA-N Leu-Ala-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O WNGVUZWBXZKQES-YUMQZZPRSA-N 0.000 description 1
- YOZCKMXHBYKOMQ-IHRRRGAJSA-N Leu-Arg-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCCN)C(=O)O)N YOZCKMXHBYKOMQ-IHRRRGAJSA-N 0.000 description 1
- WGNOPSQMIQERPK-UHFFFAOYSA-N Leu-Asn-Pro Natural products CC(C)CC(N)C(=O)NC(CC(=O)N)C(=O)N1CCCC1C(=O)O WGNOPSQMIQERPK-UHFFFAOYSA-N 0.000 description 1
- PVMPDMIKUVNOBD-CIUDSAMLSA-N Leu-Asp-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(O)=O PVMPDMIKUVNOBD-CIUDSAMLSA-N 0.000 description 1
- OXRLYTYUXAQTHP-YUMQZZPRSA-N Leu-Gly-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)NCC(=O)N[C@@H](C)C(O)=O OXRLYTYUXAQTHP-YUMQZZPRSA-N 0.000 description 1
- VGPCJSXPPOQPBK-YUMQZZPRSA-N Leu-Gly-Ser Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O VGPCJSXPPOQPBK-YUMQZZPRSA-N 0.000 description 1
- USLNHQZCDQJBOV-ZPFDUUQYSA-N Leu-Ile-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(N)=O)C(O)=O USLNHQZCDQJBOV-ZPFDUUQYSA-N 0.000 description 1
- HNDWYLYAYNBWMP-AJNGGQMLSA-N Leu-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(C)C)N HNDWYLYAYNBWMP-AJNGGQMLSA-N 0.000 description 1
- RXGLHDWAZQECBI-SRVKXCTJSA-N Leu-Leu-Ser Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O RXGLHDWAZQECBI-SRVKXCTJSA-N 0.000 description 1
- RZXLZBIUTDQHJQ-SRVKXCTJSA-N Leu-Lys-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(O)=O RZXLZBIUTDQHJQ-SRVKXCTJSA-N 0.000 description 1
- HVHRPWQEQHIQJF-AVGNSLFASA-N Leu-Lys-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O HVHRPWQEQHIQJF-AVGNSLFASA-N 0.000 description 1
- ZAVCJRJOQKIOJW-KKUMJFAQSA-N Leu-Phe-Asp Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CC(O)=O)C(O)=O)CC1=CC=CC=C1 ZAVCJRJOQKIOJW-KKUMJFAQSA-N 0.000 description 1
- INCJJHQRZGQLFC-KBPBESRZSA-N Leu-Phe-Gly Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)NCC(O)=O INCJJHQRZGQLFC-KBPBESRZSA-N 0.000 description 1
- DRWMRVFCKKXHCH-BZSNNMDCSA-N Leu-Phe-Leu Chemical compound CC(C)C[C@H]([NH3+])C(=O)N[C@H](C(=O)N[C@@H](CC(C)C)C([O-])=O)CC1=CC=CC=C1 DRWMRVFCKKXHCH-BZSNNMDCSA-N 0.000 description 1
- PJWOOBTYQNNRBF-BZSNNMDCSA-N Leu-Phe-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCCN)C(=O)O)N PJWOOBTYQNNRBF-BZSNNMDCSA-N 0.000 description 1
- YWKNKRAKOCLOLH-OEAJRASXSA-N Leu-Phe-Thr Chemical compound CC(C)C[C@H](N)C(=O)N[C@H](C(=O)N[C@@H]([C@@H](C)O)C(O)=O)CC1=CC=CC=C1 YWKNKRAKOCLOLH-OEAJRASXSA-N 0.000 description 1
- CHJKEDSZNSONPS-DCAQKATOSA-N Leu-Pro-Ser Chemical compound [H]N[C@@H](CC(C)C)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CO)C(O)=O CHJKEDSZNSONPS-DCAQKATOSA-N 0.000 description 1
- IRMLZWSRWSGTOP-CIUDSAMLSA-N Leu-Ser-Ala Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(O)=O IRMLZWSRWSGTOP-CIUDSAMLSA-N 0.000 description 1
- IZPVWNSAVUQBGP-CIUDSAMLSA-N Leu-Ser-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O IZPVWNSAVUQBGP-CIUDSAMLSA-N 0.000 description 1
- XOWMDXHFSBCAKQ-SRVKXCTJSA-N Leu-Ser-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC(C)C XOWMDXHFSBCAKQ-SRVKXCTJSA-N 0.000 description 1
- AMSSKPUHBUQBOQ-SRVKXCTJSA-N Leu-Ser-Lys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CCCCN)C(=O)O)N AMSSKPUHBUQBOQ-SRVKXCTJSA-N 0.000 description 1
- GOFJOGXGMPHOGL-DCAQKATOSA-N Leu-Ser-Met Chemical compound CSCC[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC(C)C GOFJOGXGMPHOGL-DCAQKATOSA-N 0.000 description 1
- AEDWWMMHUGYIFD-HJGDQZAQSA-N Leu-Thr-Asn Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(O)=O AEDWWMMHUGYIFD-HJGDQZAQSA-N 0.000 description 1
- QWWPYKKLXWOITQ-VOAKCMCISA-N Leu-Thr-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC(C)C QWWPYKKLXWOITQ-VOAKCMCISA-N 0.000 description 1
- DAYQSYGBCUKVKT-VOAKCMCISA-N Leu-Thr-Lys Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(O)=O DAYQSYGBCUKVKT-VOAKCMCISA-N 0.000 description 1
- VJGQRELPQWNURN-JYJNAYRXSA-N Leu-Tyr-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCC(O)=O)C(O)=O VJGQRELPQWNURN-JYJNAYRXSA-N 0.000 description 1
- YIRIDPUGZKHMHT-ACRUOGEOSA-N Leu-Tyr-Tyr Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O YIRIDPUGZKHMHT-ACRUOGEOSA-N 0.000 description 1
- FBNPMTNBFFAMMH-AVGNSLFASA-N Leu-Val-Arg Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N FBNPMTNBFFAMMH-AVGNSLFASA-N 0.000 description 1
- FBNPMTNBFFAMMH-UHFFFAOYSA-N Leu-Val-Arg Natural products CC(C)CC(N)C(=O)NC(C(C)C)C(=O)NC(C(O)=O)CCCN=C(N)N FBNPMTNBFFAMMH-UHFFFAOYSA-N 0.000 description 1
- AIMGJYMCTAABEN-GVXVVHGQSA-N Leu-Val-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O AIMGJYMCTAABEN-GVXVVHGQSA-N 0.000 description 1
- 239000000232 Lipid Bilayer Substances 0.000 description 1
- XFIHDSBIPWEYJJ-YUMQZZPRSA-N Lys-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H](N)CCCCN XFIHDSBIPWEYJJ-YUMQZZPRSA-N 0.000 description 1
- IXHKPDJKKCUKHS-GARJFASQSA-N Lys-Ala-Pro Chemical compound C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCCN)N IXHKPDJKKCUKHS-GARJFASQSA-N 0.000 description 1
- DGWXCIORNLWGGG-CIUDSAMLSA-N Lys-Asn-Ser Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O DGWXCIORNLWGGG-CIUDSAMLSA-N 0.000 description 1
- HKCCVDWHHTVVPN-CIUDSAMLSA-N Lys-Asp-Ala Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O HKCCVDWHHTVVPN-CIUDSAMLSA-N 0.000 description 1
- IWWMPCPLFXFBAF-SRVKXCTJSA-N Lys-Asp-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O IWWMPCPLFXFBAF-SRVKXCTJSA-N 0.000 description 1
- LMVOVCYVZBBWQB-SRVKXCTJSA-N Lys-Asp-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN LMVOVCYVZBBWQB-SRVKXCTJSA-N 0.000 description 1
- PHHYNOUOUWYQRO-XIRDDKMYSA-N Lys-Asp-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](CCCCN)N PHHYNOUOUWYQRO-XIRDDKMYSA-N 0.000 description 1
- WTZUSCUIVPVCRH-SRVKXCTJSA-N Lys-Gln-Arg Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H](C(O)=O)CCCN=C(N)N WTZUSCUIVPVCRH-SRVKXCTJSA-N 0.000 description 1
- RZHLIPMZXOEJTL-AVGNSLFASA-N Lys-Gln-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CCCCN)N RZHLIPMZXOEJTL-AVGNSLFASA-N 0.000 description 1
- NNCDAORZCMPZPX-GUBZILKMSA-N Lys-Gln-Ser Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CO)C(=O)O)N NNCDAORZCMPZPX-GUBZILKMSA-N 0.000 description 1
- LLSUNJYOSCOOEB-GUBZILKMSA-N Lys-Glu-Asp Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O LLSUNJYOSCOOEB-GUBZILKMSA-N 0.000 description 1
- KZOHPCYVORJBLG-AVGNSLFASA-N Lys-Glu-His Chemical compound C1=C(NC=N1)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CCCCN)N KZOHPCYVORJBLG-AVGNSLFASA-N 0.000 description 1
- QZONCCHVHCOBSK-YUMQZZPRSA-N Lys-Gly-Asn Chemical compound [H]N[C@@H](CCCCN)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O QZONCCHVHCOBSK-YUMQZZPRSA-N 0.000 description 1
- XNKDCYABMBBEKN-IUCAKERBSA-N Lys-Gly-Gln Chemical compound NCCCC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CCC(N)=O XNKDCYABMBBEKN-IUCAKERBSA-N 0.000 description 1
- FHIAJWBDZVHLAH-YUMQZZPRSA-N Lys-Gly-Ser Chemical compound NCCCC[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O FHIAJWBDZVHLAH-YUMQZZPRSA-N 0.000 description 1
- SPCHLZUWJTYZFC-IHRRRGAJSA-N Lys-His-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C(C)C)C(O)=O SPCHLZUWJTYZFC-IHRRRGAJSA-N 0.000 description 1
- QBEPTBMRQALPEV-MNXVOIDGSA-N Lys-Ile-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H]([C@@H](C)CC)NC(=O)[C@@H](N)CCCCN QBEPTBMRQALPEV-MNXVOIDGSA-N 0.000 description 1
- JYXBNQOKPRQNQS-YTFOTSKYSA-N Lys-Ile-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JYXBNQOKPRQNQS-YTFOTSKYSA-N 0.000 description 1
- ZXFRGTAIIZHNHG-AJNGGQMLSA-N Lys-Ile-Leu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)O)NC(=O)[C@H](CCCCN)N ZXFRGTAIIZHNHG-AJNGGQMLSA-N 0.000 description 1
- ONPDTSFZAIWMDI-AVGNSLFASA-N Lys-Leu-Gln Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(N)=O)C(O)=O ONPDTSFZAIWMDI-AVGNSLFASA-N 0.000 description 1
- SKRGVGLIRUGANF-AVGNSLFASA-N Lys-Leu-Glu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O SKRGVGLIRUGANF-AVGNSLFASA-N 0.000 description 1
- XIZQPFCRXLUNMK-BZSNNMDCSA-N Lys-Leu-Phe Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CCCCN)N XIZQPFCRXLUNMK-BZSNNMDCSA-N 0.000 description 1
- VUTWYNQUSJWBHO-BZSNNMDCSA-N Lys-Leu-Tyr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O VUTWYNQUSJWBHO-BZSNNMDCSA-N 0.000 description 1
- XOQMURBBIXRRCR-SRVKXCTJSA-N Lys-Lys-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CCCCN XOQMURBBIXRRCR-SRVKXCTJSA-N 0.000 description 1
- GAHJXEMYXKLZRQ-AJNGGQMLSA-N Lys-Lys-Ile Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O GAHJXEMYXKLZRQ-AJNGGQMLSA-N 0.000 description 1
- HVAUKHLDSDDROB-KKUMJFAQSA-N Lys-Lys-Leu Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O HVAUKHLDSDDROB-KKUMJFAQSA-N 0.000 description 1
- KJIXWRWPOCKYLD-IHRRRGAJSA-N Lys-Lys-Met Chemical compound CSCC[C@@H](C(=O)O)NC(=O)[C@H](CCCCN)NC(=O)[C@H](CCCCN)N KJIXWRWPOCKYLD-IHRRRGAJSA-N 0.000 description 1
- PLDJDCJLRCYPJB-VOAKCMCISA-N Lys-Lys-Thr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H]([C@@H](C)O)C(O)=O PLDJDCJLRCYPJB-VOAKCMCISA-N 0.000 description 1
- BXPHMHQHYHILBB-BZSNNMDCSA-N Lys-Lys-Tyr Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O BXPHMHQHYHILBB-BZSNNMDCSA-N 0.000 description 1
- QBHGXFQJFPWJIH-XUXIUFHCSA-N Lys-Pro-Ile Chemical compound CC[C@H](C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CCCCN QBHGXFQJFPWJIH-XUXIUFHCSA-N 0.000 description 1
- GHKXHCMRAUYLBS-CIUDSAMLSA-N Lys-Ser-Asn Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O GHKXHCMRAUYLBS-CIUDSAMLSA-N 0.000 description 1
- IEIHKHYMBIYQTH-YESZJQIVSA-N Lys-Tyr-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=C(C=C2)O)NC(=O)[C@H](CCCCN)N)C(=O)O IEIHKHYMBIYQTH-YESZJQIVSA-N 0.000 description 1
- SQRLLZAQNOQCEG-KKUMJFAQSA-N Lys-Tyr-Ser Chemical compound NCCCC[C@H](N)C(=O)N[C@H](C(=O)N[C@@H](CO)C(O)=O)CC1=CC=C(O)C=C1 SQRLLZAQNOQCEG-KKUMJFAQSA-N 0.000 description 1
- VVURYEVJJTXWNE-ULQDDVLXSA-N Lys-Tyr-Val Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(O)=O VVURYEVJJTXWNE-ULQDDVLXSA-N 0.000 description 1
- RPWQJSBMXJSCPD-XUXIUFHCSA-N Lys-Val-Ile Chemical compound CC[C@H](C)[C@H](NC(=O)[C@@H](NC(=O)[C@@H](N)CCCCN)C(C)C)C(O)=O RPWQJSBMXJSCPD-XUXIUFHCSA-N 0.000 description 1
- NYTDJEZBAAFLLG-IHRRRGAJSA-N Lys-Val-Lys Chemical compound NCCCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCCN)C(O)=O NYTDJEZBAAFLLG-IHRRRGAJSA-N 0.000 description 1
- OZVXDDFYCQOPFD-XQQFMLRXSA-N Lys-Val-Pro Chemical compound CC(C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CCCCN)N OZVXDDFYCQOPFD-XQQFMLRXSA-N 0.000 description 1
- RIPJMCFGQHGHNP-RHYQMDGZSA-N Lys-Val-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CCCCN)N)O RIPJMCFGQHGHNP-RHYQMDGZSA-N 0.000 description 1
- 241000218922 Magnoliophyta Species 0.000 description 1
- 102100025022 Mannose-6-phosphate isomerase Human genes 0.000 description 1
- 102000048193 Mannose-6-phosphate isomerases Human genes 0.000 description 1
- QAHFGYLFLVGBNW-DCAQKATOSA-N Met-Ala-Lys Chemical compound CSCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN QAHFGYLFLVGBNW-DCAQKATOSA-N 0.000 description 1
- WGBMNLCRYKSWAR-DCAQKATOSA-N Met-Asp-Lys Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CCCCN WGBMNLCRYKSWAR-DCAQKATOSA-N 0.000 description 1
- AFFKUNVPPLQUGA-DCAQKATOSA-N Met-Leu-Ala Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O AFFKUNVPPLQUGA-DCAQKATOSA-N 0.000 description 1
- BEZJTLKUMFMITF-AVGNSLFASA-N Met-Lys-Arg Chemical compound CSCC[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CCCNC(N)=N BEZJTLKUMFMITF-AVGNSLFASA-N 0.000 description 1
- KSIPKXNIQOWMIC-RCWTZXSCSA-N Met-Thr-Arg Chemical compound CSCC[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CCCNC(N)=N KSIPKXNIQOWMIC-RCWTZXSCSA-N 0.000 description 1
- 241001465754 Metazoa Species 0.000 description 1
- 101000612136 Mus musculus Procollagen C-endopeptidase enhancer 1 Proteins 0.000 description 1
- WUGMRIBZSVSJNP-UHFFFAOYSA-N N-L-alanyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)C)C(O)=O)=CNC2=C1 WUGMRIBZSVSJNP-UHFFFAOYSA-N 0.000 description 1
- YBAFDPFAUTYYRW-UHFFFAOYSA-N N-L-alpha-glutamyl-L-leucine Natural products CC(C)CC(C(O)=O)NC(=O)C(N)CCC(O)=O YBAFDPFAUTYYRW-UHFFFAOYSA-N 0.000 description 1
- SITLTJHOQZFJGG-UHFFFAOYSA-N N-L-alpha-glutamyl-L-valine Natural products CC(C)C(C(O)=O)NC(=O)C(N)CCC(O)=O SITLTJHOQZFJGG-UHFFFAOYSA-N 0.000 description 1
- PESQCPHRXOFIPX-UHFFFAOYSA-N N-L-methionyl-L-tyrosine Natural products CSCCC(N)C(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 PESQCPHRXOFIPX-UHFFFAOYSA-N 0.000 description 1
- XMBSYZWANAQXEV-UHFFFAOYSA-N N-alpha-L-glutamyl-L-phenylalanine Natural products OC(=O)CCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 XMBSYZWANAQXEV-UHFFFAOYSA-N 0.000 description 1
- 241001460678 Napo <wasp> Species 0.000 description 1
- 101710144111 Non-structural protein 3 Proteins 0.000 description 1
- 101710101547 Non-structural protein NS-S Proteins 0.000 description 1
- 238000000636 Northern blotting Methods 0.000 description 1
- 108091007494 Nucleic acid- binding domains Proteins 0.000 description 1
- 108700026244 Open Reading Frames Proteins 0.000 description 1
- 240000002582 Oryza sativa Indica Group Species 0.000 description 1
- 240000008467 Oryza sativa Japonica Group Species 0.000 description 1
- 229910019142 PO4 Inorganic materials 0.000 description 1
- 206010034133 Pathogen resistance Diseases 0.000 description 1
- 108010049977 Peptide Elongation Factor Tu Proteins 0.000 description 1
- CGOMLCQJEMWMCE-STQMWFEESA-N Phe-Arg-Gly Chemical compound NC(N)=NCCC[C@@H](C(=O)NCC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 CGOMLCQJEMWMCE-STQMWFEESA-N 0.000 description 1
- WMGVYPPIMZPWPN-SRVKXCTJSA-N Phe-Asp-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N WMGVYPPIMZPWPN-SRVKXCTJSA-N 0.000 description 1
- SWZKMTDPQXLQRD-XVSYOHENSA-N Phe-Asp-Thr Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SWZKMTDPQXLQRD-XVSYOHENSA-N 0.000 description 1
- GDBOREPXIRKSEQ-FHWLQOOXSA-N Phe-Gln-Phe Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O GDBOREPXIRKSEQ-FHWLQOOXSA-N 0.000 description 1
- KYYMILWEGJYPQZ-IHRRRGAJSA-N Phe-Glu-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H](N)CC1=CC=CC=C1 KYYMILWEGJYPQZ-IHRRRGAJSA-N 0.000 description 1
- KJJROSNFBRWPHS-JYJNAYRXSA-N Phe-Glu-Leu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O KJJROSNFBRWPHS-JYJNAYRXSA-N 0.000 description 1
- PSKRILMFHNIUAO-JYJNAYRXSA-N Phe-Glu-Lys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N PSKRILMFHNIUAO-JYJNAYRXSA-N 0.000 description 1
- WPTYDQPGBMDUBI-QWRGUYRKSA-N Phe-Gly-Asn Chemical compound N[C@@H](Cc1ccccc1)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O WPTYDQPGBMDUBI-QWRGUYRKSA-N 0.000 description 1
- KRYSMKKRRRWOCZ-QEWYBTABSA-N Phe-Ile-Glu Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CCC(O)=O)C(O)=O KRYSMKKRRRWOCZ-QEWYBTABSA-N 0.000 description 1
- LRBSWBVUCLLRLU-BZSNNMDCSA-N Phe-Leu-Lys Chemical compound CC(C)C[C@H](NC(=O)[C@@H](N)Cc1ccccc1)C(=O)N[C@@H](CCCCN)C(O)=O LRBSWBVUCLLRLU-BZSNNMDCSA-N 0.000 description 1
- BSHMIVKDJQGLNT-ACRUOGEOSA-N Phe-Lys-Tyr Chemical compound C([C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=CC=C1 BSHMIVKDJQGLNT-ACRUOGEOSA-N 0.000 description 1
- TXJJXEXCZBHDNA-ACRUOGEOSA-N Phe-Phe-His Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CC=CC=C2)C(=O)N[C@@H](CC3=CN=CN3)C(=O)O)N TXJJXEXCZBHDNA-ACRUOGEOSA-N 0.000 description 1
- RBRNEFJTEHPDSL-ACRUOGEOSA-N Phe-Phe-Lys Chemical compound C([C@@H](C(=O)N[C@@H](CCCCN)C(O)=O)NC(=O)[C@@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 RBRNEFJTEHPDSL-ACRUOGEOSA-N 0.000 description 1
- DBNGDEAQXGFGRA-ACRUOGEOSA-N Phe-Tyr-Lys Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CC=C(C=C2)O)C(=O)N[C@@H](CCCCN)C(=O)O)N DBNGDEAQXGFGRA-ACRUOGEOSA-N 0.000 description 1
- YUPRIZTWANWWHK-DZKIICNBSA-N Phe-Val-Glu Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)N YUPRIZTWANWWHK-DZKIICNBSA-N 0.000 description 1
- 101710181935 Phosphate-binding protein PstS 1 Proteins 0.000 description 1
- 102000004160 Phosphoric Monoester Hydrolases Human genes 0.000 description 1
- 108090000608 Phosphoric Monoester Hydrolases Proteins 0.000 description 1
- 108091000080 Phosphotransferase Proteins 0.000 description 1
- 239000004952 Polyamide Substances 0.000 description 1
- 239000002202 Polyethylene glycol Substances 0.000 description 1
- DZZCICYRSZASNF-FXQIFTODSA-N Pro-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1 DZZCICYRSZASNF-FXQIFTODSA-N 0.000 description 1
- OBVCYFIHIIYIQF-CIUDSAMLSA-N Pro-Asn-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O OBVCYFIHIIYIQF-CIUDSAMLSA-N 0.000 description 1
- VOHFZDSRPZLXLH-IHRRRGAJSA-N Pro-Asn-Phe Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O VOHFZDSRPZLXLH-IHRRRGAJSA-N 0.000 description 1
- UAYHMOIGIQZLFR-NHCYSSNCSA-N Pro-Gln-Val Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(O)=O UAYHMOIGIQZLFR-NHCYSSNCSA-N 0.000 description 1
- KIPIKSXPPLABPN-CIUDSAMLSA-N Pro-Glu-Asn Chemical compound NC(=O)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H]1CCCN1 KIPIKSXPPLABPN-CIUDSAMLSA-N 0.000 description 1
- MGDFPGCFVJFITQ-CIUDSAMLSA-N Pro-Glu-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O MGDFPGCFVJFITQ-CIUDSAMLSA-N 0.000 description 1
- VOZIBWWZSBIXQN-SRVKXCTJSA-N Pro-Glu-Lys Chemical compound NCCCC[C@H](NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H]1CCCN1)C(O)=O VOZIBWWZSBIXQN-SRVKXCTJSA-N 0.000 description 1
- VZKBJNBZMZHKRC-XUXIUFHCSA-N Pro-Ile-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O VZKBJNBZMZHKRC-XUXIUFHCSA-N 0.000 description 1
- CDGABSWLRMECHC-IHRRRGAJSA-N Pro-Lys-His Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O CDGABSWLRMECHC-IHRRRGAJSA-N 0.000 description 1
- FNGOXVQBBCMFKV-CIUDSAMLSA-N Pro-Ser-Glu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(O)=O FNGOXVQBBCMFKV-CIUDSAMLSA-N 0.000 description 1
- QDDJNKWPTJHROJ-UFYCRDLUSA-N Pro-Tyr-Tyr Chemical compound C([C@@H](C(=O)O)NC(=O)[C@H](CC=1C=CC(O)=CC=1)NC(=O)[C@H]1NCCC1)C1=CC=C(O)C=C1 QDDJNKWPTJHROJ-UFYCRDLUSA-N 0.000 description 1
- 108010076504 Protein Sorting Signals Proteins 0.000 description 1
- 108010003201 RGH 0205 Proteins 0.000 description 1
- 230000009948 RNA mutation Effects 0.000 description 1
- 238000011529 RT qPCR Methods 0.000 description 1
- 101710090029 Replication-associated protein A Proteins 0.000 description 1
- 108700008625 Reporter Genes Proteins 0.000 description 1
- 102000047781 Ribonuclease H domains Human genes 0.000 description 1
- 108700037838 Ribonuclease H domains Proteins 0.000 description 1
- 108090000621 Ribonuclease P Proteins 0.000 description 1
- 102000004167 Ribonuclease P Human genes 0.000 description 1
- 101710185843 Ribonuclease Z Proteins 0.000 description 1
- 101000654577 Saccharomyces cerevisiae (strain ATCC 204508 / S288c) Protein transport protein SFT1 Proteins 0.000 description 1
- BTKUIVBNGBFTTP-WHFBIAKZSA-N Ser-Ala-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)NCC(O)=O BTKUIVBNGBFTTP-WHFBIAKZSA-N 0.000 description 1
- QFBNNYNWKYKVJO-DCAQKATOSA-N Ser-Arg-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@@H](N)CO)CCCN=C(N)N QFBNNYNWKYKVJO-DCAQKATOSA-N 0.000 description 1
- RZUOXAKGNHXZTB-GUBZILKMSA-N Ser-Arg-Met Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCSC)C(O)=O RZUOXAKGNHXZTB-GUBZILKMSA-N 0.000 description 1
- ZXLUWXWISXIFIX-ACZMJKKPSA-N Ser-Asn-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O ZXLUWXWISXIFIX-ACZMJKKPSA-N 0.000 description 1
- BNFVPSRLHHPQKS-WHFBIAKZSA-N Ser-Asp-Gly Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O BNFVPSRLHHPQKS-WHFBIAKZSA-N 0.000 description 1
- OLIJLNWFEQEFDM-SRVKXCTJSA-N Ser-Asp-Phe Chemical compound OC[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 OLIJLNWFEQEFDM-SRVKXCTJSA-N 0.000 description 1
- OJPHFSOMBZKQKQ-GUBZILKMSA-N Ser-Gln-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CO OJPHFSOMBZKQKQ-GUBZILKMSA-N 0.000 description 1
- LALNXSXEYFUUDD-GUBZILKMSA-N Ser-Glu-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O LALNXSXEYFUUDD-GUBZILKMSA-N 0.000 description 1
- DSGYZICNAMEJOC-AVGNSLFASA-N Ser-Glu-Phe Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O DSGYZICNAMEJOC-AVGNSLFASA-N 0.000 description 1
- SNVIOQXAHVORQM-WDSKDSINSA-N Ser-Gly-Gln Chemical compound [H]N[C@@H](CO)C(=O)NCC(=O)N[C@@H](CCC(N)=O)C(O)=O SNVIOQXAHVORQM-WDSKDSINSA-N 0.000 description 1
- CXBFHZLODKPIJY-AAEUAGOBSA-N Ser-Gly-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CO)N CXBFHZLODKPIJY-AAEUAGOBSA-N 0.000 description 1
- WEQAYODCJHZSJZ-KKUMJFAQSA-N Ser-His-Tyr Chemical compound C([C@H](NC(=O)[C@H](CO)N)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CN=CN1 WEQAYODCJHZSJZ-KKUMJFAQSA-N 0.000 description 1
- JIPVNVNKXJLFJF-BJDJZHNGSA-N Ser-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CO)N JIPVNVNKXJLFJF-BJDJZHNGSA-N 0.000 description 1
- ZOPISOXXPQNOCO-SVSWQMSJSA-N Ser-Ile-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](CO)N ZOPISOXXPQNOCO-SVSWQMSJSA-N 0.000 description 1
- MUJQWSAWLLRJCE-KATARQTJSA-N Ser-Leu-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O MUJQWSAWLLRJCE-KATARQTJSA-N 0.000 description 1
- CRJZZXMAADSBBQ-SRVKXCTJSA-N Ser-Lys-Lys Chemical compound NCCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CO CRJZZXMAADSBBQ-SRVKXCTJSA-N 0.000 description 1
- UPLYXVPQLJVWMM-KKUMJFAQSA-N Ser-Phe-Leu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O UPLYXVPQLJVWMM-KKUMJFAQSA-N 0.000 description 1
- ADJDNJCSPNFFPI-FXQIFTODSA-N Ser-Pro-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CO ADJDNJCSPNFFPI-FXQIFTODSA-N 0.000 description 1
- FLONGDPORFIVQW-XGEHTFHBSA-N Ser-Pro-Thr Chemical compound C[C@@H](O)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CO FLONGDPORFIVQW-XGEHTFHBSA-N 0.000 description 1
- CUXJENOFJXOSOZ-BIIVOSGPSA-N Ser-Ser-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CO)NC(=O)[C@H](CO)N)C(=O)O CUXJENOFJXOSOZ-BIIVOSGPSA-N 0.000 description 1
- BEBVVQPDSHHWQL-NRPADANISA-N Ser-Val-Glu Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCC(O)=O)C(O)=O BEBVVQPDSHHWQL-NRPADANISA-N 0.000 description 1
- LGIMRDKGABDMBN-DCAQKATOSA-N Ser-Val-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CO)N LGIMRDKGABDMBN-DCAQKATOSA-N 0.000 description 1
- 108020004682 Single-Stranded DNA Proteins 0.000 description 1
- 108020004688 Small Nuclear RNA Proteins 0.000 description 1
- 102000039471 Small Nuclear RNA Human genes 0.000 description 1
- 101000611441 Solanum lycopersicum Pathogenesis-related leaf protein 6 Proteins 0.000 description 1
- 238000002105 Southern blotting Methods 0.000 description 1
- 101000879638 Streptomyces mobaraensis Transglutaminase-activating metalloprotease inhibitor Proteins 0.000 description 1
- 108091027544 Subgenomic mRNA Proteins 0.000 description 1
- 101710180274 Suppressor of RNA-mediated gene silencing Proteins 0.000 description 1
- 241000132145 Sweet potato mild mottle virus Species 0.000 description 1
- 210000001744 T-lymphocyte Anatomy 0.000 description 1
- 108010006785 Taq Polymerase Proteins 0.000 description 1
- FQPQPTHMHZKGFM-XQXXSGGOSA-N Thr-Ala-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O FQPQPTHMHZKGFM-XQXXSGGOSA-N 0.000 description 1
- ZUXQFMVPAYGPFJ-JXUBOQSCSA-N Thr-Ala-Lys Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN ZUXQFMVPAYGPFJ-JXUBOQSCSA-N 0.000 description 1
- CEXFELBFVHLYDZ-XGEHTFHBSA-N Thr-Arg-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CO)C(O)=O CEXFELBFVHLYDZ-XGEHTFHBSA-N 0.000 description 1
- IRKWVRSEQFTGGV-VEVYYDQMSA-N Thr-Asn-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O IRKWVRSEQFTGGV-VEVYYDQMSA-N 0.000 description 1
- OJRNZRROAIAHDL-LKXGYXEUSA-N Thr-Asn-Ser Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O OJRNZRROAIAHDL-LKXGYXEUSA-N 0.000 description 1
- QILPDQCTQZDHFM-HJGDQZAQSA-N Thr-Gln-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O QILPDQCTQZDHFM-HJGDQZAQSA-N 0.000 description 1
- RKDFEMGVMMYYNG-WDCWCFNPSA-N Thr-Gln-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O RKDFEMGVMMYYNG-WDCWCFNPSA-N 0.000 description 1
- JMGJDTNUMAZNLX-RWRJDSDZSA-N Thr-Glu-Ile Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JMGJDTNUMAZNLX-RWRJDSDZSA-N 0.000 description 1
- AQAMPXBRJJWPNI-JHEQGTHGSA-N Thr-Gly-Glu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CCC(O)=O)C(O)=O AQAMPXBRJJWPNI-JHEQGTHGSA-N 0.000 description 1
- XPNSAQMEAVSQRD-FBCQKBJTSA-N Thr-Gly-Gly Chemical compound C[C@@H](O)[C@H](N)C(=O)NCC(=O)NCC(O)=O XPNSAQMEAVSQRD-FBCQKBJTSA-N 0.000 description 1
- YSXYEJWDHBCTDJ-DVJZZOLTSA-N Thr-Gly-Trp Chemical compound C[C@H]([C@@H](C(=O)NCC(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)N)O YSXYEJWDHBCTDJ-DVJZZOLTSA-N 0.000 description 1
- CRZNCABIJLRFKZ-IUKAMOBKSA-N Thr-Ile-Asp Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H]([C@@H](C)O)N CRZNCABIJLRFKZ-IUKAMOBKSA-N 0.000 description 1
- BVOVIGCHYNFJBZ-JXUBOQSCSA-N Thr-Leu-Ala Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O BVOVIGCHYNFJBZ-JXUBOQSCSA-N 0.000 description 1
- MEJHFIOYJHTWMK-VOAKCMCISA-N Thr-Leu-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)[C@@H](C)O MEJHFIOYJHTWMK-VOAKCMCISA-N 0.000 description 1
- MECLEFZMPPOEAC-VOAKCMCISA-N Thr-Leu-Lys Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)O)N)O MECLEFZMPPOEAC-VOAKCMCISA-N 0.000 description 1
- SCSVNSNWUTYSFO-WDCWCFNPSA-N Thr-Lys-Glu Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(O)=O)C(O)=O SCSVNSNWUTYSFO-WDCWCFNPSA-N 0.000 description 1
- KKPOGALELPLJTL-MEYUZBJRSA-N Thr-Lys-Tyr Chemical compound C[C@@H](O)[C@H](N)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 KKPOGALELPLJTL-MEYUZBJRSA-N 0.000 description 1
- WRQLCVIALDUQEQ-UNQGMJICSA-N Thr-Phe-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O WRQLCVIALDUQEQ-UNQGMJICSA-N 0.000 description 1
- WYLAVUAWOUVUCA-XVSYOHENSA-N Thr-Phe-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(O)=O)C(O)=O WYLAVUAWOUVUCA-XVSYOHENSA-N 0.000 description 1
- IWAVRIPRTCJAQO-HSHDSVGOSA-N Thr-Pro-Trp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O IWAVRIPRTCJAQO-HSHDSVGOSA-N 0.000 description 1
- MFMGPEKYBXFIRF-SUSMZKCASA-N Thr-Thr-Gln Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(O)=O MFMGPEKYBXFIRF-SUSMZKCASA-N 0.000 description 1
- ABCLYRRGTZNIFU-BWAGICSOSA-N Thr-Tyr-His Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC2=CN=CN2)C(=O)O)N)O ABCLYRRGTZNIFU-BWAGICSOSA-N 0.000 description 1
- 108091036066 Three prime untranslated region Proteins 0.000 description 1
- 241000723681 Tomato ringspot virus Species 0.000 description 1
- 241000710141 Tombusvirus Species 0.000 description 1
- 241000219793 Trifolium Species 0.000 description 1
- DLZKEQQWXODGGZ-KWQFWETISA-N Tyr-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 DLZKEQQWXODGGZ-KWQFWETISA-N 0.000 description 1
- AYPAIRCDLARHLM-KKUMJFAQSA-N Tyr-Asn-Lys Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCCCN)C(=O)O)N)O AYPAIRCDLARHLM-KKUMJFAQSA-N 0.000 description 1
- UABYBEBXFFNCIR-YDHLFZDLSA-N Tyr-Asp-Val Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O UABYBEBXFFNCIR-YDHLFZDLSA-N 0.000 description 1
- KIJLSRYAUGGZIN-CFMVVWHZSA-N Tyr-Ile-Asp Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(O)=O)C(O)=O KIJLSRYAUGGZIN-CFMVVWHZSA-N 0.000 description 1
- GULIUBBXCYPDJU-CQDKDKBSSA-N Tyr-Leu-Ala Chemical compound [O-]C(=O)[C@H](C)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H]([NH3+])CC1=CC=C(O)C=C1 GULIUBBXCYPDJU-CQDKDKBSSA-N 0.000 description 1
- NKUGCYDFQKFVOJ-JYJNAYRXSA-N Tyr-Leu-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 NKUGCYDFQKFVOJ-JYJNAYRXSA-N 0.000 description 1
- JLKVWTICWVWGSK-JYJNAYRXSA-N Tyr-Lys-Glu Chemical compound OC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 JLKVWTICWVWGSK-JYJNAYRXSA-N 0.000 description 1
- PMHLLBKTDHQMCY-ULQDDVLXSA-N Tyr-Lys-Val Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C(C)C)C(O)=O PMHLLBKTDHQMCY-ULQDDVLXSA-N 0.000 description 1
- JXGUUJMPCRXMSO-HJOGWXRNSA-N Tyr-Phe-Phe Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=C(O)C=C1 JXGUUJMPCRXMSO-HJOGWXRNSA-N 0.000 description 1
- VBFVQTPETKJCQW-RPTUDFQQSA-N Tyr-Phe-Thr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(O)=O VBFVQTPETKJCQW-RPTUDFQQSA-N 0.000 description 1
- RCMWNNJFKNDKQR-UFYCRDLUSA-N Tyr-Pro-Phe Chemical compound C([C@H](N)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=C(O)C=C1 RCMWNNJFKNDKQR-UFYCRDLUSA-N 0.000 description 1
- XGZBEGGGAUQBMB-KJEVXHAQSA-N Tyr-Pro-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@@H]1CCCN1C(=O)[C@H](CC2=CC=C(C=C2)O)N)O XGZBEGGGAUQBMB-KJEVXHAQSA-N 0.000 description 1
- SOAUMCDLIUGXJJ-SRVKXCTJSA-N Tyr-Ser-Asn Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(N)=O)C(O)=O SOAUMCDLIUGXJJ-SRVKXCTJSA-N 0.000 description 1
- MQGGXGKQSVEQHR-KKUMJFAQSA-N Tyr-Ser-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 MQGGXGKQSVEQHR-KKUMJFAQSA-N 0.000 description 1
- WQOHKVRQDLNDIL-YJRXYDGGSA-N Tyr-Thr-Ser Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(O)=O WQOHKVRQDLNDIL-YJRXYDGGSA-N 0.000 description 1
- SQUMHUZLJDUROQ-YDHLFZDLSA-N Tyr-Val-Asp Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O SQUMHUZLJDUROQ-YDHLFZDLSA-N 0.000 description 1
- ABSXSJZNRAQDDI-KJEVXHAQSA-N Tyr-Val-Thr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O ABSXSJZNRAQDDI-KJEVXHAQSA-N 0.000 description 1
- 102000006275 Ubiquitin-Protein Ligases Human genes 0.000 description 1
- 108010083111 Ubiquitin-Protein Ligases Proteins 0.000 description 1
- RUCNAYOMFXRIKJ-DCAQKATOSA-N Val-Ala-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN RUCNAYOMFXRIKJ-DCAQKATOSA-N 0.000 description 1
- PVPAOIGJYHVWBT-KKHAAJSZSA-N Val-Asn-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](C(C)C)N)O PVPAOIGJYHVWBT-KKHAAJSZSA-N 0.000 description 1
- HZYOWMGWKKRMBZ-BYULHYEWSA-N Val-Asp-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N HZYOWMGWKKRMBZ-BYULHYEWSA-N 0.000 description 1
- BMGOFDMKDVVGJG-NHCYSSNCSA-N Val-Asp-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N BMGOFDMKDVVGJG-NHCYSSNCSA-N 0.000 description 1
- NYTKXWLZSNRILS-IFFSRLJSSA-N Val-Gln-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](C(C)C)N)O NYTKXWLZSNRILS-IFFSRLJSSA-N 0.000 description 1
- CVIXTAITYJQMPE-LAEOZQHASA-N Val-Glu-Asn Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(O)=O CVIXTAITYJQMPE-LAEOZQHASA-N 0.000 description 1
- GBESYURLQOYWLU-LAEOZQHASA-N Val-Glu-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N GBESYURLQOYWLU-LAEOZQHASA-N 0.000 description 1
- ZXAGTABZUOMUDO-GVXVVHGQSA-N Val-Glu-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O)N ZXAGTABZUOMUDO-GVXVVHGQSA-N 0.000 description 1
- XWYUBUYQMOUFRQ-IFFSRLJSSA-N Val-Glu-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](C(C)C)N)O XWYUBUYQMOUFRQ-IFFSRLJSSA-N 0.000 description 1
- YTPLVNUZZOBFFC-SCZZXKLOSA-N Val-Gly-Pro Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N1CCC[C@@H]1C(O)=O YTPLVNUZZOBFFC-SCZZXKLOSA-N 0.000 description 1
- KZKMBGXCNLPYKD-YEPSODPASA-N Val-Gly-Thr Chemical compound CC(C)[C@H](N)C(=O)NCC(=O)N[C@@H]([C@@H](C)O)C(O)=O KZKMBGXCNLPYKD-YEPSODPASA-N 0.000 description 1
- APQIVBCUIUDSMB-OSUNSFLBSA-N Val-Ile-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H]([C@@H](C)O)C(=O)O)NC(=O)[C@H](C(C)C)N APQIVBCUIUDSMB-OSUNSFLBSA-N 0.000 description 1
- AGXGCFSECFQMKB-NHCYSSNCSA-N Val-Leu-Asp Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N AGXGCFSECFQMKB-NHCYSSNCSA-N 0.000 description 1
- WBAJDGWKRIHOAC-GVXVVHGQSA-N Val-Lys-Gln Chemical compound [H]N[C@@H](C(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(O)=O WBAJDGWKRIHOAC-GVXVVHGQSA-N 0.000 description 1
- ZRSZTKTVPNSUNA-IHRRRGAJSA-N Val-Lys-Leu Chemical compound CC(C)C[C@H](NC(=O)[C@H](CCCCN)NC(=O)[C@@H](N)C(C)C)C(O)=O ZRSZTKTVPNSUNA-IHRRRGAJSA-N 0.000 description 1
- UEPLNXPLHJUYPT-AVGNSLFASA-N Val-Met-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCCCN)C(O)=O UEPLNXPLHJUYPT-AVGNSLFASA-N 0.000 description 1
- GQMNEJMFMCJJTD-NHCYSSNCSA-N Val-Pro-Gln Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(N)=O)C(O)=O GQMNEJMFMCJJTD-NHCYSSNCSA-N 0.000 description 1
- SDHZOOIGIUEPDY-JYJNAYRXSA-N Val-Ser-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CO)NC(=O)[C@@H](N)C(C)C)C(O)=O)=CNC2=C1 SDHZOOIGIUEPDY-JYJNAYRXSA-N 0.000 description 1
- MIAZWUMFUURQNP-YDHLFZDLSA-N Val-Tyr-Asn Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N MIAZWUMFUURQNP-YDHLFZDLSA-N 0.000 description 1
- 108020005202 Viral DNA Proteins 0.000 description 1
- 108010067390 Viral Proteins Proteins 0.000 description 1
- 241000607479 Yersinia pestis Species 0.000 description 1
- 230000021736 acetylation Effects 0.000 description 1
- 238000006640 acetylation reaction Methods 0.000 description 1
- 102000005421 acetyltransferase Human genes 0.000 description 1
- 108020002494 acetyltransferase Proteins 0.000 description 1
- 239000002253 acid Substances 0.000 description 1
- 108010008685 alanyl-glutamyl-aspartic acid Proteins 0.000 description 1
- 108010024078 alanyl-glycyl-serine Proteins 0.000 description 1
- 108010086434 alanyl-seryl-glycine Proteins 0.000 description 1
- 108010044940 alanylglutamine Proteins 0.000 description 1
- 108010087924 alanylproline Proteins 0.000 description 1
- 125000000539 amino acid group Chemical group 0.000 description 1
- 230000001775 anti-pathogenic effect Effects 0.000 description 1
- 230000000840 anti-viral effect Effects 0.000 description 1
- 239000002246 antineoplastic agent Substances 0.000 description 1
- 108010008355 arginyl-glutamine Proteins 0.000 description 1
- 108010001271 arginyl-glutamyl-arginine Proteins 0.000 description 1
- 108010059459 arginyl-threonyl-phenylalanine Proteins 0.000 description 1
- 108010084758 arginyl-tyrosyl-aspartic acid Proteins 0.000 description 1
- 108010069205 aspartyl-phenylalanine Proteins 0.000 description 1
- 108010093581 aspartyl-proline Proteins 0.000 description 1
- 108010038633 aspartylglutamate Proteins 0.000 description 1
- 108010047857 aspartylglycine Proteins 0.000 description 1
- 108010068265 aspartyltyrosine Proteins 0.000 description 1
- 230000010165 autogamy Effects 0.000 description 1
- 230000000443 biocontrol Effects 0.000 description 1
- 230000001488 breeding effect Effects 0.000 description 1
- 150000001720 carbohydrates Chemical class 0.000 description 1
- 235000014633 carbohydrates Nutrition 0.000 description 1
- 210000000170 cell membrane Anatomy 0.000 description 1
- 210000002421 cell wall Anatomy 0.000 description 1
- 210000004671 cell-free system Anatomy 0.000 description 1
- 230000004700 cellular uptake Effects 0.000 description 1
- 239000003153 chemical reaction reagent Substances 0.000 description 1
- 239000005081 chemiluminescent agent Substances 0.000 description 1
- 239000011248 coating agent Substances 0.000 description 1
- 238000000576 coating method Methods 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 230000001276 controlling effect Effects 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 239000013256 coordination polymer Substances 0.000 description 1
- 244000038559 crop plants Species 0.000 description 1
- 210000004748 cultured cell Anatomy 0.000 description 1
- 238000005520 cutting process Methods 0.000 description 1
- 150000001923 cyclic compounds Chemical class 0.000 description 1
- 230000003013 cytotoxicity Effects 0.000 description 1
- 231100000135 cytotoxicity Toxicity 0.000 description 1
- SUYVUBYJARFZHO-RRKCRQDMSA-N dATP Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@H]1C[C@H](O)[C@@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O1 SUYVUBYJARFZHO-RRKCRQDMSA-N 0.000 description 1
- SUYVUBYJARFZHO-UHFFFAOYSA-N dATP Natural products C1=NC=2C(N)=NC=NC=2N1C1CC(O)C(COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O1 SUYVUBYJARFZHO-UHFFFAOYSA-N 0.000 description 1
- RGWHQCVHVJXOKC-SHYZEUOFSA-J dCTP(4-) Chemical compound O=C1N=C(N)C=CN1[C@@H]1O[C@H](COP([O-])(=O)OP([O-])(=O)OP([O-])([O-])=O)[C@@H](O)C1 RGWHQCVHVJXOKC-SHYZEUOFSA-J 0.000 description 1
- HAAZLUGHYHWQIW-KVQBGUIXSA-N dGTP Chemical compound C1=NC=2C(=O)NC(N)=NC=2N1[C@H]1C[C@H](O)[C@@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O1 HAAZLUGHYHWQIW-KVQBGUIXSA-N 0.000 description 1
- NHVNXKFIZYSCEB-XLPZGREQSA-N dTTP Chemical compound O=C1NC(=O)C(C)=CN1[C@@H]1O[C@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)[C@@H](O)C1 NHVNXKFIZYSCEB-XLPZGREQSA-N 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 230000000368 destabilizing effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- XPPKVPWEQAFLFU-UHFFFAOYSA-J diphosphate(4-) Chemical compound [O-]P([O-])(=O)OP([O-])([O-])=O XPPKVPWEQAFLFU-UHFFFAOYSA-J 0.000 description 1
- 235000011180 diphosphates Nutrition 0.000 description 1
- 235000013399 edible fruits Nutrition 0.000 description 1
- 210000002257 embryonic structure Anatomy 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 230000005284 excitation Effects 0.000 description 1
- 230000001747 exhibiting effect Effects 0.000 description 1
- 238000010195 expression analysis Methods 0.000 description 1
- 108091006047 fluorescent proteins Proteins 0.000 description 1
- 102000034287 fluorescent proteins Human genes 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 108020001507 fusion proteins Proteins 0.000 description 1
- 102000037865 fusion proteins Human genes 0.000 description 1
- 238000003198 gene knock in Methods 0.000 description 1
- 238000012239 gene modification Methods 0.000 description 1
- 238000010363 gene targeting Methods 0.000 description 1
- 238000001415 gene therapy Methods 0.000 description 1
- 235000003869 genetically modified organism Nutrition 0.000 description 1
- 108010079547 glutamylmethionine Proteins 0.000 description 1
- 230000001279 glycosylating effect Effects 0.000 description 1
- HPAIKDPJURGQLN-UHFFFAOYSA-N glycyl-L-histidyl-L-phenylalanine Natural products C=1C=CC=CC=1CC(C(O)=O)NC(=O)C(NC(=O)CN)CC1=CN=CN1 HPAIKDPJURGQLN-UHFFFAOYSA-N 0.000 description 1
- XBGGUPMXALFZOT-UHFFFAOYSA-N glycyl-L-tyrosine hemihydrate Natural products NCC(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 XBGGUPMXALFZOT-UHFFFAOYSA-N 0.000 description 1
- 108010000434 glycyl-alanyl-leucine Proteins 0.000 description 1
- 108010026364 glycyl-glycyl-leucine Proteins 0.000 description 1
- 108010066198 glycyl-leucyl-phenylalanine Proteins 0.000 description 1
- 108010050475 glycyl-leucyl-tyrosine Proteins 0.000 description 1
- 108010089804 glycyl-threonine Proteins 0.000 description 1
- 108010048994 glycyl-tyrosyl-alanine Proteins 0.000 description 1
- 108010081551 glycylphenylalanine Proteins 0.000 description 1
- 108010087823 glycyltyrosine Proteins 0.000 description 1
- 108010037850 glycylvaline Proteins 0.000 description 1
- 239000001963 growth medium Substances 0.000 description 1
- 229960002897 heparin Drugs 0.000 description 1
- 229920000669 heparin Polymers 0.000 description 1
- 229920000140 heteropolymer Polymers 0.000 description 1
- 108010028295 histidylhistidine Proteins 0.000 description 1
- 108010085325 histidylproline Proteins 0.000 description 1
- 230000006195 histone acetylation Effects 0.000 description 1
- 239000010903 husk Substances 0.000 description 1
- 125000002887 hydroxy group Chemical group [H]O* 0.000 description 1
- 230000001771 impaired effect Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000010348 incorporation Methods 0.000 description 1
- 239000003112 inhibitor Substances 0.000 description 1
- 150000002484 inorganic compounds Chemical class 0.000 description 1
- 229910010272 inorganic material Inorganic materials 0.000 description 1
- 229960003786 inosine Drugs 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 230000003834 intracellular effect Effects 0.000 description 1
- 230000002427 irreversible effect Effects 0.000 description 1
- 238000005304 joining Methods 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 108010044311 leucyl-glycyl-glycine Proteins 0.000 description 1
- 108010030617 leucyl-phenylalanyl-valine Proteins 0.000 description 1
- 108010000761 leucylarginine Proteins 0.000 description 1
- 108010012058 leucyltyrosine Proteins 0.000 description 1
- 239000003446 ligand Substances 0.000 description 1
- 230000004807 localization Effects 0.000 description 1
- 108010003700 lysyl aspartic acid Proteins 0.000 description 1
- 108010044348 lysyl-glutamyl-aspartic acid Proteins 0.000 description 1
- 108010045397 lysyl-tyrosyl-lysine Proteins 0.000 description 1
- 108010009298 lysylglutamic acid Proteins 0.000 description 1
- 108010038320 lysylphenylalanine Proteins 0.000 description 1
- 108010017391 lysylvaline Proteins 0.000 description 1
- 229920002521 macromolecule Polymers 0.000 description 1
- 101150026430 manA gene Proteins 0.000 description 1
- 230000013011 mating Effects 0.000 description 1
- 238000002844 melting Methods 0.000 description 1
- 230000008018 melting Effects 0.000 description 1
- 239000002207 metabolite Substances 0.000 description 1
- 108091070501 miRNA Proteins 0.000 description 1
- 239000000693 micelle Substances 0.000 description 1
- 230000000116 mitigating effect Effects 0.000 description 1
- 230000002438 mitochondrial effect Effects 0.000 description 1
- 230000007498 myristoylation Effects 0.000 description 1
- 210000002569 neuron Anatomy 0.000 description 1
- 229910052757 nitrogen Inorganic materials 0.000 description 1
- 108091027963 non-coding RNA Proteins 0.000 description 1
- 102000042567 non-coding RNA Human genes 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 230000001293 nucleolytic effect Effects 0.000 description 1
- 235000016709 nutrition Nutrition 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 210000003463 organelle Anatomy 0.000 description 1
- 150000002894 organic compounds Chemical class 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 230000036961 partial effect Effects 0.000 description 1
- 244000052769 pathogen Species 0.000 description 1
- 230000001717 pathogenic effect Effects 0.000 description 1
- 239000008188 pellet Substances 0.000 description 1
- 108010064486 phenylalanyl-leucyl-valine Proteins 0.000 description 1
- 108010051242 phenylalanylserine Proteins 0.000 description 1
- NBIIXXVUZAFLBC-UHFFFAOYSA-K phosphate Chemical compound [O-]P([O-])([O-])=O NBIIXXVUZAFLBC-UHFFFAOYSA-K 0.000 description 1
- 239000010452 phosphate Substances 0.000 description 1
- 102000020233 phosphotransferase Human genes 0.000 description 1
- 230000004962 physiological condition Effects 0.000 description 1
- 108010025488 pinealon Proteins 0.000 description 1
- 210000002706 plastid Anatomy 0.000 description 1
- 229920002647 polyamide Polymers 0.000 description 1
- 238000006116 polymerization reaction Methods 0.000 description 1
- 230000001124 posttranscriptional effect Effects 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 108010031719 prolyl-serine Proteins 0.000 description 1
- 238000001243 protein synthesis Methods 0.000 description 1
- 150000003212 purines Chemical class 0.000 description 1
- 150000003230 pyrimidines Chemical class 0.000 description 1
- 230000000171 quenching effect Effects 0.000 description 1
- 239000011541 reaction mixture Substances 0.000 description 1
- 230000006798 recombination Effects 0.000 description 1
- 238000005215 recombination Methods 0.000 description 1
- 230000002829 reductive effect Effects 0.000 description 1
- 230000022532 regulation of transcription, DNA-dependent Effects 0.000 description 1
- 230000009711 regulatory function Effects 0.000 description 1
- 230000010076 replication Effects 0.000 description 1
- 230000001850 reproductive effect Effects 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 108090000589 ribonuclease E Proteins 0.000 description 1
- 108020004418 ribosomal RNA Proteins 0.000 description 1
- 238000009394 selective breeding Methods 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 238000002864 sequence alignment Methods 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
- 108010069117 seryl-lysyl-aspartic acid Proteins 0.000 description 1
- 238000004904 shortening Methods 0.000 description 1
- HBMJWWWQQXIZIP-UHFFFAOYSA-N silicon carbide Chemical compound [Si+]#[C-] HBMJWWWQQXIZIP-UHFFFAOYSA-N 0.000 description 1
- 229910010271 silicon carbide Inorganic materials 0.000 description 1
- 230000003007 single stranded DNA break Effects 0.000 description 1
- 239000011780 sodium chloride Substances 0.000 description 1
- 108010068698 spleen exonuclease Proteins 0.000 description 1
- 238000010561 standard procedure Methods 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 235000021092 sugar substitutes Nutrition 0.000 description 1
- 239000003765 sweetening agent Substances 0.000 description 1
- 108700029760 synthetic LTSP Proteins 0.000 description 1
- 229940124597 therapeutic agent Drugs 0.000 description 1
- 230000001225 therapeutic effect Effects 0.000 description 1
- 108010031491 threonyl-lysyl-glutamic acid Proteins 0.000 description 1
- 230000002103 transcriptional effect Effects 0.000 description 1
- 238000010361 transduction Methods 0.000 description 1
- 230000026683 transduction Effects 0.000 description 1
- 239000001226 triphosphate Substances 0.000 description 1
- 235000011178 triphosphate Nutrition 0.000 description 1
- 125000002264 triphosphate group Chemical class [H]OP(=O)(O[H])OP(=O)(O[H])OP(=O)(O[H])O* 0.000 description 1
- 108010038745 tryptophylglycine Proteins 0.000 description 1
- 108010012567 tyrosyl-glycyl-glycyl-phenylalanyl Proteins 0.000 description 1
- 108010051110 tyrosyl-lysine Proteins 0.000 description 1
- 101150085703 vir gene Proteins 0.000 description 1
- 238000011179 visual inspection Methods 0.000 description 1
- 238000001262 western blot Methods 0.000 description 1
- 210000005253 yeast cell Anatomy 0.000 description 1
- 108091005957 yellow fluorescent proteins Proteins 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/10—Processes for the isolation, preparation or purification of DNA or RNA
- C12N15/1034—Isolating an individual clone by screening libraries
- C12N15/1082—Preparation or screening gene libraries by chromosomal integration of polynucleotide sequences, HR-, site-specific-recombination, transposons, viral vectors
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/113—Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/10—Processes for the isolation, preparation or purification of DNA or RNA
- C12N15/102—Mutagenizing nucleic acids
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/82—Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
- C12N15/8201—Methods for introducing genetic material into plant cells, e.g. DNA, RNA, stable or transient incorporation, tissue culture methods adapted for transformation
- C12N15/8213—Targeted insertion of genes into the plant genome by homologous recombination
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/16—Hydrolases (3) acting on ester bonds (3.1)
- C12N9/22—Ribonucleases [RNase]; Deoxyribonucleases [DNase]
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2310/00—Structure or type of the nucleic acid
- C12N2310/10—Type of nucleic acid
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2310/00—Structure or type of the nucleic acid
- C12N2310/10—Type of nucleic acid
- C12N2310/20—Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPR]
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2320/00—Applications; Uses
- C12N2320/50—Methods for regulating/modulating their activity
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Genetics & Genomics (AREA)
- Engineering & Computer Science (AREA)
- Chemical & Material Sciences (AREA)
- Biomedical Technology (AREA)
- Organic Chemistry (AREA)
- Wood Science & Technology (AREA)
- Biotechnology (AREA)
- Zoology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- Molecular Biology (AREA)
- Microbiology (AREA)
- Biochemistry (AREA)
- General Health & Medical Sciences (AREA)
- Plant Pathology (AREA)
- Biophysics (AREA)
- Physics & Mathematics (AREA)
- Crystallography & Structural Chemistry (AREA)
- Cell Biology (AREA)
- Medicinal Chemistry (AREA)
- Bioinformatics & Computational Biology (AREA)
- Virology (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Breeding Of Plants And Reproduction By Means Of Culturing (AREA)
Abstract
提供了用于修饰DNA分子中的靶位点的方法和组合物。提供了包含crRNA分子和tracrRNA分子的DNA靶向RNA双链体,以及使用这些分子来修饰靶DNA的方法。修饰包括靶向转基因插入、靶向等位基因置换、和靶向诱变。
Description
序列表
提供ASCII文本格式的序列表作为纸质副本的替代,该序列表是根据37 C.F.R.§1.821提交的,名称为“81555_ST25.txt”,大小为82千字节,于2018年4月24日生成。这个序列表特此通过引用以其披露内容并入本说明书中。
技术领域
本申请涉及用于细胞的基因组中的靶向转基因插入、靶向等位基因置换、或靶向诱变的方法和组合物。
背景技术
在靶向基因组修饰领域中已经取得的最新进展使得常规的靶向修饰可以很快成为可能。针对开发通过与工程化的crRNA-tracrRNA双链体复合或与单引导RNA复合发挥作用的位点特异性核酸酶(例如,锌指核酸酶(ZFN)、大范围核酸酶、转录激活子样效应子核酸酶(TALENS)以及成簇规律间隔短回文重复/CRISPR相关的核酸酶(CRISPR/Cas)),靶向并且切割基因组DNA的方法和组合物,在过去几年中已经取得了显著的进展。这些位点特异性核酸酶可以诱导靶向诱变、诱导DNA序列的靶向缺失、并且促进外源供体DNA多核苷酸(例如转基因)在靶向DNA序列内的靶向重组。
在II型CRISPR系统中,由包含crRNA:tracrRNA双链体的双重引导系统引导的Cas9核酸酶足以切割靶DNA(Jinek等人,2012,Science[科学]:337:816-821)。位点特异性切割发生在由crRNA和靶DNA以及短基序(称为前间隔序列邻近基序PAM,与靶DNA中的互补区域并列)之间的碱基配对互补性决定的位置上。单独的crRNA不能指导Cas9至靶DNA;需要与crRNA的序列配对的tracrRNA来形成蛋白结合区段,所述蛋白结合区段使得crRNA-tracrRNA双链体和Cas9酶之间能够形成复合物。然而,还不知道是否可以优化crRNA和tracrRNA之间的相互作用来增加Cas9靶向和/或诱变功效。
发明概述
本发明提供了包含crRNA分子及其相应tracrRNA分子的DNA靶向RNA双链体,其中所述crRNA分子和tracrRNA分子分别包含以下核酸序列:SEQ ID NO:55和56、SEQ ID NO:57和58、SEQ ID NO:59和60、SEQ ID NO:61和62、SEQ ID NO:63和64、SEQ ID NO:65和66、SEQID NO:67和68、SEQ ID NO:69和70、SEQ ID NO:71和72、SEQ ID NO:73和74、SEQ ID NO:75和76、SEQ ID NO:77和78、SEQ ID NO:79和80、SEQ ID NO:81和82、或SEQ ID NO:83和84,其中所述crRNA进一步包含DNA靶向区段,所述DNA靶向区段包含与靶DNA分子中的序列互补的核酸序列,由此所述DNA靶向RNA双链体靶向靶DNA序列并且与其杂交。将本发明的crRNA和相应tracrRNA分子工程化,意味着它们是通过人工产生的,不是天然存在的。
本发明还提供了核酸分子,其包含编码本发明的至少一个crRNA和/或至少一个tracrRNA的核酸序列。所述核酸分子可以编码多于一个crRNA分子,其中多个crRNA分子具有不同的前间隔序列。可替代地,所述核酸分子可以编码具有相同前间隔序列的多个crRNA分子。所述核酸分子还可以编码多个tracrRNA分子,或者它可以多次编码单个tracrRNA分子。所述核酸分子可以是DNA或RNA分子。在一些实施例中,所述核酸分子是环化的。在其他实施例中,所述核酸分子是直链的。在一些实施例中,所述核酸分子是单链的、部分双链的、或双链的。
本发明还提供了用于靶向诱变的工程化的、非天然存在的系统,所述系统包含本发明的DNA靶向RNA双链体和定点修饰多肽,其中所述DNA靶向RNA双链体包含crRNA分子及其相应tracrRNA分子的DNA靶向RNA双链体,其中所述crRNA分子和tracrRNA分子分别包含以下核酸序列:SEQ ID NO:55和56、SEQ ID NO:57和58、SEQ ID NO:59和60、SEQ ID NO:61和62、SEQ ID NO:63和64、SEQ ID NO:65和66、SEQ ID NO:67和68、SEQ ID NO:69和70、SEQID NO:71和72、SEQ ID NO:73和74、SEQ ID NO:75和76、SEQ ID NO:77和78、SEQ ID NO:79和80、SEQ ID NO:81和82、或SEQ ID NO:83和84,其中所述crRNA进一步包含与靶DNA分子中的序列互补的核酸序列,由此所述crRNA-tracrRNA双重引导复合物靶向靶DNA序列并且与其杂交,并且所述定点修饰多肽切割DNA分子。本发明的crRNA分子进一步包含前间隔序列,其是本发明的crRNA分子的DNA靶向区段并且与靶DNA分子中的序列互补。
在一些实施例中,所述crRNA分子、其相应tracrRNA分子、和定点修饰多肽是在至少一个核酸分子内编码的,其中所述crRNA分子和tracrRNA分子由以下核酸序列编码,所述核酸序列分别包含SEQ ID NO:3和4、SEQ ID NO:5和6、SEQ ID NO:7和8、SEQ ID NO:9和10、SEQ ID NO:11和12、SEQ ID NO:13和14、SEQ ID NO:15和16、SEQ ID NO:17和18、SEQ IDNO:19和20、SEQ ID NO:21和22、SEQ ID NO:23和24、SEQ ID NO:28和29、SEQ ID NO:30和31、SEQ ID NO:32和33、或SEQ ID NO:34和35、或其互补序列,其中所述crRNA进一步包含DNA靶向区段,所述DNA靶向区段包含与靶DNA分子中的序列互补的核酸序列,由此所述crRNA-tracrRNA双重引导复合物靶向靶DNA序列并且与其杂交,并且所述定点修饰多肽切割DNA分子。
在一些实施例中,在其上编码crRNA和/或tracrRNA的核酸分子是载体。在另外的实施例中,所述核酸分子是能够转化(例如基因枪转化、农杆菌介导的转化、或PEG/电穿孔转化)的载体。在一些实施例中,定点修饰多肽是在其上编码crRNA和tracrRNA分子的相同核酸分子上编码的。在其他实施例中,定点修饰多肽是在与编码crRNA和tracrRNA分子的核酸分子不同的核酸分子上编码的。在一些实施例中,所述crRNA和tracrRNA分子是在不同表达盒中编码的。在其他实施例中,所述crRNA和tracrRNA分子是在相同表达盒中编码的。
本发明还提供了包含至少一个crRNA区段和其相应tracrRNA区段中的至少一个的RNA分子,其中所述区段可操作地连接在tRNA切割序列的5’和/或3’端。在一些实施例中,所述RNA分子可以存在于能够进行tRNA切割的细胞中。在tRNA切割后,所述crRNA区段变成本发明的crRNA分子,并且所述tracrRNA区段变成本发明的tracrRNA分子,使得所述crRNA和tracrRNA分子是能够形成DNA靶向RNA双链体的分开的并且不同的分子。在一些实施例中,所述RNA分子包含处于串联排列的tRNA-crRNA-tRNA-tracrRNA或tRNA-tracrRNA-tRNA-crRNA。在一些实施例中,所得crRNA分子及其相应tracrRNA分子中的至少一个分别包含以下核酸序列:SEQ ID NO:55和56、SEQ ID NO:57和58、SEQ ID NO:59和60、SEQ ID NO:61和62、SEQ ID NO:63和64、SEQ ID NO:65和66、SEQ ID NO:67和68、SEQ ID NO:69和70、SEQ IDNO:71和72、SEQ ID NO:73和74、SEQ ID NO:75和76、SEQ ID NO:77和78、SEQ ID NO:79和80、SEQ ID NO:81和82、或SEQ ID NO:83和84,其中所述crRNA进一步包含与靶DNA序列中的序列互补的核酸序列。
本发明还提供了包含表达所述RNA分子的至少一个表达盒的核酸分子,所述RNA分子包含本文描述的tRNA切割位点。此核酸分子是用于将crRNA和tracrRNA分子递送至细胞并且用来靶向DNA分子的改进的构建体。所述核酸分子可以存在于能够进行tRNA切割的细胞中。在一些实施例中,本发明的crRNA分子、本发明的相应tracrRNA分子、和至少两个tRNA切割序列是在相同表达盒内编码的,由此在tRNA切割后,所述crRNA和tracrRNA分子是分开并且不同的分子。
在一些实施例中,表达包含至少一个tRNA切割位点的RNA分子的核酸分子包含至少一个表达盒,所述表达盒包含由RNA聚合酶II驱动的启动子。在另外的实施例中,所述由RNA聚合酶II驱动的启动子与SEQ ID NO:85具有至少90%同一性。在一些实施例中,所述核酸分子包含至少一个表达盒,所述表达盒包含由RNA聚合酶III驱动的启动子。在另外的实施例中,所述由RNA聚合酶III驱动的启动子与SEQ ID NO:86具有至少90%同一性。在一些实施例中,本发明的核酸分子包含至少两个表达盒,其中一个包含由RNA聚合酶II驱动的启动子,并且其中另一个包含由RNA聚合酶III驱动的启动子。在另外的实施例中,第一表达盒包含与SEQ ID NO:85具有至少90%同一性的启动子,并且第二表达盒包含与SEQ ID NO:86具有至少90%同一性的启动子。
在一些实施例中,以上直接描述的核酸分子包含至少一个表达盒,其中所述表达盒的核酸序列是SEQ ID NO:87-94中的任一者。SEQ ID NO:87-94内的20个N表示在表达盒内编码的crRNA分子的前间隔序列。如本文所述,所述前间隔序列可以是长度为至少12个核苷酸,与靶DNA分子的靶序列具有至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%互补性。
本发明还提供了靶DNA的位点特异性修饰的方法,所述方法包括使靶DNA与以下接触:(i)DNA靶向RNA双链体、或编码其的DNA分子,其中所述DNA靶向RNA双链体是如本文所述的本发明的DNA靶向RNA双链体,和(ii)定点修饰多肽、或编码其的DNA分子,其中所述定点修饰多肽包含与DNA靶向RNA相互作用的RNA结合部分、和展现出定点酶活性的活性部分。
本发明的方法包括靶DNA的位点特异性修饰,其中DNA修饰酶活性是核酸酶活性。核酸酶可以在靶DNA中引入单链的或双链的断裂。DNA靶向RNA双链体和/或定点修饰多肽可以在容许非同源末端连接(NHEJ)或同源定向修复的条件下,与靶DNA接触。在一些实施例中,可以作为修复过程的结果,并且不是作为可以仅充当定点核酸酶的定点修饰多肽的酶活性的直接结果,修饰靶DNA。
本发明还提供了位点特异性修饰的方法,其中通过插入核酸序列来修饰靶位点。此序列是由供体分子提供的。在此方法中,靶DNA与以下接触:(i)DNA靶向RNA双链体、或编码其的DNA分子,其中DNA靶向RNA双链体是如本文所述的本发明的DNA靶向RNA双链体;(ii)定点修饰多肽、或编码其的DNA分子,其中所述定点修饰多肽包含与DNA靶向RNA相互作用的RNA结合部分、和展现出定点酶活性的活性部分;和(iii)供体多核苷酸,其中所述供体多核苷酸、所述供体多核苷酸的一部分、或所述供体多核苷酸的拷贝、或所述供体多核苷酸的拷贝的一部分整合到靶DNA中。
在本发明的方法的一些实施例中,将编码DNA靶向RNA双链体和/或定点修饰多肽的DNA分子引入或递送到包含靶DNA的细胞中。在一些实施例中,所述DNA靶向RNA双链体和定点修饰多肽是在相同DNA分子上编码的。在其他实施例中,它们是在分开的DNA分子上编码的。在另外的实施例中,通过基因枪轰击、农杆菌介导的转化、或本领域已知的任何其他方法将一个或多个DNA分子引入细胞中。在一些实施例中,所述DNA分子是瞬时表达的,并且并未并入细胞的基因组中。在一些实施例中,所述DNA分子是稳定转化的,并且并入细胞的基因组中。
本发明还提供了包含靶DNA的位点特异性修饰的产生植物、植物部分或其子代的方法,所述方法包括从其DNA已经通过以上描述的任何本发明的方法修饰的植物细胞再生植物。本发明进一步提供了植物、植物部分或其子代,包含对通过这些方法产生的其DNA进行修饰。
附图说明
图1(Fig.1)描绘了crRNA-tracrRNA双链体并且指示本发明的突变d2至d9和d11。所述crRNA的序列是SEQ ID NO:113。所述tracrRNA的序列是SEQ ID NO:114。d2至d7和d11指示crRNA的点突变的位置,和用来保持碱基配对的tracrRNA中的相应位置。在没有前间隔序列的情况下,d2的crRNA及其相应tracrRNA的序列是SEQ ID NO:57-58;d3的是SEQ IDNO:59-60、d4的是SEQ ID NO:61-62、d5的是SEQ ID NO:63-64、d6的是SEQ ID NO:65-66、d7的是SEQ ID NO:67-68和d11的是SEQ ID NO:75-76。d8是在3’端延长crRNA的9nt添加,从而提供与tracrRNA的5’端的互补碱基配对,并且突变的crRNA(没有前间隔序列的情况下)和相应tracrRNA的序列是SEQ ID NO:69-70。d9是tracrRNA的5’端的8nt缺失,从而消除tracrRNA的5’突出端,并且d9的crRNA(没有前间隔序列的情况下)和突变的tracrRNA的序列是SEQ ID NO:71-72。
序列表中的序列简述
SEQ ID NO:1-2是编码crRNA和相应tracrRNA分子的一部分的DNA序列。本文的crRNA序列并不包括crRNA的DNA靶向区段。
SEQ ID NO:3-24是编码工程化的crRNA和相应tracrRNA分子的一部分的DNA序列。本文的crRNA序列并不包括crRNA的DNA靶向区段。这些配对被鉴定为图1中和表1中的突变d1-d11。
SEQ ID NO:25是编码由prOsU3启动子(其由RNA聚合酶III驱动)驱动的tRNA-crRNA-tRNA-tracrRNA分子并且在其3’端以合成的polyT终止子终止的表达盒的DNA序列。此表达盒是在载体23999中,如实例2和表1中所述。
SEQ ID NO:26是编码由prOsU3启动子(其由RNA聚合酶III驱动)驱动的tRNA-tracrRNA-tRNA-crRNA分子并且在其3’端以合成的polyT终止子终止的表达盒的DNA序列。此表达盒是在载体24000中,如实例2和表1中所述。
SEQ ID NO:27是编码由prOsU3启动子(其由RNA聚合酶III驱动)驱动的单引导RNA分子并且在其3’端以合成的polyT终止子终止的表达盒的DNA序列。此表达盒是在载体23127中。此sgRNA的DNA靶向区段是与工程化的crRNA分子中相同的DNA靶向区段,如实例2和表1中所述。
SEQ ID NO:28-35是编码工程化的crRNA及其相应tracrRNA分子的一部分的DNA序列,如实例3-4和表2中所述。本文的crRNA序列并不包括crRNA的DNA靶向区段。
SEQ ID NO:36是包含小麦矮缩病毒(WDV)DNA复制子的DNA序列,使得从所述WDV复制子表达工程化的d9+d11 crRNA和tracrRNA分子。
SEQ ID NO:37是由prOsU3启动子驱动并且由合成的polyT终止子终止的表达盒的DNA序列,其编码包含tRNA-tracrRNA-tRNA-crRNA-tRNA-tracrRNA-tRNA-crRNA的RNA分子,如实例3中所述。
SEQ ID NO:38是由prOsU3启动子驱动并且由拟南芥终止子终止的表达盒的DNA序列,其编码包含tRNA-tracrRNA-tRNA-crRNA-tRNA-tracrRNA-tRNA-crRNA的RNA分子,其中所述crRNA和tracrRNA包含d9突变,如实例3中所述。
SEQ ID NO:39是用于这些实例的Cas9变体的氨基酸序列。
SEQ ID NO:40是由prSoUbi启动子驱动(所述启动子由RNA聚合酶II驱动)并且由根癌农杆菌终止子终止的表达盒的DNA序列,其编码包含tRNA-tracrRNA-tRNA-crRNA-tRNA-tracrRNA-tRNA-crRNA-tRNA的RNA分子,如实例3中所述。
SEQ ID NO:41是由prOsU3启动子驱动并且由拟南芥终止子终止的表达盒的DNA序列,其编码包含tRNA-tracrRNA-tRNA-crRNA-tRNA-tracrRNA-tRNA-crRNA的RNA分子,其中所述crRNA和tracrRNA包含d9突变,如实例3中所述。
SEQ ID NO:42是由prSoUbi启动子驱动并且由根癌农杆菌终止子终止的表达盒的DNA序列,其编码包含tRNA-tracrRNA-tRNA-crRNA-tRNA-tracrRNA-tRNA-crRNA-tRNA的RNA分子,其中所述crRNA和tracrRNA包含d9突变,如实例3中所述。
SEQ ID NO:43是由prOsU3启动子驱动并且由合成的polyT终止子终止的表达盒的DNA序列,其编码包含tRNA-tracrRNA-tRNA-crRNA-tRNA-tracrRNA-tRNA-crRNA的RNA分子,其中所述crRNA和tracrRNA包含d9和d11(d9+d11)突变,如实例3中所述。
SEQ ID NO:44是由prSoUbi启动子驱动并且由根癌农杆菌终止子终止的表达盒的DNA序列,其编码包含tRNA-tracrRNA-tRNA-crRNA-tRNA-tracrRNA-tRNA-crRNA-tRNA的RNA分子,其中所述crRNA和tracrRNA包含d9+d11突变,如实例3中所述。
SEQ ID NO:45是DEP1前间隔序列靶标的DNA序列,所述DEP1前间隔序列靶标是可操作地连接在实例中描述的所有工程化的crRNA分子的5’端并且是其一部分的前间隔序列(和DNA靶向区段)。
SEQ ID NO:46-48是可用于PMI基因的检测的PMI引物组和探针。
SEQ ID NO:49-51是可用于Cas9基因的检测的Cas9引物组和探针。
SEQ ID NO:52-54是可用于OsDEP1基因中的靶向突变的检测的OsDep1-2678引物组和探针。
SEQ ID NO:55-76是并不包括对应于SEQ ID NO:3-24的DNA序列的DNA靶向区段及其相应tracrRNA分子的工程化的crRNA的一部分的RNA序列。
SEQ ID NO:77-84是并不包括对应于SEQ ID NO:28-35的DNA序列的DNA靶向区段及其相应tracrRNA分子的工程化的crRNA的一部分的RNA序列。
SEQ ID NO:85是由RNA聚合酶II驱动的prSoUbi4启动子的DNA序列。
SEQ ID NO:86是由RNA聚合酶III驱动的prOsU3启动子的DNA序列。
SEQ ID NO:87-95是类似于SEQ ID NO:25、26、37、38、和40-44的表达盒的DNA序列,除了20个N表示工程化的crRNA的前间隔序列的编码序列。这些N可以是核苷酸,例如A、T、G、或C。这些N还可以指示没有核苷酸,使得前间隔序列的长度可以小于20个核苷酸。
SEQ ID NO:96-110是本发明的tracrRNA分子的双链体形成区段的RNA序列。
SEQ ID NO:111是用于这些实例的Cas9变体的DNA序列。
SEQ ID NO:112是编码用作这些实例中描述的表达盒中的tRNA序列的tRNA前体(pre-tRNA)(gly)的DNA序列。
具体实施方式
本说明不旨在是可以实施本发明的所有不同方式,或可以添加到本发明中的所有特征的详细目录。例如,关于一个实施例所说明的特征可以并入其他实施例中,并且关于一个特定实施例所说明的特征可以从那个实施例删除。此外,鉴于本披露内容,本文建议的不同实施例的众多变化以及附加对于本领域技术人员是显而易见的,这不脱离本发明。因此,以下说明旨在阐述本发明的一些特定实施例,并且并没有穷尽地叙述其所有排列、组合和变化。
除非另外定义,本文所使用的所有技术和科学术语均具有与本发明所属领域的普通技术人员通常所理解的相同的含义。在本文的发明的说明中使用的术语是仅出于描述特定实施例的目的,且并不旨在限制本发明。本文提及的所有出版物、专利申请、专利以及其他参考文献通过引用以其全文并入本文。
提供下面的定义和方法以便更好地定义本发明并且在本发明的实践中指导本领域的普通技术人员。除非另外说明,本文使用的术语应该根据相关领域的那些一般技术人员的常规用法来理解。分子生物学中的一般术语的定义也可在Rieger等人,Glossary of Genetics:Classical and Molecular[遗传学词汇表:标准和分子],第5版,Springer-Verlag:New York[施普林格出版社:纽约],1994中找到。
如在本发明的实施例的说明和所附权利要求中所使用的,单数形式“一个/一种(a/an)”和“所述(the)”旨在也包括复数形式,除非上下文清楚地另外指明。
如本文使用的,“和/或”是指并且涵盖相关列出项目中的一个或多个的任何和所有可能的组合。
如本文使用的术语“约”当指代可测量的值如化合物的量、剂量、时间、温度等时意指涵盖指定量的20%、10%、5%、1%、0.5%、或甚至0.1%的变化。
术语“包括(comprise、comprises和/或comprising)”当在本说明书中使用时,指明所列举特征、整体、步骤、操作、元件、和/或组分的存在,但是不排除一种或多种其他特征、整体、步骤、操作、元件、组分、和/或其组的存在或添加。
如本文使用的,过渡短语“基本上由……组成”意指权利要求的范围将被解释为涵盖该权利要求中所提到的指定材料或步骤以及不实质上影响要求保护的发明的一个或多个基本特征和新特征的那些材料或步骤。因此,当用于本发明的权利要求中时,术语“基本上由……组成”并不旨在被解释为等同于“包含(comprising)”。
如本文使用的,术语“扩增的”意指使用至少一种核酸分子作为模板,构建核酸分子的多个拷贝或与该核酸分子互补的多个拷贝。参见例如Diagnostic MolecularMicrobiology:Principles and Applications[诊断分子微生物学:原理与应用],D.H.Persing等人编著,American Society for Microbiology[美国微生物学会],华盛顿哥伦比亚特区(1993)。扩增产物被称为扩增子。
“编码序列”是转录成RNA(例如mRNA、rRNA、tRNA、snRNA、有义RNA或反义RNA)的核酸序列。在一些实施例中,该RNA随后在生物体内被翻译以产生蛋白质。
如本文使用的“表达盒”意指能够在适当的宿主细胞中指导特定的核苷酸序列表达的核酸分子,该核酸分子包括可操作地连接至目的核苷酸序列(典型地是编码区)的启动子,该核苷酸序列可操作地连接至终止信号。它还典型地包含适当翻译该核苷酸序列所需要的序列。该编码区通常对目的蛋白质进行编码,但是还可以在正义或反义方向上对目的功能性RNA(例如反义RNA或非翻译RNA,例如tRNA)进行编码。表达盒还可以包含在指导目的核苷酸序列表达中不需要的序列,但是其因为用于将表达盒从表达载体移除的方便的限制性位点而存在。包含目的核苷酸序列的表达盒可以是嵌合的,意味着至少一个它的组分相对于至少一个它的其他组分是异源的。该表达盒还可以是天然存在的但已经是以对于异源表达有用的重组形式而获得的表达盒。然而,典型地,该表达盒相对于宿主来说是异源的,即表达盒的特定核酸序列在宿主细胞中不是天然存在的,并且必须已经通过本领域已知的转化方法引入至宿主细胞或宿主细胞的祖先中。在该表达盒中核苷酸序列的表达可以是在组成型启动子或诱导型启动子的控制之下,该启动子只有当该宿主细胞暴露于一些特定的外界刺激时才引发转录。在多细胞生物体(例如植物)的情况下,该启动子对于特定组织、或器官、或者发育阶段也可以是特异的。当被转化进植物中时,表达盒或其片段也可被称为“插入的序列”或者“插入序列”。
“基因”是位于基因组内的限定区域,并且除了前述的编码核酸序列之外,它还包括其他负责控制该编码部分的表达(也就是转录和翻译)的主要调节性核酸序列。基因可以包括编码区和非编码区(例如、内含子、调节元件、启动子、增强子、终止序列和5'和3'非翻译区)二者。基因典型地表达mRNA、功能性RNA、或特异性蛋白,包括调节序列。基因可能或可能不能用于产生功能性蛋白质。在一些实施例中,基因仅指编码区。术语“天然基因”是指如在自然界中发现的基因。术语“嵌合基因”是指包含以下各项的任何基因:1)DNA序列,包括在自然界中未一起发现的调节序列和编码序列,或2)编码不天然邻接的蛋白的部分的序列,或3)不天然邻接的启动子的部分。因此,嵌合基因可以包括从不同来源得到的调节序列和编码序列,或包括从相同来源得到的、但以与在自然界中所发现的不同的方式进行安排的调节序列和编码序列。基因可以是“分离的”,分离的基因意为一种核酸分子,其基本上(substantially或essentially)不含正常情况下发现与其天然状态时的核酸分子相关的组分。此类组分包括其他细胞材料、来自重组产物的培养基、和/或在化学合成该核酸分子中所使用的多种化学品。
关于多核苷酸编码序列的术语“表达(express或expression)”,意指该序列被转录,并且任选被翻译。
“目的基因”或“目的核苷酸序列”是指当转移至植物时,在该植物上赋予所希望的特征(例如抗生素抗性、病毒抗性、昆虫抗性、疾病抗性、或对其他有害生物的抗性、除草剂耐受性、改进的营养价值、改进的工业过程的性能或者改变的繁育能力)的任何基因。“目的基因”还可以是被转移至植物用于在该植物中产生商业上有价值的酶或代谢物的基因。
如本文使用的,“异源的”是指与其引入的宿主细胞天然不相关的核酸分子或核苷酸序列,该序列来源于另一种物种或来自相同物种或生物体,但是从其原始形式或主要在细胞中表达的形式进行了修饰,包括天然存在的核酸序列的非天然存在的多个拷贝。因此,源自与将其引入的细胞所属的生物体或物种不同的生物体或物种的核苷酸序列相对于那个细胞或细胞的子代而言是异源的。另外,异源核苷酸序列包括一种核苷酸序列,该核苷酸序列源自并插入相同的天然原始细胞类型,但是却以非天然状态存在,例如,以不同拷贝数目存在,和/或处于与在该核酸分子的天然状态中发现的那些不同的调节序列的控制下。核酸序列还可以异源于与其相关的其他核酸序列,例如在核酸构建体中,例如像表达载体。作为一个非限制性实例,启动子可以与一种或多种调节元件和/或编码序列组合存在于核酸构建体中,所述调节元件和/或编码序列不与那个特定启动子相关地天然存在,即它们与该启动子是异源的。
“同源”核酸序列是与其被引入的宿主细胞天然相关联的核酸序列。同源核酸序列还可以与其他核酸序列天然相关的核酸序列,这些其他核酸序列可以例如存在于核酸构建体中。作为一个非限制性实例,启动子可以与一种或多种调节元件和/或编码序列组合存在于核酸构建体中,所述调节元件和/或编码序列与那个特定启动子相关地天然存在,即它们与该启动子是同源的。
“可操作地连接”是指在一个单个核酸序列上核酸序列的关联,这样使得一个的功能影响另一个的功能。例如,当一个启动子能够影响编码序列或者功能RNA的表达时(即,该编码序列或功能RNA处于该启动子的转录控制之下),则该启动子与该编码序列或者功能RNA是可操作地连接的。正义方向或者反义方向的编码序列能够与调节序列可操作地连接。因此,可操作地与核苷酸序列相关的调节或控制序列(例如,启动子)能够影响核苷酸序列的表达。例如,与编码GFP的核苷酸序列可操作地连接的启动子将能够影响该GFP核苷酸序列的表达。控制序列不需要与目的核苷酸序列相邻,只要它们起到指导其表达的作用。因此,例如,介入未翻译的、已转录的序列可以在启动子与编码序列之间存在,并且该启动子序列仍可以被认为“可操作地连接至”该编码序列上。
如本文使用的“引物”是分离的核酸,它们通过核酸杂交被退火为互补靶DNA链,以在该引物与该靶DNA链之间形成杂交,然后通过一种聚合酶(如DNA聚合酶)沿着该靶DNA链延长。引物对或引物组可以用于核酸分子的扩增,例如通过聚合酶链式反应(PCR)或者其他核酸扩增方法。
“探针”是互补于靶核酸分子的一部分的分离的核酸分子,并且典型地用于检测和/或定量靶核酸分子。因此,在一些实施例中,探针可以是可检测部分或报道基因附接到的分离的核酸分子,如放射性同位素、配体、化学发光剂、荧光剂或酶。根据本发明的探针不仅可以包括脱氧核糖核酸或核糖核酸,还包括与靶核酸序列特异性结合并且可以用于检测该靶核酸序列的存在或定量该靶核酸序列的量的聚酰胺类以及其他探针材料。
设计TaqMan探针,使得其在由特定引物组扩增的DNA区域内退火。由于Taq聚合酶延伸引物并从互补链的3'至5'的单链模板合成新生链,所以聚合酶的5'至3'外切核酸酶通过探针延伸新生链,并且因此降解已经退火到模板的探针。探针的降解从其中释放荧光团,并打破了与淬灭剂的紧密相接,从而减轻了淬灭效应并允许荧光团的荧光。因此,在定量PCR热循环仪中检测到的荧光与释放的荧光团和PCR中存在的DNA模板的量成正比。
引物和探针的长度一般在5和100个核苷酸或更多核苷酸之间。在一些实施例中,引物和探针的长度可以为至少20个核苷酸或更多,或至少25个核苷酸或更多,或长度至少30个核苷酸或更多。这些引物和探针在本领域已知的最佳杂交条件下与靶序列特异性杂交。根据本发明的引物和探针可以具有与该靶序列互补的完整序列,虽然与该靶序列不同并保留与该靶序列杂交的能力的探针可通过根据本发明的常规方法进行设计。
用于制备和使用探针和引物的方法描述于例如Molecular Cloning:A Laboratory Manual[分子克隆:实验室手册],第二版,第1-3卷,Sambrook等人编辑,ColdSpring Harbor Laboratory Press[冷泉港实验室出版社],Cold Spring Harbor[冷泉港],纽约州,1989中。PCR引物对可以源自已知序列,例如通过使用旨在用于该目的的计算机程序。
聚合酶链式反应(PCR)是一种用于“扩增”特定DNA片段的技术。为了进行PCR,必须知道待复制的DNA分子的核苷酸序列的至少一部分。通常,使用与待扩增的DNA的每条链的3'端处的核苷酸序列(已知序列)互补(例如,基本互补或完全互补)的引物或短寡核苷酸。将DNA样品加热以分离其链,并与这些引物混合。这些引物与其DNA样品中的互补序列杂交。使用原始DNA链作为模板开始合成(5'至3'方向)。该反应混合物必须包含全部四种脱氧核苷酸三磷酸(dATP、dCTP、dGTP、dTTP)和DNA聚合酶。聚合继续进行,直到每条新合成的链已经进行得足够远以包含被另一个引物识别的序列。一旦发生这种情况,就会产生与原始分子相同的两个DNA分子。将这两个分子加热以分离其链,并重复该过程。每个循环使DNA分子的数量加倍。使用自动化设备,每个循环的复制可以在不到5分钟内完成。30个循环后,以DNA单分子开始的扩增已经超过10亿个拷贝(230=1.02x 109)。
定量聚合酶链式反应(qPCR)(也称为实时聚合酶链式反应)实时监测来自PCR反应的DNA产物的积累。qPCR是基于聚合酶链式反应(PCR)的分子生物学实验室技术,它用于扩增并且同时定量靶DNA分子。TaqMan是用于qPCR的系统。可以在PCR中扩增和检测特定序列的甚至一个拷贝。PCR反应以指数方式生成DNA模板的拷贝。这导致起始靶序列的量和在任何特定循环下累积的PCR产物的量之间的定量关系。由于与模板、试剂限制或焦磷酸盐分子的积累一起发现的聚合酶反应的抑制剂,所以PCR反应最终停止以指数速率生成模板(即平台期),使得PCR产物的终点定量不可靠。因此,重复的反应可以生成可变量的PCR产物。只有在PCR反应的指数期期间才有可能回推以便确定模板序列的起始量。PCR产物积累时的测量(即实时定量PCR)允许在反应的指数期进行定量,并且因此消除与常规PCR相关的变异性。在实时PCR测定中,通过荧光信号积累来检测阳性反应。对于DNA样品中的一个或多个特异性序列,定量PCR能够进行检测和定量二者。数量可以是拷贝的绝对数量或是当归一化到DNA输入或额外的归一化基因时的相对量。从实时PCR的第一次记录以来,它已被用于越来越多的并且不同数量的应用,包括mRNA表达研究、基因组或病毒DNA中的DNA拷贝数测量、等位基因辨别测定、基因的特异性剪接变体的表达分析和石蜡包埋组织中的基因表达以及激光捕获的显微切割细胞。
如本文使用的,术语“细胞”是指任何活细胞。所述细胞可以是原核细胞或真核细胞。所述细胞可以是分离的。所述细胞可能能够或可能不能够再生成生物体。所述细胞可以是在组织、愈伤组织、培养物、器官、或部分的上下文中。在一些实施例中,所述细胞可以是植物细胞。本发明的植物细胞可以处于分离的单细胞形式,或者可以是培养的细胞,或者可以是作为较高级的组织单位(例如像,植物组织或植物器官)的一部分。所述植物细胞可以源自被子植物或裸子植物或是它们的一部分。在另外的实施例中,所述植物细胞可以是单子叶植物细胞、双子叶植物细胞。所述单子叶植物细胞可以是例如玉蜀黍、水稻、高粱、甘蔗、大麦、小麦、燕麦、草皮草、或观赏草细胞。所述双子叶植物细胞可以是例如烟草、胡椒、茄子、向日葵、十字花科植物、亚麻、马铃薯、棉花、大豆、甜菜、或油菜细胞。
如本文使用的术语“植物部分”包括但不限于胚、花粉、胚珠、种子、叶、茎、芽、花、枝、果实、籽粒、穗、穗轴、壳、秆、根、根尖、花药。植物部分包括植物细胞。“植物细胞”包括在植物和/或植物的部分中完整的植物细胞、植物原生质体、植物组织、植物细胞组织培养物、植物愈伤组织、植物团(plant clump)等。如本文使用的,“芽”是指包括叶和茎的地上部分。此外,如本文使用的,“植物细胞”是指植物的结构和生理单位,包括细胞壁并且也可以指原生质体。
在细胞、原核细胞、细菌细胞、真核细胞、植物细胞、植物和/或植物部分的上下文中,术语“引入”(introducing或introduce)意指将核酸分子与所述细胞、真核细胞、植物、植物部分和/或植物细胞以这样一种方式相接触,使得所述核酸分子得以进入细胞、真核细胞、植物细胞和/或植物和/或植物部分的细胞的内部。在引入多于一种核酸分子的情况下,这些核酸分子可以被装配成单个聚核苷酸或核酸构建体的一部分,或装配成分开的聚核苷酸或核酸构建体,并且可以位于相同或不同的核酸构建体上。因此,可以在单个的转化事件中、在分开的转化事件中、或者例如作为育种方案的一部分,将这些多核苷酸引入到植物细胞中。
如本文使用的,术语“转化”和“转基因”是指包含至少一种重组(例如,异源)多核苷酸的全部或部分的任何细胞、原核细胞、真核细胞、植物、植物细胞、愈伤组织、植物组织、或植物部分。在一些实施例中,将该重组多核苷酸的全部或部分稳定地整合到染色体或稳定的染色体外元件中,以便使得其传递到连续世代。出于本发明的目的,术语“重组多核苷酸”是指已经通过基因工程予以改变、重排或修饰的多核苷酸。实例包括任何克隆的多核苷酸,或与异源序列连接或接合的多核苷酸。术语“重组”不是指因天然存在的事件(如自发突变)或因非自发诱变随后选择性育种而产生的多核苷酸改变。
如本文使用的术语“转化”是指将异源核酸引入细胞中。细胞的转化可以是稳定或瞬时的。因此,本发明的转基因细胞、植物细胞、植物和/或植物部分可以被稳定转化或瞬时转化。术语“转化”可以指将核酸分子转移到宿主细胞的基因组中,导致基因上稳定的遗传。在一些实施例中,引入植物、植物部分和/或植物细胞中是经由细菌介导的转化、粒子轰击转化、磷酸钙介导的转化、环糊精介导的转化、电穿孔、脂质体介导的转化、纳米粒子介导的转化、聚合物介导的转化、病毒介导的核酸递送、晶须介导的核酸递送、微量注射、超声波处理法、浸润法、聚乙二醇介导的转化、原生质体转化或导致向植物、植物部分和/或其细胞引入核酸的任何其他电学、化学、物理和/或生物学机制,或其任何组合进行的。
用于转化植物的程序在本领域中是熟知且常规的并且普遍描述于文献中。用于植物转化的方法的非限制性实例包括经由以下方式转化:细菌介导的核酸递送(例如,经由来自农杆菌属的细菌)、病毒介导的核酸递送、碳化硅或核酸须晶介导的核酸递送、脂质体介导的核酸递送、微注射、微粒轰击、磷酸钙介导的转化、环糊精介导的转化、电穿孔、纳米粒子介导的转化、超声处理、渗入、PEG介导的核酸吸收、以及使得核酸引入到植物细胞中的任何其他电学、化学、物理(机械)和/或生物学机制,包括其任何组合。本领域中已知的各种植物转化方法的一般指南包括Miki等人,(“Procedures for Introducing Foreign DNAinto Plants[将外源DNA引入植物中的程序]”在Plant Molecular Biology and Biotechnology[植物分子生物学和生物技术]的方法中,Glick,B.R.和Thompson,J.E.编辑(CRC Press,Inc.[CRC出版有限公司],波卡拉顿,1993),第67-88页)和Rakowoczy-Trojanowska(Cell.Mol.Biol.Lett.[细胞分子生物学快报]7:849-858(2002))。
农杆菌介导的转化是用于转化植物的常用方法,因为它的高转化效率以及因为它与许多不同物种的广泛实用性。农杆菌介导的转化典型地涉及将携带目的外源DNA的二元载体转移至适当的农杆菌菌株,这可能取决于由宿主农杆菌菌株在共同存在的Ti质粒上或染色体地携带的vir基因的互补体(Uknes等人,1993,Plant Cell[植物细胞]5:159-169)。将该重组二元载体转移至农杆菌可以使用携带该重组二元载体的大肠杆菌,一种辅助大肠杆菌菌株(该辅助菌株携带能够将该重组二元载体移动到靶农杆菌菌株中的质粒)通过三亲本交配程序实现。可替代地,可以通过核酸转化将该重组二元载体转移至农杆菌中(和Willmitzer,1988,Nucleic Acids Res.[核酸研究]16:9877)。
通过重组农杆菌进行的植物转化通常涉及该农杆菌与来自该植物的外植体的共培养,并且遵循本领域熟知的方法。典型地在携带位于这些二元质粒T-DNA边界之间的抗生素或除草剂抗性标记的选择培养基上对转化的组织进行再生。
另一种用于转化植物、植物部分以及植物细胞的方法涉及在植物组织和细胞上推进惰性或生物学活性的粒子。参见例如,美国专利号4,945,050、5,036,006和5,100,792。通常,这种方法涉及在有效于穿透该细胞的外表面并提供掺入在其内部中的条件下在植物细胞处推进惰性或生物活性的粒子。当使用惰性粒子时,可以通过用含有目的核酸的载体包被这些粒子而将该载体引入该细胞中。可替代地,一个或多个细胞可以被该载体围绕以使得该载体通过该粒子的激发而被带入该细胞中。也可以将生物活性粒子(例如,干燥的酵母细胞、干燥的细菌或噬菌体,各自包含一个或多个试图被引入的核酸)推进到植物组织中。
在多核苷酸的上下文中,“瞬时转化”意指:将多核苷酸引入细胞中并且没有整合到该细胞的基因组中。瞬时转化可以通过例如酶联免疫测定(ELISA)或蛋白质印迹来进行检测,这两种方法可以检测由引入生物体的一个或多个核酸分子编码的肽或多肽的存在。
如本文使用的,在被引入细胞中的多核苷酸的上下文中,“稳定引入(stablyintroducing、stably introduced)”、“稳定转化(stable transformation或stablytransformed)”意指:引入的多核苷酸被稳定地整合到该细胞的基因组中,并且因此该细胞用该多核苷酸稳定地转化。因此,整合的多核苷酸能够由其子代继承,更具体地说,由多个连续世代的子代继承。如本文使用的“基因组”包括核和/或质体基因组,并且因此包括多核苷酸到例如叶绿体基因组中的整合。如本文使用的稳定转化还可以是指被保持在染色体外,例如,作为微染色体的多核苷酸。
细胞的稳定转化可以通过例如细胞基因组DNA与核酸序列(这些序列与引入生物体(例如,植物)中的核酸分子的核苷酸序列特异性地杂交)的DNA印迹杂交测定来进行检测。细胞的稳定转化可以通过例如细胞的RNA与核酸序列(这些序列与引入植物或其他生物体的核酸分子的核苷酸序列特异性地杂交)的RNA印记杂交测定来进行检测。细胞的稳定转化还可以通过例如聚合酶链式反应(PCR)或本领域内熟知的其他扩增反应来进行检测,该反应采用与核酸分子的一个或多个靶序列进行杂交的特异性引物序列,导致该一个或多个靶序列的扩增,这种扩增可以根据标准方法进行检测。转化还可以通过本领域熟知的直接测序和/或杂交方案进行检测。
因此,在本发明的具体实施例中,植物细胞可以通过本领域内已知的任何方法并且如本文所述进行转化并且可以使用多种已知技术中的任一种来从这些经转化的细胞再生出完整的植物。在以下文献中描述了从植物细胞、植物组织培养物和/或培养的原生质体进行的植物再生:例如,Evans等人(Handbook of Plant Cell Cultures[植物细胞培养物手册],第1卷,麦克米兰出版公司(MacMilan Publishing Co.),纽约(1983));以及VasilI.R.(编辑)(Cell Culture and Somatic Cell Genetics of Plants[植物的细胞培养和体细胞遗传学],学术出版社,奥兰多,第I卷(1984)和第II卷(1986))。选择转化的转基因植物、植物细胞和/或植物组织培养物的方法在本领域中是常规的,并且可以用于在此提供的本发明的方法中。
“转化和再生过程”是指将转基因稳定地引入植物细胞并从转基因植物细胞再生植物的过程。如本文使用的,转化和再生包括选择过程,通过该过程转基因包括选择性标记,并且转化的细胞已经并入并表达转基因,使得转化的细胞将在选择剂存在下存活并发育繁盛。“再生”是指从植物细胞、一组植物细胞、或植物片(如来自原生质体、愈伤组织、或组织部分的)长成整个植物。
术语“核苷酸序列”、“核酸”、“核酸序列”、“核酸分子”“寡核苷酸”以及“多核苷酸”在此可互换地使用来指核苷酸的杂聚物并且涵盖RNA和DNA二者,包括cDNA、基因组DNA、mRNA、合成的(例如,化学合成的)DNA或RNA以及RNA和DNA的嵌合体。术语核酸分子是指核苷酸链,而不考虑该链的长度。这些核苷酸包含糖、磷酸和碱,该碱是嘌呤或嘧啶。核酸分子可以是双链或单链的。在单链时,核酸分子可以是正义链或反义链。可以使用寡核苷酸类似物或衍生物(例如,肌苷或硫代磷酸核苷酸)合成核酸分子。此类寡核苷酸可以例如用于制备具有改变的碱基配对能力或对核酸酶的增强的抗性的核酸分子。在此提供的核酸序列在此以5’至3’方向从左至右表示,并且使用代表核苷酸字符的标准代码表示,如美国序列规则,37 CFR§§1.821-1.825和世界知识产权组织(WIPO)标准ST.25中所述。
“核酸片段”是给定核酸分子的一部分。“RNA片段”是给定的RNA分子的一部分。“DNA片段”是给定的DNA分子的一部分。“核酸区段”是给定的核酸分子的一部分并且并不是从该分子分离的。“RNA区段”是给定的RNA分子的一部分并且并不是从该分子分离的。“DNA区段”是给定的DNA分子的一部分并且并不是从该分子分离的。多核苷酸的区段可以是任何长度,例如长度为至少5、10、15、20、25、30、40、50、75、100、150、200、300或500或更多个核苷酸。引导序列的区段或一部分可以是该引导序列的约50%、40%、30%、20%、10%,例如该引导序列的三分之一或更短,例如长度为7、6、5、4、3、或2个核苷酸。
在分子的上下文中,术语“源自”是指使用亲本分子或来自所述亲本分子的信息,分离或制造的分子。例如,Cas9单突变体切口酶和Cas9双突变体无效核酸酶各自源自野生型Cas9蛋白。
在高等植物中,脱氧核糖核酸(DNA)是遗传物质,而核糖核酸(RNA)涉及将DNA中包含的信息到蛋白中的转移。“基因组”是在生物体的每个细胞中所包含的遗传物质的整体。除非另外表明,本发明的特定的核酸序列还暗示性地涵盖其保守地修饰的变体(例如,简并密码子取代)以及互补序列、以及连同明确地指明的序列。确切地,简并密码子取代可通过产生以下序列来实现,在这些序列中一个或多个所选(或全部)密码子的第三位置被经混合的碱基和/或脱氧肌苷残基取代(Batzer等人,Nucleic Acid Res.[核算研究]19:5081(1991);Ohtsuka等人,J.Biol.Chem.[生物化学杂志]260:2605-2608(1985);Rossolini等人,Mol.Cell.Probes[分子细胞探针]8:91-98(1994))。术语核酸分子与基因、cDNA和由基因编码的mRNA可互换使用。
如本文使用的“序列同一性”是指两个最佳比对的多核苷酸或肽序列在组分(例如,核苷酸或氨基酸)的整个比对窗口内不变的程度。“同一性”可以通过已知方法容易地计算出,这些方法包括但不限于以下文献中描述的那些:Computational Molecular Biology[计算分子生物学](莱斯克A.M.(Lesk,A.M.)编辑)牛津大学出版社(Oxford UniversityPress),纽约(1988);Biocomputing:Informatics and Genome Projects[生物计算:信息学与基因组计划](史密斯D.W.(Smith,D.W.)编辑)学术出版社(Academic Press),纽约(1993);Computer Analysis of Sequence Data[序列数据的计算机分析],部分I(格里芬A.M.(Griffin,A.M.)和格里芬H.G.(Griffin,H.G.)编辑)胡马纳出版社(Humana Press),新泽西州(1994);SequenceAnalysis in Molecular Biology[分子生物学中的序列分析](冯·海因切G.(von Heinje,G.)编辑)学术出版社(1987);以及Sequence Analysis Primer[序列分析初级读本](哥博斯科夫M.(Gribskov,M.)和德弗罗J.(Devereux,J.)编辑)斯托克顿出版社(Stockton Press),纽约(1991)。
如本文使用的,术语“序列同一性百分比”或“同一性百分比”是指在最佳比对两个序列时,与测试(“主题”)多核苷酸分子(或其互补链)相比,参考(“查询”)多核苷酸分子(或其互补链)的线性多核苷酸序列中的同一核苷酸的百分比。在一些实施例中,“同一性百分比”可以是指氨基酸序列中同一氨基酸的百分比。
如本文使用的,在两个核酸分子、核苷酸序列或蛋白质序列上下文中,短语“基本上同一”是指当比较并比对最大对应性时具有至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约96%、至少约97%、至少约98%、或至少约99%核苷酸或氨基酸残基同一性的两个或更多个序列或子序列,如使用以下序列比较算法之一或通过目测检查所测量的。在本发明的一些实施例中,在长度为至少约15个残基至约150个残基的序列区域上存在基本同一性。因此,在本发明的一些实施例中,在长度为至少约10、约20、约30、约40、50、约60、约70、约80、约90、约100、约110、约120、约130、约140、约150或更多个残基的序列区域上存在基本同一性。在一些具体实施例中,这些序列在至少约80个残基上是基本上同一的。在另外的实施例中,这些序列在编码区的全长上(例如在tracrRNA分子的全长上)是基本上同一的。此外,在代表性实施例中,基本上同一的核苷酸序列或蛋白序列进行基本上相同的功能(例如引导至具体的基因组靶表、具体的基因组靶位点的内切核酸酶切割)。
对于序列比较,典型地,一个序列充当与测试序列进行比较的参考序列。当使用序列比较算法时,将测试序列和参考序列输入到计算机中(若有必要,则指定子序列坐标),并且指定序列算法程序的参数。然后,该序列比较算法基于所指定的程序参数来计算测试序列相对于参考序列的序列同一性百分比。
用于比对比较窗口的最佳序列比对是本领域技术人员所熟知的并且可以由以下工具实施:如Smith和Waterman的局部同源性算法、Needleman和Wunsch的同源性比对算法、Pearson和Lipman的相似性搜索方法,并且任选地由这些算法的计算机化实现方式来实施,如作为Wisconsin(材料科学软件公司(Accelrys Inc.),圣地亚哥,加利福尼亚州)的部分可获得的GAP、BESTFIT、FASTA和TFASTA。测试序列和参考序列的已比对区段的“同一性分数”是由两个已比对序列所共有的同一组分的数目除以参考序列区段(即,完整的参考序列或参考序列的更小限定部分)中组分的总数目。序列同一性百分比被表示为同一性分数乘以100。一个或多个多核苷酸序列的比较可以是相对于全长多核苷酸序列或其部分,或相对于较长的多核苷酸序列。出于本发明的目的,也可以使用针对翻译的核苷酸序列的2.0版BLASTX和针对多核苷酸序列的2.0版BLASTN确定“同一性百分比”。
用于执行BLAST分析的软件可通过美国国家生物技术信息中心(National Centerfor Biotechnology Information)公开地获得。这种算法涉及首先通过鉴定查询序列中具有长度W的短字码而鉴定得分高的序列对(HSP),这些得分高的序列对当与数据库序列中具有相同长度的字码(word)进行比对时匹配或满足一些正值阈值的得分T。T被称为邻近字码得分阈值(Altschul等人,1990)。这些初始的邻近字码命中充当种子用于起始搜索以发现含有它们的较长的HSP。然后,将这些字码命中在两个方向上沿着每个序列延伸直到累积的比对得分可以增加。对于核苷酸序列,使用参数M(对于一对匹配残基的奖赏得分;总是>0)和N(对于错配残基的罚分;总是<0)来计算累积得分。对于氨基酸序列,使用评分矩阵来计算累积得分。当累积的比对得分从它的最大达到值降低了数量X;由于累积一个或多个负得分的残基比对使累积得分趋于0或0以下;或者到达任一序列的末端时,停止字码命中在每个方向上的延伸。BLAST算法的参数W、T、以及X决定了比对的灵敏度与速度。BLASTN程序(对核苷酸序列来说)使用字长(W)为11、期望值(E)为10、截止值(cutoff)为100、M=5、N=-4、以及两条链的比较作为默认值。对于氨基酸序列,BLASTP程序使用字长(W)为3、期望值(E)为10、以及BLOSUM62评分矩阵作为默认值(参见Henikoff&Henikoff,Proc.Natl.Acad.Sci.USA[美国国家科学院院刊]89:10915(1989))。
除了计算序列同一性百分数之外,BLAST算法还进行两个序列之间相似性的统计分析(参见,例如Karlin和Altschul,Proc.Nat’l.Acad.Sci.USA[美国国家科学院院刊]90:5873-5787(1993))。由BLAST算法提供的相似性的一种量度是最小概率总和(P(N)),它提供了在两个核苷酸或氨基酸序列之间会偶然发生匹配的概率的指示。例如,如果在测试核苷酸序列与参考核苷酸序列的比较中的最小概率总和小于约0.1至小于约0.001,则该测试核酸序列被认为是与该参考序列相似的。因此,在本发明的一些实施例中,在测试核苷酸序列与参考核苷酸序列的比较中的最小概率总和小于约0.001。
当两个核苷酸序列在严格条件下彼此杂交时,这两个核苷酸序列也可以被认为是基本上同一的。在一些代表性实施例中,被认为基本上同一的两个核苷酸序列在高严格条件下彼此杂交。
在核酸杂交实验(如DNA杂交和RNA杂交)的上下文中,“严格杂交条件”和“严格杂交洗涤条件”是序列依赖性的,并且在不同的环境参数下是不同的。对核酸杂交的广泛指导见于以下:Tijssen Laboratory Techniques in Biochemistry and Molecular Biology-Hybridization with Nucleic Acid[生物化学和分子生物学实验室技术-使用核酸探针的杂交]第2章第I部分“Overview of principles of hybridization and the strategy ofnucleic acid probe assays[杂交原理和核酸探针测定策略综述]”Elsevier[爱思唯尔],纽约(1993)。通常,高严格杂交和洗涤条件在限定的离子强度和pH下被选定为比特定序列的热熔点(Tm)低约5℃。
Tm是50%的靶序列与完全匹配的探针进行杂交时的温度(在限定的离子强度和pH下)。非常严格条件被选定为等于特定探针的Tm。用于互补核苷酸序列(它们在DNA或RNA印迹中在滤器上具有超过100个互补残基)的杂交的严格杂交条件的一个实例是在42℃下具有1mg肝素的50%甲酰胺,其中杂交是过夜进行的。高严格洗涤条件的一个实例是0.15MNaCl,在72℃持续约15分钟。严格洗涤条件的实例是在65℃以0.2x SSC洗涤持续15分钟(参见Sambrook,下文,针对SSC缓冲液的描述)。通常,高严格洗涤之前会先进行低严格洗涤,以去除背景探针信号。对于例如多于100个核苷酸的双链体的中严格洗涤的实例是在45℃以1x SSC持续15分钟。对于例如多于100个核苷酸的双链体的低严格性洗涤的一个实例是在40℃下以4-6x SSC进行15分钟。对于短探针(例如,约10至50个核苷酸),严格条件典型地涉及小于约1.0M的Na离子的盐浓度,典型地在pH 7.0至8.3下约0.01至1.0M的Na离子浓度(或其他盐),并且温度典型地是至少约30℃。还可以通过添加去稳定剂(如甲酰胺)来达到严格条件。一般而言,在特定的杂交测定中相比于不相关的探针观察到的高出2x(或更高)的信噪比表明检测到特异性杂交。如果在严格条件下彼此不杂交的核苷酸序列所编码的蛋白质是基本上同一的,则这些核苷酸序列仍然是基本上同一的。例如,当使用遗传密码所允许的最大密码子简并性来生成核苷酸序列的拷贝时,这种情况可能发生。
以下是可以用来克隆同源核苷酸序列(这些序列是与本发明的参考核苷酸序列基本上同一的)的杂交/洗涤条件的设置的实例。在一个实施例中,参考核苷酸序列在50℃在7%十二烷基硫酸钠(SDS)、0.5M NaPO4、1mM EDTA中与“测试”核苷酸序列杂交,同时在50℃在2X SSC、0.1%SDS中洗涤。在另一个实施例中,参考核苷酸序列在50℃在7%十二烷基硫酸钠(SDS)、0.5M NaPO4、1mM EDTA中与“测试”核苷酸序列杂交,同时在50℃在1X SSC、0.1%SDS中洗涤;或者在50℃在7%十二烷基硫酸钠(SDS)、0.5M NaPO4、1mM EDTA中杂交,同时在50℃在0.5X SSC、0.1%SDS中洗涤。在再另外的实施例中,参考核苷酸序列在50℃在7%十二烷基硫酸钠(SDS)、0.5M NaPO4、1mM EDTA中与“测试”核苷酸序列杂交,同时在50℃在0.1X SSC、0.1%SDS中洗涤;或者在50℃在7%十二烷基硫酸钠(SDS)、0.5M NaPO4、1mMEDTA中杂交,同时在65℃在0.1X SSC、0.1%SDS中洗涤。
“分离的”核酸分子或核苷酸序列或“分离的”多肽是借助于人的手脱离其天然环境存在的和/或当与其在其天然环境中的功能相比时具有不同的、修饰的、调节的和/或改变的功能的并且因此不是天然的产物的核酸分子、核苷酸序列或多肽。分离的核酸分子或分离的多肽能以纯化形式存在或可以存在于非天然环境(例如像重组宿主细胞)中。因此,例如,相对于多核苷酸而言,术语分离的意指将该多核苷酸从它天然存在于其中的染色体和/或细胞中分离出。如果将一种多核苷酸从它天然存在于其中的染色体和/或细胞中分离出并且然后将其插入它并不天然存在于其中的遗传背景、染色体、染色体位置、和/或细胞中,则该多核苷酸也是被分离的。本发明的重组核酸分子和核苷酸序列可以被认为是如上文所定义的“分离的”。
“野生型”核苷酸序列或氨基酸序列是指天然存在(“天然”)或内源核苷酸序列或氨基酸序列。因此,例如,“野生型mRNA”是天然存在于生物体中的或对生物体来说是內源性的mRNA。“同源”核苷酸序列是与它被引入的宿主细胞天然相关的核苷酸序列。
术语“开放阅读框”和“ORF”是指在编码序列的翻译起始和终止密码子之间编码的氨基酸序列。术语“起始密码子”和“终止密码子”是指在编码序列中三个相邻的核苷酸(“密码子”)的一个单位,它对应地指明蛋白合成(mRNA翻译)的起始和链终止。
“启动子”是指核苷酸序列,通常在它的编码序列的上游(5’),它通过提供对适当的转录所需的RNA聚合酶以及其他因子的识别来控制该编码序列的表达。“启动子调节序列”由近端和更远端上游元件组成。启动子调节序列影响相关编码序列的转录、RNA加工或稳定性、或翻译。调节序列包括增强子、启动子、非翻译的前导序列、内含子、以及聚腺苷酸化信号序列。它们包括自然序列以及合成序列、连同可能是合成序列与自然序列的组合的序列。“增强子”是一个DNA序列,它可以刺激启动子的活性并且可以是该启动子或插入的异源元件的一个固有元件以增强一种启动子的水平或组织特异性。它能够在两个方向(正常或翻转)上进行操作,并且甚至当移动到该启动子的上游或下游时还能够发挥作用。术语“启动子”的含义包括“启动子调节序列”。
“初级转化株”以及“T0世代”是指与最初转化(即,自从转化起未经历减数分裂以及受精)的组织具有相同遗传世代的转基因植物。“次级转化株”以及“T1、T2、T3等世代”是指经由一个或多个减数分裂以及受精循环而源自初级转化株的转基因植物。它们可以通过初级或次级转化株的自体受精或初级或次级转化株与其他转化或未转化植物的杂交衍生的。
“转基因”是指核酸分子,该核酸分子已经通过转化被引入该基因组中并且被稳定地保持。转基因可以包括至少一个表达盒,典型地包括至少两个表达盒,并且可以包括十个或更多个表达盒。转基因可以包括例如对于待转化的特定植物的基因而言是异源的或者是同源的基因。此外,转基因可以包括被插入非天然生物体中的天然基因,或嵌合基因。术语“内源基因”是指在生物体的基因组中在它的天然位置中的天然基因。“外源”基因是指正常在宿主生物体中未发现但通过基因转移被引入该生物体中的基因。
“内含子”是指几乎唯一地在真核基因中发生的DNA的内插区段,但该内插区段在该基因产物中没有被翻译成氨基酸序列。通过一个称为剪接的过程从未成熟的mRNA中去除这些内含子,该剪接使外显子未被触及,从而形成mRNA。出于本发明的目的,术语“内含子”的定义包括对源自靶基因的内含子的核苷酸序列进行修饰,条件是该修饰过的内含子没有显著地降低其关联的5’调节序列的活性。
“外显子”是指携带蛋白或其一部分的编码序列的DNA的区段。外显子被内插的、非编码序列(内含子)分离。出于本发明的目的,术语“外显子”的定义包括对源自靶基因的外显子的核苷酸序列进行修饰,条件是该修饰过的外显子没有显著地降低它的关联的5’调节序列的活性。
如本文使用的,“靶位点”、“靶序列”、或“靶前间隔序列DNA”在本文可互换使用,是指靶DNA(目标DNA靶向RNA的DNA靶向区段将与其结合)中存在的核酸序列,为结合存在的提供足够的条件。适合的DNA/RNA结合条件包括细胞中正常存在的生理条件。其他适合的DNA/RNA结合条件(例如无细胞系统中的条件)是本领域已知的;参见例如Sambrook,同上。与DNA靶向RNA互补并且与其杂交的靶DNA的链被称为“互补链”,并且与“互补链”互补(并且因此不与DNA靶向RNA互补)的靶DNA链称为“非互补链”。
如本文使用的,关于本发明的一个或多个核苷酸序列的术语“邻近的”或“与……邻近”意指紧邻(例如,没有插入序列)或由从约1个碱基至约10,000个碱基(例如,1、2、3、4、5、6、7、8、9、10、15、20、30、40、50、100、200、500、1000、2000、3000、4000、5000、6000、7000、8000、9000、或10,000个碱基)分隔,包括包含在该范围内但未在此明确叙述的任何值。
术语“切割(cleavage或cleaving)”是指多核苷酸的核糖基磷酸二酯主链中的共价磷酸二酯键联的断裂。术语“切割(cleavage或cleaving)”涵盖单链断裂和双链断裂二者。作为两次不同的单链切割事件的结果,可以发生双链切割。切割可以导致产生平末端或交错末端。“核酸酶切割位点”或“基因组核酸酶切割位点”是包括核酸酶切割序列的核苷酸区域,该核酸酶区域由特异性核酸酶识别,该核酸酶用于切割一条或两条链中基因组DNA的核苷酸序列。由核酸酶的这种切割引发了细胞内的DNA修复机制,它建立了同源重组或非同源末端连接发生的环境。
术语“CRISPR相关蛋白”、“Cas蛋白”、“CRISPR相关核酸酶”或“Cas核酸酶”是指野生型Cas蛋白,其片段,或其突变体或变体。术语“Cas突变体”或“Cas变体”是指野生型Cas蛋白的蛋白或多肽衍生物,例如具有一个或多个点突变、插入、缺失、截短、融合蛋白、或其组合的蛋白。在某些实施例中,Cas突变体或Cas变体基本上保留了Cas蛋白的核酸酶活性,例如与源自植物的核定位信号(NLS)可操作地连接的本文描述的Cas9变体。在某些实施例中,将Cas核酸酶突变,使得一个或两个核酸酶结构域无活性,例如像不具有催化活性的Cas9称为dCas9,它仍然能够靶向特定基因组位置,但是不具有内切核酸酶活性(Qi等人,2013,Cell[细胞],152:1173-1183,特此并入本文)。在一些实施例中,将Cas核酸酶突变,使得它缺乏其野生型对应物的一些或全部核酸酶活性。Cas蛋白可以是Cas9、Cpf1(Zetsche等人,2015,Cell[细胞],163:759-771,特此并入本文)或另一种CRISPR相关核酸酶。
“供体分子”、“供体多核苷酸”、或“供体序列”是旨在用于在靶多核苷酸(典型地靶基因组位点)处进行插入的核苷酸聚合物或低聚物。供体序列可以是一个或多个目的转基因、表达盒、或核苷酸序列。供体分子可以是供体DNA分子,是单链的、部分双链的、或双链的。供体多核苷酸可以是天然的或修饰的多核苷酸,RNA-DNA嵌合体,或DNA片段,单链的、或至少部分双链的、或完全双链的DNA分子,或PGR扩增的ssDNA,或至少部分dsDNA片段。在一些实施例中,供体DNA分子是环化DNA分子的一部分。完全双链的供体DNA是有利的,因为它可能提供增加的稳定性,因为与ssDNA相比,对于核酸酶降解,dsDNA片段通常更具有抗性。供体分子可以包含至少10个连续核苷酸,其中核酸分子与基因组核苷酸序列具有至少70%同一性,使得这些连续核苷酸足以在定点修饰多肽(在此情况下,是定点核酸酶)进行切割后,在靶向基因组DNA序列处将供体DNA分子同源重组到细胞中。在一些实施例中,供体DNA分子可以包含至少约10、20、30、50、70、80、100、150、200、250、300、250、400、450、500、600、700、800、900、1000、1500、2000、2500、3000、3500、4000、4500、5000、7500、10000、15,000或20,000个核苷酸,包括此范围内的未在此明确叙述的任何值,其中所述供体DNA分子与基因组核酸序列具有至少70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、或100%同一性。在一些实施例中,供体DNA分子可以与基因组核酸序列基本上互补。在一些实施例中,供体DNA分子包含异源核酸序列。在一些实施例中,供体DNA分子包含至少一个表达盒。在一些实施例中,供体DNA分子可以包含转基因,所述转基因包含至少一个表达盒。在一些实施例中,供体DNA分子包含原于靶基因组的基因的等位基因修饰。所述等位基因修饰可以包含至少一个核苷酸插入、至少一个核苷酸缺失、和/或至少一个核苷酸取代。在一些实施例中,所述等位基因修饰可以包含INDEL。在一些实施例中,供体DNA分子包含与靶基因组位点同源的臂。在一些实施例中,供体DNA分子包含与基因组核酸序列具有至少90%同一性的至少100个连续核苷酸,并且任选地可以进一步包含异源核酸序列,例如转基因。
如本文使用的,“定点修饰多肽”或“RNA结合定点多肽”或“RNA结合定点修饰多肽”是指结合RNA并且靶向特定DNA序列的多肽。定点修饰多肽的实例是CRISPR相关核酸酶,例如Cas9或其变体。通过与如本文所述的定点修饰多肽结合的一个或多个RNA分子,将如本文所述的定点修饰多肽靶向至特定DNA序列。RNA分子或RNA双链体(如果是两个RNA分子),包含与靶DNA内的靶序列互补的序列,由此将结合的多肽靶向至靶DNA(靶序列)内的特定位置处。
结合定点修饰多肽并且将所述多肽靶向至靶DNA内特定位置处的RNA双链体在本文被称为“DNA靶向RNA双链体”。本发明的DNA靶向RNA双链体包含两个分子,它们一起提供“DNA靶向区段”和“蛋白结合区段”。这两个分子在本领域中称为crRNA(“CRISPR RNA”)和tracrRNA(“反式作用CRISPR RNA)(Jinek等人,2012)。crRNA分子包含DNA靶向RNA双链体的DNA靶向区段(单链的)和形成DNA靶向RNA双链体的蛋白结合区段的RNA双链体的一半的核苷酸的延伸区段(“双链体形成区段”)二者。相应的tracrRNA分子包含形成DNA靶向RNA双链体的蛋白结合区段的RNA双链体的另一半的核苷酸的延伸区段(双链体形成区段)。换句话说,crRNA分子的核苷酸的延伸区段与tracrRNA分子的核苷酸的延伸区段互补并且与其杂交,从而形成DNA靶向RNA的蛋白结合结构域的RNA双链体。如此,可以说每个crRNA分子具有相应的tracrRNA分子。crRNA分子另外提供了单链DNA靶向区段。因此,作为对应的对,crRNA分子和tracrRNA分子杂交,从而形成DNA靶向RNA双链体。DNA靶向RNA双链体可以包含任何相应的crRNA和tracrRNA对。
术语“双链体形成区段”在本文用于意指有助于通过与相应的crRNA或tracrRNA分子的核苷酸的延伸区段杂交,形成RNA双链体的crRNA分子或tracrRNA分子的核苷酸的延伸区段。换句话说,crRNA包含与相应tracrRNA的双链体形成区段互补的双链体形成区段。如此,tracrRNA包含双链体形成区段,同时crRNA包含DNA靶向RNA双链体的双链体形成区段和DNA靶向区段二者。
“区段”意指分子的区段/部分/区域,例如RNA中的核苷酸的连续延伸区段。区段还可以意指复合物的区域/部分,使得区段可以包含多于一个分子的区域。例如,DNA靶向RNA双链体的蛋白结合区段包含沿着互补区域杂交的两个分开的RNA分子。作为说明性的非限制性实例,DNA靶向RNA双链体的蛋白结合区段可以包含(i)长度为100个碱基对的第一RNA分子的碱基对40-75;和(ii)长度为50个碱基对的第二RNA分子的碱基对10-25。除非特定上下文中另外明确定义,否则“区段”的定义并不受限于总碱基对的具体数目,并不受限于来自给定RNA分子的碱基对的任何特定数目,并不受限于复合物内的分开的分子的特定数目,并且可以包括具有任何总长度的RNA分子的区域,并且可以包括或可以不包括与其他分子互补的区域。本发明的DNA靶向RNA双链体的DNA靶向区段(或“DNA靶向序列”)包含与靶DNA内的具体序列互补的核苷酸序列(靶DNA的互补链)。蛋白结合区段(或“蛋白结合序列”)与定点修饰多肽相互作用。
当定点修饰多肽是Cas9或Cas9变体多肽时,在由以下二者决定的位置处发生靶DNA的位点特异性切割:(i)crRNA的DNA靶向区段和靶DNA之间的碱基配对互补性;和(ii)靶DNA中的短基序(称为前间隔序列邻近基序(PAM))。DNA靶向RNA双链体的蛋白结合区段包含彼此杂交从而形成双链RNA双链体(dsRNA双链体)的核苷酸是两个互补延伸区段。示例性DNA靶向RNA双链体包含crRNA分子和相应tracrRNA分子。DNA靶向RNA分子还可以包含单分子,例如所谓的单引导RNA,它能够形成二级结构,所述二级结构包括通过单引导RNA分子的相反端的杂交形成的蛋白结合区段(Jinek等人,2012)。
本披露提供了将相关定点修饰多肽的活性指导至靶DNA内的特定靶序列的DNA靶向RNA双链体。本发明的DNA靶向RNA双链体包含两个RNA分子,即crRNA和tracrRNA分子。crRNA包含DNA靶向区段,所述DNA靶向区段是与靶DNA内的序列互补的核酸序列。此DNA靶向区段也称为“前间隔序列”。换句话说,本发明的crRNA的DNA靶向区段以序列特异性方式,经由杂交(即碱基配对)与靶DNA相互作用。如此,crRNA分子的DNA靶向区段的核苷酸序列可以变化,并且决定了DNA靶向RNA双链体和靶DNA将发生相互作用的靶DNA内的位置。
本发明的crRNA分子的DNA靶向区段可以被修饰(例如通过基因工程),从而与靶DNA内的任何所希望的序列杂交。本发明的crRNA分子的DNA靶向区段的长度可以为从约12个核苷酸至约100个核苷酸。例如,本发明的crRNA的DNA靶向区段的长度可以为从约12个核苷酸(nt)至约80nt、从约12nt至约50nt、从约12nt至约40nt、从约12nt至约30nt、从约12nt至约25nt、从约12nt至约20nt、或从约12nt至约19nt。例如,本发明的crRNA的DNA靶向区段的长度可以为从约17nt至约27nt。例如,本发明的crRNA的DNA靶向区段的长度可以为从约19nt至约20nt、从约19nt至约25nt、从约19nt至约30nt、从约19nt至约35nt、从约19nt至约40nt、从约19nt至约45nt、从约19nt至约50nt、从约19nt至约60nt、从约19nt至约70nt、从约19nt至约80nt、从约19nt至约90nt、从约19nt至约100nt、从约20nt至约25nt、从约20nt至约30nt、从约20nt至约35nt、从约20nt至约40nt、从约20nt至约45nt、从约20nt至约50nt、从约20nt至约60nt、从约20nt至约70nt、从约20nt至约80nt、从约20nt至约90nt、或从约20nt至约100nt。本发明的crRNA的DNA靶向区段的核苷酸序列的长度可以为至少约12nt。在一些实施例中,本发明的crRNA的DNA靶向区段的长度为20个核苷酸。在一些实施例中,本发明的crRNA的DNA靶向区段的长度为19个核苷酸。
在SEQ ID NO:87-95(包含编码表达盒的DNA序列,用于表达至少一个crRNA和至少一个tracrRNA)中,用20个“N”表示crRNA的DNA靶向区段。这20个N被认为表示本发明的crRNA的DNA靶向区段,并且可以被修饰,从而与靶DNA内的任何所希望的序列杂交。这20个N还被认为表示适合DNA靶向区段的长度,如以上所述,并且如本领域普通技术人员熟知的,其中长度是至少约12nt、至少约15nt、至少约18nt、至少约19nt、至少约20nt、至少约25nt、至少约30nt、至少约35nt、至少约40nt、至少约50nt、至少约60nt、至少约70nt、至少约80nt、至少约90nt、或至少约100nt。
靶DNA的DNA靶向区段和靶序列之间的互补性百分比可以是至少60%(例如至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少97%、至少98%、至少99%、或100%)。在一些情况下,在靶DNA的互补链的靶序列的最5'的7个连续核苷酸上,本发明的crRNA的DNA靶向区段和靶DNA的靶序列之间的互补性百分比是100%。在一些情况下,在约20个连续核苷酸上,DNA靶向区段的DNA靶向序列和靶DNA的靶序列之间的互补性百分比是至少60%。在一些情况下,在靶DNA的互补链的靶序列的最5'的14个连续核苷酸上,crRNA的DNA靶向区段和靶DNA的靶序列之间的互补性百分比是100%,并且在其余部分上,低至0%。在这样一种情况下,可以认为DNA靶向序列长度为14个核苷酸。在一些情况下,在靶DNA的互补链的靶序列的最5'的7个连续核苷酸上,crRNA的DNA靶向区段和靶DNA的靶序列之间的互补性百分比是100%,并且在其余部分上,低至0%。在这样一种情况下,可以认为DNA靶向序列长度为7个核苷酸。
本发明的DNA靶向RNA双链体的蛋白结合区段与定点修饰多肽相互作用。经由crRNA分子的上述DNA靶向区段,DNA靶向RNA双链体将结合的多肽引导至靶DNA内的特定核苷酸序列。本发明的DNA靶向RNA双链体的蛋白结合区段包含彼此互补的核苷酸的两个延伸区段。这些延伸区段中的一个是在crRNA分子上,并且另一个是在tracrRNA分子上。核苷酸的这些延伸区段中的每一个彼此互补,使得两个RNA分子的互补核苷酸杂交,从而形成蛋白结合区段的双链RNA双链体。蛋白结合区段包含crRNA分子和tracrRNA分子的双链体形成区段,其中它们杂交,从而形成双链RNA区段,所述双链RNA区段然后由定点修饰多肽识别,以便结合。双链体形成区段可以包括二级RNA结构,在一级RNA序列中表示为crRNA与tracrRNA分子和/或5’突出端(对于tracrRNA分子)和/或3’突出端(对于crRNA分子)之间的错配。
crRNA由双链体形成区段和前间隔序列构成。在一些实施例中,在至少8、至少10、至少12、至少14、至少16、至少18、至少20、至少22、或22个连续核苷酸的延伸区段上,本发明的crRNA的双链体形成区段与SEQ ID NO:55、57、59、61、63、65、67、69、71、73、75、77、79、81、83,或其互补序列具有至少80%同一性、至少85%同一性、至少90%同一性、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%同一性。
tracrRNA的相应双链体形成区段在tracrRNA分子的5’端。在一些实施例中,在至少8、至少10、至少12、至少14、至少16、至少18、至少20、至少22、或22个连续核苷酸的延伸区段上,tracrRNA分子的双链体形成区段与SEQ ID NO:96-110、或其互补序列具有至少80%同一性、至少85%同一性、至少90%同一性、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%同一性。例如,在至少8、至少10、至少12、至少14、至少16、至少18、至少19、至少20、至少21、或至少22个连续核苷酸上,tracrRNA的双链体形成区段(或编码tracrRNA的双链体形成区段的DNA)与SEQ ID NO:96-110、或其互补序列中列出的tracrRNA序列的双链体形成区段中之一具有至少约65%同一性、至少约70%同一性、至少约75%同一性、至少约80%同一性、至少约85%同一性、至少约90%同一性、至少约95%同一性、至少约98%同一性、至少约99%同一性或100%同一性。
crRNA和tracrRNA分子的两个双链体形成区段杂交并且形成蛋白结合区段。在一些实施例中,在至少8、至少10、至少12、至少14、至少16、至少18、至少19、至少20、至少21、或至少22个连续核苷酸的延伸区段上,crRNA分子的双链体形成区段与本发明的相应tracrRNA分子具有至少60%同一性、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%同一性。
在一些实施例中,crRNA的双链体形成区段和tracrRNA的相应双链体形成区段分别是SEQ ID NO:55和96。在一些实施例中,crRNA的双链体形成区段和tracrRNA的相应双链体形成区段分别是SEQ ID NO:57和97。在一些实施例中,crRNA的双链体形成区段和tracrRNA的相应双链体形成区段分别是SEQ ID NO:59和98。在一些实施例中,crRNA的双链体形成区段和tracrRNA的相应双链体形成区段分别是SEQ ID NO:61和99。在一些实施例中,crRNA的双链体形成区段和tracrRNA的相应双链体形成区段分别是SEQ ID NO:63和100。在一些实施例中,crRNA的双链体形成区段和tracrRNA的相应双链体形成区段分别是SEQ ID NO:65和101。在一些实施例中,crRNA的双链体形成区段和tracrRNA的相应双链体形成区段分别是SEQ ID NO:67和102。在一些实施例中,crRNA的双链体形成区段和tracrRNA的相应双链体形成区段分别是SEQ ID NO:69和103。在一些实施例中,crRNA的双链体形成区段和tracrRNA的相应双链体形成区段分别是SEQ ID NO:71和104。在一些实施例中,crRNA的双链体形成区段和tracrRNA的相应双链体形成区段分别是SEQ ID NO:73和105。在一些实施例中,crRNA的双链体形成区段和tracrRNA的相应双链体形成区段分别是SEQ ID NO:75和106。在一些实施例中,crRNA的双链体形成区段和tracrRNA的相应双链体形成区段分别是SEQ ID NO:77和107。在一些实施例中,crRNA的双链体形成区段和tracrRNA的相应双链体形成区段分别是SEQ ID NO:79和108。在一些实施例中,crRNA的双链体形成区段和tracrRNA的相应双链体形成区段分别是SEQ ID NO:81和109。在一些实施例中,crRNA的双链体形成区段和tracrRNA的相应双链体形成区段分别是SEQ ID NO:83和110。
将认识到,可以将包含本发明的crRNA和tracrRNA分子的双重引导DNA靶向RNA双链体设计为允许crRNA与tracrRNA的受控制的(即有条件的)结合。因为DNA靶向RNA双链体不是功能性的,除非crRNA和tracrRNA二者都在功能性复合物中与定点修饰多肽(例如Cas9)结合,所以通过使crRNA和tracrRNA之间的结合是可诱导的,从而使DNA靶向RNA双链体是可诱导的(例如药物可诱导的)。作为一个非限制性实例,RNA适体可以用于调节(即控制)crRNA与tracrRNA的结合。因此,crRNA和/或tracrRNA可以包含RNA适体序列。
作为DNA靶向RNA双链体的一部分并且包含crRNA和tracrRNA分子的双链体形成区段的蛋白结合区段的长度可以为从约10个核苷酸至约100个核苷酸。例如,蛋白结合区段的长度可以为从约12个核苷酸(nt)至约80nt、从约12nt至约50nt、从约12nt至约40nt、从约12nt至约30nt、从约12nt至约25nt、或从约12至约20nt。蛋白结合区段的dsRNA双链体的长度可以为从约6个碱基对(bp)至约50bp。例如,蛋白结合区段的dsRNA双链体的长度为可以为从约6bp至约40bp、从约6bp至约30bp、从约6bp至约25bp、从约6bp至约20bp、从约6bp至约15bp、从约8bp至约40bp、从约8bp至约30bp、从约8bp至约25bp、从约8bp至约20bp或从约8bp至约15bp。例如,蛋白结合区段的dsRNA双链体的长度为可以为从约8bp至约10bp、从约10bp至约15bp、从约15bp至约18bp、从约18bp至约20bp、从约20bp至约25bp、从约25bp至约30bp、从约30bp至约35bp、从约35bp至约40bp、或从约40bp至约50bp。在一些实施例中,蛋白结合区段的dsRNA双链体的长度为17个碱基对。
杂交从而形成蛋白结合区段的dsRNA双链体的核苷酸序列之间的互补性百分比可以是至少约60%。例如,杂交从而形成蛋白结合区段的dsRNA双链体的核苷酸序列之间的互补性百分比可以是至少约65%、至少约70%、至少约75%、至少约80%、至少约85%、至少约90%、至少约95%、至少约98%、或至少约99%。在一些情况下,杂交从而形成蛋白结合区段的dsRNA双链体的核苷酸序列之间的互补性百分比是100%。
在天然DNA靶向RNA双链体中,crRNA和tracrRNA分子的双链体形成区段之间的碱基配对不是100%,因为形成了至少一个小环(Jinek等人,2012;Briner等人,2014.Molecular Cell[分子细胞]56:333-339)。类似地,本发明的crRNA和tracrRNA分子的双链体形成区段之间的碱基配对可以不是100%。在一些实施例中,本发明的DNA靶向RNA双链体的蛋白结合区段包含至少8个碱基配对。在其他实施例中,本发明的DNA靶向RNA双链体的蛋白结合区段包含至少9个碱基配对,至少10、至少11、至少12、至少13、至少14、至少15、至少16、至少17、至少18、至少19、至少20、至少21、至少22、至少23、至少24、至少25、至少26、至少27、至少28、至少29、或至少30个碱基配对。
在一些实施例中,本发明的DNA靶向RNA双链体和定点修饰多肽形成复合物。DNA靶向RNA双链体通过包含与靶DNA的序列互补的crRNA分子上的核苷酸序列,提供了对复合物的靶特异性(如以上所指出)。所述复合物的定点修饰多肽提供了位点特异性活性。换句话说,凭借其至少与DNA靶向RNA双链体的蛋白结合区段缔合,将定点修饰多肽引导至DNA序列(例如染色体序列或染色体外序列,例如游离体序列、微环序列、线粒体序列、叶绿体序列等)。定点修饰多肽修饰靶DNA(例如靶DNA的切割或甲基化)和/或与靶DNA缔合的多肽(例如组蛋白尾的甲基化或乙酰化)。定点修饰多肽在本文也称为“定点多肽”或“RNA结合定点修饰多肽”。
在一些情况下,定点修饰多肽是天然存在的修饰多肽。在其他情况下,定点修饰多肽不是天然存在的修饰多肽(例如嵌合多肽或被修饰的(例如突变、缺失、插入)的天然存在的多肽)。示例性天然存在的定点修饰多肽是本领域已知的(参见例如Makarova等人,2017,Cell[细胞]168:328-328.e1,和Shmakov等人,2017,Nat Rev Microbiol[自然微生物学综述]15(3):169-182,这两篇文献均通过引用并入本文)。这些天然存在的多肽结合DNA靶向RNA,并且由此被指导至靶DNA内的特定序列,并且切割靶DNA,从而产生双链断裂。
定点修饰多肽包含两个部分,即RNA结合部分和活性部分。在一些实施例中,定点修饰多肽包含:(i)与DNA靶向RNA相互作用的RNA结合部分,其中所述DNA靶向RNA包含与靶DNA中的序列互补的核苷酸序列;和(ii)展现出定点酶活性(例如DNA甲基化活性、DNA切割活性、组蛋白乙酰化活性、组蛋白甲基化活性等)的活性部分,其中由DNA靶向RNA决定酶活性的位点。在其他实施例中,定点修饰多肽包含:(i)与DNA靶向RNA相互作用的RNA结合部分,其中所述DNA靶向RNA包含与靶DNA中的序列互补的核苷酸序列;和(ii)调节靶DNA内的转录(例如增加或减少转录)的活性部分,其中由DNA靶向RNA决定靶DNA内的调节的转录的位点。
在一些情况下,定点修饰多肽具有修饰靶DNA的酶活性(例如核酸酶活性、甲基转移酶活性、脱甲基酶活性、DNA修复活性、DNA损伤活性、去氨基活性、歧化酶活性、烷基化活性、脱嘌呤活性、氧化活性、嘧啶二聚体形成活性、整合酶活性、转座酶活性、重组酶活性、聚合酶活性、连接酶活性、螺旋酶活性、光解酶活性或糖基化酶活性)。在其他情况下,定点修饰多肽具有修饰与靶DNA缔合的多肽(例如组蛋白)的酶活性(例如甲基转移酶活性、脱甲基酶活性、乙酰转移酶活性、脱乙酰基酶活性、激酶活性、磷酸酶活性、泛素连接酶活性、去泛素化活性、腺苷酸化活性、脱腺苷酸化活性、SUMO化活性、去SUMO化活性、核糖基化活性、去核糖基化活性、豆蔻酰化活性或去豆蔻酰化活性)。
在一些情况下,不同定点修饰多肽,例如不同Cas9蛋白(即来自多种物种的Cas9蛋白)可以有利地用于多种本发明提供的方法,用来利用不同Cas9蛋白的多种酶特征(例如用于不同PAM序列偏好;用于增加或减少的酶活性;用于增加或减少的细胞毒性水平;用于改变NHEJ、同源定向修复、单链断裂、双链断裂等之间的平衡)。来自多种物种的Cas9蛋白(例如,Shmakov等人,2017中披露的那些,或源自其的多肽)可能需要靶DNA中的不同PAM序列。因此,对于选择的特定Cas9酶,PAM序列要求可能不同于已知对于Cas9活性所需要的5'-NGG-3'序列(其中N是A、T、C、或G)。本文已经鉴定了来自多种多样的物种的许多Cas9直系同源物,并且所述蛋白仅共享少数相同的氨基酸。所有鉴定的Cas9直向同源物具有与中央HNH内切核酸酶结构域和分开的RuvC/核糖核酸酶H结构域相同的结构域构造。Cas9蛋白共享具有保守构造的4个关键基序;基序1、2、和4是RuvC样基序,而基序3是HNH基序。
定点修饰多肽还可以是嵌合的和修饰的Cas9核酸酶。例如,它可以是修饰的Cas9“碱基编辑器”。碱基编辑使得能够以可编程方式将一个靶DNA碱基直接不可逆转变为另一个碱基,而不需要DNA切割或供体DNA分子。例如,Komor等人(2016,Nature[自然],533:420-424)教导了Cas9-胞苷脱氨酶融合,其中也已经将Cas9工程化为无活性的,并且并不诱导双链DNA断裂。此外,Gaudelli等人(2017,Nature[自然],doi:10.1038/nature24644)教导了融合至tRNA腺苷脱氨酶的催化活性削弱的Cas9,它可以介导靶DNA序列中A/T至G/C的转变。可以充当本发明的方法和组合物中的定点修饰多肽的另一类工程化的Cas9核酸酶是识别广范围的PAM序列(包括NG、GAA、和GAT)的变体(Hu等人,2018,Nature[自然],doi:10.1038/nature26155)。
任何Cas9蛋白(包括那些天然存在的和/或从天然存在的Cas9蛋白突变或修饰的那些)可以用作本发明的方法和组合物中的定点修饰多肽。具有催化活性的Cas9核酸酶切割靶DNA,从而产生双链断裂。然后由细胞按以下两种方式之一修复这些断裂:非同源末端连接、和同源定向修复。
在非同源末端连接(NHEJ)中,通过断裂端彼此直接连接,修复双链断裂。如此,没有新核酸材料插入所述位点,尽管一些核酸材料可以失去,导致缺失。在同源定向修复中,将与切割的靶DNA序列同源的供体DNA分子用作模板,用于切割的靶DNA序列的修复,导致遗传信息从供体多核苷酸转移至靶DNA。如此,可以将新核酸材料插入/拷贝到所述位点。在一些情况下,使靶DNA与供体分子(例如供体DNA分子)接触。在一些情况下,将供体DNA分子引入细胞中。在一些情况下,供体DNA分子的至少一个区段整合到细胞的基因组中。
归因于NHEJ和/或同源定向修复对靶DNA进行修饰导致例如基因修正、基因置换、基因标记、转基因插入、核苷酸缺失、基因破坏、基因突变等。因此,在不存在外源提供的供体多核苷酸的情况下,通过切割靶DNA序列并且允许细胞修复该序列,由定点修饰多肽切割DNA可以用于从靶DNA序列缺失核酸材料(例如用来破坏使细胞易于感染的基因(例如CCR5或CXCR4基因,它们使T细胞易于被HIV感染),用于去除神经元中的致病三核苷酸重复序列,用于产生基因敲除和突变作为研究的疾病模型等)。因此,主题方法可以用于敲除基因(导致转录的完全缺乏或转录改变),或用于将遗传材料敲入靶DNA中的选择的基因座中。可替代地,如果用至少包括与靶DNA序列同源的区段的供体分子将DNA靶向RNA双链体和定点修饰多肽共同施用至细胞,则可以使用主题方法用于添加,即插入或置换核酸材料至靶DNA序列(例如用来“敲入”编码蛋白、siRNA、miRNA等的核酸),用于添加标记(例如6xHis、荧光蛋白(例如绿色荧光蛋白;黄色荧光蛋白等)、血球凝集素(HA)、FLAG等),用于添加调节序列至基因(例如启动子、聚腺苷酸化信号、内部核糖体进入序列(IRES)、2A肽、起始密码子、终止密码子、剪接信号、定位信号等),用于修饰核酸序列(例如引入突变)等。如此,包含DNA靶向RNA双链体和定点修饰多肽的复合物可用于任何体外或体内应用,在这些应用中,希望以位点特异性的,即“靶向的”方式修饰DNA,例如基因敲除、基因敲入、基因编辑、基因标记等,如用于例如基因疗法(例如用于治疗疾病),或者作为抗病毒、抗病原、或抗癌治疗剂,在农业中产生基因修饰生物体,由细胞大规模产生蛋白,用于治疗、诊断、或研究目的,诱导iPS细胞,生物研究,靶向病原体的基因用于缺失或置换等。
在一些实施例中,本发明的crRNA和/或tracrRNA包含一个或多个修饰,例如碱基修饰、主链修饰等,从而提供具有新的或增强的特征(例如改进的稳定性)的核酸。如本领域中已知的,核苷是碱基-糖组合。核苷的碱基部分正常是杂环碱基。两个最常见类别的此类杂环碱基是嘌呤和嘧啶。核苷酸是进一步包括与核苷的糖部分共价连接的磷酸基团的核苷。对于包括戊呋喃糖基糖的那些核苷而言,磷酸基团可以连接至该糖的2'、3'、或5'羟基部分。在形成寡核苷酸时,磷酸基团将邻近核苷彼此共价连接,从而形成直链高分子化合物。继而,直链高分子化合物的相应端可以进一步连接,从而形成环状化合物,然而,直链化合物通常是适合的。此外,直链化合物可以具有内部核苷酸碱基互补性,并且因此可以按某种方式折叠,从而产生完全的或部分的双链化合物。在寡核苷酸内,磷酸基团通常称为形成寡核苷酸的核苷间主链。RNA和DNA的正常键联或主链是3'至5'磷酸二酯键联。
含有修饰的适合的核酸的实例包括含有修饰的主链或非天然核苷间键联的核酸。具有修饰的主链的核酸包括在主链中保留了磷原子的那些,和在主链中并不具有磷原子的那些。本发明的crRNA或tracrRNA可以是核酸模拟物。如应用于多核苷酸,术语“模拟物”旨在包括多核苷酸,其中仅呋喃糖环或呋喃糖环和核苷酸间键联二者被非呋喃糖基团置换,仅呋喃糖环的置换在本领域也称为糖替代物。保持杂环碱基部分或修饰的碱基部分用于与适当靶核酸杂交。已被报道具有优异的杂交特性的一个多核苷酸模拟物是肽核酸(PNA)。PNA化合物中的主链是赋予PNA含酰胺主链的两个或更多个连接的氨基乙基甘氨酸单元。杂环碱基部分直接或间接结合主链的酰胺部分的氮杂氮原子。描述了PNA化合物的制备的代表性美国专利包括但不限于:美国专利号5,539,082、5,714,331和5,719,262。
本发明的crRNA或tracrRNA分子可以包括一个或多个取代的糖部分。本发明的crRNA或tracrRNA分子还包括核碱基(通常在本领域称为“碱基”)修饰或取代。本发明的crRNA或tracrRNA分子的另一种可能的修饰涉及将增强寡核苷酸的活性、细胞分布或细胞摄取的一个或多个部分或缀合物化学连接至多核苷酸。缀合物可以包括“蛋白转导结构域”或PTD(也称为CPP细胞穿透肽),它可以指促进穿过脂双层、微团、细胞膜、细胞器膜、或囊泡膜的多肽、多核苷酸、碳水化合物、或有机或无机化合物。
在本发明的一些实施例中,crRNA和tracrRNA是更长RNA分子(其是天然存在的、异源的RNA分子,包含两个或更多个tRNA切割序列)的组分、或区段。这些tRNA切割序列用于RNA核溶解活性,例如tRNA前体剪接、3’端mRNA前体内切核酸酶活性、tRNA前体切割活性、和/或核糖体RNA前体切割活性。当此RNA分子存在于细胞中时,天然tRNA加工系统在tRNA序列处切割RNA分子。然后此切割释放crRNA和tracrRNA分子到单个分子中,这些分子然后可以相互作用从而形成DNA靶向RNA双链体。在一些实施例中,更长的RNA包含crRNA和/或tracrRNA的多个拷贝。这些crRNA的多个拷贝可以含有相同的前间隔序列。在其他实施例中,更长的RNA分子含有不同crRNA分子的多个拷贝,这些分子含有不同DNA靶标的不同前间隔序列。不同DNA靶标可以是相同基因或不同基因的不同区域。在一些实施例中,多个crRNA分子可以含有不同前间隔序列,但是各自可以具有相同的相应tracrRNA。换句话说,每个crRNA的双链体形成区段是相同的,使得相应tracrRNA的双链体形成区段是相同的。在其他实施例中,更长的RNA分子可以含有crRNA和/或tracrRNA分子的不同变体,例如d9tracrRNA和d9+d11tracrRNA(如图1和实例中所述)。
tRNA切割序列包括主动与细胞的内源tRNA系统,例如核糖核酸酶P、核糖核酸酶Z和核糖核酸酶E(细菌)相互作用并且由其切割的任何序列和/或结构基序。这可以包括结构识别元件,例如接纳茎、D环臂、T Psi C环以及特定序列基序。存在本领域普通技术人员通过多个来源,例如万维网lowelab.ucsc.edu/tRNAscan-SE上可获得tRNA-SE程序,或万维网trna.bioinf.uni-leipzig.de/DataOutput/Organisms(对于所有生物体)、或万维网plantrna.ibmp.cnrs.fr/plantrna(对于植物),已知或可获得的众多tRNA活性序列和基序。众多文章和Genbank资源也是可获得的。
tRNA的一般特征是本领域普通技术人员熟知的。优选地,从能够折叠从而采用特征性“三叶草形”二级结构的单个核糖核苷酸分子来形成tRNA。此特征二级结构包含:(i)由以下构成的接纳茎:核糖核苷酸链的5'端的前7个核糖核苷酸,和核糖核苷酸链的3'端的最后4个核糖核苷酸之前的7个核糖核苷酸,由此形成包含6或7对的核糖核苷酸的双链结构,可能的是,由以下组成的核糖核苷酸并不是配对的:核糖核苷酸链的5'端的第一个核糖核苷酸,和核糖核苷酸链的3'端的最后4个核糖核苷酸之前的核糖核苷酸;ii)由4对核糖核苷酸组成的D臂和由8个核糖核苷酸组成的D环,是通过折叠核糖核苷酸链的5'端的前7个核糖核苷酸之后的一部分核糖核苷酸链形成的;(iii)由5对核糖核苷酸组成的反密码子的茎,和由7个核糖核苷酸组成的反密码子的环(反密码子的茎-环),是通过折叠D臂和D环之后的一部分核糖核苷酸链形成的;(iv)由从4至21个核糖核苷酸组成并且由反密码子的茎和反密码子的环之后的一部分核糖核苷酸链形成的可变环;(v)由5对核糖核苷酸组成的T臂,和由8个核糖核苷酸组成的T环,是通过折叠可变环之后和接纳茎的组成中涉及的核糖核苷酸链的3'端的核糖核苷酸之前的一部分核糖核苷酸链形成的。
在一些情况下,优选地,按从5'端朝向3'端的方向,核糖核苷酸链的5'端的前7个核糖核苷酸与D臂和D环之间存在2个核糖核苷酸,D臂和D环(一方面)与反密码子的茎和环(另一方面)之间存在1个核糖核苷酸,并且反密码子的茎和环(一方面)与可变环(另一方面)之间存在1个核糖核苷酸。仍优选地,并且根据本领域普通技术人员熟知并且由Sprinzl等人,1998,(Nucleic Acids Res.[核酸研究]26:148-153)定义的编号,tRNA包含17个核糖核苷酸,确保tRNA的三维结构并且由细胞酶识别,即:U.sub.8、A.sub.14、(A或G).sub.15、G.sub.18、G.sub.19、A.sub.21、G.sub.53、U.sub.54、U.sub.55、C.sub.56、(A或G).sub.57、A.sub.58、(C或U).sub.60、C.sub.61、C.sub.74、C.sub.75、A.sub.76。指示的核糖核苷酸对应于如在某些核糖核苷酸的任何转录后修饰之前由细胞机制转录的tRNA的序列。
特别地,以上定义的tRNA可以选自由以下组成的组:古细菌、细菌、病毒、原生动物、真菌、藻类、植物或动物tRNA。根据本发明可以使用的tRNA包括Sprinzl等人(1998)描述的所有tRNA或在万维网网址例如uni-bayreuth.de/departments/biochemie/tma/上可获得的那些。在本发明的上下文中,术语“tRNA”还包括通过修饰如以上定义的tRNA或如以上定义的tRNA的天然变体获得的结构,其前提是那些修饰的结构或那些变体保留了未修饰的tRNA的功能性,即尤其是与以下蛋白的相互作用:例如EF-Tu'因子(参见例如Rodnina等人(2005)FEBS.Lett.[四面体快报]579:938-942)或CCAse(参见例如Augustin等人(2003)J.Mol.Biol.[分子生物学杂志]328:985-994)。存在本领域普通技术人员例如通过多个来源,例如tRNA-SE程序或从万维网网址plantrna.ibmp.cnrs.fr/plantrna(对于植物)已知或可获得的众多tRNA活性序列和基序。
如本文使用的,短语“3'端mRNA前体内切核酸酶的底物”是指由3'端mRNA前体内切核酸酶识别并且切下的任何核苷酸序列。例如,包含具有切割位点上游的序列AACAAA和切割位点下游的富含G/U序列元件的六核苷酸的核苷酸序列可以用作3'端mRNA前体内切核酸酶的底物。由3'端mRNA前体内切核酸酶的底物识别并且切下的核苷酸序列可以包含10个核苷酸、15个核苷酸、20个核苷酸、25个核苷酸、25个核苷酸、30个核苷酸、40个核苷酸、45个核苷酸、50个核苷酸、55个核苷酸、60个核苷酸、65个核苷酸、75个核苷酸、100个核苷酸、125个核苷酸、150个核苷酸、或更多个核苷酸。
本发明提供了包含crRNA分子及其相应tracrRNA分子的DNA靶向RNA双链体,其中所述crRNA分子和tracrRNA分子分别包含以下核酸序列:SEQ ID NO:55和56、SEQ ID NO:57和58、SEQ ID NO:59和60、SEQ ID NO:61和62、SEQ ID NO:63和64、SEQ ID NO:65和66、SEQID NO:67和68、SEQ ID NO:69和70、SEQ ID NO:71和72、SEQ ID NO:73和74、SEQ ID NO:75和76、SEQ ID NO:77和78、SEQ ID NO:79和80、SEQ ID NO:81和82、或SEQ ID NO:83和84,其中所述crRNA进一步包含与靶DNA分子中的序列互补的核酸序列,由此所述DNA靶向RNA双链体靶向靶DNA序列并且与其杂交。将本发明的crRNA和相应tracrRNA分子工程化,意味着它们是通过人工产生的,不是天然存在的。
本发明的crRNA分子包含前间隔序列,它是本发明的crRNA分子的DNA靶向区段并且与靶DNA分子中的序列互补。如以上所述,所述前间隔序列可以是长度为至少12个核苷酸,与靶DNA分子的靶序列具有至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%互补性。本领域普通技术人员将理解,可以将前间隔序列工程化为大数量靶序列中的任一者。本领域普通技术人员将理解,crRNA的DNA靶向区段的序列并不影响crRNA的蛋白结合区段与其相应tracrRNA杂交的能力。尽管本发明的crRNA分子需要前间隔序列具有完全功能性,但是本发明并不限制该前间隔序列或其长度超过适当的靶向的CRISPR-Cas系统所已经需要的,如以上所述。
在其他实施例中,本发明提供了如所述的DNA靶向RNA双链体,其中crRNA分子及其相应tracrRNA分子的双链体形成区段分别包含以下核酸序列:SEQ ID NO:55和96、SEQ IDNO:57和97、SEQ ID NO:59和98、SEQ ID NO:61和99、SEQ ID NO:63和100、SEQ ID NO:65和101、SEQ ID NO:67和102、SEQ ID NO:69和103、SEQ ID NO:71和104、SEQ ID NO:73和105、SEQ ID NO:75和106、SEQ ID NO:77和107、SEQ ID NO:79和108、SEQ ID NO:81和109、或SEQID NO:83和110。
本发明还提供了核酸分子,其包含编码本发明的至少一个crRNA和/或至少一个tracrRNA的核酸序列。所述核酸分子可以编码多于一个crRNA分子,其中多个crRNA分子具有不同的前间隔序列。可替代地,所述核酸分子可以编码具有相同前间隔序列的多个crRNA分子。所述核酸分子还可以编码多个tracrRNA分子,或者它可以多次编码单个tracrRNA分子。所述核酸分子可以是DNA或RNA分子。在一些实施例中,所述核酸分子是环化的。在其他实施例中,所述核酸分子是直链的。在一些实施例中,所述核酸分子是单链的、部分双链的、或双链的。
在一些实施例中,核酸分子与至少一个多肽复合。所述多肽可以具有核酸识别结构域或核酸结合结构域。在一些实施例中,所述多肽是用于介导例如crRNA、tracrRNA、和/或DNA靶向RNA双链体、以及还有定点修饰多肽、以及任选地供体分子的递送的穿梭物(shuttle)。在一些实施例中,多肽穿梭物是Feldan穿梭物(美国专利公开号20160298078,通过引用并入本文)。
本发明的核酸分子可以包含能够驱动至少一种crRNA和/或至少一种tracrRNA的表达的表达盒。所述核酸分子可以进一步包含能够表达以下的另外的表达盒:例如核酸酶,例如CRISPR相关核酸酶,例如Cas9核酸酶、包含Cas9核酸酶的一部分的嵌合酶、或修饰的Cas9核酸酶,上文描述了它们中的全部。
本发明还提供了用于靶向诱变的工程化的、非天然存在的系统,所述系统包含本发明的DNA靶向RNA双链体和定点修饰多肽,其中所述DNA靶向RNA双链体包含crRNA分子及其相应tracrRNA分子的DNA靶向RNA双链体,其中所述crRNA分子和tracrRNA分子分别包含以下核酸序列:SEQ ID NO:55和56、SEQ ID NO:57和58、SEQ ID NO:59和60、SEQ ID NO:61和62、SEQ ID NO:63和64、SEQ ID NO:65和66、SEQ ID NO:67和68、SEQ ID NO:69和70、SEQID NO:71和72、SEQ ID NO:73和74、SEQ ID NO:75和76、SEQ ID NO:77和78、SEQ ID NO:79和80、SEQ ID NO:81和82、或SEQ ID NO:83和84,其中所述crRNA进一步包含与靶DNA分子中的序列互补的核酸序列,由此所述crRNA-tracrRNA双重引导复合物靶向靶DNA序列并且与其杂交,并且所述定点修饰多肽切割DNA分子。如以上所述,本发明的crRNA分子包含前间隔序列,其是本发明的crRNA分子的DNA靶向区段并且与靶DNA分子中的序列互补。如以上所述,所述前间隔序列可以是长度为至少12个核苷酸,与靶DNA分子的靶序列具有至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%互补性。
在一些实施例中,所述crRNA分子、其相应tracrRNA、和定点修饰多肽是在至少一个核酸分子内编码的,其中所述crRNA分子和tracrRNA分子由以下核酸序列编码,所述核酸序列分别包含SEQ ID NO:3和4、SEQ ID NO:5和6、SEQ ID NO:7和8、SEQ ID NO:9和10、SEQID NO:11和12、SEQ ID NO:13和14、SEQ ID NO:15和16、SEQ ID NO:17和18、SEQ ID NO:19和20、SEQ ID NO:21和22、SEQ ID NO:23和24、SEQ ID NO:28和29、SEQ ID NO:30和31、SEQID NO:32和33、或SEQ ID NO:34和35、或其互补序列,或者crRNA分子包含SEQ ID NO:36的核酸序列或其互补序列,其中所述crRNA进一步包含与靶DNA分子中的序列互补的核酸序列,由此所述crRNA-tracrRNA双重引导复合物靶向靶DNA序列并且与其杂交,并且所述定点修饰多肽切割DNA分子。如以上所述,所述前间隔序列可以是长度为至少12个核苷酸,与靶DNA分子的靶序列具有至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%互补性。
在一些实施例中,所述核酸分子包含至少一个表达盒,所述表达盒包含由RNA聚合酶II驱动的启动子。在另外的实施例中,所述由RNA聚合酶II驱动的启动子的核酸序列与SEQ ID NO:85具有至少90%同一性。在一些实施例中,所述核酸分子包含至少一个表达盒,所述表达盒包含由RNA聚合酶III驱动的启动子。在另外的实施例中,所述由RNA聚合酶III驱动的启动子的核酸序列与SEQ ID NO:86具有至少90%同一性。在一些实施例中,本发明的核酸分子包含至少两个表达盒,其中一个包含由RNA聚合酶II驱动的启动子,并且其中另一个包含由RNA聚合酶III驱动的启动子。在另外的实施例中,第一表达盒包含与SEQ IDNO:85具有至少90%同一性的启动子,并且第二表达盒包含与SEQ ID NO:86具有至少90%同一性的启动子。
在一些实施例中,以上描述的本发明的核酸分子包含两个或更多个表达盒,其中每个表达盒编码相同的crRNA和相应tracrRNA分子。在其他实施例中,以上描述的核酸分子包含两个或更多个表达盒,其中每个表达盒编码具有不同前间隔序列的本发明的crRNA分子。
在一些实施例中,所述核酸分子是载体。在另外的实施例中,所述核酸分子是能够转化(例如基因枪转化或农杆菌介导的转化)的载体。在一些实施例中,定点修饰多肽是在其上编码crRNA和tracrRNA分子的相同核酸分子上编码的。在其他实施例中,定点修饰多肽是在与编码crRNA和tracrRNA分子的核酸分子不同的核酸分子上编码的。在一些实施例中,所述crRNA和tracrRNA分子是在不同表达盒中编码的。在其他实施例中,所述crRNA和tracrRNA分子是在相同表达盒中编码的。
本发明还提供了包含至少一个crRNA区段和其相应tracrRNA区段中的至少一个的RNA分子,其中所述区段可操作地连接在tRNA切割序列的5’和/或3’端。在一些实施例中,所述RNA分子可以存在于能够进行tRNA切割的细胞中。在tRNA切割后,所述crRNA区段变成本发明的crRNA分子,并且所述tracrRNA区段变成本发明的tracrRNA分子,使得所述crRNA和tracrRNA分子是能够形成DNA靶向RNA双链体的分开的并且不同的分子。在一些实施例中,所述RNA分子包含处于串联排列的tRNA-crRNA-tRNA-tracrRNA。在一些实施例中,所得crRNA分子及其相应tracrRNA分子中的至少一个分别包含以下核酸序列:SEQ ID NO:55和56、SEQ ID NO:57和58、SEQ ID NO:59和60、SEQ ID NO:61和62、SEQ ID NO:63和64、SEQ IDNO:65和66、SEQ ID NO:67和68、SEQ ID NO:69和70、SEQ ID NO:71和72、SEQ ID NO:73和74、SEQ ID NO:75和76、SEQ ID NO:77和78、SEQ ID NO:79和80、SEQ ID NO:81和82、或SEQID NO:83和84,其中所述crRNA进一步包含与靶DNA序列中的序列互补的核酸序列。如上所述,本发明的crRNA分子包含前间隔序列,其是本发明的crRNA分子的DNA靶向区段并且与靶DNA分子中的序列互补。如以上所述,所述前间隔序列可以是长度为至少12个核苷酸,与靶DNA分子的靶序列具有至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%互补性。
在一些实施例中,以上描述的RNA分子(其包含至少一个crRNA、至少一个tracrRNA、和至少一个tRNA切割序列)含有与SEQ ID NO:112具有至少90%同一性的tRNA切割位点的核酸序列。
本发明还提供了包含表达所述RNA分子的至少一个表达盒的核酸分子,所述RNA分子包含以上描述的tRNA切割位点。所述核酸分子可以存在于能够进行tRNA切割的细胞中。在一些实施例中,本发明的crRNA分子、本发明的相应tracrRNA分子、和至少两个tRNA切割序列是在相同表达盒内编码的,由此在tRNA切割后,所述crRNA和tracrRNA分子是分开并且不同的分子。
在一些实施例中,表达包含至少一个tRNA切割位点的RNA分子的核酸分子包含至少一个表达盒,所述表达盒包含由RNA聚合酶II驱动的启动子。在另外的实施例中,所述由RNA聚合酶II驱动的启动子与SEQ ID NO:85具有至少90%同一性。在一些实施例中,所述核酸分子包含至少一个表达盒,所述表达盒包含由RNA聚合酶III驱动的启动子。在另外的实施例中,所述由RNA聚合酶III驱动的启动子与SEQ ID NO:86具有至少90%同一性。在一些实施例中,本发明的核酸分子包含至少两个表达盒,其中一个包含由RNA聚合酶II驱动的启动子,并且其中另一个包含由RNA聚合酶III驱动的启动子。在另外的实施例中,第一表达盒包含与SEQ ID NO:85具有至少90%同一性的启动子,并且第二表达盒包含与SEQ ID NO:86具有至少90%同一性的启动子。
在一些实施例中,以上直接描述的本发明的核酸分子包含两个或更多个表达盒,其中每个表达盒可以编码相同的crRNA和相应tracrRNA分子。在其他实施例中,以上描述的核酸分子包含两个或更多个表达盒,其中每个表达盒可以编码具有不同前间隔序列的本发明的crRNA分子。
在一些实施例中,以上直接描述的核酸分子是载体。在另外的实施例中,所述核酸分子是能够转化(例如基因枪转化或农杆菌介导的转化)的载体。在一些实施例中,定点修饰多肽是在其上编码crRNA和tracrRNA分子的相同核酸分子上编码的。在其他实施例中,定点修饰多肽是在与编码crRNA和tracrRNA分子的核酸分子不同的核酸分子上编码的。在一些实施例中,所述crRNA和tracrRNA分子是在多于一个表达盒上编码的。在其他实施例中,所述crRNA和tracrRNA分子是在相同表达盒中编码的。
在一些实施例中,以上直接描述的核酸分子包含至少一个表达盒,其中所述表达盒的核酸序列是SEQ ID NO:87-94中的任一者。SEQ ID NO:87-94内的20个N表示在表达盒内编码的crRNA分子的前间隔序列。如以上所述,所述前间隔序列可以是长度为至少12个核苷酸,与靶DNA分子的靶序列具有至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%互补性。
本发明还提供了靶DNA的位点特异性修饰的方法,所述方法包括使靶DNA与以下接触:(i)DNA靶向RNA双链体、或编码其的DNA分子,其中所述DNA靶向RNA双链体是如以上所述的本发明的DNA靶向RNA双链体,和(ii)定点修饰多肽、或编码其的DNA分子,其中所述定点修饰多肽包含与DNA靶向RNA相互作用的RNA结合部分、和展现出定点酶活性的活性部分。
在一些实施例中,所述方法的靶DNA是染色体外的。在另外的实施例中,在体外实践所述方法,其中所述靶DNA是染色体外的,例如DNA载体或质粒。在其他实施例中,所述靶DNA是在细胞内。在一些实施例中,所述细胞是真核细胞。在另外的实施例中,所述细胞是植物、藻类、或真菌的细胞。在一些实施例中,所述靶DNA是在附加体、线粒体或叶绿体中。在其他实施例中,所述靶DNA是染色体的一部分。在另外的实施例中,所述靶DNA是细胞中的染色体的一部分。
在一些实施例中,定点修饰的方法需要定点修饰多肽具有修饰靶DNA的酶活性。所述酶活性可以是核酸酶活性、甲基转移酶活性、脱甲基酶活性、DNA修复活性、DNA损伤活性、去氨基活性、歧化酶活性、烷基化活性、脱嘌呤活性、氧化活性、嘧啶二聚体形成活性、整合酶活性、转座酶活性、重组酶活性、聚合酶活性、连接酶活性、螺旋酶活性、光解酶活性或糖基化酶活性、或其任何组合。如前所述,定点修饰多肽可以是工程化的和/或嵌合的酶。
本发明的方法包括靶DNA的位点特异性修饰,其中DNA修饰酶活性是核酸酶活性。核酸酶可以在靶DNA中引入单链的或双链的断裂。DNA靶向RNA双链体和/或定点修饰多肽可以在容许非同源末端连接(NHEJ)或同源定向修复的条件下,与靶DNA接触。在一些实施例中,可以作为修复过程的结果,并且不是作为可以仅充当定点核酸酶的定点修饰多肽的酶活性的直接结果,修饰靶DNA。
本发明还提供了位点特异性修饰的方法,其中通过插入核酸序列来修饰靶位点。此序列是由供体分子提供的。在此方法中,靶DNA与以下接触:(i)DNA靶向RNA双链体、或编码其的DNA分子,其中DNA靶向RNA双链体是如以上所述的本发明的DNA靶向RNA双链体;(ii)定点修饰多肽、或编码其的DNA分子,其中所述定点修饰多肽包含与DNA靶向RNA相互作用的RNA结合部分、和展现出定点酶活性的活性部分;和(iii)供体多核苷酸,其中所述供体多核苷酸、所述供体多核苷酸的一部分、或所述供体多核苷酸的拷贝、或所述供体多核苷酸的拷贝的一部分整合到靶DNA中。
在一些实施例中,本发明的方法的定点修饰多肽是CRISPR相关核酸酶。在另外的实施例中,所述定点修饰多肽是任选地修饰的Cas9核酸酶。修饰的Cas9核酸酶可以是嵌合的,可以具有改变的酶活性,和/或可以不具有核酸酶活性,如以上所述。修饰的Cas9(其中核酸酶活性被灭活)可以称为dCas9。
本发明的方法是靶DNA的定点修饰的方法。在一些实施例中,修饰是靶向至基因组内的基因的修饰的基因序列的插入,这也称为等位基因置换。不受理论的束缚,修饰的基因序列是与靶向的基因组位点高度同源的,使得可以通过经由RNA介导的靶向基因组切割后的同源依赖性修复的同源重组,修饰的基因序列可以置换靶向基因组位点的核苷酸的至少一部分。等位基因置换并不引入外源基因序列。等位基因置换典型地涉及至少一个核苷酸的精确置换,从而修饰基因功能,例如酶活性或调节功能。在一些实施例中,等位基因置换可以用于置换基因的编码区的少数核苷酸,从而产生含有一个或少数几个氨基酸改变的新功能性蛋白或酶变体。例如,通过使用CRISPR-Cas9介导的基因组编辑,改变2个氨基酸(T178I和P182A突变),草甘膦敏感的EPSPS基因等位基因可以转化为草甘膦耐受的变体(Sauer NJ等人,2016,Plant Physiol.[植物生理学]DOI:10.1104/pp.15.01696)。与背景同源重组频率相比,即使使用定点核酸酶来将其频率增加高达数千倍,典型地,在作物植物中,等位基因置换频率也是相当低的,因此使得其在作物改进中的应用是有限的。
在本发明的方法的一些实施例中,编码抗沉默蛋白的核酸分子、或抗沉默蛋白自身也被引入包含靶DNA的细胞中。在一些实施例中,抗沉默蛋白是病毒沉默抑制子(VSR),或源自病毒沉默抑制子。在另外的实施例中,抗沉默蛋白是源自植物病毒的VSR。在另外的实施例中,抗沉默蛋白是病毒沉默抑制子p19蛋白,源自番茄丛矮病毒(Tombus virus),例如CymRSV、CIRV、或TBSV。Zhu等人最近表示,与引导RNA和Cas9核酸酶共表达的源自番茄茂密矮小病毒(Tomato Bushy Stunt Virus)的p19 VSR改进了植物中的基因靶向效率和/或引导RNA稳定性(美国专利公开号2016/0264982)。在一些实施例中,VSR选自植物病毒蛋白的组,包括HC-Pro、p14、p38、NSs、NS3、CaMV P6、PNS10、P122、2b、Potex p25、ToRSV CP、P0、和SPMMV P1(参见Csorba等人,2015,Virology[病毒学]479-480第85-103页,通过引用并入本文)。
在本发明的方法的一些实施例中,包含靶DNA的细胞是单子叶植物细胞。在另外的实施例中,植物细胞是玉蜀黍、水稻、高粱、甘蔗、大麦、小麦、燕麦、草皮草、或观赏草细胞。在其他实施例中,细胞是双子叶植物细胞。在另外的实施例中,植物细胞是烟草、番茄、胡椒、茄子、向日葵、十字花科植物、亚麻、马铃薯、棉花、大豆、甜菜、或油菜细胞。在一些实施例中,细胞是松柏科细胞。
在本发明的方法的一些实施例中,将编码DNA靶向RNA双链体和/或定点修饰多肽的DNA分子引入或递送到包含靶DNA的细胞中。在一些实施例中,所述DNA靶向RNA双链体和定点修饰多肽是在相同DNA分子上编码的。在其他实施例中,它们是在分开的DNA分子上编码的。在另外的实施例中,通过基因枪轰击、农杆菌介导的转化、或本领域已知的任何其他方法将一个或多个DNA分子引入细胞中。在一些实施例中,所述DNA分子是瞬时表达的,并且并未并入细胞的基因组中。在一些实施例中,所述DNA分子是稳定转化的,并且并入细胞的基因组中。
本发明还提供了包含靶DNA的位点特异性修饰的产生植物、植物部分或其子代的方法,所述方法包括从其DNA已经通过以上描述的任何本发明的方法修饰的植物细胞再生植物。本发明进一步提供了植物、植物部分或其子代,包含对通过这些方法产生的其DNA进行修饰。
现在将参考以下实例描述本发明。应了解,这些实例并不旨在将权利要求书的范围限于本发明,而是旨在成为某些实施例的示例。可以由熟练的技术人员想到的示例性方法的任何变体都旨在落入本发明的范围内。
实例
实例1:通过crRNA和tracrRNA的突变改进的基因组编辑效率
此实例描述了crRNA和/或tracrRNA的突变,从而改进基因组编辑效率。这些突变通常落入四个区域中。第一突变靶向RNA聚合酶III暂停信号。这些突变通常靶向双重引导RNA复合物的两个区域。这些区域中的两个包含RNA中的“UUUU”基序。DNA模板中的T的连续序列是RNA聚合酶III的暂停信号。第一poly-U基序位于crRNA的前间隔序列的下游。进行点突变来破坏此暂停信号。如图1中所示,产生突变体d2至d7,从而确定破坏此第一基序将如何影响基因组编辑效率。“d1”是如图1中所示的没有针对前间隔序列的指定序列(SEQ IDNO:113)及其相应tracrRNA(SEQ ID NO:114)的crRNA的序列。突变d2至d7含有crRNA分子中的突变和tracrRNA分子中的相应突变二者,使得crRNA和tracrRNA分子仍然在突变的残基处碱基配对。例如,d2是d2突变体的crRNA/tracrRNA中的U/A至crRNA/tracrRNA中的G/C的突变。d11突变体靶向位于crRNA的3’端和tracrRNA的5’端处的第二UUUU基序。这些突变在图1中说明并且被提供为SEQ ID NO:57至68。
用于诱变的第二区域集中于通过点突变,并且也通过插入另外的RNA元件,优化crRNA-tracrRNA双链体结构。为了测试延长或缩短双链体中的碱基对的数量以增加RNA:RNA相互作用是否改进了诱变效率,产生了d8突变体。d8突变包含添加至crRNA的3'端的“AAUGGUUCC”基序,从而提供与天然tracrRNA(SEQ ID NO:69)的互补碱基配对。可替代地,d9突变体含有tracrRNA分子的5’端中的8核苷酸序列“GAACCAUU”,从而消除tracrRNA的5’突出端(SEQ ID NO:72)。在突变体d10中,BYDV(大麦黄矮病毒)3'-UTR的30个核苷酸被引入到crRNA(SEQ ID NO:73)的3’端处,并且BYDV 5'-UTR的37个核苷酸被引入到tracrRNA(SEQID NO:74)的5’端处。这些来自BYDV的序列含有编码由植物宿主因子识别的BYDV翻译元件的RNA-RNA环相互作用结构,并且向DNA靶向RNA双链体提供另外的RNA:RNA元件。所有这些突变都在图1中说明。
用于诱变的第三区域集中于双重引导RNA的转录物加工。有报道表示,将tRNA引入设计用来靶向多个位点的单引导RNA是允许在细胞中加工RNA的有效方式(Xie等人,2015,PNAS 112(11):3570-3575;Qi等人,2016,BMC Biotechnology[BMC生物技术],DOI10.1186/s12896-016-0289-2)。然而,尚未证明tRNA具有增加双重引导RNA系统的效率的能力。产生了构建体23999,其含有表达盒(SEQ ID NO:25),所述表达盒包含在其3’端可操作地连接至tRNA的PolIII启动子(即prOsU3),所述tRNA在其3’端可操作地连接至crRNA,所述crRNA在其3’端可操作地连接至第二tRNA,所述第二tRNA在其3’端可操作地连接至tracrRNA,所述tracrRNA在其3’端可操作地连接至polyT。这产生了具有处于串联排列的tRNA-crRNA-tRNA-tracrRNA的RNA分子。还产生了构建体24000,其含有表达盒,所述表达盒包含与构建体23999中相同的元件,但是tracrRNA在crRNA的上游。换句话说,构建体24000含有表达盒(SEQ ID NO:26),所述表达盒包含在其3’端可操作地连接至tRNA的prOsU3启动子,所述tRNA在其3’端可操作地连接至tracrRNA,所述tracrRNA在其3’端可操作地连接至tRNA,所述tRNA在其3’端可操作地连接至crRNA,所述crRNA在其3’端可操作地连接至polyT。这产生了具有处于串联排列的tRNA-tracrRNA-tRNA-crRNA的RNA分子。
实例2:水稻的靶向诱变
为了测试以上描述的双重引导构建体的基因组编辑效率,在水稻(rice或Oryzasativa)的基因组中鉴定靶标。靶基因是DENSE AND ERECT PANICLE 1(DEP1)。粳稻dep1突变体含有接近DEP1的3’端的625bp缺失。突变体具有密集并且竖起的穗,与野生型相比,具有更高谷物数量和更低植物高度(Huang等人,2009,Nat Genet[自然遗传学]41:494-497)。籼稻具有DEP1基因的野生型拷贝。对于本文描述的实例,DEP1被靶向用于突变,并且本文描述的所有crRNA构建体均含有5’-ACTGCAGTGCGTGCTGCGC-3’(SEQ ID NO:45),其编码本文描述的crRNA分子的前间隔序列。本领域普通技术人员将理解,本发明并不受限于前间隔序列或其相应DNA靶标的序列,并且crRNA和tracrRNA分子的突变,以及产生它们的表达盒可以适合用于任何前间隔序列。
本文描述的所有二元载体均包含用来表达Cas9内切核酸酶的表达盒(WO16106121,通过引用以其全文并入本文),和用来表达用于转化的选择性标记的第二表达盒。PMI基因(也称为manA基因)(编码选择性标记磷酸甘露糖异构酶,并且提供了代谢甘露糖的能力(美国专利号5,767,378和5,994,629,通过引用并入本文))被用作用于转基因水稻植物的转化和再生的选择性标记。对于除了23999和24000以外的所有二元载体,每个二元载体进一步包含产生crRNA的野生型或d1-d11突变体的表达盒,和产生相应tracrRNA分子的野生型或d1-d11突变体的另外的表达盒。对于23999和24000,单个表达盒产生包含tRNA、crRNA、和tracrRNA的RNA分子,如以上所述。作为对照,还测试了包含用来产生野生型crRNA和tracrRNA分子的表达盒的二元载体(构建体23844),和包含产生单引导RNA分子的表达盒的二元载体(构建体23127)。每个二元载体中的所有表达盒都是单个转基因的一部分。
将水稻(rice或Oryza sativa)近交系IR58025B用于基本上按照用于转化、选择、和再生的方案,进行农杆菌介导的转化实验,如在以下文献中所述:Gui等人2014(PlantCell Rep[植物细胞报道]33:1081-1090,通过引用并入本文)。转基因水稻品系在具有16h光照/30℃和8h黑暗/22℃的温室中生长。
对来自T0转基因事件的叶组织取样,并且用于基因组DNA提取,随后进行TaqMan分析。TaqMan分析基本如Ingham等人描述的(Biotechniques[生物技术]31(1):132-4,136-40,2001)来进行,通过引用并入本文。进行TaqMan来检测以下的存在:PMI基因(SEQ ID NO:46-47是引物;SEQ ID NO:48是探针)、Cas9基因(SEQ ID NO:49-50是引物;SEQ ID NO:51是探针)、和DEP1中的靶向突变(SEQ ID NO:52-53是引物;SEQ ID NO:54是探针)。为了检测DEP1中的突变,使正向引物(SEQ ID NO:52)和反向引物(SEQ ID NO:53)插入前间隔序列靶序列(SEQ ID NO:45)侧翼,并且使探针(SEQ ID NO:54)与包括Cas9切割位点和PAM的前间隔序列区域杂交。如果突变(典型地是indel)引入到Cas9切割位点,则探针将不结合靶序列,并且因此不产生荧光。基于DEP1的TaqMan分析,计算突变率。
表1说明了通过本发明的DNA靶向RNA双链体进行的靶向诱变。SEQ ID NO是编码突变的crRNA(不包括前间隔序列)和相应tracrRNA分子的DNA序列,或是编码构建体23999和24000的RNA分子的表达盒。“外植体的编号”是最初转化的水稻外植体的编号,并且“转化株的编号”是成功转化的外植体的编号。突变率是含有在DEP1处的靶向突变的转化株的百分比,如通过以上描述的TaqMan测定确定的。“突变体的拷贝编号”指示在DEP1基因中成功突变的转化株中的转基因插入的编号。“低拷贝”表明了单个插入。“两个拷贝”表明了2个插入,并且高拷贝表明了多于两个插入。
表1:水稻转基因事件中的DNA靶向RNA双链体效率和拷贝数分布
如表1中可见,crRNA/tracrRNA双链体的一些突变出人意料地导致突变率若干倍优于野生型crRNA/tracrRNA双链体。特别地,与野生型crRNA/tracrRNA双链体相比,由23999和24000构建体产生的d9和d11突变、以及RNA分子,给出了更高的突变率。
实例3:双重引导RNA分子的进一步优化
产生了另外的突变的构建体,从而确定是否可以通过crRNA和/或tracrRNA的诱变,特别是在其中它们相互作用从而形成双链体的区域中,或通过插入另外的RNA元件,进一步优化DNA靶向RNA双链体结构。基于表1中所示结果,构建许多这些构建体。
构建体24127编码含有d11突变的crRNA分子(SEQ ID NO:28),和含有以上和图1中描述的d9 5’端缺失突变和d11突变二者的tracrRNA分子(SEQ ID NO 29)。构建体24128还编码具有d9缺失突变的tracrRNA。此外,构建体24128的crRNA和tracrRNA已经突变,从而在crRNA的3’端处(参见SEQ ID NO:30)和tracr RNA的5’端处(参见SEQ ID NO:31)增加双链体的10个核苷酸中的GC含量。
构建体24141包含具有以上和图1中描述的d9 5’端缺失突变的tracrRNA。此外,30个核苷酸长的回文结构已经引入到crRNA的3’端处(参见SEQ ID NO:32),和tracrRNA的5’端处(参见SEQ ID NO:33),从而将crRNA/tracrRNA双链体延长30个核苷酸。构建体24129包括24141的突变,但是4个核苷酸长的基序(参见针对crRNA的SEQ ID NO:34和tracrRNA的SEQ ID NO:35)插入到回文结构内,从而产生回文内的crRNA/tracrRNA双链体结构中的环。
类似于构建体24127,构建体24154编码含有d11突变的crRNA分子,和含有d9 5’端缺失突变和d11突变二者的tracrRNA分子。构建体24154进一步包含小麦矮缩病毒DNA复制子,使得从WDV DNA复制子(SEQ ID NO:36)表达crRNA和tracrRNA。构建体24154还包含用于RepA,WDV复制酶的表达盒。由WDV复制酶产生编码crRNA和tracrRNA的另外的DNA分子,可以增加细胞中的crRNA和tracrRNA分子,由此增加诱变效率(Wang等人,2017,MolecularPlant[分子植物]10:1007-1010;Baltes等人,2014,Plant Cell[植物细胞]26:151-163)。
用于诱变的第四区域集中于增加靶细胞中存在的双重引导RNA分子的水平。已知RNA聚合酶II涉及mRNA的转录,并且已知RNA聚合酶III涉及非编码RNA(包括tRNA和其他小RNA分子)的转录。为了确定通过不同RNA聚合酶的转录是否可以增加双重引导RNA/CRISPR系统中的基因组编辑效率,使用RNA PolII启动子,而不是RNA PolIII启动子。这些构建体还具有两个拷贝,crRNA和tracrRNA中各一个,也用来增加细胞中存在的crRNA和tracrRNA分子的数量。
构建体24140含有表达盒,所述表达盒包含在其3’端可操作地连接至tRNA的prOsU3启动子,前述tRNA在其3’端可操作地连接至tracrRNA,前述tracrRNA在其3’端可操作地连接至tRNA,前述tRNA在其3’端可操作地连接至crRNA,前述crRNA在其3’端可操作地连接至tracrRNA的第二拷贝,前述tracrRNA的第二拷贝在其3’端可操作地连接至tRNA,前述tRNA在其3’端可操作地连接至crRNA的第二拷贝,前述crRNA的第二拷贝在其3’端可操作地连接至poly-T(SEQ ID NO:37)。构建体24155含有表达盒,所述表达盒包含在其3’端可操作地连接至tRNA的prOsU3启动子,前述tRNA在其3’端可操作地连接至d9 tracrRNA,前述d9tracrRNA在其3’端可操作地连接至tRNA,前述tRNA在其3’端可操作地连接至d9 crRNA,前述d9 crRNA在其3’端可操作地连接至d9 tracrRNA的第二拷贝,前述d9 tracrRNA的第二拷贝在其3’端可操作地连接至tRNA,前述tRNA在其3’端可操作地连接至d9 crRNA的第二拷贝,前述d9crRNA的第二拷贝在其3’端可操作地连接至poly-T(SEQ ID NO:38)。构建体24155不同于构建体24140,因为构建体24155含有具有“d9”突变的双重引导RNA分子,而构建体24140含有野生型双重引导RNA分子。
构建体24164含有表达盒,所述表达盒包含在其3’端可操作地连接至tRNA的prSoUbi4启动子(它是RNA聚合酶II依赖性启动子),前述tRNA在其3’端可操作地连接至d9tracrRNA,前述d9 tracrRNA在其3’端可操作地连接至tRNA,前述tRNA在其3’端可操作地连接至d9 crRNA,前述d9 crRNA在其3’端可操作地连接至d9 tracrRNA的第二拷贝,前述d9tracrRNA的第二拷贝在其3’端可操作地连接至tRNA,前述tRNA在其3’端可操作地连接至d9crRNA的第二拷贝,前述d9 crRNA的第二拷贝在其3’端可操作地连接至poly-T(SEQ ID NO:40)。
构建体24165含有用于表达crRNA和tracrRNA分子的两个表达盒,其中突变所述crRNA和tracrRNA分子,使其含有d9突变。第一表达盒包含在其3’端可操作地连接至tRNA的prOsU3启动子,前述tRNA在其3’端可操作地连接至d9 tracrRNA,前述d9 tracrRNA在其3’端可操作地连接至tRNA,前述tRNA在其3’端可操作地连接至d9 crRNA,前述d9 crRNA在其3’端可操作地连接至d9 tracrRNA的第二拷贝,前述d9 tracrRNA的第二拷贝在其3’端可操作地连接至tRNA,前述tRNA在其3’端可操作地连接至d9 crRNA的第二拷贝,前述d9 crRNA的第二拷贝在其3’端可操作地连接至poly-T(SEQ ID NO:41)。第二表达盒包含在其3’端可操作地连接至tRNA的prSoUbi4启动子,前述tRNA在其3’端可操作地连接至d9 tracrRNA,前述d9tracrRNA在其3’端可操作地连接至tRNA,前述tRNA在其3’端可操作地连接至d9crRNA,前述d9 crRNA在其3’端可操作地连接至d9tracrRNA的第二拷贝,前述d9 tracrRNA的第二拷贝在其3’端可操作地连接至tRNA,前述tRNA在其3’端可操作地连接至d9 crRNA的第二拷贝,前述d9 crRNA的第二拷贝在其3’端可操作地连接至poly-T(SEQ ID NO:42)。
构建体24169还含有用于表达crRNA和tracrRNA分子的两个表达盒,然而可以突变所述crRNA和tracrRNA分子,使其含有d9和d11突变二者。第一表达盒包含在其3’端可操作地连接至tRNA的prOsU3启动子,前述tRNA在其3’端可操作地连接至d9+d11tracrRNA,前述d9+d11 tracrRNA在其3’端可操作地连接至tRNA,前述tRNA在其3’端可操作地连接至d9+d11 crRNA,前述d9+d11crRNA在其3’端可操作地连接至d9+d11 tracrRNA的第二拷贝,前述d9+d11 tracrRNA的第二拷贝在其3’端可操作地连接至tRNA,前述tRNA在其3’端可操作地连接至d9+d11 crRNA的第二拷贝,前述d9+d11 crRNA的第二拷贝在其3’端可操作地连接至poly-T(SEQ ID NO:43)。第二表达盒包含在其3’端可操作地连接至tRNA的prSoUbi4启动子,前述tRNA在其3’端可操作地连接至d9+d11 tracrRNA,前述d9+d11 tracrRNA在其3’端可操作地连接至tRNA,前述tRNA在其3’端可操作地连接至d9+d11 crRNA,前述d9+d11crRNA在其3’端可操作地连接至d9+d11 tracrRNA的第二拷贝,前述d9+d11 tracrRNA的第二拷贝在其3’端可操作地连接至tRNA,前述tRNA在其3’端可操作地连接至d9+d11 crRNA的第二拷贝,前述d9+d11crRNA的第二拷贝在其3’端可操作地连接至poly-T(SEQ ID NO:44)。
重要的是要注意,以上描述的构建体合并了在表1中经验显示改进了crRNA/tracrRNA双链体(也称为DNA靶向RNA双链体)的诱变效率的突变和结构。不能预测这些构建体中任一个的成功。仅可以经验上确定最佳序列/构建体。
实例4:水稻的靶向诱变
为了测试实例3中描述的构建体,crRNA构建体靶向DEP1,如实例2中所述。此实例中的描述的二元构建体类似于实例2中描述的那些,并且包括PMI基因和编码Cas9内切核酸酶的基因。如实例2中所述,进行水稻品种IR58025B的转化和转化株的TaqMan分析。
表2说明了通过本发明的DNA靶向RNA双链体进行的靶向诱变。对于构建体24127、24128、24141、和24129而言,SEQ ID NO是编码突变的crRNA(不包括前间隔序列)和相应tracrRNA分子的DNA序列。对于构建体24154,SEQ ID NO:36是包含crRNA的d11突变体和tracrRNA的d9+d11突变体的WDV DNA复制子的DNA序列。对于构建体24140、24155、24164、24165、和24169而言,SEQ ID NO.是一个或多个表达盒(包括启动子)的DNA序列。“外植体的编号”是最初转化的水稻外植体的编号,并且“转化株的编号”是成功转化的外植体的编号。突变率是含有在DEP1处的靶向突变的转化株的百分比,如通过以上描述的TaqMan测定确定的。“突变体的拷贝编号”指示在DEP1基因中成功突变的转化株中的转基因插入的编号。“低拷贝”表明了单个插入。“两个拷贝”表明了2个插入,并且高拷贝表明了多于两个插入。
表2:水稻转基因事件中的DNA靶向RNA双链体效率和拷贝数分布
如表2中所示,这些构建体中的许多的突变率是相当高的。产生包含两个突变d9和d11的crRNA/tracrRNA分子的构建体(24127和24169)表现非常好。有趣的是,使用构建体24169获得的突变率超过了使用构建体24165获得的突变率的150%,尽管它们的不同之处仅在于,构建体241696中存在两个突变d9和d11(构建体24165仅包含d9突变)。d11突变分别将crRNA和相应tracrRNA的蛋白结合RNA双链体区中的UU/AA改变为GG/CC。令人惊讶并且出乎意料的是,这样一个突变(其引入了对两个碱基配对的更强结合,但是并不改变crRNA和tracrRNA之间的碱基配对的总数)可以增加双重引导RNA突变效率。
本领域普通技术人员将理解,本文描述的实例可以延伸至任何基因组靶标/前间隔序列,因为对于crRNA/tracrRNA双链体形成(Jinek等人,2012)、通过RNA聚合酶II或RNA聚合酶III的转录、或tRNA加工而言,前间隔序列不是至关重要的。
虽然为了清楚理解的目的已经通过说明和举例的方式在一定详细程度上描述了以上发明,显然的是在本发明的范围内可以进行某些改变和变更。
序列表
<110> SYNGENTA PARTICIPATIONS AG
SYNGENTA BIOTECHNOLOGY CHINA CO., LTD.
Li, Jiang
Geng, Lizhao
Xu, Jianping
Li, Shon
<120> 用于多核苷酸的靶向编辑的方法和组合物
<130> 81555-WO-REG-ORG-P-1
<160> 114
<170> PatentIn version 3.5
<210> 1
<211> 45
<212> DNA
<213> 人工序列
<220>
<223> 酿脓链球菌
<400> 1
gttttagagc tatgctgttt tgaatggtcc caaaactttt ttttt 45
<210> 2
<211> 88
<212> DNA
<213> 人工序列
<220>
<223> 酿脓链球菌
<400> 2
ggaaccattc aaaacagcat agcaagttaa aataaggcta gtccgttatc aacttgaaaa 60
agtggcaccg agtcggtgct tttttttt 88
<210> 3
<211> 31
<212> DNA
<213> 人工序列
<220>
<223> 酿脓链球菌
<400> 3
gttttagagc tatgctgttt tgtttttttt t 31
<210> 4
<211> 88
<212> DNA
<213> 人工序列
<220>
<223> 酿脓链球菌
<400> 4
ggaaccattc aaaacagcat agcaagttaa aataaggcta gtccgttatc aacttgaaaa 60
agtggcaccg agtcggtgct tttttttt 88
<210> 5
<211> 31
<212> DNA
<213> 人工序列
<220>
<223> 酿脓链球菌
<400> 5
ggtttagagc tatgctgttt tgtttttttt t 31
<210> 6
<211> 88
<212> DNA
<213> 人工序列
<220>
<223> 酿脓链球菌
<400> 6
ggaaccattc aaaacagcat agcaagttaa actaaggcta gtccgttatc aacttgaaaa 60
agtggcaccg agtcggtgct tttttttt 88
<210> 7
<211> 31
<212> DNA
<213> 人工序列
<220>
<223> 酿脓链球菌
<400> 7
gtgttagagc tatgctgttt tgtttttttt t 31
<210> 8
<211> 88
<212> DNA
<213> 人工序列
<220>
<223> 酿脓链球菌
<400> 8
ggaaccattc aaaacagcat agcaagttaa cataaggcta gtccgttatc aacttgaaaa 60
agtggcaccg agtcggtgct tttttttt 88
<210> 9
<211> 31
<212> DNA
<213> 人工序列
<220>
<223> 酿脓链球菌
<400> 9
gttgtagagc tatgctgttt tgtttttttt t 31
<210> 10
<211> 88
<212> DNA
<213> 人工序列
<220>
<223> 酿脓链球菌
<400> 10
ggaaccattc aaaacagcat agcaagttac aataaggcta gtccgttatc aacttgaaaa 60
agtggcaccg agtcggtgct tttttttt 88
<210> 11
<211> 31
<212> DNA
<213> 人工序列
<220>
<223> 酿脓链球菌
<400> 11
gtttgagagc tatgctgttt tgtttttttt t 31
<210> 12
<211> 88
<212> DNA
<213> 人工序列
<220>
<223> 酿脓链球菌
<400> 12
ggaaccattc aaaacagcat agcaagttca aataaggcta gtccgttatc aacttgaaaa 60
agtggcaccg agtcggtgct tttttttt 88
<210> 13
<211> 31
<212> DNA
<213> 人工序列
<220>
<223> 酿脓链球菌
<400> 13
gtttaagagc tatgctgttt tgtttttttt t 31
<210> 14
<211> 88
<212> DNA
<213> 人工序列
<220>
<223> 酿脓链球菌
<400> 14
ggaaccattc aaaacagcat agcaagttta aataaggcta gtccgttatc aacttgaaaa 60
agtggcaccg agtcggtgct tttttttt 88
<210> 15
<211> 31
<212> DNA
<213> 人工序列
<220>
<223> 酿脓链球菌
<400> 15
gtttcagagc tatgctgttt tgtttttttt t 31
<210> 16
<211> 88
<212> DNA
<213> 人工序列
<220>
<223> 酿脓链球菌
<400> 16
ggaaccattc aaaacagcat agcaagttga aataaggcta gtccgttatc aacttgaaaa 60
agtggcaccg agtcggtgct tttttttt 88
<210> 17
<211> 40
<212> DNA
<213> 人工序列
<220>
<223> 酿脓链球菌
<400> 17
gttttagagc tatgctgttt tgaatggttc cttttttttt 40
<210> 18
<211> 88
<212> DNA
<213> 人工序列
<220>
<223> 酿脓链球菌
<400> 18
ggaaccattc aaaacagcat agcaagttaa aataaggcta gtccgttatc aacttgaaaa 60
agtggcaccg agtcggtgct tttttttt 88
<210> 19
<211> 31
<212> DNA
<213> 人工序列
<220>
<223> 酿脓链球菌
<400> 19
gttttagagc tatgctgttt tgtttttttt t 31
<210> 20
<211> 80
<212> DNA
<213> 人工序列
<220>
<223> 酿脓链球菌
<400> 20
gcaaaacagc atagcaagtt aaaataaggc tagtccgtta tcaacttgaa aaagtggcac 60
cgagtcggtg cttttttttt 80
<210> 21
<211> 61
<212> DNA
<213> 人工序列
<220>
<223> 酿脓链球菌
<400> 21
gttttagagc tatgctgttt tgagctcggg taggctgtca acctaccgcc gttttttttt 60
t 61
<210> 22
<211> 126
<212> DNA
<213> 人工序列
<220>
<223> 酿脓链球菌
<400> 22
gcggtcccct tattgcctga caagctgagg gccaccctgg aaccattcaa aacagcatag 60
caagttaaaa taaggctagt ccgttatcaa cttgaaaaag tggcaccgag tcggtgcttt 120
tttttt 126
<210> 23
<211> 31
<212> DNA
<213> 人工序列
<220>
<223> 酿脓链球菌
<400> 23
gttttagagc tatgctgtgg tgtttttttt t 31
<210> 24
<211> 88
<212> DNA
<213> 人工序列
<220>
<223> 酿脓链球菌
<400> 24
ggaaccattc accacagcat agcaagttaa aataaggcta gtccgttatc aacttgaaaa 60
agtggcaccg agtcggtgct tttttttt 88
<210> 25
<211> 663
<212> DNA
<213> 人工序列
<220>
<223> 酿脓链球菌, 水稻
<400> 25
aaggaatctt taaacatacg aacagatcac ttaaagttct tctgaagcaa cttaaagtta 60
tcaggcatgc atggatcttg gaggaatcag atgtgcagtc agggaccata gcacaagaca 120
ggcgtcttct actggtgcta ccagcaaatg ctggaagccg ggaacactgg gtacgttgga 180
aaccacgtga tgtgaagaag taagataaac tgtaggagaa aagcatttcg tagtgggcca 240
tgaagccttt caggacatgt attgcagtat gggccggccc attacgcaat tggacgacaa 300
caaagactag tattagtacc acctcggcta tccacataga tcaaagctga tttaaaagag 360
ttgtgcagat gatccgtggc aacaaagcac cagtggtcta gtggtagaat agtaccctgc 420
cacggtacag acccgggttc gattcccggc tggtgcaact gcagtgcgtg ctgcgcgttt 480
tagagctatg ctgttttgaa caaagcacca gtggtctagt ggtagaatag taccctgcca 540
cggtacagac ccgggttcga ttcccggctg gtgcaggaac cattcaaaac agcatagcaa 600
gttaaaataa ggctagtccg ttatcaactt gaaaaagtgg caccgagtcg gtgctttttt 660
ttt 663
<210> 26
<211> 660
<212> DNA
<213> 人工序列
<220>
<223> 酿脓链球菌, 水稻
<400> 26
aaggaatctt taaacatacg aacagatcac ttaaagttct tctgaagcaa cttaaagtta 60
tcaggcatgc atggatcttg gaggaatcag atgtgcagtc agggaccata gcacaagaca 120
ggcgtcttct actggtgcta ccagcaaatg ctggaagccg ggaacactgg gtacgttgga 180
aaccacgtga tgtgaagaag taagataaac tgtaggagaa aagcatttcg tagtgggcca 240
tgaagccttt caggacatgt attgcagtat gggccggccc attacgcaat tggacgacaa 300
caaagactag tattagtacc acctcggcta tccacataga tcaaagctga tttaaaagag 360
ttgtgcagat gatccgtggc aacaaagcac cagtggtcta gtggtagaat agtaccctgc 420
cacggtacag acccgggttc gattcccggc tggtgcagga accattcaaa acagcatagc 480
aagttaaaat aaggctagtc cgttatcaac ttgaaaaagt ggcaccgagt cggtgcttaa 540
caaagcacca gtggtctagt ggtagaatag taccctgcca cggtacagac ccgggttcga 600
ttcccggctg gtgcaactgc agtgcgtgct gcgcgtttta gagctatgct gttttttttt 660
<210> 27
<211> 480
<212> DNA
<213> 人工序列
<220>
<223> 酿脓链球菌, 水稻
<400> 27
gggatcttta aacatacgaa cagatcactt aaagttcttc tgaagcaact taaagttatc 60
aggcatgcat ggatcttgga ggaatcagat gtgcagtcag ggaccatagc acaggacagg 120
cgtcttctac tggtgctacc agcaaatgct ggaagccggg aacactgggt acgttggaaa 180
ccacgtgatg tggagtaaga taaactgtag gagaaaagca tttcgtagtg ggccatgaag 240
cctttcagga catgtattgc agtatgggcc ggcccattac gcaattggac gacaacaaag 300
actagtatta gtaccacctc ggctatccac atagatcaaa gctggtttaa aagagttgtg 360
cagatgatcc gtggcaactg cagtgcgtgc tgcgcgtttt agagctagaa atagcaagtt 420
aaaataaggc tagtccgtta tcaacttgaa aaagtggcac cgagtcggtg cttttttttt 480
<210> 28
<211> 31
<212> DNA
<213> 人工序列
<220>
<223> 酿脓链球菌
<400> 28
gttttagagc tatgctgtgg tgtttttttt t 31
<210> 29
<211> 80
<212> DNA
<213> 人工序列
<220>
<223> 酿脓链球菌
<400> 29
gcaccacagc atagcaagtt aaaataaggc tagtccgtta tcaacttgaa aaagtggcac 60
cgagtcggtg cttttttttt 80
<210> 30
<211> 31
<212> DNA
<213> 人工序列
<220>
<223> 酿脓链球菌
<400> 30
gttttagagc tacgccgggg gctttttttt t 31
<210> 31
<211> 80
<212> DNA
<213> 人工序列
<220>
<223> 酿脓链球菌
<400> 31
ggcccccggc gtagcaagtt aaaataaggc tagtccgtta tcaacttgaa aaagtggcac 60
cgagtcggtg cttttttttt 80
<210> 32
<211> 61
<212> DNA
<213> 人工序列
<220>
<223> 酿脓链球菌
<400> 32
gttttagagc tatgctgttt tggagctcga gctccccggg gagctcgagc tctttttttt 60
t 61
<210> 33
<211> 109
<212> DNA
<213> 人工序列
<220>
<223> 酿脓链球菌
<400> 33
gagctcgagc tccccgggga gctcgagctc caaaacagca tagcaagtta aaataaggct 60
agtccgttat caacttgaaa aagtggcacc gagtcggtgc ttttttttt 109
<210> 34
<211> 65
<212> DNA
<213> 人工序列
<220>
<223> 酿脓链球菌
<400> 34
gttttagagc tatgctgttt tggagctcga gctccccgaa aggggagctc gagctctttt 60
ttttt 65
<210> 35
<211> 113
<212> DNA
<213> 人工序列
<220>
<223> 酿脓链球菌
<400> 35
gagctcgagc tcccctttcg gggagctcga gctccaaaac agcatagcaa gttaaaataa 60
ggctagtccg ttatcaactt gaaaaagtgg caccgagtcg gtgctttttt ttt 113
<210> 36
<211> 1866
<212> DNA
<213> 人工序列
<220>
<223> 酿脓链球菌, 小麦矮缩病毒
<400> 36
atgaagaggc catggtagtg aacagaagtc cggcaggtcc ttagcgaaaa aacggggtgt 60
gccagaaaac tctatgctct accctgcgtg gaggtgtgaa ttctgcacac tgcaaatgca 120
atgtgtccaa tgctttatat agggcaggtt ttggcgggag aacagggccc ttgtgttccc 180
acgggagcgt agcgtatcgt gtgggccctg ttcggtgtgt ggtcgggggg cctccacgcg 240
ggttataata ttaccccgcg tggtggcccc cgacgcgcac tcggcttttc gtgagtgcgc 300
ggaggctttt ggaccacatc ttttctgatc actttcgtgg aagatgttga tttatcacac 360
ttttgacttg gaaatctgtg ccatgcctta gcttataagg aagtgcgcgg tagcccatct 420
cgatggagca ggcaatagcc cccccgcttc ctatacggga ctatcaatac cagacccctt 480
gggacccttt gtgaaagttg aattacggca tagccgaagg aataacagaa tcgtttcaca 540
ctttcgtaac aaaggtcttc ttatcatgtt tcagacgatg gaggcaaggc tgatcaaagt 600
gatcaagcac ataaacgcat ttttttacca tgtttcactc cataagcgtc tgagattatc 660
acaagtcacg tctagtagtt tgatggtaca ctagtgacaa tcagttcgtg cagacagagc 720
tcatacttga ctacttgagc gattacaggc gaaagtgtga aacgcatgtg atgtgggctg 780
ggaggaggag aatatatact aatgggccgt atcctgattt gggctgcgtc ggaaggtgca 840
gcccacgcgc gccgtaccgc gcgggtggcg ctgctaccca ctttagtccg ttggatgggg 900
atccgatggt ttgcgcggtg gcgttgcggg ggatgtttag taccacatcg gaaaccgaaa 960
gacgatggaa ccagcttata aacccgcgcg ctgtagtcag cttgactgca gtgcgtgctg 1020
cgcgttttag agctatgctg tggtgttttt tttttttgtg aaagttgaat tacggcatag 1080
ccgaaggaat aacagaatcg tttcacactt tcgtaacaaa ggtcttctta tcatgtttca 1140
gacgatggag gcaaggctga tcaaagtgat caagcacata aacgcatttt tttaccatgt 1200
ttcactccat aagcgtctga gattatcaca agtcacgtct agtagtttga tggtacacta 1260
gtgacaatca gttcgtgcag acagagctca tacttgacta cttgagcgat tacaggcgaa 1320
agtgtgaaac gcatgtgatg tgggctggga ggaggagaat atatactaat gggccgtatc 1380
ctgatttggg ctgcgtcgga aggtgcagcc cacgcgcgcc gtaccgcgcg ggtggcgctg 1440
ctacccactt tagtccgttg gatggggatc cgatggtttg cgcggtggcg ttgcggggga 1500
tgtttagtac cacatcggaa accgaaagac gatggaacca gcttataaac ccgcgcgctg 1560
tagtcagctt gcaccacagc atagcaagtt aaaataaggc tagtccgtta tcaacttgaa 1620
aaagtggcac cgagtcggtg cttttttttt cctaggacgc gtcgtgttat ttcaaagcca 1680
tcggcattca gtaataaaat aatattttat ttatctcatg tcattcgatt acagaggctc 1740
ggctacgagc aaagacaaac caaattataa caaaaaacaa cccttacaca atgacatcgg 1800
aaaacgaaat acaacaccct gagatattac atttatagaa actgtacgcc gtccgcgcta 1860
ggacag 1866
<210> 37
<211> 932
<212> DNA
<213> 人工序列
<220>
<223> 酿脓链球菌, 水稻
<400> 37
aaggaatctt taaacatacg aacagatcac ttaaagttct tctgaagcaa cttaaagtta 60
tcaggcatgc atggatcttg gaggaatcag atgtgcagtc agggaccata gcacaagaca 120
ggcgtcttct actggtgcta ccagcaaatg ctggaagccg ggaacactgg gtacgttgga 180
aaccacgtga tgtgaagaag taagataaac tgtaggagaa aagcatttcg tagtgggcca 240
tgaagccttt caggacatgt attgcagtat gggccggccc attacgcaat tggacgacaa 300
caaagactag tattagtacc acctcggcta tccacataga tcaaagctga tttaaaagag 360
ttgtgcagat gatccgtggc aacaaagcac cagtggtcta gtggtagaat agtaccctgc 420
cacggtacag acccgggttc gattcccggc tggtgcagga accattcaaa acagcatagc 480
aagttaaaat aaggctagtc cgttatcaac ttgaaaaagt ggcaccgagt cggtgcttaa 540
caaagcacca gtggtctagt ggtagaatag taccctgcca cggtacagac ccgggttcga 600
ttcccggctg gtgcaactgc agtgcgtgct gcgcgtttta gagctatgct gtaacaaagc 660
accagtggtc tagtggtaga atagtaccct gccacggtac agacccgggt tcgattcccg 720
gctggtgcag gaaccattca aaacagcata gcaagttaaa ataaggctag tccgttatca 780
acttgaaaaa gtggcaccga gtcggtgctt aacaaagcac cagtggtcta gtggtagaat 840
agtaccctgc cacggtacag acccgggttc gattcccggc tggtgcaact gcagtgcgtg 900
ctgcgcgttt tagagctatg ctgttttttt tt 932
<210> 38
<211> 916
<212> DNA
<213> 人工序列
<220>
<223> 酿脓链球菌, 水稻
<400> 38
aaggaatctt taaacatacg aacagatcac ttaaagttct tctgaagcaa cttaaagtta 60
tcaggcatgc atggatcttg gaggaatcag atgtgcagtc agggaccata gcacaagaca 120
ggcgtcttct actggtgcta ccagcaaatg ctggaagccg ggaacactgg gtacgttgga 180
aaccacgtga tgtgaagaag taagataaac tgtaggagaa aagcatttcg tagtgggcca 240
tgaagccttt caggacatgt attgcagtat gggccggccc attacgcaat tggacgacaa 300
caaagactag tattagtacc acctcggcta tccacataga tcaaagctga tttaaaagag 360
ttgtgcagat gatccgtggc aacaaagcac cagtggtcta gtggtagaat agtaccctgc 420
cacggtacag acccgggttc gattcccggc tggtgcagca aaacagcata gcaagttaaa 480
ataaggctag tccgttatca acttgaaaaa gtggcaccga gtcggtgctt aacaaagcac 540
cagtggtcta gtggtagaat agtaccctgc cacggtacag acccgggttc gattcccggc 600
tggtgcaact gcagtgcgtg ctgcgcgttt tagagctatg ctgtaacaaa gcaccagtgg 660
tctagtggta gaatagtacc ctgccacggt acagacccgg gttcgattcc cggctggtgc 720
agcaaaacag catagcaagt taaaataagg ctagtccgtt atcaacttga aaaagtggca 780
ccgagtcggt gcttaacaaa gcaccagtgg tctagtggta gaatagtacc ctgccacggt 840
acagacccgg gttcgattcc cggctggtgc aactgcagtg cgtgctgcgc gttttagagc 900
tatgctgttt tttttt 916
<210> 39
<211> 1389
<212> PRT
<213> 人工序列
<220>
<223> 酿脓链球菌
<400> 39
Met Asp Lys Lys Tyr Ser Ile Gly Leu Asp Ile Gly Thr Asn Ser Val
1 5 10 15
Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe
20 25 30
Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile
35 40 45
Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu
50 55 60
Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys
65 70 75 80
Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser
85 90 95
Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys
100 105 110
His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr
115 120 125
His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp
130 135 140
Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His
145 150 155 160
Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro
165 170 175
Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr
180 185 190
Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala
195 200 205
Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn
210 215 220
Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn
225 230 235 240
Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe
245 250 255
Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp
260 265 270
Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp
275 280 285
Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp
290 295 300
Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser
305 310 315 320
Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys
325 330 335
Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe
340 345 350
Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser
355 360 365
Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp
370 375 380
Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg
385 390 395 400
Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu
405 410 415
Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe
420 425 430
Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile
435 440 445
Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp
450 455 460
Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu
465 470 475 480
Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr
485 490 495
Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser
500 505 510
Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys
515 520 525
Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln
530 535 540
Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr
545 550 555 560
Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp
565 570 575
Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly
580 585 590
Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp
595 600 605
Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr
610 615 620
Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala
625 630 635 640
His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr
645 650 655
Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp
660 665 670
Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe
675 680 685
Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe
690 695 700
Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu
705 710 715 720
His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly
725 730 735
Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly
740 745 750
Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln
755 760 765
Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile
770 775 780
Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro
785 790 795 800
Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu
805 810 815
Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg
820 825 830
Leu Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys
835 840 845
Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg
850 855 860
Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys
865 870 875 880
Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys
885 890 895
Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp
900 905 910
Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr
915 920 925
Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp
930 935 940
Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser
945 950 955 960
Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg
965 970 975
Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val
980 985 990
Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe
995 1000 1005
Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala
1010 1015 1020
Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe
1025 1030 1035
Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala
1040 1045 1050
Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu
1055 1060 1065
Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val
1070 1075 1080
Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr
1085 1090 1095
Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys
1100 1105 1110
Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro
1115 1120 1125
Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val
1130 1135 1140
Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys
1145 1150 1155
Ser Val Lys Glu Leu Val Gly Ile Thr Ile Met Glu Arg Ser Ser
1160 1165 1170
Phe Glu Lys Asn Pro Val Asp Phe Leu Glu Ala Lys Gly Tyr Lys
1175 1180 1185
Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu
1190 1195 1200
Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly
1205 1210 1215
Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val
1220 1225 1230
Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser
1235 1240 1245
Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys
1250 1255 1260
His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys
1265 1270 1275
Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala
1280 1285 1290
Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn
1295 1300 1305
Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala
1310 1315 1320
Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser
1325 1330 1335
Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr
1340 1345 1350
Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp
1355 1360 1365
Ser Ser Pro Pro Lys Lys Lys Arg Lys Val Ser Trp Lys Asp Ala
1370 1375 1380
Ser Gly Trp Ser Arg Met
1385
<210> 40
<211> 2683
<212> DNA
<213> 人工序列
<220>
<223> 酿脓链球菌, 水稻, 甘蔗,
根癌农杆菌
<400> 40
cattatgtgg tctaggtagg ttctatatat aagaaaactt gaaatgttct aaaaaaaaat 60
tcaagcccat gcatgattga agcaaacggt atagcaacgg tgttaacctg atctagtgat 120
ctcttgcaat ccttaacggc cacctaccgc aggtagcaaa cggcgtcccc ctcctcgata 180
tctccgcggc gacctctggc tttttccgcg gaattgcgcg gtggggacgg attccacgag 240
accgcgacgc aaccgcctct cgccgctggg ccccacaccg ctcggtgccg tagcctcacg 300
ggactctttc tccctcctcc cccgttataa attggcttca tcccctcctt gcctcatcca 360
tccaaatccc agtccccaat cccatccctt cgtaggagaa attcatcgaa gctaagcgaa 420
tcctcgcgat cctctcaagg tactgcgagt tttcgatccc cctctcgacc cctcgtatgt 480
ttgtgtttgt cgtagcgttt gattaggtat gctttccctg tttgtgttcg tcgtagcgtt 540
tgattaggta tgctttccct gttcgtgttc atcgtagtgt ttgattaggt cgtgtgaggc 600
gatggcctgc tcgcgtcctt cgatctgtag tcgatttgcg ggtcgtggtg tagatctgcg 660
ggctgtgatg aagttatttg gtgtgatctg ctcgcctgat tctgcgggtt ggctcgagta 720
gatatgatgg ttggaccggt tggttcgttt accgcgctag ggttgggctg ggatgatgtt 780
gcatgcgccg ttgcgcgtga tcccgcagca ggacttgcgt ttgattgcca gatctcgtta 840
cgattatgtg atttggtttg gactttttag atctgtagct tctgcttatg tgccagatgc 900
gcctactgct catatgcctg atgataatca taaatggctg tggaactaac tagttgattg 960
cggagtcatg tatcagctac aggtgtaggg actagctaca ggtgtaggga cttgcgtcta 1020
attgtttggt cctttactca tgttgcaatt atgcaattta gtttagattg tttgttccac 1080
tcatctaggc tgtaaaaggg acactgctta gattgctgtt taatcttttt agtagattat 1140
attatattgg taacttatta cccctattac atgccatacg tgacttctgc tcatgcctga 1200
tgataatcat agatcactgt ggaattaatt agttgattgt tgaatcatgt ttcatgtaca 1260
taccacggca caattgctta gttccttaac aaatgcaaat tttactgatc catgtatgat 1320
ttgcgtggtt ctctaatgtg aaatactata gctacttgtt agtaagaatc aggttcgtat 1380
gcttaatgct gtatgtgcct tctgctcatg cctgatgata atcatatatc actggaatta 1440
attagttgat cgtttaatca tatatcaagt acataccatg ccacaatttt tagtcactta 1500
acccatgcag attgaactgg tccctgcatg ttttgctaaa ttgttctatt ctgattagac 1560
catatatcat gtattttttt ttggtaatgg ttctcttatt ttaaatgcta tatagttctg 1620
gtacttgtta gaaagatctg cttcatagtt tagttgccta tccctcgaat taggatgctg 1680
agcagctgat cctatagctt tgtttcatgt atcaattctt ttgtgttcaa cagtcagttt 1740
ttgttagatt cattgtaact tatggtcgct tactcttctg gtcctcaatg cttgcaggta 1800
acaaagcacc agtggtctag tggtagaata gtaccctgcc acggtacaga cccgggttcg 1860
attcccggct ggtgcaggaa ccattcaaaa cagcatagca agttaaaata aggctagtcc 1920
gttatcaact tgaaaaagtg gcaccgagtc ggtgctttaa caaagcacca gtggtctagt 1980
ggtagaatag taccctgcca cggtacagac ccgggttcga ttcccggctg gtgcaactgc 2040
agtgcgtgct gcgcgtttta gagctatgct gttttgaaca aagcaccagt ggtctagtgg 2100
tagaatagta ccctgccacg gtacagaccc gggttcgatt cccggctggt gcaggaacca 2160
ttcaaaacag catagcaagt taaaataagg ctagtccgtt atcaacttga aaaagtggca 2220
ccgagtcggt gctttaacaa agcaccagtg gtctagtggt agaatagtac cctgccacgg 2280
tacagacccg ggttcgattc ccggctggtg caactgcagt gcgtgctgcg cgttttagag 2340
ctatgctgtt ttgaacaaag caccagtggt ctagtggtag aatagtaccc tgccacggta 2400
cagacccggg ttcgattccc ggctggtgca gatcgttcaa acatttggca ataaagtttc 2460
ttaagattga atcctgttgc cggtcttgcg atgattatca tataatttct gttgaattac 2520
gttaagcatg taataattaa catgtaatgc atgacgttat ttatgagatg ggtttttatg 2580
attagagtcc cgcaattata catttaatac gcgatagaaa acaaaatata gcgcgcaaac 2640
taggataaat tatcgcgcgc ggtgtcatct atgttactag atc 2683
<210> 41
<211> 916
<212> DNA
<213> 人工序列
<220>
<223> 酿脓链球菌, 水稻, 拟南芥
<400> 41
aaggaatctt taaacatacg aacagatcac ttaaagttct tctgaagcaa cttaaagtta 60
tcaggcatgc atggatcttg gaggaatcag atgtgcagtc agggaccata gcacaagaca 120
ggcgtcttct actggtgcta ccagcaaatg ctggaagccg ggaacactgg gtacgttgga 180
aaccacgtga tgtgaagaag taagataaac tgtaggagaa aagcatttcg tagtgggcca 240
tgaagccttt caggacatgt attgcagtat gggccggccc attacgcaat tggacgacaa 300
caaagactag tattagtacc acctcggcta tccacataga tcaaagctga tttaaaagag 360
ttgtgcagat gatccgtggc aacaaagcac cagtggtcta gtggtagaat agtaccctgc 420
cacggtacag acccgggttc gattcccggc tggtgcagca aaacagcata gcaagttaaa 480
ataaggctag tccgttatca acttgaaaaa gtggcaccga gtcggtgctt aacaaagcac 540
cagtggtcta gtggtagaat agtaccctgc cacggtacag acccgggttc gattcccggc 600
tggtgcaact gcagtgcgtg ctgcgcgttt tagagctatg ctgtaacaaa gcaccagtgg 660
tctagtggta gaatagtacc ctgccacggt acagacccgg gttcgattcc cggctggtgc 720
agcaaaacag catagcaagt taaaataagg ctagtccgtt atcaacttga aaaagtggca 780
ccgagtcggt gcttaacaaa gcaccagtgg tctagtggta gaatagtacc ctgccacggt 840
acagacccgg gttcgattcc cggctggtgc aactgcagtg cgtgctgcgc gttttagagc 900
tatgctgttt tttttt 916
<210> 42
<211> 2667
<212> DNA
<213> 人工序列
<220>
<223> 酿脓链球菌, 水稻, 甘蔗,
根癌农杆菌
<400> 42
cattatgtgg tctaggtagg ttctatatat aagaaaactt gaaatgttct aaaaaaaaat 60
tcaagcccat gcatgattga agcaaacggt atagcaacgg tgttaacctg atctagtgat 120
ctcttgcaat ccttaacggc cacctaccgc aggtagcaaa cggcgtcccc ctcctcgata 180
tctccgcggc gacctctggc tttttccgcg gaattgcgcg gtggggacgg attccacgag 240
accgcgacgc aaccgcctct cgccgctggg ccccacaccg ctcggtgccg tagcctcacg 300
ggactctttc tccctcctcc cccgttataa attggcttca tcccctcctt gcctcatcca 360
tccaaatccc agtccccaat cccatccctt cgtaggagaa attcatcgaa gctaagcgaa 420
tcctcgcgat cctctcaagg tactgcgagt tttcgatccc cctctcgacc cctcgtatgt 480
ttgtgtttgt cgtagcgttt gattaggtat gctttccctg tttgtgttcg tcgtagcgtt 540
tgattaggta tgctttccct gttcgtgttc atcgtagtgt ttgattaggt cgtgtgaggc 600
gatggcctgc tcgcgtcctt cgatctgtag tcgatttgcg ggtcgtggtg tagatctgcg 660
ggctgtgatg aagttatttg gtgtgatctg ctcgcctgat tctgcgggtt ggctcgagta 720
gatatgatgg ttggaccggt tggttcgttt accgcgctag ggttgggctg ggatgatgtt 780
gcatgcgccg ttgcgcgtga tcccgcagca ggacttgcgt ttgattgcca gatctcgtta 840
cgattatgtg atttggtttg gactttttag atctgtagct tctgcttatg tgccagatgc 900
gcctactgct catatgcctg atgataatca taaatggctg tggaactaac tagttgattg 960
cggagtcatg tatcagctac aggtgtaggg actagctaca ggtgtaggga cttgcgtcta 1020
attgtttggt cctttactca tgttgcaatt atgcaattta gtttagattg tttgttccac 1080
tcatctaggc tgtaaaaggg acactgctta gattgctgtt taatcttttt agtagattat 1140
attatattgg taacttatta cccctattac atgccatacg tgacttctgc tcatgcctga 1200
tgataatcat agatcactgt ggaattaatt agttgattgt tgaatcatgt ttcatgtaca 1260
taccacggca caattgctta gttccttaac aaatgcaaat tttactgatc catgtatgat 1320
ttgcgtggtt ctctaatgtg aaatactata gctacttgtt agtaagaatc aggttcgtat 1380
gcttaatgct gtatgtgcct tctgctcatg cctgatgata atcatatatc actggaatta 1440
attagttgat cgtttaatca tatatcaagt acataccatg ccacaatttt tagtcactta 1500
acccatgcag attgaactgg tccctgcatg ttttgctaaa ttgttctatt ctgattagac 1560
catatatcat gtattttttt ttggtaatgg ttctcttatt ttaaatgcta tatagttctg 1620
gtacttgtta gaaagatctg cttcatagtt tagttgccta tccctcgaat taggatgctg 1680
agcagctgat cctatagctt tgtttcatgt atcaattctt ttgtgttcaa cagtcagttt 1740
ttgttagatt cattgtaact tatggtcgct tactcttctg gtcctcaatg cttgcaggta 1800
acaaagcacc agtggtctag tggtagaata gtaccctgcc acggtacaga cccgggttcg 1860
attcccggct ggtgcagcaa aacagcatag caagttaaaa taaggctagt ccgttatcaa 1920
cttgaaaaag tggcaccgag tcggtgcttt aacaaagcac cagtggtcta gtggtagaat 1980
agtaccctgc cacggtacag acccgggttc gattcccggc tggtgcaact gcagtgcgtg 2040
ctgcgcgttt tagagctatg ctgttttgaa caaagcacca gtggtctagt ggtagaatag 2100
taccctgcca cggtacagac ccgggttcga ttcccggctg gtgcagcaaa acagcatagc 2160
aagttaaaat aaggctagtc cgttatcaac ttgaaaaagt ggcaccgagt cggtgcttta 2220
acaaagcacc agtggtctag tggtagaata gtaccctgcc acggtacaga cccgggttcg 2280
attcccggct ggtgcaactg cagtgcgtgc tgcgcgtttt agagctatgc tgttttgaac 2340
aaagcaccag tggtctagtg gtagaatagt accctgccac ggtacagacc cgggttcgat 2400
tcccggctgg tgcagatcgt tcaaacattt ggcaataaag tttcttaaga ttgaatcctg 2460
ttgccggtct tgcgatgatt atcatataat ttctgttgaa ttacgttaag catgtaataa 2520
ttaacatgta atgcatgacg ttatttatga gatgggtttt tatgattaga gtcccgcaat 2580
tatacattta atacgcgata gaaaacaaaa tatagcgcgc aaactaggat aaattatcgc 2640
gcgcggtgtc atctatgtta ctagatc 2667
<210> 43
<211> 925
<212> DNA
<213> 人工序列
<220>
<223> 酿脓链球菌, 水稻
<400> 43
aaggaatctt taaacatacg aacagatcac ttaaagttct tctgaagcaa cttaaagtta 60
tcaggcatgc atggatcttg gaggaatcag atgtgcagtc agggaccata gcacaagaca 120
ggcgtcttct actggtgcta ccagcaaatg ctggaagccg ggaacactgg gtacgttgga 180
aaccacgtga tgtgaagaag taagataaac tgtaggagaa aagcatttcg tagtgggcca 240
tgaagccttt caggacatgt attgcagtat gggccggccc attacgcaat tggacgacaa 300
caaagactag tattagtacc acctcggcta tccacataga tcaaagctga tttaaaagag 360
ttgtgcagat gatccgtggc aacaaagcac cagtggtcta gtggtagaat agtaccctgc 420
cacggtacag acccgggttc gattcccggc tggtgcagca ccacagcata gcaagttaaa 480
ataaggctag tccgttatca acttgaaaaa gtggcaccga gtcggtgctt aacaaagcac 540
cagtggtcta gtggtagaat agtaccctgc cacggtacag acccgggttc gattcccggc 600
tggtgcaact gcagtgcgtg ctgcgcgttt tagagctatg ctgtggtgaa caaagcacca 660
gtggtctagt ggtagaatag taccctgcca cggtacagac ccgggttcga ttcccggctg 720
gtgcagcacc acagcatagc aagttaaaat aaggctagtc cgttatcaac ttgaaaaagt 780
ggcaccgagt cggtgcttaa caaagcacca gtggtctagt ggtagaatag taccctgcca 840
cggtacagac ccgggttcga ttcccggctg gtgcaactgc agtgcgtgct gcgcgtttta 900
gagctatgct gtggtgtttt ttttt 925
<210> 44
<211> 2667
<212> DNA
<213> 人工序列
<220>
<223> 酿脓链球菌, 水稻, 甘蔗,
根癌农杆菌
<400> 44
cattatgtgg tctaggtagg ttctatatat aagaaaactt gaaatgttct aaaaaaaaat 60
tcaagcccat gcatgattga agcaaacggt atagcaacgg tgttaacctg atctagtgat 120
ctcttgcaat ccttaacggc cacctaccgc aggtagcaaa cggcgtcccc ctcctcgata 180
tctccgcggc gacctctggc tttttccgcg gaattgcgcg gtggggacgg attccacgag 240
accgcgacgc aaccgcctct cgccgctggg ccccacaccg ctcggtgccg tagcctcacg 300
ggactctttc tccctcctcc cccgttataa attggcttca tcccctcctt gcctcatcca 360
tccaaatccc agtccccaat cccatccctt cgtaggagaa attcatcgaa gctaagcgaa 420
tcctcgcgat cctctcaagg tactgcgagt tttcgatccc cctctcgacc cctcgtatgt 480
ttgtgtttgt cgtagcgttt gattaggtat gctttccctg tttgtgttcg tcgtagcgtt 540
tgattaggta tgctttccct gttcgtgttc atcgtagtgt ttgattaggt cgtgtgaggc 600
gatggcctgc tcgcgtcctt cgatctgtag tcgatttgcg ggtcgtggtg tagatctgcg 660
ggctgtgatg aagttatttg gtgtgatctg ctcgcctgat tctgcgggtt ggctcgagta 720
gatatgatgg ttggaccggt tggttcgttt accgcgctag ggttgggctg ggatgatgtt 780
gcatgcgccg ttgcgcgtga tcccgcagca ggacttgcgt ttgattgcca gatctcgtta 840
cgattatgtg atttggtttg gactttttag atctgtagct tctgcttatg tgccagatgc 900
gcctactgct catatgcctg atgataatca taaatggctg tggaactaac tagttgattg 960
cggagtcatg tatcagctac aggtgtaggg actagctaca ggtgtaggga cttgcgtcta 1020
attgtttggt cctttactca tgttgcaatt atgcaattta gtttagattg tttgttccac 1080
tcatctaggc tgtaaaaggg acactgctta gattgctgtt taatcttttt agtagattat 1140
attatattgg taacttatta cccctattac atgccatacg tgacttctgc tcatgcctga 1200
tgataatcat agatcactgt ggaattaatt agttgattgt tgaatcatgt ttcatgtaca 1260
taccacggca caattgctta gttccttaac aaatgcaaat tttactgatc catgtatgat 1320
ttgcgtggtt ctctaatgtg aaatactata gctacttgtt agtaagaatc aggttcgtat 1380
gcttaatgct gtatgtgcct tctgctcatg cctgatgata atcatatatc actggaatta 1440
attagttgat cgtttaatca tatatcaagt acataccatg ccacaatttt tagtcactta 1500
acccatgcag attgaactgg tccctgcatg ttttgctaaa ttgttctatt ctgattagac 1560
catatatcat gtattttttt ttggtaatgg ttctcttatt ttaaatgcta tatagttctg 1620
gtacttgtta gaaagatctg cttcatagtt tagttgccta tccctcgaat taggatgctg 1680
agcagctgat cctatagctt tgtttcatgt atcaattctt ttgtgttcaa cagtcagttt 1740
ttgttagatt cattgtaact tatggtcgct tactcttctg gtcctcaatg cttgcaggta 1800
acaaagcacc agtggtctag tggtagaata gtaccctgcc acggtacaga cccgggttcg 1860
attcccggct ggtgcagcac cacagcatag caagttaaaa taaggctagt ccgttatcaa 1920
cttgaaaaag tggcaccgag tcggtgcttt aacaaagcac cagtggtcta gtggtagaat 1980
agtaccctgc cacggtacag acccgggttc gattcccggc tggtgcaact gcagtgcgtg 2040
ctgcgcgttt tagagctatg ctgtggtgaa caaagcacca gtggtctagt ggtagaatag 2100
taccctgcca cggtacagac ccgggttcga ttcccggctg gtgcagcacc acagcatagc 2160
aagttaaaat aaggctagtc cgttatcaac ttgaaaaagt ggcaccgagt cggtgcttta 2220
acaaagcacc agtggtctag tggtagaata gtaccctgcc acggtacaga cccgggttcg 2280
attcccggct ggtgcaactg cagtgcgtgc tgcgcgtttt agagctatgc tgtggtgaac 2340
aaagcaccag tggtctagtg gtagaatagt accctgccac ggtacagacc cgggttcgat 2400
tcccggctgg tgcagatcgt tcaaacattt ggcaataaag tttcttaaga ttgaatcctg 2460
ttgccggtct tgcgatgatt atcatataat ttctgttgaa ttacgttaag catgtaataa 2520
ttaacatgta atgcatgacg ttatttatga gatgggtttt tatgattaga gtcccgcaat 2580
tatacattta atacgcgata gaaaacaaaa tatagcgcgc aaactaggat aaattatcgc 2640
gcgcggtgtc atctatgtta ctagatc 2667
<210> 45
<211> 19
<212> DNA
<213> 人工序列
<220>
<223> 水稻
<400> 45
actgcagtgc gtgctgcgc 19
<210> 46
<211> 19
<212> DNA
<213> 人工序列
<220>
<223> 大肠杆菌
<400> 46
ccctatcccc gttgacgac 19
<210> 47
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 大肠杆菌
<400> 47
ctgatagtgg tctccttgtc gct 23
<210> 48
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 大肠杆菌
<400> 48
ttcgccttca gcctgcacga cct 23
<210> 49
<211> 19
<212> DNA
<213> 人工序列
<220>
<223> 酿脓链球菌
<400> 49
ttgtgctgct ccacgaaca 19
<210> 50
<211> 20
<212> DNA
<213> 人工序列
<220>
<223> 酿脓链球菌
<400> 50
gccagccact acgagaagct 20
<210> 51
<211> 24
<212> DNA
<213> 人工序列
<220>
<223> 酿脓链球菌
<400> 51
ctgcttctgc tcgttgtcct ccgg 24
<210> 52
<211> 17
<212> DNA
<213> 水稻
<400> 52
tgcgacgagc catgctg 17
<210> 53
<211> 23
<212> DNA
<213> 水稻
<400> 53
gcagtctgga ctacagcatg acc 23
<210> 54
<211> 13
<212> DNA
<213> 水稻
<400> 54
cagcgcagca cgc 13
<210> 55
<211> 22
<212> RNA
<213> 人工序列
<220>
<223> 酿脓链球菌
<400> 55
guuuuagagc uaugcuguuu ug 22
<210> 56
<211> 88
<212> RNA
<213> 人工序列
<220>
<223> 酿脓链球菌
<400> 56
ggaaccauuc aaaacagcau agcaaguuaa aauaaggcua guccguuauc aacuugaaaa 60
aguggcaccg agucggugcu uuuuuuuu 88
<210> 57
<211> 22
<212> RNA
<213> 人工序列
<220>
<223> 酿脓链球菌
<400> 57
gguuuagagc uaugcuguuu ug 22
<210> 58
<211> 88
<212> RNA
<213> 人工序列
<220>
<223> 酿脓链球菌
<400> 58
ggaaccauuc aaaacagcau agcaaguuaa acuaaggcua guccguuauc aacuugaaaa 60
aguggcaccg agucggugcu uuuuuuuu 88
<210> 59
<211> 22
<212> RNA
<213> 人工序列
<220>
<223> 酿脓链球菌
<400> 59
guguuagagc uaugcuguuu ug 22
<210> 60
<211> 88
<212> RNA
<213> 人工序列
<220>
<223> 酿脓链球菌
<400> 60
ggaaccauuc aaaacagcau agcaaguuaa cauaaggcua guccguuauc aacuugaaaa 60
aguggcaccg agucggugcu uuuuuuuu 88
<210> 61
<211> 22
<212> RNA
<213> 人工序列
<220>
<223> 酿脓链球菌
<400> 61
guuguagagc uaugcuguuu ug 22
<210> 62
<211> 88
<212> RNA
<213> 人工序列
<220>
<223> 酿脓链球菌
<400> 62
ggaaccauuc aaaacagcau agcaaguuac aauaaggcua guccguuauc aacuugaaaa 60
aguggcaccg agucggugcu uuuuuuuu 88
<210> 63
<211> 22
<212> RNA
<213> 人工序列
<220>
<223> 酿脓链球菌
<400> 63
guuugagagc uaugcuguuu ug 22
<210> 64
<211> 88
<212> RNA
<213> 人工序列
<220>
<223> 酿脓链球菌
<400> 64
ggaaccauuc aaaacagcau agcaaguuca aauaaggcua guccguuauc aacuugaaaa 60
aguggcaccg agucggugcu uuuuuuuu 88
<210> 65
<211> 22
<212> RNA
<213> 人工序列
<220>
<223> 酿脓链球菌
<400> 65
guuuaagagc uaugcuguuu ug 22
<210> 66
<211> 88
<212> RNA
<213> 人工序列
<220>
<223> 酿脓链球菌
<400> 66
ggaaccauuc aaaacagcau agcaaguuua aauaaggcua guccguuauc aacuugaaaa 60
aguggcaccg agucggugcu uuuuuuuu 88
<210> 67
<211> 22
<212> RNA
<213> 人工序列
<220>
<223> 酿脓链球菌
<400> 67
guuucagagc uaugcuguuu ug 22
<210> 68
<211> 88
<212> RNA
<213> 人工序列
<220>
<223> 酿脓链球菌
<400> 68
ggaaccauuc aaaacagcau agcaaguuga aauaaggcua guccguuauc aacuugaaaa 60
aguggcaccg agucggugcu uuuuuuuu 88
<210> 69
<211> 40
<212> RNA
<213> 人工序列
<220>
<223> 酿脓链球菌
<400> 69
guuuuagagc uaugcuguuu ugaaugguuc cuuuuuuuuu 40
<210> 70
<211> 88
<212> RNA
<213> 人工序列
<220>
<223> 酿脓链球菌
<400> 70
ggaaccauuc aaaacagcau agcaaguuaa aauaaggcua guccguuauc aacuugaaaa 60
aguggcaccg agucggugcu uuuuuuuu 88
<210> 71
<211> 22
<212> RNA
<213> 人工序列
<220>
<223> 酿脓链球菌
<400> 71
guuuuagagc uaugcuguuu ug 22
<210> 72
<211> 80
<212> RNA
<213> 人工序列
<220>
<223> 酿脓链球菌
<400> 72
gcaaaacagc auagcaaguu aaaauaaggc uaguccguua ucaacuugaa aaaguggcac 60
cgagucggug cuuuuuuuuu 80
<210> 73
<211> 52
<212> RNA
<213> 人工序列
<220>
<223> 酿脓链球菌
<400> 73
guuuuagagc uaugcuguuu ugagcucggg uaggcuguca accuaccgcc gu 52
<210> 74
<211> 126
<212> RNA
<213> 人工序列
<220>
<223> 酿脓链球菌
<400> 74
gcgguccccu uauugccuga caagcugagg gccacccugg aaccauucaa aacagcauag 60
caaguuaaaa uaaggcuagu ccguuaucaa cuugaaaaag uggcaccgag ucggugcuuu 120
uuuuuu 126
<210> 75
<211> 22
<212> RNA
<213> 人工序列
<220>
<223> 酿脓链球菌
<400> 75
guuuuagagc uaugcugugg ug 22
<210> 76
<211> 88
<212> RNA
<213> 人工序列
<220>
<223> 酿脓链球菌
<400> 76
ggaaccauuc accacagcau agcaaguuaa aauaaggcua guccguuauc aacuugaaaa 60
aguggcaccg agucggugcu uuuuuuuu 88
<210> 77
<211> 22
<212> RNA
<213> 人工序列
<220>
<223> 酿脓链球菌
<400> 77
guuuuagagc uaugcugugg ug 22
<210> 78
<211> 80
<212> RNA
<213> 人工序列
<220>
<223> 酿脓链球菌
<400> 78
gcaccacagc auagcaaguu aaaauaaggc uaguccguua ucaacuugaa aaaguggcac 60
cgagucggug cuuuuuuuuu 80
<210> 79
<211> 22
<212> RNA
<213> 人工序列
<220>
<223> 酿脓链球菌
<400> 79
guuuuagagc uacgccgggg gc 22
<210> 80
<211> 80
<212> RNA
<213> 人工序列
<220>
<223> 酿脓链球菌
<400> 80
ggcccccggc guagcaaguu aaaauaaggc uaguccguua ucaacuugaa aaaguggcac 60
cgagucggug cuuuuuuuuu 80
<210> 81
<211> 52
<212> RNA
<213> 人工序列
<220>
<223> 酿脓链球菌
<400> 81
guuuuagagc uaugcuguuu uggagcucga gcuccccggg gagcucgagc uc 52
<210> 82
<211> 109
<212> RNA
<213> 人工序列
<220>
<223> 酿脓链球菌
<400> 82
gagcucgagc uccccgggga gcucgagcuc caaaacagca uagcaaguua aaauaaggcu 60
aguccguuau caacuugaaa aaguggcacc gagucggugc uuuuuuuuu 109
<210> 83
<211> 56
<212> RNA
<213> 人工序列
<220>
<223> 酿脓链球菌
<400> 83
guuuuagagc uaugcuguuu uggagcucga gcuccccgaa aggggagcuc gagcuc 56
<210> 84
<211> 113
<212> RNA
<213> 人工序列
<220>
<223> 酿脓链球菌
<400> 84
gagcucgagc uccccuuucg gggagcucga gcuccaaaac agcauagcaa guuaaaauaa 60
ggcuaguccg uuaucaacuu gaaaaagugg caccgagucg gugcuuuuuu uuu 113
<210> 85
<211> 1797
<212> DNA
<213> 人工序列
<220>
<223> 甘蔗
<400> 85
cattatgtgg tctaggtagg ttctatatat aagaaaactt gaaatgttct aaaaaaaaat 60
tcaagcccat gcatgattga agcaaacggt atagcaacgg tgttaacctg atctagtgat 120
ctcttgcaat ccttaacggc cacctaccgc aggtagcaaa cggcgtcccc ctcctcgata 180
tctccgcggc gacctctggc tttttccgcg gaattgcgcg gtggggacgg attccacgag 240
accgcgacgc aaccgcctct cgccgctggg ccccacaccg ctcggtgccg tagcctcacg 300
ggactctttc tccctcctcc cccgttataa attggcttca tcccctcctt gcctcatcca 360
tccaaatccc agtccccaat cccatccctt cgtaggagaa attcatcgaa gctaagcgaa 420
tcctcgcgat cctctcaagg tactgcgagt tttcgatccc cctctcgacc cctcgtatgt 480
ttgtgtttgt cgtagcgttt gattaggtat gctttccctg tttgtgttcg tcgtagcgtt 540
tgattaggta tgctttccct gttcgtgttc atcgtagtgt ttgattaggt cgtgtgaggc 600
gatggcctgc tcgcgtcctt cgatctgtag tcgatttgcg ggtcgtggtg tagatctgcg 660
ggctgtgatg aagttatttg gtgtgatctg ctcgcctgat tctgcgggtt ggctcgagta 720
gatatgatgg ttggaccggt tggttcgttt accgcgctag ggttgggctg ggatgatgtt 780
gcatgcgccg ttgcgcgtga tcccgcagca ggacttgcgt ttgattgcca gatctcgtta 840
cgattatgtg atttggtttg gactttttag atctgtagct tctgcttatg tgccagatgc 900
gcctactgct catatgcctg atgataatca taaatggctg tggaactaac tagttgattg 960
cggagtcatg tatcagctac aggtgtaggg actagctaca ggtgtaggga cttgcgtcta 1020
attgtttggt cctttactca tgttgcaatt atgcaattta gtttagattg tttgttccac 1080
tcatctaggc tgtaaaaggg acactgctta gattgctgtt taatcttttt agtagattat 1140
attatattgg taacttatta cccctattac atgccatacg tgacttctgc tcatgcctga 1200
tgataatcat agatcactgt ggaattaatt agttgattgt tgaatcatgt ttcatgtaca 1260
taccacggca caattgctta gttccttaac aaatgcaaat tttactgatc catgtatgat 1320
ttgcgtggtt ctctaatgtg aaatactata gctacttgtt agtaagaatc aggttcgtat 1380
gcttaatgct gtatgtgcct tctgctcatg cctgatgata atcatatatc actggaatta 1440
attagttgat cgtttaatca tatatcaagt acataccatg ccacaatttt tagtcactta 1500
acccatgcag attgaactgg tccctgcatg ttttgctaaa ttgttctatt ctgattagac 1560
catatatcat gtattttttt ttggtaatgg ttctcttatt ttaaatgcta tatagttctg 1620
gtacttgtta gaaagatctg cttcatagtt tagttgccta tccctcgaat taggatgctg 1680
agcagctgat cctatagctt tgtttcatgt atcaattctt ttgtgttcaa cagtcagttt 1740
ttgttagatt cattgtaact tatggtcgct tactcttctg gtcctcaatg cttgcag 1797
<210> 86
<211> 380
<212> DNA
<213> 人工序列
<220>
<223> 水稻
<400> 86
aaggaatctt taaacatacg aacagatcac ttaaagttct tctgaagcaa cttaaagtta 60
tcaggcatgc atggatcttg gaggaatcag atgtgcagtc agggaccata gcacaagaca 120
ggcgtcttct actggtgcta ccagcaaatg ctggaagccg ggaacactgg gtacgttgga 180
aaccacgtga tgtgaagaag taagataaac tgtaggagaa aagcatttcg tagtgggcca 240
tgaagccttt caggacatgt attgcagtat gggccggccc attacgcaat tggacgacaa 300
caaagactag tattagtacc acctcggcta tccacataga tcaaagctga tttaaaagag 360
ttgtgcagat gatccgtggc 380
<210> 87
<211> 664
<212> DNA
<213> 人工序列
<220>
<223> 酿脓链球菌, 水稻
<220>
<221> 尚未归类的特征
<222> (458)..(477)
<223> n是a, c, g, 或t
<400> 87
aaggaatctt taaacatacg aacagatcac ttaaagttct tctgaagcaa cttaaagtta 60
tcaggcatgc atggatcttg gaggaatcag atgtgcagtc agggaccata gcacaagaca 120
ggcgtcttct actggtgcta ccagcaaatg ctggaagccg ggaacactgg gtacgttgga 180
aaccacgtga tgtgaagaag taagataaac tgtaggagaa aagcatttcg tagtgggcca 240
tgaagccttt caggacatgt attgcagtat gggccggccc attacgcaat tggacgacaa 300
caaagactag tattagtacc acctcggcta tccacataga tcaaagctga tttaaaagag 360
ttgtgcagat gatccgtggc aacaaagcac cagtggtcta gtggtagaat agtaccctgc 420
cacggtacag acccgggttc gattcccggc tggtgcannn nnnnnnnnnn nnnnnnngtt 480
ttagagctat gctgttttga acaaagcacc agtggtctag tggtagaata gtaccctgcc 540
acggtacaga cccgggttcg attcccggct ggtgcaggaa ccattcaaaa cagcatagca 600
agttaaaata aggctagtcc gttatcaact tgaaaaagtg gcaccgagtc ggtgcttttt 660
tttt 664
<210> 88
<211> 661
<212> DNA
<213> 人工序列
<220>
<223> 酿脓链球菌, 水稻,
<220>
<221> 尚未归类的特征
<222> (616)..(635)
<223> n是a, c, g, 或t
<400> 88
aaggaatctt taaacatacg aacagatcac ttaaagttct tctgaagcaa cttaaagtta 60
tcaggcatgc atggatcttg gaggaatcag atgtgcagtc agggaccata gcacaagaca 120
ggcgtcttct actggtgcta ccagcaaatg ctggaagccg ggaacactgg gtacgttgga 180
aaccacgtga tgtgaagaag taagataaac tgtaggagaa aagcatttcg tagtgggcca 240
tgaagccttt caggacatgt attgcagtat gggccggccc attacgcaat tggacgacaa 300
caaagactag tattagtacc acctcggcta tccacataga tcaaagctga tttaaaagag 360
ttgtgcagat gatccgtggc aacaaagcac cagtggtcta gtggtagaat agtaccctgc 420
cacggtacag acccgggttc gattcccggc tggtgcagga accattcaaa acagcatagc 480
aagttaaaat aaggctagtc cgttatcaac ttgaaaaagt ggcaccgagt cggtgcttaa 540
caaagcacca gtggtctagt ggtagaatag taccctgcca cggtacagac ccgggttcga 600
ttcccggctg gtgcannnnn nnnnnnnnnn nnnnngtttt agagctatgc tgtttttttt 660
t 661
<210> 89
<211> 934
<212> DNA
<213> 人工序列
<220>
<223> 酿脓链球菌, 水稻
<220>
<221> 尚未归类的特征
<222> (616)..(635)
<223> n是a, c, g, 或t
<220>
<221> 尚未归类的特征
<222> (889)..(908)
<223> n是a, c, g, 或t
<400> 89
aaggaatctt taaacatacg aacagatcac ttaaagttct tctgaagcaa cttaaagtta 60
tcaggcatgc atggatcttg gaggaatcag atgtgcagtc agggaccata gcacaagaca 120
ggcgtcttct actggtgcta ccagcaaatg ctggaagccg ggaacactgg gtacgttgga 180
aaccacgtga tgtgaagaag taagataaac tgtaggagaa aagcatttcg tagtgggcca 240
tgaagccttt caggacatgt attgcagtat gggccggccc attacgcaat tggacgacaa 300
caaagactag tattagtacc acctcggcta tccacataga tcaaagctga tttaaaagag 360
ttgtgcagat gatccgtggc aacaaagcac cagtggtcta gtggtagaat agtaccctgc 420
cacggtacag acccgggttc gattcccggc tggtgcagga accattcaaa acagcatagc 480
aagttaaaat aaggctagtc cgttatcaac ttgaaaaagt ggcaccgagt cggtgcttaa 540
caaagcacca gtggtctagt ggtagaatag taccctgcca cggtacagac ccgggttcga 600
ttcccggctg gtgcannnnn nnnnnnnnnn nnnnngtttt agagctatgc tgtaacaaag 660
caccagtggt ctagtggtag aatagtaccc tgccacggta cagacccggg ttcgattccc 720
ggctggtgca ggaaccattc aaaacagcat agcaagttaa aataaggcta gtccgttatc 780
aacttgaaaa agtggcaccg agtcggtgct taacaaagca ccagtggtct agtggtagaa 840
tagtaccctg ccacggtaca gacccgggtt cgattcccgg ctggtgcann nnnnnnnnnn 900
nnnnnnnngt tttagagcta tgctgttttt tttt 934
<210> 90
<211> 918
<212> DNA
<213> 人工序列
<220>
<223> 酿脓链球菌, 水稻, 拟南芥
<220>
<221> 尚未归类的特征
<222> (608)..(627)
<223> n是a, c, g, 或t
<220>
<221> 尚未归类的特征
<222> (873)..(892)
<223> n是a, c, g, 或t
<400> 90
aaggaatctt taaacatacg aacagatcac ttaaagttct tctgaagcaa cttaaagtta 60
tcaggcatgc atggatcttg gaggaatcag atgtgcagtc agggaccata gcacaagaca 120
ggcgtcttct actggtgcta ccagcaaatg ctggaagccg ggaacactgg gtacgttgga 180
aaccacgtga tgtgaagaag taagataaac tgtaggagaa aagcatttcg tagtgggcca 240
tgaagccttt caggacatgt attgcagtat gggccggccc attacgcaat tggacgacaa 300
caaagactag tattagtacc acctcggcta tccacataga tcaaagctga tttaaaagag 360
ttgtgcagat gatccgtggc aacaaagcac cagtggtcta gtggtagaat agtaccctgc 420
cacggtacag acccgggttc gattcccggc tggtgcagca aaacagcata gcaagttaaa 480
ataaggctag tccgttatca acttgaaaaa gtggcaccga gtcggtgctt aacaaagcac 540
cagtggtcta gtggtagaat agtaccctgc cacggtacag acccgggttc gattcccggc 600
tggtgcannn nnnnnnnnnn nnnnnnngtt ttagagctat gctgtaacaa agcaccagtg 660
gtctagtggt agaatagtac cctgccacgg tacagacccg ggttcgattc ccggctggtg 720
cagcaaaaca gcatagcaag ttaaaataag gctagtccgt tatcaacttg aaaaagtggc 780
accgagtcgg tgcttaacaa agcaccagtg gtctagtggt agaatagtac cctgccacgg 840
tacagacccg ggttcgattc ccggctggtg cannnnnnnn nnnnnnnnnn nngttttaga 900
gctatgctgt tttttttt 918
<210> 91
<211> 2685
<212> DNA
<213> 人工序列
<220>
<223> 酿脓链球菌, 水稻, 根癌农杆菌,
甘蔗
<220>
<221> 尚未归类的特征
<222> (2036)..(2055)
<223> n是a, c, g, 或t
<220>
<221> 尚未归类的特征
<222> (2314)..(2333)
<223> n是a, c, g, 或t
<400> 91
cattatgtgg tctaggtagg ttctatatat aagaaaactt gaaatgttct aaaaaaaaat 60
tcaagcccat gcatgattga agcaaacggt atagcaacgg tgttaacctg atctagtgat 120
ctcttgcaat ccttaacggc cacctaccgc aggtagcaaa cggcgtcccc ctcctcgata 180
tctccgcggc gacctctggc tttttccgcg gaattgcgcg gtggggacgg attccacgag 240
accgcgacgc aaccgcctct cgccgctggg ccccacaccg ctcggtgccg tagcctcacg 300
ggactctttc tccctcctcc cccgttataa attggcttca tcccctcctt gcctcatcca 360
tccaaatccc agtccccaat cccatccctt cgtaggagaa attcatcgaa gctaagcgaa 420
tcctcgcgat cctctcaagg tactgcgagt tttcgatccc cctctcgacc cctcgtatgt 480
ttgtgtttgt cgtagcgttt gattaggtat gctttccctg tttgtgttcg tcgtagcgtt 540
tgattaggta tgctttccct gttcgtgttc atcgtagtgt ttgattaggt cgtgtgaggc 600
gatggcctgc tcgcgtcctt cgatctgtag tcgatttgcg ggtcgtggtg tagatctgcg 660
ggctgtgatg aagttatttg gtgtgatctg ctcgcctgat tctgcgggtt ggctcgagta 720
gatatgatgg ttggaccggt tggttcgttt accgcgctag ggttgggctg ggatgatgtt 780
gcatgcgccg ttgcgcgtga tcccgcagca ggacttgcgt ttgattgcca gatctcgtta 840
cgattatgtg atttggtttg gactttttag atctgtagct tctgcttatg tgccagatgc 900
gcctactgct catatgcctg atgataatca taaatggctg tggaactaac tagttgattg 960
cggagtcatg tatcagctac aggtgtaggg actagctaca ggtgtaggga cttgcgtcta 1020
attgtttggt cctttactca tgttgcaatt atgcaattta gtttagattg tttgttccac 1080
tcatctaggc tgtaaaaggg acactgctta gattgctgtt taatcttttt agtagattat 1140
attatattgg taacttatta cccctattac atgccatacg tgacttctgc tcatgcctga 1200
tgataatcat agatcactgt ggaattaatt agttgattgt tgaatcatgt ttcatgtaca 1260
taccacggca caattgctta gttccttaac aaatgcaaat tttactgatc catgtatgat 1320
ttgcgtggtt ctctaatgtg aaatactata gctacttgtt agtaagaatc aggttcgtat 1380
gcttaatgct gtatgtgcct tctgctcatg cctgatgata atcatatatc actggaatta 1440
attagttgat cgtttaatca tatatcaagt acataccatg ccacaatttt tagtcactta 1500
acccatgcag attgaactgg tccctgcatg ttttgctaaa ttgttctatt ctgattagac 1560
catatatcat gtattttttt ttggtaatgg ttctcttatt ttaaatgcta tatagttctg 1620
gtacttgtta gaaagatctg cttcatagtt tagttgccta tccctcgaat taggatgctg 1680
agcagctgat cctatagctt tgtttcatgt atcaattctt ttgtgttcaa cagtcagttt 1740
ttgttagatt cattgtaact tatggtcgct tactcttctg gtcctcaatg cttgcaggta 1800
acaaagcacc agtggtctag tggtagaata gtaccctgcc acggtacaga cccgggttcg 1860
attcccggct ggtgcaggaa ccattcaaaa cagcatagca agttaaaata aggctagtcc 1920
gttatcaact tgaaaaagtg gcaccgagtc ggtgctttaa caaagcacca gtggtctagt 1980
ggtagaatag taccctgcca cggtacagac ccgggttcga ttcccggctg gtgcannnnn 2040
nnnnnnnnnn nnnnngtttt agagctatgc tgttttgaac aaagcaccag tggtctagtg 2100
gtagaatagt accctgccac ggtacagacc cgggttcgat tcccggctgg tgcaggaacc 2160
attcaaaaca gcatagcaag ttaaaataag gctagtccgt tatcaacttg aaaaagtggc 2220
accgagtcgg tgctttaaca aagcaccagt ggtctagtgg tagaatagta ccctgccacg 2280
gtacagaccc gggttcgatt cccggctggt gcannnnnnn nnnnnnnnnn nnngttttag 2340
agctatgctg ttttgaacaa agcaccagtg gtctagtggt agaatagtac cctgccacgg 2400
tacagacccg ggttcgattc ccggctggtg cagatcgttc aaacatttgg caataaagtt 2460
tcttaagatt gaatcctgtt gccggtcttg cgatgattat catataattt ctgttgaatt 2520
acgttaagca tgtaataatt aacatgtaat gcatgacgtt atttatgaga tgggttttta 2580
tgattagagt cccgcaatta tacatttaat acgcgataga aaacaaaata tagcgcgcaa 2640
actaggataa attatcgcgc gcggtgtcat ctatgttact agatc 2685
<210> 92
<211> 918
<212> DNA
<213> 人工序列
<220>
<223> 酿脓链球菌, 水稻, 拟南芥
<220>
<221> 尚未归类的特征
<222> (608)..(627)
<223> n是a, c, g, 或t
<220>
<221> 尚未归类的特征
<222> (873)..(892)
<223> n是a, c, g, 或t
<400> 92
aaggaatctt taaacatacg aacagatcac ttaaagttct tctgaagcaa cttaaagtta 60
tcaggcatgc atggatcttg gaggaatcag atgtgcagtc agggaccata gcacaagaca 120
ggcgtcttct actggtgcta ccagcaaatg ctggaagccg ggaacactgg gtacgttgga 180
aaccacgtga tgtgaagaag taagataaac tgtaggagaa aagcatttcg tagtgggcca 240
tgaagccttt caggacatgt attgcagtat gggccggccc attacgcaat tggacgacaa 300
caaagactag tattagtacc acctcggcta tccacataga tcaaagctga tttaaaagag 360
ttgtgcagat gatccgtggc aacaaagcac cagtggtcta gtggtagaat agtaccctgc 420
cacggtacag acccgggttc gattcccggc tggtgcagca aaacagcata gcaagttaaa 480
ataaggctag tccgttatca acttgaaaaa gtggcaccga gtcggtgctt aacaaagcac 540
cagtggtcta gtggtagaat agtaccctgc cacggtacag acccgggttc gattcccggc 600
tggtgcannn nnnnnnnnnn nnnnnnngtt ttagagctat gctgtaacaa agcaccagtg 660
gtctagtggt agaatagtac cctgccacgg tacagacccg ggttcgattc ccggctggtg 720
cagcaaaaca gcatagcaag ttaaaataag gctagtccgt tatcaacttg aaaaagtggc 780
accgagtcgg tgcttaacaa agcaccagtg gtctagtggt agaatagtac cctgccacgg 840
tacagacccg ggttcgattc ccggctggtg cannnnnnnn nnnnnnnnnn nngttttaga 900
gctatgctgt tttttttt 918
<210> 93
<211> 2669
<212> DNA
<213> 人工序列
<220>
<223> 酿脓链球菌, 甘蔗, 根癌
农杆菌
<220>
<221> 尚未归类的特征
<222> (2028)..(2047)
<223> n是a, c, g, 或t
<220>
<221> 尚未归类的特征
<222> (2298)..(2317)
<223> n是a, c, g, 或t
<400> 93
cattatgtgg tctaggtagg ttctatatat aagaaaactt gaaatgttct aaaaaaaaat 60
tcaagcccat gcatgattga agcaaacggt atagcaacgg tgttaacctg atctagtgat 120
ctcttgcaat ccttaacggc cacctaccgc aggtagcaaa cggcgtcccc ctcctcgata 180
tctccgcggc gacctctggc tttttccgcg gaattgcgcg gtggggacgg attccacgag 240
accgcgacgc aaccgcctct cgccgctggg ccccacaccg ctcggtgccg tagcctcacg 300
ggactctttc tccctcctcc cccgttataa attggcttca tcccctcctt gcctcatcca 360
tccaaatccc agtccccaat cccatccctt cgtaggagaa attcatcgaa gctaagcgaa 420
tcctcgcgat cctctcaagg tactgcgagt tttcgatccc cctctcgacc cctcgtatgt 480
ttgtgtttgt cgtagcgttt gattaggtat gctttccctg tttgtgttcg tcgtagcgtt 540
tgattaggta tgctttccct gttcgtgttc atcgtagtgt ttgattaggt cgtgtgaggc 600
gatggcctgc tcgcgtcctt cgatctgtag tcgatttgcg ggtcgtggtg tagatctgcg 660
ggctgtgatg aagttatttg gtgtgatctg ctcgcctgat tctgcgggtt ggctcgagta 720
gatatgatgg ttggaccggt tggttcgttt accgcgctag ggttgggctg ggatgatgtt 780
gcatgcgccg ttgcgcgtga tcccgcagca ggacttgcgt ttgattgcca gatctcgtta 840
cgattatgtg atttggtttg gactttttag atctgtagct tctgcttatg tgccagatgc 900
gcctactgct catatgcctg atgataatca taaatggctg tggaactaac tagttgattg 960
cggagtcatg tatcagctac aggtgtaggg actagctaca ggtgtaggga cttgcgtcta 1020
attgtttggt cctttactca tgttgcaatt atgcaattta gtttagattg tttgttccac 1080
tcatctaggc tgtaaaaggg acactgctta gattgctgtt taatcttttt agtagattat 1140
attatattgg taacttatta cccctattac atgccatacg tgacttctgc tcatgcctga 1200
tgataatcat agatcactgt ggaattaatt agttgattgt tgaatcatgt ttcatgtaca 1260
taccacggca caattgctta gttccttaac aaatgcaaat tttactgatc catgtatgat 1320
ttgcgtggtt ctctaatgtg aaatactata gctacttgtt agtaagaatc aggttcgtat 1380
gcttaatgct gtatgtgcct tctgctcatg cctgatgata atcatatatc actggaatta 1440
attagttgat cgtttaatca tatatcaagt acataccatg ccacaatttt tagtcactta 1500
acccatgcag attgaactgg tccctgcatg ttttgctaaa ttgttctatt ctgattagac 1560
catatatcat gtattttttt ttggtaatgg ttctcttatt ttaaatgcta tatagttctg 1620
gtacttgtta gaaagatctg cttcatagtt tagttgccta tccctcgaat taggatgctg 1680
agcagctgat cctatagctt tgtttcatgt atcaattctt ttgtgttcaa cagtcagttt 1740
ttgttagatt cattgtaact tatggtcgct tactcttctg gtcctcaatg cttgcaggta 1800
acaaagcacc agtggtctag tggtagaata gtaccctgcc acggtacaga cccgggttcg 1860
attcccggct ggtgcagcaa aacagcatag caagttaaaa taaggctagt ccgttatcaa 1920
cttgaaaaag tggcaccgag tcggtgcttt aacaaagcac cagtggtcta gtggtagaat 1980
agtaccctgc cacggtacag acccgggttc gattcccggc tggtgcannn nnnnnnnnnn 2040
nnnnnnngtt ttagagctat gctgttttga acaaagcacc agtggtctag tggtagaata 2100
gtaccctgcc acggtacaga cccgggttcg attcccggct ggtgcagcaa aacagcatag 2160
caagttaaaa taaggctagt ccgttatcaa cttgaaaaag tggcaccgag tcggtgcttt 2220
aacaaagcac cagtggtcta gtggtagaat agtaccctgc cacggtacag acccgggttc 2280
gattcccggc tggtgcannn nnnnnnnnnn nnnnnnngtt ttagagctat gctgttttga 2340
acaaagcacc agtggtctag tggtagaata gtaccctgcc acggtacaga cccgggttcg 2400
attcccggct ggtgcagatc gttcaaacat ttggcaataa agtttcttaa gattgaatcc 2460
tgttgccggt cttgcgatga ttatcatata atttctgttg aattacgtta agcatgtaat 2520
aattaacatg taatgcatga cgttatttat gagatgggtt tttatgatta gagtcccgca 2580
attatacatt taatacgcga tagaaaacaa aatatagcgc gcaaactagg ataaattatc 2640
gcgcgcggtg tcatctatgt tactagatc 2669
<210> 94
<211> 927
<212> DNA
<213> 人工序列
<220>
<223> 酿脓链球菌, 水稻
<220>
<221> 尚未归类的特征
<222> (608)..(627)
<223> n是a, c, g, 或t
<220>
<221> 尚未归类的特征
<222> (877)..(896)
<223> n是a, c, g, 或t
<400> 94
aaggaatctt taaacatacg aacagatcac ttaaagttct tctgaagcaa cttaaagtta 60
tcaggcatgc atggatcttg gaggaatcag atgtgcagtc agggaccata gcacaagaca 120
ggcgtcttct actggtgcta ccagcaaatg ctggaagccg ggaacactgg gtacgttgga 180
aaccacgtga tgtgaagaag taagataaac tgtaggagaa aagcatttcg tagtgggcca 240
tgaagccttt caggacatgt attgcagtat gggccggccc attacgcaat tggacgacaa 300
caaagactag tattagtacc acctcggcta tccacataga tcaaagctga tttaaaagag 360
ttgtgcagat gatccgtggc aacaaagcac cagtggtcta gtggtagaat agtaccctgc 420
cacggtacag acccgggttc gattcccggc tggtgcagca ccacagcata gcaagttaaa 480
ataaggctag tccgttatca acttgaaaaa gtggcaccga gtcggtgctt aacaaagcac 540
cagtggtcta gtggtagaat agtaccctgc cacggtacag acccgggttc gattcccggc 600
tggtgcannn nnnnnnnnnn nnnnnnngtt ttagagctat gctgtggtga acaaagcacc 660
agtggtctag tggtagaata gtaccctgcc acggtacaga cccgggttcg attcccggct 720
ggtgcagcac cacagcatag caagttaaaa taaggctagt ccgttatcaa cttgaaaaag 780
tggcaccgag tcggtgctta acaaagcacc agtggtctag tggtagaata gtaccctgcc 840
acggtacaga cccgggttcg attcccggct ggtgcannnn nnnnnnnnnn nnnnnngttt 900
tagagctatg ctgtggtgtt ttttttt 927
<210> 95
<211> 2669
<212> DNA
<213> 人工序列
<220>
<223> 酿脓链球菌, 甘蔗, 根癌
农杆菌
<220>
<221> 尚未归类的特征
<222> (2028)..(2047)
<223> n是a, c, g, 或t
<220>
<221> 尚未归类的特征
<222> (2298)..(2317)
<223> n是a, c, g, 或t
<400> 95
cattatgtgg tctaggtagg ttctatatat aagaaaactt gaaatgttct aaaaaaaaat 60
tcaagcccat gcatgattga agcaaacggt atagcaacgg tgttaacctg atctagtgat 120
ctcttgcaat ccttaacggc cacctaccgc aggtagcaaa cggcgtcccc ctcctcgata 180
tctccgcggc gacctctggc tttttccgcg gaattgcgcg gtggggacgg attccacgag 240
accgcgacgc aaccgcctct cgccgctggg ccccacaccg ctcggtgccg tagcctcacg 300
ggactctttc tccctcctcc cccgttataa attggcttca tcccctcctt gcctcatcca 360
tccaaatccc agtccccaat cccatccctt cgtaggagaa attcatcgaa gctaagcgaa 420
tcctcgcgat cctctcaagg tactgcgagt tttcgatccc cctctcgacc cctcgtatgt 480
ttgtgtttgt cgtagcgttt gattaggtat gctttccctg tttgtgttcg tcgtagcgtt 540
tgattaggta tgctttccct gttcgtgttc atcgtagtgt ttgattaggt cgtgtgaggc 600
gatggcctgc tcgcgtcctt cgatctgtag tcgatttgcg ggtcgtggtg tagatctgcg 660
ggctgtgatg aagttatttg gtgtgatctg ctcgcctgat tctgcgggtt ggctcgagta 720
gatatgatgg ttggaccggt tggttcgttt accgcgctag ggttgggctg ggatgatgtt 780
gcatgcgccg ttgcgcgtga tcccgcagca ggacttgcgt ttgattgcca gatctcgtta 840
cgattatgtg atttggtttg gactttttag atctgtagct tctgcttatg tgccagatgc 900
gcctactgct catatgcctg atgataatca taaatggctg tggaactaac tagttgattg 960
cggagtcatg tatcagctac aggtgtaggg actagctaca ggtgtaggga cttgcgtcta 1020
attgtttggt cctttactca tgttgcaatt atgcaattta gtttagattg tttgttccac 1080
tcatctaggc tgtaaaaggg acactgctta gattgctgtt taatcttttt agtagattat 1140
attatattgg taacttatta cccctattac atgccatacg tgacttctgc tcatgcctga 1200
tgataatcat agatcactgt ggaattaatt agttgattgt tgaatcatgt ttcatgtaca 1260
taccacggca caattgctta gttccttaac aaatgcaaat tttactgatc catgtatgat 1320
ttgcgtggtt ctctaatgtg aaatactata gctacttgtt agtaagaatc aggttcgtat 1380
gcttaatgct gtatgtgcct tctgctcatg cctgatgata atcatatatc actggaatta 1440
attagttgat cgtttaatca tatatcaagt acataccatg ccacaatttt tagtcactta 1500
acccatgcag attgaactgg tccctgcatg ttttgctaaa ttgttctatt ctgattagac 1560
catatatcat gtattttttt ttggtaatgg ttctcttatt ttaaatgcta tatagttctg 1620
gtacttgtta gaaagatctg cttcatagtt tagttgccta tccctcgaat taggatgctg 1680
agcagctgat cctatagctt tgtttcatgt atcaattctt ttgtgttcaa cagtcagttt 1740
ttgttagatt cattgtaact tatggtcgct tactcttctg gtcctcaatg cttgcaggta 1800
acaaagcacc agtggtctag tggtagaata gtaccctgcc acggtacaga cccgggttcg 1860
attcccggct ggtgcagcac cacagcatag caagttaaaa taaggctagt ccgttatcaa 1920
cttgaaaaag tggcaccgag tcggtgcttt aacaaagcac cagtggtcta gtggtagaat 1980
agtaccctgc cacggtacag acccgggttc gattcccggc tggtgcannn nnnnnnnnnn 2040
nnnnnnngtt ttagagctat gctgtggtga acaaagcacc agtggtctag tggtagaata 2100
gtaccctgcc acggtacaga cccgggttcg attcccggct ggtgcagcac cacagcatag 2160
caagttaaaa taaggctagt ccgttatcaa cttgaaaaag tggcaccgag tcggtgcttt 2220
aacaaagcac cagtggtcta gtggtagaat agtaccctgc cacggtacag acccgggttc 2280
gattcccggc tggtgcannn nnnnnnnnnn nnnnnnngtt ttagagctat gctgtggtga 2340
acaaagcacc agtggtctag tggtagaata gtaccctgcc acggtacaga cccgggttcg 2400
attcccggct ggtgcagatc gttcaaacat ttggcaataa agtttcttaa gattgaatcc 2460
tgttgccggt cttgcgatga ttatcatata atttctgttg aattacgtta agcatgtaat 2520
aattaacatg taatgcatga cgttatttat gagatgggtt tttatgatta gagtcccgca 2580
attatacatt taatacgcga tagaaaacaa aatatagcgc gcaaactagg ataaattatc 2640
gcgcgcggtg tcatctatgt tactagatc 2669
<210> 96
<211> 32
<212> RNA
<213> 人工序列
<220>
<223> 酿脓链球菌
<400> 96
ggaaccauuc aaaacagcau agcaaguuaa aa 32
<210> 97
<211> 32
<212> RNA
<213> 人工序列
<220>
<223> 酿脓链球菌
<400> 97
ggaaccauuc aaaacagcau agcaaguuaa ac 32
<210> 98
<211> 32
<212> RNA
<213> 人工序列
<220>
<223> 酿脓链球菌
<400> 98
ggaaccauuc aaaacagcau agcaaguuaa ca 32
<210> 99
<211> 32
<212> RNA
<213> 人工序列
<220>
<223> 酿脓链球菌
<400> 99
ggaaccauuc aaaacagcau agcaaguuac aa 32
<210> 100
<211> 32
<212> RNA
<213> 人工序列
<220>
<223> 酿脓链球菌
<400> 100
ggaaccauuc aaaacagcau agcaaguuca aa 32
<210> 101
<211> 32
<212> RNA
<213> 人工序列
<220>
<223> 酿脓链球菌
<400> 101
ggaaccauuc aaaacagcau agcaaguuua aa 32
<210> 102
<211> 32
<212> RNA
<213> 人工序列
<220>
<223> 酿脓链球菌
<400> 102
ggaaccauuc aaaacagcau agcaaguuga aa 32
<210> 103
<211> 32
<212> RNA
<213> 人工序列
<220>
<223> 酿脓链球菌
<400> 103
ggaaccauuc aaaacagcau agcaaguuaa aa 32
<210> 104
<211> 24
<212> RNA
<213> 人工序列
<220>
<223> 酿脓链球菌
<400> 104
gcaaaacagc auagcaaguu aaaa 24
<210> 105
<211> 70
<212> RNA
<213> 人工序列
<220>
<223> 酿脓链球菌
<400> 105
gcgguccccu uauugccuga caagcugagg gccacccugg aaccauucaa aacagcauag 60
caaguuaaaa 70
<210> 106
<211> 32
<212> RNA
<213> 人工序列
<220>
<223> 酿脓链球菌
<400> 106
ggaaccauuc accacagcau agcaaguuaa aa 32
<210> 107
<211> 24
<212> RNA
<213> 人工序列
<220>
<223> 酿脓链球菌
<400> 107
gcaccacagc auagcaaguu aaaa 24
<210> 108
<211> 24
<212> RNA
<213> 人工序列
<220>
<223> 酿脓链球菌
<400> 108
ggcccccggc guagcaaguu aaaa 24
<210> 109
<211> 53
<212> RNA
<213> 人工序列
<220>
<223> 酿脓链球菌
<400> 109
gagcucgagc uccccgggga gcucgagcuc caaaacagca uagcaaguua aaa 53
<210> 110
<211> 57
<212> RNA
<213> 人工序列
<220>
<223> 酿脓链球菌
<400> 110
gagcucgagc uccccuuucg gggagcucga gcuccaaaac agcauagcaa guuaaaa 57
<210> 111
<211> 4170
<212> DNA
<213> 人工序列
<220>
<223> 酿脓链球菌
<400> 111
atggacaaga agtacagcat cggcctggac atcggcacca acagcgtggg ctgggccgtg 60
atcaccgacg agtacaaggt gccgagcaag aagttcaagg tgctgggcaa caccgacagg 120
cacagcatca agaagaacct gatcggcgcc ctgctgttcg acagcggcga gaccgccgag 180
gccaccaggc tgaagaggac cgccaggagg aggtacacca ggaggaagaa caggatctgc 240
tacctgcagg agatcttcag caacgagatg gccaaggtgg acgacagctt cttccacagg 300
ctggaggaga gcttcctggt ggaggaggac aagaagcacg agaggcaccc gatcttcggc 360
aacatcgtgg acgaggtggc ctaccacgag aagtacccga ccatctacca cctgaggaag 420
aagctggtgg acagcaccga caaggccgac ctgaggctga tctacctggc cctggcccac 480
atgatcaagt tcaggggcca cttcctgatc gagggcgacc tgaacccgga caacagcgac 540
gtggacaagc tgttcatcca gctggtgcag acctacaacc agctgttcga ggagaacccg 600
atcaacgcca gcggcgtgga cgccaaggcc atcctgagcg ccaggctgag caagagcagg 660
aggctggaga acctgatcgc ccagctgccg ggcgagaaga agaacggcct gttcggcaac 720
ctgatcgccc tgagcctggg cctgaccccg aacttcaaga gcaacttcga cctggccgag 780
gacgccaagc tgcagctgag caaggacacc tacgacgacg acctggacaa cctgctggcc 840
cagatcggcg accagtacgc cgacctgttc ctggccgcca agaacctgag cgacgccatc 900
ctgctgagcg acatcctgag ggtgaacacc gagatcacca aggccccgct gagcgccagc 960
atgatcaaga ggtacgacga gcaccaccag gacctgaccc tgctgaaggc cctggtgagg 1020
cagcagctgc cggagaagta caaggagatc ttcttcgacc agagcaagaa cggctacgcc 1080
ggctacatcg acggcggcgc cagccaggag gagttctaca agttcatcaa gccgatcctg 1140
gagaagatgg acggcaccga ggagctgctg gtgaagctga acagggagga cctgctgagg 1200
aagcagagga ccttcgacaa cggcagcatc ccgcaccaga tccacctggg cgagctgcac 1260
gccatcctga ggaggcagga ggacttctac ccgttcctga aggacaacag ggagaagatc 1320
gagaagatcc tgaccttccg catcccgtac tacgtgggcc cgctggccag gggcaacagc 1380
aggttcgcct ggatgaccag gaagagcgag gagaccatca ccccgtggaa cttcgaggag 1440
gtggtggaca agggcgccag cgcccagagc ttcatcgaga ggatgaccaa cttcgacaag 1500
aacctgccga acgagaaggt gctgccgaag cacagcctgc tgtacgagta cttcaccgtg 1560
tacaacgagc tgaccaaggt gaagtacgtg accgagggca tgaggaagcc ggccttcctg 1620
agcggcgagc agaagaaggc catcgtggac ctgctgttca agaccaacag gaaggtgacc 1680
gtgaagcagc tgaaggagga ctacttcaag aagatcgagt gcttcgacag cgtggagatc 1740
agcggcgtgg aggacaggtt caacgccagc ctgggcacct accacgacct gctgaagatc 1800
atcaaggaca aggacttcct ggacaacgag gagaacgagg acatcctgga ggacatcgtg 1860
ctgaccctga ccctgttcga ggacagggag atgatcgagg agaggctgaa gacctacgcc 1920
cacctgttcg acgacaaggt gatgaagcag ctgaagagga ggaggtacac cggctggggc 1980
aggctgagca ggaagctgat caacggcatc agggacaagc agagcggcaa gaccatcctg 2040
gacttcctga agagcgacgg cttcgccaac aggaacttca tgcagctgat ccacgacgac 2100
agcctgacct tcaaggagga catccagaag gcccaggtga gcggccaggg cgacagcctg 2160
cacgagcaca tcgccaacct ggccggcagc ccggccatca agaagggcat cctgcagacc 2220
gtgaaggtgg tggacgagct ggtgaaggtg atgggcaggc acaagccgga gaacatcgtg 2280
atcgagatgg ccagggagaa ccagaccacc cagaagggcc agaagaacag cagggagagg 2340
atgaagagga tcgaggaggg catcaaggag ctgggcagcc agatcctgaa ggagcacccg 2400
gtggagaaca cccagctgca gaacgagaag ctgtacctgt actacctgca gaacggcagg 2460
gacatgtacg tggaccagga gctggacatc aacaggctga gcgactacga cgtggaccac 2520
atcgtgccgc agagcttcct gaaggacgac agcatcgaca acaaggtgct gaccaggagc 2580
gacaagaaca ggggcaagag cgacaacgtg ccgagcgagg aggtggtgaa gaagatgaaa 2640
aactactgga ggcagctgct gaacgccaag ctgatcaccc agaggaagtt cgacaacctg 2700
accaaggccg agaggggcgg cctgagcgag ctggacaagg ccggcttcat taaaaggcag 2760
ctggtggaga ccaggcagat caccaagcac gtggcccaga tcctggacag caggatgaac 2820
accaagtacg acgagaacga caagctgatc agggaggtga aggtgatcac cctgaagagc 2880
aagctggtga gcgacttcag gaaggacttc cagttctaca aggtgaggga gatcaataat 2940
taccaccacg cccacgacgc ctacctgaac gccgtggtgg gcaccgccct gattaaaaag 3000
tacccgaagc tggagagcga gttcgtgtac ggcgactaca aggtgtacga cgtgaggaag 3060
atgatcgcca agagcgagca ggagatcggc aaggccaccg ccaagtactt cttctacagc 3120
aacatcatga acttcttcaa gaccgagatc accctggcca acggcgagat caggaagagg 3180
ccgctgatcg agaccaacgg cgagaccggc gagatcgtgt gggacaaggg cagggacttc 3240
gccaccgtga ggaaggtgct gtccatgccg caggtgaaca tcgtgaagaa gaccgaggtg 3300
cagaccggcg gcttcagcaa ggagagcatc ctgccgaaga ggaacagcga caagctgatc 3360
gccaggaaga aggactggga tccgaagaag tacggcggct tcgacagccc gaccgtggcc 3420
tacagcgtgc tggtggtggc caaggtggag aagggcaaga gcaagaagct gaagagcgtg 3480
aaggagctgg tgggcatcac catcatggag aggagcagct tcgagaagaa cccagtggac 3540
ttcctggagg ccaagggcta caaggaggtg aagaaggacc tgatcattaa actgccgaag 3600
tacagcctgt tcgagctgga gaacggcagg aagaggatgc tggccagcgc cggcgagctg 3660
cagaagggca acgagctggc cctgccgagc aagtacgtga acttcctgta cctggccagc 3720
cactacgaga agctgaaggg cagcccggag gacaacgagc agaagcagct gttcgtggag 3780
cagcacaagc actacctgga cgagatcatc gagcagatca gcgagttcag caagagggtg 3840
atcctggccg acgccaacct ggacaaggtg ctgagcgcct acaacaagca cagggacaag 3900
ccgatcaggg agcaggccga gaacatcatc cacctgttca ccctgaccaa cctgggcgcc 3960
ccggccgcct tcaagtactt cgacaccacc atcgacagga agaggtacac cagcaccaag 4020
gaggtgctgg acgccaccct gatccaccag agcatcaccg gcctgtacga gaccaggatc 4080
gacctgagcc agctgggcgg cgacagcagc ccgccgaaga agaagaggaa ggtgagctgg 4140
aaggacgcca gcggctggag caggatgtga 4170
<210> 112
<211> 77
<212> DNA
<213> 人工序列
<220>
<223> 水稻
<400> 112
aacaaagcac cagtggtcta gtggtagaat agtaccctgc cacggtacag acccgggttc 60
gattcccggc tggtgca 77
<210> 113
<211> 42
<212> RNA
<213> 人工序列
<220>
<223> 酿脓链球菌
<220>
<221> 尚未归类的特征
<222> (1)..(20)
<223> n是a, c, g, 或u
<400> 113
nnnnnnnnnn nnnnnnnnnn guuuuagagc uaugcuguuu ug 42
<210> 114
<211> 85
<212> RNA
<213> 人工序列
<220>
<223> 酿脓链球菌
<400> 114
ggaaccauuc aaaacagcau agcaaguuaa aauaaggcua guccguuauc aacuugaaaa 60
aguggcaccg agucggugcu uuuuu 85
Claims (50)
1.一种包含crRNA分子及其相应tracrRNA分子的DNA靶向RNA双链体,其中所述crRNA分子和tracrRNA分子分别包含以下核酸序列:SEQ ID NO:55和56、SEQ ID NO:57和58、SEQ IDNO:59和60、SEQ ID NO:61和62、SEQ ID NO:63和64、SEQ ID NO:65和66、SEQ ID NO:67和68、SEQ ID NO:69和70、SEQ ID NO:71和72、SEQ ID NO:73和74、SEQ ID NO:75和76、SEQ IDNO:77和78、SEQ ID NO:79和80、SEQ ID NO:81和82、或SEQ ID NO:83和84,其中所述crRNA进一步包含DNA靶向区段,所述DNA靶向区段包含与靶DNA分子中的序列互补的核酸序列,由此所述DNA靶向RNA双链体靶向靶DNA序列并且与其杂交。
2.如权利要求1所述的DNA靶向RNA双链体,其中所述crRNA分子的DNA靶向区段包含长度为至少12个核苷酸,并且与靶DNA分子中的序列具有至少80%互补性的核酸序列。
3.如权利要求1所述的DNA靶向RNA双链体,其中所述crRNA分子及其相应tracrRNA分子的双链体形成区段分别包含以下核酸序列:SEQ ID NO:55和96、SEQ ID NO:57和97、SEQ IDNO:59和98、SEQ ID NO:61和99、SEQ ID NO:63和100、SEQ ID NO:65和101、SEQ ID NO:67和102、SEQ ID NO:69和103、SEQ ID NO:71和104、SEQ ID NO:73和105、SEQ ID NO:75和106、SEQ ID NO:77和107、SEQ ID NO:79和108、SEQ ID NO:81和109、或SEQ ID NO:83和110。
4.一种编码如权利要求1所述的crRNA或tracrRNA分子的DNA分子。
5.一种编码如权利要求1所述的crRNA分子和tracrRNA分子二者的DNA分子。
6.如权利要求4-5中任一项所述的DNA分子,其中所述crRNA分子及其相应tracrRNA分子由以下核酸序列编码,所述核酸序列分别包含SEQ ID NO:3和4、SEQ ID NO:5和6、SEQ IDNO:7和8、SEQ ID NO:9和10、SEQ ID NO:11和12、SEQ ID NO:13和14、SEQ ID NO:15和16、SEQ ID NO:17和18、SEQ ID NO:19和20、SEQ ID NO:21和22、SEQ ID NO:23和24、SEQ IDNO:28和29、SEQ ID NO:30和31、SEQ ID NO:32和33、或SEQ ID NO:34和35、或其互补序列,其中所述crRNA进一步包含DNA靶向区段,所述DNA靶向区段包含与靶DNA分子中的序列互补的核酸序列,由此所述DNA靶向RNA双链体靶向靶DNA序列并且与其杂交。
7.一种包含至少一个crRNA区段及其相应tracrRNA区段的RNA分子,其中这些区段可操作地连接在tRNA切割序列的5’和/或3’端,由此在tRNA切割后,所述crRNA和tracrRNA区段变成能够形成DNA靶向RNA双链体的分开并且不同的分子。
8.如权利要求7所述的RNA分子,其中所述分子包含处于串联排列的tRNA-crRNA-tRNA-tracrRNA或tRNA-tracrRNA-tRNA-crRNA。
9.如权利要求7所述的RNA分子,其中所述分子包含至少两个crRNA区段及其相应tracrRNA区段,其中所述区段可操作地连接在tRNA切割序列的5’和/或3’端。
10.如权利要求9所述的RNA分子,其中所述两个crRNA包含DNA靶向区段,所述DNA靶向区段是与不同靶DNA分子中的不同序列互补的核酸序列。
11.如权利要求7所述的RNA分子,其中所述crRNA区段及其相应tracrRNA区段中的至少一个分别包含以下核酸序列:SEQ ID NO:55和56、SEQ ID NO:57和58、SEQ ID NO:59和60、SEQ ID NO:61和62、SEQ ID NO:63和64、SEQ ID NO:65和66、SEQ ID NO:67和68、SEQ IDNO:69和70、SEQ ID NO:71和72、SEQ ID NO:73和74、SEQ ID NO:75和76、SEQ ID NO:77和78、SEQ ID NO:79和80、SEQ ID NO:81和82、或SEQ ID NO:83和84,其中所述crRNA进一步包含DNA靶向区段,所述DNA靶向区段包含与靶DNA序列中的序列互补的核酸序列。
12.如权利要求7-11中任一项所述的RNA分子,其中所述tRNA切割位点的核酸序列与SEQ ID NO:112具有至少90%同一性。
13.一种编码至少一个如权利要求7所述的RNA分子的核酸分子。
14.如权利要求13所述的核酸分子,其中所述RNA分子的表达是由RNA聚合酶II驱动的启动子驱动的。
15.如权利要求14所述的核酸分子,其中所述由RNA聚合酶II驱动的启动子的核酸序列与SEQ ID NO:85具有至少90%同一性。
16.如权利要求13所述的核酸分子,其中所述RNA分子的表达是由RNA聚合酶III驱动的启动子驱动的。
17.如权利要求16所述的核酸分子,其中所述由RNA聚合酶III驱动的启动子的核酸序列与SEQ ID NO:86具有至少90%同一性。
18.如权利要求13所述的核酸分子,其中一个RNA分子的表达是由RNA聚合酶II驱动的启动子驱动的,并且第二RNA分子的表达是由RNA聚合酶III驱动的启动子驱动的。
19.如权利要求13-18中任一项所述的核酸分子,其中存在两个表达盒,它们各自编码crRNA和相应tracrRNA分子。
20.如权利要求13-19中任一项所述的核酸分子,其中至少一个表达盒包含SEQ ID NO:87-95中任一个的序列。
21.一种用于靶向诱变的工程化的、非天然存在的系统,所述系统包含如权利要求1所述的DNA靶向RNA双链体,并且进一步包含定点修饰多肽,由此所述DNA靶向RNA双链体与所述定点修饰多肽相互作用,以形成复合物,其中所述复合物靶向靶DNA分子并且与其杂交,并且所述定点修饰多肽修饰靶DNA序列。
22.如权利要求21所述的用于靶向诱变的系统,其中至少一个crRNA分子、至少一个tracrRNA分子、和定点修饰多肽是在至少一个核酸分子内编码的,其中至少一个crRNA分子及其相应tracrRNA分子由以下核酸序列编码,所述核酸序列分别包含SEQ ID NO:3和4、SEQID NO:5和6、SEQ ID NO:7和8、SEQ ID NO:9和10、SEQ ID NO:11和12、SEQ ID NO:13和14、SEQ ID NO:15和16、SEQ ID NO:17和18、SEQ ID NO:19和20、SEQ ID NO:21和22、SEQ IDNO:23和24、SEQ ID NO:28和29、SEQ ID NO:30和31、SEQ ID NO:32和33、或SEQ ID NO:34和35、或其互补序列,其中所述crRNA进一步包含DNA靶向区段,所述DNA靶向区段包含与靶DNA序列中的序列互补的核酸序列,由此所述DNA靶向RNA双链体与所述定点修饰多肽相互作用以形成复合物,其中所述复合物靶向靶DNA分子并且与其杂交,并且所述定点修饰多肽修饰靶DNA序列。
23.如权利要求22所述的核酸分子,其中至少一个crRNA分子和至少一个tracrRNA分子在相同表达盒内编码,其中所述表达盒包含两个或更多个tRNA切割序列,由此在tRNA切割后,所述crRNA和tracrRNA分子是分开并且不同的分子。
24.一种靶DNA的位点特异性修饰的方法,所述方法包括:
使所述靶DNA与以下接触:
(i)DNA靶向RNA双链体、或编码其的DNA分子,其中所述DNA靶向RNA双链体是如权利要求1所述的DNA靶向RNA双链体;和
(ii)定点修饰多肽、或编码其的DNA分子,其中所述定点修饰多肽包含与DNA靶向RNA相互作用的RNA结合部分、和展现出定点酶活性的活性部分;
其中所述酶活性修饰所述靶DNA。
25.如权利要求24所述的方法,其中所述靶DNA是染色体外的。
26.如权利要求24所述的方法,其中所述靶DNA是染色体的一部分。
27.如权利要求26所述的方法,其中所述靶DNA是细胞中的染色体的一部分。
28.如权利要求25所述的方法,其中所述靶DNA是附加体或微染色体的一部分,或是在线粒体或叶绿体中。
29.如权利要求27所述的方法,其中所述细胞是真核细胞。
30.如权利要求24所述的方法,其中所述酶活性是核酸酶活性、甲基转移酶活性、脱甲基酶活性、DNA修复活性、DNA损伤活性、去氨基活性、歧化酶活性、烷基化活性、脱嘌呤活性、氧化活性、嘧啶二聚体形成活性、整合酶活性、转座酶活性、重组酶活性、聚合酶活性、连接酶活性、螺旋酶活性、光解酶活性或糖基化酶活性。
31.如权利要求30所述的方法,其中所述DNA修饰酶活性是核酸酶活性。
32.如权利要求31所述的方法,其中所述核酸酶在靶DNA中引入双链断裂。
33.如权利要求24-32中任一项所述的方法,其中所述接触发生在容许非同源末端连接或同源定向修复的条件下。
34.如权利要求24-33中任一项所述的方法,所述方法进一步包括使所述靶DNA分子与供体多核苷酸接触,其中所述供体多核苷酸、所述供体多核苷酸的一部分、或所述供体多核苷酸的拷贝、或所述供体多核苷酸的拷贝的一部分整合到所述靶DNA分子中。
35.如权利要求24-34中任一项所述的方法,其中所述定点修饰多肽是CRISPR相关核酸酶。
36.如权利要求35所述的方法,其中所述定点修饰多肽是任选地修饰的Cas9核酸酶。
37.如权利要求36所述的方法,其中所述Cas9核酸酶具有SEQ ID NO:39的氨基酸序列。
38.如权利要求24-37中任一项所述的方法,所述方法进一步包括向所述细胞中引入包含编码抗沉默多肽的核苷酸序列的另外的核酸分子。
39.如权利要求24-37中任一项所述的方法,所述方法进一步包括向所述细胞提供抗沉默多肽。
40.如权利要求24-39中任一项所述的方法,其中所述细胞是植物、真菌、或藻类细胞。
41.如权利要求40所述的方法,其中所述植物细胞是单子叶植物细胞。
42.如权利要求41所述的方法,其中所述植物细胞是玉蜀黍、水稻、高粱、甘蔗、大麦、小麦、燕麦、草皮草、或观赏草细胞。
43.如权利要求40所述的方法,其中所述植物细胞是双子叶植物细胞。
44.如权利要求43所述的方法,其中所述植物细胞是烟草、番茄、胡椒、茄子、向日葵、十字花科植物、亚麻、马铃薯、棉花、大豆、甜菜、或油菜细胞。
45.如权利要求24-44中任一项所述的方法,其中将包含所述DNA靶向RNA双链体和/或定点修饰多肽的分子递送到所述细胞。
46.如权利要求24-44中任一项所述的方法,其中将编码所述DNA靶向RNA双链体和/或定点修饰多肽的DNA分子引入所述细胞。
47.如权利要求46所述的方法,其中通过基因枪轰击将所述DNA分子引入所述细胞。
48.如权利要求46所述的方法,其中通过农杆菌介导的转化将所述DNA分子引入所述细胞。
49.一种产生包含靶DNA的位点特异性修饰的植物、植物部分或其子代的方法,所述方法包括从通过如权利要求40-48中任一项所述的方法产生的植物细胞再生植物。
50.一种通过如权利要求49所述的方法产生的、包含靶DNA的位点特异性修饰的植物、植物部分或其子代。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/CN2018/086365 WO2019213910A1 (en) | 2018-05-10 | 2018-05-10 | Methods and compositions for targeted editing of polynucleotides |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112105732A true CN112105732A (zh) | 2020-12-18 |
Family
ID=68467159
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201880093322.1A Pending CN112105732A (zh) | 2018-05-10 | 2018-05-10 | 用于多核苷酸的靶向编辑的方法和组合物 |
Country Status (9)
Country | Link |
---|---|
US (1) | US20210054367A1 (zh) |
EP (1) | EP3790976A4 (zh) |
JP (1) | JP2021522829A (zh) |
KR (1) | KR20210008381A (zh) |
CN (1) | CN112105732A (zh) |
AU (1) | AU2019267350A1 (zh) |
BR (1) | BR112020022745A2 (zh) |
PH (1) | PH12020551819A1 (zh) |
WO (2) | WO2019213910A1 (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2024245139A1 (en) * | 2023-05-26 | 2024-12-05 | Correctsequence Therapeutics (Shanghai) Co., Ltd | Gene editing systems and uses thereof |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2014089290A1 (en) * | 2012-12-06 | 2014-06-12 | Sigma-Aldrich Co. Llc | Crispr-based genome modification and regulation |
WO2015026883A1 (en) * | 2013-08-22 | 2015-02-26 | E. I. Du Pont De Nemours And Company | Plant genome modification using guide rna/cas endonuclease systems and methods of use |
CN104854241A (zh) * | 2012-05-25 | 2015-08-19 | 埃玛纽埃尔·沙尔庞捷 | 用于rna定向的靶dna修饰和用于rna定向的转录调节的方法和组合物 |
WO2016061481A1 (en) * | 2014-10-17 | 2016-04-21 | The Penn State Research Foundation | Methods and compositions for multiplex rna guided genome editing and other rna technologies |
Family Cites Families (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101597610B (zh) * | 2008-06-05 | 2012-11-21 | 中国科学院遗传与发育生物学研究所 | 直立密穗基因及其应用 |
JP5673918B2 (ja) * | 2010-03-11 | 2015-02-18 | 独立行政法人農業生物資源研究所 | 粒間スペースが長くなった形質転換植物 |
CN102174527B (zh) * | 2011-01-27 | 2013-10-30 | 中国科学院遗传与发育生物学研究所 | 直立密穗基因提高氮肥利用效率的新应用 |
US10448588B2 (en) * | 2013-03-15 | 2019-10-22 | Syngenta Participations Ag | Haploid induction compositions and methods for use therefor |
CN104450745A (zh) * | 2013-09-12 | 2015-03-25 | 北京大学 | 一种获得水稻指定基因突变体的方法及其应用 |
AU2014370416B2 (en) * | 2013-12-26 | 2021-03-11 | The General Hospital Corporation | Multiplex guide RNAs |
NZ765591A (en) * | 2014-06-23 | 2022-09-30 | Regeneron Pharma | Nuclease-mediated dna assembly |
WO2015200555A2 (en) * | 2014-06-25 | 2015-12-30 | Caribou Biosciences, Inc. | Rna modification to engineer cas9 activity |
EP3786296A1 (en) * | 2014-12-18 | 2021-03-03 | Integrated Dna Technologies, Inc. | Crispr-based compositions and methods of use |
CA2969151A1 (en) * | 2014-12-23 | 2016-06-30 | Syngenta Participations Ag | Methods and compositions for identifying and enriching for cells comprising site specific genomic modifications |
AU2016285724A1 (en) * | 2015-06-29 | 2017-11-16 | Ionis Pharmaceuticals, Inc. | Modified CRISPR RNA and modified single CRISPR RNA and uses thereof |
BR102016021980A2 (pt) * | 2015-10-05 | 2017-05-30 | Dow Agrosciences Llc | Genetically modified plants for improving cultural performance |
JP6923205B2 (ja) * | 2015-11-27 | 2021-08-18 | 国立大学法人神戸大学 | 標的化したdna配列の核酸塩基を特異的に変換する、単子葉植物のゲノム配列の変換方法、及びそれに用いる分子複合体 |
CN105349551B (zh) * | 2015-12-10 | 2019-07-02 | 山东大学 | 一种玉米mZmDEP基因和其表达抑制结构在玉米抗逆育种中的应用 |
IL260257B2 (en) * | 2015-12-28 | 2024-05-01 | Novartis Ag | Preparations and methods for the treatment of hemoglobinopathies |
US9896696B2 (en) * | 2016-02-15 | 2018-02-20 | Benson Hill Biosystems, Inc. | Compositions and methods for modifying genomes |
-
2018
- 2018-05-10 CN CN201880093322.1A patent/CN112105732A/zh active Pending
- 2018-05-10 WO PCT/CN2018/086365 patent/WO2019213910A1/en active Application Filing
-
2019
- 2019-04-30 AU AU2019267350A patent/AU2019267350A1/en not_active Withdrawn
- 2019-04-30 US US17/052,210 patent/US20210054367A1/en not_active Abandoned
- 2019-04-30 JP JP2020563676A patent/JP2021522829A/ja not_active Ceased
- 2019-04-30 WO PCT/US2019/029891 patent/WO2019217146A1/en active Application Filing
- 2019-04-30 BR BR112020022745-5A patent/BR112020022745A2/pt not_active IP Right Cessation
- 2019-04-30 EP EP19799692.9A patent/EP3790976A4/en not_active Withdrawn
- 2019-04-30 KR KR1020207035024A patent/KR20210008381A/ko not_active Withdrawn
-
2020
- 2020-10-30 PH PH12020551819A patent/PH12020551819A1/en unknown
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104854241A (zh) * | 2012-05-25 | 2015-08-19 | 埃玛纽埃尔·沙尔庞捷 | 用于rna定向的靶dna修饰和用于rna定向的转录调节的方法和组合物 |
WO2014089290A1 (en) * | 2012-12-06 | 2014-06-12 | Sigma-Aldrich Co. Llc | Crispr-based genome modification and regulation |
WO2015026883A1 (en) * | 2013-08-22 | 2015-02-26 | E. I. Du Pont De Nemours And Company | Plant genome modification using guide rna/cas endonuclease systems and methods of use |
WO2016061481A1 (en) * | 2014-10-17 | 2016-04-21 | The Penn State Research Foundation | Methods and compositions for multiplex rna guided genome editing and other rna technologies |
Also Published As
Publication number | Publication date |
---|---|
BR112020022745A2 (pt) | 2021-03-02 |
AU2019267350A1 (en) | 2020-11-12 |
EP3790976A1 (en) | 2021-03-17 |
EP3790976A4 (en) | 2022-08-10 |
JP2021522829A (ja) | 2021-09-02 |
PH12020551819A1 (en) | 2021-07-26 |
US20210054367A1 (en) | 2021-02-25 |
WO2019217146A1 (en) | 2019-11-14 |
WO2019213910A1 (en) | 2019-11-14 |
KR20210008381A (ko) | 2021-01-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11702667B2 (en) | Methods and compositions for multiplex RNA guided genome editing and other RNA technologies | |
EP3110945B1 (en) | Compositions and methods for site directed genomic modification | |
EP3601579B1 (en) | Expression modulating elements and use thereof | |
US20220010322A1 (en) | Gene silencing via genome editing | |
US20250129367A1 (en) | Methods and compositions for targeted genomic insertion | |
WO2021061507A1 (en) | Methods and compositions for dna base editing | |
CN112105732A (zh) | 用于多核苷酸的靶向编辑的方法和组合物 | |
JP7545985B2 (ja) | 天然miRNAのゲノム編集による標的遺伝子発現の抑制 | |
EP4534678A2 (en) | Targeted insertion sites in the maize genome |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20201218 |
|
WD01 | Invention patent application deemed withdrawn after publication |