CN113227367B - 用cas12a蛋白进行基因组工程的组合物和方法 - Google Patents
用cas12a蛋白进行基因组工程的组合物和方法 Download PDFInfo
- Publication number
- CN113227367B CN113227367B CN201980066655.XA CN201980066655A CN113227367B CN 113227367 B CN113227367 B CN 113227367B CN 201980066655 A CN201980066655 A CN 201980066655A CN 113227367 B CN113227367 B CN 113227367B
- Authority
- CN
- China
- Prior art keywords
- tag
- cas12a
- mgcas12a
- sequence
- seq
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 108700004991 Cas12a Proteins 0.000 title claims abstract description 311
- 238000000034 method Methods 0.000 title claims abstract description 127
- 239000000203 mixture Substances 0.000 title claims description 135
- 238000010362 genome editing Methods 0.000 title claims description 57
- 150000007523 nucleic acids Chemical class 0.000 claims abstract description 161
- 238000003776 cleavage reaction Methods 0.000 claims description 141
- 230000007017 scission Effects 0.000 claims description 141
- 108091028043 Nucleic acid sequence Proteins 0.000 claims description 140
- 108020005004 Guide RNA Proteins 0.000 claims description 99
- 125000003729 nucleotide group Chemical group 0.000 claims description 90
- 239000002773 nucleotide Substances 0.000 claims description 89
- 108090000765 processed proteins & peptides Proteins 0.000 claims description 65
- 229920001184 polypeptide Polymers 0.000 claims description 64
- 102000004196 processed proteins & peptides Human genes 0.000 claims description 64
- 239000000872 buffer Substances 0.000 claims description 59
- 108091003079 Bovine Serum Albumin Proteins 0.000 claims description 51
- 229940098773 bovine serum albumin Drugs 0.000 claims description 50
- 241000282414 Homo sapiens Species 0.000 claims description 44
- 150000001413 amino acids Chemical group 0.000 claims description 43
- OWMVSZAMULFTJU-UHFFFAOYSA-N bis-tris Chemical compound OCCN(CCO)C(CO)(CO)CO OWMVSZAMULFTJU-UHFFFAOYSA-N 0.000 claims description 38
- UMSVPCYSAUKCAZ-UHFFFAOYSA-N propane;hydrochloride Chemical compound Cl.CCC UMSVPCYSAUKCAZ-UHFFFAOYSA-N 0.000 claims description 37
- 108010040467 CRISPR-Associated Proteins Proteins 0.000 claims description 35
- 101000860092 Francisella tularensis subsp. novicida (strain U112) CRISPR-associated endonuclease Cas12a Proteins 0.000 claims description 33
- 238000000746 purification Methods 0.000 claims description 29
- 230000000295 complement effect Effects 0.000 claims description 27
- 230000002441 reversible effect Effects 0.000 claims description 24
- 102100036279 DNA (cytosine-5)-methyltransferase 1 Human genes 0.000 claims description 22
- 102100035875 C-C chemokine receptor type 5 Human genes 0.000 claims description 17
- 101710149870 C-C chemokine receptor type 5 Proteins 0.000 claims description 17
- 239000000546 pharmaceutical excipient Substances 0.000 claims description 16
- 108010009540 DNA (Cytosine-5-)-Methyltransferase 1 Proteins 0.000 claims description 14
- 230000027455 binding Effects 0.000 claims description 14
- COLNVLDHVKWLRT-QMMMGPOBSA-N L-phenylalanine Chemical compound OC(=O)[C@@H](N)CC1=CC=CC=C1 COLNVLDHVKWLRT-QMMMGPOBSA-N 0.000 claims description 13
- COLNVLDHVKWLRT-UHFFFAOYSA-N phenylalanine Natural products OC(=O)C(N)CC1=CC=CC=C1 COLNVLDHVKWLRT-UHFFFAOYSA-N 0.000 claims description 11
- 241000120506 Bluetongue virus Species 0.000 claims description 9
- 102100025064 Cellular tumor antigen p53 Human genes 0.000 claims description 9
- 101150029707 ERBB2 gene Proteins 0.000 claims description 9
- 241000701867 Enterobacteria phage T7 Species 0.000 claims description 9
- KOSRFJWDECSPRO-WDSKDSINSA-N Glu-Glu Chemical compound OC(=O)CC[C@H](N)C(=O)N[C@@H](CCC(O)=O)C(O)=O KOSRFJWDECSPRO-WDSKDSINSA-N 0.000 claims description 9
- 102100023823 Homeobox protein EMX1 Human genes 0.000 claims description 9
- 101000721661 Homo sapiens Cellular tumor antigen p53 Proteins 0.000 claims description 9
- 101001048956 Homo sapiens Homeobox protein EMX1 Proteins 0.000 claims description 9
- 101100063433 Pisum sativum DIM gene Proteins 0.000 claims description 9
- 229920000805 Polyaspartic acid Polymers 0.000 claims description 9
- 101800004937 Protein C Proteins 0.000 claims description 9
- 101800001700 Saposin-D Proteins 0.000 claims description 9
- 102400000827 Saposin-D Human genes 0.000 claims description 9
- KOSRFJWDECSPRO-UHFFFAOYSA-N alpha-L-glutamyl-L-glutamic acid Natural products OC(=O)CCC(N)C(=O)NC(CCC(O)=O)C(O)=O KOSRFJWDECSPRO-UHFFFAOYSA-N 0.000 claims description 9
- 108010055341 glutamyl-glutamic acid Proteins 0.000 claims description 9
- 239000003446 ligand Substances 0.000 claims description 9
- 229920000724 poly(L-arginine) polymer Polymers 0.000 claims description 9
- 108010011110 polyarginine Proteins 0.000 claims description 9
- 108010064470 polyaspartate Proteins 0.000 claims description 9
- 108010077051 polycysteine Proteins 0.000 claims description 9
- 229960000856 protein c Drugs 0.000 claims description 9
- 101800005109 Triakontatetraneuropeptide Proteins 0.000 claims description 8
- NMEHNETUFHBYEG-IHKSMFQHSA-N tttn Chemical compound C([C@@H](C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC=1NC=NC=1)C(=O)N[C@@H](CC=1C=CC=CC=1)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(=O)NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N1[C@@H](CCC1)C(=O)NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(O)=O)NC(=O)[C@H](CC(C)C)NC(=O)[C@H](CCSC)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](NC(=O)[C@H]1N(CCC1)C(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)[C@@H](C)O)[C@@H](C)O)C1=CC=CC=C1 NMEHNETUFHBYEG-IHKSMFQHSA-N 0.000 claims description 8
- 108091028113 Trans-activating crRNA Proteins 0.000 claims description 7
- 102000039446 nucleic acids Human genes 0.000 abstract description 11
- 108020004707 nucleic acids Proteins 0.000 abstract description 11
- 108020004414 DNA Proteins 0.000 description 361
- 102000053602 DNA Human genes 0.000 description 258
- 108090000623 proteins and genes Proteins 0.000 description 158
- 210000004027 cell Anatomy 0.000 description 147
- 102000004169 proteins and genes Human genes 0.000 description 137
- 235000018102 proteins Nutrition 0.000 description 131
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 77
- 239000004472 Lysine Substances 0.000 description 76
- 238000006243 chemical reaction Methods 0.000 description 76
- 239000000047 product Substances 0.000 description 73
- 206010028980 Neoplasm Diseases 0.000 description 66
- 201000011510 cancer Diseases 0.000 description 54
- 101710163270 Nuclease Proteins 0.000 description 41
- 239000000758 substrate Substances 0.000 description 41
- 125000003588 lysine group Chemical group [H]N([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])(N([H])[H])C(*)=O 0.000 description 40
- 230000000694 effects Effects 0.000 description 39
- 239000000243 solution Substances 0.000 description 37
- 239000000499 gel Substances 0.000 description 36
- 238000011534 incubation Methods 0.000 description 23
- 102000004389 Ribonucleoproteins Human genes 0.000 description 22
- 108010081734 Ribonucleoproteins Proteins 0.000 description 22
- 239000013612 plasmid Substances 0.000 description 22
- 201000010536 head and neck cancer Diseases 0.000 description 21
- 208000014829 head and neck neoplasm Diseases 0.000 description 21
- 238000000338 in vitro Methods 0.000 description 21
- 210000001938 protoplast Anatomy 0.000 description 21
- 238000003556 assay Methods 0.000 description 20
- 238000001502 gel electrophoresis Methods 0.000 description 19
- 230000008685 targeting Effects 0.000 description 19
- 150000001768 cations Chemical class 0.000 description 18
- 108010042407 Endonucleases Proteins 0.000 description 17
- 102000004533 Endonucleases Human genes 0.000 description 17
- 208000003174 Brain Neoplasms Diseases 0.000 description 16
- 241000196324 Embryophyta Species 0.000 description 16
- 241000207746 Nicotiana benthamiana Species 0.000 description 16
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 15
- 238000005065 mining Methods 0.000 description 15
- 206010006187 Breast cancer Diseases 0.000 description 13
- 208000026310 Breast neoplasm Diseases 0.000 description 13
- 206010009944 Colon cancer Diseases 0.000 description 13
- 241000209094 Oryza Species 0.000 description 13
- 235000007164 Oryza sativa Nutrition 0.000 description 13
- 208000005718 Stomach Neoplasms Diseases 0.000 description 13
- 125000000539 amino acid group Chemical group 0.000 description 13
- 206010017758 gastric cancer Diseases 0.000 description 13
- 235000009566 rice Nutrition 0.000 description 13
- 201000011549 stomach cancer Diseases 0.000 description 13
- 208000001333 Colorectal Neoplasms Diseases 0.000 description 12
- TWRXJAOTZQYOKJ-UHFFFAOYSA-L Magnesium chloride Chemical compound [Mg+2].[Cl-].[Cl-] TWRXJAOTZQYOKJ-UHFFFAOYSA-L 0.000 description 12
- 239000012634 fragment Substances 0.000 description 12
- 102000004190 Enzymes Human genes 0.000 description 11
- 108090000790 Enzymes Proteins 0.000 description 11
- 206010039491 Sarcoma Diseases 0.000 description 11
- 229940088598 enzyme Drugs 0.000 description 11
- 208000020816 lung neoplasm Diseases 0.000 description 11
- 206010005949 Bone cancer Diseases 0.000 description 10
- 208000018084 Bone neoplasm Diseases 0.000 description 10
- 208000003445 Mouth Neoplasms Diseases 0.000 description 10
- 208000000453 Skin Neoplasms Diseases 0.000 description 10
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 10
- 208000021712 Soft tissue sarcoma Diseases 0.000 description 10
- 235000001014 amino acid Nutrition 0.000 description 10
- 229940024606 amino acid Drugs 0.000 description 10
- 208000014018 liver neoplasm Diseases 0.000 description 10
- 230000035772 mutation Effects 0.000 description 10
- 229920001223 polyethylene glycol Polymers 0.000 description 10
- 201000000849 skin cancer Diseases 0.000 description 10
- 241001408449 Asca Species 0.000 description 9
- FBPFZTCFMRRESA-KVTDHHQDSA-N D-Mannitol Chemical compound OC[C@@H](O)[C@@H](O)[C@H](O)[C@H](O)CO FBPFZTCFMRRESA-KVTDHHQDSA-N 0.000 description 9
- 206010058467 Lung neoplasm malignant Diseases 0.000 description 9
- 229930195725 Mannitol Natural products 0.000 description 9
- 101100219625 Mus musculus Casd1 gene Proteins 0.000 description 9
- -1 cas1B Proteins 0.000 description 9
- 101150055766 cat gene Proteins 0.000 description 9
- 208000012987 lip and oral cavity carcinoma Diseases 0.000 description 9
- 201000007270 liver cancer Diseases 0.000 description 9
- 201000005202 lung cancer Diseases 0.000 description 9
- 239000000594 mannitol Substances 0.000 description 9
- 235000010355 mannitol Nutrition 0.000 description 9
- 108091033409 CRISPR Proteins 0.000 description 8
- 208000000461 Esophageal Neoplasms Diseases 0.000 description 8
- 101000931098 Homo sapiens DNA (cytosine-5)-methyltransferase 1 Proteins 0.000 description 8
- 241000080590 Niso Species 0.000 description 8
- 206010030155 Oesophageal carcinoma Diseases 0.000 description 8
- 206010061902 Pancreatic neoplasm Diseases 0.000 description 8
- 208000002495 Uterine Neoplasms Diseases 0.000 description 8
- 230000008901 benefit Effects 0.000 description 8
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 8
- 201000004101 esophageal cancer Diseases 0.000 description 8
- 206010023841 laryngeal neoplasm Diseases 0.000 description 8
- 208000015486 malignant pancreatic neoplasm Diseases 0.000 description 8
- 201000001441 melanoma Diseases 0.000 description 8
- 201000002528 pancreatic cancer Diseases 0.000 description 8
- 208000008443 pancreatic carcinoma Diseases 0.000 description 8
- 239000000523 sample Substances 0.000 description 8
- 238000012163 sequencing technique Methods 0.000 description 8
- 238000004088 simulation Methods 0.000 description 8
- 238000001890 transfection Methods 0.000 description 8
- 206010046766 uterine cancer Diseases 0.000 description 8
- 206010005003 Bladder cancer Diseases 0.000 description 7
- 208000022072 Gallbladder Neoplasms Diseases 0.000 description 7
- 206010023825 Laryngeal cancer Diseases 0.000 description 7
- 208000000821 Parathyroid Neoplasms Diseases 0.000 description 7
- 208000024770 Thyroid neoplasm Diseases 0.000 description 7
- 208000007097 Urinary Bladder Neoplasms Diseases 0.000 description 7
- 238000001042 affinity chromatography Methods 0.000 description 7
- 201000010175 gallbladder cancer Diseases 0.000 description 7
- 208000026045 malignant tumor of parathyroid gland Diseases 0.000 description 7
- 230000035484 reaction time Effects 0.000 description 7
- 201000002510 thyroid cancer Diseases 0.000 description 7
- 201000005112 urinary bladder cancer Diseases 0.000 description 7
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 6
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 6
- 206010025323 Lymphomas Diseases 0.000 description 6
- 206010062129 Tongue neoplasm Diseases 0.000 description 6
- 201000006491 bone marrow cancer Diseases 0.000 description 6
- 201000007455 central nervous system cancer Diseases 0.000 description 6
- 208000025997 central nervous system neoplasm Diseases 0.000 description 6
- RAXXELZNTBOGNW-UHFFFAOYSA-N imidazole Natural products C1=CNC=N1 RAXXELZNTBOGNW-UHFFFAOYSA-N 0.000 description 6
- 229910001629 magnesium chloride Inorganic materials 0.000 description 6
- 238000006467 substitution reaction Methods 0.000 description 6
- 201000006134 tongue cancer Diseases 0.000 description 6
- 210000004881 tumor cell Anatomy 0.000 description 6
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 6
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 5
- 108091093088 Amplicon Proteins 0.000 description 5
- 238000010453 CRISPR/Cas method Methods 0.000 description 5
- 108020004705 Codon Proteins 0.000 description 5
- 241001112690 Eubacteriaceae Species 0.000 description 5
- 235000003228 Lactuca sativa Nutrition 0.000 description 5
- 238000004458 analytical method Methods 0.000 description 5
- 210000003169 central nervous system Anatomy 0.000 description 5
- 238000005119 centrifugation Methods 0.000 description 5
- 238000010586 diagram Methods 0.000 description 5
- 201000010099 disease Diseases 0.000 description 5
- 239000000463 material Substances 0.000 description 5
- 239000013642 negative control Substances 0.000 description 5
- 201000008968 osteosarcoma Diseases 0.000 description 5
- 239000011780 sodium chloride Substances 0.000 description 5
- 208000031261 Acute myeloid leukaemia Diseases 0.000 description 4
- WHUUTDBJXJRKMK-UHFFFAOYSA-N Glutamic acid Natural products OC(=O)C(N)CCC(O)=O WHUUTDBJXJRKMK-UHFFFAOYSA-N 0.000 description 4
- 206010061252 Intraocular melanoma Diseases 0.000 description 4
- CKLJMWTZIZZHCS-REOHCLBHSA-N L-aspartic acid Chemical compound OC(=O)[C@@H](N)CC(O)=O CKLJMWTZIZZHCS-REOHCLBHSA-N 0.000 description 4
- AGPKZVBTJJNPAG-WHFBIAKZSA-N L-isoleucine Chemical compound CC[C@H](C)[C@H](N)C(O)=O AGPKZVBTJJNPAG-WHFBIAKZSA-N 0.000 description 4
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 description 4
- OUYCCCASQSFEME-QMMMGPOBSA-N L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-QMMMGPOBSA-N 0.000 description 4
- 241000208822 Lactuca Species 0.000 description 4
- 208000033776 Myeloid Acute Leukemia Diseases 0.000 description 4
- 208000034176 Neoplasms, Germ Cell and Embryonal Diseases 0.000 description 4
- PXHVJJICTQNCMI-UHFFFAOYSA-N Nickel Chemical compound [Ni] PXHVJJICTQNCMI-UHFFFAOYSA-N 0.000 description 4
- 201000005969 Uveal melanoma Diseases 0.000 description 4
- KZSNJWFQEVHDMF-UHFFFAOYSA-N Valine Natural products CC(C)C(N)C(O)=O KZSNJWFQEVHDMF-UHFFFAOYSA-N 0.000 description 4
- 101150059443 cas12a gene Proteins 0.000 description 4
- 230000001747 exhibiting effect Effects 0.000 description 4
- ZDXPYRJPNDTMRX-UHFFFAOYSA-N glutamine Natural products OC(=O)C(N)CCC(N)=O ZDXPYRJPNDTMRX-UHFFFAOYSA-N 0.000 description 4
- 201000005787 hematologic cancer Diseases 0.000 description 4
- 208000024200 hematopoietic and lymphoid system neoplasm Diseases 0.000 description 4
- 201000002575 ocular melanoma Diseases 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 239000007787 solid Substances 0.000 description 4
- 239000006228 supernatant Substances 0.000 description 4
- 208000024891 symptom Diseases 0.000 description 4
- 102000036365 BRCA1 Human genes 0.000 description 3
- 108700020463 BRCA1 Proteins 0.000 description 3
- 101150072950 BRCA1 gene Proteins 0.000 description 3
- 108010059892 Cellulase Proteins 0.000 description 3
- 241000588724 Escherichia coli Species 0.000 description 3
- 101100326871 Escherichia coli (strain K12) ygbF gene Proteins 0.000 description 3
- 208000006168 Ewing Sarcoma Diseases 0.000 description 3
- 208000007766 Kaposi sarcoma Diseases 0.000 description 3
- DCXYFEDJOCDNAF-REOHCLBHSA-N L-asparagine Chemical compound OC(=O)[C@@H](N)CC(N)=O DCXYFEDJOCDNAF-REOHCLBHSA-N 0.000 description 3
- 208000006644 Malignant Fibrous Histiocytoma Diseases 0.000 description 3
- 206010061535 Ovarian neoplasm Diseases 0.000 description 3
- 229920001030 Polyethylene Glycol 4000 Polymers 0.000 description 3
- 108020004682 Single-Stranded DNA Proteins 0.000 description 3
- 208000024313 Testicular Neoplasms Diseases 0.000 description 3
- 235000003704 aspartic acid Nutrition 0.000 description 3
- 239000011324 bead Substances 0.000 description 3
- OQFSQFPPLPISGP-UHFFFAOYSA-N beta-carboxyaspartic acid Natural products OC(=O)C(N)C(C(O)=O)C(O)=O OQFSQFPPLPISGP-UHFFFAOYSA-N 0.000 description 3
- 230000015572 biosynthetic process Effects 0.000 description 3
- 210000000601 blood cell Anatomy 0.000 description 3
- 210000000988 bone and bone Anatomy 0.000 description 3
- 210000002798 bone marrow cell Anatomy 0.000 description 3
- 101150117416 cas2 gene Proteins 0.000 description 3
- 229940106157 cellulase Drugs 0.000 description 3
- 208000035475 disorder Diseases 0.000 description 3
- 230000034431 double-strand break repair via homologous recombination Effects 0.000 description 3
- 239000001257 hydrogen Substances 0.000 description 3
- 229910052739 hydrogen Inorganic materials 0.000 description 3
- 210000003026 hypopharynx Anatomy 0.000 description 3
- 238000007918 intramuscular administration Methods 0.000 description 3
- 238000001990 intravenous administration Methods 0.000 description 3
- 210000003734 kidney Anatomy 0.000 description 3
- 239000002609 medium Substances 0.000 description 3
- 238000002156 mixing Methods 0.000 description 3
- 230000006780 non-homologous end joining Effects 0.000 description 3
- 238000002360 preparation method Methods 0.000 description 3
- 238000002864 sequence alignment Methods 0.000 description 3
- 238000007920 subcutaneous administration Methods 0.000 description 3
- 238000003786 synthesis reaction Methods 0.000 description 3
- 230000001225 therapeutic effect Effects 0.000 description 3
- 239000013598 vector Substances 0.000 description 3
- 239000013603 viral vector Substances 0.000 description 3
- GUAHPAJOXVYFON-ZETCQYMHSA-N (8S)-8-amino-7-oxononanoic acid zwitterion Chemical compound C[C@H](N)C(=O)CCCCCC(O)=O GUAHPAJOXVYFON-ZETCQYMHSA-N 0.000 description 2
- JKMHFZQWWAIEOD-UHFFFAOYSA-N 2-[4-(2-hydroxyethyl)piperazin-1-yl]ethanesulfonic acid Chemical compound OCC[NH+]1CCN(CCS([O-])(=O)=O)CC1 JKMHFZQWWAIEOD-UHFFFAOYSA-N 0.000 description 2
- QKNYBSVHEMOAJP-UHFFFAOYSA-N 2-amino-2-(hydroxymethyl)propane-1,3-diol;hydron;chloride Chemical compound Cl.OCC(N)(CO)CO QKNYBSVHEMOAJP-UHFFFAOYSA-N 0.000 description 2
- KDCGOANMDULRCW-UHFFFAOYSA-N 7H-purine Chemical compound N1=CNC2=NC=NC2=C1 KDCGOANMDULRCW-UHFFFAOYSA-N 0.000 description 2
- 239000004475 Arginine Substances 0.000 description 2
- DCXYFEDJOCDNAF-UHFFFAOYSA-N Asparagine Natural products OC(=O)C(N)CC(N)=O DCXYFEDJOCDNAF-UHFFFAOYSA-N 0.000 description 2
- 208000032791 BCR-ABL1 positive chronic myelogenous leukemia Diseases 0.000 description 2
- UXVMQQNJUSDDNG-UHFFFAOYSA-L Calcium chloride Chemical compound [Cl-].[Cl-].[Ca+2] UXVMQQNJUSDDNG-UHFFFAOYSA-L 0.000 description 2
- 206010007953 Central nervous system lymphoma Diseases 0.000 description 2
- 241001478240 Coccus Species 0.000 description 2
- 238000007400 DNA extraction Methods 0.000 description 2
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 description 2
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 description 2
- 108010008532 Deoxyribonuclease I Proteins 0.000 description 2
- 102000007260 Deoxyribonuclease I Human genes 0.000 description 2
- 239000006144 Dulbecco’s modified Eagle's medium Substances 0.000 description 2
- 101100438439 Escherichia coli (strain K12) ygbT gene Proteins 0.000 description 2
- 241000186394 Eubacterium Species 0.000 description 2
- 208000017259 Extragonadal germ cell tumor Diseases 0.000 description 2
- 241000589602 Francisella tularensis Species 0.000 description 2
- 239000004471 Glycine Substances 0.000 description 2
- 239000007995 HEPES buffer Substances 0.000 description 2
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 description 2
- FFEARJCKVFRZRR-BYPYZUCNSA-N L-methionine Chemical compound CSCC[C@H](N)C(O)=O FFEARJCKVFRZRR-BYPYZUCNSA-N 0.000 description 2
- QIVBCDIJIAJPQS-VIFPVBQESA-N L-tryptophane Chemical compound C1=CC=C2C(C[C@H](N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-VIFPVBQESA-N 0.000 description 2
- KZSNJWFQEVHDMF-BYPYZUCNSA-N L-valine Chemical compound CC(C)[C@H](N)C(O)=O KZSNJWFQEVHDMF-BYPYZUCNSA-N 0.000 description 2
- 241001112693 Lachnospiraceae Species 0.000 description 2
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 description 2
- 206010062038 Lip neoplasm Diseases 0.000 description 2
- 241000124008 Mammalia Species 0.000 description 2
- 206010027406 Mesothelioma Diseases 0.000 description 2
- 241001465754 Metazoa Species 0.000 description 2
- 208000034578 Multiple myelomas Diseases 0.000 description 2
- 201000007224 Myeloproliferative neoplasm Diseases 0.000 description 2
- 206010028767 Nasal sinus cancer Diseases 0.000 description 2
- 208000001894 Nasopharyngeal Neoplasms Diseases 0.000 description 2
- 206010061306 Nasopharyngeal cancer Diseases 0.000 description 2
- 241000208125 Nicotiana Species 0.000 description 2
- 235000002637 Nicotiana tabacum Nutrition 0.000 description 2
- 206010031096 Oropharyngeal cancer Diseases 0.000 description 2
- 206010057444 Oropharyngeal neoplasm Diseases 0.000 description 2
- 206010033128 Ovarian cancer Diseases 0.000 description 2
- 238000010222 PCR analysis Methods 0.000 description 2
- 206010061332 Paraganglion neoplasm Diseases 0.000 description 2
- 206010035226 Plasma cell myeloma Diseases 0.000 description 2
- 208000007452 Plasmacytoma Diseases 0.000 description 2
- ONIBWKKTOPOVIA-UHFFFAOYSA-N Proline Natural products OC(=O)C1CCCN1 ONIBWKKTOPOVIA-UHFFFAOYSA-N 0.000 description 2
- 238000011529 RT qPCR Methods 0.000 description 2
- 208000015634 Rectal Neoplasms Diseases 0.000 description 2
- 201000000582 Retinoblastoma Diseases 0.000 description 2
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 description 2
- 206010043276 Teratoma Diseases 0.000 description 2
- 206010057644 Testis cancer Diseases 0.000 description 2
- 101100329497 Thermoproteus tenax (strain ATCC 35583 / DSM 2078 / JCM 9277 / NBRC 100435 / Kra 1) cas2 gene Proteins 0.000 description 2
- AYFVYJQAPQTCCC-UHFFFAOYSA-N Threonine Natural products CC(O)C(N)C(O)=O AYFVYJQAPQTCCC-UHFFFAOYSA-N 0.000 description 2
- 239000004473 Threonine Substances 0.000 description 2
- QIVBCDIJIAJPQS-UHFFFAOYSA-N Tryptophan Natural products C1=CC=C2C(CC(N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-UHFFFAOYSA-N 0.000 description 2
- 108010065282 UDP xylose-protein xylosyltransferase Proteins 0.000 description 2
- 102000010199 Xylosyltransferases Human genes 0.000 description 2
- 230000002159 abnormal effect Effects 0.000 description 2
- 208000020990 adrenal cortex carcinoma Diseases 0.000 description 2
- 208000007128 adrenocortical carcinoma Diseases 0.000 description 2
- 235000004279 alanine Nutrition 0.000 description 2
- ODKSFYDXXFIFQN-UHFFFAOYSA-N arginine Natural products OC(=O)C(N)CCCNC(N)=N ODKSFYDXXFIFQN-UHFFFAOYSA-N 0.000 description 2
- 125000000637 arginyl group Chemical group N[C@@H](CCCNC(N)=N)C(=O)* 0.000 description 2
- 235000009582 asparagine Nutrition 0.000 description 2
- 229960001230 asparagine Drugs 0.000 description 2
- 239000001110 calcium chloride Substances 0.000 description 2
- 229910001628 calcium chloride Inorganic materials 0.000 description 2
- 235000011148 calcium chloride Nutrition 0.000 description 2
- 101150000705 cas1 gene Proteins 0.000 description 2
- 208000011654 childhood malignant neoplasm Diseases 0.000 description 2
- 208000006990 cholangiocarcinoma Diseases 0.000 description 2
- 238000004590 computer program Methods 0.000 description 2
- 235000018417 cysteine Nutrition 0.000 description 2
- XUJNEKJLAYXESH-UHFFFAOYSA-N cysteine Natural products SCC(N)C(O)=O XUJNEKJLAYXESH-UHFFFAOYSA-N 0.000 description 2
- 238000012350 deep sequencing Methods 0.000 description 2
- 239000003085 diluting agent Substances 0.000 description 2
- 239000012153 distilled water Substances 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000007613 environmental effect Effects 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- 229940118764 francisella tularensis Drugs 0.000 description 2
- 201000011243 gastrointestinal stromal tumor Diseases 0.000 description 2
- 235000013922 glutamic acid Nutrition 0.000 description 2
- 239000004220 glutamic acid Substances 0.000 description 2
- 230000002489 hematologic effect Effects 0.000 description 2
- HNDVDQJCIGZPNO-UHFFFAOYSA-N histidine Natural products OC(=O)C(N)CC1=CN=CN1 HNDVDQJCIGZPNO-UHFFFAOYSA-N 0.000 description 2
- WQYVRQLZKVEZGA-UHFFFAOYSA-N hypochlorite Chemical compound Cl[O-] WQYVRQLZKVEZGA-UHFFFAOYSA-N 0.000 description 2
- 229960000310 isoleucine Drugs 0.000 description 2
- AGPKZVBTJJNPAG-UHFFFAOYSA-N isoleucine Natural products CCC(C)C(N)C(O)=O AGPKZVBTJJNPAG-UHFFFAOYSA-N 0.000 description 2
- 239000007788 liquid Substances 0.000 description 2
- 210000004185 liver Anatomy 0.000 description 2
- 229910052751 metal Inorganic materials 0.000 description 2
- 239000002184 metal Substances 0.000 description 2
- 229930182817 methionine Natural products 0.000 description 2
- 201000005962 mycosis fungoides Diseases 0.000 description 2
- 229910052759 nickel Inorganic materials 0.000 description 2
- 201000006958 oropharynx cancer Diseases 0.000 description 2
- 208000021010 pancreatic neuroendocrine tumor Diseases 0.000 description 2
- 208000007312 paraganglioma Diseases 0.000 description 2
- 208000016800 primary central nervous system lymphoma Diseases 0.000 description 2
- 230000000069 prophylactic effect Effects 0.000 description 2
- 239000002096 quantum dot Substances 0.000 description 2
- 206010038038 rectal cancer Diseases 0.000 description 2
- 201000001275 rectum cancer Diseases 0.000 description 2
- 208000010639 renal pelvis urothelial carcinoma Diseases 0.000 description 2
- 201000009410 rhabdomyosarcoma Diseases 0.000 description 2
- SUKJFIGYRHOWBL-UHFFFAOYSA-N sodium hypochlorite Chemical compound [Na+].Cl[O-] SUKJFIGYRHOWBL-UHFFFAOYSA-N 0.000 description 2
- 125000006850 spacer group Chemical group 0.000 description 2
- UCSJYZPVAKXKNQ-HZYVHMACSA-N streptomycin Chemical compound CN[C@H]1[C@H](O)[C@@H](O)[C@H](CO)O[C@H]1O[C@@H]1[C@](C=O)(O)[C@H](C)O[C@H]1O[C@@H]1[C@@H](NC(N)=N)[C@H](O)[C@@H](NC(N)=N)[C@H](O)[C@H]1O UCSJYZPVAKXKNQ-HZYVHMACSA-N 0.000 description 2
- 208000011580 syndromic disease Diseases 0.000 description 2
- 201000003120 testicular cancer Diseases 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 210000001519 tissue Anatomy 0.000 description 2
- 239000012096 transfection reagent Substances 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- OUYCCCASQSFEME-UHFFFAOYSA-N tyrosine Natural products OC(=O)C(N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-UHFFFAOYSA-N 0.000 description 2
- 201000000334 ureter transitional cell carcinoma Diseases 0.000 description 2
- 208000037965 uterine sarcoma Diseases 0.000 description 2
- 206010046885 vaginal cancer Diseases 0.000 description 2
- 208000013139 vaginal neoplasm Diseases 0.000 description 2
- 239000004474 valine Substances 0.000 description 2
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 description 1
- 102100036512 7-dehydrocholesterol reductase Human genes 0.000 description 1
- 208000030507 AIDS Diseases 0.000 description 1
- 208000002008 AIDS-Related Lymphoma Diseases 0.000 description 1
- 208000024893 Acute lymphoblastic leukemia Diseases 0.000 description 1
- 101100385358 Alicyclobacillus acidoterrestris (strain ATCC 49025 / DSM 3922 / CIP 106132 / NCIMB 13137 / GD3B) cas12b gene Proteins 0.000 description 1
- 206010061424 Anal cancer Diseases 0.000 description 1
- 208000007860 Anus Neoplasms Diseases 0.000 description 1
- 241000219194 Arabidopsis Species 0.000 description 1
- CKLJMWTZIZZHCS-UHFFFAOYSA-N Aspartic acid Chemical compound OC(=O)C(N)CC(O)=O CKLJMWTZIZZHCS-UHFFFAOYSA-N 0.000 description 1
- 206010003571 Astrocytoma Diseases 0.000 description 1
- 208000035404 Autolysis Diseases 0.000 description 1
- 208000010839 B-cell chronic lymphocytic leukemia Diseases 0.000 description 1
- 239000007989 BIS-Tris Propane buffer Substances 0.000 description 1
- 241000894006 Bacteria Species 0.000 description 1
- 238000009010 Bradford assay Methods 0.000 description 1
- 208000011691 Burkitt lymphomas Diseases 0.000 description 1
- 238000010354 CRISPR gene editing Methods 0.000 description 1
- 101150017047 CSM3 gene Proteins 0.000 description 1
- 101150069031 CSN2 gene Proteins 0.000 description 1
- 101150078885 CSY3 gene Proteins 0.000 description 1
- 206010007275 Carcinoid tumour Diseases 0.000 description 1
- 206010007279 Carcinoid tumour of the gastrointestinal tract Diseases 0.000 description 1
- 201000009030 Carcinoma Diseases 0.000 description 1
- 102100031437 Cell cycle checkpoint protein RAD1 Human genes 0.000 description 1
- 206010057248 Cell death Diseases 0.000 description 1
- 206010008342 Cervix carcinoma Diseases 0.000 description 1
- 201000009047 Chordoma Diseases 0.000 description 1
- 108020004638 Circular DNA Proteins 0.000 description 1
- 108700010070 Codon Usage Proteins 0.000 description 1
- RYGMFSIKBFXOCR-UHFFFAOYSA-N Copper Chemical compound [Cu] RYGMFSIKBFXOCR-UHFFFAOYSA-N 0.000 description 1
- 102100033934 DNA repair protein RAD51 homolog 2 Human genes 0.000 description 1
- 230000004568 DNA-binding Effects 0.000 description 1
- 108010053770 Deoxyribonucleases Proteins 0.000 description 1
- 102000016911 Deoxyribonucleases Human genes 0.000 description 1
- 241000702421 Dependoparvovirus Species 0.000 description 1
- KCXVZYZYPLLWCC-UHFFFAOYSA-N EDTA Chemical compound OC(=O)CN(CC(O)=O)CCN(CC(O)=O)CC(O)=O KCXVZYZYPLLWCC-UHFFFAOYSA-N 0.000 description 1
- 101100275895 Emericella nidulans (strain FGSC A4 / ATCC 38163 / CBS 112.46 / NRRL 194 / M139) csnB gene Proteins 0.000 description 1
- 208000001976 Endocrine Gland Neoplasms Diseases 0.000 description 1
- 206010014733 Endometrial cancer Diseases 0.000 description 1
- 206010014759 Endometrial neoplasm Diseases 0.000 description 1
- 206010057649 Endometrial sarcoma Diseases 0.000 description 1
- 206010014967 Ependymoma Diseases 0.000 description 1
- 101100007788 Escherichia coli (strain K12) casA gene Proteins 0.000 description 1
- 101100007792 Escherichia coli (strain K12) casB gene Proteins 0.000 description 1
- 101100219622 Escherichia coli (strain K12) casC gene Proteins 0.000 description 1
- 101100382541 Escherichia coli (strain K12) casD gene Proteins 0.000 description 1
- 101100005249 Escherichia coli (strain K12) ygcB gene Proteins 0.000 description 1
- LYCAIKOWRPUZTN-UHFFFAOYSA-N Ethylene glycol Chemical compound OCCO LYCAIKOWRPUZTN-UHFFFAOYSA-N 0.000 description 1
- 201000001342 Fallopian tube cancer Diseases 0.000 description 1
- 208000013452 Fallopian tube neoplasm Diseases 0.000 description 1
- 241000233866 Fungi Species 0.000 description 1
- 206010051066 Gastrointestinal stromal tumour Diseases 0.000 description 1
- 230000010558 Gene Alterations Effects 0.000 description 1
- 208000021309 Germ cell tumor Diseases 0.000 description 1
- 102100033961 Guanylin Human genes 0.000 description 1
- 208000017604 Hodgkin disease Diseases 0.000 description 1
- 208000021519 Hodgkin lymphoma Diseases 0.000 description 1
- 208000010747 Hodgkins lymphoma Diseases 0.000 description 1
- 101000928720 Homo sapiens 7-dehydrocholesterol reductase Proteins 0.000 description 1
- 101001130384 Homo sapiens Cell cycle checkpoint protein RAD1 Proteins 0.000 description 1
- 101001132307 Homo sapiens DNA repair protein RAD51 homolog 2 Proteins 0.000 description 1
- 101100170936 Homo sapiens DNMT1 gene Proteins 0.000 description 1
- 101000584612 Homo sapiens GTPase KRas Proteins 0.000 description 1
- 101001068469 Homo sapiens Guanylin Proteins 0.000 description 1
- 101000878605 Homo sapiens Low affinity immunoglobulin epsilon Fc receptor Proteins 0.000 description 1
- 206010021042 Hypopharyngeal cancer Diseases 0.000 description 1
- 206010056305 Hypopharyngeal neoplasm Diseases 0.000 description 1
- 208000009164 Islet Cell Adenoma Diseases 0.000 description 1
- 240000008415 Lactuca sativa Species 0.000 description 1
- 201000005099 Langerhans cell histiocytosis Diseases 0.000 description 1
- 108091026898 Leader sequence (mRNA) Proteins 0.000 description 1
- 102100038007 Low affinity immunoglobulin epsilon Fc receptor Human genes 0.000 description 1
- 208000004059 Male Breast Neoplasms Diseases 0.000 description 1
- 208000032271 Malignant tumor of penis Diseases 0.000 description 1
- 238000007476 Maximum Likelihood Methods 0.000 description 1
- 208000002030 Merkel cell carcinoma Diseases 0.000 description 1
- 201000003793 Myelodysplastic syndrome Diseases 0.000 description 1
- 101100387128 Myxococcus xanthus (strain DK1622) devR gene Proteins 0.000 description 1
- 101100387131 Myxococcus xanthus (strain DK1622) devS gene Proteins 0.000 description 1
- 206010029260 Neuroblastoma Diseases 0.000 description 1
- 206010029266 Neuroendocrine carcinoma of the skin Diseases 0.000 description 1
- 208000033383 Neuroendocrine tumor of pancreas Diseases 0.000 description 1
- 208000015914 Non-Hodgkin lymphomas Diseases 0.000 description 1
- 108091034117 Oligonucleotide Proteins 0.000 description 1
- 206010067517 Pancreatic neuroendocrine tumour Diseases 0.000 description 1
- 208000003937 Paranasal Sinus Neoplasms Diseases 0.000 description 1
- 229930182555 Penicillin Natural products 0.000 description 1
- JGSARLDLIJGVTE-MBNYWOFBSA-N Penicillin G Chemical compound N([C@H]1[C@H]2SC([C@@H](N2C1=O)C(O)=O)(C)C)C(=O)CC1=CC=CC=C1 JGSARLDLIJGVTE-MBNYWOFBSA-N 0.000 description 1
- 208000002471 Penile Neoplasms Diseases 0.000 description 1
- 206010034299 Penile cancer Diseases 0.000 description 1
- 208000009565 Pharyngeal Neoplasms Diseases 0.000 description 1
- 206010034811 Pharyngeal cancer Diseases 0.000 description 1
- 208000007913 Pituitary Neoplasms Diseases 0.000 description 1
- 208000033014 Plasma cell tumor Diseases 0.000 description 1
- 208000026149 Primary peritoneal carcinoma Diseases 0.000 description 1
- 101710089372 Programmed cell death protein 1 Proteins 0.000 description 1
- 206010060862 Prostate cancer Diseases 0.000 description 1
- 208000000236 Prostatic Neoplasms Diseases 0.000 description 1
- 229940124158 Protease/peptidase inhibitor Drugs 0.000 description 1
- 108010076504 Protein Sorting Signals Proteins 0.000 description 1
- 201000008183 Pulmonary blastoma Diseases 0.000 description 1
- CZPWVGJYEJSRLH-UHFFFAOYSA-N Pyrimidine Chemical compound C1=CN=CN=C1 CZPWVGJYEJSRLH-UHFFFAOYSA-N 0.000 description 1
- 108010092799 RNA-directed DNA polymerase Proteins 0.000 description 1
- 206010038111 Recurrent cancer Diseases 0.000 description 1
- 208000008938 Rhabdoid tumor Diseases 0.000 description 1
- 206010073334 Rhabdoid tumour Diseases 0.000 description 1
- 208000005678 Rhabdomyoma Diseases 0.000 description 1
- 206010061934 Salivary gland cancer Diseases 0.000 description 1
- 238000012300 Sequence Analysis Methods 0.000 description 1
- 108010071390 Serum Albumin Proteins 0.000 description 1
- 102000007562 Serum Albumin Human genes 0.000 description 1
- 206010041067 Small cell lung cancer Diseases 0.000 description 1
- 239000005708 Sodium hypochlorite Substances 0.000 description 1
- 229930006000 Sucrose Natural products 0.000 description 1
- CZMRCDWAGMRECN-UGDNZRGBSA-N Sucrose Chemical compound O[C@H]1[C@H](O)[C@@H](CO)O[C@@]1(CO)O[C@@H]1[C@H](O)[C@@H](O)[C@H](O)[C@@H](CO)O1 CZMRCDWAGMRECN-UGDNZRGBSA-N 0.000 description 1
- 208000031673 T-Cell Cutaneous Lymphoma Diseases 0.000 description 1
- 206010042971 T-cell lymphoma Diseases 0.000 description 1
- 208000027585 T-cell non-Hodgkin lymphoma Diseases 0.000 description 1
- 101100059152 Thermococcus onnurineus (strain NA1) csm1 gene Proteins 0.000 description 1
- 101100273269 Thermus thermophilus (strain ATCC 27634 / DSM 579 / HB8) cse3 gene Proteins 0.000 description 1
- 208000000728 Thymus Neoplasms Diseases 0.000 description 1
- 102000008579 Transposases Human genes 0.000 description 1
- 108010020764 Transposases Proteins 0.000 description 1
- 208000015778 Undifferentiated pleomorphic sarcoma Diseases 0.000 description 1
- 208000006593 Urologic Neoplasms Diseases 0.000 description 1
- 208000006105 Uterine Cervical Neoplasms Diseases 0.000 description 1
- 241000700605 Viruses Species 0.000 description 1
- 206010047741 Vulval cancer Diseases 0.000 description 1
- 208000008383 Wilms tumor Diseases 0.000 description 1
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 1
- 241001531273 [Eubacterium] eligens Species 0.000 description 1
- 241001531188 [Eubacterium] rectale Species 0.000 description 1
- 238000000246 agarose gel electrophoresis Methods 0.000 description 1
- 229910052782 aluminium Inorganic materials 0.000 description 1
- XAGFODPZIPBFFR-UHFFFAOYSA-N aluminium Chemical compound [Al] XAGFODPZIPBFFR-UHFFFAOYSA-N 0.000 description 1
- 201000011165 anus cancer Diseases 0.000 description 1
- 208000021780 appendiceal neoplasm Diseases 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- HHKZCCWKTZRCCL-UHFFFAOYSA-N bis-tris propane Chemical compound OCC(CO)(CO)NCCCNC(CO)(CO)CO HHKZCCWKTZRCCL-UHFFFAOYSA-N 0.000 description 1
- 239000012888 bovine serum Substances 0.000 description 1
- 208000002458 carcinoid tumor Diseases 0.000 description 1
- 101150090505 cas10 gene Proteins 0.000 description 1
- 101150098304 cas13a gene Proteins 0.000 description 1
- 101150055191 cas3 gene Proteins 0.000 description 1
- 101150111685 cas4 gene Proteins 0.000 description 1
- 101150049463 cas5 gene Proteins 0.000 description 1
- 101150106467 cas6 gene Proteins 0.000 description 1
- 101150044165 cas7 gene Proteins 0.000 description 1
- 101150038500 cas9 gene Proteins 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 238000002659 cell therapy Methods 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 201000010881 cervical cancer Diseases 0.000 description 1
- 239000007795 chemical reaction product Substances 0.000 description 1
- 239000003153 chemical reaction reagent Substances 0.000 description 1
- 239000003795 chemical substances by application Substances 0.000 description 1
- 208000019772 childhood adrenal gland pheochromocytoma Diseases 0.000 description 1
- 208000023973 childhood bladder carcinoma Diseases 0.000 description 1
- 208000026046 childhood carcinoid tumor Diseases 0.000 description 1
- 208000028191 childhood central nervous system germ cell tumor Diseases 0.000 description 1
- 208000013549 childhood kidney neoplasm Diseases 0.000 description 1
- 208000015576 childhood malignant melanoma Diseases 0.000 description 1
- 238000010367 cloning Methods 0.000 description 1
- 101150100788 cmr3 gene Proteins 0.000 description 1
- 101150040342 cmr4 gene Proteins 0.000 description 1
- 101150095330 cmr5 gene Proteins 0.000 description 1
- 101150034961 cmr6 gene Proteins 0.000 description 1
- 229910017052 cobalt Inorganic materials 0.000 description 1
- 239000010941 cobalt Substances 0.000 description 1
- GUTLYIVDDKVIGB-UHFFFAOYSA-N cobalt atom Chemical compound [Co] GUTLYIVDDKVIGB-UHFFFAOYSA-N 0.000 description 1
- 208000029742 colonic neoplasm Diseases 0.000 description 1
- 229910052802 copper Inorganic materials 0.000 description 1
- 239000010949 copper Substances 0.000 description 1
- 101150085344 csa5 gene Proteins 0.000 description 1
- 101150089829 csc-1 gene Proteins 0.000 description 1
- 101150088639 csm4 gene Proteins 0.000 description 1
- 101150022488 csm5 gene Proteins 0.000 description 1
- 101150064365 csm6 gene Proteins 0.000 description 1
- 101150056210 csx1 gene Proteins 0.000 description 1
- 101150088252 csy1 gene Proteins 0.000 description 1
- 101150016576 csy2 gene Proteins 0.000 description 1
- 238000012258 culturing Methods 0.000 description 1
- 201000007241 cutaneous T cell lymphoma Diseases 0.000 description 1
- 208000017763 cutaneous neuroendocrine carcinoma Diseases 0.000 description 1
- 238000005520 cutting process Methods 0.000 description 1
- 230000001351 cycling effect Effects 0.000 description 1
- 230000002950 deficient Effects 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 230000000593 degrading effect Effects 0.000 description 1
- 238000002716 delivery method Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 208000028715 ductal breast carcinoma in situ Diseases 0.000 description 1
- 238000001962 electrophoresis Methods 0.000 description 1
- 238000004520 electroporation Methods 0.000 description 1
- 230000008030 elimination Effects 0.000 description 1
- 238000003379 elimination reaction Methods 0.000 description 1
- 208000014616 embryonal neoplasm Diseases 0.000 description 1
- 201000011523 endocrine gland cancer Diseases 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 208000024519 eye neoplasm Diseases 0.000 description 1
- 210000003746 feather Anatomy 0.000 description 1
- 239000012091 fetal bovine serum Substances 0.000 description 1
- 230000003328 fibroblastic effect Effects 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 239000011888 foil Substances 0.000 description 1
- 230000002496 gastric effect Effects 0.000 description 1
- 210000001035 gastrointestinal tract Anatomy 0.000 description 1
- 238000010353 genetic engineering Methods 0.000 description 1
- 230000035784 germination Effects 0.000 description 1
- 208000003884 gestational trophoblastic disease Diseases 0.000 description 1
- 230000012010 growth Effects 0.000 description 1
- 201000009277 hairy cell leukemia Diseases 0.000 description 1
- 210000003128 head Anatomy 0.000 description 1
- 208000024348 heart neoplasm Diseases 0.000 description 1
- 201000011066 hemangioma Diseases 0.000 description 1
- 238000012165 high-throughput sequencing Methods 0.000 description 1
- 201000008298 histiocytosis Diseases 0.000 description 1
- 201000006866 hypopharynx cancer Diseases 0.000 description 1
- 230000005847 immunogenicity Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000001727 in vivo Methods 0.000 description 1
- 238000010348 incorporation Methods 0.000 description 1
- 238000011081 inoculation Methods 0.000 description 1
- 238000003780 insertion Methods 0.000 description 1
- 230000037431 insertion Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- BPHPUYQFMNQIOC-NXRLNHOXSA-N isopropyl beta-D-thiogalactopyranoside Chemical compound CC(C)S[C@@H]1O[C@H](CO)[C@H](O)[C@H](O)[C@H]1O BPHPUYQFMNQIOC-NXRLNHOXSA-N 0.000 description 1
- 125000001449 isopropyl group Chemical group [H]C([H])([H])C([H])(*)C([H])([H])[H] 0.000 description 1
- 238000005304 joining Methods 0.000 description 1
- 230000000366 juvenile effect Effects 0.000 description 1
- 229930027917 kanamycin Natural products 0.000 description 1
- 229960000318 kanamycin Drugs 0.000 description 1
- SBUJHOSQTJFQJX-NOAMYHISSA-N kanamycin Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CN)O[C@@H]1O[C@H]1[C@H](O)[C@@H](O[C@@H]2[C@@H]([C@@H](N)[C@H](O)[C@@H](CO)O2)O)[C@H](N)C[C@@H]1N SBUJHOSQTJFQJX-NOAMYHISSA-N 0.000 description 1
- 229930182823 kanamycin A Natural products 0.000 description 1
- 210000000244 kidney pelvis Anatomy 0.000 description 1
- 210000001821 langerhans cell Anatomy 0.000 description 1
- 208000032839 leukemia Diseases 0.000 description 1
- 201000006721 lip cancer Diseases 0.000 description 1
- 238000011068 loading method Methods 0.000 description 1
- 230000004807 localization Effects 0.000 description 1
- 210000004072 lung Anatomy 0.000 description 1
- 201000003175 male breast cancer Diseases 0.000 description 1
- 208000010907 male breast carcinoma Diseases 0.000 description 1
- 230000036210 malignancy Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000001404 mediated effect Effects 0.000 description 1
- 229910021645 metal ion Inorganic materials 0.000 description 1
- 150000002739 metals Chemical class 0.000 description 1
- 230000001394 metastastic effect Effects 0.000 description 1
- 208000037819 metastatic cancer Diseases 0.000 description 1
- 208000011575 metastatic malignant neoplasm Diseases 0.000 description 1
- 206010061289 metastatic neoplasm Diseases 0.000 description 1
- 208000037970 metastatic squamous neck cancer Diseases 0.000 description 1
- 244000005700 microbiome Species 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 201000006462 myelodysplastic/myeloproliferative neoplasm Diseases 0.000 description 1
- 208000018795 nasal cavity and paranasal sinus carcinoma Diseases 0.000 description 1
- 208000017929 nasal glial heterotopia Diseases 0.000 description 1
- 238000007481 next generation sequencing Methods 0.000 description 1
- 208000002154 non-small cell lung carcinoma Diseases 0.000 description 1
- 201000008106 ocular cancer Diseases 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000002611 ovarian Effects 0.000 description 1
- 208000021284 ovarian germ cell tumor Diseases 0.000 description 1
- 208000022102 pancreatic neuroendocrine neoplasm Diseases 0.000 description 1
- 208000003154 papilloma Diseases 0.000 description 1
- 208000029211 papillomatosis Diseases 0.000 description 1
- 201000007052 paranasal sinus cancer Diseases 0.000 description 1
- 229940049954 penicillin Drugs 0.000 description 1
- 239000000137 peptide hydrolase inhibitor Substances 0.000 description 1
- 239000008194 pharmaceutical composition Substances 0.000 description 1
- 208000028591 pheochromocytoma Diseases 0.000 description 1
- 208000010916 pituitary tumor Diseases 0.000 description 1
- 230000008635 plant growth Effects 0.000 description 1
- 208000010626 plasma cell neoplasm Diseases 0.000 description 1
- 239000013600 plasmid vector Substances 0.000 description 1
- 102000054765 polymorphisms of proteins Human genes 0.000 description 1
- 230000035935 pregnancy Effects 0.000 description 1
- 238000004321 preservation Methods 0.000 description 1
- 208000025638 primary cutaneous T-cell non-Hodgkin lymphoma Diseases 0.000 description 1
- 108020001580 protein domains Proteins 0.000 description 1
- 230000004853 protein function Effects 0.000 description 1
- 238000004445 quantitative analysis Methods 0.000 description 1
- 210000000664 rectum Anatomy 0.000 description 1
- 230000008929 regeneration Effects 0.000 description 1
- 238000011069 regeneration method Methods 0.000 description 1
- 230000008439 repair process Effects 0.000 description 1
- 101150071322 ruvC gene Proteins 0.000 description 1
- 201000003804 salivary gland carcinoma Diseases 0.000 description 1
- 150000003839 salts Chemical class 0.000 description 1
- 230000028327 secretion Effects 0.000 description 1
- 230000028043 self proteolysis Effects 0.000 description 1
- 238000002741 site-directed mutagenesis Methods 0.000 description 1
- 208000020352 skin basal cell carcinoma Diseases 0.000 description 1
- 201000010106 skin squamous cell carcinoma Diseases 0.000 description 1
- 208000000587 small cell lung carcinoma Diseases 0.000 description 1
- 201000002314 small intestine cancer Diseases 0.000 description 1
- 238000002415 sodium dodecyl sulfate polyacrylamide gel electrophoresis Methods 0.000 description 1
- 238000000527 sonication Methods 0.000 description 1
- 208000037969 squamous neck cancer Diseases 0.000 description 1
- 239000008223 sterile water Substances 0.000 description 1
- 229960005322 streptomycin Drugs 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 239000005720 sucrose Substances 0.000 description 1
- 238000002560 therapeutic procedure Methods 0.000 description 1
- 208000008732 thymoma Diseases 0.000 description 1
- 201000009377 thymus cancer Diseases 0.000 description 1
- 208000029729 tumor suppressor gene on chromosome 11 Diseases 0.000 description 1
- 238000011144 upstream manufacturing Methods 0.000 description 1
- 210000000626 ureter Anatomy 0.000 description 1
- 201000011531 vascular cancer Diseases 0.000 description 1
- 206010055031 vascular neoplasm Diseases 0.000 description 1
- 108700026220 vif Genes Proteins 0.000 description 1
- 238000011179 visual inspection Methods 0.000 description 1
- 239000011782 vitamin Substances 0.000 description 1
- 235000013343 vitamin Nutrition 0.000 description 1
- 229940088594 vitamin Drugs 0.000 description 1
- 229930003231 vitamin Natural products 0.000 description 1
- 201000005102 vulva cancer Diseases 0.000 description 1
- 239000011534 wash buffer Substances 0.000 description 1
- 238000005406 washing Methods 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/16—Hydrolases (3) acting on ester bonds (3.1)
- C12N9/22—Ribonucleases RNAses, DNAses
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/415—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from plants
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/435—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
- C07K14/705—Receptors; Cell surface antigens; Cell surface determinants
- C07K14/715—Receptors; Cell surface antigens; Cell surface determinants for cytokines; for lymphokines; for interferons
- C07K14/7158—Receptors; Cell surface antigens; Cell surface determinants for cytokines; for lymphokines; for interferons for chemokines
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/87—Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
- C12N15/90—Stable introduction of foreign DNA into chromosome
- C12N15/902—Stable introduction of foreign DNA into chromosome using homologous recombination
- C12N15/907—Stable introduction of foreign DNA into chromosome using homologous recombination in mammalian cells
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/10—Transferases (2.)
- C12N9/1003—Transferases (2.) transferring one-carbon groups (2.1)
- C12N9/1007—Methyltransferases (general) (2.1.1.)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2310/00—Structure or type of the nucleic acid
- C12N2310/10—Type of nucleic acid
- C12N2310/20—Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2800/00—Nucleic acids vectors
- C12N2800/80—Vectors containing sites for inducing double-stranded breaks, e.g. meganuclease restriction sites
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Genetics & Genomics (AREA)
- Organic Chemistry (AREA)
- Engineering & Computer Science (AREA)
- Zoology (AREA)
- Molecular Biology (AREA)
- Wood Science & Technology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biomedical Technology (AREA)
- Biotechnology (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Biochemistry (AREA)
- Microbiology (AREA)
- Medicinal Chemistry (AREA)
- Biophysics (AREA)
- Physics & Mathematics (AREA)
- Plant Pathology (AREA)
- Cell Biology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Gastroenterology & Hepatology (AREA)
- Mycology (AREA)
- Toxicology (AREA)
- Immunology (AREA)
- Botany (AREA)
- Peptides Or Proteins (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
Abstract
本公开提供了切割靶核酸的新颖Cas12a蛋白及其使用方法。
Description
交叉引用
本申请要求于2018年8月9日提交的韩国专利申请10-2018-0093336和2018年10月30日提交的美国临时申请号62/752,950的优先权和权益,每件所述申请的全部内容通过引用并入本文中。
背景技术
基因组编辑是一种基因工程技术,其靶向将基因插入基因组的特定位置,从而修饰缺陷基因和/或引入功能基因。使用RNA指导的内切核酸酶切割关注的核酸序列的成簇规律间隔短回文重复(CRISPR)-CRISPR相关(Cas)技术的最新进展进一步提高了效率并缩短了基因组编辑过程。但是,当前使用传统内切核酸酶的CRISPR技术苦于精度相对较低。因此,仍然非常需要新颖高效的内切核酸酶。
发明内容
本公开提供了一种组合物,其包含i)-iv)中的至少一种,以及与i)-iv)中的所述至少一种偶联的指导RNA:i)与SEQ ID NO:1的残基829至残基991具有至少80%序列一致性的多肽,其中所述多肽包含氨基酸序列,所述氨基酸序列包含与SEQ ID NO:1的位置925处的赖氨酸对齐的赖氨酸;ii)与SEQ ID NO:3的残基825至残基996具有至少80%序列一致性的多肽,其中所述多肽包含氨基酸序列,所述氨基酸序列包含与SEQ ID NO:3的位置930处的赖氨酸对齐的赖氨酸;iii)与SEQ ID NO:1具有至少80%序列一致性的多肽,其中所述多肽包含氨基酸序列,所述氨基酸序列包含与SEQ ID NO:1的位置925处的赖氨酸对齐的赖氨酸;或iv)与SEQ ID NO:3具有至少80%序列一致性的多肽,其中所述多肽包含氨基酸序列,所述氨基酸序列包含与SEQ ID NO:3的位置930处的赖氨酸对齐的赖氨酸。指导RNA包含与包含6至60个碱基的真核核酸序列反向互补的序列。
在一些实施方案中,相对于SEQ ID NO:1或SEQ ID NO:1,在最佳比对时,与SEQ IDNO:1的位置925处的赖氨酸对齐的赖氨酸或与在SEQ ID NO:3的位置930处的赖氨酸对齐的赖氨酸可以分别不在位置925或930处。
在一些实施方案中,真核核酸序列是人核酸序列,其可以包含处于KRAS、HER2/neu、PD-1、TCR、p53、CCR5、DNMT1、EMX1和LKB1中的区域。可替代地和/或另外地,真核核酸序列是植物核酸序列。
优选地,多肽是V型CRISPR相关蛋白。在这样的实施方案中,优选地,V型CRISPR相关蛋白是Cas12a蛋白。
在一些实施方案中,多肽包含纯化标签。纯化标签包含选自由以下组成的组中的至少一种标签:His标签、FLAG标签、AU1表位标签、AU5表位标签、噬菌体T7标签、噬菌体V5表位标签、蓝舌病毒标签(B标签)、Glu-Glu标签(EE标签)、HSV表位标签、KT3表位标签、Myc表位标签、PDZ配体标签、聚精氨酸标签、聚天冬氨酸标签、聚半胱氨酸标签、聚苯丙氨酸标签、蛋白C标签、S1标签、S标签、Step标签和VSV-G标签。
在一些实施方案中,指导RNA包含富含A的原间隔子相邻基序(protospaceradjacent motif,PAM)序列、富含G的PAM序列、富含T的PAM序列或富含C的PAM序列。任选地,PAM序列包含3个T核碱基、2个T核碱基、1个T核碱基或TTTN。可替代地和/或另外地,指导RNA包括crRNA和tracrRNA。
优选的是,与AsCas12a、FnCas12a或LbCas12a相比,组合物显示出至少2倍增高的基因组编辑效率。在一些实施方案中,组合物还包含赋形剂。在一些实施方案中,赋形剂具有7至8的pH。在一些实施方案中,赋形剂是缓冲液,其可以包含Bis-Tris丙烷-HCl、MgCl2或牛血清白蛋白中的至少一种。
本公开还公开了一种基因编辑的方法,其包括:提供一种组合物,所述组合物包含i)-iv)中的至少一种,以及与i)-iv)中的所述至少一种偶联的指导RNA:i)与SEQ ID NO:1的残基829至残基991具有至少80%序列一致性的多肽,其中所述多肽包含氨基酸序列,所述氨基酸序列包含与SEQ ID NO:1的位置925处的赖氨酸对齐的赖氨酸;ii)与SEQ ID NO:3的残基825至残基996具有至少80%序列一致性的多肽,其中所述多肽包含氨基酸序列,所述氨基酸序列包含与SEQ ID NO:3的位置930处的赖氨酸对齐的赖氨酸;iii)与SEQ ID NO:1具有至少80%序列一致性的多肽,其中所述多肽包含氨基酸序列,所述氨基酸序列包含与SEQ ID NO:1的位置925处的赖氨酸对齐的赖氨酸;或iv)与SEQ ID NO:3具有至少80%序列一致性的多肽,其中所述多肽包含氨基酸序列,所述氨基酸序列包含与SEQ ID NO:3的位置930处的赖氨酸对齐的赖氨酸。指导RNA包含与包含6至60个碱基的真核核酸序列反向互补的序列。
在一些实施方案中,真核核酸序列是人核酸序列,其可以包含处于KRAS、HER2/neu、PD-1、TCR、p53、CCR5、DNMT1、EMX1和LKB1中的区域。可替代地和/或另外地,真核核酸序列是植物核酸序列。
优选地,多肽是V型CRISPR相关蛋白。在这样的实施方案中,优选地,V型CRISPR相关蛋白是Cas12a蛋白。
在一些实施方案中,多肽包含纯化标签。纯化标签包含选自由以下组成的组中的至少一种标签:His标签、FLAG标签、AU1表位标签、AU5表位标签、噬菌体T7标签、噬菌体V5表位标签、蓝舌病毒标签(B标签)、Glu-Glu标签(EE标签)、HSV表位标签、KT3表位标签、Myc表位标签、PDZ配体标签、聚精氨酸标签、聚天冬氨酸标签、聚半胱氨酸标签、聚苯丙氨酸标签、蛋白C标签、S1标签、S标签、Step标签和VSV-G标签。
在一些实施方案中,指导RNA包含富含A的原间隔子相邻基序(PAM)序列、富含G的PAM序列、富含T的PAM序列或富含C的PAM序列。任选地,PAM序列包含3个T核碱基、2个T核碱基、1个T核碱基或TTTN。可替代地和/或另外地,指导RNA包括crRNA和tracrRNA。
在一些实施方案中,组合物还包含赋形剂。在一些实施方案中,赋形剂具有7至8的pH。在一些实施方案中,赋形剂是缓冲液,其可以包含Bis-Tris丙烷-HCl、MgCl2或牛血清白蛋白中的至少一种。优选地,切割步骤的效率是AsCas12a、FnCas12a或LbCas12a的基因组编辑效率的至少2倍。
本公开还公开了一种提高V型CRISPR相关蛋白的切割效率的方法,所述方法包括:提供V型CRISPR相关蛋白;鉴定V型CRISPR相关蛋白的与SEQ ID NO:1的位置925处的赖氨酸或SEQ ID NO:3的位置930处的赖氨酸对齐的残基;以及将所述残基突变为赖氨酸。
本公开提供了一种组合物,所述组合物包含:与SEQ ID NO:1的残基829至残基991具有至少80%序列一致性的蛋白(或多肽),其中所述蛋白在位置925处包含赖氨酸;和指导RNA,所述指导RNA包含与包含6至60个碱基的真核核酸序列反向互补的序列。
本公开提供了一种组合物,所述组合物包含:与SEQ ID NO:3的残基825至残基996具有至少80%序列一致性的蛋白(或多肽),其中所述蛋白在位置930处包含赖氨酸;和指导RNA,所述指导RNA包含与包含6至60个碱基的真核核酸序列反向互补的序列。
本公开提供了一种组合物,所述组合物包含:与SEQ ID NO:1具有至少80%序列一致性的蛋白(或多肽),其中所述蛋白在位置925处包含赖氨酸;和指导RNA,所述指导RNA包含与包含6至60个碱基的真核核酸序列反向互补的序列。
本公开提供了一种组合物,所述组合物包含:与SEQ ID NO:3具有至少80%序列一致性的蛋白(或多肽),其中所述蛋白在位置930处包含赖氨酸;和指导RNA,所述指导RNA包含与包含6至60个碱基的真核核酸序列反向互补的序列。
在这些组合物中,真核核酸序列可以是人核酸序列。任选地,人核酸序列与癌症有关。可替代地,真核核酸序列可以是植物核酸序列。在一些实施方案中,编码SEQ ID NO:1的核苷酸序列包含相比于SEQ ID NO:2至少80%的序列一致性。可替代地,和/或另外地,编码SEQ ID NO:3的核苷酸序列包含相比于SEQ ID NO:4至少80%的序列一致性。考虑到所述蛋白来自、获得自或衍生自真杆菌科。在本文提供的特定公开内容中,所述蛋白包含核酸酶。
优选地,所述蛋白包含核酸酶。在此类实施方案中,核酸酶可包含V型CRISPR相关蛋白。进一步优选地,V型CRISPR相关蛋白可以包含Cas12a蛋白。在一些实施方案中,这样的Cas12a蛋白是经宏基因组学挖掘的。
在一些实施方案中,所述组合物包含或具有7至7.9范围的pH,例如约或恰好7的pH。可替代地,和/或另外地,将所述组合物配制在缓冲液中,所述缓冲液可以包含Bis-Tris丙烷-HCl、MgCl2和/或牛血清白蛋白。例如,所述缓冲液包含0.1至50mM的Bis-Tris丙烷-HCl。此外,所述缓冲液包含0.1至50mM的MgCl2。所述缓冲液还可以包含1至500μg/ml的牛血清白蛋白。所述缓冲液可以具体地包含约或恰好10mM的Bis-Tris丙烷-HCl。此外,所述缓冲液可包含约或恰好10mM MgCl2。另外,所述缓冲液包含约或恰好100μg/ml的牛血清白蛋白。
在一些实施方案中,所述蛋白(或多肽;蛋白和多肽可在本文中互换使用)包含纯化标签。例如,纯化标签包含或可以包括选自由以下组成的组中的至少一种标签:His标签、FLAG标签、AU1表位标签、AU5表位标签、噬菌体T7标签、噬菌体V5表位标签、蓝舌病毒标签(B标签)、Glu-Glu标签(EE标签)、HSV表位标签、KT3表位标签、Myc表位标签、PDZ配体标签、聚精氨酸标签、聚天冬氨酸标签、聚半胱氨酸标签、聚苯丙氨酸标签、蛋白C标签、S1标签、S标签、Step标签和VSV-G标签。与本公开相符地,指导RNA包含富含A的原间隔子相邻基序(PAM)序列、富含G的PAM序列、富含T的PAM序列或富含C的PAM序列。
组合物中的指导RNA可以包含富含T的PAM序列。例如,PAM序列包含3个T核碱基、2个T核碱基或1个T核碱基。与本公开相容的PAM序列包含TTTN。在一些实施方案中,指导RNA序列包含1至100个核苷酸。
可替代地,和/或另外地,靶人核酸序列包含处于KRAS、HER2/neu、PD-1、TCR、p53、CCR5、DNMT1、EMX1和LKB1中的区域。
考虑了几种癌症并且与本公开兼容,例如,所述癌症包括膀胱癌、骨癌、血液癌、乳腺癌、黑色瘤(black colored tumor)、甲状腺癌、甲状旁腺癌、骨髓癌、喉咽癌、喉癌、肺癌、食道癌、胰腺癌、结直肠癌、胃癌、舌癌、皮肤癌、脑癌、子宫癌、头颈癌、胆囊癌、口腔癌、中枢神经系统肿瘤、或肝癌。
本发明的组合物能够展现出与其他Cas12a直系同源物相比改善的基因组编辑效率。例如,在一些方面,与AsCas12a、FnCas12a或LbCas12a相比,组合物显示出至少2倍增高的基因组编辑效率。本公开的蛋白能够与具有与其他Cas12a直系同源物兼容的5'柄的crRNA进行复合。例如,在以上任何组合物中,指导RNA包含crRNA和tracrRNA。此外,crRNA包含AAUU的5'重复识别序列。在一些方面,所述蛋白在CaCl2、CoCl2、FeCl2、MnSO4或其任何组合的存在下显示切割活性。
本公开还提供了一种基因编辑的方法,其中所述方法包括:使细胞与以上任何一种组合物接触;将指导RNA与靶人核酸序列结合;以及切割人核酸序列。
本公开另外提供了一种基因编辑的方法,其中所述方法包括:提供组合物,所述组合物包含:与SEQ ID NO:1的残基829至残基991具有至少80%序列一致性的蛋白(或多肽),其中所述蛋白在位置925处包含赖氨酸;和指导RNA,所述指导RNA包含与包含6至60个核苷酸的核酸序列反向互补的序列;使细胞与所述组合物接触;使所述指导RNA与真核核酸序列结合;以及切割所述核酸序列。
本公开提供了一种基因编辑的方法,其中所述方法包括:提供组合物,所述组合物包含:与SEQ ID NO:3的残基825至残基996具有至少80%序列一致性的蛋白(或多肽),其中所述蛋白在位置930处包含赖氨酸;和指导RNA,所述指导RNA包含与包含6至60个核苷酸的核酸序列反向互补的序列;使细胞与所述组合物接触;使所述指导RNA与真核核酸序列结合;以及切割所述核酸序列。
本公开另外提供了一种基因编辑的方法,其中所述方法包括:提供组合物,所述组合物包含与SEQ ID NO:1具有至少80%序列一致性的蛋白(或多肽),其中所述蛋白在位置925处包含赖氨酸;和指导RNA,所述指导RNA包含与包含6至60个核苷酸的核酸序列反向互补的序列;使细胞与所述组合物接触;使所述指导RNA与真核核酸序列结合;以及切割所述核酸序列。
本公开还提供了一种基因编辑的方法,其中所述方法包括:提供组合物,所述组合物包含与SEQ ID NO:3具有至少80%序列一致性的蛋白(或多肽),其中所述蛋白在位置930处包含赖氨酸;和指导RNA,所述指导RNA包含与包含6至60个核苷酸的核酸序列反向互补的序列;使细胞与所述组合物接触;使所述指导RNA与真核核酸序列结合;以及切割所述核酸序列。
在这些组合物中,真核核酸序列可以是人核酸序列。任选地,人核酸序列与癌症有关。可替代地,真核核酸序列可以是植物核酸序列。在一些实施方案中,编码SEQ ID NO:1的核苷酸序列包含相比于SEQ ID NO:2至少80%的序列一致性。可替代地,和/或另外地,编码SEQ ID NO:3的核苷酸序列包含相比于SEQ ID NO:4至少80%的序列一致性。通常,核酸序列可以包含人核酸序列或植物核酸序列。本公开提供了使细胞与组合物接触包括将所述组合物施用于需要其的受试者。例如,施用包括静脉内、皮下、肌内、口服或粘膜施用。在一些方面,使细胞与组合物接触包括离体将组合物施用于细胞。
考虑到所述蛋白(或多肽)来自、获得自或衍生自真杆菌科。在本文提供的特定公开内容中,所述蛋白包含核酸酶。优选地,所述蛋白包含核酸酶。在此类实施方案中,核酸酶可包含V型CRISPR相关蛋白。进一步优选地,V型CRISPR相关蛋白可以包含Cas12a蛋白。在一些实施方案中,这样的Cas12a蛋白是经宏基因组学挖掘的。
在一些实施方案中,所述组合物包含或具有7至7.9范围的pH,例如约或恰好7的pH。可替代地,和/或另外地,将所述组合物配制在缓冲液中,所述缓冲液可以包含Bis-Tris丙烷-HCl、MgCl2和/或牛血清白蛋白。例如,所述缓冲液包含0.1至50mM的Bis-Tris丙烷-HCl。所述缓冲液还包含0.1至50mM的MgCl2。所述缓冲液另外包含1至500μg/ml的牛血清白蛋白。所述缓冲液还包含约或恰好10mM的Bis-Tris丙烷-HCl。此外,所述缓冲液包含约或恰好10mM的MgCl2。另外,所述缓冲液包含约或恰好100μg/ml的牛血清白蛋白。
在一些实施方案中,所述蛋白(或多肽)包含纯化标签。例如,纯化标签包含或可以包括选自由以下组成的组中的至少一种标签:His标签、FLAG标签、AU1表位标签、AU5表位标签、噬菌体T7标签、噬菌体V5表位标签、蓝舌病毒标签(B标签)、Glu-Glu标签(EE标签)、HSV表位标签、KT3表位标签、Myc表位标签、PDZ配体标签、聚精氨酸标签、聚天冬氨酸标签、聚半胱氨酸标签、聚苯丙氨酸标签、蛋白C标签、S1标签、S标签、Step标签和VSV-G标签。
组合物中的指导RNA可以包含富含A的原间隔子相邻基序(PAM)序列、富含G的PAM序列、富含T的PAM序列或富含C的PAM序列。组合物中的指导RNA可以包含富含T的PAM序列。例如,PAM序列包含3个T核碱基、2个T核碱基或1个T核碱基。与本公开兼容的PAM序列包含TTTN。在一些实施方案中,指导RNA序列包含1至100个碱基。可替代地,和/或另外地,靶人核酸序列包含处于KRAS、HER2/neu、PD-1、TCR、p53、CCR5、DNMT1、EMX1和LKB1中的区域。
在一些实施方案中,细胞包括癌细胞,优选地人癌细胞,包括但不限于:膀胱癌细胞、骨癌细胞、血液癌细胞、乳腺癌细胞、黑色瘤细胞、甲状腺癌细胞、甲状旁腺癌细胞、骨髓癌细胞、喉咽癌细胞、喉癌细胞、肺癌细胞、食道癌细胞、胰腺癌细胞、结直肠癌细胞、胃癌细胞、舌癌细胞、皮肤癌细胞、脑癌细胞、子宫癌细胞、头颈癌细胞、胆囊癌细胞、口腔癌细胞、中枢神经系统肿瘤细胞、或肝癌细胞。
在一些方面,任何上述方法导致与AsCas12a、FnCas12a或LbCas12a相比至少2倍增高的基因组编辑效率。本公开的方法进一步包括组合物,其中指导RNA包含crRNA和tracrRNA。此外,crRNA包含AAUU的5'重复识别序列。更进一步,在本公开的方法中,组合物在CaCl2、CoCl2、FeCl2、MnSO4或其任何组合的存在下显示切割活性。
本公开另外提供了一种改善V型CRISPR相关蛋白的切割效率的方法,所述方法包括:提供V型CRISPR相关蛋白;鉴定位置925或930处的残基;和将位置925或930处的残基突变为赖氨酸,从而改善V型CRISPR相关蛋白的切割效率。
援引并入
本说明书中所提及的所有出版物、专利和专利申请均通过引用并入本文中,其程度犹如具体地且单独地指出每个单独的出版物、专利或专利申请均通过引用而并入。.
附图说明
本发明的新颖特征在所附权利要求书中具体阐述。通过参考以下阐述其中利用了本发明的原理的说明性实施方案的详细描述以及附图,可以更好地理解本发明的特征和优点,在所述附图中:
图1显示了通过宏基因组挖掘而鉴定本公开的CRISPR相关蛋白(CAS蛋白)的过程。
图2显示了Cas12a的系统树图。
图3显示了本公开的Cas12a蛋白的比对,包括SEQ ID NO:1(mgCas12a-1)、SEQ IDNO:3(mgCas12a-2)、SEQ ID NO:9(AsCas12a)、SEQ ID NO:10(LbCas12a)和SEQ ID NO:11(FnCas12a)。
图4显示了本公开的Cas12a蛋白的比对的延续,包括来自图3的SEQ ID NO:1(mgCas12a-1)、SEQ ID NO:3(mgCas12a-2)、SEQ ID NO:9(AsCas12a)、SEQ ID NO:10(LbCas12a)和SEQ ID NO:11(FnCas12a)。
图5显示了本公开的Cas12a蛋白的比对的延续,包括来自图4的SEQ ID NO:1(mgCas12a-1)、SEQ ID NO:3(mgCas12a-2)、SEQ ID NO:9(AsCas12a)、SEQ ID NO:10(LbCas12a)和SEQ ID NO:11(FnCas12a)。
图6显示了本公开的Cas12a蛋白的比对的延续,包括来自图5的SEQ ID NO:1(mgCas12a-1)、SEQ ID NO:3(mgCas12a-2)、SEQ ID NO:9(AsCas12a)、SEQ ID NO:10(LbCas12a)和SEQ ID NO:11(FnCas12a)。
图7显示了本公开的Cas12a蛋白的比对的延续,包括来自图6的SEQ ID NO:1(mgCas12a-1)、SEQ ID NO:3(mgCas12a-2)、SEQ ID NO:9(AsCas12a)、SEQ ID NO:10(LbCas12a)和SEQ ID NO:11(FnCas12a)。
图8显示了本公开的Cas12a蛋白的比对的延续,包括来自图7的SEQ ID NO:1(mgCas12a-1)、SEQ ID NO:3(mgCas12a-2)、SEQ ID NO:9(AsCas12a)、SEQ ID NO:10(LbCas12a)和SEQ ID NO:11(FnCas12a)。
图9A显示了本公开的Cas12a蛋白的特征图,包括通过宏基因组学挖掘发现的Cas12a蛋白(例如,SEQ ID NO:1(mgCas12a-1)和SEQ ID NO:3(mgCas12a-2)、AsCas12a、LbCas12a和FnCas12a。
图9B显示了Cas12a直系同源物之间的氨基酸序列一致性(%)图表。与表中的所有其他直系同源物相比,AsCas12具有低于40%的序列一致性。LbCas12a和FnCas12a相比于mgCas12a-1和mgCas12a-2具有低于40%序列一致性。LbCas12a相比于FnCas12a具有40%至50%的序列一致性。mgCas12a-1相比于mgCas12a-2具有大于50%的序列一致性。
图10显示了在无缓冲液、NEBuffer 1.1、NEBuffer 2.1或NEBuffer 3.1中在暴露于与crRNA#1复合的mgCas12a-1(SEQ ID NO:1)或mgCas12a-2(SEQ ID NO:3)后靶dsDNA#1的凝胶电泳。
图11显示了在无缓冲液、NEBuffer 1.1、NEBuffer 2.1或NEBuffer 3.1中在暴露于与crRNA#2复合的mgCas12a-1(SEQ ID NO:1)或mgCas12a-2(SEQ ID NO:3)后靶dsDNA#2的另一凝胶电泳。
图12显示了在暴露于与crRNA复合的mgCas12a-1(SEQ ID NO:1)、mgCas12a-2(SEQID NO:3)、AsCas12a、FnCas12a和LbCas12a后靶dsDNA的凝胶电泳。
图13显示了在图10至图12的凝胶电泳实验中测试的靶双链DNA LsXTb12以及crRNA的相应结合区的图。
图14显示了在用核酸酶孵育靶后1小时和在用核酸酶孵育靶后4小时,使用各种核酸酶(包括FnCas12、AsCas12、LbCas12、He-MgCas12a-1(人源化和工程化的mgCas12a-1)和He-MgCas12a-2(人源化和工程化的mgCas12a-2))进行的体外切割测定的结果。
图15A-图15B说明了稻和本氏烟草(N.benthamiana)中FnCas12a和He-MgCas12a-1的基因组编辑效率。
图15A说明FnCas12a在稻中分别在crRNA1-1、crRNA1-2、crRNA2中表现出0.5%、0.3%和0.9%的基因组编辑效率,并且He-MgCas12a-1在稻中分别在crRNA1-1、crRNA1-2、crRNA2中表现出1.9%、0.7%和10.2%的基因组编辑效率。
图15B说明FnCas12a在本氏烟草中分别在crRNA1、crRNA2和crRNA3中表现出0.8%、1.4%和4.8%的基因组编辑效率,并且He-MgCas12a-1在本氏烟草中分别在crRNA1、crRNA2和crRNA3中表现出0.7%,3.7%和3.4%的基因组编辑效率。
图16显示了Cas12a核酸酶(包括mgCas12a-1(野生型)、he_mgCas12a-1(人源化和工程化的mgCas12a-1)、de_mgCas12a-1(失效和工程化的mgCas12a)、mg Cas12a-2、he_mgCas12a-2、de_mgCas12a-2、AsCas12a、FnCas12a和LbCas12a)的体外切割测定。
图17A-图17B显示了在12小时(图17A)和24小时(图17B)的反应时间之后,Cas12a核酸酶(包括mgCas12a-1(野生型)、he_mgCas12a-1(人源化和工程化的mgCas12a-1)、de_mgCas12a-1(失效和工程化的mgCas12a)、mg Cas12a-2、he_mgCas12a-2、de_mgCas12a-2、AsCas12a、FnCas12a和LbCas12a)的体外切割测定。
图18显示了用Cas12a核酸酶(包括mgCas12a-1(野生型)、he_mgCas12a-1(人源化和工程化的mgCas12a-1)、de_mgCas12a-1(失效和工程化的mgCas12a)、mg Cas12a-2、he_mgCas12a-2、de_mgCas12a-2、AsCas12a、FnCas12a和LbCas12a)对靶质粒DNA的体外切割测定。
图19A-图19B显示了在12小时(图19A)和24小时(图19B)的反应时间之后,用Cas12a核酸酶(包括mgCas12a-1(野生型)、he_mgCas12a-1(人源化和工程化的mgCas12a-1)、de_mgCas12a-1(失效和工程化的mgCas12a)、mg Cas12a-2、he_mgCas12a-2、de_mgCas12a-2、AsCas12a、FnCas12a和LbCas12a)对靶质粒DNA的体外切割测定。
图20A-图20C显示了本公开的mgCas12a蛋白的示意图。
图20A显示了相对于图1的简化示意图,显示了从宏基因组数据中挖掘Cas12a蛋白的流程。
图20B显示了本公开的源自宏基因组的Cas12a蛋白和其他Cas12a直系同源物的系统树。
图20C显示了功能表征的新颖Cas12as和AsCas12a的示意图(Yamano等人,2016)。
图21示出了本公开的源自宏基因组的Cas12a和其他直系同源物的无根且基于进化距离的系统树。
图22A-图22B显示本公开的crRNA指导的mgCas12a蛋白对dsDNA的序列特异性切割。
图22A显示crRNA指导的Cas12a蛋白(包括FnCas12a、WT mgCas12a-1和WTmgCas12a-2)对线性dsDNA的序列特异性切割。
图22B显示crRNA指导的Cas12a蛋白(包括FnCas12a、WT mgCas12a-1和WTmgCas12a-2)对环状dsDNA的序列特异性切割。
图23A-图23B显示本公开的mgCas12a蛋白可以利用三种不同类型的Cas12a柄。
图23A显示了与具有来自AsCas12a、FnCas12a和LbCas12a的5’柄的crRNA复合的WTmgCas12a-1对靶线性dsDNA的切割。
图23B显示了与具有来自AsCas12a、FnCas12a和LbCas12a的5’柄的crRNA复合的WTmgCas12a-2对靶线性dsDNA的切割。
图24显示一些Cas12a-RNP表现出不受控制的dsDNA酶活性。将七种不同的Cas12a-RNP与靶dsDNA一起孵育12或24小时。
图25A-图25B显示Cas12a表现出随机dsDNA酶活性。
图25A显示与dsDNA孵育不同时间段的每种Cas12a。
图25B显示每种Cas12a的时间相对于dsDNA酶活性的图。
图26A-图26D显示了在不同二价阳离子存在下每种Cas12a-RNP的活性。
图26A显示了在七种不同二价阳离子存在下,对每种Cas12a-RNP给出了Cas12a-RNP对靶线性dsDNA切割的结果。
图26B显示了在不同二价阳离子存在下FnCas12a-RNP的序列特异性dsDNA切割。
图26C显示了在不同二价阳离子存在下每种WT mgCas12a-1RNP的序列特异性dsDNA切割。
图26D显示了在不同二价阳离子存在下每种WT mgCas12a-2-RNP的序列特异性dsDNA切割。
图27显示了mgCas12a-1、mgCas12a-2和模拟(阴性对照)的编辑效率的图。
图28显示了本氏烟草中靶向性核酸酶蛋白的得失位频率的图。mgCas12a-1的基因编辑效率是FnCpf1的两倍。
具体实施方式
定义
如在本说明书和所附权利要求书中使用的,除非有相反的规定,否则以下术语具有以下指示的含义。
如本文所使用的,术语“包括”或其变体,例如“包含”,应被理解为指示包括任何叙述的特征,而不是排除任何其他特征。因此,如本文所使用的,术语“包含”是涵盖性的并且不排除另外的未叙述的特征。在本文提供的任何组合物和方法的一些实施方案中,“包含”可以被替换为“基本上由……组成”或“由……组成”。短语“基本上由……组成”在本文中用于要求指定的(多个)特征以及不实质上影响要求保护的公开内容的特性或功能的那些特征。如本文中所使用的,术语“由……组成”用于指示仅存在所叙述的特征。
在整个本公开中,以范围格式呈现了各种实施方案。应当理解,范围格式的描述仅仅是为了方便和简洁,而不应被解释为对任何实施方案的范围的不灵活的限制。因此,除非上下文另外明确指出,否则应该认为对范围的描述已经具体公开了所有可能的子范围以及该范围内至下限单位的十分之一的任何单独数值。例如,对范围例如从1到6的描述应被视为已明确公开了子范围例如从1到3、从1到4、从1到5、从2到4、从2到6、从3到6等,以及该范围内的任何单独值,例如1.1、2、2.3、5和5.9。无论范围的宽度如何,这都适用。这些中间范围的上限和下限可以独立地被包括在较小范围内,并且也被包括在本发明内,可能有所述范围内任何明确被排除的限制。当所述范围包括所述极限的一个或两个时,除非上下文另外明确指出,排除那些所包括的极限中的一个或两个的范围也被包括在本发明中。
本文中所用术语仅用于描述具体实施方案的目的,而非意在限制任何实施方案。如本文所用,单数形式“一种”,“一个”和“所述”也旨在包括复数形式,除非上下文另外明确指出。还将理解,术语“包含”和/或“包括”当用于本说明书中时指示所说明的特征、整数、步骤、操作、要素和/或组分的存在但并不排除一个或更多个其他特征、整数、步骤、操作、要素、组分、和/或其组的存在或添加。如本文所使用的,术语“和/或”包括相关联的所列项目中的一个或更多个的任何和所有组合。
除非特别说明或从上下文中显而易见,如本文所用,提及数量或数量范围时术语“约”应理解为是指所述数量和+/-其10%,或针对范围所列出的值,10%低于列出的下限和10%高于列出的上限。
术语“确定”、“测量”、“评估”、“估计”、“测定”和“分析”在本文中经常可互换地用来表示测量形式。所述术语包括确定要素是否存在(例如,检测)。这些术语可以包括定量、定性或定量和定性确定。评估可以是相对的或绝对的。“检测……的存在”除了可以包括根据上下文确定事物是否存在之外,还可以包括确定事物存在的量。
如本文所用,“……的治疗”或“治疗”、“施用”或“缓和”或“改善”可互换使用。这些术语是指获得有益或期望结果(包括但不限于治疗益处和/或预防益处)的方法。“治疗益处”是指消除或改善所治疗的潜在病症。而且,通过消除或改善与潜在病症相关的一种或更多种生理症状,获得治疗益处,从而尽管患者仍然患有所述潜在病症,但在所述患者中观察到了改善。对于预防益处,在一些实施方案中,将组合物施用于有发生特定疾病或病症风险的患者,或施用于报告疾病的一种或更多种生理症状的患者,即使尚未对该疾病进行诊断。
术语“受试者”、“个体”或“患者”在本文中经常可互换地使用。“受试者”可以是包含表达的遗传物质的生物实体。生物实体可以是植物、动物或微生物,包括例如细菌、病毒、真菌和原生动物。受试者可以是生物实体的体内获得或体外培养的组织、细胞及其后代。受试者可以是哺乳动物。哺乳动物可以是人。受试者可以被诊断或怀疑患有疾病的高风险。在某些情况下,受试者不一定被诊断或怀疑患有疾病的高风险。
本文中使用的小节标题仅是为了编排的目的并且不应该被解释为对所述主题进行限制。
本公开提供了通过宏基因组学分析鉴定的新颖内切核酸酶。所鉴定的新颖内切核酸酶优选是DNA内切核酸酶,其可以另外切割RNA。考虑到所鉴定的内切核酸酶可以切割双链DNA、单链DNA或双链DNA(dsDNA)和单链DNA(ssDNA)两者。优选地,所鉴定的内切核酸酶可以包括II类V型CRIRSPR/Cas蛋白,例如Cas12a内切核酸酶。此外,优选地,Cas12a蛋白可以包含RuvC样结构域并且可以缺少在Cas9中发现的HNH结构域。
本公开还提供了用于基因组编辑的合成工具,所述合成工具包括成簇规律间隔短回文重复序列(CRISPR)/CRISPR相关(Cas)系统,其包括指导RNA(crRNA和/或tracrRNA),所述指导RNA将DNA内切核酸酶(Cas蛋白)引导到双链DNA(dsDNA)的要切割的区域。指导RNA(gRNA)是经过合成工程化的,并且包括crRNA和tracrRNA,它们通过接头而连接在一起形成gRNA。考虑到接头可以具有任何长度,并且可以具有核碱基的任何组合,其可以包括富含G的接头、富含A的接头、富含T的接头和富含C的接头。本公开的接头包含1至50个核碱基、5至50个核碱基、10至50个核碱基、15至50个核碱基、20至50个核碱基、25至50个核碱基、30至50个核碱基、35至50个核碱基、40至50个核碱基、或45至50个核碱基。可替代地,本公开提供具有GAAA序列的接头以形成gRNA。本公开提供了任何指导RNA引导的内切核酸酶。本公开的Cas蛋白包括选自Cas1、Cas1B、Cas2、Cas3、Cas4、Cas5、Cas6、Cas7、Cas8、Cas9、Cas10、Cas12a、Cas12b、Cas12c、Cas12d、Cas12e、Cas13a、Cas13b、Cas13c、Cas13d、Csy1、Csy2、Csy3、Cse1、Cse2、Csc1、Csc2、Csa5、Csn2、Csm2、Csm3、Csm4、Csm5、Csm6、Cmr1、Cmr3、Cmr4、Cmr5、Cmr6、Csb1、Csb2、Csb3、Csx17、Csx14、Csx10、Csx16、CsaX、Csx3、Csx1、Csx15、Csf1、Csf2、Csf3和Csf4的任何核酸酶。本公开还提供了一种或更多种Cas蛋白,特别是Cas12a蛋白,也称为Cpf1。Cas12a蛋白不需要tracrRNA,并且因此与crRNA序列复合以将内切核酸酶指导至dsDNA的关注区域。
本公开还提供了与指导RNA复合的Cas12a蛋白,所述指导RNA小于用于Cas9蛋白的包含多达约100个核苷酸的指导RNA。于是,本公开的CRISPR-Cas12a内切核酸酶比CRISPR/Cas9系统小得多,因此,更容易包装在病毒载体中以进行递送。本公开的Cas12a蛋白能够识别原间隔子相邻基序(PAM)序列,其是与待结合的靶核酸序列相邻的识别序列。本公开的一些Cas12a蛋白识别核酸序列区段。与识别富含G的PAM序列的Cas9蛋白不同,本公开的Cas12a蛋白能够识别富含T的PAM序列,从而增加了双链DNA的可被靶向和切割的区域数量。可替代地,本公开的Cas12a蛋白也能够识别富含A的PAM序列、富含G的PAM序列和富含C的PAM序列。PAM包含三核碱基PAM,例如富含T的PAM。例如,一些指导RNA引导的内切核酸酶(例如本文所述的Cas12a蛋白)识别5'-TTTN-3'的PAM序列。可替代地,具有两个T核苷碱基或1个T核苷碱基的PAM序列也与本公开相符。也与本公开相符的是富含嘧啶或富含嘌呤的PAM序列。
与接近识别位点进行切割的Cas9蛋白不同,本公开的Cas12a蛋白离识别位点更远地进行切割。这是特别有利的,因为所得的非同源末端连接(NHEJ)导致了PAM序列的保存,从而允许进一步编辑并改善同源性定向修复(HDR)。最后,与一经切割就在dsDNA中产生平末端的Cas9蛋白不同,本公开的Cas12a内切核酸酶在切割时就在dsDNA中产生交错或粘性的末端。因此,一些指导RNA引导的内切核酸酶,例如本公开的Cas12a蛋白,通过产生交错或粘性的末端来促进基因组编辑,所述交错或粘性的末端更可能通过HDR而不是随机NHEJ进行修复。
Cas12a蛋白
本公开提供了通过宏基因组学挖掘而鉴定的Cas12a蛋白(例如,SEQ ID NO:1或SEQ ID NO:3或本文公开的与其相关的任何序列)。本公开可互换地提及多肽和蛋白。因此,本公开的多肽是Cas12a蛋白,其也可以称为Cas12a多肽。例如,从NCBI Genbank BLAST数据库下载宏基因组碱基序列,并将其保存为本地BLASTp数据库。从Uniprot数据库下载了许多不同的Cas12a和Cas1氨基酸序列。MetaCRT用于从宏基因组中鉴定关键的CRISPR重复序列和间隔子序列,并使用Prodigal程序提取所有具有CRISPR序列的宏基因组序列。基于CRISPR序列建立分类层次,并通过搜索相比于其他Cas12a序列的同源性来鉴定新颖Cas12a蛋白。这些Cas12a序列可互换地称为Cas12a蛋白或宏基因组Cas12a内切核酸酶(mgCas12a)。
在一些实施方案中,Cas12a蛋白是从真杆菌科获得或衍生的(或修饰的)。例如,本文所述的Cas12a蛋白获自或衍生自(或修饰自)直肠真杆菌(Eubacterium rectale)或挑剔真杆菌(Eubacterium eligens)。
在一些实施方案中,经由宏基因组学挖掘发现的Cas12a蛋白可以是野生型蛋白。然而,本文所述的Cas12a蛋白可以被人源化和/或工程化以相容于施用给有需要的受试者。在某些情况下,人源化的Cas12a蛋白可能在野生型Cas12a蛋白序列中包含突变,由此可能使人源化的Cas12a蛋白相对于野生型Cas12a蛋白而言,在不影响蛋白功能的情况下不太可能引起免疫原性。如果使用质粒进行施用,则对人源化的Cas12a序列进行密码子优化以促进在哺乳动物或人系统中的表达。工程化的Cas12a蛋白在序列中包含突变,由此改善核酸酶的活性和功能。在一些情况下,本文公开的Cas12a的人源化和工程化增加了切割效率。可替代地或组合地,人源化或工程化可以增加切割特异性。在一些情况下,将失效且工程化的(“de”)Cas12a蛋白用作对照,以比较相比于野生型或人源化和/或工程化的Cas12a蛋白的相对活性。失效Cas12a蛋白包括野生型Cas12a蛋白序列中的突变,所述突变使所述蛋白无功能且失活。
本公开的Cas12a蛋白(例如,SEQ ID NO:1或SEQ ID NO:3或本文所公开的与其相关的任何序列)在特定pH下切割核酸序列。例如,Cas12a内切核酸酶在约pH 7至约pH 7.9、或约pH 7至约pH 8.0切割核酸序列。在一些情况下,Cas12a内切核酸酶在约pH 7、约pH7.1、约pH 7.2、约pH 7.3、约pH 7.4、约pH 7.5、约pH 7.6、约pH 7.7、约pH 7.8或约pH 7.9进行切割。本文所述的Cas12a内切核酸酶能够在约pH 7至约pH 7.3、约pH 7.3至约pH 7.6或约pH 7.6至约pH 7.9切割核酸序列。本文公开的Cas12a内切核酸酶在大于7.9的pH下不显示切割活性,并且因此是失活的。例如,本文所述的Cas12a内切核酸酶(例如,SEQ ID NO:1或SEQ ID NO:3或本文所公开的与其相关的任何序列)被激活并且能够在包含约7.0至约7.9的pH的细胞环境进行切割。因此,如果环境pH在约7.0至约7.9之外,则本文所述的Cas12a内切核酸酶(例如,SEQ ID NO:1或SEQ ID NO:3或本文所公开的与其相关的任何序列)失活并变为惰性。可替代地,本公开的Cas12a蛋白能够在任何pH下切割核酸序列,例如,本文所述的Cas12a内切核酸酶能够在约pH 2、约pH 2.5、约pH 3、约pH 3.5、约pH 4、约pH4.5、约pH 5、约pH 5.5、约pH 6、约pH 6.5、约pH 7、约pH 7.5、约pH 8、约pH 8.5、约pH 9、约pH 9.5、约pH 10、约pH 10.5、约pH 11、约pH 11.5、约pH 12、约pH 2至约pH 12、约pH 2至约pH 2.5、约pH 3至约pH 3.5、约pH 4至约pH 4.5、约pH 5至约pH 5.5、约pH 6至约pH 6.5、约pH 7至约pH 7.5、约pH 8至约pH 8.5、约pH 9至约pH 9.5、约pH 10至约pH 10.5、约pH 11至约pH 11.5、或约pH 12至约pH 12.5下切割核酸序列。本公开的Cas12a蛋白也可以在任何环境pH下是失活的和惰性的,例如,本文所述的Cas12a内切核酸酶可以在约pH 2、约pH 2.5、约pH 3、约pH 3.5、约pH 4、约pH 4.5、约pH 5、约pH 5.5、约pH 6、约pH 6.5、约pH 7、约pH7.5、约pH 8、约pH 8.5、约pH 9、约pH 9.5、约pH 10、约pH 10.5、约pH 11、约pH 11.5、约pH12、约pH 2至约pH 12、约pH 2至约pH 2.5、约pH 3至约pH 3.5、约pH 4至约pH 4.5、约pH 5至约pH 5.5、约pH 6至约pH 6.5、约pH 7至约pH 7.5、约pH 8至约pH 8.5、约pH 9至约pH9.5、约pH 10至约pH 10.5、约pH 11至约pH 11.5、或约pH 12至约pH 12.5是惰性的。
因此,优选的是,包含Cas12a蛋白的组合物的pH范围可以在约pH 7至约pH 7.9、约pH 7至约pH 7.3、约pH 7.3至约pH 7.6、或约pH 7.6至约pH 7.9、或约pH 7、约pH 7.1、约pH7.2、约pH 7.3、约pH 7.4、约pH 7.5、约pH 7.6、约pH 7.7、约pH 7.8、或约pH 7.9。然而,在Cas12a蛋白可以在任何其他pH范围内维持其活性(例如,可以切割核酸序列)的情况下,还考虑到包含Cas12a蛋白的组合物可以具有其他pH范围(例如,约pH 2、约pH 2.5、约pH 3、约pH 3.5、约pH 4、约pH 4.5、约pH 5、约pH 5.5、约pH 6、约pH 6.5、约pH 7、约pH 7.5、约pH8、约pH 8.5、约pH 9、约pH 9.5、约pH 10、约pH 10.5、约pH 11、约pH 11.5、约pH 12、约pH 2至约pH 12、约pH 2至约pH 2.5、大约pH 3至大约pH 3.5、大约pH 4至大约pH 4.5、大约pH 5至大约pH 5.5、大约pH 6至大约pH 6.5、大约pH 7至大约pH 7.5、大约pH 8至大约pH 8.5、大约pH 9至约pH 9.5、约pH 10至约pH 10.5、约pH 11至约pH 11.5或约pH 12至约pH12.5)。
本公开的Cas12a蛋白(例如,SEQ ID NO:1或SEQ ID NO:3或本文所公开的与其相关的任何序列)在特定温度下切割核酸序列。例如,Cas12a内切核酸酶在约0°至约100℃、约10℃至约20℃、约20℃至约30℃、约30℃至约40℃、约40℃至约50℃、约50℃至约60℃、约60℃至约70℃、约70℃至约80℃、约80℃至约90℃、约90℃至约100℃、约100℃至约110℃、约110℃至约120℃、或约120℃至约130℃切割核酸序列。
将本公开中描述的Cas12a内切核酸酶(例如,SEQ ID NO:1或SEQ ID NO:3或本文所公开的与其相关的任何序列)配制在赋形剂中,优选药学上可接受的赋形剂(例如,稀释剂、载剂(carrier)、缓冲液)。换句话说,包含Cas12a内切核酸酶的组合物可以进一步包含赋形剂,优选地药学上可接受的赋形剂(例如,稀释剂、载剂、缓冲液)。在一些实施方案中,缓冲液包含Bis-Tris丙烷-HCl。缓冲液可替代地、另外地或任选地包含MgCl2。另外地或任选地,缓冲液补充有蛋白,例如,与本文所述的Cas12内切核酸酶一起使用的缓冲液可进一步包含牛血清白蛋白(BSA)。将本文所述的Cas12a内切核酸酶(例如,SEQ ID NO:1或SEQ IDNO:3或本文公开的与其相关的任何序列)配制在例如缓冲液中,所述缓冲液包含从0.1至50mM Bis-Tris丙烷-HCl,从0.1到5mM Bis-Tris丙烷-HCl、从5到15mM Bis-Tris丙烷-HCl、从15到25mM Bis-Tris丙烷-HCl、从25到35mM Bis-Tris丙烷-HCl、从35至45mM Bis-Tris丙烷HCl、45至50mM Bis-Tris丙烷-HCl、少于0.1mM Bis-Tris丙烷-HCl、少于0.5mM Bis-Tris丙烷-HCl、少于1mM Bis-Tris丙烷-HCl、少于5mM Bis-Tris丙烷-HCl、少于10mM Bis-Tris丙烷-HCl、少于15mM Bis-Tris丙烷-HCl、少于20mM Bis-Tris丙烷-HCl、少于25mM Bis-Tris丙烷-HCl、少于30mM Bis-Tris丙烷-HCl、少于35mM Bis-Tris丙烷-HCl、少于40mMBis-Tris丙烷-HCl、少于45mM Bis-Tris丙烷-HCl、或少于50mM的Bis-Tris丙烷-HCl。缓冲液还包含0.1至50mM MgCl2、0.1至5mM MgCl2、5至15mM MgCl2、15至25mM MgCl2、25至35mMMgCl2、35至45mM MgCl2、45至50mM MgCl2、少于0.1mM MgCl2、少于0.5mM MgCl2、少于1mMMgCl2、少于5mM MgCl2、少于10mM MgCl2、少于15mM MgCl2、少于20mM MgCl2、少于25mMMgCl2、少于30mM MgCl2、少于35mM MgCl2、少于40mM MgCl2、少于45mM MgCl2、或少于50mMMgCl2。此外,缓冲液包含1至500μg/ml BSA、1至50μg/ml BSA、50至100μg/ml BSA、100至150μg/ml BSA、150至200μg/ml BSA、200至250μg/ml BSA、250至300μg/ml BSA、300至350μg/mlBSA、350至400μg/ml BSA、400至450μg/ml BSA、450至500μg/ml BSA、少于1μg/ml BSA、少于10μg/ml BSA、少于20μg/ml BSA、少于30μg/ml BSA、少于40μg/ml BSA、少于50μg/ml BSA、少于100μg/ml BSA、少于150μg/ml BSA、少于200μg/ml BSA、少于250μg/ml BSA、少于300μg/ml BSA、少于350μg/ml BSA、少于400μg/ml BSA、少于450μg/ml BSA、或少于500μg/mlBSA。本公开另外描述了在包含10mM Bis-Tris丙烷-HCl、10mM MgCl2和100μg/ml BSA的缓冲液中配制的Cas12a内切核酸酶。在以上为Bis-Tris丙烷、MgCl2和BSA提供的范围之外的替代方案也与本发明相符。
本公开的Cas12a蛋白切割靶DNA的1%至100%、10%至90%、50%至100%、1%至10%、10%至20%、20%至30%、30%至40%、40%至50%、50%至60%、60%至70%、70%至80%、80%至90%、90%至100%、或80%至100%。与本发明相容的靶DNA包括线性DNA或质粒DNA。本公开的Cas12a蛋白在0至1小时、1小时至5小时、5小时至10小时、10小时至20小时、20小时至30小时、30小时至40小时、40小时至50小时、50小时至60小时、60小时至70小时、70小时至80小时、80小时至90小时、或90小时至100小时中切割靶DNA的1%至100%、10%至90%、50%至100%、1%至10%、10%至20%、20%至30%、30%至40%、40%至50%、50%至60%、60%至70%、70%至80%、80%至90%、90%至100%、或80%至100%。本公开的Cas12a蛋白在1小时内切割靶DNA的90%至100%。另外,本公开的Cas12a蛋白在12小时内切割靶DNA的90%至100%。本公开的Cas12a蛋白在24小时内切割靶DNA的90%至100%。通过使0.1pmol至100pmol、0.1至10pmol、10pmol至20pmol、20pmol至30pmol的本公开的Cas12a蛋白、30pmol至40pmol、40pmol至50pmol、50pmol至60pmol、60pmol至70pmol、70pmol至80pmol、80pmol至90pmol、或90至100pmol的本公开的Cas12a蛋白与1ng至1000ng的靶DNA、1ng至100ng的靶DNA、100ng至200ng的靶DNA、200ng至300ng的靶DNA、300ng至400ng的靶DNA、400ng至500ng的靶DNA、500ng至600ng的靶DNA、600ng至700ng的靶DNA、700ng至800ng的靶DNA、800ng至900ng的靶DNA或900ng至1000ng的靶DNA反应来实现上述切割效率。通过使6pmol的本公开的Cas12a蛋白与300ng靶DNA反应来实现上述切割效率。在37℃下实现上述切割效率。
在一些情况下,本公开的Cas12a蛋白将靶DNA切割成切割产物而没有完全降解DNA,或者换句话说,没有表现出无终止的DNA酶活性。被本公开的Cas12a蛋白切割的靶DNA包括任何双链DNA(dsDNA)、任何线性化的dsDNA和任何质粒dsDNA。
优选地,CAS12A蛋白的功能结构域包括SEQ ID NO:1的残基829至991或SEQ IDNO:3的残基825至996。可替代地,Cas12a蛋白相比于SEQ ID NO:1的残基829至991或SEQ IDNO:3的残基825至996具有至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或至少99%的序列一致性。
可替代地和/或另外地,本公开的Cas12a蛋白相比于SEQ ID NO:1中的功能结构域具有至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或至少99%的序列一致性。
可替代地,本公开的Cas12a蛋白相比于SEQ ID NO:3的功能结构域具有至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或至少99%的序列一致性。
作为另一个实例,本文公开的一些蛋白质与本公开的Cas12a蛋白共享至少20个连续残基、至少25个连续残基、至少40个连续残基、至少55个连续残基、至少70个连续残基、至少85个连续残基、至少100个连续残基、至少115个连续残基、至少130个连续残基、至少145个连续残基、至少160个连续残基、至少175个连续残基、至少190个连续残基、至少205个连续残基、至少220个连续残基、至少235个连续残基、至少250个连续残基、至少265个连续残基、至少280个连续残基、至少295个连续残基、至少310个连续残基、至少325个连续残基、至少340个连续残基、至少355个连续残基、至少370个连续残基、至少385个连续残基、至少400个连续残基、至少415个连续残基、至少430个连续残基、至少445个连续残基、至少460个连续残基、至少475个连续残基、至少490个连续残基、至少505个连续残基、至少520个连续残基、至少535个连续残基、至少550个连续残基、至少565个连续残基、至少580个连续残基、至少595个连续残基、至少610个连续残基、至少625个连续残基、至少640个连续残基、至少655个连续残基、至少670个连续残基、至少685个连续残基、至少700个连续残基、至少715个连续残基、至少730个连续残基、至少745个连续残基、至少760个连续残基、至少775个连续残基、至少790个连续残基、至少805个连续残基、至少820个连续残基、至少835个连续残基、至少850个连续残基、至少865个连续残基、至少880个连续残基、至少895个连续残基、至少910个连续残基、至少925个连续残基、至少940个连续残基、至少955个连续残基、至少970个连续残基、至少985个连续残基、至少1000个连续残基、至少1015个连续残基、至少1030个连续残基、至少1045个连续残基、至少1060个连续残基、至少1075个连续残基、至少1090个连续残基、至少1105个连续残基、至少1120个连续残基、至少1135个连续残基、至少1150个连续残基、至少1165个连续残基、至少1180个连续残基、至少1195个连续残基、至少1210个连续残基、至少1225个连续残基、至少1240个连续残基、或至少1250个连续残基。
本公开的Cas12a蛋白相比于SEQ ID NO:1的至少50个连续残基、至少100个连续残基、至少150个连续残基、至少200个连续残基、至少250个连续残基、至少300个连续残基、至少350个连续残基、至少400个连续残基、至少450个连续残基、至少500个连续残基、至少550个连续残基、至少600个连续残基、至少650个连续残基、至少700个连续残基、至少750个连续残基、至少800个连续残基、至少850个连续残基、至少900个连续残基、至少950个连续残基、至少1000个连续残基、至少1050个连续残基、至少1100个连续残基、至少1150个连续残基、至少1200个连续残基、至少1250个连续残基、或至少1263个连续残基具有至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或至少99%的序列一致性。
本公开的Cas12a蛋白相比于SEQ ID NO:3的至少50个连续残基、至少100个连续残基、至少150个连续残基、至少200个连续残基、至少250个连续残基、至少300个连续残基、至少350个连续残基、至少400个连续残基、至少450个连续残基、至少500个连续残基、至少550个连续残基、至少600个连续残基、至少650个连续残基、至少700个连续残基、至少750个连续残基、至少800个连续残基、至少850个连续残基、至少900个连续残基、至少950个连续残基、至少1000个连续残基、至少1050个连续残基、至少1100个连续残基、至少1150个连续残基、至少1200个连续残基、至少1250个连续残基、或至少1275个连续残基具有至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或至少99%的序列一致性。
本公开的Cas12a蛋白相比于SEQ ID NO:1的全长序列具有至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%的序列一致性。可替代地,本公开的Cas12a蛋白相比于SEQ ID NO:3的全长序列具有至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或至少99%的序列一致性。
本公开的Cas12a蛋白相比于SEQ ID NO:1的残基1至100、残基100至200、残基200至300、残基300至400、残基400至500、残基500至600、残基600至700、残基700至800、残基800至900、残基900至1000、残基1000至1100、残基1100至1200或残基1200至1263具有至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%的序列一致性。
本公开的Cas12a蛋白相比于SEQ ID NO:3的残基1至100、残基100至200、残基200至300、残基300至400、残基400至500、残基500至600、残基600至700、残基700至800、残基800至900、残基900至1000、残基1000至1100、残基1100至1200或残基1200至1275具有至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%的序列一致性。
本公开提供了Cas12a蛋白,其具有包含SEQ ID NO:1的氨基酸序列,并且在本文中也称为mgCas12a-1。另外,本公开的Cas12a蛋白由包含SEQ ID NO:2的核苷酸序列编码。SEQID NO:2的核苷酸序列编码SEQ ID NO:1的mgCas12a蛋白。
本公开另外提供了Cas12a蛋白,其具有包含SEQ ID NO:3的氨基酸序列,并且在本文中也称为mgCas12a-2。另外,本公开的Cas12a蛋白由包含SEQ ID NO:4的核苷酸序列编码。SEQ ID NO:4的核苷酸序列编码SEQ ID NO:3的mgCas12a蛋白。
本公开提供了本公开的Cas12a蛋白,其在位置(残基)925处具有赖氨酸(K),如SEQID NO:1所示。另外,本公开的Cas12a蛋白在位置(残基)930处具有赖氨酸(K),如SEQ IDNO:3所示。因此,在一些实施方案中,当Cas12a蛋白或其变体分别与SEQ ID NO:1或SEQ IDNO:3最佳对齐时,Cas12a蛋白或其变体在位置(残基)925或930处或在位置(残基)925或930以外的其他位置处可以具有赖氨酸(K)。换句话说,在位置(残基)925处具有赖氨酸(K)的本公开的Cas12a蛋白包括Cas12a蛋白或Cas12a蛋白变体(Cas12a蛋白的一部分、包括Cas12a蛋白的某些结构域的多肽,等),其在与SEQ ID NO:1的残基925对应的位置处具有赖氨酸(K),在与SEQ ID NO:1的残基925对齐或相对于SEQ ID NO:1的残基925对齐的位置处具有赖氨酸(K)。例如,如果Cas12a蛋白或其变体的氨基酸残基915-930与SEQ ID NO:1的氨基酸残基918-933对齐,则赖氨酸(K)优选位于氨基酸残基922中,所述氨基酸残基922相对于、对应于或对齐至SEQ ID NO:1的残基925。
本公开的Cas12a多肽还可具有氨基酸序列,所述氨基酸序列包含与SEQ ID NO:1的位置925处的赖氨酸对齐的赖氨酸、与SEQ ID NO:3的位置930处的赖氨酸对齐的赖氨酸、与SEQ ID NO:1的位置925处的赖氨酸对齐的赖氨酸、与SEQ ID NO:3的位置930处的赖氨酸对齐的赖氨酸,或其任何组合。例如,本公开提供了一种组合物,其包含:与SEQ ID NO:1的残基829至残基991具有至少80%序列一致性的多肽,其中所述多肽包含氨基酸序列,所述氨基酸序列包含与SEQ ID NO:1的位置925处的赖氨酸对齐的赖氨酸;与SEQ ID NO:3的残基825至残基996具有至少80%序列一致性的多肽,其中所述多肽包含氨基酸序列,所述氨基酸序列包含与SEQ ID NO:3的位置930处的赖氨酸对齐的赖氨酸;与SEQ ID NO:1具有至少80%序列一致性的多肽,其中所述多肽包含氨基酸序列,所述氨基酸序列包含与SEQ IDNO:1的位置925处的赖氨酸对齐的赖氨酸;或与SEQ ID NO:3具有至少80%序列一致性的多肽,其中所述多肽包含氨基酸序列,所述氨基酸序列包含与SEQ ID NO:3的位置930处的赖氨酸对齐的赖氨酸。在本文公开的Cas12a多肽中,在某位置上与第二残基对齐的第一残基可以指示所述第一残基在候选多肽序列中,并且所述对齐是参考参考多肽序列中的第二残基和位置。例如,与SEQ ID NO:1的残基829至残基991具有至少80%序列一致性的多肽(其中所述多肽包含氨基酸序列,所述氨基酸序列包含与SEQ ID NO:1的位置925处的赖氨酸对齐的赖氨酸)可以表示具有可以与SEQ ID NO:1的Lys925对齐的赖氨酸的候选多肽。可以使用本文公开的任何方法进行比对,并且对齐的残基对于本领域技术人员将是显而易见的。
另外,本公开的Cas12a蛋白具有包含SEQ ID NO:5的氨基酸序列,其包含在位置925处具有赖氨酸突变成谷氨酰胺(K925Q)的SEQ ID NO:1。本公开另外提供了Cas12a蛋白,其具有包含SEQ ID NO:6的氨基酸序列,所述氨基酸序列包含在位置930处具有赖氨酸突变成谷氨酰胺(K930Q)的SEQ ID NO:3。
SEQ ID NO:1的位置925处的赖氨酸被任何其他氨基酸残基置换是与本公开相符的。SEQ ID NO:1的位置925处的赖氨酸也可以被置换为精氨酸(Arg)、组氨酸(His)、天冬氨酸(Asp)、谷氨酸(Glu)、丝氨酸(Ser)、苏氨酸(Thr)、天冬酰胺(Asn)、谷氨酰胺(Gln)、酪氨酸(Tyr)、丙氨酸(Ala)、异亮氨酸(Ile)、亮氨酸(Leu)、缬氨酸(Val)、苯丙氨酸(Phe)、蛋氨酸(Met)、色氨酸(Trp)、甘氨酸(Gly)、脯氨酸(Pro)或半胱氨酸(Cys)。另外,本公开还描述了SEQ ID NO:3的位置930处的赖氨酸被任何其他氨基酸残基置换。SEQ ID NO:1的位置925处的赖氨酸可以被置换为精氨酸(Arg)、组氨酸(His)、天冬氨酸(AsP)、谷氨酸(Glu)、丝氨酸(Ser)、苏氨酸(Thr)、天冬酰胺(Asp)、谷氨酰胺(Gln)、酪氨酸(Tyr)、丙氨酸(Ala)、异亮氨酸(Ile)、亮氨酸(Leu)、缬氨酸(Val)、苯丙氨酸(Phe)、蛋氨酸(Met)、色氨酸(Trp)、甘氨酸(Gly)、脯氨酸(Pro)或半胱氨酸(Cys)。
本公开的Cas12a的碱基序列(例如,mgCas12a-1)是人密码子优化的(其在某些情况下可以改善蛋白质表达)并具有包含SEQ ID NO:7的序列。本公开的Cas12a的碱基序列(例如,mgCas12a-2)是人密码子优化的(其在某些情况下可以改善蛋白质表达)并具有包含SEQ ID NO:8的序列。
本文公开的Cas12a蛋白(例如,SEQ ID NO:1或SEQ ID NO:3或本文公开的与其相关的任何序列)切割DNA或RNA。
表1显示了本公开的示例性Cas12a序列,包括SEQ ID NO:1至SEQ ID NO:8。
表1–示例性Cas12a序列
本公开的Cas12a(例如,SEQ ID NO:1或SEQ ID NO:3或本文公开的与其相关的任何序列)蛋白包含以下氨基酸残基区段中的一个或更多个:LIPTETT(SEQ ID NO:12)、MDDYYR(SEQ ID NO:13)、NAEIF(SEQ ID NO:14)、CQKNK(SEQ ID NO:15)、LHKQILC(SEQ IDNO:16)、KVKKAVK(SEQ ID NO:17)、VRNYVTQKPY(SEQ ID NO:18)、GWSKSKEY(SEQ ID NO:19)、DLIDYFK(SEQ ID NO:20)、DIVLKLNGEAEIFFRKSS(SEQ ID NO:21)、GSILVNRTYE(SEQ ID NO:22)、ELSDEA(SEQ ID NO:23)、IVKDYRYT(SEQ ID NO:24)、LHVIGIDRGERNLIYVSVID(SEQ IDNO:25)、KYNAIIAMEDL(SEQ ID NO:26)、GRFKVERQVYQKFETMLI(SEQ ID NO:27)、IFYVPAAYTSKIDPTTGF(SEQ ID NO:28)或ISPVLN(SEQ ID NO:29)。
本公开内容还提供了改善V型CRISPR相关蛋白的切割效率的方法,其中所述方法包括:提供V型CRISPR相关蛋白,鉴定关键位置(例如SEQ ID NO:1的位置925或SEQ ID NO:3的位置930)处的残基,以及将关键位置处的残基突变为赖氨酸,从而提高内切核酸酶的切割效率。
与其他Cas12a直系同源物(例如,AsCas12a、FnCas12a或LbCas12a)相比,本公开的宏基因组挖掘的Cas12a蛋白(例如,mgCas12a-1或mgCas12a-2)显示出优异的编辑效率。例如,在一些情况下,本公开的宏基因组学挖掘的Cas12a蛋白表现出比其他Cas12a直系同源物(例如FnCas12a、AsCas12和/或LbCas12a)至少1.5倍、至少2倍、至少5倍、至少10倍、至少15倍、至少20倍、至少25倍、至少30倍、至少35倍、至少40倍、至少45倍、至少50倍、至少60倍、至少70倍、至少80倍、至少90倍、至少100倍、至少150倍、至少200倍、至少250倍、至少300倍、至少350倍、至少400倍、至少450倍、至少500倍、至少600倍、至少700倍、至少800倍、至少900倍、至少1000倍、至少2000倍、1.5至5倍、5至10倍、10至15倍、15至20倍、20至25倍、25至30倍、30至35倍、35至40倍、40至45倍、45至50倍、50至60倍、60至70倍、70至80倍、80至90倍、90至100倍、100至150倍、150至200倍、200至250倍、250至300倍、300至350倍、350至400倍、400至450倍、450至500倍、500至600倍、600至700倍、700至800倍、800至900倍、900至1000倍、1000至2000倍、1.5至2000倍、1.5至20倍、5至10倍、10至40倍、20至40倍、5至15倍、5至100倍、50至80倍、2至4倍、4至8倍、8至10倍、或10至14倍更有效的基因组编辑。可以通过任何已知的定量方法来测量编辑效率,例如测量得失位百分比或靶向扩增子的深度测序。
考虑到,根据反应条件,本公开的宏基因组学挖掘的Cas12a蛋白可以表现出低的随机DNA酶活性,与其他Cas12a直系同源物至少相似的随机DNA酶活性,或甚至比其他Cas12a直系同源物更低的随机DNA酶活性,同时还实现比其他Cas12a直系同源物更高的编辑效率,或者同时保持与其他Cas12a直系同源物相当的编辑效率。例如,如图24和图25A中所示,dsDNA底物和切割产物几乎完全降解,这可能是由于反应孵育12小时和24小时后,某些Cas12a直系同源物(例如,FnCas12a、LbCas12a)的随机DNA酶活性所致,而在与本公开的宏基因组学挖掘的Cas12a蛋白(WT mg-1和WT mg-2)的12小时反应中检测到底物和切割产物二者。图25B显示了每种Cas12a的时间相对于dsDNA酶活性的图,表明对于mgCas12a-1,靶底物dsDNA在较晚时间点仍然存在,说明mgCas12a-1的较低的随机DNA酶活性。
在一些实施方案中,本公开的宏基因组挖掘的Cas12a蛋白(例如,mgCas12a-1或mgCas12a-2)在宽范围的二价阳离子的存在下展示切割活性。例如,在CaCl2、CoCl2、FeCl2、MnSO4或其任何组合的存在下,本公开的宏基因组挖掘的Cas12a蛋白(例如,mgCas12a-1或mgCas12a-2)可以展示切割活性。
下面的表2显示了其他Cas12a蛋白的序列,包括SEQ ID NO:9所示的氨基酸球菌属(Acidaminococcus sp.)Cas12a(AsCas12a)、SEQ ID NO:10所示的毛螺菌科(Lachnospiraceae sp.)(LbCas12a)和SEQ ID NO:11所示的Francisella tularensissubsp.novicidia(FnCas12a)。
表2–其他Cas12a蛋白
纯化标签
在一些实施方案中,考虑到本公开的Cas12a蛋白形成异源蛋白,其在N末端或C末端与纯化标签融合。本公开的Cas12a蛋白(例如SEQ ID NO:1或SEQ ID NO:3或本文公开的与其相关的任何序列)包括在其N末端或C末端掺入的纯化标签。在本公开的Cas12a蛋白的N末端或C末端掺入了纯化标签,以提供易于纯化的重组多肽。因此,所述纯化标签促进Cas12a蛋白的纯化。
例如,本公开的Cas12蛋白(例如,SEQ ID NO:1或SEQ ID NO:3或本文公开的与其相关的任何序列)具有His标签,例如6xHis或聚His标签。所述的His标签能够结合几种金属离子,例如镍、钴和铜。因此,使用金属亲和色谱法快速纯化本公开的带His标签的Cas12a蛋白(例如,SEQ ID NO:1或SEQ ID NO:3或本文所公开的与其相关的任何序列)。可替代地,本公开提供了具有标签(其包含具有DYKDDDDK序列的肽(SEQ ID NO:30))的Cas12a蛋白(例如,SEQ ID NO:1或SEQ ID NO:3或本文所公开的与其相关的任何序列)。所述标签被抗抗体识别。因此,使用亲和色谱法快速纯化了本公开的带标签的Cas12a蛋白(例如,SEQ ID NO:1或SEQ ID NO:3或本文所公开的与其相关的任何序列)。
本公开的Cas12a蛋白(例如,SEQ ID NO:1或SEQ ID NO:3或本文所公开的与其相关的任何序列)具有选自由以下组成的组中的纯化标签:His标签、FLAG标签、AU1表位标签、AU5表位标签、噬菌体T7标签、噬菌体V5表位标签、蓝舌病毒标签(B标签)、Glu-Glu标签(EE标签)、HSV表位标签、KT3表位标签、Myc表位标签、PDZ配体标签、聚精氨酸标签、聚天冬氨酸标签、聚半胱氨酸标签、聚苯丙氨酸标签、蛋白C标签、S1标签、S标签、Step标签和VSV-G标签。
Cas12a内切核酸酶的指导RNA
本公开的Cas12a内切核酸酶(例如,SEQ ID NO:1或SEQ ID NO:3或本文公开的与其相关的任何序列)与crRNA序列偶联,所述crRNA序列将Cas12a内切核酸酶引导至关注的核酸序列。因此,crRNA也称为指导RNA或简称gRNA。crRNA序列与关注的核酸序列例如真核核酸序列反向互补。真核核酸序列可以是人核酸序列或植物核酸序列。换句话说,crRNA将本文所述的Cas12a内切核酸酶靶向基因组中的关注区域。具体而言,crRNA被设计为与仅存在于癌细胞中而不存在于正常细胞中的核酸序列反向互补。在某些情况下,仅存在于癌细胞中的核酸序列可能与正常细胞中存在的核酸序列仅具有一个碱基的差异。在某些情况下,仅存在于癌细胞中的核酸序列可包含基因的一部分或可包含已被部分置换或丧失的基因。例如,仅存在于癌细胞中的核酸序列可以是包含单核苷酸多态性(SNP)的癌细胞中的核酸序列。具有与仅存在于癌细胞中的核酸序列反向互补的序列的指导RNA结合所述核酸序列,并且将不结合脱靶核酸序列或不结合不存在于癌细胞中的核酸序列。
用于指导本公开的Cas12a内切核酸酶的指导RNA,也称为crRNA序列,是10至60个核苷酸长、10至15个核苷酸长、15至20个核苷酸长、20至25个核苷酸长、25至30个核苷酸长、30至35个核苷酸长、35至40个核苷酸长、40至45个核苷酸长、45至50个核苷酸长、50至55个核苷酸长、55至60个核苷酸长、1至100个核苷酸长、1至200个核苷酸长、1至200个核苷酸长、1至300个核苷酸长、1至50个核苷酸长、50至100个核苷酸长、100至150个核苷酸长、150至200个核苷酸长、200至250个核苷酸长、250至300个核苷酸长、300至350个核苷酸长、350至400个核苷酸长、400至450个核苷酸长、或450至500个核苷酸长。用于指导本公开的Cas12a内切核酸酶的crRNA序列是约10个核苷酸长、约15个核苷酸长、约20个核苷酸长、约25个核苷酸长、约30个核苷酸长、约35个核苷酸长、约40个核苷酸长、约45个核苷酸长、约50个核苷酸长、约55个核苷酸长、约60个核苷酸长、约65个核苷酸长、约70个核苷酸长、约75个核苷酸长、约80个核苷酸长、约85个核苷酸长、约90个核苷酸长、约95个核苷酸长、约100个核苷酸长、约150个核苷酸长、约200个核苷酸长、约250个核苷酸长、约300个核苷酸长、约350个核苷酸长、约400个核苷酸长、约450个核苷酸长、或约500个核苷酸长。用于指导本公开的Cas12a内切核酸酶的crRNA序列的长度为约42个核苷酸。
本公开的宏基因组挖掘的Cas12a蛋白具有灵活和优越的特性,这是因为它们在与具有AsCas12a、FnCas12a和/或LbCas12a的5'重复识别序列(crRNA的茎环(step-loop)区域上游的核苷酸)的crRNA复合时具有维持切割活性的能力。例如,本公开的Cas12a蛋白(例如,mgCas12a-1或mgCas12a-2)可以与具有复合到AsCas12a、FnCas12a和/或LbCas12a的crRNA的5’柄的crRNA复合,并且仍然保持对靶核酸的切割活性。
CRISPR/Cas系统的递送
进一步考虑到Cas12a和指导RNA可以形成CRISPR/Cas复合物,并且可以通过各种方法将这种形成的复合物递送至靶细胞。一种示例性方法包括质粒或病毒载体,其包含编码内切核酸酶和指导RNA的核酸。示例性的基于病毒载体的递送方法包括基于慢病毒的递送或基于腺相关病毒(AAV)的递送。可替代地,本文公开的CRISPR/Cas复合物可以使用核糖核蛋白(RNP)进行递送,以递送组装到gRNA的完整蛋白。然后将组装到gRNA的完整蛋白质直接递送至细胞。
应用
本文所述的CRISPR/Cas复合物或CRISPR/Cas12a内切核酸酶复合物(或CRISPR/Cas12a复合物)用于编辑核酸序列的基因组。核酸序列是哺乳动物核酸序列。例如,核酸序列是人核酸序列。核酸序列也是非人核酸序列。核酸序列来自任何动物。对于基因组编辑,crRNA,也称为指导RNA(gRNA),与关注的核酸序列反向互补。例如,crRNA与人核酸序列反向互补。
例如,CRISPR/Cas12a复合物可以用于对癌细胞中核酸序列的基因组编辑,其包含通过对各种细胞组织基因组的序列分析而鉴定的癌症特异性序列(例如,单核苷酸多态性(SNP)或癌症特异性突变)。crRNA序列被合成为与在癌细胞中独特地存在的这些核酸序列反向互补。CRISPR/Cas12a复合物可以使用与癌症特异性序列反向互补的crRNA来生成,并以有效治疗肿瘤细胞的剂量和方案作为定制疗法施用于患有癌症的受试者。
可以用本公开的CRISPR/Cas复合物治疗的癌症可以包括:膀胱癌、骨癌、血液癌、乳腺癌、黑色瘤、甲状腺癌、甲状旁腺癌、骨髓癌、直肠癌、喉咽癌、喉癌、肺癌、食道癌、胰腺癌、结直肠癌、胃癌、舌癌、皮肤癌、脑瘤、子宫癌、头颈癌、胆囊癌、口腔癌、结肠癌、肛门周围癌、中枢神经系统肿瘤、肝癌或结直肠癌。在特定情况下,癌症包括胃癌、结直肠癌、肝癌、肺癌或乳腺癌。于是,癌细胞包括:膀胱癌细胞、骨癌细胞、血液癌细胞、乳腺癌细胞、黑色瘤细胞、甲状腺癌细胞、甲状旁腺癌细胞、骨髓癌细胞、喉咽癌细胞、喉癌细胞、肺癌细胞、食道癌细胞、胰腺癌细胞、结直肠癌细胞、胃癌细胞、舌癌细胞、皮肤癌细胞、脑瘤细胞、子宫癌细胞、头颈癌细胞、胆囊癌细胞、口腔癌细胞、中枢神经系统肿瘤细胞或肝癌细胞。
可替代地,和/或另外地,由本公开的RNA指导的核酸酶靶向的核酸序列包括处于基因KRAS、BRCA1、HER2/neu、PD-1、TCR、p53、CCR5、DNMT1、EMX1和LKB1中的区域。
例如,本公开的CRISPR/Cas12a复合物包括crRNA,所述crRNA被设计为与BRCA1的外显子10或外显子11(其涉及卵巢癌和乳腺癌)反向互补。靶向BRCA1的外显子11的两个或更多个gRNA被用于本公开的CRISPR/Cas12a复合物中。因此,基于癌症治疗的目的或癌症的类型来选择gRNA的组合。
本文还公开了使用本公开的RNA指导的Cas12a内切核酸酶治疗、治愈或改善癌症的症状或癌症本身的方法。例如,所述方法包括鉴定有癌症症状的有需要的受试者,以及施用本文公开的CRISPR/Cas12a复合物。几种癌症适应症与本文公开的组合物相符。本公开提供了Cas12a蛋白,其用于CRISPR/Cas12a复合物中,以便对https://www.cancer.gov/types中列出的任何癌症的癌细胞中的核酸序列进行基因组编辑。例如,本公开的Cas12a蛋白(例如,SEQ ID NO:1或SEQ ID NO:3或本文所公开的与其相关的任何序列)用于CRISPR/Cas12a复合物中以便对来自癌症的癌细胞中的靶核酸序列进行基因组编辑,所述癌症是:例如急性淋巴细胞性白血病(ALL)、急性髓性白血病(AML)、青少年癌症、肾上腺皮质癌、儿童肾上腺皮质癌、艾滋病相关的癌症、卡波西肉瘤(软组织肉瘤)、艾滋病相关的淋巴瘤(淋巴瘤)、原发性cns淋巴瘤(淋巴瘤)、肛门癌、阑尾癌、星形细胞瘤、儿童(脑癌)、非典型的畸胎瘤/横纹肌样瘤、儿童中枢神经系统(脑癌)、皮肤基底细胞癌、胆管癌、膀胱癌、儿童膀胱癌、骨癌(包括尤因肉瘤和骨肉瘤以及恶性纤维组织细胞瘤)、脑肿瘤、乳腺癌、儿童乳腺癌、支气管肿瘤、儿童伯基特淋巴瘤、类癌肿瘤(胃肠道)、儿童类癌肿瘤、原发性未知癌、原发性未知儿童癌、心脏(心)肿瘤、儿童中枢神经系统非典型畸胎瘤/横纹肌样瘤、儿童(脑癌)、胚胎肿瘤、儿童(脑癌)、生殖细胞肿瘤、儿童(脑癌)、原发性cns淋巴瘤、子宫颈癌、儿童子宫颈癌、儿童癌症、儿童非常见癌症、胆管癌、脊索瘤、儿童慢性淋巴细胞性白血病(CLL)、慢性髓细胞性白血病(CML)、慢性骨髓增生性赘生物、结直肠癌、儿童结直肠癌、颅咽管瘤、儿童(脑癌)、皮肤T细胞淋巴瘤、原位导管癌(DCIS)、胚胎肿瘤、中枢神经系统、儿童(脑癌)、子宫内膜癌(子宫癌)、室管膜瘤、儿童(脑癌)、食道癌、儿童食道癌、鼻腔神经胶质瘤(头颈癌)、尤因肉瘤(骨癌)、颅外生殖细胞肿瘤、儿童性腺外生殖细胞肿瘤、眼癌、儿童眼内黑色素瘤、眼内黑色素瘤、视网膜母细胞瘤、输卵管癌、骨纤维组织细胞瘤、恶性瘤、和骨肉瘤、胆囊癌、胃癌、儿童胃癌、胃肠类癌肿瘤、胃肠道间质瘤(GIST)(软组织肉瘤)、儿童胃肠道间质瘤、生殖细胞肿瘤、儿童中枢神经系统生殖细胞肿瘤(脑癌)、儿童颅外生殖细胞肿瘤、性腺外生殖细胞肿瘤、卵巢生殖细胞肿瘤、睾丸癌、妊娠滋养细胞疾病、毛细胞白血病、头颈癌、心脏肿瘤、儿童肝细胞(肝)癌、组织细胞增多症、朗格汉斯细胞、霍奇金淋巴瘤、下咽癌(头颈癌)、眼内黑色素瘤、儿童眼内黑色素瘤、胰岛细胞瘤、胰腺神经内分泌肿瘤、卡波西肉瘤(软组织肉瘤)、肾(肾细胞)癌、朗格汉斯细胞组织细胞增多症、喉癌(头颈癌)、白血病、唇和口腔癌(头颈癌)、肝癌、肺癌(非小细胞和小细胞)、儿童肺癌、淋巴瘤、男性乳腺癌、骨恶性纤维组织细胞瘤和骨肉瘤、黑色素瘤、儿童黑色素瘤、眼内(眼)黑色素瘤、儿童眼内黑色素瘤、梅克尔细胞癌(皮肤癌)、间皮瘤(恶性)、儿童间皮瘤、转移性癌症、隐性原发性转移性鳞状颈癌(头颈癌)、具有nut基因改变的中线道癌)、口腔癌(头颈癌)、多发性内分泌肿瘤综合征、多发性骨髓瘤/浆细胞瘤、蕈样肉芽肿病(淋巴瘤)、骨髓增生异常综合征、骨髓增生异常/骨髓增生性肿瘤、慢性髓细胞性白血病(CML)、急性髓性白血病(AML)、慢性骨髓增生性肿瘤、鼻腔和鼻旁窦癌(头颈癌)、鼻咽癌(头颈癌)、成神经细胞瘤、非霍奇金淋巴瘤、非小细胞肺癌、口腔癌、唇和口腔癌和口咽癌(头颈癌)、骨肉瘤和骨恶性纤维组织细胞瘤、卵巢癌、儿童卵巢癌、胰腺癌、儿童胰腺癌、胰腺神经内分泌肿瘤(胰岛细胞瘤)、乳头状瘤病(儿童喉部)、副神经节瘤、儿童副神经节瘤、鼻旁窦和鼻腔癌(头颈癌)、甲状旁腺癌、阴茎癌、咽癌(头颈癌)、嗜铬细胞瘤、儿童嗜铬细胞瘤、垂体瘤、浆细胞肿瘤/多发性骨髓瘤、胸膜肺母细胞瘤、妊娠和乳腺癌、原发性中枢神经系统(CNS)淋巴瘤、原发性腹膜癌、前列腺癌、直肠癌、复发性癌症、肾细胞(肾)癌、视网膜母细胞瘤、横纹肌肉瘤、儿童(软组织肉瘤)、唾液腺癌(头颈癌)、肉瘤、儿童横纹肌肉瘤(软组织肉瘤)、儿童血管瘤(软组织肉瘤)、尤因肉瘤(骨癌)、卡波西肉瘤(软组织肉瘤)、骨肉瘤(骨癌)、软组织肉瘤、子宫肉瘤、sézary综合征(淋巴瘤)、皮肤癌、儿童皮肤癌、小细胞肺癌、小肠癌、软组织肉瘤、皮肤鳞状细胞癌、隐性原发性鳞状颈癌(转移性)(头颈癌)、胃癌、儿童胃癌、T细胞淋巴瘤、皮肤癌、睾丸癌、儿童睾丸癌、喉癌(头颈癌)、鼻咽癌、口咽癌、下咽癌、胸腺瘤和胸腺癌、甲状腺癌、肾盂和输尿管的移行细胞癌(肾脏(肾细胞)癌)、原发性未知儿童癌、儿童不常见癌症、输尿管和肾盂移行细胞癌(肾脏(肾细胞)癌、尿道癌、子宫癌、子宫内膜肉瘤、子宫肉瘤、阴道癌、儿童阴道癌、血管肿瘤(软组织肉瘤)、外阴癌、威尔姆斯瘤、其他儿童肾脏肿瘤、或其任何组合。
本公开另外提供了基因组编辑的方法,其包括以下步骤:使细胞与本文所述的CRISPR/Cas12a接触,使指导RNA得以结合至关注的人核酸序列,以及切割人核酸序列。本文所述的CRISPR/Cas12a内切核酸酶被离体施用于多个细胞,从而允许工程化细胞的产生。所述工程化细胞作为细胞疗法施用给有需要的受试者,其中所述受试者是人并且患有任何上述癌症。本文所述的CRISPR/Cas12a内切核酸酶被直接施用于需要其的受试者。直接施用包括静脉内施用、皮下施用、肌内施用、口服施用或粘膜施用。
在其他情况下,crRNA与植物核酸序列反向互补。例如,本公开的Cas12a蛋白用于CRIPSR/Cas12a复合物中,以便对植物细胞中核酸序列进行基因组编辑。关注的植物细胞的非限制性实例包括稻和本氏烟草。
本公开另外提供了一种改善V型CRISPR相关蛋白的切割效率的方法。例如,本文提供的方法包括:鉴定与V型CRISPR相关蛋白的残基925或残基930相对应的位置处的残基,以及将这些残基突变为赖氨酸。在残基925处突变为赖氨酸、在残基930处突变为赖氨酸,或两者,可以改进V型CRISPR相关蛋白的切割效率。本文公开的V型CRISPR相关蛋白(例如,SEQID NO:1或SEQ ID NO:3)的与925或930对应的残基处的赖氨酸对于维持功能是至关重要的。因此,可以在对应于这些位置的残基处将赖氨酸(Lys)引入V型CRISPR相关蛋白中,以改善在对应于残基925或930的位置处不具有赖氨酸的V型CRISPR相关蛋白的功能。
查看附图,可以看到以下内容。图1显示了通过宏基因组挖掘来鉴定本公开的CRISPR相关蛋白(CAS蛋白)的过程。使用metaCRT发现CRISPRI序列,并使用Prodigal进行基因预测。使用来自Uniprot和Genbank的Cas12a序列的局部BLASTp来鉴定出Cas12a候选蛋白。接下来,鉴定800个氨基酸至1500个氨基酸的序列。除了Cas1还鉴定了Cas 12a候选物,其中,从来自Uniprot的Cas1序列的局部BLASTp分析而鉴定了Cas1候选物。使用MEGA7建立了系统发育树,并使用Web BLASTp注释了序列。鉴定了推定的Cas12a蛋白。
图2是进化分枝图,其中SEQ ID NO:3(mg Cas12a-2)和SEQ ID NO:1(mgCas12a-1)从FnCas12a(其与LbCas12a相关)在顶部分开,两者均与AsCas12a相关。图2另外显示了许多Cas12a蛋白之间的关系。因此,本文公开的宏基因组学挖掘方法能够鉴定Cas12a蛋白之间的关系并且挖掘新的Cas12a蛋白。图2还显示了自展值。mGCas12a-2和mgCas12a-1显示出52的自展值。
图3到图8显示了选自图2的系统树的蛋白的比对,包括SEQ ID NO:1(mgCas12a-1,CDY)、SEQ ID NO:3(mgCas12a-2,CDZ)、SEQ ID NO:9(AsCas12a,WP_021)、SEQ ID NO:10(LbCas12a,WP_035)、以及SEQ ID NO:11(FnCas12a,WP_003)。绝对保守的残基被加阴影。在比对的顶部显示了包括α螺旋和β折叠的预测结构。未鉴定的位置以点表示。图7显示了楔形,表示mgCas12a-1(位置925)和mgCas12a-2(位置930)中的关键残基,其已从K残基置换为Q残基。
图9A显示了包括AsCas12a的Cas12a蛋白的特征图,所述AsCas12a蛋白来自氨基酸球菌属,并且具有3,921的核苷酸长度、1,307的氨基酸长度、5’-TTTN-3’PAM序列、100%序列一致性(与AsCas12a相比),以及100%关键残基一致性(33)。该图还显示了LbCas12a蛋白,所述蛋白来自毛螺菌科,并且具有3684的核苷酸长度、1228的氨基酸长度、5’-TTTN-3’的PAM序列、33.41%的序列一致性(与AsCas12a相比),以及79%的关键残基一致性(26)。该图还显示了FnCas12a蛋白,所述蛋白来自Francisella tularensis subsp.novicida,并且具有3,900的核苷酸长度、1,300的氨基酸长度、5’-TTTN-3’的PAM序列、34.45%的序列一致性(与AsCas12a相比),以及79%的关键残基一致性(26)。该图还显示了mgCas12a-1(SEQ IDNO:1)蛋白,所述蛋白来自宏基因组CDYX01038443.1,并且具有3,789的核苷酸长度、1,263的氨基酸长度、推定的PAM序列5’-TTTN-3’、32.65%的序列一致性(与AsCas12a相比),以及88%的关键残基一致性(29)。该图还显示了mgCas12a-2(SEQ ID NO:3)蛋白,所述蛋白来自宏基因组CDZH01035208.1,并且具有3,825的核苷酸长度、1,275的氨基酸长度、推定的PAM序列5’-TTTN-3’、32.65%的序列一致性(与AsCas12a相比),以及88%的关键残基一致性(29)。图9B显示了各种Cas12直系同源物以及不同Cas12a直系同源物之间的序列一致性百分比的图表。第一行从左到右包括Cas12a、As、Lb、Fn、mg-1和mg-2。第二行从左到右包括As,后跟5个空白单元格。第三行从左到右包括Lb 33.4,后跟4个空白单元格。第四行从左到右包括Fn、34.2、40.4,后跟3个空白单元格。第五行从左到右包括mg-1、32.4、35.3、36.6,后跟2个空白单元格。最后一行从左到右包括mg-2、30.7、34.9、35.9、52.5,后跟1个空白单元格。
图10显示了在无缓冲液、NEBuffer 1.1、NEBuffer 2.1和NEBuffer 3.1中在暴露于与crRNA复合的mgCas12a-1(SEQ ID NO:1)或mgCas12a-2(SEQ ID NO:3)在37℃下进行10分钟反应后,靶dsDNA的凝胶电泳。切割产物用箭头指示。靶dsDNA(LsXTb12)分辨约2.2kbp。发现在NEBuffer 1.1中存在比例为1:1.25的3pmol mgCas12a-1蛋白、FnCas12a crRNA#1,以及300ng纯化的dsDNA的情况下发生切割。在NEBuffer 1.1中存在比例为1:1.25的6pmolmgCas12a-1蛋白、FnCas12a crRNA#1,以及300ng纯化的dsDNA的情况下也发生了切割。在上述条件下,在NEBuffer 2.1和NEBuffer 3.1中也观察到了切割,但在NEBuffer 1.1中切割是最强的。对于mgCas12a-2,主要在NEBuffer 1.1中存在比例为1:1.25的3pmol mgCas12a-2、FnCas12a crRNA#1,以及300ng纯化的dsDNA的情况下,和在NEBuffer 1.1中比例为1:1.25的6pmol mgCas12a-1蛋白、FnCas12a crRNA#1,以及300ng纯化的dsDNA的情况下观察到了切割。在这两种情况下,均以1.6kbp和0.6kpb检测到切割产物。
图11显示了在无缓冲液、NEBuffer 1.1、NEBuffer 2.1和NEBuffer 3.1中在暴露于与crRNA复合的mgCas12a-1(SEQ ID NO:1)或mgCas12a-2(SEQ ID NO:3)在37℃下进行10分钟反应后,靶dsDNA的凝胶电泳。切割产物用箭头指示。靶dsDNA(LsXTb12)分辨约2.2kbp。发现在NEBuffer 1.1中存在比例为1:1.25的3pmol mgCas12a-1蛋白、FnCas12a crRNA#1,以及300ng纯化的dsDNA的情况下发生切割。对于mgCas12a-2,主要在NEBuffer 1.1中存在比例为1:1.25的3pmol mgCas12a-2、FnCas12a crRNA#1,以及300ng纯化的dsDNA的情况下,和在NEBuffer 1.1中比例为1:1.25的6pmol mgCas12a-1蛋白、FnCas12a crRNA#1,以及300ng纯化的dsDNA的情况下观察到切割。在这两种情况下,均以1.8kbp和0.4kpb检测到切割产物。虽然图11和图10具有相似的反应条件,但是图10和图11使用两种不同的crRNA(图10为crRNA#1,图11为crRNA#2)。因此,所得切割产物在图11中具有与图10相比不同的大小。
图12显示了在NEBuffer 1.1中在暴露于与crRNA复合的Cas12a蛋白(包括mgCas12a-1、mgCas12a-2、AsCas12a、FnCas12a和LbCas12a)在37℃下反应10分钟后,靶dsDNA的凝胶电泳。切割产物用箭头指示。靶dsDNA(LsXTb12)分辨约2.2kbp。对于mgCas12a-1、mgCas12a-2、AsCas12a、FnCas12a和LbCas12a,在6pmol mgCas12a-1蛋白、7.5pmolFnCas12a crRNA#1和300ng纯化dsDNA的存在下发生切割。在1.6kbp和0.6kbp检测到切割产物。此外,在6pmol mgCas12a-1蛋白、7.5pmol FnCas12a crRNA#2和300ng纯化dsDNA的存在下测试mgCas12a-1、mgCas12a-2、AsCas12a、FnCas12a或LbCas12a的过程中,对于mgCas12a-1,检测到切割最好。在1.8kbp和0.4kbp检测到切割产物。
图13显示了在图10至图12的凝胶电泳实验中测试的靶双链DNA LsXTb12以及crRNA#1和crRNA#2的相应结合区,分别包括在外显子1和外显子2中。图13显示实心顶部条,其指示为“LsXTb12的部分”,并从其5’末端至其3’末端显示。在靶dsDNA LsXTb12下方的左侧是从左到右的箭头,显示5'UTR和外显子1。XYLT crRNA#1(413至439)显示在靶dsDNA的实心顶部条上方,并且显示为与靶dsDNA中外显子1上方的区域结合。在靶dsDNA LsXTb12下方的右边是从左到右两个箭头,包括外显子2,后随外显子3的部分。XYLT crRNA#2(1593至1619)显示在靶dsDNA的实心顶部条上方,并且显示为与靶dsDNA中外显子2上方的区域结合。
图14说明了在与本公开的Cas12a核酸酶一起孵育之后靶DNA的凝胶电泳。最左边的泳道显示DNA阶梯,模拟A和模拟B泳道显示对照。模拟A泳道显示缺少gRNA和蛋白的反应。模拟B指示缺少蛋白的反应。如预期的,靶DNA在模拟A和模拟B泳道中保持未剪切状态,并以1430个碱基对(bp)的大小进行分辨。被测试用于切割靶DNA的Cas12a蛋白包括:FnCas12、AsCas12、LbCas12、He-MgCas12a-1(人源化和工程化的mgCas12a-1)和He-MgCas12a-2(人源化和工程化的mgCas12a-2)。He-MgCas12a-1和He-MgCas12a-2都将DNA模板(1,430bp)切割成750bp和680bp的两个片段。孵育1小时内,He-MgCas12a-1切割所有DNA模板,在完整DNA模板大小上没有条带证明了这一点。孵育4小时内,He-MgCas12a-2切割所有DNA模板,由在完整DNA模板大小处没有条带证明。尽管FnCas12、AsCas12和LbCas12切割靶DNA,但未切割的DNA模板甚至在4小时后仍然保留,由在完整DNA模板大小处的条带证明。
图15A-B显示了两个图,其说明在稻(图15A)和本氏烟草(图15B)中FnCas12相对于He-MgCas12a-1的基因组编辑效率。基因组编辑效率通过下一代测序技术来测量,y轴显示百分比编辑效率。模拟表示阴性对照样品。对于稻中的基因组编辑,对两种crRNA进行了评估,并对于本氏烟草中的基因组编辑,评估了三种crRNA。与FnCas12相比,在crRNA 1和crRNA 2情况下,在稻中,He-MgCas12a-1显示出更高的编辑效率。与FnCas12相比,在crRNA2情况下,在本氏烟草中He-MgCas12a-1显示出更高的编辑效率。
图16说明了在1X NEBuffer中在37°下与Cas12a(6pmol)/crRNA(7.5pmol)复合物一起孵育1小时的300ng靶DNA(LsXTb12)的凝胶电泳。凝胶电泳的每个泳道显示各种条件。凝胶中从左到右的泳道显示:1)DNA阶梯,2)不含Cas12a或crRNA的纯化的dsDNA,3)mgCas12a-1、crRNA和纯化的dsDNA,4)he_mgCas12a-1、crRNA和纯化的dsDNA,5)de_mgCas12a-1、crRNA和纯化的dsDNA,6)mgCas12a-2、crRNA和纯化的dsDNA,7)he_mgCas12a-2、crRNA和纯化的dsDNA,8)de_mgCas12a-2、crRNA和纯化的dsDNA,9)AsCas12a、crRNA和纯化的dsDNA,10)FnCas12a、crRNA和纯化的dsDNA,11)LbCas12a、crRNA和纯化的dsDNA。在mgCas12a泳道和he-mgCas12a泳道以及AsCas12a、FnCas12a和LbCas12a泳道中观察到切割产物。切割的模板DNA在1.8kB和0.65kB处观察到。
图17A显示了在1X NEBuffer中在37°下与Cas12a(6pmol)和crRNA(7.5pmol)一起孵育12小时的300ng靶DNA(LsXTb12)的凝胶电泳。凝胶中从左到右的泳道显示:1)仅纯化的dsDNA,2)crRNA和纯化的dsDNA,3)在37℃时仅纯化的dsDNA,4)在37℃时crRNA和纯化的dsDNA,5)mgCas12a-1、crRNA和纯化的dsDNA,6)he_mgCas12a-1、crRNA和纯化的dsDNA,7)de_mgCas12a-1、crRNA和纯化的dsDNA,8)mgCas12a-2、crRNA和纯化的dsDNA,9)he_mgCas12a-2、crRNA和纯化的dsDNA,10)de_mgCas12a-2、crRNA和纯化的dsDNA,11)AsCas12a、crRNA和纯化的dsDNA,12)FnCas12a、crRNA和纯化的dsDNA,以及13)LbCas12a、crRNA和纯化的dsDNA。尽管AsCas12a、FnCas12a和LbCas12a完全降解模板DNA,由在靶DNA大小处缺少条带所证明,但在mgCas12a、he_mgCas12a和de_mgCas12a蛋白的情况下,观察到完整的模板DNA。对于mgCas12a和he_mgCas12a蛋白,观察到模板DNA的切割产物,其分辨为1.8kb和0.65kb。
图17B显示了在1X NEBuffer中在37°下与Cas12a(6pmol)和crRNA(7.5pmol)一起孵育24小时的300ng靶DNA(LsXTb12)的凝胶电泳。凝胶中从左到右的泳道显示:1)DNA阶梯,2)不含Cas12a或crRNA的纯化的dsDNA,3)mgCas12a-1、crRNA和纯化的dsDNA,4)he_mgCas12a-1、crRNA和纯化的dsDNA,5)de_mgCas12a-1、crRNA和纯化的dsDNA,6)mgCas12a-2、crRNA和纯化的dsDNA,7)he_mgCas12a-2、crRNA和纯化的dsDNA,8)de_mgCas12a-2、crRNA和纯化的dsDNA,9)AsCas12a、crRNA和纯化的dsDNA,10)FnCas12a、crRNA和纯化的dsDNA,11)LbCas12a、crRNA和纯化的dsDNA。24小时后在mgCas12a泳道中观察到模板DNA。相反,在AsCas12a、FnCas12a和LbCas12a泳道中未观察到靶DNA。
图18显示了在1X NEBuffer中在37°下与Cas12a(6pmol)和crRNA(7.5pmol)一起孵育1小时的300ng靶质粒DNA(约10kbp)的凝胶电泳。凝胶中从左到右的泳道显示:1)DNA阶梯,2)不含Cas12a或crRNA的纯化的dsDNA,3)mgCas12a-1、crRNA和纯化的dsDNA,4)he_mgCas12a-1、crRNA和纯化的dsDNA,5)de_mgCas12a-1、crRNA和纯化的dsDNA,6)mgCas12a-2、crRNA和纯化的dsDNA,7)he_mgCas12a-2、crRNA和纯化的dsDNA,8)de_mgCas12a-2、crRNA和纯化的dsDNA,9)AsCas12a、crRNA和纯化的dsDNA,10)FnCas12a、crRNA和纯化的dsDNA,11)LbCas12a、crRNA和纯化的dsDNA。通过10kbp的条带证明了靶质粒DNA,并且在6kbp观察到了切割产物。除de_mgCas12a蛋白外,所有Cas12a蛋白均将靶质粒DNA切割成大小为6kbp的线性化DNA片段。
图19A显示了在1X NEBuffer中在37℃下12小时反应时间之后,与Cas12a核酸酶(包括mgCas12a-1(野生型)、he_mgCas12a-1(人源化和工程化的mgCas12a-1)、de_mgCas12a-1(失效和工程化的mgCas12a)、mg Cas12a-2、he_mgCas12a-2、de_mgCas12a-2、AsCas12a、FnCas12a和LbCas12a)一起孵育的300ng靶质粒DNA的凝胶电泳。凝胶中从左到右的泳道显示:1)仅纯化的dsDNA,2)crRNA和纯化的dsDNA,3)在37℃时仅纯化的dsDNA,4)在37℃时crRNA和纯化的dsDNA,5)mgCas12a-1、crRNA和纯化的dsDNA,6)he_mgCas12a-1、crRNA和纯化的dsDNA,7)de_mgCas12a-1、crRNA和纯化的dsDNA,8)mgCas12a-2、crRNA和纯化的dsDNA,9)he_mgCas12a-2、crRNA和纯化的dsDNA,10)de_mgCas12a-2、crRNA和纯化的dsDNA,11)AsCas12a、crRNA和纯化的dsDNA,12)FnCas12a、crRNA和纯化的dsDNA,以及13)LbCas12a、crRNA和纯化的dsDNA。由缺少任何条带证明,AsCa12a、FnCas12a和LbCas12a在12小时内降解所有模板质粒DNA。mgCas12a蛋白和he_mgCas12a蛋白均显示线性化的切割产物和一些靶质粒DNA,由其各自预期大小处的条带所证明。
图19B显示了在1X NEBuffer中在37℃下24小时反应时间之后,与Cas12a核酸酶(包括mgCas12a-1(野生型)、he_mgCas12a-1(人源化和工程化的mgCas12a-1)、de_mgCas12a-1(失效和工程化的mgCas12a)、mg Cas12a-2、he_mgCas12a-2、de_mgCas12a-2、AsCas12a、FnCas12a和LbCas12a)一起孵育的300ng靶质粒DNA的凝胶电泳,。凝胶中从左到右的泳道显示:1)DNA阶梯,2)不含Cas12a或crRNA的纯化dsDNA,3)mgCas12a-1、crRNA和纯化的dsDNA,4)he_mgCas12a-1、crRNA和纯化的dsDNA,5)de_mgCas12a-1、crRNA和纯化的dsDNA,6)mgCas12a-2、crRNA和纯化的dsDNA,7)he_mgCas12a-2、crRNA和纯化的dsDNA,8)de_mgCas12a-2、crRNA和纯化的dsDNA,9)AsCas12a、crRNA和纯化的dsDNA,10)FnCas12a、crRNA和纯化的dsDNA,11)LbCas12a、crRNA和纯化的dsDNA。由缺少任何条带证明,AsCa12a、FnCas12a和LbCas12a在24小时内降解所有模板质粒DNA。mgCas12a蛋白和he_mgCas12a蛋白均显示线性化的切割产物,由其预期大小处的条带所证明。
图20A示出了从宏基因组数据库挖掘新颖Cas12a蛋白的流程图。可以从Genbank获得宏基因组序列数据,并可以使用metaCRT和基因预测(Prodigal)来找到CRISPR序列。使用来自Uniprot和Genbank的Cas12a序列的局部BLASTp来鉴定出Cas12a候选蛋白。然后使用MEGAX来分析此类鉴定出的Cas12a候选蛋白以生成系统树,该信息使用网页BALSTp进行注释。
图20B显示了各种Cas12a直系同源物的系统树。本公开的宏基因组挖掘的Cas12a蛋白,包括mgCas12a-2和mgCas12a-1在右侧分辨。该树还使用自展值来显示其他Cas12a蛋白之间的关系。
图20C显示了AsCas12a、mgCas12a-1和mgCas12a-2中各个结构域的示意图,其包括:WED-I、REC1、REC2、WED-II、PI、WED-II、RuvC-I、BH、RuvC-II、Nuc、RuvC-III。请注意,AsCas12a包含Cas4、Cas1、Cas2、CRISPR结构域,而mgCas12a-1中不存在Cas1,并且mgCas12a-2中不存在Cas4、Cas1、Cas2。还需要注意,分别在RuvC-I和RuvC-II结构域中,mgCas12a-1包含D877A和K925Q的突变,mgCas12a-2包含D873A和K925Q的突变。
图21显示了从宏基因组衍生的Cas12a的无根且基于进化距离的系统树,包括mgCas12a-2和mgCas12a-1,它们在右侧分辨。还显示了其他Cas12直系同源物,从左下方开始顺时针为Lb2Cas12a、LbCas12a、PcCas12a、PdCas12a、MbCas12a、SsCas12a、LiCas12a、PmCas12a、FnCas12a、PbCas12a、PeCas12a、Lb3Cas12a、BpCas12a、CEST01022924.1 4、CESD01057036.1 3、CMtCas12a、AsCas12a、mgCas12a-2、mgCas12a-1、CDYR01026036.1 2、CDYL01005663.1 6、EeCas12a、CDYK01004246.1 121、CDYK01036676.1 3、CDYL01025564.13、CEAM01003869.1 48、和CDZY01023362.1 31。
图22A在左上方显示表格。第一行从左到右显示没有孵育,和在37℃孵育2小时。第二行从左到右显示4个空白单元格,然后是Fn、WT mg-1和WT mg-2。第三行指示反应中Cas12a的存在或不存在。第四行指示反应中crRNA的存在或不存在。底行指示线性dsDNA的存在或不存在。紧靠下方的凝胶显示了表中的每个反应,其中线性dsDNA靶向HsCCR5,表示为“S”代表底物。表示为S的箭头所示的条带显示未切割的线性dsDNA。切割产物也用箭头表示,并且由指示切割产物的位置的箭头所示的条带显示靶线性dsDNA的切割片段。紧靠下方的凝胶显示了表中的每个反应,其中线性dsDNA靶向HsDNMT1,表示为“S”代表底物。表示为S的箭头所示的条带显示未切割的线性dsDNA。切割产物也用箭头表示,并且由指示切割产物的位置的箭头所示的条带显示靶线性dsDNA的切割片段。紧靠下方的凝胶显示了表中的每个反应,其中线性dsDNA靶向HsEMX1,表示为“S”代表底物。表示为S的箭头所示的条带显示未切割的线性dsDNA。切割产物也用箭头表示,并且由指示切割产物的位置的箭头所示的条带显示靶线性dsDNA的切割片段。
图22B在左上方显示表格。第一行从左到右显示没有孵育,和在37℃孵育2小时。第二行从左到右显示4个空白单元格,然后是Fn、WT mg-1和WT mg-2。第三行指示反应中Cas12a的存在或不存在。第四行指示反应中crRNA的存在或不存在。底行指示环状dsDNA的存在或不存在。紧靠下方的凝胶显示了表中的每个反应,其中环状dsDNA靶向HsCCR5,表示为“S”代表底物。表示为S的箭头所示的条带显示未切割的线性dsDNA。线性化产物也用箭头表示,并且由指示线性化产物的位置的箭头所示的条带显示靶环状dsDNA的切割片段。紧靠下方的凝胶显示了表中的每个反应,其中环状dsDNA靶向HsDNMT1,表示为“S”代表底物。表示为S的箭头所示的条带显示未切割的环状dsDNA。切割产物也用箭头表示,并且由指示切割产物的位置的箭头所示的条带显示靶环状dsDNA的切割片段。紧靠下方的凝胶显示了表中的每个反应,其中环状dsDNA靶向HsEMX1,表示为“S”代表底物。表示为S的箭头所示的条带显示未切割的环状dsDNA。切割产物也用箭头表示,并且由指示切割产物的位置的箭头所示的条带显示环状线性dsDNA的切割片段。
图23A显示了反应条件的表。第一行从左到右显示0、1m,10m,30m,1h,6h和12h。第二行指示d_mgCas12a的存在或不存在,第三行指示WT mgCas12的存在或不存在。第四行指示crRNA的存在或不存在。第五行指示线性dsDNA的存在或不存在。紧靠下方的凝胶显示了表中的每个反应,其中mgCas12a-1与具有来自AsCas12a的5'柄的crRNA(crRNA,从5'到3'为UAAUUUCUACUCUUGUAGAU)复合。线性dsDNA以“S”表示,代表底物,出现在该位置的条带显示未切割的靶线性dsDNA。切割产物用“P”表示,代表产物,出现在该位置的条带显示靶线性dsDNA的切割区段。紧靠下方的凝胶显示了表中的每个反应,其中mgCas12a-1与具有来自FnCas12a的5'柄的crRNA(crRNA,从5'到3'为AAUUUCUACUGUUGUAGAU)复合。线性dsDNA以“S”表示,代表底物,出现在该位置的条带显示未切割的靶线性dsDNA。切割产物用“P”表示,代表产物,出现在该位置的条带显示靶线性dsDNA的切割区段。紧靠下方的凝胶显示了表中的每个反应,其中mgCas12a-1与具有来自LbCas12a的5'柄的crRNA(crRNA,从5'到3'为AAUUUCUACUAAGUGUAGAU)复合。线性dsDNA以“S”表示,代表底物,出现在该位置的条带显示未切割的靶线性dsDNA。切割产物用“P”表示,代表产物,出现在该位置的条带显示靶线性dsDNA的切割区段。
图23B显示了反应条件的表。第一行从左到右显示0、1m,10m,30m,1h,6h和12h。第二行指示d_mgCas12a的存在或不存在,第三行指示WT mgCas12的存在或不存在。第四行指示crRNA的存在或不存在。第五行指示线性dsDNA的存在或不存在。紧靠下方的凝胶显示了表中的每个反应,其中mgCas12a-2与具有来自AsCas12a的5'柄的crRNA(crRNA,从5'到3'为UAAUUUCUACUCUUGUAGAU)复合。线性dsDNA以“S”表示,代表底物,出现在该位置的条带显示未切割的靶线性dsDNA。切割产物用“P”表示,代表产物,出现在该位置的条带显示靶线性dsDNA的切割区段。紧靠下方的凝胶显示了表中的每个反应,其中mgCas12a-2与具有来自FnCas12a的5'柄的crRNA(crRNA,从5'到3'为AAUUUCUACUGUUGUAGAU)复合。线性dsDNA以“S”表示,代表底物,出现在该位置的条带显示未切割的靶线性dsDNA。切割产物用“P”表示,代表产物,出现在该位置的条带显示靶线性dsDNA的切割区段。紧靠下方的凝胶显示了表中的每个反应,其中mgCas12a-2与具有来自LbCas12a的5'柄的crRNA(crRNA,从5'到3'为AAUUUCUACUAAGUGUAGAU)复合。线性dsDNA以“S”表示,代表底物,出现在该位置的条带显示未切割的靶线性dsDNA。切割产物用“P”表示,代表产物,出现在该位置的条带显示靶线性dsDNA的切割区段。
图24显示了在顶部的表,该表从左到右总结了反应条件。顶行从左至右,对于两列表示时间点0,对于九列表示在37℃下孵育12小时,对于九列表示在37℃下孵育24小时。第二行指示每个反应中的Cas12a,并从左至右显示4个空白单元格,随后是WT mg-1、d_mg-1、WT mg-2、d_mg-2、As、Fn、Lb、2个空白单元格,随后是WT mg-1、d_mg-1、WT mg-2、d_mg-2、As、Fn和Lb。第三行指示Cas12a的存在或不存在。第四行指示crRNA的存在或不存在。第五行指示线性dsDNA的存在或不存在。紧靠下方的凝胶显示了表中的每个反应,其中每个测试的Cas12a与靶向HsCCR5线性dsDNA的crRNA复合。线性dsDNA以“S”表示,代表底物,出现在该位置的条带显示未切割的靶线性dsDNA。切割产物用“P”表示,代表产物,出现在该位置的条带显示靶线性dsDNA的切割区段。紧靠下方的凝胶显示了表中的每个反应,其中每个测试的Cas12a与靶向HsDNMT1线性dsDNA的crRNA复合。线性dsDNA以“S”表示,代表底物,出现在该位置的条带显示未切割的靶线性dsDNA。切割产物用“P”表示,代表产物,出现在该位置的条带显示靶线性dsDNA的切割区段。紧靠下方的凝胶显示了表中的每个反应,其中每个测试的Cas12a与靶向HsEMX1线性dsDNA的crRNA复合。线性dsDNA以“S”表示,代表底物,出现在该位置的条带显示未切割的靶线性dsDNA。切割产物用“P”表示,代表产物,出现在该位置的条带显示靶线性dsDNA的切割区段。
图25A显示了在顶部的表,该表总结了每个反应的反应条件。第一行从左至右显示0、1m、10m、30m、1h、2h、6h、12h、24h和针对最后两列的48h。第二行指示每个反应中Cas12a的存在或不存在。第三行指示每个反应中线性dsDNA的存在或不存在。紧靠下方的凝胶显示了表中的每个反应,其中FnCas12a与靶向线性dsDNA的crRNA复合。线性dsDNA以“S”表示,代表底物,出现在该位置的条带显示未切割的靶线性dsDNA。紧靠下方的凝胶显示了表中的每个反应,其中WT mgCas12a-1与靶向线性dsDNA的crRNA复合。线性dsDNA以“S”表示,代表底物,出现在该位置的条带显示未切割的靶线性dsDNA。紧靠下方的凝胶显示了表中的每个反应,其中WT mgCas12a-2与靶向线性dsDNA的crRNA复合。线性dsDNA以“S”表示,代表底物,出现在该位置的条带显示未切割的靶线性dsDNA。
图25B显示了孵育期相对于切割的靶dsDNA的图。x轴显示孵育期,从左到右是仅dsDNA,1m、10m、30m、1h、2h、6h、12h、24h和48h。y轴显示切割的靶dsDNA,其范围为0.00至1.00,增量为0.20。实线显示了FnCas12a的数据。短划线虚线显示了WT mgCas12a-1的数据。点虚线显示了WT mgCas12a-2的数据。
图26A显示了在顶部的表,该表总结了每个反应的反应条件。前两行显示二价阳离子,从左至右是DW、对照、10和100的CaCl2、10和100的CoCl2、10和100的CuSO4、10和100的FeCl2、10和100的MnSO4,10和100的NiSO4,以及10和100的ZnSO4。第三行显示每个反应中Cas12a的存在或不存在。第四行显示每个反应中crRNA的存在或不存在。第五行显示每个反应中线性dsDNA的存在或不存在。紧靠下方的凝胶显示了表中的每个反应,其中FnCas12a与靶向线性dsDNA的crRNA复合。线性dsDNA以“S”表示,代表底物,出现在该位置的条带显示未切割的靶线性dsDNA。切割产物用“P”表示,代表产物,出现在该位置的条带显示靶线性dsDNA的切割区段。紧靠下方的凝胶显示了表中的每个反应,其中WT mgCas12a-1与靶向线性dsDNA的crRNA复合。线性dsDNA以“S”表示,代表底物,出现在该位置的条带显示未切割的靶线性dsDNA。切割产物用“P”表示,代表产物,出现在该位置的条带显示靶线性dsDNA的切割区段。紧靠下方的凝胶显示了表中的每个反应,其中WT mgCas12a-2与靶向线性dsDNA的crRNA复合。线性dsDNA以“S”表示,代表底物,出现在该位置的条带显示未切割的靶线性dsDNA。切割产物用“P”表示,代表产物,出现在该位置的条带显示靶线性dsDNA的切割区段。
图26B显示了切割的靶dsDNA相对于各种反应条件(二价阳离子,针对与靶向线性dsDNA的crRNA复合的FnCas12a)的图。x轴显示反应条件,从左到右为Ctrl、10mM CaCl2、100mM CaCl2、10mM CoCl2、100mM CoCl2、10mM CuSO4、100mM CuSO4、10mM FeCl2、100mMFeCl2、10mM MnSO4、100mM MnSO4、10mM NiSO4、100mM NiSO4、10mM ZnSO4、和100mM ZnSO4。y轴显示切割的靶dsDNA,其范围为-0.20至1.20,增量为0.20。
图26C显示了切割的靶dsDNA相对于各种反应条件(二价阳离子,针对与靶向线性dsDNA的crRNA复合的WT mgCas12a-1)的图。x轴显示反应条件,从左到右为Ctrl、10mMCaCl2、100mM CaCl2、10mM CoCl2、100mM CoCl2、10mM CuSO4、100mM CuSO4、10mM FeCl2、100mM FeCl2、10mM MnSO4、100mM MnSO4、10mM NiSO4、100mM NiSO4、10mM ZnSO4、和100mMZnSO4。y轴显示切割的靶dsDNA,其范围为-0.20至0.70,增量为0.10。
图26D显示了切割的靶dsDNA相对于各种反应条件(二价阳离子,针对与靶向线性dsDNA的crRNA复合的WT mgCas12a-2)的图。x轴显示反应条件,从左到右为Ctrl、10mMCaCl2、100mM CaCl2、10mM CoCl2、100mM CoCl2、10mM CuSO4、100mM CuSO4、10mM FeCl2、100mM FeCl2、10mM MnSO4、100mM MnSO4、10mM NiSO4、100mM NiSO4、10mM ZnSO4、和100mMZnSO4。y轴显示切割的靶dsDNA,其范围为-1.20至1.00,增量为0.20。
图27显示了反应条件相对于得失位(%)的图。x轴从左至右显示,48h时模拟(靶向CCR5),48h时mgCas12a-1(靶向CCR5),48h时mgCas12a-2(靶向CCR5),72h时模拟(靶向CCR5),72h时mgCas12a-1(靶向CCR5),72h时mgCas12a-2(靶向CCR5),48h时模拟(靶向DNMT1),48h时mgCas12a-1(靶向DNMT1),48h时mgCas12a-2(靶向DNMT1),72h时模拟(靶向DNMT1),72h时mgCas12a-1(靶向DNMT1),和72h时mgCas12a-2(靶向DNMT1)。y轴显示得失位(%),其范围为0.0到0.6,增量为0.1。
图28显示了测试的Cas12a相对于得失位频率(%)的图。x轴显示测试的Cas12a和crRNA,从左到右为crRNA2、mgCas12a-1-crRNA2、mgCas12a-2-crRNA2、FnCpf1-crRNA2、crRNA4、mgCas12a-1-crRNA4、mgCas12a-2-crRNA4、和FnCpf1-crRNA4。y轴显示得失位频率(%),其范围为0.0到2.0,增量为0.2。
本公开的蛋白RNA指导的内切核酸酶的“功能结构域”可以是推定的转座酶DNA结合结构域,例如SEQ ID NO:1的残基829至残基991或SEQ ID NO:3的残基825至残基996。
如本文所用的,“序列一致性”可以描述在被比较的两个序列之间共享一致性或共同的核碱基或氨基酸残基的数目、分数或百分比。相对于参考多肽序列的序列一致性百分比(%)是在对序列进行比对,任选地引入缺口以获得最大序列一致性百分比,并且任选地不考虑保守性置换作为序列一致性的部分之后,第一序列(例如候选序列)中与第二序列(例如参考多肽序列)中的氨基酸残基相同的氨基酸残基的百分比。类似地,相对于参考核碱基序列的序列一致性百分比(%)是在对序列进行比对,任选地引入缺口以获得最大序列一致性百分比,并且任选地不考虑保守性置换作为序列一致性的部分之后,第一序列(例如,候选序列)中与第二序列(例如,核碱基参考序列)中的核碱基相同的核碱基的百分比。用于确定氨基酸序列一致性百分比的比对可以通过各种已知的方式实现,例如,使用公开可获得的计算机软件,例如BLAST、BLAST-2、ALIGN或Megalign(DNASTAR)软件。能够确定用于比对序列的适当参数,包括在被比较的序列的全长上实现最大比对所需的算法。然而,出于本文的目的,氨基酸序列一致性百分比(%)值是使用序列比较计算机程序ALIGN-2生成的。ALIGN-2序列比较计算机程序由Genentech,Inc.编写,其源代码已在华盛顿特区的美国版权局(U.S.Copyright Office,Washington D.C.,20559)以用户文档形式提交,并在那里以美国版权登记号TXU510087注册。ALIGN-2程序可从加利福尼亚州南旧金山的Genentech,Inc.公开获得,或者可以从源代码编译。ALIGN-2程序应被编译以便在UNIX操作系统(包括数字UNIX V4.0D)上使用。所有序列比较参数均由ALIGN-2程序设置且不变。
如本文所用的,“连续残基”可以描述在给定序列中彼此紧邻的核碱基或氨基酸残基。
“互补性”是指核酸通过传统的沃森-克里克或其他非传统类型而与另一核酸序列形成(多个)氢键的能力。互补性百分比表示核酸分子中的可以与第二核酸序列形成氢键(例如沃森-克里克碱基配对)的残基的百分比(例如,10个中的5、6、7、8、9、10个分别是50%、60%、70%、80%、90%和100%互补)。“完美互补”意指核酸序列的所有邻接残基都将与第二核酸序列中相同数目的邻接残基形成氢键。如本文所用的,“基本上互补”是指在8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、30、35、40、45、50个或更多个核苷酸的区域中至少60%、65%、70%、75%、80%、85%、90%、92%、95%、97%、98%、99%或100%程度的互补,或指在严格条件下杂交的两个核酸。序列一致性(例如出于评估百分比互补性的目的)可以通过任何合适的比对算法进行测量,包括但不限于:Needleman-Wunsch算法(参见例如www.ebi.ac.uk/Tools/psa/emboss_needle/nucleotide.html上可获得的EMBOSS Needle比对器,任选地使用默认设置),BLAST算法(参见例如blast.ncbi.nlm.nih.gov/Blast.cgi上可获得的BLAST比对工具,任选地使用默认设置),或Smith-Waterman算法(参见例如www.ebi.ac.uk/Tools/psa/emboss_water/nucleotide.html上可获得的EMBOSS Water比对器,任选地使用默认设置)。可以使用所选算法的任何合适参数(包括默认参数)来评估最佳比对。
核酸和氨基酸序列的同源性根据本领域已知的任何合适的方法来确定,包括但不限于本文所述的那些。
例如,可以使用美国国家生物技术信息中心(NCBI,Bethesda,MD)程序MegaBLAST进行比对和搜索相似序列。使用此程序(百分比一致性的选项设置为例如对于氨基酸序列而言70%,或设置为例如对于核苷酸序列而言90%)将鉴定相比于查询序列具有70%或90%或更高的序列一致性的那些序列。本领域已知的其他软件也可用于比对和/或搜索相似序列,例如与包含本文中的分泌信号序列的信息串至少70%或90%一致的序列。例如,用于比较以鉴定与查询序列至少70%或90%一致的序列的序列比对经常通过使用以下来进行:例如,GCG序列分析软件包(可以从威斯康星大学生物技术中心遗传学计算机组(Genetics Computer Group,University of Wisconsin Biotechnology Center)获得,1710University Avenue,Madison,Wis.53705)中提供的GAP、BESTFIT、BLAST、FASTA和TFASTA程序,用其中指定的默认参数,加上针对以期望百分比的序列一致性程度的参数。另外,例如,可以使用CLUSTAL程序(可从Intelligenetics,Mountain View,Cal.的PC/Gene软件包中获得)。
这些和其他序列比对方法可以通过手动比对,通过目视检查,或通过手动或自动应用序列比对算法来进行,例如上述程序所体现的那些中任一种。各种有用的算法包括例如:W.R.Pearson&D.J.Lipman,Proc.Natl.Acad.Sci.USA 85:2444-48(1988年4月)中描述的相似性搜索方法;T.F.Smith&M.S.Waterman,Adv.Appl.Math.2:482-89(1981)中和J.Molec.Biol.147:195-97(1981)中描述的局部同源性方法;S.B.Needleman&C.D.Wunsch,J.Molec.Biol.48(3):443-53(1970年3月)中描述的同源性比对方法;以及例如以下中描述的各种方法:W.R.Pearson,Genomics 11(3):635-50中(1991年11月);W.R.Pearson,Methods Molec.Biol.24:307-31和25:365-89(1994);以及D.G.Higgins&P.M.Sharp,Comp.Appl'ns in Biosci.5:151-53(1989)和Gene 73(1):237-44(1988年12月15日)。
GAP版本10(其使用Needleman和Wunsch(1970)同上的算法)可以使用以下参数来确定序列一致性或相似性:核苷酸序列的一致性百分比(%)和相似性百分比(%),使用50的GAP权重和3的长度权重以及nwsgapdna.cmp评分矩阵;氨基酸序列的一致性%或相似性%,使用8的GAP权重和2的长度权重,以及BLOSUM62评分程序。如本领域技术人员将理解的,也可以使用等效或类似的程序。例如,可以使用序列比较程序,该程序对于任何两个所讨论的序列产生比对,当与GAP版本10所产生的对应的比对相比较时,该比对具有相同的核苷酸残基匹配以及相同的序列一致性百分比。在一些实施方案中,在整个查询或主题序列或两者上进行序列比较。
编号的实施方案
以下实施方案列举了本文公开的特征的组合的非限制性排列。也考虑到特征组合的其他排列。特别地,这些编号的实施方案中的每一个均被视为取决于或相关于每个先前或后续编号的实施方案,而与列出它们的顺序无关。1.一种组合物,包含:与SEQ ID NO:1的残基829至残基991具有至少80%序列一致性的蛋白,其中所述蛋白在位置925处包含赖氨酸;和指导RNA,所述指导RNA包含与包含6至60个碱基的真核核酸序列反向互补的序列。2.一种组合物,包含:与SEQ ID NO:3的残基825至残基996具有至少80%序列一致性的蛋白,其中所述蛋白在位置930处包含赖氨酸;和指导RNA,所述指导RNA包含与包含6至60个碱基的真核核酸序列反向互补的序列。3.一种组合物,包含:与SEQ ID NO:1具有至少80%序列一致性的蛋白,其中所述蛋白在位置925处包含赖氨酸;和指导RNA,所述指导RNA包含与包含6至60个碱基的真核核酸序列反向互补的序列。4.一种组合物,包含:与SEQ ID NO:3具有至少80%序列一致性的蛋白,其中所述蛋白在位置930处包含赖氨酸;和指导RNA,所述指导RNA包含与包含6至60个碱基的真核核酸序列反向互补的序列。5.如实施方案1-4中的任一项所述的组合物,其中所述真核核酸序列是人核酸序列。6.如实施方案1-4中的任一项所述的组合物,其中所述真核核酸序列是植物核酸序列。7.如实施方案1或3中的任一项所述的组合物,其中编码SEQ ID NO:1的核苷酸序列包含相比于SEQ ID NO:2至少80%的序列一致性。8.如实施方案2或4中的任一项所述的组合物,其中编码SEQ ID NO:3的核苷酸序列包含相比于SEQ ID NO:4至少80%的序列一致性。9.如实施方案1-8中的任一项所述的组合物,其中所述蛋白来自真杆菌科。10.如实施方案1-9中的任一项所述的组合物,其中所述蛋白包含核酸酶。11.如实施方案10所述的组合物,其中所述核酸酶包含V型CRISPR相关蛋白。12.如实施方案11所述的组合物,所述V型CRISPR相关蛋白包含Cas12a蛋白。13.如实施方案12所述的组合物,其中Cas12a蛋白是经宏基因组学挖掘的。14.如实施方案5-13中的任一项所述的组合物,其中所述人核酸序列与癌症有关。15.如实施方案1-14中的任一项所述的组合物,其中所述组合物包含7至7.9的pH。16.如实施方案1-15中的任一项所述的组合物,其中所述组合物的pH为7。17.如实施方案1-16中的任一项所述的组合物,其中所述组合物配制在缓冲液中。18.如实施方案17所述的组合物,其中所述缓冲液包含Bis-Tris丙烷-HCl。19.如实施方案17-18中的任一项所述的组合物,其中所述缓冲液包含MgCl2。20.如实施方案17-19中的任一项所述的组合物,其中所述缓冲液包含牛血清白蛋白。21.如实施方案17-20中的任一项所述的组合物,其中所述缓冲液包含0.1至50mM Bis-Tris丙烷-HCl。22.如实施方案17-21中的任一项所述的组合物,其中所述缓冲液包含0.1至50mM MgCl2。23.如实施方案17-22中的任一项所述的组合物,其中所述缓冲液包含1至500μg/ml牛血清白蛋白。24.如实施方案17-23中的任一项所述的组合物,其中所述缓冲液包含10mM Bis-Tris丙烷-HCl。25.如实施方案17-24中的任一项所述的组合物,其中所述缓冲液包含10mM MgCl2。26.如实施方案17-25中的任一项所述的组合物,其中所述缓冲液包含100μg/ml的牛血清白蛋白。27.如实施方案1-26中的任一项所述的组合物,其中所述蛋白包含纯化标签。28.如实施方案27所述的组合物,其中所述纯化标签包含选自由以下组成的组中的至少一种标签:His标签、FLAG标签、AU1表位标签、AU5表位标签、噬菌体T7标签、噬菌体V5表位标签、蓝舌病毒标签(B标签)、Glu-Glu标签(EE标签)、HSV表位标签、KT3表位标签、Myc表位标签、PDZ配体标签、聚精氨酸标签、聚天冬氨酸标签、聚半胱氨酸标签、聚苯丙氨酸标签、蛋白C标签、S1标签、S标签、Step标签和VSV-G标签。29.如实施方案1-28中的任一项所述的组合物,其中所述指导RNA包含富含A的原间隔子相邻基序(PAM)序列、富含G的PAM序列、富含T的PAM序列或富含C的PAM序列。30.如实施方案1-29中的任一项所述的组合物,其中所述指导RNA包含富含T的PAM序列。31.如实施方案29-30中的任一项所述的组合物,其中所述PAM序列包含3个T核碱基、2个T核碱基或1个T核碱基。32.如实施方案29-31中的任一项所述的组合物,其中所述PAM序列包含TTTN。33.如实施方案5-32中的任一项所述的组合物,其中所述人核酸序列包含处于KRAS、HER2/neu、PD-1、TCR、p53、CCR5、DNMT1、EMX1和LKB1中的区域。34.如实施方案14-33中的任一项所述的组合物,其中所述癌症包括:膀胱癌、骨癌、血液癌、乳腺癌、黑色瘤、甲状腺癌、甲状旁腺癌、骨髓癌、喉咽癌、喉癌、肺癌、食道癌、胰腺癌、结直肠癌、胃癌、舌癌、皮肤癌、脑瘤、子宫癌、头颈癌、胆囊癌、口腔癌、中枢神经系统肿瘤、或肝癌。35.如实施方案1-34中的任一项所述的组合物,其中所述指导RNA序列包含1至100个核苷酸。36.如实施方案1-35中的任一项所述的组合物,其中所述组合物表现出AsCas12a、FnCas12a或LbCas12a的至少2倍。37.如实施方案1-36中的任一项所述的组合物,其中所述指导RNA包含crRNA和tracrRNA。38.如实施方案37所述的组合物,其中所述crRNA包含AAUU的5'重复识别序列。39.如实施方案1-38中的任一项所述的组合物,其中蛋白在CaCl2、CoCl2、FeCl2、MnSO4或其任何组合的存在下表现出切割活性。40.一种基因编辑的方法,其中所述方法包括:使细胞与如实施方案1-39中的任一项所述的组合物接触;使所述指导RNA与真核核酸序列结合;以及切割所述真核核酸序列。41.一种基因编辑的方法,其中所述方法包括:提供组合物,所述组合物包含:与SEQ ID NO:1的残基829至残基991具有至少80%序列一致性的蛋白,其中所述蛋白在位置925处包含赖氨酸;和指导RNA,所述指导RNA包含与包含6至60个碱基的核酸序列反向互补的序列;使细胞与所述组合物接触;使所述指导RNA与真核核酸序列结合;以及切割所述核酸序列。42.一种基因编辑的方法,其中所述方法包括:提供组合物,所述组合物包含:与SEQ ID NO:3的残基825至残基996具有至少80%序列一致性的蛋白,其中所述蛋白在位置930处包含赖氨酸;和指导RNA,所述指导RNA包含与包含6至60个碱基的核酸序列反向互补的序列;使细胞与所述组合物接触;使所述指导RNA与真核核酸序列结合;以及切割所述核酸序列。43.一种基因编辑的方法,其中所述方法包括:提供组合物,所述组合物包含:与SEQ ID NO:1具有至少80%序列一致性的蛋白,其中所述蛋白在位置925处包含赖氨酸;和指导RNA,所述指导RNA包含与包含6至60个碱基的核酸序列反向互补的序列;使细胞与所述组合物接触;使所述指导RNA与真核核酸序列结合;以及切割所述核酸序列。44.一种基因编辑的方法,其中所述方法包括:提供组合物,所述组合物包含:与SEQ IDNO:3具有至少80%序列一致性的蛋白,其中所述蛋白在位置930处包含赖氨酸;和指导RNA,所述指导RNA包含与包含6至60个碱基的核酸序列反向互补的序列;使细胞与所述组合物接触;使所述指导RNA与真核核酸序列结合;以及切割所述核酸序列。45.如实施方案41-44中的任一项所述的方法,其中所述真核核酸序列是人核酸序列。46.如实施方案41-44中的任一项所述的方法,其中所述真核核酸序列是植物核酸序列。47.如实施方案41或43中的任一项所述的方法,其中编码SEQ ID NO:1的核苷酸序列包含相比于SEQ ID NO:2至少80%的序列一致性。48.如实施方案42或44中的任一项所述的组合物,其中编码SEQ ID NO:3的核苷酸序列包含相比于SEQ ID NO:4至少80%的序列一致性。49.如实施方案36-48中的任一项所述的方法,其中所述细胞包括癌细胞。50.如实施方案36-49中的任一项所述的方法,其中使所述细胞与所述组合物接触包括将所述组合物施用于需要其的受试者。51.如实施方案50所述的方法,其中所述施用包括静脉内、皮下、肌内、口服或粘膜施用。52.如实施方案36-51中的任一项所述的方法,其中使所述细胞与所述组合物接触包括离体将所述组合物施用于所述细胞。53.如实施方案41-52中的任一项所述的方法,其中所述蛋白来自真杆菌科。54.如实施方案41-53中的任一项所述的方法,其中所述蛋白包含核酸酶。55.如实施方案54所述的方法,其中所述核酸酶包含V型CRISPR相关蛋白。56.如实施方案55所述的方法,所述V型CRISPR相关蛋白包含Cas12a蛋白。57.如实施方案56所述的方法,其中所述Cas12a蛋白是经宏基因组学挖掘的。58.如实施方案45-57中的任一项所述的方法,其中所述人核酸序列与癌症有关。59.如实施方案41-58中的任一项所述的方法,其中所述方法包括在7至7.9的pH下切割所述核酸序列。60.如实施方案41-59中的任一项所述的方法,其中所述方法包括在7的pH下切割所述核酸序列。61.如实施方案41-60中的任一项所述的方法,其中所述组合物配制在缓冲液中。62.如实施方案61所述的方法,其中所述缓冲液包含Bis-Tris丙烷-HCl。63.如实施方案61-62中的任一项所述的方法,其中所述缓冲液包含MgCl2。64.如实施方案61-63中的任一项所述的方法,其中所述缓冲液包含牛血清白蛋白。65.如实施方案61-64中的任一项所述的方法,其中所述缓冲液包含0.1至50mM Bis-Tris丙烷-HCl。66.如实施方案61-65中的任一项所述的方法,其中所述缓冲液包含0.1至50mM MgCl2。67.如实施方案61-66中的任一项所述的方法,其中所述缓冲液包含1至500μg/ml牛血清白蛋白。68.如实施方案61-67中的任一项所述的方法,其中所述缓冲液包含10mM Bis-Tris丙烷-HCl。69.如实施方案61-68中的任一项所述的方法,其中所述缓冲液包含10mM MgCl2。70.如实施方案61-69中的任一项所述的方法,其中所述缓冲液包含100μg/ml的牛血清白蛋白。71.如实施方案41-70中的任一项所述的方法,其中所述蛋白包含纯化标签。72.如实施方案71所述的方法,其中所述纯化标签包含选自由以下组成的组中的至少一种标签:His标签、FLAG标签、AU1表位标签、AU5表位标签、噬菌体T7标签、噬菌体V5表位标签、蓝舌病毒标签(B标签)、Glu-Glu标签(EE标签)、HSV表位标签、KT3表位标签、Myc表位标签、PDZ配体标签、聚精氨酸标签、聚天冬氨酸标签、聚半胱氨酸标签、聚苯丙氨酸标签、蛋白C标签、S1标签、S标签、Step标签和VSV-G标签。73.如实施方案41-72中的任一项所述的组合物,其中所述指导RNA包含富含A的原间隔子相邻基序(PAM)序列、富含G的PAM序列、富含T的PAM序列或富含C的PAM序列。74.如实施方案41-73中的任一项所述的方法,其中所述指导RNA包含富含T的PAM序列。75.如实施方案73-74中的任一项所述的组合物,其中所述PAM序列包含3个T核碱基、2个T核碱基或1个T核碱基。76.如实施方案73-75中的任一项所述的方法,其中所述PAM序列包含TTTN。77.如实施方案45-76中的任一项所述的方法,其中所述人核酸序列包含处于KRAS、HER2/neu、PD-1、TCR、p53、CCR5、DNMT1、EMX1和LKB1中的区域。78.如实施方案49-77中的任一项所述的方法,其中所述癌细胞包括:膀胱癌细胞、骨癌细胞、血液癌细胞、乳腺癌细胞、黑色瘤细胞、甲状腺癌细胞、甲状旁腺癌细胞、骨髓癌细胞、喉咽癌细胞、喉癌细胞、肺癌细胞、食道癌细胞、胰腺癌细胞、结直肠癌细胞、胃癌细胞、舌癌细胞、皮肤癌细胞、脑瘤细胞、子宫癌细胞、头颈癌细胞、胆囊癌细胞、口腔癌细胞、中枢神经系统肿瘤细胞或肝癌细胞。79.如实施方案45-78中的任一项所述的方法,其中所述组合物表现出AsCas12a、FnCas12a或LbCas12a的至少2倍。80.如实施方案45-79中的任一项所述的方法,其中所述指导RNA包含crRNA和tracrRNA。81.如实施方案80所述的方法,其中所述crRNA包含AAUU的5'重复识别序列。82.如实施方案45-81中的任一项所述的方法,其中蛋白在CaCl2、CoCl2、FeCl2、MnSO4或其任何组合的存在下表现出切割活性。83.如实施方案41-82中的任一项所述的方法,其中所述指导RNA序列包含1至100个核苷酸。84.一种改善V型CRISPR相关蛋白的切割效率的方法,所述方法包括:提供V型CRISPR相关蛋白;鉴定位置925或930处的残基;以及将位置925或930处的残基突变为赖氨酸,从而改善V型CRISPR相关蛋白的切割效率。
实施例
提供这些实施例仅出于说明性目的,而不一定限制本文提供的发明主题的范围。
实施例1
通过宏基因组的挖掘来发现Cas12a蛋白
该实施例说明了通过宏基因组的挖掘来发现Cas12a蛋白。图1显示了从宏基因组中挖掘Cas12a的过程的示意图。从NCBI Genbank BLAST数据库下载宏基因组碱基序列,并将其建立为本地BLASTp数据库。接下来,从Uniprot数据库下载16个Cas12a蛋白序列和各种CRISPR相关蛋白1(Cas1)氨基酸序列。使用MetaCRT来鉴定宏基因组碱基序列中的CRISPR重复序列和间隔区序列。提取了具有CRISPR序列的宏基因组序列,并使用Prodigal程序来预测基因。
基于CRISPR序列的10kb范围内的预测基因而建立了分类学层次,并使用Cas12a氨基酸序列来从预测的基因预测Cas12a蛋白的同源物。使用Cas1基因,预测了Cas12a同源物的分类学层次是否具有Cas1同源物,并选择了在Cas1的800个氨基酸(aa)至1500aa范围内的Cas12a基因。
使用MAFFT(使用快速傅立叶变换的多重比对)程序比对未断裂的Cas12a蛋白,以比对序列,运行相邻连接(NJ)方法,并使用MEGA7用100x自展来构建系统树图。使用本文发现的Cas12a氨基酸序列,并通过选择与已知Cas12a基因形成单源性组的基因来构建使用MEGA7的最大似然1000x自展系统树图,以鉴定任何进化关系。
图20A-C显示了本公开的mgCas12a蛋白的示意图。图20A显示了相对于图1的简化示意图,显示了从宏基因组数据中挖掘Cas12a蛋白的流程。图20B显示了本公开的源自宏基因组的Cas12a蛋白和其他Cas12a直系同源物的系统树。自展值显示在每个节点上。本公开中使用的序列包括FnCas12a、LbCas12a、AsCas12a、mgCas12a-1和mgCas12a-2。图20C显示了功能表征的新颖Cas12a和AsCas12a的示意图(Yamano等人,2016)。使用与AsCas12a氨基酸序列基于结构的比对来预测蛋白结构域。用虚线显示了mgCas12a-1和mgCas12a-2中Cas元件的不存在。定点诱变残基用黑色楔形标记。序列标识符(包括重叠群标题和GenBank登录号)在每个示意图的右侧。示意图中的首字母缩略词包括:Cas(CRISPR相关基因)、WED(楔形结构域)、REC(识别结构域)、PI(PAM相互作用结构域)、RuvC(RuvC核酸酶结构域)、BH(桥螺旋结构域)和Nuc(核酸酶结构域)。图2显示了Cas12a的系统树图,表明本文公开的宏基因组学挖掘方法是成功的。图21示出了本公开的源自宏基因组的Cas12a和其他直系同源物的无根且基于进化距离的系统树。本文使用的直系同源物包括FnCas12a、LbCas12a、AsCas12a、mgCas12a-1和mgCas12a-2。
实施例2
基因和指导RNA的合成
该实施例说明了基因和指导RNA(gRNA)的合成。使用ESPript程序来对新颖Cas12a蛋白、AsCas12a蛋白和LbCas12a蛋白进行基于结构的比对。选择与AsCas12a表现出同源性的新颖Cas12a蛋白,并用产生关键功能丧失的氨基酸残基进行置换,如用在同一位置处的AsCas12a氨基酸残基进行置换。表现出关键功能丧失的序列包括SEQ ID NO:1的K925Q突变体(mgCas12a-1)和SEQ ID NO:3的K930Q突变体(mgCas12a-2)。
考虑了用于人、拟南芥和大肠杆菌的密码子使用,并进行了密码子优化。SEQ IDNO:7和SEQ ID NO:8分别示出了已被人密码子优化的SEQ ID NO:1(mgCas12a-1)和SEQ IDNO:3(mgCas12a-2)的碱基序列。图3-图8显示了本公开的Cas12a蛋白的比对,包括SEQ IDNO:1(mgCas12a-1)、SEQ ID NO:3(mgCas12a-2)、SEQ ID NO:9(AsCas12a)、SEQ ID NO:10(LbCas12a)和SEQ ID NO:11(FnCas12a)。图9A显示了本公开的Cas12a蛋白的特征图,包括通过宏基因组学挖掘发现的Cas12a蛋白(例如,SEQ ID NO:1(mgCas12a-1)和SEQ ID NO:3(mgCas12a-2)、AsCas12a、LbCas12a和FnCas12a。图9B显示了Cas12a直系同源物之间的氨基酸序列一致性(%)图。与表中的所有其他直系同源物相比,AsCas12具有低于40%的序列一致性。LbCas12a和FnCas12a相比于mgCas12a-1和mgCas12a-2具有低于40%的序列一致性。LbCas12a相比于FnCas12a具有40%至50%的序列一致性。mgCas12a-1相比于mgCas12a-2具有大于50%的序列一致性。
用克隆到pUC57载体上的基因在pET28a-KanR-6xHis-BPNLS载体上进行T4连接。还进行了限制性克隆。将克隆的载体转化到大肠杆菌DH5a和Rosetta菌株中。从宏基因组CRISPR重复序列中提取crRNA的5'柄序列,用DNA寡核苷酸对RNA结构进行建模和合成,对序列进行转录,并使用FLUOstar Omega和MEGAshortscript T7 RNA转录酶来确认浓度。
实施例3
蛋白表达和精制
该实施例说明了蛋白表达和精制。使用Rosetta(DE3),将5mL大肠杆菌培养过夜。用500mL Terrific肉汤培养基(TB)和100mg/ml卡那霉素进行接种。在37℃培养基中培养培养物,直到测得的OD600为0.6,另外,在用0.4μM IPTG(异丙基β-D-1-硫代吡喃半乳糖苷)处理后,在22℃在16至18小时时测定蛋白表达。离心后,将细胞溶解于10mL缓冲液(20mMHEPES pH 7.5、100mM KCl、20mM咪唑、10%甘油和不含EDTA的蛋白酶抑制剂混合物)中,并通过超声处理将细胞重新分散。在20分钟期间,将细胞以6000rpm离心3次,并且使用0.22微米的过滤器进行过滤。
使用镍柱(HisTrap FF 5ml)和300mM咪唑缓冲液,将蛋白清洁、洗脱并通过亲和色谱法纯化。将蛋白通过SDS-PAGE电泳来确认大小,并使用20mM HEPES pH 7.5、100mM KCl、1mM DTT、10%甘油进行过夜透析。根据蛋白的大小,进行选择性过滤和浓缩(Amicon Ultra离心过滤器100,000MWCO)。使用Bradford蛋白测定法来测量蛋白浓度,并将蛋白存储在-80℃。
实施例4
体外切割分析
该实施例说明了体外切割分析。通过PCR扩增了莴苣的木糖基转移酶,预测PAM(原间隔子相邻基序)序列,并设计了指导RNA。将mgCas12a-1(SEQ ID NO:1)和mgCas12a-2(SEQID NO:3)的RNP(核糖核蛋白)复合物置于室温20分钟,并且蛋白和RNA的摩尔比为1:1.25。在处理精制的木糖基转移酶PCR产物后,将RNP重悬在各种缓冲液中,包括NEBuffer 1.1(1X缓冲液成分、10mM Bis-Tris-丙烷-HCl、10mM MgCl2和100μg/ml BSA)、NEBuffer 2.1(1X缓冲液成分、50mM NaCl、10mM Tris-HCl、10mM MgCl2和100μg/ml BSA)和NEBuffer 3.1(1X缓冲液成分、100mM NaCl、50mM Tris-HCl、10mM MgCl2和100μg/ml BSA)并且体外切割分析在37℃进行。在25℃,NEBuffer 1.1、NEBuffer 2.1和NEBuffer 3.1的pH值分别为7.0、pH 7.9和pH 7.9。反应进行至完成,并在65℃孵育10分钟后终止。通过1.5%琼脂糖凝胶电泳来确认反应产物。图10-12显示凝胶电泳结果。
如图10-12中所述,当在NEBuffer 1.1缓冲液中配制mgCas12a-1和crRNA时,靶dsDNA被切割。此外,如果在NEBuffer 1.1中配制mgCas12a-2和crRNA,则靶dsDNA被切割。因此,mgCas12a-1和mgCas12a-2在pH 7.0具有活性。
图16显示了Cas12a核酸酶(包括mgCas12a-1(野生型)、he_mgCas12a-1(人源化和工程化的mgCas12a-1)、de_mgCas12a-1(失效和工程化的mgCas12a)、mg Cas12a-2、he_mgCas12a-2、de_mgCas12a-2、AsCas12a、FnCas12a和LbCas12a)的体外切割测定。每种RNP的浓度为300nM,大括号表示凝胶电泳中已切割的模板,其在1.8kb和0.65kb处分辨。将RNP样品与1X NEBuffer在37℃孵育1小时。mgCas12a和de_mgCas12a也被人源化。体外切割试验中使用的材料和方法包括蛋白与gRNA的摩尔比1:1.25。在20μL反应中,使用了300nM(911.4ng)的蛋白(FnCas12a-BPNLS,158.82kDa)。在20μL反应中,使用了375nM(102.5ng)的crRNA(LsXTb12)。反应进行1小时。使用300ng模板DNA,并在37℃下孵育1小时。所有Cas12a核酸酶均将模板DNA(2.45kB)切割成1.8kB和0.65kB的两个片段。mgCas12a-1、he_mgCas12a-1、mgCas12a-2、he_mgCas12a-2、AsCas12a、FnCas12a和LbCas12a将模板DNA剪切成两个片段,而与de_mgCas12a-1和de_mgCas12a-2混合的模板DNA则以未剪切的大小分辨。
图17A-B显示了在12小时(图17A)和24小时(图17B)的反应时间之后,Cas12a核酸酶(包括mgCas12a-1(野生型)、he_mgCas12a-1(人源化和工程化的mgCas12a-1)、de_mgCas12a-1(失效和工程化的mgCas12a)、mg Cas12a-2、he_mgCas12a-2、de_mgCas12a-2、AsCas12a、FnCas12a和LbCas12a)的体外切割测定。每种RNP的浓度为300nM,大括号表示凝胶电泳中已切割的模板,其在1.8kb和0.65kb处分辨。将RNP样品与1X NEBuffer在37℃孵育12小时和24小时。mgCas12a和de_mgCas12a也被人源化。体外切割试验中使用的材料和方法包括蛋白与gRNA的摩尔比1:1.25。在20μL反应中,使用了300nM(911.4ng)的蛋白(FnCas12a-BPNLS,158.82kDa)。在20μL反应中,使用了375nM(102.5ng)的crRNA(LsXTb12)。反应在37℃进行12小时和24小时,并使用300ng模板DNA。将样品在37℃下孵育12小时和24小时。AsCas12a、FnCas12a和LbCas12a在12小时内完全降解了模板DNA,表明它们具有无终止的dsDNA酶活性。mgCas12a-1、he_mgCas12a-1、mgCas12a-2和he_mgCas12a-2表现出较低的无终止dsDNA酶活性,并且在24h反应后模板DNA仍然存在。与de_mgCas12a-1和de_mgCas12a-2孵育的样品也失去了无终止dsDNA酶活性。
图18显示了用Cas12a核酸酶(包括mgCas12a-1(野生型)、he_mgCas12a-1(人源化和工程化的mgCas12a-1)、de_mgCas12a-1(失效和工程化的mgCas12a)、mg Cas12a-2、he_mgCas12a-2、de_mgCas12a-2、AsCas12a、FnCas12a和LbCas12a)对靶质粒DNA的体外切割测定。每种RNP的浓度为300nM,箭头显示切割的模板,其为6kb的线性化产物。将RNP样品与1XNEBuffer在37℃孵育1小时。mgCas12a和de_mgCas12a也被人源化。体外切割试验中使用的材料和方法包括蛋白与gRNA的摩尔比1:1.25。在20μL反应中,使用了300nM(911.4ng)的蛋白(FnCas12a-BPNLS,158.82kDa)。在20μL反应中,使用了375nM(102.5ng)的crRNA(LsXTb12)。反应在37℃下进行1小时。使用300ng模板质粒DNA,并将样品在37℃孵育1小时。所有Cas12a核酸酶都切割了模板DNA,从10kb切割成其大小为6kb的线性化形式。mgCas12a-1、he_mgCas12a-1、mgCas12a-2、he_mgCas12a-2、AsCas12a、FnCas12a和LbCas12a剪切并线性化了靶质粒DNA,而与de_mgCas12a-1和de_mgCas12a-2孵育的靶质粒DNA保持未剪切的大小。
图19A-B显示了在12小时(图19A)和24小时(图19B)的反应时间之后,用Cas12a核酸酶(包括mgCas12a-1(野生型)、he_mgCas12a-1(人源化和工程化的mgCas12a-1)、de_mgCas12a-1(失效和工程化的mgCas12a)、mg Cas12a-2、he_mgCas12a-2、de_mgCas12a-2、AsCas12a、FnCas12a和LbCas12a)对靶质粒DNA的体外切割测定。每种RNP的浓度为300nM,箭头显示切割的模板,其为6kb的线性化产物。将RNP样品与1X NEBuffer在37℃孵育12小时和24小时。mgCas12a和de_mgCas12a也被人源化。体外切割试验中使用的材料和方法包括蛋白与gRNA的摩尔比1:1.25。在20μL反应中,使用了300nM(911.4ng)的蛋白(FnCas12a-BPNLS,158.82kDa)。在20μL反应中,使用了375nM(102.5ng)的crRNA(LsXTb12)。反应在37℃进行12小时和24小时,模板DNA的使用量为300ng。将样品在37℃下孵育12小时和24小时。AsCa12a、FnCas12a和LbCas12a在12小时内降解了所有模板质粒DNA,表明这些核酸酶表现出无终止dsDNA酶活性。mgCas12a-1、he_mgCas12a-1、mgCas12a-2和he_mgCas12a-2表现出较低的无终止dsDNA酶活性,并且在反应24小时后模板质粒DNA仍然存在。mgCas12a-1和de_mgCas12a-2也失去了无终止dsDNA酶活性。
实施例5
使用SEQ ID NO:1的Cas12a蛋白进行基因组编辑
该实施例说明了用SEQ ID NO:1的Cas12a蛋白进行基因组编辑。SEQ ID NO:1是重组表达或化学合成的。如果重组表达,则SEQ ID NO:1的Cas12a蛋白包含用于通过亲和色谱法纯化所述蛋白的纯化标签。将SEQ ID NO:1的Cas12a蛋白与具有与关注的核酸序列反向互补的序列的指导RNA(也称为crRNA)偶联。关注的核酸序列是双链DNA(dsDNA)并且来自人。将指导RNA和SEQ ID NO:1的Cas12a蛋白施用于受试者。所述受试者是人。指导RNA将SEQID NO:1的Cas12a蛋白引导至关注的核酸序列,并且SEQ ID NO:1的Cas12a蛋白切割dsDNA。
实施例6
使用SEQ ID NO:3的Cas12a蛋白进行基因组编辑
该实施例说明了用SEQ ID NO:3的Cas12a蛋白进行基因组编辑。SEQ ID NO:3的Cas12a蛋白被重组表达或化学合成。如果重组表达,则SEQ ID NO:3的Cas12a蛋白包含用于通过亲和色谱法纯化所述蛋白的纯化标签。将SEQ ID NO:3的Cas12a蛋白与具有与关注的核酸序列反向互补的序列的指导RNA(也称为crRNA)偶联。关注的核酸序列是双链DNA(dsDNA)并且来自人。将指导RNA和SEQ ID NO:3的Cas12a蛋白施用于受试者。所述受试者是人。指导RNA将SEQ ID NO:3引导至关注的核酸序列,并且SEQ ID NO:3的Cas12a蛋白切割dsDNA。
实施例7
用SEQ ID NO:1的Cas12a蛋白工程化细胞
该实施例说明了用SEQ ID NO:1的Cas12a蛋白离体工程化细胞。SEQ ID NO:1的Cas12a蛋白被重组表达或化学合成。如果重组表达,则SEQ ID NO:1的Cas12a蛋白包含用于通过亲和色谱法纯化所述蛋白的纯化标签。将SEQ ID NO:1的Cas12a蛋白与具有与关注的核酸序列反向互补的序列的指导RNA(也称为crRNA)偶联。关注的核酸序列是双链DNA(dsDNA)并且来自人。将指导RNA和SEQ ID NO:1的Cas12a蛋白施用于多个细胞。指导RNA将SEQ ID NO:1的Cas12a蛋白引导至关注的核酸序列,并且SEQ ID NO:1的Cas12a蛋白切割dsDNA,从而编辑所述多个细胞。细胞被编辑以敲除异常基因或引入功能性基因。将经编辑的细胞施用于需要其的受试者。受试者是人并且患有癌症。癌症是胃癌、结直肠癌、肝癌、肺癌或乳腺癌。
实施例8
用SEQ ID NO:3的Cas12a蛋白工程化细胞
该实施例说明了用SEQ ID NO:3的Cas12a蛋白离体工程化细胞。SEQ ID NO:3的Cas12a蛋白被重组表达或化学合成。如果重组表达,则SEQ ID NO:3的Cas12a蛋白包含用于通过亲和色谱法纯化所述蛋白的纯化标签。将SEQ ID NO:3的Cas12a蛋白与具有与关注的核酸序列反向互补的序列的指导RNA(也称为crRNA)偶联。关注的核酸序列是双链DNA(dsDNA)并且来自人。将指导RNA和SEQ ID NO:3的Cas12a蛋白施用于多个细胞。指导RNA将SEQ ID NO:3的Cas12a蛋白引导至关注的核酸序列,并且SEQ ID NO:3的Cas12a蛋白切割dsDNA,从而编辑所述多个细胞。细胞被编辑以敲除异常基因或引入功能性基因。将经编辑的细胞施用于需要其的受试者。受试者是人并且患有癌症。癌症是胃癌、结直肠癌、肝癌、肺癌或乳腺癌。
实施例9
Cpf1蛋白的体外切割分析
该实施例说明了Cpf1蛋白的体外切割分析。蛋白质和gRNA以1:1.2摩尔比共同孵育。在20μl反应的情况下,使用了100nM(320ng)的FnCas12a-BPNLS蛋白(159.81kDa)。在20μl反应的情况下,使用了120nM(80ng)的crRNA DHCR7。测试了在37℃下1小时和4小时的反应时间,并使用了200ng模板DNA。图14显示了在用核酸酶孵育靶后1小时和在用核酸酶孵育靶后4小时,使用各种核酸酶(包括FnCas12、AsCas12、LbCas12、He-MgCas12a-1(人源化和工程化的mgCas12a-1)和He-MgCas12a-2(人源化和工程化的mgCas12a-2))进行的体外切割测定的结果。每种RNP的浓度为100nM。箭头指示模板的切割片段,其以680个碱基对(bp)和750bps分辨。模拟A表示在切割测定中均未使用gRNA或蛋白的样品。模拟B表示在切割测定中不使用蛋白的样品。He-MgCas12a-1和He-MgCas12a-2都将DNA模板(1,430bp)切割成750bp和680bp的两个片段。
到1小时时,He-MgCas12a-1已将模板DNA完全剪切成两个片段,而与He-MgCas12a-2孵育时,一些未剪切大小的剩余模板DNA明显可见。到4小时时,He-MgCas12a-2也已完全剪切模板DNA。He-MgCas12a-1和He-MgCas12a-2的切割效率高于其他三种Cas12核酸酶,因为与其他三种Cas12核酸酶(FnCas12、AsCas12和LbCas12)孵育1小时后,未剪切的模板DNA仍然存在。此外,FnCas12泳道表明模板和切割产物均随着时间而被降解,而He-MgCas12a-1和He-MgCas12a-2泳道均未显示任何进一步的DNA降解。
实施例10
稻和本氏烟草的基因组编辑
该实施例说明了稻和本氏烟草的基因组编辑。在稻中两种crRNA和在本氏烟草中三种crRNA用来评估He-MgCas12a-1相比于FnCas12的基因组编辑效率。使用扩增子靶向的深度测序来测量基因组编辑效率值。这些测定中使用的植物和其他材料包括:20-30个莴苣种子(Lactuca sativa var.Chungchima)、MS盐与维生素(M0222,Duchefa,RV Haarlem,荷兰)、剃须刀(NO.10,FEATHER SAFETY RAZOR,Osaka,日本)、镊子(Cat.3-SA,Jonostick byregine Switzerland Standard,中国)、细胞滤过器(Cat.93100,SPL,韩国)、1000μl宽孔枪头(T-205-WB-C-R-S,Axygen,NY)、24℃生长室(HB103M,HanBaek Scientific Co.,韩国)、pH计(STARA2115,ThermoFisher Scientific,Waltham,MA,美国)和灭菌器(Cat.BF-60AC,BioFree,韩国)。使用以下进行PEG转染:1)酶溶液,其中包含甘露醇(M0803,Duchefa,RVHaarlem,荷兰)、KCl(P5405,Sigma-Aldrich,美国)、MES(M1503,Duchefa,RV Haarlem,荷兰)、CaCl2(C3881,Sigma-Aldrich,日本)、BSA(A9056,Sigma-Aldrich,美国)、纤维素酶R-10(Yakurt Pharmaceutical Inc.,东京,日本)和离析酶R-10(Yakurt PharmaceuticalInc.,东京,日本),2)PEG溶液,其中包含NaCl(7548-4405,Daejung chemicals andmetals,韩国)、KCl(P5405,Sigma-Aldrich,美国)、CaCl2(C3881,Sigma-Aldrich,日本)和MES(M1503,Duchefa,RV Haarlem,荷兰),和3)MMG溶液,其中包含甘露醇(M0803,Duchefa,RV Haarlem,荷兰)、MgCl2(M0533,Duchefa,RV Haarlem,荷兰)和MES(M1503,Duchefa,RVHaarlem,荷兰)。
植物转化和再生如下进行。用于原生质体转化的植物和试剂包括:首先用2%的次氯酸钠(Clorox)将莴苣种子灭菌10分钟,用无菌dH2O洗涤种子5次,然后将无菌种子种植在1/2MS培养基上。萌发后5天收获莴苣叶以用于原生质体制备。用0.4M甘露醇、20mM KCl、20mM MES(pH 5.7)、1.5%纤维素酶R-10(Yakurt)和0.3%离析酶R-10(Yakurt)制得40mL酶溶液。在55℃下孵育10分钟,添加10mM CaCl2和0.1%BSA,并通过0.45μm针筒式过滤器过滤酶溶液。
原生质体的制备包括:用剃须刀从稻或本氏烟草小植株上剪下十到十五片叶,将两到三片叶堆放在无菌水滴中,并将堆放在一起的叶切片。将20mL的酶溶液倒入90mm直径的板中,将十五片切片的叶子转移到20mL的酶溶液中。用铝箔覆盖该溶液。将90mm板放在50转/分钟的旋转摇床上,并将板孵育4至5小时。将具有原生质体的酶溶液倒入圆管中,并将相同体积的W5溶液添加到20mL酶溶液中。W5溶液包含154mM NaCl、125mM CaCl2、5mM KCl和2mM MES(pH 5.7)。使含有原生质体的40mL酶溶液通过100μm细胞滤过器流入50mL圆管中。移去细胞滤过器,并将50mL试管以100g(或在Hanil中为80g)离心5分钟。用20mL长移液管除去上清液。添加1mL的MMG溶液。通过将2.5mL的0.8M甘露醇、0.25mL的300mM MgCl2和0.1mL的200mM MES(pH 5.7)混合来制备5mL MMG溶液。通过将5mL的0.8M甘露醇、0.5mL的300mMMgCl2和0.2mL的200mM MES(pH 5.7)混合来制备10mL MMG溶液。用血细胞计数器对原生质体进行计数,通过添加MMG溶液将细胞数量调节至2x 106个细胞/mL。将含有2x 105/mL原生质体的200μl等分到1.5mL试管中。
用CRISPR RNP转化原生质体。如下表3所示,在1.5mL试管中进行20μl转化反应。
表3:转化反应
LipofectamineTM 3000和Plus试剂TM转染试剂均用于与PEG 4000一起进行RNP递送。RNP可以用Cpf1或其他Cas蛋白代替。GFP-Cas9被用来帮助跟踪Cas9定位,而不是Cas9。
将RNP转化混合物在室温下孵育10分钟。将200μl原生质体溶液用1,000μl宽孔枪头等分入干净的1.5mL管中。将RNP混合物添加至200μl原生质体溶液中并轻轻混合。在RNP-原生质体溶液中添加相同体积(200μl)的40%PEG溶液(如下表4所示)。
表4:PEG溶液
40%PEG溶液成分 | 5ml | 10ml |
0.8M甘露醇 | 1.25ml | 2.5ml |
1M CaCl2 | 0.5ml | 1ml |
PEG 4000 | 2g | 4g |
dH2O至 | 5ml | 10ml |
将RNP-原生质体-PEG溶液轻轻吸移五到十次。将RNP-原生质体-PEG溶液在室温下放置10分钟。将800μl W5溶液添加到RNP-原生质体-PEG溶液中,倒置四到五次。将管在大型台式离心机中以100g离心1分钟,弃去上清液。将200μl W5溶液添加到样品中,并将样品在28℃下孵育4小时。收获原生质体并提取基因组DNA。扩增靶DNA区域并进行扩增子靶向测序。
扩增子的建立如下进行。在冰上工作,使用多通道移液器添加引物是通过从垂直i5(S5XX)引物条(strip)将4μl添加到板的列中,从水平i7(N7XX)引物条将4μl添加到板的行中。从8孔板条将10μl聚合酶加入每个孔中,将2μl的0.5ng/μl DNA转移到相应的孔中。将板密封、涡旋并在板离心机中以2000g旋转2分钟。使用表5中概述的循环条件进行PCR。使用KAPA HiFi混合物时,可以使用qPCR机或标准PCR机。qPCR的优势在于实时监控每个样品是如何扩增的,因为每个样品都包含SYBR绿。
表5:PCR循环条件
第二轮PCR产物如下进行清洗。将30μl H2O添加到PCR板的每个孔中,以使每个孔的总体积达到50μl,将50μl AmpureXP珠添加到96孔圆底板的每个孔中,并将50μl PCR产物转移到含有50μl AmpureXP混合物的96孔板中,然后将溶液上下吸移10次以进行混合。将样品在工作台上孵育至少10分钟。将板放在96孔板磁体上5分钟,直到液体看起来澄清为止。通过吸移和抽吸来弃去上清液。通过向每个样品中加入190μl 70-80%的乙醇来洗涤样品,并放置30秒。通过吸移和抽吸来弃去乙醇。如上所述,用乙醇洗涤样品并弃去乙醇,总共重复两次洗涤。将板从磁体上移除并风干2-3分钟,并确保没有检测到乙醇。将板从磁体上取下,并将珠重悬于22μl的H2O中,并通过上下吸移10次而充分混合。将板在工作台上孵育至少10分钟。将板放回到磁体上5分钟,并确保液体看起来透明。最后,将20μl上清液转移至新的96孔PCR板中。
合并PCR产物,并对文库进行如下定量。将10μl的每个第二轮PCR产物从板转移到单个微量离心管中。使用Qubit来确定DNA的浓度。将DNA浓度调节至2nM。
按照Illumina的说明使用MiSeq加载方案进行测序。引物序列显示在下面的表6中。
表6:引物序列
图15A说明FnCas12a在稻中分别在crRNA1-1、crRNA1-2、crRNA2中表现出0.5%、0.3%和0.9%的基因组编辑效率,并且He-MgCas12a-1在稻中分别在crRNA1-1、crRNA1-2、crRNA2中表现出1.9%、0.7%和10.2%的基因组编辑效率。图15B说明FnCas12a在本氏烟草中分别在crRNA1、crRNA2和crRNA3中表现出0.8%、1.4%和4.8%的基因组编辑效率,并且He-MgCas12a-1在本氏烟草中分别在crRNA1、crRNA2和crRNA3中表现出0.7%,3.7%和3.4%的基因组编辑效率。
实施例11
CCR5和DNMT1的基因组编辑
该实施例说明了CCR5和DNMT1的基因组编辑。
细胞培养。将HEK293T细胞在补充了10%胎牛血清、青霉素和链霉素的Dulbecco改良Eagle培养基(DMEM)中培养。
crRNA序列。对于CCR5和DNMT1,合成的crRNA的核苷酸序列是从IDT获得,并且在下面的表7中列出。
表7–靶向CCR5和DNMT1的crRNA序列
RNP制备和电穿孔。在将蛋白转染到细胞中之前,将纯化的mgCas12a-1和mgCas12a-2蛋白(100pmol)与CCR5或DNMT1 crRNA(200pmol)在室温下孵育20分钟,以形成RNP复合物。使用Lonza进行HEK293T细胞的细胞核转染。每个细胞核转染反应包括将20μl细胞核转染试剂中的约2x 105个细胞与10μl的RNP混合。
基因组DNA提取。在转染后48和72小时时收获细胞。按照制造商的说明,使用PureLink Genomic DNA试剂盒(Invitrogen)进行基因组DNA提取。
中靶位点的深度测序分析。使用两步PCR方法来扩增每个基因的靶位点旁侧的基因组区域。首先从经编辑的样品和对照样品中分离基因组DNA,并使用Q5高保真DNA聚合酶和衔接子引物进行PCR扩增35个循环。衔接子引物的序列在下面的表8中显示。使用QIAquick PCR纯化试剂盒制备所得的扩增子。使用KAPA HotStart DNA聚合酶对这些样品进行8个PCR循环,以进行索引,然后进行AMPure珠纯化。通过Qubit 2.0荧光计对纯化的DNA样品进行定量,通过BioAnalyzer分析大小,并以等摩尔比合并。将测序文库用IlluminaMiniSeq进行测序。使用Cas-Analyzer程序来分析数据。
表8–衔接子引物序列
图27显示了mgCas12a-1、mgCas12a-2和模拟(阴性对照)的编辑效率。靶向CCR5时,mgCas12a-1表现出更有效的编辑效率,如以下所示:与阴性对照(模拟)和mgCas12a-2相比,在48h和72h时得失位百分比更高。靶向CCR5时,在72h时mgCas12a-2表现出超出背景的得失位百分比。靶向DNMT1时,在48h和72h时mgCas12a-1和mgCas12a-2两者都表现出超出背景的得失位百分比,其中mgCas12a-2表现出的得失位百分比稍微高于mgCas12a-1。
下表9总结了mgCas12a-1和mgCas12a-2的得失位的靶向深度测序数据。
表9–mgCas12a-1和mgCas12a-2的得失位的靶向深度测序数据
实施例12
本氏烟草的基因组编辑
该实施例说明了CCR5和DNMT1的基因组编辑。
植物生长条件。使所有植物均在150E m-2s-1LED灯下于25℃在长日照(14小时光照/10小时黑暗光周期)条件下生长。
原生质体转染。将烟草(本氏烟草)和种子在0.4%次氯酸盐溶液中灭菌1分钟,在蒸馏水中洗涤3次,然后播种在补充有2%蔗糖的0.5x Gamborg B5固体培养基中。将在B5培养基中生长的4周龄叶子用酶(1.5%纤维素酶R10、0.3%离析酶R10、0.5M甘露醇、8mMCaCl2、5mM MES[pH 5.7]、0.1%BSA)在黑暗中在25℃消化4小时。过滤混合物,然后通过在圆底管中以100g离心6分钟来收集原生质体。将重悬的原生质体用W5溶液(154mM NaCl、125mM CaCl2·2H2O、5mM KCI、2mM MES[pH5.7])洗涤,并通过在100g离心6分钟而结团。最后,将原生质体重悬于MMG溶液(0.4M甘露醇、15mM MgCl2、4mM MES[pH 5.7])中,并在显微镜下使用血细胞计数器进行计数。将原生质体稀释至密度为1×106个原生质体/mlMMG溶液,并在PEG介导的转染前于4℃稳定化至少30分钟。将2×105个原生质细胞用与体外转录的crRNA(22μg)预混合的核酸酶蛋白(10μg的mgCas12a-1、mgCas12a-2或FnCpf1)进行转染。转染前,将核酸酶蛋白与crRNA在1x NEB缓冲液1中混合,并在室温下孵育10-20分钟。将重悬于200μl MMG溶液中的原生质体混合物与10-20μl的RNP复合物和210-220μl新鲜制备的PEG溶液(0.2M甘露醇、40%W/V PEG-4000、100mM CaCl2)轻轻混合并在25℃孵育15分钟。在室温下孵育15分钟后,通过添加840-880μL的W5溶液来终止转化。通过在室温下以100g离心2分钟来收集原生质体,并通过在100g下再离心2分钟来用1ml洗涤缓冲液进行洗涤一次。将原生质体重悬于500μL的W5溶液中,并在25℃在生长室中孵育2天。
靶向深度测序。将中靶从基因组DNA扩增。通过另外的PCR来添加索引和测序衔接子。使用Illumina MiniSeq进行高通量测序。以下表10显示crRNA靶区域和序列。
表10–CRIPSR RNA(crRNA)靶区域和序列
以下表11显示用于靶区域PCR分析的引物。
表11–用于靶区域PCR分析的引物
以下表12显示与两种crRNA复合的Cas12a对两种FucT14靶的编辑效率,如由MiniSeq测量。
表12–Cas12a编辑效率
实施例13
Cas12a对线性dsDNA和环状dsDNA的切割
该实施例描述了Cas12a对线性dsDNA和环状dsDNA的切割。使FnCa12a、mgCas12a-1和mgCas12a-2与靶向HsCCR5、HsDNMT1和HsEMX1的crRNA(Hs代表人)复合。测试了Cas12a核酸酶靶向和切割线性dsDNA和环状DNA的能力。使用纯化的PCR产物来获得靶线性dsDNA,并且使用纯化的质粒DNA来获得环状dsDNA。测试的条件包括不孵育和在37℃孵育2小时。如表中总结的,还测试了合适的阴性对照。
图22A-B显示本公开的crRNA指导的mgCas12a蛋白对dsDNA的序列特异性切割。图22A显示crRNA指导的Cas12a蛋白(包括FnCas12a、WT mgCas12a-1和WT mgCas12a-2)对线性dsDNA的序列特异性切割。底物用箭头和字母S表示,凝胶中的切割产物也用箭头表示。纯化的PCR产物用于线性dsDNA。凝胶图像下方的数字表示底物DNA带强度。图22B显示crRNA指导的Cas12a蛋白(包括FnCas12a、WT mgCas12a-1和WT mgCas12a-2)对环状dsDNA的序列特异性切割。底物用箭头和字母S表示,凝胶中的线性化产物(来自切割)也用箭头表示。纯化的质粒DNA用于环状dsDNA。凝胶图像下方的数字表示底物DNA带强度。
实施例14
使用不同的5'柄,Cas12a对靶DNA的切割
该实施例描述了使用不同的5'柄,Cas12a对靶DNA的切割。将mgCas12a-1和mgCas12a-2与crRNA复合以靶向特定核酸。用于指导mgCas12a-1和mgCas12a-2的crRNA包括5’末端的核苷酸,其在AsCas12a、FnCas12a和LbCas12a的crRNA的茎环区域之前。通过在各个时间点(包括0小时、1分钟、10分钟、30分钟、1小时、6小时和12小时)对Cas12a/crRNA复合物与靶核酸的反应运行凝胶来监测切割活性。
图23A-B显示本公开的mgCas12a蛋白可以利用三种不同类型的Cas12a柄。图23A显示了与具有来自AsCas12a、FnCas12a和LbCas12a的5’柄的crRNA复合的WT mgCas12a-1对靶线性dsDNA的切割。图23B显示了与具有来自AsCas12a、FnCas12a和LbCas12a的5’柄的crRNA复合的WT mgCas12a-2对靶线性dsDNA的切割。从这些凝胶中可以看出,两种mgCas12a蛋白都可以利用三种类型的5'柄:AsCas12a、FnCas12a和LbCas12a,来序列特异性地切割dsDNA。底物(“S”)指示靶核酸,“P”指示切割的产物。凝胶图像下方的数字表示底物DNA带强度。对照包括催化失活的mgCas12a(“d_mgCas12a”)、无Cas12a或无crRNA。在所有三种crRNA(其具有在AsCas12a、FnCas12a和LbCas12a的crRNA中发现的各种5'核苷酸)情况下,mgCas12a-1和mgCas12a-2都表现出对靶核酸的切割。
实施例15
Cas12a-RNP的随机dsDNA酶活性
该实施例描述了Cas12a_RNP的随机dsDNA酶活性。将mgCas12a-1、d_mgCas12a_1(已失活)、mgCas12a_2、d_mgCas12a_2(已失活)、AsCas12a、FnCas12a和LbCas12a与crRNA复合,以靶向HsCCR5、HsDNMT1和HsEMX1中的线性dsDNA。随时间监测切割。
如图24和图25A中所示,将七种不同的Cas12a-RNP与靶dsDNA一起孵育12或24小时。对于底物,靶底物dsDNA用“S”表示,并且对于产物,切割产物用“P”表示。反应孵育12小时和24小时后,dsDNA底物和所得的切割产物几乎完全被降解,这可能是由于一些Cas12a直系同源物(包括FnCas12a和LbCas12a)的随机DNA酶活性所致。在与本公开的宏基因组学挖掘的Cas12a蛋白(包括WT mg-1(SEQ ID NO:1)和WT mg-2(SEQ ID NO:2))的12小时反应中,检测到底物和切割产物。图25B显示了每种Cas12a的时间相对于dsDNA酶活性的图,表明对于mgCas12a-1(SEQ ID NO:1),靶底物dsDNA在较晚时间点仍然存在,说明mgCas12a-1表现出较低的随机DNA酶活性。
图25A-B显示Cas12a表现出对靶线性dsDNA(人DNMT1)的随机dsDNA酶活性。图25A显示FnCas12a、WT mgCas12a-1和mgCas12a-2与crRNA复合并与线性dsDNA一起孵育不同时间段。凝胶图像下方的数字表示底物DNA带强度。对应于底物线性dsDNA的条带,对于FnCas12a而言随着时间基本上消失,对于mgCas12a-2而言则很弱。对于mgCas12a-1,在较晚的相同时间点观察到底物条带。图25B显示了每种Cas12a的时间相对于dsDNA酶活性的图,表明对于mgCas12a-1,底物靶dsDNA在较晚时间点仍然存在。
实施例16
存在二价阳离子时Csa12a活性
该实施例描述了存在二价阳离子时Csa12a活性。针对FnCas12a、WT mgCas12a-1和WT mgCas12a-2测试了Cas12a对线性dsDNA的切割活性。针对每种测试的二价阳离子(包括CaCl2、CoCl2、CuSO4、FeCl2、MnSO4、NiSO4和ZnSO4),通过运行凝胶来评估对靶线性dsDNA的切割。S表示对应于靶线性dsDNA靶底物的条带,P对应于反应的切割产物。
图26A-D显示了在不同二价阳离子存在下每种Cas12a-RNP的活性。图26A显示了在七种不同二价阳离子存在下,对每种Cas12a-RNP给出了Cas12a-RNP对靶线性dsDNA切割的结果。图中的缩写包括:DW表示蒸馏水,Ctrl表示1X NEBuffer 1.1(对照)。图26B显示了在不同二价阳离子存在下FnCas12a-RNP的序列特异性dsDNA切割。图26C显示了在不同二价阳离子存在下每种WT mgCas12a-1RNP的序列特异性dsDNA切割。图26D显示了在不同二价阳离子存在下每种WT mgCas12a-2-RNP的序列特异性dsDNA切割。
对于所有测试的Cas12a直系同源物,都观察到来自靶向线性dsDNA的切割产物。对于mgCas12a-1和mgCas12a-2,清楚地观察到从环状dsDNA切割产生的线性化产物。对于由FnCas12a切割环状dsDNA而产生的线性化产物,还观察到浅淡的带。但是,在所有测试的Cas12a直系同源物中,在环状dsDNA底物(S)处均不存在条带,表明Cas12a通过所有直系同源物(包括FnCas12a)的切割。
虽然本文已经显示并描述了本发明的优选实施方案,但是对于本领域技术人员显而易见,这些实施方案仅以示例的方式提供。在不脱离本发明的情况下,本领域技术人员现将想到许多变化、改变和替换。应当理解,在实施本发明的过程中可以采用本文所述的本发明实施方案的各种替代方案。所附权利要求书旨在限定本发明的范围,并且旨在由此涵盖在这些权利要求范围内的方法和结构及其等同物。
Claims (32)
1.一种组合物,包含:
多肽,其中所述多肽的氨基酸序列为SEQ ID NO:1;以及
与所述多肽偶联的指导RNA,其中所述指导RNA包含与包含6至60个碱基的真核核酸序列反向互补的序列,
其中所述指导RNA是包含选自由以下组成的组的5'柄的crRNA:来自AsCas12a的5'柄、来自FnCas12a的5'柄和来自LbCas12a的5'柄,
其中所述来自AsCas12a的5'柄由核苷酸序列UAAUUUCUACUCUUGUAGAU组成,
其中所述来自FnCas12a的5'柄由核苷酸序列AAUUUCUACUGUUGUAGAU组成;并且
其中所述来自LbCas12a的5'柄由核苷酸序列AAUUUCUACUAAGUGUAGAU组成。
2.如权利要求1所述的组合物,其中所述真核核酸序列是人核酸序列。
3.如权利要求2所述的组合物,其中所述人核酸序列包含处于KRAS、HER2/neu、PD-1、TCR、p53、CCR5、DNMT1、EMX1和LKB1中的区域。
4.如权利要求1所述的组合物,其中所述真核核酸序列是植物核酸序列。
5.如权利要求1所述的组合物,其中所述多肽是V型CRISPR相关蛋白。
6.如权利要求5所述的组合物,其中所述V型CRISPR相关蛋白是Cas12a蛋白。
7.如权利要求1所述的组合物,其中所述多肽还包含纯化标签。
8.如权利要求7所述的组合物,其中所述纯化标签包含选自由以下组成的组中的至少一种标签:His标签、FLAG标签、AU1表位标签、AU5表位标签、噬菌体T7标签、噬菌体V5表位标签、蓝舌病毒标签(B标签)、Glu-Glu标签(EE标签)、HSV表位标签、KT3表位标签、Myc表位标签、PDZ配体标签、聚精氨酸标签、聚天冬氨酸标签、聚半胱氨酸标签、聚苯丙氨酸标签、蛋白C标签、S1标签、S标签、Step标签和VSV-G标签。
9.如权利要求1所述的组合物,其中所述指导RNA包含富含A的原间隔子相邻基序(PAM)序列、富含G的PAM序列、富含T的PAM序列或富含C的PAM序列。
10.如权利要求9所述的组合物,其中所述PAM序列包含3个T核碱基、2个T核碱基、1个T核碱基或TTTN。
11.如权利要求1所述的组合物,其中所述指导RNA还包含tracrRNA。
12.如权利要求1所述的组合物,其中与AsCas12a、FnCas12a或LbCas12a相比,所述组合物显示出至少2倍增高的基因组编辑效率。
13.如权利要求1所述的组合物,进一步包含赋形剂。
14.如权利要求13所述的组合物,其中所述赋形剂具有7至8的pH。
15.如权利要求13所述的组合物,其中所述赋形剂是缓冲液。
16.如权利要求14所述的组合物,其中所述缓冲液包含Bis-Tris丙烷-HCl、MgCl2或牛血清白蛋白中的至少一种。
17.一种基因编辑的方法,其中所述方法包括:
提供组合物,所述组合物包含:
多肽,其中所述多肽的氨基酸序列为SEQ ID NO:1;以及
与所述多肽偶联的指导RNA,其中所述指导RNA包含与包含6至60个碱基的真核核酸序列反向互补的序列,
其中所述指导RNA是包含选自由以下组成的组的5'柄的crRNA:来自AsCas12a的5'柄、来自FnCas12a的5'柄和来自LbCas12a的5'柄,
其中所述来自AsCas12a的5'柄由核苷酸序列UAAUUUCUACUCUUGUAGAU组成,
其中所述来自FnCas12a的5'柄由核苷酸序列AAUUUCUACUGUUGUAGAU组成;并且
其中所述来自LbCas12a的5'柄由核苷酸序列AAUUUCUACUAAGUGUAGAU组成;
使细胞与所述组合物接触;
使所述指导RNA与真核核酸序列结合;以及
切割所述核酸序列。
18.如权利要求17所述的方法,其中所述真核核酸序列是人核酸序列。
19.如权利要求18所述的方法,其中所述人核酸序列包含处于KRAS、HER2/neu、PD-1、TCR、p53、CCR5、DNMT1、EMX1和LKB1中的区域。
20.如权利要求17所述的方法,其中所述真核核酸序列是植物核酸序列。
21.如权利要求17所述的方法,其中所述多肽是V型CRISPR相关蛋白。
22.如权利要求21所述的方法,其中所述V型CRISPR相关蛋白是Cas12a蛋白。
23.如权利要求17所述的方法,其中所述多肽包含纯化标签。
24.如权利要求23所述的方法,其中所述纯化标签包含选自由以下组成的组中的至少一种标签:His标签、FLAG标签、AU1表位标签、AU5表位标签、噬菌体T7标签、噬菌体V5表位标签、蓝舌病毒标签(B标签)、Glu-Glu标签(EE标签)、HSV表位标签、KT3表位标签、Myc表位标签、PDZ配体标签、聚精氨酸标签、聚天冬氨酸标签、聚半胱氨酸标签、聚苯丙氨酸标签、蛋白C标签、S1标签、S标签、Step标签和VSV-G标签。
25.如权利要求17所述的方法,进一步包含赋形剂。
26.如权利要求25所述的方法,其中所述赋形剂具有7至8的pH。
27.如权利要求25所述的方法,其中所述赋形剂是缓冲液。
28.如权利要求27所述的方法,其中所述缓冲液包含Bis-Tris丙烷-HCl、MgCl2或牛血清白蛋白中的至少一种。
29.如权利要求17所述的方法,其中所述指导RNA包含富含A的原间隔子相邻基序(PAM)序列、富含G的PAM序列、富含T的PAM序列或富含C的PAM序列。
30.如权利要求18所述的方法,其中所述PAM序列包含3个T核碱基、2个T核碱基、1个T核碱基或TTTN。
31.如权利要求17所述的方法,其中所述指导RNA还包含tracrRNA。
32.如权利要求17所述的方法,其中切割步骤的效率是AsCas12a、FnCas12a或LbCas12a的基因组编辑效率的至少2倍。
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR20180093336 | 2018-08-09 | ||
KR10-2018-0093336 | 2018-08-09 | ||
US201862752950P | 2018-10-30 | 2018-10-30 | |
US62/752,950 | 2018-10-30 | ||
PCT/IB2019/000946 WO2020030984A2 (en) | 2018-08-09 | 2019-08-09 | Compositions and methods for genome engineering with cas12a proteins |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113227367A CN113227367A (zh) | 2021-08-06 |
CN113227367B true CN113227367B (zh) | 2023-05-12 |
Family
ID=69413428
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201980066655.XA Active CN113227367B (zh) | 2018-08-09 | 2019-08-09 | 用cas12a蛋白进行基因组工程的组合物和方法 |
Country Status (5)
Country | Link |
---|---|
US (1) | US11434478B2 (zh) |
EP (1) | EP3833751A4 (zh) |
CN (1) | CN113227367B (zh) |
CA (1) | CA3109083A1 (zh) |
WO (1) | WO2020030984A2 (zh) |
Families Citing this family (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2016057961A1 (en) | 2014-10-10 | 2016-04-14 | Editas Medicine, Inc. | Compositions and methods for promoting homology directed repair |
WO2019014564A1 (en) | 2017-07-14 | 2019-01-17 | Editas Medicine, Inc. | SYSTEMS AND METHODS OF TARGETED INTEGRATION AND GENOME EDITING AND DETECTION THEREOF WITH INTEGRATED PRIMING SITES |
WO2020030984A2 (en) | 2018-08-09 | 2020-02-13 | G+Flas Life Sciences | Compositions and methods for genome engineering with cas12a proteins |
GB2617658B (en) | 2020-03-06 | 2024-04-17 | Metagenomi Inc | Class II, type V CRISPR systems |
EP4118195A1 (en) * | 2020-03-12 | 2023-01-18 | Novozymes A/S | Crispr-aid using catalytically inactive rna-guided endonuclease |
BR112023024983A2 (pt) * | 2021-06-02 | 2024-04-30 | Metagenomi Inc | Sistemas crispr classe ii, tipo v |
CN113969281B (zh) * | 2021-12-24 | 2022-04-01 | 汕头大学 | 经修饰的CrRNA片段及非洲猪瘟病毒试剂盒 |
WO2024046307A1 (zh) * | 2022-08-29 | 2024-03-07 | 北京迅识科技有限公司 | 一种突变的v型crispr酶及其应用 |
WO2024251229A1 (zh) * | 2023-06-09 | 2024-12-12 | 益杰立科(上海)生物科技有限公司 | Cas酶及其系统和应用 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107250363A (zh) * | 2014-12-17 | 2017-10-13 | 纳幕尔杜邦公司 | 使用与环状多核苷酸修饰模板组合的引导RNA/Cas内切核酸酶系统在大肠杆菌中进行有效基因编辑的组合物和方法 |
CN107488710A (zh) * | 2017-07-14 | 2017-12-19 | 上海吐露港生物科技有限公司 | 一种Cas蛋白的用途及靶标核酸分子的检测方法和试剂盒 |
US9982279B1 (en) * | 2017-06-23 | 2018-05-29 | Inscripta, Inc. | Nucleic acid-guided nucleases |
Family Cites Families (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9790490B2 (en) | 2015-06-18 | 2017-10-17 | The Broad Institute Inc. | CRISPR enzymes and systems |
CA2993474A1 (en) | 2015-07-25 | 2017-02-02 | Habib FROST | A system, device and a method for providing a therapy or a cure for cancer and other pathological states |
EP3374494A4 (en) | 2015-11-11 | 2019-05-01 | Coda Biotherapeutics, Inc. | CRISPR COMPOSITIONS AND METHODS OF USE FOR GENE THERAPY |
WO2017099494A1 (ko) | 2015-12-08 | 2017-06-15 | 기초과학연구원 | Cpf1을 포함하는 유전체 교정용 조성물 및 그 용도 |
EP3405570A1 (en) * | 2016-01-22 | 2018-11-28 | The Broad Institute, Inc. | Crystal structure of crispr cpf1 |
US9896696B2 (en) | 2016-02-15 | 2018-02-20 | Benson Hill Biosystems, Inc. | Compositions and methods for modifying genomes |
EP3445853A1 (en) * | 2016-04-19 | 2019-02-27 | The Broad Institute, Inc. | Cpf1 complexes with reduced indel activity |
WO2018013990A1 (en) | 2016-07-15 | 2018-01-18 | Zymergen Inc. | Scarless dna assembly and genome editing using crispr/cpf1 and dna ligase |
WO2018094356A2 (en) * | 2016-11-18 | 2018-05-24 | Genedit Inc. | Compositions and methods for target nucleic acid modification |
KR20180018466A (ko) | 2017-11-10 | 2018-02-21 | 주식회사 툴젠 | 면역세포의 면역조절 유전자의 활성 조절을 위한 조성물 및 그 용도 |
WO2020030984A2 (en) | 2018-08-09 | 2020-02-13 | G+Flas Life Sciences | Compositions and methods for genome engineering with cas12a proteins |
EP3835418A4 (en) | 2018-08-09 | 2022-05-04 | G+Flas Life Sciences | NOVEL CRISPR-ASSOCIATED PROTEIN AND USE THEREOF |
-
2019
- 2019-08-09 WO PCT/IB2019/000946 patent/WO2020030984A2/en unknown
- 2019-08-09 CN CN201980066655.XA patent/CN113227367B/zh active Active
- 2019-08-09 EP EP19846360.6A patent/EP3833751A4/en active Pending
- 2019-08-09 CA CA3109083A patent/CA3109083A1/en active Pending
-
2021
- 2021-02-09 US US17/171,302 patent/US11434478B2/en active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107250363A (zh) * | 2014-12-17 | 2017-10-13 | 纳幕尔杜邦公司 | 使用与环状多核苷酸修饰模板组合的引导RNA/Cas内切核酸酶系统在大肠杆菌中进行有效基因编辑的组合物和方法 |
US9982279B1 (en) * | 2017-06-23 | 2018-05-29 | Inscripta, Inc. | Nucleic acid-guided nucleases |
CN107488710A (zh) * | 2017-07-14 | 2017-12-19 | 上海吐露港生物科技有限公司 | 一种Cas蛋白的用途及靶标核酸分子的检测方法和试剂盒 |
Non-Patent Citations (2)
Title |
---|
CRISPR/Cas9介导的基因组定点编辑技术;方锐等;《生物化学与生物物理进展》;20130815(第08期);7-18 * |
CRISPR-Cas系统介导的基因组编辑和基因转录调控;郭芳等;《生理科学进展》;20161025(第05期);13-16 * |
Also Published As
Publication number | Publication date |
---|---|
CA3109083A1 (en) | 2020-02-13 |
EP3833751A2 (en) | 2021-06-16 |
CN113227367A (zh) | 2021-08-06 |
US20210222140A1 (en) | 2021-07-22 |
EP3833751A4 (en) | 2022-04-27 |
WO2020030984A3 (en) | 2020-07-16 |
WO2020030984A2 (en) | 2020-02-13 |
US11434478B2 (en) | 2022-09-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113227367B (zh) | 用cas12a蛋白进行基因组工程的组合物和方法 | |
JP7038079B2 (ja) | Crisprハイブリッドdna/rnaポリヌクレオチドおよび使用方法 | |
EP3289081B1 (en) | Compositions and methods for the treatment of nucleotide repeat expansion disorders | |
JP2023052051A (ja) | Vi型crisprオルソログ及び系 | |
JP2024109660A (ja) | 遺伝子編集における非意図的な変異の阻害 | |
JP2023517041A (ja) | クラスiiのv型crispr系 | |
CN113348245A (zh) | 新型crispr酶和系统 | |
WO2019018423A1 (en) | NEW TYPE VI CRISPR ORTHOLOGISTS AND ASSOCIATED SYSTEMS | |
US20160024523A1 (en) | Using Truncated Guide RNAs (tru-gRNAs) to Increase Specificity for RNA-Guided Genome Editing | |
CN107208096A (zh) | 基于crispr的组合物和使用方法 | |
JP5147692B2 (ja) | 治療用タンパク質生成のための宿主細胞タンパク質ノックアウト細胞 | |
KR102626503B1 (ko) | 뉴클레오타이드 표적 인식을 이용한 표적 서열 특이적 개변 기술 | |
KR102567576B1 (ko) | 표적 특이성이 향상된 신규한 Cas9 단백질 변이체 및 이의 용도 | |
US8318155B2 (en) | Nucleic acid cleaving agent | |
CN106244570B (zh) | 一种核糖核酸酶及其衍生物和/或变体及其应用 | |
EP3866860B1 (en) | Complement component 1s (c1s) deficient cells for production of vaccines and biopharmaceutical proteins | |
US20250059568A1 (en) | Class ii, type v crispr systems | |
US20230332120A1 (en) | Cas9 proteins with enhanced specificity and uses thereof | |
CN117693585A (zh) | Ii类v型crispr系统 | |
CN117821423A (zh) | RalCas13d蛋白及其编辑系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |