KR20230132341A - Cpf1 mutant protein for rapid DNA diagnosis - Google Patents
Cpf1 mutant protein for rapid DNA diagnosis Download PDFInfo
- Publication number
- KR20230132341A KR20230132341A KR1020220090185A KR20220090185A KR20230132341A KR 20230132341 A KR20230132341 A KR 20230132341A KR 1020220090185 A KR1020220090185 A KR 1020220090185A KR 20220090185 A KR20220090185 A KR 20220090185A KR 20230132341 A KR20230132341 A KR 20230132341A
- Authority
- KR
- South Korea
- Prior art keywords
- mutant protein
- cpf1
- amino acids
- protein
- lbcpf1
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 102000008300 Mutant Proteins Human genes 0.000 title claims abstract description 181
- 108010021466 Mutant Proteins Proteins 0.000 title claims abstract description 181
- 238000003745 diagnosis Methods 0.000 title abstract description 11
- 108091036333 Rapid DNA Proteins 0.000 title abstract 2
- 150000001413 amino acids Chemical class 0.000 claims abstract description 159
- 108090000623 proteins and genes Proteins 0.000 claims abstract description 65
- 102000004169 proteins and genes Human genes 0.000 claims abstract description 63
- 235000001014 amino acid Nutrition 0.000 claims description 154
- 229940024606 amino acid Drugs 0.000 claims description 153
- 235000004279 alanine Nutrition 0.000 claims description 65
- 150000007523 nucleic acids Chemical class 0.000 claims description 63
- 235000018102 proteins Nutrition 0.000 claims description 59
- 102000039446 nucleic acids Human genes 0.000 claims description 58
- 108020004707 nucleic acids Proteins 0.000 claims description 58
- 108020004414 DNA Proteins 0.000 claims description 48
- 125000003295 alanine group Chemical group N[C@@H](C)C(=O)* 0.000 claims description 43
- 102000040430 polynucleotide Human genes 0.000 claims description 40
- 108091033319 polynucleotide Proteins 0.000 claims description 40
- 239000002157 polynucleotide Substances 0.000 claims description 40
- 230000002209 hydrophobic effect Effects 0.000 claims description 35
- 108020005004 Guide RNA Proteins 0.000 claims description 30
- 102000053602 DNA Human genes 0.000 claims description 28
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 claims description 25
- 239000013598 vector Substances 0.000 claims description 24
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 claims description 23
- COLNVLDHVKWLRT-QMMMGPOBSA-N L-phenylalanine Chemical compound OC(=O)[C@@H](N)CC1=CC=CC=C1 COLNVLDHVKWLRT-QMMMGPOBSA-N 0.000 claims description 23
- KZSNJWFQEVHDMF-UHFFFAOYSA-N Valine Natural products CC(C)C(N)C(O)=O KZSNJWFQEVHDMF-UHFFFAOYSA-N 0.000 claims description 23
- AGPKZVBTJJNPAG-UHFFFAOYSA-N isoleucine Natural products CCC(C)C(N)C(O)=O AGPKZVBTJJNPAG-UHFFFAOYSA-N 0.000 claims description 23
- 229960000310 isoleucine Drugs 0.000 claims description 23
- COLNVLDHVKWLRT-UHFFFAOYSA-N phenylalanine Natural products OC(=O)C(N)CC1=CC=CC=C1 COLNVLDHVKWLRT-UHFFFAOYSA-N 0.000 claims description 23
- 239000004474 valine Substances 0.000 claims description 23
- QNAYBMKLOCPYGJ-REOHCLBHSA-N L-alanine Chemical compound C[C@H](N)C(O)=O QNAYBMKLOCPYGJ-REOHCLBHSA-N 0.000 claims description 22
- AGPKZVBTJJNPAG-WHFBIAKZSA-N L-isoleucine Chemical compound CC[C@H](C)[C@H](N)C(O)=O AGPKZVBTJJNPAG-WHFBIAKZSA-N 0.000 claims description 21
- KZSNJWFQEVHDMF-BYPYZUCNSA-N L-valine Chemical compound CC(C)[C@H](N)C(O)=O KZSNJWFQEVHDMF-BYPYZUCNSA-N 0.000 claims description 20
- 238000000034 method Methods 0.000 claims description 16
- 230000000295 complement effect Effects 0.000 claims description 13
- 241000904817 Lachnospiraceae bacterium Species 0.000 claims description 2
- 238000003776 cleavage reaction Methods 0.000 abstract description 43
- 230000000694 effects Effects 0.000 abstract description 33
- 230000035772 mutation Effects 0.000 description 60
- 108020004682 Single-Stranded DNA Proteins 0.000 description 25
- 101000860090 Acidaminococcus sp. (strain BV3L6) CRISPR-associated endonuclease Cas12a Proteins 0.000 description 16
- 238000001514 detection method Methods 0.000 description 15
- 201000010099 disease Diseases 0.000 description 13
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 13
- 230000001939 inductive effect Effects 0.000 description 12
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 10
- 238000004458 analytical method Methods 0.000 description 10
- 108091033409 CRISPR Proteins 0.000 description 9
- 238000006243 chemical reaction Methods 0.000 description 7
- 238000006467 substitution reaction Methods 0.000 description 7
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 6
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 description 6
- 108091028043 Nucleic acid sequence Proteins 0.000 description 6
- RAXXELZNTBOGNW-UHFFFAOYSA-N imidazole Natural products C1=CNC=N1 RAXXELZNTBOGNW-UHFFFAOYSA-N 0.000 description 6
- 239000013612 plasmid Substances 0.000 description 6
- 230000007017 scission Effects 0.000 description 6
- 238000010354 CRISPR gene editing Methods 0.000 description 5
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 5
- 239000004472 Lysine Substances 0.000 description 5
- 241001465754 Metazoa Species 0.000 description 5
- 239000011780 sodium chloride Substances 0.000 description 5
- 239000000758 substrate Substances 0.000 description 5
- 108010009540 DNA (Cytosine-5-)-Methyltransferase 1 Proteins 0.000 description 4
- 102100036279 DNA (cytosine-5)-methyltransferase 1 Human genes 0.000 description 4
- 230000004544 DNA amplification Effects 0.000 description 4
- 241000588724 Escherichia coli Species 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 4
- 208000035473 Communicable disease Diseases 0.000 description 3
- IAZDPXIOMUYVGZ-UHFFFAOYSA-N Dimethylsulphoxide Chemical compound CS(C)=O IAZDPXIOMUYVGZ-UHFFFAOYSA-N 0.000 description 3
- 108010042407 Endonucleases Proteins 0.000 description 3
- 102000004533 Endonucleases Human genes 0.000 description 3
- WHUUTDBJXJRKMK-UHFFFAOYSA-N Glutamic acid Natural products OC(=O)C(N)CCC(O)=O WHUUTDBJXJRKMK-UHFFFAOYSA-N 0.000 description 3
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 3
- 241000282412 Homo Species 0.000 description 3
- 241000282414 Homo sapiens Species 0.000 description 3
- 239000000872 buffer Substances 0.000 description 3
- 230000014509 gene expression Effects 0.000 description 3
- 235000013922 glutamic acid Nutrition 0.000 description 3
- 239000004220 glutamic acid Substances 0.000 description 3
- 230000008685 targeting Effects 0.000 description 3
- 125000002987 valine group Chemical group [H]N([H])C([H])(C(*)=O)C([H])(C([H])([H])[H])C([H])([H])[H] 0.000 description 3
- 229920000936 Agarose Polymers 0.000 description 2
- 101150005393 CBF1 gene Proteins 0.000 description 2
- 101100329224 Coprinopsis cinerea (strain Okayama-7 / 130 / ATCC MYA-4618 / FGSC 9003) cpf1 gene Proteins 0.000 description 2
- 108010053770 Deoxyribonucleases Proteins 0.000 description 2
- 102000016911 Deoxyribonucleases Human genes 0.000 description 2
- 101150007297 Dnmt1 gene Proteins 0.000 description 2
- 102100035102 E3 ubiquitin-protein ligase MYCBP2 Human genes 0.000 description 2
- 102000004190 Enzymes Human genes 0.000 description 2
- 108090000790 Enzymes Proteins 0.000 description 2
- 241000589601 Francisella Species 0.000 description 2
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 2
- 241000689670 Lachnospiraceae bacterium ND2006 Species 0.000 description 2
- TWRXJAOTZQYOKJ-UHFFFAOYSA-L Magnesium chloride Chemical compound [Mg+2].[Cl-].[Cl-] TWRXJAOTZQYOKJ-UHFFFAOYSA-L 0.000 description 2
- 206010028980 Neoplasm Diseases 0.000 description 2
- 241000605861 Prevotella Species 0.000 description 2
- 230000003321 amplification Effects 0.000 description 2
- 238000003556 assay Methods 0.000 description 2
- 239000011324 bead Substances 0.000 description 2
- 210000004369 blood Anatomy 0.000 description 2
- 239000008280 blood Substances 0.000 description 2
- 201000011510 cancer Diseases 0.000 description 2
- 101150059443 cas12a gene Proteins 0.000 description 2
- 210000004027 cell Anatomy 0.000 description 2
- 238000012217 deletion Methods 0.000 description 2
- 230000037430 deletion Effects 0.000 description 2
- 229940088598 enzyme Drugs 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- 239000000499 gel Substances 0.000 description 2
- 238000010362 genome editing Methods 0.000 description 2
- 230000001965 increasing effect Effects 0.000 description 2
- 239000012678 infectious agent Substances 0.000 description 2
- 125000000741 isoleucyl group Chemical group [H]N([H])C(C(C([H])([H])[H])C([H])([H])C([H])([H])[H])C(=O)O* 0.000 description 2
- 229930027917 kanamycin Natural products 0.000 description 2
- SBUJHOSQTJFQJX-NOAMYHISSA-N kanamycin Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CN)O[C@@H]1O[C@H]1[C@H](O)[C@@H](O[C@@H]2[C@@H]([C@@H](N)[C@H](O)[C@@H](CO)O2)O)[C@H](N)C[C@@H]1N SBUJHOSQTJFQJX-NOAMYHISSA-N 0.000 description 2
- 229960000318 kanamycin Drugs 0.000 description 2
- 229930182823 kanamycin A Natural products 0.000 description 2
- 125000001909 leucine group Chemical group [H]N(*)C(C(*)=O)C([H])([H])C(C([H])([H])[H])C([H])([H])[H] 0.000 description 2
- 239000012139 lysis buffer Substances 0.000 description 2
- 238000002703 mutagenesis Methods 0.000 description 2
- 231100000350 mutagenesis Toxicity 0.000 description 2
- 238000003199 nucleic acid amplification method Methods 0.000 description 2
- 239000002773 nucleotide Substances 0.000 description 2
- 125000003729 nucleotide group Chemical group 0.000 description 2
- YBYRMVIVWMBXKQ-UHFFFAOYSA-N phenylmethanesulfonyl fluoride Chemical compound FS(=O)(=O)CC1=CC=CC=C1 YBYRMVIVWMBXKQ-UHFFFAOYSA-N 0.000 description 2
- 238000002360 preparation method Methods 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 238000000746 purification Methods 0.000 description 2
- 210000003296 saliva Anatomy 0.000 description 2
- 210000002966 serum Anatomy 0.000 description 2
- 238000002741 site-directed mutagenesis Methods 0.000 description 2
- 210000003491 skin Anatomy 0.000 description 2
- 239000000243 solution Substances 0.000 description 2
- 210000002700 urine Anatomy 0.000 description 2
- JKMHFZQWWAIEOD-UHFFFAOYSA-N 2-[4-(2-hydroxyethyl)piperazin-1-yl]ethanesulfonic acid Chemical compound OCC[NH+]1CCN(CCS([O-])(=O)=O)CC1 JKMHFZQWWAIEOD-UHFFFAOYSA-N 0.000 description 1
- 229920001817 Agar Polymers 0.000 description 1
- 208000035143 Bacterial infection Diseases 0.000 description 1
- 241000283690 Bos taurus Species 0.000 description 1
- 241000283707 Capra Species 0.000 description 1
- 108700004991 Cas12a Proteins 0.000 description 1
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 description 1
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 description 1
- KCXVZYZYPLLWCC-UHFFFAOYSA-N EDTA Chemical compound OC(=O)CN(CC(O)=O)CCN(CC(O)=O)CC(O)=O KCXVZYZYPLLWCC-UHFFFAOYSA-N 0.000 description 1
- 241000196324 Embryophyta Species 0.000 description 1
- 241000283073 Equus caballus Species 0.000 description 1
- 241000282326 Felis catus Species 0.000 description 1
- 239000004471 Glycine Substances 0.000 description 1
- 239000007995 HEPES buffer Substances 0.000 description 1
- 208000026350 Inborn Genetic disease Diseases 0.000 description 1
- ONIBWKKTOPOVIA-BYPYZUCNSA-N L-Proline Chemical compound OC(=O)[C@@H]1CCCN1 ONIBWKKTOPOVIA-BYPYZUCNSA-N 0.000 description 1
- FFEARJCKVFRZRR-BYPYZUCNSA-N L-methionine Chemical compound CSCC[C@H](N)C(O)=O FFEARJCKVFRZRR-BYPYZUCNSA-N 0.000 description 1
- QIVBCDIJIAJPQS-VIFPVBQESA-N L-tryptophane Chemical compound C1=CC=C2C(C[C@H](N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-VIFPVBQESA-N 0.000 description 1
- OUYCCCASQSFEME-QMMMGPOBSA-N L-tyrosine Chemical compound OC(=O)[C@@H](N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-QMMMGPOBSA-N 0.000 description 1
- 102000016943 Muramidase Human genes 0.000 description 1
- 108010014251 Muramidase Proteins 0.000 description 1
- 108010062010 N-Acetylmuramoyl-L-alanine Amidase Proteins 0.000 description 1
- 241000283973 Oryctolagus cuniculus Species 0.000 description 1
- 241000009328 Perro Species 0.000 description 1
- ONIBWKKTOPOVIA-UHFFFAOYSA-N Proline Natural products OC(=O)C1CCCN1 ONIBWKKTOPOVIA-UHFFFAOYSA-N 0.000 description 1
- 229930006000 Sucrose Natural products 0.000 description 1
- CZMRCDWAGMRECN-UGDNZRGBSA-N Sucrose Chemical compound O[C@H]1[C@H](O)[C@@H](CO)O[C@@]1(CO)O[C@@H]1[C@H](O)[C@@H](O)[C@H](O)[C@@H](CO)O1 CZMRCDWAGMRECN-UGDNZRGBSA-N 0.000 description 1
- QIVBCDIJIAJPQS-UHFFFAOYSA-N Tryptophan Natural products C1=CC=C2C(CC(N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-UHFFFAOYSA-N 0.000 description 1
- 208000036142 Viral infection Diseases 0.000 description 1
- 239000008272 agar Substances 0.000 description 1
- 208000022362 bacterial infectious disease Diseases 0.000 description 1
- 230000033228 biological regulation Effects 0.000 description 1
- 239000004202 carbamide Substances 0.000 description 1
- 210000000170 cell membrane Anatomy 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 239000003086 colorant Substances 0.000 description 1
- 150000001875 compounds Chemical class 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000011109 contamination Methods 0.000 description 1
- 238000011840 criminal investigation Methods 0.000 description 1
- 238000000354 decomposition reaction Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 229940079593 drug Drugs 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 239000012149 elution buffer Substances 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 230000001973 epigenetic effect Effects 0.000 description 1
- 230000005284 excitation Effects 0.000 description 1
- 238000005206 flow analysis Methods 0.000 description 1
- 102000034287 fluorescent proteins Human genes 0.000 description 1
- 108091006047 fluorescent proteins Proteins 0.000 description 1
- 239000012634 fragment Substances 0.000 description 1
- 208000016361 genetic disease Diseases 0.000 description 1
- 230000002068 genetic effect Effects 0.000 description 1
- 230000005484 gravity Effects 0.000 description 1
- 238000009396 hybridization Methods 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 238000007901 in situ hybridization Methods 0.000 description 1
- 238000011534 incubation Methods 0.000 description 1
- 208000015181 infectious disease Diseases 0.000 description 1
- 238000003780 insertion Methods 0.000 description 1
- 230000037431 insertion Effects 0.000 description 1
- BPHPUYQFMNQIOC-NXRLNHOXSA-N isopropyl beta-D-thiogalactopyranoside Chemical compound CC(C)S[C@@H]1O[C@H](CO)[C@H](O)[C@H](O)[C@H]1O BPHPUYQFMNQIOC-NXRLNHOXSA-N 0.000 description 1
- 125000001449 isopropyl group Chemical group [H]C([H])([H])C([H])(*)C([H])([H])[H] 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 239000006166 lysate Substances 0.000 description 1
- 229960000274 lysozyme Drugs 0.000 description 1
- 235000010335 lysozyme Nutrition 0.000 description 1
- 239000004325 lysozyme Substances 0.000 description 1
- 229910001629 magnesium chloride Inorganic materials 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 229930182817 methionine Natural products 0.000 description 1
- 230000000813 microbial effect Effects 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 239000013642 negative control Substances 0.000 description 1
- 244000052769 pathogen Species 0.000 description 1
- 239000013600 plasmid vector Substances 0.000 description 1
- 238000002264 polyacrylamide gel electrophoresis Methods 0.000 description 1
- 239000000047 product Substances 0.000 description 1
- 230000005180 public health Effects 0.000 description 1
- 238000003753 real-time PCR Methods 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 238000007086 side reaction Methods 0.000 description 1
- 238000002415 sodium dodecyl sulfate polyacrylamide gel electrophoresis Methods 0.000 description 1
- 238000003860 storage Methods 0.000 description 1
- 238000012916 structural analysis Methods 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 239000005720 sucrose Substances 0.000 description 1
- 239000006228 supernatant Substances 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 210000001519 tissue Anatomy 0.000 description 1
- 230000007306 turnover Effects 0.000 description 1
- OUYCCCASQSFEME-UHFFFAOYSA-N tyrosine Natural products OC(=O)C(N)CC1=CC=C(O)C=C1 OUYCCCASQSFEME-UHFFFAOYSA-N 0.000 description 1
- 230000009385 viral infection Effects 0.000 description 1
- 239000013603 viral vector Substances 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/16—Hydrolases (3) acting on ester bonds (3.1)
- C12N9/22—Ribonucleases [RNase]; Deoxyribonucleases [DNase]
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/113—Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6876—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2310/00—Structure or type of the nucleic acid
- C12N2310/10—Type of nucleic acid
- C12N2310/20—Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPR]
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2521/00—Reaction characterised by the enzymatic activity
- C12Q2521/30—Phosphoric diester hydrolysing, i.e. nuclease
- C12Q2521/301—Endonuclease
Landscapes
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Health & Medical Sciences (AREA)
- Engineering & Computer Science (AREA)
- Genetics & Genomics (AREA)
- Organic Chemistry (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Molecular Biology (AREA)
- Biotechnology (AREA)
- Biomedical Technology (AREA)
- General Engineering & Computer Science (AREA)
- Microbiology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Biochemistry (AREA)
- General Health & Medical Sciences (AREA)
- Biophysics (AREA)
- Physics & Mathematics (AREA)
- Analytical Chemistry (AREA)
- Plant Pathology (AREA)
- Medicinal Chemistry (AREA)
- Immunology (AREA)
- Peptides Or Proteins (AREA)
Abstract
본 발명은 신속 DNA 진단을 위한 Cpf1 변이 단백질에 관한 것으로, 보다 상세하게는 LbCpf1 단백질의 1025, 1026, 1032, 1033, 1050, 1061, 1062, 1079, 1080, 1096, 1097, 1101, 1120 및 1121번째 아미노산 중 적어도 하나가 변이된 Cpf1 변이 단백질은 시스-절단 활성(cis-cleavage activity)을 유지하면서 우수한 트랜스-절단 활성(trans-cleavage activity)을 나타낼 수 있다.The present invention relates to Cpf1 mutant protein for rapid DNA diagnosis, and more specifically, to the 1025th, 1026, 1032, 1033, 1050, 1061, 1062, 1079, 1080, 1096, 1097, 1101, 1120 and 1121st of LbCpf1 protein. A Cpf1 mutant protein in which at least one of the amino acids is mutated can exhibit excellent trans-cleavage activity while maintaining cis-cleavage activity.
Description
본 발명은 Cpf1 변이 단백질에 관한 것이다.The present invention relates to Cpf1 mutant protein.
핵산 분자의 신속한 검출은 공중 보건, 환경 검출, 범죄 수사 등 분야에 있어서 핵심 기술이다. 핵산 분자 검출은 인간, 동물, 식물 등이 병원체에 감염되었는지 여부를 검출할 수 있을 뿐만 아니라 유전 질환 또는 암 위험을 검출하고, 개인 약물 사용에 보조적 참조를 제공하며 수역에 미생물 오염이 존재하는지 여부 등의 검출에도 사용될 수 있다. 현재에는 Realtime PCR, FISH 혼성화 기술(Fluorescence in situ hybridization) 등 많은 핵산 검출 방법이 개발되었으나 빠르고 저렴하며 감도가 우수한 핵산 검출 기술 개발이 여전히 필요하다.Rapid detection of nucleic acid molecules is a key technology in fields such as public health, environmental detection, and criminal investigation. Nucleic acid molecule detection can not only detect whether humans, animals, plants, etc. are infected with pathogens, but also detect genetic diseases or cancer risk, provide an auxiliary reference for personal drug use, whether microbial contamination exists in water bodies, etc. It can also be used for detection. Currently, many nucleic acid detection methods have been developed, such as real-time PCR and FISH hybridization (Fluorescence in situ hybridization), but there is still a need to develop nucleic acid detection technology that is fast, inexpensive, and has excellent sensitivity.
최근 CRISPR 기술은 게놈 편집 분야에서 큰 응용 가치를 보여주고 있다. 해당 임무는 주로 Cas9와 같은 DNA(또는 RNA) 표적 엔도뉴클레아제에 의해 수행되는 바, 사람들은 가이드 간단한 RNA 설계만으로도 Cas9 등 단백질을 PAM을 포함(예를 들어, Cas9의 PAM 서열은 NGG임)하는 임의의 핵산 표적 서열에 표적화하여 이중 가닥 DNA의 파단(또는 RNA의 절단)을 유발할 수 있다. 게놈 편집 외에도 CRISPR는 유전자 조절, 후성 유전학 편집, 기능적 유전자 선별, 게놈 이미징 등에도 사용될 수 있다. 최근에는 풍부한 툴박스인 CRISPR가 핵산 검출 분야에 등장하기 시작해 주목을 받고 있다.Recently, CRISPR technology has shown great application value in the field of genome editing. This task is mainly performed by DNA (or RNA) targeting endonucleases such as Cas9, allowing people to guide proteins such as Cas9 by simply designing a simple RNA containing a PAM (for example, the PAM sequence of Cas9 is NGG). It can cause breakage of double-stranded DNA (or cleavage of RNA) by targeting any nucleic acid target sequence. In addition to genome editing, CRISPR can also be used for gene regulation, epigenetic editing, functional gene screening, and genome imaging. Recently, CRISPR, a rich toolbox, has begun to appear in the field of nucleic acid detection and is attracting attention.
CRISPR 단백질 중 진단에 사용되는 LbCpfl(CRISPR from Prevotella and Francisella 1(Cpfl) proteins from Lachnospiraceae bacterium ND2006)은 crRNA 의 서열과 상보적인 DNA 이중나선 부분을 정확히 절단하는 cis-cleavage activity를 가지면서 동시에 collateral DNase 활성으로 DNA 단일 나선을 절단하는 트랜스-절단 활성(trans-cleavage activity)을 가져 최근 진단에 응용되고 있다. 하지만 LbCpf1의 트랜스-절단 활성은 5.0x106s-1M-1(Kcat/Km), ~3 turnovers/sec로 늦어 정확한 진단을 위해서는 30분 이상의 시간이 소요되는 문제점이 있다.Among CRISPR proteins, LbCpfl (CRISPR from Prevotella and Francisella 1 (Cpfl) proteins from Lachnospiraceae bacterium ND2006), which is used for diagnosis, has cis-cleavage activity to accurately cleave the DNA double helix portion complementary to the sequence of crRNA, and at the same time has collateral DNase activity. It has a trans-cleavage activity that cuts a single strand of DNA and has recently been used in diagnosis. However, the trans-cleavage activity of LbCpf1 is slow at 5.0x10 6 s -1 M -1 (Kcat/Km), ~3 turnovers/sec, so there is a problem that it takes more than 30 minutes for accurate diagnosis.
본 발명은 Cpf1 변이 단백질을 제공하는 것을 목적으로 한다.The purpose of the present invention is to provide a Cpf1 mutant protein.
본 발명은 Cpf1 변이 단백질을 암호화하는 폴리뉴클레오티드를 제공하는 것을 목적으로 한다.The purpose of the present invention is to provide a polynucleotide encoding a Cpf1 mutant protein.
본 발명은 Cpf1 변이 단백질을 암호화하는 폴리뉴클레오티드를 포함하는 벡터를 제공하는 것을 목적으로 한다.The purpose of the present invention is to provide a vector containing a polynucleotide encoding a Cpf1 mutant protein.
본 발명은 Cpf1 변이 단백질 및 가이드 RNA를 포함하는 복합체를 제공하는 것을 목적으로 한다.The purpose of the present invention is to provide a complex containing a Cpf1 mutant protein and a guide RNA.
본 발명은 Cpf1 변이 단백질을 포함하는 표적 핵산 분자를 검출하기 위한 키트를 제공하는 것을 목적으로 한다.The purpose of the present invention is to provide a kit for detecting target nucleic acid molecules containing Cpf1 mutant proteins.
본 발명은 시료에 Cpf1 변이 단백질을 처리하는 단계를 포함하는 표적 핵산 검출 방법을 제공하는 것을 목적으로 한다.The purpose of the present invention is to provide a method for detecting a target nucleic acid including the step of treating a Cpf1 mutant protein in a sample.
1. LbCpf1(Lachnospiraceae bacterium Cpf1) 단백질의 1025, 1026, 1032, 1033, 1050, 1061, 1062, 1079, 1080, 1096, 1097, 1101, 1120 및 1121번째 아미노산 중 적어도 하나가 변이된 Cpf1 변이 단백질.1. Cpf1 mutation in which at least one of amino acids 1025, 1026, 1032, 1033, 1050, 1061, 1062, 1079, 1080, 1096, 1097, 1101, 1120, and 1121 of the LbCpf1 ( Lachnospiraceae bacterium Cpf1) protein is mutated Protein.
2. 위 1에 있어서, 상기 Cpf1 변이 단백질은 상기 LbCpf1 단백질의 1025, 1026, 1032, 1033, 1050, 1061, 1062, 1079, 1080, 1096, 1097, 1101, 1120 및 1121번째 아미노산 중 적어도 하나가 각각 독립적으로 알라닌, 이소류신, 페닐알라닌, 발린 및 류신으로 이루어진 군에서 선택된 소수성 아미노산으로 치환된, Cpf1 변이 단백질.2. In 1 above, the Cpf1 mutant protein has at least one of amino acids 1025, 1026, 1032, 1033, 1050, 1061, 1062, 1079, 1080, 1096, 1097, 1101, 1120, and 1121 of the LbCpf1 protein, respectively. A Cpf1 variant protein substituted with a hydrophobic amino acid independently selected from the group consisting of alanine, isoleucine, phenylalanine, valine and leucine.
3. 위 1에 있어서, 상기 Cpf1 변이 단백질은 상기 LbCpf1 단백질의 i) K1025 및 K1026의 아미노산이 알라닌으로 치환되거나; ii) D1032 및 R1033의 아미노산이 알라닌으로 치환되거나; iii) K1050의 아미노산이 알라닌으로 치환되거나; iv) K1061 및 K1062의 아미노산이 알라닌으로 치환되거나; v) K1079 및 K1080의 아미노산이 알라닌으로 치환되거나; vi) K1096 및 E1097의 아미노산이 알라닌, 이소류신, 페닐알라닌, 발린 및 류신으로 이루어진 군에서 선택된 소수성 아미노산으로 치환되거나; vii) K1101의 아미노산이 알라닌으로 치환되거나; viii) D1120 및 K1121의 아미노산이 알라닌으로 치환되거나; ix) K1025, K1026, K1079 및 K1080의 아미노산이 알라닌으로 치환되거나; x) K1025, K1026, K1096 및 E1097의 아미노산이 알라닌으로 치환되거나; xi) K1079, K1080, K1096 및 E1097의 아미노산이 알라닌으로 치환되거나; 또는 xii) K1025, K1026, K1079, K1080, K1096 및 E1097의 아미노산이 알라닌으로 치환된, Cpf1 변이 단백질.3. In 1 above, the Cpf1 mutant protein is one in which i) the amino acids K1025 and K1026 of the LbCpf1 protein are substituted with alanine; ii) the amino acids at D1032 and R1033 are replaced with alanine; iii) the amino acid at K1050 is replaced with alanine; iv) the amino acids at K1061 and K1062 are replaced with alanine; v) the amino acids at K1079 and K1080 are replaced with alanine; vi) the amino acids of K1096 and E1097 are substituted with a hydrophobic amino acid selected from the group consisting of alanine, isoleucine, phenylalanine, valine and leucine; vii) the amino acid of K1101 is replaced with alanine; viii) the amino acids D1120 and K1121 are substituted with alanine; ix) the amino acids K1025, K1026, K1079 and K1080 are substituted with alanine; x) the amino acids K1025, K1026, K1096 and E1097 are replaced with alanine; xi) the amino acids K1079, K1080, K1096 and E1097 are substituted with alanine; or xii) a Cpf1 mutant protein in which the amino acids K1025, K1026, K1079, K1080, K1096 and E1097 are substituted with alanine.
4. 위 1에 있어서, 상기 LbCpf1 단백질은 서열번호 1의 서열인, Cpf1 변이 단백질.4. The Cpf1 mutant protein of 1 above, wherein the LbCpf1 protein is the sequence of SEQ ID NO: 1.
5. 위 1의 Cpf1 변이 단백질을 암호화하는 폴리뉴클레오티드.5. Polynucleotide encoding the Cpf1 mutant protein of 1 above.
6. 위 1의 Cpf1 변이 단백질을 암호화하는 폴리뉴클레오티드를 포함하는 벡터.6. A vector containing a polynucleotide encoding the Cpf1 mutant protein of 1 above.
7. 위 1의 Cpf1 변이 단백질 및 표적 핵산에 상보적으로 결합할 수 있는 가이드 RNA를 포함하는 복합체.7. A complex containing the Cpf1 mutant protein of 1 above and a guide RNA that can bind complementary to a target nucleic acid.
8. 위 1 내지 4 중 어느 한 항의 Cpf1 변이 단백질, 위 5의 폴리뉴클레오티드, 위 6의 벡터 및 위 7의 복합체 중 적어도 하나를 포함하는 표적 핵산 검출용 키트.8. A kit for detecting a target nucleic acid containing at least one of the Cpf1 mutant protein of any one of 1 to 4 above, the polynucleotide of 5 above, the vector of 6 above, and the complex of 7 above.
9. 위 8에 있어서, 표적 핵산에 상보적으로 결합할 수 있는 가이드 RNA 또는 라벨링된 ssDNA 중 적어도 하나를 더 포함하는, 표적 핵산 검출용 키트.9. The kit for detecting target nucleic acid according to item 8 above, further comprising at least one of guide RNA or labeled ssDNA capable of complementary binding to the target nucleic acid.
10. 시료에 위 1 내지 4 중 어느 한 항의 Cpf1 변이 단백질, 위 5의 폴리뉴클레오티드, 위 6의 벡터 및 위 7의 복합체 중 적어도 하나를 처리하는 것을 포함하는 표적 핵산 검출 방법.10. A target nucleic acid detection method comprising treating a sample with at least one of the Cpf1 mutant protein of any one of 1 to 4 above, the polynucleotide of 5 above, the vector of 6 above, and the complex of 7 above.
11. 위 10에 있어서, 상기 시료에 상기 표적 핵산에 상보적으로 결합할 수 있는 가이드 RNA 또는 라벨링된 ssDNA 중 적어도 하나를 처리하는 것을 더 포함하는, 표적 핵산 검출 방법.11. The method of detecting a target nucleic acid according to item 10 above, further comprising treating the sample with at least one of guide RNA or labeled ssDNA capable of binding complementary to the target nucleic acid.
본 발명의 Cpf1 변이 단백질은 시스-절단 활성(cis-cleavage activity)을 유지하면서 우수한 트랜스-절단 활성(trans-cleavage activity)을 나타낼 수 있다.The Cpf1 mutant protein of the present invention can exhibit excellent trans-cleavage activity while maintaining cis-cleavage activity.
본 발명의 Cpf1 변이 단백질은 신속하고 높은 강도로 표적 핵산을 검출할 수 있다. The Cpf1 mutant protein of the present invention can detect target nucleic acids quickly and with high intensity.
본 발명의 Cpf1 변이 단백질은 신속하고 높은 강도로 표적 핵산을 검출할 수 있고, 바이러스 매개의 전염병을 포함한 각종 전염 질병에 필수적인 현장진단(Point Of Care, POC)에 활용될 수 있다.The Cpf1 mutant protein of the present invention can detect target nucleic acids quickly and with high intensity, and can be used for point-of-care (POC) essential for various infectious diseases, including virus-borne infectious diseases.
도 1은 야생형 LbCpf1 단백질의 도메인을 간략히 나타낸 도식 및 야생형 LbCpf1 단백질의 3D 구조를 나타낸다.
도 2 내지 도 9는 실시예에 따른 각 LbCpf1 변이 단백질의 3D 구조와 변이가 발생한 아미노산 위치를 표시한 것이다. 도 2의 왼쪽 하단에 도 2 내지 9의 3D 구조에 표시된 색의 의미를 표시하였다.
도 10 및 도 11은 정제된 LbCpf1 변이 단백질을 확인한 SDS-PAGE gel 분석 결과이다. 도 10 및 도 11에서 D1181A 는 negative control이며 WT는 야생형 LbCpf1 단백질을 의미한다.
도 12 및 도 13은 LbCpf1 변이 단백질의 시스-절단 분석(cis-cleavage analysis) 결과를 나타낸다. 도 12 및 도 13에서 WT는 야생형 LbCpf1 단백질을 의미한다.
도 14 및 도 15는 LbCpf1 변이 단백질의 트랜스-절단 분석 결과를 나타낸다. 도 14 및 도 15에서 WT는 야생형 LbCpf1 단백질을 의미한다.
도 16은 LbCpf1 변이 단백질을 이용한 Lateral flow assay 결과를 나타낸다.
도 17은 AsCpf1 단백질의 3D 구조를 나타낸다. 도 17의 3D 구조에 표 4의 각 AsCpf1 변이 단백질들의 변이 위치를 한번에 표시하였다.
도 18은 AsCpf1 변이 단백질의 트랜스-절단 활성의 분석 결과를 나타낸다. 도 18에서 WT는 야생형 AsCpf1 단백질을 의미한다.
도 19는 본 발명의 Cpf1 변이 단백질을 활용할 수 있는 응용 범위를 도식화한 것이다. 본 발명의 Cpf1 변이 단백질을 이용하면 크리스퍼 반응을 통해 효과적으로 POC test를 수행할 수 있다.Figure 1 shows a schematic diagram of the domains of the wild-type LbCpf1 protein and the 3D structure of the wild-type LbCpf1 protein.
Figures 2 to 9 show the 3D structure of each LbCpf1 mutant protein according to an example and the amino acid position where the mutation occurred. The meaning of the colors shown in the 3D structures of Figures 2 to 9 is indicated at the bottom left of Figure 2.
Figures 10 and 11 show the results of SDS-PAGE gel analysis confirming the purified LbCpf1 mutant protein. In Figures 10 and 11, D1181A is a negative control and WT means wild type LbCpf1 protein.
Figures 12 and 13 show the results of cis-cleavage analysis of the LbCpf1 mutant protein. 12 and 13, WT refers to wild-type LbCpf1 protein.
Figures 14 and 15 show the results of trans-cleavage analysis of the LbCpf1 mutant protein. 14 and 15, WT refers to wild-type LbCpf1 protein.
Figure 16 shows the results of lateral flow assay using the LbCpf1 mutant protein.
Figure 17 shows the 3D structure of AsCpf1 protein. The mutation positions of each AsCpf1 mutant protein in Table 4 are displayed at once in the 3D structure of Figure 17.
Figure 18 shows the results of analysis of trans-cleavage activity of AsCpf1 mutant protein. In Figure 18, WT refers to wild-type AsCpf1 protein.
Figure 19 schematically illustrates the range of applications in which the Cpf1 mutant protein of the present invention can be utilized. Using the Cpf1 mutant protein of the present invention, a POC test can be effectively performed through CRISPR reaction.
이하, 본 발명을 상세히 설명한다.Hereinafter, the present invention will be described in detail.
본 발명은 Cpf1(Clustered Regularly Interspaced Short Palindromic Repeats from Prevotella and Francisella 1) 변이 단백질을 제공한다.The present invention provides a Cpf1 (Clustered Regularly Interspaced Short Palindromic Repeats from Prevotella and Francisella 1) mutant protein.
본 명세서는 Cpf1의 시스-절단 활성을 유지하면서 동시에 트랜스-절단 활성을 보다 증진시킬 수 있는 기술을 제공할 수 있다. 보다 구체적으로 Cpf1의 변이 단백질은 표적 핵산이 존재하는 경우 야생형 Cpf1에 비해 우수한 collateral DNase 활성을 나타낼 수 있다. 따라서, 본 발명의 Cpf1 변이 단백질은 표적 핵산의 보다 신속한 검출이 필요한 분야(예컨대 현장 진단 등)에 활용될 수 있다.The present specification can provide a technology that can further enhance the trans-cleavage activity of Cpf1 while maintaining its cis-cleavage activity. More specifically, mutant proteins of Cpf1 can exhibit superior collateral DNase activity compared to wild-type Cpf1 in the presence of target nucleic acids. Therefore, the Cpf1 mutant protein of the present invention can be used in fields that require more rapid detection of target nucleic acids (for example, point-of-care diagnosis, etc.).
Cpf1은 RNA-가이드 내부핵산분해효소(RNA-guided endonuclease)로 Cas12 또는 Cas12a로도 표현될 수 있다.Cpf1 is an RNA-guided endonuclease and can also be expressed as Cas12 or Cas12a.
“변이 단백질(mutant protein)”은 돌연변이(mutation)가 일어난 단백질을 의미한다. 예컨대 변이 단백질은 야생형 단백질로부터 하나의 아미노산에 변이가 일어난 것일 수 있고, 절단에 의해 넓은 범위의 아미노산에 변이가 일어난 것일 수 있다. 변이는 인위적으로 도입된 것일 수 있고, 예를 들어 야생형 단백질을 암호화하는 폴리뉴클레오티드에 포함된 일부 뉴클레오티드를 변경하여 아미노산 변이를 도입할 수 있다.“Mutant protein” refers to a protein that has undergone mutation. For example, a mutant protein may be a mutation in one amino acid from a wild-type protein, or it may be a mutation in a wide range of amino acids due to cleavage. Mutations may be artificially introduced, for example, amino acid mutations may be introduced by changing some nucleotides included in a polynucleotide encoding a wild-type protein.
“변이”는 하나 이상의 연속 또는 비-연속 아미노산의 삽입, 치환 또는 결실을 포함할 수 있다.A “variation” may include the insertion, substitution, or deletion of one or more consecutive or non-consecutive amino acids.
“Cpf1 변이 단백질”은 야생형 Cpf1에 변이가 일어난 단백질을 의미한다. 예컨대 Cpf1 변이 단백질은 야생형 Cpf1 단백질의 아미노산 서열에서 적어도 하나의 아미노산이 치환 및/또는 결실되거나, 야생형 Cpf1 단백질의 아미노산 서열에 외부 아미노산이 삽입되거나, 야생형 Cpf1 단백질의 아미노산 서열에서 적어도 하나의 아미노산이 치환 및/또는 결실되고 외부 아미노산이 삽입된 것일 수 있다.“Cpf1 mutant protein” refers to a protein that has mutated from wild-type Cpf1. For example, the Cpf1 mutant protein has at least one amino acid substituted and/or deleted in the amino acid sequence of the wild-type Cpf1 protein, a foreign amino acid is inserted into the amino acid sequence of the wild-type Cpf1 protein, or at least one amino acid is substituted in the amino acid sequence of the wild-type Cpf1 protein. And/or it may be deleted and a foreign amino acid may be inserted.
Cpf1 변이 단백질은 야생형 Cpf1 단백질의 3차원 구조에서 트랜스-절단 활성에 영향을 줄 것으로 예상되는 위치에서 변이가 일어난 것일 수 있다.The Cpf1 mutant protein may be mutated at a position expected to affect trans-cleavage activity in the three-dimensional structure of the wild-type Cpf1 protein.
Cpf1 변이 단백질은 LbCpf1 단백질의 1025 내지 1121번째 아미노산 중 적어도 하나의 아미노산의 변이를 포함할 수 있다.The Cpf1 mutant protein may include a mutation in at least one amino acid among amino acids 1025 to 1121 of the LbCpf1 protein.
Cpf1 변이 단백질은 LbCpf1 단백질의 1025, 1026, 1032, 1033, 1050, 1061, 1062, 1079, 1080, 1096, 1097, 1101, 1120 및 1121번째 아미노산 중 적어도 하나의 변이를 포함할 수 있다.The Cpf1 mutant protein may contain a mutation in at least one of amino acids 1025, 1026, 1032, 1033, 1050, 1061, 1062, 1079, 1080, 1096, 1097, 1101, 1120, and 1121 of the LbCpf1 protein.
Cpf1 변이 단백질은 LbCpf1 단백질의 1025, 1026, 1032, 1033, 1050, 1061, 1062, 1079, 1080, 1096, 1097, 1101, 1120 및 1121번째 아미노산 중 적어도 하나가 변이된 것일 수 있다.The Cpf1 mutant protein may be one in which at least one of amino acids 1025, 1026, 1032, 1033, 1050, 1061, 1062, 1079, 1080, 1096, 1097, 1101, 1120, and 1121 of the LbCpf1 protein is mutated.
상기 LbCpf1 단백질은 야생형 LbCpf1 단백질을 의미한다. 야생형 LbCpf1 단백질은 서열번호 1의 서열을 포함할 수 있다. 야생형 LbCpf1 단백질은 서열번호 1의 서열에 대해 적어도 80%, 85%, 90%, 95% 또는 99%의 서열 동일성을 갖는 서열일 수 있다. 야생형 LbCpf1 단백질은 서열번호 1의 서열일 수 있다.The LbCpf1 protein refers to the wild type LbCpf1 protein. The wild-type LbCpf1 protein may include the sequence of SEQ ID NO: 1. The wild-type LbCpf1 protein may be a sequence having at least 80%, 85%, 90%, 95% or 99% sequence identity to the sequence of SEQ ID NO: 1. The wild-type LbCpf1 protein may have the sequence of SEQ ID NO: 1.
LbCpf1 단백질은 Lachnospiraceae_bacterium_ND2006 유래 Cpf1을 의미한다.LbCpf1 protein refers to Cpf1 from Lachnospiraceae_bacterium_ND2006 .
MSKLEKFTNCYSLSKTLRFKAIPVGKTQENIDNKRLLVEDEKRAEDYKGVKKLLDRYYLSFINDVLHSIKLKNLNNYISLFRKKTRTEKENKELENLEINLRKEIAKAFKGNEGYKSLFKKDIIETILPEFLDDKDEIALVNSFNGFTTAFTGFFDNRENMFSEEAKSTSIAFRCINENLTRYISNMDIFEKVDAIFDKHEVQEIKEKILNSDYDVEDFFEGEFFNFVLTQEGIDVYNAIIGGFVTESGEKIKGLNEYINLYNQKTKQKLPKFKPLYKQVLSDRESLSFYGEGYTSDEEVLEVFRNTLNKNSEIFSSIKKLEKLFKNFDEYSSAGIFVKNGPAISTISKDIFGEWNVIRDKWNAEYDDIHLKKKAVVTEKYEDDRRKSFKKIGSFSLEQLQEYADADLSVVEKLKEIIIQKVDEIYKVYGSSEKLFDADFVLEKSLKKNDAVVAIMKDLLDSVKSFENYIKAFFGEGKETNRDESFYGDFVLAYDILLKVDHIYDAIRNYVTQKPYSKDKFKLYFQNPQFMGGWDKDKETDYRATILRYGSKYYLAIMDKKYAKCLQKIDKDDVNGNYEKINYKLLPGPNKMLPKVFFSKKWMAYYNPSEDIQKIYKNGTFKKGDMFNLNDCHKLIDFFKDSISRYPKWSNAYDFNFSETEKYKDIAGFYREVEEQGYKVSFESASKKEVDKLVEEGKLYMFQIYNKDFSDKSHGTPNLHTMYFKLLFDENNHGQIRLSGGAELFMRRASLKKEELVVHPANSPIANKNPDNPKKTTTLSYDVYKDKRFSEDQYELHIPIAINKCPKNIFKINTEVRVLLKHDDNPYVIGIDRGERNLLYIVVVDGKGNIVEQYSLNEIINNFNGIRIKTDYHSLLDKKEKERFEARQNWTSIENIKELKAGYISQVVHKICELVEKYDAVIALEDLNSGFKNSRVKVEKQVYQKFEKMLIDKLNYMVDKKSNPCATGGALKGYQITNKFESFKSMSTQNGFIFYIPAWLTSKIDPSTGFVNLLKTKYTSIADSKKFISSFDRIMYVPEEDLFEFALDYKNFSRTDADYIKKWKLYSYGNRIRIFRNPKKNNVFDWEEVCLTSAYKELFNKYGINYQQGDIRALLCEQSDKAFYSSFMALMSLMLQMRNSITGRTDVDFLISPVKNSDGIFYDSRNYEAQENAILPKNADANGAYNIARKVLWAIGQFKKAEDEKLDKVKIAISNKEWLEYAQTSVKHSEQ ID NO: 1:
Cpf1 변이 단백질은 야생형 Cpf1 단백질의 비소수성 아미노산 중 적어도 하나가 소수성 아미노산으로 치환된 것일 수 있다. 비소수성 아미노산은 소수성이 아닌 아미노산으로, 예컨대 친수성 아미노산일 수 있다. 야생형 Cpf1에 치환으로 도입된 소수성 아미노산은 부피가 크지 않고 구조가 단순하며, 트랜스-절단 외에 부반응을 일으키지 않는 것일 수 있다.The Cpf1 mutant protein may be one in which at least one of the non-hydrophobic amino acids of the wild-type Cpf1 protein is replaced with a hydrophobic amino acid. A non-hydrophobic amino acid may be an amino acid that is not hydrophobic, for example, a hydrophilic amino acid. The hydrophobic amino acid introduced by substitution into wild-type Cpf1 is not bulky, has a simple structure, and may not cause side reactions other than trans-cleavage.
소수성 아미노산은 글라이신, 알라닌, 발린, 류신, 이소류신, 페닐알라닌, 티로신, 트립토판, 프롤린 및 메티오닌으로 이루어진 군에서 선택된 적어도 하나일 수 있다. 구체적으로, 소수성 아미노산은 알라닌, 이소류신, 페닐알라닌, 발린 및 류신으로 이루어진 군에서 선택된 것일 수 있다. 알라닌(Ala, A)은 소수성을 나타내면서 잔기 사이즈가 크지 않고 단순한 형태의 아미노산다. 이소류신(Ile, I), 페닐알라닌(Phe, F), 발린(Val,V) 및 류신(Leu, L)은 타 소수성 아미노산에 비해 상대적으로 소수성 성질이 높다.The hydrophobic amino acid may be at least one selected from the group consisting of glycine, alanine, valine, leucine, isoleucine, phenylalanine, tyrosine, tryptophan, proline, and methionine. Specifically, the hydrophobic amino acid may be selected from the group consisting of alanine, isoleucine, phenylalanine, valine, and leucine. Alanine (Ala, A) is a simple amino acid that is hydrophobic and does not have a large residue size. Isoleucine (Ile, I), phenylalanine (Phe, F), valine (Val, V), and leucine (Leu, L) have relatively high hydrophobic properties compared to other hydrophobic amino acids.
Cpf1 변이 단백질은 LbCpf1 단백질의 1025 내지 1121번째 아미노산 중 적어도 하나가 소수성 아미노산으로 치환된 변이를 포함할 수 있다. The Cpf1 mutant protein may include a mutation in which at least one of amino acids 1025 to 1121 of the LbCpf1 protein is substituted with a hydrophobic amino acid.
Cpf1 변이 단백질은 LbCpf1 단백질의 1025, 1026, 1032, 1033, 1050, 1061, 1062, 1079, 1080, 1096, 1097, 1101, 1120 및 1121번째 아미노산 중 적어도 하나가 각각 독립적으로 알라닌, 이소류신, 페닐알라닌, 발린 및 류신으로 이루어진 군에서 선택된 소수성 아미노산으로 치환된 변이를 포함할 수 있다. Cpf1 변이 단백질은 LbCpf1 단백질의 1025, 1026, 1032, 1033, 1050, 1061, 1062, 1079, 1080, 1096, 1097, 1101, 1120 및 1121번째 아미노산 중 적어도 하나가 각각 독립적으로 알라닌, 이소류신, 페닐알라닌, 발린 및 류신으로 이루어진 군에서 선택된 소수성 아미노산으로 치환된 것일 수 있다.CPF1 variant protein is at least one of the 1025, 1026, 1032, 1033, 1050, 1061, 1062, 1079, 1080, 1096, 1097, 1101, 1120 and 1121th amino acids, respectively and a mutation substituted with a hydrophobic amino acid selected from the group consisting of leucine. CPF1 variant protein is at least one of the 1025, 1026, 1032, 1033, 1050, 1061, 1062, 1079, 1080, 1096, 1097, 1101, 1120 and 1121th amino acids, respectively and may be substituted with a hydrophobic amino acid selected from the group consisting of leucine.
일 실시예에 따르면, Cpf1 변이 단백질은 LbCpf1(서열번호 1)에서 1025 내지 1026번째 아미노산이 변이된 것일 수 있다(LbCpf1 에서 K1025 내지 K1026 아미노산의 변이). 구체적으로, Cpf1 변이 단백질은 LbCpf1(서열번호 1)에서 1025 내지 1026번째 아미노산이 각각 독립적으로 알라닌, 이소류신, 페닐알라닌, 발린 및 류신으로 이루어진 군에서 선택된 소수성 아미노산으로 치환된 것일 수 있다. 구체적으로, Cpf1 변이 단백질은 LbCpf1(서열번호 1)에서 1025 내지 1026번째 아미노산이 알라닌으로 치환된 것일 수 있다.According to one embodiment, the Cpf1 mutant protein may be one in which amino acids 1025 to 1026 of LbCpf1 (SEQ ID NO: 1) are mutated (mutation of amino acids K1025 to K1026 in LbCpf1). Specifically, the Cpf1 mutant protein may be one in which amino acids 1025 to 1026 of LbCpf1 (SEQ ID NO: 1) are each independently substituted with a hydrophobic amino acid selected from the group consisting of alanine, isoleucine, phenylalanine, valine, and leucine. Specifically, the Cpf1 mutant protein may be one in which amino acids 1025 to 1026 of LbCpf1 (SEQ ID NO: 1) are substituted with alanine.
일 실시예에 따르면, Cpf1 변이 단백질은 LbCpf1(서열번호 1)에서 1079 내지 1080번째 아미노산이 변이된 것일 수 있다(LbCpf1에서 K1079 내지 K1080 아미노산의 변이). 구체적으로, Cpf1 변이 단백질은 LbCpf1(서열번호 1)에서 1079 내지 1080번째 아미노산이 각각 독립적으로 알라닌, 이소류신, 페닐알라닌, 발린 및 류신으로 이루어진 군에서 선택된 소수성 아미노산으로 치환된 것일 수 있다. 구체적으로, Cpf1 변이 단백질은 LbCpf1(서열번호 1)에서 1079 및 1080번째 아미노산이 알라닌으로 치환된 것일 수 있다.According to one embodiment, the Cpf1 mutant protein may be one in which amino acids 1079 to 1080 of LbCpf1 (SEQ ID NO: 1) are mutated (mutation of amino acids K1079 to K1080 in LbCpf1). Specifically, the Cpf1 mutant protein may be one in which amino acids 1079 to 1080 of LbCpf1 (SEQ ID NO: 1) are each independently substituted with a hydrophobic amino acid selected from the group consisting of alanine, isoleucine, phenylalanine, valine, and leucine. Specifically, the Cpf1 mutant protein may be one in which amino acids 1079 and 1080 of LbCpf1 (SEQ ID NO: 1) are substituted with alanine.
일 실시예에 따르면, Cpf1 변이 단백질은 LbCpf1(서열번호 1)에서 1096 내지 1097번째 아미노산이 변이된 것일 수 있다(LbCpf1에서 K1096 내지 E1097 아미노산의 변이). 구체적으로 Cpf1 변이 단백질은 LbCpf1(서열번호 1)에서 1096 및 1097번째 아미노산이 각각 독립적으로 알라닌, 이소류신, 페닐알라닌, 발린 및 류신으로 이루어진 군에서 선택된 소수성 아미노산으로 치환된 것일 수 있다. 구체적으로, Cpf1 변이 단백질은 LbCpf1(서열번호 1)에서 1079 및 1080번째 아미노산이 모두 알라닌으로 치환되거나, 1079 및 1080번째 아미노산이 모두 이소류신으로 치환되거나, 1079 및 1080번째 아미노산이 모두 페닐알라닌으로 치환되거나, 1079 및 1080번째 아미노산이 모두 발린으로 치환되거나, 1079 및 1080번째 아미노산이 모두 류신으로 치환된 것일 수 있다.According to one embodiment, the Cpf1 mutant protein may be one in which amino acids 1096 to 1097 of LbCpf1 (SEQ ID NO: 1) are mutated (mutation of amino acids K1096 to E1097 in LbCpf1). Specifically, the Cpf1 mutant protein may be one in which amino acids 1096 and 1097 of LbCpf1 (SEQ ID NO: 1) are each independently substituted with hydrophobic amino acids selected from the group consisting of alanine, isoleucine, phenylalanine, valine, and leucine. Specifically, the Cpf1 mutant protein is LbCpf1 (SEQ ID NO: 1) in which both the 1079th and 1080th amino acids are substituted with alanine, both the 1079th and 1080th amino acids are substituted with isoleucine, both the 1079th and 1080th amino acids are substituted with phenylalanine, or Both the 1079th and 1080th amino acids may be substituted with valine, or both the 1079th and 1080th amino acids may be substituted with leucine.
일 실시예에 따르면, Cpf1 변이 단백질은 LbCpf1(서열번호 1)에서 1032 내지 1033번째 아미노산이 변이된 것일 수 있다(LbCpf1에서 D1032 내지 R1033 아미노산의 변이). 구체적으로 Cpf1 변이 단백질은 LbCpf1(서열번호 1)에서 1032 내지 1033번째 아미노산이 각각 독립적으로 알라닌, 이소류신, 페닐알라닌, 발린 및 류신으로 이루어진 군에서 선택된 소수성 아미노산으로 치환된 것일 수 있다. 구체적으로 Cpf1 변이 단백질은 LbCpf1(서열번호 1)에서 1032 내지 1033번째 아미노산이 알라닌으로 치환된 것일 수 있다.According to one embodiment, the Cpf1 mutant protein may be one in which amino acids 1032 to 1033 of LbCpf1 (SEQ ID NO: 1) are mutated (mutation of amino acids D1032 to R1033 in LbCpf1). Specifically, the Cpf1 mutant protein may be one in which amino acids 1032 to 1033 of LbCpf1 (SEQ ID NO: 1) are each independently substituted with a hydrophobic amino acid selected from the group consisting of alanine, isoleucine, phenylalanine, valine, and leucine. Specifically, the Cpf1 mutant protein may be one in which amino acids 1032 to 1033 in LbCpf1 (SEQ ID NO: 1) are substituted with alanine.
일 실시예에 따르면, Cpf1 변이 단백질은 LbCpf1(서열번호 1)에서 1050번째 아미노산이 변이된 것일 수 있다(LbCpf1에서 K1050 아미노산의 변이). 구체적으로 Cpf1 변이 단백질은 LbCpf1(서열번호 1)에서 1050번째 아미노산이 알라닌, 이소류신, 페닐알라닌, 발린 및 류신으로 이루어진 군에서 선택된 소수성 아미노산으로 치환된 것일 수 있다. 구체적으로 Cpf1 변이 단백질은 LbCpf1(서열번호 1)에서 1050번째 아미노산이 알라닌으로 치환된 것일 수 있다.According to one embodiment, the Cpf1 mutant protein may be one in which the 1050th amino acid in LbCpf1 (SEQ ID NO: 1) is mutated (mutation of the K1050 amino acid in LbCpf1). Specifically, the Cpf1 mutant protein may be one in which the 1050th amino acid in LbCpf1 (SEQ ID NO: 1) is substituted with a hydrophobic amino acid selected from the group consisting of alanine, isoleucine, phenylalanine, valine, and leucine. Specifically, the Cpf1 mutant protein may be one in which the 1050th amino acid in LbCpf1 (SEQ ID NO: 1) is substituted with alanine.
일 실시예에 따르면, Cpf1 변이 단백질은 LbCpf1(서열번호 1)에서 1061 내지 1062번째 아미노산이 변이된 것일 수 있다(LbCpf1에서 K1061 내지 K1062 아미노산의 변이). 구체적으로 Cpf1 변이 단백질은 LbCpf1(서열번호 1)에서 1061 내지 1062번째 아미노산이 각각 독립적으로 알라닌, 이소류신, 페닐알라닌, 발린 및 류신으로 이루어진 군에서 선택된 소수성 아미노산으로 치환된 것일 수 있다. 구체적으로 Cpf1 변이 단백질은 LbCpf1(서열번호 1)에서 1061 내지 1062번째 아미노산이 알라닌으로 치환된 것일 수 있다.According to one embodiment, the Cpf1 mutant protein may be one in which amino acids 1061 to 1062 of LbCpf1 (SEQ ID NO: 1) are mutated (mutation of amino acids K1061 to K1062 in LbCpf1). Specifically, the Cpf1 mutant protein may be one in which amino acids 1061 to 1062 of LbCpf1 (SEQ ID NO: 1) are each independently substituted with a hydrophobic amino acid selected from the group consisting of alanine, isoleucine, phenylalanine, valine, and leucine. Specifically, the Cpf1 mutant protein may be one in which amino acids 1061 to 1062 of LbCpf1 (SEQ ID NO: 1) are substituted with alanine.
일 실시예에 따르면, Cpf1 변이 단백질은 LbCpf1(서열번호 1)에서 1101번째 아미노산이 변이된 것일 수 있다(LbCpf1에서 K1101 아미노산의 변이). 구체적으로 Cpf1 변이 단백질은 LbCpf1(서열번호 1)에서 1101번째 아미노산이 알라닌, 이소류신, 페닐알라닌, 발린 및 류신으로 이루어진 군에서 선택된 소수성 아미노산으로 치환된 것일 수 있다. 구체적으로 Cpf1 변이 단백질은 LbCpf1(서열번호 1)에서 1101번째 아미노산이 알라닌으로 치환된 것일 수 있다.According to one embodiment, the Cpf1 mutant protein may be one in which the 1101st amino acid in LbCpf1 (SEQ ID NO: 1) is mutated (mutation of the K1101 amino acid in LbCpf1). Specifically, the Cpf1 mutant protein may be one in which the 1101st amino acid in LbCpf1 (SEQ ID NO: 1) is substituted with a hydrophobic amino acid selected from the group consisting of alanine, isoleucine, phenylalanine, valine, and leucine. Specifically, the Cpf1 mutant protein may be one in which the 1101st amino acid in LbCpf1 (SEQ ID NO: 1) is substituted with alanine.
일 실시예에 따르면, Cpf1 변이 단백질은 LbCpf1(서열번호 1)에서 1120 및 1121번째 아미노산이 변이된 것일 수 있다(LbCpf1에서 D1120 및 K1121 아미노산의 변이). 구체적으로 Cpf1 변이 단백질은 LbCpf1(서열번호 1)에서 1120 및 1121번째 아미노산이 알라닌, 이소류신, 페닐알라닌, 발린 및 류신으로 이루어진 군에서 선택된 소수성 아미노산으로 치환된 것일 수 있다. 구체적으로 Cpf1 변이 단백질은 LbCpf1(서열번호 1)에서 1120 및 1121번째 아미노산이 알라닌으로 치환된 것일 수 있다.According to one embodiment, the Cpf1 mutant protein may be one in which the 1120th and 1121st amino acids in LbCpf1 (SEQ ID NO: 1) are mutated (mutation of the D1120 and K1121 amino acids in LbCpf1). Specifically, the Cpf1 mutant protein may be one in which amino acids 1120 and 1121 in LbCpf1 (SEQ ID NO: 1) are substituted with hydrophobic amino acids selected from the group consisting of alanine, isoleucine, phenylalanine, valine, and leucine. Specifically, the Cpf1 mutant protein may be one in which the 1120th and 1121st amino acids in LbCpf1 (SEQ ID NO: 1) are substituted with alanine.
일 실시예에 따르면, Cpf1 변이 단백질은 LbCpf1(서열번호 1)에서 1025, 1026, 1079 및 1080번째 아미노산이 변이된 것일 수 있다. 구체적으로 Cpf1 변이 단백질은 LbCpf1(서열번호 1)에서 1025, 1026, 1079 및 1080번째 아미노산이 각각 독립적으로 알라닌, 이소류신, 페닐알라닌, 발린 및 류신으로 이루어진 군에서 선택된 소수성 아미노산으로 치환된 것일 수 있다. 구체적으로 Cpf1 변이 단백질은 LbCpf1(서열번호 1)에서 1025, 1026, 1079 및 1080번째 아미노산이 알라닌으로 치환된 것일 수 있다.According to one embodiment, the Cpf1 mutant protein may be one in which amino acids 1025, 1026, 1079, and 1080 of LbCpf1 (SEQ ID NO: 1) are mutated. Specifically, the Cpf1 mutant protein may be one in which amino acids 1025, 1026, 1079, and 1080 of LbCpf1 (SEQ ID NO: 1) are each independently substituted with hydrophobic amino acids selected from the group consisting of alanine, isoleucine, phenylalanine, valine, and leucine. Specifically, the Cpf1 mutant protein may be one in which amino acids 1025, 1026, 1079, and 1080 of LbCpf1 (SEQ ID NO: 1) are substituted with alanine.
일 실시예에 따르면, Cpf1 변이 단백질은 LbCpf1(서열번호 1)에서 1025, 1026, 1096 및 1097번째 아미노산이 변이된 것일 수 있다. 구체적으로 Cpf1 변이 단백질은 LbCpf1(서열번호 1)에서 1025, 1026, 1096 및 1097번째 아미노산이 각각 독립적으로 알라닌, 이소류신, 페닐알라닌, 발린 및 류신으로 이루어진 군에서 선택된 소수성 아미노산으로 치환된 것일 수 있다. 구체적으로 Cpf1 변이 단백질은 LbCpf1(서열번호 1)에서 1025, 1026, 1096 및 1097번째 아미노산이 알라닌으로 치환된 것일 수 있다.According to one embodiment, the Cpf1 mutant protein may be one in which amino acids 1025, 1026, 1096, and 1097 of LbCpf1 (SEQ ID NO: 1) are mutated. Specifically, the Cpf1 mutant protein may be one in which amino acids 1025, 1026, 1096, and 1097 of LbCpf1 (SEQ ID NO: 1) are each independently substituted with hydrophobic amino acids selected from the group consisting of alanine, isoleucine, phenylalanine, valine, and leucine. Specifically, the Cpf1 mutant protein may be one in which amino acids 1025, 1026, 1096, and 1097 of LbCpf1 (SEQ ID NO: 1) are substituted with alanine.
일 실시예에 따르면, Cpf1 변이 단백질은 LbCpf1(서열번호 1)에서 1079, 1080, 1096 및 1097번째 아미노산이 변이된 것일 수 있다. 구체적으로 Cpf1 변이 단백질은 LbCpf1(서열번호 1)에서 1079, 1080, 1096 및 1097번째 아미노산이 각각 독립적으로 알라닌, 이소류신, 페닐알라닌, 발린 및 류신으로 이루어진 군에서 선택된 소수성 아미노산으로 치환된 것일 수 있다. 구체적으로 Cpf1 변이 단백질은 LbCpf1(서열번호 1)에서 1079, 1080, 1096 및 1097번째 아미노산이 알라닌으로 치환된 것일 수 있다.According to one embodiment, the Cpf1 mutant protein may be one in which amino acids 1079, 1080, 1096, and 1097 of LbCpf1 (SEQ ID NO: 1) are mutated. Specifically, the Cpf1 mutant protein may be one in which amino acids 1079, 1080, 1096, and 1097 of LbCpf1 (SEQ ID NO: 1) are each independently substituted with hydrophobic amino acids selected from the group consisting of alanine, isoleucine, phenylalanine, valine, and leucine. Specifically, the Cpf1 mutant protein may be one in which amino acids 1079, 1080, 1096, and 1097 of LbCpf1 (SEQ ID NO: 1) are substituted with alanine.
일 실시예에 따르면, Cpf1 변이 단백질은 LbCpf1(서열번호 1)에서 1025, 1026, 1079, 1080, 1096 및 1097번째 아미노산이 변이된 것일 수 있다. 구체적으로 Cpf1 변이 단백질은 LbCpf1(서열번호 1)에서 1025, 1026, 1079, 1080, 1096 및 1097번째 아미노산이 각각 독립적으로 알라닌, 이소류신, 페닐알라닌, 발린 및 류신으로 이루어진 군에서 선택된 소수성 아미노산으로 치환된 것일 수 있다. 구체적으로 Cpf1 변이 단백질은 LbCpf1(서열번호 1)에서 1025, 1026, 1079, 1080, 1096 및 1097번째 아미노산이 알라닌으로 치환된 것일 수 있다.According to one embodiment, the Cpf1 mutant protein may be one in which amino acids 1025, 1026, 1079, 1080, 1096, and 1097 of LbCpf1 (SEQ ID NO: 1) are mutated. Specifically, the Cpf1 mutant protein is one in which amino acids 1025, 1026, 1079, 1080, 1096, and 1097 in LbCpf1 (SEQ ID NO: 1) are each independently substituted with hydrophobic amino acids selected from the group consisting of alanine, isoleucine, phenylalanine, valine, and leucine. You can. Specifically, the Cpf1 mutant protein may be one in which amino acids 1025, 1026, 1079, 1080, 1096, and 1097 of LbCpf1 (SEQ ID NO: 1) are substituted with alanine.
Cpf1 변이 단백질은 LbCpf1 변이 단백질일 수 있다. 일 실시예에 따르면, LbCpf1 변이 단백질은 상응하는 위치에서 변이를 포함하는 AsCpf1 변이 단백질에 비해 트랜스-절단 활성 증진 효과가 우수하다. The Cpf1 mutant protein may be an LbCpf1 mutant protein. According to one embodiment, the LbCpf1 mutant protein has a superior trans-cleavage activity enhancement effect compared to the AsCpf1 mutant protein containing a mutation at the corresponding position.
또한, 본 발명은 전술한 Cpf1 변이 단백질을 암호화하는 폴리뉴클레오티드를 제공할 수 있다.Additionally, the present invention can provide a polynucleotide encoding the above-described Cpf1 mutant protein.
예컨대 Cpf1 변이 단백질을 암호화하는 폴리뉴클레오티드는 서열번호 3의 폴리뉴클레오티드 서열에서 소정의 뉴클레오티드들에 변이가 발생한 것일 수 있다. 서열번호 3은 야생형 LbCpf1을 암호화하는 서열일 수 있다.For example, the polynucleotide encoding the Cpf1 mutant protein may be one in which certain nucleotides are mutated in the polynucleotide sequence of SEQ ID NO: 3. SEQ ID NO: 3 may be a sequence encoding wild-type LbCpf1.
Cpf1 변이 단백질은 서열번호 3의 폴리뉴클레오티드 서열에서 3073 내지 3078번째 위치에 특정 부위(Site-Directed) 돌연변이 유도를 일으켜 제조된 것일 수 있다(3073 내지 3078번째 위치에서의 변이: aag aag -> gcg gcg ). Cpf1 변이 단백질은 서열번호 3의 폴리뉴클레오티드 서열에서 3094 내지 3099번째 위치에 특정 부위 돌연변이 유도를 일으켜 제조된 것일 수 있다(3094 내지 3099번째 위치에서의 변이: gac agg -> gcc gcg ).The Cpf1 mutant protein may be produced by inducing site-directed mutation at positions 3073 to 3078 in the polynucleotide sequence of SEQ ID NO: 3 (mutation at positions 3073 to 3078: aag aag -> gcg gcg ). The Cpf1 mutant protein may be produced by inducing a specific site mutation at positions 3094 to 3099 in the polynucleotide sequence of SEQ ID NO: 3 (mutation at positions 3094 to 3099: gac agg -> gcc gcg ).
Cpf1 변이 단백질은 서열번호 3의 폴리뉴클레오티드 서열에서 3148 내지 3150번째 위치에 특정 부위 돌연변이 유도를 일으켜 제조된 것일 수 있다(3148 내지 3150번째 위치에서의 변이: aag -> gcg ).The Cpf1 mutant protein may be produced by inducing a specific site mutation at positions 3148 to 3150 in the polynucleotide sequence of SEQ ID NO: 3 (mutation at positions 3148 to 3150: aag -> gcg ).
Cpf1 변이 단백질은 서열번호 3의 폴리뉴클레오티드 서열에서 3181 내지 3186번째 위치에 특정 부위 돌연변이 유도를 일으켜 제조된 것일 수 있다(3181 내지 3186번째 위치에서의 변이: aag aag-> gcg gcg ).The Cpf1 mutant protein may be produced by inducing a mutation at a specific site at positions 3181 to 3186 in the polynucleotide sequence of SEQ ID NO: 3 (mutation at positions 3181 to 3186: aag aag -> gcg gcg ).
Cpf1 변이 단백질은 서열번호 3의 폴리뉴클레오티드 서열에서 3235 내지 3240 번째 위치에 특정 부위 돌연변이 유도를 일으켜 제조된 것일 수 있다(3235 내지 3240 번째 위치에서의 변이: aag aag -> gcg gcg ).The Cpf1 mutant protein may be produced by inducing a specific site mutation at positions 3235 to 3240 in the polynucleotide sequence of SEQ ID NO: 3 (mutation at positions 3235 to 3240: aag aag -> gcg gcg ).
Cpf1 변이 단백질은 서열번호 3의 폴리뉴클레오티드 서열에서 3286 내지 3291 번째 위치에 특정 부위 돌연변이 유도를 일으켜 제조된 것일 수 있다(3286 내지 3291 번째 위치에서의 변이: aag gag -> gcg gcg /aag gag -> ata ata /aag gag -> ctg ctg /aag gag -> gtg gtg /aag gag -> ttt ttt ).The Cpf1 mutant protein may be produced by inducing a mutation at a specific site at positions 3286 to 3291 in the polynucleotide sequence of SEQ ID NO: 3 (mutation at positions 3286 to 3291: aag gag -> gcg gcg /aag gag -> ata ata /aag gag -> ctg ctg /aag gag -> gtg gtg /aag gag -> ttt ttt ).
Cpf1 변이 단백질은 서열번호 3의 폴리뉴클레오티드 서열에서 3301 내지 3303번째 위치에 특정 부위 돌연변이 유도를 일으켜 제조된 것일 수 있다(3301 내지 3303번째 위치에서의 변이: aag-> gcg ).The Cpf1 mutant protein may be produced by inducing a specific site mutation at positions 3301 to 3303 in the polynucleotide sequence of SEQ ID NO: 3 (mutation at positions 3301 to 3303: aag -> gcg ).
Cpf1 변이 단백질은 서열번호 3의 폴리뉴클레오티드 서열에서 3358 내지 3363번째 위치에 특정 부위 돌연변이 유도를 일으켜 제조된 것일 수 있다(3358 내지 3363번째 위치에서의 변이: gac aag-> gcc gcg ).The Cpf1 mutant protein may be produced by inducing a specific site mutation at positions 3358 to 3363 in the polynucleotide sequence of SEQ ID NO: 3 (mutation at positions 3358 to 3363: gac aag -> gcc gcg ).
Cpf1 변이 단백질은 서열번호 3의 폴리뉴클레오티드 서열에서 3073 내지 3078번째, 및 3235 내지 3240 번째 위치에 특정 부위 돌연변이 유도를 일으켜 제조된 것일 수 있다(3073 내지 3078번째 위치에서의 변이: aag aag -> gcg gcg , 및 3235 내지 3240 번째 위치에서의 변이: aag aag -> gcg gcg ).The Cpf1 mutant protein may be produced by inducing specific site mutations at positions 3073 to 3078 and 3235 to 3240 in the polynucleotide sequence of SEQ ID NO: 3 (mutation at positions 3073 to 3078: aag aag -> gcg gcg , and the mutation at positions 3235 to 3240: aag aag -> gcg gcg ).
Cpf1 변이 단백질은 서열번호 3의 폴리뉴클레오티드 3073 내지 3078번째, 및 3286 내지 3291 번째 위치에 특정 부위 돌연변이 유도를 일으켜 제조된 것일 수 있다(3073 내지 3078번째 위치에서의 변이: aag aag -> gcg gcg, 및 3286 내지 3291 번째 위치에서의 변이: aag gag -> gcg gcg ).The Cpf1 mutant protein may be prepared by inducing specific site mutations at positions 3073 to 3078 and 3286 to 3291 of the polynucleotide of SEQ ID NO: 3 (mutation at positions 3073 to 3078: aag aag -> gcg gcg, and mutations at positions 3286 to 3291: aag gag -> gcg gcg ).
Cpf1 변이 단백질은 서열번호 3의 폴리뉴클레오티드 3235 내지 3240 번째, 및 3286 내지 3291 번째 위치에 특정 부위 돌연변이 유도를 일으켜 제조된 것일 수 있다(3235 내지 3240 번째 위치에서의 변이: aag aag -> gcg gcg , 및 3286 내지 3291 번째 위치에서의 변이: aag gag -> gcg gcg ).The Cpf1 mutant protein may be produced by inducing specific site mutations at positions 3235 to 3240 and 3286 to 3291 of the polynucleotide of SEQ ID NO: 3 (mutation at positions 3235 to 3240: aag aag -> gcg gcg , and mutations at positions 3286 to 3291: aag gag -> gcg gcg ).
Cpf1 변이 단백질은 서열번호 3의 폴리뉴클레오티드 3073 내지 3078번째, 3235 내지 3240 번째, 및 3286 내지 3291 번째 위치에 특정 부위 돌연변이 유도를 일으켜 제조된 것일 수 있다(3073 내지 3078번째 위치에서의 변이: aag aag -> gcg gcg , 3235 내지 3240 번째 위치에서의 변이: aag aag -> gcg gcg 및 3286 내지 3291 번째 위치에서의 변이: aag gag -> gcg gcg ).The Cpf1 mutant protein may be prepared by inducing specific site mutations at positions 3073 to 3078, 3235 to 3240, and 3286 to 3291 of the polynucleotide of SEQ ID NO: 3 (mutation at positions 3073 to 3078: aag aag -> gcg gcg , mutation at positions 3235 to 3240: aag aag -> gcg gcg and mutations at positions 3286 to 3291: aag gag -> gcg gcg ).
본 발명의 폴리뉴클레오티드는 Cpf1 변이 단백질을 암호화하는 것이면 충분하며, 구체적인 서열은 제한되지 않는다.The polynucleotide of the present invention is sufficient as long as it encodes a Cpf1 mutant protein, and the specific sequence is not limited.
Cpf1 변이 단백질에 대해서는 전술한 바 있어 구체적인 설명은 생략한다.Since the Cpf1 mutant protein has been described above, detailed description will be omitted.
또한, 본 발명은 전술한 Cpf1 변이 단백질을 암호화하는 폴리뉴클레오티드를 포함하는 벡터를 제공할 수 있다.Additionally, the present invention can provide a vector containing a polynucleotide encoding the above-described Cpf1 mutant protein.
벡터는 플라스미드 벡터, 바이러스성 벡터일 수 있으나, 이에 제한되지 않는다.The vector may be, but is not limited to, a plasmid vector or a viral vector.
벡터는 검출 대상 표적 핵산에 상보적으로 결합할 수 있는 가이드 RNA를 암호화하는 핵산 서열을 더 포함할 수 있다. 표적 핵산은 표적 DNA 또는 표적 RNA일 수 있고, 이중가닥 또는 단일가닥일 수 있다.The vector may further include a nucleic acid sequence encoding a guide RNA that can bind complementary to the target nucleic acid to be detected. The target nucleic acid may be target DNA or target RNA, and may be double-stranded or single-stranded.
가이드 RNA는 Cpf1에 의한 검출 대상 표적 핵산의 표적 가닥 내 표적 서열의 인식에 필요한 RNA 분자를 의미한다. 용어 표적 가닥은 가이드 RNA와 상호작용하여 가이드 RNA-DNA 하이브리드를 형성하는 핵산 가닥을 지칭한다. 비표적 가닥은 표적 가닥에 대해 상보적이다. Cpf1 단백질이 활성화 되어 핵산 가닥을 절단시, 특정 핵산 표적부위가 엔도뉴클레아제의 RuvC/NuC 포켓으로 변위될 수 있다. 가이드 RNA는 검출 대상 표적 핵산에 포함된 일부 뉴클레오티드 서열(표적 서열)을 표적할 수 있도록 설계될 수 있다. 가이드 RNA는 crRNA일 수 있다.Guide RNA refers to an RNA molecule required for recognition of the target sequence within the target strand of the target nucleic acid to be detected by Cpf1. The term target strand refers to the nucleic acid strand that interacts with the guide RNA to form a guide RNA-DNA hybrid. The non-target strand is complementary to the target strand. When the Cpf1 protein is activated and cleaves the nucleic acid strand, the specific nucleic acid target site may be displaced into the RuvC/NuC pocket of the endonuclease. Guide RNA can be designed to target some nucleotide sequences (target sequences) included in the target nucleic acid to be detected. The guide RNA may be crRNA.
Cpf1 변이 단백질에 대해서는 전술한 바 있어 구체적인 설명은 생략한다.Since the Cpf1 mutant protein has been described above, detailed description will be omitted.
또한, 본 발명은 Cpf1 변이 단백질 및 검출 대상 표적 핵산에 상보적으로 결합할 수 있는 가이드 RNA를 포함하는 복합체를 제공할 수 있다. 표적 핵산은 표적 DNA일 수 있다. 가이드 RNA는 crRNA일 수 있다. 가이드 RNA는 Cpf1에 의한 표적 가닥 내 표적 서열의 인식에 필요한 RNA 분자를 지칭한다.Additionally, the present invention can provide a complex containing a Cpf1 mutant protein and a guide RNA capable of binding complementary to a target nucleic acid to be detected. The target nucleic acid may be target DNA. The guide RNA may be crRNA. Guide RNA refers to the RNA molecule required for recognition of the target sequence within the target strand by Cpf1.
Cpf1은 적절한 crRNA와 회합되면 crRNA-Cpf1 복합체를 형성할 수 있다.Cpf1 can form a crRNA-Cpf1 complex when associated with an appropriate crRNA.
Cpf1 변이 단백질에 대해서는 전술한 바 있어 구체적인 설명은 생략한다.Since the Cpf1 mutant protein has been described above, detailed description will be omitted.
또한, 본 발명은 상기 Cpf1 변이 단백질, 상기 폴리뉴클레오티드, 상기 벡터 및 상기 복합체로 이루어진 군에서 선택된 적어도 하나를 포함하는 표적 핵산 검출용 키트를 제공할 수 있다.Additionally, the present invention can provide a kit for detecting a target nucleic acid containing at least one selected from the group consisting of the Cpf1 mutant protein, the polynucleotide, the vector, and the complex.
본 발명의 키트는 검출 대상인 표적 핵산에 대해 결합할 수 있는 가이드 RNA를 더 포함할 수 있다. 상기 가이드 RNA는 crRNA일 수 있다. 상기 결합은 상보적 결합일 수 있다. crRNA는 표적 서열을 높은 특이성으로 인식할 수 있다.The kit of the present invention may further include a guide RNA capable of binding to the target nucleic acid to be detected. The guide RNA may be crRNA. The bond may be a complementary bond. crRNA can recognize target sequences with high specificity.
본 발명의 키트는 ssDNA(single-stranded DNA)를 더 포함할 수 있다.The kit of the present invention may further include ssDNA (single-stranded DNA).
ssDNA는 적어도 하나의 상호작용 라벨 세트(예컨대 적어도 하나의 형광원(fluorophore) 및 적어도 하나의 소광물질(quencher)을 포함)로 라벨링되고, 상기 상호작용 라벨은 ssDNA의 절단시 신호를 제공하는 것일 수 있다.The ssDNA may be labeled with a set of at least one interacting label (e.g., comprising at least one fluorophore and at least one quencher), wherein the interacting label may provide a signal upon cleavage of the ssDNA. there is.
ssDNA는 라벨링된 ssDNA일 수 있다. 라벨링된 ssDNA는 ssDNA에 형광원, 소광물질 및 리포터 중 적어도 하나가 결합된 것일 수 있다.The ssDNA may be labeled ssDNA. Labeled ssDNA may be one in which at least one of a fluorescent source, a quencher, and a reporter is bound to ssDNA.
라벨링된 ssDNA가 Cpf1 변이 단백질에 의해 절단되면 발광 그룹이 발광할 수 있다. 본 발명의 Cpf1 변이 단백질은 라벨링된 ssDNA를 분해시킬 수 있고, 신호를 발생시킬 수 있다.When the labeled ssDNA is cleaved by the Cpf1 mutant protein, the luminescent group can emit light. The Cpf1 mutant protein of the present invention can degrade labeled ssDNA and generate a signal.
라벨링된 ssDNA가 절단된 후 검출 가능한 차이를 발생하는 한, 이론적으로 검출 가능한 다른 임의의 라벨링 방식을 적용할 수 있다. 라벨링된 ssDNA는 화합물과 결합한 후 형광을 방출하여 상기 라벨링된 ssDNA가 절단되었는지 여부를 탐지하도록 설계될 수 있다.As long as a detectable difference occurs after the labeled ssDNA is cut, any other labeling method that can theoretically be detected can be applied. Labeled ssDNA can be designed to emit fluorescence after binding to a compound to detect whether the labeled ssDNA has been cleaved.
키트는 표적 DNA 증폭을 위한 DNA 중합효소와 소정의 프라이머를 더 포함할 수 있다. DNA 증폭은 표적 핵산 내 표적 서열을 증폭시키는 것일 수 있고, 라벨링된 ssDNA가 분해되어 발생하는 신호의 세기를 보다 강화시켜 진단의 정확성을 높이기 위해 수행되는 것일 수 있다. DNA 증폭은 검출 대상 시료에 Cpf1 변이 단백질을 처리하는 단계 전에 수행되는 것일 수 있다.The kit may further include DNA polymerase and predetermined primers for amplifying target DNA. DNA amplification may be to amplify a target sequence within a target nucleic acid, or may be performed to increase the accuracy of diagnosis by further enhancing the intensity of the signal generated by decomposition of labeled ssDNA. DNA amplification may be performed before the step of treating the Cpf1 mutant protein in the sample to be detected.
한편, Cpf1 변이 단백질은 트랜스-절단 활성이 높아 표적 핵산 검출시 DNA 증폭 단계를 수행하지 않아도 효과적으로 표적 핵산을 검출할 수 있으며, DNA 증폭 단계를 거치더라도 증폭 시간을 적게 하더라도 표적 핵산을 검출할 수 있다. 이에, 검출 시간이나 비용적인 측면에서 장점을 나타낼 수 있다.Meanwhile, the Cpf1 mutant protein has high trans-cleavage activity, so it can effectively detect target nucleic acids without performing a DNA amplification step. Even if a DNA amplification step is performed, the target nucleic acid can be detected even with a short amplification time. . Accordingly, it can provide advantages in terms of detection time and cost.
전술한 것처럼 Cpf1 변이 단백질은 표적 핵산을 효과적으로 검출할 수 있으며, 이에 본 발명의 Cpf1 변이 단백질은 SNP 검출, 암 진단, 박테리아 감염 진단, 바이러스 감염 진단 등에 활용될 수 있다.As described above, the Cpf1 mutant protein can effectively detect target nucleic acids, and therefore, the Cpf1 mutant protein of the present invention can be used for SNP detection, cancer diagnosis, bacterial infection diagnosis, and viral infection diagnosis.
Cpf1 변이 단백질, Cpf1 변이 단백질을 암호화하는 폴리뉴클레오티드, 상기 벡터 및 상기 복합체에 대해서는 전술한 바 있어 구체적인 설명은 생략한다.Since the Cpf1 mutant protein, the polynucleotide encoding the Cpf1 mutant protein, the vector, and the complex have been described above, detailed descriptions will be omitted.
또한 본 발명은 Cpf1 변이 단백질을 이용한 표적 핵산 검출 방법을 제공할 수 있다.Additionally, the present invention can provide a method for detecting a target nucleic acid using a Cpf1 mutant protein.
표적 핵산 검출 방법은 시료에 Cpf1 변이 단백질, 상기 폴리뉴클레오티드, 상기 벡터 및 상기 복합체로 이루어진 군에서 선택된 적어도 하나를 처리하는 것을 포함할 수 있다. Cpf1 단백질은 단백질, 폴리뉴클레오티드, 벡터 및 가이드 RNA와의 복합체의 형태로 처리될 수 있다.The target nucleic acid detection method may include treating a sample with at least one selected from the group consisting of a Cpf1 mutant protein, the polynucleotide, the vector, and the complex. Cpf1 protein can be processed in the form of complexes with proteins, polynucleotides, vectors, and guide RNAs.
시료는 표적 핵산이 존재하는지 여부를 확인하고자 검출 대상 시료이다. 예를 들어 검출 대상 시료는 인간을 포함한 동물 또는 식물로부터 분리된 시료일 수 있으며, 이에 제한되지 않는다. 식물은 유전정보가 알려진 식물일 수 있다. 예컨대 인간을 포함한 동물로부터 분리된 혈액, 혈청, 소변, 타액, 피부, 식물조직 등일 수 있다. The sample is a sample to be detected to determine whether the target nucleic acid is present. For example, the sample to be detected may be a sample isolated from an animal, including a human, or a plant, but is not limited thereto. The plant may be a plant for which genetic information is known. For example, it may be blood, serum, urine, saliva, skin, plant tissue, etc. isolated from animals, including humans.
표적 핵산 검출 방법은 상기 시료에 상기 표적 핵산에 상보적으로 결합할 수 있는 가이드 RNA를 처리하는 것을 더 포함할 수 있다. 가이드 RNA는 상기 Cpf1 변이 단백질, 상기 폴리뉴클레오티드, 상기 벡터 및 상기 복합체로 이루어진 군에서 선택된 적어도 하나와 동시 또는 이시에 처리될 수 있다. 가이드 RNA는 검출 대상 표적 서열을 인식할 수 있는 서열로 이루어진 것일 수 있다. 가이드 RNA는 crRNA 일 수 있다. 가이드 RNA는 RNA 서열 또는 이를 암호화하는 벡터의 형태로 처리될 수 있다.The target nucleic acid detection method may further include treating the sample with a guide RNA capable of binding complementary to the target nucleic acid. The guide RNA may be processed simultaneously or simultaneously with at least one selected from the group consisting of the Cpf1 mutant protein, the polynucleotide, the vector, and the complex. The guide RNA may be composed of a sequence that can recognize the target sequence to be detected. The guide RNA may be crRNA. Guide RNA may be processed in the form of an RNA sequence or a vector encoding it.
표적 핵산 검출 방법은 상기 시료에 라벨링된 ssDNA를 처리하는 것을 더 포함할 수 있다. 라벨링된 ssDNA는 상기 Cpf1 변이 단백질, 상기 폴리뉴클레오티드, 상기 벡터 및 상기 복합체로 이루어진 군에서 선택된 적어도 하나와 동시 또는 이시에 처리될 수 있다.The target nucleic acid detection method may further include processing ssDNA labeled in the sample. The labeled ssDNA may be processed simultaneously or simultaneously with at least one selected from the group consisting of the Cpf1 mutant protein, the polynucleotide, the vector, and the complex.
표적 핵산 검출 방법은 표적 핵산의 존부, 수준 및/또는 농도를 결정하는 단계;를 더 포함할 수 있다. 표적 핵산의 존부, 수준 및/또는 농도를 결정하는 단계는 Cpf1 변이 단백질의 트랜스-절단 활성에 의해 라벨링된 ssDNA가 절단됨으로써 나타나는 신호 강도에 기초하여 결정될 수 있다.The target nucleic acid detection method may further include determining the presence, level, and/or concentration of the target nucleic acid. The step of determining the presence, level and/or concentration of the target nucleic acid may be determined based on the signal intensity resulting from cleavage of the labeled ssDNA by the trans-cleavage activity of the Cpf1 variant protein.
Cpf1 변이 단백질, Cpf1 변이 단백질을 암호화하는 폴리뉴클레오티드, 상기 벡터, 상기 복합체, 가이드 RNA 및 라벨링된 ssDNA에 대해서는 전술한 바 있어 구체적인 설명은 생략한다.The Cpf1 mutant protein, the polynucleotide encoding the Cpf1 mutant protein, the vector, the complex, guide RNA, and labeled ssDNA have been described above, and detailed descriptions thereof will be omitted.
상기 검출 대상 표적 핵산은 소정의 질환을 유발하는 핵산 단편일 수 있다. 예컨대 상기 검출 대상 표적 핵산은 질환을 유발하는 감염원의 게놈 핵산 단편일 수 있다.The target nucleic acid to be detected may be a nucleic acid fragment that causes a certain disease. For example, the target nucleic acid to be detected may be a genomic nucleic acid fragment of an infectious agent that causes a disease.
또한 본 발명은 Cpf1 변이 단백질을 이용한 질환의 진단 방법을 제공할 수 있다.Additionally, the present invention can provide a method for diagnosing diseases using the Cpf1 mutant protein.
질환은 증가된/감소된 유전자 발현 및/또는 외인성 유전자 물질의 존재와 연관된 임의의 질환일 수 있다. 질환은 감염성 질환일 수 있다.The disease may be any disease associated with increased/reduced gene expression and/or the presence of exogenous genetic material. The disease may be an infectious disease.
질환의 진단 방법은 진단 대상 개체로부터 분리된 시료에 Cpf1 변이 단백질, 상기 폴리뉴클레오티드, 상기 벡터 및 상기 복합체로 이루어진 군에서 선택된 적어도 하나를 처리하는 것을 포함할 수 있다. Cpf1 변이 단백질은 단백질, 폴리뉴클레오티드, 벡터 및/또는 복합체의 형태로 처리될 수 있다.A method for diagnosing a disease may include treating a sample isolated from an individual to be diagnosed with at least one selected from the group consisting of a Cpf1 mutant protein, the polynucleotide, the vector, and the complex. Cpf1 variant proteins can be processed in the form of proteins, polynucleotides, vectors, and/or complexes.
진단 대상 개체는 표적 핵산을 포함하거나 포함하는 것으로 의심되는 개체일 수 있다. 검출 대상 표적 핵산은 상기 질환을 유발하는 핵산 단편일 수 있다. 예컨대 상기 검출 대상 표적 핵산은 질환을 유발하는 감염원의 게놈 핵산 단편일 수 있다.The entity to be diagnosed may be an entity that contains or is suspected of containing the target nucleic acid. The target nucleic acid to be detected may be a nucleic acid fragment that causes the disease. For example, the target nucleic acid to be detected may be a genomic nucleic acid fragment of an infectious agent that causes a disease.
개체는 인간을 포함한 동물 또는 식물일 수 있고, 예컨대 동물은 인간, 개, 고양이, 토끼, 소, 말 또는 염소일 수 있다.The entity may be an animal, including a human, or a plant, for example, the animal may be a human, dog, cat, rabbit, cow, horse, or goat.
시료는 혈액, 혈청, 소변, 타액, 피부, 조직 등일 수 있으나, 이에 제한되지 않는다.Samples may be blood, serum, urine, saliva, skin, tissue, etc., but are not limited thereto.
질환의 진단 방법은 상기 시료에 상기 표적 핵산에 상보적으로 결합할 수 있는 가이드 RNA를 처리하는 것을 더 포함할 수 있다. 가이드 RNA는 상기 Cpf1 변이 단백질, 상기 폴리뉴클레오티드, 상기 벡터 및 상기 복합체로 이루어진 군에서 선택된 적어도 하나와 동시 또는 이시에 처리될 수 있다.The method for diagnosing a disease may further include treating the sample with a guide RNA that can bind complementary to the target nucleic acid. The guide RNA may be processed simultaneously or simultaneously with at least one selected from the group consisting of the Cpf1 mutant protein, the polynucleotide, the vector, and the complex.
가이드 RNA는 검출 대상 표적 서열을 인식할 수 있는 서열로 이루어진 것일 수 있다. 가이드 RNA는 crRNA 일 수 있다. 가이드 RNA는 RNA 서열 또는 이를 암호화하는 벡터의 형태로 처리될 수 있다.The guide RNA may be composed of a sequence that can recognize the target sequence to be detected. The guide RNA may be crRNA. Guide RNA may be processed in the form of an RNA sequence or a vector encoding it.
질환의 진단 방법은 상기 시료에 라벨링된 ssDNA를 처리하는 것을 더 포함할 수 있다. 라벨링된 ssDNA는 상기 Cpf1 변이 단백질, 상기 폴리뉴클레오티드, 상기 벡터 및 상기 복합체로 이루어진 군에서 선택된 적어도 하나와 동시 또는 이시에 처리될 수 있다.The method for diagnosing a disease may further include processing ssDNA labeled in the sample. The labeled ssDNA may be processed simultaneously or simultaneously with at least one selected from the group consisting of the Cpf1 mutant protein, the polynucleotide, the vector, and the complex.
질환의 진단 방법은 표적 핵산의 존부, 수준 및/또는 농도를 결정하는 단계;를 더 포함할 수 있다. 표적 핵산의 존부, 수준 및/또는 농도를 결정하는 단계는 Cpf1 변이 단백질의 트랜스-절단 활성에 의해 라벨링된 ssDNA가 절단됨으로써 나타나는 신호 강도에 기초하여 결정될 수 있다.The method for diagnosing a disease may further include determining the presence, level, and/or concentration of a target nucleic acid. The step of determining the presence, level and/or concentration of the target nucleic acid may be determined based on the signal intensity resulting from cleavage of the labeled ssDNA by the trans-cleavage activity of the Cpf1 variant protein.
표적 핵산의 검출 방법 및 질환의 진단 방법은 인간 또는 장치에 의해 수행될 수 있다.Methods for detecting target nucleic acids and diagnosing diseases can be performed by humans or devices.
Cpf1 변이 단백질, Cpf1 변이 단백질을 암호화하는 폴리뉴클레오티드, 상기 벡터, 상기 복합체, 가이드 RNA 및 라벨링된 ssDNA에 대해서는 전술한 바 있어 구체적인 설명은 생략한다.The Cpf1 mutant protein, the polynucleotide encoding the Cpf1 mutant protein, the vector, the complex, guide RNA, and labeled ssDNA have been described above, and detailed descriptions thereof will be omitted.
본 발명의 Cpf1 변이 단백질은 특정 표적 서열을 인식하고 자르는 시스-절단 활성 외에도 트랜스-절단 활성이 높아 ssDNA를 보다 신속하게 절단할 수 있고 강한 신호를 발생시킬 수 있다. 이에 본 발명의 Cpf1 변이 단백질은 표적 DNA 검출에 활용될 수 있다.The Cpf1 mutant protein of the present invention has a high trans-cutting activity in addition to cis-cutting activity that recognizes and cuts a specific target sequence, so it can cut ssDNA more quickly and generate a strong signal. Accordingly, the Cpf1 mutant protein of the present invention can be used to detect target DNA.
이하, 본 발명을 구체적으로 설명하기 위해 실시예를 들어 상세하게 설명하기로 한다.Hereinafter, the present invention will be described in detail with reference to examples.
실시예Example
본 발명자들은 야생형 LbCpf1 단백질의 DNA를 절단하는 효소 역할을 하는 도메인을 분석하고, 트랜스-절단 활성에 영향을 미칠 수 있는 부분을 탐색한 후 점 돌연변이(In site directed mutagenesis)를 통해 아미노산을 변경한 후 트랜스-절단 활성을 확인하였다.The present inventors analyzed the domain that acts as an enzyme that cleaves DNA of the wild-type LbCpf1 protein, searched for parts that may affect trans-cleavage activity, and changed amino acids through point mutation (In site directed mutagenesis). Trans-cleavage activity was confirmed.
1. Cpf1 변이 단백질 제조1. Preparation of Cpf1 mutant protein
(1) Cpf1 변이 단백질 디자인(1) Cpf1 mutant protein design
먼저, 단백질 3차 구조를 예측할 수 있는 RCSB PBD 데이터 베이스를 이용하여 야생형 LbCpf1 단백질의 구조를 분석하였다(도 1 참조). 야생형 LbCpf1 단백질의 구조 분석을 통해 표적 DNA 이중나선을 자르는 시스-절단(cis-cleavage)이 이루어지는 RuvC 근처의 TSL 도메인을 찾고, 이 부위에서 변이를 발생시킬 위치를 선정하였다. 구체적으로 해당 부위에서 표적 DNA의 결합이 불안정하게 하도록 하기 위해 비소수성 아미노산을 소수성 아미노산으로 교체할 수 있도록 설계하였다(DOI: 10.2210/pdb5XUT/pdb NDB: 5XUT). 구체적으로 야생형 LbCpf1 단백질에서 trans-cleavage activity에 영향을 줄 것으로 예상되는 위치의 아미노산이 소수성을 나타내면서 잔기 사이즈가 크지 않고 구조가 단순한 알라닌(Ala, A)으로 치환된 돌연변이를 디자인하였다. 또한, 야생형 LbCpf1 단백질에서 trans-cleavage activity에 영향을 줄 것으로 예상되는 위치의 아미노산이 알라닌 외에 다른 소수성 아미노산(소수성이 높은 순서대로 상위 4개: 이소류신(Ile, I), 페닐알라닌(Phe, F), 발린(Val,V), 또는 류신(Leu, L))으로 치환된 돌연변이를 디자인하였다.First, the structure of the wild-type LbCpf1 protein was analyzed using the RCSB PBD database, which can predict protein tertiary structure (see Figure 1). Through structural analysis of the wild-type LbCpf1 protein, the TSL domain near RuvC, where cis-cleavage occurs to cut the target DNA double helix, was found, and the location at which mutations would occur in this region was selected. Specifically, in order to destabilize the binding of the target DNA at the corresponding site, it was designed to replace non-hydrophobic amino acids with hydrophobic amino acids (DOI: 10.2210/pdb5XUT/pdb NDB: 5XUT). Specifically, a mutant was designed in which the amino acid at a position expected to affect trans-cleavage activity in the wild-type LbCpf1 protein was replaced with alanine (Ala, A), which is hydrophobic, has a small residue size, and has a simple structure. In addition, in the wild-type LbCpf1 protein, the amino acids at positions expected to affect trans-cleavage activity are other hydrophobic amino acids besides alanine (top 4 in order of increasing hydrophobicity: isoleucine (Ile, I), phenylalanine (Phe, F), Mutants substituted with valine (Val, V), or leucine (Leu, L)) were designed.
위와 같이 디자인된 다양한 LbCpf1 변이 단백질의 정보를 아래 표 2에 기재하였다.Information on the various LbCpf1 mutant proteins designed as above is listed in Table 2 below.
표 2에서 두 번째 열은 서열번호 1의 야생형 LbCpf1 서열을 기준으로 변이 위치와 아미노산의 변경을 표시한 것이다. 예를 들어, K1025A는 LbCpf1(서열번호 1) 서열의 1025번째 위치의 아미노산 라이신(K)이 알라닌(A)으로 치환된 변이를 의미하고, E1097A는 LbCpf1(서열번호 1) 서열의 1097번째 위치의 아미노산 글루탐산(E)이 알라닌(A)로 치환된 변이를 의미한다. 예컨대, 표 2에서 LbCpf1 변이 단백질 KK1025AA는 LbCpf1(서열번호 1) 서열의 1025번째 위치의 아미노산 라이신(K)이 알라닌(A)으로 치환되고, 1026번째 위치의 아미노산 라이신(K)이 알라닌(A)으로 치환된 변이 단백질이다. 또한 LbCpf1 변이 단백질 KK1025AA/KE1096AA 는 LbCpf1(서열번호 1) 서열의 1025, 1026 및 1096번째 아미노산이 모두 라이신(K)이 알라닌(A)으로 치환되고 1097번째 아미노산이 글루탐산(E)에서 알라닌(A)으로 치환된 변이 단백질이다. LbCpf1 변이 단백질 KK1025AA/KK1079AA/KE1096AA 는 LbCpf1(서열번호 1) 서열의 1025, 1026, 1079, 1080 및 1096번째 아미노산이 모두 라이신(K)이 알라닌(A)으로 치환되고 1097번째 아미노산이 글루탐산(E)에서 알라닌(A)으로 치환된 변이 단백질이다.The second column in Table 2 indicates the mutation position and amino acid change based on the wild-type LbCpf1 sequence of SEQ ID NO: 1. For example, K1025A refers to a mutation in which the amino acid lysine (K) at position 1025 of the LbCpf1 (SEQ ID NO: 1) sequence is replaced with alanine (A), and E1097A refers to a mutation at position 1097 of the LbCpf1 (SEQ ID NO: 1) sequence. It refers to a mutation in which the amino acid glutamic acid (E) is replaced with alanine (A). For example, in Table 2, in the LbCpf1 mutant protein KK1025AA, the amino acid lysine (K) at the 1025th position of the LbCpf1 (SEQ ID NO: 1) sequence is replaced with alanine (A), and the amino acid lysine (K) at the 1026th position is replaced with alanine (A). It is a mutant protein substituted with . In addition, the LbCpf1 mutant protein KK1025AA/KE1096AA has lysine (K) replaced with alanine (A) at amino acids 1025, 1026, and 1096 of the LbCpf1 (SEQ ID NO: 1) sequence, and amino acid 1097 substituted from glutamic acid (E) to alanine (A). It is a mutant protein substituted with . In the LbCpf1 mutant protein KK1025AA/KK1079AA/KE1096AA, lysine (K) is replaced with alanine (A) at amino acids 1025, 1026, 1079, 1080, and 1096 of the LbCpf1 (SEQ ID NO: 1) sequence, and amino acid 1097 is glutamic acid (E). It is a mutant protein substituted with alanine (A).
도 2 내지 9에 각 LbCpf1 변이 단백질의 3D 구조와 아미노산이 변이된 위치를 나타내었다.Figures 2 to 9 show the 3D structure and amino acid mutated positions of each LbCpf1 mutant protein.
(2) Cpf1 변이 단백질 생산을 위한 플라스미드 제작 (2) Construction of plasmid for producing Cpf1 mutant protein
비소수성 아미노산을 암호화하는 DNA 서열을 소수성 아미노산을 암호화하는 DNA 서열(알라닌: GCG, GCA, GCC, GCT/ 이소류신: ATA, ATC, ATT/페닐알라닌:TTT, TTC/ 발린:GTG, GTA, GTC, GTT/류신:TTG, TTA, CTT, CTC, CTA, CTG)로 치환할 수 있는 mutagenesis 용 primer를 설계하여 in site directed mutagenesis를 수행하였다(아래 표 3 참조).DNA sequences encoding non-hydrophobic amino acids can be compared to DNA sequences encoding hydrophobic amino acids (alanine: GCG, GCA, GCC, GCT/isoleucine: ATA, ATC, ATT/phenylalanine:TTT, TTC/valine:GTG, GTA, GTC, GTT / leucine: TTG, TTA, CTT, CTC, CTA, CTG) primers for mutagenesis that can be substituted were designed and in site directed mutagenesis was performed (see Table 3 below).
구체적으로 LbCpf1 야생형의 DNA 가 coding 되어 있는 pET28a-LbCpf1 plasmid DNA 를 template 로 하여 상기 디자인된 mutagenesis 용 primer 를 이용하여 PCR 을 수행하였다. 5X phusion GC 6ul, 10uM Forward primer 1ul, 100ng/ul plasmid 1ul, 10mM dNTPP 0.5ul, DMSO 1.5ul, D.W 를 총 30ul 를 맞춘 조건으로 98℃ 에서 5분 pre extension 반응 후 98℃ 에서 30초, 55℃에서 1분, 72℃ 에서 4분 30초를 1 사이클로 총 25 사이클을 연쇄반응 후 72℃ 에서 8분을 반응시켜 PCR 반응을 종결시켰다. 이후 DNA purification kit를 이용하여 PCR product 를 정제 후, Dpn1 enzyme 을 10ul 당 0.5ul 37℃ 에서 1시간 처리하여 mutation 을 포함하지 않은 원본 plasmid 를 제거하였다. 이어 E.coli DH5alpha competent cell 에 5ul 의 샘플을 넣어 30분 아이스 인큐베이션 한 후 42도에 1분 heat shock 을 준 후 kanamycin 이 100ug/ml 포함한 agar plate 에 도포하여 37도에 하루 배양하여 개별 콜로니를 발생시켰다. 각각의 plasmid DNA 를 정제하여 sequencing primer T7 promoter_Forward 5'- taatacgactcactataggg-3' (서열번호 18), LbCpf1 seq primer2 5'- GAGGATTTCTTTGAGGGCGAG-3' (서열번호 19), LbCpf1 seq primer3 5'- GGCAAGGAGACAAACAGGGA-3' (서열번호 20), LbCpf1 seq primer 4 5'- CCAGATAATCCCAAGAAAACC-3' (서열번호 21), LbCpf1 seq primer 5 5'- ATTCCAAGAAGTTCATCAGC-3'(서열번호 22) 로 시퀀싱하여 각 LbCpf1 변이 단백질 후보자들이 원하는 위치에서 아미노산이 변이되고, 그 외 다른 부위에서 변이가 발생하지 않았는지 확인하였다. 원하는 위치에서 아미노산이 변이되고 그 외 다른 부위에서 돌연변이가 발생하지 않은 LbCpf1 변이 단백질을 최종적으로 선정하였다. Specifically, PCR was performed using pET28a-LbCpf1 plasmid DNA, which encodes the DNA of LbCpf1 wild type, as a template, using the primers for mutagenesis designed above. 5X phusion GC 6ul, 10uM Forward primer 1ul, 100ng/ul plasmid 1ul, 10mM dNTPP 0.5ul, DMSO 1.5ul, D.W. Pre-extension reaction for 5 minutes at 98℃ with a total of 30ul, then 98℃ for 30 seconds, 55℃ After chain reaction for a total of 25 cycles of 1 minute at 72°C and 4 minutes and 30 seconds at 72°C, the PCR reaction was terminated by reacting at 72°C for 8 minutes. After purifying the PCR product using a DNA purification kit, the original plasmid that did not contain the mutation was removed by treating it with 0.5ul of Dpn1 enzyme per 10ul at 37°C for 1 hour. Then, 5ul of sample was added to E.coli DH5alpha competent cells, incubated on ice for 30 minutes, heat shocked at 42 degrees for 1 minute, applied to an agar plate containing 100ug/ml kanamycin, and incubated for one day at 37 degrees to generate individual colonies. I ordered it. Purify each plasmid DNA and sequence primer T7 promoter_Forward 5'- taatacgactcactataggg-3' (SEQ ID NO: 18), LbCpf1 seq primer2 5'- GAGGATTTCTTTGAGGGCGAG-3' (SEQ ID NO: 19), LbCpf1 seq primer3 5'- GGCAAGGAGACAAACAGGGA-3' (SEQ ID NO: 20), LbCpf1 seq primer 4 5'- CCAGATAATCCCAAGAAAACC-3' (SEQ ID NO: 21), LbCpf1 seq primer 5 5'- ATTCCAAGAAGTTCATCAGC-3' (SEQ ID NO: 22), and each LbCpf1 mutant protein candidate was located at the desired position. It was confirmed that the amino acid was mutated and that no mutation occurred in other areas. The LbCpf1 mutant protein in which the amino acid was mutated at the desired position and no mutation occurred at other sites was finally selected.
(3) Cpf1 변이 단백질의 정제(3) Purification of Cpf1 mutant protein
위 1.(2)에서 제작된 플라스미드를 각각 E.coli DE3 에 형질전환하였다. 50ug/ml 농도의 kanamycin 이 포함된 Lb broth 5ml에 각각의 콜로니를 접종하여 16시간 37℃ 220rpm 조건에서 shacking incubation 하여 1차 배양하고, 2차로 200ml Lb broth 에 1:10000 비율로 1차 배양물을 접종하여 약 5시간 동안 37℃ 220rpm 조건에서 OD600 값이 0.6 에 도달 할 때까지 배양하였다. OD600 0.6 에 도달한 시점에서 IPTG (Isopropyl β를 0.8mM 로 추가하여 단백질 발현을 유도하여 16℃ 220rpm 조건에서 16시간 이상 단백질을 발현시켰다. 단백질이 발현된 E.coli 는 centrifuge 를 이용하여 Lb broth 를 제거하고 튜브에 모아주고, 50mM NaH2PO4, 300mM NaCl, 10mM imidazole, 2mg/ml lysozyme, 1mM PMSF pH7.4 성분의 lysis buffer 를 이용하여 resuspension 하였다. 이후 15초씩 on/off 사이클로 3번 15% amplification 세기로 Sonication 처리하여 세포막을 깨어 주고 centrifuge 를 이용하여 E.coli 잔여물을 가라앉힌 뒤, 상층액을 모아 Ni-NTA Agarose bead 와 섞어 4℃ 에서 1시간 동안 반응시켜 agarose bead-protein 복합체를 형성하였다. 이후 gravity column 에 위의 복합체가 포함된 lysate 를 넣어 flow through 를 제거해 준 뒤, lysis buffer 10ml을 한번 더 흘려주어 비특이적으로 결합할 수 있는 물질들을 제거하였다. bead 에서 단백질만 분리하기위해 NaH2PO4 50mM, 300mM NaCl, 250mM imidazole, pH7.4 조건의 elution buffer 3ml를 column 에 넣고 column 에서 추출되는 용액을 받아 centricon 에 centrifuge 하여 단백질을 수득하였다. 100mM HEPES, 150mM NaCl, 0.1mM EDTA, 1mM DTT, 2% sucrose, 20% glycerol 이 포함된 저장용액으로 버퍼를 교체하고 농도를 측정하였다. 각 Cpf1 변이 단백질의 발현을 확인한 결과를 도 10 내지 도 11에 나타내었다.The plasmids prepared in step 1.(2) above were each transformed into E.coli DE3. Each colony was inoculated into 5ml of Lb broth containing kanamycin at a concentration of 50ug/ml and incubated for primary culture by shaking incubation at 37°C and 220rpm for 16 hours. Second, the primary culture was inoculated into 200ml Lb broth at a ratio of 1:10000. The cells were inoculated and cultured at 37°C and 220rpm for about 5 hours until the OD600 value reached 0.6. When the OD600 reached 0.6, protein expression was induced by adding 0.8mM of IPTG (Isopropyl β) and the protein was expressed for more than 16 hours at 16°C and 220rpm. E.coli with the expressed protein was cultured in Lb broth using a centrifuge. Remove, collect in a tube, and resuspend using lysis buffer containing 50mM NaH 2 PO 4 , 300mM NaCl, 10mM imidazole, 2mg/ml lysozyme, and 1mM PMSF pH 7.4. Afterwards, 15% on/off cycle 3 times for 15 seconds each. Sonicate at amplification intensity to break the cell membrane, settle the E. coli residues using a centrifuge, collect the supernatant, mix with Ni-NTA Agarose beads, and react at 4°C for 1 hour to form an agarose bead-protein complex. Afterwards, the lysate containing the above complex was added to the gravity column to remove flow through, and then 10ml of lysis buffer was flowed once more to remove substances that could bind non-specifically. NaH 2 was added to separate only the proteins from the beads. 3ml of elution buffer with 50mM PO 4 , 300mM NaCl, 250mM imidazole, pH 7.4 was added to the column, and the solution extracted from the column was centrifuged on centricon to obtain protein: 100mM HEPES, 150mM NaCl, 0.1mM EDTA, 1mM DTT. , the buffer was replaced with a storage solution containing 2% sucrose and 20% glycerol, and the concentration was measured. The results of confirming the expression of each Cpf1 mutant protein are shown in Figures 10 and 11.
2. Cpf1 변이 단백질의 시스-절단 활성 분석2. Analysis of cis-cleavage activity of Cpf1 mutant protein
본 발명자들은 위 1에서 제조한 LbCpf1 변이 단백질이 표적 DNA를 절단하는 능력을 유지하는지 확인하기 위해 아래와 같이 시스-절단 분석을 수행하였다(도 12 및 13 참조).The present inventors performed a cis-cleavage analysis as follows to confirm whether the LbCpf1 mutant protein prepared in 1 above maintains the ability to cleave target DNA (see Figures 12 and 13).
구체적으로, RNP (변이 protein: crRNA) 복합체를 형성하기 위하여, 100mM NaCl, 10mM MgCl2, 1mM DTT, 10mM Tris-Cl pH7.4 조건에서 DNMT1 유전자를 표적으로 하는 crRNA(서열번호 23: 5'- AAUUUCUACUAAGUGUAGAUCUGAUGGUCCAUGUCUGUUACUC-3') 200nM와 전술한 변이 단백질 200nM 을 37℃ 에서 5분간 우선 반응시켰다. substrate로서 DNMT1 유전자의 51bp DNA 조각(target strand(서열번호 24): 5'-CACTTGACAGGCGAGTAACAGACATGGACCATCAGGAAACATTAACGTACT-3', non-target strand(서열번호 25): 5'-GTGAACTGTCCGCTCATTGTCTGTACCTGGTAGTCCTTTGTAATTGCATGA-3')을 Cy5 형광단백질로 라벨링하였다.Specifically, to form an RNP (mutated protein: crRNA) complex, crRNA targeting the DNMT1 gene (SEQ ID NO: 23: 5'- 200 nM of AAUUUCUACUAAGUGUAGAUCUGAUGGUCCAUGUCUGUUACUC-3') and 200 nM of the above-mentioned mutant protein were first reacted at 37°C for 5 minutes. As a substrate, a 51bp DNA fragment of the DNMT1 gene (target strand (SEQ ID NO: 24): 5'-CACTTGACAGGCGAGTAACAGACATGGACCATCAGGAAACATTAACGTACT-3', non-target strand (SEQ ID NO: 25): 5'-GTGAACTGTCCGCTCATTGTCTGTACCTGGTAGTCCTTTGTAATTGCATGA-3') was labeled with Cy5 fluorescent protein. .
상기 복합체(변이 단백질:crRNA=200nM:200nM)에 annealing한 substrate를 최종 반응농도 20nM 이 되도록 첨가하여 37℃ 에서 10분간 반응시켰다. 반응 후 얻어진 물질을 10% TBE-UREA PAGE gel 에 로딩하고 크기를 확인하였다.target strand는 13nt, non-target strand는 18nt의 크기를 나타냈으며, 이는 상기 substrate가 상기 복합체에 의해 잘린 것을 의미한다. 본 실험 결과를 통해 본 발명의 변이 단백질이 모두 시스 활성을 나타내는 것을 확인하였다.The annealed substrate was added to the complex (mutant protein:crRNA=200nM:200nM) to a final reaction concentration of 20nM and reacted at 37°C for 10 minutes. After the reaction, the obtained material was loaded onto a 10% TBE-UREA PAGE gel and the size was confirmed. The target strand had a size of 13 nt, and the non-target strand had a size of 18 nt, which means that the substrate was cut by the complex. Through the results of this experiment, it was confirmed that all mutant proteins of the present invention exhibited cis activity.
3. Cpf1 변이 단백질의 트랜스-절단 활성 분석3. Trans-cleavage activity analysis of Cpf1 mutant protein
본 발명자들은 위 1에서 제조한 LbCpf1 변이 단백질이 야생형 LbCpf1 단백질에 비해 얼마나 개선된 트랜스-절단 활성을 갖는지 확인하기 위해 아래와 같이 트랜스-절단 분석을 수행하였다(도 14 및 15 참조).The present inventors performed a trans-cleavage analysis as follows to determine how much the LbCpf1 mutant protein prepared in step 1 above has improved trans-cleavage activity compared to the wild-type LbCpf1 protein (see Figures 14 and 15).
구체적으로, 100mM NaCl, 10mM MgCl2, 1mM DTT, 10mM Tris-Cl pH7.4 조건에서 1uM crRNA, 1uM 변이 단백질 및 100nM DNMT1 DNA를, 37℃에서 10분간 시스 절단을 수행한 뒤, 이 반응물을 96well 차광 플레이트에 10ul씩 분주하였다. 리포터(reporter) 분자(5'-BHQ-TTTTTTTT(서열번호 26)-FAM-3')를 125nM 농도로 시스 절단 반응과 같은 버퍼 조건에서 준비하였다. 준비된 리포터 분자를 40ul 씩 각각의 웰에 추가 하여 최종적으로 RNP, DNMT1 DNA substrate 및 리포터 분자를 다음과 같은 농도로 만들어주었다; 변이 단백질: crRNA: DNMT1 DNA substrate: 리포터 분자=200nM:200nM:20nM:100nM. 그 후 spectrometer 장비에서 494nm excitation 시킨 후, 30초마다 한번씩 30분동안 515nm emission 값을 측정하였고, 측정된 값들을 graph pad 프로그램을 이용하여 그래프로 나타내었다. 도 14 및 15에 나타난 것처럼 KTK1015ATA 및 RIR1071AIA 을 제외한 변이 단백질은 야생형 보다 trans-cleavage 기능이 증진된 것을 확인하였다.Specifically, cis-cleavage was performed on 1uM crRNA, 1uM mutant protein, and 100nM DNMT1 DNA at 37°C for 10 minutes under conditions of 100mM NaCl, 10mM MgCl 2 , 1mM DTT, 10mM Tris-Cl pH 7.4, and then the reaction was placed in a 96 well. 10ul each was dispensed onto a light-shielding plate. The reporter molecule (5'-BHQ-TTTTTTTT (SEQ ID NO: 26)-FAM-3') was prepared at a concentration of 125 nM under the same buffer conditions as the cis cleavage reaction. 40ul of the prepared reporter molecule was added to each well, and the final concentrations of RNP, DNMT1 DNA substrate, and reporter molecule were as follows; Mutant protein: crRNA: DNMT1 DNA substrate: Reporter molecule=200nM:200nM:20nM:100nM. Afterwards, after 494nm excitation in the spectrometer equipment, the 515nm emission value was measured once every 30 seconds for 30 minutes, and the measured values were displayed in a graph using the graph pad program. As shown in Figures 14 and 15, it was confirmed that the trans-cleavage function of the mutant proteins except KTK1015ATA and RIR1071AIA was enhanced compared to the wild type.
4. Cpf1 변이 단백질을 이용한 측면 흐름 분석4. Lateral flow analysis using Cpf1 mutant protein
본 발명자들은 위 1에서 제조한 LbCpf1 변이 단백질 중 트랜스-절단 활성이 우수한 변이 단백질을 이용해 측면 흐름 분석(Lateral flow assay, LFA)을 수행하였다 (도 16 참조).The present inventors performed a lateral flow assay (LFA) using a mutant protein with excellent trans-cleavage activity among the LbCpf1 mutant proteins prepared in step 1 above (see FIG. 16).
구체적으로, 100mM NaCl, 10mM MgCl2, 1mM DTT, 10mM Tris-Cl pH7.4 조건 에서 1uM crRNA, 1uM 변이 단백질, 100nM DNMT1 DNA 농도로 10ul 부피에서 37℃ 10분간 시스 절단을 수행한 뒤, 같은 버퍼 조건에서 10uM의 리포터 분자(5'-Biotin-TTTTTTTT(서열번호 26)-FAM-3') 를 0.5uM 농도로 10ul 만들어 시스 절단이 수행된 샘플에 추가하여 같은 온도에서 30분간 트랜스 절단을 수행하였다. 트랜스 절단이 수행된 샘플에 1X hybrid buffer 를 80ul 더하여 리포터 분자의 농도가 50pM가 되도록 맞추었고, 이를 Milenia Genline Dipsticks (Milenia Biotec, Germany, Cat. MGDS) 의 샘플 반응부위에 적셔 테스트 라인의 보라색을 확인하였다. 도 16에 나타난 것처럼, 야생형 단백질을 사용한 샘플에 비해 본 발명의 변이 단백질을 사용한 샘플은 lfa 키트에서 뚜렷한 시그널을 나타내었다. 특히 야생형 단백질을 사용한 샘플과 달리 본 발명의 변이 단백질을 사용한 샘플은 lfa 키트에 적용한지 5분 내에 강한 시그널을 나타내었으며, 이를 통해 본 발명의 변이 단백질을 신속 진단에 활용할 수 있음을 확인하였다.Specifically, cis cleavage was performed at 37°C for 10 minutes at 37°C in a 10ul volume with 1uM crRNA, 1uM mutant protein, and 100nM DNMT1 DNA under 100mM NaCl, 10mM MgCl2, 1mM DTT, 10mM Tris-Cl pH 7.4 conditions, and then under the same buffer conditions. 10ul of 10uM reporter molecule (5'-Biotin-TTTTTTTT (SEQ ID NO: 26)-FAM-3') at a concentration of 0.5uM was added to the cis-cleaved sample, and trans-cleavage was performed at the same temperature for 30 minutes. Add 80 ul of 1 did. As shown in Figure 16, compared to the sample using the wild-type protein, the sample using the mutant protein of the present invention showed a distinct signal in the lfa kit. In particular, unlike samples using the wild-type protein, samples using the mutant protein of the present invention showed a strong signal within 5 minutes of application to the lfa kit, confirming that the mutant protein of the present invention can be used for rapid diagnosis.
5. AsCpf1 변이 단백질의 트랜스-절단 활성 분석5. Trans-cleavage activity analysis of AsCpf1 mutant protein
(1) AsCpf1 변이 단백질 제조(1) Preparation of AsCpf1 mutant protein
위 1.의 방법과 유사한 방법으로 야생형 AsCpf1의 서열(서열번호 2)에서 몇몇 아미노산 서열이 변이된 AsCpf1 변이 단백질을 디자인하고 제조하였다. 구체적으로 아래 실험에 사용된 AsCpf1 변이 단백질의 정보를 아래 표 4에 기재하였다. 각 변이 단백질들에서 변이 위치를 도 17에 한번에 나타내었다.An AsCpf1 mutant protein in which several amino acid sequences were mutated from the sequence of wild-type AsCpf1 (SEQ ID NO: 2) was designed and produced in a similar manner to the method in 1 above. Specifically, information on the AsCpf1 mutant protein used in the experiments below is listed in Table 4 below. The location of mutations in each mutant protein is shown in Figure 17.
MTQFEGFTNLYQVSKTLRFELIPQGKTLKHIQEQGFIEEDKARNDHYKELKPIIDRIYKTYADQCLQLVQLDWENLSAAIDSYRKEKTEETRNALIEEQATYRNAIHDYFIGRTDNLTDAINKRHAEIYKGLFKAELFNGKVLKQLGTVTTTEHENALLRSFDKFTTYFSGFYENRKNVFSAEDISTAIPHRIVQDNFPKFKENCHIFTRLITAVPSLREHFENVKKAIGIFVSTSIEEVFSFPFYNQLLTQTQIDLYNQLLGGISREAGTEKIKGLNEVLNLAIQKNDETAHIIASLPHRFIPLFKQILSDRNTLSFILEEFKSDEEVIQSFCKYKTLLRNENVLETAEALFNELNSIDLTHIFISHKKLETISSALCDHWDTLRNALYERRISELTGKITKSAKEKVQRSLKHEDINLQEIISAAGKELSEAFKQKTSEILSHAHAALDQPLPTTLKKQEEKEILKSQLDSLLGLYHLLDWFAVDESNEVDPEFSARLTGIKLEMEPSLSFYNKARNYATKKPYSVEKFKLNFQMPTLASGWDVNKEKNNGAILFVKNGLYYLGIMPKQKGRYKALSFEPTEKTSEGFDKMYYDYFPDAAKMIPKCSTQLKAVTAHFQTHTTPILLSNNFIEPLEITKEIYDLNNPEKEPKKFQTAYAKKTGDQKGYREALCKWIDFTRDFLSKYTKTTSIDLSSLRPSSQYKDLGEYYAELNPLLYHISFQRIAEKEIMDAVETGKLYLFQIYNKDFAKGHHGKPNLHTLYWTGLFSPENLAKTSIKLNGQAELFYRPKSRMKRMAHRLGEKMLNKKLKDQKTPIPDTLYQELYDYVNHRLSHDLSDEARALLPNVITKEVSHEIIKDRRFTSDKFFFHVPITLNYQAANSPSKFNQRVNAYLKEHPETPIIGIDRGERNLIYITVIDSTGKILEQRSLNTIQQFDYQKKLDNREKERVAARQAWSVVGTIKDLKQGYLSQVIHEIVDLMIHYQAVVVLENLNFGFKSKRTGIAEKAVYQQFEKMLIDKLNCLVLKDYPAEKVGGVLNPYQLTDQFTSFAKMGTQSGFLFYVPAPYTSKIDPLTGFVDPFVWKTIKNHESRKHFLEGFDFLHYDVKTGDFILHFKMNRNLSFQRGLPGFMPAWDIVFEKNETQFDAKGTPFIAGKRIVPVIENHRFTGRYRDLYPANELIALLEEKGIVFRDGSNILPKLLENDDSHAIDTMVALIRSVLQMRNSNAATGEDYINSPVRDLNGVCFDSRFQNPEWPMDADANGAYHIALKGQLLLNHLKESKDLKLQNGISNQDWLAYIQELRNSEQ ID NO: 2:
(2) AsCpf1 변이 단백질의 트랜스-절단 활성 분석(2) Trans-cleavage activity analysis of AsCpf1 mutant protein
위 3.의 방법과 유사하게 위 5.(1)에서 제조한 AsCpf1 변이 단백질의 트랜스-절단 활성을 확인하였다 (도 18 참조). 그 결과, LbCpf1 변이 단백질과 달리 AsCpf1 변이 단백질은 야생형 AsCpf1 단백질과 유사하거나 낮은 트랜스-절단 활성을 나타내었다. Similar to the method in 3. above, the trans-cleavage activity of the AsCpf1 mutant protein prepared in 5.(1) above was confirmed (see FIG. 18). As a result, unlike the LbCpf1 mutant protein, the AsCpf1 mutant protein showed similar or lower trans-cleavage activity than the wild-type AsCpf1 protein.
Claims (11)
A Cpf1 mutant protein in which at least one of amino acids 1025, 1026, 1032, 1033, 1050, 1061, 1062, 1079, 1080, 1096, 1097, 1101, 1120, and 1121 of the LbCpf1 ( Lachnospiraceae bacterium Cpf1) protein is mutated.
The method of claim 1, wherein in the Cpf1 mutant protein, at least one of amino acids 1025, 1026, 1032, 1033, 1050, 1061, 1062, 1079, 1080, 1096, 1097, 1101, 1120, and 1121 of the LbCpf1 protein is each independently A Cpf1 mutant protein substituted with a hydrophobic amino acid selected from the group consisting of alanine, isoleucine, phenylalanine, valine and leucine.
The method according to claim 1, wherein the Cpf1 mutant protein is one in which i) the amino acids K1025 and K1026 of the LbCpf1 protein are substituted with alanine; ii) the amino acids at D1032 and R1033 are replaced with alanine; iii) the amino acid at K1050 is replaced with alanine; iv) the amino acids at K1061 and K1062 are replaced with alanine; v) the amino acids at K1079 and K1080 are replaced with alanine; vi) the amino acids of K1096 and E1097 are substituted with hydrophobic amino acids selected from the group consisting of alanine, isoleucine, phenylalanine, valine and leucine; vii) the amino acid of K1101 is replaced with alanine; viii) the amino acids D1120 and K1121 are substituted with alanine; ix) the amino acids K1025, K1026, K1079 and K1080 are substituted with alanine; x) the amino acids K1025, K1026, K1096 and E1097 are replaced with alanine; xi) the amino acids K1079, K1080, K1096 and E1097 are substituted with alanine; or xii) a Cpf1 mutant protein in which the amino acids K1025, K1026, K1079, K1080, K1096 and E1097 are substituted with alanine.
The method according to claim 1, wherein the LbCpf1 protein is a Cpf1 mutant protein having the sequence of SEQ ID NO: 1.
A polynucleotide encoding the Cpf1 mutant protein of claim 1.
A vector containing a polynucleotide encoding the Cpf1 mutant protein of claim 1.
A complex comprising the Cpf1 mutant protein of claim 1 and a guide RNA capable of complementary binding to a target nucleic acid.
A kit for detecting a target nucleic acid comprising at least one of the Cpf1 mutant protein of any one of claims 1 to 4, the polynucleotide of claim 5, the vector of claim 6, and the complex of claim 7.
The kit for detecting a target nucleic acid according to claim 8, further comprising at least one of guide RNA or labeled ssDNA capable of binding complementary to the target nucleic acid.
A method for detecting a target nucleic acid comprising treating a sample with at least one of the Cpf1 mutant protein of any one of claims 1 to 4, the polynucleotide of claim 5, the vector of claim 6, and the complex of claim 7.
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020220028748 | 2022-03-07 | ||
KR20220028748 | 2022-03-07 |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20230132341A true KR20230132341A (en) | 2023-09-15 |
Family
ID=88017403
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020220090185A Pending KR20230132341A (en) | 2022-03-07 | 2022-07-21 | Cpf1 mutant protein for rapid DNA diagnosis |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR20230132341A (en) |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20200132924A (en) | 2018-03-14 | 2020-11-25 | 에디타스 메디신, 인코포레이티드 | Systems and methods for the treatment of hemoglobinosis |
-
2022
- 2022-07-21 KR KR1020220090185A patent/KR20230132341A/en active Pending
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20200132924A (en) | 2018-03-14 | 2020-11-25 | 에디타스 메디신, 인코포레이티드 | Systems and methods for the treatment of hemoglobinosis |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US12104204B2 (en) | Use of high-temperature-resistant Cas protein, and method and reagent kit for detecting target nucleic acid molecule | |
JP7210203B2 (en) | Method for multiplexing recombinase polymerase amplification | |
CN109055499B (en) | Isothermal nucleic acid detection method and kit based on CRISPR-Cas | |
EP0850315B1 (en) | Detection of mismatches by resolvase cleavage using a magnetic bead support | |
US5877280A (en) | Thermostable muts proteins | |
US7282328B2 (en) | Helicase dependent amplification of nucleic acids | |
US5646019A (en) | Method for producing primed nucleic acid templates | |
US20100075384A1 (en) | Helicase-dependent amplification of circular nucleic acids | |
US20220267847A1 (en) | Crispr multi-target detection method and test kit therefor | |
CN1319142A (en) | Zymogenic nucleic acid detection method, and related molecules and kits | |
US10227660B2 (en) | Strand-invasion based DNA amplification method | |
JP2011510630A (en) | Use of a nucleic acid probe to detect a nucleotide sequence of interest present in a sample | |
WO1998001562A1 (en) | Thermostable mutl genes and proteins and uses therefor | |
US6136533A (en) | Additives for use in cycling probe reactions | |
US20170369941A1 (en) | Method and product | |
KR20140071968A (en) | Methods, systems, and compositions for detection of microbial dna by pcr | |
KR20230132341A (en) | Cpf1 mutant protein for rapid DNA diagnosis | |
JP2007195421A (en) | Primer for detecting metallo-β-lactamase gene, method for detecting metallo-β-lactamase gene, and method for detecting β-lactam drug resistant bacteria | |
US7094542B2 (en) | Detection of rpoB sequences of Mycobacterium tuberculosis | |
JP2008283891A (en) | Method for detecting and cloning double-stranded nucleic acid | |
JP2000308489A (en) | Detection of dna having micromutation | |
JP2004033090A (en) | Method for detecting vibrio vulnificus | |
JP2001346589A (en) | Polynucleotide specific to hads-degrading microorganism and method for detecting and quantitatively determining hads-degrading microorganism using the polynucleotide | |
AU2490401A (en) | Amplifying and detecting target nucleic acids using a post amplification incubation step |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PA0109 | Patent application |
Patent event code: PA01091R01D Comment text: Patent Application Patent event date: 20220721 |
|
PA0201 | Request for examination | ||
PG1501 | Laying open of application | ||
E902 | Notification of reason for refusal | ||
PE0902 | Notice of grounds for rejection |
Comment text: Notification of reason for refusal Patent event date: 20241129 Patent event code: PE09021S01D |