KR102515727B1 - Composition and method for inserting specific nucleic acid sequence into target nucleic acid using overlapping guide nucleic acid - Google Patents
Composition and method for inserting specific nucleic acid sequence into target nucleic acid using overlapping guide nucleic acid Download PDFInfo
- Publication number
- KR102515727B1 KR102515727B1 KR1020180003981A KR20180003981A KR102515727B1 KR 102515727 B1 KR102515727 B1 KR 102515727B1 KR 1020180003981 A KR1020180003981 A KR 1020180003981A KR 20180003981 A KR20180003981 A KR 20180003981A KR 102515727 B1 KR102515727 B1 KR 102515727B1
- Authority
- KR
- South Korea
- Prior art keywords
- nucleic acid
- sequence
- guide
- composition
- target
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 150000007523 nucleic acids Chemical group 0.000 title claims abstract description 394
- 102000039446 nucleic acids Human genes 0.000 title claims abstract description 328
- 108020004707 nucleic acids Proteins 0.000 title claims abstract description 328
- 239000000203 mixture Substances 0.000 title claims abstract description 68
- 108091028043 Nucleic acid sequence Proteins 0.000 title claims abstract description 61
- 238000000034 method Methods 0.000 title claims abstract description 23
- 230000000295 complement effect Effects 0.000 claims description 59
- 108091033409 CRISPR Proteins 0.000 claims description 44
- 210000004027 cell Anatomy 0.000 claims description 31
- 108020005004 Guide RNA Proteins 0.000 claims description 20
- 108091028113 Trans-activating crRNA Proteins 0.000 claims description 18
- 230000008685 targeting Effects 0.000 claims description 12
- 108091079001 CRISPR RNA Proteins 0.000 claims description 6
- 241000193996 Streptococcus pyogenes Species 0.000 claims description 4
- 101000910035 Streptococcus pyogenes serotype M1 CRISPR-associated endonuclease Cas9/Csn1 Proteins 0.000 claims description 4
- 210000003527 eukaryotic cell Anatomy 0.000 claims description 2
- 210000001236 prokaryotic cell Anatomy 0.000 claims description 2
- 241000206602 Eukaryota Species 0.000 claims 1
- 238000005516 engineering process Methods 0.000 abstract description 18
- 108090000623 proteins and genes Proteins 0.000 description 122
- 102000004169 proteins and genes Human genes 0.000 description 55
- 108091027544 Subgenomic mRNA Proteins 0.000 description 45
- 125000003729 nucleotide group Chemical group 0.000 description 31
- 239000002773 nucleotide Substances 0.000 description 30
- 238000010586 diagram Methods 0.000 description 24
- 238000003780 insertion Methods 0.000 description 16
- 230000037431 insertion Effects 0.000 description 16
- 238000003205 genotyping method Methods 0.000 description 15
- 238000004458 analytical method Methods 0.000 description 14
- 210000002257 embryonic structure Anatomy 0.000 description 14
- 108020004414 DNA Proteins 0.000 description 13
- 102000053602 DNA Human genes 0.000 description 12
- 238000013461 design Methods 0.000 description 12
- 239000013598 vector Substances 0.000 description 12
- 241000699666 Mus <mouse, genus> Species 0.000 description 11
- 101150071105 Morc2a gene Proteins 0.000 description 10
- 238000002474 experimental method Methods 0.000 description 10
- 108090000790 Enzymes Proteins 0.000 description 9
- 102000004190 Enzymes Human genes 0.000 description 9
- 101150025199 Upf1 gene Proteins 0.000 description 9
- 210000002459 blastocyst Anatomy 0.000 description 9
- 238000012350 deep sequencing Methods 0.000 description 9
- 230000035772 mutation Effects 0.000 description 9
- 101150078577 Adora2b gene Proteins 0.000 description 7
- 101150044214 Srebf1 gene Proteins 0.000 description 7
- 238000010457 gene scissor Methods 0.000 description 7
- 229920002477 rna polymer Polymers 0.000 description 7
- 101100219625 Mus musculus Casd1 gene Proteins 0.000 description 6
- 101150047500 TERT gene Proteins 0.000 description 6
- 150000001413 amino acids Chemical class 0.000 description 6
- 101150055766 cat gene Proteins 0.000 description 6
- 238000012790 confirmation Methods 0.000 description 6
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical compound NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 description 6
- 238000010362 genome editing Methods 0.000 description 6
- 229910052739 hydrogen Inorganic materials 0.000 description 6
- 239000001257 hydrogen Substances 0.000 description 6
- RWQNBRDOKXIBIV-UHFFFAOYSA-N thymine Chemical compound CC1=CNC(=O)NC1=O RWQNBRDOKXIBIV-UHFFFAOYSA-N 0.000 description 6
- 241000699670 Mus sp. Species 0.000 description 5
- 238000012217 deletion Methods 0.000 description 5
- 230000037430 deletion Effects 0.000 description 5
- 239000013615 primer Substances 0.000 description 5
- 239000002987 primer (paints) Substances 0.000 description 5
- 239000000126 substance Substances 0.000 description 5
- 238000010354 CRISPR gene editing Methods 0.000 description 4
- 241000196324 Embryophyta Species 0.000 description 4
- 108091092584 GDNA Proteins 0.000 description 4
- ISAKRJDGNUQOIC-UHFFFAOYSA-N Uracil Chemical compound O=C1C=CNC(=O)N1 ISAKRJDGNUQOIC-UHFFFAOYSA-N 0.000 description 4
- 238000007796 conventional method Methods 0.000 description 4
- 230000001404 mediated effect Effects 0.000 description 4
- 108020004999 messenger RNA Proteins 0.000 description 4
- 102000040430 polynucleotide Human genes 0.000 description 4
- 108091033319 polynucleotide Proteins 0.000 description 4
- 239000002157 polynucleotide Substances 0.000 description 4
- 238000012163 sequencing technique Methods 0.000 description 4
- 239000004055 small Interfering RNA Substances 0.000 description 4
- 241000894007 species Species 0.000 description 4
- RYYWUUFWQRZTIU-UHFFFAOYSA-K thiophosphate Chemical compound [O-]P([O-])([O-])=S RYYWUUFWQRZTIU-UHFFFAOYSA-K 0.000 description 4
- 229930024421 Adenine Natural products 0.000 description 3
- -1 Csm2 Proteins 0.000 description 3
- 241000581650 Ivesia Species 0.000 description 3
- 241001465754 Metazoa Species 0.000 description 3
- 101100047461 Rattus norvegicus Trpm8 gene Proteins 0.000 description 3
- 241000187191 Streptomyces viridochromogenes Species 0.000 description 3
- 229960000643 adenine Drugs 0.000 description 3
- 238000005520 cutting process Methods 0.000 description 3
- 229940104302 cytosine Drugs 0.000 description 3
- 230000034431 double-strand break repair via homologous recombination Effects 0.000 description 3
- 230000003993 interaction Effects 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 229920000642 polymer Polymers 0.000 description 3
- 229940113082 thymine Drugs 0.000 description 3
- 241000007910 Acaryochloris marina Species 0.000 description 2
- 241001135192 Acetohalobium arabaticum Species 0.000 description 2
- GFFGJBXGBJISGV-UHFFFAOYSA-N Adenine Chemical compound NC1=NC=NC2=C1N=CN2 GFFGJBXGBJISGV-UHFFFAOYSA-N 0.000 description 2
- 241000147155 Ammonifex degensii Species 0.000 description 2
- 241000620196 Arthrospira maxima Species 0.000 description 2
- 240000002900 Arthrospira platensis Species 0.000 description 2
- 235000016425 Arthrospira platensis Nutrition 0.000 description 2
- 241000823281 Burkholderiales bacterium Species 0.000 description 2
- 238000011740 C57BL/6 mouse Methods 0.000 description 2
- 101150018129 CSF2 gene Proteins 0.000 description 2
- 241001496650 Candidatus Desulforudis Species 0.000 description 2
- 241000193163 Clostridioides difficile Species 0.000 description 2
- 241000193155 Clostridium botulinum Species 0.000 description 2
- 108091026890 Coding region Proteins 0.000 description 2
- 108091035707 Consensus sequence Proteins 0.000 description 2
- 241000065716 Crocosphaera watsonii Species 0.000 description 2
- 101150074775 Csf1 gene Proteins 0.000 description 2
- 241000159506 Cyanothece Species 0.000 description 2
- 239000006144 Dulbecco’s modified Eagle's medium Substances 0.000 description 2
- 241000192016 Finegoldia magna Species 0.000 description 2
- 241000186673 Lactobacillus delbrueckii Species 0.000 description 2
- 241000186869 Lactobacillus salivarius Species 0.000 description 2
- 241001134698 Lyngbya Species 0.000 description 2
- 241000192710 Microcystis aeruginosa Species 0.000 description 2
- 241000190928 Microscilla marina Species 0.000 description 2
- 241000167285 Natranaerobius thermophilus Species 0.000 description 2
- 241000919925 Nitrosococcus halophilus Species 0.000 description 2
- 241001223105 Nodularia spumigena Species 0.000 description 2
- 108091034117 Oligonucleotide Proteins 0.000 description 2
- 241000142651 Pelotomaculum thermopropionicum Species 0.000 description 2
- NBIIXXVUZAFLBC-UHFFFAOYSA-N Phosphoric acid Chemical compound OP(O)(O)=O NBIIXXVUZAFLBC-UHFFFAOYSA-N 0.000 description 2
- 241000512220 Polaromonas Species 0.000 description 2
- 108091028664 Ribonucleotide Proteins 0.000 description 2
- 108091027967 Small hairpin RNA Proteins 0.000 description 2
- 108020004459 Small interfering RNA Proteins 0.000 description 2
- 241000191967 Staphylococcus aureus Species 0.000 description 2
- 241000203587 Streptosporangium roseum Species 0.000 description 2
- 101710172711 Structural protein Proteins 0.000 description 2
- 238000000692 Student's t-test Methods 0.000 description 2
- 108020004566 Transfer RNA Proteins 0.000 description 2
- 229940011019 arthrospira platensis Drugs 0.000 description 2
- 238000003556 assay Methods 0.000 description 2
- 230000037429 base substitution Effects 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 238000003776 cleavage reaction Methods 0.000 description 2
- 238000010367 cloning Methods 0.000 description 2
- 239000005547 deoxyribonucleotide Substances 0.000 description 2
- 125000002637 deoxyribonucleotide group Chemical group 0.000 description 2
- 238000009826 distribution Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000002068 genetic effect Effects 0.000 description 2
- 108091070501 miRNA Proteins 0.000 description 2
- 239000002679 microRNA Substances 0.000 description 2
- 238000000520 microinjection Methods 0.000 description 2
- 229910052754 neon Inorganic materials 0.000 description 2
- GKAOGPIIYCISHV-UHFFFAOYSA-N neon atom Chemical compound [Ne] GKAOGPIIYCISHV-UHFFFAOYSA-N 0.000 description 2
- 150000002972 pentoses Chemical class 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 230000008439 repair process Effects 0.000 description 2
- 239000002336 ribonucleotide Substances 0.000 description 2
- 125000002652 ribonucleotide group Chemical group 0.000 description 2
- 108020004418 ribosomal RNA Proteins 0.000 description 2
- 230000007017 scission Effects 0.000 description 2
- UNFWWIHTNXNPBV-WXKVUWSESA-N spectinomycin Chemical compound O([C@@H]1[C@@H](NC)[C@@H](O)[C@H]([C@@H]([C@H]1O1)O)NC)[C@]2(O)[C@H]1O[C@H](C)CC2=O UNFWWIHTNXNPBV-WXKVUWSESA-N 0.000 description 2
- 238000007619 statistical method Methods 0.000 description 2
- UCSJYZPVAKXKNQ-HZYVHMACSA-N streptomycin Chemical compound CN[C@H]1[C@H](O)[C@@H](O)[C@H](CO)O[C@H]1O[C@@H]1[C@](C=O)(O)[C@H](C)O[C@H]1O[C@@H]1[C@@H](NC(N)=N)[C@H](O)[C@@H](NC(N)=N)[C@H](O)[C@H]1O UCSJYZPVAKXKNQ-HZYVHMACSA-N 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- 238000012353 t test Methods 0.000 description 2
- 238000001890 transfection Methods 0.000 description 2
- 229940035893 uracil Drugs 0.000 description 2
- SQAINHDHICKHLX-UHFFFAOYSA-N 1-naphthaldehyde Chemical compound C1=CC=C2C(C=O)=CC=CC2=C1 SQAINHDHICKHLX-UHFFFAOYSA-N 0.000 description 1
- ASJSAQIRZKANQN-CRCLSJGQSA-N 2-deoxy-D-ribose Chemical compound OC[C@@H](O)[C@@H](O)CC=O ASJSAQIRZKANQN-CRCLSJGQSA-N 0.000 description 1
- 241000604451 Acidaminococcus Species 0.000 description 1
- 241001464929 Acidithiobacillus caldus Species 0.000 description 1
- 241000605222 Acidithiobacillus ferrooxidans Species 0.000 description 1
- 102000007470 Adenosine A2B Receptor Human genes 0.000 description 1
- 108010085273 Adenosine A2B receptor Proteins 0.000 description 1
- 241001147780 Alicyclobacillus Species 0.000 description 1
- 241000190857 Allochromatium vinosum Species 0.000 description 1
- 108091093088 Amplicon Proteins 0.000 description 1
- 241001495180 Arthrospira Species 0.000 description 1
- 241001495183 Arthrospira sp. Species 0.000 description 1
- 241000589941 Azospirillum Species 0.000 description 1
- 241000193830 Bacillus <bacterium> Species 0.000 description 1
- 241000906059 Bacillus pseudomycoides Species 0.000 description 1
- 241000605059 Bacteroidetes Species 0.000 description 1
- 108091003079 Bovine Serum Albumin Proteins 0.000 description 1
- 101150114882 CALM2 gene Proteins 0.000 description 1
- 238000010356 CRISPR-Cas9 genome editing Methods 0.000 description 1
- 101150069031 CSN2 gene Proteins 0.000 description 1
- 241000589876 Campylobacter Species 0.000 description 1
- 241000206594 Carnobacterium Species 0.000 description 1
- 108090000994 Catalytic RNA Proteins 0.000 description 1
- 102000053642 Catalytic RNA Human genes 0.000 description 1
- 102000011022 Chorionic Gonadotropin Human genes 0.000 description 1
- 108010062540 Chorionic Gonadotropin Proteins 0.000 description 1
- 241000193403 Clostridium Species 0.000 description 1
- 241000907165 Coleofasciculus chthonoplastes Species 0.000 description 1
- 102000008186 Collagen Human genes 0.000 description 1
- 108010035532 Collagen Proteins 0.000 description 1
- HMFHBZSHGGEWLO-SOOFDHNKSA-N D-ribofuranose Chemical compound OC[C@H]1OC(O)[C@H](O)[C@@H]1O HMFHBZSHGGEWLO-SOOFDHNKSA-N 0.000 description 1
- 238000007400 DNA extraction Methods 0.000 description 1
- 102000004163 DNA-directed RNA polymerases Human genes 0.000 description 1
- 108090000626 DNA-directed RNA polymerases Proteins 0.000 description 1
- 241000936939 Desulfonatronum Species 0.000 description 1
- 241000605716 Desulfovibrio Species 0.000 description 1
- BWGNESOTFCXPMA-UHFFFAOYSA-N Dihydrogen disulfide Chemical compound SS BWGNESOTFCXPMA-UHFFFAOYSA-N 0.000 description 1
- 241000186394 Eubacterium Species 0.000 description 1
- 241001468125 Exiguobacterium Species 0.000 description 1
- 241000326311 Exiguobacterium sibiricum Species 0.000 description 1
- 108700024394 Exon Proteins 0.000 description 1
- 241000589601 Francisella Species 0.000 description 1
- 101150106478 GPS1 gene Proteins 0.000 description 1
- 206010064571 Gene mutation Diseases 0.000 description 1
- 241000032681 Gluconacetobacter Species 0.000 description 1
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Natural products OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 description 1
- 108010086677 Gonadotropins Proteins 0.000 description 1
- 102000006771 Gonadotropins Human genes 0.000 description 1
- UYTPUPDQBNUYGX-UHFFFAOYSA-N Guanine Natural products O=C1NC(N)=NC2=C1N=CN2 UYTPUPDQBNUYGX-UHFFFAOYSA-N 0.000 description 1
- 241001430278 Helcococcus Species 0.000 description 1
- 241000282414 Homo sapiens Species 0.000 description 1
- 108091092195 Intron Proteins 0.000 description 1
- 102000011782 Keratins Human genes 0.000 description 1
- 108010076876 Keratins Proteins 0.000 description 1
- ROHFNLRQFUQHCH-YFKPBYRVSA-N L-leucine Chemical compound CC(C)C[C@H](N)C(O)=O ROHFNLRQFUQHCH-YFKPBYRVSA-N 0.000 description 1
- 241001112693 Lachnospiraceae Species 0.000 description 1
- 241000186660 Lactobacillus Species 0.000 description 1
- 241000589248 Legionella Species 0.000 description 1
- 208000007764 Legionnaires' Disease Diseases 0.000 description 1
- 241001453171 Leptotrichia Species 0.000 description 1
- ROHFNLRQFUQHCH-UHFFFAOYSA-N Leucine Natural products CC(C)CC(N)C(O)=O ROHFNLRQFUQHCH-UHFFFAOYSA-N 0.000 description 1
- 241000186781 Listeria Species 0.000 description 1
- 241000206589 Marinobacter Species 0.000 description 1
- 241000501784 Marinobacter sp. Species 0.000 description 1
- 241000204637 Methanohalobium evestigatum Species 0.000 description 1
- 241000589323 Methylobacterium Species 0.000 description 1
- 241000179980 Microcoleus Species 0.000 description 1
- 102000007474 Multiprotein Complexes Human genes 0.000 description 1
- 108010085220 Multiprotein Complexes Proteins 0.000 description 1
- 101100238296 Mus musculus Morc2a gene Proteins 0.000 description 1
- 241000588653 Neisseria Species 0.000 description 1
- 101100385413 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) csm-3 gene Proteins 0.000 description 1
- 241000135938 Nitratifractor Species 0.000 description 1
- 241001515112 Nitrosococcus watsonii Species 0.000 description 1
- 241000203619 Nocardiopsis dassonvillei Species 0.000 description 1
- 241000192656 Nostoc Species 0.000 description 1
- 241000192673 Nostoc sp. Species 0.000 description 1
- 101710163270 Nuclease Proteins 0.000 description 1
- 108020004711 Nucleic Acid Probes Proteins 0.000 description 1
- 241000936936 Opitutaceae Species 0.000 description 1
- 241000192520 Oscillatoria sp. Species 0.000 description 1
- 238000012408 PCR amplification Methods 0.000 description 1
- 241000740708 Paludibacter Species 0.000 description 1
- 241001386753 Parvibaculum Species 0.000 description 1
- 229930182555 Penicillin Natural products 0.000 description 1
- JGSARLDLIJGVTE-MBNYWOFBSA-N Penicillin G Chemical compound N([C@H]1[C@H]2SC([C@@H](N2C1=O)C(O)=O)(C)C)C(=O)CC1=CC=CC=C1 JGSARLDLIJGVTE-MBNYWOFBSA-N 0.000 description 1
- 108091005804 Peptidases Proteins 0.000 description 1
- 241000983938 Petrotoga mobilis Species 0.000 description 1
- 241001599925 Polaromonas naphthalenivorans Species 0.000 description 1
- 241001472610 Polaromonas sp. Species 0.000 description 1
- 241000605894 Porphyromonas Species 0.000 description 1
- 241000605861 Prevotella Species 0.000 description 1
- 239000004365 Protease Substances 0.000 description 1
- 101710130181 Protochlorophyllide reductase A, chloroplastic Proteins 0.000 description 1
- 241000590028 Pseudoalteromonas haloplanktis Species 0.000 description 1
- 230000006819 RNA synthesis Effects 0.000 description 1
- 108020004511 Recombinant DNA Proteins 0.000 description 1
- 102000018120 Recombinases Human genes 0.000 description 1
- 108010091086 Recombinases Proteins 0.000 description 1
- 102100028287 Regulator of nonsense transcripts 1 Human genes 0.000 description 1
- 101710172454 Regulator of nonsense transcripts 1 Proteins 0.000 description 1
- 102100037486 Reverse transcriptase/ribonuclease H Human genes 0.000 description 1
- 241000191025 Rhodobacter Species 0.000 description 1
- 102000004389 Ribonucleoproteins Human genes 0.000 description 1
- 108010081734 Ribonucleoproteins Proteins 0.000 description 1
- PYMYPHUHKUWMLA-LMVFSUKVSA-N Ribose Natural products OC[C@@H](O)[C@@H](O)[C@@H](O)C=O PYMYPHUHKUWMLA-LMVFSUKVSA-N 0.000 description 1
- 241000605947 Roseburia Species 0.000 description 1
- MTCFGRXMJLQNBG-UHFFFAOYSA-N Serine Natural products OCC(N)C(O)=O MTCFGRXMJLQNBG-UHFFFAOYSA-N 0.000 description 1
- 241000949716 Sphaerochaeta Species 0.000 description 1
- 241000191940 Staphylococcus Species 0.000 description 1
- 102000009822 Sterol Regulatory Element Binding Proteins Human genes 0.000 description 1
- 108010020396 Sterol Regulatory Element Binding Proteins Proteins 0.000 description 1
- 241000194017 Streptococcus Species 0.000 description 1
- 241000194022 Streptococcus sp. Species 0.000 description 1
- 241000194020 Streptococcus thermophilus Species 0.000 description 1
- 241001518258 Streptomyces pristinaespiralis Species 0.000 description 1
- 241000192707 Synechococcus Species 0.000 description 1
- 241000192560 Synechococcus sp. Species 0.000 description 1
- 108010017842 Telomerase Proteins 0.000 description 1
- 241000206213 Thermosipho africanus Species 0.000 description 1
- 241000078013 Trichormus variabilis Species 0.000 description 1
- 241000670722 Tuberibacillus Species 0.000 description 1
- 238000005411 Van der Waals force Methods 0.000 description 1
- 241001673106 [Bacillus] selenitireducens Species 0.000 description 1
- 230000021736 acetylation Effects 0.000 description 1
- 238000006640 acetylation reaction Methods 0.000 description 1
- HMFHBZSHGGEWLO-UHFFFAOYSA-N alpha-D-Furanose-Ribose Natural products OCC1OC(O)C(O)C1O HMFHBZSHGGEWLO-UHFFFAOYSA-N 0.000 description 1
- 229910000147 aluminium phosphate Inorganic materials 0.000 description 1
- 239000000427 antigen Substances 0.000 description 1
- 102000036639 antigens Human genes 0.000 description 1
- 108091007433 antigens Proteins 0.000 description 1
- 238000004113 cell culture Methods 0.000 description 1
- 210000002421 cell wall Anatomy 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000007385 chemical modification Methods 0.000 description 1
- 210000000349 chromosome Anatomy 0.000 description 1
- 229920001436 collagen Polymers 0.000 description 1
- 239000002299 complementary DNA Substances 0.000 description 1
- 101150055601 cops2 gene Proteins 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 230000009977 dual effect Effects 0.000 description 1
- 238000004520 electroporation Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000004720 fertilization Effects 0.000 description 1
- 239000012894 fetal calf serum Substances 0.000 description 1
- 235000013305 food Nutrition 0.000 description 1
- 230000014509 gene expression Effects 0.000 description 1
- 238000003197 gene knockdown Methods 0.000 description 1
- 239000008103 glucose Substances 0.000 description 1
- 239000002622 gonadotropin Substances 0.000 description 1
- 239000005556 hormone Substances 0.000 description 1
- 229940088597 hormone Drugs 0.000 description 1
- 229940084986 human chorionic gonadotropin Drugs 0.000 description 1
- 230000002209 hydrophobic effect Effects 0.000 description 1
- 238000000338 in vitro Methods 0.000 description 1
- 230000006698 induction Effects 0.000 description 1
- 230000009545 invasion Effects 0.000 description 1
- 229940039696 lactobacillus Drugs 0.000 description 1
- 210000001161 mammalian embryo Anatomy 0.000 description 1
- 230000011987 methylation Effects 0.000 description 1
- 238000007069 methylation reaction Methods 0.000 description 1
- 244000005700 microbiome Species 0.000 description 1
- 210000000472 morula Anatomy 0.000 description 1
- 239000002853 nucleic acid probe Substances 0.000 description 1
- 230000016087 ovulation Effects 0.000 description 1
- 230000036961 partial effect Effects 0.000 description 1
- 229940049954 penicillin Drugs 0.000 description 1
- 230000026731 phosphorylation Effects 0.000 description 1
- 238000006366 phosphorylation reaction Methods 0.000 description 1
- 238000000053 physical method Methods 0.000 description 1
- 239000013612 plasmid Substances 0.000 description 1
- 102000054765 polymorphisms of proteins Human genes 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 238000000746 purification Methods 0.000 description 1
- 230000005855 radiation Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 108091008146 restriction endonucleases Proteins 0.000 description 1
- 108091092562 ribozyme Proteins 0.000 description 1
- 238000007480 sanger sequencing Methods 0.000 description 1
- 210000002966 serum Anatomy 0.000 description 1
- 230000037432 silent mutation Effects 0.000 description 1
- 229960005322 streptomycin Drugs 0.000 description 1
- 210000001519 tissue Anatomy 0.000 description 1
- 238000011144 upstream manufacturing Methods 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/10—Processes for the isolation, preparation or purification of DNA or RNA
- C12N15/102—Mutagenizing nucleic acids
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/113—Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/16—Hydrolases (3) acting on ester bonds (3.1)
- C12N9/22—Ribonucleases RNAses, DNAses
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2310/00—Structure or type of the nucleic acid
- C12N2310/10—Type of nucleic acid
- C12N2310/20—Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
Landscapes
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Engineering & Computer Science (AREA)
- Genetics & Genomics (AREA)
- Chemical & Material Sciences (AREA)
- Organic Chemistry (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biomedical Technology (AREA)
- Wood Science & Technology (AREA)
- Zoology (AREA)
- Biotechnology (AREA)
- General Engineering & Computer Science (AREA)
- Molecular Biology (AREA)
- Microbiology (AREA)
- Biochemistry (AREA)
- General Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- Biophysics (AREA)
- Plant Pathology (AREA)
- Medicinal Chemistry (AREA)
- Crystallography & Structural Chemistry (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
Abstract
본 출원에 의해 개시되는 기술은 타겟 시퀀스를 조작하기 위한 조성물 및 표적 핵산에 특정 핵산 서열을 삽입하는 방법에 관한 것으로, 본 출원에 의해 개시되는 조성물 및 방법은 중첩된 가이드핵산을 사용하면, 특정 핵산 서열이 삽입되는 효율이 증가된다.The technology disclosed by this application relates to a composition for manipulating a target sequence and a method for inserting a specific nucleic acid sequence into a target nucleic acid. The efficiency with which the sequence is inserted is increased.
Description
본 출원에 의해 개시되는 기술은 타겟 시퀀스를 조작하기 위한 조성물 및 표적 핵산에 특정 핵산 서열을 삽입하는 방법에 관한 것이다. 보다 구체적으로, 중첩된 가이드핵산을 이용하여 타겟 시퀀스를 조작하기 위한 조성물 및 표적 핵산에 특정 핵산 서열을 삽입하는 방법에 관한 것이다.The technology disclosed by this application relates to compositions for manipulating target sequences and methods for inserting specific nucleic acid sequences into target nucleic acids. More specifically, it relates to a composition for manipulating a target sequence using overlapping guide nucleic acids and a method for inserting a specific nucleic acid sequence into a target nucleic acid.
유전자 변이를 인위적으로 초래하기 위해서, 이전에는 i) 방사선 또는 UV를 사용한 물리적 방법이나, ii) DNA 구조를 불안정하게 만드는 화학적 방법 등을 이용해 왔다. 하지만 이러한 방법들은 유전자 변이가 발생되는 위치를 특정한 위치로 제어하는 데에 어렵다는 단점이 있다.In order to artificially cause genetic mutation, i) physical methods using radiation or UV, or ii) chemical methods that destabilize DNA structure have been used in the past. However, these methods have a disadvantage in that it is difficult to control the location where genetic mutation occurs to a specific location.
이와 달리, 최근 개발된 유전자 가위 기술(예를 들어, Clustered Regularly Interspaced Short Palindromic Repeat, CRISPR)은 종래의 기술보다는 유전자 변이의 위치를 특정한 위치로 제어하는 것에 용이해졌다. 그럼에도 불구하고, 원하는 유전자를 인위적으로 도입하는데 있어서는 여전히 낮은 효율성을 지니고 있다. In contrast, recently developed genetic scissors technology (eg, Clustered Regularly Interspaced Short Palindromic Repeat, CRISPR) has made it easier to control the position of gene mutation to a specific position than conventional techniques. Nevertheless, it still has low efficiency in artificially introducing a desired gene.
따라서, 최근의 유전자 가위 기술과 분자생물학적 방법을 잘 융합시킴으로써 원하는 유전자의 도입 효율을 극대화한 유전자 편집 기술이 요구되고 있는 실정이다.Therefore, there is a demand for a gene editing technology that maximizes the introduction efficiency of a desired gene by well integrating recent gene editing technology and molecular biology methods.
본 출원에 의해 개시되는 기술의 일 과제는, 전술한 종래 기술의 문제점을 해결하기 위하여, 중첩된 가이드핵산을 이용하여 타겟 시퀀스를 조작하기 위한 조성물을 제공하는 것이다.One object of the technology disclosed by the present application is to provide a composition for manipulating a target sequence using overlapping guide nucleic acids in order to solve the above-mentioned problems of the prior art.
본 출원에 의해 개시되는 기술의 다른 과제는, 전술한 종래 기술의 문제점을 해결하기 위하여, 중첩된 가이드핵산을 이용하여 표적 핵산에 특정 핵산 서열을 삽입하여 상기 표적 핵산을 조작하는 방법을 제공하는 것이다.Another object of the technology disclosed by the present application is to provide a method of manipulating a target nucleic acid by inserting a specific nucleic acid sequence into a target nucleic acid using an overlapping guide nucleic acid in order to solve the above-mentioned problems of the prior art. .
전술한 본 출원에 의해 개시되는 기술의 과제를 달성하기 위하여, 본 출원에 의해 개시되는 기술의 일 양태에 따르면, 표적 핵산에 특정 핵산 서열의 삽입 효율 증가를 위한 조성물 및 방법에 관한 것이다.In order to achieve the above object of the technology disclosed by the present application, according to one aspect of the technology disclosed by the present application, it relates to a composition and method for increasing the insertion efficiency of a specific nucleic acid sequence into a target nucleic acid.
전술한 본 발명의 과제를 해결하기 위하여, 본 출원에 의해 개시되는 기술의 일 양태에 의하면, 중첩된 가이드핵산을 이용하여 특정 핵산 서열의 삽입 효율을 증가시킬 수 있는 조성물이 제공된다.In order to solve the above problems of the present invention, according to one aspect of the technology disclosed by the present application, a composition capable of increasing the insertion efficiency of a specific nucleic acid sequence using overlapping guide nucleic acids is provided.
상기 중첩된 가이드핵산을 이용하여 특정 핵산 서열의 삽입 효율을 증가시킬 수 있는 조성물은, Cas 단백질 또는 상기 Cas 단백질을 인코딩하는 제1 핵산; 적어도 제1 영역 및 제2 영역을 포함하는 제2 핵산; 및 적어도 제3 영역을 포함하는 제3 핵산;을 포함할 수 있다. 이 때, 상기 타겟 시퀀스를 조작하기 위하여, 상기 제2 핵산 및 상기 제3 핵산은 상기 Cas 단백질과 상호작용을 할 수 있다. 또한, 상기 제1 영역 및 제2 영역은 상기 타겟 시퀀스의 적어도 제1 부분에 상보적이고, 상기 제3 영역은 상기 타겟 시퀀스의 적어도 제2 부분에 상보적일 수 있으며, 상기 제2 영역 및 상기 제3 영역은 서로 공통 서열을 가지고 있거나 또는 서로 상보적인 서열을 가질 수 있다.A composition capable of increasing the insertion efficiency of a specific nucleic acid sequence using the overlapping guide nucleic acids may include a Cas protein or a first nucleic acid encoding the Cas protein; a second nucleic acid comprising at least a first region and a second region; and a third nucleic acid comprising at least a third region. In this case, in order to manipulate the target sequence, the second nucleic acid and the third nucleic acid may interact with the Cas protein. In addition, the first region and the second region may be complementary to at least a first part of the target sequence, the third region may be complementary to at least a second part of the target sequence, and the second region and the third region may be complementary to each other. The regions may have sequences in common with each other or sequences that are complementary to each other.
전술한 본 출원에 의해 개시되는 기술의 다른 과제를 해결하기 위하여, 본 출원에 의해 개시되는 기술의 다른 일 양태에 의하면, 중첩된 가이드핵산을 포함하는 표적 핵산에 특정 핵산 서열을 삽입하는 방법이 제공된다.In order to solve the other problems of the technology disclosed by the present application, according to another aspect of the technology disclosed by the present application, a method of inserting a specific nucleic acid sequence into a target nucleic acid containing overlapping guide nucleic acids is provided do.
상기 표적 핵산에 특정 핵산 서열을 삽입하는 방법은, i) Cas 단백질 또는 상기 Cas 단백질을 인코딩하는 제1 핵산, ii) 적어도 제1 영역 및 제2 영역을 포함하는 제2 핵산, iii) 적어도 제3 영역을 포함하는 제3 핵산, 및 iv) 상기 표적 핵산의 특정 영역에 삽입되기 위한 상기 특정 핵산 서열을 포함하는 조성물을 세포에 도입시키는 단계를 포함한다. 이 때, 상기 제2 영역 및 상기 제3 영역은 서로 공통 서열을 가지고 있거나 또는 서로 상보적인 서열을 가질 수 있으며, 상기 특정 핵산 서열은 상기 표적 핵산의 영역 중 상기 제2 핵산 및/또는 상기 제3 핵산에 대해 상보적인 영역의 적어도 일부에 중첩되도록 삽입될 수 있다.The method of inserting a specific nucleic acid sequence into the target nucleic acid comprises: i) a Cas protein or a first nucleic acid encoding the Cas protein, ii) a second nucleic acid comprising at least a first region and a second region, iii) at least a third nucleic acid and iv) introducing into a cell a composition comprising said specific nucleic acid sequence for insertion into a specific region of said target nucleic acid. In this case, the second region and the third region may have a common sequence or a sequence complementary to each other, and the specific nucleic acid sequence is the second nucleic acid and/or the third region of the target nucleic acid. It may be inserted so as to overlap at least a portion of a region complementary to the nucleic acid.
본 출원에 의해 개시되는 기술에 따르면 다음과 같은 효과가 발생된다.According to the technology disclosed by this application, the following effects occur.
중첩된 가이드핵산을 사용하여 표적 핵산에 특정 핵산 서열을 삽입하기 위한 조성물 및 방법을 제공할 수 있게 된다. 특히, 본 출원에 의해 개시되는 바와 같이 중첩된 가이드핵산을 사용하게 되면 종래의 기술에 비하여 특정 핵산 서열이 삽입되는 효율이 엄청나게 증가하게 된다.It is possible to provide compositions and methods for inserting a specific nucleic acid sequence into a target nucleic acid using overlapping guide nucleic acids. In particular, when overlapping guide nucleic acids are used as disclosed in the present application, the efficiency of inserting a specific nucleic acid sequence is greatly increased compared to conventional techniques.
도 1은 중첩된 가이드핵산의 예시들을 도시화한 도면이다.
도 2는 Rosa26 유전자를 표적유전자 자리로 한 sgRNAs의 설계를 나타낸 도면이다.
도 3은 Rosa26 유전자를 표적유전자 자리로 한 ssODN의 설계를 나타낸 도면이다.
도 4는 Rosa26 유전자를 표적유전자 자리로 한 배아의 넉인 비율을 나타낸 도면이다.
도 5는 Rosa26 유전자를 표적유전자 자리로 한 마우스 새끼의 유전형 분석결과를 나타낸 도면이다.
도 6은 Rosa26 유전자를 표적유전자 자리로 한 배반포의 유전형 분석결과를 나타낸 도면이다.
도 7은 Rosa26 유전자를 표적유전자 자리로 한 마우스 새끼의 염기서열 분석결과를 나타낸 도면이다.
도 8은 Upf1 유전자를 표적유전자 자리로 한 sgRNAs의 설계를 나타낸 도면이다.
도 9는 Upf1 유전자를 표적유전자 자리로 한 ssODN의 설계를 나타낸 도면이다.
도 10은 Upf1 유전자를 표적유전자 자리로 한 배아의 넉인 비율을 나타낸 도면이다.
도 11은 Upf1 유전자를 표적유전자 자리로 한 sgRNAs의 삭제서열의 분포를 나타낸 도면이다.
도 12는 Upf1 유전자를 표적유전자 자리로 한 배반포의 유전형 분석결과를 나타낸 도면이다.
도 13은 Srebf1 유전자를 표적유전자 자리로 한 sgRNAs의 설계를 나타낸 도면이다.
도 14는 Srebf1 유전자를 표적유전자 자리로 한 ssODN의 설계를 나타낸 도면이다.
도 15는 Srebf1 유전자를 표적유전자 자리로 한 마우스 새끼의 유전형 분석결과를 나타낸 도면이다.
도 16는 Tert 유전자를 표적유전자 자리로 한 sgRNAs의 설계를 나타낸 도면이다.
도 17은 Tert 유전자를 표적유전자 자리로 한 ssODN의 설계를 나타낸 도면이다.
도 18은 Tert 유전자를 표적유전자 자리로 한 마우스 새끼의 유전형 분석결과를 나타낸 도면이다.
도 19는 Morc2a 유전자를 표적유전자 자리로 한 sgRNAs의 설계를 나타낸 도면이다.
도 20은 Morc2a 유전자를 표적유전자 자리로 한 ssODN의 설계를 나타낸 도면이다.
도 21은 Morc2a 유전자를 표적유전자 자리로 한 DSB 패턴 분석결과를 나타낸 도면이다.
도 22는 Morc2a 유전자를 표적유전자 자리로 한 배아의 넉인 비율을 나타낸 도면이다.
도 23은 Morc2a 유전자를 표적유전자 자리로 한 배반포의 유전형 분석결과를 나타낸 도면이다.
도 24는 Morc2a 유전자를 표적유전자 자리로 한 sgRNAs의 삭제서열의 분포를 나타낸 도면이다.
도 25는 Morc2a 유전자를 표적유전자 자리로 한 넉인 효율 분석결과를 나타낸 도면이다.
도 26은 Adora2b 유전자를 표적유전자 자리로 한 sgRNAs와 ssODN의 설계를 나타낸 도면이다.
도 27은 Adora2b 유전자를 표적유전자 자리로 한 마우스 새끼의 유전형 분석결과를 나타낸 도면이다.
도 28는 Adora2b 유전자를 표적유전자 자리로 한 넉인 효율 분석결과를 나타낸 도면이다.1 is a diagram illustrating examples of overlapping guide nucleic acids.
Figure 2 is a diagram showing the design of sgRNAs with Rosa26 gene as a target locus.
3 is a diagram showing the design of ssODN with Rosa26 gene as a target locus.
4 is a diagram showing the knock-in rate of embryos with the Rosa26 gene as the target locus.
5 is a diagram showing the results of genotyping analysis of mouse offspring with the Rosa26 gene as the target locus.
6 is a view showing the results of genotyping analysis of blastocysts with Rosa26 gene as the target locus.
7 is a diagram showing the results of sequencing of mouse offspring with the Rosa26 gene as the target locus.
8 is a diagram showing the design of sgRNAs with Upf1 gene as a target locus.
9 is a diagram showing the design of ssODN with Upf1 gene as a target locus.
10 is a diagram showing the knock-in rate of embryos with Upf1 gene as a target locus.
11 is a diagram showing the distribution of deleted sequences of sgRNAs targeting the Upf1 gene.
12 is a view showing the results of genotyping analysis of blastocysts with Upf1 gene as the target locus.
Figure 13 is a diagram showing the design of sgRNAs with the Srebf1 gene as the target locus.
14 is a diagram showing the design of ssODN with the Srebf1 gene as the target locus.
15 is a diagram showing the results of genotyping of mouse offspring with the Srebf1 gene as the target locus.
16 is a diagram showing the design of sgRNAs with Tert gene as a target locus.
17 is a diagram showing the design of ssODN with Tert gene as a target locus.
18 is a diagram showing the results of genotyping analysis of mouse offspring with the Tert gene as the target locus.
Figure 19 is a diagram showing the design of sgRNAs with Morc2a gene as the target locus.
20 is a diagram showing the design of ssODN with Morc2a gene as the target locus.
21 is a view showing the results of DSB pattern analysis with the Morc2a gene as the target locus.
22 is a diagram showing the knock-in rate of embryos with Morc2a gene as the target locus.
23 is a view showing the results of genotyping analysis of blastocysts with Morc2a gene as the target locus.
24 is a diagram showing the distribution of deleted sequences of sgRNAs targeting the Morc2a gene.
25 is a diagram showing the results of knock-in efficiency analysis using the Morc2a gene as the target locus.
26 is a diagram showing the design of sgRNAs and ssODN with the Adora2b gene as the target locus.
27 is a diagram showing the results of genotyping analysis of mouse offspring with the Adora2b gene as the target locus.
28 is a diagram showing the results of knock-in efficiency analysis using the Adora2b gene as a target locus.
본 출원에 의해 개시되는 기술의 일 태양은 특정 핵산 서열의 삽입 효율을 증가시킬 수 있는 조성물에 관한 것이다.One aspect of the technology disclosed by this application relates to a composition capable of increasing the insertion efficiency of a particular nucleic acid sequence.
구체적으로, 인위적으로 조작된 중첩된 가이드핵산을 사용한 표적 핵산에 특정 핵산 서열을 삽입하기 위한 조성물에 관한 것이다.Specifically, it relates to a composition for inserting a specific nucleic acid sequence into a target nucleic acid using an artificially engineered overlapping guide nucleic acid.
본 출원에 의해 개시되는 기술에서 사용되는 용어 또는 실시는 달리 정의되지 않는 한, 당업계의 기술 내에 있는 면역학, 생화학, 분자 생물학, 미생물학, 세포 생물학, 유전체학 및 재조합 DNA의 통상의 기술 등을 사용하는 당업자에 의해 통상적으로 이해되는 것과 동일한 의미를 가진다.Terms or practices used in the technology disclosed by this application, unless otherwise defined, use conventional techniques of immunology, biochemistry, molecular biology, microbiology, cell biology, genomics, and recombinant DNA within the skill of the art. have the same meaning as commonly understood by a person skilled in the art.
본 명세서에서 사용되는 용어 "핵산"은 뉴클레오타이드로 구성된 유기물을 의미하며, DNA(deoxyribonucleic acid), RNA(ribonucleic acid), DNA/RNA 혼합형태를 포함한다.As used herein, the term "nucleic acid" refers to an organic substance composed of nucleotides, and includes deoxyribonucleic acid (DNA), ribonucleic acid (RNA), and a mixture of DNA/RNA.
본 명세서에서 사용되는 용어 "뉴클레오타이드"는 인산, 염기, 당으로 구성된 물질을 총칭하며, 상기 당은 5탄당을 포함할 수 있으며, 상기 5탄당은 리보오스(ribose)와 디옥시리보오스(deoxyribose)를 포함할 수 있다. 상기 뉴클레오타이드는 단일가닥(single strand) 또는 이중가닥(double strand)형태로 존재하는 디옥시리보뉴클레오타이드 또는 리보뉴클레오타이드도 포함할 수 있다. 상기 뉴클레오타이드는 임의의 길이의 뉴클레오타이드, 디옥시리보뉴클레오타이드 또는 리보뉴클레오타이드 중 어느 하나, 또는 그것들의 유사체의 중합체 형태도 포함할 수 있다. 또한, 상기 뉴클레오타이드는 임의의 3차원 구조를 가질 수 있으며, 기지의 또는 미지의 임의의 기능을 수행할 수 있다. 상기 뉴클레오티드의 구조에 대한 변형이 존재한다면, 중합체의 조립 전에 또는 후에 부여될 수 있다.As used herein, the term "nucleotide" refers to substances composed of phosphoric acid, base, and sugar, and the sugar may include a pentose sugar, and the pentose sugar may include ribose and deoxyribose. can The nucleotide may also include deoxyribonucleotide or ribonucleotide present in a single strand or double strand form. The nucleotides may also include polymeric forms of nucleotides of any length, either deoxyribonucleotides or ribonucleotides, or analogs thereof. In addition, the nucleotide may have any three-dimensional structure and may perform any known or unknown function. Modifications, if any, to the structure of the nucleotides can be imparted before or after assembly of the polymer.
다음은 뉴클레오타이드의 비제한적인 예들이다. 유전자, 유전자 단편, 염색체 단편, 유전자 또는 유전자 단편의 코딩 영역, 유전자 또는 유전자 단편의 비코딩 영역, 엑손, 인트론, 전령 RNA(mRNA), 운반 RNA(tRNA), 리보솜 RNA(rRNA), 짧은 간섭 RNA(siRNA), 짧은 헤어핀 RNA(shRNA), 마이크로 RNA(miRNA), 리보자임, cDNA, 재조합 폴리뉴클레오타이드, 플라스미드, 벡터, 임의의 서열이 분리된 DNA, 임의의 서열이 분리된 RNA, 핵산 프로브, 프라이머, 하나 이상이 변형된 뉴클레오타이드(예를 들어, 메틸화 뉴클레오타이드 및 뉴클레오타이드 유사체) 등을 포함할 수 있다.The following are non-limiting examples of nucleotides. Genes, gene segments, chromosome segments, coding regions of genes or gene segments, non-coding regions of genes or gene segments, exons, introns, messenger RNA (mRNA), transfer RNA (tRNA), ribosomal RNA (rRNA), short interfering RNA (siRNA), short hairpin RNA (shRNA), micro RNA (miRNA), ribozymes, cDNA, recombinant polynucleotides, plasmids, vectors, DNA with any sequence isolated, RNA with any sequence isolated, nucleic acid probes, primers , nucleotides in which one or more are modified (eg, methylated nucleotides and nucleotide analogs), and the like.
용어 뉴클레오타이드, 뉴클레오티드, 폴리뉴클레오타이드, 폴리뉴클레오티드, 올리고뉴클레오타이드, 올리고뉴클레오티드는 상호교환 가능하게 사용된다.The terms nucleotide, nucleotide, polynucleotide, polynucleotide, oligonucleotide, and oligonucleotide are used interchangeably.
본 명세서에서 사용되는 용어 "단백질"은 아미노산(amino acid)으로 구성된 유기 물질을 총칭하며, 상기 단백질은 구조 단백질 및 생물학적 활성 단백질 등을 포함할 수 있으나 이에 한정하지 않는다. 상기 구조 단백질은 콜라겐, 케라틴 등으로 일반적으로 가늘고 긴 실 모양의 사슬로 구성되어 있고, 상기 생물학적 활성 단백질은 효소와 같이 생물의 체내에서 일어나는 화학반응을 촉매하거나, 호르몬처럼 신체의 다른 부위로 신호를 전달하거나, 체내의 다른 부위로 물질을 수송하거나, 항원처럼 외부의 침입으로부터 몸을 방어하는 역할 등을 할 수 있다. 상기 단백질은 임의의 3차원 또는 4차원 구조를 가질 수 있으나, 이에 한정하지 않는다. 또한, 상기 단백질은 기지의 또는 미지의 임의의 기능을 수행할 수 있다. 상기 단백질의 구조에 대한 변형이 존재한다면, 중합체의 조립 전에 또는 후에 부여될 수 있다.The term "protein" used herein is a general term for organic substances composed of amino acids, and the protein may include, but is not limited to, structural proteins and biologically active proteins. The structural protein is generally composed of long and thin thread-like chains such as collagen, keratin, etc., and the biologically active protein catalyzes a chemical reaction occurring in the body of an organism like an enzyme or sends a signal to other parts of the body like a hormone. It can deliver, transport substances to other parts of the body, or play a role in defending the body from external invasion like antigens. The protein may have any three-dimensional or four-dimensional structure, but is not limited thereto. In addition, the protein may perform any known or unknown function. Modifications, if any, to the structure of the protein can be imparted before or after assembly of the polymer.
상기 단백질은 아미노산의 펩타이드 결합, 이온결합, 공유결합, 비공유결합에 의한 소수성결합, 수소결합, 반데르발스 힘, 정전기적 인력, 이황화(-S-S-)결합 등으로 단백질 구조의 변형이 발생 할 수 있으나, 이에 제한하지는 않는다.The protein may be modified in protein structure by peptide bonds of amino acids, ionic bonds, covalent bonds, hydrophobic bonds by non-covalent bonds, hydrogen bonds, van der Waals forces, electrostatic attraction, disulfide (-S-S-) bonds, etc. However, it is not limited thereto.
상기 단백질은 임의의 크기의 아미노산 또는 그것들의 유사체의 중합체 형태도 포함할 수 있으며, 이 때 아미노산의 종류와 아미노산 형태의 변형은 한정하지 않는다.The protein may also include polymers of amino acids of any size or analogs thereof, and in this case, the type of amino acid and the modification of the amino acid form are not limited.
용어 단백질, 효소는 상호교환 가능하게 사용된다.The terms protein and enzyme are used interchangeably.
본 명세서에서 사용되는 용어 "상보성(complementarity)"은 통상적인 왓슨-크릭(Watson-Crick) 염기 쌍형성 또는 기타 비통상적인 유형에 의한 다른 핵산 서열과 수소 결합(들)을 형성할 수 있는 핵산의 능력을 지칭한다. 상기 핵산서열은 아데닌(adenine, A), 사이토신(cytosine, C), 구아닌(guamine, G), 티민(thymine, T), 우라실(uracil, U)의 염기서열들을 의미한다. 핵산의 종류에 따라 DNA일 때는 아데닌은 다른 가닥의 티민과, 구아닌은 다른 가닥의 사이토신과 각각 수소결합으로 결합한다. RNA일 때는 아데닌이 우라실과 수소결합을 한다. 용어 '상보적'은 상보성을 포함하는 상태 또는 특징을 의미한다.As used herein, the term "complementarity" refers to the ability of a nucleic acid to form hydrogen bond(s) with another nucleic acid sequence by conventional Watson-Crick base pairing or other unusual types. refers to ability The nucleic acid sequence refers to nucleotide sequences of adenine (A), cytosine (C), guamine (G), thymine (T), and uracil (U). Depending on the type of nucleic acid, in the case of DNA, adenine bonds with thymine on the other strand and guanine bonds with cytosine on the other strand, respectively, through hydrogen bonds. In RNA, adenine hydrogen bonds with uracil. The term 'complementary' refers to the state or characteristic of including complementarity.
본 명세서에서 사용되는 용어 "상보적인 서열"은 상기 상보성을 가질 수 있는 서열인 것을 의미한다.As used herein, the term "complementary sequence" means a sequence that may have the above complementarity.
본 명세서에서, 상보성을 가지는 핵산, 핵산서열, 뉴클레오타이드 등은 수소 결합을 형성할 수 있는 핵산 분자 내의 잔기의 백분율을 의미한다(예를 들어, 10개 중 5, 6, 7, 8, 9, 10개는 50%, 60%, 70%, 80%, 90% 및 100% 상보성을 의미함). 또한, 본 명세서에서 특별한 언급이 없는 한, 상보성의 백분율은 50% 이상, 60% 이상, 70% 이상, 80% 이상, 90% 이상, 95% 이상, 99% 이상, 또는 100%의 서열 상보성을 갖는 모든 뉴클레오타이드 서열을 포함한다.In the present specification, nucleic acids, nucleic acid sequences, nucleotides, etc. having complementarity refer to the percentage of residues in a nucleic acid molecule capable of forming hydrogen bonds (e.g., 5, 6, 7, 8, 9, 10 out of 10). means 50%, 60%, 70%, 80%, 90% and 100% complementarity). Also, unless otherwise specified herein, percentage complementarity is a sequence complementarity of greater than 50%, greater than 60%, greater than 70%, greater than 80%, greater than 90%, greater than 95%, greater than 99%, or 100%. It includes all nucleotide sequences with
예를 들어, '제1 가이드핵산과 제2 가이드핵산은 서로 상보적인 서열을 가진다'는 말의 의미는 제1 가이드핵산의 염기서열과 제2 가이드핵산의 핵산서열이 서로 수소 결합을 형성할 수 있되, 위에서 언급한 바와 같이 전체 10개의 염기서열 중 5, 6, 7, 8, 9, 10개는 50%, 60%, 70%, 80%, 90% 및 100% 의 상보적인 결합을 할 수 있는 서열을 의미한다.For example, 'the first guide nucleic acid and the second guide nucleic acid have complementary sequences' means that the nucleotide sequence of the first guide nucleic acid and the nucleic acid sequence of the second guide nucleic acid can form hydrogen bonds with each other. However, as mentioned above, 5, 6, 7, 8, 9, and 10 of the total 10 nucleotide sequences can form 50%, 60%, 70%, 80%, 90% and 100% complementary bonds. means a sequence of
본 명세서에서 사용되는 용어 "공통 서열"은 다음과 같이 해석되어야 한다. 예를 들어, '제1 가이드핵산과 제2 가이드핵산은 서로 공통 서열을 가진다'는 말의 의미는 상기 제1 가이드핵산의 핵산서열과 상기 제2 가이드핵산의 핵산서열이 부분적으로 또는 전체적으로 같은 핵산서열을 가지고 있음을 의미한다. 이 때, 상기 제1 가이드핵산의 핵산서열이 10개이고, 상기 제2 가이드핵산의 핵산서열이 10개일 경우 염기서열 중 1, 2, 3, 4, 5, 6, 7, 8, 9, 10개의 염기서열이 같을 수 있는 경우 모두를 포함할 수 있다. 용어 공통 서열, 동일한 서열은 상호교환 가능하게 사용된다.As used herein, the term "consensus sequence" should be interpreted as follows. For example, 'a first guide nucleic acid and a second guide nucleic acid have a common sequence' means that the nucleic acid sequence of the first guide nucleic acid and the nucleic acid sequence of the second guide nucleic acid are partially or entirely identical to each other. It means you have a sequence. At this time, when the nucleic acid sequence of the first guide nucleic acid is 10 and the nucleic acid sequence of the second guide nucleic acid is 10, 1, 2, 3, 4, 5, 6, 7, 8, 9, or 10 of the base sequences When the nucleotide sequence may be the same, all may be included. The terms consensus sequence, identical sequence are used interchangeably.
본 명세서에서 사용되는 용어 "중첩"은 둘 이상의 핵산, 핵산 서열이 서로 동일한 핵산 서열을 부분적으로 공유하고 있거나 혹은 둘 이상의 핵산의 적어도 일부 영역들이 서로 상보적인 서열을 가지는 것을 의미한다. 이 때, 중첩된 정도(%)는 예를 들어, 염기 서열 10개 중 1, 2, 3, 4, 5, 6, 7, 8, 9, 10개는 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90% 및 100%를 포함할 수 있다.As used herein, the term "overlap" means that two or more nucleic acids or nucleic acid sequences partially share the same nucleic acid sequence, or at least some regions of two or more nucleic acids have complementary sequences. At this time, the degree of overlap (%) is, for example, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 out of 10 base sequences is 10%, 20%, 30%, 40 %, 50%, 60%, 70%, 80%, 90% and 100%.
조작용 조성물-유전자 가위 시스템Compositions for manipulation - Genetic Scissors System
본 출원에 의해 개시되는 기술은 중첩된 가이드핵산을 이용한 표적 핵산에 특정 핵산 서열을 삽입하기 위한 조성물로서, 가이드핵산과 유전자가위 단백질을 포함할 수 있다.The technology disclosed by the present application is a composition for inserting a specific nucleic acid sequence into a target nucleic acid using overlapping guide nucleic acids, and may include a guide nucleic acid and a gene scissors protein.
1. 가이드핵산(guide nucleic acid)1. Guide nucleic acid
상기 "가이드핵산"은 표적 핵산을 인식할 수 있는 핵산을 의미하며, Cas 단백질과 결합하여 Cas 단백질을 표적 핵산으로 인도할 수 있는 기능을 가진 것을 지칭한다. The "guide nucleic acid" refers to a nucleic acid capable of recognizing a target nucleic acid, and refers to a nucleic acid that binds to a Cas protein and has a function of guiding the Cas protein to a target nucleic acid.
상기 가이드핵산은 DNA, RNA 또는 DNA/RNA 혼합의 형태를 포함할 수 있으나, 바람직하게는 가이드 RNA일 수 있다.The guide nucleic acid may include DNA, RNA, or a DNA/RNA mixture, but may preferably be a guide RNA.
상기 가이드 RNA는 crRNA(CRISPR RNA) 또는/및 tracrRNA(trans-activating crRNA)를 포함할 수 있다. 상기 crRNA와 상기 tracrRNA의 특정 부위가 융합된 형태를 sgRNA(sinlge-chain guide RNA)로 지칭할 수 있다. The guide RNA may include crRNA (CRISPR RNA) and/or tracrRNA (trans-activating crRNA). A form in which the crRNA and a specific site of the tracrRNA are fused may be referred to as sgRNA (sinlge-chain guide RNA).
상기 가이드 RNA는 5 내지 150개, 5 내지 100개, 5 내지 50개, 5 내지 40, 또는 5 내지 30개의 핵산서열을 가질 수 있다.The guide RNA may have 5 to 150, 5 to 100, 5 to 50, 5 to 40, or 5 to 30 nucleic acid sequences.
상기 가이드핵산은 하나 이상의 도메인을 포함할 수 있다.The guide nucleic acid may include one or more domains.
이 때, 상기 도메인은 가이드 도메인, 제 1 상보적 도메인, 연결 도메인, 제 2 상보적 도메인, 근위 도메인, 꼬리 도메인 등 일 수 있으나, 이에 제한하지 않는다. 또한, 동일한 도메인을 반복적으로 포함하거나, 서로 다른 도메인을 포함할 수 있다.In this case, the domain may be a guide domain, a first complementary domain, a linking domain, a second complementary domain, a proximal domain, a tail domain, etc., but is not limited thereto. In addition, the same domain may be repeatedly included or different domains may be included.
상기 도메인의 개수는 1, 2, 3, 4, 5, 6 또는 그 이상의 가이드 도메인 또는/및 제 1 상보적 도메인 또는/및 연결 도메인 또는/및 제 2 상보적 도메인 또는/및 근위 도메인 또는/및 꼬리 도메인을 포함할 수 있다.The number of domains is 1, 2, 3, 4, 5, 6 or more guide domains or/and first complementary domains or/and linking domains or/and second complementary domains or/and proximal domains or/and A tail domain may be included.
선택적으로 상기 가이드 도메인 또는/및 상기 제 1 상보적 도메인 또는/및 상기 연결 도메인 또는/및 상기 제 2 상보적 도메인 또는/및 상기 근위 도메인 또는/및 상기 꼬리 도메인의 염기서열의 일부 또는 전부는 화학적 변형을 포함할 수 있다. 상기 화학적 변형은 methylation, acetylation, phosphorylation, phosphorothioate linkage, locked nucleic acid(LNA), 2'-O-methyl 3'phosphorothioate(MS) 또는 2'-O-methyl 3'thioPACE(MSP)일 수 있으나, 이에 제한되지 않는다.Optionally, part or all of the sequence of the guide domain or/and the first complementary domain or/and the linking domain or/and the second complementary domain or/and the proximal domain or/and the tail domain is chemically may contain variations. The chemical modification may be methylation, acetylation, phosphorylation, phosphorothioate linkage, locked nucleic acid (LNA), 2'-O-methyl 3'phosphorothioate (MS) or 2'-O-methyl 3'thioPACE (MSP), but Not limited.
상기 가이드핵산 및 상기 도메인의 길이는 서로 같거나 다를 수 있다.The guide nucleic acid and the domain may have the same length or different lengths.
상기 "가이드 도메인"은 표적 유전자 또는 핵산 상에서 표적 서열과 상보적인 결합을 할 수 있는 상보적인 가이드 서열이 포함된 도메인으로, 표적 유전자 또는 핵산과의 특이적인 상호작용을 위한 역할을 할 수 있다.The "guide domain" is a domain containing a complementary guide sequence capable of complementary binding with a target sequence on a target gene or nucleic acid, and may play a role for specific interaction with a target gene or nucleic acid.
상기 "제 1 상보적 도메인"은 제 2 상보적 도메인과 상보적 핵산서열을 포함하는 핵산 서열로, 제 2 상보적 도메인과 이중가닥을 형성할 수 있을 정도로 상보성을 가질 수 있다.The "first complementary domain" is a nucleic acid sequence including a nucleic acid sequence complementary to the second complementary domain, and may have complementarity to the extent of forming a double strand with the second complementary domain.
상기 "연결 도메인"은 두 개 이상의 도메인을 연결하는 핵산 서열로, 연결 도메인은 동일한 또는 서로 다른 두 개 이상의 도메인을 연결할 수 있다. 상기 연결 도메인은 두 개 이상의 도메인과 공유결합 또는 비공유결합을 할 수 있고, 또는 두 개 이상의 도메인을 공유적 또는 비공유적으로 연결할 수 있다.The "linking domain" is a nucleic acid sequence linking two or more domains, and the linking domain may link two or more identical or different domains. The linking domain may form a covalent or non-covalent bond with two or more domains, or may link two or more domains covalently or non-covalently.
상기 "제 2 상보적 도메인"은 상기 제 1 상보적 도메인과 상보적 핵산서열을 포함하는 핵산서열로 제 1 상보적 도메인과 이중가닥을 형성할 수 있을 정도로 상보성을 가질 수 있다.The "second complementary domain" is a nucleic acid sequence including a nucleic acid sequence complementary to the first complementary domain, and may have complementarity to the extent of forming a double strand with the first complementary domain.
상기 "근위 도메인"은 제 2 상보적 도메인에 근접하게 위치하는 핵산서열일 수 있다.The "proximal domain" may be a nucleic acid sequence located proximal to the second complementary domain.
상기 "꼬리 도메인"은 가이드핵산의 양 말단 중 어느 하나 이상의 말단에 위치하는 핵산서열일 수 있다.The "tail domain" may be a nucleic acid sequence located at one or more ends of both ends of the guide nucleic acid.
2. 유전자가위 단백질(2. Gene scissors protein ( genomegenome editingediting proteinprotein ))
상기 "유전자가위 단백질"은 표적 핵산 또는 유전자를 절단(cleavage)할 수 있는 기능을 수행하는 단백질을 지칭하며, 상기 유전자가위 단백질은 효소를 포함할 수 있으며, 상기 효소는 뉴클레아제, 프로테아제 또는 제한효소 등을 포함할 수 있으나, 이에 제한하지 않는다.The "cleaving protein" refers to a protein that performs a function of cleaving a target nucleic acid or gene, and the cleaving protein may include an enzyme, wherein the enzyme is a nuclease, a protease or a restriction enzyme. Enzymes, etc. may be included, but are not limited thereto.
상기 유전자가위 단백질은 자연 상태에 존재하는 또는 존재하지 않는 인위적으로 생성된 효소 또는 단백질의 형태 또는 그것들의 일부가 변형된 형태를 포함할 수 있다.The gene editing protein may include a form of an artificially produced enzyme or protein that exists or does not exist in nature, or a form in which a part thereof is modified.
상기 효소는 CRISPR 효소일 수 있다.The enzyme may be a CRISPR enzyme.
상기 CRISPR 효소는 CRISPR-Cas 시스템을 구성하는 단백질로서, 가이드핵산과 결합하여 복합체를 형성하여 표적 서열을 절단 또는 위치를 변형시키는 기능을 수행할 수 있다.The CRISPR enzyme is a protein constituting the CRISPR-Cas system, and may bind to a guide nucleic acid to form a complex to cut or modify a target sequence.
상기 CRISPR 효소는 효소의 활성을 변경시켜 불완전 또는 부분 활성을 가지도록 변형한 형태를 포함할 수 있다.The CRISPR enzyme may include a form modified to have incomplete or partial activity by changing the activity of the enzyme.
상기 CRISPR 효소는 Cas1, Cas1B, Cas2, Cas3, Cas4, Cas5, Cas6, Cas7, Cas8, Cas9(Csn1 및 Csx12로도 알려짐), Cas10, Csy1, Csy2, Csy3, Cse1, Cse2, Csc1, Csc2, Csa5, Csn2, Csm2, Csm3, Csm4, Csm5, Csm6, Cmr1, Cmr3, Cmr4, Cmr5, Cmr6, Csb1, Csb2, Csb3, Csx17, Csx14, Csx10, Csx16, CsaX, Csx3, Csx1, Csx15, Csf1, Csf2, Csf3, Csf4, Cpf1 등의 자연상태로 존재하는 것 또는 인위적으로 변형된 형태를 포함할 수 있으나, 이에 제한하지는 않는다.The CRISPR enzymes are Cas1, Cas1B, Cas2, Cas3, Cas4, Cas5, Cas6, Cas7, Cas8, Cas9 (also known as Csn1 and Csx12), Cas10, Csy1, Csy2, Csy3, Cse1, Cse2, Csc1, Csc2, Csa5, Csn2 , Csm2, Csm3, Csm4, Csm5, Csm6, Cmr1, Cmr3, Cmr4, Cmr5, Cmr6, Csb1, Csb2, Csb3, Csx17, Csx14, Csx10, Csx16, CsaX, Csx3, Csx1, Csx15, Csf1, Csf2, Csf4, , Cpf1, etc., which exist in a natural state or artificially modified forms, but are not limited thereto.
상기 CRISPR 효소는 CRISPR 시스템의 종류에 따라 크게 6가지의 Type으로 나눌 수 있다. Type I은 Cas1, Cas2, Cas3, Cas8 등으로 구성될 수 있고; Type II는 Cas1, Cas2, Cas2/Cas4, Cas9 등으로 구성될 수 있고; Type III는 Cas5, Cas6, Cmr1, Cmr3, Cmr4, Cmr5, Cas5/Cmr1, Cam2, Cmr5 등으로 구성될 수 있고; Type IV는 Csf1, Csf2, Csf3 등으로 구성될 수 있고; Type V는 Cas1, Cas2, Cas1, Cas2, Cas4, Cpf1, Cpf2 등으로 구성될 수 있고; Type VI는 C2C2, Cas1, Cas2 등으로 구성될 수 있으나, 이에 한정하지 않는다.The CRISPR enzyme can be divided into six types according to the type of CRISPR system. Type I may consist of Cas1, Cas2, Cas3, Cas8, etc.; Type II may consist of Cas1, Cas2, Cas2/Cas4, Cas9, etc.; Type III may consist of Cas5, Cas6, Cmr1, Cmr3, Cmr4, Cmr5, Cas5/Cmr1, Cam2, Cmr5, etc.; Type IV may consist of Csf1, Csf2, Csf3, etc.; Type V may consist of Cas1, Cas2, Cas1, Cas2, Cas4, Cpf1, Cpf2, etc.; Type VI may be composed of C2C2, Cas1, Cas2, etc., but is not limited thereto.
상기 CRISPR 효소의 Type 중 Type II의 Cas9과 Type V의 Cpf1이 일반적으로 가장 많이 사용된다.Among the types of CRISPR enzymes, Cas9 of Type II and Cpf1 of Type V are generally most used.
상기 Cas9은 스트렙토코커스 피오게네스(Streptococcus pyogenes), 스트렙토코커스 써모필러스(Streptococcus thermophilus), 스트렙토코커스 속(Streptococcus sp.), 황색포도상구균(Staphylococcus aureus), 노카르디옵시스 다손빌레이(Nocardiopsis dassonvillei), 스트렙토마이세스 프리스티네스피랄리스(Streptomyces pristinaespiralis), 스트렙토마이세스 비리도크로모게네스(Streptomyces viridochromogenes), 스트렙토마이세스 비리도크로모게네스(Streptomyces viridochromogenes), 스트렙토스포랑기움 로세움(Streptosporangium roseum), 스트렙토스포랑기움 로세움(Streptosporangium roseum), 알리사이클로바클루스 아시도칼다리우스(AlicyclobacHlus acidocaldarius), 바실러스 슈도마이코이데스(Bacillus pseudomycoides), 바실러스 셀레니티레두센스(Bacillus selenitireducens), 엑시구오박테리움 시비리쿰(Exiguobacterium sibiricum), 락토바실러스 델브루에키이(Lactobacillus delbrueckii), 락토바실러스 살리바리우스(Lactobacillus salivarius), 미크로스 킬라 마리나(Microscilla marina), 부르크홀데리아레스 박테리움(Burkholderiales bacterium), 폴라로모나스 나프탈레니보란스(Polaromonas naphthalenivorans), 폴라로모나스 속(Polaromonas sp.), 크로코스파에라 와트소니이(Crocosphaera watsonii), 시아노테세 속(Cyanothece sp.), 마이크로시스티스 아에루기노사(Microcystis aeruginosa), 시네코코커스 속(Synechococcus sp.), 아세토할로비움 아라바티쿰(Acetohalobium arabaticum), 암모니펙스 데겐시이(Ammonifex degensii), 칼디셀룰로시럽토 베시이(Caldicelulosiruptor bescii), 칸디다투스 데술포루디스(Candidatus Desulforudis), 클로스트리듐 보툴리눔(Clostridium botulinum), 클로스트리듐 디피실레(Clostridium difficile), 피네골디아 마그나(Finegoldia magna), 나트라나에로비우스 써모필러스 (Natranaerobius thermophilus), 펠로토마쿨럼 써모프로피오니쿰(Pelotomaculum thermopropionicum), 아시디티오바실러스 칼두스(Acidithiobacillus caldus), 아시디티오바실러스 페로옥시단스(Acidithiobacillus ferrooxidans), 알로크로마티움 비노숨(Allochromatium vinosum), 마리노박터 속(Marinobacter sp.), 니트로소코커스 할로필러스(Nitrosococcus halophilus), 니트로소코커스 와트소니(Nitrosococcus watsoni), 슈도알테로 모나스 할로플란크티스(Pseudoalteromonas haloplanktis), 크테도노박테르 라세미페르(Ktedonobacter racemifer), 메타노할로비움 에베스티가툼(Methanohalobium evestigatum), 아나베나 바리아빌리스(Anabaena variabilis), 노둘라리아 스푸미게나(Nodularia spumigena), 노스톡 속(Nostoc sp.), 아르트로스피라 맥시마(Arthrospira maxima), 아르트로스피라 플라텐시스(Arthrospira platensis), 아르트로스피라 속(Arthrospira sp.), 링비아속(Lyngbya sp.), 마이크로콜레우스 크토노플라스테스(Microcoleus chthonoplastes), 오실라토리아 속(Oscillatoria sp.), 페트로토가 모빌리스(Petrotoga mobilis), 써모시포 아프리카누스(Thermosipho africanus) 또는 아카리오클로리스 마리나(Acaryochloris marina) 등 다양한 미생물 유래의 Cas9일 수 있다.The Cas9 is Streptococcus pyogenes, Streptococcus thermophilus, Streptococcus sp. , Staphylococcus aureus , Nocardiopsis dassonvillei , Streptomyces pristinaespiralis , Streptomyces viridochromogenes , Streptomyces viridochromogenes , Streptomyces viridochromogenes , Streptosporangium roseum , Streptosporangium roseum , AlicyclobacHlus acidocaldarius , Bacillus pseudomycoides , Bacillus selenitireducens , Exiguobacterium fertilization Ricum ( Exiguobacterium sibiricum ), Lactobacillus delbrueckii ( Lactobacillus delbrueckii ), Lactobacillus salivarius ( Lactobacillus salivarius ), Microscilla marina ( Microscilla marina ), Burkholderiales bacterium ( Burkholderiales bacterium ), Polaromonas naphthal Renivorans ( Polaromonas naphthalenivorans ), Polaromonas genus ( Polaromonas sp.), Crocosphaera Watsonii ( Crocosphaera watsonii ), Cyanothece genus ( Cyanothece sp.), Microcystis aeruginosa ( Microcystis aeruginosa ) , Synechococcus genus ( Synechococcus sp.), Acetohalobium Arabaticum ( Acetohalobium arabaticum ), Ammonifex degensii ( Ammonifex degensii ), Caldicelulosiruptor bescii ( Caldicelulosiruptor bescii ), Candidatus Desulforudis ( Candidatus Desulforudis ), Clostridium Botulinum ( Clostridium botulinum ), Clostridium difficile ( Clostridium difficile ), Finegoldia magna ( Finegoldia magna ), Natranaerobius thermophilus ( Natranaerobius thermophilus ), Pelotomaculum thermopropionicum ( Pelotomaculum thermopropionicum ), Acidithiobacillus caldus, Acidithiobacillus ferrooxidans , Allochromatium vinosum , Marinobacter genus ( Marinobacter sp.), Nitrosococcus halophilus ( Nitrosococcus halophilus ), Nitrosococcus watsoni , Pseudoalteromonas haloplanktis , Ctedonobacter racemifer , Methanohalobium evestigatum ), Anabaena variabilis , Nodularia spumigena ( Nodularia spumigena ), Nostoc genus ( Nostoc sp.), Arthrospira Maxima ( Arthrospira maxima ), Arthrospira Platensis ( Arthrospira platensis ), Arthrospira ( Arthrospira sp.), Lyngbya ( Lyngbya sp.), Microcoleus Microcoleus chthonoplastes , Oscillatoria sp., Petrotoga mobilis , Thermosipho africanus or Acaryochloris marina ( Acaryochloris marina ) derived from various microorganisms. It may be Cas9.
또한, 상기 Cpf1은 Streptococcus, Campylobacter, Nitratifractor, Staphylococcus, Parvibaculum, Roseburia, Neisseria, Gluconacetobacter, Azospirillum, Sphaerochaeta, Lactobacillus, Eubacterium, Corynebacter, Carnobacterium, Rhodobacter, Listeria, Paludibacter, Clostridium, Lachnospiraceae, Clostridiaridium, Leptotrichia, Francisella, Legionella, Alicyclobacillus, Methanomethyophilus, Porphyromonas, Prevotella, Bacteroidetes, Helcococcus, Letospira, Desulfovibrio, Desulfonatronum, Opitutaceae, Tuberibacillus, Bacillus, Brevibacilus, Methylobacterium 또는 Acidaminococcus 유래의 Cpf1일 수 있다. In addition, the Cpf1 is Streptococcus, Campylobacter, Nitratifractor, Staphylococcus, Parvibaculum, Roseburia, Neisseria, Gluconacetobacter, Azospirillum, Sphaerochaeta, Lactobacillus, Eubacterium, Corynebacter, Carnobacterium, Rhodobacter, Listeria, Paludibacter, Clostridium, Lachnospiraceae, Clostridiaridium, Leptotrichia, Francisella, Legionella , Alicyclobacillus, Methanomethyophilus, Porphyromonas, Prevotella, Bacteroidetes, Helcococcus, Letospira, Desulfovibrio, Desulfonatronum, Opitutaceae, Tuberibacillus, Bacillus, Brevibacilus, Methylobacterium or Acidaminococcus .
상기 Cas9은 HNH 도메인, RuvC 도메인, PAM-상호작용(PI)도메인으로 구성될 수 있으며, 구체적인 Cas9의 구조적 특성은 Hiroshi Nishimasu et al. (2014) Cell 156:935-949를 참고할 수 있다.The Cas9 may be composed of an HNH domain, a RuvC domain, and a PAM-interacting (PI) domain, and specific structural characteristics of Cas9 are described in Hiroshi Nishimasu et al. (2014) Cell 156:935-949.
상기 Cpf1은 RuvC 도메인, Nuc 도메인, PAM-상호작용(PI)도메인으로 구성될 수 있으며, 구체적인 Cpf1의 구조적 특성은 Takashi Yamano et al. (2016) Cell 165:949-962를 참고할 수 있다.The Cpf1 may be composed of a RuvC domain, a Nuc domain, and a PAM-interacting (PI) domain, and specific structural characteristics of Cpf1 are described by Takashi Yamano et al. (2016) Cell 165:949-962.
상기 CRISPR 효소는 가이드핵산과 상호작용하여 복합체를 형성하여 표적 핵산 또는 유전자의 표적 서열을 절단 또는 위치를 변형시키는 기능을 수행할 수 있다. 이 때, 그 기능은 상기 CRISPR 효소가 직접적으로 인지하는 PAM(protospacer adjacent modif)을 포함해야한다. 즉, 상기 PAM의 염기서열은 CRISPR 효소의 종에 따라 달라진다. 예를 들어, 일반적으로 많이 사용되는, Streptococcus pyogenes 에서 유래된 Cas9 단백질의 경우 5'-NGG-3'가 PAM 염기서열이 된다. 예를 들어, Staphylococcus aureus 에서 유래된 Cas9 단백질은 5'-NNGRRT-3'를 PMA 염기서열로 가진다. 결과적으로 상기 표적 핵산 또는 유전자의 표적 서열을 절단 또는 위치의 변형을 수행할 때, CRISPR 효소의 종의 선택에 따라 필수적으로 PAM의 염기서열이 바뀌며, 그것들에 의해 표적 서열을 절단 또는 위치의 변형이 결정된다. The CRISPR enzyme may form a complex by interacting with a guide nucleic acid to cut or modify a target sequence of a target nucleic acid or gene. At this time, the function should include a PAM (protospacer adjacent modif) that the CRISPR enzyme directly recognizes. That is, the nucleotide sequence of the PAM varies depending on the species of the CRISPR enzyme. For example, in the case of Cas9 protein derived from Streptococcus pyogenes , which is commonly used, 5'-NGG-3' becomes the PAM sequence. For example, the Cas9 protein derived from Staphylococcus aureus has 5'-NNGRRT-3' as a PMA nucleotide sequence. As a result, when cutting or modifying the position of the target sequence of the target nucleic acid or gene, the nucleotide sequence of the PAM is essentially changed according to the selection of the CRISPR enzyme species, thereby cutting the target sequence or modifying the position. It is decided.
3. 가이드핵산 및 유전자가위 단백질을 포함하는 조성물3. Composition containing guide nucleic acid and gene scissors protein
<제1 실시예><First Embodiment>
본 출원에 의해 개시되는 타겟 시퀀스를 조작하기 위한 조성물은, 표적 핵산에 대한 조작 효율을 높일 수 있는 것으로, 제1 가이드 핵산 또는 이를 인코딩하고 있는 핵산, 제2 가이드 핵산 또는 이를 인코딩하고 있는 핵산 및 유전자가위 단백질 또는 이를 인코딩하고 있는 핵산을 포함할 수 있다. 이 때, 상기 제1 가이드 핵산과 상기 제2 가이드 핵산은 완전히 동일하지는 않다. 즉, 상기 타겟 시퀀스를 조작하기 위한 조성물은, 적어도 둘 이상의 서로 다른 가이드 핵산을 포함할 수 있다.The composition for manipulating a target sequence disclosed in the present application can increase the manipulation efficiency of a target nucleic acid, and includes a first guide nucleic acid or a nucleic acid encoding the same, a second guide nucleic acid or a nucleic acid and a gene encoding the same. It may include a scissor protein or a nucleic acid encoding the same. At this time, the first guide nucleic acid and the second guide nucleic acid are not completely identical. That is, the composition for manipulating the target sequence may include at least two or more different guide nucleic acids.
상기 조성물은 서로 동일한 서열을 가지는 복수의 제1 가이드 핵산을 포함할 수 있다. 또한, 상기 조성물은 서로 동일한 서열을 가지는 복수의 제2 가이드 핵산을 포함할 수 있다. 또한, 상기 조성물은 복수의 유전자 가위 단백질을 포함할 수 있다. The composition may include a plurality of first guide nucleic acids having the same sequence as each other. In addition, the composition may include a plurality of second guide nucleic acids having the same sequence as each other. In addition, the composition may include a plurality of gene editing proteins.
상기 제1 가이드 핵산의 서열 및 상기 제2 가이드 핵산의 서열은 서로 상이할 수 있다. 다만, 본 출원에 의해 개시되는 조성물에 있어서, 상기 제1 가이드 핵산의 서열의 적어도 일부 및 상기 제2 가이드 핵산의 서열의 적어도 일부는 서로 연관되어 있다. The sequence of the first guide nucleic acid and the sequence of the second guide nucleic acid may be different from each other. However, in the composition disclosed by the present application, at least a portion of the sequence of the first guide nucleic acid and at least a portion of the sequence of the second guide nucleic acid are associated with each other.
예를 들어, 상기 제1 가이드 핵산 및 상기 제2 가이드 핵산은 서로 동일한 유전자를 표적화할 수 있다. For example, the first guide nucleic acid and the second guide nucleic acid may target the same gene.
다른 예를 들어, 상기 제1 가이드 핵산 및 상기 제2 가이드 핵산은 서로 동일한 엑손을 표적화할 수 있다.In another example, the first guide nucleic acid and the second guide nucleic acid may target the same exon.
또 다른 예를 들어, 상기 제1 가이드 핵산 및 상기 제2 가이드 핵산은 서로 동일한 인트론을 표적화할 수 있다.In another example, the first guide nucleic acid and the second guide nucleic acid may target the same intron.
본 출원에 의해 개시되는 상기 제1 가이드 핵산 및 상기 제2 가이드 핵산은 서로 중첩될 수 있다. The first guide nucleic acid and the second guide nucleic acid disclosed by the present application may overlap each other.
본 명세서에 있어서, 상기 "중첩"이라는 용어는, 둘 이상의 핵산이 서로 동일한 핵산 서열을 부분적으로 공유하고 있거나 혹은 둘 이상의 핵산의 적어도 일부 영역들이 서로 상보적인 서열을 가지는 것을 의미한다.In the present specification, the term "overlapping" means that two or more nucleic acids partially share the same nucleic acid sequence or at least some regions of two or more nucleic acids have complementary sequences.
예를 들어, 상기 제1 가이드 핵산이 제1 영역 및 제2 영역을 가지고 있고, 상기 제2 가이드 핵산이 제3 영역 및 제4 영역을 가지고 있을 때, 상기 제2 영역의 서열과 상기 제3 영역의 서열이 서로 동일한 서열인 경우, 상기 제1 가이드 핵산과 상기 제2 가이드 핵산은 서로 중첩되어 있다고 할 수 있다.For example, when the first guide nucleic acid has a first region and a second region, and the second guide nucleic acid has a third region and a fourth region, the sequence of the second region and the third region When the sequences of are identical to each other, the first guide nucleic acid and the second guide nucleic acid may be said to overlap each other.
다른 예를 들어, 상기 제1 가이드 핵산이 제1 영역 및 제2 영역을 가지고 있고, 상기 제2 가이드 핵산이 제3 영역 및 제4 영역을 가지고 있을 때, 상기 제2 영역의 서열과 상기 제3 영역의 서열이 서로 상보적인 서열인 경우, 상기 제1 가이드 핵산과 상기 제2 가이드 핵산은 서로 중첩되어 있다고 할 수 있다.In another example, when the first guide nucleic acid has a first region and a second region, and the second guide nucleic acid has a third region and a fourth region, the sequence of the second region and the third region When the sequence of the region is complementary to each other, it can be said that the first guide nucleic acid and the second guide nucleic acid overlap each other.
이하에서, 특별한 언급이 없는 한, 둘 이상의 핵산이 서로 중첩되어 있다고 기재하는 경우, 상기 둘 이상의 핵산이 서로 공통된 염기 서열을 가지는 경우와 서로 상보적인 서열을 가지는 경우를 모두 지칭하는 것으로 한다.Hereinafter, unless otherwise specified, when it is described that two or more nucleic acids overlap with each other, it shall refer to both the case where the two or more nucleic acids have a common nucleotide sequence and the case where they have complementary sequences.
전술한 바와 같이, 상기 제1 가이드 핵산 및 상기 제2 가이드 핵산은 각각 가이드 도메인, 제 1 상보적 도메인, 연결 도메인, 제 2 상보적 도메인, 근위 도메인, 꼬리 도메인을 가질 수 있다.As described above, the first guide nucleic acid and the second guide nucleic acid may each have a guide domain, a first complementary domain, a linking domain, a second complementary domain, a proximal domain, and a tail domain.
본 출원에 의해 개시되는 상기 제1 가이드 핵산 및 상기 제2 가이드 핵산에 있어서, 특히, 상기 제1 가이드 핵산의 가이드 도메인 및 상기 제2 가이드 핵산의 가이드 도메인이 서로 중첩되어 있을 수 있다.In the first guide nucleic acid and the second guide nucleic acid disclosed in the present application, in particular, the guide domain of the first guide nucleic acid and the guide domain of the second guide nucleic acid may overlap each other.
상기 조성물에 포함된 유전자가위 단백질은 모두 동일한 종의 CRIPSR 효소일 수 있다.The scissors proteins included in the composition may all be CRIPSR enzymes of the same species.
본 출원에 의해 개시되는 상기 조성물에 포함되어 있는 상기 유전자가위 단백질이 모두 동일한 종의 CRISPR 효소(예를 들어, SpCas9)인 경우, 상기 제1 가이드 핵산의 제1 상보적 도메인 및 제2 상보적 도메인은 각각 상기 제2 가이드 핵산의 제1 상보적 도메인 및 제2 상보적 도메인과 서로 동일할 수 있다.When all of the scissors proteins included in the composition disclosed by the present application are CRISPR enzymes (eg, SpCas9) of the same species, the first complementary domain and the second complementary domain of the first guide nucleic acid Each may be identical to the first complementary domain and the second complementary domain of the second guide nucleic acid.
이하에서는, 설명의 편의를 위하여, 둘 이상의 가이드 핵산들이 서로 중첩되어 있다고 기재하면, 특별한 언급이 없는 한, 둘 이상의 가이드 핵산들 각각의 가이드 도메인이 서로 중첩되어 있는 것을 의미하는 것으로 한다.Hereinafter, for convenience of explanation, when two or more guide nucleic acids are described as overlapping with each other, unless otherwise specified, guide domains of each of the two or more guide nucleic acids are overlapped with each other.
상기 제1 가이드 핵산 및 상기 제2 가이드 핵산이 서로 중첩된 중첩 길이는 2 - 16 bp일 수 있다.The overlapping length of the first guide nucleic acid and the second guide nucleic acid may be 2-16 bp.
상기 제1 가이드 핵산 및 상기 제2 가이드 핵산은 서로 10~80% 정도 중첩될 수 있다.The first guide nucleic acid and the second guide nucleic acid may overlap each other by 10 to 80%.
상기 제1 가이드 핵산을 인코딩하고 있는 핵산, 상기 제2 가이드 핵산을 인코딩하고 있는 핵산 및 상기 유전자가위 단백질을 인코딩하고 있는 핵산은 동일한 벡터에 패키징되어 있을 수 있다.A nucleic acid encoding the first guide nucleic acid, a nucleic acid encoding the second guide nucleic acid, and a nucleic acid encoding the scissors protein may be packaged in the same vector.
또는, 상기 제1 가이드 핵산을 인코딩하고 있는 핵산, 상기 제2 가이드 핵산을 인코딩하고 있는 핵산 및 상기 유전자가위 단백질을 인코딩하고 있는 핵산 중 둘은 동일한 벡터에 패키징되어 있고, 나머지 하나는 다른 벡터에 패키징되어 있을 수 있다.Alternatively, two of the nucleic acid encoding the first guide nucleic acid, the nucleic acid encoding the second guide nucleic acid, and the nucleic acid encoding the scissor protein are packaged in the same vector, and the other is packaged in a different vector. may have been
또는, 상기 제1 가이드핵산, 상기 제2 가이드핵산 및 상기 유전자가위 단백질을 인코딩하고 있는 핵산은 동일한 벡터에 패키징 되거나 또는 서로 다른 벡터에 패키징 될 수 있다.Alternatively, the nucleic acids encoding the first guide nucleic acid, the second guide nucleic acid, and the scissors protein may be packaged in the same vector or packaged in different vectors.
또는, 상기 제1 가이드핵산, 상기 제2 가이드핵산을 인코딩하고 있는 핵산 및 상기 유전자가위 단백질을 인코딩하고 있는 핵산은 동일한 벡터에 패키징 되거나 또는 서로 다른 벡터에 패키징 될 수 있다.Alternatively, the nucleic acid encoding the first guide nucleic acid, the second guide nucleic acid, and the nucleic acid encoding the shear protein may be packaged in the same vector or in different vectors.
또는, 상기 제1 가이드핵산을 인코딩하고 있는 핵산, 상기 제2 가이드핵산 및 상기 유전자가위 단백질을 인코딩하고 있는 핵산은 동일한 벡터에 패키징 되거나 또는 서로 다른 벡터에 패키징 될 수 있다.Alternatively, the nucleic acid encoding the first guide nucleic acid, the second guide nucleic acid, and the nucleic acid encoding the scissors protein may be packaged in the same vector or in different vectors.
또는, 상기 제1 가이드핵산, 상기 제2 가이드핵산 및 상기 유전자가위 단백질은 서로 결합하여(또는 상호작용하여) 복합체를 형성한 상태로 상기 조성물에 포함되어 있을 수 있다. 이 때, 상기 복합체는 제1 가이드핵산 또는/및 상기 제2 가이드핵산과 유전자가위 단백질의 상호작용을 통해 형성된 복합체를 의미하며, 핵산-단백질 복합체(예를 들어, ribonucleoprotein;RNP)는 상기 제1 가이드핵산 또는/및 상기 제2 가이드핵산과 유전자가위 단백질의 상호작용을 통해 형성된 복합체을 포함할 수 있다. Alternatively, the first guide nucleic acid, the second guide nucleic acid, and the scissor protein may be included in the composition in a state in which a complex is formed by binding (or interacting) with each other. At this time, the complex refers to a complex formed through the interaction of the first guide nucleic acid or / and the second guide nucleic acid and the gene scissors protein, and the nucleic acid-protein complex (eg, ribonucleoprotein; RNP) is the first guide nucleic acid or / and the second guide nucleic acid. It may include a guide nucleic acid or/and a complex formed through interaction between the second guide nucleic acid and the gene scissors protein.
이 때, 상기 유전자 가위 단백질 1분자에 대하여, 상기 제1 가이드핵산 1분자 및 상기 제2 가이드핵산 1분자가 모두 결합(또는 상호작용)하여 상기 복합체를 형성하는 것은 아니고, 상기 유전자가위 단백질 1분자와 상기 제1 가이드핵산 1분자가 하나의 복합체(제1 가이드핵산-단백질 복합체)를 형성하고, 상기 유전자가위 단백질 1분자와 상기 제2 가이드핵산 1분자가 다른 하나의 복합체(제2 가이드핵산-단백질 복합체)를 형성하는 것이 일반적이다.At this time, one molecule of the first guide nucleic acid and one molecule of the second guide nucleic acid do not both bind (or interact) to form the complex with respect to one molecule of the scissors protein, and one molecule of the scissors protein and one molecule of the first guide nucleic acid form one complex (first guide nucleic acid-protein complex), and one molecule of the scissors protein and one molecule of the second guide nucleic acid form another complex (second guide nucleic acid-protein complex). It is common to form protein complexes.
이하에서, 특별한 언급이 없는 한, 복합체라고 기재하는 경우, 가이드핵산-단백질 복합체를 포함하는 상기 핵산-단백질 복합체를 복합체로 칭하는 것으로 한다.Hereinafter, unless otherwise specified, when described as a complex, the nucleic acid-protein complex including a guide nucleic acid-protein complex is referred to as a complex.
상기 제1 가이드핵산 및 상기 유전자가위 단백질은 서로 결합하여 복합체를 형성한 상태로 상기 제2 가이드핵산을 인코딩하고 있는 핵산과 상기 조성물에 포함되어 있을 수 있다.The first guide nucleic acid and the cleaving protein may be included in the composition and the nucleic acid encoding the second guide nucleic acid in a state in which they bind to each other to form a complex.
또는, 상기 제2 가이드핵산 및 상기 유전자가위 단백질은 서로 결합하여 복합체를 형성한 상태로 상기 제1 가이드핵산을 인코딩하고 있는 핵산과 상기 조성물에 포함되어 있을 수 있다.Alternatively, the second guide nucleic acid and the scissors protein may be combined with each other to form a complex, and the nucleic acid encoding the first guide nucleic acid and the composition may be included in the composition.
상기 조성물은 제3 가이드 핵산을 더 포함할 수 있다. 상기 제3 가이드 핵산은 상기 제1 가이드 핵산 또는 상기 제2 가이드 핵산과 서로 중첩되어 있을 수 있다. 보다 구체적으로, 상기 제3 가이드 핵산의 가이드 도메인이 상기 제1 가이드 핵산의 상기 가이드 도메인 또는 상기 제2 가이드 핵산의 상기 가이드 도메인과 서로 중첩되어 있을 수 있다.The composition may further include a third guide nucleic acid. The third guide nucleic acid may overlap with the first guide nucleic acid or the second guide nucleic acid. More specifically, the guide domain of the third guide nucleic acid may overlap with the guide domain of the first guide nucleic acid or the guide domain of the second guide nucleic acid.
상기 조성물은, 상기 제1 내지 제3 가이드 핵산을 제외한 추가적인 가이드 핵산을 더 포함할 수도 있다.The composition may further include additional guide nucleic acids other than the first to third guide nucleic acids.
본 출원에 의해 개시되는 조성물에 포함되는 둘 이상의 가이드 핵산들이 서로 어떠한 형태로 중첩될 수 있는지에 대하여 도 1을 참조하여 이하에서 간략하게 설명하기로 한다.How two or more guide nucleic acids included in the composition disclosed by the present application may overlap each other will be briefly described below with reference to FIG. 1 .
도 1에는 제1 영역(①) 및 제2 영역(②)을 포함하고 있는 제1 가이드핵산, 제3 영역(③) 및 제4 영역(④)을 포함하고 있는 제2 가이드핵산, 제1 PAM 서열, 제2 PAM 서열, 제1 부분(ⓐ), 제2 부분(ⓑ) 및 표적 핵산이 도시되어 있다.1, the first guide nucleic acid including the first region (①) and the second region (②), the second guide nucleic acid including the third region (③) and the fourth region (④), and the first PAM Sequence, second PAM sequence, first part (ⓐ), second part (ⓑ) and target nucleic acid are shown.
도 1의 (a)에는 상기 제1 가이드핵산 및 상기 제2 가이드 핵산이, 타겟 유전자에 대한 이중 가닥의 절단(cleavage) 또는 특정 서열의 유전자의 삽입(insertion)을 유도하기 위하여, 타겟 유전자의 이중 가닥 중 동일한 가닥에 대해 상보적으로 결합하는 경우가 도시되어 있다. 한편, 도 1의 (b)에는 상기 제1 가이드 핵산 및 상기 제2 가이드 핵산이, 타겟 유전자에 대한 이중 가닥의 절단(cleavage) 또는 특정 서열의 유전자의 삽입(insertion)을 유도하기 위하여, 타겟 유전자의 이중 가닥의 서로 다른 가닥에 대해 상보적으로 결합하는 경우가 도시되어 있다.In (a) of FIG. 1, the first guide nucleic acid and the second guide nucleic acid are used to induce double-stranded cleavage of a target gene or insertion of a gene having a specific sequence. Cases of complementary binding to the same strand of the strands are shown. On the other hand, in (b) of FIG. 1, the first guide nucleic acid and the second guide nucleic acid are included in the target gene in order to induce double-stranded cleavage or insertion of a specific sequence gene into the target gene. The case of complementary binding to the other strand of the double strand of is shown.
도 1의 (a)와 같이, 상기 제1 가이드핵산과 상기 제2 가이드핵산이 서로 동일한 가닥(same strand)에 상보적으로 결합하도록 상기 제1 및 제2 가이드핵산이 설계된 경우, 상기 제1 가이드핵산의 상기 제2 영역 또는/및 상기 제2 가이드핵산의 상기 제3 영역이 서로 공통 서열을 가질 수 있다. 이 때, 상기 제1 영역 및 상기 제2 영역이 상기 표적 핵산의 제1 부분(ⓐ)에 상보적이고, 상기 제2 가이드핵산의 상기 제3 영역 또는/및 상기 제4 영역이 상기 표적 핵산의 상기 제2 부분(ⓑ)에 상보적일 수 있다.As shown in (a) of FIG. 1, when the first and second guide nucleic acids are designed so that the first and second guide nucleic acids complementarily bind to the same strand, the first guide nucleic acid The second region of the nucleic acid or/and the third region of the second guide nucleic acid may have a sequence in common with each other. In this case, the first region and the second region are complementary to the first portion (ⓐ) of the target nucleic acid, and the third region or/and the fourth region of the second guide nucleic acid is complementary to the first portion (ⓐ) of the target nucleic acid. It may be complementary to the second part (ⓑ).
한편, 도 1의 (b)와 같이, 상기 제1 가이드핵산과 상기 제2 가이드핵산이 서로 다른 가닥(different strand)에 상보적으로 결합하도록 상기 제1 및 제2 가이드핵산이 설계된 경우, 상기 제1 가이드핵산의 상기 제2 영역이 상기 제2 가이드핵산의 상기 제3 영역과 서로 상보적인 서열을 가질 수 있다. 이 때, 상기 제1 영역 및 상기 제2 영역이 상기 표적 핵산의 제1 부분(ⓐ)에 상보적이고, 상기 제2 가이드핵산의 상기 제3 영역 또는/및 상기 제4 영역이 상기 표적 핵산의 상기 제2 부분(ⓑ)에 상보적일 수 있다.Meanwhile, as shown in (b) of FIG. 1, when the first and second guide nucleic acids are designed so that the first and second guide nucleic acids complementarily bind to different strands, the first guide nucleic acid and the second guide nucleic acid are designed to complement each other. The second region of one guide nucleic acid may have a sequence complementary to the third region of the second guide nucleic acid. In this case, the first region and the second region are complementary to the first portion (ⓐ) of the target nucleic acid, and the third region or/and the fourth region of the second guide nucleic acid is complementary to the first portion (ⓐ) of the target nucleic acid. It may be complementary to the second part (ⓑ).
전술한 바와 같이, 도 1의 (a)에 도시된 바와 같이, 상기 제1 가이드핵산의 적어도 일부분(예를 들어, 제2 영역)과 상기 제2 가이드핵산의 적어도 일부분(예를 들어, 제3 영역)이 서로 공통된 서열을 가지는 경우와 같이 상기 제1 가이드핵산과 상기 제2 가이드핵산이 중첩될 수 있으며, 도 1의 (b)에 도시된 바와 같이, 상기 제1 가이드핵산의 적어도 일부분(예를 들어, 제2 영역)과 상기 제2 가이드핵산의 적어도 일부분(예를 들어, 제3 영역)이 서로 상보적 서열을 가지는 경우와 같이 상기 제1 가이드핵산과 상기 제2 가이드 핵산이 중첩될 수도 있다.As described above, as shown in (a) of FIG. 1, at least a portion (eg, a second region) of the first guide nucleic acid and at least a portion (eg, a third region) of the second guide nucleic acid region) may overlap the first guide nucleic acid and the second guide nucleic acid, such as when they have a sequence in common with each other, and as shown in FIG. 1 (b), at least a portion of the first guide nucleic acid (eg For example, the first guide nucleic acid and the second guide nucleic acid may overlap, such as when the second region) and at least a portion (eg, the third region) of the second guide nucleic acid have complementary sequences. there is.
상기 제1 가이드핵산과 상기 제2 가이드핵산이 서로 중첩된 길이(예를 들어, 상기 제2 영역의 길이 또는 상기 제3 영역의 길이)는 조작하고자 하는 타겟 유전자의 시퀀스에 따라 서로 달라질 수 있으며, 최대 16bp를 넘지 않는 것이 바람직하며, 최소 2bp 보다는 긴 것이 바람직하다. The overlapping length of the first guide nucleic acid and the second guide nucleic acid (eg, the length of the second region or the length of the third region) may vary depending on the sequence of the target gene to be manipulated, It is preferable not to exceed a maximum of 16 bp, and preferably longer than a minimum of 2 bp.
이하에서, 설명하겠지만, 상기 제1 및 제2 가이드핵산들이 서로 중첩된 길이는 타겟 유전자의 시퀀스에 존재하는 PAM 서열들 간의 거리(예를 들어, 제1 PAM 서열의 위치와 제2 PAM 서열의 위치 간의 거리)에 의존적일 수 있다.As will be described below, the overlapping length of the first and second guide nucleic acids is the distance between the PAM sequences present in the sequence of the target gene (e.g., the position of the first PAM sequence and the position of the second PAM sequence). distance) may be dependent.
예를 들어, 도 1의 (a)에 도시한 바와 같이, 상기 제1 및 제2 가이드핵산이 동일한 핵산에 대해 상보적으로 결합하는 경우, 상기 중첩된 길이는 상기 PAM 서열들 간의 거리가 멀어지면 멀어질수록 짧아질 수 있다.For example, as shown in (a) of FIG. 1, when the first and second guide nucleic acids complementarily bind to the same nucleic acid, the overlapping length increases as the distance between the PAM sequences increases. The farther you go, the shorter it can be.
다른 예를 들어, 도 1의 (b)에 도시한 바와 같이, 상기 제1 및 제2 가이드핵산이 서로 다른 핵산에 대해 상보적으로 결합하는 경우, 상기 중첩된 길이는 상기 PAM 서열들 간의 거리가 멀어지면 멀어질수록 짧아질 수 있다.For another example, as shown in (b) of FIG. 1, when the first and second guide nucleic acids complementarily bind to different nucleic acids, the overlapped length is the distance between the PAM sequences. The farther you go, the shorter it can get.
한편, 본 출원에 의해 개시되는 타겟 시퀀스를 조작하기 위한 조성물은, 둘 이상의 가이드핵산들을 포함하기만 하면되는 것으로 반드시 두 종류의 가이드핵산만 포함하고 있어야 하는 것은 아니다. 다시 말해, 상기 조성물은, 제1 가이드핵산 및 제2 가이드핵산 이외에도 제3 가이드핵산을 더 포함할 수 있다. 다만, 상기 제3 가이드핵산은 상기 제1 가이드핵산 및/또는 상기 제2 가이드핵산과 서로 중첩되어 있을 수 있다. 예를 들어, 상기 제3 가이드핵산과 상기 제1 가이드핵산(또는 상기 제2 가이드핵산)은 도 1을 참조하여 설명한 상기 제1 및 제2 가이드핵산들 간의 관계를 가질 수 있다. Meanwhile, a composition for manipulating a target sequence disclosed in the present application only needs to include two or more guide nucleic acids, and does not necessarily have to contain only two types of guide nucleic acids. In other words, the composition may further include a third guide nucleic acid in addition to the first guide nucleic acid and the second guide nucleic acid. However, the third guide nucleic acid may overlap with the first guide nucleic acid and/or the second guide nucleic acid. For example, the third guide nucleic acid and the first guide nucleic acid (or the second guide nucleic acid) may have a relationship between the first and second guide nucleic acids described with reference to FIG. 1 .
상기 가이드핵산은 제3 가이드핵산에 더하여 추가적인 가이드핵산을 가질 수 있음은, 자세히 설명하지 않아도 당업자에게 자명한 사항이라 할 것이다.It will be apparent to those skilled in the art that the guide nucleic acid may have an additional guide nucleic acid in addition to the third guide nucleic acid, even without detailed explanation.
<제2 실시예><Second Embodiment>
본 출원에 의해 개시되는 타겟 시퀀스를 조작하기 위한 조성물은, 표적 핵산 또는 유전자에 대한 조작 효율을 높일 수 있는 것으로, 제1 가이드 핵산 또는 이를 인코딩하고 있는 핵산, 제2 가이드 핵산 또는 이를 인코딩하고 있는 핵산, 유전자 가위 단백질 또는 이를 인코딩하고 있는 핵산 및 특정 핵산 서열을 포함할 수 있다.The composition for manipulating a target sequence disclosed in the present application can increase the manipulation efficiency of a target nucleic acid or gene, and includes a first guide nucleic acid or a nucleic acid encoding the same, a second guide nucleic acid or a nucleic acid encoding the same. , gene editing proteins or nucleic acids encoding them and specific nucleic acid sequences.
제1 실시예에서와 유사하게, 상기 제1 가이드 핵산의 서열 및 상기 제2 가이드 핵산의 서열은 서로 상이할 수 있다. 다만, 본 출원에 의해 개시되는 조성물에 있어서, 상기 제1 가이드 핵산의 서열의 적어도 일부 및 상기 제2 가이드 핵산의 서열의 적어도 일부는 서로 연관되어 있으며, 이에 대한 자세한 설명은 생략하기로 한다.Similar to the first embodiment, the sequence of the first guide nucleic acid and the sequence of the second guide nucleic acid may be different from each other. However, in the composition disclosed by the present application, at least a portion of the sequence of the first guide nucleic acid and at least a portion of the sequence of the second guide nucleic acid are related to each other, and a detailed description thereof will be omitted.
상기 제1 가이드 핵산 및 상기 제2 가이드 핵산은, 제1 실시예에서 설명한 바와 같이, 서로 중첩되어 있을 수 있으며, 이에 대한 자세한 설명은 생략하기로 한다.As described in the first embodiment, the first guide nucleic acid and the second guide nucleic acid may overlap each other, and a detailed description thereof will be omitted.
상기 제1 가이드핵산 또는/및 상기 유전자가위 단백질이 복합체를 형성하여 표적 핵산 또는 유전자의 이중가닥 또는 단일가닥을 절단하고, 손상된 핵산 또는 유전자를 수선하기 위해 상동 재조합 수리(homology directed repairing, HDR)가 일어날 때, 상기 특정 핵산 서열이 사용될 수 있다.The first guide nucleic acid or/and the scissors protein form a complex to cleave the double strand or single strand of the target nucleic acid or gene, and homology directed repairing (HDR) is performed to repair the damaged nucleic acid or gene. When occurring, the specific nucleic acid sequence above may be used.
일반적으로, 상동 재조합 수리(HDR)는 유전자 가닥에 손상이 생겼을 때, 이중 가닥의 상보적인 특징으로 이용하여 수리되는 것으로, 자연상태에서는, 상기 손상된유전자는 상동 재조합 수리(HDR)에 의해 손상되기 전의 유전자 서열 그대로 복원된다. 그러나, 외부에서 인위적으로 특정 핵산 서열을 넣어주면 상기 상동 재조합 수리에 의해 유전자가 복원되는 과정에서 상기 특정 핵산 서열 그 자체가 혹은 상기 특정 핵산 서열과 동일한 시퀀스를 가지는 폴리뉴클레오타이드가 상기 유전자에 삽입될 수 있다.In general, homologous recombination repair (HDR) repairs damage to a gene strand by using a complementary feature of the double strand. The gene sequence is restored intact. However, if a specific nucleic acid sequence is artificially inserted from the outside, the specific nucleic acid sequence itself or a polynucleotide having the same sequence as the specific nucleic acid sequence can be inserted into the gene in the process of restoring the gene by the homologous recombination repair. there is.
예를 들어, 상기 삽입하고자 하는 특정 핵산 서열의 양 말단에 상기 유전자에 상보적으로 결합할 수 있는 호몰로지 암(homology arm)이 구비되어 있는 경우, 상기 상동 재조합 수리(HDR) 과정에 의해서 손상된 유전자가 복원될 때, 상기 특정 핵산 서열이 유전자에 삽입되는 빈도가 더 높아진다는 것이 이미 널리 알려진 연구 결과이다.For example, when a homology arm capable of complementarily binding to the gene is provided at both ends of the specific nucleic acid sequence to be inserted, a gene damaged by the homologous recombination repair (HDR) process It is a widely known research result that when is restored, the frequency of insertion of the specific nucleic acid sequence into a gene increases.
앞으로, 특별한 언급이 없으면, 특정 핵산 서열 그 자체를 '도너(donor)'라고 칭할 것이나, 특별한 언급이 있다면, 특정 핵산 서열 및 그 양 말단에 결합되어 있는 호몰로지 암(homology arm)까지 포함하는 의미로 '도너(donor)'라고 칭하도록 한다.In the future, unless otherwise specified, a specific nucleic acid sequence itself will be referred to as a 'donor', but if there is special mention, the meaning includes a specific nucleic acid sequence and a homology arm linked to both ends thereof to be referred to as 'donors'.
상기 특정 핵산서열(예를 들어, 도너 시퀀스)은, 다음의 예사와 같은 형태로 상기 조성물에 포함되어 있을 수 있으나, 이에 한정하지는 않는다.The specific nucleic acid sequence (eg, donor sequence) may be included in the composition in the form of the following example, but is not limited thereto.
예를 들어, 상기 제1 가이드핵산, 상기 제2 가이드핵산, 상기 유전자가위 단백질 및 상기 특정 핵산서열은 각각 핵산서열 상태로 하나 이상이 동일한 벡터에 존재할 수 있다. 또는, 상이한 벡터에 존재할 수 있다.For example, one or more of the first guide nucleic acid, the second guide nucleic acid, the scissors protein, and the specific nucleic acid sequence may be present in the same vector in the form of nucleic acid sequences, respectively. Alternatively, it may be present in a different vector.
예를 들어, 상기 제1 가이드핵산, 상기 제2 가이드핵산 및 상기 유전자가위 단백질은 서로 결합하여 복합체를 형성한 상태로 상기 특정 핵산서열과 상기 조성물에 포함되어 있을 수 있다.For example, the first guide nucleic acid, the second guide nucleic acid, and the gene scissors protein may be included in the specific nucleic acid sequence and the composition in a state in which they bind to each other to form a complex.
예를 들어, 상기 제1 가이드핵산 및 상기 유전자가위 단백질은 서로 결합하여 복합체를 형성한 상태로 상기 제2 가이드핵산을 인코딩하고 있는 핵산, 상기 특정 핵산서열과 상기 조성물에 포함되어 있을 수 있다.For example, the first guide nucleic acid and the cleaving protein may be included in the nucleic acid encoding the second guide nucleic acid, the specific nucleic acid sequence, and the composition in a state in which they bind to each other to form a complex.
예를 들어, 상기 제2 가이드핵산 및 상기 유전자가위 단백질은 서로 결합하여 복합체를 형성한 상태로 상기 제1 가이드핵산을 인코딩하고 있는 핵산, 상기 특정 핵산서열과 상기 조성물에 포함되어 있을 수 있다.For example, the second guide nucleic acid and the cleaving protein may be included in the nucleic acid encoding the first guide nucleic acid, the specific nucleic acid sequence, and the composition in a state in which they bind to each other to form a complex.
4. 가이드핵산 및 유전자가위 단백질을 포함하는 조성물의 이용4. Use of a composition containing guide nucleic acid and gene scissors protein
본 출원에 의해 개시되는 기술에 의하면, 전술한 상기 타겟 시퀀스를 조작하기 위한 조성물의 이용예가 제공될 수 있다.According to the technology disclosed by the present application, an example of using the composition for manipulating the target sequence described above may be provided.
상기 조성물은 대상(target)을 조작하는데 사용될 수 있다.The composition can be used to manipulate a target.
상기 조작은 넉아웃(Knock-out), 넉인(Knock-in), 넉다운(Knock-down) 중 선택되는 어느 하나일 수 있다.The manipulation may be any one selected from knock-out, knock-in, and knock-down.
상기 대상은 표적 핵산 또는 유전자를 포함하는 유기체일 수 있다.The subject may be an organism comprising the target nucleic acid or gene.
상기 유기체는 세포, 조직, 식물, 동물 또는 인간일 수 있다.The organism may be a cell, tissue, plant, animal or human.
상기 세포는 원핵세포 또는 진핵세포일 수 있다.The cell may be a prokaryotic cell or a eukaryotic cell.
일 예로, 상기 조성물은 유전자를 조작하는 데 사용될 수 있다.In one example, the composition can be used to manipulate genes.
구체예로, 상기 유전자는 Rosa26 유전자, Upf1 유전자, Srebf1 유전자, Tert 유전자, Morc2a 유전자, Adora2b 유전자 각각의 야생형 또는 인위적으로 변형된 형태를 포함할 수 있다.In specific embodiments, the genes may include wild-type or artificially modified forms of Rosa26 gene, Upf1 gene, Srebf1 gene, Tert gene, Morc2a gene, and Adora2b gene, respectively.
상기 조작은 표적 핵산 또는 유전자를 절단, 변형 및 교정을 포함할 수 있다. 또한, 상기 조작은 상기 표적 핵산 또는 유전자에 특정 핵산 서열을 삽입하는 것을 포함할 수 있다.The manipulation may include cutting, modifying, and correcting the target nucleic acid or gene. In addition, the manipulation may include inserting a specific nucleic acid sequence into the target nucleic acid or gene.
상기 특정 핵산 서열이 상기 표적 핵산 또는 유전자에 삽입되면, 넉인이 발생할 수 있다.When the specific nucleic acid sequence is inserted into the target nucleic acid or gene, knock-in may occur.
상기 조작은 상기 표적 핵산 또는 상기 유전자의 핵산 서열에 대한 하나 이상의 뉴클레오타이드의 삽입, 치환, 결실 및 외부 유래의 하나 이상의 뉴클레오타이들의 삽입 중 하나 이상을 포함할 수 있다.The manipulation may include one or more of insertion, substitution, deletion of one or more nucleotides into the target nucleic acid or nucleic acid sequence of the gene, and insertion of one or more nucleotides from outside.
상기 표적 핵산 또는 유전자의 교정은 상기 표적 핵산 또는 유전자의 핵산 서열 중 일부에 있는 잘못된 시퀀스를 올바른 시퀀스로 바꾸는 것을 의미한다.Correction of the target nucleic acid or gene means replacing an erroneous sequence in a part of the nucleic acid sequence of the target nucleic acid or gene with a correct sequence.
상기 잘못된 시퀀스의 예는, 일부 서열의 결실, 일부 서열의 추가, 일부 서열의 중복 등이 있을 수 있다. Examples of the erroneous sequence may include deletion of some sequences, addition of some sequences, duplication of some sequences, and the like.
일부 서열이 결실되어 있는 경우, 결실된 서열을 상기 표적 핵산 또는 유전자에 삽입함으로써 상기 표적 핵산 또는 유전자가 교정될 수 있다.If some sequences are deleted, the target nucleic acid or gene can be corrected by inserting the deleted sequence into the target nucleic acid or gene.
5. 타겟 시퀀스 조작 방법5. How to manipulate the target sequence
본 출원에 의해 개시되는 기술의 다른 양태에 의하면, 표적 핵산에 특정 핵산 서열을 삽입하는 방법이 제공된다. 상기 방법에 의하면, 종래의 방법에 비하여, 삽입하고자 하는 특정 핵산 서열을 표적 핵산에 삽입시킬 수 있는 효율(빈도, frequency)를 현저하게 높일 수 있게 된다.According to another aspect of the technology disclosed by this application, a method of inserting a specific nucleic acid sequence into a target nucleic acid is provided. According to the method, compared to the conventional method, the efficiency (frequency) of inserting a specific nucleic acid sequence to be inserted into a target nucleic acid can be remarkably increased.
상기 방법에는 전술한 타겟 시퀀스를 조작하기 위한 조성물이 사용될 수 있다.Compositions for manipulating the target sequences described above may be used in the method.
상기 표적 핵산에 특정 핵산 서열을 삽입하는 방법은, i) Cas 단백질 또는 상기 Cas 단백질을 인코딩하는 제1 핵산, ii) 적어도 제1 영역 및 제2 영역을 포함하는 제2 핵산, iii) 적어도 제3 영역을 포함하는 제3 핵산, 및 iv) 상기 표적 핵산의 특정 영역에 삽입되기 위한 상기 특정 핵산 서열을 포함하는 조성물을 세포에 도입시키는 단계를 포함할 수 있다. 이 때, 상기 제2 영역 및 상기 제3 영역은 서로 공통 서열을 가지고 있거나 또는 서로 상보적인 서열을 가질 수 있다. 또한, 상기 특정 핵산 서열은 상기 표적 핵산에 포함된 서열들 중 상기 제2 핵산 및/또는 상기 제3 핵산과 중첩되어 있는 영역의 적어도 일부에 중첩되는 위치에 삽입될 수 있다.The method of inserting a specific nucleic acid sequence into the target nucleic acid comprises: i) a Cas protein or a first nucleic acid encoding the Cas protein, ii) a second nucleic acid comprising at least a first region and a second region, iii) at least a third nucleic acid and iv) introducing into the cell a composition comprising the specific nucleic acid sequence to be inserted into the specific region of the target nucleic acid. In this case, the second region and the third region may have a common sequence or a sequence complementary to each other. In addition, the specific nucleic acid sequence may be inserted at a position overlapping at least a part of a region overlapping the second nucleic acid and/or the third nucleic acid among the sequences included in the target nucleic acid.
상기 표적 핵산에 특정 핵산 서열을 삽입하는 방법은, 상기 조성물이 상기 세포로 보다 잘 도입될 수 있도록 상기 세포를 전처리하는 단계를 더 포함할 수 있다.The method of inserting a specific nucleic acid sequence into the target nucleic acid may further include pre-treating the cell so that the composition can be better introduced into the cell.
예를 들어, 상기 세포가 식물 세포인 경우, 상기 조성물의 적어도 일부가 상기 식물 세포로 보다 더 잘 도입되도록 하기 위하여, 상기 식물 세포의 세포벽을 제거하기 위한 전처리 단계가 수행될 수 있다.For example, when the cells are plant cells, a pretreatment step may be performed to remove cell walls of the plant cells in order to better incorporate at least a portion of the composition into the plant cells.
상기 조성물을 세포에 도입하면, 표적 핵산 또는 유전자가 조작될 수 있다. 특히, 상기 표적 핵산 또는 유전자가 넉인될 수 있다.Upon introduction of the composition into a cell, the target nucleic acid or gene can be manipulated. In particular, the target nucleic acid or gene may be knocked in.
상기 조성물을 세포에 도입하면, 상기 제2 핵산의 제2 영역과 상기 제3 핵산의 제3 영역의 일부 또는 전체가 상기 제1 핵산과 결합하기 위해서 서로 경쟁을 하기 때문에, 넉인 효율이 더 높아질 수도 있다.When the composition is introduced into a cell, knock-in efficiency may be higher because part or all of the second region of the second nucleic acid and the third region of the third nucleic acid compete with each other to bind to the first nucleic acid. there is.
또한, 상기 조성물이 세포에 도입되면, 상기 제2 핵산과 상기 제3 핵산이 상기 특정 핵산 서열이 삽입되는 부위에 작은 서열 결실(small sequence deletion)을 일으켜, 넉인 효율이 더 높아질 수도 있다.In addition, when the composition is introduced into a cell, the second nucleic acid and the third nucleic acid cause a small sequence deletion at a site where the specific nucleic acid sequence is inserted, so that knock-in efficiency may be further increased.
상기 표적 핵산 또는 유전자의 염기서열을 데이터베이스(예를 들어, NCBI 등)를 사용하여 유전자의 염기서열 데이터를 수집하여, 상기 염기서열 중 PAM 서열(예를 들어, 5'-NGG-3')이 있는 부위를 찾고, 그 PAM 서열로부터 ~20bp의 염기서열을 선정하여 적어도 상기 제2 핵산 및 상기 제3 핵산들의 중첩된 다양한 형태를 설계할 수 있다.The nucleotide sequence data of the target nucleic acid or gene is collected using a database (eg, NCBI, etc.), and the PAM sequence (eg, 5'-NGG-3') among the nucleotide sequences is It is possible to design a variety of overlapping forms of at least the second nucleic acid and the third nucleic acid by finding a site where the PAM sequence is present and selecting a nucleotide sequence of ˜20 bp from the PAM sequence.
상기 제2 핵산, 상기 제3 핵산이 중첩된 가이드핵산 형태를 가질 때, 상기 중첩된 가이드핵산, 상기 PAM 서열은 도 1의 예시와 같이 설계할 수 있으나, 이에 제한되는 것은 아니다. 하기에서는, 중첩된 가이드핵산과 PAM 서열들 간의 관계에 대해서 설명할 것이며, 중첩된 가이드핵산의 형태에 대한 자세한 설명은 이전에 설명하였으므로 생략하기로 한다.When the second nucleic acid and the third nucleic acid have an overlapping guide nucleic acid form, the overlapping guide nucleic acid and the PAM sequence may be designed as illustrated in FIG. 1 , but are not limited thereto. In the following, the relationship between overlapping guide nucleic acids and PAM sequences will be described, and detailed descriptions of overlapping guide nucleic acids have been previously described, so they will be omitted.
도 1에는 제1 영역(①) 및 제2 영역(②)을 포함하고 있는 제1 가이드핵산, 제3 영역(③) 및 제4 영역(④)을 포함하고 있는 제2 가이드핵산, 제1 PAM 서열, 제2 PAM 서열, 제1 부분(ⓐ), 제2 부분(ⓑ) 및 표적 핵산이 도시되어 있다.1, the first guide nucleic acid including the first region (①) and the second region (②), the second guide nucleic acid including the third region (③) and the fourth region (④), and the first PAM Sequence, second PAM sequence, first part (ⓐ), second part (ⓑ) and target nucleic acid are shown.
예를 들어, 도 1의 (a)와 같이, 상기 제1 가이드핵산의 상기 제2 영역과 상기 제2 가이드핵산의 상기 제3 영역이 서로 공통 서열을 가질 때, 상기 제1 가이드핵산 및 상기 제2 가이드핵산과 상보적 서열을 가질 수 있는 표적 가닥(예를 들어, 도 1의 (a)에 도시된 표적 핵산의 이중 가닥 중 상측에 도시된 가닥)과 다른 가닥(different strand)(예를 들어, 도 1의 (a)에 도시된 표적 핵산의 이중 가닥 중 하측에 도시된 가닥)에 상기 제1 PAM서열 및 상기 제2 PAM서열들이 설계될 수 있다. 이 때, 상기 제1 PAM 서열로부터 20bp의 염기서열을 가지는 제1 가이드핵산 및 상기 제2 PAM 서열로부터 20bp의 염기서열을 가지는 제 2 가이드핵산을 설계할 수 있다.For example, as shown in (a) of FIG. 1, when the second region of the first guide nucleic acid and the third region of the second guide nucleic acid have a common sequence, the first guide nucleic acid and the first guide nucleic acid 2 A target strand that may have a complementary sequence with the guide nucleic acid (eg, the upper strand of the double strand of the target nucleic acid shown in FIG. 1 (a)) and another strand (eg, the other strand) , the lower strand of the double strand of the target nucleic acid shown in (a) of FIG. 1), the first PAM sequence and the second PAM sequence may be designed. In this case, a first guide nucleic acid having a base sequence of 20 bp from the first PAM sequence and a second guide nucleic acid having a base sequence of 20 bp from the second PAM sequence may be designed.
다른 예를 들어, 도 1의 (b)와 같이, 상기 제1 가이드핵산이 상기 제1 부분에 상보적이고, 상기 제2 가이드핵산이 상기 제2 부분에 상보적일 때, 상기 제1 PAM서열 및 상기 제2 PAM서열은 표적 핵산의 서로 다른 가닥에 설계될 수 있다. 예를 들어, 제1 PAM서열은 도 1의 (b)에 도시된 표적 핵산의 이중 가닥 중 하측에 도시된 가닥에 존재하고, 제2 PAM서열은 도 1의 (b)에 도시된 표적 핵산의 이중 가닥 중 상측에 도시된 가닥에 존재할 수 있다. 이 때, 상기 제1 PAM 서열로부터 20bp의 염기서열을 가지는 제1 가이드핵산 및 상기 제2 PAM 서열로부터 20bp의 염기서열을 가지는 제 2 가이드핵산을 설계할 수 있다.For another example, as shown in (b) of FIG. 1, when the first guide nucleic acid is complementary to the first part and the second guide nucleic acid is complementary to the second part, the first PAM sequence and the A second PAM sequence can be designed on a different strand of the target nucleic acid. For example, the first PAM sequence is present in the lower strand of the double strand of the target nucleic acid shown in FIG. 1 (b), and the second PAM sequence is the target nucleic acid shown in FIG. 1 (b). Of the double strands, it may be present in the strand shown above. In this case, a first guide nucleic acid having a base sequence of 20 bp from the first PAM sequence and a second guide nucleic acid having a base sequence of 20 bp from the second PAM sequence may be designed.
상기 중첩된 가이드 핵산의 길이(예를 들어, 상기 제2 영역 또는 상기 제3 영역)는 상기 제1 PAM서열과 상기 제2 PAM서열의 거리가 가까워 질수록 길어질 수 있다.The length of the overlapping guide nucleic acid (eg, the second region or the third region) may increase as the distance between the first PAM sequence and the second PAM sequence increases.
상기 표적 핵산의 표적 서열은 상기 제2 핵산 또는/및 상기 제3 핵산 각각의 가이드 도메인에 포함되는 가이드 서열과 상보성을 가진다. 상기 표적 서열은 표적 핵산 또는 유전자에 따라, 즉 유전자 조작을 하는 대상에 따라 달라질 수 있는 염기서열로, 다양하게 설계될 수 있다.The target sequence of the target nucleic acid has complementarity with a guide sequence included in each of the guide domains of the second nucleic acid and/or the third nucleic acid. The target sequence may be variously designed as a nucleotide sequence that may vary depending on the target nucleic acid or gene, that is, depending on the subject to be genetically engineered.
또한, 상기 표적 서열은 CRISPR 효소, 즉 Cas9 또는 Cpf1이 인식할 수 있는 PAM 서열에 근접한 위치에 위치한 염기서열일 수 있다. 상기 표적 서열은 다음의 예시와 같이 설계될 수 있으나, 이에 제한하지 않는다.In addition, the target sequence may be a nucleotide sequence located close to the PAM sequence recognized by the CRISPR enzyme, that is, Cas9 or Cpf1. The target sequence may be designed as in the following examples, but is not limited thereto.
본 출원에 의해 개시되는 타겟 시퀀스를 조작하는 조성물을 이용할 때, 상기 표적 서열 하나에 대해서, 둘 이상의 가이드핵산들을 포함하여When using the composition for manipulating a target sequence disclosed by the present application, for one target sequence, two or more guide nucleic acids are included.
예를 들어, 상기 표적 서열은 CRISPR 효소가 인식할 수 있는 PAM 서열의 5' 말단 또는/및 3' 말단에 인접하여 위치하는 연속하는 5 내지 50개의 염기서열일 수 있다.For example, the target sequence may be a sequence of 5 to 50 consecutive bases positioned adjacent to the 5' end or/and 3' end of the PAM sequence that can be recognized by the CRISPR enzyme.
예를 들어, CRISPR 효소가 SpCas9인 경우, 상기 표적 서열은 5'-NGG-3', 5'-NAG-3' 또는/및 5'-NGA-3' (N= A, T, G 또는 C; 또는 A, U, G 또는 C) 서열의 5' 말단 또는/및 3' 말단에 인접하여 위치하는 연속하는 16 내지 25개의 염기서열일 수 있다.For example, if the CRISPR enzyme is SpCas9, the target sequence is 5'-NGG-3', 5'-NAG-3' or/and 5'-NGA-3' (N= A, T, G or C or A, U, G or C) may be a sequence of 16 to 25 consecutive bases positioned adjacent to the 5' end or/and 3' end of the sequence.
예를 들어, CRISPR 효소가 SpCas9 단백질인 경우, 상기 PAM 서열은 5'-NGG-3' (N은 A, T, G, 또는 C임)이고, 상기 절단되는 염기서열 부위(표적 부위)는 표적 유전자 내의 5'-NGG-3' 서열의 5' 말단 및/또는 3' 말단에 인접하여 위치하는 연속하는 1bp 내지 25bp, 예컨대 17bp 내지 23bp 또는 21bp 내지 23bp의 염기서열 부위일 수 있다.For example, when the CRISPR enzyme is the SpCas9 protein, the PAM sequence is 5'-NGG-3' (N is A, T, G, or C), and the cleaved nucleotide sequence site (target site) is the target site. It may be a nucleotide sequence region of 1 bp to 25 bp, such as 17 bp to 23 bp or 21 bp to 23 bp, located adjacent to the 5' end and/or 3' end of the 5'-NGG-3' sequence in the gene.
[발명의 실시를 위한 형태][Form for implementing the invention]
이하, 실시예를 통하여 본 발명을 더욱 상세히 설명하고자 한다.Hereinafter, the present invention will be described in more detail through examples.
이들 실시예는 오로지 본 발명을 보다 구체적으로 설명하기 위한 것으로서, 본 발명의 범위가 이들 실시예에 의해 제한되지 않는다는 것은 본 발명이 속하는 기술분야에서 통상의 지식을 가진 자에 있어 자명할 것이다.These examples are only for explaining the present invention in more detail, and it will be apparent to those skilled in the art that the scope of the present invention is not limited by these examples.
실험방법Experiment method
1. 동물1. Animals
C57BL/6 마우스는 코아텍(Koatech, Pyeongtaek, Korea)에서 구입하였다. 모든 마우스는 개별적으로 통풍이 되는 케이지에서 유지하였고, 물과 먹이는 자유식으로 공급하였다. 본 연구는 서울대의 동물실험윤리위원회에 의해 승인 받았고, 승인 받은 가이드라인에 따라 수행하였다.C57BL/6 mice were purchased from Koatech (Pyeongtaek, Korea). All mice were maintained in individually ventilated cages, and water and food were supplied ad libitum. This study was approved by the Animal Experimentation Ethics Committee of Seoul National University and was conducted in accordance with the approved guidelines.
2. Cas9, sgRNA 및 ssODN의 준비2. Preparation of Cas9, sgRNA and ssODN
Cas9 mRNA는 툴젠(Toolgen Inc, Seoul, Korea)에서 구입하였다. 각 유전자를 위한 sgRNA는 Chopchop을 이용하여 설계하였고, PCR을 증폭한 후에 in vitro RNA 합성 키트(Thermo Fisher Scientific, Waltham, Ma, USA)를 사용하여 합성하였다. ssODNs은 상업적 서비스(IDT, San Jose, CA, USA)를 통해 설계하고 합성하였다. ssODN의 3' 말단은 ssODN의 안정성을 향상시키기 위해 포스포로티오에이트(phosphorothioate)로 변형시켰다. Cas9 mRNA was purchased from Toolgen Inc (Seoul, Korea). The sgRNA for each gene was designed using Chopchop and synthesized using an in vitro RNA synthesis kit (Thermo Fisher Scientific, Waltham, MA, USA) after PCR amplification. ssODNs were designed and synthesized through a commercial service (IDT, San Jose, CA, USA). The 3' end of ssODN was modified with phosphorothioate to improve the stability of ssODN.
3. 미량주입(microinjection)3. Microinjection
C57BL/6 암컷 마우스에 임신 말 혈청성 성선 자극 호르몬(pregnant mare's serum gonadotropin, Prospec, USA)과 인간 융모성 성선 자극 호르몬(human chorionic gonadotropin, Prospec)을 주입하여 과잉 배란되도록 한 후 배아를 수집하였다. 1~2시간 배양 후, 전핵(pronuclei)을 가진 생존한 배아는 선택하였고, 현미조작장치(Eppendorf, Hamburg, Germany)를 이용하여 미량주입을 실시하였다. 간단하게 설명하면, 50ng/uL Cas9 mRNAs와 20ng/uL sgRNAs 및 20ng/uL ssODNs를 섞은 혼합물을 배아에 미량주입 하였다. 배아는 2-세포 단계(2-cell stage)까지 배양한 후 가임신 암컷 마우스로 옮기거나, 또는 유전형 분석을 위해 배반포(blastocyst) 단계가 될 때까지 배양하였다.C57BL/6 female mice were injected with pregnant mare's serum gonadotropin (Prospec, USA) and human chorionic gonadotropin (Prospec, USA) to cause excess ovulation, and then embryos were collected. After 1-2 hours of culture, surviving embryos with pronuclei were selected and microinjection was performed using a micromanipulator (Eppendorf, Hamburg, Germany). Briefly, a mixture of 50ng/uL Cas9 mRNAs, 20ng/uL sgRNAs, and 20ng/uL ssODNs was microinjected into embryos. Embryos were cultured to the 2-cell stage and then transferred to pseudopregnant female mice, or cultured until the blastocyst stage for genotyping.
4. 유전형 분석(Genotyping) 및 염기서열분석(sequencing)4. Genotyping and sequencing
상실배아(morula) 또는 배반포 상태의 배아 및 마우스 새끼의 꼬리로부터 DNA를 추출하였다. 단일 배아는 피펫(mouth pipet)을 이용하여 20uL DW가 들어있는 150uL 튜브로 옮기고, 3번의 동결/융해과정을 수행하고 95℃에서 15분 동안 변성(denaturation)시킨 후에 PCR을 위한 템플릿으로 사용하였다. 꼬리로부터 DNA 추출은 상업용 추출키트(Intron, Korea)를 이용하여 실시하였다. 염기서열분석은 일반적인 TA 클로닝과 생거 시퀀싱(Sanger sequencing, Cosmogenetech, Korea)을 이용하여 수행하였다. DNA was extracted from morula or blastocyst embryos and tails of mouse pups. A single embryo was transferred to a 150uL tube containing 20uL DW using a pipette, frozen/thawed 3 times, and denatured at 95° C. for 15 minutes, then used as a template for PCR. DNA extraction from the tail was performed using a commercial extraction kit (Intron, Korea). Sequencing was performed using general TA cloning and Sanger sequencing (Cosmogenetech, Korea).
5. 세포배양 및 형질주입(tranfection)5. Cell culture and transfection
NIH3T3 (ATCC® CRL-1658™) 세포주는 high glucose (WelGene, South Korea)와 10% fetal calf serum (WelGene) 및 1X penicillin/streptomycin (WelGene)을 포함하는 Dulbecco's Modified Eagle Medium (DMEM)에서 배양했다. 형질주입을 위해, ssODNs(5ug)을 포함하거나 포함하지 않는 Cas9 단백질(ToolGen, South Korea) 4ug과 sgRNAs(각 1ug)와 ssODNs(5ug)를 포함 또는 포함하지 않도록 섞은 혼합물을 5분 동안 실온에서 배양하였다. 그 후에, 2 x 105개 세포에 10uL 전기청공용 팁을 사용하는 네온 전기청공장치(Neon electroporator, Thermo Fischer Scientific)를 이용하여 상기 Cas9-sgRNA 혼합물을 세포 내로 전달하였다. 72시간 후에, 형질주입된 세포를 수거하였고, 게놈 DNA 정제키트(GeneAll)를 이용하여 상기 세포의 게놈 DNA를 추출하였다.The NIH3T3 (ATCC® CRL-1658™) cell line was cultured in Dulbecco's Modified Eagle Medium (DMEM) containing high glucose (WelGene, South Korea), 10% fetal calf serum (WelGene), and 1X penicillin/streptomycin (WelGene). For transfection, a mixture of 4ug of Cas9 protein (ToolGen, South Korea) with or without ssODNs (5ug) and sgRNAs (1ug each) with or without ssODNs (5ug) was incubated at room temperature for 5 minutes did After that, the Cas9-sgRNA mixture was delivered into cells using a Neon electroporator (Neon electroporator, Thermo Fischer Scientific) using a 10uL electroporation tip for 2 x 10 5 cells. After 72 hours, the transfected cells were harvested, and the genomic DNA of the cells was extracted using a genomic DNA purification kit (GeneAll).
6. 타겟 딥 시퀀싱(targeted deep sequencing)6. Targeted deep sequencing
형질주입 된 세포로부터 추출한 게놈 DNA에서 On-target 영역을 Phusion polymerase taq(New England Biolabs)을 사용하여 PCR 증폭하였다. 그 다음, Mi-seq(Illumina)을 이용하여 상기 PCR 증폭물로 페어드-엔드 딥 시퀀싱(paired-end deep sequencing)을 수행하였다. 딥 시퀀싱 결과는 온라인 Cas-Analyzer(www.rgenome.net)를 이용하여 분석하였다. CRISPR/Cas9 반응에 의한 돌연변이 유무 확인을 위하여 PAM 서열로부터 3bp 업스트림에서 인델을 확인하였다. HDR 분석을 위하여, 상기 확인된 서열에서 다른 ssODNs로 인한 특정한 도너 서열이 발견된 녹인(KI)의 빈도를 관찰하였다. From the genomic DNA extracted from the transfected cells, the on-target region was PCR amplified using Phusion polymerase taq (New England Biolabs). Then, paired-end deep sequencing was performed on the PCR amplicons using Mi-seq (Illumina). Deep sequencing results were analyzed using an online Cas-Analyzer (www.rgenome.net). In order to confirm the presence or absence of mutation by CRISPR/Cas9 reaction, an indel was identified at 3 bp upstream from the PAM sequence. For HDR analysis, the frequency of knock-in (KI) in which a specific donor sequence due to other ssODNs was found in the above identified sequences was observed.
7. 통계분석7. Statistical analysis
통계분석을 위해, Graphpad Prism (Graphpad software, La Jolla, CA, USA)를 사용하여 t-test와 chi-square (X2 analysis)를 수행하였다. X2 analysis는 배아와 새끼에서 겹쳐진 sgRNA와 겹쳐지지 않는 sgRNA 사이에 KI 효율의 p 값을 계산하는데 사용하였고, t-test는 NIH3T3 세포주를 이용한 실험에서 KI 효율의 p 값을 계산하는데 사용하였다. p<0.05일 때, 현저한 차이가 난다고 규정하였다.For statistical analysis, t-test and chi-square (X 2 analysis) were performed using Graphpad Prism (Graphpad software, La Jolla, CA, USA). X 2 analysis was used to calculate the p- value of KI efficiency between overlapping and non-overlapping sgRNAs in embryos and offspring, and t-test was used to calculate the p- value of KI efficiency in experiments using the NIH3T3 cell line. When p <0.05, it was defined as a significant difference.
실험예 1. Rosa26 유전자를 표적으로 하는 서열의 삽입 효율 확인Experimental Example 1. Confirmation of Insertion Efficiency of Sequence Targeting Rosa26 Gene
2개의 중첩된 sgRNAs를 이용하여 Rosa26 유전자 자리로 재조합효소 매개 카세트 변화(loxP and loxP2272) 서열(recombinase mediated cassette chage (loxP and loxP2272) sequence)을 삽입하였다. 이를 위해, 마우스 Rosa26 유전자 자리를 표적으로 하는 PAM 서열을 포함하는 16bps를 공유하는 2개의 sgRNA(중첩된 sgRNAs)와 Cas9-mRNA, 34nt loxP를 포함하는 ssODN, 42nt 다중 클로닝 사이트(MCS), 34nt loxP2272 및 각 말단에 45nt 상동염기서열(homology arm)로 구성된 표적 위치는 Rosa26 유전자 위치의 인트론 1 영역을 사용하였다(도 2, 도 3). PCR 기반 유전형 분석을 위해 미량주입한 배반포(blastocyst) 단계의 배아로부터 게놈 DNAs(gDNAs)를 분리하여 총 67개의 배아 중에 17개의 배아가 KI된 서열을 가지고 있었고, 미량주입 한 배아 중 태어난 마우스 8마리 중 3마리의 마우스에서 KI된 서열을 가지고 있음을 확인하였다(도 4). 유전형 분석은 마우스 새끼에서 특정한 프라이머(WT 385bp, KI 495bp)로 PCR을 통해 확인하였다(도 5). 배반포의 유전형 분석은 특정 프라이머를 이용하여 PCR을 통해 확인하였다(도 6). 또한, 마우스 새끼의 염기서열 분석 결과로 괄호는 전체 실험한 클론에 대한 KI 클론의 수와 빈도를 나타낸다(도 7). 상기 결과들로 겹쳐지지 않은 sgRNAs 보다 겹쳐진 sgRNAs를 사용하였을 때, KI의 효율이 더 높음을 확인할 수 있었다.A recombinase mediated cassette change (loxP and loxP2272) sequence was inserted into the Rosa26 locus using two overlapping sgRNAs. To this end, two sgRNAs (nested sgRNAs) sharing 16bps containing the PAM sequence targeting the mouse Rosa26 locus, Cas9-mRNA, ssODN containing 34nt loxP, 42nt multiple cloning site (MCS), 34nt loxP2272 And, the
실험예 2.Experimental example 2. Upf1 유전자를 표적으로 하는 서열의 삽입 효율 확인Confirmation of insertion efficiency of sequences targeting the Upf1 gene
넌센스 전사체 1(nonsense transcripts 1)의 조절자를 인코딩하는 Upf1 유전자를 표적 유전자로 선택하여 실험을 수행하였다. Upf1 유전자 자리의 경우, 인트론 1 영역 또는 인트론 2 영역을 표적하는 적어도 6bps가 겹치는/또는 겹치지 않는 3개의 중첩된 sgRNAs와 loxP를 포함하는 ssODN을 설계하였다(도 8, 도 9). 배아에서 KI의 비율은 PCR을 통해 확인하였다(도 10). 겹치지 않는 sgRNA와 비교하였을 때, 겹치는 sgRNA를 사용하였을 때 KI 효율의 높음이 나타났다. NIH-3T3 세포에 동일한 sgRNAs를 형질주입하여 딥 시퀀싱(deep-sequencing)을 이용해 삭제된 패턴을 분석하였다(도 11). 겹쳐진 sgRNAs를 사용할 경우 짧은 삭제서열의 빈도가 높음을 확인하였다. 배반포의 유전형 분석은 특정 프라이머를 이용하여 PCR을 통해 확인하였다(도 12). NIH-3T3 세포에 Cas9 단백질, sgRNAs 및 ssODN을 형질주입하고 3일 후, 딥시퀀싱을 수행하였다. 상기 결과들로 겹쳐지지 않은 sgRNAs 보다 겹쳐진 sgRNAs를 사용하였을 때, KI의 효율이 더 높음을 확인할 수 있었다.Experiments were performed by selecting the Upf1 gene, which encodes a regulator of
실험예 3.Experimental example 3. Srebf1 유전자를 표적으로 하는 서열의 삽입 효율 확인Confirmation of insertion efficiency of sequences targeting the Srebf1 gene
Sterol regulatory element-binding proein 1을 인코딩하는 Srebf1 유전자를 표적 유전자로 선택하여 실험을 수행하였다. Srebf1 유전자 자리의 경우, 겹쳐지지 않는 2개의 sgRNAs를 이용하여 엑손 1에 loxP 서열을 삽입하였고, 각각 5bps가 겹쳐진 2개의 sgRNA를 엑손 4로 loxP 서열을 삽입하였다(도 13). ssODN은 상동염기서열, 인공서열 및 loxP 서열로 구성하였다(도 14). 마우스 꼬리로부터 수득한 gDNA를 PCR을 통한 유전형을 분석하였다(도 15). 상기 결과들은 전반적으로 겹쳐진 sgRNAs를 사용하였을 때 KI의 효율이 더 높음을 나타낸다.The experiment was performed by selecting the Srebf1 gene encoding sterol regulatory element-binding
실험예 4.Experimental example 4. Tert 유전자를 표적으로 하는 서열의 삽입 효율 확인Confirmation of insertion efficiency of sequences targeting the Tert gene
Telomerase transcriptase를 인코딩하는 Tert 유전자를 표적 유전자로 선택하여 실험을 수행하였다. Tert 유전자 자리의 경우, 각각 14bps 및 21bps가 겹쳐진 2개의 sgRNAs를 이용하여 각각 인트론 1 및 인트론 15에 loxP 서열을 삽입하였다(도 16). ssODN은 상동염기서열(homology arm)과 loxP로 구성하였다(도 17). 마우스 꼬리로부터 수득한 gDNA를 PCR을 통하여 유전형 분석을 하였다(도 18). 이러한 결과들은 겹쳐진 sgRNAs에서 작은 사이즈를 가지는 외부 유전자의 ssODN 매개의 KI 효율이 더 높음을 나타낸다.Experiments were performed by selecting the Tert gene encoding telomerase transcriptase as a target gene. In the case of the Tert locus, loxP sequences were inserted into
실험예 5.Experimental Example 5. Morc2a 유전자를 표적으로 하는 서열의 삽입 효율 확인Confirmation of insertion efficiency of sequences targeting the Morc2a gene
Microrchidia 2A를 인코딩하는 Morc2a 유전자를 표적 유전자로 선택하여 실험을 수행하였다. Morc2a 유전자 자리의 경우, 엑손 6에 점돌연변이(point mutation)를 도입하였다(도 19). 상기 실험을 위해, 60bp 상동염기서열(homology arm)과 표적 유전자의 엑손 6에 260번째 사이토신을 티민으로 교체(cC260T)하는 단일 염기 다형성(Single nucleotide polymorphism, SNP)을 야기하는 숨은 돌연변이(silent mutation)를 포함하는 ssODN을 설계하였다(도 20). 상기 숨은 돌연변이는 표적 유전자가 단백질로 번역될 때 세린이 류신으로 아미노산 치환(pS87L)이 되도록 한다. DSB 패턴을 분석하여, sgRNAs의 결합 위치와 단일 염기 다형성(SNP)를 위한 표적 위치를 확인하였다(도 21). KI 분석을 위해 PCR을 이용한 유전형 분석 결과, 숨은 돌연변이를 야기하는 9개 이상의 점돌연변이가 삽입되었다. loxP의 KI 실험과 같은 방법을 이용하여, 겹쳐진 또는 겹쳐지지 않은 2개의 sgRNAs, Cas9-mRNA 및 ssODN을 1 세포기 접합체(one-cell stage zygotes)에 미량주입 하였고, 배아를 수집하여 PCR을 이용한 유전형 분석을 통해 KI 분석을 수행하였다(도 22). 배반포의 유전형 분석도 PCR을 이용하여 수행하였다(도 23). 또한, 겹쳐진 또는 겹쳐지지 않는 sgRNAs를 형질주입 한 NIH-3T3 세포로부터 gDNA를 수집하여 분석하였다. 그 결과, 타겟 딥 시퀀싱을 통해 겹쳐지지 않는 sgRNAs에 비해 겹쳐진 sgRNA에 의해 더 많은 빈도의 짧은 삭제 패턴을 확인하였다(도 24). NIH-3T3 세포에 Cas9 단백질, sgRNAs 및 ssODN을 형질주입하고 3일 후, 딥시퀀싱을 수행하였다. 또한, NIH-3T3 세포에 Cas9 단백질, sgRNAs 및 ssODN을 형질주입하고 3일 후, 딥시퀀싱을 수행하여, KI 효율을 분석하였다(도 25). 상기 결과들은 겹쳐진 sgRNAs를 사용하였을 때, KI 효율이 증가하는 것을 보여준다.Experiments were performed by selecting the Morc2a gene encoding Microrchidia 2A as a target gene. In the case of the Morc2a locus, a point mutation was introduced in exon 6 (FIG. 19). For the above experiment, a 60 bp homology arm and a silent mutation that causes a single nucleotide polymorphism (SNP) to replace the 260th cytosine with thymine (cC260T) in
실험예 6.Experimental Example 6. Adora2b 유전자를 표적으로 하는 서열의 삽입 효율 확인Confirmation of insertion efficiency of sequences targeting the Adora2b gene
Adenosine A2b receptor를 인코딩하는 Adora2b 유전자를 표적 유전자로 선택하여 실험을 수행하였다. Adora2b 유전자 자리의 경우, 3개의 겹쳐진 sgRNAs 및 2개의 겹쳐지지 않는 sgRNAs를 엑손 2에 점돌연변이를 도입하였다. 상기 실험을 위해, 50nt 상동염기서열과 표적 유전자의 엑손 2에 cA890G의 단일 염기 다형성을 야기하는 숨은 돌연변이를 포함하는 ssODN을 설계하였다(도 26). 겹쳐진 sgRNAs를 주입한 그룹에서 12마리의 새끼가 태어났고, 겹쳐지지 않는 sgRNAs를 주입한 그룹에서는 13마리의 새끼가 태어났다. 마우스 꼬리로부터 수득한 gDNA를 PCR을 통하여 유전형 분석을 하였다(도 27). 또한, 특정 프라이머로 딥시퀀싱을 수행하여 유전형 분석을 수행하였다. 겹쳐지지 않는 sgRNAs에 비해 겹쳐진 sgRNAs가 adora1 유전자 자리에 염기 치환(Ca890G) 유도 KI 효율이 현저하게 높은 것을 확인하였다(도 28). 이러한 결과들은 겹쳐진 sgRNAs가 마우스 접합체에 염기 치환 유도의 ssODN 매개 KI 효율을 향상시킴을 보여준다.Experiments were performed by selecting the Adora2b gene, which encodes the adenosine A2b receptor, as a target gene. For the Adora2b locus, point mutations were introduced in
Claims (18)
상기 조성물은,
Streptococcus pyogenes 유래의 Cas9 단백질 또는 이를 암호화하는 핵산;
제 1 가이드 RNA(first guide RNA) 또는 이를 암호화하는 핵산; 및
제 2 가이드 RNA(second guide RNA) 또는 이를 암호화하는 핵산;
을 포함하고,
상기 제 1 가이드 RNA는 제 1 가이드 도메인을 포함하는 제 1 crRNA(CRISPR RNA), 제 1 tracrRNA(trans-activating crRNA)를 포함하고,
이 때, 상기 제 1 가이드 도메인은 상기 표적 핵산과 전부 상보적인 결합을 할 수 있고,
상기 제 1 crRNA, 제 1 tracrRNA은 상기 Cas9 단백질과 상호작용하고,
상기 제 2 가이드 RNA는 제 2 가이드 도메인을 포함하는 제 2 crRNA(CRISPR RNA), 제 2 tracrRNA(trans-activating crRNA)를 포함하고,
이 때, 상기 제 2 가이드 도메인은 상기 표적 핵산과 전부 상보적인 결합을 할 수 있고,
상기 제 2 crRNA, 제 2 tracrRNA은 상기 Cas9 단백질과 상호작용하고,
상기 제 1 가이드 도메인의 제 1지점에서 3' 말단까지의 서열과 상기 제 2 가이드 도메인의 5' 말단에서 제 2지점까지의 서열은 서로 90% 내지 100% 동일하고,
이 때, 상기 제 2가이드 RNA의 3'말단과 상기 제 2지점 사이에 상기 SpCas9 단백질에 대응되는 PAM(Proto-spacer-Adjacent Motif)서열을 포함하고 있는 것을 특징으로 하는 조성물.
A composition for manipulating a target nucleic acid,
The composition,
Cas9 protein from Streptococcus pyogenes or a nucleic acid encoding the same;
a first guide RNA or a nucleic acid encoding the same; and
Second guide RNA (second guide RNA) or a nucleic acid encoding the same;
including,
The first guide RNA includes a first crRNA (CRISPR RNA) and a first tracrRNA (trans-activating crRNA) including a first guide domain,
At this time, the first guide domain can form a complementary binding with all of the target nucleic acids,
The first crRNA and the first tracrRNA interact with the Cas9 protein,
The second guide RNA includes a second crRNA (CRISPR RNA) and a second tracrRNA (trans-activating crRNA) including a second guide domain,
At this time, the second guide domain can make complementary binding to all of the target nucleic acids,
The second crRNA and the second tracrRNA interact with the Cas9 protein,
The sequence from the first point to the 3' end of the first guide domain and the sequence from the 5' end to the second point of the second guide domain are 90% to 100% identical to each other,
At this time, the composition characterized in that it comprises a PAM (Proto-spacer-Adjacent Motif) sequence corresponding to the SpCas9 protein between the 3' end of the second guide RNA and the second point.
상기 조성물은,
Streptococcus pyogenes 유래의 Cas9 단백질 또는 이를 암호화하는 핵산;
제 1 가이드 RNA(first guide RNA) 또는 이를 암호화하는 핵산; 및
제 2 가이드 RNA(second guide RNA) 또는 이를 암호화하는 핵산;
을 포함하고,
상기 제 1 가이드 RNA는 제 1 가이드 도메인을 포함하는 제 1 crRNA(CRISPR RNA), 제 1 tracrRNA(trans-activating crRNA)를 포함하고,
이 때, 상기 제 1 가이드 도메인은 상기 표적 핵산과 전부 상보적인 결합을 할 수 있고,
상기 제 1 crRNA, 제 1 tracrRNA은 상기 Cas9 단백질과 상호작용하고,
상기 제 2 가이드 RNA는 제 2 가이드 도메인을 포함하는 제 2 crRNA(CRISPR RNA), 제 2 tracrRNA(trans-activating crRNA)를 포함하고,
이 때, 상기 제 2 가이드 도메인은 상기 표적 핵산과 전부 상보적인 결합을 할 수 있고,
상기 제 2 crRNA, 제 2 tracrRNA은 상기 Cas9 단백질과 상호작용하고,
상기 제 1 가이드 도메인의 5'말단에서 제 1지점까지의 서열과 상기 제 2 가이드 도메인의 5'말단에서 제 2지점까지의 서열은 서로 90% 내지 100% 상보성을 가지는 것을 특징으로 하는 조성물.
A composition for manipulating a target nucleic acid,
The composition,
Cas9 protein from Streptococcus pyogenes or a nucleic acid encoding the same;
a first guide RNA or a nucleic acid encoding the same; and
Second guide RNA (second guide RNA) or a nucleic acid encoding the same;
including,
The first guide RNA includes a first crRNA (CRISPR RNA) and a first tracrRNA (trans-activating crRNA) including a first guide domain,
At this time, the first guide domain can form a complementary binding with all of the target nucleic acids,
The first crRNA and the first tracrRNA interact with the Cas9 protein,
The second guide RNA includes a second crRNA (CRISPR RNA) and a second tracrRNA (trans-activating crRNA) including a second guide domain,
At this time, the second guide domain can make complementary binding to all of the target nucleic acids,
The second crRNA and the second tracrRNA interact with the Cas9 protein,
The composition, characterized in that the sequence from the 5' end of the first guide domain to the first point and the sequence from the 5' end of the second guide domain to the second point have 90% to 100% complementarity with each other.
상기 제 2 가이드 도메인의 5'말단에서 제 2지점까지의 길이는 2 base 내지 16base인 것을 특징으로 하는 조성물.
According to claim 1 or 2,
The composition, characterized in that the length from the 5 'end of the second guide domain to the second point is 2 base to 16 base.
제 3 가이드 RNA(third guide RNA) 또는 이를 암호화하는 핵산;을 더 포함할 수 있고,
상기 제 3 가이드 RNA는 제 3 가이드 도메인을 포함하는 제 3 crRNA(CRISPR RNA), 제 3 tracrRNA(trans-activating crRNA)를 포함하고,
이 때, 상기 제 3 가이드 도메인은 상기 표적 핵산과 전부 상보적인 결합을 할 수 있고,
상기 제 3 crRNA, 제 3 tracrRNA은 상기 Cas9 단백질과 상호작용하는 것을 특징으로 하는 조성물.
According to claim 1 or 2,
A third guide RNA (third guide RNA) or a nucleic acid encoding the same; may further include,
The third guide RNA includes a third crRNA (CRISPR RNA) and a third tracrRNA (trans-activating crRNA) including a third guide domain,
At this time, the third guide domain is capable of complementary binding to all of the target nucleic acids,
Wherein the third crRNA and the third tracrRNA interact with the Cas9 protein.
상기 제 3 가이드 도메인의 5'말단에서 제 3지점까지의 서열과 상기 제 2 가이드 도메인의 제 2지점에서 3'말단까지의 서열은 서로 90% 내지 100% 동일한 것을 특징으로 하는 조성물.
According to claim 4,
The composition, characterized in that the sequence from the 5'end to the third point of the third guide domain and the sequence from the second point to the 3'end of the second guide domain are 90% to 100% identical to each other.
상기 제 1 가이드 RNA 및 상기 제 2 가이드 RNA는,
서로 동일한 엑손 또는 인트론을 표적하는 것을 특징으로 하는 조성물.
According to claim 1 or 2,
The first guide RNA and the second guide RNA,
A composition characterized by targeting the same exon or intron as each other.
표적 핵산을 조작하기 위해 도너(donor)를 더 포함할 수 있고, 이 때, 상기 도너는 표적 핵산에 삽입하고자 하는 특정 핵산 서열의 양 말단에 상보적으로 결합할 수 있는 호몰로지 암(homology arm)인 것을 특징으로 하는 조성물.
According to claim 1 or 2,
It may further include a donor to manipulate the target nucleic acid, wherein the donor is a homology arm capable of complementary binding to both ends of a specific nucleic acid sequence to be inserted into the target nucleic acid. A composition characterized in that.
상기 표적 핵산의 조작은, 넉인(Knock-in)인 것을 특징으로 하는 조성물.
According to claim 1 or 2,
The manipulation of the target nucleic acid is a composition, characterized in that knock-in (Knock-in).
상기 표적 핵산은 진핵생물의 게놈 시퀀스인 것을 특징으로 하는 조성물.
According to claim 1 or 2,
The composition, characterized in that the target nucleic acid is a genome sequence of a eukaryote.
상기 PAM 서열은,
5'-NGG-3'(N은 A, T, C 또는 G임)인 것을 특징으로 하는 조성물.
According to claim 1,
The PAM sequence,
5'-NGG-3' (N is A, T, C or G).
상기 제 1항 또는 2항 중 선택되는 어느 하나의 조성물을 세포에 도입시키는 단계;를 포함하고,
이 때, 상기 세포는 원핵세포 또는 분리된 진핵세포인 것을 특징으로 하는 방법.A method for manipulating a target nucleic acid,
Incorporating a composition of any one selected from claim 1 or 2 into cells;
At this time, the method characterized in that the cell is a prokaryotic cell or an isolated eukaryotic cell.
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201762445130P | 2017-01-11 | 2017-01-11 | |
US62/445,130 | 2017-01-11 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20180082981A KR20180082981A (en) | 2018-07-19 |
KR102515727B1 true KR102515727B1 (en) | 2023-03-30 |
Family
ID=63058522
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020180003981A Active KR102515727B1 (en) | 2017-01-11 | 2018-01-11 | Composition and method for inserting specific nucleic acid sequence into target nucleic acid using overlapping guide nucleic acid |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR102515727B1 (en) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2020036445A1 (en) * | 2018-08-16 | 2020-02-20 | 주식회사 라트바이오 | Transgenic animal and transgenic embryo producing artificial nuclease |
KR102103104B1 (en) | 2018-08-16 | 2020-04-22 | (주)라트바이오 | Genetically modified transgenic animals and transgenic embryos |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20160153006A1 (en) | 2013-06-17 | 2016-06-02 | The Broad Institute Inc. | Optimized crispr-cas double nickase systems, methods and compositions for sequence manipulation |
US20160237455A1 (en) | 2013-09-27 | 2016-08-18 | Editas Medicine, Inc. | Crispr-related methods and compositions |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110669758A (en) * | 2012-10-23 | 2020-01-10 | 基因工具股份有限公司 | Composition for cleaving target DNA and use thereof |
US9388430B2 (en) * | 2013-09-06 | 2016-07-12 | President And Fellows Of Harvard College | Cas9-recombinase fusion proteins and uses thereof |
JP2016153006A (en) | 2016-05-30 | 2016-08-25 | 株式会社ユニバーサルエンターテインメント | Enclosed type game machine |
-
2018
- 2018-01-11 KR KR1020180003981A patent/KR102515727B1/en active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20160153006A1 (en) | 2013-06-17 | 2016-06-02 | The Broad Institute Inc. | Optimized crispr-cas double nickase systems, methods and compositions for sequence manipulation |
US20160237455A1 (en) | 2013-09-27 | 2016-08-18 | Editas Medicine, Inc. | Crispr-related methods and compositions |
Also Published As
Publication number | Publication date |
---|---|
KR20180082981A (en) | 2018-07-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20210277389A1 (en) | Methods and Compositions for the Single Tube Preparation of Sequencing Libraries Using Cas9 | |
US20230383290A1 (en) | High-throughput precision genome editing | |
KR102098915B1 (en) | Chimeric genome engineering molecules and methods | |
EP3152312B1 (en) | Methods and compositions for modifying a targeted locus | |
CN113444747B (en) | Methods and compositions for targeted genetic modification using paired guide RNAs | |
Wefers et al. | Gene editing in mouse zygotes using the CRISPR/Cas9 system | |
EP3536796A1 (en) | Gene knockout method | |
KR20200103769A (en) | Extended single guide RNA and uses thereof | |
JP6958917B2 (en) | How to make gene knock-in cells | |
EP3998344A1 (en) | Crispr oligonucleotides and gene editing | |
CN109136248B (en) | Multi-target editing vector and construction method and application thereof | |
KR102151065B1 (en) | Composition and method for base editing in animal embryos | |
CN107922949A (en) | Compounds and methods for for the genome editor based on CRISPR/CAS by homologous recombination | |
Cao et al. | The multiplexed CRISPR targeting platforms | |
KR102515727B1 (en) | Composition and method for inserting specific nucleic acid sequence into target nucleic acid using overlapping guide nucleic acid | |
KR102679001B1 (en) | Compositions and methods for use of engineered base editing fusion protein | |
EP3666898A1 (en) | Gene knockout method | |
US20230295667A1 (en) | Use of anti-crispr agents to control editing in human embryos | |
CN118048344B (en) | Nuclease and preparation method and use thereof | |
CN118048343B (en) | Cas9 nuclease and preparation method and use thereof | |
US20230287459A1 (en) | Single generation targeted gene integration | |
US20220323609A1 (en) | Gene editing to correct aneuploidies and frame shift mutations | |
WO2024023734A1 (en) | MULTI-gRNA GENOME EDITING | |
WO2024182440A2 (en) | Methods and compositions for modifying nucleotide sequences | |
CN117363649A (en) | Gene integration method and application |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PA0109 | Patent application |
Patent event code: PA01091R01D Comment text: Patent Application Patent event date: 20180111 |
|
PG1501 | Laying open of application | ||
PA0201 | Request for examination |
Patent event code: PA02012R01D Patent event date: 20210111 Comment text: Request for Examination of Application Patent event code: PA02011R01I Patent event date: 20180111 Comment text: Patent Application |
|
E902 | Notification of reason for refusal | ||
PE0902 | Notice of grounds for rejection |
Comment text: Notification of reason for refusal Patent event date: 20220630 Patent event code: PE09021S01D |
|
E701 | Decision to grant or registration of patent right | ||
PE0701 | Decision of registration |
Patent event code: PE07011S01D Comment text: Decision to Grant Registration Patent event date: 20230111 |
|
GRNT | Written decision to grant | ||
PR0701 | Registration of establishment |
Comment text: Registration of Establishment Patent event date: 20230327 Patent event code: PR07011E01D |
|
PR1002 | Payment of registration fee |
Payment date: 20230327 End annual number: 3 Start annual number: 1 |
|
PG1601 | Publication of registration |