KR20220041875A - 단일 세포 분석 - Google Patents
단일 세포 분석 Download PDFInfo
- Publication number
- KR20220041875A KR20220041875A KR1020227006454A KR20227006454A KR20220041875A KR 20220041875 A KR20220041875 A KR 20220041875A KR 1020227006454 A KR1020227006454 A KR 1020227006454A KR 20227006454 A KR20227006454 A KR 20227006454A KR 20220041875 A KR20220041875 A KR 20220041875A
- Authority
- KR
- South Korea
- Prior art keywords
- cases
- cell
- sequencing
- cells
- amplification
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000004458 analytical method Methods 0.000 title claims abstract description 82
- 238000000034 method Methods 0.000 claims abstract description 438
- 238000003199 nucleic acid amplification method Methods 0.000 claims abstract description 193
- 230000003321 amplification Effects 0.000 claims abstract description 191
- 238000012163 sequencing technique Methods 0.000 claims abstract description 168
- 230000035772 mutation Effects 0.000 claims abstract description 88
- 108090000623 proteins and genes Proteins 0.000 claims abstract description 64
- 239000000203 mixture Substances 0.000 claims abstract description 55
- 102000004169 proteins and genes Human genes 0.000 claims abstract description 45
- 210000004027 cell Anatomy 0.000 claims description 533
- 150000007523 nucleic acids Chemical class 0.000 claims description 198
- 102000039446 nucleic acids Human genes 0.000 claims description 192
- 108020004707 nucleic acids Proteins 0.000 claims description 192
- 125000003729 nucleotide group Chemical group 0.000 claims description 166
- 239000002773 nucleotide Substances 0.000 claims description 160
- 238000010839 reverse transcription Methods 0.000 claims description 73
- 239000002299 complementary DNA Substances 0.000 claims description 61
- 108020004999 messenger RNA Proteins 0.000 claims description 49
- 238000006073 displacement reaction Methods 0.000 claims description 46
- 230000010076 replication Effects 0.000 claims description 46
- 239000012634 fragment Substances 0.000 claims description 34
- 102000040430 polynucleotide Human genes 0.000 claims description 31
- 108091033319 polynucleotide Proteins 0.000 claims description 31
- 239000002157 polynucleotide Substances 0.000 claims description 31
- 206010028980 Neoplasm Diseases 0.000 claims description 26
- 201000011510 cancer Diseases 0.000 claims description 24
- 230000009089 cytolysis Effects 0.000 claims description 23
- 230000011987 methylation Effects 0.000 claims description 13
- 238000007069 methylation reaction Methods 0.000 claims description 12
- 210000004369 blood Anatomy 0.000 claims description 9
- 239000008280 blood Substances 0.000 claims description 9
- 239000007850 fluorescent dye Substances 0.000 claims description 9
- 230000001605 fetal effect Effects 0.000 claims description 6
- 238000000684 flow cytometry Methods 0.000 claims description 4
- 210000004185 liver Anatomy 0.000 claims description 4
- 210000004072 lung Anatomy 0.000 claims description 4
- 238000007855 methylation-specific PCR Methods 0.000 claims description 4
- 230000001086 cytosolic effect Effects 0.000 claims description 3
- 210000003734 kidney Anatomy 0.000 claims description 3
- 108091008146 restriction endonucleases Proteins 0.000 claims description 3
- 210000003491 skin Anatomy 0.000 claims description 3
- 210000004498 neuroglial cell Anatomy 0.000 claims description 2
- 210000002569 neuron Anatomy 0.000 claims description 2
- OAICVXFJPJFONN-UHFFFAOYSA-N Phosphorus Chemical compound [P] OAICVXFJPJFONN-UHFFFAOYSA-N 0.000 claims 2
- 229910052698 phosphorus Inorganic materials 0.000 claims 2
- 239000011574 phosphorus Substances 0.000 claims 2
- 238000003745 diagnosis Methods 0.000 abstract description 6
- 238000011160 research Methods 0.000 abstract description 4
- 238000002560 therapeutic procedure Methods 0.000 abstract description 4
- 239000013615 primer Substances 0.000 description 154
- 239000000523 sample Substances 0.000 description 144
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 description 124
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 description 124
- 108020004414 DNA Proteins 0.000 description 122
- 108091093088 Amplicon Proteins 0.000 description 110
- 239000002585 base Substances 0.000 description 107
- 239000000047 product Substances 0.000 description 88
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 54
- 238000006243 chemical reaction Methods 0.000 description 52
- 239000011324 bead Substances 0.000 description 46
- 230000004048 modification Effects 0.000 description 34
- 238000012986 modification Methods 0.000 description 34
- 108091034117 Oligonucleotide Proteins 0.000 description 31
- 230000000694 effects Effects 0.000 description 30
- 230000002441 reversible effect Effects 0.000 description 24
- 238000003559 RNA-seq method Methods 0.000 description 22
- 238000001514 detection method Methods 0.000 description 21
- 239000007787 solid Substances 0.000 description 20
- 102000004190 Enzymes Human genes 0.000 description 19
- 108090000790 Enzymes Proteins 0.000 description 19
- 229940088598 enzyme Drugs 0.000 description 19
- 238000002955 isolation Methods 0.000 description 19
- 239000005546 dideoxynucleotide Substances 0.000 description 18
- 239000000243 solution Substances 0.000 description 18
- 108060002716 Exonuclease Proteins 0.000 description 17
- 238000003556 assay Methods 0.000 description 17
- 102000013165 exonuclease Human genes 0.000 description 17
- 239000000872 buffer Substances 0.000 description 16
- 102000004594 DNA Polymerase I Human genes 0.000 description 15
- 108010017826 DNA Polymerase I Proteins 0.000 description 15
- 238000002360 preparation method Methods 0.000 description 15
- 108010010677 Phosphodiesterase I Proteins 0.000 description 14
- 230000000295 complement effect Effects 0.000 description 14
- 230000014509 gene expression Effects 0.000 description 14
- 210000004940 nucleus Anatomy 0.000 description 14
- CVWXJKQAOSCOAB-UHFFFAOYSA-N quizartinib Chemical compound O1C(C(C)(C)C)=CC(NC(=O)NC=2C=CC(=CC=2)C=2N=C3N(C4=CC=C(OCCN5CCOCC5)C=C4S3)C=2)=N1 CVWXJKQAOSCOAB-UHFFFAOYSA-N 0.000 description 14
- 230000035945 sensitivity Effects 0.000 description 14
- 201000010099 disease Diseases 0.000 description 13
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 13
- 229950001626 quizartinib Drugs 0.000 description 13
- 239000011541 reaction mixture Substances 0.000 description 13
- YBJHBAHKTGYVGT-ZKWXMUAHSA-N (+)-Biotin Chemical compound N1C(=O)N[C@@H]2[C@H](CCCCC(=O)O)SC[C@@H]21 YBJHBAHKTGYVGT-ZKWXMUAHSA-N 0.000 description 12
- 108700028369 Alleles Proteins 0.000 description 12
- 238000001712 DNA sequencing Methods 0.000 description 12
- 229940079593 drug Drugs 0.000 description 12
- 239000003814 drug Substances 0.000 description 12
- 241000736262 Microbiota Species 0.000 description 11
- 229910052799 carbon Inorganic materials 0.000 description 11
- 238000010362 genome editing Methods 0.000 description 11
- 238000013507 mapping Methods 0.000 description 11
- 239000011859 microparticle Substances 0.000 description 11
- 239000002105 nanoparticle Substances 0.000 description 11
- 125000006850 spacer group Chemical group 0.000 description 11
- 102100031780 Endonuclease Human genes 0.000 description 10
- ISAKRJDGNUQOIC-UHFFFAOYSA-N Uracil Chemical compound O=C1C=CNC(=O)N1 ISAKRJDGNUQOIC-UHFFFAOYSA-N 0.000 description 10
- 230000001186 cumulative effect Effects 0.000 description 10
- 238000002474 experimental method Methods 0.000 description 10
- 244000052769 pathogen Species 0.000 description 10
- 241000196324 Embryophyta Species 0.000 description 9
- 101000932478 Homo sapiens Receptor-type tyrosine-protein kinase FLT3 Proteins 0.000 description 9
- 102100020718 Receptor-type tyrosine-protein kinase FLT3 Human genes 0.000 description 9
- 101710126859 Single-stranded DNA-binding protein Proteins 0.000 description 9
- 210000002459 blastocyst Anatomy 0.000 description 9
- 239000003153 chemical reaction reagent Substances 0.000 description 9
- 230000009977 dual effect Effects 0.000 description 9
- 230000007613 environmental effect Effects 0.000 description 9
- 210000001519 tissue Anatomy 0.000 description 9
- 108010092799 RNA-directed DNA polymerase Proteins 0.000 description 8
- VYPSYNLAJGMNEJ-UHFFFAOYSA-N Silicium dioxide Chemical compound O=[Si]=O VYPSYNLAJGMNEJ-UHFFFAOYSA-N 0.000 description 8
- JCAQMQLAHNGVPY-UUOKFMHZSA-N [(2r,3s,4r,5r)-3,4-dihydroxy-5-(2,2,4-trioxo-1h-imidazo[4,5-c][1,2,6]thiadiazin-7-yl)oxolan-2-yl]methyl dihydrogen phosphate Chemical compound O[C@@H]1[C@H](O)[C@@H](COP(O)(O)=O)O[C@H]1N1C(NS(=O)(=O)NC2=O)=C2N=C1 JCAQMQLAHNGVPY-UUOKFMHZSA-N 0.000 description 8
- 238000013459 approach Methods 0.000 description 8
- 238000001943 fluorescence-activated cell sorting Methods 0.000 description 8
- 229920001223 polyethylene glycol Polymers 0.000 description 8
- 208000031261 Acute myeloid leukaemia Diseases 0.000 description 7
- 208000033776 Myeloid Acute Leukemia Diseases 0.000 description 7
- 238000012408 PCR amplification Methods 0.000 description 7
- 229920001213 Polysorbate 20 Polymers 0.000 description 7
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 7
- BQRGNLJZBFXNCZ-UHFFFAOYSA-N calcein am Chemical compound O1C(=O)C2=CC=CC=C2C21C1=CC(CN(CC(=O)OCOC(C)=O)CC(=O)OCOC(C)=O)=C(OC(C)=O)C=C1OC1=C2C=C(CN(CC(=O)OCOC(C)=O)CC(=O)OCOC(=O)C)C(OC(C)=O)=C1 BQRGNLJZBFXNCZ-UHFFFAOYSA-N 0.000 description 7
- 230000001413 cellular effect Effects 0.000 description 7
- 210000001175 cerebrospinal fluid Anatomy 0.000 description 7
- 210000000349 chromosome Anatomy 0.000 description 7
- 238000013467 fragmentation Methods 0.000 description 7
- 238000006062 fragmentation reaction Methods 0.000 description 7
- 238000009396 hybridization Methods 0.000 description 7
- 230000002427 irreversible effect Effects 0.000 description 7
- FZWBNHMXJMCXLU-BLAUPYHCSA-N isomaltotriose Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CO)O[C@@H]1OC[C@@H]1[C@@H](O)[C@H](O)[C@@H](O)[C@@H](OC[C@@H](O)[C@@H](O)[C@H](O)[C@@H](O)C=O)O1 FZWBNHMXJMCXLU-BLAUPYHCSA-N 0.000 description 7
- 230000005291 magnetic effect Effects 0.000 description 7
- 239000012528 membrane Substances 0.000 description 7
- 239000000256 polyoxyethylene sorbitan monolaurate Substances 0.000 description 7
- 235000010486 polyoxyethylene sorbitan monolaurate Nutrition 0.000 description 7
- 239000002096 quantum dot Substances 0.000 description 7
- -1 rRNA Proteins 0.000 description 7
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 6
- 229920002307 Dextran Polymers 0.000 description 6
- 102100037111 Uracil-DNA glycosylase Human genes 0.000 description 6
- 230000001580 bacterial effect Effects 0.000 description 6
- 230000027455 binding Effects 0.000 description 6
- 229960002685 biotin Drugs 0.000 description 6
- 235000020958 biotin Nutrition 0.000 description 6
- 239000011616 biotin Substances 0.000 description 6
- 210000001109 blastomere Anatomy 0.000 description 6
- 239000013592 cell lysate Substances 0.000 description 6
- 239000003795 chemical substances by application Substances 0.000 description 6
- 238000004925 denaturation Methods 0.000 description 6
- 230000036425 denaturation Effects 0.000 description 6
- MTHSVFCYNBDYFN-UHFFFAOYSA-N diethylene glycol Chemical compound OCCOCCO MTHSVFCYNBDYFN-UHFFFAOYSA-N 0.000 description 6
- 238000004090 dissolution Methods 0.000 description 6
- 238000005516 engineering process Methods 0.000 description 6
- 230000002068 genetic effect Effects 0.000 description 6
- 238000010348 incorporation Methods 0.000 description 6
- 230000000670 limiting effect Effects 0.000 description 6
- 238000004519 manufacturing process Methods 0.000 description 6
- 239000000463 material Substances 0.000 description 6
- 238000006386 neutralization reaction Methods 0.000 description 6
- 230000008569 process Effects 0.000 description 6
- XJMOSONTPMZWPB-UHFFFAOYSA-M propidium iodide Chemical compound [I-].[I-].C12=CC(N)=CC=C2C2=CC=C(N)C=C2[N+](CCC[N+](C)(CC)CC)=C1C1=CC=CC=C1 XJMOSONTPMZWPB-UHFFFAOYSA-M 0.000 description 6
- UCSJYZPVAKXKNQ-HZYVHMACSA-N streptomycin Chemical compound CN[C@H]1[C@H](O)[C@@H](O)[C@H](CO)O[C@H]1O[C@@H]1[C@](C=O)(O)[C@H](C)O[C@H]1O[C@@H]1[C@@H](NC(N)=N)[C@H](O)[C@@H](NC(N)=N)[C@H](O)[C@H]1O UCSJYZPVAKXKNQ-HZYVHMACSA-N 0.000 description 6
- ASJSAQIRZKANQN-CRCLSJGQSA-N 2-deoxy-D-ribose Chemical compound OC[C@@H](O)[C@@H](O)CC=O ASJSAQIRZKANQN-CRCLSJGQSA-N 0.000 description 5
- 206010003445 Ascites Diseases 0.000 description 5
- 241000322342 Bacillus phage M2 Species 0.000 description 5
- 241000701844 Bacillus virus phi29 Species 0.000 description 5
- 108020004635 Complementary DNA Proteins 0.000 description 5
- 102000053602 DNA Human genes 0.000 description 5
- 102000016559 DNA Primase Human genes 0.000 description 5
- 108010092681 DNA Primase Proteins 0.000 description 5
- 241001465754 Metazoa Species 0.000 description 5
- 208000005228 Pericardial Effusion Diseases 0.000 description 5
- 108010026552 Proteome Proteins 0.000 description 5
- 108010090804 Streptavidin Proteins 0.000 description 5
- 210000001742 aqueous humor Anatomy 0.000 description 5
- 108010058966 bacteriophage T7 induced DNA polymerase Proteins 0.000 description 5
- 238000003339 best practice Methods 0.000 description 5
- 210000001124 body fluid Anatomy 0.000 description 5
- 210000001185 bone marrow Anatomy 0.000 description 5
- 125000001153 fluoro group Chemical group F* 0.000 description 5
- 230000002438 mitochondrial effect Effects 0.000 description 5
- 210000004912 pericardial fluid Anatomy 0.000 description 5
- 239000002953 phosphate buffered saline Substances 0.000 description 5
- 210000004910 pleural fluid Anatomy 0.000 description 5
- 229920000642 polymer Polymers 0.000 description 5
- 125000002924 primary amino group Chemical group [H]N([H])* 0.000 description 5
- 230000037452 priming Effects 0.000 description 5
- 210000003296 saliva Anatomy 0.000 description 5
- 150000003839 salts Chemical class 0.000 description 5
- 239000007790 solid phase Substances 0.000 description 5
- 230000000392 somatic effect Effects 0.000 description 5
- 239000000126 substance Substances 0.000 description 5
- 239000000758 substrate Substances 0.000 description 5
- 210000004881 tumor cell Anatomy 0.000 description 5
- 229940035893 uracil Drugs 0.000 description 5
- 210000002700 urine Anatomy 0.000 description 5
- 238000003260 vortexing Methods 0.000 description 5
- 241000894006 Bacteria Species 0.000 description 4
- 102000052510 DNA-Binding Proteins Human genes 0.000 description 4
- 108010042407 Endonucleases Proteins 0.000 description 4
- 108700024394 Exon Proteins 0.000 description 4
- 229920001917 Ficoll Polymers 0.000 description 4
- 241000233866 Fungi Species 0.000 description 4
- 108091092584 GDNA Proteins 0.000 description 4
- TWRXJAOTZQYOKJ-UHFFFAOYSA-L Magnesium chloride Chemical compound [Mg+2].[Cl-].[Cl-] TWRXJAOTZQYOKJ-UHFFFAOYSA-L 0.000 description 4
- 108060004795 Methyltransferase Proteins 0.000 description 4
- 239000004793 Polystyrene Substances 0.000 description 4
- 108010001244 Tli polymerase Proteins 0.000 description 4
- 108700009124 Transcription Initiation Site Proteins 0.000 description 4
- 230000004075 alteration Effects 0.000 description 4
- 238000003149 assay kit Methods 0.000 description 4
- 238000004113 cell culture Methods 0.000 description 4
- 210000003855 cell nucleus Anatomy 0.000 description 4
- 238000003776 cleavage reaction Methods 0.000 description 4
- 210000002308 embryonic cell Anatomy 0.000 description 4
- 238000013412 genome amplification Methods 0.000 description 4
- 210000004602 germ cell Anatomy 0.000 description 4
- KWIUHFFTVRNATP-UHFFFAOYSA-N glycine betaine Chemical compound C[N+](C)(C)CC([O-])=O KWIUHFFTVRNATP-UHFFFAOYSA-N 0.000 description 4
- 230000006872 improvement Effects 0.000 description 4
- 238000000338 in vitro Methods 0.000 description 4
- 239000003112 inhibitor Substances 0.000 description 4
- 239000007788 liquid Substances 0.000 description 4
- 239000012139 lysis buffer Substances 0.000 description 4
- 239000002609 medium Substances 0.000 description 4
- 239000011325 microbead Substances 0.000 description 4
- 230000000813 microbial effect Effects 0.000 description 4
- 238000007481 next generation sequencing Methods 0.000 description 4
- QJGQUHMNIGDVPM-UHFFFAOYSA-N nitrogen group Chemical group [N] QJGQUHMNIGDVPM-UHFFFAOYSA-N 0.000 description 4
- 108091027963 non-coding RNA Proteins 0.000 description 4
- 102000042567 non-coding RNA Human genes 0.000 description 4
- 229920002223 polystyrene Polymers 0.000 description 4
- 238000010791 quenching Methods 0.000 description 4
- 230000000171 quenching effect Effects 0.000 description 4
- 230000002829 reductive effect Effects 0.000 description 4
- 230000004044 response Effects 0.000 description 4
- 238000005096 rolling process Methods 0.000 description 4
- 230000007017 scission Effects 0.000 description 4
- 239000000377 silicon dioxide Substances 0.000 description 4
- 150000003384 small molecules Chemical class 0.000 description 4
- 239000011534 wash buffer Substances 0.000 description 4
- 108091023043 Alu Element Proteins 0.000 description 3
- 101710116602 DNA-Binding protein G5P Proteins 0.000 description 3
- IAZDPXIOMUYVGZ-UHFFFAOYSA-N Dimethylsulphoxide Chemical compound CS(C)=O IAZDPXIOMUYVGZ-UHFFFAOYSA-N 0.000 description 3
- 108010067770 Endopeptidase K Proteins 0.000 description 3
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 3
- 108020005196 Mitochondrial DNA Proteins 0.000 description 3
- 108010014251 Muramidase Proteins 0.000 description 3
- 102000016943 Muramidase Human genes 0.000 description 3
- 108010062010 N-Acetylmuramoyl-L-alanine Amidase Proteins 0.000 description 3
- 101710163270 Nuclease Proteins 0.000 description 3
- 108091028043 Nucleic acid sequence Proteins 0.000 description 3
- 229930182555 Penicillin Natural products 0.000 description 3
- JGSARLDLIJGVTE-MBNYWOFBSA-N Penicillin G Chemical compound N([C@H]1[C@H]2SC([C@@H](N2C1=O)C(O)=O)(C)C)C(=O)CC1=CC=CC=C1 JGSARLDLIJGVTE-MBNYWOFBSA-N 0.000 description 3
- 229920001030 Polyethylene Glycol 4000 Polymers 0.000 description 3
- 101710162453 Replication factor A Proteins 0.000 description 3
- 101710176758 Replication protein A 70 kDa DNA-binding subunit Proteins 0.000 description 3
- 101710176276 SSB protein Proteins 0.000 description 3
- HEMHJVSKTPXQMS-UHFFFAOYSA-M Sodium hydroxide Chemical compound [OH-].[Na+] HEMHJVSKTPXQMS-UHFFFAOYSA-M 0.000 description 3
- 239000013504 Triton X-100 Substances 0.000 description 3
- 229920004890 Triton X-100 Polymers 0.000 description 3
- 241000700605 Viruses Species 0.000 description 3
- 210000004102 animal cell Anatomy 0.000 description 3
- 239000002246 antineoplastic agent Substances 0.000 description 3
- 230000008901 benefit Effects 0.000 description 3
- 239000013060 biological fluid Substances 0.000 description 3
- 238000001574 biopsy Methods 0.000 description 3
- 230000015572 biosynthetic process Effects 0.000 description 3
- 230000000903 blocking effect Effects 0.000 description 3
- 239000011575 calcium Substances 0.000 description 3
- 230000006037 cell lysis Effects 0.000 description 3
- 239000006285 cell suspension Substances 0.000 description 3
- 238000005119 centrifugation Methods 0.000 description 3
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical class NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 description 3
- 239000003599 detergent Substances 0.000 description 3
- 239000004205 dimethyl polysiloxane Substances 0.000 description 3
- 230000004720 fertilization Effects 0.000 description 3
- 238000001914 filtration Methods 0.000 description 3
- 239000012530 fluid Substances 0.000 description 3
- 238000009472 formulation Methods 0.000 description 3
- 239000000499 gel Substances 0.000 description 3
- 238000012268 genome sequencing Methods 0.000 description 3
- 239000011521 glass Substances 0.000 description 3
- 210000005260 human cell Anatomy 0.000 description 3
- 238000001990 intravenous administration Methods 0.000 description 3
- 229960000274 lysozyme Drugs 0.000 description 3
- 239000004325 lysozyme Substances 0.000 description 3
- 235000010335 lysozyme Nutrition 0.000 description 3
- 239000011777 magnesium Substances 0.000 description 3
- 210000004962 mammalian cell Anatomy 0.000 description 3
- 210000001161 mammalian embryo Anatomy 0.000 description 3
- 239000003550 marker Substances 0.000 description 3
- 230000007246 mechanism Effects 0.000 description 3
- 230000001404 mediated effect Effects 0.000 description 3
- 244000005700 microbiome Species 0.000 description 3
- 239000004005 microsphere Substances 0.000 description 3
- 239000002077 nanosphere Substances 0.000 description 3
- 229940049954 penicillin Drugs 0.000 description 3
- 229920000435 poly(dimethylsiloxane) Polymers 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 230000001915 proofreading effect Effects 0.000 description 3
- 230000017854 proteolysis Effects 0.000 description 3
- 238000012175 pyrosequencing Methods 0.000 description 3
- 238000013442 quality metrics Methods 0.000 description 3
- 230000008261 resistance mechanism Effects 0.000 description 3
- 238000003757 reverse transcription PCR Methods 0.000 description 3
- 238000007841 sequencing by ligation Methods 0.000 description 3
- 239000002689 soil Substances 0.000 description 3
- 239000002904 solvent Substances 0.000 description 3
- 238000010186 staining Methods 0.000 description 3
- 229960005322 streptomycin Drugs 0.000 description 3
- 239000004094 surface-active agent Substances 0.000 description 3
- 238000011222 transcriptome analysis Methods 0.000 description 3
- 238000002054 transplantation Methods 0.000 description 3
- 238000012070 whole genome sequencing analysis Methods 0.000 description 3
- APKFDSVGJQXUKY-KKGHZKTASA-N Amphotericin-B Natural products O[C@H]1[C@@H](N)[C@H](O)[C@@H](C)O[C@H]1O[C@H]1C=CC=CC=CC=CC=CC=CC=C[C@H](C)[C@@H](O)[C@@H](C)[C@H](C)OC(=O)C[C@H](O)C[C@H](O)CC[C@@H](O)[C@H](O)C[C@H](O)C[C@](O)(C[C@H](O)[C@H]2C(O)=O)O[C@H]2C1 APKFDSVGJQXUKY-KKGHZKTASA-N 0.000 description 2
- IJGRMHOSHXDMSA-UHFFFAOYSA-N Atomic nitrogen Chemical compound N#N IJGRMHOSHXDMSA-UHFFFAOYSA-N 0.000 description 2
- 241000283690 Bos taurus Species 0.000 description 2
- 108091061744 Cell-free fetal DNA Proteins 0.000 description 2
- 208000005443 Circulating Neoplastic Cells Diseases 0.000 description 2
- 230000004544 DNA amplification Effects 0.000 description 2
- 108010008286 DNA nucleotidylexotransferase Proteins 0.000 description 2
- 102100029764 DNA-directed DNA/RNA polymerase mu Human genes 0.000 description 2
- 206010059866 Drug resistance Diseases 0.000 description 2
- 102000004533 Endonucleases Human genes 0.000 description 2
- LYCAIKOWRPUZTN-UHFFFAOYSA-N Ethylene glycol Chemical compound OCCO LYCAIKOWRPUZTN-UHFFFAOYSA-N 0.000 description 2
- 241000713800 Feline immunodeficiency virus Species 0.000 description 2
- 101150022345 GAS6 gene Proteins 0.000 description 2
- 108010010803 Gelatin Proteins 0.000 description 2
- 101000923005 Homo sapiens Growth arrest-specific protein 6 Proteins 0.000 description 2
- ZDXPYRJPNDTMRX-VKHMYHEASA-N L-glutamine Chemical compound OC(=O)[C@@H](N)CCC(N)=O ZDXPYRJPNDTMRX-VKHMYHEASA-N 0.000 description 2
- 229930182816 L-glutamine Natural products 0.000 description 2
- CSNNHWWHGAXBCP-UHFFFAOYSA-L Magnesium sulfate Chemical compound [Mg+2].[O-][S+2]([O-])([O-])[O-] CSNNHWWHGAXBCP-UHFFFAOYSA-L 0.000 description 2
- 108010052285 Membrane Proteins Proteins 0.000 description 2
- 102000018697 Membrane Proteins Human genes 0.000 description 2
- 108700011259 MicroRNAs Proteins 0.000 description 2
- 241000713869 Moloney murine leukemia virus Species 0.000 description 2
- 101100335081 Mus musculus Flt3 gene Proteins 0.000 description 2
- 239000008118 PEG 6000 Substances 0.000 description 2
- 229910019142 PO4 Inorganic materials 0.000 description 2
- 108091005804 Peptidases Proteins 0.000 description 2
- 229920002584 Polyethylene Glycol 6000 Polymers 0.000 description 2
- 229920002594 Polyethylene Glycol 8000 Polymers 0.000 description 2
- WCUXLLCKKVVCTQ-UHFFFAOYSA-M Potassium chloride Chemical compound [Cl-].[K+] WCUXLLCKKVVCTQ-UHFFFAOYSA-M 0.000 description 2
- 239000004365 Protease Substances 0.000 description 2
- 239000012979 RPMI medium Substances 0.000 description 2
- 102000018780 Replication Protein A Human genes 0.000 description 2
- 108010027643 Replication Protein A Proteins 0.000 description 2
- 102100037486 Reverse transcriptase/ribonuclease H Human genes 0.000 description 2
- 108091028664 Ribonucleotide Proteins 0.000 description 2
- XUIMIQQOPSSXEZ-UHFFFAOYSA-N Silicon Chemical compound [Si] XUIMIQQOPSSXEZ-UHFFFAOYSA-N 0.000 description 2
- 108020004459 Small interfering RNA Proteins 0.000 description 2
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 2
- PPBRXRYQALVLMV-UHFFFAOYSA-N Styrene Chemical compound C=CC1=CC=CC=C1 PPBRXRYQALVLMV-UHFFFAOYSA-N 0.000 description 2
- 102000008579 Transposases Human genes 0.000 description 2
- 108010020764 Transposases Proteins 0.000 description 2
- 108010072685 Uracil-DNA Glycosidase Proteins 0.000 description 2
- 230000004913 activation Effects 0.000 description 2
- 239000003513 alkali Substances 0.000 description 2
- 210000004381 amniotic fluid Anatomy 0.000 description 2
- APKFDSVGJQXUKY-INPOYWNPSA-N amphotericin B Chemical compound O[C@H]1[C@@H](N)[C@H](O)[C@@H](C)O[C@H]1O[C@H]1/C=C/C=C/C=C/C=C/C=C/C=C/C=C/[C@H](C)[C@@H](O)[C@@H](C)[C@H](C)OC(=O)C[C@H](O)C[C@H](O)CC[C@@H](O)[C@H](O)C[C@H](O)C[C@](O)(C[C@H](O)[C@H]2C(O)=O)O[C@H]2C1 APKFDSVGJQXUKY-INPOYWNPSA-N 0.000 description 2
- 229960003942 amphotericin b Drugs 0.000 description 2
- 238000000137 annealing Methods 0.000 description 2
- 229960003237 betaine Drugs 0.000 description 2
- 239000012472 biological sample Substances 0.000 description 2
- 239000010839 body fluid Substances 0.000 description 2
- 229910002091 carbon monoxide Inorganic materials 0.000 description 2
- 238000002659 cell therapy Methods 0.000 description 2
- 108091092259 cell-free RNA Proteins 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 239000003638 chemical reducing agent Substances 0.000 description 2
- 238000012937 correction Methods 0.000 description 2
- 210000000172 cytosol Anatomy 0.000 description 2
- 229940127089 cytotoxic agent Drugs 0.000 description 2
- 238000007405 data analysis Methods 0.000 description 2
- 230000007423 decrease Effects 0.000 description 2
- 238000012350 deep sequencing Methods 0.000 description 2
- 238000012217 deletion Methods 0.000 description 2
- 230000037430 deletion Effects 0.000 description 2
- 230000001419 dependent effect Effects 0.000 description 2
- 238000004720 dielectrophoresis Methods 0.000 description 2
- 238000010494 dissociation reaction Methods 0.000 description 2
- 230000005593 dissociations Effects 0.000 description 2
- 239000000890 drug combination Substances 0.000 description 2
- 210000002257 embryonic structure Anatomy 0.000 description 2
- 230000002255 enzymatic effect Effects 0.000 description 2
- 230000001747 exhibiting effect Effects 0.000 description 2
- 230000005294 ferromagnetic effect Effects 0.000 description 2
- 238000002866 fluorescence resonance energy transfer Methods 0.000 description 2
- 238000007672 fourth generation sequencing Methods 0.000 description 2
- 239000013505 freshwater Substances 0.000 description 2
- 230000002538 fungal effect Effects 0.000 description 2
- 229920000159 gelatin Polymers 0.000 description 2
- 239000008273 gelatin Substances 0.000 description 2
- 235000019322 gelatine Nutrition 0.000 description 2
- 235000011852 gelatine desserts Nutrition 0.000 description 2
- 150000004676 glycans Chemical class 0.000 description 2
- UYTPUPDQBNUYGX-UHFFFAOYSA-N guanine Chemical compound O=C1NC(N)=NC2=C1N=CN2 UYTPUPDQBNUYGX-UHFFFAOYSA-N 0.000 description 2
- 230000003394 haemopoietic effect Effects 0.000 description 2
- 230000003100 immobilizing effect Effects 0.000 description 2
- 238000011065 in-situ storage Methods 0.000 description 2
- 238000011534 incubation Methods 0.000 description 2
- 208000015181 infectious disease Diseases 0.000 description 2
- 230000005764 inhibitory process Effects 0.000 description 2
- 238000003780 insertion Methods 0.000 description 2
- 230000037431 insertion Effects 0.000 description 2
- 230000010354 integration Effects 0.000 description 2
- 239000003446 ligand Substances 0.000 description 2
- 210000002751 lymph Anatomy 0.000 description 2
- 239000006166 lysate Substances 0.000 description 2
- 229910001629 magnesium chloride Inorganic materials 0.000 description 2
- 230000036210 malignancy Effects 0.000 description 2
- MYWUZJCMWCOHBA-VIFPVBQESA-N methamphetamine Chemical compound CN[C@@H](C)CC1=CC=CC=C1 MYWUZJCMWCOHBA-VIFPVBQESA-N 0.000 description 2
- 244000005706 microflora Species 0.000 description 2
- 238000010369 molecular cloning Methods 0.000 description 2
- 239000003471 mutagenic agent Substances 0.000 description 2
- 229920002113 octoxynol Polymers 0.000 description 2
- 239000003921 oil Substances 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 210000000056 organ Anatomy 0.000 description 2
- 239000005022 packaging material Substances 0.000 description 2
- 239000013610 patient sample Substances 0.000 description 2
- 230000002974 pharmacogenomic effect Effects 0.000 description 2
- 235000021317 phosphate Nutrition 0.000 description 2
- 230000026731 phosphorylation Effects 0.000 description 2
- 238000006366 phosphorylation reaction Methods 0.000 description 2
- 239000004033 plastic Substances 0.000 description 2
- 229920003023 plastic Polymers 0.000 description 2
- BASFCYQUMIYNBI-UHFFFAOYSA-N platinum Chemical compound [Pt] BASFCYQUMIYNBI-UHFFFAOYSA-N 0.000 description 2
- 229920002523 polyethylene Glycol 1000 Polymers 0.000 description 2
- 229920001282 polysaccharide Polymers 0.000 description 2
- 239000005017 polysaccharide Substances 0.000 description 2
- 230000001124 posttranscriptional effect Effects 0.000 description 2
- 235000019419 proteases Nutrition 0.000 description 2
- 238000000746 purification Methods 0.000 description 2
- 238000003908 quality control method Methods 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 230000008439 repair process Effects 0.000 description 2
- 239000003161 ribonuclease inhibitor Substances 0.000 description 2
- 239000002336 ribonucleotide Substances 0.000 description 2
- 125000002652 ribonucleotide group Chemical group 0.000 description 2
- 210000000582 semen Anatomy 0.000 description 2
- 229910052710 silicon Inorganic materials 0.000 description 2
- 239000010703 silicon Substances 0.000 description 2
- 239000004055 small Interfering RNA Substances 0.000 description 2
- 238000009987 spinning Methods 0.000 description 2
- 238000010561 standard procedure Methods 0.000 description 2
- 210000000130 stem cell Anatomy 0.000 description 2
- 238000003786 synthesis reaction Methods 0.000 description 2
- 230000008685 targeting Effects 0.000 description 2
- 238000010257 thawing Methods 0.000 description 2
- 238000005382 thermal cycling Methods 0.000 description 2
- RYYWUUFWQRZTIU-UHFFFAOYSA-K thiophosphate Chemical compound [O-]P([O-])([O-])=S RYYWUUFWQRZTIU-UHFFFAOYSA-K 0.000 description 2
- RWQNBRDOKXIBIV-UHFFFAOYSA-N thymine Chemical compound CC1=CNC(=O)NC1=O RWQNBRDOKXIBIV-UHFFFAOYSA-N 0.000 description 2
- 238000013519 translation Methods 0.000 description 2
- WKKCYLSCLQVWFD-UHFFFAOYSA-N 1,2-dihydropyrimidin-4-amine Chemical compound N=C1NCNC=C1 WKKCYLSCLQVWFD-UHFFFAOYSA-N 0.000 description 1
- MXHRCPNRJAMMIM-SHYZEUOFSA-N 2'-deoxyuridine Chemical compound C1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C=C1 MXHRCPNRJAMMIM-SHYZEUOFSA-N 0.000 description 1
- FZWBNHMXJMCXLU-UHFFFAOYSA-N 2,3,4,5-tetrahydroxy-6-[3,4,5-trihydroxy-6-[[3,4,5-trihydroxy-6-(hydroxymethyl)oxan-2-yl]oxymethyl]oxan-2-yl]oxyhexanal Chemical compound OC1C(O)C(O)C(CO)OC1OCC1C(O)C(O)C(O)C(OCC(O)C(O)C(O)C(O)C=O)O1 FZWBNHMXJMCXLU-UHFFFAOYSA-N 0.000 description 1
- QKNYBSVHEMOAJP-UHFFFAOYSA-N 2-amino-2-(hydroxymethyl)propane-1,3-diol;hydron;chloride Chemical compound Cl.OCC(N)(CO)CO QKNYBSVHEMOAJP-UHFFFAOYSA-N 0.000 description 1
- FWBHETKCLVMNFS-UHFFFAOYSA-N 4',6-Diamino-2-phenylindol Chemical compound C1=CC(C(=N)N)=CC=C1C1=CC2=CC=C(C(N)=N)C=C2N1 FWBHETKCLVMNFS-UHFFFAOYSA-N 0.000 description 1
- BGWLYQZDNFIFRX-UHFFFAOYSA-N 5-[3-[2-[3-(3,8-diamino-6-phenylphenanthridin-5-ium-5-yl)propylamino]ethylamino]propyl]-6-phenylphenanthridin-5-ium-3,8-diamine;dichloride Chemical compound [Cl-].[Cl-].C=1C(N)=CC=C(C2=CC=C(N)C=C2[N+]=2CCCNCCNCCC[N+]=3C4=CC(N)=CC=C4C4=CC=C(N)C=C4C=3C=3C=CC=CC=3)C=1C=2C1=CC=CC=C1 BGWLYQZDNFIFRX-UHFFFAOYSA-N 0.000 description 1
- 229930024421 Adenine Natural products 0.000 description 1
- GFFGJBXGBJISGV-UHFFFAOYSA-N Adenine Chemical compound NC1=NC=NC2=C1N=CN2 GFFGJBXGBJISGV-UHFFFAOYSA-N 0.000 description 1
- 229920000936 Agarose Polymers 0.000 description 1
- 108020000992 Ancient DNA Proteins 0.000 description 1
- 241000713838 Avian myeloblastosis virus Species 0.000 description 1
- 101150062763 BMRF1 gene Proteins 0.000 description 1
- LSNNMFCWUKXFEE-UHFFFAOYSA-M Bisulfite Chemical compound OS([O-])=O LSNNMFCWUKXFEE-UHFFFAOYSA-M 0.000 description 1
- 101001042041 Bos taurus Isocitrate dehydrogenase [NAD] subunit beta, mitochondrial Proteins 0.000 description 1
- 108091033409 CRISPR Proteins 0.000 description 1
- 238000010354 CRISPR gene editing Methods 0.000 description 1
- OYPRJOBELJOOCE-UHFFFAOYSA-N Calcium Chemical compound [Ca] OYPRJOBELJOOCE-UHFFFAOYSA-N 0.000 description 1
- 241000253373 Caldanaerobacter subterraneus subsp. tengcongensis Species 0.000 description 1
- 241000282472 Canis lupus familiaris Species 0.000 description 1
- 239000004215 Carbon black (E152) Substances 0.000 description 1
- CURLTUGMZLYLDI-UHFFFAOYSA-N Carbon dioxide Chemical compound O=C=O CURLTUGMZLYLDI-UHFFFAOYSA-N 0.000 description 1
- 206010007269 Carcinogenicity Diseases 0.000 description 1
- 238000001353 Chip-sequencing Methods 0.000 description 1
- 108010077544 Chromatin Proteins 0.000 description 1
- VYZAMTAEIAYCRO-UHFFFAOYSA-N Chromium Chemical compound [Cr] VYZAMTAEIAYCRO-UHFFFAOYSA-N 0.000 description 1
- 206010008805 Chromosomal abnormalities Diseases 0.000 description 1
- 208000031404 Chromosome Aberrations Diseases 0.000 description 1
- 108091028075 Circular RNA Proteins 0.000 description 1
- 108091026890 Coding region Proteins 0.000 description 1
- 208000035473 Communicable disease Diseases 0.000 description 1
- 238000000116 DAPI staining Methods 0.000 description 1
- 101150026402 DBP gene Proteins 0.000 description 1
- 108020001738 DNA Glycosylase Proteins 0.000 description 1
- 108020003215 DNA Probes Proteins 0.000 description 1
- 102000028381 DNA glycosylase Human genes 0.000 description 1
- 238000007399 DNA isolation Methods 0.000 description 1
- 101710134178 DNA polymerase processivity factor BMRF1 Proteins 0.000 description 1
- 239000003155 DNA primer Chemical class 0.000 description 1
- 239000003298 DNA probe Substances 0.000 description 1
- 101710096438 DNA-binding protein Proteins 0.000 description 1
- 241000255925 Diptera Species 0.000 description 1
- 201000010374 Down Syndrome Diseases 0.000 description 1
- 101100300807 Drosophila melanogaster spn-A gene Proteins 0.000 description 1
- 239000012591 Dulbecco’s Phosphate Buffered Saline Substances 0.000 description 1
- KCXVZYZYPLLWCC-UHFFFAOYSA-N EDTA Chemical compound OC(=O)CN(CC(O)=O)CCN(CC(O)=O)CC(O)=O KCXVZYZYPLLWCC-UHFFFAOYSA-N 0.000 description 1
- 101800001466 Envelope glycoprotein E1 Proteins 0.000 description 1
- 241000283086 Equidae Species 0.000 description 1
- 241000588724 Escherichia coli Species 0.000 description 1
- 241000701533 Escherichia virus T4 Species 0.000 description 1
- 208000036307 FLT3 internal tandem duplication acute myeloid leukemia Diseases 0.000 description 1
- 241000282326 Felis catus Species 0.000 description 1
- 102100039788 GTPase NRas Human genes 0.000 description 1
- 208000034826 Genetic Predisposition to Disease Diseases 0.000 description 1
- 108010033128 Glucan Endo-1,3-beta-D-Glucosidase Proteins 0.000 description 1
- 108010033040 Histones Proteins 0.000 description 1
- 241000282412 Homo Species 0.000 description 1
- 101000744505 Homo sapiens GTPase NRas Proteins 0.000 description 1
- 101000960234 Homo sapiens Isocitrate dehydrogenase [NADP] cytoplasmic Proteins 0.000 description 1
- 101000653374 Homo sapiens Methylcytosine dioxygenase TET2 Proteins 0.000 description 1
- 101000807561 Homo sapiens Tyrosine-protein kinase receptor UFO Proteins 0.000 description 1
- 102100039905 Isocitrate dehydrogenase [NADP] cytoplasmic Human genes 0.000 description 1
- 241000713666 Lentivirus Species 0.000 description 1
- 102000003960 Ligases Human genes 0.000 description 1
- 108090000364 Ligases Proteins 0.000 description 1
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 1
- 239000004472 Lysine Substances 0.000 description 1
- FYYHWMGAXLPEAU-UHFFFAOYSA-N Magnesium Chemical compound [Mg] FYYHWMGAXLPEAU-UHFFFAOYSA-N 0.000 description 1
- 241000124008 Mammalia Species 0.000 description 1
- 206010027476 Metastases Diseases 0.000 description 1
- 102100030803 Methylcytosine dioxygenase TET2 Human genes 0.000 description 1
- 241000714177 Murine leukemia virus Species 0.000 description 1
- 241000699670 Mus sp. Species 0.000 description 1
- OKIZCWYLBDKLSU-UHFFFAOYSA-M N,N,N-Trimethylmethanaminium chloride Chemical compound [Cl-].C[N+](C)(C)C OKIZCWYLBDKLSU-UHFFFAOYSA-M 0.000 description 1
- ZMXDDKWLCZADIW-UHFFFAOYSA-N N,N-dimethylformamide Substances CN(C)C=O ZMXDDKWLCZADIW-UHFFFAOYSA-N 0.000 description 1
- 239000000020 Nitrocellulose Substances 0.000 description 1
- 108020004485 Nonsense Codon Proteins 0.000 description 1
- 239000004677 Nylon Substances 0.000 description 1
- 201000009928 Patau syndrome Diseases 0.000 description 1
- 241001494479 Pecora Species 0.000 description 1
- 239000004698 Polyethylene Substances 0.000 description 1
- 239000002202 Polyethylene glycol Substances 0.000 description 1
- 108010021757 Polynucleotide 5'-Hydroxyl-Kinase Proteins 0.000 description 1
- 102000008422 Polynucleotide 5'-hydroxyl-kinase Human genes 0.000 description 1
- 239000004743 Polypropylene Substances 0.000 description 1
- ZLMJMSJWJFRBEC-UHFFFAOYSA-N Potassium Chemical compound [K] ZLMJMSJWJFRBEC-UHFFFAOYSA-N 0.000 description 1
- 102100039824 Pre T-cell antigen receptor alpha Human genes 0.000 description 1
- 208000006994 Precancerous Conditions Diseases 0.000 description 1
- 101710193739 Protein RecA Proteins 0.000 description 1
- 108020004518 RNA Probes Proteins 0.000 description 1
- 238000002123 RNA extraction Methods 0.000 description 1
- 239000013616 RNA primer Chemical class 0.000 description 1
- 239000003391 RNA probe Substances 0.000 description 1
- 239000012980 RPMI-1640 medium Substances 0.000 description 1
- 241000700159 Rattus Species 0.000 description 1
- 108020004511 Recombinant DNA Proteins 0.000 description 1
- 102000006382 Ribonucleases Human genes 0.000 description 1
- 108010083644 Ribonucleases Proteins 0.000 description 1
- 241000011473 Salmonella virus HK620 Species 0.000 description 1
- 108010022999 Serine Proteases Proteins 0.000 description 1
- 102000012479 Serine Proteases Human genes 0.000 description 1
- 241000270295 Serpentes Species 0.000 description 1
- 241000700584 Simplexvirus Species 0.000 description 1
- 241000282887 Suidae Species 0.000 description 1
- 101150104425 T4 gene Proteins 0.000 description 1
- PZBFGYYEXUXCOF-UHFFFAOYSA-N TCEP Chemical compound OC(=O)CCP(CCC(O)=O)CCC(O)=O PZBFGYYEXUXCOF-UHFFFAOYSA-N 0.000 description 1
- 108010006785 Taq Polymerase Proteins 0.000 description 1
- 206010043275 Teratogenicity Diseases 0.000 description 1
- DHXVGJBLRPWPCS-UHFFFAOYSA-N Tetrahydropyran Chemical compound C1CCOCC1 DHXVGJBLRPWPCS-UHFFFAOYSA-N 0.000 description 1
- 208000035199 Tetraploidy Diseases 0.000 description 1
- 108091023040 Transcription factor Proteins 0.000 description 1
- 102000040945 Transcription factor Human genes 0.000 description 1
- 101800001690 Transmembrane protein gp41 Proteins 0.000 description 1
- 208000003721 Triple Negative Breast Neoplasms Diseases 0.000 description 1
- 206010044686 Trisomy 13 Diseases 0.000 description 1
- 208000006284 Trisomy 13 Syndrome Diseases 0.000 description 1
- 102100037236 Tyrosine-protein kinase receptor UFO Human genes 0.000 description 1
- 241000101098 Xenotropic MuLV-related virus Species 0.000 description 1
- 230000021736 acetylation Effects 0.000 description 1
- 238000006640 acetylation reaction Methods 0.000 description 1
- NIXOWILDQLNWCW-UHFFFAOYSA-N acrylic acid group Chemical group C(C=C)(=O)O NIXOWILDQLNWCW-UHFFFAOYSA-N 0.000 description 1
- 239000000654 additive Substances 0.000 description 1
- 229960000643 adenine Drugs 0.000 description 1
- 150000001345 alkine derivatives Chemical class 0.000 description 1
- 150000003863 ammonium salts Chemical class 0.000 description 1
- 208000036878 aneuploidy Diseases 0.000 description 1
- 231100001075 aneuploidy Toxicity 0.000 description 1
- 238000002399 angioplasty Methods 0.000 description 1
- 238000010171 animal model Methods 0.000 description 1
- 239000000427 antigen Substances 0.000 description 1
- 108091007433 antigens Proteins 0.000 description 1
- 102000036639 antigens Human genes 0.000 description 1
- 239000004599 antimicrobial Substances 0.000 description 1
- 229940041181 antineoplastic drug Drugs 0.000 description 1
- 125000004429 atom Chemical group 0.000 description 1
- 150000001540 azides Chemical class 0.000 description 1
- 230000037429 base substitution Effects 0.000 description 1
- 239000003637 basic solution Substances 0.000 description 1
- 238000010296 bead milling Methods 0.000 description 1
- 230000002146 bilateral effect Effects 0.000 description 1
- 238000003766 bioinformatics method Methods 0.000 description 1
- 239000012620 biological material Substances 0.000 description 1
- 230000033228 biological regulation Effects 0.000 description 1
- 239000008364 bulk solution Substances 0.000 description 1
- 229910052791 calcium Inorganic materials 0.000 description 1
- 235000011089 carbon dioxide Nutrition 0.000 description 1
- 230000007670 carcinogenicity Effects 0.000 description 1
- 231100000260 carcinogenicity Toxicity 0.000 description 1
- 210000003850 cellular structure Anatomy 0.000 description 1
- 239000001913 cellulose Substances 0.000 description 1
- 229920002678 cellulose Polymers 0.000 description 1
- 210000002230 centromere Anatomy 0.000 description 1
- 239000000919 ceramic Substances 0.000 description 1
- 125000003636 chemical group Chemical group 0.000 description 1
- 238000002512 chemotherapy Methods 0.000 description 1
- 210000003483 chromatin Anatomy 0.000 description 1
- 229910052804 chromium Inorganic materials 0.000 description 1
- 239000011651 chromium Substances 0.000 description 1
- 238000010367 cloning Methods 0.000 description 1
- 210000001072 colon Anatomy 0.000 description 1
- 238000010835 comparative analysis Methods 0.000 description 1
- 230000000052 comparative effect Effects 0.000 description 1
- 239000003636 conditioned culture medium Substances 0.000 description 1
- 230000003750 conditioning effect Effects 0.000 description 1
- 229920001577 copolymer Polymers 0.000 description 1
- 238000012864 cross contamination Methods 0.000 description 1
- 229940104302 cytosine Drugs 0.000 description 1
- 230000003013 cytotoxicity Effects 0.000 description 1
- 231100000135 cytotoxicity Toxicity 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 239000003398 denaturant Substances 0.000 description 1
- 239000013578 denaturing buffer Substances 0.000 description 1
- 239000005547 deoxyribonucleotide Substances 0.000 description 1
- 125000002637 deoxyribonucleotide group Chemical group 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- MXHRCPNRJAMMIM-UHFFFAOYSA-N desoxyuridine Natural products C1C(O)C(CO)OC1N1C(=O)NC(=O)C=C1 MXHRCPNRJAMMIM-UHFFFAOYSA-N 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 229960002086 dextran Drugs 0.000 description 1
- 229940119744 dextran 40 Drugs 0.000 description 1
- 229940119743 dextran 70 Drugs 0.000 description 1
- 230000009274 differential gene expression Effects 0.000 description 1
- 230000029087 digestion Effects 0.000 description 1
- 238000010790 dilution Methods 0.000 description 1
- 239000012895 dilution Substances 0.000 description 1
- 238000011978 dissolution method Methods 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- VHJLVAABSRFDPM-ZXZARUISSA-N dithioerythritol Chemical compound SC[C@H](O)[C@H](O)CS VHJLVAABSRFDPM-ZXZARUISSA-N 0.000 description 1
- 239000010459 dolomite Substances 0.000 description 1
- 229910000514 dolomite Inorganic materials 0.000 description 1
- 239000000975 dye Substances 0.000 description 1
- 238000010291 electrical method Methods 0.000 description 1
- 238000005370 electroosmosis Methods 0.000 description 1
- 238000001962 electrophoresis Methods 0.000 description 1
- 239000000839 emulsion Substances 0.000 description 1
- 239000003623 enhancer Substances 0.000 description 1
- 230000001973 epigenetic effect Effects 0.000 description 1
- 230000004049 epigenetic modification Effects 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 230000005284 excitation Effects 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 210000002950 fibroblast Anatomy 0.000 description 1
- 238000000799 fluorescence microscopy Methods 0.000 description 1
- 238000001215 fluorescent labelling Methods 0.000 description 1
- 231100000221 frame shift mutation induction Toxicity 0.000 description 1
- 230000037433 frameshift Effects 0.000 description 1
- 230000008014 freezing Effects 0.000 description 1
- 238000007710 freezing Methods 0.000 description 1
- 230000005021 gait Effects 0.000 description 1
- 238000001502 gel electrophoresis Methods 0.000 description 1
- 238000007429 general method Methods 0.000 description 1
- 108010026195 glycanase Proteins 0.000 description 1
- 230000013595 glycosylation Effects 0.000 description 1
- 238000006206 glycosylation reaction Methods 0.000 description 1
- 230000012010 growth Effects 0.000 description 1
- 239000001963 growth medium Substances 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 238000010438 heat treatment Methods 0.000 description 1
- 238000012165 high-throughput sequencing Methods 0.000 description 1
- 229930195733 hydrocarbon Natural products 0.000 description 1
- 150000002430 hydrocarbons Chemical class 0.000 description 1
- 239000000017 hydrogel Substances 0.000 description 1
- 229920001477 hydrophilic polymer Polymers 0.000 description 1
- 125000001165 hydrophobic group Chemical group 0.000 description 1
- 125000002887 hydroxy group Chemical group [H]O* 0.000 description 1
- 238000007031 hydroxymethylation reaction Methods 0.000 description 1
- 230000002977 hyperthermial effect Effects 0.000 description 1
- 210000001822 immobilized cell Anatomy 0.000 description 1
- 238000002513 implantation Methods 0.000 description 1
- 238000000126 in silico method Methods 0.000 description 1
- 238000007901 in situ hybridization Methods 0.000 description 1
- 210000004263 induced pluripotent stem cell Anatomy 0.000 description 1
- 239000004615 ingredient Substances 0.000 description 1
- 150000002500 ions Chemical class 0.000 description 1
- 229940043355 kinase inhibitor Drugs 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 230000003902 lesion Effects 0.000 description 1
- 208000032839 leukemia Diseases 0.000 description 1
- 230000002934 lysing effect Effects 0.000 description 1
- 230000002101 lytic effect Effects 0.000 description 1
- 229910052749 magnesium Inorganic materials 0.000 description 1
- 159000000003 magnesium salts Chemical class 0.000 description 1
- 229910052943 magnesium sulfate Inorganic materials 0.000 description 1
- 235000019341 magnesium sulphate Nutrition 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 230000003211 malignant effect Effects 0.000 description 1
- 238000004949 mass spectrometry Methods 0.000 description 1
- 238000001840 matrix-assisted laser desorption--ionisation time-of-flight mass spectrometry Methods 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 229910052751 metal Inorganic materials 0.000 description 1
- 239000002184 metal Substances 0.000 description 1
- 150000002739 metals Chemical class 0.000 description 1
- 230000009401 metastasis Effects 0.000 description 1
- 238000012164 methylation sequencing Methods 0.000 description 1
- YACKEPLHDIMKIO-UHFFFAOYSA-N methylphosphonic acid Chemical group CP(O)(O)=O YACKEPLHDIMKIO-UHFFFAOYSA-N 0.000 description 1
- BMGQWWVMWDBQGC-IIFHNQTCSA-N midostaurin Chemical compound CN([C@H]1[C@H]([C@]2(C)O[C@@H](N3C4=CC=CC=C4C4=C5C(=O)NCC5=C5C6=CC=CC=C6N2C5=C43)C1)OC)C(=O)C1=CC=CC=C1 BMGQWWVMWDBQGC-IIFHNQTCSA-N 0.000 description 1
- 229950010895 midostaurin Drugs 0.000 description 1
- 230000003278 mimic effect Effects 0.000 description 1
- 239000003068 molecular probe Substances 0.000 description 1
- 238000003541 multi-stage reaction Methods 0.000 description 1
- 231100000350 mutagenesis Toxicity 0.000 description 1
- 231100000707 mutagenic chemical Toxicity 0.000 description 1
- 230000003505 mutagenic effect Effects 0.000 description 1
- 231100000299 mutagenicity Toxicity 0.000 description 1
- 230000007886 mutagenicity Effects 0.000 description 1
- 230000000869 mutational effect Effects 0.000 description 1
- 239000011807 nanoball Substances 0.000 description 1
- 239000002102 nanobead Substances 0.000 description 1
- 239000002547 new drug Substances 0.000 description 1
- 150000002823 nitrates Chemical class 0.000 description 1
- 229920001220 nitrocellulos Polymers 0.000 description 1
- 229910052757 nitrogen Inorganic materials 0.000 description 1
- 230000002352 nonmutagenic effect Effects 0.000 description 1
- 230000037434 nonsense mutation Effects 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 238000007899 nucleic acid hybridization Methods 0.000 description 1
- 230000005257 nucleotidylation Effects 0.000 description 1
- 229920001778 nylon Polymers 0.000 description 1
- 238000002515 oligonucleotide synthesis Methods 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 210000003463 organelle Anatomy 0.000 description 1
- 230000003204 osmotic effect Effects 0.000 description 1
- 230000002018 overexpression Effects 0.000 description 1
- 210000000496 pancreas Anatomy 0.000 description 1
- 230000005298 paramagnetic effect Effects 0.000 description 1
- 230000037438 passenger mutation Effects 0.000 description 1
- 230000001717 pathogenic effect Effects 0.000 description 1
- 230000037361 pathway Effects 0.000 description 1
- 239000008188 pellet Substances 0.000 description 1
- RVZRBWKZFJCCIB-UHFFFAOYSA-N perfluorotributylamine Chemical compound FC(F)(F)C(F)(F)C(F)(F)C(F)(F)N(C(F)(F)C(F)(F)C(F)(F)C(F)(F)F)C(F)(F)C(F)(F)C(F)(F)C(F)(F)F RVZRBWKZFJCCIB-UHFFFAOYSA-N 0.000 description 1
- 239000012071 phase Substances 0.000 description 1
- NBIIXXVUZAFLBC-UHFFFAOYSA-K phosphate Chemical group [O-]P([O-])([O-])=O NBIIXXVUZAFLBC-UHFFFAOYSA-K 0.000 description 1
- 239000010452 phosphate Substances 0.000 description 1
- 125000002467 phosphate group Chemical group [H]OP(=O)(O[H])O[*] 0.000 description 1
- 150000003013 phosphoric acid derivatives Chemical class 0.000 description 1
- 239000003757 phosphotransferase inhibitor Substances 0.000 description 1
- 239000013612 plasmid Substances 0.000 description 1
- 229910052697 platinum Inorganic materials 0.000 description 1
- 229920001748 polybutylene Polymers 0.000 description 1
- 229920000573 polyethylene Polymers 0.000 description 1
- 229920005862 polyol Polymers 0.000 description 1
- 150000003077 polyols Chemical class 0.000 description 1
- 229920001155 polypropylene Polymers 0.000 description 1
- 229920002635 polyurethane Polymers 0.000 description 1
- 239000004814 polyurethane Substances 0.000 description 1
- 238000011176 pooling Methods 0.000 description 1
- 230000004481 post-translational protein modification Effects 0.000 description 1
- 239000001103 potassium chloride Substances 0.000 description 1
- 235000011164 potassium chloride Nutrition 0.000 description 1
- LWIHDJKSTIGBAC-UHFFFAOYSA-K potassium phosphate Substances [K+].[K+].[K+].[O-]P([O-])([O-])=O LWIHDJKSTIGBAC-UHFFFAOYSA-K 0.000 description 1
- 229910000160 potassium phosphate Inorganic materials 0.000 description 1
- 235000011009 potassium phosphates Nutrition 0.000 description 1
- 239000002987 primer (paints) Substances 0.000 description 1
- 238000012342 propidium iodide staining Methods 0.000 description 1
- MWWATHDPGQKSAR-UHFFFAOYSA-N propyne Chemical compound CC#C MWWATHDPGQKSAR-UHFFFAOYSA-N 0.000 description 1
- 238000002331 protein detection Methods 0.000 description 1
- 238000000164 protein isolation Methods 0.000 description 1
- 238000011002 quantification Methods 0.000 description 1
- 230000005855 radiation Effects 0.000 description 1
- 230000002285 radioactive effect Effects 0.000 description 1
- 238000011084 recovery Methods 0.000 description 1
- 230000014493 regulation of gene expression Effects 0.000 description 1
- 238000009877 rendering Methods 0.000 description 1
- 230000003362 replicative effect Effects 0.000 description 1
- 239000011347 resin Substances 0.000 description 1
- 229920005989 resin Polymers 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 238000010008 shearing Methods 0.000 description 1
- 230000035939 shock Effects 0.000 description 1
- 230000037432 silent mutation Effects 0.000 description 1
- 150000003376 silicon Chemical class 0.000 description 1
- 238000009097 single-agent therapy Methods 0.000 description 1
- 239000011780 sodium chloride Substances 0.000 description 1
- 239000001488 sodium phosphate Substances 0.000 description 1
- 229910000162 sodium phosphate Inorganic materials 0.000 description 1
- 238000000527 sonication Methods 0.000 description 1
- 241000894007 species Species 0.000 description 1
- 239000003381 stabilizer Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 150000003467 sulfuric acid derivatives Chemical class 0.000 description 1
- 239000006228 supernatant Substances 0.000 description 1
- 238000002626 targeted therapy Methods 0.000 description 1
- 239000003439 teratogenic agent Substances 0.000 description 1
- 231100000211 teratogenicity Toxicity 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 230000004797 therapeutic response Effects 0.000 description 1
- 230000002992 thymic effect Effects 0.000 description 1
- 229940113082 thymine Drugs 0.000 description 1
- 210000001685 thyroid gland Anatomy 0.000 description 1
- 230000005945 translocation Effects 0.000 description 1
- 238000009966 trimming Methods 0.000 description 1
- 239000001226 triphosphate Substances 0.000 description 1
- 235000011178 triphosphate Nutrition 0.000 description 1
- UNXRWKVEANCORM-UHFFFAOYSA-N triphosphoric acid Chemical compound OP(O)(=O)OP(O)(=O)OP(O)(O)=O UNXRWKVEANCORM-UHFFFAOYSA-N 0.000 description 1
- 208000022679 triple-negative breast carcinoma Diseases 0.000 description 1
- RYFMWSXOAZQYPI-UHFFFAOYSA-K trisodium phosphate Chemical compound [Na+].[Na+].[Na+].[O-]P([O-])([O-])=O RYFMWSXOAZQYPI-UHFFFAOYSA-K 0.000 description 1
- 230000034512 ubiquitination Effects 0.000 description 1
- 238000010798 ubiquitination Methods 0.000 description 1
- 238000011144 upstream manufacturing Methods 0.000 description 1
- 239000003981 vehicle Substances 0.000 description 1
- 230000035899 viability Effects 0.000 description 1
- 230000003612 virological effect Effects 0.000 description 1
- 238000012800 visualization Methods 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
- DGVVWUTYPXICAM-UHFFFAOYSA-N β‐Mercaptoethanol Chemical compound OCCS DGVVWUTYPXICAM-UHFFFAOYSA-N 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6806—Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/10—Processes for the isolation, preparation or purification of DNA or RNA
- C12N15/1034—Isolating an individual clone by screening libraries
- C12N15/1093—General methods of preparing gene libraries, not provided for in other subgroups
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/10—Processes for the isolation, preparation or purification of DNA or RNA
- C12N15/1096—Processes for the isolation, preparation or purification of DNA or RNA cDNA Synthesis; Subtracted cDNA library construction, e.g. RT, RT-PCR
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6844—Nucleic acid amplification reactions
- C12Q1/686—Polymerase chain reaction [PCR]
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6869—Methods for sequencing
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/156—Polymorphic or mutational markers
Landscapes
- Chemical & Material Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Organic Chemistry (AREA)
- Engineering & Computer Science (AREA)
- Genetics & Genomics (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biotechnology (AREA)
- General Engineering & Computer Science (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Molecular Biology (AREA)
- Biochemistry (AREA)
- Biophysics (AREA)
- Microbiology (AREA)
- General Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- Biomedical Technology (AREA)
- Analytical Chemistry (AREA)
- Immunology (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Plant Pathology (AREA)
- Crystallography & Structural Chemistry (AREA)
- Bioinformatics & Computational Biology (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
- Investigating Or Analysing Biological Materials (AREA)
Abstract
정확하고 확장 가능한 1차 주형 지시 증폭(PTA) 핵산 증폭 및 시퀀싱 방법을 위한 조성물 및 방법, 및 연구, 진단 및 치료에서의 돌연변이 분석을 위한 이들의 적용예가 본원에 제공된다. 단일 세포로부터의 DNA, RNA 및/또는 단백질의 병렬 분석을 위한 멀티오믹스 방법이 본원에 추가로 제공된다.
Description
상호 참조
본 출원은 2019년 7월 31일에 출원된 미국 가특허 출원 번호 62/881,183의 이익을 주장하며, 이는 그 전체가 본원에 참조로 포함된다.
배경
핵산 증폭을 활용하는 연구 방법, 예를 들어, 차세대 시퀀싱은 복합 샘플, 게놈 및 기타 핵산 공급원에 대한 많은 양의 정보를 제공한다. 일부 경우에, 이러한 샘플은 단일 세포로부터 소량으로 얻어진다. 작은 샘플을 포함하는 연구, 진단 및 치료를 위한 매우 정확하고 확장 가능하며 효율적인 핵산 증폭 및 시퀀싱 방법, 특히 RNA, DNA, 및 단백질의 동시 분석 방법이 필요하다.
개요
(a) 세포 집단으로부터 단일 세포를 단리하는 단계; (b) 단일 세포로부터의 mRNA 전사체로부터 증폭된 폴리뉴클레오티드를 포함하는 cDNA 라이브러리를 시퀀싱하는 단계; 및 (c) 단일 세포의 게놈을 시퀀싱하는 단계를 포함하고, 게놈을 시퀀싱하는 단계는: (i) 게놈을 적어도 하나의 증폭 프라이머, 적어도 하나의 핵산 폴리머라제, 및 뉴클레오티드의 혼합물과 접촉시키는 단계로서, 뉴클레오티드의 혼합물은 폴리머라제에 의한 핵산 복제를 종결시키는 적어도 하나의 종결자 뉴클레오티드를 포함하는 단계; (ii) 게놈의 적어도 일부를 증폭하여 복수의 종결된 증폭 산물을 생성하는 단계로서, 복제는 가닥 치환 복제에 의해 진행되는 단계; (iii) 단계 (ii)에서 얻은 분자를 어댑터로 결찰하여 게놈 DNA 라이브러리를 생성하는 단계; 및 (iv) 게놈 DNA 라이브러리를 시퀀싱하는 단계를 포함하는, 멀티오믹(multiomic) 단일 세포 분석 방법이 본원에 제공된다. mRNA 전사체가 폴리아데닐화 mRNA 전사체를 포함하는 방법이 본원에 추가로 제공된다. mRNA 전사체가 폴리아데닐화 mRNA 전사체를 포함하는 않는 방법이 본원에 추가로 제공된다. cDNA 라이브러리를 시퀀싱하는 단계가 주형 전환 프라이머를 사용한 mRNA 전사체의 증폭을 포함하는 방법이 본원에 추가로 제공된다. cDNA 라이브러리의 폴리뉴클레오티드의 적어도 일부가 바코드를 포함하는 본원에 추가로 제공된다. 바코드가 세포 바코드 또는 샘플 바코드를 포함하는 방법이 본원에 추가로 제공된다. cDNA 라이브러리 및 게놈 DNA 라이브러리가 시퀀싱 전에 풀링되는 방법이 본원에 추가로 제공된다. 단일 세포가 1차 세포인 방법이 본원에 추가로 제공된다. 단일 세포가 간, 피부, 콩팥, 혈액, 또는 폐로부터 유래하는 방법이 본원에 추가로 제공된다. 단일 세포가 유세포 분석에 의해 단리되는 방법이 본원에 추가로 제공된다. 종결된 증폭 산물로부터 적어도 하나의 종결자 뉴클레오티드를 제거하는 단계를 추가로 포함하는 방법이 본원에 추가로 제공된다. 복수의 종결된 증폭 산물이 평균 1000-2000개 염기 길이를 포함하는 방법이 본원에 추가로 제공된다. 복수의 종결된 증폭 산물이 250-1500개 염기 길이인 방법이 본원에 추가로 제공된다. 복수의 종결된 증폭 산물이 단일 세포 게놈의 적어도 97%를 포함하는 방법이 본원에 추가로 제공된다. 증폭 산물의 적어도 일부가 세포 바코드 또는 샘플 바코드를 포함하는 방법이 본원에 추가로 제공된다. cDNA 라이브러리를 시퀀싱하는 단계가 단일 세포의 세포기질 용해 및 역전사를 포함하는 방법이 본원에 추가로 제공된다. mRNA 전사체가 주형 전환 역전사를 통해 증폭되는 방법이 본원에 추가로 제공된다. cDNA 라이브러리가 적어도 10,000개의 유전자를 포함하는 방법이 본원에 추가로 제공된다. 단일 세포의 게놈을 시퀀싱하는 단계가 단일 세포의 핵 용해를 추가로 포함하는 방법이 본원에 추가로 제공된다. PCR을 사용하는 추가 증폭 단계를 추가로 포함하는 방법이 본원에 추가로 제공된다. 적어도 하나의 돌연변이가 세포의 게놈에서 확인되고, 돌연변이가 참조 서열의 상응하는 위치와 상이한 방법이 본원에 추가로 제공된다. 적어도 하나의 돌연변이가 세포 집단의 1% 미만에서 발생하는 방법이 본원에 추가로 제공된다. 적어도 하나의 돌연변이가 세포 집단의 0.1% 이하에서 발생하는 방법이 본원에 추가로 제공된다. 적어도 하나의 돌연변이가 세포 집단의 0.001% 이하에서 발생하는 방법이 본원에 추가로 제공된다. 적어도 하나의 돌연변이가 증폭 산물 서열의 1% 이하에서 발생하는 방법이 본원에 추가로 제공된다. 적어도 하나의 돌연변이가 증폭 산물 서열의 0.1% 이하에서 발생하는 방법이 본원에 추가로 제공된다. 적어도 하나의 돌연변이가 증폭 산물 서열의 0.001% 이하에서 발생하는 방법이 본원에 추가로 제공된다.
(a) 세포 집단으로부터 단일 세포를 단리하는 단계; (b) 상기 단일 세포의 표면 상의 적어도 하나의 단백질을 확인하는 단계; 및 (c) 상기 단일 세포의 게놈을 시퀀싱하는 단계를 포함하고, 게놈을 시퀀싱을 시퀀싱하는 단계는: (i)게놈을 적어도 하나의 증폭 프라이머, 적어도 하나의 핵산 폴리머라제, 및 뉴클레오티드의 혼합물과 접촉시키는 단계로서, 뉴클레오티드의 혼합물은 폴리머라제에 의한 핵산 복제를 종결시키는 적어도 하나의 종결자 뉴클레오티드를 포함하는 단계; (ii) 게놈의 적어도 일부를 증폭하여 복수의 종결된 증폭 산물을 생성하는 단계로서, 복제는 가닥 치환 복제에 의해 진행되는 단계; (iii) 단계 (ii)에서 얻은 분자를 어댑터로 결찰하여 게놈 DNA 라이브러리를 생성하는 단계; 및 (iv) 게놈 DNA 라이브러리를 시퀀싱하는 단계를 포함하는, 멀티오믹 단일 세포 분석 방법이 본원에 제공된다. 세포 표면 상의 적어도 하나의 단백질을 확인하는 단계가 세포를 적어도 하나의 단백질에 결합하는 표지된 항체와 접촉시키는 것을 포함하는 방법이 본원에 추가로 제공된다. 표지된 항체가 적어도 하나의 형광 표지 또는 질량 태그를 포함하는 방법이 본원에 추가로 제공된다. 표지된 항체가 적어도 하나의 핵산 바코드를 포함하는 방법이 본원에 추가로 제공된다.
(a) 세포 집단으로부터 단일 세포를 단리하는 단계; (b) 단일 세포의 게놈을 시퀀싱하는 단계를 포함하고, 세포의 게놈을 시퀀싱하는 단계는: (i) 게놈을 메틸화 민감성 제한 효소로 분해하여 게놈 단편을 생성하는 단계; (ii) 게놈 단편의 적어도 일부를 적어도 하나의 증폭 프라이머, 적어도 하나의 핵산 폴리머라제, 및 뉴클레오티드의 혼합물과 접촉시키는 단계로서, 뉴클레오티드의 혼합물은 폴리머라제에 의한 핵산 복제를 종결시키는 적어도 하나의 종결자 뉴클레오티드를 포함하는 단계; (iii) 게놈의 적어도 일부를 증폭하여 복수의 종결된 증폭 산물을 생성하는 단계로서, 복제는 가닥 치환 복제에 의해 진행되는 단계; (iv) 게놈 단편의 적어도 일부를 메틸화-특이적 PCR로 증폭하는 단계; (v) 단계 (iii 및 iv)에서 얻은 분자를 어댑터로 결찰하여 게놈 DNA 라이브러리 및 메틸롬 DNA 라이브러리를 생성하는 단계; 및 (vi) 게놈 DNA 라이브러리 및 메틸롬 라이브러리를 시퀀싱하는 단계를 포함하는, 멀티오믹 단일 세포 분석 방법이 본원에 제공된다.
참고에 의한 포함
본 명세서에서 언급된 모든 간행물, 특허, 및 특허 출원은 각각의 개별 간행물, 특허, 또는 특허 출원이 참조로 포함되는 것으로 구체적이고 개별적으로 나타낸 것과 같이 동일한 정도로 본원에 참조로 포함된다.
본 발명의 새로운 특징은 첨부된 청구범위에서 구체적으로 설명된다. 본 발명의 원리가 활용되는 예시적인 구현예를 설명하는 다음의 상세한 설명 및 첨부 도면을 참조하여 본 발명의 특징 및 이점을 더 잘 이해할 수 있을 것이다.
도 1a는 단일 세포로부터 단백질, DNA 및 RNA의 단리 분석을 위한 일반적인 워크플로우 요약을 도시한다.
도 1b는 교차 오염을 최소화하기 위해 샘플 분할을 사용하여 단일 세포로부터 단백질, DNA 및 RNA의 단리 분석을 위한 워크플로우를 도시한다.
도 1c는 단일 튜브 사전증폭을 사용하여 단일 세포로부터 단백질, DNA 및 RNA의 단리 분석을 위한 워크플로우를 도시한다.
도 1d는 앰플리콘 크기를 감소시키기 위해 종결자를 이용한 단일 튜브 사전증폭을 사용하여 단일 세포로부터 단백질, DNA 및 RNA의 단리 분석을 위한 워크플로우를 도시한다.
도 1e는 공동 증폭을 사용하여 단일 세포로부터 단백질, DNA 및 RNA의 단리 분석을 위한 워크플로우를 도시한다.
도 1f는 본원에 기재된 단백질/DNA/RNA 단일 세포 실험으로부터의 데이터를 조합하는 정보학 워크플로우를 도시한다.
도 1g는 MDA 및 PTA-비가역적 종결자 방법이 돌연변이 전파(propagation)와 관련되어 있기 때문에 이들의 비교를 도시한다. PTA 방법은 원래 DNA 주형의 직접적인 카피 수를 증가시킨다.
도 2a는 증폭 후 수행되는 방법 단계를 도시하며, 이는 어댑터 결찰 전에 종결자를 제거하는 단계, 말단을 복구하는 단계, 및 A-테일링을 수행하는 단계를 포함한다. 이어서, 풀링된 세포의 라이브러리는 시퀀싱 전에 관심 있는 모든 엑손 또는 기타 특정 영역에 대해 혼성화 매개 농축을 거칠 수 있다. 각 리드의 기원 세포는 세포 바코드(녹색 및 청색 서열로 나타냄)로 식별된다.
도 2b (GC)는 MDA 및 PTA 실험에 대한 시퀀싱된 염기의 GC 함량의 비교를 나타낸다.
도 2c는 단일 세포가 PTA 또는 MDA를 거친 후 인간 게놈에 맵핑되는(p_mapped) 맵 품질 점수(e)(mapQ)를 나타낸다.
도 2d는 단일 세포가 PTA 또는 MDA를 거친 후 인간 게놈에 맵핑되는(p_mapped) 리드의 퍼센트를 나타낸다.
도 2e (PCR)는 단일 세포가 MDA 및 PTA를 거친 후 2천만 개의 서브샘플링된 리드에 대한 PCR 중복체인 리드의 퍼센트의 비교를 나타낸다.
도 2f는 PTA와 함께 사용하기 위한 단일 세포의 RT 증폭을 위한 워크플로우를 나타낸다.
도 2g는 RT에 의해 얻어진 cDNA로부터 라이브러리의 생성을 나타낸다.
도 3a는 단일 세포가 가역적 또는 비가역적 종결자를 이용한 PTA를 거친 후 인간 게놈에 맵핑되는(p_mapped2) 맵 품질 점수(c)(mapQ2)를 나타낸다.
도 3b는 단일 세포가 가역적 또는 비가역적 종결자를 이용한 PTA를 거친 후 인간 게놈에 맵핑되는(p_mapped2) 리드의 퍼센트를 나타낸다.
도 3c는 다양한 방법을 사용하여 Alu 요소와 중첩되는 평균 리드 퍼센트에 대해 정렬된 리드를 설명하는 일련의 박스 플롯을 나타낸다. PTA는 게놈에 정렬된 리드 수가 가장 높았다.
도 3d는 다양한 방법을 사용하여 Alu 요소와 중첩되는 평균 리드 퍼센트에 대한 PCR 중복을 설명하는 일련의 박스 플롯을 나타낸다.
도 3e는 다양한 방법을 사용하여 Alu 요소와 중첩되는 평균 리드 퍼센트에 대한 리드의 GC 함량을 설명하는 일련의 박스 플롯을 나타낸다.
도 3f는 다양한 방법을 사용하여 Alu 요소와 중첩되는 평균 리드 퍼센트의 맵핑 품질을 설명하는 일련의 박스 플롯을 나타낸다. PTA는 시험된 방법 중 맵핑 품질이 가장 높았다.
도 3g는 고정된 7.5X 시퀀싱 깊이에서 상이한 WGA 방법과 SC 미토콘드리아 게놈 커버리지 폭의 비교를 나타낸다.
도 4a는 각 세포를 4천만 쌍의 리드로 다운샘플링한 후 무작위 프라이머 PTA 증폭된 세포와 비교하여 고품질 MDA 세포(~ 50% 세포를 나타냄)를 선택한 후 염색체 1에 걸친 10 킬로베이스 윈도우의 평균 커버리지 깊이를 나타낸다. 도면은 두 배보다 더 많거나 (박스 A) 더 적은 (박스 C) 평균 커버리지 깊이를 가진 더 많은 윈도우로 인해 MDA가 균일성이 낮음을 나타낸다. 반복 영역의 높은 GC 함량과 낮은 맵핑 품질로 인해 동원체에서 MDA와 PTA 둘 모두에서 커버리지가 존재하지 않는다(박스 B).
도 4b는 MDA 및 PTA 방법에 대한 시퀀싱 커버리지 대 게놈 위치의 플롯을 나타낸다(상단). 하단 박스 플롯은 벌크 샘플과 비교하여 MDA 및 PTA 방법에 대한 대립유전자 빈도를 나타낸다.
도 5a는 다양한 방법에 대해 증가하는 시퀀싱 깊이에서 커버리지를 평가하기 위해 커버된 게놈의 비율 대 리드 게놈의 수의 플롯을 나타낸다. PTA 방법은 모든 깊이에서 2개의 벌크 샘플에 접근하며, 이는 시험된 다른 방법보다 개선된 것이다.
도 5b는 커버리지 균일성을 평가하기 위한 게놈 커버리지의 변동 계수 대 리드 수의 플롯을 나타낸다. PTA 방법은 시험된 방법 중 균일성이 가장 높은 것으로 밝혀졌다.
도 5c는 총 리드의 누적 분율 대 게놈의 누적 분율의 로렌츠(Lorenz) 플롯을 나타낸다. PTA 방법은 시험된 방법 중 균일성이 가장 높은 것으로 밝혀졌다.
도 5d는 완벽한 균일성으로부터 각 증폭 반응의 차이를 평가하기 위해 시험된 각 방법에 대해 계산된 지니 지수(Gini indice)의 일련의 박스 플롯을 나타낸다. PTA 방법은 시험된 다른 방법보다 재현성이 더 균일한 것으로 밝혀졌다.
도 5e는 호출된 벌크 변이체의 분율 대 리드 수의 플롯을 나타낸다. 각 방법에 대한 변이체 호출 비율을 증가하는 시퀀싱 깊이에서 상응하는 벌크 샘플과 비교하였다. 민감도를 평가하기 위해 각 시퀀싱 깊이에서 각 세포에서 발견된 6억 5천만 개 리드로 서브샘플링된 상응하는 벌크 샘플에서(도 3a) 호출된 변이체의 퍼센트를 계산하였다. PTA의 개선된 커버리지 및 균일성은 다음으로 가장 민감한 방법인 Q-MDA 방법에 비해 30% 더 많은 변이체를 검출하였다.
도 5f는 Alu 요소와 중첩되는 평균 리드 퍼센트의 일련의 박스 플롯을 나타낸다. PTA 방법은 이러한 이형접합 부위에서 대립유전자 왜곡을 유의하게 감소시켰다. PTA 방법은 시험된 다른 방법에 비해 동일한 세포에서 두 대립유전자를 더 고르게 증폭한다.
도 5g는 돌연변이 호출의 특이성을 평가하기 위한 변이체 호출의 특이성 대 리드 수의 플롯을 나타낸다. 벌크 샘플에서 발견되지 않은 다양한 방법을 사용하여 발견된 변이체는 위양성으로 간주하였다. PTA 방법은 시험된 방법 중 가장 낮은 위양성 호출(가장 높은 특이성)을 유도하였다.
도 5h는 다양한 방법에 걸쳐 각 유형의 염기 변화에 대한 위양성 염기 변화의 분율을 보여준다. 이론에 구속하고자 하는 것은 아니지만 그러한 패턴은 폴리머라제 의존적일 수 있다.
도 5i는 위양성 변이체 호출에 대해 Alu 요소와 중첩되는 평균 리드 퍼센트의 일련의 박스 플롯을 나타낸다. PTA 방법은 위양성 변이체 호출에 대해 가장 낮은 대립유전자 빈도를 유도하였다.
도 6(파트 A)은 절단성 링커, 고유한 세포 바코드, 및 무작위 프라이머가 부착된 올리고뉴클레오티드를 가진 비드를 나타낸다. 파트 B는 동일한 액적에 캡슐화된 단일 세포와 비드, 이어서 세포의 용해 및 프라이머의 절단을 나타낸다. 이어서, 액적은 PTA 증폭 믹스를 포함하는 다른 액적과 융합될 수 있다. 파트 C는 증폭 후 액적이 파괴되고, 모든 세포의 앰플리콘이 풀링되는 것을 나타낸다. 본 발명에 따른 프로토콜은 어댑터 결찰 전에 종결자 제거, 말단 복구, 및 A-테일링에 사용된다. 이어서, 풀링된 세포의 라이브러리는 시퀀싱 전에 관심 있는 엑손에 대한 혼성화 매개 농축을 거친다. 이어서, 세포 바코드를 사용하여 각 리드의 기원 세포를 식별한다.
도 7a는 PTA를 사용한 단일 세포의 멀티오믹 (또는 폴리오믹) 분석을 위한 워크플로우를 도시한다. 단계 A: 세포를 형광 표지 및 올리고뉴클레오티드 바코드 태그를 포함하는 항체와 접촉시킨다. 단계 B: 세포를 형광 마커를 기반으로 분류한다. 단계 C: 튜브를 핵에 결합하는 항체로 코팅한다; 세포를 용해시킨다; 세포기질 mRNA는 역전사를 거치는 반면 온전한 핵은 관벽에 결합된다.
도 7b는 도 7a의 단계 C로부터 계속되는, PTA를 사용한 단일 세포의 멀티오믹 분석을 위한 워크플로우를 도시한다. 단계 D: 역전사 후, 시퀀싱 분석을 위해 RT 분획을 제거한다. 단계 E: 핵을 용해시키고, 게놈 DNA에 대해 PTA 방법을 수행한다. 단계 F: PTA는 대략 1000배 증폭된 짧은 단편 cDNA 풀을 생성한다.
도 8a는 멀티오믹 DNA/RNA 단일 세포 분석 워크플로우에서 역전사 및 사전증폭에 사용되는 프라이머를 도시한다.
도 8b는 멀티오믹 DNA/RNA 단일 세포 분석 워크플로우에 대한 역전사 및 사전증폭 워크플로우를 도시한다. 도 8a로부터의 프라이머가 사용되었다.
도 9a는 FLT3 억제제의 존재 하에 강하게 성장하는 AML 세포주를 생성하기 위해 3주의 기간 동안 2 nM 퀴자르티닙으로 처리된 모 세포주에 대한 성장률 그래프를 도시한다. 이어서, 단일 내성 및 모 세포(FACS 농축)는 RNA 시퀀싱 및 낮은 통과 DNA 시퀀싱 분석에 의해 분석되었다.
도 9b는 모 및 내성 배양 둘 모두로부터 RNA 발현이 단일 포트 RNA seq 화학을 사용하여 cDNA 풀(C)을 생성하는 능력을 보이고 이러한 세포에서 발현된 유전자가 세포당 검출된 평균 ~10K 유전자에 대해 유전자 발현으로 세포 집단을 시각화할 수 있는 뚜렷한 패턴을 생성했음을 도시한다. 별도의 워크플로우에서, PTA 방법을 사용하여 단일 세포 게놈을 증폭하였다.
도 9c는 RNAseq 단독 대조군 실험에 대한 정규화된 유전자 발현 프로파일을 도시한다.
도 9d는 PTA에 의한 증폭된 DNA의 양 대 상이한 프로토콜의 그래프를 도시한다. RT 단계(R) 동안 생성된 전사체는 DNA와 비교하여 PTA 반응에 의해 효과적으로 증폭되지 않으며 단일 세포에서 DNA는 단일 세포로부터의 표준 PTA 증폭 게놈(D, RD)과 비교하여 조합된 프로토콜(SC1-SC8)을 사용하여 효과적으로 증폭된다. NTC = 주형 제어 없음; R = RT 단계; D = PTA DNA 단계; RD = 이중 RT/PTA.
도 10a는 낮은 통과 시퀀싱 프로토콜(~ 5백만 리드/세포)을 사용하여 2개의 상이한 프로토콜(이중 RNAseq/PTA, 표준 RNAseq)에 대한 미토콘드리아 염색체 양(%)을 도시한다.
그리고 추정 게놈 크기는 3억개 염기 초과였다.
도 10b는 낮은 통과 시퀀싱 프로토콜(~ 5백만 리드/세포)을 사용하여 2개의 상이한 프로토콜(이중 RNAseq/PTA, 표준 RNAseq)에 대한 중복체 퍼센트를 도시한다.
도 10c는 낮은 통과 시퀀싱 프로토콜(~ 5백만 리드/세포)을 사용하여 2개의 상이한 프로토콜(이중 RNAseq/PTA, 표준 RNAseq)에 대한 추정된 게놈 크기를 도시한다.
도 10d는 이중 RNAseq/PTA 프로토콜을 사용하여 molm13 세포로부터의 3개의 scRNAseq 데이터세트의 특징 할당을 예시한다.
도 10e는 표준 RNAseq 프로토콜을 사용하여 얻어진 Sum159 세포주에 대한 정규화된 발현 프로파일의 그래프를 도시한다. P = 모 세포. R = 내성 세포.
도 10f는 이중 RNAseq/PTA 프로토콜을 사용하여 얻어진 Sum159 세포주에 대한 정규화된 발현 프로파일의 그래프를 도시한다. P = 모 세포. R = 내성 세포.
도 11a는 25x (K)의 대략적인 깊이로 수행된 7개의 모 세포 및 5개의 내성 molm13 세포의 딥 시퀀싱의 결과를 나타낸다. 리드는 bwa mem을 사용하여 Hg38에 정렬되었다. 품질 관리 및 SNV 호출은 GATK4 모범 사례를 사용하여 수행되었다. SNV는 적어도 2개의 내성 세포로 제한되었고 어떠한 모 세포에서도 대안적 대립유전자가 호출되지 않았고 적어도 6개의 모 세포가 유전자형화된 경우에만 고려되었다. 모든 세포는 1x 커버리지에서 적어도 96%의 게놈이 그리고 10x에서 적어도 76%가 커버되었다. 삽입체는 molm13 세포에서 알려진 Flt3 삽입-결실이 모든 세포에서 검출된다는 것을 나타낸다(명확성을 위해 4개를 나타냄).
도 11b는 퀴자르티닙 내성의 알려진 기전인 과발현된 유전자 GAS6을 포함하는 유전자 발현 프로파일의 히트 맵(heat map)을 도시한다. Gas6은 퀴자르티닙 치료에 실패한 재발 환자에서 임상적으로 관련된 내성 기전인 AXL에 대한 리간드이다.
도 12a는 벌크 샘플 대 단일 세포 샘플에서 커버된 엑손의 비율의 그래프를 도시한다.
도 12b는 벌크 샘플 대 단일 세포 샘플에서 커버리지가 없는 엑손의 비율 그래프를 도시한다.
도 12c는 벌크 샘플 대 단일 세포 샘플에서 선택된 염기 퍼센트의 그래프를 도시한다.
도 12d는 벌크 샘플 대 단일 세포 샘플에서 20X로 커버된 염기의 비율 그래프를 도시한다.
도 13a는 처리에 의해 계층화되고 샘플 유형에 의해 음영 처리된 게놈에서 맵핑된 리드 염기의 위치 그래프를 도시한다.
도 13b는 샘플 강도 대 캡처된 삽입체 크기의 그래프를 도시한다.
도 14a는 12-플렉스(plex) 실험에 대한 중복체 퍼센트 대 선택된 염기 퍼센트의 그래프를 도시한다.
도 14b는 표적 염기의 수 대 커버리지 수준의 그래프를 도시한다.
도 1a는 단일 세포로부터 단백질, DNA 및 RNA의 단리 분석을 위한 일반적인 워크플로우 요약을 도시한다.
도 1b는 교차 오염을 최소화하기 위해 샘플 분할을 사용하여 단일 세포로부터 단백질, DNA 및 RNA의 단리 분석을 위한 워크플로우를 도시한다.
도 1c는 단일 튜브 사전증폭을 사용하여 단일 세포로부터 단백질, DNA 및 RNA의 단리 분석을 위한 워크플로우를 도시한다.
도 1d는 앰플리콘 크기를 감소시키기 위해 종결자를 이용한 단일 튜브 사전증폭을 사용하여 단일 세포로부터 단백질, DNA 및 RNA의 단리 분석을 위한 워크플로우를 도시한다.
도 1e는 공동 증폭을 사용하여 단일 세포로부터 단백질, DNA 및 RNA의 단리 분석을 위한 워크플로우를 도시한다.
도 1f는 본원에 기재된 단백질/DNA/RNA 단일 세포 실험으로부터의 데이터를 조합하는 정보학 워크플로우를 도시한다.
도 1g는 MDA 및 PTA-비가역적 종결자 방법이 돌연변이 전파(propagation)와 관련되어 있기 때문에 이들의 비교를 도시한다. PTA 방법은 원래 DNA 주형의 직접적인 카피 수를 증가시킨다.
도 2a는 증폭 후 수행되는 방법 단계를 도시하며, 이는 어댑터 결찰 전에 종결자를 제거하는 단계, 말단을 복구하는 단계, 및 A-테일링을 수행하는 단계를 포함한다. 이어서, 풀링된 세포의 라이브러리는 시퀀싱 전에 관심 있는 모든 엑손 또는 기타 특정 영역에 대해 혼성화 매개 농축을 거칠 수 있다. 각 리드의 기원 세포는 세포 바코드(녹색 및 청색 서열로 나타냄)로 식별된다.
도 2b (GC)는 MDA 및 PTA 실험에 대한 시퀀싱된 염기의 GC 함량의 비교를 나타낸다.
도 2c는 단일 세포가 PTA 또는 MDA를 거친 후 인간 게놈에 맵핑되는(p_mapped) 맵 품질 점수(e)(mapQ)를 나타낸다.
도 2d는 단일 세포가 PTA 또는 MDA를 거친 후 인간 게놈에 맵핑되는(p_mapped) 리드의 퍼센트를 나타낸다.
도 2e (PCR)는 단일 세포가 MDA 및 PTA를 거친 후 2천만 개의 서브샘플링된 리드에 대한 PCR 중복체인 리드의 퍼센트의 비교를 나타낸다.
도 2f는 PTA와 함께 사용하기 위한 단일 세포의 RT 증폭을 위한 워크플로우를 나타낸다.
도 2g는 RT에 의해 얻어진 cDNA로부터 라이브러리의 생성을 나타낸다.
도 3a는 단일 세포가 가역적 또는 비가역적 종결자를 이용한 PTA를 거친 후 인간 게놈에 맵핑되는(p_mapped2) 맵 품질 점수(c)(mapQ2)를 나타낸다.
도 3b는 단일 세포가 가역적 또는 비가역적 종결자를 이용한 PTA를 거친 후 인간 게놈에 맵핑되는(p_mapped2) 리드의 퍼센트를 나타낸다.
도 3c는 다양한 방법을 사용하여 Alu 요소와 중첩되는 평균 리드 퍼센트에 대해 정렬된 리드를 설명하는 일련의 박스 플롯을 나타낸다. PTA는 게놈에 정렬된 리드 수가 가장 높았다.
도 3d는 다양한 방법을 사용하여 Alu 요소와 중첩되는 평균 리드 퍼센트에 대한 PCR 중복을 설명하는 일련의 박스 플롯을 나타낸다.
도 3e는 다양한 방법을 사용하여 Alu 요소와 중첩되는 평균 리드 퍼센트에 대한 리드의 GC 함량을 설명하는 일련의 박스 플롯을 나타낸다.
도 3f는 다양한 방법을 사용하여 Alu 요소와 중첩되는 평균 리드 퍼센트의 맵핑 품질을 설명하는 일련의 박스 플롯을 나타낸다. PTA는 시험된 방법 중 맵핑 품질이 가장 높았다.
도 3g는 고정된 7.5X 시퀀싱 깊이에서 상이한 WGA 방법과 SC 미토콘드리아 게놈 커버리지 폭의 비교를 나타낸다.
도 4a는 각 세포를 4천만 쌍의 리드로 다운샘플링한 후 무작위 프라이머 PTA 증폭된 세포와 비교하여 고품질 MDA 세포(~ 50% 세포를 나타냄)를 선택한 후 염색체 1에 걸친 10 킬로베이스 윈도우의 평균 커버리지 깊이를 나타낸다. 도면은 두 배보다 더 많거나 (박스 A) 더 적은 (박스 C) 평균 커버리지 깊이를 가진 더 많은 윈도우로 인해 MDA가 균일성이 낮음을 나타낸다. 반복 영역의 높은 GC 함량과 낮은 맵핑 품질로 인해 동원체에서 MDA와 PTA 둘 모두에서 커버리지가 존재하지 않는다(박스 B).
도 4b는 MDA 및 PTA 방법에 대한 시퀀싱 커버리지 대 게놈 위치의 플롯을 나타낸다(상단). 하단 박스 플롯은 벌크 샘플과 비교하여 MDA 및 PTA 방법에 대한 대립유전자 빈도를 나타낸다.
도 5a는 다양한 방법에 대해 증가하는 시퀀싱 깊이에서 커버리지를 평가하기 위해 커버된 게놈의 비율 대 리드 게놈의 수의 플롯을 나타낸다. PTA 방법은 모든 깊이에서 2개의 벌크 샘플에 접근하며, 이는 시험된 다른 방법보다 개선된 것이다.
도 5b는 커버리지 균일성을 평가하기 위한 게놈 커버리지의 변동 계수 대 리드 수의 플롯을 나타낸다. PTA 방법은 시험된 방법 중 균일성이 가장 높은 것으로 밝혀졌다.
도 5c는 총 리드의 누적 분율 대 게놈의 누적 분율의 로렌츠(Lorenz) 플롯을 나타낸다. PTA 방법은 시험된 방법 중 균일성이 가장 높은 것으로 밝혀졌다.
도 5d는 완벽한 균일성으로부터 각 증폭 반응의 차이를 평가하기 위해 시험된 각 방법에 대해 계산된 지니 지수(Gini indice)의 일련의 박스 플롯을 나타낸다. PTA 방법은 시험된 다른 방법보다 재현성이 더 균일한 것으로 밝혀졌다.
도 5e는 호출된 벌크 변이체의 분율 대 리드 수의 플롯을 나타낸다. 각 방법에 대한 변이체 호출 비율을 증가하는 시퀀싱 깊이에서 상응하는 벌크 샘플과 비교하였다. 민감도를 평가하기 위해 각 시퀀싱 깊이에서 각 세포에서 발견된 6억 5천만 개 리드로 서브샘플링된 상응하는 벌크 샘플에서(도 3a) 호출된 변이체의 퍼센트를 계산하였다. PTA의 개선된 커버리지 및 균일성은 다음으로 가장 민감한 방법인 Q-MDA 방법에 비해 30% 더 많은 변이체를 검출하였다.
도 5f는 Alu 요소와 중첩되는 평균 리드 퍼센트의 일련의 박스 플롯을 나타낸다. PTA 방법은 이러한 이형접합 부위에서 대립유전자 왜곡을 유의하게 감소시켰다. PTA 방법은 시험된 다른 방법에 비해 동일한 세포에서 두 대립유전자를 더 고르게 증폭한다.
도 5g는 돌연변이 호출의 특이성을 평가하기 위한 변이체 호출의 특이성 대 리드 수의 플롯을 나타낸다. 벌크 샘플에서 발견되지 않은 다양한 방법을 사용하여 발견된 변이체는 위양성으로 간주하였다. PTA 방법은 시험된 방법 중 가장 낮은 위양성 호출(가장 높은 특이성)을 유도하였다.
도 5h는 다양한 방법에 걸쳐 각 유형의 염기 변화에 대한 위양성 염기 변화의 분율을 보여준다. 이론에 구속하고자 하는 것은 아니지만 그러한 패턴은 폴리머라제 의존적일 수 있다.
도 5i는 위양성 변이체 호출에 대해 Alu 요소와 중첩되는 평균 리드 퍼센트의 일련의 박스 플롯을 나타낸다. PTA 방법은 위양성 변이체 호출에 대해 가장 낮은 대립유전자 빈도를 유도하였다.
도 6(파트 A)은 절단성 링커, 고유한 세포 바코드, 및 무작위 프라이머가 부착된 올리고뉴클레오티드를 가진 비드를 나타낸다. 파트 B는 동일한 액적에 캡슐화된 단일 세포와 비드, 이어서 세포의 용해 및 프라이머의 절단을 나타낸다. 이어서, 액적은 PTA 증폭 믹스를 포함하는 다른 액적과 융합될 수 있다. 파트 C는 증폭 후 액적이 파괴되고, 모든 세포의 앰플리콘이 풀링되는 것을 나타낸다. 본 발명에 따른 프로토콜은 어댑터 결찰 전에 종결자 제거, 말단 복구, 및 A-테일링에 사용된다. 이어서, 풀링된 세포의 라이브러리는 시퀀싱 전에 관심 있는 엑손에 대한 혼성화 매개 농축을 거친다. 이어서, 세포 바코드를 사용하여 각 리드의 기원 세포를 식별한다.
도 7a는 PTA를 사용한 단일 세포의 멀티오믹 (또는 폴리오믹) 분석을 위한 워크플로우를 도시한다. 단계 A: 세포를 형광 표지 및 올리고뉴클레오티드 바코드 태그를 포함하는 항체와 접촉시킨다. 단계 B: 세포를 형광 마커를 기반으로 분류한다. 단계 C: 튜브를 핵에 결합하는 항체로 코팅한다; 세포를 용해시킨다; 세포기질 mRNA는 역전사를 거치는 반면 온전한 핵은 관벽에 결합된다.
도 7b는 도 7a의 단계 C로부터 계속되는, PTA를 사용한 단일 세포의 멀티오믹 분석을 위한 워크플로우를 도시한다. 단계 D: 역전사 후, 시퀀싱 분석을 위해 RT 분획을 제거한다. 단계 E: 핵을 용해시키고, 게놈 DNA에 대해 PTA 방법을 수행한다. 단계 F: PTA는 대략 1000배 증폭된 짧은 단편 cDNA 풀을 생성한다.
도 8a는 멀티오믹 DNA/RNA 단일 세포 분석 워크플로우에서 역전사 및 사전증폭에 사용되는 프라이머를 도시한다.
도 8b는 멀티오믹 DNA/RNA 단일 세포 분석 워크플로우에 대한 역전사 및 사전증폭 워크플로우를 도시한다. 도 8a로부터의 프라이머가 사용되었다.
도 9a는 FLT3 억제제의 존재 하에 강하게 성장하는 AML 세포주를 생성하기 위해 3주의 기간 동안 2 nM 퀴자르티닙으로 처리된 모 세포주에 대한 성장률 그래프를 도시한다. 이어서, 단일 내성 및 모 세포(FACS 농축)는 RNA 시퀀싱 및 낮은 통과 DNA 시퀀싱 분석에 의해 분석되었다.
도 9b는 모 및 내성 배양 둘 모두로부터 RNA 발현이 단일 포트 RNA seq 화학을 사용하여 cDNA 풀(C)을 생성하는 능력을 보이고 이러한 세포에서 발현된 유전자가 세포당 검출된 평균 ~10K 유전자에 대해 유전자 발현으로 세포 집단을 시각화할 수 있는 뚜렷한 패턴을 생성했음을 도시한다. 별도의 워크플로우에서, PTA 방법을 사용하여 단일 세포 게놈을 증폭하였다.
도 9c는 RNAseq 단독 대조군 실험에 대한 정규화된 유전자 발현 프로파일을 도시한다.
도 9d는 PTA에 의한 증폭된 DNA의 양 대 상이한 프로토콜의 그래프를 도시한다. RT 단계(R) 동안 생성된 전사체는 DNA와 비교하여 PTA 반응에 의해 효과적으로 증폭되지 않으며 단일 세포에서 DNA는 단일 세포로부터의 표준 PTA 증폭 게놈(D, RD)과 비교하여 조합된 프로토콜(SC1-SC8)을 사용하여 효과적으로 증폭된다. NTC = 주형 제어 없음; R = RT 단계; D = PTA DNA 단계; RD = 이중 RT/PTA.
도 10a는 낮은 통과 시퀀싱 프로토콜(~ 5백만 리드/세포)을 사용하여 2개의 상이한 프로토콜(이중 RNAseq/PTA, 표준 RNAseq)에 대한 미토콘드리아 염색체 양(%)을 도시한다.
그리고 추정 게놈 크기는 3억개 염기 초과였다.
도 10b는 낮은 통과 시퀀싱 프로토콜(~ 5백만 리드/세포)을 사용하여 2개의 상이한 프로토콜(이중 RNAseq/PTA, 표준 RNAseq)에 대한 중복체 퍼센트를 도시한다.
도 10c는 낮은 통과 시퀀싱 프로토콜(~ 5백만 리드/세포)을 사용하여 2개의 상이한 프로토콜(이중 RNAseq/PTA, 표준 RNAseq)에 대한 추정된 게놈 크기를 도시한다.
도 10d는 이중 RNAseq/PTA 프로토콜을 사용하여 molm13 세포로부터의 3개의 scRNAseq 데이터세트의 특징 할당을 예시한다.
도 10e는 표준 RNAseq 프로토콜을 사용하여 얻어진 Sum159 세포주에 대한 정규화된 발현 프로파일의 그래프를 도시한다. P = 모 세포. R = 내성 세포.
도 10f는 이중 RNAseq/PTA 프로토콜을 사용하여 얻어진 Sum159 세포주에 대한 정규화된 발현 프로파일의 그래프를 도시한다. P = 모 세포. R = 내성 세포.
도 11a는 25x (K)의 대략적인 깊이로 수행된 7개의 모 세포 및 5개의 내성 molm13 세포의 딥 시퀀싱의 결과를 나타낸다. 리드는 bwa mem을 사용하여 Hg38에 정렬되었다. 품질 관리 및 SNV 호출은 GATK4 모범 사례를 사용하여 수행되었다. SNV는 적어도 2개의 내성 세포로 제한되었고 어떠한 모 세포에서도 대안적 대립유전자가 호출되지 않았고 적어도 6개의 모 세포가 유전자형화된 경우에만 고려되었다. 모든 세포는 1x 커버리지에서 적어도 96%의 게놈이 그리고 10x에서 적어도 76%가 커버되었다. 삽입체는 molm13 세포에서 알려진 Flt3 삽입-결실이 모든 세포에서 검출된다는 것을 나타낸다(명확성을 위해 4개를 나타냄).
도 11b는 퀴자르티닙 내성의 알려진 기전인 과발현된 유전자 GAS6을 포함하는 유전자 발현 프로파일의 히트 맵(heat map)을 도시한다. Gas6은 퀴자르티닙 치료에 실패한 재발 환자에서 임상적으로 관련된 내성 기전인 AXL에 대한 리간드이다.
도 12a는 벌크 샘플 대 단일 세포 샘플에서 커버된 엑손의 비율의 그래프를 도시한다.
도 12b는 벌크 샘플 대 단일 세포 샘플에서 커버리지가 없는 엑손의 비율 그래프를 도시한다.
도 12c는 벌크 샘플 대 단일 세포 샘플에서 선택된 염기 퍼센트의 그래프를 도시한다.
도 12d는 벌크 샘플 대 단일 세포 샘플에서 20X로 커버된 염기의 비율 그래프를 도시한다.
도 13a는 처리에 의해 계층화되고 샘플 유형에 의해 음영 처리된 게놈에서 맵핑된 리드 염기의 위치 그래프를 도시한다.
도 13b는 샘플 강도 대 캡처된 삽입체 크기의 그래프를 도시한다.
도 14a는 12-플렉스(plex) 실험에 대한 중복체 퍼센트 대 선택된 염기 퍼센트의 그래프를 도시한다.
도 14b는 표적 염기의 수 대 커버리지 수준의 그래프를 도시한다.
서열 표현, 균일성 및 정확성을 재현 가능한 방식으로 증가시킴으로써 현재 방법의 한계를 극복할 핵산 증폭(단일 세포 및 다세포 게놈 증폭 포함) 및 시퀀싱을 위한 새로운 확장 가능하고 정확하며 효율적인 방법을 개발할 필요가 있다. 정확하고 확장 가능한 1차 주형 지시 증폭(PTA) 및 시퀀싱을 제공하기 위한 조성물 및 방법이 본원에서 제공된다. 단일 세포로부터의 단백질, DNA 및 RNA의 분석, 및 PTA와 조합된 상응하는 전사후 또는 해독후 변형을 포함하는 멀티오믹 분석 방법이 본원에 추가로 제공된다. 그러한 방법 및 조성물은 표적 (또는 "주형") 핵산의 매우 정확한 증폭을 용이하게 하여 차세대 시퀀싱과 같은 후속 적용의 정확도 및 민감도를 증가시킨다.
정의
달리 정의되지 않는 한, 본원에서 사용되는 모든 기술적 및 과학적 용어는 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자에 의해 일반적으로 이해되는 것과 동일한 의미를 갖는다.
본 발명의 전반에 걸쳐, 수치 특징은 범위 형식으로 제시된다. 범위 형식의 기재는 단지 편의성과 간결성을 위한 것이며 임의의 구현예의 범위에 대한 융통성 없는 제한으로 해석되어서는 안 된다는 것을 이해해야 한다. 따라서, 범위에 대한 기재는 문맥에서 달리 명시하지 않는 한, 하한 단위의 10분의 1까지 해당 범위 내의 개별 수치뿐만 아니라 가능한 모든 하위 범위를 구체적으로 개시한 것으로 간주해야 한다. 예를 들어, 1 내지 6과 같은 범위에 대한 기재는 1 내지 3, 1 내지 4, 1 내지 5, 2 내지 4, 2 내지 6, 3 내지 6 등과 같은 하위 범위뿐만 아니라 예를 들어, 1.1, 2, 2.3, 5 및 5.9와 같이 해당 범위 내의 개별 값을 구체적으로 개시한 것으로 간주해야 한다. 이것은 범위의 폭에 관계없이 적용된다. 이들 중간 범위의 상한 및 하한은 독립적으로 더 작은 범위에 포함될 수 있으며, 또한 언급된 범위에서 임의의 구체적으로 배제된 한계에 따라 본 발명 내에 포함된다. 언급된 범위가 한계 중 하나 또는 둘 모두를 포함하는 경우, 포함된 한계 중 하나 또는 둘 모두를 제외하는 범위도 문맥상 달리 명시하지 않는 한 본 발명에 포함된다.
본원에서 사용된 용어는 단지 특정 구현예를 설명하기 위한 것이며 임의의 구현예를 제한하려는 의도가 아니다. 본원에 사용된 바와 같이, 단수 형태 "a", "an" 및 "the"는 문맥이 달리 명시하지 않는 한 복수 형태도 포함하도록 의도된다. 본 명세서에서 사용될 때 용어 "포함한다" 및/또는 "포함하는"은 언급된 특징, 정수, 단계, 조작, 요소, 및/또는 구성요소의 존재를 지정하지만 하나 이상의 다른 특징, 정수, 단계, 조작, 요소, 구성요소, 및/또는 이들의 군의 존재 또는 첨가를 배제하지는 않는다는 것을 또한 이해할 것이다. 본원에 사용된 바와 같이, 용어 "및/또는"은 하나 이상의 연관된 나열 항목의 임의의 및 모든 조합을 포함한다.
구체적으로 언급되거나 문맥상 명백하지 않는 한, 본원에 사용된 바와 같이, 숫자 또는 숫자 범위와 관련하여 용어 "약"은 언급된 숫자 및 숫자 +/- 이의 10%, 또는 범위에 열거된 값에 대해 나열된 하한보다 10% 낮고 나열된 상한보다 10% 높음을 의미하는 것으로 이해된다.
본원에 사용된 바와 같이, 용어 "대상체" 또는 "환자" 또는 "개체"는, 예를 들어, 인간, 수의학 동물(예를 들어, 고양이, 개, 소, 말, 양, 돼지 등) 및 질환의 실험 동물 모델(예를 들어, 마우스, 래트)과 같은 포유동물을 포함하는 동물을 지칭한다. 본 발명에 따르면, 당업계의 기술 내에서 통상적인 분자 생물학, 미생물학, 및 재조합 DNA 기술이 사용될 수 있다. 그러한 기술은 문헌에 자세히 설명되어 있다. 예를 들어, 다른 것들 중에서도 문헌(Sambrook, Fritsch & Maniatis, Molecular Cloning: A Laboratory Manual, Second Edition (1989) Cold Spring Harbor Laboratory Press, Cold Spring Harbor, New York (본원에서 "Sambrook et al., 1989"); DNA Cloning: A practical Approach, Volumes I and II (D.N. Glover ed. 1985); Oligonucleotide Synthesis (MJ. Gait ed. 1984); Nucleic Acid Hybridization (B.D. Hames & S.J. Higgins eds. (1985)); Transcription and Translation (B.D. Hames & S.J. Higgins, eds. (1984)); Animal Cell Culture (R.I. Freshney, ed. (1986); Immobilized Cells and Enzymes (lRL Press, (1986)); B. Perbal, A practical Guide To Molecular Cloning (1984); F.M. Ausubel et al. (eds.), Current Protocols in Molecular Biology, John Wiley & Sons, Inc. (1994))을 참조한다.
용어 "핵산"은 단일 가닥 분자뿐만 아니라 다중 가닥 분자도 포함한다. 이중 가닥 또는 삼중 가닥 핵산에서, 핵산 가닥은 공존할 필요가 없다(즉, 이중 가닥 핵산이 두 가닥의 전체 길이를 따라 이중 가닥일 필요는 없음). 본원에 기재된 핵산 주형은 50-300개의 염기, 100-2000개의 염기, 100-750개의 염기, 170-500개의 염기, 100-5000개의 염기, 50-10,000개의 염기, 또는 50-2000개의 염기 길이를 포함하지만, 이에 제한되지 않는 샘플에 따른 임의의 크기(작은 무세포 DNA 단편으로부터 전체 게놈까지)일 수 있다. 일부 경우에, 주형은 적어도 50, 100, 200, 500, 1000, 2000, 5000, 10,000, 20,000 50,000, 100,000, 200,000, 500,000, 1,000,000개 또는 1,000,000개 초과의 염기 길이이다. 본원에 기재된 방법은 핵산 주형과 같은 핵산의 증폭을 제공한다. 본원에 기재된 방법은 단리된 핵산 및 적어도 부분적으로 정제된 핵산 및 핵산 라이브러리의 생성을 추가로 제공한다. 일부 예에서, 본원 기재된 방법은 추출된 핵산(예를 들어, 조직, 세포 또는 배지로부터 추출됨)을 제공한다. 핵산은 DNA, RNA, 원형 RNA, mtDNA(미토콘드리아 DNA), cfDNA(무세포 DNA), cfRNA(무세포 RNA), siRNA(작은 간섭 RNA), cffDNA(무세포 태아 DNA), mRNA, tRNA, rRNA, miRNA(마이크로RNA), 합성 폴리뉴클레오티드, 폴리뉴클레오티드 유사체, 명세서와 일치하는 임의의 다른 핵산, 또는 이들의 조합을 포함하는 것들을 포함하지만 이에 제한되지 않는다. 폴리뉴클레오티드의 길이는, 제공되는 경우, 염기의 수로 기재되며 nt(뉴클레오티드), bp(염기), kb(킬로 염기), 또는 Gb(기가 염기)와 같이 약어로 표시된다.
본원에 사용된 바와 같이, 용어 "액적"은 액적 작동기(droplet actuator) 상의 액체 부피를 지칭한다. 일부 경우에, 액적은, 예를 들어, 수성 또는 비수성이거나, 수성 및 비수성 성분을 포함하는 혼합물 또는 에멀젼일 수 있다. 액적 작업에 적용될 수 있는 액적 유체의 비제한적인 예에 대해서는, 예를 들어, 국체 특허 출원 공개 번호 WO2007/120241을 참조한다. 액적을 형성하고 조작하기 위한 임의의 적합한 시스템이 본원에 제시된 구현예에서 사용될 수 있다. 예를 들어, 일부 경우에, 액적 작동기가 사용된다. 사용될 수 있는 액적 작동기의 비제한적인 예에 대해서는, 예를 들어, 미국 특허 번호 6,911,132, 6,977,033, 6,773,566, 6,565,727, 7,163,612, 7,052,244, 7,328,979, 7,547,380, 7,641,779, 미국 특허 출원 공개 번호 US20060194331, US20030205632, US20060164490, US20070023292, US20060039823, US20080124252, US20090283407, US20090192044, US20050179746호, US20090321262, US20100096266, US20110048951, 국제 특허 출원 공개 번호 WO2007/120241을 참조한다. 일부 경우에, 비드는 액적, 액적 작업 갭, 또는 액적 작업 표면에 제공된다. 일부 경우에, 비드는 액적 작업 갭의 외부에 있거나 액적 작업 표면과 떨어져 있는 저장소에 제공되며, 저장소는 비드를 포함하는 액적이 액적 작업 갭에 들어가거나 액적 작업 표면과 접촉하도록 허용하는 흐름 경로와 연관될 수 있다. 자기 반응 비드 및/또는 비-자기 반응 비드를 고정하고/하거나 비드를 사용하여 액적 작업 프로토콜을 수행하기 위한 액적 작동기 기술의 비제한적인 예는 미국 특허 출원 공개 번호 US20080053205, 국제 특허 출원 공개 번호 WO2008/098236, WO2008/134153, WO2008/116221, WO2007/120241에 기재되어 있다. 본원에 기재된 방법의 다중화 구현예에서 비드 특성이 이용될 수 있다. 다중화에 적합한 특성을 갖는 비드의 예와 이러한 비드에서 방출되는 신호를 검출하고 분석하는 방법은 미국 특허 출원 공개 번호 US20080305481, US20080151240, US20070207513, US20070064990, US20060159962, US20050277197, US20050118574에서 찾을 수 있다.
프라이머 및/또는 주형 전환 올리고뉴클레오티드는 또한 mRNA 폴리뉴클레오티드의 역전사 및 주형 전환을 용이하게 하기 위해 고체 기질에 부착될 수 있다. 이 배열에서, RT 또는 주형 전환 반응의 일부는 장치의 벌크 용액에서 발생하며, 여기서, 반응의 제2 단계는 표면 근처에서 발생한다. 다른 배열에서, 주형 전환 올리고뉴클레오티드의 프라이머는 전체 반응이 용액의 표면 위에서 발생할 수 있도록 고체 기질로부터 방출되도록 한다. 폴리오믹 접근법에서, 일부 경우에, 다단계 반응을 위한 프라이머는 고체 기질에 부착되거나 비드와 조합되어 다단계 프라이머의 조합을 달성한다.
특정 미세유체 장치는 또한 폴리오믹 접근법을 지원한다. 예를 들어 PDMS로 제작된 장치는 종종 각 반응 단계에 대해 연속적인 챔버를 갖고 있다. 이러한 다중 챔버 장치는 종종 공기 또는 유체, 예컨대 물 또는 불활성 탄화수소(즉, 플루오리너트(fluorinert))로 압력을 통해 제어할 수 있는 마이크로밸브 구조를 사용하여 분리된다. 멀티오믹 접근법에서는 반응의 각 단계는 분리될 수 있고 개별적으로 수행될 수 있도록 하였다. 특정 단계의 완료에서 인접한 챔버 사이의 밸브는 후속 반응을 위해 기판에서 해제될 수 있으며 직렬 방식으로 추가될 수 있다. 그 결과 개별 세포를 입력 주형 재료로서 사용하는 멀티오믹(단백질/RNA/DNA/후성유전체) 반응 세트와 같은 일련의 반응을 모방할 수 있다. 다양한 미세유체 플랫폼은 단일 세포의 분석에 사용될 수 있다. 일부 경우에, 세포는 유체역학(액적 미세유체, 관성 미세유체, 볼텍싱, 미세 밸브, 미세 구조(예를 들어, 미세웰, 미세트랩)), 전기적 방법(유전영동(DEP), 전기삼투), 광학 방법(광학 집게, 광학적으로 유도된 유전영동(ODEP), 광열모세관), 음향적 방법 또는 자기적 방법을 통해 조작된다. 일부 경우에, 미세유체 플랫폼은 미세웰을 포함한다. 일부 경우에, 미세유체 플랫폼은 PDMS(폴리디메틸실록산) 기반 장치를 포함한다. 본원에 기술된 방법과 호환될 수 있는 단일 세포 분석 플랫폼의 비제한적 예는 다음과 같다: ddSEQ 단일 세포 단리기(Bio-Rad, Hercules, CA, USA, 및 Illumina, San Diego, CA, USA)); 크롬(10x Genomics, Pleasanton, CA, USA)); 랩소디 단일 세포 분석 시스템(BD, Franklin Lakes, NJ, USA); 타페스트리(Tapestri) 플랫폼(MissionBio, San Francisco, CA, USA)), 나디아 이노베이트(Nadia Innovate) (Dolomite Bio, Royston, UK); C1 및 폴라리스(Polaris) (Fluidigm, South San Francisco, CA, USA); ICELL8 단일 세포 시스템(Takara); MSND(Wafergen); Puncher 플랫폼(Vycap); CellRaft AIR 시스템(CellMicrosystems); DEPArray NxT 및 DEPArray 시스템(Menarini Silicon Biosystems); AVISO 셀 선택기(ALS); 및 InDrop 시스템(1CellBio), 및 TrapTx(Celldom).
본원에 사용된 바와 같이, 용어 "고유한 분자 식별자(UMI)"는 복수의 핵산 분자 각각에 부착되는 고유한 핵산 서열을 지칭한다. 핵산 분자에 혼입될 때, UMI는 일부 경우에 증폭 후 시퀀싱되는 UMI를 직접 계수하여 후속 증폭 편향을 보정하는 데 사용된다. UMI의 설계, 혼입 및 적용은, 예를 들어, 국제 특허 출원 공개 번호 WO 2012/142213, 문헌(Islam et al. Nat. Methods (2014) 11:163-166, Kivioja, T. et al. Nat. Methods (2012) 9: 72-74, Brenner et al. (2000) PNAS 97(4), 1665, and Hollas and Schuler, (2003) Conference: 3rd International Workshop on Algorithms in Bioinformatics, Volume: 2812)에 기재되어 있다.
본원에 사용된 바와 같이, 용어 "바코드"는 핵산 물질의 샘플 또는 공급원을 확인하는 데 사용할 수 있는 핵산 태그를 지칭한다. 따라서, 핵산 샘플이 여러 공급원에서 유래된 경우, 각 핵산 샘플 내 핵산은 일부 경우에 샘플의 공급원이 확인될 수 있도록 상이한 핵산 태그로 태그된다. 일반적으로 인덱스, 태그 등으로도 지칭되는 바코드는 당업자에게 잘 알려져 있다. 임의의 적합한 바코드 또는 바코드 세트가 사용될 수 있다. 예를 들어, 미국 특허 번호 8,053,192 및 국제 특허 출원 공개 번호 WO2005/068656에 제공된 비제한적인 예를 참조한다. 단일 세포의 바코드는, 예를 들어, 미국 특허 출원 공개 번호 2013/0274117에 기재된 바와 같이 수행될 수 있다.
본원에서 용어 "고체 표면", "고체 지지체" 및 기타 문법적 등가물은 본원에 기재된 프라이머, 바코드 및 서열의 부착에 적합하거나 적합하도록 변형될 수 있는 임의의 재료를 지칭한다. 예시적인 기재는 유리 및 개질된 또는 기능성화된 유리, 플라스틱(아크릴, 폴리스티렌, 및 스티렌과 기타 재료의 공중합체, 폴리프로필렌, 폴리에틸렌, 폴리부틸렌, 폴리우레탄, Teflon™ 등 포함), 폴리사카라이드, 나일론, 니트로셀룰로오스, 세라믹, 수지, 실리카, 실리카계 재료(예를 들어, 규소 또는 개질된 규소), 탄소, 금속, 무기 유리, 플라스틱, 광섬유 번들, 및 기타 다양한 중합체를 포함하지만 이에 제한되지 않는다. 일부 구현예에서, 고체 지지체는 프라이머, 바코드 및 서열을 정렬된 패턴으로 고정하는데 적합한 패턴화된 표면을 포함한다.
본원에 사용된 바와 같이, 용어 "생물학적 샘플"은 조직, 세포, 생물학적 유체 및 이들의 단리물을 포함하지만 이에 제한되지 않는다. 본원에 기재된 방법에 사용된 세포 또는 기타 샘플은 일부 경우에 인간 환자, 동물, 식물, 토양 또는 박테리아, 진균, 원생동물 등과 같은 미생물을 포함하는 기타 샘플로부터 단리된다. 일부 경우에, 생물학적 샘플은 인간 기원이다. 일부 경우에, 생물학적 물질은 비인간 기원이다. 일부 경우에, 세포는 본원에 기재된 PTA 방법 및 시퀀싱을 거친다. 게놈 전체에 걸쳐 또는 특정 위치에서 검출된 변이체는 연구 또는 진단 목적으로 세포 계통의 이력을 추적하기 위해 해당 대상체로부터 단리된 다른 모든 세포와 비교될 수 있다. 일부 경우에, 직접적인 PCR 시퀀싱과 같은 추가 분석 방법을 통해 변이체를 확인한다.
단일 세포 분석
단일 세포의 분석을 위한 방법 및 조성물이 본원에 기재되어 있다. 대량의 세포 분석은 세포 집단에 대한 일반적인 정보를 제공하지만 종종 배경에서 저빈도 돌연변이를 검출할 수 없다. 그러한 돌연변이는 약물 내성 또는 암과 관련된 돌연변이와 같은 중요한 성질을 포함할 수 있다. 일부 경우에, 동일한 단일 세포로부터의 DNA, RNA 및/또는 단백질이 병렬로 분석된다. 분석은 후성유전학적 해독 후(예를 들어, 글리코실화, 인산화, 아세틸화, 유비퀴틴화, 히스톤 변형) 및/또는 전사 후(예를 들어, 메틸화, 하이드록시메틸화) 변형의 확인을 포함할 수 있다. 그러한 방법은 시퀀싱을 위한 핵산 라이브러리를 얻기 위한 "1차 주형 지시 증폭"(PTA)을 포함할 수 있다. 일부 경우에, PTA는 RT-PCR 또는 프로테옴/단백질 정량 기술(예를 들어, 질량 분석법, 항체 염색 등)과 같은 추가 단계 또는 방법과 결합된다. 일부 경우에, 세포의 다양한 성분이 개별 분석 단계 동안 물리적 또는 공간적으로 서로 분리된다. 예를 들어, 일부 경우에, 워크플로우는 도 1a에서 일반 단계를 포함한다. 단백질은 먼저 항체로 표지된다. 일부 경우에, 항체의 적어도 일부는 태그 또는 마커(예를 들어, 핵산/올리고 태그, 질량 태그, 또는 형광 태그)를 포함한다. 일부 경우에, 항체의 일부는 올리고 태그를 포함한다. 일부 경우에, 항체의 일부는 형광 마커를 포함한다. 일부 경우에, 항체는 2개 이상의 태그 또는 마커로 표지된다. 일부 경우에, 항체의 일부는 형광 마커를 기반으로 분류된다. RT-PCR 후, 제1 가닥 mRNA 산물이 생성된 다음, 분석을 위해 제거된다. 이어서, 라이브러리는 RT-PCR 생성물과 단백질 특이적 항체에 존재하는 바코드로부터 생성되며, 이후에 시퀀싱된다. 동시에 동일한 세포로부터의 게놈 DNA에 라이브러리가 생성되고 시퀀싱되는 PTA를 적용한다. 게놈, 프로테옴 및 전사체의 시퀀싱 결과는 일부 경우에 생물정보학 방법을 사용하여 풀링된다. 일부 경우에, 본원에 기재된 방법은 표지, 세포 분류, 친화성 분리/정제, 특정 세포 성분(예를 들어, 외막, 핵 등)의 용해, RNA 증폭, DNA 증폭(예를 들어, PTA), 또는 단백질, RNA 또는 DNA 단리 또는 분석과 관련된 기타 단계의 임의의 조합을 포함한다. 일부 경우에, 본원에 기재된 방법은 엑솜 농축과 같은 하나 이상의 농축 단계를 포함한다.
단일 세포로부터의 RNA 및 DNA의 분석을 포함하는 단일 세포 분석의 제1 방법이 본원에 기재되어 있다(도 1b). 일부 경우에, 방법은 단일 세포의 단리, 단일 세포의 용해 및 역전사(RT)를 포함한다. 일부 경우에, 역전사는 주형 전환 올리고뉴클레오티드(TSO)로 수행된다. 일부 경우에, TSO는 cDNA RT 산물의 후속 풀다운 및 cDNA 라이브러리를 생성하기 위한 RT 산물의 PCR 증폭을 허용하는 비오틴과 같은 분자 TAG를 포함한다. 대안적으로 또는 조합하여, 원심분리는 세포 펠릿의 cDNA로부터 상층액에서 RNA를 분리하는 데 사용된다. 일부 경우에, 남아 있는 cDNA를 UDG(우라실 DNA 글리코실라제)로 단편화하여 제거하고, 알칼리 용해를 사용하여 RNA를 분해하고 게놈을 변성시킨다. 일부 경우에, 중화, 프라이머 추가 및 PTA 후, 증폭 산물은 SPRI(고상 가역적 고정화) 비드에서 정제되고 어댑터로 결찰되어 gDNA 라이브러리를 생성한다.
단일 세포로부터의 RNA 및 DNA의 분석을 포함하는 단일 세포 분석의 제2 방법이 본원에 기재되어 있다(도 1c). 일부 경우에, 방법은 단일 세포의 단리, 단일 세포의 용해 및 역전사(RT)를 포함한다. 일부 경우에, 역전사는 주형 전환 올리고뉴클레오티드(TSO)로 수행된다. 일부 경우에, TSO는 cDNA RT 산물의 후속 풀다운 및 cDNA 라이브러리를 생성하기 위한 RT 산물의 PCR 증폭을 허용하는 비오틴과 같은 분자 TAG를 포함한다. 일부 경우에, 이어서 알칼리 용해를 사용하여 RNA를 분해하고 게놈을 변성시킨다. 일부 경우에, 중화, 무작위 프라이머 추가 및 PTA 후, 증폭 산물은 SPRI(고상 가역적 고정화) 비드에서 정제되고 어댑터로 결찰되어 gDNA 라이브러리를 생성한다. 일부 경우에, RT 산물은 스트렙타비딘 비드를 사용하는 풀다운과 같은 풀다운에 의해 단리된다.
단일 세포로부터의 RNA 및 DNA의 분석을 포함하는 단일 세포 분석의 제3 방법이 본원에 기재되어 있다(도 1d). 일부 경우에, 방법은 단일 세포의 단리, 단일 세포의 용해 및 역전사(RT)를 포함한다. 일부 경우에, 역전사는 종결자 뉴클레오티드의 존재하에 주형 전환 올리고뉴클레오티드(TSO)로 수행된다. 일부 경우에, 역전사는 종결자 뉴클레오티드의 존재하에 주형 전환 올리고뉴클레오티드(TSO)로 수행된다. 일부 경우에, TSO는 cDNA RT 산물의 후속 풀다운 및 cDNA 라이브러리를 생성하기 위한 RT 산물의 PCR 증폭을 허용하는 비오틴과 같은 분자 TAG를 포함한다. 일부 경우에, 이어서 알칼리 용해를 사용하여 RNA를 분해하고 게놈을 변성시킨다. 일부 경우에, 중화, 무작위 프라이머 추가 및 PTA 후, 증폭 산물은 SPRI(고상 가역적 고정화) 비드에서 정제되고 어댑터로 결찰되어 DNA 라이브러리를 생성한다. 일부 경우에, RT 산물은 스트렙타비딘 비드를 사용하는 풀다운과 같은 풀다운에 의해 단리된다.
단일 세포로부터의 RNA 및 DNA의 분석을 포함하는 단일 세포 분석의 제4 방법이 본원에 기재되어 있다(도 1e). 일부 경우에, 방법은 단일 세포의 단리, 단일 세포의 용해 및 역전사(RT)를 포함한다. 일부 경우에, 역전사는 주형 전환 올리고뉴클레오티드(TSO)로 수행된다. 일부 경우에, TSO는 cDNA RT 산물의 후속 풀다운 및 cDNA 라이브러리를 생성하기 위한 RT 산물의 PCR 증폭을 허용하는 비오틴과 같은 분자 TAG를 포함한다. 일부 경우에, 이어서 알칼리 용해를 사용하여 RNA를 분해하고 게놈을 변성시킨다. 일부 경우에, 중화, 무작위 프라이머 추가 및 PTA 후, 증폭 산물은 차단 및 표지된 프라이머를 사용하여 RNase 및 cDNA 증폭을 거친다. gDNA는 SPRI(고상 가역적 고정화) 비드에서 정제되고 어댑터로 결찰되어 gDNA 라이브러리를 생성한다. 일부 경우에, RT 산물은 스트렙타비딘 비드를 사용하는 풀다운과 같은 풀다운에 의해 단리된다.
단일 세포로부터의 RNA 및 DNA의 분석을 포함하는 단일 세포 분석의 제5 방법이 본원에 기재되어 있다(도 7a 및 7b). 세포 집단을 항체가 표지된 항체 라이브러리와 접촉시킨다. 일부 경우에, 항체는 형광 표지, 핵산 바코드, 둘 모두로 표지된다. 표지된 항체는 집단에서 적어도 하나의 세포에 결합하고, 그러한 세포는 분류되어 용기(예를 들어, 튜브, 바이알, 마이크로웰 등)당 하나의 세포를 배치한다. 일부 경우에, 용기는 용매를 포함한다. 일부 경우에, 용기 표면의 영역은 캡처 모이어티로 코팅된다. 일부 경우에, 캡처 모이어티는 소분자, 항체, 단백질, 또는 하나 이상의 세포, 소기관 또는 기타 세포 성분에 결합할 수 있는 기타 제제이다. 일부 경우에, 적어도 하나의 세포, 또는 단일 세포, 또는 이의 성분은 용기 표면의 영역에 결합한다. 일부 경우에, 핵이 용기의 영역에 결합한다. 일부 경우에, 세포의 외막이 용해되어 mRNA가 용기의 용액으로 방출된다. 일부 경우에, 게놈 DNA를 함유하는 세포의 핵은 용기 표면의 영역에 결합한다. 다음으로, RT는 종종 용액에서 mRNA를 주형으로 사용하여 수행하여 cDNA를 생성한다. 일부 경우에, 주형 전환 프라이머는 5'에서 3'으로 TSS 영역(전사 시작 부위), 앵커 영역, RNA BC 영역 및 폴리 dT 테일을 포함한다. 일부 경우에, 폴리 dT 테일은 하나 이상의 mRNA의 폴리 A 테일에 결합한다. 일부 경우에, 주형 전환 프라이머는 3'에서 5'로 TSS 영역, 앵커 영역 및 폴리 G 영역을 포함한다. 일부 경우에, 폴리 G 영역은 riboG를 포함한다. 일부 경우에, 폴리 G 영역은 mRNA 전사체 상의 폴리 C 영역에 결합한다. 일부 경우에, riboG는 말단 트랜스퍼라제에 의해 mRNA 전사체에 추가되었다. 후속 시퀀싱을 위해 RT PCR 산물을 제거한 후, 세포에 남아 있는 RNA는 UNG에 의해 제거된다. 이어서, 핵이 용해되고 방출된 게놈 DNA는 등온 폴리머라제로 무작위 프라이머를 사용하여 PTA 방법에 적용된다. 일부 경우에, 프라이머는 6-9개 염기 길이이다. 일부 경우에, PTA는 100-5000, 200-5000, 500-2000, 500-2500, 1000-3000, 또는 300-3000개 염기 길이의 게놈 앰플리콘을 생성한다. 일부 경우에, PTA는 평균 길이가 100-5000, 200-5000, 500-2000, 500-2500, 1000-3000, 또는 300-3000개 염기인 게놈 앰플리콘을 생성한다. 일부 경우에, PTA는 250-1500개 염기 길이의 게놈 앰플리콘을 생성한다. 일부 경우에, 본원에 기재된 방법은 약 500, 약 750, 약 1000, 약 5000, 또는 약 10,000배 증폭으로 짧은 단편 cDNA 풀을 생성한다. 일부 경우에, 본원에 기재된 방법은 500-5000, 750-1500, 또는 250-10,000배 증폭으로 짧은 단편 cDNA 풀을 생성한다. PTA 산물은 임의로 추가 증폭 및 시퀀싱 처리된다.
단일 세포의 샘플 제조 및 단리
본원에 기재된 방법은 분석을 위해 단일 세포의 단리를 필요로 할 수 있다. 흡입 피펫팅(mouth pipetting), 마이크로 피펫팅, 유세포 분석/FACS, 미세 유체, 핵 분류 방법(4배체 또는 기타) 또는 수동 희석과 같은 임의의 단일 세포 단리 방법을 PTA와 함께 사용할 수 있다. 그러한 방법은 추가 시약 및 단계, 예를 들어, 항체 기반 농축(예를 들어, 순환 종양 세포), 기타 소분자 또는 단백질 기반 농축 방법, 또는 형광 표지에 의해 도움을 받는다. 일부 경우에, 본원에 기재된 멀티오믹 분석 방법은 더 큰 조직으로부터 세포의 기계적 또는 효소적 해리를 포함한다.
세포 성분의 제조 및 분석
본원에 기재된 PTA를 포함하는 멀티오믹 분석 방법은 DNA, RNA 및/또는 단백질과 같은 세포 성분을 처리하는 하나 이상의 방법을 포함할 수 있다. 일부 경우에, 핵(게놈 DNA 포함)은 세포기질(mRNA 포함)로부터 물리적으로 분리되고, 이어서 막-선택적 용해 완충액을 사용하여 막을 용해하지만 핵은 온전하게 유지한다. 이어서, 세포기질은 마이크로 피펫팅, 원심분리 또는 항체 접합 자기 마이크로비드를 포함한 방법을 사용하여 핵으로부터 분리된다. 또 다른 경우에, 올리고-dT 프라이머 코팅된 자기 비드는 DNA로부터 분리하기 위해 폴리아데닐화된 mRNA에 결합한다. 또 다른 경우에, DNA 및 RNA는 동시에 사전증폭된 다음, 분석을 위해 분리된다. 또 다른 경우에, 단일 세포는 절반의 mRNA가 처리되고 다른 절반의 게놈 DNA가 처리된 2개의 동일한 조각으로 분할된다.
멀티오믹스
본원에 기재된 방법(예를 들어, PTA)은 단일 세포 시퀀싱(멀티오믹스 등)에 사용되는 당업계에 알려진 임의의 수의 다른 방법에 대한 대체물로서 사용될 수 있다. PTA는 MDA, PicoPlex, DOP-PCR, MALBAC, 또는 표적 특이적 증폭과 같은 게놈 DNA 시퀀싱 방법을 대체할 수 있다. 일부 경우에, PTA는 DR-시퀀싱(Dey et al., 2015), G&T 시퀀싱(MacAulay et al., 2015), scMT-시퀀싱(Hu et al., 2016), sc-GEM(Cheow et al., 2016), scTrio-시퀀싱(Hou et al., 2016), RNA와 단백질의 동시 다중화 측정(Darmanis et al., 2016), scCOOL-시퀀싱(Guo et al., 2017), CITE-시퀀싱(Stoeckius et al., 2017), REAP-시퀀싱(Peterson et al., 2017), scNMT-시퀀싱(Clark et al., 2018), 또는 SIDR-시퀀싱(Han et al., 2018)을 포함하는 멀티오믹스 방법에서 표준 게놈 DNA 시퀀싱 방법을 대체한다. 일부 경우에, 본원에 기재된 방법은 PTA 및 폴리아데닐화 mRNA 전사체의 방법을 포함한다. 일부 경우에, 본원에 기재된 방법은 PTA 및 비-폴리아데닐화 mRNA 전사체의 방법을 포함한다. 일부 경우에, 본원에 기재된 방법은 PTA 및 전체 (폴리아데닐화 및 비-폴리아데닐화) mRNA 전사체의 방법을 포함한다.
일부 경우에, PTA는 표준 RNA 시퀀싱 방법과 조합하여 게놈 및 전사체 데이터를 얻는다. 일부 경우에, 본원에 기재된 멀티오믹스 방법은 PTA 및 다음 중 하나를 포함한다: Drop-시퀀싱(Macosko, et al. 2015), mRNA-시퀀싱(Tang et al., 2009), InDrop(Klein et al., 2015), MARS-시퀀싱(Jaitin et al., 2014), Smart-시퀀싱2(Hashimshony, et al., 2012; Fish et al., 2016), CEL-시퀀싱(Jaitin et al., 2014), STRT-시퀀싱(Islam, et al., 2011), Quartz-시퀀싱(Sasagawa et al., 2013), CEL-시퀀싱2(Hashimshony, et al. 2016), cyto 시퀀싱(Fan et al., 2015), SuPeR-시퀀싱(Fan et al., 2011), RamDA-시퀀싱(Hayashi, et al. 2018), MATQ-시퀀싱(Sheng et al., 2017), 또는 SMARTer(Verboom et al., 2019).
전사체 분석을 위한 cDNA 라이브러리를 생성하기 위해 다양한 반응 조건 및 혼합물이 사용될 수 있다. 일부 경우에, RT 반응 혼합물을 사용하여 cDNA 라이브러리를 생성한다. 일부 경우에, RT 반응 혼합물은 크라우딩 시약, 적어도 하나의 프라이머, 주형 전환 올리고뉴클레오티드(TSO), 역전사효소, 및 dNTP 믹스를 포함한다. 일부 경우에, RT 반응 믹스는 RNAse 억제제를 포함한다. 일부 경우에, RT 반응 믹스는 하나 이상의 계면활성제를 포함한다. 일부 경우에, RT 반응 믹스는 Tween-20 및/또는 Triton-X를 포함한다. 일부 경우에, RT 반응 믹스는 베타인을 포함한다. 일부 경우에, RT 반응 믹스는 하나 이상의 염을 포함한다. 일부 경우에, RT 반응 믹스는 마그네슘 염(예를 들어, 염화마그네슘) 및/또는 염화테트라메틸암모늄을 포함한다. 일부 경우에, RT 반응 믹스는 젤라틴을 포함한다. 일부 경우에, RT 반응 믹스는 PEG(PEG1000, PEG2000, PEG4000, PEG6000, PEG8000, 또는 기타 길이의 PEG)를 포함한다.
본원에 기재된 멀티오믹 방법은 단일 세포로부터 게놈 정보와 RNA 전사체 정보를 둘 모두 제공할 수 있다(예를 들어, 조합된 또는 이중 프로토콜). 일부 경우에, 단일 세포로부터의 게놈 정보는 PTA 방법으로부터 얻고 RNA 전사체 정보는 역전사로부터 얻어 cDNA 라이브러리를 생성한다. 일부 경우에, cDNA 라이브러리를 얻기 위해 전체 전사체 방법이 사용된다. 일부 경우에, cDNA 라이브러리를 얻기 위해 3' 또는 5' 말단 카운팅이 사용된다. 일부 경우에, UMI를 사용하여 cDNA 라이브러리를 얻지 못한다. 일부 경우에, 멀티오믹 방법은 단일 세포로부터 적어도 500, 1000, 2000, 5000, 8000, 10,000, 12,000, 또는 적어도 15,000개의 유전자에 대한 RNA 전사체 정보를 제공한다. 일부 경우에, 멀티오믹 방법은 단일 세포로부터 약 500, 1000, 2000, 5000, 8000, 10,000, 12,000, 또는 약 15,000개의 유전자에 대한 RNA 전사체 정보를 제공한다. 일부 경우에, 멀티오믹 방법은 단일 세포로부터 100-12,000 1000-10,000, 2000-15,000, 5000-15,000, 10,000-20,000, 8000-15,000, 또는 10,000-15,000개의 유전자에 대한 RNA 전사체 정보를 제공한다. 일부 경우에, 멀티오믹 방법은 단일 세포의 적어도 80%, 90%, 92%, 95%, 97%, 98%, 또는 적어도 99%에 대한 게놈 서열 정보를 제공한다. 일부 경우에, 멀티오믹 방법은 단일 세포의 게놈의 약 80%, 90%, 92%, 95%, 97%, 98%, 또는 약 99%에 대한 게놈 서열 정보를 제공한다.
멀티오믹 방법은 세포 집단으로부터 단일 세포의 분석을 포함할 수 있다. 일부 경우에, 적어도 5, 10, 20, 50, 100, 200, 500, 1000, 2000, 5000, 또는 적어도 8000개의 세포가 분석된다. 일부 경우에, 약 5, 10, 20, 50, 100, 200, 500, 1000, 2000, 5000, 또는 약 8000개의 세포가 분석된다. 일부 경우에, 5-100, 10-100, 50-500, 100-500, 100-1000, 50-5000, 100-5000, 500-1000, 500-10000, 1000-10000, 또는 5000-20,000개의 세포가 분석된다.
멀티오믹 방법은 단일 세포의 유형에 기반하여 PTA 반응으로부터 게놈 DNA의 수율을 생성할 수 있다. 일부 경우에, 단일 세포로부터 생성된 DNA의 양은 약 0.1, 1, 1.5, 2, 3, 5 또는 약 10 마이크로그램이다. 일부 경우에, 단일 세포로부터 생성된 DNA의 양은 약 0.1, 1, 1.5, 2, 3, 5, 또는 약 10 펨토그램이다. 일부 경우에, 단일 세포로부터 생성된 DNA의 양은 적어도 0.1, 1, 1.5, 2, 3, 5, 또는 적어도 10 마이크로그램이다. 일부 경우에, 단일 세포로부터 생성된 DNA의 양은 적어도 0.1, 1, 1.5, 2, 3, 5, 또는 적어도 10 펨토그램이다. 일부 경우에, 단일 세포로부터 생성된 DNA의 양은 약 0.1-10, 1-10, 1.5-10, 2-20, 2-50, 1-3, 또는 0.5-3.5 마이크로그램이다. 일부 경우에, 단일 세포로부터 생성된 DNA의 양은 약 0.1-10, 1-10, 1.5-10, 2-20, 2-4, 1-3, 또는 0.5-4 펨토그램이다.
메틸롬 분석
단일 세포에서 메틸화된 DNA의 부위가 PTA 방법을 사용하여 결정되는, PTA를 포함하는 방법이 본원에 기재되어 있다. 일부 경우에, 이러한 방법은 동일한 세포의 전사체 및/또는 프로테옴의 병렬 분석을 추가로 포함한다. 메틸화된 게놈 염기를 검출하는 방법은 메틸화 민감성 엔도뉴클레아제로 선택적으로 제한한 후 PTA 방법으로 처리하는 방법을 포함한다. 그러한 효소에 의해 절단된 부위는 시퀀싱으로부터 결정되고 메틸화된 염기가 확인된다. 또 다른 경우에, 게놈 DNA 라이브러리의 중아황산염 처리는 비메틸화된 시토신을 우라실로 전환한다. 이어서, 라이브러리는 일부 경우에 메틸화 서열에 선택적으로 어닐링하는 메틸화 특이적 프라이머로 증폭된다. 대안적으로, 비메틸화-특이적 PCR이 수행된 후, 직접적인 파이로시퀀싱, MS-SnuPE, HRM, COBRA, MS-SSCA 또는 염기 특이적 절단/MALDI-TOF를 포함하여 중아황산염 반응된 염기를 구별하는 하나 이상의 방법이 수행된다. 일부 경우에, 게놈 DNA 샘플은 게놈 (또는 이의 농축된 부분)의 병렬 분석 및 메틸롬 분석을 위해 분할된다. 일부 경우에, 게놈 및 메틸롬의 분석은 게놈 단편(예를 들어, 엑솜, 또는 기타 표적)의 농축 또는 전체 전체 게놈 시퀀싱을 포함한다.
생물정보학
본원에 기재된 PTA를 활용하는 단일 세포 분석 방법으로부터 얻은 데이터는 데이터베이스로 컴파일링될 수 있다. 생물정보학 데이터 통합 방법 및 시스템이 본원에 기재되어 있다. 일부 경우에, 프로테옴, 게놈, 전사체, 메틸롬으로부터의 데이터 또는 기타 데이터는 데이터베이스에 조합/통합되어 분석된다. 일부 경우에, 생물정보학 데이터 통합 방법 및 시스템은 단백질 검출(FACS 및/또는 NGS), mRNA 검출 및/또는 게놈 변이 검출 중 하나 이상을 포함한다. 일부 경우에, 이 데이터는 질환 상태 또는 병태와 연관이 있다. 일부 경우에, 복수의 단일 세포로부터의 데이터는 특정 샘플, 영역, 유기체 또는 조직으로부터의 세포와 같은 더 큰 세포 집단의 기술된 성질을 컴파일링한다. 일부 경우에, 단백질 데이터는 세포 상의 단백질에 선택적으로 결합하는 형광 표지된 항체로부터 수집된다. 일부 경우에, 단백질 검출 방법은 형광 마커를 기반으로 세포를 그룹화하고 분류 후 샘플 위치를 보고하는 단계를 포함한다. 일부 경우에, 단백질 검출 방법은 샘플 바코드를 검출하는 단계, 단백질 바코드를 검출하는 단계, 설계된 서열과 비교하는 단계, 및 바코드 및 카피 수에 기반하여 세포를 그룹화하는 단계를 포함한다. 일부 경우에, 단백질 데이터는 세포 상의 단백질에 선택적으로 결합하는 바코드 항체로부터 획득된다. 일부 경우에, 전사체 데이터는 샘플 및 RNA 특정 바코드로부터 획득된다. 일부 경우에, mRNA 검출 방법은 샘플 및 RNA 특정 바코드를 검출하는 단계, 게놈에 정렬하는 단계, RefSeq/Encode에 정렬하는 단계, 엑손/인트로/유전자간 서열을 보고하는 단계, 엑손-엑손 접합을 분석하는 단계, 바코드 및 발현 변이를 기반으로 세포를 그룹화하는 단계 및 변이 및 상위 가변 유전자의 분석을 클러스터링하는 단계를 포함한다. 일부 경우에, 게놈 데이터는 샘플 및 DNA 특이적 바코드로부터 획득된다. 일부 경우에, 게놈 변이 검출 방법은 샘플 및 DNA 특이적 바코드 검출 단계, 게놈에 정렬하는 단계, 게놈 회수 및 SNV 맵핑 속도를 결정하는 단계, 엑손-엑손 접합에 대한 리드를 필터링하는 단계, 변이 호출 파일(VCF)을 생성하는 단계, 및 변이 및 상위 가변 돌연변이의 분석을 클러스터링하는 단계 포함한다.
돌연변이
일부 경우에, 본원에 기재된 방법(예를 들어, 멀티오믹 PTA)은 돌연변이의 검출에 대해 더 높은 검출 민감도 및/또는 더 낮은 위양성 비율을 유도한다. 일부 경우에, 돌연변이는 분석된 서열(예를 들어, 본원에 기재된 방법을 사용함)과 참조 서열 사이의 차이이다. 참조 서열은 일부 경우에 다른 유기체, 동일하거나 유사한 종의 다른 개체, 유기체의 집단 또는 동일한 게놈의 다른 영역으로부터 얻는다. 일부 경우에, 돌연변이는 플라스미드 또는 염색체에서 확인된다. 일부 경우에, 돌연변이는 SNV(단일 뉴클레오티드 변이), SNP(단일 뉴클레오티드 다형성) 또는 CNV(카피 수 변이 또는 CNA/카피 수 이상)이다. 일부 경우에, 돌연변이는 염기 치환, 삽입, 또는 결실이다. 일부 경우에, 돌연변이는 전이, 전환, 넌센스 돌연변이, 사일런트 돌연변이, 동의 또는 비-동의 돌연변이, 비병원성 돌연변이, 미스센스 돌연변이 또는 프레임시프트 돌연변이(결실 또는 삽입)이다. 일부 경우에, PTA는 인 실리코(in-silico) 예측, ChIP-시퀀싱, GUIDE-시퀀싱, 서클-시퀀싱, HTGTS(고처리량 게놈 전체 전좌 시퀀싱), IDLV(통합 결핍 렌티바이러스), 절단유전체-시퀀싱, FISH(형광 동소 혼성화), 또는 DISCOVER-시퀀싱과 같은 방법과 비교할 때 돌연변이 검출에 대해 더 높은 검출 민감도 및/또는 더 낮은 위양성 비율을 유도한다.
1차 주형 지시 증폭
"1차 주형 지시 증폭(PTA)"과 같은 핵산 증폭 방법이 본원에 기재되어 있다. 일부 경우에, PTA는 멀티오믹 분석을 위해 다른 분석 워크플로우와 조합된다. 예를 들어, 본원에 기재된 PTA 방법의 일 구현예는 도 1g에 개략적으로 표시된다. PTA 방법으로, 폴리머라제(예를 들어, 가닥 치환 폴리머라제)를 사용하여 1차 주형("직접적인 카피")으로부터 앰플리콘을 우선적으로 생성한다. 결과적으로, 오류는 MDA와 비교하여 후속 증폭 동안 딸 앰플리콘으로부터 더 낮은 속도로 전파된다. 그 결과 기존 WGA 프로토콜과 달리 단일 세포의 게놈을 포함한 적은 DNA 입력량을 높은 커버리지 폭과 균일성을 가지면서 정확하고 재현 가능한 방식으로 증폭할 수 있는 쉽게 실행되는 방법이다. 또한, 종결된 증폭 산물은 종결자를 제거한 후 방향 결찰을 거쳐 증폭 프라이머에 세포 바코드를 부착할 수 있으므로 모든 세포로부터의 산물이 병렬 증폭 반응을 거친 후 풀링될 수 있다. 일부 경우에, 주형 핵산은 고체 지지체에 결합되지 않는다. 일부 경우에, 주형 핵산의 직접적인 카피는 고체 지지체에 결합되지 않는다. 일부 경우에, 하나 이상의 프라이머는 고체 지지체에 결합되지 않는다. 일부 경우에, 프라이머는 고체 지지체에 결합되지 않는다. 일부 경우에, 프라이머는 제1 고체 지지체에 부착되고, 주형 핵산은 제2 고체 지지체에 부착되며, 여기서, 제1 및 제2 고체 지지체는 동일하지 않다. 일부 경우에, PTA는 더 큰 세포 집단에서 단일 세포를 분석하는데 사용된다. 일부 경우에, PTA는 더 큰 세포 집단 또는 전체 세포 집단으로부터 하나 초과의 세포를 분석하는 데 사용된다.
증폭을 위해 가닥 치환 활성을 갖는 핵산 폴리머라제를 사용하는 방법이 본원에 기재되어 있다. 일부 경우에서, 그러한 폴리머라제는 가닥 치환 활성 및 낮은 오류율을 포함한다. 일부 경우에, 그러한 폴리머라제는 가닥 치환 활성 및 교정(proofreading) 엑소뉴클레아제 활성, 예컨대 3'-> 5' 교정 활성을 포함한다. 일부 경우에, 핵산 폴리머라제는 가역적 또는 비가역적 종결자, 또는 추가 가닥 치환 인자와 같은 다른 성분과 함께 사용된다. 일부 경우에, 폴리머라제는 가닥 치환 활성을 갖지만, 엑소뉴클레아제 교정 활성을 갖지 않는다. 예를 들어, 일부 경우에 그러한 폴리머라제는 박테리오파지 phi29(Φ29) 폴리머라제를 포함하며, 이는 또한 3'-> 5' 교정 엑소뉴클레아제 활성의 결과로 매우 낮은 오류율을 갖는다(예를 들어, 미국 특허 번호 5,198,543 및 5,001,050 참조). 일부 경우에, 가닥 치환 핵산 폴리머라제의 비제한적인 예는, 예를 들어, 유전자 변형된 phi29(Φ29) DNA 폴리머라제, 클레나우 단편 DNA 폴리머라제 I(Jacobsen et al., Eur. J. Biochem. 45:623-627 (1974)), 파아지 M2 DNA 폴리머라제(Matsumoto et al., Gene 84:247 (1989)), 파아지 phiPRD1 DNA 폴리머라제(Jung et al., Proc. Natl. Acad. Sci. USA 84:8287 (1987); Zhu and Ito, Biochim. Biophys. Acta. 1219:267-276 (1994)), Bst DNA 폴리머라제(예를 들어, Bst 큰 단편 DNA 폴리머라제(엑소(-) Bst; Aliotta et al., Genet. Anal. (Netherlands) 12:185-195 (1996)), 엑소(-) Bca DNA 폴리머라제(Walker and Linn, Clinical Chemistry 42:1604-1608 (1996)), Bsu DNA 폴리머라제, 벤트R (엑소-) DNA 폴리머라제를 포함하는 벤트R DNA 폴리머라제(Kong et al., J. Biol. Chem. 268:1965-1975 (1993)), 딥 벤트 (엑소-) DNA 폴리머라제를 포함하는 딥 벤트 DNA 폴리머라제, IsoPol DNA 폴리머라제, DNA 폴리머라제 I, 써미네이터(Therminator) DNA 폴리머라제, T5 DNA 폴리머라제(Chatterjee et al., Gene 97:13-19 (1991)), 시쿼나아제(U.S. Biochemicals), T7 DNA 폴리머라제, T7 시쿼나아제, T7 gp5 DNA 폴리머라제, PRDI DNA 폴리머라제, T4 DNA 폴리머라제(Kaboord and Benkovic, Curr. Biol. 5:149-157 (1995))를 포함한다. 추가 가닥 치환 핵산 폴리머라제는 또한 본원에 기재된 방법과 호환된다. 가닥 치환 복제를 수행하는 주어진 폴리머라제의 능력은, 예를 들어, 가닥 치환 복제 검정에서 폴리머라제를 사용하여 결정될 수 있다(예를 들어, 미국 특허 번호 6,977,148에 개시된 바와 같음). 일부 경우에, 그러한 검정은 사용되는 효소에 대한 최적 활성에 적합한 온도, 예를 들어, phi29 DNA 폴리머라제의 경우 32℃, 엑소(-) Bst DNA 폴리머라제의 경우 46℃ 내지 64℃, 또는 고열 유기체로부터의 효소의 경우 약 60℃ 내지 70℃에서 수행된다. 폴리머라제를 선택하기 위한 또 다른 유용한 검정은 문헌(Kong et al., J. Biol. Chem. 268:1965-1975 (1993))에 기재된 프라이머 차단 검정이다. 검정은 진행을 차단하기 위해 신장 프라이머의 상류에 혼성화되는 올리고뉴클레오티드의 존재 또는 부재하에 M13 ssDNA 주형을 사용하는 프라이머 신장 검정으로 이루어진다. 일부 경우에, 이 검정에서 차단 프라이머를 치환할 수 있는 다른 효소는 개시된 방법에 유용하다. 일부 경우에, 폴리머라제는 dNTP 및 종결자를 거의 동일한 속도로 혼입시킨다. 일부 경우에, 본원에 기재된 폴리머라제에 대한 dNTP 및 종결자에 대한 혼입 속도의 비율은 약 1:1, 약 1.5:1, 약 2:1, 약 3:1, 약 4:1, 약 5:1, 약 10:1, 약 20:1, 약 50:1, 약 100:1, 약 200:1, 약 500:1, 또는 약 1000:1이다. 일부 경우에, 본원에 기재된 폴리머라제의 dNTP 및 종결자에 대한 혼입 속도의 비율은 1:1 내지 1000:1, 2:1 내지 500:1, 5:1 내지 100:1, 10:1 내지 1000:1, 100:1 내지 1000:1, 500:1 내지 2000:1, 50:1 내지 1500:1, 또는 25:1 내지 1000:1이다.
가닥 치환이, 예를 들어, 헬리카제와 같은 가닥 치환 인자의 사용을 통해 촉진될 수 있는 증폭 방법이 본원에 기재되어 있다. 그러한 인자는 일부 경우에 폴리머라제, 종결자, 또는 기타 성분과 같은 추가 증폭 성분과 함께 사용된다. 일부 경우에, 가닥 치환 인자는 가닥 치환 활성이 없는 폴리머라제와 함께 사용된다. 일부 경우에, 가닥 치환 인자는 가닥 치환 활성을 갖는 폴리머라제와 함께 사용된다. 이론에 구속하고자 하는 것은 아니지만, 가닥 치환 인자는 더 작은 이중 가닥 앰플리콘이 다시 프라이밍되는 속도를 증가시킬 수 있다. 일부 경우에, 가닥 치환 인자의 존재하에 가닥 치환 복제를 수행할 수 있는 임의의 DNA 폴리머라제는 그러한 인자의 부재하에 DNA 폴리머라제가 가닥 치환 복제를 수행하지 않더라도 PTA 방법에서 사용하기에 적합하다. 일부 경우에, 가닥 치환 복제에 유용한 가닥 치환 인자는 BMRF1 폴리머라제 부속 서브유닛(Tsurumi et al., J. Virology 67(12):7648-7653 (1993)), 아데노바이러스 DNA 결합 단백질(Zijderveld and van der Vliet, J. Virology 68(2): 1158-1164 (1994)), 단순 포진 바이러스 단백질 ICP8(Boehmer and Lehman, J. Virology 67(2):711-715 (1993); Skaliter and Lehman, Proc. Natl. Acad. Sci. USA 91(22):10665-10669 (1994)); 단일 가닥 DNA 결합 단백질(SSB; Rigler and Romano, J. Biol. Chem. 270:8910-8919 (1995)); 파아지 T4 유전자 32 단백질(Villemain and Giedroc, Biochemistry 35:14395-14404 (1996)); T7 헬리카제-프리마제; T7 gp2.5 SSB 단백질; Tte-UvrD(써모안에어로박터 텐그콘겐시스(Thermoanaerobacter tengcongensis) 유래), 소 흉선 헬리카제(Siegel et al., J. Biol. Chem. 267:13629-13635 (1992)); 박테리아 SSB(예를 들어, 이. 콜라이(E. coli) SSB), 진핵생물의 복제 단백질 A(RPA: Replication Protein A), 인간 미토콘드리아 SSB(mtSSB), 및 재조합 효소(예를 들어, 재조합 효소 A(RecA) 패밀리 단백질, T4 UvsX, 파아지 HK620의 Sak4, Rad51, Dmc1, 또는 Radb)를 포함한다(그러나 이에 제한되지 않음). 가닥 치환 및 프라이밍을 촉진하는 인자의 조합도 본원에 기재된 방법과 일치한다. 예를 들어, 헬리카제가 폴리머라제와 함께 사용된다. 일부 경우에, PTA 방법은 단일 가닥 DNA 결합 단백질(SSB, T4 gp32, 또는 기타 단일 가닥 DNA 결합 단백질), 헬리카제, 및 폴리머라제(예를 들어, SauDNA 폴리머라제, Bsu 폴리머라제, Bst2.0, GspM, GspM2.0, GspSSD, 또는 기타 적합한 폴리머라제)의 사용을 포함한다. 일부 경우에, 역전사 효소가 본원에 기재된 가닥 치환 인자와 함께 사용된다. 일부 경우에, 역전사효소는 본원에 기재된 가닥 치환 인자와 함께 사용된다. 일부 경우에, 증폭은 US 9,617,586에 기재된 것과 같은 폴리머라제 및 닉킹 효소(예를 들어, "NEAR")를 사용하여 수행된다. 일부 경우에, 닉킹 효소는 Nt.BspQI, Nb.BbvCi, Nb.BsmI, Nb.BsrDI, Nb.BtsI, Nt.AlwI, Nt.BbvCI, Nt.BstNBI, Nt.CviPII, Nb.Bpu10I, 또는 Nt.Bpu10I이다.
종결자 뉴클레오티드, 폴리머라제, 및 추가 인자 또는 조건의 사용을 포함하는 증폭 방법이 본원에 기재되어 있다. 예를 들어, 일부 경우에, 그러한 인자는 증폭 동안 핵산 주형(들) 또는 앰플리콘을 단편화하기 위해 사용된다. 일부 경우에서, 그러한 인자는 엔도뉴클레아제를 포함한다. 일부 경우에, 인자는 트랜스포사제를 포함한다. 일부 경우에, 기계적 전단을 사용하여 증폭 동안 핵산을 단편화한다. 일부 경우에, 추가 단백질 또는 조건의 추가를 통해 단편화될 수 있는 뉴클레오티드가 증폭 동안 첨가된다. 예를 들어, 우라실이 앰플리콘에 혼입되고; 우라실 D-글리코실라제의 처리는 우라실 함유 위치에서 핵산을 단편화한다. 일부 경우에, 선택적 핵산 단편화를 위한 추가 시스템, 예를 들어, 변형된 시토신-피렌 염기 쌍을 절단하는 조작된 DNA 글리코실라제도 사용된다(Kwon, et al. Chem Biol. 2003, 10(4), 351).
핵산 복제를 종결하여 증폭 산물의 크기를 감소시키는 종결자 뉴클레오티드의 사용을 포함하는 증폭 방법이 본원에 기재되어 있다. 그러한 종결자는 일부 경우에 폴리머라제, 가닥 치환 인자, 또는 본원에 기재된 다른 증폭 성분과 함께 사용된다. 일부 경우에, 종결자 뉴클레오티드는 핵산 복제의 효율을 감소시키거나 낮춘다. 그러한 종결자는 일부 경우에 신장 속도를 적어도 99.9%, 99%, 98%, 95%, 90%, 85%, 80%, 75%, 70%, 또는 적어도 65% 감소시킨다. 그러한 종결자는 일부 경우에 신장 속도를 50%-90%, 60%-80%, 65%-90%, 70%-85%, 60%-90%, 70%-99%, 80%-99%, 또는 50%-80% 감소시킨다. 일부 경우에, 종결자는 평균 앰플리콘 산물 길이를 적어도 99.9%, 99%, 98%, 95%, 90%, 85%, 80%, 75%, 70%, 또는 적어도 65% 감소시킨다. 일부 경우에, 종결자는 평균 앰플리콘 길이를 50%-90%, 60%-80%, 65%-90%, 70%-85%, 60%-90%, 70%-99%, 80%-99%, 또는 50%-80% 감소시킨다. 일부 경우에, 종결자 뉴클레오티드를 포함하는 앰플리콘은 그러한 앰플리콘을 주형으로 사용하는 폴리머라제의 능력을 감소시키는 루프 또는 헤어핀을 형성한다. 일부 경우에, 종결자의 사용은 종결자 뉴클레오티드(예를 들어, 엑소뉴클레아제 내성을 갖도록 변형되어 DNA 신장을 종결시키는 디데옥시뉴클레오티드)의 혼입을 통해 초기 증폭 부위에서 증폭 속도를 늦춰 더 작은 증폭 산물을 생성한다. 현재 사용되는 방법보다 더 작은 증폭 산물을 생산함으로써(예를 들어, MDA 방법의 경우 > 10,000개 뉴클레오티드의 평균 산물 길이와 비교하여 PTA 방법의 경우 50-2000개 뉴클레오티드 길이의 평균 길이), 일부 경우에 PTA 증폭 산물은 단편화가 필요 없는 어댑터의 직접적인 결찰을 거쳐 세포 바코드 및 고유한 분자 식별자(UMI)를 효율적으로 혼입할 수 있다(도 2a 참조).
종결자 뉴클레오티드는 폴리머라제, 주형, 또는 기타 인자와 같은 인자에 따라 다양한 농도로 존재한다. 예를 들어, 일부 경우에 종결자 뉴클레오티드의 양은 본원에 기재된 방법에서 종결자 뉴클레오티드에 대한 비-종결자 뉴클레오티드의 비율로 표현된다. 그러한 농도는 일부 경우에 앰플리콘 길이의 조절을 허용한다. 일부 경우에, 종결자 대 비-종결자 뉴클레오티드의 비율은 존재하는 주형의 양 또는 주형의 크기에 대해 변형된다. 일부 경우에, 종결자 대 비-종결자 뉴클레오티드의 비율은 더 작은 샘플 크기(예를 들어, 펨토그램 대 피코그램 범위)에 대해 감소된다. 일부 경우에, 종결자 대 비-종결자 뉴클레오티드의 비율은 약 2:1, 5:1, 7:1, 10:1, 20:1, 50:1, 100:1, 200:1, 500:1, 1000:1, 2000:1, 또는 5000:1이다. 일부 경우에, 비-종결자 대 종결자 뉴클레오티드의 비율은 2:1-10:1, 5:1-20:1, 10:1-100:1, 20:1-200:1, 50:1-1000:1, 50:1-500:1, 75:1-150:1, 또는 100:1-500:1이다. 일부 경우에, 본원에 기재된 방법을 사용한 증폭 동안 존재하는 뉴클레오티드 중 적어도 하나는 종결자 뉴클레오티드이다. 각 종결자는 거의 동일한 농도로 존재할 필요는 없고; 일부 경우에, 본원에 기재된 방법에 존재하는 각 종결자의 비율은 특정 세트의 반응 조건, 샘플 유형, 또는 폴리머라제에 대해 최적화된다. 이론에 구속하고자 하는 것은 아니지만, 각 종결자는 주형 가닥 상의 상응하는 뉴클레오티드와 쌍을 이루는 것에 반응하여 앰플리콘의 성장하는 폴리뉴클레오티드 사슬로의 혼입에 대해 상이한 효율을 가질 수 있다. 예를 들어, 일부 경우에 시토신과 쌍을 이루는 종결자는 평균 종결자 농도보다 약 3%, 5%, 10%, 15%, 20%, 25%, 또는 50% 더 높은 농도로 존재한다. 일부 경우에, 티민과 쌍을 이루는 종결자는 평균 종결자 농도보다 약 3%, 5%, 10%, 15%, 20%, 25%, 또는 50% 더 높은 농도로 존재한다. 일부 경우에, 구아닌과 쌍을 이루는 종결자는 평균 종결자 농도보다 약 3%, 5%, 10%, 15%, 20%, 25%, 또는 50% 더 높은 농도로 존재한다. 일부 경우에, 아데닌과 쌍을 이루는 종결자는 평균 종결자 농도보다 약 3%, 5%, 10%, 15%, 20%, 25%, 또는 50% 더 높은 농도로 존재한다. 일부 경우에, 우라실과 쌍을 이루는 종결자는 평균 종결자 농도보다 약 3%, 5%, 10%, 15%, 20%, 25%, 또는 50% 더 높은 농도로 존재한다. 일부 경우에, 핵산 폴리머라제에 의해 핵산 신장을 종결할 수 있는 임의의 뉴클레오티드가 본원에 기재된 방법에서 종결 뉴클레오티드로 사용된다. 일부 경우에, 가역적 종결자를 사용하여 핵산 복제를 종결한다. 일부 경우에, 비가역적 종결자를 사용하여 핵산 복제를 종결한다. 일부 경우에, 종결자의 비제한적 예는, 예를 들어, 3' 차단된 가역적 종결자 포함 뉴클레오티드, 3' 차단되지 않은 가역적 종결자 포함 뉴클레오티드, 데옥시뉴클레오티드의 2' 변형을 포함하는 종결자, 데옥시뉴클레오티드의 질소 염기에 대한 변형을 포함하는 종결자, 또는 이들의 임의의 조합과 같은 가역적 및 비가역적 핵산 및 핵산 유사체를 포함한다. 일 구현예에서, 종결자 뉴클레오티드는 디데옥시뉴클레오티드이다. 핵산 복제를 종결하고 본 발명을 실행하기에 적합할 수 있는 다른 뉴클레오티드 변형은 데옥시리보스의 3' 탄소의 r 기의 임의의 변형, 예컨대 역전된 디데옥시뉴클레오티드, 3' 비오티닐화 뉴클레오티드, 3' 아미노 뉴클레오티드, 3'-인산화 뉴클레오티드, 3'-O-메틸 뉴클레오티드, 3' C3 스페이서 뉴클레오티드를 포함한 3' 탄소 스페이서 뉴클레오티드, 3' C18 뉴클레오티드, 3' 헥산디올 스페이서 뉴클레오티드, 아시클로뉴클레오티드, 및 이들의 조합을 제한 없이 포함한다. 일부 경우에, 종결자는 1, 2, 3, 4개 이상의 염기 길이를 포함하는 폴리뉴클레오티드이다. 일부 경우에, 종결자는 검출 가능한 모이어티 또는 태그(예를 들어, 질량 태그, 형광 태그, 염료, 방사성 원자, 또는 기타 검출 가능한 모이어티)를 포함하지 않는다. 일부 경우에, 종결자는 검출 가능한 모이어티 또는 태그의 부착을 허용하는 화학적 모이어티(예를 들어, "클릭" 아지드/알킨, 접합체 첨가 파트너, 또는 태그 부착을 위한 화학적 핸들)를 포함하지 않는다. 일부 경우에, 모든 종결자 뉴클레오티드는 뉴클레오티드의 영역(예를 들어, 당 모이어티, 염기 모이어티, 또는 포스페이트 모이어티)에서 증폭을 감소시키는 동일한 변형을 포함한다. 일부 경우에, 적어도 하나의 종결자는 증폭을 감소시키는 상이한 변형을 갖는다. 일부 경우에, 모든 종결자는 실질적으로 유사한 형광 여기 또는 방출 파장을 갖는다. 일부 경우에, 포스페이트 기에 대한 변형이 없는 종결자는 엑소뉴클레아제 교정 활성을 갖지 않는 폴리머라제와 함께 사용된다. 종결자 뉴클레오티드를 제거할 수 있는 3'-> 5' 교정 엑소뉴클레아제 활성을 갖는 폴리머라제(예컨대, phi29)와 함께 사용되는 경우 종결자는 일부 경우에 이들을 엑소뉴클레아제 내성으로 만들기 위해 추가로 변형된다. 예를 들어, 디데옥시뉴클레오티드는 포스포로티오에이트 연결을 생성하는 알파-티오 기로 변형되어 이들 뉴클레오티드가 핵산 폴리머라제의 3'-> 5' 교정 엑소뉴클레아제 활성에 내성을 갖게 만든다. 일부 경우에 그러한 변형은 폴리머라제의 엑소뉴클레아제 교정 활성을 적어도 99.5%, 99%, 98%, 95%, 90%, 또는 적어도 85% 감소시킨다. 3'-> 5' 엑소뉴클레아제 활성에 대한 내성을 제공하는 다른 종결자 뉴클레오티드 변형의 비제한적인 예는 일부 경우에 다음을 포함한다: 알파 기가 변형된 뉴클레오티드, 예컨대 포스포로티오에이트 결합을 생성하는 알파-티오 디데옥시뉴클레오티드, C3 스페이서 뉴클레오티드, 잠금 핵산(LNA), 역위된 핵산, 2' 플루오로 염기, 3' 인산화, 2'-O-메틸 변형 (또는 기타 2'-O-알킬 변형), 프로핀 변형된 염기(예를 들어, 데옥시시토신, 데옥시우리딘), L-DNA 뉴클레오티드, L-RNA 뉴클레오티드, 역위된 연결을 갖는 뉴클레오티드(예를 들어, 5'-5' 또는 3'-3'), 5' 역위된 염기(예를 들어, 5' 역위된 2',3'-디데옥시 dT), 메틸포스포네이트 백본, 및 트랜스 핵산. 일부 경우에, 변형된 뉴클레오티드는 유리 3' OH 기를 포함하는 염기 변형된 핵산(예를 들어, 2-니트로벤질 알킬화 HOMedU 트리포스페이트, 고체 지지체 또는 다른 큰 모이어티와 같은 큰 화학 기를 갖는 변형을 포함하는 염기)을 포함한다. 일부 경우에, 가닥 치환 활성을 갖지만 3'-> 5' 엑소뉴클레아제 교정 활성이 없는 폴리머라제는 엑소뉴클레아제 내성을 갖도록 하는 변형이 있거나 없는 종결자 뉴클레오티드와 함께 사용된다. 그러한 핵산 폴리머라제는 Bst DNA 폴리머라제, Bsu DNA 폴리머라제, 딥 벤트 (엑소-) DNA 폴리머라제, 클레나우 단편 (엑소-) DNA 폴리머라제, 써미네이터 DNA 폴리머라제, 및 벤트R (엑소-)를 제한 없이 포함한다.
프라이머 및 앰플리콘 라이브러리
적어도 하나의 표적 핵산 분자의 증폭으로부터 유도되는 앰플리콘 라이브러리가 본원에 기재되어 있다. 그러한 라이브러리는 일부 경우에 종결자를 사용하는 것과 같이 본원에 기재된 방법을 사용하여 생성된다. 그러한 방법은 가닥 치환 폴리머라제 또는 인자, 종결자 뉴클레오티드(가역적 또는 비가역적), 또는 본원에 기재된 다른 특징 및 구현예의 사용을 포함한다. 일부 경우에, 본원에 기재된 종결자를 사용하여 생성된 앰플리콘 라이브러리는 후속 증폭 반응(예를 들어, PCR)에서 추가로 증폭된다. 일부 경우에, 후속 증폭 반응은 종결자를 포함하지 않는다. 일부 경우에, 앰플리콘 라이브러리는 폴리뉴클레오티드를 포함하며, 여기서 폴리뉴클레오티드의 적어도 50%, 60%, 70%, 80%, 90%, 95%, 또는 적어도 98%는 적어도 하나의 종결자 뉴클레오티드를 포함한다. 일부 경우에, 앰플리콘 라이브러리는 앰플리콘 라이브러리가 유래된 표적 핵산 분자를 포함한다. 앰플리콘 라이브러리는 복수의 폴리뉴클레오티드를 포함하며, 여기서 폴리뉴클레오티드의 적어도 일부는 직접적인 카피(예를 들어, 게놈 DNA, RNA, 또는 다른 표적 핵산과 같은 표적 핵산 분자로부터 직접적으로 복제됨)이다. 예를 들어, 앰플리콘 폴리뉴클레오티드의 적어도 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 95% 또는 95% 초과는 적어도 하나의 표적 핵산 분자의 직접적인 카피이다. 일부 경우에, 앰플리콘 폴리뉴클레오티드의 적어도 5%는 적어도 하나의 표적 핵산 분자의 직접적인 카피이다. 일부 경우에, 앰플리콘 폴리뉴클레오티드의 적어도 10%는 적어도 하나의 표적 핵산 분자의 직접적인 카피이다. 일부 경우에, 앰플리콘 폴리뉴클레오티드의 적어도 15%는 적어도 하나의 표적 핵산 분자의 직접적인 카피이다. 일부 경우에, 앰플리콘 폴리뉴클레오티드의 적어도 20%는 적어도 하나의 표적 핵산 분자의 직접적인 카피이다. 일부 경우에, 앰플리콘 폴리뉴클레오티드의 적어도 50%는 적어도 하나의 표적 핵산 분자의 직접적인 카피이다. 일부 경우에, 앰플리콘 폴리뉴클레오티드의 3%-5%, 3-10%, 5%-10%, 10%-20%, 20%-30%, 30%-40%, 5%-30%, 10%-50%, 또는 15%-75%는 적어도 하나의 표적 핵산 분자의 직접적인 카피이다. 일부 경우에, 폴리뉴클레오티드의 적어도 일부는 표적 핵산 분자, 또는 딸(표적 핵산의 첫 번째 카피) 자손의 직접적인 카피이다. 예를 들어, 앰플리콘 폴리뉴클레오티드의 적어도 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 95% 또는 95% 초과는 적어도 하나의 표적 핵산 분자 또는 딸 자손의 직접적인 카피이다. 일부 경우에, 앰플리콘 폴리뉴클레오티드의 적어도 5%는 적어도 하나의 표적 핵산 분자 또는 딸 자손의 직접적인 카피이다. 일부 경우에, 앰플리콘 폴리뉴클레오티드의 적어도 10%는 적어도 하나의 표적 핵산 분자 또는 딸 자손의 직접적인 카피이다. 일부 경우에, 앰플리콘 폴리뉴클레오티드의 적어도 20%는 적어도 하나의 표적 핵산 분자 또는 딸 자손의 직접적인 카피이다. 일부 경우에, 앰플리콘 폴리뉴클레오티드의 적어도 30%는 적어도 하나의 표적 핵산 분자 또는 딸 자손의 직접적인 카피이다. 일부 경우에, 앰플리콘 폴리뉴클레오티드의 3%-5%, 3%-10%, 5%-10%, 10%-20%, 20%-30%, 30%-40%, 5%-30%, 10%-50%, 또는 15%-75%는 적어도 하나의 표적 핵산 분자 또는 딸 자손의 직접적인 카피이다. 일부 경우에, 표적 핵산의 직접적인 카피는 50-2500, 75-2000, 50-2000, 25-1000, 50-1000, 500-2000, 또는 50-2000개 염기 길이이다. 일부 경우에, 딸 자손은 1000-5000, 2000-5000, 1000-10,000, 2000-5000, 1500-5000, 3000-7000, 또는 2000-7000개 염기 길이이다. 일부 경우에, PTA 증폭 산물의 평균 길이는 25-3000개 뉴클레오티드 길이, 50-2500, 75-2000, 50-2000, 25-1000, 50-1000, 500-2000, 또는 50-2000개 염기 길이이다. 일부 경우에, PTA로부터 생성된 앰플리콘은 5000, 4000, 3000, 2000, 1700, 1500, 1200, 1000, 700, 500개 이하, 또는 300개 이하의 염기 길이이다. 일부 경우에, PTA로부터 생성된 앰플리콘은 1000-5000, 1000-3000, 200-2000, 200-4000, 500-2000, 750-2500, 또는 1000-2000개 염기 길이이다. 일부 경우에, 본원에 기재된 방법을 사용하여 생성된 앰플리콘 라이브러리는 고유한 서열을 포함하는 적어도 1000, 2000, 5000, 10,000, 100,000, 200,000, 500,000개 또는 500,000개 초과의 앰플리콘을 포함한다. 일부 경우에, 라이브러리는 적어도 100, 200, 300, 400, 500, 600, 700, 800, 900, 1000, 1100, 1200, 1300, 1400, 1500, 2000, 2500, 3000개, 또는 적어도 3500개 앰플리콘을 포함한다. 일부 경우에, 1000개 미만의 염기 길이를 갖는 앰플리콘 폴리뉴클레오티드의 적어도 5%, 10%, 15%, 20%, 25%, 30% 또는 30% 초과는 적어도 하나의 표적 핵산 분자의 직접적인 카피이다. 일부 경우에, 2000개 이하의 염기 길이를 갖는 앰플리콘 폴리뉴클레오티드의 적어도 5%, 10%, 15%, 20%, 25%, 30% 또는 30% 초과는 적어도 하나의 표적 핵산 분자의 직접적인 카피이다. 일부 경우에, 3000-5000개 염기 길이를 갖는 앰플리콘 폴리뉴클레오티드의 적어도 5%, 10%, 15%, 20%, 25%, 30% 또는 30% 초과는 적어도 하나의 표적 핵산 분자의 직접적인 카피이다. 일부 경우에, 표적 핵산 분자에 대한 직접 복제 앰플리콘의 비율은 적어도 10:1, 100:1, 1000:1, 10,000:1, 100,000:1, 1,000,000:1, 10,000,000:1, 또는 10,000,000:1 초과이다. 일부 경우에, 표적 핵산 분자에 대한 직접적인 카피 앰플리콘의 비율은 적어도 10:1, 100:1, 1000:1, 10,000:1, 100,000:1, 1,000,000:1, 10,000,000:1, 또는 10,000,000:1 초과이고, 여기서 직접적인 카피 앰플리콘은 700-1200개 이하의 염기 길이이다. 일부 경우에, 표적 핵산 분자에 대한 직접적인 카피 앰플리콘 및 딸 앰플리콘의 비율은 적어도 10:1, 100:1, 1000:1, 10,000:1, 100,000:1, 1,000,000:1, 10,000,000:1, 또는 10,000,000:1 초과이다. 일부 경우에, 표적 핵산 분자에 대한 직접적인 카피 앰플리콘 및 딸 앰플리콘의 비율은 적어도 10:1, 100:1, 1000:1, 10,000:1, 100,000:1, 1,000,000:1, 10,000,000:1, 또는 10,000,000:1 초과이고, 여기서 직접적인 카피 앰플리콘은 700-1200개 염기 길이이고, 딸 앰플리콘은 2500-6000개 염기 길이이다. 일부 경우에, 라이브러리는 표적 핵산 분자의 직접적인 카피인 약 50-10,000, 약 50-5,000, 약 50-2500, 약 50-1000, 약 150-2000, 약 250-3000, 약 50-2000, 약 500-2000, 또는 약 500-1500개 앰플리콘을 포함한다. 일부 경우에, 라이브러리는 표적 핵산 분자 또는 딸 앰플리콘의 직접적인 카피인 약 50-10,000, 약 50-5,000, 약 50-2500, 약 50-1000, 약 150-2000, 약 250-3000, 약 50-2000, 약 500-2000, 또는 약 500-1500개 앰플리콘을 포함한다. 직접적인 카피의 수는 일부 경우에 PCR 증폭 주기의 수에 의해 제어될 수 있다. 일부 경우에, 30, 25, 20, 15, 13, 11, 10, 9, 8, 7, 6, 5, 4, 또는 3개 이하의 PCR 주기가 표적 핵산 분자의 카피를 생성하기 위해 사용된다. 일부 경우에, 약 30, 25, 20, 15, 13, 11, 10, 9, 8, 7, 6, 5, 4, 또는 약 3개 PCR 주기가 표적 핵산 분자의 카피를 생성하기 위해 사용된다. 일부 경우에, 3, 4, 5, 6, 7, 또는 8개 PCR 주기가 표적 핵산 분자의 카피를 생성하기 위해 사용된다. 일부 경우에, 2-4, 2-5, 2-7, 2-8, 2-10, 2-15, 3-5, 3-10, 3-15, 4-10, 4-15, 5-10 또는 5-15개 PCR 주기가 표적 핵산 분자의 카피를 생성하기 위해 사용된다. 본원에 기재된 방법을 사용하여 생성된 앰플리콘 라이브러리는 일부 경우에 어댑터 결찰 및 추가 PCR 증폭과 같은 추가 단계를 거친다. 일부 경우에, 이러한 추가 단계는 시퀀싱 단계에 선행한다.
본원에 기재된 방법은 하나 이상의 농축 또는 정제 단계를 추가로 포함할 수 있다. 일부 경우에, 하나 이상의 폴리뉴클레오티드(예컨대 cDNA, PTA 앰플리콘, 또는 기타 폴리뉴클레오티드)는 본원에 기재된 방법 동안 농축된다. 일부 경우에, 폴리뉴클레오티드 프로브는 하나 이상의 폴리뉴클레오티드를 캡처하는데 사용된다. 일부 경우에, 프로브는 하나 이상의 게놈 엑손을 캡처하도록 구성된다. 일부 경우에, 프로브의 라이브러리는 적어도 1000, 2000, 5000, 10,000, 50,000, 100,000, 200,000, 500,000, 또는 100만개 초과의 상이한 서열을 포함한다. 일부 경우에, 프로브의 라이브러리는 적어도 10, 20, 50, 100, 200, 500, 1000, 2000, 5000, 10,000 또는 10,000개 초과의 유전자에 결합할 수 있는 서열을 포함한다. 일부 경우에, 프로브는 비오틴과 같은 고체 지지체에 의한 캡처를 위한 모이어티를 포함한다. 일부 경우에, 농축 단계는 PTA 단계 후에 발생한다. 일부 경우에, 농축 단계는 PTA 단계 전에 발생한다. 일부 경우에, 프로브는 게놈 DNA 라이브러리에 결합하도록 구성된다. 일부 경우에, 프로브는 cDNA 라이브러리에 결합하도록 구성된다.
일부 경우에, 본원에 기재된 PTA 방법 및 조성물(종결자, 폴리머라제 등)로부터 생성된 폴리뉴클레오티드의 앰플리콘 라이브러리는 균일성이 증가된다. 일부 경우에, 균일성은 로렌츠 곡선(예를 들어, 도 5c), 또는 기타 그러한 방법을 사용하여 설명된다. 일부 경우에, 그러한 증가는 표적 핵산 분자(예를 들어, 게놈 DNA, RNA, 또는 기타 표적 핵산 분자)의 원하는 커버리지에 필요한 더 적은 시퀀싱 리드로 이어진다. 예를 들어, 폴리뉴클레오티드의 50% 이하의 누적 분율은 표적 핵산 분자의 서열의 적어도 80%의 누적 분율을 포함한다. 일부 경우에, 폴리뉴클레오티드의 50% 이하의 누적 분율은 표적 핵산 분자의 서열의 적어도 60%의 누적 분율을 포함한다. 일부 경우에, 폴리뉴클레오티드의 50% 이하의 누적 분율은 표적 핵산 분자의 서열의 적어도 70%의 누적 분율을 포함한다. 일부 경우에, 폴리뉴클레오티드의 50% 이하의 누적 분율은 표적 핵산 분자의 서열의 적어도 90%의 누적 분율을 포함한다. 일부 경우에, 균일성은 지니 지수를 사용하여 기재된다(여기서, 지수 0은 라이브러리의 완벽한 동일성을 나타내고 지수 1은 완벽한 비동일성을 나타냄). 일부 경우에, 본원에 기재된 앰플리콘 라이브러리는 0.55, 0.50, 0.45, 0.40, 또는 0.30 이하의 지니 지수를 갖는다. 일부 경우에, 본원에 기재된 앰플리콘 라이브러리는 0.50 이하의 지니 지수를 갖는다. 일부 경우에, 본원에 기재된 앰플리콘 라이브러리는 0.40 이하의 지니 지수를 갖는다. 일부 경우에, 그러한 균일성 메트릭스는 얻은 리드 수에 따라 결정된다. 예를 들어, 1억, 2억, 3억, 4억 이하, 또는 5억 개 이하의 리드를 얻는다. 일부 경우에, 리드 길이는 약 50, 75, 100, 125, 150, 175, 200, 225, 또는 약 250개 염기 길이이다. 일부 경우에, 균일성 메트릭스는 표적 핵산의 커버리지 깊이에 따라 결정된다. 예를 들어, 평균 커버리지 깊이는 약 10X, 15X, 20X, 25X, 또는 약 30X이다. 일부 경우에, 평균 커버리지 깊이는 10-30X, 20-50X, 5-40X, 20-60X, 5-20X, 또는 10-20X이다. 일부 경우에, 본원에 기재된 앰플리콘 라이브러리는 0.55 이하의 지니 지수를 가지며, 여기서 약 3억 개의 리드를 얻었다. 일부 경우에, 본원에 기재된 앰플리콘 라이브러리는 0.50 이하의 지니 지수를 가지며, 여기서 약 3억 개의 리드를 얻었다. 일부 경우에, 본원에 기재된 앰플리콘 라이브러리는 0.45 이하의 지니 지수를 가지며, 여기서 약 3억 개의 리드를 얻었다. 일부 경우에, 본원에 기재된 앰플리콘 라이브러리는 0.55 이하의 지니 지수를 가지며, 여기서, 3억 개 이하의 리드를 얻었다. 일부 경우에, 본원에 기재된 앰플리콘 라이브러리는 0.50 이하의 지니 지수를 가지며, 여기서 3억 개 이하의 리드를 얻었다. 일부 경우에, 본원에 기재된 앰플리콘 라이브러리는 0.45 이하의 지니 지수를 가지며, 여기서, 3억 개 이하의 리드를 얻었다. 일부 경우에, 본원에 기재된 앰플리콘 라이브러리는 0.55 이하의 지니 지수를 가지며, 여기서, 시퀀싱 커버리지 평균 깊이는 약 15X이다. 일부 경우에, 본원에 기재된 앰플리콘 라이브러리는 0.50 이하의 지니 지수를 가지며, 여기서, 시퀀싱 커버리지 평균 깊이는 약 15X이다. 일부 경우에, 본원에 기재된 앰플리콘 라이브러리는 0.45 이하의 지니 지수를 가지며, 여기서, 시퀀싱 커버리지 평균 깊이는 약 15X이다. 일부 경우에, 본원에 기재된 앰플리콘 라이브러리는 0.55 이하의 지니 지수를 가지며, 여기서, 시퀀싱 커버리지 평균 깊이는 적어도 15X이다. 일부 경우에, 본원에 기재된 앰플리콘 라이브러리는 0.50 이하의 지니 지수를 가지며, 여기서, 시퀀싱 커버리지 평균 깊이는 적어도 15X이다. 일부 경우에, 본원에 기재된 앰플리콘 라이브러리는 0.45 이하의 지니 지수를 가지며, 여기서, 시퀀싱 커버리지 평균 깊이는 적어도 15X이다. 일부 경우에, 본원에 기재된 앰플리콘 라이브러리는 0.55 이하의 지니 지수를 가지며, 여기서, 시퀀싱 커버리지 평균 깊이는 15X 이하이다. 일부 경우에, 본원에 기재된 앰플리콘 라이브러리는 0.50 이하의 지니 지수를 가지며, 여기서, 시퀀싱 커버리지 평균 깊이는 15X 이하이다. 일부 경우에, 본원에 기재된 앰플리콘 라이브러리는 0.45 이하의 지니 지수를 가지며, 여기서, 시퀀싱 커버리지 평균 깊이는 15X 이하이다. 본원에 기재된 방법을 사용하여 생성된 균일한 앰플리콘 라이브러리는 일부 경우에 어댑터 결찰 및 추가 PCR 증폭과 같은 추가 단계를 거친다. 일부 경우에, 그러한 추가 단계는 시퀀싱 단계에 선행한다.
프라이머는 본원에서 기재된 증폭 반응을 프라이밍하는 데 사용되는 핵산을 포함한다. 일부 경우에, 그러한 프라이머는 엑소뉴클레아제 내성을 갖도록 하는 변형이 있거나 없는 임의 길이의 무작위 데옥시뉴클레오티드, 엑소뉴클레아제 내성을 갖도록 하는 변형이 있거나 없는 임의 길이의 무작위 리보뉴클레오티드, 잠금 핵산과 같은 변형된 핵산, 특정 게놈 영역에 표적화되는 DNA 또는 RNA 프라이머, 및 프리마제와 같은 효소로 프라이밍되는 반응을 제한 없이 포함한다. 전체 게놈 PTA의 경우, 무작위 또는 부분 무작위 뉴클레오티드 서열을 갖는 프라이머 세트를 사용하는 것이 바람직하다. 매우 복잡한 핵산 샘플에서는 샘플에 존재하는 구체적인 핵산 서열을 알 필요가 없으며 프라이머는 임의의 특정 서열에 상보적으로 설계될 필요가 없다. 오히려, 핵산 샘플의 복잡성으로 인해 샘플에서 다수의 상이한 혼성화 표적 서열이 생성되며, 이는 무작위 또는 부분 무작위 서열의 다양한 프라이머에 상보적일 것이다. PTA에서 사용하기 위한 프라이머의 상보적인 부분은 일부 경우에 완전히 무작위화되거나, 무작위화된 부분만을 포함하거나, 그렇지 않으면 선택적으로 무작위화된다. 일부 경우에, 프라이머의 상보적인 부분에 있는 무작위 염기 위치의 수는, 예를 들어, 프라이머의 상보적인 부분에 있는 총 뉴클레오티드 수의 20% 내지 100%이다. 일부 경우에, 프라이머의 상보적인 부분에 있는 무작위 염기 위치의 수는 프라이머의 상보적인 부분에 있는 총 뉴클레오티드 수의 10% 내지 90%, 15-95%, 20%-100%, 30%-100%, 50%-100%, 75-100% 또는 90-95%이다. 일부 경우에, 프라이머의 상보적인 부분에 있는 무작위 염기 위치의 수는 프라이머의 상보적인 부분에 있는 총 뉴클레오티드 수의 적어도 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 또는 적어도 90%이다. 무작위 또는 부분 무작위 서열을 갖는 프라이머 세트는 일부 경우에 각 위치에서 임의의 뉴클레오티드의 첨가를 무작위화할 수 있도록 함으로써 표준 기술을 사용하여 합성된다. 일부 경우에, 프라이머 세트는 유사한 길이 및/또는 혼성화 특성을 가진 프라이머로 구성된다. 일부 경우에, 용어 "무작위 프라이머"는 각 위치에서 4배 축퇴성을 나타낼 수 있는 프라이머를 지칭한다. 일부 경우에, 용어 "무작위 프라이머"는 각 위치에서 3배 축퇴성을 나타낼 수 있는 프라이머를 의미한다. 일부 경우에, 본원에 기재된 방법에 사용된 무작위 프라이머는 3, 4, 5, 6, 7, 8, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20개 이상의 염기 길이인 무작위 서열을 포함한다. 일부 경우에, 프라이머는 3-20, 5-15, 5-20, 6-12, 또는 4-10개 염기 길이인 무작위 서열을 포함한다. 프라이머는 또한 이의 생성된 앰플리콘의 후속 증폭을 제한하는 신장 불가능한 요소를 포함할 수 있다. 예를 들어, 신장 불가능한 요소가 있는 프라이머는 일부 경우에 종결자를 포함한다. 일부 경우에, 프라이머는 1, 2, 3, 4, 5, 10, 또는 10개 초과의 종결자 뉴클레오티드와 같은 종결자 뉴클레오티드를 포함한다. 프라이머는 증폭 반응에 외부적으로 추가되는 성분에 제한될 필요는 없다. 일부 경우에, 프라이머는 프라이밍을 촉진하는 뉴클레오티드 및 단백질의 추가를 통해 동일 반응계에서 생성된다. 예를 들어, 뉴클레오티드와 조합된 프리마제 유사 효소는 일부 경우에 본원에 기재된 방법을 위한 무작위 프라이머를 생성하는 데 사용된다. 프리마제 유사 효소는 일부 경우에 DnaG 또는 AEP 효소 슈퍼패밀리의 구성원이다. 일부 경우에, 프리마제 유사 효소는 TthPrimPol이다. 일부 경우에, 프리마제 유사 효소는 T7 gp4 헬리카제-프리마제이다. 그러한 프리마제는 일부 경우에 본원에 기재된 폴리머라제 또는 가닥 치환 인자와 함께 사용된다. 일부 경우에, 프리마제는 데옥시리보뉴클레오티드로 프라이밍을 시작한다. 일부 경우에, 프리마제는 리보 뉴클레오티드로 프라이밍을 시작한다.
PTA 증폭은 앰플리콘의 특정 서브세트에 대한 선택이 뒤따를 수 있다. 그러한 선택은 일부 경우에 크기, 친화성, 활성, 프로브에 대한 혼성화, 또는 기타 알려진 선택 인자에 따라 결정된다. 일부 경우에, 선택은 어댑터 결찰 및/또는 라이브러리 증폭과 같은 본원에 기재된 추가 단계를 선행하거나 뒤따른다. 일부 경우에, 선택은 앰플리콘의 크기(길이)를 기반으로 한다. 일부 경우에, 지수 증폭을 거칠 가능성이 적은 더 작은 앰플리콘을 선택하며, 이는 증폭을 지수에서 준선형 증폭 과정으로 추가로 변환시키면서 1차 주형으로부터 유래된 산물을 농축시킨다(도 1a). 일부 경우에, 50-2000, 25-5000, 40-3000, 50-1000, 200-1000, 300-1000, 400-1000, 400-600, 600-2000, 또는 800-1000개 염기 길이를 포함하는 앰플리콘이 선택된다. 일부 경우에 크기 선택은 프로토콜의 사용, 예를 들어, 특정 크기의 핵산 단편을 농축하기 위해 카복실화된 상자성 비드 상의 고체상 가역 고정(SPRI)을 사용하거나, 당업자에게 알려진 다른 프로토콜을 사용하여 발생한다. 임의로 또는 조합하여, 선택은 시퀀싱(예를 들어, 합성에 의한 시퀀싱, 나노포어 시퀀싱 또는 기타 시퀀싱 방법) 동안 더 작은 시퀀싱 라이브러리 단편으로부터 클러스터가 우선적으로 형성되는 결과뿐만 아니라 시퀀싱 라이브러리를 제조하면서 PCR 동안 더 작은 단편의 우선적 결찰 및 증폭을 통해 발생한다. 더 작은 단편을 선택하기 위한 다른 전략도 본원에 기재된 방법과 일치하며 겔 전기영동 후 특정 크기의 핵산 단편 단리, 특정 크기의 핵산 단편에 결합하는 실리카 컬럼의 사용, 및 더 작은 단편에 대해 더 강력하게 농축되는 기타 PCR 전략의 사용을 제한 없이 포함한다. 임의의 수의 라이브러리 제조 프로토콜이 본원에 기재된 PTA 방법과 함께 사용될 수 있다. 일부 경우에, PTA에 의해 생성된 앰플리콘은 어댑터로 결찰된다(임의로 종결자 뉴클레오티드의 제거와 함께). 일부 경우에, PTA에 의해 생성된 앰플리콘은 프라이밍 부위로서 사용되는 트랜스포사제 기반 단편화로부터 생성된 상동성 영역을 포함한다. 일부 경우에, 라이브러리는 핵산을 기계적으로 또는 효소적으로 단편화하여 제조된다. 일부 경우에, 라이브러리는 트랜스포솜을 통한 태그멘테이션(tagmentation)을 사용하여 제조된다. 일부 경우에, 라이브러리는 Y-어댑터, 범용 어댑터 또는 원형 어댑터와 같은 어댑터의 결찰을 통해 제조된다.
PTA에서 사용되는 프라이머의 비상보적 부분은 증폭된 서열을 추가로 조작 및/또는 분석하는 데 사용할 수 있는 서열을 포함할 수 있다. 그러한 서열의 예는 "검출 태그"이다. 검출 태그는 검출 프로브와 상보적인 서열을 가지며 이들의 동족 검출 프로브를 사용하여 검출된다. 프라이머 상에는 1, 2, 3, 4개 또는 4개 초과의 검출 태그가 있을 수 있다. 프라이머의 크기를 제외하고 프라이머에 존재할 수 있는 검출 태그의 수에 근본적인 제한은 없다. 일부 경우에, 프라이머 상에 단일 검출 태그가 존재한다. 일부 경우에, 프라이머 상에 2개의 검출 태그가 존재한다. 여러 개의 검출 태그가 존재하는 경우, 이들은 동일한 서열을 가질 수 있거나 서로 상이한 서열을 가질 수 있으며, 각각의 상이한 서열은 상이한 검출 프로브에 상보적이다. 일부 경우에, 여러 검출 태그는 동일한 서열을 갖는다. 일부 경우에, 여러 검출 태그는 상이한 서열을 갖는다.
프라이머의 비상보적 부분에 포함될 수 있는 서열의 또 다른 예는 조직 섹션에서의 위치와 같은 앰플리콘의 다른 세부 정보를 코딩할 수 있는 "주소 태그"이다. 일부 경우에, 세포 바코드는 주소 태그를 포함한다. 주소 태그는 주소 프로브에 상보적인 서열을 갖는다. 주소 태그는 증폭된 가닥의 말단에 혼입된다. 존재하는 경우, 프라이머 상에 하나 또는 하나 초과의 주소 태그가 존재할 수 있다. 프라이머의 크기를 제외하고 프라이머 상에 존재할 수 있는 주소 태그의 수에 근본적인 제한은 없다. 여러 주소 태그가 존재하는 경우, 이들은 동일한 서열을 가질 수 있거나 서로 상이한 서열을 가질 수 있으며, 각각의 상이한 서열은 상이한 주소 프로브에 상보적이다. 주소 태그 부분은 주소 태그와 주소 프로브 사이에 특이적이고 안정적인 혼성화를 지원하는 임의의 길이일 수 있다. 일부 경우에, 하나 초과의 공급원부터의 핵산은 가변적인 태그 서열을 혼입시킬 수 있다. 이 태그 서열은 최대 100개 뉴클레오티드 길이, 바람직하게는 1 내지 10개 뉴클레오티드 길이, 가장 바람직하게는 4, 5 또는 6개 뉴클레오티드 길이일 수 있으며 뉴클레오티드의 조합을 포함한다. 일부 경우에, 태그 서열은 1-20, 2-15, 3-13, 4-12, 5-12, 또는 1-10개 뉴클레오티드 길이이다. 예를 들어, 6개의 염기쌍이 태그를 형성하기 위해 선택되고 4개의 상이한 뉴클레오티드의 순열이 사용되면, 각각 고유한 6개의 염기 태그를 가진 총 4096개의 핵산 앵커(예를 들어, 헤어핀)를 만들 수 있다.
본원에 기재된 프라이머는 용액에 존재하거나 고체 지지체에 고정될 수 있다. 일부 경우에, 샘플 바코드 및/또는 UMI 서열을 포함하는 프라이머는 고체 지지체에 고정될 수 있다. 고체 지지체는, 예를 들어, 하나 이상의 비드일 수 있다. 일부 경우에, 개별 세포를 식별하기 위해 개별 세포를 고유한 세트의 샘플 바코드 및/또는 UMI 서열을 갖는 하나 이상의 비드와 접촉시킨다. 일부 경우에, 개별 세포 용해물을 식별하기 위해 개별 세포로부터의 용해물을 고유한 세트의 샘플 바코드 및/또는 UMI 서열을 갖는 하나 이상의 비드와 접촉시킨다. 일부 경우에, 개별 세포로부터 추출된 핵산을 식별하기 위해 개별 세포로부터 추출된 핵산을 고유한 세트의 샘플 바코드 및/또는 UMI 서열을 갖는 하나 이상의 비드와 접촉시킨다. 비드는, 예를 들어, 본원에 기재된 액적 작동기를 사용하여, 당해 분야에 알려진 임의의 적합한 방식으로 조작될 수 있다. 비드는, 예를 들어, 마이크로비드, 마이크로입자, 나노비드 및 나노입자를 포함하는 임의의 적합한 크기일 수 있다. 일부 구현예에서, 비드는 자기적으로 반응하고; 다른 구현예에서, 비드는 자기적으로 크게 반응하지 않는다. 적합한 비드의 비제한적인 예는 유세포 분석 마이크로비드, 폴리스티렌 마이크로입자 및 나노입자, 기능화된 폴리스티렌 마이크로입자 및 나노입자, 코팅된 폴리스티렌 마이크로입자 및 나노입자, 실리카 마이크로비드, 형광 마이크로스피어 및 나노스피어, 기능화된 형광 마이크로스피어 및 나노스피어, 코팅된 형광 마이크로스피어 및 나노스피어, 색상 염색된 마이크로입자 및 나노입자, 자성 마이크로입자 및 나노입자, 초상자성 마이크로입자 및 나노입자(예를 들어, Invitrogen Group(미국 캘리포니아주 칼스배드 소재)로부터 구입할 수 있는 DYNABEADS®), 형광 마이크로입자 및 나노입자, 코팅된 자성 마이크로입자 및 나노입자, 강자성 마이크로입자 및 나노입자, 코팅된 강자성 마이크로입자 및 나노입자, 및 미국 특허 출원 공개 번호 US20050260686, US20030132538, US20050118574, 20050277197, 20060159962에 기재된 것들을 포함한다. 비드는 항체, 단백질 또는 항원, DNA/RNA 프로브 또는 원하는 표적에 대한 친화성을 가진 임의의 다른 분자와 미리 결합될 수 있다. 일부 구현예에서, 샘플 바코드 및/또는 UMI 서열을 보유하는 프라이머는 용액에 있을 수 있다. 특정 구현예에서, 복수의 액적이 제공될 수 있으며, 여기서 복수의 각 액적은 액적에 고유한 샘플 바코드 및 분자에 고유한 UMI를 보유하여 UMI가 액적 집합 내에서 여러 번 반복되도록 한다. 일부 구현예에서, 개별 세포를 식별하기 위해 개별 세포를 고유한 세트의 샘플 바코드 및/또는 UMI 서열을 갖는 액적과 접촉시킨다. 일부 구현예에서, 개별 세포 용해물을 식별하기 위해 개별 세포로부터의 용해물을 고유한 세트의 샘플 바코드 및/또는 UMI 서열을 갖는 액적과 접촉시킨다. 일부 구현예에서, 개별 세포로부터 추출된 핵산을 식별하기 위해 개별 세포로부터 추출된 핵산을 샘플 바코드 및/또는 UMI 서열의 고유한 세트를 갖는 액적과 접촉시킨다.
PTA 프라이머는 서열 특이적 또는 무작위 프라이머, 세포 바코드 및/또는 고유한 분자 식별자(UMI)를 포함할 수 있다(예를 들어, 도 10a(선형 프라이머) 및 도 10b(헤어핀 프라이머) 참조). 일부 경우에, 프라이머는 서열 특이적 프라이머를 포함한다. 일부 경우에, 프라이머는 무작위 프라이머를 포함한다. 일부 경우에, 프라이머는 세포 바코드를 포함한다. 일부 경우에, 프라이머는 샘플 바코드를 포함한다. 일부 경우에, 프라이머는 고유한 분자 식별자를 포함한다. 일부 경우에, 프라이머는 2개 이상의 세포 바코드를 포함한다. 그러한 바코드는 일부 경우에 고유한 샘플 공급원 또는 고유한 워크플로우를 식별한다. 그러한 바코드 또는 UMI는 일부 경우에 5, 6, 7, 8, 9, 10, 11, 12, 15, 20, 25, 30, 또는 30개 초과의 염기 길이이다. 프라이머는 일부 경우에 적어도 1000, 10,000, 50,000, 100,000, 250,000, 500,000, 106, 107, 108, 109, 또는 적어도 1010개의 고유한 바코드 또는 UMI를 포함한다. 일부 경우에, 프라이머는 적어도 8, 16, 96, 또는 384개의 고유한 바코드 또는 UMI를 포함한다. 일부 경우에, 표준 어댑터를 이어서 시퀀싱 전에 증폭 산물에 결찰시키고; 시퀀싱 후에, 세포 바코드를 기반으로 먼저 리드를 특정 세포에 할당한다. PTA 방법과 함께 사용될 수 있는 적합한 어댑터는, 예를 들어, Integrated DNA Technologies(IDT)로부터 구입할 수 있는 xGen® 이중 인덱스(Dual Index) UMI 어댑터를 포함한다. 이어서, 각 세포로부터의 리드는 UMI를 사용하여 그룹화되고 동일한 UMI를 사용하는 리드는 컨센서스 리드로 정리될 수 있다. 세포 바코드를 사용하면 나중에 세포 바코드로 세포를 식별할 수 있으므로 라이브러리 제조 전에 모든 세포를 풀링할 수 있다. 일부 경우에, UMI를 사용하여 컨센서스 리드를 형성하면 PCR 편향을 교정하여 카피 수 변이(CNV: copy number variation) 검출을 개선한다(도 11a 및 11b). 또한, 동일한 분자로부터 고정된 비율의 리드가 각 위치에서 동일한 염기 변화가 검출될 것을 요구함으로써 시퀀싱 오류를 교정할 수 있다. 이 접근 방식은 CNV 검출을 개선하고 벌크 샘플에서 시퀀싱 오류를 교정하는 데 사용되었다. 일부 경우에, UMI는 본원에 기재된 방법과 함께 사용되며, 예를 들어, 미국 특허 번호 8,835,358은 무작위로 증폭 가능한 바코드를 부착한 후 디지털 카운팅 원리를 개시한다. Shimitt 등 및 Fan 등은 시퀀싱 오류를 교정하는 유사한 방법을 개시한다. 일부 경우에, 라이브러리는 프라이머를 사용하여 시퀀싱을 위해 생성된다. 일부 경우에, 라이브러리는 200-700개 염기, 100-1000, 300-800, 300-550, 300-700, 또는 200-800개 염기 길이의 단편을 포함한다. 일부 경우에, 라이브러리는 적어도 50, 100, 150, 200, 300, 500, 600, 700, 800, 또는 적어도 1000개 염기 길이의 단편을 포함한다. 일부 경우에, 라이브러리는 약 50, 100, 150, 200, 300, 500, 600, 700, 800, 또는 약 1000개 염기 길이의 단편을 포함한다.
본원에 기재된 방법은 샘플 또는 주형에 대해 수행되는 단계를 포함한 추가 단계를 추가로 포함할 수 있다. 일부 경우에, 그러한 샘플 또는 주형은 PTA 이전에 하나 이상의 단계를 거친다. 일부 경우에, 세포를 포함하는 샘플은 전처리 단계를 거친다. 예를 들어, 세포는 동결-해동, Triton X-100, Tween 20, 및 프로테이나아제 K의 조합을 사용하여 염색질 접근성을 증가시키기 위해 용해 및 단백질 분해를 거친다. 다른 용해 전략도 본원에 기재된 방법을 실행하는 데 적합하다. 그러한 전략은 세제 및/또는 리소자임 및/또는 프로테아제 처리의 다른 조합 및/또는 초음파 처리와 같은 세포의 물리적 파괴를 이용한 용해, 및/또는 알칼리 용해 및/또는 저장성(hypotonic) 용해를 제한 없이 포함한다. 일부 경우에, 1차 주형 또는 표적 분자(들)는 전처리 단계를 거친다. 일부 경우에서, 1차 주형 (또는 표적)은 수산화나트륨을 사용하여 변성된 다음 용액의 중화가 뒤따른다. 다른 변성 전략도 본원에 기재된 방법을 실행하는데 적합할 수 있다. 그러한 전략은 알칼리 용해와 다른 염기성 용액의 조합, 샘플의 온도 증가 및/또는 샘플의 염 농도 변경, 용매 또는 오일과 같은 첨가제의 추가, 기타 변형, 또는 이들의 조합을 제한 없이 포함할 수 있다. 일부 경우에, 추가 단계는 샘플, 주형 또는 앰플리콘을 크기별로 분류, 여과, 또는 단리하는 단계를 포함한다. 일부 경우에, 세포는 기계적(예를 들어, 고압 균질화기, 비드 밀링) 또는 비기계적(물리적, 화학적 또는 생물학적)으로 용해된다. 일부 경우에, 물리적 용해 방법은 가열, 삼투압 충격 및/또는 공동화를 포함한다. 일부 경우에, 화학적 용해가 알칼리 및/또는 세제를 포함한다. 일부 경우에, 생물학적 용해가 효소의 사용을 포함한다. 용해 방법의 조합은 또한 본원에 기재된 방법과 호환된다. 용해 효소의 비제한적인 예는 재조합 리소자임, 세린 프로테아제 및 박테리아 리신을 포함한다. 일부 경우에, 효소에 의한 용해는 리소자임, 리소스타핀, 자이몰라제, 셀룰로오스, 프로테아제 또는 글리카나제의 사용을 포함한다. 예를 들어, 본원에 기재된 방법으로 증폭한 후, 앰플리콘 라이브러리는 원하는 길이를 갖는 앰플리콘에 대해 농축된다. 일부 경우에, 앰플리콘 라이브러리는 50-2000, 25-1000, 50-1000, 75-2000, 100-3000, 150-500, 75-250, 170-500, 100-500, 또는 75-2000개 염기 길이를 갖는 앰플리콘에 대해 농축된다. 일부 경우에, 앰플리콘 라이브러리는 75, 100, 150, 200, 500, 750, 1000, 2000, 5000개 이하, 또는 10,000개 이하의 염기 길이를 갖는 앰플리콘에 대해 농축된다. 일부 경우에, 앰플리콘 라이브러리는 적어도 25, 50, 75, 100, 150, 200, 500, 750, 1000, 또는 적어도 2000개 염기 길이를 갖는 앰플리콘에 대해 농축된다.
본원에 기재된 방법 및 조성물은 완충액 또는 다른 제형을 포함할 수 있다. 일부 경우에, 그러한 완충액은 PTA, RT 또는 본원에 기재된 다른 방법에 사용된다. 그러한 완충액은 일부 경우에 계면 활성제/세제 또는 변성제(Tween-20, DMSO, DMF, 소수성 기를 포함하는 페길화 중합체, 또는 기타 계면 활성제), 염(인산칼륨 또는 인산나트륨(일염기 또는 이염기), 염화나트륨, 염화칼륨, 트리스HCl, 염화마그네슘 또는 황산마그네슘, 암모늄염, 예컨대 인산염, 질산염 또는 황산염, EDTA), 환원제(DTT, THP, DTE, 베타-머캅토 에탄올, TCEP, 또는 기타 환원제) 또는 기타 성분(글리세롤, PEG와 같은 친수성 중합체)을 포함한다. 일부 경우에, 완충액은 폴리머라제, 가닥 치환 인자, 종결자, 또는 본원에 기재된 다른 반응 성분과 같은 성분과 함께 사용된다. 일부 경우에, 완충액은 폴리머라제, 가닥 치환 인자, 종결자, 또는 본원에 기재된 다른 반응 성분과 같은 성분과 함께 사용된다. 완충액은 하나 이상의 크라우딩 제제(crowding agent)를 포함할 수 있다. 일부 경우에, 크라우딩 시약을 중합체를 포함한다. 일부 경우에, 크라우딩 시약은 폴리올과 같은 중합체를 포함한다. 일부 경우에, 크라우딩 시약은 폴리에틸렌 글리콜 중합체(PEG)를 포함한다. 일부 경우에, 크라우딩 시약은 폴리사카라이드를 포함한다. 제한 없이, 크라우딩 시약의 예는 피콜(예를 들어, 피콜 PM 400, 피콜 PM 70, 또는 기타 분자량 피콜), PEG(예를 들어, PEG1000, PEG 2000, PEG4000, PEG6000, PEG8000, 또는 기타 분자량 PEG), 덱스트란(덱스트란 6, 덱스트란 10, 덱스트란 40, 덱스트란 70, 덱스트란 6000, 덱스트란 138k, 또는 기타 분자량 덱스트란)을 포함한다.
본원에 기재된 방법에 따라 증폭된 핵산 분자는 당업자에게 알려진 방법을 사용하여 시퀀싱되고 분석될 수 있다. 일부 경우에 사용되는 시퀀싱 방법의 비제한적인 예는, 예를 들어, 혼성화에 의한 시퀀싱(SBH: sequencing by hybridization), 결찰에 의한 시퀀싱(SBL: sequencing by ligation)(Shendure et al. (2005) Science 309:1728), 정량적 증분 형광 뉴클레오티드 첨가 시퀀싱(QIFNAS: quantitative incremental fluorescent nucleotide addition sequencing), 단계적 결찰 및 절단, 형광 공명 에너지 전달(FRET: fluorescence resonance energy transfer), 분자 비콘(molecular beacons), TaqMan 리포터 프로브 분해, 파이로시퀀싱, 형광 동소 시퀀싱(FISSEQ: fluorescent in situ sequencing), FISSEQ 비드(미국 특허 번호 7,425,431), 워블 시퀀싱(국제 특허 출원 공개 번호 WO2006/073504), 멀티플렉스 시퀀싱(미국 특허 출원 공개 번호 US2008/0269068; Porreca et al., 2007, Nat. Methods 4:931), 중합 콜로니(POLONY: polymerized colony) 시퀀싱(미국 특허 번호 6,432,360, 6,485,944 및 6,511,803, 및 국제 특허 출원 공개 번호 WO2005/082098), 나노그리드 롤링 서클 시퀀싱(ROLONY: rolling circle sequencing)(미국 특허 번호 9,624,538), 대립유전자 특이적 올리고 결찰 검정(예를 들어, 올리고 결찰 검정(OLA: oligo ligation assay), 결찰된 선형 프로브 및 회전환 증폭(RCA: rolling circle amplification) 판독을 이용한 단일 주형 분자 OLA, 결찰된 패드록(padlock) 프로브, 및/또는 결찰된 원형 패드록 프로브 및 회전환 증폭(RCA) 판독을 이용한 단일 주형 분자 OLA), 예를 들어, Roche 454, Illumina Solexa, AB-SOLiD, Helicos, Polonator 플랫폼 등을 이용한 방법과 같은 고처리량 시퀀싱 방법, 및 광 기반 시퀀싱 기술(Landegren et al. (1998) Genome Res. 8:769-76; Kwok (2000) Pharmacogenomics 1:95-100; 및 Shi (2001) Clin. Chem.47:164-172)을 포함한다. 일부 경우에, 증폭된 핵산 분자는 샷건 시퀀싱된다. 일부 경우에, 시퀀싱 라이브러리의 시퀀싱은 단일-분자 실시간(SMRT) 시퀀싱, 폴로니 시퀀싱, 결찰에 의한 시퀀싱, 가역적 종결자 시퀀싱, 양성자 검출 시퀀싱, 이온 반도체 시퀀싱, 나노포어 시퀀싱, 전자 시퀀싱, 파이로시퀀싱, 맥삼-길버트(Maxam-Gilbert) 시퀀싱, 사슬 종결(예를 들어, 생거(Sanger)) 시퀀싱, +S 시퀀싱, 또는 합성에 의한 시퀀싱(어레이/콜로니 기반 또는 나노볼 기반)을 포함하지만 이에 제한되지 않는 임의의 적절한 시퀀싱 기술로 수행된다.
본원에 기재된 방법(예를 들어, PTA 또는 RNAseq)을 사용하여 생성된 시퀀싱 라이브러리를 시퀀싱하여 원하는 수의 시퀀싱 리드를 얻을 수 있다. 일부 경우에, 라이브러리는 단일 세포 또는 단일 세포를 포함하는 샘플(단독 또는 멀티오믹스 워크플로의 일부)로부터 생성된다. 일부 경우에, 라이브러리를 시퀀싱하여 적어도 10만, 20만, 40만, 50만, 70만, 80만, 90만, 100만, 110만, 120만, 150만, 200만, 500만, 또는 적어도 1000만 리드를 얻는다. 일부 경우에, 라이브러리를 시퀀싱하여 10만, 20만, 40만, 50만, 70만, 80만, 90만, 100만, 110만, 120만, 150만, 200만, 500만 이하, 또는 1000만 이하 리드를 수득한다. 일부 경우에, 라이브러리를 시퀀싱하여 약 10만, 20만, 40만, 50만, 70만, 80만, 90만, 100만, 110만, 120만, 150만, 200만, 500만, 또는 약 1000만 리드를 얻는다. 일부 경우에, 라이브러리를 시퀀싱하여 샘플당 10만-1000만, 10만-500만, 10만-100만, 20만-100만, 30만-150만, 50만-100만, 100만-500만, 또는 50만-500만 리드를 얻는다. 일부 경우에, 리드 수가 게놈의 크기에 따라 달라진다. 일부 경우에, 박테리아 게놈을 포함하는 샘플을 시퀀싱하여 50만-100만 리드를 얻는다. 일부 경우에, 라이브러리를 시퀀싱하여 적어도 2백만, 4백만, 1천만, 2천만, 5천만, 1억, 2억, 3억, 5억, 7억, 또는 적어도 9억 리드를 얻는다. 일부 경우에, 라이브러리를 시퀀싱하여 2백만, 4백만, 1천만, 2천만, 5천만, 1억, 2억, 3억, 5억, 7억 이하, 또는 9억 이하 리드를 얻는다. 일부 경우에, 라이브러리를 시퀀싱하여 약 2백만, 4백만, 1천만, 2천만, 5천만, 1억, 2억, 3억, 5억, 7억, 또는 약 9억 리드를 얻는다. 일부 경우에서, 포유동물 게놈을 포함하는 샘플은 5억-6억 리드를 얻는다. 일부 경우에, 시퀀싱 라이브러리(cDNA 라이브러리 또는 게놈 라이브러리)의 유형이 시퀀싱 동안 식별된다. 일부 경우에, cDNA 라이브러리 및 게놈 라이브러리는 고유한 바코드로 시퀀싱 동안 식별된다.
폴리머라제 매개 증폭 반응과 관련하여 사용될 때 용어 "주기"는 이중 가닥 핵산(예를 들어, 앰플리콘으로부터의 주형, 또는 이중 가닥 주형, 변성)의 적어도 일부의 해리 단계를 설명하기 위해 본원에서 사용된다. 프라이머의 적어도 일부를 주형에 혼성화(어닐링)하고 프라이머를 확장하여 앰플리콘을 생성한다. 일부 경우에, 온도가 증폭 주기 동안 일정하게 유지된다(예를 들어, 등온 반응). 일부 경우에, 주기의 수가 생산된 앰플리콘의 수와 직접적으로 연관이 있다. 일부 경우에, 등온 반응을 위한 주기 수는 반응이 진행되도록 허용되는 시간의 양에 의해 제어된다.
방법 및 적용
단일 세포와 같은 멀티오믹 분석 PTA 방법을 사용하여 세포에서 돌연변이를 확인하는 방법이 본원에 기재되어 있다. 일부 경우에 PTA 방법의 사용으로 알려진 방법, 예를 들어, MDA에 비해 개선을 유도한다. 일부 경우에 PTA는 MDA 방법보다 위양성 및 위음성 변이체 호출 비율이 낮다. 일부 경우에, 게놈, 예컨대 NA12878 platinum 게놈을 사용하여 PTA의 더 큰 게놈 커버리지와 균일성이 더 낮은 위음성 변이체 호출 비율을 유도하는 지의 여부를 결정한다. 이론에 구속하고자 하는 것은 아니지만 PTA에서 오류 전파가 없으면 위양성 변이체 호출 비율이 감소한다고 결정할 수 있다. 두 가지 방법을 사용한 대립유전자 간의 증폭 균형은 일부 경우에, 알려진 양성 유전자좌에서 이형접합 돌연변이 호출의 대립유전자 빈도를 비교하여 평가된다. 일부 경우에, PTA를 사용하여 생성된 앰플리콘 라이브러리는 PCR에 의해 추가로 증폭된다. 일부 경우에, PTA는 RNAseq, 메틸롬 분석 또는 본원 기재된 다른 방법과 같은 추가 분석 방법과 함께 워크플로우에서 사용된다.
일부 경우에 본원에 기재된 방법을 사용하여 분석된 세포는 종양 세포를 포함한다. 예를 들어, 순환하는 종양 세포는 혈액, 골수, 소변, 타액, 뇌척수액, 흉수, 심낭액, 복수, 또는 안방수와 같은, 그러나 이에 제한되지 않는, 환자로부터 채취한 체액으로부터 단리될 수 있다. 이어서, 세포는 본원에 기재된 방법(예를 들어, PTA) 및 시퀀싱을 거쳐 각 세포에서 돌연변이 부하 및 돌연변이 조합을 결정한다. 이러한 데이터는 일부 경우에 특정 질환의 진단에 또는 치료 반응을 예측하는 도구로 사용된다. 유사하게, 일부 경우에 악성 가능성이 알려지지 않은 세포가 일부 경우에 혈액, 골수, 소변, 타액, 뇌척수액, 흉수, 심낭액, 복수, 안방수, 포배강액, 또는 배양시 세포를 둘러싼 수집 배지와 같은, 그러나 이에 제한되지 않는, 환자로부터 채취한 체액으로부터 단리된다. 일부 경우에, 배아 세포를 둘러싼 수집 배지로부터 샘플을 얻는다. 본원에 기재된 방법 및 시퀀싱을 이용한 후, 그러한 방법을 추가로 사용하여 각 세포에서 돌연변이 부하 및 돌연변이 조합을 결정한다. 이러한 데이터는 일부 경우에 특정 질환의 진단에 사용되거나 전암 상태에서 악성 종양으로의 진행을 예측하는 도구로 사용된다. 일부 경우에, 세포는 원발성 종양 샘플로부터 단리될 수 있다. 이어서, 세포는 PTA 및 시퀀싱을 거쳐 각 세포에서 돌연변이 부하 및 돌연변이 조합을 결정할 수 있다. 이러한 데이터는 특정 질환의 진단에 사용되거나 환자의 악성 종양이 사용 가능한 항암제에 내성이 있을 가능성을 예측하는 도구로 사용될 수 있다. 샘플을 상이한 화학요법제에 노출시킴으로써, 다수 클론과 소수 클론이 알려진 "유발 돌연변이"의 존재와 반드시 연관되지는 않은 특정 약물에 대해 차등적인 민감도를 갖는 것으로 밝혀졌으며, 이는 클론 집단 내의 돌연변이 조합이 특정 화학요법제에 대한 민감도를 결정한다는 것을 시사한다. 이론에 구속하고자 하는 것은 아니지만, 이러한 발견은 아직 확장되고 클론으로 진화되지 않은 전암 병변이 그의 게놈 변형 수가 증가하면 치료에 대해 내성적일 가능성을 더 크게 할 수 있는 것으로 확인된다면 악성 종양을 제거하기가 더 쉬울 수 있음을 시사한다. 문헌(Ma et al., 2018, "Pan-cancer genome and transcriptome analyses of 1,699 pediatric leukemias and solid tumors.")을 참조한다. 단일 세포 유전체학 프로토콜은 일부 경우에 환자 샘플로부터 단리된 정상 세포와 악성 세포의 혼합물 내에서 단일 암세포 또는 클론형에서 체세포 유전 변이체의 조합을 검출하는 데 사용된다. 이 기술은 일부 경우에 시험관 내 및/또는 환자 내에서 둘 모두 약물에 노출된 후 양성 선택을 받는 클론형을 확인하기 위해 추가로 활용된다. 도 6a에 나타낸 바와 같이, 화학요법에 노출된 생존 클론을 진단시 확인된 클론과 비교하여 특정 약물에 대한 내성을 문서화하는 암 클론형 목록을 만들 수 있다. 일부 경우에, PTA 방법은 기존 또는 신규 약물, 및 이들 조합에 대한 다중 클론형으로 구성된 샘플에서 특정 클론의 민감도를 검출하고, 여기서 상기 방법은 약물에 대한 특정 클론의 민감도를 검출할 수 있다. 일부 경우에, 이 접근법은 모든 암 클론의 민감도를 한 번의 측정으로 함께 고려하는 현재의 약물 민감도 측정으로는 검출되지 않을 수 있는 특정 클론에 대한 약물의 효능을 보여준다. 주어진 환자의 암에서 암 클론형을 검출하기 위해 본원에 기재된 PTA가 진단시 수집된 환자 샘플에 적용되면, 약물 민감도 카탈로그를 사용하여 해당 클론을 찾아서 종양 전문의에게 약물 또는 약물 조합이 효과가 없으며 어떤 약물 또는 약물 조합이 해당 환자의 암에 대해 가장 효과적일 가능성이 있는지에 대해 정보를 준다. PTA는 세포 군을 포함하는 샘플의 분석에 사용될 수 있다. 일부 경우에, 샘플은 뉴런 또는 신경교 세포를 포함한다. 일부 경우에, 샘플은 핵을 포함한다.
환경 인자의 돌연변이 유발성과 조합하여 유전자 발현 변경을 측정하는 방법이 본원에 기재되어 있다. 예를 들어, 세포(단일 또는 집단)는 잠재적인 환경 조건에 노출된다. 예를 들어, 기관(간, 췌장, 폐, 결장, 갑상선, 또는 기타 기관), 조직(피부, 또는 기타 조직), 혈액, 또는 기타 생물학적 공급원에서 유래한 세포가 일부 경우에 본 방법과 함께 사용된다. 일부 경우에, 환경 조건은 열, 광(예를 들어, 자외선), 방사선, 화학 물질, 또는 이들의 조합을 포함한다. 환경 조건에 어느 정도, 일부 경우에 몇 분, 몇 시간, 며칠 또는 그 이상 노출된 후 단일 세포를 단리하고 PTA 방법을 적용한다. 일부 경우에, 분자 바코드와 고유한 분자 식별자를 사용하여 샘플을 태그한다. 샘플을 시퀀싱한 다음, 분석하여 유전자 발현 변경 및/또는 환경 조건에 대한 노출로 인한 돌연변이 결과를 확인한다. 일부 경우에, 그러한 돌연변이는 알려진 비돌연변이 유발성 물질, 비히클/용매, 또는 환경 조건의 결여와 같은 대조군 환경 조건과 비교된다. 일부 경우에, 그러한 분석은 환경 조건에 의해 야기된 총 돌연변이 수뿐만 아니라 그러한 돌연변이의 위치와 특성도 제공한다. 패턴은 일부 경우에 데이터로부터 확인되고, 질환 또는 병태의 진단에 사용될 수 있다. 일부 경우에, 패턴을 사용하여 미래의 질환 상태 또는 병태를 예측한다. 일부 경우에, 본원에 기재된 방법은, 예를 들어, 잠재적 돌연변이 유발원 또는 기형 유발 물질과 같은 환경 제제에 노출된 후 세포에서 돌연변이 부하, 위치, 및 패턴을 측정한다. 일부 경우에, 이 접근법은 질환의 발생에 기여할 수 있는 돌연변이를 유도할 수 있는 잠재력을 포함하여 주어진 제제의 안전성을 평가하는 데 사용된다. 예를 들어, 특정 농도의 특정 제제에 노출된 후 특정 세포 유형에 대한 제제의 발암성 또는 기형발생(teratogenicity)을 예측하는 데 이 방법을 사용할 수 있다.
(예를 들어, CRISPR 기술을 사용하여) 게놈 편집을 거친 동물, 식물 또는 미생물 세포에서 돌연변이와 조합하여 유전자 발현 변경을 확인하는 방법이 본원에 기재되어 있다. 일부 경우에, 그러한 세포는 단리되고 PTA 및 시퀀싱을 거쳐 각 세포에서 돌연변이 부하 및 돌연변이 조합을 결정할 수 있다. 일부 경우에, 게놈 편집 프로토콜로부터 유도되는 세포당 돌연변이 비율 및 돌연변이 위치는 주어진 게놈 편집 방법의 안전성을 평가하는 데 사용된다.
유도된 만능 줄기세포의 이식, 조작되지 않은 조혈 또는 기타 세포의 이식, 또는 게놈 편집을 거친 조혈 또는 기타 세포의 이식과 같은, 그러나 이에 제한되지 않는, 세포 치료에 사용되는 세포에서 돌연변이와 조합하여 유전자 발현 변경을 결정하는 방법이 본원에 기재되어 있다. 이어서, 세포는 PTA 및 시퀀싱을 거쳐 각 세포에서 돌연변이 부하 및 돌연변이 조합을 결정할 수 있다. 세포 요법 산물에서 세포당 돌연변이 비율 및 돌연변이 위치를 사용하여 산물의 안전성과 잠재적 효능을 평가할 수 있다.
PTA 방법과 함께 사용하는 세포는 배아 세포와 같은 태아 세포일 수 있다. 일부 구현예에서, PTA는 비침습성 착상전 유전자 검사(NIPGT)와 함께 사용된다. 추가의 구현예에서, 세포는 시험관내 수정에 의해 생성된 할구로부터 단리될 수 있다. 이어서, 세포는 PTA 및 시퀀싱을 거쳐 각 세포에서 잠재적으로 질환에 걸리기 쉬운 유전적 변이체의 부하와 조합을 결정할 수 있다. 이어서, 세포의 돌연변이 프로파일과 조합된 유전자 발현 변경을 사용하여 착상 전에 할구의 유전적 소인을 특정 질환으로 추정할 수 있다. 일부 경우에, 배양 배아는 낮은 통과 게놈 시퀀싱을 사용하여 배아의 건강을 평가하는 데 사용되는 핵산을 방출한다. 일부 경우에, 배아는 동결-해동된다. 일부 경우에, 핵산은 배반포 배양 조절된 배지(BCCM), 포배강액(BF), 또는 이들의 조합으로부터 얻어진다. 일부 경우에, 태아 세포의 PTA 분석은 태아 이수성과 같은 염색체 이상을 감지하는 데 사용된다. 일부 경우에, PTA는 다운 증후군 또는 파타우 증후군과 같은 질환을 감지하는 데 사용된다. 일부 경우에, 동결된 배반포는 분석을 위한 핵산(예를 들어, 배양 배지, BF 또는 세포 생검)을 얻기 전에 일정 기간 동안 해동되고 배양된다. 일부 경우에, 배반포는 분석을 위한 핵산을 얻기 전에 4, 6, 8, 12, 16, 24, 36, 48시간 이하 또는 64시간 이하 동안 배양된다.
또 다른 구현예에서, 미생물 세포(예를 들어, 박테리아, 진균, 원생동물)는 식물 또는 동물로부터(예를 들어, 미생물총 샘플[예를 들어, GI 미생물총, 피부 미생물총 등]로부터 또는 예를 들어, 혈액, 골수, 소변, 타액, 뇌척수액, 흉수, 심낭액, 복수, 또는 안방수와 같은 체액으로부터) 단리될 수 있다. 또한, 미생물 세포는 정맥내 카테터, 요도 카테터, 뇌척수 션트, 인공 판막, 인공 관절, 또는 기관내 튜브와 같은, 그러나 이에 제한되지 않는, 유치 의료 장치로부터 단리될 수 있다. 이어서, 세포는 PTA 및 시퀀싱을 거쳐 특정 미생물의 정체를 결정하고 특정 항균제에 대한 반응 (또는 내성)을 예측하는 미생물 유전적 변이체의 존재를 검출할 수 있다. 이러한 데이터는 특정 감염성 질환의 진단에 그리고/또는 치료 반응을 예측하는 도구로 사용될 수 있다.
본원에 기재된 PTA 방법을 사용하여 짧은 핵산을 포함하는 샘플로부터 앰플리콘 라이브러리를 생성하는 방법이 본원에 기재되어 있다. 일부 경우에, PTA는 더 짧은 핵산의 증폭의 충실도 및 균일성을 개선한다. 일부 경우에, 핵산은 2000개 이하의 염기 길이이다. 일부 경우에, 핵산은 1000개 이하의 염기 길이이다. 일부 경우에, 핵산은 500개 이하의 염기 길이이다. 일부 경우에, 핵산은 200, 400, 750, 1000, 2000 또는 5000개 이하의 염기 길이이다. 일부 경우에, 짧은 핵산 단편을 포함하는 샘플은 고대 DNA(수백, 수천, 수백만, 또는 심지어 수십억 년), FFPE(포르말린 고정 파라핀 포매된) 샘플, 무세포 DNA, 또는 짧은 핵산을 포함하는 다른 샘플을 포함하지만 이에 제한되지 않는다.
구현예
표적 핵산 분자를 증폭하는 방법이 본원에 기재되어 있으며, 상기 방법은 a) 표적 핵산 분자를 포함하는 샘플을 하나 이상의 증폭 프라이머, 핵산 폴리머라제, 및 폴리머라제에 의한 핵산 복제를 종결시키는 하나 이상의 종결자 뉴클레오티드를 포함하는 뉴클레오티드 혼합물과 접촉시키는 단계, 및 b) 표적 핵산 분자의 복제를 촉진하는 조건 하에 샘플을 인큐베이션하여 복수의 종결된 증폭 생성물을 수득하는 단계로서, 복제는 가닥 치환 복제에 의해 진행되는 단계를 포함한다. 임의의 상기 방법의 한 구현예에서, 방법은 복수의 종결된 증폭 산물로부터 약 50개 뉴클레오티드 길이와 약 2000개 뉴클레오티드 길이 사이인 산물을 단리하는 단계를 추가로 포함한다. 임의의 상기 방법의 한 구현예에서, 방법은 약 400개 뉴클레오티드 길이와 약 600개 뉴클레오티드 길이 사이인 산물을 복수의 종결된 증폭 산물로부터 단리하는 단계를 추가로 포함한다. 임의의 상기 방법의 한 구현예에서, 방법은 c) 말단 및 A-테일링을 복구하는 단계, 및 d) 단계 (c)에서 얻은 분자를 어댑터로 결찰하여 증폭 산물의 라이브러리를 생성하는 단계를 추가로 포함한다. 일부 구현예에서, 방법은 종결된 증폭 산물로부터 종결자 뉴클레오티드의 제거를 추가로 포함한다. 임의의 상기 방법의 한 구현예에서, 방법은 증폭 산물을 시퀀싱하는 단계를 추가로 포함한다. 임의의 상기 방법의 한 구현예에서, 증폭은 실질적으로 등온 조건 하에 수행된다. 임의의 상기 방법의 한 구현예에서, 핵산 폴리머라제는 DNA 폴리머라제이다.
임의의 상기 방법의 한 구현예에서, DNA 폴리머라제는 가닥 치환 DNA 폴리머라제이다. 임의의 상기 방법의 한 구현예에서, 핵산 폴리머라제는 박테리오파지 phi29(Φ29) 폴리머라제, 유전자 변형된 phi29(Φ29) DNA 폴리머라제, 클레나우 단편 DNA 폴리머라제 I, 파지 M2 DNA 폴리머라제, 파지 phiPRD1 DNA 폴리머라제, Bst DNA 폴리머라제, Bst 큰 단편 DNA 폴리머라제, 엑소(-) Bst 폴리머라제, 엑소(-)Bca DNA 폴리머라제, Bsu DNA 폴리머라제, 벤트R DNA 폴리머라제, 벤트R (엑소-) DNA 폴리머라제, 딥 벤트 DNA 폴리머라제, 딥 벤트 (엑소-) DNA 폴리머라제, IsoPol DNA 폴리머라제, DNA 폴리머라제 I, 써미네이터 DNA 폴리머라제, T5 DNA 폴리머라제, 시쿼나제, T7 DNA 폴리머라제, T7-시쿼나제, 및 T4 DNA 폴리머라제로부터 선택된다. 임의의 상기 방법의 한 구현예에서, 핵산 폴리머라제는 3'->5' 엑소뉴클레아제 활성을 갖고 종결자 뉴클레오티드는 그러한 3'->5' 엑소뉴클레아제 활성을 억제한다. 일 특정 구현예에서, 종결자 뉴클레오티드는 알파 기가 변형된 뉴클레오티드(예를 들어, 포스포로티오에이트 결합을 생성하는 알파-티오 디데옥시뉴클레오티드), C3 스페이서 뉴클레오티드, 잠금 핵산(LNA), 역위된 핵산, 2' 플루오로 뉴클레오티드, 3' 인산화 뉴클레오티드, 2'-O-메틸 변형된 뉴클레오티드, 및 트랜스 핵산으로부터 선택된다. 임의의 상기 방법의 한 구현예에서, 핵산 폴리머라제는 3'->5' 엑소뉴클레아제 활성을 갖지 않는다. 일 특정 구현예에서, 폴리머라제는 Bst DNA 폴리머라제, 엑소(-) Bst 폴리머라제, 엑소(-) Bca DNA 폴리머라제, Bsu DNA 폴리머라제, 벤트R (엑소-) DNA 폴리머라제, 딥 벤트 (엑소-) DNA 폴리머라제, 클레나우 단편 (엑소-) DNA 폴리머라제, 및 써미네이터 DNA 폴리머라제로부터 선택된다. 일 특정 구현예에서, 종결자 뉴클레오티드는 데옥시리보오스의 3' 탄소의 r 기의 변형을 포함한다. 일 특정 구현예에서, 종결자 뉴클레오티드는 3' 차단된 가역적 종결자 포함 뉴클레오티드, 3' 비차단된 가역적 종결자 포함 뉴클레오티드, 데옥시뉴클레오티드의 2' 변형을 포함하는 종결자, 데옥시뉴클레오티드의 질소성 염기에 변형을 포함하는 종결자, 및 이들의 조합으로부터 선택된다. 일 특정 구현예에서, 종결자 뉴클레오티드는 디데옥시뉴클레오티드, 역위된 디데옥시뉴클레오티드, 3' 비오티닐화 뉴클레오티드, 3' 아미노 뉴클레오티드, 3'-인산화 뉴클레오티드, 3'-O-메틸 뉴클레오티드, 3' C3 스페이서 뉴클레오티드를 포함한 3' 탄소 스페이서 뉴클레오티드, 3' C18 뉴클레오티드, 3' 헥산디올 스페이서 뉴클레오티드, 아사이클로뉴클레오티드, 및 이들의 조합으로부터 선택된다. 임의의 상기 방법의 한 구현예에서, 증폭 프라이머는 4개 뉴클레오티드 길이와 70개 뉴클레오티드 길이 사이이다. 임의의 상기 방법의 한 구현예에서, 증폭 산물은 약 50개 뉴클레오티드 길이와 약 2000개 뉴클레오티드 길이 사이이다. 임의의 상기 방법의 한 구현예에서, 표적 핵산은 DNA(예를 들어, cDNA 또는 게놈 DNA)이다. 임의의 상기 방법의 한 구현예에서, 증폭 프라이머는 무작위 프라이머이다. 임의의 상기 방법의 한 구현예에서, 증폭 프라이머는 바코드를 포함한다. 일 특정 구현예에서, 바코드는 세포 바코드를 포함한다. 일 특정 구현예에서, 바코드는 샘플 바코드를 포함한다. 임의의 상기 방법의 한 구현예에서, 증폭 프라이머는 고유한 분자 식별자(UMI)를 포함한다. 임의의 상기 방법의 한 구현예에서, 방법은 초기 프라이머 어닐링 전에 표적 핵산 또는 게놈 DNA를 변성시키는 단계를 포함한다. 일 특정 구현예에서, 변성은 알칼리 조건 하에 수행된 후 중화된다. 임의의 상기 방법의 한 구현예에서, 샘플, 증폭 프라이머, 핵산 폴리머라제, 및 뉴클레오티드의 혼합물은 미세유체 장치에 포함된다. 임의의 상기 방법의 한 구현예에서, 샘플, 증폭 프라이머, 핵산 폴리머라제, 및 뉴클레오티드의 혼합물은 액적에 포함된다. 임의의 상기 방법의 한 구현예에서, 샘플은 조직(들) 샘플, 세포, 생물학적 유체 샘플(예를 들어, 혈액, 소변, 타액, 림프액, 뇌척수액(CSF), 양수, 흉수, 심낭액, 복수, 안방수), 골수 샘플, 정액 샘플, 생검 샘플, 암 샘플, 종양 샘플, 세포 용해물 샘플, 법의학 샘플, 고고학 샘플, 고생물학 샘플, 감염 샘플, 생산 샘플, 전체 식물, 식물 부분, 미생물총 샘플, 바이러스 제제, 토양 샘플, 해양 샘플, 담수 샘플, 가정 또는 산업 샘플, 및 이들의 조합 및 단리물로부터 선택된다. 임의의 상기 방법의 한 구현예에서, 샘플은 세포(예를 들어, 동물 세포[예를 들어, 인간 세포], 식물 세포, 진균 세포, 박테리아 세포, 및 원생동물 세포)이다. 일 특정 구현예에서, 세포는 복제 전에 용해된다. 일 특정 실시 양태에서, 세포 용해는 단백질 분해가 수반된다. 일 특정 구현예에서, 세포는 착상 전 배아, 줄기 세포, 태아 세포, 종양 세포, 의심성 암 세포, 암 세포, 유전자 편집 절차를 거친 세포, 병원성 유기체로부터의 세포, 법의학 샘플로부터 얻은 세포, 고고학 샘플로부터 얻은 세포, 및 고생물학 샘플로부터 얻은 세포로부터 선택된다. 임의의 상기 방법의 한 구현예에서, 샘플은 착상 전 배아(예를 들어, 할구[예를 들어, 시험관 내 수정에 의해 생성된 8 세포 단계 배아로부터 얻은 할구])로부터의 세포이다. 일 특정 구현예에서, 방법은 배아 세포에서 질병 소인성 생식계열 또는 체세포 변이체의 존재를 결정하는 단계를 추가로 포함한다. 임의의 상기 방법의 한 구현예에서, 샘플은 병원성 유기체(예를 들어, 박테리아, 진균, 원생동물)로부터의 세포이다. 일 특정 구현예에서, 병원성 유기체 세포는 환자로부터 채취한 체액, 미생물총 샘플(예를 들어, GI 미생물총 샘플, 질 미생물총 샘플, 피부 미생물총 등) 또는 유치 의료 장치(예를 들어, 정맥 내 카테터, 요도 카테터, 뇌척수 션트, 인공 판막, 인공 관절, 기관 내 튜브 등)로부터 얻는다. 일 특정 구현예에서, 방법은 병원성 유기체의 정체를 결정하는 단계를 추가로 포함한다. 일 특정 구현예에서, 방법은 치료에 대한 병원성 유기체의 내성의 원인이 되는 유전적 변이체의 존재를 결정하는 단계를 추가로 포함한다. 임의의 상기 방법의 한 구현예에서, 샘플은 종양 세포, 의심성 암 세포, 또는 암 세포이다. 일 특정 구현예에서, 방법은 하나 이상의 진단적 또는 예후적 돌연변이의 존재를 결정하는 단계를 추가로 포함한다. 일 특정 구현예에서, 방법은 치료에 대한 내성의 원인이 되는 생식계열 또는 체세포 변이체의 존재를 결정하는 단계를 추가로 포함한다. 임의의 상기 방법의 한 구현예에서, 샘플은 유전자 편집 절차를 거친 세포이다. 일 특정 구현예에서, 방법은 유전자 편집 과정에 의해 야기되는 계획되지 않은 돌연변이의 존재를 결정하는 단계를 추가로 포함한다. 임의의 상기 방법의 한 구현예에서, 방법은 세포 계통의 이력을 결정하는 단계를 추가로 포함한다. 관련된 양태에서, 본 발명은 저빈도 서열 변이체(예를 들어, 전체 서열의 ≥0.01%를 구성하는 변이체)를 확인하는 임의의 상기 방법의 용도를 제공한다.
관련된 양태에서, 본 발명은 핵산 폴리머라제, 하나 이상의 증폭 프라이머, 하나 이상의 종결자 뉴클레오티드를 포함하는 뉴클레오티드의 혼합물, 및 임의로 사용 지침서를 포함하는 키트를 제공한다. 본 발명의 키트의 일 구현예에서, 핵산 폴리머라제는 가닥 치환 DNA 폴리머라제이다. 본 발명의 키트의 한 구현예에서, 핵산 폴리머라제는 박테리오파지 phi29(Φ29) 폴리머라제, 유전자 변형된 phi29(Φ29) DNA 폴리머라제, 클레나우 단편 DNA 폴리머라제 I, 파지 M2 DNA 폴리머라제, 파지 phiPRD1 DNA 폴리머라제, Bst DNA 폴리머라제, Bst 큰 단편 DNA 폴리머라제, 엑소(-) Bst 폴리머라제, 엑소(-) Bca DNA 폴리머라제, Bsu DNA 폴리머라제, 벤트R DNA 폴리머라제, 벤트R (엑소-) DNA 폴리머라제, 딥 벤트 DNA 폴리머라제, 딥 벤트 (엑소-) DNA 폴리머라제, IsoPol DNA 폴리머라제, DNA 폴리머라제 I, 써미네이터 DNA 폴리머라제, T5 DNA 폴리머라제, 시쿼나제, T7 DNA 폴리머라제, T7-시쿼나제, 및 T4 DNA 폴리머라제로부터 선택된다. 본 발명의 키트의 한 구현예에서, 핵산 폴리머라제는 3'->5' 엑소뉴클레아제 활성을 갖고 종결자 뉴클레오티드는 그러한 3'->5' 엑소뉴클레아제 활성을 억제한다(예를 들어, 알파 기가 변형된 뉴클레오티드[예를 들어, 알파-티오 디데옥시뉴클레오티드], C3 스페이서 뉴클레오티드, 잠금 핵산(LNA), 역위된 핵산, 2' 플루오로 뉴클레오티드, 3' 인산화 뉴클레오티드, 2'-O-메틸 변형된 뉴클레오티드, 트랜스 핵산). 본 발명의 키트의 한 구현예에서, 핵산 폴리머라제는 3'->5' 엑소뉴클레아제 활성을 갖지 않는다(예를 들어, Bst DNA 폴리머라제, 엑소(-) Bst 폴리머라제, 엑소(-) Bca DNA 폴리머라제, Bsu DNA 폴리머라제, 벤트R (엑소-) DNA 폴리머라제, 딥 벤트 (엑소-) DNA 폴리머라제, 클레나우 단편 (엑소-) DNA 폴리머라제, 써미네이터 DNA 폴리머라제). 일 특정 구현예에서, 종결자 뉴클레오티드는 데옥시리보오스의 3' 탄소의 r 기의 변형을 포함한다. 일 특정 구현예에서, 종결자 뉴클레오티드는 3' 차단된 가역성 종결자 포함 뉴클레오티드, 3' 비차단된 가역성 종결자 포함 뉴클레오티드, 데옥시뉴클레오티드의 2' 변형을 포함하는 종결자, 데옥시뉴클레오티드의 질소성 염기에 변형을 포함하는 종결자, 및 이들의 조합으로부터 선택된다. 일 특정 구현예에서, 종결자 뉴클레오티드는 디데옥시뉴클레오티드, 역위된 디데옥시뉴클레오티드, 3' 비오티닐화 뉴클레오티드, 3' 아미노 뉴클레오티드, 3'-인산화 뉴클레오티드, 3'-O-메틸 뉴클레오티드, 3' C3 스페이서 뉴클레오티드를 포함한 3' 탄소 스페이서 뉴클레오티드, 3' C18 뉴클레오티드, 3' 헥산디올 스페이서 뉴클레오티드, 아사이클로뉴클레오티드, 및 이들의 조합으로부터 선택된다.
게놈을 증폭하는 방법이 본원에 기재되어 있으며, 상기 방법은 a) 게놈을 포함하는 샘플을 복수의 증폭 프라이머(예를 들어, 2개 이상의 프라이머), 핵산 폴리머라제, 및 폴리머라제에 의한 핵산 복제를 종결시키는 하나 이상의 종결자 뉴클레오티드를 포함하는 뉴클레오티드의 혼합물과 접촉시키는 단계, 및 b) 게놈의 복제를 촉진하는 조건 하에 샘플을 인큐베이션하여 복수의 종결된 증폭 산물을 얻는 단계로서, 복제는 가닥 치환 복제에 의해 진행되는 단계를 포함한다. 임의의 상기 방법의 한 구현예에서, 방법은 복수의 종결된 증폭 산물로부터 약 50개 뉴클레오티드 길이와 약 2000개 뉴클레오티드 사이인 산물을 단리하는 단계를 추가로 포함한다. 임의의 상기 방법의 한 구현예에서, 방법은 복수의 종결된 증폭 산물로부터 약 400개 뉴클레오티드 길이와 약 600개 뉴클레오티드 길이 사이인 산물을 단리하는 단계를 추가로 포함한다. 임의의 상기 방법의 한 구현예에서, 방법은 c) 말단 및 A-테일링을 복구하는 단계 및 d) 단계 (c)에서 얻은 분자를 어댑터로 결찰시켜 증폭 산물의 라이브러리를 생성하는 단계를 추가로 포함한다. 임의의 상기 방법의 한 구현예에서, 방법은 증폭 산물을 시퀀싱하는 단계를 추가로 포함한다. 임의의 상기 방법의 일 구현예에서, 증폭은 실질적으로 등온 조건 하에 수행된다. 임의의 상기 방법의 일 구현예에서, 핵산 폴리머라제는 DNA 폴리머라제이다.
임의의 상기 방법의 한 구현예에서, DNA 폴리머라제는 가닥 치환 DNA 폴리머라제이다. 임의의 상기 방법의 한 구현예에서, 핵산 폴리머라제는 박테리오파지 phi29(Φ29) 폴리머라제, 유전자 변형된 phi29(Φ29) DNA 폴리머라제, 클레나우 단편 DNA 폴리머라제 I, 파지 M2 DNA 폴리머라제, 파지 phiPRD1 DNA 폴리머라제, Bst DNA 폴리머라제, Bst 큰 단편 DNA 폴리머라제, 엑소(-) Bst 폴리머라제, 엑소(-)Bca DNA 폴리머라제, Bsu DNA 폴리머라제, 벤트R DNA 폴리머라제, 벤트R (엑소-) DNA 폴리머라제, 딥 벤트 DNA 폴리머라제, 딥 벤트 (엑소-) DNA 폴리머라제, IsoPol DNA 폴리머라제, DNA 폴리머라제 I, 써미네이터 DNA 폴리머라제, T5 DNA 폴리머라제, 시쿼나제, T7 DNA 폴리머라제, T7-시쿼나제, 및 T4 DNA 폴리머라제로부터 선택된다. 임의의 상기 방법의 한 구현예에서, 핵산 폴리머라제는 3'->5' 엑소뉴클레아제 활성을 갖고 종결자 뉴클레오티드는 그러한 3'->5' 엑소뉴클레아제 활성을 억제한다. 일 특정 구현예에서, 종결자 뉴클레오티드는 알파 기가 변형된 뉴클레오티드(예를 들어, 포스포로티오에이트 결합을 생성하는 알파-티오 디데옥시뉴클레오티드), C3 스페이서 뉴클레오티드, 잠금 핵산(LNA), 역위된 핵산, 2' 플루오로 뉴클레오티드, 3' 인산화 뉴클레오티드, 2'-O-메틸 변형된 뉴클레오티드, 및 트랜스 핵산으로부터 선택된다. 임의의 상기 방법의 한 구현예에서, 핵산 폴리머라제는 3'->5' 엑소뉴클레아제 활성을 갖지 않는다. 일 특정 구현예에서, 폴리머라제는 Bst DNA 폴리머라제, 엑소(-) Bst 폴리머라제, 엑소(-) Bca DNA 폴리머라제, Bsu DNA 폴리머라제, 벤트R (엑소-) DNA 폴리머라제, 딥 벤트 (엑소-) DNA 폴리머라제, 클레나우 단편 (엑소-) DNA 폴리머라제, 및 써미네이터 DNA 폴리머라제로부터 선택된다. 일 특정 구현예에서, 종결자 뉴클레오티드는 데옥시리보오스의 3' 탄소의 r 기의 변형을 포함한다. 일 특정 구현예에서, 종결자 뉴클레오티드는 3' 차단된 가역적 종결자 포함 뉴클레오티드, 3' 비차단된 가역적 종결자 포함 뉴클레오티드, 데옥시뉴클레오티드의 2' 변형을 포함하는 종결자, 데옥시뉴클레오티드의 질소성 염기에 변형을 포함하는 종결자, 및 이들의 조합으로부터 선택된다. 일 특정 구현예에서, 종결자 뉴클레오티드는 디데옥시뉴클레오티드, 역위된 디데옥시뉴클레오티드, 3' 비오티닐화 뉴클레오티드, 3' 아미노 뉴클레오티드, 3'-인산화 뉴클레오티드, 3'-O-메틸 뉴클레오티드, 3' C3 스페이서 뉴클레오티드를 포함한 3' 탄소 스페이서 뉴클레오티드, 3' C18 뉴클레오티드, 3' 헥산디올 스페이서 뉴클레오티드, 아사이클로뉴클레오티드, 및 이들의 조합으로부터 선택된다. 임의의 상기 방법의 한 구현예에서, 증폭 프라이머는 4개 뉴클레오티드 길이와 70개 뉴클레오티드 길이 사이이다. 임의의 상기 방법의 한 구현예에서, 증폭 산물은 약 50개 뉴클레오티드 길이와 약 2000개 뉴클레오티드 길이 사이이다. 임의의 상기 방법의 한 구현예에서, 표적 핵산은 DNA(예를 들어, cDNA 또는 게놈 DNA)이다. 임의의 상기 방법의 한 구현예에서, 증폭 프라이머는 무작위 프라이머이다. 임의의 상기 방법의 한 구현예에서, 증폭 프라이머는 바코드를 포함한다. 일 특정 구현예에서, 바코드는 세포 바코드를 포함한다. 일 특정 구현예에서, 바코드는 샘플 바코드를 포함한다. 임의의 상기 방법의 한 구현예에서, 증폭 프라이머는 고유한 분자 식별자(UMI)를 포함한다. 임의의 상기 방법의 한 구현예에서, 방법은 초기 프라이머 어닐링 전에 표적 핵산 또는 게놈 DNA를 변성시키는 단계를 포함한다. 일 특정 구현예에서, 변성은 알칼리 조건 하에 수행된 후 중화된다. 임의의 상기 방법의 한 구현예에서, 샘플, 증폭 프라이머, 핵산 폴리머라제, 및 뉴클레오티드의 혼합물은 미세유체 장치에 포함된다. 임의의 상기 방법의 한 구현예에서, 샘플, 증폭 프라이머, 핵산 폴리머라제, 및 뉴클레오티드의 혼합물은 액적에 포함된다. 임의의 상기 방법의 한 구현예에서, 샘플은 조직(들) 샘플, 세포, 생물학적 유체 샘플(예를 들어, 혈액, 소변, 타액, 림프액, 뇌척수액(CSF), 양수, 흉수, 심낭액, 복수, 안방수), 골수 샘플, 정액 샘플, 생검 샘플, 암 샘플, 종양 샘플, 세포 용해물 샘플, 법의학 샘플, 고고학 샘플, 고생물학 샘플, 감염 샘플, 생산 샘플, 전체 식물, 식물 부분, 미생물총 샘플, 바이러스 제제, 토양 샘플, 해양 샘플, 담수 샘플, 가정 또는 산업 샘플, 및 이들의 조합 및 단리물로부터 선택된다. 임의의 상기 방법의 한 구현예에서, 샘플은 세포(예를 들어, 동물 세포[예를 들어, 인간 세포], 식물 세포, 진균 세포, 박테리아 세포, 및 원생동물 세포)이다. 일 특정 구현예에서, 세포는 복제 전에 용해된다. 일 특정 구현예에서, 세포 용해는 단백질 분해가 수반된다. 일 특정 구현예에서, 세포는 착상 전 배아, 줄기 세포, 태아 세포, 종양 세포, 의심성 암 세포, 암 세포, 유전자 편집 절차를 거친 세포, 병원성 유기체로부터의 세포, 법의학 샘플로부터 얻은 세포, 고고학 샘플로부터 얻은 세포, 및 고생물학 샘플로부터 얻은 세포로부터 선택된다. 임의의 상기 방법의 한 구현예에서, 샘플은 착상 전 배아(예를 들어, 할구[예를 들어, 시험관 내 수정에 의해 생성된 8 세포 단계 배아로부터 얻은 할구])로부터의 세포이다. 일 특정 구현예에서, 방법은 배아 세포에서 질병 소인성 생식계열 또는 체세포 변이체의 존재를 결정하는 단계를 추가로 포함한다. 임의의 상기 방법의 한 구현예에서, 샘플은 병원성 유기체(예를 들어, 박테리아, 진균, 원생동물)로부터의 세포이다. 일 특정 구현예에서, 병원성 유기체 세포는 환자로부터 채취한 체액, 미생물총 샘플(예를 들어, GI 미생물총 샘플, 질 미생물총 샘플, 피부 미생물총 등) 또는 유치 의료 장치(예를 들어, 정맥 내 카테터, 요도 카테터, 뇌척수 션트, 인공 판막, 인공 관절, 기관 내 튜브 등)로부터 얻는다. 일 특정 구현예에서, 방법은 병원성 유기체의 정체를 결정하는 단계를 추가로 포함한다. 일 특정 구현예에서, 방법은 치료에 대한 병원성 유기체의 내성의 원인이 되는 유전적 변이체의 존재를 결정하는 단계를 추가로 포함한다. 임의의 상기 방법의 한 구현예에서, 샘플은 종양 세포, 의심성 암 세포, 또는 암 세포이다. 일 특정 구현예에서, 방법은 하나 이상의 진단적 또는 예후적 돌연변이의 존재를 결정하는 단계를 추가로 포함한다. 일 특정 구현예에서, 방법은 치료에 대한 내성의 원인이 되는 생식계열 또는 체세포 변이체의 존재를 결정하는 단계를 추가로 포함한다. 임의의 상기 방법의 한 구현예에서, 샘플은 유전자 편집 절차를 거친 세포이다. 일 특정 구현예에서, 방법은 유전자 편집 과정에 의해 야기되는 계획되지 않은 돌연변이의 존재를 결정하는 단계를 추가로 포함한다. 임의의 상기 방법의 한 구현예에서, 방법은 세포 계통의 이력을 결정하는 단계를 추가로 포함한다. 관련된 양태에서, 본 발명은 저빈도 서열 변이체(예를 들어, 전체 서열의 ≥0.01%를 구성하는 변이체)를 확인하는 임의의 상기 방법의 용도를 제공한다.
관련된 양태에서, 본 발명은 역전사효소, 핵산 폴리머라제, 하나 이상의 증폭 프라이머, 하나 이상의 종결자 뉴클레오티드를 포함하는 뉴클레오티드의 혼합물, 및 임의로 사용 지침서를 포함하는 키트를 제공한다. 본 발명의 키트의 한 구현예에서, 핵산 폴리머라제는 가닥 치환 DNA 폴리머라제이다. 일부 경우에, 역전사효소는 주형 전환을 수행한다. 일부 경우에, 역전사효소는 MMLV(몰로니 뮤린 백혈병 바이러스), HIV-1AMV(조류 골수아세포증 바이러스), 테로머라제 RT, FIV(고양이 면역결핍 바이러스) 또는 XMRV(이종성 뮤린 백혈병 바이러스 관련 바이러스)의 변이체이다. 역전사효소의 비제한적인 예는 SuperScript I(Thermo), SuperScript II(Thermo), SuperScript III(Thermo), SuperScript IV(Thermo), OmniScript(Qiagen), SensiScript(Qiagen), PrimeScript(Takara), Maxima H-(Thermo), AcuuScript Hi-Fi(Agilent), iScript(Bio-Rad), eAMV(Merck KGaA), qScript(Quanta Biosciences), SmartScribe (Clontech), 또는 GoScript(Promega)를 포함한다. 본 발명의 키트의 한 구현예에서, 핵산 폴리머라제는 박테리오파지 phi29(Φ29) 폴리머라제, 유전자 변형된 phi29(Φ29) DNA 폴리머라제, 클레나우 단편 DNA 폴리머라제 I, 파지 M2 DNA 폴리머라제, 파지 phiPRD1 DNA 폴리머라제, Bst DNA 폴리머라제, Bst 큰 단편 DNA 폴리머라제, 엑소(-) Bst 폴리머라제, 엑소(-)Bca DNA 폴리머라제, Bsu DNA 폴리머라제, 벤트R DNA 폴리머라제, 벤트R (엑소-) DNA 폴리머라제, 딥 벤트 DNA 폴리머라제, 딥 벤트 (엑소-) DNA 폴리머라제, IsoPol DNA 폴리머라제, DNA 폴리머라제 I, 써미네이터 DNA 폴리머라제, T5 DNA 폴리머라제, 시쿼나제, T7 DNA 폴리머라제, T7-시쿼나제, 및 T4 DNA 폴리머라제로부터 선택된다. 본 발명의 키트의 한 구현예에서, 핵산 폴리머라제는 3'->5' 엑소뉴클레아제 활성을 갖고 종결자 뉴클레오티드는 그러한 3'->5' 엑소뉴클레아제 활성을 억제한다(예를 들어, 알파 기가 변형된 뉴클레오티드[예를 들어, 알파-티오 디데옥시뉴클레오티드], C3 스페이서 뉴클레오티드, 잠금 핵산(LNA), 역위된 핵산, 2' 플루오로 뉴클레오티드, 3' 인산화 뉴클레오티드, 2'-O-메틸 변형된 뉴클레오티드, 트랜스 핵산). 본 발명의 키트의 한 구현예에서, 핵산 폴리머라제는 3'->5' 엑소뉴클레아제 활성을 갖는다(예를 들어, Bst DNA 폴리머라제, 엑소(-) Bst 폴리머라제, 엑소(-) Bca DNA 폴리머라제, Bsu DNA 폴리머라제, 벤트R (엑소-) DNA 폴리머라제, 딥 벤트 (엑소-) DNA 폴리머라제, 클레나우 단편 (엑소-) DNA 폴리머라제, 써미네이터 DNA 폴리머라제). 일 특정 구현예에서, 종결자 뉴클레오티드는 데옥시리보오스의 3' 탄소의 r 기의 변형을 포함한다. 일 특정 구현예에서, 종결자 뉴클레오티드는 3' 차단된 가역적 종결자 포함 뉴클레오티드, 3' 비차단된 가역적 종결자 포함 뉴클레오티드, 데옥시뉴클레오티드의 2' 변형을 포함하는 종결자, 데옥시뉴클레오티드의 질소성 염기에 변형을 포함하는 종결자, 및 이들의 조합으로부터 선택된다. 일 특정 구현예에서, 종결자 뉴클레오티드는 디데옥시뉴클레오티드, 역위된 디데옥시뉴클레오티드, 3' 비오티닐화 뉴클레오티드, 3' 아미노 뉴클레오티드, 3'-인산화 뉴클레오티드, 3'-O-메틸 뉴클레오티드, 3' C3 스페이서 뉴클레오티드를 포함한 3' 탄소 스페이서 뉴클레오티드, 3' C18 뉴클레오티드, 3' 헥산디올 스페이서 뉴클레오티드, 아사이클로뉴클레오티드, 및 이들의 조합으로부터 선택된다. 일부 경우에, 키트는 적어도 하나의 효소 안정화제, 중화 완충액, 변성 완충액, 또는 이들의 조합을 포함한다. 일부 경우에, 키트는 하나 이상의 모듈을 포함한다. 일부 예에서, 키트는 게놈 모듈 및 전사체 모듈을 포함한다.
넘버링된 구현예
하기 넘버링된 구현예 1-46이 본원에 기재되어 있다. 1. a. 세포 집단으로부터 단일 세포를 단리하는 단계; b. 단일 세포로부터의 mRNA 전사체로부터 증폭된 폴리뉴클레오티드를 포함하는 cDNA 라이브러리를 시퀀싱하는 단계; 및 c. 세포의 게놈을 시퀀싱하는 단계를 포함하고, 세포의 게놈을 시퀀싱하는 단계는: i. 단일 세포로부터 게놈을 제공하는 단계; ii. 게놈을 적어도 하나의 증폭 프라이머, 적어도 하나의 핵산 폴리머라제, 및 뉴클레오티드의 혼합물과 접촉시키는 단계로서, 뉴클레오티드의 혼합물은 폴리머라제에 의한 핵산 복제를 종결시키는 적어도 하나의 종결자 뉴클레오티드를 포함하는 단계; iii. 게놈의 적어도 일부를 증폭하여 복수의 종결된 증폭 산물을 생성하는 단계로서, 복제는 가닥 치환 복제에 의해 진행되는 단계; iv. 단계 (iii)에서 얻은 분자를 어댑터로 결찰하여 게놈 DNA 라이브러리를 생성하는 단계; 및 v. 게놈 DNA 라이브러리를 시퀀싱하는 단계를 포함하는, 멀티오믹 단일 세포 분석 방법을 포함하는 구현예가 본원에 기재되어 있다. 2. 방법이 세포 표면 상의 적어도 하나의 단백질을 확인하는 단계를 추가로 포함하는 구현예 1의 방법이 본원에 추가로 제공된다. 3. mRNA 전사체가 폴리아데닐화 mRNA 전사체를 포함하는 구현예 1의 방법이 본원에 추가로 제공된다. 4. mRNA 전사체가 폴리아데닐화 mRNA 전사체를 포함하지 않는 구현예 1의 방법이 본원에 추가로 제공된다. 5. cDNA 라이브러리를 시퀀싱하는 단계가 주형 전환 프라이머를 사용한 mRNA 전사체의 증폭을 포함하는 구현예 1 내지 4 중 어느 하나의 방법이 본원에 추가로 제공된다. 6. cDNA 라이브러리의 폴리뉴클레오티드 중 적어도 일부가 바코드를 포함하는 구현예 1 내지 4 중 어느 하나의 방법이 본원에 추가로 제공된다. 7. cDNA 라이브러리의 폴리뉴클레오티드 중 적어도 일부가 적어도 2개의 바코드를 포함하는 구현예 1 내지 4 중 어느 하나의 방법이 본원에 추가로 제공된다. 8. 바코드가 세포 바코드를 포함하는 구현예 6 또는 7의 방법이 본원에 추가로 제공된다. 9. 바코드가 샘플 바코드를 포함하는 구현예 6 또는 7의 방법이 본원에 추가로 제공된다. 10. a. 세포 집단으로부터 단일 세포를 단리하는 단계; b. 세포 표면 상의 적어도 하나의 단백질을 확인하는 단계; 및 c. 세포의 게놈을 시퀀싱하는 단계를 포함하고, 세포의 게놈을 시퀀싱을 시퀀싱하는 단계는: i. 단일 세포로부터 게놈을 제공하는 단계; ii. 게놈을 적어도 하나의 증폭 프라이머, 적어도 하나의 핵산 폴리머라제, 및 뉴클레오티드의 혼합물을 접촉시키는 단계로서, 뉴클레오티드의 혼합물은 폴리머라제에 의한 핵산 복제를 종결시키는 적어도 하나의 종결자 뉴클레오티드를 포함하는 단계; iii. 게놈의 적어도 일부를 증폭하여 복수의 종결된 증폭 산물을 생성하는 단계로서, 복제는 가닥 치환 복제에 의해 진행되는 단계; iv. 단계 (iii)에서 얻은 분자를 어댑터로 결찰하여 게놈 DNA 라이브러리를 생성하는 단계; 및 v. 게놈 DNA 라이브러리를 시퀀싱하는 단계를 포함하는, 멀티오믹 단일 세포 분석 방법. 11. 세포 표면 상의 적어도 하나의 단백질을 확인하는 단계가 세포를 적어도 하나의 단백질에 결합하는 표지된 항체와 접촉시키는 것을 포함하는 구현예 10의 방법이 본원에 추가로 제공된다. 12. 표지된 항체가 적어도 하나의 형광 표지를 포함하는 구현예 11의 방법이 본원에 추가로 제공된다. 13. 표지된 항체가 적어도 하나의 질량 태그를 포함하는 구현예 11의 방법이 본원에 추가로 제공된다. 14. 표지된 항체가 적어도 하나의 핵산 바코드를 포함하는 구현예 11의 방법이 본원에 추가로 제공된다. 15. a. 세포 집단으로부터 단일 세포를 단리하는 단계; b.세포의 게놈을 시퀀싱하는 단계를 포함하고, 세포의 게놈을 시퀀싱하는 단계는: i. 단일 세포로부터 게놈을 제공하는 단계; ii. 게놈을 메틸화 민감성 제한 효소로 분해하여 게놈 단편을 생성하는 단계; iii. 게놈 단편의 적어도 일부를 적어도 하나의 증폭 프라이머, 적어도 하나의 핵산 폴리머라제, 및 뉴클레오티드의 혼합물과 접촉시키는 단계로서, 뉴클레오티드의 혼합물은 폴리머라제에 의한 핵산 복제를 종결시키는 적어도 하나의 종결자 뉴클레오티드를 포함하는 단계; iv. 게놈 단편의 적어도 일부를 증폭하여 복수의 종결된 증폭 산물을 생성하는 단계로서, 복제는 가닥 치환 복제에 의해 진행되는 단계; v. 게놈 단편의 적어도 일부를 메틸화-특이적 PCR로 증폭하는 단계; vi. 단계 (iv 및 v)에서 얻은 분자를 어댑터로 결찰하여 게놈 DNA 라이브러리 및 메틸롬 DNA 라이브러리를 생성하는 단계; 및 vii. 게놈 DNA 라이브러리 및 메틸롬 라이브러리를 시퀀싱하는 단계를 포함하는, 멀티오믹 단일 세포 분석 방법. 16. 세포 표면 상의 적어도 하나의 단백질을 확인하는 단계가 세포를 적어도 하나의 단백질에 결합하는 표지된 항체와 접촉시키는 것을 포함하는 구현예 15의 방법이 본원에 추가로 제공된다. 17. 표지된 항체가 적어도 하나의 형광 표지를 포함하는 구현예 16의 방법이 본원에 추가로 제공된다. 18. 표지된 항체가 적어도 하나의 질량 태그를 포함하는 구현예 16의 방법이 본원에 추가로 제공된다. 19. 표지된 항체가 적어도 하나의 핵산 바코드를 포함하는 구현예 16의 방법이 본원에 추가로 제공된다. 20. 단일 세포가 포유동물 세포인 구현예 1 내지 19 중 어느 하나의 방법이 본원에 추가로 제공된다. 21. 단일 세포가 인간 세포인 구현예 1 내지 19 중 어느 하나의 방법이 본원에 추가로 제공된다. 22. 단일 세포가 간, 피부, 콩팥, 혈액, 또는 폐로부터 유래하는 구현예 1 내지 19 중 어느 하나의 방법이 본원에 추가로 제공된다. 23. 단일 세포가 1차 세포인 구현예 1 내지 19 중 어느 하나의 방법이 본원에 추가로 제공된다. 24. 방법이 종결된 증폭 산물로부터 어도 하나의 종결자 뉴클레오티드를 제거하는 단계를 추가로 포함하는 구현예 1 내지 23 중 어느 하나의 방법이 본원에 추가로 제공된다. 25. 증폭 산물의 적어도 일부가 바코드를 포함하는 구현예 1 내지 23 중 어느 하나의 방법이 본원에 추가로 제공된다. 26. 증폭 산물의 적어도 일부가 적어도 2개의 바코드를 포함하는 구현예 1 내지 23 중 어느 하나의 방법이 본원에 추가로 제공된다. 27. 바코드가 세포 바코드를 포함하는 구현예 24 또는 26의 방법이 본원에 추가로 제공된다. 28. 바코드가 샘플 바코드를 포함하는 구현예 24 또는 26의 방법이 본원에 추가로 제공된다. 29. 증폭 프라이머의 적어도 일부가 고유한 분자 식별자(UMI)를 포함하는 구현예 1 내지 28 중 어느 하나의 방법이 본원에 추가로 제공된다. 30. 증폭 프라이머의 적어도 일부가 적어도 2개의 고유한 분자 식별자(UMI)를 포함하는 구현예 1 내지 28 중 어느 하나의 방법이 본원에 추가로 제공된다. 31. 방법이 PCR을 사용하는 추가 증폭 단계를 추가로 포함하는 구현예 1 내지 30 중 어느 하나의 방법이 본원에 추가로 제공된다. 32. 적어도 하나의 돌연변이가 세포의 게놈에서 확인되고, 돌연변이가 참조 서열에서 상응하는 위치와 상이한 구현예 1 내지 30 중 어느 하나의 방법이 본원에 추가로 제공된다. 33. 적어도 하나의 돌연변이가 세포 집단의 50% 미만에서 발생하는 구현예 32의 방법이 본원에 추가로 제공된다. 34. 적어도 하나의 돌연변이가 세포 집단의 25% 미만에서 발생하는 구현예 32의 방법이 본원에 추가로 제공된다. 35. 적어도 하나의 돌연변이가 세포 집단의 1% 미만에서 발생하는 구현예 32의 방법이 본원에 추가로 제공된다. 36. 적어도 하나의 돌연변이가 세포 집단의 0.1% 이하에서 발생하는 구현예 32의 방법이 본원에 추가로 제공된다. 37. 적어도 하나의 돌연변이가 세포 집단의 0.01% 이하에서 발생하는 구현예 32의 방법이 본원에 추가로 제공된다. 38. 적어도 하나의 돌연변이가 세포 집단의 0.001% 이하에서 발생하는 구현예 32의 방법이 본원에 추가로 제공된다. 39. 적어도 하나의 돌연변이가 세포 집단의 0.0001% 이하에서 발생하는 구현예 32의 방법이 본원에 추가로 제공된다. 40. 적어도 하나의 돌연변이가 증폭 산물 서열의 50% 이하에서 발생하는 구현예 32의 방법이 본원에 추가로 제공된다. 41. 적어도 하나의 돌연변이가 증폭 산물 서열의 25% 이하에서 발생하는 구현예 32의 방법이 본원에 추가로 제공된다. 42. 적어도 하나의 돌연변이가 증폭 산물 서열의 1% 이하에서 발생하는 구현예 32의 방법이 본원에 추가로 제공된다. 43. 적어도 하나의 돌연변이가 증폭 산물 서열의 0.1% 이하에서 발생하는 구현예 32의 방법이 본원에 추가로 제공된다. 44. 적어도 하나의 돌연변이가 증폭 산물 서열의 0.01% 이하에서 발생하는 구현예 32의 방법이 본원에 추가로 제공된다. 45. 적어도 하나의 돌연변이가 증폭 산물 서열의 0.001% 이하에서 발생하는 구현예 32의 방법이 본원에 추가로 제공된다. 46. 적어도 하나의 돌연변이가 증폭 산물 서열의 0.0001% 이하에서 발생하는 구현예 32의 방법이 본원에 추가로 제공된다.
실시예
다음의 실시예는 당업자에게 본원에 개시된 구현예의 원리 및 실시를 더 명확하게 설명하기 위해 제시되며 임의의 청구된 구현예의 범위를 제한하는 것으로 해석되어서는 안 된다. 달리 명시되지 않는 한, 모든 부 및 백분율은 중량을 기준으로 한다.
실시예 1: 1차 주형 지시 증폭(PTA)
PTA는 임의의 핵산 증폭에 사용될 수 있지만 전체 게놈 증폭에 특히 유용한데, PTA가 현재 사용되는 방법, 예를 들어, 다중 치환 증폭(MDA)보다 더 균일하고 재현 가능한 방식으로 더 낮은 오류율로 더 많은 비율의 세포 게놈을 캡처할 수 있기 때문이며, 이는 처음에 폴리머라제가 무작위 프라이머를 신장시키는 위치에서의 지수 증폭과 같은 현재 사용되는 방법이 유전자좌 및 대립유전자의 무작위 과대 표현 및 돌연변이 전파를 초래하는 그러한 단점을 방지한다(도 1g 참조). PTA는 또한 전사체 분석과 같은 다른 분석 기술과 함께 사용된다.
세포 배양
인간 NA12878(Coriell Institute) 세포는 15% FBS 및 2 mM L-글루타민, 및 100 unit/mL의 페니실린, 100 μg/mL의 스트렙토마이신, 및 0.25 μg/mL의 암포테리신 B(Gibco, Life Technologies)가 보충된 RPMI 배지에서 유지시켰다. 세포는 3.5 x 105개 세포/ml의 밀도로 접종하였다. 배양물을 3일마다 분할하고 5% CO2와 함께 37℃의 가습 인큐베이터에서 유지시켰다.
단일 세포 단리 및 WTA
WTA(전체 전사체 분석)에 대한 일반적인 프로토콜을 도 2f에 나타낸다. 세포를 150-500개 세포/μL의 농도로 재현탁하였다. 이 세포 현탁액을 새로 준비된 20 μL의 염색 완충액으로 염색하였다(Life Technology의 LIVE/DEAD® 생존능력/세포독성 키트로부터 2.5 μL 에티디움 동종이량체-1 및 0.625 μL 칼세인 AM을 1X PBS 및 0.05% tween-20을 함유하는 1.25 mL 세포 완충액에 추가함). 이어서, FACS Aria III 분류 기기를 사용하여 세포를 분류하여 96웰 각각에 세포를 침착시켰다. 5x RT 완충액, PEG4000, RT 프라이머(100 uM), TS 올리고(20 uM), 역전사효소, RNAse 억제제, 젤라틴, Tween-20, Triton-X, dNTP 믹스, TMAC(1 M), 베타인(5M), MgCl2(50 mM), ERCC 스파이크를 함유하는 반응 믹스를 각 웰에 첨가하였다. 이어서, 샘플을 42℃에서 90분, 50℃에서 30분 동안 열 순환기에 놓은 다음, 샘플이 사전증폭을 위해 처리될 수 있을 때까지 4℃에서 유지하였다. RT에 대한 열 순환 후, 샘플은 DNA 증폭 또는 RT 반응으로부터 유도된 제1 가닥 cDNA의 사전증폭을 위해 처리된다. 샘플의 사전증폭은 cDNA 산물을 증폭하기 위해 다음 프로토콜과 함께 단일 프라이머(반-억제 PCR)를 사용하여 수행되었다. 간단히, 5 uL의 RT 반응을 2X 마스터 믹스, 1 마이크로몰 프라이머 및 5X 프리앰프 완충액을 포함하는 30 마이크로리터 반응에 다음 열 순환 조건 95℃ - 1분을 사용하여 추가하였다. 95℃ - 15초, 60℃ - 30초, 68℃ - 4분의 21주기 후 72℃에서 10분의 기간 동안 유지하였다. 이어서, 제조업체의 지침서를 사용하여 Nextera XT 라이브러리 제조 키트를 사용하여 샘플을 시퀀싱 라이브러리로 변환했다(도 2g). RT 실험에 대한 결과는 표 1에 6개의 샘플에 대해 나타낸다.
[표 1]
단일 세포 단리 및 WGA
NA12878 세포를 3.5 x 105개 세포/ml의 밀도로 접종한 후 최소 3일 동안 배양한 후, 3 mL의 세포 현탁액을 300xg에서 10분 동안 펠렛화하였다. 이어서, 배지를 버리고 세포를 1 mL의 세포 세척 완충액(Mg2 또는 Ca2 없이 2% FBS를 함유하는 1X PBS)으로 300xg, 200xg, 마지막으로 100xg에서 5분 동안 회전시켜 3회 세척하였다. 이어서, 세포를 500 μL의 세포 세척 완충액에 재현탁하였다. 이어서, 100 nM의 칼세인(Calcein) AM(Molecular Probes) 및 100 ng/ml의 프로피듐 요오다이드(PI; Sigma-Aldrich)로 염색하여 생존 세포 집단을 구별하였다. ELIMINase(Decon Labs)로 완전히 세척하고 세포 분류를 위한 Accudrop 형광 비드(BD Biosciences)를 사용하여 보정한 BD FACScan 유세포 분석기(FACSAria II) (BD Biosciences)에 세포를 로딩하였다. PTA(Sigma-Aldrich)를 거친 세포에서 칼세인 AM-양성, PI-음성 분획으로부터의 단일 세포를 0.2% Tween 20을 포함한 3 μL의 PBS를 함유하는 96웰 플레이트의 각 웰에 분류하였다. 여러 웰을 의도적으로 비워 두어 무주형 대조군(NTC: no template control)으로 사용하였다. 분류 직후, 플레이트를 잠시 원심분리하여 얼음 위에 두었다. 이어서, 세포를 -20℃에서 최소 밤새 동결시켰다. 다음날, HEPA 여과 공기의 일정한 양압을 제공하고 각 실험 전에 30분 동안 UV 광선으로 오염이 제거된 사전 PCR 워크스테이션에서 WGA 반응을 조립하였다.
MDA는 이전에 증폭 균일성을 개선하는 것으로 나타났던 변형과 함께 수행하였다. 구체적으로, 엑소뉴클레아제 내성 무작위 프라이머(ThermoFisher)를 최종 농도가 125 μM이 되도록 용해 완충액/믹스에 첨가하였다. 4 μL의 생성된 용해/변성 믹스를 단일 세포를 함유하는 튜브에 첨가하고, 볼텍싱하고, 잠시 회전시키고 얼음에서 10분 동안 인큐베이션하였다. 세포 용해물은 3 μL의 켄칭 완충액을 첨가하여 중화시키고, 볼텍싱으로 혼합하고, 잠시 원심분리하고, 실온에 두었다. 이어서, 40 μL의 증폭 믹스를 첨가한 후 30℃에서 8시간 동안 인큐베이션한 후 3분 동안 65℃로 가열하여 증폭을 종료시켰다.
PTA는 5% Triton X-100(Sigma-Aldrich)과 20 mg/ml 프로테이나아제 K(Promega)의 1:1 혼합물의 미리 냉각된 용액 2 μl를 첨가하여 동결 해동 후 세포를 먼저 추가로 용해시켜 수행하였다. 이어서, 세포를 볼텍싱하고 잠시 원심분리한 후 10분 동안 40℃에 두었다. 이어서, 4 μl의 용해 완충액/믹스 및 1 μl의 500 μM 엑소뉴클레아제 내성 무작위 프라이머를 용해된 세포에 첨가하여 DNA를 변성시킨 후 볼텍싱하고, 회전시키고, 65℃에서 15분 동안 두었다. 이어서, 4 μl의 실온의 켄칭 완충액을 첨가하고 샘플을 볼텍싱하고 회전시켰다. 56 μl의 증폭 믹스(프라이머, dNTP, 폴리머라제, 완충액)는 최종 증폭 반응에서 1200 μM의 농도에서 동일한 비율로 알파-티오-ddNTP를 함유하였다. 이어서, 샘플을 30℃에서 8시간 동안 둔 후 3분 동안 65℃로 가열시켜 증폭을 종료하였다.
증폭 단계 후, AMPure XP 마그네틱 비드(Beckman Coulter)를 사용하여 2:1 비율의 비드 대 샘플로 MDA 및 PTA 반응 둘 모두로부터 DNA를 정제하고 Qubit dsDNA HS 검정 키트를 사용하여 Qubit 3.0 형광계로 제조업체의 지침서(Life Technologies)에 따라 수율을 측정하였다.
라이브러리 제조
MDA 반응으로 40 μg의 증폭된 DNA를 생성하였다. 표준 절차에 따라 1 μg의 산물을 30분 동안 단편화하였다. 이어서, 샘플은 15 μM의 이중 인덱스 어댑터(T4 폴리머라제, T4 폴리뉴클레오티드 키나제 및 A-테일링을 위한 Taq 폴리머라제에 의한 최종 복구)와 4주기의 PCR로 표준 라이브러리 제조를 거쳤다. 각 PTA 반응은 40 ng과 60 ng 사이의 물질을 생성하였고, 이들은 단편화 없이 온전히 표준 DNA 시퀀싱 라이브러리 제조에 사용하였다. UMI와 이중 인덱스가 있는 2.5 μM 어댑터를 T4 리가제와 함께 결찰에 사용하였으며 최종 증폭에는 15주기의 PCR(핫 스타트 폴리머라제)을 사용하였다. 이어서, 우측 및 좌측 선택에 각각 0.65X 및 0.55X의 비율을 사용하는 양측 SPRI를 사용하여 라이브러리를 세정하였다. 최종 라이브러리를 Qubit dsDNA BR 검정 키트 및 2100 Bioanalyzer(Agilent Technologies)를 사용하여 정량화한 후 Illumina NextSeq 플랫폼에서 시퀀싱하였다. NovaSeq를 포함한 모든 Illumina 시퀀싱 플랫폼도 본 프로토콜과 호환된다.
데이터 분석
시퀀싱 리드는 Bcl2fastq를 사용하여 세포 바코드를 기반으로 역 다중화하였다. 이어서, 트리모마틱(trimmomatic)을 사용하여 리드를 트리밍한 다음, BWA를 사용하여 hg19에 정렬하였다. 리드는 Picard에 의해 중복 마킹을 거쳐 GATK 4.0을 사용하여 국소 재정렬 및 염기 재보정을 수행하였다. 품질 메트릭스를 계산하는 데 사용된 모든 파일을 Picard DownSampleSam을 사용하여 2천만 리드로 다운샘플링하였다. qualimap과 Picard AlignmentSummaryMetrics 및 CollectWgsMetrics를 사용하여 최종 bam 파일로부터 품질 메트릭스를 획득하였다. 전체 게놈 커버리지는 또한 Preseq를 사용하여 평가하였다.
변이체 호출
GATK 4.0의 GATK UnifiedGenotyper를 사용하여 단일 뉴클레오티드 변이체 및 삽입-결실을 호출하였다. GATK 모범 사례를 사용하는 표준 필터링 기준을 과정의 모든 단계에 사용하였다(https://software.broadinstitute.org/gatk/best-practices/). Control-FREEC(Boeva et al., Bioinformatics, 2012, 28(3):423-5)를 사용하여 카피 수 변이체를 호출하였다. CREST를 사용하여 구조적 변이체도 검출하였다(Wang et al., Nat Methods, 2011, 8 (8):652-4).
결과
도 3a 및 도 3b에 나타난 바와 같이, 디데옥시뉴클레오티드("가역적")만으로 증폭의 맵핑 비율 및 맵핑 품질 점수는 각각 15.0 +/- 2.2 및 0.8 +/- 0.08인 한편, 엑소뉴클레아제 내성 알파-티오 디데옥시뉴클레오티드 종결자의 혼입("비가역적")은 각각 97.9 +/- 0.62 및 46.3 +/- 3.18의 맵핑 비율 및 품질 점수를 생성하였다. 가역적 ddNTP, 및 상이한 농도의 종결자를 사용하여 실험을 시행하였다(도 2a, 하단).
도 2b-2e는 MDA(문헌[Dong, X. et al., Nat Methods. 2017, 14 (5):491-493]의 방법에 따름) 또는 PTA를 거친 NA12878 인간 단일 세포로부터 생성된 비교 데이터를 나타낸다. 두 프로토콜 모두 필적하게 낮은 PCR 중복율(MDA 1.26% +/- 0.52 vs PTA 1.84% +/- 0.99) 및 GC%(MDA 42.0 +/- 1.47 vs PTA 40.33 +/- 0.45)을 생성하였다. PTA는 더 작은 앰플리콘 크기를 생성하였다. MDA에 비해 맵핑된 리드 퍼센트 및 맵핑 품질 점수도 PTA에서 유의하게 높았다(각각 PTA 97.9 +/- 0.62 vs MDA 82.13 +/- 0.62 및 PTA 46.3 +/-3.18 vs MDA 43.2 +/- 4.21). 전반적으로 PTA는 MDA와 비교할 때 더 유용한 맵핑된 데이터를 생성한다. 도 4a는 MDA와 비교하여 PTA가 커버리지 폭이 더 넓고 커버리지가 거의 0에 가까운 영역이 적어 증폭의 균일성을 유의하게 향상시켰음을 나타낸다. PTA를 사용하면 전체 서열의 ≥0.01%를 구성하는 변이체를 포함한 핵산 집단에서 저빈도 서열 변이체를 확인할 수 있다. PTA는 단일 세포 게놈 증폭에 성공적으로 사용될 수 있다.
실시예 2: PTA의 비교 분석
PTA 및 SCMDA 세포 유지 및 단리의 벤치마킹
1000명의 게놈 프로젝트 대상체 NA12878(Coriell Institute, Camden, NJ, USA)로부터의 림프모구양 세포를 15% FBS, 2 mM L-글루타민, 100 unit/mL의 페니실린, 100 μg/mL의 스트렙토마이신, 및 0.25 μg/mL의 암포테리신 B가 보충된 RPMI 배지에서 유지시켰다. 세포를 3.5 x 105개 세포/ml의 밀도로 접종하고 3일마다 분할하였다. 이들을 5% CO2와 함께 37℃의 가습 인큐베이터에서 유지시켰다. 단일 세포 단리 전에, 이전 3일에 걸쳐 확장된 3 mL의 세포 현탁액을 300xg에서 10분 동안 회전시켰다. 펠렛화된 세포를 1 mL의 세포 세척 완충액(Mg2+ 또는 Ca2+가 없이 2% FBS를 포함하는 1X PBS)으로 순차적으로 300xg, 200xg, 마지막으로 100xg에서 5분 동안 회전시켜 3회 세척하여 사멸된 세포를 제거하였다. 이어서, 세포를 500 uL의 세포 세척 완충액에 재현탁시킨 다음, 100 nM의 칼세인 AM 및 100 ng/ml의 프로피듐 요오다이드(PI)로 염색하여 생존 세포 집단을 구별하였다. ELIMINase로 완전히 세척하고 Accudrop 형광 비드를 사용하여 보정한 BD FACScan 유세포 분석기(FACSAria II)에 세포를 로딩하였다. 칼세인 AM-양성, PI-음성 분획으로부터의 단일 세포를 0.2% Tween 20과 함께 3 uL의 PBS를 함유하는 96웰 플레이트의 각 웰에 분류하였다. 다수의 웰을 의도적으로 비워 두어 무주형 대조군으로 사용하였다. 분류 직후, 플레이트를 잠시 원심분리하여 얼음 위에 두었다. 이어서, 세포를 -80℃에서 최소 밤새 동결시켰다.
PTA 및 SCMDA 실험
HEPA 여과 공기로 일정한 양압을 제공하고 각 실험 전에 30분 동안 UV 광으로 오염을 제거한 사전 PCR 워크스테이션에서 WGA 반응을 조립하였다. MDA는 공개된 프로토콜(Dong et al. Nat. Meth. 2017, 14, 491-493)을 사용하여 SCMDA 방법론에 따라 수행하였다. 구체적으로, 엑소뉴클레아제 내성 무작위 프라이머를 용해 완충액에 최종 농도 12.5 uM으로 첨가하였다. 4 uL의 생성된 용해 믹스를 단일 세포를 함유하는 튜브에 첨가하고, 3회 피펫팅하여 혼합하고, 잠시 회전시키고 얼음 위에서 10분 동안 인큐베이션하였다. 3 uL의 켄칭 완충액을 첨가하여 세포 용해물을 중화시키고, 3회 피펫팅하여 혼합하고, 잠시 원심분리하고, 얼음 위에 두었다. 이어서, 40 ul의 증폭 믹스를 첨가한 후 30℃에서 8시간 동안 인큐베이션한 후, 3분 동안 65℃로 가열하여 증폭을 종료하였다. PTA는 먼저 5% 트리톤 X-100과 20 mg/ml 프로테이나아제 K의 1:1 혼합물의 사전 냉각된 용액 2 μl를 첨가하여 동결 해동 후 세포를 추가로 용해하여 수행하였다. 이어서, 세포를 볼텍싱하고 잠시 원심분리한 후 40℃에서 10분 동안 두었다. 이어서, 4 μl의 변성 완충액과 1 μl의 500 μM 엑소뉴클레아제 내성의 무작위 프라이머를 용해된 세포에 첨가하여 DNA를 변성시킨 후, 볼텍싱하고, 회전시키고, 65℃에서 15분 동안 두었다. 이어서, 4 μl의 실온의 켄칭 용액을 첨가하고 샘플을 볼텍싱하고 회전시켰다. 56 μl의 증폭 믹스는 최종 증폭 반응에서 1200 μM의 농도에서 동일한 비율로 알파-티오-ddNTP를 함유하였다. 이어서, 샘플을 30℃에서 8시간 동안 둔 후 3분 동안 65℃로 가열하여 증폭을 종료하였다. SCMDA 또는 PTA 증폭 후, AMPure XP 마그네틱 비드를 사용하여 2:1 비율의 비드 대 샘플로 DNA를 정제하고 Qubit 3.0 형광계와 함께 Qubit dsDNA HS 검정 키트를 사용하여 제조업체의 지침서에 따라 수율을 측정하였다.
라이브러리 제조
컨디셔닝 용액을 첨가한 후 HyperPlus 프로토콜에 따라 1 ug의 SCMDA 산물을 30분 동안 단편화하였다. 이어서, 샘플은 15 μM의 고유한 이중 인덱스 어댑터와 4주기의 PCR로 표준 라이브러리 제조를 거쳤다. 각 PTA 반응의 전체 산물은 단편화 없이 표준 증폭 프로토콜을 사용하여 DNA 시퀀싱 라이브러리 제조에 사용하였다. 결찰에 2.5 uM의 고유한 이중 인덱스 어댑터를 사용하였고 최종 증폭에는 15주기의 PCR을 사용하였다. 이어서, SCMDA 및 PTA로부터의 라이브러리를 1% 아가로스 E-겔에서 가시화하였다. 400 bp와 700 bp 사이의 단편을 겔에서 절제하여 겔 DNA 회수 키트를 사용하여 회수하였다. Qubit dsDNA BR 검정 키트 및 Agilent 2100 Bioanalyzer를 사용하여 최종 라이브러리를 정량화한 후 NovaSeq 6000에서 시퀀싱하였다.
데이터 분석
트리마모틱을 사용하여 데이터를 트리밍한 다음. BWA를 사용하여 hg19에 정렬하였다. 리드는 Picard에 의한 중복 마킹을 거친 후 GATK 3.5 모범 사례를 사용하여 국소 재정렬 및 염기 재보정을 수행하였다. 모든 파일을 Picard DownSampleSam을 사용하여 지정된 수의 리드로 다운샘플링하였다. qualimap과 Picard AlignmentMetricsAummary 및 CollectWgsMetrics를 사용하여 최종 bam 파일로부터 품질 메트릭스를 획득하였다. 로렌츠 곡선을 그리고 htSeqTools를 사용하여 지니 지수를 계산하였다. UnifiedGenotyper를 사용하여 SNV 호출을 수행한 다음, 표준 권장 기준(QD < 2.0 || FS > 60.0 || MQ < 40.0 || SOR > 4.0 || MQRankSum < -12.5 || ReadPosRankSum < -8.0)을 사용하여 필터링하였다. 분석에서 어떤 영역도 제외시키지 않았으며 다른 데이터 정규화 또는 조작도 수행하지 않았다. 시험된 방법에 대한 시퀀싱 메트릭스는 표 2에서 확인된다.
[표 2] 시험된 방법 간의 시퀀싱 메트릭스의 비교
CV = 변이 계수; SNV = 단일 뉴클레오티드 변이; 값은 15X 커버리지를 지칭한다.
게놈 커버리지 폭 및 균일성
모든 일반적인 단일 세포 WGA 방법과 PTA의 포괄적인 비교를 수행하였다. 이를 달성하기 위해, PTA 및 개선된 버전의 MDA, 소위 단일 세포 MDA(Dong et al. Nat. Meth. 2017, 14, 491-493) (SCMDA)를 각각 10개의 NA12878 세포에서 수행하였다. 또한, DOP-PCR(Zhang et al. PNAS 1992, 89, 5847-5851), MDA 키트 1(Dean et al. PNAS 2002, 99, 5261-5266), MDA 키트 2, MALBAC(Zong et al. Science 2012, 338, 1622-1626), LIANTI(Chen et al., Science 2017, 356, 189-194), 또는 PicoPlex(Langmore, Pharmacogenomics 3, 557-560 (2002))로 증폭을 거친 세포에 대한 결과를 LIANTI 연구의 일부로 생성된 데이터를 사용하여 비교하였다.
샘플에 걸쳐 정규화하기 위해, 모든 샘플로부터의 원시 데이터를 정렬하고 동일한 파이프라인을 사용하는 변이체 호출을 위한 전처리를 거쳤다. 이어서, 비교를 수행하기 전에 bam 파일을 각각 3억개 리드로 서브샘플링하였다. 중요하게는, PTA 및 SCMDA 산물은 추가 분석을 수행하기 전에 스크리닝하지 않았지만 다른 모든 방법은 후속 분석에 사용된 최고 품질의 세포를 선택하기 전에 게놈 커버리지 및 균일성에 대한 스크리닝을 거쳤다. 중요하게는, SCMDA와 PTA는 벌크 2배체 NA12878 샘플과 비교하였지만 다른 모든 방법은 LIANTI 연구에서 사용된 벌크 BJ1 2배체 섬유아세포와 비교하였다. 도 3c-3f에서 나타난 바와 같이, PTA는 게놈에 정렬된 리드 퍼센트가 가장 높았을 뿐만 아니라 맵핑 품질도 가장 높았다. PTA, LIANTI, 및 SCMDA는 유사한 GC 함량을 보였으며 이들 모두는 다른 방법보다 더 낮았다. PCR 중복율은 모든 방법에서 유사하였다. 또한, PTA 방법은 미토콘드리아 게놈과 같은 더 작은 주형이 시험된 다른 방법에 비해 더 높은 커버리지 비율(더 큰 표준 염색체와 유사)을 제공하게 할 수 있다(도 3g).
이어서, 모든 방법의 커버리지 폭과 균일성을 비교하였다. 염색체 1에 걸친 커버리지 플롯의 예는 SCMDA 및 PTA에 대해 나타내며, 여기서 PTA는 커버리지의 균일성 및 대립유전자 빈도가 유의하게 개선된 것으로 나타난다(도 4b). 이어서, 증가하는 리드 수를 사용하여 모든 방법에 대해 커버리지 비율을 계산하였다. PTA는 모든 깊이에서 2개의 벌크 샘플에 접근하며 이는 다른 모든 방법에 비해 유의하게 개선된 것이다(도 5a). 이어서, 두 가지 전략을 사용하여 커버리지 균일성을 측정하였다. 첫 번째 접근법은 증가하는 시퀀싱 깊이에서 커버리지의 변동 계수를 계산하는 것이었으며, 여기서 PTA가 다른 모든 방법보다 더 균일한 것으로 밝혀졌다(도 5b). 두 번째 전략은 각각의 서브샘플링된 bam 파일에 대해 로렌츠 곡선을 계산하는 것이었으며, 여기서, PTA가 가장 높은 균일성을 갖는 것으로 또한 밝혀졌다(도 5c). 증폭 균일성의 재현성을 측정하기 위해, 지니 지수를 계산하여 완벽한 균일성에서 각 증폭 반응의 차이를 평가하였다(de Bourcy et al., PloS one 9, e105585 (2014)). PTA는 다른 방법보다 재현 가능하게 더 균일한 것으로 또한 나타났다(도 5d).
SNV 민감도
SNV 호출에 대한 증폭 방법의 성능에서 이러한 차이의 효과를 결정하기 위해, 증가하는 시퀀싱 깊이에서 대응하는 벌크 샘플에 대한 각각의 변이체 호출 비율을 비교하였다. 민감도를 평가하기 위해 각 시퀀싱 깊이에서 각 세포에서 확인된 6억 5천만 리드로 서브샘플링된 상응하는 벌크 샘플에서 호출된 변이체의 퍼센트(도 5e)를 비교하였다. PTA의 개선된 커버리지와 균일성은 다음으로 가장 민감한 방법인 MDA 키트 2에 비해 45.6% 더 많은 변이체를 검출하였다. 벌크 샘플에서 이형접합으로 호출된 부위를 조사하여 PTA가 이형접합 부위에서 대립유전자 왜곡을 유의하게 감소시켰음을 보였다(도 5f). 이 발견은 PTA가 게놈에 걸쳐 더 고르게 증폭될 뿐만 아니라 동일한 세포에서 2개의 대립유전자를 더 고르게 증폭한다는 주장을 뒷받침한다.
SNV 특이성
돌연변이 호출의 특이성을 평가하기 위해, 상응하는 벌크 샘플에서 확인되지 않은 각 단일 세포에서 호출된 변이체를 위양성으로 간주하였다. SCMDA의 더 낮은 온도 용해는 위양성 변이체 호출 수를 유의하게 감소시켰다(도 5g). 내열성 폴리머라제(MALBAC, PicoPlex 및 DOP-PCR)를 사용하는 방법은 시퀀싱 깊이가 증가함에 따라 SNV 호출 특이성이 추가로 감소하는 것으로 나타났다. 이론에 구속하고자 하는 것은 아니지만 이는 phi29 DNA 폴리머라제에 비해 이들 폴리머라제의 오류율이 크게 증가한 결과일 수 있다. 또한, 위양성 호출에서 보이는 염기 변화 패턴도 폴리머라제에 의존하는 것으로 보인다(도 5h). 도 5g에서 나타난 바와 같이, PTA에서 억제된 오류 전파 모델은 표준 MDA 프로토콜에 비해 PTA에서 더 낮은 위양성 SNV 호출 비율에 의해 뒷받침된다. 또한, PTA는 위양성 변이체 호출의 대립유전자 빈도가 가장 낮으며, 이는 PTA로 억제된 오류 전파 모델과 또한 일치한다(도 5i).
실시예 3: 대규모 병렬 단일 세포 DNA 시퀀싱
PTA를 사용하여, 대규모 병렬 DNA 시퀀싱을 위한 프로토콜을 확립한다. 먼저, 무작위 프라이머에 세포 바코드를 추가한다. 세포 바코드에 의해 도입되는 증폭의 임의의 편향을 최소화하기 위한 두 가지 전략을 사용한다: 1) 무작위 프라이머의 크기를 늘리고/거나, 2) 세포 바코드가 주형에 결합하는 것을 방지하기 위해 스스로 역으로 루프를 형성하는 프라이머를 생성한다(도 10b). 최적의 프라이머 전략이 수립되면, 예를 들어, 점성 액체도 높은 정확도로 25 nL의 부피까지 피펫팅할 수 있는 Mosquito HTS 액체 처리기를 사용하여 최대 384개의 분류된 세포를 확장할 수 있다. 이 액체 처리기는 또한 표준 50 μL 반응 부피 대신 1 μL PTA 반응을 사용하여 시약 비용을 대략 50배 절감한다.
증폭 프로토콜은 세포 바코드가 있는 프라이머를 액적에 전달함으로써 액적으로 이행된다. 분할 및 풀 전략을 사용하여 생성된 비드와 같은 고체 지지대를 임의로 사용한다. 적합한 비드는, 예를 들어, ChemGenes로부터 구입 가능하다. 일부 경우에, 올리고뉴클레오티드는 무작위 프라이머, 세포 바코드, 고유한 분자 식별자 및 절단성 서열 또는 스페이서를 함유하여 비드 및 세포가 동일한 액적에 캡슐화된 후 올리고뉴클레오티드를 방출한다. 이 과정 동안, 액적의 적은 나노리터 부피에 대해 주형, 프라이머, dNTP, 알파-티오-ddNTP, 및 폴리머라제 농도를 최적화한다. 일부 경우에, 최적화에는 반응 부피를 증가시키기 위해 더 큰 액적을 사용하는 것이 포함된다. 도 9에서 나타낸 바와 같이, 이 과정은 세포 용해, 이어서 WGA의 2개의 순차적 반응이 필요하다. 용해된 세포와 비드를 함유하는 첫 번째 액적은 증폭 믹스가 있는 두 번째 액적과 합한다. 대안적으로 또는 조합하여, 세포는 용해 전에 하이드로겔 비드에 캡슐화된 후, 두 비드 모두가 오일 액적에 첨가될 수 있다. 문헌(Lan, F. et al., Nature Biotechnol., 2017, 35:640-646)을 참조한다.
추가 방법은 마이크로 웰의 사용을 포함하며, 이는 일부 경우에 3" Х 2" 현미경 슬라이드 크기의 장치에서 20 피코리터 반응 챔버에서 140,000개의 단일 세포를 캡처한다. 액적 기반 방법과 유사하게, 이러한 웰은 세포 바코드를 함유하는 비드와 세포를 결합하여 대규모 병렬 처리를 허용한다. 문헌(Gole et al., Nature Biotechnol., 2013, 31:1126-1132)을 참조한다.
실시예 4: 단일 세포에서 게놈 및 전사체의 병렬 분석
세포 집단으로부터 단일 세포를 분류하여 웰당 하나의 세포를 배치한다. 각 웰은 표면 영역에 고정된 항체를 포함하고, 여기서 항체는 세포 핵에 결합한다. 세포의 외막은 용해되어 mRNA를 웰의 용액으로 방출하는 반면 뉴클레아제는 손상되지 않고 웰의 영역에 결합되어 있다. RT는 도 8a의 프라이머를 사용하여 cDNA를 생성하기 위해 주형으로서 용액 내 mRNA를 사용하여 수행된다. 임의로, rRNA(리보솜 RNA) 고갈 단계가 수행된다. 5'에서 3'로 TSS 영역(전사 시작 부위), 앵커 영역, RNA BC 영역, 및 폴리 dT 테일을 포함하는 제1 주형 전환 프라이머; 및 3'에서 5'로 TSS 영역, 앵커 영역, 및 폴리 G 영역을 포함하는 제2 주형 전환 프라이머는 RT PCR에 사용된다. 후속 시퀀싱을 위해 RT PCR 산물(cDNA 라이브러리)을 제거한 후, 세포에 남아 있는 임의의 RNA는 UNG에 의해 제거된다. RNA 라이브러리는 Nextera/트랜스포존 기반 시퀀싱 방법 및 시약을 사용하여 제조된다(도 8b). cDNA 라이브러리는 대략 1000배 증폭된 짧은 cDNA를 포함한다. 이어서, 핵이 용해되고 방출된 게놈 DNA는 6-9개 염기 길이의 무작위 프라이머를 갖는 등온 폴리머라제가 있는 무작위 프라이머를 사용하여 PTA 방법에 적용된다. PTA에 대한 증폭 조건은 250-1500개 염기 길이의 앰플리콘을 생성하도록 선택된다. PTA 산물은 임의로 추가 중폭 및 시퀀싱된다. RNA 시퀀싱 데이터 및 DNA 시퀀싱 데이터는 분석을 위해 데이터베이스로 컴파일링된다.
실시예 5: 단일 세포 멀티오믹 분석
세포 집단은 항체가 표지된 항체 라이브러리와 접촉된다. 항체는 형광성 표지, 핵산 바코드 또는 둘 모두로 표지된다. 표지된 항체는 집단에서 적어도 하나의 세포에 결합하고, 그러한 세포는 분류되어 웰당 하나의 세포가 배치된다. 일부 표지된 항체는 결합 후 세포 표면 단백질 마커에 대한 특정 정보를 제공하며, 이는 형광 현미경 검사법 또는 항체에 태그된 바코드 리드로 얻어진다. 각 웰은 표면의 영역에 고정된 항체를 포함하고, 여기서 항체는 세포 핵에 결합한다. 세포의 외막은 용해되어 mRNA를 웰의 용액으로 방출하는 반면 뉴클레아제는 손상되지 않고 웰의 영역에 결합되어 있다. 임의로, rRNA(리보솜 RNA) 고갈 단계가 수행된다. 다음으로, RT는 용액 중 mRNA를 주형으로 사용하여 수행되어 cDNA를 생성한다. 5'에서 3'로 TSS 영역(전사 시작 부위), 앵커 영역, RNA BC 영역, 및 폴리 dT 테일을 포함하는 제1 주형 전환 프라이머; 및 3'에서 5'로 TSS 영역, 앵커 영역, 및 폴리 G 영역을 포함하는 제2 주형 전환 프라이머는 RT PCR에 사용된다. 후속 시퀀싱을 위해 RT PCR 산물(cDNA 라이브러리)을 제거한 후, 세포에 남아 있는 임의의 RNA는 UNG에 의해 제거된다. cDNA 라이브러리는 대략 1000배 증폭된 짧은 cDNA를 포함한다. 이어서, 핵이 용해되고 방출된 게놈 DNA는 6-9개 염기 길이의 무작위 프라이머를 갖는 등온 폴리머라제를 갖는 무작위 프라이머를 사용하여 PTA 방법에 적용된다. PTA에 대한 증폭 조건은 250-1500개 염기 길이의 앰플리콘을 생성하도록 선택된다. PTA 산물은 임의로 추가 중폭 및 시퀀싱된다. 단백질 데이터, RNA 시퀀싱 데이터, 및 DNA 시퀀싱 데이터는 분석을 위해 데이터베이스로 컴파일링된다.
실시예 6: 메틸롬 및 전사체의 단일 세포 분석
세포 집단으로부터 단일 세포를 분류하여 웰당 하나의 세포를 배치한다. 각 웰은 표면의 영역에 고정된 항체를 포함하고, 여기서 항체는 세포 핵에 결합한다. 세포의 외막은 용해되어 mRNA를 웰의 용액으로 방출하는 반면 뉴클레아제는 손상되지 않고 웰의 영역에 결합되어 있다. mRNA 전사체는 말단 트랜스퍼라제와 접촉하여 mRNA 가닥의 5' 말단에 리보구아닌을 추가한다. 다음으로, RT는 용액 중 mRNA를 주형으로 사용하여 수행되어 cDNA를 생성한다. 임의로, rRNA(리보솜 RNA) 고갈 단계가 수행된다. 5'에서 3'로 TSS 영역(전사 시작 부위), 앵커 영역, RNA BC 영역, 및 폴리 dT 테일을 포함하는 제1 주형 전환 프라이머; 및 3'에서 5'로 TSS 영역, 앵커 영역, 및 폴리 G 영역을 포함하는 제2 주형 전환 프라이머는 RT PCR에 사용된다. 후속 시퀀싱을 위해 RT PCR 산물(cDNA 라이브러리)을 제거한 후, 세포에 남아 있는 임의의 RNA는 UNG에 의해 제거된다. cDNA 라이브러리는 대략 1000배 증폭된 짧은 cDNA를 포함한다. 이어서, 핵이 용해되고 방출된 게놈 DNA가 메틸화에 민감성 엔도뉴클레아제를 사용하여 단편화된다. 게놈 단편은 6-9개 염기 길이의 무작위 프라이머를 갖는 등온 폴리머라제가 있는 무작위 프라이머를 사용하여 PTA 방법에 적용된다. PTA에 대한 증폭 조건은 250-1500개 염기 길이의 앰플리콘을 생성하도록 선택된다. PTA 산물은 임의로 추가 중폭 및 시퀀싱된다. RNA 시퀀싱 데이터, 및 DNA 시퀀싱 데이터는 분석을 위해 데이터베이스로 컴파일링되고 메틸화 민감성 엔도뉴클레아제 절단 부위가 식별된다. 이러한 부위는 원래 게놈 DNA의 메틸화 위치를 맵핑하는 데 사용된다.
실시예 7: 메틸롬 및 게놈의 단일 세포 분석
세포 집단으로부터 단일 세포를 분류하여 웰당 하나의 세포를 배치한다. 각 웰은 표면의 영역에 고정된 항체를 포함하고, 여기서 항체는 세포 핵에 결합한다. 세포는 메틸화 민감성 효소로 용해되고, 게놈은 6-9개 염기 길이의 무작위 프라이머를 갖는 등온 폴리머라제가 있는 무작위 프라이머를 사용하여 PTA 방법에 적용된다. PTA에 대한 증폭 조건은 250-1500개 염기 길이의 앰플리콘을 생성하도록 선택된다. 반응 혼합물은 분할되며, 여기서 혼합물의 절반은 엑솜 농축, 전체 게놈 시퀀싱 또는 기타 표적 시퀀싱 방법에 적용된다. 반응 혼합물의 나머지 절반은 메틸화에 민감한 PCR 조건에 적용된다. 메틸화 및 DNA 시퀀싱 데이터는 분석을 위해 데이터베이스로 컴파일링된다.
실시예 8: 표면 프로테옴 및 게놈의 단일 세포 분석
세포 집단을 포함하는 샘플로부터의 세포는 항체, 폴리뉴클레오티드 또는 기타 소분자와 같은 베이트(bait) 라이브러리와 접촉된다. 일부 경우에, 베이트는 세포 표면 상의 단백질에 대한 베이트의 결합의 풀다운 및 식별을 허용하기 위해 바코드(예컨대 바코드 항체)가 있다. 대안적으로 또는 조합하여, 베이트는 형광 표지 또는 질량 태그와 같은 다른 표지로 표지된다. 세포 집단으로부터 단일 세포를 분류하여 웰당 하나의 세포를 배치한다. 임의로, 세포 표면에 결합된 베이트는 게놈 라이브러리 제조 전에 시퀀싱 또는 식별을 위해 제거된다. 세포가 용해되고 게놈이 용액으로 방출되고 단편이 생성된다. 게놈 단편은 6-9개 염기 길이의 무작위 프라이머를 갖는 등온 폴리머라제가 있는 무작위 프라이머를 사용하여 PTA 방법에 적용된다. 대안적으로, 게놈은 PTA로 증폭하기 전에 단편화되지 않는다. PTA에 대한 증폭 조건은 250-1500개 염기 길이의 앰플리콘을 생성하도록 선택된다. PTA 산물은 임의로 추가 증폭 및 시퀀싱된다. 세포 표면 단백질과 DNA 시퀀싱 데이터는 분석을 위해 데이터베이스로 컴파일링된다.
실시예 9: 약물 내성을 측정하기 위한 멀티오믹스
AML(급성 골수성 백혈병)에서 FLT3을 표적으로 하는 소분자 억제제를 사용한 단일요법은 임상적 이점을 보여주었지만 내성이 불가피하게 발생한다. FLT3 억제제 퀴자르티닙(AC220)은 그러한 억제제 중 하나로, 약물이 재발성 또는 불응성 AML 환자에서 대략 50%의 복합 완전 관해를 보였다. 이러한 성공에도 불구하고, 활성화 루프(D835) 및 게이트키퍼 잔기 F691에서 2차 FLT3 돌연변이가 퀴자르티닙 요법에서 재발한 FLT3-ITD 환자에서 확인되었다. 다중 키나제 억제제 PKC412에 대한 임상 내성은 FLT3 키나제 도메인의 2차 돌연변이의 결과인 것으로 결정되었다. AXL의 우회 경로 활성화와 NRAS, TET2 및 IDH1/2 돌연변이를 포함하여 표적 요법에 대한 FLT3 독립적 내성 모드가 FLT3-ITD AML에서 추가로 확인되었다. 후성유전학적 변형 효소의 돌연변이 및 전사 인자도 관찰되었으며, 이는 FLT3 억제에 대한 내성 기전의 복잡성과 다양성을 강조한다.
퀴자르티닙 내성 및 일치된 모 MOLM-13 AML 세포주, 및 이형접합 FLT3-ITD 돌연변이를 보유하는 세포주가 생성되었다. PTA 방법은 RNAseq 화학을 조합하고 AML에서 FLT3 억제 후 내성 기전에 대한 이해를 얻기 위해 이러한 약물 내성 단일 세포를 게놈 및 전사적으로 조사하는 데 사용되었다. 간단히, 워크플로우는 (1) 내성 세포의 생성, (2) 내성 세포의 단리, (3) mRNA를 방출하기 위한 세포기질 용해, (4) mRNA로부터 cDNA를 생성하기 위한 역전사, (5) 게놈 DNA를 방출하기 위한 핵 용해, (6) PTA 증폭, (7) 별도의 DNA/RNA 농축, (8) 농축된 mRNA의 cDNA PreAMP, (9) 라이브러리 제조, QC, 및 풀링, (10) 차세대 시퀀싱, 및 (11) 데이트 분석으로 구성되었다.
세포 배양. 이형접합 FLT3 내부 탠덤 중복(ITD)1을 보유한 MOLM-13 급성 골수성 백혈병 세포는 구입처(DSMZ-German Collection of Microorganisms and Cell Cultures (ACC 554))로부터 입수했다. 세포를 10% FBS 및 페니실린/스트렙토마이신이 보충된 RPMI 1640(Gibco 11875-093)에서 유지하고 2.5 E5 - 1.5 E6 세포/ml의 밀도 범위를 유지하면서 2-3일마다 계대 배양하였다. 퀴자르티닙 내성 MOLM-13 라인의 생성을 위해, 세포를 2 nM 퀴자르티닙으로 계속해서 처리하고 배양 5주 기간에 내성 클론이 나타날 때까지 각 계대 배양에서 약물을 보충하였다(도 9a). 게놈 DNA 또는 전체 RNA는 단일 세포 데이터세트와 비교하기 위한 벌크 시퀀싱 대조군 라이브러리를 생성하기 위해 FACS 분류 시 퀴자르티닙 내성 및 일치된 모 MOLM-13 세포로부터 단리되었다.
FACS. 단일 세포 분석을 위해, ~2.0 E6 MOLM-13 퀴자르티닙 내성 또는 일치된 모 세포를 2% FBS로 보충된 칼슘 및 마그네슘이 결여된 둘베코(Dulbecco)의 인산염 완충 식염수(Gibco)에서 2회 헹구고 BD FACSAria III FACS 분류까지 얼음 위에서 보관하였다. 칼세인 AM, 프로피디움 요오다이드 및 DAPI 염색 후, 살아있는 세포 게이팅을 확립하고(DAPI/PI 음성, 상위 70% 칼세인-AM 양성) 단일 세포를 세포 완충액을 함유하는 낮은 결합 96웰 PCR 플레이트(세미-스커트형)로 분류하고(130 미크론 노즐 조립) 짧은 볼텍싱 및 원심분리 후 드라이아이스에서 즉시 동결시켰다.
결합된 게놈/전사체 분석. 첫째, 비오틴 접합 올리고 dT 프라이머를 주형 전환 역전사 반응에 사용하여 단일 MOLM-13 모 또는 퀴자르티닙 내성 세포로부터 제1 가닥 cDNA를 생성하였다. 1차 주형 지시 증폭(PTA)을 역전사 후 연속적으로 수행하였다. 이어서, 제1 가닥 cDNA는 스트렙타비딘 M-280 비드를 사용하여 친화성 정제되었고 2회의 고염 세척 후 1회의 저염 세척을 거쳤다. 20주기의 사전증폭을 수행하여 제2 가닥 cDNA를 생성하고 Nextera DNA Flex 라이브러리 제조 키트를 사용하여 RNA 시퀀싱 라이브러리를 제조하였다. PTA 라이브러리 제조를 위해, 스트렙타비딘 비드에 결합되지 않은 PTA 산물을 비드를 사용하여 정제하고 TruSeq 어댑터로 결찰하였다. PTA 반응으로부터 증폭 산물은 먼저 비드 클린업으로 정제하고 큐빗(Qubit)으로 측정하고 전기영동으로 분석하였다. 포유동물 세포(~ 6pg DNA)에 대한 전형적인 수율은 1-3 ug이었고, 여기서, 단일 박테리아 게놈(2-4 fg)은 최대 50 ng까지 생성되었다. PTA로 증폭된 샘플의 앰플리콘 산물 크기는 0.2 kB와 4 kB 사이(평균 1.5 Kb)였다. PTA 라이브러리는 WGS 방법에 대해 단편화 없이 제조되었으며 300-550개 염기 크기 범위로 대략 500 ng의 수율을 생성하였다. 포유동물 세포로부터의 전체 게놈은 NovaSeq로 ~5억 5천만 리드를 표적으로 분석하였다. 이어서, 트리밍 정렬 및 VCF 파일 생성을 위해 시퀀싱 파일을 전송하고 TrailblazerTM 클라우드 기반 생물정보학 플랫폼 솔루션에 의해 분석하였다. QC 및 라이브러리 제조 시간은 4-6시간이었다. 비교를 위해 RNASeq만을 사용하여 병렬 실험을 수행하였다.
결과. 모 및 내성 배양 둘 모두로부터 RNA 발현은 단일-포트 RNA seq 화학을 사용하여 cDNA 풀을 생성하는 능력을 입증하였고(도 9b) 이들 세포에서 발현된 유전자는 세포당 검출된 평균 ~10K 유전자에 걸쳐 유전자 발현에 의해 세포 집단의 시각화를 가능하게 하는 별개의 패턴을 생성하였다. 별도의 워크플로우에서, 단일 세포 게놈은 PTA 방법을 사용하여 증폭되었다. 이어서, 2개의 프로토콜을 조합하여(도 9d의 수율) 각 세포로부터 조합된 전사체 및 게놈 cDNA 풀을 생성하였다. 낮은 통과(~ 5백만 리드/세포)는 낮은 미토콘드리아 염색체 양 및 높은 완전한 PreSeq 게놈 추정치를 갖는 내성 및 모 계통 둘 모두의 효과적인 증폭 및 라이브러리 제조를 입증한다(도 10a-10c). 데이터는 RT 단계 동안 생성된 전사체가 DNA와 비교하여 PTA 반응에 의해 효과적으로 증폭되지 않으며 단일 세포의 DNA가 단일 세포로부터 표준 PTA 증폭 게놈과 비교하여 조합된 프로토콜을 사용하여 효과적으로 증폭된다는 것을 입증하였다(도 9d). 조합된 RNASeq/PTA 방법은 표준 PTA 프로토콜과 유사한 결과(도 10a)를 생성했으며, 여기서 ChrM 및 중복체 퍼센트는 전형적으로 2% 미만이고 추정 게놈 크기는 30억 염기 초과였다(도 10a-10c). 게놈 평가는 90% 초과의 맵핑 및 커버리지와 각 세포에서 단일 뉴클레오티드 변이체의 75% 이상의 특정 호출을 보여주었다. 표준 PTA 게놈 화학과 비교하여 이중 프로토콜에서 더 많은 변화가 관찰되었다. 전사체의 경우, 프로토타입 화학은 엑손-엑손 접합을 포함하는 ~3000-5000개의 유전자를 검출하는 것으로 나타났다. 유전자의 ~30%가 RNAseq-단독 프로토콜(도 9c)과 비교하여 이중 프로토콜(도 10d)에서 검출되었다. 또한, 이중/조합 RNASeq/PTA 프로토콜은 제2 내성 세포주 SUM159(삼중 음성 유방암 세포주)와 함께 사용되었다. 두 프로토콜에서 실행된 RNAseq 데이터는 유사한 PCA 분포를 생성했으며, 이는 조합된 화학이 단일 세포 유형의 모 및 내성 세포로 제한되지 않는 차등 유전자 발현을 검출할 수 있음을 나타낸다(도 10e-10f).
7개의 모 세포 및 5개의 내성 molm13 세포의 딥 시퀀싱이 25x의 대략적인 깊이로 수행되었다(도 11). 리드는 bwa mem을 사용하여 Hg38에 정렬되었다. 품질 관리 및 SNV 호출은 GATK4 모범 사례를 사용하여 수행되었다. SNV는 적어도 2개의 내성 세포로 제한되었고 임의의 모 세포에서 어떠한 대안적 대립유전자도 호출되지 않았고 적어도 6개의 모 세포가 유전자형화된 경우에만 고려되었다. 모든 세포는 1x 커버리지에서 게놈의 적어도 96%가 그리고 10x에서 적어도 76%가 커버되었다. 삽입체는 molm13 세포에서 알려진 Flt3 삽입-결실이 모든 세포에서 검출된다는 것을 나타낸다(명확성을 위해 4개를 나타냄).
RNAseq 및 PTA 방법은 맵핑 및 커버리지가 둘 모두 95%를 초과하고 ChrM 및 PCR 중복체가 일반적으로 2.0% 미만인 경우 일반적으로 유사하다. 또한, 합 159개의 모 세포주와 내성 세포주 둘 모두의 선택 샘플에서 게놈의 95% 초과가 회수되었다. Molm13 세포주에 대해, 퀴자르티닙 내성의 알려진 기전인 과발현된 유전자 GAS6(L)이 확인되었다. Gas6은 퀴자르티닙 치료에 실패한 재발 환자에서 임상적으로 관련된 내성 기전인 AXL에 대한 리간드이다(도 11b). 이중 프로토콜로부터의 모 세포주와 내성 MOLM13 세포주 둘 모두의 심층 게놈 시퀀싱은 모든 염색체에 걸쳐 분포된 돌연변이를 검출하였다. 총체적으로, 모든 단일 세포 중에서 퀴자르티닙 내성 집단에 고유한 5675개의 SNV가 확인되었다. 코딩 서열 변이가 검출되었지만, 관찰된 변이체의 대부분은 유전자간 공간에 있었다. 이론에 구속시키고자 하는 것은 아니지만 패신저 돌연변이는 의심할 여지 없이 이 변이체 코호트에 존재하지만, 이는 인핸서 또는 프로모터 수준에서 유전자 발현의 조절이 잠재적으로 비코딩 RNA의 조절뿐만 아니라 내성에 기여한다는 것을 시사한다. 이중 mRNA seq 전사체 화학/PTA는 단일 세포에서 10K 초과의 유전자를 검출할 수 있는 능력이 있으며, 이는 FACS에 의해 농축될 수 있다. PTA 방법은 개별 세포의 전체 게놈의 97% 초과를 회수하는 능력이 있다. 전사체와 게놈 둘 모두를 회수하는 능력은 대부분의 게놈을 회수하는 능력에 대한 민감도에 유의하게 영향을 미치지 않는다. 전사체 단독 또는 조합된 전사체/게놈 증폭 화학을 비교할 때 발현된 유전자의 70% 초과가 많은 세포에서 검출될 수 있다.
실시예 10: 엑솜 캡처를 사용한 PTA 단일 세포 분석
실시예 3의 일반적인 PTA 방법은 변형하여 사용하였다: 추가 엑솜 캡처 단계를 사용하여 PTA 생성된 앰플리콘을 농축했다. 단일 세포 샘플(27개 샘플)과 벌크 샘플(112개 샘플) 모두에 대해 6천만 개의 리드를 얻었다. 단일 세포로부터의 엑솜 캡처 시퀀싱 결과를 벌크 샘플의 결과와 비교하였다(도 12a-12d, 13a, 14a, 및 14b). 시퀀싱 결과는 여러 샘플에 걸쳐 일관되었고(도 13a), 캡처된 앰플리콘의 평균 크기는 623개 염기였다(도 13b).
실시예 11: 엑솜 캡처 + 멀티오믹스
실시예 5-8 중 어느 하나의 일반적인 방법은 변형하여 사용한다: 추가 캡처 단계를 사용하여 게놈 DNA로부터 생성된 PTA 생성 앰플리콘을 농축했다. 캡처 단계는 엑솜 패널 또는 특정 유전자를 표적으로 하는 다른 패널을 포함한다. 일부 경우에, 그러한 패널이 암 핫스팟, 바이러스 게놈 또는 미토콘드리아 DNA에 관한 것이다.
본원에 설명되는 구현예는 이러한 구현예가 단지 예로서 제공된다는 것이 당업자에게 명백할 것이다. 이제 본 발명으로부터 벗어나지 않고 당업자에게 다양한 변형, 변화 및 대체가 일어날 것이다. 본원에 기재된 본 발명의 구현예에 대한 다양한 대안이 본 발명을 실시하는 데 사용될 수 있음을 이해해야 한다. 다음의 청구범위는 본 발명의 범위를 정의하고, 이러한 청구 범위의 범주 내의 방법 및 구조 및 그 등가물이 이로써 포함되도록 의도된다.
SEQUENCE LISTING
<110> BIOSKRYB, INC.
<120> SINGLE CELL ANALYSIS
<130> 55461-703.601
<140> PCT/US2020/044338
<141> 2020-07-30
<150> 62/881,183
<151> 2019-07-31
<160> 20
<170> PatentIn version 3.5
<210> 1
<211> 100
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<220>
<221> modified_base
<222> (63)..(68)
<223> a, c, t, g, unknown or other
<220>
<221> modified_base
<222> (100)..(100)
<223> a, c, t, g, unknown or other
<400> 1
tgtcgttgtt gtcggccttc tctggaagca gtggtatcaa cgcagagtac ggacgttcag 60
agnnnnnntt tttttttttt tttttttttt ttttttttvn 100
<210> 2
<211> 23
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 2
aagcagtggt atcaacgcag agt 23
<210> 3
<211> 30
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> Description of Combined DNA/RNA Molecule: Synthetic
oligonucleotide
<400> 3
aagcagtggt atcaacgcag agtacatggg 30
<210> 4
<211> 15
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 4
gtctcgtggg ctcgg 15
<210> 5
<211> 47
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 5
caagcagaag acggcatacg agattcgcct tagtctcgtg ggctcgg 47
<210> 6
<211> 66
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 6
aatgatacgg cgaccaccga gatctacacg cctgtccgcg gaagcagtgg tatcaacgca 60
gagtac 66
<210> 7
<211> 68
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 7
aatgatacgg cgaccaccga gatctacacg cctgtccgcg gaagcagtgg tatcaacgca 60
gagtacgg 68
<210> 8
<211> 28
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<221> modified_base
<222> (1)..(1)
<223> a, c, t, g, unknown or other
<400> 8
nbaaaaaaaa aaaaaaaaaa aaaaaaaa 28
<210> 9
<211> 30
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<223> Description of Combined DNA/RNA Molecule: Synthetic
oligonucleotide
<400> 9
cccatgtact ctgcgttgat accactgctt 30
<210> 10
<211> 100
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<220>
<221> modified_base
<222> (1)..(1)
<223> a, c, t, g, unknown or other
<220>
<221> modified_base
<222> (33)..(38)
<223> a, c, t, g, unknown or other
<400> 10
nvaaaaaaaa aaaaaaaaaa aaaaaaaaaa aannnnnnct ctgaacgtcc gtactctgcg 60
ttgataccac tgcttccaga gaaggccgac aacaacgaca 100
<210> 11
<211> 75
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<221> modified_base
<222> (1)..(1)
<223> a, c, t, g, unknown or other
<220>
<221> modified_base
<222> (33)..(38)
<223> a, c, t, g, unknown or other
<400> 11
nvaaaaaaaa aaaaaaaaaa aaaaaaaaaa aannnnnnct ctgaacgtcc gtactctgcg 60
ttgataccac tgctt 75
<210> 12
<211> 75
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<220>
<221> modified_base
<222> (38)..(43)
<223> a, c, t, g, unknown or other
<220>
<221> modified_base
<222> (75)..(75)
<223> a, c, t, g, unknown or other
<400> 12
aagcagtggt atcaacgcag agtacggacg ttcagagnnn nnnttttttt tttttttttt 60
tttttttttt tttvn 75
<210> 13
<211> 19
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 13
ctgtctctta tacacatct 19
<210> 14
<211> 34
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 14
gtctcgtggg ctcggagatg tgtataagag acag 34
<210> 15
<211> 116
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<220>
<221> modified_base
<222> (79)..(84)
<223> a, c, t, g, unknown or other
<220>
<221> modified_base
<222> (116)..(116)
<223> a, c, t, g, unknown or other
<400> 15
aatgatacgg cgaccaccga gatctacacg cctgtccgcg gaagcagtgg tatcaacgca 60
gagtacggac gttcagagnn nnnntttttt tttttttttt tttttttttt ttttvn 116
<210> 16
<211> 34
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 16
ctgtctctta tacacatctc cgagcccacg agac 34
<210> 17
<211> 116
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
polynucleotide
<220>
<221> modified_base
<222> (1)..(1)
<223> a, c, t, g, unknown or other
<220>
<221> modified_base
<222> (33)..(38)
<223> a, c, t, g, unknown or other
<400> 17
nvaaaaaaaa aaaaaaaaaa aaaaaaaaaa aannnnnnct ctgaacgtcc gtactctgcg 60
ttgataccac tgcttccgcg gacaggcgtg tagatctcgg tggtcgccgt atcatt 116
<210> 18
<211> 66
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 18
caagcagaag acggcatacg agattcgcct tagtctcgtg ggctcggaga tgtgtataag 60
agacag 66
<210> 19
<211> 66
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 19
ctgtctctta tacacatctc cgagcccacg agactaaggc gaatctcgta tgccgtcttc 60
tgcttg 66
<210> 20
<211> 37
<212> DNA
<213> Artificial Sequence
<220>
<223> Description of Artificial Sequence: Synthetic
oligonucleotide
<400> 20
gcctgtccgc ggaagcagtg gtatcaacgc agagtac 37
Claims (33)
- 멀티오믹(multiomic) 단일 세포 분석 방법으로서,
a. 세포 집단으로부터 단일 세포를 단리하는 단계;
b. 상기 단일 세포로부터의 mRNA 전사체로부터 증폭된 폴리뉴클레오티드를 포함하는 cDNA 라이브러리를 시퀀싱하는 단계; 및
c. 상기 단일 세포의 게놈을 시퀀싱하는 단계로서, 상기 게놈을 시퀀싱하는 단계는
i. 상기 게놈을 적어도 하나의 증폭 프라이머, 적어도 하나의 핵산 폴리머라제, 및 뉴클레오티드의 혼합물과 접촉시키는 단계로서, 상기 뉴클레오티드의 혼합물은 폴리머라제에 의한 핵산 복제를 종결시키는 적어도 하나의 종결자 뉴클레오티드를 포함하는 것인 단계;
ii. 상기 게놈의 적어도 일부를 증폭하여 복수의 종결된 증폭 산물을 생성하는 단계로서, 상기 복제는 가닥 치환 복제에 의해 진행되는 것인 단계;
iii. 단계 (ii)에서 얻은 분자를 어댑터로 결찰하여 게놈 DNA 라이브러리를 생성하는 단계; 및
iv. 상기 게놈 DNA 라이브러리를 시퀀싱하는 단계
를 포함하는 것인 단계
를 포함하는, 멀티오믹 단일 세포 분석 방법. - 제1항에 있어서, mRNA 전사체가 폴리아데닐화 mRNA 전사체를 포함하는 것인 방법.
- 제1항에 있어서, mRNA 전사체가 폴리아데닐화 mRNA 전사체를 포함하지 않는 것인 방법.
- 제1항에 있어서, cDNA 라이브러리를 시퀀싱하는 단계가 주형 전환 프라이머를 사용한 mRNA 전사체의 증폭을 포함하는 것인 방법.
- 제1항에 있어서, cDNA 라이브러리의 폴리뉴클레오티드 중 적어도 일부가 바코드를 포함하는 것인 방법.
- 제5항에 있어서, 바코드가 세포 바코드 또는 샘플 바코드를 포함하는 것인 방법.
- 제1항에 있어서, cDNA 라이브러리 및 게놈 DNA 라이브러리가 시퀀싱 전에 풀링되는 것인 방법.
- 제1항에 있어서, 단일 세포가 1차 세포인 방법.
- 제1항에 있어서, 단일 세포가 간, 피부, 콩팥, 혈액, 또는 폐로부터 유래하는 것인 방법.
- 제1항에 있어서, 단일 세포가 암세포, 뉴런, 신경교 세포, 또는 태아 세포인 방법.
- 제1항에 있어서, 단일 세포가 유세포 분석에 의해 단리되는 것인 방법.
- 제1항에 있어서, 종결된 증폭 산물로부터 적어도 하나의 종결자 뉴클레오티드를 제거하는 단계를 추가로 포함하는 방법.
- 제1항에 있어서, 복수의 종결된 증폭 산물이 평균 1000-2000개 염기 길이를 포함하는 것인 방법.
- 제1항에 있어서, 복수의 종결된 증폭 산물이 250-1500개 염기 길이인 방법.
- 제1항에 있어서, 복수의 종결된 증폭 산물이 단일 세포 게놈의 적어도 97%를 포함하는 것인 방법.
- 제1항에 있어서, 증폭 산물의 적어도 일부가 세포 바코드 또는 샘플 바코드를 포함하는 것인 방법.
- 제1항에 있어서, cDNA 라이브러리를 시퀀싱하는 단계가 단일 세포의 세포기질 용해 및 역전사를 포함하는 것인 방법.
- 제1항에 있어서, mRNA 전사체가 주형 전환 역전사를 통해 증폭되는 것인 방법.
- 제1항에 있어서, cDNA 라이브러리가 적어도 10,000개의 유전자를 포함하는 것인 방법.
- 제1항에 있어서, 단일 세포의 게놈을 시퀀싱하는 단계가 단일 세포의 핵 용해를 추가로 포함하는 것인 방법.
- 제1항에 있어서, PCR을 사용하는 추가 증폭 단계를 추가로 포함하는 방법.
- 제1항에 있어서, 적어도 하나의 돌연변이가 세포의 게놈에서 확인되고, 상기 돌연변이가 참조 서열의 상응하는 위치와 상이한 것인 방법.
- 제1항에 있어서, 적어도 하나의 돌연변이가 세포 집단의 1% 미만에서 발생하는 것인 방법.
- 제1항에 있어서, 적어도 하나의 돌연변이가 세포 집단의 0.1% 이하에서 발생하는 것인 방법.
- 제1항에 있어서, 적어도 하나의 돌연변이가 세포 집단의 0.001% 이하에서 발생하는 것인 방법.
- 제1항에 있어서, 적어도 하나의 돌연변이가 증폭 산물 서열의 1% 이하에서 발생하는 것인 방법.
- 제1항에 있어서, 적어도 하나의 돌연변이가 증폭 산물 서열의 0.1% 이하에서 발생하는 것인 방법.
- 제1항에 있어서, 적어도 하나의 돌연변이가 증폭 산물 서열의 0.001% 이하에서 발생하는 것인 방법.
- 멀티오믹 단일 세포 분석 방법으로서,
a. 세포 집단으로부터 단일 세포를 단리하는 단계;
b. 상기 단일 세포의 표면 상의 적어도 하나의 단백질을 확인하는 단계; 및
c. 상기 단일 세포의 게놈을 시퀀싱하는 단계로서, 상기 게놈을 시퀀싱을 시퀀싱하는 단계는:
i. 상기 게놈을 적어도 하나의 증폭 프라이머, 적어도 하나의 핵산 폴리머라제, 및 뉴클레오티드의 혼합물과 접촉시키는 단계로서, 상기 뉴클레오티드의 혼합물은 폴리머라제에 의한 핵산 복제를 종결시키는 적어도 하나의 종결자 뉴클레오티드를 포함하는 것인 단계;
ii. 상기 게놈의 적어도 일부를 증폭하여 복수의 종결된 증폭 산물을 생성하는 단계로서, 상기 복제는 가닥 치환 복제에 의해 진행되는 것인 단계;
iii. 단계 (ii)에서 얻은 분자를 어댑터로 결찰하여 게놈 DNA 라이브러리를 생성하는 단계; 및
iv. 상기 게놈 DNA 라이브러리를 시퀀싱하는 단계
를 포함하는 것인 단계
를 포함하는, 멀티오믹 단일 세포 분석 방법. - 제29항에 있어서, 세포 표면 상의 적어도 하나의 단백질을 확인하는 단계가 세포를 적어도 하나의 단백질에 결합하는 표지된 항체와 접촉시키는 것을 포함하는 방법.
- 제30항에 있어서, 표지된 항체가 적어도 하나의 형광 표지 또는 질량 태그를 포함하는 것인 방법.
- 제30항에 있어서, 표지된 항체가 적어도 하나의 핵산 바코드를 포함하는 것인 방법.
- 멀티오믹 단일 세포 분석 방법으로서,
a. 세포 집단으로부터 단일 세포를 단리하는 단계;
b. 상기 단일 세포의 게놈을 시퀀싱하는 단계로서, 상기 세포의 게놈을 시퀀싱하는 단계는:
i. 상기 게놈을 메틸화 민감성 제한 효소로 분해하여 게놈 단편을 생성하는 단계;
ii. 상기 게놈 단편의 적어도 일부를 적어도 하나의 증폭 프라이머, 적어도 하나의 핵산 폴리머라제, 및 뉴클레오티드의 혼합물과 접촉시키는 단계로서, 상기 뉴클레오티드의 혼합물은 폴리머라제에 의한 핵산 복제를 종결시키는 적어도 하나의 종결자 뉴클레오티드를 포함하는 것인 단계;
iii. 상기 게놈의 적어도 일부를 증폭하여 복수의 종결된 증폭 산물을 생성하는 단계로서, 상기 복제는 가닥 치환 복제에 의해 진행되는 것인 단계;
iv. 상기 게놈 단편의 적어도 일부를 메틸화-특이적 PCR로 증폭하는 단계;
v. 단계 (iii 및 iv)에서 얻은 분자를 어댑터로 결찰하여 게놈 DNA 라이브러리 및 메틸롬 DNA 라이브러리를 생성하는 단계; 및
vi. 상기 게놈 DNA 라이브러리 및 상기 메틸롬 라이브러리를 시퀀싱하는 단계
를 포함하는 것인 단계
를 포함하는, 멀티오믹 단일 세포 분석 방법.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201962881183P | 2019-07-31 | 2019-07-31 | |
US62/881,183 | 2019-07-31 | ||
PCT/US2020/044338 WO2021022085A2 (en) | 2019-07-31 | 2020-07-30 | Single cell analysis |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20220041875A true KR20220041875A (ko) | 2022-04-01 |
Family
ID=74228691
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020227006454A Pending KR20220041875A (ko) | 2019-07-31 | 2020-07-30 | 단일 세포 분석 |
Country Status (10)
Country | Link |
---|---|
US (1) | US20230220377A1 (ko) |
EP (1) | EP4004201A4 (ko) |
JP (1) | JP2022543051A (ko) |
KR (1) | KR20220041875A (ko) |
CN (1) | CN114555802B (ko) |
AU (1) | AU2020322027A1 (ko) |
CA (1) | CA3149610A1 (ko) |
IL (1) | IL290245A (ko) |
MX (1) | MX2022001324A (ko) |
WO (1) | WO2021022085A2 (ko) |
Families Citing this family (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2024509984A (ja) * | 2021-03-19 | 2024-03-05 | パリ シアンス エ レットル | 細胞又は細胞小器官の選択的分析のための方法 |
CN113151425B (zh) * | 2021-04-08 | 2023-01-06 | 中国计量科学研究院 | 基于关键指标提高准确性的单细胞测序方法 |
WO2022232050A1 (en) * | 2021-04-26 | 2022-11-03 | The Broad Institute, Inc. | Compositions and methods for characterizing polynucleotide sequence alterations |
EP4388128A1 (en) * | 2021-08-16 | 2024-06-26 | Bioskryb Genomics, Inc. | Embryonic nucleic acid analysis |
WO2023055790A1 (en) * | 2021-09-29 | 2023-04-06 | Battelle Memorial Institute | Apparatus and methods for performing multiple omics analysis and processing analyte mixtures |
CN113943729B (zh) * | 2021-10-20 | 2023-05-16 | 翌圣生物科技(上海)股份有限公司 | U型接头及采用u型接头介导的磁珠偶联转座酶进行rna快速均一化建库的方法 |
EP4514961A1 (en) * | 2022-04-28 | 2025-03-05 | Bioskryb Genomics, Inc. | Single cell multiomics |
AU2023264552A1 (en) * | 2022-05-05 | 2024-12-19 | BioSkryb Genomics, Inc. | Primary template-directed amplification and methods thereof |
CN115144519A (zh) * | 2022-06-30 | 2022-10-04 | 上海交通大学 | 基于无机纳米颗粒的单细胞样品指纹图谱检测方法和应用 |
WO2024026376A2 (en) * | 2022-07-27 | 2024-02-01 | BioSkryb Genomics, Inc. | Methods and systems for multiomic analysis |
Family Cites Families (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
ATE510930T1 (de) * | 2005-08-02 | 2011-06-15 | Rubicon Genomics Inc | Zusammensetzungen und verfahren zur bearbeitung und amplifikation von dna mit verwendung mehrerer enzyme in einer einzigen reaktion |
US9309511B2 (en) * | 2007-08-28 | 2016-04-12 | The Johns Hopkins University | Functional assay for identification of loss-of-function mutations in genes |
US9982304B2 (en) * | 2010-09-03 | 2018-05-29 | The Johns Hopkins University | ARID1A and PPP2R1A mutations in cancer |
US10480021B2 (en) * | 2014-06-23 | 2019-11-19 | Yale University | Methods for closed chromatin mapping and DNA methylation analysis for single cells |
CA2974306A1 (en) * | 2015-02-04 | 2016-08-11 | The Regents Of The University Of California | Sequencing of nucleic acids via barcoding in discrete entities |
US11460468B2 (en) * | 2016-09-26 | 2022-10-04 | Becton, Dickinson And Company | Measurement of protein expression using reagents with barcoded oligonucleotide sequences |
AU2017382905A1 (en) * | 2016-12-21 | 2019-07-04 | The Regents Of The University Of California | Single cell genomic sequencing using hydrogel based droplets |
CN117821565A (zh) * | 2017-03-08 | 2024-04-05 | 芝加哥大学 | 高灵敏度dna甲基化分析方法 |
SG10202108175RA (en) * | 2017-06-07 | 2021-09-29 | Univ Oregon Health & Science | Single cell whole genome libraries for methylation sequencing |
ES2999650T3 (en) * | 2017-08-01 | 2025-02-26 | Illumina Inc | Spatial indexing of genetic material and library preparation using hydrogel beads and flow cells |
WO2019084055A1 (en) * | 2017-10-23 | 2019-05-02 | Massachusetts Institute Of Technology | CLASSIFICATION OF GENETIC VARIATION FROM UNICELLULAR TRANSCRIPTOMS |
-
2020
- 2020-07-30 KR KR1020227006454A patent/KR20220041875A/ko active Pending
- 2020-07-30 MX MX2022001324A patent/MX2022001324A/es unknown
- 2020-07-30 US US17/631,130 patent/US20230220377A1/en active Pending
- 2020-07-30 JP JP2022506428A patent/JP2022543051A/ja active Pending
- 2020-07-30 CN CN202080069560.6A patent/CN114555802B/zh active Active
- 2020-07-30 EP EP20847237.3A patent/EP4004201A4/en active Pending
- 2020-07-30 AU AU2020322027A patent/AU2020322027A1/en active Pending
- 2020-07-30 WO PCT/US2020/044338 patent/WO2021022085A2/en active Application Filing
- 2020-07-30 CA CA3149610A patent/CA3149610A1/en active Pending
-
2022
- 2022-01-30 IL IL290245A patent/IL290245A/en unknown
Also Published As
Publication number | Publication date |
---|---|
EP4004201A2 (en) | 2022-06-01 |
JP2022543051A (ja) | 2022-10-07 |
WO2021022085A3 (en) | 2021-03-11 |
MX2022001324A (es) | 2022-05-19 |
WO2021022085A2 (en) | 2021-02-04 |
CN114555802B (zh) | 2025-01-07 |
CN114555802A (zh) | 2022-05-27 |
US20230220377A1 (en) | 2023-07-13 |
EP4004201A4 (en) | 2023-08-23 |
AU2020322027A1 (en) | 2022-03-03 |
IL290245A (en) | 2022-03-01 |
CA3149610A1 (en) | 2021-02-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN114555802B (zh) | 单细胞分析 | |
US11643682B2 (en) | Method for nucleic acid amplification | |
US20220277805A1 (en) | Genetic mutational analysis | |
US20240368695A1 (en) | Embryonic nucleic acid analysis | |
US20240271210A1 (en) | Spatial nucleic acid analysis | |
US20240316556A1 (en) | High-throughput analysis of biomolecules | |
AU2023264552A1 (en) | Primary template-directed amplification and methods thereof | |
WO2024158720A2 (en) | Fine needle aspiration methods | |
CN119585427A (zh) | 单细胞多组学 | |
WO2024073510A2 (en) | Methods and compositions for fixed sample analysis |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PA0105 | International application |
Patent event date: 20220224 Patent event code: PA01051R01D Comment text: International Patent Application |
|
PG1501 | Laying open of application |