CN114901818B - 靶向核酸文库形成的方法 - Google Patents
靶向核酸文库形成的方法 Download PDFInfo
- Publication number
- CN114901818B CN114901818B CN201980089745.0A CN201980089745A CN114901818B CN 114901818 B CN114901818 B CN 114901818B CN 201980089745 A CN201980089745 A CN 201980089745A CN 114901818 B CN114901818 B CN 114901818B
- Authority
- CN
- China
- Prior art keywords
- probe
- nucleic acid
- bridge
- target
- adapter
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 150000007523 nucleic acids Chemical class 0.000 title claims description 301
- 102000039446 nucleic acids Human genes 0.000 title claims description 300
- 108020004707 nucleic acids Proteins 0.000 title claims description 300
- 238000000034 method Methods 0.000 title claims description 248
- 239000000523 sample Substances 0.000 claims abstract description 759
- 230000003321 amplification Effects 0.000 claims abstract description 48
- 238000003199 nucleic acid amplification method Methods 0.000 claims abstract description 48
- 108020004414 DNA Proteins 0.000 claims description 106
- LSNNMFCWUKXFEE-UHFFFAOYSA-M Bisulfite Chemical compound OS([O-])=O LSNNMFCWUKXFEE-UHFFFAOYSA-M 0.000 claims description 71
- 230000027455 binding Effects 0.000 claims description 60
- 238000012163 sequencing technique Methods 0.000 claims description 43
- YBJHBAHKTGYVGT-ZKWXMUAHSA-N (+)-Biotin Chemical compound N1C(=O)N[C@@H]2[C@H](CCCCC(=O)O)SC[C@@H]21 YBJHBAHKTGYVGT-ZKWXMUAHSA-N 0.000 claims description 36
- 239000011324 bead Substances 0.000 claims description 35
- 108010010677 Phosphodiesterase I Proteins 0.000 claims description 26
- 206010028980 Neoplasm Diseases 0.000 claims description 25
- 239000007787 solid Substances 0.000 claims description 24
- 229960002685 biotin Drugs 0.000 claims description 18
- 235000020958 biotin Nutrition 0.000 claims description 18
- 239000011616 biotin Substances 0.000 claims description 18
- 108010090804 Streptavidin Proteins 0.000 claims description 16
- 102000053602 DNA Human genes 0.000 claims description 14
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical class NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 claims description 13
- 230000000865 phosphorylative effect Effects 0.000 claims description 11
- WSFSSNUMVMOOMR-UHFFFAOYSA-N Formaldehyde Chemical compound O=C WSFSSNUMVMOOMR-UHFFFAOYSA-N 0.000 claims description 6
- 102000003960 Ligases Human genes 0.000 claims description 5
- 108090000364 Ligases Proteins 0.000 claims description 5
- 108020004682 Single-Stranded DNA Proteins 0.000 claims description 5
- 230000033616 DNA repair Effects 0.000 claims description 4
- 239000012188 paraffin wax Substances 0.000 claims description 3
- 239000012472 biological sample Substances 0.000 claims description 2
- 238000000338 in vitro Methods 0.000 claims description 2
- 230000001225 therapeutic effect Effects 0.000 claims 1
- 238000009396 hybridization Methods 0.000 abstract description 113
- 238000004458 analytical method Methods 0.000 abstract description 9
- 239000000047 product Substances 0.000 description 266
- 239000002773 nucleotide Substances 0.000 description 85
- 125000003729 nucleotide group Chemical group 0.000 description 85
- 238000006243 chemical reaction Methods 0.000 description 47
- ISAKRJDGNUQOIC-UHFFFAOYSA-N Uracil Chemical compound O=C1C=CNC(=O)N1 ISAKRJDGNUQOIC-UHFFFAOYSA-N 0.000 description 38
- 230000000295 complement effect Effects 0.000 description 38
- 102100022704 Amyloid-beta precursor protein Human genes 0.000 description 37
- 108060002716 Exonuclease Proteins 0.000 description 27
- 102000013165 exonuclease Human genes 0.000 description 27
- 239000000203 mixture Substances 0.000 description 27
- 102100029470 Apolipoprotein E Human genes 0.000 description 24
- 230000029087 digestion Effects 0.000 description 20
- 230000011987 methylation Effects 0.000 description 20
- 238000007069 methylation reaction Methods 0.000 description 20
- 238000003752 polymerase chain reaction Methods 0.000 description 20
- 229940035893 uracil Drugs 0.000 description 19
- 201000011510 cancer Diseases 0.000 description 17
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 17
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 14
- 238000002844 melting Methods 0.000 description 13
- 230000008018 melting Effects 0.000 description 13
- 238000000137 annealing Methods 0.000 description 12
- 201000010099 disease Diseases 0.000 description 12
- 230000008685 targeting Effects 0.000 description 12
- -1 DNA) may be Chemical class 0.000 description 9
- 230000015572 biosynthetic process Effects 0.000 description 9
- 238000001514 detection method Methods 0.000 description 9
- 210000001519 tissue Anatomy 0.000 description 9
- 210000004027 cell Anatomy 0.000 description 8
- 102000052116 epidermal growth factor receptor activity proteins Human genes 0.000 description 8
- 108700015053 epidermal growth factor receptor activity proteins Proteins 0.000 description 8
- YOHYSYJDKVYCJI-UHFFFAOYSA-N n-[3-[[6-[3-(trifluoromethyl)anilino]pyrimidin-4-yl]amino]phenyl]cyclopropanecarboxamide Chemical compound FC(F)(F)C1=CC=CC(NC=2N=CN=C(NC=3C=C(NC(=O)C4CC4)C=CC=3)C=2)=C1 YOHYSYJDKVYCJI-UHFFFAOYSA-N 0.000 description 8
- 239000007850 fluorescent dye Substances 0.000 description 7
- 239000000463 material Substances 0.000 description 7
- 230000035772 mutation Effects 0.000 description 7
- 230000007067 DNA methylation Effects 0.000 description 6
- 108091034117 Oligonucleotide Proteins 0.000 description 6
- 238000010276 construction Methods 0.000 description 6
- 230000003993 interaction Effects 0.000 description 6
- 108090000623 proteins and genes Proteins 0.000 description 6
- 238000003786 synthesis reaction Methods 0.000 description 6
- 108091029523 CpG island Proteins 0.000 description 5
- 230000001010 compromised effect Effects 0.000 description 5
- 208000035475 disorder Diseases 0.000 description 5
- 238000005259 measurement Methods 0.000 description 5
- 108091008146 restriction endonucleases Proteins 0.000 description 5
- 229930024421 Adenine Natural products 0.000 description 4
- GFFGJBXGBJISGV-UHFFFAOYSA-N Adenine Chemical compound NC1=NC=NC2=C1N=CN2 GFFGJBXGBJISGV-UHFFFAOYSA-N 0.000 description 4
- 208000023275 Autoimmune disease Diseases 0.000 description 4
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 4
- 102000008158 DNA Ligase ATP Human genes 0.000 description 4
- 108010060248 DNA Ligase ATP Proteins 0.000 description 4
- 102000012410 DNA Ligases Human genes 0.000 description 4
- 108010061982 DNA Ligases Proteins 0.000 description 4
- 208000012902 Nervous system disease Diseases 0.000 description 4
- 208000025966 Neurological disease Diseases 0.000 description 4
- 101710163270 Nuclease Proteins 0.000 description 4
- 108091028043 Nucleic acid sequence Proteins 0.000 description 4
- 108091093037 Peptide nucleic acid Proteins 0.000 description 4
- CZPWVGJYEJSRLH-UHFFFAOYSA-N Pyrimidine Chemical compound C1=CN=CN=C1 CZPWVGJYEJSRLH-UHFFFAOYSA-N 0.000 description 4
- 229960000643 adenine Drugs 0.000 description 4
- 238000003776 cleavage reaction Methods 0.000 description 4
- 238000013461 design Methods 0.000 description 4
- 125000000623 heterocyclic group Chemical group 0.000 description 4
- 238000010348 incorporation Methods 0.000 description 4
- 230000004048 modification Effects 0.000 description 4
- 238000012986 modification Methods 0.000 description 4
- 230000008569 process Effects 0.000 description 4
- 150000003212 purines Chemical class 0.000 description 4
- 238000003753 real-time PCR Methods 0.000 description 4
- 230000002441 reversible effect Effects 0.000 description 4
- 230000007017 scission Effects 0.000 description 4
- RWQNBRDOKXIBIV-UHFFFAOYSA-N thymine Chemical compound CC1=CNC(=O)NC1=O RWQNBRDOKXIBIV-UHFFFAOYSA-N 0.000 description 4
- 108091029430 CpG site Proteins 0.000 description 3
- 108010017826 DNA Polymerase I Proteins 0.000 description 3
- 102000004594 DNA Polymerase I Human genes 0.000 description 3
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 description 3
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 description 3
- 102000004190 Enzymes Human genes 0.000 description 3
- 108090000790 Enzymes Proteins 0.000 description 3
- 108010033040 Histones Proteins 0.000 description 3
- 229910019142 PO4 Inorganic materials 0.000 description 3
- 238000011529 RT qPCR Methods 0.000 description 3
- 208000036142 Viral infection Diseases 0.000 description 3
- 239000003242 anti bacterial agent Substances 0.000 description 3
- 238000000429 assembly Methods 0.000 description 3
- 230000000712 assembly Effects 0.000 description 3
- 230000003115 biocidal effect Effects 0.000 description 3
- 239000002041 carbon nanotube Substances 0.000 description 3
- 229910021393 carbon nanotube Inorganic materials 0.000 description 3
- 239000013522 chelant Substances 0.000 description 3
- 239000002299 complementary DNA Substances 0.000 description 3
- 229940104302 cytosine Drugs 0.000 description 3
- 238000012217 deletion Methods 0.000 description 3
- 230000037430 deletion Effects 0.000 description 3
- 238000007847 digital PCR Methods 0.000 description 3
- 208000016097 disease of metabolism Diseases 0.000 description 3
- 238000002474 experimental method Methods 0.000 description 3
- 230000001605 fetal effect Effects 0.000 description 3
- 102000054766 genetic haplotypes Human genes 0.000 description 3
- PCHJSUWPFVWCPO-UHFFFAOYSA-N gold Chemical compound [Au] PCHJSUWPFVWCPO-UHFFFAOYSA-N 0.000 description 3
- 239000010931 gold Substances 0.000 description 3
- 229910052737 gold Inorganic materials 0.000 description 3
- 208000015181 infectious disease Diseases 0.000 description 3
- 229910052500 inorganic mineral Inorganic materials 0.000 description 3
- 238000007403 mPCR Methods 0.000 description 3
- 208000030159 metabolic disease Diseases 0.000 description 3
- 229910052751 metal Inorganic materials 0.000 description 3
- 239000002184 metal Substances 0.000 description 3
- 239000011707 mineral Substances 0.000 description 3
- 239000002245 particle Substances 0.000 description 3
- 239000010452 phosphate Substances 0.000 description 3
- NBIIXXVUZAFLBC-UHFFFAOYSA-K phosphate Chemical compound [O-]P([O-])([O-])=O NBIIXXVUZAFLBC-UHFFFAOYSA-K 0.000 description 3
- 230000026731 phosphorylation Effects 0.000 description 3
- 238000006366 phosphorylation reaction Methods 0.000 description 3
- 239000002096 quantum dot Substances 0.000 description 3
- 230000002285 radioactive effect Effects 0.000 description 3
- 230000009385 viral infection Effects 0.000 description 3
- RYVNIFSIEDRLSJ-UHFFFAOYSA-N 5-(hydroxymethyl)cytosine Chemical compound NC=1NC(=O)N=CC=1CO RYVNIFSIEDRLSJ-UHFFFAOYSA-N 0.000 description 2
- FHSISDGOVSHJRW-UHFFFAOYSA-N 5-formylcytosine Chemical compound NC1=NC(=O)NC=C1C=O FHSISDGOVSHJRW-UHFFFAOYSA-N 0.000 description 2
- 208000024827 Alzheimer disease Diseases 0.000 description 2
- KWIUHFFTVRNATP-UHFFFAOYSA-N Betaine Natural products C[N+](C)(C)CC([O-])=O KWIUHFFTVRNATP-UHFFFAOYSA-N 0.000 description 2
- 108091003079 Bovine Serum Albumin Proteins 0.000 description 2
- 206010006187 Breast cancer Diseases 0.000 description 2
- 208000026310 Breast neoplasm Diseases 0.000 description 2
- 241000588724 Escherichia coli Species 0.000 description 2
- 108091093094 Glycol nucleic acid Proteins 0.000 description 2
- 206010061598 Immunodeficiency Diseases 0.000 description 2
- 208000029462 Immunodeficiency disease Diseases 0.000 description 2
- 241001465754 Metazoa Species 0.000 description 2
- KWIUHFFTVRNATP-UHFFFAOYSA-O N,N,N-trimethylglycinium Chemical compound C[N+](C)(C)CC(O)=O KWIUHFFTVRNATP-UHFFFAOYSA-O 0.000 description 2
- 241000288906 Primates Species 0.000 description 2
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 2
- 108091046915 Threose nucleic acid Proteins 0.000 description 2
- 108010001244 Tli polymerase Proteins 0.000 description 2
- 102000004357 Transferases Human genes 0.000 description 2
- 108090000992 Transferases Proteins 0.000 description 2
- 241000700605 Viruses Species 0.000 description 2
- 230000005856 abnormality Effects 0.000 description 2
- 239000011543 agarose gel Substances 0.000 description 2
- 238000003556 assay Methods 0.000 description 2
- 229960003237 betaine Drugs 0.000 description 2
- 229940098773 bovine serum albumin Drugs 0.000 description 2
- 210000000349 chromosome Anatomy 0.000 description 2
- 238000003745 diagnosis Methods 0.000 description 2
- 101150036185 dnaQ gene Proteins 0.000 description 2
- 238000010828 elution Methods 0.000 description 2
- 210000003754 fetus Anatomy 0.000 description 2
- 239000012530 fluid Substances 0.000 description 2
- 239000012634 fragment Substances 0.000 description 2
- 230000007813 immunodeficiency Effects 0.000 description 2
- 208000014018 liver neoplasm Diseases 0.000 description 2
- 239000003550 marker Substances 0.000 description 2
- 230000008774 maternal effect Effects 0.000 description 2
- 238000001840 matrix-assisted laser desorption--ionisation time-of-flight mass spectrometry Methods 0.000 description 2
- 108020004999 messenger RNA Proteins 0.000 description 2
- 238000012164 methylation sequencing Methods 0.000 description 2
- 239000002679 microRNA Substances 0.000 description 2
- 238000012544 monitoring process Methods 0.000 description 2
- 238000002414 normal-phase solid-phase extraction Methods 0.000 description 2
- 230000036961 partial effect Effects 0.000 description 2
- 210000002381 plasma Anatomy 0.000 description 2
- 229920000642 polymer Polymers 0.000 description 2
- 239000001267 polyvinylpyrrolidone Substances 0.000 description 2
- 235000013855 polyvinylpyrrolidone Nutrition 0.000 description 2
- 229920000036 polyvinylpyrrolidone Polymers 0.000 description 2
- SCVFZCLFOSHCOH-UHFFFAOYSA-M potassium acetate Chemical compound [K+].CC([O-])=O SCVFZCLFOSHCOH-UHFFFAOYSA-M 0.000 description 2
- 206010039073 rheumatoid arthritis Diseases 0.000 description 2
- 125000000548 ribosyl group Chemical class C1([C@H](O)[C@H](O)[C@H](O1)CO)* 0.000 description 2
- 210000003296 saliva Anatomy 0.000 description 2
- 230000035945 sensitivity Effects 0.000 description 2
- 238000000926 separation method Methods 0.000 description 2
- 210000002966 serum Anatomy 0.000 description 2
- 241000894007 species Species 0.000 description 2
- 230000009870 specific binding Effects 0.000 description 2
- 108010068698 spleen exonuclease Proteins 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- 201000000596 systemic lupus erythematosus Diseases 0.000 description 2
- 238000002560 therapeutic procedure Methods 0.000 description 2
- 229940113082 thymine Drugs 0.000 description 2
- VLCQZHSMCYCDJL-UHFFFAOYSA-N tribenuron methyl Chemical compound COC(=O)C1=CC=CC=C1S(=O)(=O)NC(=O)N(C)C1=NC(C)=NC(OC)=N1 VLCQZHSMCYCDJL-UHFFFAOYSA-N 0.000 description 2
- 210000002700 urine Anatomy 0.000 description 2
- 125000001399 1,2,3-triazolyl group Chemical class N1N=NC(=C1)* 0.000 description 1
- AGFIRQJZCNVMCW-UAKXSSHOSA-N 5-bromouridine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C(Br)=C1 AGFIRQJZCNVMCW-UAKXSSHOSA-N 0.000 description 1
- BLQMCTXZEMGOJM-UHFFFAOYSA-N 5-carboxycytosine Chemical compound NC=1NC(=O)N=CC=1C(O)=O BLQMCTXZEMGOJM-UHFFFAOYSA-N 0.000 description 1
- LRSASMSXMSNRBT-UHFFFAOYSA-N 5-methylcytosine Chemical compound CC1=CNC(=O)N=C1N LRSASMSXMSNRBT-UHFFFAOYSA-N 0.000 description 1
- 206010069754 Acquired gene mutation Diseases 0.000 description 1
- 108091093088 Amplicon Proteins 0.000 description 1
- 208000009575 Angelman syndrome Diseases 0.000 description 1
- 101100278439 Archaeoglobus fulgidus (strain ATCC 49558 / DSM 4304 / JCM 9628 / NBRC 100126 / VC-16) pol gene Proteins 0.000 description 1
- 101100460704 Aspergillus sp. (strain MF297-2) notI gene Proteins 0.000 description 1
- 201000001320 Atherosclerosis Diseases 0.000 description 1
- 101100355997 Bacillus subtilis (strain 168) recA gene Proteins 0.000 description 1
- 101100238763 Bacillus subtilis hsdRM gene Proteins 0.000 description 1
- 241000894006 Bacteria Species 0.000 description 1
- 108091032955 Bacterial small RNA Proteins 0.000 description 1
- 201000000046 Beckwith-Wiedemann syndrome Diseases 0.000 description 1
- 206010005003 Bladder cancer Diseases 0.000 description 1
- 206010005949 Bone cancer Diseases 0.000 description 1
- 208000018084 Bone neoplasm Diseases 0.000 description 1
- 101100165205 Caenorhabditis elegans bbs-2 gene Proteins 0.000 description 1
- 240000005589 Calophyllum inophyllum Species 0.000 description 1
- 208000024172 Cardiovascular disease Diseases 0.000 description 1
- 208000016718 Chromosome Inversion Diseases 0.000 description 1
- 208000005443 Circulating Neoplastic Cells Diseases 0.000 description 1
- 206010009944 Colon cancer Diseases 0.000 description 1
- RYGMFSIKBFXOCR-UHFFFAOYSA-N Copper Chemical compound [Cu] RYGMFSIKBFXOCR-UHFFFAOYSA-N 0.000 description 1
- 241000195493 Cryptophyta Species 0.000 description 1
- 108010063113 DNA Polymerase II Proteins 0.000 description 1
- 102000010567 DNA Polymerase II Human genes 0.000 description 1
- 108010071146 DNA Polymerase III Proteins 0.000 description 1
- 102000007528 DNA Polymerase III Human genes 0.000 description 1
- 238000000018 DNA microarray Methods 0.000 description 1
- 108050009160 DNA polymerase 1 Proteins 0.000 description 1
- 241000196324 Embryophyta Species 0.000 description 1
- 108010042407 Endonucleases Proteins 0.000 description 1
- 102000004533 Endonucleases Human genes 0.000 description 1
- 101000781479 Escherichia coli (strain K12) Flap endonuclease Xni Proteins 0.000 description 1
- 101100301301 Escherichia coli (strain K12) recE gene Proteins 0.000 description 1
- 208000000461 Esophageal Neoplasms Diseases 0.000 description 1
- 101710205719 Exodeoxyribonuclease 10 Proteins 0.000 description 1
- 108010007577 Exodeoxyribonuclease I Proteins 0.000 description 1
- 108700024394 Exon Proteins 0.000 description 1
- 102100029075 Exonuclease 1 Human genes 0.000 description 1
- 229920001917 Ficoll Polymers 0.000 description 1
- 108700039691 Genetic Promoter Regions Proteins 0.000 description 1
- 208000034951 Genetic Translocation Diseases 0.000 description 1
- 241000282575 Gorilla Species 0.000 description 1
- 208000031226 Hyperlipidaemia Diseases 0.000 description 1
- 241000282560 Macaca mulatta Species 0.000 description 1
- 108700011259 MicroRNAs Proteins 0.000 description 1
- 108020005196 Mitochondrial DNA Proteins 0.000 description 1
- 108020004485 Nonsense Codon Proteins 0.000 description 1
- 206010030155 Oesophageal carcinoma Diseases 0.000 description 1
- 206010033128 Ovarian cancer Diseases 0.000 description 1
- 206010061535 Ovarian neoplasm Diseases 0.000 description 1
- 238000012408 PCR amplification Methods 0.000 description 1
- 241000282577 Pan troglodytes Species 0.000 description 1
- 108091007412 Piwi-interacting RNA Proteins 0.000 description 1
- 201000010769 Prader-Willi syndrome Diseases 0.000 description 1
- 206010036790 Productive cough Diseases 0.000 description 1
- 206010060862 Prostate cancer Diseases 0.000 description 1
- 208000000236 Prostatic Neoplasms Diseases 0.000 description 1
- 208000006289 Rett Syndrome Diseases 0.000 description 1
- 102000003661 Ribonuclease III Human genes 0.000 description 1
- 108010057163 Ribonuclease III Proteins 0.000 description 1
- 108020004688 Small Nuclear RNA Proteins 0.000 description 1
- 102000039471 Small Nuclear RNA Human genes 0.000 description 1
- 238000002105 Southern blotting Methods 0.000 description 1
- 108010006785 Taq Polymerase Proteins 0.000 description 1
- 101000803959 Thermus thermophilus (strain ATCC 27634 / DSM 579 / HB8) DNA ligase Proteins 0.000 description 1
- 208000024770 Thyroid neoplasm Diseases 0.000 description 1
- YZCKVEUIGOORGS-NJFSPNSNSA-N Tritium Chemical compound [3H] YZCKVEUIGOORGS-NJFSPNSNSA-N 0.000 description 1
- 208000007097 Urinary Bladder Neoplasms Diseases 0.000 description 1
- 108020000999 Viral RNA Proteins 0.000 description 1
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 1
- 239000002253 acid Substances 0.000 description 1
- 230000032683 aging Effects 0.000 description 1
- 150000001345 alkine derivatives Chemical class 0.000 description 1
- 125000003277 amino group Chemical group 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 208000029560 autism spectrum disease Diseases 0.000 description 1
- 150000001540 azides Chemical class 0.000 description 1
- 230000001580 bacterial effect Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 239000013060 biological fluid Substances 0.000 description 1
- 238000001574 biopsy Methods 0.000 description 1
- 210000004556 brain Anatomy 0.000 description 1
- 229910052799 carbon Inorganic materials 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 239000003054 catalyst Substances 0.000 description 1
- 108091092259 cell-free RNA Proteins 0.000 description 1
- 239000007795 chemical reaction product Substances 0.000 description 1
- 208000037516 chromosome inversion disease Diseases 0.000 description 1
- 239000011248 coating agent Substances 0.000 description 1
- 238000000576 coating method Methods 0.000 description 1
- 210000001072 colon Anatomy 0.000 description 1
- 208000029742 colonic neoplasm Diseases 0.000 description 1
- 230000021615 conjugation Effects 0.000 description 1
- 229910052802 copper Inorganic materials 0.000 description 1
- 239000010949 copper Substances 0.000 description 1
- 238000005520 cutting process Methods 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 238000004925 denaturation Methods 0.000 description 1
- 230000036425 denaturation Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000006073 displacement reaction Methods 0.000 description 1
- 239000000975 dye Substances 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 201000004101 esophageal cancer Diseases 0.000 description 1
- 210000003238 esophagus Anatomy 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 108010052305 exodeoxyribonuclease III Proteins 0.000 description 1
- 238000007672 fourth generation sequencing Methods 0.000 description 1
- 231100000221 frame shift mutation induction Toxicity 0.000 description 1
- 230000037433 frameshift Effects 0.000 description 1
- 239000000499 gel Substances 0.000 description 1
- 238000001502 gel electrophoresis Methods 0.000 description 1
- 210000004602 germ cell Anatomy 0.000 description 1
- 239000011521 glass Substances 0.000 description 1
- 208000005017 glioblastoma Diseases 0.000 description 1
- 210000002216 heart Anatomy 0.000 description 1
- 238000010438 heat treatment Methods 0.000 description 1
- 206010073071 hepatocellular carcinoma Diseases 0.000 description 1
- 101150102883 hsdM gene Proteins 0.000 description 1
- 101150085823 hsdR gene Proteins 0.000 description 1
- 201000001421 hyperglycemia Diseases 0.000 description 1
- 238000003780 insertion Methods 0.000 description 1
- 230000037431 insertion Effects 0.000 description 1
- 150000002500 ions Chemical class 0.000 description 1
- 210000003734 kidney Anatomy 0.000 description 1
- 231100000518 lethal Toxicity 0.000 description 1
- 230000001665 lethal effect Effects 0.000 description 1
- 208000032839 leukemia Diseases 0.000 description 1
- 238000011528 liquid biopsy Methods 0.000 description 1
- 210000004185 liver Anatomy 0.000 description 1
- 201000007270 liver cancer Diseases 0.000 description 1
- 210000004072 lung Anatomy 0.000 description 1
- 201000005243 lung squamous cell carcinoma Diseases 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000004949 mass spectrometry Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 108091070501 miRNA Proteins 0.000 description 1
- 201000006417 multiple sclerosis Diseases 0.000 description 1
- 230000037434 nonsense mutation Effects 0.000 description 1
- 230000005257 nucleotidylation Effects 0.000 description 1
- 210000000056 organ Anatomy 0.000 description 1
- 230000003647 oxidation Effects 0.000 description 1
- 238000007254 oxidation reaction Methods 0.000 description 1
- 101150088264 pol gene Proteins 0.000 description 1
- 101150005648 polB gene Proteins 0.000 description 1
- 102000040430 polynucleotide Human genes 0.000 description 1
- 108091033319 polynucleotide Proteins 0.000 description 1
- 239000002157 polynucleotide Substances 0.000 description 1
- 210000002729 polyribosome Anatomy 0.000 description 1
- 235000011056 potassium acetate Nutrition 0.000 description 1
- 108090000765 processed proteins & peptides Proteins 0.000 description 1
- 238000004393 prognosis Methods 0.000 description 1
- 208000020016 psychiatric disease Diseases 0.000 description 1
- 238000010926 purge Methods 0.000 description 1
- 238000000746 purification Methods 0.000 description 1
- 238000012175 pyrosequencing Methods 0.000 description 1
- 239000011541 reaction mixture Substances 0.000 description 1
- 230000008707 rearrangement Effects 0.000 description 1
- 101150056906 recJ gene Proteins 0.000 description 1
- 230000002829 reductive effect Effects 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 238000010839 reverse transcription Methods 0.000 description 1
- 238000007480 sanger sequencing Methods 0.000 description 1
- 201000000980 schizophrenia Diseases 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000037432 silent mutation Effects 0.000 description 1
- 208000017520 skin disease Diseases 0.000 description 1
- 239000004055 small Interfering RNA Substances 0.000 description 1
- 239000011780 sodium chloride Substances 0.000 description 1
- 239000001509 sodium citrate Substances 0.000 description 1
- NLJMYIDDQXHKNR-UHFFFAOYSA-K sodium citrate Chemical compound O.O.[Na+].[Na+].[Na+].[O-]C(=O)CC(O)(CC([O-])=O)C([O-])=O NLJMYIDDQXHKNR-UHFFFAOYSA-K 0.000 description 1
- 239000007790 solid phase Substances 0.000 description 1
- 230000037439 somatic mutation Effects 0.000 description 1
- 125000006850 spacer group Chemical group 0.000 description 1
- 210000000952 spleen Anatomy 0.000 description 1
- 210000003802 sputum Anatomy 0.000 description 1
- 208000024794 sputum Diseases 0.000 description 1
- 101150081002 sspI gene Proteins 0.000 description 1
- 239000007858 starting material Substances 0.000 description 1
- 210000004243 sweat Anatomy 0.000 description 1
- 230000002195 synergetic effect Effects 0.000 description 1
- 230000009044 synergistic interaction Effects 0.000 description 1
- 238000004885 tandem mass spectrometry Methods 0.000 description 1
- 201000002510 thyroid cancer Diseases 0.000 description 1
- PIEPQKCYPFFYMG-UHFFFAOYSA-N tris acetate Chemical compound CC(O)=O.OCC(N)(CO)CO PIEPQKCYPFFYMG-UHFFFAOYSA-N 0.000 description 1
- 229910052722 tritium Inorganic materials 0.000 description 1
- 230000005641 tunneling Effects 0.000 description 1
- 208000001072 type 2 diabetes mellitus Diseases 0.000 description 1
- 210000003932 urinary bladder Anatomy 0.000 description 1
- 201000005112 urinary bladder cancer Diseases 0.000 description 1
- 101150041325 vopp1 gene Proteins 0.000 description 1
- 238000005406 washing Methods 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/10—Processes for the isolation, preparation or purification of DNA or RNA
- C12N15/1034—Isolating an individual clone by screening libraries
- C12N15/1093—General methods of preparing gene libraries, not provided for in other subgroups
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6844—Nucleic acid amplification reactions
- C12Q1/6865—Promoter-based amplification, e.g. nucleic acid sequence amplification [NASBA], self-sustained sequence replication [3SR] or transcription-based amplification system [TAS]
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/10—Processes for the isolation, preparation or purification of DNA or RNA
- C12N15/1034—Isolating an individual clone by screening libraries
- C12N15/1068—Template (nucleic acid) mediated chemical library synthesis, e.g. chemical and enzymatical DNA-templated organic molecule synthesis, libraries prepared by non ribosomal polypeptide synthesis [NRPS], DNA/RNA-polymerase mediated polypeptide synthesis
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6806—Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6813—Hybridisation assays
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6813—Hybridisation assays
- C12Q1/6827—Hybridisation assays for detection of mutation or polymorphism
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2563/00—Nucleic acid detection characterized by the use of physical, structural and functional properties
- C12Q2563/179—Nucleic acid detection characterized by the use of physical, structural and functional properties the label being a nucleic acid
Landscapes
- Chemical & Material Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Organic Chemistry (AREA)
- Engineering & Computer Science (AREA)
- Genetics & Genomics (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biotechnology (AREA)
- General Engineering & Computer Science (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Molecular Biology (AREA)
- Biochemistry (AREA)
- Biophysics (AREA)
- Microbiology (AREA)
- General Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- Biomedical Technology (AREA)
- Analytical Chemistry (AREA)
- Immunology (AREA)
- Plant Pathology (AREA)
- Crystallography & Structural Chemistry (AREA)
- Bioinformatics & Computational Biology (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
本公开内容提供了用于靶序列扩增和分析的探针的靶向杂交和/或邻近连接。探针与靶序列的杂交可以是直接的或通过间接缔合。
Description
交叉引用
本申请要求于2018年11月21日提交的美国临时申请号62/770,585的优先权,其通过引用全文并入本文。
背景技术
核酸靶捕获方法可实现富集特定基因、外显子和其他目的基因组区域,例如,用于靶向测序。然而,当前基于靶捕获的测序方法可能涉及繁琐冗长的方案和昂贵的过程。当前基于靶捕获的方法对于小捕获组(例如,少于500个探针)也可能具有低中靶率,并且由于例如引物相互作用,尤其是对于带有分子条形码的PCR引物,基于多重PCR扩增子的靶测序的灵活性较低。此外,由于转化率低,当前的核酸靶捕获方法可能不适用于低输入和受损的DNA。
亚硫酸氢盐转化是研究核酸分子甲基化模式的有用技术,并可用于通过测序研究甲基化。然而,亚硫酸氢盐转化可能通过例如产生截断而损伤核酸。如果使用亚硫酸氢盐处理二代测序(NGS)DNA文库,大量核酸可能受损并无法在后续扩增步骤中恢复,从而导致低转化率。此外,由于亚硫酸氢盐转化可导致单链或片段化的DNA并降低序列复杂性,因此转化的DNA可能难以作为基于常规衔接子连接的文库构建的输入。考虑到转化率低(例如,对于亚硫酸氢盐处理的无细胞DNA(cfDNA),为5%或更低),亚硫酸氢盐处理的cfDNA或循环肿瘤细胞DNA(ctDNA)的初始输入通常较小,这可能带来更大的挑战。此外,在亚硫酸氢盐转化时,任何非甲基化的“C”均可以转化为“U”,然后在PCR扩增后又可以转化为“T”。由于亚硫酸氢盐转化前扩增可能无法保留甲基化信息,因此亚硫酸氢盐转化后捕获可以更常用。探针或PCR引物的设计或生产可能是基于亚硫酸氢盐后转化的序列,这是一个更复杂的过程。如果使用亚硫酸氢盐前转化捕获,现有的市场方案可能需要高DNA输入(例如超过250ng)。这种限制可以导致靶向区域难以通过当前的探针捕获或多重PCR方法富集。
因此,需要更有效、易于使用、快速、灵活和实用的靶核酸捕获方法和用于分析亚硫酸氢盐处理的核酸的改进方法,特别是对于低输入样品(例如cfDNA)。本文公开的方法可用于对极低DNA输入样品进行基于预扩增和预亚硫酸氢盐转化杂交的捕获。
发明内容
本文公开了一种方法,包括:将捕获探针的靶特异性区与模板核酸分子的靶序列杂交;将该模板核酸分子的3’末端附着于该捕获探针的5’末端,从而产生附着于该捕获探针的模板核酸分子;将第一衔接子引物与该捕获探针的第一衔接子杂交;延伸该第一衔接子引物,从而产生第一延伸产物;以及将第二衔接子附着于该第一延伸产物的3’末端,从而产生附着于该第二衔接子的第一延伸产物。该捕获探针可以进一步包括分子条形码。该方法可以进一步包括在附着第二衔接子之前将模板核酸分子的5’末端磷酸化。该第二衔接子可以是双链衔接子,其中该第二衔接子的两条链中的一条链附着于模板核酸分子。该方法可以进一步包括将第二衔接子引物与第二衔接子杂交。该方法可以进一步包括延伸第二衔接子引物,从而产生第二延伸产物。该方法可以进一步包括扩增附着于第二衔接子的第一延伸产物和第二延伸产物,从而产生扩增产物。该方法可以进一步包括使用第一衔接子引物和第二衔接子引物扩增附着于第二衔接子的第一延伸产物和第二延伸产物,从而产生扩增产物。
本文公开了一种方法,包括:将捕获探针的靶特异性区与模板核酸分子的靶序列杂交;将该模板核酸分子的3’末端附着于该捕获探针的5’末端,从而产生附着于该捕获探针的模板核酸分子;以及使用亚硫酸氢盐处理附着于该捕获探针的模板核酸分子。该方法可以进一步包括将第一衔接子引物与捕获探针的第一衔接子杂交。该方法可以包括延伸第一衔接子引物,从而产生第一延伸产物。该方法可以进一步包括将第二衔接子附着于第一延伸产物的3’末端,从而产生附着于第二衔接子的第一延伸产物。该捕获探针可以进一步包括分子条形码。该方法可以包括在附着第二衔接子之前将模板核酸分子的5’末端磷酸化。该第二衔接子可以是双链衔接子,其中该第二衔接子的两条链中的一条链附着于该模板核酸分子。该方法可以进一步包括将第二衔接子引物与第二衔接子杂交。该方法可以进一步包括延伸第二衔接子引物,从而产生第二延伸产物。该方法可以进一步包括扩增附着于第二衔接子的第一延伸产物和第二延伸产物,从而产生扩增产物。该方法可以进一步包括使用第一衔接子引物和第二衔接子引物扩增附着于第二衔接子的第一延伸产物和第二延伸产物,从而产生扩增产物。该方法可以进一步包括将靶特异性引物与第一延伸产物杂交。该方法可以进一步包括延伸靶特异性引物,从而产生第二延伸产物。该方法可以进一步包括扩增附着于第二衔接子的第一延伸产物和第二延伸产物,从而产生扩增产物。该方法可以进一步包括使用第一衔接子引物和靶特异性引物扩增附着于第二衔接子的第一延伸产物和第二延伸产物,从而产生扩增产物。
本文公开了一种方法,包括:将捕获探针的靶特异性区与模板核酸分子的靶序列杂交;将该模板核酸分子的3’末端附着于该捕获探针的5’末端,从而产生附着于该捕获探针的模板核酸分子;以及延伸该捕获探针的3’末端,从而产生附着于该模板核酸分子的第一延伸产物。该方法可以进一步包括使用亚硫酸氢盐处理附着于捕获探针的模板核酸分子。该捕获探针可以包括第一衔接子。该捕获探针可以进一步包括分子条形码。该方法可以进一步包括将模板核酸分子的5’末端磷酸化。该方法可以进一步包括将第二衔接子附着于模板核酸分子的5’末端。该方法可以进一步包括在附着第二衔接子之前将模板核酸分子的5’末端磷酸化。该第二衔接子可以是双链衔接子。该方法可以进一步包括将第一衔接子引物与捕获探针的第一衔接子杂交。该方法可以进一步包括延伸第一衔接子引物,从而产生第二延伸产物。该方法可以进一步包括将第二衔接子引物与第二延伸产物杂交。该方法可以进一步包括延伸第二衔接子引物,从而产生第三延伸产物。该方法可以进一步包括扩增第二延伸产物和第三延伸产物,从而产生扩增产物。该方法可以进一步包括使用第一衔接子引物和第二衔接子引物扩增第二延伸产物和第三延伸产物,从而产生扩增产物。该方法可以进一步包括将靶特异性引物与第二延伸产物杂交。该方法可以进一步包括延伸靶特异性引物,从而产生第三延伸产物。该方法可以进一步包括扩增第二延伸产物和第三延伸产物,从而产生扩增产物。该方法可以进一步包括使用第一衔接子引物和靶特异性引物扩增第二延伸产物和第三延伸产物,从而产生扩增产物。
本文公开了一种方法,包括将捕获探针的靶特异性区与模板核酸分子的靶序列杂交;将该模板核酸分子的3’末端附着于该捕获探针的5’末端,从而产生附着于该捕获探针的模板核酸分子;以及分离该靶特异性区。该方法可以进一步包括在分离靶特异性区之前使用亚硫酸氢盐处理附着于捕获探针的模板核酸分子。该捕获探针可以进一步包括分子条形码。该方法可以进一步包括将第一衔接子引物与捕获探针的第一衔接子杂交。该方法可以进一步包括延伸第一衔接子引物,从而产生第一延伸产物。该方法可以进一步包括将第二衔接子附着于第一延伸产物的3’末端,从而产生附着于第二衔接子的第一延伸产物。该方法可以进一步包括延伸第二衔接子引物,从而产生第二延伸产物。该方法可以进一步包括扩增附着于第二衔接子的第一延伸产物和第二延伸产物,从而产生扩增产物。该方法可以进一步包括使用第一衔接子引物和第二衔接子引物扩增附着于第二衔接子的第一延伸产物和第二延伸产物,从而产生扩增产物。该方法可以进一步包括将靶特异性引物与第一延伸产物杂交。该方法可以进一步包括延伸靶特异性引物,从而产生第二延伸产物。该方法可以进一步包括扩增第一延伸产物和第二延伸产物,从而产生扩增产物。该方法可以进一步包括使用第一衔接子引物和靶特异性引物扩增第一延伸产物和第二延伸产物,从而产生扩增产物。
本文公开了一种方法,包括:将第一桥探针(bridge probe)的第一靶特异性区与模板核酸分子的第一靶序列杂交,其中该第一桥探针的第一衔接子着陆序列(adaptorlanding sequence)与衔接子锚探针的第一桥结合序列结合;以及将该模板核酸分子的3’末端附着于该衔接子锚探针的5’末端,从而产生附着于该衔接子锚探针的模板核酸分子。该方法可以进一步包括使用亚硫酸氢盐处理附着于衔接子锚探针的模板核酸分子。该衔接子锚探针可以进一步包括分子条形码。该第一桥探针的第一靶特异性区可以在第一桥探针的3’部分中。该第一桥探针的第一靶特异性区可以在第一桥探针的5’部分中。该第一桥探针可以包括在第一靶特异性区和第一衔接子着陆序列之间的第一接头。该附着可以包括使用连接酶将模板核酸分子的3’末端与衔接子锚探针的5’末端连接。该方法可以进一步包括将第一衔接子引物与衔接子锚探针的第一衔接子杂交。该方法可以进一步包括延伸第一衔接子引物,从而产生第一延伸产物。该方法可以进一步包括将第二衔接子附着于第一延伸产物的3’末端,从而产生附着于第二衔接子的第一延伸产物。该方法可以进一步包括在附着第二衔接子之前将模板核酸分子的5’末端磷酸化。该第二衔接子可以是双链衔接子,其中该第二衔接子的两条链中的一条链附着于模板核酸分子。该方法可以进一步包括将第二衔接子引物与在附着于第二衔接子的第一延伸产物中的第二衔接子杂交。该方法可以进一步包括延伸第二衔接子引物,从而产生第二延伸产物。该方法可以进一步包括扩增附着于第二衔接子的第一延伸产物和第二延伸产物,从而产生扩增产物。该方法可以进一步包括使用第一衔接子引物和第二衔接子引物扩增附着于第二衔接子的第一延伸产物和第二延伸产物,从而产生扩增产物。该方法可以进一步包括将靶特异性引物与第一延伸产物杂交。该方法可以进一步包括延伸靶特异性引物,从而产生第二延伸产物。该方法可以进一步包括扩增第一延伸产物和第二延伸产物,从而产生扩增产物。该方法可以进一步包括使用第一衔接子引物和靶特异性引物扩增第一延伸产物和第二延伸产物,从而产生扩增产物。
该方法可以进一步包括分离第一桥结合序列。该方法可以进一步包括延伸第一桥探针的3’末端,从而产生第一延伸产物。该衔接子锚探针可以包括第一衔接子。该方法可以进一步包括将第二衔接子附着于模板核酸分子的5’末端。该方法可以进一步包括在附着第二衔接子之前将模板核酸分子的5’末端磷酸化。该衔接子可以是双链衔接子。该方法可以进一步包括将第一衔接子引物与衔接子锚探针的第一衔接子杂交。该方法可以进一步包括延伸第一衔接子引物,从而产生第二延伸产物。该方法可以进一步包括将第二衔接子引物与第二延伸产物杂交。该方法可以进一步包括延伸第二衔接子引物,从而产生第三延伸产物。该方法可以进一步包括扩增第二延伸产物和第三延伸产物,从而产生扩增产物。该方法可以进一步包括使用第一衔接子引物和第二衔接子引物扩增第二延伸产物和第三延伸产物,从而产生扩增产物。该方法可以进一步包括将靶特异性引物与第二延伸产物杂交。该方法可以进一步包括延伸靶特异性引物,从而产生第三延伸产物。该方法可以进一步包括扩增第二延伸产物和第三延伸产物,从而产生扩增产物。该方法可以进一步包括使用第一衔接子引物和靶特异性引物扩增第二延伸产物和第三延伸产物,从而产生扩增产物。该方法可以进一步包括将第二桥探针的第二靶序列区与模板核酸分子的第二靶序列杂交,其中该第二桥探针的第二衔接子着陆序列与该衔接子锚探针的第二桥结合序列结合。该第二桥探针的第二靶特异性区可以在第二桥探针的3’部分中。该第二桥探针的第二靶特异性区可以在第二桥探针的5’部分中。该第二桥探针可以包括在第二靶特异性区和第二衔接子着陆序列之间的第二接头。
第一桥探针的第一靶特异性区可以在第一桥探针的3’部分中并且第二桥探针的第二靶特异性区可以在第二桥探针的3’部分中;第一桥探针的第一靶特异性区可以在第一桥探针的5’部分中并且第二桥探针的第二靶特异性区可以在第二桥探针的5’部分中;第一桥探针的第一靶特异性区可以在第一桥探针的3’部分中并且第二桥探针的第二靶特异性区可以在第二桥探针的5’部分中;或第一桥探针的第一靶特异性区可以在第一桥探针的5’部分中并且第二桥探针的第二靶特异性区可以在第二桥探针的3’部分中。第一桥探针的第一靶特异性区可以在第一桥探针的3’部分中并且第二桥探针的第二靶特异性区可以在第二桥探针的5’部分中;并且第一桥探针的第一接头和第二桥探针的第二接头可以彼此杂交。
捕获探针或桥探针的靶序列区可以基于模板核酸分子的靶序列而设计,并且模板核酸的靶序列在亚硫酸氢盐处理后可以保留非甲基化胞嘧啶。该方法可以进一步包括使用亚硫酸氢盐处理核酸分子,从而产生模板核酸分子,其中该模板核酸分子可以是亚硫酸氢盐处理的产物。捕获探针或桥探针的靶序列区可以基于亚硫酸氢盐处理后的模板核酸分子的靶序列而设计,其中模板核酸中的非甲基化胞嘧啶在亚硫酸氢盐处理期间转化为尿嘧啶。该方法可以进一步包括将核酸分子的5’末端去磷酸化,从而产生模板核酸分子。捕获探针或衔接子锚探针可以进一步包括标记物。该方法可以进一步包括通过标记物来捕获桥探针。该标记物可以是生物素。该标记物可以被捕获在固体支持物上。该固体支持物可以是珠粒。该珠粒可以包括靶向标记物的捕获部分。该捕获部分可以是链霉亲和素。该方法可以进一步包括在将模板核酸分子的3’末端附着于捕获探针或衔接子锚探针的5’末端后,将核酸分子与3’至5’核酸外切酶接触,其中该核酸分子包括捕获探针和模板核酸分子。该方法可以进一步包括对扩增产物进行测序。该测序可以包括二代测序。该模板核酸分子可以包括单链DNA。该模板核酸分子可以包括RNA。该模板核酸分子可以包括受损的DNA。该模板核酸分子可以来自福尔马林固定石蜡包埋(FFPE)的样品。该模板核酸分子可以包括来自生物样品的无细胞核酸。该无细胞核酸可以包括无细胞DNA。该无细胞DNA可以包括循环肿瘤DNA。在一些情况下,不可以对模板核酸分子进行体外DNA修复步骤。
本文公开了一种方法,包括:使用探针捕获靶序列,其中该探针与该靶序列杂交并且其中该探针附着于包括该靶序列的模板;以及使用亚硫酸氢盐处理附着于该探针的靶序列。本文公开了一种方法,包括使用桥探针捕获靶序列,其中该桥探针促进锚探针附着于靶序列。该方法可以进一步包括使用亚硫酸氢盐处理附着于锚探针的靶序列。
本文公开了一种试剂盒,包括:捕获探针,其包括与模板核酸分子的靶序列杂交的靶特异性区和附着于模板核酸分子的3’末端的5’末端;第一衔接子引物,其与捕获探针的第一衔接子杂交,其中延伸第一衔接子引物产生第一延伸产物;第二衔接子,其附着于第一延伸产物;和第二衔接子引物,其与第二衔接子杂交。本文公开了一种试剂盒,包括:桥探针,其包括与模板核酸分子的靶序列杂交的靶特异性区;衔接子锚探针,其包括与桥探针的衔接子着陆序列杂交的桥结合序列和附着于模板核酸分子的3’末端的5’末端。
本文公开了一种方法,包括将捕获探针的靶特异性区与模板核酸分子的靶序列杂交,其中该捕获探针进一步包括位于该靶特异性区的5’末端的第一衔接子;在与该靶特异性区杂交后,将该模板核酸分子与3’至5’核酸外切酶接触;以及使用该第一衔接子作为模板延伸该模板核酸分子的3’末端,从而产生第一延伸产物。该方法可以进一步包括延伸捕获探针的3’末端,从而产生第二延伸产物。该方法可以进一步包括将包括第一衔接子的引物与第一延伸产物杂交;以及延伸包括第一衔接子的引物的3’末端,从而产生第二延伸产物。该方法可以进一步包括将第二衔接子附着于第一延伸产物的5’末端。该方法可以进一步包括在附着第二衔接子之前将第一延伸产物的5’末端磷酸化。该第二衔接子可以是双链衔接子,其中该第二衔接子的两条链中的一条链附着于第二延伸产物。该方法可以进一步包括扩增第一延伸产物和第二延伸产物,从而产生扩增产物。
该方法可以进一步包括将靶特异性引物与第二延伸产物杂交,其中该靶特异性引物附着于第二衔接子;以及延伸靶特异性引物,从而产生第三延伸产物。该方法可以进一步包括扩增第二延伸产物和第三延伸产物,从而产生扩增产物。
该捕获探针可以进一步包括分子条形码。该捕获探针可以进一步包括结合部分。该结合部分可以附着于支持物。该支持物可以是珠粒。该珠粒可以是链霉亲和素珠粒。该结合部分可以是生物素。
本文公开了一种方法,包括将第一桥探针的第一靶特异性区与模板核酸分子的第一靶序列杂交,其中该第一桥探针的第一衔接子着陆序列与衔接子锚探针的第一桥结合序列结合;将第二桥探针的第二靶特异性区与模板核酸分子的第二靶序列杂交,其中该第二桥探针的第二衔接子着陆序列与该衔接子锚探针的第二桥结合序列结合;以及延伸该第一桥探针的3’末端,从而产生第一延伸产物。该第一桥探针可以包括第一衔接子。该方法可以进一步包括将第二衔接子附着于第一延伸产物的3’末端。该第二衔接子可以是双链衔接子,其中该第二衔接子的两条链中的一条链附着于模板核酸分子。该方法可以进一步包括在附着第二衔接子之前将模板核酸分子的5’末端磷酸化。
该方法可以进一步包括将靶特异性引物与第一延伸产物杂交;以及延伸靶特异性引物,从而产生第二延伸产物。该靶特异性引物可以附着于第二衔接子。该方法可以进一步包括将包括第一衔接子的引物与第二延伸产物杂交;以及延伸包括第一衔接子的引物的3’末端,从而产生第三延伸产物。该方法可以进一步包括扩增第二延伸产物和第三延伸产物,从而产生扩增产物。
该第一桥探针可以进一步包括分子条形码。该第一桥探针可以进一步包括结合部分。该结合部分可以附着于支持物。该支持物可以是珠粒。该珠粒可以是链霉亲和素珠粒。该结合部分可以是生物素。
本文公开了一种方法,包括将第一桥探针的第一靶特异性区与模板核酸分子的第一靶序列杂交,其中该第一桥探针的第一衔接子着陆序列与衔接子锚探针的第一桥结合序列结合,其中该第一桥探针进一步包括位于该靶特异性区5’末端的第一衔接子;以及在与第一靶特异性区杂交后,将该模板核酸分子与3’至5’核酸外切酶接触;以及使用该第一衔接子作为模板延伸该模板核酸分子的3’末端,从而产生第一延伸产物。该方法可以进一步包括将包括第一衔接子的引物与第一延伸产物杂交;以及延伸包括第一衔接子的引物的3’末端,从而产生第二延伸产物。该方法可以进一步包括将第二衔接子附着于第一延伸产物的5’末端。该方法可以进一步包括在附着第二衔接子之前将第一延伸产物的5’末端磷酸化。该第二衔接子可以是双链衔接子,其中该第二衔接子的两条链中的一条链附着于第二延伸产物。该方法可以进一步包括将靶特异性引物与第二延伸产物杂交;以及延伸靶特异性引物,从而产生第三延伸产物。该靶特异性引物可以附着于第二衔接子。该方法可以进一步包括扩增第二延伸产物和第三延伸产物,从而产生扩增产物。该模板核酸分子与3’至5’核酸外切酶的接触可以在模板核酸分子的3’末端切割一个或多个核苷酸。
该第一桥探针可以进一步包括分子条形码。该第一桥探针可以进一步包括结合部分。该结合部分可以附着于支持物。该支持物可以是珠粒。该珠粒可以是链霉亲和素珠粒。该结合部分可以是生物素。
援引并入
本说明书中提及的所有出版物、专利和专利申请均通过引用而并入本文,其程度如同每个单独的出版物、专利或专利申请被具体地和单独地指示为通过引用而并入。
附图说明
本公开内容的新颖特征在所附权利要求中具体阐述。通过参考以下阐述采用了本公开内容的原理的说明性实施方式的详细描述以及其附图,可以更好地了解本公开内容的特点和优势,附图中:
图1A-图1C示出了捕获探针与模板中的靶序列(TS)的直接杂交和后续扩增的一个实施方式。图1A显示了捕获探针与TS的杂交以及捕获探针与模板的邻近连接。图1B显示了使用AD1引物合成模板的互补链。图1C示出了第二衔接子(AD2)与图1B的延伸产物和模板的连接,以及引物与第二衔接子的退火,以使用AD2引物和AD1引物进一步扩增TS。
图2A-图2C示出了捕获探针与模板中的靶序列(TS)的直接杂交和不同扩增方法的一个实施方式。图2A显示了捕获探针与靶序列的杂交以及捕获探针与模板的邻近连接。图2B显示了使用AD1引物合成模板的互补链。图2C示出了使用靶特异性区(TSR)引物用于用AD1引物进一步扩增靶序列。
图3A-图3C显示了捕获探针与靶序列(TS)的直接杂交和另一种扩增方法的实施方式。图3A显示了捕获探针与靶序列的杂交以及捕获探针与模板的邻近连接。图3B显示了模板5’末端的磷酸化和使用捕获探针的靶特异性区(TSR)(捕获探针的3’末端)作为引物合成模板的互补链。图3C示出了AD2衔接子与图3B的产物的连接以及使用引物与AD1和AD2退火以用于进一步扩增靶序列。
图4A-图4C示出了去除捕获探针的靶特异性区(TSR)以促进靶序列的后续扩增。图4A显示了捕获探针与模板的靶序列的杂交以及捕获探针与模板的邻近连接。图4B显示了捕获探针的TSR的切割。图4C显示了在捕获探针中与AD1序列退火的AD1引物的延伸和靶序列的扩增。
图5A-图5C显示了衔接子锚探针与模板的间接缔合。图5A显示了由于桥探针与衔接子锚探针和模板两者的杂交以及衔接子锚探针与模板的后续连接而导致的衔接子锚探针与模板的缔合。靶特异性区(TSR)位于桥探针的3’部分。图5B显示了使用AD1引物合成模板的互补链。图5C显示了AD2衔接子与图5B的产物的连接以及使用AD1和AD2引物的进一步扩增。
图6A-图6C显示了衔接子锚探针的间接缔合和不同扩增方法。图6A显示了由于桥探针与衔接子锚探针和模板两者的杂交以及衔接子锚探针与模板的后续连接而导致的衔接子锚探针与模板的缔合。靶特异性区(TSR)位于桥探针的3’部分。图6B显示了使用AD1引物合成模板的互补链。图6C显示了使用与靶序列的互补序列退火的引物和AD1引物的进一步扩增。
图7A-图7C显示了使用桥探针将衔接子锚探针与模板间接缔合,其中靶特异性区(TSR)位于桥探针的5’部分。图7A显示了由于桥探针与衔接子锚探针和模板两者的杂交以及衔接子锚探针与模板的后续连接而导致的衔接子锚探针与模板的缔合。图7B显示了使用AD1引物合成模板的互补链。在引物与AD1序列退火之前,可以使桥探针、模板和衔接子锚探针之间的键变性。图7C显示了AD2衔接子与图7B的产物的连接以及使用AD1和AD2引物的进一步扩增。
图8A-图8C显示了衔接子锚探针通过桥探针与模板的间接缔合以及桥探针的靶特异性区(TSR)的延伸。图8A显示了由于桥探针与衔接子锚探针和模板两者的杂交以及衔接子锚探针与模板的后续连接而导致的衔接子锚探针与模板的缔合。图8B显示了使用TSR作为引物(桥探针的3’末端)合成模板的互补链。图8C显示了AD2衔接子与图8B的产物的连接以及使用AD1和AD2引物的进一步扩增。
图9显示了多个桥探针与模板和衔接子锚探针的杂交,导致衔接子锚探针与模板的邻近连接。两个桥探针在3’部分均包括靶特异性区(TSR)。
图10显示了另一组桥探针与模板和衔接子锚探针的杂交,以及衔接子锚探针与模板的后续连接。两个桥探针在5’部分均包括靶特异性区(TSR)。
图11显示了不同桥探针与模板的杂交以及衔接子锚探针与模板的连接。第一桥探针在3’部分包括靶特异性区(TSR),并且第二桥探针在5’部分包括TSR,导致两个桥探针的接头杂交和稳定组装体。
图12显示了桥探针与模板的杂交以及衔接子锚探针与模板的连接。第一桥探针在5’部分包括TSR,并且第二桥探针在3’部分包括TSR。
图13A-图B示出了靶扩增的两个实施方式,其中关于探针与包括靶的模板连接采用了不同亚硫酸氢盐处理顺序。图13A显示了在DNA输入与捕获探针或桥探针杂交之前的亚硫酸氢盐处理。图13B显示了在DNA输入杂交并与捕获探针或桥探针邻近连接之后的亚硫酸氢盐处理。
图14显示了亚硫酸氢盐处理对连接的模板DNA的影响。亚硫酸氢盐转化可以使模板DNA的双链部分保持完整,从而允许使用被设计成与模板DNA的非亚硫酸氢盐转化的TS的互补序列退火的TSR PCR引物。
图15A-图15B显示了使用核酸外切酶选择性去除脱靶连接产物的方案。
图16A-图16B显示了用于选择正确连接的靶模板和衔接子锚探针的固相捕获方法。
图17A-图17C显示了使用ssDNA或受损的dsDNA作为起始材料的文库构建方法。
图18A示出了在使用(1)或未使用(2)桥探针的情况下将衔接子锚探针附着于模板的示意图。图18B显示了琼脂糖凝胶图像,在使用桥探针(1)设置的情况下有连接的模板和衔接子锚探针产物;在未使用桥探针(2)设置的情况下缺少连接产物。
图19A-图19C示出了在捕获探针与模板核酸直接杂交之后添加衔接子的不同方法。
图20A-图20D显示了在模板核酸通过与桥探针的相互作用而与衔接子锚探针间接缔合之后添加衔接子的不同方法。
图21A-图21E显示了模板核酸和衔接子锚探针通过与桥探针的相互作用而间接缔合的各种构型。
图22A-图22G示出了通过模板核酸与靶探针的直接杂交而添加衔接子以及模板核酸被3’至5’核酸外切酶消化的步骤。
图23A-图23F示出了通过靶探针和模板核酸的间接缔合而添加衔接子以及桥探针的延伸步骤。
图24A-图24F示出了通过靶探针和模板核酸的间接缔合而添加衔接子以及模板核酸被3’至5’核酸外切酶消化的步骤。
图25A-图25D示出了通过使用具有衔接子的多核苷酸引物以添加衔接子的步骤。
图26显示了使用合成DNA模板,通过捕获探针的直接杂交而添加衔接子和模板核酸被3’至5’核酸外切酶消化的实验的示意图。
图27显示了使用片段化基因组DNA,通过捕获探针的直接杂交而添加衔接子和模板核酸被3’至5’核酸外切酶消化的另一实验的示意图。
具体实施方式
I.概述
本文提供了用于靶向衔接子邻近连接和富集(TALE)以及后续测序(TALE-SEQ)的方法和试剂盒。TALE可以一步完成靶富集和文库构建。TALE还可以利用单链DNA作为输入,并在扩增前富集靶序列。此外,本文公开的方法和试剂盒可以利用受损的DNA,而使用二代测序(NGS)可能具有低转化率。本文提供的方法和试剂盒可以提供更高的转化率和改进的灵敏度,因为与过程中较少步骤相关的DNA损失更少。此外,使用多个桥探针-衔接子锚可以提高捕获特异性和效率。因此,本文提供的方法和试剂盒可以为NGS中的靶富集提供快速、简单且灵活的设计和低成本解决方案。
本文公开的方法包括捕获探针与模板的靶向杂交以及捕获探针的末端与模板的末端的邻近连接,以及利用例如附着的衔接子后续扩增模板中的靶序列。与多重聚合酶链反应(PCR)二代测序分析相比,这些方法可以提高核酸组合(panel)设计的灵活性和实用性,并且可以节省大量时间和成本。该方法还可以保持核酸样品的高复杂性,并且例如使用受损的DNA作为输入时,由于高转化率而可以具有低偏倚显示的特点。
此外,本文公开的局部靶捕获方法可以消除双链DNA修复步骤和繁琐的探针杂交/富集。所公开的方法可以用于单链DNA、受损DNA、片段化DNA(例如来自福尔马林固定石蜡包埋(FFPE)的样品)、亚硫酸氢盐处理的DNA,和RNA。
a.通过直接杂交添加靶向探针的概述
本文公开的方法包括通过直接杂交和附着将捕获探针选择性地附着于具有靶序列的模板核酸分子。捕获探针可以被设计成包括可以与模板核酸分子中的特定靶序列杂交并由此可以与靶模板杂交的靶特异性区。杂交带来的邻近可以促进捕获探针的5’末端附着于模板核酸分子的3’末端。捕获探针的5’末端可以通过使用连接酶连接而附着于模板的3’末端。捕获探针的5’末端可以被磷酸化以促进其与模板核酸分子的连接。模板核酸分子的5’末端可以去磷酸化以减少自连接,例如,在捕获探针的靶特异性区与模板中的靶序列杂交之前。
捕获探针可以包括可充当用于扩增的引物退火位点的衔接子。捕获探针可以进一步包括分子条形码(MB)以唯一识别附着的模板核酸分子,从而用于模板核酸分子的随后测序、检测、识别、测量和/或分析。
b.通过间接缔合添加靶向探针的概述
所公开的方法进一步包括某些实施方式,其包括通过间接缔合和附着将衔接子锚探针选择性地附着于具有靶序列的模板核酸分子。可以将桥探针设计为与模板核酸分子中的特定靶序列杂交,从而可以与靶模板杂交。衔接子锚探针又可以被设计为与桥探针杂交并且可以将其与桥探针杂交,从而产生三个杂交核酸分子的组装体。三个核酸分子之间的杂交所带来的邻近可以促进衔接子锚探针的5’末端附着于模板核酸分子的3’末端。衔接子锚探针的5’末端可以通过使用连接酶连接而附着于模板的3’末端。衔接子锚探针的5’末端可以被磷酸化以促进其与模板的连接。模板核酸分子的5’末端可以去磷酸化以减少自连接。
衔接子锚探针可以可充当用于扩增的引物退火位点的衔接子。衔接子锚探针可以进一步包括分子条形码以唯一识别附着的模板,从而用于模板核酸分子的随后测序、检测、识别、测量和/或分析。
c.通过直接杂交添加衔接子的概述
本文公开的方法包括通过直接杂交将捕获探针与具有靶序列的模板核酸分子选择性杂交。所公开的方法包括某些实施方式,其包括将靶探针的一个或多个衔接子添加或掺入延伸产物中,而不将靶探针附着或连接于模板核酸。捕获探针可以被设计成包括可以与模板核酸分子中的特定靶序列杂交并由此可以与靶模板杂交的靶特异性区。捕获探针可以进一步包括可充当用于扩增的引物退火位点的衔接子。衔接子可以位于靶特异性区的5’末端。
在与捕获探针杂交后,模板核酸分子可以与3’至5’核酸外切酶接触以消化模板核酸的任何3’突出端。消化后,可以延伸模板核酸分子的3’末端以产生包括与衔接子互补的序列的延伸产物。
在一些情况下,在捕获探针和模板核酸杂交后,捕获探针的3’末端可以被延伸以产生包括衔接子的延伸产物。
捕获探针可以进一步包括分子条形码(MB)以唯一地识别附着的模板核酸分子,从而用于模板核酸分子的随后测序、检测、识别、测量和/或分析。
d.通过间接缔合添加衔接子的概述
所公开的方法进一步包括某些实施方式,其包括将桥探针与模板核酸选择性杂交。所公开的方法包括某些实施方式,其包括将桥探针的一个或多个衔接子添加或掺入延伸产物中,而不将靶向探针附着或连接于模板核酸。可以将桥探针设计为与模板核酸分子中的特定靶序列杂交,从而可以与靶模板杂交。衔接子锚探针又可以被设计为与桥探针杂交并且可以将其与桥探针杂交,从而产生三个杂交核酸分子的组装体。多重杂交组装体可以协同地为复合物提供更高的稳定性。桥探针可以进一步包括可作为用于扩增的引物退火位点的衔接子。衔接子可以位于靶特异性区的5’末端。
在与捕获探针杂交后,模板核酸分子可以与3’至5’核酸外切酶接触以消化模板核酸的任何3’突出端。消化后,可以延伸模板核酸分子的3’末端以产生包括与衔接子互补的序列的延伸产物。桥探针的3’末端也可以在桥探针和模板杂交时延伸以产生包括衔接子的延伸产物。
桥探针可以进一步包括分子条形码(MB)以唯一识别附着的模板核酸分子,从而用于模板核酸分子的随后测序、检测、识别、测量和/或分析。
II.通过直接杂交添加探针
本文公开的方法可以包括捕获探针与模板的直接杂交和连接。捕获探针可以包括衔接子,引物可以与该衔接子杂交。可以使用用于测序和/或文库构建的引物进行扩增。
a.使用衔接子的靶向探针邻近连接和扩增
本文公开了一种方法,包括将捕获探针的靶特异性区与模板核酸分子的靶序列杂交;将模板核酸分子的3’末端附着于捕获探针的5’末端,从而产生附着于捕获探针的模板核酸分子;将第一衔接子引物与捕获探针的第一衔接子杂交;延伸第一衔接子引物,从而产生第一延伸产物;以及将第二衔接子附着于第一延伸产物的3’末端,从而产生附着于第二衔接子的第一延伸产物。
捕获探针可以包括具有唯一识别序列的分子条形码(MB)以唯一识别模板和/或确保捕获探针对模板核酸分子的特异性。模板核酸分子可以在其5’末端磷酸化以促进衔接子(例如双链第二衔接子)的一条链与模板核酸分子的连接。为了扩增模板核酸分子,与第二衔接子杂交的第二衔接子引物可以与第一衔接子引物一起使用。与模板核酸分子的靶序列杂交的引物可以与第一衔接子引物一起用于扩增模板核酸分子。
图1A示出了捕获探针与模板核酸分子的直接杂交以及捕获探针与模板的连接的方法。可以使用核酸,例如含有靶序列(哈希标记,TS)的双链(ds)DNA作为模板。其中一条链可能受损(例如,有缺口)。捕获探针可以包括与模板的TS互补的靶特异性区(TSR)和第一衔接子(AD1)。捕获探针的5’末端可以被磷酸化。模板可以在其5’末端去磷酸化。捕获探针的TSR可以与模板的TS杂交,并且捕获探针的磷酸化5’末端可以与模板的3’末端连接,因为杂交后非常邻近。第一衔接子引物(AD1引物)可以与捕获探针的第一衔接子(AD1)杂交并延伸,例如,用链取代机制合成如图1B所示的互补链。图1C示出了连接的第二衔接子(AD2)用于进一步扩增TS。可以将双链AD2与模板和其延伸产物连接,并且可以使用在各末端处与AD1和AD2退火的引物进行PCR,从而扩增TS并产生文库。在一些情况下,单链AD2衔接子与延伸产物的3’连接。捕获探针可以包括唯一分子条形码(MB)以在后续分析中唯一地识别模板。
一旦捕获探针附着于模板,则可以采用不同的引物进行扩增。如图2C所示,可以使用与AD1和TS的互补序列杂交的引物来扩增靶序列(TS)。在另一实施方式中,引物可以被设计为与在TS的互补序列侧翼(例如TS互补序列的5’或3’)的区域退火。
在捕获探针与模板连接后,可以从捕获探针分离或切割TSR。切割可以去除发夹环。原始模板链可能不是PCR反应的理想模板,因为由TSR和TS杂交形成的发夹环以及捕获探针与模板的连接可能干扰引物与AD1的退火和后续延伸。在捕获探针与模板的邻近连接之后,TSR可以在例如TSR的5’末端和AD1的3’末端之间通过例如限制性酶被切割,例如,如图4A和图4B所示。可以从模板去除切割的TSR,并且可以在延伸反应中使用AD1引物以在去除TSR后扩增模板(参见例如,图4C)。
b.使用TSR进行靶向探针邻近连接和扩增
捕获探针的3’末端可作为延伸引物来合成模板核酸分子的互补链,而无需单独的延伸引物。图3A-图3C示出了在捕获探针与模板邻近连接之后,捕获探针的TSR区域用于扩增模板的可能用途。一旦杂交的捕获探针的5’末端与模板的3’末端连接,杂交捕获探针就可以形成发夹环(参见例如,图3A和图3B)。TSR(在捕获探针的3’末端)可以如引物一样向模板的5’末端延伸,形成与模板杂交的互补序列(参见例如,图3B-图3C)。可以将双链AD2与成环并延伸的模板的末端连接(参见例如,图3C)。在一些情况下,单链AD2衔接子可以与模板的5’末端连接。模板的5’末端可以被磷酸化以确保AD2链与模板连接。然后可以使用与AD1和AD2序列退火的引物进一步扩增模板链(参见例如,图3C)。
III.通过间接缔合添加探针
探针可以与模板间接缔合并且与模板邻近连接。这种方法可以为捕获探针组合的设计提供灵活性,并且可以允许在连接后从模板分离TSR。桥探针可以包括与模板的TS杂交的TSR和与衔接子锚探针的桥结合序列(BBS)杂交的衔接子着陆序列(ALS)。模板与桥探针之间以及桥探针与衔接子锚探针之间的杂交可以使衔接子锚探针靠近模板,促进衔接子锚探针与模板的连接。衔接子锚探针可以进一步包括AD1、唯一标识符、MB和5’磷酸。
a.使用衔接子的靶向探针邻近连接和扩增
本文公开了一种方法,包括将第一桥探针的第一靶特异性区(TSR)与模板核酸分子的第一靶序列(TS)杂交,其中该第一桥探针的第一衔接子着陆序列(ALS)与衔接子锚探针的第一桥结合序列(BBS)结合;以及将模板核酸分子的3’末端附着(例如,连接)于衔接子锚探针的5’末端,从而产生附着于衔接子锚探针的模板核酸分子(参见例如,图5A和图6A)。第一桥探针可以进一步包括连接靶特异性区(TSR)和ALS的接头(参见例如,图5A和图6A)。
衔接子锚探针可以包括具有唯一识别序列的MB,以在后续分析中唯一地识别模板(参见例如,图5A和图6A)和/或确保捕获探针对模板核酸分子的特异性。模板核酸分子可以在其5’末端磷酸化以促进第二衔接子(例如单链或双链衔接子)的一条链与模板核酸分子的连接(参见例如,图5A和图6A)。为了扩增模板核酸分子,与第二衔接子杂交的第二衔接子引物可以与第一衔接子引物一起使用。在一些情况下,与模板核酸分子的靶序列(TS)的互补序列杂交的引物可以与第一衔接子引物一起用于扩增模板核酸分子(参见例如,图6C)。第一桥探针的第一靶特异性区(TSR)可以在第一桥探针的3’部分中(参见例如,图5A和图6A)。第一桥探针的第一靶特异性区(TSR)可以在第一桥探针的5’部分中(参见例如,图7A)。衔接子锚探针可以通过桥探针与模板缔合,并且衔接子锚探针的磷酸化的5’末端可以与模板的3’末端连接,从而将衔接子锚探针的AD1和MB附着于模板(参见例如,图5A、图6A、图7A和图8A)。可以使用与AD1和AD2退火的引物(参见例如,图5C和图7C)或与AD1以及TS的互补序列退火的引物(参见例如,图6C)来扩增连接的模板。衔接子锚探针可能缺少TSR;当衔接子锚探针缺少TSR时,它不会与模板形成双链。在一些情况下,衔接子锚探针和模板之间的直接杂交可干扰引物退火,例如,衔接子锚探针中AD1引物与AD1衔接子的退火。
b.使用TSR的靶向探针邻近连接和扩增
第一桥探针3’末端的TSR可以如引物一样延伸以产生第一延伸产物(参见例如,图8B)。第二衔接子(AD2)可以附着于第一延伸产物并且AD2引物可以与AD1引物一起使用以扩增模板(参见例如,图8C)。AD2可以是双链的并附着于模板和第一延伸产物,模板5’末端的磷酸化对此有利(参见例如,图8C)。在一些情况下,AD2是单链的,并且连接至模板的5’末端。在其他实施方式中,可以使用与AD1以及TS的互补序列退火的引物来扩增靶序列。
图8A-图8C示出了使用TSR(桥探针的3’末端)进行延伸反应的实例。桥探针3’末端的TSR可作为延伸引物来合成具有与模板互补的序列的第一延伸产物(参见例如,图8B)。模板的5’末端可以被磷酸化以促进双链AD2的连接(参见例如,图8C)。在一些情况下,单链AD2与模板的5’末端连接。模板可以通过与AD1和AD2序列(或AD2的互补序列)退火的引物组进行扩增。
c.多个靶向探针桥探针的杂交和邻近连接
该方法可以进一步包括将第二桥探针的第二靶特异性区(TRS2)与模板核酸分子的第二靶序列(TS2)杂交,其中该第二桥探针的第二衔接子着陆序列(ALS2)与衔接子锚探针的第二桥结合序列(BBS2)结合(参见例如,图9-图12)。第二桥探针可以进一步包括连接第二靶特异性区(TSR2)和ALS2的接头(参见例如,图9-图12)。第二桥探针可以包括在第二靶特异性区(TSR2)和第二衔接子着陆序列(ALS2)之间的第二接头。
第一桥探针的第一靶特异性区(TSR1)可以在第一桥探针的3’部分中并且第二桥探针的第二靶特异性区(TSR2)可以在第二桥探针的3’部分中,例如,如图9所示。第一桥探针的第一靶特异性区(TSR1)可以在第一桥探针的5’部分中并且第二桥探针的第二靶特异性区(TSR2)可以在第二桥探针的5’部分中(参见例如,图10)。第一桥探针的第一靶特异性区(TSR1)可以在第一桥探针的5’部分中并且第二桥探针的第二靶特异性区(TSR2)可以在第二桥探针的3’部分中(参见例如,图12)。第一桥探针的第一靶特异性区(TSR1)可以在第一桥探针的3’部分中并且第二桥探针的第二靶特异性区(TSR2)可以在第二桥探针的5’部分中(参见例如,图11)。第一桥探针的接头可以进一步与第二桥探针的接头杂交。第一桥探针和第二桥探针的杂交可以稳定四核酸分子组装体并且可以促进衔接子锚探针的5’末端与模板的3’末端的连接(参见例如,图11)。
在本文所述的方法中可以使用多于两个的桥探针。例如,至少2、3、4、5、6、7、8、9、10、25、50、75、100或更多个桥探针可用于在本文所述方法中将模板和衔接子锚探针桥接。
IV.通过直接杂交添加衔接子
本文公开的方法可以包括捕获探针和模板核酸的直接杂交,以及将捕获探针的衔接子添加或掺入延伸产物中。捕获探针可以包括衔接子,引物可以与该衔接子杂交。可以使用用于测序和/或文库构建的引物进行扩增。捕获探针可以进一步包括分子条形码。还可以在未将捕获探针与模板核酸连接的情况下进行衔接子添加。
模板核酸分子可以从低输入样品(例如无细胞DNA(cfDNA)和循环肿瘤DNA(ctDNA))捕获和富集。捕获和富集可以通过与捕获探针的直接杂交进行。捕获探针可以包括一个或多个结合部分。结合部分可以是生物素。结合部分可以附着于支持物。支持物可以是珠粒。珠粒可以是链霉亲和素珠粒。
图19A-图19C示出了在捕获探针与模板核酸直接杂交之后添加或掺入衔接子的各种方法。包含靶序列(哈希标记,TS)的核酸可用作模板。捕获探针可以包括与模板的TS互补的靶特异性区(TSR)和衔接子(AD)。图19A显示了模板核酸与捕获探针的杂交或捕获,随后是衔接子与模板的直接附着。图19C显示了在与模板杂交后,包括衔接子的捕获探针与模板的附着。包括靶序列(哈希标记,TS)的核酸可以用作模板。捕获探针可以包括与模板的TS互补的靶特异性区(TSR)和衔接子(AD)。
a.核酸外切酶消化后添加衔接子
本文公开了一种方法,包括将捕获探针的靶特异性区与模板核酸分子的靶序列杂交,其中该捕获探针进一步包括位于该靶特异性区的5’末端的第一衔接子;与靶特异性区杂交后,模板核酸分子与3’至5’核酸外切酶接触;延伸模板核酸分子的3’末端,从而产生第一延伸产物。该方法进一步包括将包括第一衔接子的引物与第一延伸产物杂交;以及延伸包括第一衔接子的引物,从而产生第二延伸产物。在一些情况下,可以将捕获探针的3’末端延伸以产生第二延伸产物。
图19B示出了模板核酸分子与捕获探针的杂交或捕获,随后使用3’至5’核酸外切酶消化单链3’突出端。消化后,使用捕获探针的衔接子作为模板延伸模板核酸,从而将衔接子掺入延伸产物。
图22A-图22G进一步示出了杂交、消化和延伸的步骤。图22E显示了靶特异性引物与第二延伸产物的杂交,其中靶特异性引物附着于第二衔接子;以及延伸靶特异性引物以产生第三延伸产物。可以进一步扩增第二延伸产物和第三延伸产物以产生图22G的扩增产物。
在一些情况下,所公开的方法可以包括将第二衔接子附着于第一延伸产物的5’末端,如图22F所示。第一延伸产物的5’末端可以被磷酸化以促进附着第二衔接子。第二衔接子可以是双链衔接子,其中第二衔接子的两条链中的一条链附着于第二延伸产物。在附着第二衔接子后,可以扩增第一延伸产物和第二延伸产物以产生图22G的扩增产物。
b.捕获探针延伸后添加衔接子
杂交或捕获的模板核酸分子还可以通过延伸捕获探针的3’末端来扩增,以产生第一延伸产物,而不需要单独的延伸引物。捕获探针可以包括衔接子。
该方法可以进一步包括将第二衔接子附着于第一延伸产物的3’末端,从而产生附着于第二衔接子的第一延伸产物。模板核酸的5’末端可以被磷酸化以促进第二衔接子与模板的附着或连接。第二衔接子可以是双链衔接子。双链第二衔接子的两条链中的一条链可以附着于模板核酸分子。第二衔接子引物可以与附着于第一延伸产物的第二衔接子杂交并延伸以产生第二延伸产物。附着于第二衔接子的第一延伸产物和第二延伸产物可以被扩增以产生扩增产物。
在一些情况下,靶特异性引物可以与附着于第二衔接子的第一延伸产物杂交。靶特异性引物可以被延伸以合成附着于第二衔接子的第一延伸产物的互补链(第二延伸产物)。第一延伸产物和第二延伸产物可以被扩增以形成更多扩增产物。
通过直接或间接相互作用(参见图25A,上图和中间图)延伸附着于衔接子的杂交靶探针,可以将衔接子添加到延伸产物中。胸腺嘧啶可以通过末端核酸酶转移酶添加到DNA模板中(参见图25A,下图)。聚腺嘌呤(多聚A)寡核苷酸可以与延伸模板的3’-多聚T杂交。如图25B所示,多聚A寡核苷酸可以附着于衔接子,使得当多聚A的3’末端延伸时,第一延伸产物可以包括第一衔接子。可将聚胞嘧啶(多聚C)添加至延伸产物的3’末端,其可以与附着于第二衔接子的聚鸟嘌呤(多聚G)引物互补结合(参见图25C)。然后,多聚G-衔接子可以用作模板以允许核苷酸添加过程继续进行,并且用作第二衔接子添加到第一延伸产物(参见图25D)。
V.通过间接缔合添加衔接子
靶探针杂交可以通过模板核酸和形成组装体的一种或多种探针的协同相互作用来促进。多复合物组装体可以稳定模板和靶探针之间的杂交相互作用。桥探针可以包括与模板的靶区域杂交的靶特异性区和与衔接子锚探针的桥结合序列(BBS)杂交的衔接子着陆序列(ALS)。模板和桥探针之间以及桥探针和衔接子锚探针之间的杂交可以形成多复合物组装体。桥探针可以进一步包括AD1、唯一标识符、MB和/或5’磷酸。使用桥探针可以合成延伸产物。还可以将衔接子添加或掺入延伸产物,而无需将桥探针或衔接子锚探针与模板核酸连接。在本文公开的方法中可以使用多于两个的桥探针。例如,至少2、3、4、5、6、7、8、9、10、25、50、75、100或更多个桥探针可用于桥接模板和衔接子锚探针。
模板核酸可以从低输入样品(例如无细胞DNA(cfDNA)和循环肿瘤DNA(ctDNA))捕获和富集。捕获和富集可以通过与桥探针杂交,经由与衔接子锚探针间接缔合而进行。桥探针和/或衔接子锚探针可以包括一个或多个结合部分。结合部分可以是生物素。结合部分可以附着于支持物。支持物可以是珠粒。珠粒可以是链霉亲和素珠粒。
图20A-图20D显示了在用桥探针和衔接子锚探针杂交或捕获后,将衔接子添加或掺入模板核酸的不同方法。图20A示出了衔接子与捕获的模板核酸的连接。图20D显示了杂交后包括衔接子的衔接子锚探针与模板的邻近连接。
该方法可以进一步包括将第二桥探针的第二靶特异性区与模板核酸分子的第二靶序列杂交,其中第二桥探针的第二衔接子着陆序列可以与衔接子锚探针的第二桥结合序列结合(参见例如,图21A-图21E)。第二桥探针可以进一步包括连接第二靶特异性区和第二衔接子着陆序列的接头。
a.桥探针延伸后添加衔接子
本文公开了一种方法,包括将第一桥探针的第一靶特异性区与模板核酸分子的第一靶序列杂交,其中该第一桥探针的第一衔接子着陆序列可以与衔接子锚探针的第一桥结合序列结合;将第二桥探针的第二靶特异性区与模板核酸分子的第二靶序列杂交,其中该第二桥探针的第二衔接子着陆序列可以与衔接子锚探针的第二桥结合序列结合;以及延伸第一桥探针的3’末端,从而产生第一延伸产物。第一桥探针可以包括第一衔接子。
该方法可以进一步包括将第二衔接子附着于第一延伸产物的3’末端。第二衔接子可以是双链衔接子。第二衔接子的两条链中的一条链可以附着于模板核酸分子。在将第二衔接子附着于模板之前,模板核酸分子的5’末端可以被磷酸化。
可选地,靶特异性引物可以与第一延伸产物杂交并且可以被延伸以产生第二延伸产物。靶特异性引物可以附着于第二衔接子。包括第一衔接子的引物可以与第二延伸产物杂交并且可以延伸以产生第三延伸产物。扩增第二延伸产物和第三延伸产物可以产生进一步的扩增产物。
图20B显示了通过使用靶核酸分子作为模板来延伸桥探针的3’末端而将衔接子掺入延伸产物。
图23A-图23F示出了在延伸产物中掺入一个或多个衔接子。图23A-23C显示了第一桥探针的杂交和延伸,以及第一延伸产物。靶特异性引物可以与第一延伸产物杂交并延伸以合成与第一延伸产物互补的链,并且包括第一衔接子的引物可以与第二延伸产物杂交产生与第二延伸产物互补的序列(参见图23D)。可以扩增第二延伸产物和第三延伸产物以产生图23F所示的扩增产物。在另一种情况下,第二(双链)衔接子可以附着于第一延伸产物的3’末端和模板核酸分子的5’末端(参见图23E)。模板核酸分子的5’末端可以在附着第二衔接子之前被磷酸化。桥探针可以进一步包括分子条形码,其可以被掺入延伸产物中以唯一地识别附着的模板,从而用于模板核酸分子的随后测序、检测、识别、测量和/或分析。
通过延伸附着于衔接子的杂交桥探针,可以将衔接子添加或掺入延伸产物。还可以通过首先对模板核酸分子进行3’引物延伸,将衔接子添加到延伸产物中。聚胸腺嘧啶(多聚T)寡核苷酸可以通过末端核酸转移酶添加到DNA模板的3’末端。聚腺嘌呤(多聚A)寡核苷酸可以与延伸模板的3’-多聚T杂交。多聚A寡核苷酸可以附着于衔接子,使得当多聚A的3’末端被延伸时,第一延伸产物可以包括第一衔接子。聚胞嘧啶(多聚C)可以添加到第一延伸产物的3’末端,它可以与附着于第二衔接子的聚鸟嘌呤(多聚G)引物互补结合。多聚G-衔接子可以作为模板,第一延伸产物可以进一步延伸以添加第二衔接子。
b.核酸外切酶消化后添加衔接子
与桥探针杂交后,模板可以具有单链3’突出端。3’突出端可以用充当3’至5’核酸外切酶的酶进行消化。本文提供了一种方法,包括将第一桥探针的第一靶特异性区与模板核酸分子的第一靶序列杂交,其中该第一桥探针的第一衔接子着陆序列与衔接子锚探针的第一桥结合序列结合,其中该第一桥探针进一步包括位于靶特异性区5’末端的第一衔接子;以及与靶特异性区杂交后,将模板核酸分子与3’至5’核酸外切酶接触;使用第一衔接子作为模板延伸模板核酸分子的3’末端,从而产生第一延伸产物(参见图20C)。
图24A-图24F进一步示出了在用3’至5’核酸外切酶消化后将一种或多种衔接子掺入延伸产物中的步骤。图24A-图24C显示了多个桥探针与模板和衔接子锚探针杂交,随后使用第一桥探针的第一衔接子作为模板来延伸模板的3’末端以产生包括第一衔接子的互补序列的第一延伸产物。第一延伸产物可以与包括第一衔接子的引物杂交并且引物的3’末端可以被延伸以产生第二延伸产物(参见图24D-图24E)。可以将靶特异性引物与第二延伸产物杂交并且可以延伸3’末端以产生第三延伸产物(参见图24D)。在靶特异性引物与第一延伸产物杂交之前,可以将第二衔接子附着于靶特异性引物。可以扩增第二延伸产物和第三延伸产物以产生更多扩增产物(参见图24F)。如图24E所示,第二(双链)衔接子可以附着于第一延伸产物的5’末端和第二延伸产物的3’末端。在附着于第二衔接子之前,第一延伸产物可能需要被磷酸化。
在一些情况下,模板核酸分子的3’末端可以在第一桥探针的3’末端延伸之前、同时或之后延伸,以产生第一延伸产物和第二延伸产物。可以在模板核酸的3’延伸之前,将模板核酸分子与3’至5’核酸外切酶接触以去除任何3’突出端。
VI.亚硫酸氢盐转化的工作流程
本文提供了用于核酸的亚硫酸氢盐处理的方法。亚硫酸氢盐处理的核酸可用于研究核酸的甲基化。亚硫酸氢盐处理可以将非甲基化胞嘧啶转化为尿嘧啶。胞嘧啶的甲基化(例如,5’-甲基胞嘧啶)可以防止亚硫酸氢盐将甲基化胞嘧啶转化为尿嘧啶。
在捕获探针与模板连接后,所得产物可以使用亚硫酸氢盐处理(参见例如,图13B)。双链序列的形成(例如,在模板的TS和捕获探针的TSR之间)可以在亚硫酸氢盐处理期间保护杂交区域中的胞嘧啶免于转化为尿嘧啶(参见,例如,图14)。通过桥探针与模板和衔接子锚探针杂交形成的双链序列可以提供保护杂交区域中的亚硫酸氢盐免于转化为尿嘧啶。此外,由于亚硫酸氢盐处理可以将非甲基化胞嘧啶转化为尿嘧啶,因此在TS区域保护胞嘧啶免于转化为尿嘧啶可以允许使用旨在与非亚硫酸氢盐转化的DNA退火的扩增引物。对于亚硫酸氢盐转化前的捕获,还可以针对未转化的序列设计探针。与未转化的胞嘧啶退火的探针和引物可以更直接地设计并提供更好的杂交。
a.靶探针与模板核酸杂交和/或连接后的亚硫酸氢盐处理
模板核酸(例如,DNA)可用于本文所述的靶向衔接子邻近连接和富集(TALE)以及后续测序(TALE-SEQ)(参见例如,图13B(1310);(1312))。模板核酸(例如DNA)可以是例如基因组DNA或cfDNA。模板核酸(例如,DNA)可以通过例如如本文所述的邻近连接而附着于捕获探针或衔接子锚探针,例如,如图1A-图12和图17(1314)所示。附着于捕获探针或衔接子锚探针的模板核酸(例如,DNA)可以用亚硫酸氢盐处理(1316)、延伸(1318)并后续扩增(1320),例如用于甲基化测序。在一些情况下,亚硫酸氢盐处理可以在捕获探针的TSR分离之前发生(参见例如,图4B)。在一些情况下,可以在捕获探针或桥探针与模板核酸分子杂交之后进行亚硫酸氢盐处理。与捕获探针或桥探针杂交的模板核酸分子可以用亚硫酸氢盐处理、延伸并后续扩增以用于甲基化测序。
可以基于模板核酸分子的靶序列而设计捕获探针或桥探针的靶特异性区,并且在亚硫酸氢盐处理后,模板核酸分子的靶序列可以保留非甲基化胞嘧啶。
图14示出了在TS和TSR杂交以及捕获探针与模板连接之后发生的亚硫酸氢盐处理期间,保护TS和TSR位点中的非甲基化胞嘧啶免于转化为尿嘧啶。在该实例中,捕获探针与模板杂交并且捕获探针的5’末端与模板的3’末端邻近连接,形成双链区域和发夹环(参见例如,图14)。随后,附着的模板用亚硫酸氢盐处理,在此期间,杂交的TSR-TS区域中的非甲基化胞嘧啶未转化为尿嘧啶,而单链区域中(环中)的非甲基化胞嘧啶转化为尿嘧啶。在TS区域保护胞嘧啶免于转化为尿嘧啶可以允许使用设计为与非亚硫酸氢盐转化的DNA退火的探针。在一些情况下,引物结合位点(例如衔接子和/或模板)中的一个或多个胞嘧啶残基未被保护免于亚硫酸氢盐转化。在亚硫酸氢盐转化之后,衔接子中的引物结合位点可以包括一个或多个尿嘧啶。引物可以设计为与包括一个或多个尿嘧啶的衔接子序列互补。引物可以与包括一个或多个尿嘧啶的衔接子序列100%互补,或与包括一个或多个尿嘧啶的衔接子序列小于100%互补。
在亚硫酸氢盐处理后,模板可以包括一个或多个尿嘧啶。与衔接子退火的引物可以使用包括一个或多个尿嘧啶的模板进行链延伸。延伸的链可以包括与一个或多个尿嘧啶碱基配对的一个或多个腺嘌呤。延伸产物可以从模板变性。引物可以与包括一个或多个腺嘌呤的区域中的延伸产物退火并延伸。引物可用于使用例如衔接子引物来扩增模板。
b.靶探针与模板杂交和/或连接之前的亚硫酸氢盐处理
模板核酸分子可以在与捕获探针或桥探针杂交以及与捕获探针或衔接子锚探针连接之前进行亚硫酸氢盐处理(参见例如,图13A(1300))。DNA可以用亚硫酸氢盐处理以将非甲基化胞嘧啶转化为尿嘧啶(1302)。亚硫酸氢盐处理的DNA可用作靶向衔接子邻近连接和富集(TALE)以及后续测序(TALE-SEQ)(1304)的输入。亚硫酸氢盐处理的DNA可用作邻近衔接子连接(1306)的输入,例如,如图1A-图12和图17所示。探针的TSR可以设计为与这样的模板退火,该模板中存在的非甲基化胞嘧啶已转化为尿嘧啶。在邻近衔接子连接之后,可以进行延伸(1306),然后进行靶扩增(1308)。
VII.清除(Clean-up)/特异性
a.使用核酸外切酶清除脱靶核酸分子或随机连接产物
在一些情况下,在捕获探针的TSR没有与模板退火的情况下,捕获探针的5’末端可以与模板的3’末端连接。在衔接子锚探针没有通过桥探针与模板缔合的情况下,衔接子锚探针的5’末端可以与模板的3’末端连接。这些连接事件的产物可能是不需要的。在直接杂交和连接步骤之后,可以将核酸外切酶添加到所得的核酸分子混合物中,以消化探针与模板的任何非特异性附着。
在实例中,在捕获探针的TSR没有与模板的TS退火的情况下,捕获探针的5’末端可以与模板的3’末端连接,从而产生线性分子(例如,缺少茎环的分子)(参见例如,图15B)。由于捕获探针的TSR与模板的TS杂交而产生的任何特定附着均可以产生发夹环,从而保护模板不被核酸外切酶(例如,3’至5’核酸外切酶)消化(参见例如,图15A)。图15A显示了捕获TSR与模板TS的特异性杂交以及捕获探针的5’末端与模板的3’末端的连接。杂交和连接可以形成发夹环,保护模板免受核酸外切酶(例如3’至5’核酸外切酶)的消化。模板的5’末端可以包括阻止5’至3’核酸外切酶切割的块(block)。图15B显示了捕获探针的5’末端与模板的3’末端的连接,其中模板的TSR未与模板的TS退火,或模板不包括TS。在使用一个或多个桥探针的情况下,衔接子锚探针的5’末端可以与模板的3’末端连接,其中衔接子锚探针通过一个或多个桥探针与模板缔合。连接未导致发夹环形成,无法防止核酸外切酶(例如,3’至5’核酸外切酶)消化,从而导致脱靶随机连接产物降解。图15B示出了切割游离模板、游离捕获探针以及捕获探针和模板的脱靶连接产物的核酸外切酶(例如,3’至5’核酸外切酶)。脱靶连接产物的核酸外切酶切割可导致选择这样的连接产物,其中捕获探针与模板特异性杂交并且捕获探针附着(例如,连接)于模板。在核酸外切酶处理之后,可以进行纯化步骤以在进行后续延伸和扩增步骤之前从连接产物中去除核酸外切酶。
b.固相萃取
本文提供了选择例如在衔接子锚探针与模板连接之前与桥探针杂交的模板(或通过桥探针与衔接子锚探针缔合的模板)的方法。该方法可以采用固相萃取。该方法可用于增加衔接子锚探针连接至与衔接子锚探针特异性缔合的模板的可能性。本文提供了将捕获探针、桥探针或衔接子锚探针与固体支持物结合的方法。衔接子锚探针独立于桥探针而附着(例如,连接)于模板的可能性可以引入次优特异性。为了减少此类非特异性连接产物以及未结合的探针,可以使用标记物(例如,生物素)和捕获部分(例如,链霉亲和素珠粒)。
捕获探针、桥探针或衔接子锚探针可以包括标记物。所公开的方法可以进一步包括通过标记物来捕获捕获探针、桥探针或衔接子锚探针。标记物可以是生物素。标记物可以是核酸序列,例如多聚A或多聚T,或特定序列。核酸序列的长度可以为约5至30个碱基。核酸序列可以包括DNA和/或RNA。标记物可以位于捕获探针、桥探针或衔接子锚探针的3’末端。标记物可以是肽,或是可以被抗体(例如5-溴尿苷)识别的修饰核酸,以及生物素。标记物可以通过反应如“点击”化学与捕获探针、桥探针或衔接子锚探针缀合。“点击”化学可以使报告分子(如荧光染料)与生物分子(如DNA)缀合。点击化学可以是叠氮化物和炔烃之间的反应,可以产生共价产物(例如,1,5-二取代的1,2,3-三唑)。铜可以作为催化剂。
标记物可以被捕获在固体支持物上。固体支持物可以是磁性的。固体支持物可以包括珠粒、流动池、玻璃、板、包括一个或多个微流体通道的装置,或柱。固体支持物可以是磁珠。
固体支持物(例如,珠粒)可以(例如,通过包被)包括一种或多种可以结合标记物的捕获部分。捕获部分可以是链霉亲和素,并且链霉亲和素可以结合生物素。捕获部分可以是抗体。抗体可以结合标记物。捕获部分可以是核酸,例如包括DNA和/或RNA的核酸。核酸捕获部分可以结合例如衔接子锚探针或桥探针上的序列。在一些情况下,结合到固体表面的抗RNA/DNA杂交抗体可用作捕获部分。
标记物和捕获部分可以通过一个或多个共价或非共价键结合。在固体支持物上捕获捕获探针、桥探针或衔接子锚探针后,可以洗涤固体支持物以从样品中去除例如未结合的模板。在一些情况下,不进行洗涤步骤。洗涤可以是严格的或温和的。被捕获的捕获探针、桥探针或衔接子锚探针(和缔合的模板)可以被洗脱,例如,当标记物是生物素且捕获部分是链霉亲和素时,通过向样品中添加游离生物素。
捕获探针的5’末端与模板的3’末端的连接可以在捕获探针被捕获在固体支持物上时发生。捕获探针的5’末端与模板的3’末端的连接可以在捕获探针/模板复合物从固相支持物洗脱后发生。捕获探针或衔接子锚探针的5’末端可以在捕获探针或衔接子锚探针被捕获在固体支持物上时被磷酸化。
衔接子锚探针的5’末端与模板的3’末端的连接可以在衔接子锚探针(以及缔合的桥探针和模板)被捕获在固体支持物上时发生。衔接子锚探针的5’末端与模板的3’末端的连接可以在衔接子锚探针(以及缔合的桥探针和模板)从固体支持物上洗脱后发生。捕获探针或衔接子锚探针的5’末端可以在从固体支持物洗脱后被磷酸化。
延伸步骤(例如,与捕获探针中的AD1衔接子退火的AD1引物的延伸)可以在捕获探针或衔接子锚探针被捕获在固体支持物上时或在捕获探针(和连接的模板)或衔接子锚探针(和连接的模板)从固体支持物上洗脱后进行。
图16A示出了在模板、桥探针和衔接子锚探针杂交之后使用链霉亲和素珠粒进行清除,其中衔接子锚探针的3’末端被生物素化。杂交复合物和游离衔接子、锚衔接子都可以与珠粒结合。未结合的模板和桥探针可以被洗去。杂交复合物仍可以发生邻近连接。当复合物在珠粒上时可以进行连接。在从珠粒上洗脱复合物后可以进行连接。然而,对于游离衔接子锚探针,连接至任何模板DNA的可能性可极大降低。在图16B中,第一和/或第二桥探针的5’末端或3’末端可以被生物素化。链霉亲和素珠粒可用于去除未杂交的衔接子锚衔接子和模板,这可以防止衔接子锚探针和模板的随机连接。
VIII.模板核酸分子
模板核酸可以是DNA或RNA。DNA可以是基因组DNA(gDNA)、线粒体DNA、病毒DNA、cDNA、cfDNA或合成DNA。DNA可以是双链DNA、单链DNA、片段化DNA或受损的DNA。RNA可以是mRNA、tRNA、rRNA、microRNA、snRNA、piRNA、非编码小RNA、多核糖体RNA、内含子RNA、前体mRNA、病毒RNA或无细胞RNA。
模板核酸可以是天然存在的或合成的。模板核酸可以具有修饰的杂环碱基。修饰可以是甲基化嘌呤或嘧啶、酰化嘌呤或嘧啶、烷基化核糖或其他杂环。模板核酸可以具有修饰的糖部分。修饰的糖部分可以包括肽核酸。模板核酸可以包括肽核酸。模板核酸可以包括苏糖核酸。模板核酸可以包括锁核酸。模板核酸可以包括己糖醇核酸。模板核酸可以是柔性核酸。模板核酸可以包括甘油核酸。
模板核酸分子可以从低输入(例如1ng核酸材料)样品(例如无细胞DNA(cfDNA)和循环肿瘤DNA(ctDNA))捕获和富集。低输入样品可以具有1ng、2ng、3ng、4ng、5ng、6ng、7ng、8ng、9ng、10ng或更多的核酸材料。低输入样品可以具有少于10ng、9ng、8ng、7ng、6ng、5ng、4ng、3ng、2ng、1ng或更少的核酸材料。低输入样品可以具有200pg至10ng的核酸材料。低输入样品可以具有少于10ng的核酸材料。低输入样品可以是少于10ng、5ng、1ng、100pg、50pg、25pg或更少的核酸材料。在一些情况下,输入样品可以具有1ng、10ng、20ng、30ng、40ng、50ng或更多的核酸分子。输入样品可以具有少于50ng、40ng、30ng、20ng、10ng、1ng或更少的核酸材料。捕获和富集可以通过靶探针杂交进行。靶探针可以是捕获探针、桥探针和/或衔接子锚探针。靶探针可以包括一个或多个结合部分。结合部分可以是生物素。结合部分可以附着于支持物。支持物可以是珠粒。珠粒可以是链霉亲和素珠粒。
模板核酸可以是受损的。受损的核酸可以包括碱基改变或缺失,和/或主链修饰。模板核酸可以通过氧化、辐射或随机突变而受损。模板核酸可以通过亚硫酸氢盐处理而受损。
对于受损的DNA,本公开内容可以消除双链DNA修复步骤,提供更高的转化率和改进的灵敏度,这是由于过程中较少步骤造成的DNA损失较少。
图17A示出了使用受损的dsDNA(带有缺口)或ssDNA作为文库构建的模板。受损可能是由于亚硫酸氢盐处理。对于受损的dsDNA,可以将dsDNA变性,因此至少可以使用一条未受损的链作为模板。然后可以将模板杂交并附着于捕获探针,并使用各种引物进行扩增。
模板可以源自无细胞DNA(cfDNA)或循环肿瘤DNA(ctDNA)。cfDNA的来源可以是胎儿或肿瘤。模板可以源自受试者的液体活检、固体活检或固定组织。模板可以是cDNA并且可以通过逆转录产生。模板核酸可以源自流体样品,包括但不限于血浆、血清、痰、唾液、尿液或汗液。可以对流体样品进行亚硫酸氢盐处理以研究模板核酸的甲基化模式和/或确定模板核酸的组织来源。模板核酸可以源自肝脏、食道、肾脏、心脏、肺脏、脾脏、膀胱、结肠或脑。模板核酸可以用亚硫酸氢盐处理以分析模板核酸所源自的器官的甲基化模式。受试者可以患有甲基化相关疾病,例如自身免疫疾病、心血管疾病、动脉粥样硬化、神经障碍和癌症。
模板核酸可以源自男性或女性受试者。受试者可以是婴儿。受试者可以是青少年。受试者可以是年轻的成年人。受试者可以是老年人。
模板核酸可以来源于人、大鼠、小鼠、其他动物或特定植物、细菌、藻类、病毒等。模板核酸可以来源于灵长类动物。灵长类动物可以是黑猩猩或大猩猩。其他动物可以是恒河猴。模板也可以来自不同物种(包括宿主-病原体、细菌群等)的基因组混合物。模板可以是由两个或更多个物种的基因组表达的RNA所产生的cDNA
模板核酸可以包括靶序列。靶序列是外显子。靶序列可以是内含子。靶序列可以包括启动子。靶序列可以是先前已知的。靶序列可以是先前部分已知的。靶序列可能是先前未知的。靶序列可以包括染色体、染色体臂或基因。基因可以是与病症(例如癌症)相关的基因。
模板核酸分子可以在杂交之前去磷酸化,以例如降低自连接率。
IX.捕获探针
捕获探针可用于捕获具有靶序列的模板核酸分子。捕获探针还可以通过邻近而与模板核酸分子连接。由于连接末端之间的空间相对较宽,游离探针和模板的连接率可能非常低。但是与采用游离捕获探针相比,杂交捕获探针可以增加捕获探针和模板之间连接的可能性。捕获探针可以包括DNA。捕获探针可以包括RNA。捕获探针可以包括尿嘧啶或甲基化胞嘧啶。在一些情况下,捕获探针不包括尿嘧啶。
捕获探针可以包括约400个核苷酸。捕获探针可以包括约300个核苷酸。捕获探针可以包括约200个核苷酸。捕获探针可以包括约180个核苷酸。捕获探针可以包括约150个核苷酸。捕获探针可以包括约120个核苷酸。捕获探针可以包括约100个核苷酸。捕获探针可以包括约90个核苷酸。捕获探针可以包括约80个核苷酸。捕获探针可以包括约70个核苷酸。捕获探针可以包括约50个核苷酸。捕获探针可以包括约40个核苷酸。捕获探针可以包括约30个核苷酸。捕获探针可以包括约20个核苷酸。捕获探针可以包括约10个核苷酸。捕获探针可为约10至约400个核苷酸、约10至约200个核苷酸、约10至约120个核苷酸、约20至约120个核苷酸、约20至约60个核苷酸、或约30至约50个核苷酸。
捕获探针与模板核酸连接的温度可以是约70℃、约65℃、约60℃、约55℃、约50℃、约45℃、或约45℃至约55℃。
捕获探针可以进一步包括标记物。标记物可以发荧光。荧光标记物可以是有机荧光染料、金属螯合物、碳纳米管、量子点、金颗粒或荧光矿物。标记物可以是放射性的。标记物可以是生物素。捕获探针可以与标记的核酸结合分子结合。核酸结合分子可以是抗体、抗生素、组蛋白、抗体或核酸酶。
样品中可以使用多种捕获探针。多种捕获探针可以设计为具有相似的解链温度。一组捕获探针的解链温度可以在约15℃内、约10℃内、约5℃内、或约2℃内。一种或多种捕获探针的解链温度可以为约85℃、约80℃、约75℃、约70℃、约65℃、约60℃、约55℃、或约50℃。捕获探针的解链温度可以为约50℃至约85℃、约55℃至约80℃、约45℃至约60℃、或约52℃至约58℃。
捕获探针可以包括分子条形码(MB)。捕获探针可以包括衔接子序列(例如,用于结合衔接子引物)。捕获探针可以包括靶特异性区(TSR)。捕获探针可以包括用于区分样品的索引。捕获探针可以包括限制性核酸内切酶切割位点,例如,在TSR和衔接子序列之间。分子条形码或索引可以是衔接子序列的5’和TSR的5’。
a.分子条形码
分子条形码可以提供唯一识别工具,并且允许观察探针和模板之间的特异性结合。分子条形码可以包括约25个核苷酸、约20个核苷酸、约15个核苷酸、约10个核苷酸、约8个核苷酸或约4个核苷酸。分子条形码可以包括DNA。分子条形码可以包括RNA。分子条形码可以包括尿嘧啶。在一些情况下,分子条形码不包括尿嘧啶。捕获探针可以包括索引。索引可用于识别样品。索引的长度可以为2至16个核苷酸,或约6或约8个核苷酸。
b.衔接子和衔接子引物
捕获探针中的衔接子可以提供用于扩增的引物结合的位置。衔接子引物可以与衔接子上的位点互补结合,并可用于扩增模板中的靶序列。衔接子引物可以具有约50个核苷酸的长度。衔接子引物可以具有约45个核苷酸的长度。衔接子引物可以具有约40个核苷酸的长度。衔接子引物可以具有约35个核苷酸的长度。衔接子引物可以具有约30个核苷酸的长度。衔接子引物可以具有约25个核苷酸的长度。衔接子引物可以具有约20个核苷酸的长度。衔接子引物可以具有约15个核苷酸的长度。衔接子引物可以具有约18至约30个核苷酸的长度。
衔接子可以包括DNA或RNA。衔接子可以是天然存在的或合成的核酸。衔接子可以具有修饰的杂环碱基。修饰可以是甲基化嘌呤或嘧啶、酰化嘌呤或嘧啶、烷基化核糖或其他杂环。衔接子可以具有修饰的糖部分。修饰的糖部分可以包括肽核酸。衔接子可以包括肽核酸。衔接子可以包括苏糖核酸。衔接子可以包括锁核酸。衔接子可以包括己糖醇核酸。衔接子可以包括柔性核酸。衔接子可以包括甘油核酸。
c.靶特异性区(TSR)
捕获探针或桥探针的TSR可以设计为与模板的靶序列杂交。可以针对亚硫酸氢盐转化的靶序列或亚硫酸氢盐保护的靶序列而设计TSR。在一些情况下,探针的靶特异性区的100%可以与模板的靶序列互补。探针的靶特异性区的约75%可以与模板的靶序列互补。探针的靶特异性区的约50%可以与模板的靶序列互补。靶特异性区可以包括约35个核苷酸、约30个核苷酸、约25个核苷酸、约20个核苷酸、约15个核苷酸、约10个核苷酸或约5个核苷酸。靶特异性区与本文所述的靶序列退火。
X.衔接子/衔接子引物/扩增
附着的、添加的或掺入的衔接子可以为扩增的引物杂交提供位点。第一衔接子(AD1)可以通过捕获探针或衔接子锚探针附着于模板。针对AD1的引物可用于合成与模板互补的链。第二衔接子(AD2)可以附着于模板的5’末端和/或互补链的3’末端,以进一步扩增模板。可以使用AD1引物和AD2引物构建文库。可以使用AD1引物和针对TSR或其侧翼区域的引物进行选择性扩增。
衔接子可以是单链核酸。衔接子可以是双链核酸。衔接子可以是部分双链体,其中长链长于短链,或两条链等长。
XI.桥探针
桥探针可用于将模板核酸分子与靶序列和衔接子锚探针杂交。桥探针可以进一步允许衔接子锚探针和模板的间接缔合,从而促进它们的附着。由于相互作用的随机性,游离衔接子锚探针和模板的连接率可能极低。但与采用游离衔接子锚探针相比,杂交桥探针可以增加衔接子锚探针和模板之间连接的可能性。桥探针可以包括DNA。桥探针可以包括RNA。桥探针可以包括尿嘧啶和甲基化胞嘧啶。桥探针可以不包括尿嘧啶。
桥探针可以包括与靶序列杂交的靶特异性区(TSR)。桥探针可以包括与衔接子锚探针的桥结合序列杂交的衔接子着陆序列(ALS)。桥探针可以包括连接TSR和ALS的接头。TSR可以位于桥探针的3’部分。TSR可以位于桥探针的5’部分。
桥探针可以包括一个或多个分子条形码。桥探针可以包括一个或多个结合部分。结合部分可以是生物素。结合部分可以附着于支持物。支持物可以是珠粒。珠粒可以是链霉亲和素珠粒。
桥探针可以包括约400个核苷酸、约300个核苷酸、约200个核苷酸、约120个核苷酸、约100个核苷酸、约90个核苷酸、约80个、约70个核苷酸、约50个核苷酸、约40个核苷酸、约30个核苷酸、约20个核苷酸、或约10个核苷酸。
多种桥探针可用于与样品中的多个靶序列退火。可以将桥探针设计为具有相似的解链温度。一组桥探针的解链温度可以在约15℃内、约10℃内、约5℃内、或约2℃内。一种或多种桥探针的解链温度可以为约75℃、约70℃、约65℃、约60℃、约55℃、约50℃、约45℃、或约40℃。桥探针的解链温度可以为约40℃至约75℃、约45℃至约70℃、45℃至约60℃、或约52℃至约58℃。
使用衔接子锚探针以及围绕特定桥探针的一个或多个桥探针可以通过协同效应帮助稳定特定桥探针与其靶序列的杂交。形成多个桥探针组装体的杂交温度可以高于单桥探针的解链温度。较高的温度可以通过减少可能在较低温度下发生的非特异性杂交而导致更好的捕获特异性。杂交温度可以比单个桥探针的解链温度高约5℃、约10℃、约15℃、或约20℃。杂交温度可以比桥探针的解链温度高约5℃至约20℃,或比多个桥探针的平均解链温度高约5℃至约20℃。
多个桥探针的杂交温度可以是约75℃、约70℃、约65℃、约60℃、约55℃、或约50℃。多个桥探针的杂交温度可以是约50℃至约75℃、55℃至约75℃、60℃至约75℃、或65℃至约75℃。
桥探针可以进一步包括标记物。标记物可以发荧光。荧光标记物可以是有机荧光染料、金属螯合物、碳纳米管、量子点、金颗粒或荧光矿物。标记物可以是放射性的。标记物可以是生物素。桥探针可以与标记的核酸结合分子结合。核酸结合分子可以是抗体、抗生素、组蛋白、抗体或核酸酶。
桥探针可以包括接头。接头可以包括约30个核苷酸、约25个核苷酸、约20个核苷酸、约15个核苷酸、约10个核苷酸或约5个核苷酸。接头可以包括约5至约20个核苷酸。
接头可以包括非核酸聚合物(例如,碳链)。接头非核苷酸聚合物可以包括约30个单位、约25个单位、约20个单位、约15个单位、约10个单位、或约5个单位。
桥探针可以在3’和/或5’末端被阻碍。桥探针可以缺少5’磷酸根。桥探针可以缺少3’OH。桥探针可以包括3’ddC、3’倒位dT、3’C3间隔子、3’氨基或3’磷酸化。
XII.衔接子锚探针
衔接子锚探针可以包括约400个核苷酸、约200个核苷酸、约120个核苷酸、约100个核苷酸、约90个核苷酸、约80个核苷酸、约70个核苷酸、约50个核苷酸、约40个核苷酸、约30个核苷酸、约20个核苷酸、或约10个核苷酸。衔接子锚探针可以为约20至约70个核苷酸。
衔接子锚探针与桥探针的解链温度可以为约65℃、约60℃、约55℃、约50℃、约45℃、或约45℃至约70℃。
衔接子锚探针可以包括标记物。标记物可以发荧光。荧光标记物可以是有机荧光染料、金属螯合物、碳纳米管、量子点、金颗粒或荧光矿物。标记物可以是放射性的。标记物可以是生物素。衔接子锚探针可以与标记的核酸结合分子结合。核酸结合分子可以是抗体、抗生素、组蛋白、抗体或核酸酶。
衔接子锚探针可以包括分子条形码(MB)。衔接子锚探针可以包括衔接子序列(例如,用于结合衔接子引物)。捕获探针可以包括桥结合序列(BBS)。衔接子锚探针可以包括1至100个BBS。衔接子锚探针可以包括用于区分样品的索引。分子条形码或索引可以是衔接子序列的5’和BBS的5’。
XIII.酶
可用于本文所述的方法和试剂盒的DNA聚合酶的实例包括Klenow聚合酶、Bst DNA聚合酶、Bca聚合酶、phi 29DNA聚合酶、Vent聚合酶、Deep Vent聚合酶、Taq聚合酶、T4聚合酶、T7聚合酶、或大肠杆菌DNA聚合酶1。
可用于本文所述的方法和试剂盒中的连接酶的实例包括CircLigase、CircLigaseII、大肠杆菌DNA连接酶、T3 DNA连接酶、T4 DNA连接酶、T7 DNA连接酶、DNA连接酶I、DNA连接酶II、DNA连接酶III、DNA连接酶IV、Taq DNA连接酶、或Tth DNA连接酶。
可用于本文所述的方法和试剂盒的核酸外切酶的实例包括与DNA聚合酶I(polA)、DNA聚合酶II(polB)和DNA聚合酶III(dnaQ/mutD)相关的核酸外切酶,DNA聚合酶I大(Klenow)片段,T4 DNA聚合酶,核酸外切酶I、核酸外切酶III,核酸外切酶IV,核酸外切酶VII,核酸外切酶IX,核酸外切酶X,RecBCD核酸外切酶,RecJ核酸外切酶,RecE核酸外切酶,SbcCD核酸内切/外切酶,核糖核酸酶D,或TabcD核酸外切酶。核酸外切酶可以是3’至5’核酸外切酶或5’至3’核酸外切酶。
可用于本文所述的方法和试剂盒中的限制性核酸内切酶可以是I型、II型、III型或IV型。限制性核酸内切酶可以包括AciI、HindIII、SspI、MluCI、BspMI、EcoP15、EcoRI、HsdR、HsdM、HhaI、NotI、FokI或BaeI。限制性核酸内切酶可以是4切(cutter)、5切或6切。
XIV.扩增产物的下游分析
使用本文所述的方法产生的扩增产物可以使用多种方法进一步分析,包括DNA印迹、聚合酶链反应(PCR)(例如,实时PCR(RT-PCR)、数字PCR(dPCR)、微滴式数字PCR(ddPCR)、定量PCR(Q-PCR))、nCounter分析(Nanostring技术)、凝胶电泳、DNA微阵列、质谱(例如,串联质谱、基质辅助激光解吸电离飞行时间质谱(MALDI-TOF MS)、链终止测序(Sanger测序)或二代测序。
二代测序可以包括454测序(ROCHE)(使用焦磷酸测序)、使用可逆终止染料的测序(ILLUMINA测序)、半导体测序(THERMOFISHER ION TORRENT)、单分子实时(SMRT)测序(PACIFIC BIOSCIENCES)、纳米孔测序(例如,使用来自OXFORD NANOPORE或GENIA的技术)、使用焦磷酸解作用(BASE4)的微滴单分子测序、单分子电子检测测序(例如,当核酸(DNA/RNA)通过纳米间隙时测量通过纳米电极的隧道电流并计算电流差异)(来自QUANTUMBIOSYSTEMS的QUANTUM SEQUENCING)、GenapSys Gene Electornic Nano-IntegratedUltra-Sensitive(GENIUS)技术(GENAPYS)、来自QIAGEN的GENEREADER、使用顺序杂交和部分随机寡核苷酸与由特定荧光团识别的中心确定碱基(或碱基对)的连接的测序(SOLiD测序)。测序可以是双端测序。
可以使用本文所述的方法测序的来自样品的靶序列的数目可以是约5、10、15、25、50、100、1000、10,000、100,000或1,000,000个,或者约5至约100、约100至约1000、约1000至约10,000、约10,000至约100,000、或约100,000至约1,000,000个。
使用本文所述的方法产生的核酸文库可以从多于一个样品产生。每个文库可以具有与样品相关的不同索引。例如,捕获探针或衔接子锚探针可以包括可用于将核酸识别为来自相同样品的索引(例如,包括相同第一索引的第一组捕获探针或衔接子锚探针可用于从来自第一受试者的第一样品产生第一文库,并且包括相同第二索引的第二组捕获探针或衔接子锚探针可用于从来自第二受试者的第二样品产生第二文库,第一和第二文库可以合并、测序,并且索引可用于辨别测序的核酸来自哪个样品)。使用本文所述的方法产生的扩增产物可用于从至少2、5、10、25、50、100、1000或10,000个样品产生文库,每个文库具有不同的索引,并且可以合并文库并进行测序,例如,使用二代测序技术。
测序可以产生至少100、1000、5000、10,000、100,000、1,000,000或10,000,000个序列读数。测序可以产生约100个序列读数至约1000个序列读数、约1000个序列读数至约10,000个序列读数、约10,000个序列读数至约100,000个序列读数、约100,000个序列读数至约1,000,000个序列读数、或约1,000,000个序列读数至约10,000,000个序列读数。
测序深度可以为约1×、5×、10×、50×、100×、1000×或10,000×。测序深度可以为约1×至约10×、约10×至约100×、约100×至约1000×、或约1000×至约10000×。
XV.应用
a.核酸特征检测
可以分析使用本文所述的方法和试剂盒产生的扩增核酸产物的一种或多种核酸特征。一种或多种核酸特征可以是一种或多种甲基化事件。甲基化可以是CpG二核苷酸中胞嘧啶的甲基化。甲基化碱基可以是5-甲基胞嘧啶。非CpG环境中的胞嘧啶可以被甲基化。甲基化或非甲基化胞嘧啶可以在CpG岛中。CpG岛可以是基因组中具有高频率CpG位点的区域。CpG岛可为至少200bp,或约300至约3000bp。CpG岛可以具有至少60%的CpG二核苷酸含量。CpG岛可以在基因的启动子区域中。甲基化可以是5-hmC(5-羟甲基胞嘧啶)、5-fC(5-甲酰基胞嘧啶)或5-caC(5-羧基胞嘧啶)。本文所述的方法和试剂盒可用于检测例如来自实体组织或来自生物流体(例如包括例如无细胞DNA的血浆、血清、尿液或唾液)的DNA的甲基化模式。
一种或多种核酸特征可以是新生突变(de novo mutation)、无义突变、错义突变、沉默突变、移码突变、插入、置换、点突变、单核苷酸多态性(SNP)、单核苷酸变异(SNV)、新生单核苷酸变异、缺失、重排、扩增、染色体易位、中间缺失、染色体倒位、杂合性丧失、功能丧失、功能获得、显性失活或致死突变。可以分析扩增的核酸产物以检测种系突变或体细胞突变。一种或多种核酸特征可以与病症相关,例如癌症、自身免疫疾病、神经系统疾病、感染(例如病毒感染)或代谢疾病。
b.诊断/检测/监测
所公开的方法和试剂盒还可用于诊断或检测病症。该病症可以是心理障碍。该病症可以是衰老。该病症可以是疾病。病症(例如疾病)可以是癌症、神经疾病(例如阿尔茨海默病、自闭症谱系障碍、Rett综合征、精神分裂症)、免疫缺陷、皮肤病、自身免疫性疾病(例如眼白塞病、系统性红斑狼疮(SLE)、类风湿性关节炎(RA)、多发性硬化症)、感染(例如病毒感染)或代谢疾病(例如高血糖症、高脂血症、2型糖尿病)。癌症可以是例如结肠癌、乳腺癌、肝癌、膀胱癌、Wilms癌、卵巢癌、食道癌、前列腺癌、骨癌、或肝细胞癌、胶质母细胞瘤、乳腺癌、鳞状细胞肺癌、甲状腺癌或白血病(参见例如,Jin和Liu(2018)DNA methylation inhuman disease.Genes&Diseases,5:1-8)。该病症可以是Beckwith–Wiedemann综合征、Prader–Willi综合征或Angelman综合征。
使用本文提供的方法和试剂盒产生的无细胞DNA的甲基化模式可用作癌症的标志物(参见例如,Hao等人,DNA methylation markers for diagnosis and prognosis ofcommon cancers.Proc.Natl.Acad.Sci.2017;国际PCT申请公开号WO2015116837)。无细胞DNA的甲基化模式可用于确定DNA来源的组织(参见例如,国际PCT申请公开号WO2005019477)。本文所述的方法和试剂盒可用于确定甲基化单倍型信息,并可用于确定无细胞DNA的组织或细胞来源(参见例如,Seioighe等人,(2018)DNA methylationhaplotypes as cancer markers.Nature Genetics 50,1062-1063;国际PCT申请公开号WO2015116837;美国专利申请公开号20170121767)。本文所述的方法和试剂盒可用于检测癌症受试者和非癌症受试者的甲基化水平,例如无细胞DNA的甲基化水平(参见例如,Vidal等人A DNA methylation map of human cancer at single base-pairresolution.Oncogenomics 36,5648-5657;国际PCT申请公开号WO2014043763)。本文所述的方法和试剂盒可用于确定甲基化水平或确定不同组织对无细胞DNA混合物的部分贡献(参见例如,国际PCT申请公开号WO2016008451)。本文所述的方法和试剂盒可用于确定例如血浆中无细胞DNA的来源组织,例如基于比较甲基化单倍型的模式和丰度(参见例如,Tang等人,(2018)Tumor origin detection with tissue-specific miRNA and DNAmethylation markers.Bioinformatics 34,398-406;国际PCT申请公开号WO2018119216)。本文所述的方法和试剂盒可用于区分癌细胞和正常细胞,并根据其来源组织对不同的癌症类型进行分类(参见例如,美国专利申请公开号20170175205A1)。本文提供的方法和试剂盒可用于使用母体样品检测胎儿DNA或胎儿异常(参见例如,Poon等人(2002)DifferentialDNA Methylation between Fetus and Mother as a Strategy for Detecting FetalDNA in Maternal Plasma.Clinical Chemistry,48:35-41)。
所公开的方法可用于监测病症。该病症可以是疾病。该疾病可以是癌症、神经疾病(例如阿尔茨海默病)、免疫缺陷、皮肤病、自身免疫性疾病(例如眼白塞病)、感染(例如病毒感染)或代谢疾病。癌症可能处于缓解期。由于所公开的方法可以使用cfDNA和ctDNA来检测低水平的异常,因此本公开内容可以提供监测疾病的相对无创的方法。所公开的方法可用于监测治疗或疗法。治疗或疗法可用于病症,例如疾病,例如癌症,或本文公开的任何病症。
实施例
实施例1
衔接子锚探针的连接
图18A提供了两种反应方案的示意图。在左图的反应方案(1)中,桥探针、模板和衔接子锚探针一起温育。桥探针与模板上的靶序列杂交,并且桥探针与衔接子锚探针上的衔接子着陆序列杂交(1;上图)。杂交促进衔接子锚探针的磷酸化5’末端和模板的3’末端的邻近连接(1;上图)。然后,使用PCR扩增连接产物(1;下图)。在右图的第二反应(2)中,模板和衔接子锚探针在没有桥探针的情况下一起温育(2;上图)。按反应方案(1)进行类似反应步骤。
在该实施例中,在反应方案(1)中,通过桥探针(SEQ ID:3)杂交促进将具有靶特异性结合序列的衔接子锚探针(SEQ ID:2)连接至具有已知靶序列的模板DNA(SEQ ID:1)。桥探针包括靶特异性区,其被设计为与模板的靶序列互补。SEQ ID:1和SEQ ID:2(表1)中的斜体字母分别代表模板和桥探针的靶序列和靶特异性区。桥探针进一步包括与桥探针的桥结合序列互补的衔接子着陆序列,和连接靶特异性区和衔接子着陆序列的寡聚T接头。桥结合序列和衔接子着陆序列在表1的SEQ ID:2和SEQ ID:3中加下划线显示。除了桥结合序列外,衔接子锚探针也被设计为含有衔接子和具有唯一序列的分子条形码。SEQ ID:2中的粗体序列代表AD1引物结合位点。与AD1和TSR退火的引物用于扩增模板的靶序列。“N”代表四种DNA核苷酸中的任一种。检测模板的不同3’末端以找出优先连接和测序的核苷酸。衔接子锚探针5’末端的四个核苷酸代表分子条形码。分子条形码的各种组合被合成并与模板混合。
表1:序列表
以下是反应方案(1)的杂交和连接条件。将1fmole模板、10fmole桥探针和200fmole衔接子锚探针以12μl体积混合,在95℃下变性30秒,然后置于冰上。将2μl的10×CircLigase缓冲液、4μl的5M甜菜碱、1μl的50mM MnCl2添加到变性的DNA混合物中,以在20μl终体积中达到2.5mM MnCl2、1M甜菜碱、0.033M Tris-乙酸(pH 7.5)、0.066M乙酸钾和0.5mM DTT的终浓度。通过在MJ热循环仪上将混合物在50℃下温育30min进行杂交。通过向混合物中添加100单位Circligase II并在MJ热循环仪上在50℃下温育20分钟以完成连接。取连接产物1μl作为模板,添加0.2μM的PCR引物进行PCR反应。进行20个循环的PCR,变性条件为95℃持续15秒,退火条件为58℃持续15秒,延伸条件为68℃持续30秒。反应方案(2)的条件相同,只是模板和衔接子锚探针的混合物中不包括桥探针。10μL的PCR产物在2%琼脂糖凝胶上在80V下运行20min,并且DNA条带用1X GelRed染色凝胶在紫外灯箱上观察。
如图18B所示,泳道1的100bp和50bp左右区域出现两条带,其展示反应方案(1)的PCR反应产物。100bp与连接的模板和衔接子锚探针的大小一致,表明连接成功。较低的条带是扩增步骤中使用的引物的预期大小。在反应方案(2)的泳道2中未检测到约100bp条带,表明反应方案(1)中的桥探针促进模板和衔接子锚探针的连接。
实施例2
通过核酸外切酶消化和延伸添加衔接子
图26提供了捕获探针杂交和3’至5’核酸外切酶消化的示意图。对于杂交捕获,捕获探针与模板(E-T1,SEQ ID NO.6和E-T2,SEQ ID NO.7)上的靶序列杂交。对于反应,将合成模板E-T1(表3的输入混合物1、3、5、7)或E-T2(表3的输入混合物2、4、6、8)与捕获探针(SEQ ID NO.8)以1:1的比例以(1μM)浓度在Duplex缓冲液中混合。DNA混合物在92℃下变性2min,然后在热循环仪上冷却至室温。
表2列出了模板核酸、捕获探针、使用的PCR引物以及从实验得到的延伸产物的序列。衔接子序列以粗体表示,而靶序列以斜体表示。与E-T1相比,E-T2模板在靶特异性区(TSR)下游包括更多核苷酸序列,因此当与捕获探针杂交时,E-T2具有单链3’突出端。
表2:序列表
杂交后,使用3’至5’核酸外切酶消化模板上的单链3’突出端。对于核酸外切酶消化和延伸,DNA混合物与DNA聚合酶I大(Klenow)片段或T4聚合酶反应。表3列出了用于每种混合物的模板和酶的组合。
表3:输入混合物和实验结果
每种消化和延伸混合物使用约12000拷贝的E-T1/E-T2和捕获探针退火产物。对于Klenow反应混合物,添加1×NEB缓冲液2、50μM dNTP和0.1U/μl Klenow,并在25℃下温育15min。对于T4聚合酶混合物,添加1×NEB缓冲液2.1、10μM dNTP和0.06U/μl T4聚合酶,并在12℃下温育15min。
使用PCR引物(EGFR正向引物,SEQ ID NO.9和捕获探针反向引物,SEQ ID NO.10)通过qPCR评价PCR产物。未与Klenow或T4聚合酶反应(输入混合物3、4、7和8)且其模板因此仍保留3’突出端的PCR产物未检测到包括衔接子(参见表3)。相反,在输入混合物1、2、5和6中检测到衔接子添加。输入混合物1、2、5和6的产物也被检测到具有SEQ ID NO.10的序列。无论使用何种核酸外切酶/聚合酶,E-T1模板的循环阈值(Ct)值均低于E-T2,表明E-T1模板更容易发生延伸,因为E-T1不包括3’突出端。
实施例3
使用T4聚合酶通过核酸外切酶消化和延伸添加衔接子
图27提供了捕获探针杂交和3’至5’核酸外切酶消化的示意图。捕获探针与模板上的靶序列杂交。已知包括SEQ ID NO.12的片段化基因组DNA(gDNA)被用作模板。对于杂交捕获,使用20ng片段化(峰大小160bp)模板gDNA和10pmol捕获探针。DNA输入和杂交探针在杂交缓冲液中在95℃下变性30秒,然后使混合物逐渐冷却至60℃。杂交在热循环仪上在60℃下温育1小时。最终杂交缓冲液含有100ng/μl DNA、1μg/μl牛血清白蛋白(BSA)、1μg/μlFicoll、1μg/μl聚乙烯吡咯烷酮(PVP)、0.075M柠檬酸钠、0.75M NaCl、5×SSC和1×Denhardt溶液。
为了清除,将杂交组装体与链霉亲和素珠粒(Thermo Fisher Dynabeads M270Streptavidin)在室温下温育10min。通过3次洗涤进行清除(洗涤1:5X SSPE,1%SDS;洗涤2:2X SSPE,0.1%;洗涤3:0.1X SSPE,0.01%氚)。
然后,将3’至5’核酸外切酶(T4聚合酶)添加到捕获组装体以消化模板上的单链3’突出端并延伸模板。将捕获组装体重悬于25μl T4聚合酶混合物中(输入混合物1、2、3),并在12℃下温育15min。通过在95℃下加热1min终止反应。输入混合物4未经T4聚合酶处理。
进行qPCR以评价衔接子的添加。使用EGFR靶向序列(EGFR正向引物,SEQ ID NO.13和反向引物,SEQ ID NO.14)通过qPCR评价富集的DNA。通过EGFR和衔接子序列PCR(EGFR正向引物,SEQ ID NO.13和探针反向引物,SEQ ID NO.15,参见表4和5)评价衔接子添加。图27示出了qPCR评价的示意图。在用T4聚合酶处理的所有样品(输入混合物1、2和3)中检测到衔接子添加,但在没有T4聚合酶反应的样品中未检测到(参见表5)。经历核酸外切酶消化的混合物(输入混合物1、2和3)的循环阈值(Ct)值低于未消化模板(输入混合物4)的循环阈值(Ct)。在所有样品中,EGFR PCR的Ct相似,表明在所有反应中均捕获EGFR,并且将富集DNA的Ct与未捕获富集的相同部分gDNA进行了比较,发现65%的EGFR被恢复。
表4:序列表
表5:输入混合物和实验结果
虽然本文已显示和描述本发明的优选实施方式,但是对于本领域技术人员来说显而易见的是,这些实施方式仅作为实例提供。在未背离本发明的情况下,本领域技术人员现在将想到许多变体、变化和替换。应当理解,在实践本发明时可以采用对本文描述的本发明的实施方式的各种替代。以下权利要求旨在限定本发明的范围,并且由此涵盖在这些权利要求及其等同物范围内的方法和结构。
Claims (59)
1. 一种靶富集和衔接子连接的非诊断和治疗目的的方法,包括:
将第一桥探针的第一靶特异性区与模板核酸分子的第一靶序列杂交,其中第一桥探针的第一衔接子着陆序列与衔接子锚探针的第一桥结合序列结合,其中所述第一桥探针的所述第一靶特异性区在所述第一桥探针的3’部分中;以及
使用连接酶将所述模板核酸分子的3’末端附着于所述衔接子锚探针的5’末端,从而产生附着于所述衔接子锚探针的模板核酸分子,其中所述衔接子锚探针从3’末端至5’末端依次包括第一桥结合序列、第一衔接子和分子条形码;
将第一衔接子引物与衔接子锚探针的第一衔接子杂交;以及
延伸所述第一衔接子引物,从而产生第一延伸产物。
2.根据权利要求1所述的方法,进一步包括使用亚硫酸氢盐处理附着于所述衔接子锚探针的所述模板核酸分子。
3.根据权利要求1或2所述的方法,其中所述第一桥探针包括在所述第一靶特异性区和所述第一衔接子着陆序列之间的第一接头。
4.根据权利要求3所述的方法,进一步包括将第二衔接子附着于所述第一延伸产物的3’末端,从而产生附着于所述第二衔接子的第一延伸产物。
5.根据权利要求4所述的方法,进一步包括在附着所述第二衔接子之前将所述模板核酸分子的5’末端磷酸化。
6.根据权利要求4所述的方法,其中所述第二衔接子是双链衔接子,其中所述第二衔接子的两条链中的一条链附着于所述模板核酸分子。
7.根据权利要求4所述的方法,进一步包括将第二衔接子引物与在附着于所述第二衔接子的所述第一延伸产物中的所述第二衔接子杂交。
8.根据权利要求7所述的方法,进一步包括延伸所述第二衔接子引物,从而产生第二延伸产物。
9.根据权利要求8所述的方法,进一步包括扩增附着于所述第二衔接子的所述第一延伸产物和所述第二延伸产物,从而产生扩增产物。
10.根据权利要求8所述的方法,进一步包括使用所述第一衔接子引物和所述第二衔接子引物扩增附着于所述第二衔接子的所述第一延伸产物和所述第二延伸产物,从而产生扩增产物。
11.根据权利要求1所述的方法,进一步包括将靶特异性引物与所述第一延伸产物杂交。
12.根据权利要求11所述的方法,进一步包括延伸所述靶特异性引物,从而产生第二延伸产物。
13.根据权利要求12所述的方法,进一步包括扩增所述第一延伸产物和所述第二延伸产物,从而产生扩增产物。
14.根据权利要求12所述的方法,进一步包括使用所述第一衔接子引物和所述靶特异性引物扩增所述第一延伸产物和所述第二延伸产物,从而产生扩增产物。
15.根据权利要求1或2所述的方法,进一步包括分离所述第一桥结合序列。
16.根据权利要求1或2所述的方法,进一步包括延伸所述第一桥探针的3’末端,从而产生第一延伸产物。
17.根据权利要求1或2所述的方法,其中所述衔接子锚探针包括第一衔接子。
18.根据权利要求17所述的方法,进一步包括将第二衔接子附着于所述模板核酸分子的5’末端。
19.根据权利要求18所述的方法,进一步包括在附着所述第二衔接子之前将所述模板核酸分子的5’末端磷酸化。
20.根据权利要求18所述的方法,其中所述衔接子是双链衔接子。
21.根据权利要求18所述的方法,进一步包括将第一衔接子引物与所述衔接子锚探针的所述第一衔接子杂交。
22.根据权利要求21所述的方法,进一步包括延伸所述第一衔接子引物,从而产生第二延伸产物。
23.根据权利要求22所述的方法,进一步包括将第二衔接子引物与所述第二延伸产物杂交。
24.根据权利要求23所述的方法,进一步包括延伸所述第二衔接子引物,从而产生第三延伸产物。
25.根据权利要求24所述的方法,进一步包括扩增所述第二延伸产物和所述第三延伸产物,从而产生扩增产物。
26.根据权利要求24所述的方法,进一步包括使用所述第一衔接子引物和所述第二衔接子引物扩增所述第二延伸产物和所述第三延伸产物,从而产生扩增产物。
27.根据权利要求22所述的方法,进一步包括将靶特异性引物与所述第二延伸产物杂交。
28.根据权利要求27所述的方法,进一步包括延伸所述靶特异性引物,从而产生第三延伸产物。
29.根据权利要求28所述的方法,进一步包括扩增所述第二延伸产物和所述第三延伸产物,从而产生扩增产物。
30.根据权利要求28所述的方法,进一步包括使用所述第一衔接子引物和所述靶特异性引物扩增所述第二延伸产物和所述第三延伸产物,从而产生扩增产物。
31.根据权利要求1或2所述的方法,进一步包括将第二桥探针的第二靶序列区与所述模板核酸分子的第二靶序列杂交,其中所述第二桥探针的第二衔接子着陆序列与所述衔接子锚探针的第二桥结合序列结合。
32.根据权利要求31所述的方法,其中所述第二桥探针的所述第二靶特异性区在所述第二桥探针的3’部分中。
33.根据权利要求31所述的方法,其中所述第二桥探针的所述第二靶特异性区在所述第二桥探针的5’部分中。
34.根据权利要求31所述的方法,其中所述第二桥探针包括在所述第二靶特异性区和所述第二衔接子着陆序列之间的第二接头。
35.根据权利要求31所述的方法,其中i)所述第一桥探针的所述第一靶特异性区在所述第一桥探针的3’部分中并且所述第二桥探针的所述第二靶特异性区在所述第二桥探针的3’部分中;ii)所述第一桥探针的所述第一靶特异性区在所述第一桥探针的5’部分中并且所述第二桥探针的所述第二靶特异性区在所述第二桥探针的5’部分中;iii)其中所述第一桥探针的所述第一靶特异性区在所述第一桥探针的3’部分中并且所述第二桥探针的所述第二靶特异性区在所述第二桥探针的5’部分中;或iv)所述第一桥探针的所述第一靶特异性区在所述第一桥探针的5’部分中并且所述第二桥探针的所述第二靶特异性区在所述第二桥探针的3’部分中。
36.根据权利要求31所述的方法,其中所述第一桥探针的所述第一靶特异性区在所述第一桥探针的3’部分中,并且所述第二桥探针的所述第二靶特异性区在所述第二桥探针的5’部分中;并且其中所述第一桥探针的第一接头和所述第二桥探针的第二接头彼此杂交。
37.根据权利要求2所述的方法,其中所述桥探针的所述靶序列区基于所述模板核酸分子的所述靶序列而设计,并且其中所述模板核酸的所述靶序列在所述亚硫酸氢盐处理后保留非甲基化胞嘧啶。
38.根据权利要求1所述的方法,进一步包括使用亚硫酸氢盐处理核酸分子,从而产生权利要求1所述的模板核酸分子,其中权利要求1所述的模板核酸分子是所述亚硫酸氢盐处理的产物。
39.根据权利要求38所述的方法,其中所述桥探针的所述靶序列区基于所述亚硫酸氢盐处理后的所述模板核酸分子的所述靶序列而设计,其中模板核酸中的非甲基化胞嘧啶在所述亚硫酸氢盐处理期间转化为尿嘧啶。
40.根据权利要求1所述的方法,进一步包括将核酸分子的5’末端去磷酸化,从而产生权利要求1所述的模板核酸分子。
41.根据权利要求1所述的方法,其中所述衔接子锚探针进一步包括标记物。
42.根据权利要求41所述的方法,进一步包括通过所述标记物来捕获所述桥探针。
43.根据权利要求41所述的方法,其中所述标记物是生物素。
44.根据权利要求42所述的方法,其中所述标记物被捕获在固体支持物上。
45.根据权利要求44所述的方法,其中所述固体支持物是珠粒。
46.根据权利要求45所述的方法,其中所述珠粒包括靶向所述标记物的捕获部分。
47.根据权利要求46所述的方法,其中所述捕获部分是链霉亲和素。
48.根据权利要求1所述的方法,进一步包括在将所述模板核酸分子的3’末端附着于权利要求1所述的衔接子锚探针的5’末端之后,将核酸分子与3’至5’核酸外切酶接触,其中所述核酸分子包括所述衔接子锚探针和所述模板核酸分子。
49.根据权利要求13、25或29所述的方法,进一步包括对所述扩增产物进行测序。
50.根据权利要求49所述的方法,其中所述测序包括二代测序。
51.根据权利要求1所述的方法,其中所述模板核酸分子包括单链DNA。
52.根据权利要求1所述的方法,其中所述模板核酸分子包括RNA。
53.根据权利要求1所述的方法,其中所述模板核酸分子包括受损的DNA。
54.根据权利要求1所述的方法,其中所述模板核酸分子来自福尔马林固定石蜡包埋(FFPE)的样品。
55.根据权利要求1所述的方法,其中所述模板核酸分子包括来自生物样品的无细胞核酸。
56.根据权利要求55所述的方法,其中所述无细胞核酸包括无细胞DNA。
57.根据权利要求56所述的方法,其中所述无细胞DNA包括循环肿瘤DNA。
58.根据权利要求1所述的方法,其中在权利要求1之前未对所述模板核酸分子进行体外DNA修复步骤。
59.一种试剂盒,包括:
桥探针,其包括与模板核酸分子的靶序列杂交的靶特异性区,其中所述桥探针的所述靶特异性区在所述桥探针的3’部分中;
衔接子锚探针,其包括与桥探针的衔接子着陆序列杂交的桥结合序列和附着于所述模板核酸分子的3’末端的5’末端,其中所述衔接子锚探针从3’末端至5’末端依次包括第一桥结合序列、第一衔接子和分子条形码。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201862770585P | 2018-11-21 | 2018-11-21 | |
US62/770,585 | 2018-11-21 | ||
PCT/US2019/062507 WO2020106906A1 (en) | 2018-11-21 | 2019-11-20 | Methods for targeted nucleic acid library formation |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114901818A CN114901818A (zh) | 2022-08-12 |
CN114901818B true CN114901818B (zh) | 2025-01-10 |
Family
ID=70773188
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201980089745.0A Active CN114901818B (zh) | 2018-11-21 | 2019-11-20 | 靶向核酸文库形成的方法 |
Country Status (9)
Country | Link |
---|---|
US (1) | US20210355485A1 (zh) |
EP (1) | EP3884047A4 (zh) |
JP (1) | JP2022513124A (zh) |
KR (1) | KR20210141915A (zh) |
CN (1) | CN114901818B (zh) |
AU (1) | AU2019384154A1 (zh) |
CA (1) | CA3120713A1 (zh) |
GB (2) | GB2615955B (zh) |
WO (1) | WO2020106906A1 (zh) |
Families Citing this family (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
SG10201704633UA (en) | 2012-12-10 | 2017-07-28 | Resolution Bioscience Inc | Methods for targeted genomic analysis |
US20160053301A1 (en) | 2014-08-22 | 2016-02-25 | Clearfork Bioscience, Inc. | Methods for quantitative genetic analysis of cell free dna |
CN115044645A (zh) | 2015-11-11 | 2022-09-13 | 分析生物科学有限公司 | Dna文库的高效率构建 |
KR20230035431A (ko) | 2016-08-25 | 2023-03-13 | 레졸루션 바이오사이언스, 인크. | Dna 샘플 중 게놈 카피 변화의 검출을 위한 방법 |
WO2022055984A1 (en) * | 2020-09-08 | 2022-03-17 | Resolution Bioscience, Inc. | Adaptors and methods for high efficiency construction of genetic libraries and genetic analysis |
EP4060049B1 (en) | 2021-03-18 | 2023-08-23 | Genomill Health Oy | Methods for accurate parallel quantification of nucleic acids in dilute or non-purified samples |
EP4215619A1 (en) * | 2022-01-21 | 2023-07-26 | Genomill Health Oy | Methods for sensitive and accurate parallel quantification of nucleic acids |
US20250101412A1 (en) * | 2022-01-25 | 2025-03-27 | Oregon Health & Science University | Methods and systems for increasing capture potential of a spatial array |
CN118696131A (zh) * | 2022-02-18 | 2024-09-24 | 安捷伦科技有限公司 | 用于靶向核酸捕获和条形码编码的系统和方法 |
WO2023230618A1 (en) * | 2022-05-27 | 2023-11-30 | Chen cheng yao | Method, kits and system for dual labeling of nucleic acids |
WO2024005523A1 (ko) | 2022-06-28 | 2024-01-04 | 주식회사 제노헬릭스 | Rna 염기서열 분석을 위한 라이브러리 제작 방법 |
KR20240002713A (ko) | 2022-06-28 | 2024-01-05 | 주식회사 제노헬릭스 | Rna 염기서열 분석을 위한 라이브러리 제작 방법 |
KR20250033954A (ko) | 2023-08-30 | 2025-03-10 | 주식회사 제노헬릭스 | 제한효소를 이용한 rna 라이브러리 제작 방법 |
Family Cites Families (31)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100249110B1 (ko) * | 1992-05-06 | 2000-04-01 | 다니엘 엘. 캐시앙 | 핵산 서열 증폭 방법, 이에 이용되는 조성물 및 키트 |
FR2724934B1 (fr) * | 1994-09-26 | 1997-01-24 | Bio Merieux | Oligonucleotide chimere et son utilisation dans l'obtention de transcrits d'un acide nucleique |
DE60127939T2 (de) * | 2000-02-07 | 2008-01-24 | Illumina, Inc., San Diego | Nukleinsäure-Nachweisverfahren mit universellem Priming |
US7157228B2 (en) * | 2002-09-09 | 2007-01-02 | Bioarray Solutions Ltd. | Genetic analysis and authentication |
EP1556517B1 (en) * | 2002-10-30 | 2006-03-08 | PamGene B.V. | Improved methods for generating multiple rna copies |
US20060183128A1 (en) | 2003-08-12 | 2006-08-17 | Epigenomics Ag | Methods and compositions for differentiating tissues for cell types using epigenetic markers |
EP1921156A1 (en) * | 2006-11-10 | 2008-05-14 | bioMerieux B.V. | Improved multiplex nucleic acid amplification using blocked primers |
DK3064599T3 (en) * | 2008-02-15 | 2019-04-08 | Synthetic Genomics Inc | METHODS IN VITRO FOR COMBINING AND COMBINATORY CONSTRUCTION OF NUCLEIC ACID MOLECULES |
CN101935697B (zh) * | 2010-04-16 | 2015-11-25 | 中生方政生物技术有限公司 | 用于核酸序列检测的方法和试剂盒 |
US20120052498A1 (en) * | 2010-07-01 | 2012-03-01 | Affymetrix, Inc. | Detection of Nucleic Acids |
EP2847353B1 (en) * | 2012-05-10 | 2022-01-19 | The General Hospital Corporation | Methods for determining a nucleotide sequence |
US20150011396A1 (en) * | 2012-07-09 | 2015-01-08 | Benjamin G. Schroeder | Methods for creating directional bisulfite-converted nucleic acid libraries for next generation sequencing |
PL2898100T5 (pl) | 2012-09-20 | 2023-11-06 | The Chinese University Of Hong Kong | Nieinwazyjny sposób określania metylomu płodu lub guza z wykorzystaniem osocza |
CN103806111A (zh) * | 2012-11-15 | 2014-05-21 | 深圳华大基因科技有限公司 | 高通量测序文库的构建方法及其应用 |
US9567632B2 (en) * | 2013-03-19 | 2017-02-14 | New England Biolabs, Inc. | Enrichment of target sequences |
EP3099822A4 (en) | 2014-01-30 | 2017-08-30 | The Regents of the University of California | Methylation haplotyping for non-invasive diagnosis (monod) |
DK4026917T5 (da) | 2014-04-14 | 2024-07-15 | Yissum Research And Development Company Of The Hebrew Univ Of Jerusalem Ltd | Fremgangsmåde og kit til bestemmelse af cellers eller vævs død eller dna's vævs- eller celleoprindelse ved dna-methyleringsanalyse |
EP3169813B1 (en) | 2014-07-18 | 2019-06-12 | The Chinese University Of Hong Kong | Methylation pattern analysis of tissues in dna mixture |
WO2016037361A1 (zh) * | 2014-09-12 | 2016-03-17 | 深圳华大基因科技有限公司 | 试剂盒及其在核酸测序中的用途 |
WO2016093838A1 (en) * | 2014-12-11 | 2016-06-16 | New England Biolabs, Inc. | Enrichment of target sequences |
US20180320241A1 (en) * | 2014-12-19 | 2018-11-08 | Roche Sequencing Solutions, Inc. | Methods for identifying multiple epitopes in selected sub-populations of cells |
US9944993B2 (en) * | 2015-01-06 | 2018-04-17 | Haplox Biotechnology (Shenzhen) Co., Ltd. | Method for enrichment of circulating tumor DNA and reagent for enrichment of circulating tumor DNA |
US20160215331A1 (en) * | 2015-01-26 | 2016-07-28 | Yale University | Flexible and scalable genotyping-by-sequencing methods for population studies |
EP3390657B1 (en) | 2015-12-17 | 2020-09-16 | Illumina, Inc. | Distinguishing methylation levels in complex biological samples |
CN117604082A (zh) * | 2016-08-10 | 2024-02-27 | 格瑞尔有限责任公司 | 分析核酸片段的方法 |
WO2018119216A1 (en) | 2016-12-21 | 2018-06-28 | The Regents Of The University Of California | Deconvolution and detection of rare dna in plasma |
EP3589750B1 (en) * | 2017-03-01 | 2022-05-04 | The Board of Trustees of the Leland Stanford Junior University | Highly specific circular proximity ligation assay |
WO2018175779A1 (en) * | 2017-03-22 | 2018-09-27 | The Board Of Trustees Of The Leland Stanford Junior University | Molecular profiling using proximity ligation-in situ hybridization |
EP3612642B1 (en) * | 2017-04-17 | 2025-07-09 | GeneFirst Limited | Methods and kits for preparing nucleic acid libraries |
EP3447152A1 (en) * | 2017-08-25 | 2019-02-27 | Eawag, Swiss Federal Institute of Aquatic Science and Technology | Accurate and massively parallel quantification of nucleic acid |
WO2021155374A2 (en) * | 2020-01-31 | 2021-08-05 | Avida Biomed, Inc. | Systems and methods for targeted nucleic acid capture |
-
2019
- 2019-11-20 CA CA3120713A patent/CA3120713A1/en active Pending
- 2019-11-20 KR KR1020217018861A patent/KR20210141915A/ko not_active Ceased
- 2019-11-20 EP EP19886590.9A patent/EP3884047A4/en active Pending
- 2019-11-20 GB GB2308060.9A patent/GB2615955B/en active Active
- 2019-11-20 WO PCT/US2019/062507 patent/WO2020106906A1/en not_active Application Discontinuation
- 2019-11-20 JP JP2021529113A patent/JP2022513124A/ja active Pending
- 2019-11-20 GB GB2108738.2A patent/GB2595076B8/en active Active
- 2019-11-20 AU AU2019384154A patent/AU2019384154A1/en active Pending
- 2019-11-20 CN CN201980089745.0A patent/CN114901818B/zh active Active
-
2021
- 2021-05-21 US US17/326,475 patent/US20210355485A1/en active Pending
Also Published As
Publication number | Publication date |
---|---|
GB2595076B8 (en) | 2023-08-23 |
US20210355485A1 (en) | 2021-11-18 |
GB202108738D0 (en) | 2021-08-04 |
CN114901818A (zh) | 2022-08-12 |
EP3884047A4 (en) | 2022-08-17 |
GB2595076A (en) | 2021-11-17 |
JP2022513124A (ja) | 2022-02-07 |
GB2595076B (en) | 2023-07-26 |
AU2019384154A1 (en) | 2021-06-10 |
GB2615955A (en) | 2023-08-23 |
GB2615955B (en) | 2023-11-22 |
KR20210141915A (ko) | 2021-11-23 |
WO2020106906A1 (en) | 2020-05-28 |
GB202308060D0 (en) | 2023-07-12 |
CA3120713A1 (en) | 2020-05-28 |
EP3884047A1 (en) | 2021-09-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN114901818B (zh) | 靶向核酸文库形成的方法 | |
US11697843B2 (en) | Methods for creating directional bisulfite-converted nucleic acid libraries for next generation sequencing | |
US20220017893A1 (en) | Capture methodologies for circulating cell free dna | |
JP6479083B2 (ja) | 組み合わせたヌクレアーゼ反応、連結反応、およびポリメラーゼ反応を用いて核酸配列、発現、またはコピー変化を相対的に定量するための方法 | |
JP2024060054A (ja) | ヌクレアーゼ、リガーゼ、ポリメラーゼ、及び配列決定反応の組み合わせを用いた、核酸配列、発現、コピー、またはdnaのメチル化変化の識別及び計数方法 | |
US20150284769A1 (en) | Reduced representation bisulfite sequencing with diversity adaptors | |
EP3572528A1 (en) | Direct capture, amplification and sequencing of target dna using immobilized primers | |
US11091791B2 (en) | Methods for hybridization based hook ligation | |
WO2013074632A1 (en) | Mismatch nucleotide purification and identification | |
WO2019014218A2 (en) | SEQUENCING METHOD FOR DETECTION OF GENOMIC REARRANGEMENTS | |
KR20220133984A (ko) | 표적화된 핵산 캡쳐를 위한 시스템 및 방법 | |
KR20230124636A (ko) | 멀티플렉스 반응에서 표적 서열의 고 감응성 검출을위한 조성물 및 방법 | |
HK40078903A (zh) | 靶向核酸文庫形成的方法 | |
KR20240150780A (ko) | 표적 핵산 포획 및 바코딩을 위한 시스템 및 방법 | |
CN119932155A (zh) | 用于靶向基因组富集的方法和试剂盒 | |
WO2025078657A1 (en) | Amplification-free target enrichment workflow for direct detection of nucleic acid modifications |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
REG | Reference to a national code |
Ref country code: HK Ref legal event code: DE Ref document number: 40078903 Country of ref document: HK |
|
TA01 | Transfer of patent application right |
Effective date of registration: 20230913 Address after: California, USA Applicant after: AGILENT TECHNOLOGIES, Inc. Address before: California, USA Applicant before: Aveda Biomedical Corp. |
|
TA01 | Transfer of patent application right | ||
GR01 | Patent grant | ||
GR01 | Patent grant |