JP2024511760A - エラー補正のための固有分子識別子を有するトランスポゾンベースの技術を使用した指向性タグメンテーション配列決定ライブラリーの調製方法 - Google Patents
エラー補正のための固有分子識別子を有するトランスポゾンベースの技術を使用した指向性タグメンテーション配列決定ライブラリーの調製方法 Download PDFInfo
- Publication number
- JP2024511760A JP2024511760A JP2023557365A JP2023557365A JP2024511760A JP 2024511760 A JP2024511760 A JP 2024511760A JP 2023557365 A JP2023557365 A JP 2023557365A JP 2023557365 A JP2023557365 A JP 2023557365A JP 2024511760 A JP2024511760 A JP 2024511760A
- Authority
- JP
- Japan
- Prior art keywords
- sequence
- umi
- nucleic acid
- double
- transposon
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 457
- 238000012163 sequencing technique Methods 0.000 title claims abstract description 282
- 238000005516 engineering process Methods 0.000 title abstract description 14
- 238000012937 correction Methods 0.000 title description 14
- 150000007523 nucleic acids Chemical class 0.000 claims abstract description 459
- 102000039446 nucleic acids Human genes 0.000 claims abstract description 176
- 108020004707 nucleic acids Proteins 0.000 claims abstract description 176
- 238000003199 nucleic acid amplification method Methods 0.000 claims abstract description 63
- 230000003321 amplification Effects 0.000 claims abstract description 62
- 108020004414 DNA Proteins 0.000 claims description 241
- 108091034117 Oligonucleotide Proteins 0.000 claims description 136
- 102000008579 Transposases Human genes 0.000 claims description 102
- 108010020764 Transposases Proteins 0.000 claims description 102
- 102000040430 polynucleotide Human genes 0.000 claims description 94
- 108091033319 polynucleotide Proteins 0.000 claims description 94
- 239000002157 polynucleotide Substances 0.000 claims description 94
- 230000000295 complement effect Effects 0.000 claims description 93
- 239000007787 solid Substances 0.000 claims description 81
- 239000002773 nucleotide Substances 0.000 claims description 61
- 125000003729 nucleotide group Chemical group 0.000 claims description 61
- 239000012634 fragment Substances 0.000 claims description 59
- 108091032973 (ribonucleotides)n+m Proteins 0.000 claims description 49
- 238000009396 hybridization Methods 0.000 claims description 42
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 claims description 32
- 239000000203 mixture Substances 0.000 claims description 26
- 102000053602 DNA Human genes 0.000 claims description 23
- 239000011324 bead Substances 0.000 claims description 22
- 238000001712 DNA sequencing Methods 0.000 claims description 18
- YBJHBAHKTGYVGT-ZKWXMUAHSA-N (+)-Biotin Chemical compound N1C(=O)N[C@@H]2[C@H](CCCCC(=O)O)SC[C@@H]21 YBJHBAHKTGYVGT-ZKWXMUAHSA-N 0.000 claims description 16
- 102100034343 Integrase Human genes 0.000 claims description 12
- 108010092799 RNA-directed DNA polymerase Proteins 0.000 claims description 10
- 229960002685 biotin Drugs 0.000 claims description 8
- 235000020958 biotin Nutrition 0.000 claims description 8
- 239000011616 biotin Substances 0.000 claims description 8
- 239000002299 complementary DNA Substances 0.000 claims description 6
- 238000002844 melting Methods 0.000 claims description 6
- 230000008018 melting Effects 0.000 claims description 6
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 claims description 5
- 241000713869 Moloney murine leukemia virus Species 0.000 claims description 5
- 230000035945 sensitivity Effects 0.000 claims description 5
- 239000000463 material Substances 0.000 abstract description 39
- 238000002360 preparation method Methods 0.000 abstract description 28
- 238000007481 next generation sequencing Methods 0.000 abstract description 7
- 238000013459 approach Methods 0.000 abstract description 2
- 125000006850 spacer group Chemical group 0.000 description 73
- 239000000523 sample Substances 0.000 description 66
- 238000006243 chemical reaction Methods 0.000 description 45
- 238000003752 polymerase chain reaction Methods 0.000 description 32
- 210000004027 cell Anatomy 0.000 description 29
- 108010012306 Tn5 transposase Proteins 0.000 description 25
- 230000017105 transposition Effects 0.000 description 23
- 238000001514 detection method Methods 0.000 description 20
- 108091028043 Nucleic acid sequence Proteins 0.000 description 19
- 239000000243 solution Substances 0.000 description 19
- 230000001351 cycling effect Effects 0.000 description 18
- 238000012986 modification Methods 0.000 description 16
- 230000004048 modification Effects 0.000 description 16
- 239000003153 chemical reaction reagent Substances 0.000 description 15
- 239000007791 liquid phase Substances 0.000 description 12
- AFUDNVRZGPHSQO-UHFFFAOYSA-N 2-(2-methylpropylamino)-1,2-diphenylethanol Chemical compound C=1C=CC=CC=1C(NCC(C)C)C(O)C1=CC=CC=C1 AFUDNVRZGPHSQO-UHFFFAOYSA-N 0.000 description 11
- 238000007792 addition Methods 0.000 description 11
- 239000000047 product Substances 0.000 description 11
- 238000010348 incorporation Methods 0.000 description 10
- 206010028980 Neoplasm Diseases 0.000 description 9
- 230000008901 benefit Effects 0.000 description 9
- 238000006073 displacement reaction Methods 0.000 description 9
- 238000000338 in vitro Methods 0.000 description 9
- 108020004999 messenger RNA Proteins 0.000 description 9
- 239000000758 substrate Substances 0.000 description 9
- 238000013461 design Methods 0.000 description 8
- 208000035657 Abasia Diseases 0.000 description 7
- 108091093088 Amplicon Proteins 0.000 description 7
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 description 7
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 description 7
- 238000000137 annealing Methods 0.000 description 7
- 239000012472 biological sample Substances 0.000 description 7
- 238000004132 cross linking Methods 0.000 description 7
- 239000011521 glass Substances 0.000 description 7
- 238000003780 insertion Methods 0.000 description 7
- 230000037431 insertion Effects 0.000 description 7
- 230000008569 process Effects 0.000 description 7
- 239000011541 reaction mixture Substances 0.000 description 7
- 238000003786 synthesis reaction Methods 0.000 description 7
- 102000004190 Enzymes Human genes 0.000 description 6
- 108090000790 Enzymes Proteins 0.000 description 6
- UGQMRVRMYYASKQ-KQYNXXCUSA-N Inosine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C2=NC=NC(O)=C2N=C1 UGQMRVRMYYASKQ-KQYNXXCUSA-N 0.000 description 6
- 229930010555 Inosine Natural products 0.000 description 6
- -1 Tn/O and IS10 Proteins 0.000 description 6
- 230000015572 biosynthetic process Effects 0.000 description 6
- 239000013592 cell lysate Substances 0.000 description 6
- 238000003776 cleavage reaction Methods 0.000 description 6
- 230000000694 effects Effects 0.000 description 6
- 229960003786 inosine Drugs 0.000 description 6
- 108090000623 proteins and genes Proteins 0.000 description 6
- 230000007017 scission Effects 0.000 description 6
- 102100030396 Protein O-glucosyltransferase 1 Human genes 0.000 description 5
- 101710112761 Protein O-glucosyltransferase 1 Proteins 0.000 description 5
- WYURNTSHIVDZCO-UHFFFAOYSA-N Tetrahydrofuran Chemical compound C1CCOC1 WYURNTSHIVDZCO-UHFFFAOYSA-N 0.000 description 5
- 238000004458 analytical method Methods 0.000 description 5
- 238000003491 array Methods 0.000 description 5
- 239000000872 buffer Substances 0.000 description 5
- 238000004519 manufacturing process Methods 0.000 description 5
- 239000004005 microsphere Substances 0.000 description 5
- 230000035772 mutation Effects 0.000 description 5
- 238000012175 pyrosequencing Methods 0.000 description 5
- 239000007790 solid phase Substances 0.000 description 5
- AWNXKZVIZARMME-UHFFFAOYSA-N 1-[[5-[2-[(2-chloropyridin-4-yl)amino]pyrimidin-4-yl]-4-(cyclopropylmethyl)pyrimidin-2-yl]amino]-2-methylpropan-2-ol Chemical compound N=1C(NCC(C)(O)C)=NC=C(C=2N=C(NC=3C=C(Cl)N=CC=3)N=CC=2)C=1CC1CC1 AWNXKZVIZARMME-UHFFFAOYSA-N 0.000 description 4
- YLQBMQCUIZJEEH-UHFFFAOYSA-N Furan Chemical compound C=1C=COC=1 YLQBMQCUIZJEEH-UHFFFAOYSA-N 0.000 description 4
- 108010061833 Integrases Proteins 0.000 description 4
- VYPSYNLAJGMNEJ-UHFFFAOYSA-N Silicium dioxide Chemical compound O=[Si]=O VYPSYNLAJGMNEJ-UHFFFAOYSA-N 0.000 description 4
- 108091023045 Untranslated Region Proteins 0.000 description 4
- 238000003556 assay Methods 0.000 description 4
- 238000001574 biopsy Methods 0.000 description 4
- 230000001010 compromised effect Effects 0.000 description 4
- 238000011049 filling Methods 0.000 description 4
- 239000012530 fluid Substances 0.000 description 4
- 238000013467 fragmentation Methods 0.000 description 4
- 238000006062 fragmentation reaction Methods 0.000 description 4
- 108020001507 fusion proteins Proteins 0.000 description 4
- 102000037865 fusion proteins Human genes 0.000 description 4
- 238000003384 imaging method Methods 0.000 description 4
- 241001430294 unidentified retrovirus Species 0.000 description 4
- YBJHBAHKTGYVGT-ZXFLCMHBSA-N 5-[(3ar,4r,6as)-2-oxo-1,3,3a,4,6,6a-hexahydrothieno[3,4-d]imidazol-4-yl]pentanoic acid Chemical compound N1C(=O)N[C@H]2[C@@H](CCCCC(=O)O)SC[C@H]21 YBJHBAHKTGYVGT-ZXFLCMHBSA-N 0.000 description 3
- ZKHQWZAMYRWXGA-KQYNXXCUSA-J ATP(4-) Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](COP([O-])(=O)OP([O-])(=O)OP([O-])([O-])=O)[C@@H](O)[C@H]1O ZKHQWZAMYRWXGA-KQYNXXCUSA-J 0.000 description 3
- ZKHQWZAMYRWXGA-UHFFFAOYSA-N Adenosine triphosphate Natural products C1=NC=2C(N)=NC=NC=2N1C1OC(COP(O)(=O)OP(O)(=O)OP(O)(O)=O)C(O)C1O ZKHQWZAMYRWXGA-UHFFFAOYSA-N 0.000 description 3
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 3
- 229910019142 PO4 Inorganic materials 0.000 description 3
- 239000008280 blood Substances 0.000 description 3
- 210000004369 blood Anatomy 0.000 description 3
- 229910052799 carbon Inorganic materials 0.000 description 3
- 230000001413 cellular effect Effects 0.000 description 3
- 239000000356 contaminant Substances 0.000 description 3
- 239000000539 dimer Substances 0.000 description 3
- 238000002866 fluorescence resonance energy transfer Methods 0.000 description 3
- 239000000017 hydrogel Substances 0.000 description 3
- 230000003100 immobilizing effect Effects 0.000 description 3
- 239000000178 monomer Substances 0.000 description 3
- 230000036961 partial effect Effects 0.000 description 3
- 239000002245 particle Substances 0.000 description 3
- 239000010452 phosphate Substances 0.000 description 3
- 239000004033 plastic Substances 0.000 description 3
- 229920003023 plastic Polymers 0.000 description 3
- 229920000642 polymer Polymers 0.000 description 3
- 102000004169 proteins and genes Human genes 0.000 description 3
- 230000002441 reversible effect Effects 0.000 description 3
- 238000010561 standard procedure Methods 0.000 description 3
- 108700028369 Alleles Proteins 0.000 description 2
- 108060002716 Exonuclease Proteins 0.000 description 2
- 102000012330 Integrases Human genes 0.000 description 2
- 102000003960 Ligases Human genes 0.000 description 2
- 108090000364 Ligases Proteins 0.000 description 2
- 239000004677 Nylon Substances 0.000 description 2
- 240000007019 Oxalis corniculata Species 0.000 description 2
- 238000012408 PCR amplification Methods 0.000 description 2
- 239000004793 Polystyrene Substances 0.000 description 2
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 2
- DBMJMQXJHONAFJ-UHFFFAOYSA-M Sodium laurylsulphate Chemical compound [Na+].CCCCCCCCCCCCOS([O-])(=O)=O DBMJMQXJHONAFJ-UHFFFAOYSA-M 0.000 description 2
- 241000191967 Staphylococcus aureus Species 0.000 description 2
- PPBRXRYQALVLMV-UHFFFAOYSA-N Styrene Chemical compound C=CC1=CC=CC=C1 PPBRXRYQALVLMV-UHFFFAOYSA-N 0.000 description 2
- 108010006785 Taq Polymerase Proteins 0.000 description 2
- 229920006362 Teflon® Polymers 0.000 description 2
- GWEVSGVZZGPLCZ-UHFFFAOYSA-N Titan oxide Chemical compound O=[Ti]=O GWEVSGVZZGPLCZ-UHFFFAOYSA-N 0.000 description 2
- 108020004566 Transfer RNA Proteins 0.000 description 2
- 241000607618 Vibrio harveyi Species 0.000 description 2
- 238000002835 absorbance Methods 0.000 description 2
- 230000001580 bacterial effect Effects 0.000 description 2
- 238000010804 cDNA synthesis Methods 0.000 description 2
- 201000011510 cancer Diseases 0.000 description 2
- 239000000919 ceramic Substances 0.000 description 2
- 108010063460 elongation factor T Proteins 0.000 description 2
- 102000013165 exonuclease Human genes 0.000 description 2
- 238000007672 fourth generation sequencing Methods 0.000 description 2
- ACCCMOQWYVYDOT-UHFFFAOYSA-N hexane-1,1-diol Chemical compound CCCCCC(O)O ACCCMOQWYVYDOT-UHFFFAOYSA-N 0.000 description 2
- 239000000710 homodimer Substances 0.000 description 2
- 230000000977 initiatory effect Effects 0.000 description 2
- 238000011901 isothermal amplification Methods 0.000 description 2
- 230000000670 limiting effect Effects 0.000 description 2
- 102000016470 mariner transposase Human genes 0.000 description 2
- 108060004631 mariner transposase Proteins 0.000 description 2
- 229920001778 nylon Polymers 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 239000012071 phase Substances 0.000 description 2
- 210000002381 plasma Anatomy 0.000 description 2
- 229920002401 polyacrylamide Polymers 0.000 description 2
- 229920001296 polysiloxane Polymers 0.000 description 2
- 229920002223 polystyrene Polymers 0.000 description 2
- 230000010076 replication Effects 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 108020004418 ribosomal RNA Proteins 0.000 description 2
- 238000000926 separation method Methods 0.000 description 2
- 239000000377 silicon dioxide Substances 0.000 description 2
- 241000894007 species Species 0.000 description 2
- 230000002194 synthesizing effect Effects 0.000 description 2
- 210000001519 tissue Anatomy 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 238000005406 washing Methods 0.000 description 2
- 102000040650 (ribonucleotides)n+m Human genes 0.000 description 1
- BDCDOEVKQUFRTF-UHFFFAOYSA-N 1,7-dihydropurin-6-one 1H-pyrimidine-2,4-dione Chemical compound O=C1C=CNC(=O)N1.O=C1NC=NC2=C1NC=N2 BDCDOEVKQUFRTF-UHFFFAOYSA-N 0.000 description 1
- HZOYZGXLSVYLNF-UHFFFAOYSA-N 2-amino-3,7-dihydropurin-6-one;1h-pyrimidine-2,4-dione Chemical compound O=C1C=CNC(=O)N1.O=C1NC(N)=NC2=C1NC=N2 HZOYZGXLSVYLNF-UHFFFAOYSA-N 0.000 description 1
- HCGYMSSYSAKGPK-UHFFFAOYSA-N 2-nitro-1h-indole Chemical compound C1=CC=C2NC([N+](=O)[O-])=CC2=C1 HCGYMSSYSAKGPK-UHFFFAOYSA-N 0.000 description 1
- TXOSAXQFTKBXLI-UHFFFAOYSA-N 3,7-dihydropurin-6-one;7h-purin-6-amine Chemical compound NC1=NC=NC2=C1NC=N2.O=C1N=CNC2=C1NC=N2 TXOSAXQFTKBXLI-UHFFFAOYSA-N 0.000 description 1
- PHIYHIOQVWTXII-UHFFFAOYSA-N 3-amino-1-phenylpropan-1-ol Chemical compound NCCC(O)C1=CC=CC=C1 PHIYHIOQVWTXII-UHFFFAOYSA-N 0.000 description 1
- JLBJTVDPSNHSKJ-UHFFFAOYSA-N 4-Methylstyrene Chemical compound CC1=CC=C(C=C)C=C1 JLBJTVDPSNHSKJ-UHFFFAOYSA-N 0.000 description 1
- CRYRGPNRAULTHU-UHFFFAOYSA-N 6-amino-1h-pyrimidin-2-one;3,7-dihydropurin-6-one Chemical compound NC=1C=CNC(=O)N=1.O=C1NC=NC2=C1NC=N2 CRYRGPNRAULTHU-UHFFFAOYSA-N 0.000 description 1
- 206010069754 Acquired gene mutation Diseases 0.000 description 1
- 229930024421 Adenine Natural products 0.000 description 1
- GFFGJBXGBJISGV-UHFFFAOYSA-N Adenine Chemical compound NC1=NC=NC2=C1N=CN2 GFFGJBXGBJISGV-UHFFFAOYSA-N 0.000 description 1
- 102000012410 DNA Ligases Human genes 0.000 description 1
- 108010061982 DNA Ligases Proteins 0.000 description 1
- 230000005778 DNA damage Effects 0.000 description 1
- 231100000277 DNA damage Toxicity 0.000 description 1
- 229920002307 Dextran Polymers 0.000 description 1
- 241000588724 Escherichia coli Species 0.000 description 1
- 108091092195 Intron Proteins 0.000 description 1
- 241000714177 Murine leukemia virus Species 0.000 description 1
- 239000000020 Nitrocellulose Substances 0.000 description 1
- 239000004698 Polyethylene Substances 0.000 description 1
- 239000004743 Polypropylene Substances 0.000 description 1
- 206010036790 Productive cough Diseases 0.000 description 1
- CZPWVGJYEJSRLH-UHFFFAOYSA-N Pyrimidine Chemical compound C1=CN=CN=C1 CZPWVGJYEJSRLH-UHFFFAOYSA-N 0.000 description 1
- 239000013614 RNA sample Substances 0.000 description 1
- 238000003559 RNA-seq method Methods 0.000 description 1
- 229920002684 Sepharose Polymers 0.000 description 1
- 102000004523 Sulfate Adenylyltransferase Human genes 0.000 description 1
- 108010022348 Sulfate adenylyltransferase Proteins 0.000 description 1
- 239000004809 Teflon Substances 0.000 description 1
- 102220483600 Troponin I, cardiac muscle_E54V_mutation Human genes 0.000 description 1
- 102220483626 Troponin I, cardiac muscle_M56A_mutation Human genes 0.000 description 1
- 241000700605 Viruses Species 0.000 description 1
- 239000002253 acid Substances 0.000 description 1
- 150000007513 acids Chemical class 0.000 description 1
- 229920006397 acrylic thermoplastic Polymers 0.000 description 1
- 230000003213 activating effect Effects 0.000 description 1
- 229960000643 adenine Drugs 0.000 description 1
- 150000001413 amino acids Chemical class 0.000 description 1
- 238000005842 biochemical reaction Methods 0.000 description 1
- 230000000903 blocking effect Effects 0.000 description 1
- 229920002678 cellulose Polymers 0.000 description 1
- 239000001913 cellulose Substances 0.000 description 1
- 210000001175 cerebrospinal fluid Anatomy 0.000 description 1
- 238000001311 chemical methods and process Methods 0.000 description 1
- 239000003795 chemical substances by application Substances 0.000 description 1
- 238000010668 complexation reaction Methods 0.000 description 1
- 229920001577 copolymer Polymers 0.000 description 1
- 238000005520 cutting process Methods 0.000 description 1
- 125000004122 cyclic group Chemical group 0.000 description 1
- 230000009089 cytolysis Effects 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000029087 digestion Effects 0.000 description 1
- XPPKVPWEQAFLFU-UHFFFAOYSA-J diphosphate(4-) Chemical compound [O-]P([O-])(=O)OP([O-])([O-])=O XPPKVPWEQAFLFU-UHFFFAOYSA-J 0.000 description 1
- 235000011180 diphosphates Nutrition 0.000 description 1
- 238000005530 etching Methods 0.000 description 1
- LYCAIKOWRPUZTN-UHFFFAOYSA-N ethylene glycol Natural products OCCO LYCAIKOWRPUZTN-UHFFFAOYSA-N 0.000 description 1
- 230000005284 excitation Effects 0.000 description 1
- 230000007717 exclusion Effects 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 238000005562 fading Methods 0.000 description 1
- 210000003608 fece Anatomy 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- 239000000499 gel Substances 0.000 description 1
- 238000003205 genotyping method Methods 0.000 description 1
- 150000004676 glycans Chemical class 0.000 description 1
- 239000010439 graphite Substances 0.000 description 1
- 229910002804 graphite Inorganic materials 0.000 description 1
- WGCNASOHLSPBMP-UHFFFAOYSA-N hydroxyacetaldehyde Natural products OCC=O WGCNASOHLSPBMP-UHFFFAOYSA-N 0.000 description 1
- 238000001727 in vivo Methods 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 150000002500 ions Chemical class 0.000 description 1
- 230000001788 irregular Effects 0.000 description 1
- 239000004816 latex Substances 0.000 description 1
- 229920000126 latex Polymers 0.000 description 1
- 239000007788 liquid Substances 0.000 description 1
- 210000002751 lymph Anatomy 0.000 description 1
- 239000006166 lysate Substances 0.000 description 1
- 230000002934 lysing effect Effects 0.000 description 1
- 238000007403 mPCR Methods 0.000 description 1
- 230000005291 magnetic effect Effects 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 230000001404 mediated effect Effects 0.000 description 1
- 229910052751 metal Inorganic materials 0.000 description 1
- 239000002184 metal Substances 0.000 description 1
- 150000002739 metals Chemical class 0.000 description 1
- 239000000693 micelle Substances 0.000 description 1
- 239000011859 microparticle Substances 0.000 description 1
- 238000002156 mixing Methods 0.000 description 1
- 238000010369 molecular cloning Methods 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 238000000465 moulding Methods 0.000 description 1
- 108010009127 mu transposase Proteins 0.000 description 1
- 210000003097 mucus Anatomy 0.000 description 1
- 229920001220 nitrocellulos Polymers 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 239000002907 paramagnetic material Substances 0.000 description 1
- NBIIXXVUZAFLBC-UHFFFAOYSA-K phosphate Chemical compound [O-]P([O-])([O-])=O NBIIXXVUZAFLBC-UHFFFAOYSA-K 0.000 description 1
- 238000000206 photolithography Methods 0.000 description 1
- 229920003229 poly(methyl methacrylate) Polymers 0.000 description 1
- 229920000058 polyacrylate Polymers 0.000 description 1
- 229920001748 polybutylene Polymers 0.000 description 1
- 229920000573 polyethylene Polymers 0.000 description 1
- 238000006116 polymerization reaction Methods 0.000 description 1
- 229920001155 polypropylene Polymers 0.000 description 1
- 229920001282 polysaccharide Polymers 0.000 description 1
- 239000005017 polysaccharide Substances 0.000 description 1
- 229920002635 polyurethane Polymers 0.000 description 1
- 239000004814 polyurethane Substances 0.000 description 1
- 239000011148 porous material Substances 0.000 description 1
- 238000000746 purification Methods 0.000 description 1
- 238000003908 quality control method Methods 0.000 description 1
- 230000005855 radiation Effects 0.000 description 1
- 230000008707 rearrangement Effects 0.000 description 1
- 238000006462 rearrangement reaction Methods 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000008439 repair process Effects 0.000 description 1
- 239000011347 resin Substances 0.000 description 1
- 229920005989 resin Polymers 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 238000005096 rolling process Methods 0.000 description 1
- 210000000582 semen Anatomy 0.000 description 1
- 238000007841 sequencing by ligation Methods 0.000 description 1
- 210000002966 serum Anatomy 0.000 description 1
- 239000008279 sol Substances 0.000 description 1
- 230000037439 somatic mutation Effects 0.000 description 1
- 230000003595 spectral effect Effects 0.000 description 1
- 108010068698 spleen exonuclease Proteins 0.000 description 1
- 210000003802 sputum Anatomy 0.000 description 1
- 208000024794 sputum Diseases 0.000 description 1
- 230000000087 stabilizing effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 239000006228 supernatant Substances 0.000 description 1
- 230000008685 targeting Effects 0.000 description 1
- ISXSCDLOGDJUNJ-UHFFFAOYSA-N tert-butyl prop-2-enoate Chemical compound CC(C)(C)OC(=O)C=C ISXSCDLOGDJUNJ-UHFFFAOYSA-N 0.000 description 1
- RYYWUUFWQRZTIU-UHFFFAOYSA-K thiophosphate Chemical compound [O-]P([O-])([O-])=S RYYWUUFWQRZTIU-UHFFFAOYSA-K 0.000 description 1
- ZCUFMDLYAMJYST-UHFFFAOYSA-N thorium dioxide Chemical compound O=[Th]=O ZCUFMDLYAMJYST-UHFFFAOYSA-N 0.000 description 1
- 239000004408 titanium dioxide Substances 0.000 description 1
- 238000013518 transcription Methods 0.000 description 1
- 230000035897 transcription Effects 0.000 description 1
- 238000009827 uniform distribution Methods 0.000 description 1
- 210000002700 urine Anatomy 0.000 description 1
- 239000011534 wash buffer Substances 0.000 description 1
- 238000012070 whole genome sequencing analysis Methods 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/10—Processes for the isolation, preparation or purification of DNA or RNA
- C12N15/1034—Isolating an individual clone by screening libraries
- C12N15/1065—Preparation or screening of tagged libraries, e.g. tagged microorganisms by STM-mutagenesis, tagged polynucleotides, gene tags
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6806—Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/10—Processes for the isolation, preparation or purification of DNA or RNA
- C12N15/1034—Isolating an individual clone by screening libraries
- C12N15/1068—Template (nucleic acid) mediated chemical library synthesis, e.g. chemical and enzymatical DNA-templated organic molecule synthesis, libraries prepared by non ribosomal polypeptide synthesis [NRPS], DNA/RNA-polymerase mediated polypeptide synthesis
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2521/00—Reaction characterised by the enzymatic activity
- C12Q2521/50—Other enzymatic activities
- C12Q2521/507—Recombinase
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2525/00—Reactions involving modified oligonucleotides, nucleic acids, or nucleotides
- C12Q2525/10—Modifications characterised by
- C12Q2525/191—Modifications characterised by incorporating an adaptor
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2563/00—Nucleic acid detection characterized by the use of physical, structural and functional properties
- C12Q2563/179—Nucleic acid detection characterized by the use of physical, structural and functional properties the label being a nucleic acid
Landscapes
- Chemical & Material Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Genetics & Genomics (AREA)
- Engineering & Computer Science (AREA)
- Organic Chemistry (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biotechnology (AREA)
- General Engineering & Computer Science (AREA)
- Biomedical Technology (AREA)
- Molecular Biology (AREA)
- General Health & Medical Sciences (AREA)
- Biophysics (AREA)
- Microbiology (AREA)
- Physics & Mathematics (AREA)
- Biochemistry (AREA)
- Analytical Chemistry (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Crystallography & Structural Chemistry (AREA)
- Plant Pathology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Immunology (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
- Apparatus Associated With Microorganisms And Enzymes (AREA)
Abstract
次世代配列決定のための核酸ライブラリーを調製するための材料及び方法が、本明細書に記載される。配列決定ライブラリーの調製におけるトランスポゾンベースの技術を用いた固有分子識別子の使用に関する様々なアプローチが記載されている。増幅及び配列決定エラーを同定及び補正するための配列決定材料及び方法も本明細書に記載される。
Description
関連出願の相互参照
本出願は、2021年3月31日に出願された米国仮特許出願第63/168,802号の優先権の利益を主張し、この出願は、参照によりその全体があらゆる目的のために本明細書に組み込まれる。
本出願は、2021年3月31日に出願された米国仮特許出願第63/168,802号の優先権の利益を主張し、この出願は、参照によりその全体があらゆる目的のために本明細書に組み込まれる。
配列表
この出願は、電子フォーマットでの配列表と共に出願されている。配列表は、「2022-03-29_01243-0024-00PCT_Sequence_Listing_ST25.txt」と題されたファイル(2022年3月29日作成、4キロバイトのサイズ)として提供されている。配列表の電子フォーマット中の情報は、参照によりその全体が本明細書に組み込まれる。
この出願は、電子フォーマットでの配列表と共に出願されている。配列表は、「2022-03-29_01243-0024-00PCT_Sequence_Listing_ST25.txt」と題されたファイル(2022年3月29日作成、4キロバイトのサイズ)として提供されている。配列表の電子フォーマット中の情報は、参照によりその全体が本明細書に組み込まれる。
本出願は、低頻度変異体の配列決定感度を増加させる固有分子識別子(UMI)を組み込むためのトランスポゾンベースの技術を使用したDNA及びRNA配列決定ライブラリーの調製に関する。
次世代配列決定(NGS)は、がんの研究者が、非常に正確な配列決定データを使用して単一のアッセイにおいて多数の遺伝子を評価することを可能にしている。しかしながら、合成ベースの方法はいずれも固有のエラーを含む。エラー率は、多くのNGSベースの用途の達成を成功させるのに十分に低い(0.5%未満)が、より低い濃度の標的核酸が得られる試料収集のための非侵襲的な、又は他の方法を使用する新しい方法は、より低いエラー率を必要とし得る。例えば、無細胞DNA(cfDNA)の分析を用いて、生検を必要とせずに血中の体細胞変異を検出することができるが、総cfDNA内の循環腫瘍DNA(ctDNA)の割合が低いため、変異対立遺伝子頻度が、既存の方法の検出限界近くになる。ライブラリー調製方法から生じ得るアーチファクトを、低頻度変異体と誤る場合があり、それによって、方法の感度及び信頼性を低下させる。
トランスポゾンベースの技術を用いて、全ゲノム配列決定ライブラリーを調製することができる。例えば、以前にNextera DNA Flex Library Prepとして知られていたIllumina DNA Prep(RUO)は、広い核酸入力範囲(1~500ng)、複数の試料タイプ、並びに小ゲノム及び大ゲノムの両方をサポートする。4時間未満で、350塩基対断片のライブラリーを生成することができ、標的核酸をトランスポソーム複合体で処理することによって、核酸が配列決定のために同時に断片化及びタグ化(「タグメンテーション化」)されるようになる。
トランスポゾンベースの技術に従って調製されたライブラリーは、NGSデータにおける固有のエラー率を低下させるために、固有分子識別子(UMI)を組み込むことによって改善され得る。配列決定ライブラリーへのUMIの組み込みは、UMI Error Correction Appが同じ標的分子由来の複数のリードを認識し、それらを単一のリードに折り畳み、最終的なバリアントコールにおけるエラーを低減することを可能にする。鎖型(すなわち、フォーク型)ライブラリーと組み合わせたUMIは、配列決定データにおいて個々の鎖分子を解明することができる。本開示は、トランスポゾンベースの技術を使用してUMIライブラリーを調製するための材料及び方法を提供する。
本開示は、トランスポゾンベースの技術を使用してUMIを含む核酸配列決定ライブラリーを調製するための材料、組成物、及び方法に関する。
実施形態1は、二本鎖核酸ライブラリーを作製する方法であり、ライブラリー中の各断片は、固有分子識別子(UMI)を含み、方法は、(a)二本鎖標的核酸を含む試料を、(i)第1のトランスポザーゼと、(ii)第1の3’末端トランスポゾン末端配列、第1のアダプター配列、及び第1のUMIを含む第1のトランスポゾンと、(iii)第1の3’末端トランスポゾン末端配列に完全に又は部分的に相補的である配列を含む第2のトランスポゾンと、を含む、第1のトランスポソーム複合体に適用することと、(b)二本鎖標的核酸を第1のトランスポソーム複合体でタグメンテーションして、タグメンテーション化二本鎖標的核酸断片を生成することであって、各タグメンテーション化二本鎖標的核酸断片は、第1のアダプター配列及び第1のUMIを含む、ことと、(c)タグメンテーション化二本鎖標的核酸断片を第1のトランスポソーム複合体から遊離させることと、(d)任意選択的に、タグメンテーション化二本鎖標的核酸断片を伸長させることと、(e)任意選択的に、第1のトランスポゾンを、タグメンテーション化二本鎖標的核酸断片又は伸長させたタグメンテーション化二本鎖標的核酸断片とライゲーションすることと、(f)タグメンテーション化二本鎖標的核酸断片を生成することと、(g)タグメンテーション化二本鎖標的核酸断片を増幅することと、を含む。
実施形態2は、第1のトランスポゾン内の第1のUMIが、第1のアダプター配列と第1の3’トランスポゾン末端配列との間に位置する、実施形態1に記載の方法である。
実施形態3は、第1のトランスポゾン内の第1のアダプター配列が、第1のUMIと第1の3’トランスポゾン末端配列との間に位置する、実施形態1又は2に記載の方法である。
実施形態4は、(a)第2のトランスポザーゼと、(b)第2のアダプター配列及び第2の3’トランスポゾン末端配列を含む第3のトランスポゾンと、(c)第2の3’末端トランスポゾン末端配列に完全に又は部分的に相補的である配列を含む第4のトランスポゾンと、を含む、第2のトランスポソーム複合体を更に含む、実施形態1~3のいずれか1つに記載の方法である。
実施形態5は、タグメンテーション化工程が、(a)第1のアダプター配列及び第1のUMIを含む第1の鎖と、(b)第2のアダプター配列を含む第2の鎖と、を含む、タグメンテーション化二本鎖標的核酸断片を生成する、実施形態4に記載の方法である。
実施形態6は、(a)第3のトランスポゾンが第2のUMIを更に含み、(b)第2のアダプター配列が第2のUMIと第2の3’トランスポゾン末端配列との間に位置する、実施形態4又は5に記載の方法である。
実施形態7は、タグメンテーション化工程が、(a)第1のアダプター配列及び第1のUMIを含む第1の鎖と、(b)第2のアダプター配列及び第2のUMIを含む第2の鎖と、を含む、二本鎖標的核酸断片を生成する、実施形態6に記載の方法である。
実施形態8は、二本鎖核酸ライブラリーを作製する方法であり、ライブラリー中の各断片はUMIを含み、方法は、(a)二本鎖標的核酸を含む試料を、(i)トランスポザーゼと、(ii)第1の3’末端トランスポゾン末端配列及び第1のアダプター配列を含む第1のトランスポゾンと、(iii)第1の3’末端トランスポゾン末端配列に完全に又は部分的に相補的である配列を含む第2のトランスポゾンと、を含む、トランスポソーム複合体に適用することと、(b)二本鎖標的核酸の第1の鎖をトランスポソーム複合体でタグメンテーションして、タグメンテーション化二本鎖標的核酸断片を生成することであって、各タグメンテーション化二本鎖標的核酸断片は、第1のアダプター配列を含む、ことと、(c)タグメンテーション化二本鎖標的核酸断片をトランスポソーム複合体から遊離させることと、(d)第2のアダプター配列、UMI、及び第1の3’末端トランスポゾン配列に完全に又は部分的に相補的である配列を含むポリヌクレオチドをハイブリダイズさせることと、(e)任意選択的に、タグメンテーション化二本鎖標的核酸断片の第2の鎖を伸長させることと、(f)任意選択的に、ポリヌクレオチドを、タグメンテーション化二本鎖標的核酸断片又は伸長させたタグメンテーション化二本鎖標的核酸断片とライゲーションすることと、(g)UMIを含むタグメンテーション化二本鎖標的核酸断片を生成することであって、UMIは、挿入DNAの3’末端に直接隣接して位置する、ことと、(h)UMIを含むタグメンテーション化二本鎖標的核酸断片を増幅することと、を含む。
実施形態9は、二本鎖核酸ライブラリーを作製する方法であり、ライブラリー中の各断片はUMIを含み、方法は、(a)二本鎖標的核酸を含む試料を、(i)トランスポザーゼと、(ii)第1の3’末端トランスポゾン末端配列及び第1のアダプター配列を含む第1のトランスポゾンと、(iii)第1の3’末端トランスポゾン末端配列に完全に又は部分的に相補的である配列を含む第2のトランスポゾンと、を含む、トランスポソーム複合体に適用することと、(b)二本鎖標的核酸の第1の鎖をトランスポソーム複合体でタグメンテーションして、タグメンテーション化二本鎖標的核酸断片を生成することであって、各タグメンテーション化二本鎖標的核酸断片は、第1のアダプター配列を含む、ことと、(c)タグメンテーション化二本鎖標的核酸断片をトランスポソーム複合体から遊離させることと、(d)UMI及び第2のアダプター配列を含む第1のポリヌクレオチドをハイブリダイズさせることと、(e)任意選択的に、第1のポリヌクレオチドに相補的な領域を含む第2のポリヌクレオチドを付加して、二本鎖アダプターを生成することと、(f)任意選択的に、タグメンテーション化二本鎖標的核酸断片の第2の鎖を伸長させることと、(g)任意選択的に、第2のポリヌクレオチドを、伸長させたタグメンテーション化二本鎖標的核酸断片の第2の鎖とライゲーションすることと、(h)UMIを含むタグメンテーション化二本鎖標的核酸断片を生成することであって、UMIは、二本鎖標的核酸断片と第2のアダプター配列との間に位置する、ことと、(i)UMIを含むタグメンテーション化二本鎖標的核酸断片を増幅することと、を含む。
実施形態10は、ハイブリダイズさせる工程の後に、方法が、(a)二本鎖標的核酸断片の第2の鎖を伸長させることと、(b)第1のポリヌクレオチドをコピーすることと、を更に含む、実施形態9に記載の方法である。
実施形態11は、二本鎖核酸ライブラリーを作製する方法であり、ライブラリー中の各断片は2つの異なるUMIを含み、方法は、(a)二本鎖標的核酸を含む試料を、(i)第1のトランスポソーム複合体であって、(1)第1のトランスポザーゼと、(2)(a)二本鎖標的核酸断片の第1の鎖上の第1のトランスポゾン及び(b)第2のトランスポゾンを含む、第1のフォーク型アダプターと、を含み、第1のトランスポゾンは、第1の3’末端トランスポゾン末端配列、第1のアダプター配列の第1のコピー、及び第1のUMIを含み、第2のトランスポゾンは、第2のアダプター配列の第1のコピー、並びに第1の3’末端トランスポゾン末端配列及び第1のUMIに完全に又は部分的に相補的である配列を含み、更に、第1のアダプター配列の第1のコピーは一本鎖であり、第2のアダプター配列の第1のコピーは二本鎖部分を含む、第1のトランスポソーム複合体、並びに、(ii)第2のトランスポソーム複合体であって、(1)第2のトランスポザーゼと、(2)(a)二本鎖標的核酸断片の第2の鎖上の第3のトランスポゾン及び(b)第4のトランスポゾンとを含む、第2のフォーク型アダプターと、を含み、第3のトランスポゾンは、第2の3’末端トランスポゾン末端配列、第1のアダプター配列の第2のコピー、及び第2のUMIを含み、第3のトランスポゾンは、第2のアダプター配列の第2のコピー、並びに第2の3’末端トランスポゾン末端配列及び第2のUMIに完全に又は部分的に相補的である配列を含み、更に、第1のアダプター配列の第2のコピーは一本鎖であり、第2のアダプター配列の第2のコピーは二本鎖部分を含む、第2のトランスポソーム複合体、に適用することと、(b)二本鎖標的核酸をフォーク型アダプターでタグメンテーションして、タグメンテーション化二本鎖標的核酸断片を生成することであって、各タグメンテーション化二本鎖標的核酸断片は、第1のアダプター配列の第1及び第2のコピー、第1のUMI、第2のアダプター配列の第1及び第2のコピー、及び第2のUMIを含む、ことと、(c)タグメンテーション化二本鎖標的核酸断片をトランスポソーム複合体から遊離させることと、(d)任意選択的に、タグメンテーション化二本鎖標的核酸断片を伸長させることと、(e)第2及び第4のトランスポゾンを、二本鎖標的核酸断片又は伸長させたタグメンテーション化二本鎖標的核酸断片とライゲーションすることと、(f)タグメンテーション化二本鎖標的核酸断片を生成することと、(g)タグメンテーション化二本鎖標的核酸断片を増幅することと、を含む。
実施形態12は、二本鎖核酸ライブラリーを作製する方法であり、ライブラリー中の各断片は4つの異なるUMIを含み、方法は、(a)二本鎖標的核酸を含む試料を、(i)第1のトランスポソーム複合体であって、(1)第1のトランスポザーゼと、(2)(a)二本鎖標的核酸断片の第1の鎖上の第1のトランスポゾン及び(b)第2のトランスポゾンを含む、第1のフォーク型アダプターと、を含み、第1のトランスポゾンは、第1の3’末端トランスポゾン末端配列、第1のアダプター配列の第1のコピー、第1のUMIの第1のコピー、及び第2のアダプター配列の第1のコピーを含み、第2のトランスポゾンは、第1の3’末端トランスポゾン末端配列に完全に又は部分的に相補的である配列、第3のアダプター配列の第1のコピー、第2のUMIの第1のコピー、及び第4のアダプター配列を含み、更に、第1、第2、及び第3のアダプター配列の第1のコピーは一本鎖であり、第4のアダプター配列は二本鎖部分を含む、第1のトランスポソーム複合体、並びに、(i)第2のトランスポソーム複合体であって、(1)第2のトランスポザーゼと、(2)(a)二本鎖標的核酸断片の第2の鎖上の第3のトランスポゾン及び(b)第4のトランスポゾンを含む、第2のフォーク型アダプターと、を含み、第3のトランスポゾンは、第2の3’末端トランスポゾン末端配列、第5のアダプター配列の第1のコピー、第3のUMIの第1のコピー、及び第6のアダプター配列の第1のコピーを含み、第4のトランスポゾンは、第2の3’末端トランスポゾン末端配列に完全に又は部分的に相補的である配列、第7のアダプター配列の第1のコピー、第4のUMIの第1のコピー、及び第8のアダプター配列を含み、更に、第5、第6、及び第7のアダプター配列の第1のコピーは一本鎖であり、第8のアダプター配列は二本鎖部分を含む、第2のトランスポソーム複合体、に適用することと、(b)二本鎖標的核酸をフォーク型アダプターでタグメンテーションして、タグメンテーション化二本鎖標的核酸断片を生成することであって、各タグメンテーション化二本鎖標的核酸断片は、第1、第2、第3、第5、第6、及び第7アダプター配列の第1のコピー、第1、第2、第3、及び第4のUMIの第1のコピー、第6のアダプター配列、並びに第8のアダプター配列を含む、ことと、(c)タグメンテーション化二本鎖標的核酸断片をトランスポソーム複合体から遊離させることと、(d)任意選択的に、タグメンテーション化二本鎖標的核酸断片を伸長させることと、(e)第2及び第4のトランスポゾンを、二本鎖標的核酸断片又は伸長させたタグメンテーション化二本鎖標的核酸断片とライゲーションすることと、(f)タグメンテーション化二本鎖標的核酸断片を生成することと、(g)タグメンテーション化二本鎖標的核酸断片を増幅することと、を含む。
実施形態13は、第1、第2、第3、及び第4のUMIが相補的又は異なる配列であってもよい、実施形態6、7、11、又は12のいずれか1つに記載の方法である。
実施形態14は、二本鎖標的核酸が二本鎖DNAである、実施形態1~13のいずれか1つに記載の方法である。
実施形態15は、二本鎖標的核酸がctDNAである、実施形態1~13のいずれか1つに記載の方法である。
実施形態16は、二本鎖標的核酸がcfDNAである、実施形態1~13のいずれか1つに記載の方法である。
実施形態17は、二本鎖標的核酸がRNAである、実施形態1~13のいずれか1つに記載の方法である。
実施形態18は、二本鎖標的核酸がcDNAであるか、又はDNA:RNA二重鎖がRNAから生成される、実施形態1~13のいずれか1つに記載の方法である。
実施形態19は、第1のアダプター配列が5’第1リード配列決定アダプター配列である、実施形態1~18のいずれか1つに記載の方法である。
実施形態20は、第2のアダプター配列が、5’第2リード配列決定アダプター配列である、実施形態1~19のいずれか1つに記載の方法である。
実施形態21は、第1及び第2のアダプター配列が、5’第1リード及び5’第2リード配列決定アダプター配列である、実施形態1~20のいずれか1つに記載の方法である。
実施形態22は、5’第1リード及び5’第2リード配列決定アダプター配列が、固有プライマー結合部位を含む、実施形態1~21のいずれか1つに記載の方法である。
実施形態23は、第1のUMIが、タグメンテーション化二本鎖標的核酸断片の第1の鎖上にある、実施形態1、2、4~8、又は13~22のいずれか1つに記載の方法である。
実施形態24は、第1のUMIの第1のコピーがタグメンテーション化二本鎖標的核酸断片の第1の鎖上にあり、第1のUMIの第2のコピーが第2の鎖上にある、実施形態1、3、5~7、13~22のいずれか1つに記載の方法である。
実施形態25は、第1のUMIが、タグメンテーション化二本鎖標的核酸断片の第1の鎖上にあり、第2のUMIが、タグメンテーション化二本鎖標的核酸断片の第2の鎖上にある、実施形態1~7、13~22のいずれか1つに記載の方法である。
実施形態26は、第1、第2、第3、又は第4のトランスポゾンがビオチンタグを更に含む、実施形態1~25のいずれか1つに記載の方法である。
実施形態27は、第1、第2、第3、又は第4のトランスポゾンが、第1の固有プライマー結合配列を更に含む、実施形態1~26のいずれか1つに記載の方法である。
実施形態28は、第1、第2、第3、又は第4のトランスポゾンが、第2の固有プライマー結合配列を更に含む、実施形態27に記載の方法である。
実施形態29は、固有プライマー結合配列が、A2、A14、及び/又はB15を含む、実施形態27又は28に記載の方法である。
実施形態30は、ハイブリダイズさせる工程が、フォーク型アダプターを生成する、実施形態8~10又は14~22のいずれか1つに記載の方法である。
実施形態31は、二本鎖標的核酸断片の3’末端からトランスポゾンの5’末端まで伸長させることを更に含む、実施形態1~30のいずれか1つに記載の方法である。
実施形態32は、ライゲーション工程が、タグメンテーション化二本鎖標的核酸断片の3’末端又は伸長させたタグメンテーション化二本鎖標的核酸断片の3’末端を、第1、第2、又は第4のトランスポゾンの5’末端とライゲーションすることを含む、実施形態1~7又は11~31のいずれか1つに記載の方法である。
実施形態33は、伸長及び/又はライゲーション工程が、伸長ライゲーション混合物中で任意選択的に実施される、実施形態1~32のいずれか1つに記載の方法である。
実施形態34は、ポリヌクレオチドが、(a)ヘアピンUMI、(b)ヘアピンUMI及びユニバーサルハイブリダイズテール、(c)スプリントライゲーションアダプター、又は(d)3’鋳型スイッチオリゴヌクレオチドを含む3’アダプターを含む、実施形態8、15~22、26~33のいずれか1つに記載の方法である。
実施形態35は、ヘアピンUMIが、伸長工程及び/又はライゲーション工程中は安定であるが、増幅工程中は安定ではない、実施形態34に記載の方法である。
実施形態36は、ヘアピンUMIが3又は4塩基対ステムを含む、実施形態34又は35に記載の方法である。
実施形態37は、ユニバーサルハイブリダイズテールが、任意のDNAヌクレオチドに結合できるヌクレオチドを含む、実施形態34~36のいずれか1つに記載の方法である。
実施形態38は、ライゲーション工程が、タグメンテーション化二本鎖標的核酸断片の第2の鎖の3’末端をユニバーサルハイブリダイズテールの5’末端とライゲーションすることを含む、実施形態34~37のいずれか1つに記載の方法である。
実施形態39は、(a)ポリヌクレオチドが、ヘアピンUMIを含む3’アダプターを含み、(b)伸長工程が、タグメンテーション化二本鎖標的核酸断片の第2の鎖の3’末端からヘアピンUMIの5’末端まで伸長させることを含む、実施形態34に記載の方法である。
実施形態40は、ライゲーション工程が、伸長させたタグメンテーション化二本鎖標的核酸断片の第2の鎖の3’末端をヘアピンUMIの5’末端とライゲーションすることを含む、実施形態39に記載の方法である。
実施形態41は、(a)ポリヌクレオチドが、スプリントライゲーションアダプターを含み、(b)伸長工程が、タグメンテーション化二本鎖標的核酸断片の第2の鎖の3’末端からスプリントライゲーションアダプターの5’末端まで伸長させることを含む、実施形態34に記載の方法である。
実施形態42は、伸長工程が、9塩基を伸長させることを含む、実施形態41に記載の方法である。
実施形態43は、ライゲーション工程が、伸長させたタグメンテーション化二本鎖標的核酸断片の第2の鎖の3’末端をスプリントライゲーションアダプターの第1の鎖の5’末端とライゲーションすることを含む、実施形態41又は42に記載の方法である。
実施形態44は、(a)ポリヌクレオチドが、鋳型スイッチオリゴヌクレオチドを含み、(b)伸長工程が、タグメンテーション化二本鎖標的核酸断片の第1の鎖をコピーすることによって、タグメンテーション化二本鎖標的核酸断片の第2の鎖の3’末端から鋳型スイッチオリゴヌクレオチド内の接合部まで伸長させることと、(c)鋳型を第1の鎖から3’鋳型スイッチオリゴヌクレオチドの不対領域に切り替えることと、(d)3’鋳型スイッチオリゴヌクレオチドの不対領域を接合部から3’鋳型スイッチオリゴヌクレオチドの不対領域の5’末端にコピーすることと、を含む、実施形態34のいずれか1つに記載の方法である。
実施形態45は、伸長、切り替え、及びコピーすることが、DNA指向性鋳型切り替えが可能なポリメラーゼによって行われる、実施形態44に記載の方法である。
実施形態46は、DNA指向性鋳型切り替えが可能なポリメラーゼが、MMLV逆転写酵素を含む、実施形態44又は45に記載の方法である。
実施形態47は、ライゲーション工程が、タグメンテーション化二本鎖標的核酸断片の3’末端を、第1、第2、又は第4のトランスポゾンの5’末端とライゲーションすることを含む、実施形態1~33のいずれか1つに記載の方法である。
実施形態48は、増幅工程の後に、あるサイズ範囲内の増幅された核酸断片を選択することを更に含む、実施形態1~33又は47のいずれか1つに記載の方法である。
実施形態49は、増幅工程が、ライブラリーを固体支持体に付着させるために、タグメンテーション化二本鎖標的核酸断片の一端又は両端にオリゴヌクレオチドを付加することを含む、実施形態1~48のいずれか1つに記載の方法である。
実施形態50は、増幅工程が、少なくとも第1リード配列決定オリゴヌクレオチド及び/又は第2リード配列決定オリゴヌクレオチドを添加することを含む、実施形態1~49のいずれか1つに記載の方法である。
実施形態51は、増幅工程が、少なくともP5オリゴヌクレオチド及びP7オリゴヌクレオチドを添加することを含む、実施形態1~50のいずれか1つに記載の方法である。
実施形態52は、増幅工程が、少なくとも複数のi5オリゴヌクレオチド及び複数のi7オリゴヌクレオチドを添加することを含む、実施形態1~51のいずれか1つに記載の方法である。
実施形態53は、トランスポソーム複合体、第1のトランスポソーム複合体及び/又は第2のトランスポソーム複合体が固体支持体上にある、実施形態1~52のいずれか1つに記載の方法である。
実施形態54は、トランスポソーム複合体、第1のトランスポソーム複合体及び/又は第2のトランスポソーム複合体が溶液中にある、実施形態1~53のいずれか1つに記載の方法である。
実施形態55は、実施形態1~54のいずれか1つに記載の方法によって生成された二本鎖核酸ライブラリーを配列決定する方法であり、UMIを配列決定して、DNA配列決定における感度を増加させる。
実施形態56は、類似の融解温度を有する配列決定プライマーを結合させることを含む、実施形態55に記載の方法である。
実施形態57は、固有プライマー結合配列に完全に又は部分的に相補的である配列を含む配列決定プライマーを結合させることを含む、実施形態55又は56に記載の方法である。
実施形態58は、少なくともA2配列を有するプライマーを配列決定することを含む、実施形態55~57のいずれか1つに記載の方法である。
実施形態59は、少なくともA14配列及びB15配列を有するプライマーを配列決定することを含む、実施形態55~57のいずれか1つに記載の方法である。
実施形態60は、少なくとも架橋プライマーを有するプライマーを配列決定することを含む、実施形態55~59のいずれか1つに記載の方法である。
実施形態61は、暗サイクルを更に含み、データが配列決定法の一部について記録されていない、実施形態55~60のいずれか1つに記載の方法である。
実施形態62は、記録されていないデータが、3’トランスポゾン末端配列に関連する配列データである、実施形態55~60のいずれか1つに記載の方法である。
実施形態63は、方法が暗サイクルの必要性をなくす、実施形態55~60のいずれか1つに記載の方法である。
実施形態64は、伸長工程が、UMI又は第1のUMIをコピーして二重鎖UMIを生成するポリメラーゼを含む、実施形態1又は9に記載の方法である。
実施形態65は、(a)トランスポザーゼと、(b)3’トランスポゾン末端配列及び5’アダプター配列を含む第1のトランスポゾンと、(c)第1の3’末端トランスポゾン末端配列に完全に又は部分的に相補的である配列を含む第2のトランスポゾンと、を含む、トランスポソーム複合体である。
実施形態66は、第1のトランスポゾンの5’アダプター配列が、A14配列(配列番号4)、A2配列(配列番号7)、及び/又はB15配列(配列番号5)を含む、実施形態65に記載のトランスポソーム複合体である。
実施形態67は、第1のトランスポゾンがUMI配列を更に含む、実施形態65又は66に記載のトランスポソーム複合体である。
実施形態68は、第1又は第2のトランスポゾンがA14-ME(配列番号1)を含む、実施形態65~67のいずれか1つに記載のトランスポソーム複合体である。
実施形態69は、第1又は第2のトランスポゾンがB15-ME(配列番号2)を含む、実施形態65~67のいずれか1つに記載のトランスポソーム複合体である。
実施形態70は、第1のトランスポゾンの3’トランスポゾン末端配列が、ME(配列番号6)又はME’(配列番号3)を含む、実施形態65~67のいずれか1つに記載のトランスポソーム複合体である。
実施形態71は、第2のトランスポゾンの3’トランスポゾン末端配列が、ME(配列番号6)又はME’(配列番号3)を含む、実施形態65~67のいずれか1つに記載のトランスポソーム複合体である。
実施形態72は、第2のトランスポゾンが3’アダプター配列を更に含み、第2のトランスポゾンの3’アダプター配列が、第1のトランスポゾンの5’アダプター配列に部分的に又は完全に相補的である、実施形態67に記載のトランスポソーム複合体である。
実施形態73は、第2のトランスポゾンが3’アダプター配列を更に含み、第2のトランスポゾンの3’アダプター配列のどの部分も第1のトランスポゾンの5’アダプター配列に相補的ではない、実施形態67に記載のトランスポソーム複合体である。
実施形態74は、第2のトランスポゾンの3’アダプター配列が、A14配列(配列番号4)、A2配列(配列番号7)、B15配列(配列番号5)、X配列、Y’配列、A配列、及び/又はB配列を含む、実施形態72又は73に記載のトランスポソーム複合体である。
実施形態75は、第2のトランスポゾンが、第1のトランスポゾンのUMI配列に相補的である配列を更に含む、実施形態72又は74に記載のトランスポソーム複合体である。
実施形態76は、第2のトランスポゾンがUMIを更に含み、第2のトランスポゾンのUMIが、第1のトランスポゾンのUMIとは異なる配列を含む、実施形態73又は74のトランスポソーム複合体である。
実施形態77は、B15配列又はA14配列に相補的なオリゴヌクレオチドを更に含む、実施形態75又は76に記載のトランスポソーム複合体である。
実施形態78は、(a)A14配列に隣接するAアダプター配列、(b)B15配列に隣接するBアダプター配列、(c)ME配列に隣接するXアダプター配列、及び/又は(d)ME’配列に隣接するY’アダプター配列を更に含む、実施形態76に記載のトランスポソーム複合体である。
実施形態79は、トランスポソーム複合体が、第1又は第2のトランスポゾンを介して固体支持体に固定されている、実施形態65~78のいずれか1つに記載のトランスポソーム複合体である。
実施形態80は、トランスポソーム複合体が、相補的オリゴヌクレオチドを介して固体支持体に固定されている、実施形態77に記載のトランスポソーム複合体である。
実施形態81は、固体支持体がビーズである、実施形態79又は80に記載のトランスポソーム複合体である。
実施形態82は、実施形態65~81のいずれか1つに記載のトランスポソーム複合体を含むキットである。
実施形態83は、実施形態65~81のいずれか1つに記載のトランスポソーム複合体を生成するためのキットである。
追加の目的及び利点は、以下の説明において部分的に記載され、一部は説明から理解されるか、又は実践によって習得され得る。目的及び利点は、添付の特許請求の範囲において特に指摘される要素及び組み合わせによって実現及び達成されるであろう。
前述の一般的な説明及び以下の詳細な説明はいずれも例示的かつ説明的のみであり、特許請求の範囲を限定するものではないことを理解されたい。
本明細書に組み込まれ、本明細書の一部を構成する添付図面は、1つの(いくつかの)実施形態を図解し、明細書とともに本明細書に記載される原理を説明する役割を果たす。
配列の説明
表1は、本明細書中で参照される特定の配列のリストを提供する。全ての配列は、タンパク質及び核酸配列について、それぞれ、N末端からC末端又は5’から3’のいずれかで示されている。表1における特定の配列は、配列のライブラリー由来の例示的な配列を表す。例えば、以下のセクションII.Aで説明されるように、「UMI」は、UMI配列のライブラリーを表す。別の例では、ME配列は、配列番号6の例示的なMEと比較した場合、配列変異を含有し得る。同様に、A14-ME配列は、配列番号1の例示的なA14-MEと比較した場合、配列変異を含有し得る。配列変異は、例えば、核酸突然変異、核酸置換、核酸欠失、核酸付加、核酸挿入、配列切断、より長い配列、より短い配列、UMI配列、プライマー配列、インデックスタグ配列、捕捉配列、バーコード配列、開裂配列、アンカー配列、ユニバーサル配列、スペーサー配列、トランスポゾン末端配列、配列決定関連配列、及びそれらの任意の組み合わせを含み得る。別の例では、配列決定に関連するプライマー及びアダプターは、プライマー及びアダプターのライブラリーを指し得る。i5及びi7配列のライブラリーは、Illumina Adapter Sequences Document#1000000002694 v15によって提供され、その全体が参照により本明細書に組み込まれる。配列番号10及び11などの例示的なカスタムプライマーにおいて、i5及びi7部分は、Illumina Adapter Sequences Document#1000000002694 v15によって提供されるような配列変異を含有し得る。
表1は、本明細書中で参照される特定の配列のリストを提供する。全ての配列は、タンパク質及び核酸配列について、それぞれ、N末端からC末端又は5’から3’のいずれかで示されている。表1における特定の配列は、配列のライブラリー由来の例示的な配列を表す。例えば、以下のセクションII.Aで説明されるように、「UMI」は、UMI配列のライブラリーを表す。別の例では、ME配列は、配列番号6の例示的なMEと比較した場合、配列変異を含有し得る。同様に、A14-ME配列は、配列番号1の例示的なA14-MEと比較した場合、配列変異を含有し得る。配列変異は、例えば、核酸突然変異、核酸置換、核酸欠失、核酸付加、核酸挿入、配列切断、より長い配列、より短い配列、UMI配列、プライマー配列、インデックスタグ配列、捕捉配列、バーコード配列、開裂配列、アンカー配列、ユニバーサル配列、スペーサー配列、トランスポゾン末端配列、配列決定関連配列、及びそれらの任意の組み合わせを含み得る。別の例では、配列決定に関連するプライマー及びアダプターは、プライマー及びアダプターのライブラリーを指し得る。i5及びi7配列のライブラリーは、Illumina Adapter Sequences Document#1000000002694 v15によって提供され、その全体が参照により本明細書に組み込まれる。配列番号10及び11などの例示的なカスタムプライマーにおいて、i5及びi7部分は、Illumina Adapter Sequences Document#1000000002694 v15によって提供されるような配列変異を含有し得る。
I.定義
本明細書で使用される「ハイブリダイゼーション配列」又は「HYB」は、相補ハイブリダイゼーション配列にハイブリダイズできる配列を指す。1つのライブラリー産物中のHYBの別のライブラリー産物中のHYB’へのハイブリダイゼーションは、ハイブリダイゼーション付加物をもたらすことができ、このとき、2つのライブラリー産物は、HYB/HYB’のハイブリダイゼーションを介して互いにアニールする。
本明細書で使用される「ハイブリダイゼーション配列」又は「HYB」は、相補ハイブリダイゼーション配列にハイブリダイズできる配列を指す。1つのライブラリー産物中のHYBの別のライブラリー産物中のHYB’へのハイブリダイゼーションは、ハイブリダイゼーション付加物をもたらすことができ、このとき、2つのライブラリー産物は、HYB/HYB’のハイブリダイゼーションを介して互いにアニールする。
本明細書で使用される「Hyb2Y」又は「Hyb2Yワークフロー」は、フォーク型アダプター構造(Yアダプター構造としても知られる)を作製するためのHYB/HYB’の使用を指す。全てではないがいくつかの場合において、このプロセスはまた、1つのオリゴヌクレオチドの別のオリゴヌクレオチドでの置換を包含する。
ビーズ連結トランスポソーム(BLT)の文脈において、「Hyb2Y」、すなわち、HYB/HYB’を使用してフォーク型アダプター構造を生成することは、Tn5トランスポソーム生成物複合体から非転移鎖を除去し、それを、置換するオリゴヌクレオチドに対する追加の配列を含有し得る別のオリゴヌクレオチドで置換することをもたらす。そうすることで、使用されているアダプターの新しいフォーク型構造を作成するか、又は既存のフォーク型構造を維持することができる。
本明細書で使用される「インサート配列」は、ポリヌクレオチドに含まれる標的核酸の領域を指す。ポリヌクレオチドは、複数のインサート配列を含み得る。
本明細書で使用される「スタックリード」は、単一のポリヌクレオチドから生成される複数のインサート配列の配列決定リードに関する。これらの配列決定リードは連続的であり得る。例えば、2つ以上のインサート配列及び2つ以上のプライマー配列を含むポリヌクレオチドを用いて、スタックリードを生成することができる。本明細書で使用される「スタックリードライブラリー」は、スタックリードを生成するために使用され得る複数のインサート配列を含むポリヌクレオチドのライブラリーを指す。
本明細書で使用される「合成による配列決定」又は「SBS」は、リードプライマーの結合を改善するためにポリヌクレオチドに組み込まれる配列を指す。ポリヌクレオチドがタグメンテーションによって産生されるライブラリー産物から作製される実施形態では、SBSはモザイク末端配列であってもよく、SBS’はME及びME’などのモザイク末端配列の相補体であってもよい。ライブラリー産物がTruSeq(商標)法(Illumina)を使用して産生される場合、SBS及びSBS’配列もアダプターに含まれ得る。
II.トランスポゾンベースの技術を用いたUMIライブラリーの調製
固有分子識別子(UMI)は、配列決定エラーの同定及び補正、並びにPCR複製のための二本鎖核酸ライブラリーに組み込まれる核酸配列である。UMIは、多くのDNA分子が一緒に配列決定される場合に、1つのソースDNA分子を別のものから区別するために使用される。UMIは、配列決定及びPCRのアーチファクト、並びにホルマリン固定、パラフィン包埋、FFPE組織において典型的に見出されるものなどの鎖特異的DNA損傷由来のエラーを同定する際に役立ち得る。UMIは、PCR増幅及び配列決定の間に生じるエラー由来のノイズの低減を可能にし、1%未満の対立遺伝子頻度で一塩基バリアント(SNV)(例えば、無細胞DNA、cfDNA中)の検出を可能にする。
固有分子識別子(UMI)は、配列決定エラーの同定及び補正、並びにPCR複製のための二本鎖核酸ライブラリーに組み込まれる核酸配列である。UMIは、多くのDNA分子が一緒に配列決定される場合に、1つのソースDNA分子を別のものから区別するために使用される。UMIは、配列決定及びPCRのアーチファクト、並びにホルマリン固定、パラフィン包埋、FFPE組織において典型的に見出されるものなどの鎖特異的DNA損傷由来のエラーを同定する際に役立ち得る。UMIは、PCR増幅及び配列決定の間に生じるエラー由来のノイズの低減を可能にし、1%未満の対立遺伝子頻度で一塩基バリアント(SNV)(例えば、無細胞DNA、cfDNA中)の検出を可能にする。
本明細書に記載の材料及び方法をトランスポゾンベースの技術と共に使用して、UMIを二本鎖核酸ライブラリーに組み込むことができる。本明細書中で使用される場合、「UMIライブラリー」は、各断片が少なくとも1つのUMIを含む二本鎖核酸断片のライブラリーである。本明細書に記載される特定の実施形態では、各断片は、1つ、2つ、又はそれ以上のUMIを含み得る。
トランスポゾンベースの技術と組み合わされる配列決定ライブラリーを生成するための方法が本明細書に開示される。いくつかの実施形態では、トランスポゾンベースの技術は、断片の末端において固有のアダプター配列でタグ化した二本鎖核酸断片の集団を生成するための、Illumina(登録商標)による一連のDNA Prep製品に対するワークフローを含む。転位反応において使用するための種々のHYB又はHYB’配列が開示される。いくつかの実施形態では、この方法は、溶液混合物中で実行される。いくつかの実施形態では、BLTなどの固体支持体が使用される。
多くの実施形態では、UMIライブラリーを調製する方法は、二本鎖標的核酸を有する試料を1つ、2つ、又はそれ以上のトランスポソーム複合体に適用する第1の工程を含む。
いくつかの実施形態では、第1の工程の後、UMIライブラリーを調製する方法は、(1)核酸をタグメンテーションして、UMI及びアダプター配列を含む核酸断片を生成することと、(2)トランスポソーム複合体から核酸断片を遊離させることと、(3)トランスポゾン又は伸長させたトランスポゾンを核酸断片とライゲーションすることと、(4)UMIを含む核酸断片を生成することと、を更に含む。いくつかの実施形態では、この方法は、二本鎖標的核酸断片が伸長される、遊離工程の後の任意選択の伸長工程を更に含む。この伸長工程は、ギャップ充填としても知られている。
いくつかの実施形態では、第1の工程の後、UMIライブラリーを調製する方法は、(1)核酸をタグメンテーションして、アダプター配列を含む核酸断片を生成することと、(2)トランスポソーム複合体から核酸断片を遊離させることと、(3)UMIの組み込みのために、アダプター配列及びUMIを含むポリヌクレオチドをハイブリダイズさせることと、を更に含む。ポリヌクレオチドは、3’末端トランスポゾン配列に完全に又は部分的に相補的である配列を更に含む。この方法は、二本鎖標的核酸断片の第2の鎖を伸長させる任意選択の工程を更に含み得る。この方法は、ポリヌクレオチド又は伸長させたポリヌクレオチドをライゲーションする任意選択の工程を更に含み得る。いくつかの実施形態では、方法は、UMIを有する二本鎖標的核酸断片を生成することを更に含み、このときUMIは、挿入DNAの3’末端に直接隣接して位置する。
いくつかの実施形態では、第1の工程の後、UMIライブラリーを調製する方法は、(1)二本鎖標的核酸の第1の鎖をトランスポゾンでタグメンテーションして、第1のアダプター配列を含む二本鎖標的核酸断片を生成することと、(2)トランスポソーム複合体から二本鎖標的核酸断片を遊離させることと、(3)UMI及び第2のアダプター配列を含む第1のポリヌクレオチドをハイブリダイズさせることと、を更に含む。いくつかの実施形態では、この方法は、(1)第1のポリヌクレオチドに相補的な領域を含む第2のポリヌクレオチドを付加して二本鎖アダプターを生成する、(2)二本鎖標的核酸断片の第2の鎖を伸長する、及び/又は(3)任意選択的に、二本鎖アダプターを二本鎖標的核酸断片とライゲーションするための、任意選択の工程を更に含み得る。
いくつかの実施形態では、第1の工程の後に、UMIライブラリーを調製する方法は、(1)二本鎖標的核酸をフォーク型アダプタートランスポゾンでタグメンテーションして、第1のアダプター配列の第1及び第2のコピー、第1のUMI、第2のアダプター配列の第1及び第2のコピー、並びに第2のUMIを含む二本鎖標的核酸断片を生成することと、(2)トランスポソーム複合体から二本鎖標的核酸断片を遊離させることと、(3)フォーク型アダプタートランスポゾンを二本鎖標的核酸断片とライゲーションすることと、を更に含む。いくつかの実施形態では、遊離工程の後、二本鎖標的核酸断片を伸長し、この場合、続くライゲーション工程は、伸長させたフォーク型アダプタートランスポゾンを二本鎖標的核酸断片とライゲーションする。
多くの実施形態では、UMIライブラリーが作製された後、方法は、UMIライブラリーを増幅することを更に含む。
いくつかの実施形態では、UMIは、トランスポゾンアダプターを使用してタグメンテーション中に組み込まれる。いくつかの実施形態では、UMIは、ポリヌクレオチドアダプターを使用してタグメンテーション後に組み込まれる。いくつかの実施形態では、UMIは、ポリヌクレオチドアダプターを伸長及び/又はライゲーションすることによって組み込まれる。いくつかの実施形態では、UMIは、ライブラリー増幅の前に組み込まれる。
これらの工程のそれぞれの態様は、以下のセクションで説明される。
A.固有分子識別子(UMI)
固有分子識別子(UMI)は、個々の核酸分子を互いに区別するために使用され得る核酸分子に適用されるか、又は同定されるヌクレオチドの配列である。UMIは、リード配列が1つのソース核酸分子又は別のものであるかどうかを決定するために、それらが関連する核酸分子とともに配列決定され得る。「UMI」という用語は、ポリヌクレオチドの配列情報及び物理的ポリヌクレオチド自体の両方を指すために本明細書で使用され得る。UMIは、1つの試料のリードを他の試料のリードから区別するために一般的に使用されるバーコードに類似しているが、UMIは、代わりに、個々の試料からの多くの断片が一緒に配列決定される場合、核酸鋳型断片を別の断片から区別するために使用される。UMIは、参照により本明細書に組み込まれる、国際公開第2019/108972号及び国際公開第2018/136248号に記載されるように、多くの方式で定義することができる。
固有分子識別子(UMI)は、個々の核酸分子を互いに区別するために使用され得る核酸分子に適用されるか、又は同定されるヌクレオチドの配列である。UMIは、リード配列が1つのソース核酸分子又は別のものであるかどうかを決定するために、それらが関連する核酸分子とともに配列決定され得る。「UMI」という用語は、ポリヌクレオチドの配列情報及び物理的ポリヌクレオチド自体の両方を指すために本明細書で使用され得る。UMIは、1つの試料のリードを他の試料のリードから区別するために一般的に使用されるバーコードに類似しているが、UMIは、代わりに、個々の試料からの多くの断片が一緒に配列決定される場合、核酸鋳型断片を別の断片から区別するために使用される。UMIは、参照により本明細書に組み込まれる、国際公開第2019/108972号及び国際公開第2018/136248号に記載されるように、多くの方式で定義することができる。
UMIは、一本鎖又は二本鎖であってもよく、少なくとも5塩基、少なくとも6塩基、少なくとも7塩基、少なくとも8塩基、又はそれ以上であってもよい。特定の実施形態では、UMIは、5~8塩基、5~10塩基、5~15塩基、5~25塩基、8~10塩基、8~12塩基、8~15塩基、又は8~25塩基などの長さである。更に、特定の実施形態では、UMIは、30塩基以下、25塩基以下、20塩基以下、15塩基以下の長さである。本明細書で提供されるUMI配列の長さは、配列の固有の/識別可能な部分を指してもよく、配列決定プライマーとして機能し得、異なる識別子配列を有する複数のUMI間で共通である隣接する共通又はアダプター配列(例えば、p5、p7)を除外し得ることを理解すべきである。
UMIは、参照により本明細書に組み込まれる、国際公開第2018/136248号に記載されるように、多くの方式で定義することができる。UMIは、アダプター中に挿入されるか、そうでなければ配列決定されるソースDNA分子中に組み込まれる、ランダム、擬似ランダム若しくは部分的ランダム、又は非ランダムヌクレオチド配列であってもよい。いくつかの実施形態では、UMIは固有であり、各UMIは、試料中に存在する任意の所与のソースDNA分子について固有の識別を提供することができる。本明細書に記載されるように、トランスポゾンアダプター及びポリヌクレオチドアダプターを用いて、配列決定される標的核酸にUMIを組み込むことができ、個々の配列決定された分子はそれぞれ、それを他の全ての断片から区別するのに役立つUMIを有する。いくつかの実施形態では、多数の異なる物理的UMIを用いて、試料中のDNA断片を一意に同定することができる。いくつかの実施形態では、UMIは、それぞれ及び全てのソースDNA分子についての独自性を確実にするのに十分な長さである。
いくつかの実施形態では、UMIのライブラリーは、非ランダム配列を含む。いくつかの実施形態では、非ランダムUMI(nonrandom UMI、nrUMI)は、特定の実験又は適用のために事前定義される。ある特定の実施形態では、規則を使用して、セットの配列を生成するか、又はセットから試料を選択してnrUMIを得る。例えば、セットの配列は、配列が特定のパターンを有するように生成され得る。いくつかの実施形態では、各配列は、特定の数(例えば、2、3、又は4)のヌクレオチドだけ、セット中の他の全ての配列と異なる。すなわち、nrUMI配列は、特定の数より少ないヌクレオチドを置き換えることによって、任意の他の利用可能なnrUMI配列に変換され得ない。いくつかの実装形態では、配列決定プロセスで使用されるUMIのセットは、特定の配列長を与えられた全ての可能なUMIよりも少ないUMIを含む。例えば、6個のヌクレオチドを有するnrUMIsのセットは、合計4A6=4096個の可能な異なる配列の代わりに、合計96個の異なる配列を含み得る。いくつかの実施形態では、UMIのライブラリーは、120個の非ランダム配列を含む。
nrUMIが全ての可能な異なる配列よりも少ない配列を有するセットから選択されるいくつかの実施において、nrUMIの数は、ソースDNA分子の数よりも少なく、場合によっては著しく少ない。このような実施では、nrUMI情報を、仮想UMI、参照配列上のリード位置、及び/又はリードの配列情報などの他の情報と組み合わせて、同じソースDNA分子に由来する配列リードを同定することができる。
「仮想固有分子インデックス」又は「仮想UMI」は、ソースDNA分子中の固有サブ配列である。いくつかの実施形態では、仮想UMIは、ソースDNA分子の末端又はその付近に位置する。1つ以上のこのような固有の末端位置は、単独で、又は他の情報と組み合わせて、ソースDNA分子を一意に同定できる。異なるソースDNA分子の数及び仮想UMI中のヌクレオチドの数に応じて、1つ以上の仮想UMIは、試料中のソースDNA分子を一意に同定できる。場合によっては、ソースDNA分子を同定するために、2つの仮想固有分子識別子の組み合わせが必要とされる。このような組み合わせは極めてまれであり、おそらく試料中に1つだけ見出すことができる。いくつかの場合において、1つ以上の物理的UMIと組み合わせた1つ以上の仮想UMIは共に、ソースDNA分子を一意に同定することができる。いくつかの実施形態では、仮想UMIは、Nextera断片化プロセスに由来する断片化末端ポイントに存在する。
いくつかの実施形態では、rUMIsのライブラリーは、1つ以上の配列長を与えられた全ての可能な異なるオリゴヌクレオチド配列からなるUMIのセットから、置き換えあり又はなしで、ランダム試料として選択されるランダムUMI(random UMI、rUMI)を含み得る。例えば、UMIのセット中の各UMIがn個のヌクレオチドを有する場合、セットは、互いに異なる配列を有する4An個のUMIを含む。4An個のUMIから選択されたランダム試料は、rUMIを構成する。
いくつかの実施形態では、UMIのライブラリーは、擬似ランダム又は部分的にランダムであり、nrUMIとrUMIとの混合物を含み得る。
多くの実施形態では、UMIは、当該核酸のタグメンテーション中又は後にオリゴヌクレオチド又はポリヌクレオチドを使用して標的二本鎖核酸に付加される。多くの実施形態では、UMIは、ライブラリー増幅工程の前に標的二本鎖核酸に付加される。
いくつかの実施形態では、TruSight(登録商標)Oncologyワークフロー(Illuminaカタログ番号20024586)のUMI試薬が、本開示に従って利用され得る。
いくつかの実施形態では、UMIライブラリー中の二本鎖核酸分子はそれぞれ、1つの固有UMI配列、又は単一のUMIを含む。多くの実施形態では、UMIは挿入DNAのいずれかの側に位置してもよい。いくつかの実施形態では、アダプター配列又は他のヌクレオチド配列は、UMIと挿入DNAとの間に存在してもよい。
いくつかの実施形態では、UMIライブラリーは二重鎖UMIを含み、これは単一UMIの使用と比較してエラーの検出限界を低下させる可能性がある。二重鎖UMIは、当業者が、配列決定反応において生じ得るエラーにもかかわらず、プラス鎖をそのマイナス鎖と対合させることを可能にする。このような配列決定ミスマッチは、配列決定の間に同定され、核酸断片の配列は、ミスマッチを有するにもかかわらず、なお正確に再構成され得る。いくつかの実施形態では、二重鎖UMIを含むUMIライブラリーを作製する方法は、以下のセクションII.Cで詳細に論じるように、フォーク型アダプターを含む。いくつかの実施形態では、フォーク型アダプターはBLTフォークアダプタである。
いくつかの実施形態では、UMIライブラリー中の各二本鎖核酸断片は、2つ、3つ、又は4つのUMI配列を含む。UMI配列は、互いに相補的である配列を有してもよく、又はそれぞれ異なる配列を有してもよい。
いくつかの実施形態では、アダプター配列又は他のヌクレオチド配列は、各UMIと挿入DNAとの間に存在してもよい。
いくつかの実施形態では、UMIは、挿入DNAの5’に位置する。いくつかの実施形態では、UMIは、挿入DNAの3’に位置する。いくつかの実施形態では、1つ以上のアダプター配列を表す核酸の配列は、UMIと挿入DNAとの間に位置してもよい。いくつかの実施形態では、UMIは、アダプター配列とトランスポゾン末端配列との間に位置する。
多くの実施形態では、UMIは、二本鎖標的核酸断片の第1の鎖、第2の鎖、又は両方の鎖上にあってもよい。いくつかの実施形態では、UMIは、第1の鎖上にある。いくつかの実施形態では、UMIの第1のコピーは二本鎖標的核酸断片の第1の鎖上にあり、UMIの第2のコピーは第2の鎖上にある。いくつかの実施形態では、第1のUMIは第1の鎖上にあり、第2のUMIは第2の鎖上にある。
1.インラインUMI
UMIは、二本鎖核酸分子上のいずれに位置してもよい。多くの実施形態では、二本鎖核酸分子上のUMIの位置は様々である。いくつかの実施形態では、UMIは、挿入DNAに直接隣接して位置し、すなわち、UMIは「インラインUMI」である。いくつかの実施形態では、インラインUMIは、挿入DNAの3’に隣接する。いくつかの実施形態では、インラインUMIは、挿入DNAの5’に隣接する。現在のBLT法は、標的インサートに隣接するMEを含有するため、IlluminaライゲーションアダプターのUMIとの使用を排除する。UMIは、二本鎖核酸中のPCR複製物の除去及び低頻度変異体の検出に有用であるが、UDIは、ライブラリー配列決定及び逆多重化におけるインデックスホッピングに起因する試料の不正確なアサインメントを軽減するのに有用である。UDIは、固有のi5及びi7インデックス配列であり、両方の末端がUDIを含むように、標的核酸の末端に付加される。UDIは、IlluminaのNovaSeq 6000システムなどのパターン化されたフローセルと共に使用される(例えば、国際公開第2018/204423号、同第2018/208699号、同第201/9055715号、及び同第2016/176091号参照、それらは、参照によりそれらの全体が本明細書に組み込まれる)。当業者は、インラインUMIが、UMIライブラリーと、UDIを利用する標準的な下流ライブラリー調製物、例えば、IlluminaのTruSeq(商標)及びAmpliSeq(商標)ワークフローにおける試料多重化PCR及び配列決定試薬レシピとの適合性を可能にすることを理解するであろう。いくつかの実施形態では、インラインUMIと共に使用される配列決定法は、カスタムプライマー又はカスタムリードを必要としない。
UMIは、二本鎖核酸分子上のいずれに位置してもよい。多くの実施形態では、二本鎖核酸分子上のUMIの位置は様々である。いくつかの実施形態では、UMIは、挿入DNAに直接隣接して位置し、すなわち、UMIは「インラインUMI」である。いくつかの実施形態では、インラインUMIは、挿入DNAの3’に隣接する。いくつかの実施形態では、インラインUMIは、挿入DNAの5’に隣接する。現在のBLT法は、標的インサートに隣接するMEを含有するため、IlluminaライゲーションアダプターのUMIとの使用を排除する。UMIは、二本鎖核酸中のPCR複製物の除去及び低頻度変異体の検出に有用であるが、UDIは、ライブラリー配列決定及び逆多重化におけるインデックスホッピングに起因する試料の不正確なアサインメントを軽減するのに有用である。UDIは、固有のi5及びi7インデックス配列であり、両方の末端がUDIを含むように、標的核酸の末端に付加される。UDIは、IlluminaのNovaSeq 6000システムなどのパターン化されたフローセルと共に使用される(例えば、国際公開第2018/204423号、同第2018/208699号、同第201/9055715号、及び同第2016/176091号参照、それらは、参照によりそれらの全体が本明細書に組み込まれる)。当業者は、インラインUMIが、UMIライブラリーと、UDIを利用する標準的な下流ライブラリー調製物、例えば、IlluminaのTruSeq(商標)及びAmpliSeq(商標)ワークフローにおける試料多重化PCR及び配列決定試薬レシピとの適合性を可能にすることを理解するであろう。いくつかの実施形態では、インラインUMIと共に使用される配列決定法は、カスタムプライマー又はカスタムリードを必要としない。
いくつかの実施形態では、標準的な配列決定法を用いて、インラインUMIを有するUMIライブラリーを配列決定する。これらの実施形態では、UMIは、挿入核酸の3’末端に隣接する(図20)。したがって、各UMI及び挿入核酸配列は、それらの間のME配列を配列決定する必要なく、リード2を使用して捕捉される。これらの実施形態では、配列決定法は、暗サイクルを含まない。暗サイクルは、以下のセクションIII.Aで説明される。
いくつかの実施形態では、「インラインUMI」は、挿入DNAとアダプター配列との間に位置する。いくつかの実施形態では、アダプター配列は、第2のアダプター配列である。
B.トランスポソーム複合体
一般に、本発明のトランスポゾン複合体は、1つ以上の目的とする核酸配列への標的化を媒介する1つ以上の要素と共に、トランスポザーゼ並びに第1及び第2のトランスポゾンを含む。
一般に、本発明のトランスポゾン複合体は、1つ以上の目的とする核酸配列への標的化を媒介する1つ以上の要素と共に、トランスポザーゼ並びに第1及び第2のトランスポゾンを含む。
本明細書で使用されるとき、「トランスポソーム複合体」は、少なくとも1つのトランスポザーゼ(又は本明細書に記載の他の酵素)及びトランスポゾン認識配列から構成される。いくつかのそのようなシステムでは、トランスポザーゼは、転移反応を触媒することができる機能的複合体を形成するために、トランスポゾン認識配列に結合する。いくつかの態様では、トランスポゾン認識配列は、二本鎖トランスポゾン末端配列である。トランスポザーゼは、標的核酸内のトランスポザーゼ認識部位に結合し、トランスポゾン認識配列を標的核酸に挿入する。いくつかのそのような挿入事象では、トランスポゾン認識配列(又は末端配列)の1つの鎖が標的核酸に転写され、開裂事象が生じる。例示的な転位手順及びシステムは、トランスポザーゼでの使用に容易に適合され得る。
いくつかの実施形態では、この方法は、1つ、2つ、又はそれ以上のトランスポソーム複合体を含む。各トランスポソーム複合体は、同じ方法で使用することもできる他のトランスポソーム複合体とは異なるトランスポザーゼ及びトランスポゾンを含むことができる。
いくつかの実施形態では、トランスポソーム複合体は、トランスポザーゼと、1つ、2つ、又はそれ以上のトランスポゾンとを含む。
いくつかの実施形態では、トランスポソーム複合体は、トランスポザーゼと、3’トランスポゾン末端配列及び5’アダプター配列を含む第1のトランスポゾンと、を含む。第1のトランスポゾンの5’アダプター配列は、A14配列(配列番号4)、A2配列(配列番号7)、及び/又はB15配列(配列番号5)を含み得る。いくつかの実施形態では、第1のトランスポゾンはまた、UMI配列を含む。
いくつかの実施形態では、トランスポソーム複合体はまた、第1及び第2のトランスポゾンを含む。第2のトランスポゾンは、5’トランスポゾン末端配列を含む。第2のトランスポゾンの5’トランスポゾン末端配列は、第1のトランスポゾンの3’トランスポゾン末端配列と相補的であり得る。
いくつかの実施形態では、第2のトランスポゾンはまた、3’アダプター配列を含む。第2のトランスポゾンの3’アダプター配列は、第1のトランスポゾンの5’アダプター配列に部分的に又は完全に相補的であり得る。
いくつかの実施形態では、第2のトランスポゾンの3’アダプター配列は、第1のトランスポゾンの5’アダプター配列に相補的な部分を含有しない。
いくつかの実施形態では、第2のトランスポゾンの3’アダプター配列は、A14配列(配列番号4)、A2配列(配列番号7)、B15配列(配列番号5)、及び/又は第1のトランスポゾンのUMI配列に相補的である配列を含む。
いくつかの実施形態では、第2のトランスポゾンは、UMIを更に含む。第2のトランスポゾンのUMIは、第1のトランスポゾンのUMIと同じ配列又は異なる配列であってもよい。
いくつかの実施形態では、トランスポソーム複合体は、1つ、2つ、又はそれ以上のトランスポゾンを含み、それぞれがA14-ME(配列番号1)及び/又はB15-ME(配列番号2)を含む配列を有する。
いくつかの実施形態では、トランスポゾン複合体は、ME(配列番号6)又はME’(配列番号3)を含む3’トランスポゾン末端配列を有する第1のトランスポゾンを含む。いくつかの実施形態では、トランスポゾン複合体は、ME(配列番号6)又はME’(配列番号3)を含む3’トランスポゾン末端配列を有する第2のトランスポゾンを含む。
いくつかの実施形態では、トランスポソーム複合体は、A14配列(配列番号4)、A2配列(配列番号7)、B15配列(配列番号5)、ME配列(配列番号6)、及び/又はME’配列(配列番号3)に隣接する追加のアダプター配列を含む。参照により本明細書に組み込まれるIllumina Adapter Sequences Document#1000000002694 v15に開示されているものなど、多くの配列を追加のアダプター配列として使用することができる。いくつかの実施形態では、追加のアダプター配列は、Aアダプター配列、Bアダプター配列、Xアダプター配列、又はY’アダプター配列である。
いくつかの実施形態では、トランスポソーム複合体は、B15配列及び/又はA14配列に相補的なオリゴヌクレオチドを含む。
いくつかの実施形態では、トランスポソーム複合体は、ビーズ又は他の材料などの固体支持体に固定化される。いくつかの実施形態では、トランスポソーム複合体は、第1又は第2のトランスポゾンを介して固定化される。いくつかの実施形態では、トランスポソーム複合体は、第1又は第2のトランスポゾンのアダプター配列(B15配列又はA14配列など)に相補的なオリゴヌクレオチドを介して固定化される。
1.トランスポザーゼ
「トランスポザーゼ」は、トランスポゾン末端含有組成物(例えば、トランスポゾン、トランスポゾン末端、トランスポゾン末端組成物)を有する機能的複合体を形成し、かつ二本鎖標的核酸へのトランスポゾン末端含有組成物の挿入又は転位を触媒することができる酵素を意味する。本明細書に提示されるトランスポザーゼはまた、レトロトランスポゾン及びレトロウイルスからのインテグラーゼを含み得る。
「トランスポザーゼ」は、トランスポゾン末端含有組成物(例えば、トランスポゾン、トランスポゾン末端、トランスポゾン末端組成物)を有する機能的複合体を形成し、かつ二本鎖標的核酸へのトランスポゾン末端含有組成物の挿入又は転位を触媒することができる酵素を意味する。本明細書に提示されるトランスポザーゼはまた、レトロトランスポゾン及びレトロウイルスからのインテグラーゼを含み得る。
本明細書に提供されるある特定の実施形態で使用され得る例示的なトランスポザーゼとしては、Tn5トランスポザーゼ、Sleeping Beauty(SB)トランスポザーゼ、ビブリオハーベイ(Vibrio harveyi)、R1及びR2末端配列を含むMuAトランスポザーゼ及びMuトランスポザーゼ認識部位、Staphylococcus aureus Tn552、Ty1、Tn7トランスポザーゼ、Tn/O及びIS10、Mariner transposase、Tc1、P Element、Tn3、細菌挿入配列、レトロウイルス、及び酵母のレトロトランスポゾンが挙げられる(又はそれによってコードされる)。より多くの例としては、IS5、Tn10、Tn903、IS911、及びトランスポザーゼファミリー酵素の設計されたバージョンが挙げられる。本明細書に記載される方法はまた、トランスポザーゼの組み合わせを含み、単一のトランスポザーゼのみを含むのではない。
いくつかの実施形態では、トランスポザーゼは、Tn5、Tn7、MuA、若しくはビブリオハーベイトランスポザーゼ、又はこれらの活性変異体である。他の実施形態では、トランスポザーゼは、Tn5トランスポザーゼ又はその変異体である。他の実施形態では、トランスポザーゼは、Tn5トランスポザーゼ又はその変異体である。他の実施形態では、トランスポザーゼは、Tn5トランスポザーゼ又はその活性変異体である。いくつかの実施形態では、Tn5トランスポザーゼは、高活性Tn5トランスポザーゼ、又はその活性変異体である。いくつかの態様では、Tn5トランスポザーゼは、参照により本明細書に組み込まれる、PCT国際公開第2015/160895号に記載されているTn5トランスポザーゼである。いくつかの態様では、Tn5トランスポザーゼは、野生型Tn5トランスポザーゼに対する54、56、372、212、214、251、及び338位での変異を有する、高活性Tn5である。いくつかの態様では、Tn5トランスポザーゼは、野生型Tn5トランスポザーゼ:E54K、M56A、L372P、K212R、P214R、G251R、及びA338Vに対する以下の変異を有する高活性Tn5である。いくつかの実施形態では、Tn5トランスポザーゼは、融合タンパク質である。いくつかの実施形態では、Tn5トランスポザーゼ融合タンパク質は、融合伸長因子Ts(Tsf)タグを含む。いくつかの実施形態では、Tn5トランスポザーゼは、野生型配列に対するアミノ酸54、56、及び372における変異を含む高活性Tn5トランスポザーゼである。いくつかの実施形態では、高活性Tn5トランスポザーゼは融合タンパク質であり、任意選択で、融合タンパク質は伸長因子Ts(Tsf)である。いくつかの実施形態では、認識部位は、Tn5型トランスポザーゼ認識部位である(Goryshin and Reznikoff,J.Biol.Chem.,273:7367,1998)。一実施形態では、高活性Tn5トランスポザーゼと複合体を形成するトランスポザーゼ認識部位が使用される(例えば、EZ-Tn5TMトランスポザーゼ、Epicentre Biotechnologies、Madison,Wis.)。いくつかの実施形態では、Tn5トランスポザーゼは野生型Tn5トランスポザーゼである。
全体にわたって使用されるとき、「トランスポザーゼ」という用語は、トランスポゾン含有組成物(例えば、トランスポゾン、トランスポゾン組成物)を備えた機能複合体を形成し、インビトロ転位反応で、共にインキュベートされる二本鎖標的核酸へのトランスポゾン含有組成物の挿入又は転位を触媒することができる酵素を指す。提供される方法のトランスポザーゼはまた、レトロトランスポゾン及びレトロウイルスからのインテグラーゼを含む。提供される方法において使用され得る例示的なトランスポザーゼとしては、野生型又は変異体形態のTn5トランスポザーゼ及びMuAトランスポザーゼが挙げられる。
「転位反応」は、1つ以上のトランスポゾンがランダムな部位又はほぼランダムな部位で標的核酸に挿入される反応である。転位反応の必須成分は、転移トランスポゾン配列及びその相補体(すなわち、非転移トランスポゾン末端配列)、並びに機能的転位又はトランスポソーム複合体を形成するために必要な他の構成要素を含む、トランスポゾンのヌクレオチド配列を示すトランスポザーゼ及びDNAオリゴヌクレオチドである。本開示の方法は、高活性Tn5トランスポザーゼ及びTn5型トランスポゾン末端によって、又はMuA若しくはHYPERMuトランスポザーゼ並びにR1及びR2末端配列を含むMuトランスポゾン末端によって形成される転位複合体を用いることによって例示される(例えば、Goryshin,I.and Reznikoff,W.S.,J.Biol.Chem.,273:7367,1998、及びMizuuchi,Cell,35:785,1983;Savilahti,H,et al.,EMBO J.,14:4893,1995を参照されたく、それらは、参照によりそれらの全体が本明細書に組み込まれる)。しかしながら、意図された目的のために標的核酸にタグ付けするのに十分な効率で、ランダム又はほぼランダムな様式でトランスポゾン末端を挿入することができる任意の転位システムが提供される方法で使用され得る。提供される方法で使用され得る既知の転位システムの他の例としては、Staphylococcus aureus Tn552、Tyl、トランスポゾンTn7、Tn/O及びIS10、マリナートランスポザーゼ、Tel、Pエレメント、Tn3、細菌挿入配列、レトロウイルス、並びに酵母のレトロトランスポゾン(例えば、Colegio O R et al,J.Bacteriol.,183:2384-8,2001;Kirby C et al,Mol.Microbiol.,43:173-86,2002、Devine S E,and Boeke J D.,Nucleic Acids Res.,22:3765-72,1994、国際特許出願第95/23875号、Craig,N L,Science.271:1512,1996、Craig,N L,Review in:Curr Top Microbiol Immunol.,204:27-48,1996、Kleckner N,et al.,Curr Top Microbiol Immunol.,204:49-82,1996、Lampe D J,et al.,EMBO J.,15:5470-9,1996、Plasterk R H,Curr Top Microbiol Immunol,204:125-43,1996、Gloor,G B,Methods Mol.Biol,260:97-1 14,2004、Ichikawa H,and Ohtsubo E.,J Biol.Chem.265:18829-32,1990、Ohtsubo,F and Sekine,Y,Curr.Top.Microbiol.Immunol.204:1-26,1996、Brown P O,et al,Proc Natl Acad Sci USA,86:2525-9,1989、Boeke J D and Corces V G,Annu Rev Microbiol.43:403-34,1989を参照されたく、それらは、参照によりそれらの全体が本明細書に組み込まれる)が挙げられるが、それらに限定されない。
トランスポゾンを標的配列に挿入するための方法は、適切なインビトロ転位システムが利用可能であるか、又は当該技術分野の知識に基づいて開発し得る任意の適切なトランスポゾンシステムを使用してインビトロで実施することができる。一般に、本開示の方法で使用するための適切なインビトロ転位システムは、少なくとも、十分な純度、十分な濃度、及び十分なインビトロ転位活性のトランスポザーゼ酵素、並びにトランスポザーゼが、転位反応を触媒し得るそれぞれのトランスポザーゼと機能複合体を形成するトランスポゾンを必要とする。使用され得る好適なトランスポザーゼトランスポゾン末端配列は、トランスポザーゼの野生型、誘導体又は変異体から選択されるトランスポザーゼと複合体を形成する野生型、誘導体又は変異体トランスポゾン末端配列を含むが、それらに限定されない。
いくつかの実施形態では、トランスポザーゼは、Tn5トランスポザーゼを含む。いくつかの実施形態では、Tn5トランスポザーゼは、高活性Tn5トランスポザーゼである。
いくつかの実施形態では、トランスポソーム複合体は、トランスポザーゼの2つの分子のダイマーを含む。いくつかの実施形態では、トランスポソーム複合体は、ホモダイマーであり、トランスポザーゼの2つの分子は各々、同じ型の第1及び第2のトランスポゾンに結合している(例えば、各モノマーに結合した2つのトランスポゾンの配列は同じであり、「ホモダイマー」を形成する)。いくつかの実施形態では、本明細書に記載の組成物及び方法は、トランスポソーム複合体の2つの集団を採用する。いくつかの実施形態では、各集団におけるトランスポゾンは同じである。いくつかの実施形態では、各集団におけるトランスポソーム複合体は、ホモダイマーであり、第1の集団は、各モノマーにおいて第1のアダプター配列を有し、第2の集団は、各モノマー中に異なるアダプター配列を有する。
「トランスポゾン末端」という用語は、インビトロ転位反応で機能するトランスポザーゼ又はインテグラーゼ酵素との複合体を形成するために必要なヌクレオチド配列(「トランスポゾン末端配列」)のみを示す二本鎖核酸分子を指す。いくつかの実施形態では、二本鎖核酸分子は、DNAである。いくつかの実施形態では、トランスポゾン末端は、転位反応においてトランスポザーゼと機能複合体を形成することができる。非限定的な例として、参照によりその全体が本明細書に組み込まれる米国特許出願公開第2010/0120098号の開示に記載されるように、トランスポゾン末端は、19-bpの外側末端(「outer end、OE」)トランスポゾン末端、内側末端(「inner end、IE」)トランスポゾン末端、又は野生型若しくは変異体Tn5トランスポザーゼによって認識される「モザイク末端」(「mosaic end、ME」)トランスポゾン末端、又はR1及びR2トランスポゾン末端を含み得る。トランスポゾン末端は、インビトロ転位反応においてトランスポザーゼ又はインテグラーゼ酵素と機能複合体を形成するのに好適な任意の核酸又は核酸類似体を含み得る。例えば、トランスポゾン末端は、DNA、RNA、修飾塩基、非天然塩基、修飾骨格を含むことができ、一方又は両方の鎖にニックを含むことができる。「DNA」という用語は、トランスポゾン末端組成物に関連して本開示全体を通して使用されるが、任意の好適な核酸又は核酸類似体がトランスポゾン末端において利用され得ることを理解すべきである。
2.転移鎖及び非転移鎖
同様に、「転移鎖」という用語は、両方のトランスポゾン末端の転移部分を指す。同様に、「非転移鎖」という用語は、両方の「トランスポゾン末端」の非転移部分を指す。転移鎖の3’末端は、インビトロ転位反応で標的DNAに結合又は転移される。転移されたトランスポゾン末端配列に相補的なトランスポゾン末端配列を示す非転移鎖は、インビトロ転位反応で標的DNAに結合又は転移されない。
同様に、「転移鎖」という用語は、両方のトランスポゾン末端の転移部分を指す。同様に、「非転移鎖」という用語は、両方の「トランスポゾン末端」の非転移部分を指す。転移鎖の3’末端は、インビトロ転位反応で標的DNAに結合又は転移される。転移されたトランスポゾン末端配列に相補的なトランスポゾン末端配列を示す非転移鎖は、インビトロ転位反応で標的DNAに結合又は転移されない。
いくつかの実施形態では、転移鎖及び非転移鎖は、共有結合している。例えば、いくつかの実施形態では、転移及び非転移鎖配列は、単一のオリゴヌクレオチド上に、例えば、ヘアピン構成で提供される。したがって、非転移鎖の遊離末端は、転位反応によって標的DNAに直接的には結合されないが、非転移鎖は、ヘアピン構造のループによって転移鎖に連結されているため、非転移鎖は、DNA断片に間接的に付着することになる。トランスポソーム構造並びにトランスポソームを調製及び使用する方法の更なる例は、米国特許出願公開第2010/0120098号の開示に見出すことができ、その内容は参照によりその全体が本明細書に組み込まれる。
いくつかの実施形態では、トランスポソーム複合体は、3’トランスポゾン末端配列と、5’アダプター配列と、を含む、第1のトランスポゾンを含む。いくつかの実施形態では、トランスポソーム複合体は、5’トランスポゾン末端配列を含む第2のトランスポゾンを含み、5’トランスポゾン末端配列は、3’トランスポゾン末端配列に相補的である。
したがって、いくつかの実施形態では、タグメンテーション化工程は、(1)第1のアダプター配列及び第1のUMIを含む第1の鎖と、(2)第2のアダプター配列を含む第2の鎖と、を含む、二本鎖標的核酸断片を生成する。いくつかの実施形態では、第2の鎖は、第2のUMIを更に含んでよい。
3.タグメンテーション
「タグメンテーション」は、断片及びタグ核酸に対するトランスポザーゼの使用を指す。タグメンテーションは、トランスポゾン末端配列(本明細書でトランスポゾンと称される)を含む1つ以上のアダプター配列で複合体化されたトランスポザーゼ酵素を含むトランスポソーム複合体による核酸の修飾を含む。タグメンテーションは、DNAの断片化及び二重鎖断片の両方の鎖の5’末端へのアダプターのライゲーションを同時にもたらし得る。
「タグメンテーション」は、断片及びタグ核酸に対するトランスポザーゼの使用を指す。タグメンテーションは、トランスポゾン末端配列(本明細書でトランスポゾンと称される)を含む1つ以上のアダプター配列で複合体化されたトランスポザーゼ酵素を含むトランスポソーム複合体による核酸の修飾を含む。タグメンテーションは、DNAの断片化及び二重鎖断片の両方の鎖の5’末端へのアダプターのライゲーションを同時にもたらし得る。
多くの実施形態では、タグメンテーションは、トランスポゾン末端配列及びアダプター配列を含むトランスポゾンで複合体化されたトランスポザーゼをそれぞれ含む、複数のトランスポソーム複合体を含み得る。いくつかの実施形態では、タグメンテーションは、複数のトランスポソーム複合体中の全てのアダプター配列が同一である対称タグメンテーションである。いくつかの実施形態では、タグメンテーションは、複数のトランスポソーム複合体が2つの異なるアダプター配列セットを含む標準又は非対称タグメンテーションである。アダプター配列は、以下のセクションII.Cで説明される。対称タグメンテーション及び非対称タグメンテーションは、国際公開第2015/168161号及び同第2017/040306号に記載されており、これらは参照によりその全体が本明細書に組み込まれる。
いくつかの実施形態では、方法は、第1のトランスポザーゼと、第1のトランスポゾンと、第2のトランスポゾンと、を含む。いくつかの実施形態では、この方法は、第2のトランスポザーゼと、第3のトランスポゾンと、第4のトランスポゾンと、を更に含む。
多くの実施形態では、タグメンテーション化工程は、様々な方法で配置され得るアダプター配列及び/又はUMIを有する二本鎖標的核酸断片を生成する。アダプター配列及びUMIの位置(又は5’から3’へのアダプター配列及びUMIの順序)は、タグメンテーションにおいて使用されるトランスポゾンアダプターに依存する。いくつかの実施形態は、タグメンテーション化工程は、第1のアダプター配列及び第1のUMIを含む二本鎖標的核酸断片を生成する。いくつかの実施形態では、第1のアダプター配列及び第1のUMIは、核酸断片の第1の鎖上にある。
いくつかの実施形態は、タグメンテーション化工程は、第1のアダプター配列、第1のUMI、及び第2のアダプター配列を含む二本鎖標的核酸断片を生成する。いくつかの実施形態では、第1のアダプター配列及び第1のUMIは、核酸断片の第1の鎖上にあり、一方第2のアダプター配列は、核酸断片の第2の鎖上にある。
いくつかの実施形態では、タグメンテーション化工程は、第1のアダプター配列、第1のUMI、第2のアダプター配列、及び第2のUMIを含む二本鎖を生成する。いくつかの実施形態では、第1のアダプター配列及び第1のUMIは核酸断片の第1の鎖上にあり、一方第2のアダプター配列及び第2のUMIは核酸断片の第2の鎖上にある。
いくつかの実施形態では、タグメンテーション化工程は、フォーク型アダプタートランスポゾンを有する二本鎖標的核酸を生成して、第1のアダプター配列の第1及び第2のコピー、第1のUMI、第2のアダプター配列の第1及び第2のコピー、並びに第2のUMIを含む二本鎖標的核酸断片を生成する。
いくつかの実施形態は、タグメンテーション化工程は、第3のUMI及び/又は第4のUMIを更に含む二本鎖標的核酸断片を生成する。
いくつかの実施形態では、タグメンテーション化工程は、1つ以上のアダプター配列を含み、UMIを含まない、二本鎖標的核酸を生成する。いくつかの実施形態では、1つ以上のアダプター配列は、核酸断片の第1の鎖上にある。
4.固定化されたトランスポソーム複合体
その全体が本明細書に組み込まれる米国特許第9683230号に記載されているように、いくつかの異なる種類の固定化トランスポソームをこれらの方法で使用することができる。本明細書に提示される方法及び組成物では、トランスポソーム複合体は、固体支持体に固定化される。いくつかの実施形態では、トランスポソーム複合体及び/又は捕捉オリゴヌクレオチドは、トランスポゾン末端配列を含むポリヌクレオチドなどの1つ以上のポリヌクレオチドを介して支持体に固定化される。いくつかの実施形態では、トランスポソーム複合体は、トランスポザーゼ酵素を固体支持体に結合するリンカーを介して固定化され得る。いくつかの実施形態では、トランスポザーゼ酵素及びポリヌクレオチドの両方が、固体支持体に固定化される。固体支持体への分子(例えば、核酸)の固定化に言及する場合、「固定化された」及び「結合された」という用語は、本明細書では互換的に使用され、両方の用語は、明示的に又は文脈によってのいずれかで別段指示されない限り、直接的又は間接的、共有結合、又は非共有結合を包含することが意図される。いくつかの実施形態では、共有結合が使用され得るが、一般的に、必要とされるのは、例えば、核酸増幅及び/又は核酸配列決定を必要とする用途において、支持体を使用することが意図される条件下で、分子(例えば、核酸)が、支持体に固定化されたままである又は結合したままであるということである。
その全体が本明細書に組み込まれる米国特許第9683230号に記載されているように、いくつかの異なる種類の固定化トランスポソームをこれらの方法で使用することができる。本明細書に提示される方法及び組成物では、トランスポソーム複合体は、固体支持体に固定化される。いくつかの実施形態では、トランスポソーム複合体及び/又は捕捉オリゴヌクレオチドは、トランスポゾン末端配列を含むポリヌクレオチドなどの1つ以上のポリヌクレオチドを介して支持体に固定化される。いくつかの実施形態では、トランスポソーム複合体は、トランスポザーゼ酵素を固体支持体に結合するリンカーを介して固定化され得る。いくつかの実施形態では、トランスポザーゼ酵素及びポリヌクレオチドの両方が、固体支持体に固定化される。固体支持体への分子(例えば、核酸)の固定化に言及する場合、「固定化された」及び「結合された」という用語は、本明細書では互換的に使用され、両方の用語は、明示的に又は文脈によってのいずれかで別段指示されない限り、直接的又は間接的、共有結合、又は非共有結合を包含することが意図される。いくつかの実施形態では、共有結合が使用され得るが、一般的に、必要とされるのは、例えば、核酸増幅及び/又は核酸配列決定を必要とする用途において、支持体を使用することが意図される条件下で、分子(例えば、核酸)が、支持体に固定化されたままである又は結合したままであるということである。
いくつかの実施形態では、トランスポソームは、ビオチンタグを含むトランスポゾンを使用して固定化される。
いくつかの実施形態では、トランスポソーム複合体は、1mm2当たり少なくとも103、104、105、又は106個の複合体の密度で固体支持体上に存在する。
いくつかの実施形態では、固定化ライブラリー中の二本鎖断片の長さは、固体支持体上のトランスポソーム複合体の密度を増加又は減少させることによって調整される。
a)捕捉オリゴヌクレオチド
いくつかの実施形態では、捕捉オリゴヌクレオチドは、固体支持体上に固定化される。
いくつかの実施形態では、捕捉オリゴヌクレオチドは、固体支持体上に固定化される。
いくつかの実施形態では、標的DNAの3’末端は、捕捉オリゴヌクレオチドに結合する。
いくつかの実施形態では、標的RNAの3’末端は、捕捉オリゴヌクレオチドに結合する。いくつかの実施形態では、捕捉オリゴヌクレオチドは、固体支持体上に標的RNAを固定化するように機能し得る。
いくつかの実施形態では、捕捉プローブは、ポリT配列を含む。
いくつかの実施形態では、標的RNAは、mRNAであり、mRNAは、ポリT配列を含む捕捉オリゴヌクレオチドに結合する。
いくつかの実施形態では、捕捉オリゴヌクレオチドは、ポリT配列を含まない。
いくつかの実施形態では、捕捉オリゴヌクレオチドは、P5又はP7配列を介してビーズに固定化される。
いくつかの実施形態では、捕捉オリゴヌクレオチドは、固定化トランスポソームの第1のポリヌクレオチドに含まれる第1のタグにも存在するタグを含む。
b)固体支持体
特定の実施形態は、ポリヌクレオチドなどの生体分子への共有結合を可能にする反応基を含む中間材料の層又はコーティングの適用によって機能化された不活性基質又はマトリックス(例えば、ガラススライド、ポリマービーズなど)から構成される固体支持体を利用することができる。このような支持体の例としては、ガラスなどの不活性基質上に支持されるポリアクリルアミドヒドロゲル、特に国際公開第2005/065814号及び米国特許出願公開第2008/0280773号に記載されているポリアクリルアミドヒドロゲルが挙げられるが、これらに限定されず、その内容は、参照によりそれらの全体が本明細書に組み込まれる。そのような実施形態では、生体分子(ポリヌクレオチド)は、中間材料(例えば、ヒドロゲル)に直接共有付着してもよいが、中間材料は、それ自体が基質又はマトリックス(例えば、ガラス基質)に非共有結合してもよい。用語「固体支持体への共有結合」は、この種類の配列を包含するように適宜解釈されるべきである。
特定の実施形態は、ポリヌクレオチドなどの生体分子への共有結合を可能にする反応基を含む中間材料の層又はコーティングの適用によって機能化された不活性基質又はマトリックス(例えば、ガラススライド、ポリマービーズなど)から構成される固体支持体を利用することができる。このような支持体の例としては、ガラスなどの不活性基質上に支持されるポリアクリルアミドヒドロゲル、特に国際公開第2005/065814号及び米国特許出願公開第2008/0280773号に記載されているポリアクリルアミドヒドロゲルが挙げられるが、これらに限定されず、その内容は、参照によりそれらの全体が本明細書に組み込まれる。そのような実施形態では、生体分子(ポリヌクレオチド)は、中間材料(例えば、ヒドロゲル)に直接共有付着してもよいが、中間材料は、それ自体が基質又はマトリックス(例えば、ガラス基質)に非共有結合してもよい。用語「固体支持体への共有結合」は、この種類の配列を包含するように適宜解釈されるべきである。
「固体表面」、「固体支持体」という用語、及び本明細書の他の文法的等価物は、トランスポソーム複合体の結合に適切であるか、又は適切であるように修飾され得る任意の材料を指す。当業者によって理解されるように、可能な基質の数は非常に多い。可能な基質としては、ガラス及び変性又は機能化ガラス、プラスチック(例えば、アクリル、ポリスチレン、並びにスチレン及び他の材料のコポリマー、ポリプロピレン、ポリエチレン、ポリブチレン、ポリウレタン、テフロン(登録商標)など)、多糖類、ナイロン又はニトロセルロース、セラミックス、樹脂、シリカ、又はシリコン及び変性シリコンを含むシリカ系材料、炭素、金属、無機ガラス、プラスチック、光ファイバ束、並びに様々な他のポリマーを含むが、これらに限定されない。いくつかの実施形態では、特に有用な固体支持体及び固体表面は、フローセル装置内に配置される。例示的なフローセルは、以下に更に詳細に示される。
いくつかの実施形態では、固体支持体は、規則的なパターンでのトランスポソーム複合体の固定に好適なパターン化された表面を含む。「パターン化された表面」は、固体支持体の露出層内又はその上における、異なる領域の配置を指す。例えば、領域のうちの1つ以上は、1つ以上のトランスポソーム複合体が存在する特徴であり得る。この特徴は、トランスポソーム複合体が存在しない間質領域によって分離され得る。いくつかの実施形態では、パターンは、行及び列にある特徴のx-yフォーマットであり得る。いくつかの実施形態では、パターンは、特徴及び/又は間質領域の反復配置であり得る。いくつかの実施態様では、パターンは、特徴及び/又は間質領域のランダム配置であり得る。いくつかの実施形態では、トランスポソーム複合体は、固体支持体上にランダムに分布している。いくつかの実施形態では、トランスポソーム複合体は、パターン化された表面上に分布している。本明細書に記載される方法及び組成物において使用することができる例示的なパターン化表面は、米国特許出願第13/661,524号又は米国特許出願公開第2012/0316086(A1)号に記載されており、これらのそれぞれは、参照により本明細書に組み込まれる。
いくつかの実施形態では、固体支持体は、表面にウェル又は窪みのアレイを含む。これは、フォトリソグラフィ、スタンピング技術、成形技術、及びマイクロエッチング技術を含むがこれらに限定されない様々な技術を使用して、当該技術分野において一般的に既知であるように加工することができる。当該技術分野において理解されるように、使用される技術は、アレイ基板の組成物及び形状に依存する。
固体支持体の組成及び幾何学的形状は、その使用によって異なり得る。いくつかの実施形態では、固体支持体は、スライド、チップ、マイクロチップ及び/又はアレイなどの平面構造である。したがって、基質の表面は、平面層の形態であり得る。いくつかの実施形態では、固体支持体は、フローセルの1つ以上の表面を含む。本明細書で使用するとき、用語「フローセル」は、1つ又はそれ以上の流体試薬を流通させることができる固体表面を含むチャンバを指す。本開示の方法において容易に使用することができるフローセル及び関連する流体システム及び検出プラットフォームの例は、例えば、Bentley et al.,Nature 456:53-59(2008)、国際公開第2004/018497号、米国特許第7,057,026号、国際公開第1991/06678号、同第2007/123744号、米国特許第7,329,492号、同第7,211,414号、同第7,315,019号、同第7,405,281号、及び米国特許出願公開第2008/0108082号に記載されており、これらの各々は、参照により本明細書に組み込まれる。
いくつかの実施形態では、固体支持体又はその表面は、チューブ又は容器の内面又は外面などの非平面である。いくつかの実施形態では、固体支持体は、ミクロスフェア又はビーズを含む。本明細書における「ミクロスフェア」又は「ビーズ」又は「粒子」又は文法的均等物は、小さな離散粒子を意味する。好適なビーズ組成物としては、プラスチック、セラミックス、ガラス、ポリスチレン、メチルスチレン、アクリルポリマー、常磁性材料、トリアゾル(thoria sol)、カーボングラファイト、二酸化チタン、ラテックス、又はセファロースなどの架橋デキストラン、セルロース、ナイロン、架橋ミセル、及びテフロン(登録商標)が挙げられるが、これらに限定されず、並びに固体支持体について本明細書に概説される任意の他の材料を全て使用することができる。Bangs Laboratories,Fishers,Ind.の「Microsphere Selection Guide」は、有用なガイドである。ある特定の実施形態では、ミクロスフェアは、磁気ミクロスフェア又はビーズである。
ビーズは球状である必要はない。不規則な粒子を使用してもよい。代替的に又は追加的に、ビーズは多孔質であってもよい。ビーズサイズは、ナノメートル、すなわち、100nmから、ミリメートル、すなわち、1mmまでの範囲であり、ビーズは約0.2ミクロン~約200ミクロン、又は約0.5~約5マイクロメートルであるが、いくつかの実施形態では、より小さな又はより大きなビーズが使用されてもよい。
これらの表面結合トランスポソームの密度は、第1のポリヌクレオチドの密度を変化させることによって、又は固体支持体に付加されるトランスポザーゼの量によって、調節することができる。例えば、いくつかの実施形態では、トランスポソーム複合体は、1mm2あたり少なくとも103、104、105、又は106個の複合体の密度で固形支持体上に存在する。
支持体への核酸の結合は、剛性又は半剛性にかかわらず、共有結合又は非共有結合を介して起こり得る。例示的な結合は、米国特許第6,737,236号、同第7,259,258号、同第7,375,234号、同第7,427,678号、及び米国特許出願公開第2011/0059865(A1)号に記載されており、これらの各々は、参照により本明細書に組み込まれる。いくつかの実施形態では、核酸又は他の反応成分は、ゲル又は他の半固体支持体に結合され得、これは次に、固相支持体に結合又は接着される。このような実施形態では、核酸又は他の反応成分は、固相であると理解される。
いくつかの実施形態では、固体支持体は、微小粒子、ビーズ、平面支持体、パターン化された表面、又はウェルを含む。いくつかの実施形態では、平面支持体は、チューブの内面又は外面である。
いくつかの実施形態では、固体支持体は、その上に固定化されて調製されたタグ付きDNA断片のライブラリーを有する。
いくつかの実施形態では、固体支持体は、その上に固定化された捕捉オリゴヌクレオチドと第1のポリヌクレオチドとを含み、第1のポリヌクレオチドは、トランスポゾン末端配列及び第1のタグを含む3’部分を含む。
いくつかの実施形態では、固体支持体は、トランスポソーム複合体を形成するために第1のポリヌクレオチドに結合したトランスポザーゼを更に含む。
いくつかの実施形態では、固体支持体は、その上に固定化された捕捉オリゴヌクレオチド及び第2のポリヌクレオチドを含み、第2のポリヌクレオチドは、トランスポゾン末端配列を含む3’部分と、第2のタグと、を含む。
いくつかの実施形態では、固体支持体は、トランスポソーム複合体を形成するために第2のポリヌクレオチドに結合したトランスポザーゼを更に含む。
いくつかの実施形態では、キットは、本明細書に記載されるような固体支持体を含む。いくつかの実施形態では、キットは、トランスポザーゼを更に含む。いくつかの実施形態では、キットは、逆転写酵素ポリメラーゼを更に含む。いくつかの実施形態では、キットは、DNAを固定化するための第2の固体支持体を更に含む。
5.液相トランスポソーム複合体
トランスポソーム複合体は、液相トランスポソーム複合体であってもよい。これらの液相トランスポソーム複合体は可動性であってもよく、固体支持体に固定化されていなくてもよい。いくつかの実施形態では、液相トランスポソーム複合体を使用して、溶液中でタグ付き断片を生成する。
トランスポソーム複合体は、液相トランスポソーム複合体であってもよい。これらの液相トランスポソーム複合体は可動性であってもよく、固体支持体に固定化されていなくてもよい。いくつかの実施形態では、液相トランスポソーム複合体を使用して、溶液中でタグ付き断片を生成する。
更に、本方法は、液相トランスポソーム複合体を伴う工程を含んでもよい。例えば、本明細書に提示される方法は、溶液中にトランスポソーム複合体を提供し、DNAがトランスポソーム複合体溶液によって断片化される条件下で、液相トランスポソーム複合体を固定化断片と接触させる工程であって、それによって、溶液中に1つの末端を有する固定化核酸断片を得ることを更に含み得る。いくつかの実施形態では、溶液中のトランスポソーム複合体は、第2のタグを含むことができ、その結果、方法は、第2のタグを有する固定化核酸断片を生成し、第2のタグは溶液中にある。第1及び第2のタグは、異なるか又は同じであり得る。
いくつかの実施形態では、方法は、DNA断片が液相トランスポソーム複合体によって更に断片化される条件下で、液相トランスポソーム複合体を二本鎖核酸と接触させることであって、それによって、溶液中に1つの末端を有する固定化核酸断片を得ることを更に含み得る。
いくつかの実施形態では、液相トランスポソーム複合体は、第2のタグを含み、それによって、溶液中に第2のタグを有する固定化核酸断片を生成する。いくつかの実施形態では、第1及び第2のタグは異なる。いくつかの実施形態では、液相トランスポソーム複合体の少なくとも50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、又は99%は、第2のタグを含む。
いくつかの実施形態では、表面結合トランスポソームの1つの形態は、固体支持体上に主に存在する。例えば、いくつかの実施形態では、当該固体支持体上に存在するタグの少なくとも50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、又は99%は、同じタグドメインを含む。そのような実施形態では、表面結合トランスポソームとの最初のタグメンテーション反応後、ブリッジ構造の少なくとも50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、又は99%は、ブリッジの各末端に同じタグドメインを含む。第2のタグメンテーション反応は、ブリッジを更に断片化する溶液からのトランスポソームを付加することによって行われ得る。いくつかの実施形態では、液相トランスポソームのほとんど又は全ては、第1のタグメンテーション反応において生成されたブリッジ構造上に存在するタグドメインとは異なるタグドメインを含む。例えば、いくつかの実施形態では、液相トランスポソーム中に存在するタグの少なくとも50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、又は99%は、第1のタグメンテーション反応において生成されたブリッジ構造上に存在するタグドメインとは異なるタグドメインを含む。
いくつかの実施形態では、鋳型の長さは、標準的なクラスター化学を使用して好適に増幅され得るものよりも長い。例えば、いくつかの実施形態では、鋳型の長さは、少なくとも100bp、200bp、300bp、400bp、500bp、600bp、700bp、800bp、900bp、1000bp、1100bp、1200bp、1300bp、1400bp、1500bp、1600bp、1700bp、1800bp、1900bp、2000bp、2100bp、2200bp、2300bp、2400bp、2500bp、2600bp、2700bp、2800bp、2900bp、3000bp、3100bp、3200bp、3300bp、3400bp、3500bp、3600bp、3700bp、3800bp、3900bp、4000bp、4100bp、4200bp、4300bp、4400bp、4500bp、4600bp、4700bp、4800bp、4900bp、5000bp、10000bp、30000bp、又は100,000bpである。そのような実施形態では、第2のタグメンテーション反応は、次いで、その全体が本明細書に組み込まれる米国特許第9,683,230号に記載されるように、ブリッジを更に断片化する溶液からのトランスポソームを付加することによって行われ得る。したがって、第2のタグメンテーション反応は、ブリッジの内部スパンを除去することができ、更なる配列決定工程の準備ができているクラスターに変換することができる表面に固定された短い切り端を残す。特定の実施形態では、鋳型の長さは、上で例示したものから選択される上限及び下限によって規定される範囲内であり得る。
C.アダプター
本明細書で使用される「アダプター」は、1つ以上の所望の意図される目的又は用途のための1つ以上の「アダプター配列」を示すトランスポゾン又はポリヌクレオチドを指す。アダプターは、任意の所望の目的のために提供される任意の配列を含むことができる。
本明細書で使用される「アダプター」は、1つ以上の所望の意図される目的又は用途のための1つ以上の「アダプター配列」を示すトランスポゾン又はポリヌクレオチドを指す。アダプターは、任意の所望の目的のために提供される任意の配列を含むことができる。
アダプターは、5’アダプター又は3’アダプターであってよい。5’アダプターは、標的核酸分子の5’末端に連結されることを意図して使用される。3’アダプターは、標的核酸分子の3’末端に連結されることを意図している。
いくつかの実施形態では、アダプター配列は、増幅反応のためのプライマーとのハイブリダイゼーションに好適な1つ以上の領域を含む。いくつかの実施形態では、アダプター配列は、配列決定反応のためのプライマーとのハイブリダイゼーションに好適な1つ以上の領域を含む。いくつかの実施形態では、アダプター配列は、UMIの組み込みのためのポリヌクレオチドとのハイブリダイゼーションに好適な1つ以上の領域を含む。そのような実施形態では、HYB/HYB’又はHyb2Yワークフローを使用して、UMIを組み込むことができる。
いくつかの実施形態では、アダプター配列は、UMI、プライマー配列、インデックスタグ配列、捕捉配列、バーコード配列、開裂配列、アンカー配列、ユニバーサル配列、スペーサー領域、トランスポゾン末端配列、若しくは配列決定関連配列、又はそれらの組み合わせを含む。本明細書で使用される場合、配列決定関連配列は、後の配列決定工程に関連する任意の配列であり得る。配列決定関連配列は、下流の配列決定工程を単純化するように作用し得る。例えば、配列決定関連配列は、他の点でアダプターを核酸断片にライゲーションする工程を介して組み込まれる配列であり得る。いくつかの実施形態では、アダプター配列は、特定の配列決定方法においてフローセルへの結合を容易にするために、P5又はP7配列(又はそれらの相補体)を含む。任意の他の適切な特徴がアダプターに組み込まれ得ること、及びアダプター配列が任意の組み合わせで使用され得、5’から3’への任意の順序で配置され得ることが理解される。いくつかの実施形態では、トランスポゾン末端配列は、モザイク末端配列(ME)である。
アダプターは、1つ、2つ、又はそれ以上のリード配列決定アダプター配列を含み得る。いくつかの実施形態では、アダプター配列は、5’第1リード配列決定アダプター配列である。いくつかの実施形態では、アダプター配列は、5’第2リード配列決定アダプター配列である。いくつかの実施形態では、第1のリード及び/又は第2のリード配列決定アダプター配列は、固有プライマー結合部位を含む。
いくつかの実施形態では、アダプター配列は、5bp~200bpの長さを有する配列を含む。いくつかの実施形態では、アダプター配列は、10bp~100bpの長さを有する配列を含む。いくつかの実施形態では、アダプター配列は、20bp~50bpの長さを有する配列を含む。いくつかの実施形態では、アダプター配列は、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、150、又は200bpの長さを有する配列を含む。
種々の配列がアダプターにおいて使用され得るが、以下に提供されるのは、アダプター配列、固有プライマー結合部位、ポリヌクレオチド、又はトランスポゾン末端配列(ME)において使用され得る特定の配列である。配列は、任意の組み合わせで使用されてもよく、5’から3’の順序で配置されてもよい。A14-ME、ME、B15-ME、ME’、A14、B15、及びMEの例示的な配列を以下に示す。
A14-ME:5’-TCGTCGGCAGCGTCAGATGTGTATAAGAGACAG-3’(配列番号1)
B15-ME:5’-GTCTCGTGGGCTCGGAGATGTGTATAAGAGACAG-3’(配列番号2)
ME’:5’-phoS-CTGTCTCTTATACACATCT-3’(配列番号3)
A14:5’-TCGTCGGCAGCGTC-3’(配列番号4)
B15:5’-GTCTCGTGGGCTCGG-3’(配列番号5)
ME:AGATGTGTATAAGAGACAG(配列番号6)
A2:TCACTCAAGAACAGC(配列番号7)
A14-ME:5’-TCGTCGGCAGCGTCAGATGTGTATAAGAGACAG-3’(配列番号1)
B15-ME:5’-GTCTCGTGGGCTCGGAGATGTGTATAAGAGACAG-3’(配列番号2)
ME’:5’-phoS-CTGTCTCTTATACACATCT-3’(配列番号3)
A14:5’-TCGTCGGCAGCGTC-3’(配列番号4)
B15:5’-GTCTCGTGGGCTCGG-3’(配列番号5)
ME:AGATGTGTATAAGAGACAG(配列番号6)
A2:TCACTCAAGAACAGC(配列番号7)
いくつかの実施形態では、アダプター配列は、タグメンテーション中に組み込まれる。これらの実施形態では、アダプター配列を有するトランスポゾンが、タグメンテーション工程において使用される。
いくつかの実施形態では、アダプター配列は、アダプターライゲーション工程中に組み込まれる。これらの実施形態では、アダプター配列を有するポリヌクレオチドが、ライゲーション工程において使用される。いくつかの実施形態では、1つ、2つ、又はそれ以上のポリヌクレオチドが使用され得る。
1.フォーク型アダプター
いくつかの実施形態では、アダプターは、Y字型アダプターとしても知られるフォーク型アダプターであってもよい。フォーク型アダプターに基づく技術は、例えば、TruSeq(商標)試料調製キット(Illumina,Inc.)のワークフローにおいて例示されるような、ポリヌクレオチドを生成するために利用することができる。また、TruSight(登録商標)Oncologyキット(Illumina,Inc.)のワークフローの試薬を使用して、フォーク型アダプターをアセンブルすることもできる。多くの実施形態では、HYB/HYB’ワークフローを用いて、フォーク型アダプターを生成する。
いくつかの実施形態では、アダプターは、Y字型アダプターとしても知られるフォーク型アダプターであってもよい。フォーク型アダプターに基づく技術は、例えば、TruSeq(商標)試料調製キット(Illumina,Inc.)のワークフローにおいて例示されるような、ポリヌクレオチドを生成するために利用することができる。また、TruSight(登録商標)Oncologyキット(Illumina,Inc.)のワークフローの試薬を使用して、フォーク型アダプターをアセンブルすることもできる。多くの実施形態では、HYB/HYB’ワークフローを用いて、フォーク型アダプターを生成する。
本明細書で使用される場合、「フォーク型アダプター」は、核酸の2つの鎖を含むアダプターを指し、2つの鎖はそれぞれ、他方の鎖に相補的である領域及び他方の鎖に相補的ではない領域を含む。いくつかの実施形態では、フォーク型アダプター中の2つの鎖の核酸は、ライゲーションの前に一緒にアニーリングされ、アニーリングは、相補的領域に基づく。いくつかの実施形態では、相補的領域は、それぞれ12ヌクレオチドを含む。いくつかの実施形態では、フォーク型アダプターは、二本鎖DNA断片の末端で両方の鎖にライゲーションされる。いくつかの実施形態では、フォーク型アダプターは、二本鎖DNA断片の一方の末端にライゲーションされる。いくつかの実施形態では、フォーク型アダプターは、二本鎖DNA断片の両端にライゲーションされる。いくつかの実施形態では、断片の対向する末端上のフォーク型アダプターは異なる。いくつかの実施形態では、フォーク型アダプターの一方の鎖は、断片へのライゲーションを促進するために、その5’でリン酸化される。いくつかの実施形態では、フォーク型アダプターの一方の鎖は、3’Tの直前にホスホロチオエート結合を有する。いくつかの実施形態では、3’Tはオーバーハングである(すなわち、フォーク型アダプターの他方の鎖中のヌクレオチドと対形成していない)。いくつかの実施形態では、3’Tオーバーハングは、ライブラリー断片上に存在するAテールと塩基対を形成することができる。いくつかの実施形態では、ホスホロチオエート結合は、3’Tオーバーハングのエキソヌクレアーゼ消化をブロックする。いくつかの実施形態では、部分的に相補的なプライマーを用いるPCRは、末端を伸長し、フォークを分解するためにアダプターライゲーションの後に使用される。
いくつかの実施形態では、トランスポソーム複合体は、次の構造を有する。
いくつかの実施形態では、トランスポソーム複合体は、次の構造を有する。
いくつかの実施形態では、UMIは、タグメンテーション化工程中に組み込まれる。これらの実施形態では、UMIを組み込むために使用されるアダプターはトランスポゾンである。いくつかの実施形態では、UMIは、アダプター配列と3’トランスポゾン末端配列との間に位置する。いくつかの実施形態では、アダプター配列は、UMIと3’末端トランスポゾン末端配列との間に位置する。いくつかの実施形態では、アダプター配列は、3’末端トランスポゾン末端配列に完全に又は部分的に相補的である配列を含み得る。
いくつかの実施形態では、トランスポゾンは、フォーク型アダプタートランスポゾンである。フォーク型アダプターは、2つの鎖を含み得る。いくつかの実施形態では、フォーク型アダプタートランスポゾンの第1の鎖は、3’末端トランスポゾン末端配列と、アダプター配列と、UMIとを含む。いくつかの実施形態では、フォーク型アダプタートランスポゾンの第2の鎖は、アダプター配列と、第1のフォーク型アダプタートランスポゾンの第1の鎖に完全に又は部分的に相補的である配列とを含む。第1及び第2の鎖において完全な又は部分的な相補性を有する配列は、2つの鎖がハイブリダイズして、フォーク型構造を形成することを可能にする。
いくつかの実施形態では、2つ以上のフォーク型アダプタートランスポゾンを用いて、2つ以上のUMI及び2つ以上のアダプター配列をライブラリーに組み込んでもよい。
いくつかの実施形態では、2つのフォーク型アダプタートランスポゾンを用いて、2つのUMI及び4つのアダプター配列をライブラリーに組み込む。いくつかの実施形態では、二本鎖核酸をフォーク型アダプタートランスポゾンでタグメンテーションすることにより、2つのUMI、第1のアダプター配列の第1及び第2のコピー、並びに第2のアダプター配列の第1及び第2のコピーを有する二本鎖標的核酸断片が生成される。
いくつかの実施形態では、2つのフォーク型アダプタートランスポゾンを用いて、4つのUMI及び4つのアダプター配列をライブラリーに組み込む。いくつかの実施形態では、二本鎖核酸をフォーク型アダプタートランスポゾンでタグメンテーションすることにより、4つのUMI及び4つのアダプター配列を有する二本鎖標的核酸断片が生成される。
いくつかの実施形態では、トランスポゾンは、1つ、2つ、3つ、4つ、又はそれ以上の固有プライマー結合配列を更に含む。いくつかの実施形態では、固有プライマー結合配列は、Hyb2Yワークフローにおいて使用される。いくつかの実施形態では、固有プライマー結合配列は、カスタム配列決定プライマーをアニーリングするために使用される。いくつかの実施形態では、固有プライマー結合配列は、A2、A14、及び/又はB15を含む。
3.ポリヌクレオチドアダプター
いくつかの実施形態では、UMIは、タグメンテーションの後に組み込まれる。これらの実施形態では、UMIを組み込むために使用されるアダプターはポリヌクレオチドである。いくつかの実施形態では、この方法は、1つ、2つ、又はそれ以上のポリヌクレオチドを含む。いくつかの実施形態では、ポリヌクレオチドは、UMIと、1つ、2つ、又はそれ以上のアダプター配列とを含む。いくつかの実施形態では、ポリヌクレオチドは、相補的配列を介して他のポリヌクレオチド又はトランスポゾンにハイブリダイズするための領域を含む。例えば、ポリヌクレオチドは、3’末端トランスポゾン配列に完全に又は部分的に相補的である配列を含み得る。いくつかの実施形態では、1つ以上のポリヌクレオチドは、ハイブリダイズ工程において処理されて、フォーク型アダプターを生成する。
いくつかの実施形態では、UMIは、タグメンテーションの後に組み込まれる。これらの実施形態では、UMIを組み込むために使用されるアダプターはポリヌクレオチドである。いくつかの実施形態では、この方法は、1つ、2つ、又はそれ以上のポリヌクレオチドを含む。いくつかの実施形態では、ポリヌクレオチドは、UMIと、1つ、2つ、又はそれ以上のアダプター配列とを含む。いくつかの実施形態では、ポリヌクレオチドは、相補的配列を介して他のポリヌクレオチド又はトランスポゾンにハイブリダイズするための領域を含む。例えば、ポリヌクレオチドは、3’末端トランスポゾン配列に完全に又は部分的に相補的である配列を含み得る。いくつかの実施形態では、1つ以上のポリヌクレオチドは、ハイブリダイズ工程において処理されて、フォーク型アダプターを生成する。
いくつかの実施形態では、ポリヌクレオチドの一部は、3’アダプターを含み得る。3’アダプターは、ヘアピンUMI、ユニバーサルハイブリダイズテール、スプリントライゲーションアダプター、及び/又は鋳型スイッチオリゴヌクレオチドを含み得る。
いくつかの実施形態では、ポリヌクレオチドは、ヘアピンUMIを含む。これらの実施形態のいくつかにおいて、ポリヌクレオチドは、ユニバーサルハイブリダイズテールを更に含む。いくつかの実施形態では、ヘアピンUMIは、伸長及び/又はライゲーション工程中は安定であるが、この方法の増幅工程中は安定ではない。いくつかの実施形態では、UMIは、3又は4塩基対ステムを含む。いくつかの実施形態では、ユニバーサルハイブリダイズテールは、任意のDNA分子に結合できるイノシンなどのヌクレオチドを含む。
いくつかの実施形態では、ポリヌクレオチドは、スプリントライゲーションアダプターを含む。
いくつかの実施形態では、方法は、鋳型スイッチオリゴヌクレオチドを含む。
D.タグメンテーション後の伸長及びライゲーション工程
いくつかの実施形態では、タグメンテーション事象後に残された核酸配列中のギャップは、伸長工程を使用して埋めることができる。一般に、伸長工程の後にライゲーション工程が続く。伸長及び/又はライゲーションは、適切な条件を使用して行われる。いくつかの実施形態では、使用される緩衝液は、伸長-ライゲーションミックス緩衝液(例えば、伸長-ライゲーションミックス緩衝液3、ELM3)である。T4 DNA pol Exo-(New England BioLabs、カタログ番号M0203S)又はTtaq608などのポリメラーゼを、かかる伸長及び/又はライゲーション工程において使用できる。Taqポリメラーゼ、又は前述のポリメラーゼのいずれかの変異体、アナログ、若しくは誘導体もまた、この工程において代わりに使用され得る。
いくつかの実施形態では、タグメンテーション事象後に残された核酸配列中のギャップは、伸長工程を使用して埋めることができる。一般に、伸長工程の後にライゲーション工程が続く。伸長及び/又はライゲーションは、適切な条件を使用して行われる。いくつかの実施形態では、使用される緩衝液は、伸長-ライゲーションミックス緩衝液(例えば、伸長-ライゲーションミックス緩衝液3、ELM3)である。T4 DNA pol Exo-(New England BioLabs、カタログ番号M0203S)又はTtaq608などのポリメラーゼを、かかる伸長及び/又はライゲーション工程において使用できる。Taqポリメラーゼ、又は前述のポリメラーゼのいずれかの変異体、アナログ、若しくは誘導体もまた、この工程において代わりに使用され得る。
いくつかの実施形態では、二本鎖標的核酸断片が伸長される。いくつかの実施形態では、二本鎖標的核酸断片の第2の鎖が伸長される。
いくつかの実施形態では、二本鎖標的核酸断片の3’末端は、トランスポゾンの5’末端まで伸長される。
いくつかの実施形態では、伸長工程は、二本鎖標的核酸断片の第2の鎖の3’末端からヘアピンUMIの5’末端まで伸長させることを含む。
いくつかの実施形態では、伸長工程は、Bst DNAポリメラーゼ及びdNTP混合物を含むものなどの、鎖置換伸長反応を用いて行われる。
いくつかの実施形態では、伸長工程の後にライゲーションが続く。これらの実施形態では、方法は、ポリメラーゼ及びリガーゼを処理して、核酸鎖を伸長及びライゲーションして、完全な二本鎖タグ化断片を生成することを含み得る。
いくつかの実施形態では、伸長工程は、9塩基伸長させることを含む。
いくつかの実施形態では、伸長工程は、二本鎖標的核酸断片の第2の鎖の3’末端からスプリントライゲーションアダプターの5’末端まで伸長させることを含む。
いくつかの実施形態では、伸長工程は、二本鎖標的核酸断片の第1の鎖をコピーすることによって、二本鎖標的核酸断片の第2の鎖の3’末端から鋳型スイッチオリゴヌクレオチド内の接合部まで伸長させることを含む。
いくつかの実施形態では、転位事象後に残された核酸配列中にギャップは存在しない。これらの実施形態では、方法は、リガーゼを使用してトランスポゾン又はポリヌクレオチドを二本鎖標的核酸断片とライゲーションすることを含み、伸長工程は使用されない。
TruSeq及びTruSight Oncology 500(例えば、TruSeq(登録商標)RNA Sample Preparation v2 Guide、15026495 Rev.F、Illumina,2014を参照されたい)など、アダプターライゲーションの工程を含む多種多様なライブラリー調製方法が当技術分野で公知である。例示的なライゲーションされたフォーク型アダプターは、国際公開第2007/052006号、米国特許出願公開第2020/0080145号、米国特許第9,868,982号、及び国際公開第2020/144373号に記載されており、それらの全体が参照により本明細書に組み込まれる。他のライゲーション方法と共に使用されるアダプターを、この方法において使用してもよい(例えば、Illumina Adapter Sequences,Illumina,2021参照)。特に、アダプターライゲーションは、タグメンテーションによって断片をタグ化する方法(アダプター配列が転位反応中に断片に組み込まれる)と比較して、アダプター(より長いアダプターなど)のより柔軟な組み込みを可能にし得る。タグメンテーションを含むいくつかの方法において、更なるアダプター配列がPCR反応によって組み込まれてもよく、この方法は、更なるアダプター配列を組み込むための更なるPCR工程の必要性を排除し得る。
ライゲーション技術は、配列決定のためのNGSライブラリーを調製するために一般的に使用される。いくつかの実施形態は、ライゲーション工程は、酵素を用いて、特殊化されたアダプターをDNA断片の両端に接続する。いくつかの実施形態では、A塩基は、各鎖の平滑末端に付加され、配列決定アダプターへのライゲーションのためにそれらを調製する。いくつかの実施形態では、各アダプターはT塩基オーバーハングを含有し、アダプターをAテール断片化DNAにライゲーションするための相補的オーバーハングを提供する。
アダプターライゲーションプロトコールは、他の方法よりも有利であることが知られている。例えば、アダプターライゲーションを用いて、シングルリード、ペアエンドリード、及びインデックスリードのための配列決定プライマーハイブリダイゼーション部位の完全な相補体を生成することができる。いくつかの実施形態では、アダプターライゲーションは、インデックスタグ及びインデックスプライマー部位を付加するための更なるPCR工程の必要性を排除する。
いくつかの実施形態では、ライゲーション工程は、二本鎖標的核酸断片の3’末端のトランスポゾンの5’末端とのライゲーションを含む。
いくつかの実施形態では、ライゲーション工程は、二本鎖標的核酸断片の3’末端の複数のトランスポゾンの5’末端とのライゲーションを含む。
いくつかの実施形態では、ライゲーション工程は、二本鎖標的核酸断片の第2の鎖の3’末端とユニバーサルハイブリダイズテールの5’末端とのライゲーションを含む。
いくつかの実施形態では、ライゲーション工程は、伸長させた二本鎖標的核酸断片の第2の鎖の3’末端とスプリントライゲーションアダプターの第1の鎖の5’末端とのライゲーションを含む。
E.鋳型切り替え
いくつかの実施形態では、核酸断片のトランスポソーム複合体からの遊離後に、鋳型スイッチ又は鎖交換工程を実施することができる。いくつかの実施形態では、この鋳型切り替え工程の後に、ギャップ充填及びライゲーションが続く。いくつかの実施形態では、この方法は、チューブ内又はフローセル内で行われ得る。
いくつかの実施形態では、核酸断片のトランスポソーム複合体からの遊離後に、鋳型スイッチ又は鎖交換工程を実施することができる。いくつかの実施形態では、この鋳型切り替え工程の後に、ギャップ充填及びライゲーションが続く。いくつかの実施形態では、この方法は、チューブ内又はフローセル内で行われ得る。
鋳型切り替えは、ポリメラーゼが、新たに合成された鎖に依然として結合しながら伸長を中断し、別の核酸鎖で合成を再開する能力を指す。いくつかの実施形態では、(1)伸長、(2)鋳型切り替え、及び(3)タグメンテーション後の合成の再開の工程は、DNA鋳型切り替えが可能なポリメラーゼによって行われる。いくつかの実施形態では、ポリメラーゼは、モロニーマウス白血病ウイルス(MMLV)逆転写酵素である。
いくつかの実施形態では、鋳型は、二本鎖標的核酸断片の第1の鎖から、3’鋳型スイッチオリゴヌクレオチドの不対領域に切り替えられる。いくつかの実施形態では、コピー工程が鋳型切り替え工程の後に続き、3’スイッチオリゴヌクレオチドの不対領域を、鋳型スイッチオリゴヌクレオチド中の接合部からかかる不対領域の5’末端にコピーする。
F.増幅
UMIライブラリーを、任意選択的に、当該技術分野で公知の任意の適切な増幅法に従って増幅し、1つ以上の配列決定プライマーを用いて配列決定することができる。いくつかの実施形態では、UMIライブラリーは、固体支持体上で増幅される。いくつかの実施形態では、固体支持体は、BLTタグメンテーションが起こる同じ固体支持体である。このような実施形態では、本明細書で提供される方法及び組成物は、試料調製物が、最初の試料導入工程から、増幅まで、及び任意選択的に配列決定工程まで、同じ固体支持体上で進行することを可能にする。
UMIライブラリーを、任意選択的に、当該技術分野で公知の任意の適切な増幅法に従って増幅し、1つ以上の配列決定プライマーを用いて配列決定することができる。いくつかの実施形態では、UMIライブラリーは、固体支持体上で増幅される。いくつかの実施形態では、固体支持体は、BLTタグメンテーションが起こる同じ固体支持体である。このような実施形態では、本明細書で提供される方法及び組成物は、試料調製物が、最初の試料導入工程から、増幅まで、及び任意選択的に配列決定工程まで、同じ固体支持体上で進行することを可能にする。
例えば、いくつかの実施形態では、UMIライブラリーは、米国特許第7,985,565号及び同第7,115,400号の開示によって例示されるように、クラスター増幅法を使用して増幅され、これらの各々の内容は、参照によりその全体が本明細書に組み込まれる。米国特許第7,985,565号及び同第7,115,400号の組み込まれている材料は、固定されている核酸分子のクラスター又は「コロニー」からなるアレイを形成するために、増幅産物を固体支持体上に固定することを可能にする固相核酸増幅の方法を記載する。そのようなアレイ上の各クラスター又はコロニーは、複数の同一の固定化されたポリヌクレオチド鎖及び複数の同一の固定化された相補的ポリヌクレオチド鎖から形成される。そのように形成されたアレイは、本明細書では一般に「クラスター化アレイ」と称される。米国特許第7,985,565号及び同第7,115,400号に記載されているような固相増幅反応の産物は、固定されているポリポリヌクレオチド鎖と固定されている相補鎖の対をアニーリングすることによって形成されるいわゆる「架橋(bridged)」構造体であり、両方の鎖は、いくつかの実施形態では、共有結合を介して、5’末端で固体支持体上に固定されている。クラスター増幅方法論は、固定化された核酸鋳型を使用して固定化されたアンプリコンを産生する方法の例である。他の好適な方法を用いて、本明細書で提供される方法に従って生成されたUMIライブラリーから固定されたアンプリコンを生成することもできる。例えば、1つ以上のクラスター又はコロニーは、増幅プライマーの各対の一方又は両方のプライマーが固定化されているかどうかにかかわらず、固相PCRによって形成することができる。
他の実施形態では、UMIライブラリーは、溶液中で増幅される。例えば、いくつかの実施形態では、核酸断片は、開裂されるか、又は別の方法で固体支持体から遊離され、次いで増幅プライマーは、溶液中で遊離分子にハイブリダイズされる。他の実施形態では、増幅プライマーを、1つ以上の初期の増幅工程のために核酸断片にハイブリダイズさせ、その後溶液中の後続の増幅工程を行う。したがって、いくつかの実施形態では、固定化された核酸鋳型を使用して、液相アンプリコンを産生することができる。
本明細書に記載されるか、又は当該技術分野において一般に既知である増幅法のいずれも、UMIライブラリーを増幅するために、ユニバーサル又は標的特異的プライマーと共に利用され得ることを理解されたい。増幅のための好適な方法には、参照によりその全体が本明細書に組み込まれる、米国特許第8,003,354号に記載されるように、ポリメラーゼ連鎖反応(PCR)、鎖置換増幅(SDA)、転写媒介増幅(TMA)及び核酸配列ベースの増幅(NASBA)が含まれるが、これらに限定されない。上記の増幅方法を使用して、関心対象の1つ以上の核酸を増幅することができる。例えば、マルチプレックスPCR、SDA、TMA、NASBAなどを含むPCRを利用してUMIライブラリーを増幅することができる。いくつかの実施形態では、関心対象の核酸に特異的に向けられるプライマーは、増幅反応に含まれる。
ポリヌクレオチドの増幅に好適な他の方法としては、オリゴヌクレオチド伸長及びライゲーション、ローリングサークル増幅(rolling circle amplification、RCA)(Lizardi et al.,Nat.Genet.19:225-232(1998)、参照により本明細書に組み込まれる)、及びオリゴヌクレオチドライゲーションアッセイ(oligonucleotide ligation assay、OLA)(一般に米国特許第7,582,420号、同第5,185,243号、同第5,679,524号、及び同第5,573,907号、欧州特許第0320308(B1)号、欧州特許第0336731(B1)号、欧州特許第0439182(B1)号、国際公開第90/01069号、国際公開第89/12696号、及び国際公開第89/09835号、その全てが参照により組み込まれる)技術、を挙げることができる。これらの増幅方法論は、UMIライブラリーを増幅するように設計され得ることを理解されたい。例えば、いくつかの実施形態では、増幅方法は、目的の核酸に特異的に向けられるプライマーを含むライゲーションプローブ増幅又はオリゴヌクレオチドライゲーションアッセイ(OLA)反応を含み得る。いくつかの実施形態では、増幅方法は、目的の核酸に特異的に指向されるプライマーを含有するプライマー伸長ライゲーション反応を含んでもよい。目的の核酸を増幅するように特別に設計することができるプライマー伸長及びライゲーションプライマーの非限定的な例として、増幅は、米国特許第7,582,420号及び同第7,611,869号(これらの各々は、参照によりその全体が本明細書に組み込まれる)に例示されるようなGoldenGateアッセイ(Illumina,Inc.、San Diego,CA)に使用されるプライマーを含み得る。
本開示の方法で使用され得る例示的な等温増幅方法としては、例えばDean et al.,Proc.Natl.Acad.Sci.USA 99:5261-66(2002)により例示される多置換増幅(Multiple Displacement Amplification、MDA)、又は例えば米国特許第6,214,587号(これらの各々は、参照によりその全体が本明細書に組み込まれる)により例示される等温鎖置換核酸増幅が挙げられるが、これらに限定されない。本開示で使用され得る他の非PCRベースの方法としては、例えば、Walker et al.,Molecular Methods for Virus Detection,Academic Press,Inc.,1995、米国特許第5,455,166号、及び同第5,130,238号、並びにWalker et al.,Nucl.Acids Res.20:1691-96(1992)に記載されている鎖置換増幅(SDA)又は例えば、Lage et al.,Genome Research 13:294-307(2003)に記載されている超分枝鎖置換増幅が挙げられ、これらの各々は、参照によりその全体が本明細書に組み込まれる。等温増幅法は、ゲノムDNAのランダムプライマー増幅のために、鎖置換Phi 29ポリメラーゼ又はBst DNAポリメラーゼの大型断片、5’→3’エキソ-とともに使用することができる。これらのポリメラーゼの使用は、それらの高い加工性及び鎖置換活性を利用する。高い加工性により、ポリメラーゼは、10~20kbの長さの断片を産生することが可能になる。上記のように、クレノウポリメラーゼなどの低いプロセッシビティと鎖置換活性を有するポリメラーゼを使用して、等温条件下でより小さな断片を産生することができる。増幅反応、条件、及び成分の更なる説明は、米国特許第7,670,810号の開示に詳細に記載されている(参照によりその全体が本明細書に組み込まれる)。
本開示において有用な別の核酸増幅法は、例えば、参照によりその全体が本明細書に組み込まれる、Grothues,et al.Nucleic Acids Res.21(5):1321-2(1993)に記載されるように、定常5’領域の後にランダム3’領域が続く2ドメインプライマーの集団を使用するタグ付きPCRである。増幅の第1のラウンドは、ランダムに合成された3’領域からの個々のハイブリダイゼーションに基づいて、熱変性DNA上で多数の開始を可能にするために実施される。3’領域の性質により、開始部位は、ゲノム全体にランダムであると考えられる。その後、結合していないプライマーを除去し、定常5’領域に対して相補的であるプライマーを使用して、更なる複製を行うことができる。
いくつかの実施形態では、増幅工程は、ライブラリーを固体支持体に付着させるために、核酸断片の一端又は両端にオリゴヌクレオチドを付加することを含む。
いくつかの実施形態では、増幅工程は、少なくとも第1リード配列決定オリゴヌクレオチド及び/又は第2リード配列決定オリゴヌクレオチドを添加することを含む。いくつかの実施形態では、増幅工程は、少なくともP5オリゴヌクレオチド及びP7オリゴヌクレオチドを添加することを含む。いくつかの実施形態では、増幅工程は、少なくとも複数のi5オリゴヌクレオチド及び複数のi7オリゴヌクレオチドを添加することを含む。
いくつかの実施形態では、増幅工程の後、方法は、増幅工程の後にサイズ範囲内の増幅された核酸断片を選択することを含み得る。
G.UMIライブラリーを作製する方法
アダプターは、5’から3’への任意の組み合わせ又は順序で2つ以上のアダプター配列を含み得るが、本開示は、様々な実施形態において使用され得るアダプターを提供する。本開示はまた、本明細書で説明されるアダプターと共に使用され得る複数の方法を提供する。本開示の方法は、以下のアダプター及び方法のうちの1つ以上を含み得る。
アダプターは、5’から3’への任意の組み合わせ又は順序で2つ以上のアダプター配列を含み得るが、本開示は、様々な実施形態において使用され得るアダプターを提供する。本開示はまた、本明細書で説明されるアダプターと共に使用され得る複数の方法を提供する。本開示の方法は、以下のアダプター及び方法のうちの1つ以上を含み得る。
1.単一UMIを用いてUMIライブラリーを作製する方法
図1に示されるように、例示的なアダプターは、その第1の鎖上の5’から3’へ、B15、A2、UMI、及びMEのアダプター配列を含む。アダプター中、UMIはA2とMEとの間に位置する。UMIは、nrUMI及び/又はrUMIを含み得る。その第2の鎖上に、アダプターは、MEに相補的である配列を含む。アダプターはまた、アダプターが固体支持体と共に使用できるように、ビオチンタグを含む。他の実施形態では、固体支持体は使用されず、研究者は液相トランスポソーム複合体を使用することができる。
図1に示されるように、例示的なアダプターは、その第1の鎖上の5’から3’へ、B15、A2、UMI、及びMEのアダプター配列を含む。アダプター中、UMIはA2とMEとの間に位置する。UMIは、nrUMI及び/又はrUMIを含み得る。その第2の鎖上に、アダプターは、MEに相補的である配列を含む。アダプターはまた、アダプターが固体支持体と共に使用できるように、ビオチンタグを含む。他の実施形態では、固体支持体は使用されず、研究者は液相トランスポソーム複合体を使用することができる。
図2に示され、実施例1に記載されるように、UMIライブラリーを作製する例示的な方法は、(1)二本鎖核酸ライブラリーを作製することであって、ライブラリー中の各断片はUMIを含み、方法は、(a)二本鎖標的核酸を含む試料を、(i)第1のトランスポザーゼと、(ii)第1の3’末端トランスポゾン末端配列、第1のアダプター配列、及び第1のUMIを含む第1のトランスポゾンと、(iii)第1の3’末端トランスポゾン末端配列に完全に又は部分的に相補的である配列を含む第2のトランスポゾンと、を含む、第1のトランスポソーム複合体に適用することを含む、ことと、(2)二本鎖標的核酸を第1及び第2のトランスポゾンでタグメンテーションして、第1のアダプター配列及び第1のUMIを含む二本鎖標的核酸断片を生成することと、(3)二本鎖標的核酸断片を第1のトランスポソーム複合体から遊離させることと、(4)任意選択的に、二本鎖標的核酸断片を伸長させ、それによって単一UMIをコピーして二重鎖UMIを生成することと、(5)トランスポゾン又は伸長させたトランスポゾンを二本鎖標的核酸断片とライゲーションすることと、(6)UMIを含む二本鎖標的核酸断片を生成することと、(7)二本鎖標的核酸断片を増幅することと、を含む。
この例示的な方法において、第1のトランスポゾン内の第1のUMIは、第1のアダプター配列と第1の3’トランスポゾン末端配列との間に位置する。
図3Bに示され、実施例2に記載されるように、UMIライブラリーを配列決定する例示的な方法は、19回の暗サイクルを含む(以下のセクションIII.Aで論じる)。この方法では、ME配列の19塩基は、19回の暗サイクル中に画像化されない。この方法は、次の4つのプライマー、すなわち、カスタムプライマー1 UMI+リード1、カスタムプライマーi5、カスタムプライマーi7、及びカスタムプライマー4 UMI+リード2を使用する。
この例示的なアダプター及び方法を用いて、第1のUMIが二本鎖標的核酸断片の第1の鎖上にあり、第2のUMIが二本鎖標的核酸断片の第2の鎖上にあるUMIライブラリーが作製される。
UMIライブラリーを配列決定する別の例示的な方法を使用してもよい。図4に示され、実施例3に記載されるように、例示的な方法は、次の6つのカスタムプライマー、すなわち、カスタムUMI 1リード(配列番号8)、インサート1リード用カスタム架橋プライマー(配列番号9)、カスタムi7リード(配列番号10)、カスタムi5リード(配列番号11)、カスタムUMI 2リード(配列番号12)、及びインサート2リード用カスタム架橋プライマー(配列番号13)を含む。この配列決定法では、配列番号1及び5を有するプライマーを組み合わせ、配列番号3及び4を有するプライマーを組み合わせ、配列番号2及び6を有するプライマーを組み合わせる。
2.UMI-BLTを用いてUMIライブラリーを作製する方法
2つの例示的なアダプターを図5Aに示す。第1のアダプターは、その第1の鎖上の5’から3’へ、A15及びMEの配列を含む。第1のアダプターはまた、その第2の鎖上にMEに相補的である配列を含む。
2つの例示的なアダプターを図5Aに示す。第1のアダプターは、その第1の鎖上の5’から3’へ、A15及びMEの配列を含む。第1のアダプターはまた、その第2の鎖上にMEに相補的である配列を含む。
第2のアダプターは、その第1の鎖上の5’から3’へ、B15、A2、UMI、及びMEの配列を含む。UMIは、A2とMEとの間に位置する。第2のアダプターはまた、その第2の鎖上にMEに相補的である配列を含む。第1及び第2のアダプターはビオチンタグを含む。
図5Bに示され、実施例4に記載されるように、UMIライブラリーを作製する例示的な方法は、(1)二本鎖核酸ライブラリーを作製することであって、ライブラリー中の各断片はUMIを含み、方法は、(a)二本鎖標的核酸を含む試料を、(i)第1のトランスポザーゼと、(ii)第1の3’末端トランスポゾン末端配列、第1のアダプター配列、及び第1のUMIを含む第1のトランスポゾンと、(iii)第1の3’末端トランスポゾン末端配列に完全に又は部分的に相補的である配列を含む第2のトランスポゾンと、を含む、第1のトランスポソーム複合体に適用することを含む、ことと、(2)二本鎖標的核酸を第1及び第2のトランスポゾンでタグメンテーションして、第1のアダプター配列及び第1のUMIを含む二本鎖標的核酸断片を生成することと、(3)二本鎖標的核酸断片を第1のトランスポソーム複合体から遊離させることと、(4)任意選択的に、二本鎖標的核酸断片を伸長させることと、(5)UMIを含む二本鎖標的核酸断片を生成することと、(7)二本鎖標的核酸断片を増幅することと、を含む。
この例示的な方法において、第1のトランスポゾン内の第1のUMIは、第1のアダプター配列と第1の3’トランスポゾン末端配列との間に位置する。
この例示的な方法は、(1)第2のトランスポザーゼと、(2)第2のアダプター配列及び第2の3’トランスポゾン末端配列を含む第3のトランスポゾンと、(3)第2の3’末端トランスポゾン末端配列に完全に又は部分的に相補的である配列を含む第4のトランスポゾンと、を含む、第2のトランスポソーム複合体を更に含む。
本明細書に記載される例示的なアダプター及び方法を用いて、第1のUMIが二本鎖標的核酸断片の第1の鎖上にあるUMIライブラリーを作製する。
図6Aに示され、実施例5に記載されるように、UMIライブラリーを配列決定する例示的な方法は、暗サイクルと、次の4つのプライマー、すなわち、標準インサートリード1、カスタムi7、標準i5、及びUMI+インサートリード2を含む。
UMIライブラリーを配列決定する別の例示的な方法を使用してもよい。図6Bに示され、実施例6に記載されるように、例示的な方法は、次の4つのプライマー、すなわち、標準インサートリード1、カスタムi7、標準i5、UMIプライマー、及びインサートリード2架橋プライマーを含む。この方法では、UMIプライマーがインサートリード2架橋プライマーによって置換される架橋プライマー再ハイブリダイゼーション工程が使用される。
3.無細胞DNA(cfDNA)から調製されるUMIライブラリーを作製する方法
2つの例示的なアダプターを図9に示す。第1のアダプターは、その第1の鎖上の5’から3’へ、P5、UMI、A14、及びMEの配列を含む。第1のアダプターはまた、その第2の鎖上にMEに相補的である配列を含む。UMIは、P5とA14との間に位置する。
2つの例示的なアダプターを図9に示す。第1のアダプターは、その第1の鎖上の5’から3’へ、P5、UMI、A14、及びMEの配列を含む。第1のアダプターはまた、その第2の鎖上にMEに相補的である配列を含む。UMIは、P5とA14との間に位置する。
第2のアダプターは、その第1の鎖上の5’から3’へ、P7、UMI、B15、及びMEの配列を含む。UMIは、P7とB15との間に位置する。第2のアダプターはまた、その第2の鎖上にMEに相補的である配列を含む。第1及び第2のアダプターはビオチンタグを含む。
図9に示され、実施例7に記載されるように、UMIライブラリーを作製する例示的な方法は、(1)二本鎖核酸ライブラリーを作製することであって、ライブラリー中の各断片はUMIを含み、方法は、(a)二本鎖標的核酸を含む試料を、(i)第1のトランスポザーゼと、(ii)第1の3’末端トランスポゾン末端配列、第1のアダプター配列、及び第1のUMIを含む第1のトランスポゾンと、(iii)第1の3’末端トランスポゾン末端配列に完全に又は部分的に相補的である配列を含む第2のトランスポゾンと、を含む、第1のトランスポソーム複合体に適用することを含む、ことと、(2)二本鎖標的核酸を第1及び第2のトランスポゾンでタグメンテーションして、第1のアダプター配列及び第1のUMIを含む二本鎖標的核酸断片を生成することと、(3)二本鎖標的核酸断片を第1のトランスポソーム複合体から遊離させることと、(4)任意選択的に、二本鎖標的核酸断片を伸長させることと、(5)UMIを含む二本鎖標的核酸断片を生成することと、(7)二本鎖標的核酸断片を増幅することと、を含む。第1のトランスポゾン内の第1のアダプター配列は、第1のUMIと第1の3’トランスポゾン末端配列との間に位置する。
この例示的な方法は、(1)第2のトランスポザーゼと、(2)第2のアダプター配列及び第2の3’トランスポゾン末端配列を含む第3のトランスポゾンと、(3)第2の3’末端トランスポゾン末端配列に完全に又は部分的に相補的である配列を含む第4のトランスポゾンと、を含む、第2のトランスポソーム複合体を更に含む。
この方法は、(1)第3のトランスポゾンが第2のUMIを更に含み、(2)第2のアダプター配列が第2のUMIと第2の3’トランスポゾン末端配列との間に位置する、ことを更に含む。この方法において、タグメンテーション化工程は、(1)第1のアダプター配列及び第1のUMIを含む第1の鎖と、(2)第2のアダプター配列及び第2のUMIを含む第2の鎖と、を含む、二本鎖標的核酸断片を生成する。
本明細書に記載される例示的なアダプター及び方法を用いて、第1のUMIの第1のコピーが二本鎖標的核酸断片の第1の鎖上にあり、第1のUMIの第2のコピーが第2の鎖上にある、UMIライブラリーが作製される。
図9に示され、実施例8に記載されるように、UMIライブラリーを配列決定する例示的な方法は、次の4つのプライマー、すなわち、リード1(標準プライマー)、UMIリード(標準i7プライマー)、UMIリード(標準i5プライマー)及びリード2(標準プライマー)を含む。
UMIライブラリーを配列決定する別の例示的な方法を使用してもよい。図6Bに示され、実施例6に記載されるように、例示的な方法は、次の4つのプライマー、すなわち、標準インサートリード1、カスタムi7、標準i5、UMIプライマー、及びインサートリード2架橋プライマーを含む。この方法では、UMIプライマーがインサートリード2架橋プライマーによって置換される架橋プライマー再ハイブリダイゼーション工程が使用される。
4.UDI及び二重鎖UMIを用いてUMIライブラリーを作製するための第1の方法
2つの例示的なアダプターを図12に示す。第1及び第2のアダプターは、フォーク型アダプターである。
2つの例示的なアダプターを図12に示す。第1及び第2のアダプターは、フォーク型アダプターである。
第1のアダプターは、その第1の鎖上の5’から3’へ、A14、UMI-A、及びMEの配列を含む。第1のアダプターはまた、その第2の鎖上の5’から3’へ、ME’、UMI-A’、及びB15がB15’にハイブリダイズしているB15二重鎖の配列を含む。UMI-Aは、A14とMEとの間に位置する。UMI-A’は、ME’とB15二重鎖との間に位置する。
第2のアダプターは、その第1の鎖上の5’から3’へ、A14、UMI-B、及びMEの配列を含む。第2のアダプターはまた、その第2の鎖上の5’から3’へ、ME’、UMI-B’、及びB15二重鎖の配列を含む。UMI-Bは、A14とMEとの間に位置する。
第1及び第2のアダプターはそれぞれ、ビオチンタグを含む。
図12に示され、実施例9に記載されるように、UMIライブラリーを作製する例示的な方法は、(1)二本鎖標的核酸を含む試料を第1のトランスポソーム複合体及び第2のトランスポソーム複合体に適用することと、(2)二本鎖標的核酸をフォーク型アダプタートランスポゾンでタグメンテーションして、第1のアダプター配列の第1及び第2のコピー、第1のUMI、第2のアダプター配列の第1及び第2のコピー、並びに第2のUMIを含む二本鎖標的核酸断片を生成することと、(3)二本鎖標的核酸断片をトランスポソーム複合体から遊離させることと、(4)任意選択的に、二本鎖標的核酸断片を伸長させることと、(5)フォーク型アダプタートランスポゾン又は伸長させたフォーク型アダプタートランスポゾンを二本鎖標的核酸断片とライゲーションすることと、(6)UMIを含む二本鎖標的核酸断片を生成することと、(7)二本鎖標的核酸断片を増幅することと、を含む。
この方法では、第1のトランスポソーム複合体は、(1)第1のトランスポザーゼと、(2)二本鎖標的核酸断片の第1の鎖上の第1のフォーク型アダプタートランスポゾンとを含み、(i)第1のフォーク型アダプタートランスポゾンの第1の鎖は、第1の3’末端トランスポゾン末端配列、第1のアダプター配列の第1のコピー、及び第1のUMIを含み、(ii)第1のフォーク型アダプタートランスポゾンの第2の鎖は、第2のアダプター配列の第1のコピー、及び第1のフォーク型アダプタートランスポゾンの第1の鎖に完全に又は部分的に相補的である配列を含む。
更に、第2のトランスポソーム複合体は、(1)(i)第2のトランスポザーゼと、(ii)二本鎖標的核酸断片の第2の鎖上の第2のフォーク型アダプタートランスポゾンとを含む、第2のトランスポソーム複合体を含み、(a)第2のフォーク型アダプタートランスポゾンの第1の鎖は、第2の3’末端トランスポゾン末端配列、第1のアダプター配列の第2のコピー、及び第2のUMIを含み、(b)第2のフォーク型アダプタートランスポゾンの第2の鎖は、第2のアダプターの第2のコピー、及び第2のフォーク型アダプタートランスポゾンの第1の鎖に完全に又は部分的に相補的である配列を含む。
図6Aに示され、実施例5に記載されるように、UMIライブラリーを配列決定する例示的な方法は、暗サイクルと、次の4つのプライマー、すなわち、標準インサートリード1、カスタムi7、標準i5、及びUMI+インサートリード2を含む。
UMIライブラリーを配列決定する別の例示的な方法を使用してもよい。図6Bに示され、実施例6に記載されるように、例示的な方法は、次の4つのプライマー、すなわち、標準インサートリード1、カスタムi7、標準i5、UMIプライマー、及びインサートリード2架橋プライマーを含む。この方法では、UMIプライマーがインサートリード2架橋プライマーによって置換される架橋プライマー再ハイブリダイゼーション工程が使用される。
図12に示され、実施例10に記載されるように、UMIライブラリーを配列決定する例示的な方法は、暗サイクルと、次のプライマー、すなわち、A14リード、B15リード、i7リード、及びi5リードを含む。
5.UDI及び二重鎖UMIを用いてUMIライブラリーを作製するための第2の方法
2つの例示的なアダプターを図13に示す。第1及び第2のアダプターは、フォーク型アダプターである。UMIライブラリーを作製するこの方法で二重鎖配列決定を使用するために、各フォーク型アダプター内のUMIのアニール対は相補的ではない。(比較のために図12を参照)。
2つの例示的なアダプターを図13に示す。第1及び第2のアダプターは、フォーク型アダプターである。UMIライブラリーを作製するこの方法で二重鎖配列決定を使用するために、各フォーク型アダプター内のUMIのアニール対は相補的ではない。(比較のために図12を参照)。
この方法における各アダプターは二本鎖であり、各鎖上に1つのUMIを有する2つのUMIを含有する(図13)。2つの鎖をME領域でアニーリングして、非相補的な二重鎖UMIを有するフォーク型アダプターを生成する。二重鎖UMIは相補的配列を含まないため、各アダプターは互いに別々にアニーリングされる。
第1のアダプターは、その第1の鎖上の5’から3’へ、A14、A、UMI-1、X、及びMEの配列を含む。第1のアダプターはまた、その第2の鎖上の5’から3’へ、ME’、Y、UMI-2’、B、及びB15がB15’にハイブリダイズしているB15二重鎖の配列を含む。UMI-1は、AとUMI-1との間に位置する。UMI-2’は、ME’とBとの間に位置する。
第2のアダプターは、その第1の鎖上の5’から3’へ、A14、A、UMI-4’、X、及びMEの配列を含む。第2のアダプターはまた、その第2の鎖上の5’から3’へ、ME’、Y’、UMI-3、B、及びB15二重鎖の配列を含む。UMI-4’は、AとXとの間に位置する。UMI-3は、BとY’との間に位置する。
第1及び第2のアダプターはそれぞれ、ビオチンタグを含む。
図13に示され、実施例11に記載されるように、UMIライブラリーを作製する例示的な方法は、(1)二本鎖標的核酸を含む試料を第1のトランスポソーム複合体及び第2のトランスポソーム複合体に適用することと、(2)二本鎖標的核酸をフォーク型アダプタートランスポゾンでタグメンテーションして、第1のアダプター配列の第1及び第2のコピー、第1のUMI、第2のアダプター配列の第1及び第2のコピー、並びに第2のUMIを含む二本鎖標的核酸断片を生成することと、(3)二本鎖標的核酸断片をトランスポソーム複合体から遊離させることと、(4)任意選択的に、二本鎖標的核酸断片を伸長させることと、(5)フォーク型アダプタートランスポゾン又は伸長させたフォーク型アダプタートランスポゾンを二本鎖標的核酸断片とライゲーションすることと、(6)UMIを含む二本鎖標的核酸断片を生成することと、(7)二本鎖標的核酸断片を増幅することと、を含む。
この方法では、第1のトランスポソーム複合体は、(1)第1のトランスポザーゼと、(2)二本鎖標的核酸断片の第1の鎖上の第1のフォーク型アダプタートランスポゾンとを含み、(i)第1のフォーク型アダプタートランスポゾンの第1の鎖は、第1の3’末端トランスポゾン末端配列、第1のアダプター配列の第1のコピー、及び第1のUMIを含み、(ii)第1のフォーク型アダプタートランスポゾンの第2の鎖は、第2のアダプター配列の第1のコピー、及び第1のフォーク型アダプタートランスポゾンの第1の鎖に完全に又は部分的に相補的である配列を含む。
更に、第2のトランスポソーム複合体は、(1)(i)第2のトランスポザーゼと、(ii)二本鎖標的核酸断片の第2の鎖上の第2のフォーク型アダプタートランスポゾンとを含む、第2のトランスポソーム複合体を含み、(a)第2のフォーク型アダプタートランスポゾンの第1の鎖は、第2の3’末端トランスポゾン末端配列、第1のアダプター配列の第2のコピー、及び第2のUMIを含み、(b)第2のフォーク型アダプタートランスポゾンの第2の鎖は、第2のアダプターの第2のコピー、及び第2のフォーク型アダプタートランスポゾンの第1の鎖に完全に又は部分的に相補的である配列を含む。
更に、(1)第1のフォーク型アダプタートランスポゾンの第1の鎖は、第3アダプター配列を更に含み、(2)第1のフォーク型アダプタートランスポゾンの第2の鎖は、第4アダプター配列及び第3のUMIを更に含み、(3)第2のフォーク型アダプタートランスポゾンの第1の鎖は、第3アダプター配列に完全に又は部分的に相補的である配列を更に含み、(4)第2のフォーク型アダプタートランスポゾンの第2の鎖は、第4アダプター配列及び第4のUMIに完全に又は部分的に相補的である配列を更に含み、(5)タグメンテーション化工程は、第3のUMI及び第4のUMIを更に含む二本鎖標的核酸断片を生成する。
図13に示され、実施例12に記載されるように、UMIライブラリーを配列決定する例示的な方法は、暗サイクルと、次の6つのカスタムプライマー、すなわち、カスタム1、カスタムUMI i7、カスタムi7、カスタム2、カスタムUMI i5、及びカスタムi5を含む。
6.ヘアピンUMI及びユニバーサルハイブリダイズテールを含むアダプターを使用してインラインUMIを生成する方法
例示的な3’アダプターを図14に示し、実施例13に記載する。アダプターは、5’から3’へ、ユニバーサルハイブリダイズテール、ヘアピンUMI、ME’、及びB15を含む。ヘアピンUMIは、バルジを形成する3又は4塩基対ステム構造を含む。ユニバーサルハイブリダイズテールは、任意のDNA分子に結合できるイノシンを含み、これは転移鎖の露出した5’塩基へのハイブリダイゼーションを可能にする。
例示的な3’アダプターを図14に示し、実施例13に記載する。アダプターは、5’から3’へ、ユニバーサルハイブリダイズテール、ヘアピンUMI、ME’、及びB15を含む。ヘアピンUMIは、バルジを形成する3又は4塩基対ステム構造を含む。ユニバーサルハイブリダイズテールは、任意のDNA分子に結合できるイノシンを含み、これは転移鎖の露出した5’塩基へのハイブリダイゼーションを可能にする。
実施例13に記載されるように、インラインUMIを用いてUMIライブラリーを作製する例示的な方法は、(1)二本鎖標的核酸を含む試料を、(i)トランスポザーゼと、(ii)第1の3’末端トランスポゾン末端配列及び第1のアダプター配列を含むトランスポゾンと、を含むトランスポソーム複合体に適用することと、(2)二本鎖標的核酸の第1の鎖をトランスポゾンでタグメンテーションして、第1のアダプター配列を含む二本鎖標的核酸断片を生成することと、(3)二本鎖標的核酸断片をトランスポソーム複合体から遊離させることと、(4)第2のアダプター配列、UMI、及び第1の3’末端トランスポゾン配列に完全に又は部分的に相補的である配列を含むポリヌクレオチドをハイブリダイズさせることと、(5)ポリヌクレオチドを、二本鎖標的核酸断片とライゲーションすることと、(6)UMIを含む二本鎖標的核酸断片を生成することであって、UMIは、挿入DNAの3’末端に直接隣接して位置する、ことと、(7)二本鎖標的核酸断片を増幅することと、を含む。
更にライゲーション工程は、二本鎖標的核酸断片の第2の鎖の3’末端とユニバーサルハイブリダイズテールの5’末端とのライゲーションを含む。
更に、ヘアピンUMIは、伸長工程及び/又はライゲーション工程中は安定であるが、増幅工程中は安定ではない。
この方法によれば、UMIは、二本鎖標的核酸断片の第1の鎖上にある。
本明細書に記載される例示的なアダプター及び方法は、インラインUMIが挿入DNAの3’末端に隣接するUMIライブラリーを作製する(図20)。標準的な配列決定法を用いて、各UMI及びインサートDNA配列を、ME配列を配列決定することなく、リード2を使用して捕捉する。UMIライブラリーを作製するためのこの例示的なアダプター及び方法の使用は、UMIライブラリーが配列決定されるときの暗サイクルの必要性を排除する。
7.ヘアピンUMIを含むインラインUMIの製造方法
例示的な3’アダプターを図15に示し、実施例14に記載する。アダプターは、5’から3’へ、ヘアピンUMI、ME’、及びB15を含むポリヌクレオチドである。ヘアピンUMIは、バルジを形成する3又は4塩基対ステム構造を含む。
例示的な3’アダプターを図15に示し、実施例14に記載する。アダプターは、5’から3’へ、ヘアピンUMI、ME’、及びB15を含むポリヌクレオチドである。ヘアピンUMIは、バルジを形成する3又は4塩基対ステム構造を含む。
実施例14に記載されるように、インラインUMIを用いてUMIライブラリーを作製する例示的な方法は、(1)二本鎖標的核酸を含む試料を、(i)トランスポザーゼと、(ii)第1の3’末端トランスポゾン末端配列及び第1のアダプター配列を含むトランスポゾンと、を含むトランスポソーム複合体に適用することと、(2)二本鎖標的核酸の第1の鎖をトランスポゾンでタグメンテーションして、第1のアダプター配列を含む二本鎖標的核酸断片を生成することと、(3)二本鎖標的核酸断片をトランスポソーム複合体から遊離させることと、(4)第2のアダプター配列、UMI、及び第1の3’末端トランスポゾン配列に完全に又は部分的に相補的である配列を含むポリヌクレオチドをハイブリダイズさせることと、(5)二本鎖標的核酸断片の第2の鎖を伸張させることと、(6)伸張させたポリヌクレオチドを、二本鎖標的核酸断片とライゲーションすることと、(7)UMIを含む二本鎖標的核酸断片を生成することであって、UMIは、挿入DNAの3’末端に直接隣接して位置する、ことと、(8)二本鎖標的核酸断片を増幅することと、を含む。
更に、伸長工程は、二本鎖標的核酸断片の第2の鎖の3’末端からヘアピンUMIの5’末端まで伸長させることを含む。
更に、ライゲーション工程は、二本鎖標的核酸断片の第2の鎖の3’末端とはピンUMIの5’末端とのライゲーションを含む。
更に、ヘアピンUMIは、伸長工程及び/又はライゲーション工程中は安定であるが、増幅工程中は安定ではない。
この方法によれば、UMIは、二本鎖標的核酸断片の第1の鎖上にある。
本明細書に記載される例示的なアダプター及び方法は、UMIが挿入DNAの3’末端に隣接するUMIライブラリーを作製する(図20)。標準的な配列決定法を用いて、各UMI及びインサートDNA配列を、ME配列を配列決定することなく、リード2を使用して捕捉する。UMIライブラリーを作製するためのこの例示的なアダプター及び方法の使用は、UMIライブラリーが配列決定されるときの暗サイクルの必要性を排除する。
8.スプリントライゲーションアダプターを含むインラインUMIを製造するための第1の方法
例示的な3’アダプターを図16に示し、実施例15aに記載する。アダプターは、部分的二本鎖を含む3’スプリントライゲーションアダプター複合体を含むポリヌクレオチドである。アダプターの2つの部分は、スプリント(図16、3’スプリントライゲーションアダプター、下の鎖を参照)、及びテール(図16、3’スプリントライゲーションアダプター、上の鎖を参照)である。スプリント部分は、5’から3’へ、ME、UMI’、ME’、切断A14’を含む。テール部分は、5’から3’へ、UMI、ME’及びB15を含む。複合体は、UMI及びME配列のハイブリダイゼーションによって形成される。
例示的な3’アダプターを図16に示し、実施例15aに記載する。アダプターは、部分的二本鎖を含む3’スプリントライゲーションアダプター複合体を含むポリヌクレオチドである。アダプターの2つの部分は、スプリント(図16、3’スプリントライゲーションアダプター、下の鎖を参照)、及びテール(図16、3’スプリントライゲーションアダプター、上の鎖を参照)である。スプリント部分は、5’から3’へ、ME、UMI’、ME’、切断A14’を含む。テール部分は、5’から3’へ、UMI、ME’及びB15を含む。複合体は、UMI及びME配列のハイブリダイゼーションによって形成される。
実施例15aに記載されるように、インラインUMIを用いてUMIライブラリーを作製する例示的な方法は、(1)二本鎖標的核酸を含む試料を、(i)トランスポザーゼと、(ii)第1の3’末端トランスポゾン末端配列及び第1のアダプター配列を含むトランスポゾンと、を含むトランスポソーム複合体に適用することと、(2)二本鎖標的核酸の第1の鎖をトランスポゾンでタグメンテーションして、第1のアダプター配列を含む二本鎖標的核酸断片を生成することと、(3)二本鎖標的核酸断片をトランスポソーム複合体から遊離させることと、(4)第2のアダプター配列、UMI、及び第1の3’末端トランスポゾン配列に完全に又は部分的に相補的である配列を含むポリヌクレオチドをハイブリダイズさせることと、(5)ポリヌクレオチドを、二本鎖標的核酸断片とライゲーションすることと、(6)UMIを含む二本鎖標的核酸断片を生成することであって、UMIは、挿入DNAの3’末端に直接隣接して位置する、ことと、(7)二本鎖標的核酸断片を増幅することと、を含む。
更に、伸長工程は、二本鎖標的核酸断片の第2の鎖の3’末端からスプリントライゲーションアダプターの5’末端まで9塩基伸長させることを含む。
更に、ライゲーション工程は、伸長させた二本鎖標的核酸断片の第2の鎖の3’末端とスプリントライゲーションアダプターの第1の鎖の5’末端とのライゲーションを含む。
この方法によれば、UMIは、二本鎖標的核酸断片の第1の鎖上にある。
本明細書に記載される例示的なアダプター及び方法は、UMIが挿入DNAの3’末端に隣接するUMIライブラリーを作製する(図20)。標準的な配列決定法を用いて、各UMI及びインサートDNA配列を、ME配列を配列決定することなく、リード2を使用して捕捉する。UMIライブラリーを作製するためのこの例示的なアダプター及び方法の使用は、UMIライブラリーが配列決定されるときの暗サイクルの必要性を排除する。
9.スプリントライゲーションアダプターを含むインラインUMIを製造するための第2の方法
例示的な3’アダプターを図16に示し、実施例15bに記載する。アダプターは、部分的二本鎖を含む3’スプリントライゲーションアダプター複合体を含むポリヌクレオチドである。アダプターの2つの部分は、スプリント(図16、3’スプリントライゲーションアダプター、下の鎖を参照)、及びテール(図16、3’スプリントライゲーションアダプター、上の鎖を参照)である。スプリント部分は、5’から3’へ、X、UMI’、ME’、切断A14’を含み、このとき、Xは、完全長又は切断型であり得る3’TruSeq(商標)アダプター配列である。テール部分は、5’から3’へ、UMI、X’及びB15を含む。複合体は、UMI及びX配列のハイブリダイゼーションによって形成される。
例示的な3’アダプターを図16に示し、実施例15bに記載する。アダプターは、部分的二本鎖を含む3’スプリントライゲーションアダプター複合体を含むポリヌクレオチドである。アダプターの2つの部分は、スプリント(図16、3’スプリントライゲーションアダプター、下の鎖を参照)、及びテール(図16、3’スプリントライゲーションアダプター、上の鎖を参照)である。スプリント部分は、5’から3’へ、X、UMI’、ME’、切断A14’を含み、このとき、Xは、完全長又は切断型であり得る3’TruSeq(商標)アダプター配列である。テール部分は、5’から3’へ、UMI、X’及びB15を含む。複合体は、UMI及びX配列のハイブリダイゼーションによって形成される。
実施例15bに記載されるように、インラインUMIを用いてUMIライブラリーを作製する例示的な方法は、(1)二本鎖標的核酸を含む試料を、(i)トランスポザーゼと、(ii)第1の3’末端トランスポゾン末端配列及び第1のアダプター配列を含むトランスポゾンと、を含むトランスポソーム複合体に適用することと、(2)二本鎖標的核酸の第1の鎖をトランスポゾンでタグメンテーションして、第1のアダプター配列を含む二本鎖標的核酸断片を生成することと、(3)二本鎖標的核酸断片をトランスポソーム複合体から遊離させることと、(4)第2のアダプター配列、UMI、及び第1の3’末端トランスポゾン配列に完全に又は部分的に相補的である配列を含むポリヌクレオチドをハイブリダイズさせることと、(5)ポリヌクレオチドを、二本鎖標的核酸断片とライゲーションすることと、(6)UMIを含む二本鎖標的核酸断片を生成することであって、UMIは、挿入DNAの3’末端に直接隣接して位置する、ことと、(7)二本鎖標的核酸断片を増幅することと、を含む。
更に、伸長工程は、二本鎖標的核酸断片の第2の鎖の3’末端からスプリントライゲーションアダプターの5’末端まで9塩基伸長させることを含む。
更に、ライゲーション工程は、伸長させた二本鎖標的核酸断片の第2の鎖の3’末端とスプリントライゲーションアダプターの第1の鎖の5’末端とのライゲーションを含む。
この方法によれば、UMIは、二本鎖標的核酸断片の第1の鎖上にある。
本明細書に記載される例示的なアダプター及び方法は、UMIが挿入DNAの3’末端に隣接するUMIライブラリーを作製する(図20)。標準的な配列決定法を用いて、各UMI及びインサートDNA配列を、ME配列を配列決定することなく、リード2を使用して捕捉する。UMIライブラリーを作製するためのこの例示的なアダプター及び方法の使用は、UMIライブラリーが配列決定されるときの暗サイクルの必要性を排除する。
10.3’鋳型スイッチオリゴヌクレオチドを含むインラインUMIを製造するための第1の方法
例示的な3’アダプターを図17に示し、実施例16aに記載する。アダプターは、長さが約70ヌクレオチドの鋳型スイッチオリゴヌクレオチドを含むポリヌクレオチドであり、5’から3’へ、B15’、ME又はX、UMI’、ME’、及びA14’を含有する。
例示的な3’アダプターを図17に示し、実施例16aに記載する。アダプターは、長さが約70ヌクレオチドの鋳型スイッチオリゴヌクレオチドを含むポリヌクレオチドであり、5’から3’へ、B15’、ME又はX、UMI’、ME’、及びA14’を含有する。
実施例16aに記載されるように、インラインUMIを用いてUMIライブラリーを作製する例示的な方法は、(1)二本鎖標的核酸を含む試料を、(i)トランスポザーゼと、(ii)第1の3’末端トランスポゾン末端配列及び第1のアダプター配列を含むトランスポゾンと、を含むトランスポソーム複合体に適用することと、(2)二本鎖標的核酸の第1の鎖をトランスポゾンでタグメンテーションして、第1のアダプター配列を含む二本鎖標的核酸断片を生成することと、(3)二本鎖標的核酸断片をトランスポソーム複合体から遊離させることと、(4)第2のアダプター配列、UMI、及び第1の3’末端トランスポゾン配列に完全に又は部分的に相補的である配列を含むポリヌクレオチドをハイブリダイズさせることと、(5)ポリヌクレオチドを、二本鎖標的核酸断片とライゲーションすることと、(6)UMIを含む二本鎖標的核酸断片を生成することであって、UMIは、挿入DNAの3’末端に直接隣接して位置する、ことと、(7)二本鎖標的核酸断片を増幅することと、を含む。
更に、伸長工程は、(1)二本鎖標的核酸断片の第1の鎖をコピーすることによって、二本鎖標的核酸断片の第2の鎖の3’末端から鋳型スイッチオリゴヌクレオチド内の接合部まで伸長させることと、(2)鋳型を第1の鎖から3’鋳型スイッチオリゴヌクレオチドの不対領域に切り替えることと、(3)3’鋳型スイッチオリゴヌクレオチドの不対領域を接合部から3’鋳型スイッチオリゴヌクレオチドの不対領域の5’末端にコピーすることと、を含む。
この方法によれば、UMIは、二本鎖標的核酸断片の第1の鎖上にある。
本明細書に記載される例示的なアダプター及び方法は、UMIが挿入DNAの3’末端に隣接するUMIライブラリーを作製する(図20)。標準的な配列決定法を用いて、各UMI及びインサートDNA配列を、ME配列を配列決定することなく、リード2を使用して捕捉する。UMIライブラリーを作製するためのこの例示的なアダプター及び方法の使用は、UMIライブラリーが配列決定されるときの暗サイクルの必要性を排除する。
11.オリゴヌクレオチドがA14’中に修飾を含む、鋳型スイッチオリゴヌクレオチドを含むインラインUMIを作製するための第2の方法
例示的な3’アダプターを図17に示し、実施例16bに記載する。アダプターは、長さが約70ヌクレオチドの鋳型スイッチオリゴヌクレオチドを含むポリヌクレオチドであり、5’から3’へ、B15’、ME又はX、UMI’、ME’、及び任意選択的にA14’の一部を含有する。A14’配列は切断又は除去されている。したがって、このアダプターは、上記II.G.10におけるアダプターがA14’配列を有することを除いて、上記II.G.10において説明されたアダプターと同じであるが、この実施形態では、A14’配列は、切断されるか又は除去されている。
例示的な3’アダプターを図17に示し、実施例16bに記載する。アダプターは、長さが約70ヌクレオチドの鋳型スイッチオリゴヌクレオチドを含むポリヌクレオチドであり、5’から3’へ、B15’、ME又はX、UMI’、ME’、及び任意選択的にA14’の一部を含有する。A14’配列は切断又は除去されている。したがって、このアダプターは、上記II.G.10におけるアダプターがA14’配列を有することを除いて、上記II.G.10において説明されたアダプターと同じであるが、この実施形態では、A14’配列は、切断されるか又は除去されている。
実施例16bに記載されるように、この例示的な方法は、上記のII.G.10に開示される工程を含む。
この方法によれば、UMIは、二本鎖標的核酸断片の第1の鎖上にある。
本明細書に記載される例示的なアダプター及び方法は、UMIが挿入DNAの3’末端に隣接するUMIライブラリーを作製する(図20)。標準的な配列決定法を用いて、各UMI及びインサートDNA配列を、ME配列を配列決定することなく、リード2を使用して捕捉する。UMIライブラリーを作製するためのこの例示的なアダプター及び方法の使用は、UMIライブラリーが配列決定されるときの暗サイクルの必要性を排除する。
12.5’二本鎖アダプター、ポリメラーゼ伸長工程、及び近接ライゲーション工程を含む、インラインUMIを製造するための方法
例示的なアダプターは、図19Bに示される。アダプターは、2つのオリゴヌクレオチドを含む5’二本鎖を含む。第1のオリゴヌクレオチドは、5’から3’へ、B15、X、及びUMIを含む。第2のオリゴヌクレオチドは、5’から3’へ、UMI’、X’、及びB15’を含む。第1及び第2のオリゴヌクレオチドはハイブリダイズされ、二本鎖アダプターを形成する。
例示的なアダプターは、図19Bに示される。アダプターは、2つのオリゴヌクレオチドを含む5’二本鎖を含む。第1のオリゴヌクレオチドは、5’から3’へ、B15、X、及びUMIを含む。第2のオリゴヌクレオチドは、5’から3’へ、UMI’、X’、及びB15’を含む。第1及び第2のオリゴヌクレオチドはハイブリダイズされ、二本鎖アダプターを形成する。
実施例16dに記載され、図19A~図19Cに示されるように、インラインUMIを用いてUMIライブラリーを作製する例示的な方法は、(1)二本鎖標的核酸を含む試料を、(i)トランスポザーゼと、(ii)第1の3’末端トランスポゾン末端配列及び第1のアダプター配列を含むトランスポゾンと、を含むトランスポソーム複合体に適用することと、(2)二本鎖標的核酸の第1の鎖をトランスポゾンでタグメンテーションして、第1のアダプター配列を含む二本鎖標的核酸断片を生成することと、(3)二本鎖標的核酸断片をトランスポソーム複合体から遊離させることと、(4)UMI及び第2のアダプター配列を含む第1のポリヌクレオチドをハイブリダイズさせることと、(5)第1のポリヌクレオチドに相補的な領域を含む第2のポリヌクレオチドを付加して二本鎖アダプターを生成することと、(6)二本鎖標的核酸断片の第2の鎖を伸長させることと、(7)二本鎖アダプターを二本鎖標的核酸断片とライゲーションすることと、(8)UMIを含む二本鎖標的核酸断片を生成することであって、UMIは、二本鎖標的核酸断片と第2のアダプター配列との間に位置する、ことと、(9)二本鎖標的核酸断片を増幅することと、を含む。上記ライゲーション工程は、(図19Bに示されるように)ライゲーションされる5’リン酸及び3’OHが同じ鋳型鎖にハイブリダイズされないため、「近接ライゲーション」と呼ばれる。
本明細書に記載される例示的なアダプター及び方法は、UMIが挿入DNAの3’末端に隣接するUMIライブラリーを作製する(図19d)。標準的な配列決定法を用いて、各UMI及びインサートDNA配列を、ME配列を配列決定することなく、リード2を使用して捕捉する。UMIライブラリーを作製するためのこの例示的なアダプター及び方法の使用は、UMIライブラリーが配列決定されるときの暗サイクルの必要性を排除する。
13.5’一本鎖ポリメラーゼ鋳型スイッチオリゴヌクレオチドを含むインラインUMIを製造するための方法
例示的なアダプターは、図18Bに示される。アダプターは、5’から3’へ、B15、X、及びUMIを有する5’ポリメラーゼ鋳型スイッチオリゴヌクレオチドを含む。
例示的なアダプターは、図18Bに示される。アダプターは、5’から3’へ、B15、X、及びUMIを有する5’ポリメラーゼ鋳型スイッチオリゴヌクレオチドを含む。
実施例16cに記載され、図18A~図18Cに示されるように、インラインUMIを用いてUMIライブラリーを作製する例示的な方法は、(1)二本鎖標的核酸を含む試料を、(i)トランスポザーゼと、(ii)第1の3’末端トランスポゾン末端配列及び第1のアダプター配列を含むトランスポゾンと、を含むトランスポソーム複合体に適用することと、(2)二本鎖標的核酸の第1の鎖をトランスポゾンでタグメンテーションして、第1のアダプター配列を含む二本鎖標的核酸断片を生成することと、(3)二本鎖標的核酸断片をトランスポソーム複合体から遊離させることと、(4)UMI及び第2のアダプター配列を含む第1のポリヌクレオチドをハイブリダイズさせることと、(5)二本鎖標的核酸断片の第2の鎖を伸長させることと、(6)第1のポリヌクレオチドをコピーすることと、(7)UMIを含む二本鎖標的核酸断片を生成することであって、UMIは、二本鎖標的核酸断片と第2のアダプター配列との間に位置する、ことと、(9)二本鎖標的核酸断片を増幅することと、を含む。上記の伸長工程は、標的核酸鎖からアダプター鎖への鋳型スイッチを含む。
本明細書に記載される例示的なアダプター及び方法は、UMIが挿入DNAの3’末端に隣接するUMIライブラリーを作製する(図18d)。標準的な配列決定法を用いて、各UMI及びインサートDNA配列を、ME配列を配列決定することなく、リード2を使用して捕捉する。UMIライブラリーを作製するためのこの例示的なアダプター及び方法の使用は、UMIライブラリーが配列決定されるときの暗サイクルの必要性を排除する。
H.試料及び標的核酸
本開示に従って使用される生物学的試料は、標的核酸を含む任意のタイプであり得る。しかしながら、試料は完全に精製される必要はなく、例えば、タンパク質と混合された核酸、他の核酸種、他の細胞成分、及び/又は任意の他の夾雑物を含むことができる。いくつかの実施形態では、生体試料は、核酸、タンパク質、他の核酸種、他の細胞成分、及び/又はインビボで見られるものとほぼ同じ割合で存在する任意の他の夾雑物の混合物を含む。例えば、いくつかの実施形態では、成分は、無傷細胞に見られるものと同じ割合で見出される。いくつかの実施形態では、生体試料は、2.0、1.9、1.8、1.7、1.6、1.5、1.4、1.3、1.2、1.1、1.0、0.9、0.8、0.7、又は0.60以下の260/280吸光度比を有する。いくつかの実施形態では、生体試料は、少なくとも2.0、1.9、1.8、1.7、1.6、1.5、1.4、1.3、1.2、1.1、1.0、0.9、0.8、0.7、又は0.60の260/280吸光度比を有する。本明細書で提供される方法により、核酸を固形支持体に結合させることができるため、他の夾雑物は、表面結合タグメンテーションが生じた後に固形支持体を洗浄するだけで除去することができる。生体試料は、例えば、粗細胞溶解物又は全細胞を含み得る。例えば、本明細書に記載の方法において固体支持体に適用される粗細胞溶解物は、他の細胞成分から核酸を単離するために従来から使用している分離工程のうちの1つ以上が行われる必要はない。例示的な分離工程は、Maniatis et al.,Molecular Cloning:A Laboratory Manual,2d Edition,1989、及びShort Protocols in Molecular Biology,ed.Ausubel,et alに記載され、参照により本明細書に組み込まれる。
本開示に従って使用される生物学的試料は、標的核酸を含む任意のタイプであり得る。しかしながら、試料は完全に精製される必要はなく、例えば、タンパク質と混合された核酸、他の核酸種、他の細胞成分、及び/又は任意の他の夾雑物を含むことができる。いくつかの実施形態では、生体試料は、核酸、タンパク質、他の核酸種、他の細胞成分、及び/又はインビボで見られるものとほぼ同じ割合で存在する任意の他の夾雑物の混合物を含む。例えば、いくつかの実施形態では、成分は、無傷細胞に見られるものと同じ割合で見出される。いくつかの実施形態では、生体試料は、2.0、1.9、1.8、1.7、1.6、1.5、1.4、1.3、1.2、1.1、1.0、0.9、0.8、0.7、又は0.60以下の260/280吸光度比を有する。いくつかの実施形態では、生体試料は、少なくとも2.0、1.9、1.8、1.7、1.6、1.5、1.4、1.3、1.2、1.1、1.0、0.9、0.8、0.7、又は0.60の260/280吸光度比を有する。本明細書で提供される方法により、核酸を固形支持体に結合させることができるため、他の夾雑物は、表面結合タグメンテーションが生じた後に固形支持体を洗浄するだけで除去することができる。生体試料は、例えば、粗細胞溶解物又は全細胞を含み得る。例えば、本明細書に記載の方法において固体支持体に適用される粗細胞溶解物は、他の細胞成分から核酸を単離するために従来から使用している分離工程のうちの1つ以上が行われる必要はない。例示的な分離工程は、Maniatis et al.,Molecular Cloning:A Laboratory Manual,2d Edition,1989、及びShort Protocols in Molecular Biology,ed.Ausubel,et alに記載され、参照により本明細書に組み込まれる。
いくつかの実施形態では、固体支持体に適用される試料は、1.7以下である260/280吸光度比を有する。
したがって、いくつかの実施形態では、生体試料は、例えば、血液、血漿、血清、リンパ液、粘液、痰、尿、精液、脳脊髄液、気管支吸引液、糞便、及びそれらの浸軟組織、若しくはそれらの溶解物、又は核酸を含む任意の他の生体標本を含み得る。
いくつかの実施形態では、試料は、血液である。いくつかの実施形態では、試料は、細胞溶解物である。いくつかの実施形態では、細胞溶解物は、粗細胞溶解物である。いくつかの実施形態では、方法は、試料を固体支持体に適用した後に試料中の細胞を溶解して、細胞溶解物を生成する工程を更に含む。
いくつかの実施形態では、試料は、生検試料である。いくつかの実施形態では、生検試料は、液体又は固体試料である。いくつかの実施形態では、がん患者由来の生検試料を使用して、対象が予測遺伝子中に特定の変異又はバリアントを有するかどうかを決定するために、目的の配列を評価する。
本明細書に提示される方法及び組成物の1つの利点は、フローセルに生体試料を添加することができ、その後の溶解工程及び精製工程は、フローセルに必要な試薬を流すだけで、更なる移動又は取り扱い工程なしにフローセル内で全て生じ得ることである。
1.DNA
いくつかの実施形態では、試料は、標的二本鎖DNAを含む。いくつかの実施形態では、DNAは、ゲノムDNAである。いくつかの実施形態では、DNAは、無細胞DNA(cfDNA)である。いくつかの実施形態では、DNAは、循環腫瘍DNA(ctDNA)である。いくつかの実施形態では、DNAは、以下のセクションII.H.3で詳細に説明されるDNA:RNA二重鎖である。
いくつかの実施形態では、試料は、標的二本鎖DNAを含む。いくつかの実施形態では、DNAは、ゲノムDNAである。いくつかの実施形態では、DNAは、無細胞DNA(cfDNA)である。いくつかの実施形態では、DNAは、循環腫瘍DNA(ctDNA)である。いくつかの実施形態では、DNAは、以下のセクションII.H.3で詳細に説明されるDNA:RNA二重鎖である。
2.RNA
いくつかの実施形態では、試料は、標的RNAを含む。いくつかの実施形態では、試料は、RNA及びDNAを含む。いくつかの実施形態では、標的RNAは、mRNAである。いくつかの実施形態では、標的RNAは、コード、非翻訳領域(UTR)配列、イントロン配列、及び/又は遺伝子間配列を含む。
いくつかの実施形態では、試料は、標的RNAを含む。いくつかの実施形態では、試料は、RNA及びDNAを含む。いくつかの実施形態では、標的RNAは、mRNAである。いくつかの実施形態では、標的RNAは、コード、非翻訳領域(UTR)配列、イントロン配列、及び/又は遺伝子間配列を含む。
いくつかの実施形態では、標的RNAは、捕捉オリゴヌクレオチドの1つ以上の少なくとも部分に対して相補的である配列を含む。
いくつかの実施形態では、標的RNAは、メッセンジャRNA(messenger RNA、mRNA)、転移RNA(transfer RNA、tRNA)、又はリボソームRNA(ribosomal RNA、rRNA)である。適切な捕捉オリゴヌクレオチドは、標的RNAの種類に基づいて設計され得る。
いくつかの実施形態では、標的RNAの3’末端は、捕捉オリゴヌクレオチドに結合する。
いくつかの実施形態では、標的RNAは、mRNAである。いくつかの実施形態では、標的RNAは、ポリアデニル化される(すなわち、アデニン塩基のみを含むRNAのストレッチを含む)。いくつかの実施形態では、mRNAは、ポリAテールを含む。いくつかの実施形態では、mRNAの3’末端は、ポリAテールを含む。
いくつかの実施形態では、標的mRNAは、ポリA配列を含み、ポリT配列を含む捕捉オリゴヌクレオチドに結合する。
3.DNA:RNA二重鎖
いくつかの実施形態では、cDNAは、ライブラリー調製の第1の工程として、RNAを含む試料から合成される。言い換えれば、DNA:RNA二重鎖は、BLTによるタグメンテーションの前に溶液中で生成され得る。いくつかの実施形態では、DNA:RNA二重鎖は、次いで、捕捉オリゴヌクレオチドによってBLT上に捕捉される。いくつかの実施形態では、DNA:RNA二重鎖は、トランスポソーム複合体に含まれるトランスポザーゼに対する親和性に基づいてBLTに直接結合する。
いくつかの実施形態では、cDNAは、ライブラリー調製の第1の工程として、RNAを含む試料から合成される。言い換えれば、DNA:RNA二重鎖は、BLTによるタグメンテーションの前に溶液中で生成され得る。いくつかの実施形態では、DNA:RNA二重鎖は、次いで、捕捉オリゴヌクレオチドによってBLT上に捕捉される。いくつかの実施形態では、DNA:RNA二重鎖は、トランスポソーム複合体に含まれるトランスポザーゼに対する親和性に基づいてBLTに直接結合する。
いくつかの実施形態では、cDNA合成は、逆転写酵素によって行われる。いくつかの実施形態では、このcDNA合成により、DNA:RNA二重鎖が得られ、RNAの鎖にハイブリダイズすることができるDNAの鎖が生成される。いくつかの実施形態では、逆転写酵素ポリメラーゼは、cDNAを合成する条件下で、RNAを含む試料に付加される。いくつかの実施形態では、cDNAを合成するための条件は、RNAに結合することができるヌクレオチド及び/又はプライマー(ポリTプライマー及び/又はランダマープライマーなど)の存在を含む。
いくつかの実施形態では、逆転写酵素は、RNAからDNAを調製するだけである(二本鎖DNAを得るためにDNAの更なるコピーを生成することなく)。
いくつかの実施形態では、溶液中で生成されたDNA:RNA二重鎖は、次いで、BLTに結合され、タグメンテーションされ得る。RNAについて上記のセクションII.H.2に説明されるように、標的RNAは、ポリT配列を含む捕捉オリゴヌクレオチドに結合するポリAテールを含み得る。
いくつかの実施形態では、DNA:RNA二重鎖の断片は、標的RNAのコード、非翻訳領域(UTR)、イントロン、及び/又は遺伝子間配列を生成するために使用することができる。
いくつかの実施形態では、標的RNAからタグ付きDNA:RNA断片の固定化ライブラリーを調製する方法は、cDNAを合成し、DNA:RNA二重鎖を生成するための条件下で、標的RNAを含む試料に逆転写酵素ポリメラーゼを付加することと、DNA:RNA二重鎖を、トランスポソーム複合体が上に固定化された固体支持体に固定化することであって、トランスポソーム複合体が、第1のポリヌクレオチドに結合したトランスポザーゼを含み、第1のポリヌクレオチドが、トランスポゾン末端配列を含む3’部分と、第1のタグと、を含み、試料は、DNA:RNA二重鎖が捕捉オリゴヌクレオチド又はトランスポザーゼに直接結合する条件下で、固体支持体に適用される、固定化することと、DNA:RNA二重鎖が1つの鎖の5’末端にタグ付けされる条件下でトランスポソーム複合体を用いてDNA:RNA二重鎖に対して断片化を行い、それによって、DNA:RNA断片の固定化ライブラリーを産生することであって、少なくとも1つの鎖が、第1のタグで5’タグ付けされている、産生することと、を含む。いくつかの実施形態では、一方の鎖の5’末端は、RNA鎖の5’末端である。いくつかの実施形態では、一方の鎖の5’末端は、DNA鎖の5’末端である。
III.UMIライブラリーを配列決定する方法
本開示は更に、本明細書に提供される方法に従って作製されるUMIライブラリーの配列決定に関する。UMIライブラリーは、合成による配列決定、ライゲーションによる配列決定、ハイブリダイゼーションによる配列決定、ナノポア配列決定などを含む直接配列決定などの任意の適切な配列決定法に従って配列決定することができる。いくつかの実施形態では、ライブラリーは、固体支持体上で配列決定される。いくつかの実施形態では、配列決定のための固体支持体は、表面結合タグメンテーションが起こるものと同じ固体支持体である。いくつかの実施形態では、配列決定のための固体支持体は、増幅が起こるのと同じ固体支持体である。
本開示は更に、本明細書に提供される方法に従って作製されるUMIライブラリーの配列決定に関する。UMIライブラリーは、合成による配列決定、ライゲーションによる配列決定、ハイブリダイゼーションによる配列決定、ナノポア配列決定などを含む直接配列決定などの任意の適切な配列決定法に従って配列決定することができる。いくつかの実施形態では、ライブラリーは、固体支持体上で配列決定される。いくつかの実施形態では、配列決定のための固体支持体は、表面結合タグメンテーションが起こるものと同じ固体支持体である。いくつかの実施形態では、配列決定のための固体支持体は、増幅が起こるのと同じ固体支持体である。
1つの例示的な配列決定方法論は、合成による配列決定(sequencing-by-synthesis、SBS)である。SBSでは、核酸鋳型(例えば標的核酸又はそのアンプリコン)に沿った核酸プライマーの伸長を監視して、鋳型中のヌクレオチドの配列を決定する。基礎となる化学プロセスは、重合(例えば、ポリメラーゼ酵素によって触媒される)であり得る。特定のポリマーベースのSBSの実施形態では、プライマーに付加されるヌクレオチドの順序及び種類の検出を使用して鋳型の配列を決定することができるように、蛍光標識ヌクレオチドを鋳型依存的にプライマーに付加する(それによってプライマーを伸長させる)。
フローセルは、本開示の方法によって生成された、増幅されたDNA断片を収容するための便利な固体支持体を提供する。そのようなフォーマットの1つ以上の増幅されたDNA断片は、サイクル中に試薬を繰り返し送達することを含むSBS又は他の検出技術に供することができる。例えば、第1のSBSサイクルを開始するために、1つ以上の標識されたヌクレオチド、DNAポリメラーゼなどを、1つ以上の増幅された核酸分子を収容するフローセルに流入/通過させることができる。プライマー伸長によって標識ヌクレオチドを組み込む部位は、検出することができる。任意選択的に、ヌクレオチドは、ヌクレオチドがプライマーに付加されると、更なるプライマー伸長を終結する可逆的終結特性を更に含むことができる。例えば、脱ブロック作用因子が送達されてその部分を除去するまで、その後の伸長が起こらないように、可逆的ターミネータ部分を有するヌクレオチド類似体をプライマーに付加することができる。したがって、可逆的終端を使用する実施形態では、脱ブロック試薬をフローセルに送達することができる(検出発生の前又は後)。洗浄は、様々な送達工程の間に実施することができる。次に、サイクルをn回繰り返してプライマーをn個のヌクレオチドで伸長し、それによって長さnの配列を検出することができる。本開示の方法によって産生されるアンプリコンと共に使用するために容易に適合させることができる例示的なSBS手順、流体系及び検出プラットフォームは、例えば、Bentley et al.,Nature 456:53-59(2008)、国際公開第04/018497号、米国特許第7,057,026号、国際公開第91/06678号、同第07/123744号、米国特許第7,329,492号、同第7,211,414号、同第7,315,019号、同第7,405,281号、及び米国特許出願公開第2008/0108082号に記載されており、これらの各々は、参照により本明細書に組み込まれる。
パイロシークエンシングなどの、サイクル反応を使用する他の配列決定手順を使用することができる。パイロシーケンシングは、特定のヌクレオチドが新生核酸鎖に組み込まれるときに無機ピロリン酸(inorganic pyrophosphate、PPi)の放出を検出する(Ronaghi,et al.,Analytical Biochemistry 242(1),84-9(1996)、Ronaghi,Genome Res.11(1),3-11(2001)、Ronaghi et al.Science 281(5375),363(1998)、米国特許第第6,210,891号、同第6,258,568号、及び同第6,274,320号、これらの各々は参照により本明細書に組み込まれる)。パイロシークエンシングでは、放出されたPPiは、ATPスルフリラーゼによってアデノシン三リン酸(adenosine triphosphate、ATP)に即座に変換されることで検出することができ、生成されたATPのレベルは、ルシフェラーゼ産生光子を介して検出することができる。したがって、配列決定反応は、発光検出システムを介して監視することができる。蛍光ベースの検出システムに使用される励起放射線源は、パイロシークエンシング手順には必要ない。本開示により産生された アンプリコンへのパイロ配列決定の適用に適合させることができる有用な流体システム、検出器、及び手順は、例えば、国際出願PCT/US11/57111号、米国特許出願公開第2005/0191698(A1)号、米国特許第7,595,883号、及び同第7,244,559号に記載されており、これらの各々は、参照により本明細書に組み込まれる。
いくつかの実施形態は、DNAポリメラーゼ活性のリアルタイムモニタリングを伴う方法を利用することができる。例えば、ヌクレオチドの取り込みは、フルオロフォア担持ポリメラーゼとγ-リン酸標識ヌクレオチドとの間の蛍光共鳴エネルギー移動(fluorescence resonance energy transfer、FRET)相互作用を介して、又はゼロモード導波路(zeromode waveguide、ZMW)を用いて検出することができる。FRETベースの配列決定のための技術及び試薬は、例えば、Levene et al.Science 299,682-686(2003)、Lundquist et al.Opt.Lett.33,1026-1028(2008)、Korlach et al.Proc.Natl.Acad.Sci.USA 105,1176-1181(2008)に記載され、それらの開示は参照により本明細書に組み込まれる。
いくつかのSBS実施形態は、伸長産物へのヌクレオチドの組み込み時に放出されるプロトンの検出を含む。例えば、放出されたプロトンの検出に基づく配列決定は、Ion Torrent(Guilford,CT、Life Technologiesの子会社)から市販されている電気検出器及び関連技術、又は、米国特許出願公開第2009/0026082(A1)号、同第2009/0127589(A1)号、同第2010/0137143(A1)号、若しくは同第2010/0282617(A1)号に記載されている配列決定方法及びシステムを使用することができ、これらの各々は、参照により本明細書に組み込まれる。動力学的除外を使用して標的核酸を増幅するための本明細書に記載の方法は、プロトンを検出するために使用される基質に容易に適用することができる。より具体的には、本明細書に記載の方法を使用し、プロトンを検出するために使用されるアンプリコンのクローン集団を産生することができる。
別の有用な配列決定技術は、ナノポア配列決定である(例えば、Deamer et al.Trends Biotechnol.18,147-151(2000)、Deamer et al.Acc.Chem.Res.35:817-825(2002)、Li et al.Nat.Mater.2:611-615(2003)を参照されたく、これらの開示は、参照により本明細書に組み込まれる)。いくつかのナノポアの実施形態では、標的核酸又は標的核酸から除去された個々のヌクレオチドは、ナノポアを通過する。核酸又はヌクレオチドがナノポアを通過するとき、各ヌクレオチドの種類は、ポアの電気コンダクタンスの変動を測定することによって識別され得る。(米国特許第7,001,792号、Soni et al.Clin.Chem.53,1996-2001(2007)、Healy,Nanomed.2,459-481(2007)、Cockroft et al.J.Am.Chem.Soc.130,818-820(2008)、これらの開示は、参照により本明細書に組み込まれる)。
本開示による検出に適用することができるアレイベースの発現及び遺伝子型解析のための例示的な方法は、米国特許第7,582,420号、同第6,890,741号、同第6,913,884号、若しくは同第6,355,431号、又は米国特許出願公開第2005/0053980(A1)号、同第2009/0186349(A1)号、若しくは同第2005/0181440(A1)号に記載されており、これらの各々は参照により本明細書に組み込まれる。
本明細書に記載の方法の利点は、複数の標的核酸の迅速かつ効率的な検出を並行して提供することである。したがって、本開示は、上記で例示されるものなどの当該技術分野において既知の技術を使用して核酸を調製及び検出することができる統合システムを提供する。したがって、本開示の統合システムは、増幅試薬及び/又は配列決定試薬を1つ以上の核酸断片に送達することができる流体成分を含むことができ、システムは、ポンプ、弁、リザーバ、流体ラインなどの構成要素を含む。フローセルは、標的核酸を検出するための統合システムで構成及び/又は使用することができる。例示的なフローセルは、例えば、米国特許出願公開第2010/0111768(A1)号及び米国特許出願第13/273,666号に記載され、これらの各々は、参照により本明細書に組み込まれる。フローセルについて例示されるように、統合システムの流体構成要素の1つ以上を増幅方法及び検出方法に使用することができる。核酸配列決定の実施形態を一例として取ると、統合システムの流体構成要素の1つ以上を、本明細書に記載の増幅方法、及び上記に例示したような配列決定方法における配列決定試薬の送達に使用することができる。代替的に、統合システムは、増幅方法を実施し、検出方法を実施するための別々の流体システムを含み得る。増幅された核酸を作成し、また核酸の配列を決定することができる統合配列決定システムの例としては、MiSeq(商標)プラットフォーム(Illumina Inc.,San Diego,CA)、及び参照により本明細書に組み込まれる、米国特許出願第13/273,666号に記載のデバイスが挙げられるが、これらに限定されない。
いくつかの実施形態では、本開示のUMIライブラリーを配列決定する方法は、UMIを配列決定して、DNA配列決定における上昇した感度を提供する。いくつかの実施形態では、配列決定方法は、NextSeq 500/550(Illumina)を含む。
A.暗サイクル
いくつかの実施形態では、カスタム配列決定レシピを調製し、NextSeqソフトウェアを使用して、特定の配列の記録をスキップするために使用される暗サイクルを含むように選択した。その配列の配列決定化学反応は依然として実行されるが、配列決定は機器によって画像化されない。暗サイクルを用いて、配列決定結果を全体的に悪化させ得る、ME配列のライブラリーなどの低多様性配列を繰り返し配列決定することに関するフェージング/プレフェージング問題を軽減する。暗サイクルの後、標的核酸のインサート配列が記録されるように、配列の画像化が再開される。
いくつかの実施形態では、カスタム配列決定レシピを調製し、NextSeqソフトウェアを使用して、特定の配列の記録をスキップするために使用される暗サイクルを含むように選択した。その配列の配列決定化学反応は依然として実行されるが、配列決定は機器によって画像化されない。暗サイクルを用いて、配列決定結果を全体的に悪化させ得る、ME配列のライブラリーなどの低多様性配列を繰り返し配列決定することに関するフェージング/プレフェージング問題を軽減する。暗サイクルの後、標的核酸のインサート配列が記録されるように、配列の画像化が再開される。
カスタム配列決定レシピは、スキップされる配列の長さに及ぶ適切な数の暗サイクルを含むように、標準レシピの変法を含めた。言い換えれば、暗サイクルの数は、スキップが意図される塩基の数に等しい。例えば、スキップされる配列が19塩基長のME配列である場合、19回の暗サイクルが使用される。いくつかの実施形態では、スキップされる配列は、ME配列である。19ヌクレオチド長のMEを有する実施形態では、暗サイクルの数は19である。異なる数のヌクレオチドを有するMEでは、暗サイクルは一般的にヌクレオチドの数である。暗サイクルによる最大の利益を得るために、ユーザはME全体をスキップすることができるが、MEドメイン及びその配列部分の大部分をスキップして、結果におけるそれらのヌクレオチドを無視することも可能である。
いくつかの実施形態では、配列決定法は、データが配列決定法の一部について記録されていない暗サイクルを含む。いくつかの実施形態では、記録されていないデータは、3’トランスポゾン末端配列に関連する配列データである。いくつかの実施形態では、記録されていない配列データは、ME配列である。いくつかの実施形態では、暗サイクルは19サイクルを含む。
いくつかの実施形態では、配列決定法は、暗サイクルを含まない。これらの実施形態では、UMIライブラリーを調製する方法は、各UMIが挿入核酸の3’末端に隣接しており、それらの間にME配列がないため、暗サイクルの必要性を排除する(図20)。
いくつかの実施形態では、カスタムプライマーを使用して暗サイクルの必要性を排除する。これらの実施形態では、カスタムプライマーは、MEと整列する配列を含む架橋プライマーである(図4及び6B)。これらの実施形態では、ME配列は画像化されない。
B.配列決定プライマー
Illuminaライブラリー調製キット及び配列決定プラットフォーム、例えば、Nextera、Illumina Prep、Illumina PCR、AmpliSeq(商標)、TruSight(登録商標)、及びTruSeq(商標)を用いてUMIライブラリーを配列決定するために使用され得る配列決定プライマー及びアダプター配列は、Illumina Adapter Sequences Document#1000000002694 v15に開示されている通りであり、参照によりその全体が本明細書に組み込まれる。これらの配列決定プライマー及びアダプターは、本開示に従って修飾され得る。かかるプライマー及びアダプターの例としては、リード1、リード2、インデックス1リード、インデックス2リード、インデックス1(i7)アダプター、インデックス2(i5)アダプター、インデックスアダプター1~27、TruSeqユニバーサルアダプター、インデックスPCRプライマー、Multiplexingアダプター、Multiplexingリード配列決定プライマー、Multiplexingインデックスリード配列決定プライマー、及びPCRプライマーインデックス配列1~12が挙げられる。
Illuminaライブラリー調製キット及び配列決定プラットフォーム、例えば、Nextera、Illumina Prep、Illumina PCR、AmpliSeq(商標)、TruSight(登録商標)、及びTruSeq(商標)を用いてUMIライブラリーを配列決定するために使用され得る配列決定プライマー及びアダプター配列は、Illumina Adapter Sequences Document#1000000002694 v15に開示されている通りであり、参照によりその全体が本明細書に組み込まれる。これらの配列決定プライマー及びアダプターは、本開示に従って修飾され得る。かかるプライマー及びアダプターの例としては、リード1、リード2、インデックス1リード、インデックス2リード、インデックス1(i7)アダプター、インデックス2(i5)アダプター、インデックスアダプター1~27、TruSeqユニバーサルアダプター、インデックスPCRプライマー、Multiplexingアダプター、Multiplexingリード配列決定プライマー、Multiplexingインデックスリード配列決定プライマー、及びPCRプライマーインデックス配列1~12が挙げられる。
いくつかの実施形態では、配列決定方法は、類似の融解温度を有する配列決定プライマーを結合させることを含む。
1.カスタムプライマー
カスタムプライマーは、異なる機能を果たすために配列決定反応において使用され得る。
カスタムプライマーは、異なる機能を果たすために配列決定反応において使用され得る。
いくつかの実施形態では、UMI配列は、UMIへのプライマー結合を可能にするためにカスタムプライマーに含まれる。
いくつかの実施形態では、カスタムプライマーは、プライマーを長くするように機能し、かつ/又はプライマーの融解温度に影響を及ぼす配列を含み得る。いくつかの実施形態では、同じ反応において使用され得るカスタム配列決定プライマー及び標準配列決定プライマーは、類似の融解温度を有し得る。
いくつかの実施形態では、カスタムプライマーは、1つ以上のスペーサーを含む架橋プライマーである。スペーサーは、架橋プライマーが任意の核酸配列と整列することを可能にする。
いくつかの実施形態では、スペーサーは、標的核酸配列に結合し得る。いくつかの実施形態では、スペーサーは、イノシンなどのユニバーサルハイブリダイゼーション配列を含む。
いくつかの実施形態では、スペーサーは、標的核酸配列に結合させることなく、それと整列し得る。いくつかの実施形態では、スペーサーは、非核酸リンカーを含む。
いくつかの実施形態では、スペーサーは、可変配列と整列する。いくつかの実施形態では、スペーサーは、UMI配列と整列する。いくつかの実施形態では、スペーサーは、UDI配列と整列する。
いくつかの実施形態では、配列決定プライマーは、1つ以上の固有プライマー結合配列に完全に又は部分的に相補的である配列を含む。いくつかの実施形態では、配列決定プライマーは、少なくともA2配列、少なくともA14配列、又は少なくともB15配列を含む。
いくつかの実施形態では、固有プライマー結合配列は、A2、A14、及び/又はB15である。
a)スペーサー
本明細書で使用するとき、配列中のスペーサー領域は、既知の遺伝子機能のための任意の構造的又は分類情報を保持しない核酸配列を指す。ポリヌクレオチド又はオリゴヌクレオチド上のスペーサー領域は、様々な配列と整列することができる。いくつかの実施形態では、スペーサー領域は、ある範囲のi5配列と整列することができ、これはIllumina Adapter Sequences Document#1000000002694 v15に開示されており、参照により本明細書に組み込まれる。いくつかの実施形態では、スペーサー領域は、UMI配列と整列する。いくつかの実施形態では、スペーサー領域は、ME配列と整列する。
本明細書で使用するとき、配列中のスペーサー領域は、既知の遺伝子機能のための任意の構造的又は分類情報を保持しない核酸配列を指す。ポリヌクレオチド又はオリゴヌクレオチド上のスペーサー領域は、様々な配列と整列することができる。いくつかの実施形態では、スペーサー領域は、ある範囲のi5配列と整列することができ、これはIllumina Adapter Sequences Document#1000000002694 v15に開示されており、参照により本明細書に組み込まれる。いくつかの実施形態では、スペーサー領域は、UMI配列と整列する。いくつかの実施形態では、スペーサー領域は、ME配列と整列する。
いくつかの実施形態では、スペーサー領域は、ユニバーサル配列である。いくつかの実施形態では、スペーサー領域は、非DNAスペーサーである。いくつかの実施形態では、スペーサー領域は、イノシン又はニトロインドールなどのユニバーサル塩基を含む。あるいは、スペーサーは合成リンカーを含み得る。合成リンカーの例としては、C3スペーサー、ヘキサンジオール、1’,2’-ジデオキシリボース(dSpacer)、光切断可能スペーサー(PCスペーサー)、スペーサー9、及びスペーサー18が挙げられる。C3スペーサーは、オリゴヌクレオチドの内部又は5’末端に組み込むことができるC3スペーサーホスホラミダイトである。複数のC3スペーサーをオリゴヌクレオチドのいずれかの末端に付加して、フルオロフォア又は他のペンダント基の付加のための長い親水性スペーサーアームを導入することができる。ヘキサンジオールは、DNAポリメラーゼによる伸長をブロックすることができる6炭素グリコールスペーサーである。この3’修飾は、より長いオリゴヌクレオチドの合成を支持することができる。dSpacer修飾を用いて、オリゴヌクレオチド内に安定な無塩基部位を導入することができる。PCスペーサーは、DNA塩基間又はオリゴヌクレオチドと5’-修飾基との間に配置することができる。PCスペーサーは、300~350nmスペクトル範囲のUV光への曝露によって切断され得る10原子スペーサーアームを提供する。切断により、5’-リン酸基を有するオリゴヌクレオチドが遊離される。スペーサー9は、オリゴヌクレオチドの5’末端若しくは3’末端に、又は内部に組み込むことができるトリエチレングリコールスペーサーである。複数の挿入を用いて、長いスペーサーアームを作製することができる。スペーサー18(iSp18)は、18原子のヘキサエチレングリコールスペーサーであり、単一修飾として付加できる最長のスペーサーアームとみなすことができる。
いくつかの実施形態では、スペーサーは、iSp18リンカーを含む。本明細書で使用するとき、iSp18リンカーは、C18スペーサー(18原子ヘキサ-エチレングリコールスペーサー)を有する標準的な修飾リンカーであり、4塩基対の長さに等しい。したがって、2×sp18リンカーは、長さが8塩基対と同等である。いくつかの実施形態では、スペーサー領域は、2×iSp18合成リンカーを含む。いくつかの実施形態では、スペーサー領域は、1、2、3、4、5、6個以上のC18スペーサーなどの、1つ以上のC18スペーサーを含む。いくつかの実施形態では、スペーサー領域は、2つのC18スペーサ(長さが8ヌクレオチドと同等)を含む。いくつかの実施形態では、スペーサーは、長さが2塩基対と同等のC9スペーサーである。いくつかの実施形態では、スペーサー領域は、1、2、3、4、5、6個以上のC9スペーサーなどの、1つ以上のC9スペーサー(トリエチレングリコールスペーサー)を含む。いくつかの実施形態では、スペーサーは、10塩基対スペーサーなどの既存のインデックスと共に使用される従来のスペーサーである。いくつかの実施形態では、スペーサー領域は、スペーサーの組み合わせ、例えば、1つ以上のC18スペーサーと1つ以上のC9スペーサーとの組み合わせ、又は本明細書に記載の任意のスペーサーの任意の組み合わせである。いくつかの実施形態では、スペーサー領域は、2、3、4、5、6、7、8、9、10、12、15、20、又は30塩基対と同等の長さである。いくつかの実施形態では、スペーサー領域は、8又は10塩基対又はヌクレオチドにほぼ同等の長さである。いくつかの実施形態では、スペーサー領域は、インデックス領域と同じ長さであるように具体的に選択される。いくつかの実施形態では、インデックス領域は、8ヌクレオチドの長さであり、スペーサー領域は、2つのC18スペーサーを含む。いくつかの実施形態では、インデックス領域は、10ヌクレオチドの長さであり、スペーサー領域は、2つのC18スペーサー及び1つのC9スペーサーを含む。
いくつかの実施形態では、スペーサーは、無塩基ヌクレオチドを含む。無塩基ヌクレオチドは、スペーサーの任意の位置に導入することができる。無塩基ヌクレオチドを有するスペーサーの例としては、dSpacer(1’,2’-ジデオキシリボース、DNA無塩基)、rSpacer(すなわち、RNA無塩基)、及びAbasic IIが挙げられる。いくつかの実施形態では、dSpacerは、無塩基フラン、テトラヒドロフラン(THF)、THF誘導体、又は無プリン/無ピリミジン(AP)ヌクレオチドである。
いくつかの実施形態では、スペーサーは、ゆらぎ塩基を含む。ゆらぎ塩基は、スペーサーの任意の位置に導入することができる。ゆらぎ塩基対は、グアニン-ウラシル、ヒポキサンチン-ウラシル、ヒポキサンチン-アデニン、及びヒポキサンチン-シトシンなどのワトソン-クリック塩基対規則に従わない2つのヌクレオチド間の対合である。
IV.トランスポソーム複合体を含むキット
いくつかの実施形態では、キットは、本明細書に開示されるトランスポソーム複合体の構成要素を含む。いくつかの実施形態では、キットは、トランスポサーゼ、並びにトランスポゾン、5’及び3’トランスポゾン末端配列、アダプター配列、UMI配列、及び/又は他のHYB/HYB’配列を含むオリゴヌクレオチドを含む、かかるトランスポソーム複合体を生成するための構成要素を含む。
いくつかの実施形態では、キットは、本明細書に開示されるトランスポソーム複合体の構成要素を含む。いくつかの実施形態では、キットは、トランスポサーゼ、並びにトランスポゾン、5’及び3’トランスポゾン末端配列、アダプター配列、UMI配列、及び/又は他のHYB/HYB’配列を含むオリゴヌクレオチドを含む、かかるトランスポソーム複合体を生成するための構成要素を含む。
キットは、種々のアダプターのいずれかを含み得る。多くの実施形態では、アダプターは、3’アダプター、ポリヌクレオチドアダプター、フォーク型アダプター、ヘアピンUMIアダプター、ヘアピンUMI及びユニバーサルハイブリダイズテールアダプター、スプリントライゲーションアダプター、鋳型スイッチオリゴヌクレオチドアダプター、並びに任意の適切なオリゴヌクレオチドから選択され得る。
いくつかの実施形態では、キットは、Hyb2Yのための構成要素、例えばアダプター及び緩衝液を含み得る。
いくつかの実施形態では、キットは、ビーズなどの固体支持体を含み得る。
いくつかの実施形態では、キットは、逆転写酵素ポリメラーゼを含み得る。
いくつかの実施形態では、キットは、配列決定プライマーを含み得る。
以下の実施例は、UMIを有するDNA配列決定ライブラリーを調製することに関する方法を記載する。BLT法(例えば、以前はNextera DNA Flex Library Prep、及びNextera XT DNA Library Preparation Kitsとして知られていたIllumina DNA Prep(研究用途のみ、RUO))を使用した配列決定ライブラリーの生成は、NGSライブラリー調製ワークフローと適合する便利で効率的な方法である。これらの多くについて、配列決定されたDNA分子の相対的な方向及び固有性(すなわち、標的DNAのストランド性又は方向性)を追跡し、それらをバイオインフォマティクス的に分解することができることが望ましい。実施例に記載されている方法は、現世代のBLT法によっては得られない特徴であるストランド性又は方向性を提供するためのUMIの使用に関する。UMIは、Illumina TruSeq(商標)法を使用せずに組み込まれる。以下の実施例は、UMIを組み込む異なる方法を開示する。
実施例1.二重鎖UMIエラー補正を可能にするためにUMI-BLTを使用する配列決定のためのDNAライブラリーの調製
この実施例は、固有二重インデックス(UDI)及び二重鎖UMIを有するDNA配列決定ライブラリーを調製するために使用される非対称タグメンテーションBLT法を記載する。この例は、エラー補正のためにUDIとUMIとを組み合わせる方法を記載する。単一UMIを使用してDNAライブラリーをタグ化し、続いて単一UMIをコピーして二重鎖UMIを生成する。
この実施例は、固有二重インデックス(UDI)及び二重鎖UMIを有するDNA配列決定ライブラリーを調製するために使用される非対称タグメンテーションBLT法を記載する。この例は、エラー補正のためにUDIとUMIとを組み合わせる方法を記載する。単一UMIを使用してDNAライブラリーをタグ化し、続いて単一UMIをコピーして二重鎖UMIを生成する。
本実施例の方法は、BLT法をHyb2Yワークフローと組み合わせた。タグメンテーション工程において、第1のUMIを標的DNAの第1の鎖に付加し、第2のUMIを標的DNAの第2の鎖に付加した。
この方法では、追加のA2アダプター配列をBLT中のトランスポゾンアームに付加し、Hyb2Yワークフローを使用してUMIをコピーした。BLTアダプターへのA2シーケンスの追加は、2つの目的を果たす。第1に、反対鎖上に対合したUMIを有するように伸長できるHyb2Yオリゴヌクレオチドのアニーリングを可能にする。Hyb2YオリゴヌクレオチドのA2へのハイブリダイゼーションは、伸長が最小限である他の方法に依存するのではなく、UMI及びアダプター配列をコピーできるより長い伸長を可能にする。第2に、A2配列は、標準配列決定プライマーと同じアニーリング温度(Tm)を有する配列決定のためのカスタム配列決定レシピ及びカスタムプライマーの開発を可能にする。更に、この方法に従って調製されたライブラリーは、フォーク型アダプターBLT設計が使用される場合に時折観察されるアダプター二量体の量を減少させる。アダプター二量体を回避することによって、この方法はまた、ライブラリー収量を増加させる。
A.材料
この実施例では次の材料を使用した。(1)ゲノムDNA(gDNA)Horizon Tru-Q 7標準試料(Horizonカタログ番号HD734)、(2)Illumina DNA Prep with Enrichment(IDPE、Illuminaカタログ番号20025523及び20025524、以前は、Nextera Flex for Enrichment)、(3)TruSight Oncology UMI試薬(Illuminaカタログ番号20024586)、(4)TruSight Tumor 170試薬(Illuminaカタログ番号20028821)、(5)New Enrichment Blocker NHB2(Illumina参照番号20031771)、(6)Extension Ligation Mix ELM3(Illuminaカタログ番号20019117)、(7)NextSeq 500/550 v2.5キット(Illuminaカタログ番号20024906)、及び(8)カスタムプライマー。
この実施例では次の材料を使用した。(1)ゲノムDNA(gDNA)Horizon Tru-Q 7標準試料(Horizonカタログ番号HD734)、(2)Illumina DNA Prep with Enrichment(IDPE、Illuminaカタログ番号20025523及び20025524、以前は、Nextera Flex for Enrichment)、(3)TruSight Oncology UMI試薬(Illuminaカタログ番号20024586)、(4)TruSight Tumor 170試薬(Illuminaカタログ番号20028821)、(5)New Enrichment Blocker NHB2(Illumina参照番号20031771)、(6)Extension Ligation Mix ELM3(Illuminaカタログ番号20019117)、(7)NextSeq 500/550 v2.5キット(Illuminaカタログ番号20024906)、及び(8)カスタムプライマー。
B.二重鎖UMIを有するBLTライブラリー
この方法では、標的DNA断片をタグメンテーションするためのBLTを、まず、UMI-BLTを含む捕捉オリゴヌクレオチドを用いて反応混合物中で調製した(図1)。タグメンテーションのための標的DNAを、UMI-BLTを有する反応混合物に添加した(図2)。10ng及び50ngのgDNA Horizon Tru-Q 7標準試料を標的DNAとして使用した。
この方法では、標的DNA断片をタグメンテーションするためのBLTを、まず、UMI-BLTを含む捕捉オリゴヌクレオチドを用いて反応混合物中で調製した(図1)。タグメンテーションのための標的DNAを、UMI-BLTを有する反応混合物に添加した(図2)。10ng及び50ngのgDNA Horizon Tru-Q 7標準試料を標的DNAとして使用した。
AB長単一UMIを含有するタグメンテーション化ライブラリーを、IDPEで使用したeBLTと同様の密度で作製したBLTを用いて調製した。ライブラリーは、TruSight(商標)Tumor(TST170、Illumina)プローブを用いて、IDPEプロトコールガイドラインに従って調製した。タグメンテーション停止緩衝液ST2を添加して、タグメンテーションプロセスを停止させた。
得られたタグメンテーション化ライブラリーを55℃で5分間加熱して、タグメンテーション化ライブラリーを溶液中に遊離させた。3’-ビオチン化MEはビーズに結合したままであり、転移しなかった。反応混合物を室温で5分間インキュベートし、反応混合物をタグメンテーション洗浄緩衝液(TWB)で2回洗浄した。
次いで、Hyb2Yオリゴヌクレオチド(図2の5’P-A2’A14’-3’)を添加し、65℃で10分間アニーリングした。反応混合物を37℃までゆっくりと放冷した。次いで、反応混合物の上清を除去し、ギャップ充填のために伸長-ライゲーションミックスELM3と混合した。
37℃で30分間のELM3中での伸長及びライゲーションによって、34塩基をギャップ充填する。UMI配列はこの工程中にコピーされ、これにより、UMIを使用して上の鎖及び下の鎖を同定及びグループ化することが可能になることによって、UMI二重鎖エラー補正が可能になる。次いで、固相可逆性固定ビーズ(SPRI)を使用して反応混合物を洗浄し、タグメンテーション化DNAを有する溶液を生成した。UDIプライマーを用いて9サイクルのPCRを行い、タグメンテーション化DNAを増幅した。次いで、SPRIを用いてPCR産物を精製して、正しいサイズ範囲内に入るタグメンテーション化DNAを捕捉した。最後に、ライブラリー(約500ngのDNA)を、IDPE及びTST170プローブを用いて濃縮した。更なるブロッカーを、AB-長BLTプローブのハイブリダイゼーションのために添加した。
これらの工程は、二重鎖UMIを有する標準構造BLTライブラリーを生成した。ライブラリーは、Illumina UDIによるPCR増幅に使用できるA14及びB15オリゴヌクレオチド配列を含んでいた(図2)。
C.単一UMIを有するBLTライブラリー
第2のBLTライブラリーを調製した。このライブラリーは単一UMIを含み、A-B-短単一UMIを用いて作製した。ライブラリーは、BLTハイブリダイゼーションのために追加のブロッカーを使用しなかったことを除いて、A-B-長単一UMIについて上述した工程を使用して調製した。
第2のBLTライブラリーを調製した。このライブラリーは単一UMIを含み、A-B-短単一UMIを用いて作製した。ライブラリーは、BLTハイブリダイゼーションのために追加のブロッカーを使用しなかったことを除いて、A-B-長単一UMIについて上述した工程を使用して調製した。
D.対照ライブラリー
比較のために、TruSight Tumor 170プロトコールガイドラインに従ってTruSight Oncology UMI試薬を用いて、別個のタグメンテーション化ライブラリーを調製した。
比較のために、TruSight Tumor 170プロトコールガイドラインに従ってTruSight Oncology UMI試薬を用いて、別個のタグメンテーション化ライブラリーを調製した。
更なる比較のために、UMIを含まないライブラリーを、NFEを用いて調製した。
実施例2.暗サイクルによる二重鎖UMIを含むDNAライブラリーの配列決定
この実施例は、実施例1のDNAライブラリーを配列決定する方法を記載する。
この実施例は、実施例1のDNAライブラリーを配列決定する方法を記載する。
A.材料
この実施例では次のシステム及び材料を使用した。(1)NextSeq 500配列決定システムを使用した(Illumina Document#15046563)、及び(2)必要に応じて、実施例1のライブラリーに特異的な配列決定プライマー及びカスタムプライマー(Illumina Document#15057456)。
この実施例では次のシステム及び材料を使用した。(1)NextSeq 500配列決定システムを使用した(Illumina Document#15046563)、及び(2)必要に応じて、実施例1のライブラリーに特異的な配列決定プライマー及びカスタムプライマー(Illumina Document#15057456)。
B.方法
実施例1のライブラリーをプールし、変性させ、プロトコールガイドラインに従ってNextSeq 500配列決定カートリッジに加えた。カスタムプライマーを希釈し、NextSeq 500及びNextSeq 550 Sequencing Systems Custom Primers Guideに従ってカートリッジ内の関連位置に添加した。
実施例1のライブラリーをプールし、変性させ、プロトコールガイドラインに従ってNextSeq 500配列決定カートリッジに加えた。カスタムプライマーを希釈し、NextSeq 500及びNextSeq 550 Sequencing Systems Custom Primers Guideに従ってカートリッジ内の関連位置に添加した。
カスタム配列決定レシピを配列決定機器にロードし、NextSeqソフトウェアを使用して選択した。レシピは、ME領域にわたって19回の暗サイクルを含むように標準レシピを変更することを含んでいた。暗サイクルは、画像化を伴わない配列決定サイクルであり、これは、配列決定結果を全体的に悪化させ得るフェージング/プレフェージングの問題を補正した。暗サイクルは、上記セクションIII.Aで詳細に説明されている。暗サイクルの間、ME領域の19塩基を画像化しなかった。暗サイクルの後、画像化を再開し、挿入配列を画像化した。
試料シートは、TruSight Oncology UMI Reagentsガイドに見られる設定を含んでいた。
内部UMI折り畳みAPP及びDragen Enrichment Appを用いて、Basespace Sequence Hubでデータ分析を行った。
1.プライマー
使用したカスタム配列決定プライマーは、図3Bに示す通りである。4つのカスタムプライマーは、標準的な配列決定プライマーと適合する融解温度(Tm)を含み、したがって、同じ配列決定反応において混合及び使用することができる。カスタムプライマーは、図3Bに示すように、(1)カスタムプライマー1 UMI+リード1、(2)カスタムプライマーi5、(3)カスタムプライマーi7、及び(4)カスタムプライマー4 UMI+リード2であった。カスタムプライマーは、図3Bの青色矢印によって示されるように、それぞれの領域にアニールするように設計した。カスタムプライマー1 UMI+リード1をA14-A2配列にアニールした。カスタムプライマーi5をA14’-A2’配列にアニールした。カスタムプライマーi7をA2’-B15’配列にアニールした。カスタムプライマー4 UMI+リード2をB15-A2配列にアニールした。挿入DNAの配列を、カスタムプライマー1 UMI+リード1及びカスタムプライマー4 UMI+リード2を用いて読み取った。
使用したカスタム配列決定プライマーは、図3Bに示す通りである。4つのカスタムプライマーは、標準的な配列決定プライマーと適合する融解温度(Tm)を含み、したがって、同じ配列決定反応において混合及び使用することができる。カスタムプライマーは、図3Bに示すように、(1)カスタムプライマー1 UMI+リード1、(2)カスタムプライマーi5、(3)カスタムプライマーi7、及び(4)カスタムプライマー4 UMI+リード2であった。カスタムプライマーは、図3Bの青色矢印によって示されるように、それぞれの領域にアニールするように設計した。カスタムプライマー1 UMI+リード1をA14-A2配列にアニールした。カスタムプライマーi5をA14’-A2’配列にアニールした。カスタムプライマーi7をA2’-B15’配列にアニールした。カスタムプライマー4 UMI+リード2をB15-A2配列にアニールした。挿入DNAの配列を、カスタムプライマー1 UMI+リード1及びカスタムプライマー4 UMI+リード2を用いて読み取った。
合計6つのプライマーを含有する3つのカスタムプライマーポートを、この配列決定法に使用した。i7及びi5カスタムプライマーを、配列決定のための標準的な操作手順に従って1つのカスタムプライマーポートに添加した。この実施例に従って使用及び調製されるプライマーは、配列決定カートリッジ上の利用可能なプライマーポート数が限られている当業者にとって有用であり得る。例えば、一部の配列決定プラットフォームは、利用可能プライマーポートは3つのみである。この方法は、配列決定プロセス中の異なる時間に使用される単一反応における異なるカスタム配列決定プライマーの混合を可能にし、それによって、当業者が配列決定カートリッジ上に必要とされるカスタムプライマーポートの数を最小限にすることを可能にする。
任意選択的に、この方法は、代わりに、カスタムプライマー1 UMI+リード1及びカスタムプライマー2 UMI+リード2の2つのプライマーのみを含み得る。これらの2つのプライマーは予め混合することができ、2つのカスタムプライマーポートのみを必要とする。
C.結果
図3Cは、配列決定ランにおけるサイクル毎の品質スコアを示す。簡潔に言えば、品質スコアは、ベースコールでのエラーの確率の予測である。高品質スコアは、ベースコールがより信頼性が高く、不正確である可能性がより低いことを意味する。Q30のクオリティスコアを有する塩基コールでは、1,000における1つの塩基コールが不正確であると予測される。配列決定の品質がQ30に達する場合、事実上全ての読み取りが完全であり、エラーやあいまいさがなくなる。Q30は、次世代配列決定における品質のベンチマークと考えられる。
図3Cは、配列決定ランにおけるサイクル毎の品質スコアを示す。簡潔に言えば、品質スコアは、ベースコールでのエラーの確率の予測である。高品質スコアは、ベースコールがより信頼性が高く、不正確である可能性がより低いことを意味する。Q30のクオリティスコアを有する塩基コールでは、1,000における1つの塩基コールが不正確であると予測される。配列決定の品質がQ30に達する場合、事実上全ての読み取りが完全であり、エラーやあいまいさがなくなる。Q30は、次世代配列決定における品質のベンチマークと考えられる。
図3Cは、≧Q30の%を示すが、図3Dは、この実施例の配列決定ランにおけるサイクル毎の配列決定サイクルの強度を示す。暗サイクルを用いて、配列決定の速度を上げ、アダプター配列にわたる反応の情報価値のない画像の記録を回避した。暗サイクル(及び明サイクル)は、挿入部で新しい読み取りを開始することと比較して、後続の配列決定の質を低下させる(図3C及び図3D)。
50ngの鋳型インプットを用いた配列決定反応において、TruSight UMI法は優れた性能を示した。実施例1におけるHyb2Yワークフローは、配列決定性能の改善を可能にするために最適化を必要とした可能性がある。
図3Eに示すように、TruSight UMI法(TruSight-Duplex)は、50ngの鋳型インプットを用いた反応において優れた性能を実証した。これは、実施例1における伸長及びライゲーション工程中に使用されるポリメラーゼによってUMI配列に導入されたエラーに起因して、分析の第1の工程においてUMIリードが破棄されることによって引き起こされた可能性がある。図3Eでは、二重鎖UMIを有さない設計を0と呼んだ。フォーク-二重鎖ライブラリーのアダプターブロッキングも最適以下であった。それにもかかわらず、フォーク-二重鎖データセットは、20%の二重鎖ファミリーと呼ばれていた。この数は、実施例1のHyb2Yワークフローにおける生化学的反応に対する最適化によって改善されるはずである。最適化され得るパラメータの例としては、オリゴヌクレオチド濃度、ハイブリダイゼーション時間、ハイブリダイゼーション温度、及びハイブリダイゼーションに使用される配列の選択が挙げられる。
実施例3.架橋プライマー再ハイブリダイゼーションによる二重鎖UMIを含むDNAライブラリーの配列決定
この実施例は、実施例1のDNAライブラリーを配列決定する方法を記載する。
この実施例は、実施例1のDNAライブラリーを配列決定する方法を記載する。
A.材料
材料は、上記実施例2に記載した通りである。
材料は、上記実施例2に記載した通りである。
B.方法
方法は、上記の実施例2に記載の通りであるが、以下の改変を伴う。
方法は、上記の実施例2に記載の通りであるが、以下の改変を伴う。
ここでは、暗サイクルを含まないカスタム配列決定レシピが使用される。レシピは、リード1及びリード4の間の追加のプライマー再ハイブリダイゼーションを更に含む(図4)。
1.プライマー
この実施例におけるカスタムプライマーは、表2及び図4に提供される通りである。リード1及びリード6のプライマーは架橋プライマーである。
この実施例におけるカスタムプライマーは、表2及び図4に提供される通りである。リード1及びリード6のプライマーは架橋プライマーである。
各架橋プライマーは、A14-A2配列にアニールする配列、UMI配列にまたがるがアニールしない2つのスペーサー、及びME配列にアニールする配列を含む。タグメンテーション化ライブラリーにおいて、A14-A2及びME配列は定常配列であるが、UMI配列は変化する。この実施例において、使用されるiSp18の2つのコピーは、プライマー2及び6の各々における2つのスペーサーである。
この実施例の配列決定方法において、プライマー1を最初にアニーリングし、次いでプライマー2をアニーリングするために除去される。同様に、プライマー5をアニールした後、プライマー6のアニールのために除去される。インサートDNAの配列を、インサート1リード用のカスタム架橋プライマー及びインサート2リード用のカスタム架橋プライマーを用いて読み取った。
実施例4.二重鎖UMIエラー補正を可能にするためにUMI-BLTを使用する配列決定のためのDNAライブラリーの調製
本実施例は、エラー補正のためにUDI及び二重鎖UMIを用いてDNA配列決定ライブラリーを調製するために使用される非対称タグメンテーションBLT法を記載する。材料は実施例1に記載した通りである。タグメンテーション工程において、UMIを標的DNAの第1の鎖に付加し、標的DNAの第2の鎖はUMIによってタグメンテーションされなかった。
本実施例は、エラー補正のためにUDI及び二重鎖UMIを用いてDNA配列決定ライブラリーを調製するために使用される非対称タグメンテーションBLT法を記載する。材料は実施例1に記載した通りである。タグメンテーション工程において、UMIを標的DNAの第1の鎖に付加し、標的DNAの第2の鎖はUMIによってタグメンテーションされなかった。
この方法において、標的DNAをタグメンテーションするためのUMI-BLTを含むトランスポソーム構造は、図5Aに示される通りである。タグメンテーション化DNAは、図5Bに示すように処理される。タグメンテーション化DNAをドデシル硫酸ナトリウム(SDS)で洗浄し、トランスポザーゼTsTn5(図5A及び図5Bに示す)を除去する。タグメンテーション化DNAライブラリーを、UDIプライマーを使用するPCRによって増幅する。
実施例5.暗サイクルによる二重鎖UMIを含むDNAライブラリーの配列決定
本実施例は、暗サイクルを含む実施例4のDNAライブラリーを配列決定する方法を記載する(図6A)。
本実施例は、暗サイクルを含む実施例4のDNAライブラリーを配列決定する方法を記載する(図6A)。
A.材料
材料は、上記実施例2に記載した通りである。
材料は、上記実施例2に記載した通りである。
B.方法
方法は、上記の実施例2に記載の通りであるが、以下の改変を伴う。
方法は、上記の実施例2に記載の通りであるが、以下の改変を伴う。
1.プライマー
この方法では、(1)標準インサートリード1、(2)カスタムi7、(3)標準i5、及び(4)UMI+インサートリード2の4つのプライマーを使用した。プライマーは、図6Aの黒色矢印によって示されるように、それぞれの領域にアニールするように設計した。標準インサートリード1をA14-ME配列にアニールした。カスタムi7をA2’-B15’配列にアニールした。標準i5をME’-A14’配列にアニールした。UMI+インサートリード2をB15-A2配列にアニールした。
この方法では、(1)標準インサートリード1、(2)カスタムi7、(3)標準i5、及び(4)UMI+インサートリード2の4つのプライマーを使用した。プライマーは、図6Aの黒色矢印によって示されるように、それぞれの領域にアニールするように設計した。標準インサートリード1をA14-ME配列にアニールした。カスタムi7をA2’-B15’配列にアニールした。標準i5をME’-A14’配列にアニールした。UMI+インサートリード2をB15-A2配列にアニールした。
C.結果
本実施例の配列決定方法(図6A)を、TruSeq(商標)法又はIDPE標準法(図3A)を使用した配列決定ランと比較した。図7(「暗」)に示されるこの方法についての標準配列決定リード1及びR4 UMI+インサートリード2のQ30%は、方法がIDPE(「IDPE標準」)及びTruSeq(商標)(「TruSeq標準」)法ほど良好に機能しなかったが、この方法が成功したことを示す。暗サイクル後にQ30%スコアの減少も観察された。この配列決定方法は、3つのプライマーのみを使用し、3つ以下のプライマーを支持し得るカートリッジを有する配列決定機器と共に使用される場合、好ましい方法であり得る。
本実施例の配列決定方法(図6A)を、TruSeq(商標)法又はIDPE標準法(図3A)を使用した配列決定ランと比較した。図7(「暗」)に示されるこの方法についての標準配列決定リード1及びR4 UMI+インサートリード2のQ30%は、方法がIDPE(「IDPE標準」)及びTruSeq(商標)(「TruSeq標準」)法ほど良好に機能しなかったが、この方法が成功したことを示す。暗サイクル後にQ30%スコアの減少も観察された。この配列決定方法は、3つのプライマーのみを使用し、3つ以下のプライマーを支持し得るカートリッジを有する配列決定機器と共に使用される場合、好ましい方法であり得る。
実施例6.架橋プライマー再ハイブリダイゼーションによる二重鎖UMIを含むDNAライブラリーの配列決定
本実施例は、暗サイクルの代わりに架橋プライマー再ハイブリダイゼーションを含む、実施例4のDNAライブラリーを配列決定する方法を記載する(図6B)。
本実施例は、暗サイクルの代わりに架橋プライマー再ハイブリダイゼーションを含む、実施例4のDNAライブラリーを配列決定する方法を記載する(図6B)。
A.材料
材料は、上記実施例5に記載した通りである。
材料は、上記実施例5に記載した通りである。
B.方法
方法は、上記の実施例5に記載の通りであるが、以下の改変を伴う。
方法は、上記の実施例5に記載の通りであるが、以下の改変を伴う。
1.プライマー
この方法では、(1)標準インサートリード1、(2)カスタムi7、(3)標準i5、(4)UMI、及び(5)インサートリード2架橋プライマーの5つのプライマーを使用する。プライマーは、図6Bの黒色矢印によって示されるように、それぞれの領域にアニールするように設計した。プライマー(1)~(4)は、前段落に記載した領域にアニールする。プライマー5は、A2-B13配列にアニールする配列、UMI配列にまたがるがアニールしないスペーサー、及びME配列にアニールする配列を含む。プライマー5は、配列決定法における暗サイクルの必要性を排除する。この方法において、プライマー4をまずアニールし、次いでプライマー5のアニールのために除去される。インサートDNAの配列を、標準インサートリード1及びインサートリード2架橋プライマーを用いて読み取る。
この方法では、(1)標準インサートリード1、(2)カスタムi7、(3)標準i5、(4)UMI、及び(5)インサートリード2架橋プライマーの5つのプライマーを使用する。プライマーは、図6Bの黒色矢印によって示されるように、それぞれの領域にアニールするように設計した。プライマー(1)~(4)は、前段落に記載した領域にアニールする。プライマー5は、A2-B13配列にアニールする配列、UMI配列にまたがるがアニールしないスペーサー、及びME配列にアニールする配列を含む。プライマー5は、配列決定法における暗サイクルの必要性を排除する。この方法において、プライマー4をまずアニールし、次いでプライマー5のアニールのために除去される。インサートDNAの配列を、標準インサートリード1及びインサートリード2架橋プライマーを用いて読み取る。
C.結果
本実施例の配列決定方法(図6B)を、TruSeq(商標)法又はIDPE標準法(図3A)を使用した配列決定ランと比較した。図7(「再hyb」)に示されるこの方法についての標準配列決定リード1及びR5挿入リード2架橋プライマーのQ30%は、方法がTruSeq(商標)(「TruSeq標準」)及びIDPE(「IDPE標準」)方法と同様に機能し、暗サイクルを用いる方法(「暗」実施例5も参照)よりも配列決定が良好であったことを示す。
本実施例の配列決定方法(図6B)を、TruSeq(商標)法又はIDPE標準法(図3A)を使用した配列決定ランと比較した。図7(「再hyb」)に示されるこの方法についての標準配列決定リード1及びR5挿入リード2架橋プライマーのQ30%は、方法がTruSeq(商標)(「TruSeq標準」)及びIDPE(「IDPE標準」)方法と同様に機能し、暗サイクルを用いる方法(「暗」実施例5も参照)よりも配列決定が良好であったことを示す。
実施例7.配列決定のためのUMI BLTを用いる無細胞DNA(cfDNA)からのDNAライブラリーの調製
本実施例は、エラー補正のためにUDI及び二重鎖UMIを用いてDNA配列決定ライブラリーを調製するために使用される非対称タグメンテーションBLT法を記載する。材料は実施例1に記載した通りである。タグメンテーション工程において、第1のUMIを標的DNAの第1の鎖に付加し、第2のUMIを標的DNAの第2の鎖に付加した。
本実施例は、エラー補正のためにUDI及び二重鎖UMIを用いてDNA配列決定ライブラリーを調製するために使用される非対称タグメンテーションBLT法を記載する。材料は実施例1に記載した通りである。タグメンテーション工程において、第1のUMIを標的DNAの第1の鎖に付加し、第2のUMIを標的DNAの第2の鎖に付加した。
cfDNAを、1人の患者の5mLの血漿から抽出した。Mg2+を含まないBLT Tn5を使用してcfDNAを抽出した。図8に示されるように、cfDNAを、対照としてTruSeq(商標)ワークフローを使用して処理したか、又は本実施例に記載される方法を使用して処理した(図8の「eBBN」)。
まず、cfDNAを、TruSeq(商標)ワークフローを使用して以下のように処理した。(1)30分間の末端修復、(2)30分間のA-テーリング、(3)30分間のUMIのライゲーション、(4)30分間のアダプターのライゲーション、(5)SPRIの洗浄、及び(6)PCRによる増幅。
図9に示すように、既存の方法のタグメンテーションワークフローに従って、以下の工程でcfDNAの別の試料を処理した。(1)cfDNAを、単一UMIアダプターを含む捕捉オリゴヌクレオチドで5分間タグメンテーションし、(2)タグメンテーションを停止し、(3)タグメンテーション化cfDNA、すなわちUMIライブラリーを5~10分間の洗浄を用いて洗浄し、(4)作製したUMIライブラリーをPCRによって増幅した。
この方法では、UDIの代わりにUMIをBLT捕捉オリゴヌクレオチドに付加したが、これにより、UDIを使用する更なるインデックス化を排除する。UMIは、BLT捕捉部分を有する鎖と同じ鎖上にはなく、UMIは転移鎖上にあり、一方、BLT捕捉部分は非転移鎖上にある。
10個のUMI配列をi7位置に使用し、10個のUMI配列をi5位置に使用した。タグメンテーション化DNA断片をギャップ充填し、P5及びP7プライマーを用いてPCRによって増幅した。この方法は、標準配列決定プライマーを使用する配列決定に対して準備ができているA14及びB15オリゴヌクレオチド配列を有する標準構造BLTライブラリーを生成した。
実施例8.単一UMIを含むDNAライブラリーの配列決定
この実施例は、実施例7のDNAライブラリーを配列決定する方法を記載する。
この実施例は、実施例7のDNAライブラリーを配列決定する方法を記載する。
A.材料
材料は、上記実施例2に記載した通りである。
材料は、上記実施例2に記載した通りである。
B.方法
方法は、上記の実施例2に記載の通りであるが、以下の改変を伴う。
方法は、上記の実施例2に記載の通りであるが、以下の改変を伴う。
1.プライマー
この実施例は、標準配列決定ラン及び標準配列決定プライマーであるNextera Readプライマー1(NR1リード)、i7リード、i5リード、及びNextera Readプライマー2(NR2リード)を含んだ。プライマーは、図9の黒色矢印によって示されるように、それぞれの領域にアニールするように設計した。i7及びi5領域はUMIによって損なわれているので、UMIをインデックスリードから捕捉した。
この実施例は、標準配列決定ラン及び標準配列決定プライマーであるNextera Readプライマー1(NR1リード)、i7リード、i5リード、及びNextera Readプライマー2(NR2リード)を含んだ。プライマーは、図9の黒色矢印によって示されるように、それぞれの領域にアニールするように設計した。i7及びi5領域はUMIによって損なわれているので、UMIをインデックスリードから捕捉した。
C.結果
DNAライブラリー全体のUMIリードの均一な分布は、単一UMIのタグメンテーション化DNA断片への組み込みが成功したことを示す(図10)。配列決定リードに対してRead Collapsing分析工程を実施して、重複リードをグループ化し、それらを単一のコンセンサス整列リードに折り畳んだ。得られたリード(重複排除されたリード)は、より高い塩基あたりの品質及び種々の供給源由来のより低いノイズを有する。Read Collapsingは、UMIが関与する場合の品質管理に対する有用な測定基準である。
DNAライブラリー全体のUMIリードの均一な分布は、単一UMIのタグメンテーション化DNA断片への組み込みが成功したことを示す(図10)。配列決定リードに対してRead Collapsing分析工程を実施して、重複リードをグループ化し、それらを単一のコンセンサス整列リードに折り畳んだ。得られたリード(重複排除されたリード)は、より高い塩基あたりの品質及び種々の供給源由来のより低いノイズを有する。Read Collapsingは、UMIが関与する場合の品質管理に対する有用な測定基準である。
図11A及び図11Bに示されるように、単一のUMI-BLTライブラリー(図11Bにおいて「eBBN」として示される)は、TruSeq(商標)ライブラリー(図11Aにおいて「UMIなし」として示される)よりも大きい重複排除された平均標的カバレッジ及びcfDNAのライブラリーへのより高い変換を有することを示す。
実施例9.UDIによる配列決定及び二重鎖配列エラー補正のための二重鎖UMI-BLTを使用するDNAライブラリーの調製
本実施例は、エラー補正のためにUDI及び二重鎖UMIを用いてDNA配列決定ライブラリーを調製するために使用される対称タグメンテーションBLT法を記載する。材料は実施例1に記載した通りである。この方法は、BLTのフォーク型アダプター捕捉オリゴヌクレオチド中に二重鎖UMIを含む(図12)。タグメンテーション工程において、UMIを標的DNAの両方の鎖に付加する。
本実施例は、エラー補正のためにUDI及び二重鎖UMIを用いてDNA配列決定ライブラリーを調製するために使用される対称タグメンテーションBLT法を記載する。材料は実施例1に記載した通りである。この方法は、BLTのフォーク型アダプター捕捉オリゴヌクレオチド中に二重鎖UMIを含む(図12)。タグメンテーション工程において、UMIを標的DNAの両方の鎖に付加する。
まず、120個の異なるUMI二重鎖を含むUMIのプールを形成する。各UMI二重鎖を別々に調製し、次いで一緒に混合して、UMIのプールを形成する。このプールを使用してフォーク型アダプター捕捉オリゴヌクレオチドを調製し、次いでこれを使用してユニバーサルUMI BLT(ユニバーサルUMI Tsm)を調製する。標的DNA断片を、ユニバーサルUMI Tsmを使用してタグメンテーションする。ELMを用いてギャップ充填及びライゲーションを行う。タグメンテーション化DNAは、Nextera Indexプライマーを使用してPCRによって増幅され、配列決定の準備ができている。
実施例10.二重鎖UMI及びUDIを含むDNAライブラリーの配列決定
この実施例は、二重鎖UMI及びUDIを含む実施例9のDNAライブラリーを配列決定する方法を記載する。この方法は、ME領域の画像化を回避するための、4つの標準プライマー及び暗サイクルの使用を含む。
この実施例は、二重鎖UMI及びUDIを含む実施例9のDNAライブラリーを配列決定する方法を記載する。この方法は、ME領域の画像化を回避するための、4つの標準プライマー及び暗サイクルの使用を含む。
A.材料
材料は、上記実施例2に記載した通りである。
材料は、上記実施例2に記載した通りである。
B.方法
方法は、上記の実施例2に記載の通りであるが、以下の改変を伴う。
方法は、上記の実施例2に記載の通りであるが、以下の改変を伴う。
1.プライマー
この実施例は、19回の暗サイクル並びに配列決定プライマーである(1)A14リード、(2)i7リード、(3)B15リード、及び(4)i5リードを用いた配列決定ランを含む。プライマーは、図12の灰色矢印によって示されるように、それぞれの領域にアニールするように設計した。
この実施例は、19回の暗サイクル並びに配列決定プライマーである(1)A14リード、(2)i7リード、(3)B15リード、及び(4)i5リードを用いた配列決定ランを含む。プライマーは、図12の灰色矢印によって示されるように、それぞれの領域にアニールするように設計した。
標準A14リードプライマー及び標準B15リードプライマーは、A14領域及びB15領域にアニールする。これらの領域は、短いヌクレオチド配列(すなわち、14塩基対)を含み、これは、A14リードプライマー及びB15リードプライマーにおける低Tmの設計をもたらす。プライマーは、UMI配列を読み取ることができるように、それぞれのTmを増加させる、追加の10塩基対などの修飾から利益を得る。
実施例11.インデックス化及び二重鎖配列エラー補正を可能にする配列決定のためのDNAライブラリーの調製
本実施例は、エラー補正のためにUDI及び二重鎖UMIを用いてDNA配列決定ライブラリーを調製するために使用される対称タグメンテーションBLT法を記載する。材料は実施例1に記載した通りである。この方法は、BLTのフォーク型アダプター捕捉オリゴヌクレオチド中にUMIを含む(図13)。タグメンテーション工程において、UMIを標的DNAの両方の鎖に付加する。
本実施例は、エラー補正のためにUDI及び二重鎖UMIを用いてDNA配列決定ライブラリーを調製するために使用される対称タグメンテーションBLT法を記載する。材料は実施例1に記載した通りである。この方法は、BLTのフォーク型アダプター捕捉オリゴヌクレオチド中にUMIを含む(図13)。タグメンテーション工程において、UMIを標的DNAの両方の鎖に付加する。
UMI、BLT、及びタグメンテーション化DNAを調製するための工程は、上記実施例9に記載の通りである。
実施例12.DNAライブラリーの配列決定
この実施例は、実施例11のDNAライブラリーを配列決定する方法を記載する。
この実施例は、実施例11のDNAライブラリーを配列決定する方法を記載する。
A.材料
材料は、上記実施例2に記載した通りである。
材料は、上記実施例2に記載した通りである。
B.方法
方法は、上記の実施例2に記載の通りであるが、以下の改変を伴う。
方法は、上記の実施例2に記載の通りであるが、以下の改変を伴う。
1.プライマー
この実施例は、6つのカスタム配列決定プライマーである(1)カスタム1、(2)カスタムUMIi7、(3)カスタムi7、(4)カスタム2、(5)カスタムUMIi5、及び(6)カスタムi5を含む。プライマーは、図13の黒色矢印によって示されるように、それぞれの領域にアニールするように設計した。
この実施例は、6つのカスタム配列決定プライマーである(1)カスタム1、(2)カスタムUMIi7、(3)カスタムi7、(4)カスタム2、(5)カスタムUMIi5、及び(6)カスタムi5を含む。プライマーは、図13の黒色矢印によって示されるように、それぞれの領域にアニールするように設計した。
実施例13.ヘアピンUMI及びユニバーサルハイブリダイズテールを含む3’アダプターを使用する配列決定のためのDNAライブラリーの調製
この実施例は、UMIがタグメンテーション後に組み込まれる、UMIを有するDNA配列決定ライブラリーを調製するために使用される非対称タグメンテーションBLT法を記載する(図14)。ヘアピン-UMI及びユニバーサルハイブリダイズテールを含む3’アダプターを用いて、UMIを組み込む。
この実施例は、UMIがタグメンテーション後に組み込まれる、UMIを有するDNA配列決定ライブラリーを調製するために使用される非対称タグメンテーションBLT法を記載する(図14)。ヘアピン-UMI及びユニバーサルハイブリダイズテールを含む3’アダプターを用いて、UMIを組み込む。
材料は実施例1に記載した通りである。
この方法は、標的DNAを5’配列決定アダプター(5’アダプター)でタグメンテーションし、次いで、UMIが挿入DNAの3’末端に直接隣接して配置されるように、3’配列決定アダプター(3’アダプター)を5’アダプターME配列にハイブリダイズさせることを含む。これにより、標準的な下流のライブラリー調製工程(すなわち、試料多重化PCR)及び配列決定試薬レシピとの適合性を確実にする、インラインUMIが生成される。
5’アダプター配列A14のみを含有するトランスポソームを用いて二本鎖DNAに対してタグメンテーションを行い、非転移Tn5-モザイク末端配列であるMEを変性させる。3’アダプターは、一般的なワトソン-クリック塩基対形成が可能なイノシン塩基を含み得る、3’ユニバーサルハイブリダイズテールを含有するオリゴヌクレオチドである。3’ユニバーサルハイブリダイズテールは、UMIヘアピン、及びME’配列、及び3’アダプター配列であるB15を更に含有する。
Hyb2Yを用いて、3’アダプターを5’アダプターMEにハイブリダイズする。ユニバーサルハイブリダイズテールは、転移鎖の露出した5’塩基(5’アダプターに隣接する)にハイブリダイズされる。9ヌクレオチドのユニバーサルハイブリダイズテールを用いて、転移鎖の露出した9ヌクレオチドは完全にハイブリダイズし、ユニバーサルハイブリダイズテールの5’は大腸菌DNAリガーゼによって非転移鎖の3’にライゲーションされる。9ヌクレオチド未満のユニバーサルハイブリダイズテールを使用すると、ライゲーションの前に非転移鎖の更なる伸長工程が必要となる場合がある。
標準的な配列決定方法(実施例2に記載され、図3B及び図20に示される)を用いて、この実施例のライブラリーを、それぞれ挿入DNAに先行及び後続する、リード2の開始点又はリード1の末端点において配列決定できる。リードは、インサートの品質及び可変インサート長に起因して、リード2の開始点において捕捉される可能性がより高い。
ユニバーサルハイブリダイズテールオリゴヌクレオチドは、各(元の)DNA分子の固有コピー(固有コピーインデックス、UCI)を追跡し、分解する可能性を提供する。元の挿入分子の異なるコピーは、同じUMIによって異なる9ヌクレオチドユニバーサルハイブリダイズテール配列を有することができる。UMIと同様に、UCIは、配列決定リードにおける所定の位置とインラインである。したがって、バイオインフォマティクス的に同定され得る。
実施例14.ヘアピン-UMIを含む3’アダプターを使用する配列決定のためのDNAライブラリーの調製
この実施例は、UMIがタグメンテーション後に組み込まれる、インラインUMIを有するDNA配列決定ライブラリーを調製するために使用される非対称タグメンテーションBLT法を記載する(図15)。ヘアピン-UMIを含む3’アダプターを用いて、UMIを組み込む。
この実施例は、UMIがタグメンテーション後に組み込まれる、インラインUMIを有するDNA配列決定ライブラリーを調製するために使用される非対称タグメンテーションBLT法を記載する(図15)。ヘアピン-UMIを含む3’アダプターを用いて、UMIを組み込む。
材料は実施例1に記載した通りである。
3’アダプターは、実施例13に記載されるようにヘアピンUMIを含有するが、ユニバーサルハイブリダイズテールを含有しない。
5’アダプタータグメンテーション及び3’アダプターハイブリダイゼーション工程を、実施例13に記載されるように行う。3’アダプターハイブリダイゼーションの後、非転移鎖の3’を、ハイブリダイズした3’アダプターの5’末端に達するまで、DNAポリメラーゼによって伸長する。(DNAポリメラーゼは鎖置換を含まず、5’→3’エキソヌクレアーゼ活性を含まない。)これにより、UMI-ヘアピンの5’末端が3’アダプターの3’末端に近接して配置される。
標準的な配列決定方法(実施例2に記載され、図3B及び図20に示される)を用いて、この実施例のライブラリーを、それぞれ挿入DNAに先行及び後続する、リード2の開始点又はリード1の末端点において配列決定できる。リードは、インサートの品質及び可変インサート長に起因して、リード2の開始点において捕捉される可能性がより高い。
実施例15a.3’スプリントライゲーションアダプターを使用する配列決定のためのDNAライブラリーの調製。
この実施例は、UMIがタグメンテーション後に組み込まれる、インラインUMIを有するDNA配列決定ライブラリーを調製するために使用される非対称タグメンテーションBLT法を記載する(図16)。3’スプリントライゲーションアダプターを使用してUMIを組み込む。
この実施例は、UMIがタグメンテーション後に組み込まれる、インラインUMIを有するDNA配列決定ライブラリーを調製するために使用される非対称タグメンテーションBLT法を記載する(図16)。3’スプリントライゲーションアダプターを使用してUMIを組み込む。
材料は実施例1に記載した通りである。
5’アダプタータグメンテーション及び3’アダプターハイブリダイゼーション工程を、実施例13に記載されるように行う。
3’スプリントライゲーションアダプターは、UMI-ME’-B15と非転移鎖との間のライゲーションのためのスプリントを作り出す、部分的に二本鎖の複合体である(図16)。3’スプリントライゲーションアダプターの各鎖は、アダプターの2つの部分のうちの1つを形成し、各鎖は約50ヌクレオチド長である。アダプターの2つの部分は、スプリント(図16、3’スプリントライゲーションアダプター、下の鎖を参照)、及びテール(図16、3’スプリントライゲーションアダプター、上の鎖を参照)である。アダプタースプリント部分は、5’から3’へ、ME、UMI’、ME’、切断A14’の領域を含む。ME及びA14’配列の両方は、所望のハイブリダイゼーション特異性を改善するため、かつアダプターオリゴヌクレオチドコストを減少させるために切断され得る。例えば、MEは、5’から3’へのアダプター結合に必要な完全なME’配列との分子内ハイブリダイゼーションを防ぐために切断される。アダプターテール部分は、UMI及びME配列を介してアダプタースプリント部分にハイブリダイズし、これは、5’アダプターと3’アダプターとの間のハイブリダイゼーションを安定化させることによって効率を改善し得る。アダプターテール部分は、5’から3’へ、UMI、ME’、及びB15の領域を含有する。アダプターテール部分は切断されていない。標的DNAの非転移鎖をアダプターのテールの5’末端まで伸長させ、実施例14に記載のライゲーション工程に従って特定されるようにライゲーションする。
標準的な配列決定方法(実施例2に記載され、図3B及び図20に示される)を用いて、この実施例のライブラリーを、それぞれ挿入DNAに先行及び後続する、リード2の開始点又はリード1の末端点において配列決定できる。
実施例15b.3’スプリントライゲーションアダプターを使用する配列決定のためのDNAライブラリーの調製。
この実施例は、UMIがタグメンテーション後に組み込まれる、インラインUMIを有するDNA配列決定ライブラリーを調製するために使用される非対称タグメンテーションBLT法を記載する(図16)。3’スプリントライゲーションアダプターを使用してUMIを組み込む。この実施例は、以下の変更を加えた実施例15aによって提供される方法を記載する。
この実施例は、UMIがタグメンテーション後に組み込まれる、インラインUMIを有するDNA配列決定ライブラリーを調製するために使用される非対称タグメンテーションBLT法を記載する(図16)。3’スプリントライゲーションアダプターを使用してUMIを組み込む。この実施例は、以下の変更を加えた実施例15aによって提供される方法を記載する。
3’スプリントライゲーションアダプターは、以下の変更を加えた上記実施例15aに記載される通りである。アダプタースプリント部分は、5’から3’へ、X、UMI’、ME’の領域を含有する。実施例15aのスプリント部分と比較して、この実施例におけるスプリント部分は、3’スプリントアダプターがビーズ上の3’アダプター付加を容易にできるように、A14’を含有しない。X配列は、3’TruSeq(商標)アダプター配列の一部であり、所望のハイブリダイゼーション特異性を改善し、アダプターオリゴヌクレオチドコストを減少させるために切断され得る。アダプターテール部分は、5’から3’へ、UMI、X’及びB15の領域を含有する。
この実施例のライブラリーは、次の変更を加え、すなわち、カスタムリード2プライマーを必要として、標準的な配列決定方法(実施例2に記載され、図3B及び図20に示される)を使用して配列決定される。
実施例16a.3’鋳型スイッチオリゴヌクレオチドを使用する配列決定のためのDNAライブラリーの調製
この実施例は、UMIがタグメンテーション後に組み込まれる、インラインUMIを有するDNA配列決定ライブラリーを調製するために使用される非対称タグメンテーションBLT法を記載する(図17)。3’鋳型スイッチオリゴヌクレオチドを使用してUMIを組み込む。
この実施例は、UMIがタグメンテーション後に組み込まれる、インラインUMIを有するDNA配列決定ライブラリーを調製するために使用される非対称タグメンテーションBLT法を記載する(図17)。3’鋳型スイッチオリゴヌクレオチドを使用してUMIを組み込む。
材料は実施例1に記載した通りである。
3’鋳型スイッチオリゴヌクレオチドは、約70ヌクレオチド長であり、5’から3’へ、B15’、ME又はX、UMI’、ME’、及びA14’の領域を含有する。
5’アダプタータグメンテーション及び3’アダプターハイブリダイゼーション工程を、実施例13に記載されるように行う。ハイブリダイゼーション後、マウス白血病ウイルス(MMLV)逆転写酵素などの、DNA指向性鋳型切り替えが可能なポリメラーゼを用いて伸長を行う。非転移鎖を伸長して、転移鎖の5’末端を9ヌクレオチドまでコピーする。鋳型スイッチ接合部(図17中の**)に到達すると、ポリメラーゼは、鋳型として非転移DNA鎖を使用することから、3’鋳型スイッチオリゴヌクレオチドに切り替えることができる。このようにして、UMI、ME’/X’、及びB15配列は、3’鋳型スイッチオリゴヌクレオチドからコピーされる。
標準的な配列決定方法(実施例2に記載され、図3B及び図20に示される)を用いて、この実施例のライブラリーを、それぞれ挿入DNAに先行及び後続する、リード2の開始点又はリード1の末端点において配列決定できる。
実施例16b.3’鋳型スイッチオリゴヌクレオチドを使用する配列決定のためのDNAライブラリーの調製
この実施例は、UMIがタグメンテーション後に組み込まれる、インラインUMIを有するDNA配列決定ライブラリーを調製するために使用される非対称タグメンテーションBLT法を記載する(図17)。3’鋳型スイッチオリゴヌクレオチドを使用してUMIを組み込む。この実施例は、3’鋳型スイッチオリゴヌクレオチドに以下の変更を加えた実施例16aによって提供される方法を記載する。
この実施例は、UMIがタグメンテーション後に組み込まれる、インラインUMIを有するDNA配列決定ライブラリーを調製するために使用される非対称タグメンテーションBLT法を記載する(図17)。3’鋳型スイッチオリゴヌクレオチドを使用してUMIを組み込む。この実施例は、3’鋳型スイッチオリゴヌクレオチドに以下の変更を加えた実施例16aによって提供される方法を記載する。
3’鋳型スイッチオリゴヌクレオチドのA14’配列は、3’鋳型スイッチオリゴヌクレオチドのビーズ上の付加を容易にするため、切断又は除去される。
標準的な配列決定方法(実施例2に記載され、図3B及び図20に示される)を用いて、この実施例のライブラリーを、それぞれ挿入DNAに先行及び後続する、リード2の開始点又はリード1の末端点において配列決定できる。
実施例16c.5’一本鎖ポリメラーゼ鋳型スイッチオリゴヌクレオチドを使用する配列決定のためのDNAライブラリーの調製
この実施例は、UMIがタグメンテーション後に組み込まれる、インラインUMIを有するDNA配列決定ライブラリーを調製するために使用される非対称タグメンテーションBLT法を記載する(図18A~図18D)。5’ポリメラーゼ鋳型スイッチオリゴヌクレオチドを用いてUMIを組み込む。
この実施例は、UMIがタグメンテーション後に組み込まれる、インラインUMIを有するDNA配列決定ライブラリーを調製するために使用される非対称タグメンテーションBLT法を記載する(図18A~図18D)。5’ポリメラーゼ鋳型スイッチオリゴヌクレオチドを用いてUMIを組み込む。
材料は実施例1に記載した通りである。循環腫瘍DNA(ctDNA)を標的DNAとして使用する。
5’一本鎖ポリメラーゼ鋳型スイッチオリゴヌクレオチドは、5’から3’へ、B15、X、及びUMIの領域を有する5’アダプターである(図18B)。
タグメンテーション及びアダプターハイブリダイゼーション工程を、実施例13に記載されるように行う(図18A~図18B)。この実施例では、5’アダプターをME’の5’に付加する(図18B)。
次いで、ポリメラーゼ鋳型スイッチを用いて、5’アダプターをDNAインサートに付加する。ポリメラーゼは、鋳型としての挿入DNAの使用から、鋳型としての付加された5’アダプターの使用に切り替わる(図18C)。伸長が完了したら、B15、X、及びUMI配列を挿入DNAの3’末端に融合させ、PCR反応における鋳型として使用して、更なるフローセル及び試料インデックスアダプターエレメントを付加することができる(図18D)。
この実施例のライブラリーを、標準的な配列決定法(実施例2に記載される)を使用して配列決定する。X領域は、MEの非存在下でのB15からの配列決定のために適切なTmに達するように、B15領域を伸長するために働く。
実施例16d.5’二本鎖アダプター、ポリメラーゼ伸長及び近接ライゲーションを使用する配列決定のためのDNAライブラリーの調製
この実施例は、UMIがタグメンテーション後に組み込まれる、インラインUMIを有するDNA配列決定ライブラリーを調製するために使用される非対称タグメンテーションBLT法を記載する(図19A~図19D)。5’二本鎖アダプターを使用してUMIを組み込む。
この実施例は、UMIがタグメンテーション後に組み込まれる、インラインUMIを有するDNA配列決定ライブラリーを調製するために使用される非対称タグメンテーションBLT法を記載する(図19A~図19D)。5’二本鎖アダプターを使用してUMIを組み込む。
材料は実施例1に記載した通りである。循環腫瘍DNA(ctDNA)を標的DNAとして使用する。
この実施例では、5’二本鎖アダプターは、その第1の鎖上に5’から3’へ、B15、X、及びUMIの領域を含有する。第2の鎖は、5’から3’へ、本明細書に列挙される相補的配列であるUMI’、X’、及びB15’を含む。5’-リン酸は、5’アダプターの第2の鎖上に存在するが、タグメンテーションアダプター上のME’は、ME’と5’アダプターとのライゲーションを阻止するために脱リン酸化される(図19B)。
タグメンテーション及びアダプターハイブリダイゼーション工程を、実施例13に記載されるように行う(図19A~図19B)。5’アダプターをME’の5’に付加する(図19B)。アダプターハイブリダイゼーションの間、5’アダプターの第1の鎖及び第2の鎖は混合されて二本鎖を形成する。また、タグメンテーションアダプター上のME’は、5’アダプターとのライゲーションを阻止するために脱リン酸化される(図19B)。
次いで、T4 DNA pol Exo(New England BioLabs、カタログ番号M0203S)又はTtaq608などのポリメラーゼを用いて、最初の転位反応からギャップを横切って伸長させる(図19C)。Taqポリメラーゼ、又は前述のポリメラーゼのいずれかの変異体、アナログ、若しくは誘導体もまた、この工程において代わりに使用され得る。使用したポリメラーゼは、鎖置換又はエキソヌクレアーゼ活性を欠いている。ギャップ伸長は、ME’との接合部で終結する。
次いで、近接ライゲーション工程が、3’伸長産物と5’アダプターの第2の鎖との間で起こる(図19C)。
この実施例のライブラリー(図19D)を、標準的な配列決定法(実施例2に記載される)を使用して配列決定する。X領域は、MEの非存在下でのB15からの配列決定のために適切なTmに達するように、B15領域を伸長するために働く。リードは、インサートの品質及び可変インサート長に起因して、リード2の開始点において捕捉される可能性がより高い。
実施例17.低頻度変異体の検出のためのDNAライブラリーの調製
この実施例は、低頻度一塩基バリアント(SNV)及び構造変異体(SV)の検出のためのDNA配列決定ライブラリーを調製するために使用される非対称タグメンテーションBLT法を記載する。
この実施例は、低頻度一塩基バリアント(SNV)及び構造変異体(SV)の検出のためのDNA配列決定ライブラリーを調製するために使用される非対称タグメンテーションBLT法を記載する。
第1のDNAライブラリーを、上記実施例7に記載の方法を使用して調製する。第2のDNAライブラリーを、TruSeq(商標)法を使用して調製する。
SNV 及びSVを特定の量、すなわち2%、0.5%及び0.2%で含有するDNAを使用する。
均等物
前述の明細書は、当業者が実施形態を実践することを可能にするのに十分であると考えられる。前述の説明及び実施例は、特定の実施形態を詳細に詳述し、本発明者らによって想到される最良の様式を説明する。しかしながら、前述の内容が本文にどれほど詳細にあらわれていても、実施形態は多くの方式で実施することができ、添付の特許請求の範囲及びその任意の均等物に従って解釈されるべきであることが理解されるであろう。
前述の明細書は、当業者が実施形態を実践することを可能にするのに十分であると考えられる。前述の説明及び実施例は、特定の実施形態を詳細に詳述し、本発明者らによって想到される最良の様式を説明する。しかしながら、前述の内容が本文にどれほど詳細にあらわれていても、実施形態は多くの方式で実施することができ、添付の特許請求の範囲及びその任意の均等物に従って解釈されるべきであることが理解されるであろう。
本明細書で使用するとき、約という用語は、明示的に示されているか否かにかかわらず、例えば、整数、割合、及び百分率を含む数値を指す。用語は、一般に、当業者が列挙された値(例えば、同じ機能又は結果を有する)と同等であると考えられる数値の範囲(例えば、列挙された範囲の±5~10%)を指す。少なくとも及び約などの用語が数値又は範囲のリストの前にある場合、その用語はリスト内に提供される値又は範囲の全てを変更する。場合によっては、約という用語は、最も近い有効数字に丸められた数値を含んでもよい。
Claims (83)
- 二本鎖核酸ライブラリーを作製する方法であって、前記ライブラリー中の各断片は固有分子識別子(UMI)を含み、前記方法は、
a.二本鎖標的核酸を含む試料を、
i.第1のトランスポザーゼと、
ii.第1の3’末端トランスポゾン末端配列、第1のアダプター配列、及び第1のUMIを含む第1のトランスポゾンと、
iii.前記第1の3’末端トランスポゾン末端配列に完全に又は部分的に相補的である配列を含む第2のトランスポゾンと、を含む、第1のトランスポソーム複合体に適用することと、
b.前記二本鎖標的核酸を前記第1のトランスポソーム複合体でタグメンテーションして、タグメンテーション化二本鎖標的核酸断片を生成することであって、各タグメンテーション化二本鎖標的核酸断片は前記第1のアダプター配列及び前記第1のUMIを含む、ことと、
c.前記タグメンテーション化二本鎖標的核酸断片を前記第1のトランスポソーム複合体から遊離させることと、
d.任意選択的に、前記タグメンテーション化二本鎖標的核酸断片を伸長させることと、
e.任意選択的に、前記第1のトランスポゾンを、前記タグメンテーション化二本鎖標的核酸断片又は前記伸長させたタグメンテーション化二本鎖標的核酸断片とライゲーションすることと、
f.タグメンテーション化二本鎖標的核酸断片を生成することと、
g.前記タグメンテーション化二本鎖標的核酸断片を増幅することと、を含む、方法。 - 前記第1のトランスポゾン内の前記第1のUMIが、前記第1のアダプター配列と前記第1の3’トランスポゾン末端配列との間に位置する、請求項1に記載の方法。
- 前記第1のトランスポゾン内の前記第1のアダプター配列が、前記第1のUMIと前記第1の3’トランスポゾン末端配列との間に位置する、請求項1又は2に記載の方法。
- a.第2のトランスポザーゼと、
b.第2のアダプター配列及び第2の3’トランスポゾン末端配列を含む第3のトランスポゾンと、
c.前記第2の3’末端トランスポゾン末端配列に完全に又は部分的に相補的である配列を含む第4のトランスポゾンと、を含む、第2のトランスポソーム複合体を更に含む、請求項1~3のいずれか一項に記載の方法。 - 前記タグメンテーション化工程が、
a.前記第1のアダプター配列及び前記第1のUMIを含む第1の鎖と、
b.前記第2のアダプター配列を含む第2の鎖と、を含む、タグメンテーション化二本鎖標的核酸断片を生成する、請求項4に記載の方法。 - a.前記第3のトランスポゾンが、第2のUMIを更に含み、
b.前記第2のアダプター配列が、前記第2のUMIと前記第2の3’トランスポゾン末端配列との間に位置する、請求項4又は5に記載の方法。 - 前記タグメンテーション化工程が、
a.前記第1のアダプター配列及び前記第1のUMIを含む第1の鎖と、
b.前記第2のアダプター配列及び前記第2のUMIを含む第2の鎖と、を含む、二本鎖標的核酸断片を生成する、請求項6に記載の方法。 - 二本鎖核酸ライブラリーを作製する方法であって、前記ライブラリー中の各断片はUMIを含み、前記方法は、
a.二本鎖標的核酸を含む試料を、
i.トランスポザーゼと、
ii.第1の3’末端トランスポゾン末端配列、及び第1のアダプター配列を含む第1のトランスポゾンと、
iii.前記第1の3’末端トランスポゾン末端配列に完全に又は部分的に相補的である配列を含む第2のトランスポゾンと、を含む、トランスポソーム複合体に適用することと、
b.前記二本鎖標的核酸の第1の鎖を前記トランスポソーム複合体でタグメンテーションして、タグメンテーション化二本鎖標的核酸断片を生成することであって、各タグメンテーション化二本鎖標的核酸断片は前記第1のアダプター配列を含む、ことと、
c.前記タグメンテーション化二本鎖標的核酸断片を前記トランスポソーム複合体から遊離させることと、
d.第2のアダプター配列、UMI、及び前記第1の3’末端トランスポゾン配列に完全に又は部分的に相補的である配列を含むポリヌクレオチドをハイブリダイズさせることと、
e.任意選択的に、前記タグメンテーション化二本鎖標的核酸断片の第2の鎖を伸長させることと、
f.任意選択的に、前記ポリヌクレオチドを、前記タグメンテーション化二本鎖標的核酸断片又は前記伸長させたタグメンテーション化二本鎖標的核酸断片とライゲーションすることと、
g.前記UMIを含むタグメンテーション化二本鎖標的核酸断片を生成することであって、前記UMIは、挿入DNAの3’末端に直接隣接して位置する、ことと、
h.前記UMIを含むタグメンテーション化二本鎖標的核酸断片を増幅することと、を含む、方法。 - 二本鎖核酸ライブラリーを作製する方法であって、前記ライブラリー中の各断片はUMIを含み、前記方法は、
a.二本鎖標的核酸を含む試料を、
i.トランスポザーゼと、
ii.第1の3’末端トランスポゾン末端配列、及び第1のアダプター配列を含む第1のトランスポゾンと、
iii.前記第1の3’末端トランスポゾン末端配列に完全に又は部分的に相補的である配列を含む第2のトランスポゾンと、を含む、トランスポソーム複合体に適用することと、
b.前記二本鎖標的核酸の第1の鎖を前記トランスポソーム複合体でタグメンテーションして、タグメンテーション化二本鎖標的核酸断片を生成することであって、各タグメンテーション化二本鎖標的核酸断片は前記第1のアダプター配列を含む、ことと、
c.前記タグメンテーション化二本鎖標的核酸断片をトランスポソーム複合体から遊離させることと、
d.UMI及び第2のアダプター配列を含む第1のポリヌクレオチドをハイブリダイズさせることと、
e.任意選択的に、前記第1のポリヌクレオチドに相補的な領域を含む第2のポリヌクレオチドを付加して、二本鎖アダプターを生成させることと、
f.任意選択的に、前記タグメンテーション化二本鎖標的核酸断片の第2の鎖を伸長させることと、
g.任意選択的に、前記第2のポリヌクレオチドを、前記伸長させたタグメンテーション化二本鎖標的核酸断片の前記第2の鎖とライゲーションすることと、
h.前記UMIを含むタグメンテーション化二本鎖標的核酸断片を生成することであって、前記UMIは、前記二本鎖標的核酸断片と前記第2のアダプター配列との間に位置する、ことと、
i.前記UMIを含む前記タグメンテーション化二本鎖標的核酸断片を増幅することと、を含む、方法。 - 前記ハイブリダイズさせる工程の後に、前記方法が、
a.前記二本鎖標的核酸断片の第2の鎖を伸長することと、
b.前記第1のポリヌクレオチドをコピーすることと、を更に含む、請求項9に記載の方法。 - 二本鎖核酸ライブラリーを作製する方法であって、前記ライブラリー中の各断片は2つの異なるUMIを含み、前記方法は、
a.二本鎖標的核酸を含む試料を、
i.第1のトランスポソーム複合体であって、
1.第1のトランスポザーゼと、
2.(a)前記二本鎖標的核酸断片の第1の鎖上の第1のトランスポゾン、及び(b)第2のトランスポゾンを含む、第1のフォーク型アダプターと、を含み、
前記第1のトランスポゾンは、第1の3’末端トランスポゾン末端配列、第1のアダプター配列の第1のコピー、及び第1のUMIを含み、
前記第2のトランスポゾンは、第2のアダプター配列の第1のコピー、並びに前記第1の3’末端トランスポゾン末端配列及び前記第1のUMIに完全に又は部分的に相補的である配列を含み、
更に、前記第1のアダプター配列の前記第1のコピーは一本鎖であり、前記第2のアダプター配列の前記第1のコピーは二本鎖部分を含む、第1のトランスポソーム複合体、並びに、
ii.第2のトランスポソーム複合体であって、
1.第2のトランスポザーゼと、
2.(a)前記二本鎖標的核酸断片の第2の鎖上の第3のトランスポゾン、及び(b)第4のトランスポゾンを含む、第2のフォーク型アダプターと、を含み、
前記第3のトランスポゾンは、第2の3’末端トランスポゾン末端配列、前記第1のアダプター配列の第2のコピー、及び第2のUMIを含み、
前記第3のトランスポゾンは、前記第2のアダプター配列の第2のコピー、並びに前記第2の3’末端トランスポゾン末端配列及び前記第2のUMIに完全に又は部分的に相補的である配列を含み、
更に、前記第1のアダプター配列の前記第2のコピーは一本鎖であり、前記第2のアダプター配列の前記第2のコピーは二本鎖部分を含む、第2のトランスポソーム複合体、に適用することと、
b.前記二本鎖標的核酸を前記フォーク型アダプターでタグメンテーションして、タグメンテーション化二本鎖標的核酸断片を生成することであって、各タグメンテーション化二本鎖標的核酸断片は、前記第1のアダプター配列の前記第1のコピー及び前記第2のコピー、前記第1のUMI、前記第2のアダプター配列の前記第1のコピー及び前記第2のコピー、並びに前記第2のUMIを含む、ことと、
c.前記タグメンテーション化二本鎖標的核酸断片を前記トランスポソーム複合体から遊離させることと、
d.任意選択的に、前記タグメンテーション化二本鎖標的核酸断片を伸長させることと、
e.前記第2及び第4のトランスポゾンを、前記二本鎖標的核酸断片又は前記伸長させたタグメンテーション化二本鎖標的核酸断片とライゲーションすることと、
f.タグメンテーション化二本鎖標的核酸断片を生成することと、
g.前記タグメンテーション化二本鎖標的核酸断片を増幅することと、を含む、方法。 - 二本鎖核酸ライブラリーを作製する方法であって、前記ライブラリー中の各断片は4つの異なるUMIを含み、前記方法は、
a.二本鎖標的核酸を含む試料を、
i.第1のトランスポソーム複合体であって、
1.第1のトランスポザーゼと、
2.(a)前記二本鎖標的核酸断片の第1の鎖上の第1のトランスポゾン、及び(b)第2のトランスポゾンを含む、第1のフォーク型アダプターと、を含み、
前記第1のトランスポゾンは、第1の3’末端トランスポゾン末端配列、第1のアダプター配列の第1のコピー、第1のUMIの第1のコピー、及び第2のアダプター配列の第1のコピーを含み、
前記第2のトランスポゾンは、前記第1の3’末端トランスポゾン末端配列に完全に又は部分的に相補的である配列、第3のアダプター配列の第1のコピー、第2のUMIの第1のコピー、及び第4のアダプター配列を含み、
更に、前記第1、第2、及び第3のアダプター配列の前記第1のコピーは一本鎖であり、前記第4のアダプター配列は二本鎖部分を含む、第1のトランスポソーム複合体、並びに、
ii.第2のトランスポソーム複合体であって、
1.第2のトランスポザーゼと、
2.(a)前記二本鎖標的核酸断片の第2の鎖上の第3のトランスポゾン、及び(b)第4のトランスポゾンを含む、第2のフォーク型アダプターと、を含み、
前記第3のトランスポゾンは、第2の3’末端トランスポゾン末端配列、第5のアダプター配列の第1のコピー、第3のUMIの第1のコピー、及び第6のアダプター配列の第1のコピーを含み、
前記第4のトランスポゾンは、前記第2の3’末端トランスポゾン末端配列に完全に又は部分的に相補的である配列、第7のアダプター配列の第1のコピー、第4のUMIの第1のコピー、及び第8のアダプター配列を含み、
更に、前記第5、第6、及び第7のアダプター配列の前記第1のコピーは一本鎖であり、前記第8のアダプター配列は二本鎖部分を含む、第2のトランスポソーム複合体、に適用することと、
b.前記二本鎖標的核酸を前記フォーク型アダプターでタグメンテーションして、タグメンテーション化二本鎖標的核酸断片を生成することであって、各タグメンテーション化二本鎖標的核酸断片は、前記第1、第2、第3、第5、第6、及び第7アダプター配列の前記第1のコピー、前記第1、第2、第3、及び第4のUMIの前記第1のコピー、前記第6のアダプター配列、並びに前記第8のアダプター配列を含み、
c.前記タグメンテーション化二本鎖標的核酸断片を前記トランスポソーム複合体から遊離させることと、
d.任意選択的に、前記タグメンテーション化二本鎖標的核酸断片を伸長させることと、
e.前記第2及び第4のトランスポゾンを、前記二本鎖標的核酸断片又は前記伸長させたタグメンテーション化二本鎖標的核酸断片とライゲーションすることと、
f.タグメンテーション化二本鎖標的核酸断片を生成することと、
g.前記タグメンテーション化二本鎖標的核酸断片を増幅することと、を含む、方法。 - 前記第1、第2、第3、及び第4のUMIが相補的又は異なる配列であってもよい、請求項6、7、11、又は12のいずれか一項に記載の方法。
- 前記二本鎖標的核酸が二本鎖DNAである、請求項1~13のいずれか一項に記載の方法。
- 前記二本鎖標的核酸がctDNAである、請求項1~13のいずれか一項に記載の方法。
- 前記二本鎖標的核酸がcfDNAである、請求項1~13のいずれか一項に記載の方法。
- 前記二本鎖標的核酸がRNAである、請求項1~13のいずれか一項に記載の方法。
- 二本鎖標的核酸が、cDNAであるか、又はDNA:RNA二重鎖が、RNAから生成される、請求項1~13のいずれか一項に記載の方法。
- 前記第1のアダプター配列が、5’第1リード配列決定アダプター配列である、請求項1~18のいずれか一項に記載の方法。
- 前記第2のアダプター配列が、5’第2リード配列決定アダプター配列である、請求項1~19のいずれか一項に記載の方法。
- 前記第1及び第2のアダプター配列が、5’第1リード及び5’第2リード配列決定アダプター配列である、請求項1~20のいずれか一項に記載の方法。
- 前記5’第1リード及び5’第2リード配列決定アダプター配列が、固有プライマー結合部位を含む、請求項1~21のいずれか一項に記載の方法。
- 前記第1のUMIが、前記タグメンテーション化二本鎖標的核酸断片の前記第1の鎖上にある、請求項1、2、4~8、又は13~22のいずれか一項に記載の方法。
- 前記第1のUMIの第1のコピーが前記タグメンテーション化二本鎖標的核酸断片の前記第1の鎖上にあり、前記第1のUMIの第2のコピーが前記第2の鎖上にある、請求項1、3、5~7、13~22のいずれか一項に記載の方法。
- 前記第1のUMIが、前記タグメンテーション化二本鎖標的核酸断片の前記第1の鎖上にあり、前記第2のUMIが、前記タグメンテーション化二本鎖標的核酸断片の前記第2の鎖上にある、請求項1~7、13~22のいずれか一項に記載の方法。
- 前記第1、第2、第3、又は第4のトランスポゾンがビオチンタグを更に含む、請求項1~25のいずれか一項に記載の方法。
- 前記第1、第2、第3、又は第4のトランスポゾンが、第1の固有プライマー結合配列を更に含む、請求項1~26のいずれか一項に記載の方法。
- 前記第1、第2、第3、又は第4のトランスポゾンが、第2の固有プライマー結合配列を更に含む、請求項27に記載の方法。
- 前記固有プライマー結合配列が、A2、A14、及び/又はB15を含む、請求項27又は28に記載の方法。
- 前記ハイブリダイズさせる工程が、フォーク型アダプターを生成する、請求項8~10又は14~22のいずれか一項に記載の方法。
- 前記二本鎖標的核酸断片の3’末端から前記トランスポゾンの5’末端まで伸長させることを更に含む、請求項1~30のいずれか一項に記載の方法。
- 前記ライゲーション工程が、前記タグメンテーション化二本鎖標的核酸断片の3’末端又は前記伸長させたタグメンテーション化二本鎖標的核酸断片の3’末端を、前記第1、第2、又は第4のトランスポゾンの5’末端とライゲーションすることを含む、請求項1~7又は11~31のいずれか一項に記載の方法。
- 前記伸長及び/又はライゲーション工程が、伸長ライゲーション混合物中で任意選択的に実施される、請求項1~32のいずれか一項に記載の方法。
- 前記ポリヌクレオチドが、
a.ヘアピンUMI、
b.ヘアピンUMIとユニバーサルハイブリダイズテール、
c.スプリントライゲーションアダプター、又は
d.3’鋳型スイッチオリゴヌクレオチド、を含む3’アダプターを含む、請求項8、15~22、26~33のいずれか一項に記載の方法。 - 前記ヘアピンUMIが、前記伸長工程及び/又は前記ライゲーション工程中は安定であるが、前記増幅工程中は安定ではない、請求項34に記載の方法。
- 前記ヘアピンUMIが3又は4塩基対ステムを含む、請求項34又は35に記載の方法。
- 前記ユニバーサルハイブリダイズテールが、任意のDNAヌクレオチドに結合できるヌクレオチドを含む、請求項34~36のいずれか一項に記載の方法。
- 前記ライゲーション工程が、前記タグメンテーション化二本鎖標的核酸断片の前記第2の鎖の3’末端を前記ユニバーサルハイブリダイズテールの5’末端とライゲーションすることを含む、請求項34~37のいずれか一項に記載の方法。
- a.前記ポリヌクレオチドが、ヘアピンUMIを含む3’アダプターを含み、
b.前記伸長工程が、前記タグメンテーション化二本鎖標的核酸断片の前記第2の鎖の3’末端から前記ヘアピンUMIの5’末端まで伸長させることを含む、請求項34に記載の方法。 - 前記ライゲーション工程が、前記伸長させたタグメンテーション化二本鎖標的核酸断片の第2の鎖の前記3’末端を前記ヘアピンUMIの前記5’末端とライゲーションすることを含む、請求項39に記載の方法。
- a.前記ポリヌクレオチドが、スプリントライゲーションアダプターを含み、
b.前記伸長工程が、前記タグメンテーション化二本鎖標的核酸断片の前記第2の鎖の3’末端から前記スプリントライゲーションアダプターの5’末端まで伸長させることを含む、請求項34に記載の方法。 - 前記伸長工程が、9塩基を伸長させることを含む、請求項41に記載の方法。
- 前記ライゲーション工程が、前記伸長させたタグメンテーション化二本鎖標的核酸断片の前記第2の鎖の前記3’末端を前記スプリントライゲーションアダプターの第1の鎖の5’末端とライゲーションすることを含む、請求項41又は42に記載の方法。
- a.前記ポリヌクレオチドが、鋳型スイッチオリゴヌクレオチドを含み、
b.前記伸長工程が、前記タグメンテーション化二本鎖標的核酸断片の前記第1の鎖をコピーすることによって、前記タグメンテーション化二本鎖標的核酸断片の前記第2の鎖の3’末端から前記鋳型スイッチオリゴヌクレオチド内の接合部まで伸長させることと、
c.前記第1の鎖から前記3’鋳型スイッチオリゴヌクレオチドの不対領域に鋳型を切り替えることと、
d.前記3’鋳型スイッチオリゴヌクレオチドの不対領域を、前記接合部から前記3’鋳型スイッチオリゴヌクレオチドの前記不対領域の5’末端にコピーすることと、を含む、請求項34のいずれか一項に記載の方法。 - 前記伸長、切り替え、及びコピーすることが、DNA指向性鋳型切り替えが可能なポリメラーゼによって行われる、請求項44に記載の方法。
- 前記DNA指向性鋳型切り替えが可能なポリメラーゼが、MMLV逆転写酵素を含む、請求項44又は45に記載の方法。
- 前記ライゲーション工程が、前記タグメンテーション化二本鎖標的核酸断片の3’末端を、第1、第2、又は第4のトランスポゾンの5’末端とライゲーションすることを含む、請求項1~33のいずれか一項に記載の方法。
- 前記増幅工程の後に、あるサイズ範囲内の増幅された核酸断片を選択することを更に含む、請求項1~33又は47のいずれか一項に記載の方法。
- 前記増幅工程が、前記ライブラリーを固体支持体に付着させるために、前記タグメンテーション化二本鎖標的核酸断片の一端又は両端にオリゴヌクレオチドを付加することを含む、請求項1~48のいずれか一項に記載の方法。
- 前記増幅工程が、少なくとも第1リード配列決定オリゴヌクレオチド及び/又は第2リード配列決定オリゴヌクレオチドを添加することを含む、請求項1~49のいずれか一項に記載の方法。
- 前記増幅工程が、少なくともP5オリゴヌクレオチド及びP7オリゴヌクレオチドを添加することを含む、請求項1~50のいずれか一項に記載の方法。
- 前記増幅工程が、少なくとも複数のi5オリゴヌクレオチド及び複数のi7オリゴヌクレオチドを添加することを含む、請求項1~51のいずれか一項に記載の方法。
- 前記トランスポソーム複合体、前記第1のトランスポソーム複合体及び/又は前記第2のトランスポソーム複合体が固体支持体上にある、請求項1~52のいずれか一項に記載の方法。
- 前記トランスポソーム複合体、前記第1のトランスポソーム複合体及び/又は前記第2のトランスポソーム複合体が溶液中にある、請求項1~53のいずれか一項に記載の方法。
- 請求項1~54のいずれか一項に記載の方法によって生成された二本鎖核酸ライブラリーを配列決定する方法であって、前記UMIを配列決定して、DNA配列決定における感度を増加させる、方法。
- 類似の融解温度を有する配列決定プライマーを結合させることを含む、請求項55に記載の方法。
- 固有プライマー結合配列に完全に又は部分的に相補的である配列を含む配列決定プライマーを結合させることを含む、請求項55又は56に記載の方法。
- 少なくともA2配列を有するプライマーを配列決定することを含む、請求項55~57のいずれか一項に記載の方法。
- 少なくともA14配列及びB15配列を有するプライマーを配列決定することを含む、請求項55~57のいずれか一項に記載の方法。
- 少なくとも架橋プライマーを有するプライマーを配列決定することを含む、請求項55~59のいずれか一項に記載の方法。
- 暗サイクルを更に含み、データが前記配列決定法の一部について記録されていない、請求項55~60のいずれか一項に記載の方法。
- 記録されていない前記データが、前記3’トランスポゾン末端配列に関連する配列データである、請求項55~60のいずれか一項に記載の方法。
- 前記方法が、暗サイクルの必要性をなくす、請求項55~60のいずれか一項に記載の方法。
- 前記伸長工程が、前記UMI又は前記第1のUMIをコピーして二重鎖UMIを生成するポリメラーゼを含む、請求項1又は9に記載の方法。
- トランスポソーム複合体であって、
a.トランスポザーゼと、
b.3’トランスポゾン末端配列及び5’アダプター配列を含む、第1のトランスポゾンと、
c.前記第1の3’末端トランスポゾン末端配列に完全に又は部分的に相補的である配列を含む第2のトランスポゾンと、を含む、トランスポソーム複合体。 - 前記第1のトランスポゾンの前記5’アダプター配列が、A14配列(配列番号4)、A2配列(配列番号7)、及び/又はB15配列(配列番号5)を含む、請求項65に記載のトランスポソーム複合体。
- 前記第1のトランスポゾンが、UMI配列を更に含む、請求項65又は66に記載のトランスポソーム複合体。
- 前記第1又は第2のトランスポゾンが、A14-ME(配列番号1)を含む、請求項65~67のいずれか一項に記載のトランスポソーム複合体。
- 前記第1又は第2のトランスポゾンが、B15-ME(配列番号2)を含む、請求項65~67のいずれか一項に記載のトランスポソーム複合体。
- 前記第1のトランスポゾンの前記3’トランスポゾン末端配列が、ME(配列番号6)又はME’(配列番号3)を含む、請求項65~67のいずれか一項に記載のトランスポソーム複合体。
- 前記第2のトランスポゾンの前記3’トランスポゾン末端配列が、ME(配列番号6)又はME’(配列番号3)を含む、請求項65~67のいずれか一項に記載のトランスポソーム複合体。
- 前記第2のトランスポゾンが、3’アダプター配列を更に含み、
前記第2のトランスポゾンの前記3’アダプター配列は、前記第1のトランスポゾンの前記5’アダプター配列に部分的に又は完全に相補的である、請求項67に記載のトランスポソーム複合体。 - 前記第2のトランスポゾンが、3’アダプター配列を更に含み、
前記第2のトランスポゾンの前記3’アダプター配列は、前記第1のトランスポゾンの前記5’アダプター配列に相補的な部分がない、請求項67に記載のトランスポソーム複合体。 - 前記第2のトランスポゾンの前記3’アダプター配列が、A14配列(配列番号4)、A2配列(配列番号7)、B15配列(配列番号5)、X配列、Y’配列、A配列、及び/又はB配列を含む、請求項72又は73に記載のトランスポソーム複合体。
- 前記第2のトランスポゾンが、前記第1のトランスポゾンの前記UMI配列に相補的である配列を更に含む、請求項72又は74に記載のトランスポソーム複合体。
- 前記第2のトランスポゾンが、UMIを更に含み、前記第2のトランスポゾンの前記UMIは、前記第1のトランスポゾンの前記UMIとは異なる配列を含む、請求項73又は74に記載のトランスポソーム複合体。
- 前記B15配列又はA14配列に相補的なオリゴヌクレオチドを更に含む、請求項75又は76に記載のトランスポソーム複合体。
- a.A14配列に隣接するAアダプター配列、
b.B15配列に隣接するBアダプター配列、
c.ME配列に隣接するXアダプター配列、及び/又は
d.ME’配列に隣接するY’アダプター配列、を更に含む、請求項76に記載のトランスポソーム複合体。 - 前記トランスポソーム複合体が、前記第1のトランスポゾン又は前記第2のトランスポゾンを介して固体支持体に固定されている、請求項65~78のいずれか一項に記載のトランスポソーム複合体。
- 前記トランスポソーム複合体が、前記相補的オリゴヌクレオチドを介して固体支持体に固定されている、請求項77に記載のトランスポソーム複合体。
- 前記固体支持体がビーズである、請求項79又は80に記載のトランスポソーム複合体。
- 請求項65~81のいずれか一項に記載のトランスポソーム複合体を含む、キット。
- 請求項65~81のいずれか一項に記載のトランスポソーム複合体を生成するための、キット。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US202163168802P | 2021-03-31 | 2021-03-31 | |
US63/168,802 | 2021-03-31 | ||
PCT/US2022/022379 WO2022212402A1 (en) | 2021-03-31 | 2022-03-29 | Methods of preparing directional tagmentation sequencing libraries using transposon-based technology with unique molecular identifiers for error correction |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2024511760A true JP2024511760A (ja) | 2024-03-15 |
Family
ID=81653505
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2023557365A Pending JP2024511760A (ja) | 2021-03-31 | 2022-03-29 | エラー補正のための固有分子識別子を有するトランスポゾンベースの技術を使用した指向性タグメンテーション配列決定ライブラリーの調製方法 |
Country Status (11)
Country | Link |
---|---|
US (1) | US20240026348A1 (ja) |
EP (1) | EP4314283A1 (ja) |
JP (1) | JP2024511760A (ja) |
KR (1) | KR20230164668A (ja) |
CN (1) | CN117015603A (ja) |
AU (1) | AU2022249289A1 (ja) |
BR (1) | BR112023019945A2 (ja) |
CA (1) | CA3211172A1 (ja) |
IL (1) | IL307164A (ja) |
MX (1) | MX2023011218A (ja) |
WO (1) | WO2022212402A1 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2024173880A1 (en) * | 2023-02-17 | 2024-08-22 | Twist Bioscience Corporation | Reagents and methods for normalization |
Family Cites Families (68)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CA1323293C (en) | 1987-12-11 | 1993-10-19 | Keith C. Backman | Assay using template-dependent nucleic acid probe reorganization |
CA1341584C (en) | 1988-04-06 | 2008-11-18 | Bruce Wallace | Method of amplifying and detecting nucleic acid sequences |
WO1989009835A1 (en) | 1988-04-08 | 1989-10-19 | The Salk Institute For Biological Studies | Ligase-based amplification method |
JP2837868B2 (ja) * | 1988-05-24 | 1998-12-16 | アンリツ株式会社 | 分光装置 |
ATE144556T1 (de) | 1988-06-24 | 1996-11-15 | Amgen Inc | Verfahren und mittel zum nachweis von nukleinsäuresequenzen |
US5130238A (en) | 1988-06-24 | 1992-07-14 | Cangene Corporation | Enhanced nucleic acid amplification process |
ATE138106T1 (de) | 1988-07-20 | 1996-06-15 | David Segev | Verfahren zur amplifizierung und zum nachweis von nukleinsäuresequenzen |
US5185243A (en) | 1988-08-25 | 1993-02-09 | Syntex (U.S.A.) Inc. | Method for detection of specific nucleic acid sequences |
WO1991006678A1 (en) | 1989-10-26 | 1991-05-16 | Sri International | Dna sequencing |
DE69118930T2 (de) | 1990-01-26 | 1997-01-09 | Abbott Lab | Verbessertes Verfahren zur Amplifikation von Nuklein säurezielsequenz, einsetzbar für die Polymerase und Ligasekettenreaktion |
US5573907A (en) | 1990-01-26 | 1996-11-12 | Abbott Laboratories | Detecting and amplifying target nucleic acids using exonucleolytic activity |
US5455166A (en) | 1991-01-31 | 1995-10-03 | Becton, Dickinson And Company | Strand displacement amplification |
AU694187B2 (en) | 1994-02-07 | 1998-07-16 | Beckman Coulter, Inc. | Ligase/polymerase-mediated genetic bit analysis TM of single nucleotide polymorphisms and its use in genetic analysis |
US5677170A (en) | 1994-03-02 | 1997-10-14 | The Johns Hopkins University | In vitro transposition of artificial transposons |
JPH09510351A (ja) | 1994-03-16 | 1997-10-21 | ジェン−プローブ・インコーポレイテッド | 等温鎖置換核酸増幅法 |
GB9620209D0 (en) | 1996-09-27 | 1996-11-13 | Cemu Bioteknik Ab | Method of sequencing DNA |
GB9626815D0 (en) | 1996-12-23 | 1997-02-12 | Cemu Bioteknik Ab | Method of sequencing DNA |
JP2001509828A (ja) | 1997-01-08 | 2001-07-24 | プロリゴ・エルエルシー | 高分子のバイオコンジュゲーション |
ES2563643T3 (es) | 1997-04-01 | 2016-03-15 | Illumina Cambridge Limited | Método de secuenciación de ácido nucleico |
US7427678B2 (en) | 1998-01-08 | 2008-09-23 | Sigma-Aldrich Co. | Method for immobilizing oligonucleotides employing the cycloaddition bioconjugation method |
AR021833A1 (es) | 1998-09-30 | 2002-08-07 | Applied Research Systems | Metodos de amplificacion y secuenciacion de acido nucleico |
US20050191698A1 (en) | 1999-04-20 | 2005-09-01 | Illumina, Inc. | Nucleic acid sequencing using microsphere arrays |
US6355431B1 (en) | 1999-04-20 | 2002-03-12 | Illumina, Inc. | Detection of nucleic acid amplification reactions using bead arrays |
US20060275782A1 (en) | 1999-04-20 | 2006-12-07 | Illumina, Inc. | Detection of nucleic acid reactions on bead arrays |
US7244559B2 (en) | 1999-09-16 | 2007-07-17 | 454 Life Sciences Corporation | Method of sequencing a nucleic acid |
US6274320B1 (en) | 1999-09-16 | 2001-08-14 | Curagen Corporation | Method of sequencing a nucleic acid |
US7955794B2 (en) | 2000-09-21 | 2011-06-07 | Illumina, Inc. | Multiplex nucleic acid reactions |
US6913884B2 (en) | 2001-08-16 | 2005-07-05 | Illumina, Inc. | Compositions and methods for repetitive use of genomic DNA |
US7611869B2 (en) | 2000-02-07 | 2009-11-03 | Illumina, Inc. | Multiplexed methylation detection methods |
US7582420B2 (en) | 2001-07-12 | 2009-09-01 | Illumina, Inc. | Multiplex nucleic acid reactions |
JP2003521252A (ja) | 2000-02-07 | 2003-07-15 | イルミナ インコーポレイテッド | ユニバーサルプライミングを用いる核酸検出方法 |
US7001792B2 (en) | 2000-04-24 | 2006-02-21 | Eagle Research & Development, Llc | Ultra-fast nucleic acid sequencing device and a method for making and using the same |
CN100462433C (zh) | 2000-07-07 | 2009-02-18 | 维西根生物技术公司 | 实时序列测定 |
EP1354064A2 (en) | 2000-12-01 | 2003-10-22 | Visigen Biotechnologies, Inc. | Enzymatic nucleic acid synthesis: compositions and methods for altering monomer incorporation fidelity |
US7057026B2 (en) | 2001-12-04 | 2006-06-06 | Solexa Limited | Labelled nucleotides |
CN1671673B (zh) | 2002-05-30 | 2010-05-26 | 斯克里普斯研究学院 | 铜催化的叠氮化物和乙炔的连接 |
DK3363809T3 (da) | 2002-08-23 | 2020-05-04 | Illumina Cambridge Ltd | Modificerede nukleotider til polynukleotidsekvensering |
US7595883B1 (en) | 2002-09-16 | 2009-09-29 | The Board Of Trustees Of The Leland Stanford Junior University | Biological analysis arrangement and approach therefor |
EP1636337A4 (en) | 2003-06-20 | 2007-07-04 | Illumina Inc | METHODS AND COMPOSITIONS USEFUL FOR THE AMPLIFICATION AND GENOTYPING OF THE GENOME |
US7259258B2 (en) | 2003-12-17 | 2007-08-21 | Illumina, Inc. | Methods of attaching biological compounds to solid supports using triazine |
EP3175914A1 (en) | 2004-01-07 | 2017-06-07 | Illumina Cambridge Limited | Improvements in or relating to molecular arrays |
US20060062531A1 (en) | 2004-09-17 | 2006-03-23 | Stephen Turner | Fabrication of optical confinements |
GB0427236D0 (en) | 2004-12-13 | 2005-01-12 | Solexa Ltd | Improved method of nucleotide detection |
US7405281B2 (en) | 2005-09-29 | 2008-07-29 | Pacific Biosciences Of California, Inc. | Fluorescent nucleotide analogs and uses therefor |
GB0522310D0 (en) | 2005-11-01 | 2005-12-07 | Solexa Ltd | Methods of preparing libraries of template polynucleotides |
WO2007123744A2 (en) | 2006-03-31 | 2007-11-01 | Solexa, Inc. | Systems and devices for sequence by synthesis analysis |
AU2007309504B2 (en) | 2006-10-23 | 2012-09-13 | Pacific Biosciences Of California, Inc. | Polymerase enzymes and reagents for enhanced nucleic acid sequencing |
GB2457851B (en) | 2006-12-14 | 2011-01-05 | Ion Torrent Systems Inc | Methods and apparatus for measuring analytes using large scale fet arrays |
US8349167B2 (en) | 2006-12-14 | 2013-01-08 | Life Technologies Corporation | Methods and apparatus for detecting molecular interactions using FET arrays |
US8262900B2 (en) | 2006-12-14 | 2012-09-11 | Life Technologies Corporation | Methods and apparatus for measuring analytes using large scale FET arrays |
EP2121983A2 (en) | 2007-02-02 | 2009-11-25 | Illumina Cambridge Limited | Methods for indexing samples and sequencing multiple nucleotide templates |
WO2008096146A1 (en) | 2007-02-07 | 2008-08-14 | Solexa Limited | Preparation of templates for methylation analysis |
US20100137143A1 (en) | 2008-10-22 | 2010-06-03 | Ion Torrent Systems Incorporated | Methods and apparatus for measuring analytes |
US9080211B2 (en) | 2008-10-24 | 2015-07-14 | Epicentre Technologies Corporation | Transposon end compositions and methods for modifying nucleic acids |
WO2012170936A2 (en) | 2011-06-09 | 2012-12-13 | Illumina, Inc. | Patterned flow-cells useful for nucleic acid analysis |
US9683230B2 (en) | 2013-01-09 | 2017-06-20 | Illumina Cambridge Limited | Sample preparation on a solid support |
CA2946046A1 (en) | 2014-04-15 | 2015-10-22 | Illumina, Inc. | Modified transposases for improved insertion sequence bias and increased dna input tolerance |
EP3680333A1 (en) | 2014-04-29 | 2020-07-15 | Illumina, Inc. | Multiplexed single cell expression analysis using template switch and tagmentation |
US10844428B2 (en) | 2015-04-28 | 2020-11-24 | Illumina, Inc. | Error suppression in sequenced DNA fragments using redundant reads with unique molecular indices (UMIS) |
AU2016316773B2 (en) | 2015-08-28 | 2020-01-30 | Illumina, Inc. | Nucleic acid sequence analysis from single cells |
WO2017048993A1 (en) * | 2015-09-15 | 2017-03-23 | Takara Bio Usa, Inc. | Methods for preparing a next generation sequencing (ngs) library from a ribonucleic acid (rna) sample and compositions for practicing the same |
CN116497103A (zh) | 2017-01-18 | 2023-07-28 | 伊鲁米那股份有限公司 | 制备测序衔接子的方法和对核酸分子进行测序的方法 |
DK3452621T3 (da) * | 2017-02-21 | 2022-12-12 | Illumina Inc | Tagmentation ved brug af immobiliserede transposomer med linkere |
AU2018261332B2 (en) | 2017-05-01 | 2024-12-05 | Illumina, Inc. | Optimal index sequences for multiplex massively parallel sequencing |
AU2018266377B2 (en) | 2017-05-08 | 2024-06-20 | Illumina, Inc. | Universal short adapters for indexing of polynucleotide samples |
US11447818B2 (en) | 2017-09-15 | 2022-09-20 | Illumina, Inc. | Universal short adapters with variable length non-random unique molecular identifiers |
AU2018375785A1 (en) | 2017-11-30 | 2019-12-12 | Illumina, Inc. | Validation methods and systems for sequence variant calls |
US11685946B2 (en) | 2019-01-11 | 2023-06-27 | Illumina Cambridge Limited | Complex surface-bound transposome complexes |
-
2022
- 2022-03-29 IL IL307164A patent/IL307164A/en unknown
- 2022-03-29 MX MX2023011218A patent/MX2023011218A/es unknown
- 2022-03-29 KR KR1020237031732A patent/KR20230164668A/ko active Pending
- 2022-03-29 CN CN202280022273.9A patent/CN117015603A/zh active Pending
- 2022-03-29 WO PCT/US2022/022379 patent/WO2022212402A1/en active Application Filing
- 2022-03-29 BR BR112023019945A patent/BR112023019945A2/pt unknown
- 2022-03-29 CA CA3211172A patent/CA3211172A1/en active Pending
- 2022-03-29 EP EP22723498.6A patent/EP4314283A1/en active Pending
- 2022-03-29 JP JP2023557365A patent/JP2024511760A/ja active Pending
- 2022-03-29 AU AU2022249289A patent/AU2022249289A1/en active Pending
-
2023
- 2023-09-28 US US18/476,719 patent/US20240026348A1/en active Pending
Also Published As
Publication number | Publication date |
---|---|
MX2023011218A (es) | 2023-10-02 |
CA3211172A1 (en) | 2022-10-06 |
WO2022212402A1 (en) | 2022-10-06 |
US20240026348A1 (en) | 2024-01-25 |
KR20230164668A (ko) | 2023-12-04 |
AU2022249289A1 (en) | 2023-08-17 |
EP4314283A1 (en) | 2024-02-07 |
CN117015603A (zh) | 2023-11-07 |
BR112023019945A2 (pt) | 2023-11-14 |
IL307164A (en) | 2023-11-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
AU2018259202B2 (en) | Compositions and methods for improving sample identification in indexed nucleic acid libraries | |
KR20230161979A (ko) | 개선된 라이브러리 제조 방법 | |
US20230407388A1 (en) | Sequencing Templates Comprising Multiple Inserts and Compositions and Methods for Improving Sequencing Throughput | |
US9944924B2 (en) | Polynucleotide modification on solid support | |
EP3094743B1 (en) | Polynucleotide modification on solid support | |
EP3066114A1 (en) | Plurality of transposase adapters for dna manipulations | |
US20230183682A1 (en) | Preparation of RNA and DNA Sequencing Libraries Using Bead-Linked Transposomes | |
US20240271126A1 (en) | Oligo-modified nucleotide analogues for nucleic acid preparation | |
US20240026348A1 (en) | Methods of Preparing Directional Tagmentation Sequencing Libraries Using Transposon-Based Technology with Unique Molecular Identifiers for Error Correction | |
JP2024512917A (ja) | 等温相補的dna及びライブラリ調製の改善された方法 | |
WO2010064040A1 (en) | Method for use in polynucleotide sequencing | |
CN117062910A (zh) | 改进的文库制备方法 | |
JP2025508067A (ja) | ターゲット濃縮 |