CN119301275A - 用于核酸测序的组合物和方法 - Google Patents
用于核酸测序的组合物和方法 Download PDFInfo
- Publication number
- CN119301275A CN119301275A CN202380043475.6A CN202380043475A CN119301275A CN 119301275 A CN119301275 A CN 119301275A CN 202380043475 A CN202380043475 A CN 202380043475A CN 119301275 A CN119301275 A CN 119301275A
- Authority
- CN
- China
- Prior art keywords
- hapten
- type
- moiety
- unlabeled nucleotides
- nucleotide
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 79
- 238000012163 sequencing technique Methods 0.000 title claims abstract description 72
- 239000000203 mixture Substances 0.000 title claims abstract description 51
- 150000007523 nucleic acids Chemical class 0.000 title abstract description 29
- 102000039446 nucleic acids Human genes 0.000 title abstract description 25
- 108020004707 nucleic acids Proteins 0.000 title abstract description 25
- 125000003729 nucleotide group Chemical group 0.000 claims abstract description 306
- 239000002773 nucleotide Substances 0.000 claims abstract description 298
- 239000003153 chemical reaction reagent Substances 0.000 claims abstract description 106
- 230000005284 excitation Effects 0.000 claims abstract description 45
- YBJHBAHKTGYVGT-ZKWXMUAHSA-N (+)-Biotin Chemical group N1C(=O)N[C@@H]2[C@H](CCCCC(=O)O)SC[C@@H]21 YBJHBAHKTGYVGT-ZKWXMUAHSA-N 0.000 claims description 196
- 102000004169 proteins and genes Human genes 0.000 claims description 135
- 108090000623 proteins and genes Proteins 0.000 claims description 135
- 229960002685 biotin Drugs 0.000 claims description 106
- 239000011616 biotin Substances 0.000 claims description 106
- 235000020958 biotin Nutrition 0.000 claims description 99
- ZYGHJZDHTFUPRJ-UHFFFAOYSA-N coumarin Chemical compound C1=CC=C2OC(=O)C=CC2=C1 ZYGHJZDHTFUPRJ-UHFFFAOYSA-N 0.000 claims description 97
- 108091033319 polynucleotide Proteins 0.000 claims description 93
- 102000040430 polynucleotide Human genes 0.000 claims description 93
- 239000002157 polynucleotide Substances 0.000 claims description 93
- 108090001008 Avidin Proteins 0.000 claims description 77
- -1 dinitrophenyl Chemical group 0.000 claims description 62
- 239000002105 nanoparticle Substances 0.000 claims description 55
- 108010090804 Streptavidin Proteins 0.000 claims description 54
- 229960000956 coumarin Drugs 0.000 claims description 53
- 235000001671 coumarin Nutrition 0.000 claims description 49
- 238000005259 measurement Methods 0.000 claims description 37
- 239000007787 solid Substances 0.000 claims description 36
- 125000000623 heterocyclic group Chemical group 0.000 claims description 34
- 238000006243 chemical reaction Methods 0.000 claims description 29
- 229920000642 polymer Polymers 0.000 claims description 27
- 230000000903 blocking effect Effects 0.000 claims description 26
- 108010087904 neutravidin Proteins 0.000 claims description 22
- 239000000243 solution Substances 0.000 claims description 20
- 125000003903 2-propenyl group Chemical group [H]C([*])([H])C([H])=C([H])[H] 0.000 claims description 16
- 230000000694 effects Effects 0.000 claims description 16
- 108091034117 Oligonucleotide Proteins 0.000 claims description 15
- 230000000295 complement effect Effects 0.000 claims description 15
- 125000001313 C5-C10 heteroaryl group Chemical group 0.000 claims description 14
- 238000003776 cleavage reaction Methods 0.000 claims description 14
- 230000007017 scission Effects 0.000 claims description 14
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 claims description 14
- 108700021042 biotin binding protein Proteins 0.000 claims description 13
- 102000043871 biotin binding protein Human genes 0.000 claims description 13
- 238000003384 imaging method Methods 0.000 claims description 12
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 claims description 11
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 claims description 11
- SHIBSTMRCDJXLN-KCZCNTNESA-N digoxigenin Chemical compound C1([C@@H]2[C@@]3([C@@](CC2)(O)[C@H]2[C@@H]([C@@]4(C)CC[C@H](O)C[C@H]4CC2)C[C@H]3O)C)=CC(=O)OC1 SHIBSTMRCDJXLN-KCZCNTNESA-N 0.000 claims description 11
- 239000011159 matrix material Substances 0.000 claims description 10
- 125000001997 phenyl group Chemical group [H]C1=C([H])C([H])=C(*)C([H])=C1[H] 0.000 claims description 9
- 239000000872 buffer Substances 0.000 claims description 8
- 239000004372 Polyvinyl alcohol Substances 0.000 claims description 6
- 239000007864 aqueous solution Substances 0.000 claims description 6
- 229920002451 polyvinyl alcohol Polymers 0.000 claims description 6
- 229920000954 Polyglycolide Polymers 0.000 claims description 5
- 239000004633 polyglycolic acid Substances 0.000 claims description 5
- 238000005406 washing Methods 0.000 claims description 5
- 125000000852 azido group Chemical group *N=[N+]=[N-] 0.000 claims description 4
- SUYVUBYJARFZHO-RRKCRQDMSA-N dATP Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@H]1C[C@H](O)[C@@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O1 SUYVUBYJARFZHO-RRKCRQDMSA-N 0.000 claims description 4
- HAAZLUGHYHWQIW-KVQBGUIXSA-N dGTP Chemical compound C1=NC=2C(=O)NC(N)=NC=2N1[C@H]1C[C@H](O)[C@@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O1 HAAZLUGHYHWQIW-KVQBGUIXSA-N 0.000 claims description 4
- NHVNXKFIZYSCEB-XLPZGREQSA-N dTTP Chemical compound O=C1NC(=O)C(C)=CN1[C@@H]1O[C@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)[C@@H](O)C1 NHVNXKFIZYSCEB-XLPZGREQSA-N 0.000 claims description 4
- 239000002502 liposome Substances 0.000 claims description 4
- 229920002401 polyacrylamide Polymers 0.000 claims description 4
- SHIBSTMRCDJXLN-UHFFFAOYSA-N Digoxigenin Natural products C1CC(C2C(C3(C)CCC(O)CC3CC2)CC2O)(O)C2(C)C1C1=CC(=O)OC1 SHIBSTMRCDJXLN-UHFFFAOYSA-N 0.000 claims description 3
- BWGNESOTFCXPMA-UHFFFAOYSA-N Dihydrogen disulfide Chemical compound SS BWGNESOTFCXPMA-UHFFFAOYSA-N 0.000 claims description 3
- SUYVUBYJARFZHO-UHFFFAOYSA-N dATP Natural products C1=NC=2C(N)=NC=NC=2N1C1CC(O)C(COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O1 SUYVUBYJARFZHO-UHFFFAOYSA-N 0.000 claims description 3
- QONQRTHLHBTMGP-UHFFFAOYSA-N digitoxigenin Natural products CC12CCC(C3(CCC(O)CC3CC3)C)C3C11OC1CC2C1=CC(=O)OC1 QONQRTHLHBTMGP-UHFFFAOYSA-N 0.000 claims description 3
- 238000009396 hybridization Methods 0.000 claims description 3
- 230000001404 mediated effect Effects 0.000 claims description 3
- AHCYMLUZIRLXAA-SHYZEUOFSA-N Deoxyuridine 5'-triphosphate Chemical compound O1[C@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)[C@@H](O)C[C@@H]1N1C(=O)NC(=O)C=C1 AHCYMLUZIRLXAA-SHYZEUOFSA-N 0.000 claims description 2
- 229920006037 cross link polymer Polymers 0.000 claims description 2
- 239000000412 dendrimer Substances 0.000 claims description 2
- 229920000736 dendritic polymer Polymers 0.000 claims description 2
- RGWHQCVHVJXOKC-SHYZEUOFSA-J dCTP(4-) Chemical compound O=C1N=C(N)C=CN1[C@@H]1O[C@H](COP([O-])(=O)OP([O-])(=O)OP([O-])([O-])=O)[C@@H](O)C1 RGWHQCVHVJXOKC-SHYZEUOFSA-J 0.000 claims 1
- 238000010348 incorporation Methods 0.000 abstract description 28
- 230000009977 dual effect Effects 0.000 abstract description 13
- 238000001668 nucleic acid synthesis Methods 0.000 abstract 1
- 230000009870 specific binding Effects 0.000 abstract 1
- 239000000975 dye Substances 0.000 description 159
- 125000005647 linker group Chemical group 0.000 description 81
- KDLHZDBZIXYQEI-UHFFFAOYSA-N palladium Substances [Pd] KDLHZDBZIXYQEI-UHFFFAOYSA-N 0.000 description 43
- 125000003118 aryl group Chemical group 0.000 description 38
- 125000000217 alkyl group Chemical group 0.000 description 36
- QGKMIGUHVLGJBR-UHFFFAOYSA-M (4z)-1-(3-methylbutyl)-4-[[1-(3-methylbutyl)quinolin-1-ium-4-yl]methylidene]quinoline;iodide Chemical compound [I-].C12=CC=CC=C2N(CCC(C)C)C=CC1=CC1=CC=[N+](CCC(C)C)C2=CC=CC=C12 QGKMIGUHVLGJBR-UHFFFAOYSA-M 0.000 description 27
- 230000015572 biosynthetic process Effects 0.000 description 25
- 125000004432 carbon atom Chemical group C* 0.000 description 25
- 125000004452 carbocyclyl group Chemical group 0.000 description 23
- 238000003786 synthesis reaction Methods 0.000 description 23
- YICAEXQYKBMDNH-UHFFFAOYSA-N 3-[bis(3-hydroxypropyl)phosphanyl]propan-1-ol Chemical compound OCCCP(CCCO)CCCO YICAEXQYKBMDNH-UHFFFAOYSA-N 0.000 description 21
- 150000001875 compounds Chemical class 0.000 description 21
- 125000003342 alkenyl group Chemical group 0.000 description 20
- 125000002947 alkylene group Chemical group 0.000 description 20
- LTMHDMANZUZIPE-PUGKRICDSA-N digoxin Chemical compound C1[C@H](O)[C@H](O)[C@@H](C)O[C@H]1O[C@@H]1[C@@H](C)O[C@@H](O[C@@H]2[C@H](O[C@@H](O[C@@H]3C[C@@H]4[C@]([C@@H]5[C@H]([C@]6(CC[C@@H]([C@@]6(C)[C@H](O)C5)C=5COC(=O)C=5)O)CC4)(C)CC3)C[C@@H]2O)C)C[C@@H]1O LTMHDMANZUZIPE-PUGKRICDSA-N 0.000 description 20
- 239000002777 nucleoside Substances 0.000 description 19
- 125000004122 cyclic group Chemical group 0.000 description 18
- 238000002372 labelling Methods 0.000 description 18
- WEVYAHXRMPXWCK-UHFFFAOYSA-N Acetonitrile Chemical compound CC#N WEVYAHXRMPXWCK-UHFFFAOYSA-N 0.000 description 17
- 150000003833 nucleoside derivatives Chemical class 0.000 description 17
- 125000001424 substituent group Chemical group 0.000 description 17
- 239000007850 fluorescent dye Substances 0.000 description 16
- IAZDPXIOMUYVGZ-UHFFFAOYSA-N Dimethylsulphoxide Chemical compound CS(C)=O IAZDPXIOMUYVGZ-UHFFFAOYSA-N 0.000 description 15
- 125000004435 hydrogen atom Chemical group [H]* 0.000 description 15
- 230000003993 interaction Effects 0.000 description 15
- 239000001045 blue dye Substances 0.000 description 14
- 239000001046 green dye Substances 0.000 description 14
- 125000001072 heteroaryl group Chemical group 0.000 description 14
- 238000001514 detection method Methods 0.000 description 13
- JGFZNNIVVJXRND-UHFFFAOYSA-N N,N-Diisopropylethylamine (DIPEA) Chemical compound CCN(C(C)C)C(C)C JGFZNNIVVJXRND-UHFFFAOYSA-N 0.000 description 12
- 125000004737 (C1-C6) haloalkoxy group Chemical group 0.000 description 11
- 229910052799 carbon Inorganic materials 0.000 description 11
- 125000003178 carboxy group Chemical group [H]OC(*)=O 0.000 description 11
- 125000002887 hydroxy group Chemical group [H]O* 0.000 description 11
- ASJSAQIRZKANQN-CRCLSJGQSA-N 2-deoxy-D-ribose Chemical group OC[C@@H](O)[C@@H](O)CC=O ASJSAQIRZKANQN-CRCLSJGQSA-N 0.000 description 10
- 125000000882 C2-C6 alkenyl group Chemical group 0.000 description 10
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 10
- XYFCBTPGUUZFHI-UHFFFAOYSA-N Phosphine Chemical compound P XYFCBTPGUUZFHI-UHFFFAOYSA-N 0.000 description 10
- 125000000304 alkynyl group Chemical group 0.000 description 10
- 238000003491 array Methods 0.000 description 10
- 229910052739 hydrogen Inorganic materials 0.000 description 10
- 239000001257 hydrogen Substances 0.000 description 10
- 239000000523 sample Substances 0.000 description 10
- 239000000758 substrate Substances 0.000 description 10
- 108020004414 DNA Proteins 0.000 description 9
- 101150003085 Pdcl gene Proteins 0.000 description 9
- 125000000753 cycloalkyl group Chemical group 0.000 description 9
- 230000000670 limiting effect Effects 0.000 description 9
- 239000000126 substance Substances 0.000 description 9
- 125000000171 (C1-C6) haloalkyl group Chemical group 0.000 description 8
- KDCGOANMDULRCW-UHFFFAOYSA-N 7H-purine Chemical compound N1=CNC2=NC=NC2=C1 KDCGOANMDULRCW-UHFFFAOYSA-N 0.000 description 8
- 125000003601 C2-C6 alkynyl group Chemical group 0.000 description 8
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 8
- LTMHDMANZUZIPE-AMTYYWEZSA-N Digoxin Natural products O([C@H]1[C@H](C)O[C@H](O[C@@H]2C[C@@H]3[C@@](C)([C@@H]4[C@H]([C@]5(O)[C@](C)([C@H](O)C4)[C@H](C4=CC(=O)OC4)CC5)CC3)CC2)C[C@@H]1O)[C@H]1O[C@H](C)[C@@H](O[C@H]2O[C@@H](C)[C@H](O)[C@@H](O)C2)[C@@H](O)C1 LTMHDMANZUZIPE-AMTYYWEZSA-N 0.000 description 8
- 238000002835 absorbance Methods 0.000 description 8
- 125000003545 alkoxy group Chemical group 0.000 description 8
- 239000011324 bead Substances 0.000 description 8
- 229960005156 digoxin Drugs 0.000 description 8
- LTMHDMANZUZIPE-UHFFFAOYSA-N digoxine Natural products C1C(O)C(O)C(C)OC1OC1C(C)OC(OC2C(OC(OC3CC4C(C5C(C6(CCC(C6(C)C(O)C5)C=5COC(=O)C=5)O)CC4)(C)CC3)CC2O)C)CC1O LTMHDMANZUZIPE-UHFFFAOYSA-N 0.000 description 8
- 125000001475 halogen functional group Chemical group 0.000 description 8
- 125000005842 heteroatom Chemical group 0.000 description 8
- 229910052763 palladium Inorganic materials 0.000 description 8
- 125000002924 primary amino group Chemical group [H]N([H])* 0.000 description 8
- 239000011541 reaction mixture Substances 0.000 description 8
- 235000000346 sugar Nutrition 0.000 description 8
- 229910003244 Na2PdCl4 Inorganic materials 0.000 description 7
- 125000003277 amino group Chemical group 0.000 description 7
- 125000004429 atom Chemical group 0.000 description 7
- JMXMXKRNIYCNRV-UHFFFAOYSA-N bis(hydroxymethyl)phosphanylmethanol Chemical compound OCP(CO)CO JMXMXKRNIYCNRV-UHFFFAOYSA-N 0.000 description 7
- 150000002148 esters Chemical class 0.000 description 7
- 229910052760 oxygen Inorganic materials 0.000 description 7
- 239000000047 product Substances 0.000 description 7
- 239000001226 triphosphate Substances 0.000 description 7
- 235000011178 triphosphate Nutrition 0.000 description 7
- PEHVGBZKEYRQSX-UHFFFAOYSA-N 7-deaza-adenine Chemical compound NC1=NC=NC2=C1C=CN2 PEHVGBZKEYRQSX-UHFFFAOYSA-N 0.000 description 6
- CZPWVGJYEJSRLH-UHFFFAOYSA-N Pyrimidine Chemical compound C1=CN=CN=C1 CZPWVGJYEJSRLH-UHFFFAOYSA-N 0.000 description 6
- VYPSYNLAJGMNEJ-UHFFFAOYSA-N Silicium dioxide Chemical compound O=[Si]=O VYPSYNLAJGMNEJ-UHFFFAOYSA-N 0.000 description 6
- 239000007983 Tris buffer Substances 0.000 description 6
- ISAKRJDGNUQOIC-UHFFFAOYSA-N Uracil Chemical compound O=C1C=CNC(=O)N1 ISAKRJDGNUQOIC-UHFFFAOYSA-N 0.000 description 6
- 239000000460 chlorine Substances 0.000 description 6
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical compound NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 description 6
- UYTPUPDQBNUYGX-UHFFFAOYSA-N guanine Chemical compound O=C1NC(N)=NC2=C1N=CN2 UYTPUPDQBNUYGX-UHFFFAOYSA-N 0.000 description 6
- 239000000017 hydrogel Substances 0.000 description 6
- 125000002467 phosphate group Chemical group [H]OP(=O)(O[H])O[*] 0.000 description 6
- 229910052717 sulfur Inorganic materials 0.000 description 6
- 238000012360 testing method Methods 0.000 description 6
- RWQNBRDOKXIBIV-UHFFFAOYSA-N thymine Chemical compound CC1=CNC(=O)NC1=O RWQNBRDOKXIBIV-UHFFFAOYSA-N 0.000 description 6
- UNXRWKVEANCORM-UHFFFAOYSA-N triphosphoric acid Chemical compound OP(O)(=O)OP(O)(=O)OP(O)(O)=O UNXRWKVEANCORM-UHFFFAOYSA-N 0.000 description 6
- PYMYPHUHKUWMLA-LMVFSUKVSA-N Ribose Natural products OC[C@@H](O)[C@@H](O)[C@@H](O)C=O PYMYPHUHKUWMLA-LMVFSUKVSA-N 0.000 description 5
- HMFHBZSHGGEWLO-UHFFFAOYSA-N alpha-D-Furanose-Ribose Natural products OCC1OC(O)C(O)C1O HMFHBZSHGGEWLO-UHFFFAOYSA-N 0.000 description 5
- 125000003710 aryl alkyl group Chemical group 0.000 description 5
- 239000003054 catalyst Substances 0.000 description 5
- 125000000524 functional group Chemical group 0.000 description 5
- 239000003446 ligand Substances 0.000 description 5
- 229910000073 phosphorus hydride Inorganic materials 0.000 description 5
- 229910002093 potassium tetrachloropalladate(II) Inorganic materials 0.000 description 5
- 230000008569 process Effects 0.000 description 5
- 150000003839 salts Chemical group 0.000 description 5
- LENZDBCJOHFCAS-UHFFFAOYSA-N tris Chemical compound OCC(N)(CO)CO LENZDBCJOHFCAS-UHFFFAOYSA-N 0.000 description 5
- HZAXFHJVJLSVMW-UHFFFAOYSA-N 2-Aminoethan-1-ol Chemical compound NCCO HZAXFHJVJLSVMW-UHFFFAOYSA-N 0.000 description 4
- RJICLMDXEDUMAK-UHFFFAOYSA-N 2-amino-2-ethylbutan-1-ol Chemical compound CCC(N)(CC)CO RJICLMDXEDUMAK-UHFFFAOYSA-N 0.000 description 4
- FBTSQILOGYXGMD-LURJTMIESA-N 3-nitro-L-tyrosine Chemical group OC(=O)[C@@H](N)CC1=CC=C(O)C([N+]([O-])=O)=C1 FBTSQILOGYXGMD-LURJTMIESA-N 0.000 description 4
- 101001120790 Caenorhabditis elegans UDP-N-acetylglucosamine-peptide N-acetylglucosaminyltransferase Proteins 0.000 description 4
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 4
- NQRYJNQNLNOLGT-UHFFFAOYSA-N Piperidine Chemical compound C1CCNCC1 NQRYJNQNLNOLGT-UHFFFAOYSA-N 0.000 description 4
- 230000003321 amplification Effects 0.000 description 4
- 229910052801 chlorine Inorganic materials 0.000 description 4
- 229940125782 compound 2 Drugs 0.000 description 4
- 239000001177 diphosphate Substances 0.000 description 4
- XPPKVPWEQAFLFU-UHFFFAOYSA-J diphosphate(4-) Chemical compound [O-]P([O-])(=O)OP([O-])([O-])=O XPPKVPWEQAFLFU-UHFFFAOYSA-J 0.000 description 4
- 235000011180 diphosphates Nutrition 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 4
- 230000007717 exclusion Effects 0.000 description 4
- 229910052736 halogen Inorganic materials 0.000 description 4
- 238000011065 in-situ storage Methods 0.000 description 4
- 125000000325 methylidene group Chemical group [H]C([H])=* 0.000 description 4
- 150000004712 monophosphates Chemical class 0.000 description 4
- 229910052757 nitrogen Inorganic materials 0.000 description 4
- 238000003199 nucleic acid amplification method Methods 0.000 description 4
- 238000006116 polymerization reaction Methods 0.000 description 4
- 239000008057 potassium phosphate buffer Substances 0.000 description 4
- 239000000725 suspension Substances 0.000 description 4
- LOSIULRWFAEMFL-UHFFFAOYSA-N 7-deazaguanine Chemical compound O=C1NC(N)=NC2=C1CC=N2 LOSIULRWFAEMFL-UHFFFAOYSA-N 0.000 description 3
- GFFGJBXGBJISGV-UHFFFAOYSA-N Adenine Chemical compound NC1=NC=NC2=C1N=CN2 GFFGJBXGBJISGV-UHFFFAOYSA-N 0.000 description 3
- 229930024421 Adenine Natural products 0.000 description 3
- UHOVQNZJYSORNB-UHFFFAOYSA-N Benzene Chemical compound C1=CC=CC=C1 UHOVQNZJYSORNB-UHFFFAOYSA-N 0.000 description 3
- HMFHBZSHGGEWLO-SOOFDHNKSA-N D-ribofuranose Chemical compound OC[C@H]1OC(O)[C@H](O)[C@@H]1O HMFHBZSHGGEWLO-SOOFDHNKSA-N 0.000 description 3
- 229910019142 PO4 Inorganic materials 0.000 description 3
- RWRDLPDLKQPQOW-UHFFFAOYSA-N Pyrrolidine Chemical compound C1CCNC1 RWRDLPDLKQPQOW-UHFFFAOYSA-N 0.000 description 3
- HEMHJVSKTPXQMS-UHFFFAOYSA-M Sodium hydroxide Chemical compound [OH-].[Na+] HEMHJVSKTPXQMS-UHFFFAOYSA-M 0.000 description 3
- PZBFGYYEXUXCOF-UHFFFAOYSA-N TCEP Chemical compound OC(=O)CCP(CCC(O)=O)CCC(O)=O PZBFGYYEXUXCOF-UHFFFAOYSA-N 0.000 description 3
- 229960000643 adenine Drugs 0.000 description 3
- 150000001348 alkyl chlorides Chemical class 0.000 description 3
- QVGXLLKOCUKJST-UHFFFAOYSA-N atomic oxygen Chemical compound [O] QVGXLLKOCUKJST-UHFFFAOYSA-N 0.000 description 3
- 230000004888 barrier function Effects 0.000 description 3
- 150000001721 carbon Chemical group 0.000 description 3
- 150000004775 coumarins Chemical class 0.000 description 3
- 125000001995 cyclobutyl group Chemical group [H]C1([H])C([H])([H])C([H])(*)C1([H])[H] 0.000 description 3
- 125000001559 cyclopropyl group Chemical group [H]C1([H])C([H])([H])C1([H])* 0.000 description 3
- 229940104302 cytosine Drugs 0.000 description 3
- RGWHQCVHVJXOKC-SHYZEUOFSA-N dCTP Chemical compound O=C1N=C(N)C=CN1[C@@H]1O[C@H](CO[P@](O)(=O)O[P@](O)(=O)OP(O)(O)=O)[C@@H](O)C1 RGWHQCVHVJXOKC-SHYZEUOFSA-N 0.000 description 3
- 238000010511 deprotection reaction Methods 0.000 description 3
- 239000005546 dideoxynucleotide Substances 0.000 description 3
- 238000006073 displacement reaction Methods 0.000 description 3
- 230000009881 electrostatic interaction Effects 0.000 description 3
- 150000002367 halogens Chemical class 0.000 description 3
- 150000002430 hydrocarbons Chemical group 0.000 description 3
- 230000007062 hydrolysis Effects 0.000 description 3
- 238000006460 hydrolysis reaction Methods 0.000 description 3
- 125000002496 methyl group Chemical group [H]C([H])([H])* 0.000 description 3
- 238000002156 mixing Methods 0.000 description 3
- 125000003835 nucleoside group Chemical group 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 239000001301 oxygen Substances 0.000 description 3
- 125000004430 oxygen atom Chemical group O* 0.000 description 3
- 150000002972 pentoses Chemical class 0.000 description 3
- 235000021317 phosphate Nutrition 0.000 description 3
- 150000003003 phosphines Chemical class 0.000 description 3
- 239000011148 porous material Substances 0.000 description 3
- 238000002360 preparation method Methods 0.000 description 3
- 238000002953 preparative HPLC Methods 0.000 description 3
- 125000000548 ribosyl group Chemical group C1([C@H](O)[C@H](O)[C@H](O1)CO)* 0.000 description 3
- 239000000377 silicon dioxide Substances 0.000 description 3
- SNOOUWRIMMFWNE-UHFFFAOYSA-M sodium;6-[(3,4,5-trimethoxybenzoyl)amino]hexanoate Chemical compound [Na+].COC1=CC(C(=O)NCCCCCC([O-])=O)=CC(OC)=C1OC SNOOUWRIMMFWNE-UHFFFAOYSA-M 0.000 description 3
- 239000002904 solvent Substances 0.000 description 3
- 125000006850 spacer group Chemical group 0.000 description 3
- 241000894007 species Species 0.000 description 3
- 125000000475 sulfinyl group Chemical group [*:2]S([*:1])=O 0.000 description 3
- 125000000472 sulfonyl group Chemical group *S(*)(=O)=O 0.000 description 3
- 229940113082 thymine Drugs 0.000 description 3
- 229910052723 transition metal Inorganic materials 0.000 description 3
- 150000003624 transition metals Chemical class 0.000 description 3
- 229940035893 uracil Drugs 0.000 description 3
- 125000003161 (C1-C6) alkylene group Chemical group 0.000 description 2
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 2
- LBUJPTNKIBCYBY-UHFFFAOYSA-N 1,2,3,4-tetrahydroquinoline Chemical compound C1=CC=C2CCCNC2=C1 LBUJPTNKIBCYBY-UHFFFAOYSA-N 0.000 description 2
- 238000005160 1H NMR spectroscopy Methods 0.000 description 2
- KZTWONRVIPPDKH-UHFFFAOYSA-N 2-(piperidin-1-yl)ethanol Chemical compound OCCN1CCCCC1 KZTWONRVIPPDKH-UHFFFAOYSA-N 0.000 description 2
- FZWGECJQACGGTI-UHFFFAOYSA-N 2-amino-7-methyl-1,7-dihydro-6H-purin-6-one Chemical compound NC1=NC(O)=C2N(C)C=NC2=N1 FZWGECJQACGGTI-UHFFFAOYSA-N 0.000 description 2
- OIVLITBTBDPEFK-UHFFFAOYSA-N 5,6-dihydrouracil Chemical compound O=C1CCNC(=O)N1 OIVLITBTBDPEFK-UHFFFAOYSA-N 0.000 description 2
- LRFVTYWOQMYALW-UHFFFAOYSA-N 9H-xanthine Chemical compound O=C1NC(=O)NC2=C1NC=N2 LRFVTYWOQMYALW-UHFFFAOYSA-N 0.000 description 2
- QTBSBXVTEAMEQO-UHFFFAOYSA-N Acetic acid Chemical compound CC(O)=O QTBSBXVTEAMEQO-UHFFFAOYSA-N 0.000 description 2
- OSDWBNJEKMUWAV-UHFFFAOYSA-N Allyl chloride Chemical compound ClCC=C OSDWBNJEKMUWAV-UHFFFAOYSA-N 0.000 description 2
- CIWBSHSKHKDKBQ-JLAZNSOCSA-N Ascorbic acid Chemical compound OC[C@H](O)[C@H]1OC(=O)C(O)=C1O CIWBSHSKHKDKBQ-JLAZNSOCSA-N 0.000 description 2
- IJGRMHOSHXDMSA-UHFFFAOYSA-N Atomic nitrogen Chemical compound N#N IJGRMHOSHXDMSA-UHFFFAOYSA-N 0.000 description 2
- 102000014914 Carrier Proteins Human genes 0.000 description 2
- ZAMOUSCENKQFHK-UHFFFAOYSA-N Chlorine atom Chemical compound [Cl] ZAMOUSCENKQFHK-UHFFFAOYSA-N 0.000 description 2
- PXGOKWXKJXAPGV-UHFFFAOYSA-N Fluorine Chemical compound FF PXGOKWXKJXAPGV-UHFFFAOYSA-N 0.000 description 2
- 239000004471 Glycine Substances 0.000 description 2
- 101001132698 Homo sapiens Retinoic acid receptor beta Proteins 0.000 description 2
- YNAVUWVOSKDBBP-UHFFFAOYSA-N Morpholine Chemical compound C1COCCN1 YNAVUWVOSKDBBP-UHFFFAOYSA-N 0.000 description 2
- KWYHDKDOAIKMQN-UHFFFAOYSA-N N,N,N',N'-tetramethylethylenediamine Chemical compound CN(C)CCN(C)C KWYHDKDOAIKMQN-UHFFFAOYSA-N 0.000 description 2
- WKDDICBTQWGDFL-UHFFFAOYSA-N O.O.O.O.O.O.O.O.O.[Na].[Na].[Na].[Na].[Na].[Na].[Na].[Na].[Na] Chemical compound O.O.O.O.O.O.O.O.O.[Na].[Na].[Na].[Na].[Na].[Na].[Na].[Na].[Na] WKDDICBTQWGDFL-UHFFFAOYSA-N 0.000 description 2
- 229910002666 PdCl2 Inorganic materials 0.000 description 2
- GLUUGHFHXGJENI-UHFFFAOYSA-N Piperazine Chemical compound C1CNCCN1 GLUUGHFHXGJENI-UHFFFAOYSA-N 0.000 description 2
- JUJWROOIHBZHMG-UHFFFAOYSA-N Pyridine Chemical compound C1=CC=NC=C1 JUJWROOIHBZHMG-UHFFFAOYSA-N 0.000 description 2
- 102100033909 Retinoic acid receptor beta Human genes 0.000 description 2
- 125000005631 S-sulfonamido group Chemical group 0.000 description 2
- CDBYLPFSWZWCQE-UHFFFAOYSA-L Sodium Carbonate Chemical compound [Na+].[Na+].[O-]C([O-])=O CDBYLPFSWZWCQE-UHFFFAOYSA-L 0.000 description 2
- NINIDFKCEFEMDL-UHFFFAOYSA-N Sulfur Chemical compound [S] NINIDFKCEFEMDL-UHFFFAOYSA-N 0.000 description 2
- 238000005411 Van der Waals force Methods 0.000 description 2
- 108010046516 Wheat Germ Agglutinins Proteins 0.000 description 2
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 2
- 238000011481 absorbance measurement Methods 0.000 description 2
- 150000001413 amino acids Chemical class 0.000 description 2
- 125000004104 aryloxy group Chemical group 0.000 description 2
- 150000001540 azides Chemical class 0.000 description 2
- 229940077388 benzenesulfonate Drugs 0.000 description 2
- SRSXLGNVWSONIS-UHFFFAOYSA-M benzenesulfonate Chemical compound [O-]S(=O)(=O)C1=CC=CC=C1 SRSXLGNVWSONIS-UHFFFAOYSA-M 0.000 description 2
- 125000001797 benzyl group Chemical group [H]C1=C([H])C([H])=C(C([H])=C1[H])C([H])([H])* 0.000 description 2
- 108091008324 binding proteins Proteins 0.000 description 2
- 230000008033 biological extinction Effects 0.000 description 2
- RYYVLZVUVIJVGH-UHFFFAOYSA-N caffeine Chemical compound CN1C(=O)N(C)C(=O)C2=C1N=CN2C RYYVLZVUVIJVGH-UHFFFAOYSA-N 0.000 description 2
- 239000003638 chemical reducing agent Substances 0.000 description 2
- 239000011248 coating agent Substances 0.000 description 2
- 238000000576 coating method Methods 0.000 description 2
- 229940125904 compound 1 Drugs 0.000 description 2
- 125000004093 cyano group Chemical group *C#N 0.000 description 2
- 125000000113 cyclohexyl group Chemical group [H]C1([H])C([H])([H])C([H])([H])C([H])(*)C([H])([H])C1([H])[H] 0.000 description 2
- 125000001511 cyclopentyl group Chemical group [H]C1([H])C([H])([H])C([H])([H])C([H])(*)C1([H])[H] 0.000 description 2
- 230000007423 decrease Effects 0.000 description 2
- 239000000539 dimer Substances 0.000 description 2
- 239000012972 dimethylethanolamine Substances 0.000 description 2
- 125000001495 ethyl group Chemical group [H]C([H])([H])C([H])([H])* 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- 239000011737 fluorine Substances 0.000 description 2
- 229910052731 fluorine Inorganic materials 0.000 description 2
- 125000002541 furyl group Chemical group 0.000 description 2
- 239000011521 glass Substances 0.000 description 2
- 125000004438 haloalkoxy group Chemical group 0.000 description 2
- 125000001188 haloalkyl group Chemical group 0.000 description 2
- 238000010438 heat treatment Methods 0.000 description 2
- 125000004475 heteroaralkyl group Chemical group 0.000 description 2
- 230000002209 hydrophobic effect Effects 0.000 description 2
- FDGQSTZJBFJUBT-UHFFFAOYSA-N hypoxanthine Chemical compound O=C1NC=NC2=C1NC=N2 FDGQSTZJBFJUBT-UHFFFAOYSA-N 0.000 description 2
- 230000001965 increasing effect Effects 0.000 description 2
- 150000002500 ions Chemical class 0.000 description 2
- 125000000959 isobutyl group Chemical group [H]C([H])([H])C([H])(C([H])([H])[H])C([H])([H])* 0.000 description 2
- DRAVOWXCEBXPTN-UHFFFAOYSA-N isoguanine Chemical compound NC1=NC(=O)NC2=C1NC=N2 DRAVOWXCEBXPTN-UHFFFAOYSA-N 0.000 description 2
- 125000001449 isopropyl group Chemical group [H]C([H])([H])C([H])(*)C([H])([H])[H] 0.000 description 2
- 239000007788 liquid Substances 0.000 description 2
- 239000004973 liquid crystal related substance Chemical group 0.000 description 2
- 125000003588 lysine group Chemical group [H]N([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])(N([H])[H])C(*)=O 0.000 description 2
- 239000011859 microparticle Substances 0.000 description 2
- 239000000178 monomer Substances 0.000 description 2
- DIHKMUNUGQVFES-UHFFFAOYSA-N n,n,n',n'-tetraethylethane-1,2-diamine Chemical compound CCN(CC)CCN(CC)CC DIHKMUNUGQVFES-UHFFFAOYSA-N 0.000 description 2
- 125000001326 naphthylalkyl group Chemical group 0.000 description 2
- 230000000269 nucleophilic effect Effects 0.000 description 2
- WXHIJDCHNDBCNY-UHFFFAOYSA-N palladium dihydride Chemical compound [PdH2] WXHIJDCHNDBCNY-UHFFFAOYSA-N 0.000 description 2
- PIBWKRNGBLPSSY-UHFFFAOYSA-L palladium(II) chloride Chemical compound Cl[Pd]Cl PIBWKRNGBLPSSY-UHFFFAOYSA-L 0.000 description 2
- JKDRQYIYVJVOPF-FDGPNNRMSA-L palladium(ii) acetylacetonate Chemical compound [Pd+2].C\C([O-])=C\C(C)=O.C\C([O-])=C\C(C)=O JKDRQYIYVJVOPF-FDGPNNRMSA-L 0.000 description 2
- NBIIXXVUZAFLBC-UHFFFAOYSA-K phosphate Chemical compound [O-]P([O-])([O-])=O NBIIXXVUZAFLBC-UHFFFAOYSA-K 0.000 description 2
- 239000010452 phosphate Substances 0.000 description 2
- 150000008300 phosphoramidites Chemical class 0.000 description 2
- 150000003013 phosphoric acid derivatives Chemical class 0.000 description 2
- 239000002244 precipitate Substances 0.000 description 2
- 150000003141 primary amines Chemical class 0.000 description 2
- 125000001436 propyl group Chemical group [H]C([*])([H])C([H])([H])C([H])([H])[H] 0.000 description 2
- 238000000746 purification Methods 0.000 description 2
- 150000003212 purines Chemical class 0.000 description 2
- 239000002096 quantum dot Substances 0.000 description 2
- 238000010992 reflux Methods 0.000 description 2
- 230000010076 replication Effects 0.000 description 2
- 230000002441 reversible effect Effects 0.000 description 2
- 125000006413 ring segment Chemical group 0.000 description 2
- QAOWNCQODCNURD-UHFFFAOYSA-L sulfate group Chemical group S(=O)(=O)([O-])[O-] QAOWNCQODCNURD-UHFFFAOYSA-L 0.000 description 2
- 239000011593 sulfur Substances 0.000 description 2
- 239000004094 surface-active agent Substances 0.000 description 2
- 125000000999 tert-butyl group Chemical group [H]C([H])([H])C(*)(C([H])([H])[H])C([H])([H])[H] 0.000 description 2
- 150000003512 tertiary amines Chemical class 0.000 description 2
- YAPQBXQYLJRXSA-UHFFFAOYSA-N theobromine Chemical compound CN1C(=O)NC(=O)C2=C1N=CN2C YAPQBXQYLJRXSA-UHFFFAOYSA-N 0.000 description 2
- LWIHDJKSTIGBAC-UHFFFAOYSA-K tripotassium phosphate Chemical compound [K+].[K+].[K+].[O-]P([O-])([O-])=O LWIHDJKSTIGBAC-UHFFFAOYSA-K 0.000 description 2
- 125000000391 vinyl group Chemical group [H]C([*])=C([H])[H] 0.000 description 2
- LZXHHNKULPHARO-UHFFFAOYSA-M (3,4-dichlorophenyl)methyl-triphenylphosphanium;chloride Chemical compound [Cl-].C1=C(Cl)C(Cl)=CC=C1C[P+](C=1C=CC=CC=1)(C=1C=CC=CC=1)C1=CC=CC=C1 LZXHHNKULPHARO-UHFFFAOYSA-M 0.000 description 1
- 125000006727 (C1-C6) alkenyl group Chemical group 0.000 description 1
- 125000006700 (C1-C6) alkylthio group Chemical group 0.000 description 1
- 125000006728 (C1-C6) alkynyl group Chemical group 0.000 description 1
- 125000006716 (C1-C6) heteroalkyl group Chemical group 0.000 description 1
- 125000006729 (C2-C5) alkenyl group Chemical group 0.000 description 1
- 125000006730 (C2-C5) alkynyl group Chemical group 0.000 description 1
- 125000006714 (C3-C10) heterocyclyl group Chemical group 0.000 description 1
- 125000006552 (C3-C8) cycloalkyl group Chemical group 0.000 description 1
- FXXRPTKTLVHPAR-UHFFFAOYSA-N 1,3,5-triaza-7-phosphaadamantane Chemical compound C1N(C2)CN3CN1CP2C3 FXXRPTKTLVHPAR-UHFFFAOYSA-N 0.000 description 1
- JPRPJUMQRZTTED-UHFFFAOYSA-N 1,3-dioxolanyl Chemical group [CH]1OCCO1 JPRPJUMQRZTTED-UHFFFAOYSA-N 0.000 description 1
- ILWJAOPQHOZXAN-UHFFFAOYSA-N 1,3-dithianyl Chemical group [CH]1SCCCS1 ILWJAOPQHOZXAN-UHFFFAOYSA-N 0.000 description 1
- KFHQOZXAFUKFNB-UHFFFAOYSA-N 1,3-oxathiolanyl Chemical group [CH]1OCCS1 KFHQOZXAFUKFNB-UHFFFAOYSA-N 0.000 description 1
- IZXIZTKNFFYFOF-UHFFFAOYSA-N 2-Oxazolidone Chemical compound O=C1NCCO1 IZXIZTKNFFYFOF-UHFFFAOYSA-N 0.000 description 1
- IMSODMZESSGVBE-UHFFFAOYSA-N 2-Oxazoline Chemical compound C1CN=CO1 IMSODMZESSGVBE-UHFFFAOYSA-N 0.000 description 1
- SGPUHRSBWMQRAN-UHFFFAOYSA-N 2-[bis(1-carboxyethyl)phosphanyl]propanoic acid Chemical compound OC(=O)C(C)P(C(C)C(O)=O)C(C)C(O)=O SGPUHRSBWMQRAN-UHFFFAOYSA-N 0.000 description 1
- PZIJUXHDLWNNRW-UHFFFAOYSA-N 2-[bis(2-hydroxyethyl)phosphanyl]ethanol Chemical compound OCCP(CCO)CCO PZIJUXHDLWNNRW-UHFFFAOYSA-N 0.000 description 1
- 125000002941 2-furyl group Chemical group O1C([*])=C([H])C([H])=C1[H] 0.000 description 1
- 125000000094 2-phenylethyl group Chemical group [H]C1=C([H])C([H])=C(C([H])=C1[H])C([H])([H])C([H])([H])* 0.000 description 1
- PTHDBHDZSMGHKF-UHFFFAOYSA-N 2-piperidin-2-ylethanol Chemical compound OCCC1CCCCN1 PTHDBHDZSMGHKF-UHFFFAOYSA-N 0.000 description 1
- SNKZJIOFVMKAOJ-UHFFFAOYSA-N 3-Amino-1-propanesulfonic acid Natural products NCCCS(O)(=O)=O SNKZJIOFVMKAOJ-UHFFFAOYSA-N 0.000 description 1
- 125000006201 3-phenylpropyl group Chemical group [H]C1=C([H])C([H])=C(C([H])=C1[H])C([H])([H])C([H])([H])C([H])([H])* 0.000 description 1
- LEEPGDCCHVRYHK-UHFFFAOYSA-N 4-bromo-1-methylpyrazole-3-carboxylic acid Chemical compound CN1C=C(Br)C(C(O)=O)=N1 LEEPGDCCHVRYHK-UHFFFAOYSA-N 0.000 description 1
- GBJJCODOZGPTBC-UHFFFAOYSA-N 4-fluoro-2-hydroxybenzaldehyde Chemical compound OC1=CC(F)=CC=C1C=O GBJJCODOZGPTBC-UHFFFAOYSA-N 0.000 description 1
- 125000005986 4-piperidonyl group Chemical group 0.000 description 1
- BUVSBIKCBLHNCG-UFLZEWODSA-N 5-[(3as,4s,6ar)-2-oxo-1,3,3a,4,6,6a-hexahydrothieno[3,4-d]imidazol-4-yl]pentanoic acid;azide Chemical compound [N-]=[N+]=[N-].N1C(=O)N[C@@H]2[C@H](CCCCC(=O)O)SC[C@@H]21 BUVSBIKCBLHNCG-UFLZEWODSA-N 0.000 description 1
- LRSASMSXMSNRBT-UHFFFAOYSA-N 5-methylcytosine Chemical compound CC1=CNC(=O)N=C1N LRSASMSXMSNRBT-UHFFFAOYSA-N 0.000 description 1
- 108050001427 Avidin/streptavidin Proteins 0.000 description 1
- BWKDAAFSXYPQOS-UHFFFAOYSA-N Benzaldehyde glyceryl acetal Chemical compound O1CC(O)COC1C1=CC=CC=C1 BWKDAAFSXYPQOS-UHFFFAOYSA-N 0.000 description 1
- BTBUEUYNUDRHOZ-UHFFFAOYSA-N Borate Chemical compound [O-]B([O-])[O-] BTBUEUYNUDRHOZ-UHFFFAOYSA-N 0.000 description 1
- WKBOTKDWSSQWDR-UHFFFAOYSA-N Bromine atom Chemical compound [Br] WKBOTKDWSSQWDR-UHFFFAOYSA-N 0.000 description 1
- BVKZGUZCCUSVTD-UHFFFAOYSA-L Carbonate Chemical compound [O-]C([O-])=O BVKZGUZCCUSVTD-UHFFFAOYSA-L 0.000 description 1
- 241000694440 Colpidium aqueous Species 0.000 description 1
- XFXPMWWXUTWYJX-UHFFFAOYSA-N Cyanide Chemical compound N#[C-] XFXPMWWXUTWYJX-UHFFFAOYSA-N 0.000 description 1
- 238000001712 DNA sequencing Methods 0.000 description 1
- 102000004190 Enzymes Human genes 0.000 description 1
- 108090000790 Enzymes Proteins 0.000 description 1
- 239000004593 Epoxy Substances 0.000 description 1
- JNCMHMUGTWEVOZ-UHFFFAOYSA-N F[CH]F Chemical compound F[CH]F JNCMHMUGTWEVOZ-UHFFFAOYSA-N 0.000 description 1
- 108010081348 HRT1 protein Hairy Proteins 0.000 description 1
- 102100021881 Hairy/enhancer-of-split related with YRPW motif protein 1 Human genes 0.000 description 1
- 101001121408 Homo sapiens L-amino-acid oxidase Proteins 0.000 description 1
- UGQMRVRMYYASKQ-UHFFFAOYSA-N Hypoxanthine nucleoside Natural products OC1C(O)C(CO)OC1N1C(NC=NC2=O)=C2N=C1 UGQMRVRMYYASKQ-UHFFFAOYSA-N 0.000 description 1
- LPHGQDQBBGAPDZ-UHFFFAOYSA-N Isocaffeine Natural products CN1C(=O)N(C)C(=O)C2=C1N(C)C=N2 LPHGQDQBBGAPDZ-UHFFFAOYSA-N 0.000 description 1
- 102100026388 L-amino-acid oxidase Human genes 0.000 description 1
- 108090001090 Lectins Proteins 0.000 description 1
- 102000004856 Lectins Human genes 0.000 description 1
- 102000003960 Ligases Human genes 0.000 description 1
- 108090000364 Ligases Proteins 0.000 description 1
- 229910021547 Lithium tetrachloropalladate(II) hydrate Inorganic materials 0.000 description 1
- 241000872931 Myoporum sandwicense Species 0.000 description 1
- OVRNDRQMDRJTHS-FMDGEEDCSA-N N-acetyl-beta-D-glucosamine Chemical compound CC(=O)N[C@H]1[C@H](O)O[C@H](CO)[C@@H](O)[C@@H]1O OVRNDRQMDRJTHS-FMDGEEDCSA-N 0.000 description 1
- UEEJHVSXFDXPFK-UHFFFAOYSA-N N-dimethylaminoethanol Chemical compound CN(C)CCO UEEJHVSXFDXPFK-UHFFFAOYSA-N 0.000 description 1
- 108091028043 Nucleic acid sequence Proteins 0.000 description 1
- OAICVXFJPJFONN-UHFFFAOYSA-N Phosphorus Chemical compound [P] OAICVXFJPJFONN-UHFFFAOYSA-N 0.000 description 1
- 108091028664 Ribonucleotide Proteins 0.000 description 1
- 229910006069 SO3H Inorganic materials 0.000 description 1
- ZMZDMBWJUHKJPS-UHFFFAOYSA-M Thiocyanate anion Chemical compound [S-]C#N ZMZDMBWJUHKJPS-UHFFFAOYSA-M 0.000 description 1
- LEHOTFFKMJEONL-UHFFFAOYSA-N Uric Acid Chemical compound N1C(=O)NC(=O)C2=C1NC(=O)N2 LEHOTFFKMJEONL-UHFFFAOYSA-N 0.000 description 1
- TVWHNULVHGKJHS-UHFFFAOYSA-N Uric acid Natural products N1C(=O)NC(=O)C2NC(=O)NC21 TVWHNULVHGKJHS-UHFFFAOYSA-N 0.000 description 1
- 230000005856 abnormality Effects 0.000 description 1
- 238000010521 absorption reaction Methods 0.000 description 1
- DHKHKXVYLBGOIT-UHFFFAOYSA-N acetaldehyde Diethyl Acetal Natural products CCOC(C)OCC DHKHKXVYLBGOIT-UHFFFAOYSA-N 0.000 description 1
- 150000001241 acetals Chemical class 0.000 description 1
- 239000002253 acid Substances 0.000 description 1
- 125000000641 acridinyl group Chemical group C1(=CC=CC2=NC3=CC=CC=C3C=C12)* 0.000 description 1
- 125000002252 acyl group Chemical group 0.000 description 1
- 125000005073 adamantyl group Chemical group C12(CC3CC(CC(C1)C3)C2)* 0.000 description 1
- 150000001336 alkenes Chemical class 0.000 description 1
- 125000004450 alkenylene group Chemical group 0.000 description 1
- 125000004183 alkoxy alkyl group Chemical group 0.000 description 1
- 125000003282 alkyl amino group Chemical group 0.000 description 1
- 125000000746 allylic group Chemical group 0.000 description 1
- HSFWRNGVRCDJHI-UHFFFAOYSA-N alpha-acetylene Natural products C#C HSFWRNGVRCDJHI-UHFFFAOYSA-N 0.000 description 1
- 150000001412 amines Chemical class 0.000 description 1
- 125000006620 amino-(C1-C6) alkyl group Chemical group 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000000137 annealing Methods 0.000 description 1
- 125000002178 anthracenyl group Chemical group C1(=CC=CC2=CC3=CC=CC=C3C=C12)* 0.000 description 1
- 125000006615 aromatic heterocyclic group Chemical group 0.000 description 1
- 125000005110 aryl thio group Chemical group 0.000 description 1
- 235000010323 ascorbic acid Nutrition 0.000 description 1
- 239000011668 ascorbic acid Substances 0.000 description 1
- 229960005070 ascorbic acid Drugs 0.000 description 1
- 125000002785 azepinyl group Chemical group 0.000 description 1
- HONIICLYMWZJFZ-UHFFFAOYSA-N azetidine Chemical compound C1CNC1 HONIICLYMWZJFZ-UHFFFAOYSA-N 0.000 description 1
- 125000003828 azulenyl group Chemical group 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 125000003785 benzimidazolyl group Chemical group N1=C(NC2=C1C=CC=C2)* 0.000 description 1
- 125000001164 benzothiazolyl group Chemical group S1C(=NC2=C1C=CC=C2)* 0.000 description 1
- 125000004196 benzothienyl group Chemical group S1C(=CC2=C1C=CC=C2)* 0.000 description 1
- 125000004541 benzoxazolyl group Chemical group O1C(=NC2=C1C=CC=C2)* 0.000 description 1
- 150000001615 biotins Chemical group 0.000 description 1
- 229910021538 borax Inorganic materials 0.000 description 1
- 150000001642 boronic acid derivatives Chemical class 0.000 description 1
- GDTBXPJZTBHREO-UHFFFAOYSA-N bromine Substances BrBr GDTBXPJZTBHREO-UHFFFAOYSA-N 0.000 description 1
- 229910052794 bromium Inorganic materials 0.000 description 1
- 125000004369 butenyl group Chemical group C(=CCC)* 0.000 description 1
- 125000000484 butyl group Chemical group [H]C([*])([H])C([H])([H])C([H])([H])C([H])([H])[H] 0.000 description 1
- 229960001948 caffeine Drugs 0.000 description 1
- VJEONQKOZGKCAK-UHFFFAOYSA-N caffeine Natural products CN1C(=O)N(C)C(=O)C2=C1C=CN2C VJEONQKOZGKCAK-UHFFFAOYSA-N 0.000 description 1
- 125000000609 carbazolyl group Chemical group C1(=CC=CC=2C3=CC=CC=C3NC12)* 0.000 description 1
- 150000004649 carbonic acid derivatives Chemical class 0.000 description 1
- 239000000969 carrier Substances 0.000 description 1
- 238000006555 catalytic reaction Methods 0.000 description 1
- 238000002144 chemical decomposition reaction Methods 0.000 description 1
- 239000003795 chemical substances by application Substances 0.000 description 1
- 125000004218 chloromethyl group Chemical group [H]C([H])(Cl)* 0.000 description 1
- 125000000259 cinnolinyl group Chemical group N1=NC(=CC2=CC=CC=C12)* 0.000 description 1
- 238000004440 column chromatography Methods 0.000 description 1
- 229940126214 compound 3 Drugs 0.000 description 1
- 238000012937 correction Methods 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 238000005336 cracking Methods 0.000 description 1
- XLJMAIOERFSOGZ-UHFFFAOYSA-M cyanate Chemical compound [O-]C#N XLJMAIOERFSOGZ-UHFFFAOYSA-M 0.000 description 1
- 125000000392 cycloalkenyl group Chemical group 0.000 description 1
- 125000004850 cyclobutylmethyl group Chemical group C1(CCC1)C* 0.000 description 1
- 125000000596 cyclohexenyl group Chemical group C1(=CCCCC1)* 0.000 description 1
- 125000004186 cyclopropylmethyl group Chemical group [H]C([H])(*)C1([H])C([H])([H])C1([H])[H] 0.000 description 1
- 230000009089 cytolysis Effects 0.000 description 1
- 229960002887 deanol Drugs 0.000 description 1
- 230000036425 denaturation Effects 0.000 description 1
- 238000004925 denaturation Methods 0.000 description 1
- 239000005549 deoxyribonucleoside Substances 0.000 description 1
- 238000000502 dialysis Methods 0.000 description 1
- 125000001028 difluoromethyl group Chemical group [H]C(F)(F)* 0.000 description 1
- 125000006009 dihaloalkoxy group Chemical group 0.000 description 1
- 125000004982 dihaloalkyl group Chemical group 0.000 description 1
- 125000000723 dihydrobenzofuranyl group Chemical group O1C(CC2=C1C=CC=C2)* 0.000 description 1
- 238000010790 dilution Methods 0.000 description 1
- 239000012895 dilution Substances 0.000 description 1
- 125000005879 dioxolanyl group Chemical group 0.000 description 1
- CVKCKLNGVYHFAX-UHFFFAOYSA-L dipotassium;4-[phenyl-(4-sulfonatophenyl)phosphanyl]benzenesulfonate;dihydrate Chemical compound O.O.[K+].[K+].C1=CC(S(=O)(=O)[O-])=CC=C1P(C=1C=CC(=CC=1)S([O-])(=O)=O)C1=CC=CC=C1 CVKCKLNGVYHFAX-UHFFFAOYSA-L 0.000 description 1
- 201000010099 disease Diseases 0.000 description 1
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 1
- 230000008030 elimination Effects 0.000 description 1
- 238000003379 elimination reaction Methods 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 230000002255 enzymatic effect Effects 0.000 description 1
- 238000006911 enzymatic reaction Methods 0.000 description 1
- HYMXUYQKXCHWDC-UHFFFAOYSA-N ethyl 3-ethoxy-3-iminopropanoate;hydrochloride Chemical compound Cl.CCOC(=N)CC(=O)OCC HYMXUYQKXCHWDC-UHFFFAOYSA-N 0.000 description 1
- 125000002534 ethynyl group Chemical group [H]C#C* 0.000 description 1
- VUWZPRWSIVNGKG-UHFFFAOYSA-N fluoromethane Chemical compound F[CH2] VUWZPRWSIVNGKG-UHFFFAOYSA-N 0.000 description 1
- 125000004216 fluoromethyl group Chemical group [H]C([H])(F)* 0.000 description 1
- 238000002523 gelfiltration Methods 0.000 description 1
- 238000012268 genome sequencing Methods 0.000 description 1
- 125000004446 heteroarylalkyl group Chemical group 0.000 description 1
- 125000006038 hexenyl group Chemical group 0.000 description 1
- 125000004051 hexyl group Chemical group [H]C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])* 0.000 description 1
- ZMZDMBWJUHKJPS-UHFFFAOYSA-N hydrogen thiocyanate Natural products SC#N ZMZDMBWJUHKJPS-UHFFFAOYSA-N 0.000 description 1
- 125000002632 imidazolidinyl group Chemical group 0.000 description 1
- 125000002636 imidazolinyl group Chemical group 0.000 description 1
- 125000002883 imidazolyl group Chemical group 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- PQNFLJBBNBOBRQ-UHFFFAOYSA-N indane Chemical compound C1=CC=C2CCCC2=C1 PQNFLJBBNBOBRQ-UHFFFAOYSA-N 0.000 description 1
- 125000003387 indolinyl group Chemical group N1(CCC2=CC=CC=C12)* 0.000 description 1
- 125000001041 indolyl group Chemical group 0.000 description 1
- 230000000977 initiatory effect Effects 0.000 description 1
- 229910017053 inorganic salt Inorganic materials 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- PNDPGZBMCMUPRI-UHFFFAOYSA-N iodine Chemical compound II PNDPGZBMCMUPRI-UHFFFAOYSA-N 0.000 description 1
- 239000012948 isocyanate Substances 0.000 description 1
- 150000002513 isocyanates Chemical class 0.000 description 1
- 125000004594 isoindolinyl group Chemical group C1(NCC2=CC=CC=C12)* 0.000 description 1
- 125000000904 isoindolyl group Chemical group C=1(NC=C2C=CC=CC12)* 0.000 description 1
- 125000003253 isopropoxy group Chemical group [H]C([H])([H])C([H])(O*)C([H])([H])[H] 0.000 description 1
- 125000005956 isoquinolyl group Chemical group 0.000 description 1
- 125000001786 isothiazolyl group Chemical group 0.000 description 1
- 150000002540 isothiocyanates Chemical class 0.000 description 1
- 125000003965 isoxazolidinyl group Chemical group 0.000 description 1
- 125000003971 isoxazolinyl group Chemical group 0.000 description 1
- 125000000842 isoxazolyl group Chemical group 0.000 description 1
- 239000002523 lectin Substances 0.000 description 1
- 108010026228 mRNA guanylyltransferase Proteins 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 229910052987 metal hydride Inorganic materials 0.000 description 1
- 150000004681 metal hydrides Chemical class 0.000 description 1
- 238000001823 molecular biology technique Methods 0.000 description 1
- 125000002950 monocyclic group Chemical group 0.000 description 1
- 125000006682 monohaloalkyl group Chemical group 0.000 description 1
- 125000002757 morpholinyl group Chemical group 0.000 description 1
- 230000005405 multipole Effects 0.000 description 1
- 230000035772 mutation Effects 0.000 description 1
- 125000004108 n-butyl group Chemical group [H]C([H])([H])C([H])([H])C([H])([H])C([H])([H])* 0.000 description 1
- 125000001624 naphthyl group Chemical group 0.000 description 1
- 230000007935 neutral effect Effects 0.000 description 1
- 238000007481 next generation sequencing Methods 0.000 description 1
- 125000000449 nitro group Chemical group [O-][N+](*)=O 0.000 description 1
- 125000006574 non-aromatic ring group Chemical group 0.000 description 1
- 238000003203 nucleic acid sequencing method Methods 0.000 description 1
- JRZJOMJEPLMPRA-UHFFFAOYSA-N olefin Natural products CCCCCCCC=C JRZJOMJEPLMPRA-UHFFFAOYSA-N 0.000 description 1
- 125000000160 oxazolidinyl group Chemical group 0.000 description 1
- 125000005968 oxazolinyl group Chemical group 0.000 description 1
- 125000002971 oxazolyl group Chemical group 0.000 description 1
- 125000003551 oxepanyl group Chemical group 0.000 description 1
- AHHWIHXENZJRFG-UHFFFAOYSA-N oxetane Chemical compound C1COC1 AHHWIHXENZJRFG-UHFFFAOYSA-N 0.000 description 1
- 230000003647 oxidation Effects 0.000 description 1
- 238000007254 oxidation reaction Methods 0.000 description 1
- 230000001590 oxidative effect Effects 0.000 description 1
- 125000000466 oxiranyl group Chemical group 0.000 description 1
- 125000004043 oxo group Chemical group O=* 0.000 description 1
- HXNFUBHNUDHIGC-UHFFFAOYSA-N oxypurinol Chemical compound O=C1NC(=O)N=C2NNC=C21 HXNFUBHNUDHIGC-UHFFFAOYSA-N 0.000 description 1
- PENAXHPKEVTBLF-UHFFFAOYSA-L palladium(2+);prop-1-ene;dichloride Chemical group [Pd+]Cl.[Pd+]Cl.[CH2-]C=C.[CH2-]C=C PENAXHPKEVTBLF-UHFFFAOYSA-L 0.000 description 1
- YJVFFLUZDVXJQI-UHFFFAOYSA-L palladium(ii) acetate Chemical compound [Pd+2].CC([O-])=O.CC([O-])=O YJVFFLUZDVXJQI-UHFFFAOYSA-L 0.000 description 1
- 230000036961 partial effect Effects 0.000 description 1
- 125000002255 pentenyl group Chemical group C(=CCCC)* 0.000 description 1
- 125000001147 pentyl group Chemical group C(CCCC)* 0.000 description 1
- 230000000737 periodic effect Effects 0.000 description 1
- 229910052698 phosphorus Inorganic materials 0.000 description 1
- 239000011574 phosphorus Substances 0.000 description 1
- 125000004592 phthalazinyl group Chemical group C1(=NN=CC2=CC=CC=C12)* 0.000 description 1
- 125000004193 piperazinyl group Chemical group 0.000 description 1
- 125000003386 piperidinyl group Chemical group 0.000 description 1
- 125000003367 polycyclic group Chemical group 0.000 description 1
- 229920000867 polyelectrolyte Polymers 0.000 description 1
- 229920000728 polyester Polymers 0.000 description 1
- 229910000160 potassium phosphate Inorganic materials 0.000 description 1
- 235000011009 potassium phosphates Nutrition 0.000 description 1
- 239000000843 powder Substances 0.000 description 1
- 239000002243 precursor Substances 0.000 description 1
- XOJVVFBFDXDTEG-UHFFFAOYSA-N pristane Chemical compound CC(C)CCCC(C)CCCC(C)CCCC(C)C XOJVVFBFDXDTEG-UHFFFAOYSA-N 0.000 description 1
- 125000004368 propenyl group Chemical group C(=CC)* 0.000 description 1
- 239000011546 protein dye Substances 0.000 description 1
- 125000003373 pyrazinyl group Chemical group 0.000 description 1
- 125000003072 pyrazolidinyl group Chemical group 0.000 description 1
- 125000002755 pyrazolinyl group Chemical group 0.000 description 1
- 125000003226 pyrazolyl group Chemical group 0.000 description 1
- 125000002098 pyridazinyl group Chemical group 0.000 description 1
- UMJSCPRVCHMLSP-UHFFFAOYSA-N pyridine Natural products COC1=CC=CN=C1 UMJSCPRVCHMLSP-UHFFFAOYSA-N 0.000 description 1
- 125000004076 pyridyl group Chemical group 0.000 description 1
- 125000000714 pyrimidinyl group Chemical group 0.000 description 1
- 125000000719 pyrrolidinyl group Chemical group 0.000 description 1
- 125000004929 pyrrolidonyl group Chemical group N1(C(CCC1)=O)* 0.000 description 1
- 125000000168 pyrrolyl group Chemical group 0.000 description 1
- 238000010791 quenching Methods 0.000 description 1
- 230000000171 quenching effect Effects 0.000 description 1
- 125000005493 quinolyl group Chemical group 0.000 description 1
- 230000002285 radioactive effect Effects 0.000 description 1
- 239000000376 reactant Substances 0.000 description 1
- 239000001044 red dye Substances 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 239000002342 ribonucleoside Substances 0.000 description 1
- 239000002336 ribonucleotide Substances 0.000 description 1
- 125000002652 ribonucleotide group Chemical group 0.000 description 1
- 229920002477 rna polymer Polymers 0.000 description 1
- 238000007480 sanger sequencing Methods 0.000 description 1
- 229920006395 saturated elastomer Polymers 0.000 description 1
- 125000002914 sec-butyl group Chemical group [H]C([H])([H])C([H])([H])C([H])(*)C([H])([H])[H] 0.000 description 1
- 150000003335 secondary amines Chemical class 0.000 description 1
- 238000004557 single molecule detection Methods 0.000 description 1
- 239000011734 sodium Substances 0.000 description 1
- PPASLZSBLFJQEF-RKJRWTFHSA-M sodium ascorbate Substances [Na+].OC[C@@H](O)[C@H]1OC(=O)C(O)=C1[O-] PPASLZSBLFJQEF-RKJRWTFHSA-M 0.000 description 1
- 235000010378 sodium ascorbate Nutrition 0.000 description 1
- 229960005055 sodium ascorbate Drugs 0.000 description 1
- 229910000029 sodium carbonate Inorganic materials 0.000 description 1
- 239000001488 sodium phosphate Substances 0.000 description 1
- 229910000162 sodium phosphate Inorganic materials 0.000 description 1
- 159000000000 sodium salts Chemical group 0.000 description 1
- 235000010339 sodium tetraborate Nutrition 0.000 description 1
- PPASLZSBLFJQEF-RXSVEWSESA-M sodium-L-ascorbate Chemical compound [Na+].OC[C@H](O)[C@H]1OC(=O)C(O)=C1[O-] PPASLZSBLFJQEF-RXSVEWSESA-M 0.000 description 1
- 125000003003 spiro group Chemical group 0.000 description 1
- 125000000547 substituted alkyl group Chemical group 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 150000008163 sugars Chemical class 0.000 description 1
- PXQLVRUNWNTZOS-UHFFFAOYSA-N sulfanyl Chemical class [SH] PXQLVRUNWNTZOS-UHFFFAOYSA-N 0.000 description 1
- 125000000020 sulfo group Chemical group O=S(=O)([*])O[H] 0.000 description 1
- BDHFUVZGWQCTTF-UHFFFAOYSA-M sulfonate Chemical compound [O-]S(=O)=O BDHFUVZGWQCTTF-UHFFFAOYSA-M 0.000 description 1
- 125000001273 sulfonato group Chemical group [O-]S(*)(=O)=O 0.000 description 1
- 238000010189 synthetic method Methods 0.000 description 1
- 125000004213 tert-butoxy group Chemical group [H]C([H])([H])C(O*)(C([H])([H])[H])C([H])([H])[H] 0.000 description 1
- 125000003718 tetrahydrofuranyl group Chemical group 0.000 description 1
- 125000001412 tetrahydropyranyl group Chemical group 0.000 description 1
- 125000005958 tetrahydrothienyl group Chemical group 0.000 description 1
- 125000004632 tetrahydrothiopyranyl group Chemical group S1C(CCCC1)* 0.000 description 1
- 229960004559 theobromine Drugs 0.000 description 1
- 238000002560 therapeutic procedure Methods 0.000 description 1
- 238000005382 thermal cycling Methods 0.000 description 1
- 125000001113 thiadiazolyl group Chemical group 0.000 description 1
- 125000001984 thiazolidinyl group Chemical group 0.000 description 1
- 125000002769 thiazolinyl group Chemical group 0.000 description 1
- 125000000335 thiazolyl group Chemical group 0.000 description 1
- 125000001544 thienyl group Chemical group 0.000 description 1
- 125000001583 thiepanyl group Chemical group 0.000 description 1
- 125000004568 thiomorpholinyl group Chemical group 0.000 description 1
- RYYWUUFWQRZTIU-UHFFFAOYSA-K thiophosphate Chemical compound [O-]P([O-])([O-])=S RYYWUUFWQRZTIU-UHFFFAOYSA-K 0.000 description 1
- MYAJTCUQMQREFZ-UHFFFAOYSA-K tppts Chemical compound [Na+].[Na+].[Na+].[O-]S(=O)(=O)C1=CC=CC(P(C=2C=C(C=CC=2)S([O-])(=O)=O)C=2C=C(C=CC=2)S([O-])(=O)=O)=C1 MYAJTCUQMQREFZ-UHFFFAOYSA-K 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
- 125000004306 triazinyl group Chemical group 0.000 description 1
- 125000001425 triazolyl group Chemical group 0.000 description 1
- 125000000876 trifluoromethoxy group Chemical group FC(F)(F)O* 0.000 description 1
- 125000002023 trifluoromethyl group Chemical group FC(F)(F)* 0.000 description 1
- 125000004952 trihaloalkoxy group Chemical group 0.000 description 1
- 125000004385 trihaloalkyl group Chemical group 0.000 description 1
- BSVBQGMMJUBVOD-UHFFFAOYSA-N trisodium borate Chemical compound [Na+].[Na+].[Na+].[O-]B([O-])[O-] BSVBQGMMJUBVOD-UHFFFAOYSA-N 0.000 description 1
- RYFMWSXOAZQYPI-UHFFFAOYSA-K trisodium phosphate Chemical compound [Na+].[Na+].[Na+].[O-]P([O-])([O-])=O RYFMWSXOAZQYPI-UHFFFAOYSA-K 0.000 description 1
- 229940116269 uric acid Drugs 0.000 description 1
- 230000003313 weakening effect Effects 0.000 description 1
- 238000012070 whole genome sequencing analysis Methods 0.000 description 1
- 229940075420 xanthine Drugs 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6869—Methods for sequencing
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N21/00—Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
- G01N21/62—Systems in which the material investigated is excited whereby it emits light or causes a change in wavelength of the incident light
- G01N21/63—Systems in which the material investigated is excited whereby it emits light or causes a change in wavelength of the incident light optically excited
- G01N21/64—Fluorescence; Phosphorescence
- G01N21/6428—Measuring fluorescence of fluorescent products of reactions or of fluorochrome labelled reactive substances, e.g. measuring quenching effects, using measuring "optrodes"
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N21/00—Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
- G01N21/62—Systems in which the material investigated is excited whereby it emits light or causes a change in wavelength of the incident light
- G01N21/63—Systems in which the material investigated is excited whereby it emits light or causes a change in wavelength of the incident light optically excited
- G01N21/64—Fluorescence; Phosphorescence
- G01N2021/6417—Spectrofluorimetric devices
- G01N2021/6419—Excitation at two or more wavelengths
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N21/00—Investigating or analysing materials by the use of optical means, i.e. using sub-millimetre waves, infrared, visible or ultraviolet light
- G01N21/62—Systems in which the material investigated is excited whereby it emits light or causes a change in wavelength of the incident light
- G01N21/63—Systems in which the material investigated is excited whereby it emits light or causes a change in wavelength of the incident light optically excited
- G01N21/64—Fluorescence; Phosphorescence
- G01N21/6428—Measuring fluorescence of fluorescent products of reactions or of fluorochrome labelled reactive substances, e.g. measuring quenching effects, using measuring "optrodes"
- G01N2021/6439—Measuring fluorescence of fluorescent products of reactions or of fluorochrome labelled reactive substances, e.g. measuring quenching effects, using measuring "optrodes" with indicators, stains, dyes, tags, labels, marks
Landscapes
- Chemical & Material Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Organic Chemistry (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Immunology (AREA)
- Physics & Mathematics (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Biochemistry (AREA)
- Analytical Chemistry (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biophysics (AREA)
- Molecular Biology (AREA)
- Biotechnology (AREA)
- General Engineering & Computer Science (AREA)
- Microbiology (AREA)
- Genetics & Genomics (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Optics & Photonics (AREA)
- Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
- General Physics & Mathematics (AREA)
- Pathology (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
本公开的实施方案涉及用于核酸测序的试剂盒、组合物和方法,例如,使用蓝光激发和绿光激发的双通道核酸合成测序。具体地讲,用于掺入的未标记核苷酸可与含有能够被蓝光和/或绿光激发的可检测标记的亲和试剂结合使用,用于与所掺入的每种类型的核苷酸特异性结合。
Description
技术领域
本公开一般涉及用于核酸测序应用的组合物、试剂盒、方法和系统。
背景技术
核酸测序方法已从Maxam和Gilbert所使用的化学降解方法以及Sanger所使用的链延长方法得到了显著发展。现今使用了允许在单个测序运行中并行处理数千个核酸的若干测序方法。执行此类方法的仪器通常是大型且昂贵的,因为当前方法通常依赖于大量昂贵的试剂和多组光学滤光器以记录核酸掺入到测序反应中。
已经清楚的是,对高通量、较小型、较便宜的DNA测序技术的需求将有利于获得基因组测序带来的回报。个性化保健越来越前沿,并且将受益于此类技术。对个体的基因组进行测序以识别潜在的突变和异常,对于鉴别一个人是否患有特定疾病并在随后针对该个体定制后续疗法将是至关重要的。为了适应此类努力,测序技术不仅应该具有高通量能力,而且应该具有可扩展性。因此,现在需要在速度、错误读取和成本效益均有改进的新的测序方法。
发明内容
本公开提供新一代测序试剂盒、方法、系统和组合物。某些公开内容涉及用于使用蓝光激发和绿光激发(例如,在450-460nm和520-540nm处的激光)进行两通道核酸测序应用的试剂盒和组合物。
本公开的一个方面涉及一种用于测序应用的试剂盒,该试剂盒包括:
第一类型的未标记核苷酸,该第一类型的未标记核苷酸包含第一半抗原;
第二类型的未标记核苷酸,该第二类型的未标记核苷酸包含第二半抗原;
第三类型的未标记核苷酸;以及
一组亲和试剂,该一组亲和试剂包含:
第一亲和试剂,该第一亲和试剂包含能够与该第一类型的未标记核苷酸特异性结合的第一半抗原结合配偶体;以及
第二亲和试剂,该第二亲和试剂包含能够与该第二类型的未标记核苷酸特异性结合的第二半抗原结合配偶体;
其中该第一亲和试剂包含一个或多个第一可检测标记,该一个或多个第一可检测标记能够由第一激发光源激发,该第二亲和试剂包含一个或多个第二可检测标记,该一个或多个第二可检测标记能够由第二激发光源激发,并且其中该第一可检测标记与该第二可检测标记为光谱上可区分的;并且
其中该第一激发光源和该第二激发光源中的一者具有约450nm至约460nm的波长,并且该第一激发光源和该第二激发光源中的另一者具有约520nm至约540nm的波长;
本公开的一个方面涉及蛋白组装系统,该蛋白组装系统包含:
第一蛋白,该第一蛋白用一个或多个第一可检测标记来标记;
一个或多个含半抗原的接头,该一个或多个含半抗原的接头共价连接到该第一蛋白;以及
一个或多个半抗原结合的第二蛋白,该一个或多个半抗原结合的第二蛋白与一个或多个含半抗原的接头结合;
其中该一个或多个半抗原结合的第二蛋白用一个或多个第二可检测标记来标记,并且其中该一个或多个第一可检测标记与该一个或多个第二可检测标记为光谱上可区分的。
本公开的另一个方面涉及一种包含本文所述的蛋白组装系统的核苷酸络合物。在另一个方面,本公开涉及一种寡核苷酸或多核苷酸,该寡核苷酸或多核苷酸包含本文所述的该核苷酸络合物。
本公开的进一步方面涉及标记的纳米颗粒,该标记的纳米颗粒包含:聚合物基质,该聚合物基质包含多个可检测标记,其中聚合物的骨架包含一个或多个可裂解部分,并且其中该标记的纳米颗粒在该可裂解部分裂解后能够降解成较小的聚合链。在一些实施方案中,本文所述的该标记的纳米颗粒可用作用于本文所述的该试剂盒或该蛋白组装系统的可检测标记。例如,本公开的额外实施方案包括标记的纳米颗粒,该标记的纳米颗粒还包含连接到其上或涂覆于其上的一种或多种蛋白(例如,抗体)。
本公开的进一步方面涉及试剂盒在核酸测序中的用途。例如,该试剂盒可用于确定多种不同靶多核苷酸的序列的方法,该方法包括:
(a)使固体载体在杂交条件下与包含测序引物的溶液接触,其中所述固体载体包含多个固定在其上的不同靶多核苷酸;并且所述测序引物与所述靶多核苷酸的至少一部分互补;
(b)使该固体载体在适用于DNA聚合酶介导的引物延伸的条件下与包含DNA聚合酶和四种不同类型的未标记核苷酸中的一种或多种未标记核苷酸的水溶液接触,并将一种类型的核苷酸掺入到该测序引物中以产生延伸的拷贝多核苷酸;其中
该四种类型的核苷酸中的每种类型的核苷酸包含3'封端基团;
第一类型的未标记核苷酸包含第一半抗原;
第二类型的未标记核苷酸包含第二半抗原;
(c)使该延伸的拷贝多核苷酸与一组亲和试剂在其中一种亲和试剂特异性地结合所掺入的未标记核苷酸的条件下接触,以提供标记的延伸拷贝多核苷酸;
(d)对该固体载体进行成像并对该延伸的拷贝多核苷酸执行一次或多次荧光测量;以及
(e)除去所掺入的核苷酸的该3'封端基团;
其中该一组亲和试剂包含:
第一亲和试剂,该第一亲和试剂包含能够与该第一类型的未标记核苷酸特异性结合的第一半抗原结合配偶体;以及
第二亲和试剂,该第二亲和试剂包含能够与该第二类型的未标记核苷酸特异性结合的第二半抗原结合配偶体;
其中该第一亲和试剂包含一个或多个第一可检测标记,该一个或多个第一可检测标记能够由第一激发光源激发,该第二亲和试剂包含一个或多个第二可检测标记,该一个或多个第二可检测标记能够由第二激发光源激发,并且其中该一个或多个第一可检测标记与该一个或多个第二可检测标记为光谱上可区分的;并且
其中该第一激发光源和该第二激发光源中的一者具有约450nm至约460nm的波长,并且该第一激发光源和该第二激发光源中的另一者具有约520nm至约540nm的波长;
在本文所述的试剂盒或测序方法的一些实施方案中,该试剂盒和测序方法可减少或消除序列环境效应或序列特异性效应,例如在两通道合成测序(SBS)中。
附图说明
图1示意性地示出了根据本公开的实施方案的双标记的蛋白组装系统。
图2A示出了标准的非可解聚的荧光纳米颗粒。
图2B示出了根据本公开的实施方案的可解聚的标记的纳米颗粒。
图3A和图3B是根据本公开的两个不同实施方案,用未标记核苷酸集合和两标签亲和试剂混合物进行的蓝/绿两通道SBS运行的散点图。
图4A是根据本公开的一个实施方案,用未标记核苷酸的集合和三标签亲和试剂混合物进行的蓝/绿两通道SBS运行的散点图。
图4B是使用通用ffN混合物和三标签亲和试剂混合物的蓝/绿两通道SBS运行的散点图,其中亲和试剂中的一种亲和试剂是根据本公开的实施方案的双蛋白组装系统。
图5A和图5B是溶液中相对荧光强度图,比较了分别用标准香豆素染料C标记的ffA与用香豆素染料I-1和染料I-2标记的亲和试剂。
图6A至图6C是循环5处的蓝/绿两通道SBS运行的散点图,比较了包含用香豆素染料C标记的完全官能化C核苷酸(ffC)的核苷酸集合与包含用染料I-1或染料I-2标记的ffC的核苷酸集合。
图7A和图7B是条形图,示出了在增加光剂量下标准两通道SBS的151个循环后剩余的T检出信号的百分比,比较了掺入混合物中标记为ffC的标准香豆素染料C与分别标记为染料I-2或染料I-4的ffC。
具体实施方式
定义
除非另有定义,否则本文所用的所有技术和科学术语的含义与本领域的普通技术人员通常理解的含义相同。术语“包括”以及其他形式(诸如“包括(include/includes/included)”)的使用不是限制性的。术语“具有”以及其他形式(诸如“具有(have/has/had)”)的使用不是限制性的。如本说明书中所用,无论是在过渡短语中还是在权利要求的正文中,术语“包含”和“包括”都将被解释为具有开放式含义。即,上述术语应与短语“至少具有”或“至少包括”同义地解释。例如,当在过程的上下文中使用时,术语“包含”表示该过程至少包括所列举的步骤,但是也可包括额外步骤。当在化合物、组合物或设备的上下文中使用时,术语“包含”是指该化合物、组合物或设备至少包含所列举的特征或组分,但是也可包含额外特征或组分。
如本文所用,常见的有机缩写定义如下:
℃以摄氏度计的温度
dATP 三磷酸脱氧腺苷
dCTP 三磷酸脱氧胞苷
dGTP 三磷酸脱氧鸟苷
dTTP 三磷酸脱氧胸苷
ddNTP 三磷酸双脱氧核苷酸
ffA 完全官能化A核苷酸
ffC 完全官能化C核苷酸
ffG 完全官能化G核苷酸
ffN 完全官能化核苷酸
ffT 完全官能化T核苷酸
LED 发光二极管
SBS 合成测序
如本文所用,术语“阵列”是指连接到一个或多个底物的一组不同探针分子,使得这些不同探针分子可根据相对位置彼此区分。阵列可包括各自位于底物上的不同可寻址位置处的不同探针分子。替代性地或另外地,阵列可包括各自带有不同探针分子的单独底物,其中可根据底物在底物所连接到的表面上的位置或根据底物在液体中的位置来识别不同的探针分子。其中单独底物位于表面上的示例性阵列包括但不限于在孔中包含珠粒的那些,如例如美国专利第6,355,431B1号、US2002/0102578和PCT公开第WO 00/63437号中所述的。例如,在美国专利第6,524,793号中描述了在本发明中可用于例如使用微流体装置,诸如荧光活化细胞分选器(FACS)区分液体阵列中的珠粒的示例性形式。可用于本发明的阵列的另外的示例包括但不限于美国专利第5,429,807号;第5,436,327号;第5,561,071号;第5,583,211号;第5,658,734号;第5,837,858号;第5,874,219号;第5,919,523号;第6,136,269号;第6,287,768号;第6,287,776号;第6,288,220号;第6,297,006号;第6,291,193号;第6,346,413号;第6,416,949号;第6,482,591号;第6,514,751号和第6,610,482号;和WO93/17126;WO 95/11995;WO 95/35505;EP 742287;和EP 799 897中描述的那些。
如本文所用,术语“共价连接的”或“共价键合的”是指形成特征在于原子之间共用电子对的化学键合。例如,共价连接的聚合物涂层是指与底物的官能化表面形成化学键的聚合物涂层,这与经由其他方式(例如,粘附或静电相互作用)粘附到该表面形成比较。应当理解,共价连接到表面的聚合物也可以经由除共价连接之外的方式键合。
如本文所用,术语“非共价相互作用”与共价键的不同之处在于,它不涉及共用电子,而是涉及分子之间或分子内电磁相互作用更分散的变化。非共价相互作用一般可分为四类:静电效应、π效应、范德华力和疏水效应。静电相互作用的非限制性示例包括离子相互作用、氢键合(特定类型的偶极-偶极相互作用)、卤素键合等。范德华力是涉及永久或诱导偶极或多极的静电相互作用的子集。π效应可分拆成许多类,包括(但不限于)π-π相互作用、阳离子-π和阴离子-π相互作用和极性-π相互作用。一般来讲,π效应跟分子与分子系统(诸如苯)的π-轨道的相互作用相关。疏水效应是非极性物质在水性溶液中聚集并排斥水分子的倾向。非共价相互作用可以是分子间的和分子内的。非共价相互作用可以是分子间的和分子内的。
应当理解,根据上下文,某些基团命名惯例可以包括单基或二基。例如,当取代基需要两个与分子其余部分的连接点时,应当理解,该取代基为二基。例如,被识别为需要两个连接点的烷基的取代基包括二基,诸如–CH2–、–CH2CH2–、–CH2CH(CH3)CH2–等。其他基团命名惯例清楚地指示该基团为二基,诸如“亚烷基”或“亚烯基”。
如本文所用,术语“卤素”或“卤基”意味着元素周期表第7列的放射性稳定原子中的任一种,例如,氟、氯、溴或碘,其中氟和氯是优选的。
如本文所用,其中“a”和“b”是整数的“Ca-Cb”、“Ca-Cb”或“Ca-b”是指烷基、烯基或炔基基团中的碳原子数,或环烷基或芳基基团的环原子数。即,烷基、烯基、炔基、环烷基的环和芳基的环可以含有“a”至“b”个(包括端值在内)的碳原子。例如,“C1至C4烷基”基团是指具有1个至4个碳的所有烷基基团,即CH3-、CH3CH2-、CH3CH2CH2-、(CH3)2CH-、CH3CH2CH2CH2-、CH3CH2CH(CH3)-和(CH3)3C-;C3至C4环烷基基团是指具有3至4个碳原子的所有环烷基基团,即环丙基和环丁基。类似地,“4至6元杂环基”基团是指具有4至6个总环原子的所有杂环基基团,例如氮杂环丁烷、氧杂环丁烷、噁唑啉、吡咯烷、哌啶、哌嗪、吗啉等。如果对于烷基、烯基、炔基、环烷基或芳基基团没有指定“a”和“b”,则将假设这些定义中描述的最广泛范围。如本文所用,术语“C1-C6”包括C1、C2、C3、C4、C5和C6,以及由这两个数字中的任一者定义的范围。例如,C1-C6烷基包括C1烷基、C2烷基、C3烷基、C4烷基、C5烷基和C6烷基、C2-C6烷基、C1-C3烷基等。类似地,C2-C6烯基包括C2烯基、C3烯基、C4烯基、C5烯基和C6烯基、C2-C5烯基、C3-C4烯基等;并且C2-C6炔基包括C2炔基、C3炔基、C4炔基、C5炔基和C6炔基、C2-C5炔基、C3-C4炔基等。C3-C8环烷基各自包括含有3、4、5、6、7和8个碳原子或由任何两个数字限定的范围的烃环,诸如C3-C7环烷基或C5-C6环烷基。
如本文所用,“烷基”是指完全饱和(即,不包含双键和三键)的直链或支链烃链。烷基基团可具有1至20个碳原子(每当在本文中出现时,诸如“1至20”的数值范围是指给定范围内的每个整数;例如,“1至20个碳原子”意味着烷基基团可由1个碳原子、2个碳原子、3个碳原子等,最多至并包括20个碳原子组成,但本定义还涵盖出现其中没有指定数值范围的术语“烷基”)。烷基基团还可以是具有1至9个碳原子的中等大小烷基。烷基基团还可以是具有1至6个碳原子的低级烷基。烷基基团可以被命名为“C1-C4烷基”或类似的名称。仅以举例的方式,“C1-C6烷基”表示烷基链中存在一至六个碳原子,即,烷基链选自由甲基、乙基、丙基、异丙基、正丁基、异丁基、仲丁基和叔丁基组成的组。典型的烷基基团包括但绝不限于甲基、乙基、丙基、异丙基、丁基、异丁基、叔丁基、戊基、己基等。
如本文所用,“烷氧基”是指式-OR(其中R为如上文所定义的烷基),诸如“C1-C9烷氧基”,包括但不限于甲氧基、乙氧基、正丙氧基、1-甲基乙氧基(异丙氧基)、正丁氧基、异丁氧基、仲丁氧基和叔丁氧基等。
如本文所用,“烯基”是指包含一个或多个双键的直链或支链烃链。烯基基团可具有2至20个碳原子,但本定义还涵盖出现其中没有指定数值范围的术语“烯基”。烯基基团还可以是具有2至9个碳原子的中等大小烯基。烯基基团还可以是具有2至6个碳原子的低级烯基。烯基基团可以被命名为“C2-C6烯基”或类似的名称。仅以举例的方式,“C2-C6烯基”表示烯基链中存在两至六个碳原子,即,烯基链选自由乙烯基、丙烯-1-基、丙烯-2-基、丙烯-3-基、丁烯-1-基、丁烯-2-基、丁烯-3-基、丁烯-4-基、1-甲基-丙烯-1-基、2-甲基-丙烯-1-基、1-乙基-乙烯-1-基、2-甲基-丙烯-3-基、丁-1,3-二烯基、丁-1,2-二烯基和丁-1,2-二烯-4-基组成的组。典型的烯基基团包括但绝不限于乙烯基、丙烯基、丁烯基、戊烯基和己烯基等。
术语“芳族”是指具有共轭π电子体系的环或环系,并且包括碳环芳族基团(例如,苯基)和杂环芳族基团(例如,吡啶)这两者。该术语包括单环基团或稠环多环(即,共用相邻原子对的环)基团,前提条件是整个环系是芳族的。
如本文所用,“芳基”是指在环骨架中仅包含碳的芳族环或环系(即,共用两个相邻碳原子的两个或更多个稠环)。当芳基为环系时,该环系中的每个环均为芳族的。芳基基团可以具有6至18个碳原子,但本定义还涵盖出现其中没有指定数值范围的术语“芳基”。在一些实施方案中,芳基基团具有6至10个碳原子。芳基基团可以被命名为“C6-C10芳基”、“C6或C10芳基”或类似的名称。芳基基团的示例包括但不限于苯基、萘基、薁基和蒽基。
“芳烷基”或“芳基烷基”为作为取代基经由亚烷基基团连接的芳基基团,诸如“C7-14芳烷基”等,包括但不限于苄基、2-苯基乙基、3-苯基丙基和萘基烷基。在一些情况下,亚烷基基团为低级亚烷基基团(即,C1-C6亚烷基基团)。
如本文所用,“芳氧基”是指RO-,其中R是如上文所定义的芳基,诸如但不限于苯基。
如本文所用,“杂芳基”是指在环骨架中含有一个或多个杂原子(即,除碳之外的元素,包括但不限于氮、氧和硫)的芳族环或环系(即,共用两个相邻原子的两个或更多个稠环)。当杂芳基是环系时,该环系中的每个环均是芳族的。杂芳基基团可以具有5至18个环成员(即,构成环骨架的原子(包括碳原子和杂原子)的数目),但本定义还涵盖出现其中没有指定数值范围的术语“杂芳基”。在一些实施方案中,杂芳基基团具有5至10个环成员或者5至7个环成员。杂芳基基团可以被命名为“5至7元杂芳基”、“5至10元杂芳基”或类似的名称。杂芳基环的示例包括但不限于呋喃基、噻吩基、酞嗪基、吡咯基、噁唑基、噻唑基、咪唑基、吡唑基、异噁唑基、异噻唑基、三唑基、噻二唑基、吡啶基、哒嗪基、嘧啶基、吡嗪基、三嗪基、喹啉基、异喹啉基、苯并咪唑基、苯并噁唑基、苯并噻唑基、吲哚基、异吲哚基和苯并噻吩基。
“杂芳烷基”或“杂芳基烷基”为作为取代基经由亚烷基基团连接的杂芳基基团。示例包括但不限于2-噻吩基甲基、3-噻吩基甲基、呋喃基甲基、噻吩基乙基、吡咯基烷基、吡啶基烷基、异噁唑基烷基和咪唑基烷基。在一些情况下,亚烷基基团为低级亚烷基基团(即,C1-C6亚烷基基团)。
如本文所用,“碳环基”意味着在环系骨架中仅含有碳原子的非芳族环状环或环系。当碳环基为环系时,两个或更多个环可以以稠合、桥接或螺接的方式接合在一起。碳环基可以具有任何饱和度,前提条件是环系中的至少一个环不是芳族的。因此,碳环基包括环烷基、环烯基和环炔基。碳环基基团可以具有3至20个碳原子,但本定义还涵盖出现其中没有指定数值范围的术语“碳环基”。碳环基基团也可以是具有3至10个碳原子的中等大小碳环基。碳环基基团也可以是具有3至6个碳原子的碳环基。碳环基基团可以被命名为“C3-C6碳环基”或类似的名称。碳环基环的示例包括但不限于环丙基、环丁基、环戊基、环己基、环己烯基、2,3-二氢-茚、双环[2.2.2]辛烷基、金刚烷基和螺[4.4]壬烷基。
如本文所用,“环烷基”意味着完全饱和的碳环基环或环系。示例包括环丙基、环丁基、环戊基和环己基。
如本文所用,“杂环基”是指在环骨架中含有至少一个杂原子的非芳族环状环或环系。杂环基可以稠合、桥接或螺接的方式接合在一起。杂环基可具有任何饱和度,前提条件是环系中的至少一个环不是芳族的。杂原子可以存在于环系中的非芳族环或芳族环中。杂环基基团可以具有3至20个环元(即,构成环骨架的原子(包括碳原子和杂原子)的数目),但本定义还涵盖出现其中没有指定数值范围的术语“杂环基”。杂环基基团也可以是具有3至10个环元的中等大小杂环基。杂环基基团也可以是具有3至6个环元的杂环基。杂环基基团可以被命名为“3至6元杂环基”或类似的名称。在优选的六元单环杂环基中,杂原子选自O、N或S中的一个至最多三个,并且在优选的五元单环杂环基中,杂原子选自一个或两个选自O、N或S的杂原子。杂环基环的示例包括但不限于吖庚因基、吖啶基、咔唑基、噌啉基、二氧戊环基、咪唑啉基、咪唑烷基、吗啉基、环氧乙烷基、氧杂环庚烷基、硫杂环庚烷基、哌啶基、哌嗪基、二氧代哌嗪基、吡咯烷基、吡咯烷酮基、吡咯烷二酮基、4-哌啶酮基、吡唑啉基、吡唑烷基、1,3-二噁英基、1,3-二噁烷基、1,4-二噁英基、1,4-二噁烷基、1,3-氧硫杂环己烷基、1,4-氧硫杂环己烯基、1,4-氧硫杂环己烷基、2H-1,2-噁嗪基、三噁烷基、六氢-1,3,5-三嗪基、1,3-间二氧杂环戊烯基、1,3-二氧戊环基、1,3-二噻吩基、1,3-二噻烷基、异噁唑啉基、异噁唑烷基、噁唑啉基、噁唑烷基、噁唑烷酮基、噻唑啉基、噻唑烷基、1,3-氧硫杂环戊烷基、二氢吲哚基、异二氢吲哚基、四氢呋喃基、四氢吡喃基、四氢噻吩基、四氢噻喃基、四氢-1,4-噻嗪基、硫代吗啉基、二氢苯并呋喃基、苯并咪唑烷基和四氢喹啉。
如本文所用,“(芳基)烷基”是指作为取代基经由如上文所述的亚烷基基团连接的如上文所定义的芳基基团。芳烷基的亚烷基和芳基基团可为取代的或未取代的。示例包括但不限于苄基、2-苯基烷基、3-苯基烷基和萘基烷基。在一些实施方案中,亚烷基是含有1、2、3、4、5或6个亚甲基单元的未取代的直链。
如本文所用,“(杂芳基)烷基”是指作为取代基经由如上文所定义的亚烷基基团连接的如上文所定义的杂芳基基团。杂芳烷基的亚烷基和杂芳基基团可为取代的或未取代的。示例包括但不限于2-噻吩基烷基、3-噻吩基烷基、呋喃基烷基、噻吩基烷基、吡咯基烷基、吡啶基烷基、异噁唑基烷基和咪唑基烷基,以及它们的苯并稠合类似物。在一些实施方案中,亚烷基是含有1、2、3、4、5或6个亚甲基单元的未取代的直链。
如本文所用,“(杂环基)烷基”是指作为取代基经由如上文所定义的亚烷基基团连接的如上文所定义的杂环或杂环基基团。(杂环基)烷基的亚烷基基团和杂环基基团可以是取代的或未取代的。示例包括但不限于(四氢-2H-吡喃-4-基)甲基、(哌啶-4-基)乙基、(哌啶-4-基)丙基、(四氢-2H-噻喃-4-基)甲基和(1,3-噻嗪烷-4-基)甲基。在一些实施方案中,亚烷基是含有1、2、3、4、5或6个亚甲基单元的未取代的直链。
如本文所用,“(碳环基)烷基”是指作为取代基经由亚烷基基团连接的碳环基基团(如本文所定义的)。示例包括但不限于环丙基甲基、环丁基甲基、环戊基乙基和环己基丙基。在一些实施方案中,亚烷基是含有1、2、3、4、5或6个亚甲基单元的未取代的直链。
如本文所用,“烷氧基烷基”或“(烷氧基)烷基”是指通过亚烷基基团连接的烷氧基基团,诸如C2-C8烷氧基烷基或(C1-C6烷氧基)C1-C6烷基,例如–(CH2)1-3-OCH3。
如本文所用,“-O-烷氧基烷基”或“-O-(烷氧基)烷基”是指经由–O-(亚烷基)基团连接的烷氧基基团,诸如–O-(C1-C6烷氧基)C1-C6烷基,例如–O-(CH2)1-3-OCH3。
如本文所用,“卤代烷基”是指其中一个或多个氢原子被卤素取代的烷基基团(例如,单卤代烷基、二卤代烷基和三卤代烷基)。此类基团包括但不限于氯甲基、氟甲基、二氟甲基、三氟甲基和1-氯-2-氟甲基、2-氟异丁基。卤代烷基可为取代的或未取代的。
如本文所用,“卤代烷氧基”是指其中一个或多个氢原子被卤素取代的烷氧基基团(例如,单卤代烷氧基、二卤代烷氧基和三卤代烷氧基)。此类基团包括但不限于氯甲氧基、氟甲氧基、二氟甲氧基、三氟甲氧基和1-氯-2-氟甲氧基、2-氟异丁氧基。卤代烷氧基可为取代的或未取代的。
“氨基”基团是指–NH2基团。如本文所用,术语“单取代的氨基基团”是指其中一个氢原子被取代基取代的氨基(-NH2)基团。如本文所用,术语“二取代的氨基基团”是指其中两个氢原子中的每个均被取代基取代的氨基(-NH2)基团。如本文所用,术语“任选地取代的氨基”是指-NRARB基团,其中RA和RB独立地为氢、烷基、环烷基、芳基、杂芳基、杂环基、芳烷基或杂环基(烷基),如本文所定义的。
“O-羧基”基团是指其中R选自氢、C1-C6烷基、C2-C6烯基、C2-C6炔基、C3-C7碳环基、C6-C10芳基、5至10元杂芳基和3至10元杂环基的“-OC(=O)R”基团,如本文所定义的。
“C-羧基”基团是指其中R选自由氢、C1-C6烷基、C2-C6烯基、C2-C6炔基、C3-C7碳环基、C6-C10芳基、5至10元杂芳基和3至10元杂环基组成的组的“-C(=O)OR”基团,如本文所定义的。非限制性示例包括羧基(即,-C(=O)OH)。
“磺酰基”基团是指其中R选自氢、C1-C6烷基、C2-C6烯基、C2-C6炔基、C3-C7碳环基、C6-C10芳基、5至10元杂芳基和3至10元杂环基的“-SO2R”基团,如本文所定义的。
“亚磺酸基”基团是指“-S(=O)OH”基团。
“磺基”基团是指“-S(=O)2OH”或“-SO3H”基团。
“磺酸根”基团是指“-SO3ˉ”基团。
“硫酸根”基团是指“-SO4ˉ”基团。
“S-亚磺酰氨基”基团是指其中RA和RB各自独立地选自氢、C1-C6烷基、C2-C6烯基、C2-C6炔基、C3-C7碳环基、C6-C10芳基、5至10元杂芳基和3至10元杂环基的“-SO2NRARB”基团,如本文所定义的。
“N-亚磺酰氨基”基团是指其中RA和RB各自独立地选自氢、C1-C6烷基、C2-C6烯基、C2-C6炔基、C3-C7碳环基、C6-C10芳基、5至10元杂芳基和3至10元杂环基的“-N(RA)SO2RB”基团,如本文所定义的。
“C-酰氨基”基团是指其中RA和RB各自独立地选自氢、C1-C6烷基、C2-C6烯基、C2-C6炔基、C3-C7碳环基、C6-C10芳基、5至10元杂芳基和3至10元杂环基的“-C(=O)NRARB”基团,如本文所定义的。
“N-酰氨基”基团是指其中RA和RB各自独立地选自氢、C1-C6烷基、C2-C6烯基、C2-C6炔基、C3-C7碳环基、C6-C10芳基、5至10元杂芳基和3至10元杂环基的“-N(RA)C(=O)RB”基团,如本文所定义的。
“O-氨甲酰基”基团是指“-OC(=O)N(RARB)”基团,其中RA和RB可以与S-亚磺酰氨基的定义相同。O-氨甲酰基可为取代的或未取代的。
“N-氨甲酰基”基团是指“ROC(=O)N(RA)-”基团,其中R和RA可以与N-亚磺酰氨基的定义相同。N-氨甲酰基可为取代的或未取代的。
“O-硫代氨甲酰基”基团是指“-OC(=S)-N(RARB)”基团,其中RA和RB可以与S-亚磺酰氨基的定义相同。O-硫代氨甲酰基可为取代的或未取代的。
“N-硫代氨甲酰基”基团是指“ROC(=S)N(RA)-”基团,其中R和RA可以与N-亚磺酰氨基的定义相同。N-硫代氨甲酰基可为取代的或未取代的。
术语“烷基氨基”或“(烷基)氨基”是指其中一个或两个氢被烷基基团取代的氨基基团。
“(烷氧基)烷基”基团是指经由亚烷基基团连接的烷氧基基团,诸如“(C1-C6烷氧基)C1-C6烷基”等。
如本文所用的术语“羟基”是指–OH基团。
如本文所用的术语“氰基”是指“-CN”基团。
如本文所用的术语“叠氮基”是指–N3基团。
如本文所用的术语“异氰化物”是指“–N+≡Cˉ”基团。
当基团被描述为“任选地取代的”时,其可以是未取代的或取代的。同样,当基团被描述为“取代的”时,取代基可以选自所指示的取代基中的一者或多者。如本文所用,取代的基团衍生自未取代的母体基团,其中已存在一个或多个氢原子与另一个原子或基团的交换。除非另外指明,否则当基团被认为是“取代的”时,这意味着该基团被一个或多个取代基取代,该取代基独立地选自:C1-C6烷基、C1-C6烯基、C1-C6炔基、C1-C6杂烷基、C3-C7碳环基(任选地被卤代基、C1-C6烷基、C1-C6烷氧基、C1-C6卤代烷基和C1-C6卤代烷氧基取代)、C3-C7碳环基-C1-C6-烷基(任选地被卤代基、C1-C6烷基、C1-C6烷氧基、C1-C6卤代烷基和C1-C6卤代烷氧基取代)、3-10元杂环基(任选地被卤代基、C1-C6烷基、C1-C6烷氧基、C1-C6卤代烷基和C1-C6卤代烷氧基取代)、3-10元杂环基-C1-C6-烷基(任选地被卤代基、C1-C6烷基、C1-C6烷氧基、C1-C6卤代烷基和C1-C6卤代烷氧基取代)、芳基(任选地被卤代基、C1-C6烷基、C1-C6烷氧基、C1-C6卤代烷基和C1-C6卤代烷氧基取代)、(芳基)C1-C6烷基(任选地被卤代基、C1-C6烷基、C1-C6烷氧基、C1-C6卤代烷基和C1-C6卤代烷氧基取代)、5-10元杂芳基(任选地被卤代基、C1-C6烷基、C1-C6烷氧基、C1-C6卤代烷基和C1-C6卤代烷氧基取代)、(5-10元杂芳基)C1-C6烷基(任选地被卤代基、C1-C6烷基、C1-C6烷氧基、C1-C6卤代烷基和C1-C6卤代烷氧基取代)、卤代基、-CN、羟基、C1-C6烷氧基、(C1-C6烷氧基)C1-C6烷基、-O(C1-C6烷氧基)C1-C6烷基;(C1-C6卤代烷氧基)C1-C6烷基;-O(C1-C6卤代烷氧基)C1-C6烷基;芳氧基、巯基(氢硫基)、卤代(C1-C6)烷基(例如,–CF3)、卤代(C1-C6)烷氧基(例如,–OCF3)、C1-C6烷硫基、芳硫基、氨基、氨基(C1-C6)烷基、硝基、O-氨甲酰基、N-氨甲酰基、O-硫代氨甲酰基、N-硫代氨甲酰基、C-酰氨基、N-酰氨基、S-亚磺酰氨基、N-亚磺酰氨基、C-羧基、O-羧基、酰基、氰酸根、异氰酸根、硫氰酸根、异硫氰酸根、亚磺酰基、磺酰基、-SO3H、磺酸根、硫酸根、亚磺基、-OSO2C1-4烷基、单磷酸根、二磷酸根、三磷酸根和氧代基(=O)。在基团被描述为“任选地取代的”的任何地方,该基团可以被上述取代基取代。
在示出本文所述化合物的单一内消旋形式的每种情况下,同样设想了替代性的内消旋形式。
如本文所用,“核苷酸”包括含氮杂环碱基、糖以及一个或多个磷酸基团。它们是核酸序列的单体单元。在RNA中,糖为核糖,并且在DNA中为脱氧核糖,即,缺乏存在于核糖中的羟基基团的糖。含氮杂环碱基可为嘌呤、脱氮嘌呤或嘧啶碱基。嘌呤碱基包括腺嘌呤(A)和鸟嘌呤(G)以及它们的修饰衍生物或类似物,诸如7-脱氮腺嘌呤或7-脱氮鸟嘌呤。嘧啶碱基包括胞嘧啶(C)、胸腺嘧啶(T)和尿嘧啶(U)以及它们的经修饰的衍生物或类似物。脱氧核糖的C-1原子与嘧啶的N-1或嘌呤的N-9键合。
如本文所用,“核苷酸缀合物”通常是指用荧光部分标记的核苷酸,任选地通过如本文所述的裂解连接基标记。在一些实施方案中,当核苷酸络合物被描述为未标记核苷酸时,此类核苷酸不包含荧光部分。在一些另外的实施方案中,未标记的核苷酸缀合物也不具有可裂解的连接基。
如本文所用,“核苷”在结构上类似于核苷酸,但缺少磷酸部分。核苷类似物的一个示例是其中标记与碱基连接并且没有磷酸基团连接到糖分子的核苷类似物。术语“核苷”在本文中以本领域技术人员所理解的常规含义使用。示例包括但不限于包含核糖部分的核糖核苷和包含脱氧核糖部分的脱氧核糖核苷。经修饰的戊糖部分是其中氧原子已被碳取代和/或碳已被硫或氧原子取代的戊糖部分。“核苷”是可以具有取代的碱基和/或糖部分的单体。另外,核苷可以掺入较大的DNA和/或RNA聚合物和低聚物中。
术语“嘌呤碱基”在本文中以本领域技术人员所理解的普通含义使用,并且包括其互变异构体。类似地,术语“嘧啶碱基”在本文中以本领域技术人员所理解的普通含义使用,并且包括其互变异构体。任选地取代的嘌呤碱基的非限制性列表包括嘌呤、腺嘌呤、鸟嘌呤、脱氮嘌呤、7-脱氮腺嘌呤、7-脱氮鸟嘌呤、次黄嘌呤、黄嘌呤、别黄嘌呤、7-烷基鸟嘌呤(例如7-甲基鸟嘌呤)、可可碱、咖啡因、尿酸和异鸟嘌呤。嘧啶碱基的示例包括但不限于胞嘧啶、胸腺嘧啶、尿嘧啶、5,6-二氢尿嘧啶和5-烷基胞嘧啶(例如5-甲基胞嘧啶)。
如本文所用,当寡核苷酸或多核苷酸被描述为“包含”本文所述的核苷或核苷酸时,这意味着本文所述的核苷或核苷酸与寡核苷酸或多核苷酸形成共价键。类似地,当核苷或核苷酸被描述为寡核苷酸或多核苷酸的一部分,诸如“掺入到”寡核苷酸或多核苷酸中时,这意味着本文所述的核苷或核苷酸与寡核苷酸或多核苷酸形成共价键。在一些此类实施方案中,共价键在寡核苷酸或多核苷酸的3'羟基与在本文中描述为寡核苷酸或多核苷酸的3'碳原子与核苷酸的5'碳原子之间的磷酸二酯键的核苷酸的5'磷酸基团之间形成。
如本文所用,术语“可裂解的连接基”并不意在暗示需要除去整个连接基。裂解位点可以位于连接基上确保该连接基的一部分在裂解后保持连接到可检测标记和/或核苷或核苷酸部分的某个位置处。
如本文所用,“衍生物”或“类似物”意指具有修饰的碱基部分和/或修饰的糖部分的合成核苷酸或核苷衍生物。此类衍生物和类似物在例如Scheit,Nucleotide Analogs(John Wiley&Son,1980)和Uhlman等人,Chemical Reviews 90:543-584,1990中进行了讨论。核苷酸类似物还可以包括经修饰的磷酸二酯键,包括硫代磷酸酯键、二硫代磷酸酯键、烷基膦酸酯键和氨基磷酸酯键。如本文所用,“衍生物”、“类似物”和“修饰的”可互换使用,并且由本文定义的术语“核苷酸”和“核苷”涵盖。
如本文所用,含生物素部分的分子或其类似物包含结构 的生物素部分。在一些情况下,生物素部分经由接头连接到分子的剩余部分,诸如含生物素部分的分子的类似物可包括取代的生物素部分。
如本文所用,含烷基氯的分子或其类似物包含结构含烷基氯部分的分子的类似物可包括取代的烷基氯部分。
如本文所用,含二硝基苯基(DNP)部分的分子或其类似物包含结构在一些情况下,经由接头连接到分子的剩余部分,诸如含DNP部分的分子的类似物可包括取代的DNP部分。
如本文所用,含地高辛(DIG)部分的分子或其类似物包含结构或其非对映异构体,诸如在一些情况下,DIG部分经由接头连接到分子的剩余部分,诸如含DIG部分的分子的类似物可包括取代的DIG部分。
如本文所用,含β-N-乙酰葡糖胺(O-GlcNAc)部分的分子或其类似物包含结构含O-GlcNAc部分的分子的类似物可包括取代的O-GlcNAc部分。
如本文所用,含烷基鸟嘌呤部分的分子或其类似物包含结构含烷基鸟嘌呤部分的分子的类似物可包括取代的烷基鸟嘌呤部分。
如本文所用,含3-硝基酪氨酸部分的分子或其类似物包含结构含3-硝基酪氨酸部分的分子的类似物可包括取代的3-硝基酪氨酸部分。
如本文所用,抗DNP抗体是指能够与本文所述的DNP部分特异性结合的抗体。
如本文所用,抗DIG抗体是指能够与本文所述的DIG部分特异性结合的抗体。
如本文所用,小麦胚芽凝集素(WGA)是指能够与本文所述的O-GlcNAc部分结合的凝集素。
如本文所用,SNAP-Tag是指可商购获得的蛋白标签。能够与本文所述的烷基鸟嘌呤部分特异性结合。
如本文所用,是指可商购获得的蛋白标签。能够与本文所述的烷基氯部分特异性结合。
如本文所用,抗硝基酪氨酸抗体是指能够与本文所述的3-硝基酪氨酸部分特异性结合的抗体。
如本文所用,术语“磷酸盐”以本领域技术人员所理解的其普通含义使用,并且包括其质子化形式(例如,)。如本文所用,术语“单磷酸”、“二磷酸”和“三磷酸”以本领域技术人员所理解的其普通含义使用,并且包括质子化形式。
如本领域普通技术人员所理解的,本文所述的化合物(诸如核苷酸络合物)可以离子化形式存在,例如,含有-CO2-、-SO3或-O-。如果化合物包含带正电荷或带负电荷的取代基基团,则其还可以包含带负电荷或带正电荷的抗衡离子,使得该化合物整体为中性的。在其他方面,该化合物可以以盐形式存在,其中抗衡离子由共轭酸或碱提供。
如本文所用,术语“定相”是指SBS中的现象,该现象是由3'终止子和荧光团的不完全去除和/或未能通过在给定测序循环下通过聚合酶完成簇内DNA链的一部分掺入所引起的。预定相是由掺入不具有有效3'终止子的核苷酸引起的,其中掺入事件由于终止失败而提前1个周期。定相和预定相导致特定循环的测量信号强度由来自当前循环的信号以及来自前一个和后一个循环的噪声组成。随着循环的数量增加,受到定相和预定相影响的每个簇的序列分数增加,妨碍对正确碱基的识别。预定相可以由在通过合成测序(SBS)期间存在痕量的不受保护或未封端的3'-OH核苷酸引起。不受保护的3'-OH核苷酸可以在制造过程期间或可能在储存和试剂处理过程期间产生。
如本文所用,术语“序列环境效应”或“序列特异性效应”是指在合成测序(SBS)期间,如云状散点图所示的碱基强度可能受到前一序列环境影响的效应,特别是两通道SBS。这种强度调制给系统添加了噪声,并且当序列特异性强度调制将给定簇的强度朝向决策边界移位时,可导致误检出。其也称为序列特异性错误(SSE)。不受特定理论的束缚,序列特异性强度移位的一个原因是用不同染料(例如,绿色ffA和蓝色ffA)标记的完全官能化核苷酸(ffn)的差异掺入。导致荧光信号强度减弱的另一原因可能是由于前述碱基对掺入的标记核苷酸示出不同的效应(例如,淬灭或增强染料信号强度)。如本公开中所述,使用单个完全官能化核苷酸(ffN)与可在两通道中产生颜色的亲和试剂结合,可减少或消除序列特异性强度移位,并且从而提高碱基检出准确性。
试剂盒
本公开的一个方面涉及一种用于测序应用的试剂盒,该试剂盒包括:
第一类型的未标记核苷酸,该第一类型的未标记核苷酸包含第一半抗原;
第二类型的未标记核苷酸,该第二类型的未标记核苷酸包含第二半抗原;
第三类型的未标记核苷酸;以及
一组亲和试剂,该一组亲和试剂包含:
第一亲和试剂,该第一亲和试剂包含能够与该第一类型的未标记
核苷酸特异性结合的第一半抗原结合配偶体;以及
第二亲和试剂,该第二亲和试剂包含能够与该第二类型的未标记核苷酸特异性结合的第二半抗原结合配偶体;
其中该第一亲和试剂包含一个或多个第一可检测标记,该一个或多个第一可检测标记能够由第一激发光源激发,该第二亲和试剂包含一个或多个第二可检测标记,该一个或多个第二可检测标记能够由第二激发光源激发,并且其中该第一可检测标记与该第二可检测标记为光谱上可区分的;并且
其中该第一激发光源和该第二激发光源中的一者具有约450nm至约460nm的波长,并且该第一激发光源和该第二激发光源中的另一者具有约520nm至约540nm的波长;
在本文所述的试剂盒的一些实施方案中,该第一半抗原经由可裂解接头共价连接到该第一类型的未标记核苷酸的核碱基。
在本文所述的试剂盒的一些实施方案中,该第二半抗原经由可裂解接头共价连接到该第二类型的未标记核苷酸的核碱基。
两标签系统
在本文所述的试剂盒的一些实施方案中,该第三类型的未标记核苷酸包含含有该第一半抗原的该第三类型的未标记核苷酸和含有该第二半抗原的该第三类型的未标记核苷酸的混合物,并且其中该第一亲和试剂和该第二亲和试剂均能够与该第三类型的未标记核苷酸特异性结合。在又一个实施方案中,该第一半抗原和该第二半抗原中的每一者经由可裂解接头共价连接到该第三类型的核苷酸的核碱基。在又一个实施方案中,该第一半抗原包含生物素部分,并且该第一半抗原结合配偶体包含抗生物素蛋白(例如,链霉抗生物素蛋白、中性抗生物素蛋白、黄菲灵等)。在又一个实施方案中,该抗生物素蛋白是链霉抗生物素蛋白。在又一个实施方案中,该抗生物素蛋白是中性抗生物素蛋白。在又一个实施方案中,该抗生物素蛋白的一个或多个生物素结合位点被含生物素部分的分子或其类似物封端。在又一个实施方案中,该抗生物素蛋白的所有剩余生物素结合位点被含生物素部分的分子或其类似物封端。在又一个实施方案中,该第二半抗原包含二硝基苯基(DNP)部分,并且该第二半抗原结合配偶体包含抗DNP抗体。在一些此类实施方案中,该第三类型的未标记核苷酸包含含有生物素部分的第三类型的未标记核苷酸和含有DNP部分的第三类型的未标记核苷酸的混合物。在另一个实施方案中,该第二半抗原包含地高辛(DIG)部分,并且该第二半抗原结合配偶体包含抗DIG抗体。在一些此类实施方案中,该第三类型的未标记核苷酸包括含有生物素部分的第三类型的未标记核苷酸和含有DIG部分的第三类型的未标记核苷酸的混合物。
三标签系统
在本文所述的试剂盒的一些实施方案中,该第三类型的未标记核苷酸包含第三半抗原,并且该一组亲和试剂还包含第三亲和试剂,该第三亲和试剂包含能够与该第三半抗原特异性结合的第三半抗原结合配偶体。在又一个实施方案中,该第三半抗原经由可裂解接头共价连接到该第三类型的未标记核苷酸的核碱基。在又一个实施方案中,该第一半抗原包含生物素部分,并且该第一半抗原结合配偶体包含抗生物素蛋白。在又一个实施方案中,该抗生物素蛋白是链霉抗生物素蛋白。在又一个实施方案中,该抗生物素蛋白是中性抗生物素蛋白。在又一个实施方案中,该抗生物素蛋白的一个或多个生物素结合位点被含生物素部分的分子或其类似物封端。在其他另外的实施方案中,该抗生物素蛋白的所有剩余生物素结合位点被含生物素部分的分子或其类似物封端。在一些此类实施方案中,该第二半抗原和该第三半抗原中的一者包含DNP部分,并且该第二半抗原和该第三半抗原中的另一者包含DIG部分。在另一个实施方案中,该第一半抗原和该第二半抗原中的一者包含DNP部分,并且该第一半抗原和该第二半抗原中的另一者包含DIG部分。在一些此类实施方案中,该第三半抗原包含生物素部分,并且该第三半抗原结合配偶体包含抗生物素蛋白。在又一个实施方案中,该抗生物素蛋白是链霉抗生物素蛋白。在又一个实施方案中,该抗生物素蛋白是中性抗生物素蛋白。在又一个实施方案中,该抗生物素蛋白的一个或多个生物素结合位点被含生物素部分的分子或其类似物封端。在其他另外的实施方案中,该抗生物素蛋白的所有剩余生物素结合位点被含生物素部分的分子或其类似物封端。在又一个实施方案中,该第三亲和试剂包含一个或多个第一可检测标记和一个或多个第二可检测标记。
在一些实施方案中,通过可检测标记的官能团与半抗原结合配偶体(例如,蛋白标签或抗体)的官能团反应,可检测标记共价连接到亲和试剂。例如,可检测标记的羧基基团可与半抗原结合配偶体的氨基基团(例如,蛋白或抗体的氨基酸部分的氨基基团)反应以形成酰胺键。在一个示例中,一种或多种荧光染料共价连接到蛋白/抗体(例如,链霉抗生物素蛋白)上的一个或多个赖氨酸部分。在一些实施方案中,通过比较蛋白/抗体的吸收波长(例如,280nm处的吸光度)与可检测标记(例如,荧光染料)的比率来测量蛋白/抗体上的可检测标记的平均数。在一些实施方案中,第一可检测标记与第二可检测标记的平均摩尔比可介于约10:1、9.5:1、9:1、8.5:1、8:1、7.5:1、7:1、6.5:1、6:1、5.5:1、5:1、4.5:1、4:1、3.5:1、3:1、2.5:1、2:1、1.5:1、1:1、1:1.5、1:2、1:2.5、1:3、1:3.5、1:4、1.4.5、1:5、1:5.5、1:6、1:6.5、1:7、1:7.5、1:8、1:8.5、1:9、1:9.5和1:10之间。在又一个实施方案中,第三亲和试剂包括如本文所述的多染料标记的蛋白组装系统。
除了本文导电的生物素-抗生物素蛋白(例如链霉抗生物素蛋白或中性抗生物素蛋白)、DNP/抗DNP和DIG/抗DIG配对之外,其他半抗原和半抗原结合配偶体也可用于本文所述的两标签系统或三标签系统。表1列出了半抗原和半抗原结合配偶体的非限制性示例。
表1.半抗原和半抗原结合配偶体的例示性示例。
在本文所述的试剂盒的任何实施方案中,亲和试剂混合物中每个亲和试剂(例如,标记的蛋白标签或标记的抗体)的浓度可独立地在约0.01μM至约1μM、约0.02μM至约0.5μM或约0.05μM至约0.25μM的范围内。在另外的实施方案中,亲和试剂的浓度可独立地为约0.01μM、0.02μM、0.03μM、0.04μM、0.05μM、0.06μM、0.07μM、0.08μM、0.09μM、0.11μM、0.12μM、0.13μM、0.14μM、0.15μM、0.16μM、0.17μM、0.18μM、0.19μM、0.20μM、0.22μM、0.24μM、0.26μM、0.28μM、0.30μM、0.35μM、0.40μM、0.45μM或0.50μM或由任何两个前述值限定的范围。
在本文所述的试剂盒的任何实施方案中,该试剂盒还包括第四类型的未标记核苷酸,其中该第四类型的未标记核苷酸不能与任何该亲和试剂特异性结合。在又一个实施方案中,该第四类型的未标记核苷酸不能由第一光源或第二光源激发。
在本文所述的试剂盒的任何实施方案中,该第一类型的未标记核苷酸、该第二类型的未标记核苷酸、该第三类型的未标记核苷酸和该第四类型的未标记核苷酸中的每一者都包含如本文所述的3'封端基团。例如,3'封端基团可为连接到核苷酸的3'氧的叠氮甲基(—CH2N3)。又如,3'封端基团可为连接到核苷酸的3'碳的—OCH2OCH2CH=CH2(AOM)。又如,3'封端基团可为连接到核苷酸的3'氧的烯丙基基团(—CH2CH=CH2)。
在本文所述的试剂盒的任何实施方案中,该第一半抗原、该第二半抗原或该第三半抗原中的任何一者或多者可经由本文所述的可裂解接头共价连接到该核苷酸。在一些实施方案中,可裂解接头可含有一个或多个叠氮基部分、一个或多个烯丙基部分或它们的组合。接头还可含有间隔区,诸如PEG。在另外的实施方案中,可裂解接头可在与3'封端基团相同的反应条件下被裂解。
在本文所述的试剂盒的任何实施方案中,试剂盒还可包含DNA聚合酶和一种或多种缓冲液组合物。在另外的实施方案中,试剂盒可包括非暗G的一种或多种未标记核苷酸。例如,试剂盒可包括一种或多种未标记T核苷酸以减弱绿色T信号。替代性地或另外地,试剂盒可包括一种或多种标记核苷酸,其中标记的核苷酸可含有不能由第一光源或第二光源激发的荧光标记。
可检测标签
A.蛋白组装系统
本公开的一个方面涉及蛋白组装系统,该蛋白组装系统包含:
第一蛋白,该第一蛋白用一个或多个第一可检测标记来标记;
一个或多个含半抗原的接头,该一个或多个含半抗原的接头共价连接到该第一蛋白;以及
一个或多个半抗原结合的第二蛋白,该一个或多个半抗原结合的第二蛋白与一个或多个含半抗原的接头结合;
其中该一个或多个半抗原结合的第二蛋白用一个或多个第二可检测标记来标记,并且其中该一个或多个第一可检测标记与该一个或多个第二可检测标记为光谱上可区分的。
在本文所述的蛋白组装系统的一些实施方案中,该一个或多个半抗原结合的第二蛋白与该一个或多个含半抗原的接头经由非共价相互作用结合;在其他实施方案中,该一个或多个半抗原结合的第二蛋白与该一个或多个含半抗原的接头经由共价相互作用结合;在一些另外的实施方案中,该一个或多个含半抗原的接头是含生物素部分的接头,并且该一个或多个半抗原结合的第二蛋白是生物素结合蛋白。在又一个实施方案中,该一个或多个半抗原结合的第二蛋白包含抗生物素蛋白。在又一个实施方案中,该抗生物素蛋白是链霉抗生物素蛋白。在又一个实施方案中,该抗生物素蛋白是中性抗生物素蛋白。在又一个实施方案中,该抗生物素蛋白的一个或多个生物素结合位点被含生物素部分的分子或其类似物封端。在又进一步实施方案中,该抗生物素蛋白的所有剩余生物素结合位点被含生物素部分的分子或其类似物封端。
在本文所述的蛋白组装系统的一些实施方案中,该第一蛋白包含抗体。在另外的实施方案中,该抗体是抗DNP抗体或抗DIG抗体。
在本文所述的蛋白组装系统的一些实施方案中,该一个或多个第一可检测标记能够由蓝光激发,并且该一个或多个第二可检测标记能够由绿光激发。在一些此类实施方案中,该一个或多个第一可检测标记包括或选自具有如本文所述的式(I)的结构的香豆素染料。在另一个实施方案中,该一个或多个第一可检测标记能够由绿光激发,并且该一个或多个第二可检测标记能够由蓝光激发。在另外的实施方案中,该蓝光具有约450nm至约460nm的波长。在另外的实施方案中,该绿光具有约520nm至约540nm(例如,约532nm)的波长。
在本文所述的蛋白组装系统的一些实施方案中,该第一蛋白用多个第一可检测标记来标记。在另外的实施方案中,该第一蛋白用至少三种、至少四种、至少五种、至少六种、至少七种、至少八种、至少九种或至少十种第一可检测标记来标记。
在蛋白组装系统的一些实施方案中,其中该系统包括至少两种生物素结合蛋白(例如,三种生物素结合蛋白),每种生物素结合蛋白用多个第二可检测标记来标记。在另外的实施方案中,每种生物素结合蛋白用至少三种、至少四种、至少五种、至少六种、至少七种、至少八种、至少九种或至少十种第二可检测标记来标记。在另外的实施方案中,该生物素结合蛋白中的一种或多种生物素结合蛋白可包含抗生物素蛋白。在又一个实施方案中,该抗生物素蛋白是链霉抗生物素蛋白。在又一个实施方案中,该抗生物素蛋白是中性抗生物素蛋白。
在蛋白组装系统的一些实施方案中,该含生物素部分的接头包含PEG重复单元(—OCH2CH2—)n,其中n是2至30的整数。在一些实施方案中,n是5、6、7、8、9、10、11、12、13、14或15。
图1示意性地示出了根据本公开的实施方案的双蛋白组装系统。第一蛋白可为具有一个或多个第一可检测标记的抗体(例如,抗DNP或抗DIG抗体)。第一可检测标记可包括例如第一染料部分。第一蛋白可用一个、两个、三个、四个、五个、六个、七个、八个、九个、十个、十一个、十二个、十三个、十四个或十五个可检测标记来标记,尽管在一些实施方案中,可包括更多的可检测标记。一个或多个含半抗原的接头可为含生物素部分的接头。一个或多个含生物素的接头可共价连接到第一蛋白。例如,一个、两个、三个、四个、五个、六个、七个、八个、九个或十个含生物素部分的接头可共价连接到第一蛋白,尽管在一些实施方案中,更多的生物素接头可连接到第一蛋白/抗体。一个或多个半抗原结合的第二蛋白可包括一个或多个第二可检测标记。例如,根据本实施方案,一个或多个半抗原结合的第二蛋白可包含或为抗生物素蛋白分子,例如链霉抗生物素蛋白或中性抗生物素蛋白。第二可检测标记可包括第二染料部分。第一染料部分和第二染料部分可具有不同的激发和荧光发射波长,使得第一染料部分的发射荧光与第二染料部分的发射荧光为光谱上可区分的。在一些实施方案中,第一可检测标记可包含“蓝色染料”,其能够由波长在约450nm至约460nm之间的蓝色光源激发。在一些另外的实施方案中,第二可检测标记可包含“绿色染料”,其可由波长在约520nm至约540nm之间的绿色光源激发。标记的抗生物素蛋白分子可被引入并结合到生物素部分,该生物素部分含有连接到第一蛋白/抗体的接头。因此,蛋白组装系统可包括多个第一可检测标记和多个第二可检测标记。在另外的实施方案中,第一蛋白/抗体与第二蛋白(例如,抗生物素蛋白/链霉抗生物素蛋白/中性抗生物素蛋白)的摩尔比可介于约10:1、9:1、8:1、7:1、6:1、5:1、4:1、3:1、2:1、1:1、1:2、1:3、1:4、1:5、1:6、1:7、1:8、1:9和1:10之间。在一些实施方案中,第一蛋白/抗体与第二蛋白的摩尔比通过制备蛋白组装系统的反应中每种组分的摩尔量来计算。在一个实施方案中,第一蛋白/抗体(例如,抗DNP)与链霉抗生物素蛋白的摩尔比为约1:3。在另外的实施方案中,抗DNP平均用约或至少约2、2.5、3、3.5、4、4.5、5、5.5、6、6.5、7、7.5、8、8.5、9、9.5或10种蓝色染料或绿色染料标记。在另外的实施方案中,每种链霉抗生物素蛋白平均用约或至少约2、2.5、3、3.5、4、4.5、5、5.5、6、6.5、7、7.5、8、8.5、9、9.5或10种绿色染料或蓝色染料标记。在其他另外的实施方案中,用含生物素部分的分子或其类似物封端双蛋白组装系统中链霉抗生物素蛋白的剩余生物素结合位点,使得双蛋白组装系统仅能够与含DNP部分的核苷酸特异性结合。
本公开的一个方面涉及包含本文所述的蛋白组装系统的核苷酸络合物。在一些实施方案中,该核苷酸经由非共价相互作用与该蛋白组装系统缀合。在又一个实施方案中,该蛋白组装系统与该核苷酸的半抗原部分结合,并且该核苷酸的该半抗原部分能够与该蛋白组装系统的该蛋白中的至少一种蛋白特异性结合。在又进一步实施方案中,该核苷酸的该半抗原部分包含DIG部分或DNP部分。在又一个实施方案中,该核苷酸的该半抗原部分经由可裂解接头共价连接到核碱基。
本公开的另一个方面涉及包含本文所述的核苷酸络合物的寡核苷酸或多核苷酸。在又一个实施方案中,该寡核苷酸或多核苷酸与固定在固体载体的表面上的靶多核苷酸至少部分地互补并杂交。在又一个实施方案中,固体载体包含多种不同的固定的靶多核苷酸,其中固定的靶多核苷酸(即簇)在固体载体上的的密度为约或至少约50,000/mm2、100,000/mm2、150,000/mm2、200,000/mm2、250,000/mm2、300,000/mm2、350,000/mm2或400,000/mm2。
B.标记的抗生物素蛋白
本公开的一些方面涉及用作本文所述亲和试剂或用作本文所述的蛋白组装系统的一部分的标记的抗生物素蛋白。具体地讲,该标记的抗生物素蛋白可为多染料标记的链霉抗生物素蛋白或中性抗生物素蛋白,其中该抗生物素蛋白的至少一个生物素结合位点被含生物素部分的分子或其类似物封端,并且其中该标记的抗生物素蛋白包含至少一个(或仅一个)开放的生物素结合位点(即,用于与该蛋白组装系统的该含生物素部分的核苷酸或含生物素部分的接头结合)。
在本文所述的该标记的抗生物素蛋白(例如链霉抗生物素蛋白或中性抗生物素蛋白)的一些实施方案中,该抗生物素蛋白的一至三个生物素结合位点被该含生物素部分的分子或其类似物封端。在一些实施方案中,该抗生物素蛋白的一个生物素结合位点被该含生物素部分的分子或其类似物封端。在一些实施方案中,该抗生物素蛋白的两个生物素结合位点被该含生物素部分的分子或其类似物封端。在一些实施方案中,该抗生物素蛋白的三个生物素结合位点被该含生物素部分的分子或其类似物封端。在一些实施方案中,其中该含生物素部分的分子或其类似物是未共价连接到核苷酸或核苷的游离分子。例如,含生物素部分的分子或其类似物可包含游离生物素生物素-TEG,双生物素,PC生物素,脱硫生物素-TEG,生物素叠氮化物,或它们的组合。在其他实施方案中,该含生物素部分的分子或其类似物包含共价连接到核苷酸或核苷的生物素部分,任选地经由接头(例如,可裂解接头)连接。在本文所述的标记的抗生物素蛋白的一些实施方案中,抗生物素蛋白用两种至八种荧光染料部分标记。在一些实施方案中,抗生物素蛋白用两种荧光染料部分标记。在一些实施方案中,抗生物素蛋白用五种至七种荧光染料部分标记。
在本文所述的标记的抗生物素蛋白的一些实施方案中,荧光染料部分是相同的和/或光谱不可区分的。在一些实施方案中,该抗生物素蛋白的该荧光染料部分可由波长在约400nm至约650nm之间的光源激发。例如,光源可具有约400nm、410nm、420nm、430nm、440nm、445nm、450nm、455nm、460nm、465nm、470nm、480nm、490nm、500nm、510nm、515nm、520nm、525nm、530nm、535nm、540nm、545nm、550nm、560nm、570nm、580nm、590nm、600nm、610nm、620nm、630nm、640nm或650nm的波长、或由任何两个前述值限定的范围。例如,波长在下列范围中的任何一者:约440-470nm、约450-460nm、约510-545nm、515-540nm、520-535nm或525-535nm。在一些另外的实施方案中,该荧光染料部分可由波长介于约450nm至约460nm之间,或介于约520nm至约535nm之间的光源激发。
关于标记的抗生物素蛋白的更多细节可在美国申请号18/190330中找到,该申请以引用方式并入本文。
C.可解聚的标记的纳米颗粒
本公开的另一个方面涉及一种标记的纳米颗粒,该标记的纳米颗粒包括:
聚合物基质,该聚合物基质包含多个可检测标记,其中聚合物的骨架包含一个或多个可裂解部分,并且其中该标记的纳米颗粒在该可裂解部分裂解后能够降解成较小的聚合链。
在本文所述的标记的纳米颗粒的一些实施方案中,该多个可检测标记包含或为能够由波长介于约400nm至约650nm、约420nm至约600nm、或约450nm至约550nm波长之间的光源激发的荧光团。
在本文所述的标记的纳米颗粒的一些实施方案中,该多个可检测标记为能够由波长介于约450nm至约460nm波长之间的光源激发的荧光团。
在本文所述的标记的纳米颗粒的一些实施方案中,降解的纳米颗粒的该较小聚合链是水溶性的。
在本文所述的标记的纳米颗粒的一些实施方案中,该可裂解部分是可化学降解的、可酶促降解的、可热降解的或可光降解的。
在本文所述的标记的纳米颗粒的一些实施方案中,该可裂解部分包含二硫化物、叠氮基或烯丙基部分、或它们的组合。
在本文所述的标记的纳米颗粒的一些实施方案中,该聚合物包含交联或树枝状聚合物或脂质体。
在本文所述的标记的纳米颗粒的一些实施方案中,该聚合物包含聚丙烯酰胺、聚乙醇酸(PGA)、聚乙烯醇(PVA)。
在本文所述的标记的纳米颗粒的一些实施方案中,该多个可检测标记共价连接到该聚合物基质。
在本文所述的标记的纳米颗粒的一些实施方案中,该多个可检测标记被包封或物理限制在该聚合物基质内。
在本文所述的标记的纳米颗粒的一些实施方案中,该标记的纳米颗粒还包含连接到其上的一种或多种蛋白。
随着SBS中使用的图案化流通池的孔密度增加,孔的尺寸减小。这为模板链留下了更少的区域。由于先前的ffn已经与每碱基一个荧光团缀合,每孔的荧光信号也降低了。
如本文所讨论的,有可能将ffN与半抗原缀合,并流入具有一个或多个掺入的荧光团的对应的半抗原结合配偶体中。在一些实施方案中,结合配偶体本身与纳米颗粒或量子点缀合,一个或多个掺入的荧光团与该纳米颗粒或量子点缀合。然而,这些纳米颗粒可能仍然吸附在流通池的DNA簇上,甚至在洗涤步骤之后,产生高背景荧光。可解聚的纳米颗粒可更容易地从DNA簇中洗涤。
图2A示意性地示出了非可解聚的纳米颗粒,而图2B示意性地示出了根据本实施方案的示例性可解聚的荧光纳米颗粒。每个纳米颗粒可包括聚合物基质。另外,纳米颗粒可包括配体结合蛋白(即半抗原结合配偶体),纳米颗粒可经由该配体结合蛋白结合一种或多种染料标记的分子。在替代性实施方案中,染料标记可共价连接到纳米颗粒。与普通的纳米颗粒不同,可解聚的荧光纳米颗粒的聚合物基质可包括可裂解部分。在图2B所示的示例中,可裂解部分可为二硫键。如果在SBS期间,合适的裂解混合物被引入到可解聚的荧光纳米颗粒,则纳米颗粒可分解成小的可溶链,该小的可溶性链可被洗涤掉。
尽管图2B描绘了包括二硫键的纳米颗粒,但是在可解聚的纳米颗粒中可使用其他可裂解键。在一些实施方案中,二硫键可被还原剂裂解。在一些实施方案中,烯丙基键可被Pd(0)络合物(例如,三(3,3',3"-次膦基三(苯磺酸基)钯(0)九钠盐九水合物),或本文所述的用于裂解3'封端基团/可裂解接头的相同钯裂解试剂裂解。在一些实施方案中,叠氮甲基键可被三(2-羧乙基)膦(TCEP)或三(羟丙基)膦(THP或THPP)裂解。在一些实施方案中,二醇键可被NaIO4裂解。在一些实施方案中,聚乙醇酸键可被H2O或具有酯酶活性的酶裂解。在一些实施方案中,聚乙烯醇(PVA)键可通过加热、酶促作用或氧化而裂解。在一些实施方案中,酯键可通过水解、加热或碱性条件而裂解。在一些实施方案中,光可裂解键可通过暴露于UV光而裂解。在一些实施方案中,纳米颗粒可包括聚合物泡囊。聚合物泡囊在特定的pH范围下可能够被表面活性剂和/或水解降解。在一些实施方案中,纳米颗粒可包括脂质体。脂质体可在特定的pH范围下能够被表面活性剂、特定的温度范围和/或通过水解降解。可使用其他合适的可裂解键。
荧光染料
各种荧光染料可在本公开中用作本文所述的亲和试剂的可检测标记,特别是那些可由蓝光或绿光激发的染料。这些染料也可以分别称为“蓝色染料”和“绿色染料”。各种类型的蓝色染料的示例,包括但不限于香豆素染料、色喹啉染料、萘酰亚胺染料和含双硼杂环化合物,公开于美国专利公布号2018/0094140、2018/0201981、2020/0277529、2020/0277670、2021/0188832和2022/0033900,以及美国序列号17/550271、17/736688、18/190531、63/356412和63/492896中,这些文献中的每一篇均全文以引用方式并入。蓝色染料的非限制性示例包括:
(香豆素染料A)、(香豆素染料C)和(香豆素染料D),及其盐、液晶形式和任选地取代的类似物。例如,在烷基基团上具有-SO3H取代的类似物。
绿色染料的示例包括国际专利公布号WO2013/041117、WO2014/135221、WO2016/189287、WO2017/051201和WO2018/060482A1中公开的花青或多甲川染料,这些文献中的每一篇均全文以引用方式并入。绿色染料的非限制性示例包括:
(花青染料B)、及其盐、液晶形式和任选地取代的类似物。
在一些实施方案中,本文所述的荧光染料可被进一步修饰以引入一个或多个取代基(例如-SO3H、-OH、-C(O)OH、-C(O)OR,其中R是未取代的或取代的C1-C6烷基)以在染料与本文所述的抗体/蛋白(即半抗原结合配偶体)缀合时提高染料的亲水性,同时保持染料的信号强度。在一些此类实施方案中,在本公开的试剂盒和蛋白组装系统中描述的第一可检测标记可为具有式(I)的结构的香豆素染料:
其中m是1、2或3的整数;
n是1、2、3、4或5的整数;
R1是-C(O)OC1-C6烷基、-SO3H、-OH、任选地取代的5至10元杂芳基、任选地取代的3至10元杂环基、任选地取代的苯基、或-ORx,其中Rx是任选地取代的5至10元杂芳基、任选地取代的3至10元杂环基、或任选地取代的苯基。在一些实施方案中,m是1。在一些实施方案中,n是1。在一些其他实施方案中,n是3。在另外的实施方案中,m是1并且n是3。在一个实施方案中,R1是-C(O)OtBu。在另一个实施方案中,R1是-SO3H。在另一个实施方案中,R1是呋喃基(例如2-呋喃基)。在另一个实施方案中,R1是香豆素染料的另外的非限制性实施方案包括:
当染料与亲和试剂(例如,抗生物素蛋白、蛋白或抗体)形成共价键时,染料的羧基基团可与亲和试剂的氨基官能团反应以形成酰胺键。例如,式(I)的染料包含与亲和试剂共价结合后的部分
3'封端基团
本文所述的核苷酸还可具有共价连接到核苷酸的脱氧核糖的3'封端基团。在WO2002/029003、WO2004/018497和WO2014/139596中公开了各种3'封端基团。例如,封端基团可为叠氮甲基(-CH2N3)或取代的叠氮甲基(例如,-CH(CHF2)N3或CH(CH2F)N3)、或烯丙基,各自连接至脱氧核糖部分的3'氧原子。在一些实施方案中,3'封端基团为叠氮甲基,与核糖或脱氧核糖的3'碳形成3'-OCH2N3。
附加的3′封端基团公开于美国公开2020/0216891A1中,该公开全文以引用方式并入。缩醛封端基团的非限制性示例为(AOM)、
各自共价连接到脱氧核糖的3'碳。
3'封端基团的脱保护
在一些实施方案中,可通过使用水溶性膦试剂除去或脱保护3'羟基保护基团,诸如叠氮甲基以生成游离的3'-OH。非限制性示例包括三(羟甲基)膦(THMP)、三(羟乙基)膦(THEP)或三(羟丙基)膦(THP或THPP)。本文所述的3'-缩醛封端基团可以在各种化学条件下去除或裂解。对于含有烯丙基部分的3'封端基团,非限制性裂解条件包括在膦配体,例如三(羟甲基)膦(THMP)或三(羟丙基)膦(THP或THPP)的存在下的Pd(II)络合物,诸如Pd(OAc)2或烯丙基氯化Pd(II)二聚体。对于含有炔基基团(例如,乙炔基)的那些封端基团,其也可以通过在膦配体(例如,THP或THMP)的存在下的Pd(II)络合物(例如,Pd(OAc)2或烯丙基氯化Pd(II)二聚体)去除。
钯裂解试剂
在一些其他实施方案中,如本文所述的3′封端基团诸如烯丙基或AOM可以被钯催化剂裂解。在一些此类实施方案中,Pd催化剂是水溶性的。在一些此类实施方案中,为Pd(0)络合物(例如,三(3,3',3"-次膦基三(苯磺酸基)钯(0)九钠盐九水合物)。在一些情况下,Pd(0)络合物可以通过试剂诸如烯烃、醇、胺、膦或金属氢化物还原Pd(II)络合物而原位生成。合适的钯源包括Na2PdCl4、Li2PdCl4、Pd(CH3CN)2Cl2、(PdCl(C3H5))2、[Pd(C3H5)(THP)]Cl、[Pd(C3H5)(THP)2]Cl、Pd(OAc)2、Pd(Ph3)4、Pd(dba)2、Pd(Acac)2、PdCl2(COD)、Pd(TFA)2、Na2PdBr4、K2PdBr4、PdCl2、PdBr2和Pd(NO3)2。在一个此类实施方案中,Pd(0)络合物由Na2PdCl4或K2PdCl4原位产生。在另一个实施方案中,钯源是烯丙基氯化钯(II)二聚体[(PdCl(C3H5))2]。在一些实施方案中,Pd(0)络合物通过将Pd(II)络合物与膦混合而在水溶液中产生。合适的膦包括水溶性膦,诸如三(羟丙基)膦(THP)、三(羟甲基)膦(THMP)、1,3,5-三氮杂-7-磷杂金刚烷(PTA)、双(对磺酸基苯基)苯基膦二水合物钾盐、三(羧乙基)膦(TCEP)和三苯基膦-3,3',3"-三磺酸三钠盐。
在一些实施方案中,钯催化剂通过将[(烯丙基)PdCl]2与THP原位混合来制备。[(烯丙基)PdCl]2与THP的摩尔比可以为约1:1、1:1.5、1:2、1:2.5、1:3、1:3.5、1:4、1:4.5、1:5、1:5.5、1:6、1:6.5、1:7、1:7.5、1:8、1:8.5、1:9、1:9.5或1:10。在一个实施方案中,[(烯丙基)PdCl]2和THP的摩尔比为1:10。在一些其他实施方案中,钯催化剂通过将水溶性Pd试剂诸如Na2PdCl4或K2PdCl4与THP原位混合来制备。Na2PdCl4或K2PdCl4与THP的摩尔比可以为约1:1、1:1.5、1:2、1:2.5、1:3、1:3.5、1:4、1:4.5、1:5、1:5.5、1:6、1:6.5、1:7、1:7.5、1:8、1:8.5、1:9、1:9.5或1:10。在一个实施方案中,Na2PdCl4或K2PdCl4与THP的摩尔比为约1:3。在另一个实施方案中,Na2PdCl4或K2PdCl4与THP的摩尔比为约1:3.5。在另一个实施方案中,Na2PdCl4或K2PdCl4与THP的摩尔比为约1:2.5。在一些另外的实施方案中,可以添加一种或多种还原剂,诸如抗坏血酸或其盐(例如,抗坏血酸钠)。在一些实施方案中,裂解混合物可以含有另外的缓冲液试剂,诸如伯胺、仲胺、叔胺、碳酸盐、磷酸盐或硼酸盐,或它们的组合。在一些另外的实施方案中,缓冲液试剂包括乙醇胺(EA)、三(羟甲基)氨基甲烷(Tris)、甘氨酸、碳酸钠、磷酸钠、硼酸钠、2-二甲基乙醇胺(DMEA)、2-二乙基乙醇胺(DEEA)、N,N,N',N'-四甲基乙二胺(TEMED)或N,N,N',N'-四乙基乙二胺(TEEDA)或2-哌啶乙醇(也称为(2-羟乙基)哌啶,具有结构),或它们的组合。在一个实施方案中,缓冲液试剂包括DEEA,或为DEEA。在另一个实施方案中,缓冲液试剂包括或为(2-羟乙基)哌啶。在另一个实施方案中,缓冲剂含有一种或多种无机盐,诸如碳酸盐、磷酸盐或硼酸盐,或它们的组合。在一个实施方案中,无机盐为钠盐。
可裂解的连接基
在一些实施方案中,本文所述的核苷酸的半抗原部分经由可裂解接头共价连接到核苷酸的核碱基。使用术语“可裂解的连接基”并不意在暗示需要除去整个连接基。裂解位点可以位于连接基上确保该连接基的一部分在裂解后保持连接到染料和/或底物部分的某个位置处。以非限制性示例的方式,可裂解的连接基可以是亲电可裂解的连接基、亲核可裂解的连接基、可光裂解的连接基、在还原条件下可裂解的(例如含有二硫化物或叠氮化物的连接基)、在氧化条件下可裂解的、通过使用安全捕获连接基可裂解的,以及通过消除机制可裂解的。使用可裂解的连接基将染料化合物连接到底物部分确保了如果需要的话,可以在检测后移除标记,从而避免下游步骤中的任何干扰信号。
可用的连接基基团可以见于PCT公开WO2004/018493(以引用方式并入本文)中,其示例包括可以使用水溶性膦或由过渡金属和至少部分水溶性的配体形成的水溶性过渡金属催化剂裂解的连接基。在水性溶液中,后者形成至少部分水溶性的过渡金属络合物。此类可裂解的连接基可以用于将核苷酸的碱基连接到标记,诸如本文所示的染料。
特定的连接基包括PCT公开WO2004/018493(以引用方式并入本文)中所公开的那些,诸如包括下式的部分的那些:
(其中X选自包括O、S、NH和NQ的组,其中Q为C1-10取代或未取代的烷基基团,Y选自包括O、S、NH和N(烯丙基)的组,T为氢或C1-C10取代或未取代的烷基基团,并且*指示所述部分与核苷酸或核苷的其余部分连接的位置)。在一些方面,连接基将核苷酸的碱基连接到标记,诸如,本文所述的染料化合物。
连接基的附加示例包括美国公开2016/0040225(以引用方式并入本文)中所公开的那些,诸如包括下式的部分的那些:
(其中*指示所述部分与核苷酸或核苷的其余部分连接的位置)。本文所展示的连接基部分可以包括核苷酸/核苷与标记之间的全部或部分连接基结构。
接头的其他示例公开于美国专利公布号2020/0216891A1中,该文献全文以引用方式并入:
其中B是核碱基;n是1、2、3、4、5;k是1;Z是–N3(叠氮基)、–O-C1-C6烷基、–O-C2-C6烯基或–O-C2-C6炔基;并且Hap包含本文所述的半抗原部分,该染料部分可含有额外接头结构。本领域普通技术人员理解,本文所述的半抗原部分通过半抗原化合物的官能团(例如羧基)与接头的官能团(例如氨基)反应而与接头共价结合。在一个实施方案中,可裂解连接基包含(“AOL”连接基部分),其中Z为–O-烯丙基。为了本公开的目的,核苷酸可含有多个可裂解接头重复单元(例如,k是1、2、3、4、5、6、7、8、9或10)。
半抗原部分可例如通过接头连接到核苷酸碱基上的任何位置。在特定实施方案中,仍然可以对所得的类似物进行Watson-Crick碱基配对。特定的核碱基标记位点包括嘧啶碱基的C5位置或7-脱氮嘌呤碱基的C7位置。如上所述,接头基团可用于将染料共价连接到核苷酸。
在特定实施方案中,未标记的核苷酸可为可酶促掺入的和可酶促延伸的。因此,连接基部分可以具有足够的长度以将核苷酸连接到化合物,使得该化合物不显著干扰核酸复制酶对核苷酸的总体结合与识别。因此,接头还可包含间隔单元,诸如一个或多个PEG单元(-OCH2CH2-)n,其中n是1至20的整数,例如1、2、3、4、5、6、7、8、9、10、11、12、13、14或15。间隔区距离为例如核苷酸碱基距裂解位点或标记的距离。
本文所述的含半抗原的未标记核苷或核苷酸的可具有下式:
其中Hap是本文所述的半抗原部分;B为核碱基,诸如尿嘧啶、胸腺嘧啶、胞嘧啶、腺嘌呤、7-脱氮腺嘌呤、鸟嘌呤、7-脱氮鸟嘌呤等;L为可以存在或可以不存在的任选的连接基;R'可以为H,或-OR'为单磷酸根、二磷酸根、三磷酸根、硫代磷酸根、磷酸酯类似物、连接至反应性含磷基团的–O–,或者被封端基团保护的–O–;R”是H或OH;并且R”'是H、本文所述的3'羟基封端基团,或-OR”'形成亚磷酰胺。其中-OR”'是亚磷酰胺,R'是酸可裂解的羟基保护基团,其允许随后在自动化合成条件下进行单体偶联。在一些另外的实施方案中,B包括 或它们的任选地取代的衍生物和类似物。在一些另外的实施方案中,核碱基包括结构
在另一个替代性的实施方案中,戊糖的3'碳上不存在封端基团,并且经由接头连接到碱基的标记的抗生物素蛋白例如可具有足以充当掺入另外的核苷酸的障碍的尺寸或结构。因此,该障碍可归因于空间位阻或可归因于尺寸、电荷和结构的组合,无论染料是否连接到糖的3'位置。
使用封端基团允许对聚合进行控制,诸如当掺入未标记核苷酸时通过停止延伸来控制。如果封端效应是可逆的,例如,以非限制性示例的方式,则通过改变化学条件或通过除去化学障碍,可以在某些点处停止延伸,然后允许其继续。
在一个特定实施方案中,接头(在半抗原部分和核苷酸之间)和封端基团两者均存在并且为单独的部分。在特定实施方案中,连接基和封端基团在相同或基本上类似的条件下都是可裂解的。因此,脱保护和脱封闭过程可能更有效,因为只需要单一处理就可以除去染料化合物和封闭基团这两者。然而,在一些实施方案中,连接基和封端基团不需要可在类似条件下裂解,而是可在不同条件下单独裂解。
如本文所述的非限制性示例性未标记核苷酸包括:
其中L表示接头,包括本文所述的可裂解接头;R表示如上所述的核糖或脱氧核糖部分,或具有被单磷酸、二磷酸或三磷酸取代的5'位置的核糖或脱氧核糖部分;Hap表示本文所述的半抗原部分。
在一些实施方案中,含有经由可裂解接头共价连接的半抗原部分的非限制性示例性未标记核苷酸如下所示:
其中PG代表本文所述的3′封端基团;p为1、2、3、4、5、6、7、8、9或10的整数;并且m为0、1、2、3、4或5。在一个实施方案中,–O–PG为AOM。在另一个实施方案中,–O–PG为–O–叠氮甲基。在一个实施方案中,k为5。在一些另外的实施方案中,p为1、2或3;并且m为5。是指作为接头部分的氨基基团与半抗原的羧基基团之间的反应的结果的半抗原部分与可裂解接头的连接点。在另外的实施方案中,核苷酸可经由多于一个相同的可裂解接头(诸如LN3-LN3、sPA-sPA、AOL-AOL)连接到半抗原部分。在其他实施方案中,核苷酸可经由两个或更多个不同的可裂解接头(诸如sPA-LN3、sPA-sPA-LN3、sPA-LN3-LN3等)连接到半抗原部分。在本文所述的标记的核苷酸的任何实施方案中,核苷酸为核苷酸三磷酸。在另外的实施方案中,核苷酸具有2'脱氧核糖。
测序方法
本公开的额外方面涉及一种用于并行确定多种不同靶多核苷酸的序列的方法,该方法包括:
(a)使固体载体在杂交条件下与包含测序引物的溶液接触,其中所述固体载体包含多个固定在其上的不同靶多核苷酸;并且所述测序引物与所述靶多核苷酸的至少一部分互补;
(b)使该固体载体在适用于DNA聚合酶介导的引物延伸的条件下与包含DNA聚合酶和四种不同类型的未标记核苷酸中的一种或多种未标记核苷酸(例如,含有A、C、G、T或U的掺入混合物)的水溶液接触,并将一种类型的核苷酸掺入到该测序引物中以产生延伸的拷贝多核苷酸;其中
该四种类型的核苷酸中的每种类型的核苷酸包含3'封端基团;
第一类型的未标记核苷酸包含第一半抗原;
第二类型的未标记核苷酸包含第二半抗原;
(c)使该延伸的拷贝多核苷酸与一组亲和试剂在其中一种亲和试剂特异性地结合所掺入的未标记核苷酸的条件下接触,以提供标记的延伸拷贝多核苷酸;
(d)对该固体载体进行成像并对该延伸的拷贝多核苷酸执行一次或多次荧光测量;以及
(e)除去所掺入的核苷酸的该3'封端基团;
其中该一组亲和试剂包含:
第一亲和试剂,该第一亲和试剂包含能够与该第一类型的未标记核苷酸特异性结合的第一半抗原结合配偶体;以及
第二亲和试剂,该第二亲和试剂包含能够与该第二类型的未标记核苷酸特异性结合的第二半抗原结合配偶体;
其中该第一亲和试剂包含一个或多个第一可检测标记,该一个或多个第一可检测标记能够由第一激发光源激发,该第二亲和试剂包含一个或多个第二可检测标记,该一个或多个第二可检测标记能够由第二激发光源激发,并且其中该一个或多个第一可检测标记与该一个或多个第二可检测标记为光谱上可区分的;并且
其中该第一激发光源和该第二激发光源中的一者具有约450nm至约460nm的波长,并且该第一激发光源和该第二激发光源中的另一者具有约520nm至约540nm的波长;
在本文所述的测序方法的一些实施方案中,该第一半抗原经由可裂解接头共价连接到该第一类型的未标记核苷酸的核碱基。在一些另外的实施方案中,该第二半抗原经由可裂解接头共价连接到该第二类型的未标记核苷酸的核碱基。
两标签测序
在本文所述的测序方法的一些实施方案中,该第三类型的未标记核苷酸包含含有该第一半抗原的该第三类型的未标记核苷酸和含有该第二半抗原的该第三类型的未标记核苷酸的混合物,并且其中该第一亲和试剂和该第二亲和试剂均能够与该第三类型的未标记核苷酸特异性结合。在一些另外的实施方案中,该第一半抗原和该第二半抗原中的每一者经由可裂解接头共价连接到该第三类型的核苷酸的核碱基。在这种情况下,第一类型的核苷酸的掺入由第一荧光测量中的信号态和第二荧光测量中的暗态来确定。第二类型的核苷酸的掺入由第一荧光测量中的信号态和第二荧光测量中的暗态来确定。第三类型的核苷酸的掺入由第一荧光测量中的信号态和第二荧光测量中的信号态来确定。第四类型的核苷酸的掺入由第一荧光测量中的暗态和第二荧光测量中的暗态来确定。本文所述的测序系统也可称为两标签系统,因为存在分别用光谱上可区分的可检测标记来标记的两种亲和试剂。
在本文所述的两标签测序方法的一些实施方案中,该第一半抗原包含生物素部分,并且该第一半抗原结合配偶体包含抗生物素蛋白。在又一个实施方案中,该抗生物素蛋白是链霉抗生物素蛋白。在又一个实施方案中,该抗生物素蛋白是中性抗生物素蛋白。在另外的实施方案中,该抗生物素蛋白的一个或多个生物素结合位点被含生物素部分的分子或其类似物封端。在一些实施方案中,该第二半抗原包含DNP部分,并且该第二半抗原结合配偶体包含抗DNP抗体。在一些实施方案中,该第三类型的未标记核苷酸包含含有生物素部分的第三类型的未标记核苷酸和含有DNP部分的第三类型的未标记核苷酸的混合物。在其他实施方案中,该第二半抗原包含DIG部分,并且该第二半抗原结合配偶体包含抗DIG抗体。在其他实施方案中,该第三类型的未标记核苷酸包括含有生物素部分的第三类型的未标记核苷酸和含有DIG部分的第三类型的未标记核苷酸的混合物。
三标签测序
在本文所述的方法的一些实施方案中,该第三类型的未标记核苷酸包含第三半抗原,并且该一组亲和试剂还包含第三亲和试剂,该第三亲和试剂包含能够与该第三半抗原特异性结合的第三半抗原结合配偶体。在一些此类实施方案中,该第三半抗原经由可裂解接头共价连接到该第三类型的未标记核苷酸的核碱基。在这种情况下,第一类型的核苷酸的掺入由第一荧光测量中的信号态和第二荧光测量中的暗态来确定。第二类型的核苷酸的掺入由第一荧光测量中的信号态和第二荧光测量中的暗态来确定。第三类型的核苷酸的掺入由第一荧光测量中的信号态和第二荧光测量中的信号态来确定。第四类型的核苷酸的掺入由第一荧光测量中的暗态和第二荧光测量中的暗态来确定。本文所述的测序系统也可称为三标签系统,因为存在分别用光谱上可区分的可检测标记来标记的三种亲和试剂。
在本文所述的三标签测序方法的一些实施方案中,该第一半抗原包含生物素部分,并且该第一半抗原结合配偶体包含抗生物素蛋白。在又一个实施方案中,该抗生物素蛋白是链霉抗生物素蛋白。在又一个实施方案中,该抗生物素蛋白是中性抗生物素蛋白。在另外的实施方案中,该抗生物素蛋白的一个或多个生物素结合位点被含生物素部分的分子或其类似物封端。在一些实施方案中,该第二半抗原和该第三半抗原中的一者包含DNP部分,并且该第二半抗原和该第三半抗原中的另一者包含DIG部分。例如,该第二半抗原包含DNP部分,并且该第二半抗原结合配偶体包含抗DNP抗体。该第三半抗原包含DIG部分,并且该第三半抗原结合配偶体包含抗DIG抗体。
在本文所述的三标签测序方法的一些其他实施方案中,该第一半抗原和该第二半抗原中的一者包含DNP部分,并且该第一半抗原和该第二半抗原中的另一者包含DIG部分。例如,该第一半抗原包含DNP部分,并且该第一半抗原结合配偶体包含抗DNP抗体。该第二半抗原包含DIG部分,并且该第二半抗原结合配偶体包含抗DIG抗体。在一些另外的实施方案中,该第三半抗原包含生物素部分,并且该第三半抗原结合配偶体包含抗生物素蛋白。在又一个实施方案中,该抗生物素蛋白是链霉抗生物素蛋白。在又一个实施方案中,该抗生物素蛋白是中性抗生物素蛋白。在一些另外的实施方案中,该抗生物素蛋白的一个或多个生物素结合位点被含生物素部分的分子或其类似物封端。
在本文所述的三标签测序方法的一些其他实施方案中,该第三亲和试剂包含一个或多个第一可检测标记和一个或多个第二可检测标记。例如,该第三亲和试剂可包含或为本文所述的蛋白组装系统。在一些实施方案中,该三标签方法中使用的该蛋白组装系统包括:
蛋白(例如,抗体),该蛋白用一个或多个第一可检测标记来标记;
一个或多个生物素部分,该一个或多个生物素部分共价连接到该蛋白;以及
一个或多个生物素结合蛋白(例如,抗生物素蛋白,诸如链霉抗生物素蛋白或中性抗生物素蛋白),该一个或多个生物素结合蛋白经由非共价相互作用与该一个或多个生物素部分结合;
其中该生物素结合蛋白用一个或多个第二可检测标记来标记,并且其中该第一可检测标记与该第二可检测标记为光谱上可区分的。在另外的实施方案中,该蛋白组装系统中该生物素结合蛋白(例如,抗生物素蛋白,诸如链霉抗生物素蛋白或中性抗生物素蛋白)的剩余生物素结合位点被含生物素部分的分子或其类似物进一步封端,使得该蛋白组装系统可仅与该蛋白(例如,抗体)的该半抗原部分特异性结合。
尽管已经讨论了与两标签测序方案或三标签测序方案相关的某些半抗原和半抗原结合配偶体,但是也可使用其他半抗原和半抗原结合配偶体,诸如表1中例示的那些。
在本文所述的测序方法的任何实施方案中,该掺入混合物还包含第四类型的未标记核苷酸,其中该第四类型的未标记核苷酸不能与任何该亲和试剂特异性结合。此外,该第四类型的未标记核苷酸不能由第一光源或第二光源激发。
当用于参考成像事件时,术语“信号态”是指掺入未标记核苷酸并随后与本文所述的标记的亲和试剂缀合的多核苷酸的状态,其中通过此类成像事件产生特定的发射信号,并测量、检测或收集该发射信号。例如,与所掺入的未标记核苷酸特异性结合的亲和试剂的一个或多个可检测标记可被特定波长的光源(例如,激光)激发,并且发射在单个发射检测通道/滤光器中收集或检测的荧光信号,指示此类成像事件或荧光测量中的“信号态”。
当参考成像事件时,术语“暗态”是指掺入未标记核苷酸并随后与本文所述的标记的亲和试剂缀合的多核苷酸的状态,其中此类成像事件没有产生特定的发射信号,或没有测量、收集和/或检测到该发射信号。
在本文所述的方法的一个示例中,“C”核苷酸络合物由第一荧光测量中的信号态和第二荧光测量中的暗态来确定;“T”核苷酸络合物由第一荧光测量中的暗态和第二荧光测量中的信号态来确定;“A”核苷酸络合物由第一荧光测量中的信号态和第二荧光测量中的信号态来确定;并且“G”核苷酸络合物由第一荧光测量中的暗态和第二荧光测量中的暗态来确定。又如,“T”核苷酸络合物由第一荧光测量中的信号态和第二荧光测量中的暗态来确定;“C”核苷酸络合物由第一荧光测量中的暗态和第二荧光测量中的信号态来确定;“A”核苷酸络合物由第一荧光测量中的信号态和第二荧光测量中的信号态来确定;并且“G”核苷酸络合物由第一荧光测量中的暗态和第二荧光测量中的暗态来确定。
在本文所述的测序方法的一些实施方案中,步骤(e)还除去了所掺入的核苷酸的可检测标记。在一些此类实施方案中,可检测标记和3'封端基团在单个步骤中(例如,在相同化学反应条件下)被除去。在其他实施方案中,可检测标记和3'封端基团在两个单独的步骤中被除去(例如,可检测标记和3'封端基团在两个单独的化学反应条件下被除去)。在一些实施方案中,通过该裂解可裂解接头来除去该可检测标记,其中该半抗原部分共价连接到该核苷酸。在一些另外的实施方案中,该方法还包括(f)用含水洗涤溶液洗涤固体载体。
在一些实施方案中,成像步骤(d)由在不同波长下操作的两个光源(例如,激光)执行。具体地讲,一个光源可具有介于约450nm至约460nm之间的波长,并且另一个光源可具有介于约510nm至约540nm之间或介于约520nm至约535nm之间的波长。因此,步骤(d)包括两个单独的成像事件和两个荧光测量。
在本文所述的测序方法的另外的实施方案中,步骤(b)至步骤(f)在重复循环(例如,至少30、50、100、150、200、250、300、400或500次)中执行,并且该方法还包括基于每种相继掺入的核苷酸络合物的同一性依次确定靶多核苷酸的至少一部分的序列。在一些此类实施方案中,步骤(b)至步骤(f)重复至少50个循环。
在本文所述的方法的一些实施方案中,核苷酸络合物的掺入是通过9N聚合酶的突变体进行的,诸如WO 2005/024010、美国专利公布号2020/0131484A1、2020/0181587A1和美国序列号63/412,241和63/433,971中所公开的那些,这些文献中的每一篇均全文以引用方式并入。示例性聚合酶包括但不限于Pol 812、Pol 1901、Pol 1558或Pol 963。Pol 812、Pol1901、Pol 1558或Pol 963DNA聚合酶的氨基酸序列描述于例如美国专利公开号2020/0131484A1和2020/0181587A1中。
在本文所述的方法的一些实施方案中,步骤(b)中所述掺入混合物中的一种或多种四种不同类型的核苷酸包括选自由以下项组成的组的核苷酸类型:A、C、G、T和U以及它们的非天然核苷酸类似物。在另外的实施方案中,掺入混合物包含四种不同类型的核苷酸络合物(A、C、G和T或U)或它们的非天然核苷酸类似物。在另外的实施方案中,四种不同类型的核苷酸缀合物为dATP、dCTP、dGTP和dTTP或dUTP或它们的非天然核苷酸类似物。在另外的实施方案中,掺入混合物中的四种类型的核苷酸络合物中的每一种类型核苷酸络合物含有3'封端基团。
在本文所述的方法的任何实施方案中,固体载体上固定的不同的靶多核苷酸(即簇)的密度为约或至少约50,000/mm2、100,000/mm2、150,000/mm2、200,000/mm2、250,000/mm2、300,000/mm2、350,000/mm2或400,000/mm2。
尽管已经讨论了与两标签测序方案相关的某些半抗原和半抗原结合配偶体,但是也可使用其他半抗原和半抗原结合配偶体。表1列出了半抗原和半抗原结合配偶体的非限制性示例。在另外的实施方案中,测序方法中使用的掺入混合物也可包括一种或多种标记的核苷酸。例如,标记的核苷酸可含有不能由第一光源或第二光源激发的荧光标记。
在本文所述的方法的任何实施方案中,第一可检测标记可为本文所述的蓝色染料(例如,式(I)、(I-1)、(I-2)、(I-3)或(I-4)的香豆素染料)。在一些另外的实施方案中,第二可检测标记可为本文所述的绿色染料(例如,花青染料)。
在本文所述的测序方法的任何实施方案中,该方法可减少或消除序列环境效应或序列特异性效应。两通道碱基检出依赖于通过两个发射颜色通道中的强度来区分碱基的能力。这种强度调制给系统添加了噪声,并且当序列特异性强度调制将给定簇的强度朝向决策边界移位时,可导致误检出。使用单个ffN(诸如ffA),随后与用两种有色染料标记的蛋白缀合,该两种有色染料可在两通道中产生颜色,从而减少或消除序列特异性强度移位,并且从而提高碱基检出准确性。
关于合成测序的一般描述
在一个特定实施方案中,进行了合成步骤并且该合成步骤可以任选地包括将模板多核苷酸链或靶多核苷酸链与包含本公开的荧光标记的核苷酸的反应混合物一起温育。还可以在允许在退火到模板或靶多核苷酸链的多核苷酸链上的游离3'羟基基团和标记的核苷酸上的5'磷酸基团之间形成磷酸二酯键的条件下提供聚合酶。因此,合成步骤可以包括通过核苷酸与模板/靶链的互补碱基配对来指导多核苷酸链的形成。
在所述方法的所有实施方案中,检测步骤可以在向其中掺入了标记的核苷酸的多核苷酸链退火到模板/靶链上时进行,或者在其中将两条链分离的变性步骤之后进行。在合成步骤和检测步骤之间可以包括另外的步骤,例如化学反应步骤或酶促反应步骤,或者纯化步骤。具体地讲,可以分离或纯化掺入了标记的核苷酸的多核苷酸链,然后进一步加工或用于后续的分析。以举例的方式,在合成步骤中掺入如本文所述的标记核苷酸的多核苷酸链随后可以用作标记的探针或引物。在其他实施方案中,本文示出的合成步骤的产物可以经受进一步的反应步骤,并且如果需要,这些后续步骤的产物被纯化或分离。
用于合成步骤的合适条件将为熟悉标准分子生物学技术的人员所熟知。在一个实施方案中,合成步骤可以类似于标准引物延伸反应,该标准引物延伸反应在合适的聚合酶的存在下使用核苷酸前体(包括如本文所述的标记的核苷酸)形成与模板/靶链互补的延伸的多核苷酸链(引物多核苷酸链)。在其他实施方案中,合成步骤本身可以形成产生标记的双链扩增产物的扩增反应的一部分,该标记的双链扩增产物由来源于引物多核苷酸链和模板多核苷酸链的复制的退火互补链组成。其他示例性合成步骤包括切口平移、链置换聚合、随机引发的DNA标记等。用于合成步骤的特别有用的聚合酶是能够催化如本文示出的标记的核苷酸的掺入的聚合酶。可以使用多种天然存在的或突变的/经修饰的聚合酶。以举例的方式,热稳定聚合酶可以用于使用热循环条件进行的合成反应,而热稳定聚合酶可能不是等温引物延伸反应所期望的。能够掺入根据本公开的标记的核苷酸的合适的热稳定聚合酶包括WO 2005/024010或WO06120433中描述的那些,这些公开中的每一篇以引用方式并入本文。在较低温度诸如37℃处进行的合成反应中,聚合酶不必是热稳定聚合酶,因此对聚合酶的选择将取决于许多因素,诸如反应温度、pH、链置换活性等。
在具体的非限制性实施方案中,本公开涵盖以下的方法:核酸测序、重新测序、全基因组测序、单核苷酸多态性评分、涉及当用本文示出的染料标记的经修饰的核苷酸或核苷掺入到多核苷酸中时对其进行检测的任何其他应用。
SBS通常涉及使用聚合酶或连接酶在5'至3'方向上将一个或多个核苷酸或寡核苷酸顺序添加至生长的多核苷酸链,以便形成与待测序的模板/靶核酸互补的延伸多核苷酸链。存在于一个或多个添加的核苷酸中的碱基的身份可以在检测或“成像”步骤中确定。添加的碱基的身份可以在每个核苷酸掺入步骤之后测定。然后可以使用常规的Watson-Crick碱基配对规则来推断模板的序列。使用用本文示出的染料标记的核苷酸来测定单个碱基的身份可能是有用的,例如,在单核苷酸多态性的评分中,并且此类单碱基延伸反应在本公开的范围内。
在本公开的一个实施方案中,模板/靶多核苷酸的序列通过检测连接到掺入的核苷酸的荧光标记,检测一个或多个核苷酸掺入到与待测序的模板多核苷酸互补的新生链中来确定。模板多核苷酸的测序可以用合适的引物(或制备成发夹构建体,其将包含引物作为发夹的一部分)引发,并且新生链通过在聚合酶催化的反应中向引物的3'端添加核苷酸而以逐个方式延伸。
在特定实施方案中,不同的核苷酸三磷酸(A、T、G和C)中的每一种可以用独特的荧光团进行标记,并且还在3'位置处包含封端基团以防止不受控制的聚合。替代性地,四种核苷酸中的一种可以是未标记的(暗色)。聚合酶将核苷酸掺入到与模板多核苷酸/靶多核苷酸互补的新生链中,并且封端基团防止核苷酸的进一步掺入。任何未掺入的核苷酸都可以被洗掉,并且来自每种掺入的核苷酸的荧光信号可以通过合适的装置(如使用光源激发和合适的发射滤光器的电荷耦合装置)以光学方式“读取”。然后可(同时或顺序地)除去(脱保护)3'封端基团和荧光染料化合物,以暴露新生链用于进一步掺入核苷酸。
如上文所例示,该方法利用了在DNA聚合酶的存在下将荧光标记的3'封端的核苷酸A、G、C和T掺入到与固定的多核苷酸互补的生长链中。聚合酶掺入与靶多核苷酸互补的碱基,但是被3'封端基团防止进一步添加。然后可以确定掺入的核苷酸的标记,并且通过化学裂解除去封闭基团以允许发生进一步的聚合。在SBS反应中待测序的核酸模板可以是期望测序的任何多核苷酸。用于测序反应的核酸模板将通常包含具有游离的3'羟基基团的双链区域,该双链区域充当用于在测序反应中添加另外的核苷酸的引物或起始点。待测序模板的该区域将在互补链上悬垂该游离的3'羟基基团。待测序模板的悬垂区域可为单链的,但也可为双链的,前提条件是在与待测序的模板链互补的链上存在“切口”,以提供用于引发测序反应的游离3'OH基团。在此类实施方案中,测序可以通过链置换进行。在某些实施方案中,可以添加带有游离的3'羟基基团的引物,作为与待测序模板的单链区域杂交的单独组分(例如,短寡核苷酸)。替代性地,待测序的引物和模板链可以各自形成能够形成分子内双链体(诸如发夹环结构)的部分自身互补核酸链的一部分。发夹多核苷酸及其可以连接到固体载体的方法在PCT公开号WO0157248和WO2005/047301中公开,这些公开中的每一篇以引用方式并入本文。核苷酸可以被连续地添加到生长引物,导致在5'至3'方向上合成多核苷酸链。可以确定已添加的碱基的性质,特别是但不必在每次添加核苷酸之后,从而提供核酸模板的序列信息。因此,将核苷酸掺入核酸链(或多核苷酸)中的方式为,经由与该核苷酸的5'磷酸基团形成磷酸二酯键而将该核苷酸接合到核酸链的游离3'羟基基团。
待测序的核酸模板可以是DNA或RNA,或者甚至是由脱氧核苷酸和核糖核苷酸组成的杂合分子。核酸模板可以包含天然存在的和/或非天然存在的核苷酸以及天然或非天然的骨架键,前提条件是这些不阻止测序反应中模板的复制。
在某些实施方案中,待测序的核酸模板可以经由本领域已知的任何合适的连接方法(例如经由共价连接)连接到固体载体。在某些实施方案中,模板多核苷酸可以直接连接到固体载体(例如,基于二氧化硅的载体)。然而,在本公开的其他实施方案中,固体载体的表面可以以某种方式修饰,以便允许模板多核苷酸的直接共价连接,或者通过本身可以非共价连接到固体载体的水凝胶或聚电解质多层来固定模板多核苷酸。
其中多核苷酸已直接连接到载体(例如,基于二氧化硅的载体,诸如WO00/06770(以引用方式并入本文)中所公开的那些)的阵列,其中通过玻璃上的环氧侧基与多核苷酸上的内部氨基基团之间的反应将多核苷酸固定在玻璃载体上。此外,可以通过硫基亲核物质与固体载体的反应将多核苷酸连接到固体载体,例如,如W02005/047301(以引用方式并入本文)中所述。固体支撑的模板多核苷酸的其他另外的示例是模板多核苷酸连接到在基于二氧化硅或其他固体载体上负载的水凝胶,例如如WO00/31148、WO01/01143、WO02/12566、WO03/014392、美国专利6,465,178和WO00/53812中所述,这些专利中的每一篇以引用方式并入本文。
模板多核苷酸可以固定于其上的特定表面是聚丙烯酰胺水凝胶。聚丙烯酰胺水凝胶描述于上文引用的参考文献和WO2005/065814中,该专利以引用方式并入本文。可以使用的特定水凝胶包括WO2005/065814和美国公开2014/0079923中所述的那些。在一个实施方案中,水凝胶为PAZAM(聚(N-(5-叠氮基乙酰氨基戊基)丙烯酰胺-共-丙烯酰胺))。
DNA模板分子可以连接到珠粒或微粒,例如,如美国专利第6,172,218号(以引用方式并入本文)中所述。与珠粒或微粒的连接可以用于测序应用。可以制备珠粒文库,其中每个珠粒包含不同的DNA序列。示例性文库及其产生方法描述于Nature,437,376-380(2005);Science,309,5741,1728-1732(2005),这些文献各自以引用方式并入本文。使用本文示出的核苷酸对此类珠粒的阵列进行测序在本公开的范围内。
待测序的模板可以形成固体载体上的“阵列”的一部分,在这种情况下,阵列可以采取任何方便的形式。因此,本公开的方法适用于所有类型的高密度阵列,包括单分子阵列、成簇阵列和珠粒阵列。用本公开的染料化合物标记的核苷酸可以用于对基本上任何类型的阵列上的模板(包括但不限于通过将核酸分子固定在固体载体上而形成的那些)进行测序。
然而,用本公开的染料化合物标记的核苷酸在对成簇阵列进行测序的背景中是特别有利的。在成簇阵列中,阵列上的不同区域(通常称为位点或特征)包含多个多核苷酸模板分子。一般来讲,所述多个多核苷酸分子不能通过光学手段单独地分辨,而是作为整体被检测到。取决于阵列的形成方式,阵列上的每个位点可以包含一个单独多核苷酸分子的多个拷贝(例如,该位点对于特定的单链核酸种类或双链核酸种类是同质的)或甚至少量不同多核苷酸分子的多个拷贝(例如,两个不同核酸种类的多个拷贝)。核酸分子的成簇阵列可以使用本领域中公知的技术产生。以举例的方式,WO 98/44151和WO00/18957(这些专利中的每一篇以引用方式并入本文)描述了扩增核酸的方法,其中模板和扩增产物均保持固定在固体载体上,以便形成由固定的核酸分子的簇或“集落”组成的阵列。根据这些方法制备的成簇阵列上存在的核酸分子是使用用本公开的染料化合物标记的核苷酸进行测序的合适模板。
用本公开的染料化合物标记的核苷酸也可用于对单分子阵列上的模板进行测序。如本文所用的术语“单分子阵列”或“SMA”是指分布(或排列)在固体载体上的多核苷酸分子群,其中任何单独的多核苷酸与该群的所有其他多核苷酸分子的间距使得有可能单独地分辨单独的多核苷酸分子。因此,在一些实施方案中,固定到固体载体的表面上的靶核酸分子能够通过光学手段分辨。这意味着一个或多个不同的信号(每个信号代表一种多核苷酸)将出现在所用的特定成像装置的可分辨区域内。
可以实现单分子检测,其中阵列上的相邻多核苷酸分子之间的间距为至少100nm,更具体地讲至少250nm,还更具体地讲至少300nm,甚至更具体地讲至少350nm。因此,每个分子能够作为单分子荧光点来单独地分辨和检测,并且来自所述单分子荧光点的荧光也表现出单步光漂白。
术语“单独分辨的”和“单独分辨”在本文中用于规定,当可视化时,有可能将阵列上的一个分子与其相邻分子区分开。阵列上各个分子之间的间隔将部分地通过用于分辨各个分子的特定技术来确定。通过参考已公布的申请WO00/06770和WO 01/57248将理解单分子阵列的一般特征,这些申请中的每个申请以引用方式并入本文。虽然本公开的标记的核苷酸的一种用途是用于合成测序反应中,但此类核苷酸的效用却不限于此类方法。事实上,本文所述的标记的核苷酸可以有利地用于需要检测连接于掺入到多核苷酸中的核苷酸的荧光标记的任何测序方法。
具体地讲,用本公开的染料化合物标记的核苷酸可以用于自动化荧光测序方案,尤其是基于Sanger和同事的链终止测序方法的荧光染料-终止子循环测序。此类方法通常使用酶和循环测序将荧光标记的双脱氧核苷酸掺入引物延伸测序反应中。所谓的Sanger测序方法和相关方案(Sanger型)利用带有标记的双脱氧核苷酸的随机化链终止。
实施例
在以下实施例中更详细地公开了附加的实施方案,这些实施例并非旨在以任何方式限制权利要求书的范围。
用于确定蛋白标记度的一般程序
染料的蛋白标记度可经由吸光度测量来估计。首先,如果存在,非缀合染料必须从包括染料标记的蛋白的样品中除去。为了准确确定蛋白:染料比例,非缀合染料应该完全或基本上从样品中除去。例如,可通过透析或凝胶过滤除去染料。
除去未缀合的染料后,可在280nm波长下测量蛋白:染料络合物的吸光度,A280。可使用分光光度计测量280nm吸光度A280。分光光度计的比色皿可具有1cm的路径长度。如果初始吸光度测量值超过2.0,则可用稀释系数DF稀释样品,以便在重新测量前将吸光度降低到2.0以下。另外,蛋白:染料络合物的吸光度Amax可在波长λmax下测量,在该波长下染料具有最大吸光度。
样品中蛋白的摩尔浓度可根据以下计算:
其中ε是蛋白摩尔消光系数,并且CF是校正因子,用于调整染料在280nm处的吸光量。蛋白摩尔浓度可用于计算蛋白:染料摩尔比:
其中ε'是荧光染料的摩尔消光系数。
实施例1.蓝色染料和绿色染料标记的链霉抗生物素蛋白的制备
为了制备蓝色染料标记的链霉抗生物素蛋白,将1当量的香豆素染料A-PEG12-COOH与1mL的DMF共蒸发,并在真空下干燥。然后,添加10当量的N,N-二异丙基乙胺和1.1当量的TSTU。在室温下搅拌反应30分钟以形成香豆素染料A-PEG12-COOH的活化酯。然后将10μL的活化酯添加到1.0mL的含2.0mg/mL的链霉抗生物素蛋白(SA)的pH6.5磷酸钾缓冲液中。将所得溶液在室温下搅拌1小时,并且反应混合物通过PD minitrap G-25尺寸排阻柱使用pH6.5,10mM磷酸钾缓冲液纯化,得到所得链霉抗生物素蛋白(香豆素A-PEG12)络合物。香豆素染料A通过羧基基团的活化酯与链霉抗生物素蛋白的赖氨酸残基反应共价连接到链霉抗生物素蛋白以形成酰胺键。基于用于通过比较蛋白和染料的吸光波长的比率来确定蛋白标记度的一般程序,计算共价连接到链霉抗生物素蛋白的香豆素染料A的数量。所得蛋白染料络合物被确定为SA(香豆素染料A-PEG12)4.5。
为了制备绿色染料标记的链霉抗生物素蛋白,将1当量的花青染料B与1mL的DMF共蒸发,并在真空下干燥。然后添加10当量的N,N-二异丙基乙胺和1.1当量的TSTU。在室温下搅拌反应30分钟以形成花青染料B的活化酯。然后将所得的在pH6.5的磷酸钾中的5.0μM SA(香豆素染料PEG12)4.5的络合物与10μL的花青染料B的活化酯混合,并在室温下搅拌1小时,并通过PD minitrap G-25尺寸排阻柱使用pH8.0、10mM tris缓冲液纯化反应混合物,以获得双标记的链霉抗生物素蛋白(用蓝色香豆素染料A和绿色花青染料B标记)。花青染料B标记度基于与如上所述如SA(香豆素染料A-PEG12)4.5(花青染料B)1.4相同的一般程序来计算。通过nanodrop光谱仪对络合物进行了表征。
美国专利公布号2022/0033900A1中公开了香豆素染料A,当通过PEG接头与蛋白(例如,链霉抗生物素蛋白)或抗体(例如,抗DNP)缀合时,其具有结构部分这种香豆素染料能够由约450nm至约460nm的蓝光激发(也称为“蓝色染料”)。花青染料B在国际专利公布号WO2014/135221A1中公开,当与链霉抗生物素蛋白缀合时,其具有结构部分这种花青染料能够由约520nm至约540nm的绿光激发(也称为“绿色染料”)。
实施例2.双蛋白组装系统的制备
首先,将1当量的香豆素染料A-PEG12-COOH与1mL的DMF共蒸发,并在真空下干燥。然后添加10当量的N,N-二异丙基乙胺和1.1当量的TSTU。在室温下搅拌反应30分钟以形成香豆素染料A-PEG12-COOH的活化酯。然后将20μL的香豆素染料A-PEG12-COOH的活化酯添加到0.5mL的在pH6.5磷酸钾缓冲液中的2.0mg/mL(12.5μM)抗DNP抗体中。将所得溶液在室温下搅拌1小时,并且反应混合物通过PD minitrap G-25尺寸排阻柱使用pH6.5,10mM磷酸钾缓冲液纯化,得到香豆素染料A标记的抗DNP。染料标记度基于上述如抗DNP(香豆素染料A-PEG12)7的一般程序来计算。然后,将1mL的6.2μM抗DNP(香豆素染料A-PEG12)7与10μL的2.35mg/mL NHS-PEG12-生物素在DMA溶液中混合,并在室温下搅拌1小时,并且反应混合物通过PD minitrap G-25尺寸排阻柱使用pH 8.0、10mM tris缓冲液纯化以获得溶液浓度为3.0μM的抗DNP(香豆素染料A-peg12)7-生物素。
花青染料B标记的链霉抗生物素蛋白SA(花青染料B)7的制备类似于美国专利公布号2013/0079232A1中描述的程序,该文献以引用的方式整体并入。。染料标记度基于上述如SA(花青染料B)7的一般程序来计算。然后通过在20.5μL的pH 8.0的10mM tris缓冲液中添加48μL的3.0μM的抗DNP(香豆素染料A-PEG12)7-生物素和31.5μL的13.7μM SA(花青染料B)7(3摩尔当量)组装双蛋白系统以形成抗DNP(香豆素染料A-PEG12)7-生物素-[SA(花青染料B)7]3。通过nanodrop光谱仪对双蛋白络合物进行了表征。
实施例3.具有未标记核苷酸的两标签SBS
在该实施例中,使用具有两种不同半抗原部分的通用ffN的两染料方案进行SBS。掺入混合物中使用的未标记的ffn包括暗ffG、生物素连接的ffA(ffA-sPA-LN3-生物素)、DNP连接的ffA(ffA-sPA-LN3-DNP)、DNP连接的ffT(ffT-LN3-DNP)、生物素连接的ffC(ffC-LN3-LN3-生物素)和SO7181连接的ffC(ffC-LN3-SO7181)。SO7181是可商购获得的红色染料。在掺入未标记核苷酸之后,用于二次标记的亲和试剂混合物包括用香豆素染料A(抗DNP(香豆素染料A)4)标记的0.1μM抗DNP抗体,和用花青染料B标记的0.1μM的链霉抗生物素蛋白。将亲和试剂混合物引入掺入的ffn中,并使其在60℃结合60秒。使用蓝光激发/绿光激发(首先是约460nm的蓝光,然后是约532nm的绿光)在MiSeq上进行SBS运行。
图3A是由SBS运行掺入循环26的读数生成的双染料SBS信号强度散点图。通道1(x轴)绘制绿色通道的强度,而通道2(y轴)绘制蓝色通道的强度。在所述运行中,150个循环的平均误差率为1.1%,平均相位为0.07%,并且平均信号剩余为61%。
在类似的条件下用反向标记的蛋白标签进行第二次SBS运行。其包括用花青染料B标记的0.1μM抗DNP抗体和用香豆素染料A标记的0.1μM链霉抗生物素蛋白。图3B是从所述运行掺入循环26的读数生成的双染料SBS强度图。通道1(x轴)绘制蓝色通道的强度,而通道2(y轴)绘制绿色通道的强度。对于这次运行,误差率为0.54%,相位为0.13%,并且信号剩余为63%。
实施例4.具有未标记核苷酸的三标签SBS
在该实施例中,使用三标签系统进行SBS,该系统具有具有三种不同半抗原部分的未标记核苷酸集合。使用的ffn包括暗ffG、DNP连接的ffA(ffA-sPA-LN3-DNP)、生物素连接的ffC(ffC-LN3-LN3-生物素)和DIG连接的ffT(ffT-sPA-LN3-DIG)。亲和试剂混合物(即标记的蛋白混合物)包括如实施例1中所述的双标记的链霉抗生物素蛋白络合物SA(香豆素染料A-PEG12)4.5(花青染料B)1.4,平均包括4.5摩尔当量的香豆素染料A部分(蓝色染料)和1.4摩尔当量的花青染料B(绿色染料);用花青染料B标记的抗DIG抗体(抗DIG(花青染料B)8)和用香豆素染料A标记的抗DNP抗体(抗DNP(香豆素染料A)4)。将标记蛋白混合物引入掺入的ffN中,并在60℃下结合60秒。使用蓝光激发/绿光激发在MiSeqTM上进行SBS运行。
图4A是从所述运行掺入循环1生成的双染料SBS信号强度散点图。通道1(x轴)绘制绿色通道的强度,而通道2(y轴)绘制蓝色通道的强度。对于所述运行,在循环150处的错误率为0.79%,相位为0.059%,并且信号剩余为86%。
在类似的条件下,用不同的亲和试剂混合物进行第二次SBS运行。掺入混合物中的ffn包括:暗ffG、DNP连接的ffA(ffA-sPA-LN3-DNP)、生物素连接的ffC(ffC-LN3-LN3-生物素)和DIG连接的ffT(ffT-sPA-LN3-DIG)。亲和试剂混合物(即标记的蛋白混合物)包括实施例2中描述的双蛋白组装系统-抗DNP(香豆素染料A-PEG12)7-生物素-[SA(花青染料B)7]3。抗DNP抗体用香豆素染料A部分(蓝色染料)共价标记。此外,抗DNP抗体经由生物素接头与三摩尔当量的花青染料B(绿色染料)标记的链霉抗生物素蛋白连接。这些链霉抗生物素蛋白分子平均用7个花青染料B部分标记,并且任何剩余的生物素结合位点被封端,使得该蛋白组件不能与生物素连接的ffC结合。标记蛋白混合物还包括用花青染料B标记的抗DIG抗体(抗DIG(花青染料B)8)和用香豆素染料A标记的链霉抗生物素蛋白(SA(香豆素染料A)4)。
图4B是从第二运行掺入循环1生成的双染料SBS信号强度散点图。通道1(x轴)绘制蓝色通道的强度,而通道2(y轴)绘制绿色通道的强度。此外,观察到散点图中不存在A云的通道1-通道2反相关序列环境行为(当ffA用蓝色染料或绿色染料标记时,通常在两通道SBS中观察到),因为ffA、ffC和ffT中的每一者都有单个实体标记。
实施例5.式(I)的亲水性香豆素染料的合成和荧光强度溶液数据
将3-氨基-4-羟基苯甲酸(4.05g,26.5mmol,1.0当量)悬浮在乙醇(50ml)中,并冷却至0℃。添加3-乙氧基-3-亚氨基丙酸乙酯盐酸盐(5.69g,29.1mmol,1.1当量),并且使烧瓶温热至室温,随后加热回流16小时。将反应混合物冷却至室温,并且通过过滤收集形成的沉淀物,用EtOH洗涤。收集的目标化合物1呈灰白色粉末(5.99g,24.1mmol,91%)。1H NMR(400MHz,DMSO)δ13.12(s,<1H),8.26(d,J=1.6Hz,1H),8.03(dd,J=8.5,1.7Hz,1H),7.84(d,J=8.5Hz,1H),4.27(s,2H),4.17(q,J=7.1Hz,2H),1.21(t,J=7.1Hz,3H)。
将4-氟-2-羟基苯甲醛(3.35g,23.9mmol,1.0当量)和化合物1(5.97g,23.9mmol,1.0当量)悬浮在EtOH中,随后添加AcOH(836μl,12.0mmol,0.5当量)和哌啶(974μl,12.0mmol,0.5当量)。将反应物加热回流16小时(形成橙色悬浮液,加热溶解)。将反应混合物冷却至室温,并且通过过滤收集沉淀物,用EtOH洗涤并在高真空下干燥,得到呈淡黄色固体形式的化合物2(5.05g,15.5mmol,65%)。1H NMR(400MHz,DMSO)δ9.13(s,1H),8.29(d,J=1.5Hz,1H),8.15–8.03(m,2H),7.80(d,J=8.5Hz,1H),7.52(dd,J=9.6,2.5Hz,1H),7.38(td,J=8.8,2.5Hz,1H)。
染料I-1的合成
将化合物3(53.5mg,190μmol,2.0当量)和化合物2(30.9mg,95μmol,1.0当量)悬浮在DMSO(2ml)中。添加DIPEA(165μl,950μmol,10.0当量)并将反应在110℃下加热16小时(橙色悬浮液至深橙色溶液)。在60℃下高真空下蒸馏掉一半体积的溶剂,并且将残余物用水和乙腈(10ml)的1:1混合物稀释。通过制备型HPLC(用35%乙腈/水洗脱)纯化产物,得到染料I-1(31.3μmol,33%),λabs=450nm、λfl=495nm.
染料I-2的合成
将3-氨基-1-丙磺酸(0.75g,5.39mmol,1.0当量)在水(5ml)中的溶液加热至60℃。添加NaOH水溶液(2M,3ml),随后滴加3-溴丙烷磺酸钠(1.40g,6.22mmol,1.15当量)的水(5ml)溶液,并在60℃下搅拌16小时。将反应混合物蒸发并重新溶解在最小体积的水中,并通过C18柱色谱法(0%-10%乙腈/水)纯化,得到化合物4,为具有不期望的伯胺和叔胺的粗混合物(在下一步骤中未反应)。
将化合物4(2.0g粗混合物)和化合物2(750mg,2.31mmol,1.0当量)悬浮在DMSO(40ml)中。添加DIPEA(4.0ml,23.1mmol,10.0当量)并将反应在110℃下加热16小时(橙色悬浮液至深橙色溶液)。在60℃高真空下蒸馏掉一半体积的溶剂,用水(40ml)稀释残余物并过滤。通过制备型HPLC(在20%乙腈/水中洗脱)纯化染料I-2,得到染料I-2(187μmol,8%),λabs=449nm,λfl=494nm。
胺改性的香豆素染料的一般合成
将胺R1-NH-R2(2.0当量)和化合物2(1.0当量)悬浮在DMSO中。添加DIPEA(10.0当量),并将反应在110℃下加热6-16小时(橙色悬浮液至深橙色溶液)。在60℃高真空下蒸馏掉一半体积的溶剂,用水稀释残余物并过滤。通过制备型HPLC(用20%-40%乙腈/水洗脱)纯化产物,得到胺修饰的香豆素染料(8%-40%产率)。使用本文所述的通用合成方法,以40%的产率制备染料I-4,λabs=451nm,λfl=500nm。
染料I-1和染料I-2的荧光强度在溶液中相对于参考香豆素染料C进行测试,该参考香豆素染料是在Illumina的两通道SBS中使用的标准蓝色染料,具有良好的稳定性和荧光强度。此外,用多种染料I-1和染料I-2标记的蛋白/抗体(诸如链霉抗生物素蛋白、抗DIG、抗DNP)也按照实施例1中描述的类似程序制备,并在溶液中测试其荧光强度。如图5A和图5B所示,与用相同浓度的香豆素染料C标记的ffA相比,标记的链霉抗生物素蛋白、标记的抗DIG和标记的抗DNP在溶液中显示出更大的荧光强度。
实施例6.使用式(I)的亲水性香豆素染料的
SBS
ffC-sPA-染料I-1和ffC-sPA-染料I-2在Illumina的MiSeqTM平台上进行测试,其中蓝色和绿色LED分别在460nm和532nm下操作,与标准ffC-sPA-香豆素染料C进行对比。测序方案是使用22℃扫描,无可变剂量,无重复使用,25s掺入时间和10s裂解时间。除了标记的ffC之外,掺入混合物的额外组分包括:(1)核苷酸集合,包括暗G、ffC-SO7181、ffA-LN3-BL-香豆素染料C、ffA-BL-NR550S0(一种已知的绿色染料)、ffT-LN3-花青染料B;(2)DNA聚合酶Pol 1901;和(3)甘氨酸缓冲液。
图6A至图6C是在第5次循环时蓝/绿双通道SBS运行的散点图,比较了用ffC-sPA-染料I-1或ffC-sPA-染料I-2改变ffC-sPA-香豆素染料C的效果。与用香豆素染料C标记的标准ffC相比,ffC-sPA-染料I-1或ffC-sPA-染料I-2在测序中示出亮度增加。
当在测序期间暴露于增加的剂量时,掺入ffC-sPA-染料I-2和ffC-sPA-染料I-4的ffN混合物都比对应的ffC-sPA-香豆素染料C保留了更多的信号(图7A和图7B)。这可指示,在测序过程的每个循环期间,生长的DNA链被这些ffn破坏得更少。
Claims (90)
1.一种用于测序应用的试剂盒,所述试剂盒包括:
第一类型的未标记核苷酸,所述第一类型的未标记核苷酸包含第一半抗原;
第二类型的未标记核苷酸,所述第二类型的未标记核苷酸包含第二半抗原;
第三类型的未标记核苷酸;以及
一组亲和试剂,所述一组亲和试剂包含:
第一亲和试剂,所述第一亲和试剂包含能够与所述第一类型的未标记核苷酸特异性结合的第一半抗原结合配偶体;以及
第二亲和试剂,所述第二亲和试剂包含能够与所述第二类型的未标记核苷酸特异性结合的第二半抗原结合配偶体;
其中所述第一亲和试剂包含一个或多个第一可检测标记,所述一个或多个第一可检测标记能够由第一激发光源激发,所述第二亲和试剂包含一个或多个第二可检测标记,所述一个或多个第二可检测标记能够由第二激发光源激发,并且其中所述第一可检测标记与所述第二可检测标记为光谱上可区分的;并且
其中所述第一激发光源和所述第二激发光源中的一者具有约450nm至约460nm的波长,并且所述第一激发光源和所述第二激发光源中的另一者具有约520nm至约540nm的波长。
2.根据权利要求1所述的试剂盒,其中所述第一半抗原经由可裂解接头共价连接到所述第一类型的未标记核苷酸的核碱基。
3.根据权利要求1或2所述的试剂盒,其中所述第二半抗原经由可裂解接头共价连接到所述第二类型的未标记核苷酸的核碱基。
4.根据权利要求1至3中任一项所述的试剂盒,其中所述第三类型的未标记核苷酸包含含有所述第一半抗原的所述第三类型的未标记核苷酸和含有所述第二半抗原的所述第三类型的未标记核苷酸的混合物,并且其中所述第一亲和试剂和所述第二亲和试剂均能够与所述第三类型的未标记核苷酸特异性结合。
5.根据权利要求4所述的试剂盒,其中所述第一半抗原和所述第二半抗原中的每一者经由可裂解接头共价连接到所述第三类型的核苷酸的核碱基。
6.根据权利要求4或5所述的试剂盒,其中所述第一半抗原包含生物素部分,并且所述第一半抗原结合配偶体包含抗生物素蛋白。
7.根据权利要求6所述的试剂盒,其中所述抗生物素蛋白是链霉抗生物素蛋白或中性抗生物素蛋白。
8.根据权利要求6或7所述的试剂盒,其中所述抗生物素蛋白的一个或多个生物素结合位点被含生物素部分的分子或其类似物封端。
9.根据权利要求6至8中任一项所述的试剂盒,其中所述第二半抗原包含二硝基苯基(DNP)部分,并且所述第二半抗原结合配偶体包含抗DNP抗体。
10.根据权利要求9所述的试剂盒,其中所述第三类型的未标记核苷酸包含含有生物素部分的第三类型的未标记核苷酸和含有DNP部分的第三类型的未标记核苷酸的混合物。
11.根据权利要求6至8中任一项所述的试剂盒,其中所述第二半抗原包含地高辛(DIG)部分,并且所述第二半抗原结合配偶体包含抗DIG抗体。
12.根据权利要求11所述的试剂盒,其中所述第三类型的未标记核苷酸包括含有生物素部分的第三类型的未标记核苷酸和含有DIG部分的第三类型的未标记核苷酸的混合物。
13.根据权利要求1至3中任一项所述的试剂盒,其中所述第三类型的未标记核苷酸包含第三半抗原,并且所述一组亲和试剂还包含第三亲和试剂,所述第三亲和试剂包含能够与所述第三半抗原特异性结合的第三半抗原结合配偶体。
14.根据权利要求13所述的试剂盒,其中所述第三半抗原经由可裂解接头共价连接到所述第三类型的未标记核苷酸的核碱基。
15.根据权利要求13或14所述的试剂盒,其中所述第一半抗原包含生物素部分,并且所述第一半抗原结合配偶体包含抗生物素蛋白。
16.根据权利要求15所述的试剂盒,其中所述抗生物素蛋白是链霉抗生物素蛋白或中性抗生物素蛋白。
17.根据权利要求15或16所述的试剂盒,其中所述抗生物素蛋白的一个或多个生物素结合位点被含生物素部分的分子或其类似物封端。
18.根据权利要求15至17中任一项所述的试剂盒,其中所述第二半抗原和所述第三半抗原中的一者包含DNP部分,并且所述第二半抗原和所述第三半抗原中的另一者包含DIG部分。
19.根据权利要求13或14所述的试剂盒,其中所述第一半抗原和所述第二半抗原中的一者包含DNP部分,并且所述第一半抗原和所述第二半抗原中的另一者包含DIG部分。
20.根据权利要求19所述的试剂盒,其中所述第三半抗原包含生物素部分,并且所述第三半抗原结合配偶体包含抗生物素蛋白。
21.根据权利要求20所述的试剂盒,其中所述抗生物素蛋白是链霉抗生物素蛋白或中性抗生物素蛋白。
22.根据权利要求20或21所述的试剂盒,其中所述抗生物素蛋白的一个或多个生物素结合位点被含生物素部分的分子或其类似物封端。
23.根据权利要求13至22中任一项所述的试剂盒,其中所述第三亲和试剂包含一个或多个第一可检测标记和一个或多个第二可检测标记。
24.根据权利要求23所述的试剂盒,其中所述第三亲和试剂包含根据权利要求29至42中任一项所述的多染料标记的蛋白组装系统。
25.根据权利要求1至24中任一项所述的试剂盒,所述试剂盒还包括第四类型的未标记核苷酸,其中所述第四类型的未标记核苷酸不能与任何所述亲和试剂特异性结合。
26.根据权利要求25所述的试剂盒,其中所述第一类型的未标记核苷酸、所述第二类型的未标记核苷酸、所述第三类型的未标记核苷酸和所述第四类型的未标记核苷酸中的每一者都包含3'封端基团。
27.根据权利要求1至26中任一项所述的试剂盒,其中所述第一可检测标记是具有式(I)的结构的染料:
其中
R1是-C(O)OC1-C6烷基、-SO3H、-OH、任选地取代的5至10元杂芳基、任选地取代的3至10元杂环基、任选地取代的苯基、或-ORx;
Rx是任选地取代的5至10元杂芳基、任选地取代的3至10元杂环基、或任选地取代的苯基;
m是1、2或3的整数;并且
n是1、2、3、4或5的整数。
28.根据权利要求1至27中任一项所述的试剂盒,所述试剂盒还包括DNA聚合酶和一种或多种缓冲液组合物。
29.一种蛋白组装系统,所述蛋白组装系统包括:
第一蛋白,所述第一蛋白用一个或多个第一可检测标记来标记;
一个或多个含半抗原的接头,所述一个或多个含半抗原的接头共价连接到所述第一蛋白;以及
一个或多个半抗原结合的第二蛋白,所述一个或多个半抗原结合的第二蛋白与一个或多个含半抗原的接头结合;
其中所述一个或多个半抗原结合的第二蛋白用一个或多个第二可检测标记来标记,并且其中所述一个或多个第一可检测标记与所述一个或多个第二可检测标记为光谱上可区分的。
30.根据权利要求29所述的蛋白组装系统,其中所述一个或多个含半抗原的接头是含生物素部分的接头,并且所述一个或多个半抗原结合的第二蛋白是生物素结合蛋白。
31.根据权利要求29或30所述的蛋白组装系统,其中所述一个或多个半抗原结合的第二蛋白包含抗生物素蛋白。
32.根据权利要求31所述的蛋白组装系统,其中所述抗生物素蛋白是链霉抗生物素蛋白或中性抗生物素蛋白。
33.根据权利要求31或32所述的蛋白组装系统,其中所述抗生物素蛋白的一个或多个生物素结合位点被含生物素部分的分子或其类似物封端。
34.根据权利要求29至33中任一项所述的蛋白组装系统,其中所述第一蛋白包含抗体。
35.根据权利要求34所述的蛋白组装系统,其中所述抗体是抗DNP抗体或抗DIG抗体。
36.根据权利要求29至35中任一项所述的蛋白组装系统,其中所述一个或多个第一可检测标记能够由蓝光激发,并且所述一个或多个第二可检测标记能够由绿光激发。
37.根据权利要求29至35中任一项所述的蛋白组装系统,其中所述一个或多个第一可检测标记能够由绿光激发,并且所述一个或多个第二可检测标记能够由蓝光激发。
38.根据权利要求36或37所述的蛋白组装系统,其中所述蓝光具有约450nm至约460nm的波长。
39.根据权利要求36或37所述的蛋白组装系统,其中所述绿光具有约520nm至约540nm的波长。
40.根据权利要求29至39中任一项所述的蛋白组装系统,其中所述第一蛋白用多个第一可检测标记来标记。
41.根据权利要求30至40中任一项所述的蛋白组装系统,其中所述蛋白组装系统包括至少两种生物素结合蛋白,每种生物素结合蛋白用多个第二可检测标记来标记。
42.根据权利要求30至41中任一项所述的蛋白组装系统,其中所述含生物素部分的接头包含PEG重复单元(—OCH2CH2—)n,并且其中n是2至30的整数。
43.根据权利要求29至42中任一项所述的蛋白组装系统,其中所述一个或多个第一可检测标记包括具有式(I)的结构的香豆素染料:
其中
R1是-C(O)OC1-C6烷基、-SO3H、-OH、任选地取代的5至10元杂芳基、任选地取代的3至10元杂环基、任选地取代的苯基、或-ORx;
Rx是任选地取代的5至10元杂芳基、任选地取代的3至10元杂环基、或任选地取代的苯基;
m是1、2或3的整数;并且
n是1、2、3、4或5的整数。
44.一种核苷酸络合物,所述核苷酸络合物包含根据权利要求29至43中任一项所述的蛋白组装系统。
45.根据权利要求44所述的核苷酸络合物,其中所述蛋白组装系统与核苷酸的半抗原部分结合,并且其中所述核苷酸的所述半抗原部分能够与所述蛋白组装系统的蛋白中的至少一种蛋白特异性结合。
46.根据权利要求45所述的核苷酸络合物,其中所述核苷酸的所述半抗原部分包含DIG部分或DNP部分。
47.根据权利要求44至46中任一项所述的核苷酸络合物,其中所述核苷酸的所述半抗原部分经由可裂解接头共价连接到核碱基。
48.一种寡核苷酸或多核苷酸,所述寡核苷酸或多核苷酸包含掺入其中的根据权利要求44至47中任一项所述的核苷酸络合物。
49.根据权利要求48所述的寡核苷酸或多核苷酸,其中所述寡核苷酸或多核苷酸与固定在固体载体的表面上的靶多核苷酸至少部分地互补并杂交。
50.根据权利要求48或49所述的寡核苷酸或多核苷酸,其中所述固体载体包含多个固定的靶多核苷酸,其中所述固定的靶多核苷酸在所述固体载体上的密度为至少约50,000/mm2。
51.一种确定多个不同靶多核苷酸的序列的方法,所述方法包括:
(a)使固体载体在杂交条件下与包含测序引物的溶液接触,其中所述固体载体包含多个固定在其上的不同靶多核苷酸;并且所述测序引物与所述靶多核苷酸的至少一部分互补;
(b)使所述固体载体在适用于DNA聚合酶介导的引物延伸的条件下与包含DNA聚合酶和四种不同类型的未标记核苷酸中的一种或多种未标记核苷酸的水溶液接触,并将一种类型的核苷酸掺入到所述测序引物中以产生延伸的拷贝多核苷酸;其中
所述四种类型的核苷酸中的每种类型的核苷酸包含3'封端基团;
所述第一类型的未标记核苷酸包含第一半抗原;
所述第二类型的未标记核苷酸包含第二半抗原;
(c)使所述延伸的拷贝多核苷酸与一组亲和试剂在其中一种亲和试剂特异性地结合所掺入的未标记核苷酸的条件下接触,以提供标记的延伸拷贝多核苷酸;
(d)对所述固体载体进行成像并对所述延伸的拷贝多核苷酸执行一次或多次荧光测量;以及
(e)除去所掺入的核苷酸的所述3'封端基团;
其中所述一组亲和试剂包含:
第一亲和试剂,所述第一亲和试剂包含能够与所述第一类型的未标记核苷酸特异性结合的第一半抗原结合配偶体;以及
第二亲和试剂,所述第二亲和试剂包含能够与所述第二类型的未标记核苷酸特异性结合的第二半抗原结合配偶体;
其中所述第一亲和试剂包含一个或多个第一可检测标记,所述一个或多个第一可检测标记能够由第一激发光源激发,所述第二亲和试剂包含一个或多个第二可检测标记,所述一个或多个第二可检测标记能够由第二激发光源激发,并且其中所述一个或多个第一可检测标记与所述一个或多个第二可检测标记为光谱上可区分的;并且
其中所述第一激发光源和所述第二激发光源中的一者具有约450nm至约460nm的波长,并且所述第一激发光源和所述第二激发光源中的另一者具有约520nm至约540nm的波长。
52.根据权利要求51所述的方法,其中所述第一半抗原经由可裂解接头共价连接到所述第一类型的未标记核苷酸的核碱基。
53.根据权利要求51或52所述的方法,其中所述第二半抗原经由可裂解接头共价连接到所述第二类型的未标记核苷酸的核碱基。
54.根据权利要求51至53中任一项所述的方法,其中第三类型的未标记核苷酸包含含有所述第一半抗原的所述第三类型的未标记核苷酸和含有所述第二半抗原的所述第三类型的未标记核苷酸的混合物,并且其中所述第一亲和试剂和所述第二亲和试剂均能够与所述第三类型的未标记核苷酸特异性结合。
55.根据权利要求54所述的方法,其中所述第一半抗原和所述第二半抗原中的每一者经由可裂解接头共价连接到所述第三类型的核苷酸的核碱基。
56.根据权利要求54或55所述的方法,其中所述第一半抗原包含生物素部分,并且所述第一半抗原结合配偶体包含抗生物素蛋白。
57.根据权利要求56所述的方法,其中所述抗生物素蛋白是链霉抗生物素蛋白或中性抗生物素蛋白。
58.根据权利要求56或57所述的方法,其中所述抗生物素蛋白的一个或多个生物素结合位点被含生物素部分的分子或其类似物封端。
59.根据权利要求56至58中任一项所述的方法,其中所述第二半抗原包含DNP部分,并且所述第二半抗原结合配偶体包含抗DNP抗体。
60.根据权利要求59所述的方法,其中所述第三类型的未标记核苷酸包含含有生物素部分的第三类型的未标记核苷酸和含有DNP部分的第三类型的未标记核苷酸的混合物。
61.根据权利要求56至58中任一项所述的方法,其中所述第二半抗原包含DIG部分,并且所述第二半抗原结合配偶体包含抗DIG抗体。
62.根据权利要求61所述的方法,其中所述第三类型的未标记核苷酸包括含有生物素部分的第三类型的未标记核苷酸和含有DIG部分的第三类型的未标记核苷酸的混合物。
63.根据权利要求51至53中任一项所述的方法,其中所述第三类型的未标记核苷酸包含第三半抗原,并且所述一组亲和试剂还包含第三亲和试剂,所述第三亲和试剂包含能够与所述第三半抗原特异性结合的第三半抗原结合配偶体。
64.根据权利要求63所述的方法,其中所述第三半抗原经由可裂解接头共价连接到所述第三类型的未标记核苷酸的核碱基。
65.根据权利要求63或64所述的方法,其中所述第一半抗原包含生物素部分,并且所述第一半抗原结合配偶体包含抗生物素蛋白。
66.根据权利要求65所述的方法,其中所述第二半抗原和所述第三半抗原中的一者包含DNP部分,并且所述第二半抗原和所述第三半抗原中的另一者包含DIG部分。
67.根据权利要求63或64所述的方法,其中所述第一半抗原和所述第二半抗原中的一者包含DNP部分,并且所述第一半抗原和所述第二半抗原中的另一者包含DIG部分。
68.根据权利要求67所述的方法,其中所述第三半抗原包含生物素部分,并且所述第三半抗原结合配偶体包含抗生物素蛋白。
69.根据权利要求65或68所述的方法,其中所述抗生物素蛋白是链霉抗生物素蛋白或中性抗生物素蛋白。
70.根据权利要求68或69所述的方法,其中所述抗生物素蛋白的一个或多个生物素结合位点被含生物素部分的分子或其类似物封端。
71.根据权利要求63至70中任一项所述的方法,其中所述第三亲和试剂包含一个或多个第一可检测标记和一个或多个第二可检测标记。
72.根据权利要求71所述的方法,其中所述第三亲和试剂包含根据权利要求29至42中任一项所述的多染料标记的蛋白组装系统。
73.根据权利要求51至72中任一项所述的方法,所述方法还包括第四类型的未标记核苷酸,其中所述第四类型的未标记核苷酸不能与任何所述亲和试剂特异性结合。
74.根据权利要求51至73中任一项所述的方法,其中步骤(e)还除去所掺入的核苷酸的所述可检测标记。
75.根据权利要求74所述的方法,其中所掺入的核苷酸的所述可检测标记和所述3'封端基团在单一化学反应中除去。
76.根据权利要求51至75中任一项所述的方法,所述方法还包括(f)用含水洗涤溶液洗涤所述固体载体。
77.根据权利要求76所述的方法,其中将步骤(b)至(f)重复至少50、100、150、200、250、300、400或500个循环以确定所述靶多核苷酸序列。
78.根据权利要求51至77中任一项所述的方法,其中所述四种类型的核苷酸包括dATP、dCTP、dGTP和dTTP或dUTP或它们的非天然核苷酸类似物。
79.根据权利要求51至78中任一项所述的方法,其中所述固定的靶多核苷酸在所述固体载体上的密度为至少约50,000/mm2。
80.根据权利要求51至79中任一项所述的方法,其中所述方法减少或消除序列环境效应。
81.一种标记的纳米颗粒,所述标记的纳米颗包含:
聚合物基质,所述聚合物基质包含多个可检测标记,其中聚合物的骨架包含一个或多个可裂解部分,并且其中所述标记的纳米颗粒在所述可裂解部分裂解后能够降解成较小的聚合链。
82.根据权利要求81所述的标记的纳米颗粒,其中所述多个可检测标记包括能够由波长介于约450nm至约460nm波长之间的光源激发的荧光团。
83.根据权利要求81或82所述的标记的纳米颗粒,其中所降解的纳米颗粒的所述较小聚合链是水溶性的。
84.根据权利要求81至83中任一项所述的标记的纳米颗粒,其中所述可裂解部分是可化学降解的、可酶促降解的、可热降解的或可光降解的。
85.根据权利要求81至84中任一项所述的标记的纳米颗粒,其中所述可裂解部分包含二硫化物、叠氮基或烯丙基部分、或它们的组合。
86.根据权利要求81至85中任一项所述的标记的纳米颗粒,其中所述聚合物包含交联或树枝状聚合物或脂质体。
87.根据权利要求81至86中任一项所述的标记的纳米颗粒,其中所述聚合物包含聚丙烯酰胺、聚乙醇酸(PGA)、聚乙烯醇(PVA)。
88.根据权利要求81至88中任一项所述的标记的纳米颗粒,其中所述多个可检测标记共价连接到所述聚合物基质。
89.根据权利要求81至88中任一项所述的标记的纳米颗粒,其中所述多个可检测标记被包封或物理限制在所述聚合物基质内。
90.根据权利要求81至89中任一项所述的标记的纳米颗粒,所述标记的纳米颗粒包含连接到其上的一种或多种蛋白。
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US202263347152P | 2022-05-31 | 2022-05-31 | |
US63/347,152 | 2022-05-31 | ||
US202363486082P | 2023-02-21 | 2023-02-21 | |
US63/486,082 | 2023-02-21 | ||
PCT/EP2023/064466 WO2023232829A1 (en) | 2022-05-31 | 2023-05-30 | Compositions and methods for nucleic acid sequencing |
Publications (1)
Publication Number | Publication Date |
---|---|
CN119301275A true CN119301275A (zh) | 2025-01-10 |
Family
ID=86710834
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202380043475.6A Pending CN119301275A (zh) | 2022-05-31 | 2023-05-30 | 用于核酸测序的组合物和方法 |
Country Status (4)
Country | Link |
---|---|
US (1) | US20230383342A1 (zh) |
CN (1) | CN119301275A (zh) |
AU (1) | AU2023281871A1 (zh) |
WO (1) | WO2023232829A1 (zh) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11293061B2 (en) | 2018-12-26 | 2022-04-05 | Illumina Cambridge Limited | Sequencing methods using nucleotides with 3′ AOM blocking group |
CN119095982A (zh) | 2022-12-22 | 2024-12-06 | 伊路米纳有限公司 | 用于边合成边测序的钯催化剂组合物和方法 |
CN119095983A (zh) | 2022-12-22 | 2024-12-06 | 伊路米纳有限公司 | 用于边合成边测序的过渡金属催化剂组合物和方法 |
WO2024145154A1 (en) | 2022-12-27 | 2024-07-04 | Illumina, Inc. | Methods of sequencing using 3´ allyl blocked nucleotides |
Family Cites Families (73)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB8822228D0 (en) | 1988-09-21 | 1988-10-26 | Southern E M | Support-bound oligonucleotides |
US5800992A (en) | 1989-06-07 | 1998-09-01 | Fodor; Stephen P.A. | Method of detecting nucleic acids |
US6346413B1 (en) | 1989-06-07 | 2002-02-12 | Affymetrix, Inc. | Polymer arrays |
DE3924454A1 (de) | 1989-07-24 | 1991-02-07 | Cornelis P Prof Dr Hollenberg | Die anwendung von dna und dna-technologie fuer die konstruktion von netzwerken zur verwendung in der chip-konstruktion und chip-produktion (dna chips) |
DK0604552T3 (da) | 1991-09-18 | 1997-08-04 | Affymax Tech Nv | Fremgangsmåde til syntese af forskellige samlinger af oligomerer |
DE69233087T2 (de) | 1991-11-22 | 2003-12-24 | Affymetrix, Inc. (N.D.Ges.D.Staates Delaware) | Verfahren zur Herstellung von Polymerarrays |
AU3728093A (en) | 1992-02-19 | 1993-09-13 | Public Health Research Institute Of The City Of New York, Inc., The | Novel oligonucleotide arrays and their use for sorting, isolating, sequencing, and manipulating nucleic acids |
US5583211A (en) | 1992-10-29 | 1996-12-10 | Beckman Instruments, Inc. | Surface activated organic polymers useful for location - specific attachment of nucleic acids, peptides, proteins and oligosaccharides |
WO1995011995A1 (en) | 1993-10-26 | 1995-05-04 | Affymax Technologies N.V. | Arrays of nucleic acid probes on biological chips |
JPH09502351A (ja) * | 1993-09-08 | 1997-03-11 | バクスター、インターナショナル、インコーポレイテッド | 正の細胞選択及び遊離のためのビオチン類縁体接合抗体 |
US5472672A (en) | 1993-10-22 | 1995-12-05 | The Board Of Trustees Of The Leland Stanford Junior University | Apparatus and method for polymer synthesis using arrays |
US6156501A (en) | 1993-10-26 | 2000-12-05 | Affymetrix, Inc. | Arrays of modified nucleic acid probes and methods of use |
US5429807A (en) | 1993-10-28 | 1995-07-04 | Beckman Instruments, Inc. | Method and apparatus for creating biopolymer arrays on a solid support surface |
US5807522A (en) | 1994-06-17 | 1998-09-15 | The Board Of Trustees Of The Leland Stanford Junior University | Methods for fabricating microarrays of biological samples |
US5846719A (en) | 1994-10-13 | 1998-12-08 | Lynx Therapeutics, Inc. | Oligonucleotide tags for sorting and identification |
US5556752A (en) | 1994-10-24 | 1996-09-17 | Affymetrix, Inc. | Surface-bound, unimolecular, double-stranded DNA |
US5624711A (en) | 1995-04-27 | 1997-04-29 | Affymax Technologies, N.V. | Derivatization of solid supports and methods for oligomer synthesis |
US5545531A (en) | 1995-06-07 | 1996-08-13 | Affymax Technologies N.V. | Methods for making a device for concurrently processing multiple biological chip assays |
DE69638321D1 (de) | 1995-10-11 | 2011-03-03 | Luminex Corp | Gleichzeitige mehrfachanalyse klinischer proben |
US5658734A (en) | 1995-10-17 | 1997-08-19 | International Business Machines Corporation | Process for synthesizing chemical compounds |
US6458530B1 (en) | 1996-04-04 | 2002-10-01 | Affymetrix Inc. | Selecting tag nucleic acids |
US6297006B1 (en) | 1997-01-16 | 2001-10-02 | Hyseq, Inc. | Methods for sequencing repetitive sequences and for determining the order of sequence subfragments |
ES2563643T3 (es) | 1997-04-01 | 2016-03-15 | Illumina Cambridge Limited | Método de secuenciación de ácido nucleico |
US6465178B2 (en) | 1997-09-30 | 2002-10-15 | Surmodics, Inc. | Target molecule attachment to surfaces |
US6485944B1 (en) | 1997-10-10 | 2002-11-26 | President And Fellows Of Harvard College | Replica amplification of nucleic acid arrays |
US6087102A (en) | 1998-01-07 | 2000-07-11 | Clontech Laboratories, Inc. | Polymeric arrays and methods for their use in binding assays |
US6287776B1 (en) | 1998-02-02 | 2001-09-11 | Signature Bioscience, Inc. | Method for detecting and classifying nucleic acid hybridization |
JP3944996B2 (ja) | 1998-03-05 | 2007-07-18 | 株式会社日立製作所 | Dnaプローブアレー |
US6031078A (en) | 1998-06-16 | 2000-02-29 | Millennium Pharmaceuticals, Inc. | MTbx protein and nucleic acid molecules and uses therefor |
DE69928265T3 (de) | 1998-07-30 | 2013-11-28 | Illumina Cambridge Ltd. | Matrizen von biomolekülen und ihre verwendung in sequenzierung |
GB0002310D0 (en) | 2000-02-01 | 2000-03-22 | Solexa Ltd | Polynucleotide sequencing |
AR021833A1 (es) | 1998-09-30 | 2002-08-07 | Applied Research Systems | Metodos de amplificacion y secuenciacion de acido nucleico |
US6277628B1 (en) | 1998-10-02 | 2001-08-21 | Incyte Genomics, Inc. | Linear microarrays |
US6391937B1 (en) | 1998-11-25 | 2002-05-21 | Motorola, Inc. | Polyacrylamide hydrogels and hydrogel arrays made from polyacrylamide reactive prepolymers |
WO2000063437A2 (en) | 1999-04-20 | 2000-10-26 | Illumina, Inc. | Detection of nucleic acid reactions on bead arrays |
US6355431B1 (en) | 1999-04-20 | 2002-03-12 | Illumina, Inc. | Detection of nucleic acid amplification reactions using bead arrays |
US6664061B2 (en) | 1999-06-25 | 2003-12-16 | Amersham Biosciences Ab | Use and evaluation of a [2+2] photoaddition in immobilization of oligonucleotides on a three-dimensional hydrogel matrix |
US6372813B1 (en) | 1999-06-25 | 2002-04-16 | Motorola | Methods and compositions for attachment of biomolecules to solid supports, hydrogels, and hydrogel arrays |
US6649414B1 (en) * | 1999-08-17 | 2003-11-18 | Luminex Corporation | Microparticles with multiple fluorescent signals and methods of using same |
US6770441B2 (en) | 2000-02-10 | 2004-08-03 | Illumina, Inc. | Array compositions and methods of making same |
EP1307414A2 (en) | 2000-08-09 | 2003-05-07 | Amersham Biosciences AB | The use and evaluation of a 2+2] photocycloaddition in immobilization of oligonucleotides on a three-dimensional hydrogel matrix |
ATE356222T1 (de) | 2000-10-06 | 2007-03-15 | Univ Columbia | Massives parallelverfahren zur dekodierung von dna und rna |
DK1560838T3 (da) | 2002-08-23 | 2009-09-07 | Illumina Cambridge Ltd | M rkede nuklotider |
DK3363809T3 (da) | 2002-08-23 | 2020-05-04 | Illumina Cambridge Ltd | Modificerede nukleotider til polynukleotidsekvensering |
GB0321306D0 (en) | 2003-09-11 | 2003-10-15 | Solexa Ltd | Modified polymerases for improved incorporation of nucleotide analogues |
GB0326073D0 (en) | 2003-11-07 | 2003-12-10 | Solexa Ltd | Improvements in or relating to polynucleotide arrays |
EP3175914A1 (en) | 2004-01-07 | 2017-06-07 | Illumina Cambridge Limited | Improvements in or relating to molecular arrays |
WO2006120433A1 (en) | 2005-05-10 | 2006-11-16 | Solexa Limited | Improved polymerases |
DK3029461T3 (en) * | 2006-11-01 | 2018-02-05 | Ventana Med Syst Inc | Haptenes, hapten conjugates, compositions thereof and processes for their preparation and use |
US20090004670A1 (en) * | 2007-06-29 | 2009-01-01 | Jingwu Zhang | Methods for fabricating surface enhanced fluorescent (sef) nanoparticles and their applications in bioassays |
US20120269721A1 (en) * | 2009-10-12 | 2012-10-25 | The Regents Of The University Of California | Targeted nanoclusters and methods of their use |
US20120071338A1 (en) * | 2010-07-15 | 2012-03-22 | Christopher Bowman | Polymerization-based amplification for immunostaining and biodetection |
HRP20211523T1 (hr) | 2011-09-23 | 2021-12-24 | Illumina, Inc. | Pripravci za sekvenciranje nukleinske kiseline |
EP2758475B1 (en) | 2011-09-23 | 2017-04-26 | Illumina Cambridge Limited | Dyes for labelling molecular ligands |
US9012022B2 (en) | 2012-06-08 | 2015-04-21 | Illumina, Inc. | Polymer coatings |
WO2014135221A1 (en) | 2013-03-08 | 2014-09-12 | Illumina Cambridge Ltd | Polymethine compounds and their use as fluorescent labels |
KR102230831B1 (ko) | 2013-03-15 | 2021-03-22 | 일루미나 케임브리지 리미티드 | 변형된 뉴클레오사이드 또는 뉴클레오타이드 |
GB201414098D0 (en) | 2014-08-08 | 2014-09-24 | Illumina Cambridge Ltd | Modified nucleotide linkers |
GB201508858D0 (en) | 2015-05-22 | 2015-07-01 | Illumina Cambridge Ltd | Polymethine compounds with long stokes shifts and their use as fluorescent labels |
GB201516987D0 (en) | 2015-09-25 | 2015-11-11 | Illumina Cambridge Ltd | Polymethine compounds and their use as fluorescent labels |
US10527614B2 (en) * | 2015-11-09 | 2020-01-07 | Bio-Rad Laboratories, Inc. | Assays using avidin and biotin |
US10385214B2 (en) | 2016-09-30 | 2019-08-20 | Illumina Cambridge Limited | Fluorescent dyes and their uses as biomarkers |
JP2020504074A (ja) | 2016-12-22 | 2020-02-06 | イルミナ ケンブリッジ リミテッド | クマリン化合物および蛍光標識としてのそれらの使用 |
GB201716931D0 (en) | 2017-10-16 | 2017-11-29 | Illumina Cambridge Ltd | New fluorescent compounds and their use as biomarkers |
CA3103719A1 (en) | 2018-10-31 | 2020-05-07 | Illumina, Inc. | Polymerases, compositions, and methods of use |
AU2018448937B2 (en) * | 2018-11-07 | 2024-08-15 | Qingdao MGI Tech Co., Ltd. | Method for sequencing polynucleotides |
CA3103739A1 (en) | 2018-12-05 | 2020-06-11 | Illumina, Inc. | Polymerases, compositions, and methods of use |
US11293061B2 (en) | 2018-12-26 | 2022-04-05 | Illumina Cambridge Limited | Sequencing methods using nucleotides with 3′ AOM blocking group |
SG11202012555UA (en) | 2019-03-01 | 2021-01-28 | Illumina Cambridge Ltd | Exocyclic amine-substituted coumarin compounds and their uses as fluorescent labels |
IL279660B2 (en) | 2019-03-01 | 2024-10-01 | Illumina Cambridge Ltd | Tertiary amine substituted coumarin compounds and their uses as fluorescent labels |
WO2021007458A1 (en) * | 2019-07-09 | 2021-01-14 | The Trustees Of Columbia University In The City Of New York | Novel nucleotide analogues and methods for use |
US11981964B2 (en) | 2020-07-28 | 2024-05-14 | Illumina Cambridge Limited | Substituted coumarin dyes and uses as fluorescent labels |
US20220195518A1 (en) * | 2020-12-22 | 2022-06-23 | Illumina Cambridge Limited | Methods and compositions for nucleic acid sequencing |
-
2023
- 2023-05-30 CN CN202380043475.6A patent/CN119301275A/zh active Pending
- 2023-05-30 WO PCT/EP2023/064466 patent/WO2023232829A1/en active Application Filing
- 2023-05-30 AU AU2023281871A patent/AU2023281871A1/en active Pending
- 2023-05-30 US US18/325,610 patent/US20230383342A1/en active Pending
Also Published As
Publication number | Publication date |
---|---|
AU2023281871A1 (en) | 2024-11-14 |
WO2023232829A1 (en) | 2023-12-07 |
US20230383342A1 (en) | 2023-11-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN115916908B (zh) | 长斯托克斯位移色烯并喹啉染料及其在测序应用中的用途 | |
RU2756272C2 (ru) | Кумарины, замещенные вторичными аминами, и их применение в качестве флуоресцентных меток | |
US12043637B2 (en) | Fluorescent dyes containing bis-boron fused heterocycles and uses in sequencing | |
JP2022515944A (ja) | 3’-ヒドロキシブロッキング基を有するヌクレオシドおよびヌクレオチド、ならびにそれらのポリヌクレオチドシーケンシング方法における使用 | |
KR20230031837A (ko) | 3' 아세탈 블로킹기를 갖는 뉴클레오시드 및 뉴클레오티드 | |
CN119301275A (zh) | 用于核酸测序的组合物和方法 | |
KR20230044364A (ko) | 치환된 쿠마린 염료 및 형광 표지로서의 용도 | |
US20230313292A1 (en) | Chromenoquinoline dyes and uses in sequencing | |
CN115996937B (zh) | 烷基吡啶正离子香豆素染料和在测序应用中的用途 | |
US20230416279A1 (en) | Fluorescent dyes containing fused tetracyclic bis-boron heterocycle and uses in sequencing | |
CN114829369A (zh) | 含环辛四烯的染料和组合物 | |
CN115803458A (zh) | 用于核酸测序的方法和组合物 | |
RU2818762C2 (ru) | Нуклеозиды и нуклеотиды с 3’-гидрокси блокирующими группами и их применение в способах секвенирования полинуклеотидов | |
US20240327910A1 (en) | Naphthalimide dyes and uses in nucleic acid sequencing | |
CN119213083A (zh) | 用于减少测序期间的光损伤的组合物和方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication |