[go: up one dir, main page]

CN119095984A - 使用3'烯丙基封端的核苷酸的测序方法 - Google Patents

使用3'烯丙基封端的核苷酸的测序方法 Download PDF

Info

Publication number
CN119095984A
CN119095984A CN202380031861.3A CN202380031861A CN119095984A CN 119095984 A CN119095984 A CN 119095984A CN 202380031861 A CN202380031861 A CN 202380031861A CN 119095984 A CN119095984 A CN 119095984A
Authority
CN
China
Prior art keywords
nucleotide
solid support
nucleotides
group
unlabeled
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202380031861.3A
Other languages
English (en)
Inventor
安托万·弗兰西斯
埃琳娜·克蕾西纳
凯瑟琳·哈廷
安杰莉卡·马里亚尼
吴晓琳
刘小海
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Illumina Inc
Original Assignee
Illumina Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Illumina Inc filed Critical Illumina Inc
Publication of CN119095984A publication Critical patent/CN119095984A/zh
Pending legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • C12Q1/6874Methods for sequencing involving nucleic acid arrays, e.g. sequencing by hybridisation
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B01PHYSICAL OR CHEMICAL PROCESSES OR APPARATUS IN GENERAL
    • B01JCHEMICAL OR PHYSICAL PROCESSES, e.g. CATALYSIS OR COLLOID CHEMISTRY; THEIR RELEVANT APPARATUS
    • B01J23/00Catalysts comprising metals or metal oxides or hydroxides, not provided for in group B01J21/00
    • B01J23/38Catalysts comprising metals or metal oxides or hydroxides, not provided for in group B01J21/00 of noble metals
    • B01J23/40Catalysts comprising metals or metal oxides or hydroxides, not provided for in group B01J21/00 of noble metals of the platinum group metals
    • B01J23/44Palladium
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/48Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving transferase
    • C12Q1/485Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving transferase involving kinase
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6806Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • C12Q1/6816Hybridisation assays characterised by the detection means
    • C12Q1/6823Release of bound markers
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2333/00Assays involving biological materials from specific organisms or of a specific nature
    • G01N2333/90Enzymes; Proenzymes
    • G01N2333/91Transferases (2.)
    • G01N2333/912Transferases (2.) transferring phosphorus containing groups, e.g. kinases (2.7)
    • G01N2333/91205Phosphotransferases in general
    • G01N2333/91245Nucleotidyltransferases (2.7.7)
    • G01N2333/9125Nucleotidyltransferases (2.7.7) with a definite EC number (2.7.7.-)
    • G01N2333/9126DNA-directed DNA polymerase (2.7.7.7)

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Health & Medical Sciences (AREA)
  • Wood Science & Technology (AREA)
  • Analytical Chemistry (AREA)
  • Microbiology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Molecular Biology (AREA)
  • Immunology (AREA)
  • Biotechnology (AREA)
  • Biophysics (AREA)
  • Biochemistry (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Materials Engineering (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本公开的实施方案涉及具有3'烯丙基封端基团的核苷酸。本文还提供了使用本文所述的具有3'烯丙基封端基团的核苷酸进行测序的方法以及测序试剂盒。

Description

使用3′烯丙基封端的核苷酸的测序方法
发明背景
技术领域
本公开整体涉及多核苷酸测序方法、组合物和用于测序的试剂盒。本公开还涉及除去3′封端基团的方法。
背景技术
一直以来,分子研究的进展在某种程度上是由用于表征分子或其生物反应的技术的改进所引起的。特别地,核酸DNA和RNA研究得益于对用于序列分析的技术的开发以及对杂交事件的研究。
已改进核酸研究的技术的一个示例是开发固定化核酸的装配阵列。这些阵列通常由固定到固体载体材料上的多核苷酸的高密度矩阵组成。参见例如,Fodor等人,TrendsBiotech.12:19-26,1994,其描述了使用化学敏化玻璃表面组装核酸的方法,该化学敏化玻璃表面受掩模保护,但在限定的区域暴露以允许附接经适当修饰的核苷酸亚磷酰胺。装配阵列也可以通过将已知的多核苷酸“点样”到固体载体上的预定位置的技术来制造(例如,Stimpson等人,Proc.Natl.Acad.Sci.92:6379-6383,1995)。
确定与阵列结合的核酸的核苷酸序列的一种方法称为“边合成边测序”或“SBS”。在理想情况下,用于测定DNA的核苷酸序列的这种技术需要有控制地(即,每次一个)掺入与正在测序的核酸相反的正确互补核苷酸。这使得能够通过在多个循环中添加核苷酸来准确测序,由于每次只测序一个核苷酸残基,从而防止不受控制地掺入核苷酸序列。使用与掺入的核苷酸附接的适当标记来读取掺入的核苷酸,之后除去该标记部分,并进行随后的下一轮测序。
为了确保仅掺入单个核苷酸,在每个标记的核苷酸中包括结构修饰(“保护基团”或“封端基团”),该结构修饰被添加到生长链以确保仅掺入一个核苷酸。在添加具有保护基团的核苷酸后,在不干扰正在测序的DNA的完整性的反应条件下除去该保护基团。然后可继续测序循环,掺入下一个受保护的标记核苷酸。为了用于DNA测序,核苷酸(通常是核苷酸三磷酸)一般需要3′-羟基封端基团,以便一旦在该核苷酸上添加碱基,就防止用于将其掺入多核苷酸链中的聚合酶继续复制。
之前已描述过可逆的保护基团。例如,Metzker等人(Nucleic Acids Research,22(20):4259-4267,1994)公开了八种3′-修饰的2-脱氧核糖核苷5′-三磷酸(3′-修饰的dNTP)的合成与用途,并在两种DNA模板测定中测试了它们的掺入活性。WO 2002/029003描述了一种测序方法,其可以包括在聚合酶反应中使用烯丙基保护基团来对DNA生长链上的3′-OH基团封端。此外,之前在国际申请专利公布号WO 2004/018497和WO 2014/139596中报告了对许多可逆保护基团的开发以及在DNA相容条件下移除这些保护基团的方法,这两份国际申请公开中的每一者据此全文以引用方式并入。尽管在20年前已经报道了3′烯丙基封端的核苷酸的使用,但是由于包括3′封端基团裂解化学的低效率以及测序期间信号强度的快速损失在内的各种因素,使用此类核苷酸的SBS从未成功地应用于用于长DNA读取的商业环境中。例如,Ju等人报道了使用3′烯丙基封端的核苷酸的四色DNA边合成边测序,并且报道了仅25个循环的SBS,其中仅在五个循环后荧光强度显著损失。参见Ju等人,PNAS,2006,103(52):19635-19640。因此,仍然需要改进测序条件(例如,3′烯丙基封端基团的裂解条件)和使用具有3′烯丙基封端基团的核苷酸的SBS的测序指标。
发明内容
本公开的一个方面涉及一种平行确定多个不同的靶多核苷酸的序列的方法,该方法包括:
(a)使固体载体与包含测序引物的溶液在杂交条件下接触,其中:
(i)该固体载体包含至少5,000,000个在空间上可区分的位点/cm2,该位点包含靶多核苷酸的多个拷贝;
(ii)该固体载体包含多个不同的靶多核苷酸;以及
(iii)该测序引物与该不同的靶多核苷酸的至少一部分互补;
(b)使该固体载体与包含DNA聚合酶和核苷酸A、G、C和T或U的水性溶液在适用于DNA聚合酶介导的引物延伸的条件下接触,其中每种核苷酸包含具有与3′氧原子附接的3′烯丙基封端基团的2′脱氧核糖部分;
(c)使该固体载体成像以确定所掺入的核苷酸的身份;
(d)使该固体载体与包含钯催化剂和三(羟烷基)膦的水性解封端溶液在适于从所掺入的核苷酸中化学除去3′烯丙基封端基团从而暴露3′-OH基团以用于在该固体载体上进行进一步核苷酸掺入的条件下接触;
(e)使所述固体载体与水性洗涤溶液接触;以及
(f)重复步骤(b)至(e)以确定靶多核苷酸序列。
本公开的另一方面涉及一种平行确定多个不同的靶多核苷酸的序列的方法,该方法包括:
(a)使固体载体与包含测序引物的溶液在杂交条件下接触,其中:
(i)该固体载体包含至少5,000,000个在空间上可区分的位点/cm2,该位点包含靶多核苷酸的多个拷贝;
(ii)该固体载体包含多个不同的靶多核苷酸;以及
(iii)该测序引物与不同的靶多核苷酸的至少一部分互补;
(b)使该固体载体与包含DNA聚合酶和核苷酸A、G、C和T或U的水性溶液在适用于DNA聚合酶介导的引物延伸的条件下接触,其中:
(i)至少三种类型的核苷酸中的每一种类型独立地包含经由可裂解接头与可检测标记附接的碱基,并且该可裂解接头包含选自由以下项组成的组的部分:
并且*指示该部分与核苷酸的其余部分连接的位置;
(ii)每种核苷酸包含具有与3′氧原子附接的3′烯丙基基团的2′脱氧核糖部分;以及
(iii)该DNA聚合酶是改变的古细菌DNA聚合酶;
(c)使该固体载体与包含一种或多种自由基清除剂的溶液接触,并且使该固体载体成像以确定所掺入的核苷酸的身份;
(d)使该固体载体与包含钯催化剂和三(羟烷基)膦的水性解封端溶液在适于(i)从所掺入的核苷酸中化学除去3′烯丙基封端基团从而暴露3′-OH基团以用于在该固体载体上进行进一步核苷酸掺入;以及(ii)化学除去经由可裂解接头附接的可检测标记的条件下接触;
(e)使所述固体载体与包含钯清除剂的水性洗涤溶液接触;以及
(f)重复步骤(b)至(e)以确定靶多核苷酸序列。
本公开的另一方面涉及一种平行确定多个不同的靶多核苷酸的序列的方法,该方法包括:
(a)使固体载体与包含测序引物的溶液在杂交条件下接触,其中:
(i)该固体载体包含至少5,000,000个在空间上可区分的位点/cm2,该位点包含靶多核苷酸的多个拷贝;
(ii)该固体载体包含多个不同的靶多核苷酸;以及
(iii)所述测序引物与所述不同的靶多核苷酸的至少一部分互补;
(b)使该固体载体与包含DNA聚合酶和核苷酸A、G、C和T或U的水性溶液在适用于DNA聚合酶介导的引物延伸的条件下接触,其中:
(i)该核苷酸中的至少一种核苷酸包含经由可裂解接头与可检测标记附接的碱基;以及
(ii)该核苷酸各自包含具有与3′氧原子附接的3′烯丙基封端基团的2′脱氧核糖部分;
(c)使该固体载体与包含一种或多种自由基清除剂的溶液接触,并且使该固体载体成像以确定所掺入的核苷酸的身份;
(d)使该固体载体与包含钯催化剂和三(羟烷基)膦的水性解封端溶液在适于(i)从所掺入的核苷酸中化学除去3′烯丙基基团从而暴露3′-OH基团以用于在该固体载体上进行进一步核苷酸掺入;以及(ii)化学除去经由可裂解接头附接的可检测标记的条件下接触;
(e)使所述固体载体与水性洗涤溶液接触;以及
(f)重复步骤(b)至(e)以确定靶多核苷酸序列。
本公开的另一方面涉及一种平行确定多个不同的靶多核苷酸的序列的方法,该方法包括:
(a)使固体载体与包含测序引物的溶液在杂交条件下接触,其中:
(i)该固体载体包含至少5,000,000个在空间上可区分的位点/cm2,该位点包含靶多核苷酸的多个拷贝;
(ii)该固体载体包含多个不同的靶多核苷酸;以及
(iii)该测序引物与该不同的靶多核苷酸的至少一部分互补;
(b)使该固体载体与包含DNA聚合酶和四种类型的核苷酸A、G、C和T或U中的一种或多种类型的水性掺入混合物在适用于DNA聚合酶介导的引物延伸的条件下接触,其中:
(i)该核苷酸各自包含具有与3′氧原子附接的3′烯丙基封端基团
的2′脱氧核糖部分;
(ii)至少一种类型的核苷酸是未标记的;以及
(iii)第一类型的未标记的核苷酸包含第一官能部分;
(c)使所延伸的拷贝多核苷酸与包含第一标记试剂的水性标记混合物接触,其中该第一标记试剂包含一个或多个第一可检测标记和能够与第一类型的未标记的核苷酸的第一官能部分特异性结合的第一结合部分;
(d)使该固体载体成像并且执行一次或多次荧光测量以确定所掺入的核苷酸的身份;
(e)使该固体载体与包含钯催化剂和三(羟烷基)膦的水性解封端溶液在适于(i)从所掺入的核苷酸中化学除去3′烯丙基基团从而暴露3′-OH基团以用于在该固体载体上进行进一步核苷酸掺入的条件下接触;
(f)使所述固体载体与水性洗涤溶液接触;以及
(g)重复步骤(b)至(f)以确定靶多核苷酸序列。
本公开的进一步方面涉及一种测序试剂盒,该测序试剂盒包含:
(a)包含DNA聚合酶和核苷酸A、G、C和T或U的掺入混合物,其中:
(i)该核苷酸包含具有与3′碳原子附接的3′烯丙基基团的2′脱氧核糖部分;以及
(ii)该DNA聚合酶是改变的古细菌DNA聚合酶;
(b)包含钯催化剂、三(羟烷基)膦和一种或多种缓冲液试剂的水性解封端溶液,该水性解封端溶液适于(i)从掺入的核苷酸中化学除去3′烯丙基基团从而暴露3′-OH基团以用于在该固体载体上进行进一步核苷酸掺入;以及(ii)化学除去经由可裂解接头附接的可检测标记;以及
(c)包含Pd(II)清除剂的水性洗涤溶液;
其中所述试剂盒被配置用于执行至少约100个循环的边合成边测序。
在本文所述的方法或试剂盒的一些实施方案中,三(羟烷基)膦包含或为三(羟丙基)膦(THPP)。
附图说明
图1是在Pd裂解溶液动力学测定中作为时间函数的具有3′烯丙基封端基团的核苷与具有3′AOM封端基团的核苷相比的峰面积百分比的线形图。
图2是在三种不同的3′封端的核苷单磷酸的Pd裂解溶液动力学测定中作为时间函数的3′-OH核苷单磷酸形成百分比的线形图。
图3A是在Illumina的iSeq100TM仪器上使用具有3′烯丙基封端基团或3′AOM封端基团的三种不同的完全官能化的T核苷酸(ffT)进行的标准边合成边测序运行的错误率百分比的线形图。
图3B是在Illumina的iSeq100TM仪器上使用具有3′烯丙基封端基团或3′AOM封端基团的三种不同的完全官能化的T核苷酸(ffT)进行的标准边合成边测序运行的定相百分比的线形图。
图4A是在Illumina的仪器上在掺入后标记工作流中使用具有3′烯丙基封端基团或3′AOM封端基团的两种不同的完全官能化的T核苷酸(ffT)进行的边合成边测序运行的错误率百分比的线形图。
图4B是在Illumina的仪器上在掺入后标记工作流中使用具有3′烯丙基封端基团或3′AOM封端基团的两种不同的完全官能化的T核苷酸(ffT)进行的边合成边测序运行的定相百分比的线形图。
具体实施方式
本公开的一些方面涉及使用具有3′烯丙基封端基团的核苷酸进行核酸测序的方法。特别地,本文所述的测序方法涉及使用由Pd(II)络合物和水溶性三(羟烷基)膦形成的Pd(0)催化剂,以在边合成边测序的每个循环后裂解3′烯丙基封端基团。在一些实施方案中,水溶性膦是THPP。该方法还涉及使用Pd(0)和/或Pd(II)清除剂。在另外的实施方案中,在测序方法的掺入步骤中使用的核苷酸是标记的核苷酸,其中可检测标记经由含有烯丙基部分的可裂解接头与核碱基共价附接。3′烯丙基封端核苷酸可用于标记核苷酸的标准SBS设置中,或用于未标记核苷酸的掺入后标记工作流中。
定义
除非另有定义,否则本文所用的所有技术和科学术语的含义与本领域的普通技术人员通常理解的含义相同。术语“包含”以及如“包括”等其他形式的使用不具限制性。术语“具有”使用不具限制性。如本说明书中所用,无论是在过渡短语中还是在权利要求的正文中,术语“包含”和“包括”都将被解释为具有开放式含义。即,上述术语应与短语“至少具有”或“至少包括”同义地解释。例如,当在过程的上下文中使用时,术语“包含”表示该过程至少包括所列举的步骤,但是也可包括额外步骤。当在化合物、组合物或设备的上下文中使用时,术语“包含”是指该化合物、组合物或设备至少包含所列举的特征或组分,但是也可包含额外特征或组分。
在提供值的范围的情况下,应当理解,该范围的上限和下限以及上限与下限之间的每个中间值均涵盖在这些实施方案内。
如本文所用,常见的有机缩写定义如下:
℃ 以摄氏度计的温度
dATP 三磷酸脱氧腺苷
dCTP 三磷酸脱氧胞苷
dGTP 三磷酸脱氧鸟苷
dTTP 三磷酸脱氧胸苷
ddNTP 三磷酸双脱氧核苷酸
ffN 完全官能化核苷酸
ffA 完全官能化“A”核苷酸
ffC 完全官能化“C”核苷酸
ffT 完全官能化“T”核苷酸
ffG 完全官能化“G”核苷酸
IMX 掺入混合物
Pd 钯
RT 室温
SBS 边合成边测序
TCEP 三(2-羧乙基)膦
THPP 三(羟丙基)膦
如本文所用,术语“阵列”是指连接到一个或多个底物的一组不同探针分子,使得这些不同探针分子可根据相对位置彼此区分。阵列可包括各自位于底物上的不同可寻址位置处的不同探针分子。替代性地或另外地,阵列可包括各自带有不同探针分子的单独底物,其中可根据底物在底物所附接到的表面上的位置或根据底物在液体中的位置来识别不同的探针分子。其中单独基底位于表面上的示例性阵列包括但不限于在孔中包含珠粒的那些,如例如美国专利号6,355,431B1、US2002/0102578和PCT公布号WO 00/63437中所述的。例如,在美国专利号6,524,793中描述了在本发明中可用于例如使用微流体装置,诸如荧光活化细胞分选器(FACS)区分液体阵列中的珠粒的示例性形式。可用于本发明的阵列的另外的示例包括但不限于美国专利号5,429,807;5,436,327;5,561,071;5,583,211;5,658,734;5,837,858;5,874,219;5,919,523;6,136,269;6,287,768;6,287,776;6,288,220;6,297,006;6,291,193;6,346,413;6,416,949;6,482,591;6,514,751和6,610,482;和WO 93/17126;WO 95/11995;WO 95/35505;EP 742 287;和EP 799 897中描述的那些。
如本文所用,术语“共价附接的”或“共价键合的”是指形成特征在于原子之间共用电子对的化学键合。例如,共价连接的聚合物涂层是指与底物的官能化表面形成化学键的聚合物涂层,这与经由其他方式(例如,粘附或静电相互作用)附接到该表面形成比较。应当理解,共价附接到表面的聚合物也可以经由除共价附接之外的方式键合。
如本文所用,任何“R”基团均表示可以附接到指定原子的取代基。R基团可为取代的或未取代的。
应当理解,根据上下文,某些基团命名惯例可以包括单基或二基。例如,当取代基需要两个与分子其余部分的附接点时,应当理解,该取代基为二基。例如,被识别为需要两个附接点的烷基的取代基包括二基,诸如–CH2–、–CH2CH2–、–CH2CH(CH3)CH2–等。其他基团命名惯例清楚地指示该基团为二基,诸如“亚烷基”或“亚烯基”。
如本文所用,术语“卤素”或“卤代基”意味着元素周期表第7列的放射性稳定原子中的任一种,例如,氟、氯、溴或碘,其中氟和氯是优选的。
如本文所用,其中“a”和“b”是整数的“Ca至Cb”、“Ca-Cb”或“Ca-b”是指烷基、烯基或炔基基团中的碳原子数,或环烷基或芳基基团的环原子数。即,烷基、烯基、炔基、环烷基的环和芳基的环可以含有“a”至“b”个(包括端值在内)的碳原子。例如,“C1至C4烷基”基团是指具有1个至4个碳的所有烷基基团,即CH3-、CH3CH2-、CH3CH2CH2-、(CH3)2CH-、CH3CH2CH2CH2-、CH3CH2CH(CH3)-和(CH3)3C-;C3至C4环烷基基团是指具有3至4个碳原子的所有环烷基基团,即环丙基和环丁基。类似地,“4至6元杂环基”基团是指具有4至6个总环原子的所有杂环基基团,例如氮杂环丁烷、氧杂环丁烷、噁唑啉、吡咯烷、哌啶、哌嗪、吗啉等。如果对于烷基、烯基、炔基、环烷基或芳基基团没有指定“a”和“b”,则将假设这些定义中描述的最广泛范围。如本文所用,术语“C1-C6”包括C1、C2、C3、C4、C5和C6,以及由这两个数字中的任一者定义的范围。例如,C1-C6烷基包括C1烷基、C2烷基、C3烷基、C4烷基、C5烷基和C6烷基、C2-C6烷基、C1-C3烷基等。类似地,C2-C6烯基包括C2烯基、C3烯基、C4烯基、C5烯基和C6烯基、C2-C5烯基、C3-C4烯基等;并且C2-C6炔基包括C2炔基、C3炔基、C4炔基、C5炔基和C6炔基、C2-C5炔基、C3-C4炔基等。C3-C8环烷基各自包括含有3、4、5、6、7和8个碳原子或由任何两个数字限定的范围的烃环,诸如C3-C7环烷基或C5-C6环烷基。
如本文所用,“烷基”是指完全饱和(即,不包含双键和三键)的直链或支链烃链。烷基基团可具有1至20个碳原子(每当在本文中出现时,诸如“1至20”的数值范围是指给定范围内的每个整数;例如,“1至20个碳原子”意味着烷基基团可以由1个碳原子、2个碳原子、3个碳原子等,最多至并包括20个碳原子组成,但本定义还涵盖出现其中没有指定数值范围的术语“烷基”)。烷基基团还可以是具有1至9个碳原子的中等大小烷基。烷基基团还可以是具有1至6个碳原子的低级烷基。烷基基团可以被命名为“C1-C4烷基”或类似的名称。仅以举例的方式,“C1-C6烷基”表示烷基链中存在一至六个碳原子,即,烷基链选自由甲基、乙基、丙基、异丙基、正丁基、异丁基、仲丁基和叔丁基组成的组。典型的烷基基团包括但绝不限于甲基、乙基、丙基、异丙基、丁基、异丁基、叔丁基、戊基、己基等。
如本文所用,“烷氧基”是指式–OR(其中R为如上文所定义的烷基),诸如“C1-C9烷氧基”,包括但不限于甲氧基、乙氧基、正丙氧基、1-甲基乙氧基(异丙氧基)、正丁氧基、异丁氧基、仲丁氧基和叔丁氧基等。
如本文所用,“烯基”是指包含一个或多个双键的直链或支链烃链。烯基基团可以具有2至20个碳原子,但本定义还涵盖出现其中没有指定数值范围的术语“烯基”。烯基基团还可以是具有2至9个碳原子的中等大小烯基。烯基基团还可以是具有2至6个碳原子的低级烯基。烯基基团可以被命名为“C2-C6烯基”或类似的名称。仅以举例的方式,“C2-C6烯基”表示烯基链中存在两至六个碳原子,即,烯基链选自由乙烯基、丙烯-1-基、丙烯-2-基、丙烯-3-基、丁烯-1-基、丁烯-2-基、丁烯-3-基、丁烯-4-基、1-甲基-丙烯-1-基、2-甲基-丙烯-1-基、1-乙基-乙烯-1-基、2-甲基-丙烯-3-基、丁-1,3-二烯基、丁-1,2-二烯基和丁-1,2-二烯-4-基组成的组。典型的烯基基团包括但绝不限于乙烯基、丙烯基、丁烯基、戊烯基和己烯基等。
术语“芳族”是指具有共轭π电子体系的环或环系,并且包括碳环芳族基团(例如,苯基)和杂环芳族基团(例如,吡啶)两者。该术语包括单环基团或稠环多环(即,共用相邻原子对的环)基团,前提条件是整个环系是芳族的。
如本文所用,“芳基”是指在环骨架中仅包含碳的芳族环或环系(即,共用两个相邻碳原子的两个或更多个稠环)。当芳基为环系时,该环系中的每个环均为芳族的。芳基基团可以具有6至18个碳原子,但本定义还涵盖出现其中没有指定数值范围的术语“芳基”。在一些实施方案中,芳基基团具有6至10个碳原子。芳基基团可以被命名为“C6-C10芳基”、“C6或C10芳基”或类似的名称。芳基基团的示例包括但不限于苯基、萘基、薁基和蒽基。
“芳烷基”或“芳基烷基”为作为取代基经由亚烷基基团连接的芳基基团,诸如“C7-14芳烷基”等,包括但不限于苄基、2-苯基乙基、3-苯基丙基和萘基烷基。在一些情况下,亚烷基基团为低级亚烷基基团(即,C1-C6亚烷基基团)。
如本文所用,“芳氧基”是指RO-,其中R是如上文所定义的芳基,诸如但不限于苯基。
如本文所用,“杂芳基”是指在环骨架中含有一个或多个杂原子(即,除碳之外的元素,包括但不限于氮、氧和硫)的芳族环或环系(即,共用两个相邻原子的两个或更多个稠环)。当杂芳基是环系时,该环系中的每个环均是芳族的。杂芳基基团可以具有5至18个环成员(即,构成环骨架的原子(包括碳原子和杂原子)的数目),但本定义还涵盖出现其中没有指定数值范围的术语“杂芳基”。在一些实施方案中,杂芳基基团具有5至10个环成员或者5至7个环成员。杂芳基基团可以被命名为“5至7元杂芳基”、“5至10元杂芳基”或类似的名称。杂芳基环的示例包括但不限于呋喃基、噻吩基、酞嗪基、吡咯基、噁唑基、噻唑基、咪唑基、吡唑基、异噁唑基、异噻唑基、三唑基、噻二唑基、吡啶基、哒嗪基、嘧啶基、吡嗪基、三嗪基、喹啉基、异喹啉基、苯并咪唑基、苯并噁唑基、苯并噻唑基、吲哚基、异吲哚基和苯并噻吩基。
“杂芳烷基”或“杂芳基烷基”为作为取代基经由亚烷基基团连接的杂芳基基团。示例包括但不限于2-噻吩基甲基、3-噻吩基甲基、呋喃基甲基、噻吩基乙基、吡咯基烷基、吡啶基烷基、异噁唑基烷基和咪唑基烷基。在一些情况下,亚烷基基团为低级亚烷基基团(即,C1-C6亚烷基基团)。
如本文所用,“碳环基”意味着在环系骨架中仅含有碳原子的非芳族环状环或环系。当碳环基为环系时,两个或更多个环可以以稠合、桥接或螺接的方式接合在一起。碳环基可以具有任何饱和度,前提条件是环系中的至少一个环不是芳族的。因此,碳环基包括环烷基、环烯基和环炔基。碳环基基团可以具有3至20个碳原子,但本定义还涵盖出现其中没有指定数值范围的术语“碳环基”。碳环基基团也可以是具有3至10个碳原子的中等大小碳环基。碳环基基团也可以是具有3至6个碳原子的碳环基。碳环基基团可以被命名为“C3-C6碳环基”或类似的名称。碳环基环的示例包括但不限于环丙基、环丁基、环戊基、环己基、环己烯基、2,3-二氢-茚、双环[2.2.2]辛烷基、金刚烷基和螺[4.4]壬烷基。
如本文所用,“环烷基”意味着完全饱和的碳环基环或环系。示例包括环丙基、环丁基、环戊基和环己基。
如本文所用,“杂环基”是指在环骨架中含有至少一个杂原子的非芳族环状环或环系。杂环基可以稠合、桥接或螺接的方式接合在一起。杂环基可具有任何饱和度,前提条件是环系中的至少一个环不是芳族的。杂原子可以存在于环系中的非芳族环或芳族环中。杂环基基团可以具有3至20个环元(即,构成环骨架的原子(包括碳原子和杂原子)的数目),但本定义还涵盖出现其中没有指定数值范围的术语“杂环基”。杂环基基团也可以是具有3至10个环元的中等大小杂环基。杂环基基团也可以是具有3至6个环元的杂环基。杂环基基团可以被命名为“3至6元杂环基”或类似的名称。在优选的六元单环杂环基中,杂原子选自O、N或S中的一个至最多三个,并且在优选的五元单环杂环基中,杂原子选自一个或两个选自O、N或S的杂原子。杂环基环的示例包括但不限于吖庚因基、吖啶基、咔唑基、噌啉基、二氧戊环基、咪唑啉基、咪唑烷基、吗啉基、环氧乙烷基、氧杂环庚烷基、硫杂环庚烷基、哌啶基、哌嗪基、二氧代哌嗪基、吡咯烷基、吡咯烷酮基、吡咯烷二酮基、4-哌啶酮基、吡唑啉基、吡唑烷基、1,3-二噁英基、1,3-二噁烷基、1,4-二噁英基、1,4-二噁烷基、1,3-氧硫杂环己烷基、1,4-氧硫杂环己烯基、1,4-氧硫杂环己烷基、2H-1,2-噁嗪基、三噁烷基、六氢-1,3,5-三嗪基、1,3-间二氧杂环戊烯基、1,3-二氧戊环基、1,3-二噻吩基、1,3-二噻烷基、异噁唑啉基、异噁唑烷基、噁唑啉基、噁唑烷基、噁唑烷酮基、噻唑啉基、噻唑烷基、1,3-氧硫杂环戊烷基、二氢吲哚基、异二氢吲哚基、四氢呋喃基、四氢吡喃基、四氢噻吩基、四氢噻喃基、四氢-1,4-噻嗪基、硫代吗啉基、二氢苯并呋喃基、苯并咪唑烷基和四氢喹啉。
如本文所用,“(芳基)烷基”是指作为取代基经由如上文所述的亚烷基基团连接的如上文所定义的芳基基团。芳烷基的亚烷基和芳基基团可为取代的或未取代的。示例包括但不限于苄基、2-苯基烷基、3-苯基烷基和萘基烷基。在一些实施方案中,亚烷基是含有1、2、3、4、5或6个亚甲基单元的未取代的直链。
如本文所用,“(杂芳基)烷基”是指作为取代基经由如上文所定义的亚烷基基团连接的如上文所定义的杂芳基基团。杂芳烷基的亚烷基和杂芳基基团可为取代的或未取代的。示例包括但不限于2-噻吩基烷基、3-噻吩基烷基、呋喃基烷基、噻吩基烷基、吡咯基烷基、吡啶基烷基、异噁唑基烷基和咪唑基烷基,以及它们的苯并稠合类似物。在一些实施方案中,亚烷基是含有1、2、3、4、5或6个亚甲基单元的未取代的直链。
如本文所用,“(杂环基)烷基”是指作为取代基经由如上文所定义的亚烷基基团连接的如上文所定义的杂环或杂环基基团。(杂环基)烷基的亚烷基基团和杂环基基团可以是取代的或未取代的。示例包括但不限于(四氢-2H-吡喃-4-基)甲基、(哌啶-4-基)乙基、(哌啶-4-基)丙基、(四氢-2H-噻喃-4-基)甲基和(1,3-噻嗪烷-4-基)甲基。在一些实施方案中,亚烷基是含有1、2、3、4、5或6个亚甲基单元的未取代的直链。
如本文所用,“(碳环基)烷基”是指作为取代基经由亚烷基基团连接的碳环基基团(如本文所定义的)。示例包括但不限于环丙基甲基、环丁基甲基、环戊基乙基和环己基丙基。在一些实施方案中,亚烷基是含有1、2、3、4、5或6个亚甲基单元的未取代的直链。
如本文所用,“烷氧基烷基”或“(烷氧基)烷基”是指经由亚烷基基团连接的烷氧基基团,诸如C2-C8烷氧基烷基或(C1-C6烷氧基)C1-C6烷基,例如–(CH2)1-3-OCH3
如本文所用,“-O-烷氧基烷基”或“-O-(烷氧基)烷基”是指经由–O-(亚烷基)基团连接的烷氧基基团,诸如–O-(C1-C6烷氧基)C1-C6烷基,例如–O-(CH2)1-3-OCH3
如本文所用,“卤代烷基”是指其中一个或多个氢原子被卤素取代的烷基基团(例如,单卤代烷基、二卤代烷基和三卤代烷基)。此类基团包括但不限于氯甲基、氟甲基、二氟甲基、三氟甲基和1-氯-2-氟甲基、2-氟异丁基。卤代烷基可为取代的或未取代的。
如本文所用,“卤代烷氧基”是指其中一个或多个氢原子被卤素取代的烷氧基基团(例如,单卤代烷氧基、二卤代烷氧基和三卤代烷氧基)。此类基团包括但不限于氯甲氧基、氟甲氧基、二氟甲氧基、三氟甲氧基和1-氯-2-氟甲氧基、2-氟异丁氧基。卤代烷氧基可为取代的或未取代的。
“氨基”基团是指–NH2基团。如本文所用,术语“单取代的氨基基团”是指其中一个氢原子被取代基取代的氨基(-NH2)基团。如本文所用,术语“二取代的氨基基团”是指其中两个氢原子中的每个均被取代基取代的氨基(-NH2)基团。如本文所用,术语“任选地取代的氨基”是指-NRARB基团,其中RA和RB独立地为氢、烷基、环烷基、芳基、杂芳基、杂环基、芳烷基或杂环基(烷基),如本文所定义的。
“O-羧基”基团是指其中R选自氢、C1-C6烷基、C2-C6烯基、C2-C6炔基、C3-C7碳环基、C6-C10芳基、5至10元杂芳基和3至10元杂环基的“-OC(=O)R”基团,如本文所定义的。
“C-羧基”基团是指其中R选自由氢、C1-C6烷基、C2-C6烯基、C2-C6炔基、C3-C7碳环基、C6-C10芳基、5至10元杂芳基和3至10元杂环基组成的组的“-C(=O)OR”基团,如本文所定义的。非限制性示例包括羧基(即,-C(=O)OH)。
“磺酰基”基团是指其中R选自氢、C1-C6烷基、C2-C6烯基、C2-C6炔基、C3-C7碳环基、C6-C10芳基、5至10元杂芳基和3至10元杂环基的“-SO2R”基团,如本文所定义的。
“亚磺酸基”基团是指“-S(=O)OH”基团。
“磺基”基团是指“-S(=O)2OH”或“-SO3H”基团。
“磺酸根”基团是指“-SO3ˉ”基团。
“硫酸根”基团是指“-SO4ˉ”基团。
“S-亚磺酰氨基”基团是指其中RA和RB各自独立地选自氢、C1-C6烷基、C2-C6烯基、C2-C6炔基、C3-C7碳环基、C6-C10芳基、5至10元杂芳基和3至10元杂环基的“-SO2NRARB”基团,如本文所定义的。
“N-亚磺酰氨基”基团是指其中RA和RB各自独立地选自氢、C1-C6烷基、C2-C6烯基、C2-C6炔基、C3-C7碳环基、C6-C10芳基、5至10元杂芳基和3至10元杂环基的“-N(RA)SO2RB”基团,如本文所定义的。
“C-酰氨基”基团是指其中RA和RB各自独立地选自氢、C1-C6烷基、C2-C6烯基、C2-C6炔基、C3-C7碳环基、C6-C10芳基、5至10元杂芳基和3至10元杂环基的“-C(=O)NRARB”基团,如本文所定义的。
“N-酰氨基”基团是指其中RA和RB各自独立地选自氢、C1-C6烷基、C2-C6烯基、C2-C6炔基、C3-C7碳环基、C6-C10芳基、5至10元杂芳基和3至10元杂环基的“-N(RA)C(=O)RB”基团,如本文所定义的。
“O-氨甲酰基”基团是指“-OC(=O)N(RARB)”基团,其中RA和RB可以与S-亚磺酰氨基的定义相同。O-氨甲酰基可为取代的或未取代的。
“N-氨甲酰基”基团是指“ROC(=O)N(RA)-”基团,其中R和RA可以与N-亚磺酰氨基的定义相同。N-氨甲酰基可为取代的或未取代的。
“O-硫代氨甲酰基”基团是指“-OC(=S)-N(RARB)”基团,其中RA和RB可以与S-亚磺酰氨基的定义相同。O-硫代氨甲酰基可为取代的或未取代的。
“N-硫代氨甲酰基”基团是指“ROC(=S)N(RA)-”基团,其中R和RA可以与N-亚磺酰氨基的定义相同。N-硫代氨甲酰基可为取代的或未取代的。
术语“烷基氨基”或“(烷基)氨基”是指其中一个或两个氢被烷基基团取代的氨基基团。
“(烷氧基)烷基”基团是指经由亚烷基基团连接的烷氧基基团,诸如“(C1-C6烷氧基)C1-C6烷基”等。
如本文所用的术语“羟基”是指–OH基团。
如本文所用的术语“氰基”是指“-CN”基团。
如本文所用的术语“叠氮基”是指–N3基团。
当基团被描述为“任选地取代的”时,其可以是未取代的或取代的。同样,当基团被描述为“取代的”时,取代基可以选自所指示的取代基中的一者或多者。如本文所用,取代的基团衍生自未取代的母体基团,其中已存在一个或多个氢原子与另一个原子或基团的交换。除非另外指明,否则当基团被认为是“取代的”时,这意味着该基团被一个或多个取代基取代,该取代基独立地选自:C1-C6烷基、C1-C6烯基、C1-C6炔基、C1-C6杂烷基、C3-C7碳环基(任选地被卤代基、C1-C6烷基、C1-C6烷氧基、C1-C6卤代烷基和C1-C6卤代烷氧基取代)、C3-C7碳环基-C1-C6-烷基(任选地被卤代基、C1-C6烷基、C1-C6烷氧基、C1-C6卤代烷基和C1-C6卤代烷氧基取代)、3-10元杂环基(任选地被卤代基、C1-C6烷基、C1-C6烷氧基、C1-C6卤代烷基和C1-C6卤代烷氧基取代)、3-10元杂环基-C1-C6-烷基(任选地被卤代基、C1-C6烷基、C1-C6烷氧基、C1-C6卤代烷基和C1-C6卤代烷氧基取代)、芳基(任选地被卤代基、C1-C6烷基、C1-C6烷氧基、C1-C6卤代烷基和C1-C6卤代烷氧基取代)、(芳基)C1-C6烷基(任选地被卤代基、C1-C6烷基、C1-C6烷氧基、C1-C6卤代烷基和C1-C6卤代烷氧基取代)、5-10元杂芳基(任选地被卤代基、C1-C6烷基、C1-C6烷氧基、C1-C6卤代烷基和C1-C6卤代烷氧基取代)、(5-10元杂芳基)C1-C6烷基(任选地被卤代基、C1-C6烷基、C1-C6烷氧基、C1-C6卤代烷基和C1-C6卤代烷氧基取代)、卤代基、-CN、羟基、C1-C6烷氧基、(C1-C6烷氧基)C1-C6烷基、-O(C1-C6烷氧基)C1-C6烷基;(C1-C6卤代烷氧基)C1-C6烷基;-O(C1-C6卤代烷氧基)C1-C6烷基;芳氧基、巯基(氢硫基)、卤代(C1-C6)烷基(例如,–CF3)、卤代(C1-C6)烷氧基(例如,–OCF3)、C1-C6烷硫基、芳硫基、氨基、氨基(C1-C6)烷基、硝基、O-氨甲酰基、N-氨甲酰基、O-硫代氨甲酰基、N-硫代氨甲酰基、C-酰氨基、N-酰氨基、S-亚磺酰氨基、N-亚磺酰氨基、C-羧基、O-羧基、酰基、氰酸根、异氰酸根、硫氰酸根、异硫氰酸根、亚磺酰基、磺酰基、-SO3H、磺酸根、硫酸根、亚磺基、-OSO2C1-4烷基、单磷酸根、二磷酸根、三磷酸根和氧代基(=O)。在基团被描述为“任选地取代的”的任何地方,该基团可以被上述取代基取代。
如本领域的普通技术人员所理解的,本文所述的化合物可以以离子化形式存在,例如,-CO2 ˉ、-SO3 ˉ或–O-SO3 ˉ。如果化合物包含带正电荷或带负电荷的取代基基团,例如,-SO3 ˉ,则其还可以包含带负电荷或带正电荷的抗衡离子,使得该化合物整体为中性的。在其他方面,该化合物可以以盐形式存在,其中抗衡离子由共轭酸或碱提供。
如本文所用,“核苷酸”包括含氮杂环碱基、糖以及一个或多个磷酸基团。它们是核酸序列的单体单元。在RNA中,糖为核糖,并且在DNA中为脱氧核糖,即,缺乏存在于核糖中的羟基基团的糖。含氮杂环碱基可为嘌呤或嘧啶碱基。嘌呤碱基包括腺嘌呤(A)和鸟嘌呤(G)以及它们的修饰衍生物或类似物,诸如7-脱氮腺嘌呤或7-脱氮鸟嘌呤。嘧啶碱基包括胞嘧啶(C)、胸腺嘧啶(T)和尿嘧啶(U)以及它们的经修饰的衍生物或类似物。脱氧核糖的C-1原子与嘧啶的N-1或嘌呤的N-9键合。
如本文所用,“核苷”在结构上类似于核苷酸,但缺少磷酸部分。核苷类似物的一个示例是其中标记与碱基连接并且没有磷酸基团附接到糖分子的核苷类似物。术语“核苷”在本文中以本领域技术人员所理解的常规含义使用。示例包括但不限于包含核糖部分的核糖核苷和包含脱氧核糖部分的脱氧核糖核苷。经修饰的戊糖部分是其中氧原子已被碳取代和/或碳已被硫或氧原子取代的戊糖部分。“核苷”是可以具有取代的碱基和/或糖部分的单体。另外,核苷可以掺入较大的DNA和/或RNA聚合物和低聚物中。
术语“嘌呤碱基”在本文中以本领域技术人员所理解的普通含义使用,并且包括其互变异构体。类似地,术语“嘧啶碱基”在本文中以本领域技术人员所理解的普通含义使用,并且包括其互变异构体。任选地取代的嘌呤碱基的非限制性列表包括嘌呤、腺嘌呤、鸟嘌呤、脱氮嘌呤、7-脱氮腺嘌呤、7-脱氮鸟嘌呤、次黄嘌呤、黄嘌呤、别黄嘌呤、7-烷基鸟嘌呤(例如7-甲基鸟嘌呤)、可可碱、咖啡因、尿酸和异鸟嘌呤。嘧啶碱基的示例包括但不限于胞嘧啶、胸腺嘧啶、尿嘧啶、5,6-二氢尿嘧啶和5-烷基胞嘧啶(例如5-甲基胞嘧啶)。
如本文所用,当寡核苷酸或多核苷酸被描述为“包含”或“掺入”本文所述的核苷或核苷酸时,这意味着本文所述的核苷或核苷酸与寡核苷酸或多核苷酸形成共价键。类似地,当核苷或核苷酸被描述为寡核苷酸或多核苷酸的一部分,诸如“掺入到”寡核苷酸或多核苷酸中时,这意味着本文所述的核苷或核苷酸与寡核苷酸或多核苷酸形成共价键。在一些此类实施方案中,共价键在寡核苷酸或多核苷酸的3′羟基与在本文中描述为寡核苷酸或多核苷酸的3′碳原子与核苷酸的5′碳原子之间的磷酸二酯键的核苷酸的5′磷酸基团之间形成。
如本文所用,术语“可裂解接头”并不意在暗示需要除去整个接头。裂解位点可以位于接头上确保该接头的一部分在裂解后保持连接到可检测标记和/或核苷或核苷酸部分的某个位置处。
如本文所用,“衍生物”或“类似物”意指具有修饰的碱基部分和/或修饰的糖部分的合成核苷酸或核苷衍生物。此类衍生物和类似物在例如Scheit,Nucleotide Analogs(John Wiley&Son,1980)和Uhlman等人,Chemical Reviews 90:543-584,1990中进行了讨论。核苷酸类似物还可以包括经修饰的磷酸二酯键,包括硫代磷酸酯键、二硫代磷酸酯键、烷基膦酸酯键、苯胺磷酸酯键和氨基磷酸酯键。如本文所用,“衍生物”、“类似物”和“修饰的”可以互换使用,并且由本文定义的术语“核苷酸”和“核苷”涵盖。
如本文所用,术语“磷酸酯”以本领域技术人员所理解的普通含义使用,并且包括其质子化形式(例如,)。如本文所用,术语“单磷酸”、“二磷酸”和“三磷酸”以本领域技术人员所理解的其普通含义使用,并且包括质子化形式。
如本文所用,术语“保护基团”是指添加到分子中以便防止分子中的现有基团经历不希望的化学反应的任何原子或原子团。有时,“保护基团”和“封端基团”可以互换使用。
如本文所用,术语“定相”是指SBS中的现象,该现象是由3′终止子和荧光团的不完全去除以及未能通过在给定测序循环下通过聚合酶完成簇内DNA链的一部分掺入所引起的。预定相是由掺入不具有有效3′终止子的核苷酸引起的,其中掺入事件由于终止失败而提前1个周期。定相和预定相导致特定循环的测量信号强度由来自当前循环的信号以及来自前一个和后一个循环的噪声组成。随着循环的数量增加,受到定相和预定相影响的每个簇的序列分数增加,妨碍对正确碱基的识别。预定相可以由在通过边合成边测序(SBS)期间存在痕量的未保护或未封端的3′-OH核苷酸引起。不受保护的3′-OH核苷酸可以在制造过程期间或可能在储存和试剂处理过程期间产生。因此,降低预定相发生率的核苷酸类似物的发现是令人惊讶的,并且在SBS应用中提供了比现有核苷酸类似物更大的优势。例如,所提供的核苷酸类似物可以带来更快的SBS循环时间、更低的定相值和预定相值以及更长的测序读长。
利用具有3′烯丙基封端基团的核苷酸的测序方法
本公开的一些实施方案涉及一种平行确定多个不同的靶多核苷酸的序列的方法,该方法包括:
(a)使固体载体与包含测序引物的溶液在杂交条件下接触,其中:
(i)该固体载体包含多个不同的靶多核苷酸;以及
(ii)该测序引物与该不同的靶多核苷酸的至少一部分互补;
(b)使该固体载体与包含DNA聚合酶和核苷酸A、G、C和T或U(例如,dATP、dCTP、dGTP和dTTP或dUTP)的水性溶液在适用于DNA聚合酶介导的引物延伸的条件下接触,其中每种核苷酸包含具有与3′氧原子附接的3′烯丙基封端基团的2′脱氧核糖部分;
(c)使该固体载体成像以确定所掺入的核苷酸的身份(例如,通过执行所延伸的拷贝多核苷酸的一次或多次荧光测量来确定所掺入的核苷酸的身份);
(d)使该固体载体与包含钯催化剂和三(羟烷基)膦的水性解封端溶液在适于从所掺入的核苷酸中化学除去3′烯丙基封端基团从而暴露3′-
OH基团以用于在该固体载体上进行进一步核苷酸掺入的条件下接触;
(e)使所述固体载体与水性洗涤溶液接触;以及
(f)重复步骤(b)至(e)以确定靶多核苷酸序列。在本文所述方法的一些实施方案中,步骤(b)中包含DNA聚合酶的水性溶液进一步包含钯清除剂。在另外的实施方案中,步骤(b)中的钯清除剂是本文所述的Pd(0)清除剂。在一些实施方案中,步骤(e)中的水性洗涤溶液进一步包含钯清除剂。在另外一些实施方案中,步骤(e)中的钯清除剂是本文所述的Pd(II)清除剂。在另外一些实施方案中,水性解封端溶液进一步包含抗坏血酸盐,诸如抗坏血酸钠。在一些实施方案中,该固体载体包含至少500,000、1,000,000、2,000,000、
3,000,000、4,000,000或5,000,000个在空间上可区分的位点/cm2
该位点包含靶多核苷酸的多个拷贝。
在本文所述方法的一些实施方案中,至少一种类型的核苷酸包含经由可裂解接头与可检测标记附接的碱基。在另外一些实施方案中,可裂解接头包含选自由以下项组成的组的部分:
并且*指示该部分与核苷酸的其余部分连接的位置。在另外一些实施方案中,可裂解接头经由
与核碱基附接。在另外一些实施方案中,可检测标记是荧光染料,并且可裂解接头选自由以下项组成的组:
其中Z是-O-CH2-CH=CH2;n是1、2、3、4或5的整数;*指示可裂解接头与碱基的附接点;并且**指示可裂解接头与可检测标记的附接点。在另外的实施方案中,当核苷酸是T核苷酸时,可裂解接头经由与核碱基附接。在另外一些实施方案中,当核苷酸是T核苷酸时,可裂解接头是在本文所述方法的一些实施方案中,至少三种类型的核苷酸包含经由可裂解接头与可检测标记附接的核碱基。在一个实施方案中,A、C和T核苷酸各自包含经由本文所述的可裂解接头与可检测标记附接的核碱基。在另外一些实施方案中,至少三种类型的核苷酸中的每一种类型的可检测标记能够与其他可检测标记区分,并且可裂解接头选自由以下项组成的组:
其中Z是-O-CH2-CH=CH2;n是1、2、3、4或5的整数;*指示可裂解接头与碱基的附接点;并且**指示可裂解接头与可检测标记的附接点。在其他实施方案中,四种类型的核苷酸中的每一种类型是未标记的。
本公开的一些其他实施方案涉及一种平行确定多个不同的靶多核苷酸的序列的方法,该方法包括:
(a)使固体载体与包含测序引物的溶液在杂交条件下接触,其中:
(i)该固体载体包含多个不同的靶多核苷酸;以及
(ii)该测序引物与该不同的靶多核苷酸的至少一部分互补;
(b)使该固体载体与包含DNA聚合酶和核苷酸A、G、C和T或U(例如,dATP、dCTP、dGTP和dTTP或dUTP)的水性溶液在适用于DNA聚合酶介导的引物延伸的条件下接触,其中:
(i)至少三种类型的核苷酸中的每一种类型独立地包含经由可裂解接头与可检测标记附接的碱基,并且该可裂解接头包含选自由以下项组成的组的部分:
并且*指示该部分与核苷酸的其余部分连接的位置;
(ii)每种核苷酸包含具有与3′氧原子附接的3′烯丙基基团的2′脱氧核糖部分;以及
(iii)该DNA聚合酶是改变的古细菌DNA聚合酶;
(c)使该固体载体与包含一种或多种自由基清除剂的溶液接触,并且使该固体载体成像以确定所掺入的核苷酸的身份(例如,通过执行所延伸的拷贝多核苷酸的一次或多次荧光测量来确定所掺入的核苷酸的身份);
(d)使该固体载体与包含钯催化剂和三(羟烷基)膦的水性解封端溶液在适于(i)从所掺入的核苷酸中化学除去3′烯丙基封端基团从而暴露3′-OH基团以用于在该固体载体上进行进一步核苷酸掺入;以及(ii)化学除去经由可裂解接头附接的可检测标记的条件下接触;
(e)使所述固体载体与包含钯清除剂的水性洗涤溶液接触;以及
(f)重复步骤(b)至(e)以确定靶多核苷酸序列。在一些实施方案中,步骤(e)的水性洗涤溶液中的钯清除剂是本文所述的Pd(II)清除剂。在另外一些实施方案中,步骤(b)中包含DNA聚合酶的水性溶液进一步包含钯清除剂。在一些此类实施方案中,步骤(b)中的钯清除剂是本文所述的Pd(0)清除剂。在一些实施方案中,该固体载体包含至少500,000、1,000,000、2,000,000、3,000,000、4,000,000或5,000,000个在空间上可区分的位点/cm2,该位点包含靶多核苷酸的多个拷贝。
本公开的一些另外的实施方案涉及一种平行确定多个不同的靶多核苷酸的序列的方法,该方法包括:
(a)使固体载体与包含测序引物的溶液在杂交条件下接触,其中:
(i)该固体载体包含多个不同的靶多核苷酸;以及
(ii)该测序引物与该不同的靶多核苷酸的至少一部分互补;
(b)使该固体载体与包含DNA聚合酶和核苷酸A、G、C和T或U(例如,dATP、dCTP、dGTP和dTTP或dUTP)的水性溶液在适用于DNA聚合酶介导的引物延伸的条件下接触,其中:
(i)该核苷酸中的至少一种核苷酸包含经由可裂解接头与可检测标记附接的碱基;以及
(ii)该核苷酸各自包含具有与3′氧原子附接的3′烯丙基封端基团
的2′脱氧核糖部分;
(c)使该固体载体与包含一种或多种自由基清除剂的溶液接触,并且使该固体载体成像以确定所掺入的核苷酸的身份(例如,通过执行所延伸的拷贝多核苷酸的一次或多次荧光测量来确定所掺入的核苷酸的身份);
(d)使该固体载体与包含钯催化剂和三(羟烷基)膦的水性解封端溶液在适于(i)从所掺入的核苷酸中化学除去3′烯丙基基团从而暴露3′-OH基团以用于在该固体载体上进行进一步核苷酸掺入;以及(ii)化学除去经由可裂解接头附接的可检测标记的条件下接触;
(e)使所述固体载体与水性洗涤溶液接触;以及
(f)重复步骤(b)至(e)以确定靶多核苷酸序列。在一些实施方案中,步骤(e)中的水性洗涤溶液进一步包含钯清除剂。在一些实施方案中,该固体载体包含至少500,000、1,000,000、2,000,000、3,000,000、
4,000,000或5,000,000个在空间上可区分的位点/cm2,该位点包含靶多核苷酸的多个拷贝。在一些此类实施方案中,步骤(e)的水性洗涤溶液中的钯清除剂是本文所述的Pd(II)清除剂。在另外一些实施方案中,步骤(b)中包含DNA聚合酶的水性溶液进一步包含钯清除剂。在一些此类实施方案中,步骤(b)中的钯清除剂是本文所述的Pd(0)清除剂。
掺入后标记SBS工作流
本公开的另一方面涉及可替代的边合成边测序方法,其中在掺入未标记的核苷酸后引入至少一种标记试剂。特别地,本公开涉及一种平行确定多个不同的靶多核苷酸的序列的方法,该方法包括:
(a)使固体载体与包含测序引物的溶液在杂交条件下接触,其中:
(i)该固体载体包含至少5,000,000个在空间上可区分的位点
/cm2,该位点包含靶多核苷酸的多个拷贝;
(ii)该固体载体包含多个不同的靶多核苷酸;以及
(iii)该测序引物与该不同的靶多核苷酸的至少一部分互补;
(b)使该固体载体与包含DNA聚合酶和四种类型的核苷酸A、G、C和T或U中的一种或多种类型的水性掺入混合物在适用于DNA聚合酶介导的引物延伸的条件下接触,其中:
(i)该核苷酸各自包含具有与3′氧原子附接的3′烯丙基封端基团
的2′脱氧核糖部分;
(ii)至少一种类型的核苷酸是未标记的;以及
(iii)第一类型的未标记的核苷酸包含第一官能部分;
(c)使所延伸的拷贝多核苷酸与包含第一标记试剂的水性标记混合物接触,其中该第一标记试剂包含一个或多个第一可检测标记和能够与第一类型的未标记的核苷酸的第一官能部分特异性结合的第一结合部分;
(d)使该固体载体成像并且执行一次或多次荧光测量(即,以确定所掺入的核苷酸的身份);
(e)使该固体载体与包含钯催化剂和三(羟烷基)膦的水性解封端溶液在适于(i)从所掺入的核苷酸中化学除去3′烯丙基基团从而暴露3′-OH基团以用于在该固体载体上进行进一步核苷酸掺入的条件下接触;
(f)使所述固体载体与水性洗涤溶液接触;以及
(g)重复步骤(b)至(f)以确定靶多核苷酸序列。在一些实施方案中,至少两种类型的核苷酸是未标记的。
在一些实施方案中,步骤(c)在其中第一标记试剂与掺入的未标记的第一类型核苷酸特异性结合以提供标记的延伸拷贝多核苷酸的条件下执行。在一些实施方案中,第一类型的未标记的核苷酸的第一官能部分通过共价结合(任选地经由如本文所述的可裂解接头)与第一标记试剂结合。在一些其他实施方案中,第一类型的未标记的核苷酸的第一官能部分通过非共价相互作用(任选地经由如本文所述的可裂解接头)与第一标记试剂结合。
在一些实施方案中,水性掺入混合物中的四种类型的核苷酸中的每一种类型是未标记的,第二类型的未标记的核苷酸包含第二官能部分,其中水性标记混合物包含第二标记试剂,并且第二标记试剂包含一个或多个第三可检测标记和能够与第二类型的未标记的核苷酸的第二官能部分特异性结合的第二结合部分。在一些此类实施方案中,步骤(c)在其中第一标记试剂与掺入的未标记的第一类型的核苷酸特异性结合,并且第二标记试剂与掺入的未标记的第二类型的核苷酸特异性结合以提供标记的延伸拷贝多核苷酸的条件下执行。在一些此类实施方案中,第一类型的未标记的核苷酸的第一官能部分通过共价结合(任选地经由如本文所述的可裂解接头)与第一标记试剂结合。在一些其他实施方案中,第一类型的未标记的核苷酸的第二官能部分通过非共价相互作用(任选地经由如本文所述的可裂解接头)与第二标记试剂结合。在一些此类实施方案中,第三类型的未标记的核苷酸包含第三官能部分,其中水性标记混合物包含第三标记试剂,并且第三标记试剂包含一个或多个第三可检测标记和能够与第三类型的未标记的核苷酸的第三官能部分特异性结合的第三结合部分。在一些此类实施方案中,步骤(c)在其中第一标记试剂与掺入的未标记的第一类型核苷酸特异性结合,第二标记试剂与掺入的未标记的第二类型的核苷酸特异性结合,并且第三标记试剂与掺入的未标记的第三类型的核苷酸特异性结合以提供标记的延伸拷贝多核苷酸的条件下执行。在一些其他实施方案中,第三类型的未标记的核苷酸包含含有第一官能部分的第三类型的未标记的核苷酸和含有第二官能部分的第三类型的未标记的核苷酸的混合物,并且其中第一标记试剂和第二标记试剂均能够与第三类型的未标记的核苷酸特异性结合。
在本文所述的掺入后标记方法的任何实施方案中,第四类型的未标记的核苷酸不能与第一标记试剂、第二标记试剂或第三标记试剂中的任一种标记试剂特异性结合。
在本文所述的掺入后标记方法的一些实施方案中,T核苷酸具有以下结构:在另外一些实施方案中,T核苷酸具有以下结构:在另外的实施方案中,T核苷酸具有以下结构:其中Z是-O-CH2-CH=CH2,并且m和n中的每一者独立地是1、2、3、4或5的整数。
在本文所述的掺入后标记方法的一些实施方案中,C核苷酸具有以下结构:在另外一些实施方案中,C核苷酸具有以下结构:在另外的实施方案中,C核苷酸具有以下结构:其中Z是-O-CH2-CH=CH2,并且m和n中的每一者独立地是1、2、3、4或5的整数。
在本文所述的掺入后标记方法的一些实施方案中,A核苷酸具有以下结构:在另外一些实施方案中,A核苷酸具有以下结构:在另外的实施方案中,A核苷酸具有以下结构:其中Z是-O-CH2-CH=CH2,并且m和n中的每一者独立地是1、2、3、4或5的整数。在其他实施方案中,A核苷酸具有以下结构:在另外的实施方案中,A核苷酸具有以下结构: 在另外的实施方案中,A核苷酸具有以下结构: 其中Z是-O-CH2-CH=CH2,并且m和n中的每一者独立地是1、2、3、4或5的整数。
在一些实施方案中,G核苷酸是未标记的。在另外一些实施方案中,G核苷酸具有选自由以下项组成的组的结构:
接头的其他示例公开于美国专利公布号2020/0216891A1中,该文献全文以引用方式并入:
其中B是核碱基;n是1、2、3、4、5;k是1;Z是–N3(叠氮基)、–O-C1-C6烷基、–O-C2-C6烯基或–O-C2-C6炔基;并且R包含用于掺入后标记的可检测标记或结合部分,其可含有额外的接头和/或间隔结构。本领域普通技术人员理解,本文所述的可检测标记或结合部分通过使含有结合部分的化合物的官能团(例如,羧基)与接头的官能团(例如,氨基)反应以形成酰胺键而与接头共价结合。在一个实施方案中,可裂解接头包含(“AOL”接头部分),其中Z为–O-烯丙基。为了本公开的目的,核苷酸可含有多个可裂解接头重复单元(例如,k是1、2、3、4、5、6、7、8、9或10)。
在特定实施方案中,未标记的核苷酸可为可酶促掺入的和可酶促延伸的。因此,接头部分可以具有足够的长度以将核苷酸连接到化合物,使得该化合物不显著干扰核酸复制酶对核苷酸的总体结合与识别。因此,接头还可包含间隔单元,诸如一个或多个PEG单元(-OCH2CH2-)n,其中n是1至20的整数,例如1、2、3、4、5、6、7、8、9、10、11、12、13、14或15。间隔区距离为例如核苷酸碱基距裂解位点或标记的距离。
在本文所述方法的任一方法的一些实施方案中,所述使固体载体与解封端溶液接触执行约1秒至20秒、约2秒至10秒、约3秒至8秒或约4秒至5秒。例如,使固体载体与步骤(d)或步骤(e)的解封端溶液接触执行约1秒、2秒、3秒、4秒、5秒、6秒、7秒、8秒、9秒、10秒、11秒、12秒、13秒、14秒、15秒、16秒、17秒、18秒、19秒或20秒,或由前述值中的任两个值限定的范围。在另外一些实施方案中,所述使固体载体与解封端溶液接触经由连续流执行而不暂停孵育。
在本文所述方法的任一方法的一些实施方案中,重复测序循环(例如,步骤(b)至(e)或步骤(b)至(f))至少约20次、30次或50次。在其他实施方案中,重复步骤(b)至(e)或步骤(b)至(f)至少约100次、150次、200次、250次、300次、350次、400次、450次或500次。在一些实施例中,在约50个重复循环之后,预定相值小于0.18。在一些实施例中,在约50个重复循环之后,定相值小于0.18。在另外的实施方案中,在约50个重复循环之后,预定相或定相值小于0.07。在另外一些实施方案中,在约100个重复循环之后,预定相值小于0.10并且定相值小于0.10。在另外一些实施方案中,在约150个重复循环之后,预定相值小于0.25并且定相值小于0.25。在另外一些实施方案中,在约150个重复循环之后,预定相值小于0.2并且定相值小于0.2。在另外一些实施方案中,在约150个重复循环之后,预定相值小于0.15并且定相值小于0.15。在另外一些实施方案中,在约150个重复循环之后,预定相值小于0.1并且定相值小于0.1。
在本文所述方法的任一方法的一些实施方案中,DNA聚合酶是改变的B家族古细菌DNA聚合酶,其包含与9°N DNA聚合酶中的氨基酸408至410功能等效或同源的3-氨基酸区,其中3-氨基酸区的第一氨基酸是选自由异亮氨酸(I)、丙氨酸(A)、缬氨酸(V)和丝氨酸(S)组成的组的氨基酸;3-氨基酸区的第二氨基酸是选自由丙氨酸(A)和甘氨酸(G)组成的组的氨基酸;并且3-氨基酸区的第三氨基酸是选自由丙氨酸(A)、异亮氨酸(I)、缬氨酸(V)、亮氨酸(L)、苏氨酸(T)和脯氨酸(P)组成的组的氨基酸。
钯催化剂
在本文所述方法的任一方法的一些实施方案中,用于除去或裂解本文所述的3′烯丙基封端基团的Pd催化剂是水溶性的。在一些此类实施方案中,Pd催化剂为活性Pd(0)形式。在一些情况下,Pd(0)催化剂可以通过试剂诸如烯烃、醇、胺、膦或金属氢化物从Pd络合物或Pd预催化剂(例如,Pd(II)络合物)的还原原位生成。合适的Pd源包括Pd(CH3CN)2Cl2、[Pd(烯丙基)Cl]2、[Pd(烯丙基)(THPP)]Cl、[Pd(烯丙基)(THPP)2]Cl、Na2PdCl4、K2PdCl4、Li2PdCl4、Pd(OAc)2、Pd(PPh3)4、Pd(dba)2、Pd(Acac)2、PdCl2(COD)、Pd(TFA)2、Na2PdBr4、K2PdBr4、PdCl2、PdBr2和Pd(NO3)2。在一个此类实施方案中,Pd(0)络合物从钯酸盐(II)的有机或无机盐,例如Na2PdCl4或K2PdCl4原位生成。在另一个实施方案中,钯源为烯丙基氯化钯(II)二聚体[(烯丙基)PdCl]2或[PdCl(C3H5)]2。在一些实施方案中,Pd(0)催化剂通过将Pd(II)络合物与水溶性膦(诸如三(羟烷基)膦)混合而在水性溶液中生成。合适的三(羟烷基)膦包括三(羟丙基)膦(THPP)、三(羟甲基)膦(THMP)或三(羟乙基)膦(THEP)或它们的组合。在一个实施方案中,水溶性膦是THPP。
在一些实施方案中,钯催化剂通过将[(烯丙基)PdCl]2与THP原位混合来制备。[(烯丙基)PdCl]2和THP的摩尔比可为约1:1、1:1.5、1:2、1:2.5、1:3、1:3.5、1:4、1:4.5、1:5、1:5.5、1:6、1:6.5、1:7、1:7.5、1:8、1:8.5、1:9、1:9.5或1:10。在一个实施方案中,[(烯丙基)PdCl]2和THP的摩尔比为1:10。在一些其他实施方案中,钯催化剂通过将水溶性Pd试剂诸如Na2PdCl4或K2PdCl4与THP原位混合来制备。Na2PdCl4或K2PdCl4和THP的摩尔比可为约1:1、1:1.5、1:2、1:2.5、1:3、1:3.5、1:4、1:4.5、1:5、1:5.5、1:6、1:6.5、1:7、1:7.5、1:8、1:8.5、1:9、1:9.5或1:10。在一个实施方案中,Na2PdCl4或K2PdCl4与THP的摩尔比为约1:3。在另一个实施方案中,Na2PdCl4或K2PdCl4与THP的摩尔比为约1:3.5。在又一个实施方案中,Na2PdCl4或K2PdCl4与THP的摩尔比为约1:2.5。
用于本文所述的方法的裂解步骤的Pd络合物和水溶性膦可以呈组合物或混合物,也称为裂解混合物。在另外一些实施方案中,裂解混合物可含有一种或多种还原剂,诸如抗坏血酸或其盐(例如,抗坏血酸钠)或含硼还原剂。在另外一些实施方案中,裂解混合物可含有一种或多种缓冲液试剂,诸如伯胺、仲胺、叔胺、天然氨基酸、非天然氨基酸、碳酸盐、磷酸盐或硼酸盐或它们的组合。在另外一些实施方案中,缓冲液试剂包括乙醇胺(EA)、三(羟甲基)氨基甲烷(Tris)、甘氨酸、碳酸钠、磷酸钠、硼酸钠、二甲基乙醇胺(DMEA)、二乙基乙醇胺(DEEA)、N,N,N′,N′-四甲基乙二胺(TMEDA)、N,N,N′,N′-四乙基乙二胺(TEEDA)或2-哌啶乙醇(也称为(2-羟乙基)哌啶,其具有以下结构:)或它们的组合。在一个实施方案中,一种或多种缓冲液试剂包括DEEA。在另一个实施方案中,一种或多种缓冲液试剂包括(2-羟乙基)哌啶。在另一个实施方案中,一种或多种缓冲液试剂含有一种或多种无机盐,诸如碳酸盐、磷酸盐或硼酸盐,或者它们的组合。在一个实施方案中,无机盐为钠盐。
还原剂
根据本公开,还原剂可用于促进Pd(0)活性物质的形成以用于3′解封端反应和/或接头的裂解。在一些实施方案中,还原剂含有硼。例如,还原剂可为硼烷类、二取代硼酸类、硼酸类、硼酸酯类或硼氢化物类。在一些实施方案中,还原剂是硼烷类或硼酸类。合适的硼烷类包括二硼烷、三硼烷、四硼烷、五硼烷、六硼烷、七硼烷、八硼烷、九硼烷、十硼烷、硼烷四氢呋喃、硼烷二甲硫醚、儿茶酚硼烷、二氯苯基硼烷、硼烷二苯基膦络合物、二环己基碘硼烷、溴二甲基硼烷、二乙基甲氧基硼烷、二氯甲基二异丙氧基硼烷、溴二甲基硼烷和单溴硼烷甲硫醚。合适的硼烷类包括氨基-硼烷类。合适的胺-硼烷类包括吡啶-硼烷、N-基杂芳族-硼烷络合物、氨合物三氢化硼(NH3BH3)、硼烷-氨络合物、硼烷二甲胺、硼烷叔丁胺、硼烷三甲胺、硼烷异丙胺、二氯(二异丙基氨基)硼烷和环硼氮烷。合适的硼酸类包括硼酸、4-羟基苯基硼酸、四羟基二硼(B2(OH)4)、苯基硼酸、2-噻吩基硼酸、甲基硼酸、顺式-丙烯基硼酸和反式-丙烯基硼酸。合适的硼酸酯类包括烯丙基硼酸频哪醇酯、苯基硼酸丙二醇酯和二异丙氧基甲基硼烷。合适的硼氢化物类包括硼氢化钠(Na2BH4)、硼氢化锂、硼氢化钙、双(四氢呋喃)硼氢化钙、硼氢化镁、硼氢化钾、三乙基硼氢化钾、三乙酰氧基硼氢化钠、四乙基硼氢化铵和四丁基硼氢化铵。在一些实施方案中,第一水性溶液(也称为裂解混合物)中还原剂(诸如含硼还原剂)的浓度为约0.1mM、0.2mM、0.3,mM、0.4mM、0.5mM、0.6mM、0.7mM、0.8mM、0.9mM、1mM、1.5mM、2mM、2.5mM、3mM、3.5mM、4mM、4.5mM、5mM、5.5mM、6mM、6.5mM、7mM、7.5mM、8mM、8.5mM、9mM、9.5mM、10mM、12.5mM、15mM、17.5mM、20mM、22.5mM、25mM、37.5mM、30mM、35mM、40mM、45mM、50mM、55mM、60mM、65mM、70mM或75mM,或由前述值中的任意两个值限定的范围。
在一些实施方案中,3′封端基团的裂解条件与裂解核苷酸的可裂解接头的条件相同。例如,核苷酸可以包含与3′封端基团相同的接头部分。在其他实施方案中,3′封端基团的裂解条件与裂解核苷酸的可裂解接头的条件不同。
钯清除剂
Pd(0)清除剂
本公开的某些方面涉及在边合成边测序的几个步骤中使用可替代的钯清除剂,其中至少一种钯清除剂包含一个或多个烯丙基部分。例如,–O-烯丙基、–S-烯丙基、–NR-烯丙基或–N+RR′-烯丙基或它们的组合,其中R为H、未取代的或取代的C1-C6烷基、未取代的或取代的C2-C6烯基、未取代的或取代的C2-C6炔基、未取代的或取代的C6-C10芳基、未取代的或取代的5至10元杂芳基、未取代的或取代的C3-C10碳环基,或者未取代的或取代的5至10元杂环基;并且R′为H、未取代的C1-C6烷基或取代的C1-C6烷基。
含烯丙基的Pd清除剂充当竞争性底物以消耗粘附在核酸上的任何残余Pd(0)(即Pd(0)清除剂)。这些钯清除剂描述于WO 2022/243480中,该文献以引用方式整体并入。本文所述的测序方法实质上改善了测序指标(例如,减少定相值和预定相值)并且还可以通过某些消除裂解后处理步骤来减少每个循环的测序时间。
在本文所述方法的任一方法的一些实施方案中,包含一个或多个烯丙基部分的Pd(0)清除剂在含有DNA聚合酶和核苷酸的水性溶液中。在一些情况下,步骤(b)中的水性溶液也称为掺入混合物(IMX)。在一些此类实施方案中,此类钯清除剂与掺入混合物中的其他测序试剂相容,除了一种或多种不同类型的核苷酸之外,该掺入混合物还可包括聚合酶(诸如DNA聚合酶)。在一些此类实施方案中,聚合酶是DNA聚合酶,诸如9°N聚合酶的突变体(例如,WO 2005/024010中公开的那些,该专利以引用的方式并入),例如,Pol 812、Pol 1901、Pol1558或Pol 963。Pol 812、Pol1901、Pol 1558或Pol 963DNA聚合酶的氨基酸序列描述于例如美国专利公布号2020/0131484A1和2020/0181587A1中,这些公布均以引用方式并入本文。在一些实施方案中,掺入混合物进一步包含一种或多种缓冲剂。缓冲剂可以包括伯胺、仲胺、叔胺、天然氨基酸或非天然氨基酸,或者它们的组合。在另外的实施方案中,缓冲剂包括乙醇胺或甘氨酸,或者它们的组合。在一个实施方案中,缓冲剂包括甘氨酸,或为甘氨酸。在另外的实施方案中,包含一个或多个烯丙基部分的钯清除剂在下一个掺入循环之前不需要单独的洗涤步骤。在另外的实施方案中,掺入混合物中的钯清除剂是本文所述的Pd(0)清除剂。在一些实施方案中,Pd(0)清除剂与DNA聚合酶和/或四种类型的核苷酸(例如,dATP、dCTP、dGTP和dTTP或dUTP)中的一种或多种预混合。在其他实施方案中,Pd(0)清除剂与DNA聚合酶和/或四种类型的核苷酸中的一种或多种核苷酸分开储存,并在测序运行开始前不久与这些组分混合。
在本文所述方法的任一方法的一些实施方案中,包含一个或多个烯丙基部分的Pd(0)清除剂在含有DNA聚合酶和核苷酸(例如,A、G、C和T或U;或者dATP、dCTP、dGTP和dTTP或dUTP)的水性溶液中的浓度为约0.1mM至约100mM、约0.2mM至约75mM、约0.5mM至约50mM、约1mM至约20mM或约2mM至约10mM。在另外的实施方案中,钯清除剂(例如,Pd(0)清除剂)的浓度为约0.1mM、0.2mM、0.3mM、0.4mM、0.5mM、0.6mM、0.7mM、0.8mM、0.9mM、1mM、1.5mM、2mM、2.5mM、3mM、3.5mM、4mM、4.5mM、5mM、5.5mM、6mM、6.5mM、7mM、7.5mM、8mM、8.5mM、9mM、9.5mM、10mM、12.5mM、15mM、17.5mM或20mM,或由前述值中的任意两个限定的范围。在另外的实施方案中,此类钯清除剂的浓度是在掺入混合物中的浓度。在另外的实施方案中,掺入混合物的pH为约9。
在本文所述方法的任一方法的一些其他实施方案中,当执行一次或多次荧光测量时,包含一个或多个烯丙基部分的Pd(0)清除剂在溶液中。在这种实施方案中,这种钯清除剂与扫描溶液(也称为扫描混合物)的测序试剂相容。在另外的实施方案中,一种或多种钯清除剂在下一个掺入循环之前不需要单独的洗涤步骤。在另外的实施方案中,扫描溶液中的钯清除剂是本文所述的Pd(0)清除剂。
在本文所述方法的其他实施方案中,包含一个或多个烯丙基部分的Pd(0)清除剂在裂解后洗涤溶液中。在另外的实施方案中,裂解后洗涤溶液中的钯清除剂是本文所述的Pd(0)清除剂。在一些此类实施方案中,裂解后洗涤溶液不包含硫辛酸或3,3′-二硫代二丙酸(DDPA)。
在本文所述方法的另外其他实施方案中,包含一个或多个烯丙基部分的Pd(0)清除剂可存在于掺入混合物和裂解后洗涤溶液二者中,或者存在于掺入混合物和扫描混合物二者中。在一些此类实施方案中,裂解后洗涤溶液不包含硫辛酸或DDPA。
包含一个或多个–O-烯丙基或烯丙基部分的Pd(0)清除剂的非限制性示例包括以下:
(化合物A)、(化合物B,N-Boc酪氨酸(烯丙基)-OH)、(化合物C,烯丙基-β-D-吡喃葡萄糖苷)、(化合物D)、(化合物E)、
(化合物F)、(化合物G)、
(化合物H)、(化合物I)、(化合物J)、(化合物K)、(化合物L)、
(化合物M)和(化合物N)。
包含一个或多个–S-烯丙基部分的Pd(0)清除剂的非限制性示例包括以下:
包含一个或多个–NR-烯丙基或–N+RR′-烯丙基部分的Pd(0)清除剂的非限制性示例包括以下: 其中Zˉ是阴离子(例如,卤化物阴离子,诸如Fˉ或Clˉ)。在一个实施方案中,钯清除剂是Clˉ(化合物O,二烯丙基二甲基氯化铵,也称为DADMAC)。
Pd(II)清除剂
在本文所述的方法的一些实施方案中,该方法可以进一步使用附加钯清除剂,诸如Pd(II)清除剂。在一些此类实施方案中,使用附加Pd(II)清除剂可改善测序指标的定相值。例如,Pd(II)清除剂可包括异氰基乙酸(ICNA)盐、异氰基乙酸乙酯、异氰基乙酸甲酯、半胱氨酸(例如,L-半胱氨酸)或其盐(例如,N-乙酰基-L-半胱氨酸)、乙基黄原酸钾、异丙基黄原酸钾、谷胱甘肽、乙二胺四乙酸(EDTA)、亚氨基二乙酸、次氮基二乙酸、三巯基-S-三嗪、二甲基二硫代氨基甲酸酯、二硫苏糖醇、巯基乙醇、烯丙醇、炔丙醇、硫醇、硫代硫酸盐(例如,硫代硫酸钠或硫代硫酸钾)、叔胺和/或叔膦或它们的组合。在一个实施方案中,该方法还包括使用L-半胱氨酸或其盐。在另一个实施方案中,该方法还包括使用硫代硫酸盐诸如硫代硫酸钠(Na2S2O3)。在一些此类实施方案中,Pd(II)清除剂(例如,L-半胱氨酸或硫代硫酸钠)在含有DNA聚合酶和核苷酸的水性溶液(即,掺入混合物)中。在其他实施方案中,Pd(II)清除剂(例如,L-半胱氨酸或硫代硫酸钠)在裂解后洗涤溶液中。在其他实施方案中,Pd(II)清除剂(例如,L-半胱氨酸或硫代硫酸钠)可都存在于掺入混合物中。在其他实施方案中,Pd(II)清除剂(例如,L-半胱氨酸或硫代硫酸钠)可以存在于扫描混合物(即,执行所掺入的核苷酸的一次或多次荧光测量的溶液)中。在其他实施方案中,Pd(II)清除剂可存在于掺入混合物(即,步骤(b)的水性溶液)、扫描混合物或裂解后洗涤溶液(即,步骤(e)的水性溶液)中的一者或多者中。在另外的实施方案中,Pd(II)清除剂(诸如L-半胱氨酸或硫代硫酸钠)在掺入混合物或裂解后洗涤溶液中的浓度为约0.1mM至约100mM、0.2mM至约75mM、约0.5mM至约50mM、约1mM至约20mM,或约2mM至约10mM。在另外的实施方案中,Pd(II)清除剂(诸如L-半胱氨酸或硫代硫酸钠)的浓度为约0.1mM、0.5mM、1mM、2mM、3mM、4mM、5mM、6mM、6.5mM、7mM、8mM、9mM、10mM、12.5mM、15mM、17.5mM或20mM,或由前述值中的任意两个限定的范围。在另外的实施方案中,Pd(II)清除剂在裂解后洗涤溶液中,并且Pd(II)清除剂在裂解后洗涤溶液中的浓度为约10mM。在另外的实施方案中,裂解后洗涤溶液不含硫辛酸或DDPA。在其他实施方案中,该方法不包括裂解后洗涤步骤。
在本文所述方法的一些实施方案中,靶多核苷酸被固定至基底或固体载体的表面。在另外一些实施方案中,表面包含多种固定靶多核苷酸,例如不同的固定的靶多核苷酸的阵列。在一些此类实施方案中,基底或固体载体包括玻璃、改性的或功能化的玻璃、塑料、多糖、尼龙、硝酸纤维素、树脂、二氧化硅、硅、改性的硅、碳、金属、无机玻璃或光纤束或它们的组合。在另外一些实施方案中,基底是流动池、纳米颗粒或珠粒(诸如球形二氧化硅珠粒、无机纳米颗粒、磁性纳米颗粒、镉基点和无镉点,或美国公布号2021/0187470A1中公开的珠粒,该公布以引用的方式并入)。在一个实施方案中,基底或固体载体是包括由间隙区域分隔开的图案化纳米孔的流动池,并且其中固定靶多核苷酸驻留在图案化纳米孔内。在一些实施方案中,基底或固体载体包含至少5,000,000个在空间上可区分的位点/cm2,该位点包含多联体,该多联体包含所述靶多核苷酸的多个拷贝。在一些其他实施方案中,基底或固体载体包含至少5,000,000个在空间上可区分的位点/cm2,该位点包含固定核酸分子簇,该固定核酸分子簇包含所述靶多核苷酸的多个拷贝。
在本文所述的方法中的任一种的一些实施方案中,该方法在自动测序仪器上进行,并且其中自动测序仪器包括在不同波长(例如,约450nm至约460nm、和约520nm至约540nm,尤其是约460nm和约532nm)处操作的两个光源。在其他实施方案中,自动测序仪器包括在一个波长处操作的单个光源。
具有3′烯丙基封端基团的核苷酸
本公开的一些实施方案涉及包含核碱基、核糖或脱氧核糖部分和包含未取代或取代的烯丙基部分的3′封端基团的核苷酸分子。在一个实施方案中,3′封端基团是与脱氧核糖部分的3′氧原子附接的烯丙基基团(-CH2CH=CH2)。在一些实施方案中,核苷酸是未标记的。在其他实施方案中,核苷酸是本文所述的标记的核苷酸。在一些实施方案中,其中A和G核苷酸的碱基是脱氮嘌呤(例如,7-脱氮嘌呤,诸如7-脱氮腺嘌呤或7-脱氮鸟嘌呤)。在另外一些实施方案中,在本文描述的测序方法的任一方法中使用的至少一种类型的核苷酸具有选自由以下项组成的组的结构:
在另外的实施方案中,至少一种类型的核苷酸具有选自由以下项组成的组的结构:
标记的核苷酸
在一些实施方案中,3′封端的核苷酸还包含可检测标记,并且这种核苷酸被称为标记的核苷酸或完全官能化的核苷酸(ffN)。标记(例如,荧光染料)通过多种方式经由可裂解接头缀合,这些方式包括疏水吸引、离子吸引和共价连接。在一些方面,染料通过经由可裂解接头实现的共价连接来缀合至核苷酸。本领域的普通技术人员理解,该标记可以通过使该标记的官能团(例如,羧基)与接头的官能团(例如,氨基)反应来共价结合到接头。在一些此类实施方案中,可裂解接头可以包含与3′封端基团相同的部分。因此,可裂解接头和3′封端基团可以在相同的反应条件下裂解或除去。在一些此类实施方案中,可裂解接头可以包含烯丙基部分,具体而言包含以下结构的部分:
其中R1a、R1b、R2a、R3a和R3b各自独立地为H、卤素、未取代的或取代的C1-C6烷基或C1-C6卤代烷基。在另外的实施方案中,R1a、R1b、R2a、R3a和R3b各自为H。
在一些实施方案中,可检测标记可经由核苷酸碱基与寡核苷酸或核苷酸共价附接。例如,标记的核苷酸或寡核苷酸可以具有通过可裂解接头部分附接到嘧啶碱基的C5位或7-脱氮嘌呤碱基的C7位的标记。
核苷酸可以在糖或核碱基上的位点处标记。如本领域所知的,“核苷酸”由含氮碱基、糖和一个或多个磷酸基团组成。在RNA中,该糖是核糖,而在DNA中是脱氧核糖,即,缺乏存在于核糖中的羟基基团的糖。含氮碱基是嘌呤(例如,脱氮嘌呤、7-脱氮嘌呤)或嘧啶的衍生物。嘌呤为腺嘌呤(A)和鸟嘌呤(G),并且嘧啶为胞嘧啶(C)和胸腺嘧啶(T),或在RNA的情况下为尿嘧啶(U)。脱氧核糖的C-1原子与嘧啶的N-1或嘌呤的N-9键合。核苷酸也是核苷的磷酸酯,其中酯化发生在附接到糖的C-3或C-5的羟基基团上。核苷酸通常是单磷酸、二磷酸或三磷酸。
虽然碱基通常被称为嘌呤或嘧啶,但是技术人员将理解,可获得不改变核苷酸或核苷经历Watson-Crick碱基配对的能力的衍生物和类似物。“衍生物”或“类似物”意味着这样的化合物或分子:其核心结构与母体化合物的核心结构相同或非常类似,但其具有允许衍生的核苷酸或核苷与另一分子连接的化学或物理修饰,诸如不同的或附加的侧基。例如,碱基可以为脱氮嘌呤。在特定实施方案中,衍生物应当能够经历Watson-Crick配对。“衍生物”和“类似物”还包括例如具有经修饰的碱基部分和/或经修饰的糖部分的合成核苷酸或核苷衍生物。此类衍生物和类似物在例如Scheit,Nucleotide analogs(John Wiley&Son,1980)和Uhlman等人,Chemical Reviews 90:543-584,1990中进行了讨论。核苷酸类似物还可以包括经修饰的磷酸二酯键,包括硫代磷酸酯键、二硫代磷酸酯键、烷基膦酸酯键、苯胺磷酸酯键、亚磷酰胺键等。
在特定实施方案中,标记的核苷酸可以是可酶促掺入的和可酶促延伸的。因此,接头部分可以具有足够的长度以将核苷酸连接到化合物,使得该化合物不显著干扰核酸复制酶对核苷酸的总体结合与识别。因此,接头还可以包含间隔区单元。间隔区距离为例如核苷酸碱基距裂解位点或标记的距离。
本公开还涵盖掺入本文所述的核苷酸的多核苷酸。此类多核苷酸可以为分别由以磷酸二酯键接合的脱氧核糖核苷酸或核糖核苷酸组成的DNA或RNA。多核苷酸可以包含与如本文示出的至少一种经修饰的核苷酸(例如,用染料化合物标记)组合的天然存在的核苷酸、除本文所述的标记的核苷酸之外的非天然存在的(或经修饰的)核苷酸或它们的任何组合。根据本公开的多核苷酸还可以包括非天然的骨架键和/或非核苷酸化学修饰。还设想了由包含至少一种标记的核苷酸的核糖核苷酸和脱氧核糖核苷酸的混合物组成的嵌合结构。
在一些实施方案中,本文所述的标记的核苷酸包含或具有式(I)的结构:
其中B是核碱基;
R4是H或OH;
R5是未取代或取代的烯丙基基团,诸如其中Ra、Rb、Rc、Rd和Re各自独立地为H、卤素、未取代的或取代的C1-C6烷基,或C1-C6卤代烷基;
R6为H、单磷酸根、二磷酸根、三磷酸根、硫代磷酸根、磷酸酯类似物、反应性含磷基团,或羟基保护基团;
L是如本文所述的含有烯丙基部分的接头,诸如 并且
L1和L2各自独立地为任选地存在的接头部分。
在本文所述的核苷酸的一些实施方案中,Ra、Rb、Rc、Rd和Re各自为H。在其他实施方案中,Ra和Rb各自为H,并且Rc、Rd和Re中的至少一者独立地为卤素(例如,氟、氯)或未取代的C1-C6烷基(例如,甲基、乙基、异丙基、异丁基或叔丁基)。例如,Rc为未取代的C1-C6烷基,并且Rd和Re各自为H。在另一个示例中,Rc为H,并且Rd和Re中的一者或两者为卤素或未取代的C1-C6烷基。在本文所述的核苷酸的一些实施方案中,R1a、R1b、R2a、R3a和R3b各自为H。在其他实施方案中,R1a、R1b、R2a3a和R3b中的至少一者为卤素(例如,氟、氯)或未取代的C1-C6烷基(例如,甲基、乙基、异丙基、异丁基或叔丁基)。在一些此类情况下,R1a和R1b各自为H,并且R2a、R3a和R3b中的至少一者为未取代的C1-C6烷基或卤素(例如,R2a为未取代的C1-C6烷基,并且R3a和R3b各自为H;或者R2a为H,并且R3a和R3b中的一者或两者为卤素或未取代的C1-C6烷基)。在一个实施方案中,可裂解接头或L包含(“AOL”接头部分)。
在本文所述的式(I)的核苷酸的一些实施方案中,核碱基(式(I)中的“B”)为嘌呤(腺嘌呤或鸟嘌呤)、脱氮嘌呤或嘧啶(例如,胞嘧啶、胸腺嘧啶或尿嘧啶)。在另外一些实施方案中,脱氮嘌呤为7-脱氮嘌呤(例如,7-脱氮腺嘌呤或7-脱氮鸟嘌呤)。B的非限制性示例包括 者它们的任选地取代的衍生物和类似物。在另外一些实施方案中,标记的核碱基包括结构
在本文所述的式(I)的核苷酸的一些实施方案中,L1存在,并且L1包括选自由以下项组成的组的部分:炔丙胺、炔丙酰胺、烯丙胺、烯丙酰胺,以及这些物质的任选地取代的变体。在另外一些实施方案中,L1包括在另外一些实施方案中,星号*指示L1与核碱基(例如,嘧啶碱基的C5位,或者7-脱氮嘌呤碱基的C7位)的附接点。在另外的实施方案中,当核碱基是T时,L1包括或是
在本文所述的式(I)的核苷酸的另外一些实施方案中,L2存在,并且L2包括其中n是1、2、3、4、5、6、7、8、9或10的整数,并且苯基部分任选地被取代。在一些此类实施方案中,n为5,并且L2的苯基部分为未取代的。
可以掺入L1或L2中的接头部分的附加的非限制性示例包括:
附加的接头部分公开于WO 2004/018493和美国专利公布号2016/0040225和2021/0403500中,这两份专利以引用方式并入本文。
本文所述的T核苷酸的另外一些实施方案包括:
其中Z是-O-CH2-CH=CH2,并且n是1、2、3、4或5的整数。
本文所述的A核苷酸的另外一些实施方案包括:
其中Z是-O-CH2-CH=CH2,并且n是1、2、3、4或5的整数。
本文所述的C核苷酸的另外一些实施方案包括:
其中Z是-O-CH2-CH=CH2,并且n是1、2、3、4或5的整数。
本文所述的G核苷酸的另外一些实施方案包括:
其中Z是-O-CH2-CH=CH2,并且n是1、2、3、4或5的整数。
如本文所述的非限制性示例性标记的核苷酸包括:
其中PG代表本文所述的3′烯丙基封端基团;n是1、2、3、4、5、6、7、8、9或10的整数;并且m为0、1、2、3、4或5。在一个实施方案中,n为5。是指作为接头部分的氨基与染料的羧基基团之间的反应的结果的染料与可裂解接头的连接点。在一个实施方案中,p为5。是指作为接头部分的氨基基团与第一/第二/第三官能部分的羧基基团之间的反应的结果的第一/第二/第三官能部分与可裂解接头的连接点。在另外的实施方案中,核苷酸可经由多于一个相同的可裂解接头(诸如AOL-AOL)与第一/第二/第三官能部分附接。此外,接头可进一步包括如本文所述的另外的PEG间隔基,例如在R与–(CH2)m-之间。
各种荧光染料可以在本公开中用作可检测标记,尤其是可被蓝光(例如,约450nm至约460nm)或绿光(例如,约520nm至约540nm)激发的那些染料。这些染料也可以分别称为“蓝色染料”和“绿色染料”。各种类型的蓝色染料的示例,包括但不限于香豆素染料、色喹啉染料和含双硼杂环化合物,公开于美国专利公布号2018/0094140、2018/0201981、2020/0277529、2020/0277670、2021/0188832、2022/0033900、2022/0195517、2022/0380389和2023/0313292,以及美国系列号18/342064中,这些专利中的每一篇均全文以引用方式并入。绿色染料的示例包括国际公布号WO2013/041117、WO2014/135221、WO 2016/189287、WO2017/051201和WO2018/060482A1中公开的花青或多甲川染料,这些文献中的每个均以引用的方式整体并入。
在本文所述的核苷酸的任何实施方案中,核苷酸包含2′脱氧核糖部分(即,R4为式(I)为H)。在某个另外方面,2′脱氧核糖在糖环的5′位含有一个、两个或三个磷酸基团。在另外一些方面,本文所述的核苷酸为核苷酸三磷酸(即,式(I)中的-OR6形成三磷酸)。
本公开的附加实施方案涉及包含本文所述核苷或核苷酸的寡核苷酸或多核苷酸。在一些此类实施方案中,该寡核苷酸或多核苷酸与模板或靶多核苷酸杂交。在一些此类实施方案中,模板多核苷酸被固定在固体载体上。
本公开的附加实施方案涉及固体载体,其包括多个固定模板或靶多核苷酸的阵列,并且此类固定模板或靶多核苷酸的至少一部分与包含本文所述核苷或核苷酸的寡核苷酸或多核苷酸杂交。
可裂解接头的裂解条件
在本文所述核苷酸或核苷的任何实施方案中,3′封端基团和可裂解接头(以及附接的标记)可以能够在相同或基本上相同的化学反应条件下除去,例如,3′封端基团和可检测标记可以在单个化学反应中除去。在其他实施方案中,3′封端基团和可检测标记在两个分开的步骤中除去。
本文所述的可裂解接头可以在各种化学条件下除去或裂解。非限制性裂解条件包括在水溶性膦配体例如三(羟丙基)膦(THPP或THP)、三(羟甲基)膦和/或三(2-羧乙基)膦(TCEP)存在下,在或不在还原剂存在下的钯催化剂,诸如Pd(II)络合物(例如,Pd(OAc)2、氯化烯丙基Pd(II)二聚体[(烯丙基)PdCl]2或Na2PdCl4)。在一些实施方案中,3′封端基团可以在与用于可裂解接头的裂解条件相同或基本上相同的裂解条件下裂解。
与线性化相容
为了使核酸测序反应的通量最大化,有利的是能够平行对多个模板分子测序。可通过使用核酸阵列技术来实现多个模板的并行处理。这些阵列通常由固定到固体载体材料上的多核苷酸的高密度矩阵组成。
WO 98/44151和WO 00/18957均描述了核酸扩增方法,其允许将扩增产物固定在固体载体上以便形成阵列,这些阵列由簇或“集落”组成,其中簇或“集落”由多条相同的固定化多核苷酸链和多条相同的固定化互补链形成。这种类型的阵列在本文中被称为“成簇阵列”。在根据这些方法制备的聚类阵列上的DNA集落中存在的核酸分子可提供用于测序反应的模板,例如如WO 98/44152中所述。固相扩增反应的产物(诸如WO 98/44151和WO 00/18957中描述的那些)是所谓的“桥接”结构,这些结构通过对成对的固定化多核苷酸链和固定化互补链(两条链均在5′端附接到固体载体上)进行退火而形成。为了提供更适合的模板用于核酸测序,优选的是除去“桥接”结构的其中一条固定化链的基本上全部或至少一部分,以便产生至少部分是单链的模板。因此,该模板的单链部分将可用于与测序引物杂交。除去“桥接”双链核酸结构中的一条固定化链的全部或一部分的过程被称为“线性化”。线性化的方式有多种,包括但不限于酶促裂解、光化学裂解或化学裂解。线性化方法的非限制性示例公开于PCT专利公布号WO 2007/010251、美国专利公布号2009/0088327、美国专利公布号2009/0118128和美国专利公布号2019/0352327中,这些专利全文以引用方式并入。
在一些实施方案中,除去3′封端基团和/或可裂解接头的条件也与线性化方法相容,例如包括使用Pd络合物和膦的化学线性化方法。在一些实施方案中,Pd络合物是Pd(II)络合物(例如,Pd(OAc)2、[(烯丙基)PdCl]2或Na2PdCl4),其在本文所述的水溶性膦的存在下,在或不在还原剂的存在下原位生成Pd(0)。
边合成边测序的实施方案和替代方案
另选地,还可以使用未标记的核苷酸和含有本文所述的荧光染料的亲和试剂来进行本文所述的测序方法。例如,在步骤(a)的掺入混合物中,四种不同类型的核苷酸(例如,dATP、dCTP、dGTP和dTTP或dUTP)中的一种类型、两种类型、三种类型或每种类型可以未被标记。四种类型的核苷酸(例如,dNTP)中的每一种类型都具有3′封端基团,以确保仅单一碱基可通过聚合酶加入到引物多核苷酸的3′端。在步骤(b)中掺入未标记的核苷酸后,洗掉剩余未掺入的核苷酸。然后引入亲和试剂,其特异性地识别并结合掺入的dNTP以提供包含掺入的dNTP的标记的延伸产物。在WO 2018/129214和WO 2020/097607中已经公开了未标记的核苷酸和亲和试剂在合成测序中的用途。使用未标记核苷酸的本公开的修饰的测序方法可以包括以下步骤:
(a′)使固体载体与测序引物在杂交条件下接触,其中该固体载体包含多种固定在其上的靶多核苷酸;并且该测序引物与靶多核苷酸的至少一部分互补;
(b′)使固体载体与包含DNA聚合酶和四种不同类型的未标记的核苷酸(A、G、C和T或U)中的一种或多种类型的水性溶液在适用于DNA聚合酶介导的引物延伸的条件下接触,其中核苷酸中的每一种核苷酸包含含有如本文所述的未取代或取代的烯丙基部分的3′封端基团(例如,每种核苷酸包含具有与3′氧原子附接的3′烯丙基封端基团的2′脱氧核糖部分);
(c′)使延伸的拷贝多核苷酸与亲和试剂集在其中一种亲和试剂与掺入的未标记的核苷酸特异性结合的条件下接触,以提供标记的延伸拷贝多核苷酸;
(d′)使该固体载体成像以确定所掺入的核苷酸的身份(例如,通过执行所延伸的拷贝多核苷酸的一次或多次荧光测量来确定所掺入的核苷酸的身份);以及
(e′)使该固体载体与包含钯催化剂和三(羟烷基)膦的水性解封端溶液在适于从所掺入的核苷酸中化学除去3′烯丙基封端基团从而暴露3′-
OH基团以用于在该固体载体上进行进一步核苷酸掺入的条件下接触;以及
重复步骤(b′)-(e′)以确定靶多核苷酸序列。
在本文所述的修饰的测序方法的一些实施方案中,该方法进一步包括从掺入的核苷酸除去亲和试剂。在其他另外的实施方案中,在相同反应中除去3′封端基团和亲和试剂。在一些实施方案中,该方法进一步包括步骤(f′):用第三水性洗涤溶液洗涤固体载体。在另外的实施方案中,重复步骤(b′)至(f′)至少50、100、150、200、250或300个循环以确定靶多核苷酸序列。在一些实施方案中,亲和试剂组可以包含特异性结合第一类型的核苷酸的第一亲和试剂、特异性结合第二类型的核苷酸的第二亲和试剂和特异性结合第三类型的核苷酸的第三亲和试剂。在另外一些实施方案中,第一亲和试剂、第二亲和试剂和第三亲和试剂中的每一种亲和试剂包含光谱可区分的可检测标记。在一些实施方案中,亲和试剂可以包括蛋白质标签、抗体(包括但不限于抗体的结合片段、单链抗体、双特异性抗体等)、适体、打结素、affimer或以合适的特异性和亲和力结合掺入的核苷酸的任何其他已知的试剂。在一个实施方案中,至少一种亲和试剂是抗体或蛋白质标签。在另一个实施方案中,第一类型的亲和试剂、第二类型的亲和试剂和第三类型的亲和试剂中的至少一种类型是包含一个或多个可检测标记(例如,相同可检测标记的多个拷贝)的抗体或蛋白质标签,其中可检测标记是或包括本文所述的双硼染料部分。
一些实施方案包括焦磷酸测序技术。焦磷酸测序检测当将特定的核苷酸掺入新生链中时无机焦磷酸盐(PPi)的释放(Ronaghi,M.、Karamohamed,S.、Pettersson,B.、Uhlen,M.和Nyren,P.(1996)“Real-time DNA sequencing using detection of pyrophosphaterelease.”Analytical Biochemistry 242(1),84-9;Ronaghi,M.(2001)“Pyrosequencingsheds light on DNA sequencing”Genome Res.11(1),3-11;Ronaghi,M.、Uhlen,M.和Nyren,P.(1998)“A sequencing method based on real-time pyrophosphate.”Science281(5375),363;美国专利号6,210,891、6,258,568和6,274,320,这些文献的公开内容全文以引用方式并入本文)。在焦磷酸测序中,释放的PPi可通过被腺苷三磷酸(ATP)硫酸化酶立即转化为ATP成来进行检测,并且经由荧光素酶产生的光子来检测所产生的ATP水平。待测序的核酸可附接到阵列中的特征部,并且可对阵列进行成像以捕获由于在阵列的特征部处掺入核苷酸而产生的化学发光信号。可在用特定核苷酸类型(例如,A、T、C或G)处理阵列后获得图像。在添加每种核苷酸类型后获得的图像将在阵列中哪些特征部被检测到方面不同。图像中的这些差异反映阵列上的特征部的不同序列内容。然而,每个特征部的相对位置将在图像中保持不变。可使用本文所述的方法存储、处理和分析图像。例如,在用每种不同核苷酸类型处理阵列后获得的图像可以与本文针对从用于基于可逆终止子的测序方法的不同检测通道获得的图像所例示的相同方式进行处理。
在另一种示例性类型的SBS中,通过逐步添加可逆终止子核苷酸来完成循环测序,这些可逆终止子核苷酸包含例如可裂解或可光漂白的染料标记,如例如WO 04/018497和美国专利号7,057,026所述,这两份专利的公开内容以引用方式并入本文。该方法由Solexa(现为Illumina,Inc.)商业化,在WO 91/06678和WO 07/123,744中也有所描述,这两份专利各自以引用方式并入本文。荧光标记终止子(其中不但终止可以逆转,而且荧光标记可以裂解)的可用性有利于高效的循环可逆终止(CRT)测序。聚合酶也可共工程化以有效地掺入这些经修饰的核苷酸并从这些经修饰的核苷酸延伸。
优选地,在基于可逆终止子的测序实施方案中,标记在SBS反应条件下基本上不抑制延伸。然而,检测标记可以是可移除的,例如通过裂解或降解移除。可在将标记掺入到阵列化核酸特征部中后捕获图像。在具体实施方案中,每个循环涉及将四种不同的核苷酸类型同时递送到阵列,并且每种核苷酸类型具有在光谱上不同的标记。然后可获得四个图像,每个图像使用对四个不同标记中的一个标记具有选择性的检测通道。替代性地,可以顺序地添加不同的核苷酸类型,并且可以在每个添加步骤之间获得阵列的图像。在此类实施方案中,每个图像将示出已掺入特定类型的核苷酸的核酸特征部。由于每个特征部的不同序列内容,不同特征部将存在于或不存在于不同图像中。然而,特征部的相对位置将在图像中保持不变。通过此类可逆终止子-SBS方法获得的图像可如本文所述进行存储、处理和分析。在图像捕获步骤后,可以除去标记,并且可以除去可逆终止子部分,以便进行核苷酸添加和检测的后续循环。已在特定循环中以及在后续循环之前检测到标记之后移除这些标记可提供减少循环之间的背景信号和串扰的优点。可用的标记和去除方法的示例在下文进行阐述。
一些实施方案可使用少于四种不同标记来使用对四种不同核苷酸的检测。例如,可以利用结合的美国专利公布号2013/0079232的材料中所述的方法和系统来执行SBS。作为第一示例,一对核苷酸类型可在相同波长下检测,但基于对中的一个成员相对于另一个成员的强度差异,或基于对中的一个成员的导致与检测到的该对的另一个成员的信号相比明显的信号出现或消失的改变(例如,经由化学改性、光化学改性或物理改性)来区分。作为第二示例,四种不同核苷酸类型中的三种能够在特定条件下被检测到,而第四种核苷酸类型缺少在那些条件下可被检测到或在那些条件下被最低限度地检测到的标记(例如,由于背景荧光而导致的最低限度检测等)。可基于其相应信号的存在来确定前三种核苷酸类型掺入到核酸中,并且可基于任何信号的不存在或对任何信号的最低限度检测来确定第四核苷酸类型掺入到核酸中。作为第三示例,一种核苷酸类型可包括在两个不同通道中检测到的标记,而其他核苷酸类型在不超过一个通道中被检测到。上述三种例示性构型不被认为是互相排斥的,并且可以各种组合进行使用。组合所有三个示例的示例性实施方案是基于荧光的SBS方法,该方法使用在第一通道中检测到的第一核苷酸类型(例如,具有当由第一激发波长激发时在第一通道中检测到的标记的dATP),在第二通道中检测到的第二核苷酸类型(例如,具有当由第二激发波长激发时在第二通道中检测到的标记的dCTP),在第一通道和第二通道两者中检测到的第三核苷酸类型(例如,具有当被第一激发波长和/或第二激发波长激发时在两个通道中检测到的至少一个标记的dTTP),以及缺少在任一通道中检测到或最低限度地检测到的标记的第四核苷酸类型(例如,不具有标记的dGTP)。
此外,如并入的美国专利公布号2013/0079232的材料中所述,可使用单个通道获得测序数据。在此类所谓的单染料测序方法中,标记第一核苷酸类型,但在生成第一图像之后移除标记,并且仅在生成第一图像之后标记第二核苷酸类型。第三核苷酸类型在第一图像和第二图像中都保留其标记,并且第四核苷酸类型在两个图像中均保持未标记。
一些实施方案可利用边连接边测序技术。此类技术利用DNA连接酶掺入寡核苷酸并识别此类寡核苷酸的掺入。寡核苷酸通常具有与寡核苷酸杂交的序列中的特定核苷酸的同一性相关的不同标记。与其他SBS方法一样,可在用已标记的测序试剂处理核酸特征部的阵列后获得图像。每个图像将示出已掺入特定类型的标记的核酸特征部。由于每个特征部的不同序列内容,不同特征部将存在于或不存在于不同图像中,但特征部的相对位置将在图像中保持不变。通过基于连接的测序方法获得的图像可如本文所述进行存储、处理和分析。可以与本文所述的方法和系统一起使用的示例性SBS系统和方法在美国专利号6,969,488、6,172,218和6,306,597中有所描述,这些专利的公开内容全文以引用方式并入本文。
一些实施方案可利用纳米孔测序(Deamer,D.W.和Akeson,M.“Nanopores andnucleic acids:prospects for ultrarapid sequencing.”Trends Biotechnol.18,147-151(2000);Deamer,D.和D.Branton,“Characterization of nucleic acids by nanoporeanalysis”,Acc.Chem.Res.35:817-825(2002);Li,J.、M.Gershow、D.Stein、E.Brandin和J.A.Golovchenko,“DNA molecules and configurations in a solid-state nanoporemicroscope”,Nat.Mater.2:611-615(2003),这些文献的公开内容全文以引用方式并入本文)。在此类实施方案中,靶核酸穿过纳米孔。纳米孔可为合成孔或生物膜蛋白,诸如α-溶血素。当靶核酸穿过纳米孔时,可通过测量孔的电导率的波动来识别每个碱基对。(美国专利号7,001,792;Soni,G.V.和Meller,“A.Progress toward ultrafast DNA sequencingusing solid-state nanopores”,Clin.Chem.53,1996-2001(2007);Healy,K.“Nanopore-based single-molecule DNA analysis”,Nanomed.2,459-481(2007);Cockroft,S.L.、Chu,J.、Amorin,M.和Ghadiri,M.R.“A single-molecule nanopore device detects DNApolymerase activity with single-nucleotide resolution”,J.Am.Chem.Soc.130,818-820(2008),这些文献的公开内容全文以引用方式并入本文)。从纳米孔测序获得的数据可如本文所述进行存储、处理和分析。具体地,根据本文所述的光学图像和其他图像的示例性处理,可将数据如同图像那样进行处理。
测序方法的一些其他实施方案涉及在纳米球测序技术中使用本文所述的3′封端的核苷酸,诸如美国专利号9,222,132中所述的那些,该专利的公开内容以引用方式并入本文。通过滚环扩增(RCA)过程,可以产生大量离散的DNA纳米球。然后将纳米球混合物分布到含有允许单个纳米球与每个位置相关联的特征的图案化载玻片表面上。在DNA纳米球产生过程中,将DNA片段化,然后使其与四个衔接子序列中的第一个连接。对模板进行扩增、环化,之后用II型内切核酸酶裂解。添加第二组衔接子,然后进行扩增、环化和裂解。对剩余的两个衔接子重复该过程。最终产物是具有四个衔接子的环状模板,每个衔接子由模板序列分开。文库分子经历滚环扩增步骤,产生大量称为DNA纳米球的多联体,这些多联体随后沉积在流通池上。Goodwin等人,“Coming of age:ten years of next-generationsequencing technologies”,Nat Rev Genet.2016;17(6):333-51。
一些实施方案可利用涉及DNA聚合酶活性的实时监测的方法。可以通过携带荧光团的聚合酶与γ-磷酸标记的核苷酸之间的荧光共振能量转移(FRET)相互作用来检测核苷酸掺入(如例如美国专利号7,329,492和7,211,414中所述,这两份专利均以引用方式并入本文),或者可以用零模波导来检测核苷酸掺入(如例如美国专利号7,315,019中所述,该专利以引用方式并入本文),并且可以使用荧光核苷酸类似物和工程化聚合酶来检测核苷酸掺入(如例如美国专利号7,405,281和美国专利公布号2008/0108082中所述,这两份专利均以引用方式并入本文)。可以将照明限于表面拴系的聚合酶周围的z升规模体积,使得可以在低背景下观察荧光标记核苷酸的掺入情况(Levene,M.J.等人,“Zero-mode waveguidesfor single-molecule analysis at high concentrations”,Science 299,682-686(2003);Lundquist,P.M.等人,“Parallel confocal detection of single molecules inreal time”,Opt.Lett.33,1026-1028(2008);Korlach,J.等人,“Selective aluminumpassivation for targeted immobilization of single DNA polymerase molecules inzero-mode waveguide nano structures”,Proc.Natl.Acad.Sci.USA 105,1176-1181(2008),这些文献的公开内容全文以引用方式并入本文)。通过此类方法获得的图像可如本文所述进行存储、处理和分析。
一些SBS实施方案包括检测在核苷酸掺入延伸产物时释放的质子。例如,基于对释放质子的检测的测序可以使用可从Ion Torrent(Guilford,CT,Life Technologies子公司)商购获得的电检测器和相关技术,或者在美国专利公布号2009/0026082、2009/0127589、2010/0137143和2010/0282617(所有这些专利公布均以引用方式并入本文)中所述的测序方法和系统。本文阐述的使用动力学排阻来扩增靶核酸的方法可容易地应用于用于检测质子的基板。更具体地,本文阐述的方法可以用于产生用于检测质子的扩增子克隆群体。
上述SBS方法可有利地以多种格式进行,使得同时操纵多个不同的靶核酸。在具体实施方案中,可在共同的反应容器中或在特定基板的表面上处理不同的靶核酸。这允许以多种方式方便地递送测序试剂、移除未反应的试剂和检测掺入事件。在使用表面结合的靶核酸的实施方案中,靶核酸可为阵列格式。在阵列格式中,靶核酸通常可以在空间上可区分的方式结合到表面。靶核酸可通过直接共价附接、附接到小珠或其他粒子或结合到附接到表面的聚合酶或其他分子来结合。阵列可包括在每个位点(也被称为特征部)处的靶核酸的单个拷贝,或者具有相同序列的多个拷贝可存在于每个位点或特征部处。多个拷贝可通过扩增方法(诸如,如下文进一步详细描述的桥式扩增或乳液PCR)产生。
本文所述的方法可使用具有处于多种密度中任一种密度的特征部的阵列,该多种密度包括例如至少约10个特征部/cm2、100个特征部/cm2、500个特征部/cm2、1,000个特征部/cm2、5,000个特征部/cm2、10,000个特征部/cm2、50,000个特征部/cm2、100,000个特征部/cm2、1,000,000个特征部/cm2、5,000,000个特征部/cm2或更高。
本文阐述的方法的优点是它们平行提供了对多个靶核酸的快速且有效检测。因此,本公开提供了能够使用本领域已知的技术(诸如上文所例示的那些)来制备和检测核酸的整合系统。因此,本公开的整合系统可包括能够将扩增试剂和/或测序试剂递送到一个或多个固定DNA片段的流体组件,该系统包括诸如泵、阀、贮存器、流体管线等的组件。流通池在整合系统中可被配置用于和/或用于检测靶核酸。示例性流通池在例如美国专利公布号2010/0111768和美国专利申请号13/273,666中有所描述,这两份专利中的每一者以引用方式并入本文。如针对流通池所例示的,整合系统的一个或多个流体组件可用于扩增方法和检测方法。以核酸测序实施方案为例,整合系统的一个或多个流体组件可用于本文阐述的扩增方法以及用于在测序方法(诸如上文例示的那些)中递送测序试剂。另选地,整合系统可包括单独的流体系统以执行扩增方法并执行检测方法。能够产生扩增核酸而且还能够确定核酸序列的整合测序系统的示例包括但不限于MiSeqTM平台(Illumina,Inc.,San Diego,CA),以及在美国专利申请号13/273,666中描述的设备,该专利以引用方式并入本文。
其中多核苷酸已直接附接到基于二氧化硅的载体的阵列是例如在WO 00/06770(以引用方式并入本文)中所公开的那些,其中通过玻璃上的环氧侧基与多核苷酸上的内部氨基基团之间的反应将多核苷酸固定在玻璃载体上。此外,可以通过硫基亲核物质与固体载体的反应将多核苷酸连接到固体载体,例如,如WO 2005/047301(以引用方式并入本文)中所述。固体承载的模板多核苷酸的又一个示例为,其中模板多核苷酸附接到承载在基于二氧化硅的固体载体或其他固体载体上的水凝胶,例如,如WO 00/31148、WO 01/01143、WO02/12566、WO 03/014392、美国专利号6,465,178和WO 00/53812中所述,这些专利各自以引用方式并入本文。
模板多核苷酸可以固定于其上的特定表面是聚丙烯酰胺水凝胶。聚丙烯酰胺水凝胶描述于上文引用的参考文献和WO 2005/065814中,该专利以引用方式并入本文。可以使用的特定水凝胶包括WO 2005/065814和美国专利公布号2014/0079923中所述的那些。在一个实施方案中,水凝胶为PAZAM(聚(N-(5-叠氮基乙酰氨基戊基)丙烯酰胺-共-丙烯酰胺))。
DNA模板分子可以连接到珠粒或微粒,例如,如美国专利号6,172,218(以引用方式并入本文)中所述。与珠粒或微粒的附接可以用于测序应用。可以制备珠粒文库,其中每个珠粒包含不同的DNA序列。示例性文库及其产生方法描述于以下文献中:Nature,437,376-380(2005);Science,309,5741,1728-1732(2005),这些文献各自以引用方式并入本文。使用本文示出的核苷酸对此类珠粒的阵列进行测序在本公开的范围内。
待测序的模板可以形成固体载体上的“阵列”的一部分,在这种情况下,阵列可以采取任何方便的形式。因此,本公开的方法适用于所有类型的高密度阵列,包括单分子阵列、成簇阵列和珠粒阵列。本公开的标记核苷酸可以用于对基本上任何类型的阵列上的模板(包括但不限于通过将核酸分子固定在固体载体上而形成的那些)进行测序。
然而,本公开的标记核苷酸在对成簇阵列进行测序的背景中是特别有利的。在成簇阵列中,阵列上的不同区域(通常称为位点或特征)包含多个多核苷酸模板分子。一般来讲,所述多个多核苷酸分子不能通过光学手段单独地分辨,而是作为整体被检测到。取决于阵列的形成方式,阵列上的每个位点可以包含一个单独多核苷酸分子的多个拷贝(例如,该位点对于特定的单链核酸种类或双链核酸种类是同质的)或甚至少量不同多核苷酸分子的多个拷贝(例如,两个不同核酸种类的多个拷贝)。核酸分子的成簇阵列可以使用本领域中公知的技术产生。以举例的方式,WO 98/44151和WO 00/18957(其中的每一篇均并入本文)描述了扩增核酸的方法,其中模板和扩增产物均保持固定在固体载体上,以便形成由固定核酸分子的簇或“集落”组成的阵列。根据这些方法制备的成簇阵列上存在的核酸分子是使用用本公开的染料化合物标记的核苷酸进行测序的合适模板。
本公开的标记核苷酸还可用于对单分子阵列上的模板进行测序。如本文所用的术语“单分子阵列”(“SMA”)是指分布(或排列)在固体载体上的多核苷酸分子群,其中任何单独的多核苷酸与该分子群的所有其他多核苷酸的间距使得有可能单独地分辨单独的多核苷酸分子。因此,在一些实施方案中,固定到固体载体的表面上的靶核酸分子能够通过光学手段分辨。这意味着一个或多个不同的信号(每个信号代表一种多核苷酸)将出现在所用的特定成像装置的可分辨区域内。
可以实现单分子检测,其中阵列上的相邻多核苷酸分子之间的间距为至少100nm,更具体地讲至少250nm,还更具体地讲至少300nm,甚至更具体地讲至少350nm。因此,每个分子能够作为单分子荧光点来单独地分辨和检测,并且来自所述单分子荧光点的荧光也表现出单步光漂白。
术语“单独分辨的”和“单独分辨”在本文中用于规定,当可视化时,有可能将阵列上的一个分子与其相邻分子区分开。阵列上各个分子之间的间隔将部分地通过用于分辨各个分子的特定技术来确定。通过参考公布的申请WO 00/06770和WO 01/57248将理解单分子阵列的一般特征,这些公布各自以引用方式并入本文。虽然本公开的核苷酸的一种用途是用于边合成边测序反应,但这些核苷酸的效用却不限于此类方法。事实上,这些核苷酸可以有利地用于需要检测附接于掺入到多核苷酸中的核苷酸的荧光标记的任何测序方法。
特别地,本公开的标记核苷酸可以用于自动化荧光测序方案中,尤其是基于Sanger和同事的链终止测序方法的荧光染料-终止子循环测序。此类方法通常使用酶和循环测序将荧光标记的双脱氧核苷酸掺入引物延伸测序反应中。所谓的Sanger测序方法和相关方案(Sanger型)利用带有标记的双脱氧核苷酸的随机化链终止。
因此,本公开还涵盖下述标记核苷酸:这些标记核苷酸是在3′位和2′位处都缺少羟基基团的双脱氧核苷酸,此类双脱氧核苷酸适合在Sanger型测序方法等中使用。
应当理解,掺入了3′封端基团的本公开的标记核苷酸也可以用于Sanger方法和相关方案中,因为通过使用具有3′-OH封端基团的核苷酸可以实现与通过使用双脱氧核苷酸所实现的效果相同的效果:两者均防止掺入后续核苷酸。在根据本公开的并且具有3′封端基团的核苷酸将用于Sanger型测序方法的情况下,应当理解,附接到核苷酸的染料化合物或可检测标记不需要经由可裂解接头连接,因为在掺入本公开的标记的核苷酸的每种情况下;随后不需要掺入核苷酸,因此不需要从核苷酸上除去标记。
试剂盒
本公开的一些附加实施方案涉及一种测序试剂盒,该试剂盒包含:
(a)包含DNA聚合酶和核苷酸A、G、C和T或U的掺入混合物,其中:
(i)该核苷酸包含具有与3′碳原子附接的如本文所述的3′未取代或取代的烯丙基基团(例如,)的2′脱氧核糖部分;
以及
(ii)该DNA聚合酶是改变的古细菌DNA聚合酶;
(b)包含钯催化剂、三(羟烷基)膦和一种或多种缓冲液试剂的水性解封端溶液,该水性解封端溶液适于(i)从掺入的核苷酸中化学除去3′烯丙基基团从而暴露3′-OH基团以用于在该固体载体上进行进一步核苷酸掺入;以及(ii)化学除去经由可裂解接头附接的可检测标记;以及
(c)包含Pd(II)清除剂的水性洗涤溶液;
其中所述试剂盒被配置用于执行至少约50、100、150、200、250或300个边合成边测序循环。
在另外一些实施方案中,该试剂盒可包含四种类型的标记的核苷酸,即本文所述的完全官能化核苷酸(A、C、T和G),其中每种类型的核苷酸均包含本文所述的3′烯丙基封端基团和AOL接头部分。在另外的实施方案中,G是未标记的,并且不包含任何可裂解接头。在更进一步的实施方案中,剩余三种核苷酸(即,A、C和T)中的一种或多种核苷酸包含本文所述的烯丙胺或烯丙酰胺接头部分。在一个实施方案中,试剂盒包含未标记的ffG、标记的ffA、标记的ffC和标记的ffT(其中ffT含有在核碱基与可检测标记之间的烯丙胺或烯丙酰胺接头部分;也称为双键或DB接头)。在另外的实施方案中,试剂盒包含本文所述的未标记的ffG、标记的ffA、标记的ffC-DB和标记的ffT-DB。在另外一些实施方案中,至少一种类型的核苷酸包含经由可裂解接头与可检测标记附接的碱基,并且可裂解接头是其中Z是-O-CH2-CH=CH2;n是1、2、3、4或5的整数;*指示可裂解接头与碱基的附接点;并且**指示可裂解接头与可检测标记的附接点。在另外的实施方案中,T核苷酸的核碱基经由可裂解接头与可检测标记附接。在另外一些实施方案中,其中至少三种核苷酸中的每一种核苷酸独立地包含经由可裂解接头与可检测标记附接的碱基,并且可裂解接头选自由以下项组成的组:
其中Z是-O-CH2-CH=CH2;n是1、2、3、4或5的整数;*指示可裂解接头与碱基的附接点;并且**指示可裂解接头与可检测标记的附接点。
在其他实施方案中,一种或多种类型的核苷酸A、G、C和T或U是未标记的,并且其中第一类型的未标记的核苷酸包含第一官能部分,并且试剂盒进一步包含第一标记试剂,其中第一标记试剂包含一个或多个第一可检测标记和能够与第一类型的未标记的核苷酸的第一官能部分特异性结合的第一结合部分。在一些此类实施方案中,第一类型的未标记的核苷酸的第一官能部分经由本文所述的可裂解接头通过共价结合或非共价相互作用与第一标记试剂结合。在一些实施方案中,两种或更多种类型的核苷酸A、G、C和T或U是未标记的。在另外一些实施方案中,四种类型的核苷酸中的每一种类型是未标记的,并且其中第二类型的未标记的核苷酸包含第二官能部分,并且试剂盒进一步包含第二标记试剂,其中第二标记试剂包含一个或多个第二可检测标记和能够与第二类型的未标记的核苷酸的第二官能部分特异性结合的第二结合部分。在一些此类实施方案中,第二类型的未标记的核苷酸的第二官能部分经由本文所述的可裂解接头通过共价结合或非共价相互作用与第二标记试剂结合。在另外一些实施方案中,第三类型的未标记的核苷酸包含第三官能部分,并且试剂盒进一步包含第三标记试剂,其中第三标记试剂包含一个或多个第三可检测标记和能够与第三类型的未标记的核苷酸的第三官能部分特异性结合的第三结合部分。在一些此类实施方案中,第三类型的未标记的核苷酸的第三官能部分经由本文所述的可裂解接头通过共价结合或非共价相互作用与第三标记试剂结合。在其他实施方案中,第三类型的未标记的核苷酸包含含有第一官能部分的第三类型的未标记的核苷酸和含有第二官能部分的第三类型的未标记的核苷酸的混合物,并且其中第一标记试剂和第二标记试剂均能够与第三类型的未标记的核苷酸特异性结合。在另外一些实施方案中,第四类型的未标记的核苷酸不能与第一标记试剂、第二标记试剂或第三标记试剂中的任一种标记试剂特异性结合。掺入后标记试剂盒和方法已描述于美国专利公布号2023/0383342A1中,该文献全文以引用方式并入。核苷酸的官能部分与标记试剂的结合部分之间的非共价相互作用的非限制性示例包括但不限于亲和素(例如,链霉亲和素或中性亲和素)和生物素;二硝基苯基(DNP)部分和抗DNP抗体;地高辛(DIG)和抗DIG抗体;β-N-乙酰基葡糖胺(O-GlcNAc)和WGA(凝集素);烷基鸟嘌呤部分和SNAP-烷基氯部分和3-硝基酪氨酸和抗硝基酪氨酸;镍或钴络合物,诸如Ni-次氮基三乙酸(NTA)和His-Tag;锌络合物和寡天冬氨酸蛋白。官能部分与标记试剂之间的共价相互作用的非限制性实例包括但不限于选自由以下项组成的组的双正交反应:[3+2]偶极环加成、狄尔斯-阿尔德环加成、[4+1]环加成、膦连接或与2-酰基苯基硼酸的缩合。例如,官能部分和结合部分中的一者包含或为降冰片烯、反式环辛烯(TCO)、二苯并环辛炔(DBCO)或双环[6.1.0]壬炔(BCN),并且官能部分和结合部分中的另一者包含或为叠氮基。在一些其他实施方案中,官能部分和结合部分中的一者包含或为TCO,并且官能部分和结合部分中的另一者包含或为任选取代的1,2,4,5-四嗪部分。可裂解接头可包含以下结构:
其中Z是-O-CH2-CH=CH2;m和n中的每一者独立地是1、2、3、4或5的整数;*指示可裂解接头与碱基的附接点;并且**指示可裂解接头与未标记的核苷酸的第一/第二/第三官能部分的附接点。在一些实施方案中,m为2。在另外一些实施方案中,n为4。
在一个具体实施方案中,试剂盒可以包括至少一种标记的3′封端的核苷酸或核苷,以及标记的或未标记的核苷酸或核苷。例如,用染料标记的核苷酸可以与未标记的或天然的核苷酸和/或与荧光标记的核苷酸或它们的任何组合结合提供。核苷酸的组合可以作为独立的单独组分(例如,每个容器或管一个核苷酸类型)或作为核苷酸混合物(例如,在同一容器或管中混合的两种或更多种核苷酸)提供。
在试剂盒包括用染料化合物标记的多种,特别地是两种或三种,或者更特别地是四种3′封端的核苷酸的情况下,不同的核苷酸可以用不同的染料化合物标记,或者一种可以是暗色的,未用染料化合物标记。在不同的核苷酸用不同的染料化合物标记的情况下,试剂盒的一个特征是染料化合物是光谱上可区分的荧光染料。如本文所用,术语“光谱上可区分的荧光染料”是指当一个样品中存在两种或更多种此类染料时,以能够通过荧光检测设备(例如,商业的基于毛细管的DNA测序平台)区分的波长发射荧光能量的荧光染料。当用荧光染料化合物标记的两种核苷酸以试剂盒形式提供时,一些实施方案的特征在于光谱上可区分的荧光染料能够以相同的波长激发,诸如,通过相同的激光器激发。当用荧光染料化合物标记的四种3′封端的核苷酸(A、C、T和G)以试剂盒形式提供时,一些实施方案的特征在于,光谱上可区分的荧光染料中的两种荧光染料均能够以一个波长激发,而另外两种光谱上可区分的染料均能够以另一个波长激发。特定的激发波长为450nm至460nm,或520nm至532nm。
在一个另选的实施方案中,本公开的试剂盒可以包含其中相同的碱基用两种或更多种不同的染料标记的3′封端的核苷酸。第一核苷酸(例如,3′烯丙基封端的T核苷酸三磷酸或3′封端的G核苷酸三磷酸)可以用第一染料标记。第二核苷酸(例如,3′封端的C核苷酸三磷酸)可以用与第一染料在光谱上不同的第二染料标记,例如在小于600nm的波长下吸光的“绿色”染料,和在小于500nm的波长下吸光的“蓝色”染料,例如400nm至500nm,特别是450nm至460nm)。第三核苷酸(例如,3′封端的A核苷酸三磷酸)可以标记为第一染料和第二染料的混合物,或者第一染料、第二染料和第三染料的混合物,并且第四核苷酸(例如,3′封端的G核苷酸三磷酸或3′封端的T核苷酸三磷酸)可以是“暗色”的,并且不包含标记。在一个示例中,核苷酸1至4可以被标记为“蓝色”、“绿色”、“蓝色/绿色”和暗色。为了进一步简化仪器,可以用单个激光器所激发的两种染料标记四种核苷酸,因此核苷酸1至4的标记可以是“蓝色1”、“蓝色2”、“蓝色1/蓝色2”和暗色。
在特定的实施方案中,试剂盒可包含四种标记的3′封端的核苷酸(例如,A、C、T、G),其中每种类型的核苷酸包含相同的3′烯丙基封端基团和荧光标记,并且其中每种荧光标记具有不同的最大荧光值,每种荧光标记能够与另外三种标记区分开。试剂盒可以是这样的:即,这些荧光标记中的两种或更多种荧光标记具有类似的最大吸光度,但具有不同的斯托克斯位移。在一些其他实施方案中,一种类型的核苷酸是未标记的。
尽管本文以具有用不同染料化合物标记的不同核苷酸的构型为例来说明试剂盒,但是应当理解,试剂盒可以包括具有相同染料化合物的2种、3种、4种或更多种不同核苷酸。在一些实施方案中,试剂盒还包括酶和适于酶发挥作用的缓冲液。在一些此类实施方案中,酶是聚合酶、末端脱氧核苷酸转移酶或逆转录酶。在具体实施方案中,酶是DNA聚合酶,诸如DNA聚合酶812(Pol 812)或DNA聚合酶1901(Pol 1901)。在另外一些实施方案中,试剂盒可以包括本文所述的掺入混合物。在另外的实施方案中,含有本文所述的掺入混合物的试剂盒还包括至少一种Pd清除剂(例如,本文所述的包含一个或多个烯丙基部分的Pd(0)清除剂)。Pd(0)清除剂包括一个或多个各自独立地选自由以下项组成的组的烯丙基部分:–O-烯丙基、–S-烯丙基、–NR-烯丙基和–N+RR′-烯丙基,其中R为H、未取代的或取代的C1-C6烷基、未取代的或取代的C2-C6烯基、未取代的或取代的C2-C6炔基、未取代的或取代的C6-C10芳基、未取代的或取代的5至10元杂芳基、未取代的或取代的C3-C10碳环基,或者未取代的或取代的5至10元杂环基;并且R′为H、未取代的C1-C6烷基或取代的C1-C6烷基。在一些此类实施方案中,掺入溶液中的Pd(0)清除剂包含一个或多个如本文涉及测序方法所述的–O-烯丙基部分。
待被包括在此类试剂盒中的其他组分可以包括缓冲液等。本公开的核苷酸以及包括不同核苷酸的混合物在内的其他任何核苷酸组分可以在试剂盒中以浓缩形式提供,在使用前稀释。在此类实施方案中,还可以包括合适的稀释缓冲液。例如,掺入混合物试剂盒可以包括一种或多种选自以下项的缓冲剂:伯胺、仲胺、叔胺、天然氨基酸或非天然氨基酸,或者它们的组合。在另外的实施方案中,掺入混合物中的缓冲剂包括乙醇胺或甘氨酸,或者它们的组合。
同样,在本文示出的方法中识别的组分中的一种或多种组分可以被包括在本公开的试剂盒中。在另外一些实施方案中,试剂盒可以包括本文所述的钯催化剂。在一些实施方案中,Pd催化剂通过将Pd(II)络合物(即Pd预催化剂)与本文所述的一种或多种水溶性膦混合来产生。在一些此类实施方案中,包含Pd催化剂的试剂盒是裂解混合物试剂盒。在另外的实施方案中,裂解混合物试剂盒可含有[Pd(烯丙基)Cl]2或Na2PdCl4和水溶性膦(三(羟烷基)膦,诸如THPP),以生成活性Pd(0)物质。Pd(II)络合物(例如Pd(烯丙基)Cl]2或Na2PdCl4)与水溶性膦(例如,THP)的摩尔比可为约1:1、1:1.5、1:2、1:2.5、1:3、1:3.5、1:4、1:4.5、1:5、1:5.5、1:6、1:6.5、1:7、1:7.5、1:8、1:8.5、1:9、1:9.5或1:10。在另外的实施方案中,裂解混合物试剂盒还可以包含一种或多种选自由以下项组成的组的缓冲液试剂:伯胺、仲胺、叔胺、碳酸盐、磷酸盐和硼酸盐,以及它们的组合。裂解混合物试剂盒中的缓冲液试剂的非限制性示例选自由以下项组成的组:乙醇胺(EA)、三(羟甲基)氨基甲烷(Tris)、甘氨酸、碳酸盐、磷酸盐、硼酸盐、二甲基乙醇胺(DMEA)、二乙基乙醇胺(DEEA)、N,N,N′,N′-四甲基乙二胺(TEMED)、和N,N,N′,N′-四乙基乙二胺(TEEDA)、2-哌啶乙醇(也称为(2-羟乙基)哌啶,其具有以下结构:),以及它们的组合。在一个实施方案中,裂解混合物试剂盒包含DEEA。在其他实施方案中,裂解混合物试剂盒含有(2-羟乙基)哌啶。
在另外一些实施方案中,试剂盒可以包括一种或多种钯清除剂(例如,本文所述的Pd(II)清除剂)。在一些此类实施方案中,Pd(II)清除剂是在裂解后洗涤缓冲液中。在一个实施方案中,裂解后洗涤缓冲液试剂盒包括L-半胱氨酸或其盐。
在本文所述试剂盒的任何实施方案中,Pd清除剂(例如,本文所述的Pd(0)或Pd(II)清除剂)在与Pd催化剂分开的容器/隔室中。
本公开还提供与测序设备一起使用的盒,其包括多个室,其中多个室中的一个或多个室与本文所述的试剂盒一起使用。例如,盒可含有两个或更多个单独的室,一个室含有本文所述的水性裂解混合物,并且另一个室含有本文所述的掺入混合物。
实施例
在以下实施例中更详细地公开了附加的实施方案,这些实施例并非旨在以任何方式限制权利要求书的范围。
实施例1.Pd裂解溶液动力学研究
在该实施例中,由摩尔比为1:3.5的Na2PdCl4和THPP在pH约9.8的含有(2-羟乙基)哌啶的缓冲溶液中原位生成的Pd(0)裂解混合物的效率。使用具有两个不同的3′封端基团的T核苷:3′-O-烯丙基-T-5′-OH和3′-AOM-T-5′-OH(3′-AOM封端基团具有与核苷酸的3′碳原子附接的结构)。该研究比较了Pd裂解混合物在裂解3′烯丙基封端基团和3′-AOM封端基团中的有效性。如图1所示,两个封端基团上的Pd裂解效率是非常可比的,并且3′封端基团裂解几乎在30分钟后完成。
实施例2.3′-烯丙基封端的完全官能化的核苷酸(ffN)的合成
3′-烯丙基ffT的合成实施例
5′-O-(叔丁基二苯基甲硅烷基)-3′-O-烯丙基-5-碘-2′-脱氧尿苷(T2)
在氮气下将氢化钠(200mg,5mmol)悬浮在烧瓶中的5mL无水四氢呋喃中。然后在0℃逐滴加入5-碘-5′-TBDPS-2′-脱氧尿苷T1(1g,1.68mmol)在10mL无水THF中的溶液。然后将反应升至室温并搅拌30分钟,然后在室温逐滴加入烯丙基溴(430μL,5mmol)。将反应在室温搅拌过夜,然后用300μL醋酸淬灭,用100mL水稀释并用100mL乙酸乙酯萃取。将有机相用100mL水、100mL盐水洗涤。有机相用MgSO4干燥,过滤并蒸发至干。在Biotage系统(SNAPSfar 25g,梯度为100% DCM至75:25DCM/EtOAc)上通过硅胶快速色谱法纯化残余物。收率:724mg(1.14mmol),68%。TLC(EtOAc/DCM 2:8):Rf 0.7。1H NMR(400MHz,d6-DMSO):δ(ppm)11.76(s,1H,NH),8.01(s,1H,C-6),7.65(ddd,J=7.9,4.9,1.7Hz,4H,Ph),7.55–7.40(m,6H,Ph),6.04(dd,J=8.2,5.9Hz,1H,1′-CH),5.87(ddt,J=17.2,10.5,5.3Hz,1H,O-CH2-CH=),5.23(dq,J=17.3,1.8Hz,1H,CHH=),5.15(dq,J=10.4,1.5Hz,1H,CHH=),4.11(dt,J=5.4,2.4Hz,1H,3′-CH),4.06–4.00(m,1H,4′-CH),3.95(tt,J=3.9,1.5Hz,2H,CH2烯丙基),3.85(dd,J=11.3,4.0Hz,1H,5′-CHH),3.73(dd,J=11.3,4.5Hz,1H,5′-CHH),2.36–2.27(m,1H,2′-CHH),2.22(ddd,J=13.9,8.3,6.1Hz,1H,2′-CHH),1.03(s,9H,tBu)。LC-MS(ES和CI):(正离子)m/z 633(M+H+),655(M+Na+);(负离子)m/z 631(M-H+)。
5′-O-(叔丁基二苯基甲硅烷基)-3′-O-烯丙基-5-[3-(2,2,2-三氟乙酰胺基)-烯 丙基]-2′-脱氧尿苷(T3)
将5′-O-(叔丁基二苯基甲硅烷基)-3′-O-烯丙基-5-碘-2′-脱氧尿苷(T2)(401mg,0.634mmol)、2-二环己基膦基-2′,4′,6′-三异丙基联苯(24mg,0.05mmol,XPhos)、[3-(2,2,2-三氟乙酰胺基)]-烯丙基硼酸频哪醇酯(354mg,1.27mmol)和氯化烯丙基钯(II)二聚物(9mg,0.025mmol)溶解在6mL无水二甲基甲酰胺中,并通过用氮气鼓泡10分钟来脱气。然后加入Cs2CO3(412mg,1.27mg)在0.6mL水中的溶液并将反应加热至45℃。1小时后,用100mL乙酸乙酯稀释反应物,并用2x 100mL水和100mL盐水洗涤。有机相用MgSO4干燥,过滤并蒸发至干。在Biotage系统(SNAP Sfar25g,梯度为100% DCM至7:3DCM/EtOAc)上通过硅胶快速色谱法纯化残余物。收率:282mg(0.429mmol),68%。TLC(EtOAc/DCM 2:8):Rf0.5。1H NMR(400MHz,d6-DMSO):δ(ppm)11.52(s,1H,NH),9.62(t,J=5.7Hz,1H),7.95(s,1H,C-6),7.70–7.59(m,4H,Ph),7.53–7.38(m,6H,Ph),6.45(dt,J=15.8,6.3Hz,1H,Ar-CH=CH),6.11(t,J=7.1Hz,1H,1′-CH),5.99(d,J=15.9Hz,1H,Ar-CH=,5.89(ddt,J=17.3,10.6,5.3Hz,1H,O-CH2-CH=),5.26(dq,J=17.3,1.8Hz,1H,CHH=),5.16(dq,J=10.4,1.5Hz,1H,CHH=),4.17(dt,J=6.3,3.3Hz,1H,3′-CH),4.08–3.94(m,3H,4′-CH,O-CH2-All),3.88(dd,J=11.1,4.7Hz,1H,5′-CHH),3.77(m,3H,5′-CHH,CH2-NHTFA),2.34–2.25(m,2H,2′-CH2),1.01(s,9H,tBu)。LC-MS(ES和CI):(正离子)m/z 658(M+H+);(负离子)m/z 656(M-H+)。
3′-O-烯丙基-5-[3-(2,2,2-三氟乙酰胺基)-烯丙基]-2′-脱氧尿苷(T4)
在N2气氛下,将5′-O-(叔丁基二苯基甲硅烷基)-3′-O-烯丙基-5-[3-(2,2,2-三氟乙酰胺基)-烯丙基]-2′-脱氧尿苷(T3)(470mg,0.743mmol)溶于干燥THF(6mL)中,然后加入1.0M TBAF在THF中的溶液(390μL,0.89mmol)。将溶液在室温搅拌18小时,然后TLC(EtOAC/DCM 1:1)显示完成。将溶液用100mL EtOAc稀释,然后用50mL饱和NaH2PO4(pH=3),并用2x50mL水洗涤。有机相用MgSO4干燥,过滤并蒸发至干。在Biotage系统(SNAP Sfar 10g,梯度为100% DCM至1:1DCM/EtOAc)上通过硅胶快速色谱法纯化残余物。收率:218mg(520mmol),70%。TLC(EtOAc/DCM 1:1):Rf 0.5。1H NMR(400MHz,d6-DMSO):δ(ppm)11.47(s,1H,NH),9.68(t,J=5.7Hz,1H,NHTFA),8.03(s,1H,H-6),6.47(dt,J=15.9,6.2Hz,1H,Ar-CH=CH),6.21(d,J=16.0Hz,1H,Ar-CH=),6.12(dd,J=7.9,6.0Hz,1H,1′-CH)5.90(ddt,J=17.3,10.5,5.3Hz,1H,O-CH2-CH=),5.28(dq,J=17.3,1.8Hz,1H,CHH=),5.16(m,2H,CHH=,5′-OH),4.13(dt,J=5.5,2.6Hz,1H,3′-CH),4.03–3.94(m,3H,4′-CH,O-CH2-All),3.88(t,J=6.0Hz,2H,CH2-NHTFA),3.67–3.54(m,2H,5′-CH2),2.28(ddd,J=13.6,6.0,2.7Hz,1H,2′-CH2),2.20(ddd,J=13.7,7.9,5.8Hz,1H,2′-CH2)。LC-MS(ES和CI):(正离子)m/z420(M+H+),442(M+Na+);(负离子)m/z 418(M-H+)。
5′-O-三磷酸-3′-O-烯丙氧基甲基-5-(3-氨基烯丙基)-2′-脱氧尿苷(T5)
在减压下将3′-O-烯丙基-5-[3-(2,2,2-三氟乙酰胺基)-烯丙基]-2′-脱氧尿苷(T4)(210mg,0.501mmol)用P2O5干燥18小时。在氮气下向其中加入无水磷酸三乙酯(2mL)和一些新活化的分子筛,然后在冰/盐浴中将反应烧瓶冷却至-15℃。逐滴加入新蒸馏的POCl3(56μL,0.601mmol),之后逐滴加入Proton(160mg,0.75mmol)。添加后,在0℃下将反应物进一步搅拌15分钟。然后,快速加入焦磷酸双-三正丁基铵盐(1.3g,2.50mmol)在无水DMF中的0.5M溶液,之后立即加入三正丁基胺(537μL,2.25mmol)。将反应从浴中取出并在室温搅拌10分钟,然后淬入1M三乙基碳酸氢铵水性溶液(TEAB,20mL)中,并在室温进一步搅拌4小时。然后用30mL乙酸乙酯萃取该溶液。在减压下蒸发水相,然后向残余物中加入35%氨水性溶液(20mL)并在室温搅拌混合物4小时。减压蒸发溶剂,将残余物再悬浮于10mL0.1M TEAB中,并过滤。首先在DEAE-Sephadex A25(100g)上通过离子交换色谱法纯化滤液。用线性梯度的水性三乙基碳酸氢铵(TEAB,在1L中从0.1M至0.8M)洗脱柱。汇集含有三磷酸盐的级分,并将溶剂在减压下蒸发至干燥。通过制备型HPLC使用YMC-Pack-Pro C18柱,用0.1M TEAB和乙腈洗脱来进一步纯化粗材料。获得化合物T5,为三乙基铵盐。收率:195μmol(39%)。1H NMR(400MHz,D2O):δ(ppm)8.15(s,1H,H-6),6.50(d,J=15.9Hz,1H,Ar-CH=),6.38(dt,J=16.0,6.5Hz,1H,Ar-CH=CH-),6.29(dd,J=8.2,5.9Hz,1H,1′-CH),5.91(ddt,J=17.0,10.3,5.9Hz,1H O-CH2-CH=),5.30(dq,J=17.3,1.5Hz,1H,CHH=),5.24–5.16(m,1H,CHH=),4.41(dt,J=5.9,2.0Hz,1H,3′-CH),4.33(m,1H,4’-CH),4.22(ddd,J=11.8,4.1,2.4Hz,1H,5’-CHH),4.15(ddd,J=11.9,6.2,2.5Hz,1H,5’-CHH),4.07(ddt,J=5.8,2.3,1.3Hz,2H,=CH-CH2-O),3.65(dd,J=6.6,1.1Hz,2H,CH2-NH2),3.12(q,J=7.3Hz,Et3N+),2.47(ddd,J=14.3,6.0,2.1Hz,1H,2’-CHH),2.27(ddd,J=14.2,8.3,5.8Hz,1H,2’-CHH),1.20(t,J=7.3Hz,,Et3N+)。LC-MS(ES和CI):(负离子)m/z 562(M-H+)。
ffT(DB)-3′All-AOL-NR550s0的合成
将AOL-NR550s0羧酸盐(0.012mmol)与2x2mL无水N,N′-二甲基甲酰胺(DMF)共蒸发,然后溶解于1.5mL无水N,N′-二甲基乙酰胺(DMA)中。加入N,N-二异丙基乙胺(17μL,0.1mmol),之后加入N,N,N′,N′-四甲基-O-(N-琥珀酰亚胺基)脲四氟硼酸盐(TSTU,140μL的100mM DMF溶液,0.014mmol)。在氮气下在室温搅拌反应1小时。同时,将三磷酸盐T5(0.01mmol)的水性溶液在减压下蒸发至干燥,并重悬于150μL的0.1M三乙基碳酸氢铵(TEAB)水性溶液中。将活化的AOL-NR550s0羧酸盐溶液加入到三磷酸盐中,并将反应在室温搅拌18小时并且通过RP-HPLC监测。首先通过离子交换色谱法在DEAE-Sephadex A25(25g)上用0.1M TEAB/乙腈8:2至1M TEAB/乙腈8:2的梯度洗脱来纯化粗产物。汇集含有三磷酸盐的级分,并将溶剂在减压下蒸发至干燥。通过制备型RP-HPLC使用YMC-Pack-Pro C18柱,用0.1M TEAB和乙腈洗脱来进一步纯化粗材料。LC-MS(ES):(负离子)m/z 1526(M-2H++Na+),752(M-2H+)。RP-HPLC(YMC-Packpro C18,250x4.6mm,梯度为5%至60%乙腈/0.1M TEAB,20分钟,流速1mL/min):tR=18.3min。
ffT(PA)-3′All-AOL-NR550s0的合成
将AOL-NR550s0羧酸盐(0.015mmol)与2x 2mL无水N,N′-二甲基甲酰胺(DMF)共蒸发,然后溶解于2mL无水N,N′-二甲基乙酰胺(DMA)中。加入N,N-二异丙基乙胺(17μL,0.1mmol),之后加入N,N,N′,N′-四甲基-O-(N-琥珀酰亚胺基)脲四氟硼酸盐(TSTU,180μL的100mM DMF溶液,0.018mmol)。在氮气下在室温搅拌反应1小时。同时,将5′-O-三磷酸-3′-O-烯丙基-5-(3-氨基炔丙基)-2′-脱氧尿苷(0.01mmol)的水性溶液在减压下蒸发至干燥,并重悬于200μL的0.1M三乙基碳酸氢铵(TEAB)水性溶液中。将活化的染料-接头溶液加入到三磷酸盐中,并将反应在室温搅拌18小时并且通过RP-HPLC监测。首先通过离子交换色谱法在DEAE-Sephadex A25(25g)上用0.1M TEAB/乙腈8:2至1M TEAB/乙腈8:2的梯度洗脱来纯化粗产物。汇集含有三磷酸盐的级分,并将溶剂在减压下蒸发至干燥。通过制备型RP-HPLC使用YMC-Pack-Pro C18柱,用0.1M TEAB和乙腈洗脱来进一步纯化粗材料。收率:65μmol,(65%)。LC-MS(ES):(负离子)m/z 1502(M-H+),750(M-2H+)。RP-HPLC(YMC-Packpro C18,250x4.6mm,梯度为5%至60%乙腈/0.1M TEAB,20分钟,流速1mL/min):tR 18.2min。
ffT(DB)-3′All-(AOL)2-LC-生物素的合成
将(AOL)2-LC-生物素羧酸盐(0.01mmol)与2x2mL无水N,N′-二甲基甲酰胺(DMF)共蒸发,然后溶解于1mL的无水N,N′-二甲基乙酰胺(DMA)中。加入N,N-二异丙基乙胺(8.7μL,0.05mmol),之后加入N,N,N′,N′-四甲基-O-(N-琥珀酰亚胺基)脲四氟硼酸盐(TSTU,110μL的100mM DMF溶液,0.011mmol)。在氮气下在室温搅拌反应1小时。同时,将三磷酸盐T5(0.005mmol)的水性溶液在减压下蒸发至干燥,并重悬于100μL的0.1M三乙基碳酸氢铵(TEAB)水性溶液中。将活化的(AOL)2-LC-生物素羧酸盐溶液加入到三磷酸盐中,并将反应在室温搅拌18小时并且通过RP-HPLC监测。通过制备型RP-HPLC使用YMC-Pack-Pro C18柱,用0.1M TEAB和乙腈洗脱来纯化粗产物。LC-MS(ES):(负离子)m/z 1625(M-H+),812(M-2H+)。RP-HPLC(YMC-Packpro C18,250x4.6mm,梯度为5%至50%乙腈/0.1M TEAB,20分钟,流速1mL/min):tR 17.9min。
实施例3.通过钯催化剂进行的3′-烯丙基裂解研究
使用模型化合物T6和T7测量在溶液中通过钯进行的3′-烯丙基脱保护的速率,并与3′-AOM模型化合物A1的脱保护速率进行比较。在典型的400μL反应中,向底物在0.1MDEEA缓冲液pH 9.8中的0.1mM溶液中加入Pd(0)[三(3-羟丙基)膦]x络合物溶液至最终钯浓度为1mM。将反应在室温在封端管中孵育,并在设定时间点取反应的20μL等分试样,立即用10μL的0.25M H2O2/EDTA 1:1淬灭,然后通过UHPLC分析相应的3′-OH产物的形成。3′-OH产物随时间的形成示于图2中。数据显示,含有3′-烯丙基封端基团和双键侧臂的化合物T6(3′-烯丙基(DB))的脱保护速率比化合物A1(3′-AOM)的脱保护速率慢约1.5倍。然而,对于化合物T7(3′-烯丙基(PA)),观察到不完全的脱保护,甚至在孵育30分钟后。在从T7生成的UHPLC迹线中观察到几种副产物,表明胸苷上的三键侧臂对所用的钯试剂不是惰性的。
实施例4.使用ffT(PA)-3′All-AOL-NR550s0和ffT(DB)-3′烯丙基-AOL-NR550s0的 测序实验
使用蓝色/绿色2-激发/1-发射化学和相应的染料集(蓝色ffC、双蓝色/绿色ffA和暗色ffG),在Illumina iSeq100TM上测试3′-烯丙基完全官能化的T、ffT(PA)-3′-All-AOL-NR550s0和ffT(DB)-3′All-AOL-NR550s0的测序相容性。除了ffT之外,掺入混合物中还包括以下核苷酸:暗色G、ffA(DB)-AOM-AOL-色烯喹啉染料A、ffC(DB)-AOM-AOL-香豆素染料B。实验中使用的ffA、ffC和ffG各自含有3′-AOM作为3′封端基团。Pd(0)[THP]x溶液用作裂解试剂,并且10mM硫代硫酸钠和硫辛酸用作裂解后洗涤中的清除剂。在单独的单一读取1x150循环实验中使用PhiX文库作为模板。测序实验的主要指标显示在图3A和图3B以及表1中,与用3′-AOM ffT(ffT(DB)-3′AOM-AOL-NR550s0)执行的对照实验进行比较。
色烯喹啉染料A公开于美国专利公布号2022/0195517A1(以引用方式并入)中。当与核苷酸缀合时,色烯喹啉染料A具有以下结构部分:
香豆素染料B公开于美国专利公布号2018/0094140A1(以引用方式并入)中。当与核苷酸缀合时,香豆素染料B具有以下结构部分:
当使用ffT(PA)-3′All-AOL-NR550s0时,荧光强度(在绿色和蓝色通道二者中)经历了急剧的下降,而在ffT(DB)-3′All-AOL-NR550s0与ffT(DB)-3′AOM-AOL-NR550s0实验之间是可比较的。在%Q30中观察到类似的趋势。对于化合物ffT(PA)-3′All-AOL-NR550s0,%PhiX错误率和循环定相经历了更急剧的增加。数据表明T上的双键侧臂对于用基于钯的裂解混合物实现高质量测序指标是必需的。
表1.
实施例5.使用ffT(DB)-3′All-(AOL)2-生物素的测序实验
使用蓝色/绿色2-激发/2-发射化学和相应的染料集(蓝色ffA、蓝色和绿色ffC以及暗色ffG),在改进的Illumina上测试在掺入后标记工作流中3′-烯丙基完全官能化的T、ffT(DB)-3′All-(AOL)2-LC-生物素的测序相容性。除了ffT之外,以下核苷酸被包括在用于掺入后标记工作流的掺入混合物中:暗色G、ffA(DB)-AOM-AOL-BL-香豆素染料C(蓝色染料)、ffA(DB)-AOM-AOL-AF670POPO(已知绿色染料)、ffC(DB)-AOM-AOL-香豆素染料C(蓝色染料)、ffC(DB)-AOM-AOL-NR550s0。实验中使用的ffA、ffC和ffG各自含有3′-AOM作为3′封端基团。在掺入步骤之后包括另外的步骤,以用多个绿色荧光团标记的链霉亲和素缀合物(NR550C4)6-链霉亲和素标记DNA掺入的ffT(DB)-3′All-(AOL)2-LC-生物素。Pd(0)[THP]x溶液用作裂解试剂,并且10mM硫代硫酸钠包括在SBS洗涤缓冲液中。在单独的单一读取1x150循环实验中使用PhiX文库作为模板。测序实验的主要指标显示在图4A和图4B以及表2中,与用3′-AOM ffT(ffT(DB)-3′AOM-AOL-AF550POPOs0)执行的对照实验进行比较。对于对照SBS实验,使用以下ffT:ffT(DB)-AOM-AOL-AF550POPOs0(绿色染料),并且剩余ffN与掺入后标记工作流相同。
香豆素染料C具有强荧光和高稳定性。该染料公开于美国专利公布号2020/0277670A1(以引用方式并入)中,当与ffA缀合时,其具有以下结构部分
用绿色染料-链霉亲和素缀合物掺入后标记的ffT(DB)-3′All-(AOL)2-LC-生物素与标准ffT(DB)-3′AOM-AOL-AF550POPOs0之间的荧光强度(在绿色和蓝色通道二者中)和信号衰减是可比较的。在%Q30、%PhiX错误率和循环定相指标中观察到类似的趋势。数据表明,3′-烯丙基封端基团与T上的双键侧臂的组合与边合成边测序工作流相容,该边合成边测序工作流包括使用染料标记的缀合物的掺入后标记步骤。
表2.

Claims (80)

1.一种平行确定多个不同的靶多核苷酸的序列的方法,所述方法包括:
(a)使固体载体与包含测序引物的溶液在杂交条件下接触,其中:
(i)所述固体载体包含至少5,000,000个在空间上可区分的位点/cm2,所述位点包含靶多核苷酸的多个拷贝;
(ii)所述固体载体包含多个不同的靶多核苷酸;并且
(iii)所述测序引物与所述不同的靶多核苷酸的至少一部分互补;
(b)使所述固体载体与包含DNA聚合酶的水性溶液和核苷酸A、G、C和T或U在适用于DNA聚合酶介导的引物延伸的条件下接触,其中每种核苷酸包含具有与3'氧原子附接的3'烯丙基封端基团的2'脱氧核糖部分;
(c)使所述固体载体成像以确定所掺入的核苷酸的身份;
(d)使所述固体载体与包含钯催化剂和三(羟烷基)膦的水性解封端溶液在适于从所掺入的核苷酸中化学除去3'烯丙基封端基团从而暴露3'-OH基团以用于在所述固体载体上进行进一步核苷酸掺入的条件下接触;
(e)使所述固体载体与水性洗涤溶液接触;以及
(f)重复步骤(b)至(e)以确定靶多核苷酸序列。
2.根据权利要求1所述的方法,其中步骤(b)中包含DNA聚合酶的所述水性溶液进一步包含钯清除剂。
3.根据权利要求2所述的方法,其中步骤(b)中的所述钯清除剂是Pd(0)清除剂。
4.根据权利要求1至3中任一项所述的方法,其中步骤(e)中的所述水性洗涤溶液进一步包含钯清除剂。
5.根据权利要求4所述的方法,其中步骤(e)中的所述钯清除剂是Pd(II)清除剂。
6.根据权利要求1至5中任一项所述的方法,其中所述水性解封端溶液进一步包含抗坏血酸盐。
7.根据权利要求1至6中任一项所述的方法,其中至少一种类型的核苷酸包含经由可裂解接头与可检测标记附接的碱基。
8.根据权利要求7所述的方法,其中所述可检测标记是荧光染料,并且所述可裂解接头选自由以下项组成的组:
其中Z是-O-CH2-CH=CH2;n是1、2、3、4或5的整数;*指示所述可裂解接头与所述碱基的附接点;并且**指示所述可裂解接头与所述可检测标记的附接点。
9.根据权利要求1至6中任一项所述的方法,其中至少三种类型的核苷酸包含经由可裂解接头与可检测标记附接的碱基。
10.根据权利要求9所述的方法,其中所述至少三种类型的核苷酸中的每一种类型的核苷酸的所述可检测标记能够与其他可检测标记区分,并且所述可裂解接头选自由以下项组成的组:
其中Z是-O-CH2-CH=CH2;n是1、2、3、4或5的整数;*指示所述可裂解接头与所述碱基的附接点;并且**指示所述可裂解接头与所述可检测标记的附接点。
11.一种平行确定多个不同的靶多核苷酸的序列的方法,所述方法包括:
(a)使固体载体与包含测序引物的溶液在杂交条件下接触,其中:
(i)所述固体载体包含至少5,000,000个在空间上可区分的位点/cm2,所述位点包含靶多核苷酸的多个拷贝;
(ii)所述固体载体包含多个不同的靶多核苷酸;并且
(iii)所述测序引物与所述不同的靶多核苷酸的至少一部分互补;
(b)使所述固体载体与包含DNA聚合酶的水性溶液和核苷酸A、G、C和T或U在适用于DNA聚合酶介导的引物延伸的条件下接触,其中:
(i)至少三种类型的核苷酸中的每一种类型的核苷酸独立地包含经由可裂解接头与可检测标记附接的碱基,并且所述可裂解接头包含选自由以下项组成的组的部分:
并且*指示所述部分与所述核苷酸的其余部分连接的位置;
(ii)每种核苷酸包含具有与3'氧原子附接的3'烯丙基基团的2'脱氧核糖部分;并且
(iii)所述DNA聚合酶是改变的古细菌DNA聚合酶;
(c)使所述固体载体与包含一种或多种自由基清除剂的溶液接触,并且使所述固体载体成像以确定所掺入的核苷酸的身份;
(d)使所述固体载体与包含钯催化剂和三(羟烷基)膦的水性解封端溶液在适于(i)从所掺入的核苷酸中化学除去3'烯丙基封端基团从而暴露3'-OH基团以用于在所述固体载体上进行进一步核苷酸掺入;
以及(ii)化学除去经由可裂解接头附接的可检测标记的条件下接触;
(e)使所述固体载体与包含钯清除剂的水性洗涤溶液接触;以及
(f)重复步骤(b)至(e)以确定靶多核苷酸序列。
12.根据权利要求11所述的方法,其中步骤(e)的所述水性洗涤溶液中的所述钯清除剂是Pd(II)清除剂。
13.根据权利要求11或12所述的方法,其中步骤(b)中包含DNA聚合酶的所述水性溶液进一步包含钯清除剂。
14.根据权利要求13所述的方法,其中步骤(b)中的所述钯清除剂是Pd(0)清除剂。
15.一种平行确定多个不同的靶多核苷酸的序列的方法,所述方法包括:
(a)使固体载体与包含测序引物的溶液在杂交条件下接触,其中:
(i)所述固体载体包含至少5,000,000个在空间上可区分的位点/cm2,所述位点包含靶多核苷酸的多个拷贝;
(ii)所述固体载体包含多个不同的靶多核苷酸;以及
(iii)所述测序引物与所述不同的靶多核苷酸的至少一部分互补;
(b)使所述固体载体与包含DNA聚合酶的水性溶液和核苷酸A、G、C和T或U在适用于DNA聚合酶介导的引物延伸的条件下接触,其中:
(i)所述核苷酸中的至少一种核苷酸包含经由可裂解接头与可检测标记附接的碱基;以及
(ii)所述核苷酸各自包含具有与3'氧原子附接的3'烯丙基封端基团的2'脱氧核糖部分;
(c)使所述固体载体与包含一种或多种自由基清除剂的溶液接触,并且使所述固体载体成像以确定所掺入的核苷酸的身份;
(d)使所述固体载体与包含钯催化剂和三(羟烷基)膦的水性解封端溶液在适于(i)从所掺入的核苷酸中化学除去3'烯丙基基团从而暴露3'-OH基团以用于在所述固体载体上进行进一步核苷酸掺入;以及(ii)化学除去经由可裂解接头附接的可检测标记的条件下接触;
(e)使所述固体载体与水性洗涤溶液接触;以及
(f)重复步骤(b)至(e)以确定靶多核苷酸序列。
16.根据权利要求15所述的方法,其中步骤(b)中包含DNA聚合酶的所述水性溶液进一步包含钯清除剂。
17.根据权利要求16所述的方法,其中步骤(b)中的所述钯清除剂是Pd(0)清除剂。
18.根据权利要求16或17所述的方法,其中步骤(e)中的所述水性洗涤溶液进一步包含钯清除剂。
19.根据权利要求18所述的方法,其中步骤(e)中的所述钯清除剂是Pd(II)清除剂。
20.根据权利要求1至19中任一项所述的方法,其中所述三(羟烷基)膦是三(羟丙基)膦(THPP)。
21.根据权利要求1至20中任一项所述的方法,其中所述固体载体包含至少5,000,000个在空间上可区分的位点/cm2,所述位点包含多联体,所述多联体包含所述靶多核苷酸的多个拷贝。
22.根据权利要求1至20中任一项所述的方法,其中所述固体载体包含至少5,000,000个在空间上可区分的位点/cm2,所述位点包含固定的核酸分子簇,所述固定的核酸分子簇包含所述靶多核苷酸的多个拷贝。
23.根据权利要求1至22中任一项所述的方法,其中所述A和G核苷酸的所述碱基是脱氮嘌呤。
24.根据权利要求1至23中任一项所述的方法,其中所述T核苷酸具有以下结构:
25.根据权利要求24所述的方法,其中所述T核苷酸具有以下结构:
26.根据权利要求24或25所述的方法,其中所述T核苷酸具有以下结构:
其中
Z是-O-CH2-CH=CH2,并且n是1、2、3、4或5的整数。
27.根据权利要求1至26中任一项所述的方法,其中所述A核苷酸具有以下结构:
28.根据权利要求27所述的方法,其中所述A核苷酸具有以下结构:
29.根据权利要求27或28所述的方法,其中所述A核苷酸具有以下结构:
其中
Z是-O-CH2-CH=CH2,并且n是1、2、3、4或5的整数。
30.根据权利要求1至29中任一项所述的方法,其中所述C核苷酸具有以下结构:
31.根据权利要求30所述的方法,其中所述C核苷酸具有以下结构:
32.根据权利要求30或31所述的方法,其中所述C核苷酸具有以下结构:
其中
Z是-O-CH2-CH=CH2,并且n是1、2、3、4或5的整数。
33.根据权利要求1至32中任一项所述的方法,其中所述G核苷酸具有以下结构:
34.根据权利要求33所述的方法,其中所述G核苷酸具有以下结构:
35.根据权利要求33或34所述的方法,其中所述G核苷酸具有以下结构:
其中
Z是-O-CH2-CH=CH2,并且n是1、2、3、4或5的整数。
36.根据权利要求1至22中任一项所述的方法,其中至少一种类型的核苷酸具有选自由以下项组成的组的结构:
37.根据权利要求36所述的方法,其中至少一种类型的核苷酸具有选自由以下项组成的组的结构:
38.一种平行确定多个不同的靶多核苷酸的序列的方法,所述方法包括:
(a)使固体载体与包含测序引物的溶液在杂交条件下接触,其中:
(i)所述固体载体包含至少5,000,000个在空间上可区分的位点/cm2,所述位点包含靶多核苷酸的多个拷贝;
(ii)所述固体载体包含多个不同的靶多核苷酸;并且
(iii)所述测序引物与所述不同的靶多核苷酸的至少一部分互补;
(b)使所述固体载体与包含DNA聚合酶和四种类型的核苷酸A、G、C和T或U中的一种或多种类型的水性掺入混合物在适用于DNA聚合酶介导的引物延伸的条件下接触,其中:
(i)所述核苷酸各自包含具有与3'氧原子附接的3'烯丙基封端基团的2'脱氧核糖部分;
(ii)至少两种类型的核苷酸是未标记的;并且
(iii)第一类型的未标记的核苷酸包含第一官能部分;
(c)使所延伸的拷贝多核苷酸与包含第一标记试剂的水性标记混合物接触,其中所述第一标记试剂包含一个或多个第一可检测标记和能够与所述第一类型的未标记的核苷酸的所述第一官能部分特异性结合的第一结合部分;
(d)使所述固体载体成像并且执行一次或多次荧光测量以确定所掺入的核苷酸的身份;
(e)使所述固体载体与包含钯催化剂和三(羟烷基)膦的水性解封端溶液在适于(i)从所掺入的核苷酸中化学除去3'烯丙基基团从而暴露3'-OH基团以用于在所述固体载体上进行进一步核苷酸掺入的条件下接触;
(f)使所述固体载体与水性洗涤溶液接触;以及
(g)重复步骤(b)至(f)以确定靶多核苷酸序列。
39.根据权利要求38所述的方法,其中所述第一类型的未标记的核苷酸的所述第一官能部分经由可裂解接头通过共价结合或非共价相互作用与所述第一标记试剂结合。
40.根据权利要求38或39所述的方法,其中所述水性掺入混合物中的所述四种类型的核苷酸中的每一种类型是未标记的,第二类型的未标记的核苷酸包含第二官能部分,其中所述水性标记混合物包含第二标记试剂,并且所述第二标记试剂包含一个或多个第二可检测标记和能够与所述第二类型的未标记的核苷酸的所述第二官能部分特异性结合的第二结合部分。
41.根据权利要求40所述的方法,其中所述第二类型的未标记的核苷酸的所述第二官能部分经由可裂解接头通过共价结合或非共价相互作用与所述第二标记试剂结合。
42.根据权利要求40或41所述的方法,其中第三类型的未标记的核苷酸包含第三官能部分,其中所述水性标记混合物包含第三标记试剂,并且所述第三标记试剂包含一个或多个第三可检测标记和能够与所述第三类型的未标记的核苷酸的所述第三官能部分特异性结合的第三结合部分。
43.根据权利要求40或41所述的方法,其中第三类型的未标记的核苷酸包含含有所述第一官能部分的所述第三类型的未标记的核苷酸和含有所述第二官能部分的所述第三类型的未标记的核苷酸的混合物,并且其中所述第一标记试剂和所述第二标记试剂均能够与所述第三类型的未标记的核苷酸特异性结合。
44.根据权利要求42或43所述的方法,其中第四类型的未标记的核苷酸不能与所述第一标记试剂、第二标记试剂或第三标记试剂中的任一种标记试剂特异性结合。
45.根据权利要求38至44中任一项所述的方法,其中所述T核苷酸具有以下结构:
46.根据权利要求45所述的方法,其中所述T核苷酸具有以下结构:
47.根据权利要求45或46所述的方法,其中所述T核苷酸具有以下结构:
其中Z是-O-CH2-CH=CH2,并且m和n中的每一者独立地是1、2、3、4或5的整数。
48.根据权利要求38至47中任一项所述的方法,其中所述C核苷酸具有以下结构:
49.根据权利要求48所述的方法,其中所述C核苷酸具有以下结构:
50.根据权利要求48或49所述的方法,其中所述C核苷酸具有以下结构:
其中Z是-O-CH2-CH=CH2,并且m和n中的每一者独立地是1、2、3、4或5的整数。
51.根据权利要求38至50中任一项所述的方法,其中所述A核苷酸具有以下结构:
52.根据权利要求51所述的方法,其中所述A核苷酸具有以下结构:
53.根据权利要求51或52所述的方法,其中所述A核苷酸具有以下结构:
其中Z是-O-CH2-CH=CH2,并且m和n中的每一者独立地是1、2、3、4或5的整数。
54.根据权利要求38至50中任一项所述的方法,其中所述A核苷酸具有以下结构:
55.根据权利要求54所述的方法,其中所述A核苷酸具有以下结构:
56.根据权利要求54或55所述的方法,其中所述A核苷酸具有以下结构:
其中Z是-O-CH2-CH=CH2,并且m和n中的每一者独立地是1、2、3、4或5的整数。
57.根据权利要求38至56中任一项所述的方法,其中G核苷酸具有选自由以下项组成的组的结构:
58.根据权利要求1至57中任一项所述的方法,其中所述使所述固体载体与解封端溶液接触执行4秒至5秒。
59.根据权利要求1至58中任一项所述的方法,其中所述使所述固体载体与解封端溶液接触经由连续流执行而不暂停孵育。
60.根据权利要求1至59中任一项所述的方法,其中将测序循环重复至少约20次、30次、50次、100次、150次、200次、250次、300次、350次、400次、450次或500次。
61.根据权利要求60所述的方法,其中在约50个重复循环后,预定相值小于0.18。
62.根据权利要求61所述的方法,其中在约50个重复测序循环后,定相值小于0.18。
63.根据权利要求62所述的方法,其中在约50个重复测序循环后,预定相值小于0.07。
64.根据权利要求60所述的方法,其中在约100个重复测序循环后,预定相值小于0.10并且定相值小于0.10。
65.根据权利要求60所述的方法,其中在约150个重复测序循环后,预定相值小于0.25并且定相值小于0.25。
66.根据权利要求60所述的方法,其中在约150个重复测序循环后,预定相值小于0.10并且定相值小于0.10。
67.根据权利要求1至66中任一项所述的方法,其中所述解封端溶液进一步包含一种或多种选自由以下项组成的组的缓冲液试剂:伯胺、仲胺、叔胺、碳酸盐、磷酸盐和硼酸盐,以及它们的组合。
68.根据权利要求67所述的方法,其中所述缓冲液试剂选自由以下项组成的组:乙醇胺(EA)、三(羟甲基)氨基甲烷(Tris)、甘氨酸、碳酸盐、磷酸盐、硼酸盐、2-二甲基氨乙醇(DMEA)、2-二乙基氨基乙醇(DEEA)、N,N,N',N'-四甲基乙二胺(TEMED)、N,N,N',N'-四乙基乙二胺(TEEDA)和(2-羟乙基)哌啶,以及它们的组合。
69.根据权利要求1至68中任一项所述的方法,其中所述DNA聚合酶是改变的B家族古细菌DNA聚合酶,其包含与9°N DNA聚合酶中的氨基酸408至410功能等效或同源的3-氨基酸区,其中所述3-氨基酸区的第一氨基酸是选自由异亮氨酸(I)、丙氨酸(A)、缬氨酸(V)和丝氨酸(S)组成的组的氨基酸;所述3-氨基酸区的第二氨基酸是选自由丙氨酸(A)和甘氨酸(G)组成的组的氨基酸;并且所述3-氨基酸区的第三氨基酸是选自由丙氨酸(A)、异亮氨酸(I)、缬氨酸(V)、亮氨酸(L)、苏氨酸(T)和脯氨酸(P)组成的组的氨基酸。
70.一种测序试剂盒,所述测序试剂盒包含:
(a)包含DNA聚合酶和核苷酸A、G、C和T或U的掺入混合物,其中:
(i)所述核苷酸包含具有与3'碳原子附接的3'烯丙基基团的2'脱氧核糖部分;并且
(ii)所述DNA聚合酶是改变的古细菌DNA聚合酶;
(b)包含钯催化剂、三(羟烷基)膦和一种或多种缓冲液试剂的水性解封端溶液,所述水性解封端溶液适于(i)从掺入的核苷酸中化学除去3'烯丙基基团从而暴露3'-OH基团以用于在所述固体载体上进行进一步核苷酸掺入;以及(ii)化学除去经由可裂解接头附接的可检测标记;以及
(c)包含Pd(II)清除剂的水性洗涤溶液;
其中所述试剂盒被配置用于执行至少约100个循环的边合成边测序。
71.根据权利要求70所述的试剂盒,其中至少一种类型的所述核苷酸包含经由可裂解接头与可检测标记附接的碱基,并且所述可裂解接头是其中Z是-O-CH2-CH=CH2;n是1、2、3、4或5的整数;*指示所述可裂解接头与所述碱基的附接点;并且**指示所述可裂解接头与所述可检测标记的附接点。
72.根据权利要求71所述的试剂盒,其中T核苷酸的核碱基经由所述可裂解接头与所述可检测标记附接。
73.根据权利要求70至72中任一项所述的试剂盒,其中至少三种所述核苷酸中的每一种核苷酸独立地包含经由可裂解接头与可检测标记附接的碱基,并且所述可裂解接头选自由以下项组成的组:
其中Z是-O-CH2-CH=CH2;n是1、2、3、4或5的整数;*指示所述可裂解接头与所述碱基的附接点;并且**指示所述可裂解接头与所述可检测标记的附接点。
74.根据权利要求70所述的试剂盒,其中两种或更多种类型的核苷酸A、G、C和T或U是未标记的,并且其中第一类型的未标记的核苷酸包含第一官能部分,并且所述试剂盒进一步包含第一标记试剂,其中所述第一标记试剂包含一个或多个第一可检测标记和能够与所述第一类型的未标记的核苷酸的所述第一官能部分特异性结合的第一结合部分。
75.根据权利要求74所述的试剂盒,其中四种类型的核苷酸中的每一种类型是未标记的,并且其中第二类型的未标记的核苷酸包含第二官能部分,并且所述试剂盒进一步包含第二标记试剂,其中所述第二标记试剂包含一个或多个第二可检测标记和能够与所述第二类型的未标记的核苷酸的所述第二官能部分特异性结合的第二结合部分。
76.根据权利要求75所述的试剂盒,其中第三类型的未标记的核苷酸包含第三官能部分,并且所述试剂盒进一步包含第三标记试剂,其中所述第三标记试剂包含一个或多个第三可检测标记和能够与所述第三类型的未标记的核苷酸的所述第三官能部分特异性结合的第三结合部分。
77.根据权利要求75所述的试剂盒,其中第三类型的未标记的核苷酸包含含有所述第一官能部分的所述第三类型的未标记的核苷酸和含有所述第二官能部分的所述第三类型的未标记的核苷酸的混合物,并且其中所述第一标记试剂和所述第二标记试剂均能够与所述第三类型的未标记的核苷酸特异性结合。
78.根据权利要求76或77所述的试剂盒,其中第四类型的未标记的核苷酸不能与所述第一标记试剂、第二标记试剂或第三标记试剂中的任一种标记试剂特异性结合。
79.根据权利要求70至78中任一项所述的试剂盒,其中所述掺入混合物进一步包含Pd(0)清除剂。
80.根据权利要求70至79中任一项所述的试剂盒,其中所述三(羟烷基)膦是三(羟丙基)膦(THPP)。
CN202380031861.3A 2022-12-27 2023-12-21 使用3'烯丙基封端的核苷酸的测序方法 Pending CN119095984A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US202263477275P 2022-12-27 2022-12-27
US63/477,275 2022-12-27
PCT/US2023/085353 WO2024145154A1 (en) 2022-12-27 2023-12-21 Methods of sequencing using 3´ allyl blocked nucleotides

Publications (1)

Publication Number Publication Date
CN119095984A true CN119095984A (zh) 2024-12-06

Family

ID=89715759

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202380031861.3A Pending CN119095984A (zh) 2022-12-27 2023-12-21 使用3'烯丙基封端的核苷酸的测序方法

Country Status (4)

Country Link
US (1) US20240271206A1 (zh)
CN (1) CN119095984A (zh)
AU (1) AU2023419253A1 (zh)
WO (1) WO2024145154A1 (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11293061B2 (en) 2018-12-26 2022-04-05 Illumina Cambridge Limited Sequencing methods using nucleotides with 3′ AOM blocking group

Family Cites Families (94)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB8822228D0 (en) 1988-09-21 1988-10-26 Southern E M Support-bound oligonucleotides
US6346413B1 (en) 1989-06-07 2002-02-12 Affymetrix, Inc. Polymer arrays
US5800992A (en) 1989-06-07 1998-09-01 Fodor; Stephen P.A. Method of detecting nucleic acids
DE3924454A1 (de) 1989-07-24 1991-02-07 Cornelis P Prof Dr Hollenberg Die anwendung von dna und dna-technologie fuer die konstruktion von netzwerken zur verwendung in der chip-konstruktion und chip-produktion (dna chips)
WO1991006678A1 (en) 1989-10-26 1991-05-16 Sri International Dna sequencing
DK0604552T3 (da) 1991-09-18 1997-08-04 Affymax Tech Nv Fremgangsmåde til syntese af forskellige samlinger af oligomerer
DE69233087T2 (de) 1991-11-22 2003-12-24 Affymetrix, Inc. (N.D.Ges.D.Staates Delaware) Verfahren zur Herstellung von Polymerarrays
AU3728093A (en) 1992-02-19 1993-09-13 Public Health Research Institute Of The City Of New York, Inc., The Novel oligonucleotide arrays and their use for sorting, isolating, sequencing, and manipulating nucleic acids
US5583211A (en) 1992-10-29 1996-12-10 Beckman Instruments, Inc. Surface activated organic polymers useful for location - specific attachment of nucleic acids, peptides, proteins and oligosaccharides
WO1995011995A1 (en) 1993-10-26 1995-05-04 Affymax Technologies N.V. Arrays of nucleic acid probes on biological chips
US5472672A (en) 1993-10-22 1995-12-05 The Board Of Trustees Of The Leland Stanford Junior University Apparatus and method for polymer synthesis using arrays
US6156501A (en) 1993-10-26 2000-12-05 Affymetrix, Inc. Arrays of modified nucleic acid probes and methods of use
US5429807A (en) 1993-10-28 1995-07-04 Beckman Instruments, Inc. Method and apparatus for creating biopolymer arrays on a solid support surface
US5807522A (en) 1994-06-17 1998-09-15 The Board Of Trustees Of The Leland Stanford Junior University Methods for fabricating microarrays of biological samples
US5846719A (en) 1994-10-13 1998-12-08 Lynx Therapeutics, Inc. Oligonucleotide tags for sorting and identification
US5556752A (en) 1994-10-24 1996-09-17 Affymetrix, Inc. Surface-bound, unimolecular, double-stranded DNA
US5750341A (en) 1995-04-17 1998-05-12 Lynx Therapeutics, Inc. DNA sequencing by parallel oligonucleotide extensions
US5624711A (en) 1995-04-27 1997-04-29 Affymax Technologies, N.V. Derivatization of solid supports and methods for oligomer synthesis
US5545531A (en) 1995-06-07 1996-08-13 Affymax Technologies N.V. Methods for making a device for concurrently processing multiple biological chip assays
DE69638321D1 (de) 1995-10-11 2011-03-03 Luminex Corp Gleichzeitige mehrfachanalyse klinischer proben
US5658734A (en) 1995-10-17 1997-08-19 International Business Machines Corporation Process for synthesizing chemical compounds
US6458530B1 (en) 1996-04-04 2002-10-01 Affymetrix Inc. Selecting tag nucleic acids
GB9620209D0 (en) 1996-09-27 1996-11-13 Cemu Bioteknik Ab Method of sequencing DNA
GB9626815D0 (en) 1996-12-23 1997-02-12 Cemu Bioteknik Ab Method of sequencing DNA
US6297006B1 (en) 1997-01-16 2001-10-02 Hyseq, Inc. Methods for sequencing repetitive sequences and for determining the order of sequence subfragments
EP1498494A3 (en) 1997-04-01 2007-06-20 Solexa Ltd. Method of nucleic acid sequencing
ES2563643T3 (es) 1997-04-01 2016-03-15 Illumina Cambridge Limited Método de secuenciación de ácido nucleico
US6969488B2 (en) 1998-05-22 2005-11-29 Solexa, Inc. System and apparatus for sequential processing of analytes
US6465178B2 (en) 1997-09-30 2002-10-15 Surmodics, Inc. Target molecule attachment to surfaces
US6485944B1 (en) 1997-10-10 2002-11-26 President And Fellows Of Harvard College Replica amplification of nucleic acid arrays
US6087102A (en) 1998-01-07 2000-07-11 Clontech Laboratories, Inc. Polymeric arrays and methods for their use in binding assays
US6287776B1 (en) 1998-02-02 2001-09-11 Signature Bioscience, Inc. Method for detecting and classifying nucleic acid hybridization
JP3944996B2 (ja) 1998-03-05 2007-07-18 株式会社日立製作所 Dnaプローブアレー
US6031078A (en) 1998-06-16 2000-02-29 Millennium Pharmaceuticals, Inc. MTbx protein and nucleic acid molecules and uses therefor
DE69928265T3 (de) 1998-07-30 2013-11-28 Illumina Cambridge Ltd. Matrizen von biomolekülen und ihre verwendung in sequenzierung
GB0002310D0 (en) 2000-02-01 2000-03-22 Solexa Ltd Polynucleotide sequencing
AR021833A1 (es) 1998-09-30 2002-08-07 Applied Research Systems Metodos de amplificacion y secuenciacion de acido nucleico
US6277628B1 (en) 1998-10-02 2001-08-21 Incyte Genomics, Inc. Linear microarrays
US6391937B1 (en) 1998-11-25 2002-05-21 Motorola, Inc. Polyacrylamide hydrogels and hydrogel arrays made from polyacrylamide reactive prepolymers
WO2000063437A2 (en) 1999-04-20 2000-10-26 Illumina, Inc. Detection of nucleic acid reactions on bead arrays
US6355431B1 (en) 1999-04-20 2002-03-12 Illumina, Inc. Detection of nucleic acid amplification reactions using bead arrays
US6372813B1 (en) 1999-06-25 2002-04-16 Motorola Methods and compositions for attachment of biomolecules to solid supports, hydrogels, and hydrogel arrays
US6664061B2 (en) 1999-06-25 2003-12-16 Amersham Biosciences Ab Use and evaluation of a [2+2] photoaddition in immobilization of oligonucleotides on a three-dimensional hydrogel matrix
US6274320B1 (en) 1999-09-16 2001-08-14 Curagen Corporation Method of sequencing a nucleic acid
US6770441B2 (en) 2000-02-10 2004-08-03 Illumina, Inc. Array compositions and methods of making same
US7001792B2 (en) 2000-04-24 2006-02-21 Eagle Research & Development, Llc Ultra-fast nucleic acid sequencing device and a method for making and using the same
CN100462433C (zh) 2000-07-07 2009-02-18 维西根生物技术公司 实时序列测定
EP1307414A2 (en) 2000-08-09 2003-05-07 Amersham Biosciences AB The use and evaluation of a 2+2] photocycloaddition in immobilization of oligonucleotides on a three-dimensional hydrogel matrix
ATE356222T1 (de) 2000-10-06 2007-03-15 Univ Columbia Massives parallelverfahren zur dekodierung von dna und rna
EP1354064A2 (en) 2000-12-01 2003-10-22 Visigen Biotechnologies, Inc. Enzymatic nucleic acid synthesis: compositions and methods for altering monomer incorporation fidelity
US7057026B2 (en) 2001-12-04 2006-06-06 Solexa Limited Labelled nucleotides
DK1560838T3 (da) 2002-08-23 2009-09-07 Illumina Cambridge Ltd M rkede nuklotider
DK3363809T3 (da) 2002-08-23 2020-05-04 Illumina Cambridge Ltd Modificerede nukleotider til polynukleotidsekvensering
GB0321306D0 (en) 2003-09-11 2003-10-15 Solexa Ltd Modified polymerases for improved incorporation of nucleotide analogues
GB0326073D0 (en) 2003-11-07 2003-12-10 Solexa Ltd Improvements in or relating to polynucleotide arrays
EP3175914A1 (en) 2004-01-07 2017-06-07 Illumina Cambridge Limited Improvements in or relating to molecular arrays
US20060062531A1 (en) 2004-09-17 2006-03-23 Stephen Turner Fabrication of optical confinements
GB0514936D0 (en) 2005-07-20 2005-08-24 Solexa Ltd Preparation of templates for nucleic acid sequencing
US7405281B2 (en) 2005-09-29 2008-07-29 Pacific Biosciences Of California, Inc. Fluorescent nucleotide analogs and uses therefor
WO2007123744A2 (en) 2006-03-31 2007-11-01 Solexa, Inc. Systems and devices for sequence by synthesis analysis
US7754429B2 (en) 2006-10-06 2010-07-13 Illumina Cambridge Limited Method for pair-wise sequencing a plurity of target polynucleotides
AU2007309504B2 (en) 2006-10-23 2012-09-13 Pacific Biosciences Of California, Inc. Polymerase enzymes and reagents for enhanced nucleic acid sequencing
WO2008069973A2 (en) * 2006-12-01 2008-06-12 The Trustees Of Columbia University In The City Of New York Four-color dna sequencing by synthesis using cleavable fluorescent nucleotide reversible terminators
US8262900B2 (en) 2006-12-14 2012-09-11 Life Technologies Corporation Methods and apparatus for measuring analytes using large scale FET arrays
US8617811B2 (en) 2008-01-28 2013-12-31 Complete Genomics, Inc. Methods and compositions for efficient base calling in sequencing reactions
EP2758475B1 (en) 2011-09-23 2017-04-26 Illumina Cambridge Limited Dyes for labelling molecular ligands
HRP20211523T1 (hr) 2011-09-23 2021-12-24 Illumina, Inc. Pripravci za sekvenciranje nukleinske kiseline
US9012022B2 (en) 2012-06-08 2015-04-21 Illumina, Inc. Polymer coatings
US9150896B2 (en) * 2012-09-06 2015-10-06 Illumina, Inc. Nucleotides and primers with removable blocking groups
WO2014135221A1 (en) 2013-03-08 2014-09-12 Illumina Cambridge Ltd Polymethine compounds and their use as fluorescent labels
KR102230831B1 (ko) 2013-03-15 2021-03-22 일루미나 케임브리지 리미티드 변형된 뉴클레오사이드 또는 뉴클레오타이드
GB201414098D0 (en) 2014-08-08 2014-09-24 Illumina Cambridge Ltd Modified nucleotide linkers
GB201508858D0 (en) 2015-05-22 2015-07-01 Illumina Cambridge Ltd Polymethine compounds with long stokes shifts and their use as fluorescent labels
GB201516987D0 (en) 2015-09-25 2015-11-11 Illumina Cambridge Ltd Polymethine compounds and their use as fluorescent labels
US10385214B2 (en) 2016-09-30 2019-08-20 Illumina Cambridge Limited Fluorescent dyes and their uses as biomarkers
JP2020504074A (ja) 2016-12-22 2020-02-06 イルミナ ケンブリッジ リミテッド クマリン化合物および蛍光標識としてのそれらの使用
IL267836B2 (en) 2017-01-04 2023-09-01 Complete Genomics Inc Stepwise sequence determination by unlabeled reversible terminations or natural nucleotides
GB201716931D0 (en) 2017-10-16 2017-11-29 Illumina Cambridge Ltd New fluorescent compounds and their use as biomarkers
US20210032776A1 (en) * 2018-03-21 2021-02-04 Centrillion Technology Holdings Corporation Method and system for fabricating dna sequencing arrays
IL271446B1 (en) 2018-05-15 2024-12-01 Illumina Inc Compositions and methods for chemical cleavage and deprotection of surface-bound oligonucleotides
CA3103719A1 (en) 2018-10-31 2020-05-07 Illumina, Inc. Polymerases, compositions, and methods of use
US20220162693A1 (en) 2018-11-09 2022-05-26 Mgi Tech Co., Ltd. Massively parallel sequencing using unlabeled nucleotides
CA3103739A1 (en) 2018-12-05 2020-06-11 Illumina, Inc. Polymerases, compositions, and methods of use
US11293061B2 (en) 2018-12-26 2022-04-05 Illumina Cambridge Limited Sequencing methods using nucleotides with 3′ AOM blocking group
IL279660B2 (en) 2019-03-01 2024-10-01 Illumina Cambridge Ltd Tertiary amine substituted coumarin compounds and their uses as fluorescent labels
SG11202012555UA (en) 2019-03-01 2021-01-28 Illumina Cambridge Ltd Exocyclic amine-substituted coumarin compounds and their uses as fluorescent labels
CN114207148A (zh) 2019-12-23 2022-03-18 伊鲁米纳公司 具有用于模板多核苷酸附接的单个位点的纳米颗粒
BR112022026056A2 (pt) 2020-06-22 2023-03-07 Illumina Cambridge Ltd Nucleosídeos e nucleotídeos com grupo bloqueador 3? acetal
US11981964B2 (en) 2020-07-28 2024-05-14 Illumina Cambridge Limited Substituted coumarin dyes and uses as fluorescent labels
US20220195517A1 (en) 2020-12-17 2022-06-23 Illumina Cambridge Limited Long stokes shift chromenoquinoline dyes and uses in sequencing applications
EP4334327A1 (en) 2021-05-05 2024-03-13 Illumina Cambridge Limited Fluorescent dyes containing bis-boron fused heterocycles and uses in sequencing
MX2023012659A (es) 2021-05-20 2023-12-07 Illumina Inc Composiciones y metodos para secuenciación por síntesis.
EP4499758A1 (en) 2022-03-29 2025-02-05 Illumina Inc. Chromenoquinoline dyes and uses in sequencing
CN119301275A (zh) 2022-05-31 2025-01-10 伊路米纳有限公司 用于核酸测序的组合物和方法

Also Published As

Publication number Publication date
US20240271206A1 (en) 2024-08-15
AU2023419253A1 (en) 2024-10-03
WO2024145154A1 (en) 2024-07-04

Similar Documents

Publication Publication Date Title
US12227802B2 (en) Nucleotides with a 3′ AOM blocking group
US11787831B2 (en) Nucleosides and nucleotides with 3′ acetal blocking group
US12043637B2 (en) Fluorescent dyes containing bis-boron fused heterocycles and uses in sequencing
US20220396832A1 (en) Compositions and methods for sequencing by synthesis
CN119095984A (zh) 使用3'烯丙基封端的核苷酸的测序方法
US20240218443A1 (en) Methods of sequencing using 3' blocked nucleotides
US20240209015A1 (en) Methods of sequencing using 3' blocked nucleotides
US20240182963A1 (en) Methods of sequencing using 3' blocked nucleotides
US20240229131A1 (en) Transition-metal catalyst compositions and methods for sequencing by synthesis
US20240247311A1 (en) Palladium catalyst compositions and methods for sequencing by synthesis
RU2818762C2 (ru) Нуклеозиды и нуклеотиды с 3’-гидрокси блокирующими группами и их применение в способах секвенирования полинуклеотидов
JP2025041682A (ja) 3’-ヒドロキシブロッキング基を有するヌクレオシドおよびヌクレオチド、ならびにそれらのポリヌクレオチドシーケンシング方法における使用
WO2024206394A1 (en) Compositions and methods for nucleic acid sequencing

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication