CN115997033A

CN115997033A - 通过合成产生无痕dna的催化控制测序

Info

Publication number: CN115997033A
Application number: CN202180047323.4A
Authority: CN
Inventors: K·普格利泽; S·佩萨加维奇; J·曼德尔; S·麦克唐纳
Original assignee: Illumina Inc
Current assignee: Illumina Inc
Priority date: 2020-06-30
Filing date: 2021-06-29
Publication date: 2023-04-21
Also published as: US20210403993A1; WO2022006081A1; JP2023532231A; KR20230037503A; EP4172364A1; CA3177299A1; AU2021299216A1

Abstract

本公开涉及一种方法，该方法包括(a)使聚合酶与模板多核苷酸和多个游离核苷酸接触，其中该模板多核苷酸与互补多核苷酸杂交，该互补多核苷酸包括由该模板多核苷酸的5’末端片段悬垂的3’端，并且该多个游离核苷酸包括式(I)的化合物：其中所述接触在络合条件下发生，该络合条件有效地形成复合物但不会有效地形成聚合，其中该复合物包括该聚合酶、该模板多核苷酸、该互补多核苷酸以及与该模板多核苷酸的该5’末端片段的第一核苷酸互补的该多个游离核苷酸中的一个游离核苷酸；(b)检测来自荧光标记的信号；以及(c)将该复合物暴露于聚合条件。

Description

通过合成产生无痕DNA的催化控制测序

相关申请的交叉引用

本申请要求2020年6月30日提交的美国临时专利申请序列号63/045,914的权益，该申请全文据此以引用方式并入。

技术领域

本公开整体涉及用于通过合成来产生无痕DNA的催化控制测序的方法。

背景技术

许多当前测序平台使用“边合成边测序”(“SBS”)技术和基于荧光的检测方法。期望将允许更具成本效益、更快速和更方便的测序和核酸检测的替代测序方法作为SBS的补充。

当前SBS技术使用在以下两个位置处修饰的核苷酸：1)脱氧核糖的3’羟基(3’-OH)，以及2)含氮碱基(A、T、C、G)的嘧啶的5-位或嘌呤的7-位。3'-OH基团用叠氮甲基封端以产生可逆的核苷酸终止子。这可防止在添加单个核苷酸之后进一步延伸。每个含氮碱基分别用荧光团修饰，以提供识别单碱基掺入的荧光读数。随后，移除3'-OH封端基团和荧光团并重复循环。

由于修饰脱氧核糖的3'-OH和含氮碱基两者的合成挑战，目前经修饰核苷酸的成本可能很高。存在若干可能的方法来降低经修饰核苷酸的成本。一种方法是将读数标记移动到5’-末端磷酸而不是含氮碱基。在一个示例中，这消除了对单独切割步骤的需要，并允许实时检测进入的核苷酸。在掺入期间，焦磷酸盐与标签一起作为延伸过程的副产物被释放，因此不涉及可切割键。

在SBS中使用的当前完全官能化的核苷酸(“ffN”)在核碱基上携带染料标记，其可以在每个循环期间在单独的步骤中裂解。在一些情况下，这样的裂解可以化学修饰染料标记附着之处或附近的核苷酸，在DNA上留下“疤痕”，在一些情况下可能不利地影响产生的DNA与SBS聚合酶的结合、下游测序度量或SBS过程的其他方面。

本公开涉及克服本领域中的这些和其他缺陷。

发明内容

第一方面涉及一种方法。该方法包括(a)使聚合酶与模板多核苷酸和多个游离核苷酸接触，其中模板多核苷酸与互补多核苷酸杂交，该互补多核苷酸包括由模板多核苷酸的5’末端片段悬垂的3’端，并且多个游离核苷酸包括式(I)的化合物：

其中R₁包括选自腺嘌呤、鸟嘌呤、胞嘧啶、胸腺嘧啶和尿嘧啶的含氮碱基；R₂包括-O-R₂，其中R₂是H或Z，其中Z是包含叠氮基基团的可移除保护基团；R₃包括连接基，该连接基包括三个或更多个磷酸基团；并且R₄包括荧光标记；其中所述接触在络合条件下发生，该络合条件有效地形成复合物但不会有效地形成聚合，其中该复合物包括聚合酶、模板多核苷酸、互补多核苷酸以及与模板多核苷酸的5’末端片段的第一核苷酸互补的多个游离核苷酸中的一个游离核苷酸；(b)检测来自荧光标记的信号；以及(c)将复合物暴露于聚合条件。

在一个实施方案中，R₂由-O-R₂组成，其中R₂是H或Z，其中Z是包含叠氮基基团的可移除保护基团。在另一个实施方案中，模板多核苷酸是附着到基底的多个模板多核苷酸中的一个模板多核苷酸。在一个实施方案中，附着到基底的多个模板多核苷酸包括文库多核苷酸的拷贝的簇。在另一个实施方案中，该方法还包括重复步骤a)至c)一次或多次。

在一个实施方案中，聚合条件包括Mg²⁺离子的浓度，其中Mg²⁺离子的浓度在约0.1mM至约10mM的范围内；或Mn²⁺离子的浓度，其中Mn²⁺离子的浓度在约0.1mM至约10mM的范围内。在另一个实施方案中，络合条件包括非催化金属阳离子。在一个实施方案中，非催化金属阳离子选自由Ca²⁺、Zn²⁺、Co²⁺、Ni²⁺、Eu²⁺、Sr²⁺、Ba²⁺、Fe²⁺和Eu²⁺中的一者或多者组成的组。在又一个实施方案中，非催化金属阳离子的浓度小于或等于约10mM。

在一个实施方案中，络合条件包括螯合剂。在一个实施方案中，螯合剂选自由以下组成的组：乙二醇-双(β-氨基乙基醚)-N,N,N′,N′-四乙酸(EGTA)、次氮基乙酸、亚氨基二琥珀酸四钠、乙二醇四乙酸、聚天冬氨酸、乙二胺-N,N'-二琥珀酸(EDDS)、甲基甘氨酸二乙酸(MGDA)以及它们的组合。

在一个实施方案中，络合条件还包括选自由以下组成的组的抑制剂：非竞争性抑制剂、竞争性抑制剂以及它们的组合。在另一个实施方案中，络合条件包括小于约6的pH。

在另一个实施方案中，聚合条件包括大于或等于约6的pH。在一个实施方案中，络合条件包括非竞争性抑制剂。在一个实施方案中，非竞争性抑制剂选自由以下组成的组：氨基糖苷、焦磷酸盐类似物、黑色素、膦酰基乙酸酯、次磷酸酯、利福霉素以及它们的组合。

在一个实施方案中，络合条件包括竞争性抑制剂。在一个实施方案中，竞争性抑制剂选自由以下组成的组：阿非迪霉素、β-D-阿拉伯呋喃糖基-CTP、阿米洛利、脱氢阿霉素以及它们的组合。在一个实施方案中，络合条件包括溶剂添加剂。在一个实施方案中，溶剂添加剂选自由以下组成的组：乙醇、甲醇、四氢呋喃、二噁烷、二甲胺、二甲基甲酰胺、二甲基亚砜、锂、L-半胱氨酸以及它们的组合。在另一个实施方案中，络合条件包括氘。

在一个实施方案中，3'-羟基封端基团包括可逆终止子。在另一个实施方案中，可逆终止子包括叠氮甲基基团或缩醛基团。在又一个实施方案中，该方法还包括在互补多核苷酸的3’端共价结合到连接基的磷酸基团后移除可逆终止子。在又一个实施方案中，游离核苷酸还包括非桥接硫醇或桥接氮。在一个实施方案中，聚合酶包括突变。在另一个实施方案中，突变改变步骤a)至c)中的一者或多者的速度。

在SBS中使用的当前ffN在核碱基上携带染料标记，其必须在每个循环期间在单独的步骤中裂解。这种裂解在DNA上留下“疤痕”，从而潜在地影响产生的DNA与SBS聚合酶的结合和下游测序度量。通过将荧光标签(或任何其他检测标签)从核碱基移开到5’末端磷酸并小心地控制酶催化，核苷酸的掺入将导致检测标签完全释放，留下无痕DNA，即其核碱基没有有害修饰的DNA，该有害修饰否则会由于从其移除染料标记而产生。

附图说明

图1A至图1F描绘了无痕SBS循环的示意图。图1A示出聚合酶与聚集在流通池表面的引物DNA结合。在图1B中，携带5'-磷酸标记的核苷酸基底在控制催化的条件下引入，从而暂停聚合酶掺入动力学并将标记保留在5’磷酸上。根据检测模式，结合后可以洗掉过量的基底。核苷酸可任选地携带3’-嵌段以防止在引入催化条件时的多个核苷酸掺入事件。在图1C中，在催化之前，当核苷酸基底及其5’-磷酸标记仍然结合时，测量每个簇的信号。图1D示出流通池的条件被改变，使得催化可以被促进并且5’磷酸标记从簇释放。在核苷酸结合后不使用洗掉过量基底的实施方案中，3’-嵌段的存在在此处将是必需的，以仅实现单个延伸事件。在图1E中，所得DNA产物含有天然核苷酸。图1F示出在采用具有3’-嵌段的核苷酸基底的一些实施方案中，可能需要随后的去封端步骤来为随后的循环准备簇。

应当理解，前述概念和下文更详细讨论的附加概念(假设此类概念不相互矛盾)的所有组合都被设想为是本文所公开的发明主题的一部分并且可用于实现本文所述的益处和优点。

具体实施方式

应当理解，本公开的某些方面、模式、实施方案、变型和特征在下面以各种细节水平进行描述，以便提供对本技术的实质理解。除非另有说明，否则本文所用的所有技术和科学术语的含义通常与本领域的普通技术人员通常理解的含义相同。术语“包括”以及其他形式的使用不是限制性的。术语“具有”以及其他形式的使用不是限制性的。如本公开中所用，无论是在过渡短语中还是在权利要求的正文中，术语“包含(comprise(s))”和“包含(comprising)”都将被解释为具有开放式含义。即，术语应与短语“至少具有”或“至少包括”同义地解释。

术语“基本上”、“大约”、“约”、“相对”或可在整个本公开(包括权利要求书)中使用的其他此类类似术语用于描述和说明例如由于处理中的变化而来自参考或参数的小波动。此类小波动也包括来自参考或参数的零波动。例如，波动可以指小于或等于±10％，诸如小于或等于±5％，诸如小于或等于±2％，诸如小于或等于±1％，诸如小于或等于±0.5％，诸如小于或等于±0.2％，诸如小于或等于±0.1％，诸如小于或等于±0.05％。

还应理解，本文所述的某些特征(为了清楚起见，其在单独实施方案的上下文中描述)也可在单个实施方案中组合提供。相反，为了简洁起见，在单个实施方案的上下文中描述的各种特征也可以单独提供或者以任何合适的子组合提供。

术语“连接”、“接触”和/或“耦接”包括各种布置和组件。这些布置和技术包括但不限于：(1)一个部件和另一个部件的直接接合，其间没有居间部件(即，部件直接物理接触)；以及(2)一个部件和另一个部件的接合，其间具有一个或多个部件，前提条件是该一个部件“连接到”或“接触”或“耦接到”该另一个部件在某种程度上是与该另一个部件是操作性连通(例如，电气、流体、物理、光学连通等)(任选地在其间存在一个或多个附加部件)。彼此直接物理接触的一些部件可彼此电接触和/或流体接触或者可不彼此电接触和/或流体接触。此外，电连接、电耦接、光学连接、光学耦接、流体连接或流体耦接的两个部件可直接物理接触或可不直接物理接触，并且一个或多个其他部件可定位在这两个连接部件之间。

如本文所述，术语“阵列”可包括可附接到一个或多个固相基底的一组传导通道或分子，使得这些传导通道或分子可基于其位置彼此区分。如本文所述，阵列可包括各自位于固相基底上的不同可识别位置(例如，在不同传导通道处)的不同分子。另选地，阵列可包括各自带有不同分子的单独的固相基底，其中可根据固相基底在固相基底附接的表面上的位置或基于固相基底在液体(诸如流体流)中的位置来识别不同的探针分子。其中单独基底位于表面上的阵列的示例包括具有小珠的孔，如美国专利号6,355,431、美国专利公布号2002/0102578和WO 00/63437中所述，所有这些专利全文据此以引用方式并入。阵列的分子可以是核酸引物、核酸探针、核酸模板或核酸酶诸如聚合酶和核酸外切酶。

如本文所述，术语“附着”可包括当两个物体彼此接合、扣紧、粘附、连接或结合时。反应组分如聚合酶可通过共价键或非共价键附着到固相组分如传导通道。如本文所述，短语“共价附着”或“共价结合的”是指形成特征在于原子之间共享电子对的一个或多个化学键。非共价键是不涉及共享电子对的非共价键，并且可包括例如氢键、离子键、范德华力、亲水相互作用和疏水相互作用。

如本文所用，任何“R”基团表示可附着到指示原子的取代基。R基团可为取代的或未取代的。如果两个R基团被描述为“连同它们所附着的原子一起”形成环或环系，则这意味着原子、中间键和两个R基团的集合单元是所述的环。

C₁至C₂₀烃包括烷基、环烷基、聚环烷基、烯基、炔基、芳基以及它们的组合。示例包括苄基、苯乙基、炔丙基、烯丙基、环己基甲基、金刚烷基、樟脑基和萘乙基。烃是指由氢和碳作为唯一元素组分构成的任何取代基。

术语“烷基”包括在链中具有约1至约23个碳原子的直链或支链脂族烃基团。例如，直链或支链碳链可具有1至10个碳原子或1至6个碳原子。支链是指一个或多个低级烷基基团诸如甲基、乙基或丙基附着到直链烷基链上。烷基包括完全饱和的烃(即，不含双键或三键)以及它们的组合。(例如，1至10个碳原子，诸如1至6个碳原子)。烷基基团的示例包括但不限于甲基、乙基、丙基、正丙基、异丙基、丁基、异丁基、正丁基、仲丁基、叔丁基、正戊基和3-戊基。烷基基团可具有1至约23个之间的碳原子(每当在本文中出现时，诸如“1至23”的数值范围是指给定范围内的每个整数；例如，“1至23个碳原子”意味着烷基基团可以由1个碳原子、2个碳原子、3个碳原子、4个碳原子、5个碳原子等，并且最多至并包括23个碳原子组成，但本公开还涵盖出现其中没有指定数值范围的术语“烷基”)。例如，“C₁-C₆烷基”表示烷基链中存在一个和六个之间的碳原子(即，烷基链选自由甲基、乙基、丙基、异丙基、正丁基、异丁基、仲丁基和叔丁基组成的组)。

如本文所述，“烯基”是指包含一个或多个双键的直链或支链烃链。烯基基团可以具有约2至约23个碳原子，但本说明书还涵盖出现其中没有指定数值范围的术语“烯基”。烯基基团还可以是具有2至9个碳原子的中等大小烯基。烯基基团还可以是具有2和6个之间的碳原子的低级烯基。例如，“C₂-C₆烯基”表示烯基链中存在两个至六个碳原子，即，烯基链选自由乙烯基、丙烯-1-基、丙烯-2-基、丙烯-3-基、丁烯-1-基、丁烯-2-基、丁烯-3-基、丁烯-4-基、1-甲基-丙烯-1-基、2-甲基-丙烯-1-基、1-乙基-乙烯-1-基、2-甲基-丙烯-3-基、丁-1,3-二烯基、丁-1,2-二烯基和丁-1,2-二烯-4-基组成的组。典型的烯基基团可包括但不限于乙烯基、丙烯基、丁烯基、戊烯基和己烯基。

如本文所述，“炔基”包括包含一个或多个三键的直链或支链烃链。炔基基团可具有约2和约23个之间的碳原子，但本说明书还涵盖出现其中没有指定数值范围的术语“炔基”。作为示例，“C₂-C₆炔基”指示炔基链中可存在二和六个之间的碳原子(即，炔基链可选自由乙炔基、丙炔-1-基、丙炔-2-基、丁炔-1-基、丁炔-3-基、丁炔-4-基和2-丁炔基组成的组)。典型的炔基基团可包括但不限于乙炔基、丙炔基、丁炔基、戊炔基和己炔基等。

如本文所述，“杂烷基”可包括在链主链中含有一个或多个杂原子(即，除碳之外的元素，包括但不限于氮、氧和硫)的直链或支链烃链。杂烷基基团可以具有1和20个之间的碳原子，但本公开还包括出现其中没有指定数值范围的术语“杂烷基”。例如，“C₄-C₆杂烷基”可指示杂烷基链中存在四和六个之间的碳原子，并且此外在链的主链中存在一个或多个杂原子。

如本文所述，芳族是指具有共轭π电子体系的环或环系，并且包括碳环芳族基团(例如，苯基)和杂环芳族基团(例如，吡啶)这两者。芳族可包括单环基团或稠环多环(即，共用相邻原子对的环)基团，前提条件是整个环系是芳族的。

如本文所述，“芳基”包括在环主链中仅包含碳的芳族环或环系(例如，共用两个相邻碳原子的两个或更多个稠环)。本公开还包括出现其中未指定数值范围的术语“芳基”。在一个实施方案中，芳基基团具有6和10个之间的碳原子。芳基基团可被指定为例如“C₆-C₁₀芳基”。代表性芳基基团包括但不限于苯基、萘基、薁基和蒽基。

如本文所述，“芳烷基”或“芳基烷基”可包括作为取代基经由亚烷基基团连接的芳基基团，诸如“C₇-C₁₄芳烷基”等，包括但不限于苄基、2-苯基乙基、3-苯基丙基和萘基烷基。

术语“杂芳基”包括约5至约14个环原子，优选地约5至约10个环原子的芳族单环或多环环系，其中环系中的原子中的一个或多个原子是除碳以外的元素，例如氮、氧或硫。在多环环系的情况下，对于定义为“杂芳基”的环系，环中的仅一个环需要是芳族的。杂芳基基团可以具有5至18个之间的环成员(即，构成环主链的原子(包括碳原子和杂原子)的数目)，但本公开还包括出现其中没有指定数值范围的术语“杂芳基”。优选的杂芳基含有约5至10个之间的环原子，或约5至6个之间的环原子。杂芳基之前的前缀氮杂、氧杂、硫杂或硫代分别意指至少一个氮、氧或硫原子作为环原子存在。杂芳基的氮原子任选被氧化成对应的N-氧化物。代表性杂芳基包括噻吩基、酞嗪基、吡啶基、苯并噁唑基、苯并噻吩基、吡啶基、2-氧代-吡啶基、嘧啶基、哒嗪基、吡嗪基、三嗪基、呋喃基、吡咯基、噻吩基、吡唑基、咪唑基、噁唑基、异噁唑基、噻唑基、异噻唑基、三唑基、噁二唑基、噻二唑基、四唑基、吲哚基、异吲哚基、苯并呋喃基、苯并苯硫基、吲哚啉基、2-氧代吲哚啉基、二氢苯并呋喃基、二氢苯并噻吩基、吲唑基、苯并咪唑基、苯并噁唑基、苯并噻唑基、苯并异噁唑基、苯并异噻唑基、苯并三唑基、苯并[1,3]二氧杂环戊烯基、喹啉基、异喹啉基、喹唑啉基、噌啉基、酞嗪基、喹喔啉基、2,3-二氢-苯并[1,4]二氧杂环己烯基、苯并[1,2,3]三嗪基、苯并[1,2,4]三嗪基、4H-色烯基、吲哚嗪基、喹啉嗪基、6aH-噻吩并[2,3-d]咪唑基、1H-吡咯并[2,3-b]吡啶基、咪唑并[1,2-a]吡啶基、吡唑并[1,5-a]吡啶基、[1,2,4]三唑并[4,3-a]吡啶基、[1,2,4]三唑并[1,5-15a]吡啶基、噻吩并[2,3-b]呋喃基、噻吩并[2,3-b]吡啶基、噻吩并[3,2-b]吡啶基、呋喃并[2,3-b]吡啶基、呋喃并[3,2-b]吡啶基、噻吩并[3,2-d]嘧啶基、呋喃并[3,2-d]嘧啶基、噻吩并[2,3-b]吡嗪基、咪唑并[1,2-a]吡嗪基、5,6,7,8-四氢咪唑并[1,2-a]吡嗪基、6,7-二氢-4H-吡唑并[5,1-c][1,4]噁嗪基、2-氧代-2,3-二氢苯并[d]噁唑基、3,3-二甲基-2-氧代吲哚啉基、2-氧代-2,3-二氢-1H-吡咯并[2,3-b]吡啶基、苯并[c][1,2,5]噁二唑基、苯并[c][1,2,5]噻二唑基、3,4-二氢-2H-苯并[b][1,4]噁嗪基、5,6,7,8-四氢-[1,2,4]三唑并[4,3-a]吡嗪基、[1,2,4]三唑并[4,3-a]吡嗪基、3-氧代-[1,2,4]三唑并[4,3-a]吡啶-2(3H)-基等。

“杂芳烷基”或“杂芳基烷基”是指作为取代基经由亚烷基基团连接的杂芳基基团。示例包括但不限于2-噻吩基甲基、3-噻吩基甲基、呋喃基甲基、噻吩基乙基、吡咯基烷基、吡啶基烷基、异噁唑基烷基和咪唑基烷基。

除非另外指明，否则术语“碳环”旨在包括其中环原子均为碳但具有任何氧化态的环系。当碳环基为环系时，两个或更多个环可以以稠合、桥接或螺接的方式接合在一起。碳环基可以具有任何饱和度，前提条件是环系中的至少一个环不是芳族的。因此，碳环基包括环烷基、环烯基和环炔基。碳环基基团可具有3至20个碳原子，并且术语“碳环基”的当前使用也包括没有指定数值范围的情况。因此，(C₃-C₁₂)碳环例如是指非芳族和芳族体系，包括诸如环丙烷、苯和环己烯的体系。如果没有另外限制，则碳环是指单环、双环和多环。

如本文所用，“环烷基”意味着完全饱和的碳环基环或环系。环烷基是烃的子集并且包括3至8个碳原子的环状烃基。环烷基基团的示例包括c-丙基、c-丁基、c-戊基和降冰片基(例如环丙基、环丁基、环戊基和环己基)。

如本文所用，术语“C₁-C₆”包括C₁、C₂、C₃、C₄、C₅和C₆，以及由这两个数字中任一个定义的范围。例如，C₁-C₆烷基包括C₁烷基、C₂烷基、C₃烷基、C₄烷基、C₅烷基和C₆烷基、C₂-C₆烷基、C₁-C₃烷基等。类似地，C₂-C₆烯基包括C₁烯基、C₂烯基、C₃烯基、C₄烯基、C₅烯基和C₆烯基、C₂-C₅烯基、C₃-C₄烯基等；并且C₂-C₆炔基包括C₂炔基、C₃炔基、C₄炔基、C₅炔基和C₆炔基、C₂-C₅炔基、C₃-C₄炔基等。C₃-C₅环烷基各自包括含有3、4、5、6、7和8个碳原子或由任何两个数字限定的范围的烃环，诸如C₃-C₇环烷基或C₅-C₆环烷基。

如本文所用，“杂环基”或“杂环”是指由碳原子和一至五个杂原子组成的稳定3-18元环(基团)，该杂原子选自由氮、氧和硫组成的组。为了本公开的目的，杂环可以是单环或多环环系，其可以包括稠环系、桥环系或螺环系；并且杂环中的氮原子、碳原子或硫原子可任选地被氧化；氮原子可任选地被季铵化；并且环可以是部分或完全饱和的。杂环基可具有任何饱和度，前提条件是环系中的至少一个环不是芳族的。杂原子可以存在于环系中的非芳族环或芳族环中。杂环基基团可以具有3至20个环成员(即，构成环主链的原子(包括碳原子和杂原子)的数目)，但还包括出现其中没有指定数值范围的术语“杂环基”。此类杂环的示例包括但不限于吖啶基、咔唑基、咪唑啉基、氧杂环庚烷基、噻吩基、二氧哌嗪基、吡咯烷基、吡咯烷酮基、环氧乙烷基、氮杂环庚烷基、偶氮烷基、吡喃基二氧戊环基、二噻烷基、1,3-二氧戊环基、四氢呋喃基、二氢吡咯烷基、十氢异喹啉基、咪唑烷基、异噻唑烷基、异噁唑烷基、吗啉基、八氢吲哚基、八氢异吲哚基、2-氧代哌嗪基、2-氧代哌啶基、2-氧代吡咯烷基、2-氧代氮杂环庚烯基、恶唑烷基、环氧乙烷基、哌啶基、哌嗪基、4-哌啶酮基、吡咯烷基、吡唑烷基、噻唑烷基、四氢吡喃基、硫吗啉基、硫吗啉基亚砜、硫吗啉基砜和四氢喹啉。另外的杂环和杂芳基描述于Katritzky等人编辑的Comprehensive Heterocyclic Chemistry:TheStructure,Reactions,Synthesis and Use of Heterocyclic Compounds，第1-8卷，Pergamon Press,N.Y.(1984年)中，该文献全文据此以引用方式并入。

本文使用的术语“单环”表示具有一个环的分子结构。

本文所用的术语“多环”或“多环的”表示具有两个或更多个环的分子结构，包括但不限于稠环、桥环或螺环。

如本文所用，术语“卤素”或“卤基”可包括元素周期表第7列的放射性稳定原子中的任一种，例如，氟、氯、溴或碘。

原子的术语“取代的”或“取代”是指指定原子上的一个或多个氢被选自指定基团的基团取代，条件是不超过指定原子的正常化合价。如本文所用，取代的基团衍生自未取代的母体基团，其中已存在一个或多个氢原子与另一个原子或基团的交换。除非另有说明，当基团被认为是“取代的”时，是指该基团被一个或多个取代基取代。在基团被描述为“任选地取代的”的任何地方，该基团可以被上述取代基取代。

“未取代的”原子带有由它们的化合价规定的所有氢原子。当取代基是酮基(即，＝0)时，则原子上的两个氢被取代。取代基和/或变量的组合仅在此类组合产生稳定化合物的情况下是允许的；所谓“稳定的化合物”或“稳定的结构”意指足够稳健以经受从反应混合物中分离至有用的纯度的化合物。

术语“任选地取代的”用于指示基团可以在该基团的每个可取代原子上具有取代基(包括在单个原子上的多于一个取代基)，条件是不超过指定原子的正常化合价并且每个取代基的同一性独立于其他取代基。每个残基中至多三个H原子被烷基、卤素、卤代烷基、羟基、低级烷氧基、羧基、烷氧碳酰(也称为烷氧羰基)、甲酰胺基(也称为烷基氨基羰基)、氰基、羰基、硝基、氨基、烷基氨基、二烷基氨基、巯基、烷硫基、亚砜、砜、酰氨基、脒基、苯基、苄基、杂芳基、苯氧基、苄氧基或杂芳氧基取代。“未取代的”原子带有由它们的化合价规定的所有氢原子。当取代基是酮基(即，＝0)时，则原子上的两个氢被取代。取代基和/或变量的组合仅在此类组合产生稳定化合物的情况下是允许的；所谓“稳定的化合物”或“稳定的结构”意指足够稳健以经受从反应混合物中分离至有用的纯度的化合物。

如本文所用，术语“羟基”包括-OH基团。

如本文所述，术语“多核苷酸”或“核酸”是指脱氧核糖核酸(DNA)、核糖核酸(RNA)或由核苷酸类似物制成的DNA或RNA的类似物。如本文所用，术语还涵盖cDNA，即由RNA模板例如通过逆转录酶的作用产生的互补DNA或拷贝DNA。在一个实施方案中，待例如通过使用所述系统的测序进行分析的核酸被固定在基底(例如，流通池内的基底或基底诸如流通池上的一个或多个小珠等)上。如本文所用，术语“固定”旨在包括直接或间接的共价或非共价附着，除非另外明确指出或通过上下文指出。在旨在使用载体的条件下，诸如在需要核酸测序的应用中，分析物(例如，核酸)可以保持固定或附着到载体。在一个实施方案中，模板多核苷酸是附着到基底的多个模板多核苷酸中的一个模板多核苷酸。在一个实施方案中，附着到基底的多个模板多核苷酸包括文库多核苷酸的拷贝的簇，如本文所述。

核酸包括天然存在的核酸或其功能类似物。特别有用的功能类似物能够以序列特异性方式与核酸杂交或能够用作复制特定核苷酸序列的模板。天然存在的核酸通常具有包含磷酸二酯键的主链。类似物结构可具有替代的主链键，包括本领域已知的多种主链键中的任一种主链键，诸如肽核酸(PNA)或锁核酸(LNA)。天然存在的核酸通常具有脱氧核糖(例如存在于脱氧核糖核酸(DNA)中)或核糖(例如存在于核糖核酸(RNA)中)。

在RNA中，糖为核糖，并且在DNA中为脱氧核糖，即，缺乏存在于核糖中的羟基基团的糖。含氮杂环碱基可为嘌呤或嘧啶碱基。嘌呤碱基包括腺嘌呤(A)和鸟嘌呤(G)以及它们的修饰衍生物或类似物。嘧啶碱基包括胞嘧啶(C)、胸腺嘧啶(T)和尿嘧啶(U)以及它们的修饰衍生物或类似物。脱氧核糖的C-1原子可结合到嘧啶的N-1或嘌呤的N-9。

核酸可包含本领域已知的这些糖部分的多种类似物中的任一种。核酸可包括天然的或非天然的碱基。天然脱氧核糖核酸可具有选自由腺嘌呤、胸腺嘧啶、胞嘧啶或鸟嘌呤组成的组的一个或多个碱基，并且核糖核酸可具有选自由尿嘧啶、腺嘌呤、胞嘧啶或鸟嘌呤组成的组的一个或多个碱基。可包含在核酸中的有用的非天然碱基是本领域已知的。在本公开中，R₁包括选自腺嘌呤、鸟嘌呤、胞嘧啶、胸腺嘧啶和尿嘧啶的含氮碱基。

如本文所述，术语核苷酸可包括天然核苷酸及其类似物、核糖核苷酸、脱氧核糖核苷酸、双脱氧核糖核苷酸以及被称为核苷酸的其他分子。如本文所述，“核苷酸”可包括含氮杂环碱基、糖以及一个或多个磷酸基团。核苷酸可以是核酸序列的单体单元，例如以识别DNA或RNA链中存在的亚基。核苷酸还可包括不一定存在于聚合物中的分子，例如能够通过聚合酶以依赖于模板的方式掺入到多核苷酸中的分子。核苷酸可包括例如在5′碳上具有0、1、2、3个或更多个磷酸基团的核苷单元。核苷四磷酸、核苷五磷酸和核苷六磷酸可以是有用的，在5′碳上具有超过6个磷酸基团(诸如7、8、9、10或更多个磷酸基团)的核苷酸也可以是有用的。天然存在的核苷酸的示例包括但不限于ATP、UTP、CTP、GTP、ADP、UDP、CDP、GDP、AMP、UMP、CMP、GMP、dATP、dTTP、dCTP、dGTP、dADP、dTDP、dCDP、dGDP、dAMP、dTMP、dCMP和dGMP。

非天然核苷酸包括核苷酸类似物，诸如不存在于天然生物系统中或基本上不通过聚合酶在其天然环境下(例如在表达聚合酶的非重组细胞中)掺入到多核苷酸中的那些核苷酸。非天然核苷酸包括那些通过聚合酶以一种速率掺入到多核苷酸链中的那些非天然核苷酸，该速率显著快于或慢于另一种核苷酸(诸如具有与相同沃森-克里克互补碱基进行碱基配对的天然核苷酸)通过聚合酶掺入到链中的速率。例如，当与天然核苷酸的掺入速率相比时，非天然核苷酸可以至少2倍不同、5倍不同、10倍不同、25倍不同、50倍不同、100倍不同、1000倍不同、10000倍不同或更多倍不同的速率掺入。将非天然核苷酸掺入到多核苷酸中后能够被进一步延伸。示例包括具有3'羟基的核苷酸类似物或在3'位置具有可逆终止子部分的核苷酸类似物，该核苷酸类似物可被移除以允许掺入了该核苷酸类似物的多核苷酸进一步延伸。可逆终止子部分的示例描述于例如美国专利号7,427,673、7,414,116和7,057,026，以及WO 91/06678和WO 07/123744中，这些专利中的每一者全文据此以引用方式并入。应当理解，在一些示例中，具有3'终止子部分或缺乏3'羟基的核苷酸类似物(诸如双脱氧核苷酸类似物)可在已掺入核苷酸类似物的多核苷酸不被进一步延伸的条件下使用。在一些示例中，核苷酸可不包含可逆终止子部分，或该核苷酸将不包含不可逆终止子部分，或该核苷酸将根本不包含任何终止子部分。

如本文所用，“核苷”在结构上类似于核苷酸，但缺少磷酸部分。核苷类似物的一个示例是其中标记与碱基连接并且没有磷酸基团连接到糖分子的核苷类似物。术语“核苷”在本文中以本领域技术人员所理解的常规含义使用。示例包括但不限于包含核糖部分的核糖核苷和包含脱氧核糖部分的脱氧核糖核苷。经修饰的戊糖部分是其中氧原子已被碳取代和/或碳已被硫或氧原子取代的戊糖部分。“核苷”是可以具有取代的碱基和/或糖部分的单体。

术语“嘌呤碱基”在本文中以本领域技术人员所理解的普通含义使用，并且包括其互变异构体。类似地，术语“嘧啶碱基”在本文中以本领域技术人员所理解的普通含义使用，并且包括其互变异构体。任选地取代的嘌呤碱基的非限制性列表包括嘌呤、腺嘌呤、鸟嘌呤、次黄嘌呤、黄嘌呤、别黄嘌呤、7-烷基鸟嘌呤(例如，7-甲基鸟嘌呤)、可可碱、咖啡因、尿酸和异鸟嘌呤。嘧啶碱基的示例包括但不限于胞嘧啶、胸腺嘧啶、尿嘧啶、5,6-二氢尿嘧啶和5-烷基胞嘧啶(例如5-甲基胞嘧啶)。

如本文所述，术语基底(或固体载体)可包括核酸可附着到其上的任何惰性基底或基质，例如玻璃表面、塑料表面、胶乳、葡聚糖、聚苯乙烯表面、聚丙烯表面、聚丙烯酰胺凝胶、金表面和硅晶片。例如，基底可以是玻璃表面(例如，流通池通道的平面表面)。在一个实施方案中，基底可以包括已经被“官能化”的惰性基底或基质，例如通过施加中间材料的层或涂层，该中间材料包括允许共价附着到分子诸如多核苷酸的反应性基团。载体可包括负载在惰性基底诸如玻璃上的聚丙烯酰胺水凝胶。分子(例如，多核苷酸)可直接共价附着至中间材料(例如，水凝胶)。载体可以包括多个颗粒或小珠，每个颗粒或小珠具有不同的附着分析物。

如本文所用，当寡核苷酸或多核苷酸被描述为“包括”本文所述的核苷或核苷酸时，这包括当本文所述的核苷或核苷酸与寡核苷酸或多核苷酸形成共价键时。类似地，当核苷或核苷酸被描述为寡核苷酸或多核苷酸的一部分，诸如“掺入到”寡核苷酸或多核苷酸中时，这意味着本文所述的核苷或核苷酸与寡核苷酸或多核苷酸可形成共价键。在一个实施方案中，共价键在寡核苷酸或多核苷酸的3’羟基基团与核苷酸的5’磷酸基团之间形成，作为寡核苷酸或多核苷酸的3’碳原子与核苷酸的5’碳原子之间的磷酸二酯键。

如本文所用，“衍生物”或“类似物”意指具有修饰的碱基部分和/或修饰的糖部分的合成核苷酸或核苷衍生物。此类衍生物和类似物在例如Bücher，NUCLEOTIDE ANALOGS(John Wiley&Son，1980)和Uhlmann等人，“Antisense Oligonucleotides:A NewTherapeutic Principle,”Chemical Reviews 90:543-584(1990)中进行了讨论，这两篇文献全文据此以引用方式并入。核苷酸类似物还可包括经修饰的磷酸二酯键，包括硫代磷酸酯键、二硫代磷酸酯键、烷基膦酸酯键、苯胺磷酸酯键和氨基磷酸酯键。如本文所用，“衍生物”、“类似物”和“修饰的”可以互换使用，并且由本文所述的术语“核苷酸”和“核苷”涵盖。

如本文所用，术语“磷酸酯”以本领域技术人员所理解的普通含义使用，并且包括其质子化形式。如本文所用，术语“单磷酸”、“二磷酸”和“三磷酸”以本领域技术人员所理解的其普通含义使用，并且包括质子化形式。在本公开中，R₃包括连接基，该连接基包括三个或更多个磷酸基团。

根据本公开描述的核苷或核苷酸包括嘌呤或嘧啶碱基和核糖或脱氧核糖部分，所述核糖或脱氧核糖部分具有与其共价连接的封端基团，例如在3'O位置，这使得所述分子可用于需要封端3'-OH基团以防止掺入另外的核苷酸的技术中，例如在测序反应、多核苷酸合成、核酸扩增、核酸杂交测定、单核苷酸多态性研究和其他这样的技术中。

在本公开的上下文中使用术语“封端基团”的情况下，这包括本文所述的“Z”封端基团。然而，应当理解，在本文描述和要求保护的方法中，在使用核苷酸混合物的情况下，这些可包括相同类型的封端，即“Z”-封端。在使用“Z”-封端的核苷酸的情况下，如果可检测标记形成“Z”基团的一部分(即，不附着于碱基)，则每个“Z”基团可以是相同的基团，也可以不是。

一旦移除封端基团，就可以将另一个核苷酸掺入游离的3'-OH基团中。

该分子可以通过期望的连接基经由碱基连接到可检测的标记上，该标记可以是例如荧光团。如果需要的话，可检测标记可以替代地掺入式“Z”的封端基团中。连接基可以是酸不稳定的、光不稳定的或含有二硫键。可以采用其他连接，特别是膦可裂解的含叠氮化物的连接基。标记和连接的示例包括在WO 03/048387中公开的那些，该专利全文据此以引用方式并入。如本文所用，术语“羟基”包括-OH基团。如本文所述的R₂可包括羟基(即，-OH基团)和/或如本文所述的R₂可由-O-R₂组成，其中R₂为H或Z，其中Z为包含叠氮基基团的可移除保护基团。在一个实施方案中，R₂由-O-R₂组成，其中R₂是Z，其中Z是包含叠氮基基团的可移除保护基团。

如本文所述，术语“封端基团(blocking group/blocking groups)”是指添加到分子中以便防止分子中的现有基团经历不希望的化学反应的任何原子或原子团。短语“封端基团”和“保护基团”可以互换使用。为了确保仅发生单个掺入，结构修饰(“封端基团”或“保护基团”)可以包括在添加到生长链中的任何标记的核苷酸中，以确保仅掺入一个核苷酸。在添加具有封端基团的核苷酸后，然后可以在不干扰被测序的DNA的完整性的反应条件下移除封端基团。然后可继续测序循环，掺入下一个受保护的标记核苷酸。

为了在DNA测序中有用，核苷酸(通常是核苷酸三磷酸)可以包括3'-羟基封端基团，以防止用于将其掺入多核苷酸链中的聚合酶一旦添加核苷酸上的碱基就继续复制。封端基团应防止附加核苷酸分子添加到多核苷酸链上，同时可容易地从糖部分移除而不引起对多核苷酸链的损害。此外，经修饰的核苷酸可与聚合酶或用于将其掺入多核苷酸链中的另一种合适的酶相容。理想的保护基团应该表现出长期稳定性，被聚合酶有效地掺入，引起二次或进一步核苷酸掺入的阻断，并且具有在不引起多核苷酸结构损伤的温和条件下，优选在含水条件下被移除的能力。

根据本公开可能有用的3’乙缩醛封端基团的示例包括但不限于美国申请序列号16/724,088中描述的那些，该专利全文据此以引用方式并入。根据本公开可能有用的叠氮甲基封端基团的示例包括但不限于缩醛(例如，3'缩醛封端基团或AOM)或硫代氨基甲酸酯封端基团，其描述于美国申请序列号号16/724,088中描述的那些，该专利全文据此以引用方式并入。在一个实施方案中，3'-OH封端基团将包括WO2004/018497中公开的部分，该该专利全文据此以引用方式并入。例如，封端基团可以是叠氮甲基(CH₂N₃)或烯丙基。

在一个实施方案中，3'-羟基封端基团包括可逆终止子。如本文所述，可逆终止子部分的示例描述于例如美国专利号7,427,673、7,414,116和7,057,026，以及WO 91/06678和WO 07/123744中，这些专利中的每一者全文以引用方式并入本文。应当理解，在一些示例中，具有3'终止子部分或缺乏3'羟基的核苷酸类似物(诸如双脱氧核苷酸类似物)可在已掺入核苷酸类似物的多核苷酸不被进一步延伸的条件下使用。在一些示例中，3'-羟基封端基团可以不包括可逆终止子部分，或者3'-羟基封端基团将不包括不可逆终止子部分，或者3'-羟基封端基团将根本不包括任何终止子部分。可逆保护基团已描述于例如Metzker等人，“Termination of DNA Synthesis by Novel 3'-modified-deoxyribonucleoside 5'-triphosphates,”Nucleic Acids Research 22(20):4259-426(1994年)中，该文献全文据此以引用方式并入，并且公开了八种3’-修饰的2-脱氧核糖核苷5’-三磷酸(3’-修饰的dNTP)的合成和用途以及在两种DNA模板测定中对掺入活性的测试。WO 2002/029003(其全文据此以引用方式并入)描述了一种测序方法，该测序方法可包括在聚合酶反应中使用烯丙基保护基团来封端生长的DNA链上的3'-OH基团。可用于本文所述方法的可逆终止子的示例包括但不限于叠氮甲基基团、缩醛基团或它们的组合。

在一个实施方案中，该方法还包括在互补多核苷酸的3’端共价结合到连接基的磷酸基团后移除可逆终止子。可以同时或顺序地移除(即，脱保护)3'-封端基团和荧光染料化合物，以暴露新生链用于进一步掺入核苷酸。通常，将在每个掺入步骤之后确定所掺入的核苷酸的同一性，但这不是必需的。类似地，美国专利号5,302,509(其全文据此以引用方式并入)公开了一种对固定在固体载体上的多核苷酸进行测序的方法。封端基团的移除允许发生进一步聚合。

本公开涵盖包括荧光标记的核苷酸，该荧光标记可用于本文公开的任何方法中，其本身掺入较大分子结构或缀合物中或与较大分子结构或缀合物缔合。如本文所述的R₄包括荧光标记。在该上下文中，荧光标记(或可使用的任何其他检测标签)从核碱基移动至5'末端磷酸，从而允许仔细控制酶催化。如本文所述以这种方式掺入核苷酸导致检测标签完全释放，留下无痕DNA。

荧光标记可包括选自任何已知荧光物质的化合物，例如罗丹明或花青。如本文所公开的荧光标记可附着到核苷酸碱基上的任何位置，并且可以任选地包括连接基。连接基的功能通常是帮助荧光标记与核苷酸的化学附着。在特定实施方案中，仍然可以对所得的类似物进行沃森-克里克碱基配对。连接基基团可用于将染料共价附着到核苷或核苷酸。连接基部分可以具有足够的长度以将核苷酸连接到化合物，使得该化合物不显著干扰核酸复制酶对核苷酸的总体结合与识别。因此，连接基还可包括间隔区单元。间隔区距离为例如核苷酸碱基距裂解位点或标记的距离。连接基可以是例如任选地具有一个或多个杂原子替代物的烷基链。连接基可包含酰胺或酯基团以促进化学偶联反应。可使用点击化学合成连接基。连接基可包含三唑基团。连接基可包含其他芳基基团。

如本文所述，本公开涉及能够产生无痕SBS的测序化学。如本文所公开的，一旦核苷酸和聚合酶与成簇的DNA结合，与模板链相反，但在实际核苷酸掺入之前(在本文中可互换地称为例如络合条件、非掺入条件和催化暂停)，就可以进行荧光信号的检测。该方面利用受控催化，其中核苷酸的化学掺入被暂停足够长的时间或被完全阻止以便在络合条件期间检测信号并调用正确的碱基。

通过聚合酶-P/T复合物携带荧光染料标记的核苷酸基底在流通池表面上的稳定结合可以在不同条件下发生。在稳定结合后，可洗掉溶液中过量的核苷酸。例如，携带荧光染料标记的核苷酸基底在流通池表面上的结合可以在非催化条件下发生。当维持非催化条件时，核苷酸-聚合酶-P/T三元复合物可被稳定并维持如本文所述的络合条件。虽然含氮碱基通过其相应的染料标记来识别，并且一旦实现信号检测(以及且因此碱基调用)，系统就可以通过交换溶液从非掺入条件(即，如本文所述的络合条件)切换到掺入条件(即，如本文所述的聚合条件)。

条件的变化可以促进从络合条件(在本文中可互换地称为例如络合条件和/或非掺入条件)到聚合条件(在本文中可互换地称为例如聚合条件、掺入条件和/或催化条件)的转变。在催化条件的存在下，DNA聚合酶可将核苷酸掺入DNA，从而引起离去基团(例如，核苷酸的5'多磷酸)的解离，该离去基团可携带荧光标记。在一个实施方案中，除了5’末端磷酸修饰外，核苷酸可包含3’可逆终止子(例如，AZM基团)，如目前在传统SBS中使用的。如本文所述，该方法促进核苷酸掺入的精确控制，从而在每个循环中使每个DNA链能够延伸单个核苷酸，特别是在下文中描述的另外的实施方案中。

如本文所述的络合条件是指有效地形成复合物但不会有效地形成聚合的条件。一旦游离核苷酸和聚合酶与互补多核苷酸结合，与模板多核苷酸相反，但在实际核苷酸掺入之前，可检测荧光信号(在核苷酸掺入之前形成的这种复合物在本文中称为例如络合条件)。如本文所述的络合条件可利用受控催化，其中核苷酸的掺入被暂停足够长的时间或被完全阻止以便检测信号并调用正确的碱基。因此，根据本公开，多个聚合酶与多个模板多核苷酸和多个游离核苷酸的接触可以在络合条件下发生，其中至少一个模板多核苷酸与互补多核苷酸杂交，其中每个互补多核苷酸包括被模板多核苷酸的5'端悬垂的3'端。在络合条件期间形成的复合物可以包括聚合酶、模板多核苷酸、互补多核苷酸以及多个游离核苷酸中的一个游离核苷酸，该游离核苷酸与突出于互补多核苷酸的模板多核苷酸的5'端的最3'核苷酸互补。

该方面利用受控催化，其中核苷酸的化学掺入被暂停足够长的时间或被完全阻止以便在络合条件期间检测信号并调用正确的碱基。在一个实施方案中，络合条件包括非催化金属阳离子。如本文所述的非催化金属阳离子的示例包括但不限于Ca²⁺、Zn²⁺、Co²⁺、Ni²⁺、Eu²⁺、Sr²⁺、Ba²⁺、Fe²⁺、Eu²⁺以及它们的任何组合中的一者或多者。存在的非催化性金属阳离子的浓度小于或等于约100mM。例如，非催化金属的浓度可以是约100mM、约95mM、约90mM、约85mM、约80mM、约75mM、约70mM、约65mM、约60mM、约55mM、约50mM、约45mM、约40mM、约35mM、约30mM、约25mM、约20mM、约15mM、约10mM、约9mM、约8mM、约7mM、约6mM、约5mM、约4mM、约3mM、约2mM、约1mM、小于1mM或其间的任何量。在一个实施方案中，在络合条件期间存在的非催化金属阳离子的浓度可以小于或等于约10mM。

在一个实施方案中，络合条件包括螯合剂。螯合剂的示例包括但不限于乙二醇-双(β-氨基乙基醚)-N,N,N′,N′-四乙酸(EGTA)、次氮基乙酸、亚氨基二琥珀酸四钠、乙二醇四乙酸、聚天冬氨酸、乙二胺-N,N'-二琥珀酸(EDDS)、甲基甘氨酸二乙酸(MGDA)以及它们的任何组合。

在一个实施方案中，络合条件还包括选自由以下组成的组的抑制剂：非竞争性抑制剂、竞争性抑制剂以及它们的组合。

在一个实施方案中，络合条件包括非竞争性抑制剂。非竞争性抑制剂可以是例如氨基糖苷、焦磷酸盐类似物、黑色素、膦酰基乙酸酯、次磷酸酯和利福霉素中的一者或多者。可用于本公开的络合条件中的非竞争性抑制剂的示例包括但不限于阿巴卡韦半硫酸盐(逆转录酶抑制剂，抗逆转录病毒)；放线菌素D(抑制RNA聚合酶)；阿昔洛韦(抑制病毒DNA聚合酶；抗疱疹剂)；AM-TS23(DNA聚合酶λ和β抑制剂)；α-鹅膏毒环肽(抑制RNA聚合酶II)；阿非迪霉素(DNA聚合酶α、δ和ε抑制剂)；叠氮胸苷(选择性逆转录酶抑制剂；抗逆转录病毒)；BMH21(RNA聚合酶1抑制剂；也是p53通路活化剂)；BMS 986094(HCV RNA聚合酶抑制剂2'-C-甲基鸟苷三磷酸的前药；有效的HCV复制抑制剂)；甲磺酸地拉韦啶(非核苷逆转录酶抑制剂)；恩替卡韦(有效的和选择性的乙型肝炎病毒抑制剂)；光辉霉素A(DNA和RNA聚合酶的抑制剂)；替诺福韦(逆转录酶抑制剂)；以及硫藤黄菌素(细菌RNA聚合酶抑制剂)。

在一个实施方案中，络合条件包括竞争性抑制剂。可用于本公开的络合条件中的竞争性抑制剂的示例包括但不限于阿非迪霉素、β-D-阿拉伯呋喃糖基-CTP、阿米洛利、脱氢阿霉素以及它们的任何组合。

当络合条件包括非催化金属时，该非催化金属可选自由Ca2+、Zn2+、Co2+、Ni2+、Eu2+、Sr2+、Ba2+、Fe2+和Eu2+中的一者或多者组成的组。非催化金属的浓度可以在0mM和100mM之间。例如，非催化金属的浓度可以是约1mM、约5mM、约10mM、约15mM、约20mM、约25mM、约30mM、约35mM、约40mM、约45mM、约50mM、约55mM、约60mM、约65mM、约70mM、约75mM、约80mM、约85mM、约90mM、约95mM和约100mM，或其间的任何量。在一些示例中，非催化金属的浓度在约0.1mM和约10mM之间，或者在约1mM和约10mM之间。在一个实施方案中，非催化金属的浓度为至多约10mM。在一个实施方案中，需要非催化金属来维持络合条件。

还可以设定pH以促进和/或维持络合条件。在一个实施方案中，络合条件包括小于约6的pH。pH可以是例如约5、约4、约3、约2、约1或小于1。

在一个实施方案中，络合条件包括溶剂添加剂。可用于本公开的络合条件中的溶剂添加剂的示例包括但不限于乙醇、甲醇、四氢呋喃、二噁烷、二甲胺、二甲基甲酰胺、二甲基亚砜、锂、L-半胱氨酸以及它们的组合。在一个实施方案中，络合条件包括氘。

条件的改变可以促进从络合条件到聚合条件的转变。如本文所述的聚合条件促进复合物的形成，该复合物允许通过复合物的聚合酶将核苷酸掺入到互补多核苷酸的3'端上。从络合条件(在本文中也称为非掺入条件)到聚合条件(在本文中也称为掺入条件)的转变可以通过例如从非催化条件切换到催化条件来实现，使得DNA聚合酶可以将核苷酸掺入到DNA，从而引起离去基团的解离，该离去基团可携带附着到其的荧光染料。可以允许聚合步骤进行足以允许核苷酸掺入的时间。

根据本公开内容的聚合酶可以包括能够耐受掺入磷酸标记的核苷酸的任何聚合酶。根据本公开可能有用的聚合酶的示例包括但不限于phi29聚合酶、klenow片段、DNA聚合酶I、DNA聚合酶III、GA-1、PZA、phi15、Nf、G1、PZE、PRD1、B103、GA-1、9oN聚合酶、Bst、Bsu、T4、T5、T7、Taq、Vent、RT、polβ和polγ。也可以使用被设计成具有特定特性的聚合酶。

聚合条件可包括Mg²⁺离子和/或Mn²⁺离子的各种浓度。例如，Mg²⁺离子的浓度可以是约1mM、约5mM、约10mM、约15mM、约20mM、约25mM、约30mM、约35mM、约40mM、约45mM、约50mM、约55mM、约60mM、约65mM、约70mM、约75mM、约80mM、约85mM、约90mM、约95mM和约100mM，或其间的任何量。类似地，Mn²⁺离子的浓度可以是约1mM、约5mM、约10mM、约15mM、约20mM、约25mM、约30mM、约35mM、约40mM、约45mM、约50mM、约55mM、约60mM、约65mM、约70mM、约75mM、约80mM、约85mM、约90mM、约95mM和约100mM，或其间的任何量。在一个实施方案中，当聚合条件包括Mg²⁺离子的浓度时，Mg²⁺离子的浓度可在约0.1mM至约10mM的范围内；或Mn²⁺离子的浓度，Mn²⁺离子的浓度可在约0.1mM至约10mM的范围内。

也可调整pH以促进聚合条件。在一个实施方案中，聚合条件包括大于或等于约6的pH。pH可以是例如约6、约7、约8、约9、约10、约11、约12、约13或约14。

步骤(a)使聚合酶与模板多核苷酸和多个游离核苷酸接触，其中模板多核苷酸与互补多核苷酸杂交，该互补多核苷酸包括由模板多核苷酸的5’末端片段悬垂的3’端，并且多个游离核苷酸包括式(I)的化合物，其中接触在络合条件下发生，该络合条件有效地形成复合物但不会有效地形成聚合，其中复合物包括聚合酶、模板多核苷酸、互补多核苷酸以及与模板多核苷酸的5’末端片段的第一核苷酸互补的多个游离核苷酸中的一个游离核苷酸；(b)检测来自荧光标记的信号；以及(c)将复合物暴露于聚合条件可重复一次或多次。

在一个实施方案中，游离核苷酸还可包括非桥接硫醇或桥接氮。通常，核苷酸的非桥连硫醇可以包括取代核苷酸的5’磷酸基团之间的磷酸二酯键中的羰基氧的硫醇，诸如在以下示例中：

根据本公开的其他方面，对游离核苷酸进行进一步修饰。并且通常，桥接氮可包括取代核苷酸的5’磷酸基团之间的磷酸二酯键的醚中的氧的氮，诸如在以下示例中：

根据本公开的其他方面，对游离核苷酸进行进一步修饰。

在一个实施方案中，聚合酶包括突变。在一个实施方案中，突变改变(a)使聚合酶与模板多核苷酸和多个游离核苷酸接触的速度，其中模板多核苷酸与互补多核苷酸杂交，该互补多核苷酸包括由模板多核苷酸的5’末端片段悬垂的3’端，并且多个游离核苷酸包括式(I)的化合物，其中接触在络合条件下发生，该络合条件有效地形成复合物但不会有效地形成聚合，其中复合物包括聚合酶、模板多核苷酸、互补多核苷酸以及与模板多核苷酸的5’末端片段的第一核苷酸互补的多个游离核苷酸中的一个游离核苷酸；以及/或者(b)检测来自荧光标记的信号；以及/或者(c)将复合物暴露于聚合条件可重复一次或多次。

如所描述的，每个核苷酸可顺序地与目标接触，在添加下一个核苷酸之前移除未掺入的核苷酸，其中标记和封端基团的检测和移除可以在添加每个核苷酸之后进行，或在加入所有四个核苷酸之后进行。

可以使所有的核苷酸同时与目标接触，即可以使包含所有不同核苷酸的组合物与目标接触，并且可以在检测之前和移除标记和封端基团之后移除未掺入的核苷酸。

文库制备

可以按任何合适的方式制备包含多核苷酸的文库，以将寡核苷酸衔接子附着到目标多核苷酸上。如本文所用，“文库”是来自给定的来源或样品的多核苷酸群体。文库包括多个目标多核苷酸。如本文所用，“目标多核苷酸”是期望测序的多核苷酸。目标多核苷酸基本上可以是任何已知或未知序列的多核苷酸。其可以是例如基因组DNA或cDNA的片段。测序可导致确定目标多核苷酸的全部或部分序列。目标多核苷酸可以来源于已被随机片段化的初级多核苷酸样品。通过在每个目标片段的末端放置通用引物序列，可以将目标多核苷酸加工成适于扩增的模板。目标多核苷酸也可通过逆转录成cDNA从初级RNA样品获得。

如本文所用，术语“多核苷酸”和“寡核苷酸”可以互换使用，是指包含通常通过磷酸二酯键彼此共价结合的两个或更多个核苷酸单体的分子。多核苷酸通常含有比寡核苷酸更多的核苷酸。出于说明而非限制的目的，多核苷酸可以被认为含有15个、20个、30个、40个、50个、100个、200个、300个、400个、500个或更多的核苷酸，而寡核苷酸则可以被认为含有100个、50个、20个、15个或更少的核苷酸。

多核苷酸和寡核苷酸可以包括脱氧核糖核酸(DNA)或核糖核酸(RNA)。这些术语应当被理解为包括由核苷酸类似物制成的DNA或RNA的类似物作为等同物，并且适用于单链(诸如有义或反义)多核苷酸和双链多核苷酸。如本文所用，该术语还涵盖cDNA，即由RNA模板例如通过逆转录酶的作用产生的互补DNA或拷贝DNA。

初级多核苷酸分子可以来源于双链DNA(dsDNA)形式(例如基因组DNA片段、PCR和扩增产物等)，或者可能来源于单链形式，如DNA或RNA，然后被转化为dsDNA形式。举例来说，可以使用本领域熟知的标准技术将mRNA分子复制成双链cDNA。初级多核苷酸的精确序列对于本文所提出的公开内容通常并不重要，可以是已知的，也可以是未知的。

在一些实施方案中，初级目标多核苷酸是RNA分子。在此类实施方案的一个方面，首先使用本领域已知的技术将分离自特定样品的RNA转化为双链DNA。然后可以用文库特异性标签对该双链DNA加索引标签。可以从分离自不同来源或样品的RNA平行生成包含文库特异性索引标签的这种双链DNA的不同制备物。随后，可以将包含不同文库特异性索引标签的不同双链DNA制备物混合，一同测序，然后借助文库特异性索引标签序列的存在，关于每个测序片段从其分离/来源于其的文库确定每个测序片段的同一性。

在一些实施方案中，初级目标多核苷酸是DNA分子。例如，初级多核苷酸可以代表生物体的完整遗传互补序列，并且是基因组DNA分子，诸如人DNA分子，既包括内含子和外显子这两种序列(编码序列)，还包括非编码调节序列，诸如启动子序列和增强子序列。然而，可以设想还可以使用多核苷酸序列或基因组DNA的特定子集，诸如特定染色体或其一部分。在许多实施方案中，初级多核苷酸的序列是未知的。DNA目标多核苷酸可以在片段化过程(诸如随机片段化过程)之前或之后，以及在连接衔接子寡核苷酸之前、期间或之后进行化学处理或酶处理。

优选地，将初级目标多核苷酸片段化为适合测序的适当长度。目标多核苷酸能够以任何合适的方式片段化。优选地，目标多核苷酸被随机片段化。随机片段化是指通过例如酶、化学或机械手段以无序方式将多核苷酸片段化。此类片段化方法是本领域已知的，并且利用标准方法(Sambrook和Russell,Molecular Cloning,A Laboratory Manual，第三版，其全文据此以引用方式并入)。为清楚起见，经由较大一段多核苷酸的较小片段的特异性PCR扩增生成此类较小片段并不等同于将这较大一段多核苷酸片段化，因为这较大一段多核苷酸保持完整(即，不被PCR扩增片段化)。此外，随机片段化被设计成产生与包括和/或围绕断裂的核苷酸的序列同一性或位置无关的片段。

在一些实施方案中，随机片段化是通过机械手段(诸如雾化或超声处理)产生长度为约50个碱基对至长度为约1500个碱基对(诸如长度为50个至700个碱基对或长度为50个至500个碱基对)的片段。

通过机械手段(例如，雾化、超声处理和Hydroshear)将多核苷酸分子片段化可以产生具有3’悬垂端和5’悬垂端的异质混合物的片段。可以使用本领域已知的方法或试剂盒(例如Lucigen DNA终止子末端修复试剂盒)修复片段末端，以生成最适宜插入例如克隆载体的平端位点的末端。在一些实施方案中，核酸群体的片段末端是平端。这些片段末端可以是平端，并且是磷酸化的。可以经由酶处理(例如使用多核苷酸激酶)来引入磷酸部分。

在一些实施方案中，目标多核苷酸序列用单一悬垂核苷酸通过例如某些类型的DNA聚合酶(诸如Taq聚合酶或Klenow exo minus聚合酶)的活性来制备，所述DNA聚合酶具有非模板依赖性末端转移酶活性，其将单一脱氧核苷酸(例如脱氧腺苷(A))添加到例如PCR产物的3’端。此类酶可以用于将单一核苷酸“A”添加到目标多核苷酸双链体的每条链的3’末端。因此，可以通过与Taq或Klenow exo minus聚合酶反应将“A”添加到目标多核苷酸双链体的每条末端修复链的3’末端，而衔接子多核苷酸构建体可以是T构建体，其具有存在于该衔接子构建体的每个双链体区的3’末端上的相容的“T”悬垂部。该末端修饰还防止目标多核苷酸的自连接，使得偏向于形成组合的连接衔接子-目标多核苷酸。

在一些实施方案中，通过如例如WO 2016/130704中描述的标签化完成片段化，该专利全文据此以引用方式并入。在此类方法中，采用转座酶将双链多核苷酸片段化，然后将通用引物序列附着到双链多核苷酸的一条链中。所得分子可以是间隙填充分子，并且可以使用引物进行延伸(例如通过PCR扩增)，所述引物的3’端具有与所附着的通用引物序列互补的序列，5’端则含有衔接子的其他序列。

衔接子能够以任何其他合适的方式附着到目标多核苷酸。在一些实施方案中，衔接子在多步过程(诸如两步过程)中引入，该多步过程涉及将衔接子的一部分连接到具有通用引物序列的目标多核苷酸上。第二步骤包括使用引物进行延伸(例如通过PCR扩增)，所述引物的3’端具有与所附着的通用引物序列互补的序列，5’端则含有衔接子的其他序列。通过示例，这种延伸可如美国专利号8,053,192中所述进行，该专利全文据此以引用方式并入。可以进行附加延伸，以提供连接到先前延伸得到的多核苷酸的5’端的附加序列。

在一些实施方案中，将整个衔接子与片段化的目标多核苷酸连接。优选地，连接的衔接子包括与双链目标多核苷酸连接的双链区。优选地，该双链区尽可能短，而不丧失功能。在该语境中，“功能”是指双链区在标准反应条件下形成稳定双链体的能力。在一些实施方案中，标准反应条件是指用于酶催化的多核苷酸连接反应的反应条件，这是技术读者熟知的(例如，在4℃至25℃范围内的温度下，在适合于酶的连接缓冲液中孵育)，其使得形成衔接子的两条链在衔接子与目标分子连接期间保持部分退火。连接方法是本领域已知的，并且可利用标准方法(Sambrook和Russell,Molecular Cloning,A Laboratory Manual，第三版，其全文据此以引用方式并入)。此类方法利用连接酶(诸如DNA连接酶)来实现或催化两条多核苷酸链(在这种情况下，为衔接子双链体寡核苷酸和目标多核苷酸双链体的两条多核苷酸链)的末端的连接，使得形成共价键。衔接子双链体寡核苷酸可以含有5'-磷酸部分，以便促进与目标多核苷酸3'-OH的连接。目标多核苷酸可以含有5'-磷酸部分，该部分是剪切过程的残留物，或是使用酶处理步骤添加的，并且已进行末端修复，任选地通过一个或多个悬垂碱基延伸，从而得到适合连接的3'-OH。在该语境中，附着意指先前未共价连接的多核苷酸链的共价连接。在本公开的特定方面，这种附着通过在两条多核苷酸链之间形成磷酸二酯键而发生，但是也可以使用其他共价连接方式(例如，非磷酸二酯主链键)。衔接子与目标多核苷酸的连接更详细地描述于例如美国专利号8,053,192中，该专利全文据此以引用方式并入。

任何合适的衔接子可以经由任何合适的方法(诸如上文论述的那些)附着到目标多核苷酸。衔接子包括文库特异性索引标签序列。在将样品固定以供测序之前，可以将该索引标签序列附着到来自每个文库的目标多核苷酸。该索引标签本身不是由目标多核苷酸的一部分形成的，而是成为扩增模板的一部分。索引标签可以是作为模板制备步骤的一部分添加到靶标的合成的核苷酸序列。因此，文库特异性索引标签是附着到特定文库的每个目标分子的核酸序列标签，其存在指示或用于鉴定从中分离出这些目标分子的文库。

优选地，索引标签序列的长度为20个核苷酸或更少的核苷酸。例如，索引标签序列的长度可以是1至10个核苷酸，或4至6个核苷酸。四核苷酸索引标签提供了在同一阵列上复用256个样品的可能性，六碱基索引标签则使得能够在同一阵列上处理4,096个样品。

衔接子可包含多于一个索引标签，从而可以增大复用的可能性。

衔接子优选地包括双链区，以及包含两条非互补单链的区域。衔接子的双链区可以具有任何合适数目的碱基对。优选地，双链区是短双链区，其通常包括5个或更多个连续碱基对，由两条部分互补的多核苷酸链退火形成。衔接子的这种“双链区”是指其中两条链退火的区域，并不暗示任何特定的结构构象。在一些实施方案中，双链区包括20个或更少的连续碱基对，诸如10个或更少的、或者5个或更少的连续碱基对。

通过包含表现出比标准沃森-克里克碱基对更强的碱基配对的非天然核苷酸，可以增加双链区的稳定性，因此潜在地缩短其长度。优选地，衔接子的两条链在双链区域中100％互补。

当衔接子附着到目标多核苷酸时，非互补单链区可以形成待测序多核苷酸的5’端和3’端。术语“非互补单链区”是指衔接子的以下区域：其中形成衔接子的两条多核苷酸链的序列表现出一定程度的非互补性，使得这两条链不能在用于PCR反应的标准退火条件下彼此完全退火。

非互补单链区由形成双链区的同两条多核苷酸链的不同部分提供。单链部分长度的下限通常将通过例如提供用于结合引物以供引物延伸、PCR和/或测序的合适序列的功能来确定。理论上不存在不匹配区域长度的上限，只不过通常有利的是使衔接子的总长度最小化，例如，以便在一个或多个附着步骤之后促进未结合的衔接子从衔接子-目标构建体分离。因此，通常优选的是，衔接子的非互补单链区长度为50个或更少的连续核苷酸，诸如长度为40个或更少的、30个或更少的、或者25个或更少的连续核苷酸。

文库特异性索引标签序列可以位于衔接子的单链区或双链区中，或者跨越衔接子的单链区和双链区。优选地，索引标签序列位于衔接子的单链区中。

除索引标签序列外，衔接子还可以包括任何其他合适的序列。例如，衔接子可以包括通用延伸引物序列，其通常位于衔接子和所得的用于测序的多核苷酸的5’端或3’端。通用延伸引物序列可以与结合到固体基底表面的互补引物杂交。互补引物包括游离的3’端，聚合酶或其他合适的酶可以从该3’端添加核苷酸，以使用杂交的文库多核苷酸作为模板延伸序列，使得文库多核苷酸的反向链偶联到固体表面。这种延伸可以是测序运行或簇扩增的一部分。

在一些实施方案中，衔接子包括一个或多个通用测序引物序列。通用测序引物序列可以与测序引物结合，以允许对索引标签序列、目标序列或者索引标签序列和目标序列测序。

衔接子的精确核苷酸序列通常对本公开不重要，并且可以由用户选择，使得期望的序列元件最终包括在来源于衔接子的模板文库的共用序列中，以例如提供特定组的通用延伸引物和/或测序引物的结合位点。

衔接子寡核苷酸可以包含核酸外切酶抗性修饰，诸如硫代磷酸酯键。

优选地，将衔接子附着到目标多肽的两端以产生具有第一衔接子-目标-第二衔接子核苷酸序列的多核苷酸。第一衔接子和第二衔接子可以相同，也可以不同。优选地，第一衔接子和第二衔接子是相同的。如果第一衔接子和第二衔接子是不同的，则第一衔接子和第二衔接子中的至少一者包括文库特异性索引标签序列。

应当理解，“第一衔接子-目标-第二衔接子序列”或“衔接子-目标-衔接子”序列是指衔接子相对于彼此以及相对于目标的取向，不一定意味着该序列可能不包括额外的序列，诸如连接基序列。

可以采用类似的方式制备其他文库，每个文库包括至少一个文库特异性索引标签序列或索引标签序列组合，其不同于来自其他文库的索引标签序列或索引标签序列组合。

如本文所用，“附着”或“结合”在衔接子相对于目标序列的语境中可互换使用。如上所述，可以使用任何合适的方法将衔接子附着到目标多核苷酸上。例如，衔接子可以通过以下方式附着到目标：通过用连接酶连接；通过以下操作的组合，即连接衔接子的一部分，以及用含有衔接子的另外或剩余部分的引物通过延伸(诸如PCR)添加衔接子的另外或剩余部分；通过转座以结合衔接子的一部分，以及用含有衔接子的另外或剩余部分的引物通过延伸(诸如PCR)添加衔接子的另外或剩余部分；等等。优选地，附着的衔接子寡核苷酸与目标多核苷酸共价结合。

在衔接子附着到目标多核苷酸后，可以使所得的多核苷酸经受净化过程，通过除去至少一部分未结合的衔接子来提高衔接子-目标-衔接子多核苷酸的纯度。可使用任何合适的净化处理，诸如电泳、尺寸排阻色谱法等。在一些实施方案中，可以采用固相反向固定(SPRI)顺磁珠从未附着的衔接子分离衔接子-目标-衔接子多核苷酸。虽然此类方法可以提高所得的衔接子-目标-衔接子多核苷酸的纯度，但是可能保留一些未附着的衔接子寡核苷酸。

用于测序的固定化样品的制备

根据本公开，来自一个或多个来源的多个衔接子-目标-衔接子多核苷酸分子在测序前被固定和扩增。用于将来自一个或多个来源的衔接子-目标-衔接子分子附着到基底的方法是本领域已知的。同样，用于扩增固定的衔接子-目标-衔接子分子的方法包括但不限于桥式扩增法和动力学排除法。在测序之前用于固定和扩增的方法描述于例如美国专利号8,053,192、WO2016/130704、美国专利号8,895,249和美国专利号9,309,502中，所有这些专利全文据此以引用方式并入。

然后可以将样品(包括合并的样品)固定以准备测序。测序可作为单分子阵列来执行或者可在测序之前进行扩增。可使用一个或多个固定化引物来执行扩增。固定化引物可以是在平面表面上或在小珠池上的引物苔。可在乳液的每个“隔室”中将小珠池分离到具有单个小珠的乳液中。在浓度为每个“隔室”仅一个模板时，在每个小珠上仅扩增单个模板。

如本文所用，术语“固相扩增”是指在固体载体上进行的或与固体载体相关联的任何核酸扩增反应，使得扩增产物的全部或一部分在形成时固定在该固体载体上。具体地，该术语涵盖固相聚合酶链反应(固相PCR)和固相等温扩增，该固相PCR和固相等温扩增是类似于标准溶液相扩增的反应，不同的是正向扩增引物和反向扩增引物中的一者或两者被固定在固体载体上。固相PCR包括系统诸如乳液，其中一个引物锚定在小珠上，另一个引物在自由溶液中；和固相凝胶基质中的群体形成，其中一个引物锚定在表面上，一个引物锚定在自由溶液中。

在一些实施方案中，固体载体包括图案化表面。“图案化表面”是指在固体载体的暴露层中或该暴露层上的不同区域的布置。例如，这些区域中的一个或多个区域可以是存在一种或多种扩增引物的特征部。特征部可由不存在扩增引物的间隙区域隔开。在一些实施方案中，图案可以为呈行和列形式的特征部的x-y格式。在一些实施方案中，图案可以为特征部和/或间隙区域的重复布置。在一些实施方案中，图案可以为特征部和/或间隙区域的随机布置。可用于本文所述的方法和组合物中的示例性图案化表面描述于美国专利号8,778,848、8,778,849和9,079,148，以及美国专利公布号2014/0243224中，这些专利中的每一者全文以引用方式并入本文。

在一些具体实施中，固体载体在表面中包括孔或凹陷的阵列。这可如本领域通常已知的那样使用多种技术来制造，这些技术包括但不限于光刻、压印技术、模制技术和微蚀刻技术。本领域的技术人员将会知道，所使用的技术将取决于阵列基板的组成和形状。

图案化表面中的特征部可以是玻璃、硅、塑料或其他合适的固体载体上的孔阵列中的具有图案化的共价连接的凝胶(诸如聚(N-(5-叠氮基乙酰胺基戊基)丙烯酰胺-共-丙烯酰胺)(PAZAM，参见例如美国专利公布号2013/184796、WO 2016/066586和WO 2015/002813，这些专利中的每一者全文以引用方式并入本文))的孔(例如，微孔或纳米孔)。该方法产生用于测序的凝胶垫，该凝胶垫在具有大量循环的测序运行中可为稳定的。聚合物与孔的共价连接有助于在多种用途期间以及在结构化基板的整个寿命期间将凝胶保持为结构化特征。然而，在许多实施方案中，凝胶无需共价连接到孔。例如，在一些条件下，未共价附着到结构化基板的任何部分的不含硅烷的丙烯酰胺(SFA，参见例如，美国专利号8,563,477，其全文以引用方式并入本文)可用作凝胶材料。

在特定实施方案中，结构化基板可通过以下方法来制作：将固体载体材料图案化为具有孔(例如，微孔或纳米孔)，用凝胶材料(例如，PAZAM、SFA或其化学改性的变体，诸如SFA的叠氮化版本(叠氮-SFA))涂覆图案化载体，并且例如通过化学或机械抛光来抛光已涂覆凝胶的载体，从而将凝胶保持在孔中，而从孔之间的结构化基板的表面上的间隙区域移除基本上所有凝胶或使基本上所有凝胶失活。引物核酸可附着到凝胶材料。然后可使靶核酸(例如，片段化的人基因组)的溶液与已抛光的基板接触，使得单个靶核酸将通过与附着到凝胶材料的引物的相互作用接种到单个孔中；然而，由于不存在凝胶材料或该凝胶材料失活，靶核酸将不占用间隙区域。靶核酸的扩增将被限制在孔中，因为间隙区域中不存在凝胶或凝胶失活会阻止生长的核酸群体(nucleic acid colony)的向外迁移。该过程便于制造、可规模化，并且可利用常规的微米或纳米制造方法。

虽然本公开涵盖其中仅一个扩增引物被固定(另一个引物通常存在于游离溶液中)的“固相”扩增方法，优选的是固体载体将被提供有固定的正向引物和反向引物两者。在实践中，将存在固定在固体载体上的“多个”相同正向引物和/或“多个”相同反向引物，因为扩增过程需要过量的引物来维持扩增。除非上下文另有指示，否则本文提到正向引物和反向引物均应当被解释为涵盖“多个”此类引物。

技术读者将会理解，任何给定的扩增反应都需要对待扩增的模板具有特异性的至少一种类型的正向引物和至少一种类型的反向引物。然而，在某些实施方案中，正向引物和反向引物可包括相同序列的模板特异性部分，并且可具有完全相同的核苷酸序列和结构(包括任何非核苷酸修饰)。换句话讲，可以仅使用一种类型的引物进行固相扩增，并且此类单引物方法涵盖在本公开的范围内。其他实施方案可使用包含相同模板特异性序列但在一些其他结构特征方面不同的正向引物和反向引物。例如，一种类型的引物可以包含在另一种类型的引物中不存在的非核苷酸修饰。

在本公开的所有实施方案中，用于固相扩增的引物优选地通过单点共价附接固定到引物5'端处或附近的固体载体，使得引物的模板特异性部分自由退火至其同源模板，而3'羟基则自由进行引物延伸。本领域已知的任何合适的共价附接方式均可用于此目的。所选择的附接化学将取决于固体载体的性质，以及对其应用的任何衍生化或官能化。引物本身可包含可为非核苷酸化学修饰的部分，以促进附接。在一个具体实施方案中，引物可包含5'端处的含硫亲核试剂，诸如硫代磷酸酯或硫代磷酸盐。就固体承载的聚丙烯酰胺水凝胶而言，该亲核试剂将与水凝胶中存在的溴乙酰胺基团结合。将引物和模板附着到固体载体的更具体的方式是经由5’硫代磷酸酯附着到包括聚合的丙烯酰胺和N-(5-溴乙酰氨基戊基)丙烯酰胺(BRAPA)的水凝胶，如WO 05/065814中充分所述，该专利全文据此以引用方式并入。

本公开的某些实施方案可利用包括惰性基板或基质(例如，载玻片、聚合物小珠等)的固体载体，该惰性基板或基质已例如通过施加包含反应性基团的中间材料层或涂层被“官能化”，该反应性基团允许共价附接到生物分子诸如多核苷酸。此类载体的示例包括但不限于负载在惰性基板诸如玻璃上的聚丙烯酰胺水凝胶。在此类实施方案中，生物分子(例如，多核苷酸)可直接共价附接到中间材料(例如，水凝胶)，但该中间材料本身可非共价附接到基板或基质(例如，玻璃基板)。术语“共价附接到固体载体”应相应地被解释为涵盖这种类型的布置。

可在小珠上扩增合并的样品，其中每个小珠包含正向扩增引物和反向扩增引物。在特定实施方案中，根据本公开的方面制备的模板文库用于通过固相扩增，更特别地通过固相等温扩增来制备核酸集落的成簇阵列，类似于美国专利公布号2005/0100900、美国专利号7,115,400、WO 00/18957和WO 98/44151中所述的那些，这些专利中的每一者全文据此以引用方式并入。术语“簇”和“集落”在本文中可互换使用，是指固体载体上包括多条相同的固定核酸链和多条相同的固定互补核酸链的离散位点。术语“簇阵列”是指由此类簇或群体形成的阵列。在该语境中，术语“阵列”不应当被理解为需要簇的有序布置。

术语“固相”或“表面”用于表示平面阵列，其中引物附着到平坦表面，例如玻璃、二氧化硅或塑料显微镜载片，或者类似的流通池装置；表示小珠，其中一个或两个引物附接到这些小珠并且这些小珠被扩增；或者表示在小珠已扩增后表面上的小珠阵列。

可使用如WO 98/44151(该专利全文据此以引用方式并入)中所述的热循环工艺或使温度保持恒定的工艺来制备簇阵列，并且使用改变试剂来执行延伸和变性的循环。此类等温扩增方法描述于WO 02/46456和美国专利公布号2008/0009420中，这些专利全文据此以引用方式并入。

应当理解，本文所述或本领域公知的任一种扩增方法可以与通用引物或目标特异性引物一起用于扩增固定的DNA片段。合适的扩增方法包括但不限于聚合酶链反应(PCR)、链置换扩增(SDA)、转录介导的扩增(TMA)和基于核酸序列的扩增(NASBA)，如美国专利第8,003,354号中所述，该专利全文以引用方式并入本文。上述扩增方法可用于扩增一种或多种感兴趣核酸。例如，可利用PCR(包括多重PCR)、SDA、TMA、NASBA等扩增固定化DNA片段。在一些实施方案中，在扩增反应中包括特异性针对所关注多核苷酸的引物。

其他合适的多核苷酸扩增方法可包括寡核苷酸延伸和连接、滚环扩增(RCA)(Lizardi等人，“Mutation Detection and Single-Molecule Counting UsingIsothermal Rolling-Circle Amplification,”Nat.Genet.19:225-232(1998年)，其全文据此以引用方式并入)和寡核苷酸连接测定(OLA)(通常参见美国专利号7,582,420、5,185,243、5,679,524和5,573,907，EP 0 320308B1，EP 0 336 731 B1，EP 0 439 182 B1，WO 90/01069，WO 89/12696和WO 89/09835，所有这些专利全文据此以引用方式并入)技术。应当理解，这些扩增方法可被设计成用于扩增固定化DNA片段。例如，在一些实施方案中，扩增方法可包括连接探针扩增或含有特异性针对所关注核酸的引物的寡核苷酸连接测定(OLA)反应。在一些实施方案中，扩增方法可包括引物延伸-连接反应，该引物延伸-连接反应含有特异性针对所关注核酸的引物。作为可被特别设计用于扩增感兴趣的核酸的引物延伸和连接引物的非限制性示例，扩增可包括用于GoldenGate测定(Illumina,Inc.,San Diego,CA)的引物，如美国专利号7,582,420和7,611,869所示例，这两个专利全文据此以引用方式并入。

在本公开的方法中可使用的示例性等温扩增方法包括但不限于多重置换扩增(MDA)，由例如Dean等人，“Comprehensive Human Genome Amplification Using MultipleDisplacement Amplification,”Proc.Natl.Acad.Sci.USA 99:5261-66(2002年)(其全文据此以引用方式并入)所例示的多重置换扩增(MDA)，或由例如美国专利号6,214,587(其全文据此以引用方式并入)所例示的等温链置换核酸扩增。可用于本公开的其他非基于PCR的方法包括：例如链置换扩增(SDA)，其描述于例如Walker等人，Molecular Methods forVirus Detection(Academic Press,Inc.，1995年)；美国专利号5,455,166和5,130,238，以及Walker等人，“Strand Displacement Amplification--An Isothermal,in Vitro DNAAmplification Technique,”Nucl.Acids Res.20:1691-96(1992年)，所有这些全文据此以引用方式并入，或超支化链置换扩增，其描述于例如Lage等人，“Whole Genome Analysisof Genetic Alterations in Small DNA Samples Using Hyperbranched StrandDisplacement Amplification and array-CGH,”Genome Res.13:294-307(2003年)，该文献全文据此以引用方式并入。等温扩增方法可与链置换Phi 29聚合酶或Bst DNA聚合酶大片段5'->3'exo-一起用于基因组DNA的随机引物扩增。这些聚合酶的使用利用了它们的高持续合成能力和链置换活性。高持续合成能力允许聚合酶产生长度为10kb-20kb的片段。如上所述，可使用具有低持续合成能力和链置换活性的聚合酶(诸如Klenow聚合酶)在等温条件下产生较小的片段。对扩增反应、条件和组分的附加描述在美国专利7,670,810的公开内容中详细阐述，该专利以引用方式全文并入本文。

可用于本公开的另一种多核苷酸扩增方法是带标签的PCR，其使用具有恒定5'区，接着是随机3'区的二结构域引物的群体，如例如Grothues等人，“PCR Amplification ofMegabase DNA With Tagged Random Primers(T-PCR),”Nucleic Acids Res.21(5):1321-2(1993年)中所述，该文献全文据此以引用方式并入。基于来自随机合成的3'区的单独杂交，进行第一轮扩增以允许大量启动热变性的DNA。由于3'区的性质，设想启动位点在整个基因组中是随机的。然后，可移除未结合的引物，并且可使用与恒定5′区互补的引物进行进一步的复制。

在一些实施方案中，可使用动力学排除扩增(KEA)来执行等温扩增，其也被称为排除扩增(ExAmp)。本公开的核酸文库可使用包括以下步骤的方法制成：使扩增试剂反应以产生多个扩增位点，该多个扩增位点各自包括来自已接种位点的单个靶核酸的扩增子的基本上克隆的群体。在一些实施方案中，扩增反应继续进行，直到生成足够数量的扩增子以填充相应扩增位点的容量。以这种方式将已接种的位点填充至容量抑制了靶核酸在该位点处着位和扩增，从而在该位点处产生扩增子的克隆群体。在一些实施方案中，在第二靶核酸到达该位点之前，即使扩增位点未被填充至容量，也可实现表观的克隆性。在一些条件下，第一靶核酸的扩增可进行到制备了足够数量的拷贝的点，以有效地超出或压倒来自被转运到位点的第二靶核酸的拷贝的产生。例如，在使用直径小于500nm的环形特征上的桥式扩增过程的实施方案中，已确定在第一目标核酸的14个指数扩增循环之后，相同位点处来自第二目标核酸的污染所产生的污染扩增子的数量将不足以对Illumina测序平台上的边合成边测序分析产生不利影响。

在特定的实施方案中，阵列中的扩增位点可以是但不必是完全克隆的。相反，对于一些应用，单个扩增位点可主要填充有来自第一目标核酸的扩增子，并且还可具有来自第二目标核酸的低水平的污染扩增子。只要污染水平对阵列的后续使用不具有不可接受的影响，阵列就可具有一个或多个具有低水平污染扩增子的扩增位点。例如，当阵列将用于检测应用时，可接受的污染水平将是不会以不可接受的方式影响检测技术的信噪比或分辨率的水平。因此，表观的克隆性通常将与通过本文所述的方法制备的阵列的特定用途或应用相关。对于特定应用，在单个扩增位点处可以是可接受的示例性污染水平包括但不限于至多0.1％、0.5％、1％、5％、10％或25％的污染扩增子。阵列可包括具有这些示例性水平的污染扩增子的一个或多个扩增位点。例如，阵列中高达5％、10％、25％、50％、75％或甚至100％的扩增位点可具有一些污染扩增子。应当理解，在位点的阵列或其他集合中，高达50％、75％、80％、85％、90％、95％或99％或更多的位点可为克隆的或在表观上克隆的。

在一些实施方案中，当过程以足够快的速率发生以有效地排除另一事件或过程发生时，可发生动力学排除。以制作核酸阵列为例，其中该阵列的位点用来自溶液的目标核酸随机接种，并且在扩增过程中生成目标核酸的拷贝以将每个接种位点填满。根据本公开的动力学排除方法，接种和扩增过程可在扩增速率超过接种速率的条件下同时进行。因此，在已由第一靶核酸接种的位点处产生拷贝的相对较快速率将有效地排除第二核酸使其不接种用于扩增的位点。动力学排除扩增方法可如美国专利申请公布号2013/0338042的公开内容中详细描述的那样来执行，该专利全文据此以引用方式并入。

动力学排除可以利用相对慢的速率来启动扩增(例如，以慢速率来制作目标核酸的第一拷贝)，与之相比，利用相对快的速率来制作目标核酸(或目标核酸的第一拷贝)的后续拷贝。在前一段落的示例中，由于目标核酸接种以相对慢的速率(例如相对慢的扩散或转运速率)发生，与之相比，扩增通过用核酸种子的拷贝填充位点以相对快的速率发生，因此出现了动力学排斥。在另一个示例性实施方案中，由于已在位点接种的目标核酸形成第一拷贝延迟(例如，活化延迟或缓慢)，与之相比，制作后续拷贝以填充该位点的速率相对较快，因此可以出现动力学排斥。在该示例中，各个位点可能已接种有几种不同的目标核酸(例如，几种目标核酸可能在扩增之前就存在于每个位点处)。然而，任何给定的靶核酸的第一拷贝形成可被随机激活，使得第一拷贝形成的平均速率与后续拷贝生成的速率相比相对较慢。在这种情况下，虽然单个位点可能已接种有若干不同的靶核酸，但动力学排除将只允许扩增这些靶核酸中的一个靶核酸。更具体地，一旦第一靶核酸已被激活用于扩增，则该位点将用其拷贝快速填充至容量，从而防止在该位点处制备第二靶核酸的拷贝。

扩增试剂还可包括促进扩增子形成并且在一些情况下提高扩增子形成速率的组分。一个示例是重组酶。重组酶可通过允许反复侵入/延伸来促进扩增子形成。更具体地，重组酶可促进通过聚合酶进行靶核酸的侵入以及通过该聚合酶进行的引物的延伸，该聚合酶使用靶核酸作为扩增子形成的模板。该过程可被重复作为链式反应，其中由每轮入侵/延伸产生的扩增子用作后续轮中的模板。由于不需要变性循环(例如，经由加热或化学变性)，因此该过程可比标准PCR更快速地发生。因此，重组酶促进的扩增可等温地进行。通常期望在重组酶促进的扩增试剂中包括ATP或其他核苷酸(或在一些情况下其非可水解的类似物)以促进扩增。重组酶和单链结合(SSB)蛋白的混合物是特别有用的，因为SSB可进一步促进扩增。用于重组酶促进的扩增的示例性制剂包括由TwistDx(Cambridge,UK)市售为TwistAmp试剂盒的那些制剂。重组酶促进的扩增试剂的可用组分和反应条件描述于美国专利号5,223,414和7,399,590中，这些专利中的每一者全文据此以引用方式并入。

可包括在扩增试剂中以促进扩增子形成并且在一些情况下提高扩增子形成速率的组分的另一个示例是解旋酶。解旋酶可通过允许扩增子形成的链式反应来促进扩增子形成。由于不需要变性循环(例如，经由加热或化学变性)，因此该过程可比标准PCR更快速地发生。因此，解旋酶促进的扩增可等温地进行。解旋酶和单链结合(SSB)蛋白的混合物是特别有用的，因为SSB可进一步促进扩增。用于解旋酶促进的扩增的示例性制剂包括来自Biohelle(Beverly,MA)的市售为IsoAmp试剂盒的那些制剂。此外，包括解旋酶蛋白的可用制剂的示例描述于美国专利号7,399,590和7,829,284中，这些专利中的每一者全文以引用方式并入本文。

可包括在扩增试剂中以有利于扩增子形成并且在一些情况下提高扩增子形成速率的组分的另一个示例是起点结合蛋白。

在测序中的用途

在衔接子-目标-衔接子分子附着于表面后，测定固定和扩增的衔接子-目标-衔接子分子的序列。测序可以使用任何合适的测序技术来进行，并且用于确定固定和扩增的衔接子-目标-衔接子分子的序列的方法(包括链再合成)是本领域已知的并且描述于例如美国专利号8,053,192、WO2016/130704、美国专利号8,895,249和美国专利号9,309,502中，所有这些专利全文据此以引用方式并入。

本文所述的方法可与多种核酸测序技术结合使用。特别适用的技术是其中核酸附接到阵列中的固定位置处使得其相对位置不改变并且其中该阵列被重复成像的那些技术。在不同颜色通道(例如，与用于将一种核苷酸碱基类型与另一种核苷酸碱基类型区分开的不同标记吻合)中获得图像的实施方案特别适用。在一些实施方案中，确定靶核酸的核苷酸序列的过程可以是自动化过程。优选的实施方案包括边合成边测序(“SBS”)技术。

SBS技术通常包括通过针对模板链反复加入核苷酸进行的新生核酸链的酶促延伸。在传统的SBS方法中，可在每次递送中在存在聚合酶的情况下将单个核苷酸单体提供给靶核苷酸。然而，在本文所述的方法中，可在递送中存在聚合酶的情况下向靶核酸提供多于一种类型的核苷酸单体。

SBS可利用具有终止子部分的核苷酸单体或缺少任何终止子部分的核苷酸单体。使用缺少终止子的核苷酸单体的方法包括例如焦磷酸测序和使用γ-磷酸标记的核苷酸的测序，如下文进一步详细描述的。在使用缺少终止子的核苷酸单体的方法中，在每个循环中加入的核苷酸的数目通常是可变的，并且该数目取决于模板序列和核苷酸递送的方式。对于利用具有终止子部分的核苷酸单体的SBS技术，终止子在使用的测序条件下可为有效不可逆的，如利用双脱氧核苷酸的传统桑格测序的情况，或者终止子可为可逆的，如由Solexa(现为Illumina,Inc.)开发的测序方法的情况。

如本文所公开的，核苷酸单体包括标记部分或染料标记，其经由核苷酸的5'多磷酸附着到核苷酸。因此，可基于以下项来检测掺入事件：标记的特性，诸如标记的荧光。在测序试剂中存在两种或更多种不同的核苷酸的实施方案中，不同的核苷酸可以是彼此可区分的，或者另选地，两种或更多种不同的标记在所使用的检测技术下可以是不可区分的。例如，测序试剂中存在的不同核苷酸可具有不同的标记，并且它们可使用适当的光学器件进行区分，如由Solexa(现为Illumina，Inc.)开发的测序方法所例示。

在将标记的核苷酸掺入阵列化核酸特征部的复合物中后，可以捕获图像。在特定实施方案中，每个循环涉及将四种不同的核苷酸类型同时递送到阵列，并且每种核苷酸类型具有在光谱上不同的标记。然后可获得四个图像，每个图像使用对四个不同标记中的一个标记具有选择性的检测通道。在络合条件期间，与基底结合的多核苷酸的下一个可用核苷酸互补的核苷酸可以与表面结合的多核苷酸、与基底结合的多核苷酸互补的引物或新生链、以及聚合酶形成复合物。络合条件允许形成复合物，但不解离附着到游离核苷酸的染料标记，因为动力学条件不利于5'多磷酸从核苷酸上的裂解以及核苷酸附着到与表面附着的多核苷酸互补的新生链的3'端。由染料标记发射的荧光或其他信号可以在络合条件期间被光学捕获。当随后转换到聚合条件时，核苷酸的5'多磷酸和附着的染料标记将通过聚合酶从核苷酸上裂解，因为核苷酸附着到与基底附着的多核苷酸互补的新生链的3'端。

在示例中，可顺序地添加不同的核苷酸类型，并且可在每个添加步骤之间获得阵列的图像。在此类实施方案中，每个图像将示出已掺入特定类型的核苷酸的核酸特征部。由于每个特征部的不同序列内容，不同特征部将存在于或不存在于不同图像中。然而，特征部的相对位置将在图像中保持不变。

在特定实施方案中，一些或所有核苷酸单体可包括可逆终止子。在此类实施方案中，可逆终止子/可裂解荧光团可包括经由3'酯键连接到核糖部分的荧光团(Metzker，“Emerging Technologies in DNA Sequencing,”Genome Res.15:1767-1776(2005年)，该文献全文以引用方式并入本文)。其他方法已经将终止子化学与荧光标记的裂解分开(Ruparel等人，“Design and Synthesis of a 3'-O-allyl Photocleavable FluorescentNucleotide as a Reversible Terminator for DNA Sequencing by Synthesis,”Proc.Natl.Acad.Sci.USA 102:5932-37(2005年)，该文献全文以引用方式并入本文)。Ruparel等人描述了可逆终止子的发展，这些可逆终止子使用小的3'烯丙基基团来封端延伸，但是可通过用钯催化剂进行的短时间处理来容易地去封端。荧光团经由可光裂解的接头附接到碱基，该可光裂解的接头可通过暴露于长波长紫外光30秒来容易地裂解。因此，二硫化物还原或光裂解可用作可裂解的接头。可逆终止的另一种方法是使用天然终止，该天然终止在将大体积染料放置在dNTP上之后接着发生。dNTP上存在带电大体积染料可通过空间位阻和/或静电位阻而充当高效的终止子。除非染料被移除，否则一个掺入事件的存在防止进一步的掺入。染料的裂解移除荧光团并有效地逆转终止。修饰的核苷酸的示例还描述于美国专利号7,427,673和7,057,026中，其公开内容全文以引用方式并入本文。

可与本文所述的方法和系统一起使用的附加示例性SBS系统和方法描述于美国专利公布号2007/0166705、2006/0188901、2006/0240439、2006/0281109、2012/0270305和2013/0260372，美国专利号7,057,026、WO 05/065814，美国专利公布号2005/0100900、WO06/064199和WO 07/010,251中，这些专利的公开内容全文以引用方式并入本文。

一些实施方案可使用少于四种不同标记来使用对四种不同核苷酸的检测。例如，可使用美国公布号2013/0079232的并入的材料中所述的方法和系统来执行SBS，该专利全文据此以引用方式并入。作为第一个示例，一对核苷酸类型可在相同波长下检测，但基于对中的一个成员相对于另一个成员的强度差异，或基于对中的一个成员的导致与检测到的该对的另一个成员的信号相比明显的信号出现或消失的变化(例如，通过化学改性、光化学改性或物理改性)来区分。作为第二个示例，四种不同核苷酸类型中的三种能够在特定条件下被检测到，而第四种核苷酸类型缺少在那些条件下可被检测到或在那些条件下被最低限度地检测到的标记(例如，由于背景荧光而导致的最低限度检测等)。可基于其相应信号的存在来确定前三种核苷酸类型掺入到核酸中，并且可基于任何信号的不存在或对任何信号的最低限度检测来确定第四核苷酸类型掺入到核酸中。作为第三示例，一种核苷酸类型可包括在两个不同通道中检测到的标记，而其他核苷酸类型在不超过一个通道中被检测到。上述三种例示性构型不被认为是互相排斥的，并且可以各种组合进行使用。组合所有三个示例的示例性实施方案是基于荧光的SBS方法，该方法使用在第一通道中检测到的第一核苷酸类型(例如，具有当由第一激发波长激发时在第一通道中检测到的标记的dATP)，在第二通道中检测到的第二核苷酸类型(例如，具有当由第二激发波长激发时在第二通道中检测到的标记的dCTP)，在第一通道和第二通道两者中检测到的第三核苷酸类型(例如，具有当被第一激发波长和/或第二激发波长激发时在两个通道中检测到的至少一个标记的dTTP)，以及缺少在任一通道中检测到或最低限度地检测到的标记的第四核苷酸类型(例如，不具有标记的dGTP)。

此外，如美国专利公布号2013/0079232的并入的材料中所述，测序数据可使用单个通道获得，该专利全文据此以引用方式并入。在此类所谓的单染料测序方法中，标记第一核苷酸类型，但在生成第一图像之后移除标记，并且仅在生成第一图像之后标记第二核苷酸类型。第三核苷酸类型在第一图像和第二图像中都保留其标记，并且第四核苷酸类型在两个图像中均保持未标记。

上述SBS方法可有利地以多种格式进行，使得同时操纵多个不同的目标核酸。在特定实施方案中，可在共同的反应容器中或在特定基板的表面上处理不同的目标核酸。这允许以多种方式方便地递送测序试剂、移除未反应的试剂和检测掺入事件。在使用表面结合的目标核酸的实施方案中，目标核酸可为阵列格式。在阵列格式中，目标核酸通常可以在空间上可区分的方式结合到表面。目标核酸可通过直接共价附着、附着到小珠或其他粒子或结合到附着到表面的聚合酶或其他分子来结合。阵列可包括在每个位点(也被称为特征部)处的目标核酸的单个拷贝，或者具有相同序列的多个拷贝可存在于每个位点或特征部处。多个拷贝可通过扩增方法(诸如，如下文进一步详细描述的桥式扩增或乳液PCR)产生。

本文所述的方法可使用具有处于多种密度中任一种密度的特征部的阵列，该多种密度包括例如至少约10个特征部/cm²、100个特征部/cm²、500个特征部/cm²、1,000个特征部/cm²、5,000个特征部/cm²、10,000个特征部/cm²、50,000个特征部/cm²、100,000个特征部/cm²、1,000,000个特征部/cm²、5,000,000个特征部/cm²或更高。

本文阐述的方法的优点是它们并行提供了对多个靶核酸的快速且有效检测。因此，本公开提供了能够使用本领域已知的技术(诸如上文所例示的那些)来制备和检测核酸的整合系统。因此，本公开的整合系统可以包括能够将扩增试剂和/或测序试剂递送到一个或多个固定DNA片段的流体部件，该系统包括诸如泵、阀、贮存器、流体管线等的部件。流通池在整合系统中可以被配置用于和/或用于检测靶核酸。示例性流通池描述于例如美国专利公布号2010/0111768和美国专利号8,951,781中，这些专利中的每一者全文以引用方式并入本文。如针对流通池所例示的，整合系统的一个或多个流体部件可以用于扩增方法和检测方法。以核酸测序实施方案为例，整合系统的一个或多个流体部件可以用于本文阐述的扩增方法以及用于在测序方法(诸如上文例示的那些)中递送测序试剂。另选地，整合系统可包括单独的流体系统以执行扩增方法并执行检测方法。能够产生扩增核酸并且还确定核酸序列的整合测序系统的示例包括但不限于MiSeq^TM平台(Illumina,Inc.,San Diego,CA)和在美国专利号8,951,781中所述的装置，该专利全文以引用方式并入本文。

在另一个方面，本公开提供试剂盒，该试剂盒包含(a)如本文所述的多个不同的单独核苷酸和(b)其包装材料。这种试剂盒可以包括(a)根据本文描述的那些的单独核苷酸，其中每个核苷酸可具有通过可裂解连接基与可检测标记连接的碱基，或者通过任选可裂解连接基与式Z的封端基团连接的可检测标记，并且其中连接到每个核苷酸的可检测标记可以在检测时与用于其他三个核苷酸的可检测标记区分开，以及(b)其包装材料。该试剂盒可包括用于将核苷酸掺入互补核苷酸链的酶和适于酶作用的缓冲液，以及用于移除封端基团和可检测标记的适当化学物质，该可检测标记可在同一化学处理步骤中移除。

应当理解，前述概念和本文更详细讨论的附加概念(假设此类概念不相互矛盾)的所有组合都被设想为是本文所公开的发明主题的一部分。具体地讲，出现在本公开末尾的要求保护的主题的所有组合都被设想为是本文所公开的发明主题的一部分。

在本公开中，参考了形成本公开的一部分的附图，并且在附图中通过图示的方式示出了可以实施的特定实施方案。详细描述这些实施方案以使本领域的技术人员能够实践本公开，并且应当理解，可利用其他实施方案，并且可在不脱离本公开的范围的情况下作出结构、逻辑和电改变。因此，下面对示例性实施方案的描述不应被理解为限制性的。

本公开可通过参考以下示例进一步说明。

实施例

以下实施例旨在说明，但决不旨在限制如在所附权利要求中阐述的本公开的范围。

实施例1–实现无痕SBS的测序化学。

此处，提出了能够实现无痕SBS的测序化学。在该方案中，一旦核苷酸和聚合酶与成簇的DNA结合，与模板链相对，但在实际核苷酸掺入之前，发生荧光信号的检测(图1A至图1F)。该方法使用受控催化，其中核苷酸的化学掺入被暂停足够长的时间或被完全阻止以便检测信号并调用正确的碱基。

在掺入之前，通过在核苷酸结合步骤中暂停来控制催化的能力在单分子测序中也可以是有用的，在单分子测序中，掺入动力学的高速可能导致错过调用，无论是通过短脉冲宽度还是短脉冲间距离。

在一个示例中，在非催化条件下，通过流通池的表面上的聚合酶-P/T复合物，携带染料标记的核苷酸基底发生稳定结合，随后洗掉溶液中过量的核苷酸。保持的非催化条件稳定核苷酸-聚合酶-P/T三元复合物，同时碱基由其相应染料标记识别，并且一旦实现信号检测(以及因此碱基调用)，系统通过交换溶液从非掺入条件切换到掺入条件。络合(例如，非催化)条件和聚合(例如，催化)条件的示例在本文中描述。在催化条件的存在下，DNA聚合酶将核苷酸掺入DNA，引起离去基团的解离，该离去基团携带荧光染料(图1A至图1F)。原则上，除了5’末端磷酸修饰外，可以使用含有3’可逆终止子(例如，AZM基团)的核苷酸，如目前在传统SBS中使用的。以这种方式，核苷酸掺入的精确控制有可能在每个循环中使每个DNA链能够延伸单个核苷酸，特别是在图1A至图1F中描述的另外的实施方案中。

无痕SBS循环的示意图在图1A至图1F中描绘。聚合酶与聚集在流通池表面的引物DNA结合(图1A)。携带5'-磷酸标记的核苷酸基底在控制催化的条件下引入，从而暂停聚合酶掺入动力学并将标记保留在5’磷酸上(图1B)。根据检测模式，结合后可以洗掉过量的基底。在一些实施方案中(特别是当过量基底在检测前未被洗掉时)，核苷酸可携带3'-嵌段以防止在引入催化条件时的多个核苷酸掺入事件。在催化之前，当核苷酸基底及其5’-磷酸标记仍然结合时，测量每个簇的信号(图1C)。流通池的条件被改变，使得催化可以被促进并且5’磷酸标记从簇释放(图1D)。再次，在核苷酸结合后不使用洗掉过量基底的实施方案中，3’-嵌段的存在在此处将是必需的，以仅实现单个延伸事件。所得DNA产物含有天然核苷酸(图1E)。一些实施方案采用具有3’-嵌段的核苷酸基底，在那些情况下，需要随后的去封端步骤来为随后的循环准备簇(图1F)。

为了能够小心地控制催化，可以使用多种方法。催化循环的暂停需要非掺入条件，其可由非催化金属(例如，Ca2+、Zn2+、Co2+、Ni2+、Eu2+、Sr2+、Ba2+、Fe2+、Eu2+以及它们的混合物)、非竞争性抑制剂、竞争性催化抑制剂、减缓或防治化学反应的核苷酸基底变化(非桥连硫醇或桥连氮、抑制剂标记)、在某些条件下减缓或防治化学反应的酶突变、溶剂添加剂(乙醇、甲醇、THF、二噁烷、DMA、DMF、DMSO)、D2O和它们的比例、pH和温度产生。

在信号检测之后，可以引入掺入条件，其洗掉非掺入条件并使得能够释放标记。包括Mn2+和/或Mg2+的催化金属将促进催化。

可包括可逆变构抑制剂或非竞争性聚合酶抑制剂。这可以通过控制染料标记从污染量的催化金属中释放来使得能够稳定形成三元复合物，来提供与包括3’可逆终止子类似的益处。使用变构/非竞争性抑制剂可能会“敲除”或减少催化作用，以免污染催化金属离子。附着的抑制剂的局部浓度将非常高，因此即使是其他的弱抑制剂也可以提供非常有效的抑制。推测使用各种策略可以克服抑制。例如，一种这样的抑制剂是pH依赖性的，因此与抑制一致的pH可与钙一起用于检测，然后该pH可随着催化金属如Mg2+的引入而变为非抑制状态。特别地，该抑制是pH依赖性的，并且可以通过Mg(II)离子以竞争方式释放，这表明静电相互作用对抑制是重要的，并且氨基糖苷类的结合位点与Mg(II)离子结合位点重叠。参见Thuresson等人，“Inhibition of Poly(A)Polymerase by Aminoglycosides,”Biochimie 89:1221-27(2007年)以及Ren等人，“Inhibition of Klemow DNA Polymeraseand poly(A)-Specific Ribonuclease by Aminoglycosides,”RNA 8:1393-400(2002年)，这两篇文献全文据此以引用方式并入。动力学分析表明，新霉素和卡那霉素家族的氨基糖苷类表现为混合非竞争性抑制剂。参见Thuresson等人，“Inhibition of Poly(A)Polymerase by Aminoglycosides,”Biochimie 89:1221-27(2007年)以及Ren等人，“Inhibition of Klemow DNA Polymerase and poly(A)-Specific Ribonuclease byAminoglycosides,”RNA 8:1393-400(2002年)，这两篇文献全文据此以引用方式并入。其他潜在的抑制剂包括焦磷酸盐类似物，诸如黑色素。

γ磷酸酯可以包括不可逆的抑制剂，并且在掺入后与聚合酶分子结合(使其失活)，同时产生锁定的三元复合物。例如，抑制剂可在掺入后结合到酶活性位点附近的半胱氨酸上。不可逆抑制也可作为3’-OH与引入的核苷酸之间的不可水解键的结果而发生。在这些情况下，标记被有效地转移至聚合酶或被阻止从掺入的核苷酸释放，从而允许在产生不解离的复合物的同时进行检测。在该实施方案中，可能需要苛刻的化学处理，随后进行聚合酶-P/T复合物再生，以完成循环并使随后的碱基能够被掺入。

本公开内还包括使用不附着到γ磷酸酯的抑制剂(非催化金属除外)来稳定催化前复合物形成。这些可以代替非催化金属使用，或除了非催化金属之外使用，以用于更完全的控制。例如，如上所讨论的，可以使用改变pH、氨基糖苷、焦磷酸盐类似物和黑色素。

这些策略可被扩展以实现无痕的单分子SBS系统。

Claims

1.一种方法，所述方法包括：

a)使聚合酶与模板多核苷酸和多个游离核苷酸接触，其中所述模板多核苷酸与互补多核苷酸杂交，所述互补多核苷酸包括由所述模板多核苷酸的5’末端片段悬垂的3’端，并且所述多个游离核苷酸包括式(I)的化合物：

其中R₁包括选自腺嘌呤、鸟嘌呤、胞嘧啶、胸腺嘧啶和尿嘧啶的含氮碱基；R₂由-O-R₂组成，其中R₂是H或Z，其中Z是包含叠氮基基团的可移除保护基团；R₃包括连接基，所述连接基包括三个或更多个磷酸基团；并且R₄包括荧光标记；

其中所述接触在络合条件下发生，所述络合条件有效地形成复合物但不会有效地形成聚合，其中所述复合物包括所述聚合酶、所述模板多核苷酸、所述互补多核苷酸以及与所述模板多核苷酸的所述5’末端片段的第一核苷酸互补的所述多个游离核苷酸中的一个游离核苷酸；

b)检测来自荧光标记的信号；以及

c)将所述复合物暴露于聚合条件。

2.根据权利要求1所述的方法，其中R₂由-O-R₂组成，其中R₂是Z，其中Z是包含叠氮基基团的可移除保护基团。

3.根据权利要求1所述的方法，其中所述模板多核苷酸是附着到基底的多个模板多核苷酸中的一个模板多核苷酸。

4.根据权利要求3所述的方法，其中附着到所述基底的所述多个模板多核苷酸包括文库多核苷酸的拷贝的簇。

5.根据权利要求1所述的方法，还包括：

重复步骤a)至c)一次或多次。

6.根据权利要求1所述的方法，其中所述聚合条件包括Mg²⁺离子的浓度，其中Mg²⁺离子的所述浓度在约0.1mM至约10mM的范围内；或Mn²⁺离子的浓度，其中Mn²⁺离子的所述浓度在约0.1mM至约10mM的范围内。

7.根据权利要求1所述的方法，其中所述络合条件包括非催化金属阳离子。

8.根据权利要求7所述的方法，其中所述非催化金属阳离子选自由Ca²⁺、Zn²⁺、Co²⁺、Ni²⁺、Eu²⁺、Sr²⁺、Ba²⁺、Fe²⁺和Eu²⁺中的一者或多者组成的组。

9.根据权利要求7所述的方法，其中所述非催化金属阳离子的所述浓度小于或等于约10mM。

10.根据权利要求1所述的方法，其中所述络合条件包括螯合剂。

11.根据权利要求10所述的方法，其中所述螯合剂选自由以下组成的组：乙二醇-双(β-氨基乙基醚)-N,N,N′,N′-四乙酸(EGTA)、次氮基乙酸、亚氨基二琥珀酸四钠、乙二醇四乙酸、聚天冬氨酸、乙二胺-N,N'-二琥珀酸(EDDS)、甲基甘氨酸二乙酸(MGDA)以及它们的组合。

12.根据权利要求10所述的方法，其中所述络合条件还包括选自由以下组成的组的抑制剂：非竞争性抑制剂、竞争性抑制剂以及它们的组合。

13.根据权利要求1所述的方法，其中所述络合条件包括小于约6的pH。

14.根据权利要求1所述的方法，其中所述聚合条件包括大于或等于约6的pH。

15.根据权利要求1所述的方法，其中所述络合条件包括非竞争性抑制剂。

16.根据权利要求15所述的方法，其中所述非竞争性抑制剂选自由以下组成的组：氨基糖苷、焦磷酸盐类似物、黑色素、膦酰基乙酸酯、次磷酸酯、利福霉素以及它们的组合。

17.根据权利要求1所述的方法，其中所述络合条件包括竞争性抑制剂。

18.根据权利要求17所述的方法，其中所述竞争性抑制剂选自由以下组成的组：阿非迪霉素、β-D-阿拉伯呋喃糖基-CTP、阿米洛利、脱氢阿霉素以及它们的组合。

19.根据权利要求1所述的方法，其中所述络合条件包括溶剂添加剂。

20.根据权利要求19所述的方法，其中所述溶剂添加剂选自由以下组成的组：乙醇、甲醇、四氢呋喃、二噁烷、二甲胺、二甲基甲酰胺、二甲基亚砜、锂、L-半胱氨酸以及它们的组合。

21.根据权利要求1所述的方法，其中所述络合条件包括氘。

22.根据权利要求2所述的方法，其中3’-羟基封端基团包括可逆终止子。

23.根据权利要求22所述的方法，其中所述可逆终止子包括叠氮甲基基团或缩醛基团。

24.根据权利要求22所述的方法，还包括：

在所述互补多核苷酸的所述3’端共价结合到所述连接基的磷酸基团后移除所述可逆终止子。

25.根据权利要求1所述的方法，其中所述游离核苷酸还包括非桥接硫醇或桥接氮。

26.根据权利要求1所述的方法，其中所述聚合酶包括突变。

27.根据权利要求26所述的方法，其中所述突变改变步骤a)至c)中的一者或多者的速度。