CN104593483A

CN104593483A - 选择和扩增多核苷酸的方法

Info

Publication number: CN104593483A
Application number: CN201410643372.6A
Authority: CN
Inventors: 安德里亚·萨博; 罗伯托·里加蒂; 敏-瑞·理查德·沈
Original assignee: Illumina Inc
Current assignee: Illumina Inc
Priority date: 2009-08-25
Filing date: 2009-08-25
Publication date: 2015-05-06
Anticipated expiration: 2029-08-25
Also published as: CN104593483B; HK1210229A1

Abstract

本发明提供了在固相载体上选择和扩增多核苷酸的方法，包括：提供固定在固相载体上的多个扩增寡核苷酸；将寡核苷酸探针群杂交至扩增寡核苷酸的亚群，每一个该寡核苷酸探针包含互补于该扩增寡核苷酸的第一部分和包含来自模板多核苷酸所选区域的序列的第二部分；进行延伸反应以延伸杂交的扩增寡核苷酸，产生结合载体的捕获寡核苷酸群，群中的每个捕获寡核苷酸包含互补于模板多核苷酸的所选区域的序列；将模板多核苷酸群施加至固相载体；延伸杂交至模板多核苷酸的结合载体的捕获寡核苷酸，从而产生互补于模板多核苷酸的延伸产物；扩增延伸产物以产生固相扩增产物。本申请的方法能够控制固相载体表面不同分子种类的密度。

Description

选择和扩增多核苷酸的方法

本申请是申请日为2009年8月25日，申请号为200980162143.X，发明名称为“选择和扩增多核苷酸的方法”的中国发明专利申请的分案申请。

技术领域

本发明涉及核酸扩增领域。更具体地说，本实施方案提供了在固相载体上选择核酸样本的一个或多个区域以及直接在固相载体上生长核酸聚类(cluster)同时消除对多样本滴定步骤的需要的方法。

背景技术

本申请中引用了若干公开物和专利文件以更加完整地描述本发明所属领域的状态。这些公开物和文件的各自全部公开内容被引入本文作为参考。

高通量核酸测序的许多方法依赖于通用的扩增反应，其中DNA样本被随机片段化，然后处理，使得不同片段的末端都包含相同的DNA序列。含有通用末端的片段然后可以使用单对扩增寡核苷酸在单一反应中扩增。在扩增前将片段库分离到单一分子水平确保扩增分子形成离散群落，之后可以对其进一步分析。此类分离可以在乳液中或在表面上进行。或者，可以设计对核酸样本的某部分具有特异性的扩增寡核苷酸，因而除去修饰样本末端的需求。

多核苷酸阵列基于“固相”核酸扩增而形成。例如，可以使用桥式扩增反应，其中固定在固相载体上的模板被扩增，扩增产物在固相载体上形成以形成包含核酸聚类或“克隆”的阵列。此类阵列上的各个聚类或克隆由多个相同的固定的多核苷酸链和多个相同的固定的互补多核苷酸链形成。这样形成的阵列在本文中一般被称作“聚类阵列”。

与其他数种扩增技术相同，固相桥式扩增使用正向和反向扩增寡核苷酸，其包括“模板特异性”核苷酸序列，它们在扩增反应退火步骤的条件下能够与待扩增的模板或其互补者中的序列退火。模板中在扩增反应条件下与引物退火的序列，在本文中可以被称作“引物结合”序列。

聚类方法的某些实施方案使用“通用的”引物来扩增可变的待扩增的模板部分，所述模板部分的5'和3'端与常用或“通用的”引物结合序列相接。“通用的”正向和反向引物包括能够与模板构建物中的“通用的”引物结合序列退火的序列。可变的模板部分或“靶”自身可以是已知、未知或部分已知的序列。这一方法具有的优点是不必为待扩增的各个靶序列设计特异性引物对；假使各个模板通过在其5'和3'端添加了相同的通用引物结合序列而被修饰，相同引物可被用来扩增不同的模板。因此，可变的靶序列可以是感兴趣的任意DNA片段。假使混合物中的各个模板分子通过添加相同的通用引物结合序列而被修饰，可以使用类似方法通过使用单对通用的正向和反向引物来扩增多模板(具有已知末端的靶)的混合物，例如多个靶核酸分子(例如基因组DNA片段)或靶核酸分子库。

此类PCR扩增特别是固相桥式扩增的“通用引物”法是有益的，因为它们使得相同或不同、序列已知或未知的多个模板分子能够在单个扩增反应中扩增，所述反应可以在具有单对“通用”引物的固相载体上进行。不同序列的模板的混合物的同时扩增，还可以使用多个引物对进行，每个引物对与混合物中的各独特模板互补。对模板的复杂混合物而言，为各个独立的模板生成多个引物对可能是繁琐且昂贵的。在某些应用(例如检测病毒或微生物感染的存在，或表征微生物群落)中，可能可以设计扩增寡核苷酸，使得仅有来自该微生物的核酸被扩增。

在聚类阵列的制备中，通常使用的模板浓度越高，在聚类阵列上产生的聚类密度将越高。如果聚类密度太高，可能难以单独地解析各个聚类，并可能形成重叠的克隆。可以进行滴定来确定最佳模板浓度，以在阵列上达到最佳聚类密度，其中的各个聚类可以单独被解析。但是，此类滴定可导致聚类密度太高或太低引起的有价值流通池(flow cell)通道的损失、模板样本损失、需要的试剂量增加、或样本处理时间增加。

因此，对控制和达到所需聚类密度的方法存在需求，其不依赖于原始核酸样本浓度而且避免了核酸滴定步骤。本发明满足了这一需求，而且还提供了其他优点。

发明内容

本发明在某些实施方案中提供了选择和扩增多核苷酸的方法。该方法可包括(a)提供具有多个模板多核苷酸的核酸样本；(b)提供固定在固相载体上的多个寡核苷酸，其中所述多个寡核苷酸包括(i)多个捕获寡核苷酸，每个捕获寡核苷酸具有能够与所述核酸样本的选定区域杂交的不同序列，和(ii)多个扩增寡核苷酸，其中所述捕获寡核苷酸以比所述扩增寡核苷酸低的密度固定；(c)在使得所述模板多核苷酸选择性地与所述捕获寡核苷酸杂交的条件下，将所述模板多核苷酸加至所述固相载体；(d)延伸所述捕获寡核苷酸，以生成与所述模板多核苷酸互补的延伸产物；和(e)使用固定在所述固相载体上的一个或多个扩增序列扩增该延伸产物。

在一特定方面，本发明提供了控制在固相载体上形成的扩增的单链多核苷酸的序列和克隆密度的方法。该方法可以包括以下步骤：(a)提供多个模板多核苷酸；(b)提供固定在固相载体上的多个(至少三个)寡核苷酸，其中至少一个寡核苷酸是能够与所述模板多核苷酸杂交的捕获寡核苷酸，而且至少两个寡核苷酸是不能与所述模板多核苷酸杂交的扩增寡核苷酸，其中所述捕获寡核苷酸以比所述扩增寡核苷酸低的密度固定，而且所述捕获寡核苷酸对所述多个模板多核苷酸中的一部分具有选择性；(c)在合适的条件下将所述模板多核苷酸加至固相载体，使得所述模板多核苷酸分子选择性地与所述捕获寡核苷酸杂交；(d)使用核酸聚合酶延伸所述捕获寡核苷酸，以生成与所述单链模板多核苷酸互补的双链延伸产物；(e)变性所述双链延伸产物，以从所述延伸产物中除去杂交的单链多核苷酸模板分子，以产生固定在所述固相载体上的单链模板分子；和(f)使用固定在所述固相载体上的两个或多个扩增寡核苷酸，扩增固定在所述固相载体上的单链模板分子；其中所述固定的克隆的密度被所述捕获寡核苷酸的密度而不是所述单链模板多核苷酸的浓度所控制。

本发明在某些实施方案中还提供了均匀移植了多个寡核苷酸的流通池，其中所述多个包含具有不同序列的四种寡核苷酸，其中四种中的两种(例如第一和第二种)的存在密度低于其他两种(例如第三和第四种)。

附图说明

图1显示了本发明的方法，其中捕获寡核苷酸比扩增寡核苷酸长，而且模板选择性地与延伸到扩增寡核苷酸之外的捕获寡核苷酸杂交。捕获寡核苷酸相对于模板链进行延伸，变性并除去模板链。固定的模板拷贝可以与固定的扩增寡核苷酸之一杂交，且扩增寡核苷酸可以延伸。捕获寡核苷酸还包含对应于扩增寡核苷酸之一的序列，因此通过从固定的模板拷贝合成双螺旋，固定的双螺旋的两端可同时包含与扩增寡核苷酸之一互补的序列。

图2显示了制备适合扩增的单链模板库的示例性方法。

图3显示了本发明的示例性方法，其中，初始时，扩增寡核苷酸之一被封闭以阻止进行链的延长。在固定的模板链延伸后，除去封闭，样本可以进行桥式扩增循环。

图4显示了带有两种不同的固定扩增寡核苷酸和一种捕获寡核苷酸的示例性的固相载体。

图5显示了核酸样本片段化为包含选定靶区域的多个多核苷酸。通过片段化，一些片段包含靶区域，从而为随后的捕获提供模板，而其他片段不包含靶区域，因此不能成为模板。片段可在一端与转接子连接。转接子可与载体上的扩增寡核苷酸之一互补或相同。

图6显示了来自图5的模板多核苷酸样本与载体的杂交。样本通过靶区域与捕获寡核苷酸杂交，样本中剩下的不含靶区域的分子未杂交，且可从载体上被洗掉。载体上捕获的分子可用作模板多核苷酸。

图7显示了已捕获了来自图6的模板多核苷酸的捕获寡核苷酸可以延伸，以生成与模板多核苷酸互补的延伸产物。模板多核苷酸可以被变性。如果模板携带转接子序列，转接子序列作为延伸的一部分被复制。如果转接子序列的拷贝与扩增寡核苷酸互补，可以使用载体上的扩增寡核苷酸来扩增延伸产物。

图8显示了使用16S核糖体RNA测序来分析微生物群落的试验。载体上的捕获寡核苷酸被显示为对细菌16S核糖体RNA基因的两个恒定区域(8F和553R)具有选择性。这两种引物可用来扩增大约1500个碱基对的基因的大约500个碱基对，而且包括V1、V2和V3可变区域。通过延伸P5和P7扩增寡核苷酸而生成捕获寡核苷酸。然后使用捕获寡核苷酸从样本中特异性地捕获16S rRNA基因的片段。然后延伸捕获寡核苷酸。通过使用扩增寡核苷酸的固相扩增，各个延伸的捕获寡核苷酸可被转换成聚类。由于各个微生物具有特征性的16S基因序列，基于被捕获和测序的不同16S RNA区域，对聚类的测序将提供关于微生物群落成员的信息。

具体实施方式

在某些实施方案中，本发明涉及选择在表面上衍生的不同分子种类并控制其密度的方法。在具体实施方案中，分子种类是具有不同序列的核酸。本发明对于控制在固相载体上产生的核酸聚类的密度特别有用。这些方法的优点在于降低乃至消除了对用于控制表面上的分子密度的多个样本滴定步骤的需求。本发明的另一个优点是能够通过与捕获寡核苷酸的序列选择性杂交来选择核酸样本的一部分。

本文阐述的方法可以与在美国申请12/395229中描述的方法一起使用，包括例如通过使用固相载体上的捕获寡核苷酸来控制聚类密度的方法。在具体实施方案中，本文阐述的方法包括使用捕获寡核苷酸来选择核酸样本亚群，并因此同时控制载体上的聚类序列和聚类数目或密度。

在其中表面用核酸衍生化供随后形成扩增聚类的实施方案中，载体上的聚类密度可以被用来捕获模板样本的其中一种固定引物的密度所控制。每块芯片上的引物密度可以在制造期间简单地通过捕获寡核苷酸与扩增寡核苷酸的比例来控制，且因此聚类密度可以不依赖于模板样本的浓度或稀释度。例如，可以使用如下条件，其中模板样本相对于引物摩尔过量，使得即使模板浓度进一步增加，聚类密度也将基本相同。这一浓度独立性除去了精确测量双链模板初始浓度的需求，而且不依赖于样本的精确稀释。通过控制附着在芯片表面上的捕获寡核苷酸和扩增寡核苷酸的比例和浓度，可以使得多个芯片上的聚类密度基本均一。因为与源自不同生物源的模板样本相比，引物通常在更加可控的条件下被合成和操作，本文阐述的方法在聚类阵列的创建中提供了增加的可重复性。通过创建具有所需比例的引物库提供进一步的益处，所述引物库可被重复使用以创建具有可重现密度的多个聚类阵列。

依照本文阐述的方法，多个寡核苷酸可被固定到固相载体上。多个可包括不同种类的寡核苷酸分子，其各自具有不同的序列。例如，多个寡核苷酸可包括至少两种不同的、至少三种不同的、至少四种不同的或更多个不同的寡核苷酸，其中第一种具有与多个中的其他各种不同的序列。要理解的是，不同种类的寡核苷酸可以具有一段相同的序列，只要不同种类的至少一部分之间存在序列差异。例如，如图3中所示，被标识为P5'和P5'Hyb封闭的两个种类具有一段相同的序列，但是P5'Hyb封闭这个种类具有在P5'种类中不存在的额外的发夹形成序列。

本文使用的术语“固定”意在涵盖与固相载体通过共价或非共价键直接或间接的附着。在本发明的某些实施方案中，可以使用共价附着，但一般而言，所要求的仅是分子(例如核酸)在打算使用载体的条件下(例如在需要核酸扩增和/或测序的应用中)仍然固定或附着在载体上。通常，将被用作捕获寡核苷酸或扩增寡核苷酸的寡核苷酸被固定，使得3'端可用于酶促延伸，而且序列的至少一部分能够与互补序列杂交。固定可以通过与表面附着的寡核苷酸杂交而发生，在该情况下固定的寡核苷酸或多核苷酸可以处于3'-5'方向。或者，固定可以通过碱基配对杂交以外的手段发生，例如上面阐述的共价附着。

本文使用的术语“固相载体“指分子可以与其附着的任意不溶的底物或基质，例如乳胶珠、葡聚糖珠、聚苯乙烯表面、聚丙烯表面、聚丙烯酰胺凝胶、黄金表面、玻璃表面和硅片。固相载体可以是平坦的玻璃表面。固相载体可以被安装在流通池内部，以允许各种试剂溶液相互作用。

在某些实施方案中，固相载体可包含已被“官能化”的惰性底物或基质，例如通过添加一层或一涂层中间材料，所述中间材料包含允许与分子例如多核苷酸共价附着的反应基团。作为非限制性实例，此类载体可包括在惰性底物例如玻璃上的聚丙烯酰胺水凝胶层。在此类实施方案中，分子(例如多核苷酸)可以直接共价附着到中间层(例如水凝胶)上，但是中间层自身可能非共价地附着于底物或基质(例如玻璃底物)的其他层。因此，对固相载体的共价附着应被解释为涵盖此类设计。

“引物寡核苷酸”或“扩增寡核苷酸”是在扩增反应的引物退火步骤中遇到的条件下能够特异性地与待扩增的单链多核苷酸序列退火的寡核苷酸序列。一般地，术语“核酸”、“多核苷酸”和“寡核苷酸”在本文中可交换使用。除非另外特别指出，不同的术语并不意在表示大小、序列或其他性质有任何特殊差异。为了描述的清楚起见，当描述包含数种分子的具体方法或组合物时，所述多个术语可以被用来区分不同种分子。

待复制或扩增的多核苷酸序列在本文中一般被称作“模板”。模板可以包含位于待扩增的模板序列侧翼的引物结合位点。与捕获寡核苷酸杂交的模板可包含以一定方式延伸超出捕获寡核苷酸的5'端的碱基，该方式使得不是所有的模板都适于延伸。在具体实施方案中，如下面进一步详细阐述的，多个模板多核苷酸包含不同种类多核苷酸，其模板序列不同，但不同种类中的两种或更多个具有相同的引物结合位点。位于具体模板序列侧翼的两个引物结合位点可具有相同的序列，例如回文序列或同聚物序列；或者两个引物结合位点可以具有不同的序列。因此，多个不同的模板多核苷酸在模板序列的每端可以具有相同的引物结合序列或两种不同的引物结合序列。因此，多个模板多核苷酸中的各种类多核苷酸可以包含处于待评估(通过例如测序)的未知序列区域侧翼的已知序列区域。模板多核苷酸可以携带单一转接子(adaptor)，以仅在单一末端充当引物结合序列。在模板在单一末端携带转接子的情况下，该末端可以是3'端或5'端。模板多核苷酸可以不含任何转接子地使用，在该情况下，引物结合序列直接来自核酸样本中存在的序列。

扩增反应一般使用至少两个扩增寡核苷酸，通常表示为“正向”和“反向”引物。扩增寡核苷酸一般是单链多核苷酸结构。它们也可以包含天然或非天然碱基的混合物，以及天然和非天然骨架连接，至少在一些实施方案中，其前提是任意非天然的修饰没有永久地或不可逆地消除作为引物的功能，该功能被定义为在延伸或扩增反应条件期间与模板多核苷酸链退火的能力和充当与退火的模板链互补的新多核苷酸链的合成起始点的能力。也就是说，在某些实施方案中，本发明可以涉及使用引物亚群，正向的或反向的，所述引物已被修饰而无法与模板多核苷酸链杂交，而所述修饰在某一点被改变或逆转，使得杂交不再被妨碍。

此外，引物可以包含非核苷酸化学修饰，例如来促进引物对固相载体的共价附着。某些化学修饰自身可以改善分子作为引物的功能，或者可以提供其他一些有用的功能，例如提供裂解位点，其使得引物(或者源自引物的延伸多核苷酸链)能够从固相载体上裂解下来。有用的化学修饰还可以提供可逆的修饰，其阻止引物的杂交或延伸，直到修饰被除去或逆转。类似地，依照本发明附着于表面的其他分子，可以包括可裂解的连接子部分和/或改变分子功能的特定化学活性的可逆的修饰。

本文阐述的方法中使用的多个寡核苷酸可以包括作为捕获寡核苷酸发挥作用的种类。捕获寡核苷酸可以包含“模板特异性部分”，即能够与感兴趣的(例如待扩增的)多核苷酸分子中核酸样本的选定区域退火的核苷酸序列。捕获寡核苷酸可包含对核酸样本中的分子亚群具有特异性的序列。因此，在这些和相关的实施方案中，样本中仅有一分子亚群可以被捕获寡核苷酸选择成为模板多核苷酸。捕获寡核苷酸可以包含单种寡核苷酸，或可以包含两种或更多个具有不同序列的寡核苷酸。因此，捕获寡核苷酸可以是两种或更多个序列、10种或更多个序列、100种或更多个序列、1000种或更多个序列、或者10000种或更多个序列。引物结合序列一般将是已知序列，而且将因此与单链多核苷酸分子的已知序列的区域互补。捕获寡核苷酸可以包含捕获寡核苷酸和扩增寡核苷酸。例如，如图1中所示，捕获寡核苷酸的长度可以比附着在相同底物上的扩增寡核苷酸更长，在该情况下捕获寡核苷酸的5'端可包含与扩增寡核苷酸之一序列相同的区域。模板的一部分，例如模板的3'端，可以与捕获寡核苷酸的3'互补。模板的5'端可以包含含有与扩增寡核苷酸之一相同的序列的区域，使得复制模板时，其拷贝可以与固定的扩增寡核苷酸杂交。因此，在本文阐述的方法中有用的寡核苷酸种类，可以含有捕获寡核苷酸、扩增寡核苷酸、或两者。相反地，寡核苷酸种类可以缺乏捕获寡核苷酸、扩增寡核苷酸、或两者。以这种方式，一种寡核苷酸的杂交特异性可以根据方法的具体应用而调整。

引物结合序列的长度不需要与已知序列的多核苷酸模板分子的长度相同，在某些实施方案中可短一些，例如，具体为16-50个核苷酸，更具体为16-40个核苷酸，再具体为20-30个核苷酸的长度。引物寡核苷酸的所需长度将取决于许多因素。但是，引物通常应足够长(复杂)，使得其与引物结合序列以外的序列退火的可能性十分低。因此，模板序列侧翼的已知序列可以包含引物结合部分和其他部分，例如捕获寡核苷酸、标签序列或其组合。

当与核酸联用时，“固相扩增”指在固相载体上进行的或与固相载体有关的任意核酸扩增反应。通常，全部或部分扩增产物通过固定引物的延伸而合成。尤其是，术语涵盖了与标准液相扩增类似的固相扩增反应，差别仅在于至少一种扩增寡核苷酸被固定在固相载体上。

技术人员将意识到，指定的核酸扩增反应可以用对待扩增的模板具有特异性的至少一种正向引物和至少一种反向引物来进行。但是，在某些实施方案中，正向和反向引物可以包含具有相同序列的模板特异性部分。也就是说，仅使用一种引物来进行固相扩增是可能的，且此类单引物方法被包含在本发明范围内。该一种引物可包括(a)修饰过的引物亚群，所述引物已被修饰而无法与模板多核苷酸链杂交，且所述修饰在某一点被除去、改变或逆转，使得杂交不再被阻碍。其他实施方案可以使用包含相同模板特异性序列但一些结构特征不同的正向和反向引物。例如，一种引物可以包含在另一引物中不存在的非核苷酸修饰。在又一个实施方案中，模板特异性序列是不同的，而且在线性扩增方法中仅使用一种引物。在本发明的其他实施方案中，正向和反向引物可以包含具有不同序列的特异性部分。

在本发明的某些实施方案中，供固相扩增的扩增寡核苷酸，通过共价附着在引物的5'端或其附近，而被固定到固相载体上，使得引物的一部分自由地与其同源模板退火，而且3'羟基自由地在引物延伸中起作用。再一次地，在某些实施方案中，提供了修饰过的引物亚群，其被阻止进行杂交和/或延伸，直到修饰被除去、逆转或改变。在具体实施方案中，扩增寡核苷酸将不能与初始单链模板杂交。在此类实施方案中，单链模板的杂交将对捕获寡核苷酸而言通常是特异性的，使得表面上的捕获寡核苷酸量决定了被捕获的模板量并因此决定了产生的扩增聚类的密度。

选择性附着化学将通常取决于固相载体的性质以及对其应用的任何官能化或衍生化。在核酸实施方案的情况下，引物自身可包含可以是非核苷酸化学修饰的部分以促进附着。例如，引物可以在5'端包括含硫的亲核物质，例如磷硫酰或硫代磷酸。在固相承载的聚丙烯酰胺水凝胶的情况下，这一亲核物质可以与水凝胶中存在的溴乙酰胺基团结合。在一个实施方案中，将引物附着到固相载体上的手段是通过5'磷硫酰附着到由聚丙烯酰胺和N-(5-溴乙酰胺基戊基)丙烯酰胺(BRAPA)组成的水凝胶上。

可以通过将寡核苷酸的溶液耦合(移植)到固相载体上而形成均匀同质分布的固定寡核苷酸“坪”。溶液可以包含寡核苷酸的同质群落，但是典型地将包含不同寡核苷酸种类的混合物。混合物可以包含例如至少两种、三种或更多个不同的寡核苷酸。暴露于溶液的各个表面因此与溶液反应，在整个暴露的固相载体上创造均匀密度的固定序列。由此，具有不同固定序列的混合物的表面的一部分可以被具有相同固定序列的混合物的表面区域包围。扩增寡核苷酸的合适密度，是至少1fmol/mm²(6x 10¹⁰/cm²)，或更佳地至少10fmol/mm²(6x 10¹¹/cm²)。可以控制捕获寡核苷酸的密度以得到10⁶-10⁹聚类/cm²的最佳聚类密度。捕获寡核苷酸种类与扩增寡核苷酸种类的比例可以为任意所需值，包括但不限于至少1:100、1:1000或1:100000，取决于所需的聚类密度和辉度。在核酸以外的分子附着于表面的实施方案中，可以使用类似密度或比例的其他分子种类。

捕获寡核苷酸可以与扩增寡核苷酸在同一时间被放置在固相载体上。或者，特别是在模板多核苷酸不携带扩增寡核苷酸的互补序列的状况下，捕获寡核苷酸可以使用仅携带扩增寡核苷酸的固相载体，使用捕获寡核苷酸的拷贝作为模板，通过延伸扩增寡核苷酸的一部分而产生。例如，可以制备寡核苷酸探针群，其包含扩增寡核苷酸中的一种的互补序列，和延伸到扩增寡核苷酸以外的序列。这一寡核苷酸群可以在足够低的密度与载体上的扩增寡核苷酸杂交，在该密度，载体上的仅一部分扩增寡核苷酸成为杂交的。例如，杂交的分子可能是可单独解析的，这样相邻分子间的平均距离足够大，令两个分子可以通过光学显微镜分开地检测。具有杂交分子的扩增寡核苷酸部分然后可以经历延伸，例如使用聚合酶和三磷酸核苷。这具有优点：捕获寡核苷酸可以由仅包含扩增寡核苷酸的标准常见固相载体产生，即，可以制备相同的固相载体供在所有应用中使用，不需要为每次捕获寡核苷酸的序列改变而制造不同的载体；而且捕获寡核苷酸单独设计并添加到载体上。

以前，通过改变施加到载体的模板多核苷酸分子浓度来控制附着的单链多核苷酸分子密度和因此的聚类密度。通过使用如本文所述的修饰的引物或捕获寡核苷酸，可控制扩增阵列上的聚类密度而不依赖于对施加到固相载体的模板多核苷酸链的起始浓度的仔细滴定。这具有显著的优点：该方法不需要依赖于精确的浓度测量和模板多核苷酸分子的稀释，因此引起可靠性的增加、稀释错误的减少、和时间及在下游过程中需要的试剂量的减少。对每个包含太多或太少聚类的固相载体，生成的供聚类分析的数据量存在减少。这意味着生成需要的样本覆盖深度可能需要额外的分析运行，而如果聚类密度最佳化，这本来是不必要的。太多的聚类引起光饱和以及两个扩增分子之间的重叠增加；太少的聚类得到不想要的大量不生成任何数据的暗区，因而浪费了试剂，这些试剂和密集填充的表面一起使用将更有效。

在一具体实施方案中，对于各个聚类，单链多核苷酸模板分子的固定的互补拷贝通过杂交和引物延伸的方法附着到固相载体上。通过Watson-Crick碱基配对，在互补序列间形成稳定双螺旋的杂交方法是本领域已知的。固定的捕获寡核苷酸可以包含序列区域，其与单链模板多核苷酸分子的区域或模板特异性部分互补。然后可以进行延伸反应，其中通过依次添加核苷酸延伸捕获寡核苷酸，以生成通过捕获寡核苷酸附着在固相载体上的单链多核苷酸序列的互补拷贝。没有固定到载体上的单链多核苷酸序列可以在变性条件下与互补的序列分离，并通过例如洗涤被除去。

当与核酸链联用时，术语“分离”指在例如单链多核苷酸序列及其补体的Watson-Crick DNA-双螺旋内相互作用的DNA碱基的物理分离。术语还指这些链的物理分离。因此，术语可以指创建一种状况的过程，在该状况下另一种引物寡核苷酸或多核苷酸序列与双螺旋的一条链的退火成为可能。第一次延伸反应后，双螺旋通过单一的5'附着而被固定，因此链分离可引起一条链从表面丧失。在双螺旋的两条链都被固定的情况下，链的分离指双螺旋被转换成两条固定的单链。

在本发明的一个方面，可以修饰一个或多个扩增寡核苷酸以阻止单链多核苷酸分子的区域或模板特异性部分的杂交。可替换地或另外地，可以修饰一个或多个扩增寡核苷酸以阻止引物在一个或多个延伸反应期间延伸，因此阻止了杂交的模板的复制。这些修饰可以是暂时的或永久的。

一般地，捕获寡核苷酸将包含与多个扩增寡核苷酸相同序列的区域。一旦延伸的固定模板拷贝的3'端已经与一种扩增寡核苷酸杂交并延伸，得到的双螺旋将在两端被固定，而且捕获寡核苷酸序列中的所有碱基将被复制。因此捕获寡核苷酸可包含扩增寡核苷酸序列，以及与模板的末端或中央区域互补的额外序列。典型地，与模板互补的序列将不存在于任何扩增寡核苷酸中。或者，扩增寡核苷酸可包含与模板互补的序列，但是扩增寡核苷酸可以被可逆地封闭，以阻止在一个或多个延伸步骤期间的杂交和/或延伸，例如在一具体扩增过程中的第一个延伸步骤期间。

依照本发明的一个方面，一个或多个扩增寡核苷酸可包含修饰，该修饰对模板的杂交或延伸或两者同时充当可逆的封闭。作为非限制性实例，此类修饰可以被显示为存在与扩增寡核苷酸互补的额外核苷酸序列。这一额外序列可以存在于扩增寡核苷酸的一部分中，并因此成为分子内的发夹双螺旋；或者可以是阻止引物延伸的3'封闭基团。或者，该额外序列可以存在于与扩增寡核苷酸杂交的分离的寡核苷酸上。此类修饰的一具体特征是它可以被除去、改变或逆转，使得修饰过的引物寡核苷酸的功能恢复，引物能够在所述方法之后的步骤中经历杂交和延伸。在其他实例中，封闭基团可以是小的化学物类例如3'磷酸部分，其可以被酶去除；可以是脱碱基的核苷酸，使得引物的3'端不能杂交(和因而延伸)；或者可以是可选择性地从固定的链中切除的核苷酸序列，例如，使用选择性裂解特定序列的限制性内切酶，或者选择性裂解含外源碱基(例如尿嘧啶脱氧核苷酸或8-氧代鸟嘌呤)的寡核苷酸的去糖基化酶(deglycosylase)。

在一个实施方案中，三个类型的多个寡核苷酸(例如包含捕获寡核苷酸、正向和反向扩增寡核苷酸)被固定到固相载体上。或者，三种寡核苷酸可以为正向扩增、被封闭的正向扩增和反向扩增，其中未被封闭的正向引物充当捕获寡核苷酸。

核酸样本可以是双链或单链的。为了获得有效的杂交，双链样本可以被变性，以形成单链多核苷酸分子。单链多核苷酸分子可以源于单链形式，如DNA或RNA，或者可以源于双链DNA(dsDNA)形式(例如基因组DNA片段、PCR和扩增产物等)。因此，单链多核苷酸可以是多核苷酸双螺旋的正义或反义链。使用标准技术制备适合在本发明的方法中使用的单链多核苷酸分子的方法是本领域熟知的。在本文阐述的方法的不同步骤期间，原始多核苷酸分子的精确序列可以是已知或未知的。要理解的是，双链多核苷酸分子可以如本文对单链多核苷酸分子示例的那样，与固定的捕获寡核苷酸杂交，只要双链多核苷酸的单链区域是可得到的而且与捕获寡核苷酸序列互补。

分离双链分子构建物的一条链的示例性方法，在图2中显示。未知序列的样本可以被片段化，向各个片段的末端附着转接子。转接子的一条链可以包含供表面固定的部分，例如可以是可被捕获到链霉亲和素表面上的生物素。转接子可以是错配的转接子，例如在未决的申请US 2007/0128624中所描述的，其内容全部引入本文作为参考。错配或分叉的转接子的扩增，使用一对扩增寡核苷酸，其中的一个携带生物素修饰，意味着每个双螺旋的一条链携带生物素修饰。链向链霉亲和素表面的固定意味着未生物素化的链可以通过变性/链分离简单洗脱。洗脱的构建物将处于单链形式，而且当暴露于杂交条件时可以用来针对可以延伸的固定的捕获寡核苷酸杂交。

在具体实施方案中，单链多核苷酸分子是DNA分子。更具体地，单链多核苷酸分子代表基因组DNA分子，或其扩增子，包括内含子和外显子序列(编码序列)，以及非编码调节序列，例如启动子和增强子序列。更具体地，单链多核苷酸分子是人基因组DNA分子，或其扩增子。

在具体实施方案中，核酸分子可以从包含不同生物的混合物的生物样本中分离。例如，样本可以包含或包括不同细菌或病毒的混合物，例如可以存在于个体生物的细胞、组织或体液中，在某些实施方案中个体生物可以是人或其他脊椎动物。为了了解样本中存在什么微生物，“微生物组(microbiome)”——细菌特异性的样本区域可以被测序，例如来自DNA样本的16S核糖体RNA基因区域。因此扩增寡核苷酸或捕获寡核苷酸可以选择性地针对在所有细菌的16S rRNA基因区域中找到的恒定区域之一或在不同的真核生物中常见的18S基因区域。

本文描述的方法的一个实施方案可以用来对任意细菌的细菌16S核糖体基因选择和形成聚类。合适的细菌可以包括(但不打算限于)鲍氏不动杆菌(Acinetobacter baumannii)、龋齿放线菌(Actinomyces odontolyticus)、蜡样芽胞杆菌(Bacillus cereus)、普通拟杆菌(Bacteroides vulgatus)、拜氏梭菌(Clostridiumbeijerinckii)、耐辐射奇异球菌(Deinococcus radiodurans)、粪肠球菌(Enterococcus faecalis)、大肠杆菌(Escherichia coli)、幽门螺杆菌(Helicobacterpylori)、加氏乳杆菌(Lactobacillus gasseri)、单核细胞增生利斯特菌(Listeriamonocytogenes)、史氏甲烷短杆菌(Methanobrevibacter smithii)、脑膜炎奈瑟氏菌(Neisseria meningitides)、痤疮丙酸杆菌(Propionibacterium acnes)、铜绿假单胞菌(Pseudomonas aeruginosa)、球形红细菌(Rhodobacter sphaeroides)、金黄色葡萄球菌(Staphylococcus aureus)、表皮葡萄球菌(Staphylococcus epidermidis)、无乳链球菌(Streptococcus agalactiae)、变形链球菌(Streptococcus mutans)和肺炎链球菌(Streptococcus pneumoniae)。

样本，例如从人的肠、粪便、唾液或皮肤获得的样本，可以被处理以提取样本中存在的核酸。从样本提取的总的核酸可以经历片段化，而且可以与如本文所述的带有扩增和捕获寡核苷酸的固相载体接触。如果各捕获寡核苷酸带有与所有细菌中均存在的基因序列互补的序列区域，那么细菌核酸将被捕获，而其他核酸例如病毒或人的核酸将不会被捕获。细菌核酸然后可以被扩增，形成聚类。可以通过例如测序检测被捕获的核酸的可变区域。可变区域的序列提供了可用来识别其来源细菌的信息。通过对聚类测序，样本中两种或更多个细菌数目的比例，可以通过计数从固相载体上的数百万聚类中获得的特定序列读取次数而计算。

如果扩增寡核苷酸仅与细菌核酸互补，特异性扩增细菌样本是可能的。可以修饰捕获寡核苷酸以选择来自特定细菌或病毒的核酸。可以使用多个不同的捕获寡核苷酸，以优化对来自所需生物的核酸的选择。

用于选择16S基因区域的捕获寡核苷酸可以包含以下序列：

名称	区域	5′-3′	序列号
				8F	V1前	AGAGTTTGATCCTGGCTCAG	1
1542R	V9后	AAGGAGGTGATCCAGCCGCA	2
				338F	V3前	ACTCCTACGGGAGGCAGCAG	3
533R	V3后	TTACCGCGGCTGCTGGCAC	4
				967F	V6前	MWACGCGARRAACCTTACC	5
1046R	V6后	CGACARCCATGCASCACCT	6

其中M、W、R和S是标准简并碱基代码(M＝A和/或C，W＝A和/或T，R＝G和/或A，且S＝G和/或C)。

捕获寡核苷酸可以直接附着于扩增寡核苷酸，例如通过制备在单一构建物中同时包含扩增和捕获寡核苷酸的寡核苷酸并将其附着于固相载体。或者，捕获寡核苷酸可以这样制备：将扩增寡核苷酸附着到载体上，让扩增寡核苷酸和含有与捕获寡核苷酸序列和扩增寡核苷酸序列互补的序列的寡核苷酸杂交。该互补的寡核苷酸可以充当模板，通过延伸扩增寡核苷酸，制备捕获寡核苷酸。

在具体实施方案中，单链靶多核苷酸分子含有两个已知序列区域。更具体地，已知序列区域将位于单链多核苷酸分子的5'和3'端，使得单链多核苷酸分子将具有以下结构：

5'[已知序列I]-[靶多核苷酸序列]-[已知序列II]-3'

通常，“已知序列I”和“已知序列II”将包含超过20个、或超过40个、或超过50个、或超过100个、或超过300个连续的核苷酸。两个序列的精确长度可以相同也可以不同。引物结合序列一般将是已知序列，而且将因此特别地与单链多核苷酸分子的已知序列I和已知序列II内的序列互补。引物结合序列的长度不需要和已知序列I或II的长度相同，而且可以更短，具体为16-50个核苷酸，更具体为16-40个核苷酸，再更具体为20-30个核苷酸的长度。已知序列I可以与已知序列II相同，或者它们两个可以是不同的。

通过Watson-Crick碱基配对，在互补序列间形成稳定双螺旋的杂交方法是本领域已知的。单链多核苷酸模板分子的一个区域或部分可与固定的捕获寡核苷酸的至少一部分互补。来自样本的多个多核苷酸因为未与捕获寡核苷酸杂交，不充当模板，可以通过例如洗涤或其他形式的流体流动，从固相载体上被除去。因为扩增寡核苷酸要么被修饰以阻止杂交和/或延伸，要么与模板链不互补，所以仅捕获寡核苷酸将能够杂交和延伸。然后可以进行延伸反应，其中通过依次添加核苷酸延伸捕获寡核苷酸，生成延伸产物，其为通过捕获寡核苷酸附着在固相载体上的单链模板多核苷酸的互补拷贝。没有固定到载体上的单链模板多核苷酸序列，可以在变性条件下与互补的序列分离，并通过例如洗涤被除去。因此，表面上的各捕获寡核苷酸之间的距离控制了单链模板多核苷酸的密度，并因而也控制了表面上稍后形成的聚类的密度。

在例如图3中所示的实施方案中(其中修饰过的正向引物寡核苷酸被封闭，且不能被延伸)，通常所有扩增寡核苷酸将与单链模板多核苷酸杂交。进行延伸反应时，仅未被修饰的正向捕获寡核苷酸通过依次添加核苷酸而延伸，生成通过未被修饰的正向引物寡核苷酸附着在固相载体上的单链模板多核苷酸的互补拷贝。没有与载体杂交的单链模板多核苷酸序列，可以在变性条件下(例如通过用化学变性剂例如甲酰胺洗涤)从未延伸的被封闭的正向引物寡核苷酸中分离并除去。因此，表面上的各未被修饰的正向引物寡核苷酸之间的距离控制了单链模板多核苷酸的密度，并因而也控制了表面上稍后形成的聚类的密度。

互补的单链模板多核苷酸的附着后，可以处理修饰过的/被封闭的引物，以逆转、除去或改变该修饰，使得它们变得与未被修饰的正向引物寡核苷酸功能相当。例如，当其由另一的杂交的多核苷酸形成时，双链结构可以通过变性被除去，例如通过加热或者用碱性溶液处理。或者，当杂交的多核苷酸为共价连接时，可以使用酶消化来序列选择性地裂解链，接着变性。此类除去双链结构的方法是本领域已知的，而且对技术人员是显而易见的(Sambrook和Russell，Molecular Cloning,A Laboratory Manual，第三版，Cold Spring HarborLaboratory Press(2001))。

在本发明的一个实施方案中，通过使用本领域已知的连接方法连接到固定在固相载体上的双链引物上，单链模板多核苷酸分子可以被附着到固相载体上(Sambrook和Russell，同上)。此类方法使用连接酶例如DNA连接酶来实现或催化两条多核苷酸链的末端的接合，在这种情况下，单链模板多核苷酸分子和引物寡核苷酸连接，从而形成共价键连接。在该情形中，“接合”指先前未共价连接的两条多核苷酸链的共价连接。因此，本发明的某些实施方案的目的也可以通过修饰引物寡核苷酸亚群的3'端，使得其不能与单链模板多核苷酸连接而达到。作为非限制性实例，通过末端脱氧核苷酸转移酶(TdT)添加2'3'双脱氧AMP(双脱氧AMP)，有效地阻止了T4DNA连接酶将被处理的分子连接到一起。

替代性的方法是具有双螺旋链的捕获寡核苷酸和单链的扩增寡核苷酸。通过单链与捕获双螺旋(其将是带有游离5'磷酸的唯一的被固定的种类)的连接，固定链的3'端可以如上所述延伸。通过杂交的模板序列的变性，固定的链的扩增可以如描述般进行。其他附着单链的此类方法对本领域技术人员将是显而易见的。

依照本发明的具体实施方案，在下一步骤中，对固定的单链多核苷酸分子和多个扩增寡核苷酸应用合适的条件，使得单链多核苷酸分子与扩增寡核苷酸杂交，形成桥式结构形式的复合体。合适的条件例如中和与/或杂交缓冲液是本领域熟知的(参见Sambrook等，同上；Ausubel等，Current Protocols inMolecular Biology，John Wiley and Sons，Baltimore，Md.(1998))。然后可以除去中和与/或杂交缓冲液。

接下来通过应用合适的延伸条件，进行延伸反应。通过依次添加核苷酸延伸复合体的扩增寡核苷酸，以生成与单链多核苷酸分子互补的延伸产物。得到的双螺旋在两个5'端被固定，使得各链被固定。

合适的条件例如包含具有聚合酶活性的酶的延伸缓冲液/溶液是本领域熟知的(参见Sambrook等，同上；Ausubel等，同上)。在具体实施方案中，延伸缓冲液中可包含dNTP。在进一步的实施方案中，可以在延伸缓冲液前添加dNTP。这一桥式扩增技术可以如在例如US 7,115,400和US 2005/0100900 A1中所述的进行，其内容引入本文作为参考。

可在本发明中使用的具有聚合酶活性的酶的例子是DNA聚合酶(Klenow片段、T4DNA聚合酶)、来自各种耐热细菌的热稳定的DNA聚合酶(例如Taq、VENT、Pfu、或Tfl DNA聚合酶)以及它们的遗传修饰衍生物(TaqGold、VENTexo、或Pfu exo)。也可使用RNA聚合酶和逆转录酶的组合来生成延伸产物。具体地，在这些和相关的实施方案中，酶可以具有链置换活性，更具体地，酶可以在pH约7到约9有活性，特别是pH7.9到pH 8.8有活性，再具体地，在某些示例性实施方案中，酶是Bst或Klenow。

使用的三磷酸核苷分子通常是三磷酸脱氧核苷酸，例如dATP、dTTP、dCTP、dGTP，或者是三磷酸核糖核苷例如ATP、UTP、CTP、GTP。三磷酸核苷分子可以是天然存在或非天然存在的。

杂交和延伸步骤后，可将载体和附着的核酸置于变性条件下。可以使用流通池，使得通过变性缓冲液的流入，总体上去除延伸缓冲液。合适的变性缓冲液是本领域熟知的(参见Sambrook等，同上；Ausubel等，同上)。作为例子，已知pH的改变和低离子强度的溶液可以在基本等温的温度下变性核酸。甲酰胺和尿素与核酸的碱基形成新的氢键，破坏了导致Watson-Crick碱基配对的氢键。在具体实施方案中，甲酰胺的浓度是50％或更高。这些导致了单链的核酸分子。如果需要的话，可以通过用非常低盐(例如低于0.01M阳离子的条件)和高pH(>12)的溶液处理或通过使用高离液盐(例如盐酸胍)而分离链。在具体实施方案中，使用强碱。强碱是能够在酸碱反应中将非常弱的酸去质子化的碱性化合物。碱的强度通过其pKb值来指示，pKb值低于约1的化合物被叫做强碱，且是本领域技术人员熟知的。在具体实施方案中，强碱是氢氧化钠(NaOH)溶液，使用浓度从0.05M到0.25M，尤其是0.1M。

上面示例的杂交、延伸和变性步骤后，将存在两条固定的核酸，第一条包含与第一条模板单链多核苷酸分子(其被初始固定)相同的序列，而第二条是与其互补的核酸，从固定的捕获寡核苷酸之一延伸。然后通过对载体进行进一步的杂交、延伸和变性循环，两条固定链都能够开始进一步的扩增循环。因此，通过退火、延伸和变性循环，从单链到双螺旋，从一条双螺旋到两条双螺旋，从两条双螺旋到四条双螺旋等等进行扩增。

在扩增方法的各步骤之间进行任选的洗涤步骤可能是有益的。例如，可将不含聚合酶且含有或不含dNTP的延伸缓冲液添加到固相载体，之后将其去除和用全延伸缓冲液代替。

此类进一步的扩增循环可用来生产核酸克隆或“聚类”，其包含单链多核苷酸序列及其互补序列的多个固定的拷贝。

模板多核苷酸分子的初始固定指延伸产物可以与位于模板多核苷酸分子总长度距离内的扩增寡核苷酸杂交。其他的距离以外的表面结合引物不能与延伸产物杂交。因此，形成的核酸克隆或聚类的边界被限制在相对局部的区域，围绕着初始模板多核苷酸分子所固定的位置。

一旦通过进行进一步的扩增循环，即进一步的杂交、延伸和变性循环，已经合成了多核苷酸延伸产物分子及其补体的更多拷贝，那么生成的核酸克隆或聚类的边界将能够进一步延伸，尽管形成的克隆的边界仍然被限制在相对局部的区域，围绕着初始单链多核苷酸分子所固定的位置。例如，各个扩增聚类的大小可以是0.5-5微米，而且可以通过进行的循环数目来控制。

因此可以看到，本发明的方法允许由多个单一固定的单链多核苷酸分子生成多个核酸克隆，而且这些克隆的密度可以通过改变用来移植固相载体表面的修饰过的捕获/扩增寡核苷酸的比例来控制。

在一个实施方案中，杂交、延伸和变性步骤全部在相同的基本等温的温度下进行。例如温度从37℃到约75℃，特别是从50℃到70℃，更特别地从60℃到65℃。在具体实施方案中，基本等温的温度可以是所需聚合酶的最佳温度。

在一具体方面，使用依照本发明的第一个方面的方法通过固相扩增来制备核酸克隆的聚类阵列，类似于在US 7,115,400、US 2005/0100900 A1、WO00/18957和WO 98/44151(其内容引入本文作为参考)中所描述的。

在又一个方面，可以将超过一种捕获寡核苷酸和超过两种扩增寡核苷酸，例如至少三种或四种或更多个不同的扩增寡核苷酸序列，移植到固相载体上。以这种方式，可以利用多于一个的具有共同序列的库来制备聚类，库之间具有的共同序列不同，例如由两个不同患者所制备的库。或者，不同的选定区域可以使用不同的扩增寡核苷酸同时扩增。尽管聚类可能在空间上重叠，因为模板末端之间的差异，它们将能够被相继地测序。例如，两种不同的样本可以使用两种不同的捕获寡核苷酸来捕获。这些可以由相同的两种扩增寡核苷酸扩增。样本可以鉴于两种不同的捕获寡核苷酸而被区分，这两种捕获寡核苷酸可以用作两种不同的测序引物的杂交位点。因此，不同捕获寡核苷酸的使用产生了使用不同测序引物的样本索引方法。

通过本发明的方法形成的聚类阵列适用于通常在有序阵列例如微阵列上进行的应用。作为非限制性实例，此类应用包括杂交分析、基因表达分析、蛋白结合分析、测序、基因型分型、核酸甲基化分析等。聚类阵列可以在被用于下游应用前测序，例如与荧光RNA杂交前或使用荧光标记蛋白作结合研究前。

测序方法

本发明也包含对由固相扩增生成的扩增核酸进行测序的方法。因此，本发明提供了核酸测序方法，其包含如上所述使用固相扩增来扩增核酸模板库，以及进行核酸测序反应来确定在固相扩增反应中产生的至少一条扩增核酸链的全部或部分序列。

测序可以使用任何合适的测序技术进行。一个特别有用的方法是其中核苷酸依次添加到游离3'羟基上，导致多核苷酸链5'到3'方向的合成。添加的核苷酸的性质可以在每个核苷酸添加后确定，或者在测序过程末尾确定。使用通过连接来测序的测序技术(其中不是每个相邻的碱基都被测序)，和例如大规模平行信号测序(MPSS)的技术(其中碱基从表面上的链中移除而不是添加)也在本发明的范围内。

测序反应的起始点可由测序引物与固相扩增反应产物的退火提供。在这一方面，在模板库形成期间添加的转接子之一或二个全部可包含核苷酸序列，其允许测序引物与源自整个基因组或模板库的固相扩增的扩增产物退火。

固相扩增反应的产物(其中正向和反向扩增寡核苷酸都共价固定在固体表面上)是由多对固定的多核苷酸链和固定的互补链退火形成的所谓的“桥式”结构，两条链都在5'端附着于固相载体。包含此类桥式结构的阵列，为典型的核酸测序技术提供了低效率模板，因为在标准杂交条件下，常规测序引物与一条固定链的杂交，和这条链与其固定的互补链的退火相比，不占优势。

为了为核酸测序提供更加合适的模板，除去或置换“桥式”结构中的一条固定链的基本全部或至少一部分，可以是有益的，其目的是生成至少部分为单链的模板。将因此可得到模板的单链部分供与测序引物杂交。除去“桥式”双链核酸结构中的一条固定链的全部或一部分的过程在本文中可以被称作“线性化”，而且在WO07010251和US20090118128中进一步详细描述，其内容全部引入本文作为参考。

桥式模板结构可以通过用限制性内切酶裂解一条或两条链或者用粘末端内切酶裂解一条链来线性化。可以用作限制性内切酶或粘末端酶的替代的其他裂解方法，包括尤其是化学裂解(例如，用高碘酸盐裂解二醇键)、通过用内切酶(例如“USER”，如NEB，Ipswich，MA，USA提供的，产品型号M5505S)对脱碱基位点的裂解、或者通过暴露于热或碱，并入到由脱氧核苷酸组成的扩增产物中的核糖核苷的裂解、光化学裂解、或肽连接的裂解。

不管使用了什么裂解方法，裂解步骤后，可将裂解反应的产物置于变性条件下，以除去已裂解的链未附着于固相载体的部分。合适的变性条件例如氢氧化钠溶液、甲酰胺溶液或加热，对于技术人员而言，在参考了标准分子生物学方案(Sambrook等，同上；Ausubel等，同上)后，将是显而易见的。变性导致了测序模板的产生，其是部分或基本单链的。然后测序反应可以通过测序引物与模板单链部分的杂交而开始。

因此，本发明包含方法，其中的核酸测序反应包含：测序引物与线性化的扩增产物的单链区域杂交，将一个或多个核苷酸依次并入到与待测序的扩增模板链的区域互补的多核苷酸链中，识别一个或多个并入的核苷酸中存在的碱基，和从而确定模板链的区域的序列。

依照本发明，可使用的一个测序方法依赖于具有可去除的3'封闭的修饰过的核苷酸的使用，例如在WO04018497、US 2007/0166705A1和US7057026中描述的，其内容全部引入本文作为参考。一旦修饰过的核苷酸已并入与测序模板的区域互补的生长中的多核苷酸链中，没有可得到的游离3'-OH基团来引导进一步的序列延伸，因此聚合酶不能添加额外的核苷酸。一旦并入生长中的链中的碱基性质被确定，可以除去3'封闭，允许添加下一个连续的核苷酸。通过使用这些修饰过的核苷酸来确定衍生的产物的顺序，推导出DNA模板的DNA序列是可能的。如果各个修饰过的核苷酸具有附着在其上已知与特定碱基对应的不同标记，以促进在各并入步骤期间添加的碱基之间的区分，那么此类反应可以在单一实验中完成。或者，可以进行单独的反应，分别包含每个修饰过的核苷酸。

修饰过的核苷酸可以携带标记以方便其检测。例如，可以使用荧光标记来检测修饰过的核苷酸。因此，每个核苷酸类型可以携带不同的荧光标记，例如，如在作为WO07135368公开的美国临时申请号60/801,270(Novel dyesand the use of their labelled conjugates(新染料和其被标记的共轭物的使用))中描述的，其内容全部引入本文作为参考。但是，可检测的标记不必要是荧光标记。允许并入的核苷酸的检测的任何标记都可以被使用。

检测荧光标记的核苷酸的一个方法包含使用对标记过的核苷酸具特异性的波长的激光，或者使用其他合适的照明源。来自核苷酸上的标记的荧光，可通过CCD照相机或其他合适的检测手段来检测。合适的记录聚类阵列的图象的仪器，在作为WO07123744公开的美国临时申请号60/788,248(Systemsand devices for sequence by synthesis analysis(通过合成分析来测序的系统和装置))中描述，其内容全部引入本文作为参考。

本发明不意在局限于使用上面概述的测序方法，基本上，任何依赖于核苷酸向多核苷酸链中的依次并入的测序方法都可以被使用。合适的替代技术包括例如Pyrosequencing^TM(焦磷酸测序)、FISSEQ(荧光原位测序)、MPSS和通过基于连接的方法测序，例如在US6306597中所描述的，其引入本文作为参考。

核酸样本可以被进一步分析，以从片段的相反末端获得第二次读取。测序聚类两端的方法，在未决的申请WO07010252、PCTGB2007/003798和US20090088327中描述，其内容全部引入本文作为参考。在一个实施例中，步骤系列可如下进行；生成聚类，线性化，杂交第一测序引物，并获得第一测序读取。可以除去第一测序引物，而且在标签序列存在于聚类中的情况下，杂交第二引物并测序标签。然后通过由在聚类扩增中使用的剩下的固定引物合成互补的拷贝，核酸链可以在表面上被“反转”。链再合成的这一过程再生了双链聚类。可以除去原始模板链，线性化再合成的链，然后其可以与测序引物退火，在第二或第三测序运行中测序。

在使用链的再合成的情况下，可以以允许固定的链的一部分随后释放的方式将两条链都固定在表面上。这可以通过许多机制来达到，如在WO07010251和US20090118128中描述的，其内容全部引入本文作为参考。例如，一种引物可以包含尿嘧啶核苷酸，这意味着，使用除去核苷碱基的尿嘧啶糖基化酶(UDG)和切除脱碱基的核苷酸的内切酶VIII，链可以在尿嘧啶碱基处裂解。这一酶组合可从New England Biolabs作为USER^TM(NEB，Ipswich，MA，USA，产品型号M5505)得到。第二种引物可以包含8-氧代鸟嘌呤核苷酸，其然后可被酶FPG(NEB产品型号M0240)裂解。引物的这一设计为引物在过程中的哪个点裂解以及在聚类中的何处发生裂解，给出了控制。引物还可以被化学修饰，例如具有二硫化或二醇修饰，其允许在特异性位点的化学裂解。

流通池

本发明还涉及供制备核酸的扩增阵列的流通池，其中流通池包含三种、四种或更多个固定的引物的均匀涂层。因此，本文描述的底物可以存在于其内或作为流通池的一部分，而且本文阐述的方法可以在流通池中进行。与多序列的点阵相反，三种、四种或更多个寡核苷酸可以被涂层在整个阵列表面上，而不是在分离的位置，在每个小的位置包含不同的序列。阵列大小可以为1cm²或更大，其中整个1cm²或更大包含相同的三种、四种或更多个序列的多个拷贝的均质涂层。流通池可以根据以下事实与“点阵”或光刻合成的阵列区分开来：即寡核苷酸附着于每一个表面，流通池室的顶部、底部、壁、和两端，而不是安装在外壳上的阵列。但是，如果需要的话，在本文阐述的方法中使用的流通池，可以拥有对寡核苷酸具有不同反应性的表面，使得寡核苷酸仅附着于前述表面之一或前述表面的子集，或者甚至仅这些表面内的区域子集。

在某些实施方案中，流通池可以涂层了三种不同序列成分的寡核苷酸，即两种扩增寡核苷酸和一种捕获寡核苷酸。在某些实施方案中，流通池可以涂层不超过三种寡核苷酸。但是在其他特殊的实施方案中，流通池可以进一步包含一个或多个其他种类的寡核苷酸，不管是扩增寡核苷酸、捕获寡核苷酸、还是其他种类的寡核苷酸。捕获寡核苷酸可以以比扩增寡核苷酸低的浓度存在，例如至少低100、1000或100,000倍的相对浓度。两种扩增寡核苷酸可以以彼此相似的比例存在，例如变化低于两倍。捕获寡核苷酸可以比扩增寡核苷酸长，而且可以包含扩增寡核苷酸序列区域加上捕获寡核苷酸区域，如例如图1中所示。可替换地或另外地，扩增寡核苷酸可以被封闭以阻止其杂交和/或延伸。在不同的捕获寡核苷酸之间，捕获寡核苷酸的序列可以是不同的。在某些相关但不同的实施方案中，流通池可以涂层了至少四种具有不同序列的寡核苷酸，其中四种中的至少第一种和第二种，其存在密度低于四种中的第三种和第四种。例如，第一种和第二种可以是捕获寡核苷酸，而第三种和第四种可以是扩增寡核苷酸。因此，在上面描述的实施方案中以及在涉及的其他相关的实施方案中，固相载体可以携带不同序列的两种或多种捕获寡核苷酸。捕获寡核苷酸的序列可以允许对核酸样本的已知部分的选择。捕获序列可以通过延伸一些或全部的扩增序列而产生。

尽管本发明已在本文中示例了使用核酸种类的实施方案，将理解的是，相同的原则可以应用于其他分子种类。例如，底物表面可以衍生化了其他合成分子，例如多肽、小分子配体、糖类等。通过在衍生化步骤中控制不同种类的此类分子的量，可以得到各个种类的所需密度。与一个或多个这些固相分子结合的样本分子可以不需要样本滴定就使用，因为与表面结合的来自样本的分子的密度将被表面上的其结合对象的密度所控制。因此，来自样本的分子的附着可以在允许进行到平衡的过程中被热力学控制，与反应条件和培养时间需要更多精确控制的动力学过程相反。一旦与表面结合，来自样本的分子随后可以被修饰或检测。在此类实施方案中，表面可以包含可逆地修饰过的合成分子，使得改变或除去修饰可以让待修饰或检测的来自样本的分子进行特定分析试验或步骤。

虽然为了清晰和理解的目的，已经相当详细地描述了前述发明，本领域技术人员通过阅读本公开内容将清楚地知道，可以做到各种形式和细节的变化在不背离本发明的真实范围。例如，上面描述的所有技术和装置可以以各种组合使用。这一申请中引用的所有公开物、专利、专利申请、或其他文件，为所有目的以相同程度全部引入作为参考，如同各个个体公开物、专利、专利申请、或其他文件被单独指出为所有目的引入作为参考。

Claims

1.一种在固相载体上选择和扩增多核苷酸的方法，所述方法包括：

(a)提供固定在固相载体上的多个扩增寡核苷酸；

(b)将寡核苷酸探针群杂交至所述扩增寡核苷酸的亚群，每一个所述寡核苷酸探针包含互补于所述扩增寡核苷酸的第一部分和包含来自模板多核苷酸所选区域的序列的第二部分；

(c)进行延伸反应以延伸杂交的扩增寡核苷酸，以产生结合载体的捕获寡核苷酸群，所述群中的每一个捕获寡核苷酸包含互补于模板多核苷酸的所选区域的序列；

(d)在使得所述模板多核苷酸选择性地与所述结合载体的捕获寡核苷酸杂交的条件下，将所述模板多核苷酸群施加至所述固相载体；

(e)延伸杂交至所述模板多核苷酸的所述结合载体的捕获寡核苷酸，从而产生互补于所述模板多核苷酸的延伸产物；

(f)扩增所述延伸产物，其中所述扩增包括将一个或多个所述固定的扩增寡核苷酸与一个或多个所述延伸产物退火，从而产生固相扩增产物。

2.如权利要求1所述的方法，进一步包括

(g)对步骤(f)的所述固相扩增产物的第一条链进行测序，以获得所述模板多核苷酸的至少部分核苷酸序列。

3.如权利要求2所述的方法，其中，所述固相扩增产物包含通用测序引物的结合位点。

4.如权利要求1所述的方法，其中，所述捕获寡核苷酸包含至少10个不同的捕获序列。

5.如权利要求1所述的方法，其中，所述扩增寡核苷酸在所述捕获寡核苷酸的延伸过程中被可逆地封闭。

6.如权利要求5所述的方法，其中，所述可逆的封闭是通过附着在所述扩增寡核苷酸3'端的化学物类来实现的。

7.如权利要求6所述的方法，其中，所述化学物类是磷酸基团。

8.如权利要求1所述的方法，其中，所述扩增是等温的。

9.如权利要求1所述的方法，其中，所述模板多核苷酸的一端包含转接子序列。

10.如权利要求9所述的方法，其中，所述核酸样本中的所述模板多核苷酸包含不同的序列，并且对于每个模板多核苷酸，所述转接子序列是相同的。

11.如权利要求10所述的方法，其中，所述多个扩增寡核苷酸各自包含与所述转接子序列互补的共同序列，对于每个模板多核苷酸，所述转接子序列是相同的。

12.如权利要求1所述的方法，其中，所述模板多核苷酸包含PCR扩增子。

13.如权利要求1所述的方法，其中，所述模板多核苷酸包含基因组DNA片段。

14.如权利要求1所述的方法，其中，所述模板多核苷酸来源于无细胞DNA。

15.如权利要求1所述的方法，其中，所述方法进一步包括在步骤(f)之前使步骤(e)的延伸产物经历变性条件。

16.如权利要求1所述的方法，其中，所述方法进一步包括在步骤(f)之前的洗涤步骤。