CN119530347A

CN119530347A - 用于检测核酸空间信息的阵列及检测方法

Info

Publication number: CN119530347A
Application number: CN202411741947.8A
Authority: CN
Inventors: 陈奥; 徐讯; 杨晋; 刘龙奇; 王欧; 黎宇翔; 廖莎; 唐国鑫; 江媛; 徐崇钧; 倪鸣; 章文蔚; 拉多杰·德马纳克; 斯内扎娜·德马纳克
Original assignee: BGI Shenzhen Co Ltd; MGI Tech Co Ltd
Current assignee: BGI Shenzhen Co Ltd; MGI Tech Co Ltd
Priority date: 2019-05-15
Filing date: 2020-05-14
Publication date: 2025-02-28
Also published as: CN119530346A; SG11202112703QA; CN119685448A; CN119530344A; EP3971282A4; MX2021013907A; BR112021022865A2; AU2020274774C1; CA3140512A1; JP2024156848A; AU2020274774B2; KR20220009445A; CN119530345A; CN114207105A; EP3971282A1; CN114207105B; AU2020274774A1; CN119592664A; CN119592665A; JP2022540744A

Abstract

提供了检测样品中核酸的空间信息的方法，以及用于所述方法的核酸阵列及产生所述核酸阵列的方法。

Description

用于检测核酸空间信息的阵列及检测方法

本分案申请是基于申请号为CN 202080036185.5，申请日为2020年05月14日，发明名称为“用于检测核酸空间信息的阵列及检测方法”的原始中国专利申请的分案申请。

技术领域

本发明涉及生物分子空间检测领域。具体地，本发明提供了检测样品中核酸的空间信息的方法，以及用于所述方法的核酸阵列及产生所述核酸阵列的方法。

背景技术

组织中细胞的空间位置显著影响其功能，为探究这种空间异质性，需要在获知空间坐标的情况下，对细胞的基因组或转录组进行量化及分析。然而要收集较小的组织区域甚至单个细胞用于基因组或转录组分析，非常费力、费钱且精确度低。因此，开发一种能够实现单细胞甚至亚细胞级别、且高通量的检测生物分子(例如核酸)的空间信息(例如，核酸的定位、分布和/或表达)的方法是十分必要的。

发明内容

为实现核酸的空间检测，现有技术通过将阵列技术与高通量DNA测序技术联用，捕获并定位标记组织样本中的核酸，并对其进行测序和分析。为获得能够实现所述目的的芯片，现有技术通过点样或微珠介导的方式将能够捕获核酸的探针固定于芯片。然而，使用微量体积点样系统进行液滴平面点样的点样方式获得的芯片的活性区域大小高达200微米，细胞观测精度仅为20细胞；使用带定位标记的微珠进行平面铺展的微珠方式获得的芯片的活性区域大小达10微米，细胞观测精度仅能达到单细胞，无法实现对亚细胞的定位。本发明提供了一种全新的用于核酸空间检测的核酸阵列及其制备方法、以及基于该阵列的核酸空间检测方法，其能够同时实现高精度亚细胞定位和高通量组织定位，具备重大应用价值。

核酸阵列的制备

在第一方面，本发明提供了一种产生用于检测生物样品中核酸的空间信息的核酸阵列的方法，所述方法包括以下步骤：

(1)提供多种载体序列，每种载体序列包含多个拷贝的载体序列，所述载体序列从5’到3’的方向上包含：定位序列和第一固定序列，

所述定位序列具有与该种载体序列在阵列上的位置相对应的独一无二的核苷酸序列；

所述第一固定序列允许与其互补的核苷酸序列发生退火并起始延伸反应；

(2)将所述多种载体序列连接于固相支持物(例如芯片)表面；

(3)提供第一引物，并以所述载体序列为模板，进行引物延伸反应，使得所述载体序列的第一固定序列和定位序列区域形成双链，其中与所述载体序列杂交的链即为第一核酸分子，所述第一核酸分子从5’至3’方向上包含第一固定序列和定位序列的互补序列；其中，所述第一引物在其3’端包含第一固定序列互补区，所述第一固定序列互补区包含所述第一固定序列的互补序列或其片段，且具有3’自由端。

在某些实施方案中，所述载体序列、第一核酸分子是单链核酸序列。在某些实施方案中，所述载体序列、第一核酸分子是单链DNA序列。

在某些实施方案中，在步骤(3)中，在进行延伸反应的同时，对所述载体序列进行测序，从而获得所述载体序列所包含的定位序列的序列信息。

在某些实施方案中，在步骤(1)中通过以下步骤提供多种载体序列：

(i)提供多种载体模板序列，所述载体模板序列包含所述载体序列的互补序列；

(ii)以每种载体模板序列为模板，进行核酸扩增反应，以获得每种载体模板序列的扩增产物，所述扩增产物包含多个拷贝的载体序列。

在某些实施方案中，所述扩增选自滚环复制(RCA)、桥式PCR扩增、多重链置换扩增(MDA)或乳液PCR扩增。

在某些实施方案中，进行滚环复制，以获得由所述载体序列的多联体所形成的DNB。在此类实施方案中，在步骤(i)中提供环状模板序列。制备环状核酸分子的方法是本领域的常规方法，本领域技术人员可以根据需要进行选择，例如可以首先获得线性核酸模板，然后通过连接酶(例如DNA连接酶)实现线性核酸模板的环化。

在某些实施方案中，进行桥式PCR扩增、乳液PCR扩增或多重链置换扩增，以获得由所述载体序列的克隆群形的DNA簇。

在一些实施方案中，所述方法进一步包括以下步骤：

(4)提供第二核酸分子，所述第二核酸分子包含捕获序列；

所述捕获序列能够与待捕获核酸的全部或部分杂交，其包括：(a)能够捕获mRNA的寡核苷酸序列；和/或，(b)随机或简并的寡核苷酸序列；或，(c)针对特定靶核酸的特异性序列；并且，所述捕获序列具有3’自由端以使所述第二核酸分子能作为延伸引物，

(5)将所述第二核酸分子与所述第一核酸分子连接(例如，使用连接酶将所述第二核酸分子与第一核酸分子连接)。

在某些实施方案中，所述第二核酸分子是单链核酸序列。在某些实施方案中，所述第二核酸分子是单链DNA序列。在某些实施方案中，所述第二核酸分子是单链RNA序列。

在某些实施方案中，所述第二核酸分子从5’至3’方向上包含固定区和捕获序列，所述固定区包含双链核酸序列，例如双链DNA序列。在某些实施方案中，所述第二核酸分子所包含的捕获序列是单链核酸序列，例如单链DNA序列或单链RNA序列。易于理解的是，在此类实施方案中，所述第二核酸分子具有部分双链结构，也即，其固定区具有双链结构，捕获序列为单链结构。

在某些实施方案中，所述双链核酸序列的长度为1bp-50bp，例如10bp-50bp，10bp-40bp或10bp-30bp。

在另一些实施方案中，所述方法进一步包括以下步骤：

(4)提供第二核酸分子，所述第二核酸分子从5’至3’方向上包含第二固定序列互补序列和捕获序列；

所述第二固定序列互补序列允许与其互补的核苷酸序列发生杂交；

所述捕获序列能够与待捕获核酸的全部或部分杂交，其包括：(a)能够捕获mRNA的寡核苷酸序列；和/或，(b)随机或简并的寡核苷酸序列；或，(c)针对特定靶核酸的特异性序列；并且，所述捕获序列具有3’自由端以使所述第二核酸分子能作为延伸引物；

(5)在允许退火的条件下使所述第二固定序列互补序列与第二固定序列发生杂交，从而将所述第二核酸分子连接至所述载体序列；

(6)任选地，将分别杂交在载体序列上的第一核酸分子和第二核酸分子连接(例如，使用连接酶将所述第二核酸分子与第一核酸分子连接)。

在此类实施方案中，每个载体序列在其5’端进一步包含第二固定序列，所述第二固定序列允许与其互补的核苷酸序列发生退火。在某些实施方案中，所述第二固定序列允许与其互补的核苷酸序列发生退火并起始延伸反应(例如可作为桥式PCR引物的结合位点)。

在某些实施方案中，所述第二固定序列与定位序列邻接。

在某些实施方案中，所述第二固定序列的长度为1bp-50bp，例如10bp-50bp，10bp-40bp，10bp-30bp，或10bp-20bp。

在某些实施方案中，在步骤(3)中，所述第一引物在其第一固定序列互补区的5’端还包含唯一分子标识符(UMI)序列，从而使得所述第一核酸分子在其第一固定序列互补序列的5’端包含该UMI序列；或者，在步骤(4)中，所述第二核酸分子还包含UMI序列，所述UMI序列位于捕获序列的5’端；

所述UMI序列是由至少1个(例如至少2个，至少3个，至少4个，或至少5个；例如5-100个，5-50个，5-20个，例如10个)N组成的核苷酸序列，每个N各自独立地为A、C、G和T中的任何一种。

在某些实施方案中，当所述第一引物在其第一固定序列互补区的5’端包含唯一分子标识符(UMI)序列时，所述第一引物可以在所述UMI序列的5’端进一步包含额外的序列。

在某些实施方案中，所述能够捕获mRNA的寡核苷酸序列包括能够与mRNA的poly-A尾杂交的序列。在某些实施方案中，所述能够捕获mRNA的寡核苷酸序列包括poly-T寡核苷酸序列。在某些实施方案中，所述poly-T寡核苷酸序列包括至少10个(例如至少20个)脱氧胸腺嘧啶核苷残基。

在某些实施方案中，所述固相支持物是芯片。在某些实施方案中，所述固相支持物能够用作测序平台，例如测序芯片。在某些实施方案中，所述固相支持物是高通量测序芯片，例如用于Illumina、MGI或Thermo Fisher测序平台的高通量测序芯片。

在第二方面，本发明提供了一种产生用于检测生物样品中核酸的空间信息的核酸阵列的方法，所述方法包括以下步骤：

(1)提供多种载体序列，每种载体序列包含多个拷贝的载体序列，所述载体序列从5’到3’的方向上包含：捕获模板序列、定位序列和第一固定序列，

所述捕获模板序列包含捕获序列的互补序列，所述捕获序列能够与待捕获核酸的全部或部分杂交，其包括：(a)能够捕获mRNA的寡核苷酸序列；和/或，(b)随机或简并的寡核苷酸序列；或，(c)针对特定靶核酸的特异性序列；

所述第一固定序列允许与其互补的核苷酸序列发生退火并起始延伸反应；并且，所述第一固定序列还包含切割位点，所述切割可以选自切刻酶(nicking enzyme)酶切、USER酶切、光切除、化学切除或CRISPR切除；

(2)将所述多种载体序列连接于固相支持物(例如芯片)表面；

(3)提供第一引物(或称为探针引物)，所述第一引物在5’至3’方向上包含结合区、切除区和第一固定序列互补区，所述第一固定序列互补区包含所述第一固定序列的互补序列或其片段，且具有3’自由端；所述结合区包含能够与所述固相支持物表面连接的连接子；所述切除区包含切割位点；

以所述第一引物为引物，以所述载体序列为模板，进行引物延伸反应，使得所述载体序列的第一固定序列、定位序列以及捕获模板序列区域形成双链，其中与所述载体序列杂交的链即为第一核酸分子，所述第一核酸分子从5’至3’方向上包含第一固定序列互补序列、定位序列互补序列和捕获序列；所述第一核酸分子又可称为捕获探针；

(4)将所述第一引物与所述固相支持物表面连接；其中，步骤(3)与(4)以任意顺序进行；

(5)任选地对所述载体序列的第一固定序列所包含的切割位点进行切割，以消化所述载体序列，使得步骤(3)中的延伸产物与形成延伸产物的模板(即载体序列)分离，从而将所述第一核酸分子(捕获探针)连接于固相支持物(例如芯片)表面。

由于捕获探针(即第一核酸分子)是以所述载体序列为模板并通过引物延伸获得，因此，所述捕获探针包含与所述阵列上该种捕获探针(该种载体序列)的位置相对应的独一无二的定位序列互补序列，以及能够与待捕获核酸分子的全部或部分杂交的捕获序列。通过分析该定位序列互补序列能够确定该种捕获探针在阵列上的位置。

在本文中，表述“每种载体序列”是指包含相同定位序列的载体序列。

在某些实施方案中，每种载体序列是由多个拷贝的载体序列的多联体所形成的DNB。

在某些实施方案中，步骤(1)包括以下步骤：

(1a)提供环状核酸模板，所述环状核酸模板包含一种载体模板序列，所述载体模板序列包含所述载体序列的互补序列，也即所述载体模板序列在5’至3’方向上包含第一固定序列互补序列、定位序列互补序列和捕获序列；

(1b)以所述环状核酸模板为模板进行滚环扩增(RCA)，以获得由所述载体序列的多联体所形成的纳米球(DNB)。

在某些实施方案中，所述第一固定序列包含的切割位点是切刻酶酶切位点。在某些实施方案中，所述切刻酶选自USER、BamHI、BmtI等。在某些示例性实施方案中，所述酶切位点如SEQ ID NO:14所示。

在某些实施方案中，所述第一固定序列还包含测序引物杂交区和/或扩增引物杂交区；其中，所述测序引物杂交区允许测序引物退火并起始测序反应，所述扩增引物杂交区允许扩增引物退火并起始延伸及扩增反应。

在某些实施方案中，所述第一固定序列的长度大于1bp，例如大于10bp，或大于20bp。在某些实施方案中，所述第一固定序列的长度为20-100bp，例如20-80bp。

在某些实施方案中，所述定位序列的长度大于1bp，例如大于10bp。在某些实施方案中，所述定位序列的长度为10-100bp，例如10-50bp，例如10-30bp，例如20bp。

在某些实施方案中，所述捕获序列的长度大于1bp。在某些实施方案中，所述捕获序列的长度为1-100bp，例如10-50bp，例如10-30bp。

在某些实施方案中，所述载体序列还包含位于所述捕获模板序列的下游、且位于所述第一固定序列的上游的UMI互补序列(亦可称为探针标签区)，其与UMI序列互补，所述UMI序列是由至少1个(例如至少2个，至少3个，至少4个，或至少5个；例如5-100个，5-50个，5-20个，例如10个)N组成的核苷酸序列，每个N各自独立地为A、C、G和T中的任何一种。在一些实施方案中，所述UMI互补序列位于所述定位序列和捕获模板序列之间。在另一些实施方案中，所述UMI互补序列位于所述第一固定序列与定位序列之间。在此类实施方案中，在步骤(3)中，当以所述载体序列为模板进行引物延伸反应时，与所述载体序列杂交的第一核酸分子/捕获探针会相应地包含所述UMI序列(也可称为探针标签)。

在某些实施方案中，为获得上述UMI序列或其互补序列，所述载体序列的模板序列(即载体模板序列)在对应位置包含UMI模板序列，所述UMI模板序列是由修饰碱基组成的序列，所述修饰碱基能够与多种主要碱基(例如，C、G、A、T、U)形成氢键互补配对，如Inosine，可以与碱基A、C、U互补配对。不受理论约束，认为当载体模板序列包含所述UMI模板序列时，在滚环复制过程中，每进行一次复制，与所述UMI模板序列能够互补配对的碱基随机结合，从而使得每一次的复制产物带有独特的随机形成的UMI序列，进而将每一次的复制产物区分开来，如可以捕获不同的核酸分子，进行拷贝数定量。在某些实施方案中，所述UMI模板序列包含多个Inosine(例如至少10个，例如10-100个)。在某些实施方案中，所述UMI模板序列的长度大于1bp。在某些实施方案中，所述UMI模板序列的长度大于5bp。在某些实施方案中，所述UMI模板序列的长度为5-100bp，例如5-50bp，例如5-20bp，例如5-15bp，例如10bp。

在某些实施方案中，所述固相支持物是芯片。在某些实施方案中，所述固相支持物能够用作测序平台。在某些实施方案中，所述固相支持物是测序芯片(华大智造)，如BGISEQ-500平台的测序芯片。在某些实施方案中，所述固相支持物是高密度阵列芯片，例如可以如专利CN103180496B所描述的方法获得。

可以通过本领域已知的任何合适方法将载体序列(例如DNB)连接至固相支持物表面。在某些实施方案中，所述方法的非限制性示例包括核酸杂交、生物素链霉亲和素结合、巯基结合、光活化结合、共价结合、抗体-抗原、经由水凝胶或其他多孔聚合物的物理限制等，或其任意组合。

在某些实施方案中，所述固相支持物选自下列材料：玻璃、硅、多聚赖氨酸涂层材料、硝化纤维、聚苯乙烯、环状烯烃共聚物(COCs)、环状烯烃高分子(COPs)、聚丙烯、聚乙烯或聚碳酸酯等。

在某些实施方案中，在步骤(3)中，在进行引物延伸反应的同时，对所述载体序列(例如其所包含的定位序列)进行测序，从而获得所述载体序列所包含的定位序列的序列信息。

在某些实施方案中，在步骤(3)之前，还包括对所述载体序列(例如其所包含的定位序列)进行测序的步骤。在某些实施方案中，在完成测序之后，通过洗涤以去除因测序而被添加至合成链中的dNTP。

在某些实施方案中，所述连接子是能够与活化基团(例如NH₂)偶联的连接基团。在此类实施方案中，所述固相载体表面具有活化基团(例如NH₂)修饰。在某些实施方案中，所述连接子包括-SH、-DBCO或-NHS等。在某些实例性实施方案中，所述连接子是DBCO，所述固相载体表面连接有Azido-8-NHS ester。

在某些实施方案中，所述第一引物的切除区所包含的切割位点是可以通过化学、酶或光化学方法进行受控切割的位点。在某些实施方案中，所述切割位点是酶切位点。在某些实施方案中，所述切割位点是USER酶的酶切位点(UUU)。

在某些实施方案中，所述第一引物的切除区与所述载体序列的第一固定序列所包含的切割位点不同。

在某些实施方案中，所述扩增包括PCR。

核酸阵列及试剂盒

在第三方面，本发明提供了一种用于检测样品中核酸空间信息的核酸阵列，其包括表面连接有多种载体序列的固相支持物(例如芯片)，每种载体序列在所述阵列中占不同位置，每种载体序列包含多个拷贝的载体序列，所述载体序列从5’到3’的方向上包含：定位序列和第一固定序列，

所述第一固定序列允许与其互补的核苷酸序列发生退火并起始延伸反应。

在某些实施方案中，所述每种载体序列(也即，包含相同定位序列的载体序列)在所述固相支持物表面所占的面积(也即，活性区域)的直径小于1微米，例如约900纳米，约800纳米，约700纳米，约600纳米，或约500纳米。

在某些实施方案中，所述核酸阵列进一步包含第一核酸分子，所述第一核酸分子从5’到3’的方向上包含：第一固定序列互补序列和定位序列互补序列，并且与所述载体序列的第一固定序列和定位序列杂交形成双链。易于理解的是，所述第一核酸分子中仅第一固定序列互补序列和定位序列互补序列与所述载体序列的相应序列互补形成双链，因此第一固定序列与载体序列所形成的双链是不完全双链，即部分双链结构。

在某些实施方案中，每种载体序列中的每个拷贝的载体序列均包含与其杂交的第一核酸分子。

在一些实施方案中，所述核酸阵列进一步包含第二核酸分子，所述第二核酸分子与第一核酸分子连接，从而固定至所述核酸阵列，所述第二核酸分子包含捕获序列；

所述捕获序列能够与待捕获核酸的全部或部分杂交，其包括：(a)能够捕获mRNA的寡核苷酸序列；和/或，(b)随机或简并的寡核苷酸序列；或，(c)针对特定靶核酸的特异性序列；并且，所述捕获序列具有3’自由端以使所述第二核酸分子能作为延伸引物。

在某些实施方案中，每个第一核酸分子均连接所述第二核酸分子。

在某些实施方案中，所述第二核酸分子的5’端与第一核酸分子的3’端连接。

在另一些实施方案中，所述核酸阵列进一步包含第二核酸分子，所述第二核酸分子与载体序列发生杂交，从而固定至所述核酸阵列。

在此类实施方案中，每个载体序列在其5’端进一步包含第二固定序列，所述第二固定序列允许与其互补的核苷酸序列发生退火；并且，

所述第二核酸分子从5’至3’方向上包含第二固定序列互补序列和捕获序列；所述第二固定序列互补序列与所述载体序列的第二固定序列杂交形成双链；

在某些实施方案中，每种载体序列中的每个拷贝的载体序列均包含与其杂交的第二核酸分子。

在某些实施方案中，所述第二固定序列允许与其互补的核苷酸序列发生退火并起始延伸反应(例如可作为桥式PCR引物的结合位点)。

在某些实施方案中，所述第二固定序列与定位序列邻接。

在某些实施方案中，所述第二核酸分子具有5’端修饰。在某些实施方案中，所述修饰是磷酸化或生物素修饰。

在某些实施方案中，所述多个拷贝的载体序列是以所述载体序列的互补序列为模板经扩增所形成的扩增产物，所述扩增选自滚环复制(RCA)、桥式PCR扩增、多重链置换扩增(MDA)或乳液PCR扩增。

在某些实施方案中，所述多个拷贝的载体序列是由所述载体序列的多联体所形成的DNB。在某些实施方案中，所述多个拷贝的载体序列是以所述载体序列的互补序列为模板经滚环复制形成的DNB。

在某些实施方案中，所述多个拷贝的载体序列是由所述载体序列的克隆群形成的DNA簇。

在某些实施方案中，所述多个拷贝的载体序列是以所述载体序列的互补序列为模板经桥式PCR扩增形成的DNA簇。

在某些实施方案中，所述多个拷贝的载体序列是以所述载体序列的互补序列为模板经乳液PCR扩增形成的DNA簇。

在某些实施方案中，所述多个拷贝的载体序列是以所述载体序列的互补序列为模板经多重链置换扩增形成的DNA簇。

在某些实施方案中，所述第一核酸分子还包含唯一分子标识符(UMI)序列，所述UMI序列位于第一固定序列互补序列的5’端；或者，所述第二核酸分子还包含UMI序列，所述UMI序列位于捕获序列的5’端；

在某些实施方案中，每个第一核酸分子所包含的UMI序列彼此不同。

在某些实施方案中，每个第二核酸分子所包含的UMI序列彼此不同。

在某些实施方案中，所述定位序列的长度大于1nt，例如大于5nt。在某些实施方案中，所述定位序列的长度为5-50nt，例如10-50nt，10-30nt，或20-30nt。在某些实施方案中，不同种载体序列所包含的定位序列的长度可以相同或不同。

在某些实施方案中，所述捕获序列的长度大于1nt。在某些实施方案中，所述捕获序列的长度为1-100nt，例如1-50nt，例如10-30nt。

在某些实施方案中，所述第一固定序列的长度大于1nt，例如大于10nt。在某些实施方案中，所述第一固定序列的长度为10-200nt。在某些实施方案中，所述第一固定序列的长度为20-100nt，例如20-50nt。

在某些实施方案中，所述第二固定序列的长度大于1nt，例如大于10nt。在某些实施方案中，所述第二固定序列的长度为10-200nt，例如10-100nt，10-50nt，10-30nt，或10-20nt。

在第四方面，本发明提供了一种用于检测样品中核酸空间信息的试剂盒，其包含：(i)第三方面所述的核酸阵列，其中，所述核酸阵列不包含第二核酸分子；以及，(ii)第二核酸分子，所述第二核酸分子从5’至3’方向上包含固定区和捕获序列；

在一些实施方案中，所述试剂盒包含：(i)核酸阵列，其包括表面连接有多种载体序列的固相支持物(例如芯片)，每种载体序列在所述阵列中占不同位置，每种载体序列包含多个拷贝的载体序列，所述载体序列从5’到3’的方向上包含：定位序列和第一固定序列，

所述核酸阵列还包含第一核酸分子，所述第一核酸分子从5’到3’的方向上包含：第一固定序列互补序列和定位序列互补序列，并且与所述载体序列的第一固定序列和定位序列杂交形成双链；

以及，(ii)第二核酸分子，所述第二核酸分子的固定区包含双链DNA序列。

易于理解的是，可以使用连接酶将(ii)所述的第二核酸分子连接至(i)所述的核酸阵列所包含的第一核酸分子上。因此，在某些实施方案中，所述试剂盒进一步包含连接酶。

在另一些实施方案中，所述试剂盒包含：(i)核酸阵列，其包括表面连接有多种载体序列的固相支持物(例如芯片)，每种载体序列在所述阵列中占不同位置，每种载体序列包含多个拷贝的载体序列，所述载体序列从5’到3’的方向上包含：第二固定序列、定位序列和第一固定序列，

所述第二固定序列允许与其互补的核苷酸序列发生退火；

以及，(ii)第二核酸分子，所述第二核酸分子的固定区包含第二固定序列互补序列。

在某些实施方案中，所述第二固定序列与定位序列邻接。

易于理解的是，在允许退火的条件下，(ii)所述的第二核酸分子可与(i)所述的核酸阵列所包含的载体序列的互补区域杂交，进而可以使用连接酶将第二核酸分子连接至第一核酸分子上。因此，在某些实施方案中，所述试剂盒进一步包含连接酶。

在另一方面，本发明还涉及第三方面所述的核酸阵列或第四方面所述的试剂盒用于检测样品中核酸的空间信息的用途，或者在制备用于检测样品中核酸的空间信息的检测试剂中的用途。

在某些实施方案中，所述核酸的空间信息包括核酸的定位、分布和/或表达。

在某些实施方案中，所述样品是组织样品，例如含有细胞的组织样品。在某些实施方案中，所述样品是组织切片。在某些实施方案中，所述组织切片从固定组织制备，例如，以福尔马林固定石蜡包埋(FFPE)的组织或深度冷冻的组织。

在第五方面，本发明还涉及一种用于检测样品中核酸的空间信息的核酸阵列，其包括表面连接有多种载体序列的固相支持物(例如芯片)，每种载体序列在所述阵列中占不同位置，每种载体序列包含多个拷贝的载体序列，所述载体序列从5’到3’的方向上包含：捕获模板序列、定位序列和第一固定序列，其中，

所述第一固定序列允许与其互补的核苷酸序列发生退火并起始延伸反应，并且，所述第一固定序列还包含切割位点，所述切割可以选自切刻酶(nicking enzyme)酶切、USER酶切、光切除、化学切除或CRISPR切除；

所述核酸阵列还包含第一核酸分子(亦可称为捕获探针)，所述第一核酸分子从5’到3’的方向上包含：结合区、切除区、以及载体序列互补区，

所述结合区包含能够与所述固相支持物表面连接的连接子；

所述切除区包含切割位点；

所述载体序列互补区包含能够与所述载体序列互补的序列，其从5’到3’的方向上包含：第一固定序列互补序列、定位序列互补序列以及捕获序列；并且，所述捕获序列具有3’自由端以使所述第一核酸分子能作为延伸引物；

并且，所述第一核酸分子的载体序列互补区与所述载体序列杂交形成双链。

在某些实施方案中，每种载体序列中的每个拷贝的载体序列均包含与其杂交的上述第一核酸分子。

在某些实施方案中，所述第一核酸分子的连接子是能够与活化基团(例如NH₂)偶联的连接基团，所述固相支持物表面具有活化基团(例如NH₂)修饰。在某些实施方案中，所述连接子包括-SH、-DBCO或-NHS。在某些实施方案中，所述连接子是(DBCO)，所述固相支持物表面连接有(Azido-8-NHSester)。

在某些实施方案中，所述第一核酸分子的切除区所包含的切割位点是可以通过化学、酶或光化学方法进行受控切割的位点。在某些实施方案中，所述切割位点是酶切位点。在某些实施方案中，所述切割位点是USER酶的酶切位点(UUU)。

在某些实施方案中，所述第一核酸分子的切除区与所述载体序列的第一固定序列所包含的切割位点不同。

在某些实施方案中，所述核酸阵列通过第二方面所述的方法制备。

在某些实施方案中，所述载体序列进一步包含位于所述捕获模板序列的下游、且位于所述第一固定序列的上游的UMI互补序列，其与UMI序列互补，所述UMI序列是由至少1个(例如至少2个，至少3个，至少4个，或至少5个；例如5-100个，5-50个，5-20个，例如10个)N组成的核苷酸序列，每个N各自独立地为A、C、G和T中的任何一种；

并且，所述第一核酸分子的载体序列互补区进一步包含位于所述捕获序列上游、且位于所述第一固定序列互补序列的下游的UMI序列。

在某些实施方案中，所述UMI互补序列位于所述定位序列和捕获模板序列之间，或者位于所述第一固定序列与定位序列之间。

在某些实施方案中，每种载体序列(也即，包含相同定位序列的载体序列)中的每个拷贝的载体序列具备彼此不同的UMI互补序列。相应地，与每个拷贝的载体序列杂交的第一核酸分子(捕获探针)也具备彼此不同的UMI序列。

在某些实施方案中，通过载体序列的第一固定序列所包含的切割位点将所述载体序列从核酸阵列中去除。在此类实施方案中，所述核酸阵列包括表面连接有多种捕获探针(第一核酸分子)的固相支持物(例如芯片)，每种捕获探针(第一核酸分子)在所述阵列中占不同位置，且定向为具有3’自由端以使所述捕获探针(第一核酸分子)能作为延伸引物，其中每种捕获探针(第一核酸分子)从5’到3’的方向上包含：结合区、切除区、定位序列互补序列以及捕获序列，其中，

所述结合区包含能够与所述固相支持物表面连接的连接子；

所述切除区包含切割位点；

所述定位序列与所述阵列上该种捕获探针的位置相对应；

所述捕获序列能够与待捕获核酸的全部或部分杂交，其包括：(1a)能够捕获mRNA的寡核苷酸序列；和/或，(1b)随机或简并的寡核苷酸序列；或，(c)针对特定靶核酸的特异性序列。

在某些实施方案中，所述每种捕获探针中的每条捕获探针(也即，包含相同定位序列/定位序列互补序列的捕获探针)具备彼此不同的UMI序列，所述UMI序列位于所述捕获序列的上游，并且位于所述切除区的下游。在一些实施方案中，所述UMI序列位于所述捕获序列的5’端，例如位于所述捕获序列与定位序列互补序列之间。在另一些实施方案中，所述UMI序列位于所述定位序列互补序列的5’端，例如位于所述切除区与定位序列互补序列之间。

在某些实施方案中，所述每种载体序列(也即，包含相同定位序列的载体序列)或每种捕获探针(也即，包含相同定位序列/定位序列互补序列的捕获探针)在所述固相支持物表面所占的面积(也即，活性区域)的直径小于1微米，例如约900纳米，约800纳米，约700纳米，约600纳米，或约500纳米。在某些实施方案中，所述每种载体序列或每种捕获探针的活性区域的直径为约500纳米。

在某些实施方案中，所述固相支持物是芯片。在某些实施方案中，所述固相支持物能够用作测序平台。在某些实施方案中，所述固相支持物是测序芯片(华大智造)，如BGISEQ-500平台。在某些实施方案中，所述固相支持物是高密度阵列芯片，例如可以如专利CN103180496B所描述的方法获得。

检测方法

在第六方面，本发明提供了一种检测样品中核酸的空间信息的方法，其包括以下步骤：

(1)提供第三方面所述的核酸阵列，或者，通过第一方面所述的方法获得核酸阵列；其中，

所述核酸阵列包含连接于固相支持物(例如芯片)表面的多种载体序列，每种载体序列在所述阵列中占有不同位置，并且每种载体序列包含多个拷贝的载体序列；

每个载体序列包含与其杂交的第一核酸分子和第二核酸分子，并且所述第一核酸分子和第二核酸分子彼此未连接；

所述第一核酸分子包含与所述阵列上该种载体序列的位置相对应的定位序列互补序列，

所述第二核酸分子包含能够捕获样品中的核酸的捕获序列；

(2)将所述核酸阵列在允许退火的条件下与待测样品接触，以使得待测样品中的核酸与所述第二核酸分子的捕获序列发生退火，从而使得该核酸的位置被对应至核酸阵列上的载体序列的位置；

(3)(i)当所述第一核酸分子和第二核酸分子彼此未连接时，连接杂交于每个载体序列上的第一核酸分子和第二核酸分子(例如使用连接酶)；

在允许引物延伸的条件下，以连接的第一和第二核酸分子作为引物，以被捕获的核酸分子为模板，进行引物延伸反应，以产生延伸产物，与所述被捕获核酸分子杂交的链具有第一核酸分子中所包含的定位序列互补序列作为空间信息标记；和/或，

以被捕获的核酸分子作为引物，以所述连接的第一和第二核酸分子为模板，进行引物延伸反应，以产生经延长的被捕获核酸分子，所述经延长的被捕获核酸分子具有所述定位序列作为空间信息标记；

或者，(ii)当所述第一核酸分子和第二核酸分子彼此未连接时，在允许引物延伸的条件下，以所述第二核酸分子作为引物，以被捕获的核酸分子为模板，进行引物延伸反应，以产生经延长的第二核酸分子，所述经延长的第二核酸分子包含被捕获核酸的互补序列；连接杂交于每个载体序列上的第一核酸分子和经延长的第二核酸分子(例如使用连接酶)，与所述被第一核酸分子连接的经延长的第二核酸分子具有第一核酸分子中所包含的定位序列互补序列作为空间信息标记；

或者，(iii)当所述第一核酸分子和第二核酸分子彼此连接时，在允许引物延伸的条件下，以连接的第一和第二核酸分子作为引物，以被捕获的核酸分子为模板，进行引物延伸反应，以产生延伸产物，与所述被捕获核酸分子杂交的链具有第一核酸分子中所包含的定位序列互补序列作为空间信息标记；和/或，

(4)从阵列表面释放至少一部分空间信息标记的核酸分子，其中所述部分包括定位序列或其互补链以及被捕获核酸分子或其互补链；和

(5)直接或间接地分析步骤(4)中被释放的核酸分子的序列。

在此类实施方案中，在步骤(2)捕获靶核酸之前，所述核酸阵列上的第一核酸分子和第二核酸分子未连接。

在第七方面，本发明提供了一种检测样品中核酸的空间信息的方法，其包括以下步骤：

(1)提供第一方面所述的核酸阵列，或者，通过第三方面所述的方法获得核酸阵列；其中，

每个载体序列包含与其杂交的第一核酸分子，所述第一核酸分子连接第二核酸分子；

所述第二核酸分子包含能够捕获样品中的核酸的捕获序列；

(3)(iii)在允许引物延伸的条件下，以连接的第一和第二核酸分子作为引物，以被捕获的核酸分子为模板，进行引物延伸反应，以产生延伸产物，与所述被捕获核酸分子杂交的链具有第一核酸分子中所包含的定位序列互补序列作为空间信息标记；和/或，

(5)直接或间接地分析步骤(4)中被释放的核酸分子的序列。

在此类实施方案中，在步骤(2)捕获靶核酸之前，所述核酸阵列上的第一核酸分子与第二核酸分子已连接。

在第六或第七方面所述方法的某些实施方案中，所述多个拷贝的载体序列是由所述载体序列的多联体所形成的DNB，或者，所述多个拷贝的载体序列是由所述载体序列的克隆群形的DNA簇。

在第六或第七方面所述方法的某些实施方案中，所述载体序列、第一核酸分子是单链DNA。在某些实施方案中，所述第二核酸分子是单链DNA或单链RNA。

在第八方面，本发明提供了一种检测样品中核酸的空间信息的方法，其包括以下步骤：

(1)提供第五方面所述的核酸阵列，或者，通过第二方面所述的方法获得核酸阵列；其中，所述核酸阵列包含连接于固相支持物(例如芯片)表面的多种载体序列，每种载体序列在所述阵列中占有不同位置，并且每种载体序列包含多个拷贝的载体序列；

每个载体序列包含与其杂交的第一核酸分子，所述第一核酸分子包含与所述阵列上该种载体序列的位置相对应的定位序列互补序列以及能够捕获样品中的核酸的捕获序列；

(2)将所述核酸阵列在允许退火的条件下与待测样品接触，以使得待测样品中的核酸与所述第一核酸分子的捕获序列发生退火，从而使得该核酸的位置被对应至核酸阵列上的第一核酸分子的位置；

(3)在允许引物延伸的条件下，以所述第一核酸分子作为引物，以被捕获的核酸分子为模板，进行引物延伸反应，以产生延伸产物，与所述被捕获核酸分子杂交的链具有第一核酸分子中所包含的定位序列互补序列作为空间信息标记；

(5)直接或间接地分析步骤(4)中被释放的核酸分子的序列。

在某些实施方案中，在步骤(2)之前，所述方法还包括对所述载体序列的第一固定序列所包含的切割位点进行切割，以消化所述载体序列，同时将所述第一核酸分子(捕获探针)连接于固相支持物(例如芯片)表面。在此类实施方案中，所述核酸阵列包含连接于固相支持物(例如芯片)表面的多种捕获探针，每种捕获探针在所述阵列中占有不同位置，并且，所述捕获探针包含与所述阵列上该种捕获探针的位置相对应的定位序列互补序列以及能够捕获样品中的核酸的捕获序列；

(2)将所述核酸阵列在允许退火的条件下与待测样品接触，以使得待测样品中的核酸与所述捕获探针的捕获序列发生退火，从而使得该核酸的位置被对应至核酸阵列上的捕获探针的位置；

(3)在允许引物延伸的条件下，以所述捕获探针作为引物，以被捕获的核酸分子为模板，进行引物延伸反应，所产生的延伸产物包含作为空间信息标记的定位序列互补序列以及被捕获核酸分子的互补序列，从而产生空间信息标记的DNA分子；可选地，生成所述空间信息标记的DNA分子的互补链，和/或可选地，扩增所述空间信息标记的DNA分子；

(4)从阵列表面释放至少一部分空间信息标记的DNA分子和/或他们的互补链或扩增子，其中所述部分包括空间信息标记序列或其互补链；和

(5)直接或间接地分析步骤(4)中被释放的核酸分子的序列。

在第八方面所述方法的某些实施方案中，所述的第一核酸分子、捕获探针是DNA分子，例如单链DNA。

在第六至第八任一方面所述方法的某些实施方案中，所述核酸的空间信息包括核酸的定位、分布和/或表达。

在第六至第八任一方面所述方法的某些实施方案中，所述样品是组织样品，例如组织切片。在某些实施方案中，所述组织切片从固定组织制备，例如，以福尔马林固定石蜡包埋(FFPE)的组织或深度冷冻的组织。

在第六至第八任一方面所述方法的某些实施方案中，所述方法用于非诊断用途。

在第六至第八任一方面所述方法的某些实施方案中，在步骤(5)中可以采用任何核酸分析方法。在某些实施方案中，该步骤可以包括测序。在某些实施方案中，可以采用序列特异性分析方法。例如，可以实施序列特异性扩增反应，比如通过使用引物，且该引物对所述定位域和/或一种特定的目标序列(例如，一种待测的特定目标DNA)具有特异性。因此，在某些实施方案中，该步骤可以包括序列特异性的PCR反应。

在第六至第八任一方面所述方法的某些实施方案中，步骤(5)所得到的序列分析信息可被用于获得样品中核酸的空间信息(即，位置信息)。在某些实施方案中，该空间信息可从测得的序列分析信息的性质来推定，例如，其可以揭示一种特定核酸的存在，而该核酸可能在所测样品的环境中本身就具有空间信息意义，以及/或者可以结合阵列上样品的位置和测序信息来推定空间信息(例如，空间定位)。因此，本方法可以仅包括将序列分析信息与样品的某个位置相关联的步骤，例如，利用定位标记和其与样品上某位置间的关联性。在某些实施方案中，可以通过关联序列分析数据和样品图像来便利地获得空间信息。因此，在此类实施方案中，第六至第八任一方面所述方法还包括步骤(6)：将步骤(5)获得的序列分析信息与所述样品的图像相关联，其中该样品在步骤(3)之前或之后成像。在某些实施方案中，所述样品的成像是利用光、明视场、暗视场、相位差、荧光、镜像、干涉或共聚焦显微镜或其组合。

在第六方面所述方法的某些实施方案中，所述方法用于检测样品中的转录组。在此类实施方案中，在步骤(3)(i)中，以连接的第一和第二核酸分子作为反转录引物，从已捕获的RNA分子合成cDNA分子，所述cDNA分子具备第一核酸分子中所包含的定位序列互补序列作为空间信息标记，且可选地，扩增所述cDNA分子；或者，在步骤(3)(ii)中，以第二核酸分子作为反转录引物，从已捕获的RNA分子合成cDNA分子，连接杂交于每个载体序列上的第一核酸分子和所述cDNA分子(例如使用连接酶)，以产生具有第一核酸分子中所包含的定位序列互补序列作为空间信息标记的cDNA分子，且可选地，扩增所述cDNA分子；以及，在步骤(4)中，从阵列表面释放至少一部分所述cDNA分子和/或其扩增子，其中所述被释放的核酸分子可以是cDNA分子的第一和/或第二链或其扩增子，且其中所述部分包含空间信息序列或其互补链。在某些实施方案中，在步骤(1)中，所述捕获序列包含能够捕获mRNA的寡核苷酸序列。

在第七方面所述方法的某些实施方案中，所述方法用于检测样品中的转录组。在此类实施方案中，在步骤(3)(iii)中，以连接的第一和第二核酸分子作为反转录引物，从已捕获的RNA分子合成cDNA分子，所述cDNA分子具备第一核酸分子中所包含的定位序列互补序列作为空间信息标记，且可选地，扩增所述cDNA分子；以及，在步骤(4)中，从阵列表面释放至少一部分所述cDNA分子和/或其扩增子，其中所述被释放的核酸分子可以是cDNA分子的第一和/或第二链或其扩增子，且其中所述部分包含空间信息序列或其互补链。在某些实施方案中，在步骤(1)中，所述捕获序列包含能够捕获mRNA的寡核苷酸序列。

在第八方面所述方法的某些实施方案中，所述方法用于检测样品中的转录组。在此类实施方案中，在步骤(3)中，以所述捕获探针为RT引物，从已捕获的RNA分子合成cDNA分子，所述cDNA分子具备空间信息标记，且可选地，扩增所述cDNA分子；在此类实施方案中，在步骤(3)中，以所述第一核酸分子为RT引物，从已捕获的RNA分子合成cDNA分子，所述cDNA分子具备第一核酸分子中所包含的定位序列互补序列作为空间信息标记，且可选地，扩增所述cDNA分子。在步骤(4)中，从阵列表面释放至少一部分所述cDNA分子和/或其扩增子，其中所述被释放的核酸分子可以是cDNA分子的第一和/或第二链或其扩增子，且其中所述部分包含空间信息标记序列或其互补链。在某些实施方案中，在步骤(1)中，所述捕获序列包含能够捕获mRNA的寡核苷酸序列。

在第六至第八任一方面所述方法的某些实施方案中，在所述空间信息标记的核酸分子(例如DNA分子)或所述空间信息标记的cDNA分子从阵列表面释放之前或之后，生成所述互补链或所述cDNA第二链。

第二链DNA(例如cDNA)的合成步骤可以在阵列上原位进行，可以是单独的第二链合成步骤，也可以作为扩增反应的初始步骤。可选地，可以从阵列上释放DNA(例如cDNA)的第一链(也即，以被捕获核酸分子为模板所生成的链)，然后再进行第二链合成，例如，在溶液中进行反应，可以作为一个单独步骤或作为扩增反应中的一个步骤。

当第二链合成在阵列上(即原位)进行时，该方法可以包括一个可选的步骤，即在第二链合成前移除被捕获的核酸分子(如RNA)，例如可以采用RNA硝化酶(RNase)，如RNaseH。此步骤的操作流程为本领域所熟知并有记载。但是，此步骤一般并无必要，且在大多数情况下，RNA会自然降解。从阵列上除去样品的步骤，一般也会移除阵列上的RNA。

在某些实施方案中，DNA(例如cDNA)的第二链在单一反应中生成，第二链合成可以通过本领域已知的任何适当的方法来实现。例如，从阵列上释放的cDNA第一链，随后使用随机引物(例如六聚体引物)和DNA聚合酶(例如链置换聚合酶)，以第一链为模板进行DNA合成反应。因此，在某些实施方案中，所述互补链或第二链的合成使用随机引物和链置换聚合酶。

在第六至第八任一方面所述方法的某些实施方案中，在序列分析前进一步包括对所述空间信息标记的核酸分子(例如DNA分子)或cDNA分子进行扩增的步骤。在某些实施方案中，所述扩增步骤在所述空间信息标记的核酸分子(例如DNA分子)或cDNA分子从阵列释放之后实施，或所述扩增步骤在阵列上原位实施(也即，在所述第一核酸分子和/或载体序列和/或捕获探针依然连接于固相支持物表面时)。在某些实施方案中，所述扩增步骤包括PCR。

在第六至第八任一方面所述方法的某些实施方案中，在步骤(4)中，所述分子通过如下方法从阵列表面释放：(i)核酸剪切；(ii)变性；和/或(iii)物理方法。在某些实施方案中，通过将热水或缓冲液应用至所述固相支持物来释放所述分子。

在某些实施方案中，在测序之前进一步包括对被释放的分子进行纯化的步骤。

在某些实施方案中，在样品与阵列接触之后且步骤(3)之前，进一步包括给样品补水的步骤。

在某些实施方案中，在步骤(4)之前，所述方法进一步包括洗涤阵列以除去残余样品(例如，组织)的步骤。

在某些实施方案中，所述阵列包含至少一个方向标记，来为阵列上的样品定向。

在某些实施方案中，在步骤(5)中，所述序列分析步骤包括测序步骤。在某些实施方案中，所述测序步骤包括基于可逆染色终止剂的测序反应。

本发明第六至第八任一方面所述的检测核酸空间信息的方法可用于RNA检测以及转录组分析、DNA检测及基因组分析等。空间信息对转录组学及基因组学相关研究具有重要意义，特别是在例如组织的不同细胞或区域中的转录组或基因组变异研究中有用，例如比较正常和病态细胞或组织，或研究疾病进程中的转录组或基因组变化等。

举例来说，阿尔茨海默症的病理生理学分析显示其病变过程涉及到神经元和胶质细胞的相互作用，而相关转录组和表观基因组研究也发现，阿尔兹海默症病人大脑中的神经元功能严重受损、先天免疫反应异常。然而，群体水平的研究是不能够揭示细胞间和细胞群内变化的复杂性，尤其是对于那些稀有的细胞类型。普通单细胞水平的研究也不能够区分同时期不同组织区域的特定细胞类型特征与神经退行性病变期间的细胞成分变化。因此，要想进一步揭示疾病的致病机制和发展模式迫切需要获取带有空间维度的单细胞转录组信息。

本发明第六至第八任一方面所述的检测核酸空间信息的方法可以通过连接于芯片的带有位置标记的捕获序列将大脑组织样本中不同区域的核酸分子固定至芯片，并进行测序，从而获得含有准确位置信息的转录组结果，以实现对阿尔茨海默病病变期间不同区域的特定细胞类型的变化的检测。特别地，由于本发明芯片上DNB或DNA簇的活性区域低至纳米级，而细胞直径约为12um，因此本发明的芯片能够实现亚细胞分辨率的空间定位信息。

本发明还包含以下示例性实施方案：

项目1.一种产生核酸阵列的方法，所述核酸阵列用于检测样品中生物分子(例如核酸)的空间信息，所述方法包括以下步骤：

(1)提供环状核酸模板，所述环状核酸模板包含一种捕获探针的模板序列，所述模板序列在5’至3’方向上包含接头区、空间标签区及捕获区；其中，

所述接头区包含切割位点，所述切割可以选自切刻酶(nicking enzyme)酶切、USER酶切、光切除、化学切除或CRISPR切除；

所述空间标签区包含空间标签序列，所述空间标签序列对应于该种捕获探针在阵列上的位置；

所述捕获区包含能够捕获样品中生物分子(例如核酸)的捕获序列；其中，所述捕获序列包括：(1a)能够捕获mRNA的寡核苷酸序列；和/或，(1b)随机或简并的寡核苷酸序列；或，(c)针对特定靶分子(例如靶核酸)的特异性序列；

(2)以所述环状核酸模板为模板进行滚环扩增(RCA)，以获得由所述模板序列的互补序列(即，模板互补序列)的多联体所形成的纳米球(DNB)；

(3)将所述DNB连接于固相载体(例如芯片)表面；

(4)提供探针引物，并以所述DNB所包含的模板互补序列为模板，进行引物延伸反应，以产生延伸产物，其中与所述模板互补序列杂交的链即为捕获探针；可选地，扩增所述延伸产物；所述探针引物在5’至3’方向上包含结合区、切除区和引物接头区；其中，

所述结合区包含能够与所述固相载体表面连接的连接子；

所述切除区包含切割位点；

所述引物接头区与所述DNB所包含的模板互补序列的接头区序列(也即，所述模板序列接头区的互补序列)的全部或部分互补，且具有3’自由端，以使所述探针引物能作为引物起始延伸反应；优选地，所述引物接头区包含所述模板序列的接头区的序列或其片段；

(5)将所述探针引物与所述固相载体表面连接；其中，步骤(4)与(5)以任意顺序进行；

(6)对接头区所包含的切割位点进行切割，以消化所述DNB，使得步骤(4)中的延伸产物与形成延伸产物的模板DNB分离，从而将捕获探针连接于固相载体(例如芯片)表面；

优选地，所述环状核酸模板、DNB以及捕获探针是DNA；

优选地，在步骤(1)中提供多种环状核酸模板，每种环状核酸模板包含各不相同的捕获探针的模板序列，从而获得表面连接有多种捕获探针的固相载体(例如芯片)。

项目2.项目1的方法，其中，所述接头区所包含的切割位点是切刻酶酶切位点；

优选地，所述切刻酶选自USER、BamHI、BmtI。

项目3.项目1或2的方法，其中，所述接头区还包含测序引物杂交区和/或扩增引物杂交区；其中，所述测序引物杂交区允许测序引物退火并起始测序反应，所述扩增引物杂交区允许扩增引物退火并起始延伸及扩增反应。

项目4.项目1-3任一项的方法，其中，所述能够捕获mRNA的寡核苷酸序列包括能够与mRNA的poly-A尾杂交的序列；

优选地，所述能够捕获mRNA的寡核苷酸序列包括poly-T寡核苷酸序列；

优选地，所述poly-T寡核苷酸序列包括至少10个(例如至少20个)脱氧胸腺嘧啶核苷残基。

项目5.项目1-4任一项的方法，其中，所述模板序列还包含位于所述捕获区上游、且位于所述接头区下游的探针标签区，所述探针标签区包含由修饰碱基组成的探针标签互补序列，所述修饰碱基能够与多种主要碱基(例如，C、G、A、T、U)形成氢键互补配对；

优选地，所述探针标签区位于所述空间标签区和捕获区之间，或者位于所述接头区与空间标签区之间；

优选地，所述探针标签互补序列包含多个(例如至少10个)Inosine。

项目6.项目1-5任一项的方法，其具备以下特征中的一项或多项：

(i)所述接头区的长度大于1bp，例如大于10bp，或大于20bp；优选地，所述接头区的长度为20-100bp；

(ii)所述空间标签区的长度大于1bp，例如大于10bp；优选地，所述空间标签区的长度为10-100bp；

(iii)所述捕获区的长度大于1bp；优选地，所述捕获区的长度为1-100bp；

(iv)所述探针标签区的长度大于1bp，例如大于5bp；优选地，所述探针标签区的长度为5-100bp。

项目7.项目1-6任一项的方法，其中，所述固相载体是芯片；

优选地，所述固相载体能够用作测序平台，例如测序芯片。

项目8.项目1-7任一项的方法，其中，在步骤(4)中，在进行引物延伸反应的同时，对所述空间标签序列的互补序列进行测序，从而获得相应的捕获探针所包含的空间标签序列的序列信息。

项目9.项目1-7任一项的方法，其中，在步骤(4)之前，还包括对所述DNB所包含的空间标签序列的互补序列进行测序的步骤；

优选地，在完成测序之后，通过洗涤以去除因测序而被添加至合成链中的dNTP。

项目10.项目1-9任一项的方法，其中，所述连接子是能够与活化基团(例如NH₂)偶联的连接基团，所述固相载体表面具有活化基团(例如NH₂)修饰；

优选地，所述连接子包括-SH、-DBCO或-NHS；

项目11.项目1-10任一项的方法，其中，所述切除区所包含的切割位点是可以通过化学、酶或光化学方法进行受控切割的位点；

优选地，所述切割位点是酶切位点；

优选地，所述切除区与所述接头区所包含的切割位点不同。

项目12.项目1-11任一项的方法，其中，在所述扩增包括PCR。

项目13.通过项目1-12任一项的方法制备的核酸阵列。

项目14.一种用于检测样品中生物分子(例如核酸)的空间信息的核酸阵列，其包括表面连接有多种捕获探针的固相载体(例如芯片)，每种捕获探针在所述阵列中占不同位置，且定向为具有3’自由端以使所述捕获探针能作为延伸引物，其中每种捕获探针从5’到3’的方向上包含：结合区、切除区、空间标签序列以及捕获序列，其中，

所述结合区包含能够与所述固相载体表面连接的连接子；

所述切除区包含切割位点；

所述空间标签序列与所述阵列上该种捕获探针的位置相对应；

所述捕获序列能够与待捕获生物分子(例如核酸)的全部或部分杂交，其包括：(1a)能够捕获mRNA的寡核苷酸序列；和/或，(1b)随机或简并的寡核苷酸序列；或，(c)针对特定靶分子(例如靶核酸)的特异性序列。

项目15.项目14的核酸阵列，其中，所述每种捕获探针中的每条捕获探针(也即，包含相同空间标签序列的捕获探针)具备彼此不同的探针标签序列，所述探针标签序列位于所述捕获序列的上游，并且位于所述切割区的下游；

优选地，所述探针标签序列位于所述捕获序列与空间标签序列之间，或者，位于所述切割区与空间标签序列之间。

项目16.项目14或15的核酸阵列，其中，所述每种捕获探针(也即，包含相同空间标签序列的捕获探针)在所述固相载体表面所占的面积(也即，活性区域)的直径小于1微米；

优选地，所述每种捕获探针的活性区域的直径为约500纳米。

项目17.项目14-16任一项的核酸阵列，其中，所述固相载体是芯片；

优选地，所述固相载体能够用作测序平台，例如测序芯片。

项目18.项目14-17任一项的核酸阵列，其中，所述核酸阵列通过项目1-12任一项的方法制备。

项目19.一种检测样品中生物分子的空间信息的方法，其包括以下步骤：

(1)提供项目13-18任一项的核酸阵列，或者，通过项目1-12任一项的方法获得核酸阵列；所述核酸阵列包含连接于固相载体(例如芯片)表面的多种捕获探针，每种捕获探针在所述阵列中占有不同位置，并且，所述捕获探针包含与所述阵列上该种捕获探针的位置相对应的空间标签序列以及能够捕获样品中的生物分子的捕获序列；

(2)将所述核酸阵列与待测样品接触，以使得所述捕获探针的捕获序列与待测样品中的生物分子结合，从而使得该生物分子的位置被对应至核酸阵列上的捕获探针的位置，并且产生空间标签标记的生物分子；

(3)从阵列表面释放空间标签标记的生物分子；和

(4)直接或间接地分析步骤(3)中被释放的生物分子的序列。

项目20.一种检测样品中核酸的空间信息的方法，其包括以下步骤：

(1)提供项目13-18任一项所述的核酸阵列，或者，通过项目1-12任一项的方法获得核酸阵列；所述核酸阵列包含连接于固相载体(例如芯片)表面的多种捕获探针，每种捕获探针在所述阵列中占有不同位置，并且，所述捕获探针包含与所述阵列上该种捕获探针的位置相对应的空间标签序列以及能够捕获样品中的核酸的捕获序列；

(3)在允许引物延伸的条件下，以所述捕获探针作为引物，以被捕获的核酸分子为模板，进行引物延伸反应，所产生的延伸产物包含空间标签序列以及被捕获核酸分子的互补序列，从而产生空间标签标记的DNA分子；可选地，生成所述空间标签标记的DNA分子的互补链，和/或可选地，扩增所述空间标签标记的DNA分子；

(4)从阵列表面释放至少一部分空间标签标记的DNA分子和/或他们的互补链或扩增子，其中所述部分包括空间标签序列或其互补链；和

(5)直接或间接地分析步骤(4)中被释放的核酸分子的序列；

优选地，所述核酸的空间信息包括核酸的定位、分布和/或表达；

优选地，所述捕获探针是DNA分子；

优选地，所述样品是组织样品，例如组织切片；

优选地，所述组织切片从固定组织制备，例如，以福尔马林固定石蜡包埋(FFPE)的组织或深度冷冻的组织。

项目21.项目20的方法，在步骤(5)中，所述序列分析包括测序或序列特异性的PCR反应。

项目22.项目20或21的方法，所述方法还包括步骤(6)：将步骤(5)获得的序列分析信息与所述样品的图像相关联，其中该样品在步骤(3)之前或之后成像。

项目23.项目20-22任一项的方法，所述方法用于检测样品中的转录组，其中：

在步骤(3)中，以所述捕获探针为RT引物，从已捕获的RNA分子合成cDNA分子，所述cDNA分子具备空间标签标记，且可选地，扩增所述cDNA分子；

在步骤(4)中，从阵列表面释放至少一部分所述cDNA分子和/或其扩增子，其中所述被释放的核酸分子可以是cDNA分子的第一和/或第二链或其扩增子，且其中所述部分包含空间标签序列或其互补链；

优选地，在步骤(1)中，所述捕获序列包含能够捕获mRNA的寡核苷酸序列。

项目24.项目20-23任一项的方法，其中，在所述空间标签标记的DNA分子或所述空间标签标记的cDNA分子从阵列表面释放之前或之后，生成所述互补链或所述cDNA第二链；

优选地，所述互补链或第二链的合成使用随机引物和链置换聚合酶。

项目25.项目20-24任一项的方法，其中，在序列分析前进一步包括对所述空间标签标记的DNA分子或cDNA分子进行扩增的步骤；

优选地，所述扩增步骤在所述空间标签标记的DNA或cDNA分子从阵列释放之后实施，或所述扩增步骤在阵列上原位实施；

优选地，所述扩增步骤包括PCR。

项目26.项目20-25任一项的方法，其中，在序列分析之前进一步包括对被释放的分子(例如，核酸分子)进行纯化的步骤。

项目27.项目20-26任一项的方法，在步骤(4)之前，所述方法进一步包括洗涤阵列以除去残余样品(例如，组织)的步骤。

项目28.项目20-27任一项的方法，在步骤(4)中，所述分子通过如下方法从阵列表面释放：(i)核酸剪切；(ii)变性；和/或(iii)物理方法；

优选地，所述分子通过酶切从捕获探针的切除区释放。

项目29.项目20-28任一项的方法，在步骤(6)中，所述样品的成像是利用光、明视场、暗视场、相位差、荧光、镜像、干涉或共聚焦显微镜或其组合。

有益效果

本发明提供了一种全新的用于检测核酸空间信息的阵列及其制备方法，该核酸阵列应用于核酸空间信息检测时，可以同时实现高精度亚细胞定位和高通量组织定位。本发明的阵列及基于该阵列的检测方法在细胞定位，亚细胞定位，细胞器定位，细胞互作，细胞器互作，分子通路研究，疾病诊断等方面具备重大应用价值。

附图说明

图1示出了实施例2中捕获mRNA后进行cDNA合成的结构示意图。

图2示出了实施例2中从芯片上释放的分子的结构示意图。

图3显示了实施例2中2100检测cDNA片段分布的结果。

图4显示了实施例3中cDNA测序所得到的一链25bp序列与捕获芯片上定位序列的fq的匹配结果。

图5显示了实施例3中组织切片中mRNA的表达情况图。

图6显示了实施例4中一个示例性实施方案的探针引物及DNB中所包含的载体序列结构示意图。

图7示出了实施例4中芯片上所连接的探针结构示意图。

图8显示了实施例5中对所捕获的核酸分子进行cDNA合成后的结构示意图。

图9显示了实施例5中从芯片上所释放的分子的结构示意图。

图10显示了实施例5中2100检测cDNA片段分布的结果。

图11显示了实施例6中cDNA测序所得到的一链20bp序列与捕获芯片上定位序列的fq的匹配结果。

图12显示了实施例6中组织切片中mRNA的表达情况图。

具体实施方式

现参照下列意在举例说明本发明(而非限定本发明)的实施例来描述本发明。

除非特别指明，否则基本上按照本领域内熟知的以及在各种参考文献中描述的常规方法进行实施例中描述的实验和方法。另外，实施例中未注明具体条件者，按照常规条件或制造商建议的条件进行。所用试剂或仪器未注明生产厂商者，均为可以通过市购获得的常规产品。本领域技术人员知晓，实施例以举例方式描述本发明，且不意欲限制本发明所要求保护的范围。本文中提及的全部公开案和其他参考资料以其全文通过引用合并入本文。

实施例1.捕获芯片的制备-1

1、设计并合成下述DNA文库序列。委托华大六合进行序列合成。

5’磷酸化-AAGTCGGAGGCCAAGCGGTCTTAGGAAGACAA(接头A，SEQ ID NO:1)NNNNNNNNNNNNNNNNNNNNNNNNN(定位序列互补序列，N表示任意碱基，例如C、G、A或T)CTGATAAGGTCGCCA(第二固定序列互补序列，SEQ ID NO:2)CAACTCCTTGGCTCACAGAACGACATGGCTACGATCCGACTT(接头B，SEQ ID NO:3)-3’。其中，接头A包含第一固定序列互补序列的部分序列以及环化位点，接头B包含第一固定序列互补序列的另一部分、酶切位点、环化位点。

2、文库原位扩增

DNA纳米球(DNB)制备：配置下面的反应体系40ul，投入80fmol上述DNA文库，DNB引物序列为GGCCTCCGACTTAAGTCGGATCGT(SEQ ID NO:4)，由华大六合合成。

成分	体积(ul)	终浓度
			DNA文库序列	80fmol(X)
10×phi29buffer(BGI自产)	4	1X
			DNB引物序列10uM	4	1uM
分子水	32-x

将上述反应体积放置于PCR仪反应，反应条件如下：95℃3min，40℃3min；反应结束后，放于冰上，加入40ul DNBSEQ测序试剂盒中DNB制备所需的混合酶I，2ul混合酶II，及1ulATP(母液100mM，Thermo Fisher)，0.1ul T4 ligase(BGI自产)，混匀后，将上述反应体系至于PCR仪30℃，反应20min，形成DNB。将所述的DNB按照BGISEQ500 SE50试剂盒所述的方法将DNB装载至BGISEQ500测序芯片上。

3、定位序列的测序解码：按照BGISEQ500 SE50测序试剂盒说明书，对定位序列进行解码测序，设置25bp的测序长度。测序形成的fq文件储存待用。

4、捕获序列固定：委托华大六合合成下面DNA序列：5’磷酸化-CTGATAAGGTCGCCA(第二固定序列互补序列，SEQ ID NO:5)NNNNNNNNNN(UMI)TTTTTTTTTTTTTTTTTTTVN(捕获序列，SEQ ID NO:6)-3’，其中，N表示任意碱基(例如，C、G、A或T)。将测序芯片从测序仪取下，向芯片中泵入BGISEQ500 SE50试剂盒中的7号孔位的切除试剂(保证试剂覆盖整张芯片，无气泡产生)，将芯片置于60℃，反应10min。反应完后，在测序芯片中泵入适量的5×SSC(上海生工购买)，使SSC充分置换芯片中上一个试剂。用5×SSC稀释捕获序列至1uM，加入适量稀释好的捕获序列至芯片，使芯片中充满捕获序列。将芯片置于常温反应30min左右，使捕获序列充分杂交至DNB上。

5、芯片切块：将制备好的芯片切成若干小片，切片大小根据实验需要进行调整，将芯片浸泡在50mM pH8.0的tris buffer中，制备4℃待用。

实施例2.组织mRNA捕获及cDNA合成

1.冰冻组织切片。按照冰冻切片的标准流程，制作小鼠的小脑组织切片。

2.mRNA捕获。根据切片组织的大小，取合适大小的实施例1制备的芯片，放置于室温，至芯片上的液体挥发完后，在切片机内利用切片组织和芯片的温差，将切片组织贴在捕获芯片上。将贴好的组织切片放置室温，在芯片上加入5×SSC反应液(充分覆盖贴有组织的区域)，30℃反应30min后，使组织内的mRNA与芯片上的捕获区域充分杂交反应。

3.cDNA合成。使用5×SSC室温清洗芯片两次，配置如下逆转录酶反应体系200ul，将反应液加到芯片上，充分覆盖，42℃反应90min-180min，mRNA将以polyT为引物进行cDNA合成，mRNA的3端带上TSO标签(AAGTCGGAGGCCAAGCGGTC/rG//rG//iXNA_G/)(SEQ ID NO:7)，用于cDNA互补链的合成。上述过程的结构示意图如图1所示。

4.空间定位区与捕获区连接。cDNA合成后，用5×SSC清洗芯片两次，配置如下反应体系1ml，向芯片中泵入合适的体积，保证芯片中充满下列连接反应液，将图1中所示的nick补齐。室温反应30min。反应结束后，使用5×SSC清洗芯片，温度55℃，清洗3遍，每遍5min。

成分	体积(ul)	浓度
			10× T4 ligase buffer(BGI自产)	100	1×
T4 ligase(600U/ul,BGI自产)	100	60u/ul
			甘油(阿拉丁)	10	10％
分子水	790

5.cDNA释放。cDNA一链在芯片合成后，在芯片上加入适量的formamide溶液，并在55℃下反应10min，将cDNA链从芯片上释放下来。所释放的分子具有如图2所示的结构。收集从芯片上释放的反应液，使用2×XP磁珠纯化cDNA一链，最后用45ul TE buffer(Thermofisher)回收产物。使用qubit ssDNA检测试剂盒对cDNA单链进行定量检测。

6.cDNA扩增。配置如下反应体系100ul：

将上述反应体系至于PCR仪，设置如下反应程序，95℃3min，11循环(98℃20s，58℃20s，72℃3min)，72℃5min，4℃∞。反应结束后，用XP beads进行磁珠纯化回收。使用qubit试剂盒dsDNA浓度定量，2100检测cDNA片段分布。2100检测结果如图3所示，cDNA长度正常。

实施例3.cDNA建库测序

1.Tn5打断。根据cDNA浓度，取20ng cDNA，加入0.5uM Tn5打断酶及相应buffer(Tn5打断酶包被方法按照stLFR建库试剂盒操作)，混匀配成20ul的反应体系，在55℃反应10min后，加入5ul 0.1％SDS混匀室温5min结束Tn5打断步骤。

2.PCR扩增。配置如下反应体系100ul：

混匀后置于PCR仪，设置如下程序95℃3min，11循环(98℃20s，58℃20s，72℃3min)，72℃5min，4℃∞。反应结束后，用XP beads进行磁珠纯化回收。使用qubit试剂盒dsDNA浓度定量。

3.测序。取上述打断后的扩增产物80fmol，进行DNB制备。配置如下40ul反应体系：

将上述反应体积放置于PCR仪反应，反应条件如下：95℃3min，40℃3min；反应结束后，放于冰上，加入40ul DNBSEQ测序试剂盒中DNB制备所需的混合酶I，2ul混合酶II，及1ulATP(母液100mM，Thermo Fisher)，0.1ul T4 ligase(BGI自产)，混匀后，将上述反应体系至于PCR仪30℃，反应20min，形成DNB。将所述的DNB按照MGISEQ2000上PE50试剂盒所述的方法将DNB装载至MGISEQ2000的测序芯片上，并按照相关说明书进行测序，选择PE50测序模型，其中一链测序分成两段测序25bp后进行15cycle暗反应后，再测10bp UMI序列，二链设置50bp。

数据分析

1.通过比对将cDNA测序所得到的一链25bp序列，与捕获芯片上定位序列的fq(实施例1中步骤3所得的测序结果)进行匹配。匹配结果如图4所示，亮区是cDNA测序的25bp与捕获芯片完全匹配的区域，此区域代表捕获芯片上用于组织捕获的区域。说明捕获芯片可以使用空间定位区域对组织捕获区进行精确定位。

2.对cDNA测序匹配到捕获芯片的DNB进一步分析，将这些DNB reads的二链测序结果cDNA(反应组织中的mRNA表达)与小鼠的基因组进行比对分析。将比对上小鼠基因组的DNB，通过25bp的测序结果将小鼠的mRNA信息比对到捕获芯片上，如图5所示，左边显示的是所分析的组织切片中mRNA的表达全貌，该全貌图表明，此捕获芯片可以分析出组织中mRNA的表达差异。此图右边是随机取小鼠小脑中表达的一个基因在组织中的表达水平，表明此芯片可以分析出组织样品中某个基因在整个组织中的表达差异。

实施例4.捕获芯片的制备-2

1.设计并合成下述DNA文库序列。委托华大六合进行序列合成。

5’磷酸化-GAACGACATGGCTTTTTCCCGTAGCCATGTCGTTCTGCGCCTTC CCGATG(固定序列1，SEQ ID NO:12)NNNNNNNNNNNNNNNNNNNN(定位序列模板序列，N表示任意碱基，例如，C、G、A或T)IIIIIIIIII(UMI模板序列，I为Inosine)TTTTTTTTTTTTTTTTTTTTT(捕获序列，SEQ IDNO:13)CCTCAG C(酶切位点，SEQ ID NO:14)CCTTGGCTCACA(固定序列2，SEQ ID NO:15)。其中，固定序列1包含第一固定序列互补序列的部分序列以及环化位点，固定序列2包含第一固定序列互补序列的部分序列以及环化位点。

2.文库原位扩增

DNA纳米球(DNB)制备：配置下面的反应体系40ul，投入80fmol上述DNA文库，DNB引物序列为GACATGGCTACGTGTGAGCCAAGG(SEQ ID NO:16)，由华大六合合成。

成分	体积(ul)	终浓度
			DNA文库序列	80fmol(×)
10×phi29buffer(BGI自产)	4	1×
			DNB引物序列10uM	4	1uM
分子水	32-x

3.空间信息解码

(1)芯片表面修饰：

将上述BGISEQ-500平台芯片表面连接Azido-8-NHS ester，结构如下：

按照下列方法进行芯片表面修饰：NHS-PEG8-Azido(564.58g/mol)浓度为45μM，配制100ml方法：

试剂	用量	单位
			NHS-PEG8-Azido	2.54	mg
1×PBS(pH 7.4)	100	ml

-20℃保存，避免反复冻融。

DBCO-primer浓度为1uM，用PBS稀释

(2)引物探针偶联：

华大六合定制合成以下引物探针序列：

DBCO(连接基团)-UUU(USER酶切位点)TTTTTCCCGTAGCCATGTCGTTCTGCGCCTTCCCGATG(SEQ ID NO:17，该序列包含第一固定序列互补序列、PCR扩增位点序列、中间序列)。将1uM的上述引物探针序列使用PBS稀释通入修饰有azido的芯片上，室温反应1h或过夜。

(3)空间信息解码。按照BGISEQ500 SE50测序试剂盒说明书，对空间信息序列进行解码测序，设置30bp的测序长度(前20bp为空间信息序列，后10bp为探针标签序列)。测序形成的fq文件储存待用。

(4)捕获区合成：

配制dTTP及Hifi聚合酶的混合液，以DNB为模板，含有空间定位区的探针序列为引物，dTTP为底物，延伸出oligo dT序列。

4.含有空间信息的探针释放

配制1uM Spatial_RNA_BbvCI引物(用5×SSC稀释)，引物序列CCTCAGCCAACTCCT(SEQ ID NO:18)由华大六合合成；室温杂交30min；配制BbvCI切除体系(1.5ml)：15ul RE+150ul 10×CS Buffer+1335ul ddH₂O，通入空间定位区解码后的芯片，在37℃反应1h或过夜，加入用测序试剂盒(华大智造)中的WB2洗两次，再使用formamide在55℃下反应15min，最后使用WB2冲洗两次。所得探针示意图如图7所示，探针序列如下所示：

UUU(切除区)TTTTTCCCGTAGCCATGTCGTTCTGCGCCTTCCCGATG(第一固定序列互补序列，SEQ ID NO:19)NNNNNNNNNNNNNNNNNNN(定位序列互补序列，其与步骤一中的DNA文库序列中的定位序列模板序列相同)NNNNNNNNNN(UMI序列，其是以步骤一中的UMI模板序列为模板获得的随机碱基序列的互补序列)TTTTTTTTTTTTTTTTTTTTT(捕获序列，SEQ ID NO:20)。

5.芯片切块

将制备好的捕获芯片切成若干小片，切片大小根据实验需要进行调整，将芯片浸泡在50mM pH8.0的tris buffer中，4℃待用。

实施例5.组织mRNA捕获及cDNA合成

2.mRNA捕获。根据切片组织的大小，取合适大小的实施例4制备获得的芯片，放置于室温，至芯片上的液体挥发完后，在切片机内利用切片组织和芯片的温差，将切片组织贴在捕获芯片上。将贴好的组织切片放置室温，在芯片上加入5×SSC反应液(充分覆盖贴有组织的区域)，30℃反应30min后，使组织内的mRNA与芯片上的捕获区域充分杂交反应。

3.cDNA合成。使用5×SSC室温清洗芯片两次，配置如下逆转录酶反应体系200ul，将反应液加到芯片上，充分覆盖，42℃反应90min-180min，mRNA将以polyT为引物进行cDNA合成，mRNA的3端带上TSO标签(CGTAGCCATGTCGTTCTGCG/rG//rG//iXNA_G/)(SEQ ID NO:21)，用于cDNA互补链的合成。上述过程的结构示意图如图8所示。

4.cDNA释放。cDNA一链在芯片合成后，配制user酶反应体系，并按照USER酶的使用说明书进行反应。所释放的分子具有如图9所示的结构。收集从芯片上释放的反应液，使用2×XP磁珠纯化cDNA一链，最后用45ul TE buffer(Thermo fisher)回收产物。

5.cDNA扩增。配置如下反应体系100ul：

将上述反应体系至于PCR仪，设置如下反应程序，95℃3min，11循环(98℃20s，58℃20s，72℃3min)，72℃5min，4℃∞。反应结束后，用XP beads进行磁珠纯化回收。使用qubit试剂盒dsDNA浓度定量，2100检测cDNA片段分布。2100检测结果如图10所示，cDNA长度正常。

实施例6.cDNA建库测序

2.PCR扩增。配置如下反应体系100ul：

将上述反应体积放置于PCR仪反应，反应条件如下：95℃3min，40℃3min；反应结束后，放于冰上，加入40ul DNBSEQ测序试剂盒中DNB制备所需的混合酶I，2ul混合酶II，及1ulATP(母液100mM，Thermo Fisher)，0.1ul T4 ligase(BGI自产)，混匀后，将上述反应体系至于PCR仪30℃，反应20min，形成DNB。将所述的DNB按照MGISEQ2000上PE50试剂盒所述的方法将DNB装载至MGISEQ2000的测序芯片上，并按照相关说明书进行测序，选择customer测序模式，其中中一链测序分成两段测序20bp后进行10bp探针标签序列测序，二链设置50bp。

数据分析

1.通过比对将cDNA测序所得到的一链20bp序列，与芯片上空间信息序列的fq(实施例四中步骤3所得的测序结果)进行匹配。匹配结果如图11所示，亮区是cDNA测序的20bp与捕获芯片完全匹配的区域，此区域代表捕获芯片上用于组织捕获的区域。说明捕获芯片可以使用空间定位区域对组织捕获区进行精确定位。

2.对cDNA测序匹配到捕获芯片的DNB进一步分析，将这些DNB reads的二链测序结果cDNA(反应组织中的mRNA表达)与小鼠的基因组进行比对分析。将比对上小鼠基因组的DNB，通过20bp的测序结果将小鼠的mRNA信息比对到捕获芯片上，如图12所示，左边显示的是所分析的组织切片中mRNA的表达全貌，该全貌图表明，此捕获芯片可以分析出组织中mRNA的表达差异。此图右边是随机取小鼠小脑中表达的一个基因在组织中的表达水平，表明此芯片可以分析出组织样品中某个基因在整个组织中的表达差异。

尽管本发明的具体实施方式已经得到详细的描述，但本领域技术人员将理解：根据已经公布的所有教导，可以对细节进行各种修改和变动，并且这些改变均在本发明的保护范围之内。本发明的全部分为由所附权利要求及其任何等同物给出。

Claims

1.一种产生核酸阵列的方法，其包括以下步骤：

(1)于固相支持物(例如芯片)表面提供多种载体序列，每种载体序列包含多个拷贝的载体序列，所述载体序列包含：第二固定序列、定位序列和第一固定序列，

所述定位序列具有与该种载体序列在固相支持物上的位置相对应的独一无二的核苷酸序列；

所述第一固定序列允许与其互补的核苷酸序列(例如，引物)发生退火并起始延伸反应；

(2)提供探针引物，并以所述载体序列为模板，进行引物延伸反应；生成第一核酸分子，所述第一核酸分子包含第一固定序列的互补序列、定位序列的互补序列和第二固定序列的互补序列；

(3)提供第二核酸分子，所述第二核酸分子包括捕获模板序列和第三固定序列，所述第三固定序列能够与所述第一核酸分子的第二固定序列的互补序列至少部分互补，从而将第二核酸分子杂交到第一核酸分子，并以第二核酸分子为模板，继续延伸第一核酸分子，获得延伸的第一核酸分子；

其中，所述延伸的第一核酸分子即捕获探针，所述捕获探针包括：第一固定序列的互补序列、定位序列的互补序列、第二固定序列的互补序列和捕获序列，所述捕获序列能够捕获待测样品中的核酸分子。

2.权利要求1所述的方法，其中，所述方法用于检测生物样品中核酸的空间信息；

优选地，所述捕获序列包括：(a)能够捕获mRNA的寡核苷酸序列；和/或，(b)随机或简并的寡核苷酸序列；或，(c)针对特定靶核酸的特异性序列。

3.权利要求1或2所述的方法，其中，在步骤(2)中，在进行所述延伸反应的同时，对所述载体序列或其部分进行测序，生成第一核酸分子，并获得载体序列所包含的定位序列的序列信息；

优选地，通过测序获得所述载体序列所包含的定位序列的序列信息；

优选地，所述延伸反应为边合成边测序(SBS)，基于所述边合成边测序生成所述第一核酸分子，并获得所述载体序列所包含的定位序列的序列信息；

优选地，通过测序获得所述载体序列所包含的定位序列、第一固定序列和/或第二固定序列的序列信息。

4.权利要求1-3任一项所述的方法，其中，在步骤(2)中，将所述探针引物固定在所述固相支持物表面；

优选地，在步骤(2)中，将所述探针引物与所述固相支持物表面连接；

优选地，所述探针引物还包含结合区，以使其与所述固相支持物表面连接；其中，所述结合区包含能够与所述固相支持物表面连接的连接子；

优选地，所述探针引物在5’至3’方向上包含结合区、切除区和固定序列(例如，第一固定序列)互补区，所述结合区包含能够与所述固相支持物表面连接的连接子，所述切除区包含切割位点，所述固定序列互补区至少部分能够与载体序列的第一固定序列结合，进而以所述载体序列为模板，进行引物延伸反应。

5.权利要求4所述的方法，其中，所述连接子是能够与活化基团(例如NH₂)偶联的连接基团，所述固相支持物表面具有活化基团(例如NH₂)修饰；

优选地，所述连接子包括-SH、-DBCO或-NHS；

优选地，所述连接子是所述固相支持物表面连接有

6.权利要求4所述的方法，其中，所述切除区所包含的切割位点是可以通过化学、酶或光化学方法进行受控切割的位点；

优选地，所述探针引物的切除区所包含的切割位点是酶切位点。

7.权利要求1-6任一项所述的方法，其中，所述多种载体序列固定于固相支持物(例如芯片)表面；

优选地，在步骤(1)中，所述多种载体序列随机固定于固相支持物(例如芯片)表面；

优选地，在步骤(1)中，通过将所述多种载体序列连接于固相支持物(例如芯片)表面，以获得表面固定有多种载体序列的固相支持物；

优选地，在步骤(1)中，通过将所述多种载体序列随机连接于固相支持物(例如芯片)表面，以获得表面固定有多种载体序列的固相支持物；

优选地，在步骤(1)中，通过将所述多种载体序列装载于固相支持物(例如芯片)表面，以获得表面固定有多种载体序列的固相支持物；

优选地，在步骤(1)中，通过将所述多种载体序列随机装载于固相支持物(例如芯片)表面，以获得表面固定有多种载体序列的固相支持物；

优选地，每种载体序列在所述固相支持物中占不同位置。

8.权利要求1-7任一项所述的方法，其中，所述方法具有选自下列的一项或多项特征：

(1)所述第一核酸分子从5’至3’方向上包含第一固定序列的互补序列、定位序列的互补序列和第二固定序列的互补序列；

(2)所述第一引物包含测序接头，如MGI测序平台的测序接头；

(3)第二核酸分子从5’至3’方向上包括捕获模板序列和第三固定序列；

(4)所述捕获探针从5’至3’方向上包括：第一固定序列的互补序列、定位序列的互补序列、第二固定序列的互补序列和捕获序列；

(5)所述固定序列还包含测序引物杂交区和/或扩增引物杂交区；其中，所述测序引物杂交区允许测序引物退火并起始测序反应，所述扩增引物杂交区允许扩增引物退火并起始延伸及扩增反应。

9.权利要求1-8任一项所述的方法，在步骤(1)之前进一步包括：

(ii)以每种载体模板序列为模板，进行核酸扩增反应，获得每种载体模板序列的扩增产物，所述扩增产物包含多个拷贝的载体序列；

其中，所述核酸扩增反应选自滚环复制(RCA)、桥式PCR扩增、多重链置换扩增(MDA)或乳液PCR扩增。

10.权利要求9所述的方法，其中，所述多个拷贝的载体序列是由所述载体序列的多联体所形成的DNB；

优选地，所述核酸扩增反应选自滚环复制(RCA)和/或多重链置换扩增(MDA)；

优选地，通过滚环复制获得由所述载体序列的多联体所形成的DNB。

11.权利要求9所述的方法，其中，所述多个拷贝的载体序列是由所述载体序列的克隆群形成的DNA簇；

优选地，所述核酸扩增反应选自桥式PCR扩增和/或乳液PCR扩增；

优选地，通过桥式PCR扩增或乳液PCR扩增或多重链置换扩增，获得由所述载体序列的克隆群形成的DNA簇。

12.权利要求1-11任一项所述的方法，其中，包含相同定位序列的多个拷贝的载体序列在所述固相支持物表面所占的面积的直径小于1微米；

优选地，所述每种载体序列(也即，包含相同定位序列的多个拷贝的载体序列)或每种捕获探针(也即，包含相同定位序列/定位序列互补序列的捕获探针)在所述固相支持物表面所占的面积(也即，活性区域)的直径小于1微米。

13.权利要求1-12任一项所述的方法，其中，所述第一核酸分子还包含唯一分子标识符(UMI)序列，所述UMI序列位于固定序列(例如，第一固定序列)互补序列的5’端；

所述UMI序列是由至少1个(例如至少2个，至少3个，至少4个，或至少5个；例如5-100个)N组成的核苷酸序列，每个N各自独立地为A、C、G和T中的任何一种。

14.权利要求1-12任一项所述的方法，其中，所述第二核酸分子还包含UMI序列，所述UMI序列的互补序列位于捕获序列的5’端；

15.权利要求2-14任一项所述的方法，其中，所述能够捕获mRNA的寡核苷酸序列包括能够与mRNA的poly-A尾杂交的序列；

16.权利要求1-15任一项所述的方法，其中，所述载体序列的固定序列(例如，第一固定序列)还包含切割位点，所述切割可以选自切刻酶(nicking enzyme)酶切、USER酶切、光切除、化学切除或CRISPR切除；

任选地，在步骤(2)生成所述第一核酸分子之后，对所述载体序列的第一固定序列所包含的切割位点进行切割，以消化所述载体序列。

17.权利要求16所述的方法，其中，所述连接子是能够与活化基团(例如NH₂)偶联的连接基团，所述固相支持物表面具有活化基团(例如NH₂)修饰；

优选地，所述连接子包括-SH、-DBCO或-NHS；

优选地，所述连接子是所述固相支持物表面连接有

18.权利要求1-17任一项所述的方法，其中，所述固相支持物是芯片；

优选地，所述固相支持物是测序芯片；

优选地，所述固相支持物是高通量测序芯片，例如用于Illumina、MGI或Thermo Fisher测序平台的高通量测序芯片；

优选地，所述测序芯片为开放式芯片；优选地，所述开放式芯片为高密度阵列芯片；

优选地，所述测序芯片不存在封闭流道。

19.权利要求1-9、11-18中任一项所述的方法，其中，在步骤(2)所述引物延伸反应之前，对所述载体序列或其部分(例如，定位序列)进行核酸分析(例如，对所述载体序列或其部分进行测序)；

优选地，所述固相支持物表面和/或载体序列中存在一个或多个测序接头，如illumina测序平台的P5、P7和/或P9接头；

优选地，所述固定序列还包含测序引物杂交区和/或扩增引物杂交区；其中，所述测序引物杂交区允许测序引物退火并起始测序反应，所述扩增引物杂交区允许扩增引物退火并起始延伸及扩增反应；

优选地，在步骤(1)中，所述多个拷贝的载体序列是由所述载体序列的克隆群形成的DNA簇，并且通过桥式PCR扩增获得所述DNA簇；

优选地，在步骤(2)所述引物延伸反应之前，对所述DNA簇进行测序，获得所述定位序列信息；

优选地，在步骤(2)所述引物延伸反应之前，以固相支持物表面的测序接头为引物，对所述DNA簇进行边合成边测序，生成测序链，获得所述定位序列信息，然后去除所述测序链。

20.一种核酸阵列，其通过权利要求1-19任一项所述的方法制备获得；

优选地，每种核酸阵列包含相同定位序列的载体序列在所述固相支持物表面所占的面积的直径小于1微米；

优选地，所述每种载体序列(也即，包含相同定位序列的载体序列)或每种捕获探针(也即，包含相同定位序列/定位序列互补序列的捕获探针)在所述固相支持物表面所占的面积(也即，活性区域)的直径小于1微米。

21.一种试剂盒，其包含权利要求20所述的核酸阵列；

优选地，所述试剂盒进一步包括逆转录试剂、核酸扩增试剂、核酸文库制备试剂和/或测序试剂。

22.一种对待测样品中核酸分子进行空间信息标记的方法，其包括以下步骤：

(1)提供权利要求20所述的核酸阵列，或者权利要求21所述的试剂盒，或者通过权利要求1-19任一项所述的方法所获得的核酸阵列；

(2)将所述核酸阵列在允许退火的条件下与待测样品接触，以使得待测样品中的核酸或其互补序列附接(例如，连接和/或杂交)至所述捕获探针或其互补序列，从而将该核酸的位置对应至核酸阵列上的捕获探针的位置，获得空间信息标记的核酸分子，其中，所述空间信息标记的核酸分子具有定位序列或其互补序列作为空间信息标记；

优选地，将所述核酸阵列在允许退火的条件下与待测样品接触，以使得待测样品中的核酸或其互补序列附接(例如，连接和/或杂交)至所述第一核酸分子或其互补序列；在允许引物延伸的条件下，以所述第一核酸分子作为引物，以被捕获的核酸分子为模板，进行引物延伸反应，以产生延伸产物，从而得到空间信息标记的核酸分子。

23.权利要求22所述的方法，其中，

(1)所述样品是组织样品；

(2)所述样品是含有细胞的样品(例如，含有细胞的组织样品)；

(3)所述样品是组织切片；

(4)所述样品是以福尔马林固定石蜡包埋(FFPE)的组织样品或深度冷冻的组织样品或新鲜的组织的样品。

24.一种检测待测样本中核酸的空间信息的方法，其中，所述方法包括以下步骤：

I)通过权利要求22或23所述的方法获得空间信息标记的核酸分子；

II)直接或间接地分析空间信息标记的核酸分子；

任选地，步骤I)之后，步骤II)之前，从固相支持物表面释放至少一部分空间信息标记的核酸分子，其中所述部分空间信息标记的核酸分子包括定位序列或其互补链以及被捕获核酸分子或其互补链。

25.权利要求24所述的方法，其中，所述方法具有选自下列的一项或多项特征：

(1)所述核酸的空间信息包括核酸的定位、分布和/或表达；

(2)所述空间信息标记的核酸分子的至少一部分通过如下方法从固相支持物表面释放：(i)核酸剪切；(ii)变性；和/或(iii)物理方法；

(3)在步骤(II)中，所述序列分析包括测序或序列特异性的PCR反应。