CN115004260A - 用于组织分类的系统和方法 - Google Patents
用于组织分类的系统和方法 Download PDFInfo
- Publication number
- CN115004260A CN115004260A CN202080093520.5A CN202080093520A CN115004260A CN 115004260 A CN115004260 A CN 115004260A CN 202080093520 A CN202080093520 A CN 202080093520A CN 115004260 A CN115004260 A CN 115004260A
- Authority
- CN
- China
- Prior art keywords
- capture
- pixels
- class
- analyte
- sequence
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/0002—Inspection of images, e.g. flaw detection
- G06T7/0012—Biomedical image inspection
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/60—Type of objects
- G06V20/69—Microscopic objects, e.g. biological cells or cellular parts
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06K—GRAPHICAL DATA READING; PRESENTATION OF DATA; RECORD CARRIERS; HANDLING RECORD CARRIERS
- G06K7/00—Methods or arrangements for sensing record carriers, e.g. for reading patterns
- G06K7/10—Methods or arrangements for sensing record carriers, e.g. for reading patterns by electromagnetic radiation, e.g. optical sensing; by corpuscular radiation
- G06K7/14—Methods or arrangements for sensing record carriers, e.g. for reading patterns by electromagnetic radiation, e.g. optical sensing; by corpuscular radiation using light without selection of wavelength, e.g. sensing reflected white light
- G06K7/1404—Methods for optical code recognition
- G06K7/1408—Methods for optical code recognition the method being specifically adapted for the type of code
- G06K7/1413—1D bar codes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/11—Region-based segmentation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/60—Type of objects
- G06V20/69—Microscopic objects, e.g. biological cells or cellular parts
- G06V20/698—Matching; Classification
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B40/00—ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/10—Image acquisition modality
- G06T2207/10024—Color image
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20036—Morphological image processing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/30—Subject of image; Context of image processing
- G06T2207/30004—Biomedical image processing
- G06T2207/30024—Cell structures in vitro; Tissue sections in vitro
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- General Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Life Sciences & Earth Sciences (AREA)
- Medical Informatics (AREA)
- Artificial Intelligence (AREA)
- Biomedical Technology (AREA)
- Molecular Biology (AREA)
- Multimedia (AREA)
- Data Mining & Analysis (AREA)
- Software Systems (AREA)
- Biophysics (AREA)
- Toxicology (AREA)
- Databases & Information Systems (AREA)
- Epidemiology (AREA)
- Evolutionary Computation (AREA)
- Electromagnetism (AREA)
- Public Health (AREA)
- Bioethics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Biotechnology (AREA)
- Evolutionary Biology (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
- Radiology & Medical Imaging (AREA)
- Quality & Reliability (AREA)
- Investigating Or Analysing Biological Materials (AREA)
Abstract
提供了用于组织分类的系统和方法。获得呈多个像素方式的基板上的组织的图像。基准标志物处于基板边界上。像被分配到指示组织样品的第一类别或指示背景的第二类别。所述分配使用所述基准标志物来定义所述图像内的边界框并忽略所述框之外的像素。然后,启发式分类器应用于所述像素:对于所述多个像素中的每个相应像素,每个启发式分类器对所述第一类别与所述第二类别之间的相应像素进行投票,由此形成每个像素的作为第一类别、可能的第一类别、可能的第二类别和明显的第二类别之一的聚合分数。每个像素的所述聚合分数和强度应用于分割算法,以向每个像素分配作为组织样品或背景的概率。
Description
相关申请的交叉引用
本申请要求于2019年11月18日提交的题为“用于组织分类的系统和方法(Systemsand Methods for Tissue Classification)”的美国临时专利申请第62/937,066号的优先权,所述美国临时专利申请以全文引用的方式特此并入。
序列表
本申请含有已经以ASCII格式电子提交的序列表,并且特此通过引用整体并入。于2020年11月18日创建的所述ASCII文本被命名为104371-5030_ST25.txt并且大小为2千字节。
技术领域
本说明书描述了涉及处理大型复杂数据集中的观察到的分析物数据如空间排列的下一代测序数据,以及使用所述数据对如组织或背景等数据集中的图像中的单独像素进行分类的技术。
背景技术
复杂组织中的分析物的空间分辨率为了解生物学功能和形态学的潜在过程提供了新的见解,如细胞命运和发育、疾病进展和检测以及细胞和组织水平的调控网络。参见,Satija等人,2015,“单细胞基因表达数据的空间重建(Spatial reconstruction ofsingle-cell gene expression data)”,《自然生物技术(Nature Biotechnology)》33,495-502,doi:10.1038.nbt.3192和Achim等人,2015,“单细胞RNA-seq数据到原始组织的高通量空间映射(High-throughput spatial mapping of single-cell RNA-seq data totissue of origin)”,《自然生物技术》.33:503-509,doi:10.1038/nbt.3209,所述文献中的每个文献特此以全文引用的方式并入本文中。了解分析物之间的空间模式或其它形式的关系可以提供有关不同细胞行为的信息。进而,这可以帮助阐明复杂的病状,如复杂的疾病。例如,确定分析物(例如,基因)的丰度与特定组织类别(例如,疾病组织、健康组织、疾病和健康组织的边界等)的组织亚群相关联,提供了分析物与如复杂疾病等病状相关联的推论证据。同样,确定分析物的丰度与复杂2维或3维组织(例如,哺乳动物的大脑、肝脏、肾脏、心脏、类器官、肿瘤或模式生物体的发育胚胎)中的异质细胞群体的特定亚群相关联提供了特定亚群中的分析物关联的推论证据。
因此,对分析物的空间分析可以通过标识复杂组织中的高危区域并通过空间重建(例如,基因表达、蛋白质表达、DNA甲基化和/或单核苷酸多态性、表观遗传扰动、肽定位以及其它的空间重建)表征这些区域中存在的分析物分布。分析物到其在区域或子区域内的特定定位的高分辨率空间映射揭示了分析物的空间表达模式,提供了相关数据,并且进一步暗示了涉及疾病或其它所关注形态或表型的分析物网络相互作用,从而使在其形态背景下全面了解细胞。参见,10X,2019,“空间解析转录组学(Spatially-ResolvedTranscriptomics)”、10X,2019,“深入了解Visium空间技术(Inside Visium SpatialTechnology)”和10X,2019,“Visium空间基因表达解决方案(Visium Spatial GeneExpression Solution)”,所述文献中的每个文献特此以全文引用的方式并入本文中。
对分析物的空间分析可以通过捕获分析物和/或分析物捕获剂并(例如,使用附接到基板上的带条形码的捕获探针)使用参考图像将它们映射到已知定位来执行,所述参考图像指示与已知定位相对应的所关注组织或区域。例如,在空间分析的一些实施方案中,制备样品(例如,将新鲜冷冻的组织切片、放置在载玻片上、固定和/或染色用于成像)。对样品的成像提供了要用于空间分析的参考图像。然后使用例如分析物捕获或分析物捕获剂通过带条形码的捕获探针、文库构建和/或测序来进行分析物检测。所得带条形码的分析物数据和参考图像可以在数据可视化期间组合以进行空间分析。参见,10X,2019,“深入了解Visium空间技术”。
除了确保样品或样品的图像(例如,组织切片或组织切片的图像)与带条形码的捕获探针(例如,使用基准对准)正确对准之外,还需要确定哪些带条形码的捕获探针含有对应于样品的分析物数据以及哪些带条形码的捕获探针对应于背景。因此,为了将每种分析物映射到样品或组织中的对应定位(例如,使用带条形码的捕获探针),期望首先能够将图像中的所关注区域(例如,对应于样品和/或组织的区域)与不关注区域(例如,对应于背景和/或非组织的区域)区分开来。此类方法减少了对分析物的检测和空间分析期间的背景信号噪声量,从而在比较所关注区域之间的分析物水平时提供了更高的分辨率。例如,此类方法可以用于比较多个组织亚群之间的分析物水平(例如,绘制疾病组织相对于健康组织的分析物分布图,如组织切片中的癌性病变),而不存在来自背景区域的最小化或扭曲数据中的真实变化的混杂信号(例如,使用归一化和/或减少高背景信号以更清楚地显示区域中的差异分析物水平,以防止低分析物信号被视为背景,或考虑分析物从基板上的组织扩散)。
在用于组织样品制备和进行切片的传统湿实验室方法期间,样品质量经常出现缺陷,进一步加剧了所述领域的技术限制。这些问题的出现要么是由于组织样品本身的性质(尤其包含间质区域、空泡和/或通常在成像之后难以解释的一般粒度),要么是由于处理不当或样品降解导致样品中的间隙或孔洞(例如,撕裂样品或仅获取部分样品,如从活检中获得)。另外地,用于成像的湿实验室方法会导致进一步的缺陷,包含但不限于空气泡、碎屑、沉积在基板或组织上的结晶染色颗粒、不一致或对比度差的染色和/或产生图像模糊、曝光过度或曝光不足和/或分辨率低的显微镜限制。参见,Uchida,2013,“生物图像的图像处理和识别(Image processing and recognition for biological images)”,《发育、成长与分化(Develop.Growth Differ.)》55,523-549,doi:10.1111/dgd.12054,所述文献特此以全文引用的方式并入本文中。此类缺陷使对准更加困难。
用于图像处理和生物图像标识的传统方法通常需要人工输入。例如,为了使用传统工具(例如,魔术棒(Magic Wand)、智能剪刀(Intelligent Scissors)、敲除(Knockout)2、图形切割(Graph Cut)以及其它)标识所关注区域(例如,基板上的组织切片),要求从业者选择区域中的是期望的(例如,组织)和/或不期望的(例如,非组织)至少一部分。参见,Rother等人,2004,“‘GrabCut’——使用迭代图形切割的交互式前景提取(‘GrabCut’–Interactive Foreground Extraction using Iterated Graph Cuts)”,《美国计算机协会图形协会报(ACM Transactions on Graphics.)》23(3):309-314,doi:10.1145/1186562.1015720,所述文献特此以全文引用的方式并入本文中。这种必要性使传统工具的有效性降低并且使鲁棒性基本上降低,因为人眼的手动分析需要大量的努力和时间,易出现人为错误和偏见,并且需要另外的劳动力和培训成本才能使从业者变得熟练,例如,在病理学或生物图像分析中。用于图像分析的传统方法效率也较低,因为对人工输入的要求用作阻碍快速成像、分析物捕获和分析的瓶颈,例如,在必须同时处理来自多个来源的许多组织样品的高通量应用期间。此类限制严重降低了高通量方法的能力,如组织中核酸分析物的下一代测序。参见,Uchida,2013,“生物图像的图像处理和识别”,《发育、成长与分化》55,523-549,doi:10.1111/dgd.12054,所述文献特此以全文引用的方式并入本文中。
因此,本领域需要一种高通量、自动化的分类系统和方法,其可以在代表基板上的组织的图像中将组织与背景区分开来(例如,用于分析物捕获)。此类系统和方法将允许在不需要大量培训和劳动力成本的情况下对图像中的组织样品进行可重复的标识,并且将通过去除由于主观评估引起的人为错误来进一步提高标识的准确性。此类系统和方法将进一步为从业者提供成本有效、用户友好的工具,以可靠地执行对组织切片中的分析物的空间重建,而不需要在空间映射步骤期间除了提供图像之外的另外的用户输入。
发明内容
在本公开中提供了用于解决组织检测和组织分类的上述问题的技术解决方案(例如,计算系统、方法和非暂时性计算机可读存储介质)。具体地,本公开提供了用于标识图像的所关注区域(例如,被组织切片或薄片覆盖)的系统和方法,并且在一些实施例中,将所述图像区域转化为多个对应的分析物(例如,被组织切片覆盖的一组RNA捕获点)。
下文呈现了本公开的概述,以便提供对本公开的一些方面的基本理解。此概述不是本公开的广泛概要。此概述并不旨在标识本公开的关键/重要要素或描绘本公开的范围。此概述的唯一目的是以简化的形式呈现本公开的概念中的一些作为对之后所呈现的更加详细的说明的序言。
本公开提供了用于组织分类的系统和方法。获得呈电子形式的多个像素方式(例如,使用透射光显微术)的基板上的组织样品(例如,来自受试者)的图像。在一些实施例中,所述多个像素包括至少1000个、10,000个、100,000个、1×106个、2×106个、3×106个、4×106个、5×106个、8×106个或15×106个像素。图像包含基板边界上的基准标志物。像素被分配到指示组织样品的第一类别或指示背景的第二类别。所述分配使用基准标志物来定义所述图像内的边界框并去除所述框之外的像素。然后,启发式分类器应用于所述像素:对于所述多个像素中的每个相应像素,每个启发式分类器对所述第一类别与所述第二类别之间的相应像素进行投票,由此形成每个像素的作为第一类别、可能的第一类别、可能的第二类别和明显的第二类别之一的聚合分数。例如,每个像素接收来自启发式分类器的总计分数,指示明显的组织、可能的组织、可能的背景或明显的背景。每个像素的聚合分数和强度应用于分割算法如图形切割算法(例如,GrabCut分割算法),以向每个像素分配作为组织样品或背景的概率。
本公开的一方面提供了一种组织分类方法。所述方法包括获得呈电子形式的多个像素方式的基板上的经切片的组织样品(例如,来自受试者)的图像。图像包含多个基准标志物(例如,在基板的外边界上)。在一些实施例中,所述多个基准标志物包括超过5、10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100、200、500、1000或5000个标志物。在一些实施例中,所述多个基准标志物由少于1000、2000、3000、4000或5000个基准标志物组成。所述图像是使用透射光显微术获取的。所述多个像素中的每个相应像素被分配类别。例如,在一些实施例中,每个像素被分配到第一类别或第二类别。在一些实施例中,每个像素被分配到多个类别中的任一个类别,其中所述多个类别由N个类别组成,并且N为2或更大的正整数。在一些实施例中,第一类别指示组织样品在基板上的叠加,并且第二类别指示背景。所述分配使用所述多个基准标志物来定义所述图像内的边界框,并且从所述多个像素中去除落在所述边界框之外的相应像素。然后,在多个像素上运行多个启发式分类器(例如,在灰度空间中)。对于所述多个像素中的每个相应像素,所述多个启发式分类器中的每个相应启发式分类器对第一类别与第二类别之间的相应像素进行投票,由此形成所述多个像素中的每个相应像素的对应聚合分数。每个对应聚合分数是包括明显的第一类别、可能的第一类别、可能的第二类别和明显的第二类别的一组类别中的类别。将所述多个像素中的每个相应像素的聚合分数和强度应用于图形切割分割算法,以独立地向所述多个像素中的每个相应像素分配作为组织样品或背景的概率。
在一些实施例中,组织掩模叠加在图像上。所述组织掩模使所述图像的所述多个像素中的已经被分配作为组织的概率更大的每个相应像素被分配第一属性并且所述多个像素中的已经被分配作为背景的概率更大的每个相应像素被分配第二属性。
在一些实施例中,所述第一属性是第一颜色,并且所述第二属性是第二颜色。在一些实施例中,所述第一颜色是红色和蓝色中的一种,并且所述第二颜色是红色和蓝色中的另一种。在一些实施例中,所述第一属性是亮度或不透明度的第一水平,并且所述第二属性是亮度或不透明度的第二水平。
在一些实施例中,所述图像进一步包括呈所述基板上的二维位置阵列的形式的一组捕获点的表示,所述一组捕获点中的每个相应捕获点处于所述二维阵列中的不同位置处并且与来自所述组织的一种或多种分析物相关联,所述一组捕获点中的每个相应捕获点由多个空间条形码中的至少一个唯一空间条形码表征,并且所述方法进一步包括:基于所述图像中的所述多个捕获点中的捕获点的每个相应表示附近的像素的分配,为所述捕获点的所述相应表示分配所述第一属性或所述第二属性。
在一些实施例中,所述一组捕获点中的捕获点包括捕获结构域。在一些实施例中,所述一组捕获点中的捕获点包括切割结构域。在一些实施例中,所述一组点中的每个捕获点直接附接或间接附接到所述基板。在一些实施例中,所述一种或多种分析物包括五种或更多种分析物、十种或更多种分析物、五十种或更多种分析物、一百种或更多种分析物、五百种或更多种分析物、1000种或更多种分析物、2000种或更多种分析物或2000到100,000种分析物。在一些实施例中,所述唯一空间条形码编码选自以下集合的唯一预定值:{1,…,1024},{1,…,4096},{1,…,16384},{1,…,65536},{1,…,262144},{1,…,1048576},{1,…,4194304},{1,…,16777216},{1,…,67108864}或{1,…,1x1012}。
在一些实施例中,每个相应捕获点包含1000个或更多个捕获探针、2000个或更多个捕获探针、10,000个或更多个捕获探针、100,000个或更多个捕获探针、1×106个或更多个捕获探针、2×106个或更多个捕获探针或5×106个或更多个捕获探针。在一些实施例中,所述相应捕获点中的每个捕获探针包含poly-A序列或poly-T序列以及表征所述相应捕获点的所述唯一空间条形码。在一些实施例中,所述相应捕获点中的每个捕获探针包含来自所述多个空间条形码的相同空间条形码。在一些实施例中,所述相应捕获点中的每个捕获探针包含来自所述多个空间条形码的不同空间条形码。
在一些实施例中,所述经切片的组织样品的深度为100微米或更小。
在一些实施例中,所述一种或多种分析物是多种分析物,所述一组捕获点中的相应捕获点包含多个捕获探针,所述多个捕获探针中的每个捕获探针包含捕获结构域,所述捕获结构域由多个捕获结构域类型中的捕获结构域类型表征,并且所述多个捕获结构域类型中的每个相应捕获结构域类型被配置成与所述多种分析物中的不同分析物结合。在一些实施例中,所述多个捕获结构域类型包括5到15,000个捕获结构域类型,并且所述多个相应捕获探针包含针对所述多个捕获结构域类型中的每个捕获结构域类型的至少五个、至少10个、至少100个或至少1000个捕获探针。
在一些实施例中,所述一种或多种分析物是多种分析物,并且所述一组捕获点中的相应捕获点包含多个捕获探针,所述多个捕获探针中的每个捕获探针包含捕获结构域,所述捕获结构域由单个捕获结构域类型表征,所述单个捕获结构域类型被配置成以无偏差的方式与所述多种分析物中的每种分析物结合。
在一些实施例中,所述一组捕获点中的每个相应捕获点包含在所述基板上的100微米乘100微米的正方形内。在一些实施例中,所述一组捕获点中的每个相应捕获点包含在所述基板上的50微米乘50微米的正方形内。在一些实施例中,所述一组捕获点中的每个相应捕获点包含在所述基板上的10微米乘10微米的正方形内。在一些实施例中,所述一组捕获点中的每个相应捕获点包含在所述基板上的1微米乘1微米的正方形内。在一些实施例中,所述一组捕获点中的每个相应捕获点包含在所述基板上的0.5微米乘0.5微米的正方形内。在一些实施例中,所述一组捕获点中的每个相应捕获点包含在所述基板上的0.3微米乘0.3微米的正方形内。在一些实施例中,所述一组捕获点中的每个相应捕获点包含在所述基板上的0.2微米乘0.2微米的正方形内。
在一些实施例中,每个相应点的中心到所述基板上的所述一组捕获点中的相邻捕获点之间的距离介于300纳米与300微米之间。在一些实施例中,每个相应点的中心到所述基板上的所述一组捕获点中的相邻捕获点之间的距离介于700纳米与10微米之间。在一些实施例中,每个相应点的中心到所述基板上的所述一组捕获点中的相邻捕获点之间的距离介于800纳米与3微米之间。
在一些实施例中,所述基板上的所述一组捕获点中的每个捕获点的形状为闭合形式形状。在一些实施例中,所述闭合形式形状是圆形、椭圆形或N边形,其中N是介于1与20之间的值。在一些实施例中,所述闭合形式形状是六边形。在一些实施例中,所述闭合形式形状为圆形,并且所述一组捕获点中的每个捕获点的直径为80微米或更小。在一些实施例中,所述闭合形式形状为圆形,并且所述一组捕获点中的每个捕获点的直径介于0.3微米与65微米之间。
在一些实施例中,每个相应捕获点的中心到所述基板上的所述一组捕获点中的相邻捕获点之间的距离介于0.5微米与2微米之间。在一些实施例中,每个相应捕获点的中心到所述基板上的所述一组捕获点中的相邻捕获点之间的距离介于2微米与7微米之间。在一些实施例中,每个相应捕获点的中心到所述基板上的所述一组捕获点中的相邻捕获点之间的距离介于5微米与50微米之间。
在一些实施例中,所述多个启发式分类器包括第一启发式分类器,所述第一启发式分类器标识将所述多个像素分为所述第一类别和所述第二类别的单个强度阈值。如此,所述第一启发式分类器对所述第一类别或所述第二类别的所述多个像素中的每个相应像素进行投票。在此类实施例中,所述单个强度阈值表示所述第一类别与所述第二类别之间的类内强度方差的最小化或所述第一类别与所述第二类别之间的类间方差的最大化。
在一些实施例中,所述多个启发式分类器包括第二启发式分类器,所述第二启发式分类器标识具有使用所述第一启发式方法标识的相同类别的像素的局部邻域。所述第二启发式分类器对每个局部邻域中的像素之间的最大强度差异应用平滑量度,从而使所述第二启发式分类器对所述第一类别或所述第二类别的所述多个像素中的每个相应像素进行投票。
在一些实施例中,所述多个启发式分类器包括第三启发式分类器,所述第三启发式分类器对所述多个像素进行边缘检测以形成所述图像中的多个边缘。所述第三启发式然后在形态上闭合所述多个边缘以形成所述图像中的多个在形态上闭合的区域。然后,在形态上闭合的区域中的像素属于第一类别,并且在形态上闭合的区域之外的像素属于第二类别。因此,以此方式,所述第三启发式分类器对所述第一类别或所述第二类别的所述多个像素中的每个相应像素进行投票。
在一些实施例中,所述多个启发式分类器由第一启发式分类器、第二启发式分类器和第三启发式分类器组成。在一些此类实施例中,将由所述多个分类器中的所述启发式分类器中的每个启发式分类器分配到所述第二类别的每个相应像素标记为明显的第二类别,并且将由所述多个启发式分类器中的每个启发式分类器分配为所述第一类别的每个相应像素标记为明显的第一类别。
在一些实施例中,图形切割分割算法是GrabCut分割算法。
本公开的另一方面提供了一种计算系统,所述计算系统包含一个或多个处理器和存储用于组织分类的一个或多个程序的存储器。应当理解,此存储器可以在单个计算机、计算机网络、一个或多个虚拟机上,或者在云计算架构中。所述一个或多个程序被配置成由所述一个或多个处理器执行。所述一个或多个程序包含用于执行上文所公开的任何方法的指令。
本公开的仍另一方面提供了一种计算机可读存储介质,所述计算机可读存储介质存储要由电子装置执行的一个或多个程序。所述一个或多个程序包含用于所述电子装置通过上文所公开的任何方法执行组织分类的指令。应当理解,计算机可读存储介质可以作为单个计算机可读存储介质或彼此物理分离的任何数量的组件计算机可读存储介质存在。
其它实施例涉及与本文所描述的方法相关联的系统、便携式消费者装置和计算机可读介质。
如本文所公开的,本文所公开的任何实施例在适用时可以应用于任何方面。
所附权利要求范围内的系统、方法和装置的各个实施例各自均具有若干个方面,其中并非仅靠任何单一方面来负责本文所描述的期望的属性。在不限制所附权利要求的范围的情况下,本文描述了一些突出的特征。在考虑了这一讨论之后,并且特别是在阅读了题为“具体实施方式”的部分之后,人们将理解如何使用各个实施例的特征。
通过引用的方式并入
所有可在互联网上获得并在本说明书中提及的公开、专利、专利申请和信息均本文中通过引用并入,程度如同每一单独的公开、专利、专利申请或信息项被专门并且单独地指示以引用的方式并入一般。在通过引用的方式并入的在互联网上可用的公开、专利、专利申请或信息项与本说明书中所包含的公开内容相抵触的情况下,本说明书意欲替代和/或优先于任何此类矛盾材料。
附图说明
以下附图展示了本公开的特征和优点的某些实施例。这些实施例不旨在以任何方式限制所附权利要求的范围。附图中的相似附图标记指示相似的元件。
图1示出了根据本公开的实施例的示例性空间分析工作流程。
图2示出了根据本公开的实施例的示例性空间分析工作流程,在所述示例性空间分析工作流程中,任选的步骤由虚线框指示。
图3A和3B示出了根据本公开的实施例的示例性空间分析工作流程,在所述示例性空间分析工作流程中,在图3A中,任选的步骤由虚线框指示。
图4示出了根据本公开的实施例的示例性空间分析工作流程,在所述示例性空间分析工作流程中,任选的步骤由虚线框指示。
图5示出了根据本公开的实施例的示例性空间分析工作流程,在所述示例性空间分析工作流程中,任选的步骤由虚线框指示。
图6是示出了根据本公开的实施例的如本文所描述的附接到捕获点的带条形码的捕获探针的实例的示意图。
图7是展示了根据本公开的实施例的可切割捕获探针的示意图,其中经切割的捕获探针被配置成进入到非透化细胞中并且与样品内的靶标分析物结合。
图8是根据本公开的实施例的示例性多路复用空间标记的捕获点的示意图。
图9A、9B、9C、9D、9E、9F、9G、9H和9I展示了根据一些实施例的基板上的组织切片的图像输入图9A、各种启发式分类器图9B、9C、9D、9E、9F、9G的输出,以及分割算法图9H和9I的输出。
图10A、10B、10C、10D、10E和10F展示了根据本公开的一些实施例的用于组织分类的非限制性方法,在所述方法中,任选的步骤由虚线框展示。
图11是展示了根据本公开的一些实施例的计算装置的示例框图。
图12是示出了根据本公开的实施例的阵列内的带条形码的捕获点的布置的示意图。
图13是展示了根据本公开的实施例的防扩散介质例如盖的侧视图的示意图。
图14是根据本公开的一些实施例的示例性分析物捕获剂的示意图。
图15A是描绘了根据本公开的一些实施例的特征固定的捕获探针与分析物捕获剂之间的示例性相互作用的示意图。
图15B是示出了分析物结合部分的示例性示意图,所述分析物结合部分包括具有与阻断结构域(由poly(T)序列指示)杂交的捕获结合结构域(由poly(A)序列指示)的寡核苷酸。
图15C是示出了分析物结合部分的示例性示意图,所述分析物结合部分包含包括发夹序列的寡核苷酸,所述发夹序列安置在阻断结构域(由poly(U)序列指示)与捕获结合结构域(由poly(A)序列指示)之间。如所示出的,阻断结构域与捕获结合结构域杂交。
图15D是示出了由RNAse H释放的阻断结构域的示例性示意图。
图15E是示出了包含寡核苷酸的分析物结合部分的示例性示意图,所述寡核苷酸包括使用笼状核苷酸(由五边形指示)阻断的捕获结合结构域。
图16是展示了根据本公开的一些实施例的空间标记的分析物捕获剂的示例性示意图,其中分析物捕获序列通过阻断探针被阻断,并且其中阻断探针可以例如通过RNA酶处理被去除。
具体实施方式
I.简介
本公开描述了用于对样品的空间分析的设备、系统、方法和组合物。此部分具体地描述了本公开的后面部分中提到的某些通用术语、分析物、样品类型和制备步骤。
(a)空间分析
组织和细胞可以从任何来源获得。例如,组织和细胞可以从单细胞或多细胞生物(例如,哺乳动物)中获得。从哺乳动物(例如,人)获得的组织和细胞通常具有不同的分析物水平(例如,基因和/或蛋白质表达),这可能产生细胞形态和/或功能的差异。细胞或细胞亚群(例如,相邻细胞和/或非相邻细胞)在组织内的位置可以影响例如细胞的命运、行为、形态、信号传导以及与组织中的其它细胞的相互作用。关于哺乳动物的组织中的不同细胞内的分析物水平(例如,基因和/或蛋白质表达)的差异的信息也可以帮助医生选择或实施有效的治疗方法,并且可以允许研究人员基于检测到的组织中的不同细胞内的分析物水平的差异来标识和阐明单细胞或多细胞生物(例如,哺乳动物)中的细胞形态和/或细胞功能的差异。哺乳动物的组织中的不同细胞内的分析物水平的差异还可以提供有关组织(例如,健康和患病组织)如何发挥作用和/或发育的信息。哺乳动物的组织中的不同细胞内的分析物水平的差异还可以提供关于组织中的疾病发病机制的不同机制和组织内的治疗处理作用机制的信息。哺乳动物的组织中的不同细胞内的分析物水平的差异还可以提供有关药物抗性机制和其在哺乳动物的组织中的发展的信息。多细胞生物体(例如,哺乳动物)的组织中的不同细胞内的分析物存在或不存在的差异可以提供关于药物抗性机制以及其在多细胞生物体的组织中的发展的信息。
本文中的空间分析方法提供对哺乳动物的组织中的不同细胞内的或哺乳动物的单个细胞内的分析物水平(例如,基因和/或蛋白质表达)的差异的检测。例如,空间分析方法可以用于检测组织切片样品中的不同细胞内的分析物水平(例如,基因和/或蛋白质表达)的差异,从中可以重新组合数据以产生从哺乳动物获得的组织样品(例如,组织样品)的分析物水平(例如,基因和/或蛋白质表达)的三维图(例如,具有一定程度的空间分辨率,如单细胞分辨率)。
开发系统中的空间异质性通常使用RNA杂交、免疫组织化学、荧光报告基因或预定义亚群的纯化或诱导以及随后的基因组分析(例如,RNA-seq)进行研究。然而,此类方法依赖于一组相对较小的预定义标志物,因此引入了限制发现的选择偏差。这些先验方法也依赖于先验知识。空间RNA测定传统上依赖于对有限数量的RNA种类进行染色。相比之下,单细胞RNA测序允许对细胞基因表达(包含非编码RNA)进行深入分析,但已建立的方法将细胞与其天然空间环境分开。
本文所描述的空间分析方法以高空间分辨率为样品内的各种多种分析物提供大量分析物水平和/或表达数据,例如,同时保留天然空间背景。空间分析方法含括,例如,使用包含空间条形码(例如,核酸序列)的捕获探针,所述空间条形码提供关于捕获探针在细胞或组织样品(例如,哺乳动物细胞或哺乳动物组织样品)内的位置的信息;以及能够与由细胞产生和/或存在于细胞中的分析物(例如,蛋白质和/或核酸)结合的捕获结构域。如本文所描述的,空间条形码可以是具有唯一序列的核酸、唯一荧光团、唯一荧光团组合、唯一氨基酸序列、唯一重金属或唯一重金属组合,或任何其它唯一可检测药剂。捕获结构域可以是能够与由细胞产生的和/或存在于细胞中的分析物(例如,能够与来自细胞的核酸杂交的核酸(例如,mRNA、基因组DNA、线粒体DNA或miRNA)、包含分析物的基板、分析物的结合配偶体或与分析物特异性结合的抗体)结合的任何药剂。捕获探针还可以包含与通用正向和/或通用反向引物的序列互补的核酸序列。捕获探针还可以包含切割位点(例如,限制性核酸内切酶的切割识别位点),或光不稳定或热敏键。
分析物与捕获探针的结合可以使用许多不同的方法来检测,例如,核酸测序、荧光团检测、核酸扩增、核酸连接检测和/或核酸切割产物检测。在一些实例中,所述检测用于将特定空间条形码与由细胞(例如,哺乳动物细胞)产生和/或存在于细胞中的特定分析物相关联。
捕获探针可以例如附接到表面,例如,固体阵列、珠粒或盖玻片。在一些实例中,捕获探针不附接到表面。在一些实例中,捕获探针被包封在、包埋在渗透性组合物(例如,本文所描述的任何基板)的表面内或在所述表面上分层。例如,捕获探针可以包封或安置在渗透性珠粒(例如,凝胶珠粒)内。在一些实例中,捕获探针被包封在、包埋在基板(例如,本文所描述的任何示例性基板,如水凝胶或多孔膜)的表面内或在所述表面上分层。
在一些实例中,使细胞或包含细胞的组织样品与附接到基板(例如,基板的表面)的捕获探针接触,并且细胞或组织样品被透化以允许分析物从细胞中释放并与附接到基板的捕获探针结合。在一些实例中,可以使用多种方法,例如电泳、化学梯度、压力梯度、流体流动或磁场,将从细胞中释放的分析物主动引导向附接到基板的捕获探针。
在其它实例中,使用多种方法例如,在捕获探针中包含脂质锚定剂,包含与捕获探针中的膜蛋白特异性结合或与捕获探针中的膜蛋白形成共价键的药剂、流体流动、压力梯度、化学梯度或磁场引导捕获探针与细胞或组织样品相互作用。
空间分析方法的非限制性方面描述于以下中:WO 2011/127099、WO 2014/210233、WO 2014/210225、WO 2016/162309、WO 2018/091676、WO 2012/140224、WO 2014/060483、美国专利第10,002,316号、美国专利第9,727,810号、美国专利申请公开第2017/0016053号,Rodriques等人,《科学(Science)》363(6434):1463-1467,2019;WO 2018/045186,Lee等人,《自然实验手册(Nat.Protoc.)》10(3):442-458,2015;WO 2016/007839、WO 2018/045181、WO 2014/163886,Trejo等人,《公共科学图书馆:综合(PLoS ONE)》14(2):e0212031,2019,美国专利申请公开第2018/0245142号,Chen等人,《科学》348(6233):aaa6090,2015,Gao等人,《BMC生物学(BMC Biol.)》15:50,2017、WO 2017/144338、WO 2018/107054、WO 2017/222453、WO 2019/068880、WO 2011/094669、美国专利第7,709,198号、美国专利第8,604,182号、美国专利第8,951,726号、美国专利第9,783,841号、美国专利第10,041,949号、WO2016/057552、WO 2017/147483、WO 2018/022809、WO 2016/166128、WO 2017/027367、WO2017/027368、WO 2018/136856、WO 2019/075091、美国专利第10,059,990号、WO 2018/057999、WO 2015/161173,Gupta等人,《自然生物技术(Nature Biotechnol.)》36:1197-1202,2018以及2020年8月13日提交的题为“用于使用单倍型的空间分布来确定生物状况的系统和方法(Systems and Methods for Using Spatial Distribution of Haplotypesto Determine a Biological Condition)”的美国专利申请第16/992,569号,并且可以在本文中以任何组合使用。本文描述了空间分析方法的另外的非限制性方面。
(b)通用术语
贯穿此公开使用了特定术语以解释所描述的设备、系统、方法和组合物的不同方面。此小节包含在本公开的后面部分出现的某些术语的解释。如果此部分中的描述与本公开的其它部分的用法明显冲突,则以此部分中的定义为准。
(i)受试者
“受试者”是如哺乳动物(例如,人或非人猿)等动物、或禽(例如,鸟)或如植物等其它生物体。受试者的实例包含但不限于哺乳动物,如啮齿动物、小鼠、大鼠、兔子、豚鼠、有蹄动物、马、羊、猪、山羊、牛、猫、狗、灵长类动物(即,人或非人灵长类动物);植物,如拟南芥(Arabidopsis thaliana)、玉米、高粱、燕麦、小麦、稻米、油菜籽或大豆;藻类植物,如莱茵衣藻(Chlamydomonas reinhardtii);线虫,如秀丽隐杆线虫(Caenorhabditis elegans);昆虫,如黑腹果蝇(Drosophila melanogaster)、蚊子、果蝇、蜜蜂或蜘蛛;鱼,如斑马鱼;爬行动物;两栖动物,如青蛙或非洲爪蟾(Xenopus laevis);盘基网柄菌(Dictyosteliumdiscoideum);真菌,如卡氏肺孢子虫(Pneumocystis carinii)、红鳍东方鲀(Takifugurubripes)、酵母、酿酒酵母(Saccharamoyces cerevisiae)或粟酒裂殖酵母(Schizosaccharomyces pombe);或恶性疟原虫(Plasmodium falciparum)。
(ii)核酸和核苷酸
术语“核酸”和“核苷酸”旨在与其在本领域中的用途保持一致并且包含天然存在的物种或其功能类似物。特别有用的核酸功能类似物能够以序列特异性方式与核酸杂交(例如,能够与两种核酸杂交,使得可以在两种杂交的核酸之间发生连接)或能够用作复制特定核苷酸序列的模板。天然存在的核酸通常具有含有磷酸二酯键的主链。类似物结构可以具有包含本领域已知的任何那些主链键的交替性主链键。天然存在的核酸通常具有脱氧核糖(例如,存在于脱氧核糖核酸(DNA)中)或核糖(例如,存在于核糖核酸(RNA)中)。
核酸可以含有具有本领域已知的这些糖部分的各种类似物的任何类似物的核苷酸。核酸可以包含天然或非天然核苷酸。在此方面,天然脱氧核糖核酸可以具有选自由以下组成的组的一个或多个碱基:腺嘌呤(A)、胸腺嘧啶(T)、胞嘧啶(C)或鸟嘌呤(G),并且核糖核酸可以具有选自由以下组成的组的一个或多个碱基:尿嘧啶(U)、腺嘌呤(A)、胞嘧啶(C)或鸟嘌呤(G)。可以包含在核酸或核苷酸中的有用的非天然碱基是本领域已知的。
(iii)探针和靶标
当关于核酸或核酸序列使用时,“探针”或“靶标”旨在在方法或组合物的背景下作为用于核酸或序列的语义标识符,并且并且不将核酸或序列的结构或功能限制在明确指示的范围之外。
(iv)寡核苷酸和多核苷酸
术语“寡核苷酸”和“多核苷酸”可互换使用,指长度为约2到约500个核苷酸的单链核苷酸多聚体。寡核苷酸可以是合成的、酶促制备(例如,通过聚合)或使用“拆分池”方法。寡核苷酸可以包含核糖核苷酸单体(例如,可以是寡核糖核苷酸)和/或脱氧核糖核苷酸单体(例如,寡脱氧核糖核苷酸)。在一些实例中,寡核苷酸包含寡核苷酸中的脱氧核糖核苷酸单体和核糖核苷酸单体的组合(例如,脱氧核糖核苷酸单体和核糖核苷酸单体的随机或有序组合)。例如,寡核苷酸的长度可以是4到10个、10到20个、21到30个、31到40个、41到50个、51到60个、61到70个、71到80个、80到100个、100到150个、150到200个、200到250个、250到300个、300到350个、350到400或400到500个核苷酸。寡核苷酸可以包含一个或多个与多聚体结构附接(例如,共价或非共价)的功能部分。例如,寡核苷酸可以包含一个或多个可检测标记(例如,放射性同位素或荧光团)。
(v)条形码
“条形码”是传递信息或者能够传递信息(例如,关于样品中的分析物、珠粒和/或捕获探针的信息)的标记或标识符。条形码可以是分析物的一部分或独立于分析物。条形码可以附接到分析物。特定条形码相对于其它条形码可以是唯一的。
条形码可以具有多种不同的格式。例如,条形码可以包含非随机、半随机和/或随机核酸序列和/或氨基酸序列,以及合成核酸序列和/或氨基酸序列。
条形码可以具有多种不同的格式。例如,条形码可以包含多核苷酸条形码、随机核酸序列和/或氨基酸序列,以及合成核酸序列和/或氨基酸序列。条形码可以以可逆或不可逆的方式附接到分析物或另一部分或结构。可以在样品测序之前或期间将条形码添加到例如脱氧核糖核酸(DNA)或核糖核酸(RNA)样品的片段。条形码可以允许各个测序读段的标识和/或定量(例如,条形码可以是或者可以包含唯一的分子标识符或“UMI”)。
条形码可以在空间上分辨存在于样品中的分子组分,例如以单细胞分辨率(例如,条形码可以是或可以包含“空间条形码”)。在一些实施例中,条形码包含UMI和空间条形码两者。在一些实施例中,条形码包含一起用作单个条形码的两个或更多个子条形码。在一些实施例中,条形码包含UMI和空间条形码两者。在一些实施例中,条形码包含一起用作单个条形码(例如,多核苷酸条形码)的两个或更多个子条形码。例如,多核苷酸条形码可以包含由一个或多个非条形码序列分离的两个或更多个多核苷酸序列(例如,子条形码)。
(vi)捕获点
“捕获点”(可替代地,“特征”或“捕获探针多个”)在本文中用于描述充当样品分析中使用的各种分子实体的支持物或储存库的实体。捕获点的实例包含但不限于珠粒、任何二维或三维几何形状的点(例如、喷墨点、掩蔽点、网格上的正方形)、孔和水凝胶垫。在一些实施例中,捕获点是基板上的区域,在所述区域处,用空间条形码标记的捕获探针聚类在一起。捕获点和基板的特定非限制性实施例在本公开的下文中进一步描述。
总体上涉及分析物的空间分析的另外的定义可以在于2020年8月13日提交的题为“用于使用单倍型空间分布确定生物状况的系统和方法”的美国专利申请第16/992,569号中找到,所述美国专利申请通过引用特此并入本文。
(vii)基板
如本文所用,“基板”是可以在其上固定捕获探针的任何表面(例如,固体阵列、珠粒、盖玻片等)。
(viii)基因组
“基因组”通常是指来自受试者的基因组信息,所述基因组信息可以是例如受试者的基因编码的遗传信息的至少一部分或全部。基因组可以包含(例如,编码蛋白质的)编码区域以及非编码区域。基因组可以包含部分或全部受试者染色体的序列。例如,人基因组通常共有46条染色体。这些中的一些或全部的序列可以构成基因组。
(ix)衔接子、适配体和标签
“衔接子”、“适配体”和“标签”是在本公开中可互换使用的术语,并且是指可以使用许多不同技术(包含(但不限于)连接、杂交和标记)中的任一种与多核苷酸序列偶联(在称为“标记”的过程中)的物种。衔接子也可以是添加功能的核酸序列,例如,间隔子序列、引物序列/位点、条形码序列、唯一分子标识符序列。
(x)抗体
“抗体”是识别互补靶抗原并与互补靶抗原结合的多肽分子。抗体通常具有类似于Y形的分子结构形状或其聚合物。天然存在的抗体,被称为免疫球蛋白,属于免疫球蛋白类别IgG、IgM、IgA、IgD和IgE之一。抗体也可以合成产生。例如,作为单克隆抗体的重组抗体,可以使用合成基因通过从源细胞中回收抗体基因,扩增到适当的载体中,并将所述载体引入到宿主中以使宿主表达重组抗体来合成。通常,可以使用合适的寡核苷酸引物和/或杂交探针从任何产生抗体的动物物种中克隆重组抗体。重组技术可以用于产生抗体和抗体片段,包含非内源性物种。
合成抗体可以源自非免疫球蛋白来源。例如,可以从核酸(例如,适体)和非免疫球蛋白蛋白支架(如肽适体)产生抗体,其中插入高变环以形成抗原结合位点。基于核酸或肽结构的合成抗体可以比免疫球蛋白源性抗体更小,从而产生更大的组织渗透。
抗体还可以包含affimer蛋白,其是通常具有约12到14kDa分子量的亲和试剂。affimer蛋白通常以高亲和力和特异性两者与靶标(例如,靶蛋白)结合。此类靶标的实例包含但不限于泛素链、免疫球蛋白和C反应蛋白。在一些实施例中,affimer蛋白源自半胱氨酸蛋白酶抑制剂,并且包含肽环和提供结合位点的可变N端序列。抗体还可以包含单结构域抗体(VHH结构域和VNAR结构域)、scFv和Fab片段。
(c)分析物
本公开中描述的设备、系统、方法和组合物可以用于检测和分析多种不同的分析物。出于本公开的目的,“分析物”可以包含任何要分析的生物物质、结构、部分或组分。术语“靶标”可以类似地用于指所关注分析物。
分析物可以大致分类为以下两个组之一:核酸分析物和非核酸分析物。非核酸分析物的实例包含但不限于脂质、碳水化合物、肽、蛋白质、糖蛋白(N-连接或O-连接)、脂蛋白、磷蛋白、蛋白质的特定磷酸化或乙酰化变体、蛋白质的酰胺化变体、蛋白质的羟基化变体、蛋白质的甲基化变体、蛋白质的泛素化变体、蛋白质的硫酸化变体、病毒外壳蛋白、细胞外和细胞内蛋白质、抗体和抗原结合片段。在一些实施例中,分析物是细胞器(例如,细胞核或线粒体)。
对应于分析物的细胞表面特征可以包含但不限于受体、抗原、表面蛋白、跨膜蛋白、分化蛋白簇、蛋白通道、蛋白泵、载体蛋白、磷脂、糖蛋白、糖脂、细胞-细胞相互作用蛋白复合物、抗原呈递复合物、主要组织相容性复合物、工程化T细胞受体、T细胞受体、B细胞受体、嵌合抗原受体、细胞外基质蛋白、细胞表面蛋白的翻译后修饰(例如,磷酸化、糖基化、泛素化、亚硝基化、甲基化、乙酰化或脂化)状态、间隙连接和粘附连接。
分析物可以源自特定类型的细胞和/或特定的亚细胞区域。例如,分析物可以源自细胞质、细胞核、线粒体、微粒体,并且更一般地,源自任何其它隔室、细胞器或细胞的一部分。特异性靶向某些细胞隔室和细胞器的透化剂可以用于选择性地从细胞中释放分析物以进行分析。
核酸分析物的实例包含DNA分析物,如基因组DNA、甲基化DNA、特定甲基化DNA序列、片段化DNA、线粒体DNA、原位合成的PCR产物和RNA/DNA杂合体。
核酸分析物的实例还包含RNA分析物,如各种类型的编码和非编码RNA。不同类型的RNA分析物的实例包含信使RNA(mRNA)、核糖体RNA(rRNA)、转移RNA(tRNA)、微RNA(miRNA)和病毒RNA。RNA可以是转录物(例如,存在于组织切片中)。RNA可以很小(例如,长度小于200个核酸碱基)或很大(例如,RNA长度大于200个核酸碱基)。小RNA主要包含5.8S核糖体RNA(rRNA)、5S rRNA、转移RNA(tRNA)、微RNA(miRNA)、小干扰RNA(siRNA)、小核仁RNA(snoRNA)、Piwi相互作用RNA(piRNA)、tRNA-衍生的小RNA(tsRNA)和小rDNA衍生的RNA(srRNA)。RNA可以是双链RNA或单链RNA。RNA可以是环状RNA。RNA可以是细菌rRNA(例如,16s rRNA或23srRNA)。
分析物的另外的实例包含mRNA和细胞表面特征(例如,使用本文所描述的标记剂)、mRNA和细胞内蛋白质(例如,转录因子)、mRNA和细胞甲基化状态、mRNA和可接近的染色质(例如,ATAC-seq、DNase-seq和/或MNase-seq)、mRNA和代谢物(例如,使用本文所描述的标记剂)、条形码标记剂(例如,本文所描述的寡核苷酸标记的抗体)和免疫细胞受体(例如,T细胞受体)的V(D)J序列,mRNA和扰动剂(例如,如本文所描述的CRISPR crRNA/sgRNA、TALEN、锌指核酸酶和/或反义寡核苷酸)。在一些实施例中,扰动剂是小分子、抗体、药物、适体、miRNA、物理环境(例如,温度变化)或任何其它已知的扰动剂。
分析物可以包含具有编码免疫细胞受体(例如,TCR或BCR)的V(D)J序列的至少一部分的核酸序列的核酸分子。在一些实施例中,核酸分子是首先使用含有poly(T)的引物从对应的mRNA逆转录产生的cDNA。然后可以使用捕获探针对产生的cDNA进行条形码标记,所述探针具有与产生的cDNA的至少一部分杂交的条形码序列(以及任选地UMI序列)。在一些实施例中,模板转换寡核苷酸与通过逆转录酶添加到cDNA的3'端的poly(C)尾部杂交。然后可以将原始mRNA模板和模板转换寡核苷酸从cDNA中变性,并且然后带条形码的捕获探针可以与cDNA和产生的cDNA的补体杂交。适用于对从mRNA转录物产生的cDNA加条形码的另外的方法和组合物,包含编码免疫细胞受体的V(D)J区域的那些和/或包含模板转换寡核苷酸的加条形码方法和组合物描述于2017年10月18日提交的PCT专利申请PCT/US2017/057269和2017年11月29日提交的美国专利申请序列号15/825,740中,所述文献中的两者以全文引用的方式并入本文中。V(D)J分析也可以使用一种或多种与免疫细胞的特定表面特征结合并与条形码序列相关联的标记剂来完成。一种或多种标记剂可以包含MHC或MHC多聚体。
如上文所描述的,分析物可以包含能够作为基因编辑反应的组分的核酸,如例如,基于成簇的规则间隔短回文重复序列(CRISPR)的基因编辑。因此,捕获探针可以包含与分析物互补的核酸序列(例如,可以与CRISPR RNA(crRNA)、单向导RNA(sgRNA)或工程化为crRNA或sgRNA的衔接子序列杂交的序列)。
在某些实施例中,从活细胞中提取分析物。可以调整处理条件以确保生物样品在分析期间保持活性,并且从样品的活细胞中提取(或释放)分析物。活细胞衍生的分析物只能从样品中获得一次,或者可以从继续保持存活状况的样品中间隔获得。
通常,系统、设备、方法和组合物可以用于分析任何数量的分析物。例如,被分析的分析物的数量可以是存在于样品的区域中或基板的单独捕获点内的至少约2种、至少约3种、至少约4种、至少约5种、至少约6种、至少约7种、至少约8种、至少约9种、至少约10种、至少约11种、至少约12种、至少约13种、至少约14种、至少约15种、至少约20种、至少约25种、至少约30种、至少约40种、至少约50种、至少约100种、至少约1,000种、至少约10,000种、至少约100,000种或更多种不同的分析物。用于执行多路复用测定以分析两种或更多种不同分析物的方法将在本公开的后续部分中讨论。
(d)样品
(i)样品的类型
本公开允许分析生物样品和非生物样品两者。“生物样品”从受试者中获得以用于使用各种技术的任何技术进行分析,所述技术包含但不限于活检、手术和激光捕获显微术(LCM),并且所述生物样品通常包含来自受试者的细胞和/或其它生物材料。除了上文所描述的受试者之外,生物样品也可以从非哺乳动物生物(例如,植物、昆虫、蛛形纲动物、线虫类、真菌类、两栖类动物和鱼类)中获得。生物样品可以从以下中获得:原核生物如细菌,例如大肠杆菌(Escherichia coli)、葡萄状球菌(Staphylococci)或肺炎支原体(Mycoplasmapneumoniae);古生菌;病毒,如丙型肝炎病毒或人体免疫缺损病毒;或类病毒。生物样品也可以从真核生物中获得,如患者源性类器官(PDO)或患者源性异种移植物(PDX)。生物样品可以包含类器官,这是一种在体外产生的器官的小型化和简化版本,在三个维度上显示出逼真的微观解剖结构。类器官可以由来自组织、胚胎干细胞和/或诱导多能干细胞的一个或多个细胞产生,所述细胞由于其自更新和分化能力可以在三维培养中自组织。在一些实施例中,类器官是脑类器官、肠类器官、胃类器官、舌类器官、甲状腺类器官、胸腺类器官、睾丸类器官、肝类器官、胰腺类器官、上皮类器官、肺类器官、肾类器官、类原肠胚(gastruloid)、心脏类器官或视网膜类器官。可以从中获得生物样品的受试者可以是健康或无症状的个体、患有或怀疑患有疾病(例如,癌症)或有疾病倾向的个体和/或需要疗法或怀疑需要疗法的个体。
生物样品可以包含任何数量的大分子,例如细胞大分子和细胞器(例如,线粒体和细胞核)。生物样品可以是核酸样品和/或蛋白质样品。生物样品可以是碳水化合物样品或脂质样品。生物样品可以是作为如组织切片、活组织检查、核心活组织检查、针抽吸物或细针抽吸物等组织样品获得的。样品可以是如血液样品、尿液样品或唾液样品等流体样品。样品可以是皮肤样品、结肠样品、面颊拭子、组织学样品、组织病理学样品、血浆或血清样品、肿瘤样品、活细胞、培养细胞、临床样品如例如全血液或血液衍生产物、血细胞或培养的组织或细胞,包含细胞悬浮液。
无细胞生物样品可以包含细胞外多核苷酸。细胞外多核苷酸可以从身体样品例如,血液、血浆、血清、尿液、唾液、粘膜排泄物、痰液、粪便和眼泪中分离出来。
生物样品可以衍生自同质培养物或本文提到的受试者生物体的群体或可替代地衍生自几种不同生物体的集合(例如,群落或生态系统)。
生物样品可以包含一个或多个患病细胞。患病细胞可以具有更改的代谢特性、基因表达、蛋白质表达和/或形态特征。疾病的实例包含炎性病症、代谢紊乱、神经系统病症和癌症。癌细胞可以源自实体瘤、血液学恶性肿瘤、细胞系,或作为循环肿瘤细胞获得。
生物样品还可以包含胎儿细胞。例如,可以执行如羊膜穿刺术等程序以从母体循环中获得胎儿细胞样品。对胎儿细胞的测序可以用于标识多种遗传病症中的任一种,包含例如,如唐氏综合征(Down's syndrome)、爱德华兹综合征(Edwards syndrome)和帕陶综合征(Patau syndrome)等非整倍体。进一步地,胎儿细胞的细胞表面特征可以用于标识多种病症或疾病中的任一种。
生物样品还可以包含免疫细胞。对此类细胞的免疫组库进行序列分析,包含基因组、蛋白质组和细胞表面特征,可以提供丰富的信息,以促进了解免疫系统的状态和功能。通过实例的方式,在自体干细胞移植后确定多发性骨髓瘤(MM)患者的微小残留病(MRD)的状态(例如,阴性或阳性)被视为是MM患者中的MRD的预测因子(参见例如,美国专利申请公开第2018/0156784号,所述美国专利申请公开的全部内容通过引用并入本文中)。
生物样品中的免疫细胞的实例包含但不限于B细胞、T细胞(例如,细胞毒性T细胞、自然杀伤T细胞、调节性T细胞和T辅助细胞)、天然杀伤细胞、细胞因子诱导的杀伤(CIK)细胞、骨髓细胞,如粒细胞(嗜碱性粒细胞、嗜酸性粒细胞、中性粒细胞/高分节中性粒细胞)、单核细胞/巨噬细胞、肥大细胞、血小板/巨核细胞和树突状细胞。
如上文所讨论的,生物样品可以包含单一所关注分析物,或超过一种所关注分析物。用于执行多路复用测定以分析单个生物样品中的两种或更多种不同分析物的方法将在本公开的后续部分中讨论。
(ii)生物样品的制备
可以执行多种步骤来制备用于分析的生物样品。除非另有说明,否则下文所描述的制备步骤通常可以以任何方式组合以适当地制备特定样品用于分析。
(1)进行组织切片
生物样品可以从受试者(例如,通过手术活检、整体受试者切片)采集生物样品或使所述生物样品在生长基板或培养皿上体外生长作为细胞群体,并且将所述生物样品制备作为组织薄片或组织切片以进行分析。生长样品可以足够薄以用于分析而无需另外的处理步骤。可替代地,可以使用如刀片振动切片机等机械切割设备将生长样品和通过活检或切片获得的样品制备成薄组织切片。作为另一个替代方案,在一些实施例中,可以通过将生物样品的触摸印记应用于合适的基板材料来制备薄组织切片。
组织切片的厚度可以是细胞的最大横截面尺寸的分数(例如,小于0.9、0.8、0.7、0.6、0.5、0.4、0.3、0.2或0.1)。然而,还可以使用厚度大于最大横截面细胞尺寸的组织切片。例如,可以使用低温恒温器切片,其可以是例如10-20微米厚。
更通常地,组织切片的厚度通常取决于用于制备切片的方法和组织的物理特性,并且因此可以制备和使用各种不同厚度的切片。例如,组织切片的厚度可以是至少0.1、0.2、0.3、0.4、0.5、0.7、1.0、1.5、2、3、4、5、6、7、8、9、10、11、12、13、14、15、20、30、40或50微米。如果需要或者方便的话还可以使用更厚的切片,例如,至少70、80、90或100微米或更厚。通常,组织切片的厚度介于1-100微米、1-50微米、1-30微米、1-25微米、1-20微米、1-15微米、1-10微米、2-8微米、3-7微米或4-6微米之间,但是如上文所提及的,还可以分析厚度大于或小于这些范围的切片。
还可以从单个生物样品获得多个切片。例如,可以通过使用切片刀片进行活检样品的连续切片来从手术活检样品获得多个组织切片。连续切片之间的空间信息可以以此方式保存,并且可以对切片进行连续地分析以获得关于生物样品的三维信息。
(2)冷冻
在一些实施例中,生物样品(例如,如上文所描述的组织切片)可以通过在适于维持或保持组织结构的完整性(例如,物理特性)的温度下深度冷冻来制备。此类温度可以为例如小于-20℃或小于-25℃、-30℃、-40℃、-50℃、-60℃、-70℃、-80℃、-90℃、-100℃、-110℃、-120℃、-130℃、-140℃、-150℃、-160℃、-170℃、-180℃、-190℃或-200℃。冷冻组织样品可以使用任何数量的合适方法在基板表面上进行切片,例如,切成薄片。例如,组织样品可以使用设置在适于维持组织样品的结构完整性和样品中核酸的化学特性两者的温度下的冷冻切片机(例如,低温恒温器)来制备。此类温度可以是例如小于-15℃、小于-20℃或小于-25℃。样品可以在异戊烷和液氮中快速冷冻。冷冻样品可以在包埋之前储存在密封容器中。
(3)福尔马林固定和石蜡包埋
在一些实施例中,可以使用福尔马林固定和石蜡包埋(FFPE)制备生物样品,这是确立的方法。在一些实施例中,可以使用福尔马林固定和石蜡包埋制备细胞悬浮液和其它非组织样品。随后将样品固定并且包埋在石蜡或树脂块中,样品可以如上文所描述地进行切片。在分析之前,可以通过在合适的溶剂(例如,二甲苯)中温育组织切片然后冲洗(例如,99.5%乙醇持续2分钟,96%乙醇持续2分钟,以及70%乙醇持续2分钟)来从组织切片中去除石蜡包埋的材料(例如,脱蜡)。
(4)固定
作为如上文所描述地的福尔马林固定的替代方案,生物样品可以以各种其它固定剂的任何固定剂固定以在分析之前保持样品的生物结构。例如,样品可以通过浸没在乙醇、甲醇、丙酮、甲醛(例如,2%甲醛)、多聚甲醛-Triton、戊二醛或其组合中进行固定。
在一些实施例中,丙酮固定用于新鲜冷冻的样品,所述样品可以包含但不限于皮质组织、小鼠嗅球、人脑瘤、人死后脑以及乳腺癌样品。在一些实施例中,基于期望的工作流程选择和/或优化兼容的固定方法。例如,可以选择甲醛固定以与使用IHC/IF方案进行蛋白质可视化的工作流程兼容。作为另一个实例,对于强调RNA/DNA文库质量的工作流程,可以选择甲醇固定。在一些应用中可以选择丙酮固定来透化组织。当进行丙酮固定时,可以不进行预透化步骤(如下文所描述)。可替代地,可以结合透化步骤来进行丙酮固定。
(5)包埋
作为如上文所描述的石蜡包埋的替代方案,生物样品可以包埋在各种其它包埋材料的任何材料中以在切片和其它处理步骤之前为样品提供基板。通常,在对从样品获得的组织切片进行分析之前将包埋材料去除。合适的包埋材料包含但不限于蜡、树脂(例如,甲基丙烯酸酯树脂)、环氧树脂和琼脂。
(6)染色
为了促进可视化,生物样品可以使用各种染色和染色技术来染色。在一些实施例中,例如,样品可以使用任何数量的生物染色来染色,包含但不限于吖啶橙、俾斯麦棕(Bismarck brown)、深红色、考马斯蓝、甲酚紫、DAPI、伊红、溴化乙锭、酸性品红、苏木精、赫斯特染色(Hoechst stain)、碘、甲基绿、亚甲蓝、中性红、尼罗蓝、尼罗红、四氧化锇、碘化丙啶、罗丹明或番红。
可以使用已知染色技术对样品进行染色,所述已知染色技术包含坎-格伦瓦耳德(Can-Grunwald)、吉姆萨(Giemsa)、苏木精和伊红(H&E)、詹纳尔氏(Jenner's)、雷氏曼(Leishman)、马森氏三色(Masson's trichrome)、巴氏(Papanicolaou)、罗曼诺夫斯基(Romanowsky)、银、苏丹(Sudan)、瑞氏(Wright's)和/或过碘酸-希夫(Periodic AcidSchiff,PAS)染色技术。PAS染色通常在福尔马林固定或丙酮固定之后进行。
在一些实施例中,如本文别处所描述的,使用可检测标记(例如,放射性同位素、荧光团、化学发光化合物、生物发光化合物和染料)对样品进行染色。在一些实施例中,仅使用一种类型的染色剂或一种技术对生物样品进行染色。在一些实施例中,染色包含生物染色技术,如H&E染色。在一些实施例中,染色包含使用荧光偶联抗体标识分析物。在一些实施例中,使用两种或多种不同类型的染色剂或两种或多种不同的染色技术对生物样品进行染色。例如,可以通过使用一种技术(例如,H&E染色和/或明场成像)进行染色和成像,然后通过使用另一种技术(例如,IHC/IF染色和荧光显微镜)对同一生物样品进行染色和成像来制备生物样品。
在一些实施例中,可以使生物样品脱色。使生物样品脱色或褪色的方法在本领域中是已知的,并且通常取决于施加到样品上的染色剂的性质。例如,H&E染色可以通过在HCl或任何其它低pH酸(例如,硒酸、硫酸、氢碘酸、苯甲酸、碳酸、苹果酸、磷酸、草酸、琥珀酸、水杨酸、酒石酸、亚硫酸、三氯乙酸、氢溴酸、盐酸、硝酸、正磷酸、砷酸、亚硒酸、铬酸、柠檬酸、氢氟酸、亚硝酸、异氰酸、甲酸、硒化氢、钼酸、乳酸、乙酸、碳酸、硫化氢或其组合)中洗涤样品来脱色。在一些实施例中,脱色可以包含在低pH酸(例如,HCl)中进行1、2、3、4、5或更多次洗涤。在一些实施例中,脱色可以包含将HCl添加到下游溶液(例如,透化溶液)中。在一些实施例中,脱色可以包含将所公开的方法中使用的酶(例如,胃蛋白酶)溶解在低pH酸(例如,HCl)溶液中。在一些实施例中,用低pH酸对苏木精进行脱色之后,可以将其它试剂添加到脱色溶液中以提高pH,以用于其它应用。例如,与单独的低pH酸脱色溶液相比,可以将SDS添加到低pH酸脱色溶液中以提高pH。作为另一个实例,在一些实施例中,通过抗体偶联将一种或多种免疫荧光染色剂应用于样品。可以使用如通过用还原剂处理和去污剂洗涤、离液盐处理、用抗原修复溶液处理和用酸性甘氨酸缓冲液处理来切割二硫键等技术来去除此类染色。例如,用于多路复用染色和脱色的方法描述于例如以下中:Bolognesi等人,2017,《组织化学与细胞化学杂志(J.Histochem.Cytochem.)》65(8):431-444,Lin等人,2015,《自然通信(Nat Commun.)》6:8390,Pirici等人,2009,《组织化学与细胞化学杂志》57:567–75以及Glass等人,2009,《组织化学与细胞化学杂志》57:899–905,所述文献中的每个文献的全部内容通过引用并入本文中。
(7)水凝胶包埋
在一些实施例中,水凝胶形成发生在生物样品内。在一些实施例中,将生物样品(例如,组织切片)包埋在水凝胶中。在一些实施例中,将水凝胶亚基输注到生物样品中,并且水凝胶的聚合由外部或内部刺激引发。如本文所描述的“水凝胶”可以包含亲水性聚合物链的交联3D网络。“水凝胶亚基”可以是亲水性单体、分子前体或可以聚合(例如,交联)以形成三维(3D)水凝胶网络的聚合物。
水凝胶在存在水的情况下会膨胀。在一些实施例中,水凝胶包括天然材料。在一些实施例中,水凝胶包含合成材料。在一些实施例中,水凝胶包含混合材料,例如,水凝胶材料包括合成聚合物和天然聚合物两者的元素。可以使用在水凝胶或包括本文所描述的基于多肽的材料的水凝胶中使用的任何材料。以这种方式包埋样品通常涉及使生物样品与水凝胶接触以使得生物样品由水凝胶包围。例如,可以通过使样品与合适的聚合物材料接触,并且活化聚合物材料以形成水凝胶来包埋样品。在一些实施例中,形成了水凝胶使得水凝胶在生物样品内内化。
在一些实施例中,通过形成水凝胶的聚合物材料的交联将生物样品固定在水凝胶中。交联可以化学地和/或光化学地进行,或者可替代地通过本领域已知的任何其它水凝胶形成方法进行。例如,生物样品可以通过聚丙烯酰胺交联固定在水凝胶中。进一步地,生物样品的分析物可以通过交联(,聚丙烯酰胺交联)固定在水凝胶中。
水凝胶基质的组成和对生物样品的应用通常取决于生物样品的性质和制备(例如,切片的、未切片的、新鲜冷冻的、固定类型)。水凝胶可以是任何适当的水凝胶,其中在生物样品上形成水凝胶时,生物样品锚定或包埋水凝胶中。水凝胶的非限制性实例在本文描述或在本领域中是已知的。作为一个实例,在生物样品是组织切片的情况下,水凝胶可以包含单体溶液和过硫酸铵(APS)引发剂/四甲基乙二胺(TEMED)催化剂溶液。作为另一个实例,在生物样品由细胞(例如,培养的细胞或与组织样品分离的细胞)组成的情况下,细胞可以用单体溶液和APS/TEMED溶液温育。对于细胞,水凝胶在隔室中形成,包含但不限于用于培养、维持或传输细胞的装置。例如,可以用添加到隔室到约0.1μm到约2mm的深度范围的单体溶液加APS/TEMED来形成水凝胶。
生物样品的水凝胶包埋的另外的方法和方面描述于例如以下中:Chen等人,2015,《科学》347(6221):543–548和题为“使用带空间条形码的寡核苷酸阵列对生物分析物进行分析(Profiling of biological analytes with spatially barcoded oligonucleotidearrays)”的PCT公开202020176788A1中,所述文献中的每个文献的全部内容通过引用并入本文中。
(8)生物样品转移
在一些实施例中,使用水凝胶将固定在基板上的生物样品(例如,使用甲醇固定或福尔马林固定和石蜡包埋(FFPE)制备的生物样品)转移到空间阵列。在一些实施例中,在基板(例如,载玻片)上的生物样品顶部上形成水凝胶。例如,水凝胶形成可以以足以将生物样品锚定(例如,包埋)到水凝胶的方式发生。在水凝胶形成之后,生物样品被锚定到(例如,包埋在)水凝胶中,其中将水凝胶与基板分离导致生物样品与水凝胶一起与基板分离。然后可以使生物样品与空间阵列接触,由此允许生物样品的空间分布。在一些实施例中,在生物样品与空间阵列接触之后去除水凝胶。例如,本文所描述的方法可以包含事件依赖性(例如,光或化学)解聚水凝胶,其中在施加事件(例如,外部刺激)时使水凝胶解聚。在一个实例中,生物样品可以锚定到DTT敏感性水凝胶,其中添加DTT可以使水凝胶解聚并释放锚定的生物样品。水凝胶可以是任何适当的水凝胶,其中在生物样品上形成水凝胶时,生物样品锚定或包埋水凝胶中。水凝胶的非限制性实例在本文描述或在本领域中是已知的。在一些实施例中,水凝胶包含允许将生物样品锚定到水凝胶的连接子。在一些实施例中,水凝胶包含允许将生物分析物锚定到水凝胶的连接子。在此类情况下,可以在水凝胶形成之前、同时或之后将连接子添加到水凝胶中。将核酸锚定到水凝胶的连接子的非限制性实例可以包含6-((丙烯酰基)氨基)己酸(丙烯酰基-X SE)(可从马萨诸塞州沃尔瑟姆赛默飞世尔公司(ThermoFisher,Waltham,MA)获得)、标记-IT胺(可从威斯康星州麦迪逊MirusBio公司(MirusBio,Madison,WI)获得)和标记X(Chen等人,《自然方法(Nat.Methods)》13:679-684,2016)。任何多种特性都可以确定给定生物样品所需的转移条件。可能影响转移条件的特性的非限制性实例包含样品(例如,厚度、固定和交联)和/或所关注分析物(用于保存和/或转移不同分析物(例如,DNA、RNA和蛋白质)的不同条件)。在一些实施例中,水凝胶形成可以以足以将(例如,包埋在)生物样品中的分析物锚定到水凝胶的方式发生。在一些实施例中,水凝胶可以与生物样品中存在的锚定的分析物(例如,包埋在水凝胶中)一起内爆(例如,收缩)。在一些实施例中,水凝胶可以与生物样品中存在的锚定的分析物(例如,包埋在水凝胶中)一起扩增(例如,等距扩增)。在一些实施例中,水凝胶可以与生物样品中存在的锚定的分析物(例如,包埋在水凝胶中)一起内爆(例如,收缩)并随后扩增。
(9)等距扩增
在一些实施例中,包埋在水凝胶中的生物样品可以等距扩增。可以使用的等距扩增方法包含水合作用,即扩增显微术中的制备步骤,如描述于以下中:Chen等人,2015,《科学》347(6221)543–548、Asano等人,2018,《实验室指南(Current Protocols)》80:1,doi:10.1002/cpcb.56;Gao等人,2017,《BMC生物学》15:50,doi:10.1186/s12915-017-0393-3和Wassie等人,2018,扩增显微术:生物学研究的原理和用途(Expansion microscopy:principles and uses in biological research),《自然方法》16(1):33-41,所述文献中的每个文献以全文引用的方式并入。
通常,用于进行生物样品的等距扩增的步骤可以取决于样品的特性(例如,组织切片厚度、固定、交联)和/或所关注的分析物(例如,用于将RNA、DNA和蛋白质锚固到凝胶的不同条件)。
可以通过将生物样品的一个或多个组分锚固到凝胶,随后凝胶形成,进行蛋白水解和溶胀来进行等距扩增。生物样品的等距扩增可以在将生物样品固定在基板上之前进行,或者在将生物样品固定到基板之后进行。在一些实施例中,在使经扩增的生物样品与带空间条形码的阵列(例如,基板上的带空间条形码的捕获探针)接触之前,可以将等距扩增的生物样品从基板上去除。
在一些实施例中,生物样品中的蛋白质被锚定到可膨胀的凝胶,如聚电解质凝胶。抗体可以在被锚定到可溶胀凝胶之前、之后或结合被锚定到可溶胀凝胶而针对蛋白质。生物样品中的DNA和/或RNA也可以通过合适的连接子锚定到可膨胀凝胶。此类连接子的实例包含但不限于6-((丙烯酰基)氨基)己酸(丙烯酰基-X SE)(可从马萨诸塞州沃尔瑟姆赛默飞世尔公司获得)、标记-IT胺(可从威斯康星州麦迪逊MirusBio公司获得)和标记X(描述于例如Chen等人,《自然方法》13:679-684,2016中,所述文献的全部内容通过引用并入本文中)。
样品的等距扩增可以增加样品的随后分析的空间分辨率。例如,生物样品的等距扩增可以使空间剖析(例如,单细胞剖析)的分辨率增加。空间剖析中增加的分辨率可以由等距扩增的样品与还未等距扩增的样品进行比较来确定。
等距扩增可以实现样品的随后分析的三维空间分辨率。在一些实施例中,在存在空间剖析试剂(例如,分析物捕获剂或捕获探针)的情况下,可能会发生生物样品的等距扩增。例如,可膨胀凝胶可以包含通过合适的连接子锚定到可膨胀凝胶的分析物捕获剂或捕获探针。在一些实施例中,空间剖析试剂可以被递送到等距扩增的生物样品中的特定定位。
在一些实施例中,将生物样品等距扩增到体积为其未扩增体积的至少2倍、2.1倍、2.2倍、2.3倍、2.4倍、2.5倍、2.6倍、2.7倍、2.8倍、2.9倍、3倍、3.1倍、3.2倍、3.3倍、3.4倍、3.5倍、3.6倍、3.7倍、3.8倍、3.9倍、4倍、4.1倍、4.2倍、4.3倍、4.4倍、4.5倍、4.6倍、4.7倍、4.8倍或4.9倍。在一些实施例中,将样品等距扩增到其未扩增体积的至少2倍且小于20倍。
在一些实施例中,将包埋在水凝胶中的生物样品等距扩增到体积为其未扩增体积的至少2倍、2.1倍、2.2倍、2.3倍、2.4倍、2.5倍、2.6倍、2.7倍、2.8倍、2.9倍、3倍、3.1倍、3.2倍、3.3倍、3.4倍、3.5倍、3.6倍、3.7倍、3.8倍、3.9倍、4倍、4.1倍、4.2倍、4.3倍、4.4倍、4.5倍、4.6倍、4.7倍、4.8倍或4.9倍。在一些实施例中,将包埋在水凝胶中的生物样品等距扩增到其未扩增大小的至少2倍且小于20倍。
(10)基板附接
在一些实施例中,生物样品可以附接到基板。适用于此目的的基板的实例在下文中详细描述。生物样品的附接可以是不可逆的或可逆的,这取决于样品的性质和分析方法中的随后步骤。
在某些实施例中,可以通过将合适的聚合物涂层施加到基板,并且使样品与聚合物涂层接触来将样品可逆地附接到基板。然后可以使用使聚合物涂层至少部分溶解的有机溶剂来将样品从基板分离。水凝胶是适于此目的的聚合物的实例。
更通常地,在一些实施例中,基板可以用一种或多种物质涂覆或功能化以促进样品与基板的附接。可以用于涂覆或功能化基板的合适物质包含但不限于凝集素、聚赖氨酸、抗体和多糖。
(11)细胞未聚集
在一些实施例中,生物样品对应于细胞(例如,源自细胞培养物或组织样品)。在具有多个细胞的细胞样品中,单独的细胞可以是天然未聚集的。例如,细胞可以源自细胞的悬浮液和/或来自组织或组织切片的解离或解聚的细胞。
可替代地,样品中的细胞可以聚集,并且可以使用例如酶促或机械技术解聚成单独的细胞。用于酶解聚的酶的实例包含但不限于分散酶、胶原酶、胰蛋白酶和其组合。例如,可以使用组织均质器进行机械解聚。
在未聚集的细胞或解聚的细胞的一些实施例中,细胞分布在基板上,使得至少一个细胞占据基板上不同的空间特征。细胞可以固定在基板上(例如,以防止细胞横向扩散)。在一些实施例中,细胞固定剂可以用于在分析物捕获之前将非聚集或解聚的样品固定在上空间带条形码的阵列上。“细胞固定剂”可以是指附接到基板上的抗体,其可以与细胞表面标志物结合。在一些实施例中,基板上的多个细胞的分布遵循泊松统计。
在一些实施例中,来自多个细胞的细胞被固定在基板上。在一些实施例中,例如,通过添加水凝胶和/或通过施加电场来固定细胞以防止横向扩散。
(12)悬浮和贴壁细胞
在一些实施例中,生物样品可以源自体外生长的细胞培养物。源自细胞培养物的样品可以包含一种或多种在细胞培养物中是贴壁依赖性的悬浮细胞。此类细胞的实例包含但不限于源自造血细胞的细胞系,以及源自以下细胞系:Colo205、CCRF-CEM、HL-60、K562、MOLT-4、RPMI-8226、SR、HOP-92、NCI-H322M和MALME-3M。
源自细胞培养物的样品可以包含在含有培养基的容器的表面上生长的一种或多种贴壁细胞。悬浮和贴壁细胞的另外的非限制性实例发现于以下中:2020年8月13日提交的题为“用于使用单倍型的空间分布来确定生物状况的系统和方法”的美国专利申请第16/992,569号和题为“使用带空间条形码的寡核苷酸阵列对生物分析物进行分析”的PCT公开第202020176788A1号,所述文献中的每个文献的全部内容通过引用并入本文中。
在一些实施例中,生物样品可以被透化以促进将分析物从样品中转移出来,和/或促进物种(如捕获探针)转移进入到样品中。如果样品未被充分透化,那么从样品捕获的分析物的数量可能太低以至于不能够进行适当分析。相反,如果组织样品被过度透化,那么组织样品内的分析物的相对空间关系可能丢失。因此,期望组织样品被透化足以获得良好信号强度的同时仍维持样品中的分析物分布的空间分辨率之间的平衡。
通常,可以通过将样品暴露于一种或多种透化剂来使生物样品透化。用于此目的的合适药剂包含但不限于有机溶剂(例如,丙酮、乙醇和甲醇)、交联剂(例如,多聚甲醛)、去污剂(例如,皂苷、Triton X-100TM、Tween-20TM或十二烷基硫酸钠(SDS))和酶(例如,胰蛋白酶、蛋白酶(例如蛋白酶K)。在一些实施例中,去污剂是阴离子去污剂(例如,SDS或N-月桂酰肌氨酸钠盐溶液)。在一些实施例中,可以在酶处理之前或之后使用本文所描述的任何方法(例如,使用本文所描述的任何去污剂,例如SDS和/或N-月桂酰肌氨酸钠盐溶液)使生物样品透化(例如,用本文所描述的任何酶,例如胰蛋白酶、蛋白酶(例如,胃蛋白酶和/或蛋白酶K)处理)。
在一些实施例中,可以通过使样品暴露于大于约1.0w/v%(例如,大于约2.0w/v%、大于约3.0w/v%、大于约4.0w/v%、大于约5.0w/v%、大于约6.0w/v%、大于约7.0w/v%、大于约8.0w/v%、大于约9.0w/v%、大于约10.0w/v%、大于约11.0w/v%、大于约12.0w/v%或大于约13.0w/v%)的十二烷基硫酸钠(SDS)和/或N-月桂酰肌氨酸或N-月桂酰肌氨酸钠盐使生物样品透化。在一些实施例中,可以通过使样品暴露于约1.0w/v%到约14.0w/v%(例如,约2.0w/v%到约14.0w/v%、约2.0w/v%到约12.0w/v%、约2.0w/v%到约10.0w/v%、约4.0w/v%到约14.0w/v%、约4.0w/v%到约12.0w/v%、约4.0w/v%到约10.0w/v%、约6.0w/v%到约14.0w/v%、约6.0w/v%到约12.0w/v%、约6.0w/v%到约10.0w/v%、约8.0w/v%到约14.0w/v%、约8.0w/v%到约12.0w/v%、约8.0w/v%到约10.0w/v%、约10.0%w/v%到约14.0w/v%、约10.0w/v%到约12.0w/v%或约12.0w/v%到约14.0w/v%)SDS和/或N-月桂酰肌氨酸盐溶液和/或蛋白酶K(例如,在约4%到约35℃、约4℃到约25℃、约4℃到约20℃、约4℃到约10℃、约10℃到约25℃、约10℃到约20℃、约10℃到约15℃、约35℃到约50℃、约35℃到约45℃、约35℃到约40℃、约40℃到约50℃、约40℃到约45℃或约45℃到约50℃的温度下)(例如,持续约5分钟到约1小时、约5分钟到约40分钟、约5分钟到约30分钟、约5分钟到约20分钟或约5分钟到约10分钟)来使生物样品透化。
在一些实施例中,生物样品可以用透化剂来温育以促进样品的透化。用于样品透化的另外的方法描述于例如Jamur等人,2010,《分子生物学方法(Method Mol.Biol.)》588:63-66,2010,所述文献的全部内容通过引用并入本文中。
裂解试剂
在一些实施例中,可以通过将一个或多个裂解试剂添加到样品中来渗透生物样品。合适的裂解剂的实例包含但不限于生物活性试剂,如用于裂解不同细胞类型,例如革兰氏阳性或阴性细菌、植物、酵母、哺乳动物,的裂解酶,如溶菌酶、无色肽酶、溶葡球菌酶、唇形蛋白酶(labiase)、细胞裂解酶、溶壁酶和各种其它可商购获得的裂解酶。
其它裂解剂可以另外地或可替代地添加到生物样品以促进透化。例如,可以使用基于表面活性剂的裂解溶液以使样品细胞裂解。裂解溶液可以包含离子表面活性剂,如例如十二烷基肌氨酸钠和十二烷基硫酸钠(SDS)。更通常地,化学裂解剂可以包含但不限于有机溶剂、螯合剂、去污剂、表面活性剂和离液剂。
在一些实施例中,生物样品可以通过非化学透化方法进行透化。非化学渗透方法是本领域已知的。例如,可以使用的非化学透化方法包含但不限于物理裂解技术,如电穿孔、机械透化方法(例如,使用均质器和研磨球进行珠击以机械破坏样品组织结构)、声学透化(例如,超声)和热裂解技术,如加热以诱导样品的热透化。
蛋白酶
在一些实施例中,培养基、溶液或透化溶液可以含有一种或多种蛋白酶。在一些实施例中,用能够降解组蛋白的蛋白酶处理的生物样品可以使产生片段化的基因组DNA。片段化的基因组DNA可以使用与捕获mRNA相同的捕获结构域(例如,具有poly(T)序列的捕获结构域)来捕获。在一些实施例中,在空间剖析之前,用能够降解组蛋白的蛋白酶和RNA保护剂处理生物样品,以促进对基因组DNA和mRNA两者的捕获。
在一些实施例中,通过使样品暴露于能够降解组蛋白的蛋白酶来使生物样品透化。如本文所用,术语“组蛋白”通常是指连接子组蛋白(例如,H1)和/或核心组蛋白(例如,H2A、H2B、H3和H4)。在一些实施例中,蛋白酶降解连接子组蛋白、核心组蛋白或连接子组蛋白和核心组蛋白。可以使用能够降解生物样品中的组蛋白的任何合适的蛋白酶。能够降解组蛋白的蛋白酶的非限制性实例包含被亮肽素和TLCK(甲苯磺酰-L-赖氨酰-氯甲烷盐酸盐)抑制的蛋白酶、由来自沙眼衣原体血清型A的EUO基因编码的蛋白酶、颗粒酶A、丝氨酸蛋白酶(例如,胰蛋白酶或胰蛋白酶样蛋白酶、中性丝氨酸蛋白酶、弹性蛋白酶、组织蛋白酶G)、天冬氨酰蛋白酶(例如,组织蛋白酶D)、肽酶家族C1酶(例如,组织蛋白酶L)、胃蛋白酶、蛋白酶K、被重氮甲烷抑制剂Z-Phe-Phe-CHN(2)或环氧化物抑制剂E-64抑制的蛋白酶、溶酶体蛋白酶或嗜天青酶(例如,组织蛋白酶G、弹性蛋白酶、蛋白酶3、中性丝氨酸蛋白酶)。在一些实施例中,丝氨酸蛋白酶是胰蛋白酶、胰蛋白酶样酶或其功能变体或衍生物(例如,P00761;C0HK48;Q8IYP2;Q8BW11;Q6IE06;P35035;P00760;P06871;Q90627;P16049;P07477;P00762;P35031;P19799;P35036;Q29463;P06872;Q90628;P07478;P07146;P00763;P35032;P70059;P29786;P35037;Q90629;P35030;P08426;P35033;P35038;P12788;P29787;P35039;P35040;Q8NHM4;P35041;P35043;P35044;P54624;P04814;P35045;P32821;P54625;P35004;P35046;P32822;P35047;C0HKA5;C0HKA2;P54627;P35005;C0HKA6;C0HKA3;P52905;P83348;P00765;P35042;P81071;P35049;P51588;P35050;P35034;P35051;P24664;P35048;P00764;P00775;P54628;P42278;P54629;P42279;Q91041;P54630;P42280;C0HKA4)或其组合。在一些实施例中,胰蛋白酶是P00761、P00760、Q29463或其组合。在一些实施例中,能够降解一种或多种组蛋白的蛋白酶包括与P00761、P00760或Q29463具有至少80%序列同一性的氨基酸序列。在一些实施例中,能够降解一种或多种组蛋白的蛋白酶包括与P00761、P00760或Q29463具有至少85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%同一性的氨基酸序列。如果相对于在对酶最适条件下的蛋白酶的活性,蛋白酶具有至少50%例如至少60%、70%、80%、90%、95%、96%、97%、98%、99%或100%的活性,则所述蛋白酶可以被视为是功能变体。在一些实施例中,用胃蛋白酶或胃蛋白酶样酶进行的酶处理可以包含:P03954/PEPA1_MACFU;P28712/PEPA1_RABIT;P27677/PEPA2_MACFU;P27821/PEPA2_RABIT;P0DJD8/PEPA3_HUMAN;P27822/PEPA3_RABIT;P0DJD7/PEPA4_HUMAN;P27678/PEPA4_MACFU;P28713/PEPA4_RABIT;P0DJD9/PEPA5_HUMAN;Q9D106/PEPA5_MOUSE;P27823/PEPAF_RABIT;P00792/PEPA_BOVIN;Q9N2D4/PEPA_CALJA;Q9GMY6/PEPA_CANLF;P00793/PEPA_CHICK;P11489/PEPA_MACMU;P00791/PEPA_PIG;Q9GMY7/PEPA_RHIFE;Q9GMY8/PEPA_SORUN;P81497/PEPA_SUNMU;P13636/PEPA_URSTH以及其功能变体和衍生物或其组合。在一些实施例中,胃蛋白酶可以包含:P00791/PEPA_PIG;P00792/PEPA_BOVIN、功能变体、衍生物或其组合。
另外地,蛋白酶可以包含在反应混合物(溶液)中,所述反应混合物(溶液)还包含其它组分(例如,缓冲液、盐、螯合剂(例如,EDTA)和/或去污剂(例如,SDS、N-月桂酰肌氨酸钠盐溶液))。反应混合物可以被缓冲,具有约6.5到8.5,例如约7.0到8.0的pH。另外地,反应混合物可以在任何合适的温度下使用,如约10-50℃,例如约10-44℃、11-43℃、12-42℃、13-41℃、14-40℃、15-39℃、16-38℃、17-37℃,例如约10℃、12℃、15℃、18℃、20℃、22℃、25℃、28℃、30℃、33℃、35℃或37℃,优选地约35-45℃,例如,约37℃。
其它试剂
在一些实施例中,透化溶液可以含有另外的试剂,或者可以用另外的试剂处理生物样品以优化生物样品透化。在一些实施例中,另外的试剂是RNA保护剂。如本文所用,术语“RNA保护剂”通常是指保护RNA免于RNA核酸酶(例如,RNA酶)的试剂。可以使用保护RNA免于降解的任何适当的RNA保护剂。RNA保护剂的非限制性实例包含有机溶剂(例如,至少60%、65%、70%、75%、80%、85%、90%或95%v/v有机溶剂),所述有机溶剂包含但不限于乙醇、甲醇、丙-2-醇、丙酮、三氯乙酸、丙醇、聚乙二醇、乙酸或其组合。在一些实施例中,RNA保护剂包含乙醇、甲醇和/或丙-2-醇或其组合。在一些实施例中,RNA保护剂包含RNAlater ICE(赛默飞世尔科技公司(ThermoFisher Scientific))。在一些实施例中,RNA保护剂包括至少约60%的乙醇。在一些实施例中,RNA保护剂包括约60-95%的乙醇、约0-35%的甲醇和约0-35%的丙-2-醇,其中培养基中的有机溶剂的总量不超过约95%。在一些实施例中,RNA保护剂包括约60-95%的乙醇、约5-20%的甲醇和约5-20%的丙-2-醇,其中培养基中的有机溶剂的总量不超过约95%。
在一些实施例中,RNA保护剂包含盐。盐可以包含硫酸铵、硫酸氢铵、氯化铵、乙酸铵、硫酸铯、硫酸镉、硫酸铁(II)铯、硫酸铬(III)、硫酸钴(II)、硫酸铜(II)、氯化锂、乙酸锂、硫酸锂、硫酸镁、氯化镁、硫酸锰、氯化锰、氯化钾、硫酸钾、氯化钠、醋酸钠、硫酸钠、氯化锌、醋酸锌、硫酸锌。在一些实施例中,所述盐为硫酸盐,例如硫酸铵、硫酸氢铵、硫酸铯、硫酸镉、硫酸铁(II)铯、硫酸铬(III)、硫酸钴(II)、硫酸铜(II)、硫酸锂、硫酸镁、硫酸锰、硫酸钾、硫酸钠或硫酸锌。在一些实施例中,所述盐是硫酸铵。盐可以以约20g/100ml的培养基或更低的浓度存在,如约15g/100ml、10g/100ml、9g/100ml、8g/100ml、7g/100ml、6g/100ml、5g/100ml或更少,例如,约4g、3g、2g或1g/100ml。
另外地,RNA保护剂可以包含在进一步包含螯合剂(例如,EDTA)、缓冲剂(例如,柠檬酸钠、乙酸钠、柠檬酸钾或乙酸钾,优选地乙酸钠)和/或缓冲至介于约4到8之间(例如,约5)的pH的培养基中。
在一些实施例中,在透化之前、同时或之后用一种或多种RNA保护剂处理生物样品。例如,在用一种或多种透化试剂(例如,一种或多种蛋白酶)处理之前,用一种或多种RNA保护剂处理生物样品。在另一个实例中,用包含一种或多种RNA保护剂和一种或多种透化试剂(例如,一种或多种蛋白酶)的溶液处理生物样品。在又另一个实例中,在生物样品已经用一种或多种透化试剂(例如,一种或多种蛋白酶)处理之后,用一种或多种RNA保护剂处理生物样品。在一些实施例中,在固定之前用一种或多种RNA保护剂处理生物样品。
在一些实施例中,标识生物样品中的所捕获的分析物的定位包含核酸延伸反应。在其中捕获探针捕获片段化基因组DNA分子的一些实施例中,核酸延伸反应包含DNA聚合酶。例如,核酸延伸反应包含使用DNA聚合酶以使用所捕获的分析物(例如,片段化的基因组DNA)作为模板来延伸与所捕获的分析物(例如,片段化的基因组DNA)杂交的捕获探针。延伸反应的产物包含带空间条形码的分析物(例如,带空间条形码的片段化基因组DNA)。带空间条形码的分析物(例如,带空间条形码的片段化基因组DNA)可以用于标识生物样品中的分析物的空间定位。能够使用所捕获的分析物作为模板延伸捕获探针的任何DNA聚合酶都可以用于本文所描述的方法。DNA聚合酶的非限制性实例包含T7 DNA聚合酶;Bsu DNA聚合酶;以及大肠杆菌DNA聚合酶pol I。
防扩散介质
在一些实施例中,通常用于限制分析物扩散的防扩散介质可以包含至少一种透化试剂。例如,防扩散介质(例如,水凝胶)可以包含含有透化缓冲液或试剂的孔(例如,微孔、纳米孔或皮可孔(picowell)或孔)。在一些实施例中,在使水凝胶与样品接触之前将防扩散介质(例如,水凝胶)浸泡在透化缓冲液中。在一些实施例中,当防扩散介质施加到生物样品时,水凝胶或其它防扩散介质可以含有干燥试剂或单体以递送透化试剂。在一些实施例中,防扩散介质(例如,水凝胶)共价附接到固体基板(例如,丙烯酸化载玻片)。
在一些实施例中,可以对水凝胶进行改性以使其既能递送透化试剂又能含有捕获探针。例如,可以对水凝胶薄膜进行改性以包含带空间条形码的捕获探针。然后在使带空间条形码的水凝胶薄膜与样品接触之前,将带空间条形码的水凝胶薄膜浸泡在透化缓冲液中。在另一个实例中,水凝胶可以被改性为包含带空间条形码的捕获探针,并且被设计为在暴露于透化缓冲液或任何其它生物样品制备试剂时用作多孔膜(例如,渗透性水凝胶)。透化试剂扩散通过带空间条形码的渗透性水凝胶,并且使水凝胶的另一侧的生物样品透化。然后分析物在暴露于透化试剂之后扩散到带空间条形码的水凝胶中。在此类情况下,带空间条形码的水凝胶(例如,多孔膜)促进生物样品中的生物分析物扩散到水凝胶中。在一些实施例中,生物分析物在暴露于透化试剂之前扩散到水凝胶中(例如,当分泌的分析物存在于生物样品之外或在生物样品在添加透化试剂之前通过其它方式裂解或透化的情况下时)。在一些实施例中,透化试剂以可变的流速(例如,促进透化剂扩散穿过带空间条形码的水凝胶的任何流速)流过水凝胶。在一些实施例中,透化试剂跨带空间条形码的水凝胶流经微流体室或通道。在一些实施例中,在使用流动将透化试剂引入到生物样品之后,生物样品制备试剂可以流过水凝胶以进一步促进生物分析物扩散到带空间条形码的水凝胶中。因此带空间条形码的水凝胶薄膜将透化试剂递送到与带空间条形码的水凝胶接触的样品表面,从而增强分析物迁移和捕获。在一些实施例中,将带空间条形码的水凝胶施加到样品并且置于透化散装溶液中。在一些实施例中,浸没于透化溶剂中的水凝胶薄膜夹置在样品与带空间条形码的阵列之间。在一些实施例中,靶标分析物能够扩散穿过透化试剂浸没的水凝胶并且与水凝胶另一侧的捕获探针杂交或结合。在一些实施例中,水凝胶的厚度与分辨率损失成比例。在一些实施例中,孔(例如,微孔、纳米孔或皮可孔)可以含有带空间条形码的捕获探针和透化试剂和/或缓冲液。在一些实施例中,带空间条形码的捕获探针和透化试剂保持在间隔子之间。在一些实施例中,将样品穿孔、切割或转移到孔中,其中靶标分析物扩散通过透化试剂/缓冲液并且到达带空间条形码的捕获探针。在一些实施例中,分辨率损失可以与间隙宽度成比例(例如,样品与捕获探针之间的透化缓冲液的量)。在一些实施例中,防扩散介质(例如,水凝胶)的厚度在大约50到500微米之间,包含500、450、400、350、300、250、200、150、100或50微米厚,或50和500微米内的任何厚度。
在一些实施例中,将生物样品暴露于多孔膜(例如,渗透性水凝胶)以帮助透化并限制扩散分析物损失,同时允许透化试剂到达样品。可以操纵膜化学和孔体积以使分析物损失最小化。在一些实施例中,多孔膜可以由玻璃、硅、纸、水凝胶、聚合物单片或其它材料制成。在一些实施例中,材料可以是天然多孔的。在一些实施例中,材料可以具有蚀刻到固体材料的孔(pore)或孔(well)。在一些实施例中,透化试剂跨多孔膜流经微流体室或通道。在一些实施例中,流动控制了样品到透化试剂的通路。在一些实施例中,多孔膜是渗透性水凝胶。例如,当透化试剂和/或生物样品制备试剂可以使用扩散通过水凝胶时,水凝胶是可渗透的。本文所描述的任何合适的透化试剂和/或生物样品制备试剂可以在足以从生物样品中释放分析物(例如,核酸、蛋白质、代谢物、脂质等)的条件下使用。在一些实施例中,水凝胶在一侧上暴露于生物样品,并且在另一侧上暴露于透化试剂。透化试剂扩散通过渗透性水凝胶,并且使水凝胶的另一侧的生物样品透化。在一些实施例中,透化试剂以可变的流速(例如,促进透化剂扩散穿过水凝胶的任何流速)流过水凝胶。在一些实施例中,透化试剂跨水凝胶流经微流体室或通道。使透化试剂跨水凝胶流动可以控制试剂的浓度。在一些实施例中,可以调整水凝胶化学和孔体积以增强透化并限制扩散分析物损失。
在一些实施例中,多孔膜夹置在带空间条形码的阵列与样品之间,其中透化溶液施加在多孔膜之上。透化试剂扩散通过膜的孔并且进入到生物样品中。在一些实施例中,生物样品可以放置在基板(例如,载玻片)上。然后生物分析物扩散通过多孔膜并进入到含有捕获探针的空间中。在一些实施例中,多孔膜被改性为包含捕获探针。例如,可以使用本文所描述的任何方法将捕获探针附接到多孔膜的表面。在另一个实例中,捕获探针可以包埋在多孔膜中处于允许与生物分析物相互作用的任何深度处。在一些实施例中,多孔膜以允许多孔膜上的捕获探针与来自生物样品的生物分析物之间相互作用的配置放置在生物样品上。例如,捕获探针定位于多孔膜靠近生物样品的一侧上。在此类情况下,多孔膜的另一侧上的透化试剂通过多孔膜扩散到含有生物样品和捕获探针的定位中,以促进生物样品的透化(例如,也促进捕获探针捕获生物分析物)。在一些实施例中,多孔膜定位于样品与捕获探针之间。在一些实施例中,透化试剂跨多孔膜流经微流体室或通道。
选择性透化/选择性裂解
在一些实施例中,根据已建立的方法,可以处理生物样品以从细胞的亚细胞区域选择性地释放分析物。在一些实施例中,本文提供的方法可以包含检测生物样品中的细胞的亚细胞区域中存在的至少一种生物分析物。如本文所用,“亚细胞区域”可以是指任何亚细胞区域。例如,亚细胞区域可以是指细胞质、线粒体、细胞核、核仁、内质网、溶酶体、囊泡、高尔基体、质体、液泡、核糖体、细胞骨架或其组合。在一些实施例中,亚细胞区域包括细胞质、细胞核、线粒体和微粒体中的至少一种。在一些实施例中,亚细胞区域是细胞质。在一些实施例中,亚细胞区域是细胞核。在一些实施例中,亚细胞区域是线粒体。在一些实施例中,亚细胞区域是微粒体。
例如,可以通过选择性透化或选择性裂解从细胞的亚细胞区域中选择性地释放生物分析物。在一些实施例中,“选择性透化”可以是指一种透化方法,所述透化方法可以透化亚细胞区域的膜,同时使不同的亚细胞区域基本上完整(例如,由于所应用的透化方法,生物分析物不会从亚细胞区域中释放)。选择性透化方法的非限制性实例包含使用电泳和/或应用透化试剂。在一些实施例中,“选择性裂解”可以是指一种裂解方法,所述裂解方法可以裂解亚细胞区域的膜,同时使不同的亚细胞区域基本上完整(例如,由于所应用的裂解方法,生物分析物不会从亚细胞区域中释放)。用于选择性透化或裂解的若干方法是本领域技术人员已知的,包含以下中描述的方法:Lu等人《芯片实验室(Lab Chip)》2005年1月;5(1):23-9;Niklas等人,2011,《分析生物化学(Anal Biochem)》416(2):218-27;Cox和Emili.,2006,《自然实验手册》1(4):1872-8;Chiang等人,2000,《生物化学与生物物理学方法杂志(J Biochem.Biophys.Methods.)》20;46(1-2):53-68;以及Yamauchi和Herr等人,2017,《微系统与纳米工程化(Microsyst.Nanoeng.)》3.pii:16079;所述文献中的每个文献以全文引用的方式并入本文中。
在一些实施例中,“选择性透化”或“选择性裂解”是指特定细胞类型的选择性透化或选择性裂解。例如,“选择性透化”或“选择性裂解”可以指裂解一种细胞类型,同时使不同的细胞类型基本上完整(例如,由于所应用的透化或裂解方法,生物分析物不会从细胞中释放)。与另一个细胞“不同细胞类型”的细胞可以指来自不同分类界的细胞、原核细胞相对于真核细胞、来自不同组织类型的细胞等。本领域技术人员已知用于选择性地透化或裂解不同细胞类型的许多方法。非限制性实例包含应用透化试剂、电穿孔和/或超声处理。参见例如,国际申请第WO 2012/168003号;Han等人,2019,《微系统与纳米工程化》5:30;Gould等人,2018《肿瘤靶标(Oncotarget.)》20;9(21):15606–15615;Oren和Shai,1997,《生物化学(Biochemistry)》36(7),1826-35;Algayer等人,2019,《分子学(Molecules.)》24(11).pii:E2079;Hipp等人2017,《白血病(Leukemia)》10,2278;国际申请第WO 2012/168003号;以及美国专利第7,785,869号;所有文献以全文引用的方式并入本文中。
在一些实施例中,应用选择性透化或裂解试剂包括使生物样品与包括透化或裂解试剂的水凝胶接触。
在一些实施例中,使生物样品与两个或更多个阵列(例如,柔性阵列,如本文所描述)接触。例如,在亚细胞区域被透化并且来自所述亚细胞区域的生物分析物被捕获在第一阵列上之后,可以去除第一阵列,并且可以在第二阵列上捕获来自不同亚细胞区域的生物分析物。
(13)对RNA物种的选择性富集
在一些实施例中,在RNA是分析物的情况下,可以选择性地富集一种或多种所关注RNA分析物物种(例如,Adiconis等人,2013,对用于降解样品和低输入样品的RNA测序方法的比较分析(Comparative analysis of RNAsequencing methods for degraded andlow-input samples),《自然(Nature)》10,623-632,所述文献以全文引用的方式并入本文中)。例如,可以通过将一种或多种寡核苷酸添加到样品中来选择一种或多种RNA物种。在一些实施例中,另外的寡核苷酸是用于通过聚合酶引发反应的序列。例如,与一个或多个所关注RNA具有序列互补性的一个或多个引物序列可以用于扩增一个或多个所关注RNA,由此选择性地富集这些RNA。在一些实施例中,与所捕获的RNA(例如,cDNA)的互补链具有序列互补性的寡核苷酸可以与cDNA结合。例如,具有与一个或多个所关注cDNA互补的序列的生物素化寡核苷酸与cDNA结合,并且可以使用本领域已知的多种方法(例如,链霉亲和素珠粒)中的任何方法,使用生物素化-链霉亲和素亲和性来选择。
可替代地,一个或多个RNA(例如,核糖体和/或线粒体RNA)可以使用多种方法中的任一种进行下选(例如,去除、耗竭)。核糖体RNA耗竭的杂交和捕获方法的非限制性实例包含RiboMinusTM、RiboCopTM和Ribo-ZeroTM。另一种非限制性RNA耗竭方法涉及互补DNA寡核苷酸与不需要的RNA杂交,然后使用RNase H降解RNA/DNA杂交体。杂交和降解方法的非限制性实例包含rRNA耗竭、NuGEN AnyDeplete或RiboZero Plus。另一种非限制性核糖体RNA耗竭方法包含ZapRTM消化,例如SMARTer。在SMARTer方法中,随机核酸适配体与RNA杂交,以通过逆转录酶进行第一链合成和加尾,然后通过逆转录酶进行模板转换和延伸。另外地,第一轮PCR扩增添加了全长Illumina测序适配体(例如,Illumina索引)。核糖体RNA被ZapR v2和R探针v2切割。进行第二轮PCR,扩增非rRNA分子(例如,cDNA)。这些核糖体耗竭方案/试剂盒的部分或步骤可以进一步与本文所描述的方法组合以优化用于特定生物样品的方案。
在耗竭方案中,可以将探针施用于选择性地与核糖体RNA(rRNA)杂交的样品,由此减少样品中的rRNA的池和浓度。可以将探针施用于选择性地与线粒体RNA(mtRNA)杂交的生物样品,由此减少样品中的mtRNA的池和浓度。在一些实施例中,可以在cDNA合成期间添加与线粒体RNA互补的探针,或者可以在cDNA合成期间添加与核糖体和线粒体RNA两者都互补的探针。由于样品中存在的非特异性RNA(例如,向下选择的RNA)减少,随后将捕获探针应用于样品可以使对其它类型RNA的捕获提高。另外地或可替代地,双链体特异性核酸酶(DSN)处理可以去除rRNA(参见例如,Archer等人,2014,在cDNA阶段从RNA-seq文库中选择性和灵活地耗竭有问题的序列(Selective and flexible depletion of problematicsequences from RNA-seq libraries at the cDNA stage),《BMC基因组学(BMCGenomics)》15 401,所述文献的全部内容通引用并入本文中)。此外,羟基磷灰石色谱法可以去除丰富的物种(例如,rRNA)(参见例如,Vandernoot,2012,“通过羟基磷灰石色谱法进行cDNA归一化以富集RNA-seq应用中的转录组多样性(cDNA normalization byhydroxyapatite chromatography to enrich transcriptome diversity in RNA-seqapplications)”,《生物技术(Biotechniques)》,53(6)373-80,所述文献的全部内容通过引用并入本文中)。
(14)捕获探针相互作用
在一些实施例中,生物样品中的分析物可以在与捕获探针相互作用之前进行预处理。例如,在与捕获探针相互作用之前,由聚合酶(例如,DNA聚合酶或逆转录酶)催化的聚合反应在生物样品中进行。在一些实施例中,用于聚合反应的引物包含增强与捕获探针杂交的官能团。捕获探针可以包含适当的捕获结构域以捕获所关注生物分析物(例如,用于捕获poly(A)mRNA的poly-dT序列)。
在一些实施例中,通过下一代测序对生物分析物进行预处理以进行文库产生。例如,分析物可以通过添加修饰(例如,允许与捕获探针相互作用的序列的连接)进行预处理。在一些实施例中,使用片段化技术(例如,使用转座酶和/或片段化缓冲液)对分析物(例如,DNA或RNA)进行片段化。
片段化之后可以对分析物进行修饰。例如,修饰可以是通过连接允许与捕获探针杂交的衔接子序列添加。在一些实施例中,在所关注分析物是RNA的情况下,进行poly(A)加尾。将poly(A)尾部添加到不含poly(A)尾部的RNA中可以促进与捕获探针的杂交,所述捕获探针包含具有功能量的poly(dT)序列的捕获结构域。
在一些实施例中,在与捕获探针相互作用之前,由连接酶催化的连接反应在生物样品中进行。在一些实施例中,连接可以通过化学连接进行。在一些实施例中,可以使用如下文进一步描述的点击化学进行连接。在一些实施例中,捕获结构域包含与RNA分子具有互补性的DNA序列,其中所述RNA分子与第二个DNA序列具有互补性,并且其中RNA-DNA序列互补性用于将第二个DNA序列连接到捕获结构域中的DNA序列。在这些实施例中,对RNA分子进行直接检测是可能的。
在一些实施例中,在与捕获探针相互作用之前,在生物样品中进行靶特异性反应。靶特异性反应的实例包含但不限于靶特异性衔接子、探针和/或其它寡核苷酸的连接,使用对一种或多种分析物具有特异性的引物进行靶特异性扩增,以及使用原位杂交、DNA显微术和/或抗体检测进行靶特异性检测。在一些实施例中,捕获探针包含靶向靶特异性产物(例如,扩增或连接)的捕获结构域。
II.基于通用空间阵列的分析方法
本公开的此部分描述了用于生物样品的基于空间阵列的分析的方法、设备、系统和组合物。
(a)空间分析方法
基于阵列的空间分析方法涉及将一种或多种分析物从生物样品转移到基板上的捕获点阵列,所述捕获点中的每个捕获点与阵列上的唯一空间定位相关联。经转移的分析物的后续分析包含确定分析物的身份和样品内的每种分析物的空间定位。样品内的每种分析物的空间定位是基于阵列中每种分析物结合的捕获点以及捕获点在阵列内的相对空间定位确定的。
存在用于使空间条形码与一个或多个相邻细胞相关联的至少两种通用方法,使得空间条形码将一个或多个细胞和/或一个或多个细胞的内容标识为与特定空间定位相关联。一种通用方法是促进分析物离开细胞并朝向带空间条形码的阵列。图1描绘了此通用方法的示例性实施例。在图1中,填充有捕获探针(如本文进一步描述)的带空间条形码的阵列与样品101接触,并且样品被透化102,允许靶标分析物远离样品迁移并朝向阵列102。靶标分析物与带空间条形码的阵列上的捕获探针相互作用。一旦靶标分析物与捕获探针杂交/结合,则任选地从阵列中去除样品并分析捕获探针以获得空间分辨的分析物信息103。
另一种通用方法是从阵列上切割带空间条形码的捕获探针,并且促进带空间条形码的捕获探针朝向和/或进入到样品中或到样品上。图2描绘了此通用方法的示例性实施例,填充有捕获探针(如本文进一步描述)的带空间条形码的阵列可以与样品接触201。将带空间条形码的捕获探针切割,并且然后所述带空间条形码的捕获探针与所提供的样品内的细胞相互作用202。所述相互作用可以是共价或非共价的细胞-表面相互作用。相互作用可以是由递送系统或细胞穿透肽促进的细胞内相互作用。一旦带空间条形码的捕获探针与特定细胞相关联,就可以任选地去除样品以进行分析。样品可以在分析之前任选地解离。一旦经标记的细胞与带空间条形码的捕获探针相关联,就可以分析捕获探针以获得关于经标记的细胞的空间分辨信息203。
图3A和3B示出了包含在带空间条形码的阵列上制备样品301的示例性工作流程。样品制备可以包含将样品放置在基板(例如,芯片、载玻片等)上、固定样品和/或使样品染色以进行成像。然后在阵列上对样品(经染色或未经染色的)进行成像302,使用明场(例如,使用苏木精和曙红染色剂对样品进行成像)或荧光(用于对图像捕获点进行成像)(如图3B的上图302所展示)和/或发射成像模式(如图3B的下图304所展示)。
明场图像是透射显微镜图像,其中广谱白光放置在安装在基板上的样品的一侧上,并且相机物镜放置在另一侧上,样品本身过滤光以产生颜色或灰度强度图像1124,类似于在明亮的日子里从里面看到的彩色玻璃窗。
在一些实施例中,除了或代替明场成像,使用发射成像,如荧光成像。在发射成像方法中,基板上的样品暴露于特定窄带(第一波长带)的光,并且然后测量从样品重新发射的稍有不同波长(第二波长带)的光。这种吸收和重新发射是由于存在对所使用的激发敏感并且可以是样品的天然特性或者可以是样品在准备成像时接触过的药剂的荧光团。作为一个实例,在免疫荧光实验中,将与某种蛋白质或蛋白质类别结合并用某种荧光团标记的抗体添加到样品中。当完成此操作时,样品上的包含蛋白质或蛋白质类别的定位将发射第二波长带。事实上,具有多个荧光团的多种抗体可以用于标记样品中的多种蛋白质。每个此类荧光团都需要用不同波长的光激发,并且进一步发射不同的独特波长的光。为了在空间上分辨每种不同发射波长的光,样品会经历不同波长的光的照射,所述不同波长的光会连续激发多个荧光团,并且这些曝光中的每次曝光的图像都保存为图像,从而产生多个图像。例如,图像经历激发第一荧光团以第二波长发射的第一波长,并且在样品暴露于第一波长时拍摄样品的第一图像。然后停止将样品暴露于第一波长,并且将样品暴露于以第四波长(不同于第二波长)激发第二荧光团的第三波长(不同于第一波长)并且在样品暴露于第三波长时拍摄样品的第二图像。对多个荧光团(例如,两个或更多个荧光团、三个或更多个荧光团、四个或更多个荧光团、五个或更多个荧光团)中的每个不同荧光团重复此类过程。以此方式,获得了组织的一系列图像,每个图像都描绘了一些不同参数(如特定蛋白质或蛋白质类别)的空间布置。在一些实施例中,同时对超过一个荧光团进行成像。在此类方法中,使用激发波长的组合,每个激发波长用于超过一个荧光团中的一个,并且收集单个图像。
在一些实施例中,通过发射成像收集的每个图像都是灰度的。为了区分此类灰度图像,在一些实施例中,为每个图像分配颜色(红色阴影、蓝色阴影等)并且组合成一个合成彩色图像以供查看。此类荧光成像允许对样品中的蛋白质丰度(例如,空间蛋白质组学)进行空间分析。在一些实施例中,此类空间丰度是单独分析的。在其它实施例中,此类空间丰度与转录组学一起分析。
在其中用转录组学以及明场和/或发射成像(例如,荧光成像)分析样品的一些实施例中,靶标分析物从样品中释放并且形成带空间条形码的阵列的捕获探针杂交或结合所释放的靶标分析物303。可以将样品任选地从阵列中去除304,并且可以将捕获探针任选地从阵列中切割下来305。然后在将分析物反转录成cDNA的同时,任选地以两种模式对样品和阵列进行第二次成像305B,并且制备扩增子文库306并进行测序307。然后对图像进行空间叠加,以关联空间上识别的样品信息308。当样品和阵列没有第二次成像时,305B,反而将提供点坐标文件。点坐标文件替代第二成像步骤305B。进一步地,可以使用独特的PCR衔接子进行扩增子文库制备306并进行测序307。
图4示出了利用基板上的带空间条形码的阵列的另一个示例性工作流程,其中用空间条形码标记的带空间条形码的捕获探针聚集在被称为捕获点的区域处。空间标记的捕获探针可以包含切割结构域、一种或多种功能序列、空间条形码、唯一分子标识符和捕获结构域。空间标记的捕获探针还可以包含5'端修饰,用于可逆地附接到基板。带空间条形码的阵列与样品接触401,并且样品通过应用透化试剂透化402。可以通过将阵列/样品组合件放置于散装溶液中来施用透化试剂。可替代地,可以通过防扩散介质和/或如盖等物理屏障将透化试剂施用于样品,其中样品夹置在防扩散介质和/或屏障与含有阵列的基板之间。使用本文所公开的任何数量的技术将分析物向带空间条形码的捕获阵列迁移。例如,使用防扩散介质盖和被动迁移可以发生分析物迁移。作为另一个实例,分析物迁移可以是主动迁移,例如使用电泳转移系统。一旦分析物与带空间条形码的捕获探针非常靠近,捕获探针就可以杂交或以其它方式结合靶标分析物403。可以任选地从阵列中去除样品404。
捕获探针可以任选地从阵列上切割下来405,并且所捕获的分析物可以通过进行逆转录酶第一链cDNA反应而是带空间条形码的。可以任选地使用模板转换寡核苷酸进行第一链cDNA反应。例如,模板转换寡核苷酸可以与通过逆转录酶添加到cDNA的3'端的poly(C)尾部杂交。然后可以将原始mRNA模板和模板转换寡核苷酸从cDNA中变性,并且然后带空间条形码的捕获探针可以与cDNA杂交并且可以产生cDNA的补体。然后可以纯化和收集第一链cDNA用于下游扩增步骤。第一链cDNA可以使用PCR任选地进行扩增406,其中正向引物和反向引物侧接空间条形码和所关注靶标分析物区域,从而产生与特定空间条形码相关联的文库407。在一些实施例中,可以对文库制备进行定量和/或经历质量控制,以验证文库制备步骤的成功408。在一些实施例中,cDNA包括边合成边测序(SBS)引物序列。对文库扩增子进行测序和分析以解码空间信息407,具有另外的文库质量控制(QC)步骤408。
使用本文所描述的方法、组合物、系统、试剂盒和装置,生物样品(例如,组织样品)中存在的RNA转录物可以用于空间转录组分析。具体地,在一些情况下,带条形码的寡核苷酸可以被配置成引发、复制并因此从RNA模板产生带条形码的延伸产物或其衍生物。例如,在一些情况下,带条形码的寡核苷酸可以包含mRNA特异性引发序列,例如,允许在逆转录反应中引发和复制mRNA的poly-T引物区段或其它靶向引发序列。可替代地或另外地,可以使用带条形码的寡核苷酸的随机N聚体引物区段进行随机RNA引发。逆转录酶(RT)可以使用RNA模板和与RNA模板的3'端互补的引物来引导第一链互补DNA(cDNA)的合成。许多RT可以用于此逆转录反应,包含例如禽成髓细胞瘤病毒(AMV)逆转录酶、莫洛尼小鼠白血病病毒(moloney murine leukemia virus,M-MuLV或MMLV)以及其其它变体。当与其野生型对应物相比时,一些重组M-MuLV逆转录酶,如例如II逆转录酶,可以降低RNaseH活性和增加热稳定性,并且提供更高的特异性、更高的cDNA产率和更多长度为至多12千碱基(kb)的全长cDNA产物。在一些实施例中,逆转录酶是突变逆转录酶,如但不限于突变MMLV逆转录酶。在另一个实施例中,逆转录酶为突变MMLV逆转录酶,如但不限于2019年12月11日提交的美国专利公开第20180312822号和美国临时专利申请第62/946,885号中描述的一种或多种变体,所述文献中的两个文献以全文引用的方式并入本文中。
图5描绘了示例性工作流程,其中样品从带空间条形码的阵列中去除并且带空间条形码的捕获探针从阵列中去除以用于带条形码的分析物扩增和文库制备另一个实施例包含使用带空间条形码的阵列上的模板转换寡核苷酸进行第一链合成,而不切割捕获探针。在此实施例中,样品制备501和透化502如本文别处所描述的进行。一旦捕获探针捕获靶标分析物,通过模板转换和逆转录酶产生的第一链cDNA503然后变性,并且然后延伸第二链504。然后从第一链cDNA中使第二链cDNA变性,中和,并转移到试管中505。可以使用本文所讨论的标准技术进行cDNA定量和扩增。然后可以对cDNA进行文库制备506和任选的索引507,包含片段化、末端修复和加尾以及索引PCR步骤。还可以任选地测试文库的质量控制(QC)508。
在上文所描述的工作流程的非限制性实例中,生物样品(例如,组织切片)可以用甲醇固定,用苏木精和曙红染色,并成像。任选地,样品可以在透化之前脱色。这些图像可以用于将空间分析物丰度(例如,基因表达)模式映射返回到生物样品。透化酶可以用于直接透化载玻片上的生物样品。从生物样品的上覆细胞中释放的分析物(例如,聚腺苷酸化mRNA)可以被基板上的捕获区域内的捕获探针捕获。可以将逆转录(RT)试剂添加到透化的生物样品中。用RT试剂温育可以从所捕获的分析物(例如,聚腺苷酸化mRNA)中产生带空间条形码的全长cDNA。可以将第二链试剂(例如,第二链引物、酶)添加到载玻片上的生物样品中以启动第二链合成。所得cDNA可以从捕获探针模板中变性并转移(例如,到干净的管中)用于扩增和/或文库构建。带空间条形码的全长cDNA可以在文库构建之前通过PCR进行扩增。然后可以对cDNA进行酶促片段化和大小选择,以优化cDNA扩增子大小。P5、P7、i7和i5可以用作样品索引,并且TruSeq Read 2可通过末端修复、A加尾、衔接子连接和PCR添加。然后可以使用TruSeq Read 1和TruSeq Read 2作为测序引物位点,使用配对末端测序对cDNA片段进行测序。参见,Illumina,索引测序概述指南(Indexed Sequencing OverviewGuides),2018年2月,文件15057455v04;以及Illumina衔接子序列,2019年5月,文件#1000000002694v11,所述文献中的每个文献通过引用特此并入,针对关于P5、P7、i7、i5的信息、TruSeq Read 2、索引测序和本文所描述的其它试剂。
在一些实施例中,对由此工作流程和本文所描述的其它工作流程产生的数据进行相关分析,可以产生跨两个捕获区域表达的基因的超过95%的相关性(例如,95%或更高、96%或更高、97%或更高、98%或更高或99%或更高)。当使用细胞核的单细胞RNA测序执行所描述的工作流程时,在一些实施例中,对数据的相关分析可以产生跨两个捕获区域表达的基因的超过90%(例如,超过90%、91%、92%、93%、94%、95%、96%、97%、98%或99%)的相关性。
在一些实施例中,产生cDNA(例如,通过逆转录)之后,可以直接在基板表面上扩增cDNA。通过直接在基板表面上扩增产生cDNA的多个拷贝(例如,从所捕获的分析物合成的cDNA)可以提高最终测序文库复杂性。因此,在一些实施例中,可以通过等温核酸扩增直接在基板表面上扩增cDNA。在一些实施例中,等温核酸扩增可以扩增RNA或DNA。
在一些实施例中,等温扩增可以比标准PCR反应更快。在一些实施例中,等温扩增可以是线性扩增(例如,使用单个引物不对称)或指数扩增(例如,使用两个引物)。在一些实施例中,等温核酸扩增可以通过模板转换寡核苷酸引物进行。在一些实施例中,模板转换寡核苷酸将共同序列添加到被逆转录的RNA的5'端上。例如,在捕获探针与分析物(例如,mRNA)相互作用并进行逆转录之后,将另外的核苷酸添加到cDNA的端部,从而产生如本文所描述的3'突出端。在一些实施例中,模板转换寡核苷酸与通过逆转录酶添加的非模板化poly(C)核苷酸杂交,以继续复制到模板转换寡核苷酸的5'端,由此产生全长cDNA,为进一步扩增做好准备。在一些实施例中,模板转换寡核苷酸将共同的5'序列添加到用于cDNA扩增的全长cDNA(例如,模板转换寡核苷酸的反向补体)。
在一些实施例中,一旦产生了全长cDNA分子,模板转换寡核苷酸就可以用作cDNA扩增反应(例如,使用DNA聚合酶)中的引物。在一些实施例中,双链cDNA(例如,第一链cDNA和第二链反向补体cDNA)可以通过使用解旋酶或重组酶等温扩增,然后使用链置换DNA聚合酶进行扩增。链置换DNA聚合酶可以产生置换的第二链,从而产生扩增产物。
在本文所描述的任何等温扩增方法中,条形码交换(例如,空间条形码)可以在第一扩增循环之后发生,其中基板表面上存在未使用的捕获探针。在一些实施例中,未使用的捕获探针的游离3'OH端可以通过任何合适的3'OH阻断方法来阻断。在一些实施例中,3'OH可以通过发夹连接来阻断。
等温核酸扩增可以用于标准PCR反应(例如,需要加热至约95℃以使双链DNA变性的PCR反应)的补充或替代方案。等温核酸扩增通常不需要使用热循环仪,然而在一些实施例中,等温扩增可以在热循环仪中进行。在一些实施例中,等温扩增可以在约35℃到约75℃进行。在一些实施例中,等温扩增可以在约40℃、约45℃、约50℃、约55℃、约60℃、约65℃或约70℃或介于两者之间的任何温度下进行,取决于所使用的聚合酶和辅助酶。
等温核酸扩增技术是本领域已知的,并且可以单独使用或与本文所描述的任何空间方法组合使用。例如,合适的等温核酸扩增技术的非限制性实例包含转录介导的扩增、基于核酸序列的扩增、RNA技术的信号介导扩增、链置换扩增、滚环扩增、环介导的DNA等温扩增(LAMP)、等温多重置换扩增、重组酶聚合酶扩增、解旋酶依赖性扩增、单引物等温扩增、环状解旋酶依赖性扩增(参见例如,Gill和Ghaemi,核酸等温扩增技术:综述(Nucleic acidisothermal amplification technologies:a review),《核苷、核苷酸和核酸(Nucleosides,Nucleotides,&Nucleic Acids)》,27(3),224-43,doi:10.1080/15257770701845204(2008),所述文献以全文引用的方式并入本文中)。
在一些实施例中,等温核酸扩增是解旋酶依赖性核酸扩增。解旋酶依赖性等温核酸扩增描述于Vincent等人,2004,解旋酶依赖性等温DNA扩增,《欧洲分子生物学组织报告(EMBO Rep.)》,795-800和美国专利第7,282,328号中,所述文献均以全文引用的方式并入本文中。进一步地,基板(g例如,芯片上)上的解旋酶依赖性核酸扩增描述于以下中:Andresen等人,2009,解旋酶依赖性扩增:用于OnChip扩增和护理点诊断的潜力(Helicase-dependent amplification:use in OnChip amplification and potential for point-of-care diagnostics),《分子医学的专家评论(Expert Rev Mol Diagn.)》9,645-650,doi:10.1586/erm.09.46,所述文献以全文引用的方式并入本文中。在一些实施例中,等温核酸扩增为重组酶聚合酶核酸扩增。重组酶聚合酶核酸扩增描述于以下中:Piepenburg等人,2006,使用重组蛋白进行DNA检测(DNA Detection Using Recombinant Proteins),《公共科学图书馆·生物学(PLoS Biol.)》4,7e204和Li等人,2019,综述:重组酶聚合酶扩增的十年发展的综合总结(Review:a comprehensive summary of a decade development ofthe recombinase polymerase amplification),《分析家(Analyst)》144,31-67,doi:10.1039/C8AN01621F(2019),所述文献中的两个文献以全文引用的方式并入本文中。
通常,等温扩增技术使用本领域已知的标准PCR试剂(例如,缓冲液、dNTP等)。一些等温扩增技术可能需要另外的试剂。例如,解旋酶依赖性核酸扩增使用单链结合蛋白和辅助蛋白。在另一个实例中,重组酶聚合酶核酸扩增使用重组酶(例如,T4UvsX)、重组酶加载因子(例如,TF UvsY)、单链结合蛋白(例如,T4 gp32)、拥挤剂(例如,PEG-35K)和ATP。
在通过本文中的任何方法描述的全长cDNA等温核酸扩增之后,等温扩增的cDNA(例如,单链或双链)可以从基板回收,并且任选地随后在微量离心管中用典型的cDNA PCR扩增。然后可以将样品与本文所描述的任何空间方法一起使用。
免疫组织化学和免疫荧光
在一些实施例中,免疫荧光或免疫组织化学方案(直接和间接染色技术)作为本文呈现的示例性空间工作流程的一部分或补充进行。例如,可以根据本文所描述的方法固定组织切片。生物样品可以转移到阵列(例如,捕获探针阵列),其中使用免疫荧光方案探测分析物(例如,蛋白质)。例如,在用荧光初级抗体(3XSSC中的1:100,2%BSA,0.1%Triton X,1U/μl RNAse抑制剂,在4℃下持续30分钟)染色之前,可以对样品进行再水化、阻断和透化(3XSSC,2%BSA,0.1%Triton X,1U/μl RNAse抑制剂,在4℃下持续10分钟)。根据本文所描述的分析物捕获或空间工作流程,可以清洗、盖片(在甘油+1U/μl RNAse抑制剂中)、成像(例如,使用共聚焦显微镜或其它能够进行荧光检测的设备)、清洗和处理生物样品。
如本文所用,“抗原修复缓冲液”可以改善IF/IHC方案中的抗体捕获。用于抗原修复的示例性方案可以是预加热抗原修复缓冲液(例如,至95℃),将生物样品浸入加热的抗原修复缓冲液中持续预定时间,并且然后从抗原修复缓冲液中取出生物样品并洗涤生物样品。
在一些实施例中,优化透化可用于标识细胞内分析物。透化优化可以包含对透化剂的选择、透化剂的浓度和透化持续时间。组织透化在本文别处讨论。
在一些实施例中,在准备标记生物样品时阻断阵列和/或生物样品会降低抗体与阵列和/或生物样品的非特异性结合(降低背景)。一些实施例提供了可以在应用标记之前和/或期间应用的阻断缓冲液/阻断溶液,其中所述阻断缓冲液可以包含阻断剂,以及任选地表面活性剂和/或盐溶液。在一些实施例中,阻断剂可以是牛血清白蛋白(BSA)、血清、明胶(例如,鱼明胶)、牛奶(例如,脱脂奶粉)、酪蛋白、聚乙二醇(PEG)、聚乙烯醇(PVA)或聚乙烯吡咯烷酮(PVP)、生物素阻断试剂、过氧化物酶阻断试剂、左旋咪唑、卡诺伊溶液、甘氨酸、赖氨酸、硼氢化钠、滇胺天蓝、苏丹黑、台盼蓝、FITC阻断剂和/或乙酸。阻断缓冲液/阻断溶液可以在对生物样品进行标记之前和/或期间应用于阵列和/或生物样品(例如,荧光团缀合的抗体的应用)。
在一些实施例中,在结合空间阵列执行IF/IHC方案时,可以包含另外的步骤或优化。在执行本文讨论的空间标记的分析物捕获剂工作流程中可以包含另外的步骤或优化。
在一些实施例中,本文提供了用于从生物样品(例如,存在于生物样品中的分析物,如组织切片)中空间检测分析物(例如,检测分析物例如生物分析物的定位)的方法,所述方法包含:(a)在基板上提供生物样品;(b)对基板上的生物样品进行染色,对染色的生物样品进行成像,并且选择生物样品或生物样品的子部分(例如,所关注区域)以进行分析;(c)提供在基板上包括一个或多个捕获探针的阵列;(d)使生物样品与阵列接触,由此允许一种或多种捕获探针中的捕获探针捕获所关注分析物;以及(e)分析所捕获的分析物,由此在空间上检测所关注分析物。如本文所描述或本领域已知的任何种类的染色和成像技术可以根据本文所描述的方法使用。在一些实施例中,染色包含如本文所描述的光学标记,包含但不限于荧光、放射性、化学发光、比色或比色可检测标记。在一些实施例中,染色包含针对生物样品中的靶标分析物(例如,细胞表面或细胞内蛋白质)的荧光抗体。在一些实施例中,染色包含针对生物样品中的靶标分析物(例如,细胞表面或细胞内蛋白质)的免疫组织化学染色。在一些实施例中,染色包含化学染色,如苏木精和曙红(H&E)或过碘酸-希夫(PAS)。在一些实施例中,在对生物样品进行染色和/或成像与进行分析之间可能会经过相当长的时间(例如,几天、几个月或几年)。在一些实施例中,在阵列与生物样品接触之前、同时或之后将用于进行分析的试剂添加到生物样品中。在一些实施例中,步骤(d)包含将阵列放置在生物样品上。在一些实施例中,所述阵列是柔性阵列,其中多个带空间条形码的特征(例如,具有捕获探针的基板、具有捕获探针的珠粒)附接到柔性基板。在一些实施例中,在阵列与生物样品接触之前,采取措施减缓反应(例如,冷却生物样品的温度或使用优先在如与其最佳功能温度相比更低或更高的温度下执行其主要功能的酶)。在一些实施例中,步骤(e)在不使生物样品与阵列脱离接触的情况下进行。在一些实施例中,在生物样品不再与阵列接触之后执行步骤(e)。在一些实施例中,在对生物样品进行染色和/或成像之前、同时或之后用分析物捕获剂标记生物样品。在此类情况下,在染色和/或成像与进行分析之间可能会经过相当长的时间(例如,几天、几个月或几年)。在一些实施例中,阵列适于促进生物分析物从染色和/或成像的生物样品迁移到阵列上(例如,使用本文所描述的任何材料或方法)。在一些实施例中,生物样品在与阵列接触之前被透化。在一些实施例中,在使生物样品与阵列接触之前,透化速率被减慢(例如,以限制分析物扩散离开其在生物样品中的原始定位)。在一些实施例中,可以通过调节生物样品暴露于的条件(例如,调节温度、pH和/或光)来调节透化速率(例如,调节透化试剂的活性)。在一些实施例中,调节透化速率包含使用外部刺激物(例如,小分子、酶和/或活化试剂)来调节透化速率。例如,可以在与阵列接触之前将透化试剂提供给生物样品,所述透化试剂在条件(例如,温度、pH和/或光)改变或提供外部刺激(例如,小分子、酶和/或活化试剂)之前是无活性的。
在一些实施例中,本文提供了用于从生物样品(例如,存在于生物样品中,如组织切片)中空间检测分析物(例如,检测分析物例如生物分析物的定位)的方法,所述方法包含:(a)在基板上提供生物样品;(b)对基板上的生物样品进行染色,对染色的生物样品进行成像,并且选择生物样品或生物样品的子部分(例如,所关注区域)以进行空间转录组分析;(c)提供在基板上包括一个或多个捕获探针的阵列;(d)使生物样品与阵列接触,由此允许一种或多种捕获探针中的捕获探针捕获所关注生物分析物;以及(e)分析所捕获的生物分析物,由此在空间上检测所关注生物分析物。
(b)捕获探针
“捕获探针”,在本文中也可互换地称为“探针”,是指能够捕获(直接或间接)和/或标记生物样品中的分析物(例如,所关注分析物)的任何分子。在一些实施例中,捕获探针是核酸或多肽。在一些实施例中,捕获探针是缀合物(例如,寡核苷酸-抗体缀合物)。在一些实施例中,捕获探针包含条形码(例如,空间条形码和/或唯一分子标识符(UMI))和捕获结构域。
图6是示出了如本文所描述的捕获探针的实例的示意图。如所示出的,捕获探针602任选地通过切割结构域603如二硫键连接子与捕获点601偶联。
捕获探针602可以包含对后续处理有用的功能序列,如功能序列604,所述功能序列可以包含定序器特异性流动池附接序列,例如P5序列,以及功能序列606,所述功能序列可以包含测序引物序列,例如,R1引物结合位点、R2引物结合位点等。在一些实施例中,序列604是P7序列并且序列606是R2引物结合位点。
空间条形码605可以包含在捕获探针内,用于对靶标分析物加条形码。可以选择功能序列以与各种不同的测序系统兼容,例如454测序、Ion Torrent Proton或PGM、Illumina测序仪器、PacBio、Oxford Nanopore等,以及其要求。在一些实施例中,可以选择功能序列以与非商业化测序系统兼容。可以使用合适的功能序列的此类测序系统和技术的实例包含(但不限于)Ion Torrent Proton或PGM测序、Illumina测序、PacBio SMRT测序和OxfordNanopore测序。进一步地,在一些实施例中,可以选择功能序列以与其它测序系统兼容,包含非商业化测序系统。
在一些实施例中,空间条形码605、功能序列604(例如,流动池附接序列)和606(例如,测序引物序列)对于附接到给定捕获点的所有探针可以是共同的。空间条形码还可以包含捕获结构域607以促进对靶标分析物的捕获。
(i)捕获结构域
如上文所讨论的,每个捕获探针包含至少一个捕获结构域。“捕获结构域”是与期望的分析物特异性结合的寡核苷酸、多肽、小分子或其任何组合。在一些实施例中,捕获结构域可以用于捕获或检测期望的分析物。
在一些实施例中,捕获结构域是被配置成与一种或多种分析物如一种或多种不同类型的核酸(例如,RNA分子和DNA分子)相互作用的功能核酸序列。在一些实施例中,功能核酸序列可以包含N聚体序列(例如,随机N聚体序列),所述N聚体序列被配置成与多个DNA分子相互作用。在一些实施例中,功能序列可以包含poly(T)序列,所述poly(T)序列被配置成通过mRNA转录物的poly(A)尾部与信使RNA(mRNA)分子相互作用。在一些实施例中,功能核酸序列是蛋白质(例如,转录因子、DNA结合蛋白或RNA结合蛋白)的结合靶标,其中靶标分析物是蛋白质。
捕获探针可以包含核糖核苷酸和/或脱氧核糖核苷酸以及能够参与沃森-克里克类型(Watson-Crick type)或类似碱基对相互作用的合成核苷酸残基。在一些实施例中,捕获结构域能够引发逆转录反应以产生与所捕获的RNA分子互补的cDNA。在一些实施例中,捕获探针的捕获结构域可以引发DNA延伸(聚合酶)反应以产生与所捕获的DNA分子互补的DNA。在一些实施例中,捕获结构域可以模板化所捕获的DNA分子与直接或间接固定在基板上的表面探针之间的连接反应。在一些实施例中,捕获结构域可以连接到所捕获的DNA分子的一条链上。例如,SplintR连接酶连同RNA或DNA序列(例如,简并RNA)可以用于将单链DNA或RNA连接到捕获结构域。在一些实施例中,具有RNA模板化连接酶活性的连接酶,例如SplintR连接酶、T4 RNA连接酶2或KOD连接酶,可以用于将单链DNA或RNA连接到捕获结构域。在一些实施例中,捕获结构域包含夹板寡核苷酸。在一些实施例中,捕获结构域捕获夹板寡核苷酸。
在一些实施例中,捕获结构域定位于捕获探针的3'端处并包含可以通过例如模板依赖性聚合进行延伸的游离3'端,以形成如本文所描述的延伸的捕获探针。在一些实施例中,捕获结构域包含能够与存在于和与阵列接触的组织样品的细胞中的核酸(例如,RNA或其它分析物)杂交的核苷酸序列。在一些实施例中,可以选择或设计捕获结构域以域靶核酸选择性地或特异性地结合。例如,可以选择或设计捕获结构域以通过与mRNApoly(A)尾部杂交来捕获mRNA。因此,在一些实施例中,捕获结构域包含能够与mRNA的poly(A)尾部杂交的poly(T)DNA寡核苷酸,例如,通过磷酸二酯键连接的一系列连续脱氧胸苷残基。在一些实施例中,捕获结构域可以包含在功能上或结构上类似于poly(T)尾部的核苷酸。例如,聚-U寡核苷酸或包含脱氧胸苷类似物的寡核苷酸。在一些实施例中,捕获结构域包含至少10、11、12、13、14、15、16、17、18、19或20个核苷酸。在一些实施例中,捕获结构域包含至少25、30或35个核苷酸。
在一些实施例中,捕获探针包含具有能够与mRNA和/或基因组DNA结合的序列的捕获结构域。例如,捕获探针可以包含捕获结构域,所述捕获结构域包含能够与mRNA的poly(A)尾部和/或存在于基因组DNA中的poly(A)均聚物序列结合的核酸序列(例如,poly(T)序列)。在一些实施例中,使用末端转移酶将均聚物序列添加到mRNA分子或基因组DNA分子中,以产生具有poly(A)或poly(T)序列的分析物。例如,可以将poly(A)序列添加到分析物(例如,基因组DNA的片段)中,由此使分析物能够被poly(T)捕获结构域捕获。
在一些实施例中,随机序列,例如随机六聚体或类似序列,可以用于形成全部或部分捕获结构域。例如,随机序列可以与poly(T)(或poly(T)类似物)序列结合使用。因此,在捕获结构域包含poly(T)(或“poly(T)样”)寡核苷酸的情况下,它还可以包含随机寡核苷酸序列(例如,“poly(T)随机序列”探针)。例如,这可以定位于poly(T)序列的5'或3',例如,在捕获结构域的3'端。poly(T)随机序列探针可以促进对mRNA poly(A)尾部的捕获。在一些实施例中,捕获结构域可以是完全随机序列。在一些实施例中,可以使用简并捕获结构域。
在一些实施例中,两个或更多个捕获探针的池形成混合物,其中一个或多个捕获探针的捕获结构域包含poly(T)序列,并且一个或多个捕获探针的捕获结构域包含随机序列。在一些实施例中,两个或更多个捕获探针的池形成混合物,其中一个或多个捕获探针的捕获结构域包含poly(T)样序列,并且一个或多个捕获探针的捕获结构域包含随机序列。在一些实施例中,两个或更多个捕获探针的池形成混合物,其中一个或多个捕获探针的捕获结构域包含poly(T)随机序列,并且一个或多个捕获探针的捕获结构域包含随机序列。在一些实施例中,可以将具有简并捕获结构域的探针添加到本文列出的任何前述组合中。在一些实施例中,具有简并捕获结构域的探针可以取代本文所描述的每一对中的探针之一。
捕获结构域可以基于其被设计为捕获的特定基因序列或特定基序序列或共同/保守序列(即,序列特异性捕获结构域)。因此,在一些实施例中,捕获结构域能够与期望的核酸亚型或亚组选择性地结合,例如特定类型的RNA,如mRNA、rRNA、tRNA、SRP RNA、tmRNA、snRNA、snoRNA、SmY RNA、scaRNA、gRNA、RNase P、RNase MRP、TERC、SL RNA、aRNA、cis-NAT、crRNA、lncRNA、miRNA、piRNA、siRNA、shRNA、tasiRNA、rasiRNA、7SK、eRNA、ncRNA或其它类型的RNA。在非限制性实例中,捕获结构域能够选择性地结合期望的核糖核酸亚组,例如微生物组RNA,如16S rRNA。
在一些实施例中,捕获结构域包含作为被设计为确保捕获结构域与预期生物分析物杂交的核苷酸序列的“锚定”或“锚定序列”。在一些实施例中,锚定序列包含核苷酸序列,包含1聚体、2聚体、3聚体或更长的序列。在一些实施例中,短序列是随机的。例如,可以设计包含poly(T)序列的捕获结构域来捕获mRNA。在此类实施例中,锚定序列可以包含随机的3聚体(例如,GGG),这有助于确保poly(T)捕获结构域与mRNA杂交。在一些实施例中,锚定序列可以是VN、N或NN。可替代地,所述序列可以使用特定的核苷酸序列来设计。在一些实施例中,锚序列处于捕获结构域的3'端处。在一些实施例中,锚序列处于捕获结构域的5'端处。
在一些实施例中,捕获探针的捕获结构域在生物样品与阵列接触之前被阻断,并且当生物样品中的核酸在其被捕获在阵列上之前被修饰时使用阻断探针。在一些实施例中,阻断探针用于阻断或修饰捕获结构域的游离3'端。在一些实施例中,阻断探针可以与捕获探针杂交以掩蔽捕获结构域的游离3'端,例如,发夹探针或部分双链探针,或互补序列。在一些实施例中,捕获结构域的游离3'端可以通过化学修饰来阻断,例如,添加叠氮甲基作为化学可逆封端部分,使得捕获探针不包含游离3'端。在使生物样品与阵列接触之前,具体地在捕获结构域的游离3'端处阻断或修饰捕获探针防止对捕获探针的修饰,例如,防止将poly(A)尾部添加到捕获探针的3'端。
3'修饰的非限制性实例包含双脱氧C-3'(3'-ddC)、3'倒置dT、3'C3间隔子、3'氨基和3'磷酸化。在一些实施例中,可以修饰生物样品中的核酸,使得其可以被捕获结构域捕获。例如,可以将衔接子序列(包含能够与捕获探针的捕获结构域结合的结合结构域)添加到核酸例如片段化的基因组DNA的末端。在一些实施例中,这是通过连接衔接子序列或延伸核酸来实现的。在一些实施例中,酶用于在核酸序列的末端掺入另外的核苷酸,例如poly(A)尾部。在一些实施例中,捕获探针可以被可逆地掩蔽或修饰,使得捕获探针的捕获结构域不包含游离3'端。在一些实施例中,3'端被去除、修饰或变得不可接近,使得捕获结构域就不会易受用于修饰生物样品的核酸的过程的影响,例如连接或延伸。
在一些实施例中,捕获探针的捕获结构域被修饰以允许去除在对生物样品的核酸分子修饰期间发生的对捕获探针的任何修饰。在一些实施例中,捕获探针可以包含捕获结构域下游的另外的序列,即捕获结构域的3',即阻断结构域。
在一些实施例中,捕获探针的捕获结构域可以是非核酸结构域。不完全基于核酸的合适捕获结构域的实例包含但不限于模拟本文所描述的任何捕获结构域的功能的蛋白质、肽、适体、抗原、抗体和分子类似物。
(ii)切割结构域
每个捕获探针可以任选地包含至少一个切割结构域。切割结构域表示用于将探针可逆地附接到阵列捕获点的探针的部分,如下文将进一步描述的。进一步地,捕获探针的一个或多个片段或区域可以任选地通过切割结构域的切割从阵列捕获点中释放。作为实例,空间条形码和/或通用分子标识符(UMI)可以通过对切割结构域的切割来释放。
图7是展示了可切割捕获探针的示意图,其中经切割的捕获探针可以进入到非透化细胞中并且与样品内的靶标分析物结合。捕获探针602含有切割结构域603、细胞穿透肽703、报告分子704和二硫键(-S-S-)。705表示捕获探针的所有其它部分,例如空间条形码和捕获结构域。
在一些实施例中,将捕获探针连接到捕获点的切割结构域603是能够被酶切割的共价键。可以添加酶来切割切割结构域,从而使捕获探针从捕获点中释放。作为另一个实例,加热还可以产生切割结构域的降解和附接的捕获探针从阵列捕获点中释放。在一些实施例中,激光辐射用于加热和降解特定定位处的捕获探针的切割结构域。在一些实施例中,切割结构域是一种光敏化学键(例如,当暴露于如紫外光等光时会解离的化学键)。在一些实施例中,切割结构域可以是超声切割结构域。例如,超声切割可以取决于核苷酸序列、长度、pH、离子强度、温度和超声频率(例如,22kHz、44kHz)(Grokhovsky,S.L.,通过超声切割的DNA的特异性(Specificity of DNA cleavage by ultrasound),《分子生物学(Molecular Biology)》,40(2),276-283(2006))。
切割结构域603的其它实例包含不稳定的化学键,如但不限于酯键(例如,可用酸、碱或羟胺切割)、邻位二醇键(例如,可通过高碘酸钠切割)、狄尔斯-阿尔德(Diels-Alder)键(例如,可通过热切割)、砜键(例如,可通过碱切割)、甲硅烷基醚键(例如,可通过酸切割)、糖苷键(例如,可通过淀粉酶切割)、肽键(例如,可通过蛋白酶切割)或磷酸二酯键(例如,可通过核酸酶(例如,DNAase)切割)。
在一些实施例中,切割结构域603包含被一种或多种能够切割核酸分子例如能够破坏两个或更多个核苷酸之间的磷酸二酯键的酶识别的序列。键可以通过其它核酸分子靶向酶,如限制性酶(例如,限制性核酸内切酶)切割。例如,切割结构域可以包含限制性核酸内切酶(限制性酶)识别序列。限制性酶在被称为限制性位点的特定识别核苷酸序列处切割双链或单链DNA。在一些实施例中,稀有切割限制性酶,例如具有长识别位点(例如,长度为至少8个碱基对)的酶,用于降低在捕获探针的其它位置切割的可能性。
具有光敏化学键的寡核苷酸(例如,光可切割连接子)具有各种优势。它们可以被有效和快速地切割(例如,在纳秒和毫秒内)。在一些情况下,可以使用光掩模,使得只有阵列的特定区域暴露于可切割的刺激(例如,暴露于UV光、暴露于光、暴露于激光引起的热)。当使用光可切割连接子时,可切割反应由光触发,并且对连接子具有高度选择性,并且因此是双正交的。通常,光可切割连接子的波长吸收定位于光谱的近UV范围内。在一些实施例中,光可切割连接子的λmax为约300nm到约400nm,或约310nm到约365nm。在一些实施例中,光可切割连接子的λmax为约300nm、约312nm、约325nm、约330nm、约340nm、约345nm、约355nm、约365nm或约400nm。可以在切割结构域中使用的光敏化学键的非限制性实例在题为“用带空间条形码的寡核苷酸阵列对生物分析物进行剖析”的PCT公开202020176788A1中公开,所述公开的全部内容通过引用并入本文。
在一些实施例中,切割结构域包含可以被尿嘧啶DNA糖基化酶(UDG)和DNA糖基化酶-裂解酶核酸内切酶VIII(商业上被称为USERTM酶)的混合物切割的poly-U序列。可释放的捕获探针一旦释放就可用于反应。因此,例如,可活化的捕获探针可以通过从捕获点释放捕获探针来活化。
在一些实施例中,在捕获探针间接附接到基板的情况下,例如通过表面探针,切割结构域包含一个或多个错配核苷酸,使得表面探针和捕获探针的互补部分不是100%互补的(例如,错配碱基对的数量可以是一个、两个或三个碱基对)。此类错配例如被MutY和T7核酸内切酶I识别,这使核酸分子在错配的位置处切割。如本文所描述,“表面探针”可以是存在于基板的表面上的能够附接到药剂(例如,捕获探针)的任何部分。在一些实施例中,表面探针是寡核苷酸。在一些实施例中,表面探针是捕获探针的一部分。
在一些实施例中,在捕获探针间接(例如,固定)附接到捕获点的情况下,例如通过表面探针,切割结构域包含切口酶识别位点或序列。切口酶是仅切割DNA双链体的单链的核酸内切酶。因此,切割结构域可以包含靠近表面探针的5'端(和/或捕获探针的5'端)的切口酶识别位点,使得对表面探针或捕获探针的切割使表面探针与捕获探针之间的双链体不稳定,由此从捕获点释放捕获探针。
在其中捕获探针直接附接(例如,固定)到捕获点的一些实施例中,也可以使用切口酶。例如,可以使基板与和捕获探针的切割结构域杂交的核酸分子接触以提供或重构切口酶识别位点,例如切割辅助探针。因此,与切口酶接触将产生对切割结构域的切割,由此从捕获点释放捕获探针。此类切割辅助探针也可以用于为其它切割酶例如限制性酶提供或重构切割识别位点。
一些切口酶通过结合并识别特定核苷酸识别序列,仅在DNA分子上的特定位点处引入单链切口。已经发现了许多天然存在的切口酶,目前已经确定了其中至少四种的序列识别特性。切口酶描述于美国专利第6,867,028号中,所述美国专利以全文引用的方式并入本文中。通常,任何合适的切口酶可以用于与切割结构域的互补切口酶识别位点结合。使用后,可以从测定中去除切口酶或在释放捕获探针后使其失活,以防止对捕获探针的不希望的切割。
在一些实施例中,捕获探针中不存在切割结构域。具有缺少切割结构域的附接的捕获探针的基板的实例描述于例如Macosko等,(2015)《细胞(Cell)》161,1202–1214中,所述文献的全部内容通过引用并入本文中。
不完全基于核酸的合适捕获结构域的实例包含但不限于模拟本文所描述的任何捕获结构域的功能的蛋白质、肽、适体、抗原、抗体和分子类似物。
在一些实施例中,对应于切割结构域的捕获探针的区域可以用于某种其它功能。例如,可以包含用于核酸延伸或扩增的另外的区域,切割结构域通常定位于所述另外的区域。在此类实施例中,所述区域可以补充功能结构域,或者甚至可以作为另外的功能结构域存在。在一些实施例中,存在切割结构域,但其使用是任选的。
(iii)功能结构域
每个捕获探针可以任选地包含至少一个功能结构域。每个功能结构域通常包含用于整个分析程序中的下游分析步骤的功能性核苷酸序列。
可以与本公开结合使用的功能结构域的进一步细节描述于2020年8月13日提交的题为“用于使用单倍型空间分布确定生物状况的系统和方法”的美国专利申请第16/992,569号以及题为“用带空间条形码的寡核苷酸阵列对生物分析物进行剖析”的PCT公开202020176788A1中,所述文献中的每个文献特此通过引用并入本文中。
(iv)空间条形码
如上文所讨论的,捕获探针可以包含一个或多个空间条形码(例如,两个或更多个、三个或更多个、四个或更多个、五个或更多个)空间条形码。“空间条形码”是充当传达或能够传达空间信息的标记或标识符的连续核酸区段或两个或更多个非连续核酸区段。在一些实施例中,捕获探针包含具有空间方面的空间条形码,其中所述条形码与阵列内的特定定位或基板上的特定定位相关联。
空间条形码可以是分析物的一部分,或独立于分析物(即捕获探针的一部分)。除了分析物的内源性特征(例如,分析物或末端序列的大小)之外,空间条形码可以是附接到分析物(例如,核酸分子)的标签或标签的组合。空间条形码可以是唯一的。在其中空间条形码是唯一的一些实施例中,空间条形码既充当与一种特定捕获探针相关联的空间条形码又充当唯一分子标识符(UMI)。
空间条形码可以具有多种不同的格式。例如,空间条形码可以包含多核苷酸空间条形码;随机核酸和/或氨基酸序列;和合成的核酸和/或氨基酸序列。在一些实施例中,空间条形码以可逆或不可逆的方式附接到分析物。在一些实施例中,在对样品进行测序之前、期间和/或之后将空间条形码添加到例如DNA或RNA样品的片段。在一些实施例中,空间条形码允许标识和/或定量单独的测序读段。在一些实施例中,空间条形码用作荧光条形码,为了所述荧光条形码,荧光标记的寡核苷酸探针与空间条形码杂交。
在一些实施例中,空间条形码是基本上不与生物样品中的分析物核酸分子杂交的核酸序列。在一些实施例中,空间条形码与生物样品中的核酸分子的大部分(例如,80%或更多)上的核酸序列具有小于80%序列同一性(例如,小于70%、60%、50%或小于40%序列同一性)。
空间条形码序列可以包含捕获探针的序列内的约6到约20个或更多个核苷酸。在一些实施例中,空间条形码序列的长度可以是约6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个核苷酸或更长。在一些实施例中,空间条形码序列的长度可以是至少约6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个核苷酸或更长。在一些实施例中,空间条形码序列的长度是至多约6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个核苷酸或更短。
这些核苷酸可以是完全连续的,例如在单个相邻的核苷酸区段中,或者它们可以分隔成两个或更多个由1个或多个核苷酸分隔的单独子序列。分隔的空间条形码子序列的长度可以为约4个到约16个核苷酸。在一些实施例中,空间条形码子序列可以是约4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个核苷酸或更长。在一些实施例中,空间条形码子序列可以是至少约4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个核苷酸或更长。在一些实施例中,空间条形码子序列可以是至多约4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个核苷酸或更短。
对于附接到共同阵列捕获点的多个捕获探针,多个捕获探针中的一个或多个空间条形码序列可以包含对于与捕获点偶联的所有捕获探针相同的序列,和/或跨与捕获点偶联的所有捕获探针不同的序列。
图8是示例性多路复用空间标记的捕获点的示意图。在图8中,捕获点601可以与带空间条形码的捕获探针偶联,其中特定捕获点的带空间条形码的探针可以拥有相同的空间条形码,但具有被设计为使捕获点的空间条形码与超过一种靶标分析物相关联的不同捕获结构域。例如,捕获点可以与四种不同类型的带空间条形码的捕获探针偶联,每种类型的带空间条形码的捕获探针都具有空间条形码605。与捕获点相关联的一种类型的捕获探针包含空间条形码605与被设计为捕获mRNA靶标分析物的poly(T)捕获结构域803的组合。与捕获点相关联的第二类型的捕获探针包含空间条形码605与随机N聚体捕获结构域804的组合以用于gDNA分析。与捕获点相关联的第三类型的捕获探针包含空间条形码605和与分析物捕获剂805上的捕获结构域互补的捕获结构域的组合。与捕获点相关联的第四类型的捕获探针包含空间条形码605与捕获探针的组合,所述捕获探针可以特异性结合可以在CRISPR测定中起作用的核酸分子806(例如,CRISPR/Cas9)。虽然仅四种不同的带捕获探针条形码的构建体在图8中示出,但是带捕获探针条形码的构建体可以定制用于分析与核酸相关联并能够与此类构建体结合的任何给定分析物。例如,图8中示出的方案也可以用于本文所公开的其它分析物的同时分析,包含但不限于:(a)mRNA、谱系追踪构建体、细胞表面或细胞内蛋白质和代谢物,以及gDNA;(b)mRNA、可接近染色质(例如,ATAC-seq、DNase-seq和/或MNase-seq)细胞表面或细胞内蛋白质和代谢物,以及扰动剂(例如,CRISPR crRNA/sgRNA、TALEN、锌指核酸酶和/或如本文所描述的反义寡核苷酸);(c)mRNA、细胞表面或细胞内蛋白质和/或代谢物、带条形码的标记剂(例如,本文所描述的MHC多聚体)和免疫细胞受体(例如,T细胞受体)的V(D)J序列。在一些实施例中,扰动剂可以是小分子、抗体、药物、适体、miRNA、物理环境(例如,温度变化)或任何其它已知的扰动剂。
附接到单个阵列捕获点的捕获探针可以包含相同(或共同)的空间条形码序列、不同的空间条形码序列或两者的组合。附接到捕获点的捕获探针可以包含多组捕获探针。给定组中的捕获探针可以包含相同的空间条形码序列。相同的空间条形码序列可以不同于另一组中的捕获探针的空间条形码序列。
多个捕获探针可以包含与空间阵列上的特定定位相关联的空间条形码序列(例如,核酸条形码序列)。例如,第一多个捕获探针可以与第一区域相关联,基于第一区域内的捕获探针共有的空间条形码序列,并且第二多个捕获探针可以与第二区域相关联,基于第二区域内的捕获探针共有的空间条形码序列。第二区域可以或可以不与第一区域相关联。另外的多个捕获探针可以与其它区域内的捕获探针共有的空间条形码序列相关联。在一些实施例中,空间条形码序列在多个捕获探针分子中可以是相同的。
在一些实施例中,多个不同的空间条形码被并入到单个阵列化捕获探针中。例如,一组混合但已知的空间条形码序列可以通过提供定位的身份的重复或独立确认来提供空间条形码对给定点或定位的更强地址或属性。在一些实施例中,多个空间条形码表示特定阵列点的定位的增加特异性。
(v)唯一分子标识符
捕获探针可以包含一个或多个(例如,两个或更多个、三个或更多个、四个或更多个、五个或更多个)唯一分子标识符(UMI)。唯一分子标识符是充当特定分析物或结合特定分析物(例如,通过捕获结构域)的捕获探针的标记或标识符的连续核酸区段或两个或更多个非连续核酸区段。
可以与本公开的系统和方法一起使用的UMI的进一步细节描述于2020年8月13日提交的题为“用于使用单倍型空间分布确定生物状况的系统和方法”的美国专利申请第16/992,569号以及题为“用带空间条形码的寡核苷酸阵列对生物分析物进行剖析”的PCT公开202020176788A1中,所述文献中的每个文献特此通过引用并入本文中。
(vi)捕获探针的其它方面
对于附接到阵列捕获点的捕获探针,单独的阵列捕获点可以包含一个或多个捕获探针。在一些实施例中,单独的阵列捕获点包含数百或数千个捕获探针。在一些实施例中,捕获探针与特定的单独捕获点相关联,其中单独捕获点含有捕获探针,所述捕获探针包含对阵列上的定义的区域或定位唯一的空间条形码。
在一些实施例中,特定捕获点含有包含超过一个空间条形码的捕获探针(例如,在特定捕获点处的一个捕获探针可以包含与在同一特定捕获点处的另一个捕获探针中包含的空间条形码不同的空间条形码,而两个捕获探针包含第二公共空间条形码),其中每个空间条形码对应于阵列上的特定定义的区域或定位。例如,与阵列上的一个特定捕获点相关联的多个空间条形码序列可以通过提供对定位的复制或独立确认来提供对给定定位的更强地址或归属。在一些实施例中,多个空间条形码表示特定阵列点的定位的增加特异性。在非限制性实例中,可以用两个不同的空间条形码对特定的阵列点进行编码,其中每个空间条形码标识阵列内的特定定义区域,并且拥有两个空间条形码的阵列点标识两个定义区域重叠的子区域,例如,如维恩图的重叠部分。
在另一个非限制性实例中,特定阵列点可以用三个不同的空间条形码编码,其中第一空间条形码标识阵列内的第一区域,第二空间条形码标识第二区域,其中第二区域是完全在第一区域内的子区域,并且第三空间条形码标识第三区域,其中第三区域是完全在第一子区域和第二子区域内的子区域。
在一些实施例中,附接到阵列捕获点的捕获探针从阵列捕获点释放以用于测序。可替代地,在一些实施例中,捕获探针仍然附接到阵列捕获点,并且对探针进行测序,同时仍然附接到阵列捕获点(例如,通过原位测序)。对捕获探针的测序的其它方面在本公开的后续部分中描述。
在一些实施例中,阵列捕获点可以包含附接到捕获点的不同类型的捕获探针。例如,阵列捕获点可以包含第一类型的捕获探针和第二类型捕获探针,所述第一类型的捕获探针具有被设计为与一种类型的分析物结合的捕获结构域,所述第二类型的捕获探针具有被设计为与第二类型的分析物结合的捕获结构域。通常,阵列捕获点可以包含附接到单个阵列捕获点的一个或多个(例如,两个或更多个、三个或更多个、四个或更多个、五个或更多个、六个或更多个、八个或更多个、十个或更多个、12个或更多个、15个或更多个、20个或更多个、30个或更多个、50个或更多个)不同类型的捕获探针。
在一些实施例中,捕获探针是核酸。在一些实施例中,捕获探针通过其5'端附接到阵列捕获点。在一些实施例中,捕获探针包含从5'到3'端:一个或多个条形码(例如,空间条形码和/或UMI)和一个或多个捕获结构域。在一些实施例中,捕获探针包含从5'到3'端:一个条形码(例如,空间条形码或UMI)和一个捕获结构域。在一些实施例中,捕获探针包含从5'到3'端:切割结构域、功能结构域、一个或多个条形码(例如,空间条形码和/或UMI)和捕获结构域。在一些实施例中,捕获探针包含从5'到3'端:切割结构域、功能结构域、一个或多个条形码(例如,空间条形码和/或UMI)、第二功能结构域和捕获结构域。在一些实施例中,捕获探针包含从5'到3'端:切割结构域、功能结构域、空间条形码、UMI和捕获结构域。在一些实施例中,捕获探针不包含空间条形码。在一些实施例中,捕获探针不包含UMI。在一些实施例中,捕获探针包含用于启动测序反应的序列。
在一些实施例中,捕获探针通过其3'端固定在捕获点上。在一些实施例中,捕获探针包含从3'到5'端:一个或多个条形码(例如,空间条形码和/或UMI)和一个或多个捕获结构域。在一些实施例中,捕获探针包含从3'到5'端:一个条形码(例如,空间条形码或UMI)和一个捕获结构域。在一些实施例中,捕获探针包含从3'到5'端:切割结构域、功能结构域、一个或多个条形码(例如,空间条形码和/或UMI)和捕获结构域。在一些实施例中,捕获探针包含从3'到5'端:切割结构域、功能结构域、空间条形码、UMI和捕获结构域。
在一些实施例中,捕获探针包含原位合成的寡核苷酸。原位合成的寡核苷酸可以附接到基板,或附接到基板上的特征。在一些实施例中,原位合成的寡核苷酸包含一个或多个恒定序列,所述一个或多个恒定序列中的一个或多个用作引发序列(例如,用于扩增靶核酸的引物)。例如,原位合成的寡核苷酸可以在3'端处包含恒定序列,所述序列附接到基板,或附接到基板上的特征。另外地或可替代地,原位合成的寡核苷酸可以在游离5'端包含恒定序列。在一些实施例中,一个或多个恒定序列可以是可切割序列。在一些实施例中,原位合成的寡核苷酸包含条形码序列,例如可变条形码序列。条形码可以是本文所描述的任何条形码。条形码的长度可以是大约8到16个核苷酸(例如,8、9、10、11、12、13、14、15或16个核苷酸)。原位合成的寡核苷酸的长度可以小于100个核苷酸(例如,小于90、80、75、70、60、50、45、40、35、30、25或20个核苷酸)。在一些情况下,原位合成的寡核苷酸的长度为约20到约40个核苷酸。示例性原位合成的寡核苷酸由昂飞公司(Affymetrix)生产。在一些实施例中,将原位合成的寡核苷酸附接到阵列的捕获点。
另外的寡核苷酸可以与原位合成的寡核苷酸连接以产生捕获探针。例如,与原位合成的寡核苷酸的一部分(例如,寡核苷酸中的恒定序列)互补的引物可以用于杂交另外的寡核苷酸并延伸(使用原位合成的寡核苷酸作为模板,例如引物延伸反应)以形成双链寡核苷酸并进一步产生3'突出端。在一些实施例中,3'突出端可以通过模板非依赖性连接酶(例如,末端脱氧核苷酸转移酶(TdT)或poly(A)聚合酶)产生。可以使用合适的酶(例如,连接酶)和夹板寡核苷酸将包括一个或多个捕获结构域的另外的寡核苷酸连接到3'突出端,以产生捕获探针。因此,在一些实施例中,捕获探针是连接在一起的两个或更多个寡核苷酸序列(例如,原位合成的寡核苷酸和另外的寡核苷酸)的产物。在一些实施例中,寡核苷酸序列之一是原位合成的寡核苷酸。
在一些实施例中,捕获探针包含夹板寡核苷酸。可以使用夹板寡核苷酸和本领域已知或本文所描述的任何种类的连接酶(例如,SplintR连接酶)将两个或更多个寡核苷酸连接在一起。
在一些实施例中,寡核苷酸之一包含:恒定序列(例如,与夹板寡核苷酸的一部分互补的序列)、简并序列和捕获结构域(例如,如本文所描述)。在一些实施例中,捕获探针是通过酶在寡核苷酸序列的末端处添加多核苷酸而产生的。捕获探针可以包含简并序列,其可以作为唯一分子标识符。
捕获探针可以包含简并序列,所述简并序列是其中核苷酸序列的一些位置含有许多可能的碱基的序列。简并序列可以是简并核苷酸序列,包含约或至少5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、25、30、35、40、45或50个核苷酸。在一些实施例中,核苷酸序列含有核苷酸序列内的1、2、3、4、5、6、7、8、9、0、10、15、20、25或更多个简并位置。在一些实施例中,简并序列用作UMI。
在一些实施例中,捕获探针包含限制性核酸内切酶识别序列或可被特定酶活性切割的核苷酸序列。例如,可以使用尿嘧啶DNA糖基化酶(UDG)或尿嘧啶特异性切除试剂(USER)将尿嘧啶序列从核苷酸序列中酶切割下来。作为另一个实例,其它修饰的碱基(例如,通过甲基化修饰)可以被特异性核酸内切酶识别和切割。捕获探针可以进行酶切割,这去除了阻断结构域和在修饰过程期间添加到捕获探针的3'端的另外的核苷酸中的任何核苷酸。对阻断结构域的去除揭示和/或恢复捕获探针的捕获结构域的游离3'端。在一些实施例中,可以去除另外的核苷酸以揭示和/或恢复捕获探针的捕获结构域的3'端。
在一些实施例中,阻断结构域可以在其合成时或在其合成之后并入到捕获探针中。捕获结构域的末端核苷酸是可逆终止子核苷酸(例如,3'-O-阻断的可逆终止子和3'-未阻断的可逆终止子),并且可以在探针合成期间或之后包含在捕获探针中。
(vii)延伸的捕获探针
“延伸的捕获探针”是具有扩大的核酸序列的捕获探针。例如,在捕获探针包含核酸的情况下,“延伸的3'端”指示将另外的核苷酸添加到捕获探针的最3'核苷酸以延长捕获探针的长度,例如,通过用于延伸核酸分子的标准聚合反应,包含由聚合酶(例如,DNA聚合酶或逆转录酶)催化的模板化聚合。
在一些实施例中,使捕获探针延伸包含从所捕获的(杂交的)RNA产生cDNA。此过程涉及杂交的核酸的互补链的合成,例如,基于所捕获的RNA模板(与捕获探针的捕获结构域杂交的RNA)产生cDNA。因此,在延伸捕获探针的初始步骤中,例如cDNA产生,所捕获的(杂交的)核酸,例如RNA,充当用于延伸例如逆转录步骤的模板。
在一些实施例中,使用逆转录使捕获探针延伸。例如,逆转录包含使用逆转录酶从RNA(例如(信使RNA))合成cDNA(互补或拷贝DNA)。在一些实施例中,在组织仍在原位时执行逆转录,产生分析物文库,其中所述分析物文库包含来自相邻捕获探针的空间条形码。在一些实施例中,使用一种或多种DNA聚合酶延伸捕获探针。
在一些实施例中,捕获探针的捕获结构域包含用于产生与捕获探针杂交的核酸的互补链的引物,例如用于DNA聚合酶和/或逆转录的引物。由延伸反应产生的核酸分子,例如DNA和/或cDNA分子结合了捕获探针的序列。对捕获探针的延伸,例如DNA聚合酶和/或逆转录反应,可以使用多种合适的酶和方案进行。
在一些实施例中,产生全长DNA分子,例如cDNA。在一些实施例中,“全长”DNA分子是指整个捕获的核酸分子。然而,如果核酸例如RNA在组织样品中被部分降解,那么所捕获的核酸分子的长度将与组织样品中的初始RNA不同。在一些实施例中,经延伸的探针的3'端例如第一链cDNA分子被修饰。例如,可以将连接子或衔接子连接到经延伸的探针的3'端。这可以使用单链连接酶来实现,如T4 RNA连接酶或CircligaseTM(可从威斯康星州米德尔顿卢西根公司(Lucigen,Middleton,WI)获得)。在一些实施例中,模板转换寡核苷酸用于延伸cDNA以产生全长cDNA(或尽可能接近全长cDNA)。在一些实施例中,第二链合成辅助探针(能够与经延伸的捕获探针的3'端杂交的部分双链DNA分子)可以使用双链连接酶如T4 DNA连接酶连接到经延伸的探针分子的3'端,例如第一链cDNA。适用于连接步骤的其它酶是本领域已知的并且包含例如Tth DNA连接酶、Taq DNA连接酶、热球菌(Thermococcus sp.)(菌株9oN)DNA连接酶(9oNTM DNA连接酶,新英格兰生物实验室(New England Biolabs))、AmpligaseTM(可从威斯康星州米德尔顿卢西根公司获得)和SplintR(可从马萨诸塞州伊普斯威奇新英格兰生物实验室(New England Biolabs,Ipswich,MA)获得)。在一些实施例中,多核苷酸尾部,例如poly(A)尾部,并入经延伸的探针分子的3'端。在一些实施例中,使用末端转移酶活性酶并入多核苷酸尾部。
在一些实施例中,在扩增和/或分析例如序列分析之前处理经双链延伸的捕获探针以去除任何未经延伸的捕获探针。这可以通过多种方法来实现,例如,使用酶来降解未经延伸的探针,如核酸外切酶或纯化柱。
在一些实施例中,经延伸的捕获探针被扩增以产生足以用于分析的数量,例如通过DNA测序。在一些实施例中,经延伸的捕获探针(例如,DNA和/或cDNA分子)的第一链充当用于扩增反应(例如,聚合酶链式反应)的模板。
在一些实施例中,扩增反应使用包含亲和基团的引物将亲和基团并入到经延伸的捕获探针(例如,RNA-cDNA杂合体)上。在一些实施例中,引物包含亲和基团,并且经延伸的捕获探针包含亲和基团。亲和基团可以对应于先前描述的任何亲和基团。
在一些实施例中,包含亲和基团的经延伸的捕获探针可以与对亲和基团具有特异性的阵列特征偶联。在一些实施例中,基板可以包含体或抗体片段。在一些实施例中,阵列特征包含亲和素或链霉亲和素,并且亲和基团包含生物素。在一些实施例中,阵列特征包含麦芽糖,并且亲和基团包含麦芽糖结合蛋白。在一些实施例中,阵列特征包含麦芽糖结合蛋白,并且亲和基团包含麦芽糖。在一些实施例中,扩增经延伸的捕获探针可以用于从阵列特征中释放经延伸的探针,只要经延伸的探针的拷贝没有附接到阵列特征。
在一些实施例中,经延伸的捕获探针或其补体或扩增子从阵列特征中释放。从阵列特征中释放经延伸的捕获探针或其补体或扩增子的步骤可以以多种方式实现。在一些实施例中,通过核酸切割和/或变性(例如,通过加热以使双链分子变性)从特征中释放经延伸的捕获探针或其补体。
在一些实施例中,经延伸的捕获探针或其补体或扩增子通过物理方式从阵列特征中释放中值。例如,用于诱导物理释放的方法包含使双链核酸分子变性。用于释放经延伸的捕获探针的另一种方法是使用干扰双链分子的氢键的溶液。在一些实施例中,经延伸的捕获探针通过施加加热的水如至少85℃,例如至少90、91、92、93、94、95、96、97、98或99℃的水或缓冲液来释放。在一些实施例中,添加包含盐、表面活性剂等的可以进一步破坏核酸分子之间的相互作用的溶液,以从阵列特征中释放经延伸的捕获探针。在一些实施例中,甲酰胺溶液可以用于破坏核酸分子之间的相互作用以从阵列特征中释放经延伸的捕获探针。
(viii)对捕获探针的扩增
在一些实施例中,本文提供了用于扩增固定到空间阵列的捕获探针的方法,其中对所述捕获探针的扩增增加了空间阵列上的捕获结构域和空间条形码的数量。在其中捕获探针被扩增的一些实施例中,扩增通过滚环扩增进行。在一些实施例中,要扩增的捕获探针包含能够实现滚环扩增的序列(例如,对接序列、功能序列和/或引物序列)。在一个实例中,捕获探针可以包含能够与用于扩增的引物结合的功能序列。在另一个实例中,捕获探针可以包含一个或多个对接序列(例如,第一对接序列和第二对接序列),所述一个或多个对接序列可以与用于滚环扩增的一个或多个寡核苷酸(例如,挂锁探针)杂交。在一些实施例中,另外的探针被固定到基板,其中另外的探针包含能够实现滚环扩增的序列(例如,对接序列、功能序列和/或引物序列)。在一些实施例中,空间阵列与寡核苷酸(例如,挂锁探针)接触。如本文所用,“挂锁探针”是指在其5'和3'端具有与捕获探针上的相邻或附近靶序列(例如,对接序列)互补的序列的寡核苷酸。在与靶序列(例如,对接序列)杂交后,挂锁探针的两端要么接触,要么延伸一端直到两端接触,从而允许通过连接(例如,使用任何本文所描述的任何方法进行连接)使挂锁探针环化。在一些实施例中,寡核苷酸环化之后,滚环扩增可以用于扩增连接产物,所述连接产物至少包含捕获结构域和来自捕获探针的空间条形码。在一些实施例中,使用挂锁寡核苷酸和滚环扩增对捕获探针进行扩增增加了捕获结构域的数量和空间阵列上的空间条形码的数量。
在一些实施例中,一种增加空间阵列的捕获效率的方法包含扩增固定到基板的全部或部分捕获探针。例如,通过增加捕获结构域和空间条形码的数量,对固定到基板的全部或部分捕获探针进行扩增可以增加空间阵列的捕获效率。在一些实施例中,确定分析物在生物样品中的定位的方法包含使用具有增加的捕获效率的空间阵列(例如,其中捕获探针已如本文所描述被扩增的空间阵列)。例如,空间阵列的捕获效率可以通过在与生物样品接触之前扩增全部或部分捕获探针来增加。如与其中捕获探针在接触生物样品之前未被扩增的空间阵列相比,扩增使能够实现对更多分析物的捕获的捕获结构域的数量增加。在一些实施例中,一种产生具有增加的捕获效率的空间阵列的方法包含扩增全部或部分捕获探针。在其中通过扩增全部或部分捕获探针产生具有增加的捕获效率的空间阵列的一些实施例中,扩增增加了捕获结构域的数量和空间阵列上的空间条形码的数量。在一些实施例中,确定空间阵列上的捕获探针(例如,特征上的捕获探针)的定位的方法包含扩增全部或部分捕获探针。例如,对固定到基板的捕获探针的扩增可以增加用于捕获探针的定位的直接解码(例如,使用本文所描述的任何方法进行直接解码,包含但不限于原位测序)的空间条形码的数量。
(ix)分析物捕获剂
从这里开始本公开还提供了用于使用分析物捕获剂对生物分析物(例如,mRNA、基因组DNA、可接近的染色质和细胞表面或细胞内蛋白质和/或代谢物)进行空间剖析的方法和材料。如本文所用,“分析物捕获剂”(以前有时也被称为“细胞标记”剂)是指与分析物(例如,样品中的分析物)和与捕获探针(例如,附接到基板的捕获探针)相互作用以标识分析物的药剂。在一些实施例中,分析物捕获剂包含分析物结合部分和捕获剂条形码结构域。
图14是用于捕获分析物的示例性分析物捕获剂4002的示意图。分析物捕获剂包括分析物结合部分4004和捕获剂条形码结构域4008。分析物结合部分4004是能够与分析物4006结合并与带空间条形码的捕获探针相互作用的分子。分析物结合部分可以以高亲和力和/或以高特异性与分析物4006结合。分析物捕获4002剂可以包含捕获剂条形码结构域4008、核苷酸序列(例如,寡核苷酸),其可以与捕获探针的捕获结构域的至少一部分或全部杂交。分析物结合部分4004可以包含多肽和/或适体(例如,与特异性靶标分析物结合的寡核苷酸或肽分子)。分析物结合部分4004可以包含抗体或抗体片段(例如,抗原结合片段)。
如本文所用,术语“分析物结合部分”是指能够与大分子成分(例如,分析物,如生物分析物)结合的分子或部分。在本文所描述的任何空间剖析方法的一些实施例中,与生物分析物4006结合的分析物捕获剂4002的分析物结合部分4004可以包含但不限于抗体或其表位结合片段、细胞表面受体结合分子、受体配体、小分子、双特异性抗体、双特异性T细胞接合剂、T细胞受体接合剂、B细胞受体接合剂、前体、适体、单体、亲和体、预设计锚蛋白重复蛋白(darpin)和蛋白质支架或其任何组合。分析物结合部分4004可以以高亲和力和/或以高特异性与大分子成分(例如,分析物)结合。分析物结合部分4004可以包含核苷酸序列(例如,寡核苷酸),所述核苷酸序列可以对应于分析物结合部分的至少一部分或全部。分析物结合部分4004可以包含多肽和/或适体(例如,与特异性靶分子例如分析物结合的多肽和/或适体)。分析物结合部分4004可以包含抗体或抗体片段(例如,抗原结合片段),所述抗体或抗体片段与特异性分析物(例如,多肽)结合。
在一些实施例中,分析物捕获剂4002的分析物结合部分4004包含一种或多种抗体或其抗原结合片段。包含分析物结合部分4004的抗体或抗原结合片段可以与靶标分析物特异性结合。在一些实施例中,分析物4006是蛋白质(例如,生物样品的表面上的蛋白质,如细胞,或细胞内蛋白质)。在一些实施例中,包括多个分析物结合部分的多种分析物捕获剂结合存在于生物样品中的多种分析物。在一些实施例中,多种分析物包含单个物种的分析物(例如,单个物种的多肽)。在其中多种分析物包含单个物种的分析物的一些实施例中,多种分析物捕获剂的分析物结合部分是相同的。在其中多种分析物包含单个物种的分析物的一些实施例中,多种分析物捕获剂的分析物结合部分是不同的(例如,多种分析物捕获剂的成员可以具有两种或更多种物种的分析物结合部分,其中所述两种或更多种物种的分析物结合部分中的每一种结合单个物种的分析物,例如在不同的结合位点处)。在一些实施例中,多种分析物包含多种不同物种的分析物(例如,多种不同物种的多肽)。
分析物捕获剂4002可以包含分析物结合部分4004。分析物结合部分4004可以是抗体。可以用作分析物捕获剂4002中的分析物结合部分4004或可以用于本文所公开的应用中的示例性非限制性抗体包含包括其变体的以下中的任一种:A-ACT、A-AT、ACTH、肌动蛋白肌肉特异性、肌动蛋白平滑肌(SMA)、AE1、AE1/AE3、AE3、AFP、AKT磷酸盐、ALK-1、淀粉样蛋白A、雄激素受体、膜联蛋白A1、B72.3、BCA-225、BCL-1(周期素D1)、BCL-1/CD20、BCL-2、BCL-2/BCL-6、BCL-6、Ber-EP4、β-淀粉样蛋白、β-连环蛋白、BG8(Lewis Y)、BOB-1、CA 19.9、CA125、CAIX、降钙素、钙调结合蛋白、钙调蛋白、钙网膜蛋白、CAM 5.2、CAM 5.2/AE1、CD1a、CD2、CD3(M)、CD3(P)、CD3/CD20、CD4、CD5、CD7、CD8、CD10、CD14、CD15、CD20、CD21、CD22、CD23、CD25、CD30、CD31、CD33、CD34、CD35、CD43、CD45(LCA)、CD45RA、CD56、CD57、CD61、CD68、CD71、CD74、CD79a、CD99、CD117(c-KIT)、CD123、CD138、CD163、CDX-2、CDX-2/CK-7、CEA(M)、CEA(P)、嗜铬粒蛋白A、糜蛋白酶、CK-5、CK-5/6、CK-7、CK-7/TTF-1、CK-14、CK-17、CK-18、CK-19、CK-20、CK-HMW、CK-LMW、CMV-IH、COLL-IV、COX-2、D2-40、DBA44、肌间线蛋白、DOG1、EBER-ISH、EBV(LMP1)、E-钙粘蛋白、EGFR、EMA、ER、ERCC1、因子VIII(vWF)、因子XIIIa、肌成束蛋白、FLI-1、FHS、半乳凝素-3、胃泌激素、GCDFP-15、GFAP、胰高血糖素、血型糖蛋白A、磷脂酰肌醇聚糖-3、颗粒酶B、生长激素(GH)、GST、HAM 56、HMBE-1、HBP、HCAg、HCG、血红蛋白A、HEPB CORE(HBcAg)、HEP B SURF(HBsAg)、HepPar1、HER2、Herpes I、Herpes II、HHV-8、HLA-DR、HMB 45、HPL、HPV-IHC、HPV(6/11)-ISH、HPV(16/18)-ISH、HPV(31/33)-ISH、HPV WSS-ISH、HPV高-ISH、HPV低-ISH、HPV高和低-ISH、IgA、IgD、IgG、IgG4、IgM、抑制素、胰岛素、JC病毒-ISH、κ-ISH、KER PAN、Ki-67、λ-IHC、λ-ISH、LH、脂肪酶、溶菌酶(MURA)、乳腺珠蛋白、MART-1、MBP、M-细胞类胰蛋白酶、MEL-5、黑色素-A,、黑色素-A/Ki-67、间皮素、MiTF、MLH-1、MOC-31、MPO、MSH-2、MSH-6、MUC1、MUC2、MUC4、MUC5AC、MUM-1、MYO D1、成肌素、肌红蛋白、肌球蛋白重链、新天冬氨酸蛋白酶A、NB84a、NEW-N、NF、NK1-C3、NPM、NSE、OCT-2、OCT-3/4、OSCAR、p16、p21、p27/Kip1、p53、p57、p63、p120、P504S、泛黑色素瘤、PANC.POLY、细小病毒B19、PAX-2、PAX-5、PAX-5/CD43、PAX=5/CD5、PAX-8、PC、PD1、穿孔素、PGP 9.5、PLAP、PMS-2、PR、催乳素、PSA、PSAP、PSMA、PTEN、PTH、PTS、RB、RCC、S6、S100、血清素、生长抑素、表面活性剂(SP-A)、突触素、突触核蛋白、TAU、TCL-1、TCRβ、TdT、血栓调节蛋白、甲状腺球蛋白、TIA-1、TOXO、TRAP、TriViewTM乳房、TriViewTM前列腺、胰蛋白酶、TS、TSH、TTF-1、酪氨酸酶、泛素、尿空斑蛋白(Uroplakin)、VEGF、绒毛蛋白、波形蛋白(VIM)、VIP、VZV、WT1(M)N端、WT1(P)C端和ZAP-70。
进一步地,可以用作分析物捕获剂4002中的分析物结合部分4004或可以用于本文所公开的应用中的示例性非限制性抗体包含以下抗体(和其变体)中的任何一种:细胞表面蛋白、细胞内蛋白、激酶(例如,AGC激酶家族如AKT1、AKT2、PDK1、蛋白激酶C、ROCK1、ROCK2、SGK3)、CAMK激酶家族(例如,AMPK1、AMPK2、CAMK、Chk1、Chk2、Zip)、CK1激酶家族、TK激酶家族(例如,Abl2、AXL、CD167、CD246/ALK、c-Met、CSK、c-Src、EGFR、ErbB2(HER2/neu)、ErbB3、ErbB4、FAK、Fyn、LCK、Lyn、PKT7、Syk、Zap70)、STE激酶家族(例如,ASK1、MAPK、MEK1、MEK2、MEK3 MEK4、MEK5、PAK1、PAK2、PAK4、PAK6)、CMGC激酶家族(例如,Cdk2、Cdk4、Cdk5、Cdk6、Cdk7、Cdk9、Erk1、GSK3、Jnk/MAPK8、Jnk2/MAPK9、JNK3/MAPK10、p38/MAPK)以及TKL激酶家族(例如,ALK1、ILK1、IRAK1、IRAK2、IRAK3、IRAK4、LIMK1、LIMK2、M3K11、RAF1、RIP1、RIP3、VEGFR1、VEGFR2、VEGFR3)、极光激酶A、极光激酶B、IKK、Nemo样激酶、PINK、PLK3、ULK2、WEE1、转录因子(例如,FOXP3、ATF3、BACH1、EGR、ELF3、FOXA1、FOXA2、FOX01、GATA)、生长因子受体和肿瘤抑制因子(例如,抗p53、抗BLM、抗Cdk2、抗Chk2、抗BRCA-1、抗NBS1、抗BRCA-2、抗WRN、抗PTEN、抗WT1、抗p38)。
在一些实施例中,分析物捕获剂4002能够与细胞内存在的分析物4006结合。在一些实施例中,分析物捕获剂能够与细胞表面分析物结合,所述细胞表面分析物包含但不限于受体、抗原、表面蛋白、跨膜蛋白、分化蛋白簇、蛋白通道、蛋白泵、载体蛋白、磷脂、糖蛋白、糖脂、细胞-细胞相互作用蛋白复合物、抗原呈递复合物、主要组织相容性复合物、工程化T细胞受体、T细胞受体、B细胞受体、嵌合抗原受体、细胞外基质蛋白、细胞表面蛋白的翻译后修饰(例如,磷酸化、糖基化、泛素化、亚硝基化、甲基化、乙酰化或脂化)状态、间隙连接和粘附连接。在一些实施例中,分析物捕获剂4002能够与翻译后修饰的细胞表面分析物结合。在此类实施例中,基于给定的翻译后修饰状态(例如,磷酸化、糖基化、泛素化、亚硝基化、甲基化、乙酰化或脂化),分析物捕获剂可以对细胞表面分析物具有特异性,使得细胞表面分析物谱可以包含一种或多种分析物的翻译后修饰信息。
在一些实施例中,分析物捕获剂4002包含与分析物结合部分缀合或以其它方式附接的捕获剂条形码结构域4008。在一些实施例中,捕获剂条形码结构域4008与分析物结合部分4004共价连接。在一些实施例中,捕获剂条形码结构域4008是核酸序列。在一些实施例中,捕获剂条形码结构域4008包含或共价结合到分析物结合部分条形码和分析物捕获序列4114。
如本文所用,术语“分析物结合部分条形码”是指与分析物结合部分4004相关联或以其它方式标识所述分析物结合部分的条形码。在一些实施例中,通过标识分析物结合部分4004和其相关联的分析物结合部分条形码,也可以标识分析物结合部分4004所结合的分析物4006。分析物结合部分条形码可以是给定长度的核酸序列和/或与分析物结合部分4004相关联的序列。分析物结合部分条形码通常可以包含本文所描述的条形码的多个方面中的任何方面。例如,对一种类型的分析物具有特异性的分析物捕获剂4002可以具有与其偶联的第一捕获剂条形码结构域(例如,其包含第一分析物结合部分条形码),而对不同分析物具有特异性的分析物捕获剂可以具有与其偶联的不同捕获剂条形码结构域(例如,其包含第二条形码分析物结合部分条形码)。在一些方面,此类捕获剂条形码结构域可以包含分析物结合部分条形码,所述分析物结合部分条形码允许标识与捕获剂条形码结构域偶联的分析物结合部分4004。对捕获剂条形码结构域4008的选择可以允许序列方面的显著多样性,同时也易于附接到大多数分析物结合部分(例如,抗体或适体)以及易于检测(例如,使用测序或阵列技术)。
在一些实施例中,分析物捕获剂4002的捕获剂条形码结构域包含分析物捕获序列。如本文所用,术语“分析物捕获序列”是指被配置成与捕获探针的捕获结构域杂交、结合、偶联或以其它方式相互作用的区域或部分。在一些实施例中,分析物捕获序列包含与捕获探针的捕获结构域互补或基本上互补的核酸序列,使得分析物捕获序列与捕获探针的捕获结构域杂交。在一些实施例中,分析物捕获序列包括与包括poly(T)核酸序列的捕获结构域杂交的poly(A)核酸序列。在一些实施例中,分析物捕获序列包括与包括poly(A)核酸序列的捕获结构域杂交的poly(T)核酸序列。在一些实施例中,分析物捕获序列包括与捕获结构域杂交的非均聚核酸序列,所述捕获结构域包括与分析物捕获区域的非均聚核酸序列互补(或基本上互补)的非均聚核酸序列。
在本文所描述的采用分析物捕获剂4002的任何空间分析方法的一些实施例中,捕获剂条形码结构域可以直接偶联到分析物结合部分4004,或者它们可以附接到珠粒、分子晶格,例如线性的、球状的、交联的或其它聚合物,或与分析物结合部分附接或以其它方式缔合的其它帧,其允许将多个捕获剂条形码结构域附接到单个分析物结合部分。捕获剂条形码结构域与分析物结合部分4004的附接(偶联)可以通过多种直接或间接、共价或非共价缔合或附接中的任何一种来实现。例如,在捕获剂条形码结构域与包含抗体或抗原结合片段的分析物结合部分4004偶联的情况下,此类捕获剂条形码结构域可以使用化学缀合技术(例如,可从英诺华生物科学公司(Innova Biosciences)获得的抗体标记试剂盒)与抗体或抗原结合片段的一部分共价附接。在一些实施例中,捕获剂条形码结构域可以使用非共价附接机制(例如,使用生物素化抗体和包含一个或多个生物素化连接子的寡核苷酸或珠粒,通过亲和素或链霉亲和素连接子与寡核苷酸偶联)与抗体或抗原结合片段偶联。可以使用抗体和寡核苷酸生物素化技术,并且所述抗体和寡核苷酸生物素化技术描述于例如Fang等人,2003,《核酸研究(Nucleic Acids Res.)》31(2):708-715中,所述文献的全部内容通过引用并入本文。同样,蛋白质和肽生物素化技术已被开发并可以使用,并且例如在美国专利第6,265,552号中描述,所述美国专利的全部内容通过引用并入本文。此外,点击反应化学,如甲基四嗪-PEG5-NHS酯反应、TCO-PEG4-NHS酯反应等,可以用于将捕获剂条形码结构域与分析物结合部分4004偶联。分析物结合部分上的反应性部分还可以包含用于靶向醛的胺、用于靶向马来酰亚胺的胺(.例如,游离硫醇)、用于靶向点击化学化合物(例如,炔烃)的叠氮化物、用于靶向链霉亲和素的生物素、用于靶向EDC的磷酸盐,其进而靶向活性酯(例如,NH2)。分析物结合部分4004上的反应性部分可以是与反应性部分结合的化学化合物或基团。用于将分析物结合部分4004与捕获剂条形码结构域缀合的示例性策略包含使用商业试剂盒(例如,Solulink、Thunder link)、铰链区和马来酰亚胺标记的轻度还原的缀合、染色促进对标记酰胺的点击化学反应(例如,无铜),以及糖链的高碘酸盐氧化和胺缀合的缀合。在分析物结合部分4004是抗体的情况下,可以在缀合寡核苷酸之前或同时修饰抗体。例如,可以用β-1,4-半乳糖基转移酶的化学底物允许突变体、GalT(Y289L)和带有叠氮化物的二磷酸尿苷-N-乙酰半乳糖胺类似物二磷酸尿苷-GalNAz对抗体进行糖基化。经修饰的抗体可以与具有二苯并环辛炔-PEG4-NHS基团的寡核苷酸缀合。在一些实施例中,可以避免某些步骤(例如,COOH活化,如EDC)和同双功能交联剂)以防止分析物结合部分与其自身缀合。在本文所描述的任何空间剖析方法的一些实施例中,分析物捕获剂(例如,与寡核苷酸偶联的分析物结合部分4004)可以例如通过转染(例如,使用转染胺、阳离子聚合物、磷酸钙或电穿孔)、通过转导(例如,使用噬菌体或重组病毒载体)、通过机械递送(例如,磁珠)、通过脂质(例如,1,2-二油酰-sn-甘油-3-磷酸胆碱(DOPC))或通过转运蛋白递送到细胞中。
可以使用外泌体将分析物捕获剂4002递送到细胞中。例如,可以产生释放包括分析物捕获剂的外泌体的第一细胞。分析物捕获剂可以附接到外泌体膜。分析物捕获剂可以包含在外泌体的细胞质中。可以收获释放的外泌体并将其提供给第二细胞,由此将分析物捕获剂递送到第二细胞中。分析物捕获剂可以在递送到细胞之前、期间或之后从外泌体膜释放。在一些实施例中,细胞被透化以允许分析物捕获剂4002与细胞内成分(如但不限于细胞内蛋白、代谢物和核膜蛋白)偶联。在细胞内递送之后,分析物捕获剂4002可以用于分析本文所描述的细胞内成分。
在本文所描述的任何空间剖析方法的一些实施例中,与分析物捕获剂4002偶联的捕获剂条形码结构域可以包含使其不能被聚合酶延伸的修饰。在一些实施例中,当与用于引物延伸反应的样品中的捕获探针或核酸的捕获结构域结合时,捕获剂条形码结构域可以用作模板,而不是引物。当捕获剂条形码结构域还包含条形码(例如,分析物结合部分条形码)时,此类设计可以通过增加捕获剂条形码结构域与不带条形码的样品核酸之间的亲和力来提高分子加条形码的效率,并消除衔接子伪影的潜在形成。在一些实施例中,捕获剂条形码结构域4008可以包含随机N聚体序列,所述序列用使其不能被聚合酶延伸的修饰加帽。在一些情况下,可以设计随机N聚体序列的组成,以最大化与游离不带条形码的ssDNA分子的结合效率。所述设计可以包含具有较高GC含量的随机序列组合物、在特定位置处具有固定G或C的部分随机序列、鸟苷的使用、锁定核酸的使用或其任何组合。
用于通过聚合酶阻断引物延伸的修饰可以是不同长度的碳间隔基团或双脱氧核苷酸。在一些实施例中,修饰可以是具有嘌呤或嘧啶结构的脱碱基位点、碱基类似物或磷酸骨架的类似物,如通过酰胺键连接的N-(2-氨基乙基)-甘氨酸骨架、四氢呋喃或1',2'-二脱氧核糖。修饰还可以是尿嘧啶碱基、经2'OMe修饰的RNA、C3-18间隔子(例如,具有3-18个连续碳原子的结构,如C3间隔子)、乙二醇多聚体间隔子(例如,间隔子18(六乙二醇间隔子))、生物素、二脱氧核苷酸三磷酸、乙二醇、胺或磷酸盐)。
在本文所描述的任何空间剖析方法的一些实施例中,与分析物结合部分4004偶联的捕获剂条形码结构域4008包含可切割结构域。例如,在分析物捕获剂与分析物(例如,细胞表面分析物)结合之后,捕获剂条形码结构域可以被切割并收集,用于根据如本文所描述的方法进行下游分析。在一些实施例中,捕获剂条形码结构域的可切割结构域包含允许物种从珠粒释放的U-切除元件。在一些实施例中,U-切除元件可以包含含有至少一个尿嘧啶的单链DNA(ssDNA)序列。所述物种可以通过ssDNA序列附接到珠粒。所述物种可以通过尿嘧啶-DNA糖基化酶(例如,去除尿嘧啶)和核酸内切酶(例如,诱导ssDNA断裂)的组合来释放。如果核酸内切酶从切割中产生5'磷酸基团,则可以在下游处理中包含另外的酶处理以消除磷酸基团,例如,在连接另外的测序手柄元件之前,例如Illumina全P5序列、部分P5序列、全R1序列和/或部分R1序列。
在一些实施例中,来自生物样品的多种不同物种的分析物(例如,多肽)随后可以与生物样品的一种或多种物理性质相关联。例如,多种不同物种的分析物可以与生物样品中的分析物的定位相关联。此类信息(例如,当分析物结合部分识别多肽时的蛋白质组信息)可以与其它空间信息(例如,来自生物样品的遗传信息,如DNA序列信息、转录组信息,例如转录物序列,或两者)结合使用。例如,细胞的细胞表面蛋白可以与细胞的一种或多种物理特性(例如,细胞的形状、大小、活性或类型)相关联。可以通过对细胞成像来表征一种或多种物理性质。细胞可以被分析物捕获剂结合,所述分析物捕获剂包括与细胞表面蛋白结合的分析物结合部分和标识所述分析物结合部分的分析物结合部分条形码,并且可以对细胞进行空间分析(例如,本文所描述的各种空间分析方法中的任何一种)。例如,与细胞表面蛋白结合的分析物捕获剂4002可以与捕获探针(例如,阵列上的捕获探针)结合,所述捕获探针包含与存在于分析物捕获剂902的捕获剂条形码结构域上的分析物捕获序列相互作用的捕获结构域。捕获剂条形码结构域的全部或部分(包含分析物结合部分条形码)可以用聚合酶拷贝,使用捕获结构域的3'端作为引发位点,产生经延伸的捕获探针,所述经延伸的捕获探针包含对应于捕获探针(包含存在于捕获探针上的空间条形码)的全部或部分互补序列和分析物结合部分条形码的拷贝。在一些实施例中,包含与捕获探针的空间条形码互补的序列的具有经延伸的捕获剂条形码结构域的分析物捕获剂被称为“空间标记的分析物捕获剂”。
在一些实施例中,具有空间标记的分析物捕获剂的空间阵列可以与样品接触,其中与空间阵列相关联的分析物捕获剂捕获靶标分析物。然后可以使含有经延伸的捕获探针的分析物捕获剂从空间阵列的捕获探针变性,所述捕获探针包含与捕获探针的空间条形码和分析物结合部分条形码互补的序列。这允许重新使用空间阵列。可以将样品解离成非聚集细胞(例如,单细胞)并通过本文所描述的单细胞/液滴方法进行分析。可以对空间标记的分析物捕获剂进行测序以获得捕获探针的空间条形码的核酸序列和分析物捕获剂的分析物结合部分条形码。经延伸的捕获探针的核酸序列因此可以与分析物(例如,细胞表面蛋白)相关联,并且进而与细胞的一种或多种物理性质(例如,形状或细胞类型)相关联。在一些实施例中,经延伸的捕获探针的核酸序列可以与附近细胞的细胞内分析物相关联,其中细胞内分析物使用本文所描述的任何细胞透化或分析物迁移技术释放。
在本文所描述的任何空间剖析方法的一些实施例中,从分析物捕获剂释放的捕获剂条形码结构域然后可以进行序列分析以标识哪些分析物捕获剂与分析物结合。基于与空间阵列上的捕获点(例如,特定定位处的捕获点)相关联的捕获剂条形码结构域和分析物结合部分条形码序列的存在,可以为生物样品创建分析物图谱。可以将单独的细胞或细胞群体的图谱与其它细胞(例如“正常”细胞)的图谱进行比较,以标识分析物的变化,从而提供诊断相关的信息。在一些实施例中,这些图谱可以用于诊断各种以细胞表面受体变化为特征的病症,如癌症和其它病症。
图15A,顶图是描绘了特征固定的捕获探针602与分析物捕获剂4002之间的示例性相互作用的示意图(其中术语“特征”和“捕获点”可互换使用)。特征固定的捕获探针602可以包含空间条形码605以及一个或多个功能序列604和606,如本文别处所描述。捕获探针602还可以包含能够与分析物捕获剂4002结合的捕获结构域607。在一些实施例中,分析物捕获剂4002包括功能序列4118、捕获剂条形码结构域4008和分析物捕获序列4114。在一些实施例中,分析物捕获序列4114能够与捕获探针602的捕获结构域607结合。分析物捕获剂4002还可以包含一个连接子4120,所述连接子允许捕获剂条形码结构域4008(4114/4008/4118)与分析物结合部分4004偶联。
图15A,底图进一步展示了空间标记的分析物捕获剂4002,其中捕获剂条形码结构域4118/4008/4114的分析物捕获序列4114(poly-A序列)可以用阻断探针(poly-T寡核苷酸)阻断。
在一些实施例中,捕获结合结构域可以包含与捕获探针的捕获结构域(例如,本文所描述的任何示例性捕获结构域)的序列至少部分互补的序列。图15B示出了附接到分析物结合部分的示例性捕获结合结构域,所述分析物结合部分用于检测生物样品中的蛋白质。如图15B所示,分析物结合部分4004包含寡核苷酸,所述寡核苷酸包含引物(g例如,read2)序列4118、分析物结合部分条形码4008、具有第一序列的捕获结合域(例如,捕获结合结构域)4114(例如,示例性poly A)和阻断探针或第二序列4120(例如,poly T或poly U),其中阻断序列阻断捕获结合结构域与捕获探针上的捕获结构域杂交。在一些情况下,阻断序列4120被称为如本文所公开的阻断探针。在一些情况下,阻断探针是如图41B所例示的poly T序列。
在一些情况下,如图15A所示,下图,阻断探针序列不在与捕获结合结构域连续的序列上。换言之,在一些情况下,捕获结合结构域(在本文中也被称为第一序列)和阻断序列是独立的多核苷酸。在一些情况下,对本领域技术人员来说显而易见的是,术语“捕获结合结构域”和“第一序列”在本公开中可互换使用。
在非限制性实例中,当基板上的捕获探针的捕获结构域序列是poly(T)序列时,第一序列可以是poly(A)序列。在一些实施例中,捕获结合结构域包含与捕获探针的捕获结构域基本上互补的捕获结合结构域。基本上互补是指捕获结合结构域的第一序列与捕获探针的捕获结构域中的序列至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%,至少98%,至少99%或100%互补。在另一个实例中,捕获结合结构域的第一序列可以是与捕获探针的也是随机序列的捕获结构域序列至少部分互补的随机序列(例如,随机六聚体)。在又另一个实例中,当捕获探针的捕获结构域序列也是包含均聚物序列(例如,poly(A)序列)和随机序列的序列时,捕获结合结构域可以是均聚物序列(例如,poly(T)序列)和随机序列(例如,随机六聚体)的混合物。在一些实施例中,捕获结合结构域包含能够参与沃森-克里克类型或类似碱基对相互作用的核糖核苷酸、脱氧核糖核苷酸和/或合成核苷酸。在一些实施例中,捕获结合结构域序列的第一序列包含至少10个核苷酸、至少11个核苷酸、至少12个核苷酸、至少13个核苷酸、至少14个核苷酸、至少15个核苷酸、至少16个核苷酸、至少17个核苷酸、至少18个核苷酸、至少19个核苷酸、至少20个核苷酸、至少21个核苷酸、至少22个核苷酸、至少23个核苷酸或至少24个核苷酸。在一些实施例中,捕获结合结构域的第一序列包含至少25个核苷酸、至少30个核苷酸或至少35个核苷酸。
在一些实施例中,捕获结合结构域和捕获结合结构域(例如,第一序列)的阻断探针(例如,第二序列)定位于相同的连续核酸序列上。在捕获结合结构域和阻断探针定位于相同的连续核酸序列上的情况下,第二序列(例如,阻断探针)定位于第一序列的3'。在捕获结合结构域的第一序列和第二序列(例如,阻断探针)定位于相同的连续核酸序列上的情况下,第二序列(例如,阻断探针)定位于第一序列的5'。如本文所用,术语第二序列和阻断探针可互换使用。
在一些情况下,捕获结合结构域的第二序列(例如,阻断探针)包含核酸序列。在一些情况下,第二序列也杯称为阻断探针或阻断结构域,并且每个术语可互换使用。在一些情况下,阻断结构域是DNA寡核苷酸。在一些情况下,阻断结构域是RNA寡核苷酸。在一些实施例中,捕获结合结构域的阻断探针包含与捕获结合结构域的第一序列互补或基本上互补的序列。在一些实施例中,阻断探针防止捕获结合结构域的第一序列在存在时结合捕获探针的捕获结构域。在一些实施例中,在将捕获结合结构域的第一序列(例如,存在于连接的探针中)与捕获探针上的捕获结构域结合之前去除阻断探针。在一些实施例中,捕获结合结构域的阻断探针包含聚尿苷序列、聚胸苷序列或两者。在一些情况下,阻断探针(或第二序列)是发夹结构的一部分,其与捕获结合结构域特异性结合并防止捕获结合结构域与捕获探针的捕获结构域杂交。参见例如,图15C。
在一些实施例中,捕获结合结构域的第二序列(例如,阻断探针)包含被配置成与捕获结合结构域的第一序列杂交的序列。当阻断探针与第一序列杂交时,第一序列被阻止与捕获探针的捕获结构域杂交。在一些实施例中,阻断探针包含与第一序列互补的序列。在一些实施例中,阻断探针包含与第一序列基本上互补的序列。在一些实施例中,阻断探针包含与捕获结合结构域的第一序列至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%,至少98%,至少99%或100%互补的序列。
在一些实施例中,捕获结合结构域的阻断探针包含与捕获结合结构域的第一序列基本上互补的均聚物序列。在一些实施例中,阻断探针被配置成与poly(A)、poly(T)或poly-rU序列杂交。在一些实施例中,阻断探针包含poly(A)、poly(T)或poly(U)序列。在一些实施例中,第一序列包含均聚物序列。在一些实施例中,第一序列包含poly(A)、poly(U)或poly(T)序列。
在一些实施例中,捕获结合结构域进一步包含发夹序列(如图15C所示)。图15C示出了附接到分析物结合部分的示例性捕获结合结构域,所述分析物结合部分用于检测生物样品中的蛋白质。如图15C所示,分析物结合部分4004包含寡核苷酸,所述寡核苷酸包含引物(例如,read2)序列4118、分析物结合部分条形码4008、具有第一序列4114(例如,示例性poly A)的捕获结合结构域、阻断探针4120和第三序列4140,其中第二和/或第三序列可以是poly T或poly U或其组合,其中阻断探针产生发夹型结构并且第三序列阻断第一序列与捕获探针上的捕获结构域杂交。在一些情况下,第三序列4140被称为阻断序列。进一步地,4150例示了能够消化阻断测序的核酸酶。在此实例中,4150可以是能够消化尿嘧啶的核酸内切酶或核酸酶混合物,如UDG或尿嘧啶特异性切除混合物,如USER(NEB)。
发夹阻滞剂场景的另一个实施例例示于图15D中。如图15D所例示,分析物结合部分4004包含寡核苷酸,所述寡核苷酸包含引物(g例如,read2)序列4118、分析物结合部分条形码4008、具有第一序列的捕获结合域(例如,捕获结合结构域)4114(例如,示例性polyA)、第二发夹序列4170和第三序列4180,其中第三序列(例如,阻断探针)阻断第一序列与捕获探针上的捕获结构域杂交。在此实例中,4190例示了能够消化来自DNA:RNA杂合体的尿嘧啶阻断测序的RNase H核酸酶,所述杂合体通过用含有尿嘧啶的第三序列阻断第一序列形成。
在一些实施例中,发夹序列4170定位于捕获结合结构域中的阻断探针的5'。在一些实施例中,发夹序列4170定位于捕获结合结构域中的第一序列的5'。在一些实施例中,捕获结合结构域从5'到3'包含与捕获探针的捕获结构域基本上互补的第一序列、发夹序列和与第一序列基本上互补的阻断探针。可替代地,捕获结合结构域从3'到5'包含与捕获探针的捕获结构域基本上互补的第一序列、发夹序列和与第一序列基本上互补的阻断探针。
在一些实施例中,发夹序列4170包含具有约三个核苷酸、约四个核苷酸、约五个核苷酸、约六个核苷酸、约七个核苷酸、约八个核苷酸、约九个核苷酸或约10个或更多个核苷酸的序列。在一些情况下,发夹是至少约15个核苷酸、至少约20个核苷酸、至少约25个核苷酸、至少约30个核苷酸或更多个核苷酸。
在一些实施例中,发夹序列包含DNA、RNA、DNA-RNA杂合体,或包含经修饰的核苷酸。在一些情况下,所述发夹是poly(U)序列。在一些情况下,RNA发夹序列由USER和/或RNAse H使用本文所公开的方法消化。在一些情况下,poly(U)发夹序列由USER和/或RNAseH使用本文所公开的方法消化。在一些情况下,所述发夹是poly(T)序列。应当理解,发夹的序列(无论它包含DNA、RNA、DNA-RNA杂合体还是包含经修饰的核苷酸)几乎可以是任何核苷酸序列,只要它形成发夹,并且在一些情况下,只要它被USER和/或RNAse H消化。
在一些实施例中,本文提供的方法要求与捕获结合结构域的第一序列杂交的捕获结合结构域的第二序列(例如,阻断探针)从第一序列释放。在一些实施例中,从第一序列释放阻断探针(或第二序列)是在阻断探针从第一序列去杂交的条件下进行的。
在一些实施例中,从第一序列释放阻断探针包含切割发夹序列。在一些实施例中,发夹序列包含可切割连接子。例如,可切割连接子可以是光可切割连接子、UV可切割连接子或酶可切割连接子。在一些实施例中,切割所述酶可切割结构域的酶是核酸内切酶。在一些实施例中,发夹序列包含限制性核酸内切酶的靶序列。
在一些实施例中,释放与捕获结合结构域的第一序列杂交的捕获结合结构域的阻断探针(或第二序列)包含使阻断探针与限制性核酸内切酶接触。在一些实施例中,从第一序列释放阻断探针包含使阻断探针与核糖核酸内切酶接触。在一些实施例中,当阻断探针是RNA序列(例如,包括尿嘧啶的序列)时,核糖核酸内切酶是RNase H、RNase A、RNase C或RNase I中的一种或多种。在一些实施例中,其中核糖核酸内切酶是RNase H。在一些实施例中,RNase H包含RNase H1、RNase H2或RNase H1和RNase H2。
在一些实施例中,发夹序列包含均聚物序列。在一些实施例中,发夹序列4170包含poly(T)或poly(U)序列。例如,发夹序列包含poly(U)序列。在一些实施例中,本文提供了用于通过使发夹序列与尿嘧啶特异性切除试剂(USER)酶接触来释放阻断探针的方法。
在一些实施例中,从第一序列释放阻断探针包含在阻断探针从第一序列去杂交的条件下使阻断探针变性。在一些实施例中,变性包括使用化学变性或物理变性。例如,其中物理变性(例如,温度)用于释放阻断探针。在一些实施例中,变性包含温度调节。例如,第一序列和阻断探针具有基于已知序列内的组成(A、G、C或T)的预定退火温度。在一些实施例中,将温度调节到高于预定退火温度至多5℃、至多10℃、至多15℃、至多20℃、至多25℃、至多30℃或至多35℃。在一些实施例中,将温度调节到高于预定退火温度1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34或35℃。在一些实施例中,一旦将温度调节至高于预定退火温度的温度,则以约0.1℃/秒到约1.0℃/秒(例如,约0.1℃/秒到约0.9℃/秒、约0.1℃/秒到约0.8℃/秒、约0.1℃/秒到约0.7℃/秒、约0.1℃/秒到约0.6℃/秒、约0.1℃/秒到约0.5℃/秒、约0.1℃/秒到约0.4℃/秒、约0.1℃/秒到约0.3℃/秒、约0.1℃/秒到约0.2℃/秒、约0.2℃/秒到约1.0℃/秒、约0.2℃/秒到约0.9℃/秒、约0.2℃/秒到约0.8℃/秒、约0.2℃/秒到约0.7℃/秒、约0.2℃/秒到约0.6℃/秒、约0.2℃/秒到约0.5℃/秒、约0.2℃/秒到约0.4℃/秒、约0.2℃/秒到约0.3℃/秒、约0.3到约1.0℃/秒、约0.3℃/秒到约0.9℃/秒、约0.3℃/秒到约0.8℃/秒、约0.3℃/秒到约0.7℃/秒、约0.3℃/秒到约0.6℃/秒、约0.3℃/秒到约0.5℃/秒、约0.3℃/秒到约0.4℃/秒、约0.4℃/秒到约1.0℃/秒、约0.4℃/秒到约0.9℃/秒、约0.4℃/秒到约0.8℃/秒、约0.4℃/秒到约0.7℃/秒、约0.4℃/秒到约0.6℃/秒、约0.4℃/秒到约0.5℃/秒、约0.5℃/秒到约1.0℃/秒、约0.5℃/秒到约0.9℃/秒、约0.5℃/秒到约0.8℃/秒、约0.5℃/秒到约0.7℃/秒、约0.5℃/秒到约0.6℃/秒、约0.6℃/秒到约1.0℃/秒、约0.6℃/秒到约0.9℃/秒、约0.6℃/秒到约0.8℃/秒、约0.6℃/秒到约0.7℃/秒、约0.7℃/秒到约1.0℃/秒、约0.7℃/秒到约0.9℃/秒、约0.7℃/秒到约0.8℃/秒、约0.8℃/秒到约1.0℃/秒、约0.8℃/秒到约0.9℃/秒或约0.9℃/秒到约1.0℃/秒)的斜变速率将温度冷却至预定退火温度。在一些实施例中,变性包含温度循环。在一些实施例中,变性包含在变性条件(例如,变性温度)与非变性条件(例如,退火温度)之间交替。
可以理解,尽管在实施例中具有任何特定功能,但发夹序列可以是任何序列配置,只要形成发夹即可。因此,在一些情况下,它可以是,例如,简并序列、随机序列或其它情况(包括任何多核苷酸序列)。
在一些实施例中,发夹序列4170进一步包含能够与捕获探针的捕获结构域结合的序列。例如,从捕获结合结构域释放发夹序列可能需要切割发夹序列,其中切割后留下的发夹序列的部分包含能够与捕获探针的捕获结构域结合的序列。在一些实施例中,发夹序列的全部或部分与捕获探针的捕获结构域基本上互补。在一些实施例中,与捕获探针的捕获结构域基本上互补的序列定位于发夹序列切割后的游离5'或游离3'端。在一些实施例中,对发夹的切割产生能够与空间阵列上的捕获探针的捕获结构域结合的单链序列。虽然发夹序列的释放可以实现与捕获探针的捕获结构域的杂交,但经考虑发夹序列的释放不会显著影响分析物结合部分或探针寡核苷酸(例如,第二探针寡核苷酸)对靶标分析物的捕获。
在一些情况下,本文所公开的一种或多种阻断方法包含多个笼状核苷酸。在一些实施例中,本文提供了其中捕获结合结构域包含多个笼状核苷酸的方法。笼状核苷酸防止捕获结合结构域与捕获探针的捕获结构域相互作用。笼状核苷酸包含阻断沃森-克里克氢键的笼状部分,由此防止相互作用直到活化,例如,通过释放笼状部分并恢复笼状核苷酸与补体核苷酸进行沃森-克里克碱基配对的能力的笼状部分的光解。
图15E证明用笼状核苷酸阻断捕获结合结构域。如图15E所例示,分析物结合部分4004包含寡核苷酸,所述寡核苷酸包含引物(例如,read2)序列4118、分析物结合部分条形码4008和具有序列4114(例如,示例性polyA)的捕获结合结构域。笼状核苷酸4130阻断序列4114,由此阻断捕获结合结构域与捕获探针的捕获结构域之间的相互作用。在一些实施例中,所述捕获结合结构域包含多个笼状核苷酸,其中所述多个笼状核苷酸中的笼状核苷酸包含能够防止捕获结合结构域与捕获探针的捕获结构域之间的相互作用的笼状部分。笼状核苷酸的非限制性实例,也被称为光敏寡核苷酸描述于以下中:Liu等人,2014,《化学研究综述(Acc.Chem.Res.)》,47(1):45-55(2014),所述文献以全文引用的方式并入。在一些实施例中,笼状核苷酸包含选自以下组的笼状部分:6-硝基胡椒酰氧基甲基(NPOM)、1-(邻硝基苯基)-乙基(NPE)、2-(邻硝基苯基)丙基(NPP)、二乙基氨基香豆素(DEACM)和硝基二苯并呋喃(NDBF)。
在一些实施例中,笼状核苷酸包含选自由以下组成的组的非天然存在的核苷酸:6-硝基胡椒酰氧基甲基(NPOM)-笼状腺苷、6-硝基胡椒酰氧基甲基(NPOM)-笼状鸟苷、6-硝基胡椒酰氧基甲基(NPOM)-笼状尿苷和6-硝基胡椒酰氧基甲基(NPOM)-笼状胸苷。例如,捕获结合结构域包含一种或多种笼状核苷酸,其中所述笼状核苷酸包含一种或多种6-硝基胡椒酰氧基甲基(NPOM)-笼状鸟苷。在另一个实例中,捕获结合结构域包含一种或多种笼状核苷酸,其中所述笼状核苷酸包含一种或多种硝基胡椒酰氧基甲基(NPOM)-笼状尿苷。在又另一个实例中,捕获结合结构域包含一种或多种笼状核苷酸,其中所述笼状核苷酸包含一种或多种6-硝基胡椒酰氧基甲基(NPOM)-笼状胸苷。
在一些实施例中,捕获结合结构域包含本文所描述的任何笼状核苷酸中的至少两种或更多种的组合。例如,捕获结合结构域可以包含一种或多种6-硝基胡椒酰氧基甲基(NPOM)-笼状鸟苷和一种或多种硝基胡椒酰氧基甲基(NPOM)-笼状尿苷。应当理解,捕获结合结构域可以包含本文所描述的任何笼状核苷酸的任何组合。
在一些实施例中,捕获结合结构域包含一个笼状核苷酸、两个笼状核苷酸、三个笼状核苷酸、四个笼状核苷酸、五个笼状核苷酸、六个笼状核苷酸、七个笼状核苷酸、八个笼状核苷酸、九个笼状核苷酸或十个或更多个笼状核苷酸。
在一些实施例中,捕获结合结构域在3'端包含笼状核苷酸。在一些实施例中,捕获结合结构域在3'端包含两个笼状核苷酸。在一些实施例中,捕获结合结构域在3'端包含至少三个笼状核苷酸。
在一些实施例中,捕获结合结构域在5'端包含笼状核苷酸。在一些实施例中,捕获结合结构域在5'端包含两个笼状核苷酸。在一些实施例中,捕获结合结构域在5'端包含至少三个笼状核苷酸。
在一些实施例中,捕获结合结构域包含从捕获结合结构域的3'端开始的每个奇数位置的笼状核苷酸。在一些实施例中,捕获结合结构域包含从捕获结合结构域的5'端开始的每个奇数位置的笼状核苷酸。在一些实施例中,捕获结合结构域包含从捕获结合结构域的3'端开始的每个偶数位置的笼状核苷酸。在一些实施例中,捕获结合结构域包含从捕获结合结构域的5'端开始的每个偶数位置的笼状核苷酸。
在一些实施例中,捕获结合结构域包含包括至少10%、至少、20%或至少30%的笼状核苷酸的序列。在一些实施例中,捕获结合结构域中的笼状核苷酸的百分比为约40%、约50%、约60%、约70%、约80%或更高。在一些实施例中,捕获结合结构域包含其中每个核苷酸都是笼状核苷酸的序列。应当理解,笼状核苷酸的限制基于捕获结合结构域的序列和产生彼此接近的笼状核苷酸的空间限制。因此,在一些情况下,特定的核苷酸(例如,鸟嘌呤)被笼状核苷酸替代。在一些情况下,捕获结合结构域中的所有鸟嘌呤被笼状核苷酸替代。在一些情况下,捕获结合结构域中的一部分(例如,约10%、约20%、约30%、约40%、约50%、约60%、约70%、约80%、约90%或约95%)鸟嘌呤被笼状核苷酸替代。在一些情况下,特定的核苷酸(例如,尿苷或胸腺嘧啶)被笼状核苷酸替代。在一些情况下,捕获结合结构域中的所有尿苷或胸腺嘧啶被笼状核苷酸替代。在一些情况下,捕获结合结构域中的一部分(例如,约10%、约20%、约30%、约40%、约50%、约60%、约70%、约80%、约90%或约95%)尿苷或胸腺嘧啶被笼状核苷酸替代。笼状核苷酸公开于Govan等人,2013,《核酸研究》41;22,10518–10528中,所述文献以全文引用的方式并入。
在一些实施例中,捕获结合结构域包含均匀分布在整个捕获结合结构域中的笼状核苷酸。例如,捕获结合结构域可以包含包括至少10%的笼状核苷酸的序列,其中所述笼状核苷酸均匀分布在整个捕获结合结构域中。在一些实施例中,捕获结合结构域包含至少10%的笼状核苷酸的序列,其中10%的笼状核苷酸定位于捕获结合结构域的3'。在一些实施例中,捕获结合结构域包含至少10%的笼状核苷酸的序列,并且其中10%的笼状核苷酸定位于捕获结合结构域的5'端。在一些实施例中,在捕获结合结构域序列的每三个、每四个、每五个、每六个核苷酸或其组合处包含笼状核苷酸。
在一些实施例中,本文提供了用于从笼状核苷酸释放笼状部分的方法。在一些实施例中,从笼状核苷酸释放笼状部分包含活化笼状部分。在一些实施例中,从笼状核苷酸释放笼状部分恢复了笼状核苷酸通过沃森-克里克氢键与互补核苷酸杂交的能力。例如,恢复笼状核苷酸与互补核苷酸杂交的能力启用/恢复捕获结合结构域与捕获结构域相互作用的能力。在从笼状核苷酸释放笼状部分后,笼状核苷酸不再是“笼状”的,因为笼状部分不再与笼状核苷酸连接(例如,共价或非共价)。如本文所用,术语“笼状核苷酸”可以指与笼状部分连接的核苷酸或与笼状部分连接但由于笼状部分的活化而不再连接的核苷酸。
在一些实施例中,本文提供了用于活化笼状部分由此从笼状核苷酸释放笼状部分的方法。在一些实施例中,使笼状部分活化包含从核苷酸光解笼状部分。如本文所用,“光解”可以是指使用光从笼状核苷酸中去除或分离笼状部分的过程。在一些实施例中,使笼状部分活化(例如,光解)包含将笼状部分暴露于总共足以从笼状核苷酸中释放笼状部分的光脉冲(例如,两个或更多个、三个或更多个、四个或更多个、或五个或更多个光脉冲)。在一些实施例中,使笼状部分活化包含将笼状部分暴露于足以从笼状核苷酸中释放笼状部分的光脉冲(例如,单个光脉冲)。在一些实施例中,使笼状部分活化包含将笼状部分暴露于多个脉冲(例如,一个或两个或更多个光脉冲),其中光的波长为约小于约360nm。在一些实施例中,波长为约小于360nm的光源是UV光。UV光可以源自荧光显微镜、UV激光器或UV闪光灯,或本领域已知的任何UV光源。
在一些实施例中,一旦笼状部分从捕获结合结构域中释放,寡核苷酸、探针寡核苷酸或包含捕获结合结构域的连接产物能够与捕获探针的捕获结构域杂交。最后,为了标识分析物的定位或确定两个或更多个分析物结合部分之间的相互作用,可以确定寡核苷酸、探针寡核苷酸或连接产物或其补体的全部或部分序列。
有关其中分析物捕获序列被阻断的实施例的更多公开内容,参见2020年11月6日提交的题为“增强分析物结合的特异性”的国际专利申请第PCT/US2020/059472号,所述国际专利申请特此通过引用并入。
图16展示了如何将阻断探针添加到空间标记的分析物捕获剂4002以防止与阵列上的捕获结构域非特异性结合。在一些实施例中,阻断寡核苷酸和抗体被递送至组织,其中在与组织靶标结合之后,阻断寡核苷酸可以随后被去除(例如,被RNase消化)。在图16所展示的实例中,对寡核苷酸与抗体之间的连接子的切割允许寡核苷酸迁移到阵列上的捕获结构域。
在本文所描述的任何空间剖析分析方法的一些实施例中,所述方法用于标识免疫细胞图谱。免疫细胞表达与免疫功能相关的各种适应性免疫受体,如T细胞受体(TCR)和B细胞受体(BCR)。T细胞受体和B细胞受体通过特异性识别和结合抗原并帮助其破坏在免疫应答中发挥作用。关于所公开方法的此类应用的更多信息在题为“用带空间条形码的寡核苷酸阵列剖析生物分析物”的PCT公开202020176788A1中提供,所述文献中的每个文献的全部内容通过引用并入本文。
(c)基板
对于本节中描述的基于空间阵列的分析方法,基板(例如,芯片)用作用于直接或间接附接捕获探针以捕获阵列点的支撑物。另外,在一些实施例中,基板(例如,相同基板或不同基板)用于为生物样品,具体地例如薄组织切片提供支撑。因此,“基板”是不溶于水性液体并且允许将生物样品、分析物、捕获点和/或捕获探针定位在基板上的支撑物。
多种不同的基板可以用于上述目的。通常,基板可以是任何合适的支撑材料。示例性基板包含但不限于玻璃、经改性和/或功能化玻璃、水凝胶、薄膜、膜、塑料(包含例如丙烯酸树脂、聚苯乙烯、苯乙烯和其它材料的共聚物、聚丙烯、聚乙烯、聚丁烯、聚氨酯、TeflonTM、环状烯烃、聚酰亚胺等)、尼龙、陶瓷、树脂、Zeonor、二氧化硅或基于二氧化硅的材料,包含硅和改性硅、碳、金属、无机玻璃、光纤束和聚合物,如聚苯乙烯、环状烯烃共聚物(COC)、环状烯烃聚合物(COP)、聚丙烯、聚乙烯和聚碳酸酯。
基板也可以对应于流动池。流动池可以由任何前述材料形成,并且可以包含允许试剂、溶剂、捕获点和分子通过流动池的通道。
在上文讨论的基板材料的实例中,聚苯乙烯是一种适合结合带负电荷的大分子的疏水材料,因为它通常含有很少的亲水基团。对于固定在载玻片上的核酸,通过增加玻璃表面的疏水性,可以增加核酸固定。此类增强可以允许相对更密集的包装形成(例如,提供改进的特异性和分辨率)。
在一些实施例中,基板涂覆有表面处理剂,如聚-L-赖氨酸。另外地或可替代地,基材可以通过硅烷化处理,例如用环氧-硅烷、氨基-硅烷和/或用聚丙烯酰胺处理。
基材通常可以具有任何合适的形式或格式。例如,基板可以是平坦的、弯曲的,例如,朝向生物样品例如组织样品与基板之间发生相互作用的区域凸形或凹形弯曲。在一些实施例中,基板是平面的,例如平面的、芯片或载玻片。基板可以在基板内含有一个或多个图案化表面(例如,通道、孔、突起、脊、凹坑等)。
基板可以具有任何期望的形状。例如,基板通常可以是薄的、平坦的形状(例如,正方形或矩形)。在一些实施例中,基板结构具有圆角(例如,以提高安全性或坚固性)。在一些实施例中,基板结构具有一个或多个截止角(例如,用于与滑动夹具或交叉工作台一起使用)。在一些实施例中,在基板结构是平坦的情况下,基板结构可以是具有平坦表面的任何适当类型的支撑物(例如,芯片或载玻片,如显微镜载玻片)。
基板可以任选地包含各种结构,如但不限于突起、脊和通道。可以对基板进行微图案化以限制横向扩散(例如,以防止空间条形码重叠)。可以对用此类结构修饰的基板进行修饰,以允许在单独位点处缔合分析物、捕获点(例如,珠粒)或探针。例如,用各种结构修饰基板的位点可以与其它位点邻接或不邻接。
在一些实施例中,可以修饰基板的表面,使得形成仅具有或容纳单个捕获点的离散位点。在一些实施例中,可以修饰基板的表面,使得捕获点粘附到随机位点。
在一些实施例中,使用如(但不限于)冲压技术、微蚀刻技术和模制技术等技术来修饰基板的表面以含有一个或多个孔。在基板包含一个或多个孔的一些实施例中,基板可以是凹形载玻片或腔载玻片。例如,孔可以由基板的表面上的一个或多个浅凹陷形成。在其中基板包含一个或多个孔的一些实施例中,可以通过将盒(例如,含有一个或多个室的盒)附接到基板结构的表面来形成孔。
在一些实施例中,基板(例如,孔)的结构可以各自承载不同的捕获探针。可以根据结构在基板的表面中或表面上的定位来标识附接到每个结构的不同捕获探针。示例性基板包含其中分离结构定位于基板上的阵列,包含例如具有容纳捕获点的孔的那些。
在一些实施例中,基板包含在基板的表面上的一个或多个标记,例如,为将空间信息与所关注分析物的表征相关联提供指导。例如,可以用网格线标记基板(例如,以允许容易地估计放大下看到的物体的大小和/或提供用于计数物体的参考区域)。在一些实施例中,基准标志物可以包含在基板上。可以使用包含但不限于印刷、喷砂和沉积在表面上的技术来制作此类标记。
在其中基板被修饰以含有一种或多种结构(包含但不限于孔、突起、脊或标记)的一些实施例中,所述结构可以包含物理改变的位点。例如,用各种结构改性的基板可以包含物理性质,包含但不限于物理构型、磁力或压缩力、化学官能化位点、化学改变位点和/或静电改变位点。
在其中基板被修饰以含有各种结构(包含但不限于孔、突起、脊或标记)的一些实施例中,所述结构以模式应用。可替代地,结构可以随机分布。
在一些实施例中,处理基板以最小化或减少捕获点内或捕获点之间的非特异性分析物杂交。例如,处理可以包含用对非特异性杂交产生物理屏障的水凝胶、薄膜和/或膜涂覆基板。可以使用任何合适的水凝胶。例如,可以使用根据美国专利第6,391,937号、第9,512,422号和第9,889,422号以及美国专利申请公开号U.S.2017/0253918和U.S.2018/0052081中所述的方法制备的水凝胶基质。前述文档中的每个文档的全部内容通过引用并入本文。
治疗可以包含添加反应性或能够被活化的官能团,使得其在接受刺激之后变为反应性(例如,光反应性)。处理可以包含用具有一种或多种物理性质(例如,机械、电、磁和/或热)的聚合物处理,所述物理性质使非特异性结合(例如,在某些定位处使基板活化以允许分析物在那些定位处杂交)最小化。
基板(例如,或阵列上的珠粒或捕获点)可以包含数万至数十万或数百万个单独的寡核苷酸分子(例如,至少约10,000、50,000、100,000、500,000、1,000,000、10,000,000、100,000,000、1,000,000,000或10,000,000,000个寡核苷酸分子)。
在一些实施例中,基板的表面涂覆有细胞允许涂层,以允许活细胞粘附。“细胞允许涂层”是允许或帮助细胞在基板上维持细胞活力(例如,保持活力)的涂层。例如,细胞允许涂层可以增强细胞附接、细胞生长和/或细胞分化,例如,细胞允许涂层可以为活细胞提供营养。细胞允许涂层可以包含生物材料和/或合成材料。细胞允许涂层的非限制性实例包含具有一种或多种细胞外基质(ECM)组分(例如,蛋白聚糖和纤维蛋白,如胶原蛋白、弹性蛋白、纤连蛋白和层粘连蛋白)、聚赖氨酸、聚L-鸟氨酸和/或生物相容性有机硅(例如,)的涂层。例如,包含一种或多种细胞外基质组分的细胞允许涂层可以包含I型胶原蛋白、II型胶原蛋白、IV型胶原蛋白、弹性蛋白、纤连蛋白、层粘连蛋白和/或玻连蛋白。在一些实施例中,细胞允许涂层包含从恩格尔布雷斯-霍尔姆群(Engelbreth-Holm-Swarm,EHS)小鼠肉瘤(例如,)中提取的溶解基底膜制剂。在一些实施例中,细胞允许涂层包含胶原蛋白。
在基板包含凝胶(例如,水凝胶或凝胶基质)的情况下,凝胶内的寡核苷酸可以附接到基板。术语“水凝胶”和“水凝胶基质”在本文中可互换使用以指代包含网络的大分子聚合物凝胶。在网络中,一些聚合物链可以任选地被交联,尽管交联并不总是发生。
与可以用于本公开的水凝胶和水凝胶亚单元有关的进一步细节和非限制性实施例描述于2020年8月13日提交的题为“用于使用单倍型空间分布确定生物状况的系统和方法”的美国专利申请第16/992,569号中,所述美国专利申请通过引用特此并入本文。
基板的另外的实例,包含例如此类基板上的基准标志物,在题为“用带空间条形码的寡核苷酸阵列剖析生物分析物”的PCT公开202020176788A1中公开,所述文献通过引用特此并入。
(d)阵列
在本文所公开的许多方法中,捕获点共同定位在基板上。“阵列”是不规则或形成规则图案的多个捕获点(也被称为“特征”)的特定布置。阵列中的单独捕获点基于其相对空间定位而彼此不同。通常,阵列中的多个捕获点中的至少两个捕获点包含不同的捕获探针(例如,本文所描述的捕获探针的任何实例)。
阵列可以用于同时测量大量分析物。在一些实施例中,寡核苷酸至少部分地用于创建阵列。例如,单个物种的寡核苷酸(例如,捕获探针)的一个或多个拷贝可以对应于或直接或间接附接到阵列中的给定捕获点。在一些实施例中,阵列中的给定捕获点包含两个或更多个物种的寡核苷酸(例如,捕获探针)。在一些实施例中,直接或间接附接到阵列上的给定捕获点的两个或更多个物种的寡核苷酸(例如,捕获探针)包含共同的(例如,相同的)空间条形码。
如上文所定义,“捕获点”是作为样品分析中使用的各种分子实体的支撑物或储存库的实体。捕获点的实例包含但不限于珠粒、任何二维或三维几何形状的点(例如、喷墨点、掩蔽点、网格上的正方形)、孔和水凝胶垫。在一些实施例中,捕获点直接或间接地附接或固定到基板。在一些实施例中,捕获点不直接或间接地附接或固定到基板,而是例如安置在封闭或部分封闭的三维空间(例如,孔或凹坑)内。
在一些实施例中,捕获点直接或间接地附接或固定到液体可渗透的基板。在一些实施例中,捕获点直接或间接地附接或固定到生物相容的基板。在一些实施例中,捕获点直接或间接地附接或固定到作为水凝胶的基板。
图12描绘了阵列内的带条形码的捕获点的示例性布置。从左到右,图12示出了(L)包含六个带空间条形码的阵列的载玻片,(C)六个带空间条形码的阵列之一的放大示意图,示出了与生物样品相关的带条形码的捕获点网格,以及(R)阵列的一个部分的放大示意图,示出了对阵列内的多个捕获点的特定标识(标记为ID578、ID579、ID580等)。
如本文所用,术语“珠阵列”是指包含多个珠作为阵列中的捕获点的阵列。在一些实施例中,珠粒附接到基板。例如,珠粒可以任选地附接到如显微镜载玻片的基板并且靠近生物样品(例如,包含细胞的组织切片)。珠粒也可以悬浮在溶液中并沉积在表面(例如,膜、组织切片或基板(例如,显微镜载玻片))上。
基板上或基板内的珠粒阵列的实例包含定位于孔中的珠粒,如BeadChip阵列(可从加利福尼亚州圣地亚哥Illumina公司获得)、在来自454生命科学公司(LifeSciences)(瑞士巴塞尔罗氏(Roche,Basel,Switzerland)的子公司)的测序平台中使用的阵列,以及在来自Ion Torrent(加利福尼亚州卡尔斯巴德生命技术公司(Life Technologies,Carlsbad,CA)的子公司)的测序平台中使用的阵列。珠粒阵列的实例描述于以下中:例如美国专利第6,266,459号;第6,355,431号;第6,770,441号;第6,859,570号;第6,210,891号;第6,258,568号;和第6,274,320号;美国专利申请公开第2009/0026082号;第2009/0127589号;第2010/0137143号;和第2010/0282617号;以及PCT专利申请公开第WO 00/063437号和第WO 2016/162309号,所述文献中的每个文献的全部内容通过引用并入本文。
(i)用于分析物捕获的阵列
在一些实施例中,阵列中的一些或所有捕获点包含捕获探针。在一些实施例中,阵列可以包含直接或间接附接到基板的捕获探针。
捕获探针包含捕获结构域(例如,核苷酸序列),所述捕获结构域可以与样品内的靶标分析物(例如,mRNA、DNA或蛋白质)特异性结合(例如,杂交)。在一些实施例中,捕获探针与靶标的结合(例如,杂交)是通过对已经并入到靶标中的视觉信号例如荧光团、重金属(例如,银离子)或化学发光标记的检测来检测和定量的。在一些实施例中,视觉信号的强度与生物样品中的每种分析物的相对丰度相关。由于阵列可以含有数千或数百万个(或更多)捕获探针,因此带有捕获探针的捕获点阵列可以并行询问许多分析物。
在一些实施例中,基板包含被设计为从一种或多种生物体捕获分析物的一个或多个捕获探针。在非限制性实例中,基板可以含有被设计为从一种生物体(例如,人)捕获mRNA的一个或多个捕获探针和被设计为从第二种生物体(例如,细菌)捕获DNA的一个或多个捕获探针。
可以使用多种技术将捕获探针附接到基板或捕获点。在一些实施例中,捕获探针直接附接到固定在阵列上的捕获点。在一些实施例中,捕获探针通过化学固定固定到基板。例如,可以在基板上的官能团与捕获探针上的对应功能元件之间发生化学固定。捕获探针中的示例性对应功能元件可以是捕获探针的固有化学基团,例如羟基,或者可以将功能元件引入到捕获探针上。基板上的官能团的实例是胺基。在一些实施例中,要固定的捕获探针包含官能胺基团或被化学修饰以包含官能胺基团。用于此类化学修饰的手段和方法在本领域中是众所周知的。
在一些实施例中,捕获探针是核酸。在一些实施例中,捕获探针通过其5'端固定在捕获点或基板上。在一些实施例中,捕获探针通过其5'端固定在捕获点或基板上,并且包含从5'到3'端:一个或多个条形码(例如,空间条形码和/或UMI)和一个或多个捕获结构域。在一些实施例中,捕获探针通过其5'端固定在捕获点上,并且包含从5'到3'端:一个条形码(例如,空间条形码或UMI)和一个捕获结构域。在一些实施例中,捕获探针通过其5'端固定在捕获点或基板上,并且包含从5'到3'端:切割结构域、功能结构域、一个或多个条形码(例如,空间条形码和/或UMI)和捕获结构域。
在一些实施例中,捕获探针通过其5'端固定在捕获点或基板上,并且包含从5'到3'端:切割结构域、功能结构域、一个或多个条形码(例如,空间条形码和/或UMI)、第二功能结构域和捕获结构域。在一些实施例中,捕获探针通过其5'端固定在捕获点或基板上,并且包含从5'到3'端:切割结构域、功能结构域、空间条形码、UMI和捕获结构域。在一些实施例中,捕获探针通过其5'端固定在捕获点或基板上,并且不包含空间条形码。在一些实施例中,捕获探针通过其5'端固定在捕获点或基板上,并且不包含UMI。在一些实施例中,捕获探针包含用于启动测序反应的序列。
在一些实施例中,捕获探针通过其3'端固定在捕获点或基板上。在一些实施例中,捕获探针通过其3'端固定在捕获点或基板上,并且包含从3'到5'端:一个或多个条形码(例如,空间条形码和/或UMI)和一个或多个捕获结构域。在一些实施例中,捕获探针通过其3'端固定在捕获点或基板上,并且包含从3'到5'端:一个条形码(例如,空间条形码或UMI)和一个捕获结构域。在一些实施例中,捕获探针通过其3'端固定在捕获点或基板上,并且包含从3'到5'端:切割结构域、功能结构域、一个或多个条形码(例如,空间条形码和/或UMI)和捕获结构域。在一些实施例中,捕获探针通过其3'端固定在捕获点或基板上,并且包含从3'到5'端:切割结构域、功能结构域、空间条形码、UMI和捕获结构域。
对要固定的捕获探针内的官能团的定位可以用于控制和塑造捕获探针的结合行为和/或朝向,例如,官能团可以放置在捕获探针的5'或3'端处或在捕获探针的序列内。在一些实施例中,捕获探针可以进一步包含支撑物(例如,附接到捕获探针的支撑物、附接到捕获点的支撑物、或附接到基板的支撑物)。要固定的捕获探针的典型支撑物包含能够与此类捕获探针结合例如与胺官能化的核酸结合的部分。此类支撑物的实例是羧基、醛或环氧支撑物。
在一些实施例中,可以将捕获探针固定在其上的基板可以化学活化,例如通过活化基板上可用的官能团。术语“经活化的底物”涉及其中相互作用或反应性化学官能团通过化学修饰程序建立或启用的材料。例如,可以在使用之前活化包含羧基的基板。此外,某些基板含有可以与捕获探针中已经存在的特定部分反应的官能团。
在一些实施例中,共价键用于将捕获探针直接偶联到基板。在一些实施例中,捕获探针通过将捕获探针的“第一个”核苷酸与支撑物分开的连接子,即化学连接子,与基板间接偶联。在一些实施例中,捕获探针不直接与阵列结合,而是间接相互作用,例如通过与自身直接或间接与阵列结合的分子结合。在一些实施例中,捕获探针间接附接到基板(例如,通过包含聚合物的溶液)。
在一些实施例中,在捕获探针间接固定在阵列的捕获点上的情况下,例如,通过与能够结合捕获探针的表面探针杂交,捕获探针可以进一步包含能够与表面探针的5'端杂交的上游序列(与核酸杂交的序列的5',例如组织样品的RNA)。单独地,捕获探针的捕获结构域可以被视为捕获结构域寡核苷酸,在捕获探针间接固定在阵列上的实施例中,所述捕获结构域寡核苷酸可以用于捕获探针的合成。
在一些实施例中,基板包含惰性材料或基质(例如,载玻片),所述惰性材料或基质已通过例如用包括能够固定捕获探针的反应性基团的材料处理而功能化。参见例如,WO2017/019456,所述文献的全部内容通过引用并入本文中。非限制性实例包含支撑在惰性基板(例如,载玻片;参见,WO 2005/065814和美国专利申请第2008/0280773号,所述文献的全部内容通过引用并入本文)上的聚丙烯酰胺水凝胶。
在一些实施例中,使用共价方法将功能化生物分子(例如,捕获探针)固定在功能化基板上。用于共价附接的方法包含,例如,胺和活化的羧酸酯(例如,N-羟基琥珀酰亚胺酯)的缩合;在还原胺化条件下胺和醛的缩合;以及环加成反应,如狄尔斯-阿尔德(Diels–Alder)[4+2]反应、1,3-偶极环加成反应和[2+2]环加成反应。用于共价附接的方法还包含例如点击化学反应,包含[3+2]环加成反应(例如,胡伊斯根1,3-偶极环加成反应和铜(I)-催化叠氮化物-炔烃环加成反应(CuAAC));硫醇-烯反应;狄尔斯-阿尔德反应和逆电子需求狄尔斯-阿尔德反应;[4+1]异腈和四嗪的环加成;以及小碳环的亲核开环(例如,用氨基寡核苷酸开环氧化物)。用于共价附接的方法还包含,例如,马来酰亚胺和硫醇;以及对硝基苯酯功能化的寡核苷酸和多赖氨酸功能化的基板。用于共价附接的方法还包含,例如,二硫化物反应;自由基反应(参见例如,美国专利第5,919,626号,所述美国专利的全部内容通过引用并入本文);以及酰肼功能化基板(例如,其中酰肼官能团直接或间接附接到基板)和醛官能化寡核苷酸(参见例如,Yershov等人(1996)《美国国家科学院院刊(Proc.Natl.Acad.Sci.USA)》93,4913–4918,所述文献的全部内容通过引用并入本文)。
在一些实施例中,使用光化学共价方法将功能化生物分子(例如,捕获探针)固定在功能化基板上。用于光化学共价附接的方法包含,例如,蒽醌缀合的寡核苷酸的固定化(参见例如,Koch等人(2000)《生物缀合化学(Bioconjugate Chem.)》11,474–483,所述文献的全部内容通过引用并入本文)。
在一些实施例中,使用非共价方法将功能化生物分子(例如,捕获探针)固定在功能化基板上。用于非共价附接的方法包含,例如,生物素功能化的寡核苷酸和链霉亲和素处理的基板(参见例如,等人(1993)《分析生物化学(Analytical Biochemistry)》209,278–283和Gilles等人(1999)《自然生物技术》17,365–370,所述文献的全部内容通过引用并入本文)。
在一些实施例中,根据以下中阐述的方法,可以将寡核苷酸(例如,捕获探针)附接到基板或捕获点:美国专利第6,737,236号、第7,259,258号、第7,375,234号、第7,427,678号、第5,610,287号、第5,807,522号、第5,837,860号和第5,472,881号;美国专利申请公开第2008/0280773号和第2011/0059865号;Shalon等人(1996)《基因组研究(GenomeResearch)》,639–645;Rogers等人(1999)《分析生物化学》266,23–30;Stimpson等人(1995)《美国国家科学院院刊》92,6379–6383;Beattie等人(1995)《临床化学(Clin.Chem.)》45,700–706;Lamture等人(1994)《核酸研究》22,2121-2125;Beier等人(1999)《核酸研究》27,1970-1977;Joos等人(1997)《分析生物化学》247,96-101;Nikiforov等人(1995)《分析生物化学》227,201-209;Timofeev等人(1996)《核酸研究》24,3142-3148;Chrisey等人(1996)《核酸研究》24,3031-3039;Guo等人(1994)《核酸研究》22,5456-5465;Running和Urdea(1990)《生物技术》8,276–279;Fahy等人(1993)《核酸研究》21,1819-1826;Zhang等人(1991)19,3929–3933;以及Rogers等人(1997)《基因疗法(Gene Therapy)》4,1387–1392。前述文档中的每个文档的全部内容通过引用并入本文。
在一些实施例中,基板的表面涂覆有细胞允许涂层,以促进活细胞粘附。“细胞允许涂层”是允许或帮助细胞在基板上维持细胞活力(例如,保持活力)的涂层。例如,细胞允许涂层可以增强细胞附接、细胞生长和/或细胞分化,例如,细胞允许涂层可以为活细胞提供营养。细胞允许涂层可以包含生物材料和/或合成材料。细胞允许涂层的非限制性实例包含具有一种或多种细胞外基质(ECM)组分(例如,蛋白聚糖和纤维蛋白,如胶原蛋白、弹性蛋白、纤连蛋白和层粘连蛋白)、聚赖氨酸、聚L-鸟氨酸和/或生物相容性有机硅(例如,)的涂层。例如,包含一种或多种细胞外基质组分的细胞允许涂层可以包含I型胶原蛋白、II型胶原蛋白、IV型胶原蛋白、弹性蛋白、纤连蛋白、层粘连蛋白和/或玻连蛋白。在一些实施例中,细胞允许涂层包含从恩格尔布雷斯-霍尔姆群(Engelbreth-Holm-Swarm,EHS)小鼠肉瘤(例如,)中提取的溶解基底膜制剂。在一些实施例中,细胞允许涂层包含胶原蛋白。
“有条件可去除的涂层”是可以在施加脱模剂时从基板的表面去除的涂层。在一些实施例中,有条件可去除涂层包含水凝胶,如2020年8月13日提交的题为“用于使用单倍型空间分布确定生物状态的系统和方法”的美国专利申请第16/992,569号中进一步详细描述的。
(ii)以阵列格式产生捕获探针
阵列可以通过多种方法制备。在一些实施例中,阵列是通过在阵列上合成(例如,原位合成)寡核苷酸,或通过喷射印刷或光刻制备的。例如,对高密度DNA寡核苷酸的光定向合成可以通过光刻或固相DNA合成来实现。为了实施光刻合成,可以将用光化学保护基团修饰的合成连接子附接到基板,并且可以使用光刻掩模(应用于基板的特定区域)和光来修饰光化学保护基团,由此产生具有局部光脱保护的阵列。许多这些方法是本领域已知的并且描述于以下中:例如,Miller等人,2009,“微阵列的基本概念和在临床微生物学中的潜在应用(Basic concepts of microarrays and potential applications in clinicalmicrobiology)”,《临床微生物学评论(Clinical Microbiology Reviews)》22.4,611-633;US201314111482A;US9593365B2;US2019203275;以及WO 2018091676,所述文献各自以全文引用的方式并入本文中。
(1)点样或印刷
在一些实施例中,阵列用寡核苷酸“点样”或“打印”,并且然后将这些寡核苷酸(例如,捕获探针)附接到基板。寡核苷酸可以通过非接触式或接触式印刷施加。非接触式打印机可以使用与计算机打印机相同的方法(例如,气泡喷射或喷墨)将探针溶液的小液滴喷射到基板上。专门的喷墨样打印机可以将纳升到皮升体积的寡核苷酸溶液液滴(而不是墨水)喷射到基板上。在接触式打印中,每个打印针直接将寡核苷酸溶液施加到表面上的特定定位。寡核苷酸可以通过DNA的磷酸骨架的负电荷与基板表面的正电荷涂层的静电相互作用或通过DNA中的胸苷碱基与经处理的基板表面上的胺基之间的UV交联共价键附接到基板表面。在一些实施例中,基板是载玻片。在一些实施例中,寡核苷酸(例如,捕获探针)通过与化学基质(例如,环氧-硅烷、氨基-硅烷、赖氨酸、聚丙烯酰胺等)的共价键附接到基板。
(2)原位合成
阵列也可以通过原位合成来制备。在一些实施例中,这些阵列可以使用光刻法制备。光刻法通常依赖于基板上的UV掩蔽和光导向组合化学合成,以选择性地直接在阵列的表面上合成探针,每个点一次一个核苷酸,同时用于许多点。在一些实施例中,基板含有共价连接分子,所述共价连接分子在自由端具有可以被光去除的保护基团。UV光被引导通过光刻掩模,以用羟基基团脱保护和活化选定的位点,所述基团开始与附接到活化位点的受保护核苷酸偶联。掩模的设计方式使得可以选择曝光位点,并且因此指定阵列上每个核苷酸可以附接的坐标。可以重复此过程,施加新的掩模活化不同的位点组并偶联不同的碱基,从而允许在每个位点处构建任意寡核苷酸。此过程可以用于合成数十万种不同的寡核苷酸。在一些实施例中,可以使用无掩模阵列合成器技术。它使用可编程微镜阵列来创建反射期望的UV光图案的数字掩模以对特征脱保护。
在一些实施例中,喷墨点样工艺也可以用于原位寡核苷酸合成。不同的核苷酸前体加催化剂可以印刷在基板上,并且然后与偶联和脱保护步骤组合。此方法依赖于以重复轮次的碱基打印在阵列表面上打印皮升体积的核苷酸,从而延长阵列上的寡核苷酸探针的长度。
(3)电场
阵列也可以通过电场的主动杂交来制备,以控制核酸转运。当向阵列上的一个或多个测试位点施加正电流时,带负电荷的核酸可以被转运到特定位点或捕获点。阵列的表面可以含有结合分子,例如链霉亲和素,一旦电子寻址的生物素化探针到达其靶向定位,它就允许形成键(例如,链霉亲和素-生物素键)。然后将正电流从活动捕获点中去除,并且可以通过靶向施加正电流来活化新的测试位点。重复所述过程,直到阵列上的所有位点都被覆盖。
用于空间分析的阵列可以通过如本文所描述的各种方法产生。在一些实施例中,所述阵列具有包括空间条形码的多个捕获探针。可以确定这些空间条形码和其与阵列上的定位的关系。在一些情况下,此类信息很容易获得,因为寡核苷酸以预定图案在阵列上被点样、打印或合成。在一些情况下,空间条形码可以通过本文所描述的方法解码,例如通过原位测序、通过与空间条形码相关联的各种标记等。在一些实施例中,阵列可以用作模板来产生子阵列。因此,空间条形码可以转移到具有已知图案的子阵列。
(4)连接
在一些实施例中,可以通过连接多个寡核苷酸产生包括带条形码的探针的阵列。在一些情况下,多个寡核苷酸中的寡核苷酸含有条形码的一部分,并且在连接多个寡核苷酸时产生完整的条形码。例如,可以将含有条形码的第一部分的第一寡核苷酸附接到基板(例如,使用本文所描述的将寡核苷酸附接到基板的任何方法),并且然后可以将含有条形码的第二部分的第二寡核苷酸连接到第一寡核苷酸上以产生完整的条形码。条形码的第一部分、第二部分和任何另外部分的不同组合可以用于增加条形码的多样性。在第二寡核苷酸在连接之前也附接到基板的情况下,第一和/或第二寡核苷酸可以通过含有切割位点的表面连接子附接到基板。连接时,连接的寡核苷酸通过在切割位点处切割而线性化。
为了增加条形码的多样性,可以将包括两个或更多个不同条形码序列的多个第二寡核苷酸连接到包括相同条形码序列的多个第一寡核苷酸上,由此产生两个或更多个不同物种的条形码。为了实现选择性连接,附接到含有条形码的第一部分的基板上的第一寡核苷酸最初可以用保护基团(例如,光可切割保护基团)保护,并且可以在第一寡核苷酸与第二寡核苷酸之间连接之前去除保护基团。在阵列上的带条形码的探针通过连接两个或更多个寡核苷酸产生的情况下,寡核苷酸的浓度梯度可以施加于基板,使得寡核苷酸的不同组合根据其在基板上的定位并入到带条形码的探针中。
可以通过夹板寡核苷酸将另外的寡核苷酸直接连接到现有的寡核苷酸上来产生探针。在一些实施例中,现有阵列上的寡核苷酸可以包含可以与夹板寡核苷酸杂交的识别序列。识别序列可以处于现有阵列上的寡核苷酸的游离5'端或游离3'端。可用于本公开的方法的识别序列可以不含限制性酶识别位点或二级结构(例如,发夹),并且可以包含高含量的鸟嘌呤和胞嘧啶核苷酸。
(5)聚合酶
阵列上的带条形码的探针也可以通过将单个核苷酸添加到阵列上的现有寡核苷酸中来产生,例如,使用以模板非依赖性方式起作用的聚合酶。可以将单个核苷酸以浓度梯度添加到现有的寡核苷酸中,由此根据探针在阵列上的定位产生具有不同长度的探针。
(6)对现有捕获探针的修饰
还可以通过修饰现有阵列来制备阵列,例如,通过修饰附接到阵列的寡核苷酸。例如,可以在包括寡核苷酸的阵列上产生探针,所述寡核苷酸在3'端处附接到阵列并且具有游离5'端。寡核苷酸可以是原位合成的寡核苷酸,并且可以包含条形码。寡核苷酸的长度可以小于50个核苷酸(nts)(例如,小于45、40、35、30、25、20、15或10个nts)。为了使用这些寡核苷酸产生探针,可以使用与寡核苷酸的一部分(例如,寡核苷酸共享的恒定序列)互补的引物与寡核苷酸杂交并延伸(使用寡核苷酸作为模板)以形成双链体并产生3'突出端。因此,3'突出端允许将另外的核苷酸或寡核苷酸添加到双链体上。捕获探针可以通过例如将一种或多种寡核苷酸添加到3'突出端的端部(例如,通过夹板寡核苷酸介导的连接)来产生,其中添加的寡核苷酸可以包含捕获结构域的序列或序列的一部分。
在一些实施例中,可以根据WO 2012/140224、WO 2014/060483、WO 2016/162309、WO 2017/019456、WO 2018/091676和WO 2012/140224以及美国专利申请第2018/0245142号中阐述的方法制备阵列。前述文档的全部内容通过引用并入本文中。
在一些实施例中,阵列上的捕获点包含珠粒。在一些实施例中,将两个或多个珠粒分散到基板上以创建阵列,其中每个珠粒是阵列上的捕获点。珠粒可以任选地分散到基板上的孔中,例如,使得每孔仅容纳单个珠粒。
与珠粒、珠粒阵列、珠粒性质(例如,结构、材料、构造、交联、降解、试剂和/或光学性质)相关以及用于将珠粒与基板共价和非共价结合的另外的详情和非限制性实施例描述于以下中:美国专利申请第16/992,569号、美国专利申请第20110059865A1号、美国临时专利申请第62/839,346号、美国专利申请第9,012,022号以及题为“用带空间条形码的寡核苷酸阵列剖析生物分析物”的PCT公开202020176788A1,所述文献中的每个文献以全文引用的方式并入本文中。
(i)捕获点大小
阵列上的捕获点可以是多种大小的。在一些实施例中,阵列的捕获点的直径或最大尺寸介于1μm到100μm之间。在一些实施例中,阵列的捕获点的直径或最大尺寸介于1μm到10μm、1μm到20μm、1μm到30μm、1μm到40μm、1μm到50μm、1μm到60μm、1μm到70μm、1μm到80μm、1μm到90μm、90μm到100μm、80μm到100μm、70μm到100μm、60μm到100μm、50μm到100μm、40μm到100μm、30μm到100μm、20μm到100μm或10μm到100μm之间。在一些实施例中,捕获点的直径或最大尺寸介于30μm到100μm、40μm到90μm、50μm到80μm、60μm到70μm之间或所公开的子范围内的任何范围。在一些实施例中,捕获点的直径或最大尺寸不大于95μm、90μm、85μm、80μm、75μm、70μm、65μm、60μm、55μm、50μm、45μm、40μm、35μm、30μm、25μm、20μm、15μm、14μm、13μm、12μm、11μm、10μm、9μm、8μm、7μm、6μm、5μm、4μm、3μm、2μm或1μm。在一些实施例中,捕获点的直径或最大尺寸为大约65μm。
在一些实施例中,多个捕获点的平均直径或平均最大尺寸介于1μm到100μm之间。例如,介于1μm到10μm、1μm到20μm、1μm到30μm、1μm到40μm、1μm到50μm、1μm到60μm、1μm到70μm、1μm到80μm、1μm到90μm、90μm到100μm、80μm到100μm、70μm到100μm、60μm到100μm、50μm到100μm、40μm到100μm、30μm到100μm、20μm到100μm或10μm到100μm之间。在一些实施例中,多个捕获点的平均直径或平均最大尺寸介于30μm到100μm、40μm到90μm、50μm到80μm、60μm到70μm之间或所公开的子范围内的任何范围。在一些实施例中,多个捕获点的平均直径或平均最大尺寸不大于95μm、90μm、85μm、80μm、75μm、70μm、65μm、60μm、55μm、50μm、45μm、40μm、35μm、30μm、25μm、20μm、15μm、14μm、13μm、12μm、11μm、10μm、9μm、8μm、7μm、6μm、5μm、4μm、3μm、2μm或1μm。在一些实施例中,多个捕获点的平均直径或平均最大尺寸为大约65μm。
在一些实施例中,在捕获点是珠粒的情况下,珠粒的直径或最大尺寸可以不大于100μm(例如,不大于95μm、90μm、85μm、80μm、75μm、70μm、65μm、60μm、55μm、50μm、45μm、40μm、35μm、30μm、25μm、20μm、15μm、14μm、13μm、12μm、11μm、10μm、9μm、8μm、7μm、6μm、5μm、4μm、3μm、2μm或1μm)。
在一些实施例中,多个珠粒的平均直径不大于100μm。在一些实施例中,多个珠粒的平均直径或最大尺寸不大于95μm、90μm、85μm、80μm、75μm、70μm、65μm、60μm、55μm、50μm、45μm、40μm、35μm、30μm、25μm、20μm、15μm、14μm、13μm、12μm、11μm、10μm、9μm、8μm、7μm、6μm、5μm、4μm、3μm、2μm或1μm。
在一些实施例中,珠粒的体积可以是至少约1μm3,例如至少1μm3、2μm3、3μm3、4μm3、5μm3、6μm3、7μm3、8μm3、9μm3、10μm3、12μm3、14μm3、16μm3、18μm3、20μm3、25μm3、30μm3、35μm3、40μm3、45μm3、50μm3、55μm3、60μm3、65μm3、70μm3、75μm3、80μm3、85μm3、90μm3、95μm3、100μm3、125μm3、150μm3、175μm3、200μm3、250μm3、300μm3、350μm3、400μm3、450μm3、μm3、500μm3、550μm3、600μm3、650μm3、700μm3、750μm3、800μm3、850μm3、900μm3、950μm3、1000μm3、1200μm3、1400μm3、1600μm3、1800μm3、2000μm3、2200μm3、2400μm3、2600μm3、2800μm3、3000μm3或更大。
在一些实施例中,珠粒的体积可以介于约1μm3与100μm3之间,如介于约1μm3与10μm3之间、介于约10μm3与50μm3之间或介于约50μm3与100μm3之间。在一些实施例中,珠粒可以包含介于约100μm3与1000μm3之间,如介于约100μm3与500μm3之间或介于约500μm3与1000μm3之间的体积。在一些实施例中,珠粒可以包含介于约1000μm3与3000μm3之间,如介于约1000μm3与2000μm3之间或介于约2000μm3与3000μm3之间的体积。在一些实施例中,珠粒可以包含介于约1μm3与3000μm3之间,如介于约1μm3与2000μm3之间、介于约1μm3与1000μm3之间、介于约1μm3与500μm3之间或介于约1μm3与250μm3之间的体积。
捕获点可以包含一个或多个可以相同或不同的横截面。在一些实施例中,捕获点可以具有不同于第二横截面的第一横截面。捕获点的第一横截面可以为至少约0.0001微米、0.001微米、0.01微米、0.1微米或1微米。在一些实施例中,捕获点包含的横截面(例如,第一横截面)可以为至少约1微米(μm)、2μm、3μm、4μm、5μm、6μm、7μm、8μm、9μm、10μm、11μm、12μm、13μm、14μm、15μm、16μm、17μm、18μm、19μm、20μm、25μm、30μm、35μm、40μm、45μm、50μm、55μm、60μm、65μm、70μm、75μm、80μm、85μm、90μm、100μm、120μm、140μm、160μm、180μm、200μm、250μm、300μm、350μm、400μm、450μm、500μm、550μm、600μm、650μm、700μm、750μm、800μm、850μm、900μm、950μm、1毫米(mm)或更大。在一些实施例中,捕获点包含的横截面(例如,第一横截面)可以介于约1μm与500μm之间,如介于约1μm与100μm之间、介于约100μm与200μm之间、介于约200μm与300μm之间、介于约300μm与400μm之间或介于约400μm与500μm之间。例如,捕获点包含的横截面(例如,第一横截面)可以介于约1μm与100μm之间。在一些实施例中,捕获点的第二横截面可以为至少约1μm。例如,捕获点包含的第二横截面可以为至少约1微米(μm)、2μm、3μm、4μm、5μm、6μm、7μm、8μm、9μm、10μm、11μm、12μm、13μm、14μm、15μm、16μm、17μm、18μm、19μm、20μm、25μm、30μm、35μm、40μm、45μm、50μm、55μm、60μm、65μm、70μm、75μm、80μm、85μm、90μm、100μm、120μm、140μm、160μm、180μm、200μm、250μm、300μm、350μm、400μm、450μm、500μm、550μm、600μm、650μm、700μm、750μm、800μm、850μm、900μm、950μm、1毫米(mm)或更大。在一些实施例中,捕获点包含的第二横截面可以介于约1μm与500μm之间,如介于约1μm与100μm之间、介于约100μm与200μm之间、介于约200μm与300μm之间、介于约300μm与400μm之间或介于约400μm与500μm之间。例如,捕获点包含的第二横截面可以介于约1μm与100μm之间。
在一些实施例中,捕获点可以是纳米级的(例如,捕获点的直径或最大横截面尺寸可以为约100纳米(nm)到约900纳米(nm)(例如,850nm或更少、800nm或更少、750nm或更少、700nm或更少、650nm或更少、600nm或更少、550nm或更少、500nm或更少、450nm或更少、400nm或更少、350nm或更少、300nm或更少、250nm或更少、200nm或更少、150nm或更少)。多个捕获点的平均直径或平均最大横截面尺寸可以为约100纳米(nm)到约900纳米(nm)(例如,850nm或更少、800nm或更少、750nm或更少、700nm或更少、650nm或更少、600nm或更少、550nm或更少、500nm或更少、450nm或更少、400nm或更少、350nm或更少、300nm或更少、250nm或更少、200nm或更少、150nm或更少)。在一些实施例中,捕获点的直径或大小为约单个细胞(例如,评估中的单细胞)的大小。
捕获点可以是一致大小或不均匀大小。“多分散性”通常是指分子或颗粒大小的不均匀性。可以使用等式PDI=Mw/Mn计算多分散性(PDI),其中Mw是重均摩尔质量,并且Mn是数均摩尔质量。在某些实施例中,捕获点可以作为具有相对单分散大小分布的一组或多个捕获点来提供。在可能需要提供相对较一致量的试剂的情况下,维持相对较一致的捕获点特性如大小可以有助于整体一致性。
在一些实施例中,本文所提供的珠粒可以具有大小分布,所述大小分布的其横截面尺寸的变异系数小于50%、小于40%、小于30%、小于20%、小于15%、小于10%、小于5%或更小。在一些实施例中,本文提供的多个珠粒的多分散性指数为小于50%、小于45%、小于40%、小于35%、小于30%、小于25%、小于20%、小于15%、小于10%、小于5%或更低。
(ii)捕获点密度
在一些实施例中,阵列包括多个捕获点。在一些实施例中,阵列(例如,二维阵列)包含4000到10,000个捕获点或4000到6000个捕获点内的任何范围。例如,阵列包含4,000到4,400个捕获点、4,000到4,800个捕获点、4,000到5,200个捕获点、4,000到5,600个捕获点、5,600到6,000个捕获点、5,200到6,000个捕获点、4,800到6,000个捕获点或4,400到6,000个捕获点。在一些实施例中,阵列包含4,100到5,900个捕获点、4,200到5,800个捕获点、4,300到5,700个捕获点、4,400到5,600个捕获点、4,500到5,500个捕获点、4,600到5,400个捕获点、4,700到5,300个捕获点、4,800和5,200之间的捕获点、4,900到5,100个捕获点或所公开的子范围内的任何范围。例如,阵列可以包含约4,000个捕获点、约4,200个捕获点、约4,400个捕获点、约4,800个捕获点、约5,000个捕获点、约5,200个捕获点、约5,400个捕获点、约5,600个捕获点或约6,000个捕获点。在一些实施例中,阵列包括至少4,000个捕获点。在一些实施例中,阵列包含大约5,000个捕获点。
在一些实施例中,阵列的捕获点可以布置成图案。在一些实施例中,阵列的捕获点的中心距阵列的另一个捕获点的中心介于1μm与100μm之间。例如,捕获点的中心距阵列的另一个捕获点的中心介于20μm到40μm、20μm到60μm、20μm到80μm、80μm到100μm、60μm到100μm或40μm到100μm之间。在一些实施例中,阵列的捕获点的中心距阵列的另一个捕获的中心介于30μm与100μm之间、40μm与90μm之间、50μm与80μm之间、60μm与70μm之间或所公开的子范围内的任何范围。在一些实施例中,阵列的捕获点的中心距阵列的另一个捕获点的中心为大约65μm。在一些实施例中,阵列的捕获点的中心距阵列的另一个捕获点的中心介于80μm到120μm之间。
在一些实施例中,阵列的多个捕获点均匀定位。在一些实施例中,阵列的多个捕获点不均匀定位。在一些实施例中,阵列的多个捕获点的位置是预定的。在一些实施例中,阵列的多个捕获点的位置不是预定的。
在一些实施例中,阵列的多个捕获点的大小和/或形状大约一致。在一些实施例中,阵列的多个捕获点的大小和/或形状基本上不一致。
在一些实施例中,阵列为大约8mm×8mm。在一些实施例中,阵列为小于8mm×8mm。
在一些实施例中,阵列可以是高密度阵列。在一些实施例中,高密度阵列可以布置成图案。在一些实施例中,阵列的高密度图案是通过将捕获点在一个或多个维度中压实或压缩在一起产生的。在一些实施例中,可以通过点印刷或本文所描述的其它技术来创建高密度图案。在一些实施例中,阵列的捕获点的中心距阵列的另一个捕获点的中心介于80μm与120μm之间。在一些实施例中,阵列的捕获点的中心距阵列的另一个捕获的中心介于85μm与115μm之间、介于90μm与110μm之间、95μm与105μm之间或所公开的子范围内的任何范围。在一些实施例中,阵列的捕获点的中心距阵列的另一个捕获点的中心为大约100μm。
(iii)阵列分辨率
如本文所用,“低分辨率”阵列(例如,低分辨率空间阵列)是指具有平均直径为约20微米或更大的捕获点的阵列。在一些实施例中,单个捕获点内的基本上所有(例如,80%或更多)捕获探针都包含相同的条形码(例如,空间条形码),使得在去卷积时,来自对一种或多种分析物的检测的所得测序数据可以与捕获点的空间条形码相关,由此标识捕获点在阵列上的定位,并且因此确定一种或多种分析物在生物样品中的定位。
“高分辨率”阵列是指具有平均直径为约1微米至约10微米的捕获点的阵列。捕获点的平均直径范围对应于单个哺乳动物细胞的近似直径。因此,高分辨率空间阵列能够检测哺乳动物单细胞规模或以下的分析物。
在一些实施例中,可以通过构建具有较小捕获点的阵列来提高阵列的分辨率。在一些实施例中,可以通过增加阵列中的捕获点的数量来提高阵列的分辨率。在一些实施例中,可以通过将捕获点更紧密地排列在一起来提高阵列的分辨率。例如,与包含1,000个捕获点的阵列相比,包含5,000个捕获点的阵列被确定为提供更高的分辨率(数据未示出)。
在一些实施例中,阵列的捕获点可以布置成图案,并且在一些情况下,布置成高密度图案。在一些实施例中,阵列的高密度图案是通过将捕获点在一个或多个维度中压实或压缩在一起产生的。在一些实施例中,可以通过点印刷或本文所描述的其它技术来创建高密度图案。与包含1,000个捕获点的阵列相比,当使用包含5,000个捕获点的阵列时,每个细胞的中位基因捕获数量和每个细胞的中位UMI计数更高(数据未示出)。
在一些实施例中,阵列包含捕获点,其中捕获点包含一个或多个捕获探针(例如,本文所描述的任何捕获探针)。
(e)分析物捕获
在此部分中,描述了用于捕获分析物的系统和方法的一般方面。单独的方法步骤和系统特征可以组合在许多不同的实施例中;本文所描述的具体组合不以任何方式限制步骤和特征的其它组合。
通常,当使生物样品与例如包括捕获探针的基板(例如,具有嵌入、点样、印刷在基板上的捕获探针的基板或具有包括捕获探针的捕获点(例如,珠粒、孔)的基板)接触时,可以捕获分析物。
如本文所用,生物样品与包括捕获点的基板的“接触(contact、contacted和/或contacting)”是指任何接触(例如,直接或间接),使得捕获探针可以与来自生物样品的分析物相互作用(例如,捕获)。例如,基板可以在没有直接物理接触的情况下靠近或邻近生物样品,但能够从生物样品中捕获分析物。在一些实施例中,生物样品与基板直接物理接触。在一些实施例中,生物样品与基板间接物理接触。例如,液体层可以处于生物样品与基板之间。在一些实施例中,分析物通过液体层扩散。在一些实施例中,捕获探针物通过液体层扩散。在一些实施例中,试剂可以通过生物样品与基板之间的液体层递送。在一些实施例中,间接物理接触可以是在生物样品与包括具有捕获探针的捕获点的第一基板之间存在第二基板(例如,水凝胶、薄膜、多孔膜)。在一些实施例中,试剂可以通过第二基板递送到生物样品。
(i)防扩散介质/盖
为了通过促进分析物向空间标记的捕获探针扩散来提高效率,可以使用防扩散介质。通常,生物分析物的分子扩散发生在所有方向,包含朝向捕获探针(即朝向带空间条形码的阵列)和远离捕获探针(即进入到散装溶液中)。增加朝向带空间条形码的阵列的扩散会减少分析物从带空间条形码的阵列的扩散,并增加捕获探针的捕获效率。
在一些实施例中,将生物样品放置在带空间条形码的基板的顶部上,并且将防扩散介质放置在生物样品的顶部上。例如,可以将防扩散介质放置到已经被放置成与生物样品接触的阵列上。在一些实施例中,防扩散介质和空间标记的阵列是相同的组件。例如,防扩散介质可以在防扩散介质(例如,盖玻片、载玻片、水凝胶或膜)内部或之上含有空间标记的捕获探针。在一些实施例中,将样品放置在支撑物上,并且将防扩散介质放置在生物样品的顶部上。另外地,带空间条形码的捕获探针阵列可以放置紧靠防扩散介质之上。例如,可以将防扩散介质夹置在空间标记的阵列与支撑物上的样品之间。在一些实施例中,将防扩散介质安置于或点样到样品上。在其它实施例中,将防扩散介质放置成靠近样品。
通常,防扩散介质可以是已知限制生物分析物扩散性的任何材料。例如,防扩散介质可以是实心盖(例如,盖玻片或载玻片)。在一些实施例中,防扩散介质可以由玻璃、硅、纸、水凝胶、聚合物单片或其它材料制成。在一些实施例中,玻璃面可以是丙烯酸化载玻片。在一些实施例中,防扩散介质是多孔膜。在一些实施例中,材料可以是天然多孔的。在一些实施例中,材料可以具有蚀刻到固体材料的孔或孔。在一些实施例中,可以操纵孔径以最大化靶标分析物的损失。在一些实施例中,可以操纵膜化学以最大化靶标分析物的损失。在一些实施例中,防扩散介质(即水凝胶)共价附接到固体支撑物(即载玻片)。在一些实施例中,防扩散介质可以是已知限制polyA转录物扩散性的任何材料。在一些实施例中,防扩散介质可以是已知限制蛋白质扩散性的任何材料。在一些实施例中,防扩散介质可以是已知限制大分子成分扩散性的任何材料。
在一些实施例中,防扩散介质包含一种或多种防扩散介质。例如,一种或多种防扩散介质可以在使介质与生物样品接触之前以多种方式组合,包含但不限于涂层、分层或点样。作为另一个实例,可以将水凝胶放置到生物样品上,然后将盖(例如,载玻片)放置在水凝胶的顶部上。
在一些实施例中,施加力(例如,流体动力压力、超声振动、溶质对比、微波辐射、血管循环或其它电、机械、磁、离心和/或热力)以控制扩散和增强分析物捕获。在一些实施例中,一种或多种力和一种或多种防扩散介质用于控制扩散和增强捕获。例如,离心力和载玻片可以同时使用。可以使用力和防扩散介质的多种组合中的任何一种来控制或减轻扩散并增强分析物捕获。
在一些实施例中,防扩散介质连同带空间条形码的阵列和样品一起浸没在散装溶液中。在一些实施例中,散装溶液包含透化试剂。在一些实施例中,防扩散介质包含至少一种透化试剂。在一些实施例中,在将防扩散介质与样品接触之前,将防扩散介质(即水凝胶)浸泡在透化试剂中。在一些实施例中,防扩散介质可以包含含有透化缓冲液或试剂的孔(例如,微孔、纳米孔或皮可孔)。在一些实施例中,防扩散介质可以包含透化试剂。在一些实施例中,当防扩散介质施加到生物样品时,防扩散介质可以含有干燥试剂或单体以递送透化试剂。在一些实施例中,在将组合件浸没在散装溶液中之前,将防扩散介质添加到带空间条形码的阵列和样品组合件中。在一些实施例中,在样品暴露于透化试剂之后,将防扩散介质添加到带空间条形码的阵列和样品组合件中。在一些实施例中,透化试剂跨防扩散介质流经微流体室或通道。在一些实施例中,流动控制了样品到透化试剂的通路。在一些实施例中,靶标分析物从样品中扩散出来并朝向散装溶液扩散,并且然后包埋在空间标记的捕获探针包埋的防扩散介质中。
图13是防扩散介质的示例性使用的图示。防扩散介质1302可以与样品1303接触。在图13中,载玻片1304填充有带空间条形码的捕获探针1306,并且样品1303、1305与阵列1304、1306接触。可以将防扩散介质1302施加于样品1303,其中样品1303夹置在防扩散介质1302与捕获探针涂覆的载玻片1304之间。当将透化溶液1301施加于样品时,使用防扩散介质/盖1302通过减少分析物扩散到介质中来引导分析物1305向捕获探针1306迁移。可替代地,盖可以含有透化试剂。
(ii)捕获条件
基板上(或基板上的捕获点上)的捕获探针通过在别处描述的捕获结构域与释放的分析物相互作用,以捕获分析物。在一些实施例中,执行某些步骤以增强阵列的捕获探针对分析物的转移或捕获。此类修饰的实例包含但不限于调整用于使基板与生物样品接触的条件(例如,时间、温度、朝向、pH水平、对生物样品的预处理等),使用力转运分析物(例如,电泳、离心、机械等),进行扩增反应以增加生物分析物的量(例如,PCR扩增、原位扩增、克隆扩增)和/或使用标记的探针检测扩增子和条形码。
在一些实施例中,通过用透化试剂处理生物样品来促进对分析物的捕获。如果生物样品未被充分透化,那么在基板上捕获的分析物的量可能太低以至于不能够进行适当分析。相反,如果生物样品被过度透化,则分析物会从其在生物样品中的来源扩散开,使得失去生物样品内的分析物的相对空间关系。因此,期望生物样品被透化足以获得良好信号强度的同时仍维持生物样品中的分析物分布的空间分辨率之间的平衡。制备生物样品以便促进的方法在本领域中是已知的并且可以根据生物样品和生物样品的制备方式(例如,新鲜冷冻、FFPE等)进行修改。
(iii)被动捕获方法
在一些实施例中,分析物从样品迁移到基板。用于促进迁移的方法可以是被动的(例如,扩散)和/或主动的(例如,核酸的电泳迁移)。被动迁移的非限制性实例可以包含由脱水物体再水化产生的简单扩散和渗透压。
通过扩散被动迁移使用浓度梯度。扩散是未拴系的物体朝向平衡的运动。因此,当存在物体浓度高的区域和物体浓度低的区域时,物体(捕获探针、分析物等)会移动到较低浓度的区域。在一些实施例中,未拴系的分析物沿浓度梯度向下移动。
在一些实施例中,不同的试剂被添加到生物样品中,使得生物样品被再水化,同时提高了对分析物的捕获。在一些实施例中,生物样品用透化试剂再水化。在一些实施例中,生物样品用染色溶液(例如,苏木精和伊红染色)再水化。
(iv)主动捕获方法
在本文所描述的任何方法的一些实例中,细胞或生物样品中的分析物可以被转运(例如,被动或主动)到捕获探针(例如,固定到固体表面的捕获探针)。
例如,可以使用电场(例如,使用电泳)、压力梯度、流体流动、化学浓度梯度、温度梯度和/或磁场将细胞或生物样品中的分析物转运到捕获探针(例如,固定化捕获探针)。例如,分析物可以通过例如凝胶(例如,水凝胶基质)、流体或透化细胞转运到捕获探针(例如,固定化捕获探针)。
在一些实例中,可以对分析物施加电泳场以促进分析物朝向捕获探针迁移。在一些实例中,样品接触基板并捕获固定在基板(例如,载玻片、盖玻片或珠粒)上的探针,并且施加电流以促进带电分析物朝向固定在基板上的捕获探针定向迁移。电泳组合件和阳极可以用于施加电流,其中细胞或生物样品与阴极和捕获探针(例如,固定在基板上的捕获探针)接触,并且其中捕获探针(例如,固定在基板上的捕获探针)与细胞或生物样品接触。
分析物的电泳转移可以在保持样品中的分析物的相对空间对准的同时进行。因此,由捕获探针(例如,固定在基板上的捕获探针)捕获的分析物保留了细胞或生物样品的空间信息。
在一些实例中,空间可寻址微电极阵列用于通过捕获探针在空间上受限地捕获至少一种所关注带电分析物。微电极阵列可以被配置成包含高密度的离散位点,所述离散位点具有用于施加电场以促进所关注带电分析物迁移的小面积。例如,可以使用空间可寻址微电极阵列在所关注区域上进行电泳捕获。
(v)所关注区域
生物样品可以具有显示可能表明疾病存在或疾病表型发展的形态特征的区域。例如,肿瘤活检样品内的特定位点处的形态学特征可以指示受试者的癌症的侵袭性、治疗抗性、转移潜力、迁移、阶段、诊断和/或预后。肿瘤活检样品中的特定位点处的形态学特征的变化通常与特定位点内的细胞中的分析物水平或表达的变化相关,这进而可以用于提供有关受试者的癌症的侵袭性、治疗抗性、转移潜能、迁移、阶段、诊断和/或预后的信息。选择用于特定分析的生物样品内的区域或区域(例如,生物样品中的具有所关注形态特征的区域)通常被描述为“所关注区域”。
生物样品中的所关注区域可以用于分析生物样品内的特定所关注区域,并且由此将实验和数据收集集中到生物样品的特定区域(而不是整个生物样品)。这使对生物样品的分析的时间效率增加。
可以使用各种不同的技术例如扩增显微术、明场显微术、暗场显微术、相差显微术、电子显微术、荧光显微术、反射显微术、干涉显微术和共焦显微术以及其组合在生物样品中标识所关注区域。例如,可以执行生物样品的染色和成像以标识所关注区域。在一些实例中,所关注区域可以对应于细胞结构的特定结构。在一些实施例中,可以在可视化之前对生物样品进行染色,以提供生物样品不同区域之间的对比。可以根据生物样品的类型和要染色的细胞区域来选择染色的类型。在一些实施例中,超过一种染色剂可以用于可视化生物样品的不同方面,例如样品的不同区域、特定的细胞结构(例如,细胞器)或不同的细胞类型。在其它实施例中,生物样品可以在不染色生物样品的情况下被可视化或成像。
在一些实施例中,可以使用一个或多个基准标志物(即放置在成像系统的视场中的出现在所产生的图像中的对象)来执行成像。基准标志物通常用作参考点或测量量表。基准标志物可以包含但不限于可检测标记,如荧光标记、放射性标记、化学发光标记、量热标记和比色标记。使用基准标志物来稳定和朝向生物样品例如描述于Carter等人,《应用光学(Applied Optics)》46:421-427,2007中,所述文献的全部内容通过引用并入本文。
在一些实施例中,基准标志物可以存在于基板上以提供生物样品的朝向。在一些实施例中,微球可以与基板偶联以帮助生物样品的朝向。在一些实例中,与基板偶联的微球可以产生光学信号(例如,荧光)。在另一个实例中,可以将微球以特定图案或设计(例如,六边形设计)附接到阵列的一部分(例如,角),以帮助生物样品在基板上的捕获点阵列上朝向。在一些实施例中,基准标志物可以是可检测的信号分子可以与其相互作用以产生信号的固定化分子。例如,标志物核酸可以连接或偶联到当经历特定波长(或波长范围)的光时能够发荧光的化学部分。此类标志物核酸分子可以在组织样品染色之前、同时或之后与阵列接触,以使组织切片可视化或成像。尽管不是必需的,但使用可以使用用于检测标记的cDNA的相同条件(例如,成像条件)检测的标志物可能是有利的。
在一些实施例中,包含基准标志物以促进组织样品或其图像相对于基板上的固定化捕获探针的朝向。可以使用任何数量的用于标记阵列的方法,使得仅当对组织切片进行成像时才能检测到标志物。例如,分子,例如产生信号的荧光分子,可以直接或间接固定在基板的表面上。可以在基板上以图案(例如,边缘、一个或多个行、一个或多个线等)提供标志物。
在一些实施例中,可以在视场中随机放置基准标志物。例如,可以将含有荧光团的寡核苷酸随机印刷、压印、合成或附接到基板(例如,载玻片)在基板的随机位置处。组织切片可以与基板接触,使得含有荧光团的寡核苷酸接触或接近来自组织切片的细胞或细胞的组分(例如,mRNA或DNA分子)。可以获得基板和组织切片的图像,并且可以确定荧光团在组织切片图像内的位置(例如,通过查看与荧光团检测重叠的组织切片的光学图像)。在一些实施例中,基准标志物可以精确地放置在视场中(例如,在基板上的已知定位处)。在此情况下,可以在基板上压印、附接或合成基准标志物并与生物样品接触。通常,拍摄样品和基准标志物的图像,并且可以通过查看图像来确认基准标志物在基板上的位置。
在一些实例中,基准标志物可以围绕阵列。在一些实施例中,基准标志物允许检测,例如镜像。在一些实施例中,基准标志物可以完全围绕阵列。在一些实施例中,基准标志物可以不完全围绕阵列。在一些实施例中,基准标志物标识阵列的角。在一些实施例中,一个或多个基准标志物标识阵列的角。在一些实施例中,基准标志物包括图案化点,其中一个或多个图案化点基准标志物的直径为大约100微米。基准标志物的直径可以是任何有用的直径,包含但不限于50微米到500微米的直径。基准标志物可以布置成使得一个基准标志物的中心距阵列周围的一个或多个其它基准标志物的中心在100微米与200微米之间。在一些实施例中,具有周围基准标志物的阵列为大约8mm×8mm。在一些实施例中,不具有周围基准标志物的阵列小于8mm×8mm。
在一些实施例中,在使生物样品与空间阵列接触之前对生物样品进行染色和成像以选择用于空间分析的样品。在一些实施例中,染色包含施加如上文所描述的基准标志物,包含荧光、放射性、化学发光、比色或比色可检测标志物。在一些实施例中,对生物样品的染色和成像允许用户标识用户希望评估的特定样品(或所关注区域)。
在一些实施例中,查找表(LUT)可以用于将一个性质与捕获点的另一个性质相关联。这些属性包含例如定位、条形码(例如,核酸条形码分子)、空间条形码、光学标记、分子标签和其它性质。
在一些实施例中,查找表可以将核酸条形码分子与捕获点相关联。在一些实施例中,捕获点的光学标记可以允许将捕获点与生物颗粒(例如,细胞或细胞核)相关联。捕获点与生物颗粒的关联可以进一步允许将生物颗粒的核酸分子的核酸序列与生物颗粒的一种或多种物理性质(例如,细胞的类型或细胞的定位)相关联。例如,基于条形码与光学标记之间的关系,光学标记可以用于确定捕获点的定位,从而将捕获点的定位与捕获点的条形码序列相关联。随后的分析(例如,测序)可以将条形码序列与样品中的分析物相关联。因此,基于定位与条形码序列之间的关系,可以确定生物分析物的定位(例如,在特定类型的细胞中或在生物样品的特定定位处的细胞中)。
在一些实施例中,捕获点可以具有与其附接的多个核酸条形码分子。多个核酸条形码分子可以包含条形码序列。与给定捕获点附接的多个核酸分子可以具有相同的条形码序列,或两个或更多个不同的条形码序列。不同的条形码序列可以用于提供改进的空间定位精度。
在一些实施例中,处理基板以最小化或减少捕获点内或捕获点之间的非特异性分析物杂交。例如,处理可以包含用对非特异性杂交产生物理屏障的水凝胶、薄膜和/或膜涂覆基板。可以使用任何合适的水凝胶。例如,可以使用根据美国专利第6,391,937号、第9,512,422号和第9,889,422号以及美国专利申请公开号U.S.2017/0253918和U.S.2018/0052081中所述的方法制备的水凝胶基质。前述文档中的每个文档的全部内容通过引用并入本文。
治疗可以包含添加反应性或能够被活化的官能团,使得其在接受刺激之后变为反应性(例如,光反应性)。处理可以包含用具有一种或多种物理性质(例如,机械、电、磁和/或热)的聚合物处理,所述物理性质使非特异性结合(例如,在某些定位处使基板活化以允许分析物在那些定位处杂交)最小化。
在一些实例中,阵列(例如,本文所描述的任何示例性阵列)可以仅包含生物样品的一部分(例如,细胞、特征或所关注区域)。在一些实例中,生物样品仅与阵列的一部分(例如,本文所描述的任何示例性阵列)接触。在一些实例中,可以使阵列的一部分失活以使得其不与生物样品中的分析物相互作用(例如,光学失活、化学失活、热失活或对阵列中的捕获探针的阻断(例如,使用阻断探针))。在一些实例中,可以从生物样品中去除所关注区域,并且然后可以使所关注区域与阵列(例如,本文所描述的任何阵列)接触。可以使用显微外科手术、激光捕获显微切割、分块、切片机、切片、胰蛋白酶消化、标记和/或荧光辅助细胞分选从生物样品中去除所关注区域。
(f)对所捕获的分析物的分析
在一些实施例中,在使生物样品与包含捕获探针的基板接触之后,可以任选地执行去除步骤以从基板去除所有或部分生物样品。在一些实施例中,去除步骤包含生物样品的细胞的酶促和/或化学降解。例如,去除步骤可以包含用酶(例如,蛋白酶,例如蛋白酶K)处理生物样品以从基板去除生物样品的至少一部分。在一些实施例中,去除步骤可以包含组织消融(例如,激光消融)。
在一些实施例中,一种用于从生物样品(例如,存在于生物样品中)空间检测分析物(例如,检测分析物,例如生物分析物的定位)的方法,包括:(a)任选地对基板上的生物样品进行染色和/或成像;(b)使基板上的生物样品透化(例如,将包括透化试剂的溶液提供到所述生物样品);(c)使生物样品与包括多个捕获探针的阵列接触,其中所述多个捕获探针中的捕获探针捕获生物分析物;以及(d)分析所捕获的生物分析物,由此在空间上检测生物分析物;其中生物样品被完全或部分地从基板中去除。
在一些实施例中,生物样品没有从基板中去除。例如,在从基板中释放捕获探针(例如,与分析物结合的捕获探针)之前,不从基板中去除生物样品。在一些实施例中,此类释放包括从基板上切割捕获探针(例如,通过切割结构域)。在一些实施例中,此类释放不包括从基板中释放捕获探针(例如,可以制备与分析物结合的捕获探针的拷贝,并且所述拷贝可以从基板中释放,例如,通过变性)。在一些实施例中,在对与从基板中释放之后的捕获探针结合的分析物分析之前不从基板中去除生物样品。在一些实施例中,在从基板中去除捕获探针和/或在对与从基板中释放之后的捕获探针结合的分析物的分析期间,生物样品保留在基板上。在一些实施例中,可以在不使生物样品经历细胞(例如,透化细胞)的酶促和/或化学降解或组织消融(例如,激光消融)的情况下对与来自基板的捕获探针结合的分析物进行分析。
在一些实施例中,生物样品的至少一部分没有从基板中去除。例如,在从基板释放捕获探针(例如,结合到分析物的捕获证明)和/或分析与从基板释放的捕获探针结合的分析物之前,生物样品的一部分可以保留在基板上。在一些实施例中,在分析与来自支撑物的捕获探针结合的分析物之前,生物样品的至少一部分不经历细胞(例如,透化细胞)的酶促和/或化学降解或组织的消融(例如,激光消融)。
在一些实施例中,提供了一种用于从生物样品(例如,存在于生物样品中)空间检测分析物(例如,检测分析物,例如生物分析物的定位)的方法,所述方法包括:(a)任选地对基板上的生物样品进行染色和/或成像;(b)使基板上的生物样品透化(例如,将包括透化试剂的溶液提供到所述生物样品);(c)使生物样品与包括多个捕获探针的阵列接触,其中所述多个捕获探针中的捕获探针捕获生物分析物;以及(d)分析所捕获的生物分析物,由此在空间上检测生物分析物;其中生物样品不从基板中去除。
在一些实施例中,提供了一种用于从生物样品中空间检测所关注生物分析物的方法,所述方法包括:(a)对支撑物上的生物样品进行染色和成像;(b)将包括透化试剂的溶液提供到支撑物上的生物样品;(c)使生物样品与基板上的阵列接触,其中所述阵列包括一个或多个捕获探针组,由此允许一种或多种捕获探针捕获所关注生物分析物;以及(d)分析所捕获的生物分析物,由此在空间上检测所关注生物分析物;其中生物样品不从支撑物中去除。
在一些实施例中,所述方法进一步包含选择生物样品中的所关注区域以经历空间转录组分析。在一些实施例中,一个或多个捕获探针中的一个或多个捕获探针包含捕获结构域。在一些实施例中,一个或多个捕获探针中的一个或多个捕获探针包括唯一分子标识符(UMI)。在一些实施例中,一个或多个捕获探针中的一个或多个捕获探针包括切割结构域。在一些实施例中,切割结构域包括被尿嘧啶-DNA糖基化酶、脱嘌呤/脱嘧啶(AP)核酸内切酶(APE1)、尿嘧啶特异性切除试剂(USER)和/或核酸内切酶VIII识别和切割的序列。在一些实施例中,一个或多个捕获探针不包括切割结构域并且不从阵列切割。
在来自样品的分析物已经根据上文结合一般基于空间细胞的分析方法描述的任何方法与捕获探针、分析物捕获剂或其它带条形码的寡核苷酸序列杂交或以其它方式缔合之后,通过测序分析由杂交/缔合产生的带条形码的构建体以标识分析物。
在一些实施例中,本文所描述的方法可以用于评估分析物水平和/或随时间推移在细胞或生物样品中的表达(例如,在用药剂处理之前或之后或分化的不同阶段)。在一些实例中,本文所描述的方法可以对在不同时间点(例如,在用药剂治疗之前或之后、分化的不同阶段、疾病进展的不同阶段、受试者的不同年龄,或在对药剂产生抗性之前或之后)从受试者获得的多个相似的生物样品或细胞进行。
与从阵列中去除样品、对分析物的释放和扩增、对所捕获的分析物的分析(例如,通过测序和/或多路复用)和分析物信息的空间分辨率(例如,使用查找表)有关的另外的细节和非限制性实施例在2019年8月13日提交的题为“用于使用单倍型空间分布确定生物状态的系统和方法”的美国专利申请第16/992,569号中描述,所述美国专利申请特此通过引用并入本文。
III.用于组织分类的系统和方法的具体实施例
本公开还提供了用于组织分类的方法和系统。下文提供了对本公开的各个实施例的详细描述和解释。这些实施例是非限制性的并且不排除本领域技术人员在本公开的范围内可以想到的任何替代、变化、改变和取代。
(a)用于组织分类的系统
图11是展示了根据一些实施方案的用于组织分类的示例性非限制性系统的框图。在一些实施方案中,系统1100包含一个或多个处理单元CPU 1102(也被称为处理器)、一个或多个网络接口1104、用户接口1106、存储器1112、以及用于使这些组件互连的一个或多个通信总线1114。通信总线1114任选地包含互连并控制系统组件之间的通信的电路系统(有时被称为芯片组)。存储器1112通过包含高速随机存取存储器,如DRAM、SRAM、DDR RAM、ROM、EEPROM、闪速存储器、CD-ROM、数字多功能磁盘(DVD)或其它光存储装置、磁带盒、磁带、磁盘存储装置或其它磁存储装置、其它随机存取固态存储装置或可以用于存储期望的信息的任何其它介质;并且任选地包含非易失性存储器,如一个或多个磁盘存储装置、光盘存储装置、闪速存储装置或其它非易失性固态存储装置。存储器1112任选地包含远离CPU 1102定位的一个或多个存储装置。存储器1112或者可替代地存储器1112内的一个或多个非易失性存储器装置包括非暂时性计算机可读存储介质。应当理解,此存储器1112可以分布在一台或多台计算机上。在一些实施方案中,存储器1112或可替代地非暂时性计算机可读存储介质存储以下程序、模块和数据结构,或其子集:
·任选的操作系统1116,所述操作系统包含用于处理各种基本系统服务和用于执行硬件相关任务的程序;
·任选的网络通信模块(或指令)1118,所述网络通信模块(或指令)用于将装置1100与其它装置或与通信网络连接;
·任选的分类模块1120,所述任选的分类模块用于将图像的像素分类为组织或背景;
·呈电子形式的多个像素1122-1、1122-2、…、1122-M,使用透射光显微镜获得的来自受试者的基板上的切片组织样品的图像中的多个像素中的每个相应像素1122,并且多个像素中的每个相应像素1122与至少一个像素强度值1124(例如,1124-1)、初始化预测1126(例如,1126-1)、分类概率1128(例如,1128-1)和任选属性1130(例如,1130-1)相关联;
·分割算法1132,其包括多个聚合分数1134-1、1134-2、…、1134-X,每个聚合分数用于多个像素中的相应像素并且包括使用一个或多个启发式分类器获得的多个分类器投票1136(例如,1136-1-1、…、1136-1-N);
·任选的捕获点阵列1138,其包括呈基板上的二维位置阵列的形式的一组捕获点的表示,每个相应的捕获点处于二维阵列中的不同位置处并且与来自组织的一种或多种分析物相关联,并且每个相应捕获点由多个空间条形码中的至少一个唯一空间条形表征;以及
·任选的对准构造1140,其用于基于所述图像中的任选的捕获点阵列1138中的所述多个捕获点中捕获点的每个相应表示附近的像素的分配,为所述捕获点的所述相应表示分配第一属性或第二属性1130。
例如,在本公开的一些实施方案中,多个像素中的相应像素1122(例如,像素1)的像素强度值1124由一个或多个启发式分类器使用,所述启发式分类器进而提供多个分类器投票1136中的一个或多个分类器投票。多个分类器投票1136-1-1、…、1136-1-N形成相应像素的聚合分数1134,然后将其用于确定用于相应像素1122的初始化预测1126(例如,明显的第一类别、可能的第一类别、可能的二类别、明显的第二类别)。在一些实施方式中,分割算法1132随后使用相应像素1122的像素强度值1124和初始化预测1126来分配分类概率1128,指示所述像素是否表现出表示组织的概率更大,或者相反,表示背景的概率更大。在一些任选的实施方案中,相应像素1122的分类概率1128确定像素是否被分配了第一属性或第二属性1130,所述属性表示为针对多个像素中的每个像素叠加在图像上的组织掩模。最后,在一些任选的实施方案中,含有多个像素中的每个像素的第一属性或第二属性1130的组织掩模被进一步分配到捕获点阵列1138,用于捕获点阵列1138中的每个捕获点在使用任选对准构造1140确定的相应像素附近。
在一些实施方案中,用户接口1106包含供用户与系统1100交互的输入装置(例如,键盘、鼠标、触摸板、跟踪板和/或触摸屏)1110和显示器1108。
在一些实施方案中,一个或多个上述元件存储在先前提及的存储器装置中的一个或多个中,并且对应于用于执行上述功能的一组指令。以上标识的模块或程序(例如,指令集)不需要被实施为单独的软件程序、程序或模块,并且因此在各个实施方案中可以组合或以其它方式重新布置这些模块的各种子集。在一些实施方案中,存储器1112任选地存储上述模块和数据结构的子集。此外,在一些实施例中,存储器存储以上未描述的另外的模块和数据结构。在一些实施例中,上文标识的元件中的一个或多个元件存储在系统1100的计算机系统之外的计算机系统中,所述计算机系统可由系统1100寻址,使得系统1100可以在需要时检索所有或部分此类数据。
尽管图11示出了示例性系统1100,但是所述图更多地旨在作为可能存在于计算机系统中的各种特征的功能描述,而不是作为本文所描述的实施方案的结构示意图。在实践中,并且如本领域普通技术人员所认识的,可以将单独示出的项目组合,并且可以将一些项目分离。
(b)用于组织分类的方法
图10是展示了根据本公开的用于组织分类的方法1002的流程图1000。在一些实施例中,所述方法发生在具有一个或多个处理器1102和存储器1112的计算机系统1100处,所述存储器存储一个或多个程序以供一个或多个处理器1102执行。
(i)用于空间分析的基板
参考框1004,所公开的方法包括获得基板上的切片组织样品的图像。作为说明,图9A示出了基板904上的切片组织样品902的实例,其中根据一些实施例,基板是载玻片。在一些实施例中,基板用于为生物样品,具体地例如薄组织切片提供支撑。在一些实施例中,基板是允许将生物样品、分析物、捕获点和/或捕获探针定位在基板上的支持物。在一些实施例中,基板可以是任何合适的支撑材料,包含但不限于玻璃、经改性和/或功能化玻璃、水凝胶、薄膜、膜、塑料(包含例如丙烯酸树脂、聚苯乙烯、苯乙烯和其它材料的共聚物、聚丙烯、聚乙烯、聚丁烯、聚氨酯、TeflonTM、环状烯烃、聚酰亚胺等)、尼龙、陶瓷、树脂、Zeonor、二氧化硅或基于二氧化硅的材料,包含硅和改性硅、碳、金属、无机玻璃、光纤束和聚合物,如聚苯乙烯、环状烯烃共聚物(COC)、环状烯烃聚合物(COP)、聚丙烯、聚乙烯和聚碳酸酯。在一些实施例中,基板可以被印刷、图案化或以其它方式改性以包括允许在接触生物样品(例如,组织切片)时与分析物缔合的捕获点。基板性质、结构和/或修改的进一步详细实施例在上文具体实施方式中描述(例如,根据II.基于通用空间阵列的分析方法;(c)基板)。
如图9A中的虚线框906所展示的,在一些实施例中,基板包括捕获区域906。捕获区域906包括用于一种或多种反应和/或测定的多个带条形码的捕获点。每个此类反应都涉及对一种或多种组织类型的空间分析。在一些实施例中,基板包括用于多种反应和/或测定1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、超过20个、超过30个、超过40个或超过50个捕获区域906。图9A展示的丝毫单个捕获区域906。相比之下,图12展示了具有六个捕获区域(906-1、906-2、906-3、906-4、906-5和906-6)的基板。
在一些实施例中,基板是包括四个捕获区域906的空间基因表达载玻片(例如,Visium),每个捕获区域的尺寸为6.5mm×6.5mm,使得载玻片包括用于四种反应和至多四种组织类型的容量。在一些实施例中,每个捕获区域906包括5,000个带条形码的捕获点,其中每个捕获点的直径为55μm,并且两个捕获点的中心之间的距离为100μm。参见,10X,2019,“Visium空间基因表达解决方案”,其特此通告引用并入本文。捕获点的另外的具体实施例在本公开的下文中详述。
(ii)用于空间分析的组织样品
再次参考框1004,切片的组织样品从受试者获得。如上文所定义的,在一些实施例中,受试者是哺乳动物,如啮齿动物、小鼠、大鼠、兔子、豚鼠、有蹄动物、马、羊、猪、山羊、牛、猫、狗、灵长类动物(例如,人或非人灵长类动物);植物,如拟南芥、玉米、高粱、燕麦、小麦、稻米、油菜籽或大豆;藻类植物,如莱茵衣藻;线虫,如秀丽隐杆线虫;昆虫,如黑腹果蝇、蚊子、果蝇、蜜蜂或蜘蛛;鱼,如斑马鱼;爬行动物;两栖动物,如青蛙或非洲爪蟾;盘基网柄菌);真菌,如卡氏肺孢子虫)、红鳍东方鲀、酵母、酿酒酵母或粟酒裂殖酵母;或恶性疟原虫。这些实例是非限制性的并且不排除本领域技术人员将想到的任何替代性主题的取代。
在一些实施例中,组织样品从源自任何受试者的任何组织和/或器官获得,包含但不限于上文列出的那些。在一些实施例中,组织样品获得自例如心脏、肾脏、卵巢、乳房、淋巴结、脂肪、大脑、小肠、胃、肝脏、股四头肌、肺、睾丸、甲状腺、眼睛、舌头、大肠、脾脏和/或乳腺、皮肤、肌肉、隔膜、胰腺、膀胱、前列腺等。组织样品可以从健康或不健康的组织(例如,发炎、肿瘤、癌或其它)中获得。组织样品的另外的实例在表1中示出,并且在例如10X,2019,“Visium空间基因表达解决方案”中进行了编目,所述文献特此通过引用并入本文。
表1:组织样品的实例
在一些实施例中,切片的组织是通过组织切片制备的,如上文具体实施方式中所描述(例如,根据I.简介;(d)生物样品;(ii)生物样品的制备;(1)组织切片)。简言之,在一些实施例中,组织的薄片由生物样品制备(例如,使用机械切割设备,如振动刀片切片机,或通过将生物样品的触摸压印施加到合适的基板材料)。在一些实施例中,在切片之前将生物样品冷冻、固定和/或交联,或包裹在基质(例如,树脂或石蜡块)中,以在切片期间保持生物样品的完整性。上文具体实施方式中提供了生物样品制备的进一步实施方案(例如,根据I.简介;(d)生物样品;(ii)生物样品的制备;(2)冷冻,(3)福尔马林固定和石蜡包埋,(4)固定和(5)包埋)。作为实例,参考图3,使用组织切片制备生物样品包括用于空间分析的示例性工作流程的第一步骤301。
参考图10A的框1006,在一些实施例中,所述经切片的组织样品的深度为100微米或更小。在一些实施例中,所述经切片的组织样品的深度为80微米或更小、70微米或更小、60微米或更小、50微米或更小、40微米或更小、30微米或更小或20微米或更小。在一些实施例中,所述经切片的组织样品的深度介于10微米与20微米之间。参见,10X,2019,“Visium空间基因表达解决方案”。在一些实施例中,所述经切片的组织样品的深度介于1与10微米之间。上文具体实施方式中提供了经切片的组织样品的进一步实施方案(例如,根据I.简介;(d)生物样品;(ii)生物样品的制备;(1)组织切片)。在一些实施例中,组织切片的大小和形状与其所在的基板相似。在一些实施例中,组织切片的大小和形状与其所在的基板不同。在一些实施例中,组织切片叠加全部或部分基板。例如,图9A展示了尺寸与基板大致相当的组织切片,使得基板的大部分与组织切片接触。
在一些实施例中,基板上的组织切片是单个均匀切片。在一些替代性实施例中,多个组织切片处于基板上。在一些此类实施例中,基板上的单个捕获区域可以含有多个组织切片,其中每个组织切片从相同的生物样品和/或受试者或从不同的生物样品和/或受试者获得。在一些实施例中,组织切片是包括一个或多个不存在细胞的区域(例如,组织中的孔、撕裂或间隙)的单个组织切片。因此,在如上述等一些实施例中,基板上的组织切片的图像可以含有存在组织的区域和不存在组织的区域。
(iii)空间基板图像采集
再次参考图10A的框1004并且进一步参考图11,图像是以呈电子形式的多个像素1122方式获得的。作为实例,参考图3,在基板上对组织样品和/或阵列进行成像包括用于空间分析的示例性工作流程的第二步骤302。可以获得呈任何电子图像文件格式的图像,包含但不限于JPEG/JFIF、TIFF、Exif、PDF、EPS、GIF、BMP、PNG、PPM、PGM、PBM、PNM、WebP、HDR光栅格式、HEIF、BAT、BPG、DEEP、DRW、ECW、FITS、FLIF、ICO、ILBM、IMG、PAM、PCX、PGF、JPEG XR、分层图像文件格式、PLBM、SGI、SID、CD5、CPT、PSD、PSP、XCF、PDN、CGM、SVG、PostScript、PCT、WMF、EMF、SWF、XAML和/或RAW。
在一些实施例中,获得呈任何电子颜色模式的图像,包含但不限于灰度、位图、索引、RGB、CMYK、HSV、lab颜色、双色调和/或多通道。在一些实施例中,对图像进行操纵(例如,拼接、压缩和/或平整)。在一些实施例中,图像文件大小介于1KB与1MB之间、介于1MB与0.5GB之间、介于0.5GB与5GB之间、介于5GB与10GB或大于10GB。在一些实施例中,图像包括1000个像素1122、10,000个像素1122、100,000个像素1122、一百万个像素1122、三百万个像素1122、五百万个像素1122、六百万个像素1122、七百万个像素1122、八百万个像素1122、九百万个像素1122、一千万个像素1122或更多。
在一些实施例中,图像表示为包括多个像素的阵列(例如,矩阵),使得阵列(例如,矩阵)中的所述多个像素中的每个相应像素的位置对应于其在图像中的原始定位。在一些实施例中,图像表示为包括多个像素的向量,使得向量中的所述多个像素中的每个相应像素包括与其在图像中原始位置相对应的空间信息。
再次参考图10A的框1004并且进一步参考图9A和图11,图像包含在基板的外边界上的多个基准标志物908。基准标志物在上文具体实施方式中更详细的描述(例如,在II.基于通用空间阵列的分析方法;(c)基板和(e)分析物捕获;(v)所关注的区域处)。简言之,在一些实施例中,基准标志物包含在基板904上作为基板的表面上的一个或多个标记。在一些实施例中,基准标志物908用作用于将空间信息与所关注分析物的表征相关联的指南。在一些实施例中,使用以下非限制性技术中的任一种在基板904上制备基准标志物908:玻璃上的铬沉积、金纳米颗粒、激光蚀刻、管书写器-油墨、微球、Epson 802、HP 65Black XL、永久性标志物、荧光寡核苷酸、胺氧化铁纳米颗粒、胺铥掺杂上转换纳米荧光粉和/或胺Cd基量子点。用于基准标志物制备的其它技术包含喷砂、印刷、沉积或基板表面的物理改性。
在一些实施例中,基准标志物908非瞬时附接到基板904的外边界,并且样品在基准标志物的边界内。在一些实施例中,基准标志物瞬时附接到基板的外边界(例如,通过附接衔接子、载玻片支架和/或盖玻片)。在一些实施例中,在样品处于基板上之前或之后,基准标志物会暂时附接到基板的外边界。在一些实施例中,在样品处于基板上之后但在获得图像之前,基准标志物瞬时或非瞬时地附接到基板。
图9A展示了根据一些实施例的基板904上的组织的图像,其中所述图像包含多个基准标志物908。基准标志物沿基板的外边界布置,围绕捕获点阵列和组织叠加层。在一些此类实施例中,基准标志物908包括图案化点的集合(例如,图案910-1、910-2、910-3、910-4),并且图案化点910指示捕获点阵列的特定边缘和角。例如,在一些实施例中,捕获点阵列的每个角具有唯一基准标志物图案(例如,沙漏910-1、菱形910-2、棱锥910-3和圆形910-4)。因此,在一些此类实施例中,在每个角处提供基准标志物的不同图案910,从而允许使用任何朝向(例如,旋转和/或镜像)将图像与空间信息相关联。
在一些实施例中,图像是使用透射光显微术获取的。在一些实施例中,在成像之前使用例如荧光、放射性、化学发光、量热或比色可检测标志物将图像染色。在一些实施例中,使用活/死染色(例如,台盼蓝)将图像染色。在一些实施例中,如上文具体实施方式中所指示对生物样品进行染色(例如,在I.简介;(d)生物样品;(ii)生物样品的制备;(6)染色处)。在一些实施例中,使用光学显微镜(例如,明场、暗场、色散染色、相差、微分干涉对比、干涉反射、荧光、共聚焦、单平面照明、宽场多光子、去卷积、透射电子显微镜和/或扫描电子显微镜)获取图像。在一些实施例中,图像是在对组织切片染色之后但在分析物捕获之前获取的。
参考框1008并且进一步参考图9A,所述方法进一步包括将多个像素中的每个相应像素分配到第一类别或第二类别。第一类别指示基板904上的组织样品902,并且第二类别指示背景(意指基板上无组织样品902)。因此,例如在图9A中,示例区域912内的大多数像素应分配为第一类别,并且示例区域914中的像素应分配为第二类别。在一些实施例中,将每个相应像素分配为组织(第一类别)或背景(第二类别)提供了有关所关注区域的信息,使得可以使用对应于组织而不是背景的捕获点和/或分析物准确地执行对图像的任何后续空间分析。例如,在一些情况下,获得的图像包含成像伪影,包含但不限于碎片、背景染色、组织切片中的孔或间隙和/或空气泡(例如,盖玻片下方和/或组织切片下方,防止组织切片接触捕获阵列)。然后,在一些此类情况下,在所获得的图像中区分对应于组织的像素和对应于背景的像素的能力提高了空间分析的分辨率,例如,通过去除可能影响或模糊下游分析的背景信号,因此将对多个捕获探针和/或分析物的分析限制为对应于所关注区域(例如,组织)的捕获探针和/或分析物的子集。参见,Uchida,2013,“生物图像的图像处理和识别”,《发育、成长与分化》55,523-549,doi:10.1111/dgd.12054,所述文献特此以全文引用的方式并入本文中,用于生物图像处理应用的进一步实施例。
在一些实施例中,未被分类为组织的图像区域被分类为孔或物体(例如,碎片、毛发、结晶污渍颗粒和/或空气泡)。在一些此类实施例中,使用阈值大小定义图像中的小孔和/或物体。在一些实施例中,阈值大小是图像的最大长度(例如,最长边长)除以二(例如,以像素、英寸、厘米、毫米和/或任意单位为单位),在此阈值下,任何封闭的形状都被视为孔或物体。在一些实施例中,阈值大小是图像的最大长度除以N,其中N是大于或等于1的任何正值。在一些实施例中,在将图像中的像素分配到第一类别或第二类别期间,从图像中去除(例如,“填充”)小孔和物体,使得将图像的与组织相对应的整体区域表示为连续区域,并且图像的与背景相对应的整体区域表示为连续区域。在一些实施例中,在将图像中的像素分配到第一类别或第二类别期间,图像中保留了小孔和物体,使得图像的与组织相对应的一个或多个区域不包含小孔和物体,并且图像的与背景相对应的一个或多个区域包含小孔和物体。
在一些实施例中,使用算法(例如,使用包含但不限于Python、R、C、C++、Java和/或Perl的编程语言),例如由分类模块1120实施的算法执行将每个相应像素分配为组织或背景。
(iv)使用基准标志物定义边界框
参考图10A的框1010并且进一步参考图9A,将多个像素中的每个相应像素1122分配到第一类别或第二类别包括使用多个基准标志物908来定义图像内的边界框。在一些实施例中,边界框906的厚度为1、2、3、4、5、6、7、8、9或10个像素。在一些实施例中,边界框906的厚度为超过10个、超过20个、超过30个、超过40个、超过50个像素。在一些实施例中,边界框906的形状与原始图像的形状相同或不同(例如,矩形、正方形、圆形、长方形或N边形,其中N是介于1与20之间的值)。在一些实施例中,边界框906具有彩色或单色(例如,白色、黑色、灰色)。在一些实施例中,边界框906是蓝色的。
在一些实施例中,边界框906被定义在与多个基准标志物(例如,基准帧)相同的定位中(例如,在其顶部上)。在一些实施例中,边界框906被定义在基准帧的边界之内或内部。在一些此类实施例中,边界框906被定义为基准帧的边界内部的阈值距离(例如,1、2、3、4、5、6、7、8、9或10个像素,或超过10个、超过20个、超过30个、超过40个、超过50个或超过100个像素)。在一些实施例中,边界框906是通过用户输入定义的(例如,所关注区域周围的绘制框)。在一些实施例中,边界框906使用定位于基准帧的至少两个相对角上的两个、三个或四个基准标志物来定义。
在一些实施例中,边界框906是使用在获得图像之前存在于基板904上的基准标志物来定义的。在一些实施例中,边界框906是使用获得图像之后添加到图像的基准标志物908定义的(例如,通过用户输入或一个或多个启发式函数)。在一些实施例中,使用多个基准标志物作为指导,执行基准对准以将所获得的图像与预定义的空间模板对准。在一些此类实施例中,将所获得的图像中的多个基准标志物与空间模板中对应的多个基准标志物对准。在一些实施例中,空间模板包括在空间模板中具有已知定位的另外的元素(例如,具有相对于基准标志物的已知定位的捕获点)。在一些实施例中,在定义边界框之前(例如,在将每个像素分配到第一类别或第二类别之前)执行基准对准。在一些实施例中,在定义边界框之前不执行基准对准。
在一些实施例中,边界框由获得的图像的边缘(例如,图像的尺寸)和/或用于获得图像的显微镜的视场(例如,范围)定义。在一些实施例中,边界框定义为所获得的图像的边界处的相邻边缘。在一些实施例中,边界框被定义为所获得的图像的边界内部的阈值距离(例如,图像的边界内部的1、2、3、4、5、6、7、8、9或10个像素,或超过10个、超过20个、超过30个、超过40个、超过50个或超过100个像素)。在一些实施例中,边界框被定义为对应于边界框的四个角中的每个角的一组坐标(,x-y坐标)(例如,[0+设定的距离,0+设定的距离],[Wimage–设定的距离,0+设定的距离]、[0+设定的距离,Himage–设定的距离]、[Wimage–设定的距离,Himage–设定的距离],其中Wimage和Himage分别为所获得的图像的宽和高度尺寸,并且设定的距离为所获得的图像的边界内部的阈值距离)。在一些实施例中,阈值距离是预定义的(例如,通过默认和/或用户输入)或启发式确定的。
在一些实施例中,边界框是轴对准的。在一些实施例中,边界框以所获得的图像的中心为中心和/或以基准标志物所包围的区域的中心为中心。在一些实施例中,边界框不是轴对准的和/或不是以所获得的图像的中心或由基准标志物包围的区域为中心的。在一些实施例中,边界框的每个边缘与所获得的图像和/或基准帧的相应边缘之间的阈值距离对于每个相应边缘都是相同的。在一些实施例中,边界框的每个边缘与所获得的图像和/或基准帧的相应边缘之间的距离对于一个或多个边缘是不同的。在一些实施例中,边界框在所获得的图像上旋转,以实现边界框与所获得的图像不同的对准。
在一些实施例中,没有定义边界框,并且将多个像素中的每个相应像素分配到第一类别或第二类别是使用所获得的图像的整体来进行的。在一些此类实施例中,边界框被定义为“无”。
参考框1012,将所述多个像素中的每个相应像素分配到第一类别或第二类别进一步包括从所述多个像素中去除落在边界框906之外的相应像素。因此,在一些实施例中,用于组织分类的方法仅考虑边界框906内部的像素。在一些实施例中,通过从所获得的图像创建新图像来执行对落在边界框906之外的像素的去除,所述新图像仅包括来自所获得的图像的落在边界框内的相应像素。在一些实施例中,边界框被定义为在基准帧内部,并且从多个像素中去除像素(例如,以形成图像916)包含从所获得的图像中去除基准标志物。在一些实施例中,没有定义边界框并且没有从多个像素中去除像素。
(v)启发式分类器在组织切片图像中的应用
参考框1014,将多个像素中的每个相应像素分配到第一类别或第二类别进一步包括在框1012中去除之后,在所述多个像素(例如,在灰度空间中)上运行多个启发式分类器。对于多个像素中的每个相应像素1122,多个启发式分类器中的每个相应启发式分类器对第一类别与第二类别之间的相应像素1122进行投票1136。因此,每个像素1122具有一系列投票(例如,1136-1-1、…、1136-1-N),每个投票来自每个启发式分类器。通过对给定像素的投票求和,为给定像素形成聚合分数1134。因此,针对来自单独启发式分类器投票的多个像素中的每个相应像素1122形成对应聚合分数1134。在一些实施例中,每个相应像素的对应聚合分数用于将聚合分数转换为一组类别中的类别。在一些实施例中,此一组类别包括明显的第一类别、可能的第一类别、可能的第二类别和明显的第二类别。
在一些实施例中,像素1122包括一个或多个像素值(例如,强度值1124)。在一些实施例中,所述多个像素中的每个相应像素包括一个像素强度值1124,使得所述多个像素表示包括一维整数向量的单通道图像,所述一维整数向量包括每个相应像素的相应像素值。例如,8位单通道图像(例如,灰度)可以包括28或256个不同的像素值(例如,0-255)。在一些实施例中,图像的多个像素中的每个相应像素1122包括多个像素值,使得多个像素表示包括多维整数向量的多通道图像,其中每个向量元素表示每个相应像素的多个像素值。例如,24位3通道图像(例如,RGB颜色)可以包括224(例如,28x3)个不同的像素值,其中每个向量元素包括3个分量,每个分量在0到255之间。在一些实施例中,n位图像包括至多2n个不同像素值,其中n是任何正整数。参见,Uchida,2013,“生物图像的图像处理和识别”,《发育、成长与分化》55,523-549,doi:10.1111/dgd.12054,所述文献特此以全文引用的方式并入本文中。
在一些实施例中,通过获得灰度图像(例如,单通道图像)或通过获得彩色图像(例如,多通道图像)并且在获得启发式分类器之后和运行所述启发式分类器之前将图像转换为灰度,多个像素处于或转换为灰度空间。在一些实施例中,灰度空间中的多个像素中的每个相应像素1122具有介于0与255之间的整数值(例如,8位无符号整数值或“uint8”)。在一些实施例中,灰度空间中的多个像素中的每个相应像素的整数值使用例如加法、减法、乘法或除以值N来变换,其中N是任何实数。例如,在一些实施例中,灰度空间中的多个像素中的每个相应像素具有介于0与255之间的整数值,并且每个相应像素的每个整数值除以255,从而提供介于0与1之间的整数值。在一些实施例中,图像的多个像素处于灰度空间中,并且使用对比度增强或色调曲线对准进行变换。在一些实施例中,对多个像素运行多个启发式分类器包括在灰度空间中旋转、变换、调整大小或裁剪所获得的图像。
在一些实施例中,多个启发式分类器包括核心组织检测功能,并且多个启发式分类器包括1个或更多个、2个或更多个、3个或更多个、4个或更多个、5个或更多个、6个或更多个、7个或更多个、8个或更多个、9个或更多个或10个或更多个启发式分类器。在一些实施例中,核心组织检测功能对组织在基板上的位置进行初步预测。
参考框1016,在一些实施例中,所述多个启发式分类器包括第一启发式分类器,所述第一启发式分类器标识将所述多个像素分为所述第一类别和所述第二类别的单个强度阈值。所述第一启发式分类器然后对所述第一类别或所述第二类别的所述多个像素中的每个相应像素进行投票。所述单个强度阈值表示所述第一类别与所述第二类别之间的类内强度方差的最小化或所述第一类别与所述第二类别之间的类间方差的最大化。
在一些实施例中,单个强度阈值是使用Otsu方法确定的,其中第一启发式分类器标识使类内方差最小化或等效地使类间方差最大化的阈值。在一些此类实施例中,Otsu方法使用判别分析来确定强度阈值,使得多个像素中的像素合并子集尽可能清晰地分开。取决于相应像素的相应强度值是落在强度阈值之上还是之下,将多个像素中的每个相应像素合并或分组成不同的类别。例如,在一些实施例中,仓被表示为直方图,并且强度阈值被标识使得直方图可以被假定为具有双峰分布(例如,两个峰)和峰之间的明显区别(例如,谷)。
在一些此类实施例中,对所获得的图像中的多个像素进行过滤,使得将包括高于强度阈值的像素强度的像素视为前景并转换为白色(例如,uint8值为1),同时将包括低于强度阈值的像素强度的像素视为背景并转换为黑色(例如,uint8值为0)。使用Otsu方法的启发式分类器的结果的实例如图9C所展示,所述图描绘了在转换所获取的图像之后的阈值图像918(例如,掩模或层),其中多个像素中的每个像素1122表示为白色或黑色像素。在这里,Otsu方法是使用全局阈值的二值化方法的实例。在一些实施例中,当两个类别(例如,前景和背景)的方差小于所获得图像整体的平均方差时,Otsu方法是稳健的。
在一些实施例中,第一启发式分类器使用Otsu全局阈值方法,并且第一启发式分类器的运行之后是从阈值图像(例如,掩模)中去除小孔和物体。在一些此类实施例中,第一启发式分类器提供了更一致的二元结果,而掩模中没有小扰动。在一些实施例中,小孔和物体不会从掩模中去除,使得可以将小孔和物体与组织区分开来。
在一些实施例中,第一启发式分类器是不同于Otsu方法的二值化方法。在一些此类实施例中,第一启发式分类器是除Otsu方法之外的全局阈值方法或基于优化的二值化方法。在一些此类实施例中,通过手动确定强度阈值(例如,通过默认或用户输入)来执行全局阈值方法。例如,可以在灰度范围的中间值(例如,0到255之间的128)处确定强度阈值。
在一些实施例中,使用灰度像素值的直方图(例如,使用模式方法和/或P片方法(P-tile method))自动确定强度阈值。例如,使用模式方法,灰度像素值的直方图可以包含多个仓(例如,对于每个可能的灰度像素值0-255,至多256个仓),并且每个相应仓填充有具有相应灰度像素值的每个相应像素。在一些实施例中,多个仓具有双峰分布,并且强度阈值是直方图达到最小值(例如,在谷底)处的灰度像素值。使用P片方法,灰度像素值直方图中的每个相应仓填充有具有相应灰度像素值的每个相应像素,并且为从最高灰度像素值到最低灰度像素值的每个仓计算像素的累积计数。给定高于强度阈值的像素P的预定义数量,阈值在像素的累积总和超过P的仓值处确定。
在一些实施例中,通过估计背景噪声的水平来确定强度阈值(例如,在成像装置中,包含但不限于荧光显微镜)。背景噪声可以在归一化和预处理期间使用对照样品和/或未经染色的样品来确定。
在一些实施例中,例如,当使用基于优化的二值化时,通过计算转换像素值与原始像素值的相对接近度以及相应像素的转换像素值与相邻像素的转换像素值的相对接近度(例如,使用马尔可夫随机场)来确定将相应像素分配到两个类别之一(例如,转换为黑色或白色)。因此,基于优化的方法包括平滑滤波器,所述滤波器减少黑色和/或白色的小点状区域的出现,并且确保局部邻域在二值化之后表现出相对一致的结果。参见,Uchida,2013,“生物图像的图像处理和识别”,《发育、成长与分化》55,523-549,doi:10.1111/dgd.12054,所述文献特此以全文引用的方式并入本文中。
参考框1018,在一些实施例中,所述多个启发式分类器包括第二启发式分类器,所述第二启发式分类器标识具有使用所述第一启发式方法标识的相同类别的像素的局部邻域。第二启发式分类器对局部邻域中的像素之间的最大强度差异应用平滑量度。所述第二启发式分类器因此对所述第一类别或所述第二类别的所述多个像素中的每个相应像素进行投票。
在一些实施例中,像素的局部邻域由包括固定长度半径(例如,1、2、3、4、5、6、7、8、9或10个像素)的圆盘表示。在一些实施例中,圆盘的半径介于10与50个像素之间、50与100个像素之间、100与200个像素之间或超过200个像素。在一些实施例中,圆盘用于确定局部强度梯度,其中局部强度梯度是通过从局部最大像素强度值(例如,来自圆盘内的像素子集)中减去局部最小像素强度值(例如,来自圆盘内的像素子集)来确定的,从而为圆盘内的像素子集中的每个像素给出值,即局部邻域内的像素强度的差异。在一些此类实施例中,高局部强度梯度指示组织,而低局部强度梯度指示背景。
图9E展示了所获得的图像的掩模922,其中所获得的图像中的多个像素中的每个像素1122作为局部强度值的差异的灰度值。与上文所描述的全局阈值方法(例如,Otsu方法)不同,局部强度梯度是粒度而不是强度的量度。例如,虽然全局阈值方法将相对“亮”的像素子集与相对“暗”的像素子集区分开来,但局部强度梯度将具有交替明亮和黑暗(例如,纹理)图案的区域与具有相对恒定强度(例如,平滑度)的区域区分开来。因此,局部强度梯度方法在图像包括纹理组织和中等分辨率的一些情况下,和/或在全局阈值技术由于各种限制而无法区分类别的情况下是稳健的。在一些实施例中,这些包含与背景大小相比小的前景大小、前景强度与背景强度之间的小平均差异、高类内方差(例如,前景和/或背景区域内的曝光不一致或高对比度)和/或背景噪声(例如,由于点状染色、点状荧光或其它由过度染色、过度曝光、染料残留和/或碎片导致的强烈色素沉着区域)。
在一些实施例中,第一或第二启发式分类器包括用于通过过滤像素强度值的差异来最小化或减少局部邻域中的相应像素1122之间的噪声的平滑方法。在一些实施例中,在灰度空间中的多个像素中执行平滑。在一些实施例中,适用的平滑方法包含但不限于模糊滤波器、中值滤波器和/或双边滤波器。例如,在一些实施例中,模糊滤波器通过将每个相应像素1122处的像素强度值1124用相应像素1122周围的局部邻域的平均强度值替代来最小化局部邻域内的差异。在一些实施例中,中值滤波器利用类似的方法,但将每个相应像素处的像素强度值1124用相应像素1122周围的局部邻域的中值像素值替代。然而,在一些实施例中,模糊滤波器和中值滤波器使图像掩模表现出“模糊”边缘,在一些替代性实施例中,双边滤波器通过确定局部邻域中的像素1122之间的强度差异并降低(例如,在边缘)观察到很大差异的区域中的平滑效果来保留边缘。参见,Uchida,2013,“生物图像的图像处理和识别”,《发育、成长与分化》55,523-549,doi:10.1111/dgd.12054,所述文献特此以全文引用的方式并入本文中。
因此,在一些实施例中,第二启发式分类器包括用于具有固定长度半径的圆盘的局部强度梯度滤波器,所述局部强度梯度滤波器还用作所获得的图像中的多个像素1122的平滑滤波器。局部区域的大小定义了平滑度,使得增加圆盘的半径会增加平滑效果,而减小圆盘的半径会增加分类器的分辨率。
在一些实施例中,全局阈值方法进一步应用于图像掩模,所述图像掩模包括表示为灰度像素值阵列(例如,矩阵)的局部强度梯度滤波器的结果。在一些此类实施例中,使用Otsu方法将局部强度梯度阵列二值化为两个类别,使得多个像素中的每个像素都转换为白色或黑色像素(例如,分别具有1或0的像素值),分别表示前景或背景。图9F展示了使用Otsu方法将像素表征为第一类别和第二类别的实例924,所述方法应用于来自所获得的图像的局部强度梯度滤波器,使得二值化应用于高粒度和低粒度区域,而不是高像素强度和低像素强度区域。这提供了一种用于在全局阈值方法上对前景区域和背景区域进行分类的替代性方法。
在一些实施例中,如先前所描述的,可以通过去除小孔和物体来进一步处理二值化局部强度梯度。在一些实施例中,小孔和物体不会从二值化局部强度梯度阵列中去除。在一些实施例中,将局部强度梯度滤波器应用于使用Otsu方法产生的阈值图像。在一些实施例中,将多个启发式分类器顺序地应用于所获得的图像,使得第二启发式分类器应用于由第一启发式分类器产生的掩模,并且第三启发式分类器应用于由第二启发式分类器产生的掩模。在一些替代性实施例中,将多个启发式分类器应用于所获得的图像,使得每个相应启发式分类器独立地应用于所获得的图像并且将独立的结果组合。在一些实施例中,使用顺序和独立应用的启发式分类器的组合将多个启发式分类器应用于所获得的图像。
在一些实施例中,第二启发式分类器是二维Otsu方法,在一些情况下,所述方法为具有高背景噪声的图像提供更好的图像分割。在二维Otsu方法中,将相应像素1122的灰度强度值与局部邻域的平均强度进行比较。不是在整个图像上确定全局强度阈值,而是为围绕相应像素1122的固定距离半径内的局部邻域计算平均强度值,并且每对强度值(例如,在局部邻域上平均的值和相应像素1122的值)被装仓到离散数量的仓中。局部邻域和相应像素1122的每对平均强度值的实例数量除以多个像素中的像素数量,确定2维直方图中的联合概率质量函数。在一些实施例中,局部邻域由包括固定长度的半径的圆盘定义(例如,1、2、3、4、5、6、7、8、9或10个像素1122、10到50个像素1122、50到100个像素1122、100到200个像素1122或超过200个像素1122)。
参考框1020,在一些实施例中,所述多个启发式分类器包括第三启发式分类器,所述第三启发式分类器对所述多个像素进行边缘检测以形成所述图像中的多个边缘并且在形态上闭合所述多个边缘以形成所述图像中的多个在形态上闭合的区域。然后第三启发式分类器将在形态上闭合的区域中的像素1122分配到第一类别,将在形态上闭合的区域之外的像素1122分配到第二类别,由此使所述第三启发式分类器对第一类别或第二类别的多个像素中的每个相应像素1122进行投票。
在一些实施例中,Canny边缘检测算法用于检测灰度图像上的边缘。在一些此类实施例中,使用卷积算法标识边缘,所述卷积算法标识阵列(例如,图像或掩模)中的多个像素中的每个相应像素1122的像素强度值1124,并且将两个或更多个像素与边缘检测滤波器(例如,表示像素强度的阈值差异的框算子)进行比较。因此,边缘被定义为像素强度差异很大的一组像素。通过计算相邻像素强度值的一阶或二阶导数来确定对边缘的标识。在一些实施例中,Canny边缘检测算法产生二值图像,其中将特定的第一分配颜色值(例如,白色)应用于表示边缘的像素,而不是边缘的一部分的像素被分配第二颜色值(例如,黑色)。参见,Canny,1986,“用于边缘检测的计算方法”,《IEEE模式分析和机器智能汇刊(IEEE TransPattern Anal Mach Intell.)》8(6):679-98。图9B展示了包括对所获得的图像的Canny边缘检测算法的输出的图像掩模916。
在一些实施例中,使用除Canny边缘检测算法之外的边缘检测滤波器执行边缘检测,包含但不限于拉普拉斯算符(Laplacian)、Canny、索贝尔(Sobel)、Canny-Deriche、LogGabor和/或马尔-希尔德雷斯(Marr-Hildreth)。在一些实施例中,在应用边缘检测滤波器以抑制背景噪声之前应用平滑滤波器。
在一些实施例中,将多个边缘中的边缘闭合以形成多个在形态上闭合的区域。在一些实施例中,对多个像素(例如,在灰度空间中)执行形态闭合。在一些实施例中,形态闭合包括扩张然后腐蚀。在一些实施例中,形态上闭合的区域中的多个像素表示为1和0的阵列,其中分配到第一类别的像素表示为1(例如,闭合区域),并且分配到第二类别的像素表示为0(例如,未闭合区域)。在一些实施例中,1和0的阵列包括图像的掩模,所述掩模存储边缘检测和随后的形态闭合的结果。图9D展示了图像掩模920,其中闭合区域是通过在形态上闭合使用Canny边缘检测算法标识的多个边缘来形成的,如图9B中所描绘。闭合区域和非闭合区域包括多个像素,所述多个像素分别表示为像素值1和0,并且分别可视化为例如白色和黑色像素。
在一些实施例中,所述多个启发式分类器包括上文所描述的一个或多个启发式分类器或其任何组合。这些实施例是非限制性的并且不排除取代任何替代性启发式分类器用于图像操纵、变换、二值化、过滤和分割,这对于本领域技术人员来说是显而易见的。
参考框1022,在一些实施例中,所述多个启发式分类器由第一发式分类器、第二发式分类器和第三启发式分类器组成,将所述多个分类器中的所述启发式分类器中的每个启发式分类器分配到第二类别的每个相应像素1122标记为明显的第二类别,并且由所述多个启发式分类器中的每个启发式分类器分配为第一类别的每个相应像素1122被标记为明显的第一类别。例如,在一些此类实施例中,多个启发式分类器由第一启发式分类器、第二启发式分类器和第三启发式分类器组成,并且每个相应分类器为第一类别或第二类别(例如,分别为组织或背景)的多个像素中的每个相应像素1122投票1136。在一些此类实施例中,聚合多个投票,并且聚合分数1134确定相应像素1122是否被分类为明显的第一类别、可能的第一类别、可能的第二类别或明显的第二类别。在一些实施例中,对于灰度空间中的多个像素中的每个相应像素1122,对第一类别(例如,前景和/或组织)的每个相应投票1136是1,并且对第二类别(例如,背景)的每个相应投票1136是0。因此,例如,聚合分数1134为0表示三票支持背景,聚合分数为1表示一票支持组织,并且两票支持背景,聚合分数为2表示两票支持组织,和一票支持背景,并且聚合分数为3指示三票支持组织。图9G展示了表示多个启发式分类器的总和的图像掩模926,其中每个聚合分数1134表示为包括0、1、2和3的一组四个唯一类别中的一个。在一些实施例中,使用形态检测算法(例如,用Python)使用聚合分数的图像掩模检测小孔和物体。
在一些实施例中,基于接收到的启发式分类器投票1136的数量和/或类型,将多个像素中的相应像素1122分类为明显的第一类别、可能的第一类别、可能的第二类别或明显的第二类别。例如,在一些实施例中,对于背景接收三票1136的相应像素1122被分类为明显背景,并且对于组织获得一票1136的相应像素1122被分类为可能的背景。在一些替代性实施例中,对组织接收一票1136的相应像素1122被分类为可能的组织,而对组织接收两票或更多票1136的相应像素1122被归类为明显的组织。
在一些实施例中,被至少一个启发式分类器分类为孔或物体的相应像素1122被分类为可能的背景(例如,以确保被组织包围的未覆盖区域的“孔”用非“明显”标记初始化)。在一些实施例中,将基于至少两个启发式分类器投票1136分类为明显的组织的所获得图像的区域(所述区域中的像素数量)在大小上(例如,检测到的区域的边界向内调整大小)减小第一固定长度边距。在一些实施例中,第一固定长度边距为1、2、3、4、5、6、7、8、9、10或超过10个像素1122。在一些实施例中,第一固定长度边距为所获得的图像的边长的百分比。在一些实施例中,第一固定边距在所获得的图像的最长边的长度的0.5%与10%之间。在一些实施例中,将基于至少三个启发式分类器投票被分类为明显的组织的所获得图像的区域在大小上减小第二固定长度边距,所述第二固定长度边距小于第一固定长度边距。在一些实施例中,第二固定长度边距的长度是第一固定长度边距的长度的一半。
在一些实施例中,相应启发式分类器在聚合分数中被赋予优先级和/或更大的权重。例如,在一些实施例中,第一启发式分类器是通过Otsu方法进行的全局阈值化。在一些此类实施例中,被至少一个其它启发式分类器分类为组织并且没有被分类为孔或物体的所获得的图像的区域如果未被第一启发式分类器分类为组织(例如,Otsu方法),则仍将其分类为可能的背景。在一些实施例中,取决于应用相应的启发式分类器的顺序(例如,第一、第二或第三)或取决于应用的分类器的类型(例如,Otsu方法),多个启发式分类器中的相应启发式分类器在聚合分数中被赋予优先级和/或更大的权重。在一些实施例中,多个启发式分类器中的每个相应启发式分类器在聚合分数中被赋予相等的权重。
在一些实施例中,由来自多个启发式分类器的多个投票1136形成的聚合分数1134是第一类别的投票占总投票数量的百分比。在一些此类实施例中,包括明显的第一类别、可能的第一类别、可能的第二类别和明显的第二类别的一组类别中的每个类别对应于第一类别的投票占总投票数量的百分比。在一些替代性实施例中,包括明显的第一类别、可能的第一类别、可能的第二类别和明显的第二类别的一组类别中的每个类别对应于来自多个启发式分类器的多个投票中高于阈值投票数量的投票数量。在一些实施例中,预先定义了特定的“真值表”(例如,通过默认值或用户输入),为每个相应聚合分数给出相应的类别分配。
在一些实施例中,没有通过任何先前方法分配类别的相应像素1122被分类为可能的背景。
在一些实施例中,基于聚合分数将多个像素中的每个相应像素1122分类到包括明显的第一类别、可能的第一类别、可能的第二类别和明显的第二类别的一组类别中的类别产生单独的阵列(例如,图像掩模),其中阵列中的每个像素1122包括对应于一组类别中的分配的类别的相应单独值或属性。图9H展示了图像掩模928,其中每个像素1122由对应于明显的第一类别、可能的第一类别、可能的第二类别和明显的第二类别的属性表示。值得注意的是,图9G和图9H中的图像掩模的不同之处在于图9G中的图像掩模926表示来自多个启发式分类器的多个投票的原始聚合,而图9H中的图像掩模928表示基于聚合分数1134对每个相应像素1122的后续分类。如上文所描述的,在一些实施例中,基于聚合分数1134对相应像素1122的分类不仅取决于多个投票1136的原始总和,而且在一些情况下,取决于多个启发式分类器中的相应启发式分类器的顺序和/或重要性。因此,根据一些实施例,图9G和图9H中描绘的图像掩模相似但不同。
在一些实施例中,出于质量控制目的产生图像掩模(例如,以向用户或从业者提供分类结果的视觉确认)。在一些实施例中,以灰度或多光谱颜色(例如,RGB、24位RGB和/或float64位RGB)产生图像掩模。在一些实施例中,出于比较和/或质量控制的目的,将图像掩模重新包埋在原始获得的图像上。在一些实施例中,将在任何阶段和/或在任何数量的一个或多个启发式分类器之后产生的图像掩模重新包埋在原始获得的图像上,并且重新包埋包括将裁剪的图像掩模旋转、调整大小、变换或叠加到原始获得的图像上。
在一些实施例中,通过将多个像素中的每个相应像素1122分类到一组类别中的类别而产生的图像掩模928,如图9H的实例中所描绘,被用作用于下游图像分割的标志物(例如,GrabCut标志物)。在一些实施例中,用于下游图像分割的标志物的图像掩模在将多个启发式分类器应用于所获得的图像之前产生,并且在应用多个启发式分类器中的每个相应启发式分类器之后基于多个启发式分类器的聚合分数迭代地构造和重构。因此,在一些实施例中,在一些情况下,像素1122被分配第一分类,在应用后续的启发式分类器之后,所述分类变为第二分类。
在一些实施例中,多个启发式分类器包括提供对组织放置的初始估计的核心组织检测功能,并且这些估计被组合成初始化预测,所述初始化预测被传递给随后的分割算法。
(vi)图像分割
参考框1024,用于组织分类的方法进一步包括将所述多个像素中的每个相应像素1122的聚合分数1134和强度1124应用于图形切割分割算法,以独立地为所述多个像素中的每个相应像素分配作为组织样品或背景的概率。
图形切割基于初始T={TB,TU,TF}执行单色图像的分割,其中TB指示背景区域,TF指示前景区域,并且TU指示未知区域。所述图像表示为阵列z=(z1,…,zn,…,zN),所述阵列包括多个N个像素中的相应像素n的灰度像素值。与在贝叶斯抠图模型中一样,图形切割分割算法尝试通过创建将多个像素中的每个相应像素的前景和背景比例反映为介于0与1之间的α值的α抠图来计算TB和TF的TU给定输入区域的α值,其中0指示背景,并且1指示前景。在一些实施例中,通过变换灰度像素值来计算α值(例如,对于介于0与255之间的8位单通道像素值,像素值除以255)。图形切割是一种如上文所描述的基于优化的二值化技术,即使在前景和背景像素强度分离不佳时,它也使用多项式阶计算来实现稳健的分割。参见,Rother等人,2004,“‘GrabCut’——使用迭代图形切割的交互式前景提取”,《美国计算机协会图形协会报》23(3):309-314,doi:10.1145/1186562.1015720,所述文献特此以全文引用的方式并入本文中。还参见,Boykov和Jolly,2001,“用于N-D图像中的物体的最佳边界和区域分割的交互式图形切割(Interactive graph cuts for optimal boundary and regionsegmentation of objects in N-D images)”,《IEEE国际计算机视觉会议学报(Proc.IEEEInt.Conf.on Computer Vision)》,CD-ROM,以及Greig等人,1989,“二值图像的精确MAP估计(Exact MAP estimation for binary images)”,《皇家统计学会杂志系列B-统计方法(J.Roy.Stat.Soc.B.)》51,271-279,有关图形切割分割算法的详细信息;以及Chuang等人,2001,“用于数字抠图的贝叶斯方法(ABayesian approach to digital matting)”,《IEEE国际计算机视觉与模式识别会议学报(Proc.IEEE Conf.Computer Vision and PatternRecog.)》,CD-ROM,有关贝叶斯抠图模型和α抠图的详细信息,所述文献中的每个文献特此以全文引用的方式并入本文中。
在一些实施例中,三元图是用户指定的。在一些实施例中,使用多个启发式分类器作为初始组织检测函数来初始化三元图。在一些此类实施例中,将包括明显的第一类别、可能的第一类别、可能的第二类别和明显的第二类别的一组类别作为包括TF={明显的第一类别}(例如,明显的前景)、TB={明显的第二类别}(例如,明显的背景),并且TU={可能的第一类别,可能的第二类别}(例如,可能的前景和可能的背景的连接)的三元图提供给图形切割分割算法。在一些实施例中,TF={明显的第一类别,可能的第一类别}(例如,明显的前景和可能的前景),TB={明显的第二类别,可能的第二类别}(例如,明显的背景和可能的背景),并且TU是所获得的图像中的多个像素中的任何未经分类的像素。在一些实施例中,使用作为上述实施方案的组合或取代的替代三元图将一组类别提供给图形切割分割算法,这对于本领域技术人员来说是显而易见的。
参考框1026,在一些实施例中,图形切割分割算法是GrabCut分割算法。GrabCut分割算法基于图形切割分割算法,但包含迭代估计和不完整标记功能,限制所需的用户输入水平,并且利用用于边界抠图的α计算方法来减少可见伪影。此外,GrabCut使用软分割方法而不是硬分割方法。与图形切割分割算法不同,GrabCut使用高斯混合模型(GMM)而不是标记的三元图像素的直方图,其中用于背景的GMM和用于前景的GMM是具有K个分量的全协方差高斯混合。为了使GMM成为易于处理的计算,将唯一GMM分量分配到来自背景或前景模型(例如,0或1)的多个像素中的每个像素。参见,Rother等人,2004,“‘GrabCut’——使用迭代图形切割的交互式前景提取”,《美国计算机协会图形协会报》23(3):309-314,doi:10.1145/1186562.1015720,所述文献特此以全文引用的方式并入本文中。
在一些实施例中,GrabCut分割算法可以在多光谱、多通道图像(例如,3通道图像)或单通道图像上运行。在一些实施例中,为分割算法提供灰度图像。在一些实施例中,在输入到分割算法中之前,首先将灰度图像转换为多光谱、多通道图像(例如,RGB、HSV、CMYK)。在一些实施例中,多光谱、多通道彩色图像直接应用于分割算法。
在一些实施例中,将GrabCut分割算法作为卷积方法应用于图像,使得首先将局部邻域分配到分类(例如,前景或背景),并且然后将分配应用于更大的区域。在一些实施例中,使用从多个启发式分类器获得的初始化标记,将包括多个像素的图像作为彩色图像提供给GrabCut算法,并且GrabCut算法的分类输出用于下游空间分析(例如,在带条形码的捕获点上)。在一些实施例中,分配有组织或背景的概率更大的多个像素用于产生单独的构造(例如,矩阵、阵列、列表或向量),其指示多个像素中的组织的位置和背景的位置。例如,图9I展示了在给定基于如图9H所展示的GrabCut标志物的输入三元图的情况下,对于图9A的所获得的图像的GrabCut算法产生的图像掩模。GrabCut分割算法执行对组织和背景的标识,这从组织切片叠加与背景区域的清晰隔离中可以看出。
在一些实施例中,将多个像素中的每个相应像素的聚合分数和强度应用于除图形切割分割算法或GrabCut分割算法之外的分割算法,包含但不限于魔术棒、智能剪刀、贝叶斯抠图、敲除2、水平集、二值化、背景减法、分水岭法、区域增长、聚类、活动轮廓模型(例如,SNAKES)、基于模板匹配和识别的方法、马尔可夫随机场。在一些实施例中,将多个像素中的每个相应像素的聚合分数和强度应用于特征提取算法(例如,直觉和/或启发式、梯度分析、频率分析、直方图分析、到经训练的低维子空间的线性投影、结构表示和/或与另一个图像进行比较)。在一些实施例中,将多个像素中的每个相应像素的聚合分数和强度应用于图案分类方法,包含但不限于最近邻分类器、判别函数方法(例如,贝叶斯分类器、线性分类器、分段线性分类器、二次分类器、支持向量机、多层感知/神经网络、投票)和/或分类器集成方法(例如,增强、决策树/随机森林)。参见,Rother等人,2004,“‘GrabCut’——使用迭代图形切割的交互式前景提取”,《美国计算机协会图形协会报》23(3):309-314,doi:10.1145/1186562.1015720和Uchida,2013,“生物图像的图像处理和识别”,《发育、成长与分化》55,523-549,doi:10.1111/dgd.12054,所述文献中的每个文献特此以全文引用的方式并入本文中。
(vii)应用组织检测以进行空间分析
参考框1028,在一些实施例中,所述方法进一步包括将组织掩模叠加在所述图像上,其中所述组织掩模使所述图像的所述多个像素中的已经被分配作为组织的概率更大的每个相应像素被分配第一属性并且所述多个像素中的已经被分配作为背景的概率更大的每个相应像素被分配第二属性。
在一些实施例中,将第一属性或第二属性分配到相应像素需要相应像素的阈值,使得高于或低于阈值的像素值分别被分配为作为组织的概率更大或作为背景的概率更大(例如,介于0与1之间的像素值,或介于0与255之间的像素值)。在一些实施例中,作为组织的概率更大或作为背景的概率更大是基于对应于作为明显的第一类别和/或可能的第一类别或明显的第二类别和/或可能的第二类别的一组类别中的类别的聚合分数分配的。在一些实施例中,使用图像分割算法确定作为组织的概率更大或作为背景的概率更大,所述图像分割算法将分类应用于所获得的图像中的多个像素中的每个相应像素。
参考框1030,在一些此类实施例中,第一属性是第一颜色,并且第二属性是第二颜色。参考框1032,在一些此类实施例中,第一颜色是红色和蓝色中的一种,并且第二颜色是红色和蓝色中的另一种。在一些实施例中,第一颜色是包括红色、橙色、黄色、绿色、蓝色、紫罗兰色、白色、黑色、灰色和/或棕色的组中的任一种,并且第二颜色是同一组中的与第一颜色不同颜色的任一种。参考框1034,在一些实施例中,第一属性是亮度或不透明度的第一水平,并且第二属性是亮度或不透明度的第二水平。在一些实施例中,第一属性和第二属性是二进制类别的视觉表示的任何对比属性(例如,零和一、颜色、对比阴影和/或像素强度、符号(例如,X和O)和/或图案(例如,阴影图案))。
在一些实施例中,基于类别分配(例如,组织或背景)和概率(例如,明显或可能)两者来分配属性。例如,在一些实施例中,为所获得的图像中的多个像素中的相应像素分配用于指示相应像素对应于组织样品的叠加区域还是对应于背景区域(例如,红色和蓝色)的第一参数的第一属性和第二属性,以及用于指示类别分配的概率和/或可能性(例如,亮度或不透明度水平)的第二参数的第一属性和第二属性。因此,在一些此类实施例中,相应像素包括多个属性(例如,深红色、浅红色、浅蓝色、深蓝色)。
在一些实施例中,基于类别分配(例如,组织或背景)和像素强度两者来分配属性。在一些实施例中,为所获得的图像中的多个像素中的相应像素分配用于多个参数的两个或更多个属性。
参考框1036并且进一步参考图12,在一些实施例中,图像进一步包括呈基板904上的二维位置阵列1138的形式的一组捕获点(例如,1202-1、…、1202-4、…、1202-13、…、1202-M)的表示。所述一组捕获点中的每个相应捕获点1202(i)处于所述二维阵列1138中的不同位置处并且(ii)与来自所述组织的一种或多种分析物相关联。所述一组捕获点中的每个相应捕获点1202由多个空间条形码中的至少一个唯一空间条形码表征。图13展示了一个此类捕获点1202。在一些此类实施例中,所述方法进一步包括基于所述图像中的所述多个捕获点中的捕获点1202的每个相应表示附近的像素的分配,为所述捕获点的所述相应表示分配所述第一属性或所述第二属性。例如,参考图12,捕获点1202-1、…、1202-4、…、1202-13、…、1202-M将被分配到背景,因为所述捕获点落在切片的组织1204所在区域之外。
在一些实施例中,将第一属性或第二属性分配到多个捕获点中的捕获点1202的相应表示被表示为组织位置构造(例如,矩阵、阵列、列表或向量),所述组织位置构造指示相对于多个像素和/或相对于多个捕获点的组织和背景的位置,因此指示对应于与组织切片重叠的捕获点子集的像素子集。在一些实施例中,将第一属性或第二属性分配到捕获点的相应表示是使用算法、函数和/或脚本(例如,Python)来执行的。在一些此类实施例中,使用分类模块1120执行分配。在一些实施例中,所述算法返回组织位置构造(例如,矩阵、数组、列表或向量),所述组织位置构造包括作为呈行和列的形式的整数的空间坐标,以及作为值的带条形码的捕获点的条形码序列。在一些实施例中,组织位置构造基于所获得的图像的多个参数产生的,包含但不限于组织位置列表、带条形码的捕获点列表、每个相应带条形码的捕获点的中心坐标列表,所获得的图像的一个或多个缩放因子(例如,0.0–1.0)、由启发式分类器和/或图像分割算法产生的一个或多个图像掩模、相应捕获点的直径(例如,以像素为单位)、具有与组织重叠的捕获点子集的行和列坐标的数据帧和/或包括条形码序列的矩阵。在一些此类实施例中,用于产生组织位置构造的函数基于点位置和组织掩模确定哪些捕获点与组织切片重叠,其中重叠被确定为与掩模重叠的捕获点像素的分数。在一些此类实施例中,计算使用捕获点的半径和所获得的图像的缩放因子来估计重叠。在一些实施例中,用于产生组织位置构造的函数进一步返回输出,包含但不限于与组织切片重叠的条形码序列列表、与组织重叠的一组缩放的捕获点坐标和/或与背景相对应的一组缩放的捕获点坐标。
在一些实施例中,多个捕获点1202直接定位于组织图像下方,而在一些替代性实施例中,多个捕获点1202设置在与组织切片成像的基板904不同的基板上。在一些实施例中,在成像之前或之后将组织切片直接叠加在基板上的捕获点上,并且捕获点与来自组织的一种或多种分析物的缔合通过组织与捕获点的直接接触而发生。在一些实施例中,组织切片不直接叠加在捕获点上,并且捕获点与来自组织的一种或多种分析物的缔合通过使用多孔膜或转移膜将分析物从组织转移到捕获点而发生。
参考框1038,在一些实施例中,所述一组捕获点中的捕获点1202包括捕获结构域。参考框1040,在一些实施例中,所述一组捕获点中的捕获点1202包括切割结构域。参考框1042,在一些实施例中,所述一组点中的每个捕获点直接附接或间接附接到所述基板。
参考框1044,在一些实施例中,所述一种或多种分析物包括五种或更多种分析物、十种或更多种分析物、五十种或更多种分析物、一百种或更多种分析物、五百种或更多种分析物、1000种或更多种分析物、2000种或更多种分析物或2000到10,000种分析物。
参考框1046,在一些实施例中,所述唯一空间条形码编码选自以下集合的唯一预定值:{1,…,1024}、{1,…,4096}、{1,…,16384}、{1,…,65536}、{1,…,262144}、{1,…,1048576}、{1,…,4194304}、{1,…,16777216}、{1,…,67108864}或{1,…,1×1012}。
参考框1048,在一些实施例中,每个相应捕获点1202包含1000或更多个探针、2000或更多个探针、10,000或更多个探针、100,000或更多个探针、1×106或更多个探针、2×106或更多个探针或5×106或更多个探针。参考框1050,相应捕获点中的每个探针包含poly-A序列或poly-T序列以及表征所述相应捕获点的所述唯一空间条形码。参考框1052和1054,在一些实施例中,相应捕获点中的每个探针包含自所述多个空间条形码的相同空间条形码或来不同空间条形码。
参考框1056,在一些实施例中,所述一种或多种分析物是多种分析物。所述一组捕获点中的相应捕获点1202包含多个探针。多个探针中的每个探针包含捕获结构域,所述捕获结构域由多个捕获结构域类型中的捕获结构域类型表征。所述多个捕获结构域类型中的每个相应捕获结构域类型被配置成与所述多种分析物中的不同分析物结合。
因此,在一些此类实施例中,每个捕获结构域类型对应于特定的分析物(例如,特定的寡核苷酸或特定基因的结合部分)。在一些实施例中,多个捕获结构域类型中的每个捕获结构域类型被配置成与相同的分析物(例如,与单个基因的mRNA的特异性结合互补性)或不同的分析物(例如,与多个基因的mRNA的特异性结合互补性)结合。
参考框1058,在一些实施例中,所述多个捕获结构域类型包括5到15,000个捕获结构域类型,并且所述多个相应捕获探针包含针对所述多个捕获结构域类型中的每个捕获结构域类型的至少五个、至少10个、至少100个或至少1000个探针。
参考框1060,在一些实施例中,所述一种或多种分析物是多种分析物。所述一组捕获点中的相应捕获点1202包含多个探针,所述多个探针中的每个探针包含捕获结构域,所述捕获结构域由单个捕获结构域类型表征,所述单个捕获结构域类型被配置成以无偏差的方式与所述多种分析物中的每种分析物结合。因此,在一些此类实施例中,捕获结构域包括非特异性捕获部分(例如,寡-dT结合部分)。
参考框1062,在一些实施例中,所述一组捕获点中的每个相应捕获点1202包含在所述基板904上的100微米乘100微米的正方形内。在一些实施例中,所述一组捕获点中的每个相应捕获点包含在所述基板上的50微米乘50微米的正方形内。在一些实施例中,所述一组捕获点中的每个相应捕获点包含在所述基板上的10微米乘10微米的正方形内。在一些实施例中,所述一组捕获点中的每个相应捕获点包含在所述基板上的1微米乘1微米的正方形内。在一些实施例中,所述一组捕获点中的每个相应捕获点包含在所述基板上的0.5微米乘0.5微米的正方形内。在一些实施例中,所述一组捕获点中的每个相应捕获点包含在所述基板上的0.3微米乘0.3微米的正方形内。在一些实施例中,所述一组捕获点中的每个相应捕获点包含在所述基板上的0.2微米乘0.2微米的正方形内。
参考框1064,在一些实施例中,每个相应点1202的中心到所述基板904上的所述一组捕获点中的相邻捕获点1202之间的距离介于50微米与300微米之间。在一些实施例中,每个相应点1202的中心到相邻捕获点1202之间的距离介于300纳米与300微米之间。在一些实施例中,每个相应点1202的中心到相邻捕获点1202之间的距离介于300纳米与15微米之间、介于800纳米与10微米之间或介于两微米与七微米之间。
参考框1066,在一些实施例中,基板上的一组捕获点中的每个捕获点1202的形状为闭合形式形状。参考框1068,在一些实施例中,闭合形式形状是圆形、椭圆形或N边形,其中N是介于1与20之间的值。参考框1070,在一些实施例中,闭合形式形状是六边形。参考框1072,在一些实施例中,闭合形式形状为圆形,并且一组捕获点中的每个捕获点的直径为80微米或更小。在一些实施例中,所述闭合形式形状为圆形或六边形,并且所述一组捕获点中的每个捕获点的直径介于30与200微米之间和/或直径为100微米。参考框1074,在一些实施例中,闭合形式形状为圆形,并且一组捕获点中的每个捕获点的直径介于30微米与65微米之间。在一些实施例中,所述闭合形式形状为圆形或六边形,并且所述一组捕获点中的每个捕获点的直径为60微米。参考框1076,在一些实施例中,每个相应捕获点的中心到基板上的一组捕获点中的相邻捕获点之间的距离介于50微米与80微米之间。
在一些实施例中,阵列的多个捕获点的位置是预定的。在一些实施例中,阵列的多个捕获点的位置不是预定的。在一些实施例中,基板包括基准标志物,并且基准标志物的位置是预定的,使得所述基准标志物可以映射到空间定位。在一些实施例中,基板包括介于500与1000之间、1000到5000、5000到10,000、10,000到15,000、15,000到20,000之间或超过20,000个捕获点。在一些实施例中,基板包括1000到5000个捕获点,其中捕获点在基板上以六边形或网格布置。
捕获结构域类型、捕获点大小、阵列、探针、空间条形码分析物和/或捕获点的其它特征(包含但不限于尺寸、设计和修改)的许多替代性组合也是可能的,并且在上文详细讨论(例如,在部分(II)基于通用空间阵列的分析方法;子部分(b)捕获探针、(c)基板和(d)阵列中)。
引用文献和替代性实施例
所有可在互联网上获得并在本说明书中提及的公开、专利、专利申请和信息均本文中通过引用并入,程度如同每一单独的公开、专利、专利申请或信息项被专门并且单独地指示以引用的方式并入一般。在通过引用的方式并入的公开、专利或专利申请和信息项与本说明书中所包含的公开内容相抵触的情况下,本说明书意欲替代和/或优先于任何此类矛盾材料。
本发明可以被实施为计算机程序产品,所述计算机程序产品包括嵌入在非暂态计算机可读存储介质中的计算机程序机构。例如,计算机程序产品可以含有图11中所示和/或图10A、10B、10C、10D、10E和10F中所描述的程序模块。这些程序模块可以存储在CD-ROM、DVD、磁盘存储产品、USB密钥或任何其它非暂时性计算机可读数据或程序存储产品上。
在不背离本发明的精神和范围的情况下,可以对本发明进行许多修改和变化,如对本领域的技术人员而言显而易见的。本文所描述的具体实施例仅以实例的方式给出。为了最佳地解释本发明的原理及其实际应用,选择和描述了所述实施例,以便由此使本领域的其他技术人员能够最好地利用本发明以及具有适合于所设想的特定用途的各种修改的各个实施例。本发明仅由所附权利要求连同此类权利要求有权获得的等效物的全部范围限定。
序列表
<110> 10X基因组学有限公司(10X Genomics, Inc.)
<120> 用于组织分类的系统和方法
<130> 104371-5030
<150> 62/937,066
<151> 2019-11-18
<160> 3
<170> PatentIn 3.5版
<210> 1
<211> 20
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 假定核酸
<400> 1
aaaaaaaaaa aaaaaaaaaa 20
<210> 2
<211> 23
<212> RNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 假定核酸
<400> 2
uuuuuuuuuu uuuuuuuuuu uuu 23
<210> 3
<211> 18
<212> DNA
<213> 人工序列(Artificial Sequence)
<220>
<223> 假定核酸
<400> 3
tttttttttt tttttttt 18
Claims (35)
1.一种组织分类方法,其包括:
A)获得呈电子形式的多个像素方式的基板上的组织样品的图像,其中所述图像包含处于所述基板的外边界上的多个基准标志物;以及
B)通过包括以下的程序将所述多个像素中的每个相应像素分配到第一类别或第二类别,其中所述第一类别指示所述组织样品在所述基板上的叠加并且所述第二类别指示背景,并且其中所述多个像素包括至少100,000个像素:
(i)使用所述多个基准标志物来定义所述图像内的边界框;
(ii)从所述多个像素中去除落在所述边界框之外的相应像素;
(iii)在所述去除(ii)之后,在所述多个像素上运行多个启发式分类器,其中对于所述多个像素中的每个相应像素,所述多个启发式分类器中的每个相应启发式分类器对所述第一类别与所述第二类别之间的所述相应像素进行投票,由此形成所述多个像素中的每个相应像素的对应聚合分数,其中每个对应聚合分数是包括明显的第一类别、可能的第一类别、可能的第二类别和明显的第二类别的一组类别中的类别;以及
(iv)将所述多个像素中的每个相应像素的所述聚合分数和强度应用于分割算法,以独立地向所述多个像素中的每个相应像素分配作为组织样品或背景的概率。
2.根据权利要求1所述的方法,所述方法进一步包括:
将掩模叠加在所述图像上,其中所述掩模使所述图像的所述多个像素中的已经被分配作为组织的概率更大的每个相应像素被分配第一属性并且所述多个像素中的已经被分配作为背景的概率更大的每个相应像素被分配第二属性。
3.根据权利要求2所述的方法,其中所述第一属性是第一颜色,并且所述第二属性是第二颜色。
4.根据权利要求3所述的方法,其中所述第一颜色是红色和蓝色中的一种,并且所述第二颜色是红色和蓝色中的另一种。
5.根据权利要求2所述的方法,其中所述第一属性是亮度或不透明度的第一水平,并且所述第二属性是亮度或不透明度的第二水平。
6.根据权利要求2所述的方法,其中:
所述图像进一步包括呈所述基板上的二维位置阵列的形式的一组捕获点的表示,
所述一组捕获点中的每个相应捕获点(i)处于所述二维阵列中的不同位置处并且(ii)与来自所述组织的一种或多种分析物相关联,并且
所述一组捕获点中的每个相应捕获点由多个空间条形码中的至少一个唯一空间条形码表征,并且其中所述方法进一步包括:
基于所述图像中的所述多个捕获点中的捕获点的每个相应表示附近的像素的独立分配,为所述捕获点的所述相应表示分配所述第一属性或所述第二属性。
7.根据权利要求6所述的方法,其中所述一组捕获点中的捕获点包括捕获结构域。
8.根据权利要求6所述的方法,其中所述一组捕获点中的捕获点包括切割结构域。
9.根据权利要求6所述的方法,其中所述一组点中的每个捕获点直接附接或间接附接到所述基板。
10.根据权利要求6所述的方法,其中所述一种或多种分析物包括五种或更多种分析物、十种或更多种分析物、五十种或更多种分析物、一百种或更多种分析物、五百种或更多种分析物、1000种或更多种分析物、2000种或更多种分析物或2000到100,000种分析物。
11.根据权利要求6所述的方法,其中所述唯一空间条形码编码选自以下集合的唯一预定值:{1,…,1024}、{1,…,4096}、{1,…,16384}、{1,…,65536}、{1,…,262144}、{1,…,1048576}、{1,…,4194304}、{1,…,16777216}、{1,…,67108864}或{1,…,1x 1012}。
12.根据权利要求6到11中任一项所述的方法,其中每个相应捕获点包含1000个或更多个捕获探针、2000个或更多个捕获探针、10,000个或更多个捕获探针、100,000个或更多个捕获探针、1×106个或更多个捕获探针、2×106个或更多个捕获探针或5×106个或更多个捕获探针。
13.根据权利要求12所述的方法,其中所述相应捕获点中的每个捕获探针包含poly-A序列或poly-T序列以及表征所述相应捕获点的所述唯一空间条形码。
14.根据权利要求12所述的方法,其中所述相应捕获点中的每个捕获探针包含来自所述多个空间条形码的相同空间条形码。
15.根据权利要求12所述的方法,其中所述相应捕获点中的每个捕获探针包含来自所述多个空间条形码的不同空间条形码。
16.根据权利要求1到15中任一项所述的方法,其中所述组织样品的深度为100微米或更小。
17.根据权利要求6所述的方法,其中
所述一种或多种分析物是多种分析物,
所述一组捕获点中的相应捕获点包含多个捕获探针,所述多个捕获探针中的每个捕获探针包含捕获结构域,所述捕获结构域由多个捕获结构域类型中的捕获结构域类型表征,并且
所述多个捕获结构域类型中的每个相应捕获结构域类型被配置成与所述多种分析物中的不同分析物结合。
18.根据权利要求17所述的方法,其中所述多个捕获结构域类型包括5到15,000个捕获结构域类型,并且所述多个相应捕获探针包含针对所述多个捕获结构域类型中的每个捕获结构域类型的至少五个、至少10个、至少100个或至少1000个捕获探针。
19.根据权利要求6所述的方法,其中
所述一种或多种分析物是多种分析物,
所述一组捕获点中的相应捕获点包含多个捕获探针,所述多个捕获探针中的每个捕获探针包含捕获结构域,所述捕获结构域由单个捕获结构域类型表征,所述单个捕获结构域类型被配置成以无偏差的方式与所述多种分析物中的每种分析物结合。
20.根据权利要求6所述的方法,其中所述一组捕获点中的每个相应捕获点包含在所述基板上的100微米乘100微米的正方形内。
21.根据权利要求6所述的方法,其中每个相应点的中心到所述基板上的所述一组捕获点中的相邻捕获点之间的距离介于50微米与300微米之间。
22.根据权利要求6到21中任一项所述的方法,其中所述基板上的所述一组捕获点中的每个捕获点的形状为闭合形式形状。
23.根据权利要求22所述的方法,其中所述闭合形式形状是圆形、椭圆形或N边形,其中N是介于1与20之间的值。
24.根据22所述的方法,其中所述闭合形式形状是六边形。
25.根据权利要求22所述的方法,其中所述闭合形式形状为圆形,并且所述一组捕获点中的每个捕获点的直径为80微米或更小。
26.根据权利要求25所述的方法,其中所述闭合形式形状为圆形,并且所述一组捕获点中的每个捕获点的直径介于30微米与65微米之间。
27.根据权利要求26所述的方法,其中每个相应捕获点的中心到所述基板上的所述一组捕获点中的相邻捕获点之间的距离介于50微米与80微米之间。
28.根据权利要求1到27中任一项所述的方法,其中所述多个启发式分类器包括第一启发式分类器,所述第一启发式分类器标识将所述多个像素分为所述第一类别和第二类别的单个强度阈值,由此使所述第一启发式分类器对所述第一类别或所述第二类别的所述多个像素中的每个相应像素进行投票,并且其中所述单个强度阈值表示所述第一类别与所述第二类别之间的类内强度方差的最小化或所述第一类别与所述第二类别之间的类间方差的最大化。
29.根据权利要求28所述的方法,其中所述多个启发式分类器包括第二启发式分类器,所述第二启发式分类器标识具有使用所述第一启发式分类器标识的相同类别的像素的局部邻域,并且对所述局部邻域中的像素之间的最大强度差异应用平滑量度,由此使所述第二启发式分类器对所述第一类别或所述第二类别的所述多个像素中的每个相应像素进行投票。
30.根据权利要求1到29中任一项所述的方法,其中所述多个启发式分类器包括第三启发式分类器,所述第三启发式分类器对所述多个像素进行边缘检测以形成所述图像中的多个边缘,在形态上闭合所述多个边缘以形成所述图像中的多个在形态上闭合的区域,并且将所述在形态上闭合的区域中的像素分配到所述第一类别并且将所述在形态上闭合的区域之外的像素分配到所述第二类别,由此使所述第三启发式分类器对所述第一类别或所述第二类别的所述多个像素中的每个相应像素进行投票。
31.根据权利要求30所述的方法,其中:
所述多个启发式分类器由第一启发式分类器、第二启发式分类器和第三启发式分类器组成,
由所述多个分类器中的所述启发式分类器中的每个启发式分类器分配到所述第二类别的每个相应像素被标记为明显的第二类别,并且
由所述多个启发式分类器中的每个启发式分类器分配作为所述第一类别的每个相应像素被标记为明显的第一类别。
32.根据权利要求1到30中任一项所述的方法,其中所述分割算法是GrabCut分割算法。
33.根据权利要求1到32中任一项所述的方法,其中所述图像是使用透射光显微术获取的。
34.一种计算机系统,其包括:
一个或多个处理器;
存储器;以及
一个或多个程序,其中所述一个或多个程序存储在所述存储器中并且被配置成由所述一个或多个处理器执行,所述一个或多个程序用于组织分类,所述一个或多个程序包含指令,所述指令用于:
A)获得呈电子形式的多个像素方式的基板上的组织样品的图像,其中所述图像包含处于所述基板的外边界上的多个基准标志物;以及
B)通过包括以下的程序将所述多个像素中的每个相应像素分配到第一类别或第二类别,其中所述第一类别指示所述组织样品在所述基板上的叠加并且所述第二类别指示背景,并且其中所述多个像素包括至少100,000个像素:
(i)使用所述多个基准标志物来定义所述图像内的边界框;
(ii)从所述多个像素中去除落在所述边界框之外的相应像素;
(iii)在所述去除(ii)之后,在所述多个像素上运行多个启发式分类器,其中对于所述多个像素中的每个相应像素,所述多个启发式分类器中的每个相应启发式分类器对所述第一类别与所述第二类别之间的所述相应像素进行投票,由此形成所述多个像素中的每个相应像素的对应聚合分数,其中每个对应聚合分数是包括明显的第一类别、可能的第一类别、可能的第二类别和明显的第二类别的一组类别中的类别;以及
(iv)将所述多个像素中的每个相应像素的所述聚合分数和强度应用于分割算法,以独立地向所述多个像素中的每个相应像素分配作为组织样品或背景的概率。
35.一种存储一个或多个程序的计算机可读存储介质,所述一个或多个程序包括指令,所述指令在由具有一个或多个处理器和存储器的电子装置执行时使所述电子装置通过包括以下的方法执行组织分类:
A)获得呈电子形式的多个像素方式的基板上的组织样品的图像,其中所述图像包含处于所述基板的外边界上的多个基准标志物;以及
B)通过包括以下的程序将所述多个像素中的每个相应像素分配到第一类别或第二类别,其中所述第一类别指示所述组织样品在所述基板上的叠加并且所述第二类别指示背景,并且其中所述多个像素包括至少100,000个像素:
(i)使用所述多个基准标志物来定义所述图像内的边界框;
(ii)从所述多个像素中去除落在所述边界框之外的相应像素;
(iii)在所述去除(ii)之后,在所述多个像素上运行多个启发式分类器,其中对于所述多个像素中的每个相应像素,所述多个启发式分类器中的每个相应启发式分类器对所述第一类别与所述第二类别之间的所述相应像素进行投票,由此形成所述多个像素中的每个相应像素的对应聚合分数,其中每个对应聚合分数是包括明显的第一类别、可能的第一类别、可能的第二类别和明显的第二类别的一组类别中的类别;以及
(iv)将所述多个像素中的每个相应像素的所述聚合分数和强度应用于分割算法,以独立地向所述多个像素中的每个相应像素分配作为组织样品或背景的概率。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201962937066P | 2019-11-18 | 2019-11-18 | |
US62/937,066 | 2019-11-18 | ||
PCT/US2020/061064 WO2021102003A1 (en) | 2019-11-18 | 2020-11-18 | Systems and methods for tissue classification |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115004260A true CN115004260A (zh) | 2022-09-02 |
Family
ID=73835762
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202080093520.5A Pending CN115004260A (zh) | 2019-11-18 | 2020-11-18 | 用于组织分类的系统和方法 |
Country Status (6)
Country | Link |
---|---|
US (2) | US12154266B2 (zh) |
EP (1) | EP4062316A1 (zh) |
CN (1) | CN115004260A (zh) |
AU (1) | AU2020388047A1 (zh) |
CA (1) | CA3158603A1 (zh) |
WO (1) | WO2021102003A1 (zh) |
Families Citing this family (93)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11232335B2 (en) * | 2017-10-16 | 2022-01-25 | Hp Indigo B.V. | Printing sub-images to create complete image |
FR3080936B1 (fr) * | 2018-05-04 | 2020-04-24 | Imginit | Methode de detection et de quantification du flou dans une image numerique |
US11926867B2 (en) | 2019-01-06 | 2024-03-12 | 10X Genomics, Inc. | Generating capture probes for spatial analysis |
US11649485B2 (en) | 2019-01-06 | 2023-05-16 | 10X Genomics, Inc. | Generating capture probes for spatial analysis |
WO2020243579A1 (en) | 2019-05-30 | 2020-12-03 | 10X Genomics, Inc. | Methods of detecting spatial heterogeneity of a biological sample |
BR112022003461A2 (pt) * | 2019-09-09 | 2022-05-24 | Paige Ai Inc | Sistemas e métodos para processamento de imagens de lâminas para patologia digital |
EP4055185A1 (en) | 2019-11-08 | 2022-09-14 | 10X Genomics, Inc. | Spatially-tagged analyte capture agents for analyte multiplexing |
WO2021092433A2 (en) | 2019-11-08 | 2021-05-14 | 10X Genomics, Inc. | Enhancing specificity of analyte binding |
EP4424843A3 (en) | 2019-12-23 | 2024-09-25 | 10X Genomics, Inc. | Methods for spatial analysis using rna-templated ligation |
EP4081656A1 (en) | 2019-12-23 | 2022-11-02 | 10X Genomics, Inc. | Compositions and methods for using fixed biological samples in partition-based assays |
US11732299B2 (en) | 2020-01-21 | 2023-08-22 | 10X Genomics, Inc. | Spatial assays with perturbed cells |
US11702693B2 (en) | 2020-01-21 | 2023-07-18 | 10X Genomics, Inc. | Methods for printing cells and generating arrays of barcoded cells |
US11821035B1 (en) | 2020-01-29 | 2023-11-21 | 10X Genomics, Inc. | Compositions and methods of making gene expression libraries |
US12076701B2 (en) | 2020-01-31 | 2024-09-03 | 10X Genomics, Inc. | Capturing oligonucleotides in spatial transcriptomics |
US12110541B2 (en) | 2020-02-03 | 2024-10-08 | 10X Genomics, Inc. | Methods for preparing high-resolution spatial arrays |
US11898205B2 (en) | 2020-02-03 | 2024-02-13 | 10X Genomics, Inc. | Increasing capture efficiency of spatial assays |
US11732300B2 (en) | 2020-02-05 | 2023-08-22 | 10X Genomics, Inc. | Increasing efficiency of spatial analysis in a biological sample |
US12129516B2 (en) | 2020-02-07 | 2024-10-29 | 10X Genomics, Inc. | Quantitative and automated permeabilization performance evaluation for spatial transcriptomics |
US11835462B2 (en) | 2020-02-11 | 2023-12-05 | 10X Genomics, Inc. | Methods and compositions for partitioning a biological sample |
US11891654B2 (en) | 2020-02-24 | 2024-02-06 | 10X Genomics, Inc. | Methods of making gene expression libraries |
US11926863B1 (en) | 2020-02-27 | 2024-03-12 | 10X Genomics, Inc. | Solid state single cell method for analyzing fixed biological cells |
US11768175B1 (en) | 2020-03-04 | 2023-09-26 | 10X Genomics, Inc. | Electrophoretic methods for spatial analysis |
CN111523642B (zh) * | 2020-04-10 | 2023-03-28 | 星宸科技股份有限公司 | 用于卷积运算的数据重用方法、运算方法及装置、芯片 |
EP4139485B1 (en) | 2020-04-22 | 2023-09-06 | 10X Genomics, Inc. | Methods for spatial analysis using targeted rna depletion |
ES2989052T3 (es) | 2020-05-22 | 2024-11-25 | 10X Genomics Inc | Medición espacio-temporal simultánea de la expresión génica y la actividad celular |
EP4153776B1 (en) | 2020-05-22 | 2025-03-05 | 10X Genomics, Inc. | Spatial analysis to detect sequence variants |
WO2021242834A1 (en) | 2020-05-26 | 2021-12-02 | 10X Genomics, Inc. | Method for resetting an array |
US12265079B1 (en) | 2020-06-02 | 2025-04-01 | 10X Genomics, Inc. | Systems and methods for detecting analytes from captured single biological particles |
WO2021247568A1 (en) | 2020-06-02 | 2021-12-09 | 10X Genomics, Inc. | Spatial trancriptomics for antigen-receptors |
EP4025692A2 (en) | 2020-06-02 | 2022-07-13 | 10X Genomics, Inc. | Nucleic acid library methods |
US12031177B1 (en) | 2020-06-04 | 2024-07-09 | 10X Genomics, Inc. | Methods of enhancing spatial resolution of transcripts |
EP4421186A3 (en) | 2020-06-08 | 2024-09-18 | 10X Genomics, Inc. | Methods of determining a surgical margin and methods of use thereof |
EP4165207B1 (en) | 2020-06-10 | 2024-09-25 | 10X Genomics, Inc. | Methods for determining a location of an analyte in a biological sample |
EP4164796A4 (en) | 2020-06-10 | 2024-03-06 | 10x Genomics, Inc. | LIQUID DISPENSING METHOD |
AU2021294334A1 (en) | 2020-06-25 | 2023-02-02 | 10X Genomics, Inc. | Spatial analysis of DNA methylation |
US11761038B1 (en) | 2020-07-06 | 2023-09-19 | 10X Genomics, Inc. | Methods for identifying a location of an RNA in a biological sample |
US11981960B1 (en) | 2020-07-06 | 2024-05-14 | 10X Genomics, Inc. | Spatial analysis utilizing degradable hydrogels |
US12209280B1 (en) | 2020-07-06 | 2025-01-28 | 10X Genomics, Inc. | Methods of identifying abundance and location of an analyte in a biological sample using second strand synthesis |
US11981958B1 (en) | 2020-08-20 | 2024-05-14 | 10X Genomics, Inc. | Methods for spatial analysis using DNA capture |
AU2021344340A1 (en) | 2020-09-15 | 2023-03-23 | 10X Genomics, Inc. | Methods of releasing an extended capture probe from a substrate and uses of the same |
US20230313279A1 (en) | 2020-09-16 | 2023-10-05 | 10X Genomics, Inc. | Methods of determining the location of an analyte in a biological sample using a plurality of wells |
US20230351619A1 (en) | 2020-09-18 | 2023-11-02 | 10X Genomics, Inc. | Sample handling apparatus and image registration methods |
US11926822B1 (en) | 2020-09-23 | 2024-03-12 | 10X Genomics, Inc. | Three-dimensional spatial analysis |
EP4214330A1 (en) | 2020-10-22 | 2023-07-26 | 10X Genomics, Inc. | Methods for spatial analysis using rolling circle amplification |
US11827935B1 (en) | 2020-11-19 | 2023-11-28 | 10X Genomics, Inc. | Methods for spatial analysis using rolling circle amplification and detection probes |
WO2022140028A1 (en) | 2020-12-21 | 2022-06-30 | 10X Genomics, Inc. | Methods, compositions, and systems for capturing probes and/or barcodes |
US20240068017A1 (en) | 2020-12-30 | 2024-02-29 | 10X Genomics, Inc. | Methods for analyte capture determination |
ES2989523T3 (es) | 2021-02-19 | 2024-11-26 | 10X Genomics Inc | Método de uso de un dispositivo modular de soporte para ensayos |
EP4301870B1 (en) | 2021-03-18 | 2025-01-15 | 10X Genomics, Inc. | Multiplex capture of gene and protein expression from a biological sample |
EP4305196B1 (en) | 2021-04-14 | 2025-04-02 | 10X Genomics, Inc. | Methods of measuring mislocalization of an analyte |
EP4347879B1 (en) | 2021-06-03 | 2025-02-19 | 10X Genomics, Inc. | Methods, compositions, kits, and systems for enhancing analyte capture for spatial analysis |
US20240263218A1 (en) | 2021-07-13 | 2024-08-08 | 10X Genomics, Inc. | Methods for spatial analysis using targeted probe silencing |
WO2023034489A1 (en) | 2021-09-01 | 2023-03-09 | 10X Genomics, Inc. | Methods, compositions, and kits for blocking a capture probe on a spatial array |
WO2023044071A1 (en) * | 2021-09-17 | 2023-03-23 | 10X Genomics, Inc. | Systems and methods for image registration or alignment |
EP4413578A1 (en) | 2021-10-06 | 2024-08-14 | 10X Genomics, Inc. | Systems and methods for evaluating biological samples |
US20250034623A1 (en) * | 2021-10-25 | 2025-01-30 | Singular Genomics Systems, Inc. | Manipulating and detecting biological samples |
WO2023076345A1 (en) | 2021-10-26 | 2023-05-04 | 10X Genomics, Inc. | Methods for spatial analysis using targeted rna capture |
EP4419707A1 (en) | 2021-11-10 | 2024-08-28 | 10X Genomics, Inc. | Methods, compositions, and kits for determining the location of an analyte in a biological sample |
EP4430398A1 (en) | 2021-11-10 | 2024-09-18 | 10X Genomics, Inc. | Methods for identification of antigen-binding molecules |
WO2023102118A2 (en) | 2021-12-01 | 2023-06-08 | 10X Genomics, Inc. | Methods, compositions, and systems for improved in situ detection of analytes and spatial analysis |
EP4441711A1 (en) | 2021-12-20 | 2024-10-09 | 10X Genomics, Inc. | Self-test for pathology/histology slide imaging device |
WO2023150171A1 (en) | 2022-02-01 | 2023-08-10 | 10X Genomics, Inc. | Methods, compositions, and systems for capturing analytes from glioblastoma samples |
WO2023150163A1 (en) | 2022-02-01 | 2023-08-10 | 10X Genomics, Inc. | Methods, compositions, and systems for capturing analytes from lymphatic tissue |
US20230306593A1 (en) | 2022-02-15 | 2023-09-28 | 10X Genomics, Inc. | Systems and methods for spatial analysis of analytes using fiducial alignment |
US20230326071A1 (en) * | 2022-04-12 | 2023-10-12 | Renesas Electronics Corporation. | Systems including bounding box checker for object detection marking |
WO2023212532A1 (en) | 2022-04-26 | 2023-11-02 | 10X Genomics, Inc. | Systems and methods for evaluating biological samples |
WO2023215552A1 (en) | 2022-05-06 | 2023-11-09 | 10X Genomics, Inc. | Molecular barcode readers for analyte detection |
WO2023225519A1 (en) | 2022-05-17 | 2023-11-23 | 10X Genomics, Inc. | Modified transposons, compositions and uses thereof |
WO2023229982A2 (en) | 2022-05-24 | 2023-11-30 | 10X Genomics, Inc. | Porous structure confinement for convection suppression |
WO2023250077A1 (en) | 2022-06-22 | 2023-12-28 | 10X Genomics, Inc. | Methods, compositions, and systems for capturing probes and/or barcodes |
WO2024015862A1 (en) | 2022-07-13 | 2024-01-18 | 10X Genomics, Inc. | Methods for characterization of antigen-binding molecules from biological samples |
WO2024015578A1 (en) | 2022-07-15 | 2024-01-18 | 10X Genomics, Inc. | Methods for determining a location of a target nucleic acid in a biological sample |
WO2024031068A1 (en) | 2022-08-05 | 2024-02-08 | 10X Genomics, Inc. | Systems and methods for immunofluorescence quantification |
WO2024036191A1 (en) | 2022-08-10 | 2024-02-15 | 10X Genomics, Inc. | Systems and methods for colocalization |
WO2024035844A1 (en) | 2022-08-12 | 2024-02-15 | 10X Genomics, Inc. | Methods for reducing capture of analytes |
WO2024044703A1 (en) | 2022-08-24 | 2024-02-29 | 10X Genomics, Inc. | Compositions and methods for antigenic epitope mapping in biological samples |
WO2024081212A1 (en) | 2022-10-10 | 2024-04-18 | 10X Genomics, Inc. | In vitro transcription of spatially captured nucleic acids |
WO2024086167A2 (en) | 2022-10-17 | 2024-04-25 | 10X Genomics, Inc. | Methods, compositions, and kits for determining the location of an analyte in a biological sample |
WO2024102809A1 (en) | 2022-11-09 | 2024-05-16 | 10X Genomics, Inc. | Methods, compositions, and kits for determining the location of multiple analytes in a biological sample |
WO2024137826A1 (en) | 2022-12-21 | 2024-06-27 | 10X Genomics, Inc. | Analysis of analytes and spatial gene expression |
WO2024145441A1 (en) | 2022-12-29 | 2024-07-04 | 10X Genomics, Inc. | Methods, compositions, and kits for determining a location of a target nucleic acid in a fixed biological sample |
WO2024145445A1 (en) | 2022-12-30 | 2024-07-04 | 10X Genomics, Inc. | Methods of capturing target analytes |
WO2024145491A1 (en) | 2022-12-30 | 2024-07-04 | 10X Genomics, Inc. | Methods, compositions, and kits for multiple barcoding and/or high-density spatial barcoding |
WO2024206603A1 (en) | 2023-03-28 | 2024-10-03 | 10X Genomics, Inc. | Methods, compositions, and kits for reducing analyte mislocalization |
WO2024220882A1 (en) | 2023-04-21 | 2024-10-24 | 10X Genomics, Inc. | Methods and compositions for detecting nucleic acids in a fixed biological sample |
EP4500178A1 (en) | 2023-05-15 | 2025-02-05 | 10x Genomics, Inc. | Spatial antibody data normalization |
WO2024238900A1 (en) | 2023-05-17 | 2024-11-21 | 10X Genomics, Inc. | Methods of reducing mislocalization of an analyte |
WO2024254316A1 (en) | 2023-06-07 | 2024-12-12 | 10X Genomics, Inc. | Compositions and methods for identifying blood clots in biological samples |
WO2024258911A1 (en) | 2023-06-13 | 2024-12-19 | 10X Genomics, Inc. | Sequence specific dna binding proteins |
WO2025029605A1 (en) | 2023-07-28 | 2025-02-06 | 10X Genomics, Inc. | Methods and compositions for detecting genetic variants using capture probes and primer extension |
WO2025029627A1 (en) | 2023-07-31 | 2025-02-06 | 10X Genomics, Inc. | Methods, compositions, and kits for spatial detection of genetic variants |
WO2025043076A1 (en) | 2023-08-24 | 2025-02-27 | 10X Genomics, Inc. | Methods, kits, and compositions for spatial detection of genetic variants |
WO2025072119A1 (en) | 2023-09-26 | 2025-04-03 | 10X Genomics, Inc. | Methods, compositions, and kits for detecting spatial chromosomal interactions |
Family Cites Families (96)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5472881A (en) | 1992-11-12 | 1995-12-05 | University Of Utah Research Foundation | Thiol labeling of DNA for attachment to gold surfaces |
EP0711303B2 (en) | 1993-07-30 | 2009-06-10 | Affymax, Inc. | Biotinylation of proteins |
US5610287A (en) | 1993-12-06 | 1997-03-11 | Molecular Tool, Inc. | Method for immobilizing nucleic acid molecules |
US5552278A (en) | 1994-04-04 | 1996-09-03 | Spectragen, Inc. | DNA sequencing by stepwise ligation and cleavage |
US5807522A (en) | 1994-06-17 | 1998-09-15 | The Board Of Trustees Of The Leland Stanford Junior University | Methods for fabricating microarrays of biological samples |
US5846719A (en) | 1994-10-13 | 1998-12-08 | Lynx Therapeutics, Inc. | Oligonucleotide tags for sorting and identification |
US5750341A (en) | 1995-04-17 | 1998-05-12 | Lynx Therapeutics, Inc. | DNA sequencing by parallel oligonucleotide extensions |
GB9620209D0 (en) | 1996-09-27 | 1996-11-13 | Cemu Bioteknik Ab | Method of sequencing DNA |
GB9626815D0 (en) | 1996-12-23 | 1997-02-12 | Cemu Bioteknik Ab | Method of sequencing DNA |
US6737236B1 (en) | 1997-01-08 | 2004-05-18 | Proligo, Llc | Bioconjugation of macromolecules |
US5837860A (en) | 1997-03-05 | 1998-11-17 | Molecular Tool, Inc. | Covalent attachment of nucleic acid molecules onto solid-phases via disulfide bonds |
US6023540A (en) | 1997-03-14 | 2000-02-08 | Trustees Of Tufts College | Fiber optic sensor with encoded microspheres |
US6327410B1 (en) | 1997-03-14 | 2001-12-04 | The Trustees Of Tufts College | Target analyte sensors utilizing Microspheres |
WO1998044151A1 (en) | 1997-04-01 | 1998-10-08 | Glaxo Group Limited | Method of nucleic acid amplification |
US6969488B2 (en) | 1998-05-22 | 2005-11-29 | Solexa, Inc. | System and apparatus for sequential processing of analytes |
US5919626A (en) | 1997-06-06 | 1999-07-06 | Orchid Bio Computer, Inc. | Attachment of unmodified nucleic acids to silanized solid phase surfaces |
US7427678B2 (en) | 1998-01-08 | 2008-09-23 | Sigma-Aldrich Co. | Method for immobilizing oligonucleotides employing the cycloaddition bioconjugation method |
EP2045334A1 (en) | 1998-06-24 | 2009-04-08 | Illumina, Inc. | Decoding of array sensors with microspheres |
US6391937B1 (en) | 1998-11-25 | 2002-05-21 | Motorola, Inc. | Polyacrylamide hydrogels and hydrogel arrays made from polyacrylamide reactive prepolymers |
US6355431B1 (en) | 1999-04-20 | 2002-03-12 | Illumina, Inc. | Detection of nucleic acid amplification reactions using bead arrays |
ATE553219T1 (de) | 1999-04-20 | 2012-04-15 | Illumina Inc | Erkennung von nukleinsäurereaktionen auf bead- arrays |
US6274320B1 (en) | 1999-09-16 | 2001-08-14 | Curagen Corporation | Method of sequencing a nucleic acid |
US6770441B2 (en) | 2000-02-10 | 2004-08-03 | Illumina, Inc. | Array compositions and methods of making same |
US7001792B2 (en) | 2000-04-24 | 2006-02-21 | Eagle Research & Development, Llc | Ultra-fast nucleic acid sequencing device and a method for making and using the same |
GB0018120D0 (en) | 2000-07-24 | 2000-09-13 | Fermentas Ab | Nuclease |
US7057026B2 (en) | 2001-12-04 | 2006-06-06 | Solexa Limited | Labelled nucleotides |
JP3670260B2 (ja) | 2002-02-14 | 2005-07-13 | 日本碍子株式会社 | プローブ反応性チップ |
DK1507769T4 (en) | 2002-05-30 | 2018-01-02 | Scripps Research Inst | Copper-catalyzed ligation of azides and acetylenes |
ES2550513T3 (es) | 2002-08-23 | 2015-11-10 | Illumina Cambridge Limited | Nucleótidos modificados para secuenciación de polinucleótidos |
EP1539979B1 (en) | 2002-09-20 | 2008-11-19 | New England Biolabs, Inc. | Helicase dependent amplification of nucleic acids |
GB0321306D0 (en) | 2003-09-11 | 2003-10-15 | Solexa Ltd | Modified polymerases for improved incorporation of nucleotide analogues |
US7541166B2 (en) | 2003-09-19 | 2009-06-02 | Microfluidic Systems, Inc. | Sonication to selectively lyse different cell types |
WO2005036451A1 (en) * | 2003-10-08 | 2005-04-21 | Lifespan Biosciences, Inc. | Automated microspcope slide tissue sample mapping and image acquisition |
US7259258B2 (en) | 2003-12-17 | 2007-08-21 | Illumina, Inc. | Methods of attaching biological compounds to solid supports using triazine |
WO2005065814A1 (en) | 2004-01-07 | 2005-07-21 | Solexa Limited | Modified molecular arrays |
EP1828412B2 (en) | 2004-12-13 | 2019-01-09 | Illumina Cambridge Limited | Improved method of nucleotide detection |
GB0427236D0 (en) | 2004-12-13 | 2005-01-12 | Solexa Ltd | Improved method of nucleotide detection |
US8623628B2 (en) | 2005-05-10 | 2014-01-07 | Illumina, Inc. | Polymerases |
DK1910572T3 (en) | 2005-06-20 | 2016-03-14 | Advanced Cell Diagnostics Inc | Methods for Detecting Nucleic Acids in Single Cells and for Identifying Rare Cells from Large Heterogeneous Cell Populations |
GB0514936D0 (en) | 2005-07-20 | 2005-08-24 | Solexa Ltd | Preparation of templates for nucleic acid sequencing |
US8349167B2 (en) | 2006-12-14 | 2013-01-08 | Life Technologies Corporation | Methods and apparatus for detecting molecular interactions using FET arrays |
US8262900B2 (en) | 2006-12-14 | 2012-09-11 | Life Technologies Corporation | Methods and apparatus for measuring analytes using large scale FET arrays |
EP2677309B9 (en) | 2006-12-14 | 2014-11-19 | Life Technologies Corporation | Methods for sequencing a nucleic acid using large scale FET arrays, configured to measure a limited pH range |
US8131077B2 (en) * | 2007-04-03 | 2012-03-06 | Flashfoto, Inc. | Systems and methods for segmenting an image based on perceptual information |
US20100137143A1 (en) | 2008-10-22 | 2010-06-03 | Ion Torrent Systems Incorporated | Methods and apparatus for measuring analytes |
EP2529030B1 (en) | 2010-01-29 | 2019-03-13 | Advanced Cell Diagnostics, Inc. | Methods of in situ detection of nucleic acids |
PL2556171T3 (pl) | 2010-04-05 | 2016-04-29 | Prognosys Biosciences Inc | Oznaczenia biologiczne kodowane przestrzennie |
US8774494B2 (en) | 2010-04-30 | 2014-07-08 | Complete Genomics, Inc. | Method and system for accurate alignment and registration of array for DNA sequencing |
US8951781B2 (en) | 2011-01-10 | 2015-02-10 | Illumina, Inc. | Systems, methods, and apparatuses to image a sample for biological or chemical analysis |
GB201106254D0 (en) | 2011-04-13 | 2011-05-25 | Frisen Jonas | Method and product |
JP6153516B2 (ja) | 2011-06-06 | 2017-06-28 | バイオカーティス エヌベー | イオン性界面活性剤による細胞の選択的溶解 |
ES2949570T3 (es) | 2012-04-03 | 2023-09-29 | Illumina Inc | Cabezal integrado de lectura optoelectrónica y cartucho de fluidos útiles para la secuenciación de ácidos nucleicos |
US9012022B2 (en) | 2012-06-08 | 2015-04-21 | Illumina, Inc. | Polymer coatings |
US20140378345A1 (en) | 2012-08-14 | 2014-12-25 | 10X Technologies, Inc. | Compositions and methods for sample processing |
US9783841B2 (en) | 2012-10-04 | 2017-10-10 | The Board Of Trustees Of The Leland Stanford Junior University | Detection of target nucleic acids in a cellular sample |
CA2886974C (en) | 2012-10-17 | 2021-06-29 | Spatial Transcriptomics Ab | Methods and product for optimising localised or spatial detection of gene expression in a tissue sample |
US9512422B2 (en) | 2013-02-26 | 2016-12-06 | Illumina, Inc. | Gel patterned surfaces |
US10138509B2 (en) | 2013-03-12 | 2018-11-27 | President And Fellows Of Harvard College | Method for generating a three-dimensional nucleic acid containing matrix |
CN105849275B (zh) | 2013-06-25 | 2020-03-17 | 普罗格诺西斯生物科学公司 | 检测样品中生物靶标的空间分布的方法和系统 |
US20150000854A1 (en) | 2013-06-27 | 2015-01-01 | The Procter & Gamble Company | Sheet products bearing designs that vary among successive sheets, and apparatus and methods for producing the same |
US10041949B2 (en) | 2013-09-13 | 2018-08-07 | The Board Of Trustees Of The Leland Stanford Junior University | Multiplexed imaging of tissues using mass tags and secondary ion mass spectrometry |
US10055551B2 (en) * | 2013-10-10 | 2018-08-21 | Board Of Regents Of The University Of Texas System | Systems and methods for quantitative analysis of histopathology images using multiclassifier ensemble schemes |
CN106460069B (zh) | 2014-04-18 | 2021-02-12 | 威廉马歇莱思大学 | 用于富集含稀有等位基因的物质的核酸分子的竞争性组合物 |
CA2953374A1 (en) | 2014-06-26 | 2015-12-30 | 10X Genomics, Inc. | Methods of analyzing nucleic acids from individual cells or cell populations |
US10179932B2 (en) | 2014-07-11 | 2019-01-15 | President And Fellows Of Harvard College | Methods for high-throughput labelling and detection of biological features in situ using microscopy |
US20160108458A1 (en) | 2014-10-06 | 2016-04-21 | The Board Of Trustees Of The Leland Stanford Junior University | Multiplexed detection and quantification of nucleic acids in single-cells |
ES2836802T3 (es) | 2015-02-27 | 2021-06-28 | Becton Dickinson Co | Códigos de barras moleculares espacialmente direccionables |
CA2982146A1 (en) | 2015-04-10 | 2016-10-13 | Spatial Transcriptomics Ab | Spatially distinguished, multiplex nucleic acid analysis of biological specimens |
BR112017021993A2 (pt) | 2015-04-14 | 2018-07-31 | Koninklijke Philips Nv | método para detecção espacial de ácidos nucleicos em uma amostra de tecido |
US10059990B2 (en) | 2015-04-14 | 2018-08-28 | Massachusetts Institute Of Technology | In situ nucleic acid sequencing of expanded biological samples |
JP6971218B2 (ja) | 2015-07-17 | 2021-11-24 | ナノストリング テクノロジーズ,インコーポレイティド | 横断組織切片のユーザー定義領域における遺伝子発現の同時定量 |
DK3329012T3 (da) | 2015-07-27 | 2021-10-11 | Illumina Inc | Rumlig kortlægning af nukleinsyresekvensinformation |
EP3332258B1 (en) | 2015-08-07 | 2020-01-01 | Massachusetts Institute of Technology | Protein retention expansion microscopy |
US10364457B2 (en) | 2015-08-07 | 2019-07-30 | Massachusetts Institute Of Technology | Nanoscale imaging of proteins and nucleic acids via expansion microscopy |
US20170241911A1 (en) | 2016-02-22 | 2017-08-24 | Miltenyi Biotec Gmbh | Automated analysis tool for biological specimens |
EP3420110B1 (en) | 2016-02-26 | 2021-09-22 | The Board of Trustees of the Leland Stanford Junior University | Multiplexed single molecule rna visualization with a two-probe proximity ligation system |
US20170253918A1 (en) | 2016-03-01 | 2017-09-07 | Expansion Technologies | Combining protein barcoding with expansion microscopy for in-situ, spatially-resolved proteomics |
WO2017161251A1 (en) | 2016-03-17 | 2017-09-21 | President And Fellows Of Harvard College | Methods for detecting and identifying genomic nucleic acids |
US20180052081A1 (en) | 2016-05-11 | 2018-02-22 | Expansion Technologies | Combining modified antibodies with expansion microscopy for in-situ, spatially-resolved proteomics |
WO2017214023A1 (en) * | 2016-06-10 | 2017-12-14 | Amnis Corporation | A method to combine brightfield and fluorescent channels for cell image segmentation and morphological analysis using images obtained from imaging flow cytometer (ifc) |
US11352667B2 (en) | 2016-06-21 | 2022-06-07 | 10X Genomics, Inc. | Nucleic acid sequencing |
US10370698B2 (en) | 2016-07-27 | 2019-08-06 | The Board Of Trustees Of The Leland Stanford Junior University | Highly-multiplexed fluorescent imaging |
EP4428536A3 (en) | 2016-08-31 | 2024-12-04 | President and Fellows of Harvard College | Methods of combining the detection of biomolecules into a single assay using fluorescent in situ sequencing |
GB2570412A (en) | 2016-08-31 | 2019-07-24 | Harvard College | Methods of generating libraries of nucleic acid sequences for detection via fluorescent in situ sequencing |
CN110352252B (zh) | 2016-09-22 | 2024-06-25 | 威廉马歇莱思大学 | 用于复杂序列捕获和分析的分子杂交探针 |
DK3529357T3 (da) | 2016-10-19 | 2022-04-25 | 10X Genomics Inc | Fremgangsmåder til stregkodning af nukleinsyremolekyler fra individuelle celler |
GB201619458D0 (en) | 2016-11-17 | 2017-01-04 | Spatial Transcriptomics Ab | Method for spatial tagging and analysing nucleic acids in a biological specimen |
US10656144B2 (en) | 2016-12-02 | 2020-05-19 | The Charlotte Mecklenburg Hospital Authority | Immune profiling and minimal residue disease following stem cell transplantation in multiple myeloma |
JP2020504600A (ja) | 2016-12-09 | 2020-02-13 | アルティヴュー, インク. | 標識化核酸イメージング剤を使用した多重イメージングのための改善された方法 |
US10995361B2 (en) | 2017-01-23 | 2021-05-04 | Massachusetts Institute Of Technology | Multiplexed signal amplified FISH via splinted ligation amplification and sequencing |
US20180312822A1 (en) | 2017-04-26 | 2018-11-01 | 10X Genomics, Inc. | Mmlv reverse transcriptase variants |
WO2019068880A1 (en) | 2017-10-06 | 2019-04-11 | Cartana Ab | RNA MATRIX LIGATION |
US11753676B2 (en) | 2017-10-11 | 2023-09-12 | Expansion Technologies | Multiplexed in situ hybridization of tissue sections for spatially resolved transcriptomics with expansion microscopy |
SG11201907566TA (en) | 2017-12-08 | 2019-09-27 | 10X Genomics Inc | Methods and compositions for labeling cells |
WO2019213254A1 (en) * | 2018-05-02 | 2019-11-07 | The General Hospital Corporation | High-resolution spatial macromolecule abundance assessment |
US20220025447A1 (en) | 2018-12-10 | 2022-01-27 | 10X Genomics, Inc. | Generating spatial arrays with gradients |
-
2020
- 2020-11-18 CN CN202080093520.5A patent/CN115004260A/zh active Pending
- 2020-11-18 US US16/951,854 patent/US12154266B2/en active Active
- 2020-11-18 CA CA3158603A patent/CA3158603A1/en active Pending
- 2020-11-18 WO PCT/US2020/061064 patent/WO2021102003A1/en unknown
- 2020-11-18 AU AU2020388047A patent/AU2020388047A1/en active Pending
- 2020-11-18 EP EP20824787.4A patent/EP4062316A1/en active Pending
-
2024
- 2024-10-18 US US18/920,755 patent/US20250045923A1/en active Pending
Also Published As
Publication number | Publication date |
---|---|
US12154266B2 (en) | 2024-11-26 |
WO2021102003A1 (en) | 2021-05-27 |
CA3158603A1 (en) | 2021-05-27 |
AU2020388047A1 (en) | 2022-06-23 |
US20210150707A1 (en) | 2021-05-20 |
EP4062316A1 (en) | 2022-09-28 |
US20250045923A1 (en) | 2025-02-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US12154266B2 (en) | Systems and methods for binary tissue classification | |
US12229974B2 (en) | Systems and methods for spatial analysis of analytes using fiducial alignment | |
EP4062373B1 (en) | Spatial analysis of analytes | |
US11933957B1 (en) | Imaging system hardware | |
US20230242976A1 (en) | Imaging system hardware | |
US20210189475A1 (en) | Imaging system hardware | |
US20230002812A1 (en) | Generating capture probes for spatial analysis | |
US20230238078A1 (en) | Systems and methods for machine learning biological samples to optimize permeabilization | |
US20210062272A1 (en) | Systems and methods for using the spatial distribution of haplotypes to determine a biological condition | |
US20230081232A1 (en) | Systems and methods for machine learning features in biological samples | |
WO2024036191A1 (en) | Systems and methods for colocalization |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |