本申请要求2020年11月10日提交的美国临时专利申请第63/112,071号、2021年1月29日提交的美国临时专利申请第63/143,738号、2021年3月25日提交的美国临时专利申请第63/166,173号、2021年5月28日提交的美国临时专利申请第63/194,612号和2020年8月25日提交的美国临时专利申请第63/070,205号的权益,这些专利申请中的每一个通过引用以其整体并入本文。
发明内容
在一些方面,本公开描述了一种用于分析来自对象的生物样本的方法,其包括:(a)测定来自对象的生物样本以鉴定生物样本中的蛋白质,从而获得生物样本的蛋白质组信息;(b)分析来自生物样本的核酸分子,以鉴定生物样本的基因型信息;和(c)基于蛋白质组信息和基因型信息,鉴定对象的肽变体或基因组变体,其中肽变体或基因组变体无法分别在(a)或(b)中鉴定。
在一些实施方案中,生物样本包括全血、血浆、血沉棕黄层、血清、尿液、脑脊液、滑液、泪液、唾液、全血、奶汁、乳头抽吸物、针抽吸物、导管灌洗液、阴道分泌物、鼻液、耳液、胃液、胰液、小梁液、肺灌洗液、汗液、沟液、精液、前列腺液、痰、粪便、支气管灌洗液、来自拭子的液体、支气管抽吸物、流化固体、细针抽吸样本、组织匀浆、淋巴液、细胞培养样本或其任何组合。
在一些实施方案中,生物样本包括血浆或血清。
在一些实施方案中,生物样本包括超过5000种类型的蛋白质。
在一些实施方案中,(a)包括使生物样本经受鉴定生物样本中多种蛋白质的测定。
在一些实施方案中,(a)包括在足以将蛋白质从生物样本吸附到颗粒的条件下,使生物样本与颗粒接触。
在一些实施方案中,蛋白质包括颗粒的压缩的动态范围。
在一些实施方案中,吸附到颗粒的蛋白质包括一种或多种蛋白质,所述一种或多种蛋白质具有与生物样本中的丰度相比更低的丰度。
在一些实施方案中,颗粒的每平方毫米(mm2)表面积吸附至少10-9毫克(mg)蛋白质。
在一些实施方案中,颗粒包括具有不同物理化学性质的多种颗粒。
在一些实施方案中,多种颗粒包括以下中的至少两种:二氧化硅涂覆的SPION、PDMAPMA-聚合物官能化的纳米颗粒、葡萄糖-6-磷酸酯官能化的纳米颗粒、聚苯乙烯羧基官能化的纳米颗粒、葡聚糖官能化的纳米颗粒、混合酰胺和羧酸酯官能化的二氧化硅涂覆的纳米颗粒、三胺官能化的纳米颗粒、二胺官能化的纳米颗粒或单胺官能化的纳米颗粒。
在一些实施方案中,多种颗粒包括以下中的至少两种:二氧化硅涂覆的SPION、PDMAPMA-聚合物官能化的纳米颗粒、葡萄糖-6-磷酸酯官能化的纳米颗粒、聚苯乙烯羧基官能化的纳米颗粒、葡聚糖官能化的纳米颗粒、混合酰胺和羧酸酯官能化的二氧化硅涂覆的纳米颗粒、N-(3-三甲氧基甲硅烷基丙基)二亚乙基三胺涂覆的纳米颗粒、N1-(3-(三甲氧基甲硅烷基)丙基)己烷-1,6-二胺官能化的纳米颗粒或1,6-己二胺官能化的纳米颗粒。
在一些实施方案中,不同的物理化学性质包括尺寸、形状、表面官能化、芯材、密度或其任何组合。
在一些实施方案中,由多种颗粒中的第一颗粒吸附的蛋白质的第一蛋白质子集包括与由多种颗粒中的第二颗粒吸附的蛋白质的第二蛋白质子集共有的至多80%的蛋白质类型。
在一些实施方案中,蛋白质包括至少5种类型的蛋白质。
在一些实施方案中,蛋白质包括至少200种类型的蛋白质。
在一些实施方案中,蛋白质包括至少500种类型的蛋白质。
在一些实施方案中,蛋白质包括至少1000种类型的蛋白质。
在一些实施方案中,蛋白质包括至少2000种类型的蛋白质。
在一些实施方案中,蛋白质包括至少5000种类型的蛋白质。
在一些实施方案中,蛋白质包括5至1000种类型的蛋白质。
在一些实施方案中,蛋白质包括20至200种类型的蛋白质。
在一些实施方案中,蛋白质包括约50至500种类型的蛋白质或蛋白质群组。
在一些实施方案中,蛋白质包括约250至25000种类型的蛋白质或蛋白质群组。
在一些实施方案中,蛋白质占生物样本中蛋白质类型的至少2%。
在一些实施方案中,蛋白质占生物样本中蛋白质类型的0.2%至2%。
在一些实施方案中,(a)包括鉴定生物样本中蛋白质的丰度。
在一些实施方案中,(c)包括基于蛋白质组信息和基因型信息鉴定蛋白质的剪接变体、构象、翻译后修饰、辅因子关联或基底关联。
在一些实施方案中,蛋白质在生物样本中的浓度跨越至少4个数量级。
在一些实施方案中,所述方法进一步包括获得核酸分子的序列以鉴定基因型信息。
在一些实施方案中,获得序列包括荧光原位杂交(FISH)、阵列比较基因组杂交(阵列-CGH)、定量荧光PCR(QF-PCR)、纳米孔测序、杂交测序、合成测序、连接测序或其任何组合。
在一些实施方案中,核酸分子包括无细胞脱氧核糖核酸(cfDNA)、无细胞核糖核酸(cfRNA)或其任何组合。
在一些实施方案中,无细胞脱氧核糖核酸(cfDNA)包括基因组DNA、线粒体DNA(mtDNA)、循环肿瘤DNA(ctDNA)或其任何组合。
在一些实施方案中,(b)包括将核酸分子鉴定为包括基因组DNA、线粒体DNA(mtDNA)、循环肿瘤DNA(ctDNA)或其任何组合。
在一些实施方案中,(b)包括鉴定ctDNA的细胞类型、癌症类型、癌症阶段或其任何组合。
在一些实施方案中,(c)的鉴定包括鉴定ctDNA的细胞类型、癌症类型或癌症阶段。
在一些实施方案中,无细胞核糖核酸(cfRNA)包括信使RNA(mRNA)、长非编码RNA、端粒酶RNA、Piwi相互作用RNA、核糖体RNA(rRNA)、小核RNA(snRNA)、小干扰RNA(siRNA)、YRNA、微小RNA(miRNA)、环状RNA、小核仁RNA(snRNA)、假基因RNA、转移RNA(tRNA)或其任何组合。
在一些实施方案中,(b)包括将核酸分子鉴定为包括信使RNA(mRNA)、长非编码RNA、端粒酶RNA、Piwi相互作用RNA、核糖体RNA(rRNA)、小核RNA(snRNA)、小干扰RNA(siRNA)、YRNA、微小RNA(miRNA)、环状RNA、小核仁RNA(snRNA)、假基因RNA、转移RNA(tRNA)或其任何组合的序列。
在一些实施方案中,核酸分子来源于外泌体、凋亡体、肿瘤细胞、健康细胞、病毒体、胞外膜囊泡、嗜中性粒细胞胞外陷阱(NET)或其任何组合。
在一些实施方案中,(b)包括鉴定来源于外泌体、凋亡体、患病细胞、健康细胞、病毒体、胞外膜囊泡、嗜中性粒细胞胞外陷阱(NET)或其任何组合的核酸分子。
在一些实施方案中,(b)包括鉴定所述样本来源于的生物体中健康细胞或患病细胞的凋亡的比率或流行率。
在一些实施方案中,(b)包括鉴定健康细胞或患病细胞的丰度。
在一些实施方案中,(b)包括鉴定健康细胞或患病细胞的细胞类型。
在一些实施方案中,所述方法进一步包括鉴定与细胞类型相关联或来源于所述细胞类型的蛋白质的子集。
在一些实施方案中,(c)的鉴定包括鉴定与细胞类型相关联或来源于所述细胞类型的蛋白质的子集。
在一些实施方案中,所述方法进一步包括鉴定蛋白质的化学修饰。
在一些实施方案中,肽变体或基因组变体包括化学修饰。
在一些实施方案中,所述方法进一步包括至少部分地基于化学修饰来鉴定样本的生物学状态。
在一些实施方案中,分析核酸分子包括获得序列读数并将序列读数相对于参考序列进行比对,以鉴定基因型信息。
在一些实施方案中,分析核酸分子包括鉴定核酸分子的化学修饰。
在一些实施方案中,鉴定肽变体或基因组变体包括鉴定核酸分子的化学修饰。
在一些实施方案中,所述方法进一步包括至少部分地基于所述化学修饰来鉴定来源细胞的生物学状态。
在一些实施方案中,所述方法进一步包括基于蛋白质组信息和基因型信息确定生物样本具有生物学状态的概率。
在一些实施方案中,(b)包括使核酸分子经受鉴定生物样本的基因型信息的分析。
在一些方面,本公开描述了一种用于分析来自对象的生物样本的方法,其包括:(a)分析来自对象的生物样本中的核酸分子,以鉴定核酸分子来源于的细胞类型;和(b)定量生物样本中与所述细胞类型相关联的多种蛋白质的蛋白质丰度。
在一些实施方案中,生物样本包括全血、血浆、血沉棕黄层、血清、尿液、脑脊液、滑液、泪液、唾液、全血、奶汁、乳头抽吸物、针抽吸物、导管灌洗液、阴道分泌物、鼻液、耳液、胃液、胰液、小梁液、肺灌洗液、汗液、沟液、精液、前列腺液、痰、粪便、支气管灌洗液、来自拭子的液体、支气管抽吸物、流化固体、细针抽吸样本、组织匀浆、淋巴液、细胞培养样本或其任何组合。
在一些实施方案中,生物样本包括血浆或血清。
在一些实施方案中,生物样本包括超过1000种类型的蛋白质。
在一些实施方案中,所述方法进一步包括获得核酸分子的序列以鉴定基因型信息。
在一些实施方案中,获得序列包括荧光原位杂交(FISH)、阵列比较基因组杂交(阵列-CGH)、定量荧光PCR(QF-PCR)、纳米孔测序、杂交测序、合成测序、连接测序或其任何组合。
在一些实施方案中,分析核酸分子包括鉴定核酸分子的化学修饰。
在一些实施方案中,化学修饰包括甲基化、去甲基化、胺化、脱氨基化、乙酰化、氧化、氧合(oxygenation)、还原或其任何组合。
在一些实施方案中,鉴定核酸分子来源于的细胞类型至少部分地基于化学修饰的鉴定。
在一些实施方案中,分析鉴定了核酸分子的非标准核碱基。
在一些实施方案中,非标准核碱基包括次黄嘌呤、黄嘌呤、7-甲基鸟嘌呤、5,6-二氢尿嘧啶、5-甲基胞嘧啶或其任何组合。
在一些实施方案中,鉴定核酸分子来源于的细胞类型至少部分地基于非标准核碱基的鉴定。
在一些实施方案中,分析鉴定了核酸分子的转录后修饰。
在一些实施方案中,转录后修饰包括5’加帽、3’切割、3’聚腺苷酸化、剪接或其任何组合。
在一些实施方案中,鉴定核酸分子来源于的细胞类型至少部分地基于转录后修饰的鉴定。
在一些实施方案中,分析包括鉴定核酸的非翻译区。
在一些实施方案中,鉴定核酸分子来源于的细胞类型至少部分地基于非翻译区的鉴定。
在一些实施方案中,定量蛋白质丰度包括使生物样本与颗粒接触,从而在包括多种蛋白质的颗粒上形成生物分子冠状物。
在一些实施方案中,多种蛋白质在生物分子冠状物内具有压缩的动态范围。
在一些实施方案中,生物分子冠状物包含一种或多种高丰度蛋白质,所述高丰度蛋白质具有与生物样本中的丰度相比降低的丰度。
在一些实施方案中,生物分子冠状物包含每mm2颗粒表面积至少10-9mg多种蛋白质。
在一些实施方案中,颗粒包括有包括不同物理化学性质的多种颗粒。
在一些实施方案中,多种颗粒包括以下中的至少两种:二氧化硅涂覆的SPION、三胺官能化的纳米颗粒、PDMAPMA-聚合物官能化的纳米颗粒、葡萄糖-6-磷酸酯官能化的纳米颗粒、单胺官能化的纳米颗粒。
在一些实施方案中,不同的物理化学性质包括尺寸、形状、表面官能化、芯材、密度或其任何组合。
在一些实施方案中,由多种颗粒中的第一颗粒吸附的多种蛋白质的第一蛋白质子集包括与由多种颗粒中的第二颗粒吸附的多种蛋白质的第二蛋白质子集共有的至多80%的蛋白质类型。
在一些实施方案中,多种蛋白质包括至少5种类型的蛋白质。
在一些实施方案中,多种蛋白质包括至少200种类型的蛋白质。
在一些实施方案中,多种蛋白质包括至少500种类型的蛋白质。
在一些实施方案中,多种蛋白质包括5至1000种类型的蛋白质。
在一些实施方案中,蛋白质包括20至200种类型的蛋白质。
在一些实施方案中,蛋白质包括约50至500种类型的蛋白质或蛋白质群组。
在一些实施方案中,蛋白质包括约250至25000种类型的蛋白质或蛋白质群组。
在一些实施方案中,多种蛋白质占生物样本中蛋白质类型的至少2%。
在一些实施方案中,多种蛋白质占生物样本中蛋白质类型的0.2%至2%。
在一些实施方案中,多种蛋白质在生物样本中的浓度跨越至少4个数量级。
在一些实施方案中,定量蛋白质丰度包括鉴定多种蛋白质的剪接变体、构象、翻译后修饰、辅因子关联或基底关联。
在一些实施方案中,定量蛋白质丰度包括鉴定相对剪接变体丰度。
在一些实施方案中,所述方法进一步包括至少部分地基于蛋白质丰度来鉴定血浆样本的生物学状态。
在一些实施方案中,核酸分子包括无细胞核酸。
在一些实施方案中,无细胞核酸包括无细胞脱氧核糖核酸(cfDNA)或无细胞核糖核酸(cfRNA)。
在一些实施方案中,(a)包括使核酸分子经受分析以鉴定细胞类型。
在一些实施方案中,(b)包括对生物样本中多种蛋白质的蛋白质丰度进行定量。
在一些方面,本公开描述了一种用于将来自对象的生物样本分级分离(fractionating)的方法,其包括:(a)使生物样本与多种颗粒接触,以在多种颗粒上形成生物分子冠状物,所述生物分子冠状物包含来自所述生物样本的蛋白质和核酸分子;和(b)从生物样本中分离生物分子冠状物的至少一个子集,从而分级分离所述生物样本。
在一些实施方案中,生物样本包括全血、血浆、血沉棕黄层、血清、尿液、脑脊液、滑液、泪液、唾液、全血、奶汁、乳头抽吸物、针抽吸物、导管灌洗液、阴道分泌物、鼻液、耳液、胃液、胰液、小梁液、肺灌洗液、汗液、沟液、精液、前列腺液、痰、粪便、支气管灌洗液、来自拭子的液体、支气管抽吸物、流化固体、细针抽吸样本、组织匀浆、淋巴液、细胞培养样本或其任何组合。
在一些实施方案中,多种颗粒包括以下中的至少两种:二氧化硅涂覆的SPION、PDMAPMA-聚合物官能化的纳米颗粒、葡萄糖-6-磷酸酯官能化的纳米颗粒、聚苯乙烯羧基官能化的纳米颗粒、葡聚糖官能化的纳米颗粒、混合酰胺和羧酸酯官能化的二氧化硅涂覆的纳米颗粒、三胺官能化的纳米颗粒、二胺官能化的纳米颗粒或单胺官能化的纳米颗粒。
在一些实施方案中,多种颗粒包括以下中的至少两种:二氧化硅涂覆的SPION、PDMAPMA-聚合物官能化的纳米颗粒、葡萄糖-6-磷酸酯官能化的纳米颗粒、聚苯乙烯羧基官能化的纳米颗粒、葡聚糖官能化的纳米颗粒、混合酰胺和羧酸酯官能化的二氧化硅涂覆的纳米颗粒、N-(3-三甲氧基甲硅烷基丙基)二亚乙基三胺涂覆的纳米颗粒、N1-(3-(三甲氧基甲硅烷基)丙基)己烷-1,6-二胺官能化的纳米颗粒或1,6-己二胺官能化的纳米颗粒。
在一些实施方案中,生物样本包括血浆或血清。
在一些实施方案中,所述方法进一步包括裂解外泌体、凋亡体、细胞、病毒体或其任何组合。
在一些实施方案中,生物分子冠状物的蛋白质或核酸来源于裂解。
在一些实施方案中,核酸分子包括无细胞核酸。
在一些实施方案中,核酸分子包括无细胞脱氧核糖核酸(cfDNA)或无细胞核糖核酸(cfRNA)。
在一些实施方案中,无细胞脱氧核糖核酸(cfDNA)包括基因组DNA、线粒体DNA(mtDNA)、循环肿瘤DNA(ctDNA)或其任何组合。
在一些实施方案中,无细胞核糖核酸(cfRNA)包括信使RNA(mRNA)、长非编码RNA、端粒酶RNA、Piwi相互作用RNA、核糖体RNA(rRNA)、小核RNA(snRNA)、小干扰RNA(siRNA)、YRNA、微小RNA(miRNA)、环状RNA、小核仁RNA(snRNA)、假基因RNA、转移RNA(tRNA)或其任何组合。
在一些实施方案中,生物分子冠状物的核酸分子包括至少30个核苷酸的平均长度。
在一些实施方案中,生物分子冠状物的核酸分子包括至少60个核苷酸的平均长度。
在一些实施方案中,生物分子冠状物的核酸分子具有与生物样本的核酸分子相比更大的平均长度。
在一些实施方案中,蛋白质包括至少5种类型的蛋白质。
在一些实施方案中,蛋白质包括至少200种类型的蛋白质。
在一些实施方案中,蛋白质包括至少500种类型的蛋白质。
在一些实施方案中,蛋白质包括至少1000种类型的蛋白质。
在一些实施方案中,蛋白质包括至少2000种类型的蛋白质。
在一些实施方案中,蛋白质包括至少5000种类型的蛋白质。
在一些实施方案中,蛋白质包括5至1000种类型的蛋白质。
在一些实施方案中,蛋白质包括20至200种类型的蛋白质。
在一些实施方案中,蛋白质包括约50至500种类型的蛋白质或蛋白质群组。
在一些实施方案中,蛋白质包括约250至25000种类型的蛋白质或蛋白质群组。
在一些实施方案中,蛋白质占生物样本中蛋白质类型的至少2%。
在一些实施方案中,蛋白质占生物样本中蛋白质类型的0.2%至2%。
在一些实施方案中,蛋白质包括一种或多种高丰度蛋白质,所述高丰度蛋白质具有相对于生物样本中的丰度降低的丰度。
在一些实施方案中,来自蛋白质的蛋白质包括在生物样本中的小于或等于约100ng/ml的浓度。
在一些方面,本公开描述了一种用于分析来自对象的生物样本的方法,其包括:(a)测定来自对象的生物样本中的蛋白质,以鉴定可归属于第一多种蛋白质或蛋白质片段的信号;(b)测定生物样本中核酸分子的核酸序列数据,从而鉴定与所述核酸序列相关联的第二多种蛋白质或蛋白质片段;和(c)从第一多种蛋白质或蛋白质片段中鉴定生物样本中的一种或多种蛋白质,其中在没有所述核酸序列数据的情况下所述一种或多种蛋白质是无法鉴定的。
在一些实施方案中,生物样本具有小于或等于约500微升(μL)的体积。
在一些实施方案中,生物样本包括血浆或血清。
在一些实施方案中,测定蛋白质包括将蛋白质吸附到颗粒。
在一些实施方案中,相对于来自生物样本的高丰度蛋白质,将蛋白质吸附到颗粒富集了来自生物样本的低丰度蛋白质。
在一些实施方案中,将蛋白质吸附到颗粒压缩了蛋白质的动态范围。
在一些实施方案中,测定蛋白质包括质谱分析。
在一些实施方案中,测定蛋白质包括亲和捕获、组织学或其任何组合。
在一些实施方案中,测定蛋白质包括对蛋白质进行测序。
在一些实施方案中,测定蛋白质包括鉴定翻译后修饰。
在一些实施方案中,翻译后修饰包括酰化、烷基化、异戊烯化、黄素化(flavination)、酰胺化、胺化、脱氨基化、羧化、脱羧、亚硝基化、甲酰化、瓜氨酸化、糖基化、糖化、卤化、羟基化、磷酸化、磺酰化、谷胱甘肽化、琥珀酰化、羰基化、氨基甲酰化、氧化、氧合、还原、泛素化、苏素化(SUMOylation)、拟素化(neddylation)或其任何组合。
在一些实施方案中,测定核酸分子包括荧光原位杂交(FISH)、阵列比较基因组杂交(阵列-CGH)、定量荧光PCR(QF-PCR)、纳米孔测序、杂交测序、合成测序、连接测序或其任何组合。
在一些实施方案中,测定核酸分子包括测序。
在一些实施方案中,鉴定第二多种蛋白质或蛋白质片段包括对核酸分子的编码区进行测序。
在一些实施方案中,鉴定第二多种蛋白质或蛋白质片段包括对核酸分子的非编码区进行测序。
在一些实施方案中,鉴定第二多种蛋白质或蛋白质片段包括鉴定与所述核酸分子中的核酸分子结合的蛋白质或蛋白质片段。
在一些实施方案中,(c)的鉴定包括鉴定一种或多种蛋白质同种型。
在一些实施方案中,所述一种或多种蛋白质指示生物样本中生物学状态或病况的存在或不存在。
在一些实施方案中,生物学状态或病况包括癌症。
在一些实施方案中,(c)的鉴定鉴定癌症的阶段。
在一些实施方案中,所述一种或多种蛋白质包括第一多种蛋白质中的蛋白质的同种型。
在一些实施方案中,鉴定包括鉴定与一种或多种蛋白质相关联的信号,并且所述信号与可归属于第一多种蛋白质的信号中的信号重叠。
在一些方面,本公开描述了一种用于处理来自对象的生物样本的方法,其包括:(a)测定来自对象的生物样本中的核酸分子,以获得核酸分子或其片段的核酸序列;(b)计算机处理所述核酸序列以产生数据,所述数据包括与核苷酸序列相关联的蛋白质的蛋白质序列;(c)测定生物样本中可归属于所述蛋白质的至少一个子集的信号;和(d)至少部分地基于(b)中产生的数据,从所述蛋白质的至少所述子集中鉴定蛋白质。
在一些实施方案中,测定核酸分子包括荧光原位杂交(FISH)、阵列比较基因组杂交(阵列-CGH)、定量荧光PCR(QF-PCR)、纳米孔测序、杂交测序、合成测序、连接测序或其任何组合。
在一些实施方案中,核酸分子包括无细胞脱氧核糖核酸(cfDNA)、无细胞核糖核酸(cfRNA)或其任何组合。
在一些实施方案中,测定核酸分子包括从外泌体、凋亡体、患病细胞、健康细胞、病毒体、胞外膜囊泡、嗜中性粒细胞胞外陷阱(NET)或其任何组合收集核酸分子的至少一个子集。
在一些实施方案中,与核苷酸序列相关联的蛋白质序列包括未被核酸序列编码的蛋白质。
在一些实施方案中,(c)的测定包括使生物样本与颗粒接触,从而在包括所述蛋白质的至少所述子集的颗粒上形成生物分子冠状物。
在一些实施方案中,(c)的测定包括质谱法、肽测序、肽亲和捕获、组织学、色谱法或其任何组合。
在一些实施方案中,所述蛋白质的至少所述子集包括至少20种蛋白质。
在一些实施方案中,所述蛋白质的至少所述子集包括至少200种蛋白质。
在一些实施方案中,所述蛋白质的至少所述子集包括至少500种蛋白质。
在一些实施方案中,可归属于所述蛋白质的至少所述子集的信号包括至少100,000个信号。
在一些实施方案中,可归属于所述蛋白质的至少所述子集的信号包括至少1,000,000个信号。
在一些实施方案中,鉴定包括从所述蛋白质的至少所述子集中鉴定剪接变体。
在一些实施方案中,鉴定剪接变体包括鉴定多个剪接变体的丰度比。
在一些实施方案中,蛋白质与生物样本中的生物学病况或状态相关联。
在一些实施方案中,可归属于所述蛋白质的至少所述子集的信号包括多个重叠信号,并且其中所述鉴定包括确定来自所述蛋白质的至少所述子集的蛋白质的所述多个重叠信号中的重叠信号的强度。
在一些实施方案中,所述方法进一步包括从所述蛋白质的至少所述子集中鉴定第一蛋白质和第二蛋白质的丰度比,其中所述第一蛋白质和所述第二蛋白质与所述多个重叠信号中的信号相关联。
在一些实施方案中,重叠信号中的信号包括质谱信号。
在一些实施方案中,质谱信号与多个串联质谱信号相关联,并且其中鉴定包括至少部分地基于(b)的蛋白质序列分配串联质谱信号。
在一些方面,本公开描述了一种用于测定生物样本的方法,其包括:(a)提供包含表面修饰的颗粒和支持剂的干组合物,所述表面修饰的颗粒具有可变地选择性吸附多个生物分子或生物分子群组的物理化学性质;(b)在液体中重构干组合物;和(c)使生物样本与在(b)中重构的干组合物接触,以在表面修饰的颗粒的表面上吸附至少一部分所述生物分子或生物分子群组。
在一些实施方案中,生物分子或生物分子群组包括蛋白质或蛋白质群组。
在一些实施方案中,蛋白质或蛋白质群组在生物样本中的浓度具有至少7个数量级的动态范围。
在一些实施方案中,蛋白质或蛋白质群组在生物样本中的浓度具有至少8个数量级的动态范围。
在一些实施方案中,蛋白质或蛋白质群组在生物样本中的浓度具有至少9个数量级的动态范围。
在一些实施方案中,蛋白质或蛋白质群组在生物样本中的浓度具有至少10个数量级的动态范围。
在一些实施方案中,液体包括水、有机溶剂或其组合或混合物。
在一些实施方案中,生物样本包括血浆、血清、CSF、尿液、泪液、细胞裂解物、组织裂解物、细胞匀浆、组织匀浆、针抽吸物、粪便样本、滑液、全血、唾液或其组合。
在一些实施方案中,支持剂包括赋形剂。
在一些实施方案中,支持剂是赋形剂。
在一些实施方案中,赋形剂包括葡聚糖、PEG、蔗糖、葡萄糖、海藻糖、乳糖、聚山梨醇酯、氨基酸、甘露醇、甘氨酸、甘油或其任何组合或变体。
在一些实施方案中,干组合物呈冻干珠的形式。
在一些实施方案中,干组合物在多孔板、流体通道、流体腔室或管的容积内。
在一些实施方案中,在(b)中,干组合物在多孔板、流体通道、流体腔室或管的容积内重构。
在一些实施方案中,在(c)中,使重构的干组合物与多孔板、流体通道、流体腔室或管的容积内的生物样本接触。
在一些实施方案中,干组合物是在多孔板、流体通道、流体腔室或管的容积内的冻干珠。
在一些实施方案中,干组合物是多孔板、流体通道、流体腔室或管的容积内的多个冻干珠。
在一些实施方案中,干组合物包含有包括表面修饰的颗粒的多种颗粒。
在一些实施方案中,多种颗粒的至少一个子集中的单独的颗粒包括不同的表面。
在一些实施方案中,多种颗粒的至少一个子集中的单独的颗粒在至少一种物理化学性质上不同于另一个子集。
在一些实施方案中,单独的颗粒各自包括不同的物理化学性质,以用于可变地选择性吸附生物分子或生物分子群组的不同集合。
在一些实施方案中,多种颗粒包括至少两种或更多种不同的颗粒类型。
在一些实施方案中,多种颗粒包括至少六种或更多种不同的颗粒类型。
在一些实施方案中,多种颗粒包括至少十种或更多种不同的颗粒类型。
在一些实施方案中,多种颗粒包括以下中的至少两种:二氧化硅涂覆的SPION、PDMAPMA-聚合物官能化的纳米颗粒、葡萄糖-6-磷酸酯官能化的纳米颗粒、聚苯乙烯羧基官能化的纳米颗粒、葡聚糖官能化的纳米颗粒、混合酰胺和羧酸酯官能化的二氧化硅涂覆的纳米颗粒、三胺官能化的纳米颗粒、二胺官能化的纳米颗粒或单胺官能化的纳米颗粒。
在一些实施方案中,多种颗粒包括以下中的至少两种:二氧化硅涂覆的SPION、PDMAPMA-聚合物官能化的纳米颗粒、葡萄糖-6-磷酸酯官能化的纳米颗粒、聚苯乙烯羧基官能化的纳米颗粒、葡聚糖官能化的纳米颗粒、混合酰胺和羧酸酯官能化的二氧化硅涂覆的纳米颗粒、N-(3-三甲氧基甲硅烷基丙基)二亚乙基三胺涂覆的纳米颗粒、N1-(3-(三甲氧基甲硅烷基)丙基)己烷-1,6-二胺官能化的纳米颗粒或1,6-己二胺官能化的纳米颗粒。
在一些实施方案中,多种颗粒包括磁性颗粒。
在一些实施方案中,多种颗粒包括纳米颗粒、微粒或其组合。
在一些实施方案中,多种颗粒包括纳米颗粒和微粒。
在一些实施方案中,表面修饰的颗粒不包括抗体、T细胞受体、嵌合抗原受体、受体蛋白或其变体或片段。
在一些实施方案中,所述方法进一步包括在(a)之前,产生包含表面修饰的颗粒和支持剂的溶液或悬浮液。
在一些实施方案中,溶液或悬浮液具有大于1微升(μL)的体积。
在一些实施方案中,溶液或悬浮液具有小于100μL的体积。
在一些实施方案中,溶液或悬浮液具有在2微升(μL)和60μL之间的体积。
在一些实施方案中,溶液或悬浮液具有在25μL和45μL之间的体积。
在一些实施方案中,溶液或悬浮液中的支持剂具有大于50mg/mL的浓度。
在一些实施方案中,溶液或悬浮液中的支持剂具有小于250mg/mL的浓度。
在一些实施方案中,溶液或悬浮液中的支持剂具有在100mg/mL和200mg/mL之间的浓度。
在一些实施方案中,溶液或悬浮液具有大于2.5毫克/毫升(mg/mL)的颗粒浓度。
在一些实施方案中,溶液或悬浮液具有小于100mg/mL的颗粒浓度。
在一些实施方案中,溶液或悬浮液具有在10mg/mL和100mg/mL之间的颗粒浓度。
在一些实施方案中,溶液或悬浮液具有在15mg/mL和80mg/mL之间的颗粒浓度。
在一些实施方案中,干组合物是每个珠包括至少0.5mg表面修饰的颗粒的珠。
在一些实施方案中,干组合物是每个珠包括0.5mg至约5mg表面修饰的颗粒的珠。
在一些实施方案中,在(b)之后的表面修饰的颗粒的直径为溶液或悬浮液中表面修饰的颗粒的直径的约90%至约110%。
在一些实施方案中,在(b)之后的表面修饰的颗粒的ζ电势为在快速冷冻之前液体中相同表面修饰的颗粒的ζ电势的约90%至约110%。
在一些实施方案中,在(c)之后的表面修饰的颗粒吸附的生物样本中的生物分子是在不存在冻干的情况下溶解在液体中的相同表面修饰的颗粒将从生物样本中吸附的生物分子的至少90%。
在一些实施方案中,所述方法进一步包括快速冷冻所述溶液或悬浮液以产生冷冻组合物,并且其中快速冷冻是在液氮中、在冷板上或在冷却空气中进行的。
在一些实施方案中,所述方法进一步包括冻干冷冻组合物以产生干组合物。
在一些实施方案中,所述方法进一步包括在孔或管中原位进行快速冷冻。
在一些实施方案中,所述方法进一步包括在多个孔或多个管中进行快速冷冻。
在一些实施方案中,重构包括在25℃下至少0.1min-1的速率。
在一些实施方案中,重构包括在25℃下至少0.5min-1的速率。
在一些实施方案中,重构进行至多20分钟。
在一些实施方案中,重构包括超声处理、摇动或混合。
在一些实施方案中,重构不包括物理扰动。
在一些实施方案中,在重构之后,表面修饰的颗粒基本上不含颗粒聚集体。
在一些实施方案中,在重构之后,液体包括在约5和约9之间的pH。
在一些实施方案中,可变地选择性吸附包括低结合亲和力、慢结合动力学或两者。
在一些实施方案中,可变地选择性吸附包括不是蛋白质-配体相互作用的相互作用。
在一些实施方案中,可变地选择性吸附包括与表面修饰的颗粒的表面接触的多个生物分子或生物分子群组,其中所述表面不包括官能化的蛋白质。
在一些实施方案中,多个生物分子或生物分子群组的可变地选择性吸附形成生物分子冠状物。
在一些方面,本公开描述了一种用于测定生物流体样本的方法,其包括:(a)提供包含表面修饰的颗粒和冻干的支持剂的干组合物,所述表面修饰的颗粒对多个生物分子或生物分子群组具有亲和力;和(b)在不存在干组合物的重构的情况下,使生物流体样本与干组合物接触,以在表面修饰的颗粒的表面上吸附至少一部分所述生物分子或生物分子群组。
在一些实施方案中,生物流体样本包括血浆、血清、CSF、尿液、泪液、细胞裂解物、组织裂解物、细胞匀浆、组织匀浆、乳头抽吸物、针抽吸物、粪便样本、滑液、全血、唾液或其组合。
在一些实施方案中,生物流体样本在(b)之前以约1份生物流体样本比至少约1份缓冲溶液的体积比在缓冲溶液中稀释。
在一些实施方案中,生物流体样本在(b)之前以约1份生物流体样本比至少约2份缓冲溶液的体积比在缓冲溶液中稀释。
在一些实施方案中,生物流体样本在(b)之前以约1份生物流体样本比至少约5份缓冲溶液的体积比在缓冲溶液中稀释。
在一些实施方案中,生物流体样本在(b)之前以约1份生物流体样本比至少约10份缓冲溶液的体积比在缓冲溶液中稀释。
在一些实施方案中,生物流体样本在(b)之前以约1份生物流体样本比至少约20份缓冲溶液的体积比在缓冲溶液中稀释。
在一些实施方案中,生物分子或生物分子群组包括蛋白质或蛋白质群组。
在一些实施方案中,蛋白质或蛋白质群组在生物流体样本中的浓度具有至少7个数量级的动态范围。
在一些实施方案中,蛋白质或蛋白质群组在生物流体样本中的浓度具有至少8个数量级的动态范围。
在一些实施方案中,蛋白质或蛋白质群组在生物流体样本中的浓度具有至少9个数量级的动态范围。
在一些实施方案中,蛋白质或蛋白质群组在生物流体样本中的浓度具有至少10个数量级的动态范围。
在一些实施方案中,支持剂包括赋形剂。
在一些实施方案中,支持剂是赋形剂。
在一些实施方案中,赋形剂包括葡聚糖、PEG、蔗糖、葡萄糖、海藻糖、乳糖、聚山梨醇酯、氨基酸、甘露醇、甘氨酸、甘油或其任何组合或变体。
在一些实施方案中,干组合物是冻干珠。
在一些实施方案中,冻干珠包括在2微升2微升(μL)和60μL之间的体积。
在一些实施方案中,干组合物在多孔板或管的容积内。
在一些实施方案中,干组合物是在多孔板或管的容积内的冻干珠。
在一些实施方案中,干组合物是在多孔板或管的容积内的多个冻干珠。
在一些实施方案中,干组合物包含有包括表面修饰的颗粒的多种颗粒。
在一些实施方案中,在(b)之后,至少99.9%的所述多种颗粒在生物流体样本中是非聚集的。
在一些实施方案中,多种颗粒的至少一个子集中的单独的颗粒在至少一种物理化学性质上不同于另一个子集。
在一些实施方案中,单独的颗粒各自包括不同的物理化学性质,以用于可变地选择性吸附生物分子或生物分子群组的不同集合。
在一些实施方案中,多种颗粒包括至少两种或更多种不同的颗粒类型。
在一些实施方案中,多种颗粒包括至少六种或更多种不同的颗粒类型。
在一些实施方案中,多种颗粒包括至少十种或更多种不同的颗粒类型。
在一些实施方案中,所述多种颗粒包括以下中的至少两种:二氧化硅涂覆的SPION、PDMAPMA-聚合物官能化的纳米颗粒、葡萄糖-6-磷酸酯官能化的纳米颗粒、聚苯乙烯羧基官能化的纳米颗粒、葡聚糖官能化的纳米颗粒、混合酰胺和羧酸酯官能化的二氧化硅涂覆的纳米颗粒、三胺官能化的纳米颗粒、二胺官能化的纳米颗粒或单胺官能化的纳米颗粒。
在一些实施方案中,所述多种颗粒包括以下中的至少两种:二氧化硅涂覆的SPION、PDMAPMA-聚合物官能化的纳米颗粒、葡萄糖-6-磷酸酯官能化的纳米颗粒、聚苯乙烯羧基官能化的纳米颗粒、葡聚糖官能化的纳米颗粒、混合酰胺和羧酸酯官能化的二氧化硅涂覆的纳米颗粒、N-(3-三甲氧基甲硅烷基丙基)二亚乙基三胺涂覆的纳米颗粒、N1-(3-(三甲氧基甲硅烷基)丙基)己烷-1,6-二胺官能化的纳米颗粒或1,6-己二胺官能化的纳米颗粒。
在一些实施方案中,多种颗粒包括磁性颗粒。
在一些实施方案中,多种颗粒包括纳米颗粒、微粒或其组合。
在一些实施方案中,多种颗粒包括纳米颗粒和微粒。
在一些实施方案中,表面修饰的颗粒不包括抗体、T细胞受体、嵌合抗原受体、受体蛋白或其变体或片段。
在一些实施方案中,所述方法进一步包括在(a)之前,产生包含表面修饰的颗粒和支持剂的溶液或悬浮液。
在一些实施方案中,溶液或悬浮液具有大于1微升(μL)的体积。
在一些实施方案中,溶液或悬浮液具有小于100μL的体积。
在一些实施方案中,溶液或悬浮液具有在2微升(μL)和60μL之间的体积。
在一些实施方案中,溶液或悬浮液具有在25μL和45μL之间的体积。
在一些实施方案中,溶液或悬浮液中的支持剂具有大于50mg/mL的浓度。
在一些实施方案中,溶液或悬浮液中的支持剂具有小于250mg/mL的浓度。
在一些实施方案中,溶液或悬浮液中的支持剂具有小于250mg/mL的浓度。
在一些实施方案中,溶液或悬浮液中的支持剂具有在100mg/mL和200mg/mL之间的浓度。
在一些实施方案中,溶液或悬浮液具有大于2.5毫克/毫升(mg/mL)的颗粒浓度。
在一些实施方案中,溶液或悬浮液具有小于100mg/mL的颗粒浓度。
在一些实施方案中,溶液或悬浮液具有在10mg/mL和100mg/mL之间的颗粒浓度。
在一些实施方案中,溶液或悬浮液具有在15mg/mL和80mg/mL之间的颗粒浓度。
在一些实施方案中,所述方法进一步包括快速冷冻所述溶液或悬浮液以产生冷冻组合物。
在一些实施方案中,快速冷冻包括在液氮中快速冷冻。
在一些实施方案中,所述方法进一步包括冻干冷冻组合物以产生干组合物。
在一些实施方案中,在(b)之后的液体中的颗粒直径为溶液或悬浮液中平均粒径的约90%至约110%。
在一些实施方案中,在(b)之后,小于0.1%的表面修饰的颗粒作为颗粒聚集体存在。
在一些实施方案中,在(b)之后的液体中的表面修饰的颗粒包括在参考ζ电势的约90%至约110%之间的ζ电势,其中参考ζ电势可在快速冷冻液体之前从包含表面修饰的颗粒的溶液测量。
在一些实施方案中,冷冻组合物在孔或管中形成。
在一些实施方案中,冷冻组合物在多个孔或多个管中形成。
在一些实施方案中,干组合物是每个珠包括至少0.5mg表面修饰的颗粒的珠。
在一些实施方案中,干组合物是每个珠包括约0.5mg至约5mg表面修饰的颗粒的珠。
在一些方面,本公开描述了一种用于测定生物样本的系统,其包括:包含干组合物的基底,所述干组合物包含颗粒和支持剂;包括生物样本的样本储存单元;装载单元,其可操作地耦合到基底和样本储存单元;以及包括机器可执行代码的计算机可读介质,所述机器可执行代码在由处理器执行时实现一种方法,所述方法包括:(a)使用装载单元将生物样本或其一部分从样本储存单元转移到基底;(b)引导生物样本与干组合物接触以产生包含多个生物分子或生物分子群组的生物分子冠状物。
在一些实施方案中,基底是多孔板或管。
在一些实施方案中,基底包含多种干组合物,每种干组合物都包括所述干组合物。
在一些实施方案中,包括在所述多种干组合物的单独的干组合物中的颗粒的至少一个子集不同于另一个子集。
在一些实施方案中,颗粒的至少一个子集在至少一种物理化学性质上不同于另一个子集。
在一些实施方案中,多种干组合物包括至少两种干组合物,每种干组合物包括:二氧化硅涂覆的SPION、三胺官能化的纳米颗粒、PDMAPMA-聚合物官能化的纳米颗粒、葡萄糖-6-磷酸酯官能化的纳米颗粒、单胺官能化的纳米颗粒或其组合。
在一些实施方案中,多孔板的每个孔包括多种干组合物中的单独的干组合物。
在一些实施方案中,样本储存单元包括多个不同的生物样本。
在一些实施方案中,(a)的转移包括将多个不同生物样本中的每一个转移到多孔板的不同孔中。
在一些实施方案中,生物样本包括多个部分。
在一些实施方案中,(a)的转移包括将生物样本的多个部分中的每一部分转移到多孔板的不同孔中。
在一些实施方案中,生物样本的多个部分的转移基本上平行进行。
在一些实施方案中,在(b)之前,在溶剂中将生物样本或其部分稀释到至少约2x体积。
在一些实施方案中,在(b)之前,在溶剂中将生物样本或其部分稀释到至少约10x体积。
在一些实施方案中,生物样本的细胞膜在(b)之前至少部分地裂解。
在一些实施方案中,所述方法进一步包括在(b)之前在液体中重构干组合物。
在一些实施方案中,液体具有至少约3.5到至多约7.4的pH。
在一些实施方案中,液体具有至少约4.5到至多约5.5的pH。
在一些实施方案中,液体具有至多约150mM的离子浓度。
在一些实施方案中,液体具有至多约50mM的离子浓度。
在一些实施方案中,液体具有至多约0.1mM的离子浓度。
在一些实施方案中,在(b)中,生物样本保持与干组合物接触至少约10秒。
在一些实施方案中,在(b)中,生物样本保持与干组合物接触至少约1分钟。
在一些实施方案中,在(b)中,生物样本保持与干组合物接触至少约5分钟。
在一些实施方案中,所述方法进一步包括在(b)之后在再悬浮的情况下洗涤生物分子冠状物。
在一些实施方案中,所述方法进一步包括在(b)之后在没有再悬浮的情况下洗涤生物分子冠状物。
在一些实施方案中,所述方法进一步包括在(b)之前裂解生物样本的物种以产生裂解物。
在一些实施方案中,所述方法进一步包括还原裂解物。
在一些实施方案中,所述方法进一步包括过滤裂解物。
在一些实施方案中,所述方法进一步包括烷基化裂解物。
在一些实施方案中,所述方法进一步包括在(b)之后使生物分子冠状物变性,以产生经变性的生物分子冠状物。
在一些实施方案中,变性为逐步变性。
在一些实施方案中,变性在约50℃至约95℃的温度下进行。
在一些实施方案中,所述方法进一步包括在(b)之后消化生物分子冠状物,以产生经消化的生物分子冠状物。
在一些实施方案中,消化包括使用浓度为约20微克/毫升(μg/mL)至约0.1克/升(g/L)的胰蛋白酶。
在一些实施方案中,消化包括逐步使用浓度为约20微克/毫升(μg/mL)至约0.1克/升(g/L)的lysC。
在一些实施方案中,消化包括消化至多约3小时。
在一些实施方案中,消化包括消化至多约1小时。
在一些实施方案中,消化产生平均质量为约1000道尔顿至约4000道尔顿(Da)的肽。
在一些实施方案中,所述方法进一步包括将所述多个生物分子或生物分子群组释放到溶液中。
在一些实施方案中,所述方法进一步包括还原所述多个生物分子或生物分子群组。
在一些实施方案中,所述方法进一步包括过滤所述多个生物分子或生物分子群组。
在一些实施方案中,所述方法进一步包括烷基化所述多个生物分子或生物分子群组。
在一些实施方案中,所述方法进一步包括在(b)之后使生物分子冠状物变性,以产生经变性的生物分子冠状物。
在一些实施方案中,变性为逐步变性。
在一些实施方案中,变性在约50℃至约95℃的温度下进行。
在一些实施方案中,所述方法进一步包括在(b)之后消化生物分子冠状物,以产生经消化的生物分子冠状物。
在一些实施方案中,消化包括使用浓度为约20微克/毫升(μg/mL)至约0.1克/升(g/L)的胰蛋白酶。
在一些实施方案中,消化包括逐步使用浓度为约20微克/毫升(μg/mL)至约0.1克/升(g/L)的lysC。
在一些实施方案中,消化包括消化至多约3小时。
在一些实施方案中,消化包括消化至多约1小时。
在一些实施方案中,消化产生平均质量为约1000道尔顿至约4000道尔顿(Da)的肽。
在一些实施方案中,所述方法进一步包括在(b)之后洗脱生物分子冠状物。
在一些实施方案中,洗脱包括从颗粒中释放完整的蛋白质。
在一些实施方案中,洗脱包括用至多约2x体积的溶液洗脱。
在一些实施方案中,洗脱包括用至多约8x体积的溶液洗脱。
在一些实施方案中,洗脱包括在至多约50psi的压力下洗脱。
在一些实施方案中,所述方法进一步包括在(b)之后的固相提取。
在一些实施方案中,所述方法进一步包括在(b)之后对生物分子冠状物进行质谱法。
在一些实施方案中,所述方法进一步包括在(b)之后对生物分子冠状物进行液相色谱法。
在一些实施方案中,基底包括塑料器皿,并且其中所述方法进一步包括提供条形码的集合,所述条形码的集合至少包括塑料器皿条形码、颗粒条形码和试剂条形码;并且将所述条形码的集合传送到计算机可读介质。
在一些实施方案中,所述方法进一步包括至少部分地基于塑料器皿条形码将塑料器皿从塑料器皿存储器传送到装载单元。
在一些实施方案中,所述方法进一步包括至少部分地基于颗粒条形码将干组合物从颗粒存储器转移到装载单元。
在一些实施方案中,所述方法进一步包括至少部分地基于试剂条形码将试剂从试剂存储器转移到装载单元。
在一些实施方案中,所述方法包括从生物样本的至少一部分中分离至少一部分干组合物。
在一些实施方案中,所述方法包括从生物样本中分离生物分子冠状物的多个生物分子或生物分子群组的至少一个子集。
在一些实施方案中,分离包括磁分离。
在一些方面,本公开描述了一种干颗粒制剂,其包含:干组合物,所述干组合物包含(i)包括用于吸附多个生物分子或生物分子群组的表面修饰的颗粒和(ii)支持剂,其中所述干组合物在高于25℃的温度下稳定至少3个月。
在一些实施方案中,表面修饰包括二氧化硅涂层、PDMAPMA-聚合物官能化、葡萄糖-6-磷酸酯官能化、聚苯乙烯羧基官能化、葡聚糖官能化、酰胺官能化、羧基官能化、三胺官能化、二胺官能化、单胺表面官能化或其任何组合。
在一些实施方案中,表面修饰包括N-(3-三甲氧基甲硅烷基丙基)二亚乙基三胺官能化、1,6-己二胺官能化、N1-(3-(三甲氧基甲硅烷基)丙基)己烷-1,6-二胺或其任何组合。
在一些实施方案中,表面修饰包括金属氧化物涂层。
在一些实施方案中,表面修饰包括至少一个暴露的伯胺基团、仲胺基团、叔胺基团。
在一些实施方案中,表面修饰包括至少一种单糖。
在一些实施方案中,多个生物分子或生物分子群组包括肽、核酸、代谢物、脂质或其任何组合。
在一些实施方案中,支持剂包括蔗糖、d-甘露醇、海藻糖、甘油、葡聚糖、PEG、葡萄糖、乳糖、聚山梨醇酯或氨基酸中的至少一种。
在一些实施方案中,在支持剂的存在下冻干所述多种颗粒。
在一些实施方案中,支持剂占干组合物的至少约60wt%。
在一些实施方案中,支持剂占干组合物的至少约70wt%。
在一些实施方案中,支持剂占干组合物的至多约80wt%。
在一些实施方案中,支持剂占干组合物的至多约90wt%。
在一些实施方案中,温度在25℃和60℃之间。
在一些实施方案中,温度在35℃和40℃之间。
在一些实施方案中,干组合物在高于37℃的温度下稳定至少7天。
在一些实施方案中,干组合物在37℃下稳定至少40天。
在一些实施方案中,在溶液中重构干组合物时,颗粒具有的平均ζ电势为在不存在冻干的情况下溶解在相同溶液中的相同颗粒的ζ电势的85%至115%,如通过ζ电势测量所确定的。
在一些实施方案中,在溶液中重构干组合物时,颗粒具有的平均ζ电势为在不存在冻干的情况下溶解在相同溶液中的相同颗粒的ζ电势的90%至110%,如通过ζ电势测量所确定的。
在一些实施方案中,在溶液中重构干组合物时,颗粒具有的平均ζ电势为在不存在冻干的情况下溶解在相同溶液中的相同颗粒的ζ电势的95%至105%,如通过ζ电势测量所确定的。
在一些实施方案中,在溶液中重构干组合物时,颗粒具有的平均ζ电势标准偏差为在不存在冻干的情况下溶解在相同溶液中的相同颗粒的ζ电势标准偏差的85%至115%,如通过ζ电势测量所确定的。
在一些实施方案中,在溶液中重构干组合物时,颗粒具有的平均ζ电势标准偏差为在不存在冻干的情况下溶解在相同溶液中的相同颗粒的ζ电势标准偏差的90%至110%,如通过ζ电势测量所确定的。
在一些实施方案中,在溶液中重构干组合物时,颗粒具有的ζ电势标准偏差为在不存在冻干的情况下溶解在相同溶液中的相同颗粒的ζ电势标准偏差的95%至105%,如通过ζ电势测量所确定的。
在一些实施方案中,在溶液中重构干组合物时,颗粒具有的平均直径为在不存在冻干的情况下溶解在相同溶液中的相同颗粒的平均直径的85%至115%,如通过动态光散射(DLS)所确定的。
在一些实施方案中,在溶液中重构干组合物时,颗粒具有的平均直径为在不存在冻干的情况下溶解在相同溶液中的相同颗粒的平均直径的90%至110%,如通过动态光散射(DLS)所确定的。
在一些实施方案中,在溶液中重构干组合物时,颗粒具有的平均直径为在不存在冻干的情况下溶解在相同溶液中的相同颗粒的平均直径的95%至105%,如通过动态光散射(DLS)所确定的。
在一些实施方案中,当在溶液中重构干组合物时,颗粒具有的平均直径为在不存在冻干的情况下溶解在相同溶液中的相同颗粒的平均直径的98%至102%,如通过动态光散射(DLS)所确定的。
在一些实施方案中,在重构干组合物时,颗粒具有的直径标准偏差为在不存在冻干的情况下溶解在相同溶液中的相同颗粒的直径标准偏差的85%至115%,如通过动态光散射(DLS)所确定的。
在一些实施方案中,在重构干组合物时,颗粒具有的直径标准偏差为在不存在冻干的情况下溶解在相同溶液中的相同颗粒的直径标准偏差的90%至110%,如通过动态光散射(DLS)所确定的。
在一些实施方案中,在重构干组合物时,颗粒具有的直径标准偏差为在不存在冻干的情况下溶解在相同溶液中的相同颗粒的直径标准偏差的95%至105%,如通过动态光散射(DLS)所确定的。
在一些实施方案中,在重构干组合物时,颗粒具有的直径标准偏差为在不存在冻干的情况下溶解在相同溶液中的相同颗粒的直径标准偏差的98%至102%,如通过动态光散射(DLS)所确定的。
在一些方面,本公开描述了一种试剂盒,其包括本文公开的干颗粒制剂中的任一种和被配置为接收和保留干组合物的基底。
在一些实施方案中,基底包括管或孔。
在一些实施方案中,基底是96孔板。
在一些实施方案中,基底包括微流体装置。
在一些实施方案中,基底包括多个空间上隔离的位置,每个位置包括根据权利要求337-364中任一项所述的干组合物。
在一些实施方案中,多个空间上隔离的位置中的各个位置是可单独寻址和/或可独立寻址的。
在一些方面,本公开描述了一种干颗粒制剂,其包含:(a)干组合物,所述干组合物包含经表面修饰以用于吸附多个生物分子或生物分子群组的颗粒,和支持剂,其中所述干组合物被配置为用于随后的使用而无需在溶剂中重构。
在一些实施方案中,干组合物在高于25℃的温度下稳定至少7天。
在一些实施方案中,温度在25℃和60℃之间。
在一些实施方案中,温度在35℃和40℃之间。
在一些实施方案中,干组合物在37℃下稳定至少7天。
在一些实施方案中,干组合物在37℃下稳定至少10天。
在一些实施方案中,干组合物在高于37℃的温度下稳定至少7天。
在一些实施方案中,干组合物在37℃下稳定至少40天。
在一些实施方案中,颗粒被冻干。
在一些实施方案中,在支持剂的存在下冻干颗粒。
在一些实施方案中,在重构干组合物时,冻干颗粒具有的粒径为在不存在冻干的情况下溶解在溶液中的相同颗粒的粒径的85%至115%,如通过动态光散射(DLS)所确定的。
在一些实施方案中,在重构干组合物时,冻干颗粒具有的粒径为在不存在冻干的情况下溶解在溶液中的相同颗粒的粒径的90%至110%,如通过DLS所确定的。
在一些实施方案中,在重构干组合物时,冻干颗粒具有的粒径为在不存在冻干的情况下溶解在溶液中的相同颗粒的粒径的95%至105%,如通过DLS所确定的。
在一些实施方案中,在重构干组合物时,冻干颗粒具有的粒径为在不存在冻干的情况下溶解在溶液中的相同颗粒的粒径的98%至102%,如通过DLS所确定的。
在一些实施方案中,在重构干组合物时,冻干颗粒具有的ζ电势为在不存在冻干的情况下溶解在溶液中的相同颗粒的ζ电势的85%至115%,如通过ζ电势测量所确定的。
在一些实施方案中,在重构干组合物时,冻干颗粒具有的ζ电势为在不存在冻干的情况下溶解在溶液中的相同颗粒的ζ电势的90%至110%,如通过ζ电势测量所确定的。
在一些实施方案中,在重构干组合物时,冻干颗粒具有的ζ电势为在不存在冻干的情况下溶解在溶液中的相同颗粒的ζ电势的95%至105%,如通过ζ电势测量所确定的。
在一些实施方案中,随后的使用包括在与样本接触后形成生物分子冠状物。
在一些方面,本公开描述了一种试剂盒,其包括本文公开的干颗粒制剂中的任一种和被配置为接收和保留干组合物的基底。
在一些实施方案中,基底包括管或孔。
在一些实施方案中,基底是96孔板。
在一些实施方案中,基底包括多个空间上隔离的位置,每个位置包括干组合物。
在一些实施方案中,多个空间上隔离的位置中的各个位置是可单独寻址和/或可独立寻址的。
援引并入
在本说明书中提及的所有出版物、专利和专利申请通过引用并入本文,其程度如同每个单独的出版物、专利或专利申请被具体地和单独地指出通过引用并入一样。
具体实施方式
虽然本文已经示出和描述了本发明的各种实施方案,但是对于本领域技术人员来说将显而易见的是,此类实施方案仅作为实例提供。在不脱离本发明的情况下,本领域技术人员可以想到许多变化、改变和替换。应当理解,可以采用本文描述的本发明的实施方案的各种替代方案。
生物样本是各种生物分子的复杂混合物,包括蛋白质、核酸、脂质、多糖等。各种生物分子的存在与否和浓度,以及生物分子的各种子集(例如,蛋白质和核酸)之间的相关性,可以指示样本的生物学状态(例如,健康或疾病状态)。本文公开了用于分析蛋白质的组合物和工作流程,使用的方法包括在一个或多个样本中使用测序(例如,下一代测序(NGS)技术)对颗粒表面上的生物分子和核酸(例如,无细胞核酸)进行冠状物分析。一个或多个样本可以包括一个或多个生物样本。一个或多个样本可以从一名对象获得。一个或多个样本可以从多名对象获得。本文公开的方法可以鉴定蛋白质和核酸之间或本文公开的各种生物分子中的任一种之间的相关模式,其中相关模式可以指示一种或多种生物学状态。在一些情况下,生物学状态可以是健康生物学状态或疾病状态。
所述方法可以进一步区分特定的疾病状态(例如,癌症的亚型或癌症的阶段)。
在图1所示的示例性工作流程中,描述了本公开的蛋白基因组学方法,其中任选的步骤用虚线和虚框示出。最初,获取生物样本100。生物样本任选地分成多个部分105,其包括样本的第一部分和样本的第二部分。样本的第一部分可以接触传感器元件(例如,颗粒)。一旦接触,来自样本的生物分子(例如,蛋白质或蛋白质群组)可以吸附到传感器元件表面,形成生物分子冠状物110。颗粒可以与样本中未结合的生物分子分离115。任选地,在与颗粒接触110或随后从未结合的生物分子中分离颗粒115之后,可以对样本或样本的一部分进行核酸分析(例如,任选地130、任选地135、140和150)。冠状物中的生物分子可以例如通过洗脱或胰蛋白酶消化从颗粒表面释放120。可以使用许多定性或定量技术(如质谱法)来测定所得的生物分子或其片段(例如,肽和/或蛋白质)125。因此,鉴定生物分子冠状物的组成和生物分子冠状物内的物种的丰度(例如,蛋白质或蛋白质群组的数量),从而产生蛋白质组数据。样本或样本的第二部分可以经历核酸分析。可以任选地富集核酸,例如,使用扩增或下拉探针(例如,在溶液中或附着于固体基底)130。任选地,在核酸富集130之后,可以对样本或样本的一部分进行生物分子冠状物分析(例如,110,任选地115,任选地120、125和145)。核酸可以与用于核酸分析的试剂接触,如测序135、140,以产生序列信息或基因组数据140。测序可以包括量化来自生物样本的核酸序列。测序可以通过合成测序(NGS)来进行。测序可以通过传统的桑格测序来进行。产生的蛋白质组数据125可以用于从样本中鉴定肽、蛋白质或蛋白质群组145,并且基因组数据140可以用于鉴定样本中的核酸序列。任选地,核酸序列可以提供肽、蛋白质或蛋白质群组鉴定的信息,或者可能影响生物分子测定(例如,通过提供质谱数据的数据依赖性采集的信息)。在样本中鉴定的肽、蛋白质或蛋白质群组也可能影响核酸序列的鉴定。可以组合所鉴定的肽、蛋白质、蛋白质群组和/或核酸序列以鉴定生物样本的生物学状态155。
对于下一代测序方法,样本可以与用于将核酸切割成短序列片段的试剂(如核酸酶)接触。在其中分析无细胞核酸分子的情况下,切割可能不是必需的,因为无细胞核酸分子往往已经存在于短片段中。接下来,核酸分子可以与衔接子接触。衔接子可以连接到核酸分子上。衔接子连接的核酸可以被扩增,例如通过聚合酶链式反应(“PCR”)被扩增,其中并入用可检测标记物标记的核苷酸。可以对样本进行成像,并且可以通过成像来检测可检测标记物,以便确定来自样本的核酸的序列。
在另外的示例性工作流程中,可以获得生物样本,然后与结合来自样本的核酸的颗粒接触。颗粒可以用核酸结合部分(例如,具有DNA结合基序的蛋白质或具有能够与靶核酸杂交的单链区域的寡核苷酸)官能化。捕获的核苷酸可以从颗粒上洗脱下来并进行分析,例如通过凝胶电泳、原位杂交或测序。在此类工作流程中,在单独的样本体积中,生物样本也可以与缺乏核酸结合部分的颗粒接触,并允许生物分子冠状物的形成。可以从样本中分离出颗粒-冠状物,并对其进行测定,以鉴定或检测生物分子冠状物中的各种生物分子,包括蛋白质,从而提供生物样本的多组学快照。
本文公开的组合物和方法提供了可以从样本中捕获低丰度生物分子并在传感器元件与样本温育时压缩样本中生物分子的动态范围的颗粒。本文公开的方法可以捕获低丰度的生物分子,甚至在生物分子捕获可能特别困难的低体积样本中。本公开的方法可以进一步使得能够从还包含中等或高丰度生物分子的样本中捕获低丰度生物分子,从而富集低丰度生物分子。例如,在使样本与颗粒接触后,蛋白质在生物分子冠状物中可能以比其从中收集的样本中更高的相对丰度存在(例如,当蛋白质在样本中构成1/107蛋白质且在生物分子冠状物中构成1/105蛋白质时)。当分析血液、血浆和血清样本时,低丰度生物分子富集可能是有用的,所述样本含有在mg/ml范围内的蛋白质(例如,白蛋白)和在pg/ml范围内的蛋白质(例如,某些细胞因子)。与其他质谱技术(例如,非数据依赖性采集、DIA、125分钟注射梯度)相比,本文公开的方法可以允许测定来自生物样本的更多数量的蛋白质或蛋白质群组。例如,对于耗竭的(高丰度蛋白质的丰度降低)和未耗竭的血浆样本(非数据依赖性采集、DIA、125分钟注射梯度),本文公开的基于颗粒的测定方法能够从血浆样本中测定比非基于颗粒的方法多1.7至4.5倍的蛋白质群组。
本文提供了可以与各种生物样本一起温育的传感器元件(例如,颗粒)的组合物。在一些方面,所述组合物包括单独或组合的各种颗粒类型,其可以与宽范围的生物样本一起温育,以基于与颗粒表面结合以形成蛋白质冠状物来分析生物样本中存在的生物分子(例如,蛋白质)。单一颗粒类型可以用于测定特定生物样本中的蛋白质,或者多种颗粒类型可以一起用于测定生物样本中的蛋白质。可以通过以下对生物样本(例如,生物流体)进行蛋白质冠状物分析:使生物样本与多种颗粒接触,将生物样本与多种颗粒一起温育以形成生物分子冠状物(例如,蛋白质冠状物),从生物样本中分离颗粒,以及分析生物分子冠状物以确定生物分子冠状物的组成。蛋白质冠状物分析方法与通过测序对生物样本中的核酸进行平行分析是相容的。一些方法包括蛋白质冠状物的质谱分析。用多种颗粒询问样本,然后分析在多种颗粒上形成的蛋白质冠状物,在本文中可以被称为“蛋白质冠状物分析”。可以用一种或多种颗粒类型询问生物样本。可以分别分析每种颗粒类型的蛋白质冠状物。也可以组合分析一种或多种颗粒类型的蛋白质冠状物。
本公开提供了可以使用本文公开的颗粒和本文提供的方法进行测定的若干种生物样本。此类生物样本也可以通过核酸测序来测定,以分析样本的细胞或无细胞部分中的核酸分子(例如,DNA、RNA、cDNA等)。例如,生物样本可以是生物流体样本,如脑脊液(CSF)、滑液(SF)、尿液、血浆、血清、泪液、沟液、精液、全血、奶汁、乳头抽吸物、针抽吸物、导管灌洗液、阴道分泌物、鼻液、耳液、胃液、胰液、小梁液、肺灌洗液、前列腺液、痰、粪便、支气管灌洗液、来自拭子的液体、支气管抽吸物、汗液或唾液。生物流体可以是流化固体,例如组织匀浆,或者从生物样本中提取的流体。生物样本可以是例如组织样本或细针抽吸(FNA)样本。生物样本可以是细胞培养样本。生物流体可以是流化的生物样本。生物流体可以是细胞提取物。生物流体可以是裂解物。例如,生物流体可以是流化的细胞培养提取物。
基底
本公开的组合物和方法可以用于或实施于宽范围的结构、装置和设备中,在下文中被称为基底。基底可以包括用于容纳一定体积的样本或试剂的单个分区(partition)(例如,Eppendorf管),或者可以包括用于容纳一定体积的样本或试剂的多个分区(例如,16孔板、96孔板、384孔板、微孔板中的多个孔)。分区可以包括孔、通道(例如,微流体装置中的微流体通道)或隔室。分区可以包括塑料器皿(例如,塑料多孔板)、金属结构(例如,金属多孔板)、碳材料结构(例如,碳复合材料多孔板)、凝胶、玻璃器皿或其任何组合。基底可以包括压印结构。基底可以包括流体通道或腔室。流体通道或室可以是微流体或纳米流体通道或腔室。基底可以是密封的(例如,用可移除的塑料片或可刺穿的隔膜)或可密封的(例如,可以包括可重复使用的帽或盖)。
分区可以被配置为容纳至少1至10微升(μl)、至少5至25μl、至少20至50μl、至少40至200μl、至少100至500μl、至少200μl至1ml、至少2ml、至少3ml或更多的体积。分区可以被配置为容纳小于约240μl、200μl、150μl、100μl、75μl、50μl、25μl、10μl、5μl、1μl或更少的体积。分区可以是温度控制的。分区可以被配置为防止或减少蒸发。分区可以被设计成使环境光的入射量最小化。
基底可以包括多个分区,其中分区可以按颗粒、样本、对照或其任何组合进行分组,如图38所示。在本实例中,基底包括8行和12列,其可以与5种类型的颗粒(即,NP1、NP2、NP3、NP4和NP5)一起使用。每种纳米颗粒占据两列,并且可以沉积高达16个生物样本。在本实例中,每个生物样本被标记为X1、X2、X3等等,直到X16。可以存在两列用于对照实验,其中列中的每个对照孔可以接收对照颗粒组合物、对照生物样本或两者。每个对照孔可以在实验的某个步骤或步骤之间使用,以便可以对正在遵循的实验程序进行故障诊断。在一些情况下,颗粒可以被填充在分区中,然后可以在之后添加生物样本。在一些情况下,生物样本可以被填充在分区中,然后可以在之后添加颗粒。
分区的任何子集可以按颗粒分组或按样本分组。在一些情况下,多个分区可以包括用于样本的行和用于颗粒的列。在一些情况下,多个分区可以按颗粒的特定组成分组。
在一些情况下,基底可以包括2行或列用于对照。在一些情况下,基底可以包括1、2、3、4、5、6、7、8、9或10行用于对照。
在一些情况下,分区可以包括用于单个生物样本的单一颗粒。在一些情况下,分区可以包括用于单个生物样本的多种颗粒。在一些情况下,分区可以包括用于多个生物样本的单一颗粒。在一些情况下,分区可以包括用于多个生物样本的多种颗粒。
在一些情况下,基底可以包括至少约1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90或100行或列。在一些情况下,基底可以包括至多约1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90或100行或列。
可以在单个基底或基底分区内制备或询问样本,可以在多个基底或基底分区之间分配样本,或者可以在多个基底或基底分区之间顺序转移样本。例如,5ml的样本可以在500个分区之间均匀地分配,从而产生单独的10μl样本体积。样本可以在分区内与试剂混合。样本可以在分区内经历稀释(例如,用缓冲液稀释)。
基底可以包括被配置为捕获来自样本的生物分子或与其相互作用的表面。例如,该表面可以用核酸结合部分(如单链核酸)官能化,该核酸结合部分能够结合来自样本的核酸。表面可以包括能够在接触样本时形成生物分子冠状物的传感器元件。该表面可以包括分区的一部分,如孔板中的孔的侧面。
如图40所示,基底可以被配置为允许对分区的内容物施加磁场。在一些情况下,所施加的磁场可以将分区内的磁性物质与非磁性物质分离。
可以将基底耦合至仪器,以接收振动能量。在一些情况下,可以通过仪器摇动、振动或超声处理基底,如图40所示。
传感器元件
本公开的方法可以利用传感器元件从样本或其部分中收集生物分子。在一些情况下,传感器元件可以指当与样本(例如,包含生物分子的生物样本)接触时,能够结合(例如,非特异性地)或吸附(例如,根据颗粒的物理化学性质可变地选择性)多个生物分子的元件。传感器元件可以通过可变地选择性吸附从生物样本中收集生物分子。在一些情况下,可变地选择性吸附包括不是蛋白质-配体(抗生物素蛋白-生物素相互作用)、蛋白质-受体或蛋白质-亲和试剂(例如,表位-抗体)相互作用的相互作用。例如,可变地选择性吸附可以包括使得与颗粒的表面接触的多种分析物(例如,来自生物样本的生物分子),该颗粒不包括固定(例如,化学束缚)于其上的蛋白质、配体或亲和试剂。通过传感器元件从生物样本中可变地选择性吸附生物分子或生物分子群组可以产生生物分子冠状物,该生物分子冠状物包含传感器元件的表面上的生物分子或生物分子群组。在一些情况下,可变地选择性吸附表示结合一系列具有低亲和力的分析物(作为说明性但非限制性的实例,可变地选择性吸附可以包括结合至少50种具有50μM的最小解离常数的分析物)。在一些情况下,可变地选择性吸附可以包括结合至少50种具有至少约5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、200、300、400或500μM的最小解离常数的分析物。在一些情况下,可变地选择性吸附可以包括结合至少50种具有至多约5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、200、300、400或500μM的最小解离常数的分析物。在一些情况下,可变地选择性吸附表示以慢结合动力学(例如,以10至100分钟的近似伪一级的吸附半衰期)结合一系列分析物。在一些情况下,传感器元件可以被修改为对蛋白质的群组具有较高的可变地选择性吸附亲和力,并且对蛋白质的另一群组具有较低的可变地选择性吸附亲和力。在一些情况下,传感器元件可以被修改为包括电荷,以增加传感器元件对一些带相反电荷的生物分子的亲和力。在一些情况下,传感器元件可以被修改为包括特定的结合部分,如肽、蛋白质或核酸。
传感器元件可以包括离散结构(例如,颗粒)或结构的一部分(例如,纳米材料的表面)。在一些情况下,颗粒可以是传感器元件或者可以包括传感器元件。在一些情况下,颗粒可以是纳米颗粒,纳米颗粒可以是传感器元件或者可以包括传感器元件。在一些情况下,包含颗粒或纳米颗粒的组合物可以是传感器元件或者可以包括传感器元件。在一些情况下,组合物可以是干组合物。干组合物可以是传感器元件或者可以包括传感器元件。在一些情况下,传感器元件可以涵盖纳米级传感器元件。在一些情况下,传感器元件可以包括多孔结构(例如,聚合物基质)。在一些情况下,传感器元件可以包括来自单个结构的突起(例如,从刚性金属氧化物表面延伸的柔性低聚物)。在许多情况下,传感器元件可以包括在至少一个方向上长度为约5纳米(nm)至约50000nm的尺寸。合适的传感器元件可以包括例如但不限于在至少一个方向上约5nm至约50,000nm的传感器元件,包括,约5nm至约40000nm、可替代地约5nm至约30000nm、可替代地约5nm至约20,000nm、可替代地约5nm至约10,000nm、可替代地约5nm至约5000nm、可替代地约5nm至约1000nm、可替代地约5nm至约500nm、可替代地约5nm至50nm、可替代地约10nm至100nm、可替代地约20nm至200nm、可替代地约30nm至300nm、可替代地约40nm至400nm、可替代地约50nm至500nm、可替代地约60nm至600nm、可替代地约70nm至700nm、可替代地约80nm至800nm、可替代地约90nm至900nm、可替代地约100nm至1000nm、可替代地约1000nm至10000nm、可替代地约10000nm至50000nm以及其间的任何组合或量(例如,5nm、10nm、15nm、20nm、25nm、30nm、35nm、40nm、45nm、50nm、55nm、60nm、65nm、70nm、80nm、90nm、100nm、125nm、150nm、175nm、200nm、225nm、250nm、275nm、300nm、350nm、400nm、450nm、500nm、550nm、600nm、650nm、700nm、750nm、800nm、850nm、900nm、1000nm、1200nm、1300nm、1400nm、1500nm、1600nm、1700nm、1800nm、1900nm、2000nm、2500nm、3000nm、3500nm、4000nm、4500nm、5000nm、5500nm、6000nm、6500nm、7000nm、7500nm、8000nm、8500nm、9000nm、10000nm、11000nm、12000nm、13000nm、14000nm、15000nm、16000nm、17000nm、18000nm、19000nm、20000nm、25000nm、30000nm、35000nm、40000nm、45000nm、50000nm以及其间的任何数字)。在一些情况下,纳米级传感器元件可以指在至少一个方向上小于1微米的传感器元件。纳米级传感器元件的范围的合适的实例可以包括但不限于,例如,在一个方向上约5nm至约1000nm的元件,例如包括,约5nm至约500nm、可替代地约5nm至约400nm、可替代地约5nm至约300nm、可替代地约5nm至约200nm、可替代地约5nm至约100nm、可替代地约5nm至约50nm、可替代地约10nm至约1000nm、可替代地约10nm至约750nm、可替代地约10nm至约500nm、可替代地约10nm至约250nm、可替代地约10nm至约200nm、可替代地约10nm至约100nm、可替代地约50nm至约1000nm、可替代地约50nm至约500nm、可替代地约50nm至约250nm、可替代地约50nm至约200nm、可替代地约50nm至约100nm、以及其间的任何组合、范围或量(例如,5nm、10nm、15nm、20nm、25nm、30nm、35nm、40nm、45nm、S0 nm、55nm、60nm、65nm、70nm、80nm、90nm、100nm、125nm、150nm、175nm、200nm、225nm、250nm、275nm、300nm、350nm、400nm、450nm、500nm、550nm、600nm、650nm、700nm、750nm、800nm、850nm、900nm、1000nm等)。关于本文描述的传感器元件,术语传感器元件的使用包括用于传感器的纳米级传感器元件和相关方法的使用。
传感器元件可以在与样本接触时形成生物分子冠状物。在一些情况下,术语“生物分子冠状物”可以指结合到传感器元件的不同生物分子的组成、特征(signature)或模式。在一些情况下,生物分子冠状物不仅是指不同的生物分子,而且还可以指结合到传感器元件的一种或多种生物分子的量、水平或数量的差异,结合到传感器元件的一种或多种生物分子的电荷或构象状态的差异,或者结合到传感器元件的一种或多种生物分子的化学(例如,氧化还原、转录后或翻译后)状态的差异。预期每个传感器元件的生物分子冠状物可以含有一些相同的生物分子,可以含有相对于其他传感器元件不同的生物分子,和/或可以在生物分子的水平或数量、类型或电荷或构象上不同。在一些情况下,生物分子冠状物可以包含不同于所提供的生物样本的组成。在一些情况下,与所提供的生物样本相比,生物分子冠状物可以包括在所提供的生物样本中存在的更高比例的蛋白质和/或核酸的子集,例如,更长长度或更高分子量的蛋白质和/或核酸。
生物分子冠状物可能不仅取决于传感器元件的物理化学性质,而且还可能取决于样本的性质和暴露于样本的持续时间。组成这些生物分子冠状物的生物分子的类型、量和种类可以响应于传感器元件的物理化学性质以及样本中存在的不同生物分子之间的复杂相互作用。这些相互作用可能导致对于每个传感器元件产生生物分子冠状物。
生物分子冠状物可以包括蛋白质、糖类、脂质、代谢物、核酸(例如,DNA或RNA)或其任何组合。在一些情况下,生物分子冠状物是蛋白质冠状物。在另一种情况下,生物分子冠状物是多糖冠状物。在又另一种情况下,生物分子冠状物是代谢物冠状物。在一些情况下,生物分子冠状物是脂质组冠状物。生物分子冠状物可以包括多层生物分子。例如,生物分子冠状物可以包括2nm至大于50nm的平均厚度,对应于1至大于50层生物分子。生物分子冠状物可以包含各种长度或各种分子量的核酸。生物分子冠状物可以包含不同长度或不同分子量的蛋白质。
非特异性结合
颗粒可以通过可变地选择性吸附(例如,当颗粒与包含生物分子或生物分子群组的生物样本接触时,生物分子或生物分子群组的吸附,该吸附根据包括例如颗粒的物理化学性质的因素是可变地选择性的)或非特异性结合形成生物分子冠状物。非特异性结合可以指排除特异性结合的一类结合相互作用。特异性结合的实例可以包括蛋白质-配体结合相互作用、抗原-抗体结合相互作用、核酸杂交或模板分子和靶分子之间的结合相互作用,其中模板分子提供了这样的序列或3D结构,其有利于包括互补序列或互补3D结构的靶分子的结合,而不利于不包括互补序列或互补3D结构的非靶分子的结合。
非特异性结合可以包括多种化学和物理相互作用和效应中的一种或组合。非特异性结合可以包括电磁力,如静电相互作用、伦敦色散、范德华相互作用或偶极-偶极相互作用(例如,在永久偶极和感应偶极之间)。非特异性结合可以通过共价键(如二硫键)介导。非特异性结合可以通过氢键介导。非特异性结合可以包括疏溶剂效应(例如,疏水效应),其中一个物体被溶剂环境排斥,并被迫到达溶剂的边界,如另一个物体的表面。非特异性结合可以包括熵效应,如在耗竭力中,或者将热能提高到高于临界溶解温度(例如,较低的临界溶解温度)。非特异性结合可以包括动力学效应,其中一种结合分子可以比另一种结合分子具有更快的结合动力学。
非特异性结合可以包括对多个靶标的多个非特异性结合亲和力(例如,至少5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900、1000、2000、3000、4000、5000、6000、7000、8000、9000、10,000、20,000、30,000、40,000、50,000个吸附到单个颗粒上的不同靶标)。多个靶标可以具有在约一个、两个或三个数量级内的相似的非特异性结合亲和力(例如,如通过非特异性结合自由能、平衡常数、竞争吸附等来测量)。这可以与特异性结合形成对比,特异性结合可以包括对于给定靶分子比非靶分子更高的结合亲和力。
生物分子可以通过表面上的非特异性结合以各种密度吸附到表面上。在一些情况下,生物分子可以以至少约10-9毫克(mg)生物分子/平方毫米(mm2)的密度吸附。在一些情况下,蛋白质可以以至少约10-9毫克(mg)生物分子/平方毫米(mm2)的密度吸附。在一些情况下,生物分子或蛋白质可以以至少约0.1、0.2、0.3、0.4、0.5、0.6、0.7、0.8、0.9、1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900或1000fg/mm2的密度吸附。在一些情况下,生物分子或蛋白质可以以至少约1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900或1000pg/mm2的密度吸附。在一些情况下,生物分子或蛋白质可以以至少约1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900或1000ng/mm2的密度吸附。在一些情况下,生物分子或蛋白质可以以至少约1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900或1000μg/mm2的密度吸附。在一些情况下,生物分子或蛋白质可以以至少约1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900或1000mg/mm2的密度吸附。在一些情况下,生物分子或蛋白质可以以至多约0.1、0.2、0.3、0.4、0.5、0.6、0.7、0.8、0.9、1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900或1000fg/mm2的密度吸附。在一些情况下,生物分子或蛋白质可以以至多约1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900或1000pg/mm2的密度吸附。在一些情况下,生物分子或蛋白质可以以至多约1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900或1000ng/mm2的密度吸附。在一些情况下,生物分子或蛋白质可以以至多约1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900或1000μg/mm2的密度吸附。在一些情况下,生物分子或蛋白质可以以至多约1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900或1000mg/mm2的密度吸附。
吸附的生物分子可以包括各种类型的蛋白质。在一些情况下,吸附的蛋白质可以包括至少5种类型的蛋白质。在一些情况下,吸附的蛋白质可以包括至少200种类型的蛋白质。在一些情况下,吸附的蛋白质可以包括至少500种类型的蛋白质。在一些情况下,吸附的蛋白质可以包括5至1000种类型的蛋白质。在一些情况下,吸附的蛋白质可以包括20至200种类型的蛋白质。在一些情况下,吸附的蛋白质可以包括至少约1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900、1000、2000、3000、4000、5000、6000、7000、8000、9000或10000种类型的蛋白质。在一些情况下,吸附的蛋白质可以包括至多约1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900、1000、2000、3000、4000、5000、6000、7000、8000、9000或10000种类型的蛋白质。
在一些情况下,生物样本中的蛋白质可以包括至少1个数量级的浓度。在一些情况下,生物样本中的蛋白质可以包括至少2个数量级的浓度。在一些情况下,生物样本中的蛋白质可以包括至少3个数量级的浓度。在一些情况下,生物样本中的蛋白质可以包括至少4个数量级的浓度。在一些情况下,生物样本中的蛋白质可以包括至少5个数量级的浓度。在一些情况下,生物样本中的蛋白质可以包括至少6个数量级的浓度。
颗粒类型
传感器元件可以为颗粒或者可以包括颗粒。本文公开的各种类型的颗粒可以由各种材料制成。例如,颗粒材料可以由包括金属、聚合物、磁性材料、氧化物和/或脂质的材料制成。磁性颗粒可以是氧化铁颗粒。金属材料的实例包括金、银、铜、镍、钴、钯、铂、铱、锇、铑、钌、铼、钒、铬、锰、铌、钼、钨、钽、铁和镉中的任何一种或任何组合,或者US7749299中描述的任何其他材料。氧化物材料的实例包括氧化镁、二氧化硅、氧化钛、氧化钒或氧化镍中的任何一种或任何组合。在一些情况下,颗粒材料可以由硅制成。颗粒可以是磁性颗粒,如超顺磁性氧化铁纳米颗粒(SPION)。
聚合物的实例包括聚乙烯、聚碳酸酯、聚酸酐、聚羟基酸、聚富马酸丙酯、聚己内酯、聚酰胺、聚缩醛、聚醚、聚酯、聚(原酸酯)、聚氰基丙烯酸酯、聚乙烯醇、聚氨酯、聚磷腈、聚丙烯酸酯、聚甲基丙烯酸酯、聚氰基丙烯酸酯、聚脲、聚苯乙烯或聚胺、聚亚烷基二醇(例如,聚乙二醇(PEG))、聚酯(例如,聚(丙交酯-共-乙交酯)(PLGA)、聚乳酸或聚己内酯),或两种或更多种聚合物的共聚物(如聚亚烷基二醇(例如,PEG)和聚酯(例如,PLGA)的共聚物)中的任何一种或任何组合。聚合物可以是脂封端的聚亚烷基二醇和聚酯,或者US9549901中公开的任何其他材料。
在一些情况下,聚合物可以包括具有线性拓扑、支化拓扑、星形拓扑、树状拓扑、超支化拓扑、瓶状灌木拓扑、环状拓扑、链状拓扑或其任何组合的聚合物。在一些情况下,聚合物可以包括3臂拓扑、4臂拓扑、5臂拓扑、6臂拓扑、7臂拓扑、8臂拓扑、9臂拓扑或10臂拓扑。在一些情况下,聚合物可以包括交联剂。
在一些情况下,聚合物可以包括至少约2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900、1000、2000、3000、4000、5000、6000、7000、8000、9000、10000、20000、30000、40000、50000、60000、70000、80000、90000或100000个单体。在一些情况下,聚合物可以包括至多约2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900、1000、2000、3000、4000、5000、6000、7000、8000、9000、10000、20000、30000、40000、50000、60000、70000、80000、90000或100000个单体。
可以用于形成本公开的颗粒的脂质的实例包括阳离子、阴离子和带中性电荷的脂质。例如,颗粒可以由以下中的任何一种或任何组合制成:二油酰磷脂酰甘油(DOPG)、二酰基磷脂酰胆碱、二酰基磷脂酰乙醇胺、神经酰胺、鞘磷脂、脑磷脂、胆固醇、脑苷脂和二酰基甘油、二油酰磷脂酰胆碱(DOPC)、二肉豆蔻酰磷脂酰胆碱(DMPC)和二油酰磷脂酰丝氨酸(DOPS)、磷脂酰甘油、心磷脂、二酰基磷脂酰丝氨酸、二酰基磷脂酸、N-十二酰基磷脂酰乙醇胺、N-琥珀酰磷脂酰乙醇胺、N-戊二酰磷脂酰乙醇胺、赖氨酰磷脂酰甘油、棕榈酰磷脂酰甘油(POPG)、卵磷脂、溶血卵磷脂、磷脂酰乙醇胺、溶血磷脂酰乙醇胺、二油酰磷脂酰乙醇胺(DOPE)、二棕榈酰磷脂酰乙醇胺(DPPE)、二肉豆蔻酰磷脂酰乙醇胺(DMPE)、二硬脂酰磷脂酰乙醇胺(DSPE)、棕榈酰油酰磷脂酰乙醇胺(POPE)棕榈酰油酰磷脂酰胆碱(POPC)、蛋磷脂酰胆碱(EPC)、二硬脂酰磷脂酰胆碱(DSPC)、二油酰磷脂酰胆碱(DOPC)、二棕榈酰磷脂酰胆碱(DPPC)、二油酰磷脂酰甘油(DOPG)、二棕榈酰磷脂酰甘油(DPPG)、棕榈酰油酰磷脂酰甘油(POPG)、16-O-单甲基PE、16-O-二甲基PE、18-1-反式PE、棕榈酰油酰磷脂酰乙醇胺(POPE)、1-硬脂酰-2-油酰磷脂酰乙醇胺(SOPE)、磷脂酰丝氨酸、磷脂酰肌醇、鞘磷脂、脑磷脂、心磷脂、磷脂酸、脑苷脂、二乙酰基磷酸酯和胆固醇,或在US9445994(其通过引用以其整体并入本文)中列出的任何其他材料。
在表1中提供了本公开的颗粒的实例。
表1-本公开的示例性颗粒
本公开的颗粒可以是合成颗粒。颗粒可以是表面官能化的。本公开的颗粒类型的实例可以是羧酸盐(柠檬酸盐)超顺磁性氧化铁纳米颗粒(SPION)、苯酚-甲醛涂覆的SPION、二氧化硅涂覆的SPION、聚苯乙烯涂覆的SPION、羧化聚(苯乙烯-共-甲基丙烯酸)涂覆的SPION、N-(3-三甲氧基甲硅烷基丙基)二亚乙基三胺涂覆的SPION、聚(N-(3-(二甲基氨基)丙基)甲基丙烯酰胺)(PDMAPMA)涂覆的SPION、1,2,4,5-苯四甲酸涂覆的SPION、聚(乙烯基苄基三甲基氯化铵)(PVBTMAC)涂覆的SPION、羧酸盐PAA涂覆的SPION、聚(低聚(乙二醇)甲基醚甲基丙烯酸酯)(POEGMA)涂覆的SPION、羧酸盐微粒、聚苯乙烯羧基官能化的颗粒、羧酸涂覆的颗粒、二氧化硅颗粒、直径约150nm的羧酸颗粒、直径约0.4-0.6μm的氨基表面微粒、直径约0.1-0.39μm的二氧化硅氨基官能化的微粒、直径约0.1-0.39μm的Jeffamine表面颗粒,直径约2.0-2.9μm的聚苯乙烯微粒、二氧化硅颗粒、直径约50nm的具有原始涂层的羧化颗粒、直径约0.13μm的用葡聚糖基涂层涂覆的颗粒、或具有低酸度的二氧化硅硅烷醇涂覆的颗粒。在一些情况下,颗粒可能缺乏在其表面上特异性结合的官能化蛋白质。在一些情况下,表面官能化的颗粒不包括抗体或T细胞受体、嵌合抗原受体、受体蛋白或其变体或片段。
在宽范围尺寸的生物流体中温育后,可以制备本公开的颗粒并用于形成蛋白质冠状物的方法中。本公开的颗粒可以是纳米颗粒。本公开的纳米颗粒的直径可以为约10nm至约1000nm。例如,本文公开的纳米颗粒的直径可以是至少10nm、至少100nm、至少200nm、至少300nm、至少400nm、至少500nm、至少600nm、至少700nm、至少800nm、至少900nm、10nm至50nm、50nm至100nm、100nm至150nm、150nm至200nm、200nm至250nm、250nm至300nm、300nm至350nm、350nm至400nm、400nm至450nm、450nm至500nm、500nm至550nm、550nm至600nm、600nm至650nm、650nm至700nm、700nm至750nm、750nm至800nm、800nm至850nm、850nm至900nm、100nm至300nm、150nm至350nm、200nm至400nm、250nm至450nm、300nm至500nm、350nm至550nm、400nm至600nm、450nm至650nm、500nm至700nm、550nm至750nm、600nm至800nm、650nm至850nm、700nm至900nm或10nm至900nm。纳米颗粒的直径可以小于1000nm。
本公开的颗粒可以是微粒。微粒可以是直径为约1μm至约1000μm的颗粒。例如,本文公开的微粒的直径可以是至少1μm、至少10μm、至少100μm、至少200μm、至少300μm、至少400μm、至少500μm、至少600μm、至少700μm、至少800μm、至少900μm、10μm至50μm、50μm至100μm、100μm至150μm、150μm至200μm、200μm至250μm、250μm至300μm、300μm至350μm、350μm至400μm、400μm至450μm、450μm至500μm、500μm至550μm、550μm至600μm、600μm至650μm、650μm至700μm、700μm至750μm、750μm至800μm、800μm至850μm、850μm至900μm、100μm至300μm、150μm至350μm、200μm至400μm、250μm至450μm、300μm至500μm、350μm至550μm、400μm至600μm、450μm至650μm、500μm至700μm、550μm至750μm、600μm至800μm、650μm至850μm、700μm至900μm或10μm至900μm。微粒的直径可以小于1000μm。
表面积和质量之间的比率可以决定颗粒的性质。例如,颗粒从溶液中吸附的生物分子的数量和类型可以随着颗粒的表面积与质量比而变化。本文公开的颗粒可以具有3至30cm2/mg、5至50cm2/mg、10至60cm2/mg、15至70cm2/mg、20至80cm2/mg、30至100cm2/mg、35至120cm2/mg、40至130cm2/mg、45至150cm2/mg、50至160cm2/mg、60至180cm2/mg、70至200cm2/mg、80至220cm2/mg、90至240cm2/mg、100至270cm2/mg、120至300cm2/mg、200至500cm2/mg、10至300cm2/mg、1至3000cm2/mg、20至150cm2/mg、25至120cm2/mg或40至85cm2/mg的表面积与质量比。小颗粒(例如,直径为50nm或更小)可以具有显著更高的表面积与质量比,部分地源于按照质量比按照表面积对直径更高阶的依赖性。在一些情况下(例如,对于小颗粒),颗粒可以具有200至1000cm2/mg、500至2000cm2/mg、1000至4000cm2/mg、2000至8000cm2/mg或4000至10000cm2/mg的表面积与质量比。在一些情况下(例如,对于大颗粒),颗粒可以具有1至3cm2/mg、0.5至2cm2/mg、0.25至1.5cm2/mg或0.1至1cm2/mg的表面积与质量比。
在一些情况下,与本文所述的方法一起使用的多种颗粒(例如,颗粒组中的颗粒)可以具有一定范围的表面积与质量比。在一些情况下,多种颗粒的表面积与质量比的范围小于100cm2/mg、80cm2/mg、60cm2/mg、40cm2/mg、20cm2/mg、10cm2/mg、5cm2/mg或2cm2/mg。在一些情况下,多种颗粒的表面积与质量比在多种颗粒之间的变化不超过40%、30%、20%、10%、5%、3%、2%或1%。在一些情况下,多种颗粒可以包括至少2、3、4、5、6、7、8、9、10、12、15、20或更多种不同类型的颗粒。
在一些情况下,多种颗粒(例如,颗粒组中的颗粒)可以具有较宽范围的表面积与质量比。在一些情况下,多种颗粒的表面积与质量比的范围大于100cm2/mg、150cm2/mg、200cm2/mg、250cm2/mg、300cm2/mg、400cm2/mg、500cm2/mg、800cm2/mg、1000cm2/mg、1200cm2/mg、1500cm2/mg、2000cm2/mg、3000cm2/mg、5000cm2/mg、7500cm2/mg、10000cm2/mg或更大。在一些情况下,多种颗粒(例如,组内的颗粒)的表面积与质量比可以变化超过100%、200%、300%、400%、500%、1000%、10000%或更多。在一些情况下,具有宽范围的表面积与质量比的多种颗粒包括至少2、3、4、5、6、7、8、9、10、12、15、20或更多种不同类型的颗粒。
颗粒可以包括各种各样的物理性质。颗粒的物理性质可以包括组成、尺寸、表面电荷、疏水性、亲水性、两亲性、表面功能性、表面形貌、表面曲率、孔隙率、芯材、壳材料、形状、ζ电势及其任何组合。颗粒可以具有核-壳结构。在一些情况下,芯材可以包括金属、聚合物、磁性材料、氧化物和/或脂质。在一些情况下,壳材料可以包括金属、聚合物、磁性材料、氧化物和/或脂质。
在一些情况下,表面形貌可以包括各种标度的粗糙度,例如,粗糙度可以具有至少约0.1nm、0.2nm、0.3nm、0.4nm、0.5nm、0.6nm、0.7nm、0.8nm、0.9nm、1nm、2nm、3nm、4nm、5nm、6nm、7nm、8nm、9nm、10nm、20nm、30nm、40nm、50nm、60nm、70nm、80nm、90nm、100nm、200nm、300nm、400nm、500nm、600nm、700nm、800nm、900nm、1μm、2μm、3μm、4μm、5μm、6μm、7μm、8μm、9μm、10μm、20μm、30μm、40μm、50μm、60μm、70μm、80μm、90μm、100μm、200μm、300μm、400μm、500μm、600μm、700μm、800μm、900μm或1000μm的表面横向尺寸。在一些情况下,粗糙度可以具有至多约0.1nm、0.2nm、0.3nm、0.4nm、0.5nm、0.6nm、0.7nm、0.8nm、0.9nm、1nm、2nm、3nm、4nm、5nm、6nm、7nm、8nm、9nm、10nm、20nm、30nm、40nm、50nm、60nm、70nm、80nm、90nm、100nm、200nm、300nm、400nm、500nm、600nm、700nm、800nm、900nm、1μm、2μm、3μm、4μm、5μm、6μm、7μm、8μm、9μm、10μm、20μm、30μm、40μm、50μm、60μm、70μm、80μm、90μm、100μm、200μm、300μm、400μm、500μm、600μm、700μm、800μm、900μm或1000μm的表面横向尺寸。
在一些情况下,粗糙度可以具有至少约0.1nm、0.2nm、0.3nm、0.4nm、0.5nm、0.6nm、0.7nm、0.8nm、0.9nm、1nm、2nm、3nm、4nm、5nm、6nm、7nm、8nm、9nm、10nm、20nm、30nm、40nm、50nm、60nm、70nm、80nm、90nm、100nm、200nm、300nm、400nm、500nm、600nm、700nm、800nm、900nm、1μm、2μm、3μm、4μm、5μm、6μm、7μm、8μm、9μm、10μm、20μm、30μm、40μm、50μm、60μm、70μm、80μm、90μm、100μm、200μm、300μm、400μm、500μm、600μm、700μm、800μm、900μm或1000μm的深度。在一些情况下,粗糙度可以具有至多约0.1nm、0.2nm、0.3nm、0.4nm、0.5nm、0.6nm、0.7nm、0.8nm、0.9nm、1nm、2nm、3nm、4nm、5nm、6nm、7nm、8nm、9nm、10nm、20nm、30nm、40nm、50nm、60nm、70nm、80nm、90nm、100nm、200nm、300nm、400nm、500nm、600nm、700nm、800nm、900nm、1μm、2μm、3μm、4μm、5μm、6μm、7μm、8μm、9μm、10μm、20μm、30μm、40μm、50μm、60μm、70μm、80μm、90μm、100μm、200μm、300μm、400μm、500μm、600μm、700μm、800μm、900μm或1000μm的深度。
表面官能度可以包括可聚合官能团、带正电荷的官能团或带负电荷的官能团、两性离子官能团、酸性官能团或碱性官能团、极性官能团、非极性官能团或其任何组合。表面官能度可以包括羧基、羟基、硫醇基团、氰基、硝基、铵基、烷基、咪唑鎓基团、锍基团、吡啶鎓基团、吡咯烷鎓基团、鏻基、氨基丙基、胺基、硼酸基团、N-琥珀酰亚胺基酯基团、PEG基团、链霉抗生物素蛋白、甲基醚基团、三乙氧基丙基氨基硅烷基团、PCP基团、柠檬酸酯基团、硫辛酸基团、BPEI基团或其任何组合。来自多种颗粒中的颗粒可以选自胶束、脂质体、氧化铁颗粒、银颗粒、金颗粒、钯颗粒、量子点、铂颗粒、钛颗粒、二氧化硅颗粒、金属或无机氧化物颗粒、合成聚合物颗粒、共聚物颗粒、三元共聚物颗粒、具有金属核的聚合物颗粒、具有金属氧化物核的聚合物颗粒、聚苯乙烯磺酸盐颗粒、聚氧化乙烯颗粒、聚乙二醇颗粒、聚乙烯亚胺颗粒、聚乳酸颗粒、聚己内酯颗粒、聚乙醇酸颗粒、聚(丙交酯-共-乙交酯)聚合物颗粒、纤维素醚聚合物颗粒、聚乙烯吡咯烷酮颗粒、聚乙酸乙烯酯颗粒、聚乙烯吡咯烷酮-乙酸乙烯酯共聚物颗粒、聚乙烯醇颗粒、丙烯酸酯颗粒、聚丙烯酸颗粒、巴豆酸共聚物颗粒、聚乙烯膦酸酯颗粒、聚亚烷基颗粒、羧基乙烯基聚合物颗粒、海藻酸钠颗粒、角叉菜胶颗粒、黄原胶颗粒、阿拉伯树胶颗粒、阿拉伯胶颗粒、瓜尔胶颗粒、支链淀粉颗粒、琼脂颗粒、几丁质颗粒、壳聚糖颗粒、果胶颗粒、刺梧桐胶颗粒、刺槐豆胶颗粒、麦芽糖糊精颗粒、直链淀粉颗粒、玉米淀粉颗粒、马铃薯淀粉颗粒、大米淀粉颗粒、木薯淀粉颗粒、豌豆淀粉颗粒、甘薯淀粉颗粒、大麦淀粉颗粒、小麦淀粉颗粒、羟丙基化的高直链淀粉淀粉颗粒、糊精颗粒、果聚糖颗粒、elsinan颗粒、谷蛋白颗粒、胶原蛋白颗粒、乳清蛋白分离物颗粒、酪蛋白颗粒、乳蛋白颗粒、大豆蛋白颗粒、角蛋白颗粒、聚乙烯颗粒、聚碳酸酯颗粒、聚酸酐颗粒、聚羟基酸颗粒、聚富马酸丙二酯(polypropylfumerate)颗粒、聚己内酯颗粒、聚胺颗粒、聚缩醛颗粒、聚醚颗粒、聚酯颗粒、聚(原酸酯)颗粒、聚氰基丙烯酸酯颗粒、聚氨酯颗粒、聚膦腈颗粒、聚丙烯酸酯颗粒、聚甲基丙烯酸酯颗粒、聚氰基丙烯酸酯颗粒、聚脲颗粒、聚胺颗粒、聚苯乙烯颗粒、聚(赖氨酸)颗粒、壳聚糖颗粒、葡聚糖颗粒、聚(丙烯酰胺)颗粒、衍生的聚(丙烯酰胺)颗粒、明胶颗粒、淀粉颗粒、壳聚糖颗粒、葡聚糖颗粒、明胶颗粒、淀粉颗粒、聚-β-氨基-酯颗粒、聚(酰胺基胺)颗粒、聚乳酸-共-羟基乙酸颗粒、聚酸酐颗粒、生物可还原性聚合物颗粒和2-(3-氨基丙基氨基)乙醇颗粒及其任何组合。
在一些情况下,表面官能度可以包括伯胺、仲胺、叔胺、酰胺、醇、乙酸、羧酸、吡啶、嘧啶、吡咯烷或其任何组合。
图18示出了颗粒的一些表面官能度。在一些情况下,表面官能度可以包括丁-1-胺、丙-2-胺、乙-1,2-二胺、1,3-对苯二甲胺、2-氨基乙-1-醇、2-苯基吡咯烷、己-1-胺、二乙胺、(3s,5s,7s)-金刚烷-1-胺、吡啶-2-基甲胺、(S)-1,2,3,4-四氢萘-1-胺、苯基甲胺、(2-氨基乙基)氨基甲酸叔丁酯、3-氨基苯酚、苯-1,4-二胺、1-(2-氨基乙基)-1H-吡咯-2,5-二酮、2,2’-氮杂二基二乙酸、(S)-2,3-二氢-1H-茚-1-胺、6-氨基己-1-醇、4,4’-亚甲基双(环己烷-1-胺)、N1,N1-二甲基乙烷-1,2-二胺、己烷-1,6-二胺、邻-(2-氨基乙基)聚乙二醇、二氧化硅、聚(N-(3-(二甲基氨基)丙基)甲基丙烯酰胺)(PDMAPMA)、葡萄糖-6-磷酸酯、N1-(2-氨基乙基)-N2-丁基乙烷-1,2-二胺、其立体异构体、其盐或其任何组合。
表面官能度可能影响颗粒的生物分子冠状物的组成。在一些情况下,具有第一表面官能度的颗粒和具有第二表面官能度的颗粒可以形成生物分子冠状物,该生物分子冠状物包括至多80%的两种生物分子冠状物共有的蛋白质类型。在一些情况下,具有不同表面官能度的两种颗粒通常可以构成生物样本中至多约0.1%、0.2%、0.3%、0.4%、0.5%、0.6%、0.7%、0.8%、0.9%、1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、20%、30%、40%、50%、60%、70%、80%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.1%、99.2%、99.3%、99.4%、99.5%、99.6%、99.7%、99.8%或99.9%的蛋白质类型。
本公开包括有包括在至少一种物理化学性质上不同的两种或更多种颗粒的组合物和方法。此类组合物和方法可以包括来自多种颗粒中的至少2种到至少20种颗粒,这些颗粒在至少一种物理化学性质上不同。此类组合物和方法可以包括来自多种颗粒中的至少3种到至少6种颗粒,这些颗粒在至少一种物理化学性质上不同。此类组合物和方法可以包括来自多种颗粒中的至少4种到至少8种颗粒,这些颗粒在至少一种物理化学性质上不同。此类组合物和方法可以包括来自多种颗粒中的至少4种到至少10种颗粒,这些颗粒在至少一种物理化学性质上不同。此类组合物和方法可以包括来自多种颗粒中的至少5种到至少12种颗粒,这些颗粒在至少一种物理化学性质上不同。此类组合物和方法可以包括来自多种颗粒中的至少6种到至少14种颗粒,这些颗粒在至少一种物理化学性质上不同。此类组合物和方法可以包括来自多种颗粒中的至少8种到至少15种颗粒,这些颗粒在至少一种物理化学性质上不同。此类组合物和方法可以包括来自多种颗粒中的至少10种到至少20种颗粒,这些颗粒在至少一种物理化学性质上不同。此类组合物和方法可以包括至少2种不同的颗粒类型、至少3种不同的颗粒类型、至少4种不同的颗粒类型、至少5种不同的颗粒类型、至少6种不同的颗粒类型、至少7种不同的颗粒类型、至少8种不同的颗粒类型、至少9种不同的颗粒类型、至少10种不同的颗粒类型、至少11种不同的颗粒类型、至少12种不同的颗粒类型、至少13种不同的颗粒类型、至少14种不同的颗粒类型、至少15种不同的颗粒类型、至少20种不同的颗粒类型、至少25种颗粒类型或至少30种不同的颗粒类型。
本文所述的组合物包含有包括一种或多于一种不同的颗粒类型的颗粒组。本文所述的颗粒组可以在单个组中的颗粒类型的数量和颗粒类型的多样性方面变化。例如,组中的颗粒可以基于尺寸、多分散性、形状和形态、表面电荷、表面化学和官能化以及基础材料(base material)而变化。可以将组与待分析蛋白质和蛋白质浓度的样本一起温育。样本中的蛋白质吸附到颗粒组中不同颗粒类型的表面,以形成蛋白质冠状物。吸附到颗粒组中的特定颗粒类型的确切蛋白质和蛋白质的浓度可能取决于颗粒类型的组成、尺寸和表面电荷。因此,由于吸附蛋白质的不同集合、不同浓度的特定蛋白质或其组合,组中的每种颗粒类型可能具有不同的蛋白质冠状物。组中的每种颗粒类型可以具有互斥的蛋白质冠状物,或者可以具有重叠的蛋白质冠状物。重叠的蛋白质冠状物可以在蛋白质特性、蛋白质浓度或两者上重叠。
本公开还提供了根据样本类型选择包括在组中的颗粒类型的方法。包括在组中的颗粒类型可以是为去除高度丰富的蛋白质而优化的颗粒的组合。包括在组中的颗粒类型可以是为吸附低丰度蛋白质而优化的颗粒的组合。还一致包括在组中的颗粒类型是那些被选择用于吸附感兴趣的特定蛋白质的颗粒类型。颗粒可以包括纳米颗粒。颗粒可以包括微粒。颗粒可以包括纳米颗粒和微粒的组合。
本文公开的颗粒组可以用于在宽动态范围内鉴定本文公开的不同蛋白质的数量和/或本文公开的任何特定蛋白质。例如,本文公开的包括不同颗粒类型的颗粒组可以在样本(例如,血浆样本)中存在蛋白质的整个动态范围内富集样本中的蛋白质,其可以使用生物分子测定工作流程来鉴定。在一些情况下,包括本文公开的任何数量的不同颗粒类型的颗粒组在至少2的动态范围内富集和鉴定蛋白质。在一些情况下,包括本文公开的任何数量的不同颗粒类型的颗粒组在至少3的动态范围内富集和鉴定蛋白质。在一些情况下,包括本文公开的任何数量的不同颗粒类型的颗粒组在至少4的动态范围内富集和鉴定蛋白质。在一些情况下,包括本文公开的任何数量的不同颗粒类型的颗粒组在至少5的动态范围内富集和鉴定蛋白质。在一些情况下,包括本文公开的任何数量的不同颗粒类型的颗粒组在至少6的动态范围内富集和鉴定蛋白质。在一些情况下,包括本文公开的任何数量的不同颗粒类型的颗粒组在至少7的动态范围内富集和鉴定蛋白质。在一些情况下,包括本文公开的任何数量的不同颗粒类型的颗粒组在至少8的动态范围内富集和鉴定蛋白质。在一些情况下,包括本文公开的任何数量的不同颗粒类型的颗粒组在至少9的动态范围内富集和鉴定蛋白质。在一些情况下,包括本文公开的任何数量的不同颗粒类型的颗粒组在至少10的动态范围内富集和鉴定蛋白质。在一些情况下,包括本文公开的任何数量的不同颗粒类型的颗粒组在至少11的动态范围内富集和鉴定蛋白质。在一些情况下,包括本文公开的任何数量的不同颗粒类型的颗粒组在至少12的动态范围内富集和鉴定蛋白质。在一些情况下,包括本文公开的任何数量的不同颗粒类型的颗粒组在至少13的动态范围内富集和鉴定蛋白质。在一些情况下,包括本文公开的任何数量的不同颗粒类型的颗粒组在至少14的动态范围内富集和鉴定蛋白质。在一些情况下,包括本文公开的任何数量的不同颗粒类型的颗粒组在至少15的动态范围内富集和鉴定蛋白质。在一些情况下,包括本文公开的任何数量的不同颗粒类型的颗粒组在至少20的动态范围内富集和鉴定蛋白质。在一些情况下,包括本文公开的任何数量的不同颗粒类型的颗粒组在2至100的动态范围内富集和鉴定蛋白质。在一些情况下,包括本文公开的任何数量的不同颗粒类型的颗粒组在2至20的动态范围内富集和鉴定蛋白质。在一些情况下,包括本文公开的任何数量的不同颗粒类型的颗粒组在2至10的动态范围内富集和鉴定蛋白质。在一些情况下,包括本文公开的任何数量的不同颗粒类型的颗粒组在2至5的动态范围内富集和鉴定蛋白质。在一些情况下,包括本文公开的任何数量的不同颗粒类型的颗粒组在5至10的动态范围内富集和鉴定蛋白质。
包括本文公开的任何数量的不同颗粒类型的颗粒组可以富集和鉴定单一蛋白质或蛋白质群组。在一些情况下,单一蛋白质或蛋白质群组可以包括具有不同翻译后修饰的蛋白质。例如,颗粒组中的第一种颗粒类型可以富集具有第一翻译后修饰的蛋白质或蛋白质群组,颗粒组中的第二种颗粒类型可以富集具有第二翻译后修饰的相同蛋白质或相同蛋白质群组,并且颗粒组中的第三种颗粒类型可以富集缺乏翻译后修饰的相同蛋白质或相同蛋白质群组。在一些情况下,包括本文公开的任何数量的不同颗粒类型的颗粒组通过结合单一蛋白质或蛋白质群组的不同结构域、序列或表位来富集和鉴定单一蛋白质或蛋白质群组。例如,颗粒组中的第一种颗粒类型可以通过结合到蛋白质或蛋白质群组的第一结构域来富集蛋白质或蛋白质群组,并且颗粒组中的第二种颗粒类型可以通过结合到蛋白质或蛋白质群组的第二结构域来富集相同蛋白质或相同蛋白质群组。
颗粒组可以包括具有二氧化硅和聚合物表面的颗粒的组合。例如,颗粒组可以包括涂覆有薄的二氧化硅层的SPION、涂覆有聚(二甲基氨基丙基甲基丙烯酰胺)(PDMAPMA)的SPION和涂覆有聚(乙二醇)(PEG)的SPION。与本公开一致的颗粒组也可以包括两种或更多种选自以下的颗粒:二氧化硅涂覆的SPION、N-(3-三甲氧基甲硅烷基丙基)二亚乙基三胺涂覆的SPION、PDMAPMA涂覆的SPION、羧基官能化聚丙烯酸涂覆的SPION、氨基表面官能化的SPION、聚苯乙烯羧基官能化的SPION、二氧化硅颗粒和葡聚糖涂覆的SPION。与本公开一致的颗粒组还可以包括两种或更多种选自以下的颗粒:不含表面活性剂的羧酸盐微粒、羧基官能化的聚苯乙烯颗粒、二氧化硅涂覆的颗粒、二氧化硅颗粒、葡聚糖涂覆的颗粒、油酸涂覆的颗粒、硼化的纳米粉末涂覆的颗粒、PDMAPMA涂覆的颗粒、聚(甲基丙烯酸缩水甘油酯-苄胺)涂覆的颗粒和聚(N-[3-(二甲基氨基)丙基]甲基丙烯酰胺-共-[2-(甲基丙烯酰氧基)乙基]二甲基-(3-磺丙基)氢氧化铵、P(DMAPMA-共-SBMA)涂覆的颗粒。与本公开一致的颗粒组可以包括二氧化硅涂覆的颗粒、N-(3-三甲氧基甲硅烷基丙基)二亚乙基三胺涂覆的颗粒、聚(N-(3-(二甲基氨基)丙基)甲基丙烯酰胺)(PDMAPMA)涂覆的颗粒、磷酸盐-糖官能化的聚苯乙烯颗粒、胺官能化的聚苯乙烯颗粒、聚苯乙烯羧基官能化的颗粒、泛素官能化的聚苯乙烯颗粒、葡聚糖涂覆的颗粒或其任何组合。
本公开的颗粒可以与生物样本(例如,生物流体)接触,以形成生物分子冠状物。在接触复合生物样本时,多种颗粒中的一种或多种类型的颗粒可以吸附100种或更多种类型的蛋白质(例如,在包括100pM的一种类型的颗粒的100μl的生物样本的等分试样中,给定类型的约1010个颗粒可以共同吸附100种或更多种类型的蛋白质)。颗粒和生物分子冠状物可以从生物样本中分离,例如通过离心、磁分离、过滤或重力分离。可以使用多种分离技术从生物样本中分离出颗粒类型和生物分子冠状物。分离技术的非限制性实例包括磁分离、基于柱的分离、过滤、基于旋转柱的分离、离心、超速离心、基于密度或梯度的离心、重力分离或其任何组合。可以对分离的颗粒和生物分子冠状物进行蛋白质冠状物分析。蛋白质冠状物分析可以包括例如通过质谱法鉴定生物分子冠状物中的一种或多种蛋白质。一种方法可以包括使单一颗粒类型(例如,表1中列出的一种类型的颗粒)与生物样本接触。一种方法还可以包括使多种颗粒类型(例如,表1中提供的多种颗粒类型)与生物样本接触。多种颗粒类型可以被组合并与单个样本体积的生物样本接触。多种颗粒类型可以顺序地接触生物样本,并在使随后的颗粒类型接触生物样本之前从生物样本中分离。与总蛋白质分析方法相比,生物分子冠状物的蛋白质冠状物分析可以压缩分析的动态范围。
使生物样本与一种颗粒或多种颗粒接触可以包括向生物样本中添加确定浓度的颗粒。使生物样本与一种颗粒或多种颗粒接触可以包括向生物样本中添加1pM至100nM的颗粒。使生物样本与一种颗粒或多种颗粒接触可以包括向生物样本中添加1pM至500pM的颗粒。使生物样本与一种颗粒或多种颗粒接触可以包括向生物样本中添加10pM至1nM的颗粒。使生物样本与一种颗粒或多种颗粒接触可以包括向生物样本中添加100pM至10nM的颗粒。使生物样本与一种颗粒或多种颗粒接触可以包括向生物样本中添加500pM至100nM的颗粒。使生物样本与一种颗粒或多种颗粒接触可以包括向生物样本中添加50μg/ml至300μg/ml(颗粒质量/生物样本体积)的颗粒。使生物样本与一种颗粒或多种颗粒接触可以包括向生物样本中添加100μg/ml至500μg/ml的颗粒。使生物样本与一种颗粒或多种颗粒接触可以包括向生物样本中添加250μg/ml至750μg/ml的颗粒。使生物样本与一种颗粒或多种颗粒接触可以包括向生物样本中添加400μg/ml至1mg/ml的颗粒。使生物样本与一种颗粒或多种颗粒接触可以包括向生物样本中添加600μg/ml至1.5mg/ml的颗粒。使生物样本与一种颗粒或多种颗粒接触可以包括向生物样本中添加800μg/ml至2mg/ml的颗粒。使生物样本与一种颗粒或多种颗粒接触可以包括向生物样本中添加1mg/ml至3mg/ml的颗粒。使生物样本与一种颗粒或多种颗粒接触可以包括向生物样本中添加2mg/ml至5mg/ml的颗粒。使生物样本与一种颗粒或多种颗粒接触可以包括向生物样本中添加少于5mg/ml的颗粒。使生物样本与一种颗粒或多种颗粒接触可以包括向生物样本中添加大于5mg/ml的颗粒。使生物样本与一种颗粒或多种颗粒接触可以包括向生物样本中添加大于10mg/ml的颗粒。使生物样本与一种颗粒或多种颗粒接触可以包括向生物样本中添加大于15mg/ml的颗粒。
在一些情况下,生物样本可以包含大于约1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900、1000、2000、3000、4000、5000、6000、7000、8000、9000、10000、20000、30000、40000、50000、60000、70000、80000、90000、100000、200000、300000、400000或500000种类型的蛋白质。在一些情况下,生物样本可以包含小于约1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900、1000、2000、3000、4000、5000、6000、7000、8000、9000、10000、20000、30000、40000、50000、60000、70000、80000、90000、100000、200000、300000、400000或500000种类型的蛋白质。
多种颗粒中的颗粒可以具有不同程度的尺寸和形状均匀性。特定类型的颗粒集合的直径标准偏差可以小于该颗粒类型的平均直径的20%、10%、5%或2%(例如,对于平均直径为100nm的颗粒,小于2nm)。这可能对应于包含多种颗粒的样本的低多分散指数,小于2、小于1、小于0.8、小于0.6、小于0.5、小于0.4、小于0.3、小于0.2、小于0.1或小于0.05。相反,多种颗粒在平均尺寸和形状上可以具有高度的差异。包含多种颗粒的样本的多分散指数可以大于3、大于4、大于5、大于8、大于10、大于12、大于15或大于20。多种颗粒之间的尺寸和形状均匀性可能影响吸附到颗粒上的生物分子的数量和类型。对于一些方法,颗粒之间的尺寸均匀性(例如,低多分散指数)可以实现特定生物分子的更大富集,以及富集的生物分子丰度和颗粒类型之间更强的对应性。对于一些方法,低尺寸均匀性可以实现更多种类型的生物分子的收集。
颗粒可以包括各种直径。在一些情况下,直径可以通过动态光散射来测量。在一些情况下,颗粒可以包括至少约10、20、30、40、50、60、70、80、90、100、110、120、130、140、150、160、170、180、190、200、210、220、230、240、250、260、270、280、290、300、310、320、330、340、350、360、370、380、390、400、410、420、430、440、450、460、470、480、490、500、600、700、800、900或1000nm的直径。在一些情况下,颗粒可以包括至多约10、20、30、40、50、60、70、80、90、100、110、120、130、140、150、160、170、180、190、200、210、220、230、240、250、260、270、280、290、300、310、320、330、340、350、360、370、380、390、400、410、420、430、440、450、460、470、480、490、500、600、700、800、900或1000nm的直径。
颗粒在溶剂中可以包括各种ζ电势。在一些情况下,颗粒可以包括在至少约-100mV和至多约100mV之间的ζ电势。在一些情况下,颗粒可以包括在至少约-50mV和至多约50mV之间的ζ电势。在一些情况下,颗粒可以包括在至少约-40mV和至多约-20mV之间的ζ电势。在一些情况下,颗粒可以包括在至少约-20mV和至多约0mV之间的ζ电势。在一些情况下,颗粒可以包括在至少约0mV和至多约20mV之间的ζ电势。在一些情况下,颗粒可以包括在至少约20mV和至多约40mV之间的ζ电势。在一些情况下,颗粒可以包括大于约-1000、-900、-800、-700、-600、-500、-400、-300、-200、-100、-90、-80、-70、-60、-50、-40、-30、-20、-10、0、10、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900、1000、2000、3000、4000、5000、6000、7000、8000、9000或10000mV的ζ电势。在一些情况下,颗粒可以包括小于约-1000、-900、-800、-700、-600、-500、-400、-300、-200、-100、-90、-80、-70、-60、-50、-40、-30、-20、-10、0、10、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900、1000、2000、3000、4000、5000、6000、7000、8000、9000或10000mV的ζ电势。
在一些情况下,溶剂可以包括水、甲醇、乙醇、异丙醇、丙酮或其任何组合。在一些情况下,溶剂可以是缓冲溶液。在一些情况下,溶剂可以包括群集剂。在一些情况下,溶剂可以包括表面活性剂。
在一些情况下,溶剂可以包括盐。在一些情况下,盐可以包括LiF、LiCl、LiBr、LiI、Li2SO4、BeF2、BeCl2、BeBr2、BeI2、BeSO4、NaF、NaCl、NaBr、NaI、Na2SO4、MgF2、MgCl2、MgBr2、MgI2、MgSO4、KF、KCl、KBr、KI、K2SO4、CaF2、CaCl2、CaBr2、CaI2、KSO4、NH4F、NH4Cl、NH4Br、NH4I、(NH4)2SO4或其任何组合。
在一些情况下,溶剂可以包括各种酸或碱。在一些情况下,酸可以包括盐酸、乙酸、硫酸、硝酸、柠檬酸或其任何组合。在一些情况下,碱可以包括NaOH、KOH、Ca(OH)2、NH4OH或其任何组合。
在一些情况下,溶剂可以包括各种pH值。在一些情况下,溶剂可以包括约生理pH的pH。在一些情况下,溶剂可以包括至少约6.9到至多约7.0、至少约7.0到至多约7.1、至少约7.1到至多约7.2、至少约7.2到至多约7.3、至少约7.3到至多约7.4、至少约7.4到至多约7.5、至少约7.5到至多约7.6、至少约7.6到至多约7.7、至少约7.7到至多约7.8或至少约7.9到至多约8.0的pH。在一些情况下,溶剂可以包括至少约1到至多约2、至少约2到至多约3、至少约3到至多约4、至少约4到至多约5、至少约5到至多约6、至少约6到至多约7、至少约7到至多约8、至少约8到至多约9、至少约9到至多约10、至少约10到至多约11、至少约11到至多约12、至少约12到至多约13或至少约13到至多约14的pH。
在一些情况下,溶剂可以包括无菌溶剂。在一些情况下,无菌的或是无菌的可以指包括的生物物质少于对于某一实验、某一组合物、某一方法等可接受的量的物质。被认为是无菌的可接受的量可以根据不同的实验、不同的组合物和不同的方法而变化。在一些情况下,用于质谱法的无菌溶剂可以包括少于约100μg/mL、10μg/mL、1μg/mL、100ng/mL、10ng/mL、1ng/mL、100pg/mL、10pg/mL、1pg/mL、100fg/mL、10fg/mL或1fg/mL的添加的生物物质。在一些情况下,无菌溶剂可以包括小于可检测限度的量的添加的生物物质。
在一些情况下,颗粒可以是结合诱饵颗粒。在一些情况下,颗粒可以是机械诱饵颗粒。在一些情况下,颗粒可能能够发出内在信号。
在一些情况下,颗粒可以被设计成拓宽选择性。在一些情况下,颗粒可以被设计成缩小选择性。在一些情况下,通过改变颗粒的表面化学,选择性可以变宽或变窄。在一些情况下,改变颗粒的表面化学可以包括粘附新的或不同的官能团、氧化表面、氢化表面、辐射表面。在一些情况下,通过在颗粒的表面上放置特定的分子,选择性可以变宽或变窄。在一些情况下,通过在颗粒表面上放置蛋白质,选择性可以变宽或变窄。在一些情况下,通过放置抗体或抗原来捕获非常特定的蛋白质,选择性可以变宽或变窄。
样本收集和提取方法
可以根据本公开的方法和组合物测定多种样本。在用各种类型的传感器元件连续询问样本之后,可以通过生物分子冠状物分析来分析本文公开的样本。在蛋白质冠状物分析之前,样本可以被分级分离或耗竭。本公开的方法可以包括使样本与一种或多种颗粒类型接触,并对样本进行生物分子冠状物分析。
样本可以是生物样本。例如,生物样本可以是生物流体样本,如脑脊液(CSF)、滑液(SF)、尿液、血浆、血清、泪液、沟液、精液、全血、奶汁、乳头抽吸物、针抽吸物、导管灌洗液、阴道分泌物、鼻液、耳液、胃液、胰液、小梁液、肺灌洗液、前列腺液、痰、粪便、支气管灌洗液、来自拭子的液体、支气管抽吸物、汗液或唾液。生物流体可以是流化固体,例如组织匀浆,或者从生物样本中提取的流体。生物样本可以是例如组织样本或细针抽吸(FNA)样本。生物样本可以是细胞培养样本。例如,可以用于本文公开的方法的样本可以包括在细胞培养物中生长的细胞,或者可以包括取自细胞培养物的无细胞材料。生物流体可以是流化的生物样本。例如,生物流体可以是流化的细胞培养提取物。样本可以从流体样本中提取,或者样本可以从固体样本中提取。例如,样本可以包括从流化固体(例如,挥发性有机化合物)中提取的气体分子。
本文所述的生物分子冠状物分析方法可以包括在宽的动态范围内测定本公开的样本中的蛋白质。在样本中测定的生物分子的动态范围可以是如通过对样本中含有的生物分子的测定方法(例如,质谱法、肽测序、肽亲和捕获、色谱法、凝胶电泳、光谱或免疫测定)测量的生物分子丰度的测量信号的范围。例如,能够在宽的动态范围内检测蛋白质的测定可能能够检测非常低丰度的蛋白质到非常高丰度的蛋白质。测定的动态范围可以直接与作为生物分子丰度的函数的测定信号强度的斜率相关。例如,具有低动态范围的测定可能具有作为生物分子丰度的函数的低(但是正的)测定信号强度斜率,例如,对于高丰度生物分子检测到的信号的比率到对于低丰度生物分子检测到的信号的比率对于具有低动态范围的测定可能低于具有高动态范围的测定。本文描述的生物分子冠状物分析方法可以压缩测定的动态范围。如果作为生物分子丰度的函数的测定信号强度的斜率低于另一测定的斜率,则该测定的动态范围可相对于另一测定被压缩。例如,与直接在样本上使用单独的质谱法测定的血浆样本相比或者与数据库(例如,在Keshishian等人,Mol.Cell Proteomics14,2375–2393(2015)中提供的数据库,在本文中也被称为“Carr数据库”)中提供的血浆生物分子的丰度值相比,使用生物分子冠状物分析和质谱法测定的血浆样本可以具有压缩的动态范围。与使用单独的质谱法相比,压缩的动态范围可以使用生物分子冠状物分析和质谱法来实现血浆样本中更多的低丰度生物分子的检测。
压缩测定的动态范围可以实现使用本文公开的方法检测低丰度生物分子(例如,用颗粒进行连续询问,然后进行用于定量蛋白质丰度的测定,如质谱法)。例如,测定(例如,质谱法)可能能够检测3个数量级的动态范围。在包含丰度分别为1ng/mL、10ng/mL、100ng/mL、1,000ng/mL和10,000ng/mL的五种蛋白质A、B、C、D和E的样本中,测定(例如,质谱法)可以检测蛋白质B、C、D和E。然而,使用本文公开的将样本与颗粒一起温育的方法,蛋白质A、B、C、D和E可以对颗粒表面具有不同的亲和力,并且可以吸附到颗粒的表面以在不同于样本中存在的丰度下形成生物分子冠状物。例如,蛋白质A、B、C、D和E可以分别以1ng/mL、231ng/mL、463ng/mL、694ng/mL和926ng/mL的丰度存在于生物分子冠状物中。因此,在询问样本的方法中使用本文公开的颗粒可以导致将动态范围压缩到2个数量级,并且所得的测定(例如,质谱法)可以检测所有五种蛋白质。
在一些方面,第一生物分子冠状物中的多个生物分子的动态范围是以下各项的第一比率:a)由第一生物分子冠状物中的多个生物分子中的较高丰度生物分子产生的信号;和b)由第一生物分子冠状物中的多个生物分子中的较低丰度生物分子产生的信号。在一些方面,第一生物分子冠状物中的多个生物分子的动态范围是第一生物分子冠状物中的多个蛋白质中最高丰度生物分子的浓度与最低丰度生物分子的浓度的第一比率。在一些方面,第一生物分子冠状物中的多个生物分子的动态范围是第一生物分子冠状物中的多个蛋白质中的生物分子的前十分位数(top decile)与生物分子的后十分位数(bottom decile)的第一比率。在一些方面,第一生物分子冠状物中的多个生物分子的动态范围是第一比率,该第一比率包括第一生物分子冠状物中的多个生物分子中的生物分子的四分位数范围的跨度。在一些方面,第一生物分子冠状物中的多个生物分子的动态范围是第一比率,该第一比率包括第一生物分子冠状物中的多个生物分子中的所有生物分子浓度相对于样本中相同生物分子的已知浓度的图中的拟合数据的斜率。
在一些方面,如通过总生物分子分析方法(例如,总蛋白质分析方法)测量的,样本中的多个生物分子的动态范围是第二比率,该第二比率包括样本中多个生物分子中的生物分子的四分位数范围的跨度。在一些方面,如通过总生物分子分析方法测量的,样本中多个生物分子的动态范围是第二比率,该第二比率包括样本中多个生物分子中的所有生物分子浓度相对于样本中相同生物分子的已知浓度的图中拟合数据的斜率。在一些方面,从数据库中获得样本中相同生物分子的已知浓度。在一些方面,压缩动态范围包括相对于第二比率减小的第一比率。在另外的方面,减小的第一比率比第二比率小至少1.1倍、至少1.2倍、至少1.3倍、至少1.4倍、至少1.5倍、至少2倍、至少2.5倍、至少3倍、至少3.5倍、至少4倍、至少5倍、至少10倍、至少100倍、至少1000倍或至少10,000倍。
相对于未处理的样本(例如,未使用颗粒进行测定的样本),感兴趣的生物分子(例如,低丰度蛋白质)可以被富集在生物分子冠状物中。富集水平可以是与未处理的样本相比,感兴趣的生物分子相对于生物分子冠状物中生物分子的总量的相对丰度的百分比增加或倍数增加。与未接触颗粒的样本相比,通过增加生物分子冠状物中感兴趣的生物分子的相对丰度,可以在生物分子冠状物中富集感兴趣的生物分子。与未接触颗粒的样本相比,可以通过降低生物分子冠状物中高丰度生物分子的相对丰度来富集感兴趣的生物分子。生物分子冠状物分析测定可以用于快速鉴定生物样本(例如,生物流体)中的低丰度生物分子。生物分子冠状物分析测定可以在从生物样本首次与颗粒接触起不超过约8小时内鉴定生物样本中的至少约500个低丰度生物分子。生物分子冠状物分析测定可以在从生物样本首次与颗粒接触起不超过约8小时内鉴定生物样本中的至少约1000个低丰度生物分子。生物分子冠状物分析测定可以在从生物样本首次与颗粒接触起不超过约4小时内鉴定生物样本中的至少约500个低丰度生物分子。生物分子冠状物分析测定可以在从生物样本首次与颗粒接触起不超过约4小时内鉴定生物样本中的至少约1000个低丰度生物分子。
多样本分析
一种方法可以包括分析来自对象(例如,癌症患者)的多个样本。例如,多个样本可以包括核酸样本和蛋白质样本。核酸样本和蛋白质样本可以来源于一种或多种生物样本,如血液样本。
生物分子分布在样本类型和/或组织类型(例如,组织学)之间可能不均匀。对于许多生物学状态,来自对象的不同样本可以包括不同的,并且在一些情况下,可以包括不同组的生物标志物(例如,蛋白质或基因)。例如,人血浆可以包括相对低的核酸含量和随生物学状态强烈变化的人蛋白质组的子集,而组织匀浆可以包括生物学状态敏感的基因组含量,但是蛋白质分布在广泛的生物学状态范围内是稳定的。对于核酸分析有用的样本对于蛋白质分析可能是较差的样本,而对于蛋白质分析有用的样本可能含有低的核酸含量。在一些情况下(例如,对于许多形式的癌症),细胞匀浆可以提供反映生物学状态的大量基因组和转录组信息,而同时示出不足以用于生物学状态分析的蛋白质表达的微小变化。血浆蛋白质丰度可能对对象的生物学状态敏感,而血浆核酸浓度对于分析来说可能非常低。
一种方法可以通过利用不同类型的样本进行蛋白质组测定和核酸测定来克服这些限制。例如,对于怀疑患有癌症的对象,对潜在癌性组织的活检可以用于核酸分析,而血浆可以用于蛋白质组分析。一种方法也可以利用样本的不同部分进行蛋白质和核酸分析。例如,测定可以利用来自血液样本的血沉棕黄层进行核酸分析,并利用样本的血浆部分进行蛋白质组分析。
本公开的方法可以包括对来自对象的第一样本进行核酸分析,并对来自对象的第二样本进行蛋白质分析。对象可能患有或被怀疑患有疾病或癌症。与本公开一致的方法可以包括对来自对象的多种样本类型(例如,口腔拭子和尿液)进行核酸分析或蛋白质分析。本公开的方法可以包括对同一样本进行核酸和蛋白质分析。本公开的方法可以包括首先从样本中收集蛋白质,然后从样本中收集核酸。本公开的方法可以包括首先从样本中收集核酸,然后从样本中收集蛋白质。本公开的方法可以包括从样本中同时纯化核酸和蛋白质(例如,酚:氯仿:异戊醇提取以将核酸和蛋白质分离成单独的相)。本公开的方法可以包括从样本中的RNA中分离DNA,并且任选地通过逆转录将RNA转化为cDNA用于测序分析。本公开的方法可以包括基于尺寸、电荷、等电点或其任何组合来分离物质。本公开的方法可以包括对样本进行裂解。本公开的方法可以包括对样本进行色谱分离。
测定生物分子冠状物
用于测定生物样本的方法可以包括从生物分子冠状物制备分析物,用于进一步分析(例如,质谱分析)。通过去除上清液(生物样本中未结合到传感器元件的部分),然后将多个生物分子从生物分子冠状物解吸到单独的溶液中,可以将生物分子冠状物与上清液分离。在一些方法中,来自生物分子冠状物的生物分子的第一部分从生物分子冠状物解吸并丢弃,并且来自生物分子冠状物的生物分子的第二部分从生物分子冠状物解吸并收集(例如,用于分析)。可以分别解吸、收集和分析来自生物分子冠状物的生物分子的多个部分。分离的部分可以包括生物分子的不同组成,并且这些部分之间的差异可以用于对样本进行指纹鉴定。
在一些情况下,用于测定生物样本的方法可以产生信号。在一些情况下,信号可以包括或可以用于确定蛋白质组信息、基因组信息或两者。在一些情况下,信号可以指从包括化学信号、离子信号、荧光信号、另一种形式的信号或其任何组合形式的蛋白质组或基因型信息的来源发出的蛋白质组或基因型信息。在一些情况下,信号可以分配给蛋白质。在一些情况下,信号可以分配给核酸。在一些情况下,用于测定生物样本的方法可以产生多个信号,这些信号可以分配给生物分子,如蛋白质、核酸分子或其组合。在一些情况下,多个信号可以包括至少20000、50000、100,000、1,000,000个可区分的信号,或者更多个。
来自生物分子冠状物的生物分子可以被变性、片段化、化学修饰或其任何组合。这些处理可以在解吸的生物分子上或者在生物分子冠状物内的生物分子上进行。从生物分子冠状物解吸的多个生物分子可以包括来自生物分子冠状物的1%、2%、3%、4%、5%、6%、8%、10%、12%、15%、20%、25%、30%、40%、50%、60%、70%、80%、90%、95%、98%、99%或大于99%的生物分子。解吸可以进行不同长度的时间,包括5秒、15秒、30秒、1分钟、2分钟、3分钟、4分钟、5分钟、6分钟、8分钟、10分钟、12分钟、15分钟、20分钟、30分钟、40分钟、50分钟、1小时、1.5小时、2小时、3小时、4小时、5小时、6小时、8小时、12小时或更长时间。在一些情况下,解吸包括物理搅动,如摇动或超声处理。从生物分子冠状物解吸的生物分子的百分比可以取决于解吸时间、生物分子被解吸到其中的溶液的化学组成(例如,pH或缓冲液类型)、解吸温度、施加的物理搅动的形式和强度或其任何组合。从生物分子冠状物解吸的生物分子的类型在两种解吸条件或方法之间可以相差1%、2%、3%、4%、5%、6%、8%、10%、12%、15%、20%、25%、30%、40%、50%、60%或更多。
从生物分子冠状物收集的生物分子可以在分析之前经受进一步的化学处理。这可以包括消化生物分子冠状物、生物分子冠状物内的生物分子的子集或从生物分子冠状物解吸的生物分子,以在自动化设备中形成消化的样本。生物分子处理也可以包括化学修饰来自生物分子冠状物的生物分子,如对生物分子进行甲基化或还原。在一些情况下,从生物分子中分离生物分子包括完整的生物分子分离。完整的生物分子分离可以产生完整的生物分子(例如,蛋白质),其可以进行后续处理和分析(例如,质谱分析)。
一种方法可以包括多轮从生物分子冠状物制备生物分子以用于分析。一种方法可以包括1、2、3、4、5、6、7、8、9、10或更多轮制备,其中多轮产生用于分析的单独的样本(例如,可以在每轮后收集解吸的生物分子并进行质谱分析)。两轮也可以包括不同的解吸方法或条件,如不同的解吸剂溶液体积、不同的解吸剂溶液类型(例如,包括不同缓冲剂或血浆渗透浓度的解吸剂溶液)、不同的温度或不同类型和不同程度的物理搅动。来自单个生物分子冠状物的两轮或更多轮连续制备(例如,从生物分子冠状物解吸和收集生物分子的第一子集,随后从生物分子冠状物解吸和收集生物分子的第二子集)可以产生生物分子的两个集合,即使在其中在各轮之间解吸方法相同的情况下。这可能提供蛋白质冠状物内生物分子相互作用的检测或分析的信息。
一种方法可以包括将传感器元件(例如,颗粒)固定在分区内。当样本体积的一部分被移除时,固定可以防止传感器元件从样本体积(例如,孔板中的孔)中移除。固定可以通过化学方法进行,并且可以包括将传感器元件直接或间接(例如,经由接头)固定到表面,如容器内的壁。可以通过施加磁场以将磁性传感器元件(例如,磁性颗粒)保持在样本容器内来实现固定。可以通过在表面上(如在微孔板的孔的内表面上)形成或嵌入传感器元件来实现固定。
传感器元件固定可以允许生物分子冠状物与传感器元件分离。这可以包括从与传感器元件相关联的生物分子冠状物解吸多个生物分子,固定传感器元件,然后从生物分子冠状物收集具有多个生物分子的溶液,从而从传感器元件分离至少一部分生物分子冠状物。可替代地,传感器元件可以在其生物分子冠状物的一部分被解吸之前被固定。
本文公开的方法可以包括过滤步骤。过滤可以将传感器元件或一种类型的生物分子(例如,蛋白酶)与样本分离。例如,该方法可以包括从与传感器元件相关联的生物分子冠状物解吸多个生物分子,并且过滤溶液,使得传感器元件被收集在过滤器上,并且多个生物分子保留在溶液中。过滤可以在变性(例如,消化)后进行。过滤还可以去除多种生物分子或生物物种,如完整的蛋白质(例如,来自生物样本的未消化的蛋白质或添加到样本中以使蛋白质片段化的蛋白酶)。
一种方法可以包括纯化步骤。纯化步骤可以包括将生物样本(例如,从生物分子冠状物中洗脱和收集的生物分子)转移到纯化单元(例如,色谱柱)或纯化单元内的分区。纯化单元可以包括固相提取或色谱柱。纯化步骤可以在收集后准备步骤之后从样本中去除试剂(例如,化学品和酶)。在纯化后,可以重新收集生物样本以进行进一步富集或化学处理,或者可以进行某种形式的分析(例如,质谱分析)。
总的来说,本公开的方法可以实现生物样本的高度概况深度。在没有对多个生物分子进行进一步操纵或修饰的情况下,在本公开的方法中收集的多个生物分子可以实现对生物样本(从其收集生物分子子集)中的至少2%、至少3%、至少4%、至少5%、至少6%、至少7%、至少8%、至少9%、至少10%、至少12%、至少15%、至少20%、至少25%、至少30%、至少40%、至少50%、至少60%或超过60%类型的生物分子的质谱检测。在没有对多个生物分子进行进一步操纵或修饰的情况下,多个生物分子可以实现对样本中的至少2%、至少3%、至少4%、至少5%、至少6%、至少7%、至少8%、至少9%、至少10%、至少12%、至少15%、至少20%、至少25%、至少30%、至少40%、至少50%或超过50%类型的蛋白质的质谱检测。在没有对多个生物分子进行进一步操纵或修饰的情况下,在传感器元件上收集的或准备用于分析的多个生物分子可以实现对样本中跨越6、7、8、9、10、11、12或更多个数量级的两种生物分子(例如,蛋白质)的同时质谱检测。例如,这两种生物分子可以在6个数量级内的浓度下被解吸和收集,片段化,然后递交用于质谱分析。
生物样本中的蛋白质冠状物分析
本文公开的颗粒及其使用方法可以结合生物样本(例如,生物流体)中的大量不同的蛋白质或蛋白质群组。可以使用本文所述的蛋白质冠状物分析方法分析的生物样本的非限制性实例包括生物流体样本(例如,脑脊液(CSF)、滑液(SF)、尿液、血浆、血清、泪液、精液、全血、奶汁、乳头抽吸物、针抽吸物、导管灌洗液、阴道分泌物、鼻液、耳液、胃液、胰液、小梁液、肺灌洗液、前列腺液、痰、粪便、支气管灌洗液、来自拭子的液体、支气管抽吸物、汗液或唾液)、流化固体(例如,组织匀浆)、或来自细胞培养物的样本。例如,本文公开的颗粒可以与本文公开的任何生物样本一起温育以形成蛋白质冠状物,该蛋白质冠状物包括至少40种蛋白质或蛋白质群组、至少60种蛋白质或蛋白质群组、至少80种蛋白质或蛋白质群组、至少100种蛋白质或蛋白质群组、至少120种蛋白质或蛋白质群组、至少140种蛋白质或蛋白质群组、至少160种蛋白质或蛋白质群组、至少180种蛋白质或蛋白质群组、至少200种蛋白质或蛋白质群组、至少220种蛋白质或蛋白质群组、至少240种蛋白质或蛋白质群组、至少260种蛋白质或蛋白质群组、至少280种蛋白质或蛋白质群组、至少300种蛋白质或蛋白质群组、至少320种蛋白质或蛋白质群组、至少340种蛋白质或蛋白质群组、至少360种蛋白质或蛋白质群组、至少380种蛋白质或蛋白质群组、至少400种蛋白质或蛋白质群组、至少420种蛋白质或蛋白质群组、至少440种蛋白质或蛋白质群组、至少460种蛋白质或蛋白质群组、至少480种蛋白质或蛋白质群组、至少500种蛋白质或蛋白质群组、至少520种蛋白质或蛋白质群组、至少540种蛋白质或蛋白质群组、至少560种蛋白质或蛋白质群组、至少580种蛋白质或蛋白质群组、至少600种蛋白质或蛋白质群组、至少620种蛋白质或蛋白质群组、至少640种蛋白质或蛋白质群组、至少660种蛋白质或蛋白质群组、至少680种蛋白质或蛋白质群组、至少700种蛋白质或蛋白质群组、至少720种蛋白质或蛋白质群组、至少740种蛋白质或蛋白质群组、至少760种蛋白质或蛋白质群组、至少780种蛋白质或蛋白质群组、至少800种蛋白质或蛋白质群组、至少820种蛋白质或蛋白质群组、至少840种蛋白质或蛋白质群组、至少860种蛋白质或蛋白质群组、至少880种蛋白质或蛋白质群组、至少900种蛋白质或蛋白质群组、至少920种蛋白质或蛋白质群组、至少940种蛋白质或蛋白质群组、至少960种蛋白质或蛋白质群组、至少980种蛋白质或蛋白质群组、至少1000种蛋白质或蛋白质群组、100至1000种蛋白质或蛋白质群组、150至950种蛋白质或蛋白质群组、200至900种蛋白质或蛋白质群组、250至850种蛋白质或蛋白质群组、300至800种蛋白质或蛋白质群组、350至750种蛋白质或蛋白质群组、400至700种蛋白质或蛋白质群组、450至650种蛋白质或蛋白质群组、500至600种蛋白质或蛋白质群组、200至250种蛋白质或蛋白质群组、250至300种蛋白质或蛋白质群组、300至350种蛋白质或蛋白质群组、350至400种蛋白质或蛋白质群组、400至450种蛋白质或蛋白质群组、450至500种蛋白质或蛋白质群组、500至550种蛋白质或蛋白质群组、550至600种蛋白质或蛋白质群组、600至650种蛋白质或蛋白质群组、650至700种蛋白质或蛋白质群组、700至750种蛋白质或蛋白质群组、750至800种蛋白质或蛋白质群组、800至850种蛋白质或蛋白质群组、850至900种蛋白质或蛋白质群组、900至950种蛋白质或蛋白质群组、950至1000种蛋白质或蛋白质群组。在一些情况下,本文公开的颗粒可以与本文公开的任何生物样本一起温育,以形成包括至少约50至500种蛋白质或蛋白质群组的蛋白质冠状物。
在一些情况下,本文公开的颗粒可以与生物样本一起温育,以形成包括至少约2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900、1000、2000、3000、4000、5000、6000、7000、8000、9000、10,000、20,000、30,000、40,000、50,000、60,000、70,000、80,000、90,000、100,000、200,000、300,000、400,000或500,000种蛋白质或蛋白质群组的蛋白质冠状物。在一些情况下,本文公开的颗粒可以与生物样本一起温育,以形成包括至多约2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900、1000、2000、3000、4000、5000、6000、7000、8000、9000、10,000、20,000、30,000、40,000、50,000、60,000、70,000、80,000、90,000、100,000、200,000、300,000、400,000或500,000种蛋白质或蛋白质群组的蛋白质冠状物。
在一些情况下,本文公开的颗粒可以在蛋白质冠状物内鉴定至少约2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900、1000、2000、3000、4000、5000、6000、7000、8000、9000、10,000、20,000、30,000、40,000、50,000、60,000、70,000、80,000、90,000、100,000、200,000、300,000、400,000或500,000种蛋白质或蛋白质群组。在一些情况下,本文公开的颗粒可以在蛋白质冠状物内鉴定至多约2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900、1000、2000、3000、4000、5000、6000、7000、8000、9000、10,000、20,000、30,000、40,000、50,000、60,000、70,000、80,000、90,000、100,000、200,000、300,000、400,000或500,000种蛋白质或蛋白质群组。
在一些情况下,测定可以包括若干种不同类型的单独或组合的颗粒,以鉴定特定生物样本中的大量蛋白质或蛋白质群组。在一些情况下,颗粒可以是多路复用的,以便结合和鉴定生物样本中的大量蛋白质或蛋白质群组。在一些情况下,可以组合使用至少约1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90或100种颗粒。在一些情况下,组合使用的颗粒可以结合和鉴定至少约250至约25,000种蛋白质或蛋白质群组。在一些情况下,组合使用的颗粒可以结合和鉴定至少约10、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900、1000、2000、3000、4000、5000、6000、7000、8000、9000、10000、15000、20000、25000、30000、35000、40000、45000或50000种蛋白质或蛋白质群组。在一些情况下,组合使用的颗粒可以结合和鉴定至多约10、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900、1000、2000、3000、4000、5000、6000、7000、8000、9000、10000、15000、20000、25000、30000、35000、40000、45000或50000种蛋白质或蛋白质群组。
在一些情况下,本文公开的颗粒可以与来自单个对象或多个对象的生物样本一起温育。在一些情况下,生物样本可以来自至少约1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900或1000名对象。在一些情况下,生物样本可以来自至多约1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900或1000名对象。
在一些情况下,本文公开的颗粒可以鉴定或定量约50至500种类型的蛋白质或蛋白质群组。在一些情况下,本文公开的颗粒可以鉴定或定量约5至5000种类型的蛋白质或蛋白质群组。在一些情况下,本文公开的颗粒可以鉴定或定量至少约5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900、1000、2000、3000、4000或5000种类型的蛋白质或蛋白质群组。在一些情况下,本文公开的颗粒可以鉴定或定量至多约5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900、1000、2000、3000、4000或5000种类型的蛋白质或蛋白质群组。
在一些情况下,本文公开的多种颗粒可以鉴定或定量约250至25000种类型的蛋白质或蛋白质群组。在一些情况下,本文公开的多种颗粒可以鉴定或定量至少约5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900、1000、2000、3000、4000、5000、6000、7000、8000、9000、10000、15000、20000、25000、30000、40000、50000、60000、70000、80000、90000或10000种类型的蛋白质或蛋白质群组。在一些情况下,本文公开的颗粒可以鉴定或定量至多约5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900、1000、2000、3000、4000、5000、6000、7000、8000、9000、10000、15000、20000、25000、30000、40000、50000、60000、70000、80000、90000或10000种类型的蛋白质或蛋白质群组。
此外,本公开的方法可以实现从样本中富集的蛋白质或蛋白质群组的同时定量。一些诊断方法的缺点是单独的生物标志物的浓度或相对状态分布(例如,磷酸化的TrkA相对于未磷酸化的TrkA)(例如,血液中IL-10的浓度)可能比生物学状态在对象之间具有更大的差异或对外部因素具有更大的依赖性(例如,对象在捐献生物样本之前最近时间的进食状况)。然而,如本文进一步提出的,大量蛋白质的丰度比可以对特定的生物学状态进行强有力的诊断,并且甚至可以区分相似的生物学状态(例如,健康相对于糖尿病前期,或者慢性淋巴细胞白血病的1期相对于2期)。本公开中描述的方法可以提供从单独的颗粒或颗粒类型中区分相对或绝对蛋白质丰度的能力。可以分别分析或测定两种颗粒类型,从而允许在多种颗粒类型之间比较大量蛋白质(例如,70种类型的蛋白质)的相对丰度。
与总蛋白质分析方法相比,生物分子冠状物的蛋白质冠状物分析可以压缩分析的动态范围。许多分析技术(例如,质谱法)对单次测量具有浓度范围限制。例如,一些质谱检测方法可能缺乏同时检测以相差超过6个数量级的浓度存在的两种肽的能力。因此,对大量样本的粗略分析可能会强调来自丰富分析物(例如,血浆中的白蛋白)的信号,而不会分辨来自低丰度靶标(例如,血浆中的白介素)的信号。本公开的方法可以增加在2、3、4、5或6个数量级的浓度内存在的蛋白质类型的数量,这使得能够并行检测来自样本的更大量的蛋白质。
例如,包括生物分子冠状物形成的方法可以将浓度处于样本中最浓的生物分子的6个数量级内的生物分子类型的数量增加至少25%、50%、100%、200%、300%、500%或1000%。类似地,压缩的动态范围可以包括浓度处于样本中最丰富的生物分子的6个数量级内的蛋白质类型数量的增加。该方法可以将浓度处于样本中最浓缩的蛋白质的6个数量级内的蛋白质类型的数量增加至少25%、50%、100%、200%、300%、500%或1000%。该方法可以从生物样本中富集生物分子的子集,并且该生物分子的子集可以包括来自生物样本的6个数量级浓度范围内的至少10%的生物分子类型。该方法可以从生物样本中富集生物分子的子集,并且该生物分子的子集可以包括来自生物样本的6个数量级浓度范围内的至少20%的生物分子类型。该方法可以从生物样本中富集生物分子的子集,并且该生物分子的子集可以包括来自生物样本的6个数量级浓度范围内的至少30%的生物分子类型。该方法可以从生物样本中富集生物分子的子集,并且该生物分子的子集可以包括来自生物样本的6个数量级浓度范围内的至少40%的生物分子类型。该方法可以从生物样本中富集生物分子的子集,并且该生物分子的子集可以包括来自生物样本的6个数量级浓度范围内的至少50%的生物分子类型。该方法可以从生物样本中富集生物分子的子集,并且该生物分子的子集可以包括来自生物样本的6个数量级浓度范围内的至少60%的生物分子类型。该方法可以从生物样本中富集生物分子的子集,并且该生物分子的子集可以包括来自生物样本的6个数量级浓度范围内的至少70%的生物分子类型。该方法可以从生物样本中富集生物分子的子集,并且该生物分子的子集可以包括来自生物样本的6个数量级浓度范围内的至少10%的蛋白质类型。该方法可以从生物样本中富集生物分子的子集,并且该生物分子的子集可以包括来自生物样本的6个数量级浓度范围内的至少20%的蛋白质类型。该方法可以从生物样本中富集生物分子的子集,并且该生物分子的子集可以包括来自生物样本的6个数量级浓度范围内的至少30%的蛋白质类型。该方法可以从生物样本中富集生物分子的子集,并且该生物分子的子集可以包括来自生物样本的6个数量级浓度范围内的至少40%的蛋白质类型。该方法可以从生物样本中富集生物分子的子集,并且该生物分子的子集可以包括来自生物样本的6个数量级浓度范围内的至少50%的蛋白质类型。该方法可以从生物样本中富集生物分子的子集,并且该生物分子的子集可以包括来自生物样本的6个数量级浓度范围内的至少60%的蛋白质类型。该方法可以从生物样本中富集生物分子的子集,并且该生物分子的子集可以包括来自生物样本的6个数量级浓度范围内的至少70%的蛋白质类型。
可以定制本公开的方法和传感器元件,使得生物分子冠状物组成相对于样本脂质浓度不变。生物样本中脂质浓度至多10%的变化可能导致生物分子冠状物中蛋白质组成的小于5%、2%、1%或0.1%的变化。生物样本中脂质浓度至多10%的变化可能导致生物分子冠状物中蛋白质类型的数量的小于5%、2%、1%或0.1%的变化。生物样本中脂质浓度至多10%的变化可能导致生物分子冠状物中蛋白质总数的小于5%、2%、1%或0.1%的变化。
在一些情况下,生物样本可以包括血液、血浆或血清,并且生物分子冠状物可以包括比生物样本更低比例的白蛋白与非白蛋白蛋白质。生物分子冠状物中的白蛋白与非白蛋白蛋白质的比率可以比吸附蛋白质的样本中的比率低20%、30%、40%、50%、60%或70%。
在一些情况下,蛋白质组信息或数据可以指关于包括肽和/或蛋白质组分的物质的信息。在一些情况下,蛋白质组信息可以包括关于肽或蛋白质的一级结构信息、二级结构信息、三级结构信息或四级信息。在一些情况下,蛋白质组信息可以包括关于蛋白质-配体相互作用的信息,其中配体可以包括可以在活生物体中发现的各种生物分子和物质中的任何一种,如核苷酸、核酸、氨基酸、肽、蛋白质、单糖、多糖、脂质、磷脂、激素或其任何组合。
在一些情况下,蛋白质组信息可以包括关于单细胞、组织、器官、组织和/或器官系统(如心血管系统、呼吸系统、消化系统或神经系统)或整个多细胞生物体的信息。在一些情况下,蛋白质组信息可以包括关于个体(例如,个体人类或个体细菌)或个体的群体(例如,被诊断患有癌症的人类或细菌菌落)的信息。蛋白质组信息可以包括来自各种生命形式的信息,包括来自古细菌、细菌、真核生物、原生动物、色藻界、植物界、真菌或动物界的生命形式。在一些情况下,蛋白质组信息可以包括来自病毒的信息。
在一些情况下,蛋白质组信息可以包括与生命代码中的外显子和内含子相关的信息。在一些情况下,蛋白质组信息可以包括关于肽和/或蛋白质的一级结构的变化、二级结构的变化、三级结构的变化或四级结构的变化的信息。在一些情况下,蛋白质组信息可以包括关于外显子表达变化的信息,包括可替代的剪接变化、结构变化或两者。在一些情况下,蛋白质组信息可以包括肽和/或蛋白质的构象信息、翻译后修饰信息、化学修饰信息(例如,磷酸化)、辅因子(例如,盐或其他调节化学品)关联信息或基底关联信息。在一些情况下,翻译后修饰可以包括酰化、烷基化、异戊烯化、黄素化、酰胺化、胺化、脱氨基化、羧化、脱羧、亚硝基化、甲酰化、瓜氨酸化、糖基化、糖化、卤化、羟基化、磷酸化、磺酰化、谷胱甘肽化、琥珀酰化、羰基化、氨基甲酰化、氧化、氧合、还原、泛素化、苏素化、拟素化或其任何组合。在一些情况下,蛋白质组信息可以包括健康细胞或患病细胞的凋亡率或流行率。在一些情况下,蛋白质组信息可以包括细胞的状态,如健康状态或患病况态。
本公开的方法和组合物可以提供生物样本中特定蛋白质的鉴定和测量结果。这可以包括经由消化在颗粒的表面上形成的冠状物来处理蛋白质组学数据。可以鉴定和测量的蛋白质的实例包括高度丰富蛋白质、中等丰度的蛋白质和低丰度蛋白质。在一些情况下,低丰度蛋白质可以以约10ng/mL或低于约10ng/mL的浓度存在于样本中。在一些情况下,高丰度蛋白质可以以约10μg/mL或高于约10μg/mL的浓度存在于样本中。中等丰度的蛋白质可以以约10ng/mL和约10μg/mL之间的浓度存在于样本中。在一些生物样本中可能是高度丰富蛋白质的蛋白质的实例包括白蛋白、IgG和构成血浆中约95%蛋白质质量的前14种丰度蛋白质。在一些情况下,使用本文公开的颗粒、颗粒组或颗粒组合物,可以在样本中直接检测使用常规耗竭柱纯化的蛋白质。蛋白质的实例可以是在经发表的数据库中列出的任何蛋白质,如Keshishian等人(Mol Cell Proteomics.2015年9月;14(9):2375-93.doi:10.1074/mcp.M114.046813.网上公开于2015年2月27日),Farr等人(J Proteome Res.2014年1月3日;13(1):60-75.doi:10.1021/pr4010037.网上公开于2013年12月6日),或Pernemalm等人(Expert Rev Proteomics.2014年8月;11(4):431-48.doi:10.1586/14789450.2014.901157.网上公开于2014年3月24日)。
可以使用本文公开的方法和组合物测量和鉴定的蛋白质的实例可以包括白蛋白、IgG、溶菌酶、CEA、HER-2/neu、膀胱肿瘤抗原、甲状腺球蛋白、甲胎蛋白、PSA、CA125、CA19.9、CA 15.3、瘦蛋白、催乳素、骨桥蛋白、IGF-II、CD98、肌动蛋白束蛋白、sPigR、14-3-3η、肌钙蛋白I、B型利钠肽、BRCA1、c-Myc、IL-6、纤维蛋白原、EGFR、胃泌素、PH、G-CSF、结蛋白、NSE、FSH、VEGF、P21、PCNA、降钙素、PR、CA125、LH、生长抑素、S100、胰岛素、α-催乳素、ACTH、Bcl-2、ERα、Ki-67、p53、组织蛋白酶D、β连环蛋白、VWF、CD15、k-ras、半胱氨酸蛋白酶-3、EPN、CD10、FAS、BRCA2、CD30L、CD30、CGA、CRP、凝血酶原、CD44、APEX、转铁蛋白、GM-CSF、E-钙粘蛋白、IL-2、Bax、IFN-γ、β-2-MG、TNFα、c-erbB-2、胰蛋白酶、细胞周期蛋白D1、MG B、XBP-1、HG-1、YKL-40、S-γ、NESP-55、纺锤蛋白-1、联会蛋白、GADD45A、CDK-6、CCL21、BrMS1、17βHDI、PDGFRA、Pcaf、CCL5、MMP3、密封蛋白-4和密封蛋白-3。可以使用本文公开的颗粒组测量和鉴定的蛋白质的其他实例是针对感兴趣的特定疾病指征(例如,前列腺癌、肺癌或阿尔茨海默病)在开放靶标数据库中列出的任何蛋白质或蛋白质群组。
可以使用许多不同的分析技术来鉴定、测量和定量生物样本的蛋白质组数据。例如,可以使用SDS-PAGE或任何基于凝胶的分离技术来分析蛋白质组数据。也可以使用免疫测定(如ELISA)对肽和蛋白质进行鉴定、测量和定量。可替代地,可以使用质谱法、高效液相色谱法、LC-MS/MS、Edman降解、免疫亲和技术、在EP3548652、WO2019083856、WO2019133892(这些文献中的每一个都通过引用以其整体并入本文)中公开的方法和其他蛋白质分离技术来鉴定、测量和定量蛋白质组数据。
在一些情况下,测量技术鉴定蛋白质群组。被设计成检测蛋白质的测量技术也可以检测蛋白质群组。在一些情况下,蛋白质群组可以指由共享的肽序列鉴定的两种或更多种蛋白质。在一些情况下,蛋白质群组可以指通过共享的功能鉴定的两种或更多种蛋白质。在一些情况下,蛋白质群组包括给定蛋白质的蛋白形式。在一些情况下,蛋白质群组可以指通过其参与相同的生物化学途径来鉴定的两种或更多种蛋白质。在一些情况下,蛋白质群组可以指两种或更多种蛋白质,通过它们在细胞、组织或器官中的共享的定位来鉴定。在一些情况下,蛋白质群组可以指通过对本文公开的颗粒的共享亲和力鉴定的两种或更多种蛋白质。可替代地或另外,蛋白质群组可以指使用鉴定序列鉴定的一种蛋白质。例如,如果在样本中,测定两种蛋白质(蛋白质1:XYZZX和蛋白质2:XYZYZ)共有的肽序列,蛋白质群组可以是具有两个成员(蛋白质1和蛋白质2)的“XYZ蛋白质群组”。可替代地,如果肽序列是单个蛋白质(蛋白质1),则蛋白质群组可以是具有一个成员(蛋白质1)的“ZZX”蛋白质群组。每个蛋白质群组可以由多于一个的肽序列支持。根据本公开检测或鉴定的蛋白质可以指在样本中检测到的不同蛋白质(例如,使用质谱法检测到的不同的相对其他蛋白质)。因此,分析对应于颗粒组中不同颗粒类型的不同冠状物中存在的蛋白质产生了大量特征强度。
蛋白质群组可以是具有相似或不可区分的质谱指纹的一组蛋白质。在测定中鉴定的蛋白质群组的数量可能与检测到的蛋白质的数量相关。在一些情况下,蛋白质群组可以包括蛋白质同种型的集合。在一些情况下,蛋白质群组可以包括来自多个蛋白质家族的蛋白质。在一些情况下,蛋白质群组可以由来自单个蛋白质家族的蛋白质组成。在一些情况下,蛋白质群组可以包括单一类型的蛋白质。
图15图示地说明了本文公开的一些方法的优点。本公开的一些方法可以用于研究多态性、翻译后修饰、肽、蛋白质、蛋白质相互作用和/或途径。本公开的一些方法可以用于以深度分辨率(例如,多态性)和以高背景(例如,途径)研究蛋白质组学。本公开的一些方法可以是可扩展的。本公开的一些方法可能没有偏倚。
图16示意性地说明了用于本文公开的一些方法的平行且可配置的工作流程。与高度复杂和常规的实验室设置相反,本公开的一些方法可以以更简单且更有效的形式实现。本公开的一些方法可以用平行且可配置的工作流程来实现。
图17示意性地说明了实现本公开的一些方法的流水线。本公开的一些方法可以实现简化和自动化的处理,可以包括流体处理和磁捕获,和/或可以包括液体处理仪器测定实施。
肽变体
在一些情况下,可以使用测定来检测肽变体。在一些情况下,肽变体可以指从DNA中的编码区的集合表达的肽,其中DNA中的编码区的相同集合或子集可以表达多个肽,每个肽包括一级结构。在一些情况下,DNA中给定的编码区的集合可以通过例如组成性剪接、外显子跳跃、内含子保留、相互排除外显子、替代性剪接、替代性5’剪接、替代性3’剪接、可变启动子使用、转录后修饰或其任何组合来表达多种肽。
在一些情况下,可以使用蛋白质组测定来检测肽变体,其中蛋白质组测定检测可以被鉴定为变体序列的肽序列。
在一些情况下,可以使用基因型测定来检测肽变体,其中基因型测定检测mRNA,该mRNA包括可以被鉴定为编码肽变体的变体序列的序列。
动态范围
本文所述的生物分子冠状物分析方法可以包括在宽的动态范围内测定本公开的样本中的生物分子。在样本中测定的生物分子的动态范围可以是在测定(例如,质谱法、色谱法、凝胶电泳、光谱学或免疫测定)中解析的(例如,对于其存在高于定义的信噪比阈值的信号)或鉴定的生物分子的浓度范围。例如,能够在宽的动态范围内检测蛋白质的测定可能能够检测非常低丰度的蛋白质到非常高丰度的蛋白质。测定的动态范围可以直接与作为生物分子丰度的函数的测定信号强度的斜率相关。例如,具有低动态范围的测定可以具有作为生物分子丰度的函数的测定信号强度的低(但正)斜率,例如,对于高丰度生物分子检测到的信号的比率到对于低丰度生物分子检测到的信号的比率对于具有低动态范围的测定可以低于具有高动态范围的测定。在特定情况下,动态范围可以指样本或测定方法中蛋白质的动态范围。
本文所述的生物分子冠状物分析方法可以压缩测定的动态范围。如果作为生物分子丰度的函数的测定信号强度的斜率低于另一测定的斜率,则该测定的动态范围可相对于另一测定被压缩。例如,与直接在样本上使用单独的质谱法测定的血浆样本相比或者与数据库(例如,在Keshishian等人,Mol.Cell Proteomics 14,2375–2393(2015)中提供的数据库,在本文中也被称为“Carr数据库”)中提供的血浆蛋白质的丰度值相比,使用生物分子冠状物分析和质谱法测定的血浆样本可以具有压缩的动态范围。与使用单独的质谱法相比,压缩的动态范围可以使用生物分子冠状物分析和质谱法来实现生物样本中更多的低丰度生物分子的检测。
蛋白质组分析测定的动态范围可以是由最高丰度蛋白质(例如,丰度最高的10%蛋白质)产生的信号与由最低丰度蛋白质(例如,丰度最低的10%蛋白质)产生的信号的比率。压缩蛋白质组分析的动态范围可以包括相对于第二蛋白质组分析测定,降低在第一蛋白质组分析测定中由最高丰度蛋白质产生的信号与由最低丰度蛋白质产生的信号的比率。相对于总蛋白质分析方法(例如,质谱法、凝胶电泳或液相色谱法)的动态范围,本文公开的蛋白质冠状物分析测定可以压缩动态范围。
本文提供了若干种用于压缩生物分子分析测定的动态范围的方法,以便于检测相对于高丰度生物分子的低丰度生物分子。例如,本公开的颗粒类型可以用于连续地询问样本。在样本中温育颗粒类型时,在颗粒类型的表面上形成生物分子冠状物。如果在不使用颗粒类型的情况下直接在样本中检测生物分子,例如通过样本的直接质谱分析,与如果生物分子被引导到颗粒类型的表面上相比,动态范围可以跨越更宽的浓度范围,或者更多的数量级。因此,使用本文公开的颗粒类型可以用于压缩样本中生物分子的动态范围。不受理论的限制,由于在颗粒类型的生物分子冠状物中更多地捕获较高亲和力、较低丰度的生物分子并且在颗粒类型的生物分子冠状物中较少地捕获较低亲和力、较高丰度的生物分子,因此可以观察到这种效果。
蛋白质组分析测定的动态范围可以是由蛋白质组分析测定测量的作为样本中蛋白质总丰度的函数的蛋白质信号图的斜率。压缩动态范围可以包括相对于由第二蛋白质组分析测定测量的作为样本中蛋白质总丰度的函数的蛋白质信号图的斜率,降低由蛋白质组分析测定测量的作为样本中蛋白质总丰度的函数的蛋白质信号图的斜率。相对于总蛋白质分析方法(例如,质谱法、凝胶电泳或液相色谱法)的动态范围,本文公开的蛋白质冠状物分析测定可以压缩动态范围。
可以通过将蛋白质组分析与核酸分析结合来增强蛋白质组分析。这可以促进蛋白质和肽的准确鉴定,否则在缺乏这种结合方法的情况下,这些蛋白质和肽可能无法鉴定或被分配不准确的鉴定。核酸分析可以增加来自蛋白质组数据(例如,肽片段的质谱数据)的可鉴定肽的数量。例如,基因组或转录组数据可以实现其他不可分配的质谱特征的鉴定。对来自对象的核酸进行分析也可以从蛋白质群组中鉴定子群体或单独的蛋白质,并且还可以确定来自蛋白质群组的蛋白质的丰度或相对丰度(例如,通过确定蛋白质群组由以99:1的丰度比存在的两种同种型组成)。在一些情况下,来自蛋白质群组的蛋白质的相对丰度的确定可以鉴定丰度或浓度低于蛋白质分析方法的检测极限的蛋白质。因此,将蛋白质和核酸分析与蛋白质分析相结合可以将蛋白质分析的灵敏度提高1个数量级、2个数量级、3个数量级、4个数量级或更多。例如,与包括单独的蛋白质分析的方法相比,包括核酸和蛋白质分析的方法可以在更宽的浓度范围内鉴定蛋白质或蛋白质群组。
在图2B中提供了此类确定的实例,其总结了相对于主要前激肽释放酶形式频率为0.01%的前激肽释放酶的次要等位基因的鉴定。变体(例如,等位基因或剪接)频率的此类鉴定可以用于细化蛋白质丰度数据(例如,通过本公开的蛋白质分析方法获得),并将单个蛋白质群组丰度分成多个蛋白质或蛋白质子组丰度。在图2B的情况下,质谱确定的前激肽释放酶丰度可以分为以总丰度的99.99%存在的主要形式和以总丰度的0.01%存在的次要形式。
核酸分析
本公开提供了用于分析(例如,检测或测序)核酸的各种组合物和方法。在一些情况下,可以使用本公开的一些组合物和方法获得基因型(或基因组)信息。在一些情况下,基因型信息可以指关于包含核苷酸和/或核酸组分的物质的信息。在一些情况下,基因型信息可以包括表观遗传信息。在一些情况下,表观遗传信息可以包括组蛋白修饰、DNA甲基化、基因组中不同区域的可及性、其动力学变化或其任何组合。在一些情况下,基因型信息可以包括关于核酸的一级结构信息、二级结构信息、三级结构信息或四级信息。在一些情况下,基因型信息可以包括关于核酸-配体相互作用的信息,其中配体可以包括可以在活生物体中发现的各种生物分子和物质中的任何一种,如核苷酸、核酸、氨基酸、肽、蛋白质、单糖、多糖、脂质、磷脂、激素或其任何组合。在一些情况下,基因型信息可以包括健康细胞或患病细胞的凋亡的比率或流行率。在一些情况下,基因型信息可以包括细胞的状态,如健康状态或患病状态。在一些情况下,基因型信息可以包括核酸分子的化学修饰信息。在一些情况下,化学修饰可以包括甲基化、去甲基化、胺化、脱氨基化、乙酰化、氧化、氧合、还原或其任何组合。在一些情况下,基因型信息可以包括关于生物样本来自哪种类型细胞的信息。在一些情况下,基因型信息可以包括关于核酸的非翻译区的信息。
在一些情况下,基因型信息可以包括关于单细胞、组织、器官、组织和/或器官系统(如心血管系统、呼吸系统、消化系统或神经系统)或整个多细胞生物体的信息。在一些情况下,基因型信息可以包括关于个体(例如,个体人类或个体细菌)或个体群体(例如,被诊断患有癌症的人类或细菌菌落)的信息。基因型信息可以包括来自各种生命形式的信息,包括来自古细菌、细菌、真核生物、原生动物、色藻界、植物界、真菌或动物界的生命形式。在一些情况下,基因型信息可以包括来自病毒的信息。
在一些情况下,基因型信息可以包括与生命代码中的外显子和内含子相关的信息。在一些情况下,基因型信息可以包括关于核酸的一级结构中的变异或突变的信息,包括碱基取代、缺失、插入或其任何组合。在一些情况下,基因型信息可以包括关于核酸中包括非标准核碱基的信息。在一些情况下,基因型信息可以包括关于表观遗传学中的变异或突变的信息。
在一些情况下,基因型信息可以包括关于一种或多种核酸编码的肽和/或蛋白质的一级结构的变化、二级结构的变化、三级结构的变化或四级结构的变化的信息。
此类组合物和方法可以应用于靶向多种类型的生物分子的测定。例如,测定可以分析来自单个样本的蛋白质和核酸。
通过核、细胞质和无细胞核酸的可检测变化证明了宽范围的疾病和疾病前状态。然而,许多核酸疾病标志物可能不足以作为特定的生物学状态的指标,因此其本身不能用于准确的诊断。这部分地可能是由于以下事实:许多遗传标志物与多种疾病相关,如高水平的编码无细胞DNA(cfDNA)的胰岛素就是这种情况,这可能是由包括糖尿病和多囊卵巢综合征(PCOS)在内的多种疾病引起的。此外,与疾病状态相关联的基因标志物的存在并不总是与疾病本身相关。例如,在癌症检测领域,可以发现非致瘤细胞比来自同一对象的相应癌细胞携带更多的癌基因。因此,尽管核酸生物标志物可以提供关于对象的全方位信息,但是该信息可能难以用于准确的诊断。
本公开提供了能够从核酸数据和利用其他类型的生物分子数据(如蛋白质组数据)进行精确分析技术和诊断的方法。通过将多种形式的生物分子分析与核酸分析相结合,与特定疾病状态弱相关或未知与特定疾病状态相关的个体生物标志物(例如,基因标志物)可以用于高度准确的诊断。此外,通过测量和分析大量生物标志物,可以将源自对象间差异和外来因素(例如,由于压力引起的基因表达的短期变化)的噪声与疾病或病况的真阳性结果区分开。
在一些测定中,不同类型的生物分子可以在单独的样本分区中富集或分析。例如,测定可以包括在第一样本分区中分析核酸,在第二样本分区中分析蛋白质,并且任选地在第三样本分区中分析脂质和代谢物。在一些测定中,多种类型的生物分子可以在单个样本分区内富集或分析(例如,核酸和肽可以从单个体积的样本中富集)。
用于测序的各种试剂和测序核酸的方法与本文公开的平行测定蛋白质(例如,使用冠状物分析)和核酸(例如,使用测序方法)的组合物和方法一致。本文公开的方法可以包括从样本中富集一种或多种核酸分子。这可以包括溶液中的富集、传感器元件(例如,颗粒)上的富集、基底(例如,Eppendorf管的表面)上的富集、或核酸的选择性去除(例如,通过序列特异性亲和沉淀)。富集可以包括扩增,包括两种或更多种不同靶核酸的差异扩增。差异扩增可以基于序列、CG含量或转录后修饰,如甲基化状态。富集也可以包括杂交方法,如下拉方法。例如,基底分区可以包括能够与特定序列的核酸杂交的固定化核酸,从而能够从复杂的生物溶液中分离特定的核酸。杂交可以靶向基因、外显子、内含子、调控区、剪接位点、重组基因以及其他核酸靶标。杂交可以利用被设计成靶向多个不同序列或平铺单一序列的核酸探针池。
富集可以包括杂交反应,并且可以从生物样本中产生核酸分子的子集。杂交可以在溶液中、在基底表面上(例如,在微孔板中的孔壁上)、在传感器元件上或其任何组合上进行。杂交方法可能对单核苷酸多态性敏感。例如,杂交方法可以包括分子倒置探针。
富集也可以包括扩增。合适的扩增方法包括聚合酶链式反应(PCR)、固相PCR、RT-PCR、qPCR、多重PCR、触地PCR、纳米PCR、巢式PCR、热启动PCR、解旋酶依赖性扩增、环介导等温扩增(LAMP)、自维持序列复制、基于核酸序列的扩增、链置换扩增、滚环扩增、连接酶链式反应和任何其他合适的扩增技术。
测序可以靶向基因组的特定序列或区域。测序可以靶向一种类型的序列,如外显子。在一些情况下,测序包括外显子组测序。在一些情况下,测序包括全外显子组测序。测序可以靶向染色质化的核酸或非染色质化的核酸。测序可以是序列-非特异性的(例如,提供读数而不管靶序列)。测序可以靶向基因组的聚合酶可及区域。测序可以靶向位于细胞的一部分(如线粒体或细胞质)中的核酸。测序可以靶向位于细胞、组织或器官中的核酸。测序可以靶向RNA、DNA、任何其他核酸或其任何组合。
“核酸”可以指单链、双链或多链形式的任何长度的核苷酸的聚合物形式。核酸可以包括核糖核苷酸、脱氧核糖核苷酸及其天然和非天然类似物的任何组合,包括5-溴尿嘧啶、肽核酸、锁定核苷酸、乙二醇核苷酸、苏糖核苷酸、双脱氧核苷酸、3’-脱氧核糖核苷酸、双脱氧核糖核苷酸、7-脱氮-GTP、荧光团结合的核苷酸、含硫醇的核苷酸、生物素连接的核苷酸、甲基-7-鸟苷、甲基化核苷酸、肌苷、硫尿苷、假尿苷、二氢尿苷、辫苷(queuosine)和怀俄苷(wyosine)。核酸可以包括基因、基因的一部分、外显子、内含子、信使RNA(mRNA)、转移RNA(tRNA)、核糖体RNA(rRNA)、短干扰RNA(siRNA)、短发夹RNA(shRNA)、微小RNA(miRNA)、核酶、cDNA、重组核酸、分支核酸、质粒、无细胞DNA(cfDNA)、无细胞RNA(cfRNA)、基因组DNA、线粒体DNA(mtDNA)、循环肿瘤DNA(ctDNA)、长非编码RNA、端粒酶RNA、Piwi相互作用RNA、小核RNA(snRNA)、小干扰RNA、YRNA、环状RNA、小核仁RNA或假基因RNA。核酸可以包括DNA或RNA分子。核酸也可以具有确定的三维结构。在一些情况下,核酸可以包括非标准核碱基或核苷酸,如次黄嘌呤、黄嘌呤、7-甲基鸟嘌呤、5,6-二氢尿嘧啶、5-甲基胞嘧啶或其任何组合。核酸也可以包括非核酸分子。
核酸可以来自各种来源。在一些情况下,核酸可以来自外泌体、凋亡体、肿瘤细胞、健康细胞、病毒体、胞外膜囊泡、嗜中性粒细胞胞外陷阱(NET)或其任何组合。
核酸可以包括各种长度。在一些情况下,核酸可以包括至少约1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900、1000、2000、3000、4000、5000、6000、7000、8000、9000或10000个核苷酸。在一些情况下,核酸可以包括至多约1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900、1000、2000、3000、4000、5000、6000、7000、8000、9000或10000个核苷酸。
各种试剂可以用于测序。在一些情况下,试剂可以包括引物、寡核苷酸、开关寡核苷酸、衔接子、扩增衔接子、聚合酶、dNTP、辅因子、缓冲液、酶、离子辅因子、连接酶、逆转录酶、限制性酶、核酸内切酶、转座酶、蛋白酶、蛋白酶K、DNase、RNase、裂解剂、溶菌酶、消色肽酶(achromopeptidase)、溶葡萄球菌酶(lysostaphin)、拉布立酶(labiase)、立枯丝核菌裂解酶(kitalase)、溶细胞酶、抑制剂、灭活剂、螯合剂、EDTA、群集剂、还原剂、DTT、表面活性剂、TritonX-IOO、吐温20、十二烷基硫酸钠、十二烷基肌氨酸钠(sarcosyl)或其任何组合。
可以使用多种用于测序核酸的方法。在一些情况下,核酸测序方法可以包括高通量测序、下一代测序、流式测序、大规模平行测序、鸟枪法测序、单分子实时测序、离子半导体测序、电泳测序、焦磷酸测序、合成测序、组合探针锚合成测序、连接测序、纳米孔测序、GenapSys测序、链终止测序、polony测序、454焦磷酸测序、可逆终止化学测序、heliscope单分子测序、隧道电流DNA测序、杂交测序、克隆单分子阵列测序、MS测序、DNA测序、RNA测序、ATAC测序、甲基测序、ChIP测序或其任何组合。
用于测序的试剂和用于测序核酸的方法包括WO2012050920、WO2020023744、WO2019108851、WO2019084158、WO2020023744、US20190177803和US20190316185中描述的那些,所有这些文献通过引用以其整体并入本文。
如本文所公开的,核酸可以通过标准分子生物学技术进行加工,用于下游应用。核酸可以由从本公开的样本中分离的核酸制备。核酸可以随后连接到衔接子多核苷酸序列上,衔接子多核苷酸序列可以包括双链核酸。核酸可以在连接到衔接子多核苷酸序列之前进行末端修复。衔接子多核苷酸可以连接到核苷酸序列的一端或两端。相同或不同的衔接子可以结合到片段的每一端,从而产生“衔接子-核酸-衔接子”构建体。多个相同或不同的衔接子可以结合到片段的每一端。在一些情况下,当衔接子连接到核酸的两端时,不同的衔接子可以连接到核酸的每一端。将核酸衔接子连接到感兴趣的核酸上的各种方法与本文公开的组合物和方法一致,包括使用标准分子克隆技术的方法(Sambrook和Russell,Molecular Cloning,A Laboratory Manual,第3版,Cold Spring Harbor LaboratoryPress(2001),其通过引用并入本文)。
与测序引物互补的寡核苷酸标签可以并入有连接至靶核酸的衔接子。为了分析多个样本,与单独的测序引物互补的不同寡核苷酸标签可以并入有连接至靶核酸的衔接子。
寡核苷酸索引标签也可以并入有连接至靶核酸的衔接子。在其中缺失产物与固定在结构(例如,传感器元件,如颗粒)上的核酸杂交之前从多个多核苷酸产生缺失产物的情况下,对应于不同的感兴趣的核酸的多核苷酸可以首先附着到不同的寡核苷酸标签上,使得随后产生的对应于不同的感兴趣的核酸的缺失产物可以被分组或区分。因此,来自相同的感兴趣的核酸的缺失产物可以具有相同的寡核苷酸索引标签,使得索引标签鉴定来自相同的感兴趣的核酸的测序读数。同样,来自不同的感兴趣的核酸的缺失产物将具有不同的寡核苷酸索引标签,以允许它们在如传感器元件上被分组或区分。寡核苷酸索引标签的长度范围可以为约5、10、15、20、25、30、35、40、45、50、75到100个核苷酸或碱基对,或者其间的任何长度。
寡核苷酸索引标签可以单独添加,或与引物、引物结合位点或其他组分一起添加。相反,可以进行成对端的读取,其中来自第一端的读数可以包括感兴趣的序列的一部分,并且来自另一(第二)端的读数可以用作标签来鉴定第一读数所源自的片段。
测序读取可以从经修饰的核苷酸并入到延伸的捕获探针的点开始。测序引物可以与延伸的捕获探针或其互补序列杂交,所述探针或其互补序列可以在启动序列读取之前被任选地扩增,并在天然核苷酸的存在下延伸。测序引物的延伸可以在并入到模板中的第一经修饰的核苷酸的并入点处停顿,并且可以使用能够并入经修饰的核苷酸的聚合酶(例如,TiTaq聚合酶)在停顿点处并入互补的经修饰的核苷酸。在经修饰的核苷酸并入的停顿或点之后,可以在第一碱基处开始测序读取。在合成测序方法中,测序读取可以在经修饰的核苷酸并入的停顿或点之后的第一碱基处开始。
本公开的方面包括与核酸(多核苷酸)测序相关的方法和组合物。本公开的方法提供了对对象或样本中核酸的鉴定和定量。在本文所述的一些方法和组合物中,可以使用多种方法和装置来确定靶核酸或其片段的一部分的核苷酸序列。测序方法的实例包括电泳、合成测序、连接测序、杂交测序、单分子测序和实时测序方法。确定靶核酸或其片段的核苷酸序列的过程可以是自动化过程。在某些扩增反应中,捕获探针可以充当引物,允许使用来自核酸样本的多核苷酸作为模板引发核苷酸合成反应。以这种方式,可以获得关于提供给阵列的多核苷酸的序列的信息。如果进一步向阵列提供与结合至捕获探针的多核苷酸杂交的引物和测序试剂,则与阵列上的捕获探针杂交的多核苷酸可以用作测序模板。在本领域中先前已经描述了使用阵列测序的方法。
核酸分析方法可以在核酸簇上产生成对的末端读数。在WO/07010252和WO/07091077(其每一个通过引用以其整体并入本文)中描述了用于获得成对的末端读数的方法。在此类方法中,核酸簇可以固定在传感器元件上,如表面上。成对的末端测序有助于在一次成对末端读取中读取每个簇的正向模板链和反向模板链两者。通常,模板簇可以通过桥扩增在基底(例如,流动池)的表面上扩增,并通过成对引物顺序测序。在模板链的扩增后,可以产生桥接的双链结构。这可以被处理以从表面释放每个双链体的一条链的一部分。单链核酸可以用于测序、引物杂交和引物延伸循环。在第一轮测序后,第一单链模板的末端可以与最初的簇扩增程序中剩余的固定的引物杂交。可以使用杂交的第一单链作为模板来延伸固定的引物,以重新合成原始的双链结构。可以处理双链结构以除去至少一部分第一模板链,以留下以单链形式固定的重新合成的链。可以对重新合成的链进行测序,以确定第二读数,其位置来源于从片段化过程中获得的原始模板片段的相对端。
核酸测序可以是单分子测序或合成测序。测序可以是大规模平行阵列测序(例如,IlluminaTM测序),其可以使用固定在支持物(如流动池)上的模板核酸分子来进行。高通量测序方法可以同时(或基本上同时)对至少约10,000、100,000、1百万、1千万、1亿、10亿或更多个多核苷酸分子进行测序。测序方法可以包括但不限于:焦磷酸测序、合成测序、单分子测序、纳米孔测序、半导体测序、连接测序、杂交测序、数字基因表达(Helicos)、大规模平行测序,例如Helicos、克隆单分子阵列(Solexa/Illumina)、使用PacBio、SOLiD、Ion Torrent或纳米孔平台的测序。测序可以包括第一代测序方法,如Maxam-Gilbert或桑格测序,或高通量测序(例如,下一代测序或NGS)方法。
本文公开的测序方法可以涉及对全基因组或其部分进行测序。测序可以包括对整个基因组、整个外显子组、其部分(例如,一组基因,包括其潜在的编码区和非编码区)进行测序。测序可以包括对转录组或其部分进行测序。测序可以包括对外显子组或其部分进行测序。测序覆盖范围可以基于分析或实验设置或期望的测序足迹进行优化。
本公开的测序方法能够检测种系易感性基因座、体细胞单核苷酸多态性(SNP)、小插入和缺失(indel)突变、拷贝数变异(CNV)和结构变体(SV)。
本公开的测序方法可以涉及RNA的序列分析。RNA序列或表达水平可以通过使用逆转录反应从RNA产生互补DNA(cDNA)分子用于测序,或通过使用逆转录聚合酶链式反应用于表达水平的定量来分析。本公开的测序方法可以检测RNA结构变体和同种型,如剪接变体和结构变体。本公开的测序方法可以定量RNA序列或结构变体。
此外,本公开的测序方法可以定量核酸,从而允许可以鉴定和定量单独的样本内的序列变异(例如,第一百分比的基因未突变,并且样本中存在的第二百分比的基因含有插入和缺失)。
核酸分析方法可以包括从生物样本中收集的核酸的物理分析。一种方法可以基于核酸的质量、转录后修饰状态(例如,加帽)、组蛋白化、环化(例如,以检测染色体外环状DNA元件)或解链温度来区分核酸。例如,测定可以包括对从生物样本中收集的DNA进行限制性片段长度多态性(RFLP)或电泳分析。在一些情况下,转录后修饰可以包括5’加帽、3’切割、3’聚腺苷酸化、剪接或其任何组合。
核酸分析也可以包括序列特异性询问。用于序列特异性询问的测定可以靶向特定序列,以确定其在生物样本中的存在、不存在或相对丰度。例如,测定可以包括DNA印迹、qPCR、荧光原位杂交(FISH)、阵列比较基因组杂交(阵列-CGH)、定量荧光PCR(QF-PCR)、纳米孔测序、杂交测序、合成测序、连接测序或通过核酸结合部分(例如,单链核苷酸或核酸结合蛋白)的捕获,以确定在从对象中收集的样本中感兴趣的基因(例如,癌基因)的存在。测定也可以将序列特异性收集与测序分析相结合。例如,测定可以包括在包括特定靶序列的核酸中产生特定的粘端基序,将衔接子连接到具有特定粘端基序的核酸上,并对衔接子连接的核酸进行测序,以确定在感兴趣的基因中突变的存在或普遍程度。
基因组变体
在一些情况下,可以使用测定来检测基因组变体。在一些情况下,基因组变体可以指来源于样本中DNA地址的核酸序列,其包括与来源于参考样本中相同DNA地址的核酸序列不同的序列。在一些情况下,基因组变体可以包括突变,如插入突变、缺失突变、取代突变、拷贝数变异、颠换、易位、倒位、非整倍体、部分非整倍体、多倍体、染色体不稳定性、染色体结构改变、基因融合、染色体融合、基因截短、基因扩增、基因复制、染色体损伤、DNA损伤、核酸化学修饰的异常变化、表观遗传模式的异常变化、核酸甲基化感染的异常变化、染色体损伤、DNA损伤或其任何组合。在一些情况下,基因组变体的集合可以包括单核苷酸多态性(SNP)。
在一些情况下,可以从DNA或其拷贝,如RNA,或如从DNA或RNA扩增的核酸文库中检测基因组变体。
在一些情况下,可以使用蛋白质组测定来检测基因组变体,其中蛋白质组测定检测可以被鉴定为在其一级序列中具有突变的肽序列。
双重蛋白质-核酸测定
本公开提供了用于从样本中平行鉴定蛋白质和核酸的方法。将这两种形式的分析结合起来可以克服每种类型固有的局限性。特别是,单独进行蛋白质或核酸分析可以产生不确定的鉴定,如不确定的基因组拷贝数或不确定的蛋白质同种型分配。在许多情况下,将核酸和蛋白质分析恰当地结合起来可以克服这些不确定性,并且可以将诊断洞察力的水平提高到超过蛋白质和核酸分析将单独提供的总和。
一些方法可以包括在传感器元件(例如,颗粒)上平行收集蛋白质和核酸。例如,一种方法可以包括在传感器元件上同时吸附蛋白质和核酸,随后通过质谱法进行核酸测序和蛋白质分析。一种方法还可以包括将蛋白质和核酸同时吸附在传感器元件上,并从传感器元件收集蛋白质和核酸,用于平行的蛋白质分析(例如,质谱法)和核酸测序。此类方法可以包括从核酸中分离蛋白质,如通过色谱法、从传感器元件中分离洗脱蛋白质和核酸、差异沉淀、相分离或亲和捕获。可替代地,一种方法可以包括将蛋白质吸附在传感器元件上,然后从样本中收集核酸。此外,一种方法可以包括将样本分成单独的部分用于蛋白质(例如,生物分子冠状物)和核酸分析。
核酸分析可以指导或提供蛋白质(例如,生物分子冠状物)分析的信息。核酸分析的结果可能有助于蛋白质鉴定。在一些情况下,蛋白质分析可以确定蛋白质是否存在,并且核酸分析可以确定蛋白质的确切序列。当质谱数据仅鉴定蛋白质或肽序列的一部分时,这可能发生。在此类情况下,核酸数据(如样本中特定RNA同种型的鉴定)可以用于辨别蛋白质或肽的特性或全序列。作为实例,其中蛋白质结构域转座(例如,导致组成型活性和可能增加的癌症风险的HRAS蛋白激酶结构域转座)不改变肽片段消化模式的情况可能难以通过单独的蛋白质分析来确定,但可以通过生物分子冠状物分析和基因组分析的组合来阐明,其中生物分子冠状物分析可以鉴定蛋白质的存在,并且基因组分析可以确定其转座状态。
核酸(例如,转录组)分析可以用于确定在样本中存在哪些蛋白质剪接变体。RNA分析可以进一步用于确定蛋白质剪接变体的相对丰度。蛋白质分析可以用于确定样本中存在的RNA变体(例如,mRNA剪接变体)。
核酸分析也可以从实验鉴定的蛋白质群组中区分单独的蛋白质。生物分子冠状物分析可以鉴定包括多种蛋白质的蛋白质群组。在此类情况下,核酸信息如基因组序列、RNA序列(例如,特定的RNA同种型或剪接变体)、或表达调节核酸修饰(例如,甲基化)可以用于辨别蛋白质群组中存在的蛋白质或蛋白质的集合。例如,生物分子冠状物分析可以鉴定由七种相关蛋白质组成的蛋白质群组(例如,在哺乳动物细胞中发现的七种确认的14-3-3蛋白质同种型),而随后的核酸分析可以确定编码七种相关蛋白质中两种的RNA存在于样本中,从而从样本中存在的蛋白质群组中确定蛋白质。
以这种方式,核酸分析可以增加通过蛋白质测定鉴定的蛋白质或蛋白质群组的数量。核酸分析可以确定存在于经鉴定的蛋白质群组中的特定蛋白质,或者可以从蛋白质群组中鉴定蛋白质子组。因此,相对于仅包括蛋白质分析的测定,将核酸分析与蛋白质分析相结合可以使鉴定的蛋白质或蛋白质群组的数量增加至少5%、至少10%、至少15%、至少20%、至少25%、至少30%、至少40%、至少50%、至少60%、至少80%或至少100%。
核酸分析也可以指导蛋白质(例如,蛋白质冠状物)和生物分子冠状物分析。在一些情况下,质谱分析(以及由此的生物分子冠状物方法)包括数据依赖性采集,其中预先选择多个离子(例如,特定的m/z比)用于串联质谱分析。可以基于核酸分析结果选择数据依赖性采集的一个离子或多个离子。例如,核酸分析可以鉴定具有预测的肽片段的两种蛋白质变体,该预测的肽片段共享质量但在序列上不同,并且向质谱仪器提供指令以将肽片段的质量包括在数据依赖性采集中。质谱分析也可以包括非数据依赖性采集,其中预先选择质量/电荷范围用于串联质谱分析。在此类情况下,核酸分析可以决定或部分地决定所分析的质量/电荷范围。核酸分析也可以指导电离方法。例如,来自核酸分析的结果可以决定基质辅助激光解吸/电离(MALDI)质谱实验的激光功率,从而影响生成的用于分析的生物分子片段。
对象特异性文库
核酸和蛋白质分析可以单独使用或组合使用,以开发对象特异性(例如,患者特异性)文库,其加快和扩展质谱分析的深度和准确度。一些质谱分析受到蛋白质分配的模糊程度的限制。在一些情况下,蛋白质的序列的仅一部分可以被质谱信号覆盖,从而使测定对剩余未测序部分的变化是盲目的。此外,质谱分析可能无法鉴定特定的转座(例如,结构域转座)和剪接变异体。纠正此类缺点可能是昂贵且耗时的。例如,扩展质谱测定以包括多种形式的消化可以增加序列覆盖范围,代价是增加用户输入。
生成对象特异性文库可以允许更快且更深入地分析来自对象的质谱数据。对象特异性文库可以包括存在于对象中的蛋白质。对象特异性文库可以包括存在于对象中的核酸(例如,基因)。对象特异性文库可以用于生成包括来自对象的预测的实验信号(例如,对应于肽片段或DNA电泳带的质谱信号)的特异性谱文库。可以利用蛋白质组学数据、核酸数据、代谢组学数据(例如,测量乳糖水解以确定乳糖酶的存在)、脂质组学数据或其任何组合来生成对象特异性文库。
对象特异性文库可以提高蛋白质或核酸鉴定的精确度。在一些情况下,可能的蛋白质鉴定可能限于在对象的基因组中鉴定的潜在蛋白质序列。例如,基于来自对象的核酸数据,涵盖8个等位变体的蛋白质群组可以被缩窄至特定形式。
图5示出了用于生成和利用对象特异性文库的方法。该方法示出了结合的核酸和蛋白质分析可以如何提高诊断深度和精度。可以从核酸数据501构建对象特异性文库。可以处理数据以鉴定序列变体502(例如,至少基于与参考序列的比对),得到对象特异性核酸变体503的文库。核酸数据可以来自包括全基因组测序或使用基因组或转录组的特定或富集部分的靶向测序。此外,筛选可以包括外显子组测序,从而鉴定来自样本的剪接变体。
核酸序列(例如,基因变体)可以在计算机上翻译504,以产生对象特异性蛋白质序列数据库505。数据库可以包括蛋白质序列,其可以帮助从样本上的质谱数据中鉴定蛋白质或蛋白质群组。在许多情况下,数据库可以用于确定在样本中存在来自蛋白质群组中的哪些蛋白质。数据库还可以包括蛋白质序列的丰度或相对丰度。例如,数据库可以包括样本中蛋白质不同同种型的相对丰度,或一个基因或多个基因之间的突变率。
对象特异性蛋白质序列数据库505可以用于通过计算生成506对象特异性光谱库507,其可以包括部分地基于在504中生成的数据的来自对象的样本的预期的或推定的质谱信号。质谱特征的计算预测可以考虑实验变量,如样本纯化和消化方法。对象特异性光谱库可以包括预期的串联质谱特征,以及质谱特征的预测的相对强度。对象特异性光谱库也可以包括经验衍生的质谱特征。例如,可以从数据依赖性采集质谱实验509中鉴定508肽变体。
对象特异性光谱库507可以用于对从来自对象的样本中收集的质谱数据(例如,非数据依赖性采集质谱数据510)进行去卷积,从而用于鉴定样本中的特定基因组变体512。一些质谱实验的缺点是仅可以获得目标蛋白质的部分的信号,因此质谱分析对蛋白质序列的未解析部分中的序列变异是盲目的。如本文所述,对象特异性光谱库507可以通过将质谱特征与已知蛋白质或蛋白质变体相关联来克服这种限制(当存在时),在一些情况下,允许将质谱数据用于鉴定部分或完整的蛋白质序列511。此外,对象特异性光谱库507可以帮助从质谱数据中量化(例如,确定对象样本中的丰度)蛋白质。这部分地可以包括在样本中鉴定的多种蛋白质之间分配共同的质谱信号(例如,多种蛋白质共有的m/z)。
对象特异性文库的用途在于,它们可以区分并能够从难以仅通过蛋白质分析区分的群组(例如,蛋白质群组)中鉴定蛋白质。在一些情况下,对象特异性文库还可以实现蛋白质或蛋白质的集合的相对或绝对定量(例如,生物样本中的浓度)。对象特异性文库还可以确定突变(如点突变或转座)的存在,这些突变可能无法通过单独的蛋白质分析(例如,质谱法)检测到。
杂合对可能特别难以通过单独的质谱分析来检测。在一些情况下,杂合对的不同点或区域在蛋白质分析期间可能未检测到。例如,质谱分析可能不会产生覆盖在由多个等位基因产生的蛋白质之间存在差异的一个或多个区域的信号。配对核酸分析可以确定对象对特定基因是纯合的还是杂合的,并且可以进一步确定存在的一个或多个等位基因。
在图6中提供了此类方法的实例。对对象的基因组进行测序601可以揭示特定基因的纯合性或杂合性602。测序可以靶向特定基因,可以覆盖对象的基因组的一部分或多部分,或者可以覆盖对象的基因组的全部。为对象获得的核酸序列可以被计算机翻译,以构建对象特异性蛋白质序列数据库603,其含有对象中存在的预测的蛋白质序列。可以针对单个基因预测多个蛋白质序列,如在杂合性或选择性剪接的情况下。蛋白质序列可以用于从对象样本生成预测的质谱信号604。这可以简化对来自对象的蛋白质质谱数据的分析,并且也增强其特异性和准确性。例如,在质谱信号的集合从样本中鉴定蛋白质群组时,串联核酸序列和质谱信号可以鉴定样本中存在的特定蛋白质或蛋白质的集合,如由基因的两个等位基因产生的一对蛋白质。
此外,蛋白质数据可以用于确定对象中的表达水平。虽然核酸分析可以鉴定对象中存在的多种基因,但是对来自对象的样本的蛋白质分析可以确定哪些基因被表达和翻译。这一概念在图7中示出,该图示出了质谱数据701,其确定来自杂合基因对的一个等位基因在特定对象中表达。
疾病检测
本文公开的组合物和方法可以用于鉴定特定生物样本中的各种生物学状态。例如,生物学状态可以指特定蛋白质或蛋白质的集合的升高的水平或低水平。在其他实例中,生物学状态可以指疾病,如癌症。在一些情况下,生物学状态可以是健康状态。在一些情况下,生物学状态的鉴定可以包括确定生物样本达到某一状态的概率。一种或多种颗粒类型可以与样本(例如,CSF)一起温育,允许形成蛋白质冠状物。然后可以通过凝胶电泳或质谱法来分析蛋白质冠状物,以便鉴定蛋白质或蛋白质群组的模式。蛋白质冠状物的分析(例如,通过质谱法或凝胶电泳)可以被称为冠状物分析。蛋白质或蛋白质群组的模式可以与在对照样本上进行的相同方法进行比较。通过比较蛋白质或蛋白质群组的模式,可以确定第一样本包括对应于一些生物学状态(例如,脑癌)的标志物的升高的水平。因此,该颗粒及其使用方法可以用于诊断特定的疾病状态。
本文所述的方法可以用于生成与特定生物学(例如,疾病)状态一致的生物分子指纹(例如,样本中50种蛋白质和10种核酸序列的相对丰度)。生物学状态可以是疾病、病症或组织异常。疾病状态可以是早期疾病状态、中期疾病状态或晚期疾病状态。
在一些情况下,生物分子指纹可以用于确定对象的疾病状态,诊断或预测对象中的疾病,或鉴定与疾病状态或疾病或病症相关联的生物标志物的模式。例如,对象中的生物分子指纹随时间(数天、数月、数年)的变化允许能够追踪对象中的疾病或病症(例如,疾病状态),这可以广泛适用于确定可能与疾病或任何其他疾病状态的早期阶段相关联的生物分子指纹。如本文所公开的,早期检测疾病(例如,癌症)的能力,甚至在其完全发展或转移之前,允许这些患者的阳性结果的显著增加,并且能够增加预期寿命并降低与该疾病相关联的死亡率。
本文公开的方法可以以高通量方式提供与疾病的前期或前体状态相关联的生物分子指纹。本公开的方法能够大规模、快速处理样本,以高度并行的方式生成生物分子指纹,从而允许快速和大规模确定对象的疾病状态,诊断或预测对象中的疾病,或鉴定许多对象中与疾病状态或疾病或病症相关联的生物标志物的模式。
疾病或病症可以是癌症。术语“癌症”意指涵盖以细胞的异常生长(包括肿瘤和良性生长)为特征的任何癌症、肿瘤性疾病和肿瘤前疾病。例如,癌症可以是肺癌、胰腺癌或皮肤癌。本公开提供了可以从样本中诊断癌症并且还可以区分癌症的特定类型和阶段(例如,确定对象是否(a)没有癌症,(b)处于癌症前发展阶段,(c)处于癌症的早期阶段,(d)处于癌症的晚期阶段)的组合物和方法。
本公开的方法另外可以用于检测其他癌症,如急性淋巴细胞白血病(ALL)、急性髓系白血病(AML)、青少年癌症、肾上腺皮质癌、儿童期肾上腺皮质癌、儿童期不常见的癌症、AIDS相关癌症、卡波西肉瘤(软组织肉瘤)、AIDS相关淋巴瘤(淋巴瘤)、原发性中枢神经系统(CNS)淋巴瘤(淋巴瘤)、肛门癌、阑尾癌、胃肠道类癌瘤、星形细胞瘤、儿童期脑癌、非典型畸胎瘤/横纹肌瘤、中枢神经系统脑癌、中枢神经系统脑癌、皮肤基底细胞癌、皮肤癌、胆管癌、膀胱癌、儿童期膀胱癌、骨癌、尤文肉瘤、骨肉瘤、恶性纤维组织细胞瘤、脑瘤、乳腺癌、儿童期乳腺癌、支气管肿瘤、儿童期伯基特淋巴瘤、伯基特淋巴瘤、非霍奇金淋巴瘤、胃肠道类癌瘤、类癌瘤、儿童期类癌瘤、不明原发癌、儿童期不明原发癌、儿童期心脏(心)肿瘤、心脏肿瘤、中枢神经系统肿瘤、非典型畸胎瘤/横纹肌瘤、儿童期脑癌、胚胎肿瘤、生殖细胞肿瘤、宫颈癌、儿童期宫颈癌、儿童期癌症、儿童期不常见癌症、肝胆管型肝癌、胆管癌、儿童期脊索瘤、脊索瘤、慢性淋巴细胞白血病(CLL)、慢性粒细胞白血病(CML)、慢性骨髓增生性肿瘤、结直肠癌、儿童期结直肠癌、颅咽管瘤、皮肤T细胞淋巴瘤、蕈样肉芽肿、赛塞里综合征(Sézarysyndrome)、导管原位癌(DCIS)、胚胎肿瘤、子宫内膜癌、子宫癌、室管膜瘤、食道癌、儿童期食道癌、鼻腔神经胶质瘤、头颈癌、尤文肉瘤、骨癌、儿童期颅外生殖细胞瘤、颅外生殖细胞瘤、性腺外生殖细胞瘤、眼癌、儿童期眼内黑色素瘤、眼内黑色素瘤、视网膜母细胞瘤、输卵管癌、骨纤维组织细胞瘤、恶性和骨肉瘤、胆囊癌、胃(胃部的)癌、儿童期胃(胃部的)癌、胃肠道类癌瘤、胃肠道间质瘤(GIST)、软组织肉瘤、儿童胃肠道间质瘤、生殖细胞肿瘤、儿童期中枢神经系统生殖细胞肿瘤、儿童期颅外生殖细胞肿瘤、性腺外生殖细胞肿瘤、卵巢生殖细胞肿瘤、睾丸癌、妊娠滋养细胞疾病、毛细胞白血病、儿童期心脏肿瘤、心脏肿瘤、肝细胞(肝)癌、组织细胞增生症、朗格汉斯细胞、霍奇金淋巴瘤、下咽癌、眼内黑色素瘤、儿童期眼内黑色素瘤、胰岛细胞肿瘤、胰腺神经内分泌肿瘤、卡波西肉瘤、软组织肉瘤、肾(肾细胞)癌、朗格汉斯细胞组织细胞增生症、喉癌、白血病、唇和口腔癌、肝癌、肺癌(非小细胞和小细胞)、儿童期肺癌、淋巴瘤、男性乳腺癌、骨恶性纤维组织细胞瘤、骨肉瘤、黑色素瘤、儿童期黑色素瘤、眼内黑色素瘤、儿童期眼内黑色素瘤、默克尔细胞癌、皮肤癌、恶性间皮瘤、儿童期间皮瘤、转移癌、伴有隐匿性原发性的转移性鳞状颈部癌、伴有nut基因改变的中线癌、口腔癌、多发性内分泌肿瘤综合征、多发性骨髓瘤/浆细胞肿瘤、蕈样肉芽肿、骨髓增生异常综合征、骨髓增生异常/骨髓增生性肿瘤、慢性骨髓性白血病、急性髓系白血病、慢性骨髓增生性肿瘤、鼻腔和鼻窦癌、鼻咽癌、神经母细胞瘤、非霍奇金淋巴瘤、非小细胞肺癌、口腔癌、唇和口腔癌、口咽癌、骨肉瘤、骨恶性纤维组织细胞瘤、卵巢癌、儿童期卵巢癌、胰腺癌、儿童期胰腺癌、胰腺神经内分泌肿瘤(胰岛细胞肿瘤)、儿童喉癌乳头状瘤病、乳头状瘤病、副神经节瘤、儿童期副神经节瘤、副鼻窦和鼻腔癌、甲状旁腺癌、阴茎癌、咽癌、嗜铬细胞瘤、儿童嗜铬细胞瘤、垂体瘤、浆细胞瘤/多发性骨髓瘤、胸膜肺母细胞瘤、妊娠与乳腺癌、原发性中枢神经系统(CNS)淋巴瘤、原发性腹膜癌、前列腺癌、直肠癌、复发性癌、肾细胞(肾)癌、视网膜母细胞瘤、横纹肌肉瘤、儿童期软组织肉瘤、唾液腺癌、肉瘤、儿童期横纹肌肉瘤、软组织肉瘤、儿童期血管肿瘤、尤文肉瘤、卡波西肉瘤、软组织肉瘤、子宫肉瘤、赛塞里综合征(淋巴瘤)、皮肤癌、儿童期皮肤癌、小细胞肺癌、小肠癌、软组织肉瘤、皮肤鳞状细胞癌、伴有隐匿性原发性的鳞状颈部癌、转移性头颈癌、胃(胃部的)癌、儿童期胃癌、皮肤T细胞淋巴瘤、T细胞淋巴瘤、蕈样肉芽肿和赛里综合征、睾丸癌、儿童期睾丸癌、喉癌、鼻咽癌、口咽癌、下咽癌、胸腺瘤和胸腺癌、甲状腺癌、肾盂输尿管移行细胞癌、不明原发癌、儿童期不明原发癌、儿童期不常见的癌症、输尿管和肾盂移行细胞癌、尿道癌、子宫癌、子宫内膜、子宫肉瘤、阴道癌、儿童期阴道癌、血管肿瘤、外阴癌、肾母细胞瘤和其他儿童肾脏肿瘤、或年轻成人中的癌症。
在一些情况下,疾病或病症可以包括心血管疾病。如本文所用,术语“心血管疾病”(CVD)或“心血管病症”可以指影响身体的心脏、心脏瓣膜和脉管系统(例如,静脉和动脉)的多种病况的分类,并且涵盖以下疾病和病况,包括但不限于动脉粥样硬化、心肌梗死、急性冠脉综合征、心绞痛、充血性心力衰竭、主动脉瘤、主动脉夹层、髂动脉瘤或股动脉瘤、肺栓塞、心房颤动、中风、短暂性脑缺血发作、收缩功能障碍、舒张功能障碍、心肌炎、房性心动过速、心室颤动、心内膜炎、周围血管疾病和冠心病(CAD)。此外,术语心血管疾病可以指最终具有心血管事件或心血管并发症的对象,心血管事件或心血管并发症是指在对象中由心血管疾病所致的不良状况的表现,如心脏性猝死或急性冠脉综合征,包括但不限于,心肌梗死、不稳定性心绞痛、动脉瘤、中风、心力衰竭、非致死性心肌梗死、中风、心绞痛、短暂性脑缺血发作、主动脉瘤、主动脉夹层、心肌病、心导管异常、心脏成像异常、支架或移植物再血管化、经历异常应激测试的风险、经历异常心肌灌注的风险和死亡。
如本文中所用,检测、诊断或预测心血管疾病(例如,动脉粥样硬化)的能力可以包括确定对象是否处于心血管疾病的前期,是否已经发展为早期、中度或重度形式的心血管疾病,或者是否已经遭受一种或多种心血管事件或与心血管疾病相关的并发症。
动脉粥样硬化(也被称为动脉硬化性血管病或ASVD)可以指心血管疾病,其中由于含有白细胞的动脉斑块的侵袭以及积聚和沉积在动脉壁的最内层上而使动脉壁增厚,导致动脉变窄和变硬。动脉斑块可以指巨噬细胞或碎片的积聚,并且可以含有脂质(胆固醇和脂肪酸)、钙和可变量的纤维结缔组织。与动脉粥样硬化相关联的疾病包括但不限于,动脉粥样硬化血栓形成、冠心病、深部静脉血栓形成、颈动脉疾病、心绞痛、外周动脉疾病、慢性肾病、急性冠脉综合征、血管狭窄、心肌梗死、动脉瘤或中风。本公开的方法可以区分对象中动脉粥样硬化的不同阶段,包括但不限于狭窄的不同程度。
在一些情况下,疾病或病症是内分泌疾病。术语“内分泌疾病”可以指与对象的内分泌系统的失调相关联的病症。内分泌疾病可能起因于腺体产生过多或过少的内分泌激素而导致激素失衡,或者由于内分泌系统中出现损伤(如节结或肿瘤),其可能影响或可能不影响激素水平。能够被治疗的合适的内分泌疾病包括但不限于,例如肢端肥大症、爱迪生氏病、肾上腺癌、肾上腺病症、间变性甲状腺癌、库兴氏综合征、De Quervain甲状腺炎、糖尿病、滤泡性甲状腺癌、妊娠糖尿病、甲状腺肿、格雷夫斯病、生长障碍、生长素缺乏症、桥本甲状腺炎、Hurthle细胞甲状腺癌、高血糖症、甲状旁腺功能亢进症、甲状腺功能亢进症、低血糖症、甲状旁腺功能减退症、甲状腺功能减退症、低睾酮、甲状腺髓样癌、MEN 1、MEN 2A、MEN2B、绝经、代谢综合征、肥胖、骨质疏松症、乳头状甲状腺癌、甲状旁腺疾病、嗜铬细胞瘤、垂体障碍、垂体肿瘤、多囊性卵巢综合征、前驱糖尿病、无症状性甲状腺炎、甲状腺癌、甲状腺疾病、甲状腺结节、甲状腺炎、特纳综合征、1型糖尿病、2型糖尿病等。
在一些情况下,疾病或病症是炎性疾病。如本文中提及的,炎性疾病可以指由对象身体中不受控的炎症所致的疾病。炎症可以是对象对有害刺激(其可能是外部或内部的,如病原体、坏死的细胞和组织、刺激物等)的生物反应。然而,当炎性反应变得异常时,它可以导致自身组织损害并且可能导致各种疾病和病症。炎性疾病可以包括但不限于,哮喘、血管球性肾炎、炎性肠病、类风湿性关节炎、过敏、骨盆炎性疾病、自身免疫性疾病、关节炎;坏死性小肠结肠炎(NEC)、胃肠炎、骨盆炎性疾病(PID)、肺气肿、胸膜炎、肾盂炎、咽炎、心绞痛、寻常痤疮、尿路感染、阑尾炎、滑液囊炎、大肠炎、膀胱炎、皮炎、静脉炎、鼻炎、肌腱炎、扁桃体炎、血管炎、自身免疫性疾病;乳糜泻;慢性前列腺炎、过敏、再灌注损伤;结节病、移植排斥、血管炎、间质性膀胱炎、枯草热、牙周炎、动脉粥样硬化、银屑病、强直性脊柱炎、幼年特发性关节炎、白塞氏病、脊椎关节炎、葡萄膜炎、系统性红斑狼疮和癌症。例如,关节炎可以包括类风湿性关节炎、银屑病关节炎、骨关节炎或幼年特发性关节炎等。
疾病或病症可以是神经疾病。神经病症或神经疾病可以可互换地使用并且可以指脑部、脊柱及连接它们的神经的疾病。神经疾病包括但不限于脑瘤、癫痫、帕金森氏病、阿尔茨海默病、ALS、动静脉畸形、脑血管疾病、脑动脉瘤、癫痫、多发性硬化、周围神经病、疱疹后神经痛、中风、额颞叶痴呆、脱髓鞘病(包括但不限于多发性硬化、德维克病(即视神经脊髓炎)、脑桥中央髓鞘溶解、进行性多灶性白质脑病、脑白质营养不良、吉兰-巴雷综合征、进行性炎性神经病、Charcot-Marie-Tooth病、慢性炎性脱髓鞘多神经病和抗MAG周围神经病)等。神经病症还包括免疫介导的神经病症(IMND),其包括具有免疫系统的与存在于中枢或周围神经系统中的宿主蛋白质反应并且促成疾病病理学的至少一种组分的疾病。IMND可以包括但不限于脱髓鞘病、副肿瘤性神经综合征、免疫介导的脑脊髓炎、免疫介导的自主神经病、重症肌无力、自身抗体相关脑病和急性播散性脑脊髓炎。
本公开的方法可以能够准确地区分患有阿尔茨海默病或未患有阿尔茨海默病的对象。这些还可以能够检测症状前的并且可能在筛查后数年发展阿尔茨海默病的患者。这可以提供能够在非常早期阶段,甚至在疾病的发展之前治疗疾病的优点。
本公开的方法可以检测疾病或病症的病前阶段。病前阶段是对象尚未发展疾病的任何体征或症状的阶段。癌前阶段将是在对象中未鉴定出癌症或肿瘤或癌细胞的阶段。神经疾病前阶段可以指个人尚未发展神经疾病的一种或多种症状的阶段。在疾病的一种或多种体征或症状之前诊断疾病的能力可以允许密切监测对象,并且能够在非常早期阶段治疗疾病,增加了能够停止疾病进展、治愈或降低疾病的严重程度的前景。
本公开的方法可以能够检测疾病或病症的早期阶段。疾病的早期阶段可以指疾病的最初体征或症状可能在对象体内出现的时间。疾病的早期阶段可能是没有外在体征或症状的阶段。例如,在阿尔茨海默病中,早期阶段可以是阿尔茨海默病前期阶段,其中没有检测到症状,但对象将在数月或数年后发展为阿尔茨海默病。
在疾病前发展或早期状态中鉴定疾病通常可能导致对象的阳性结果的更高可能性。例如,在早期阶段(0期或1期)诊断癌症可以增加生存可能性超过80%。0期癌症可以描述在癌症已经开始扩散到附近组织之前的癌症。这一阶段的癌症通常是高度可治愈的,通常通过手术切除整个肿瘤。1期癌症通常可能是小的癌症或肿瘤,其没有深入生长到附近的组织中并且没有扩散到淋巴结或身体的其他部分。
本公开的方法可以能够检测疾病的中间阶段。疾病的中间状态可以描述已经经过了最初体征和症状的疾病阶段,并且对象可能正在经历疾病的一种或多种症状。例如,对于癌症,II期或III期癌症被认为是中间阶段,表明较大的癌症或肿瘤已经更深地生长到附近组织中。在一些情况下,II期或III期癌症也可能已经扩散到淋巴结,但未扩散到身体的其他部分。
此外,该方法可以能够检测疾病的后期(late)阶段或晚期(advanced)阶段。疾病的后期阶段或晚期阶段也可以被称为“严重的”或“晚期的”,并且通常表明对象患有疾病的多种症状和影响。例如,严重阶段癌症包括阶段IV,其中癌症已经扩散到身体的其他器官或部分,并且有时被称为晚期癌症或转移性癌症。
在一些情况下,本公开的方法不仅可以能够区分不同类型的疾病,而且还能够区分疾病的不同阶段(例如,癌症的早期阶段)。这可以包括区分健康对象和疾病前状态对象。疾病前状态可以是0期或1期癌症或神经退行性疾病、痴呆、冠心病、肾病、心血管疾病(例如,冠状动脉疾病)、糖尿病或肝病的早期阶段。区分疾病的不同阶段可以包括区分癌症的两个阶段(例如,阶段0相对于阶段1或阶段1相对于阶段3)。
疾病检测可以包括分析或处理来自对象的核酸数据和蛋白质数据。在一些情况下,核酸数据可以指导蛋白质分析。核酸分析的共同缺点是基因或转录物的存在并不一定分别意味着表达或翻译。例如,在一些情况下,致癌突变可以导致或可以不导致疾病或者甚至改变的表达。本公开的许多方法可以通过至少直接鉴定与从对象获得的遗传数据和/或转录组数据相关的蛋白质来解决这一问题。
在一些情况下,蛋白质分析可以指导核酸分析。虽然对整个基因组、转录组或外显子组进行测序可能是耗时且昂贵的,但对单独的核酸进行测序或查询通常是廉价、快速且准确的。因此,本公开的一些方法包括蛋白质分析,随后是靶向的核酸分析。本公开的一些方法包括靶向的核酸分析,随后是蛋白质分析。本公开的一些方法包括并行进行靶向的核酸分析和蛋白质分析。例如,血浆蛋白质组分析表明对象可能患有早期非小细胞肺癌(NSCLC),随后可以进行靶向潜在NSCLC癌基因的核酸分析。
干组合物和试剂盒
本文公开的组合物可以被冻干。冻干可以指冷冻包括溶剂的物质,然后通过减压、升温或两者使溶剂升华,以引起溶剂从固相到气相的转变的方法。冷冻可以包括使物质接触冷冻剂(如液氮)(例如,将物质浸入到冷冻剂中)。冷冻可以包括使物质接触冷表面,如冷冻剂冷却的板。在本文公开的某些情况下,冷冻包括将限定体积的物质滴入冷冻剂中,从而形成具有限定体积的冷冻珠。冻干组合物或干组合物可以指已经冻干的物质。
如本文公开的各种颗粒或其各种组合物可以被冻干。如本文公开的各种溶剂可以用作用于冻干的溶剂。在一些情况下,使用水作为溶剂来冻干如本文公开的颗粒组合物。在一些情况下,液体包括有机溶剂。液体也可以是有机的水性混合物,如水、甲醇混合物,有机溶剂如氯仿,或有机溶剂混合物,如二甲亚砜、乙腈混合物。在一些情况下,有机溶剂包括丙酮、乙腈、苯、丁醇、丁酮、叔丁醇、四氯化碳、氯苯、氯仿、环己烷、1,2-二氯乙烷、二甘醇、乙醚、1,2-二甲氧基乙烷(甘醇二甲醚(glyme),DME)、二甲基甲酰胺(DMF)、二甲基亚砜(DMSO)、1,4-二噁烷、乙醇、乙酸乙酯、乙二醇、甘油、庚烷、六甲基磷酰胺(HMPA)、六甲基磷、三酰胺(HMPT)、己烷、甲醇、甲基叔丁基醚(MTBE)、二氯甲烷、N-甲基-2-吡咯烷酮(NMP)、硝基甲烷、戊烷、丙醇、丙醇、吡啶、四氢呋喃(THF)、甲苯、三乙胺、邻二甲苯、间二甲苯、对二甲苯或其任何组合。
在一些情况下,该物质在支持物内冻干。例如,物质可以在多个孔(例如,孔板的孔)或管中被快速冷冻并经受溶剂升华条件。如本文进一步公开的,含有冻干物质的支持物可以在以后用于生物样本分析。
各种支持剂可以用于冻干组合物。在一些情况下,支持剂可以包括赋形剂。在一些情况下,赋形剂可以包括葡聚糖、PEG、蔗糖、葡萄糖、海藻糖、乳糖、聚山梨醇酯、氨基酸、甘露醇、甘氨酸、甘油或其任何组合或变体。在一些情况下,支持剂可以包括盐。
支持剂可以以各种量存在以用于冻干。在一些情况下,支持剂可以具有小于约5mg/mL的浓度。在一些情况下,支持剂可以具有小于约50mg/mL的浓度。在一些情况下,支持剂可以具有小于约250mg/mL的浓度。在一些情况下,支持剂可以具有大于约250mg/mL的浓度。在一些情况下,支持剂可以具有在约100mg/mL和200mg/mL之间的浓度。在一些情况下,支持剂可以具有大于约10、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900或1000mg/mL的浓度。在一些情况下,支持剂可以具有小于约10、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900或1000mg/mL的浓度。在一些情况下,支持剂可以以至少约60wt%至70wt%的量存在。在一些情况下,支持剂可以以至少约75wt%至85wt%的量存在。在一些情况下,支持剂可以以至少约97.5wt%的量存在。在一些情况下,支持剂可以以至少约50、55、60、65、70、75、80、85、90、91、92、93、94、95、96、97、98或99wt%的量存在。在一些情况下,支持剂可以以至多约50、55、60、65、70、75、80、85、90、91、92、93、94、95、96、97、98或99wt%的量存在。
颗粒可以以各种量存在以用于冻干。在一些情况下,溶液或悬浮液可以具有大于约5mg/mL的颗粒浓度。在一些情况下,溶液或悬浮液可以具有小于约100mg/mL的颗粒浓度。在一些情况下,溶液或悬浮液可以具有在约10mg/mL和约100mg/mL之间的颗粒浓度。在一些情况下,溶液或悬浮液可以具有在约15mg/mL和约80mg/mL之间的颗粒浓度。在一些情况下,溶液或悬浮液可以具有大于约0.1、0.2、0.3、0.4、0.5、0.6、0.7、0.8、0.9、1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900或1000mg/mL的颗粒浓度。在一些情况下,溶液或悬浮液可以具有小于约0.1、0.2、0.3、0.4、0.5、0.6、0.7、0.8、0.9、1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900或1000mg/mL的颗粒浓度。
颗粒可以包括各种表面修饰,包括由本公开提供的表面修饰。在一些情况下,表面修饰可以包括二氧化硅涂层、三胺官能化、PDMAPMA-聚合物官能化、葡萄糖-6-磷酸酯官能化或单胺表面官能化。在一些情况下,表面修饰可以包括金属氧化物涂层。在一些情况下,表面修饰可以包括至少一个暴露的伯胺基团、仲胺基团、叔胺基团。在一些情况下,表面修饰可以包括至少一种单糖。在一些情况下,表面修饰可以包括二氧化硅涂层、PDMAPMA-聚合物官能化、葡萄糖-6-磷酸酯官能化、聚苯乙烯羧基官能化、葡聚糖官能化、酰胺官能化、羧基官能化、三胺官能化、二胺官能化、单胺表面官能化或其任何组合。在一些情况下,表面修饰可以包括N-(3-三甲氧基甲硅烷基丙基)二亚乙基三胺官能化、1,6-己二胺官能化、N1-(3-(三甲氧基甲硅烷基)丙基)己烷-1,6-二胺或其任何组合。
各种体积的溶液或悬浮液可以被冻干。例如,可以将一定体积的溶液或悬浮液滴入低温溶剂中以形成溶液或悬浮液的冷冻珠,然后可以将该珠冷冻干燥以形成包括至少一部分初始体积的溶液的冻干珠。在一些情况下,溶液或悬浮液可以具有大于约1μL的体积。在一些情况下,溶液或悬浮液可以具有小于约100μL的体积。在一些情况下,溶液或悬浮液可以具有在2μL和60μL之间的体积。在一些情况下,溶液或悬浮液可以具有在25μL和45μL之间的体积。在一些情况下,溶液或悬浮液可以具有至少约0.1、0.2、0.3、0.4、0.5、0.6、0.7、0.8、0.9、1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900、1000、2000、3000、4000、5000、6000、7000、8000、9000或10000μL的体积。在一些情况下,溶液或悬浮液可以具有至多约0.1、0.2、0.3、0.4、0.5、0.6、0.7、0.8、0.9、1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900、1000、2000、3000、4000、5000、6000、7000、8000、9000或10000μL的体积。
冻干组合物可以包括干组合物。在一些情况下,干燥或正在干燥可以指组合物包括少于一定量的液相如水或另一种溶剂的状态。在一些情况下,干组合物可以包括有包括小于约10、1、0.1、0.01、0.001、0.0001或0.00001wt%的溶剂的组合物。在一些情况下,干组合物可以包括有包括小于约10、1、0.1、0.01、0.001、0.0001或0.00001vol%的溶剂的组合物。在一些情况下,干组合物可以包括珠,该珠包括球形形状、圆柱形形状、矩形形状或任何其他形状。
在一些情况下,干组合物可以包括每个珠至少约0.5mg的表面修饰的颗粒。在一些情况下,干组合物可以包括每个珠约0.5mg至约5mg的表面修饰的颗粒。在一些情况下,干组合物可以包括每个珠至少约0.01、0.02、0.03、0.04、0.05、0.06、0.07、0.08、0.09、0.1、0.2、0.3、0.4、0.5、0.6、0.7、0.8、0.9、1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90或100mg的颗粒。在一些情况下,干组合物可以包括每个珠至多约0.01、0.02、0.03、0.04、0.05、0.06、0.07、0.08、0.09、0.1、0.2、0.3、0.4、0.5、0.6、0.7、0.8、0.9、1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90或100mg的颗粒。
冻干可以赋予物质稳定性。在一些情况下,配制冻干形式的纳米颗粒可以在延长的时间段内允许稳定的物理化学性质。在一些情况下,冻干颗粒在冷藏温度或室温下可以是惰性的或稳定的。
颗粒可以在本文所述的一些组合物中包括稳定性。在一些情况下,稳定性或是稳定的可以归因于物质的性质,该性质的变化小于阈值量,同时在一段时间内保持物质的效用或功效。基于效用或功效的各种度量,各种物质的各种性质可以归因于不同时期的稳定性。
冻干组合物可以包括各种稳定的物理化学性质。物理化学性质可以包括ζ电势。物理化学性质可以包括纳米颗粒组合物中的ζ电势的分布。物理化学性质可以包括纳米颗粒组合物中的平均ζ电势。物理化学性质可以包括纳米颗粒组合物中ζ电势的标准偏差。在一些情况下,ζ电势通过电泳、电渗、流动电势测量或沉降电势测量来测量。在一些情况下,物理化学性质可以包括粒径。物理化学性质可以包括纳米颗粒组合物中的粒径的分布。物理化学性质可以包括纳米颗粒组合物中的平均粒径。物理化学性质可以包括纳米颗粒组合物中粒径的标准偏差。
在一些情况下,冻干颗粒可以包括是溶液或悬浮液中直径的90%至110%的直径。在一些情况下,冻干颗粒可以包括是溶液或悬浮液中直径的80%至120%的直径。在一些情况下,冻干颗粒可以包括是溶液或悬浮液中直径的95%至105%的直径。在一些情况下,冻干颗粒可以包括是溶液或悬浮液中直径的98%至102%的直径。在一些情况下,冻干颗粒可以包括是溶液或悬浮液中直径的99%至101%的直径。
在一些情况下,冻干颗粒可以包括是溶液或悬浮液中平均直径的90%至110%的平均直径。在一些情况下,冻干颗粒可以包括是溶液或悬浮液中平均直径的80%至120%的平均直径。在一些情况下,冻干颗粒可以包括是溶液或悬浮液中平均直径的95%至105%的平均直径。在一些情况下,冻干颗粒可以包括是溶液或悬浮液中平均直径的98%至102%的平均直径。在一些情况下,冻干颗粒可以包括是溶液或悬浮液中平均直径的99%至101%的平均直径。
在一些情况下,冻干颗粒可以包括是溶液或悬浮液中ζ电势的90%至110%的ζ电势。在一些情况下,冻干颗粒可以包括是溶液或悬浮液中ζ电势的80%至120%的ζ电势。在一些情况下,冻干颗粒可以包括是溶液或悬浮液中ζ电势的95%至105%的ζ电势。在一些情况下,冻干颗粒可以包括是溶液或悬浮液中ζ电势的98%至102%的ζ电势。在一些情况下,冻干颗粒可以包括是溶液或悬浮液中ζ电势的99%至101%的ζ电势。
在一些情况下,冻干颗粒可以包括是溶液或悬浮液中平均ζ电势的90%至110%的平均ζ电势。在一些情况下,冻干颗粒可以包括是溶液或悬浮液中平均ζ电势的80%至120%的平均ζ电势。在一些情况下,冻干颗粒可以包括是溶液或悬浮液中平均ζ电势的95%至105%的平均ζ电势。在一些情况下,冻干颗粒可以包括是溶液或悬浮液中平均ζ电势的98%至102%的平均ζ电势。在一些情况下,冻干颗粒可以包括是溶液或悬浮液中平均ζ电势的99%至101%的平均ζ电势。
在一些情况下,在溶液中重构干组合物时,颗粒可以具有的平均ζ电势为在不存在冻干的情况下溶解在相同溶液中的相同颗粒的ζ电势的85%至115%,如通过ζ电势测量(例如,电泳、电渗、流动电势测量或沉降电势测量)所确定的。在一些情况下,在溶液中重构干组合物时,颗粒可以具有的平均ζ电势为在不存在冻干的情况下溶解在相同溶液中的相同颗粒的ζ电势的90%至110%,如通过ζ电势测量所确定的。在一些情况下,在溶液中重构干组合物时,颗粒可以具有的平均ζ电势为在不存在冻干的情况下溶解在相同溶液中的相同颗粒的ζ电势的95%至105%,如通过ζ电势测量所确定的。在一些情况下,在溶液中重构干组合物时,颗粒可以具有的平均ζ电势为在不存在冻干的情况下溶解在相同溶液中的相同颗粒的ζ电势的98%至102%,如通过ζ电势测量所确定的。在一些情况下,在溶液中重构干组合物时,颗粒可以具有的平均ζ电势标准偏差为在不存在冻干的情况下溶解在相同溶液中的相同颗粒的ζ电势标准偏差的85%至115%,如通过ζ电势测量所确定的。在一些情况下,在溶液中重构干组合物时,颗粒可以具有的平均ζ电势标准偏差为在不存在冻干的情况下溶解在相同溶液中的相同颗粒的ζ电势标准偏差的90%至110%,如通过ζ电势测量所确定的。在一些情况下,在溶液中重构干组合物时,颗粒可以具有的ζ电势标准偏差为在不存在冻干的情况下溶解在相同溶液中的相同颗粒的ζ电势标准偏差的95%至105%,如通过ζ电势测量所确定的。在一些情况下,在溶液中重构干组合物时,颗粒可以具有的ζ电势标准偏差为在不存在冻干的情况下溶解在相同溶液中的相同颗粒的ζ电势标准偏差的98%至102%,如通过ζ电势测量所确定的。
在一些情况下,在溶液中重构干组合物时,颗粒可以具有的平均直径为在不存在冻干的情况下溶解在相同溶液中的相同颗粒的平均直径的85%至115%,如通过DLS所确定的。在一些情况下,在溶液中重构干组合物时,颗粒可以具有的平均直径为在不存在冻干的情况下溶解在相同溶液中的相同颗粒的平均直径的90%至110%,如通过DLS所确定的。在一些情况下,在溶液中重构干组合物时,颗粒可以具有的平均直径为在不存在冻干的情况下溶解在相同溶液中的相同颗粒的平均直径的95%至105%,如通过DLS所确定的。在一些情况下,在溶液中重构干组合物时,颗粒可以具有的平均直径为在不存在冻干的情况下溶解在相同溶液中的相同颗粒的平均直径的98%至102%,如通过DLS所确定的。在一些情况下,在溶液中重构干组合物时,颗粒可以具有的直径标准偏差为在不存在冻干的情况下溶解在相同溶液中的相同颗粒的直径标准偏差的85%至115%,如通过DLS所确定的。在一些情况下,在溶液中重构干组合物时,颗粒可以具有的直径标准偏差为在不存在冻干的情况下溶解在相同溶液中的相同颗粒的直径标准偏差的90%至110%,如通过DLS所确定的。在一些情况下,在溶液中重构干组合物时,颗粒可以具有的直径标准偏差为在不存在冻干的情况下溶解在相同溶液中的相同颗粒的直径标准偏差的95%至105%,如通过DLS所确定的。在一些情况下,在溶液中重构干组合物时,颗粒可以具有的直径标准偏差为在不存在冻干的情况下溶解在相同溶液中的相同颗粒的直径标准偏差的98%至102%,如通过DLS所确定的。
在一些情况下,在溶液中重构干组合物时,颗粒可以吸附的生物样本中的生物分子是在不存在冻干的情况下溶解在相同溶液中的颗粒将从相同生物样本中吸附的生物分子的至少85%。在一些情况下,在溶液中重构干组合物时,颗粒可以吸附的生物样本中的生物分子是在不存在冻干的情况下溶解在相同溶液中的颗粒将从相同生物样本中吸附的生物分子的至少90%。在一些情况下,在溶液中重构干组合物时,颗粒可以吸附的生物样本中的生物分子是在不存在冻干的情况下溶解在相同溶液中的颗粒将从相同生物样本中吸附的生物分子的至少95%。在一些情况下,在溶液中重构干组合物时,颗粒可以吸附的生物样本中的生物分子是在不存在冻干的情况下溶解在相同溶液中的颗粒将从相同生物样本中吸附的生物分子的至少96%。在一些情况下,在溶液中重构干组合物时,颗粒可以吸附的生物样本中的生物分子是在不存在冻干的情况下溶解在相同溶液中的颗粒将从相同生物样本中吸附的生物分子的至少97%。在一些情况下,在溶液中重构干组合物时,颗粒可以吸附的生物样本中的生物分子是在不存在冻干的情况下溶解在相同溶液中的颗粒将从相同生物样本中吸附的生物分子的至少98%。在一些情况下,在溶液中重构干组合物时,颗粒可以吸附的生物样本中的生物分子是在不存在冻干的情况下溶解在相同溶液中的颗粒将从相同生物样本中吸附的生物分子的至少99%。
冻干组合物可以在不同时间段内具有稳定的物理化学性质。在一些情况下,该时间段可以包括至少约12天、至少约14天、至少约30天、至少约40天、至少约2个月、至少约3个月、至少约4个月、至少约5个月、至少约6个月、至少约7个月、至少约8个月、至少约9个月、至少约10个月、至少约11个月或至少约1年的时间段。
冻干组合物可以在各种温度下具有稳定的物理化学性质。在一些情况下,温度可以为约室温。在一些情况下,温度可以为约37℃。在一些情况下,温度可以为约60℃。在一些情况下,温度可以为约-26℃至约0℃。在一些情况下,温度可以为约-10℃至约-5℃。在一些情况下,温度可以为约0℃至20℃。在一些情况下,温度可以为约0℃至约10℃。在一些情况下,温度可以为约25℃至约60℃。在一些情况下,温度可以为约35℃至约40℃。在一些情况下,干组合物或冻干组合物在约37℃下稳定至少40天。在一些情况下,干组合物或冻干组合物在环境温度下稳定至少11个月。
可以将干组合物与各种其他内容物一起包装到试剂盒中。在一些情况下,试剂盒可以包括有包含颗粒(例如,表面修饰的颗粒)和冻干支持剂的干组合物,包括被配置为接收和保留干组合物的基底。在一些情况下,基底可以是管、孔、多孔或微流体装置中的微流体通道或腔室。在一些情况下,多孔可以是12孔板、24孔板、48孔板、72孔板、96孔板、192孔板或384孔板。在一些情况下,基底可以包括多个空间上隔离的位置(例如,多孔板的单独的孔,或微流体装置的单独的微流体通道),每个位置可以包括干组合物。在一些情况下,包括在单独的位置中的干组合物可以在组合物中颗粒的至少一种物理化学性质上彼此不同。颗粒可以被配置为从样本中吸附不同的生物分子或生物分子群组。在一些情况下,多个空间上隔离的位置中的单独的位置可以是单独和/或独立可寻址的。
图19A示出了最左侧第一列中所示的三种超顺磁性氧化铁纳米颗粒(SPION)的表征,其从上到下为:二氧化硅涂覆的SPION、聚(N-(3-(二甲基氨基)丙基)甲基丙烯酰胺)(PDMAPMA)涂覆的SPION和聚(低聚(乙二醇)甲基醚甲基丙烯酸酯)(POEGMA)涂覆的SPION,该表征分别通过以下方法进行:扫描电子显微镜(SEM,第二列图像)、动态光散射(DLS,第三列图像)、透射电子显微镜(TEM,第四列图像)、高分辨率透射电子显微镜(HRTEM,第五列)和X射线光电子能谱(XPS,第六列)。DLS示出了每种颗粒类型的三个复制品。HRTEM照片是在单独的颗粒的表面处记录的。当合成时,颗粒可以包括尺寸或组成的分布。在一些情况下,一种类型的颗粒可以被可重复地制造成一定的尺寸、形式、组成或组成概况。在一些情况下,可以对制造的颗粒进行表征以用于质量控制。
使用干组合物和试剂盒的方法
如本文所述,干组合物可以与生物样本接触,以在表面修饰的颗粒的表面上产生生物分子冠状物。在一些情况下,在使组合物与生物样本接触之前,干组合物可以首先被重构。
本公开的各个方面提供了一种用于测定生物样本的方法,其包括:提供包含颗粒和支持剂的干组合物;在液体中重构干组合物以形成重构的组合物;以及使生物样本与重构的组合物接触,以将来自样本的生物分子或生物分子群组的至少一部分结合到颗粒上。在一些情况下,干组合物包括与本公开一致的冻干珠。在一些情况下,干组合物是冻干珠或多个冻干珠。
在一些情况下,重构可以指将固体溶解或悬浮在无菌溶剂中,以形成液体混合物。在一些情况下,在使混合物与生物样本接触之前,干组合物可以被重构。
在一些情况下,在多孔板、流体通道、流体腔室、微流体装置或管的容积中提供干组合物。在此类情况下,干组合物可以在多孔板、流体通道、流体腔室、微流体装置或管的容积内重构。重构的组合物也可以与多孔板、流体通道、流体腔室、微流体装置或管的容积内的生物样本接触。例如,该方法可以包括在多孔板的孔内重构干组合物,然后向孔中加入一定体积的生物样本。
在一些情况下,颗粒是表面修饰的颗粒,如表1的表面修饰的颗粒。该颗粒可以包括用于可变地选择性结合来自生物样本的生物分子的物理化学性质。例如,颗粒可以包括脂肪族非极性表面官能化,相对于中性非极性分析物的吸附,其不利于带电荷的分析物的吸附。颗粒可以包括多种颗粒。在一些情况下,多种颗粒中的单独的颗粒包括不同的表面。在一些情况下,多种颗粒中的单独的颗粒包括不同的物理化学性质。例如,颗粒可以包括胺官能化的颗粒、羧酸酯官能化的颗粒和苯乙烯官能化的颗粒。颗粒的不同的物理化学性质可能影响它们从生物样本中可变地选择性吸附生物分子或生物分子群组。
使用干组合物的方法可以包括不同的重构速率。在一些情况下,重构可以包括在25℃下至少0.1min-1的速率。在一些情况下,重构可以包括在25℃下至少0.5min-1的速率。在一些情况下,重构可以包括在25℃下至少约0.01、0.02、0.03、0.04、0.05、0.06、0.07、0.08、0.09、0.1、0.2、0.3、0.4、0.5、0.6、0.7、0.8、0.9、1、2、3、4、5、6、7、8、9min-1的速率。在一些情况下,重构可以包括在约37℃下至少约0.01、0.02、0.03、0.04、0.05、0.06、0.07、0.08、0.09、0.1、0.2、0.3、0.4、0.5、0.6、0.7、0.8、0.9、1、2、3、4、5、6、7、8、9min-1的速率。在一些情况下,重构可以包括在约25℃下至多约0.01、0.02、0.03、0.04、0.05、0.06、0.07、0.08、0.09、0.1、0.2、0.3、0.4、0.5、0.6、0.7、0.8、0.9、1、2、3、4、5、6、7、8、9min-1的速率。在一些情况下,重构可以包括在约37℃下至多约0.01、0.02、0.03、0.04、0.05、0.06、0.07、0.08、0.09、0.1、0.2、0.3、0.4、0.5、0.6、0.7、0.8、0.9、1、2、3、4、5、6、7、8、9min-1的速率。
在一些情况下,重构可以包括在约25℃下每分钟至少0.2mg颗粒的速率。在一些情况下,重构可以包括在约25℃下每分钟至少约0.01、0.02、0.03、0.04、0.05、0.06、0.07、0.08、0.09、0.1、0.2、0.3、0.4、0.5、0.6、0.7、0.8、0.9、1、2、3、4、5、6、7、8、9mg颗粒的速率。在一些情况下,重构可以包括在约25℃下每分钟至多约0.01、0.02、0.03、0.04、0.05、0.06、0.07、0.08、0.09、0.1、0.2、0.3、0.4、0.5、0.6、0.7、0.8、0.9、1、2、3、4、5、6、7、8、9mg颗粒的速率。在一些情况下,重构可以包括在约37℃下每分钟至少约0.01、0.02、0.03、0.04、0.05、0.06、0.07、0.08、0.09、0.1、0.2、0.3、0.4、0.5、0.6、0.7、0.8、0.9、1、2、3、4、5、6、7、8、9mg颗粒的速率。在一些情况下,重构可以包括在约37℃下每分钟至多约0.01、0.02、0.03、0.04、0.05、0.06、0.07、0.08、0.09、0.1、0.2、0.3、0.4、0.5、0.6、0.7、0.8、0.9、1、2、3、4、5、6、7、8、9mg颗粒的速率。
在一些情况下,重构可以进行至多20分钟。在一些情况下,重构可以进行至多1、2、3、4、5、6、7、8、9、10、20、30、40、50、60分钟。在此类时间之后,重构可以是至少85%完成、至少90%完成、至少95%完成、至少98%完成、至少99%完成或至少99.5%完成。
在一些情况下,重构可以包括物理扰动以加速重构。在一些情况下,重构可以包括超声处理、混合或摇动。在一些情况下,重构可以不包括物理扰动。
重构干组合物可以恢复到冻干之前颗粒组合物的原始性质。在一些情况下,在重构后,表面修饰的颗粒基本上不含颗粒聚集体。在一些情况下,在重构后,少于约10%的表面修饰的颗粒可能作为颗粒聚集体存在。在一些情况下,在重构后,少于约10%、9%、8%、7%、6%、5%、4%、3%、2%、1%、0.9%、0.8%、0.7%、0.6%、0.5%、0.4%、0.3%、0.2%、0.1%、0.09%、0.08%、0.07%、0.06%、0.05%、0.04%、0.03%、0.02%、0.01%、0.009%、0.008%、0.007%、0.006%、0.005%、0.004%、0.003%、0.002%、00.01%、0.0009%、0.0008%、0.0007%、0.0006%、0.0005%、0.0004%、0.0003%、0.0002%或0.0001%的表面修饰的颗粒可能作为颗粒聚集体存在。
在一些情况下,在重构后,液体包括在约5和约9之间的pH。在一些情况下,在重构后,液体包括在约6和约8之间的pH。在一些情况下,在重构后,液体包括在约7和约8之间的pH。在一些情况下,在重构后,液体包括在约7.2和约7.7之间的pH。在一些情况下,在重构后,液体包括约7.5的pH。在一些情况下,在重构后,液体包括至少5的pH。在一些情况下,在重构后,液体包括至少6的pH。在一些情况下,在重构后,液体包括至多9的pH。在一些情况下,在重构后,液体包括至多8的pH。
在一些情况下,在重构之前,液体具有至多约500mM、至多约350mM、至多约250mM、至多约200mM、至多约150mM、至多约100mM、至多约50mM、至多约30mM、至多约10mM、至多约5mM、至多约1mM、至多约0.5mM、至多约0.1mM或至多约0.05mM的离子浓度。在一些情况下,在重构之前,液体具有至少约500mM、至少约350mM、至少约250mM、至少约200mM、至少约150mM、至少约100mM、至少约50mM、至少约30mM、至少约10mM、至少约5mM、至少约1mM、至少约0.5mM、至少约0.1mM或至少约0.05mM的离子浓度。在一些情况下,在重构后,液体具有至多约500mM、至多约350mM、至多约250mM、至多约200mM、至多约150mM、至多约100mM、至多约50mM、至多约30mM、至多约10mM、至多约5mM、至多约1mM、至多约0.5mM、至多约0.1mM或至多约0.05mM的离子浓度。在一些情况下,在重构后,液体具有至少约500mM、至少约350mM、至少约250mM、至少约200mM、至少约150mM、至少约100mM、至少约50mM、至少约30mM、至少约10mM、至少约5mM、至少约1mM、至少约0.5mM、至少约0.1mM或至少约0.05mM的离子浓度。
在一些情况下,干组合物可以与生物样本接触,而无需首先在溶剂中对其进行重构。干组合物可以溶解或悬浮在生物流体样本中。例如,与本公开一致的方法可以包括提供包含颗粒和冻干支持剂的干组合物,并且在不存在干组合物重构的情况下,使生物流体样本(例如,血浆)与干组合物接触,以将生物分子或生物分子群组从生物流体样本吸附到颗粒上。例如,干组合物可以与血液、血浆、血清、CSF、尿液、泪液、细胞裂解物、组织裂解物、细胞匀浆、组织匀浆、乳头抽吸物、针抽吸物、粪便样本、滑液、全血、唾液或其组合接触。
可以用不同量的溶剂稀释生物样本。在一些情况下,生物样本可以在缓冲溶液中稀释。在一些情况下,生物样本可以以约1份生物样本比至少约1份缓冲溶液的体积比稀释。在一些情况下,生物样本可以以约1份生物样本比至少约2份缓冲溶液的体积比稀释。在一些情况下,生物样本可以以约1份生物样本比至少约5份缓冲溶液的体积比稀释。在一些情况下,生物样本可以以约1份生物样本比至少约10份缓冲溶液的体积比稀释。在一些情况下,生物样本可以以约1份生物样本比至少约20份缓冲溶液的体积比稀释。
在一些情况下,在与生物样本接触后,干组合物中的颗粒可以在生物样本中单独溶剂化。在一些情况下,至少约90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.1%、99.2%、99.3%、99.4%、99.5%、99.6%、99.7%、99.8%、99.9%、99.91%、99.92%、99.93%、99.94%、99.95%、99.96%、99.97%、99.98%或99.99%的颗粒可以在生物样本中单独溶剂化。
使用机器学习的分类
确定与疾病或病症和/或疾病状态相关联的生物分子的集合的方法可以包括分析至少两个样本的生物分子冠状物。这种确定、分析或统计分类可以通过多种方法来执行,包括但不限于例如各种监督的和无监督的数据分析、机器学习、深度学习和聚类方法,包括分层聚类分析(HCA)、主成分分析(PCA)、偏最小二乘判别分析(PLS-DA)、随机森林、逻辑回归、决策树、支持向量机(SVM)、k最近邻、朴素贝叶斯、线性回归、多项式回归、用于回归的SVM、K均值聚类和隐马尔可夫模型等。换句话说,将每个样本的冠状物中的生物分子相互比较/分析,以统计学显著性确定各个冠状物之间共有的模式,从而确定与疾病或病症或疾病状态相关联的生物分子的集合。
在一些情况下,机器学习算法可以用于构建模型,该模型基于描述实例的输入特征将类别标记物准确分配给实例。在一些情况下,对于本文描述的方法,采用机器学习和/或深度学习方法可能是有利的。例如,机器学习可以用于将生物分子冠状物与各种疾病状态(例如,没有疾病、疾病的前兆(precursor)、具有疾病的早期或晚期阶段等)相关联。例如,在一些情况下,一种或多种机器学习算法可以与本文公开的方法结合使用,以分析由生物分子冠状物和由其衍生的生物分子的集合检测和获得的数据。例如,机器学习可以与使用本文描述的方法获得的基因组和蛋白质组信息结合,以不仅确定对象是否患有癌症前期、癌症或者没有患有或发展癌症,而且还区分癌症的类型。
机器学习算法也可以用于将来自蛋白质冠状物分析的结果与来自核酸测序分析的结果相关联,并且进一步将蛋白质和核酸之间的任何趋势或相关性与生物学状态(例如,疾病状态、健康状态、疾病亚型,如疾病的阶段为癌症亚型)相关联。
机器学习可以用于对使用多种颗粒检测的蛋白质进行聚类。图20说明了使用多种颗粒来分析蛋白质和蛋白质结构和功能基团的丰度的方法。在一些情况下,颗粒的文库可以用于测定来自一个或多个生物样本的蛋白质。在一些情况下,颗粒的文库中的颗粒可以包括不同的物理化学性质。在一些情况下,由颗粒的文库检测的蛋白质可以使用聚类算法来聚类。在一些情况下,由颗粒的文库检测的蛋白质可以至少部分地基于检测的蛋白质信号的强度、颗粒化学性质、蛋白质结构和/或功能基团或其任何组合来聚类。
颗粒的文库可以包括任何数量的颗粒。在一些情况下,颗粒的文库可以包括至少约1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900或1000种颗粒。在一些情况下,颗粒的文库可以包括至多约1、2、3、4、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900或1000种颗粒。
颗粒的物理化学性质可以包括本文公开的各种性质。在一些情况下,物理化学性质可以包括电荷、疏水性、亲水性、两亲性、配位、反应类别、表面自由能、各种官能团/修饰(例如,糖、聚合物、胺、酰胺、环氧、交联剂、羟基、芳香族基团或磷酸酯基团)。在一些情况下,反应类别可以指在颗粒上提供官能化(例如,Stober过程)的反应类型。在一些情况下,特定的反应类别可以具有类别特异性的反应效率,并且可以产生一种或多种影响颗粒性质的副产物。
在一些情况下,聚类算法可以指通过某种相似性的度量对数据集中的样本进行分组的方法。在一些情况下,可以在集合空间中对样本进行分组,例如,元素“a”在集合“A”中。在一些情况下,可以在连续空间中对样本进行分组,例如,元素“a”是欧几里德空间中的点,其中距离“l”远离构成聚类“A”的元素的质心。在一些情况下,可以在图形空间中对样本进行分组,例如,元素“a”与组成聚类“A”的元素高度相关。在一些情况下,聚类可以指基于某种相似性的度量将多个元素组织成某个数学空间中的群组的原理。
在一些情况下,聚类可以包括通过相似性的任何定量测量对数据集中的任何数量的蛋白质进行分组。在一些情况下,聚类可以包括K均值聚类。在一些情况下,聚类可以包括分层聚类。在一些情况下,聚类可以包括使用随机森林模型。在一些情况下,聚类可以包括提升的树模型。在一些情况下,聚类可以包括使用支持向量机。在一些情况下,聚类可以包括计算将数据集划分成聚类的N维空间中的一个或多个N-1维表面。在一些情况下,聚类可以包括基于分布的聚类。在一些情况下,聚类可以包括在N维空间中分布的数据上拟合多个先验分布。在一些情况下,聚类可以包括使用基于密度的聚类。在一些情况下,聚类可以包括使用模糊聚类。在一些情况下,聚类可以包括计算属于聚类的数据点的概率值。在一些情况下,聚类可以包括使用约束。在一些情况下,聚类可以包括使用监督学习。在一些实施方案中,聚类可以包括使用无监督学习。
在一些情况下,聚类可以包括基于相似性对蛋白质进行分组。在一些情况下,聚类可以包括基于定量相似性对蛋白质进行分组。在一些情况下,聚类可以包括基于每种蛋白质的一个或多个特征对蛋白质进行分组。在一些情况下,聚类可以包括基于每种蛋白质的一种或多种标记物对蛋白质进行分组。在一些情况下,聚类可以包括基于蛋白质的数字表示中的欧几里德坐标对蛋白质进行分组。在一些情况下,聚类可以包括基于蛋白质结构基团或功能基团(例如,来自蛋白质数据库如蛋白质数据库(Protein Data Bank)或CATH蛋白质结构分类数据库的蛋白质结构、子结构或功能基团)对蛋白质进行分组。在一些情况下,蛋白质结构基团或功能基团可以包括蛋白质一级结构、二级结构、三级结构或四级结构。在一些情况下,蛋白质结构基团或功能基团可以至少部分地基于α螺旋、β折叠、具有不同性质(例如,脂肪族、芳香族、亲水性、酸性、碱性等)的氨基酸的相对分布、结构家族(例如,TIM桶和β桶折叠)、蛋白质结构域(例如,死亡效应结构域)。在一些情况下,蛋白质结构基团或功能基团可能至少部分地基于功能或空间性质(例如,功能基团–免疫球蛋白、细胞因子、细胞骨架蛋白等的群组)。
自动化系统
本公开中的一些方法和组合物可以与自动化系统集成。将组合物和方法集成到自动化系统中的优点在于,可以简化实验,节省用户时间并提高研究、临床或应用环境中的效率。自动化系统可以提供实验的可重复性、更快的周转时间以及研究者和临床医生之间更好的交流,共享使用自动化系统可以遵循的有用协议。自动化系统可以被工程改造成并行运行大量实验,可以实现高通量方法,并且可以用于为本文描述的一些机器学习方法生成数据。
用于测定生物样本的自动化系统可以包括:包括干组合物的基底,该干组合物包括颗粒和支持剂;包括生物样本的样本储存单元;装载单元,其可操作地耦合到基底和样本储存单元;以及包括机器可执行代码的计算机可读介质,该机器可执行代码在由处理器执行时实现一种方法,该方法包括:(a)使用装载单元将生物样本或其一部分从样本储存单元转移到基底;(b)引导生物样本与干组合物接触,以产生包含多个生物分子或生物分子群组的生物分子冠状物。
基底可以包括本公开中所述的各种基底中的任何一种。在一些情况下,基底是单孔、多孔板、管、多管设备或微流体装置。在一些情况下,自动化系统可以包括多个多孔板。
基底可以包含本公开中所述的各种组合物中的任何一种或多种。在一些情况下,基底包含多种干组合物,其中包括在多种干组合物的单独干组合物中的颗粒的至少一个子集可以不同于另一个子集。在一些情况下,颗粒的至少一个子集可以在至少一种物理化学性质上不同于另一个子集。在一些情况下,多种干组合物包括至少两种干组合物,每种干组合物包括:二氧化硅涂覆的SPION、三胺官能化的纳米颗粒、PDMAPMA-聚合物官能化的纳米颗粒、葡萄糖-6-磷酸官能化的纳米颗粒、单胺官能化的纳米颗粒或其组合。在一些情况下,多孔板中的每个孔包括单独的干组合物。
自动化系统可以同时对不同的生物样本运行实验。在一些情况下,样本储存单元可以包括多个不同的生物样本。在一些情况下,转移生物样本可以包括将多个不同生物样本中的每一个转移到多孔板的不同孔中。
自动化系统可以对生物样本的不同部分运行实验。在一些情况下,生物样本包括多个部分。例如,一部分可以是分级分离的生物样本的级分。在一些情况下,一部分可以是组织样本的子部分或全血样本的级分(例如,血沉棕黄层的一部分)。在一些情况下,一部分可以是生物样本裂解物的上清液。可以将一部分生物样本转移到孔中。可以稀释一部分生物样本(例如,用水性缓冲液,如pH 6的磷酸盐缓冲液)。生物样本可以被稀释至少2倍、至少3倍、至少4倍、至少5倍、至少6倍、至少8倍、至少10倍、至少15倍或至少20倍。在一些情况下,转移可以由自动化系统同时执行。
自动化系统可以被配置为使生物样本与颗粒组合物接触不同的时间。在一些情况下,生物样本可以保持与颗粒组合物接触至少约10秒的时间段。在一些情况下,生物样本可以保持与干组合物接触至少约10秒的时间段。在一些情况下,该时间段为至少约1分钟。在一些情况下,该时间段为至少约5分钟。
自动化系统可以配置为添加步骤或移除各种实验步骤。自动化系统可以被配置为重排各种实验步骤。在一些情况下,自动化系统可以被配置为运行清洗步骤。例如,自动化系统可以被配置为在再悬浮的情况下清洗生物分子冠状物。在一些情况下,自动化系统可以被配置为运行在不进行再悬浮的情况下清洗生物分子冠状物的步骤。在一些情况下,自动化系统可以被配置为运行用于产生裂解物的步骤。例如,自动化系统可以超声或施加电场来裂解生物样本中存在的外泌体。在一些情况下,自动化系统可以被配置为运行用于还原裂解物的步骤。在一些情况下,自动化系统可以被配置为运行用于过滤裂解物的步骤。在一些情况下,自动化系统可以被配置为运行用于烷基化裂解物的步骤。在一些情况下,自动化系统可以被配置为运行用于使生物分子冠状物变性的步骤。在一些情况下,自动化系统可以被配置为运行利用逐步变性过程使生物分子冠状物变性的步骤。在一些情况下,自动化系统可以被配置为运行消化生物分子冠状物的步骤。消化步骤可以包括蛋白酶,如胰蛋白酶、胰凝乳蛋白酶、内切蛋白酶Asp-N、内切蛋白酶Arg-C、内切蛋白酶Lys-C、胃蛋白酶、嗜热菌蛋白酶、弹性蛋白酶、木瓜蛋白酶、蛋白酶K、枯草杆菌蛋白酶、梭菌蛋白酶、羧肽酶、组织蛋白酶C或其任何组合。消化步骤可以包括化学肽切割剂,如溴化氰。自动化系统可以被配置为运行一系列消化步骤,这些消化步骤可以包括不同的条件、蛋白酶或化学切割剂。消化步骤可以使用至多50ng/mL、至多100ng/mL、至多200ng/mL、至多500ng/mL、至多1μg/mL、至多2μg/mL、至多5μg/mL、至多10μg/mL、至多25μg/mL、至多50μg/mL、至多100μg/mL、至多200μg/mL或至多500μg/mL的蛋白酶。消化步骤可以利用至少500μg/mL、至少200μg/mL、至少100μg/mL、至少50μg/mL、至少25μg/mL、至少10μg/mL、至少5μg/mL、至少2μg/mL、至少1μg/mL、至少500ng/mL、至少200ng/mL、至少100ng/mL或至少50ng/mL的蛋白酶。在一些情况下,自动化系统可以被配置为运行用浓度为至少约200纳克/毫升(ng/mL)至约200微克/毫升(μg/mL)的胰蛋白酶消化生物分子冠状物的步骤。在一些情况下,自动化系统可以被配置为运行用浓度为至少约100微克/毫升(μg/mL)至约0.1g/L的胰蛋白酶消化生物分子冠状物的步骤。在一些情况下,自动化系统可以被配置为运行用浓度为至少约200纳克/毫升(ng/mL)至约200微克/毫升(μg/mL)的lysC消化生物分子冠状物的步骤。在一些情况下,自动化系统可以被配置为运行用浓度为至少约20微克/毫升(μg/mL)至约0.02g/L的lysC消化生物分子冠状物的步骤。在一些情况下,消化步骤进行至多3小时。在一些情况下,消化步骤进行至多1小时。在一些情况下,消化步骤进行至多30分钟。在一些情况下,消化步骤产生平均质量为至少1000Da、至少2000Da、至少3000Da、至少4000Da、至少5000Da、至少6000Da、至少8000Da或至少10000Da的肽。在一些情况下,消化步骤产生平均质量为至多10000Da、至多8000Da、至多6000Da、至多5000Da、至多4000Da、至多3000Da、至多2000Da或至多1000Da的肽。在一些情况下,消化步骤产生平均质量为约1000Da至约4000Da的肽。在一些情况下,消化步骤之前是从生物分子冠状物中洗脱生物分子或生物分子群组的至少一个子集,例如使得生物分子或生物分子群组在溶液中被消化。洗脱可以包括稀释、加热、物理扰动、化学试剂添加(例如,温和的离液剂)或其任何组合。
在一些情况下,自动化系统可以被配置为洗脱生物分子冠状物或生物分子冠状物的一部分(例如,从颗粒中选择性洗脱生物分子冠状物的软部分,同时保留吸附到颗粒的生物分子冠状物的硬部分)。在一些情况下,自动化系统可以被配置为对生物分子冠状物进行液相色谱法。在一些情况下,自动化系统可以被配置为从生物样本的一部分中分离一部分干组合物。在一些情况下,自动化系统可以被配置为使用磁场从生物样本的一部分中分离一部分干组合物。在一些情况下,自动化系统可以被配置为运行蛋白质组实验。在一些情况下,自动化系统可以被配置为运行基因组实验。在一些情况下,自动化系统可以被配置为运行蛋白质组学实验。在一些情况下,自动化系统可以被配置为运行质谱实验。在一些情况下,自动化系统可以被配置为运行测序实验。
自动化系统可以被配置为在各种温度下运行各种实验步骤。在一些情况下,自动化系统可以被配置为在约-20、-19、-18、-17、-16、-15、-14、-13、-12、-11、-10、-9、-8、-7、-6、-5、-4、-3、-2、-1、0、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99或100℃下运行实验步骤。
自动化系统可以被配置为在各种持续时间内运行各种实验步骤。在一些情况下,自动化系统可以被配置为运行实验步骤至少约1、2、3、4、5、6、7、8、9、10、15、20、30、40、50或60分钟。在一些情况下,自动化系统可以被配置为运行实验步骤至少约1、2、3、4、5、6、7、8、9或10小时。在一些情况下,自动化系统可以被配置为运行实验步骤至多约1、2、3、4、5、6、7、8、9、10、15、20、30、40、50或60分钟。在一些情况下,自动化系统可以被配置为运行实验步骤至多约1、2、3、4、5、6、7、8、9或10小时。
在一些情况下,洗脱步骤可以包括用至多约2x体积的溶液洗脱。在一些情况下,洗脱步骤可以包括用至多约4x体积的溶液洗脱。在一些情况下,洗脱步骤可以包括用至多约8x体积的溶液洗脱。在一些情况下,洗脱步骤可以包括用至多约16x体积的溶液洗脱。在一些情况下,洗脱包括稀释。稀释可以为不超过20倍、不超过10倍、不超过8倍、不超过5倍、不超过2倍或不超过1.5倍稀释。洗脱可以包括物理扰动,如加热、超声、摇动或搅拌。在一些情况下,洗脱包括从颗粒中释放完整的生物分子(例如,完整的蛋白质)。
在一些情况下,自动化设备可以进行固相提取。固相提取可以从试剂(例如,蛋白酶)、生物大分子和超分子生物结构(例如,核糖体和部分细胞壁)以及不适于下游分析的物种(例如,与液相色谱柱不相容的分析物)中分离分析物(例如,从生物分子冠状物蛋白消化的肽)。在一些情况下,固相提取利用包括TF、iST或C18的固相提取板。固相提取可以在高于大气压下进行。压力可以为至少25磅每平方英寸(psi)、至少约50psi、至少约100psi、至少约200psi、至少约300psi、至少约400psi或至少约500psi。在一些情况下,固相提取步骤可以包括以至多约10、20、30、40、50、60、70、80、90或100psi从固相提取板上洗脱。在一些情况下,固相提取步骤可以包括以至少约10、20、30、40、50、60、70、80、90或100psi从固相提取板上洗脱。
自动化系统可以包括使用条形码的集合来鉴定生物样本、干组合物、实验步骤、基底、基底内的分区或容积(例如,塑料器皿基底)或试剂。自动化系统可以被配置为至少部分地基于基底(例如,板件)条形码来转移基底。例如,自动化系统可以将多孔板从加热器转移到磁体阵列,以固定在多孔板的容积中容纳的磁性颗粒。自动化系统可以被配置为至少部分地基于干组合物条形码来转移干组合物。自动化系统可以被配置为至少部分地基于生物样本条形码来转移生物样本。自动化系统可以被配置为在基底的分区或容积之间转移样本和/或试剂。自动化系统可以被配置为至少部分地基于试剂条形码来转移试剂。自动化系统可以被配置为至少部分地基于实验步骤条形码来设置实验步骤。
在一些情况下,条形码可以包括关于塑料器皿、颗粒、试剂、试剂盒、发明人管理系统、自动化系统、板布局或其任何组合的信息。
在一些情况下,自动化系统可以与客户实验室信息管理系统(LIMS)、库存管理系统、MS机器、个人计算机、云、互联网或其任何组合通信。
在一些情况下,自动化系统可以传送条形码、条形码信息、板布局、实验日志、MS文件、生物样本信息、蛋白质组或基因组测定的分析结果或其任何组合。
计算机系统
本公开提供了被编程以实施本公开的方法的计算机系统。图60示出了计算机系统6001,其被编程或以其他方式被配置为例如使一个或多个生物样本与一种或多种颗粒接触以形成一个或多个生物分子冠状物,并使用蛋白质组方法、基因组方法或两者来分析该一个或多个生物分子冠状物。
计算机系统6001可以调节本公开的分析、计算和生成的各个方面,如例如,使一个或多个生物样本与一种或多种颗粒接触以形成一个或多个生物分子冠状物,并使用蛋白质组方法、基因组方法或两者来分析该一个或多个生物分子冠状物。计算机系统6001可以是用户的电子装置或者相对于电子装置位于远程的计算机系统。电子装置可以是移动电子装置。电子装置可以包括无线键盘和鼠标。电子装置可以包括显示器支架(例如,Hamiltonarm)。
计算机系统6001包括中央处理单元(CPU,在本文中也被称为“处理器”和“计算机处理器”)6005,其可以为单核或多核处理器,或用于并行处理的多个处理器。计算机系统6001还包括存储器或存储器位置6010(例如,随机存取存储器、只读存储器、闪存存储器)、电子存储单元6015(例如,硬盘)、用于与一个或多个其他系统通信的通信接口6020(例如,网络适配器)、以及外围装置6025,如高速缓存、其他存储器、数据存储器和/或电子显示适配器。存储器6010、存储单元6015、接口6020和外围装置6025通过如主板的通信总线(实线)与CPU 6005通信。存储单元6015可以是用于存储数据的数据存储单元(或数据储存库)。借助于通信接口6020,计算机系统6001可以可操作地耦合到计算机网络(“网络”)6030。网络6030可以是因特网、互联网和/或外联网、或者与因特网通信的内联网和/或外联网。
在一些情况下,网络6030为电信网络和/或数据网络。网络6030可以包括一个或多个计算机服务器,其可以实现分布式计算,如云计算。例如,一个或多个计算机服务器可以使网络6030(“云”)上的云计算能够执行本公开的分析、计算和生成的各个方面,如例如,使一个或多个生物样本与一种或多种颗粒接触以形成一个或多个生物分子冠状物,并使用蛋白质组方法、基因组方法或两者来分析该一个或多个生物分子冠状物。此类云计算可以由云计算平台提供,如例如亚马逊网络服务(AWS)、微软Azure、谷歌云平台和IBM云。网络6030,在一些情况下借助于计算机系统6001,可以实现对等网络,这可以使耦合到计算机系统6001的装置能够充当客户端或服务器。
CPU 6005可以包括一个或多个计算机处理器和/或一个或多个图形处理单元(GPU)。CPU 6005可以执行一系列机器可读指令,这些指令可以在程序或软件中体现。指令可以存储在存储器位置如存储器6010中。这些指令可以指向CPU 6005,其可以随后编程或以其他方式配置CPU 6005来实现本公开的方法。由CPU 6005执行的操作的实例可以包括获取、解码、执行和写回。
CPU 6005可以为如集成电路等电路的一部分。系统6001的一个或多个其他部件可以包括在电路中。在一些情况下,电路是专用集成电路(ASIC)。
存储单元6015可以存储文件,如驱动程序、库和保存的程序。存储单元6015可以存储用户数据,例如,用户偏好和用户程序。在一些情况下,计算机系统6001可以包括一个或多个在计算机系统6001外部的附加数据存储单元,如位于通过内联网或因特网与计算机系统6001通信的远程服务器上。
计算机系统6001可以通过网络6030与一个或多个远程计算机系统通信。例如,计算机系统6001可以与用户的远程计算机系统通信。远程计算机系统的实例包括个人计算机(例如,便携式PC)、平板或平板PC(例如,iPad、Galaxy Tab)、电话、智能电话(例如,iPhone、支持Android的装置、)或个人数字助理。用户可以经由网络6030访问计算机系统6001。
如本文所述的方法可以通过存储在计算机系统6001的电子存储位置上(如例如,存储在存储器6010或电子存储单元6015上)的机器(例如,计算机处理器)可执行代码来实施。机器可执行或机器可读代码可以以软件的形式提供。在使用期间,代码可以由处理器6005执行。在一些情况下,代码可以从存储单元6015中检索,并被存储在存储器6010中,以备处理器6005访问。在一些情况下,可以排除电子存储单元6015,并且机器可执行指令被存储在存储器6010上。
可以对代码进行预编译和配置,以供具有适于执行代码的处理器的机器使用,或者可以在运行时间期间进行编译。代码可以以编程语言来提供,该编程语言可以被选择为使得代码能够以预编译的方式或按原样编译的方式执行。
本文提供的系统和方法的各方面,如计算机系统6001,可以通过编程实现。该技术的各个方面可以被认为是“产品”或“制造的制品”,其通常为机器(或处理器)可执行代码和/或相关数据的形式,这些代码和/或相关数据被承载在一种类型的机器可读介质中或在一种类型的机器可读介质中体现。机器可执行代码可以被存储在电子存储单元如存储器(例如,只读存储器、随机存取存储器、闪存存储器)或硬盘上。“存储”型介质可以包括计算机、处理器等的任何或所有有形存储器,或其相关模块,如各种半导体存储器、磁带驱动器、磁盘驱动器等,它们可以在任何时候为软件编程提供非暂时性存储。软件的全部或部分有时可以通过因特网或各种其他电信网络进行通信。此类通信例如可以使得能够将软件从一台计算机或处理器加载到另一台计算机或处理器中,例如从管理服务器或主计算机加载到应用服务器的计算机平台中。因此,可以承载软件元件的另一种类型的介质包括光波、电子波和电磁波,如通过有线和光陆线网络以及通过各种空中链路跨本地装置之间的物理接口使用的。承载此类波的物理元件,如有线或无线链路、光链路等,也可以被认为是承载软件的介质。如本文所用,除非限于非暂时性的有形“存储”介质,否则如计算机或机器“可读介质”等的术语是指参与向处理器提供指令以供执行的任何介质。
因此,机器可读介质(如计算机可执行代码)可以采取多种形式,包括但不限于有形存储介质、载波介质或物理传输介质。非易失性存储介质包括例如光盘或磁盘,如任何计算机等中的任何存储装置,如可以用于实现数据库等,如附图中所示。易失性存储介质包括动态存储器,如此类计算机平台的主存储器。有形传输介质包括同轴电缆;铜线和光纤,包括构成计算机系统内的总线的导线。载波传输介质可以采取电信号或电磁信号的形式,或者声波或光波的形式,如在射频(RF)和红外(IR)数据通信期间产生的声波或光波。因此,计算机可读介质的常见形式包括例如:软盘(floppy disk)、软磁盘(flexible disk)、硬盘、磁带、任何其他磁介质、CD-ROM、DVD或DVD-ROM、任何其他光学介质、穿孔卡纸带、任何其他具有孔图案的物理存储介质、RAM、ROM、PROM和EPROM、FLASH-EPROM、任何其他存储芯片或盒、传输数据或指令的载波、传输此类载波的电缆或链路、或者计算机可以从中读取程序代码和/或数据的任何其他介质。许多这些形式的计算机可读介质可能涉及将一个或多个指令的一个或多个序列传送到处理器以用于执行。
计算机系统6001可以包括电子显示器6035或与其通信,电子显示器包括用户界面(UI)6040,用于提供,例如,使一个或多个生物样本与一种或多种颗粒接触以形成一个或多个生物分子冠状物,并使用蛋白质组方法、基因组方法或两者分析该一个或多个生物分子冠状物。UI的实例包括但不限于图形用户界面(GUI)和基于网络的用户界面。
本公开的方法和系统可以通过一种或多种算法实施。在由中央处理单元6005执行时,算法可以通过软件来实现。该算法可以例如使一个或多个生物样本与一种或多种颗粒接触以形成一个或多个生物分子冠状物,并使用蛋白质组方法、基因组方法或两者来分析该一个或多个生物分子冠状物。
除非另有定义,否则本文使用的所有技术术语具有与本发明所属领域的普通技术人员通常理解的相同的含义。如在本说明书和所附的权利要求中所用,单数形式“一个(a)、“一种(an)”和“该(the)”包括复数指代物,除非上下文中另有明确规定。除非另有说明,否则本文中提及“或”旨在涵盖“和/或”。
每当术语“至少”、“大于”或“大于或等于”在一系列两个或更多个数值中的第一个数值之前时,术语“至少”、“大于”或“大于或等于”适用于该系列数值中的每个数值。例如,大于或等于1、2或3相当于大于或等于1、大于或等于2或大于或等于3。
每当术语“不超过”、“小于”、“小于或等于”或“至多”在一系列两个或更多个数值中的第一个数值之前时,术语“不超过”、“小于”或“小于或等于”或“至多”适用于该系列数值中的每个数值。例如,小于或等于3、2或1相当于小于或等于3、小于或等于2或小于或等于1。
在值被描述为范围的情况下,应当理解,此类公开包括此类范围内所有可能的子范围的公开,以及落入此类范围内的具体数值,无论具体数值或具体子范围是否明确陈述。
实施例
以下实施例为说明性的并且不限制本文所述的装置、方法、系统和试剂盒的范围。
实施例1
蛋白质和核酸的平行分析
该实施例描述了蛋白质和核酸的平行分析。获得生物样本。任选地,生物样本被分成两部分。部分样本与颗粒接触。颗粒将来自样本的蛋白质(和其他生物分子)吸附到其表面,以形成生物分子冠状物。将颗粒从样本中分离出来。生物分子被胰蛋白酶化。通过质谱法来分析胰蛋白酶化的肽,并鉴定肽的特性和浓度。
平行地,样本的另一部分与用于测序的试剂接触,该试剂包括衔接子、标记的核苷酸(用光学可检测的标记物标记)、引物、聚合酶。接触可以发生在用于测序的基底上。样本中的核酸被扩增,例如通过PCR扩增被扩增。对用于测序的样本或基底进行成像,并确定样本中核酸的序列。
将如通过蛋白质冠状物分析确定的样本中蛋白质的组成和浓度与如通过测序确定的样本中核酸的组成和浓度进行比较。这些比较与来自对照来源(例如,健康生物学状态)的样本和来自已知实验来源(例如,疾病生物学状态)的样本相关。基于样本中存在的蛋白质和核酸,使用经训练的分类器和机器学习算法对样本的生物学状态进行分类。基于样本中存在的蛋白质(如通过冠状物分析所确定的)和样本中存在的核酸(如通过测序所确定的)来确定经测定的样本的生物学状态。
实施例2
蛋白质和核酸的平行分析
该实施例描述了对来自患有早期和晚期非小细胞肺癌(NSCLC)的对象的样本的蛋白质组学分析。鉴定蛋白质变体(如同种型)可能是蛋白质组分析中的一个主要挑战。通常,能够鉴定蛋白质的方法无法察觉微小的序列变异(如单氨基酸取代)。
在本实施例中,对来自患有早期和晚期NSCLC的对象的29个血浆样本平行进行基于外显子的测序和蛋白质组分析。对于蛋白质组分析,血浆样本被分配并分别与表2中所示的并且大小(如通过动态光散射“DLS”所确定的)、多分散性指数(“PDI”,如通过DLS所确定的)和平均ζ电势各不相同的十种不同类型的SPION接触。含有颗粒的样本经受多次洗涤循环,然后暴露于适合洗脱与颗粒结合的蛋白质的条件。洗脱的蛋白质被消化并进行质谱分析,从而产生蛋白质组数据。
表2–用于NSCLC样本分析的颗粒
跨10个样本鉴定了总共1189种蛋白质。此外,在每个样本中鉴定了肽变异(包含单氨基酸取代)。图2A总结了从每个样本中鉴定的蛋白质变异的数量。跨29份血浆样本平均鉴定出约70种肽变异,其中来自单独的样本的数量在略高于50到略低于125的范围内。
图2图B提供了基于基因组和蛋白质组数据的蛋白质变体鉴定的实例。在一个样本中,基因组分析鉴定了KLKB1基因的杂合性,该KLKB1基因编码蛋白质——前激肽释放酶。样本含有KLKB1的参考等位基因和编码甘氨酸到精氨酸取代的次要等位基因,由图2图B中圈出的红色氨基酸表示。虽然外显子测序鉴定出0.01%的次要等位基因频率,但蛋白质组分析鉴定出对应于参考等位基因和次要等位基因的前激肽释放酶形式,这证明基因组图谱可以允许从复杂样本中辨别蛋白质变体。
实施例3
蛋白质和核酸的平行分析
在该实施例中,基因组和蛋白质组分析用于确定来自健康患者和癌症患者的样本中骨形态发生蛋白1(BMP1)变体的存在。可变剪接在RNA水平上导致七种BMP1变体,并且在蛋白质水平上导致四种变体。在这些蛋白质变体中,两种是BMP1蛋白质的长形式,并且两种是BMP1蛋白质的短形式。同时的基因组和蛋白质组分析允许对80名健康患者和61名早期非小细胞肺癌患者的四种BMP1蛋白变体进行定量。
蛋白质组分析是通过使每个样本与颗粒组接触,消化收集在颗粒上的蛋白质,并通过质谱法分析所得的肽片段来进行的。来自141名对象的血浆样本用一组具有不同物理化学性质的5种SPIONS进行询问(总结于表3)。来自每个对象的血浆样本在TE缓冲液中稀释,与2.5-15mg/ml来自5SPION组的每种颗粒以1:1混合,并在37℃下温育1小时,导致血浆蛋白质冠状物的形成。在颗粒收集和洗涤步骤后,在颗粒上消化蛋白质冠状物,以用于LC-MS/MS分析。
表3–用于早期NSCLC和健康样本分析的颗粒
对于BMP1,鉴定了总共7个肽片段。这些肽被映射到4种被鉴定为来自对象的编码转录物的同种型,并提供这4种同种型中的每一种的部分覆盖。图3A提供了4种经鉴定的BMP1同种型的外显子-内含子结构。最长的同种型,BMP-202(图3A,顶部),含有所有7个检测到的BMP1肽片段。第二长的同种型,BMP-201(图3A,从上数第二个),含有7个片段中的6个。两个较短的同种型,BMP-204和BMP-203(图3A,底部两行),仅含有肽片段1和2。图3B提供了健康和早期NSCLC血浆样本中七个BMP1肽片段的归一化的质谱强度,其中两个在NSCLC中更丰富并且五个在健康对照中更丰富。
该实施例证明了组合的核酸(例如,转录物鉴定)和蛋白质(例如,肽丰度)分析可以被组合用于鉴定和定量样本中存在的肽同种型。
实施例4
蛋白质和核酸的平行分析
该实施例涵盖来自健康和癌症患者的样本中翻译后修饰的鉴定。翻译后修饰可以在蛋白质活性、信号传导和体内平衡方面产生重大变化。因此,表征蛋白质序列而不鉴定翻译后活性的技术可能会错过鉴定生物学状态所需的关键信息。例如,尽管肝素辅因子2的过度表达在癌症发展中可以起作用,但是其磷酸化状态也可以指示许多疾病的存在和阶段。
在该实施例中,测量了从早期和晚期肺癌患者、健康患者和共病对照中收集的14个样本中磷酸化的肝素辅因子2与非磷酸化的肝素辅因子2的比率。图4示出了在四种样本类型中磷酸化的与未磷酸化的比率(图4中的“修饰比率”)。如从图中可以看出,肝素辅因子2磷酸化在健康患者中比肺癌患者中高。然而,最显著的差异是在早期肺癌患者和晚期肺癌患者之间,其中晚期肺癌样本包括低多倍的肝素辅因子2磷酸化。结果表明,组合的蛋白质和翻译后修饰分析能够实现疾病状态和疾病阶段的诊断。
实施例5
基于颗粒的蛋白质组分析中的肽信号多样性
该实施例涵盖了基于颗粒的蛋白质组分析中的信号多样性和再现性。蛋白质组学方法的诊断能力通常与每个靶蛋白获得的信号数量相关。这部分地是由于跨不同蛋白质家族的保守序列基序,这可以导致不同的蛋白质在分析期间产生相似的信号。因此,针对特定蛋白质获得的信号中的仅一小部分可以用于鉴定该蛋白质。此外,增加针对单个蛋白质获得的信号的数量可以增加该蛋白质的序列覆盖程度。因此,为靶蛋白产生更多信号的方法更有可能鉴定该蛋白质内的序列变异,并且可以在不同的患者样本中提供更高程度的可重复性。
本实施例提供了一种蛋白基因组测定,其能够在患者的不同集合(例如,具有不同健康概况的患者的群体)中可重复地鉴定数千种蛋白质,从而能够对多种疾病和病况进行准确诊断。使用5颗粒组和质谱法分别分析了来自健康和早期非小细胞肺癌(NSCLC)患者的集合的141份血浆样本的蛋白质含量。图8A总结了61名早期NSCLC患者和80名健康患者的对象分布。血浆样本首先在由10mM Tris、1mM乙二胺四乙酸二钠(EDTA)、150mM氯化钾和0.05%的3-((3-胆酰胺丙基)二甲基氨基)-1-丙磺酸酯(CHAPS)组成的缓冲液中以1:5稀释。通过超声处理和在去离子水中涡旋来重构以干燥的粉末形式提供的包含5种颗粒的纳米颗粒混合物,并将其与稀释的血浆样本以1:1(体积比体积)混合。然后将混合物密封,并在37℃下以300rpm摇动温育一小时。在温育后,将颗粒从上清液中磁性分离出来。对结合到纳米颗粒上的蛋白质进行胰蛋白酶消化,并通过LC-MS/MS分析所得的肽片段。
在所有对象中检测到总共2499个蛋白质群组,其中在至少25%的对象中检测到1992个蛋白质群组。图8B总结了在研究中不同百分比的对象中检测到的蛋白质群组的数量。约50%的检测到的蛋白质可以在70%的对象群体中被共同鉴定,而约80%的检测到的蛋白质在约25%的群体中被共同检测。因此,从研究的群体中选择的任何两个NSCLC患者都可能共享超过1000个经鉴定的蛋白质群组。约500种蛋白质(在研究中鉴定的蛋白质群组的20%)在所有患者中被共同鉴定。
图9示出了被鉴定的并与每种经鉴定的蛋白质相关的肽片段的数量。对于在测定中鉴定的蛋白质,鉴定了在1至大于30个肽的范围内的高斯样分布,其中对于从样本中鉴定的每种蛋白质,鉴定了平均约12个肽片段。大多数蛋白质是基于10个或更少的肽鉴定的,其中许多蛋白质对应于5个或更少的经鉴定的肽。
这些结果表明,为来自样本的蛋白质鉴定的每种蛋白质鉴定的肽的数量通常遵循统计分布。一些蛋白质被该测定完全覆盖,而其他蛋白质基于少量(例如,3个或更少)的肽被鉴定。为特定蛋白质或蛋白质群组鉴定的肽的数量可以取决于测定方法,如蛋白酶、蛋白酶类或用于使蛋白质片段化的化学试剂。因此,可以定制一种方法以获得感兴趣的特定蛋白质的高肽计数。
实施例6
基于颗粒的蛋白质组分析中的肽信号多样性
该实施例涵盖了患者群体中的等位基因检测和频率。外显子测序用于生成29名对象的个性化质谱搜索文库。在对象群体中检测到总共464种氨基酸变体。对含有这些变体的蛋白质的分析表明,在至少178个独立的基因中存在推定的等位基因特异性。
图10提供了在所研究的29名对象中鉴定的464种蛋白质变体的替代等位基因频率计数(y轴)(黑线,1010),以及通过2504名个体的全基因组测序鉴定的超过108种变体的等位基因频率(亮线,1020)。两个数据集的频率分布之间的对应程度证明了本方法的无偏性质。
图11提供了在研究中鉴定的464个等位基因的密度图1110和被鉴定为显示等位基因特异性表达的变体的密度图1120,等位基因特异性表达表示在具有该基因型的所有对象中,一种或多种肽仅映射到参考等位基因或仅映射到替代等位基因而不映射到两者的情况。如从图中可以看出,等位基因特异性表达表现出了低频率等位基因的流行率增加,表明这些基因型特异性等位基因的潜在功能。
实施例7
基于颗粒的蛋白质组分析中的肽信号多样性
该实施例涵盖蛋白质同种型鉴定。来自80名健康对象和61名早期非小细胞肺癌对象的血浆样本用表3中总结的5颗粒组进行询问。简而言之,来自患者的血浆样本在含有1mMNa2(EDTA)、150mM KCl和0.05% CHAPS的10mM Tris缓冲液中以1:5稀释。将100种纳米颗粒(每种颗粒类型约2.5-15mg/ml)与稀释的生物样本以1:1混合,密封,并在37℃下在300rpm摇动的情况下温育1小时。将颗粒从上清液中磁性分离,洗涤,然后经受胰蛋白酶化条件以用于颗粒上蛋白质消化。用20分钟的LC梯度通过LC-MS/MS分析洗脱的肽。
对在141个样本中鉴定的1992种鉴定的蛋白质进行过滤,以选择在来自健康或早期病例的至少50%对象中存在的蛋白质,并搜索在对照和癌症之间具有不同丰度的肽(p<0.05;Benjamini-Hochberg校正)。为了鉴定NSCLC相关蛋白质同种型,对1992种鉴定的蛋白质进行了筛选,以区分至少一种具有明显较低的健康血浆丰度的肽与至少一种具有明显较高的健康血浆丰度(相对于早期NSCLC丰度)的肽的蛋白质。该方法在图12A中概述,该图描绘了一种假定的蛋白质,其具有来自LC-MS/MS分析的7个检测到的肽片段。虽然四个肽片段的血浆丰度在健康和早期NSCLC群组中不变,但其中3种肽(在虚线框内并用***表示)在健康或早期NSCLC样本中更普遍,表明它们属于在早期NSCLC中具有增强的或抑制的表达的同种型。
鉴定了总共16种具有差异早期NSCLC同种型表达的蛋白质(总结于表4中)。图12B通过开放靶标肺癌协会评分(Open Target lung carcinoma association score)对蛋白质命中进行排序。七种蛋白质(表4“高”)具有高于0.3的开放靶标评分,因此已知与肺癌相关,而九种蛋白质具有低于0.1的低开放靶标评分,表明与肺癌的已知关联很少或没有关联。这九种蛋白质(表4“低”)构成了通过差异同种型分析发现的新的肺癌生物标志物。
表4–具有不同NSCLC同种型丰度的蛋白质
图12C使用来自人类血浆蛋白质组项目的浓度,通过已知血浆蛋白质丰度绘制了16种鉴定的NSCLC蛋白质。十六种经鉴定的蛋白质中有十五种具有已知的血浆丰度,并且在人血浆浓度中跨越大约5个数量级,其中补体C4-A(P0C0L4)和载脂蛋白B(APOB)具有接近100μg/ml的最高浓度,并且骨形态发生蛋白1具有约1ng/ml的最低浓度(血浆浓度比白蛋白低超过7个数量级)。因此,本公开的方法能够区分蛋白质同种型,甚至是来自生物样本的稀有蛋白质。本实施例还证明了这些方法可以用于基于差异同种型表达来鉴定生物标志物,而与总蛋白表达水平无关。
实施例8
基于颗粒的蛋白质组分析中的肽信号多样性
该实施例说明了单样本水平的蛋白质变体检测。蛋白质组数据的复杂性可能限制其用于区分相似物种的效用,如单一蛋白质的变体形式。因此,许多高通量技术,如数据依赖性采集质谱(DDA-MS),通常被认为不适用于复杂的样本分析。将基于颗粒的样本分级分离与核酸分析相结合从多个角度解决了该问题,简化了来自此类努力的数据和数据分析。
对来自健康患者、共病患者、早期非小细胞肺癌(NSCLC)患者和晚期非小细胞肺癌患者的血浆样本的组合的蛋白质和核酸分析阐明了464种肽变体。样本获自4名健康患者、11名共病患者、5名早期NSCLC患者和9名晚期NSCLC患者。来自每个对象的血浆样本用颗粒组(例如,如实施例7中概述的表3的5颗粒组)分级分离,并用DDA-MS询问。从翻译的患者基因组产生的患者特异性蛋白质组文库指导来自DDA-MS数据的肽变体鉴定。
图13概述了在29名对象的每一个中鉴定的蛋白质变体的总数。在该图中,每个条描绘了在单个对象中检测到的蛋白质变体的数量。在对象群体中鉴定了总共464种肽变体,其中每个对象的变体数量在约50至约150的范围内。这464种变体映射至表4中概述的16种肺癌相关候选蛋白质中的7种,即APOB、COL6A3、FERMT3、FLNA、ITIH1、PRG4和TLN1。
图14提供了针对7种肺癌相关候选蛋白质在每个对象中鉴定的变体蛋白质的数量。每个条代表在单个对象中针对给定的肺癌相关候选蛋白质鉴定的变体的数量。结果表明,组合的核酸和生物分子冠状物分析可以产生无偏的和深入的血浆蛋白质组概况,其使得能够以足以用于群体规模蛋白质组研究的规模鉴定血浆中存在的蛋白质变体和肽。
实施例9
形成冻干珠
该实施例说明了将包含颗粒的制剂冻干成冻干珠。将包含颗粒和赋形剂的制剂的固定体积的液滴在液氮中快速冷冻,然后冻干。制剂中颗粒的浓度在18.75mg/mL至75mg/mL的范围内。液滴的体积在30μL至40μL的范围内。在不会对制剂产生不利影响的情况下,液滴的体积可以减少到低至2μL或高达60μL。使用了各种赋形剂,包括蔗糖、d-甘露醇、海藻糖及其组合。赋形剂的浓度在约100mg/mL至160mg/mL的范围内。75mg/mL的颗粒浓度和40μL的液滴体积对应于每个液滴约3mg颗粒。在不会对制剂产生不利影响的情况下,颗粒的浓度可以降低到低于18.75mg/mL或高于75mg/mL。将冻干珠单独包装在具有干燥剂的PCR条带中,以用于将来使用。可以将合适数量的磁预装载到管中。
对冻干珠进行实验以评估其稳定性。图54A-54B示出了批次S-003-121的粒径的稳定性和颗粒平均ζ电势的实验测量结果。在冻干后,冻干珠的子集在37℃下保持至多12天,并且冻干珠的另一个子集在60℃下保持多12天。在1天、2天、5天、6天和12天后,在水中重构颗粒,并且用动态光散射(DLS)测量直径,并用Malvern ZetaSizer NanoZS测量平均ζ电势。图55和图56分别示出了以下各种制剂的尺寸测量结果和平均ζ电势测量结果:S-118-103、S-118-104、S-118-109、S-128-064、S-128-066、S-229-055、S-229-056和S-229-057。在下表5中列出了批号和相应的制剂。
表5.冻干制剂
重构冻干珠的子集,并使用它们进行测定,以测量蛋白质群组计数和肽计数。图57示出了四种不同条件的结果。对于标准组,使用标准浓度的颗粒液体组。对于条件12,将冻干珠与40μL水混合,以产生每种颗粒的纳米颗粒浓度,然后与40μL的血浆接触。对于液体Lyo对照,将用于生产冻干珠的相同液体材料组合物(即,未经冻干)与40μL的血浆接触。在条件4下,将40μL的血浆直接加入到干燥的冻干珠中,而不添加水。在匹配标准MS注射浓度(在4μL缓冲液中约500ng肽)的同时进行每次MS分析。实验结果示出了各种条件之间的一致性。液体Lyo对照和条件12(在重构的情况下使用冻干珠)的表现在统计学上等同于标准组。条件4(冻干珠,未重构,直接接触血浆)检测到在统计学上与标准组相当的数量的肽群组,然而,与标准组相比,它还检测到更多的肽(具有统计学显著性,n=10)。
实施例10
自动化系统
该实施例说明了自动化系统(仪器)用于蛋白基因组学方法的使用。图34示出了流水线,其包括提供各种可消耗材料(例如,纳米颗粒制剂、溶剂、试剂等),使用自动化系统进行测定,使用质谱仪产生测定结果,然后使用数据分析软件分析结果并将结果显示给用户。
下文描述了在自动化系统上实施的示例性方法,该自动化系统包括有包括机器可执行代码的计算机可读介质。(1)用户(即操作者)准备样本(例如,通过解冻冷冻的样本)、试剂(例如,稀释试剂)和颗粒(例如,重构冻干珠)。将准备好的样本、试剂和颗粒装载到自动化系统中。然后,自动化系统从这一点开始自动地执行实验步骤,包括:(2)在5分钟内执行装置初始化(底盘、MPE2、Hamilton加热器振荡器(HHS)、Inheco CPAC),(3)在5分钟内执行将样本移液至测定板,(4)在15分钟内执行将颗粒移液至测定板,(5)在60分钟内执行在37℃下温育,(6)在30分钟内执行测定板洗涤,(7)在10分钟内执行将裂解、还原和烷基化缓冲液加入到测定板,(8)在10分钟内在HHS上执行在95℃下的温育,(9)在20分钟内执行测定板在室温下的冷却,(10)在8分钟内执行胰蛋白酶/LysC酶的添加,(11)在180分钟内执行在37℃下用HHS温育,(12)在3分钟内执行加入终止溶液,(13)在5分钟内执行颗粒下拉,(14)在8分钟内执行使用MPE2上的SPE板处理样本,(15)在8分钟内执行使用MPE2上的SPE板用Wash A处理样本,(16)在8分钟内执行使用MPE2上的SPE板用Wash B-1处理样本,(17)在8分钟内执行使用MPE2上的SPE板用Wash B-2处理样本,和(18)在5分钟内执行使用MPE2上的SPE板洗脱样本。(19)用户然后可以在实验结束后清理自动化系统。实验的总持续时间为约7小时。
前述一系列实验步骤可以包括额外步骤,可以排除一些步骤,或者可以在每个步骤中具有变化。图40示出了可以在自动化系统上实施的方法的实例,但具有变化。这些变化可以被实现为使得用户可以选择要使用哪种变化。例如,在步骤(1)中可以存在变化,其中用户可以稀释样本(例如,血浆样本高达其原始体积的20倍),选择不同的体积用于测定(例如,从40μL到100μL的任何体积),将样本解冻到特定温度(例如,室温或4℃),单重或多重纳米颗粒(例如,每个分区2、3、4、5个或任何数量的纳米颗粒),或对样本进行干扰步骤(例如,溶血/脂质浓缩)。在一些情况下,除蛋白质以外的生物分子的背景可能会根据颗粒的物理化学性质改变蛋白质冠状物。在一些情况下,生物分子的背景也可能形成生物分子冠状物的一部分。在一些情况下,干扰步骤可以包括以不同浓度滴定不同浓度的某些生物分子(例如,脂质)。
在任何温育步骤中可以存在变化,其中温育的持续时间可以变化(例如,5分钟或过夜),被温育的溶液的pH可以变化(例如,3.8、5.0或7.4的pH),被温育的溶液的离子强度可以变化(例如,0、50或150mM),并且被温育的溶液的摇动速率可以变化(例如,0、150或300RPM)。
在任何洗涤步骤中可以存在变化,其中溶液中的一些或所有成分可以再悬浮或可以不再悬浮。溶液中的一些或所有成分可以被分离,例如,通过施加磁场来捕获磁性颗粒。
在裂解、还原或烷基化步骤中可以存在变化,其中可以发生逐步变性。溶液的温度可以变化(例如,50℃或95℃)。可能存在这样的步骤,其中蛋白质或肽被消化,例如,通过使用各种浓度的胰蛋白酶(标准量的胰蛋白酶的1X、2X浓度)持续各种持续时间(例如,3小时或过夜)被消化。在一些情况下,与蛋白质的质量相比,胰蛋白酶的标准量可以在胰蛋白酶质量的约1/10至约1/100的范围内。蛋白质或肽可以以逐步方式被消化,例如,通过使用胰蛋白酶/LysC被消化。
在洗脱步骤中可以存在变化。洗脱体积可以变化(例如,75、150或300μL),可以在各种压力(从0到50psi的任何压力)下提供清洁干燥的空气(CDA)或氮气,可以使用不同类型的固相提取(SPE)板(例如,Thermal Fisher SPE板、iST、C18或其他基底)。
图38示出了可以用于自动化系统的板布局。测定板包括两列(每列对应于每个样本5个纳米颗粒),加上用于对照的额外的列。测定板包括8行,其中每行可以填充有样本。图39示出了自动化系统的平台(deck)布局。平台包括许多模块,每个模块都配备有服务或执行特定的功能。在下表6中列出了不同模块的列表及其描述。
在一些情况下,自动化系统可以被配置为运行对照实验。图41示出了板的布局,其中一些分区被指定为用于运行对照实验。因为本文所述的一些方法包括多个不同的步骤,所以对照实验可以被设计为指示一个步骤或一组步骤的成功/失败。对照实验可以包括过程对照实验(PC3+S-003,标记为AC)、消化对照实验(PC3(1:5稀释),标记为DC)、MPE2对照实验(肽混合物,标记为CC)和质谱对照实验(肽混合物,标记为MC)。如图40所示,这些对照实验可以被配置为在实验的某些步骤中或在这些步骤之间运行。MPE2可以是自动化系统的部件,该自动化系统可以用于在过滤板上驱动正压。在一些情况下,MPE2可以指受监控的多流正压蒸发提取模块(Hamilton)。
表6.用于自动化系统的模块
在一些情况下,自动化系统可以被配置为一次运行8至16个样本。生物样本(即生物流体)中的生物分子可以用每份样本5种不同的方法进行测量。可以对多种生物流体进行测量,生物流体包括血浆、细胞提取物和裂解物。测量可以自动完成,并在7-8小时内完成,其中肽可以随时注入到液相色谱(LC)或MS中以用于检测。无偏测量允许减少LC/MS时间,并且这些测量可以不受LC/MS检测器或方法的限制,例如:在Sciex 6600+上使用DIA SWATH(非数据依赖性采集)方法时每种级分不超过30分钟的梯度长度(样本到样本),和/或在Thermo Orbitrap Lumos上使用DDA(数据依赖性采集)方法时每种级分不超过1小时的梯度长度。DIA SWATH(非数据依赖性采集)和DDA(数据依赖性采集)是MS的模式,并且在分析肽的方式和基于MS原始数据通过计算重构蛋白质的方式上有所不同。因为可以对完整的蛋白质进行测量,所以测量可以揭示实验数据中的蛋白质-蛋白质相互作用。
在一些情况下,自动化系统可以包括96孔板,其可以容纳用5纳米颗粒询问的高达16个样本。在一些情况下,所需的样本体积的量可以小于或等于240μL或40μL。在一些情况下,试剂可以在4℃下储存超过9个月或在室温下储存超过6个月同时保持稳定性。在一些情况下,测定可以在7小时内运行。在一些情况下,MS实验的运行时间可以在120分钟以内。在一些情况下,可以使用ScanningSWATH运行MS实验。在一些情况下,ScanningSWATH可以指短梯度(低至几分钟)的快速MS采集模式。在一些情况下,ScanningSWATH可以指使用扫描四极杆的快速MS采集模式。在一些情况下,ScanningSWATH可以使用Sciex timTOF快速IMS-IMS,这可以涉及离子迁移率分离,并且可以涉及基于离子电荷/偶极和形状性质的离子的预先分离。在一些情况下,自动化系统可以包括分析工具,包括可视化(例如,群组分析,PCA)工具或质量控制工具,它们可以被集成到基于云的计算系统中。在一些情况下,在自动化系统上实施的蛋白质检测方法可以显示出比浅血浆方法高5x的优势(即,检测到的蛋白质群组的数量上的优势)和比耗竭的血浆方法高3x的优势。在一些情况下,在自动化系统上实施的蛋白质检测方法在精度上可以比公开的数据集(例如,Geyer等人,Mol.Syst.Biol.,13,942(2017))具有5%的改进(较低CV)。
进行了一项使用自动化系统测量测定通过率的研究。使用图41所示的基底对一组400个生物样本进行实验。在单独的孔(对于总共2000个孔)中使每个生物样本与5种颗粒组合物接触。
图42示出了三个自动化系统的实验结果。在三个自动化系统中的每一个上进行相同的实验组,并且结果是等同的。肽群组计数和肽计数在统计学上是相等的(n=10)。对于每个自动化系统,血浆的深度作为通过数据库强度排序的血浆蛋白质的函数产生了几乎相同的结果。
图43示出了在多个板上用两种不同的自动化系统(系统1和系统2)进行的对照实验的集合(即,过程对照、消化对照、MPE2对照和质谱对照)的结果。基于检测到可接受数量的肽的孔的总数计算孔通过率/产率。测定通过率/产率是基于生物样本的总数计算的,对于这些生物样本,针对具有不同颗粒组成的所有5个孔检测到可接受数量的肽。约99.9%的实验(孔通过率/产率,即由孔计算的百分比)和约99.5%的实验(测定通过率/产率,即由样本计算的百分比)被成功进行,此外,系统1和系统2之间的结果几乎相同。在这些情况下,一小部分不成功(即异常值)实验失败的根本原因被确定为是由于试剂载体位置。
图44示出了使用自动化系统对来自NSCLC研究的样本进行的实验的结果。存在14个样本,它们跨越不同的疾病类别、部位和质量。在ThermoFischer(TF)Lumos MS(DDA)上使用通过自动化系统处理的板对样本进行实验。在14个样本中的25%中观察到(鉴定出)1810个蛋白质群组,在14个样本中的任何一个中有总共2334个蛋白质群组。2334个蛋白质群组的量比在消化的纯血浆基线中发现的量多6.1x。用单独的血浆进行的实验始终比用纳米颗粒组进行的实验检测到更少数量的蛋白质群组。根据样本,用纳米颗粒组进行的实验比仅使用血浆进行的实验检测到的结果大2.74倍至6.65倍。下表7列出了每个样本及其描述。
表7.用于NSCLC研究的样本描述。
实施例11
数据架构
图45和图46示意性说明了用于管理平台的数据架构。该数据架构使得用户能够使用本文公开的平台的板,将来自多个平台的数据与由各种仪器(包括MS仪器)和自动化系统产生的数据集成。如图45所示,集成的数据被自动加载到数据架构中,该数据架构存储和操纵数据以在计算装置、平台和仪器(例如,MS)之间传送适当的信息。
数据架构利用条形码来促进实验过程和数据管理过程。该数据架构从含有生物样本的试剂盒(4501)接收条形码(4502),该条形码传达了关于当用试剂盒内的样本进行实验时要遵循的特定方法的信息。条形码(4502)传达在分析实验结果时要执行的特定分析。条形码(4502)将板布局(4506)信息传送到客户实验室信息系统(LIMS,4508)。条形码(4502)向库存管理系统(4503)传达要使用哪些材料的信息。
数据架构协调各种仪器和系统,以执行本文公开的一些方法。元数据(例如,接收试剂盒的日期、从何人处接收试剂盒、以及实验日志文件)和输出数据(实验结果)通过适当的通道进行通信,使得系统和装置(例如,蛋白质分析平台(4504)、MS(4509)、个人计算机(4512)、客户LIMS(4508))。数据架构可以通过数字通信通道协调实验和分析。质谱(4509)结果(4510)可以被传递到云(4513)。该数据架构允许用户将来自多个仪器(4504)的数据与通过运行本公开的塑料器皿产生的数据集成。包括实验结果、历史和其他元数据的日志文件(4505)被发送到云(4513)。在云(4513)上分析实验的结果以产生基因组或蛋白质组信息(4511),该信息被传递给客户LIMS(4508)。
在另一实施例中,如图46所示,试剂盒(4601)的条形码与各种制品相关联,如塑料器皿(4602)、纳米颗粒(4603)、试剂(4604)、试剂盒(4605)。条形码可以用于通过库存管理系统(4606)跟踪这些制品的库存。条形码也可以用于本文公开的各种方法中的任何一种的质量控制和/或故障诊断。条形码可以被传送到自动化系统(4607)以用于协调测定。
自动化系统(4607)还从客户LIMS(4612)接收样本条形码(4614),并将板布局(4611)传送给客户LIMS。自动化系统还将日志文件(其可以捕获实验历史、结果等)传送到互联网(4609),在互联网上日志系统存储(4610)日志文件。客户LIMS(4613)可以将实验信息传送到LC-MS机器(4613)以生成数据,该数据被接收回客户LIMS(4613)。客户LIMS将MS文件(4616)、MS文件名和板布局(4615)传送到云(4618)。客户LIMS还将样本信息(4617)传送到云(4618)。
实施例12
分析和GUI
该实施例描述了各种分析方法和用于执行或显示分析方法的结果的图形元素。
图47说明了包括一组按钮的图形用户界面(GUI),用户可以与其进行交互。如图47所示的GUI可以通过安装到自动化系统中的膝上型电脑、智能手机或计算机来访问。
图48和图49说明了可以并入到流水线的各种分析工具,如本文所述。分析工具包括用于列出实验的数据屏幕(4801)(例如,用于所用的样本、样本体积、所用的颗粒、仪器、MS方案的列),示出2种颗粒相对于特定样本和条件的蛋白质群组计数和肽强度分布的图(4802),示出在不同条件和条件的子集下发现的蛋白质群组重叠的扰乱图(4803),发现的蛋白质相对于它们的参考丰度映射的图(4804),示出在不同条件下两种颗粒的肽定量结果的图(4805),对照监视器(4901),以及聚类算法和可视化(4902)。在一些情况下,分析工具可以在GUI上显示一个或多个图形元素。在一些情况下,分析工具可以包括用于分析翻译后修饰、序列变体、差异外显子、蛋白质-蛋白质相互作用或其任何组合的工具。
实施例13
从原始质谱数据确定生物分子丰度
质谱信号强度通常取决于许多因素,包括分析物结构、样本条件和方法(例如,电离方法、色谱梯度的长度)。因此,来源于单一样本的两种分析物(例如,单一蛋白质的片段)可能产生不同的质谱信号强度,这种现象通常被称为“飞行能力”。在没有时间和资源密集型的掺入、校准系列或标记实验的情况下,这种固有的信号变化通常使得信号强度比较和分析物丰度确定不可行。
该实施例提供了一种通过比较多个样本之间的信号强度来确定飞行能力值,然后使用这些飞行能力值来确定样本中生物分子的绝对丰度的方法。虽然前述实施例涉及两种生物分子(例如,两种蛋白质变体),但是该方法可以扩展到任何数量的生物分子,只要生物分子(1)共享共同的信号并且(2)每个生物分子都包括独特的信号(即,不与来自其他物种的信号重叠)。例如,该方法可以用于确定共享共同信号且各自具有独特信号的6种唾液酸的丰度。此外,该方法可以扩展到生物分子的群组,如包括共享共同序列的多种蛋白质同种型或类别的等位基因。
在该实施例中,共享共同杂合等位基因‘A’和等位基因‘Aref’和等位基因‘Aalt’的三个个体提交了用于质谱分析的血浆样本。两个等位基因共享共同的信号,并且每个等位基因都具有独特的信号。假设每个信号的飞行能力是线性的,每个等位基因(Aalt和Aref)的丰度和杂合等位基因A的总丰度可以被表示为它们的飞行能力和相关信号强度的乘积。例如,如果Aalt与对应于肽P1和P2的信号S1和S2相关联,并且Aref与对应于肽P1和P3的信号S1和S3相关联,那么Aalt的丰度可以被表示为S2强度和P2飞行能力的乘积,Aref的丰度可以被表示为S3强度和P3飞行能力的乘积,并且Aalt和Aref的组合的丰度(杂合等位基因A的总丰度)可以被表示为S1强度和P1飞行能力的乘积。
可以假设飞行能力在三个样本之间是恒定的。因此,如果与Aalt、Aref和A相关联的信号的强度在三个样本之间变化,则可以唯一地确定每个信号的飞行能力值。由于丰度A、Aalt和Aref是飞行能力和信号强度的乘积,A、Aalt和Aref的丰度可以由单独的质谱数据确定,并且无需进一步的样本操作或校准数据。
实施例14
使用颗粒的深度和广度的蛋白质组覆盖
生物样本(例如,血浆)中的蛋白质可以包括宽的浓度范围或动态范围。即使在其中高丰度蛋白质的量减少的样本(例如,耗竭的血浆)中,深入地检测蛋白质(高丰度蛋白质和低丰度蛋白质两者)和广泛地检测蛋白质(以对某些蛋白质的最小选择性偏差检测多种蛋白质)也可能是具有挑战性的。本实施例显示了基于颗粒的蛋白质组测定对蛋白质组提供深度和广泛覆盖的能力。
图21示出了MS强度、在不使用本公开的纳米颗粒的情况下在耗竭的血浆中检测到的MS强度、使用本公开的5种纳米颗粒的组在耗竭的血浆中检测到的复合(例如,组合)MS强度、以及在各自使用本公开的5种纳米颗粒中的一种在耗竭的血浆中检测到的5个独立MS强度的数据库的图。对于本研究,使用了来自141名患有NSCLC的对象的血浆样本。蛋白质按数据库中MS强度的等级排序。如果蛋白质存在于至少25%的样本中,则绘制蛋白质。在综合图中,颜色强度表示来自5种不同纳米颗粒的最高检测值。综合图显示,纳米颗粒更完整地检测了可用血浆蛋白质的整个光谱。同时,与耗竭的血浆的直接MS分析相比,每种单独的纳米颗粒还检测到更多的蛋白质。单独的纳米颗粒能够测定几乎血浆蛋白质组的整个范围。在一些情况下,可以优化纳米颗粒的组以覆盖蛋白质组的整个范围或蛋白质组的特定部分。使用纳米颗粒在耗竭的血浆上进行的MS实验可能能够检测到不太丰富的蛋白质和/或更完整地检测到蛋白质组。
实施例15
对象样本之间的等位基因分布
该实施例涵盖用质谱法检测变体蛋白质。使用下表8中概述的10颗粒组对来自不同对象的29个样本进行质谱生物分子冠状物分析。使用个性化质谱搜索文库从29名对象中检测到总共464种肽变体。然后根据变体是杂合的还是纯合的(对于参考等位基因或替代等位基因),对在464种肽变体中捕获的遗传变体进行分箱。
表8–用于外显子组搜索文库引导的分析的颗粒组
图61总结了与对应于参考(每个图中的右条,“ref”)或替代(每个图中的左条,“alt”)等位基因变体的杂合(每个图中的中心条,“het”)和纯合等位基因相对应的检测到的遗传变体的计数。每个图对应于独特的样本,其中这些图共同覆盖了29个样本中的每一个。如从图中可以看出,组合的基因组和蛋白质组检测方法能够观察和区分纯合和杂合的等位基因表达。大多数样本示出了杂合等位基因的丰度高于纯合等位基因。
图62图A提供了基于如gnomAD人类参考基因组联盟的在29个样本中观察到的464种肽的替代等位基因频率的直方图。图62图B总结了被分组到跨越10%增量的分箱中的替代等位基因频率。虽然大多数替代等位基因基于它们的频率被适当地注释,但观察到的肽中的89种对应于“替代”等位基因频率高于“参考”等位基因频率的等位基因。为了通过共性将变体分层,图63通过将纯合等位基因重新注释为具有大于0.1的相对频率的主要形式(每个图的中心列,'>')和具有小于或等于0.1的相对频率的次要形式(每个图中的最左列,'<=')来校正这种差异。如从这些图中可以看出,外显子组序列引导的蛋白质组分析分辨了低频率和高频率的纯合等位基因。
图64总结了检测到的替代等位基因频率小于0.01的单氨基酸多态性变体。图64A提供了列出五种检测到的变体的表格,其中第2列提供了检测到的突变,第3列示出了检测到变体的对象的数量,并且第4列提供了每种变体的基因名称。图64B-图64F提供了29个样本中“参考”(上)和“替代”(下)形式的相对计数。图64G-图64K提供了29个样本中“参考”(右)和“替代”(左)变体形式的相对质谱强度。如从这些图中可以看出,等位基因丰度在不同的变体形式之间可能不同。例如,对于SERPINA1(数据在图64C和图64H中示出),在其中检测到等位基因表达的样本中,等位基因的“替代”形式比“参考”形式丰富近一个数量级。相反,对于APOB(数据在图64E和图64J中示出),在其中检测到等位基因表达的样本中,“参考”形式比“替代”形式具有高约1个数量级的丰度。
图65A-图65B示出了29个样本中检测到的杂合等位基因之间的重叠。图65A提供了按计数排序的肽的集合。如从图中可以看出,大多数高计数群组对应于单个样本,表明对于每个样本都检测到独特的杂合等位基因。图65B提供了按重叠程度排列的肽的集合。如从该图中可以看出,在29个样本中的超过7个样本中未检测到两种肽的集合。
图66A-图66B示出了对于替代等位基因频率小于0.5的变体肽,在29个样本中检测到的纯合等位基因之间的重叠。图67A-图67B示出了对于替代等位基因频率大于0.5的变体肽,在29个样本中检测到的纯合等位基因之间的重叠。如从图中可以看出,许多变体肽对每个对象都是独特的,而少数变体肽在许多对象之间是共享的。
虽然在本文中已经示出和描述了本公开的优选实施方案,但对本领域技术人员而言将显而易见的是,此类实施方案仅作为实例提供。在不脱离本公开的情况下,本领域技术人员将会想到许多变化、改变和替换。应当理解,在实践本公开时,可以采用本文所述的本公开的实施方案的各种替代方案。所附权利要求旨在限定本公开的范围,并且由此覆盖这些权利要求及其等同物的范围内的方法和结构。
编号的实施方案
本文设想的实施方案包括实施方案1至390。
实施方案1.一种用于分析来自对象的生物样本的方法,其包括:(a)测定来自所述对象的所述生物样本,以鉴定所述生物样本中的蛋白质,从而获得所述生物样本的蛋白质组信息;(b)分析来自所述生物样本的核酸分子,以鉴定所述生物样本的基因型信息;和(c)基于所述蛋白质组信息和所述基因型信息,鉴定所述对象的肽变体或基因组变体,其中所述肽变体或所述基因组变体无法分别在(a)或(b)中以其他方式鉴定。
实施方案2.根据实施方案1所述的方法,其中所述生物样本包括全血、血浆、血沉棕黄层、血清、尿液、脑脊液、滑液、泪液、唾液、全血、奶汁、乳头抽吸物、针抽吸物、导管灌洗液、阴道分泌物、鼻液、耳液、胃液、胰液、小梁液、肺灌洗液、汗液、沟液、精液、前列腺液、痰、粪便、支气管灌洗液、来自拭子的液体、支气管抽吸物、流化固体、细针抽吸样本、组织匀浆、淋巴液、细胞培养样本或其任何组合。
实施方案3.根据实施方案1或2所述的方法,其中所述生物样本包括血浆或血清。
实施方案4.根据实施方案1-3中任一者所述的方法,其中所述生物样本包括超过5000种类型的蛋白质。
实施方案5.根据实施方案1-4中任一者所述的方法,其中(a)包括使所述生物样本经受鉴定所述生物样本中所述多种蛋白质的测定。
实施方案6.根据实施方案1-5中任一者所述的方法,其中(a)包括在足以将所述蛋白质从所述生物样本吸附到颗粒的条件下,使所述生物样本与所述颗粒接触。
实施方案7.根据实施方案6所述的方法,其中所述蛋白质在所述颗粒上具有压缩的动态范围。
实施方案8.根据实施方案6或7所述的方法,其中吸附到所述颗粒的所述蛋白质包括一种或多种蛋白质,所述一种或多种蛋白质具有与所述生物样本中的丰度相比更低的丰度。
实施方案9.根据实施方案6-8中任一者所述的方法,其中所述颗粒的每平方毫米(mm2)表面积吸附至少10-9毫克(mg)所述蛋白质。
实施方案10.根据实施方案6-9中任一者所述的方法,其中所述颗粒包括具有不同物理化学性质的多种颗粒。
实施方案11.根据实施方案10所述的方法,其中所述不同的物理化学性质包括尺寸、形状、表面官能化、芯材、密度或其任何组合。
实施方案12.根据实施方案10或11中任一者所述的方法,其中由所述多种颗粒中的第一颗粒吸附的所述蛋白质的第一蛋白质子集包括与由所述多种颗粒中的第二颗粒吸附的所述蛋白质的第二蛋白质子集共有的至多80%的蛋白质类型。
实施方案13.根据实施方案1-12中任一者所述的方法,其中所述蛋白质包括至少5种类型的蛋白质。
实施方案14.根据实施方案1-13中任一者所述的方法,其中所述蛋白质包括至少200种类型的蛋白质。
实施方案15.根据实施方案1-14中任一者所述的方法,其中所述蛋白质包括至少500种类型的蛋白质。
实施方案16.根据实施方案1-15中任一者所述的方法,其中所述蛋白质包括至少1000种类型的蛋白质。
实施方案17.根据实施方案1-16中任一者所述的方法,其中所述蛋白质包括至少2000种类型的蛋白质。
实施方案18.根据实施方案1-17中任一者所述的方法,其中所述蛋白质包括至少5000种类型的蛋白质。
实施方案19.根据实施方案1-13中任一者所述的方法,其中所述蛋白质包括5至1000种类型的蛋白质。
实施方案20.根据实施方案1-13和19中任一者所述的方法,其中所述蛋白质包括20至200种类型的蛋白质。
实施方案21.根据实施方案1-20中任一者所述的方法,其中所述蛋白质占所述生物样本中所述蛋白质类型的至少2%。
实施方案22.根据实施方案1-20中任一者所述的方法,其中所述蛋白质占所述生物样本中所述蛋白质类型的0.2%至2%。
实施方案23.根据实施方案1-22中任一者所述的方法,其中(a)包括鉴定所述生物样本中所述蛋白质的丰度。
实施方案24.根据实施方案1-23中任一者所述的方法,其中(c)包括基于所述蛋白质组信息和所述基因型信息鉴定所述蛋白质的剪接变体、构象、翻译后修饰、辅因子关联或基底关联。
实施方案25.根据实施方案1-24中任一者所述的方法,其中所述蛋白质在所述生物样本中的浓度跨越至少4个数量级。
实施方案26.根据实施方案1-25中任一者所述的方法,其进一步包括获得所述核酸分子的序列以鉴定所述基因型信息。
实施方案27.根据实施方案26所述的方法,其中所述获得所述序列包括荧光原位杂交(FISH)、阵列比较基因组杂交(阵列-CGH)、定量荧光PCR(QF-PCR)、纳米孔测序、杂交测序、合成测序、连接测序或其任何组合。
实施方案28.根据实施方案1-27中任一者所述的方法,其中所述核酸分子包括无细胞脱氧核糖核酸(cfDNA)、无细胞核糖核酸(cfRNA)或其任何组合。
实施方案29.根据实施方案28所述的方法,其中所述无细胞脱氧核糖核酸(cfDNA)包括基因组DNA、线粒体DNA(mtDNA)、循环肿瘤DNA(ctDNA)或其任何组合。
实施方案30.根据实施方案28或29所述的方法,其中(b)包括将所述核酸分子鉴定为包括基因组DNA、线粒体DNA(mtDNA)、循环肿瘤DNA(ctDNA)或其任何组合。
实施方案31.根据实施方案30所述的方法,其中(b)包括鉴定所述ctDNA的细胞类型、癌症类型、癌症阶段或其任何组合。
实施方案32.根据实施方案31所述的方法,其中(c)的所述鉴定包括所述鉴定所述ctDNA的所述细胞类型、所述癌症类型或所述癌症阶段。
实施方案33.根据实施方案28所述的方法,其中所述无细胞核糖核酸(cfRNA)包括信使RNA(mRNA)、长非编码RNA、端粒酶RNA、Piwi相互作用RNA、核糖体RNA(rRNA)、小核RNA(snRNA)、小干扰RNA(siRNA)、YRNA、微小RNA(miRNA)、环状RNA、小核仁RNA(snRNA)、假基因RNA、转移RNA(tRNA)或其任何组合。
实施方案34.根据实施方案33所述的方法,其中(b)包括将所述核酸分子鉴定为包括信使RNA(mRNA)、长非编码RNA、端粒酶RNA、Piwi相互作用RNA、核糖体RNA(rRNA)、小核RNA(snRNA)、小干扰RNA(siRNA)、YRNA、微小RNA(miRNA)、环状RNA、小核仁RNA(snRNA)、假基因RNA、转移RNA(tRNA)或其任何组合的序列。
实施方案35.根据实施方案1-34中任一者所述的方法,其中所述核酸分子来源于外泌体、凋亡体、肿瘤细胞、健康细胞、病毒体、胞外膜囊泡、嗜中性粒细胞胞外陷阱(NET)或其任何组合。
实施方案36.根据实施方案35所述的方法,其中(b)包括鉴定所述核酸分子来源于外泌体、凋亡体、患病细胞、健康细胞、病毒体、胞外膜囊泡、嗜中性粒细胞胞外陷阱(NET)或其任何组合。
实施方案37.根据实施方案36所述的方法,其中(b)包括鉴定所述样本来源于的生物体中所述健康细胞或所述患病细胞的凋亡率或流行率。
实施方案38.根据实施方案36或37中任一者所述的方法,其中(b)包括鉴定所述健康细胞或所述患病细胞的丰度。
实施方案39.根据实施方案36-38中任一者所述的方法,其中(b)包括鉴定所述健康细胞或所述患病细胞的细胞类型。
实施方案40.根据实施方案39所述的方法,其进一步包括鉴定与所述细胞类型相关联或来源于所述细胞类型的蛋白质的子集。
实施方案41.根据实施方案40所述的方法,其中(c)的所述鉴定包括所述鉴定与所述细胞类型相关联或来源于所述细胞类型的所述蛋白质的子集。
实施方案42.根据实施方案1-41中任一者所述的方法,其进一步包括鉴定所述蛋白质的化学修饰。
实施方案43.根据实施方案42所述的方法,其中所述肽变体或所述基因组变体包括所述化学修饰。
实施方案44.根据实施方案42或43中任一者所述的方法,其进一步包括至少部分地基于所述化学修饰来鉴定所述样本的生物学状态。
实施方案45.根据实施方案1-44中任一者所述的方法,其中所述分析所述核酸分子包括获得序列读数并将所述序列读数相对于参考序列进行比对,以鉴定所述基因型信息。
实施方案46.根据实施方案1-45中任一者所述的方法,其中所述分析所述核酸分子包括鉴定所述核酸分子的化学修饰。
实施方案47.根据实施方案46所述的方法,其中所述鉴定所述肽变体或所述基因组变体包括所述鉴定所述核酸分子的所述化学修饰。
实施方案48.根据实施方案46或47中任一者所述的方法,其进一步包括至少部分地基于所述化学修饰来鉴定所述来源细胞的生物学状态。
实施方案49.根据实施方案1-48中任一者所述的方法,其进一步包括基于所述蛋白质组信息和所述基因型信息确定所述生物样本具有生物学状态的概率。
实施方案50.根据实施方案1-49中任一者所述的方法,其中(b)包括使所述核酸分子经受鉴定所述生物样本的所述基因型信息的分析。
实施方案51.一种用于分析来自对象的生物样本的方法,其包括:(a)分析来自所述对象的所述生物样本中的核酸分子,以鉴定所述核酸分子来源于的细胞类型;和(b)定量所述生物样本中与所述细胞类型相关联的多种蛋白质的蛋白质丰度。
实施方案52.根据实施方案51所述的方法,其中所述生物样本包括全血、血浆、血沉棕黄层、血清、尿液、脑脊液、滑液、泪液、唾液、全血、奶汁、乳头抽吸物、针抽吸物、导管灌洗液、阴道分泌物、鼻液、耳液、胃液、胰液、小梁液、肺灌洗液、汗液、沟液、精液、前列腺液、痰、粪便、支气管灌洗液、来自拭子的液体、支气管抽吸物、流化固体、细针抽吸样本、组织匀浆、淋巴液、细胞培养样本或其任何组合。
实施方案53.根据实施方案51或52所述的方法,其中所述生物样本包括血浆或血清。
实施方案54.根据实施方案51-53中任一者所述的方法,其中所述生物样本包括超过1000种类型的蛋白质。
实施方案55.根据实施方案51-54中任一者所述的方法,其进一步包括获得所述核酸分子的序列以鉴定所述基因型信息。
实施方案56.根据实施方案55所述的方法,其中所述获得所述序列包括荧光原位杂交(FISH)、阵列比较基因组杂交(阵列-CGH)、定量荧光PCR(QF-PCR)、纳米孔测序、杂交测序、合成测序、连接测序或其任何组合。
实施方案57.根据实施方案50-56中任一者所述的方法,其中所述分析所述核酸分子包括鉴定所述核酸分子的化学修饰。
实施方案58.根据实施方案57所述的方法,其中所述化学修饰包括甲基化、去甲基化、胺化、脱氨基化、乙酰化、氧化、氧合、还原或其任何组合。
实施方案59.根据实施方案57或58中任一者所述的方法,其中所述鉴定所述核酸分子来源于的所述细胞类型至少部分地基于所述化学修饰的所述鉴定。
实施方案60.根据实施方案51-59中任一者所述的方法,其中所述分析鉴定了所述核酸分子的非标准核碱基。
实施方案61.根据实施方案60所述的方法,其中所述非标准核碱基包括次黄嘌呤、黄嘌呤、7-甲基鸟嘌呤、5,6-二氢尿嘧啶、5-甲基胞嘧啶或其任何组合。
实施方案62.根据实施方案60或61中任一者所述的方法,其中所述鉴定所述核酸分子来源于的所述细胞类型至少部分地基于所述非标准核碱基的所述鉴定。
实施方案63.根据实施方案51-62中任一者所述的方法,其中所述分析鉴定了所述核酸分子的转录后修饰。
实施方案64.根据实施方案63所述的方法,其中所述转录后修饰包括5’加帽、3’切割、3’聚腺苷酸化、剪接或其任何组合。
实施方案65.根据实施方案63或64中任一者所述的方法,其中所述鉴定所述核酸分子来源于的所述细胞类型至少部分地基于所述转录后修饰的所述鉴定。
实施方案66.根据实施方案51-65中任一者所述的方法,其中所述分析包括鉴定所述核酸的非翻译区。
实施方案67.根据实施方案66所述的方法,其中所述鉴定所述核酸分子来源于的所述细胞类型至少部分地基于所述非翻译区的所述鉴定。
实施方案68.根据实施方案61-67中任一者所述的方法,所述定量所述蛋白质丰度包括使所述生物样本与颗粒接触,从而在包括所述多种蛋白质的所述颗粒上形成生物分子冠状物。
实施方案69.根据实施方案68所述的方法,其中所述多种蛋白质包括所述生物分子冠状物内的压缩的动态范围。
实施方案70.根据实施方案68或69中任一者所述的方法,其中所述生物分子冠状物包括一种或多种高丰度蛋白质,所述高丰度蛋白质具有与所述生物样本中的丰度相比降低的丰度。
实施方案71.根据实施方案68-70中任一者所述的方法,其中所述生物分子冠状物包含每mm2所述颗粒表面积至少10-9mg所述多种蛋白质。
实施方案72.根据实施方案68-71中任一者所述的方法,其中所述颗粒包括有包括不同物理化学性质的多种颗粒。
实施方案73.根据实施方案72所述的方法,其中所述不同的物理化学性质包括尺寸、形状、表面官能化、芯材、密度或其任何组合。
实施方案74.根据实施方案72或73中任一者所述的方法,其中由所述多种颗粒中的第一颗粒吸附的所述多种蛋白质的第一蛋白质子集包括与由所述多种颗粒中的第二颗粒吸附的所述多种蛋白质的第二蛋白质子集共有的至多80%的蛋白质类型。
实施方案75.根据实施方案51-74中任一者所述的方法,其中所述多种蛋白质包括至少5种类型的蛋白质。
实施方案76.根据实施方案51-75中任一者所述的方法,其中所述多种蛋白质包括至少200种类型的蛋白质。
实施方案77.根据实施方案51-76中任一者所述的方法,其中所述多种蛋白质包括至少500种类型的蛋白质。
实施方案78.根据实施方案1-75中任一者所述的方法,其中所述多种蛋白质包括5至1000种类型的蛋白质。
实施方案79.根据实施方案1-75和78中任一者所述的方法,其中所述蛋白质包括20至200种类型的蛋白质。
实施方案80.根据实施方案51-79中任一者所述的方法,其中所述多种蛋白质占所述生物样本中所述蛋白质类型的至少2%。
实施方案81.根据实施方案51-79中任一者所述的方法,其中所述多种蛋白质占所述生物样本中所述蛋白质类型的0.2%至2%。
实施方案82.根据实施方案51-81中任一者所述的方法,其中所述多种蛋白质在所述生物样本中的浓度跨越至少4个数量级。
实施方案83.根据实施方案51-82中任一者所述的方法,其中所述定量所述蛋白质丰度包括鉴定所述多种蛋白质的剪接变体、构象、翻译后修饰、辅因子关联或基底关联。
实施方案84.根据实施方案83所述的方法,其中所述定量所述蛋白质丰度包括鉴定相对剪接变体丰度。
实施方案85.根据实施方案51-84中任一者所述的方法,其进一步包括至少部分地基于所述蛋白质丰度来鉴定所述血浆样本的生物学状态。
实施方案86.根据实施方案51-85中任一者所述的方法,其中所述核酸分子包括无细胞核酸。
实施方案87.根据实施方案86所述的方法,其中所述无细胞核酸包括无细胞脱氧核糖核酸(cfDNA)或无细胞核糖核酸(cfRNA)。
实施方案88.根据实施方案51-87中任一者所述的方法,其中(a)包括使所述核酸分子经受分析以鉴定所述细胞类型。
实施方案89.根据实施方案51-88中任一者所述的方法,其中(b)包括对所述生物样本中所述多种蛋白质的所述蛋白质丰度进行定量。
实施方案90.一种用于将来自对象的生物样本分级分离的方法,其包括:(a)使所述生物样本与多种颗粒接触,以在所述多种颗粒上形成生物分子冠状物,所述生物分子冠状物包含来自所述生物样本的蛋白质和核酸分子;和(b)从所述生物样本中分离所述生物分子冠状物的至少一个子集,从而分级分离所述生物样本。
实施方案91.根据实施方案90所述的方法,其中所述生物样本包括全血、血浆、血沉棕黄层、血清、尿液、脑脊液、滑液、泪液、唾液、全血、奶汁、乳头抽吸物、针抽吸物、导管灌洗液、阴道分泌物、鼻液、耳液、胃液、胰液、小梁液、肺灌洗液、汗液、沟液、精液、前列腺液、痰、粪便、支气管灌洗液、来自拭子的液体、支气管抽吸物、流化固体、细针抽吸样本、组织匀浆、淋巴液、细胞培养样本或其任何组合。
实施方案92.根据实施方案90或91所述的方法,其中所述生物样本包括血浆或血清。
实施方案93.根据实施方案90-92中任一者所述的方法,其进一步包括裂解外泌体、凋亡体、细胞、病毒体或其任何组合。
实施方案94.根据实施方案93所述的方法,其中所述生物分子冠状物的蛋白质或核酸来源于所述裂解。
实施方案95.根据实施方案90-94中任一者所述的方法,其中所述核酸分子包括无细胞核酸。
实施方案96.根据实施方案95所述的方法,其中所述核酸分子包括无细胞脱氧核糖核酸(cfDNA)或无细胞核糖核酸(cfRNA)。
实施方案97.根据实施方案96所述的方法,其中所述无细胞脱氧核糖核酸(cfDNA)包括基因组DNA、线粒体DNA(mtDNA)、循环肿瘤DNA(ctDNA)或其任何组合。
实施方案98.根据实施方案96或97所述的方法,其中所述无细胞核糖核酸(cfRNA)包括信使RNA(mRNA)、长非编码RNA、端粒酶RNA、Piwi相互作用RNA、核糖体RNA(rRNA)、小核RNA(snRNA)、小干扰RNA(siRNA)、YRNA、微小RNA(miRNA)、环状RNA、小核仁RNA(snRNA)、假基因RNA、转移RNA(tRNA)或其任何组合。
实施方案99.根据实施方案90-98中任一者所述的方法,其中所述生物分子冠状物的所述核酸分子包括至少30个核苷酸的平均长度。
实施方案100.根据实施方案90-99中任一者所述的方法,其中所述生物分子冠状物的所述核酸分子包括至少60个核苷酸的平均长度。
实施方案101.根据实施方案90-100中任一者所述的方法,其中所述生物分子冠状物的所述核酸分子具有与所述生物样本的核酸分子相比更大的平均长度。
实施方案102.根据实施方案90-101中任一者所述的方法,其中所述蛋白质包括至少5种类型的蛋白质。
实施方案103.根据实施方案90-102中任一者所述的方法,其中所述蛋白质包括至少200种类型的蛋白质。
实施方案104.根据实施方案90-103中任一者所述的方法,其中所述蛋白质包括至少500种类型的蛋白质。
实施方案105.根据实施方案90-104中任一者所述的方法,其中所述蛋白质包括至少1000种类型的蛋白质。
实施方案106.根据实施方案90-105中任一者所述的方法,其中所述蛋白质包括至少2000种类型的蛋白质。
实施方案107.根据实施方案90-106中任一者所述的方法,其中所述蛋白质包括至少5000种类型的蛋白质。
实施方案108.根据实施方案90-105中任一者所述的方法,其中所述蛋白质包括5至1000种类型的蛋白质。
实施方案109.根据实施方案90-102和108中任一者所述的方法,其中所述蛋白质包括20至200种类型的蛋白质。
实施方案110.根据实施方案90-109中任一者所述的方法,其中所述蛋白质占所述生物样本中蛋白质类型的至少2%。
实施方案111.根据实施方案90-109中任一者所述的方法,其中所述蛋白质占所述生物样本中蛋白质类型的0.2%至2%。
实施方案112.根据实施方案90-111中任一者所述的方法,其中所述蛋白质包括一种或多种高丰度蛋白质,所述高丰度蛋白质具有相对于所述生物样本中的丰度降低的丰度。
实施方案113.根据实施方案90-112中任一者所述的方法,其中来自所述蛋白质的蛋白质包括在所述生物样本中小于或等于约100ng/ml的浓度。
实施方案114.一种用于分析来自对象的生物样本的方法,其包括:(a)测定来自所述对象的所述生物样本中的蛋白质,以鉴定可归属于第一多种蛋白质或蛋白质片段的信号;(b)测定所述生物样本中的核酸分子以获得核酸序列数据,从而鉴定与所述核酸序列相关联的第二多种蛋白质或蛋白质片段;和(c)从所述第一多种蛋白质或蛋白质片段中鉴定所述生物样本中的一种或多种蛋白质,其中所述一种或多种蛋白质在缺少所述核酸序列数据的情况下是无法以其他方式鉴定的。
实施方案115.根据实施方案114所述的方法,其中所述生物样本具有小于或等于约500微升(μL)的体积。
实施方案116.根据实施方案114或115中任一者所述的方法,其中所述生物样本包括血浆或血清。
实施方案117.根据实施方案114-116中任一者所述的方法,其中所述测定所述蛋白质包括将所述蛋白质吸附到颗粒。
实施方案118.根据实施方案117所述的方法,其中相对于来自所述生物样本的高丰度蛋白质,所述将所述蛋白质吸附到所述颗粒富集了来自所述生物样本的低丰度蛋白质。
实施方案119.根据实施方案117或118中任一者所述的方法,其中所述将所述蛋白质吸附到所述颗粒压缩了所述蛋白质的动态范围。
实施方案120.根据实施方案114-119中任一者所述的方法,其中所述测定所述蛋白质包括质谱分析。
实施方案121.根据实施方案114-120中任一者所述的方法,其中所述测定所述蛋白质包括亲和捕获、组织学或其任何组合。
实施方案122.根据实施方案114-121中任一者所述的方法,其中所述测定所述蛋白质包括对所述蛋白质进行测序。
实施方案123.根据实施方案114-122中任一者所述的方法,其中所述测定所述蛋白质包括鉴定翻译后修饰。
实施方案124.根据实施方案123所述的方法,其中所述翻译后修饰包括酰化、烷基化、异戊烯化、黄素化、酰胺化、胺化、脱氨基化、羧化、脱羧、亚硝基化、甲酰化、瓜氨酸化、糖基化、糖化、卤化、羟基化、磷酸化、磺酰化、谷胱甘肽化、琥珀酰化、羰基化、氨基甲酰化、氧化、氧合、还原、泛素化、苏素化、拟素化或其任何组合。
实施方案125.根据实施方案114-124中任一者所述的方法,其中所述测定所述核酸分子包括荧光原位杂交(FISH)、阵列比较基因组杂交(阵列-CGH)、定量荧光PCR(QF-PCR)、纳米孔测序、杂交测序、合成测序、连接测序或其任何组合。
实施方案126.根据实施方案114-125中任一者所述的方法,其中所述测定所述核酸分子包括测序。
实施方案127.根据实施方案126所述的方法,其中所述鉴定所述第二多种蛋白质或蛋白质片段包括对所述核酸分子的编码区进行测序。
实施方案128.根据实施方案126或127中任一者所述的方法,其中所述鉴定所述第二多种蛋白质或所述蛋白质片段包括对所述核酸分子的非编码区进行测序。
实施方案129.根据实施方案114-128中任一者所述的方法,其中所述鉴定所述第二多种蛋白质或所述蛋白质片段包括鉴定与所述核酸分子中的核酸分子结合的蛋白质或蛋白质片段。
实施方案130.根据实施方案114-129中任一者所述的方法,其中(c)的所述鉴定包括鉴定一种或多种蛋白质同种型。
实施方案131.根据实施方案114-130中任一者所述的方法,其中所述一种或多种蛋白质指示所述生物样本中生物学状态或病况的存在或不存在。
实施方案132.根据实施方案131所述的方法,其中所述生物学状态或病况包括癌症。
实施方案133.根据实施方案132所述的方法,其中(c)的所述鉴定鉴定所述癌症的阶段。
实施方案134.根据实施方案114-133中任一者所述的方法,其中所述一种或多种蛋白质包括所述第一多种蛋白质中的蛋白质的同种型。
实施方案135.根据实施方案114-134中任一者所述的方法,其中所述鉴定包括鉴定与所述一种或多种蛋白质相关联的信号,并且所述信号与可归属于所述第一多种蛋白质的所述信号中的信号重叠。
实施方案136.一种用于处理来自对象的生物样本的方法,其包括:(a)测定来自所述对象的所述生物样本中的核酸分子,以获得所述核酸分子或其片段的核酸序列;(b)计算机处理所述核酸序列以产生数据,所述数据包括与所述核苷酸序列相关联的蛋白质的蛋白质序列;(c)测定所述生物样本中可归属于所述蛋白质的至少一个子集的信号;和至少部分地基于在(b)中产生的所述数据,从所述蛋白质的所述至少所述子集中鉴定蛋白质。
实施方案137.根据实施方案136所述的方法,其中所述测定所述核酸分子包括荧光原位杂交(FISH)、阵列比较基因组杂交(阵列-CGH)、定量荧光PCR(QF-PCR)、纳米孔测序、杂交测序、合成测序、连接测序或其任何组合。
实施方案138.根据实施方案136或137中任一者所述的方法,其中所述核酸分子包括无细胞脱氧核糖核酸(cfDNA)、无细胞核糖核酸(cfRNA)或其任何组合。
实施方案139.根据实施方案136-138中任一者所述的方法,其中所述测定所述核酸分子包括从外泌体、凋亡体、患病细胞、健康细胞、病毒体、胞外膜囊泡、嗜中性粒细胞胞外陷阱(NET)或其任何组合收集所述核酸分子的至少一个子集。
实施方案140.根据实施方案136-139中任一者所述的方法,其中与所述核苷酸序列相关联的蛋白质序列包括未被所述核酸序列编码的蛋白质。
实施方案141.根据实施方案136-140中任一者所述的方法,其中(c)的所述测定包括使所述生物样本与颗粒接触,从而在包括所述蛋白质的所述至少所述子集的所述颗粒上形成生物分子冠状物。
实施方案142.根据实施方案136-141中任一者所述的方法,其中(c)的所述测定包括质谱法、肽测序、肽亲和捕获、组织学、色谱法或其任何组合。
实施方案143.根据实施方案136-142中任一者所述的方法,其中所述蛋白质的所述至少所述子集包括至少20种蛋白质。
实施方案144.根据实施方案136-143中任一者所述的方法,其中所述蛋白质的所述至少所述子集包括至少200种蛋白质。
实施方案145.根据实施方案136-144中任一者所述的方法,其中所述蛋白质的所述至少所述子集包括至少500种蛋白质。
实施方案146.根据实施方案136-145中任一者所述的方法,其中可归属于所述蛋白质的所述至少所述子集的所述信号包括至少100,000个信号。
实施方案147.根据实施方案136-146中任一者所述的方法,其中可归属于所述蛋白质的所述至少所述子集的所述信号包括至少1,000,000个信号。
实施方案148.根据实施方案136-147中任一者所述的方法,其中所述鉴定包括从所述蛋白质的所述至少所述子集中鉴定剪接变体。
实施方案149.根据实施方案148所述的方法,其中所述鉴定所述剪接变体包括鉴定多个剪接变体的丰度比。
实施方案150.根据实施方案136-149中任一者所述的方法,其中所述蛋白质与所述生物样本中的生物学病况或状态相关联。
实施方案151.根据实施方案136-150中任一者所述的方法,其中可归属于所述蛋白质的所述至少所述子集的所述信号包括多个重叠信号,并且其中所述鉴定包括确定来自所述蛋白质的所述至少所述子集的蛋白质的所述多个重叠信号中的重叠信号的强度。
实施方案152.根据实施方案151所述的方法,其进一步包括从所述蛋白质的所述至少所述子集鉴定第一蛋白质和第二蛋白质的丰度比,其中所述第一蛋白质和所述第二蛋白质与所述多个重叠信号中的信号相关联。
实施方案153.根据实施方案151或152中任一者所述的方法,其中所述重叠信号中的信号包括质谱信号。
实施方案154.根据实施方案153所述的方法,其中所述质谱信号与多个串联质谱信号相关联,并且其中所述鉴定包括至少部分地基于(b)的所述蛋白质序列分配所述串联质谱信号。
实施方案155.一种用于测定生物样本的方法,其包括:(a)提供包含表面修饰的颗粒和支持剂的干组合物,所述表面修饰的颗粒具有可变地选择性吸附多个生物分子或生物分子群组的物理化学性质;(b)在液体中重构所述干组合物;和(c)使所述生物样本与在(b)中重构的所述干组合物接触,以在所述表面修饰的颗粒的表面上吸附至少一部分所述生物分子或生物分子群组。
实施方案156.根据实施方案155所述的方法,其中所述生物分子或生物分子群组包括蛋白质或蛋白质群组。
实施方案157.根据实施方案156所述的方法,其中所述蛋白质或蛋白质群组在所述生物样本中的浓度具有至少7个数量级的动态范围。
实施方案158.根据实施方案156或157所述的方法,其中所述蛋白质或蛋白质群组在所述生物样本中的浓度具有至少8个数量级的动态范围。
实施方案159.根据实施方案156-158中任一者所述的方法,其中所述蛋白质或蛋白质群组在所述生物样本中的浓度具有至少9个数量级的动态范围。
实施方案160.根据实施方案156-159中任一者所述的方法,其中所述蛋白质或蛋白质群组在所述生物样本中的浓度具有至少10个数量级的动态范围。
实施方案161.根据实施方案155-160中任一者所述的方法,其中所述液体包括水、有机溶剂或其组合或混合物。
实施方案162.根据实施方案155-161中任一者所述的方法,其中所述生物样本包括血浆、血清、CSF、尿液、泪液、细胞裂解物、组织裂解物、细胞匀浆、组织匀浆、针抽吸物、粪便样本、滑液、全血、唾液或其组合。
实施方案163.根据实施方案155-162中任一者所述的方法,其中所述支持剂包括赋形剂。
实施方案164.根据实施方案163所述的方法,其中所述支持剂是赋形剂。
实施方案165.根据实施方案163或164所述的方法,其中所述赋形剂包括葡聚糖、PEG、蔗糖、葡萄糖、海藻糖、乳糖、聚山梨醇酯、氨基酸、甘露醇、甘氨酸、甘油或其任何组合或变体。
实施方案166.根据实施方案155-165中任一者所述的方法,其中所述干组合物呈冻干珠的形式。
实施方案167.根据实施方案155-166中任一者所述的方法,其中所述干组合物在多孔板、流体通道、流体腔室或管的容积内。
实施方案168.根据实施方案167所述的方法,其中在(b)中,所述干组合物在所述多孔板、所述流体通道、所述流体腔室或所述管的所述容积内重构。
实施方案169.根据实施方案168所述的方法,其中在(c)中,使所述重构的干组合物与所述多孔板、所述流体通道、所述流体腔室或所述管的所述容积内的所述生物样本接触。
实施方案170.根据实施方案167-169中任一者所述的方法,其中所述干组合物是在所述多孔板、所述流体通道、所述流体腔室或所述管的所述容积内的冻干珠。
实施方案171.根据实施方案167-171中任一者所述的方法,其中所述干组合物是在所述多孔板、所述流体通道、所述流体腔室或所述管的所述容积内的多个冻干珠。
实施方案172.根据实施方案155-171中任一者所述的方法,其中所述干组合物包含包括所述表面修饰的颗粒的多种颗粒。
实施方案173.根据实施方案172所述的方法,其中所述多种颗粒的至少一个子集中的单独的颗粒包括不同的表面。
实施方案174.根据实施方案172或173所述的方法,其中所述多种颗粒的至少一个子集中的单独的颗粒在至少一种物理化学性质上不同于另一个子集。
实施方案175.根据实施方案174所述的方法,其中所述单独的颗粒各自包括不同的物理化学性质,以用于可变地选择性吸附生物分子或生物分子群组的不同集合。
实施方案176.根据实施方案172-175中任一者所述的方法,其中所述多种颗粒包括至少两种或更多种不同的颗粒类型。
实施方案177.根据实施方案172-176中任一者所述的方法,其中所述多种颗粒包括至少六种或更多种不同的颗粒类型。
实施方案178.根据实施方案172-177中任一者所述的方法,其中所述多种颗粒包括至少十种或更多种不同的颗粒类型。
实施方案179.根据实施方案172-178中任一者所述的方法,其中所述多种颗粒包括磁性颗粒。
实施方案180.根据实施方案172-179中任一者所述的方法,其中所述多种颗粒包括纳米颗粒、微粒或其组合。
实施方案181.根据实施方案180所述的方法,其中所述多种颗粒包括纳米颗粒和微粒。
实施方案182.根据实施方案155-181中任一者所述的方法,其中所述表面修饰的颗粒不包括抗体、T细胞受体、嵌合抗原受体、受体蛋白或其变体或片段。
实施方案183.根据实施方案155-182中任一者所述的方法,其进一步包括,在(a)之前,产生包含所述表面修饰的颗粒和所述支持剂的溶液或悬浮液。
实施方案184.根据实施方案183所述的方法,其中所述溶液或悬浮液具有大于1微升(μL)的体积。
实施方案185.根据实施方案183或184所述的方法,其中所述溶液或悬浮液具有小于100μL的体积。
实施方案186.根据实施方案183-185中任一者所述的方法,其中所述溶液或悬浮液具有在2微升(μL)和60μL之间的体积。
实施方案187.根据实施方案183-186中任一者所述的方法,其中所述溶液或悬浮液具有在25μL和45μL之间的体积。
实施方案188.根据实施方案183-187中任一者所述的方法,其中所述溶液或悬浮液中的所述支持剂具有大于50mg/mL的浓度。
实施方案189.根据实施方案183-188中任一者所述的方法,其中所述溶液或悬浮液中的所述支持剂具有小于250mg/mL的浓度。
实施方案190.根据实施方案183-189中任一者所述的方法,其中所述溶液或悬浮液中的所述支持剂具有在100mg/mL和200mg/mL之间的浓度。
实施方案191.根据实施方案183-190中任一者所述的方法,其中所述溶液或悬浮液具有大于2.5毫克/毫升(mg/mL)的颗粒浓度。
实施方案192.根据实施方案183-191中任一者所述的方法,其中所述溶液或悬浮液具有小于100mg/mL的颗粒浓度。
实施方案193.根据实施方案183-192中任一者所述的方法,其中所述溶液或悬浮液具有在10mg/mL和100mg/mL之间的颗粒浓度。
实施方案194.根据实施方案183-192中任一者所述的方法,其中所述溶液或悬浮液具有在15mg/mL和80mg/mL之间的颗粒浓度。
实施方案195.根据实施方案155-194中任一者所述的方法,其中所述干组合物是珠,每个珠包括至少0.5mg所述表面修饰的颗粒。
实施方案196.根据实施方案155-195中任一者所述的方法,其中所述干组合物是珠,每个珠包括0.5mg至约5mg所述表面修饰的颗粒。
实施方案197.根据实施方案183-196中任一者所述的方法,其中在(b)之后的所述表面修饰的颗粒的直径为所述溶液或悬浮液中所述表面修饰的颗粒的直径的约90%至约110%。
实施方案198.根据实施方案183-197中任一者所述的方法,其中在(b)之后的所述表面修饰的颗粒的ζ电势为在所述快速冷冻之前所述液体中相同表面修饰的颗粒的ζ电势的约90%至约110%。
实施方案199.根据实施方案183-198中任一者所述的方法,其中在(c)之后的所述表面修饰的颗粒吸附的所述生物样本中的生物分子是在不存在冻干的情况下溶解在所述溶液中的相同表面修饰的颗粒将从所述生物样本中吸附的生物分子至的少90%。
实施方案200.根据实施方案183-198中任一者所述的方法,其进一步包括快速冷冻所述溶液或悬浮液以产生冷冻组合物,并且其中所述快速冷冻是在液氮中、在冷板上或在冷却空气中进行的。
实施方案201.根据实施方案199或200所述的方法,其进一步包括冻干所述冷冻组合物以产生所述干组合物。
实施方案202.根据实施方案199-201中任一者所述的方法,其中所述方法进一步包括在孔或管中原位进行所述快速冷冻。
实施方案203.根据实施方案199-202中任一者所述的方法,其中所述方法进一步包括在多个孔或多个管中进行所述快速冷冻。
实施方案204.根据实施方案155-203中任一者所述的方法,其中所述重构包括在25℃下至少0.1min-1的速率。
实施方案205.根据实施方案155-204中任一者所述的方法,其中所述重构包括在25℃下至少0.5min-1的速率。
实施方案206.根据实施方案155-205中任一者所述的方法,其中所述重构进行至多20分钟。
实施方案207.根据实施方案155-206中任一者所述的方法,其中所述重构包括超声处理、摇动或混合。
实施方案208.根据实施方案155-206中任一者所述的方法,其中所述重构不包括物理扰动。
实施方案209.根据实施方案155-208中任一者所述的方法,其中在所述重构之后,所述表面修饰的颗粒基本上不含颗粒聚集体。
实施方案210.根据实施方案155-209中任一者所述的方法,在所述重构之后,所述液体包括在约5和约9之间的pH。
实施方案211.根据实施方案155-210中任一者所述的方法,其中所述可变地选择性吸附包括低结合亲和力、慢结合动力学或两者。
实施方案212.根据实施方案155-211中任一者所述的方法,其中所述可变地选择性吸附包括为非蛋白质-配体相互作用的相互作用。
实施方案213.根据实施方案155-212中任一者所述的方法,其中所述可变地选择性吸附包括与所述表面修饰的颗粒的表面接触的所述多个生物分子或生物分子群组,其中所述表面不包括官能化的蛋白质。
实施方案214.根据实施方案155-213中任一者所述的方法,其中所述多个生物分子或生物分子群组的所述可变地选择性吸附形成生物分子冠状物。
实施方案215.一种用于测定生物流体样本的方法,其包括:(a)提供包含表面修饰的颗粒和冻干支持剂的干组合物,所述表面修饰的颗粒对多个生物分子或生物分子群组具有亲和力;和(b)在不存在所述干组合物的重构的情况下,使所述生物流体样本与所述干组合物接触,以在所述表面修饰的颗粒的表面上吸附至少一部分所述生物分子或生物分子群组。
实施方案216.根据实施方案215所述的方法,其中所述生物流体样本包括血浆、血清、CSF、尿液、泪液、细胞裂解物、组织裂解物、细胞匀浆、组织匀浆、乳头抽吸物、针抽吸物、粪便样本、滑液、全血、唾液或其组合。
实施方案217.根据实施方案215或216所述的方法,其中所述生物流体样本在(b)之前以约1份生物流体样本比至少约1份缓冲溶液的体积比在缓冲溶液中稀释。
实施方案218.根据实施方案215-217中任一者所述的方法,其中所述生物流体样本在(b)之前以约1份生物流体样本比至少约2份缓冲溶液的体积比在缓冲溶液中稀释。
实施方案219.根据实施方案215-218中任一者所述的方法,其中所述生物流体样本在(b)之前以约1份生物流体样本比至少约5份缓冲溶液的体积比在缓冲溶液中稀释。
实施方案220.根据实施方案215-219中任一者所述的方法,其中所述生物流体样本在(b)之前以约1份生物流体样本比至少约10份缓冲溶液的体积比在缓冲溶液中稀释。
实施方案221.根据实施方案215-220中任一者所述的方法,其中所述生物流体样本在(b)之前以约1份生物流体样本比至少约20份缓冲溶液的体积比在缓冲溶液中稀释。
实施方案222.根据实施方案215-221中任一者所述的方法,其中所述生物分子或生物分子群组包括蛋白质或蛋白质群组。
实施方案223.根据实施方案222所述的方法,其中所述蛋白质或蛋白质群组在所述生物流体样本中的浓度具有至少7个数量级的动态范围。
实施方案224.根据实施方案222或223所述的方法,其中所述蛋白质或蛋白质群组在所述生物流体样本中的浓度具有至少8个数量级的动态范围。
实施方案225.根据实施方案222-224中任一者所述的方法,其中所述蛋白质或蛋白质群组在所述生物流体样本中的浓度具有至少9个数量级的动态范围。
实施方案226.根据实施方案222-225中任一者所述的方法,其中所述蛋白质或蛋白质群组在所述生物流体样本中的浓度具有至少10个数量级的动态范围。
实施方案227.根据实施方案215-226中任一者所述的方法,其中所述支持剂包括赋形剂。
实施方案228.根据实施方案227所述的方法,其中所述支持剂是赋形剂。
实施方案229.根据实施方案227或228所述的方法,其中所述赋形剂包括葡聚糖、PEG、蔗糖、葡萄糖、海藻糖、乳糖、聚山梨醇酯、氨基酸、甘露醇、甘氨酸、甘油或其任何组合或变体。
实施方案230.根据实施方案215-229中任一者所述的方法,其中所述干组合物是冻干珠。
实施方案231.根据实施方案230所述的方法,其中所述冻干珠包括在2微升2微升(μL)和60μL之间的体积。
实施方案232.根据实施方案215-231中任一者所述的方法,其中所述干组合物在多孔板或管的容积内。
实施方案233.根据实施方案232所述的方法,其中所述干组合物是在所述多孔板或所述管的所述容积内的冻干珠。
实施方案234.根据实施方案232或233所述的方法,其中所述干组合物是在所述多孔板或所述管的所述容积内的多个冻干珠。
实施方案235.根据实施方案215-234中任一者所述的方法,其中所述干组合物包含包括所述表面修饰的颗粒的多种颗粒。
实施方案236.根据实施方案235所述的方法,其中在(b)之后,至少99.9%的所述多种颗粒在所述生物流体样本中是非聚集的。
实施方案237.根据实施方案235或236所述的方法,其中所述多种颗粒的至少一个子集中的单独的颗粒在至少一种物理化学性质上不同于另一个子集。
实施方案238.根据实施方案237所述的方法,其中所述单独的颗粒各自包括不同的物理化学性质,以用于可变地选择性吸附生物分子或生物分子群组的不同集合。
实施方案239.根据实施方案236-238中任一者所述的方法,其中所述多种颗粒包括至少两种或更多种不同的颗粒类型。
实施方案240.根据实施方案235-239中任一者所述的方法,其中所述多种颗粒包括至少六种或更多种不同的颗粒类型。
实施方案241.根据实施方案235-240中任一者所述的方法,其中所述多种颗粒包括至少十种或更多种不同的颗粒类型。
实施方案242.根据实施方案235-241中任一者所述的方法,其中所述多种颗粒包括磁性颗粒。
实施方案243.根据实施方案235-242中任一者所述的方法,其中所述多种颗粒包括纳米颗粒、微粒或其组合。
实施方案244.根据实施方案243所述的方法,其中所述多种颗粒包括纳米颗粒和微粒。
实施方案245.根据实施方案215-244中任一者所述的方法,其中所述表面修饰的颗粒不包括抗体、T细胞受体、嵌合抗原受体、受体蛋白或其变体或片段。
实施方案246.根据实施方案215-245中任一者所述的方法,其进一步包括,在(a)之前,产生包含所述表面修饰的颗粒和所述支持剂的溶液或悬浮液。
实施方案247.根据实施方案246所述的方法,其中所述溶液或悬浮液具有大于1微升(μL)的体积。
实施方案248.根据实施方案246或247所述的方法,其中所述溶液或悬浮液具有小于100μL的体积。
实施方案249.根据实施方案246-248中任一者所述的方法,其中所述溶液或悬浮液具有在2微升(μL)和60μL之间的体积。
实施方案250.根据实施方案246-249中任一者所述的方法,其中所述溶液或悬浮液具有在25μL和45μL之间的体积。
实施方案251.根据实施方案246-250中任一者所述的方法,其中所述溶液或悬浮液中的所述支持剂具有大于50mg/mL的浓度。
实施方案252.根据实施方案246-251中任一者所述的方法,其中所述溶液或悬浮液中的所述支持剂具有小于250mg/mL的浓度。
实施方案253.根据实施方案246-252中任一者所述的方法,其中所述溶液或悬浮液中的所述支持剂具有小于250mg/mL的浓度。
实施方案254.根据实施方案246-253中任一者所述的方法,其中所述溶液或悬浮液中的所述支持剂具有在100mg/mL和200mg/mL之间的浓度。
实施方案255.根据实施方案246-254中任一者所述的方法,其中所述溶液或悬浮液具有大于2.5毫克/毫升(mg/mL)的颗粒浓度。
实施方案256.根据实施方案246-255中任一者所述的方法,其中所述溶液或悬浮液具有小于100mg/mL的颗粒浓度。
实施方案257.根据实施方案246-256中任一者所述的方法,其中所述溶液或悬浮液具有在10mg/mL和100mg/mL之间的颗粒浓度。
实施方案258.根据实施方案246-257中任一者所述的方法,其中所述溶液或悬浮液具有在15mg/mL和80mg/mL之间的颗粒浓度。
实施方案259.根据实施方案246-258中任一者所述的方法,其进一步包括快速冷冻所述溶液或悬浮液以产生冷冻组合物。
实施方案260.根据实施方案259所述的方法,其中所述快速冷冻包括在液氮中快速冷冻。
实施方案261.根据实施方案259或260所述的方法,其进一步包括冻干所述冷冻组合物以产生所述干组合物。
实施方案262.根据实施方案246-261中任一者所述的方法,其中在(b)之后的所述液体中的颗粒直径为所述溶液或悬浮液中平均粒径的约90%至约110%。
实施方案263.根据实施方案246-262中任一者所述的方法,其中在(b)之后,小于0.1%的所述表面修饰的颗粒作为颗粒聚集体存在。
实施方案264.根据实施方案259-263中任一者所述的方法,其中在(b)之后的所述液体中的所述表面修饰的颗粒包括在参考ζ电势的约90%至约110%之间的ζ电势,其中所述参考ζ电势可在所述快速冷冻所述液体之前从包含所述表面修饰的颗粒的溶液测量。
实施方案265.根据实施方案259-264中任一者所述的方法,其中所述冷冻组合物在孔或管中形成。
实施方案266.根据实施方案259-265中任一者所述的方法,其中所述冷冻组合物在多个孔或多个管中形成。
实施方案267.根据实施方案215-266中任一者所述的方法,其中所述干组合物是每个珠包括至少0.5mg所述表面修饰的颗粒的珠。
实施方案268.根据实施方案215-267中任一者所述的方法,其中所述干组合物是每个珠包括约0.5mg至约5mg所述表面修饰的颗粒的珠。
实施方案269.一种用于测定生物样本的系统,其包括:包括干组合物的基底,所述干组合物包括颗粒和支持剂;包括生物样本的样本储存单元;装载单元,其可操作地耦合到所述基底和所述样本储存单元;以及包括机器可执行代码的计算机可读介质,所述机器可执行代码在由处理器执行时实现一种方法,所述方法包括:(a)使用所述装载单元将所述生物样本或其一部分从所述样本储存单元转移到所述基底;和(b)引导所述生物样本与所述干组合物接触,以产生包含多个生物分子或生物分子群组的生物分子冠状物。
实施方案270.根据实施方案269的系统,其中所述基底是多孔板或管。
实施方案271.根据实施方案269或270所述的系统,其中所述基底包含多种干组合物,每种干组合物都包括所述干组合物。
实施方案272.根据实施方案271所述的系统,其中包括在所述多种干组合物的单独干组合物中的颗粒的至少一个子集不同于另一个子集。
实施方案273.根据实施方案272所述的系统,其中所述颗粒的至少一个子集在至少一种物理化学性质上不同于所述另一个子集。
实施方案274.根据实施方案271-273中任一者所述的系统,其中所述多种干组合物包括至少两种干组合物,每种干组合物包括:二氧化硅涂覆的SPION、三胺官能化的纳米颗粒、PDMAPMA-聚合物官能化的纳米颗粒、葡萄糖-6-磷酸酯官能化的纳米颗粒、单胺官能化的纳米颗粒或其组合。
实施方案275.根据实施方案271-274中任一者所述的系统,其中所述多孔板的每个孔包括所述多种干组合物中的单独的干组合物。
实施方案276.根据实施方案269-275中任一者所述的系统,其中所述样本储存单元包括多个不同的生物样本。
实施方案277.根据实施方案276所述的系统,其中(a)的所述转移包括将所述多个不同生物样本中的每一个转移到所述多孔板的不同孔中。
实施方案278.根据实施方案269-277中任一实施方案所述的系统,其中所述生物样本包括多个部分。
实施方案279.根据实施方案278所述的系统,其中(a)的所述转移包括将所述生物样本的所述多个部分中的每一部分转移到所述多孔板的不同孔中。
实施方案280.根据实施方案279所述的系统,其中所述生物样本的所述多个部分的所述转移基本上平行执行。
实施方案281.根据实施方案269-280中任一者所述的系统,其中在(b)之前,在溶剂中将所述生物样本或其所述部分稀释到至少约2x体积。
实施方案282.根据实施方案269-281中任一者所述的系统,其中在(b)之前,在溶剂中将所述生物样本或其所述部分稀释到至少约10x体积。
实施方案283.根据实施方案269-282中任一者所述的系统,其中所述生物样本的细胞膜在(b)之前至少部分地裂解。
实施方案284.根据实施方案269-283中任一者所述的系统,其进一步包括在(b)之前在液体中重构所述干组合物。
实施方案285.根据实施方案284所述的系统,其中所述液体具有至少约3.5到至多约7.4的pH。
实施方案286.根据实施方案284或285所述的系统,其中所述液体具有至少约4.5到至多约5.5的pH。
实施方案287.根据实施方案284-286中任一者所述的系统,其中所述液体具有至多约150mM的离子浓度。
实施方案288.根据实施方案284-287中任一者所述的系统,其中所述液体具有至多约50mM的离子浓度。
实施方案289.根据实施方案284-288中任一者所述的系统,其中所述液体具有至多约0.1mM的离子浓度。
实施方案290.根据实施方案269-289中任一者所述的系统,其中在(b)中,所述生物样本保持与所述干组合物接触至少约10秒。
实施方案291.根据实施方案269-290中任一者所述的系统,其中在(b)中,所述生物样本保持与所述干组合物接触至少约1分钟。
实施方案292.根据实施方案269-291中任一者所述的系统,其中在(b)中,所述生物样本保持与所述干组合物接触至少约5分钟。
实施方案293.根据实施方案269-292中任一者所述的系统,其中所述方法进一步包括在(b)之后在再悬浮的情况下洗涤所述生物分子冠状物。
实施方案294.根据实施方案269-292中任一者所述的系统,其中所述方法进一步包括在(b)之后在没有再悬浮的情况下洗涤所述生物分子冠状物。
实施方案295.根据实施方案269-294中任一者所述的系统,其中所述方法进一步包括在(b)之前裂解所述生物样本的物种以产生裂解物。
实施方案296.根据实施方案295所述的系统,其中所述方法进一步包括还原所述裂解物。
实施方案297.根据实施方案295或296所述的系统,其中所述方法进一步包括过滤所述裂解物。
实施方案298.根据实施方案295-297中任一者所述的系统,其中所述方法进一步包括烷基化所述裂解物。
实施方案299.根据实施方案269-298中任一者所述的系统,其中所述方法进一步包括在(b)之后使所述生物分子冠状物变性,以产生变性的生物分子冠状物。
实施方案300.根据实施方案299所述的系统,其中所述变性为逐步变性。
实施方案301.根据实施方案299或300所述的系统,其中所述变性在约50℃至约95℃的温度下进行。
实施方案302.根据实施方案269-301中任一者所述的系统,其中所述方法进一步包括在(b)之后消化所述生物分子冠状物,以产生经消化的生物分子冠状物。
实施方案303.根据实施方案302所述的系统,其中所述消化包括使用浓度为约20微克/毫升(μg/mL)至约0.1克/升(g/L)的胰蛋白酶。
实施方案304.根据实施方案302或303所述的系统,其中所述消化包括逐步使用浓度为约20微克/毫升(μg/mL)至约0.1克/升(g/L)的lysC。
实施方案305.根据实施方案302-304中任一者所述的系统,其中所述消化包括消化至多约3小时。
实施方案306.根据实施方案302-305中任一者所述的系统,其中所述消化包括消化至多约1小时。
实施方案307.根据实施方案302-306中任一者所述的系统,其中所述消化产生平均质量为约1000道尔顿至约4000道尔顿(Da)的肽。
实施方案308.根据实施方案269-294中任一者所述的系统,其中所述方法进一步包括将所述多个生物分子或生物分子群组释放到溶液中。
实施方案309.根据实施方案308所述的系统,其中所述方法进一步包括还原所述多个生物分子或生物分子群组。
实施方案310.根据实施方案308或309所述的系统,其中所述方法进一步包括过滤所述多个生物分子或生物分子群组。
实施方案311.根据实施方案308-310中任一者所述的系统,其中所述方法进一步包括烷基化所述多个生物分子或生物分子群组。
实施方案312.根据实施方案308-311中任一者所述的系统,其中所述方法进一步包括在(b)之后使所述生物分子冠状物变性,以产生经变性的生物分子冠状物。
实施方案313.根据实施方案312所述的系统,其中所述变性为逐步变性。
实施方案314.根据实施方案312或313所述的系统,其中所述变性在约50℃至约95℃的温度下进行。
实施方案315.根据实施方案308-314中任一者所述的系统,其中所述方法进一步包括在(b)之后消化所述生物分子冠状物,以产生经消化的生物分子冠状物。
实施方案316.根据实施方案315所述的系统,其中所述消化包括使用浓度为约20微克/毫升(μg/mL)至约0.1克/升(g/L)的胰蛋白酶。
实施方案317.根据实施方案315或316所述的系统,其中所述消化包括逐步使用浓度为约20微克/毫升(μg/mL)至约0.1克/升(g/L)的lysC。
实施方案318.根据实施方案315-317中任一者所述的系统,其中所述消化包括消化至多约3小时。
实施方案319.根据实施方案315-318中任一者所述的系统,其中所述消化包括消化至多约1小时。
实施方案320.根据实施方案315-319中任一者所述的系统,其中所述消化产生平均质量为约1000道尔顿至约4000道尔顿(Da)的肽。
实施方案321.根据实施方案269-307中任一者所述的系统,其中所述方法进一步包括在(b)之后洗脱所述生物分子冠状物。
实施方案322.根据实施方案321所述的系统,其中所述洗脱包括从所述颗粒中释放完整的蛋白质。
实施方案323.根据实施方案321或322所述的系统,其中所述洗脱包括用至多约2x体积的溶液洗脱。
实施方案324.根据实施方案321-323中任一者所述的系统,其中所述洗脱包括用至多约8x体积的溶液洗脱。
实施方案325.根据实施方案321-324中任一者所述的系统,其中所述洗脱包括在至多约50psi的压力下洗脱。
实施方案326.根据实施方案269-325中任一者所述的系统,其进一步包括在(b)之后的固相提取。
实施方案327.根据实施方案269-326中任一者所述的系统,其中所述方法进一步包括在(b)之后对所述生物分子冠状物进行质谱法。
实施方案328.根据实施方案269-327中任一者所述的系统,其中所述方法进一步包括在(b)之后对所述生物分子冠状物进行液相色谱法。
实施方案329.根据实施方案269-328中任一者所述的系统,其中所述基底包括塑料器皿,并且其中所述方法进一步包括提供条形码的集合,所述条形码的集合至少包括塑料器皿条形码、颗粒条形码和试剂条形码,并且将所述条形码的集合传送到所述计算机可读介质。
实施方案330.根据实施方案329所述的系统,其中所述方法进一步包括至少部分地基于所述塑料器皿条形码将塑料器皿从塑料器皿储存器转移到所述装载单元。
实施方案331.根据实施方案329或330所述的系统,其中所述方法进一步包括至少部分地基于所述颗粒条形码将所述干组合物从颗粒存储器转移到所述装载单元。
实施方案332.根据实施方案329-331中任一者所述的系统,其中所述方法进一步包括至少部分地基于所述试剂条形码将试剂从试剂存储器转移到所述装载单元。
实施方案333.根据实施方案269-332中任一者所述的系统,其中所述方法包括从所述干组合物的至少一部分中分离至少一部分所述生物样本。
实施方案334.根据实施方案269-333中任一者所述的系统,其中所述方法包括从所述生物样本中分离所述生物分子冠状物的所述多个生物分子或生物分子群组的至少一个子集。
实施方案335.根据实施方案333或334所述的系统,其中所述分离包括磁分离。
实施方案336.一种干颗粒制剂,其包含:干组合物,所述干组合物包含(i)包括用于吸附多个生物分子或生物分子群组的表面修饰的颗粒和(ii)支持剂,其中所述干组合物在高于25℃的温度下稳定至少3个月。
实施方案337.根据实施方案336所述的干颗粒制剂,其中所述表面修饰包括二氧化硅涂层、三胺官能化、PDMAPMA-聚合物官能化、葡萄糖-6-磷酸酯官能化或单胺表面官能化。
实施方案338.根据实施方案336或337所述的干颗粒制剂,其中所述表面修饰包括金属氧化物涂层。
实施方案339.根据实施方案336-338中任一者所述的干颗粒制剂,其中所述表面修饰包括至少一个暴露的伯胺基团、仲胺基团、叔胺基团。
实施方案340.根据实施方案336-339中任一者所述的干颗粒制剂,其中所述表面修饰包括至少一种单糖。
实施方案341.根据实施方案336-340中任一者所述的干颗粒制剂,其中所述多个生物分子或生物分子群组包括肽、核酸、代谢物、脂质或其任何组合。
实施方案342.根据实施方案336-341中任一者所述的干颗粒制剂,其中所述支持剂包括蔗糖、d-甘露醇、海藻糖、甘油、葡聚糖、PEG、葡萄糖、乳糖、聚山梨醇酯或氨基酸中的至少一种。
实施方案343.根据实施方案336-342中任一者所述的干颗粒制剂,其中在所述支持剂的存在下冻干所述多种颗粒。
实施方案344.根据实施方案336-343中任一者所述的干颗粒制剂,其中所述支持剂占所述干组合物的至少约60wt%。
实施方案345.根据实施方案336-344中任一者所述的干颗粒制剂,其中所述支持剂占所述干组合物的至少约70wt%。
实施方案346.根据实施方案336-345中任一者所述的干颗粒制剂,其中所述支持剂占所述干组合物的至多约80wt%。
实施方案347.根据实施方案336-346中任一者所述的干颗粒制剂,其中所述支持剂占所述干组合物的至多约90wt%。
实施方案348.根据实施方案336-347中任一者所述的干颗粒制剂,其中所述温度在25℃和60℃之间。
实施方案349.根据实施方案336-348中任一者所述的干颗粒制剂,其中所述温度在35℃和40℃之间。
实施方案350.根据实施方案336-349中任一者所述的干颗粒制剂,其中在溶液中重构所述干组合物时,所述颗粒具有的平均ζ电势为在不存在冻干的情况下溶解在相同溶液中的相同颗粒的ζ电势的85%至115%,如通过ζ电势测量所确定的。
实施方案351.根据实施方案336-350中任一者所述的干颗粒制剂,其中在溶液中重构所述干组合物时,所述颗粒具有的平均ζ电势为在不存在冻干的情况下溶解在相同溶液中的相同颗粒的ζ电势的90%至110%,如通过ζ电势测量所确定的。
实施方案352.根据实施方案336-351中任一者所述的干颗粒制剂,其中在溶液中重构所述干组合物时,所述颗粒具有的平均ζ电势为在不存在冻干的情况下溶解在相同溶液中的相同颗粒的ζ电势的95%至105%,如通过ζ电势测量所确定的。
实施方案353.根据实施方案336-352中任一者所述的干颗粒制剂,其中在溶液中重构所述干组合物时,所述颗粒具有的平均ζ电势标准偏差为在不存在冻干的情况下溶解在相同溶液中的相同颗粒的ζ电势标准偏差的85%至115%,如通过ζ电势测量所确定的。
实施方案354.根据实施方案336-353中任一者所述的干颗粒制剂,其中在溶液中重构所述干组合物时,所述颗粒具有的平均ζ电势标准偏差为在不存在冻干的情况下溶解在相同溶液中的相同颗粒的ζ电势标准偏差的90%至110%,如通过ζ电势测量所确定的。
实施方案355.根据实施方案336-354中任一者所述的干颗粒制剂,其中在溶液中重构所述干组合物时,所述颗粒具有的ζ电势标准偏差为在不存在冻干的情况下溶解在相同溶液中的相同颗粒的ζ电势标准偏差的95%至105%,如通过ζ电势测量所确定的。
实施方案356.根据实施方案336-355中任一者所述的干颗粒制剂,其中在溶液中重构所述干组合物时,所述颗粒具有的平均直径为在不存在冻干的情况下溶解在相同溶液中的相同颗粒的平均直径的85%至115%,如通过动态光散射(DLS)所确定的。
实施方案357.根据实施方案336-356中任一者所述的干颗粒制剂,其中在溶液中重构所述干组合物时,所述颗粒具有的平均直径为在不存在冻干的情况下溶解在相同溶液中的相同颗粒的平均直径的90%至110%,如通过动态光散射(DLS)所确定的。
实施方案358.根据实施方案336-357中任一者所述的干颗粒制剂,其中在溶液中重构所述干组合物时,所述颗粒具有的平均直径为在不存在冻干的情况下溶解在相同溶液中的相同颗粒的平均直径的95%至105%,如通过动态光散射(DLS)所确定的。
实施方案359.根据实施方案336-358中任一者所述的干颗粒制剂,其中在溶液中重构所述干组合物时,所述颗粒具有的平均直径为在不存在冻干的情况下溶解在相同溶液中的相同颗粒的平均直径的98%至102%,如通过动态光散射(DLS)所确定的。
实施方案360.根据实施方案336-359中任一者所述的干颗粒制剂,其中在重构所述干组合物时,所述颗具有粒的直径标准偏差为在不存在冻干的情况下溶解在相同溶液中的相同颗粒的直径标准偏差的85%至115%,如通过动态光散射(DLS)所确定的。
实施方案361.根据实施方案336-360中任一者所述的干颗粒制剂,其中在重构所述干组合物时,所述颗粒具有的直径标准偏差为在不存在冻干的情况下溶解在相同溶液中的相同颗粒的直径标准偏差的90%至110%,如通过动态光散射(DLS)所确定的。
实施方案362.根据实施方案336-361中任一者所述的干颗粒制剂,其中在重构所述干组合物时,所述颗粒具有的直径标准偏差为在不存在冻干的情况下溶解在相同溶液中的相同颗粒的直径标准偏差的95%至105%,如通过动态光散射(DLS)所确定的。
实施方案363.根据实施方案336-362中任一者所述的干颗粒制剂,其中在重构所述干组合物时,所述颗粒具有的直径标准偏差为在不存在冻干的情况下溶解在相同溶液中的相同颗粒的直径标准偏差的98%至102%,如通过动态光散射(DLS)所确定的。
实施方案364.一种试剂盒,其包括根据实施方案336-363中任一者所述的干颗粒制剂和被配置为接收和保留所述干组合物的基底。
实施方案365.根据实施方案364所述的试剂盒,其中所述基底包括管或孔。
实施方案366.根据实施方案364或365所述的试剂盒,其中所述基底是96孔板。
实施方案367.根据实施方案364-366中任一者所述的试剂盒,其中所述基底包括微流体装置。
实施方案368.根据实施方案364-367中任一者所述的试剂盒,其中所述基底包括多个空间上隔离的位置,每个位置包括根据实施方案337-364中任一者所述的干组合物。
实施方案369.根据实施方案368所述的试剂盒,其中所述多个空间上隔离的位置中的各个位置是可单独寻址和/或可独立寻址的。
实施方案370.一种干颗粒制剂,其包含:干组合物,所述干组合物包含经表面修饰以用于吸附多个生物分子或生物分子群组的颗粒,和支持剂,其中所述干组合物被配置为用于随后的使用而无需在溶剂中重构。
实施方案371.根据实施方案370所述的干颗粒制剂,其中所述干组合物在高于25℃的温度下稳定至少7天。
实施方案372.根据实施方案370或371所述的干颗粒制剂,其中所述温度在25℃和60℃之间。
实施方案373.根据实施方案370-372中任一者所述的干颗粒制剂,其中所述温度在35℃和40℃之间。
实施方案374.根据实施方案370-373中任一者所述的干颗粒制剂,其中所述干组合物在37℃下稳定至少7天。
实施方案375.根据实施方案370-374中任一者所述的干颗粒制剂,其中所述干组合物在37℃下稳定至少10天。
实施方案376.根据实施方案370-375中任一者所述的干颗粒制剂,其中所述颗粒被冻干。
实施方案377.根据实施方案370-376中任一者所述的干颗粒制剂,其中在所述支持剂的存在下冻干所述颗粒。
实施方案378.根据实施方案370-377中任一者所述的干颗粒制剂,其中在重构所述干组合物时,所述冻干颗粒具有的粒径为在不存在冻干的情况下溶解在溶液中的相同颗粒的粒径的85%至115%,如通过动态光散射(DLS)所确定的。
实施方案379.根据实施方案370-378中任一者所述的干颗粒制剂,其中在重构所述干组合物时,所述冻干颗粒具有的粒径为在不存在冻干的情况下溶解在溶液中的相同颗粒的粒径的90%至110%,如通过DLS所确定的。
实施方案380.根据实施方案370-379中任一者所述的干颗粒制剂,其中在重构所述干组合物时,所述冻干颗粒具有的粒径为在不存在冻干的情况下溶解在溶液中的相同颗粒的粒径的95%至105%,如通过DLS所确定的。
实施方案381.根据实施方案370-380中任一者所述的干颗粒制剂,其中在重构所述干组合物时,所述冻干颗粒具有的粒径为在不存在冻干的情况下溶解在溶液中的相同颗粒的粒径的98%至102%,如通过DLS所确定的。
实施方案382.根据实施方案370-381中任一者所述的干颗粒制剂,其中在重构所述干组合物时,所述冻干颗粒具有的ζ电势为在不存在冻干的情况下溶解在溶液中的相同颗粒的ζ电势的85%至115%,如通过ζ电势测量所确定的。
实施方案383.根据实施方案370-382中任一者所述的干颗粒制剂,其中在重构所述干组合物时,所述冻干颗粒具有的ζ电势为在不存在冻干的情况下溶解在溶液中的相同颗粒的ζ电势的90%至110%,如通过ζ电势测量所确定的。
实施方案384.根据实施方案370-383中任一者所述的干颗粒制剂,其中在重构所述干组合物时,所述冻干颗粒具有的ζ电势为在不存在冻干的情况下溶解在溶液中的相同颗粒的ζ电势的95%至105%,如通过ζ电势测量所确定的。
实施方案385.根据实施方案370-384中任一者所述的干颗粒制剂,其中所述随后的使用包括在与样本接触后形成生物分子冠状物。
实施方案386.一种试剂盒,其包括根据实施方案370-385中任一者所述的干颗粒制剂和被配置为接收和保留所述干组合物的基底。
实施方案387.根据实施方案386所述的试剂盒,其中所述基底包括管或孔。
实施方案388.根据实施方案386或387所述的试剂盒,其中所述基底是96孔板。
实施方案389.根据实施方案386-388中任一者所述的试剂盒,其中所述基底包括多个空间上隔离的位置,每个位置包括干组合物。
实施方案390.根据实施方案389所述的试剂盒,其中所述多个空间上隔离的位置中的各个位置是可单独寻址和/或可独立寻址的。