[go: up one dir, main page]

CN115856309A - 蛋白标志物在制备诊断帕金森或预测帕金森病的产品中的应用 - Google Patents

蛋白标志物在制备诊断帕金森或预测帕金森病的产品中的应用 Download PDF

Info

Publication number
CN115856309A
CN115856309A CN202211257679.3A CN202211257679A CN115856309A CN 115856309 A CN115856309 A CN 115856309A CN 202211257679 A CN202211257679 A CN 202211257679A CN 115856309 A CN115856309 A CN 115856309A
Authority
CN
China
Prior art keywords
dpep1
cx3cl1
cpa2
clec10a
cxcl6
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211257679.3A
Other languages
English (en)
Inventor
雒晓东
曹红志
李卓
莫家仪
李哲
肖斌
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhuhai Carbon Cloud Intelligent Technology Co ltd
Guangdong Hospital of Traditional Chinese Medicine
Original Assignee
Zhuhai Carbon Cloud Intelligent Technology Co ltd
Guangdong Hospital of Traditional Chinese Medicine
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhuhai Carbon Cloud Intelligent Technology Co ltd, Guangdong Hospital of Traditional Chinese Medicine filed Critical Zhuhai Carbon Cloud Intelligent Technology Co ltd
Priority to CN202211257679.3A priority Critical patent/CN115856309A/zh
Publication of CN115856309A publication Critical patent/CN115856309A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Investigating Or Analysing Biological Materials (AREA)

Abstract

本发明提供了一种蛋白标志物在制备诊断帕金森或预测帕金森病的产品中的应用。其中,蛋白标志物包括CPA2和/或DPEP1。解决了现有技术中诊断或预测帕金森病的产品效果差的问题,适用于帕金森病诊断产品应用领域。

Description

蛋白标志物在制备诊断帕金森或预测帕金森病的产品中的 应用
技术领域
本发明涉及帕金森病诊断产品应用领域,具体而言,涉及一种蛋白标志物在制备诊断帕金森或预测帕金森病的产品中的应用。
背景技术
帕金森病(Parkinson’s disease,PD)是在中老年人群常见的神经系统退行性疾病,主要临床特征表现为震颤,肌强直及运动减少。PD作为最常见的神经性疾病之一,患者最早期的症状常常难以察觉,易被忽略。一直以来,PD的主要诊断方法依赖于个人的临床诊断(常规检察,自身疾病异常心电图等改变)、运动机能评估(通过调查清单统计HY或MDS-UPDRS等分数),和神经学检查。目前还没有血液或实验室检测来诊断非遗传性的帕金森病,这意味着需要病人出现某些身体症状才能确定疾病情况。由于没有决定性的筛查或实验,早期帕金森患者可能不符合临床诊断标准,这种特异性的缺乏也意味着病人可能被误诊患有帕金森病,从而导致错过治疗的最佳时期。
缺乏有效的早期诊断方法是PD患者中晚期预后差的主要因素。虽然英国帕金森病社会脑库(U.K.’s Parkinson’s Disease Society Brain Bank)是诊断PD的金标准,且帕金森病的诊断评定量表(MDS-UPDRS)逐渐成为更主流的临床诊断标准,但评定量表主要依赖于病人的主观认知,心理状态和运动症状,限制了在早期筛查中的应用。
影像学诊断确诊困难,2011年美国食品和药物管理局批准的DaTscan成像扫描,可以让医生查看大脑多巴胺系统的图像。DaTscan涉及注入放射性药物并与大脑中的多巴胺传递素结合(多巴胺的缺失是导致帕金森的原因之一)。但扫描的结果并不能显示是否患有帕金森,且成本较高并使病人每年接受较高剂量的辐射。
近年来,生物分子诊断被广泛用于疾病的早期筛查、辅助诊断,提高了患者的生存率。血脑脊液检测可检测多巴胺的水平高低;代谢物如5-羟色胺和吲哚醋酸含量降低;多巴胺β羟化酶降低;生长抑素明显降低及-氨基丁酸水平减低等。但患者代谢物质含量受个体因素影响较大,如环境因素、生活习惯和饮食习惯等,且存在标志物的敏感性或特异性不够的问题,缺少大量人群样本进行验证,导致临床应用上有所限制。我们需要更多的研究来了解生物复杂性,寻找更有效的分子诊断标志物是至关重要的。
其他神经系统疾病可能引起类似帕金森病的症状。帕金森氏症(Parkinsonism)这个术语是用来指一个病人有类似帕金森氏症的症状。大约15%的帕金森病是由其他疾病引起的。除了在小部分病例中发现的遗传原因外,帕金森样疾病(Parkinson-like diseases)没有治愈方法或已知原因,如进行性核上性麻痹(Progressive Supranuclear Palsy,PSP)、多系统萎缩(Multiple System Atrophy,MSA)和路易体痴呆。因此,亟需寻找可以用于诊断PD早期患者、区分帕金森氏症的生物标志物,以施行病人的个性化治疗。
发明内容
本发明的主要目的在于提供一种蛋白标志物在制备诊断帕金森或预测帕金森病的产品中的应用,以解决现有技术中诊断或预测帕金森病的产品效果差的问题。
为了实现上述目的,根据本发明的第一个方面,提供了一种蛋白标志物在制备诊断帕金森或预测帕金森病的产品中的应用,该蛋白标志物包括CPA2和/或DPEP1。
进一步地,蛋白标志物还包括如下任意一种或多种:CXCL6、IL17C、CCL19、CCL27、GPNMB、FGF23、IL32、PSME1或TBCB;优选地,蛋白标志物进一步包括CX3CL1、CLEC10A、IL10、NTRK3、SNCG、PMVK、PTPN中的任意一种或多种。
进一步地,蛋白标志物选自如下任意一组:(1)CCL19、CX3CL1、IL10、CPA2及DPEP1;或(2)CCL19、CX3CL1、IL.17C、CPA2及DPEP1;或(3)CCL19、IL10、CPA2、NTRK3及DPEP1;或(4)CCL19、CX3CL1、CPA2及DPEP1;或(5)CX3CL1、IL10、CPA2及DPEP1;或(6)CX3CL1、CXCL6、IL.17C、CPA2及PMVK;或(7)CX3CL1、CXCL6、IL.17C、CPA2及PTPN1;或(8)CX3CL1、CXCL6、CPA2、GPNMB及PTPN1;或(9)CX3CL1、CXCL6、CPA2、GPNMB及PMVK;或(10)CX3CL1、CXCL6、IL.17C、CPA2及TBCB;或(11)CLEC10A、CPA2、NTRK3及SNCG;或(12)CLEC10A、CPA2、NTRK3及DPEP1;或(13)CLEC10A、CPA2、NTRK3、DPEP1及SNCG;或(14)IL10、CLEC10A、CPA2、NTRK3及SNCG;或(15)CLEC10A、NTRK3及DPEP1;或(16)CX3CL1、CXCL6、IL10、CLEC10A及DPEP1;或(17)CX3CL1、CXCL6、IL.17C、CLEC10A及DPEP1;或(18)CX3CL1、CXCL6、CLEC10A及DPEP1;或(19)CX3CL1、CXCL6、CLEC10A、DPEP1及PSME1;或(20)CX3CL1、CXCL6、FGF.23、CLEC10A及DPEP1;或(21)IL10、CCL27及DPEP1;或(22)IL10、CPA2及DPEP1;或(23)IL10、CCL27、DPEP1及IL32;或(24)IL10、CLEC10A、CPA2及DPEP1;或(25)IL10、CLEC10A及DPEP1;或(26)CPA2及DPEP1;或(27)CPA2、DPEP1及CX3CL1;或(28)CPA2、DPEP1、CX3CL1及CLEC10A;或(29)CPA2、DPEP1、CX3CL1、CLEC10A及IL10。
进一步地,应用包括利用检测试剂检测蛋白标志物的含量;优选地,蛋白标志物的含量的检测方法包括Olink技术、免疫印迹实验或酶联免疫吸附测定;优选地,检测试剂为蛋白标志物的抗体;优选地,抗体设置在固相载体上;优选地,固相载体包括酶标板、膜载体或微球;优选地,膜载体选自硝酸纤维素膜、玻璃纤维素膜或尼龙膜;优选地,抗体为单克隆抗体或多克隆抗体;优选地,相关产品包括试剂盒或电子预测装置。
为了实现上述目的,根据本发明的第二个方面,提供了一种用于在受试者中诊断帕金森病或预测帕金森病的试剂盒,该试剂盒包括检测蛋白标志物的含量的检测试剂,蛋白标志物包括CPA2和/或DPEP1。
进一步地,蛋白标志物还包括如下任意一种或多种:CXCL6、IL17C、CCL19、CCL27、GPNMB、FGF23、IL32、PSME1或TBCB;优选地,蛋白标志物进一步包括CX3CL1、CLEC10A、IL10、NTRK3、SNCG、PMVK、PTPN中的任意一种或多种;优选地,蛋白标志物包括:(1)CCL19、CX3CL1、IL10、CPA2及DPEP1;或(2)CCL19、CX3CL1、IL.17C、CPA2及DPEP1;或(3)CCL19、IL10、CPA2、NTRK3及DPEP1;或(4)CCL19、CX3CL1、CPA2及DPEP1;或(5)CX3CL1、IL10、CPA2及DPEP1;或(6)CX3CL1、CXCL6、IL.17C、CPA2及PMVK;或(7)CX3CL1、CXCL6、IL.17C、CPA2及PTPN1;或(8)CX3CL1、CXCL6、CPA2、GPNMB及PTPN1;或(9)CX3CL1、CXCL6、CPA2、GPNMB及PMVK;或(10)CX3CL1、CXCL6、IL.17C、CPA2及TBCB;或(11)CLEC10A、CPA2、NTRK3及SNCG;或(12)CLEC10A、CPA2、NTRK3及DPEP1;或(13)CLEC10A、CPA2、NTRK3、DPEP1及SNCG;或(14)IL10、CLEC10A、CPA2、NTRK3及SNCG;或(15)CLEC10A、NTRK3及DPEP1;或(16)CX3CL1、CXCL6、IL10、CLEC10A及DPEP1;或(17)CX3CL1、CXCL6、IL.17C、CLEC10A及DPEP1;或(18)CX3CL1、CXCL6、CLEC10A及DPEP1;或(19)CX3CL1、CXCL6、CLEC10A、DPEP1及PSME1;或(20)CX3CL1、CXCL6、FGF.23、CLEC10A及DPEP1;或(21)IL10、CCL27及DPEP1;或(22)IL10、CPA2及DPEP1;或(23)IL10、CCL27、DPEP1及IL32;或(24)IL10、CLEC10A、CPA2及DPEP1;或(25)IL10、CLEC10A及DPEP1;或(26)CPA2及DPEP1;或(27)CPA2、DPEP1及CX3CL1;或(28)CPA2、DPEP1、CX3CL1及CLEC10A;或(29)CPA2、DPEP1、CX3CL1、CLEC10A及IL10。
为了实现上述目的,根据本发明的第三个方面,提供了一种诊断帕金森病或预测帕金森病的电子装置,该装置包括:获取检测模块,被设置为获取生物样品,对生物样品进行检测,获得生物样品中的蛋白标志物的含量;诊断或预测模块,诊断或预测模块是使用逻辑回归模型、支持向量机模型或朴素贝叶斯模型和蛋白标志物的含量建立回归方程,构建模型,然后根据模型输出预测结果;优选地,生物样品为血浆样品;进一步地,生物样品中的蛋白标志物包括CPA2和/或DPEP1;优选地,生物样品中的蛋白标志物还包括如下任意一种或多种:CXCL6、IL17C、CCL19、CCL27、GPNMB、FGF23、IL32、PSME1或TBCB;优选地,蛋白标志物进一步包括CX3CL1、CLEC10A、IL10、NTRK3、SNCG、PMVK、PTPN中的任意一种或多种;优选地,蛋白标志物包括:(1)CCL19、CX3CL1、IL10、CPA2及DPEP1;或(2)CCL19、CX3CL1、IL.17C、CPA2及DPEP1;或(3)CCL19、IL10、CPA2、NTRK3及DPEP1;或(4)CCL19、CX3CL1、CPA2及DPEP1;或(5)CX3CL1、IL10、CPA2及DPEP1;或(6)CX3CL1、CXCL6、IL.17C、CPA2及PMVK;或(7)CX3CL1、CXCL6、IL.17C、CPA2及PTPN1;或(8)CX3CL1、CXCL6、CPA2、GPNMB及PTPN1;或(9)CX3CL1、CXCL6、CPA2、GPNMB及PMVK;或(10)CX3CL1、CXCL6、IL.17C、CPA2及TBCB;或(11)CLEC10A、CPA2、NTRK3及SNCG;或(12)CLEC10A、CPA2、NTRK3及DPEP1;或(13)CLEC10A、CPA2、NTRK3、DPEP1及SNCG;或(14)IL10、CLEC10A、CPA2、NTRK3及SNCG;或(15)CLEC10A、NTRK3及DPEP1;或(16)CX3CL1、CXCL6、IL10、CLEC10A及DPEP1;或(17)CX3CL1、CXCL6、IL.17C、CLEC10A及DPEP1;或(18)CX3CL1、CXCL6、CLEC10A及DPEP1;或(19)CX3CL1、CXCL6、CLEC10A、DPEP1及PSME1;或(20)CX3CL1、CXCL6、FGF.23、CLEC10A及DPEP1;或(21)IL10、CCL27及DPEP1;或(22)IL10、CPA2及DPEP1;或(23)IL10、CCL27、DPEP1及IL32;或(24)IL10、CLEC10A、CPA2及DPEP1;或(25)IL10、CLEC10A及DPEP1;或(26)CPA2及DPEP1;或(27)CPA2、DPEP1及CX3CL1;或(28)CPA2、DPEP1、CX3CL1及CLEC10A;或(29)CPA2、DPEP1、CX3CL1、CLEC10A及IL10;优选地,所述根据模型输出预测结果为使用predict函数的type='response',输出概率值,概率值≥0.5,则表示患有帕金森病或风险高,概率值<0.5,则表示不患有帕金森病或风险低。
为了实现上述目的,根据本发明的第四个方面,提供了一种诊断帕金森病或预测帕金森病的蛋白标志物的筛选方法,该筛选方法包括:获取样本人群的患帕金森病情况和生物样品,对生物样品进行检测,获得生物样品中的蛋白含量,样本人群包括健康人和帕金森患者;根据蛋白含量,通过统计方法筛选在帕金森患者和健康人中有差异的显著差异蛋白;利用样本人群的显著差异蛋白的含量和患帕金森病情况,通过机器学习训练的方法,构建预测模型;在预测模型中出现次数高于阈值的蛋白即为蛋白标志物。
进一步地,随机切分的次数为多次,构建预测模型的次数为多次,对预测模型进行多次交叉验证;优选地,统计方法包括如下任意一种或多种:T检验、广义线性模型、秩检验、逻辑回归、差异倍数、多重假设检验校正或克鲁斯卡尔沃里斯检验;优选地,生物样品包括血浆;优选地,构建预测模型包括:将样本人群分为训练集和测试集,建立训练集或测试集的显著差异蛋白的含量和患帕金森病情况的映射关系,分别得到训练数据集或测试数据集;通过机器学习训练的方法,并采用五折交叉验证,构建预测模型;优选地,机器学习训练包括如下任意一种或多种:逻辑回归模型、支持向量机模型或朴素贝叶斯模型;优选地,构建预测模型过程中,利用分析方法分析建模效果;优选地,分析方法包括套索回归、贝叶斯信息准则或逐步回归中的一种或多种。
为了实现上述目的,根据本发明的第五个方面,提供了一种诊断模型的构建方法,利用上述筛选方法获得的蛋白标志物,应用机器学习训练的方法构建诊断模型。
进一步地,蛋白标志物包括CPA2和/或DPEP1;优选地,蛋白标志物还包括如下任意一种或多种:CXCL6、IL17C、CCL19、CCL27、GPNMB、FGF23、IL32、PSME1或TBCB;优选地,蛋白标志物进一步包括CX3CL1、CLEC10A、IL10、NTRK3、SNCG、PMVK、PTPN中的任意一种或多种;优选地,蛋白标志物包括:(1)CCL19、CX3CL1、IL10、CPA2及DPEP1;或(2)CCL19、CX3CL1、IL.17C、CPA2及DPEP1;或(3)CCL19、IL10、CPA2、NTRK3及DPEP1;或(4)CCL19、CX3CL1、CPA2及DPEP1;或(5)CX3CL1、IL10、CPA2及DPEP1;或(6)CX3CL1、CXCL6、IL.17C、CPA2及PMVK;或(7)CX3CL1、CXCL6、IL.17C、CPA2及PTPN1;或(8)CX3CL1、CXCL6、CPA2、GPNMB及PTPN1;或(9)CX3CL1、CXCL6、CPA2、GPNMB及PMVK;或(10)CX3CL1、CXCL6、IL.17C、CPA2及TBCB;或(11)CLEC10A、CPA2、NTRK3及SNCG;或(12)CLEC10A、CPA2、NTRK3及DPEP1;或(13)CLEC10A、CPA2、NTRK3、DPEP1及SNCG;或(14)IL10、CLEC10A、CPA2、NTRK3及SNCG;或(15)CLEC10A、NTRK3及DPEP1;或(16)CX3CL1、CXCL6、IL10、CLEC10A及DPEP1;或(17)CX3CL1、CXCL6、IL.17C、CLEC10A及DPEP1;或(18)CX3CL1、CXCL6、CLEC10A及DPEP1;或(19)CX3CL1、CXCL6、CLEC10A、DPEP1及PSME1;或(20)CX3CL1、CXCL6、FGF.23、CLEC10A及DPEP1;或(21)IL10、CCL27及DPEP1;或(22)IL10、CPA2及DPEP1;或(23)IL10、CCL27、DPEP1及IL32;或(24)IL10、CLEC10A、CPA2及DPEP1;或(25)IL10、CLEC10A及DPEP1;或(26)CPA2及DPEP1;或(27)CPA2、DPEP1及CX3CL1;或(28)CPA2、DPEP1、CX3CL1及CLEC10A;或(29)CPA2、DPEP1、CX3CL1、CLEC10A及IL10。
为了实现上述目的,根据本发明的第六个方面,提供了一种计算机可读存储介质,该存储介质包括存储的程序,其中,在程序运行时,控制存储介质所在设备执行上述筛选方法、构建方法或诊断模型。
为了实现上述目的,根据本发明的第七个方面,提供了一种处理器,该处理器用于运行程序,其中,程序运行时执行上述筛选方法、构建方法诊断模型。
为了实现上述目的,根据本发明的第八个方面,提供了一种筛选诊断帕金森病或预测帕金森病的蛋白标志物的装置,该装置包括:获取检测模块,被设置为获取样本人群的患帕金森病情况和生物样品,对生物样品进行检测,获得生物样品中的蛋白含量,样本人群包括健康人和帕金森患者;差异统计模块,被设置为根据蛋白含量,通过统计方法筛选在帕金森患者和健康人中有差异的显著差异蛋白;模型构建模块,被设置为利用样本人群的显著差异蛋白的含量和患帕金森病情况,构建多个预测模型;标志物确定模块,被设置为在多个预测模型中出现次数高于阈值的蛋白即为蛋白标志物。
进一步地,生物样品中的待检测蛋白包括CPA2和/或DPEP1;优选地,待检测蛋白还包括如下任意一种或多种:CXCL6、IL17C、CCL19、CCL27、GPNMB、FGF23、IL32、PSME1或TBCB;优选地,待检测蛋白进一步包括CX3CL1、CLEC10A、IL10、NTRK3、SNCG、PMVK、PTPN中的任意一种或多种。
应用本发明的技术方案,筛选了一批能够诊断或预测帕金森病早期的蛋白标志物,利用这些蛋白标志物中的一种或多种,能够制备诊断帕金森病或预测帕金森病的产品,便于诊断或预测受试者患帕金森病的情况或风险,提高诊断或预测的效果。
附图说明
构成本申请的一部分的说明书附图用来提供对本发明的进一步理解,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1示出了根据本发明实施例1的18个蛋白标志物组成的预测模型的ROC曲线示意图。
图2示出了根据本发明实施例1的5个蛋白标志物组成的预测模型的ROC曲线示意图。
具体实施方式
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将结合实施例来详细说明本发明。
如背景技术所提到的,现有技术对于帕金森病、尤其是早期帕金森病的诊断难以满足需求,本申请提供了能够从蛋白分子的角度鉴别帕金森病的生物标志物,通过获取蛋白标志物的含量,通过模型计算给出预测概率,可协助诊断帕金森病,为受试者提供更明确和有效的诊断结果。
因而,在本申请中发明人尝试对受试者的蛋白进行筛选,发现了与帕金森病相关的蛋白标志物,利用其中的一种或多种蛋白标志物,能够制备诊断帕金森病或预测帕金森病的产品,预测受试者的帕金森病病情或患帕金森病风险,因而提出了本申请的一系列保护方案。
在本申请第一种典型的实施方式中,提供了一种蛋白标志物在制备诊断帕金森或预测帕金森病的产品中的应用,该蛋白标志物包括CPA2和/或DPEP1。
在一种优选的实施例中,蛋白标志物还包括如下任意一种或多种:CXCL6、IL17C、CCL19、CCL27、GPNMB、FGF23、IL32、PSME1或TBCB;优选地,蛋白标志物进一步包括CX3CL1、CLEC10A、IL10、NTRK3、SNCG、PMVK、PTPN中的任意一种或多种。
在一种优选的实施例中,蛋白标志物选自如下任意一组:(1)CCL19、CX3CL1、IL10、CPA2及DPEP1;或(2)CCL19、CX3CL1、IL.17C、CPA2及DPEP1;或(3)CCL19、IL10、CPA2、NTRK3及DPEP1;或(4)CCL19、CX3CL1、CPA2及DPEP1;或(5)CX3CL1、IL10、CPA2及DPEP1;或(6)CX3CL1、CXCL6、IL.17C、CPA2及PMVK;或(7)CX3CL1、CXCL6、IL.17C、CPA2及PTPN1;或(8)CX3CL1、CXCL6、CPA2、GPNMB及PTPN1;或(9)CX3CL1、CXCL6、CPA2、GPNMB及PMVK;或(10)CX3CL1、CXCL6、IL.17C、CPA2及TBCB;或(11)CLEC10A、CPA2、NTRK3及SNCG;或(12)CLEC10A、CPA2、NTRK3及DPEP1;或(13)CLEC10A、CPA2、NTRK3、DPEP1及SNCG;或(14)IL10、CLEC10A、CPA2、NTRK3及SNCG;或(15)CLEC10A、NTRK3及DPEP1;或(16)CX3CL1、CXCL6、IL10、CLEC10A及DPEP1;或(17)CX3CL1、CXCL6、IL.17C、CLEC10A及DPEP1;或(18)CX3CL1、CXCL6、CLEC10A及DPEP1;或(19)CX3CL1、CXCL6、CLEC10A、DPEP1及PSME1;或(20)CX3CL1、CXCL6、FGF.23、CLEC10A及DPEP1;或(21)IL10、CCL27及DPEP1;或(22)IL10、CPA2及DPEP1;或(23)IL10、CCL27、DPEP1及IL32;或(24)IL10、CLEC10A、CPA2及DPEP1;或(25)IL10、CLEC10A及DPEP1;或(26)CPA2及DPEP1;或(27)CPA2、DPEP1及CX3CL1;或(28)CPA2、DPEP1、CX3CL1及CLEC10A;或(29)CPA2、DPEP1、CX3CL1、CLEC10A及IL10。
蛋白质组学是以蛋白质组为研究对象,研究细胞、组织或生物体蛋白质组成及其变化规律的科学。自基因组学之后,蛋白质组学研究成为理解复杂生物系统的新前沿方向。研究证明蛋白质组学在鉴定疾病相关生物标志物、监测疾病进展、评价治疗响应效果等方面具有极大的潜力。此外,由于蛋白质作为靶分子的作用,它在药物开发中也具有重要的作用。
上述蛋白标志物和蛋白标志物的组合,其具有制备诊断帕金森或预测帕金森病的产品的能力。利用上述产品,能够判断受试者是否患有帕金森或预测患帕金森病的风险。此种判断和预测的能力和效果,在进行该实施方式前是无法预计的。在本申请中帕金森和帕金森病均指神经系统变性疾病Parkinson's disease(PD)。
在一种优选的实施例中,应用包括利用检测试剂检测蛋白标志物的含量;优选地,蛋白标志物的含量的检测方法包括但不限于Olink技术、免疫印迹实验(western blot)或酶联免疫吸附测定(ELISA);优选地,检测试剂为蛋白标志物的抗体;优选地,抗体设置在固相载体上;优选地,固相载体包括酶标板、膜载体或微球;优选地,膜载体选自硝酸纤维素膜、玻璃纤维素膜或尼龙膜;优选地,抗体为单克隆抗体或多克隆抗体;优选地,相关产品包括试剂盒或电子预测装置。
所有临床上检测蛋白的方法均适用于本申请,相应地检测试剂也随着不同的检测方法而选用。抗体优选设置为预包被的形式。优选地,预包被的抗体包被于固相载体上;具体的固相载体根据需要合理设计。更优选,固相载体包括酶标板(多为聚苯乙烯材料的)、膜载体或微球;进一步优选地,膜载体包括硝酸纤维素膜(使用最广泛)、玻璃纤维素膜或尼龙膜,更进一步优选地,膜载体上还包被有阳性对照物,相应的蛋白标志物和阳性对照物按检测顺序在硝酸纤维素膜上依次设置。
在上述应用中,利用检测试剂能够检测出蛋白标志物的含量,利用该检测出的含量,能够对帕金森病进行判断或预测。利用Olink技术等蛋白组学、或western blot、ELISA等现有技术,利用抗体等常见检测试剂,能够从生物样品中检测多种蛋白标志物的含量,所需样品量小,准确度高,能够对多种蛋白标志物在生物样品中的含量进行检测,进一步地对帕金森病进行诊断或预测。上述检测方法中所用的检测试剂,均为相应方法中的常规检测试剂。诊断帕金森病或预测帕金森病的相关产品包括但不限于试剂盒或电子预测装置。
在本申请第二种典型的实施方式中,提供了一种用于在受试者中诊断帕金森病或预测帕金森病的试剂盒,该试剂盒包括检测蛋白标志物的含量的检测试剂,蛋白标志物包括CPA2和/或DPEP1。
在一种优选的实施例中,蛋白标志物还包括如下任意一种或多种:CXCL6、IL17C、CCL19、CCL27、GPNMB、FGF23、IL32、PSME1或TBCB;优选地,蛋白标志物进一步包括CX3CL1、CLEC10A、IL10、NTRK3、SNCG、PMVK、PTPN中的任意一种或多种;优选地,蛋白标志物包括:(1)CCL19、CX3CL1、IL10、CPA2及DPEP1;或(2)CCL19、CX3CL1、IL.17C、CPA2及DPEP1;或(3)CCL19、IL10、CPA2、NTRK3及DPEP1;或(4)CCL19、CX3CL1、CPA2及DPEP1;或(5)CX3CL1、IL10、CPA2及DPEP1;或(6)CX3CL1、CXCL6、IL.17C、CPA2及PMVK;或(7)CX3CL1、CXCL6、IL.17C、CPA2及PTPN1;或(8)CX3CL1、CXCL6、CPA2、GPNMB及PTPN1;或(9)CX3CL1、CXCL6、CPA2、GPNMB及PMVK;或(10)CX3CL1、CXCL6、IL.17C、CPA2及TBCB;或(11)CLEC10A、CPA2、NTRK3及SNCG;或(12)CLEC10A、CPA2、NTRK3及DPEP1;或(13)CLEC10A、CPA2、NTRK3、DPEP1及SNCG;或(14)IL10、CLEC10A、CPA2、NTRK3及SNCG;或(15)CLEC10A、NTRK3及DPEP1;或(16)CX3CL1、CXCL6、IL10、CLEC10A及DPEP1;或(17)CX3CL1、CXCL6、IL.17C、CLEC10A及DPEP1;或(18)CX3CL1、CXCL6、CLEC10A及DPEP1;或(19)CX3CL1、CXCL6、CLEC10A、DPEP1及PSME1;或(20)CX3CL1、CXCL6、FGF.23、CLEC10A及DPEP1;或(21)IL10、CCL27及DPEP1;或(22)IL10、CPA2及DPEP1;或(23)IL10、CCL27、DPEP1及IL32;或(24)IL10、CLEC10A、CPA2及DPEP1;或(25)IL10、CLEC10A及DPEP1;或(26)CPA2及DPEP1;或(27)CPA2、DPEP1及CX3CL1;或(28)CPA2、DPEP1、CX3CL1及CLEC10A;或(29)CPA2、DPEP1、CX3CL1及CLEC10A、IL10。
该试剂盒包括检测上述一种或多种蛋白标志物的含量的检测试剂,利用该检测试剂和相应的检测方法、检测设备,能够检测蛋白标志物的含量。优选地,检测试剂包括利用Olink技术等现有技术检测蛋白标志物所需的检测试剂。
在本申请第三种典型的实施方式中,提供了一种诊断帕金森病或预测帕金森病的电子装置,该装置包括:获取检测模块,被设置为获取生物样品,对生物样品进行检测,获得生物样品中的蛋白标志物的含量;诊断或预测模块,诊断或预测模块是使用逻辑回归模型、支持向量机模型或朴素贝叶斯模型和蛋白标志物的含量建立回归方程,构建模型,然后根据模型输出预测结果;在一种优选的实施例中,生物样品为血浆样品;优选地,生物样品中的蛋白标志物包括CPA2和/或DPEP1;优选地,生物样品中的蛋白标志物还包括如下任意一种或多种:CXCL6、IL17C、CCL19、CCL27、GPNMB、FGF23、IL32、PSME1或TBCB;优选地,蛋白标志物进一步包括CX3CL1、CLEC10A、IL10、NTRK3、SNCG、PMVK、PTPN中的任意一种或多种;优选地,蛋白标志物包括:(1)CCL19、CX3CL1、IL10、CPA2及DPEP1;或(2)CCL19、CX3CL1、IL.17C、CPA2及DPEP1;或(3)CCL19、IL10、CPA2、NTRK3及DPEP1;或(4)CCL19、CX3CL1、CPA2及DPEP1;或(5)CX3CL1、IL10、CPA2及DPEP1;或(6)CX3CL1、CXCL6、IL.17C、CPA2及PMVK;或(7)CX3CL1、CXCL6、IL.17C、CPA2及PTPN1;或(8)CX3CL1、CXCL6、CPA2、GPNMB及PTPN1;或(9)CX3CL1、CXCL6、CPA2、GPNMB及PMVK;或(10)CX3CL1、CXCL6、IL.17C、CPA2及TBCB;或(11)CLEC10A、CPA2、NTRK3及SNCG;或(12)CLEC10A、CPA2、NTRK3及DPEP1;或(13)CLEC10A、CPA2、NTRK3、DPEP1及SNCG;或(14)IL10、CLEC10A、CPA2、NTRK3及SNCG;或(15)CLEC10A、NTRK3及DPEP1;或(16)CX3CL1、CXCL6、IL10、CLEC10A及DPEP1;或(17)CX3CL1、CXCL6、IL.17C、CLEC10A及DPEP1;或(18)CX3CL1、CXCL6、CLEC10A及DPEP1;或(19)CX3CL1、CXCL6、CLEC10A、DPEP1及PSME1;或(20)CX3CL1、CXCL6、FGF.23、CLEC10A及DPEP1;或(21)IL10、CCL27及DPEP1;或(22)IL10、CPA2及DPEP1;或(23)IL10、CCL27、DPEP1及IL32;或(24)IL10、CLEC10A、CPA2及DPEP1;或(25)IL10、CLEC10A及DPEP1;或(26)CPA2及DPEP1;或(27)CPA2、DPEP1及CX3CL1;或(28)CPA2、DPEP1、CX3CL1及CLEC10A;或(29)CPA2、DPEP1、CX3CL1、CLEC10A及IL10;优选地,所述根据模型输出预测结果为使用predict函数的type='response',输出概率值,概率值≥0.5,则表示患有帕金森病或风险高,概率值<0.5,则表示不患有帕金森病或风险低。
在本申请第四种典型的实施方式中,提供了一种诊断帕金森病或预测帕金森病的蛋白标志物的筛选方法,该筛选方法包括:获取样本人群的患帕金森病情况和生物样品,对生物样品进行检测,获得生物样品中的蛋白含量,样本人群包括健康人和帕金森患者;根据蛋白含量,通过统计方法筛选在帕金森患者和健康人中有差异的显著差异蛋白;利用样本人群的显著差异蛋白的含量和患帕金森病情况,通过机器学习训练的方法,构建预测模型;在预测模型中出现次数高于阈值的蛋白即为蛋白标志物。
在上述蛋白标志物的筛选方法中,首先获取包括健康人和帕金森患者的样本人群的生物样品和患帕金森病情况。对生物样品进行蛋白检测,选取一定数量的蛋白作为待检测,对生物样品中的待检测蛋白进行检测,得到每个生物样品中的待检测蛋白的含量。使用统计方法检验在帕金森病患者和健康人中有差异的蛋白,即为显著差异蛋白。显著差异蛋白说明,这些蛋白在样本人群中存在的量的多少,与患病情况是有关系的,在健康人和帕金森患者体内,显著差异蛋白的量有显著性差异,但无法确认显著差异蛋白对诊断或预测有怎样的具体效果,也不清楚如何进行诊断或预测。为了保证和提高诊断或预测帕金森病的效果,利用机器学习等方法,对样本人群的显著差异蛋白的含量和患病情况进行建模,构建能够诊断或预测帕金森病的预测模型,预测模型中出现的蛋白,均为从显著差异蛋白中筛选出的、次数高于阈值的、预测效果好的蛋白,即为蛋白标志物。
在一种优选的实施例中,随机切分的次数为多次,构建预测模型的次数为多次,对预测模型进行多次交叉验证;优选地,统计方法包括如下任意一种或多种:T检验、广义线性模型、秩检验、逻辑回归、差异倍数、多重假设检验校正或克鲁斯卡尔沃里斯检验;优选地,生物样品包括血浆;优选地,构建预测模型包括:将样本人群分为训练集和测试集,建立训练集或测试集的显著差异蛋白的含量和患帕金森病情况的映射关系,分别得到训练数据集或测试数据集;利用训练数据集进行机器学习训练,构建预测模型;通过机器学习训练的方法,并采用五折交叉验证,构建预测模型;优选地,机器学习训练包括如下任意一种或多种:逻辑回归模型、支持向量机模型或朴素贝叶斯模型;优选地,构建预测模型过程中,利用分析方法分析建模效果;优选地,分析方法包括LASSO regression(套索回归)、BIC(贝叶斯信息准则)、逐步回归中的一种或多种。
上述用于判断显著差异蛋白的统计方法包括但不限于T-test(T检验)、Wilcoxontest(秩检验)、逻辑回归、KW test(克鲁斯卡尔沃里斯检验)、差异倍数(Fold Change)、多重假设检验校正(Bonferroni correction)或其他现有统计方法中的一种或多种。构建预测模型时,将每个样本的患病情况和显著差异蛋白含量进行汇总,得到汇总的不同个体的数据,进行机器学习训练,并采用五折交叉验证,构建预测模型。
机器学习训练包括但不限于逻辑回归模型,SVM(support vector machines,支持向量机),NBM(
Figure BDA0003887559500000091
Bayesian Model,朴素贝叶斯模型)中的一种或多种。利用上述不同的机器学习方法,能够构建不同预测模型,在五折交叉验证过程中,将不同预测模型的验证结果进行比较,能够获得预测效果最好的模型。在建立预测模型的过程中,利用了包括但不限于LASSO regression(套索回归)、BIC(贝叶斯信息准则)、逐步回归中的一种或多种的分析方法,对建立的预测模型进行分析,选取有效性高的预测模型。
在本申请第五种典型的实施方式中,提供了一种诊断模型的构建方法,利用上述筛选方法获得的蛋白标志物,应用机器学习训练的方法构建诊断模型,所述机器学习训练的方法包括逻辑回归、支持向量机或朴素贝叶斯模型,优选逻辑回归模型。
在一种优选的实施例中,蛋白标志物包括CPA2和/或DPEP1;优选地,蛋白标志物还包括如下任意一种或多种:CXCL6、IL17C、CCL19、CCL27、GPNMB、FGF23、IL32、PSME1或TBCB;优选地,蛋白标志物进一步包括CX3CL1、CLEC10A、IL10、NTRK3、SNCG、PMVK、PTPN中的任意一种或多种;优选地,蛋白标志物包括:(1)CCL19、CX3CL1、IL10、CPA2及DPEP1;或(2)CCL19、CX3CL1、IL.17C、CPA2及DPEP1;或(3)CCL19、IL10、CPA2、NTRK3及DPEP1;或(4)CCL19、CX3CL1、CPA2及DPEP1;或(5)CX3CL1、IL10、CPA2及DPEP1;或(6)CX3CL1、CXCL6、IL.17C、CPA2及PMVK;或(7)CX3CL1、CXCL6、IL.17C、CPA2及PTPN1;或(8)CX3CL1、CXCL6、CPA2、GPNMB及PTPN1;或(9)CX3CL1、CXCL6、CPA2、GPNMB及PMVK;或(10)CX3CL1、CXCL6、IL.17C、CPA2及TBCB;或(11)CLEC10A、CPA2、NTRK3及SNCG;或(12)CLEC10A、CPA2、NTRK3及DPEP1;或(13)CLEC10A、CPA2、NTRK3、DPEP1及SNCG;或(14)IL10、CLEC10A、CPA2、NTRK3及SNCG;或(15)CLEC10A、NTRK3及DPEP1;或(16)CX3CL1、CXCL6、IL10、CLEC10A及DPEP1;或(17)CX3CL1、CXCL6、IL.17C、CLEC10A及DPEP1;或(18)CX3CL1、CXCL6、CLEC10A及DPEP1;或(19)CX3CL1、CXCL6、CLEC10A、DPEP1及PSME1;或(20)CX3CL1、CXCL6、FGF.23、CLEC10A及DPEP1;或(21)IL10、CCL27及DPEP1;或(22)IL10、CPA2及DPEP1;或(23)IL10、CCL27、DPEP1及IL32;或(24)IL10、CLEC10A、CPA2及DPEP1;或(25)IL10、CLEC10A及DPEP1;或(26)CPA2及DPEP1;或(27)CPA2、DPEP1及CX3CL1;或(28)CPA2、DPEP1、CX3CL1及CLEC10A;或(29)CPA2、DPEP1、CX3CL1、CLEC10A及IL10。
在本申请第六种典型的实施方式中,提供了一种计算机可读存储介质,该存储介质包括存储的程序,其中,在程序运行时,控制存储介质所在设备执行上述筛选方法、构建方法或构建模型。
在本申请第七种典型的实施方式中,提供了一种处理器,该处理器用于运行程序,其中,程序运行时执行上述筛选方法、构建方法或诊断模型。
本申请可用于众多通用或专用的计算系统环境或配置中。例如:个人计算机、服务器计算机、手持设备或便携式设备、平板型设备、多处理器系统、基于微处理器的系统、置顶盒、可编程的消费电子设备、网络PC、小型计算机、大型计算机、包括以上任何系统或设备的分布式计算环境等等。
显然,本领域的技术人员应该明白,上述的本申请的部分模块或步骤可以在通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本申请不限制于任何特定的硬件和软件结合。
在本申请第八种典型的实施方式中,提供了一种筛选诊断帕金森病或预测帕金森病的蛋白标志物的装置,该装置包括:获取检测模块,被设置为获取样本人群的患帕金森病情况和生物样品,对生物样品进行检测,获得生物样品中的蛋白含量,样本人群包括健康人和帕金森患者;差异统计模块,被设置为根据蛋白含量,通过统计方法筛选在帕金森患者和健康人中有差异的显著差异蛋白;模型构建模块,被设置为利用样本人群的显著差异蛋白的含量和患帕金森病情况,构建多个预测模型;标志物确定模块,被设置为在多个预测模型中出现次数高于阈值的蛋白即为蛋白标志物。
在一种优选的实施例中,生物样品中的待检测蛋白包括CPA2和/或DPEP1;优选地,待检测蛋白还包括如下任意一种或多种:CXCL6、IL17C、CCL19、CCL27、GPNMB、FGF23、IL32、PSME1或TBCB;优选地,待检测蛋白进一步包括CX3CL1、CLEC10A、IL10、NTRK3、SNCG、PMVK、PTPN中的任意一种或多种。
利用上述装置,能够通过检测样本人群的生物样品中上述待检测蛋白的蛋白含量,筛选诊断帕金森病或预测帕金森病的蛋白标志物,便于在因受试者的区域、环境等因素影响蛋白标志物的预测效果时,对蛋白标志物进行筛选或更新、校正。
下面将结合具体的实施例来进一步详细解释本申请的有益效果。
实施例1:
1.材料与方法
1.1临床样本纳入
本项目研究对象选取帕金森病患者88例,对照组健康人88例,共176样本,所有患者均接受血液采样。纳入患者年龄区间28~85岁,其中男性样本85例,女性样本89例。
所有受试者在通过自制健康问卷调查表获取个体基本信息,包括年龄、性别、身高、BMI、吸烟、饮酒、便秘、抗生素使用等情况,如表1所示。
以上研究方案符合人体试验伦理学标准,并得到伦理委员会批准,受试者在受试前知情同意并签署知情同意书。
表1所有176个样本的临床资料
Figure BDA0003887559500000111
Figure BDA0003887559500000121
Figure BDA0003887559500000131
Figure BDA0003887559500000141
Figure BDA0003887559500000151
Figure BDA0003887559500000161
注:“/”表示该数据不存在。“NA”表示该数据缺失。BMI为身体质量指数(Body MassIndex,BMI)HY分数表示帕金森病HY分级,1=单侧患病;1.5=单侧患病合并躯干(轴)症状;2=双侧患病但无平衡障碍;2.5=轻度双侧患病,能从后拉试验中恢复;3=轻至中度双侧患病,不能从后拉实验恢复,但能自理;4=严重的残疾,但是能自己站立或行走,5=坐轮椅或卧床,完全依赖别人帮助。
1.2 Olink蛋白质检测平台
蛋白测序利用的Olink技术源自于瑞典一家名为Olink Proteomics的创新蛋白质组检测方案公司,采用了独有的称为邻近延伸分析(Proximity Extension Assay,PEA)的蛋白质组检测技术。PEA技术使用一对匹配的抗体,分别偶联独有的DNA寡核苷酸链,形成具有高特异性的探针,与待检测物结合后,相近的两条DNA链互补延伸,生成新的DNA分子模板;再通过qPCR扩增,放大信号进行检测。PCR扩增进行文库模板富集,氢氧化钠变性,产生单链DNA片段。测序和生物信息学分析工作在深圳碳云智能完成。
1.3样本质控
本平台运用邻近延伸分析(PEA)技术,对上述广中医项目的176份血浆样本中的274个蛋白指标进行检测与分析,共三张芯片(panel)。通过在每个样本中加入4个内部质控品,监控整体的检测质量和各个样本的检测质量。
一共检测三张芯片,每个芯片使用两个样本版,所以一共检测6次,如表2.1所示。
表2.1组合目录
Figure BDA0003887559500000162
整体质控是根据整板的内部质控品的标准偏差进行评估,标准差小于0.2方可通过质控。本项目的6次检测通过整体质控。具体如表2.2所示
单孔样本质控是通过计算每个样本内部质控品的值与整体质控品中值的偏差来评估,偏离中值不超过0.3的样本方可通过质量控制。在本项目的本次测试中,样本质控合格率整体为97%方可通过质控(合格率取整数,四舍五入后达到97%即可)。样本质控结果如表2.3所示。
表2.2整体质控各板标准偏差
Figure BDA0003887559500000171
表2.3样本质控合格率(%)
Figure BDA0003887559500000172
综合考虑Inflammation、Neuro Exploratory、Neurology3个数据集,选择在3个数据集中均合格的样本,则最终合格样本是170个,其中疾病组86个,健康组84个。
2.筛选显著差异蛋白
为了比较对照组和疾病组的蛋白物质,筛选在上述两组之间展现出差异的显著差异蛋白。本发明利用R软件来分析差异的蛋白物,利用统计方法,综合显著性统计检验(广义线性模型或T检验等)和差异倍数(Fold change)对170个样本的274个蛋白进行分析。当蛋白显著性统计检验其P值<0.05,视为显著差异蛋白。共得到31种显著差异蛋白,如表3所示。
表3帕金森病患者和健康人之间的31种显著差异蛋白
Figure BDA0003887559500000173
Figure BDA0003887559500000181
注:UniPort ID为此蛋白在UniPort数据库(www.uniport.org)中的编号。
2.1筛选疾病预测蛋白标志物
为了评价帕金森病的蛋白组学,即上述31种显著差异蛋白的诊断价值,申请人构建了可检测帕金森患者的逻辑回归模型。将上述170个样本分为70%数量的训练集和30%数量的测试集,其中训练集包括帕金森病患者57个样本和健康人66个样本,测试集包括帕金森病患者30个样本和健康人17个样本。将训练集或测试集的显著差异蛋白的含量和患帕金森病情况的映射关系,分别得到训练数据集或测试数据集。使用显著差异蛋白的含量和患帕金森病情况(即训练数据集)来训练逻辑回归模型,并利用利用BIC分析方法找到最优模型,从而确定对疾病影响最大的蛋白标志物(R.4.0.5,BMA3.18.15软件包)(AdrianRaftery,Jennifer Hoeting,Chris Volinsky,Ian Painter and Ka Yee Yeung(2021)),从而选择蛋白标志物的最优集。在测试集上测试该模型,并测定了预测误差。
①关于该回归模型,通过使用4.0.5版本R软件(R vision 4.0.5)中的“BMA3.18.1包”,输入训练数据集,包括训练集的31种显著差异蛋白的含量、患帕金森病情况(患病情况为矢量,1表示对照,0表示病例)。
②然后使用R软件中的BMA包的bic.glm函数来构建分类模型,并且使用该函数来筛选最佳的疾病预测模型。使用predict()函数预测该模型在测试集中的分类效果。bic.glm函数输出的是预测结果(变量对疾病影响概率(p!=0));估计模型偏差(EV),标准差(SD),五个潜在最佳模型(模型1–模型5)。如表4所示,后验概率越大、BIC越小时,模型最优。表4第一列表示蛋白种类,模型1、模型2、模型3、模型4、模型5列下有数字出现的即表示该模型包含该种蛋白,只有点(.)则表示不包括该蛋白。例如:模型1中包括的蛋白有CX3CL1、CXCL6、IL 17C、CPA2、PMVK。
表4.BIC后验概率最大前五个预测组合
Figure BDA0003887559500000191
Figure BDA0003887559500000201
③对模型进行五次重复的交叉验证(五折交叉验证)。
基于逻辑回归模型,使用贝叶斯模型平均法(BMC),进行五次重复验证,每次交叉验证时,都在固定患病组与健康组的比例的基础上,将170个样本随机分为70%数量的训练集和30%数量的测试集,所以五次验证的训练集均为123个样本(包括帕金森病患者57个样本和健康人66个样本)。贝叶斯模型平均法通过根据近似的后验模型概率(posteriorprobability—postprob)对模型类中的最佳模型进行平均。每一次均列出选择后验概率最大的前五个蛋白标志物的所有集合组合,则得到25个预测模型的组合,列于表5中。同时,按照出现次数对各蛋白进行了排序,出现的18种蛋白的排序情况如表6所示,其中出现次数最多的为DPEP1,CPA2,CX3CL1,CLEC10A,IL10。
表5. 25个预测模型组合
Figure BDA0003887559500000202
Figure BDA0003887559500000211
表4示出了进行一次交叉验证得到的5个模型;表5示出了共进行5次重复,共得到25个模型(包括表4中的5个模型)。
④计算各种预测模型组合的区分能力
计算上述25个预测模型的区分能力,其中尝试了多种方式进行验证随机显著差异蛋白组合的检测能力,比如利用逻辑回归模型、NBM模型和SVC模型,发现预测结果均比较好。下面以逻辑回归模型和BIC(贝叶斯信息准则法)为例进行效果说明。以下实施例中均将蛋白标志物的不同组合组建逻辑回归模型,利用训练数据集和BIC训练、筛选模型,并利用测试数据集验证模型,计算AUC等数值,如表5倒数3列所示,并计算了测试误差。使用预测模型计算帕金森病概率,并绘制ROC(R 4.0.5,pROC 1.18.0包)。
⑤蛋白标志物的筛选
上述模型1至25中共出现18种显著差异蛋白,即为18种用于组合预测模型的蛋白标志物,如表6所示。蛋白在各个模型出现的次数越多,表明这些蛋白是具有构建模型的关键作用的。
表6. 18种蛋白标志物
Figure BDA0003887559500000212
Figure BDA0003887559500000221
我们的研究结果表明,上述18种蛋白在训练集表现良好,如图1所示,ROC曲线的曲线下面积(AUC)为90.89%。
2.2利用筛选得到的蛋白标志物随机组合构建诊断模型
在2.1中筛选过程中出现频次越高,认为与帕金森病诊断的相关性越强,因此考查了出现频次排名前5(分别是IL10、CX3CL1、DPEP1、CLEC10A、CPA2)的蛋白在构建帕金森诊断模型中作用,分别研究了单个蛋白对疾病组与对照组的区分能力(结果如表7中判别AUC所示),和选择该5种蛋白中2种或3种或4种,训练获得诊断模型,在测试集中计算区分能力(结果如表8中AUC所示),并且如图2所示,以这5个蛋白训练得到的模型,其对帕金森疾病的判别效能为AUC=91.7%。需要说明的是:以上均是利用逻辑回归构建模型和利用贝叶斯信息准则法进行模型分析,然后根据得到的蛋白标志物绘制ROC曲线(接受者操作特征曲线),计算曲线下面积(AUC)作为判别模型效能评价参数。由表7和表8的结果可知,单个蛋白(IL10、CX3CL1、DPEP1、CLEC10A、CPA2)均具有一定的对帕金森疾病的区分能力,而以①CPA2、DPEP1或②CPA2、DPEP1、CX3CL1或③CPA2、DPEP1、CX3CL1、CLEC10A或④CPA2、DPEP1、CX3CL1、CLEC10A、IL10构建的诊断模型,其模型准确率(即AUC)达到了0.85以上。可见,IL10、CX3CL1、DPEP1、CLEC10A、CPA2确为与帕金森疾病诊断具有强相关性的蛋白标志物,以IL10、CX3CL1、DPEP1、CLEC10A、CPA2这5种蛋白中任选一个或多个均可用于建立帕金森疾病诊断模型,均可获得理想的效果。
尤其是以DEEP1和CPA2形成的蛋白组合用于预测帕金森疾病的准确率(AUC)也到了0.85(参见表8),这些结果足以支持以DEEP1和/或CPA2作为预测帕金森的风险标志物,具有高灵敏度和高特异性。DEEP1和/或CPA2,任选地与其它16种蛋白中任意一种或多种进行组合,以构建诊断模型,预测帕金森的效果更佳。
表7疾病组和对照组样本蛋白标志物最优集
Figure BDA0003887559500000222
表8前5个最重要的蛋白标志物所形成的组合
Figure BDA0003887559500000223
Figure BDA0003887559500000231
CPA2、DPEP1、CX3CL1、CLEC10A和IL10组成的最优集表现最佳,ROC曲线的曲线下面积(AUC)为91.7%(图2)。
从以上的描述中,可以看出,本发明上述的实施例实现了如下技术效果:本发明利用特定的蛋白标志物中的一种或多种,制备诊断帕金森病或预测帕金森病的产品,能够诊断或预测受试者的患帕金森病的情况或风险。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (15)

1.蛋白标志物在制备诊断帕金森或预测帕金森病的产品中的应用,其特征在于,所述蛋白标志物包括CPA2和/或DPEP1。
2.根据权利要求1所述的应用,其特征在于,所述蛋白标志物还包括如下任意一种或多种:CXCL6、IL17C、CCL19、CCL27、GPNMB、FGF23、IL32、PSME1或TBCB;
优选地,所述蛋白标志物进一步包括CX3CL1、CLEC10A、IL10、NTRK3、SNCG、PMVK、PTPN中的任意一种或多种。
3.根据权利要求2所述的应用,其特征在于,所述蛋白标志物选自如下任意一组:
(1)CCL19、CX3CL1、IL10、CPA2及DPEP1;或
(2)CCL19、CX3CL1、IL.17C、CPA2及DPEP1;或
(3)CCL19、IL10、CPA2、NTRK3及DPEP1;或
(4)CCL19、CX3CL1、CPA2及DPEP1;或
(5)CX3CL1、IL10、CPA2及DPEP1;或
(6)CX3CL1、CXCL6、IL.17C、CPA2及PMVK;或
(7)CX3CL1、CXCL6、IL.17C、CPA2及PTPN1;或
(8)CX3CL1、CXCL6、CPA2、GPNMB及PTPN1;或
(9)CX3CL1、CXCL6、CPA2、GPNMB及PMVK;或
(10)CX3CL1、CXCL6、IL.17C、CPA2及TBCB;或
(11)CLEC10A、CPA2、NTRK3及SNCG;或
(12)CLEC10A、CPA2、NTRK3及DPEP1;或
(13)CLEC10A、CPA2、NTRK3、DPEP1及SNCG;或
(14)IL10、CLEC10A、CPA2、NTRK3及SNCG;或
(15)CLEC10A、NTRK3及DPEP1;或
(16)CX3CL1、CXCL6、IL10、CLEC10A及DPEP1;或
(17)CX3CL1、CXCL6、IL.17C、CLEC10A及DPEP1;或
(18)CX3CL1、CXCL6、CLEC10A及DPEP1;或
(19)CX3CL1、CXCL6、CLEC10A、DPEP1及PSME1;或
(20)CX3CL1、CXCL6、FGF.23、CLEC10A及DPEP1;或
(21)IL10、CCL27及DPEP1;或
(22)IL10、CPA2及DPEP1;或
(23)IL10、CCL27、DPEP1及IL32;或
(24)IL10、CLEC10A、CPA2及DPEP1;或
(25)IL10、CLEC10A及DPEP1;或
(26)CPA2及DPEP1;或
(27)CPA2、DPEP1及CX3CL1;或
(28)CPA2、DPEP1、CX3CL1及CLEC10A;或
(29)CPA2、DPEP1、CX3CL1、CLEC10A及IL10。
4.根据权利要求1至3中任一项所述的应用,其特征在于,所述应用包括利用检测试剂检测所述蛋白标志物的含量;
优选地,所述蛋白标志物的含量的检测方法包括Olink技术、免疫印迹实验或酶联免疫吸附测定;
优选地,所述检测试剂为所述蛋白标志物的抗体;
优选地,所述抗体设置在固相载体上;
优选地,所述固相载体包括酶标板、膜载体或微球;
优选地,所述膜载体选自硝酸纤维素膜、玻璃纤维素膜或尼龙膜;
优选地,所述抗体为单克隆抗体或多克隆抗体;
优选地,所述相关产品包括试剂盒或电子预测装置。
5.一种用于在受试者中诊断帕金森病或预测帕金森病的试剂盒,其特征在于,所述试剂盒包括检测蛋白标志物的含量的检测试剂,所述蛋白标志物包括CPA2和/或DPEP1。
6.根据权利要求5所述的试剂盒,其特征在于,所述蛋白标志物还包括如下任意一种或多种:CXCL6、IL17C、CCL19、CCL27、GPNMB、FGF23、IL32、PSME1或TBCB;
优选地,所述蛋白标志物进一步包括CX3CL1、CLEC10A、IL10、NTRK3、SNCG、PMVK、PTPN中的任意一种或多种;
优选地,所述蛋白标志物包括:
(1)CCL19、CX3CL1、IL10、CPA2及DPEP1;或
(2)CCL19、CX3CL1、IL.17C、CPA2及DPEP1;或
(3)CCL19、IL10、CPA2、NTRK3及DPEP1;或
(4)CCL19、CX3CL1、CPA2及DPEP1;或
(5)CX3CL1、IL10、CPA2及DPEP1;或
(6)CX3CL1、CXCL6、IL.17C、CPA2及PMVK;或
(7)CX3CL1、CXCL6、IL.17C、CPA2及PTPN1;或
(8)CX3CL1、CXCL6、CPA2、GPNMB及PTPN1;或
(9)CX3CL1、CXCL6、CPA2、GPNMB及PMVK;或
(10)CX3CL1、CXCL6、IL.17C、CPA2及TBCB;或
(11)CLEC10A、CPA2、NTRK3及SNCG;或
(12)CLEC10A、CPA2、NTRK3及DPEP1;或
(13)CLEC10A、CPA2、NTRK3、DPEP1及SNCG;或
(14)IL10、CLEC10A、CPA2、NTRK3及SNCG;或
(15)CLEC10A、NTRK3及DPEP1;或
(16)CX3CL1、CXCL6、IL10、CLEC10A及DPEP1;或
(17)CX3CL1、CXCL6、IL.17C、CLEC10A及DPEP1;或
(18)CX3CL1、CXCL6、CLEC10A及DPEP1;或
(19)CX3CL1、CXCL6、CLEC10A、DPEP1及PSME1;或
(20)CX3CL1、CXCL6、FGF.23、CLEC10A及DPEP1;或
(21)IL10、CCL27及DPEP1;或
(22)IL10、CPA2及DPEP1;或
(23)IL10、CCL27、DPEP1及IL32;或
(24)IL10、CLEC10A、CPA2及DPEP1;或
(25)IL10、CLEC10A及DPEP1;或
(26)CPA2及DPEP1;或
(27)CPA2、DPEP1及CX3CL1;或
(28)CPA2、DPEP1、CX3CL1及CLEC10A;或
(29)CPA2、DPEP1、CX3CL1、CLEC10A及IL10。
7.一种诊断帕金森病或预测帕金森病的电子装置,其特征在于,所述电子装置包括:
获取检测模块,被设置为获取生物样品,对所述生物样品进行检测,获得所述生物样品中的蛋白标志物的含量;
诊断或预测模块,所述诊断或预测模块是使用逻辑回归模型、支持向量机模型或朴素贝叶斯模型和所述蛋白标志物的含量建立回归方程,构建模型,然后根据模型输出预测结果;
优选地,所述生物样品为血浆样品;
优选地,所述生物样品中的所述蛋白标志物包括CPA2和/或DPEP1;
优选地,所述生物样品中的蛋白标志物还包括如下任意一种或多种:CXCL6、IL17C、CCL19、CCL27、GPNMB、FGF23、IL32、PSME1或TBCB;
优选地,所述蛋白标志物进一步包括CX3CL1、CLEC10A、IL10、NTRK3、SNCG、PMVK、PTPN中的任意一种或多种;
优选地,所述蛋白标志物包括:
(1)CCL19、CX3CL1、IL10、CPA2及DPEP1;或
(2)CCL19、CX3CL1、IL.17C、CPA2及DPEP1;或
(3)CCL19、IL10、CPA2、NTRK3及DPEP1;或
(4)CCL19、CX3CL1、CPA2及DPEP1;或
(5)CX3CL1、IL10、CPA2及DPEP1;或
(6)CX3CL1、CXCL6、IL.17C、CPA2及PMVK;或
(7)CX3CL1、CXCL6、IL.17C、CPA2及PTPN1;或
(8)CX3CL1、CXCL6、CPA2、GPNMB及PTPN1;或
(9)CX3CL1、CXCL6、CPA2、GPNMB及PMVK;或
(10)CX3CL1、CXCL6、IL.17C、CPA2及TBCB;或
(11)CLEC10A、CPA2、NTRK3及SNCG;或
(12)CLEC10A、CPA2、NTRK3及DPEP1;或
(13)CLEC10A、CPA2、NTRK3、DPEP1及SNCG;或
(14)IL10、CLEC10A、CPA2、NTRK3及SNCG;或
(15)CLEC10A、NTRK3及DPEP1;或
(16)CX3CL1、CXCL6、IL10、CLEC10A及DPEP1;或
(17)CX3CL1、CXCL6、IL.17C、CLEC10A及DPEP1;或
(18)CX3CL1、CXCL6、CLEC10A及DPEP1;或
(19)CX3CL1、CXCL6、CLEC10A、DPEP1及PSME1;或
(20)CX3CL1、CXCL6、FGF.23、CLEC10A及DPEP1;或
(21)IL10、CCL27及DPEP1;或
(22)IL10、CPA2及DPEP1;或
(23)IL10、CCL27、DPEP1及IL32;或
(24)IL10、CLEC10A、CPA2及DPEP1;或
(25)IL10、CLEC10A及DPEP1;或
(26)CPA2及DPEP1;或
(27)CPA2、DPEP1及CX3CL1;或
(28)CPA2、DPEP1、CX3CL1及CLEC10A;或
(29)CPA2、DPEP1、CX3CL1、CLEC10A及IL10;
优选地,所述根据模型输出预测结果为使用predict函数的type='response',输出概率值,概率值≥0.5,则表示患有所述帕金森病或风险高,概率值<0.5,则表示不患有所述帕金森病或风险低。
8.一种诊断帕金森病或预测帕金森病的蛋白标志物的筛选方法,其特征在于,所述筛选方法包括:
获取样本人群的患帕金森病情况和生物样品,对所述生物样品进行检测,获得所述生物样品中的蛋白含量,所述样本人群包括健康人和帕金森患者;
根据所述蛋白含量,通过统计方法筛选在所述帕金森患者和所述健康人中有差异的显著差异蛋白;
利用所述样本人群的所述显著差异蛋白的含量和所述患帕金森病情况,通过机器学习训练的方法,构建预测模型;
在所述预测模型中出现次数高于阈值的蛋白即为所述蛋白标志物。
9.根据权利要求8所述的筛选方法,其特征在于,所述随机切分的次数为多次,构建所述预测模型的次数为多次,对所述预测模型进行多次交叉验证;
优选地,所述统计方法包括如下任意一种或多种:T检验、广义线性模型、秩检验、逻辑回归、差异倍数、多重假设检验校正或克鲁斯卡尔沃里斯检验;
优选地,所述生物样品包括血浆;
优选地,构建所述预测模型包括:
将所述样本人群分为训练集和测试集,建立所述训练集或所述测试集的所述显著差异蛋白的含量和所述患帕金森病情况的映射关系,分别得到训练数据集或测试数据集;
通过所述机器学习训练的方法,并采用五折交叉验证,构建所述预测模型;
优选地,所述机器学习训练包括如下任意一种或多种:逻辑回归模型、支持向量机模型或朴素贝叶斯模型;
优选地,构建所述预测模型过程中,利用分析方法分析建模效果;
优选地,所述分析方法包括套索回归、贝叶斯信息准则或逐步回归中的一种或多种。
10.一种诊断模型的构建方法,其特征在于,利用权利要求8或9所述的筛选方法获得的所述蛋白标志物,应用所述机器学习训练的方法构建所述诊断模型。
11.根据权利要求10所述的构建方法,其特征在于,所述蛋白标志物包括CPA2和/或DPEP1;
优选地,所述蛋白标志物还包括如下任意一种或多种:CXCL6、IL17C、CCL19、CCL27、GPNMB、FGF23、IL32、PSME1或TBCB;
优选地,所述蛋白标志物进一步包括CX3CL1、CLEC10A、IL10、NTRK3、SNCG、PMVK、PTPN中的任意一种或多种;
优选地,所述蛋白标志物包括:
(1)CCL19、CX3CL1、IL10、CPA2及DPEP1;或
(2)CCL19、CX3CL1、IL.17C、CPA2及DPEP1;或
(3)CCL19、IL10、CPA2、NTRK3及DPEP1;或
(4)CCL19、CX3CL1、CPA2及DPEP1;或
(5)CX3CL1、IL10、CPA2及DPEP1;或
(6)CX3CL1、CXCL6、IL.17C、CPA2及PMVK;或
(7)CX3CL1、CXCL6、IL.17C、CPA2及PTPN1;或
(8)CX3CL1、CXCL6、CPA2、GPNMB及PTPN1;或
(9)CX3CL1、CXCL6、CPA2、GPNMB及PMVK;或
(10)CX3CL1、CXCL6、IL.17C、CPA2及TBCB;或
(11)CLEC10A、CPA2、NTRK3及SNCG;或
(12)CLEC10A、CPA2、NTRK3及DPEP1;或
(13)CLEC10A、CPA2、NTRK3、DPEP1及SNCG;或
(14)IL10、CLEC10A、CPA2、NTRK3及SNCG;或
(15)CLEC10A、NTRK3及DPEP1;或
(16)CX3CL1、CXCL6、IL10、CLEC10A及DPEP1;或
(17)CX3CL1、CXCL6、IL.17C、CLEC10A及DPEP1;或
(18)CX3CL1、CXCL6、CLEC10A及DPEP1;或
(19)CX3CL1、CXCL6、CLEC10A、DPEP1及PSME1;或
(20)CX3CL1、CXCL6、FGF.23、CLEC10A及DPEP1;或
(21)IL10、CCL27及DPEP1;或
(22)IL10、CPA2及DPEP1;或
(23)IL10、CCL27、DPEP1及IL32;或
(24)IL10、CLEC10A、CPA2及DPEP1;或
(25)IL10、CLEC10A及DPEP1;或
(26)CPA2及DPEP1;或
(27)CPA2、DPEP1及CX3CL1;或
(28)CPA2、DPEP1、CX3CL1及CLEC10A;或
(29)CPA2、DPEP1、CX3CL1、CLEC10A及IL10。
12.一种计算机可读存储介质,其特征在于,所述存储介质包括存储的程序,其中,在所述程序运行时,控制所述存储介质所在设备执行权利要求8或9所述的筛选方法、权利要求10或11所述的构建方法、或权利要求10或11所述的诊断模型。
13.一种处理器,其特征在于,所述处理器用于运行程序,其中,所述程序运行时执行权利要求8或9所述的筛选方法、权利要求10或11所述的构建方法、或权利要求10或11所述的诊断模型。
14.一种筛选诊断帕金森病或预测帕金森病的蛋白标志物的装置,其特征在于,所述装置包括:
获取检测模块,被设置为获取样本人群的患帕金森病情况和生物样品,对所述生物样品进行检测,获得所述生物样品中的蛋白含量,所述样本人群包括健康人和帕金森患者;
差异统计模块,被设置为根据所述蛋白含量,通过统计方法筛选在所述帕金森患者和所述健康人中有差异的显著差异蛋白;
模型构建模块,被设置为利用所述样本人群的所述显著差异蛋白的含量和所述患帕金森病情况,构建多个预测模型;
标志物确定模块,被设置为在多个所述预测模型中出现次数高于阈值的蛋白即为所述蛋白标志物。
15.根据权利要求14所述的装置,其特征在于,所述生物样品中的待检测蛋白包括CPA2和/或DPEP1;
优选地,所述待检测蛋白还包括如下任意一种或多种:CXCL6、IL17C、CCL19、CCL27、GPNMB、FGF23、IL32、PSME1或TBCB;
优选地,所述待检测蛋白进一步包括CX3CL1、CLEC10A、IL10、NTRK3、SNCG、PMVK、PTPN中的任意一种或多种。
CN202211257679.3A 2022-10-12 2022-10-12 蛋白标志物在制备诊断帕金森或预测帕金森病的产品中的应用 Pending CN115856309A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211257679.3A CN115856309A (zh) 2022-10-12 2022-10-12 蛋白标志物在制备诊断帕金森或预测帕金森病的产品中的应用

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211257679.3A CN115856309A (zh) 2022-10-12 2022-10-12 蛋白标志物在制备诊断帕金森或预测帕金森病的产品中的应用

Publications (1)

Publication Number Publication Date
CN115856309A true CN115856309A (zh) 2023-03-28

Family

ID=85661494

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211257679.3A Pending CN115856309A (zh) 2022-10-12 2022-10-12 蛋白标志物在制备诊断帕金森或预测帕金森病的产品中的应用

Country Status (1)

Country Link
CN (1) CN115856309A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117054670A (zh) * 2023-10-12 2023-11-14 北京豪迈生物工程股份有限公司 一种测定黑色素瘤糖蛋白b含量的试剂盒及其制备方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2006010496A1 (en) * 2004-07-28 2006-02-02 Bayer Healthcare Ag Diagnostics and therapeutics for diseases associated with dipeptidase 1 (dpep1)
US20210147831A1 (en) * 2018-04-27 2021-05-20 The Broad Institute, Inc. Sequencing-based proteomics

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2006010496A1 (en) * 2004-07-28 2006-02-02 Bayer Healthcare Ag Diagnostics and therapeutics for diseases associated with dipeptidase 1 (dpep1)
US20210147831A1 (en) * 2018-04-27 2021-05-20 The Broad Institute, Inc. Sequencing-based proteomics

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
HUI WANG ET AL.: "iTRAQ-based proteomic technology revealed protein perturbations in intestinal mucosa from manganese exposure in rat models", RSC ADVANCES, vol. 7, 22 June 2017 (2017-06-22), pages 31745 - 31758 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117054670A (zh) * 2023-10-12 2023-11-14 北京豪迈生物工程股份有限公司 一种测定黑色素瘤糖蛋白b含量的试剂盒及其制备方法

Similar Documents

Publication Publication Date Title
Kan et al. Using omics approaches to understand pulmonary diseases
Ruuskanen et al. Gut microbiome composition is predictive of incident type 2 diabetes in a population cohort of 5,572 Finnish adults
Chahine et al. Blood-based biomarkers for Parkinson's disease
Sood et al. Diagnosis of IBS: symptoms, symptom-based criteria, biomarkers or'psychomarkers'?
Le et al. Identification and replication of RNA-Seq gene network modules associated with depression severity
AU2014354808A1 (en) Personalized medicine approach for treating cognitive loss
Dawson et al. Urinary proteomics to support diagnosis of stroke
EP3786305A1 (en) Biomarker for depression and use thereof
Coutts et al. Psychotic disorders as a framework for precision psychiatry
CN111020020A (zh) 一种精神分裂症的生物标志物组合、其应用及metaphlan2筛选方法
CN108085382B (zh) 通过多个miRNA的表达量确定雷公藤多苷片治疗类风湿性关节炎的个体有效性的系统
IL296574A (en) Systems and methods for identifying risk for Alzheimer&#39;s disease using a non-circulating mrna profile test
Ettema et al. Detecting multiple sclerosis via breath analysis using an eNose, a pilot study
Zhang et al. Genome-wide study of immune biomarkers in cerebrospinal fluid and serum from patients with bipolar disorder and controls
Agbaria et al. Differential diagnosis of the etiologies of bacterial and viral infections using infrared microscopy of peripheral human blood samples and multivariate analysis
Hu et al. Bioinformatics analysis of gene expression profiles for risk prediction in patients with septic shock
Gogishvili et al. Discovery of novel CSF biomarkers to predict progression in dementia using machine learning
Carrasco-Zanini et al. Proteomic prediction of common and rare diseases
Schijven et al. Genetic cross-disorder analysis in psychiatry: from methodology to clinical utility
Wang et al. Comparative studies of genetic and phenotypic associations for 2,168 plasma proteins measured by two affinity-based platforms in 4,000 Chinese adults
CN115856309A (zh) 蛋白标志物在制备诊断帕金森或预测帕金森病的产品中的应用
O'Connell et al. High-throughput profiling of circulating antibody signatures for stroke diagnosis using small volumes of whole blood
CN111020021A (zh) 一种基于肠道菌群的小规模精神分裂症生物标志物组合、其应用及mOTU筛选方法
Angata et al. Association of serum interleukin‐27 with the exacerbation of chronic obstructive pulmonary disease
Benincasa et al. High-resolution DNA methylation changes reveal biomarkers of heart failure with preserved ejection fraction versus reduced ejection fraction

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination