CN115856309A - 蛋白标志物在制备诊断帕金森或预测帕金森病的产品中的应用 - Google Patents
蛋白标志物在制备诊断帕金森或预测帕金森病的产品中的应用 Download PDFInfo
- Publication number
- CN115856309A CN115856309A CN202211257679.3A CN202211257679A CN115856309A CN 115856309 A CN115856309 A CN 115856309A CN 202211257679 A CN202211257679 A CN 202211257679A CN 115856309 A CN115856309 A CN 115856309A
- Authority
- CN
- China
- Prior art keywords
- dpep1
- cx3cl1
- cpa2
- clec10a
- cxcl6
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 208000018737 Parkinson disease Diseases 0.000 title claims abstract description 121
- 239000012474 protein marker Substances 0.000 title claims abstract description 48
- 238000002360 preparation method Methods 0.000 title abstract description 4
- 102100020743 Dipeptidase 1 Human genes 0.000 claims abstract description 286
- 101000932213 Homo sapiens Dipeptidase 1 Proteins 0.000 claims abstract description 286
- 102100030614 Carboxypeptidase A2 Human genes 0.000 claims abstract description 245
- 108091006675 Monovalent cation:proton antiporter-2 Proteins 0.000 claims abstract description 245
- 230000000694 effects Effects 0.000 claims abstract description 17
- 238000003745 diagnosis Methods 0.000 claims abstract description 15
- 102100020997 Fractalkine Human genes 0.000 claims description 228
- 101000854520 Homo sapiens Fractalkine Proteins 0.000 claims description 228
- 102100032532 C-type lectin domain family 10 member A Human genes 0.000 claims description 190
- 101000942296 Homo sapiens C-type lectin domain family 10 member A Proteins 0.000 claims description 190
- 102000004169 proteins and genes Human genes 0.000 claims description 155
- 108090000623 proteins and genes Proteins 0.000 claims description 155
- 108090000174 Interleukin-10 Proteins 0.000 claims description 149
- 102000003814 Interleukin-10 Human genes 0.000 claims description 149
- 102100036153 C-X-C motif chemokine 6 Human genes 0.000 claims description 136
- 101000947177 Homo sapiens C-X-C motif chemokine 6 Proteins 0.000 claims description 136
- -1 CCL Proteins 0.000 claims description 82
- 108010064892 trkC Receptor Proteins 0.000 claims description 82
- 102000047459 trkC Receptor Human genes 0.000 claims description 82
- 102100036842 C-C motif chemokine 19 Human genes 0.000 claims description 57
- 101000713106 Homo sapiens C-C motif chemokine 19 Proteins 0.000 claims description 57
- 102100025615 Gamma-synuclein Human genes 0.000 claims description 51
- 101000787273 Homo sapiens Gamma-synuclein Proteins 0.000 claims description 51
- 239000012472 biological sample Substances 0.000 claims description 49
- 238000000034 method Methods 0.000 claims description 48
- 239000000523 sample Substances 0.000 claims description 41
- 101000687955 Homo sapiens Phosphomevalonate kinase Proteins 0.000 claims description 40
- 102100024279 Phosphomevalonate kinase Human genes 0.000 claims description 40
- 229920005735 poly(methyl vinyl ketone) Polymers 0.000 claims description 40
- 102100021936 C-C motif chemokine 27 Human genes 0.000 claims description 39
- 101000897494 Homo sapiens C-C motif chemokine 27 Proteins 0.000 claims description 39
- 101000904724 Homo sapiens Transmembrane glycoprotein NMB Proteins 0.000 claims description 39
- 102100023935 Transmembrane glycoprotein NMB Human genes 0.000 claims description 39
- 238000012360 testing method Methods 0.000 claims description 39
- 238000001514 detection method Methods 0.000 claims description 37
- 238000012549 training Methods 0.000 claims description 37
- 238000012216 screening Methods 0.000 claims description 30
- 101000998139 Homo sapiens Interleukin-32 Proteins 0.000 claims description 27
- 101000705756 Homo sapiens Proteasome activator complex subunit 1 Proteins 0.000 claims description 27
- 101000835634 Homo sapiens Tubulin-folding cofactor B Proteins 0.000 claims description 27
- 102100033501 Interleukin-32 Human genes 0.000 claims description 27
- 102100031300 Proteasome activator complex subunit 1 Human genes 0.000 claims description 27
- 102100026482 Tubulin-folding cofactor B Human genes 0.000 claims description 27
- 101001087394 Homo sapiens Tyrosine-protein phosphatase non-receptor type 1 Proteins 0.000 claims description 24
- 102100033001 Tyrosine-protein phosphatase non-receptor type 1 Human genes 0.000 claims description 24
- 239000012528 membrane Substances 0.000 claims description 22
- 238000007477 logistic regression Methods 0.000 claims description 20
- 239000003153 chemical reaction reagent Substances 0.000 claims description 18
- 238000010801 machine learning Methods 0.000 claims description 18
- 102100024802 Fibroblast growth factor 23 Human genes 0.000 claims description 15
- 101001051973 Homo sapiens Fibroblast growth factor 23 Proteins 0.000 claims description 15
- 101000998178 Homo sapiens Interleukin-17C Proteins 0.000 claims description 15
- 102100033105 Interleukin-17C Human genes 0.000 claims description 15
- 238000005516 engineering process Methods 0.000 claims description 13
- 101150021185 FGF gene Proteins 0.000 claims description 12
- 238000010276 construction Methods 0.000 claims description 12
- 238000007619 statistical method Methods 0.000 claims description 11
- 238000004458 analytical method Methods 0.000 claims description 10
- 238000002790 cross-validation Methods 0.000 claims description 9
- 238000012706 support-vector machine Methods 0.000 claims description 9
- 238000002965 ELISA Methods 0.000 claims description 8
- 239000007790 solid phase Substances 0.000 claims description 8
- 230000006870 function Effects 0.000 claims description 7
- 230000008569 process Effects 0.000 claims description 6
- 239000000020 Nitrocellulose Substances 0.000 claims description 5
- 238000012937 correction Methods 0.000 claims description 5
- 229920001220 nitrocellulos Polymers 0.000 claims description 5
- 239000004677 Nylon Substances 0.000 claims description 4
- 229920002678 cellulose Polymers 0.000 claims description 4
- 239000001913 cellulose Substances 0.000 claims description 4
- 238000002474 experimental method Methods 0.000 claims description 4
- 239000011521 glass Substances 0.000 claims description 4
- 238000013507 mapping Methods 0.000 claims description 4
- 239000004005 microsphere Substances 0.000 claims description 4
- 229920001778 nylon Polymers 0.000 claims description 4
- 230000004044 response Effects 0.000 claims description 4
- 239000003550 marker Substances 0.000 claims description 3
- 238000003119 immunoblot Methods 0.000 claims description 2
- 101100224410 Solanum tuberosum DPEP gene Proteins 0.000 claims 4
- 238000012545 processing Methods 0.000 claims 2
- 102000004190 Enzymes Human genes 0.000 claims 1
- 108090000790 Enzymes Proteins 0.000 claims 1
- 238000004519 manufacturing process Methods 0.000 claims 1
- 239000007787 solid Substances 0.000 claims 1
- 238000012353 t test Methods 0.000 claims 1
- 201000010099 disease Diseases 0.000 description 22
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 22
- 238000003908 quality control method Methods 0.000 description 15
- 235000019624 protein content Nutrition 0.000 description 12
- VYFYYTLLBUKUHU-UHFFFAOYSA-N dopamine Chemical compound NCCC1=CC=C(O)C(O)=C1 VYFYYTLLBUKUHU-UHFFFAOYSA-N 0.000 description 8
- 208000024891 symptom Diseases 0.000 description 6
- 238000011160 research Methods 0.000 description 5
- 108020004414 DNA Proteins 0.000 description 4
- 229960003638 dopamine Drugs 0.000 description 4
- HEMHJVSKTPXQMS-UHFFFAOYSA-M Sodium hydroxide Chemical compound [OH-].[Na+] HEMHJVSKTPXQMS-UHFFFAOYSA-M 0.000 description 3
- 230000002146 bilateral effect Effects 0.000 description 3
- 239000000090 biomarker Substances 0.000 description 3
- 210000004556 brain Anatomy 0.000 description 3
- 238000010200 validation analysis Methods 0.000 description 3
- 102000053602 DNA Human genes 0.000 description 2
- 238000012313 Kruskal-Wallis test Methods 0.000 description 2
- 208000001089 Multiple system atrophy Diseases 0.000 description 2
- 208000012902 Nervous system disease Diseases 0.000 description 2
- 208000025966 Neurological disease Diseases 0.000 description 2
- 244000208734 Pisonia aculeata Species 0.000 description 2
- 210000004369 blood Anatomy 0.000 description 2
- 239000008280 blood Substances 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 229940079593 drug Drugs 0.000 description 2
- 239000003814 drug Substances 0.000 description 2
- 238000003384 imaging method Methods 0.000 description 2
- SEOVTRFCIGRIMH-UHFFFAOYSA-N indole-3-acetic acid Chemical compound C1=CC=C2C(CC(=O)O)=CNC2=C1 SEOVTRFCIGRIMH-UHFFFAOYSA-N 0.000 description 2
- HXWLAJVUJSVENX-HFIFKADTSA-N ioflupane I(123) Chemical compound C1([C@H]2C[C@@H]3CC[C@@H](N3CCCF)[C@H]2C(=O)OC)=CC=C([123I])C=C1 HXWLAJVUJSVENX-HFIFKADTSA-N 0.000 description 2
- 239000002207 metabolite Substances 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000004770 neurodegeneration Effects 0.000 description 2
- 208000015122 neurodegenerative disease Diseases 0.000 description 2
- 239000013641 positive control Substances 0.000 description 2
- 201000002212 progressive supranuclear palsy Diseases 0.000 description 2
- 238000002331 protein detection Methods 0.000 description 2
- 230000011218 segmentation Effects 0.000 description 2
- 230000035945 sensitivity Effects 0.000 description 2
- QZAYGJVTTNCVMB-UHFFFAOYSA-N serotonin Chemical compound C1=C(O)C=C2C(CCN)=CNC2=C1 QZAYGJVTTNCVMB-UHFFFAOYSA-N 0.000 description 2
- 238000000528 statistical test Methods 0.000 description 2
- 238000001262 western blot Methods 0.000 description 2
- 208000012639 Balance disease Diseases 0.000 description 1
- 208000037663 Best vitelliform macular dystrophy Diseases 0.000 description 1
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 1
- 206010010774 Constipation Diseases 0.000 description 1
- 206010061818 Disease progression Diseases 0.000 description 1
- 108010015720 Dopamine beta-Hydroxylase Proteins 0.000 description 1
- 102100033156 Dopamine beta-hydroxylase Human genes 0.000 description 1
- 101001105583 Haloarcula marismortui (strain ATCC 43049 / DSM 3752 / JCM 8966 / VKM B-1809) 50S ribosomal protein L18e Proteins 0.000 description 1
- 101001105789 Homo sapiens 60S ribosomal protein L19 Proteins 0.000 description 1
- 101001138128 Homo sapiens Immunoglobulin kappa variable 1-12 Proteins 0.000 description 1
- 101001121408 Homo sapiens L-amino-acid oxidase Proteins 0.000 description 1
- 101000654491 Homo sapiens Serine/threonine-protein kinase SIK3 Proteins 0.000 description 1
- 102100020773 Immunoglobulin kappa variable 1-12 Human genes 0.000 description 1
- 206010061218 Inflammation Diseases 0.000 description 1
- 102100026388 L-amino-acid oxidase Human genes 0.000 description 1
- 208000009829 Lewy Body Disease Diseases 0.000 description 1
- 201000002832 Lewy body dementia Diseases 0.000 description 1
- 208000002740 Muscle Rigidity Diseases 0.000 description 1
- 108091034117 Oligonucleotide Proteins 0.000 description 1
- 238000012408 PCR amplification Methods 0.000 description 1
- 208000027089 Parkinsonian disease Diseases 0.000 description 1
- 206010034010 Parkinsonism Diseases 0.000 description 1
- 239000004793 Polystyrene Substances 0.000 description 1
- 108010026552 Proteome Proteins 0.000 description 1
- 238000011529 RT qPCR Methods 0.000 description 1
- 108020004682 Single-Stranded DNA Proteins 0.000 description 1
- 102000005157 Somatostatin Human genes 0.000 description 1
- 108010056088 Somatostatin Proteins 0.000 description 1
- 206010044565 Tremor Diseases 0.000 description 1
- 238000001793 Wilcoxon signed-rank test Methods 0.000 description 1
- 230000002159 abnormal effect Effects 0.000 description 1
- 229940124277 aminobutyric acid Drugs 0.000 description 1
- 230000003321 amplification Effects 0.000 description 1
- 238000003556 assay Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000003115 biocidal effect Effects 0.000 description 1
- 238000003766 bioinformatics method Methods 0.000 description 1
- 238000010241 blood sampling Methods 0.000 description 1
- 238000009534 blood test Methods 0.000 description 1
- 229910052799 carbon Inorganic materials 0.000 description 1
- 210000004027 cell Anatomy 0.000 description 1
- 210000001175 cerebrospinal fluid Anatomy 0.000 description 1
- 238000013145 classification model Methods 0.000 description 1
- 238000003759 clinical diagnosis Methods 0.000 description 1
- 230000019771 cognition Effects 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 238000004925 denaturation Methods 0.000 description 1
- 230000036425 denaturation Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000002405 diagnostic procedure Methods 0.000 description 1
- 230000005750 disease progression Effects 0.000 description 1
- 230000035622 drinking Effects 0.000 description 1
- 238000009509 drug development Methods 0.000 description 1
- 238000013399 early diagnosis Methods 0.000 description 1
- 235000006694 eating habits Nutrition 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 239000012634 fragment Substances 0.000 description 1
- 230000002068 genetic effect Effects 0.000 description 1
- PCHJSUWPFVWCPO-UHFFFAOYSA-N gold Chemical compound [Au] PCHJSUWPFVWCPO-UHFFFAOYSA-N 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 239000003617 indole-3-acetic acid Substances 0.000 description 1
- 230000004054 inflammatory process Effects 0.000 description 1
- 238000009533 lab test Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000012821 model calculation Methods 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 230000007659 motor function Effects 0.000 description 1
- 238000010984 neurological examination Methods 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- 229920002223 polystyrene Polymers 0.000 description 1
- 238000010837 poor prognosis Methods 0.000 description 1
- 238000000734 protein sequencing Methods 0.000 description 1
- 230000005855 radiation Effects 0.000 description 1
- 230000002285 radioactive effect Effects 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
- 230000000391 smoking effect Effects 0.000 description 1
- NHXLMOGPVYXJNR-ATOGVRKGSA-N somatostatin Chemical compound C([C@H]1C(=O)N[C@H](C(N[C@@H](CO)C(=O)N[C@@H](CSSC[C@@H](C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC=2C=CC=CC=2)C(=O)N[C@@H](CC=2C=CC=CC=2)C(=O)N[C@@H](CC=2C3=CC=CC=C3NC=2)C(=O)N[C@@H](CCCCN)C(=O)N[C@H](C(=O)N1)[C@@H](C)O)NC(=O)CNC(=O)[C@H](C)N)C(O)=O)=O)[C@H](O)C)C1=CC=CC=C1 NHXLMOGPVYXJNR-ATOGVRKGSA-N 0.000 description 1
- 229960000553 somatostatin Drugs 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 230000004083 survival effect Effects 0.000 description 1
- 210000001519 tissue Anatomy 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
- 201000007790 vitelliform macular dystrophy Diseases 0.000 description 1
- 208000020938 vitelliform macular dystrophy 2 Diseases 0.000 description 1
Images
Landscapes
- Investigating Or Analysing Biological Materials (AREA)
Abstract
本发明提供了一种蛋白标志物在制备诊断帕金森或预测帕金森病的产品中的应用。其中,蛋白标志物包括CPA2和/或DPEP1。解决了现有技术中诊断或预测帕金森病的产品效果差的问题,适用于帕金森病诊断产品应用领域。
Description
技术领域
本发明涉及帕金森病诊断产品应用领域,具体而言,涉及一种蛋白标志物在制备诊断帕金森或预测帕金森病的产品中的应用。
背景技术
帕金森病(Parkinson’s disease,PD)是在中老年人群常见的神经系统退行性疾病,主要临床特征表现为震颤,肌强直及运动减少。PD作为最常见的神经性疾病之一,患者最早期的症状常常难以察觉,易被忽略。一直以来,PD的主要诊断方法依赖于个人的临床诊断(常规检察,自身疾病异常心电图等改变)、运动机能评估(通过调查清单统计HY或MDS-UPDRS等分数),和神经学检查。目前还没有血液或实验室检测来诊断非遗传性的帕金森病,这意味着需要病人出现某些身体症状才能确定疾病情况。由于没有决定性的筛查或实验,早期帕金森患者可能不符合临床诊断标准,这种特异性的缺乏也意味着病人可能被误诊患有帕金森病,从而导致错过治疗的最佳时期。
缺乏有效的早期诊断方法是PD患者中晚期预后差的主要因素。虽然英国帕金森病社会脑库(U.K.’s Parkinson’s Disease Society Brain Bank)是诊断PD的金标准,且帕金森病的诊断评定量表(MDS-UPDRS)逐渐成为更主流的临床诊断标准,但评定量表主要依赖于病人的主观认知,心理状态和运动症状,限制了在早期筛查中的应用。
影像学诊断确诊困难,2011年美国食品和药物管理局批准的DaTscan成像扫描,可以让医生查看大脑多巴胺系统的图像。DaTscan涉及注入放射性药物并与大脑中的多巴胺传递素结合(多巴胺的缺失是导致帕金森的原因之一)。但扫描的结果并不能显示是否患有帕金森,且成本较高并使病人每年接受较高剂量的辐射。
近年来,生物分子诊断被广泛用于疾病的早期筛查、辅助诊断,提高了患者的生存率。血脑脊液检测可检测多巴胺的水平高低;代谢物如5-羟色胺和吲哚醋酸含量降低;多巴胺β羟化酶降低;生长抑素明显降低及-氨基丁酸水平减低等。但患者代谢物质含量受个体因素影响较大,如环境因素、生活习惯和饮食习惯等,且存在标志物的敏感性或特异性不够的问题,缺少大量人群样本进行验证,导致临床应用上有所限制。我们需要更多的研究来了解生物复杂性,寻找更有效的分子诊断标志物是至关重要的。
其他神经系统疾病可能引起类似帕金森病的症状。帕金森氏症(Parkinsonism)这个术语是用来指一个病人有类似帕金森氏症的症状。大约15%的帕金森病是由其他疾病引起的。除了在小部分病例中发现的遗传原因外,帕金森样疾病(Parkinson-like diseases)没有治愈方法或已知原因,如进行性核上性麻痹(Progressive Supranuclear Palsy,PSP)、多系统萎缩(Multiple System Atrophy,MSA)和路易体痴呆。因此,亟需寻找可以用于诊断PD早期患者、区分帕金森氏症的生物标志物,以施行病人的个性化治疗。
发明内容
本发明的主要目的在于提供一种蛋白标志物在制备诊断帕金森或预测帕金森病的产品中的应用,以解决现有技术中诊断或预测帕金森病的产品效果差的问题。
为了实现上述目的,根据本发明的第一个方面,提供了一种蛋白标志物在制备诊断帕金森或预测帕金森病的产品中的应用,该蛋白标志物包括CPA2和/或DPEP1。
进一步地,蛋白标志物还包括如下任意一种或多种:CXCL6、IL17C、CCL19、CCL27、GPNMB、FGF23、IL32、PSME1或TBCB;优选地,蛋白标志物进一步包括CX3CL1、CLEC10A、IL10、NTRK3、SNCG、PMVK、PTPN中的任意一种或多种。
进一步地,蛋白标志物选自如下任意一组:(1)CCL19、CX3CL1、IL10、CPA2及DPEP1;或(2)CCL19、CX3CL1、IL.17C、CPA2及DPEP1;或(3)CCL19、IL10、CPA2、NTRK3及DPEP1;或(4)CCL19、CX3CL1、CPA2及DPEP1;或(5)CX3CL1、IL10、CPA2及DPEP1;或(6)CX3CL1、CXCL6、IL.17C、CPA2及PMVK;或(7)CX3CL1、CXCL6、IL.17C、CPA2及PTPN1;或(8)CX3CL1、CXCL6、CPA2、GPNMB及PTPN1;或(9)CX3CL1、CXCL6、CPA2、GPNMB及PMVK;或(10)CX3CL1、CXCL6、IL.17C、CPA2及TBCB;或(11)CLEC10A、CPA2、NTRK3及SNCG;或(12)CLEC10A、CPA2、NTRK3及DPEP1;或(13)CLEC10A、CPA2、NTRK3、DPEP1及SNCG;或(14)IL10、CLEC10A、CPA2、NTRK3及SNCG;或(15)CLEC10A、NTRK3及DPEP1;或(16)CX3CL1、CXCL6、IL10、CLEC10A及DPEP1;或(17)CX3CL1、CXCL6、IL.17C、CLEC10A及DPEP1;或(18)CX3CL1、CXCL6、CLEC10A及DPEP1;或(19)CX3CL1、CXCL6、CLEC10A、DPEP1及PSME1;或(20)CX3CL1、CXCL6、FGF.23、CLEC10A及DPEP1;或(21)IL10、CCL27及DPEP1;或(22)IL10、CPA2及DPEP1;或(23)IL10、CCL27、DPEP1及IL32;或(24)IL10、CLEC10A、CPA2及DPEP1;或(25)IL10、CLEC10A及DPEP1;或(26)CPA2及DPEP1;或(27)CPA2、DPEP1及CX3CL1;或(28)CPA2、DPEP1、CX3CL1及CLEC10A;或(29)CPA2、DPEP1、CX3CL1、CLEC10A及IL10。
进一步地,应用包括利用检测试剂检测蛋白标志物的含量;优选地,蛋白标志物的含量的检测方法包括Olink技术、免疫印迹实验或酶联免疫吸附测定;优选地,检测试剂为蛋白标志物的抗体;优选地,抗体设置在固相载体上;优选地,固相载体包括酶标板、膜载体或微球;优选地,膜载体选自硝酸纤维素膜、玻璃纤维素膜或尼龙膜;优选地,抗体为单克隆抗体或多克隆抗体;优选地,相关产品包括试剂盒或电子预测装置。
为了实现上述目的,根据本发明的第二个方面,提供了一种用于在受试者中诊断帕金森病或预测帕金森病的试剂盒,该试剂盒包括检测蛋白标志物的含量的检测试剂,蛋白标志物包括CPA2和/或DPEP1。
进一步地,蛋白标志物还包括如下任意一种或多种:CXCL6、IL17C、CCL19、CCL27、GPNMB、FGF23、IL32、PSME1或TBCB;优选地,蛋白标志物进一步包括CX3CL1、CLEC10A、IL10、NTRK3、SNCG、PMVK、PTPN中的任意一种或多种;优选地,蛋白标志物包括:(1)CCL19、CX3CL1、IL10、CPA2及DPEP1;或(2)CCL19、CX3CL1、IL.17C、CPA2及DPEP1;或(3)CCL19、IL10、CPA2、NTRK3及DPEP1;或(4)CCL19、CX3CL1、CPA2及DPEP1;或(5)CX3CL1、IL10、CPA2及DPEP1;或(6)CX3CL1、CXCL6、IL.17C、CPA2及PMVK;或(7)CX3CL1、CXCL6、IL.17C、CPA2及PTPN1;或(8)CX3CL1、CXCL6、CPA2、GPNMB及PTPN1;或(9)CX3CL1、CXCL6、CPA2、GPNMB及PMVK;或(10)CX3CL1、CXCL6、IL.17C、CPA2及TBCB;或(11)CLEC10A、CPA2、NTRK3及SNCG;或(12)CLEC10A、CPA2、NTRK3及DPEP1;或(13)CLEC10A、CPA2、NTRK3、DPEP1及SNCG;或(14)IL10、CLEC10A、CPA2、NTRK3及SNCG;或(15)CLEC10A、NTRK3及DPEP1;或(16)CX3CL1、CXCL6、IL10、CLEC10A及DPEP1;或(17)CX3CL1、CXCL6、IL.17C、CLEC10A及DPEP1;或(18)CX3CL1、CXCL6、CLEC10A及DPEP1;或(19)CX3CL1、CXCL6、CLEC10A、DPEP1及PSME1;或(20)CX3CL1、CXCL6、FGF.23、CLEC10A及DPEP1;或(21)IL10、CCL27及DPEP1;或(22)IL10、CPA2及DPEP1;或(23)IL10、CCL27、DPEP1及IL32;或(24)IL10、CLEC10A、CPA2及DPEP1;或(25)IL10、CLEC10A及DPEP1;或(26)CPA2及DPEP1;或(27)CPA2、DPEP1及CX3CL1;或(28)CPA2、DPEP1、CX3CL1及CLEC10A;或(29)CPA2、DPEP1、CX3CL1、CLEC10A及IL10。
为了实现上述目的,根据本发明的第三个方面,提供了一种诊断帕金森病或预测帕金森病的电子装置,该装置包括:获取检测模块,被设置为获取生物样品,对生物样品进行检测,获得生物样品中的蛋白标志物的含量;诊断或预测模块,诊断或预测模块是使用逻辑回归模型、支持向量机模型或朴素贝叶斯模型和蛋白标志物的含量建立回归方程,构建模型,然后根据模型输出预测结果;优选地,生物样品为血浆样品;进一步地,生物样品中的蛋白标志物包括CPA2和/或DPEP1;优选地,生物样品中的蛋白标志物还包括如下任意一种或多种:CXCL6、IL17C、CCL19、CCL27、GPNMB、FGF23、IL32、PSME1或TBCB;优选地,蛋白标志物进一步包括CX3CL1、CLEC10A、IL10、NTRK3、SNCG、PMVK、PTPN中的任意一种或多种;优选地,蛋白标志物包括:(1)CCL19、CX3CL1、IL10、CPA2及DPEP1;或(2)CCL19、CX3CL1、IL.17C、CPA2及DPEP1;或(3)CCL19、IL10、CPA2、NTRK3及DPEP1;或(4)CCL19、CX3CL1、CPA2及DPEP1;或(5)CX3CL1、IL10、CPA2及DPEP1;或(6)CX3CL1、CXCL6、IL.17C、CPA2及PMVK;或(7)CX3CL1、CXCL6、IL.17C、CPA2及PTPN1;或(8)CX3CL1、CXCL6、CPA2、GPNMB及PTPN1;或(9)CX3CL1、CXCL6、CPA2、GPNMB及PMVK;或(10)CX3CL1、CXCL6、IL.17C、CPA2及TBCB;或(11)CLEC10A、CPA2、NTRK3及SNCG;或(12)CLEC10A、CPA2、NTRK3及DPEP1;或(13)CLEC10A、CPA2、NTRK3、DPEP1及SNCG;或(14)IL10、CLEC10A、CPA2、NTRK3及SNCG;或(15)CLEC10A、NTRK3及DPEP1;或(16)CX3CL1、CXCL6、IL10、CLEC10A及DPEP1;或(17)CX3CL1、CXCL6、IL.17C、CLEC10A及DPEP1;或(18)CX3CL1、CXCL6、CLEC10A及DPEP1;或(19)CX3CL1、CXCL6、CLEC10A、DPEP1及PSME1;或(20)CX3CL1、CXCL6、FGF.23、CLEC10A及DPEP1;或(21)IL10、CCL27及DPEP1;或(22)IL10、CPA2及DPEP1;或(23)IL10、CCL27、DPEP1及IL32;或(24)IL10、CLEC10A、CPA2及DPEP1;或(25)IL10、CLEC10A及DPEP1;或(26)CPA2及DPEP1;或(27)CPA2、DPEP1及CX3CL1;或(28)CPA2、DPEP1、CX3CL1及CLEC10A;或(29)CPA2、DPEP1、CX3CL1、CLEC10A及IL10;优选地,所述根据模型输出预测结果为使用predict函数的type='response',输出概率值,概率值≥0.5,则表示患有帕金森病或风险高,概率值<0.5,则表示不患有帕金森病或风险低。
为了实现上述目的,根据本发明的第四个方面,提供了一种诊断帕金森病或预测帕金森病的蛋白标志物的筛选方法,该筛选方法包括:获取样本人群的患帕金森病情况和生物样品,对生物样品进行检测,获得生物样品中的蛋白含量,样本人群包括健康人和帕金森患者;根据蛋白含量,通过统计方法筛选在帕金森患者和健康人中有差异的显著差异蛋白;利用样本人群的显著差异蛋白的含量和患帕金森病情况,通过机器学习训练的方法,构建预测模型;在预测模型中出现次数高于阈值的蛋白即为蛋白标志物。
进一步地,随机切分的次数为多次,构建预测模型的次数为多次,对预测模型进行多次交叉验证;优选地,统计方法包括如下任意一种或多种:T检验、广义线性模型、秩检验、逻辑回归、差异倍数、多重假设检验校正或克鲁斯卡尔沃里斯检验;优选地,生物样品包括血浆;优选地,构建预测模型包括:将样本人群分为训练集和测试集,建立训练集或测试集的显著差异蛋白的含量和患帕金森病情况的映射关系,分别得到训练数据集或测试数据集;通过机器学习训练的方法,并采用五折交叉验证,构建预测模型;优选地,机器学习训练包括如下任意一种或多种:逻辑回归模型、支持向量机模型或朴素贝叶斯模型;优选地,构建预测模型过程中,利用分析方法分析建模效果;优选地,分析方法包括套索回归、贝叶斯信息准则或逐步回归中的一种或多种。
为了实现上述目的,根据本发明的第五个方面,提供了一种诊断模型的构建方法,利用上述筛选方法获得的蛋白标志物,应用机器学习训练的方法构建诊断模型。
进一步地,蛋白标志物包括CPA2和/或DPEP1;优选地,蛋白标志物还包括如下任意一种或多种:CXCL6、IL17C、CCL19、CCL27、GPNMB、FGF23、IL32、PSME1或TBCB;优选地,蛋白标志物进一步包括CX3CL1、CLEC10A、IL10、NTRK3、SNCG、PMVK、PTPN中的任意一种或多种;优选地,蛋白标志物包括:(1)CCL19、CX3CL1、IL10、CPA2及DPEP1;或(2)CCL19、CX3CL1、IL.17C、CPA2及DPEP1;或(3)CCL19、IL10、CPA2、NTRK3及DPEP1;或(4)CCL19、CX3CL1、CPA2及DPEP1;或(5)CX3CL1、IL10、CPA2及DPEP1;或(6)CX3CL1、CXCL6、IL.17C、CPA2及PMVK;或(7)CX3CL1、CXCL6、IL.17C、CPA2及PTPN1;或(8)CX3CL1、CXCL6、CPA2、GPNMB及PTPN1;或(9)CX3CL1、CXCL6、CPA2、GPNMB及PMVK;或(10)CX3CL1、CXCL6、IL.17C、CPA2及TBCB;或(11)CLEC10A、CPA2、NTRK3及SNCG;或(12)CLEC10A、CPA2、NTRK3及DPEP1;或(13)CLEC10A、CPA2、NTRK3、DPEP1及SNCG;或(14)IL10、CLEC10A、CPA2、NTRK3及SNCG;或(15)CLEC10A、NTRK3及DPEP1;或(16)CX3CL1、CXCL6、IL10、CLEC10A及DPEP1;或(17)CX3CL1、CXCL6、IL.17C、CLEC10A及DPEP1;或(18)CX3CL1、CXCL6、CLEC10A及DPEP1;或(19)CX3CL1、CXCL6、CLEC10A、DPEP1及PSME1;或(20)CX3CL1、CXCL6、FGF.23、CLEC10A及DPEP1;或(21)IL10、CCL27及DPEP1;或(22)IL10、CPA2及DPEP1;或(23)IL10、CCL27、DPEP1及IL32;或(24)IL10、CLEC10A、CPA2及DPEP1;或(25)IL10、CLEC10A及DPEP1;或(26)CPA2及DPEP1;或(27)CPA2、DPEP1及CX3CL1;或(28)CPA2、DPEP1、CX3CL1及CLEC10A;或(29)CPA2、DPEP1、CX3CL1、CLEC10A及IL10。
为了实现上述目的,根据本发明的第六个方面,提供了一种计算机可读存储介质,该存储介质包括存储的程序,其中,在程序运行时,控制存储介质所在设备执行上述筛选方法、构建方法或诊断模型。
为了实现上述目的,根据本发明的第七个方面,提供了一种处理器,该处理器用于运行程序,其中,程序运行时执行上述筛选方法、构建方法诊断模型。
为了实现上述目的,根据本发明的第八个方面,提供了一种筛选诊断帕金森病或预测帕金森病的蛋白标志物的装置,该装置包括:获取检测模块,被设置为获取样本人群的患帕金森病情况和生物样品,对生物样品进行检测,获得生物样品中的蛋白含量,样本人群包括健康人和帕金森患者;差异统计模块,被设置为根据蛋白含量,通过统计方法筛选在帕金森患者和健康人中有差异的显著差异蛋白;模型构建模块,被设置为利用样本人群的显著差异蛋白的含量和患帕金森病情况,构建多个预测模型;标志物确定模块,被设置为在多个预测模型中出现次数高于阈值的蛋白即为蛋白标志物。
进一步地,生物样品中的待检测蛋白包括CPA2和/或DPEP1;优选地,待检测蛋白还包括如下任意一种或多种:CXCL6、IL17C、CCL19、CCL27、GPNMB、FGF23、IL32、PSME1或TBCB;优选地,待检测蛋白进一步包括CX3CL1、CLEC10A、IL10、NTRK3、SNCG、PMVK、PTPN中的任意一种或多种。
应用本发明的技术方案,筛选了一批能够诊断或预测帕金森病早期的蛋白标志物,利用这些蛋白标志物中的一种或多种,能够制备诊断帕金森病或预测帕金森病的产品,便于诊断或预测受试者患帕金森病的情况或风险,提高诊断或预测的效果。
附图说明
构成本申请的一部分的说明书附图用来提供对本发明的进一步理解,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1示出了根据本发明实施例1的18个蛋白标志物组成的预测模型的ROC曲线示意图。
图2示出了根据本发明实施例1的5个蛋白标志物组成的预测模型的ROC曲线示意图。
具体实施方式
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将结合实施例来详细说明本发明。
如背景技术所提到的,现有技术对于帕金森病、尤其是早期帕金森病的诊断难以满足需求,本申请提供了能够从蛋白分子的角度鉴别帕金森病的生物标志物,通过获取蛋白标志物的含量,通过模型计算给出预测概率,可协助诊断帕金森病,为受试者提供更明确和有效的诊断结果。
因而,在本申请中发明人尝试对受试者的蛋白进行筛选,发现了与帕金森病相关的蛋白标志物,利用其中的一种或多种蛋白标志物,能够制备诊断帕金森病或预测帕金森病的产品,预测受试者的帕金森病病情或患帕金森病风险,因而提出了本申请的一系列保护方案。
在本申请第一种典型的实施方式中,提供了一种蛋白标志物在制备诊断帕金森或预测帕金森病的产品中的应用,该蛋白标志物包括CPA2和/或DPEP1。
在一种优选的实施例中,蛋白标志物还包括如下任意一种或多种:CXCL6、IL17C、CCL19、CCL27、GPNMB、FGF23、IL32、PSME1或TBCB;优选地,蛋白标志物进一步包括CX3CL1、CLEC10A、IL10、NTRK3、SNCG、PMVK、PTPN中的任意一种或多种。
在一种优选的实施例中,蛋白标志物选自如下任意一组:(1)CCL19、CX3CL1、IL10、CPA2及DPEP1;或(2)CCL19、CX3CL1、IL.17C、CPA2及DPEP1;或(3)CCL19、IL10、CPA2、NTRK3及DPEP1;或(4)CCL19、CX3CL1、CPA2及DPEP1;或(5)CX3CL1、IL10、CPA2及DPEP1;或(6)CX3CL1、CXCL6、IL.17C、CPA2及PMVK;或(7)CX3CL1、CXCL6、IL.17C、CPA2及PTPN1;或(8)CX3CL1、CXCL6、CPA2、GPNMB及PTPN1;或(9)CX3CL1、CXCL6、CPA2、GPNMB及PMVK;或(10)CX3CL1、CXCL6、IL.17C、CPA2及TBCB;或(11)CLEC10A、CPA2、NTRK3及SNCG;或(12)CLEC10A、CPA2、NTRK3及DPEP1;或(13)CLEC10A、CPA2、NTRK3、DPEP1及SNCG;或(14)IL10、CLEC10A、CPA2、NTRK3及SNCG;或(15)CLEC10A、NTRK3及DPEP1;或(16)CX3CL1、CXCL6、IL10、CLEC10A及DPEP1;或(17)CX3CL1、CXCL6、IL.17C、CLEC10A及DPEP1;或(18)CX3CL1、CXCL6、CLEC10A及DPEP1;或(19)CX3CL1、CXCL6、CLEC10A、DPEP1及PSME1;或(20)CX3CL1、CXCL6、FGF.23、CLEC10A及DPEP1;或(21)IL10、CCL27及DPEP1;或(22)IL10、CPA2及DPEP1;或(23)IL10、CCL27、DPEP1及IL32;或(24)IL10、CLEC10A、CPA2及DPEP1;或(25)IL10、CLEC10A及DPEP1;或(26)CPA2及DPEP1;或(27)CPA2、DPEP1及CX3CL1;或(28)CPA2、DPEP1、CX3CL1及CLEC10A;或(29)CPA2、DPEP1、CX3CL1、CLEC10A及IL10。
蛋白质组学是以蛋白质组为研究对象,研究细胞、组织或生物体蛋白质组成及其变化规律的科学。自基因组学之后,蛋白质组学研究成为理解复杂生物系统的新前沿方向。研究证明蛋白质组学在鉴定疾病相关生物标志物、监测疾病进展、评价治疗响应效果等方面具有极大的潜力。此外,由于蛋白质作为靶分子的作用,它在药物开发中也具有重要的作用。
上述蛋白标志物和蛋白标志物的组合,其具有制备诊断帕金森或预测帕金森病的产品的能力。利用上述产品,能够判断受试者是否患有帕金森或预测患帕金森病的风险。此种判断和预测的能力和效果,在进行该实施方式前是无法预计的。在本申请中帕金森和帕金森病均指神经系统变性疾病Parkinson's disease(PD)。
在一种优选的实施例中,应用包括利用检测试剂检测蛋白标志物的含量;优选地,蛋白标志物的含量的检测方法包括但不限于Olink技术、免疫印迹实验(western blot)或酶联免疫吸附测定(ELISA);优选地,检测试剂为蛋白标志物的抗体;优选地,抗体设置在固相载体上;优选地,固相载体包括酶标板、膜载体或微球;优选地,膜载体选自硝酸纤维素膜、玻璃纤维素膜或尼龙膜;优选地,抗体为单克隆抗体或多克隆抗体;优选地,相关产品包括试剂盒或电子预测装置。
所有临床上检测蛋白的方法均适用于本申请,相应地检测试剂也随着不同的检测方法而选用。抗体优选设置为预包被的形式。优选地,预包被的抗体包被于固相载体上;具体的固相载体根据需要合理设计。更优选,固相载体包括酶标板(多为聚苯乙烯材料的)、膜载体或微球;进一步优选地,膜载体包括硝酸纤维素膜(使用最广泛)、玻璃纤维素膜或尼龙膜,更进一步优选地,膜载体上还包被有阳性对照物,相应的蛋白标志物和阳性对照物按检测顺序在硝酸纤维素膜上依次设置。
在上述应用中,利用检测试剂能够检测出蛋白标志物的含量,利用该检测出的含量,能够对帕金森病进行判断或预测。利用Olink技术等蛋白组学、或western blot、ELISA等现有技术,利用抗体等常见检测试剂,能够从生物样品中检测多种蛋白标志物的含量,所需样品量小,准确度高,能够对多种蛋白标志物在生物样品中的含量进行检测,进一步地对帕金森病进行诊断或预测。上述检测方法中所用的检测试剂,均为相应方法中的常规检测试剂。诊断帕金森病或预测帕金森病的相关产品包括但不限于试剂盒或电子预测装置。
在本申请第二种典型的实施方式中,提供了一种用于在受试者中诊断帕金森病或预测帕金森病的试剂盒,该试剂盒包括检测蛋白标志物的含量的检测试剂,蛋白标志物包括CPA2和/或DPEP1。
在一种优选的实施例中,蛋白标志物还包括如下任意一种或多种:CXCL6、IL17C、CCL19、CCL27、GPNMB、FGF23、IL32、PSME1或TBCB;优选地,蛋白标志物进一步包括CX3CL1、CLEC10A、IL10、NTRK3、SNCG、PMVK、PTPN中的任意一种或多种;优选地,蛋白标志物包括:(1)CCL19、CX3CL1、IL10、CPA2及DPEP1;或(2)CCL19、CX3CL1、IL.17C、CPA2及DPEP1;或(3)CCL19、IL10、CPA2、NTRK3及DPEP1;或(4)CCL19、CX3CL1、CPA2及DPEP1;或(5)CX3CL1、IL10、CPA2及DPEP1;或(6)CX3CL1、CXCL6、IL.17C、CPA2及PMVK;或(7)CX3CL1、CXCL6、IL.17C、CPA2及PTPN1;或(8)CX3CL1、CXCL6、CPA2、GPNMB及PTPN1;或(9)CX3CL1、CXCL6、CPA2、GPNMB及PMVK;或(10)CX3CL1、CXCL6、IL.17C、CPA2及TBCB;或(11)CLEC10A、CPA2、NTRK3及SNCG;或(12)CLEC10A、CPA2、NTRK3及DPEP1;或(13)CLEC10A、CPA2、NTRK3、DPEP1及SNCG;或(14)IL10、CLEC10A、CPA2、NTRK3及SNCG;或(15)CLEC10A、NTRK3及DPEP1;或(16)CX3CL1、CXCL6、IL10、CLEC10A及DPEP1;或(17)CX3CL1、CXCL6、IL.17C、CLEC10A及DPEP1;或(18)CX3CL1、CXCL6、CLEC10A及DPEP1;或(19)CX3CL1、CXCL6、CLEC10A、DPEP1及PSME1;或(20)CX3CL1、CXCL6、FGF.23、CLEC10A及DPEP1;或(21)IL10、CCL27及DPEP1;或(22)IL10、CPA2及DPEP1;或(23)IL10、CCL27、DPEP1及IL32;或(24)IL10、CLEC10A、CPA2及DPEP1;或(25)IL10、CLEC10A及DPEP1;或(26)CPA2及DPEP1;或(27)CPA2、DPEP1及CX3CL1;或(28)CPA2、DPEP1、CX3CL1及CLEC10A;或(29)CPA2、DPEP1、CX3CL1及CLEC10A、IL10。
该试剂盒包括检测上述一种或多种蛋白标志物的含量的检测试剂,利用该检测试剂和相应的检测方法、检测设备,能够检测蛋白标志物的含量。优选地,检测试剂包括利用Olink技术等现有技术检测蛋白标志物所需的检测试剂。
在本申请第三种典型的实施方式中,提供了一种诊断帕金森病或预测帕金森病的电子装置,该装置包括:获取检测模块,被设置为获取生物样品,对生物样品进行检测,获得生物样品中的蛋白标志物的含量;诊断或预测模块,诊断或预测模块是使用逻辑回归模型、支持向量机模型或朴素贝叶斯模型和蛋白标志物的含量建立回归方程,构建模型,然后根据模型输出预测结果;在一种优选的实施例中,生物样品为血浆样品;优选地,生物样品中的蛋白标志物包括CPA2和/或DPEP1;优选地,生物样品中的蛋白标志物还包括如下任意一种或多种:CXCL6、IL17C、CCL19、CCL27、GPNMB、FGF23、IL32、PSME1或TBCB;优选地,蛋白标志物进一步包括CX3CL1、CLEC10A、IL10、NTRK3、SNCG、PMVK、PTPN中的任意一种或多种;优选地,蛋白标志物包括:(1)CCL19、CX3CL1、IL10、CPA2及DPEP1;或(2)CCL19、CX3CL1、IL.17C、CPA2及DPEP1;或(3)CCL19、IL10、CPA2、NTRK3及DPEP1;或(4)CCL19、CX3CL1、CPA2及DPEP1;或(5)CX3CL1、IL10、CPA2及DPEP1;或(6)CX3CL1、CXCL6、IL.17C、CPA2及PMVK;或(7)CX3CL1、CXCL6、IL.17C、CPA2及PTPN1;或(8)CX3CL1、CXCL6、CPA2、GPNMB及PTPN1;或(9)CX3CL1、CXCL6、CPA2、GPNMB及PMVK;或(10)CX3CL1、CXCL6、IL.17C、CPA2及TBCB;或(11)CLEC10A、CPA2、NTRK3及SNCG;或(12)CLEC10A、CPA2、NTRK3及DPEP1;或(13)CLEC10A、CPA2、NTRK3、DPEP1及SNCG;或(14)IL10、CLEC10A、CPA2、NTRK3及SNCG;或(15)CLEC10A、NTRK3及DPEP1;或(16)CX3CL1、CXCL6、IL10、CLEC10A及DPEP1;或(17)CX3CL1、CXCL6、IL.17C、CLEC10A及DPEP1;或(18)CX3CL1、CXCL6、CLEC10A及DPEP1;或(19)CX3CL1、CXCL6、CLEC10A、DPEP1及PSME1;或(20)CX3CL1、CXCL6、FGF.23、CLEC10A及DPEP1;或(21)IL10、CCL27及DPEP1;或(22)IL10、CPA2及DPEP1;或(23)IL10、CCL27、DPEP1及IL32;或(24)IL10、CLEC10A、CPA2及DPEP1;或(25)IL10、CLEC10A及DPEP1;或(26)CPA2及DPEP1;或(27)CPA2、DPEP1及CX3CL1;或(28)CPA2、DPEP1、CX3CL1及CLEC10A;或(29)CPA2、DPEP1、CX3CL1、CLEC10A及IL10;优选地,所述根据模型输出预测结果为使用predict函数的type='response',输出概率值,概率值≥0.5,则表示患有帕金森病或风险高,概率值<0.5,则表示不患有帕金森病或风险低。
在本申请第四种典型的实施方式中,提供了一种诊断帕金森病或预测帕金森病的蛋白标志物的筛选方法,该筛选方法包括:获取样本人群的患帕金森病情况和生物样品,对生物样品进行检测,获得生物样品中的蛋白含量,样本人群包括健康人和帕金森患者;根据蛋白含量,通过统计方法筛选在帕金森患者和健康人中有差异的显著差异蛋白;利用样本人群的显著差异蛋白的含量和患帕金森病情况,通过机器学习训练的方法,构建预测模型;在预测模型中出现次数高于阈值的蛋白即为蛋白标志物。
在上述蛋白标志物的筛选方法中,首先获取包括健康人和帕金森患者的样本人群的生物样品和患帕金森病情况。对生物样品进行蛋白检测,选取一定数量的蛋白作为待检测,对生物样品中的待检测蛋白进行检测,得到每个生物样品中的待检测蛋白的含量。使用统计方法检验在帕金森病患者和健康人中有差异的蛋白,即为显著差异蛋白。显著差异蛋白说明,这些蛋白在样本人群中存在的量的多少,与患病情况是有关系的,在健康人和帕金森患者体内,显著差异蛋白的量有显著性差异,但无法确认显著差异蛋白对诊断或预测有怎样的具体效果,也不清楚如何进行诊断或预测。为了保证和提高诊断或预测帕金森病的效果,利用机器学习等方法,对样本人群的显著差异蛋白的含量和患病情况进行建模,构建能够诊断或预测帕金森病的预测模型,预测模型中出现的蛋白,均为从显著差异蛋白中筛选出的、次数高于阈值的、预测效果好的蛋白,即为蛋白标志物。
在一种优选的实施例中,随机切分的次数为多次,构建预测模型的次数为多次,对预测模型进行多次交叉验证;优选地,统计方法包括如下任意一种或多种:T检验、广义线性模型、秩检验、逻辑回归、差异倍数、多重假设检验校正或克鲁斯卡尔沃里斯检验;优选地,生物样品包括血浆;优选地,构建预测模型包括:将样本人群分为训练集和测试集,建立训练集或测试集的显著差异蛋白的含量和患帕金森病情况的映射关系,分别得到训练数据集或测试数据集;利用训练数据集进行机器学习训练,构建预测模型;通过机器学习训练的方法,并采用五折交叉验证,构建预测模型;优选地,机器学习训练包括如下任意一种或多种:逻辑回归模型、支持向量机模型或朴素贝叶斯模型;优选地,构建预测模型过程中,利用分析方法分析建模效果;优选地,分析方法包括LASSO regression(套索回归)、BIC(贝叶斯信息准则)、逐步回归中的一种或多种。
上述用于判断显著差异蛋白的统计方法包括但不限于T-test(T检验)、Wilcoxontest(秩检验)、逻辑回归、KW test(克鲁斯卡尔沃里斯检验)、差异倍数(Fold Change)、多重假设检验校正(Bonferroni correction)或其他现有统计方法中的一种或多种。构建预测模型时,将每个样本的患病情况和显著差异蛋白含量进行汇总,得到汇总的不同个体的数据,进行机器学习训练,并采用五折交叉验证,构建预测模型。
机器学习训练包括但不限于逻辑回归模型,SVM(support vector machines,支持向量机),NBM(Bayesian Model,朴素贝叶斯模型)中的一种或多种。利用上述不同的机器学习方法,能够构建不同预测模型,在五折交叉验证过程中,将不同预测模型的验证结果进行比较,能够获得预测效果最好的模型。在建立预测模型的过程中,利用了包括但不限于LASSO regression(套索回归)、BIC(贝叶斯信息准则)、逐步回归中的一种或多种的分析方法,对建立的预测模型进行分析,选取有效性高的预测模型。
在本申请第五种典型的实施方式中,提供了一种诊断模型的构建方法,利用上述筛选方法获得的蛋白标志物,应用机器学习训练的方法构建诊断模型,所述机器学习训练的方法包括逻辑回归、支持向量机或朴素贝叶斯模型,优选逻辑回归模型。
在一种优选的实施例中,蛋白标志物包括CPA2和/或DPEP1;优选地,蛋白标志物还包括如下任意一种或多种:CXCL6、IL17C、CCL19、CCL27、GPNMB、FGF23、IL32、PSME1或TBCB;优选地,蛋白标志物进一步包括CX3CL1、CLEC10A、IL10、NTRK3、SNCG、PMVK、PTPN中的任意一种或多种;优选地,蛋白标志物包括:(1)CCL19、CX3CL1、IL10、CPA2及DPEP1;或(2)CCL19、CX3CL1、IL.17C、CPA2及DPEP1;或(3)CCL19、IL10、CPA2、NTRK3及DPEP1;或(4)CCL19、CX3CL1、CPA2及DPEP1;或(5)CX3CL1、IL10、CPA2及DPEP1;或(6)CX3CL1、CXCL6、IL.17C、CPA2及PMVK;或(7)CX3CL1、CXCL6、IL.17C、CPA2及PTPN1;或(8)CX3CL1、CXCL6、CPA2、GPNMB及PTPN1;或(9)CX3CL1、CXCL6、CPA2、GPNMB及PMVK;或(10)CX3CL1、CXCL6、IL.17C、CPA2及TBCB;或(11)CLEC10A、CPA2、NTRK3及SNCG;或(12)CLEC10A、CPA2、NTRK3及DPEP1;或(13)CLEC10A、CPA2、NTRK3、DPEP1及SNCG;或(14)IL10、CLEC10A、CPA2、NTRK3及SNCG;或(15)CLEC10A、NTRK3及DPEP1;或(16)CX3CL1、CXCL6、IL10、CLEC10A及DPEP1;或(17)CX3CL1、CXCL6、IL.17C、CLEC10A及DPEP1;或(18)CX3CL1、CXCL6、CLEC10A及DPEP1;或(19)CX3CL1、CXCL6、CLEC10A、DPEP1及PSME1;或(20)CX3CL1、CXCL6、FGF.23、CLEC10A及DPEP1;或(21)IL10、CCL27及DPEP1;或(22)IL10、CPA2及DPEP1;或(23)IL10、CCL27、DPEP1及IL32;或(24)IL10、CLEC10A、CPA2及DPEP1;或(25)IL10、CLEC10A及DPEP1;或(26)CPA2及DPEP1;或(27)CPA2、DPEP1及CX3CL1;或(28)CPA2、DPEP1、CX3CL1及CLEC10A;或(29)CPA2、DPEP1、CX3CL1、CLEC10A及IL10。
在本申请第六种典型的实施方式中,提供了一种计算机可读存储介质,该存储介质包括存储的程序,其中,在程序运行时,控制存储介质所在设备执行上述筛选方法、构建方法或构建模型。
在本申请第七种典型的实施方式中,提供了一种处理器,该处理器用于运行程序,其中,程序运行时执行上述筛选方法、构建方法或诊断模型。
本申请可用于众多通用或专用的计算系统环境或配置中。例如:个人计算机、服务器计算机、手持设备或便携式设备、平板型设备、多处理器系统、基于微处理器的系统、置顶盒、可编程的消费电子设备、网络PC、小型计算机、大型计算机、包括以上任何系统或设备的分布式计算环境等等。
显然,本领域的技术人员应该明白,上述的本申请的部分模块或步骤可以在通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本申请不限制于任何特定的硬件和软件结合。
在本申请第八种典型的实施方式中,提供了一种筛选诊断帕金森病或预测帕金森病的蛋白标志物的装置,该装置包括:获取检测模块,被设置为获取样本人群的患帕金森病情况和生物样品,对生物样品进行检测,获得生物样品中的蛋白含量,样本人群包括健康人和帕金森患者;差异统计模块,被设置为根据蛋白含量,通过统计方法筛选在帕金森患者和健康人中有差异的显著差异蛋白;模型构建模块,被设置为利用样本人群的显著差异蛋白的含量和患帕金森病情况,构建多个预测模型;标志物确定模块,被设置为在多个预测模型中出现次数高于阈值的蛋白即为蛋白标志物。
在一种优选的实施例中,生物样品中的待检测蛋白包括CPA2和/或DPEP1;优选地,待检测蛋白还包括如下任意一种或多种:CXCL6、IL17C、CCL19、CCL27、GPNMB、FGF23、IL32、PSME1或TBCB;优选地,待检测蛋白进一步包括CX3CL1、CLEC10A、IL10、NTRK3、SNCG、PMVK、PTPN中的任意一种或多种。
利用上述装置,能够通过检测样本人群的生物样品中上述待检测蛋白的蛋白含量,筛选诊断帕金森病或预测帕金森病的蛋白标志物,便于在因受试者的区域、环境等因素影响蛋白标志物的预测效果时,对蛋白标志物进行筛选或更新、校正。
下面将结合具体的实施例来进一步详细解释本申请的有益效果。
实施例1:
1.材料与方法
1.1临床样本纳入
本项目研究对象选取帕金森病患者88例,对照组健康人88例,共176样本,所有患者均接受血液采样。纳入患者年龄区间28~85岁,其中男性样本85例,女性样本89例。
所有受试者在通过自制健康问卷调查表获取个体基本信息,包括年龄、性别、身高、BMI、吸烟、饮酒、便秘、抗生素使用等情况,如表1所示。
以上研究方案符合人体试验伦理学标准,并得到伦理委员会批准,受试者在受试前知情同意并签署知情同意书。
表1所有176个样本的临床资料
注:“/”表示该数据不存在。“NA”表示该数据缺失。BMI为身体质量指数(Body MassIndex,BMI)HY分数表示帕金森病HY分级,1=单侧患病;1.5=单侧患病合并躯干(轴)症状;2=双侧患病但无平衡障碍;2.5=轻度双侧患病,能从后拉试验中恢复;3=轻至中度双侧患病,不能从后拉实验恢复,但能自理;4=严重的残疾,但是能自己站立或行走,5=坐轮椅或卧床,完全依赖别人帮助。
1.2 Olink蛋白质检测平台
蛋白测序利用的Olink技术源自于瑞典一家名为Olink Proteomics的创新蛋白质组检测方案公司,采用了独有的称为邻近延伸分析(Proximity Extension Assay,PEA)的蛋白质组检测技术。PEA技术使用一对匹配的抗体,分别偶联独有的DNA寡核苷酸链,形成具有高特异性的探针,与待检测物结合后,相近的两条DNA链互补延伸,生成新的DNA分子模板;再通过qPCR扩增,放大信号进行检测。PCR扩增进行文库模板富集,氢氧化钠变性,产生单链DNA片段。测序和生物信息学分析工作在深圳碳云智能完成。
1.3样本质控
本平台运用邻近延伸分析(PEA)技术,对上述广中医项目的176份血浆样本中的274个蛋白指标进行检测与分析,共三张芯片(panel)。通过在每个样本中加入4个内部质控品,监控整体的检测质量和各个样本的检测质量。
一共检测三张芯片,每个芯片使用两个样本版,所以一共检测6次,如表2.1所示。
表2.1组合目录
整体质控是根据整板的内部质控品的标准偏差进行评估,标准差小于0.2方可通过质控。本项目的6次检测通过整体质控。具体如表2.2所示
单孔样本质控是通过计算每个样本内部质控品的值与整体质控品中值的偏差来评估,偏离中值不超过0.3的样本方可通过质量控制。在本项目的本次测试中,样本质控合格率整体为97%方可通过质控(合格率取整数,四舍五入后达到97%即可)。样本质控结果如表2.3所示。
表2.2整体质控各板标准偏差
表2.3样本质控合格率(%)
综合考虑Inflammation、Neuro Exploratory、Neurology3个数据集,选择在3个数据集中均合格的样本,则最终合格样本是170个,其中疾病组86个,健康组84个。
2.筛选显著差异蛋白
为了比较对照组和疾病组的蛋白物质,筛选在上述两组之间展现出差异的显著差异蛋白。本发明利用R软件来分析差异的蛋白物,利用统计方法,综合显著性统计检验(广义线性模型或T检验等)和差异倍数(Fold change)对170个样本的274个蛋白进行分析。当蛋白显著性统计检验其P值<0.05,视为显著差异蛋白。共得到31种显著差异蛋白,如表3所示。
表3帕金森病患者和健康人之间的31种显著差异蛋白
注:UniPort ID为此蛋白在UniPort数据库(www.uniport.org)中的编号。
2.1筛选疾病预测蛋白标志物
为了评价帕金森病的蛋白组学,即上述31种显著差异蛋白的诊断价值,申请人构建了可检测帕金森患者的逻辑回归模型。将上述170个样本分为70%数量的训练集和30%数量的测试集,其中训练集包括帕金森病患者57个样本和健康人66个样本,测试集包括帕金森病患者30个样本和健康人17个样本。将训练集或测试集的显著差异蛋白的含量和患帕金森病情况的映射关系,分别得到训练数据集或测试数据集。使用显著差异蛋白的含量和患帕金森病情况(即训练数据集)来训练逻辑回归模型,并利用利用BIC分析方法找到最优模型,从而确定对疾病影响最大的蛋白标志物(R.4.0.5,BMA3.18.15软件包)(AdrianRaftery,Jennifer Hoeting,Chris Volinsky,Ian Painter and Ka Yee Yeung(2021)),从而选择蛋白标志物的最优集。在测试集上测试该模型,并测定了预测误差。
①关于该回归模型,通过使用4.0.5版本R软件(R vision 4.0.5)中的“BMA3.18.1包”,输入训练数据集,包括训练集的31种显著差异蛋白的含量、患帕金森病情况(患病情况为矢量,1表示对照,0表示病例)。
②然后使用R软件中的BMA包的bic.glm函数来构建分类模型,并且使用该函数来筛选最佳的疾病预测模型。使用predict()函数预测该模型在测试集中的分类效果。bic.glm函数输出的是预测结果(变量对疾病影响概率(p!=0));估计模型偏差(EV),标准差(SD),五个潜在最佳模型(模型1–模型5)。如表4所示,后验概率越大、BIC越小时,模型最优。表4第一列表示蛋白种类,模型1、模型2、模型3、模型4、模型5列下有数字出现的即表示该模型包含该种蛋白,只有点(.)则表示不包括该蛋白。例如:模型1中包括的蛋白有CX3CL1、CXCL6、IL 17C、CPA2、PMVK。
表4.BIC后验概率最大前五个预测组合
③对模型进行五次重复的交叉验证(五折交叉验证)。
基于逻辑回归模型,使用贝叶斯模型平均法(BMC),进行五次重复验证,每次交叉验证时,都在固定患病组与健康组的比例的基础上,将170个样本随机分为70%数量的训练集和30%数量的测试集,所以五次验证的训练集均为123个样本(包括帕金森病患者57个样本和健康人66个样本)。贝叶斯模型平均法通过根据近似的后验模型概率(posteriorprobability—postprob)对模型类中的最佳模型进行平均。每一次均列出选择后验概率最大的前五个蛋白标志物的所有集合组合,则得到25个预测模型的组合,列于表5中。同时,按照出现次数对各蛋白进行了排序,出现的18种蛋白的排序情况如表6所示,其中出现次数最多的为DPEP1,CPA2,CX3CL1,CLEC10A,IL10。
表5. 25个预测模型组合
表4示出了进行一次交叉验证得到的5个模型;表5示出了共进行5次重复,共得到25个模型(包括表4中的5个模型)。
④计算各种预测模型组合的区分能力
计算上述25个预测模型的区分能力,其中尝试了多种方式进行验证随机显著差异蛋白组合的检测能力,比如利用逻辑回归模型、NBM模型和SVC模型,发现预测结果均比较好。下面以逻辑回归模型和BIC(贝叶斯信息准则法)为例进行效果说明。以下实施例中均将蛋白标志物的不同组合组建逻辑回归模型,利用训练数据集和BIC训练、筛选模型,并利用测试数据集验证模型,计算AUC等数值,如表5倒数3列所示,并计算了测试误差。使用预测模型计算帕金森病概率,并绘制ROC(R 4.0.5,pROC 1.18.0包)。
⑤蛋白标志物的筛选
上述模型1至25中共出现18种显著差异蛋白,即为18种用于组合预测模型的蛋白标志物,如表6所示。蛋白在各个模型出现的次数越多,表明这些蛋白是具有构建模型的关键作用的。
表6. 18种蛋白标志物
我们的研究结果表明,上述18种蛋白在训练集表现良好,如图1所示,ROC曲线的曲线下面积(AUC)为90.89%。
2.2利用筛选得到的蛋白标志物随机组合构建诊断模型
在2.1中筛选过程中出现频次越高,认为与帕金森病诊断的相关性越强,因此考查了出现频次排名前5(分别是IL10、CX3CL1、DPEP1、CLEC10A、CPA2)的蛋白在构建帕金森诊断模型中作用,分别研究了单个蛋白对疾病组与对照组的区分能力(结果如表7中判别AUC所示),和选择该5种蛋白中2种或3种或4种,训练获得诊断模型,在测试集中计算区分能力(结果如表8中AUC所示),并且如图2所示,以这5个蛋白训练得到的模型,其对帕金森疾病的判别效能为AUC=91.7%。需要说明的是:以上均是利用逻辑回归构建模型和利用贝叶斯信息准则法进行模型分析,然后根据得到的蛋白标志物绘制ROC曲线(接受者操作特征曲线),计算曲线下面积(AUC)作为判别模型效能评价参数。由表7和表8的结果可知,单个蛋白(IL10、CX3CL1、DPEP1、CLEC10A、CPA2)均具有一定的对帕金森疾病的区分能力,而以①CPA2、DPEP1或②CPA2、DPEP1、CX3CL1或③CPA2、DPEP1、CX3CL1、CLEC10A或④CPA2、DPEP1、CX3CL1、CLEC10A、IL10构建的诊断模型,其模型准确率(即AUC)达到了0.85以上。可见,IL10、CX3CL1、DPEP1、CLEC10A、CPA2确为与帕金森疾病诊断具有强相关性的蛋白标志物,以IL10、CX3CL1、DPEP1、CLEC10A、CPA2这5种蛋白中任选一个或多个均可用于建立帕金森疾病诊断模型,均可获得理想的效果。
尤其是以DEEP1和CPA2形成的蛋白组合用于预测帕金森疾病的准确率(AUC)也到了0.85(参见表8),这些结果足以支持以DEEP1和/或CPA2作为预测帕金森的风险标志物,具有高灵敏度和高特异性。DEEP1和/或CPA2,任选地与其它16种蛋白中任意一种或多种进行组合,以构建诊断模型,预测帕金森的效果更佳。
表7疾病组和对照组样本蛋白标志物最优集
表8前5个最重要的蛋白标志物所形成的组合
CPA2、DPEP1、CX3CL1、CLEC10A和IL10组成的最优集表现最佳,ROC曲线的曲线下面积(AUC)为91.7%(图2)。
从以上的描述中,可以看出,本发明上述的实施例实现了如下技术效果:本发明利用特定的蛋白标志物中的一种或多种,制备诊断帕金森病或预测帕金森病的产品,能够诊断或预测受试者的患帕金森病的情况或风险。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (15)
1.蛋白标志物在制备诊断帕金森或预测帕金森病的产品中的应用,其特征在于,所述蛋白标志物包括CPA2和/或DPEP1。
2.根据权利要求1所述的应用,其特征在于,所述蛋白标志物还包括如下任意一种或多种:CXCL6、IL17C、CCL19、CCL27、GPNMB、FGF23、IL32、PSME1或TBCB;
优选地,所述蛋白标志物进一步包括CX3CL1、CLEC10A、IL10、NTRK3、SNCG、PMVK、PTPN中的任意一种或多种。
3.根据权利要求2所述的应用,其特征在于,所述蛋白标志物选自如下任意一组:
(1)CCL19、CX3CL1、IL10、CPA2及DPEP1;或
(2)CCL19、CX3CL1、IL.17C、CPA2及DPEP1;或
(3)CCL19、IL10、CPA2、NTRK3及DPEP1;或
(4)CCL19、CX3CL1、CPA2及DPEP1;或
(5)CX3CL1、IL10、CPA2及DPEP1;或
(6)CX3CL1、CXCL6、IL.17C、CPA2及PMVK;或
(7)CX3CL1、CXCL6、IL.17C、CPA2及PTPN1;或
(8)CX3CL1、CXCL6、CPA2、GPNMB及PTPN1;或
(9)CX3CL1、CXCL6、CPA2、GPNMB及PMVK;或
(10)CX3CL1、CXCL6、IL.17C、CPA2及TBCB;或
(11)CLEC10A、CPA2、NTRK3及SNCG;或
(12)CLEC10A、CPA2、NTRK3及DPEP1;或
(13)CLEC10A、CPA2、NTRK3、DPEP1及SNCG;或
(14)IL10、CLEC10A、CPA2、NTRK3及SNCG;或
(15)CLEC10A、NTRK3及DPEP1;或
(16)CX3CL1、CXCL6、IL10、CLEC10A及DPEP1;或
(17)CX3CL1、CXCL6、IL.17C、CLEC10A及DPEP1;或
(18)CX3CL1、CXCL6、CLEC10A及DPEP1;或
(19)CX3CL1、CXCL6、CLEC10A、DPEP1及PSME1;或
(20)CX3CL1、CXCL6、FGF.23、CLEC10A及DPEP1;或
(21)IL10、CCL27及DPEP1;或
(22)IL10、CPA2及DPEP1;或
(23)IL10、CCL27、DPEP1及IL32;或
(24)IL10、CLEC10A、CPA2及DPEP1;或
(25)IL10、CLEC10A及DPEP1;或
(26)CPA2及DPEP1;或
(27)CPA2、DPEP1及CX3CL1;或
(28)CPA2、DPEP1、CX3CL1及CLEC10A;或
(29)CPA2、DPEP1、CX3CL1、CLEC10A及IL10。
4.根据权利要求1至3中任一项所述的应用,其特征在于,所述应用包括利用检测试剂检测所述蛋白标志物的含量;
优选地,所述蛋白标志物的含量的检测方法包括Olink技术、免疫印迹实验或酶联免疫吸附测定;
优选地,所述检测试剂为所述蛋白标志物的抗体;
优选地,所述抗体设置在固相载体上;
优选地,所述固相载体包括酶标板、膜载体或微球;
优选地,所述膜载体选自硝酸纤维素膜、玻璃纤维素膜或尼龙膜;
优选地,所述抗体为单克隆抗体或多克隆抗体;
优选地,所述相关产品包括试剂盒或电子预测装置。
5.一种用于在受试者中诊断帕金森病或预测帕金森病的试剂盒,其特征在于,所述试剂盒包括检测蛋白标志物的含量的检测试剂,所述蛋白标志物包括CPA2和/或DPEP1。
6.根据权利要求5所述的试剂盒,其特征在于,所述蛋白标志物还包括如下任意一种或多种:CXCL6、IL17C、CCL19、CCL27、GPNMB、FGF23、IL32、PSME1或TBCB;
优选地,所述蛋白标志物进一步包括CX3CL1、CLEC10A、IL10、NTRK3、SNCG、PMVK、PTPN中的任意一种或多种;
优选地,所述蛋白标志物包括:
(1)CCL19、CX3CL1、IL10、CPA2及DPEP1;或
(2)CCL19、CX3CL1、IL.17C、CPA2及DPEP1;或
(3)CCL19、IL10、CPA2、NTRK3及DPEP1;或
(4)CCL19、CX3CL1、CPA2及DPEP1;或
(5)CX3CL1、IL10、CPA2及DPEP1;或
(6)CX3CL1、CXCL6、IL.17C、CPA2及PMVK;或
(7)CX3CL1、CXCL6、IL.17C、CPA2及PTPN1;或
(8)CX3CL1、CXCL6、CPA2、GPNMB及PTPN1;或
(9)CX3CL1、CXCL6、CPA2、GPNMB及PMVK;或
(10)CX3CL1、CXCL6、IL.17C、CPA2及TBCB;或
(11)CLEC10A、CPA2、NTRK3及SNCG;或
(12)CLEC10A、CPA2、NTRK3及DPEP1;或
(13)CLEC10A、CPA2、NTRK3、DPEP1及SNCG;或
(14)IL10、CLEC10A、CPA2、NTRK3及SNCG;或
(15)CLEC10A、NTRK3及DPEP1;或
(16)CX3CL1、CXCL6、IL10、CLEC10A及DPEP1;或
(17)CX3CL1、CXCL6、IL.17C、CLEC10A及DPEP1;或
(18)CX3CL1、CXCL6、CLEC10A及DPEP1;或
(19)CX3CL1、CXCL6、CLEC10A、DPEP1及PSME1;或
(20)CX3CL1、CXCL6、FGF.23、CLEC10A及DPEP1;或
(21)IL10、CCL27及DPEP1;或
(22)IL10、CPA2及DPEP1;或
(23)IL10、CCL27、DPEP1及IL32;或
(24)IL10、CLEC10A、CPA2及DPEP1;或
(25)IL10、CLEC10A及DPEP1;或
(26)CPA2及DPEP1;或
(27)CPA2、DPEP1及CX3CL1;或
(28)CPA2、DPEP1、CX3CL1及CLEC10A;或
(29)CPA2、DPEP1、CX3CL1、CLEC10A及IL10。
7.一种诊断帕金森病或预测帕金森病的电子装置,其特征在于,所述电子装置包括:
获取检测模块,被设置为获取生物样品,对所述生物样品进行检测,获得所述生物样品中的蛋白标志物的含量;
诊断或预测模块,所述诊断或预测模块是使用逻辑回归模型、支持向量机模型或朴素贝叶斯模型和所述蛋白标志物的含量建立回归方程,构建模型,然后根据模型输出预测结果;
优选地,所述生物样品为血浆样品;
优选地,所述生物样品中的所述蛋白标志物包括CPA2和/或DPEP1;
优选地,所述生物样品中的蛋白标志物还包括如下任意一种或多种:CXCL6、IL17C、CCL19、CCL27、GPNMB、FGF23、IL32、PSME1或TBCB;
优选地,所述蛋白标志物进一步包括CX3CL1、CLEC10A、IL10、NTRK3、SNCG、PMVK、PTPN中的任意一种或多种;
优选地,所述蛋白标志物包括:
(1)CCL19、CX3CL1、IL10、CPA2及DPEP1;或
(2)CCL19、CX3CL1、IL.17C、CPA2及DPEP1;或
(3)CCL19、IL10、CPA2、NTRK3及DPEP1;或
(4)CCL19、CX3CL1、CPA2及DPEP1;或
(5)CX3CL1、IL10、CPA2及DPEP1;或
(6)CX3CL1、CXCL6、IL.17C、CPA2及PMVK;或
(7)CX3CL1、CXCL6、IL.17C、CPA2及PTPN1;或
(8)CX3CL1、CXCL6、CPA2、GPNMB及PTPN1;或
(9)CX3CL1、CXCL6、CPA2、GPNMB及PMVK;或
(10)CX3CL1、CXCL6、IL.17C、CPA2及TBCB;或
(11)CLEC10A、CPA2、NTRK3及SNCG;或
(12)CLEC10A、CPA2、NTRK3及DPEP1;或
(13)CLEC10A、CPA2、NTRK3、DPEP1及SNCG;或
(14)IL10、CLEC10A、CPA2、NTRK3及SNCG;或
(15)CLEC10A、NTRK3及DPEP1;或
(16)CX3CL1、CXCL6、IL10、CLEC10A及DPEP1;或
(17)CX3CL1、CXCL6、IL.17C、CLEC10A及DPEP1;或
(18)CX3CL1、CXCL6、CLEC10A及DPEP1;或
(19)CX3CL1、CXCL6、CLEC10A、DPEP1及PSME1;或
(20)CX3CL1、CXCL6、FGF.23、CLEC10A及DPEP1;或
(21)IL10、CCL27及DPEP1;或
(22)IL10、CPA2及DPEP1;或
(23)IL10、CCL27、DPEP1及IL32;或
(24)IL10、CLEC10A、CPA2及DPEP1;或
(25)IL10、CLEC10A及DPEP1;或
(26)CPA2及DPEP1;或
(27)CPA2、DPEP1及CX3CL1;或
(28)CPA2、DPEP1、CX3CL1及CLEC10A;或
(29)CPA2、DPEP1、CX3CL1、CLEC10A及IL10;
优选地,所述根据模型输出预测结果为使用predict函数的type='response',输出概率值,概率值≥0.5,则表示患有所述帕金森病或风险高,概率值<0.5,则表示不患有所述帕金森病或风险低。
8.一种诊断帕金森病或预测帕金森病的蛋白标志物的筛选方法,其特征在于,所述筛选方法包括:
获取样本人群的患帕金森病情况和生物样品,对所述生物样品进行检测,获得所述生物样品中的蛋白含量,所述样本人群包括健康人和帕金森患者;
根据所述蛋白含量,通过统计方法筛选在所述帕金森患者和所述健康人中有差异的显著差异蛋白;
利用所述样本人群的所述显著差异蛋白的含量和所述患帕金森病情况,通过机器学习训练的方法,构建预测模型;
在所述预测模型中出现次数高于阈值的蛋白即为所述蛋白标志物。
9.根据权利要求8所述的筛选方法,其特征在于,所述随机切分的次数为多次,构建所述预测模型的次数为多次,对所述预测模型进行多次交叉验证;
优选地,所述统计方法包括如下任意一种或多种:T检验、广义线性模型、秩检验、逻辑回归、差异倍数、多重假设检验校正或克鲁斯卡尔沃里斯检验;
优选地,所述生物样品包括血浆;
优选地,构建所述预测模型包括:
将所述样本人群分为训练集和测试集,建立所述训练集或所述测试集的所述显著差异蛋白的含量和所述患帕金森病情况的映射关系,分别得到训练数据集或测试数据集;
通过所述机器学习训练的方法,并采用五折交叉验证,构建所述预测模型;
优选地,所述机器学习训练包括如下任意一种或多种:逻辑回归模型、支持向量机模型或朴素贝叶斯模型;
优选地,构建所述预测模型过程中,利用分析方法分析建模效果;
优选地,所述分析方法包括套索回归、贝叶斯信息准则或逐步回归中的一种或多种。
10.一种诊断模型的构建方法,其特征在于,利用权利要求8或9所述的筛选方法获得的所述蛋白标志物,应用所述机器学习训练的方法构建所述诊断模型。
11.根据权利要求10所述的构建方法,其特征在于,所述蛋白标志物包括CPA2和/或DPEP1;
优选地,所述蛋白标志物还包括如下任意一种或多种:CXCL6、IL17C、CCL19、CCL27、GPNMB、FGF23、IL32、PSME1或TBCB;
优选地,所述蛋白标志物进一步包括CX3CL1、CLEC10A、IL10、NTRK3、SNCG、PMVK、PTPN中的任意一种或多种;
优选地,所述蛋白标志物包括:
(1)CCL19、CX3CL1、IL10、CPA2及DPEP1;或
(2)CCL19、CX3CL1、IL.17C、CPA2及DPEP1;或
(3)CCL19、IL10、CPA2、NTRK3及DPEP1;或
(4)CCL19、CX3CL1、CPA2及DPEP1;或
(5)CX3CL1、IL10、CPA2及DPEP1;或
(6)CX3CL1、CXCL6、IL.17C、CPA2及PMVK;或
(7)CX3CL1、CXCL6、IL.17C、CPA2及PTPN1;或
(8)CX3CL1、CXCL6、CPA2、GPNMB及PTPN1;或
(9)CX3CL1、CXCL6、CPA2、GPNMB及PMVK;或
(10)CX3CL1、CXCL6、IL.17C、CPA2及TBCB;或
(11)CLEC10A、CPA2、NTRK3及SNCG;或
(12)CLEC10A、CPA2、NTRK3及DPEP1;或
(13)CLEC10A、CPA2、NTRK3、DPEP1及SNCG;或
(14)IL10、CLEC10A、CPA2、NTRK3及SNCG;或
(15)CLEC10A、NTRK3及DPEP1;或
(16)CX3CL1、CXCL6、IL10、CLEC10A及DPEP1;或
(17)CX3CL1、CXCL6、IL.17C、CLEC10A及DPEP1;或
(18)CX3CL1、CXCL6、CLEC10A及DPEP1;或
(19)CX3CL1、CXCL6、CLEC10A、DPEP1及PSME1;或
(20)CX3CL1、CXCL6、FGF.23、CLEC10A及DPEP1;或
(21)IL10、CCL27及DPEP1;或
(22)IL10、CPA2及DPEP1;或
(23)IL10、CCL27、DPEP1及IL32;或
(24)IL10、CLEC10A、CPA2及DPEP1;或
(25)IL10、CLEC10A及DPEP1;或
(26)CPA2及DPEP1;或
(27)CPA2、DPEP1及CX3CL1;或
(28)CPA2、DPEP1、CX3CL1及CLEC10A;或
(29)CPA2、DPEP1、CX3CL1、CLEC10A及IL10。
12.一种计算机可读存储介质,其特征在于,所述存储介质包括存储的程序,其中,在所述程序运行时,控制所述存储介质所在设备执行权利要求8或9所述的筛选方法、权利要求10或11所述的构建方法、或权利要求10或11所述的诊断模型。
13.一种处理器,其特征在于,所述处理器用于运行程序,其中,所述程序运行时执行权利要求8或9所述的筛选方法、权利要求10或11所述的构建方法、或权利要求10或11所述的诊断模型。
14.一种筛选诊断帕金森病或预测帕金森病的蛋白标志物的装置,其特征在于,所述装置包括:
获取检测模块,被设置为获取样本人群的患帕金森病情况和生物样品,对所述生物样品进行检测,获得所述生物样品中的蛋白含量,所述样本人群包括健康人和帕金森患者;
差异统计模块,被设置为根据所述蛋白含量,通过统计方法筛选在所述帕金森患者和所述健康人中有差异的显著差异蛋白;
模型构建模块,被设置为利用所述样本人群的所述显著差异蛋白的含量和所述患帕金森病情况,构建多个预测模型;
标志物确定模块,被设置为在多个所述预测模型中出现次数高于阈值的蛋白即为所述蛋白标志物。
15.根据权利要求14所述的装置,其特征在于,所述生物样品中的待检测蛋白包括CPA2和/或DPEP1;
优选地,所述待检测蛋白还包括如下任意一种或多种:CXCL6、IL17C、CCL19、CCL27、GPNMB、FGF23、IL32、PSME1或TBCB;
优选地,所述待检测蛋白进一步包括CX3CL1、CLEC10A、IL10、NTRK3、SNCG、PMVK、PTPN中的任意一种或多种。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211257679.3A CN115856309A (zh) | 2022-10-12 | 2022-10-12 | 蛋白标志物在制备诊断帕金森或预测帕金森病的产品中的应用 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211257679.3A CN115856309A (zh) | 2022-10-12 | 2022-10-12 | 蛋白标志物在制备诊断帕金森或预测帕金森病的产品中的应用 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115856309A true CN115856309A (zh) | 2023-03-28 |
Family
ID=85661494
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211257679.3A Pending CN115856309A (zh) | 2022-10-12 | 2022-10-12 | 蛋白标志物在制备诊断帕金森或预测帕金森病的产品中的应用 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115856309A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117054670A (zh) * | 2023-10-12 | 2023-11-14 | 北京豪迈生物工程股份有限公司 | 一种测定黑色素瘤糖蛋白b含量的试剂盒及其制备方法 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2006010496A1 (en) * | 2004-07-28 | 2006-02-02 | Bayer Healthcare Ag | Diagnostics and therapeutics for diseases associated with dipeptidase 1 (dpep1) |
US20210147831A1 (en) * | 2018-04-27 | 2021-05-20 | The Broad Institute, Inc. | Sequencing-based proteomics |
-
2022
- 2022-10-12 CN CN202211257679.3A patent/CN115856309A/zh active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2006010496A1 (en) * | 2004-07-28 | 2006-02-02 | Bayer Healthcare Ag | Diagnostics and therapeutics for diseases associated with dipeptidase 1 (dpep1) |
US20210147831A1 (en) * | 2018-04-27 | 2021-05-20 | The Broad Institute, Inc. | Sequencing-based proteomics |
Non-Patent Citations (1)
Title |
---|
HUI WANG ET AL.: "iTRAQ-based proteomic technology revealed protein perturbations in intestinal mucosa from manganese exposure in rat models", RSC ADVANCES, vol. 7, 22 June 2017 (2017-06-22), pages 31745 - 31758 * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117054670A (zh) * | 2023-10-12 | 2023-11-14 | 北京豪迈生物工程股份有限公司 | 一种测定黑色素瘤糖蛋白b含量的试剂盒及其制备方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Kan et al. | Using omics approaches to understand pulmonary diseases | |
Ruuskanen et al. | Gut microbiome composition is predictive of incident type 2 diabetes in a population cohort of 5,572 Finnish adults | |
Chahine et al. | Blood-based biomarkers for Parkinson's disease | |
Sood et al. | Diagnosis of IBS: symptoms, symptom-based criteria, biomarkers or'psychomarkers'? | |
Le et al. | Identification and replication of RNA-Seq gene network modules associated with depression severity | |
AU2014354808A1 (en) | Personalized medicine approach for treating cognitive loss | |
Dawson et al. | Urinary proteomics to support diagnosis of stroke | |
EP3786305A1 (en) | Biomarker for depression and use thereof | |
Coutts et al. | Psychotic disorders as a framework for precision psychiatry | |
CN111020020A (zh) | 一种精神分裂症的生物标志物组合、其应用及metaphlan2筛选方法 | |
CN108085382B (zh) | 通过多个miRNA的表达量确定雷公藤多苷片治疗类风湿性关节炎的个体有效性的系统 | |
IL296574A (en) | Systems and methods for identifying risk for Alzheimer's disease using a non-circulating mrna profile test | |
Ettema et al. | Detecting multiple sclerosis via breath analysis using an eNose, a pilot study | |
Zhang et al. | Genome-wide study of immune biomarkers in cerebrospinal fluid and serum from patients with bipolar disorder and controls | |
Agbaria et al. | Differential diagnosis of the etiologies of bacterial and viral infections using infrared microscopy of peripheral human blood samples and multivariate analysis | |
Hu et al. | Bioinformatics analysis of gene expression profiles for risk prediction in patients with septic shock | |
Gogishvili et al. | Discovery of novel CSF biomarkers to predict progression in dementia using machine learning | |
Carrasco-Zanini et al. | Proteomic prediction of common and rare diseases | |
Schijven et al. | Genetic cross-disorder analysis in psychiatry: from methodology to clinical utility | |
Wang et al. | Comparative studies of genetic and phenotypic associations for 2,168 plasma proteins measured by two affinity-based platforms in 4,000 Chinese adults | |
CN115856309A (zh) | 蛋白标志物在制备诊断帕金森或预测帕金森病的产品中的应用 | |
O'Connell et al. | High-throughput profiling of circulating antibody signatures for stroke diagnosis using small volumes of whole blood | |
CN111020021A (zh) | 一种基于肠道菌群的小规模精神分裂症生物标志物组合、其应用及mOTU筛选方法 | |
Angata et al. | Association of serum interleukin‐27 with the exacerbation of chronic obstructive pulmonary disease | |
Benincasa et al. | High-resolution DNA methylation changes reveal biomarkers of heart failure with preserved ejection fraction versus reduced ejection fraction |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |