CN112094910B - 一种用于前列腺癌患病风险评估的miRNA标志物 - Google Patents
一种用于前列腺癌患病风险评估的miRNA标志物 Download PDFInfo
- Publication number
- CN112094910B CN112094910B CN202011020216.6A CN202011020216A CN112094910B CN 112094910 B CN112094910 B CN 112094910B CN 202011020216 A CN202011020216 A CN 202011020216A CN 112094910 B CN112094910 B CN 112094910B
- Authority
- CN
- China
- Prior art keywords
- mir
- prostate cancer
- marker
- mirna
- expression
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 208000000236 Prostatic Neoplasms Diseases 0.000 title claims abstract description 63
- 206010060862 Prostate cancer Diseases 0.000 title claims abstract description 60
- 108091070501 miRNA Proteins 0.000 title claims abstract description 50
- 239000003550 marker Substances 0.000 title claims abstract description 46
- 239000002679 microRNA Substances 0.000 title claims abstract description 43
- 238000012502 risk assessment Methods 0.000 title description 3
- 108091063381 miR-6131 stem-loop Proteins 0.000 claims abstract description 32
- 108091033433 MiR-191 Proteins 0.000 claims abstract description 30
- 108091043184 miR-1246 stem-loop Proteins 0.000 claims abstract description 30
- 230000014509 gene expression Effects 0.000 claims description 54
- 239000003153 chemical reaction reagent Substances 0.000 claims description 19
- 239000003795 chemical substances by application Substances 0.000 claims description 4
- 108020005187 Oligonucleotide Probes Proteins 0.000 claims description 3
- 239000002751 oligonucleotide probe Substances 0.000 claims description 3
- 238000011529 RT qPCR Methods 0.000 claims description 2
- 238000012165 high-throughput sequencing Methods 0.000 claims description 2
- 238000007901 in situ hybridization Methods 0.000 claims description 2
- 238000002360 preparation method Methods 0.000 claims description 2
- 238000003757 reverse transcription PCR Methods 0.000 claims description 2
- 238000012360 testing method Methods 0.000 description 23
- 108090000623 proteins and genes Proteins 0.000 description 19
- 238000012549 training Methods 0.000 description 17
- 239000011159 matrix material Substances 0.000 description 16
- 201000010099 disease Diseases 0.000 description 11
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 11
- 238000000034 method Methods 0.000 description 11
- 238000012216 screening Methods 0.000 description 9
- 239000000047 product Substances 0.000 description 8
- 230000035945 sensitivity Effects 0.000 description 7
- 238000003745 diagnosis Methods 0.000 description 6
- 206010028980 Neoplasm Diseases 0.000 description 5
- 238000001514 detection method Methods 0.000 description 5
- 238000011161 development Methods 0.000 description 5
- 230000018109 developmental process Effects 0.000 description 5
- 238000012986 modification Methods 0.000 description 5
- 230000004048 modification Effects 0.000 description 5
- 102000004169 proteins and genes Human genes 0.000 description 5
- 239000012472 biological sample Substances 0.000 description 4
- 238000013527 convolutional neural network Methods 0.000 description 4
- 238000010606 normalization Methods 0.000 description 4
- 238000012545 processing Methods 0.000 description 4
- 230000001105 regulatory effect Effects 0.000 description 4
- XUIMIQQOPSSXEZ-UHFFFAOYSA-N Silicon Chemical compound [Si] XUIMIQQOPSSXEZ-UHFFFAOYSA-N 0.000 description 3
- 239000011521 glass Substances 0.000 description 3
- 108020004707 nucleic acids Proteins 0.000 description 3
- 102000039446 nucleic acids Human genes 0.000 description 3
- 150000007523 nucleic acids Chemical class 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 238000004393 prognosis Methods 0.000 description 3
- 239000000523 sample Substances 0.000 description 3
- 229910052710 silicon Inorganic materials 0.000 description 3
- 239000010703 silicon Substances 0.000 description 3
- 239000007787 solid Substances 0.000 description 3
- 238000011282 treatment Methods 0.000 description 3
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 2
- 238000000018 DNA microarray Methods 0.000 description 2
- 102000007066 Prostate-Specific Antigen Human genes 0.000 description 2
- 108010072866 Prostate-Specific Antigen Proteins 0.000 description 2
- 238000007792 addition Methods 0.000 description 2
- 238000003556 assay Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 2
- 201000011510 cancer Diseases 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 238000009826 distribution Methods 0.000 description 2
- 239000003814 drug Substances 0.000 description 2
- 238000013399 early diagnosis Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000002068 genetic effect Effects 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 239000012528 membrane Substances 0.000 description 2
- 238000012544 monitoring process Methods 0.000 description 2
- 229920001184 polypeptide Polymers 0.000 description 2
- 108091007428 primary miRNA Proteins 0.000 description 2
- 102000004196 processed proteins & peptides Human genes 0.000 description 2
- 108090000765 processed proteins & peptides Proteins 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 230000003827 upregulation Effects 0.000 description 2
- 108020005544 Antisense RNA Proteins 0.000 description 1
- 108091032955 Bacterial small RNA Proteins 0.000 description 1
- 206010061818 Disease progression Diseases 0.000 description 1
- 206010059866 Drug resistance Diseases 0.000 description 1
- 206010027476 Metastases Diseases 0.000 description 1
- 108700011259 MicroRNAs Proteins 0.000 description 1
- 206010061309 Neoplasm progression Diseases 0.000 description 1
- 108010057163 Ribonuclease III Proteins 0.000 description 1
- 102000003661 Ribonuclease III Human genes 0.000 description 1
- 108091046869 Telomeric non-coding RNA Proteins 0.000 description 1
- 108020004417 Untranslated RNA Proteins 0.000 description 1
- 102000039634 Untranslated RNA Human genes 0.000 description 1
- 230000002159 abnormal effect Effects 0.000 description 1
- 230000004913 activation Effects 0.000 description 1
- 125000003277 amino group Chemical group 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000009167 androgen deprivation therapy Methods 0.000 description 1
- 230000006907 apoptotic process Effects 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000001174 ascending effect Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 210000000988 bone and bone Anatomy 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 230000024245 cell differentiation Effects 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 230000019522 cellular metabolic process Effects 0.000 description 1
- 238000002512 chemotherapy Methods 0.000 description 1
- 238000013145 classification model Methods 0.000 description 1
- 238000005094 computer simulation Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 230000034994 death Effects 0.000 description 1
- 230000005750 disease progression Effects 0.000 description 1
- 239000006185 dispersion Substances 0.000 description 1
- 230000003828 downregulation Effects 0.000 description 1
- 229940079593 drug Drugs 0.000 description 1
- 238000002474 experimental method Methods 0.000 description 1
- 238000004880 explosion Methods 0.000 description 1
- 150000004676 glycans Chemical class 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 238000009396 hybridization Methods 0.000 description 1
- 238000002955 isolation Methods 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 235000020879 medical diet Nutrition 0.000 description 1
- 108020004999 messenger RNA Proteins 0.000 description 1
- 230000002503 metabolic effect Effects 0.000 description 1
- 239000002184 metal Substances 0.000 description 1
- 230000009401 metastasis Effects 0.000 description 1
- 108091007426 microRNA precursor Proteins 0.000 description 1
- 239000004005 microsphere Substances 0.000 description 1
- 239000013642 negative control Substances 0.000 description 1
- 230000001537 neural effect Effects 0.000 description 1
- 108091027963 non-coding RNA Proteins 0.000 description 1
- 102000042567 non-coding RNA Human genes 0.000 description 1
- 239000002773 nucleotide Substances 0.000 description 1
- 125000003729 nucleotide group Chemical group 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 230000002018 overexpression Effects 0.000 description 1
- 239000002245 particle Substances 0.000 description 1
- 230000007170 pathology Effects 0.000 description 1
- 239000008194 pharmaceutical composition Substances 0.000 description 1
- 230000035479 physiological effects, processes and functions Effects 0.000 description 1
- 229920000642 polymer Polymers 0.000 description 1
- 229920001282 polysaccharide Polymers 0.000 description 1
- 239000005017 polysaccharide Substances 0.000 description 1
- 238000011176 pooling Methods 0.000 description 1
- 239000013641 positive control Substances 0.000 description 1
- 230000001124 posttranscriptional effect Effects 0.000 description 1
- 239000002244 precipitate Substances 0.000 description 1
- 125000002924 primary amino group Chemical group [H]N([H])* 0.000 description 1
- 230000035755 proliferation Effects 0.000 description 1
- 238000000746 purification Methods 0.000 description 1
- 230000002285 radioactive effect Effects 0.000 description 1
- 238000002271 resection Methods 0.000 description 1
- 239000011347 resin Substances 0.000 description 1
- 229920005989 resin Polymers 0.000 description 1
- 230000028327 secretion Effects 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 230000004083 survival effect Effects 0.000 description 1
- 230000001225 therapeutic effect Effects 0.000 description 1
- 230000010474 transient expression Effects 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
- 238000011269 treatment regimen Methods 0.000 description 1
- 239000000439 tumor marker Substances 0.000 description 1
- 230000005751 tumor progression Effects 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6876—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
- C12Q1/6883—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
- C12Q1/6886—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F30/00—Computer-aided design [CAD]
- G06F30/20—Design optimisation, verification or simulation
- G06F30/27—Design optimisation, verification or simulation using machine learning, e.g. artificial intelligence, neural networks, support vector machines [SVM] or training a model
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0639—Performance analysis of employees; Performance analysis of enterprise or organisation operations
- G06Q10/06393—Score-carding, benchmarking or key performance indicator [KPI] analysis
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B25/00—ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/158—Expression markers
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/178—Oligonucleotides characterized by their use miRNA, siRNA or ncRNA
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Physics & Mathematics (AREA)
- Human Resources & Organizations (AREA)
- Chemical & Material Sciences (AREA)
- Theoretical Computer Science (AREA)
- Genetics & Genomics (AREA)
- Organic Chemistry (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Strategic Management (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biotechnology (AREA)
- Development Economics (AREA)
- Molecular Biology (AREA)
- Analytical Chemistry (AREA)
- Wood Science & Technology (AREA)
- Zoology (AREA)
- Entrepreneurship & Innovation (AREA)
- Biophysics (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Economics (AREA)
- Pathology (AREA)
- Medical Informatics (AREA)
- Educational Administration (AREA)
- General Physics & Mathematics (AREA)
- Immunology (AREA)
- Evolutionary Computation (AREA)
- Evolutionary Biology (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Biochemistry (AREA)
- Game Theory and Decision Science (AREA)
- Microbiology (AREA)
- Marketing (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Tourism & Hospitality (AREA)
Abstract
本发明公开了一种用于前列腺癌患病风险评估的miRNA标志物,所述标志物选自miR‑191、miR‑6131、miR‑1246中的一种或几种,本发明利用神经卷积网络构建了预测前列腺癌的风险评分模型,使用该模型诊断前列腺癌具有较高准确性、敏感性和特异性。
Description
技术领域
本发明属于生物医学领域,涉及一种用于前列腺癌患病风险评估的miRNA标志物。
背景技术
前列腺癌(PCa)是美国和欧洲男性最常见的癌症,分列癌症死亡原因的第二、第三位。虽然我国目前临床前列腺癌发病率远较西方国家水平低,但近些年来前列腺癌的发病率也在逐年攀升(Acloque H,Thiery J P,Nieto M A.The physiology and pathology ofthe EMT.Meeting on the epithelial-mesenchymal transition[J].EMBO Rep,2008,9(4):322-326.)。血浆前列腺特异性抗原(PSA)检测应用于临床前列腺癌的筛查以来,使得很多的早期无症状的前列腺癌患者得到了诊断和治疗。然而,近年来,多数早期诊断的前列腺癌属于惰性前列腺癌,患者即使不接受治疗,也不会死于前列腺癌,所以可以采用主动监测的方式避免过度治疗。侵袭性前列腺癌如果不能在早期经根治性切除手术彻底清除,即使经雄激素剥夺治疗最终仍将发生远处转移(如骨)或者进展为去势抵抗型前列腺癌(李立夏,张颖,梁婧.针对去势抵抗性前列腺癌新型药物的研究进展指导[J].医学食疗与健康,2018(7):206,208.)。一旦病情发展到这个阶段,目前尚没有有效的治愈手段,化疗也只是让部分患者受益,且仅仅是生存期延长几个月而已。因此,积极筛选前列腺癌早期标志物,探索其预测价值及适宜的疾病进展监测模式是当前前列腺癌研究领域的热点问题,对于早期前列腺癌患者的诊断具有重要意义。
随着基因测序、转录组学和生物信息学的发展,已发现越来越多的非编码RNA参与肿瘤的发生发展进程,包括微小RNAs(microRNAs,miRNAs)和长链非编码RNA(long non-coding RNA,1ncRNA)。这为筛查新的肿瘤诊断标志物和治疗靶点提供了坚实的基础。miRNA是一类内生的、长度约20-24个核苷酸的小RNA,其在细胞内具有多种重要的调节作用。主要在转录后水平调控基因表达(大约调控1/3的蛋白编码基因),从而控制细胞的凋亡、增殖、分化、代谢以及个体的发育和肿瘤的发生、发展以及耐药。miRNA不仅具备作为前列腺癌诊断标志物的潜质,还与前列腺癌的预后以及药物疗效密切相关。MicroRNA存在多种形式,最原始的是pri-miRNA,长度大约为300~1000个碱基;pri-miRNA经过一次加工后,成为pre-miRNA即microRNA前体,长度大约为70~90个碱基;pre-miRNA再经过Dicer酶酶切后,成为长约20~24nt的成熟miRNA。miRNA差异表达谱,极有可能为前列腺癌的早期诊断,预后分析及疗效判断提供有力武器。
发明内容
鉴于现有技术存在的问题,本发明的目的在于提供与前列腺癌发生发展相关的标志物,本发明提供的前列腺癌标志物用于前列腺癌的诊断具有较高的灵敏性和特异性,有利于实现前列腺癌的早期诊断。
为了实现上述目的,本发明采用了如下技术方案:
本发明的第一方面提供了前列腺癌相关的miRNA标志物,所述miRNA标志物选自miR-191、miR-6131、miR-1246中的一种或几种。
作为一种可选择的实施方式,所述miRNA标志物选自miR-191、miR-6131、miR-1246的任意一种。优选地,所述miRNA标志物选自miR-6131。
作为一种优选的实施方式,所述miRNA标志物选自miR-191、miR-6131、miR-1246中的任意两种。
作为一种更为优选的实施方式,所述miRNA标志物为miR-191、miR-6131、miR-1246三者的组合。
本发明的第二方面提供了一种试剂,所述试剂能够检测本发明第一方面所述的miRNA标志物的表达水平。
作为一种可选择的实施方式,所述试剂为检测miR-191表达水平的试剂。
作为一种可选择的实施方式,所述试剂为检测miR-6131表达水平的试剂。
作为一种可选择的实施方式,所述试剂为检测miR-1246表达水平的试剂。
作为一种优选的实施方式,所述试剂包括检测miR-191和miR-6131表达水平的试剂。
作为一种优选的实施方式,所述试剂包括检测miR-191和miR-1246表达水平的试剂。
作为另外一种优选的实施方式,所述试剂包括检测miR-6131和miR-1246表达水平的试剂。
作为一种更为优选的实施方式,所述试剂包括检测miR-191、miR-6131、miR-1246三种miRNA表达水平的试剂。
进一步,所述试剂选自:
特异性识别本发明第一方面所述的miRNA标志物的寡核苷酸探针;或
特异性扩增本发明第一方面所述的miRNA标志物的引物。
本发明的第三方面提供了一种诊断前列腺癌的产品,所述产品包括检测本发明第一方面所述miRNA标志物的表达水平的试剂。
进一步,所述产品包括:通过RT-PCR、实时定量PCR、原位杂交、芯片或高通量测序平台检测本发明第一方面所述miRNA标志物的表达水平的试剂。
进一步,所述产品包括芯片或试剂盒。
在本发明中,芯片的制备可采用本领域已知的生物芯片的常规制造方法,例如,如果固相载体采用的是修饰玻片或硅片,探针的5’端含有氨基修饰的聚dT串,可将寡核苷酸探针配制成溶液,然后采用点样仪将其点在修饰玻片或硅片上,排列成预定的序列或阵列,然后通过放置过夜来固定,就可得到本发明的miRNA芯片。如果核酸不含氨基修饰,则其制备方法也可参照:王申五主编的《基因诊断技术-非放射性操作手册》;J.L.erisi,V.R.Iyer,P.O.BROWN.Exploring the metabolic and genetic control of geneexpression on a genomic scale.Science,1997;278:680和马立人,蒋中华主编.生物芯片.北京:化学工业出版社,2000,1-130。
本发明提供了一种诊断前列腺癌的试剂盒,作为一种可选择的实施方式,所述试剂盒包含与一种或多种miRNA标志物特异性结合的一种或多种探针。作为进一步的实施方式,所述试剂盒还包含洗涤溶液。作为进一步的实施方式,所述试剂盒还包含进行杂交试验的试剂、核酸分离或纯化工具、检测工具以及阳性和阴性对照。作为更进一步的实施方式,所述试剂盒还包含使用该试剂盒的说明书,所述说明书记载了如何采用试剂盒进行检测,和如何利用检测结果对肿瘤发展进行判断、对治疗方案进行选择。这样一种试剂盒可以采用例如试纸条、膜、芯片、盘、测试条、滤器、微球、载片、多孔板或光纤。所述试剂盒的固相支持物可以是例如塑料、硅片、金属、树脂、玻璃、膜、颗粒、沉淀物、凝胶、聚合物、薄片、球、多糖、毛细管、胶片、板或载片。
本发明的第四方面提供了一种建立前列腺癌诊断模型的方法,所述方法包括以下步骤:
1)收集样本,将样本分为训练集和测试集两组,检测样本中基因的表达水平;
2)对训练集数据和测试集数据整合进行归一化处理;
3)筛选差异表达基因;
4)采用一维神经卷积网络处理训练集的数据,构建风险评分模型;
5)使用测试集数据对风险评分模型进行测试,检测风险评分模型的预测准确性。
进一步,所述差异表达基因为本发明第一方面所述的miRNA标志物。
进一步,所述风险评分模型以miR-191、miR-6131或miR-1246的表达水平作为输入变量,当风险评分大于0.5时,受试者患有前列腺癌的风险高;当风险评分小于0.5时,受试者患有前列腺癌的风险低。
本发明的第五方面提供了一种预测前列腺癌的系统,所述系统包括诊断模块,所述诊断模块嵌合本发明第四方面所述的方法构建的风险评分模型。
在本发明的具体实施方式中,所述系统以miR-191、miR-6131或miR-1246的表达水平作为输入变量,当风险评分大于0.5时,受试者患有前列腺癌的风险高;当风险评分小于0.5时,受试者患有前列腺癌的风险低。
本发明的第六方面提供了如下任一项所述的应用:
1)本发明第一方面所述的miRNA标志物在构建预测前列腺癌的计算模型、制备治疗前列腺癌的药物组合物中的应用;
2)本发明第二方面所述的试剂、本发明第三方面所述的产品在制备诊断前列腺癌的工具中的应用;
3)本发明第四方面所述的方法在构建前列腺癌诊断模型或预测前列腺癌的系统中的应用。
在本发明中,当采用标志物在个体中指示异常进程、疾病或其他病症或作为异常进程、疾病或其他病症的标志时,该标志物与在个体中指示正常进程、无疾病或其他病症或作为正常进程、无疾病或其他病症的标志的标志物的表达水平或值相比较,通常被描述为过表达的或低表达的。“上调”、“上调的”、“过表达”、“过表达的”和其任何变化形式互换地用来指大于在健康或正常个体中通常检测到的标志物的值或水平(或值或水平的范围)的生物样品中的标志物的值或水平。该术语还可指大于在特定疾病的不同阶段可检测到的标志物的值或水平(或值或水平的范围)的生物样品中的标志物的值或水平。
“下调”、“下调的”、“低表达”、“低表达的”和其任何变化形式互换地用来指小于在健康或正常个体中通常检测到的标志物的值或水平(或值或水平的范围)的生物样品中的标志物的值或水平。该术语还可指小于在特定疾病的不同阶段可检测到的标志物的值或水平(或值或水平的范围)的生物样品中的标志物的值或水平。
此外,与在个体中指示正常进程或无疾病或其他病症或作为正常进程或无疾病或其他病症的标记的标志物的“正常”表达水平或值相比较,过表达的或低表达的标志物还可称作“差异表达的”或称作具有“差异水平”或“差异值”。因此,标志物的“差异表达”还可称作标志物的“正常”表达水平的变化形式。
术语“差异标志物表达”和“差异表达”互换地用来指相对于其在正常对象中的表达,或相对于其在对特定治疗不同地应答的或具有不同的预后的患者中的表达,其表达在患有特定疾病的对象中被激活为较高或较低水平的标志物。该术语还包括其表达在相同的疾病的不同的阶段被激活为较高或较低水平的标志物。还要理解的是差异表达标志物可在核酸水平或蛋白水平上被激活或被抑制,或可经受选择性剪接以产生不同的多肽产物。这种差异可通过包括mRNA水平、微小RNA水平、反义转录物水平或蛋白表面表达、分泌或多肽的其他划分的多种改变来证实。差异标志物表达可包括两个或更多个基因之间或其基因产物之间的表达的比较;或两个或更多个基因之间或其基因产物之间的表达的比率的比较;或甚至相同基因的两个不同加工的产物的比较,其在正常对象和患病对象之间是不同的;或在相同疾病的不同阶段是不同的。差异表达包括例如在正常细胞和病态细胞之间或在经历不同的疾病事件或疾病阶段的细胞之间,在标志物中瞬时表达模式或细胞表达模式中的定量和定性的差异。
“表达差异增加”或“上调”表示基因相对于对照而言,基因表达(以RNA表达或蛋白质表达测定)显示增加至少10%或更多,例如20%、30%、40%或50%、60%、70%、80%、90%或更多或1.1倍、1.2倍、1.4倍、1.6倍、1.8倍或更多。
“表达差异降低”或“下调”表示基因相对于对照而言,基因表达(以RNA表达或蛋白质表达测定)显示降低至少10%或更多,例如20%、30%、40%或50%、60%、70%、80%、90%或少于1.0倍、0.8倍、0.6倍、0.4倍、0.2倍、0.1倍或更少的基因。
在本发明中,曲线下面积被用来判断标志物的诊断效能,其是指本技术领域中所众所周知的受试者工作特征曲线(receiver operating characteristic curve;ROC)的下面积。曲线下面积(AUC)测定有助于经由整体数据范围来比较分类器的准确性。具有更大的曲线下面积(AUC)的分类器具有更大的能力以在两个感兴趣的组(例如,前列腺癌样本及正常或对照样本)之间准确分类未知物。在于区别两个群体(例如,具有前列腺癌的组与非前列腺癌的对照组)方面上,受试者工作特征曲线(ROC)有用于以图表形式来表现特定的特征(例如,本发明中所描述的标志物和/或额外的生物医学信息的任意项目)的性能。通常,基于单一特征值,经由整个群体(例如,患者组及对照组)的上述特征数据被升序排列。然后,针对上述特征的每个值,计算对于数据的真阳性率(true positi ve rate)及假阳性率(false positive rate)。通过计算高于针对其特性的值以上的病例数之后,除以总病例数来测定上述真阳性率。通过计算高于针对其特性的值以上的对照组数之后,除以总对照组数来测定上述假阳性率。尽管该定义是指患者组的特性相对于对照组高的情况,但该定义还适用于患者组的特性相对于对照组低的情况(在这种情况下,可计算出低于上述特性的值的样本的数)。受试者工作特征曲线(ROC)可以针对其他单一计算,还可针对单一特性生成,为了提供单一和值,例如,可数学性地组合两个以上的特性(例如,加、减、乘等),该单一和值可由受试者工作特征曲线(ROC)来表示。附加地,能够以受试者工作特征曲线(ROC)来画出可导出单一计算值的多重特性的组合。这些特性组合可构成测试。上述受试者工作特征曲线(ROC)为表示相对于测试的假阳性率(1-特异性)的测试的真阳性率(灵敏度)的图表。
常规地,AUC面积总是≥0.5(如果不是这样,那么可以颠倒决策规则来使之这样)。数值范围介于1.0(完美分开两个组的测试值)和0.5(两个组的测试值之间没有明显分布差异)之间。面积不仅取决于线图的特定部分诸如最接近对角线的点或90%特异性处的灵敏度,而且还取决于整个线图。这是ROC线图如何接近完美者(面积=1.0)的一种定量、描述性表述。
整体测定法灵敏度会取决于实施本文公开的方法要求的特异性。在某些优选设置中,特异性75%可能是充分的,而且统计方法和所得算法可以基于此特异性要求。在一个优选实施方案中,用于评估有前列腺癌风险的个体的方法基于特异性80%、85%、或还优选90%或95%。
与现有技术相比,本发明具有以下有益效果:
本发明首先筛选了在前列腺癌中呈现显著性差异的miRNA,所述差异表达的miRNA具有较高的诊断效能。
本发明构建了前列腺癌的风险评分模型,所述模型以miR-191、miR-6131、miR-1246的表达水平作为输入变量,根据评分来判断受试者是否患有前列腺癌,使用该模型诊断前列腺癌具有较高的准确性,特异性和敏感性。
附图说明
图1是训练集中miR-6131的诊断效能图,其中图A是ROC曲线图,图B是混淆矩阵图;
图2是训练集中miR-191的诊断效能图,其中图A是ROC曲线图,图B是混淆矩阵图;
图3是训练集中miR-1246的诊断效能图,其中图A是ROC曲线图,图B是混淆矩阵图;
图4是训练集中miR-191与miR-6131的联合诊断效能图,其中图A是ROC曲线图,图B是混淆矩阵图;
图5是训练集中miR-6131与miR-1246的联合诊断效能图,其中图A是ROC曲线图,图B是混淆矩阵图;
图6是训练集中miR-1246与miR-191的联合诊断效能图,其中图A是ROC曲线图,图B是混淆矩阵图;
图7是训练集中miR-191、miR-6131与miR-1246的联合诊断效能图,其中图A是ROC曲线图,图B是混淆矩阵图;
图8是测试集中miR-6131的诊断效能图,其中图A是ROC曲线图,图B是混淆矩阵图;
图9是测试集中miR-191的诊断效能图,其中图A是ROC曲线图,图B是混淆矩阵图;
图10是测试集中miR-1246的诊断效能图,其中图A是ROC曲线图,图B是混淆矩阵图;
图11是测试集中miR-191与miR-6131的联合诊断效能图,其中图A是ROC曲线图,图B是混淆矩阵图;
图12是测试集中miR-6131与miR-1246的联合诊断效能图,其中图A是ROC曲线图,图B是混淆矩阵图;
图13是测试集中miR-1246与miR-191的联合诊断效能图,其中图A是ROC曲线图,图B是混淆矩阵图;
图14是测试集中miR-191、miR-6131与miR-1246的联合诊断效能图,其中图A是ROC曲线图,图B是混淆矩阵图。
具体实施方式
下面结合附图和实施例详细描述本发明,以下所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员,在不脱离本发明方法的前提下,还可以做出若干改进和补充,这些改进和补充也应视为本发明的保护范围。
实施例1筛选与前列腺癌相关的miRNA
1、样本
从GEO数据库中选择前列腺癌患者和相应的正常人作为研究对象,共纳入了849例前列腺癌样本及10475例正常人样本。从849例前列腺癌样本随机选取300例作为测试集,其余549例的作为训练集;从10475例正常人中随机选取300例作为测试集,其余的10175例作为训练集。
2、数据归一化处理
对测试集数据和训练集数据归一化处理:a)把数据归一化至(0,1)区间或者(-1,1)区间;b)把有量纲表达式变成无量纲表达式。
3)筛选差异表达分子
针对测试集数据和训练集数据使用edgeR包筛选出差异表达miRNA;筛选标准为p-value≤0.05,log2FC≥2或log2FC≤-2,FDR≤0.05。
4)结果
结果显示,经分析筛选得到3个在前列腺癌患者中显著上调的miRNA,相关信息如表1所示。
表1差异表达基因
实施例2风险评分模型构建
利用一维卷积神经网络模型构建风险评分模型。一维卷积神经网络模型的输入张量维度为(length,1),其中length代表选取特征miRNA的数量。
模型主体依次包括初始卷积层(init_conv)、八个残差卷积模块(res_block)、一个全局池化层(GlobalAveragePooling),一个全连接层(Dense)以及一个激活输出层(Sigmoid)。其中,conv为一维卷积操作,k代表卷积核的大小,filters代表卷积核的个数。BatchNorm为批标准化层,其作用为将上一层的输出张量规范化至均值为0、方差为1的标准正态分布,以缓解网络训练中的梯度弥散和梯度爆炸,加快模型的训练速度。ReLU为线性整流函数(Rectified Linear Unit),又称修正线性单元,是一种神经网络中常用的激活函数。
初始卷积层由conv(k=2,filters=64)、BatchNorm、ReLU组成。卷积模块由BatchNorm、ReLU、conv(k,filters)组成。残差卷积模块由conv_block(k=1,filters1),conv_block(k=2,filters2),conv_block(k=1,filters3)三者组成,其中filters1、filters2、filters3,代表选取三种数量的卷积核。实验表明,利用上述设计的CNN分类模型,可以精确判断输入的miRNA的表达量是否为前列腺癌。
根据一维卷积神经网络模型代入前面所述的三种差异表达miRNA构建的风险评分模型为:风险评分=model(miR-191的表达水平,miR-6131的表达水平,miR-1246的表达水平)。当风险评分大于0.5时,受试者患有前列腺癌风险高;当风险评分小于0.5时,受试者患有前列腺癌风险低。
实施例3风险评分模型的诊断效能检测
在训练集中,使用本发明的风险评分模型诊断受试者前列腺癌患病风险的结果显示,单个miRNA或几个miRNA联合后可作为诊断前列腺癌患病风险的独立因子,miRNA联合后形成的曲线下面积(AUC)是最高的,同时也具有较高的特异性和灵敏性(混淆矩阵图),如表2和图1-7所示,
表2不同miRNA标志物诊断的AUC和ACC(准确率)
miRNA | AUC | ACC |
miR-6131 | 0.906 | 0.785 |
miR-191 | 0.914 | 0.724 |
miR-1246 | 0.891 | 0.779 |
miR-191+miR-6131 | 0.979 | 0.807 |
miR-6131+miR-1246 | 0.978 | 0.812 |
miR-191+miR-1246 | 0.974 | 0.864 |
miR-191+miR-6131+miR-1246 | 0.974 | 0.888 |
在测试集中,使用本发明的风险评分模型诊断受试者前列腺癌患病风险的结果显示,单个miRNA或几个miRNA联合后可作为诊断前列腺癌患病风险的独立因子,3个miRNA联合后形成的曲线下面积(AUC)是最高的,同时也具有较高的特异性和灵敏性(混淆矩阵图)如表3和图8-14所示。
表3不同miRNA标志物诊断的AUC及ACC(准确率)
miRNA | AUC | ACC |
miR-6131 | 0.930 | 0.817 |
miR-191 | 0.913 | 0.724 |
miR-1246 | 0.915 | 0.802 |
miR-191+miR-6131 | 0.971 | 0.81 |
miR-6131+miR-1246 | 0.969 | 0.785 |
miR-191+miR-1246 | 0.968 | 0.853 |
miR-191+miR-6131+miR-1246 | 0.975 | 0.903 |
上述实施例的说明只是用于理解本发明的方法及其核心思想。应当指出,对于本领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以对本发明进行若干改进和修饰,这些改进和修饰也将落入本发明权利要求的保护范围内。
Claims (4)
1.检测miRNA标志物表达水平的试剂在制备诊断前列腺癌的产品中的应用,其特征在于,所述miRNA选自miR-6131;或miR-6131与以下miRNA的组合:miR-191和/或miR-1246。
2.根据权利要求1所述的应用,其特征在于,所述试剂选自:
特异性识别所述的miRNA标志物的寡核苷酸探针;或
特异性扩增所述的miRNA标志物的引物。
3.根据权利要求1所述的应用,其特征在于,所述产品包括:通过RT-PCR、实时定量PCR、原位杂交、芯片或高通量测序平台检测miRNA标志物表达水平的试剂。
4.根据权利要求1所述的应用,其特征在于,所述产品包括芯片或试剂盒。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011020216.6A CN112094910B (zh) | 2020-09-25 | 2020-09-25 | 一种用于前列腺癌患病风险评估的miRNA标志物 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011020216.6A CN112094910B (zh) | 2020-09-25 | 2020-09-25 | 一种用于前列腺癌患病风险评估的miRNA标志物 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112094910A CN112094910A (zh) | 2020-12-18 |
CN112094910B true CN112094910B (zh) | 2023-03-24 |
Family
ID=73756519
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011020216.6A Active CN112094910B (zh) | 2020-09-25 | 2020-09-25 | 一种用于前列腺癌患病风险评估的miRNA标志物 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112094910B (zh) |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111676291A (zh) * | 2020-07-14 | 2020-09-18 | 徐州医科大学 | 一种用于肺癌患病风险评估的miRNA标志物 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2009108860A2 (en) * | 2008-02-28 | 2009-09-03 | The Ohio University Rasearch Foundation | Microrna-based methods and compositions for the diagnosis, pronosis and treatment of prostate related disorders |
US10480033B2 (en) * | 2015-01-14 | 2019-11-19 | Ohio State Innovation Foundation | MiRNA-based predictive models for diagnosis and prognosis of prostate cancer |
JP2018504915A (ja) * | 2015-02-11 | 2018-02-22 | エクシコン エ/エス | 尿中の前立腺癌の早期発見のためのmicroRNAに基づく方法 |
US10682425B2 (en) * | 2016-12-14 | 2020-06-16 | The Regents Of The University Of California | Engineered B lymphocytes and compositions having micro-RNA and methods for making and using them |
-
2020
- 2020-09-25 CN CN202011020216.6A patent/CN112094910B/zh active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111676291A (zh) * | 2020-07-14 | 2020-09-18 | 徐州医科大学 | 一种用于肺癌患病风险评估的miRNA标志物 |
Also Published As
Publication number | Publication date |
---|---|
CN112094910A (zh) | 2020-12-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN103733065B (zh) | 用于癌症的分子诊断试验 | |
Swindell et al. | ALS blood expression profiling identifies new biomarkers, patient subgroups, and evidence for neutrophilia and hypoxia | |
CN103299188B (zh) | 用于癌症的分子诊断试验 | |
EP2982985B1 (en) | System for predicting prognosis of locally advanced gastric cancer | |
EP2914739B1 (en) | Biomarker combinations for colorectal tumors | |
AU2012261820A1 (en) | Molecular diagnostic test for cancer | |
AU2008317851A1 (en) | Gene-based algorithmic cancer prognosis and clinical outcome of a patient | |
CN111183235A (zh) | 使用微rna基因表达来对黑素瘤进行诊断、分期和监测的方法 | |
JP5089993B2 (ja) | 乳癌の予後診断 | |
CN105874080A (zh) | 用于食道癌的分子诊断测试 | |
Fält et al. | Identification of progression markers in B-CLL by gene expression profiling | |
CN113614249A (zh) | 预测前列腺癌的方法及其用途 | |
CN103403187A (zh) | 结肠直肠癌复发的预后特征 | |
CN111676291B (zh) | 一种用于肺癌患病风险评估的miRNA标志物 | |
US11339446B2 (en) | Biomarker for measurement of response and prognosis of triple-negative breast cancer to anticancer agent | |
JP2004344171A (ja) | 乳癌予後予測法 | |
KR20180007291A (ko) | 암 리스크를 검출하는 방법 | |
CN112094910B (zh) | 一种用于前列腺癌患病风险评估的miRNA标志物 | |
CN113736879A (zh) | 用于小细胞肺癌患者预后的系统及其应用 | |
CN111172285A (zh) | 用于胰腺癌早期诊断和/或预后监测的miRNA组及其应用 | |
CN111778339B (zh) | 与食管癌相关的miRNA标志物及其应用 | |
WO2020117620A1 (en) | Method, system and kit to detect metastatic hepatic cancer stemming from colorectal tumors and to determine a proposed treatment regime | |
Gibbons et al. | Sequential prediction bounds for identifying differentially expressed genes in replicated microarray experiments | |
CN114736961B (zh) | 基于转录因子识别老年期抑郁症的诊断试剂、应用及系统 | |
CN119082307B (zh) | 基于外囊泡miRNA的胰腺癌诊断标志物及其应用 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |