CN114480650A - 一种预测三阴乳腺癌临床预后复发风险的标志物及模型 - Google Patents
一种预测三阴乳腺癌临床预后复发风险的标志物及模型 Download PDFInfo
- Publication number
- CN114480650A CN114480650A CN202210118351.7A CN202210118351A CN114480650A CN 114480650 A CN114480650 A CN 114480650A CN 202210118351 A CN202210118351 A CN 202210118351A CN 114480650 A CN114480650 A CN 114480650A
- Authority
- CN
- China
- Prior art keywords
- model
- recurrence
- expression
- breast cancer
- negative breast
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6876—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
- C12Q1/6883—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
- C12Q1/6886—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B5/00—ICT specially adapted for modelling or simulations in systems biology, e.g. gene-regulatory networks, protein interaction networks or metabolic networks
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/118—Prognosis of disease development
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/158—Expression markers
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Engineering & Computer Science (AREA)
- Organic Chemistry (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Biotechnology (AREA)
- Wood Science & Technology (AREA)
- Biophysics (AREA)
- Pathology (AREA)
- Zoology (AREA)
- Analytical Chemistry (AREA)
- Molecular Biology (AREA)
- Immunology (AREA)
- Genetics & Genomics (AREA)
- Physiology (AREA)
- Oncology (AREA)
- Hospice & Palliative Care (AREA)
- Theoretical Computer Science (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Microbiology (AREA)
- Medical Informatics (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Biochemistry (AREA)
- General Engineering & Computer Science (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
本发明涉及一种预测三阴乳腺癌临床预后复发风险的标志物及模型,所述标志物包括以下基因中的一种或两种以上的组合:ALAS2、AREG、ATM、BMPR1A、CLDN15、KRT33B、MSMB、MTDH、MYBPC1、NF1、NF2、NTRK3、PAX8、PLEK2、SLC5A5、TRADD。本发明以复发率作为目标变量与机器学习方法建立模型的目标函数,基于关联系数分层的迭代线性回归算法,利用三阴乳腺癌切片的全转录组数据,建立准确的临床预后复发风险预测模型。利用该模型可以在三阴乳腺癌患者进行治疗之前提前评估临床预后复发风险,并有利于指导对三阴乳腺癌患者制定术后治疗方案。
Description
技术领域
本发明涉及精准医疗技术领域,具体涉及一种预测三阴乳腺癌临床预后复发风险的标志物及模型。
背景技术
三阴性乳腺癌(TNBC)是指癌组织免疫组织化学检查结果为雌激素受体(ER)、孕激素受体(PR)和原癌基因Her-2均为阴性的乳腺癌,约占所有乳腺癌的20%。多发于绝经前年轻女性,临床表现为侵袭性病程,远处转移风险较高,内脏转移机会高于骨转移,脑转移几率也较高。三阴性乳腺癌的远处转移风险在3年时达到高峰。目前尚无特定针对TNBC的治疗指南,尽管化疗及辅助化疗有一定疗效,但预后仍较差,死亡风险较高。理论上,如果能够基于转录组信息算法模型对三阴性乳腺癌进行分子检测,可以有助于为三阴性乳腺癌病人提供个性化的精准医疗。
在现有技术中,已经有利用转录组进行乳腺癌的精准医疗,其源头为美国基因健康公司2005年推出的乳腺癌21基因检测,根据21个基因的mRNA表达水平得到复发分数,用于ER阳性或PR阳性、HER2阴性,无淋巴结扩散的早期乳腺癌病人的检测,指导术后进行化疗或者辅助激素治疗的依据:复发分数不大于17分的建议不用化疗。通过15年的临床应用,21基因检测写入NCCN乳腺癌治疗指南的推荐检测,取得了巨大的成功。对于21基因检测的高风险人群(复发分数>31),临床结果验证了化疗的有效性。然而,研究表明TNBC与BLBC只有56%的吻合,所以对TNBC需要建立独立的分子分型模型。
现有技术中,已有与TNBC分子模型相关的报道。例如,Lehman等人在2011年利用公开数据库数据,采用k-平均多层聚类算法对三阴性乳腺癌进行分子分型,根据基因表达模式把三阴性乳腺癌分成6个亚型:基底样1(BL1)、基底样2(BL2)、免疫调节(IM)、间充质(M)、间充质干细胞样(MSL)、和管腔雄激素受体(LAR)。利用约30个分别对应6个亚型的乳腺癌细胞系模型,试图建立对每个亚型的精准治疗方案。
第三军医大学西南医院病理研究所和西南癌症中心卞修武教授团队在2020年对于TNBC的转录组分子分型的学术研究发展进行了较全面的综述,他们把分子分型分为三个发展阶段。上述6个亚型为第一阶段。2015年Burstein等人把改进的亚型分为四个亚型:LAR,表达AR和细胞表面粘蛋白MUC1;M、表达生长因子受体(血小板衍生长因子受体α[PDGFRα]和c-Kit受体);BLIS(基底样免疫抑制性),表达免疫抑制分子VTCN1;BLIA(基底样免疫激活性),表达STAT信号转导分子并释放细胞因子。预后分析显示,无病生存率(DFS)的顺序为:BLIA>M>LAR>BLIS(p=0.019),疾病特异性生存率(DSS)为:BLIA>M>LAR>BLIS(p=0.07),此为第二阶段。第三阶段为复旦分型(FUSCC),刘等人结合mRNA及非编码长RNA(lncRNA)共表达网络进行模型优化,得到优化后的4个亚型:IM、免疫调节;LAR、管腔雄激素受体;MES、间充质样;BLIS、基底样和免疫抑制。通过全转录组数据构建TNBC预后预测模型,区分术后高、低危复发风险组。
然而,基于转录组基因表达的分子模型在TNBC方面的应用目前仍处于学术研究阶段,尚无一种模型在临床上得到广泛验证及应用。本领域技术人员希望开发基于TNBC转录组基因表达的预后模型,从而有助于实现三阴性乳腺癌的精准治疗,改善治疗手段及预后。
发明内容
本发明的目的在于提供一种预测三阴乳腺癌临床预后复发风险的标志物及模型,利用该标志物及模型,可以在治疗之前提前评估患者的临床预后复发风险,从而有利于指导对三阴乳腺癌患者制定术后治疗方案。
为此,第一方面,本发明提供一种预测三阴乳腺癌临床预后复发风险的标志物,所述标志物包括以下基因中的一种或两种以上的组合:ALAS2、AREG、ATM、BMPR1A、CLDN15、KRT33B、MSMB、MTDH、MYBPC1、NF1、NF2、NTRK3、PAX8、PLEK2、SLC5A5、TRADD。
在一些实施方式中,所述标志物包括以下基因中的至少十五种、至少十四种、至少十三种、至少十二种、至少十一种、至少十种、至少九种、至少八种、至少七种、至少六种、至少五种、至少四种、至少三种或至少两种的组合:ALAS2、AREG、ATM、BMPR1A、CLDN15、KRT33B、MSMB、MTDH、MYBPC1、NF1、NF2、NTRK3、PAX8、PLEK2、SLC5A5、TRADD。
在一些实施方式中,所述标志物由以下基因组成:ALAS2、AREG、ATM、BMPR1A、CLDN15、KRT33B、MSMB、MTDH、MYBPC1、NF1、NF2、NTRK3、PAX8、PLEK2、SLC5A5、TRADD。
在一些实施方式中,所述标志物由以下基因组成:AREG、KRT33B。
在一些实施方式中,所述标志物由以下基因组成:ATM、MSMB。
在一些实施方式中,所述标志物由以下基因组成:ALAS2、AREG、ATM、BMPR1A、CLDN15、KRT33B、MSMB、MTDH、NF1、NF2、NTRK3、PAX8、PLEK2、SLC5A5、TRADD。
在一些实施方式中,所述标志物由以下基因组成:ALAS2、AREG、ATM、BMPR1A、CLDN15、KRT33B、MSMB、MTDH、MYBPC1、NF1、NF2、NTRK3、PAX8、SLC5A5、TRADD。
本发明的第二方面,提供一种预测三阴乳腺癌临床预后复发风险的模型,所述模型为:所述模型以以下基因中的一种或两种以上的组合作为标志物:ALAS2、AREG、ATM、BMPR1A、CLDN15、KRT33B、MSMB、MTDH、MYBPC1、NF1、NF2、NTRK3、PAX8、PLEK2、SLC5A5、TRADD;所述Expt为标志物中每个基因的mRNA表达量,βt为对应每个基因的加权系数。
进一步,所述加权系数根据迭代线性回归计算得到。
在一些实施方式中,所述模型为:复发分数(Recurrence Score)=(βALAS2×表达量ALAS2)+(βAREG×表达量AREG)+(βATM×表达量ATM)+(βBMPR1A×表达量BMPR1A)+(βCLDN15×表达量CLDN15)+(βKRT33B×表达量KRT33B)+(βMSMB×表达量MSMB)+(βMTDH×表达量MTDH)+(βMYBPC1×表达量MYBPC1)+(βNF1×表达量NF1)+(βNF2×表达量NF2)+(βNTRK3×表达量NTRK3)+(βPAX8×表达量PAX8)+(βPLEK2×表达量PLEK2)+(βSLC5A5×表达量SLC5A5)+(βTRADD×表达量TRADD);其中,表达量为对应基因的mRNA表达量,β为根据迭代线性回归计算得到的对应基因的加权系数。
进一步,所述模型中,βBMPR1A、βMYBPC1、βNF1、βNF2、βTRADD均小于0,βAREG、βATM、βMSMB、βMTDH、βNTRK3、βPAX8、βCLDN15、βKRT33B、βSLC5A5、βALAS2、βPLEK2均大于0。
在一些实施方式中,所述模型为:复发分数(Recurrence Score)=(0.0573×表达量ALAS2)+(0.0281×表达量AREG)+(0.0739×表达量ATM)+(-0.1206×表达量BMPR1A)+(0.1333×表达量CLDN15)+(0.0575×表达量KRT33B)+(0.02×表达量MSMB)+(0.0842×表达量MTDH)+(-0.0134×表达量MYBPC1)+(-0.0807×表达量NF1)+(-0.0653×表达量NF2)+(0.0198×表达量NTRK3)+(0.037×表达量PAX8)+(0.0975×表达量PLEK2)+(0.0221×表达量SLC5A5)+(-0.1181×表达量TRADD)。
本发明的第三方面,提供所述标志物或模型在制备预测三阴乳腺癌临床预后复发风险的产品中的应用。
本发明的第四方面,提供一种预测三阴乳腺癌临床预后复发风险的模型的构建方法,包括以下步骤:
S1、获取三阴乳腺癌患者的乳腺癌切片的全转录组数据;进行数据初筛及标准化,组成数据集;
S2、在所述数据集中,利用t-检验寻找能够区分临床预后复发与临床预后不复发的人群的有统计意义(p<0.05)的基因,得到差异表达的基因;
S3、将所述差异表达的基因分为表达上调组和表达下调组,对所述表达上调组和表达下调组分别进行分层关联系数聚类,每个聚类中选取与该聚类其它基因平均关联度最大的作为模型候选基因;
S4、对所述模型候选基因,循环不同的模型变量个数(s),进行迭代线性回归分析,建立三阴乳腺癌临床预后复发的模型;
所述模型为:所述模型以以下基因中的一种或两种以上的组合作为标志物:ALAS2、AREG、ATM、BMPR1A、CLDN15、KRT33B、MSMB、MTDH、MYBPC1、NF1、NF2、NTRK3、PAX8、PLEK2、SLC5A5、TRADD;所述Expt为标志物中每个基因的mRNA表达量,βt为对应每个基因的加权系数。
本发明的第五方面,提供一种预测三阴乳腺癌临床预后复发风险的试剂盒,所述试剂盒包括所述标志物的检测试剂。
进一步,所述试剂盒包括本发明所述的模型。
进一步,使用所述试剂盒预测三阴乳腺癌临床预后复发风险的步骤包括:
(1)检测来自三阴乳腺癌患者的待测样本中所述标志物的mRNA表达量;
(2)将步骤(1)检测得到的所述标志物的mRNA表达量带入本发明所述的模型中,计算得到复发分数(Recurrence Score);
(3)当所述复发分数(Recurrence Score)大于门槛分数时,该三阴乳腺癌患者属于临床预后复发高风险;当所述复发分数(Recurrence Score)小于门槛分数时,该三阴乳腺癌患者属于临床预后复发低风险。
根据本发明的技术方案,可参考临床预后复发风险的预测结果,指导对患者的治疗方案。
进一步,所述待测样本来自组织、体液等。
本发明的第六方面,提供一种预测三阴乳腺癌临床预后复发风险的设备,所述设备包括检测装置和处理器;
所述检测装置用于检测待测样本中本发明所述的标志物中的基因的mRNA表达量;
所述处理器用于读取所述检测装置测得的基因的mRNA表达量并根据本发明提供的模型计算复发分数(Recurrence Score),再根据门槛分数预测受试者为临床预后复发高风险或低风险。
进一步,所述设备还包括输出装置,所述输出装置用于输出所述处理器的预测结果。
在一些实施方式中,所述输出装置为显示器。
与现有技术相比,本发明的技术方案具有以下优点:
本发明以重要的临床终点——复发率(Recurrence)作为目标变量与机器学习方法建立模型的目标函数,通过独创的建模方法,即基于关联系数分层的迭代线性回归算法,利用TNBC乳腺癌切片的全转录组数据,建立准确的临床预后复发风险预测模型。本发明提供的模型可以在TNBC患者进行治疗之前评估临床预后复发风险,指导对TNBC患者术后制定治疗方案,对于低风险人群制定较保守的治疗方案,比如避免辅助化疗;对于中风险人群制定较一般的治疗方案,比如常规性辅助化疗;对于高风险人群制定较激进的治疗方案,比如高剂量辅助化疗等。
附图说明
通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。在附图中:
图1:以ALAS2、AREG、ATM、BMPR1A、CLDN15、KRT33B、MSMB、MTDH、MYBPC1、NF1、NF2、NTRK3、PAX8、PLEK2、SLC5A5、TRADD作为标志物的复发模型,进行随机二分交叉验证重复过程中代表性AUC值(重复次数=20次);
图2:本发明提供的复发标志物中各基因的表达量框图;
图3:将单个基因作为标志物进行复发预测结果评价时的ROC曲线;
图4:以AREG、KRT33B作为标志物的复发模型,进行数据随机二分交叉验证重复过程中的代表性AUC值(重复次数=20);
图5:以ATM、MSMB作为标志物的复发模型,进行数据随机二分交叉验证重复过程中的代表性AUC值(重复次数=20);
图6:以ALAS2、AREG、ATM、BMPR1A、CLDN15、KRT33B、MSMB、MTDH、NF1、NF2、NTRK3、PAX8、PLEK2、SLC5A5、TRADD作为标志物的复发模型,进行数据随机二分交叉验证重复过程中的代表性AUC值(重复次数=20);
图7:以ALAS2、AREG、ATM、BMPR1A、CLDN15、KRT33B、MSMB、MTDH、MYBPC1、NF1、NF2、NTRK3、PAX8、SLC5A5、TRADD作为标志物的复发模型,进行数据随机二分交叉验证重复过程中的代表性AUC值(重复次数=20);
图8:采用实施例1中TCGA乳腺癌数据集BRCA,根据本发明提供的复发模型(以16个基因作为标志物)描绘得到的ROC曲线,用于评估模型预测临床预后复发的能力;
图9:以0.4884为门槛分数,大于门槛分数为复发风险高,小于门槛分数则为复发风险低或不复发;利用cox模型进行生存分析,对应的整体生存时间K-M曲线。
具体实施方式
下面将参照附图更详细地描述本公开的示例性实施方式。虽然附图中显示了本公开的示例性实施方式,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施方式所限制。相反,提供这些实施方式是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
本发明以重要的临床终点——复发率(Recurrence)作为目标变量与机器学习方法建立模型的目标函数,通过基于关联系数分层的迭代线性回归算法,利用TNBC乳腺癌切片的全转录组数据,建立准确的临床预后复发风险预测模型。
所述模型为:所述模型以以下基因中的一种或两种以上的组合作为标志物:ALAS2、AREG、ATM、BMPR1A、CLDN15、KRT33B、MSMB、MTDH、MYBPC1、NF1、NF2、NTRK3、PAX8、PLEK2、SLC5A5、TRADD;所述Expt为标志物中每个基因的mRNA表达量,βt为对应每个基因的加权系数。
本发明对所述的标志物的任意子集进行了评价,根据评价结果,在一些实施方式中,可以将上述十六种基因中的的至少十五种、至少十四种、至少十三种、至少十二种、至少十一种、至少十种、至少九种、至少八种、至少七种、至少六种、至少五种、至少四种、至少三种或至少两种的组合作为标志物。在另一些实施方式中,可以将上述十六种基因的组合作为标志物。在再一些实施方式中,可以将上述十六种基因的任意一种作为标志物。
对于本发明提供的标志物中的基因,其在学术领域已经有广泛的研究成果。文献表明,这些基因大部分与乳腺癌的发生,发展,复发,耐药等相关。将其按照主要功能及信号通路可以进行如下分类:
·染色体稳定及DNA损伤的细胞周期检查点:ATM;
·细胞骨架:CLDN15、KRT33B、PLEK2;
·细胞凋亡与增殖:NF2参与多个信号通路,包括Hippo/SWH信号通路的调节,TRADD介导程序性细胞死亡信号和激活NF-κB通路,MTDH为激活NF-κB的转录因子;BMPR1A、PAX8;
·细胞分化:TGF-b通路成员BMPR1A、NAS/MAPK通路激酶NTRK3、RAS GTPase活性刺激因子NF1;
·黄体酮信号通路:MYBPC1
·EGF/EGFR配体AREG;
·Lin28b/Let-7通路:MSMB/PSP94;
·代谢相关:SLC5A5
细胞周期检查点ATM/ATR激酶是DNA损伤反应传感器和效应器之间的必要联系,成为炙手可热的新型抗癌药物靶点。Fan et al.【FAN2021】详细描述了ATM/ATR通过靶向KIFC1磷酸化调控染色体中心体聚集与肿瘤复发的机制。染色体不稳定性(CIN)是许多肿瘤的主要特征之一。染色体具有多余中心体的癌细胞,要么由于多极有丝分裂产生的高水平非整倍体而死亡,要么通过将中心体聚集成两个功能极来实现伪双极结构,从而分裂并产生可存活的后代,这一过程称为中心体聚集。中心体聚集为CIN的主要表现形式。DNA损伤通常导致中心体增殖,而通过中心体聚集传代生存的癌细胞具备侵袭性能。最新的研究表明,驱动蛋白(kinesin)家族成员KIFC1,在具有多余中心体的癌细胞有丝分裂时,在中心体聚集形成伪双极结构而围绕双-焦点聚集的过程中,起着举足轻重的作用。KIFC1的缺失导致多极间期(Anaphase)的急剧增加,并因灾难性的多极分裂而引发癌细胞死亡,而KIFC1的敲除对具有两个中心体的细胞分裂几乎没有影响。目标DNA损伤的药物使癌细胞启动DNA损伤应激反应,激活ATM/ATR,使KIFC1的Ser26磷酸化稳定后,启动中心体聚集,癌细胞获得侵袭性,导致复发。复发分数模型的权重为正数表明,ATM表达越多,复发分数越高,与这些研究结果十分吻合。
Naume B,et al.【NAU2007】研究了原发性乳腺肿瘤的表达谱与骨髓中的播散性肿瘤细胞的关系,确定骨髓播散性肿瘤细胞和管腔A亚型患者全身复发相关的20基因表达谱,PLEK2为其中成员,其表达与临床预后负相关。此外,越来越多证据表明PLEK2为多种癌症的致癌基因,比如在胆囊癌,PLEK2通过调节EMT过程促进细胞迁移、侵袭和肝转移【SHE2019】;在骨肉瘤,PLEK2通过激活PI3K/AKT/mTOR通路促进癌细胞生长及转移【LIU2021】。在复发分数模型中,PLEK2权重为正数,且在所有正权重中排第二,PLEK2表达越多,复发分数越高,与这些关于其促进癌细胞转移的研究结果吻合。
TGF-b信号通路为许多其它信号通路的基础。Sulaiman et al.【SUL2021】先介绍TGF-b信号通路,然后综述以清除肿瘤干细胞为目标来抑制TGF-b通路的治疗TNBC可能性临床方案。TGF-b信号通路可以促进MAPK/ERK,PI3K/Akt/mTOR/S6K,RhoA/Rac信号通路,许多在TNBC中异常。作为TGF-b家族成员的BMPR1A与TNBC复发及不良预后负相关。
Fares B,et al.【FAR2021】发现PAX8在子宫浆液性乳头状癌(USPC)表达100%,其抗凋亡功能通过转录激活两个突变的信号通路:(一)、PAX8正向调控沉默突变的P53,使之具备致癌性功能获得;(二)、PAX8以非P53依赖的方式直接转录调节P21,让P21通过定位于细胞质来调控其获得性细胞生长促进作用。此外PAX8可能是通过代谢与HIF1A相关通路实现这些功能。TRADD与TNFRSF1A/TNFR1相互作用,并介导程序性细胞死亡信号和NF-κB激活。
Zhang DY,et al.【ZHA2020】发现对于TNBC,六-硫鸟嘌呤(6-TG)抑制PI3K/ATK通路,从而下调PTEN甲基化水平,通路下游TRADD等基因甲基化水平下调,诱导细胞凋亡。复发分数模型中TRADD权重为负,且绝对值按大小顺序排第二,表明TRADD对TNBC复发的抑制功能,与文献结果十分吻合。
MDTH在多种癌症的进展与转移有重要作用。Dhiman et al.【DHI2019】综述了MDTH作为多种癌症治疗的靶向基因。MDTH参与调控多个信号通路,PI3K/Akt,NF-κB,Wnt/β-连环蛋白(catenin),MAPK,其异常导致细胞癌变,转移与化疗耐药。研究表明,TNF-α通过NF-κB通路上调MDTH,TNF-α促使NF-κB进入细胞核与MDTH作用。在细胞核内,MDTH使NF-κB的抑制因子IκBα降解。在失活状态下,IκBα与NF-κB的p65、p50两个亚单位存在于细胞质中,IκBα降解后,p65、p50被激活,从细胞质转移至细胞核,从而启动下游基因的表达,特别是增强迁移及侵袭的基因。反过来,MDTH还可能通过直接激活MMP1而促进NF-κB表达,导致细胞的锚定非依赖性生长(Anchorage independent growth),而无需整合素-细胞外基质(ECM)相互作用信号参与。MDTH与VEGF、IGFBP7及EMT标记蛋白的功能链接促进血管生成。在肝癌细胞中,MDTH与E-钙粘蛋白、β-连环蛋白、SNAIL和N-钙粘蛋白上皮-间质转化表达相关。在慢性淋巴细胞白血病(CLL),MDTH通过淋巴增强子结合因子LEF-1与Wnt/β-连环蛋白通路的GSK3β来促进细胞生存,通过激活ERK42/44及p38 MAPK信号通路,加强GSK3β磷酸化,使β-连环蛋白进入细胞核,从而启动Wnt信号通路。此外,MTDH还上调CLDN4及四跨膜蛋白,促进细胞侵袭性。在复发分数模型中,MDTH的权重为正数,MDTH表达越多,复发分数越高,与这些研究结果吻合。
CLDN4及模型基因CLDN15属于Claudins膜蛋白家族。Claudins膜蛋白是细胞致密连接(Tight junction)屏障区的重要蛋白,调控细胞间通透性及维护上皮细胞的细胞极性。Claudin异常扰乱致密连接结构,为致癌风险因素。Kwon MJ,et al.【KWO2013】关于Claudins与癌症的综述强调了Claudin参与肿瘤干细胞(TSC)、肿瘤起始细胞(TIC)、化疗抵抗及复发。不同的Claudin在不同癌症表达或上调,或下调。而对乳腺癌不同亚型的表达有时恰恰相反,比如CLDN4在I级乳腺导管癌表达比乳房上皮细胞偏低。而在基底样乳腺癌却偏高。有研究表明,ER+管腔肿瘤中CLDN7/8表达偏高,而基底样肿瘤中CLDN1/4偏高。TNBC复发模型显示,CLDN15在TNBC中表达偏高,且在复发分数中的权重最大,表明CLDN15对TNBC化疗抵抗及复发起重要作用,与文献中报告的研究结果相吻合。
MSMB亚型(isoform)之一PSP94为前列腺素(prostasin,PRSS8)的上游信号调控因子,Chen LM,et al.【CHE2002】发现PRSS8能够抑制乳腺癌侵袭性。Ma JX,et al.【MAJ2014】表明PSP94在卵巢癌中高表达并调控Lin28b/Let-7通路,Yan BX,et al.【YAN2014】发现PSP94促进卵巢癌的化疗耐药性,其肽片段PCK3145却能够抑制癌细胞的生长。另外,MSMB/PSP94作为前列腺癌的致癌基因【REE2006,POM2010】一直是热门研究领域。
关于NTRK在乳腺癌的研究,现有的结果为NTRK与ETV6极其罕见的基因融合【BAN2021】。Tao ZH,et al.【TAO2021】利用1440例中国乳腺癌病人寻找RTK基因族的基因融合,发现NTRK1参与的有两例,NTRK2参与的只有一例。Wu SF,et al.【WUS2021】利用305例TNBC样本及五个技术平台对NTRK基因融合进行评估,发现尽管NTRK的IHC方法发现许多阳性,但NGS验证只有一例为NTRK3-ETV6基因融合。模型中NTRK3基因表达促进复发分数也许不能够单纯用基因融合来解释,其机制需要在转录组层面进行研究与验证。
神经纤维瘤亚型1,NF1,为许多癌症常见的前期,是由于NF1基因致病SNP导致。先天性遗传及后天性NF1突变各占一半。Evans DGR,et al.【EVA2019】对五个国家的142例带NF1的乳腺癌及335例非NF1乳腺癌的对比研究表明,NF1乳腺癌病人得对侧乳腺癌(Contralateral Breast Cancer,指典型第二癌在胸另一个乳房,而不是原发乳腺癌转移)的风险更高,其预后更差。NF1为抑癌基因,编码神经纤维蛋白,刺激Ras-GTP向Ras-GDP的内在水解,从而减少通过Ras-MAPK途径传递的信号。体细胞NF1突变的双等位基因失活导致缺乏神经纤维蛋白,使与GTP结合的活性形式的Ras增加,从而驱动细胞增殖。Madanikia SA,et al.【MAD2012】发现NF1乳腺癌年龄大多小于50岁。模型中NF1基因权重为负数,显示其表达降低复发分数,与其抑癌基因的特征相符合。
神经纤维瘤亚型2,NF2,又名Merlin(Moesin-Ezrin-Radixin-Like Protien),也是抑癌基因。NF2基因突变或表达异常为许多种癌症的特征。Petrilli AM,et al.【PET2016】详细综述了NF2抑癌的生物学机制。其参与的通路有:(一)、膜受体及RhoGTPase家族。NF2的抑癌体现于接触抑制的细胞生长,细胞高浓度显示NF2高表达,这是通过NF2抑制CD44而实现。CD44结合TIAM-1(RAC1GEF)把RAC1-GDP转化成RAC-GTP,从而激活RAC1,实现肌动蛋白的细胞骨架重构,促进癌细胞转移。此外,持续活化的RAC1及CDC42诱导NF2在Ser518的磷酸化,从而进一步削弱NF2的抑制功能。此外,NF2通过在细胞内的局部化阻断RAC1在细胞质膜的结合,而NF2缺失促进RAC1在细胞外基质(EM)粘附的结合,从而促进细胞生长。最后,NF2通过其FERM区与PAK-CDC42/RAC1结合区的直接结合实现对RAC1的抑制。(二)、PI3K/mTOR/Akt及HDAC信号通路。NF2通过结合PIKE-L抑制PI3K活性,PIKE-L为PI3K的GTPase。HDAC1-6与PP1的结合,间接调控AKT磷酸化。(三)、Hippo/SWH通路。一些关于乳腺癌样本的NF2基因突变研究表明,NF2突变频率较低(低于4.5%),但PAK1扩增的比例较高(33%)。尽管NF2突变不多,但由于PAK1表达增加NF2-Ser518的磷酸化,导致NF2失活,从而促进癌细胞锚定非依赖性生长。Morrow KA,et al.【MOR2011】第一个证明在乳腺癌中NF2抑癌功能的丧失是由于OPN启动的AKT对NF2的磷酸化所致。模型中NF2基因权重为负数,显示NF2表达降低复发分数,与其抑癌基因的特征相符合。
EGFR配体AREG与EGFR的结合,激活EGFR表达。Aupperlee MD,et al.【AUP2013】研究了AREG青春期或前后乳房发育过程中的作用,AREG在乳腺端芽及导管高表达,特别地通过黄体酮及其受体PR影响发育中乳腺端芽的形成和乳腺增殖,所以AREG也影响发育相关的乳腺癌风险。Hu H,et al.【HUH2014】的研究发现,黄体酮(Progesterone)促进乳腺癌NF-κB受体启动器RANKL、MYBPC1、DIO2的表达,并且在黄体期(排卵后月经周期的后半段)变得更高,表明模型中MYBPC1参与黄体酮信号通路。
最后,ALAS参与TNBC复发可能涉及线粒体人ClpP蛋白水解复合物(ClpP)。ClpP为酪蛋白溶解蛋白酶P,激活后分解线粒体内的蛋白质,这一过程称为线粒体蛋白水解。在Wong KS,et al.【WON2019】关于ClpP的生化调控综述中,Clp由核基因CLPP及CLPX编码,其主要功能是促进错误折叠的特定底物蛋白质快速转换,从而防止其作为蛋白质聚集体累积,导致正常细胞功能受损。Clp可能通过降解线粒体ALAS1和红系特异性ALAS2参与调节血红素生物合成的负反馈机制,两者均介导原卟啉(Protoporphyrin)IX生物合成的第一步。Protoporphyrin IX为血红素的分子骨架。目前还没有找到ALAS2促进乳腺癌复发或耐药的研究。
综上,本发明提供的复发分数模型中的每个基因在学术文献中均有与TNBC、或与一般乳腺癌、或其它癌症的大量研究,其正向/反向的结果与模型参数的+/-值全部吻合,表明本发明提供的算法模型的合理性。
本公开所使用的缩略语及术语
AUC:Area Under the Curve,曲线下面积
CIN:Chromosomal Instability,染色体不稳定性
ClpP:酪蛋白溶解蛋白酶P
CLL:Chronic Lymphocytic Leukemia,慢性淋巴细胞白血病
DFS:Disease Free Survival,无病生存期
ECM:Extracellular Matrix,细胞外基质
EMT:Epithelial Mesenchymal Transformation,上皮细胞间充质转化
IM:Immunomodulatory Subtype,免疫调节亚型
LAR:Luminal Androgen Receptor Subtype,管腔雄激素受体亚型
M:Mesenchymal Subtype,间充质亚型
MSL:Mesenchymal Stem Like Subtype,间充质干细胞样亚型
ROC:Receiver Operation Curve,受试者操作曲线
RSQ:R-Square,相关系数平方
SNP:Single Nucleotide Polymorphism,单核苷酸多态性
TNBC:Triple Negative Breast Cancer,三阴性乳腺癌
TIC:Tumor Initiating Cell,肿瘤起始细胞
TSC:Tumor Stem Cell,肿瘤干细胞
参考文献
【CHE2002】Chen LM,et.al.Prostasin serine protease inhibits breastcancer invasiveness and is transcriptionally regulated by promoter dnamethylation.Int.J.Cancer:97,323–329(2002).
【REE2006】Reeves J,et.al.Prognostic Value of Prostate SecretoryProtein of 94Amino Acids and its Binding Protein after RadicalProstatectomy.Clin Cancer Res 2006;12(20),2006.
【NAU2007】Naume B,et.al.Presence of bone marrow micrometastasis isassociated with different recurrence risk within molecular subtypes of breastcancer.Mol Oncol 1:160-171,2007.
【POM2010】Pomerantz MM,et.al.Analysis of the 10q11 Cancer Risk LocusImplicates MSMB and NCOA4 in Human Prostate Tumorigenesis.PLoS Genet 6(11):e1001204.doi:10.1371/journal.pgen.1001204.
【MOR2011】Morrow KA,et al.Loss of Tumor Suppressor Merlin in AdvancedBreast Cancer Is due to Post-translational Regulation.The journal ofbiological chemistry vol.286,no.46,pp.40376–40385,2011.
【MAD2012】Madanikia SA,et al.Increased Risk of Breast Cancer in Womenwith NF1.Am J Med Genet A.158A(12):3056–3060.2012.doi:10.1002/ajmg.a.35550.
【AUP2013】Aupperlee MD et al.Amphiregulin mediates progesterone-induced mammary ductal development during puberty.Breast Cancer Research2013,15:R44.
【HUH2014】Hu H,et al.,“RANKL expression in normal and malignant breasttissue responds to progesterone and is up-regulated during the luteal phase,”Breast Cancer Research and Treatment,vol.146,no.3,pp.515–523,2014.
【MAJ2014】Ma JX,et.al.PSP94,an upstream signaling mediator ofprostasin found highly elevated in ovarian cancer.Cell Death and Disease(2014)5,e1407;doi:10.1038/cddis.2014.374.
【YAN2014】Yan BX et.al.PSP94 contributes to chemoresistance and itspeptide derivative PCK3145 represses tumor growth in ovarian cancer.Oncogene(2014)33,5288–5294.
【PET2016】Petrilli AM,et.al.Role of Merlin/NF2 inactivation in tumorbiology.Oncogene(2016)35,537–548.
【SHE2019】Shen H,et.al.PLEK2 promotes gallbladder cancer invasion andmetastasis through EGFR/CCL2 pathway.J Exp Clin Cancer Res 38:247,2019.
【FAN2021】Fan GJ et.al.The ATM and ATR kinases regulate centrosomeclustering and tumor recurrence by targeting KIFC1 phosphorylation.NatureCommunications(2021)12:20https://doi.org/10.1038/s41467-020-20208.
【FAR2021】Fares,B.,Berger,L.,Bangiev-Girsh,E.et al.PAX8 plays anessential antiapoptotic role in uterine serous papillary cancer.Oncogene 40,5275–5285(2021).https://doi.org/10.1038/s41388-021-01925-z.
【LIU2021】Liu Y,et.al.PLEK2 promotes osteosarcoma tumorigenesis andmetastasis by activating the PI3K/AKT signaling pathway.
实施例1利用基因的mRNA表达数据筛选TNBC基因诊断标志物
一、数据集准备
1、从基因表达综合数据库(GEO)下载数据集GSE69031(GPL571),再从TCGA下载数据集TCGA-BRCA(GPL96,etc.)。数据集均为乳腺癌切片的基因芯片数据(Affymetrix平台GPL96,GPL571,etc.)。只选用TNBC病人得到共171例,其中TCGA-BRCA贡献150例,GSE69031贡献21例。
2、剔除表达极低的基因转录(其表达非零的样本个数不超过10个)后,再剔除miRNA及lncRNA,选取两个数据集的共有基因,得到基因数为9524。
3、分步对样本及基因进行数据标准化:
对每个样本,分别计算所有基因表达量的中位数,每个样本的标准化表达为:原表达量减去该样本所有基因表达量中位数,标准化去除了样本mRNA输入量的差异。
以样本标准化数据为基础,进一步对每个基因,计算其样本表达中值,每个基因的标准化表达为:表达量减去该基因在所有样本表达量的中位数,这去除了不同平台的差异。
标准化后的数据组装成TNBC数据集。
二、复发标志物筛选及模型
以复发指标(Recurrence)作为目标变量,对目标变量建立模型时统一进行如下操作:
1、确定和目标变量相关的基因:
利用t-检验(t-test),寻找能够区分目标变量不同人群(0代表不复发,1代表复发)的有统计意义(p<0.05)的基因,初步得到差异表达的基因。
2、对基因进行上调或下调分组:
将差异表达的基因分为两组,t-检验结果中t为正数的代表在病人组织中表达下调的基因;t为负数的代表在病人组织中表达上调的基因。分别对两组基因进行分层关联系数分析。
3、分层关联系数分析:
对表达上调或下调的基因组,分别进行分层关联系数聚类,其目的是在给定的关联系数水平,每一聚类中的基因需要大致两两相互关联,每个聚类中选取与该聚类其它基因平均关联度最大的为代表。所有聚簇的代表基因构成标志物的模型候选基因。
4、迭代线性回归分析确定标志物及模型:
(i)对于模型候选基因,给定模型参变量个数(s),进行迭代线性回归分析。再循环不同的s,寻找最优的模型参变量个数,由对应的rsq的最大值确定。从而得到最优模型。
(ii)预先选取与癌症相关的基因突变图谱上的基因,共741个,重复步骤(i),得到最优模型。
(iii)综合步骤(i),步骤(ii)得到的候选标志物,再次重复步骤(i),得到复发分数模型。该模型包括由以下16个基因组成的标志物:ALAS2、AREG、ATM、BMPR1A、CLDN15、KRT33B、MSMB、MTDH、MYBPC1、NF1、NF2、NTRK3、PAX8、PLEK2、SLC5A5、TRADD。
表1迭代线性回归后的最终复发模型参数表
基因 | p-值 | 加权系数 | 标准差 | t-值 | rsq |
AREG | 0.0082 | 0.0281 | 0.0105 | 2.685 | 0.4608 |
ATM | 0.059 | 0.0739 | 0.0388 | 1.9048 | 0.5187 |
BMPR1A | 0.0015 | -0.1206 | 0.0371 | -3.2522 | 0.5187 |
MSMB | 0.0234 | 0.02 | 0.0087 | 2.2935 | 0.5187 |
MTDH | 0.022 | 0.0842 | 0.0363 | 2.3184 | 0.5187 |
MYBPC1 | 0.0423 | -0.0134 | 0.0065 | -2.0501 | 0.5187 |
NF1 | 0.0255 | -0.0807 | 0.0357 | -2.2586 | 0.5187 |
NF2 | 0.0874 | -0.0653 | 0.0379 | -1.7218 | 0.5187 |
NTRK3 | 0.0554 | 0.0198 | 0.0102 | 1.9325 | 0.5187 |
PAX8 | 0.0091 | 0.037 | 0.014 | 2.6488 | 0.5187 |
CLDN15 | 0.0001 | 0.1333 | 0.0333 | 4.0007 | 0.5187 |
KRT33B | 0.0004 | 0.0575 | 0.0159 | 3.6296 | 0.5187 |
SLC5A5 | 0.071 | 0.0221 | 0.0121 | 1.8204 | 0.5187 |
TRADD | 0.0002 | -0.1181 | 0.0308 | -3.8407 | 0.5187 |
ALAS2 | 0.0013 | 0.0573 | 0.0174 | 3.2936 | 0.5187 |
PLEK2 | 0 | 0.0975 | 0.0194 | 5.0112 | 0.5187 |
实施例2交叉验证
把实施例1中的数据集按照目标变量的人群平分,一半为训练集,另一半为验证集,对实施例1得到的模型进行ROC曲线分析,并计算AUC。如此重复N(=20)次,并计算AUC的统计特征。参见图1所示,其中最小值AUC=0.86,最大值AUC=0.99,中间值AUC=0.92。将交叉验证的AUC中间值作为评价模型结果的指标,表明本发明提供的模型具有卓越性。
实施例3对标志物的任何子集进行评价
对于实施例1得到的标志物,取其任何子集(子集包括K个基因,K为大于等于1且小于16的正整数),将所述子集作为生物标志物进行评价。
对于K=1的情况,即将所述标志物中的任一单个基因作为生物标志物进行评价,绘制其ROC曲线并计算AUC,结果见图3所示。
对于K≥2的情况,在所述标志物中随机选择K个基因,重建模型并进行交叉验证,绘制其ROC曲线并计算AUC,部分结果见图4-7所示。
实施例4模型验证
数据集采用实施例1中的TCGA乳腺癌数据集BRCA。其中数据完整的TNBC样本数共150例,样本标记为复发(Recurrence=1)的共21例,标记为无复发(Recurrence=0)的共129例。利用实施例1建立的模型(以16个基因作为标志物)描绘得到ROC曲线,评估模型的预测复发风险的能力。ROC曲线如图8所示。
根据图8所示的ROC曲线,AUC为0.9623,ROC曲线上最优的决策点(如虚线所示)对应的特异性为91%,敏感性为95%。此外,在利用该模型计算预测分数时,计算对应的chi-sq,把最大值位置对应的分数设置为最优门槛分数。门槛分数为0.4884,大于门槛分数为复发风险高,小于则为复发风险低或不复发。相关指标如表2所示。
表2
预测能力指标 | 指标值 |
AUC | 0.9623 |
特异性 | 91% |
敏感性 | 95% |
门槛分数 | 0.4884 |
利用cox模型进行生存分析,对应的整体生存时间K-M曲线如图9所示。根据图9,低风险(分数小于0.4884)者对应的三年生存率为90%,高风险(分数大于等于0.4884)者对应的三年生存率为50%,且差别有统计意义,表明本发明提供的模型因模型具有优异的临床诊断作用。
实施例5
本实施例提供一种试剂盒,包括能够定量本发明提供的复发模型中的16个基因:ALAS2、AREG、ATM、BMPR1A、CLDN15、KRT33B、MSMB、MTDH、MYBPC1、NF1、NF2、NTRK3、PAX8、PLEK2、SLC5A5、TRADD的mRNA水平的试剂,所述试剂包括逆转录酶、引物、Taq酶、荧光染料等。
实施例6
本实施例提供一种对TNBC病人的临床预后复发风险进行预测的方法,包括以下步骤:
(1)从受试者的术后癌症切片样本或液体活检样本中提取mRNA作为待测样本;
(2)检测所述待测样本中以下16个基因:ALAS2、AREG、ATM、BMPR1A、CLDN15、KRT33B、MSMB、MTDH、MYBPC1、NF1、NF2、NTRK3、PAX8、PLEK2、SLC5A5、TRADD的mRNA表达量;
(3)根据本发明提供的复发模型计算复发分数(Recurrence Score),按照预先设置的门槛分数对受试者的临床预后复发风险进行评估,如高于门槛分数则为复发风险高,低于门槛分数则为复发风险低或不复发。
实施例7
本实施例提供一种对TNBC病人的临床预后复发风险进行预测的设备,该设备包括检测装置、处理器和输出装置;所述检测装置可以mRNA为待测样本,定量检测以下16个基因的mRNA表达量:ALAS2、AREG、ATM、BMPR1A、CLDN15、KRT33B、MSMB、MTDH、MYBPC1、NF1、NF2、NTRK3、PAX8、PLEK2、SLC5A5、TRADD;所述处理器用于读取所述检测装置测得的基因的mRNA表达量并根据本发明提供的模型计算复发分数(Recurrence Score),再按照预先设定的门槛分数预测受试者为复发风险高或复发风险低;所述输出装置用于输出所述处理器的预测结果。在一些实施方式中,所述输出装置为显示器。
运用该设备对TNBC受试者进行临床预后复发风险预测的方法如下:
(1)取受试者术后癌症切片样本或液体活检样本中提取得到的mRNA作为待测样本;
(2)将所述待测样本送入所述检测装置,定量检测以下16个基因的mRNA表达量:ALAS2、AREG、ATM、BMPR1A、CLDN15、KRT33B、MSMB、MTDH、MYBPC1、NF1、NF2、NTRK3、PAX8、PLEK2、SLC5A5、TRADD;
(3)所述处理器读取所述检测装置测得的基因的mRNA表达量,根据本发明提供的模型计算复发分数(Recurrence Score),再按照预先设定的门槛分数预测受试者为复发风险高或复发风险低;
(4)通过所述输出装置输出所述处理器的预测结果。
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以所述权利要求的保护范围为准。
Claims (10)
1.一种预测三阴乳腺癌临床预后复发风险的标志物,其特征在于,所述标志物包括以下基因中的一种或两种以上的组合:ALAS2、AREG、ATM、BMPR1A、CLDN15、KRT33B、MSMB、MTDH、MYBPC1、NF1、NF2、NTRK3、PAX8、PLEK2、SLC5A5、TRADD。
3.如权利要求2所述的模型,其特征在于,所述加权系数根据迭代线性回归计算得到。
4.如权利要求2或3所述的模型,其特征在于,所述模型为:
复发分数=(βALAS2×表达量ALAS2)+(βAREG×表达量AREG)+(βATM×表达量ATM)+(βBMPR1A×表达量BMPR1A)+(βCLDN15×表达量CLDN15)+(βKRT33B×表达量KRT33B)+(βMSMB×表达量MSMB)+(βMTDH×表达量MTDH)+(βMYBPC1×表达量MYBPC1)+(βNF1×表达量NF1)+(βNF2×表达量NF2)+(βNTRK3×表达量NTRK3)+(βPAX8×表达量PAX8)+(βPLEK2×表达量PLEK2)+(βSLC5A5×表达量SLC5A5)+(βTRADD×表达量TRADD)。
5.如权利要求4所述的模型,其特征在于,所述模型中,βBMPR1A、βMYBPC1、βNF1、βNF2、βTRADD均小于0,βAREG、βATM、βMSMB、βMTDH、βNTRK3、βPAX8、βCLDN15、βKRT33B、βSLC5A5、βALAS2、βPLEK2均大于0;
优选地,所述模型为:
复发分数=(0.0573×表达量ALAS2)+(0.0281×表达量AREG)+(0.0739×表达量ATM)+(-0.1206×表达量BMPR1A)+(0.1333×表达量CLDN15)+(0.0575×表达量KRT33B)+(0.02×表达量MSMB)+(0.0842×表达量MTDH)+(-0.0134×表达量MYBPC1)+(-0.0807×表达量NF1)+(-0.0653×表达量NF2)+(0.0198×表达量NTRK3)+(0.037×表达量PAX8)+(0.0975×表达量PLEK2)+(0.0221×表达量SLC5A5)+(-0.1181×表达量TRADD)。
6.权利要求1所述的标志物或权利要求2-5任一项所述的模型在制备预测三阴乳腺癌临床预后复发风险的产品中的应用。
7.一种预测三阴乳腺癌临床预后复发风险的模型的构建方法,其特征在于,包括以下步骤:
S1、获取三阴乳腺癌患者的乳腺癌切片的全转录组数据;进行数据初筛及标准化,组成数据集;
S2、在所述数据集中,利用t-检验寻找能够区分临床预后复发与临床预后不复发的人群的有统计意义(p<0.05)的基因,得到差异表达的基因;
S3、将所述差异表达的基因分为表达上调组和表达下调组,对所述表达上调组和表达下调组分别进行分层关联系数聚类,每个聚类中选取与该聚类其它基因平均关联度最大的作为模型候选基因;
S4、对所述模型候选基因,循环不同的模型变量个数(s),进行迭代线性回归分析,建立三阴乳腺癌临床预后复发的模型;所述模型为:
所述模型以以下基因中的一种或两种以上的组合作为标志物:ALAS2、AREG、ATM、BMPR1A、CLDN15、KRT33B、MSMB、MTDH、MYBPC1、NF1、NF2、NTRK3、PAX8、PLEK2、SLC5A5、TRADD;所述Expt为标志物中每个基因的mRNA表达量,βt为对应每个基因的加权系数。
8.一种预测三阴乳腺癌临床预后复发风险的试剂盒,其特征在于,所述试剂盒包括权利要求1所述标志物的检测试剂;
优选地,所述试剂盒包括权利要求2-5任一项所述的模型。
9.如权利要求8所述的试剂盒,其特征在于,使用所述试剂盒预测三阴乳腺癌临床预后复发风险的步骤包括:
(1)检测来自三阴乳腺癌患者的待测样本中所述标志物的mRNA表达量;
(2)将步骤(1)检测得到的所述标志物的mRNA表达量带入权利要求2-5任一项所述的模型中,计算得到复发分数;
(3)当所述复发分数大于门槛分数时,该三阴乳腺癌患者属于临床预后复发高风险;当所述复发分数小于门槛分数时,该三阴乳腺癌患者属于临床预后复发低风险;
优选地,所述待测样本来自组织或体液。
10.一种预测三阴乳腺癌临床预后复发风险的设备,其特征在于,所述设备包括检测装置和处理器;
所述检测装置用于检测待测样本中权利要求1所述的标志物中的基因的mRNA表达量;
所述处理器用于读取所述检测装置测得的基因的mRNA表达量并根据权利要求2-5任一项所述的模型计算复发分数,再根据门槛分数预测受试者为临床预后复发高风险或低风险;
优选地,所述设备还包括输出装置,所述输出装置用于输出所述处理器的预测结果。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210118351.7A CN114480650A (zh) | 2022-02-08 | 2022-02-08 | 一种预测三阴乳腺癌临床预后复发风险的标志物及模型 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210118351.7A CN114480650A (zh) | 2022-02-08 | 2022-02-08 | 一种预测三阴乳腺癌临床预后复发风险的标志物及模型 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114480650A true CN114480650A (zh) | 2022-05-13 |
Family
ID=81478577
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210118351.7A Pending CN114480650A (zh) | 2022-02-08 | 2022-02-08 | 一种预测三阴乳腺癌临床预后复发风险的标志物及模型 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114480650A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115424669A (zh) * | 2022-08-18 | 2022-12-02 | 南方医科大学南方医院 | 一种基于lr评分的三阴性乳腺癌疗效及预后评估模型 |
CN116042823A (zh) * | 2022-09-19 | 2023-05-02 | 厦门艾德生物医药科技股份有限公司 | 用于食管鳞癌预后及疗法疗效评估的分子标记物及其应用 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CA2829472A1 (en) * | 2003-01-15 | 2004-08-05 | Genomic Health, Inc. | Gene expression markers for breast cancer prognosis |
WO2012040784A1 (en) * | 2010-09-30 | 2012-04-05 | Chipdx Llc | Gene marker sets and methods for classification of cancer patients |
WO2013070521A1 (en) * | 2011-11-08 | 2013-05-16 | Genomic Health, Inc. | Method of predicting breast cancer prognosis |
US20170247766A1 (en) * | 2014-08-26 | 2017-08-31 | The University Of Notre Dame Du Lac | Late er+ breast cancer onset assessment and treatment selection |
-
2022
- 2022-02-08 CN CN202210118351.7A patent/CN114480650A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CA2829472A1 (en) * | 2003-01-15 | 2004-08-05 | Genomic Health, Inc. | Gene expression markers for breast cancer prognosis |
WO2012040784A1 (en) * | 2010-09-30 | 2012-04-05 | Chipdx Llc | Gene marker sets and methods for classification of cancer patients |
WO2013070521A1 (en) * | 2011-11-08 | 2013-05-16 | Genomic Health, Inc. | Method of predicting breast cancer prognosis |
US20170247766A1 (en) * | 2014-08-26 | 2017-08-31 | The University Of Notre Dame Du Lac | Late er+ breast cancer onset assessment and treatment selection |
Non-Patent Citations (2)
Title |
---|
宋雨欣: "乳腺分泌型癌的研究进展", 中国肿瘤外科杂志, vol. 14, no. 3, pages 252 - 256 * |
靳鹏: "MTDH和HIF-1α在复发转移性乳腺癌表达及其临床意义的研究", 泰山医学院学报, vol. 37, no. 10, pages 1081 - 1085 * |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115424669A (zh) * | 2022-08-18 | 2022-12-02 | 南方医科大学南方医院 | 一种基于lr评分的三阴性乳腺癌疗效及预后评估模型 |
CN115424669B (zh) * | 2022-08-18 | 2023-06-13 | 南方医科大学南方医院 | 一种基于lr评分的三阴性乳腺癌疗效及预后评估模型 |
CN116042823A (zh) * | 2022-09-19 | 2023-05-02 | 厦门艾德生物医药科技股份有限公司 | 用于食管鳞癌预后及疗法疗效评估的分子标记物及其应用 |
CN116042823B (zh) * | 2022-09-19 | 2024-03-29 | 广东省人民医院 | 用于食管鳞癌预后及疗法疗效评估的分子标记物及其应用 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Kan et al. | Multi-omics profiling of younger Asian breast cancers reveals distinctive molecular signatures | |
Wei et al. | Intratumoral and intertumoral genomic heterogeneity of multifocal localized prostate cancer impacts molecular classifications and genomic prognosticators | |
Ye et al. | Predicting hepatitis B virus–positive metastatic hepatocellular carcinomas using gene expression profiling and supervised machine learning | |
Chen et al. | DNA methylation-based classification and identification of renal cell carcinoma prognosis-subgroups | |
CN105821125A (zh) | 用于内分泌治疗下的乳腺癌复发预测的方法 | |
Kawaguchi et al. | Gene Expression Signature–Based Prognostic Risk Score in Patients with Primary Central Nervous System Lymphoma | |
Zhang et al. | Long noncoding RNAs predict the survival of patients with colorectal cancer as revealed by constructing an endogenous RNA network using bioinformation analysis | |
Xiong et al. | An integrated lncRNA, microRNA and mRNA signature to improve prognosis prediction of colorectal cancer | |
CN114203256B (zh) | 基于微生物丰度的mibc分型及预后预测模型构建方法 | |
CN114480650A (zh) | 一种预测三阴乳腺癌临床预后复发风险的标志物及模型 | |
Zhang et al. | Integrative analysis of methylation and gene expression in lung adenocarcinoma and squamous cell lung carcinoma | |
Joe et al. | Prognostic factor analysis for breast cancer using gene expression profiles | |
Zhang et al. | Hallmark guided identification and characterization of a novel immune-relevant signature for prognostication of recurrence in stage I–III lung adenocarcinoma | |
Luo et al. | Reduced Popdc3 expression correlates with high risk and poor survival in patients with gastric cancer | |
WO2020094569A1 (en) | Method for determining cellular composition of a tumor | |
Ruan et al. | Integrative analysis of single-cell and bulk multi-omics data to reveal subtype-specific characteristics and therapeutic strategies in clear cell renal cell carcinoma patients | |
Meyer et al. | Detailed DNA methylation characterisation of phyllodes tumours identifies a signature of malignancy and distinguishes phyllodes from metaplastic breast carcinoma | |
Giwa et al. | Predicting amplification of MYCN using CpG methylation biomarkers in neuroblastoma | |
Daza et al. | Urine supernatant reveals a signature that predicts survival in clear‐cell renal cell carcinoma | |
Zhang et al. | Precision treatment exploration of breast cancer based on heterogeneity analysis of lncRNAs at the single-cell level | |
Guo et al. | A novel 8-gene panel for prediction of early biochemical recurrence in patients with prostate cancer after radical prostatectomy | |
Li et al. | Gene expression signature to predict prognosis and adjuvant chemosensitivity of colorectal cancer patients | |
Luo et al. | SLC26A4 correlates with homologous recombination deficiency and patient prognosis in prostate cancer | |
Dou et al. | Prognostic prediction of a 12-methylation gene-based risk score system on pancreatic adenocarcinoma | |
Li et al. | Integration of Radiomics and Immune-Related Genes Signatures for Predicting Axillary Lymph Node Metastasis in Breast Cancer |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20220513 |