CN119570928A - 用于结直肠癌诊断和预后预测的lncRNA组合 - Google Patents
用于结直肠癌诊断和预后预测的lncRNA组合 Download PDFInfo
- Publication number
- CN119570928A CN119570928A CN202311140209.3A CN202311140209A CN119570928A CN 119570928 A CN119570928 A CN 119570928A CN 202311140209 A CN202311140209 A CN 202311140209A CN 119570928 A CN119570928 A CN 119570928A
- Authority
- CN
- China
- Prior art keywords
- biomarker
- seq
- detecting
- colorectal cancer
- expression
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6876—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
- C12Q1/6883—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
- C12Q1/6886—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/113—Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/118—Prognosis of disease development
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/158—Expression markers
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/178—Oligonucleotides characterized by their use miRNA, siRNA or ncRNA
Landscapes
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Engineering & Computer Science (AREA)
- Genetics & Genomics (AREA)
- Organic Chemistry (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Biomedical Technology (AREA)
- General Engineering & Computer Science (AREA)
- Biotechnology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Molecular Biology (AREA)
- Physics & Mathematics (AREA)
- Microbiology (AREA)
- Biochemistry (AREA)
- General Health & Medical Sciences (AREA)
- Immunology (AREA)
- Pathology (AREA)
- Analytical Chemistry (AREA)
- Biophysics (AREA)
- Plant Pathology (AREA)
- Hospice & Palliative Care (AREA)
- Oncology (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
本发明公开了用于结直肠癌诊断和预后预测的lncRNA组合,用于结直肠癌诊断和预后预测的lncRNA生物标志物包括DYNLRB2‑AS1、EFCAB13‑DT、LINC00645、LINC00901、LINC01409、LINC01738、LINC02962、PATJ‑DT、EWSAT1、LRP1‑AS。实验证明,通过检测本发明提供的生物标志物组合可以诊断受试者是否患有结直肠癌或患结直肠癌的风险,也可以预测结直肠癌患者预后的风险,具有较高的准确性,市场前景广阔,应用价值高。
Description
技术领域
本发明属于生物技术领域,涉及用于结直肠癌诊断和预后预测的lncRNA组合。
背景技术
结肠直肠癌(carcinoma of colon and rectum)胃肠道中常见的恶性肿瘤,早期症状不明显,随着癌肿的增大而表现排便习惯改变、便血、腹泻、腹泻与便秘交替、局部腹痛等症状,晚期则表现贫血、体重减轻等全身症状。其发病率和病死率在消化系统恶性肿瘤中仅次于胃癌、食管癌和原发性肝癌。
长链非编码RNA(Long non-coding RNA,lncRNA)是长度大于200个核苷酸的非编码RNA。研究表明,lncRNA在剂量补偿效应(Dosage compensationeffect)、表观遗传调控、细胞周期调控和细胞分化调控等众多生命活动中发挥重要作用,成为遗传学研究热点。RNA不仅仅是承担遗传信息中间载体的辅助性角色,而是更多地承担了各种调控功能。LncRNA发挥功能主要依靠其二级结构,与蛋白质结合,可引起染色质重构、影响转录因子功能等。LncRNA在发育和基因表达中发挥的复杂精确的调控功能极大地解释了基因组复杂性之难题,同时也为人们从基因表达调控网络的维度来认识生命体的复杂性开启新的天地。
发明内容
为了解决现有技术中存在的问题,本发明提供了以下技术方案:
本发明提供了以下lncRNA中的任意两种或多种作为生物标志物组合在制备诊断或预后预测结直肠癌的产品中的应用,所述lncRNA包括DYNLRB2-AS1、EFCAB13-DT、LINC00645、LINC00901、LINC01409、LINC01738、LINC02962、PATJ-DT、EWSAT1、LRP1-AS中的至少两种。
进一步,所述lncRNA选自DYNLRB2-AS1、EFCAB13-DT、LINC00645、LINC00901、LINC01409、LINC01738、LINC02962、PATJ-DT、EWSAT1、LRP1-AS的任意两种或多种。
进一步,所述lncRNA选自DYNLRB2-AS1、EFCAB13-DT、LINC00645、LINC00901、LINC01409、LINC01738、LINC02962、PATJ-DT、EWSAT1、LRP1-AS。
进一步,所述产品包括检测样本中至少一种生物标志物或其功能片段的存在、不存在和/或量的试剂。
进一步,所述试剂包括特异性检测前面所述生物标志物的引物。
进一步,所述引物包括如SEQ ID NO:1、SEQ ID NO:2所示的检测DYNLRB2-AS1的引物。
进一步,所述引物包括如SEQ ID NO:3、SEQ ID NO:4所示的检测EFCAB13-DT的引物。
进一步,所述引物包括如SEQ ID NO:5、SEQ ID NO:6所示的检测EWSAT1的引物。
进一步,所述引物包括如SEQ ID NO:7、SEQ ID NO:8所示的检测LINC00645的引物。
进一步,所述引物包括如SEQ ID NO:9、SEQ ID NO:10所示的检测LINC00901的引物。
进一步,所述引物包括如SEQ ID NO:11、SEQ ID NO:12所示的检测LINC01409的引物。
进一步,所述引物包括如SEQ ID NO:13、SEQ ID NO:14所示的检测LINC01738的引物。
进一步,所述引物包括如SEQ ID NO:15、SEQ ID NO:16所示的检测LINC02962的引物。
进一步,所述引物包括如SEQ ID NO:17、SEQ ID NO:18所示的检测LRP1-AS的引物。
进一步,所述引物包括如SEQ ID NO:19、SEQ ID NO:20所示的检测PATJ-DT的引物。
进一步,所述试剂包括通过PCR反应、RT-PCR衍生反应、3SR扩增、LCR、SDA、NASBA、TMA、SYBR Green、TaqMan探针、分子信标、双杂交探针、复合探针、ISH、微阵列、Southern印迹、Northern印迹检测样本中生物标志物或其功能片段的存在、不存在和/或量的试剂。
进一步,采用PCR反应、RT-PCR衍生反应、3SR扩增、LCR、SDA、NASBA、TMA检测样本中生物标志物或其功能片段的存在、不存在和/或量的试剂包括引物,所述引物与生物标志物或其功能片段的序列结合。
进一步,采用SYBR Green检测样本中生物标志物或其功能片段的存在、不存在和/或量的试剂包括染料,所述染料对生物标志物或其功能片段具有特异性。
进一步,采用TaqMan探针、分子信标、双杂交探针、复合探针、ISH、微阵列、Southern印迹、Northern印迹检测样本中生物标志物或其功能片段的存在、不存在和/或量的试剂包括探针,所述探针与生物标志物或其功能片段的序列互补。
进一步,所述探针为标记探针。
进一步,所述样本包括血液、组织、尿液、血清、血浆、羊水、脑脊液、胎盘细胞或组织、内皮细胞、白细胞、单核细胞、肿瘤细胞、肿瘤组织、组织提取物、细胞提取物。
本发明还提供了一种诊断或预后预测结直肠癌的产品,所述产品包括检测生物标志物的试剂,所述生物标志物包括DYNLRB2-AS1、EFCAB13-DT、LINC00645、LINC00901、LINC01409、LINC01738、LINC02962、PATJ-DT、EWSAT1、LRP1-AS中的至少两种。
进一步,所述生物标志物选自DYNLRB2-AS1、EFCAB13-DT、LINC00645、LINC00901、LINC01409、LINC01738、LINC02962、PATJ-DT、EWSAT1、LRP1-AS的任意两种或多种。
进一步,所述生物标志物选自DYNLRB2-AS1、EFCAB13-DT、LINC00645、LINC00901、LINC01409、LINC01738、LINC02962、PATJ-DT、EWSAT1、LRP1-AS。
进一步,所述产品包括引物、探针、芯片、试剂盒。
进一步,所述试剂盒包括通过PCR反应、RT-PCR衍生反应、3SR扩增、LCR、SDA、NASBA、TMA、SYBR Green、TaqMan探针、分子信标、双杂交探针、复合探针、ISH、微阵列、Southern印迹、Northern印迹检测样本中生物标志物或其功能片段的存在、不存在和/或量的试剂。
本发明还提供了一种体系,包含:
样本;
一种或多种探针和/或染色剂,所述探针和/或染色剂与至少一种生物标志物和/或其同源序列结合;以及
一种或多种设备,所述设备能够定量至少一种探针或染色剂的存在、不存在和/或量,所述探针或染色剂与所述生物标志物和/或其同源序列结合。
本发明还提供了一种诊断受试者是否患有结直肠癌或存在患结直肠癌风险的系统/装置,包括:
处理器;
输入单元,用于输入生物样本中生物标志物的表达水平,所述生物标志物选自:DYNLRB2-AS1、EFCAB13-DT、LINC00645、LINC00901、LINC01409、LINC01738、LINC02962、PATJ-DT、EWSAT1和/或LRP1-AS;
处理单元,所述存储在计算机可读介质的指令在由处理器执行时在至少两种基因和/或其表达产物的输入水平上执行算法;以及
输出单元,其提供基于所述至少两种基因和/或其表达产物的输入水平的一种或多种标记,其中所述一种或多种标记指示受试者存在结直肠癌。
进一步,所述系统/装置还包括检测所述生物标志物的试剂。
进一步,所述生物标志物选自DYNLRB2-AS1、EFCAB13-DT、LINC00645、LINC00901、LINC01409、LINC01738、LINC02962、PATJ-DT、EWSAT1、LRP1-AS的任意两种或多种。
进一步,所述生物标志物选自DYNLRB2-AS1、EFCAB13-DT、LINC00645、LINC00901、LINC01409、LINC01738、LINC02962、PATJ-DT、EWSAT1、LRP1-AS;
进一步,所述处理单元还包括分析模块,用于根据前面所述的生物标志物的表达水平,分析出受试者结直肠癌预后生存预测效果;
进一步,所述分析模块使用的分析公式为riskscore=(-0.003109)×DYNLRB2-AS1表达量+(-0.005306)×EFCAB13-DT表达量+(-0.004038)×EWSAT1表达量+0.003939×LINC00645表达量+0.008362×LINC00901表达量+(-0.007397)×LINC01409表达量+(-0.002291)×LINC01738表达量+0.003238×LINC02962表达量+(-0.002573)×LRP1-AS表达量+(-0.003843)×PATJ-DT表达量。
本发明还提供了一种计算机模型,所述计算机模型上存储有计算机程序,所述计算机程序被处理器执行时实现前面所述的系统/装置。
本发明还提供了一种预测结直肠癌患者预后复发风险的方法,所述方法检测从患者分离的样本中指示结直肠癌的生物标志物的表达水平,所述方法包括:
1)使该样本与能够检测生物标志物表达水平的试剂接触,所述生物标志物包括前面所述的生物标志物;
2)得到前面所述的生物标志物的表达水平的检测结果;
3)根据检测结果中前面所述的生物标志物的表达水平预测结直肠癌患者预后复发风险程度。
本发明还提供了生物标志物在制备治疗结直肠癌的药物组合物中的应用,所述生物标志物包括DYNLRB2-AS1、EFCAB13-DT、LINC00645、LINC00901、LINC01409、LINC01738、LINC02962、PATJ-DT、EWSAT1、LRP1-AS的任意两种或多种。
进一步,所述药物组合物包括促进或抑制所述生物标志物表达水平的促进剂或抑制剂。
进一步,所述促进剂促进在结直肠癌中表达下调的生物标志物的表达水平,所述抑制剂抑制在结直肠癌中表达上调的生物标志物的表达水平。
进一步,表达下调的生物标志物选自LINC01409、PATJ-DT。
定义
术语“生物标志物”是指某些生物学状态或疾病的可测量的指示。在一些情况下,生物标志物可以是在受试者中发现的物质,该物质的量或某种其他指示物。例如,生物标志物可以是样本中蛋白质和/或其他基因表达产物的量。
术语“样品”、“生物样品”,“测试样品”、“样本”、“来自受试者的样品”和“患者样品”可以互换使用,并且可以是血液、组织、尿液、血清、血浆、羊水、脑脊液、胎盘细胞或组织、内皮细胞、白细胞或单核细胞的样品。以本文所讨论的某种方式或本领域已知的其它方式可以用于直接从患者获得样品,或者可以(例如通过过滤、蒸馏、提取、浓缩、离心,干扰组分的灭活和添加试剂等)预处理样品以改变样品的特性。
术语“引物”或“探针”涵盖具有特定序列的寡核苷酸或具有特定序列的寡核苷酸。在其他实施方案中,通过间接检测方法检测核酸。
附图说明
图1是测试集riskscore模型在正常组织和结直肠癌组织中的差异性表达柱状图;
图2是验证集riskscore模型在正常组织和结直肠癌组织中的差异性表达柱状图;
图3是用riskscore模型进行结直肠癌诊断的ROC曲线图,其中,A为使用GTEx-TCGA数据库数据为样本绘制的ROC曲线图,B为使用临床样本数据绘制的ROC曲线图;
图4是用riskscore模型进行结直肠癌预后预测的ROC曲线图,其中,T表示癌肿瘤本身的生长情况,包括肿瘤的大小和它的浸润范围;N表示区域淋巴结的转移程度;M表示远位脏器有无血行运转;
图5是用riskscore模型进行结直肠癌预后预测后得到的生存曲线图。
具体实施方式
在本发明的具体实施方式中,所述生物标志物包括DYNLRB2-AS1、EFCAB13-DT、LINC00645、LINC00901、LINC01409、LINC01738、LINC02962、PATJ-DT、EWSAT1和/或LRP1-AS。
在本发明中,生物标志物例如DYNLRB2-AS1(Gene ID:102724084)、EFCAB13-DT(Gene ID:102724508)、LINC00645(Gene ID:100505967)、LINC00901(Gene ID:100506724)、LINC01409(Gene ID:105378580)、LINC01738(Gene ID:107984953)、LINC02962(Gene ID:339400)、PATJ-DT(Gene ID:118732297)、EWSAT1(Gene ID:283673)、LRP1-AS(Gene ID:105751187)包括基因及其编码的蛋白及其同源物,突变,和同等型。该术语涵盖全长,未加工的生物标志物,以及源自细胞中加工的任何形式的生物标志物。该术语涵盖生物标志物的天然发生变体(例如剪接变体或等位变体)。
本文公开的方法,产品和系统/装置可用于对来自一个或多个受试者的一个或多个样本进行分类。样本可以是包含待测试对象的组织、细胞、核酸、基因、基因片段、表达产物、蛋白质、多肽、外泌体、基因表达产物或基因表达产物片段的任何材料。样本可以包括但不限于组织、细胞、血浆、血清或来自细胞或源自个体细胞的任何其他生物材料。样本可以是细胞或组织的异质或同质群体。样本可以是无细胞或细胞贫乏的流体(例如血浆或血清)。在某些情况下,样本来自单个患者。
在一些实施方案中,样本由随后从样本中获取生物标志物数据的同一方(例如测试实验室)从受试者获取。在一些实施方案中,样本是从另一实体接收的(例如,通过测试实验室),所述另一实体是从受试者(例如,医师、护士、抽血者或医疗照顾者)收集样本的。在一些实施方案中,样本由医学专业人员在分离的实体(例如,测试实验室)的指导下从受试者获取,然后提供给所述实体(例如,测试实验室)。在一些实施方案中,样本由受试者或受试者的照料者在家中采集,并且随后提供给从样本中获取生物标志物数据的一方(例如,测试实验室)。
在一些实施方案中,本文所述的方法、产品、装置/系统利用任何可靠的方法来测量样本中的水平或数量。通常,可通过各种已知用于mRNA的方法从样本(包括其级分)(诸如分离的RNA的样本)中检测以及定量,各种已知方法包括,例如,基于扩增的方法(例如,聚合酶链反应(PCR)、实时聚合酶链反应(RT-PCR)、定量聚合酶链反应(qPCR)、滚环扩增等)、基于杂交的方法(例如,杂交阵列(例如,微阵列)、NanoString分析、Northern Blot分析、分支DNA(bDNA)信号扩增、原位杂交等),以及基于测序的方法(例如,下一代测序方法,例如,使用Illumina或IonTorrent平台)。其他示例性技术包括核糖核酸酶保护测定法(RPA)和质谱法。
在一些实施方案中,本发明公开的内容提供了用于分析检测结直肠癌的任何一组生物标志物的分析试剂盒。在某些具体的情况下,测定试剂盒包括一种或多种检测试剂。所述检测试剂包括但不限于探针、引物、抗体。
探针或引物可以包括标准(A,T或U,G和C)碱基,或修饰的碱基。修饰的碱基包括,但不限于,AEGIS碱基。在某些方面,碱基通过天然磷酸二酯键或不同的化学键连接。不同的化学键包括,但不限于,肽键或锁核酸(LNA)键。
在一些实施方案中,提供的测定产品如试剂盒适用于多重均质生物标志物测定,适用于在单个反应中(例如,在同一溶液室中)检测所有分析物。在一些实施方案中,提供的测定产品如试剂盒适用于多重非均质生物标志物测定,所述多重非均质生物标记测定适用于在分开的反应中(例如在分开的溶液室中)检测所有分析物。
本文公开的产品和系统/装置可包含算法或其用途。可以使用一种或多种算法来对来自一个或多个受试者的一个或多个样本进行分类。可以将一种或多种算法应用于来自一个或多个样本的数据。该数据可以包括生物标志物表达数据。
本文公开的产品和系统/装置可以包括将分类分配给来自一个或多个受试者的一个或多个样本。将分类分配给样本可以包括将算法应用于表达水平。在某些情况下,基因表达水平被输入到数据分析系统,该系统包括训练好的算法。用于将样本区分为正常对照和结直肠癌;在一些实施例中,算法可以作为其执行的一部分,计算样本的指数,并将样本的指数与阈值进行比较;预定关系可以指示样本属于特定分类的可能性。
数据分析系统可以是已训练的算法。该算法可以包括线性分类器。在一些情况下,线性分类器包括线性判别分析、费舍尔线性判别、朴素贝叶斯分类器、逻辑回归、感知机、支持向量机或其组合中的一种或多种。线性分类器可以是支持向量机(SVM)算法。该算法可以包括双向分类器。双向分类器可以包括一个或多个决策树、随机森林、贝叶斯网络、支持向量机、神经网络或逻辑回归算法。
本文进一步公开了用于分类(或排除分类)一个或多个样本的系统及其用途。该系统可以包括:(a)数字处理设备,其包括被配置为执行可执行指令的操作系统和存储设备;(b)计算机程序,其包括可由数字处理设备执行以对来自受试者的样本进行分类的指令,包括:(i)第一软件模块,其被配置为从来自受试者的样本中接收一个或多个生物标志物的生物标志物表达谱;(ii)第二软件模块,其配置为分析来自受试者的生物标志物表达谱;(iii)第三软件模块,被配置为基于分类系统对来自受试者的样本进行分类。在一些实施例中,分类系统包括两个类别。在其他实施例中,分类系统包括两个或更多个类别。至少两个类别可以选自结直肠癌、正常对照。分析来自受试者的生物标志物表达谱可以包括应用算法。分析生物标志物表达概况可包括归一化来自受试者的生物标志物表达概况。
本文公开的用于鉴定、分类(或排除分类)或表征样本的产品、系统或装置可以通过使用本文公开的方法具有至少约60%的特异度来表征。在一些实施方案中,方法的特异度为至少约70%。在一些实施方案中,方法的特异度为至少约80%。在一些实施方案中,特异度为至少约90%。在一些实施方案中,特异度至少约95%。
在一些实施方案中,本发明提供了使用本文公开的方法鉴定、分类(或排除分类)或表征样本的方法,该方法给出至少约60%的灵敏度。在一些实施方案中,该方法的灵敏度为至少70%。在一些实施方案中,该方法的灵敏度为至少80%。在一些实施方案中,该方法的灵敏度为至少90%。在一些实施方案中,该方法的灵敏度为至少95%。
本文公开的方法、试剂盒和系统可改善当前监测或预测结直肠癌的状态或结果或确定或排除样本的分类的方法的AUC。本文公开的方法、产品、系统或装置的AUC可以为至少约50%、53%、55%、57%、60%、63%、65%、67%、70%、72%、75%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.1%、99.2%、99.3%、99.4%、99.5%、99.6%、99.7%、99.8%、99.9%或介于这些值之间的任何范围。以下结合附图对本申请的具体实施方式进行详细说明。应当理解的是,此处所描述的具体实施方式仅用于说明和解释本申请,并不用于限制本申请。
实施例1与结直肠癌相关的lncRNA
1、实验对象
本实验中用于测试的TCGA结直肠癌队列的lncRNA测序数据和临床信息下载自GDC网站,GTEx数据库中正常结肠队列的基因表达数据下载自UCSC xene网站。在进行TCGA数据库以及GTEx数据库的去批次处理后共有741例样本用于差异表达及结直肠癌诊断分析,其中正常组织359例,结直肠癌组织382例;此外,在剔除了TCGA数据库中正常、重复、缺失样本后,共有619例样本用于预后分析。
本实验中用于验证的样本来自真实世界样本,均为结直肠癌患者29例,其中分别取正常组织29例,结直肠癌组织29例,用于验证riskscore模型诊断结直肠癌的正确性。
所述结直肠癌患者的纳入排除标准如下:
纳入标准:①患者均首次诊断为结直肠癌,根据世界卫生组织消化系统肿瘤(第四版)分类和美国癌症联合委员会分期系统完成结直肠癌病理诊断和分期,并经由两位病理医师独立阅片及诊断;②均接受结直肠癌根治术,清扫淋巴结数量不少于10个;③手术治疗前均未行抗肿瘤治疗,包括新辅助化疗、放疗、靶向治疗或生物治疗。
排除标准:①临床病例资料不全;②未行系统性淋巴结清扫或改为姑息手术;③既往肿瘤病史或同时合并其他部位肿瘤;④患者非因肿瘤死亡或于术后1月内死亡;⑤围手术期合并严重心、肺功能或肝、肾功能不全。
详细采样对象信息如表1所示。
表1 29例结直肠癌患者信息
2、实验方法
1)riskscore模型构建方法
①TCGA数据库数据的初步处理
A、去掉没有临床随访信息的样本;
B、去掉生存时间未知,小于0天和没有生存状态的样本;
C、去掉没有N分期的样本;
D、将探针转为Gene Symbol;
E、一个探针对应多个基因,去除该探针;
F、具有多个Gene Symbol的表达情况取其平均值。
②结直肠癌凝血相关lncRNA的分析:在MSigDB数据库中获取凝血基因,通过Spearman相关性分析获得结直肠癌中凝血相关的lncRNA(|r|>0.3,p<0.05)。
③基于筛选得到的结直肠癌凝血相关lncRNA,在TCGA数据中使用逐步回归降维的方法对变量进行筛选,以减少风险模型的基因数量。最终利用多因素Cox回归模型,来构建结直肠癌相关基因的风险评分(Risk scores)模型,将用来构建风险评分的基因定义为特征基因,然后以风险评分的中位数为分界点,将患者分为高水平组和低水平组。接下来,通过Kaplan-Meier分析风险评分的生存曲线,时间依赖ROC曲线来验证准确性。
④在实验组数据集中,将筛选得到的特征基因应用于逐步回归模型,以构建TCGA数据集中结直肠癌患者总生存率的预测模型,最后获得了10个特征基因(DYNLRB2-AS1、EFCAB13-DT、LINC00645、LINC00901、LINC01409、LINC01738、LINC02962、PATJ-DT、EWSAT1、LRP1-AS),构建风险评分模型,最终的公式如下:
Riskscore=(-0.003109)×DYNLRB2-AS1表达量+(-0.005306)×EFCAB13-DT表达量+(-0.004038)×EWSAT1表达量+0.003939×LINC00645表达量+
0.008362×LINC00901表达量+(-0.007397)×LINC01409表达量+(-0.002291)×LINC01738表达量+0.003238×LINC02962表达量+(-0.002573)×LRP1-AS表达量+(-0.003843)×PATJ-DT表达量。
2)差异表达分析
测试集:使用SPSS软件对筛选集特征基因的测序数据进行差异表达分析,比较在筛选集中结直肠癌组织与癌旁组织之间的基因差异表达。
验证集:
①RNA提取
使用RNeasy试剂盒(Beyotime,Shanghai,456中国,R0027)从组织中提取总RNA。具体如下:
a.样品准备:取20mg动物组织,置于1.5ml离心管中,加入6颗左右氧化锆珠,迅速加入600μl冰浴预冷的裂解液,用微型电动匀浆器匀浆。研磨或匀浆后,轻轻吹打匀浆液8-10次,室温放置3-5分钟。然后约14,000g离心2分钟,将上清液移至新的离心管中。
b.加入等体积结合液至裂解液中,轻轻颠倒混匀3-5次。
c.将裂解液和结合液的混合物转移到纯化柱内,放入离心机16,000g离心1分钟,弃去下层液体。
d.在纯化柱上加入600μL洗涤液I,16,000g离心1分钟,弃去下层液体。
在纯化柱上加入600μL洗涤液II,16,000g离心1分钟,弃去下层液体。
此步骤重复两次。
e.16,000g离心2分钟去除纯化柱上残余的液体。
f.弃去收集管,RNA纯化柱置于RNA洗脱管中,在纯化柱中心加入50μL洗脱液,室温放置3分钟,16,000g离心30秒。得到的洗脱液再次加到纯化柱中心重复洗脱,16,000g离心30秒,得到纯化的RNA.
②逆转录:
a.测定样本RNA的浓度和质量:
对于浓度高于143ng/μL且OD230/260和OD280/260符合标准的样本RNA进行反转录。
b.去除RNA中的DNA:
先在冰上配制gDNA Eraser和5×gDNA Eraser Buffer的混合溶液,并分装到各反应管,然后加入1μg总RNA和无酶水。
以上反应体系在42℃加热两分钟,去除DNA。
c.反转录反应:
先在冰上配制除第一步反应液外的混合溶液,然后加入第一步反应液。
以上反应体系在37℃加热15分钟,在85℃加热30秒。每管加入180μLRNase FreedH2O稀释。
③PCR
a.引物设计
TCGA结直肠癌队列的mRNA测序数据下载自GDC网站。引物由公司合成,针对riskscore模型的相关引物序列如下:
DYNLRB2-AS1
F:5’-CTGTAAGGAGCCTGGACATGG-3’(SEQ ID NO:1);
R:5’-CCAAAGCGGTCAGAAGAAGTG-3’(SEQ ID NO:2);
EFCAB13-DT
F:5’-GGGATAAGACTTTGGGGCCT-3’(SEQ ID NO:3);
R:5’-TCGATCGCTTGCTTCCCTTT-3’(SEQ ID NO:4);
EWSAT1
F:5’-CTGAAACTCCCACCGAGACC-3’(SEQ ID NO:5);
R:5’-ATGGGCTTAAGGGTGGGGTA-3’(SEQ ID NO:6);
LINC00645
F:5’-AGCAGCTGTTAAGGTCACTCC-3’(SEQ ID NO:7);
R:5’-TGCACAGTTCCATCACCAGA-3’(SEQ ID NO:8);
LINC00901
F:5’-GGGGAGCCTGTGTATATGCG-3’(SEQ ID NO:9);
R:5’-CAGGTTATCTTCCTGCCGCT-3’(SEQ ID NO:10);
LINC01409
F:5’-CCCATCCTGCCACTAACAGA-3’(SEQ ID NO:11);
R:5’-GGAGGAAGCCCTTGGTAGAAG-3’(SEQ ID NO:12);
LINC01738
F:5’-AGGCCAGCAAAGTCTTGTCA-3’(SEQ ID NO:13);
R:5’-TGTCTGAACGTGGCCTTCTC-3’(SEQ ID NO:14);
LINC02962
F:5’-GCAGTTCCTGATACTGGTTTTTCT-3’(SEQ ID NO:15);
R:5’-CAGCCATGCAATATTCATAGACTTC-3’(SEQ ID NO:16);
LRP1-AS
F:5’-CGTCTGTGTTGGTGCATAGC-3’(SEQ ID NO:17);
R:5’-CACTTCGTTGCCCTTGTCAC-3’(SEQ ID NO:18);
PATJ-DT
F:5’-CTGCGTGTAGAGCGAGACC-3’(SEQ ID NO:19);
R:5’-GTTAAGCGGATTGACCCAACG-3’(SEQ ID NO:20);
(10个lncRNA)。
b.配制反应体系:
TB Green Premix Ex Taq II试剂避光,PCR正反引物提前混合。
先在冰上配制除cDNA外的混合溶液,分装到八联排,然后加入cDNA.
c.八联排离心,上机。
实时定量PCR检测分析使用两步法PCR标准扩增程序,反应条件:以cDNA为模版,进行qRT-PCR,以GAPDH为内参照进行扩增,反应条件:第一步预变性(98℃30秒)和第二步PCR扩增(95℃5秒,60℃30秒,40个循环)。
通过qRT-PCR仪特定软件程序记录并分析检测数据结果,根据公式倍数=2-ΔΔCt计算各检测目的基因的相对表达量。
3)诊断效能分析
采用R包“pROC”绘制受试者工作曲线(ROC),分析经筛选得到的在结直肠癌组织和正常组织之间呈现显著性差异表达的lncRNA分别在筛选集和验证集中的AUC值、灵敏度、特异性,以判断其对结直肠癌的诊断效能。
其中,使用所述lncRNA的表达量(Log2表达量)进行评估分析,选择最大的Youden指数所对应的点作为其cutoff值,即最佳划分阈值通过Youden指数最大的一点来确定。
4)生存分析
本实施例在TCGA数据集中通过Kaplan-Meier分析评估所述lncRNA对结直肠癌患者总生存期(Overall survival,OS)的预后影响。根据所述lncRNA表达的最佳切点将患者分为两组。
5)预后预测效能分析
采用R包“pROC”绘制受试者工作曲线(ROC),分析所述lncRNA在TCGA数据集中对结直肠癌的预后预测的效能。
6)统计分析方法
采用Wilcoxon符号秩和检验评估所述lncRNA的表达差异。生存分析采用Log-rank检验。其余数据采用Student’s t检验(正态分布变量)或Wilcoxon秩和检验(非正态分布变量)进行分析。所有统计检验均采用R(版本:3.6.3)进行,显著性阈值设为0.05。
3、实验结果
1)差异表达分析
测试集:测试集中差异表达的分析结果如图1所示,与正常组织相比,riskscore模型在结直肠癌组织中的表达水平显著上调。
验证集:验证集中差异表达的分析结果如图2所示,与正常组织相比,riskscore模型在结直肠癌组织中的表达水平显著上调。
2)lncRNA诊断结直肠癌的ROC曲线分析
分别使用GTEx-TCGA数据库与现实世界临床收集的29对样本中关于10个lncRNA(DYNLRB2-AS1、EFCAB13-DT、LINC00645、LINC00901、LINC01409、LINC01738、LINC02962、PATJ-DT、EWSAT1、LRP1-AS)的数据,构建riskscore模型,并绘制riskscore模型正常组织与结直肠癌组织的ROC曲线,结果如图3所示,以GTEx-TCGA数据库数据绘制的测试集riskscore模型ROC曲线中,显示AUC值为0.817,以29对临床收集样本数据绘制的验证集riskscore模型ROC曲线中,显示AUC值为0.943,表明riskscore模型可以作为诊断结直肠癌的生物标志物组合。
2)lncRNA预测结直肠癌预后的ROC曲线和生存曲线分析
使用TCGA数据库数据,并绘制预后的riskscore模型ROC曲线(图4),结果显示,相较于常规使用M+N+T的预后预测方法,AUC值为0.703,使用M+N+T+riskscore的预后预测方法,其AUC值(0.791)更高,表明10个lncRNA组合成的riskscore模型能够提高结直肠癌预后预测的准确性。
使用TCGA数据库数据,并绘制预后riskscore模型高水平和低水平的生存曲线,结果如图5所示,低水平组的患者的整体生存期(OS)显著高于高水平组的患者。
上述实施例的说明只是用于理解本发明的方法及其核心思想。应当指出,对于本领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以对本发明进行若干改进和修饰,这些改进和修饰也将落入本发明权利要求的保护范围内。
Claims (10)
1.以下lncRNA中的任意两种或多种作为生物标志物组合在制备诊断或预后预测结直肠癌的产品中的应用,所述lncRNA包括DYNLRB2-AS1、EFCAB13-DT、LINC00645、LINC00901、LINC01409、LINC01738、LINC02962、PATJ-DT、EWSAT1、LRP1-AS中的至少两种;
优选地,所述lncRNA选自DYNLRB2-AS1、EFCAB13-DT、LINC00645、LINC00901、LINC01409、LINC01738、LINC02962、PATJ-DT、EWSAT1、LRP1-AS的任意两种或多种;
优选地,所述lncRNA选自DYNLRB2-AS1、EFCAB13-DT、LINC00645、LINC00901、LINC01409、LINC01738、LINC02962、PATJ-DT、EWSAT1、LRP1-AS。
2.如权利要求1所述的应用,所述产品包括检测样本中至少一种生物标志物或其功能片段的存在、不存在和/或量的试剂;
优选地,所述试剂包括特异性检测权利要求1所述生物标志物的引物;
优选地,所述引物包括如SEQ ID NO:1、SEQ ID NO:2所示的检测DYNLRB2-AS1的引物;
优选地,所述引物包括如SEQ ID NO:3、SEQ ID NO:4所示的检测EFCAB13-DT的引物;
优选地,所述引物包括如SEQ ID NO:5、SEQ ID NO:6所示的检测EWSAT1的引物;
优选地,所述引物包括如SEQ ID NO:7、SEQ ID NO:8所示的检测LINC00645的引物;
优选地,所述引物包括如SEQ ID NO:9、SEQ ID NO:10所示的检测LINC00901的引物;
优选地,所述引物包括如SEQ ID NO:11、SEQ ID NO:12所示的检测LINC01409的引物;
优选地,所述引物包括如SEQ ID NO:13、SEQ ID NO:14所示的检测LINC01738的引物;
优选地,所述引物包括如SEQ ID NO:15、SEQ ID NO:16所示的检测LINC02962的引物;
优选地,所述引物包括如SEQ ID NO:17、SEQ ID NO:18所示的检测LRP1-AS的引物;
优选地,所述引物包括如SEQ ID NO:19、SEQ ID NO:20所示的检测PATJ-DT的引物;
优选地,所述试剂包括通过PCR反应、RT-PCR衍生反应、3SR扩增、LCR、SDA、NASBA、TMA、SYBR Green、TaqMan探针、分子信标、双杂交探针、复合探针、ISH、微阵列、Southern印迹、Northern印迹检测样本中生物标志物或其功能片段的存在、不存在和/或量的试剂;
优选地,采用PCR反应、RT-PCR衍生反应、3SR扩增、LCR、SDA、NASBA、TMA检测样本中生物标志物或其功能片段的存在、不存在和/或量的试剂包括引物,所述引物与生物标志物或其功能片段的序列结合;
优选地,采用SYBR Green检测样本中生物标志物或其功能片段的存在、不存在和/或量的试剂包括染料,所述染料对生物标志物或其功能片段具有特异性;
优选地,采用TaqMan探针、分子信标、双杂交探针、复合探针、ISH、微阵列、Southern印迹、Northern印迹检测样本中生物标志物或其功能片段的存在、不存在和/或量的试剂包括探针,所述探针与生物标志物或其功能片段的序列互补;
优选地,所述探针为标记探针。
3.如权利要求2所述的应用,所述样本包括血液、组织、尿液、血清、血浆、羊水、脑脊液、胎盘细胞或组织、内皮细胞、白细胞、单核细胞、肿瘤细胞、肿瘤组织、组织提取物、细胞提取物。
4.一种诊断或预后预测结直肠癌的产品,所述产品包括检测生物标志物的试剂,所述生物标志物包括DYNLRB2-AS1、EFCAB13-DT、LINC00645、LINC00901、LINC01409、LINC01738、LINC02962、PATJ-DT、EWSAT1、LRP1-AS中的至少两种;
优选地,所述生物标志物选自DYNLRB2-AS1、EFCAB13-DT、LINC00645、LINC00901、LINC01409、LINC01738、LINC02962、PATJ-DT、EWSAT1、LRP1-AS的任意两种或多种;
优选地,所述生物标志物选自DYNLRB2-AS1、EFCAB13-DT、LINC00645、LINC00901、LINC01409、LINC01738、LINC02962、PATJ-DT、EWSAT1、LRP1-AS。
5.如权利要求4所述的产品,所述产品包括引物、探针、芯片、试剂盒;
优选地,所述试剂盒包括通过PCR反应、RT-PCR衍生反应、3SR扩增、LCR、SDA、NASBA、TMA、SYBR Green、TaqMan探针、分子信标、双杂交探针、复合探针、ISH、微阵列、Southern印迹、Northern印迹检测样本中生物标志物或其功能片段的存在、不存在和/或量的试剂。
6.一种体系,包含:
样本;
一种或多种探针和/或染色剂,所述探针和/或染色剂与至少一种生物标志物和/或其同源序列结合;以及
一种或多种设备,所述设备能够定量至少一种探针或染色剂的存在、不存在和/或量,所述探针或染色剂与所述生物标志物和/或其同源序列结合。
7.一种诊断受试者是否患有结直肠癌或存在患结直肠癌风险的系统/装置,包括:
处理器;
输入单元,用于输入生物样本中生物标志物的表达水平,所述生物标志物选自:DYNLRB2-AS1、EFCAB13-DT、LINC00645、LINC00901、LINC01409、LINC01738、LINC02962、PATJ-DT、EWSAT1和/或LRP1-AS;
处理单元,所述存储在计算机可读介质的指令在由处理器执行时在至少两种基因和/或其表达产物的输入水平上执行算法;以及
输出单元,其提供基于所述至少两种基因和/或其表达产物的输入水平的一种或多种标记,其中所述一种或多种标记指示受试者存在结直肠癌;
优选地,所述系统/装置还包括检测所述生物标志物的试剂;
优选地,所述生物标志物选自DYNLRB2-AS1、EFCAB13-DT、LINC00645、LINC00901、LINC01409、LINC01738、LINC02962、PATJ-DT、EWSAT1、LRP1-AS的任意两种或多种;
优选地,所述生物标志物选自DYNLRB2-AS1、EFCAB13-DT、LINC00645、LINC00901、LINC01409、LINC01738、LINC02962、PATJ-DT、EWSAT1、LRP1-AS;
优选地,所述处理单元还包括分析模块,用于根据前面所述的生物标志物的表达水平,分析出受试者结直肠癌预后生存预测效果;
优选地,所述分析模块使用的分析公式为riskscore=-0.003109×DYNLRB2-AS1表达量-0.005306×EFCAB13-DT表达量-0.004038×EWSAT1表达量+0.003939×LINC00645表达量+0.008362×LINC00901表达量-0.007397×LINC01409表达量-0.002291×LINC01738表达量+0.003238×LINC02962表达量-0.002573×LRP1-AS表达量-0.003843×PATJ-DT表达量。
8.一种计算机模型,所述计算机模型上存储有计算机程序,所述计算机程序被处理器执行时实现权利要求7所述的系统/装置。
9.一种预测结直肠癌患者预后复发风险的方法,所述方法检测从患者分离的样本中指示结直肠癌的生物标志物的表达水平,所述方法包括:
1)使该样本与能够检测生物标志物表达水平的试剂接触,所述生物标志物包括权利要求1所述的生物标志物;
2)得到权利要求1所述的生物标志物的表达水平的检测结果;
3)根据检测结果中权利要求1中所述的生物标志物的表达水平预测结直肠癌患者预后复发风险程度。
10.生物标志物在制备治疗结直肠癌的药物组合物中的应用,所述生物标志物包括DYNLRB2-AS1、EFCAB13-DT、LINC00645、LINC00901、LINC01409、LINC01738、LINC02962、PATJ-DT、EWSAT1、LRP1-AS的任意两种或多种;
优选地,所述药物组合物包括促进或抑制所述生物标志物表达水平的促进剂或抑制剂;
优选地,所述促进剂促进在结直肠癌中表达下调的生物标志物的表达水平,所述抑制剂抑制在结直肠癌中表达上调的生物标志物的表达水平;
优选地,表达下调的生物标志物选自LINC01409、PATJ-DT。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311140209.3A CN119570928A (zh) | 2023-09-06 | 2023-09-06 | 用于结直肠癌诊断和预后预测的lncRNA组合 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311140209.3A CN119570928A (zh) | 2023-09-06 | 2023-09-06 | 用于结直肠癌诊断和预后预测的lncRNA组合 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN119570928A true CN119570928A (zh) | 2025-03-07 |
Family
ID=94802272
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311140209.3A Pending CN119570928A (zh) | 2023-09-06 | 2023-09-06 | 用于结直肠癌诊断和预后预测的lncRNA组合 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN119570928A (zh) |
-
2023
- 2023-09-06 CN CN202311140209.3A patent/CN119570928A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN102443627B (zh) | 用于乳腺癌的预后的试剂盒 | |
JP6246845B2 (ja) | 遺伝子発現を用いた前立腺癌の予後を定量化する方法 | |
JP6114035B2 (ja) | 肺癌検出用唾液バイオマーカー | |
KR101530689B1 (ko) | 직장결장암용 예후 예측 | |
TWI582236B (zh) | 黑色素癌之預後預測 | |
KR101566368B1 (ko) | 암 검출을 위한 소변 유전자 발현 비율 | |
JP6049739B2 (ja) | 前立腺癌の分類のためのマーカー遺伝子 | |
JP6285009B2 (ja) | 前立腺ガンの予後の検知及び判定のための組成物及び該検知及び判定方法 | |
US10246748B2 (en) | Biomarker combinations for colorectal tumors | |
US7514219B2 (en) | Method for distinguishing between head and neck squamous cell carcinoma and lung squamous cell carcinoma | |
CN101014720B (zh) | 用于乳腺癌的预后的方法和试剂盒 | |
US20250137066A1 (en) | Compostions and methods for diagnosing lung cancers using gene expression profiles | |
CN110229899B (zh) | 用于结直肠癌早期诊断或预后预测的血浆标记物组合 | |
WO2016118670A1 (en) | Multigene expression assay for patient stratification in resected colorectal liver metastases | |
CN115087869A (zh) | 肺癌诊断用多种生物标志物及其用途 | |
US10233502B2 (en) | Compositions for and methods of detecting, diagnosing, and prognosing thymic cancer | |
CN109402252A (zh) | 急性髓系白血病风险评估基因标志物及其应用 | |
CN110656169B (zh) | 心房颤动的诊断标志物 | |
TWI598444B (zh) | 用以評估乳癌罹患風險之方法及基因標記 | |
JP2017510304A (ja) | 前癌性結腸直腸ポリープおよび結腸直腸癌を特定するための方法およびキット | |
CN114032308A (zh) | Fam83a、kpna2、krt6a和ldha联合作为肺腺癌生物标志物的用途 | |
CN119570928A (zh) | 用于结直肠癌诊断和预后预测的lncRNA组合 | |
CN113832228A (zh) | 生物标志物在预测直肠癌对术前放化疗联合全直肠系膜切除术的敏感性中的应用 | |
CN110184358A (zh) | 甲状腺癌早期诊断用的oit3基因及其应用 | |
CN119570930A (zh) | 生物标志物patj-dt在诊断或预后预测结直肠癌中的应用 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |