CN114540504B - 用于预测肺鳞癌患者免疫疗效的标志物组及系统 - Google Patents
用于预测肺鳞癌患者免疫疗效的标志物组及系统 Download PDFInfo
- Publication number
- CN114540504B CN114540504B CN202210448091.XA CN202210448091A CN114540504B CN 114540504 B CN114540504 B CN 114540504B CN 202210448091 A CN202210448091 A CN 202210448091A CN 114540504 B CN114540504 B CN 114540504B
- Authority
- CN
- China
- Prior art keywords
- efficacy
- lung squamous
- rna
- cell carcinoma
- squamous cell
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6876—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
- C12Q1/6883—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
- C12Q1/6886—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B25/00—ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
- G16B25/10—Gene or protein expression profiling; Expression-ratio estimation or normalisation
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B25/00—ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
- G16B25/20—Polymerase chain reaction [PCR]; Primer or probe design; Probe optimisation
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B40/00—ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
- G16B40/10—Signal processing, e.g. from mass spectrometry [MS] or from PCR
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B40/00—ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
- G16B40/20—Supervised data analysis
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B50/00—ICT programming tools or database systems specially adapted for bioinformatics
- G16B50/30—Data warehousing; Computing architectures
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H20/00—ICT specially adapted for therapies or health-improving plans, e.g. for handling prescriptions, for steering therapy or for monitoring patient compliance
- G16H20/10—ICT specially adapted for therapies or health-improving plans, e.g. for handling prescriptions, for steering therapy or for monitoring patient compliance relating to drugs or medications, e.g. for ensuring correct administration to patients
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/20—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/106—Pharmacogenomics, i.e. genetic variability in individual responses to drugs and drug metabolism
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/158—Expression markers
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/178—Oligonucleotides characterized by their use miRNA, siRNA or ncRNA
Landscapes
- Health & Medical Sciences (AREA)
- Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Physics & Mathematics (AREA)
- Medical Informatics (AREA)
- General Health & Medical Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Chemical & Material Sciences (AREA)
- Biotechnology (AREA)
- Theoretical Computer Science (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Biophysics (AREA)
- Public Health (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Genetics & Genomics (AREA)
- Databases & Information Systems (AREA)
- Molecular Biology (AREA)
- Epidemiology (AREA)
- Data Mining & Analysis (AREA)
- Organic Chemistry (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Bioethics (AREA)
- Pathology (AREA)
- Software Systems (AREA)
- Immunology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Artificial Intelligence (AREA)
- Primary Health Care (AREA)
- Evolutionary Computation (AREA)
- Biomedical Technology (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Analytical Chemistry (AREA)
- Microbiology (AREA)
- Oncology (AREA)
- General Engineering & Computer Science (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Hospice & Palliative Care (AREA)
- Biochemistry (AREA)
Abstract
本发明属于医疗领域,公开了用于预测肺鳞癌患者免疫疗效的标志物组及系统。标志物组由长链非编码RNA RP5‑1091N2.9、CD48、P2RY10、CD2、CTSS、GMFG和HLA‑DMB组成。通过确定标志物的RNA表达量及其与生存期的COX回归系数值Ci,计算得到疗效预测分值Rscore。可以很好地地指导临床用药,减少副作用,避免不必要的免疫治疗,有利于建立合理的联合治疗方案。通过结合肿瘤突变负荷TMB值,可以更好地确定免疫疗效,可以更好地指导免疫治疗。
Description
技术领域
本发明涉及医疗领域,具体涉及用于预测肺鳞癌患者免疫疗效的标志物组及系统。
背景技术
2018年4月,一项PD-1抗体Keytruda单药一线治疗局部晚期或转移性无突变NSCLC的临床III期研究表明:相比铂类药物化疗,Keytruda可显著延长PD-L1表达阳性(表达水平≥1%)患者的总生存期(OS),副作用也应该更小。至此,无论PD-1/PD-L1单药还是联合化疗均在临床研究中取得了OS获益数据。在非小细胞肺癌的一线治疗中,PD-1相比化疗疗效更佳。
尽管PD1/PD-L1阻断剂已成为临床抗肿瘤治疗一线药物,临床应用的初步成果令人鼓舞。然而该药物价格昂贵。PD-1抑制剂有效的病人,一般疗效持久;但是,目前已经观察到30%左右的患者,出现了疾病的耐药。因此,提高治疗的临床应答率、疗效的预测、用药剂量优化、避免联合用药的毒副作用、提高药物疗效依然是PD1/PD-L1阻断治疗的重大课题。这就需要我们对T细胞活性调节的PD-1/PD-L1通路机制及重要分子的完整全面理解。PD-1/PD-L1信号通路中lncRNA层次的研究有利于抗肿瘤药物的研发、有利于深入探索治疗抗性发生的机制,疗效的预测,用药剂量优化,提高治疗的临床应答率,建立合理的联合治疗方案,避免用药的毒副作用。
自2014年起,PD-1/PD-L1免疫抑制剂已被批准用来治疗包括恶黑、非小细胞肺癌、肾癌、膀胱癌、头颈瘤等多种肿瘤。然而,对大部分实体瘤,PD-1/PD-L1单独使用会有60%-80%的无效率,也就意味着还会有不少的患者用药后无效。此外,PD-1/PD-L1免疫抑制剂昂贵的价格进一步限制了其应用范围。尽管科学家和临床医生在PD-L1表达、肿瘤突变负荷(TMB)、微卫星不稳定性(MSI/MMR状态)、新抗原,新抗原瘤内异质性和MHC抗原等多种角度入手,目前依然找不到高预测性的生物标记物。这些局限性给临床肿瘤学家制定适于个体患者更安全、更经济更有效的PD-1/PD-L1免疫疗法方案带来了挑战。现在免疫疗法的主要判断指标是基于肿瘤突变负荷TMB方法。
lncRNA 通过表观遗传修饰与转录调控、转录后加工、翻译调控等多种机制,在多种生物学过程中发挥重要作用。近年来的研究揭示,lncRNA在免疫系统中起着非常重要的作用,对T细胞、B 细胞、固有免疫细胞和炎症因子亦具有调控作用,其表达异常可以影响多种免疫系统疾病的发生、发展及预后,成为免疫学关注的焦点。现有证据表明lncRNA的表达异常、相应位置的SNP或碱基的突变或许与肿瘤疾病的发生发展高度相关,并可作为肿瘤早期诊断、临床分期、预后、药物疗效的独立预测因子。然而,PD-1/PD-L1信号通路中相关lncRNA研究仍然较少。
鉴于PD-1/PD-L1免疫抑制剂缺乏高预测性生物标记物以及lncRNA在免疫调控中的重要作用,项目拟挖掘与PD-1基因相关的lncRNA及mRNA表达谱,探索预测靶基因表达量与PDCD1/PD-L1抑制剂疗效相关性,开发出PD1/PD-L1免疫治疗敏感性生物标记物试剂盒。
长非编码RNA RP5-1091N2.9转录本(含UTR区域)位置是chrX:71183559-71198175(人类hg38版本),长度为48186bp,位于负链,其对应的Ensembl 转录本ID是ENSG00000228427。其功能研究较少,Mariotti B, Servaas N H, Rossato M, et al. Thelong non-coding RNA NRIR drives IFN-response in monocytes: implication forsystemic sclerosis[J]. Frontiers in immunology, 2019, 10: 100.公开了RP5-1091N2.9 系统性硬化症(systemic sclerosis,SSc)显著高表达,未有数据显示RP5-1091N2.9与肺癌相关。
有研究表明CD48、P2RY10、CD2、CTSS、GMFG、HLA-DMB在某些肿瘤中存在差异表达,但在LUSC中并不具有显著意义。
发明内容
本发明的目的在于克服现有技术的至少一个不足,提供于预测肺鳞癌患者免疫疗效的标志物组及系统。
本发明所采取的技术方案是:
本发明的第一个方面,提供:
用于预测肺鳞癌患者免疫疗效的标志物组,由长链非编码RNA RP5-1091N2.9、CD48、P2RY10、CD2、CTSS、GMFG和HLA-DMB组成。
本发明的第二个方面,提供:
定量长链非编码RNA RP5-1091N2.9、CD48、P2RY10、CD2、CTSS、GMFG和HLA-DMB表达量的试剂在制备预测肺鳞癌患者免疫疗效试剂中的应用。
在一些应用的实例中,所述试剂的检测样本为患者的肿瘤组织和/或外周血。
本发明的第三个方面,提供:
一种用于预测肺鳞癌患者免疫疗效的系统,包括:
长链非编码RNA定量装置:用于确定样本中长链非编码RNA RP5-1091N2.9、CD48、P2RY10、CD2、CTSS、GMFG和HLA-DMB表达量;
免疫疗效预测装置:基于样本中长链非编码RNA RP5-1091N2.9、CD48、P2RY10、CD2、CTSS、GMFG和HLA-DMB表达量,预测肺鳞癌患者免疫疗效;
结果输出装置:用于输出免疫疗效预测装置分析得到的预测结果。
在一些系统的实例中,所述样本为患者的肿瘤组织和/或外周血;
在一些系统的实例中,所述长链非编码RNA定量装置选自高通量测序装置、RNA定量芯片、RNA qPCR定量装置。
在一些系统的实例中,所述免疫疗效预测装置的计算方法包括:
S1) 根据FPKM公式计算每个RNA的表达值Fk;
S2) 根据公开免疫治疗疗效数据确定RP5-1091N2.9、CD48、P2RY10、CD2、CTSS、GMFG和HLA-DMB表达量与生存期的COX回归系数值Ci;
S3) 根据以下公式计算疗效预测分值Rscore:
S4) 基于疗效预测分值Rscore确定免疫疗效。
在一些系统的实例中,使用R software的survival package确定RP5-1091N2.9、CD48、P2RY10、CD2、CTSS、GMFG和HLA-DMB表达量与生存期的COX回归系数值Ci。
在一些系统的实例中,Rscore≤0.70,判定为肺鳞癌患者免疫治疗疗效好;Rscore>0.70时,判定为肺鳞癌患者免疫治疗疗效差。
在一些系统的实例中,所述长链非编码RNA定量装置选自高通量测序装置,基于高通量测序数据,根据FPKM公式计算每个RNA的表达值Fk,使用R software的survivalpackage确定RP5-1091N2.9、CD48、P2RY10、CD2、CTSS、GMFG和HLA-DMB表达量与生存期的COX回归系数值Ci,Rscore≤0.70,判定为肺鳞癌患者免疫治疗疗效好;Rscore>0.70时,判定为肺鳞癌患者免疫治疗疗效差。
在一些系统的实例中,还包括结合肿瘤突变负荷TMB值确定免疫疗效。
在一些系统的实例中,肿瘤突变负荷TMB值≥15,判定为肺鳞癌患者免疫治疗疗效好;肿瘤突变负荷TMB值<15时,判定为肺鳞癌患者免疫治疗疗效差。
本发明的有益效果是:
本发明一些实例的技术,可以有效预测肺鳞癌患者免疫疗效,有利于更好地指导临床用药,减少副作用,避免不必要的免疫治疗,有利于建立合理的联合治疗方案。
本发明一些实例的技术,通过结合肿瘤突变负荷TMB值,可以更好地确定免疫疗效。
附图说明
图1是肺鳞癌中RP5-1091N2.9和6个辅助蛋白的表达量;
图2~图7分别是CD2、CD48、CTSS、GMFG、 HLA-DMB、P2RY10和RP5-1091N2.9的共表达关系;
图8是文库perkinelmer labchip微量芯片分析仪质检的具体出峰图;
图9是30个文库的出峰图;
图10是30个患者的生存期信息;
图11~17是不同标志物单独使用时的生存时间图。
具体实施方式
下面结合实验,进一步说明本发明的技术方案。
T细胞分离:按照EasySep™ Human T Cell Isolation Cocktail(货号:17951C)和EasySep™ Dextran RapidSpheres™(货号:50103)的说明书进行操作,采用负选方式。
提取RNA:
直接在悬浮液中加入Trizol裂解细胞,加1ml Trizol.用取样器吹打几次(加Trizol前不要洗涤细胞,以免降解RNA)。将匀浆样品在15-30℃放置5mim,使得核酸蛋白复合物完全分离。4 ℃ 12 000rpm离心10min,取上清。加0.2ml氯仿,盖好管盖,在漩涡振荡器上震荡15s,室温放置3min。如不能涡旋混匀,可手动颠倒混匀2min代替。4 ℃ 12 000rpm,离心10-15min,样品会分成三层:红色的有机相,中间层和上层无色的水相,RNA主要在水相中,把水相(约600ul,约为所用Trizol试剂的60%)转移到新管中。在得到的水相溶液中加入等体积(500ul)的异丙醇,上下颠倒混匀,-20℃ 放置20-30min。4 ℃ 12 000rpm离心10min,去上清。加入1ml 75%乙醇(DEPC水处理过的水配制)洗涤沉淀。4 ℃ 12 000rpm离心5min,弃上清;短暂快速离心,用移液器小心吸弃上清,注意不要吸弃沉淀。室温放置晾干(不要晾得过干,RNA完全干燥后会很难溶解,大约晾干2-3min左右即可)。加入适量DEPC水(根据实验需要,可加30-100ul水)或0.5%SDS,用枪头吸打几次,充分溶解RNA。50℃保温1小时。
文库构建:
根据kapa建库试剂盒的说明书进行操作。试剂盒名称和货号为KAPA RNA-seq文库构建试剂盒+RiboErase核糖体RNA去除(人/大鼠/小鼠) (96个反应) KK货号KK8484,产品货号07962304001。对建立的RNA文库,用perkinelmer labchip微量芯片分析仪或者全自动核酸蛋白分析系统Qsep100进行文库质检,确保条带都在300bp范围附近。
高通量测序:
使用illumina novaseq对上述RNAseq文库进行测序。测序量要求为20M reads/样品。也可使用同类型的其他高通量测序仪。
数据分析:
S1) 使用Cutadapt 3.4和FastQC 0.11.9进行测序下机数据的预处理;
S2) 使用STAR Aligner 2.7.9a进行数据的比对,参考基因组为hg38;
S3) 使用featureCounts v1.5.2计算所有n个RNA的read count;
S4) 根据FPKM公式计算每个RNA的表达值F,并用R software的rank函数计算每个RNA的表达值在该样品n个RNA表达量中的秩R;
S5) 提取RP5-1091N2.9及其6个辅助RNA的F值和R值,6个辅助RNA的基因symbol是CD48,P2RY10,CD2,CTSS,GMFG,HLA-DMB;
S6) 用以下公式计算疗效预测分值Rscore:
式中,Fk、Ci计算方式如下:
S6-1) 建立肿瘤RNAseq数据库,例如整合NCBI、Gtex、TCGA、Encode的公开多种细胞类型多组织的数据,按照以下方式进行数据重分析和归一化;
S6-2) 使用Cutadapt 3.4和FastQC 0.11.9进行所有原始下机数据的预处理;
S6-3) 使用STAR Aligner 2.7.9a进行数据的比对,参考基因组为hg38;
S6-4) 使用featureCounts v1.5.2计算所有n个RNA的read count;
S6-5) 根据FPKM公式计算每个RNA的表达值Fk;
S6-6) 使用R software的correlation参数,计算RP5-1091N2.9与其他人体RNA的相关性Corr值,并挑选Corr值>0.6的RNA进行下一步计算;
S6-7) 使用R software的topGO package和STRING软件(https://cn.string-db.org/),检查RP5-1091N2.9与其他Corr值>0.6的RNA所显著富集的通路是否有与免疫调节密切相关的通路,并确认这些通路的基因群形成明显的蛋白互作网络,同时需要确认6个辅助RNA的Corr值>0.6。如果满足以上所述,则认为该肿瘤RNA表达数据库构库成功;
S6-8) 根据样品的生存期信息,把数据库样品分成长生存期和短生存期两组。使用R software的survival package对数据库中的RP5-1091N2.9与其6个辅助RNA计算COX回归系数值Ci;
S7) 分别对生存期长样品和生存期短样品计算RScore值和TMB值,得到疗效判断的阈值。
肿瘤突变负荷TMB值计算方法如下:
肿瘤突变负荷TMB值可以按现有方法计算得到(www.ncbi.nlm.nih.gov/pmc/articles/PMC7710563/),或按如下方法计算:
S1) 获取基于高通量测序的肿瘤组织DNA测序数据(要求覆盖≥400个基因);
S2) 获取基于高通量测序的相应患者的外周血白细胞DNA测序数据(要求覆盖≥400个基因);
S3) 把肿瘤组织DNA+外周血白细胞DNA测序数据进行联合分析:
S4) 使用Cutadapt 3.4和FastQC 0.11.9进行测序数据的预处理;
S5) 使用bwa和samtools 进行数据的比对,参考基因组为hg38,得到外周血正常样品 bam 文件和肿瘤组织样品bam文件;
S6) 使用GATK进行碱基质量重新矫正,使用的软件和命令如下:
S7) 使用STRELKA2.8.2进行somatic snv和indel检测。使用命令如下configureStrelkaSomaticWorkflow.py --normalBam normal.bam --tumorBam tumor.bam --referenceFasta --runDir –disableEVS –reportEVSFeatures;
S8) 根据TMB定义计算每个样品的肿瘤突变负荷
RScore结果可以与TMB计算结果进行分值校正,两者共同预测为较好疗效的,才更应该被认同为疗效较好,可相互降低假阳性。RScore结果基于T细胞RNAseq计算,TMB基于DNAseq计算,确保在DNA和RNA两个层面同时对疗效进行预测。
实施例1:
建立肺鳞癌数据库,计算RP5-1091N2.9及关联蛋白的相关系数,获取疗效阈值
整合Gtex、Gencode、TCGA三个数据库中所有肺鳞癌LUSC样品的基因表达,按照FPKM(Fragment perkilometer, FPKM)的方法对表达量进行样品间和批次间校正,得到RP5-1091N2.9在各个样品的标准化表达量。
然后分析肺鳞癌中RP5-1091N2.9和6个辅助蛋白的表达量,表达量用log(FPKM)展示如图1。
通过R软件的correlation函数计算RP5-1091N2.9与其他人体蛋白的相关性(展示在下表中)。与RP5-1091N2.9高度正向相关(相关系数>0.6)的基因一共486个。
对486个基因进行Reactome富集分析。对486个相关系数>0.6的蛋白,进行Reactome功能富集分析,发现其功能显著,前5个显著富集通路都是免疫相关通路:ImmuneSystem、Adaptive Immune System、Immunoregulatory interactions between aLymphoid and a non-Lymphoid cell、Innate Immune System和Cytokine Signaling inImmune system。
注:使用的数据库为Reactome。
从表2前5个免疫富集通路Immune System、Adaptive Immune System、Immunoregulatory interactions between a Lymphoid and a non-Lymphoid cell、Innate Immune System和Cytokine Signaling in Immune system中挑选出与RP5-1091N2.9的共表达关系最强的基因,一共是如下6个,分别为CD2、CD48、CTSS、GMFG、 HLA-DMB、P2RY10 (图2~7)。
根据数据库样品的生存期信息,把数据库样品分成长生存期(Group-L)和短生存期(Group-S)两组。使用R software的survival package进行逐步回归分析,根据AIC值选取最优的回归方程,使用脚本如下:
library(survival)
cox <- coxph(Surv(futime, fustat) ~ ., data = rt)
cox=step(cox)
value <- predict(cox,type="risk",newdata=rt)
coxSummary=summary(cox)
table=as.data.frame(cbind(coxSummary$coefficients,coxSummary$
conf.int))
最终得到数据库中的RP5-1091N2.9与其6个辅助RNA计算COX回归系数值Ci,总结如表3。
根据技术路线所述,数据库构库成功。对数据库中生存期长样品和生存期短样品分别计算Rscore值和TMB值,得到阈值表(表4)。
实施例2:30例肺癌患者的RNA检测和治疗效果预测
收集30例肺癌患者的癌组织。
对30个癌组织样品进行如下操作:
制作免疫细胞悬浮液:按照EasySep™ Human T Cell Isolation Cocktail(货号:17951C) 和EasySep™ Dextran RapidSpheres™(货号:50103)的说明书进行操作,采用负选方式。
提取RNA:
直接在悬浮液中加入Trizol裂解细胞,加1ml Trizol.用取样器吹打几次(加Trizol前不要洗涤细胞,以免降解RNA)。将匀浆样品在15-30℃放置5mim,使得核酸蛋白复合物完全分离。4 ℃ 12 000rpm离心10min,取上清。加0.2ml氯仿,盖好管盖,在漩涡振荡器上震荡15s,室温放置3min。如不能涡旋混匀,可手动颠倒混匀2min代替。4 ℃ 12 000rpm,离心10-15min,样品会分成三层:红色的有机相,中间层和上层无色的水相,RNA主要在水相中,把水相(约600ul,约为所用Trizol试剂的60%)转移到新管中。在得到的水相溶液中加入等体积(500ul)的异丙醇,上下颠倒混匀,-20℃ 放置20-30min。4 ℃ 12 000rpm离心10min,去上清。加入1ml 75%乙醇(DEPC水处理过的水配制)洗涤沉淀。4 ℃ 12 000rpm离心5min,弃上清;短暂快速离心,用移液器小心吸弃上清,注意不要吸弃沉淀。室温放置晾干(不要晾得过干,RNA完全干燥后会很难溶解,大约晾干2-3min左右即可)。加入适量DEPC水(根据实验需要,可加30-100ul水)或0.5%SDS,用枪头吸打几次,充分溶解RNA。50℃保温1小时。
文库构建:
根据kapa建库试剂盒的说明书进行操作。试剂盒名称和货号为KAPA RNA-seq文库构建试剂盒+RiboErase核糖体RNA去除(人/大鼠/小鼠) (96个反应) KK货号KK8484,产品货号07962304001。对建立的RNA文库,用perkinelmer labchip微量芯片分析仪或者全自动核酸蛋白分析系统Qsep100进行文库质检,确保条带都在300bp范围附近。
以P001为例,把文库perkinelmer labchip微量芯片分析仪质检的具体出峰图结果展示如图8。30个文库的情况均类似,峰值条带都在300bp范围附近。
高通量测序:
使用illumina novaseq对上面质检过的30个RNA文库进行测序。测序量为20Mreads/样品。
数据分析:
使用Cutadapt 3.4和FastQC 0.11.9进行测序下机数据的预处理;
使用STAR Aligner 2.7.9a进行数据的比对,参考基因组为hg38;
使用featureCounts v1.5.2计算所有n个RNA的read count;
根据FPKM公式计算每个RNA的表达值F,并用R software的rank函数计算每个RNA的表达值在该样品n个RNA表达量中的秩R (Ci值);
提取RP5-1091N2.9及其6个辅助RNA的FPKM值(Fk),30个样品中的FPKM值展示如表6。
根据RP5-1091N2.9及其6个辅助RNA的Fk和Ci值,用以下公式计算疗效预测分值RScore;
30个患者的RScore计算结果如表5。根据实施例1数据库的判断,RScore疗效阈值为0.70 (RScore<0.70:疗效较好;RScore>0.70:疗效较差)。根据本计算方法,P001、P013、P019和P026被认为免疫治疗效果可能较好。
注:表中,Score-H表示预测免疫治疗疗效好,Score-L表示预测免疫治疗疗效差。
提取本实施例的30例患者的RP5-1091N2.9及其6个辅助RNA的FPKM值,把样品按照RP5-1091N2.9 的FPKM值分成两组:
1)RP5-1091N2.9 high expression组---大于RP5-1091N2.9平均FPKM值的样品组;
2)RP5-1091N2.9 low expression组---小于RP5-1091N2.9平均FPKM值的样品组;
然后根据两个组别样品的生存期信息,把数据库样品分成长生存期和短生存期两组。使用R software的survival package对数据库中的RP5-1091N2.9与其6个辅助RNA计算生存期差异p值。可见,如果单独使用这7个基因进行疗效预测并做生存分析,结果并不理想,P值均大于0.05,结果如图11~17所示。
实施例3:30例肺癌患者的RNA+DNA并行检测
1、同样的对实施例2相同的30例患者样品,进行RNA+DNA并行检测;
2、收集30例肺癌患者的癌组织*2和外周血*1。
3、对6个癌组织样品进行如下操作:
S1) 制作免疫细胞悬浮液:按照EasySep™ Human T Cell Isolation Cocktail(货号:17951C) 和EasySep™ Dextran RapidSpheres™(货号:50103)的说明书进行操作,采用负选方式。
S2) 提取RNA:直接在悬浮液中加入Trizol裂解细胞,加1ml Trizol.用取样器吹打几次(加Trizol前不要洗涤细胞,以免降解RNA)。将匀浆样品在15-30℃放置5mim,使得核酸蛋白复合物完全分离。4 ℃ 12 000rpm离心10min,取上清。加0.2ml氯仿,盖好管盖,在漩涡振荡器上震荡15s,室温放置3min。如不能涡旋混匀,可手动颠倒混匀2min代替。4 ℃ 12000rpm,离心10-15min,样品会分成三层:红色的有机相,中间层和上层无色的水相,RNA主要在水相中,把水相(约600ul,约为所用Trizol试剂的60%)转移到新管中。在得到的水相溶液中加入等体积(500ul)的异丙醇,上下颠倒混匀,-20℃ 放置20-30min。4 ℃ 12 000rpm离心10min,去上清。加入1ml 75%乙醇(DEPC水处理过的水配制)洗涤沉淀。4 ℃ 12 000rpm离心5min,弃上清;短暂快速离心,用移液器小心吸弃上清,注意不要吸弃沉淀。室温放置晾干(不要晾得过干,RNA完全干燥后会很难溶解,大约晾干2-3min左右即可)。加入适量DEPC水(根据实验需要,可加30-100ul水)或0.5%SDS,用枪头吸打几次,充分溶解RNA。50℃保温1小时。
S3) RNA文库构建:根据kapa建库试剂盒的说明书进行操作。试剂盒名称和货号为KAPA RNA-seq文库构建试剂盒+RiboErase核糖体RNA去除(人/大鼠/小鼠) (96个反应) KK货号KK8484,产品货号07962304001。
S4) 高通量测序:使用illumina novaseq对去核糖体RNA(rRNA)处理后的总RNA样本进行测序。
S5) 数据分析:
S5-1) 使用Cutadapt 3.4和FastQC 0.11.9进行测序下机数据的预处理;
S5-2)使用STAR Aligner 2.7.9a进行数据的比对,参考基因组为hg38;
S5-3)使用featureCounts v1.5.2计算RNA的read count;
S5-4)使用DESeq2 v1.30.1计算差异表达值;
S5-5)提取RP5-1091N2.9及其6个辅助RNA的Fk值和Ci值,用以下公式计算疗效预测分值RScore;
4、继续对30个癌组织样品进行如下操作:
S1) 提取DNA:根据石蜡包埋组织DNA快速提取试剂盒(天根生化,货号DP330-02)的说明书进行操作。
S2) DNA文库构建:根据kapa建库试剂盒的说明书进行操作。试剂盒名称为KAPADNA HyperPrep 文库构建试剂盒,货号KK8504。
S3) 特定基因区域捕获:按照IDT xGen® Exome Research Panel或者其他区域捕获试剂盒的说明书进行操作,要求捕获基因数>400个。
S4) 对建立的肿瘤DNA文库,30个文库均用perkinelmer labchip微量芯片分析仪质检,具体出峰图与实施例2类似,30个样品总体情况如图9所示,峰值条带都在300bp范围附近。
S5) 高通量测序:使用illumina novaseq对DNA文库进行测序。
5、对30个外周血样品进行如下操作:
S1) 分离血液白细胞层;
S2) 提取DNA:根据血液/细胞/组织基因组DNA提取试剂盒(天根生化,货号DP304-02)的说明书进行操作。
S3) DNA文库构建:根据kapa建库试剂盒的说明书进行操作。试剂盒名称为KAPADNA HyperPrep 文库构建试剂盒,货号KK8504。
S4) 特定基因区域捕获:按照IDT xGen® Exome Research Panel或者其他区域捕获试剂盒的说明书进行操作,要求捕获基因数>400个。文库如实施例2和肿瘤组织一样,也用labchip进行文库质检,通过后进行高通量测序。
S5) 高通量测序:使用illumina novaseq对DNA文库进行测序。
、每个患者的肿瘤突变负荷计算:
S1) 把第3步和第4步的测序数据进行联合分析:
i.使用Cutadapt 3.4和FastQC 0.11.9进行测序下机数据的预处理;
ii. 使用bwa和samtools 进行数据的比对,参考基因组为hg38;
iii. 使用bamdst 1.0.9软件进行捕获区域的捕获质量鉴定---计算基因覆盖数,捕获特异性等参数,以P001的肿瘤组织和外周血的测序结果为例,TargetRegion为400肿瘤基因,展示结果如表7;
iv. 使用GATK进行somatic snv和indel检测;
v. 根据TMB定义计算每个样品的肿瘤突变负荷(TMB被定义为每百万碱基中被检测出的somatic snv和indel总数,公式如下)
S2) 30个患者的肿瘤突变负荷计算结果如表8。根据实施例1数据库的判断,单纯依据TMB进行判断的疗效阈值为15(TMB≥15:TMB-High疗效较好;TMB<15:TMB-L疗效较差)。
表8、30例患者的肿瘤突变负荷TMB计算结果
注:表中,TMB-High表示预测免疫治疗疗效好,TMB-L表示预测免疫治疗疗效差。
与实施例2的计算结果进行整合,只有同时满足Rscore<0.70和TMB≥15的样品,才能在DNA和RNA两个层面同时判定为疗效较好。因此只有P001和P026两个样品被认为可推荐使用免疫治疗。
后期经临床追踪反馈,这两个患者的免疫治疗效果均好于其他28个患者,图10是30个患者的生存期信息,具有显著差异性(t检验,P.value=5.451E-07)。
以上是对本发明所作的进一步详细说明,不可视为对本发明的具体实施的局限。对于本发明所属技术领域的普通技术人员来说,在不脱离本发明构思的简单推演或替换,都在本发明的保护范围之内。
Claims (8)
1.用于预测肺鳞癌患者免疫疗效的标志物,其特征在于:由长链非编码RNA RP5-1091N2.9、CD48、P2RY10、CD2、CTSS、GMFG和HLA-DMB组成。
2.定量长链非编码RNA RP5-1091N2.9、CD48、P2RY10、CD2、CTSS、GMFG和HLA-DMB表达量的试剂在制备预测肺鳞癌患者免疫疗效试剂中的应用。
3.一种用于预测肺鳞癌患者免疫疗效的系统,其特征在于:包括:
长链非编码RNA定量装置:用于确定样本中长链非编码RNA RP5-1091N2.9、CD48、P2RY10、CD2、CTSS、GMFG和HLA-DMB表达量;
免疫疗效预测装置:基于样本中长链非编码RNA RP5-1091N2.9、CD48、P2RY10、CD2、CTSS、GMFG和HLA-DMB表达量,预测肺鳞癌患者免疫疗效;
结果输出装置:用于输出免疫疗效预测装置分析得到的预测结果;
所述免疫疗效预测装置的计算方法包括:
根据FPKM公式计算每个RNA的表达值Fk;
根据公开免疫治疗疗效数据确定RP5-1091N2.9、CD48、P2RY10、CD2、CTSS、GMFG和HLA-DMB表达量与生存期的COX回归系数值Ci;
根据以下公式计算疗效预测分值Rscore:
基于疗效预测分值Rscore确定免疫疗效。
4.根据权利要求3所述的系统,其特征在于:所述样本为患者的肿瘤组织和/或外周血;和/或
所述长链非编码RNA定量装置选自高通量测序装置、RNA定量芯片、RNA qPCR定量装置。
5.根据权利要求4所述的系统,其特征在于:使用R software的survival package确定RP5-1091N2.9、CD48、P2RY10、CD2、CTSS、GMFG和HLA-DMB表达量与生存期的COX回归系数值Ci。
6.根据权利要求5所述的系统,其特征在于:Rscore≤0.70,判定为肺鳞癌患者免疫治疗疗效好;Rscore>0.70时,判定为肺鳞癌患者免疫治疗疗效差。
7.根据权利要求6所述的系统,其特征在于:还包括结合肿瘤突变负荷TMB值确定免疫疗效。
8.根据权利要求7所述的系统,其特征在于:肿瘤突变负荷TMB值≥15,判定为肺鳞癌患者免疫治疗疗效好;肿瘤突变负荷TMB值<15时,判定为肺鳞癌患者免疫治疗疗效差。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210448091.XA CN114540504B (zh) | 2022-04-27 | 2022-04-27 | 用于预测肺鳞癌患者免疫疗效的标志物组及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210448091.XA CN114540504B (zh) | 2022-04-27 | 2022-04-27 | 用于预测肺鳞癌患者免疫疗效的标志物组及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114540504A CN114540504A (zh) | 2022-05-27 |
CN114540504B true CN114540504B (zh) | 2022-07-08 |
Family
ID=81666806
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210448091.XA Active CN114540504B (zh) | 2022-04-27 | 2022-04-27 | 用于预测肺鳞癌患者免疫疗效的标志物组及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114540504B (zh) |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2005100998A2 (en) * | 2004-04-16 | 2005-10-27 | Europroteome Ag | Membrane markers for use in cancer diagnosis and therapy |
EP2390358A1 (en) * | 2006-06-02 | 2011-11-30 | GlaxoSmithKline Biologicals S.A. | Method for identifying whether a patient will be responder or not to immunotherapy based on the differential expression of the GZMK gene |
US20140329704A1 (en) * | 2013-03-28 | 2014-11-06 | President And Fellows Of Harvard College | Markers for mature beta-cells and methods of using the same |
GB201316024D0 (en) * | 2013-09-09 | 2013-10-23 | Almac Diagnostics Ltd | Molecular diagnostic test for lung cancer |
-
2022
- 2022-04-27 CN CN202210448091.XA patent/CN114540504B/zh active Active
Also Published As
Publication number | Publication date |
---|---|
CN114540504A (zh) | 2022-05-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Jenkins et al. | A low-frequency variant at 8q24. 21 is strongly associated with risk of oligodendroglial tumors and astrocytomas with IDH1 or IDH2 mutation | |
Olsen et al. | Fine mapping of a QTL on bovine chromosome 6 using imputed full sequence data suggests a key role for the group-specific component (GC) gene in clinical mastitis and milk production | |
Coto‐Segura et al. | Common and rare CARD14 gene variants affect the antitumour necrosis factor response among patients with psoriasis | |
Qin et al. | Comprehensive characterization of functional eRNAs in lung adenocarcinoma reveals novel regulators and a prognosis-related molecular subtype | |
Guo et al. | MicroRNA variants and HLA-miRNA interactions are novel rheumatoid arthritis susceptibility factors | |
Bai et al. | Clinical significance of lnc-AC145676. 2.1-6 and lnc-TGS1-1 and their variants in western Chinese tuberculosis patients | |
Glotov et al. | Targeted sequencing analysis of ACVR2A gene identifies novel risk variants associated with preeclampsia | |
EP4305200A1 (en) | Detecting the presence of a tumor based on off-target polynucleotide sequencing data | |
Liao et al. | Identification of early and intermediate biomarkers for ARDS mortality by multi-omic approaches | |
Du et al. | A comparative study on the mechanisms of innate immune responses in mice induced by Alum and Actinidia eriantha polysaccharide | |
Kang et al. | Characterizing intrinsic molecular features of the immune subtypes of salivary mucoepidermoid carcinoma | |
Magalhães et al. | Human leukocyte antigen (HLA) and single nucleotide polymorphisms (SNPs) tumor necrosis factor (TNF)‐alpha‐238 and‐308 as genetic markers of susceptibility to psoriasis and severity of the disease in a long‐term follow‐up Brazilian study | |
Tong et al. | Complement system-related genes in stomach adenocarcinoma: Prognostic signature, immune landscape, and drug resistance | |
CN114540504B (zh) | 用于预测肺鳞癌患者免疫疗效的标志物组及系统 | |
Jian et al. | Next generation sequencing targeted detection of somatic mutations in patients with mucinous adenocarcinoma of the appendix | |
JP2025019066A (ja) | 癌の免疫療法のための複合バイオマーカー | |
Zhang et al. | A novel three-microRNA signature for predicting survival in patients with nasopharyngeal carcinoma | |
Wallace et al. | Genetics in ocular inflammation—basic principles | |
Liu et al. | Whole exome sequencing identifies putative predictors of recurrent prostate cancer with high accuracy | |
Yang et al. | Identification of epigenetic modifications that contribute to pathogenesis in therapy-related AML: Effective integration of genome-wide histone modification with transcriptional profiles | |
Li et al. | Identification of genes involved in energy metabolism in preeclampsia and discovery of early biomarkers | |
Braga et al. | Association between polymorphisms in TLR3, TICAM1 and IFNA1 genes and covid-19 severity in Southern Brazil | |
Kohailan et al. | Two SNPs in the promoter region of Toll-like receptor 4 gene are not associated with smoking in Saudi Arabia | |
Li et al. | Integrative multi-omics analysis reveals a novel subtype of hepatocellular carcinoma with biological and clinical relevance | |
Luo et al. | Identification of a apoptosis-related LncRNA signature to improve prognosis prediction and immunotherapy response in lung adenocarcinoma patients |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
TR01 | Transfer of patent right |
Effective date of registration: 20220727 Address after: 510515, No. 1838, Guangzhou Avenue, Baiyun District, Guangdong, Guangzhou Patentee after: NANFANG HOSPITAL, SOUTHERN MEDICAL University Patentee after: GUANGZHOU WANDE GENE MEDICAL TECHNOLOGY Co.,Ltd. Address before: 510700 floor 6, building D, No. 188, Kaiyuan Avenue, Guangzhou high tech Industrial Development Zone, Huangpu District, Guangzhou, Guangdong Patentee before: GUANGZHOU WANDE GENE MEDICAL TECHNOLOGY Co.,Ltd. |
|
TR01 | Transfer of patent right |