CN119546782A - 高风险鼻咽癌的检测方法 - Google Patents
高风险鼻咽癌的检测方法 Download PDFInfo
- Publication number
- CN119546782A CN119546782A CN202380042138.5A CN202380042138A CN119546782A CN 119546782 A CN119546782 A CN 119546782A CN 202380042138 A CN202380042138 A CN 202380042138A CN 119546782 A CN119546782 A CN 119546782A
- Authority
- CN
- China
- Prior art keywords
- cancer
- subject
- risk
- fgf2
- biomarkers
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- C—CHEMISTRY; METALLURGY
- C40—COMBINATORIAL TECHNOLOGY
- C40B—COMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
- C40B40/00—Libraries per se, e.g. arrays, mixtures
- C40B40/04—Libraries containing only organic compounds
- C40B40/06—Libraries containing nucleotides or polynucleotides, or derivatives thereof
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K45/00—Medicinal preparations containing active ingredients not provided for in groups A61K31/00 - A61K41/00
- A61K45/06—Mixtures of active ingredients without chemical characterisation, e.g. antiphlogistics and cardiaca
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6876—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
- C12Q1/6883—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
- C12Q1/6886—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/435—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
- C07K14/46—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates
- C07K14/47—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals
- C07K14/4701—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals not used
- C07K14/472—Complement proteins, e.g. anaphylatoxin, C3a, C5a
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/435—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
- C07K14/475—Growth factors; Growth regulators
- C07K14/50—Fibroblast growth factor [FGF]
- C07K14/503—Fibroblast growth factor [FGF] basic FGF [bFGF]
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/118—Prognosis of disease development
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2600/00—Oligonucleotides characterized by their use
- C12Q2600/158—Expression markers
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y306/00—Hydrolases acting on acid anhydrides (3.6)
- C12Y306/05—Hydrolases acting on acid anhydrides (3.6) acting on GTP; involved in cellular and subcellular movement (3.6.5)
Landscapes
- Chemical & Material Sciences (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Organic Chemistry (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Wood Science & Technology (AREA)
- Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Biochemistry (AREA)
- Zoology (AREA)
- Medicinal Chemistry (AREA)
- Immunology (AREA)
- Molecular Biology (AREA)
- Pathology (AREA)
- Genetics & Genomics (AREA)
- Analytical Chemistry (AREA)
- Oncology (AREA)
- Pharmacology & Pharmacy (AREA)
- Biophysics (AREA)
- Epidemiology (AREA)
- Biotechnology (AREA)
- Microbiology (AREA)
- Animal Behavior & Ethology (AREA)
- Physics & Mathematics (AREA)
- Hospice & Palliative Care (AREA)
- Veterinary Medicine (AREA)
- Public Health (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- Chemical Kinetics & Catalysis (AREA)
- General Chemical & Material Sciences (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
本发明总的涉及肿瘤学领域。本文提供的是一种预测受试者癌症复发或预后可能性的方法,包括将从受试者获得的样本中选自由成纤维细胞生长因子2(FGF2)、补体成分3(C3)和GTP酶、IMAP家族成员7(GIMAP7)组成的组中的一个或多个生物标志物的表达水平与参照进行比较。特别地,癌症是鼻咽癌。还提供包括多个DNA/RNA复合物的组合物或固相支持物,其中,多个DNA/RNA复合物中的每个DNA/mRNA复合物包含生物标志物和与生物标志物杂交的第一和第二DNA探针,其中,多个DNA/mRNA复合物包含选自由FGF2、C3和GIMAP7组成的组中的一个或多个生物标志物。
Description
【技术领域】
本发明总的涉及肿瘤学领域。本文提供一种用于检测和分类鼻咽癌的检测方法。
【背景技术】
鼻咽癌(NPC)是一种发生在鼻咽的癌症。虽然NPC在美国很少见,但它在世界其他地区经常发生,例如中国南部和东南亚。它是新加坡中年男性第二常见的癌症。NPC的其他风险因素包括接触EB病毒或过量饮酒。这种癌症很难早期发现,并且疾病复发率很高,约为30%至40%。此外,治疗选择有限,并且通常与显著的发病率相关。目前无分子方法可以准确识别复发风险高的患者。
期望克服或改善上述问题中的至少一个,或者至少提供一个有用的替代方案。
【发明概要】
本文公开的是一种预测癌症在受试者中复发可能性的方法,该方法包括将从受试者获得的样本中选自由成纤维细胞生长因子2(FGF2)、补体成分3(C3)和GTP酶、IMAP家族成员7(GIMAP7)组成的组中的一个或多个生物标志物的表达水平与参照进行比较,其中,与参照相比,一个或多个生物标志物中表达水平的变化或由其得出的值预测受试者中癌症复发的可能性。
本文公开的是一种确定受试者中癌症预后的方法,该方法包括将从受试者获得的样本中选自由FGF2、C3和GIMAP7组成的组中一个或多个生物标志物的表达水平与参照进行比较,其中,与参照相比,一个或多个生物标志物中表达水平的变化或由其得出的值表明受试者可能患有高风险癌症或低风险癌症。
本文公开的是一种在受试者中治疗癌症的方法,该方法包括:(a)将从受试者获得的样本中选自由FGF2、C3和GIMAP7组成的组中一个或多个生物标志物的表达水平与参照进行比较,其中,与参照相比,一个或多个生物标志物中表达水平的变化或由其得出的值表明受试者可能患有高风险癌症;及(b)对被发现可能患有高风险癌症的受试者施用抗癌剂和/或放射治疗。
在一个实施方案中,被发现可能患有高风险癌症的受试者将被更密切地随访。受试者可以接受进一步治疗以降低癌症复发的风险。例如,受试者可能被施用二线抗癌剂。受试者还可以接受针对FGF2和FGFR的靶向治疗。受试者也可以接受免疫疗法或抗血管内皮生长因子疗法。
本文还公开了将受试者分级为患有高风险或低风险癌症的人的方法,该方法包括将从受试者获得的样本中选自由FGF2、C3和GIMAP7组成的组中一个或多个生物标志物的表达水平与参照进行比较,其中,与参照相比,一个或多个生物标志物中表达水平的变化或由其得出的值将受试者分为患有高风险或低风险癌症的受试者。
本文公开的是一种组合物或固相支持物,其包含多个DNA/mRNA复合物,其中,多个DNA/mRNA复合物中的每个DNA/mRNA复合物包含生物标志物以及与生物标志物杂交的第一和第二DNA探针,其中:第一探针为捕获探针;第二探针为报告探针;生物标志物是mRNA转录本;并且多个DNA/mRNA复合物包含选自由FGF2、C3和GIMAP7组成的组中的一个或多个生物标志物。
【附图简述】
下面仅通过非限制性示例来描述本发明的实施例,并参照附图,其中:
图1(a)在发现队列中微解剖的肿瘤上皮区室中差异表达基因的热图,其比较最终复发的原发性NPC肿瘤和未复发的肿瘤(n=34个基因表达文库)。(b)无监督分级聚类表明,三个基因特征在发现队列中准确分类了复发的肿瘤和未复发的肿瘤。
图2(a)无监督分级聚类表明,这三个基因特征根据它们在第一个验证队列中对发展为复发性疾病的风险特征定义了肿瘤簇。(b)来自三个基因特征的风险评分显示,与未复发的肿瘤相比,复发的肿瘤具有更高的风险评分。(c)基于Kaplan-Meier曲线图的生存分析显示,与风险评分较低的肿瘤患者相比,风险评分较高的肿瘤患者具有更差的无病生存率。
图3(a)无监督分级聚类表明,这三个基因特征根据它们在第二验证队列中对发展为复发性疾病的风险特征定义了肿瘤簇。(b)来自三个基因特征的风险评分显示,与未复发的肿瘤相比,复发的肿瘤具有更高的风险评分。(c)基于Kaplan-Meier曲线图的生存分析显示,与风险评分较低的肿瘤患者相比,风险评分较高的肿瘤患者具有更差的无病生存率。
图4(a)细胞迁移测定(划痕测定)的代表性图像显示与对照相比,在含有5ng/mlFGF2的培养基中,C666-1细胞迁移增加。(b)定量同一细胞迁移试验的迁移到受伤区域的细胞。(c)细胞侵袭试验显示,与对照相比,与含有FGF2的培养基一起孵育时,C666-1细胞的侵袭增加。
【发明详述】
本说明书介绍了一种预测受试者中癌症复发可能性的方法。
本文公开的是一种预测癌症在受试者中复发可能性的方法,该方法包括将从受试者获得的样本中选自由FGF2、C3和GIMAP7组成的组中的一个或多个生物标志物的表达水平与参照进行比较,其中,与参照相比,一个或多个生物标志物中表达水平的变化或由其得出的值预测受试者中癌症复发的可能性。
不受理论的束缚,本发明人开发了一种显微解剖的基因表达分类器,该分类器在不同的量化基因表达(大量或显微解剖)的方法中表现稳健。这里确定的基因具有生物学相关性。FGF2是一种潜在可操作的蛋白质,因为已经在靶向该通路的其他实体器官癌症中进行了临床试验。FGFR抑制剂也已获准用于其他癌症的临床应用。C3是参与先天免疫的补体途径的关键成员,而GIMAP GTP酶也是潜在靶向的关键免疫介质。
术语“生物标志物”是指反映生理和/或病理生理状态的存在或性质(例如,严重程度)的可测量特征,包括发展为特定生理或病理生理状态(例如癌症)的风险的指标。生物标志物可能存在于在生理或病理生理状态(包括其症状)开始之前从受试者获得的样本中。因此,从受试者获得的样本中存在生物标志物可能表明受试者出现生理或病理生理状态或其症状的风险增加。或者,或者另外,生物标志物可以在个体中正常表达,但其表达可能会发生变化(即,在生理或病理生理状态(包括其症状)开始之前增加(上调;过度表达)或减少(下调;表达不足)。因此,生物标志物表达水平的变化可能表明受试者发展生理或病理生理状态或其症状的风险增加。
生物标志物包括例如基因表达产物,包括mRNA转录本和肽或来自基因表达的蛋白质、代谢物等。可以理解,将基因称为生物标志物(在本文中有时也称为生物标志物基因)意味着该基因的产物是生物标志物,即mRNA转录本和/或来自生物标志物基因表达的蛋白质是生物标志物。因此,例如,将FGF2作为生物标志物是指来自FGF2基因的mRNA转录本和/或来自FGF2基因表达的蛋白质。如本文所述,引用生物标志物的表达包括生物标志物的浓度、水平或活性,例如mRNA转录本的浓度或水平或蛋白质的浓度、水平或活性。例如,当生物标志物是一种酶时,其表达可以通过酶在已知底物上的活性水平来确定或测量。
与基因有关的术语“表达”是指基因的转录以产生RNA转录本(例如,mRNA、反义RNA、siRNA、shRNA、miRNA等)以及酌情将所得的mRNA转录本翻译成蛋白质。因此,从上下文中可以清楚地看出,编码序列的表达是由编码序列的转录和翻译产生的。相反,非编码序列的表达是由非编码序列的转录产生的。
本文使用术语“表达产物”或“基因表达产物”或“基因产物”来指代基因的RNA转录产物(转录本),包括mRNA,以及此类RNA转录本的多肽翻译产物。表达产物可以是,例如,未剪接的RNA、mRNA、剪接变体mRNA、microRNA、片段化的RNA、多肽、翻译后修饰的多肽、剪接变体多肽等。
本文使用的术语“基因”是指细胞基因组的任何和所有离散编码区,以及相关的非编码区和调节区。术语“基因”也是指参与表达调控的编码特定多肽的开放阅读框、内含子和相邻的5'和3'非编码核苷酸序列。在这方面,该基因可以进一步包含与给定基因天然相关的控制信号(例如启动子、增强子、终止和/或多聚腺苷酸化信号),或异源控制信号。DNA序列可以是cDNA或基因组DNA或其片段。该基因可以被引入合适的载体中,用于染色体外的维持或整合到宿主中。
如本文所用术语“水平”和“量”可以互换使用,以指代定量的量(例如,重量或摩尔或数量)、半定量的量、相对量(例如,类别或比率内的重量%或摩尔%)、浓度等。因此,就生物标志物的数量或水平而言,这些术语包括样本中生物标志物的绝对或相对数量或浓度,包括生物标志物水平的比率,以及水平的比值比或比值比的比率。水平或数量也可以反映单个受试者或受试者队列,后者表示为平均值或中等水平。
本文使用的术语“核酸”或“多核苷酸”是指mRNA、RNA、cRNA、cDNA或DNA。该术语通常是指长度至少为10个碱基的核苷酸的聚合物形式,可以是核糖核苷酸或脱氧核苷酸,也可以是任一类型核苷酸的修饰形式。该术语包括DNA或RNA的单链和双链形式。“蛋白质”、“多肽”和“肽”在本文中也可以互换使用,以指代氨基酸残基的聚合物以及它们的变体和合成类似物。
如本文所用,“获得”是指变得拥有。例如,对获取生物标志物特征的引用可以包括拥有已经生成的特征,例如通过从计算机或数据库获得特征,以及通过评估相关生物标志物来生成特征。在另一个示例中,获取样本(例如生物样本)可以包括拥有已经从受试者身上采集的样本,以及主动从受试者那里采集样本。
在一个实施方案中,该方法包括检测一个或多个生物标志物的水平。一种或多种生物标志物的水平可以通过本领域公知的技术(例如RNA测序)来检测。在一个实施方案中,该方法包括比较FGF2、C3或GIMAP7的水平,或由其组成。在一个实施方案中,该方法包括比较FGF2和C3的水平,或由其组成。在一个实施方案中,该方法包括比较FGF2和GIMAP7的水平,或由其组成。在一个实施方案中,该方法包括比较C3和GIMAP7的水平,或由其组成。在一个实施方案中,该方法包括比较FGF2、C3和GIMAP7的水平,或由其组成。
本文公开的是一种确定受试者中癌症预后的方法,该方法包括将从受试者获得的样本中选自由FGF2、C3和GIMAP7组成的组中一个或多个生物标志物的表达水平与参照进行比较,其中,与参照相比,一个或多个生物标志物中表达水平的变化或由其得出的值表明受试者可能患有高风险癌症或低风险癌症。
本文所指的术语“预后”是指对临床状况或疾病的可能过程和结果的预测。患者的预后通常是通过评估表明疾病有利或不利病程或结果的疾病因素或症状来做出的。本文使用的短语“确定预后”是指熟练的技术人员可以预测患者病情的进程或结果的过程。术语“预后”并不是指以100%的准确率预测病情的进程或结果的能力。相反,熟练的技术人员会明白,术语“预后”是指某个过程或结果发生的可能性增加;也就是说,与那些无表现出该病症的个体相比,表现出特定病症的患者更有可能发生病程或结果。预后可以表示为患者的预期生存时间。或者,预后可能是指疾病进入缓解期的可能性或疾病可预期的保持在缓解期的时间。预后可以用多种方式表达;例如,预后可以表示为患者在一年、五年、十年或类似时间后存活的百分比几率。或者,预后可以表示为患者因某种病症或疾病而可以预期存活的平均月数。患者的预后可能被认为是相对主义的表现,许多因素会影响最终结果。例如,对于患有某些疾病的患者,预后可以适当地表示为某种疾病可能可治疗或可治愈的可能性,或者疾病进入缓解期的可能性,而对于病情更严重的患者,预后可能更恰当地表示为在特定时间段内生存的可能性。
本文使用的术语“肿瘤”是指任何肿瘤细胞的生长和增殖,无论是恶性的还是良性的,以及所有癌前和癌的细胞和组织。术语“癌症”和“癌症的”是指或描述哺乳动物的生理状况,其典型特征部分是细胞生长不受调节。本文使用的术语“癌症”是指非转移性和转移性癌症,包括早期和晚期癌症。术语“癌前”是指通常在癌症之前或发展成癌症的病症或生长。“非转移性”是指良性癌症或保留在原发部位且未渗透到淋巴系统或血管系统或原发部位以外的组织的癌症。一般来说,非转移性癌症是指任何0期、I期或II期癌症,偶尔是III期癌症。“早期癌症”是指非侵袭性或转移性癌症,或被归类为0、I或II期癌症的癌症。术语“晚期癌症”通常是指III期或IV期癌症,但也可以指II期癌症或II期癌症的亚期。本领域技术人员会认识到,将II期癌症分类为早期癌症或晚期癌症取决于癌症的特定类型。癌症的示例包括但不限于神经胶质瘤、乳腺癌、前列腺癌、卵巢癌、宫颈癌、胰腺癌、结直肠癌、肺癌、肝细胞癌、胃癌、肝癌、膀胱癌、尿路癌、甲状腺癌、肾癌、癌、黑色素瘤、脑癌、非小细胞肺癌、头颈部鳞状细胞癌、子宫内膜癌、多发性骨髓瘤、直肠癌和食管癌。在一个实施方案中,癌症是鼻咽癌(NPC)。在一个实施方案中,癌症是转移性癌症。在一个实施方案中,癌症是转移性鼻咽癌(NPC)。
术语“受试者”、“个体”和“患者”-在本文中可互换使用,意在指代任何受试者,优选为哺乳动物受试者,并且更优选仍然是人受试者。哺乳动物受试者包括人、家畜、农场动物、运动动物和动物园动物,例如,包括人、非人灵长类动物、狗、猫、小鼠、大鼠、豚鼠等。在一些实施方案中,受试者患有或疑似患有鼻咽癌(NPC)。
如本文所用,术语“样本”在其最广泛的意义上使用。从某种意义上说,它意味着包括从任何来源获得的标本或培养物,以及生物和环境样本。生物样品可以从动物(包括人)中获得,包括液体、固体、组织和气体。生物样品包括血液制品,如血浆、血清等。然而,此类例子不能解释为限制适用于本公开的样本类型。
样品可以是生物样品,它指的是它是来源于或获得自活生物体的事实。生物体可以是体内的(例如整个生物体),也可以是体外的(例如,在培养物中生长的细胞或器官)。“生物样本”也是指来自受试者的细胞或细胞群或一定数量的组织或液体。大多数情况下,样本已从受试者中取出,但术语“生物样本”也可以指在体内分析的细胞或组织,即无从受试者中取出。通常,“生物样本”包含来自受试者的细胞,但该术语也可以指非细胞生物材料,例如血液、唾液或尿液的非细胞成分。生物样本可能来自原发性、继发性或转移性肿瘤的切除、支气管镜活检或空芯针穿刺活检,或来自胸腔积液的细胞块。此外,细针抽吸生物样品也很有用。在一个实施方案中,生物样品是腹水。生物样品还包括来自患者组织的外植体和原代和/或转化的细胞培养物。生物样本可以通过从受试者中取出细胞样本来提供,但也可以使用先前分离的细胞或细胞提取物(例如,由另一个人、其他时间和/或用于其他目的分离)来实现。也可以使用存档组织,例如有治疗或结果史的组织。生物样品包括但不限于组织活检、刮擦(例如口腔刮擦)、全血、血浆、血清、尿液、唾液、细胞培养物或脑脊液。在一个实施方案中,所述样品是组织样品。组织样本可以是新鲜组织、冷冻组织或石蜡包埋的福尔马林固定(FFPE)组织样本。在一个实施方案中,通过显微解剖获得组织样本。在一个实施方案中,通过激光捕获显微切割获得样本。
生物样品可以在收集后几乎立即进行评估生物标志物的处理和分析(即,作为新鲜样品),或者可以将其储存起来以供后续分析。如果希望或需要储存生物样品,本领域技术人员可以理解,理想情况下,应将在保持样品中感兴趣生物标志物完整性的条件下储存(例如,在-80℃下)。
生物标志物的评估可以包括引用的基因表达的mRNA的水平和/或引用的基因表达的蛋白质的水平的评估。测量表达产物(如转录本和蛋白质)的方法为本领域技术人员所熟知,下面描述了一些说明性示例。
基于核酸的测定是本领域熟知的,并且包括低通量和高通量测定。在基于核酸的说明性测定中,根据标准方法从生物样品中包含的细胞中分离核酸(Sambrook, et al.,1989, supra;和Ausubel et al., 1994, supra)。核酸通常是分级的(例如,poly A+RNA)或全细胞RNA。当RNA用作检测对象时,可能需要将RNA转化为互补DNA。在一些实施方案中,核酸通过模板依赖性核酸扩增技术进行扩增。许多模板依赖性过程可用于扩增给定模板样品中存在的生物标志物序列。聚合酶链式反应(简称PCR)就是一个典型的核酸扩增技术,在美国专利第4,683,195、4,683,202和4,800,159号,Ausubel等人(上述)和Innis等人(“PCRProtocols”, Academic Press, Inc., San Diego Calif., 1990)中有详细描述。简而言之,在PCR中,制备了两个引物序列,它们与生物标志物序列的相反互补链上的区域互补。将过量的脱氧核苷酸三磷酸与DNA聚合酶(例如Taq聚合酶)一起添加到反应混合物中。如果样品中存在同源生物标志物序列,引物将与生物标志物结合,聚合酶将通过添加核苷酸导致引物沿生物标志物序列延伸。通过升高和降低反应混合物的温度,延伸的引物将从生物标志物上解离形成反应产物,过量的引物将与生物标志物和反应产物结合,并重复该过程。可以进行逆转录酶PCR扩增程序,以定量扩增的mRNA量。将RNA逆转录成cDNA的方法是众所周知的,并在上述Sambrook等人1989中描述。逆转录的替代方法利用热稳定的RNA依赖性DNA聚合酶。这些方法在WO 90/07641中进行了描述。聚合酶链式反应方法在本领域中是众所周知的。
在某些实施方案中,模板依赖性扩增涉及转录本的实时定量。例如,可以使用实时PCR技术对RNA或DNA进行定量(Higuchi et al., Biotechnology 10: 413-417, 1992)。通过测定已完成相同循环次数且处于线性范围内的PCR反应中靶DNA扩增产物的浓度,可以确定原始DNA混合物中特定靶序列的相对浓度。如果DNA混合物是从不同组织或细胞中分离的RNA合成的cDNA,则可以确定相应组织或细胞的靶序列衍生的特异性mRNA的相对丰度。PCR产物浓度与相对mRNA丰度之间的这种直接比例仅在PCR反应的线性范围内是正确的。曲线平台部分目标DNA的最终浓度由反应混合物中试剂的可用性决定,与目标DNA的原始浓度无关。在具体实施方案中,采用多重串联PCR(MT-PCR),它使用两步过程对少量RNA或DNA进行基因表达表征,例如在美国专利申请第20070190540号中描述的。在第一步中,将RNA转化为cDNA并使用多重基因特异性引物进行扩增。在第二步中,通过实时PCR对每个单独的基因进行定量。
在某些实施方案中,使用印迹技术对靶核酸进行定量,这是本领域技术人员所熟知的。DNA印迹涉及使用DNA作为靶标,而RNA印迹涉及使用RNA作为靶标。每种方法都提供了不同类型的信息,尽管cDNA印迹在许多方面类似于印迹或RNA种类。简而言之,探针用于靶向已固定在合适基质(通常是硝酸纤维素过滤器)上的DNA或RNA种类。应在空间上将不同的种类分开,以便于分析。这通常是通过对核酸物质进行凝胶电泳,然后“印迹”到过滤器上来完成的。随后,在促进变性和再杂交的条件下,将印迹的靶标与探针(通常标记)一起孵育。由于探针设计为与靶标进行碱基配对,因此探针将在复性条件下结合靶序列的一部分。然后去除未结合的探针,并如上所述完成检测。在检测/定量之后,可以将在给定受试者中看到的结果与此处定义的对照反应或具有统计学意义的参照组或对照受试者群体进行比较。
还考虑了基于生物芯片的技术,例如Hacia等人(1996,Nature Genetics 14:441-447)和Shoemaker等人(1996,Nature Genetics 14:450-456)所描述的技术。简而言之,这些技术涉及快速准确地分析大量基因的定量方法。通过用寡核苷酸标记基因或使用固定探针阵列,可以采用生物芯片技术将目标分子分离为高密度阵列,并在杂交的基础上筛选这些分子。另见Pease 等人(1994,Proc. Natl. Acad. Sci. U.S.A. 91:5022-5026);Fodor等人(1991, Science 251: 767-773)。简而言之,制备针对生物标志物多核苷酸的核酸探针并将其连接到生物芯片上,用于筛选和诊断方法,如本文所述。附着在生物芯片上的核酸探针被设计为与特异性表达的生物标志物核酸基本互补,即靶序列(样品的靶序列或与其他探针序列,例如在夹心测定中),使得靶序列和本发明的探针发生杂交。这种互补性不一定是完美的;可能存在任意数量的碱基对错配,这将干扰靶序列与本发明的核酸探针之间的杂交。然而,如果错配的数量如此之多,以至于即使在最不严格的杂交条件下也不会发生杂交,则该序列不是互补的靶序列。在某些实施方案中,每个序列使用多于一个探针,使用重叠探针或指向目标不同部分的探针。也就是说,使用两个、三个、四个或更多探针(其中三个是理想的)来为特定目标构建冗余。探针可以是重叠的(即具有一些共同的序列),也可以是独立的。
在说明性生物芯片分析中,在有利于特异性杂交的条件下,将生物芯片上的寡核苷酸探针暴露于或与怀疑含有一种或多种生物标志物多核苷酸的核酸样品接触。DNA或RNA的单链或双链样品提取物可以从生物材料的液体悬浮液中制备,或通过研磨生物材料制备,或遵循细胞裂解步骤,包括但不限于通过SDS(或其他去污剂)、渗透休克、异硫氰酸胍和溶菌酶处理进行裂解。可用于本发明方法的合适DNA包括cDNA。这种DNA可以通过许多常用方案中的任何一种制备,例如上述Ausubel, et al., 1994, and Sambrook, et al., etal., 1989中描述。
用于评估不需要将mRNA转化为cDNA的mRNA水平的方法也是本领域已知的,并且适用于本发明的操作。在一个特定的例子中,数字分子条码技术用于测量mRNA水平。在此类技术中,包括例如NanostringnCounterTM,颜色编码的分子条码在多重检测中使用例如,在这种方法中,每个颜色编码的条码都连接到靶标特异性报告探针上,例如与感兴趣的基因杂交的长度在大约50个碱基到大约100个碱基或50到100个碱基之间的任意数量。两种探针用于与感兴趣的mRNA转录本杂交:携带颜色信号的报告基因探针和允许将探针-靶标复合物固定在可靠支持物上以进行数据收集的捕获探针。探针-靶标复合物可以固定在底物上以进行数据收集,例如nCounterTMCartridge,并例如在数字分析仪中进行分析,以便对每个靶标分子的颜色代码进行计数和制表。
合适的RNA(包括信使RNA、从DNA转录的互补RNA(cRNA)或基因组或亚基因组RNA)可用于本发明的方法中。这种RNA可以使用标准方案制备,例如上述Ausubel, et al.1994, and Sambrook, et al. 1989的相关部分中描述的。
cDNA可以片段化,例如通过超声处理或通过限制性核酸内切酶处理。适当地对cDNA进行片段化,使所得DNA片段的长度大于固定的寡核苷酸探针的长度,但足够小,以便在合适的杂交条件下快速进入。或者,可以使用合适的核苷酸扩增技术选择cDNA片段并进行扩增,例如如上所述,涉及适当的随机或特异性引物。
通常将目标生物标志物多核苷酸(例如mRNA或cDNA)或与目标多核苷酸杂交的探针进行可检测的标记,以便可以检测到杂交。可检测的标记包括,例如,色原、催化剂、酶、荧光染料、化学发光分子、生物发光分子、镧系离子(例如,Eu34)、放射性同位素和直接视觉标记。在直接视觉标签的情况下,可以使用胶体金属或非金属颗粒、染料颗粒、酶或底物、有机聚合物、乳胶颗粒、脂质体或其他含有产生物质的信号的囊泡等。这种类型的说明性标签包括大胶体,例如金属胶体,例如来自金、硒、银、锡和氧化钛的胶体。在一些实施方案中,其中酶被用作直接视觉标记,生物素化碱基掺入目标多核苷酸中。
杂交形成步骤可以在合适的条件下进行,用于杂交寡核苷酸探针以测试核酸,包括DNA或RNA。在这方面,可以参照,例如,NUCLEIC ACID HYBRIDIZATION, A PRACTICALAPPROACH (Homes and Higgins, eds.) (IRL press, Washington D.C., 1985)。通常,是否发生杂交受寡核苷酸探针的长度和待测多核苷酸序列、pH值、温度、单价和二价阳离子的浓度、杂交形成区域中G和C核苷酸的比例、介质的粘度和可能存在的变性剂的影响。这些变量也会影响杂交所需的时间。因此,优选条件将取决于特定的应用。然而,这种经验条件可以例行确定,而无需进行不必要的实验。
在杂交形成步骤之后,通常用杂交缓冲液洗涤探针以除去任何未结合的核酸。此洗涤步骤仅留下结合的靶标多核苷酸。然后检查探针以确定哪些探针与目标多核苷酸杂交。
然后评估杂交反应以检测目标多核苷酸/探针复合物。根据与目标多核苷酸或探针相关的报告分子的性质,可以通过以下方法来仪器检测信号::用光照射荧光标记并在荧光计中检测荧光;通过提供酶系统来产生可以使用分光光度计检测的染料;或使用反射计检测染料颗粒或有色胶体金属或非金属颗粒;在使用放射性标记物或化学发光分子的情况下,采用辐射计数器或放射自显影术。因此,检测装置可适于检测或扫描与标签相关的光,该光可以包括荧光光、发光光、聚焦光束或激光。在这种情况下,可以使用电荷耦合装置(CCD)或光电管从微阵列中的每个位置扫描探针:目标多核苷酸杂交体的发射光,并将数据直接记录在数字计算机中。在某些情况下,可能不需要对信号进行电子检测。例如,对于与核酸阵列格式相关的酶促生成的色点,对阵列的视觉检查将允许解释阵列上的模式。在核酸阵列的情况下,检测手段与模式识别软件适当连接,以将来自阵列的信号模式转换为通俗易懂的语言遗传图谱。在某些实施方案中,对不同生物标志物多核苷酸具有特异性的寡核苷酸探针采用核酸阵列的形式,并且使用“芯片读取器”检测从阵列上的报告分子产生的信号。例如,Pirrung等人描述了一种可供“芯片阅读器”使用的检测系统(美国专利号5,143,854)。芯片读取器通常还会包含一些信号处理,以确定特定阵列位置或特征的信号是真阳性信号还是杂散信号。例如,Fodor等人描述了典型的芯片阅读器(美国专利号,5,925,525)。或者,当使用可单独可寻址的标记微珠混合物制备阵列时,可以使用流式细胞术检测反应。
在其它实施方案中,评估来自基因表达的蛋白质的水平,例如使用本领域已知的基于蛋白质的测定法。基于抗体的技术也可用于确定样品中生物标志物的水平,其中非限制性示例包括免疫测定,例如酶联免疫吸附测定(ELISA)和放射免疫测定(RIA)。
在具体实施方案中,采用允许同时检测和/或定量大量蛋白质的蛋白质捕获阵列。例如,滤膜上的低密度蛋白质阵列,如通用蛋白质阵列系统(Ge,2000 Nucleic Acids Res.28(2):e3),允许使用标准ELISA技术和扫描电荷耦合装置(CCD)检测器对阵列抗原进行成像。此外,还开发了能够同时检测临床分析物的免疫传感器阵列。现在可以使用蛋白质阵列来表征体液中的蛋白质表达,例如健康或患病受试者的血清中,以及药物治疗前后的受试者中。
示例性蛋白质捕获阵列包括包含空间处理抗原结合分子的阵列,通常称为抗体阵列,其可以促进对定义蛋白质组或亚蛋白质组的众多蛋白质进行广泛的平行分析。抗体阵列已被证明具有所需的特异性和可接受的背景特性,有些可商购(例如,BD Biosciences、Clontech、BioRad和Sigma)。已经报道了制备抗体阵列的各种方法(例如,参见Lopez etal., 2003 J. Chromatogr. B 787:19-27;Cahill, 2000 Trends in Biotechnology 7:47-51;美国专利申请公开2002/0055186;美国专利申请公开2003/0003599;PCT公开WO 03/062444;PCT公开WO 03/077851;PCT公开WO 02/59601;PCT公开WO 02/39120;PCT公开WO01/79849;PCT公开WO 99/39210)。这种阵列的抗原结合分子可以识别至少一个细胞或细胞群表达的蛋白质子集,其说明性示例包括生长因子受体、激素受体、神经递质受体、儿茶酚胺受体、氨基酸衍生物受体、细胞因子受体、细胞外基质受体、抗体、凝集素、细胞因子、丝氨酸蛋白酶抑制物、蛋白酶、激酶、磷酸酶、ras样GTP酶、水解酶、类固醇激素受体、转录因子、热休克转录因子、DNA结合蛋白、锌指蛋白、亮氨酸拉链蛋白、同源结构域蛋白、细胞内信号转导调节剂和效应器、细胞凋亡相关因子、DNA合成因子、DNA修复因子、DNA重组因子和细胞表面抗原。
单个空间不同的蛋白质捕获剂通常附着在支持物表面上,该支持物表面通常是平面或有轮廓的。常见的物理支持物包括载玻片、硅、微孔、硝酸纤维素膜或PVDF膜,以及磁性微珠和其他微珠。
悬浮液中的颗粒也可以用作阵列的基础,前提是它们被编码以供识别;系统包括微珠(例如,可从Luminex、Bio-Rad和Nanomics Biosystems获得)和半导体纳米晶体(例如,QDotsTM,可从Quantum Dots获得)的颜色编码,以及磁珠(UltraPlexTM,可从Smartbeads获得)和多金属微棒(NanobarcodesTM颗粒,可从Surromed获得)的条码。珠也可以在半导体芯片上组装成平面阵列(例如,可从LEAPS技术和BioArray Solutions获得)。在使用颗粒时,通常将单个蛋白质捕获试剂连接到单个颗粒上,以提供阵列的空间定义或分离。然后可以单独但平行地以分隔的方式对颗粒进行分析,例如在微量滴定板的孔中或在单独的试管中。
在一个说明性示例中,蛋白质样品,其任选地碎裂以形成肽片段(例如参见美国专利申请Pub. 2002/0055186),在适合蛋白质或肽结合的条件下被输送到蛋白质捕获阵列,并且阵列被洗涤以从阵列中去除样品的未结合或非特异性结合组分。接下来,使用合适的检测系统检测与阵列的每个特征结合的蛋白质或肽的存在或数量。与阵列特征结合的蛋白质量可以相对于与阵列的第二个特征结合的第二蛋白质的量来确定。在某些实施方案中,样品中第二蛋白质的量是已知的或已知的是不变的。
在蛋白质捕获阵列的另一个说明性例子中,是基于Luminex的多重测定,它是基于珠的多重测定,其中珠在内部用荧光染料染色以产生特定的光谱地址。生物分子(如寡聚体或抗体)可以与磁珠表面偶联以捕获目标分析物。然后,流式细胞术或本领域技术人员已知的其他合适的成像技术可用于珠的表征,以及分析物的检测。Luminex技术能够使用非常小的样品量(例如,在96或384孔板中)检测大量蛋白质、基因或其他基因表达产物(例如,100个或更多、200个或更多、300个或更多、400个或更多)。在一些实施方案中,如前所述,蛋白质捕获阵列是Bio-Plex Luminex-100 Station(Bio-Rad)。
为了分析两个细胞或细胞群之间蛋白质的差异表达,在适合蛋白质结合的条件下将第一细胞或细胞群的蛋白质样品输送到阵列中。以类似的方式,将第二个细胞或细胞群的蛋白质样本输送到第二个阵列中,该阵列与第一个阵列相同。然后洗涤两个阵列,以从阵列中去除样品的未结合或非特异性结合组分。在最后一步中,将与第一个阵列特征保持结合的蛋白质量与第二个阵列的相应特征保持结合的蛋白质量进行比较。为了确定两个细胞或细胞群的差异蛋白表达模式,从与第二个阵列的相应特征结合的蛋白量中减去与第一个阵列的特征分别结合的蛋白质的量。
在其它例子中,当生物标志物蛋白质是酶时,可以基于其催化活性或基于样品中所含的蛋白质的分子数对蛋白质进行定量。
在一些实施方案中,生物标志物的水平相对于管家生物标志物进行归一化(即相对于管家生物标志物),或表示为生物标志物a的水平与管家生物标志物的水平之间的比率。管家生物标志物是生物标志物或一组生物标志物(例如,多核苷酸和/或多肽),它们通常在被分析的细胞类型和被评估的条件下以恒定水平存在。在一些实施方案中,管家生物标志物是管家基因,即编码蛋白质的基因或基因的组,这些蛋白质的活性对于维持细胞功能至关重要,并且通常在被分析的细胞类型和被评估的条件下以恒定水平存在。
在一个实施方案中,该方法包括比较一个或多个生物标志物的mRNA或蛋白质的表达水平。
术语“参照”可以指来自健康个体(例如无神经胶质瘤的个体)的样本,也可以指非癌性样本。或者,“参照”可能是指来自患癌个体的样本,也可能是指癌症(例如NPC)样本。它也可以指预先确定的值。
与参照相比,一个或多个生物标志物中表达水平的变化或由其得出的值可以指一个或多个生物标志物中表达水平的变化,或由一个或多个生物标志物中的表达水平得出的值的变化。变化可能是一个或多个生物标志物中表达水平的增加或减少。它也可能是从一个或多个生物标志物中的表达水平得出的值的增加或减少。
如本文所用,术语“增加(increase)”或“增加的(increased)”在一个或多个生物标志物的水平上,或由其得出的值,是指与参照相比具有统计学意义和可测量的增加。增加可能是指至少增加约10%,或至少增加约20%,或至少增加约30%,或至少增加约40%,或至少增加约50%或更多。
在一个实施方案中,与参照相比,一个或多个生物标志物的水平增加,或由其得出的值预测受试者中癌症复发的可能性。增加可以是增加1.1倍、1.2倍、1.3倍、1.4倍、1.5倍、1.6倍、1.7倍、1.8倍、1.9倍、2倍、3倍、4倍、5倍、6倍、7倍、8倍、9倍、10倍、11倍、12倍、13倍、14倍、15倍、16倍、17倍、18倍、19倍、20倍、21倍、22倍、23倍、24倍、25倍、26倍、27倍、28倍、29倍、30倍、31倍、32倍、33倍、34倍、35倍、36倍、37倍、38倍、39倍、40倍、41倍、42倍、43倍、44倍、45倍、46倍、47倍、48倍、49倍、50倍、51倍、52倍、53倍、54倍、55倍、56倍、57倍、58倍、59倍、60倍、61倍、62倍、63倍、64倍、65倍、66倍、67倍、68倍、69倍、70倍、71倍、72倍、73倍、74倍、75倍、76倍、77倍、78倍、79倍、80倍、81倍、82倍、83倍、84倍、85倍、86倍、87倍、88倍、89倍、90倍、91倍、92倍、93倍、94倍、95倍、96倍、97倍、98倍、99倍或100倍或介于两者之间的任何倍。
如本文所用,术语一个或多个生物标志物的水平“减少(decrease)”或“减少的(decreased)”或由其得出的值是指与参照相比具有统计学意义和可测量的减少。减少可能是指减少至少约10%,或至少减少约20%,或减少至少约30%,或减少至少约40%,或减少至少约50%或更多。
在一个实施方案中,从一个或多个生物标志物的水平得出的值是概率。该概率可能来自逻辑回归模型,其中一个或多个生物标志物的水平是逻辑回归模型的预测因子。该值可以与参照进行比较,例如,可能是指定为0.5的截止值。
在一个实施方案中,由其得出的值是通过使用风险评分模型处理选自由FGF2、C3和GIMAP7组成的组中的一个或多个生物标志物的表达水平而获得的癌症复发风险评分。
在一个实施方案中,风险评分模型是通过在包含癌症患者队列的基因表达数据和临床结果的数据集上进行回归生成的。
本文使用的术语“复发”可以指已经复发(重现)的癌症,通常在无法检测到癌症的一段时间之后。这种癌症可能被称为复发性癌症。复发性癌症可能会复发到与原始(原发)肿瘤相同的位置或身体的其他位置。当癌症与原始癌症位于同一位置或非常接近原始癌症时,复发可能被视为“局部复发”。当肿瘤已经生长到原始癌症附近的淋巴结或组织时,复发可能是“区域复发”。当癌症已经扩散到远离原始癌症的器官或组织时,这种复发可能被称为远处复发。当癌症扩散到身体的远处时,复发性癌症可能称为转移或转移性癌症。
术语“复发的可能性”可能是指癌症在受试者中复发的可能性有多大。与参照相比,一种或多种生物标志物水平的增加或由其得出的值可能表明受试者复发的可能性为10%、20%、30%、40%、50%、60%、70%、80%、90%或99%或更大的可能性。
对于本领域技术人员来说,很明显,受试者中预测的癌症复发的可能性会发生变化,例如,从低(包括可忽略不计)或降低的可能性变为复发可能性高或增加。复发可能性低或降低的受试者意味着与复发可能性高或增加的受试者相比,癌症在受试者中复发的可能性较小。相反,复发可能性高或增加的受试者意味着与复发可能性低或降低的受试者相比,癌症更有可能在受试者中复发。
可能性适当地基于数学建模。例如,增加的可能性可能是相对的或绝对的,并且可以定性或定量地表示。例如,增加的风险可以表示为在一个或多个时间点简单确定受试者的给定生物标志物水平,并将测试受试者置于“增加风险”类别中,根据已确定的参照(例如参照生物标志物),例如,从同一时间点的先前的群体研究。或者,可以根据生物标志物水平分析确定测试对象风险增加的数字表示。
在一些实施方案中,通过将至少一种生物标志物的水平或丰度与一个或多个预选水平(在本文中也称为阈值或参照水平)进行比较来评估可能性。可以选择提供可接受能力的阈值来预测风险、治疗成功等。在说明性示例中,接受者操作特征(ROC)曲线是通过在两个群体中绘制变量的值与其相对频率来计算的,其中第一群体被认为有癌症复发的风险,而第二群体被认为无癌症复发的风险或低风险(任意称呼,例如,“健康对照”)。
在一些实施方案中,如本文所述,受试者的样本生物标志物谱中至少一个生物标志物与健康受试者中的相应生物标志物相比上调或下调,则认为受试者有癌症复发的风险。
对于任何特定的生物标志物,有癌症复发风险或无癌症复发风险的受试者的生物标志物水平的分布可能重叠。在这种情况下,测试可能无法绝对(即100%)准确区分有癌症复发风险的受试者和无癌症复发风险的受试者,重叠区域表示测试无法区分两个受试者。可以选择一个阈值,高于该阈值(或低于该阈值,取决于生物标志物如何随风险变化)测试被视为“阳性”,低于该阈值则被视为“阴性”。ROC曲线下面积(AUC)提供C统计量,该统计量是感知测量允许正确识别病情的概率的度量(例如,参见Hanley et al., Radiology 143:29-36(1982))。
在一些实施方案中,阳性似然比、阴性似然比、比值比和/或AUC或接受者操作特征(ROC)值用作预测癌症复发风险的方法的能力的度量。如本文所用,术语“似然比”是指在具有此类风险可能性的受试者中观察到给定测试结果的概率除以在无此类风险可能性的受试者中观察到相同结果的概率。因此,阳性似然比是在具有指定风险的受试者中观察到阳性结果的概率除以在无指定风险的受试者中出现阳性结果的概率。负似然比是在无指定风险的受试者中出现阴性结果的概率除以具有指定风险的受试者出现阴性结果的概率。本文使用的术语“比值比”是指一组(例如,健康对照组)中事件发生的几率与另一组(例如,癌症复发风险组)发生的几率之比,或与该比率的基于数据的估计之比。术语“曲线下面积”或“AUC”是指接受者操作特征(ROC)曲线的曲线下面积,这两者都是本领域熟知的。AUC度量值可用于比较分类器在整个数据范围内的准确性。AUC较大的分类器具有更强的能力,可以在两组感兴趣的组(例如,健康的对照组和癌症复发风险组)之间正确分类未知物。ROC曲线可用于绘制特定特征(例如,本文描述的任何生物标志物和/或任何附加生物医学信息)在区分或分辨两个群体(例如,有问题的病例和无问题的对照)的性能。通常,整个群体(例如,案例和对照)的特征数据根据单个特征的值按升序排序。然后,对于该特征的每个值,将计算数据的真阳性率和假阳性率。通过计算高于该特征值的数,然后除以总数来确定灵敏度。通过计算低于该特征值的对照数,然后除以对照总数来确定特异性。尽管此定义是指与对照相比,病例中特征提升的情况,但此定义也适用于病例中特征与对照相比较低的情况(在这种情况下,将计算低于该特征值的样本)。可以为单个特征以及其他单个输出生成ROC曲线,例如,可以通过数学方式将两个或多个特征的组合组合(例如,添加、减去、乘以等)在一起以生成单个值,并且这个单个值可以绘制在ROC曲线中。此外,可以在ROC曲线中绘制多个特征的任意组合,其中组合派生单个输出值。这些特征组合可能构成一个测试。ROC曲线是检测的敏感性对检测特异性的图,其中敏感性传统上显示在纵轴上,特异性传统上显示在横轴上。因此,“AUC ROC值”等于分类器将随机选择的阳性实例排在高于随机选择的阴性实例的概率。AUC ROC值可以认为等效于Mann-Whitney U检验,该检验检验在两组为连续数据时所获得的分数之间的中位数差,或者与秩次的Wilcoxon检验等效。
在一个实施方案中,该方法还包括对受试者的治疗。本文中使用的术语“治疗”可能是指(1)预防或延迟疾病的一种或多种症状的出现;(2)抑制疾病或疾病的一种或多种症状的发展;(3)缓解疾病,即导致疾病或至少一种或多种疾病症状消退;和/或(4)导致疾病的一种或多种症状的严重程度降低。
如本文所用术语“有效量”或“治疗有效量”是指如本文所述的足以达到或有助于实现一种或多种理想临床结果的活性剂的量,例如上述“治疗”和“预防”描述中描述的那些。在任何个体病例下,适当的“有效”量可以使用本领域已知的标准技术(例如剂量递增研究)来确定,并且可以考虑所需的给药途径(例如全身与颅内)、所需的给药频率等因素来确定。此外,“有效量”可以根据要使用的共同给药方法来确定。
本文公开的是一种预防或治疗受试者癌症复发的方法,该方法包括:(a)将从受试者获得的样本中选自由FGF2、C3和GIMAP7组成的组中的一个或多个生物标志物的表达水平与参照进行比较,其中,与参照相比,一个或多个生物标志物中表达水平的变化或由其得出的值预测受试者癌症复发的可能性;及(b)当发现受试者有癌症复发的可能性时,对受试者施用抗癌剂和/或放疗。
用于治疗NPC的抗癌药物可包括吉西他滨(Gemzar)、顺铂(Platinol)、多西他赛(泰素帝(Taxotere))、5-氟尿嘧啶(5-FU)或卡培他滨(希罗达(Xeloda))。化疗药物的组合可以包括,例如吉西他滨(Gemzar)和顺铂(Platinol);多西他赛(泰素帝(Taxotere))与顺铂和5-氟尿嘧啶(5-FU);顺铂和5-氟尿嘧啶;顺铂和卡培他滨(希罗达(Xeloda));或多西他赛和顺铂。NPC的治疗可能包括在放疗时使用抗癌药物。抗癌剂也可能是一种免疫疗法。免疫疗法可以是帕博利珠单抗、纳武利尤单抗或抗血管内皮生长因子疗法,例如贝伐珠单抗。
本文还公开了将受试者分级为患有高风险或低风险癌症个体的方法,该方法包括将从受试者获得的样本中选自由FGF2、C3和GIMAP7组成的组中的一个或多个生物标志物的表达水平与参照进行比较,其中,与参照相比,一个或多个生物标志物的表达水平的变化或由其得出的值将受试者分为患有高风险或低风险癌症的个体。
本文提供的试剂盒包含一个或多个核酸分子,这些核酸分子与样品中的生物标志物的表达产物特异性结合,其中生物标志物选自由FGF2、C3和GIMAP7组成的组。一个或多个核酸分子可被检测地标记。
本文提供的组合物包括样品和一个或多个核酸分子,这些核酸分子与样品中的生物标志物的表达产物特异性结合,其中生物标志物选自由FGF2、C3和GIMAP7组成的组。
在一个实施方案中,提供一种组合物或固相支持物,其包括多个DNA/mRNA复合物,其中,多个DNA/mRNA复合物中的每个DNA/mRNA复合物包含生物标志物和与生物标志物杂交的第一和第二DNA探针,其中:第一探针是捕获探针;第二探针为报告探针;生物标志物是mRNA转录本;并且多个DNA/mRNA复合物包含选自由成纤维细胞生长因子2(FGF2)、补体成分3(C3)和GTP酶、IMAP家族成员7(GIMAP7)组成的组中的一个或多个生物标志物。
如本文所用,“和/或”是指并包含一个或多个相关所列项目的任何和所有可能的组合,以及在备选方案(或)中解释时缺少的组合。
在本申请中使用时,除非上下文明确另有规定,否则单数形式“a”、“an”和“the”包括复数引用。例如,术语“an agent”包括多个试剂,包括它们的混合物。
在本说明书和随后的陈述中,除非上下文另有要求,否则“comprise”一词以及诸如“comprises”和“comprising”的变体将被理解为意味着包含所规定的整数或步骤或整数或步骤组,但不排除任何其他整数或步骤或整数或步骤组。
本说明书中对任何先前出版物(或由其得出的信息)或任何已知事项的引用,不是也不应被视为承认或准许或任何形式的暗示,即该先前出版物(或由其得出的信息)或已知事项构成与本规范相关的努力领域的共同常识的一部分。
本领域的技术人员将认识到,本文所描述的发明容易受到除具体描述之外的变化和修改的影响。需要理解的是,本发明包括所有此类变化和修改,这些变化和修改都属于所述本发明的精神和范围。本发明还包括本说明书中单独或共同提及或指示的所有步骤、特征、组合物和化合物,以及任何两个或多个所述步骤或特征的任何和所有组合。
除非另有定义,否则本文中使用的所有技术和科学术语具有与本发明所属领域的普通技术人员通常理解的相同含义。
现在将参照以下实施例来描述本发明的某些实施例,这些实施例仅用于说明目的,而不是为了限制本文前述的一般性的范围。
【实施例】
由于NPC肿瘤中的强烈炎症浸润,混合了来自肿瘤大量基因表达表征的基因表达信号,包括来自肿瘤上皮细胞和炎症微环境细胞的信号。定义不同肿瘤区室(肿瘤上皮或微环境)特有的基因信号仍然是一个挑战。
按照Foley等人的方法,在从新加坡招募的NPC患者的发现队列中进行了显微解剖基因表达表征。表征了随后发生复发或转移性疾病的患者(A组)和未发生复发或转移性疾病的患者(B组)的原发性NPC肿瘤。表征了这些患者的存档石蜡块的原发性治疗前肿瘤。使用激光捕获显微切割分别对肿瘤上皮和微环境区室进行显微解剖,并使用Smart-3SEQ进行文库制备。样品以生物学重复的方式制备。使用tapestation和通过qPCR定量的文库进行质量控制。文库被合并、测序和拆解。使用STAR序列比对软件将原始fastq文件映射到连接的人hg19和Epstein-Barr病毒基因组,然后使用Subread包中的featureCounts对基因表达进行定量。
在过滤高质量文库后,使用R studio中的DESeq2包进行差异基因表达分析,比较最终复发的肿瘤和未复发的肿瘤的基因表达(A组与B组)。将A组11例肿瘤的17个基因表达文库与B组12例肿瘤的17个基因表达文库进行比较。
从该队列的分析中,在调整后的p值为<0.01时,在肿瘤上皮区室中鉴定出27个差异表达基因(图1a)。大多数差异表达基因富集在不复发的肿瘤中,包括几个免疫相关基因(C3、GIMAP基因、CCL21、IL8等)。鉴定出两个基因在复发的肿瘤中富集(FGF2、EFHC1)。
为了完善这组基因的分类能力,以及合理化使用基因表达特征对患者进行分类的实际意义,使用lasso方法以无偏的方式减少了在未复发肿瘤中富集的基因的数量,选择在λ(最小)处具有最大效果(|系数|>0.001)的基因。观察到C3和GIMAP7是B组富集基因中的最佳分类器。基于FGF信号通路在癌症中的生物学相关性,FGF2也被包含在包含FGF2、C3和GIMAP7的三个基因特征中。当应用于发现队列时,这三个基因特征在无监督聚类上将肿瘤准确地分为复发组和非复发组(图1b)。开发了广义线性模型来生成合并三个基因表达的风险评分(“三基因分类器”)。
验证了所述三基因分类器在两个独立队列中识别高风险NPC患者的能力。第一队列,Zhang等人2,依靠大量RNA-Seq(未显微解剖)来表征NPC肿瘤(n=88个肿瘤)。该队列的基因表达矩阵和临床结果可从NCBI Gene Expression Omnibus(登录号GSE102349)获得。尽管Lin等人使用的基因表达表征方法不同,但观察到三基因分类器表现稳健(图2)。无监督分级聚类显示,肿瘤根据FGF2、C3、GIMAP7的表达分为高风险组和低风险组。当应用三基因分类器时,与保持健康的患者相比,发展为进展性疾病的患者的肿瘤具有更高的风险评分。基于Kaplan-Meier曲线的生存分析显示,与风险评分较低的肿瘤患者相比,风险评分较高的肿瘤患者具有更差的无病生存率(p=0.0029)。
第二验证队列是来自斯坦福大学的显微解剖NPC肿瘤队列(n=85个肿瘤上皮文库)。该队列仅用于验证,不需要用于发现三基因特征。我们观察到三基因分类器表现优异(图3)。无监督分级聚类显示,肿瘤自发聚类为高风险组和低风险组。与保持健康的患者相比,发展为进展性疾病的患者的肿瘤风险评分也升高。最后,基于Kaplan-Meier曲线的生存分析再次显示,风险评分较高的肿瘤患者具有更差的无病生存率(p=0.0015)。
由于观察到FGF2在发生复发或转移性疾病的B组肿瘤中上调,我们用划痕试验(细胞迁移试验)评估了FGF2增加NPC细胞系细胞迁移的能力。将C666-1细胞一式三份接种在6孔板中,并在R10培养基(补充有1%非必需氨基酸(MEM非必需氨基酸溶液(100×),Gibco),10%胎牛血清(Fetal Bovine Serum, certified, United States, Gibco)和1% 青霉素-链霉素(Penicillin-Streptomycin(10,000 U/mL),Gibco)的RPMI 1640)中培养。汇合后,将之前的培养基替换为无血清培养基。血清饥饿24小时后,使用移液器吸头制造划痕,并用磷酸盐缓冲盐水(PBS)洗涤细胞3次,以去除脱离的细胞碎片。然后将含有5 ng/ml FGF2(人碱性FGF(FGF-2/bFGF)重组蛋白,Gibco,溶于PBS)的无血清培养基添加到受伤的细胞层中。对于对照孔,加入含有等体积PBS的无血清培养基。然后在进行划痕后,将这些细胞在37℃下孵育24小时和48小时。使用Olympus IX51倒置显微镜结合DP26 Olympus数码相机,在0h、24 h和48 h监测和捕获细胞向受伤区域的迁移。ImageJ软件用于量化迁移的细胞。细胞迁移测定以生物学一式三份进行。使用双尾Student氏t检验对定量数据进行统计分析,将FGF2处理组与对照组进行比较。图表上的误差棒是与实验获得的值的标准差。据观察,用0.5 ng/ml FGF2处理的C666-1细胞表现出迁移能力增加(图4a、b、p<0.05)。
我们还用细胞侵袭测定评估了FGF2增加NPC细胞系侵袭性的能力。根据制造商的方案使用CytoSelectTM96孔细胞侵袭检测试剂盒(基底膜,荧光计量形式)。简而言之,将C666-1细胞血清饥饿20~24小时,然后收获。将2×106个细胞/ml一式三份接种在上腔室内含有5 ng/ml和20 ng/ml FGF的无血清培养基中,无血清培养基仅作为对照。然后将所述细胞在37℃下孵育24 h和48 h。供给托盘含有10% FBS作为细胞的化学引诱剂。在每个时间点,使用细胞解离试剂收获侵入基底膜并附着在膜底部的细胞。然后将细胞在37℃下孵育30分钟。然后将裂解缓冲液和荧光染料添加到脱离的细胞中,并将混合物在环境温度下孵育20分钟。使用Synergy HT微孔板检测仪在485 nm/528 nm处进行荧光测量,定量侵入膜的细胞数量。细胞侵袭试验以生物学一式三份进行。使用双尾Student氏t检验对定量数据进行统计分析,将FGF2处理组与对照组进行比较。由于荧光读数过高,排除了20ng/ml FGF2组的1个重复。图表上的误差棒是与实验获得的值的标准差。据观察,用20ng/ml FGF2处理的C666-1细胞表现出侵袭性增加(图4c,p<0.05)。
总之,源自匹配的有和无复发的NPC肿瘤队列的基因表达分类器将NPC准确地分类为高风险组和低风险组。
【参照文献】
Foley JW, Zhu C, Jolivet P, et al. Gene-expression profiling ofsingle cells from archival tissue with laser-capture microdissection andSmart-3SEQ. Genome Res. 2019:doi: 10.1101/gr.234807.234118.
Zhang L, MacIsaac KD, Zhou T, et al. Genomic Analysis ofNasopharyngeal Carcinoma Reveals TME-Based Subtypes. Mol Cancer Res. 2017;15(12):1722-1732.
Liu SL, Sun XS, Chen QY, et al. Development and validation of atranscriptomics-based gene signature to predict distant metastasis and guideinduction chemotherapy in locoregionally advanced nasopharyngeal carcinoma.Eur J Cancer. 2022;163:26-34.
Zhao S, Dong X, Ni X, et al. Exploration of a Novel Prognostic RiskSignature and Its Effect on the Immune Response in Nasopharyngeal Carcinoma.Front Oncol. 2021;11:709931.
Tang XR, Li YQ, Liang SB, et al. Development and validation of a geneexpression-based signature to predict distant metastasis in locoregionallyadvanced nasopharyngeal carcinoma: a retrospective, multicentre, cohortstudy. Lancet Oncol. 2018;19(3):382-393.
Claims (13)
1.预测癌症在受试者中复发可能性的方法,所述方法包括将从受试者获得的样本中选自由成纤维细胞生长因子2(FGF2)、补体成分3(C3)和GTP酶、IMAP家族成员7(GIMAP7)组成的组中的一个或多个生物标志物的表达水平与参照进行比较,其中,与参照相比,一个或多个生物标志物中表达水平的变化或由其得出的值预测癌症在受试者中复发的可能性。
2.根据权利要求1所述的方法,其中,所述癌症是鼻咽癌(NPC)。
3.根据权利要求1或2所述的方法,其中,所述方法包括比较所述一个或多个生物标志物的mRNA或蛋白质的表达水平。
4.根据权利要求1~3之任一项所述的方法,其中,所述方法包括检测所述一个或多个生物标志物的水平。
5.根据权利要求1~4之任一项所述的方法,其中,所述方法包括比较FGF2、C3和GIMAP7的水平,或由其组成。
6.根据权利要求1~5之任一项所述的方法,其中,与参照相比,FGF2、C3和GIMAP7的表达水平增加、不变和/或降低预测所述癌症在所述受试者中复发的可能性。
7.根据权利要求1~5之任一项所述的方法,其中,由其得出的值是通过使用风险评分模型对选自FGF2、C3和GIMAP7组成的组中的一个或多个生物标志物的表达水平进行处理而获得的癌症复发风险评分。
8.根据权利要求7所述的方法,其中,所述风险评分模型是通过在包含癌症患者队列的基因表达数据和临床结果的数据集上进行回归而生成的。
9.根据权利要求1~8之任一项所述的方法,其中,所述样本是组织样本。
10.确定癌症在受试者中预后的方法,所述方法包括将从受试者获得的样本中选自由FGF2、C3和GIMAP7组成的组中的一个或多个生物标志物的表达水平与参照进行比较,其中,与参照相比,一个或多个生物标志物中表达水平的变化或由其得出的值表明受试者可能患有高风险癌症或低风险癌症。
11.治疗受试者中癌症的方法,所述方法包括:
(a)将从受试者获得的样本中选自由FGF2、C3和GIMAP7组成的组中一个或多个生物标志物的表达水平与参照进行比较,其中,与参照相比,一个或多个生物标志物中表达水平的变化或由其得出的值表明受试者可能患有高风险癌症;和
(b)对被发现可能患有高风险癌症的受试者施用抗癌剂和/或放射治疗。
12.将受试者分级为患有高风险或低风险癌症个体的方法,所述方法包括将从受试者获得的样本中选自由FGF2、C3和GIMAP7组成的组中一个或多个生物标志物的表达水平与参照进行比较,其中,与参照相比,一个或多个生物标志物中表达水平的变化或由其得出的值将受试者分级为患有高风险或低风险癌症个体。
13.组合物或固相支持物,其包括多个DNA/mRNA复合物,其中,所述多个DNA/mRNA复合物中的每个DNA/mRNA复合物包含生物标志物和与生物标志物杂交的第一和第二DNA探针,其中:
所述第一探针为捕获探针;
所述第二探针为报告探针;
所述生物标志物是mRNA转录本;且
所述多个DNA/mRNA复合物包含选自由成纤维细胞生长因子2(FGF2)、补体成分3(C3)和GTP酶、IMAP家族成员7(GIMAP7)组成的组中的一个或多个生物标志物。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
SG10202203606T | 2022-04-07 | ||
SG10202203606T | 2022-04-07 | ||
PCT/SG2023/050239 WO2023195931A2 (en) | 2022-04-07 | 2023-04-06 | Method for detecting high-risk nasopharyngeal cancer |
Publications (1)
Publication Number | Publication Date |
---|---|
CN119546782A true CN119546782A (zh) | 2025-02-28 |
Family
ID=88244227
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202380042138.5A Pending CN119546782A (zh) | 2022-04-07 | 2023-04-06 | 高风险鼻咽癌的检测方法 |
Country Status (3)
Country | Link |
---|---|
EP (1) | EP4504975A2 (zh) |
CN (1) | CN119546782A (zh) |
WO (1) | WO2023195931A2 (zh) |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9506118B2 (en) * | 2014-03-07 | 2016-11-29 | Hackensakc University Medical Center | Fibroblast growth factor-2 (FGF2) and syndecan-1 (SDC1) as biomarkers for poor outcome Hodgkin lymphoma patients |
-
2023
- 2023-04-06 EP EP23785118.3A patent/EP4504975A2/en active Pending
- 2023-04-06 CN CN202380042138.5A patent/CN119546782A/zh active Pending
- 2023-04-06 WO PCT/SG2023/050239 patent/WO2023195931A2/en active Application Filing
Also Published As
Publication number | Publication date |
---|---|
EP4504975A2 (en) | 2025-02-12 |
WO2023195931A2 (en) | 2023-10-12 |
WO2023195931A3 (en) | 2023-11-30 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11226333B2 (en) | Lung cancer signature | |
ES2636470T3 (es) | Marcadores de expresión génica para predecir la respuesta a la quimioterapia | |
US10689711B2 (en) | Test kits and methods for their use to detect genetic markers for urothelial carcinoma of the bladder and treatment thereof | |
WO2007073220A9 (en) | Prognosis prediction for colorectal cancer | |
WO2012158780A2 (en) | Lung cancer signature | |
US20150344962A1 (en) | Methods for evaluating breast cancer prognosis | |
US20110183862A1 (en) | Molecular signature of liver tumor grade and use to evaluate prognosis and therapeutic regimen | |
CA2987389A1 (en) | Method and systems for lung cancer diagnosis | |
CA2989497A1 (en) | Methods for diagnosis of bladder cancer | |
US20120201750A1 (en) | Serum biomarkers for melanoma metastasis | |
US20210381057A1 (en) | Recurrence gene signature across multiple cancer types | |
JP2008520251A (ja) | 固形腫瘍の予後および処置のための方法およびシステム | |
US12227808B2 (en) | Compostions and methods for diagnosing lung cancers using gene expression profiles | |
KR101346955B1 (ko) | 뇌종양의 재발 가능성 및 생존 예후 예측용 조성물 및 이를 포함하는 키트 | |
US12130290B2 (en) | Compositions and methods for diagnosing breast cancer | |
WO2019134994A1 (en) | Prognostic biomarkers for human papillomavirus positive cancers | |
CN119546782A (zh) | 高风险鼻咽癌的检测方法 | |
JP5688497B2 (ja) | 肺腺癌患者の術後予後を予測するための方法及び組成物 | |
EP2607494A1 (en) | Biomarkers for lung cancer risk assessment | |
US20070275380A1 (en) | Method for Distinguishing Aml Subtypes With Aberrant and Prognostically Intermediate Karyotypes | |
WO2024178032A2 (en) | Methods for diagnosing and treating ovarian cancer | |
CN113930504A (zh) | G蛋白偶联受体lpar6在肝癌预后中的用途 | |
EP1682906A2 (en) | Method for distinguishing aml subtypes with differents gene dosages |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |