[go: up one dir, main page]

CN101068936A - 用于实体瘤预后及治疗的方法和系统 - Google Patents

用于实体瘤预后及治疗的方法和系统 Download PDF

Info

Publication number
CN101068936A
CN101068936A CNA200580039290XA CN200580039290A CN101068936A CN 101068936 A CN101068936 A CN 101068936A CN A200580039290X A CNA200580039290X A CN A200580039290XA CN 200580039290 A CN200580039290 A CN 200580039290A CN 101068936 A CN101068936 A CN 101068936A
Authority
CN
China
Prior art keywords
gene
patient
express spectra
prognosis
rcc
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CNA200580039290XA
Other languages
English (en)
Inventor
M·E·布尔奇恩斯基
A·J·多尔纳
N·C·特温尼
W·L·特雷皮乔欧
D·K·斯洛宁
A·斯特拉思
F·伊梅尔曼
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Wyeth LLC
Original Assignee
Wyeth LLC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Wyeth LLC filed Critical Wyeth LLC
Publication of CN101068936A publication Critical patent/CN101068936A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/53Immunoassay; Biospecific binding assay; Materials therefor
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • C12Q1/6886Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K16/00Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies
    • C07K16/18Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies against material from animals or humans
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/106Pharmacogenomics, i.e. genetic variability in individual responses to drugs and drug metabolism
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/118Prognosis of disease development
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/158Expression markers

Landscapes

  • Chemical & Material Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Immunology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Engineering & Computer Science (AREA)
  • Genetics & Genomics (AREA)
  • Molecular Biology (AREA)
  • Analytical Chemistry (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Pathology (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Microbiology (AREA)
  • Biotechnology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Oncology (AREA)
  • Hematology (AREA)
  • Urology & Nephrology (AREA)
  • Biomedical Technology (AREA)
  • Hospice & Palliative Care (AREA)
  • Medicinal Chemistry (AREA)
  • Cell Biology (AREA)
  • Food Science & Technology (AREA)
  • General Physics & Mathematics (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Pharmaceuticals Containing Other Organic And Inorganic Compounds (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)

Abstract

本发明提供了用于肾细胞癌(RCC)和其它实体瘤预后及治疗的方法、系统和设备。根据本发明可以鉴定出用于预测实体瘤临床结果的基因。这些基因在实体瘤患者外周血单核细胞(PBMC)中的表达谱与患者的临床结果相关。RCC预后基因的实例列于表2和表3中。这些基因可用作预测目的RCC患者临床结果的替代标志。这些基因也可用于选择对目的RCC患者的有利治疗法。

Description

用于实体瘤预后及治疗的方法和系统
技术领域
本发明涉及实体瘤预后基因以及使用这些基因对实体瘤进行预后和治疗的方法。
发明背景
在原发组织中进行的表达谱研究表明,在正常组织和恶性组织中存在转录差异。参见例如Su等人,Cancer Res,61:7388-7393(2001);以及Ramaswamy等人,Proc Natl Acad Sci U.S.A.,98:15149-15151(2001)。最新的临床分析也已经鉴定出与临床结果的某些度量标准高度相关的肿瘤内的表达谱。一项研究已经表明,对原发肿瘤表达谱的活组织检查得到了预后“识别信号”,这种识别信号可对抗或者甚至胜过当前接受的对癌症患者风险的标准度量。参见van de Vijver等人,N Engl J Med,347:1999-2009(2002)。
发明简述
本发明提供了用于肾细胞癌(RCC)和其它实体瘤预后及治疗的方法、系统和设备。根据本发明可以鉴定出用于预测实体瘤临床结果的基因。这些基因在实体瘤患者外周血单核细胞(PBMC)中的表达谱与这些患者的临床结果相关。这些基因可用于预测患有实体瘤的目的患者临床结果的替代标志。这些基因也可用于鉴定或选择对目的患者产生有利结果的治疗法。
在一个方面,本发明提供了用于对目的患者中实体瘤进行预后或选择治疗法的方法。方法包括将一个或多个预后基因在目的患者外周血样品中的表达谱与预后基因的至少一种参照表达谱相比较,其中每一个预后基因在所比较的第一类患者PBMC与第二类患者PBMC中差异表达。第一类和第二类患者均具有与目的患者相同的实体瘤,但是每一类患者具有不同的临床结果。在许多实施方案中,预后基因包括至少一个这样的基因,即如通过Affymetrix HG-U133 A基因芯片所测定,其在两个类别患者PBMC中的治疗前表达谱与基于类别的相关分析(例如微列阵方法的近邻(nearest-neighbor)分析或显著性方法)的类别特征相关,其中类别特征代表着基因在两个类别患者PBMC中的理想表达模式。
适于本发明的实体瘤包括但不限于RCC、前列腺癌、头/颈癌以及非起源于血细胞或淋巴细胞的其它肿瘤。临床结果可以通过任何临床指示指标测定。在一个实施方案中,临床结果通过疾病进展时间(TTP)或者到死亡时间(TTD)测定。对患者进行治疗性治疗的其它疗效,如完全有效、部分有效、微效、疾病稳定、疾病进展、疾病不进展或其任意组合也可以用于测定临床结果。适于本发明的实体瘤治疗实例包括但不限于药物治疗(例如CCI-779治疗)、化学治疗、激素治疗、放射治疗、免疫治疗、手术、基因治疗、抗血管生成治疗、缓解性治疗或其任意组合。
目的患者的外周血样品可以是全血样品或者包含富集或纯化的PBMC的血液样品。其它类型的血液样品也可以用于本发明。在许多情况下,用于准备目的患者表达谱和参照表达谱的外周血样品是在对患者进行治疗性治疗之前分离的基线样品。
参照表达谱可以包括预后基因在与目的患者具有相同实体瘤并且其临床结果已知或可确定的患者外周血样品中的平均表达谱。参照表达谱也可以包括一组个别表达谱,其中每一个表达谱代表着预后基因在与目的患者具有相同实体瘤并且其临床结果已知或可确定的特定参照患者中外周血表达模式。其它类型的参照表达谱也可用于本发明。在许多情况下,目的患者的表达谱和参照表达谱使用相同或可比的方法制备。
任何比较方法可用于比较目的患者表达谱与参照表达谱。在一个实施方案中,比较基于每一预后基因的绝对或相对的外周血表达水平。在另一个实施方案中,比较基于两个或两个以上预后基因表达水平间的比值。还在另一个实施方案中,比较通过使用诸如k-近邻算法或加权投票算法进行。
在一个实施方案中,被评价的目的患者患有RCC,并且临床结果通过CCI-779治疗的疗效测定。RCC预后基因实例描述于表2和表3。在一个实例中,在结果预测中采用的RCC预后基因包括选自表2的至少一个基因。在许多情况下,RCC预后基因包括从表2选择的两个或两个以上基因,例如选自基因编号1-7的至少一个基因和选自基因编号8-14的至少另一个基因。如此选择的基因可用于预测目的RCC患者的TTD。在另一个实例中,在结果预测中采用的RCC预后基因包括选自表3的至少一个基因。在许多情况下,RCC预后基因包括选自表3的两个或两个以上基因,例如选自基因编号1-14的至少一个基因和选自基因编号15-28的至少另一个基因。如此选择的基因可用于预测目的RCC患者的TTP。在更多的实例中,在结果预测中采用的RCC预后基因包括选自表4的分类器(classifier),并且使用k-近邻算法或加权投票算法将目的RCC患者表达谱与参照表达谱比较。
本发明也涉及用于目的患者中实体瘤预后或者选择治疗法的系统。系统包括(1)包含代表着一个或多个预后基因在目的患者外周血样品中的表达谱数据的第一个储存介质,(2)包含代表着预后基因的至少一种参照表达谱数据的第二个储存介质,(3)能够将目的患者的表达谱与参照表达谱相比较的程序,和(4)能够执行程序的处理器。如通过Affymetrix HG-U133 A基因芯片所测定,预后基因在患有实体瘤的患者PBMC中的表达水平与患者的临床结果相关。在一个实施方案中,目的患者患有RCC,并且预后基因选自表2和表3。
此外,本发明涉及用于目的患者中实体瘤预后或用于选择患者中实体瘤治疗法的试剂盒。每一试剂盒包括探测实体瘤预后基因,如选自表2和表3的RCC预后基因的探针。
本发明的其它特征、目的和优点在下面的详细描述中是显而易见的。然而,应该理解,指出本发明实施方案的详细描述仅以图解说明的方式给出,而不是限制性的。在本发发明范围内的多种变化和修改对阅读详细描述的本领域技术人员而言是显而易见的。
附图简述
提供附图用于图解说明,不是限制性的。
图1A说明用于在留出交叉验证法下预测长TTD相对短TTD的具有渐增大小(从2至200)的近邻分类器的准确度。具有最高准确度的最小的优化预测模型是6-基因分类器,总体准确度为71%,在图中用箭头标记。
图1B显示用于在10-折交叉验证法下预测长TTD相对短TTD的具有渐增大小(从2至200)的近邻分类器的准确度。具有最高准确度的最小的优化预测模型是14-基因分类器,总体准确度为71%,在图中用箭头标记。
图1C说明用于在4-折交叉验证法下预测长TTD相对短TTD的具有渐增大小(从2至200)的近邻分类器的准确度。具有最高准确度的最小的优化预测模型是14-基因分类器,总体准确度为69%,在图中用箭头标记。
图2A说明用于在留出交叉验证法下预测长TTP相对短TTP的具有渐增大小的近邻分类器的准确度。具有最高准确度的最小的优化预测模型是8-基因分类器,总体准确度为86%,在图中用箭头标记。
图2B显示用于在10-折交叉验证法下预测长TTP相对短TTP的具有渐增大小的近邻分类器的准确度。具有最高准确度的最小的优化预测模型是28-基因分类器,总体准确度为88%,在图中用箭头标记。
图2C说明用于在4-折交叉验证法下预测长TTP相对短TTP的具有渐增大小的近邻分类器的准确度。具有最高准确度的最小的优化预测模型是8-基因分类器,总体准确度为88%,在图中用箭头标记。
发明详述
本发明提供了用于RCC或其它实体瘤预后以及选择RCC或其它实体瘤的治疗法的方法。这些方法采用在具有不同临床结果的实体瘤患者外周血样品中差异表达的预后基因。在基于类别的相关模型下,这些预后基因中的许多基因的外周血表达谱与患者的临床结果相关。在许多实施方案中,基于实体瘤患者的临床结果可以将他们分成至少两个类别,并且在相邻分析中预后基因的治疗前PBMC表达谱与类别特征相关,其中类别特征代表着这些基因在两个类别患者的PBMC中的理想化表达模式。
本发明的预后基因可以用作预测RCC或其它实体瘤患者临床结果的替代标志。本发明的预后基因还可以用于鉴定或者选择RCC或其它实体瘤的有利治疗法。由于疾病的分子机制存在个体异质性,所以不同的患者对于治疗性治疗会具有不同的临床反应。对与患者反应相关的基因表达模式的鉴定允许临床医生根据所预测出的患者反应来选择治疗法,从而避免了不良反应。这改善了临床试验的有效性和安全性并且提高了药物和其它治疗性治疗法的效益/风险比。外周血是通常可以以最低限度入侵方式从患者得到的组织。本发明通过确定患者结果与外周血样品中的基因表达谱之间的相关性,在临床药物基因组学与实体瘤治疗中表现出明显的进步。
本发明的多个不同方面在下面亚部分中进一步详细描述。使用亚部分不意味着对发明进行限制。每一亚部分可以应用于本发明的任何方面。在该申请中,除非另外说明,“或者”意味着“和/或”。
I.用于鉴定实体瘤预后基因的一般方法
先前研究表明,实体瘤患者与无疾病受试者的PBMC基线表达谱明显不同。参见2003年11月21日提出的美国专利申请系列号10/717,597、2003年4月3日提出的美国临时申请系列号60/459,782、2002年11月21日提出的美国临时申请系列号60/427,982,它们在此引用作为参考。研究还表明,PBMC中的基因表达谱可预测抗癌症药物的体内活性。参见2004年3月5日提出的美国专利申请系列号10/793,032、2004年2月11日提出的美国专利申请系列号10/775,169、2003年2月11日提出的美国临时申请系列号60/446,133,它们在此引用作为参考。此外,研究显示,PBMC基线表达谱与RCC或其它非血液疾病的临床结果相关。参见2004年4月29日提出的美国专利申请系列号10/834,114、2004年1月23日提出的美国临时专利申请系列号60/538,246、2003年4月29日提出的美国临时专利申请系列号60/466,067。
本发明进一步评价了外周血基因表达与RCC或其它实体瘤临床结果之间的相关性。用于RCC或其它实体瘤的预后基因可以根据本发明鉴定。这些基因在具有不同临床结果的实体瘤患者外周血样品中差异表达。这些基因中的许多基因的外周血表达谱与不同结果类别患者间的类别特征相关。在许多实施方案中,外周血表达谱是代表着开始对患者治疗前外周血基因表达的基线谱。还可以选择外周血表达谱代表治疗过程中的基因表达。适于本发明的相关性分析包括但不限于近邻分析(Golub等人,Science,286:531-537(1999))、微列阵(SAM)显著性方法(Tusher等人,Proc.Natl.Acad.Sci.U.S.A.,98:5116-5121(2001))或者其它基于类别的相关性度量法。
适用于本发明的实体瘤包括但不限于RCC、前列腺癌、头/颈癌、卵巢癌、睾丸癌、脑瘤、乳腺癌、肺癌、结肠癌、胰腺癌、胃癌、膀胱癌、皮肤癌、子宫颈癌、子宫癌和肝癌。可使用直接和间接呈现方法测量和评价实体瘤。适于的呈现方法包括但不限于扫描(例如X-射线扫描、计算机控制轴向断层扫描(CT)、磁共振影像(MRI)、正电子放射层扫描术(PET)或者超声断层扫描(U/S))、活组织检查、触诊、内窥镜检查法、腹腔镜检查以及本领域技术人员意识到的其它适宜方法。
可通过多种标准评价实体瘤的临床结果。在许多实施方案中,临床结果基于患者对治疗性治疗的反应评价。临床结果测量的实例包括但不限于完全有效、部分有效、微效、疾病稳定、疾病进展、疾病进展时间(TTP)、到死亡时间(TTD或生存期)或其任意组合。实体瘤治疗法实例包括但不限于药物治疗(例如CCI-779治疗)、化学治疗、激素治疗、放射治疗、免疫治疗、手术、基因治疗、抗血管生成治疗、缓解性治疗、或其它常规或非常规治疗法或其任意组合。
在一个实施方案中,临床结果基于WHO报告标准(WHO ReportingCriteria)评价,例如WHO出版物第48号(世界卫生组织,日内瓦,瑞士,1979)中描述的那些标准。在这些标准下,在每一次评估中测量一维或二维可测量的损害。当多处损害存在于任何器官中时,如果可能则选择多达6个代表性损害。
在一个实例中,临床结果基于由临床分类如完全有效、部分有效、微效、疾病稳定、疾病进展或其任意组合组成的分类系统确定。“完全有效”(CR)意味着在不少于4周间隔的两次观察测定中所有可测量和评价的疾病完全消失。没有新的损害和疾病相关的症状。关于二维可测量疾病,“部分有效”(PR)意味着,如通过在不少于4周间隔的两次观察所测定,所有可测量损害的最大正交直径乘积的和降低至少大约50%。关于一维可测量疾病,“部分有效”意味着,如通过在不少于4周间隔的两次观察所测定,所有损害的最大直径的和降低至少大约50%。为了限定部分有效,没有必要所有损害消退,但是损害应该没有进展并且没有新的损害出现。评价应该是客观的。关于二维可测量疾病,“微效”意味着所有可测量损害的最大正交直径乘积的和减少大约25%或更多但小于大约50%。关于一维可测量疾病,“微效”意味着所有损害的最大直径的和减少大约25%但小于大约50%。
关于二维可测量疾病,“疾病稳定”(SD)意味着所有可测量损害的最大正交直径乘积的和减少大约25%或增加大约25%。关于一维可测量疾病,“疾病稳定”意味着所有损害的直径的和减少大约25%或增加大约25%。没有新的损害出现。“疾病进展”(PD)指至少一个二维(最大正交直径的乘积)或一维可测量损害的大小增加大约25%或更多或者出现新的损害。如果通过细胞学检查证实为阳性,则胸腔积液或腹水的出现也认为是疾病进展。对于疾病进展,骨的病理性骨折或塌陷无需明显。
还在另一个实施方案中,对于一维和二维可测量疾病的总体的受试者肿瘤效果按照表1确定。
                  表1.总体的受试者肿瘤效果
  在二维可测量疾病中的效果   在一维可测量疾病中的效果   总体的受试者肿瘤效果
  PD   任意   PD
  任意   PD   PD
  SD   SD或PR   SD
  SD   CR   PR
  PR   SD或PR或CR   PR
  CR   SD或PR   PR
  CR   CR   CR
对于非可测量疾病的总体受试者肿瘤效果可以以例如下列情况评价:
a)总体完全有效:如果存在非可测量疾病,则疾病应完全消失。否则,受试者不能被认为是“总体完全有效者”
b)总体进展:在非可测量疾病大小显著增加或者出现新损害的情况下,总体的效果是进展。
临床结果还可以通过其它标准评价。例如,通过TTP或TTD测量临床结果。TTP指从开始治疗性治疗之日直到测定出疾病进展的第一天的间隔。TTD指从开始治疗性治疗之日直到死亡时间的间隔,或者直到经检查已知仍然活着的最后一天的间隔。
实体瘤患者可以基于他们各自的临床结果分类。实体瘤患者还可以通过使用传统的临床风险评估方法分类。在许多情况下,这些风险评估方法采用许多预后因素将患者分成不同的预后或风险组。一个实例是如Motzer等人,J Clin Oncol,17:2530-2540(1999)中描述的用于RCC的Motzer风险评估。不同风险组中的患者会对治疗具有不同的反应。
在许多情况下,用于鉴定预后基因的外周血样品是“基线”或“治疗前”样品。这些样品在治疗性治疗之前从各个患者分离,并且可以用于鉴定这样的基因,即其基线外周血表达谱与响应治疗的患者结果相关。在其它治疗或疾病分期分离的外周血样品也可以用于鉴定实体瘤预后基因。
多种类型的外周血样品可以用于本发明。在一个实施方案中,外周血样品是全血样品。在另一个实施方案中,外周血样品包含富集的PBMC。“富集的”意思是指样品中PBMC百分数高于全血中的百分数。在一些情况下,在富集的样品中PBMC百分数比全血高至少1、2、3、4、5或更多倍。在一些其它情况下,在富集的样品中PBMC百分数为至少90%、95%、98%、99%、99.5%或更高。包含富集的PBMC的血液样品可以使用本领域众所周知的任何方法制备,例如使用菲可梯度离心或CPT(细胞纯化管)。
外周血基因表达谱与患者结果之间的关系可通过使用总体基因表达分析来评估。适用于该目的的方法包括但不限于核酸列阵(例如cDNA或寡核苷酸列阵)、2维SDS聚丙稀凝胶电泳/质谱以及其它高通量核苷酸或多肽检测技术。核酸列阵允许同时定量检测大量基因的表达水平。核酸列阵的实例包括但不限于来自Affymetrix(Santa Clara,CA)的Genechip微列阵、来自Agilent Technologies(Palo Alto,CA)的cDNA微列阵以及在美国专利号6,288,220和6,391,562中描述的珠列阵。
待与核酸列阵杂交的多核苷酸可用一个或多个标记部分标记,以便允许检测杂交的多核苷酸复合物。标记部分可以包括通过光谱、光化学、生物化学、生物电子学、免疫化学、电学、光学或化学手段可检测的成分。示例性的标记部分包括放射同位素、化学发光化合物、标记的结合蛋白、重金属原子、光谱标记物如荧光标记物和染料、磁性标记物、连接的酶、质谱标签、自旋标记物、电子转移供体和受体等。也可使用未标记的多核苷酸。多核苷酸可以是DNA、RNA或其修饰形式。
杂交反应可在绝对或差别的杂交形式下进行。在绝对杂交形式下,源自一个样品的多核苷酸,例如源自所选择结果类别的患者的PBMC与核酸列阵上的探针杂交。将在杂交复合物形成后检测的信号与样品中的多核苷酸水平相关联。在差别杂交形式下,源自两个生物样品的多核苷酸,例如源自第一类结果类别的患者的一种多核苷酸和源自第二类结果类别的患者的另一种多核苷酸用不同的标记部分标记。将这些不同标记的多核苷酸混合物加入到核酸列阵中。然后在源自两个不同标记物的发射光可个别检测的情况下,检查核酸列阵。在一个实施方案中,荧光团Cy3和Cy5(Amersham Pharmacia Biotech,Piscataway NJ.)用作差异杂交形式下的标记部分。
从核酸列阵收集到的信号可以使用商业可获得的软件分析,例如Affymetrix或Agilent Technologies提供的那些软件。在杂交实验中包括用于扫描灵敏度、探针标记和cDNA/cRNA定量的对照。在许多实施方案中,在进一步分析之前将核酸列阵表达信号换算并归一化。例如,当在相似测试条件下使用一个以上列阵时,可将对于每一基因的表达信号归一化,以便考虑杂交强度的变异。对于各个多核苷酸复合物杂交的信号也可以使用源自每一列阵所包含的内部归一化对照的强度归一化。另外,在样品中表达水平相对一致的基因可用于将其它基因的表达水平归一化。在一个实施方案中,基因的表达水平在样品中归一化,以致于平均值为零且标准差为1。在另一个实施方案中,将通过核酸列阵检测到的表达数据进行变异过滤,其中排除了在所有样品中显示变异最小或可忽略的基因。
可以使用多种方法将从核酸列阵收集的基因表达数据与临床结果关联起来。适宜的相关性方法包括但不限于统计学方法(例如Spearman秩相关、Cox比例风险回归模型、ANOVA/t检验或者其它适宜的秩检验或存活模型)和基于类别的相关性度量法(例如近邻分析)。
在一个实施方案中,患有特定实体瘤的患者根据他们的临床分层(clinical stratification)被分成至少两个类别。外周血基因表达(例如PBMC基因表达谱)与临床结果之间的相关性通过监督聚类或学习算法分析。示例性监督聚类或学习算法包括但不限于近邻分析、支持向量机制、SAM方法、人工神经网络以及SPLASH。在监督算法下,每一类别患者的临床结果或者是已知的或者是可确定的。可以鉴定出在一个类别患者与另一类别患者外周血细胞(例如PBMC)中差异表达的基因。在许多情况下,如此鉴定的基因与两个类别患者间的类别特征在相对大程度上相关。如此鉴定的基因可用作预测目的患者中实体瘤临床结果的替代标志。
在另一个实施方案中,患有特定实体瘤的患者根据他们的外周血基因表达谱被分成至少两个类别。适于该目的的方法包括非监督聚类算法,例如自组织图(SOM)、k-means、主成分分析以及分级聚类。在一个类别中,相对大数量(例如至少50%、60%、70%、80%、90%或更多)的患者具有第一种临床结果,在另一类别中相对大数量的患者具有第二种临床结果。可以鉴定出在一个类别患者相对于另一类别患者的外周血细胞中差异表达的基因。这些基因也是实体瘤的预后基因。
在一个实例中,患有特定实体瘤的患者根据他们的临床分层(clinicalstratification)或外周血基因表达谱被分成三个类别或三个以上类别。可以采用多类别相关性度量法鉴定在这些类别中差异表达的基因。示例性多类别相关性度量法包括但不限于由Whitehead Institute的MIT Center forGenome Research(Cambridge,MA)所提供的GeneCluster 2软件所采用的那些方法。
在更多的实施方案中,近邻分析(也称作相邻分析)用于分析从核酸列阵收集的基因表达数据。用于近邻分析的算法描述于Golub等人,Science,286:531-537(1999);Slonim等人,Procs.of the Fourth Annual InternationalConference on Computational Molecular Biology,Tokyo,Japan,4月8-11,第263-272页,(2000);以及美国专利号6,647,341;所有这些文献在此引用作为参考。根据一种形式的近邻分析,每一基因的表达谱由表达向量g=(e1,e2,e3,...,en)代表,其中ei对应于基因“g”在第i个样品中的表达水平。类别特征可以由理想化表达模式c=(c1,c2,c3,...,cn)代表,其中ci=1或-1,这取决于第i个样品是从类别0或类别1分离的。类别0可包括具有第一种临床结果的患者,并且类别1包括具有第二种临床结果的患者。其它形式的类别特征也可以采用。一般类别特征代表理想化表达模式,其中基因的表达水平在一个类别的样品中一律高并且在另一类别的样品中一律低。
基因“g”和类别特征间的相关性可以通过信噪比分值测定:
        P(g,c)=[μ1(g)-μ2(g)]/[σ1(g)+σ2(g)]
其中μ1(g)和μ2(g)分别代表基因“g”在类别0和类别1中的log变换形式的表达水平的平均值,σ1(g)和σ2(g)分别代表基因“g”在类别0和类别1中的log变换形式的表达水平的标准差。较高的信噪比绝对分值表明,基因在一个类别中比在另一个类别中表达更高。在一个实例中,用于得出信噪比分值的样品包含富集的或纯化的PBMC,因此信噪比分值P(g,c)代表着类别特征与基因“g”在PBMC中的表达水平之间的相关性。
基因“g”与类别特征之间的相关性还可以通过其它方法测定,例如使用本领域技术人员意识到的Pearson相关性系数或Euclidean距离。
可以使用随机排列检验评价外周血基因表达谱与类别特征之间相关性的显著性。与随机模式相比,基因在类别特征的近邻中密度异常高,表明许多基因的表达模式与类别特征显著相关。基因与类别特征之间的相关性可以通过近邻分析图观察,在近邻分析图中,y-轴代表类别特征周围不同近邻内的基因数量,x-轴指出近邻的大小(即P(g,c))。在图中还包括了显示对于随机排列类别特征的相应近邻内的基因数量的不同显著性水平的曲线。
在许多实施方案中,本发明采用的预后基因与两个结果类别间的类别特征基本相关。例如,本发明采用的预后基因高于近邻分析图中中值显著性水平。这意味着,对于每一预后基因的相关性测量是如下的情况,即在中值显著性水平上具有P(g,c)大小的类别特征的近邻内的基因数量大于随机排列类别特征的相应近邻内的基因数量。又例如,本发明采用的预后基因可高于10%、5%、2%或1%的显著性水平。如本文所使用,x%的显著性水平意味着,x%的随机近邻包含的基因与类别特征周围的真正近邻一样多。
本发明的预后基因可以产生类别预测器(class predictor)。这些类别预测器可用于将目的患者实体瘤归于一个类别。在一个实施方案中,类别预测器中的预后基因限于通过排列测试与类别特征显著相关的那些基因,例如高于1%、2%、5%、10%、20%、30%、40%或50%显著性水平的那些基因。在另一个实施方案中,类别预测器中的每一预后基因在一个类别患者的PBMC中的表达水平显著高于或显著低于另一类别患者的PBMC中的表达水平。还在另一个实施方案中,类别预测器中的预后基因具有最高的P(g,c)绝对值。还在另一个实施方案中,对于类别预测器中每一预后基因的student t-检验的p值(例如双尾分布,两样品不等方差)不大于0.05、0.01、0.005、0.001、0.0005、0.0001或更小。P值表明预后基因在一个类别患者和另一类别患者中的PBMC表达谱之间差异的统计学显著性。p越低表明在不同类别实体瘤RCC患者中观察到的差异的统计学显著性越高。
还可以使用SAM方法将外周血基因表达谱与临床结果类别关联起来。微列阵预测分析(PAM)方法可用于鉴定能最好地表征预定结果类别并预测新样品的类别的基因集。参见Tibshirani等人,Proc.Natl.Acad.Sci.U.S.A.,99:6567-6572(2002)。
在许多实施方案中,本发明的类别预测器在留出交叉验证法、10-折交叉验证法或4-折交叉验证法情况下具有至少50%的预测准确度。在代表性的k-折交叉验证法,数据被分成大小几乎相等的k个亚组。将模型训练k次,每一次从训练中留出亚组之一并且使用留出的亚组作为测试样品以计算预测误差。如果k等于样品大小,则其变成留出交叉验证法。在许多情况下,本发明的类别预测器在留出交叉验证法、10-折交叉验证法或4-折交叉验证法的情况下具有至少60%、70%、80%、90%、95%或99%的准确度。
其它的基于类别的相关性度量法或统计学方法也可以用于鉴定其在外周血样品中的表达谱与实体瘤患者临床结果相关的预后基因。这些方法中的许多方法可以通过使用公用软件或商业软件开展。
能够鉴定实体瘤预后基因的其它方法包括但不限于RT-PCR、Northern印迹、原位杂交以及免疫分析法如ELISA、RIA或Western印迹。这些基因在一个类别患者外周血细胞(例如PBMC)中相对于另一类别患者外周血细胞差异表达。在许多情况下,这些基因中的每一个在一个类别患者中的平均外周血表达水平与在另一类别患者中的表达水平具有统计学差异。例如,在适当的统计学差异检测(例如Student t-检验)情况下,对于所观察到的差异的p值可以不大于0.05、0.01、0.005、0.001、0.0005、0.0001或更小。在许多其它情况下,如此鉴定的每一预后基因在一个类别患者与另一类别患者之间的平均PBMC表达水平具有至少2倍、3倍、4倍、5倍、10倍或20倍的差异。
根据本发明可以类似地鉴定用于其它非血液疾病的预后基因,其中在这些基因的外周血表达谱与患者结果之间的相关性具有统计学意义。因此,这些预后基因的外周血表达模式指示着患有这些非血液疾病的患者的临床结果。
II.使用HG-U133 A微列阵鉴定RCC预后基因
RCC包括多数的所有情况下的肾脏癌症并且是工业国家中最常见的十种癌症之一,其占成年恶性肿瘤的2%和癌症相关死亡人数的2%。已经开发出几种预后因素和分值指标用于诊断患有RCC的患者,有代表性的是几种关键指示物的多变量评估。例如,一个预后分值系统采用了Motzer等人,J Clin Oncol,17:2530-2540(1999)中提出的5个预后因素,即Karnofsky行为状态、血清乳酸脱氢酶、血色素、血清钙以及存在/缺乏先前的肾切除术。
本发明鉴定了其外周血表达谱与CCI-779治疗中的患者结果相关的RCC预后基因。在RCC患者中评估了抑制细胞生长的mTOR抑制剂CCI-779的抗癌效果。在CCI-779治疗前收集PBMC,并在寡核苷酸列阵(HG-U133A,Affymetrix,Santa Clara,CA,USA)上分析以便确定来自RCC患者的单核细胞是否拥有预示患者结果的转录模式。
在CCI-779治疗之前,从参与2期临床试验研究的45名晚期RCC患者(18名女性,27名男性)的外周血分离PBMC。从所有个体收到了药物基因组部分临床研究的书面知情同意书并且该项目征得了开展临床研究地点的当地伦理委员会的批准。在临床地点将RCC肿瘤患者分成了常规(透明细胞)癌亚型(24)、颗粒细胞癌亚型(1)、乳头状癌亚型(3)或混合亚型(7)。10个肿瘤被分为未知类型。RCC患者主要是白人后裔(44个是白人,1个是美国黑人),平均年龄58岁(范围在40-78岁之间)。入选标准包括,患者患有在组织学上证实的晚期肾癌,其已经接受过针对晚期疾病的先前治疗或者没有接受过针对晚期疾病的先前治疗但不适合接受高剂量IL-2治疗。其它入选标准包括:患者具有(1)二维可测量疾病的证据;(2)在进入研究之前疾病进展的证据;(3)年满18岁或更大;(4)ANC>1500/μL,血小板>100,000/μL并且血色素>8.5g/dL;(5)足够的肾功能,血清肌酸酐<1.5×正常上限;(6)足够的肝功能,胆红素<1.5×正常上限并且AST<3×正常上限(或者,如果存在肝转移的话AST<5×正常上限);(7)血清胆固醇<350mg/dL,甘油三酯<300mg/dL;(8)ECOG行为状态0-1;并且(9)至少12周的期望寿命。排除标准包括患者(1)存在已知的CNS转移;(2)在给药开始3周内进行过手术或放射治疗;(3)在给药开始4周内进行过RCC化学治疗或生物治疗;(4)在给药开始4周内用先前的研究试剂治疗过;(5)免疫妥协状态,包括已知HIV阳性或者并行使用免疫抑制剂(包括皮质类固醇)的那些;(6)具有活动性感染;(7)需要用抗惊厥疗法治疗;(8)在对威胁生命的心率失常治疗6个月内或治疗过程中出现不稳定的绞痛/心肌梗塞;(9)在过去的3年内具有先前恶性肿瘤历史;(10)对大环内酯抗生素超敏;以及(11)妊娠或者基本上会增加与参加研究相关危险的任何其它疾病。
在试验过程中,每周静脉内(IV)灌注30分钟施用3种CCI-779剂量(25mg、75mg或250mg)之一,来治疗晚期RCC患者。CCI-779是免疫抑制剂瑞帕霉素的酯类似物,并且因此它是瑞帕霉素哺乳动物靶标的有效的、选择性抑制剂。瑞帕霉素哺乳动物靶标(mTOR)激活多个信号途径,包括p70s6激酶的磷酸化,这导致编码参与翻译并进入细胞周期G1期的蛋白质的5′TOP mRNA翻译增加。由于CCI-779对mTOR和细胞周期控制具有抑制性作用,所以其用作抑制细胞生长剂和免疫抑制剂。
在治疗前和起始CCI-779治疗后每8周记录临床分级和残留、复发和转移癌的大小。肿瘤大小以厘米测定并报告为最大直径与其正交直径的乘积。可测量疾病被定义为通过CT扫描、X-射线或触诊测量的两个直径>1.0cm的任何二维可测量的损害。通过所有可测量损害的乘积的和确定肿瘤的反应。临床效果的种类通过临床治疗规定给出(即疾病进展、疾病稳定、微效、部分有效和完全有效)。还可使用Motzer风险评估下的预后种类(良好,中等,差)。在45个RCC患者,经风险评估6个为良好,17个为中等,22个预后差。除了直接分离以外,还检测了总生存期和疾病进展时间作为临床判定终点。
在CCI-779治疗前,从45名RCC患者分离基线样品。按照产品说明书,将45个基线样品中的42个样品与HG-U133A基因芯片杂交。参见GeneChip表达分析-技术手册(Part No.701021 Rev.3,Affymetrix,Inc.1999-2002),其全部内容在此引用作为参考。通过MAS 5算法从探针强度计算信号,并且使用如实施例中所述的尺度频率归一化方法将信号强度转化成频率。
基于106天TTP和一年TTD的临床分层将与U133 A基因芯片杂交的所有PBMC谱分类。采用了包括留出交叉验证法、10-折交叉验证法和4-折交叉验证法在内的几种交叉验证方法评估指定类别的准确度。近邻算法用于产生具有渐增大小的基因分类器,其通过多种交叉验证法评估。鉴定了通过3种交叉验证方法中的每一个对类别的指定具有最高准确度的分类器。
具体而言,构建了由选自表2和表3的基因组成的分类器并且通过3种交叉验证方法评估了预测准确度。这些分类器的实例列于表4。评估了分类器1-7对短生存期(少于365天)患者与更长生存期(多于365天)患者的辨别,并且评估了分类器8-21对短TTP(少于106天)患者与更长TTP(多于106天)患者的辨别。
对于两个临床分层,三种交叉验证方法对类别的指定给出了类似的准确度。对与U133A芯片杂交的42个PBMC样品进行交叉验证分析,根据一年的生存期进行分类的结果描述于表1A-1C,根据3个月TTP进行分类的结果描述于表2A-2C。基于与Affymetrix HG-U95A芯片杂交的训练组样品的基因分类器中的少数几个转录序列(参见例如美国专利申请系列号10/834,114中的表20和21)也示于表2和表3(例如与短期TTP高度相关的蛋白激酶Cδ以及与较短生存期高度相关的MD-2蛋白)。
                    表2.辨别经历短生存期(小于1年)与更长生存期(大于1年)患者的基因
  基因编号  患者类别 限定符  基因符号 基因描述 Unigene
  1  TTD小于365天 217972_at  FLJ20420 假定蛋白质FLJ20420 Hs.6693
  2  TTD小于365天 201989_s_at  CREBL2 CAMP应答元件结合蛋白样2 Hs.13313
  3  TTD小于365天 209482_at  RPP20 POP7(前体加工,酿酒酵母(S.cerevisiae))同系物 Hs.18747
  4  TTD小于365天 210186_s_at  FKBP1A FK506结合蛋白1A(12kD) Hs.179661
  5  TTD小于365天 206584_at  MD-2 MD-2蛋白 Hs.69328
  6  TTD小于365天 200785_s_at  LRP1 低密度脂蛋白相关蛋白1(α-2-巨球蛋白受体) Hs.89137
  7  TTD小于365天 203645_s_at  CD163 CD163抗原 Hs.74076
  8  TTD大于365天 215275_at  UNK_AW963138
  9  TTD大于365天 202547_s_at  ARHGEF7 Rho鸟苷酸交换因子(GEF)7 Hs.172813
  10  TTD大于365天 221736_at  UNK_AA156777 Hs.25431
  11  TTD大于365天 212231_at  FBXO21 F-box only protein 21 Hs.184227
  12  TTD大于365天 211256_x_at  BTN2A1 嗜乳脂蛋白,亚家族2,成员A1 Hs.169963
  13  TTD大于365天 208723_at  USP11 泛素特异性蛋白酶11 Hs.171501
  14  TTD大于365天 208774_at  CSNK1D 酪蛋白激酶1,δ Hs.75852
                表3.辨别经历短TTP(小于106天)与更长TTP(大于106天)患者的基因
  基因编号  患者类别 限定符  基因符号 基因描述  Unigenc
  1  TTP小于106天 208918_s_at  FLJ13052 NAD激酶  Hs.220324
  2  TTP小于106天 214084_x_at  NCF1 嗜中性粒细胞胞浆因子1(47kD,慢性肉芽肿病,常染色体1)  Hs.1583
  3  TTP小于106天 202146_at  IFRD1 干扰素相关发育调节物1  Hs.7879
  4  TTP小于106天 202545_at  PRKCD 蛋白激酶C,δ  Hs.155342
  5  TTP小于106天 211133_x_at  LILRB3 白细胞免疫球蛋白样受体,亚家族B(带有TM和ITIM结构域),成员3  Hs.105928
  6  TTP小于106天 204961_s_at  NCF1 嗜中性粒细胞胞浆因子1(47kD,慢性肉芽肿病,常染色体1)  Hs.1583
  7  TTP小于106天 205483_s_at  ISG15 干扰素刺激的蛋白,15kD  Hs.432233
  8  TTP小于106天 202086_at  MX1 黏液病毒(流感病毒)抗性1,干扰素诱导蛋白p78(小鼠)  Hs.76391
  9  TTP小于106天 203104_at  CSF1R 集落刺激因子1受体,以前称作McDonough猫肉瘤病毒(v-fms)癌基因同系物  Hs.174142
  10  TTP小于106天 205922_at  VNN2 血管非炎性蛋白2  Hs.121102
  11  TTP小于106天 213931_at  ID2 DNA结合抑制剂2,显性失活螺旋-环-螺旋蛋白  Hs.180919
    12  TTP小于106天 203514_at  MAP3K3 丝裂原活化蛋白激酶激酶激酶3  Hs.29282
    13  TTP小于106天 204336_s_at  RGS19 G蛋白信号调节物19  Hs.422336
    14  TTP小于106天 221541_at  DKFZP434B044 假定蛋白质DKFZp434B044  Hs.262958
    15  TTP大于106天 217802_s_at  UNCKS 类似于大鼠细胞核遍在酪蛋白激酶2  Hs.118064
    16  TTP大于106天 201019_s_at  EIF1A 真核翻译起始因子1A  Hs.4310
    17  TTP大于106天 212231_at  FBXO21 F-box only protein 21  Hs.184227
    18  TTP大于106天 203156_at  AKAP11 A激酶(PRKA)锚定蛋白11  Hs.232076
    19  TTP大于106天 206545_at  CD28 CD28抗原(Tp44)  Hs.1987
    20  TTP大于106天 218014_at  FLJ12549 frount  Hs.184352
    21  TTP大于106天 203712_at  KIAA0020 KIAA0020基因产物  Hs.2471
    22  TTP大于106天 221452_s_at  MGC1223 假定蛋白质MGC1223  Hs.273077
    23  TTP大于106天 212168_at  RBM12 RNA结合基序蛋白12  Hs.180895
    24  TTP大于106天 213111_at  KIAA0981 KIAA0981蛋白  Hs.158135
    25  TTP大于106天 214669_x_at  IGKC 免疫球蛋白κ恒定区  Hs.406565
    26  TTP大于106天 219423_x_at  TNFRSF12 肿瘤坏死因子受体超家族,成员12(易位链相关膜蛋白)  Hs.180338
    27  TTP大于106天 204642_at  EDG1 内皮细胞分化,神经鞘脂类G蛋白偶联受体,1  Hs.154210
    28  TTP大于106天 201477_s_at  RRM1 核糖核苷酸还原酶M1多肽  Hs.2934
                        表4.分类器实例
    分类器 基因  预测的患者类别
    1 表2中基因编号1和8  TTD小于1年对TTD大于1年
    2 表2中基因编号1-2和8-9  TTD小于1年对TTD大于1年
    3 表2中基因编号1-3和8-10  TTD小于1年对TTD大于1年
    4 表2中基因编号1-4和8-11  TTD小于1年对TTD大于1年
    5 表2中基因编号1-5和8-12  TTD小于1年对TTD大于1年
    6 表2中基因编号1-6和8-13  TTD小于1年对TTD大于1年
    7 表2中基因编号1-14  TTD小于1年对TTD大于1年
    8 表3中基因编号1和15  TTP小于106天对TTP大于106天
    9 表3中基因编号1-2和15-16  TTP小于106天对TTP大于106天
    10 表3中基因编号1-3和15-17  TTP小于106天对TTP大于106天
    11 表3中基因编号1-4和15-18  TTP小于106天对TTP大于106天
    12 表3中基因编号1-5和15-19  TTP小于106天对TTP大于106天
    13 表3中基因编号1-6和15-20  TTP小于106天对TTP大于106天
    14 表3中基因编号1-7和15-21  TTP小于106天对TTP大于106天
    15 表3中基因编号1-8和15-22  TTP小于106天对TTP大于106天
    16 表3中基因编号1-9和15-23  TTP小于106天对TTP大于106天
    17 表3中基因编号1-10和15-24  TTP小于106天对TTP大于106天
    18 表3中基因编号1-11和15-25  TTP小于106天对TTP大于106天
    19 表3中基因编号1-12和15-26  TTP小于106天对TTP大于106天
    20 表3中基因编号1-13和15-27  TTP小于106天对TTP大于106天
    21 表3中基因编号1-28  TTP小于106天对TTP大于106天
表2和表3中的基因的治疗前PBMC表达水平分别与RCC患者的生存期和进展时间相关,因此能够预测生存期和进展时间。如在表2和表3中所使用,如果基因在一个类别患者中的平均PBMC表达水平高于在另一个类别患者中的平均PBMC表达水平,则基因与该类患者“相关”。例如,基因FLJ20420在TTD小于365天的患者中的平均PBMC表达水平高于在TTD大于365天的患者中的平均PBMC表达水平(参见表2中的基因编号1)。
表2和表3中的每一个HG-U133A限定符代表着HG-U133A基因芯片上的寡核苷酸探针组。通过HG-U133 A限定符所标识的基因的RNA转录物可以在核酸列阵杂交条件下与至少一个该限定符的寡核苷酸探针(PM和完全匹配探针)杂交。优选地,基因的RNA转录物在核酸列阵杂交条件下不与PM探针的错配探针(MM)杂交。除了在错配探针中心处或附近存在单一同数替换以外,错配探针与相应的PM探针完全相同。对于25-merPM探针,MM探针在第13位具有同数碱基变化。
在许多情况下,通过HG-U133 A限定符所标识的基因的RNA转录物可以在核酸列阵杂交条件下与限定符的PM探针的50%、60%、70%、80%、90%或100%杂交,但不与这些PM探针的相应错配探针杂交。在其它许多情况下,对于这些PM探针中每一探针的辨别分值(R)不小于0.015、0.02、0.05、0.1、0.2、0.3、0.4、0.5或更大,如通过相应探针对的杂交强度差异(即PM-MM)与总体杂交强度(即PM+MM)的比值所测定。在一个实例中,当按照产品说明书将基因的RNA转录物与HG-U133A基因芯片杂交时,在默认设置下产生“存在”呼叫信号(call),即阈值Tau为0.015并且显著性水平α1为0.4。参见GeneChip表达分析-数据分析基础(Part No.701190Rev.2,Affymetrix,Inc.,2002),其全部内容在此引用作为参考。
HG-U133 A基因芯片上每一PM探针序列和衍生PM探针的相应靶序列可从Affymetrix的序列数据库得到。参见例如www.affymetrix.com/support/technical/byproduct.affx?product=hgu133。在HG-U133A基因芯片上的所有PM探针序列和相应靶序列在此引用作为参考。
表2和表3中所列的每一基因和相应的unigene ID按照HG-U133A基因芯片注释鉴别。Unigene由一组非冗余的基因导向簇(gene-orientedcluster)组成。据认为,每一unigene簇包括代表着一个唯一基因的序列。关于表2和表3中所列基因以及它们的相应unigene信息还可以从国立生物技术信息中心(NCBI)(Bethesda,MD)的Entrez Gene和Unigene数据库获得。
除了Affymetrix注释以外,由HG-U133 A限定符所代表的基因还可以通过使用BLAST在人类基因组序列数据库中检索限定符的靶序列来鉴定。适用于该目的的人类基因组序列数据库包括但不限于NCBI人类基因组数据库。NCBI提供了BLAST程序,例如“blastn”,用于检索其序列数据库。在一个实施方案中,通过使用限定符的靶序列的明确片段(即最长的明确片段)在NCBI人类基因组数据库中开展BLAST检索。限定符所代表的基因被鉴定为与明确片段具有显著性序列同一性的那些基因。在许多情况下,所鉴定的基因与明确片段具有至少95%、96%、97%、98%、99%或更高的序列同一性。
如本文所使用,通过表2和表3中的限定符所标识的基因不但包括本文明确描述的那些基因,而且还包括在表中没有列出但能够与表中限定符的PM探针杂交的那些基因。所有这些基因可以用作RCC或其它实体瘤预后的生物标志。
类似地,可以使用HG-U133 A以及近邻分析或另一种监督或非监督聚类/学习算法鉴定其它临床相关分层预后或预测的基因或分类器。同样,如此鉴定的每一分类器的预测准确度、灵敏度或特异性可以通过留出交叉验证法或k-折交叉验证法评估。在一个实例中,k-近邻算法(参见例如Armstrong等人,Nature Genetics,30:41-47(2002))用来选择和评估基因分类器。如此处所使用,“灵敏度”指正确的阳性呼叫信号与真阳性呼叫信号加假阴性呼叫信号之和的比值,“特异性”指正确的阴性呼叫信号与真阴性呼叫信号加假阳性呼叫信号之和的比值。
本领域普通技术人员会意识到,根据本发明可以类似地鉴定出预后或预测患有其它实体瘤的患者临床分层的基因。这些基因的外周血表达水平与这些患者的临床结果相关。
III.RCC或其它实体瘤的预后
本发明的预后基因可以用作RCC或其它实体瘤预后的替代标志。预后基因还可以用于对患有RCC或其它实体瘤的患者选择有利的治疗法。
任何实体瘤或其治疗法可根据本发明评估。可通过多种临床标准测定临床结果,所述临床标准包括但不限于TTP(例如小于或大于特定阶段)、TTD(例如小于或大于特定阶段)、疾病进展、疾病不进展、疾病稳定、完全有效、部分有效、微效或其组合。对治疗性治疗无反应也被认为是一种可测量的结果。
结果预测一般包括将一个或多个预后基因在目的实体瘤患者(例如RCC患者)中的外周血表达谱与至少一种参照表达谱相比较。在结果预测中采用的每一预后基因在具有不同临床结果的实体瘤患者外周血样品中差异表达。这些实体瘤患者具有与目的患者相同的实体瘤。
在一个实施方案中,如此选择用于结果预测的预后基因,即使得在基于类别的相关分析(例如近邻分析或SAM方法)下每一预后基因的外周血表达谱(如通过Affymetrix HG-U133A基因芯片所测定)与类别特征相关,其中类别特征代表所选择基因在具有不同临床结果的实体瘤患者外周血样品中的理想化表达模式。在许多情况下,在随机排列检验情况下,所选择预后基因与类别特征在高于50%、25%、10%、5%或1%的显著性水平上相关。
还可以如此选择预后基因,使得每一预后基因在一个类别实体瘤患者外周血样品中的平均表达谱(如通过Affymetrix HG-U133 A基因芯片所测定)基本不同于另一类别的实体瘤患者。两个类别的患者与目的患者具有相同的实体瘤(例如RCC)。例如,对于所观察到的差异,Student t-检验的p-值可以不大于0.05、0.01、0.005、0.001或更低。此外,可以如此选择预后基因,即使得每一预后基因在一个类别患者中的平均外周血表达水平与另一类别患者存在至少2倍、3倍、4倍、5倍、10倍或20倍的差异。
目的患者的表达谱可以与一个或多个参照表达谱相比较。参照表达谱可以与目的患者的表达谱同时确定。参照表达谱还可以预先确定或预先记录在电子储存介质或其它类型储存介质上。
参照表达谱可以包括代表特定患者外周血基因表达模式的平均表达谱或个体表达谱。在一个实施方案中,参照表达谱包括预后基因在参照患者外周血样品中的平均表达谱,所述参照患者与目的患者具有相同的实体瘤并且其临床结果是已知的或者是可确定的。可使用任何平均化方法,例如算术平均、调和平均、绝对数值的平均值、log变换数值的平均值或加权平均。在一个实例中,所有参照患者具有相同的临床结果。在另一个实例中,参照患者可以分成至少两个类别,每一类别的患者具有各自不同的临床结果。每一类别患者中的平均外周血表达谱构成了分别的参照表达谱,并且将目的患者的表达谱与这些参照表达谱中的每一个相比较。
在另一个实施方案中,参照表达谱包括多个表达谱,其中每一个代表着预后基因在特定患者中的外周血表达模式,所述的特定患者与目的患者具有相同的实体瘤并且其临床结果是已知的或者是可确定的。在本发明中还可以使用其它类型的参照表达谱。
可将目的患者的表达谱与参照表达谱创建成任何形式。在一个实施方案中,表达谱包括在结果预测中所用每一预后基因的表达水平。表达水平可以是绝对水平、归一化水平或相对水平。适宜的归一化方法包括但不限于在核酸列阵基因表达分析中使用的那些以及在Hill等人,Genome Biol,2:research0055.1-0055.13(2001)中描述的那些。在一个实例中,表达水平如此归一化,即使得平均值是零且标准差是一。在一个实例中,如本领域技术人员所意识到的,表达水平基于内部对照或外部对照归一化。还在另一个实例中,表达水平针对在血液样品中丰度已知的一个或多个对照转录物进行归一化。在许多情况下,使用相同或可比的方法创建目的患者的表达谱和参照表达谱。
在另一个实施方案中,被比较的每一表达谱包括不同预后基因表达水平之间的一个和多个比值。表达谱还可以包括能代表基因表达模式的其它度量。
在本发明中使用的外周血样品可以是全血样品或者包含富集的PBMC的样品。在一个实例中,用于制备参照表达谱的外周血样品包含富集的和纯化的PBMC,并且用于制备目的患者表达谱的外周血样品是全血样品。在另一个实例中,在结果预测中采用的所有的外周血样品包含富集的和纯化的PBMC。在许多情况下,使用相同和可比的方法从目的患者和参照患者中制备外周血样品。
其它类型的血液样品也可以用于本发明,只要在患者结果与这些血液样品中的基因表达谱之间存在统计学显著性相关即可。
在本发明中使用的外周血样品可以从处于任何疾病分期和治疗阶段的各个患者分离,只要在这些外周血样品中的基因表达模式与临床结果之间的相关性存在统计学显著性即可。在许多实施方案中,通过患者对治疗性治疗的反应测定临床结果,并且在结果预测中使用的所有的血液样品于治疗性治疗之前分离。因此,来自这些血液样品的表达谱对于治疗性治疗而言是基线表达谱。
表达谱的构建一般包括检测在结果预测中所用每一预后基因的表达水平。为该目的可用多种方法。例如,可以通过测定基因的RNA转录物水平确定基因的表达水平。适宜的方法包括但不限于定量RT-PCT、Northern印迹、原位杂交、狭缝杂交、核酸酶保护分析以及核酸列阵(包括珠列阵)。基因的表达水平还可以通过测定基因所编码多肽的水平确定。适宜的方法包括但不限于免疫测定法(例如ELISA、RIA、FACS和Western印迹)、2-维凝胶电泳、质谱和蛋白质列阵。
在一个方面,预后基因的表达水平通过测定基因在外周血样品中的RNA转录水平来确定。可使用多种方法从外周血样品分离RNA。示例性方法包括异硫氰酸胍/酸性苯酚法、TRIZOLReagent(Invitrogen)和Micro-FastTrackTM 2.0和FastTrackTM 2.0 mRNA分离试剂盒(Invitrogen)。分离的RNA可以是总RNA和mRNA。分离的RNA可以在检测和定量之前被扩增成为cDNA和cRNA。扩增可以是特异性的或非特异性的。适宜的扩增方法包括但不限于反转录PCR(RT-PCR)、恒温扩增、连接酶链反应和Qβ复制酶。
在一个实施方案中,复制过程采用反转录酶。使用反转录酶以及由oligo d(T)与编码噬菌体T7启动子的序列组成的引物,可将分离的mRNA反转录成为cDNA。如此产生的cDNA是单链的。使用DNA聚合酶并组合使用RNA酶(破坏DNA/RNA杂合体)合成cDNA的第二条链。在双链cDNA合成之后,加入T7 RNA聚合酶,从而从双链cDNA的第二条链上转录出cRNA。扩增的cDNA或cRNA可通过与标记探针的杂交检测或定量。还可以在扩增过程中标记cDNA或cRNA,然后检测或定量。
在另一个实施方案中,定量RT-PCR(例如TaqMan,ABI)用于检测或比较目的预后基因的RNA转录物水平。定量RT-PCR包括RNA反转录(RT)成cDNA,然后进行相对定量PCR(RT-PCR)。
在PCR中,所扩增靶DNA的分子数以系数增加,在反应的每一个循环中系数接近于2,直到一些试剂变成限制性的。此后,扩增速度逐渐降低,直到在循环之间所扩增的靶标没有增加。如果以循环数作为X轴并且所扩增靶DNA的浓度的对数作为Y轴作图,则通过将所画的点连接起来得到具有特征形状的曲线。以第一个循环开始,曲线的斜率是正的并且恒定。这就是所述的曲线的线性部分。在一些试剂变成限制性之后,曲线的斜率开始降低并最终变成零。在该点,所扩增靶DNA的浓度变成为渐进于一些固定值。这就是所述的曲线的平台部分。
PCR的线性部分中靶DNA的浓度与PCR开始前靶标的起始浓度成正比。通过确定PCR反应(已经完成了相同的循环数并且处于线性范围内)中靶DNA的PCR产物浓度,可以确定原始DNA混合物中特异靶序列的相对浓度。如果DNA混合物是从分离自不同组织或细胞的RNA合成的,则可以确定各个组织或细胞中特异mRNA(靶序列从其衍生)的相对丰度。在PCR反应的线性范围部分,在PCR产物浓度与相对mRNA丰度之间的正比例关系是可靠的。
曲线平台部分中靶DNA的终浓度通过反应混合物中试剂的可得性确定并且依赖于靶DNA的最初浓度。因此,在一个实施方案中,当PCR反应处于曲线线性部分时取样并定量所扩增的PCR产物。此外,将可扩增cDNA的相对浓度针对一些独立标准物归一化,这会取决于内部存在的RNA种类或者外部引入的RNA种类。还可以确定相对于样品中所有mRNA种类平均丰度的特定mRNA丰度。
在一个实施方案中,PCR扩增利用内部的PCR标准物,该标准物与靶标的丰度近似。如果在PCR扩增产物在线性阶段时取样,则该策略是有效的。如果产物是在反应接近于平台阶段时取样,则丰度较差的产物也变得相对过表达。比较许多不同RNA样品的相对丰度,当检查RNA样品中的差异表达时出现如下歪曲,即RNA的相对丰度小于实际的丰度,则应该如此。如果内部标准物比靶标丰富的多,则这种情况可以得到改善。如果内部标准物比靶标丰富,则可以在RNA样品间进行直接线性比较。
临床样品的固有问题是样品数量和质量可变。如果RT-PCR作为带有内部标准物的相对定量RT-PCR开展时,该问题可以得到克服,其中内部标准物是比靶cDNA片段更长的可扩增cDNA片段并且编码内部标准物的mRNA的丰度比编码靶标的mRNA高大约5-100倍。该测定法测量了各个mRNA种类的相对丰度,而不是绝对丰度。
在另一个实施方案中,相对定量RT-PCR使用外部标准物方案。在该方案中,PCR产物在扩增曲线的线性部分取样。对于每一靶cDNA片段的最佳的取样PCR循环数可通过经验确定。此外,从多种样品中分离的每一RNA群体的反转录产物可归一化,使可扩增cDNA的浓度相等。对扩增曲线线性范围的经验确定以及对cDNA样品的归一化是单调且耗时的过程,在某些情况下,所得到的RT-PCR分析法优于源自带有内部标准物的相对定量RT-PCR的分析法。
还在另一个实施方案中,核酸列阵(包括珠列阵)用于检测或比较目的预后基因的表达谱。核酸列阵可以是商业寡核苷酸或cDNA列阵。它们还可以是包含用于探测本发明预后基因的集中探针的定制列阵。在许多实例中,在本发明的定制列阵上总探针的至少15%、20%、25%、30%、35%、40%、45%、50%或更多是用于探测RCC或其它实体瘤预后基因的探针。这些探针可以在严格杂交条件或核酸列阵杂交条件下与相应预后基因的RNA转录物或其互补物杂交。
如本文所使用,“严格条件”至少与例如表5所示条件G-L一样严格。“高严格条件”至少与表5所示条件A-F一样严格。杂交在杂交条件(杂交温度与缓冲液)下进行大约4小时,然后在相应的洗涤条件(洗涤温度与缓冲液)下洗涤两次,每次20分钟。
                             表5.严格条件
  严格条件   多核苷酸杂合体   杂合体长度(bp)1 杂交温度与缓冲液H 洗涤温度与缓冲液H
A DNA:DNA >50   65℃;1×SSC或者42℃;1×SSC,50%甲酰胺 65℃;0.3×SSC
  B   DNA:DNA   <50   TB *;1×SSC   TB *;1×SSC
C DNA:RNA >50   67℃;1×SSC或者45℃;1×SSC,50%甲酰胺 67℃;0.3×SSC
  D   DNA:RNA   <50   TD *;1×SSC   TD *;1×SSC
E RNA:RNA >50   70℃;1×SSC或者50℃;1×SSC,50%甲酰胺 70℃;0.3×SSC
  F   RNA:RNA   <50   TF *;1×SSC   TF *;1×SSC
G DNA:DNA >50   65℃;4×SSC或者42℃;4×SSC,50%甲酰胺 65℃;1×SSC
  H   DNA:DNA   <50   TH *;4×SSC   TH *;4×SSC
I DNA:RNA >50   67℃;4×SSC或者45℃;4×SSC,50%甲酰胺 67℃;1×SSC
  J  DNA:RNA     <50 TJ *;4×SSC     TJ *;4×SSC
K RNA:RNA >50 70℃;4×SSC或者50℃;4×SSC,50%甲酰胺 67℃;1×SSC
  L  RNA:RNA     <50 TL *;2×SSC     TL *;2×SSC
1:杂合体长度是正在杂交的多核苷酸的预期的杂交区域的长度。当多核苷酸与未知序列的靶多核苷酸杂交时,杂合体长度是正在杂交的多核苷酸的长度。当已知序列的多核苷酸被杂交时,杂合体长度可以通过比对多核苷酸序列并鉴定具有最佳序列互补性的区域来确定。
H:在杂交和洗涤缓冲液中可用SSPE(1×SSPE为0.15M NaCl,10mM NaH2PO4和1.25mM EDTA,pH7.4)替换SSC(1×SSC为0.15M NaCl和15mM柠檬酸钠)。
TB *-TR *:预期长度小于50个碱基对的杂合体的杂交温度应该低于杂合体解链温度(Tm)5-10℃,其中Tm按照下列方程确定。对于长度小于18个碱基对的杂合体,Tm(℃)=2(A+T碱基数)+4(G+C碱基数)。对于长度在18和49个碱基对之间的杂合体,Tm(℃)=81.5+16.6(log10[Na+])+0.41(%G+C)-(600/N),其中N是杂合体中的碱基数,[Na+]是杂交缓冲液中钠离子的摩尔浓度(对于1×SSC,[Na+]=0.165M)。
在一个实例中,本发明的核酸列阵包括至少2、5、10或更多种不同的探针。这些探针中的每一种能够在严格杂交条件或核酸列阵杂交条件下与本发明的各个不同预后基因杂交。可在同一核酸列阵中使用用于探测同一预后基因的多个探针。列阵上的探针密度可以在任意范围内。
用于探测本发明预后基因的探针可以是DNA、RNA、PNA或其修饰形式。每一探针中的核苷酸残基可以是天然存在的残基(例如脱氧腺苷酸、脱氧胞苷酸、脱氧鸟苷酸、脱氧胸苷酸、腺苷酸、胞苷酸、鸟苷酸、尿苷酸)或者能够形成预期碱基配对的合成产生的类似物。这些类似物的实例包括但不限于氮杂和脱氮嘧啶类似物、氮杂和脱氮嘌呤类似物、以及其它杂环碱基类似物,其中嘌呤和嘧啶环中的一个或多个碳和氮原子被杂原子如氧、硫、硒和磷取代。类似地,探针的多核苷酸主链可以是天然存在的(例如通过5′至3′键连接)或者是修饰的。例如,核苷酸单位可以通过非典型键,如5′至2′键连接,只要该键不干扰杂交即可。又例如,可以使用肽核酸,在肽核酸中组成碱基通过肽键而不是磷酸二酯键连接。
用于探测预后基因的探针可稳定连接至核酸列阵的不连续的区域中。“稳定连接”意味着,在杂交和信号检测过程中,探针保持在与所连接的不连续区域相关的位置。在核酸列阵上的每一不连续区域的位置是已知的或者是可检测的。本领域已知的所有方法可用于制造本发明的核酸列阵。
在另一个实施方案中,使用核酸酶保护分析定量外周血样品中的RNA转录物水平。存在许多不同的核酸酶保护分析法。这些核酸酶保护分析法的共同特征是包括反义核酸与待定量RNA杂交。然后,使用消化单链核酸比双链核酸更有效的核酸酶消化所得到的杂合体双链分子。未被消化的反义核酸的数量是待定量靶RNA数量的度量。适宜的核酸酶保护分析法的实例包括Ambion,Inc.(Austin,Texas)提供的RNA酶保护分析法。
用于本发明预后基因的杂交探针或扩增引物可使用本领域已知的任何方法制备。对于其基因组位置仍未确定或者其特性仅仅基于EST或mRNA资料的预后基因,则用于这些基因的探针/引物可以从相应限定符的靶序列或者相应EST或mRNA序列衍生。
在一个实施方案中,用于预后基因的探针/引物明显不同于其它预后基因的序列。这可以通过针对人基因组序列数据库(例如NCBI的Entrez数据库)检查潜在的探针/引物序列来实现。适用于该目的的一种算法是BLAST算法。该算法包括,首先通过鉴定查询序列中W长度的短字(shortword)来鉴定高得分序列对(HSP),其中当与数据库中同样长度的字比对时,所述的查询序列中的短字与其匹配或者满足一些正值阈值得分T。T被称作近邻字分值阈值(neighborhood word score threshold)。将最初的命中近邻字(neighborhood word hit)用作启动查找包含它们的更长HSP的查询的基础(seed)。然后将命中字沿着每一序列的两个方向延伸以增加累积比对分值。对于核苷酸序列的累积分值使用参数M(对于一对匹配残基奖励分值;总是大于0)和N(对于错配碱基罚分,总是小于0)。BLAST算法参数W、T和X确定比对灵敏度和速度。如本领域技术人员将会意识到的那样,这些参数可以随着目的的不同而调整。
在另一个方面,可以通过测定本发明预后基因所编码多肽的水平来确定预后基因的表达水平。适于该目的的方法包括但不限于免疫分析法,例如ELISA、RIA、FACS、点印迹、Western印迹、免疫组织化学和基于抗体的放射成像。此外,可使用高通量蛋白质测序、2维SDS-聚丙稀凝胶电泳、质谱或蛋白质列阵。
在一个实施方案中,使用ELISA检测靶蛋白的水平。在示例性的ELISA中,将能够结合靶蛋白的抗体免疫固定于所选择的对蛋白质具有亲和性的表面上,例如聚苯乙烯或聚氯乙烯微量滴定板的孔。然后向孔中加入待测试的样品。在结合并洗涤去除非特异性结合免疫复合物之后,可检测结合的抗原。通过加入对靶蛋白质特异并且连接有可检测标记的第二个抗体实现检测。检测还可以如下进行:加入第二个抗体,然后加入对第二个抗体具有结合亲和性的、连接有可检测标记的第三个抗体。在将样品加入到微量滴定板中之前,将样品中的细胞裂解或提取以便将靶蛋白与潜在的干扰物质分开。
在另一个示例性ELISA中,将怀疑包含靶蛋白的样品免疫固定于孔的表面,然后与抗体接触。在结合并洗涤去除非特异性免疫复合物之后,检测结合的抗原。当最初的抗体连接有可检测标记,可直接检测免疫复合物。还可以使用对第一个抗体具有结合亲和性并连接有可检测标记的第二个抗体检测免疫复合物。
另一个示例性ELISA包括在检测中使用抗体竞争。在该ELISA中,靶蛋白被固定于孔的表面。向孔中加入标记的抗体,使其与靶蛋白结合,然后通过其上的标记检测。然后,在与包被的孔孵育之前或孵育过程中,将未知样品与标记的抗体混合,从而确定未知样品中靶蛋白的数量。在未知样品中靶蛋白的存在降低了与孔结合的抗体的数量,从而降低了最终的信号。
不同形式的ELISA具有某些共同的特征,例如包被、孵育或结合、洗涤去除非特异结合以及检测结合的免疫复合物。例如,在用抗原或抗体包被板中,板的孔可与抗原或抗体溶液孵育过夜或特定时间阶段。然后洗涤板的孔以去除不完全吸附的物质。然后用对于测试样品而言为中和抗原性的非特异蛋白质“包被”孔中任何剩余的表面。这些非特异性蛋白质的实例包括牛血清白蛋白(BSA)、酪蛋白和奶粉溶液。包被封闭了固定化表面的非特异性吸附位点,从而降低了由于抗血清非特异性结合至表面造成的背景。
在ELISA中,可使用第二种或第三种检测手段。在蛋白质或抗体与孔结合、用非反应性物质包被以降低背景并且洗涤去除非结合物质之后,在允许免疫复合物(抗原/抗体)有效形成的条件下将固定化表面与对照样品或待测试的临床样品或生物学样品接触。这些条件包括例如用溶液如BSA、牛γ球蛋白(BGG)以及磷酸缓冲盐水(PBS)/Tween稀释抗原和抗体,并且将抗体和抗原于室温孵育大约1-4小时或者于4℃孵育过夜。使用标记的第二个结合配体或抗体或者与标记的第三个抗体或第三个结合配体连接的第二个结合配体或抗体,利于检测免疫复合物。
在ELISA中的所有孵育步骤之后,洗涤接触的表面以去除未形成复合物的物质。例如,使用溶液如PBS/Tween或者硼酸盐缓冲液洗涤表面。在测试样品与最初结合的物质形成特异性免疫复合物并且洗涤之后,检测免疫复合物的量。
为了提供检测手段,可以在第二个或第三个抗体上结合有便于检测的标记。在一个实施方案中,标记是酶,当与合适的显色物质孵育时酶会显色。因此,例如人们可以将第一个或第二个免疫复合物与尿素酶、葡萄糖氧化酶、碱性磷酸酶或氧化氢酶缀合的抗体在利于免疫复合物形成的条件下接触和孵育一段时间(例如在包含PBS的溶液如PBS-Tween中室温孵育2小时)。
在与标记抗体孵育并且洗涤去除未结合物质之后,通过与显色物质如尿素和溴甲酚紫或者2,2′-叠氮-双-(3-乙基)-苯并噻唑啉-6-磺酸(ABTS)和H2O2(以过氧化物酶作为标记酶为例)孵育定量标记的量。通过测定颜色产生的程度(例如使用分光光度计)实现定量。
适于检测多肽水平的另一种方法是RIA(放射免疫分析法)。示例性的RIA基于放射标记多肽和非标记多肽对有限量抗体的竞争结合。适宜的放射标记包括但不限于I125。在一个实施方案中,固定浓度的碘标记多肽与多肽特异性抗体的系列稀释液孵育。当向系统中加入非标记多肽时,结合至抗体的I125-多肽的量降低。因此,可以产生代表着以非标记多肽的浓度为函数的抗体结合的I125-多肽的量的标准曲线。从该标准曲线中可以确定未知样品中多肽的浓度。开展RIA的方案在本领域中众所周知。
用于本发明的适宜抗体包括但不限于多克隆抗体、单克隆抗体、嵌合抗体、人源化抗体、单链抗体、Fab片段或者通过Fab表达文库产生的片段。也可使用中和抗体(即抑制二聚体形成的那些抗体)。制备这些抗体的方法在本领域众所周知。在一个实施方案中,本发明的抗体可以以至少104M-1、105M-1、106M-1、107M-1或更高的结合亲和性与相应预后基因产物或其它预期抗原结合。
本发明的抗体可用一种或多种可检测部分标记,以便允许检测抗体-抗原复合物。可检测部分包括可通过分光光度法、酶学、光化学、生物化学、生物电学、免疫化学、电学、光学或化学手段检测的成分。可检测部分包括但不限于放射性同位素、化学发光化合物、标记的结合蛋白、重金属原子、分光标志如荧光标志和染料、磁性标记、连接的酶、质谱标签、自旋标记、电子转移供体和受体等。
本发明的抗体可用作探针以构建蛋白质列阵,用来检测预后基因的表达谱。制造蛋白质列阵或生物芯片的方法为本领域众所周知。在许多实施方案中,在本发明的蛋白质列阵上相对大部分的探针是对预后基因产物具有特异性的抗体。例如,在蛋白质列阵上,至少10%、20%、30%、40%、50%或更多的探针是对预后基因产物特异的抗体。
还在另一个方面,通过测定预后基因的生物学功能或活性确定这些基因的表达水平。在基因的生物学功能或活性未知的情况下,可开发适宜的体外或体内分析法以评价基因的功能或活性。这些分析法随后可用于评估预后基因的表达水平。
在确定了每一预后基因的表达水平之后,可采用多种方法比较表达谱。目的患者的表达谱与参照表达谱之间的比较可手工进行或通过电子方式进行。在一个实例中,通过将一个表达谱中的每一成分与参照表达谱中的相应成分相比较实现比较。成分可以是预后基因的表达水平、两个预后基因表达水平的比值或者能够代表基因表达模式的另一种度量。基因的表达水平可以是绝对值或归一化数值或相对值。两个相应成分间的差异可通过倍数变化、绝对差异或者其它适宜方法评估。
目的患者的表达谱与参照表达谱之间的比较还可使用模式识别或比较程序开展,例如如Armstrong等人,Nature Genetics,30:41-47(2002)中所述的k-近邻算法或者下面描述的加权投票算法。此外,基因表达系列分析(SAGE)技术、GEMTOOLS基因表达分析程序(Incyte Pharmaceuticals)、GeneCalling and Quantitative Expression Analysis技术(Curagen)以及其它适宜的方法、程序或系统可用于比较表达谱。
在比较表达谱中可使用多个预后基因。例如使用2、4、6、8、10、12、14或更多个预后基因。此外,可以选择具有相对小的p值(例如双侧p值)的预后基因用于比较。在许多其它实例中,p值表明了不同类别患者基因表达水平之间差异的统计学意义。在许多其它实例中,p值表明了基因表达模式与临床结果之间相关性的统计学意义。在一个实施方案中,在比较中所用的预后基因具有不大于0.05、0.01、0.001、0.0005、0.0001或更低的p值。还可使用p值大于0.05的预后基因。这些基因可通过例如相对小量的血液样品鉴定。
目的患者的表达谱与参照表达谱之间的相似性或差异指示着目的患者的类别。可通过任何适宜手段确定这种相似性或差异。比较可以是定性的、定量的或者两者。
在一个实例中,参照表达谱的成分是平均值,并且目的患者的表达谱中的相应成分处于平均值的标准差范围内。在这种情况下,就该特定成分而言,目的患者的表达谱被认为与参照表达谱类似。其它标准,例如多个或一小部分标准差或某种程度的百分数增加或降低,可用于测定相似性。
在另一个实例中,在目的患者的表达谱中,至少50%(例如至少60%、70%、80%、90%或更高)的成分被认为与参照表达谱的相应成分类似。在这种情况下,目的患者的表达谱可认为与参照表达谱类似。在表达谱中不同的成分在比较中具有不同的加权。在一些情况下,使用较低的百分数阈值(例如小于总成分的50%)确定相似性。
可以如此选择预后基因和相似性标准,即使得结果预测的准确度(正确呼叫信号与正确呼叫信号和错误呼叫信号之和的比值)相对较高。例如,预测准确度为至少50%、60%、70%、80%、90%或更高。也可使用预测准确度小于50%的预后基因,只要这种预测具有统计学意义即可。
结果预测的有效性可通过灵敏度和特异性评价。可以如此选择预后基因和比较标准,即使得结果预测的灵敏度和特异性均相对较高。例如,所采用的预后基因或分类器的灵敏度和特异性为至少50%、60%、70%、80%、90%、95%或更高。也可使用灵敏度或特异性小于50%的预后基因或分类器,只要这种预测具有统计学意义即可。
此外,基于外周血表达谱的结果预测可与其它临床证据或预后方法相组合以改善结果预测的有效性或准确度。
在许多实施方案中,目的患者的表达谱与至少两个参照表达谱相比较。每一参照表达谱可包括平均表达谱或一组个体表达谱,其中每一表达谱代表着特定实体瘤(例如RCC)或无疾病人体中的外周血基因表达模式。用于一个将表达谱与两个或两个以上参照表达谱相比较的适宜方法包括但不限于加权投票算法或k-近邻算法。能够执行这些算法的软件包括但不限于GeneCluster 2软件。GeneCluster 2软件可从Whitehead Institute的MITCenter for Genome Research(例如www.genome.wi.mit.edu/cancer/software/genecluster2/gc2.html)获得。
加权投票算法和k-近邻算法两者均采用了能有效指定目的患者一个结果类别的基因分类器。“有效”意味着,类别指定具有统计学意义。在一个实例中,类别指定的有效性通过留出交叉验证法或k-折交叉验证法评价。在这些交叉验证法下的预测准确度可以为例如至少50%、60%、70%、80%、90%、95%或更高。在这些交叉验证法下的预测灵敏度或特异性也可以为至少50%、60%、70%、80%、90%、95%或更高。具有低指定灵敏度/特异性或者低交叉验证准确度(例如小于50%)的预后基因或类别预测器也可用于本发明。
在一种形式的加权投票算法中,类别预测器中的每一基因为两个类别之一投一个加权票(类别0和类别1)。基因“g”的票数定义为vg=ag(xg-bg),其中ag等于P(g,c)并且反应了基因“g”的表达水平与两个类别间类别特征之间的相关性;bg通过bg=[x1(g)+x1(g)]/2计算并代表着基因“g”在类别0和类别1中表达水平的log平均的平均值;xg是基因“g”在目的样品中归一化表达水平的对数。正数vg表示为类别0投票,负数vg表示为类别1投票。V0表示所有整数票的和,V1表示所有负数票之和的绝对值。预测强度PS定义为PS=(V0-V1)/(V0+V1)。因此预测强度在-1和1之间变化并且可以支持一个类别(例如整数PS)或另一个类别(例如负数PS)。预测强度接近“0”表示胜利的余量窄,预测强度接近“1”或“-1”表示胜利的余量宽。参见Slonim等人,Procs.of the Fourth Annual InternationalConference on Computational Molecular Biology,Tokyo,Japan,4月8-11日,第263-272页(2000);以及Golub等人,Science,286:531-537(1999)。
适宜的预测强度(PS)阈值可以通过将累积的交叉验证错误率对预测强度作图来评估。在一个实施方案中,如果对于目的样品PS的绝对值不小于0.3,则可以作出肯定预测。其它PS阈值,例如不小于0.1、0.2、0.4或0.5也可以选择用于类别预测。在许多实施方案中,阈值如此选择,即使得预测准确度最佳并且将阳性结果和假阴性结果发生率最小化。
根据本发明构建的任何类别预测器可用于对目的实体瘤患者(例如RCC患者)进行类别指定。在许多实例中,在本发明中采用的类别预测器包括通过近邻分析鉴定的n个预后基因,其中n是大于1的整数。在这些预后基因中,有一半具有最大的P(g,c)分值,另一半具有最大的-P(g,c)分值。因此数字n在定义类别预测器中仅仅是个自由参数。
还可以通过其它方法将目的患者的表达谱与两个或两个以上参照表达谱比较。例如,参照表达谱可包括每一类别患者的平均外周血表达谱。目的患者的表达谱更类似于一种参照表达谱(与另一种参照表达谱相比)这一实事表明,目的患者更可能具有与前一种参照表达谱相关的临床结果(与后一种参照表达谱相关临床结果相比)。
在一个特定实施方案中,本发明的特征在于预测目的RCC患者的临床结果。适于该目的的预后基因或分类器包括但不限于表2、表3或表4中描述的那些。
在一个实例中,基于RCC患者对治疗性治疗(例如CCI-779治疗)反应的TTD,将这些患者分成至少两个类别。第一个类别的患者具有第一个指定TTD(例如从治疗性治疗开始TTD小于365天),并且第二个类别的患者具有第二个指定TTD(例如从治疗性治疗开始TTD大于365天)。与这两个类别患者间的类别特征基本相关的基因可以被鉴定出来并用于预测目的RCC患者的类别。在许多情况下,在结果预测中使用的所有表达谱是从在治疗性治疗前分离的外周血样品制备的。适于该目的的RCC预后基因实例包括选自选自表2的那些,并且适当的分类器包括表4中的分类器1-7。本发明考虑了表2中基因编号1-14的任意组合在预测目的RCC患者的临床结果中的用途。适于该目的的方法包括但不限于RT-PCR、ELISA、功能分析法或模式识别程序(例如加权投票或k-近邻算法)。
在另一个实例中,第一个类别的RCC患者具有特定的TTP(例如从治疗性治疗如CCI-779治疗开始TTP不小于106天),并且第二个类别的患者具有另一种特定TTP(例如从治疗性治疗开始TTP小于106天)。能够将目的RCC患者指定为上述两种结果类别之一的预后基因包括但不限于表3中描述的那些基因,并且适宜的分类器包括表4中的分类器8-21。本发明考虑了表3中基因编号1-28的任意组合在预测目的RCC患者的临床结果中的用途。适于该目的的方法包括但不限于RT-PCR、ELISA、功能分析法或模式识别程序(例如加权投票或k-近邻算法)。
在更多的实例中,通过使用加权投票或k-近邻算法以及选自表4的分类器将目的RCC患者的表达谱与两种或两种以上参照表达谱比较。
本发明也可采用能够区分三种或三种以上结果类别的预后基因或类别预测器。这些预后基因可使用多类别相关性度量法鉴定。开展多类别相关性分析的适于程序包括但不限于GeneCluster 2软件(MIT Center forGenome Research,Whitehead Institute,Cambridge,MA)。经过分析,患有特定实体瘤(例如RCC)的患者被分成至少三个类别,并且每一类别的患者具有各自不同的临床结果。经多类别相关性分析,所鉴定的预后基因在一个类别患者PBMC中相对于其它类别患者PBMC差异表达。在一个实施方案中,经排列测试,所鉴定的预后基因在高于1%、5%、10%、25%或50%的显著性水平上与类别特征相关。类别特征代表着所鉴定基因在具有不同临床结果的患者外周血样品中的理想化表达模式。
本发明的特征还在于用于RCC和其它实体瘤预后或者对于RCC和其它实体瘤选择治疗法的电子系统。这些系统包括用于接收目的RCC患者表达谱以及参照表达谱的输入设备或通讯设备。参照表达谱可以储存在数据库中或另一种介质中。表达谱间的比较可通过电子方式进行,例如通过处理器或计算机。处理器或计算机可执行一种或一种以上的程序以便比较目的患者表达谱和参照表达谱。程序可储存在储存器中或许和从另一种资源如国际互联网服务器下载。在一个实例中,程序包括k-近邻或加权投票算法。在另一个实例中,电子系统与核酸列阵连接并且可以接收或处理核酸列阵产生的表达数据。
仍然在另一个方面,本发明提供了用于RCC或其它实体瘤预后或者对于RCC或其它实体瘤选择治疗法的试剂盒。每一试剂盒包括至少一种用于探测RCC或实体瘤预后基因(例如选自表2或表3的基因)的探针。本发明可使用任意类型的探针,例如杂交探针、扩增引物或抗体。
在一个实施方案中,本发明的试剂盒包括至少1、2、3、4、5、6、7、8、9、10或更多种多核苷酸探针或引物。每一探针/引物可以在严格杂交条件或核酸列阵杂交条件下与各自不同的RCC或实体瘤预后基因如选自表2或表3的那些基因杂交。在一个实例中,本发明的试剂盒包括能够在严格杂交条件或核酸列阵杂交条件下与本发明分类器中的各个基因如选自表4中的那些基因杂交的探针。如本文所使用,如果多核苷酸能够与基因的RNA转录物或其互补链杂交,则多核苷酸能够与基因杂交。
在另一个实施方案中,本发明的试剂盒包括一种或一种以上的抗体,每一抗体能够结合由各个不同RCC或实体瘤预后基因,如选自表2或表3中的那些基因编码的多肽。在一个实例中,本发明的试剂盒包括能够结合由本发明分类器中的基因(如选自表4的那些基因)所编码各个多肽的抗体。
本发明中采用的探针可以是标记的或非标记的。标记探针可以通过分光光度法、光化学、生物化学、生物电子、免疫化学、电学、光学、化学或其它适宜的手段检测。用于探针的示例性标记部分包括放射性同位素、化学发光化合物、标记的结合蛋白、重金属原子、分光标志如荧光标志和染料、磁性标记、连接的酶、质谱标签、自旋标记、电子转移供体和受体等。
本发明的试剂盒还可以具有容纳缓冲液或报告手段(reporter-means)的容器。此外,试剂盒还包括用于开展阳性或阴性对照的试剂。在一个实施方案中,本发明中采用的探针被稳定连接至一个或一个以上基质支持物上。核酸杂交或免疫分析可以直接在基质支持物上直接开展。用于该目的的适宜基质支持物包括但不限于玻璃、硅、陶瓷、尼龙、石英片、凝胶、金属、纸、珠、管、纤维、薄膜(film)、膜、柱基质或微量滴定板孔。
IV.对RCC和其它实体瘤的治疗法的选择
本发明允许对RCC或其它实体瘤进行个性化治疗。在任何治疗之前,可以根据本发明预测目的患者的临床结果。患者的预后良好表明治疗可能有效,而预后差表明不同的治疗法可能更适合于患者。这种治疗前分析帮助患者避免不必要的不良反应并且为治疗提供了改善了安全性和提高的效益/风险比。
在一个实施方案中,在使用CCI-779的任何治疗之前,评估目的RCC患者的预后。适于该目的的预后基因包括但不限于在表2或表3中描述的那些。可使用本文描述的任何预后方法,例如RT-PCR、ELISA、蛋白质功能分析法或模式识别程序(例如k-近邻或加权投票算法)。预后良好表明目的RCC患者适宜CCI-779治疗。预后良好与预后差可通过TTD(例如大于1年对小于1年)或者TTP(例如大于3个月对小于3个月)测量。其它测量法也可用于确定良好预后或较差预后。
本发明的特征还在于为目的患者选择有利的治疗法。多种治疗选择或方案可通过本发明分析。可以鉴定对于每一种治疗法的预后基因。这些预后基因在目的患者中的外周血表达谱指示着患者的临床结果,因此其可以用作鉴定或选择患者预后良好的治疗法的替代标志。如本文所使用,“良好”预后是比多数其它可利用治疗法的预后更好的预后。还可鉴定具有最佳预后的治疗方案。
通过本发明可评价任何类型的癌症治疗法。例如通过药物疗法治疗RCC。适宜的药物包括细胞因子,例如干扰素或白细胞介素2以及化疗药物如CCI-779、AN-238、长春花碱、氟尿苷、5-氟尿嘧啶或他莫昔芬。AN238是具有连接至生长激素抑制素(SST)载体八肽的2-吡咯啉阿霉素(2-pyrrolinodoxorubicin)的细胞毒性剂。AN238可靶向RCC肿瘤细胞表面的SST受体。化疗药物可个别使用或者与其它药物、细胞因子或治疗剂组合使用。此外,可采用单克隆抗体、抗血管生成药物或者抗生长因子药物来治疗RCC。
还可手术治疗RCC。适宜的手术选择包括但不限于根治性肾切除术、部分肾切除术、去除转移癌、动脉栓塞、腹腔镜肾切除术、冷冻消融术以及保留肾单位手术。此外,可使用放射治疗、基因治疗、免疫治疗、过继免疫治疗或者任何其它常规或实验疗法。
对前列腺癌、头/颈癌以及其它实体瘤的治疗选择是本领域已知的。例如前列腺癌的治疗法包括但不限于放射治疗、激素治疗以及冷冻治疗。本发明还考虑了预后基因用于实体瘤的其它新疗法或实验疗法中的用途。
治疗法选择可手工进行或者电子方式进行。参照表达谱或基因分类器可储存于数据库中。能够开展算法诸如k-近邻或加权投票算法的程序可用于将目的患者外周血表达谱与数据库比较以确定患者应使用哪种治疗法。
对预后基因的鉴定受实体瘤的疾病分期的影响。例如,预后基因可从特定疾病分期的患者中鉴定出来。如此鉴定的基因在预测也处于该疾病分期的目的患者的临床结果中更有效。
疾病分期也影响治疗法的选择。例如对于I期或II期RCC患者,普遍选择根治性肾切除术或部分肾切除术。对于III期RCC患者,根治性肾切除术是优选的治疗法。对于IV期RCC患者,可采用细胞因子免疫治疗、组合的免疫治疗和化学治疗或者其它药物治疗。因此目的患者的疾病分级可用于帮助基于基因表达选择对患者有利的治疗法。
应当理解,上述实施方案以及下面的实施例是以举例说明的形式提供的,而不是限制性的。在本发明范围内的多种变化和修改对于阅读了本说明书的本领域技术人员而言是显而易见的。
V.实施例
实施例1.PBMC和RNA的纯化
在开始CCI-779治疗前从RCC患者收集全血。将血液样品抽取到CPTCell Preparation Vacutainer管(Becton Dickinson)中。对于每一样品,体积为8ml。按照产品说明书(Becton Dickinson)通过Ficoll梯度分离PBMC。PBMC沉淀储存于-80℃直至RNA纯化。
使用QIA粉碎机和Qiagen Rneasymini试剂盒开展RNA纯化。将样品收获于含0.1%β-巯基乙醇的RLT裂解缓冲液中(Qiagen,Valencia,CA,USA),处理后使用RNeasy mini试剂盒(Qiagen,Valencia,CA,USA)分离总RNA。洗脱的RNA用96孔板UV读取仪检测A260/280定量。在2%琼脂糖凝胶中电泳检查RNA质量(18S和28S条带)。剩余的RNA储存于-80℃直至Affymetrix基因芯片杂交。
实施例2.RNA扩增与基因芯片杂交探针的产生
使用Lockhart等人,Nature Biotechnology,14:1675-1680(1996)中所述方法的修改方法制备寡核苷酸列阵的标记的靶标。使用在5′末端包含T7DNA聚合酶启动子的oligo-d(T)24引物将2微克总RNA转变成cDNA。cDNA用作使用T7 DNA聚合酶试剂盒(Ambion,Woodlands,TX,USA)和生物素化CTP和UTP(Enzo,Farmingdale,NY,USA)进行体外转录中的模板。标记的cRNA在40mM Tris-乙酸pH8.0、100mM KOAc、30mMMgOAc中于94℃片段化35分钟,终体积40mL。10微克标记的靶标稀释于1×MES缓冲液中,在缓冲液中含有100mg/mL鲱鱼精子DNA和50mg/mL乙酰化BSA。为了在列阵彼此间归一化并且为了评价寡核苷酸列阵的灵敏度,如Hill等人,Genome Biol.,2:research0055.1-0055.13(2001)中所述,在每一杂交反应中包括体外合成的11种细菌基因的转录物。这些转录物的丰度范围为1∶300000(3ppm)至1∶1000(1000ppm)(表示为总转录物中对照转录物的数量)。如通过这些对照转录物的信号反应所测定,列阵的检测灵敏度范围在每百万个转录物2.33个拷贝和每百万个转录物4.5个拷贝之间。
标记的序列在99℃变性5分钟然后于45℃维持5分钟,然后与由大量人基因构成的寡核苷酸列阵(HG-U95A或HG-U133A,Affymetrix,SantaClara,CA,USA)杂交。于45℃、60转/分杂交16小时。杂交后,将杂交混合物取出并储存,将列阵洗涤,使用GeneChip Fluidics Station 400用链霉亲和素R-藻红蛋白(Molecular Probes)染色,使用Hewlett PackardGeneArray Scanner按照说明书扫描。这些杂交和洗涤条件总称为“核酸列阵杂交条件”。
实施例3.确定基因表达频率和处理表达数据
使用Affymetrix MicroArray Suite软件(MAS)处理列阵图像,从而使用桌面版MAS将由列阵扫描仪产生的原始列阵图像数据(.dat)简化成探针特征-水平强度总表(.cel文件)。使用Gene Expression Data System(GEDS)作为图像用户界面,用户向Expression Profiling Information andKnowledge System(EPIKS)Oracle数据库提供样品描述并且加入带有说明的正确的.cel文件。然后,数据库处理调用MAS软件以产生探针组总值;使用Affymetrix平均差异算法和Affymetrix绝对检测度量法(缺乏、存在或边缘)总结每一探针组的每一信息的探针强度。MAS还用于通过将截尾均值换算至数值100进行first pass归一化。数据库处理还计算一系列芯片质量对照度量并且在数据库中储存所有的原始数据和质量对照计算。
使用MAS软件(Affymetrix)对原始荧光强度数值进行数据分析和缺乏/存在呼叫信号的确定。“存在”呼叫信号由MAS软件通过评估在样品中是否检测到转录物(基于与背景相比的基因信号的强度)来计算。使用刻度频率归一化方法(scaled frequency normalization method)(Hill等人,Genome Biol,2:research0055.1-0055.13(2001))将每一转录物的“平均差异”值归一化成为“频率”数值。加入到每一杂交溶液中的具有已知丰度的11种对照cRNA的平均差异用于产生总体校准曲线。然后使用该校准将所有转录物的平均差异转换成频率估计数,以百万分率单位表示,范围为1∶300,000(~3百万分率(ppm))至1∶1000(1000ppm)。归一化指将每一芯片的平均差异数值归一化至校准曲线,校准曲线从加入到每一杂交溶液中的具有已知丰度的11种转录物的平均差异数值构建。在许多情况下,归一化方法利用截尾均值归一化,然后在所有芯片中将合并标准曲线拟合,用于计算“频率”值以及每一芯片灵敏度估计值。所得到的度量被称作换算频率(scaled frequency)并且在所有列阵中归一化。
不具有任何相关信息的基因被排除在数据比较之外。在无疾病的PBMC与RCC PBMC的比较中,这可以使用两个数据简化过滤器(datareduction filter)实现:1)在所有GeneChip上呼叫信号为缺乏(如通过MAS中的Affymetrix绝对检测度量法所测定)的任何基因从数据组中去除;2)在所有GeneChip上以归一化频率<10ppm表达的任何基因从数据组中去除,以保证在分析设置中所留下的任何基因以至少10ppm的频率至少一次检测到。对于一些多变量预测分析,使用了更加严格的数据简化过滤器(25%P,平均频率>5ppm),以降低在基因分类器中鉴定出低水平转录物或很少检测到的转录物的可能性。
实施例4.对异常样品(Outlier Sample)进行基于Pearson的评估
为了鉴定异常样品,使用Splus(版本5.1)计算所有样品对中的成对Pearson相关系数的平方(r2)。具体而言,计算从表达数值的G×S矩阵开始,其中G是探针组的总数,S是样品总数。计算了该矩阵中样品间的r2值。结果是r2数值的S×S的对称矩阵。该矩阵测量了分析中的每一样品与所有其它样品之间的相似性。由于所有这些样品来自按照普通方案收获的人PBMC,可以预料到相关系数通常显示了高程度的相似性(即在所分析的所有样品中大多数转录物序列的表达水平相似)。为了总结样品的相似性,计算在每一样品的所有MAS信号与所研究的其它样品的所有MAS信号之间的r2值的平均值并做成热图(heat map)以利于快速显现。r2平均值越接近1,则样品越类似于所分析的其它样品。r2值平均值低表明,样品的基因表达谱相对于总体基因表达模式而言是“异常的”。异常状态可以表明,或者样品的基因表达谱显著偏离所分析的其它样品的基因表达谱,或者样品的技术质量(technical quality)差。
实施例5.临床研究方案总结
从参与II期研究的20名无疾病志愿者(12名女性,8名男性)和45名肾细胞癌患者(18名女性,27名男性)的外周血分离PBMC。收到了药物基因组部分临床研究的知情同意书,并且该项目得到了开展临床研究地点当地伦理委员会的批准。在每一地点,将RCC肿瘤分成常规(透明细胞)癌(24)、颗粒细胞癌(1)、乳头状癌(3)或混合亚型(7)。没有确定10个肿瘤的类别。通过Motzer多变量评估方法对签署基线PBMC表达谱药物基因组分析知情同意书的45名患者评分。在参加该研究的同意患者中,有6名被指定为风险评估良好,17名患者具有中等风险分值,22名患者预后差。
在试验过程中,通过一周一次IV灌注三种剂量(25mg、75mg、250mg)之一的CCI-779达30分钟来治疗晚期RCC患者。在治疗前和开始CCI-779治疗后的每8周,记录残余、复发和转移瘤的临床分期和大小。肿瘤大小以厘米测定并记录为最长直径与其正交直径的乘积。可测量疾病被定义为通过CT扫描、X射线和触诊确定的两个直径均大于1.0cm的任何二维可测量损害。通过所有可测量损害的正交直径的乘积之和确定肿瘤反应(完全有效、部分有效、微效、疾病稳定和疾病进展)。在本药物基因组研究中采用的两个主要的临床结果度量是进展时间(TTP)和生存期或到死亡时间(TTD)。TTP被定义为从开始CCI-779治疗之日直到测定出疾病进展的第一天或者经过检查已知无进展的最后一天的间隔。生存期或TTD被定义为从开始CCI-779治疗之日直到死亡时间的间隔,或者直到经检查已知仍然活着的最后一天的间隔。
实施例6.统计学分析
使用Eisen等人,Proc Natl Acad Sci U.S.A.,95:14863-14868(1998)的方法对基因和/或列阵开展基于表达谱相似性的非监督分级聚类分析。在这些分析中,仅使用满足非严格数据简化过滤器(至少1个存在呼叫信号,至少1个在数据集中的频率大于或等于10ppm)的那些转录物。将表达数据进行log变换,并标准化使其平均值为零且方差为1,使用带有非居中相关相似性度量法(uncentered correlation similarity metric)的平均联接聚类法(average linkage clustering)产生分级聚类结果。
为了鉴定疾病相关的转录物,使用平均倍数变化和Student t检验比较正常的PBMC表达谱与肾癌PBMC表达谱。
关于临床结果与治疗前表达谱的相关性,为了在治疗前表达水平与临床结果的持续度量之间进行简单单变量评估,使用Spearman秩相关计算了每一转录物的表达与TTP以及表达与TTD之间的相关性。使用Cox比例风险回归模型用临床结果删失测量(censored measure)(TTP、TTD)评估基因表达。
不同组患者的生存期数据通过Kaplan Meier分析评估,并且使用Wilcoxon测试确定显著性。
使用Genecluster 2.0版开展基因选择和监督的类别预测,Genecluster2.0版描述于Golub等人,Science,286:531-537(1999)中并且可从www.genome.wi.mit.edu/cancer/software/genecluster2.html获得。满足更严格数据简化过滤器(至少25%存在呼叫信号,在所有RCC PBM中的平均频率≥5ppm)用于预测临床结果。在预测模型中,这种更严格的过滤器可以避免包括低水平转录物或者使这种可能最小化。
对于近邻分析,在分析前将训练组和测试组的所有表达数据进行log变换。在训练组数据中,使用带有S2N相似性度量法(对于类别估计值使用中位数值)的双侧方法(在每一类别中特征数量相等)构建包含增加数量特征(转录物序列)的模型。所有的比较是二元差别,并且每一模型(具有增加数量的特征)通过留出交叉验证法、10-折交叉验证法和4-折交叉验证法评估。对测试组中类别成员的预测通过使用k近邻算法实施,该算法也存在于Genecluster中。还可参见Armstrong等人,Nature Genetics,30:41-47(2002)。对于许多预测,近邻数量设定为k=3,所使用的余弦距离度量(cosine distance measure)以及所有的k近邻相等加权。
本发明的上述描述提供了例证和描述,但这不意味着是穷尽性的或者将本发明限制在所公开的精确范围内。对本发明的修改和改变处于上述教导之中或者可从本发明的实践获得。因此,应当注意到,本发明的范围由权利要求书和它们的等效物定义。

Claims (19)

1.肾细胞癌(RCC)的预后方法,所述方法包括将一个或多个基因在目的RCC患者外周血样品中的表达谱与所述一个或多个基因的至少一种参照表达谱相比较,
其中所述一个或多个基因包括选自表2或表3的基因,其中选自表2或表3的基因不是PRKCD、MD-2或VNN2,并且
其中所述目的患者的表达谱与所述的至少一种参照表达谱之间的差异或相似性指示着目的患者中RCC的预后。
2.根据权利要求1所述的方法,其中目的患者的外周血样品是全血样品或者包含富集的PBMC。
3.根据权利要求2所述的方法,其中所述的至少一种参照表达谱包括:
所述一个或多个基因在具有第一种响应抗癌治疗的临床结果的RCC患者中的平均基线外周血表达谱,或者
多个表达谱,每一个代表着所述一个或多个基因在具有第一种或第二种响应抗癌治疗的临床结果的各个不同RCC患者中的基线外周血表达谱。
4.根据权利要求3所述的方法,其中目的患者的表达谱是对于抗肿瘤治疗而言的基线表达谱。
5.根据权利要求4所述的方法,其中抗肿瘤治疗是CCI-779治疗。
6.根据权利要求5所述的方法,其中所述一个或多个基因包括选自表2中基因编号1-7中的基因和选自表2中基因编号8-14中的另一基因,并且第一种和第二种结果通过响应CCI-779治疗的患者TTD测定。
7.根据权利要求5所述的方法,其中所述一个或多个基因包括选自表3中基因编号1-14中的基因和选自表3中基因编号15-28中的另一基因,并且第一种和第二种结果通过响应CCI-779治疗的患者TTP测定。
8.根据权利要求5所述的方法,其中所述一个或多个基因包括选自表4的一个分类器并且通过k-近邻或加权投票算法将目的患者表达谱与所述的至少一种参照表达谱相比较。
9.根据权利要求5所述的方法,包括步骤:
预测目的患者是否具有响应CCI-779治疗的第一种或第二种临床结果。
10.选择肾细胞癌(RCC)治疗法的方法,包括步骤:
根据权利要求1所述的方法提供对目的RCC患者进行多种治疗的预后;和
从多种治疗法中选择出对于目的RCC患者具有良好预后的治疗法。
11.一种系统,包括:
包含代表着一个或多个基因在实体瘤患者外周血样品中的表达谱数据的第一个储存介质;
包含代表着所述一个或多个基因的至少一种参照表达谱数据的第二个储存介质;
能够将表达谱与所述的至少一种参照表达谱相比较的程序;和
能够执行程序的处理器,其中所述一个或多个基因包括选自表2或表3的基因并且所述基因不是PRKCD、MD-2或VNN2。
12.用于肾细胞癌(RCC)预后或用于选择肾细胞癌(RCC)治疗法的试剂盒,所述试剂盒包含用于探测选自表2或表3的基因的探针,其中所述基因不是PRKCD、MD-2或VNN2。
13.用于实体瘤预后的方法,所述方法包括将一个或多个基因在目的患者外周血样品中的表达谱与所述一个或多个基因的至少一种参照表达谱相比较,
其中目的患者患有实体瘤,并且所述一个或多个基因中的每一个在第一类患者外周血单核细胞(PBMC)与第二类患者PBMC中差异表达,
其中第一类和第二类患者均患有实体瘤,并且第一类患者具有第一种临床结果并且第二类患者具有第二种临床结果,
其中所述一个或多个基因包含这样的基因,即在基于类别的相关度量法中通过HG-U133 A确定的其在第一类和第二类患者PBMC中的表达谱与一个类别特征相关,所述的类别特征代表着所述基因在第一类和第二类患者PBMC中的理想表达模式,并且
其中所述的目的患者表达谱与所述的至少一种参照表达谱之间的差异或相似性指示着目的患者实体瘤的预后。
14.根据权利要求13所述的方法,其中第一种和第二种临床结果是抗肿瘤治疗的结果。
15.根据权利要求14所述的方法,其中所述的通过HG-U133 A确定的PBMC中的表达谱是对抗肿瘤治疗而言的基线表达谱。
16.根据权利要求15所述的方法,其中实体瘤是肾细胞癌(RCC),并且目的患者的外周血样品是全血样品或者包含富集的PBMC,并且其中所述的至少一种参照表达谱包括:
所述一个或多个基因在患有实体瘤并具有第一种临床结果的患者中的平均基线外周血表达谱;或者
多个表达谱,每一个代表着所述一个或多个基因在患有实体瘤并具有一种临床结果的各个不同患者中的基线外周血表达谱,其中所述的一种临床结果选自第一种临床结果和第二种临床结果。
17.根据权利要求16所述的方法,其中第一种和第二种临床结果是通过响应CCI-779治疗的TTD或TTP测定的。
18.根据权利要求17所述的方法,其中所述的一个或多个基因包括:
选自表2中基因编号1-7中的基因和选自表2中基因编号8-14中的另一基因;或者
选自表3中基因编号1-14中的基因和选自表3中基因编号15-28中的另一基因。
19.根据权利要求17所述的方法,其中所述的一个或多个基因包括选自表4的一个分类器,并且通过k-近邻或加权投票算法将所述目的患者的表达谱与所述的至少一种参照表达谱相比较。
CNA200580039290XA 2004-11-22 2005-11-22 用于实体瘤预后及治疗的方法和系统 Pending CN101068936A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US62968104P 2004-11-22 2004-11-22
US60/629,681 2004-11-22

Publications (1)

Publication Number Publication Date
CN101068936A true CN101068936A (zh) 2007-11-07

Family

ID=36463527

Family Applications (1)

Application Number Title Priority Date Filing Date
CNA200580039290XA Pending CN101068936A (zh) 2004-11-22 2005-11-22 用于实体瘤预后及治疗的方法和系统

Country Status (15)

Country Link
US (1) US20060134671A1 (zh)
EP (1) EP1815024A2 (zh)
JP (1) JP2008520251A (zh)
KR (1) KR20070084488A (zh)
CN (1) CN101068936A (zh)
AU (1) AU2005312081A1 (zh)
BR (1) BRPI0518036A (zh)
CA (1) CA2588253A1 (zh)
CR (1) CR9100A (zh)
IL (1) IL182813A0 (zh)
MX (1) MX2007005764A (zh)
NI (1) NI200700126A (zh)
NO (1) NO20072296L (zh)
RU (1) RU2007117507A (zh)
WO (1) WO2006060265A2 (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2011153684A1 (en) * 2010-06-08 2011-12-15 Biomerieux Method and kit for the prognosis of colorectal cancer
US9422598B2 (en) 2010-06-04 2016-08-23 Biomerieux Method and kit for the prognosis of colorectal cancer
CN106148508A (zh) * 2010-06-08 2016-11-23 生物梅里埃公司 用于结肠直肠癌预后的方法和试剂盒
US9689041B2 (en) 2011-03-25 2017-06-27 Biomerieux Method and kit for determining in vitro the probability for an individual to suffer from colorectal cancer
CN108624650A (zh) * 2018-05-14 2018-10-09 乐普(北京)医疗器械股份有限公司 判断实体瘤是否适合免疫治疗的方法和检测试剂盒
CN109355385A (zh) * 2018-11-16 2019-02-19 广州医科大学附属第三医院(广州重症孕产妇救治中心、广州柔济医院) Linc00266-1 rna作为实体瘤标志物的应用
CN110634571A (zh) * 2019-09-20 2019-12-31 四川省人民医院 肝移植术后预后预测系统
CN113316720A (zh) * 2019-01-15 2021-08-27 国际商业机器公司 使用机器学习确定患者的药物有效性排序

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1618218A2 (en) * 2003-04-29 2006-01-25 Wyeth Methods for prognosis and treatment of solid tumors
GB0717101D0 (en) * 2007-09-03 2007-10-10 Cambridge Entpr Ltd Tumour marker
EP2265328B1 (en) * 2008-03-20 2018-05-09 EBS Technologies GmbH An apparatus for automatic treatment adjustment after nervous system dysfunction
CN103459597B (zh) 2010-12-13 2016-03-30 社会福祉法人三星生命公益财团 用于预测胃癌预后的标记和使用该标记预测胃癌预后的方法
WO2015187129A1 (en) * 2014-06-03 2015-12-10 Hewlett-Packard Development Company, L.P. Document classification based on multiple meta-algorithmic patterns
JP6836230B2 (ja) * 2015-01-09 2021-02-24 学校法人東京理科大学 がん又は炎症性疾患患者の予後を予測する方法

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3944996B2 (ja) * 1998-03-05 2007-07-18 株式会社日立製作所 Dnaプローブアレー
US6647341B1 (en) * 1999-04-09 2003-11-11 Whitehead Institute For Biomedical Research Methods for classifying samples and ascertaining previously unknown classes
WO2001053312A1 (en) * 1999-12-23 2001-07-26 Hyseq, Inc. Novel nucleic acids and polypeptides
US20030165854A1 (en) * 2000-12-05 2003-09-04 Cunningham Mary Jane Marker genes responding to treatment with toxins
EP1618218A2 (en) * 2003-04-29 2006-01-25 Wyeth Methods for prognosis and treatment of solid tumors

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9771621B2 (en) 2010-06-04 2017-09-26 Biomerieux Method and kit for performing a colorectal cancer assay
US9422598B2 (en) 2010-06-04 2016-08-23 Biomerieux Method and kit for the prognosis of colorectal cancer
CN103003444B (zh) * 2010-06-08 2016-04-27 生物梅里埃公司 用于结肠直肠癌预后的方法和试剂盒
CN106148508A (zh) * 2010-06-08 2016-11-23 生物梅里埃公司 用于结肠直肠癌预后的方法和试剂盒
WO2011153684A1 (en) * 2010-06-08 2011-12-15 Biomerieux Method and kit for the prognosis of colorectal cancer
CN103003444A (zh) * 2010-06-08 2013-03-27 生物梅里埃公司 用于结肠直肠癌预后的方法和试剂盒
CN106148508B (zh) * 2010-06-08 2019-12-03 生物梅里埃公司 用于结肠直肠癌预后的方法和试剂盒
US9689041B2 (en) 2011-03-25 2017-06-27 Biomerieux Method and kit for determining in vitro the probability for an individual to suffer from colorectal cancer
CN108624650A (zh) * 2018-05-14 2018-10-09 乐普(北京)医疗器械股份有限公司 判断实体瘤是否适合免疫治疗的方法和检测试剂盒
CN108624650B (zh) * 2018-05-14 2022-04-29 乐普(北京)医疗器械股份有限公司 判断实体瘤是否适合免疫治疗的方法和检测试剂盒
CN109355385B (zh) * 2018-11-16 2022-02-08 广州医科大学附属第三医院(广州重症孕产妇救治中心、广州柔济医院) Linc00266-1 rna作为实体瘤标志物的应用
CN109355385A (zh) * 2018-11-16 2019-02-19 广州医科大学附属第三医院(广州重症孕产妇救治中心、广州柔济医院) Linc00266-1 rna作为实体瘤标志物的应用
CN113316720A (zh) * 2019-01-15 2021-08-27 国际商业机器公司 使用机器学习确定患者的药物有效性排序
CN110634571A (zh) * 2019-09-20 2019-12-31 四川省人民医院 肝移植术后预后预测系统

Also Published As

Publication number Publication date
MX2007005764A (es) 2007-07-20
JP2008520251A (ja) 2008-06-19
WO2006060265A3 (en) 2007-01-04
WO2006060265A2 (en) 2006-06-08
IL182813A0 (en) 2007-08-19
CA2588253A1 (en) 2006-06-08
BRPI0518036A (pt) 2008-10-28
CR9100A (es) 2007-08-28
EP1815024A2 (en) 2007-08-08
RU2007117507A (ru) 2008-12-27
NI200700126A (es) 2008-05-09
AU2005312081A1 (en) 2006-06-08
KR20070084488A (ko) 2007-08-24
NO20072296L (no) 2007-08-20
US20060134671A1 (en) 2006-06-22

Similar Documents

Publication Publication Date Title
US10662477B2 (en) Biomarkers and methods to predict response to inhibitors and uses thereof
Buess et al. Characterization of heterotypic interaction effects in vitro to deconvolute global gene expression profiles in cancer
JP6404304B2 (ja) メラノーマ癌の予後予測
TWI618797B (zh) 偵測膀胱癌之新穎標記
KR20140105836A (ko) 다유전자 바이오마커의 확인
WO2004097051A2 (en) Methods for diagnosing aml and mds differential gene expression
EA025926B1 (ru) Молекулярно-диагностический тест на рак
JP2008545399A (ja) 白血病疾患遺伝子およびその使用
CN101068936A (zh) 用于实体瘤预后及治疗的方法和系统
JP2011525106A (ja) 瀰漫性b大細胞型リンパ腫のマーカーおよびその使用方法
WO2010141546A1 (en) Diagnostic transcriptomic biomakers in inflammatory cardiomyopathies
US9721067B2 (en) Accelerated progression relapse test
CN114875149A (zh) 检测生物标志物的试剂在制备预测胃癌预后产品中的应用
US20130157893A1 (en) Method for predicting therapeutic effect of immunotherapy on cancer patient, and gene set and kit to be used in the method
CN105722998A (zh) 预测乳腺癌复发
KR20070115891A (ko) 충실성 종양의 예후전망을 위한 약물유전학 마커
JP2022023238A (ja) 多発性骨髄腫のためのgep5モデル
US20180051342A1 (en) Prostate cancer survival and recurrence
CN104169434A (zh) 一种用于卵巢癌的体外诊断或预后的方法
Czerwiński et al. Variances in the expression of mRNAs and miRNAs related to the histaminergic system in endometrioid endometrial cancer
KR20170072685A (ko) 삼중음성유방암의 아형 분류 방법
EP2607494A1 (en) Biomarkers for lung cancer risk assessment
Nishitani et al. Cross-tissue correlations of genome-wide DNA methylation in Japanese live human brain and their blood, saliva, and buccal epithelial tissues
Gao et al. Subtype classification and prognosis of diffuse large B-cell lymphoma based on variable importance analysis
JP2025506567A (ja) 末梢t細胞リンパ腫の治療のためのバイオマーカー及びその使用方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Open date: 20071107