[go: up one dir, main page]

CN109219852A - 表征dna样品的方法 - Google Patents

表征dna样品的方法 Download PDF

Info

Publication number
CN109219852A
CN109219852A CN201780027322.7A CN201780027322A CN109219852A CN 109219852 A CN109219852 A CN 109219852A CN 201780027322 A CN201780027322 A CN 201780027322A CN 109219852 A CN109219852 A CN 109219852A
Authority
CN
China
Prior art keywords
sample
label
defect
patient
dna
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201780027322.7A
Other languages
English (en)
Inventor
S·尼克-扎因
H·戴维斯
D·格洛德齐艾克
S·摩根内拉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Genome Research Ltd
Original Assignee
Genome Research Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from GBGB1607630.9A external-priority patent/GB201607630D0/en
Priority claimed from GBGB1703903.3A external-priority patent/GB201703903D0/en
Application filed by Genome Research Ltd filed Critical Genome Research Ltd
Publication of CN109219852A publication Critical patent/CN109219852A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/10Ploidy or copy number detection
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P35/00Antineoplastic agents
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • C12Q1/6886Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B10/00ICT specially adapted for evolutionary bioinformatics, e.g. phylogenetic tree construction or analysis
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B25/00ICT specially adapted for hybridisation; ICT specially adapted for gene or protein expression
    • G16B25/10Gene or protein expression profiling; Expression-ratio estimation or normalisation
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B5/00ICT specially adapted for modelling or simulations in systems biology, e.g. gene-regulatory networks, protein interaction networks or metabolic networks
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B50/00ICT programming tools or database systems specially adapted for bioinformatics
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2537/00Reactions characterised by the reaction format or use of a specific feature
    • C12Q2537/10Reactions characterised by the reaction format or use of a specific feature the purpose or use of
    • C12Q2537/165Mathematical modelling, e.g. logarithm, ratio
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/106Pharmacogenomics, i.e. genetic variability in individual responses to drugs and drug metabolism
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/156Polymorphic or mutational markers

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • General Health & Medical Sciences (AREA)
  • Biotechnology (AREA)
  • Biophysics (AREA)
  • Genetics & Genomics (AREA)
  • Analytical Chemistry (AREA)
  • Medical Informatics (AREA)
  • Theoretical Computer Science (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Molecular Biology (AREA)
  • Organic Chemistry (AREA)
  • Immunology (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Pathology (AREA)
  • Oncology (AREA)
  • Microbiology (AREA)
  • Hospice & Palliative Care (AREA)
  • Biochemistry (AREA)
  • General Engineering & Computer Science (AREA)
  • Animal Behavior & Ethology (AREA)
  • Physiology (AREA)
  • Bioethics (AREA)
  • Public Health (AREA)
  • Databases & Information Systems (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Artificial Intelligence (AREA)
  • Data Mining & Analysis (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Software Systems (AREA)

Abstract

本发明提供了一种表征来自肿瘤的DNA样品的方法,所述方法包括以下步骤:确定样品中存在或不存在多个碱基置换标签、重排标签和插入缺失标签,以及样品的拷贝数谱;通过所述多个碱基置换标签、重排标签和插入缺失标签的存在或不存在,以及样品的拷贝数谱,生成概率分数;和基于所述概率分数,鉴定所述样品是否具有高或低可能性是同源重组(HR)缺陷。肿瘤鉴定为HR缺陷可用于告知治疗选择,例如用PARP抑制剂或铂疗法或蒽环类药物治疗。

Description

表征DNA样品的方法
发明领域
本发明涉及表征DNA样品的方法。特别地,但不限于,涉及基于来自肿瘤的DNA样品表征癌症特性的方法。
发明背景
体细胞突变存在于人体的所有细胞中并且在整个生命中发生。它们是多个突变过程的结果,包括DNA复制机制的内在轻微失真、暴露到外源或内源性诱变剂、DNA的酶法修饰和缺陷性DNA修复。不同的突变过程产生突变类型的独特组合,称为“突变标签(MutationalSignatures)”。
全基因组测序(WGS)允许探索人类癌症基因组中所有类别的体细胞突变,包括碱基取代、插入/缺失(插入缺失),重排/结构变异(SV)和拷贝数变异(CNA)。迄今为止,全世界已报道了大约2,500种多种肿瘤类型的癌症全基因组。
这些庞大的数据库为聚合分析提供了非凡的力量,并且正在努力细致探索这些数据,以进一步了解基本的癌症生物学(国际癌症基因组联盟泛癌症分析工作组(https://dcc.icgc.org/pcawg))。癌症WGS研究揭示了患者之间(肿瘤间异质性)以及个体癌症里(肿瘤内异质性)存在巨大的突变差异。实际上,总体信息是癌症非常复杂。没有两种癌症是相似的。因此,大量的WGS数据看起来令人生畏,而且过于复杂,没有临床意义。
最近报道了560例WGS乳腺癌;迄今为止最大的单一癌症类型的WGS癌症集合。从全部数据中提取关键的生物学见解,特别是提供选择性优势的推定因果突变(“驱动(driver)”突变)和报告癌症发展中出错的生物现象的过客(passenger)突变模式(“突变标签”)。该WGS乳腺癌数据库的结果包括93个基因中的1,628个推定驱动突变、12个碱基置换标签、2个插入缺失标签、6个重排标签和拷贝数谱(copy number profiles)。
然而,可以针对个体患者提取从汇总的数据库中提取的驱动和突变标签信息,以生成个性化基因组谱。有趣的是,虽然没有两个患者共享同一组体细胞突变,但整合基因组谱的整体考虑可以提供信息并具有临床前景。
先前显示一个碱基置换标签(标签3)在一小群乳腺癌中区分BRCA1/2无效与散发性乳腺癌。随后,发现标签3存在于乳腺癌、胰腺癌和卵巢癌中。BRCA1/2参与同源重组(HR)双链断裂修复,并且这些基因的失活可以通过生殖系和/或体细胞突变或BRCA1的启动子过度甲基化来实现。
BRCA1和/或BRCA2中种系失活突变导致早发性乳腺癌[1,2]、卵巢癌[2,3]和胰腺癌[4]的风险增加,而这两个基因的体细胞突变和BRCA1启动子过度甲基化也与这些癌症类型的发展有关[5,6]。BRCA1和BRCA2参与无差错同源介导的双链断裂修复[7]。因此,BRCA1和BRCA2缺陷的癌症由于非同源末端连接机制的易错修复而显示出大量的重排和插入缺失,其承担双链断裂修复的责任[8,9]。
而缺陷性双链断裂修复增加了细胞的突变负担,从而增加了获得导致肿瘤性转化的体细胞突变的机会,当暴露于诸如铂类抗肿瘤药物时,它还使细胞更容易受到细胞周期停滞和随后的细胞凋亡的影响[10,11]。这种易感性已经成功地用于开发靶向和毒性小的治疗策略,用于治疗携带BRCA1和/或BRCA2突变的乳腺癌、卵巢癌和胰腺癌,特别是聚(ADP-核糖)聚合酶(PARP)抑制剂[10,11]。这些治疗引起大量DNA双链断裂,迫使BRCA1和BRCA2功能缺陷的肿瘤细胞发生凋亡,因为它们缺乏有效修复双链断裂的能力。相比之下,正常细胞基本上不受影响,因为它们的修复机构没有受到损害。
因此,鉴定癌症是否是BRCA1/2缺陷或正常(proficient)可能在治疗方案中具有相当大的帮助。因此,对DNA样品(例如来自肿瘤的样品)进行分类的方法将在诊断该肿瘤可能的癌症类型方面提供相当大的益处,或者可以允许选择患者用于特定类型的治疗。
发明内容
本发明的一个示例性实施方式提供了一种表征来自肿瘤的DNA样品的方法,所述方法包括以下步骤:确定样品中存在或不存在多个:碱基置换标签、重排标签和插入/缺失(插入缺失)标签,以及样品的拷贝数谱;通过样品中所述多个碱基置换标签、重排标签和插入缺失标签的存在或不存在,以及样品的拷贝数谱,生成概率分数;和基于所述概率分数,鉴定所述样品是否具有高或低可能性是同源重组(HR)缺陷。
本发明的另一示例性实施方式提供了计算机程序产品,包含存储有计算机程序的永久性存储器,当在计算机上运行时,其执行以下步骤:确定来自肿瘤的DNA样品中存在或不存在多个:碱基置换标签、重排标签和插入缺失标签,并确定样品的拷贝数谱;通过样品中多个碱基置换标签、重排标签和插入缺失标签的存在或不存在,以及样品的拷贝数谱,生成概率分数;和基于所述概率分数,鉴定所述样品是否具有高或低可能性是同源重组(HR)缺陷。
本发明的又一示例性实施方式提供了一种含有处理器的计算机,其中所述处理器被配置为:确定来自肿瘤的DNA样品中存在或不存在多个:碱基置换标签、重排标签和插入缺失标签,并确定样品的拷贝数谱;通过样品中多个碱基置换标签、重排标签和插入缺失标签的存在或不存在,以及样品的拷贝数谱,生成概率分数;和基于所述概率分数,鉴定所述样品是否具有高或低可能性是同源重组(HR)缺陷。
附图简要说明
图1是以示意图形式显示根据本发明的实施方式表征DNA样品的方法的流程图;和
图2是显示9名患者用蒽环类药物治疗的响应和使用根据本发明实施方式的方法的相关预测的表。
具体实施方式
本发明的第一方面提供了一种表征来自肿瘤的DNA样品的方法,所述方法包括以下步骤:确定样品中存在或不存在多个碱基置换标签、重排标签和一个或多个插入缺失标签,以及样品的拷贝数谱;通过样品中所述多个碱基置换标签、重排标签和插入缺失标签的存在或不存在,以及样品的拷贝数谱,生成概率分数;和基于所述概率分数,鉴定所述样品是否具有高或低可能性是同源重组(HR)缺陷。
本发明的第二方面提供了一种表征来自肿瘤的DNA样品的方法,该方法包括以下步骤:
进行以下两个或多个步骤:
a)确定样品中存在或不存在至少一个碱基置换标签
b)确定样品中存在或不存在至少一个重排标签
c)确定样品中存在或不存在至少一个插入缺失标签;和
d)确定样品的拷贝数谱;
通过上述确定生成概率分数;和基于所述概率分数,鉴定所述样品是否具有高或低可能性是同源重组(HR)缺陷。
优选地,进行所述方面的三个或更多个确定步骤,更优选所有四个确定步骤。概率分数和产生该概率分数的确定的加权可以根据进行的确定步骤、和/或进行的确定步骤的数量和/或每个确定步骤中使用的标签或谱的数量而变化。
现在列出可选和优选的特征,其可以以任何组合应用于上述任何和所有方面。
在考虑碱基置换标签的情况下,优选地所述碱基置换标签包括碱基置换标签3或碱基置换标签8或两者。
在考虑重排标签的情况下,优选地多个重排标签包括重排标签5或重排标签3或两者。
在考虑插入缺失标签的情况下,优选地多个插入缺失标签包括微同源介导的插入缺失。
优选地,如果考虑,拷贝数谱包括基于HRD拷贝数的指数。
在本发明的特定实施方式中,多个碱基标签、多个重排标签和多个插入缺失标签由碱基置换标签3、碱基置换标签8、重排标签5和重排标签3以及微同源介导的插入缺失组成。在对来自乳腺癌的WGS进行广泛研究之后,已经发现这五个因素以及拷贝数谱对肿瘤是否是HR缺陷影响最大。
优选地,在这些实施方式中,概率分数是加权分数,根据以下优先级(最大的优先)为因子赋予权重:微同源介导的插入缺失、碱基置换标签3、重排标签5、基于HRD拷贝数的指数、重排标签3和碱基置换标签8。对来自乳腺癌的WGS的研究发现,上述顺序表明了这六个因素的重要性。
所述方法可以进一步包括步骤:对所述样品中的体细胞突变进行编目以产生所述样品的突变目录,其中所述碱基置换标签、重排标签和/或插入缺失标签的存在或不存在根据需要从所述突变目录得到。
当已经获得这样的目录时,所述方法进一步包括步骤:确定突变目录中突变的数量,其根据需要可归因于确定存在的每个碱基置换标签、重排标签和/或插入缺失标签。
生成概率分数可以包括以下子步骤:对归因于每个标签的突变的数量进行对数变换;归一化拷贝数谱和每个标签的突变的对数变换数量;和通过预定的加权因子对每个所述归一化值进行加权,所述加权因子表示与该值相关联的标签或特征导致肿瘤是HR缺陷的可能性。
通过对突变的数量进行对数变换,并对所有特征进行归一化,可以获得各种因素的影响之间的准确平衡。
在一个特定实施方式中,概率分数被生成为
其中
Ci是编码第i个样品状态的变量
β0是截距权重
是第i个样品的向量编码特征;和
β是权重的向量。
对于其中特征由上述六个特征组成的实施方式,权重的向量β可以如下表1所示,或者在这些权重的±10%,优选±5%的变化内:
表1
特征 权重β
具有微同源性的插入缺失的比例 2.129
碱基置换标签3的数量 1.239
重排标签5重排的数量 0.978
HRD指数 0.613
重排标签3重排的数量 0.588
碱基置换标签8的数量 0.444
对于其中特征由上述六个特征组成的其他实施方式,权重的向量β可以如下表2所示,或者在这些权重的±10%,优选±5%的变化内:
表2
特征 权重β
具有微同源性的插入缺失的比例 2.398
碱基置换标签3的数量 1.611
重排标签5重排的数量 0.847
HRD指数 0.667
重排标签3重排的数量 1.153
碱基置换标签8的数量 0.091
对于其中特征由上述六个特征的子集组成的实施方式,权重的向量β可以如下表3所示,或者在这些权重的±10%,优选±5%的变化内:
表3
鉴定步骤可包括将所述分数与预定阈值进行比较,和基于所述比较进行所述鉴定。可以基于临床参数来设置阈值。例如,可以将加权分数与阈值进行比较,并且根据该比较,制定关于如何治疗从中采集DNA样品的肿瘤的临床决策。
本方面的方法可包括上述优选和可选特征中的一些、全部或没有的任何组合。
本发明的其他方面包括用于在计算机系统上运行的计算机程序,所述计算机程序执行上述方面(包括该方面的一些、全部或没有优选和可选特征)的方法。
本发明的另一方面提供了一种计算机程序产品,所述计算机程序产品包含存储有计算机程序的永久性存储器,当在计算机上运行时,执行以下步骤:确定来自肿瘤的DNA样品中存在或不存在多个:碱基置换标签、重排标签和插入缺失标签,并确定样品的拷贝数谱;通过样品中多个碱基置换标签、重排标签和插入缺失标签的存在或不存在,以及样品的拷贝数谱,生成概率分数;和基于所述概率分数,鉴定所述样品是否具有高或低可能性是同源重组(HR)缺陷。
本发明的又一方面提供了一种含有处理器的计算机,其中所述处理器被配置为:确定来自肿瘤的DNA样品中存在或不存在多个:碱基置换标签、重排标签和插入缺失标签,并确定样品的拷贝数谱;通过样品中多个碱基置换标签、重排标签和插入缺失标签的存在或不存在,以及样品的拷贝数谱,生成概率分数;和基于所述概率分数,鉴定所述样品是否具有高或低可能性是同源重组(HR)缺陷。
上述两个方面的计算机程序和处理器还可以执行上面关于第一方面描述的一些或全部可选或优选步骤。
本发明的另一方面提供了一种预测癌症患者是否可能对PARP抑制剂或铂类药物或蒽环类药物有响应的方法,所述方法包括使用根据上述第一方面的方法(包括该方面的一些、全部或没有任选或优选步骤)将来自患者肿瘤的样品表征为具有高或低可能性是同源重组(HR)缺陷,其中如果样品被表征为具有高可能性是HR缺陷,则患者可能对PARP抑制剂或铂类药物或蒽环类药物响应。
本发明的另一方面提供了一种选择用PARP抑制剂或铂类药物或蒽环类药物治疗的癌症患者的方法,所述方法包括使用根据上述第一方面的方法(包括该方面的一些、全部或没有任选或优选步骤)将来自患者肿瘤的样品表征为具有高或低可能性是同源重组(HR)缺陷,如果样品被表征为具有高可能性是HR缺陷,则选择该患者用PARP抑制剂或铂类药物或蒽环类药物治疗。
本发明的另一方面提供PARP抑制剂或铂类药物或蒽环类药物用于患者癌症的治疗方法,从所述患者获得DNA样品,并且通过根据上述第一方面的方法(包括该方面的一些、全部或没有任选或优选步骤),所述DNA样品被表征为具有高可能性是HR缺陷。
本发明的另一方面提供了一种治疗患者的癌症的方法,所述患者被确定为患有具有高可能性是HR缺陷的肿瘤,其中肿瘤是HR缺陷的可能性是通过使用根据上述第一方面的方法(包括该方面的一些、全部或没有任选或优选步骤)表征来自肿瘤的DNA样品来确定的。
本发明的另一方面提供PARP抑制剂或铂类药物或蒽环类药物用于患者癌症的治疗方法,所述方法包括:(i)使用如上述第一方面的方法(包括该方面的一些、全部或没有任选或优选步骤),确定来自所述患者的DNA样品是否具有高或低可能性是HR缺陷;和(ii)如果确定DNA样品具有高可能性是HR缺陷,则向患者施用PARP抑制剂或铂类药物或蒽环类药物。
本发明的另一方面提供了一种预测癌症患者是否可能对靶向DNA修复途径或引起DNA损伤的药剂有响应的方法,所述方法包括使用权利要求1-14中任一项所述的方法将来自患者肿瘤的样品表征为具有高或低可能性是同源重组(HR)缺陷,其中如果样品被表征为具有高可能性是HR缺陷,则患者可能对靶向DNA修复途径或引起DNA损伤的药剂响应。
本发明的另一方面提供了一种选择用靶向DNA修复途径或引起DNA损伤的药剂治疗的癌症患者的方法,所述方法包括使用权利要求1-14中任一项所述的方法将来自患者肿瘤的样品表征为具有高或低可能性是同源重组(HR)缺陷,如果所述样品具有高可能性是HR缺陷,则选择该患者用靶向DNA修复途径或引起DNA损伤的药剂治疗。
本发明的另一方面提供靶向DNA修复途径或引起DNA损伤的药剂用于患者癌症的治疗方法,从所述患者获得DNA样品,并且通过根据权利要求1-14中任一项所述的方法,所述DNA样品被表征为具有高可能性是HR缺陷。
本发明的另一方面提供靶向DNA修复途径或引起DNA损伤的药剂用于患者癌症的治疗方法,所述方法包括:(i)使用根据权利要求1-14中任一项所述的方法,确定来自所述患者的DNA样品是否具有高或低可能性是HR缺陷;和(ii)如果确定DNA样品具有高可能性是HR缺陷,则向患者施用靶向DNA修复途径或引起DNA损伤的药剂。
下面进一步详细描述本发明的这些和其他方面。
预测结果的使用
预测肿瘤样本为BRCA缺陷的癌症患者可能通过同源重组DNA双链修复失败,并且易受引起双链断裂的药物的影响,例如,PARP抑制剂或铂类药物或蒽环类药物。
聚ADP核糖聚合酶(PARP1)是一种对修复单链断裂(也称为“缺口”)很重要的蛋白质。如果这些缺口在DNA复制之前仍未修复,则复制本身可导致形成大量双链断裂。抑制PARP1的药物会导致大量双链断裂。在不能通过无差错同源重组修复双链DNA断裂的肿瘤中,PARP1的抑制导致不能修复这些双链断裂并导致肿瘤细胞死亡。用于本发明的PARP抑制剂优选是PARP1抑制剂。PARP抑制剂的实例包括:依尼帕尼(Iniparib)、他拉唑帕尼(Talazoparib)、奥拉帕尼(Olaparib)、芦卡帕尼(Rucaparib)和维利帕尼(Veliparib)。
铂类抗肿瘤药物是用于治疗癌症的化学治疗剂。它们是铂的配位络合物,其引起DNA作为单加合物交联、链间交联、链内交联或DNA蛋白交联。它们主要作用于相邻的鸟嘌呤N-7位,形成1,2链内交联。所得的交联抑制癌细胞中的DNA修复和/或DNA合成。一些常用的铂类抗肿瘤药物包括:顺铂、卡铂、奥沙利铂(oxaliplatin)、赛特铂(satraplatin)、吡铂、奈达铂、三铂(Triplatin)和利波铂(Lipoplatin)。
蒽环类药物是用于治疗各种癌症常用的化学治疗剂。通常它们的作用机制包括:a)通过插入到链的碱基对之间抑制DNA和RNA合成,从而防止复制;b)通过抑制拓扑异构酶II阻断DNA转录和复制。常用的蒽环类药物的例子是阿霉素、表柔比星、柔红霉素、伊达比星、奈莫霉素、匹杉琼(pixantrone)、萨巴比星(sabarubicin)和戊柔比星。
本发明还涉及用PARP抑制剂或铂类药物或蒽环类药物治疗患者的癌症,所述患者患有通过上述方法鉴定为BRCA缺陷的肿瘤。
例如,所述PARP抑制剂或铂类药物或蒽环类药物可用于治疗患者癌症的方法,所述患者患有通过上述方法鉴定为BRCA缺陷的肿瘤。在治疗之前,所述方法可以包括基于来自所述患者的DNA样品预测肿瘤是否是BRCA正常或缺陷的步骤。优选地,这些是全基因组样品,并且本文所述的作为预测工具的输入值的体细胞突变可以通过全基因组测序确定。所述DNA样品可以是全外显子组样品,并且本文所述的作为预测工具的输入值的体细胞突变可以通过全外显子组测序确定。
所述DNA样品优选来自患者的肿瘤和正常组织,例如,来自患者的血液样品和通过活组织检查获得的肿瘤组织。通过将其基因组序列与正常组织之一进行比较,标准地检测肿瘤样品中的体细胞突变。
所述治疗方法包括将PARP抑制剂或铂类药物或蒽环类药物施用于患有预测为BRCA缺陷的肿瘤的癌症患者的步骤。可以使用任何合适的施用途径。
待治疗的患者优选是人类患者。
基因组分析以区分BRCA1/2缺陷与BRCA1/2正常癌症
先前已有报道,与BRCA1或BRCA2种系突变相关以及与野生型等位基因的体细胞失活相关的的肿瘤,具有区别的基因组谱,其特点是突变总体数量更多,过量的碱基置换标签3或8,在插入缺失的连接处具有微同源性过量的大片段缺失(>3bp),重排标签5和与广泛的杂合性缺失相关的拷贝数谱。
另外,BRCA1无效肿瘤也主要具有过量的重排标签3,有时还具有重排标签1。相反,典型的ER阳性肿瘤具有较少的突变、标签1和5、少数插入缺失、少数重排和典型的拷贝数异常,包括1q增加和16q减少。
在上述560例乳腺癌的WGS中,发明人鉴定了77例BRCA1或BRCA2基因无效的乳腺癌,以及274例明确的BRCA1/2正常的散发性肿瘤作为训练集,并定量地寻找BRCA状态(BRCA-ness)的界定特征。
对所有基因组参数使用套索(lasso)逻辑回归模型,所述基因组参数被鉴定为有助于BRCA状态,包括训练集上的碱基置换、插入缺失、重排和拷贝数标签。
单独发现六个区别参数以表达数据库之间的最大差异。降低影响排列,这些是:微观同源介导的插入缺失、碱基置换标签3、重排标签5、HRD指数、重排标签3、碱基置换标签8。
因此,发明人能够使用训练集中鉴定的基因组参数开发灵活的加权模型,以便为每个样品评分BRCA状态,如下更详细描述。
与现有的确定DNA样品是否为HR缺陷的方法(对BRCA1/BRCA2基因进行测序或寻找启动子高甲基化)相比,该模型能够正确地鉴定更多数量的肿瘤为HR缺陷。在所研究的560例全基因组中,在被招募到这项研究之前,已知23名有证据表明BRCA1/BRCA2蛋白在其肿瘤中完全消失的女性在这些基因中遗传了突变。使用根据本发明实施方式的模型,发明人能够鉴定另外35名BRCA1/BRCA2遗传突变的女性和另外59名女性预计具有高可能性患有HR缺陷肿瘤,而之前没有这种迹象。
预测来自肿瘤样品的DNA为BRCA缺陷或正常
为了开发和确定各种碱基置换、重排和插入缺失标签和HRD指数的权重,通过上述方法(或其他方法)处理来自WGS的DNA样品的体细胞突变,确定置换、重排和插入缺失的标签是否存在,从而确定每个样品中归因于这些标签中的每一个的突变数量。与HRD分数一起,这些“特征”是预测阶段的输入,其将结合下面的实施例进行描述。
该“训练”阶段应用于所有可用参数(即所有12个相关基础替换标签,两个插入标签和所有6个重排签名和HRD指数)。通过将下面描述的对数变换和套索逻辑回归模型应用于560WGS数据库,该模型记住了提供信息的参数,并基于样品记住了每个参数的权重,所述样品与已知为散发性和非HR缺陷的乳腺癌样品相比,肿瘤水平为BRCA1/BRCA2无效(HR缺陷)。
根据以下公式,每个输入(归因于特定碱基置换、插入缺失和重排标签的突变数和HRD指数)进行了对数变换:
x′=ln(x+1)
对数变换的数据在该特征的所有数据中进行了归一化:
通过回归收缩和选择模型和通过套索方法解析数据,其中所有β权重都被约束为正,因为它们反映了突变过程的生物存在-在这种情况下HR缺陷。肿瘤中可能存在多个突变过程,在某些情况下,某些超突变子突变表型可能成为特定癌症的主导,并且会超过其他突变过程的影响。因此,受限于正权重的模型允许检测突变过程,无论其在特定患者中的标称如何。
通过最大化训练数据的惩罚似然来获得逻辑回归的参数。惩罚似然函数是:
其中
β0是截距,相当于BRCA状态的背景对数几率
β是权重向量,其中一个实际值对应于各特征
p是表征每个样本的特征数
N是样本数量
是表征第i个样本的特征向量
λ是促进权重稀疏性的惩罚(实际值)
||β||1是权重向量的L1范数,即权重向量的所有条目的绝对值之和
使用十倍嵌套交叉验证技术测试为分类器选择的β权重的稳健性。在分类器中导出和使用的最终系数和参数列于下表4中:
表4
在另一种训练方法中,上述过程是在来自560WGS数据库的不同训练样本集上进行的,并且使用相同的77个样品组,其已被鉴定为BRCA 1/2缺陷(HR缺陷)但具有更精细的BRCA 1/2正常(HR-正常)样品的选择。从该数据库导出可以替代地在分类器使用的最终系数和参数列于下表5中:
表5
使用较小的因子选择进行预测
发明人还测试了有意限制的可用参数子集的能力以提供有用的预测。为了测试这一点,将上述对数变换和套索逻辑回归模型应用于560WGS数据库,但仅针对上述参数的有限子集。具体而言,测试了组合或选自以下的两类或更多类别的参数:相关碱基置换标签、重排标签、插入缺失标签和HRD指数。
从这些子集中的每一个,该模型记住了提供信息的参数,并基于样品记住了每个参数的权重,所述样品与已知为散发性和非HR缺陷的乳腺癌样品相比,肿瘤水平为BRCA1/BRCA2无效(HR缺陷)。
从这个学习过程中,对于以下两种或更多种的组合,发现了良好的预测能力(尽管不如使用所有可用参数那样好):碱基置换标签,重排标签,插入缺失标签和HRD指数。在这些组合中的各种中在分类器中导出和使用的最终系数和参数列于下表6中。
表6
为了确定这些组合作为来自单个肿瘤的样本是否是BRCA正常或缺陷的有用预测因子的适用性,基于0.7的概率分数的阈值(表明样品是BRCA缺陷的),计算上述每个特征和权重组合的灵敏度。结果如下表7所示。为了比较,表7还显示了上述6特征组合的灵敏度,以及单独使用时的每个特征。
表7
预测来自个体样品的BRCA正常或缺陷的DNA
在本发明的实施方式中,对来自单个患者肿瘤的DNA样品是否为BRCA正常或缺陷进行预测。在这些实施方式中,该预测通过计算机执行的方法或工具进行,所述方法或工具将该DNA样品中碱基置换和重排标签、微同源介导的插入缺失和基于HRD拷贝数的指数的相对存在或不存在作为其输入。
在该实施方式的开发中,计算机执行的方法或工具可以将通过高覆盖度或低通测序核酸材料产生的体细胞突变列表作为其输入,所述核酸材料来自新鲜冷冻衍生的DNA,循环肿瘤DNA或福尔马林固定石蜡包埋(FFPE)的DNA,其代表来自患者的疑似或已知肿瘤。然后可以分析这些体细胞突变以确定碱基置换和重排标签、微同源介导的插入缺失的相对存在或不存在,和基于HRD拷贝数的指数。
可以通过诸如[17]中描述的方法来确定碱基置换标签的相对存在或不存在。
可以通过诸如PCT专利申请号PCT/EP2017/060279(其与本申请同日提交,并通过引用并入到本文中)中描述的方法确定重排标签的相对存在或不存在。
确定微同源介导的插入缺失(也称为“微同源介导的缺失”,因为在整个插入和缺失范围内,只有缺失被归类为微同源介导的)的存在或不存在可以如下进行。
首先,使用cgpPindel识别插入缺失,如[18]和[19]中所述。
对于每个插入/缺失(插入缺失),使用Ensembl API鉴别大于或等于25bp的侧翼序列。
在其余分析中仅考虑缺失。如果缺失基序的前几个核苷酸(但不是所有核苷酸)与直接3’侧翼序列的前几个核苷酸相匹配,那么这称为“微同源介导的缺失”或“微同源介导的插入缺失”。
基于HRD拷贝数的指数的确定也称为HRD“分数”,并且是杂合性丢失、端粒等位基因失衡和大规模状态转移(large-scale state transitions)分数的总和。确定这些中的每一个的过程在[14-16]中列出。HRD分数是0-50之间的整数。
该方法的步骤在图1中示意性地说明。首先,任选地载入来自DNA样品的体细胞突变(S101),然后通过上述方法(或其他方法)处理以确定预测器的输入(S102)。一旦获得了置换、重排和插入缺失的标签的存在或不存在,就确定归因于样品中这些特征中每一个的突变数量。与HRD分数一起,这些“特征”是预测阶段的输入。
预测器根据这些输入生成加权分数(S103),其计算如下。
根据以下公式,每个输入(归因于特定碱基置换、插入缺失和重排标签的突变数和HRD指数)进行对数变换:
x′=ln(x+1)
使用上表2中所示的该特征的平均值和标准差对对数变换的数据进行归一化。
然后使用归一化分数来确定样本为BRCA缺陷的概率:
其中
Ci是编码第i个样品状态的变量
β0是截距,相当于BRCA状态的背景对数几率
是第i个样品的向量编码特征
β是权重的向量
然后,该步骤的概率可用于告知可基于肿瘤BRCA缺陷的可能性而采取的临床决策。
例如,可以将加权分数与阈值进行比较(S104),并且根据该比较,制定关于从中采集DNA样品的肿瘤是BRCA正常还是缺陷的临床决策(S105)。
临床决策可包括肿瘤对特定疗程的适合性,例如,如上所述用PARP抑制剂或铂疗法治疗。
临床试验
为了研究根据上述实施方式的方法的潜在临床实用性,在来自小针活检样品的DNA样品上进行所述方法,而不是在术后大样本上进行。
18例DNA样本(14例针活检和4例术后肿瘤块标本)获自9例三阴性肿瘤患者,这些患者接受了新辅助蒽环类霉素+/-紫杉烷类治疗[20]。尽管与PARP抑制剂不同,但已报道显示BRCA1/BRCA2缺陷的肿瘤对蒽环类药物敏感[21,22]。图2显示了对这9名患者应用上述方法的结果。对于五个样品(预处理活组织检查1和2),可获得重复的预处理针活组织检查样品。一名患者(PD9770)患有多灶性肿瘤。一名患者在两次活检中均具有极低的肿瘤细胞性,并且几乎没有任何突变被排除在外(PD9773)。在每个样本下提供从上述方法获得的概率分数。
4名患者表现出对治疗的完全响应,并且所有患者使用上述方法都具有高概率是BRCA缺陷。两名被证实是种系BRCA1突变携带者,两名是散发性肿瘤,如图2所示。相比之下,五名表现出残留疾病的患者使用上述方法具有低概率是BRCA缺陷。此外,上述方法在每位患者的独立活组织检查中以及每位患者的活组织检查和术后标本之间一致地执行,无一例外。
尽管数量小,但这些分析表明,在第一次活组织检查时,根据本发明实施方式的方法能够在患者临床过程的早期区分治疗敏感性。此外,他们认为这些方法在活组织检查/标本之间是稳健的。显然,需要更大的临床试验来充分了解这种预测器在应用于乳腺癌诊断时的表现。
更多的信息
除了所描述的结构组件和用户交互之外,上述实施例的系统和方法可以在计算机系统(特别是计算机硬件或计算机软件)中实现。
术语“计算机系统”包括用于实现系统或执行根据上述实施例的方法的硬件、软件和数据存储设备。例如,计算机系统可以包括中央处理单元(CPU),输入装置,输出装置和数据存储器。优选地,计算机系统具有显示屏以提供视觉输出显示(例如,在业务过程的设计中)。数据存储器可以包括RAM、磁盘驱动器或其他计算机可读介质。计算机系统可以包括通过网络连接并且能够通过该网络彼此通信的多个计算设备。
上述实施方式的方法可以作为计算机程序或作为计算机程序产品或携带计算机程序的计算机可读介质提供,当在计算机上运行时,执行上述方法。
术语“计算机可读介质”包括但不限于可以由计算机或计算机系统直接读取和访问的任何非暂时性介质或介质。介质可以包括但不限于:磁存储介质,例如软盘、硬盘存储介质和磁带;光存储介质,例如光盘或CD-ROM;电子存储介质,例如存储器,包括RAM、ROM和闪存;以及上述的混合物和组合,例如磁/光存储介质。
参考文献
1 Ford,D.等人,乳腺癌家系中BRCA1和BRCA2基因的遗传异质性和外显率分析“Genetic heterogeneity and penetrance analysis of the BRCA1 and BRCA2 genesin breast cancer families”,乳腺癌联合协会,美国人类遗传学杂志(American journalof human genetics)62,676-689(1998).
2 King,M.C.,Marks,J.H.,Mandell,J.B.和纽约乳腺癌研究,G.由于BRCA1和BRCA2的遗传突变导致乳腺癌和卵巢癌风险“Breast and ovarian cancer risks due toinherited mutations in BRCA1 and BRCA2”,科学(Science)302,643-646,doi:10.1126/science.1088759(2003).
3 Risch,H.A.等人,在一系列649名卵巢癌女性人群中,种系BRCA1和BRCA2突变的患病率和外显率“Prevalence and penetrance of germline BRCA1 and BRCA2mutations in a population series of 649 women with ovarian cancer”,美国人类遗传学杂志68,700-710,doi:10.1086/318787(2001).
4 Greer,J.B.和Whitcomb,D.C.BRCA1和BRCA2突变在胰腺癌中的作用“Role ofBRCA1 and BRCA2 mutations in pancreatic cancer”,Gut 56,601-605,doi:10.1136/gut.2006.101220(2007).
5 Alexandrov,L.B.等人,人类癌症中突变过程的特征“Signatures ofmutational processes in human cancer”,自然(Nature)500,415-421,doi:10.1038/nature12477(2013).
6 Waddell,N.等人,全基因组重新定义胰腺癌的突变蓝图“Whole genomesredefine the mutational landscape of pancreatic cancer”,自然518,495-501,doi:10.1038/nature14169(2015).
7 Merajver,S.D.等人,散发性卵巢肿瘤中BRCA1基因的体细胞突变“Somaticmutations in the BRCA1 gene in sporadic ovarian tumours”,自然遗传学(Naturegenetics)9,439-443,doi:10.1038/ng0495-439(1995).
8 Miki,Y.,Katagiri,T.,Kasumi,F.,Yoshimoto,T.和Nakamura,Y.原发性乳腺癌中BRCA2基因的突变分析“Mutation analysis in the BRCA2 gene in primary breastcancers”,自然遗传学13,245-247,doi:10.1038/ng 0696-245(1996).
9 Jackson,S.P.检测和修复DNA双链断裂“Sensing and repairing DNA double-strand breaks”,癌变(Carcinogenesis)23,687-696(2002).
10 Nik-Zainal,S.等人,模拟21种乳腺癌基因组的突变过程“Mutationalprocesses molding the genomes of 21 breast cancers”,细胞(Cell)149,979-993,doi:10.1016/j.cell.2012.04.024(2012).
11 Walsh,T.等人,乳腺癌高危家庭中BRCA1、BRCA2、CHEK2和TP53的突变谱“Spectrum of mutations in BRCA1,BRCA2,CHEK2,and TP53 in families at high riskof breast cancer”.Jama 295,1379-1388,doi:10.1001/jama.295.12.1379(2006).
12 Rottenberg,S.等人,BRCA1缺陷乳腺肿瘤对PARP抑制剂AZD2281单独和与铂类药物组合的高敏感性“High sensitivity of BRCA1-deficient mammary tumors to thePARP inhibitor AZD2281 alone and in combination with platinum drugs”,美国国家科学院院刊(Proceedings of the National Academy of Sciences of the UnitedStates of America)105,17079-17084,doi:10.1073/pnas.0806092105(2008).
13 Alexandrov,L.B.等人,解读人类癌症中手术突变过程的特征“Decipheringsignatures of mutational processes operative in human cancer”。Cell Rep.3(1):246-59,doi:10.1016/j.celrep.2012.12.008(2013)
14 Birkbak,N.J.等人,端粒等位基因失衡表明缺陷DNA修复和对DNA损伤剂的敏感性“Telomeric allelic imbalance indicates defective DNA repair andsensitivity to DNA-damaging agents”,癌症发现(Cancer discovery)2,366-375,doi:10.1158/2159-8290.CD-11-0206(2012).
15 Abkevich,V.等人,基因组杂合性缺失模式预测上皮性卵巢癌中的同源重组修复缺陷“Patterns of genomic loss of heterozygosity predict homologousrecombination repair defects in epithelial ovarian cancer”,英国癌症杂志(British journal of cancer)107,1776-1782,doi:10.1038/bjc.2012.451(2012).
16 Popova,T.等人,倍性和大规模基因组不稳定性一致地鉴定具有BRCA1/2失活的基底样乳腺癌“Ploidy and large-scale genomic instability consistentlyidentify basal-like breast carcinomas with BRCA1/2inactivation”,癌症研究(Cancer research)72,5454-5462,doi:10.1158/0008-5472.CAN-12-1470(2012).
17.Alexandrov,L.B.等人,胃癌中的突变标签提示治疗策略“A mutationalsignature in gastric cancer suggests therapeutic strategies”.Nat.Commun.6:8683doi:10.1038/ncomms9683(2015).
18.Raine,K.M.,Hinton,J.,Butler,A.P.,Teague,J.W.,Davies,H.,Tarpey,P.,Nik-Zainal,S.和Campbell,P.J.2015.cgpPindel:从双末端测序中鉴定体细胞获得的插入和缺失事件“cgpPindel:Identifying somatically acquired insertion and deletionevents from paired end sequencing”,Curr.Protoc.Bioinform.52:15.7.1-15.7.12.doi:10.1002/0471250953.bi1507s52.
19.Ye,K.,Schulz,M.H.,Long,Q.,Apweiler,R.,和Ning,Z.2009.Pindel:一种用于检测来自双末端短序列的大缺失和中等大小插入的断点的模式增长方法“Pindel:Apattern growth approach to detect break points of large deletions and mediumsized insertions from pairedend short reads”,生物信息学(Bioinformatics)(牛津,英格兰)25:2865-2871.doi:10.1093/bioinformatics/btp394.
20.Yates,L.R.等人,通过多区域测序揭示原发性乳腺癌的亚克隆多样化“Subclonal diversification of primary breast cancer revealed by multiregionsequencing”,Nat Med 21,751-9(2015).
21.Rodriguez,A.A.等人,DNA修复特征与三阴性乳腺癌患者的蒽环类药物响应相关“DNA repair signature is associated with anthracycline response in triplenegative breast cancer patients”,乳腺癌研究治疗(Breast Cancer Res Treat)123,189-96(2010).
22.Chappuis,P.O.等人,对BRCA1/2相关乳腺癌新辅助化疗的显著响应“Asignificant response to neoadjuvant chemotherapy in BRCA1/2 related breastcancer”,J Med Genet 39,608-10(2002).
所有上述参考文献在此引入作为参考。

Claims (28)

1.一种表征来自肿瘤的DNA样品的方法,其特征在于,所述方法包括以下步骤:
确定样品中存在或不存在多个:碱基置换标签、重排标签和插入缺失标签,以及样品的拷贝数谱;
通过样品中所述多个碱基置换标签、重排标签和插入缺失标签的存在或不存在,以及样品的拷贝数谱,生成概率分数;和
基于所述概率分数,鉴定所述样品是否具有高或低可能性是同源重组(HR)缺陷。
2.一种表征来自肿瘤的DNA样品的方法,其特征在于,所述方法包括以下步骤:
进行以下两个或多个步骤:
a)确定样品中存在或不存在至少一个碱基置换标签
b)确定样品中存在或不存在至少一个重排标签
c)确定样品中存在或不存在至少一个插入缺失标签;和
d)确定样品的拷贝数谱;
通过上述确定生成概率分数;和
基于所述概率分数,鉴定所述样品是否具有高或低可能性是同源重组(HR)缺陷。
3.根据权利要求1所述的方法,其特征在于,进行三个或更多个所述确定步骤。
4.根据权利要求1-3中任一项所述的方法,其特征在于,所述多个碱基置换标签包括碱基置换标签3和碱基置换标签8。
5.根据前述权利要求中任一项所述的方法,其特征在于,所述多个重排标签包括重排标签5和重排标签3。
6.根据前述权利要求中任一项所述的方法,其特征在于,所述多个插入缺失标签包括微同源介导的插入缺失。
7.根据前述权利要求中任一项所述的方法,其特征在于,所述拷贝数谱包括基于HRD拷贝数的指数。
8.根据权利要求1所述的方法,其特征在于,所述多个碱基置换标签、多个重排标签和多个插入缺失标签由碱基置换标签3、碱基置换标签8、重排标签5和重排标签3以及微同源介导的插入缺失组成。
9.根据权利要求8所述的方法,其特征在于,所述概率分数是加权分数,根据以下优先级(最大的优先)为因子赋予权重:微同源介导的插入缺失、碱基置换标签3、重排标签5、基于HRD拷贝数的指数、重排标签3和碱基置换标签8。
10.根据前述权利要求中任一项所述的方法,其特征在于,所述方法进一步包括步骤:对所述样品中的体细胞突变进行编目以产生所述样品的突变目录,其中所述碱基置换标签、重排标签和/或插入缺失标签存在或不存在是从所述突变目录得到的。
11.根据权利要求10所述的方法,其特征在于,所述方法进一步包括步骤:确定突变目录中突变的数量,其可归因于确定存在的每个碱基置换标签、重排标签和/或插入缺失标签。
12.根据权利要求11所述的方法,其特征在于,所述生成概率分数的步骤包括以下子步骤:
对归因于每个标签的突变的数量进行对数变换;
归一化每个标签和拷贝数谱的突变数量的对数变换;和
通过预定的加权因子对每个所述归一化值进行加权,其表示与该值相关联的标签或谱导致肿瘤是HR缺陷的可能性。
13.根据权利要求12所述的方法,其特征在于,所述概率分数被生成为
其中
Ci是编码第i个样品状态的变量
β0是截距权重
是第i个样品的向量编码特征;和
β是权重的向量。
14.根据前述权利要求中任一项所述的方法,其特征在于,所述鉴定步骤包括将所述分数与预定阈值进行比较,和基于所述比较进行所述鉴定。
15.一种计算机程序产品,其特征在于,所述计算机程序产品包含存储有计算机程序的永久性存储器,当在计算机上运行时,执行以下步骤:
确定来自肿瘤的DNA样品中存在或不存在多个碱基置换标签、重排标签和插入缺失标签,并确定样品的拷贝数谱;
通过样品中多个碱基置换标签、重排标签和插入缺失标签的存在或不存在,以及样品的拷贝数谱,生成概率分数;和
基于所述概率分数,鉴定所述样品是否具有高或低可能性是同源重组(HR)缺陷。
16.一种计算机程序产品,其特征在于,所述计算机程序产品包含存储有计算机程序的永久性存储器,当在计算机上运行时,执行以下步骤:
进行以下两个或多个步骤:
a)确定样品中存在或不存在至少一个碱基置换标签
b)确定样品中存在或不存在至少一个重排标签
c)确定样品中存在或不存在至少一个插入缺失标签;和
d)确定样品的拷贝数谱;
通过上述确定生成概率分数;和
基于所述概率分数,鉴定所述样品是否具有高或低可能性是同源重组(HR)缺陷。
17.根据权利要求16所述的计算机程序产品,其特征在于,进行三个或更多个所述确定步骤。
18.一种具有处理器的计算机,其特征在于,所述处理器被配置为:
确定来自肿瘤的DNA样品中存在或不存在多个碱基置换标签、重排标签和插入缺失标签,并确定样品的拷贝数谱;
通过样品中多个碱基置换标签、重排标签和插入缺失标签的存在或不存在,以及样品的拷贝数谱,生成概率分数;
基于所述概率分数,鉴定所述样品是否具有高或低可能性是同源重组(HR)缺陷。
19.一种具有处理器的计算机,其特征在于,所述处理器被配置为:
进行以下两个或多个步骤:
a)确定样品中存在或不存在至少一个碱基置换标签
b)确定样品中存在或不存在至少一个重排标签
c)确定样品中存在或不存在至少一个插入缺失标签;和
d)确定样品的拷贝数谱;
通过上述确定生成概率分数;和
基于所述概率分数,鉴定所述样品是否具有高或低可能性是同源重组(HR)缺陷。
20.一种预测癌症患者是否可能对PARP抑制剂或铂类药物或蒽环类药物有响应的方法,其特征在于,所述方法包括使用根据权利要求1-14中任一项所述的方法,将来自患者肿瘤的样品表征为具有高或低可能性是同源重组(HR)缺陷,其中如果样品被表征为具有高可能性是HR缺陷,则患者可能对PARP抑制剂或铂类药物或蒽环类药物响应。
21.一种选择用PARP抑制剂或铂类药物或蒽环类药物治疗的癌症患者的方法,其特征在于,所述方法包括:使用根据权利要求1-14中任一项所述的方法,将来自患者肿瘤的样品表征为具有高或低可能性是同源重组(HR)缺陷;和如果样品被表征为具有高可能性是HR缺陷,则选择该患者用PARP抑制剂或铂类药物或蒽环类药物治疗。
22.一种PARP抑制剂或铂类药物或蒽环类药物用于患者癌症的治疗方法,从所述患者中获得DNA样品,通过根据权利要求1-14中任一项所述的方法,所述DNA样品被表征为具有高可能性是HR缺陷。
23.一种治疗患者的癌症的方法,所述患者被确定为患有具有高可能性是HR缺陷的肿瘤,其中,所述肿瘤是HR缺陷的可能性是通过使用根据权利要求1-14中任一项所述的方法表征来自肿瘤的DNA样品来确定的。
24.一种PARP抑制剂或铂类药物或蒽环类药物用于患者癌症的治疗方法,其特征在于,所述方法包括:
(i)使用根据权利要求1-14中任一项所述的方法,确定来自所述患者的DNA样品是否具有高或低可能性是HR缺陷;和
(ii)如果确定所述DNA样品具有高可能性是HR缺陷,则向患者施用PARP抑制剂或铂类药物或蒽环类药物。
25.一种预测癌症患者是否可能对靶向DNA修复途径或引起DNA损伤的药剂有响应的方法,其特征在于,所述方法包括使用权利要求1-14中任一项所述的方法将来自患者肿瘤的样品表征为具有高或低可能性是同源重组(HR)缺陷,其中如果样品被表征为具有高可能性是HR缺陷,则患者可能对靶向DNA修复途径或引起DNA损伤的药剂响应。
26.一种选择用靶向DNA修复途径或引起DNA损伤的药剂治疗的癌症患者的方法,其特征在于,所述方法包括:使用权利要求1-14中任一项所述的方法将来自患者肿瘤的样品表征为具有高或低可能性是同源重组(HR)缺陷;和如果所述样品具有高可能性是HR缺陷,则选择该患者用靶向DNA修复途径或引起DNA损伤的药剂治疗。
27.一种靶向DNA修复途径或引起DNA损伤的药剂用于患者癌症的治疗方法,从所述患者获得DNA样品,并且通过根据权利要求1-14中任一项所述的方法,所述DNA样品被表征为具有高可能性是HR缺陷。
28.一种靶向DNA修复途径或引起DNA损伤的药剂用于患者癌症的治疗方法,其特征在于,所述方法包括:
(i)使用根据权利要求1-14中任一项所述的方法,确定来自所述患者的DNA样品是否具有高或低可能性是HR缺陷;和
(ii)如果确定所述DNA样品具有高可能性是HR缺陷,则向患者施用靶向DNA修复途径或引起DNA损伤的药剂。
CN201780027322.7A 2016-05-01 2017-04-28 表征dna样品的方法 Pending CN109219852A (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
GBGB1607630.9A GB201607630D0 (en) 2016-05-01 2016-05-01 Method of characterising a DNA sample
GB1607630.9 2016-05-01
GBGB1703903.3A GB201703903D0 (en) 2017-03-10 2017-03-10 Method of charaterising a DNA sample
GB1703903.3 2017-03-10
PCT/EP2017/060294 WO2017191074A1 (en) 2016-05-01 2017-04-28 Method of characterising a dna sample

Publications (1)

Publication Number Publication Date
CN109219852A true CN109219852A (zh) 2019-01-15

Family

ID=58671629

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201780027322.7A Pending CN109219852A (zh) 2016-05-01 2017-04-28 表征dna样品的方法

Country Status (7)

Country Link
US (1) US20190139625A1 (zh)
EP (1) EP3452939A1 (zh)
JP (2) JP7224185B2 (zh)
CN (1) CN109219852A (zh)
CA (1) CA3021742A1 (zh)
GB (1) GB2555878B (zh)
WO (1) WO2017191074A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114242170A (zh) * 2021-12-21 2022-03-25 深圳吉因加医学检验实验室 一种同源重组修复缺陷的评估方法、装置和存储介质

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB2555765A (en) 2016-05-01 2018-05-16 Genome Res Ltd Method of detecting a mutational signature in a sample
GB201607629D0 (en) * 2016-05-01 2016-06-15 Genome Res Ltd Mutational signatures in cancer
US12062416B2 (en) 2016-05-01 2024-08-13 Genome Research Limited Method of characterizing a DNA sample
AU2017355732A1 (en) * 2016-11-07 2019-05-09 Grail, Llc Methods of identifying somatic mutational signatures for early cancer detection
WO2020068506A1 (en) * 2018-09-24 2020-04-02 President And Fellows Of Harvard College Systems and methods for classifying tumors
EP4041925A4 (en) * 2019-10-07 2023-11-01 Memorial Sloan Kettering Cancer Center MOLECULAR SIGNATURES OF RADIATION SENSITIVITY IN TUMORS AND METHODS OF USE THEREOF
GB2595718A (en) * 2020-06-04 2021-12-08 Cancer Research Tech Ltd Methods for predicting treatment response in cancers
EP4165215A1 (en) * 2020-06-14 2023-04-19 The Jackson Laboratory Small deletion signatures
EP3945525A1 (en) * 2020-07-27 2022-02-02 Sophia Genetics S.A. Methods for identifying chromosomal spatial instability such as homologous repair deficiency in low coverage next-generation sequencing data
GB202104308D0 (en) 2021-03-26 2021-05-12 Cambridge Entpr Ltd Method of characterising a DNA sample
US20240321396A1 (en) * 2021-06-30 2024-09-26 Memorial Sloan-Kettering Cancer Center Detection of somatic mutational signatures from whole genome sequencing of cell-free dna
EP4141127B1 (en) * 2021-08-30 2024-10-09 Zentrum Familiärer Brust- und Eierstockkrebs Universitätsklinik Köln Method for assessing homologous recombination deficiency in ovarian cancer cells
KR102523938B1 (ko) * 2022-02-04 2023-04-19 가톨릭대학교 산학협력단 상동 재조합 결핍증 예측 모델의 모델링 방법
GB202203375D0 (en) 2022-03-10 2022-04-27 Cambridge Entpr Ltd Method of characterising a dna sample

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104160037A (zh) * 2011-12-21 2014-11-19 美瑞德生物工程公司 用于评估杂合性丢失的方法与材料

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002006481A (ja) 2000-06-23 2002-01-09 Toda Kogyo Corp 有機超強酸発生剤
US20120035244A1 (en) * 2010-07-29 2012-02-09 The Regents Of The University Of Michigan Parp1 targeted therapy
NZ630278A (en) * 2012-06-07 2017-02-24 Inst Curie Methods for detecting inactivation of the homologous recombination pathway (brca1/2) in human tumors
ES2777228T3 (es) * 2013-04-05 2020-08-04 Myriad Genetics Inc Métodos para evaluar la deficiencia de recombinación homóloga y predecir la respuesta al tratamiento del cáncer
EP3080292B1 (en) * 2013-12-09 2022-02-02 Institut Curie Methods for detecting inactivation of the homologous recombination pathway (brca1/2) in human tumors
EP3686288B1 (en) * 2014-08-15 2023-03-08 Myriad Genetics, Inc. Methods and materials for assessing homologous recombination deficiency
GB2555765A (en) * 2016-05-01 2018-05-16 Genome Res Ltd Method of detecting a mutational signature in a sample

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104160037A (zh) * 2011-12-21 2014-11-19 美瑞德生物工程公司 用于评估杂合性丢失的方法与材料

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
LUDMIL B ALEXANDROV 等: "Deciphering signatures of mutational processes operative in human cancer", 《CELL REP》 *
V ABKEVICH 等: "Patterns of genomic loss of heterozygosity predict homologous recombination repair defects in epithelial ovarian cancer", 《BR J CANCER》 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114242170A (zh) * 2021-12-21 2022-03-25 深圳吉因加医学检验实验室 一种同源重组修复缺陷的评估方法、装置和存储介质
CN114242170B (zh) * 2021-12-21 2023-05-09 深圳吉因加医学检验实验室 一种同源重组修复缺陷的评估方法、装置和存储介质

Also Published As

Publication number Publication date
GB201706944D0 (en) 2017-06-14
GB2555878A (en) 2018-05-16
JP2023027045A (ja) 2023-03-01
EP3452939A1 (en) 2019-03-13
US20190139625A1 (en) 2019-05-09
CA3021742A1 (en) 2017-11-09
WO2017191074A1 (en) 2017-11-09
JP7224185B2 (ja) 2023-02-17
JP2019521412A (ja) 2019-07-25
GB2555878B (en) 2018-12-05

Similar Documents

Publication Publication Date Title
CN109219852A (zh) 表征dna样品的方法
Zhu et al. Immune gene expression profiling reveals heterogeneity in luminal breast tumors
Hayward et al. Whole-genome landscapes of major melanoma subtypes
Glodzik et al. A somatic-mutational process recurrently duplicates germline susceptibility loci and tissue-specific super-enhancers in breast cancers
Chen et al. Targeted gene expression profiling predicts meningioma outcomes and radiotherapy responses
JP6704861B2 (ja) 癌処置のための個別化三剤治療を選択するための方法
Ansari-Pour et al. Whole-genome analysis of Nigerian patients with breast cancer reveals ethnic-driven somatic evolution and distinct genomic subtypes
Zhang et al. Immune microenvironments differ in immune characteristics and outcome of glioblastoma multiforme
Sun et al. Genomic instability-associated lncRNA signature predicts prognosis and distinct immune landscape in gastric cancer
Bendall et al. Specific human endogenous retroviruses predict metastatic potential in uveal melanoma
Liu et al. Pathogenic germline variants in patients with endometrial cancer of diverse ancestry
Zhou et al. Identification of telomere-associated gene signatures to predict prognosis and drug sensitivity in glioma
Zhang et al. m6A regulatory gene-mediated methylation modification in glioma survival prediction
Xu et al. An effective seven-CpG-based signature to predict survival in renal clear cell carcinoma by integrating DNA methylation and gene expression
Zhang et al. Germline genetic variation in JAK2 as a prognostic marker in castration‐resistant prostate cancer
Bao et al. Identifying potential neoantigens for cervical cancer immunotherapy using comprehensive genomic variation profiling of cervical intraepithelial neoplasia and cervical cancer
Jiang et al. Identifying the clonal origin of synchronous multifocal tumors in the hepatobiliary and pancreatic system using multi-omic platforms
Zhang et al. Chronic obstructive pulmonary disease alters the genetic landscape and tumor immune microenvironment in lung cancer patients
Cho et al. Risk stratification of childhood medulloblastoma using integrated diagnosis: discrepancies with clinical risk stratification
Mei et al. Computer classification and construction of a novel prognostic signature based on moonlighting genes in prostate cancer
Pei et al. Classification of multiple primary lung cancer in patients with multifocal lung cancer: assessment of a machine learning approach using multidimensional genomic data
Founta et al. Genetic ancestry-specific meQTLs control immune function regulation in a breast cancer cohort of African and European patients
Bowlby et al. The Cancer Genome Atlas Comprehensive Molecular Characterization of Renal Cell Carcinoma
Chen Choudhur,., oungblood, MW, Polle, M
Jeffris A machine learning approach for detecting homologous recombination deficiency in breast cancer using transcriptome data

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20190115

WD01 Invention patent application deemed withdrawn after publication