[go: up one dir, main page]

CN107779505B - 结肠直肠癌的粪便细菌标志物 - Google Patents

结肠直肠癌的粪便细菌标志物 Download PDF

Info

Publication number
CN107779505B
CN107779505B CN201710261558.9A CN201710261558A CN107779505B CN 107779505 B CN107779505 B CN 107779505B CN 201710261558 A CN201710261558 A CN 201710261558A CN 107779505 B CN107779505 B CN 107779505B
Authority
CN
China
Prior art keywords
dna
seq
rna
kit
crc
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201710261558.9A
Other languages
English (en)
Other versions
CN107779505A (zh
Inventor
于君
沈祖尧
梁巧仪
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chinese University of Hong Kong CUHK
Original Assignee
Chinese University of Hong Kong CUHK
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Chinese University of Hong Kong CUHK filed Critical Chinese University of Hong Kong CUHK
Priority to TW106128299A priority Critical patent/TWI769173B/zh
Priority to US16/327,560 priority patent/US11603567B2/en
Priority to EP17842925.4A priority patent/EP3504346B1/en
Priority to PCT/CN2017/098592 priority patent/WO2018036503A1/en
Publication of CN107779505A publication Critical patent/CN107779505A/zh
Application granted granted Critical
Publication of CN107779505B publication Critical patent/CN107779505B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6883Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material
    • C12Q1/6886Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for diseases caused by alterations of genetic material for cancer
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K45/00Medicinal preparations containing active ingredients not provided for in groups A61K31/00 - A61K41/00
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P35/00Antineoplastic agents
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/02Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving viable microorganisms
    • C12Q1/04Determining presence or kind of microorganism; Use of selective media for testing antibiotics or bacteriocides; Compositions containing a chemical indicator therefor
    • C12Q1/10Enterobacteria
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6813Hybridisation assays
    • C12Q1/6827Hybridisation assays for detection of mutation or polymorphism
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6888Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms
    • C12Q1/689Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms for bacteria
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/53Immunoassay; Biospecific binding assay; Materials therefor
    • G01N33/569Immunoassay; Biospecific binding assay; Materials therefor for microorganisms, e.g. protozoa, bacteria, viruses
    • G01N33/56911Bacteria
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/53Immunoassay; Biospecific binding assay; Materials therefor
    • G01N33/569Immunoassay; Biospecific binding assay; Materials therefor for microorganisms, e.g. protozoa, bacteria, viruses
    • G01N33/56911Bacteria
    • G01N33/56916Enterobacteria, e.g. shigella, salmonella, klebsiella, serratia
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/53Immunoassay; Biospecific binding assay; Materials therefor
    • G01N33/574Immunoassay; Biospecific binding assay; Materials therefor for cancer
    • G01N33/57407Specifically defined cancers
    • G01N33/57419Specifically defined cancers of colon
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N33/00Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
    • G01N33/48Biological material, e.g. blood, urine; Haemocytometers
    • G01N33/50Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
    • G01N33/53Immunoassay; Biospecific binding assay; Materials therefor
    • G01N33/574Immunoassay; Biospecific binding assay; Materials therefor for cancer
    • G01N33/57484Immunoassay; Biospecific binding assay; Materials therefor for cancer involving compounds serving as markers for tumor, cancer, neoplasia, e.g. cellular determinants, receptors, heat shock/stress proteins, A-protein, oligosaccharides, metabolites
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/112Disease subtyping, staging or classification
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/118Prognosis of disease development
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/156Polymorphic or mutational markers
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/158Expression markers
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2333/00Assays involving biological materials from specific organisms or of a specific nature
    • G01N2333/195Assays involving biological materials from specific organisms or of a specific nature from bacteria
    • G01N2333/33Assays involving biological materials from specific organisms or of a specific nature from bacteria from Clostridium (G)
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2800/00Detection or diagnosis of diseases
    • G01N2800/50Determining the risk of developing a disease

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Immunology (AREA)
  • Organic Chemistry (AREA)
  • Analytical Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Physics & Mathematics (AREA)
  • Microbiology (AREA)
  • Biotechnology (AREA)
  • Biochemistry (AREA)
  • Biomedical Technology (AREA)
  • Urology & Nephrology (AREA)
  • Hematology (AREA)
  • Pathology (AREA)
  • Genetics & Genomics (AREA)
  • Medicinal Chemistry (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biophysics (AREA)
  • Cell Biology (AREA)
  • General Physics & Mathematics (AREA)
  • Food Science & Technology (AREA)
  • Oncology (AREA)
  • Hospice & Palliative Care (AREA)
  • Virology (AREA)
  • Tropical Medicine & Parasitology (AREA)
  • Animal Behavior & Ethology (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Public Health (AREA)
  • Veterinary Medicine (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • General Chemical & Material Sciences (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Epidemiology (AREA)

Abstract

本发明提供了通过检测某些细菌物种的富集或减少来诊断受试者的结肠直肠癌的非侵入性方法。还提供了用于此类方法的试剂盒和装置。此外,本发明提供了通过调节人类结肠中相关的细菌物种来降低结肠癌风险的方法。

Description

结肠直肠癌的粪便细菌标志物
相关申请的交叉引用
本申请要求于2016年8月25日提交的美国临时专利申请第62/379,635号的优先权,将其整体并入本文。
背景技术
结肠直肠癌是全世界第三大常见癌症,约占每年诊断的所有癌症病例的10%。这是一种对人类健康有严重影响的致命疾病。例如,在2012年期间,全球诊断出140万例结肠直肠癌的新病例,并记录了近70万例死亡。在发达国家,结肠直肠癌的发病率明显更高,发现了超过65%的病例。男人比女人更容易患这种疾病。
诊断结肠直肠癌可能是具有挑战性的。虽然家族史可能为诊断提供有用的暗示,但绝大多数的疾病(大于75-95%)发生在很少或没有遗传风险的人群中。结肠直肠癌的症状也可能显著变化,这取决于癌症在结肠中的位置,以及其是否已经扩散到身体的其它地方。根据结肠直肠癌是多早被诊断的,其预后可以从非常好到非常严重:当癌症团块保持被限制在结肠壁内时,其可用手术使其高度可治愈;另一方面,一旦结肠直肠癌已经扩散,其通常不可治愈,此时医学干预将集中于提高生活质量和缓解症状。平均而言,美国的5年生存率为约65%。
鉴于结肠直肠癌的高流行性,以及早期诊断对患者预期寿命的至关重要性,迫切需要新的用于早期诊断结肠直肠癌的更有效的方法,尤其是以非侵入性的方式。先前已知,肠道微生物组成的变化与结肠直肠癌(CRC)相关,但因果关系尚未确立。例如,核梭杆菌(Fusobacterium nucleatum)被认为通过募集浸润性免疫细胞并经由激活β-连环蛋白信号传导来增强肠肿瘤发生。因此,用粪便微生物来进行早期非侵入性诊断CRC是有前途的。然而,仍然缺乏一种从粪便样品中诊断CRC的简单且实惠的方法。本发明满足了这点及其它相关的需要。
发明概述
本发明人已鉴定了与人结肠直肠癌(CRC)显著相关的数种细菌物种,因此其可以用作诊断标志物,通过对患者粪便样品进行非侵入性分析来早期检测CRC。更具体地,本发明人展示,与正常个体相比,某些细菌物种如哈撒韦梭菌(Clostridium hathewayi)在CRC患者的粪便样品中显著富集,而其它细菌物种如克拉鲁斯拟杆菌(Bacteroides clarus)和肠道罗斯氏菌(Roseburia intestinalis)在CRC患者的粪便中显著降低。这些细菌物种的这种增加或减少导致对于这些物种为独特的标签DNA、RNA和蛋白质种类的更高水平或更低水平,其又可用于定性和定量地检测样品中异常富集/抑制的细菌群体,从而提供与人类受试者中CRC存在或具有升高的风险相关的关键信息,这包括已被诊断患有该疾病的患者进行初始治疗(例如,外科手术、化疗和/或放疗)后,CRC复发的风险增加。相反,可以预防性地特异性抑制或激活这些细菌物种,以降低个体在未来时间发展CRC的风险。
因此,在第一方面,本发明提供了一种用于评估受试者中结肠癌风险的方法,即用于评估受试者中存在结肠癌的可能性,和/或受试者在后续时间内发展该疾病的可能性,和/或患者患有复发性结肠癌的可能性(例如,首次诊断出该疾病时进行初始治疗后)的方法。该方法通常依赖于当与健康受试者粪便中预期的对照值比较时,检测到相关细菌物种(例如,参见补充表2)、属或门的群体的增加或降低,或检测到患者粪便样品中指示相关细菌物种、属或门的某些细菌基因标志物的水平的增加或降低。
例如,所要求保护的方法包括以下步骤:(a)定量确定取自受试者的粪便样品的克拉鲁斯拟杆菌、肠道罗斯氏菌和哈撒韦梭菌中至少一种细菌物种的水平;(b)将步骤(a)中获得的水平与标准对照进行比较;(c)将步骤(a)中获得的水平确定为相对于标准对照增加或降低;和(d)将受试者确定为具有增加的结肠癌风险。
在一些实施方案中,确定克拉鲁斯拟杆菌、肠道罗斯氏菌和哈撒韦梭菌中每一种的水平。
在一些实施方案中,步骤(a)包括确定对于克拉鲁斯拟杆菌、肠道罗斯氏菌和哈撒韦梭菌中至少一种为特有的DNA、RNA或蛋白质的水平。在一些实施方案中,步骤(a)包括确定对于克拉鲁斯拟杆菌、肠道罗斯氏菌和哈撒韦梭菌中至少一种为特有的DNA的水平。在一些实施方案中,步骤包括确定对于克拉鲁斯拟杆菌和哈撒韦梭菌中每一种为特有的DNA的水平,任选地还包括确定对于核梭杆菌为特有的DNA的水平。例如,步骤(a)包括确定基因标志物m1704941(Fn)(SEQ ID NO:5)、m2736705(Ch)(SEQ ID NO:6)、m3246804(m7)(SEQ IDNO:7)和m370640(Bc)(SEQ ID NO:2)的水平,任选地还包括确定基因标志物m181682(Ri)(SEQ ID NO:1)的水平。
在一些实施方案中,在步骤(c)中将m1704941(Fn)、m2736705(Ch)和m3246804(m7)确定为增加,并在步骤(c)中将m370640(Bc)和m181682(Ri)确定为降低。在一些实施方案中,步骤(a)包括多核苷酸扩增反应,例如聚合酶链式反应(PCR),尤其是定量PCR(qPCR)。
在一些实施方案中,当受试者被确定为具有增加的结肠癌风险时,使用来自受试者的后续时间的另一粪便样品在后续时间重复步骤(a)。与来自最初的步骤(a)的水平相比,检测到重复的步骤(a)中获得的水平增加表明结肠癌风险升高;相反,降低表明结肠癌风险下降。
在一些实施方案中,当受试者被确定为具有增加的结肠癌风险时,进行进一步的步骤:向受试者施用有效量的显示为富集的细菌物种中至少一种(例如哈撒韦梭菌)的抑制剂,和/或显示为存在降低的一种或多种细菌物种(例如克拉鲁斯拟杆菌和肠道罗斯氏菌)的激活剂。
在一些情况下,核梭杆菌的替代性标志物(nusG基因)可用于定量测量样品中细菌的存在。该标志物的示例性引物/探针序列被提供在“用于本研究的引物和探针的列表”(Fn-靶标2)和补充表3中。
在第二方面,本发明提供了用于检测受试者中的结肠癌的试剂盒。所述试剂盒包括这些组分:(1)标准对照,其提供粪便样品的克拉鲁斯拟杆菌、肠道罗斯氏菌和哈撒韦梭菌中至少一种的平均量;和(2)试剂,其特异性且定量地鉴定对于克拉鲁斯拟杆菌、肠道罗斯氏菌和哈撒韦梭菌中至少一种为特有的DNA、RNA或蛋白质。
在一些实施方案中,所述试剂是特异性结合DNA或RNA的多核苷酸探针,或者所述试剂是特异性结合蛋白质的抗体。在一些实施方案中,所述试剂是特异性结合克拉鲁斯拟杆菌和哈撒韦梭菌中每一种特有的DNA的多核苷酸探针,任选地,所述试剂还包括特异性结合核梭杆菌特有的DNA的多核苷酸探针。在一些实施方案中,所述试剂特异性且定量地鉴定基因标志物m1704941(Fn)、m2736705(Ch)、m3246804(m7)和m370640(Bc),任选地所述试剂特异性且定量地鉴定基因标志物m181682(Ri)。所述试剂任选地可以包含可检测的部分。在一些实施方案中,所述试剂盒还包含两个一组的寡核苷酸引物,其用于在扩增反应中从RNA或其互补物特异性扩增DNA或逆转录DNA的至少一段或全长。示例性的寡核苷酸引物组,示于补充表3以及“用于本研究的引物和探针的列表”中。在一些实施方案中,试剂盒还包括操作手册。
本发明还提供了下述物质在制备检测受试者的结肠癌的试剂盒中的用途:(1)标准对照,其提供粪便样品的克拉鲁斯拟杆菌、肠道罗斯氏菌和哈撒韦梭菌中至少一种的平均量;和(2)试剂,其特异性且定量地鉴定对于克拉鲁斯拟杆菌、肠道罗斯氏菌和哈撒韦梭菌中至少一种为特有的DNA、RNA或蛋白质。在一些实施方案中,所述试剂是特异性结合所述DNA或RNA的多核苷酸探针,或所述试剂是特异性结合所述蛋白质的抗体。
在第三方面,本发明提供了用于在后续时间在受试者中预防性地治疗结肠癌或降低发展为结肠癌的风险的方法。该方法包括向受试者施用有效量相关的细菌物种(例如,克拉鲁斯拟杆菌、肠道罗斯氏菌和哈撒韦梭菌)中至少一种的抑制剂或激活剂/增强剂的步骤,使得在CRC患者粪便中发现富集的细菌物种将被阻抑或被抑制,而在CRC患者粪便中发现降低的细菌物种将被激活或促进。在一些实施方案中,抑制剂用于哈撒韦梭菌,而激活剂/增强剂用于克拉鲁斯拟杆菌和肠道罗斯氏菌中至少一种。在一些实施方案中,抑制剂是编码反义RNA、miRNA或siRNA的核酸,例如编码针对基因标志物m1696299和m2736705中至少一种的反义RNA、miRNA或siRNA的核酸。nusG基因作为核梭杆菌的替代性标志物,可用于实施本文所述的本发明的各个方面。
在第四方面,本发明提供了检测粪便样品中的克拉鲁斯拟杆菌(Bacteroidesclarus)、肠道罗斯氏菌(Roseburia intestinalis)和哈撒韦梭菌(Clostridiumhathewayi)中至少一种的水平增加或降低的方法,其包括以下步骤:(a)定量确定粪便样品中的克拉鲁斯拟杆菌、肠道罗斯氏菌和哈撒韦梭菌中至少一种的水平;(b)将步骤(a)中获得的水平与标准对照进行比较;(c)将在步骤(a)中获得的水平确定为相对于标准对照增加或降低。在一些实施方案中,粪便样品获得自受试者,优选获得自人类受试者。在一些实施方案中,步骤(a)包括确定对于克拉鲁斯拟杆菌、肠道罗斯氏菌和哈撒韦梭菌中至少一种为特有的DNA、RNA或蛋白质的水平。在一些实施方案中,步骤(a)包括确定对于克拉鲁斯拟杆菌、肠道罗斯氏菌和哈撒韦梭菌中至少一种为特有的DNA的水平。在一些实施方案中,步骤(a)包括确定对于克拉鲁斯拟杆菌和哈撒韦梭菌中每一种为特有的DNA的水平,任选地还包括确定对于核梭杆菌为特有的DNA的水平。在一些实施方案中,步骤(a)包括确定基因标志物m1704941(Fn)、m2736705(Ch)、m3246804(m7)和m370640(Bc)的水平,任选地还包括确定基因标志物m181682(Ri)的水平。在一些实施方案中,步骤(a)包括多核苷酸扩增反应。在一些实施方案中,多核苷酸扩增反应是聚合酶链式反应(PCR),优选定量PCR。
在相关方面,本发明提供了相关细菌物种的调节剂(即,抑制剂或激活剂)在制造用于预防性治疗如上所述的结肠癌的药物中的用途。
附图说明
图1:qPCR分析的评估。(a)16S rDNA对照的模板量和Cq值之间的相关性。由10个随机选择的粪便样品的混合物连续稀释的样品#1-10的qPCR评估的代表性实例。当最终DNA浓度<10ng/μL(#4→#10)时,qPCR结果与模板量良好相关,而>10ng/μL的DNA抑制PCR扩增(#1→#3)。(b)内部对照的Cq值与DNA量(n=29)之间的相关性。(c)新的双重qPCR分析可以使用来自粪便样品的合适的DNA模板浓度稳定地评估相对靶标丰度。一个实例示出了在一个随机选择的具有若干最终DNA浓度<10ng/μL的粪便样品中,稳定地评估核梭杆菌(Fn)的丰度。(d)在已知具有低和非常低的Fn丰度且最终DNA浓度<10ng/μL的样品中,稳定地评估Fn丰度,但极低DNA浓度可能导致在低Fn丰度的样品中的假阴性检测。
图2:通过宏基因组学方法和qPCR分析,各个标志物的定量中的良好相关性。(a)通过宏基因组学方法(基因水平,具有所示的基因ID)和qPCR分析,肠道罗斯氏菌(Ri)、克拉鲁斯拟杆菌(Bc)、哈撒韦梭菌(Ch)和一种未定义的物种(标记为m7)的定量的相关性。示出了来自宏基因组学研究的相应的基因标志物数量。(b)通过宏基因组学方法(物种水平)和qPCR分析,核梭杆菌(Fn)的定量的相关性。
图3:在CRC患者的诊断中定量检测粪便细菌标志物。(a)在第一群组的健康对照受试者(n=200)和CRC患者(n=170)之间,粪便样品中核梭杆菌(Fn)、克拉鲁斯拟杆菌(Bc)、肠道罗斯氏菌(Ri)、哈撒韦梭菌(Ch)和一个未定义的物种(标记为m7)的丰度不同。(b)区分群组-I中CRC患者与健康对照受试者的标志物Fn、Ch、m7、Bc和Ri的接受者操作特征(ROC)曲线。(c)来自独立群组-II的33个CRC患者和36个健康受试者的粪便样品中的Fn丰度,以及在该群组中区分CRC患者与健康对照受试者的Fn的相应ROC曲线。具有四分位范围的中位数,通过Tukey法示于箱须图(box and whisker plots)中。
图4:四种标志物的组合示出了针对CRC的改善的诊断能力。(a)在第一群组中,四种选择的细菌标志物候选者(包括核梭杆菌(Fn)、克拉鲁斯拟杆菌(Bc)、哈撒韦梭菌(Ch)和一种未定义的物种(标记为m7))的简单线性组合、三种选择的细菌(Fn、m7和Bc)、单独Fn和逻辑回归模型的概率图值的ROC曲线。(b)与第一群组的健康对照受试者相比,CRC患者中的Fn和四细菌(Fn、Bc、Ch和m7)的粪便丰度。(c)在独立第二群组中,四细菌(Fn、Bc、Ch和m7)、三细菌(Fn、m7和Bc)、单独Fn和逻辑回归模型的概率图值的ROC曲线。(d)在群组-II的CRC患者和健康对照受试者中,Fn和四细菌的粪便丰度。具有四分位范围的中位数通过Tukey法示于箱须图中。
图5:商业粪便免疫化学测试(FIT)的灵敏度和根据肿瘤-淋巴结-转移(TNM)期亚群的细菌标志物。示出了FIT、四细菌(4-细菌)及其组合根据肿瘤期的结肠直肠癌的检测灵敏度。括号中的数字是各个类别中参与者的数量。
图6:使用发明人的便利的平台,通过两个实验者实现了nusG/核梭杆菌定量的良好一致性。
图7:污染的人类DNA对新的qPCR平台几乎没有影响。(a)对添加有不同浓度人类DNA的10个随机选择的粪便样品的混合物的内部对照进行qPCR评估的代表性实例。(b)对添加有不同浓度人类DNA的随机选择的粪便样品的内部对照和核梭杆菌进行双重qPCR评估的代表性实例。
序列说明
SEQ ID NO:1为基因标志物m181682(Ri)的核苷酸序列。
SEQ ID NO:2为基因标志物m370640(Bc)的核苷酸序列。
SEQ ID NO:3为m482585的核苷酸序列。
SEQ ID NO:4为m1696299的核苷酸序列。
SEQ ID NO:5为基因标志物m1704941(Fn)的核苷酸序列。
SEQ ID NO:6为基因标志物m2736705(Ch)的核苷酸序列。
SEQ ID NO:7为基因标志物m3246804(m7)的核苷酸序列。
SEQ ID NO:8为m2040133的核苷酸序列。
SEQ ID NO:9为m1559769的核苷酸序列。
SEQ ID NO:10为m1804565的核苷酸序列。
SEQ ID NO:11为m2206475的核苷酸序列。
SEQ ID NO:12为m3319526的核苷酸序列。
SEQ ID NO:13为m3611706的核苷酸序列。
SEQ ID NO:14为m3976414的核苷酸序列。
SEQ ID NO:15为m4171064的核苷酸序列。
SEQ ID NO:16为m4256106的核苷酸序列。
SEQ ID NO:17为m2211919的核苷酸序列。
SEQ ID NO:18为m2361423的核苷酸序列。
SEQ ID NO:19为m3173495的核苷酸序列。
SEQ ID NO:20为m3531210的核苷酸序列。
定义
在本公开中,术语“结肠直肠癌(CRC)”和“结肠癌”具有相同的含义,并且是指大肠(结肠)、人消化系统的较下部分的癌症,尽管直肠癌通常更特别地是指结肠、直肠的最后数英寸的癌症。“结肠直肠癌细胞”是具有结肠癌特征的结肠上皮细胞,且包括癌前细胞,癌前细胞处于转化为癌细胞的早期或倾向于转化为癌细胞。此类细胞可以表现出癌性细胞的一种或多种表型性状特征。
在本公开中,术语“或”通常以包括“和/或”的含义使用,除非另有明确规定。
如本文所用,术语“基因表达”用于指DNA转录以形成编码特定蛋白质的RNA分子,或由多核苷酸序列编码的蛋白质的翻译。换言之,本公开中的术语“基因表达水平”涵盖了由目标基因编码的mRNA水平和蛋白质水平。
在本公开中,术语“分离的”核酸分子是指与通常和所述分离的核酸分子结合的其它核酸分子相分离的核酸分子。因此,“分离的”核酸分子包括但不限于,不含有天然侧接于生物体基因组(分离的核酸的来源)中的核酸一端或两端的核苷酸序列的核酸分子(例如,通过PCR或限制性内切核酸酶消化产生的cDNA或基因组DNA片段)。这种分离的核酸分子通常被引入到载体(例如,克隆载体或表达载体)中,以便于操作或产生融合核酸分子。此外,分离的核酸分子可以包括工程化的核酸分子,例如重组或合成的核酸分子。存在于例如,核酸文库(例如cDNA或基因组文库)或包含限制性消化的基因组DNA的凝胶(例如琼脂糖或聚丙烯酰胺)内的数百至数百万个其它核酸分子中的核酸分子不是“分离的”核酸。
术语“核酸”或“多核苷酸”是指单链或双链形式的脱氧核糖核酸(DNA)或核糖核酸(RNA)及其聚合物。除非特别限定,该术语涵盖包括与参考核酸具有相似结合特性且以与天然存在的核苷酸类似的方式代谢的天然核苷酸的已知类似物的核酸。除非另有说明,特定核酸序列也隐含地涵盖了其保守地修饰的变体(例如简并密码子取代)、等位基因、直系同源物、单核苷酸多态性(SNP)和互补序列以及明确指出的序列。具体地,简并密码子取代可以通过产生其中一个或多个所选(或所有)密码子的第三位置被混合碱基和/或脱氧肌苷残基取代的序列来实现(Batzer等人,Nucleic Acid Res.19:5081(1991);Ohtsuka等人,J.Biol.Chem.260:2605-2608(1985);以及Rossolini等人,Mol.Cell.Probes 8:91-98(1994))。术语核酸可与基因、cDNA以及由基因编码的mRNA互换使用。
术语“基因”是指参与产生多肽链的DNA区段;它包括涉及基因产物的转录/翻译以及转录/翻译的调节的编码区之前和之后的区域(前导和尾部),以及各个编码区段(外显子)之间的间插序列(内含子)。
在本申请中,术语“多肽”、“肽”和“蛋白质”在本文中可互换使用,是指氨基酸残基的聚合物。该术语适用于其中一个或多个氨基酸残基是相应天然存在的氨基酸的人工化学模拟物的氨基酸聚合物,以及天然存在的氨基酸聚合物和非天然存在的氨基酸聚合物。如本文所用,该术语涵盖任何长度的氨基酸链,包括全长蛋白质(即抗原),其中氨基酸残基通过共价肽键相连接。
术语“氨基酸”是指天然存在的氨基酸和合成的氨基酸,以及与天然存在的氨基酸类似的方式起作用的氨基酸类似物和氨基酸模拟物。天然存在的氨基酸是那些由遗传密码子编码的氨基酸,以及那些随后被修饰的氨基酸,例如羟脯氨酸、γ-羧基谷氨酸和O-磷酸丝氨酸。基于本申请的目的,氨基酸类似物是指具有与天然存在的氨基酸相同的基本化学结构的化合物,即与氢、羧基、氨基和R基团相结合的碳,例如高丝氨酸、正亮氨酸、甲硫氨酸亚砜、甲硫氨酸甲基锍。此类类似物具有修饰的R基团(例如正亮氨酸)或修饰的肽主链,但保留与天然存在的氨基酸相同的基本化学结构。基于本申请的目的,氨基酸模拟物是指具有与氨基酸的通常化学结构不同的结构,但以与天然存在的氨基酸类似的方式起作用的化合物。
氨基酸可以包括具有非天然存在的D-手性的那些氨基酸,如WO 01/12654中所公开,其可以改善包含一个或多个此类D-氨基酸的多肽的稳定性(例如半衰期)、生物利用度和其它特征。在一些情况下,治疗性多肽的一个或多个以及可能全部氨基酸具有D-手性。
氨基酸在本文中可以通过通常已知的三字母符号,或通过IUPAC-IUB生物化学命名委员会推荐的单字母符号来表示。同样,核苷酸可以通过它们通常被接受的单字母代码来表示。
如本文所用,在描述两个或更多个多核苷酸或氨基酸序列时,术语“相同”或“同一性”百分比是指当使用如下序列比较算法之一或通过手动比对和目视检查测量来比较和比对整个比较窗口或指定的区域的最大对应性时,两个或更多个序列或子序列是相同的,或者其指定百分比的氨基酸残基或核苷酸与参考序列具有至少80%的序列同一性,优选85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%的序列同一性。然后,将此类序列称为“基本上相同”。关于多核苷酸序列,该定义也指测试序列的互补序列。优选地,同一性存在于长度至少约50个氨基酸或核苷酸的区域,或更优选地,同一性存在于长度为75-100个氨基酸或核苷酸的区域。
对于序列比较,通常将一个序列作为参考序列,并将测试序列与之进行比较。当使用序列比较算法时,将测试序列和参考序列输入计算机(如果需要,则指定子序列坐标),并指定序列算法程序参数。可以使用默认的程序参数,或者可以指定替代性参数。然后,序列比较算法基于所述程序参数计算出测试序列相对于参考序列的序列同一性百分比。对于核酸和蛋白质的序列比较,使用BLAST和BLAST2.0算法和如下所述的默认参数。
如本文所用,“比较窗口”包括具有选自20至600、通常约50至约200、更通常约100至约150个连续位置数中任一连续位置数的区段,其中在某一序列与具有相同连续位置数的参照序列进行最优比对后,可以将这两条序列进行比较。用于比较的序列比对方法是本领域熟知的。可以通过下述来进行用于比较的序列最优比对:例如Smith&Waterman,Adv.Appl.Math.2:482(1981)的局部同源性算法、Needleman&Wunsch,J.Mol.Biol.48:443(1970)的同源性比对算法、Pearson&Lipman,Proc.Nat’l.Acad.Sci.USA 85:2444(1988)的相似性检索方法、这些算法的计算机实施(威斯康辛遗传学软件包(Wisconsin GeneticsSoftware Package)中的GAP、BESTFIT、FASTA和TFASTA,遗传学计算机集团(GeneticsComputer Group),575Science Dr.,Madison,WI)、或者手动比对和目视检查(参见,例如Current Protocols in Molecular Biology(Ausubel等人编,1995增刊))。
适于确定序列同一性百分比和序列相似性的算法实例是BLAST和BLAST 2.0算法,这两种算法分别在Altschul等人(1990)J.Mol.Biol.215:403-410和Altschul等人(1977)Nucleic Acids Res.25:3389-3402中描述。通过美国国家生物技术信息中心(theNational Center for Biotechnology Information)网站ncbi.nlm.nih.gov,可公开获得用于运行BLAST分析的软件。该算法首先涉及通过鉴定查询序列中长度为W的短词来鉴定高评分序列对(HSP),当查询序列中长度为W的短词与数据库序列中相同长度的词比对时,其能匹配或符合某正值的阈值则评分为T。T被称为相邻词评分阈值(Altschul等人,同上)。这些初始的相邻词命中作为启动检索的基础,用于发现含有它们的更长HSP。然后,在可以增加累加比对评分的前提下,将词命中在两个方向沿每一序列延伸。对于核苷酸序列,可以利用参数M(匹配残基对的奖励评分;一直大于0)以及N(错配残基的惩罚评分;一直小于0)来计算累加评分。对于氨基酸序列,使用评分矩阵来计算累加评分。当出现以下情况时,停止每一方向的词命中延伸:累加比对评分从其最大实现值下降X量时;由于一个或多个负评分残基比对的累积,而使累加评分达到零或零以下时;或者到达任一序列的末端时。BLAST算法参数W、T和X,决定了比对的灵敏度和速度。BLASTN程序(对于核苷酸序列)使用词长(W)为28、期望值(E)为10、M=1、N=-2和双链比较作为默认参数。对于氨基酸序列,BLASTP程序使用词长(W)为3、期望值(E)为10和BLOSUM62评分矩阵作为默认参数(参见,Henikoff和Henikoff,Proc.Natl.Acad.Sci.USA 89:10915(1989))。
BLAST算法还执行两条序列间的相似性统计分析(参见,例如Karlin和Altschul,Proc.Nat’l.Acad.Sci.USA 90:5873-5787(1993))。BLAST算法提供的相似性的一项测定是最小求和概率(sum probability)(P(N)),其提供了两条核苷酸或氨基酸序列间偶然发生匹配的概率指示。例如,如果在测试核酸与参照核酸比较中,最小求和概率小于约0.2,更优选小于约0.01,以及最优选小于约0.001时,则认为测试核酸与参照序列是相似的。
如下文所述,两条核酸序列或多肽基本相同的指示是,由第一核酸编码的多肽与针对由第二核酸所编码的多肽所产生的抗体发生免疫交叉反应。因此,例如,如果一条多肽与另一多肽的差异仅在于保守型取代,那么两条肽通常是基本相同的。如下文所述,两条核酸序列基本相同的另一指示是,两个分子或其互补物能在严紧条件下彼此杂交。两条核酸序列基本相同的另一指示是,可以使用相同的引物来扩增所述序列。
在本文中,术语“严紧的杂交条件”和“高严紧性”是指探针与其靶标子序列(通常处于复杂的核酸混合物中)杂交而不与其它序列杂交的条件。严紧的条件是序列依赖性的,并且在不同情况下会不同。较长的序列在较高的温度下特异性地杂交。核酸杂交的广泛指导见于,Tssen,Techniques in Biochemistry and Molecular Biology—Hybridizationwith Nucleic Probes(生物化学和分子生物学技术—核酸探针的杂交),"Overview ofprinciples of hybridization and the strategy of nucleic acid assays(杂交原理和核酸测定策略的概述)"(1993),并且容易被本领域技术人员所理解。通常,将严紧的条件被选择为比在限定的离子强度、pH下具体序列的热熔点(Tm)低约5-10℃。Tm是平衡时50%的与靶标互补的探针与靶序列杂交的温度(在限定的离子强度、pH和核酸浓度下)(因为靶序列是过量存在的,所以在Tm下,在平衡时,50%的探针被占据)。添加去稳定剂如甲酰胺也可以实现严紧的条件。对于选择性杂交或特异性杂交,阳性信号至少是背景的2倍,优选为10倍于背景的杂交。示例性的严紧杂交条件可以如下:50%甲酰胺,5×SSC和1%SDS于42℃下孵育,或5×SSC和1%SDS于65℃下孵育,在0.2×SSC和0.1%SDS中65℃下洗涤。
对于在严紧的条件下不彼此杂交的核酸,如果它们编码的多肽是基本上相同的,则该核酸仍然是基本上相同的。例如,当使用遗传密码所允许的最大密码子简并性产生核酸拷贝时,会发生这种情况。在这些情况下,所述核酸通常在中等严紧的杂交条件下杂交。示例性的“中等严紧的杂交条件”包括:37℃下于40%甲酰胺、1M NaCl、1%SDS的缓冲液中杂交,以及45℃下于1×SSC中洗涤。阳性杂交至少是背景的两倍。本领域技术人员会容易地认识到,替代性杂交和洗涤条件可以用于提供相似严紧性的条件。用于确定杂交参数的其它指导在很多参考文献中提供,例如,Current Protocols in Molecular Biology,Ausubel等人编。
“表达盒”是重组或合成产生的核酸构建体,其具有允许在宿主细胞中转录具体多核苷酸的一系列指定的核酸元件。表达盒可以是质粒、病毒基因组或核酸片段的一部分。通常,表达盒包括与启动子可操作地连接的待转录的多核苷酸。在此背景下,“可操作地连接”表示将两个或更多个遗传元件(诸如多核苷酸编码序列和启动子)置于允许元件发挥合适的生物功能(诸如启动子指导编码序列进行转录)的相对位置。可以存在于表达盒中的其它元件包括能增强转录(例如,增强子)和终止转录(例如,终止子)的元件,以及赋予表达盒所产生的重组蛋白某种结合亲和力或抗原性的元件。
术语“免疫球蛋白”或“抗体”(本文可互换使用)是指具有由两条重链和两条轻链组成的基本四多肽链结构的抗原结合蛋白,所述链例如通过链间二硫键来稳定,所述抗原结合蛋白具有特异地结合抗原的能力。重链和轻链都折叠成结构域。
术语“抗体”还指可以用于免疫结合分析中的抗体如Fab片段的抗原结合片段和表位结合片段。有很多被良好地表征的抗体片段。因此,例如,胃蛋白酶在铰链区的二硫键连接的C端消化抗体,以产生Fab的二聚体F(ab)'2,所述Fab自身是通过二硫键与VH-CH1连接的轻链。F(ab)'2可以在温和的条件下被还原,以破坏铰链区的二硫键,从而将(Fab')2二聚体转化为Fab'单体。Fab'单体在本质上是具有一部分铰链区的Fab(对于其它抗体片段的更详细描述,参见例如,Fundamental Immunology,Paul编,Raven Press,N.Y.(1993))。尽管根据完整抗体的消化来定义不同的抗体片段,但本领域技术人员应当理解的是,可以通过化学方法从头合成片段,或通过利用重组DNA技术来合成片段。因此,术语抗体还包括通过修饰整个抗体所产生的抗体片段,或利用重组DNA技术合成的抗体片段。
当在描述具体分子与蛋白或肽的结合关系的上下文中使用时,短语“特异性地结合”是指能在蛋白和其它生物制剂的混杂群体中确定蛋白的存在的结合反应。因此,在指定的结合测定条件下,指定的结合试剂(例如,抗体)与特定蛋白的结合至少为背景的二倍,并且基本上不以显著的量与样品中存在的其它蛋白结合。在这种条件下,抗体的特异性结合可能需要选择对特定蛋白具有特异性的抗体,或对某一蛋白具有特异性而不对该蛋白的相似“姐妹”蛋白具有特异性的抗体。多种免疫测定模式可用于选择能与特定的蛋白或以特定的形式发生特异性免疫反应的抗体。例如,固相ELISA免疫分析常被用于选择能与蛋白质发生特异性免疫反应的抗体(对于可用于确定特异性免疫反应性的免疫分析模式和条件的描述,参见例如,Harlow&Lane,Antibodies,ALaboratory Manual(1988))。通常,特异性或选择性结合反应为背景信号或噪音的至少两倍,更通常超过背景的10至100倍。另一方面,当涉及一条多核苷酸序列与另一多核苷酸序列形成双链复合物时,术语“特异性地结合”描述基于Watson-Crick碱基配对的“多核苷酸杂交”,正如在术语“多核苷酸杂交方法”的定义中所述。
本申请中所用的“增加”或“降低”是指,与比较对照相比在量上可检测出的正向或负向改变,所述比较对照例如是已建立的标准对照(例如,在未患有CRC或具有发展为CRC风险的健康受试者粪便样品中发现的,相关细菌DNA或RNA或蛋白质的平均水平)。增加是通常为对照值的至少10%、或至少20%、或50%、或100%的正向改变,并且可以高达对照值的至少2倍、至少5倍或甚至10倍。同样,降低是通常为对照值的至少10%、或至少20%、30%、或50%、或者甚至高达至少80%或90%的负向改变。指示与比较基准相比的量的改变或差异的其它术语,诸如“多于”、“少于”、“高于”和“低于”,在本申请中以上述相同的方式使用。相比之下,术语“基本相同的”或“基本没有变化的”指示与标准对照值相比,在量上具有极小改变或没有改变,通常改变在标准对照的±10%以内,或±5%、±2%以内,或者甚至与标准对照相比具有更小的改变。
本文所用的术语“抑制(inhibiting/inhibition)”是指对靶标生物过程(如RNA转录、蛋白质表达、细胞增殖、细胞信号转导、细胞增殖、致瘤性,转移潜能以及疾病/病况的复发)的任何可检测的负面影响。通常,抑制反映为当与不施用抑制剂的对照相比时,在施用抑制剂的靶标过程中(例如,相关细菌DNA、RNA或蛋白质的水平)降低至少10%、20%、30%、40%或50%。
如本文所用,“多核苷酸杂交方法”是指在合适的杂交条件下,基于预先确定的多核苷酸序列与已知序列的多核苷酸探针形成Watson-Crick碱基配对的能力,来检测预先确定的多核苷酸序列的存在和/或量的方法。这类杂交方法的实例包括Southern印迹、Northern印迹和原位杂交。
如本文所用,“引物”是指可以在扩增方法(如聚合酶链式反应(PCR))中用来基于对应于目的基因(例如,相关细菌物种的DNA或RNA序列)的多核苷酸序列扩增核苷酸序列的寡核苷酸。通常,用于扩增多核苷酸序列的至少一条PCR引物,对于该多核苷酸序列是序列特异性的。引物的确切长度取决于多种因素,包括温度、引物来源和所用的方法。例如,对于诊断和预后应用,取决于靶序列的复杂性,寡核苷酸引物通常含有至少10、或15、或20、或25或更多个核苷酸,尽管其可以含有更少核苷酸或更多核苷酸。在确定引物合适长度中所涉及的因素是本领域技术人员熟知的。具体实施方案中所用的引物,如本公开的“用于本研究的引物和探针的列表”所示,其中标明了它们的具体应用。在本文中,术语“引物对”表示与靶DNA分子的相反链杂交,或与位于待扩增的核苷酸序列侧翼的靶DNA区域杂交的引物对。在本文中,术语“引物位点”表示与引物杂交的靶DNA或其它核酸的区域。
“标记”、“可检测的标记”或“可检测的部分”是可通过分光光度计、光化学、生物化学、免疫化学、化学或其它物理手段进行检测的组成部分。例如,有用的标记包括32P、荧光染料、电子密度试剂、酶(例如,ELISA中常用的酶)、生物素、地高辛、或可被制成可检测的(例如,通过将放射性成分并入肽中)或用于检测抗体与肽发生特异性反应的半抗原和蛋白。通常,将可检测的标记与具有确定的结合特性的探针或分子(例如,具有已知结合特异性的多肽或多核苷酸)连接,以允许容易地检测探针(以及其结合靶标)的存在。
如本文所用,“标准对照”是指存在于已建立的无疾病粪便样品(例如,来自未被诊断患有CRC或已知具有增加的发展成CRC的风险的平均健康个体的粪便样品)中的预定量或浓度的多核苷酸序列或多肽(例如,相关细菌的DNA、RNA或蛋白质)。标准对照值适合用于本发明方法,作为用于比较测试样品中所存在的相关细菌的DNA、RNA或蛋白质的量的基础。作为标准对照的已建立样品,提供了对于不患有常规定义的任何结肠疾病(尤其是CRC)的平均健康人的粪便样品中通常的相关细菌的DNA、RNA或蛋白质的平均量。标准对照值可以根据样品的性质以及其它因素而变化,所述其它因素例如作为建立该对照值基础的所述个体的性别、年龄、种族。
当用于描述不患有常规定义的任何结肠疾病(尤其是CRC)的健康人时,术语“平均”是指在能代表随机选择的不患有任何结肠疾病(尤其是CRC)并且没有已知的发展成该疾病的风险的健康人群的人粪便样品中的某些特性,尤其是某些相关细菌的DNA、RNA或蛋白质的水平。所选择的人群应当包括足够数量的人,使得这些个体的粪便中发现的相关细菌的DNA、RNA或蛋白质的平均水平或量能以合理的准确性反映一般的健康人群中这些DNA、RNA或蛋白质的对应水平或量。此外,所选择的人群通常与粪便样品被用于测试结肠癌指示的受试者具有相似的年龄。此外,还应考虑诸如性别、种族、病史等其它因素,并优选实现测试受试者与所选的建立“平均”值的个体组在特征上密切匹配。
如本申请中所用,术语“量(amount)”是指样品中存在的目的多核苷酸或目的多肽(例如,相关细菌的DNA、RNA或蛋白质)的量。此类量可以以绝对值来表示,即样品中多核苷酸或多肽的总量,或以相对值来表示,即样品中多核苷酸或多肽的浓度。
如本申请中所用,术语“治疗(treat/treating)”描述能实现消除、减轻、缓解、逆转或预防或延迟相关病况的任何症状的发生或复发的行为。换言之,“治疗”病况包括对该病况的治疗性干预和预防性干预。
如本文所用,术语“有效量”是指在量上足以产生期望效应的给定物质的量。例如,有效量的编码反义RNA的多核苷酸,是在细菌物种中实现相应的RNA或蛋白表达或生物活性的水平降低,使得在为治疗性目的给予多核苷酸的患者中结肠癌的风险、症状、严重性和/或复发变化被减轻、逆转、消除、预防或延迟发生的所述多核苷酸的量。足以实现这点的量被定义为“治疗有效剂量”。剂量范围根据所给予的治疗剂的性质,以及诸如给药途径和患者病况的严重程度等其它因素而改变。
如本文所用,术语“受试者”或“需要治疗的受试者”包括由于具有患结肠癌风险或实际患有结肠癌而寻求医疗帮助的个体。受试者还包括寻求治疗方案改进的当前正经历治疗的个体。需要治疗的受试者或个体包括表现出结肠癌的症状,或具有患结肠癌或其症状的风险的受试者或个体。例如,需要治疗的受试者包括具有结肠癌遗传倾向或家族史的个体、过去已忍受相关症状的个体、已暴露于触发物质或事件的个体,以及忍受病况的慢性或急性症状的个体。“需要治疗的受试者”可以处于生命的任何年龄。
所使用的细菌物种的“抑制剂”、“激活剂”和“调节剂”分别是指,使用体外分析和体内分析鉴定的抑制性分子、活化性分子或调节性分子,其用于结合相关细菌的DNA、RNA或蛋白质,或用于影响细菌的存活或增殖。术语“调节剂”包括抑制剂和激活剂。例如,抑制剂是可能通过抑制细菌物种的生长或存活,来部分或完全地阻断结合、降低、阻止、延迟激活、失活、脱敏或下调相关细菌的DNA、RNA或蛋白质的水平或量的试剂。在一些情况下,抑制剂直接或间接与细菌DNA或RNA如反义分子结合。本文所用的抑制剂与失活剂和拮抗剂同义。例如,激活剂是可能通过促进细菌物种的生长或存活,来刺激、增加、促进、增强活化、敏化或上调相关细菌的DNA、RNA或蛋白质的水平或量的试剂。抑制剂、激活剂和调节剂可以是大分子,例如多核苷酸、包括抗体和抗体片段的多肽,或者它们可以是小分子,其包括含有碳水化合物的分子、siRNA、RNA适体等。
发明详述
I.引言
当在后期检测到疾病时,结肠直肠癌患者常常面临严酷的预后。因此,早期检测结肠直肠癌对于提高患者生存率至关重要。虽然先前已知人肠中存在的细菌群体在结肠直肠癌的肿瘤发生和发展中起作用,但没有足够的信息可用于开发允许基于粪便细菌标志物快速和可靠地检测所述疾病的非侵入性诊断工具。
本发明人首次发现,如通过相关细菌的DNA、RNA或蛋白质的水平增加所证实的,某些细菌物种在粪便中存在的增加,与患者中结肠直肠癌的存在或升高的风险相关。相关细菌物种在结肠直肠癌患者的结肠中富集这一发现,提供了以非侵入性方式早期检测结肠直肠癌的重要手段,以及在监测或治疗疾病中的影响。通常,测试受试者的粪便样品中可见的相关细菌DNA、RNA或蛋白质的水平高于正常水平(其可能呈现或可能不呈现结肠病症或异常的任何迹象),这表明受试者有高可能性已经患有或将在以后发展成结肠直肠癌。如果进一步的诊断方法确认了该疾病的存在,此类升高的风险的识别允许立即治疗患者,或者如果疾病还没有发生,此类升高的风险的识别允许对患者进行密切监测和/或采用预防措施。
在发明人的第二研究中,发明人通过宏基因组测序鉴定出,五个细菌候选物(包括核梭杆菌(Fn)、克拉鲁斯拟杆菌(Bc)、肠道罗斯氏菌(Ri)、哈撒韦梭菌(Ch)和一种未定义的物种(m7)的丰度,在双重qPCR分析所示的CRC患者的粪便样品与健康对照的比较中有显著的差异。粪便Fn的值,作为用于CRC诊断的基于粪便的生物标志物被证实(灵敏度为77.7%,特异性为79.5%)。四个细菌标志物候选物(Fn、Bc、Ch和m7)的简单线性组合,提高了单独Fn对CRC的诊断能力。作为检测CRC的生物标志物,在与粪便免疫化学测试(FIT)的组合时,增加了Fn(灵敏度为92.8%,特异性为79.8%)和四细菌(灵敏度为92.8%,特异性为81.5%)的性能。
本发明描述了用于定量细菌DNA含量的基于探针的内部对照分析,以及用于通过宏基因组测序来定量发明人新鉴定的粪便细菌标志物的进一步双重qPCR分析。通过如下方面良好地建立并优化内部对照分析:1)设计简并引物-探针组,使其具有适合于靶向16SrRNA基因的保守区域的qPCR定量的扩增子大小(小于150bp),并在核糖体数据库项目版本10.8中,覆盖大于90%的真细菌群体;2)使用良好优化的实验方案,Cq值与Log2 DNA量良好相关(R2=0.6466)。简言之,发明人已经建立了用于方便地转化应用新细菌标志物的可靠平台。通过本文所述的宏基因组测序研究所鉴定的基于粪便的CRC相关的细菌,可以作为用于对CRC患者进行非侵入性诊断的新型生物标志物。
II.一般方法
本发明的实践利用分子生物学领域的常规技术。公开了本发明使用的一般方法的基础教科书包括:Sambrook和Russell,Molecular Cloning,A Laboratory Manual(第3版,2001);Kriegler,Gene Transfer and Expression:A Laboratory Manual(1990);以及Current Protocols in Molecular Biology(Ausubel等人编,1994))。
对于核酸,以千碱基对(kb)或碱基对(bp)给出大小。核酸大小是从琼脂糖或丙烯酰胺凝胶电泳、从测序的核酸或从公开的DNA序列得到的估计值。对于蛋白,以千道尔顿(kDa)或氨基酸残基数给出大小。蛋白大小是从凝胶电泳、从测序的蛋白、从导出的氨基酸序列或从公开的蛋白序列估算的。
例如,使用Van Devanter等人,Nucleic Acids Res.12:6159-6168(1984)中的描述的自动化合成仪,根据Beaucage和Caruthers,Tetrahedron Lett.22:1859-1862(1981)中首先描述的固相亚磷酰胺三酯法,可以通过化学方法合成不能商购的寡核苷酸。利用任何本领域公认的策略,例如天然丙烯酰胺凝胶电泳或Pearson和Reanier,J.Chrom.255:137-149(1983)中所描述的阴离子交换高效液相色谱(HPLC),进行寡核苷酸的纯化。
利用例如Wallace等人,Gene 16:21-26(1981)中的用于双链模板的链终止法,可以验证本发明所用的目的序列,例如相关细菌DNA或RNA的多核苷酸序列,以及合成的寡核苷酸(例如,引物)。
III.获取样品和分析细菌DNA或RNA
本发明涉及测量在人粪便样品中发现的一种或多种细菌物种的识别标志DNA或RNA的水平或量,将其作为检测结肠癌的存在、评估发展成结肠癌的风险和/或监测结肠癌的进展或治疗功效(包括评估疾病复发的可能性)的手段。因此,实施本发明的第一步骤是,从测试受试者获得粪便样品并从所述样品中提取DNA或RNA。
A.粪便样品的获取和制备
使用本发明的方法,从待测试或监测结肠癌的人获得粪便样品。可以在诊所或在患者家中容易地实现收集个体的粪便样品。收集适量的粪便,并且可以在进一步的制备之前,根据标准程序储存粪便。可以使用已建立的技术,对根据本发明的患者粪便样品中发现的细菌DNA或RNA进行分析。制备用于核酸提取的粪便样品的方法是本领域技术人员熟知的。参见,例如Yu等人,Gut.2015年9月25日pii:gutjnl-2015-309800.doi:10.1136/gutjnl-2015-309800。
B.DNA和RNA的提取和定量
从生物样品中提取DNA的方法是公知的,并在分子生物学领域中是常规实施的(例如,描述于Sambrook和Russell,Molecular Cloning:A Laboratory Manual第三版,2001)。应消除RNA污染以避免干扰DNA分析。
同样,有许多用于从生物样品中提取mRNA的方法。可以遵循mRNA制备的一般方法,参见,例如Sambrook和Russell,同上;各种可商购的试剂或试剂盒,如Trizol试剂(Invitrogen,Carlsbad,CA),Oligotex Direct mRNA试剂盒(Qiagen,Valencia,CA),RNeasy Mini试剂盒(Qiagen,Hilden,Germany)和
Figure GDA0003521621830000201
Series 9600TM(Promega,Madison,WI),也可以用于从测试受试者的生物样品中获得mRNA。也可以使用这些方法中多于一种方法的组合。从RNA制剂中消除所有污染的DNA是重要的。因此,应仔细处理样品,用DNA酶彻底处理,并在扩增和定量步骤中使用适当的阴性对照。
1.基于PCR的DNA或RNA水平的定量测定
当从样品中提取DNA或mRNA,可以定量所预定的细菌DNA或RNA(如由细菌物种特有的细菌基因所编码的16s rDNA或RNA)的量。测定所述DNA或RNA水平的优选方法是基于扩增的方法,例如通过聚合酶链反应(PCR),其包括用于RNA定量分析的逆转录-聚合酶链式反应(RT-PCR)。
当细菌DNA直接进行扩增时,必须首先反转录细菌RNA。在扩增步骤之前,必须合成靶RNA的DNA拷贝(cDNA)。这一过程是通过逆转录实现的,其可以作为单独步骤进行,或在均相逆转录-聚合酶链反应(RT-PCR)中进行,所述RT-PCR是用于扩增RNA的一种改良的聚合酶链式反应。适于通过PCR扩增核糖核酸的方法描述于:Romero和Rotbart,DiagnosticMolecular Biology:Principles and Applications pp.401-406;Persing等人编,MayoFoundation,Rochester,MN,1993;Egger等人,J.Clin.Microbiol.33:1442-1447,1995;以及美国专利第5,075,212号。
PCR的一般方法是本领域公知的,并且因而在本文没有详细描述。对于PCR方法、实验方案和设计引物的原理的综述,参见例如,Innis等人,PCR Protocols:A Guide toMethods and Applications,Academic Press,Inc.N.Y.,1990。PCR试剂和实验方案还可以从供应商如Roche Molecular Systems获得。
最通常的情况下,利用热稳定酶以自动化过程来实施PCR。在该过程中,使反应混合物的温度自动地通过变性区、引物退火区和延伸反应区进行循环。专门适用于该目的的仪器是可商购获得的。
尽管在实施本发明中通常使用靶细菌DNA或RNA的PCR扩增,但本领域技术人员应当认识到,通过任何已知的方法可以实现样品中这些DNA或RNA种类的扩增,如连接酶链式反应(LCR)、转录介导的扩增和半保留序列复制或基于核酸序列的扩增(NASBA),这些方法中的每一种都能提供充分的扩增。最近研发的支链DNA技术也可以用于定量地测定样品中DNA或mRNA的量。对于直接定量临床样品中核酸序列的支链DNA信号扩增的综述,参见Nolte,Adv.Clin.Chem.33:201-235,1998。
2.其它定量方法
还可以利用本领域技术人员公知的其它标准技术来检测靶细菌DNA或RNA。尽管在检测步骤之前通常进行扩增步骤,但是本发明方法不是一定需要扩增。例如,无论事先是否进行扩增步骤,都可以通过大小分级(例如,凝胶电泳)来鉴定DNA或RNA。在琼脂糖或聚丙烯酰胺凝胶中运行样品并按照公知的技术用溴化乙锭进行标记(参见例如,Sambrook和Russell,同上)之后,与标准对照具有相同大小的条带的存在指示出靶DNA或RNA的存在,然后基于条带的强度将所述靶DNA或RNA的量与对照进行比较。或者,可将对靶细菌DNA或RNA具有特异性的寡核苷酸探针用于检测此类DNA或RNA的存在,并基于探针提供的信号强度,通过与标准对照比较来指示出细菌DNA或RNA的量。
序列特异性探针杂交是检测包含其它种类核酸的特定核酸的公知方法。在足够严紧的杂交条件下,所述探针只与基本上互补的序列特异性杂交。可以放松杂交条件的严紧性,以允许不同量的序列错配。
本领域中公知有很多杂交模式,包括但不限于:液相、固相或混合相杂交测定。下面的文章提供了多种杂交测定模式的综述:Singer等人,Biotechniques 4:230,1986;Haase等人,Methods in Virology,pp.189-226,1984;Wilkinson,In situHybridization,Wilkinson编,IRL Press,Oxford University Press,Oxford;以及Hames和Higgins编,Nucleic Acid Hybridization:A Practical Approach,IRL Press,1987。
按照公知的技术检测杂交复合物。通过常用于检测杂交核酸存在的数种方法中任一种,可以标记能够与靶核酸(即细菌16s rDNA)特异性杂交的核酸探针。一种常用的检测方法是,利用以3H、125I、35S、14C或32P等标记的探针的放射自显影技术。因为合成的便利性、稳定性和所选同位素的半衰期,放射性同位素的选择取决于研究的参数选择。其它标记包括化合物(例如,生物素和地高辛),其与用荧光团、化学发光试剂和酶标记的抗配体或抗体结合。或者,探针可以与诸如荧光团、化学发光试剂和酶的标记直接缀合。标记的选择取决于所需的敏感度、与探针缀合的便利性、稳定性需要和可利用的仪器。
利用公知的技术,可以合成和标记实施本发明所需的探针和引物。例如,使用Needham-Van Devanter等人,Nucleic Acids Res.12:6159-6168,1984中所描述的自动化合成仪,按照Beaucage和Caruthers,Tetrahedron Lett.22:1859-1862,1981首次描述的固相亚磷酰胺三酯法,可以通过化学方法合成用作探针和引物的寡核苷酸。通过天然丙烯酰胺凝胶电泳,或通过Pearson和Reanier,J.Chrom.255:137-149,1983中所描述的阴离子交换HPLC,可以进行寡核苷酸的纯化。
IV.细菌蛋白的定量
A.准备用于细菌蛋白检测的样品
还可以通过分析细菌特有的一种或多种蛋白质来定量测定样品中的相关细菌物种的存在。将来自受试者的粪便样品用于实施本发明,并且可以根据已知的方法或如前面章节所述获得并处理以进行分析。
B.测定细菌蛋白的水平
可以利用多种免疫学分析来检测蛋白质,例如指示细菌身份的蛋白质。在一些实施方案中,通过使用对靶蛋白具有特异性结合亲和力的抗体来从测试样品捕获所述靶蛋白,可以进行夹心法分析。然后,可以用对所述蛋白具有特异性结合亲和力的标记抗体来检测它。可以利用微流式装置(如微阵列蛋白芯片)来实施此类免疫学分析。还可以通过凝胶电泳(如二维凝胶电泳)和利用特异性抗体的Western印迹分析,来检测目的蛋白(例如,细菌物种特有的蛋白质)。或者,可以通过利用合适的抗体的标准免疫组织学技术来检测靶蛋白。单克隆抗体和多克隆抗体(包括具有期望的结合特异性的抗体片段),可用于靶蛋白的特异性检测。可以通过已知技术来产生对特定蛋白具有特异性结合亲和力的抗体及其结合片段。
在实施本发明中,还可以利用其它方法来测定标志物蛋白的水平。例如,基于质谱测量技术已开发出多种技术来快速和精确定量靶蛋白(甚至在大量样品中)。这些方法涉及高精密仪器,如利用多反应监测(MRM)技术的三个四极杆(triple Q)仪器、基质辅助激光解吸/电离飞行时间串联质谱仪(MALDI TOF/TOF)、利用选择性离子检测(SIM)模式的离子阱仪器,以及基于电喷雾离子化(ESI)的QTOP质谱仪。参见例如,Pan等人,J ProteomeRes.2009年2月;8(2):787–797。
V.建立标准对照
为了建立用于实施本发明方法的标准对照,首先选择未患有常规定义的任何结肠病(尤其是任何形式的肿瘤如结肠癌)的一组健康人。为了利用本发明的方法筛查和/或监测结肠癌,如果可以的话,这些个体符合合适的参数。任选地,所述个体为相同的性别、相似的年龄或相似的种族背景。
通过成熟的、常规使用的方法来确认所选个体的健康状态,所述方法包括但不限于个体的一般身体检查及其医疗史的总体回顾。
此外,所选的健康个体组必须具有合理的样品大小,使得从组中获得的粪便样品中相关的细菌、其DNA、mRNA或蛋白质的平均量/浓度,能够被合理地看作代表一般健康人群中的正常或平均水平。优选地,选择的组包括至少10个人类受试者。
一旦基于所选健康对照组每个受试者的个体值,建立了细菌、其标志物DNA、mRNA或蛋白质的平均值,该平均值、或中值、或代表值、或特征被视为标准对照。在相同的过程中还确定标准差。在一些情况下,可以为具有不同特征(如年龄、性别或种族背景)的单独定义的组,建立单独的标准对照。
VI.结肠癌的预防性治疗
通过说明人肠道中某些细菌物种的富集与结肠癌的相关性,本发明提供了用于预防性治疗具有增加的后续发展成结肠癌风险的患者的预防措施:通过抑制相关细菌物种并降低其在患者肠道中的存在的方式。相比之下,本发明人已经示出了在CRC患者结肠中某些其它细菌物种具有受抑制的群体或低于正常群体。然后可以设计预防措施,以用于预防性治疗具有增加的后续发展成结肠癌风险的患者:通过促进相关细菌物种和增加/恢复其在患者结肠中的存在的方式。
如本文所用,结肠癌的预防性治疗包括预防或延迟所述疾病的一种或多种相关症状的发作,其包括降低已经接受初始治疗的患者的死亡率或疾病复发可能性。相关细菌物种的抑制剂实际上可具有任何化学性质和结构性质:它们可以是多肽(例如抗体、抗体片段、适体)、多核苷酸(例如反义DNA/RNA、小抑制性RNA或微小RNA)以及小分子。只要它们具有经证实的对靶细菌的抑制作用(例如,抑制细菌增殖或诱导细菌细胞死亡),则此类抑制剂可用于抑制患者肠道中结肠癌细胞的发展,因此可用于治疗结肠癌。类似地,相关细菌物种的激活剂实际上可具有任何化学性质和结构性质,只要它们具有经证实的对靶细菌的增强作用(例如,促进细菌增殖或抑制细菌细胞死亡)。
A.相关细菌物种的调节剂
通过使用靶向特异性细菌基因的抑制剂核酸(如siRNA、微小RNA、微型RNA(miniRNA)、lncRNA、反义寡核苷酸、适体),可以实现细菌物种的抑制。此类核酸可以是单链核酸(例如mRNA)或双链核酸(例如DNA),其可以在合适的条件下转化为靶细菌RNA的抑制剂的活性形式。
在一个实施方案中,以表达盒的形式提供编码抑制剂的核酸,其通常是重组产生的,具有可操作地连接于编码所述抑制剂的多核苷酸序列的启动子。在一些情况下,所述启动子是在选择的细菌细胞中特异性表达的启动子。施用此类核酸可以抑制靶细菌的基因表达,并因此抑制细菌群体。由于几乎所有已知的细菌均已完全测序,并且信息已被存储在数据库中,因此可以基于序列信息来设计合适的抑制剂核酸。
在细菌培养物暴露于候选化合物时,可以在分析中确认相关细菌物种的抑制剂和激活剂,并且分析所述化合物对培养物的影响。例如,可以观察到抑制剂对细菌培养物表现出抑制或抑制作用,导致生长减弱和/或细菌细胞死亡增加。相比之下,可以观察到激活剂对细菌培养物表现出积极作用,促进细菌的存活以及增殖/生长。当在测试组中确立了对细菌培养物的负面作用时,则检测到抑制作用。优选地,负面作用是至少10%的降低;更优选地,降低是C。类似地,激活剂表现出在细胞增殖中至少10%、20%、50%或更高增加的作用,更优选地,增加是至少1倍、或2倍、或甚至5倍。
如上所述,这些细菌抑制剂或激活剂可具有不同的化学特征和结构特征。例如,抑制剂或激活剂可以是仅影响特定细菌物种生长或存活的任何小分子或大分子。基本上任何化合物都可以作为潜在的抑制剂或激活剂进行测试。此类调节剂可以通过筛选含有大量潜在的有效化合物的组合文库来鉴定。如本文所述,可以在一个或多个分析中筛选此类组合化学文库,以鉴定显示所需特征活性的那些文库成员(特定的化学物质种类或亚类)。因此,所鉴定的化合物可以用作常规的“先导化合物”,或者可以将其本身用作潜在的或实际的治疗剂。
组合化学文库的制备和筛选是本领域技术人员公知的。此类组合化学文库包括但不限于:肽文库(参见例如,美国专利第5,010,175号,Furka,Int.J.Pept.Prot.Res.37:487-493(1991)和Houghton等人,Nature 354:84-88(1991)),以及碳水化合物文库(参见例如,Liang等人,Science,274:1520-1522(1996)和美国专利第5,593,853号)。也可以使用用于产生化学多样性文库的其它化学品。此类化学物质包括但不限于:拟肽(PCT公开WO 91/19735)、编码的肽(PCT公开WO 93/20242)、随机生物寡聚物(PCT公开WO 92/00091)、苯二氮卓类(美国专利第5,288,514号)、Diversomer例如乙内酰脲、苯二氮卓类和二肽(Hobbs等人,Proc.Nat.Acad.Sci.USA 90:6909-6913(1993))、插烯多肽(vinylogouspolypeptides)(Hagihara等人,J.Amer.Chem.Soc.114:6568(1992))、具有β-D-葡萄糖骨架的非肽类肽模拟物(Hirschmann等人,J.Amer.Chem.Soc.114:9217-9218(1992))、小化合物的类似有机合成的文库(Chen等人,J.Amer.Chem.Soc.116:2661(1994))、寡聚氨基甲酸酯(Cho等人,Science 261:1303(1993))和/或肽基膦酸酯(Campbell等人,J.Org.Chem.59:658(1994)、核酸文库(参见Ausubel、Berger和Sambrook,全部同上)、肽核酸文库(参见例如,美国专利第5,539,083号)、抗体文库(参见例如,Vaughn等人,Nature BioteChnology,14(3):309-314(1996)和PCT/US96/10287)、小有机分子文库(参见例如,苯二氮卓类,BaumC&EN,1月18日,第33页(1993);类异戊二烯,美国专利第5,569,588号;噻唑烷酮和间噻嗪烷酮,美国专利第5,549,974号;吡咯烷,美国专利第5,525,735号和第5,519,134号;吗啉化合物,美国专利第5,506,337号;和苯二氮卓类,美国专利第5,288,514号)。
B.药物组合物
1.制剂
相关细菌物种的调节剂可用于药物组合物或药物的制备。可以将药物组合物或药物施用于个体以治疗结肠癌,尤其是用于预防。
本发明的治疗方法中所用的化合物,可用于制备包含有效量的所述化合物的药物组合物或药物,所述有效量的化合物与适于应用的赋形剂或载体组合或混合。
用于此类治疗用途的示例性药物组合物包含:(i)包含编码本文所述的抑制剂(例如siRNA、微小RNA、微型RNA、lncRNA、反义寡核苷酸)的多核苷酸序列的表达盒,和(ii)药学上可接受的赋形剂或载体。术语“药学上可接受的”和“生理学上可接受的”,在本文可同义使用。对于本文所述的治疗方法中的使用,可以提供治疗有效剂量的表达盒。
可以通过脂质体施用抑制剂或激活剂,脂质体用作将缀合物靶向特定的组织,以及增加组合物的半衰期。脂质体包括乳剂、起泡剂、胶束、不溶性单层、液态晶体、磷脂分散剂、片状层等。在这些制剂中,将待递送的抑制剂作为脂质体的一部分,所述抑制剂单独的或与能结合例如靶细胞中广泛存在的受体的分子或其它治疗性或免疫原性组合物联合。因此,用本发明所需的调节剂填充的脂质体,可被引导至治疗位点(例如结肠),然后在该治疗位点,所述脂质体递送所选的抑制剂组合物。用于本发明中的脂质体由标准的囊泡形成脂质形成,所述囊泡形成脂质通常包括中性和带负电的磷脂和甾醇(如胆固醇)。通常考虑以下因素来指导脂质的选择,例如,脂质体尺寸、血流中脂质体的酸不稳定性和稳定性。可获得用于制备脂质体的多种方法,其描述于例如Szoka等人(1980)Ann.Rev.Biophys.Bioeng.9:467,美国专利第4,235,871号、第4,501,728号和第4,837,028号。
利用一种或多种生理学上可接受的载体或赋形剂,通过标准技术可制备用于本发明中的药物组合物或药物。合适的药物载体在本文和E.W.Martin的“Remington'sPharmaceutical Sciences”中有描述。可以将本发明的化合物和药剂及它们的生理学上可接受的盐及溶剂化物配制为用于通过任何合适的途径进行给药,包括吸入给药、局部给药、经鼻给药、经口给药、肠胃外给药或直肠给药。
用于局部给药的典型剂型包括乳膏、软膏、喷雾、洗液和膏药。然而,药物组合物可以被配制成用于任何类型的给药,例如,利用注射器或其它装置的皮内注射、皮下注射、静脉内注射、肌肉内注射、鼻内注射、大脑内注射、气管内注射、动脉内注射、腹膜内注射、膀胱内注射、胸膜内注射、冠状动脉内或肿瘤内注射。还考虑了通过吸入(例如,气雾剂)给药或口服给药、直肠给药或阴道给药的剂型。
2.给药途径
用于局部施加于例如皮肤和眼部的合适剂型,优选本领域内公知的水性溶液、软膏、乳膏或凝胶。这种剂型可以含有增溶剂、稳定剂、张力增强剂、缓冲剂和防腐剂。
用于经皮施加的合适剂型,包括伴随载体的有效量本发明的调节剂。优选的载体包括可吸收的、药学上可接受的溶剂,以有助于透过宿主皮肤。例如,透皮装置采用绷带的形式,所述绷带包括支持构件、容纳化合物和任选的载体的贮存器,任选的速率控制屏障,以及将所述装置固定于皮肤的器具,其中所述速率控制屏障能以受控和预定的速率在长的时间段内将化合物递送至宿主皮肤。还可以使用基质透皮剂型。
对于口服给药,药物组合物或药物可以采用例如用药学上可接受的赋形剂通过常规方式制备的片剂或胶囊形式。优选的是包含以下物质的片剂和明胶胶囊:活性成分(即抑制剂或激活剂),以及(a)稀释剂或填充剂,例如,乳糖、葡萄糖、蔗糖、甘露醇、山梨醇、纤维素(例如,乙基纤维素、微晶纤维素)、糖胶、果胶、聚丙烯酸酯和/或磷酸氢钙、硫酸钙,(b)润滑剂,例如,硅石、滑石、硬脂酸、硬脂酸镁或硬脂酸钙、金属硬脂酸盐、胶体二氧化硅、氢化植物油、玉米淀粉、苯甲酸钠、醋酸钠和/或聚乙二醇;对于片剂,还可以包含(c)粘合剂,例如,硅酸镁铝、淀粉糊、明胶、黄芪胶、甲基纤维素、羧甲基纤维素钠、聚乙烯吡咯烷酮和/或羟丙基纤维素;如果需要,还可以包含(d)崩解剂,例如,淀粉(例如,马铃薯淀粉或淀粉钠)、乙醇酸盐(酯)、琼脂、褐藻酸或其钠盐、或起泡混合物,(e)润湿剂,例如,月桂基硫酸钠,和/或(f)吸收剂、着色剂、芳香剂和甜味剂。
还可以根据本领域内已知的方法,用薄膜包被片剂或用肠衣包被片剂。用于口服给药的液体制剂,可以采用例如溶液、糖浆或悬浮液的形式,或者可以将它们提供为干的产品,用于在使用前用水或其它合适介质复原。使用药学上可接受的添加剂,通过常规方式可制备这种液体制剂,所述添加剂为例如,悬浮剂,例如,山梨醇糖浆、纤维素衍生物或氢化可食脂肪;乳化剂,例如,卵磷脂或阿拉伯树胶;非水性介质,例如,杏仁油、油酯、乙醇或分级的植物油;以及防腐剂,例如,对羟基苯甲酸甲酯或对羟基苯甲酸丙酯或山梨酸。视情况而定,所述制剂还可以含有缓冲盐、芳香剂、着色剂和/或甜味剂。需要时,口服给药的制剂可以被适当配制以实现活性化合物的控释。
本发明的化合物和药剂,可以配制成通过注射用于肠胃外给药,例如通过快速推注或连续输注。可以以单位剂量形式提供用于注射的剂型,例如,添加了防腐剂的安瓿或多剂量容器。可注射的组合物优选是水性等渗溶液或悬浮液,并且优选为由脂肪乳剂或悬浮液制备的栓剂。组合物可以是无菌的和/或含有佐剂,如防腐剂、稳定剂、润湿剂或乳化剂、溶解促进剂、调节渗透压的盐和/或缓冲剂。或者,活性成分可以为粉末形式,在使用前用合适的介质(例如,无菌无热原的水)复原。此外,它们还可以含有其它有治疗价值的物质。分别按照常规的混合、粒化或包被方法来制备组合物,且组合物含有约0.1%至75%,优选约1%至50%的活性成分。
为了通过吸入给药,使用合适的推进剂,可从加压包或或喷雾器中以气雾剂喷雾的方式便利地递送活性成分,所述推进剂例如,二氯二氟甲烷、三氯氟甲烷、二氯四氟乙烷、二氧化碳或其它合适的气体。就加压气雾剂而言,通过提供阀可以确定剂量单位,以递送计量的量。例如,在吸入器或吹入器中使用的明胶胶囊或明胶盒,可以被制备成含有化合物和合适的粉末基质(例如,乳糖或淀粉)的粉末混合物。
还可以将调节剂配制在直肠组合物中,例如,栓剂或保留灌肠剂,例如,含有常规的栓剂基质,例如,可可油或其它甘油酯。
此外,可以将活性成分配制成贮库制剂。这种长效剂型可以通过植入(例如,皮下或肌肉内)或肌肉内注射来给药。因此,例如,活性成分可以与合适的聚合材料或疏水材料(例如作为可接受的油中的乳剂)或离子交换树脂一起配制,或者可以被配制成难溶的衍生物,例如,难溶性盐。
在一些情况下,本发明的药物组合物或药物包含:(i)有效量的如本文所述的化合物,其抑制或促进本文鉴定的一种或多种相关细菌物种的群体,和(ii)另一种治疗剂。当与本发明的化合物一起使用时,所述治疗剂可以单独使用、依次使用或与一种或多种其它这类治疗剂(例如,第一治疗剂、第二治疗剂和本发明的调节剂)联合使用。可以通过相同或不同的给药途径进行给药或可以在同一药物制剂中进行给药。
3.剂量
可以以能预防、治疗或控制本文所述的结肠癌的治疗有效剂量给予个体药物组合物或药物。以足以引起个体中有效的治疗反应的量给予药物组合物或药物。
所给予的活性剂的剂量取决于个体的体重、年龄、个体状况、待治疗的区域的表面积或体积以及给药形式。剂量大小还由具体个体中具体化合物的给药所伴随的任何不良反应的存在、性质和程度来决定。例如,每种类型的抑制剂或编码抑制剂的核酸都可能具有独特的剂量。用于向约50至70kg的哺乳动物口服给予单位剂量,可以含有约5至500mg的活性成分。通常,本发明的活性化合物的剂量是足以实现期望效应的剂量。最佳给药方案可以从个体体内药剂累积的测量值来计算。通常,可以每天、每周、或每月一次或多次地给予剂量。本领域技术人员能够容易地确定最佳剂量、给药方法和重复率。
为了实现期望的治疗效应,可以以治疗有效的每日剂量分多日给予化合物或药剂。因此,治疗有效地给予化合物以治疗个体中本文所述的相关疾病状态或疾病,需要持续3天至两周或更长时间的周期性(例如,每日)给药。通常,药剂的给药持续至少连续3天,通常至少连续5天,更通常至少连续10天,有时连续20、30、40或更多天。尽管连续的每日给药是达到治疗有效剂量的优选途径,但是,即使没有每天给予药剂也能实现治疗有利效应,只要足够频繁地重复给药以维持个体中药剂的治疗有效浓度。例如,可以每隔一天、每三天给予药剂,或者如果使用更高的剂量范围并且能被个体所耐受,则每周给予一次。
所述化合物或药剂的最佳剂量、毒性或治疗功效,可以随个体化合物或药剂的相对效力而不同,并且可以通过细胞培养物或实验动物中的标准药学方法来测定,例如,通过测定LD50(导致50%的群体死亡的剂量)和ED50(在50%的群体中治疗有效的剂量)。毒性效应和治疗效应的剂量比是治疗指数,且可以表示为比值LD50/ED50。优选表现出大的治疗指数的药剂。尽管可以使用表现出毒副作用的药剂,但是应当考虑设计能将这类药剂靶向受累组织位点的递送系统,从而使对正常细胞的潜在破坏最小化,进而降低副作用。
例如,从细胞培养测定和动物研究获得的数据,可以用于制定人类中使用的剂量范围。这类化合物的剂量优选位于包括ED50但具有较小毒性或没有毒性的循环浓度范围内。剂量可以在该范围内变化,这取决于所用的剂量形式和给药途径。对于本发明方法中所用的任何药剂,首先可以从细胞培养测定中估算治疗有效剂量。可以在动物模型中制定剂量,以实现包括在细胞培养中所测定的IC50(能实现症状最大抑制的一半的药剂浓度)的循环血浆浓度范围。这些信息可用于更精确地确定人类可用的剂量。例如,可以通过高效液相色谱(HPLC)测量血浆中的水平。通常,对于典型的个体,药剂的剂量当量为约1ng/kg至100mg/kg。
提供了本文所述的抑制剂或编码抑制剂的核酸的示例性剂量。当采用IV给药时,编码抑制剂的核酸(例如表达载体)的剂量可以为0.1-0.5mg(例如,5-30mg/kg)。可以以5-1000mg口服给予小的有机化合物抑制剂,或以10-500mg/ml静脉内输注小的有机化合物抑制剂。可以按照以下量通过静脉内注射或输注给予多肽抑制剂:50-500mg/ml(120分钟的时间内);1-500mg/kg(60分钟的时间内);或1-100mg/kg(快速推注),每周5次。可以以10-500mg皮下给予调节剂;以0.1-500mg/kg每天两次,或约50mg每周一次,或25mg每周两次,静脉内给予调节剂。
可以单独给予本发明的药物组合物,或可以将其与至少一种其它治疗性化合物联合给药。示例性的有利的治疗性化合物,包括全身和局部抗炎药、止疼药、抗组织胺药、麻醉化合物等。其它治疗性化合物可以与主要的活性成分同时给药,或者甚至在同一组合物中进行给药。还可以在单独的组合物中,或以与主要的活性成分不同的剂量形式,单独给予其它治疗性化合物。主要成分的部分剂量可以与其它治疗性化合物同时给药,而其它剂量可以单独给药,这取决于肠细菌群体的具体发现和个体的特征。
可以在治疗过程中,根据各种因素(包括患者肠细菌群体的分布和对治疗方案的生理应答)来调整本发明药物组合物的剂量。本领域技术人员通常参与这种治疗方案的调整。
VII.试剂盒和装置
本发明提供了用于实施本文所述方法的组合物和试剂盒,以评估从受试者获得的粪便样品中一种或多种相关细菌物种的水平。例如,可以分析一种或多种指示相关细菌物种的基因标志物,用以检测或诊断结肠癌的存在,确定发展成结肠癌的风险,并监测患者结肠癌的发展,使得可以例如通过手术、化学疗法和/或放射疗法来治疗患者。在预防性治疗的情况下,尚未发展成结肠癌但被认为后续具有发展成疾病的风险增加的患者,可以接受包含相关细菌物种的一种或多种调节剂(抑制剂和/或激活剂)的药物。
用于进行分析以确定特定细菌DNA或RNA水平的试剂盒,通常包括至少一种可用于与靶DNA或RNA序列或其互补序列的至少一个区段特异性杂交的寡核苷酸。任选地,用可检测的部分标记这一寡核苷酸。在一些情况下,试剂盒可以包括至少两个能用于通过PCR(包括通过RT-PCR)扩增靶细菌DNA或RNA的至少一个区段的寡核苷酸引物。
用于进行分析以确定细菌蛋白质水平的试剂盒,通常包括至少一种可用于与所述蛋白质特异性结合的抗体。任选地,用可检测的部分标记所述抗体。抗体可以是单克隆抗体或多克隆抗体。在一些情况下,试剂盒可以包括至少两种不同的抗体,一种用于与靶细菌蛋白特异性结合(即一抗),另一种用于一抗的检测(即二抗),二抗通常与可检测的部分连接。
通常,试剂盒还包括合适的标准对照。标准对照指示既未患结肠癌也不具有发展成结肠癌的任何增加的风险的健康受试者粪便中发现的所选细菌DNA、RNA或蛋白质的平均水平。在一些情况下,可以以设定值的方式提供此类标准对照。此外,本发明的试剂盒可以提供说明书手册,以指导使用者分析测试样品和评价测试受试者中结肠癌的存在或风险。
在另一方面,还可以在一种装置或包括一个或多个这种装置的系统中实施本发明,所述装置或系统能实施本文所述的所有或部分方法步骤。例如,在一些情况下,在收到粪便样品、评价发展成结肠癌的风险、或监测病况的进展后,所述装置或系统执行以下步骤:(a)确定样品中相关细菌物种的量或水平(例如,以测量指示细菌物种的细菌DNA、RNA或蛋白质的量或水平的方式);(b)将所述量或水平与标准对照值进行比较;以及(c)提供指示如下的结果:受试者中是否存在结肠癌、或受试者是否具有将来发展成结肠癌的风险、或受试者结肠癌病况是否有变化(即,恶化或改善)、或患者是否具有增加的复发结肠癌的可能性(例如在初始诊断和/或治疗后)。在其它情况下,在进行步骤(a)且将来自(a)的量或浓度输入所述装置之后,本发明的装置或系统执行步骤(b)和(c)的任务。优选地,所述装置或系统是部分或完全自动化的。
实施例
提供以下实施例仅用作说明而不是限制。本领域技术人员将容易地认识到,可以改变或修改各种非关键参数,以产生基本相同或相似的结果。
用于本研究的引物和探针的列表
Figure GDA0003521621830000331
Figure GDA0003521621830000341
Figure GDA0003521621830000351
使用克拉鲁斯拟杆菌、肠道罗斯氏菌、哈撒韦梭菌、M7和核梭杆菌作为CRC的粪便标志物
肠道微生物群是结肠直肠癌(CRC)发展中的重要病因学因素。本研究的目的是通过宏基因组测序来评估新鉴定的粪便细菌标志物候选物对CRC诊断的效用。在本研究中,通过双重定量PCR(qPCR)分析,在来自两个独立群组的439个受试者(203个CRC和236个健康受试者)的粪便样品中,对五种细菌的丰度进行定量。通过双重qPCR,在203个CRC患者和236个健康对照的粪便样品中,检查通过宏基因组测序鉴定的候选物(包括核梭杆菌(Fn)、克拉鲁斯拟杆菌(Bc)、肠道罗斯氏菌(Ri)、哈撒韦梭菌(Ch)和一种未定义的物种(标记为m7))。通过qPCR分析和宏基因组学方法,在各个候选物的定量之间证明了强的正相关性(r=0.801~0.934,全部P<0.0001)。在五个候选者中,CRC中的Fn丰度显著高于对照(P<0.0001),接受者操作曲线下面积(AUROC)为0.868(P<0.0001)。在最佳截断值,在群组I中,Fn将CRC与对照相区分,灵敏度为77.7%,特异性为79.5%。在群组I中,与单独Fn相比,四细菌(Fn、Bc、Ch和m7)的简单线性组合显示出改善的诊断能力(AUROC=0.886,P<0.0001)。这些发现也在独立群组II中得到证实。特别地,在与粪便免疫化学测试(FIT)组合以检测CRC时,实现了改善的单独Fn(灵敏度为92.8%,特异性为79.8%)和四细菌(灵敏度为92.8%,特异性为81.5%)的诊断性能。总之,本研究提供了基于粪便的CRC相关的细菌可作为CRC的新型非侵入性诊断生物标志物的证据。
引言
结肠直肠癌(CRC)是全世界最常见的恶性肿瘤之一。包括中国在内的许多亚洲国家在过去十年中CRC发病率增加了2至4倍(1)。肠道微生物群组成的异常,已被认为是在CRC起始和发展中潜在的重要病因学因素(2)。随着宏基因组测序和焦磷酸测序在肠微生物群研究中的广泛应用,越来越多的细菌已被确定与CRC的发病率呈正相关(3-7)。最近的研究表明,梭杆菌(尤其是核梭杆菌(Fn))与CRC相关。Fn在CRC患者的粪便和结肠粘膜中富集(3,5,8),并在结肠直肠癌发生中起重要作用(9,10)。在最近的研究中,在结肠直肠肿瘤发生的不同期,使用16SrRNA测序对人肠道粘膜中的微生物群落进行分类,还发现了梭杆菌在结肠直肠肿瘤中富集(11)。然后,通过使用宏基因组学分析,比较74个CRC患者和54个健康受试者的粪便微生物组,发明人已经鉴定了可以用作CRC的非侵入性生物标志物的细菌候选物(12),这包括Fn、克拉鲁斯拟杆菌(Bc)、肠道罗斯氏菌(Ri)、哈撒韦梭菌(Ch)、一种未定义的物种(标记为m7)。与Fn不同,其它细菌尚未与CRC相关。此外,将这些细菌候选物转化应用为诊断生物标志物,需要使用简单、具有成本效益和靶向的方法(如定量PCR(qPCR))的进一步研究。
在该研究中,在203个CRC患者和236个对照受试者的大群组中,验证了基于粪便的细菌候选标志物,以鉴定作为CRC的新型诊断工具的、具有良好灵敏度和特异性的一组标志物。发明人建立了用于定量细菌的基于探针的双重qPCR分析;与目前可用的测试相比,所涉及的技术易于实施且成本更低。
方法
人类粪便样品收集
粪便样品(n=439)收集自两个独立的群组,所述群组包括群组I-香港:370个受试者,其由170个CRC患者(平均年龄67.2±11.6岁;100个男性和70个女性)和200个正常对照(59.3±5.8岁;77个男性和123个女性)组成,2009年至2013年间在香港中文大学的威尔斯亲王医院(the Prince of Wales Hospital)(补充表1),以及群组II-上海:69个受试者,其由33个CRC患者(平均年龄63.4±9.6岁;17个男性和16个女性)和36个正常对照(53.2±12.2岁;10个男性和26个女性)组成,2014年至2015年间在上海交通大学的仁济医院(RenjiHospital)(补充表1)。用以收集粪便样品所招募的受试者包括呈现诸如肠习惯改变、直肠出血、腹痛或贫血症状的个体,以及如先前宏基因组学研究中进行了结肠镜筛查的年龄50岁或以上的无症状个体(12)。在结肠镜筛查前或结肠镜筛查后一个月收集样品,此时肠道微生物组应恢复到基线(13)。排除标准是:1)在过去3个月内使用抗生素;2)素食饮食;3)在过去3个月内有侵入性医疗干预;4)具有任何癌症或肠炎性疾病的既往病史。要求受试者于家中在标准化容器内收集粪便样品,并立即将样品存储在其家用-20℃冷冻箱中。然后将冷冻样品置于绝缘聚苯乙烯泡沫容器中并递送到医院,并立即储存在-80℃直到进一步分析。通过结肠镜检查和任何所进行的活组织检查的组织病理学检查来诊断患者。从所有受试者获得知情同意书。研究获得香港中文大学临床研究伦理委员会和上海交通大学仁济医院伦理委员会的批准。
DNA提取
将粪便样品在冰上解冻,并使用QIAamp DNA Stool Mini Kit,按照制造商的说明书(Qiagen,Hilden,Germany)进行DNA提取。然后用无DNA酶的RNA酶处理提取物以消除RNA污染。使用NanoDrop2000分光光度计(Thermo Fisher Scientific,Wilmington,DE),测定DNA的质量和数量。
引物和探针的设计
基于细菌16S rRNA基因中的保守片段,人工设计用于内部对照的引物和探针序列(14),然后使用PrimerExpress v3.0工具(Applied Biosystems,Foster City,CA)测试它们,用于确定Tm、GC含量和可能的二级结构。简并位点包括在引物和探针中以增加靶标覆盖;简并位点不接近引物的3'末端和探针的5'末端。扩增子靶标是对应的大肠杆菌基因组的nt1063-1193。
选择通过先前宏基因组测序所鉴定的五个细菌标志物候选物用于qPCR定量,包括核梭杆菌(Fn)、克拉鲁斯拟杆菌(Bc)、肠道罗斯氏菌(Ri)、哈撒韦梭菌(Ch)、一种未定义的物种(标记为m7)(补充表2)。使用在一个先前的宏基因组研究中以结肠镜检查作为分层因素的封闭的独立Wilcoxon秩和检验,通过消除结肠镜检查的混杂效应来鉴定这些候选者(12)。Fn也已经被其他人鉴定为在CRC患者中富集(3,5,8),而其他研究者认为其它四种与CRC没有关联。使用PrimerExpress设计靶向Fn的nusG基因(登录号#GMHS-1916)和我们先前的基因组测序研究中鉴定的基因标志物(包括Bc(ID m370640)、Ch(ID m2736705)、Ri(IDm181682)和m7(ID m3246804))的引物和探针序列(12)。引物-探针组特异性检测出预期靶标,而不检测由Blast搜索确认的任何其它已知序列。各个探针携带有5'报告染料FAM(6-羧基荧光素)或VIC(4,7,2'-三氯-7'-苯基-6-羧基荧光素)和3'淬灭染料TAMRA(6-羧基四甲基-罗丹明)。引物和水解探针由Invitrogen(Carlsbad,CA)合成。引物和探针的核苷酸序列列于补充表3中。通过PCR产物的直接Sanger测序,或通过对随机挑选的TA克隆测序,来确认PCR扩增的特异性。
定量PCR(qPCR)
在粘合密封的MicroAmp快速光学96孔反应板(Applied Biosystems)中,在含有0.3μM的各个引物和0.2μM的各个探针的20μL的TaqMan Universal Master Mix II(Applied Biosystems)的反应体系中,进行qPCR扩增。ABI PRISM 7900HT序列检测系统的热循环仪参数为,95℃10分钟和(95℃15秒,60℃1分钟)×45个循环。在每个实验中都包括阳性/参考对照和阴性对照(H2O作为模板)。对每个样品进行三次重复测量。对于所有临床样品,使用序列检测软件(Applied Biosystems),并人工设置阈值=0.05且基线从3-15个循环来分析qPCR数据。如果它们的阴性对照Cq值<42,则实验不合格。根据ΔCq法进行数据分析,其中ΔCq=Cq靶标-Cq对照,且丰度=POWER(2,-ΔCq)。
粪便免疫化学测试(FIT)
如前所述,使用由中国国家食品药品管理局认证的HemoSure免疫金标记的FIT浸渍条(WHPM Co.Ltd,北京,中国)(15)。
统计分析
数值适当地都表示为平均值±SD或中值(四分位间距[IQR])。通过Wilcoxon符号秩检验或Mann-Whitney U检验,确定特异性的细菌丰度的差异。通过T检验比较连续的临床和病理变量,而通过卡方检验比较分类变量。使用斯皮尔曼(Spearman)相关系数,以估计细菌丰度和若干感兴趣的因素的关联。使用单变量和多变量线性回归,估计与CRC诊断独立相关的因素。使用接受者操作特征(ROC)曲线,以评估细菌候选物在区分CRC中的诊断价值。应用逻辑回归模型以获得用于估计在所有受试者中CRC发生率的概率图值。然后构建逻辑回归模型的ROC曲线。通过Graphpad Prism 5.0(Graphpad Software Inc.,San Diego,CA)或SPSS软件v17.0(SPSS,Chicago,IL)进行所有测试。将P<0.05视为统计学显著。
结果
方便且可靠地定量细菌丰度的双重qPCR分析
为了便于定量细菌含量,发明人设计了简并引物-探针(VIC标记的)组,其扩增子大小适用于靶向16S rRNA基因的131-bp保守区域的qPCR定量。在核糖体数据库项目版本10.8中,引物和探针序列覆盖了大于90%的真细菌群体(14)。使用不同粪便DNA样品的测试表明,这一内部对照分析能够在终反应体系中,以小于10ng/μL的DNA模板评估总细菌(图1a)。较高的模板浓度抑制PCR扩增,这可能是由于从粪便中分离出的DNA中的常见杂质,这是因为从培养的大肠杆菌中提取的纯的总DNA,达到至少25ng/μL都没有观察到抑制。使用浓度小于10ng/μL的模板,Cq值与Log2 DNA量良好相关(R=0.804)(图1b)。然后使用VIC标记的内部对照和FAM标记的引物-探针组开发双重qPCR分析,以便特异性靶向细菌候选物。可以用小于10ng/μL的模板一致地定量单个样品中靶细菌的相对丰度(图1c),但模板浓度应当大于0.1ng/μL以避免在具有低丰度靶细菌的样品中的假阴性结果(图1d)。使用发明人的qPCR分析进行细菌丰度的定量,可以很好地重复(图6),并且不受人类DNA污染的干扰(图7)。这一平台和明确的实验条件,可以保证使用双重qPCR分析来可靠且方便地定量细菌靶标。
通过宏基因组学方法对各个细菌候选物的定量与qPCR分析相关
为了验证通过qPCR分析测量的基因丰度是否与宏基因组学测序具有可比性,将通过qPCR的受试者亚组(51个CRC和45个对照)中四种细菌候选物(Bc、Ch、Ri和m7)的丰度与宏基因组测序相比较。通过qPCR分析与宏基因组测序相比较,这些细菌中每一种的定量都显示出强相关性(Spearman R=0.816-0.934;图2a)。来自Fn的基因标志物丁酰辅酶A脱氢酶(m1704941;99.13%同一性),在CRC患者中显示出仅2.7%的发生率(74个中的39个);而在物种水平上,Fn在CRC患者中显示出83.8%的发生率(74个中的62个)(补充表4),这推断出对于CRC的诊断而言,在物种水平上Fn好于基因标志物m1704941。因此,发明人建立了靶向Fn的nusG基因(据报道,其在结肠直肠肿瘤中比在匹配的正常样品中转录更有活性(5))的双重qPCR分析,以评估Fn对于CRC的诊断价值。通过宏基因组测序,这一qPCR分析显示出在物种水平上与Fn的良好相关性(图2b),这表明靶向nusG的qPCR可以覆盖更多的Fn株,并且可以在检测CRC中更灵敏。
与健康对照相比,在CRC患者中,Fn、Ch和m7的丰度显著升高,且Bc和Ri的丰度降低
通过qPCR定量,与健康对照(n=200)(P<0.0001;图3a和表1)相比,CRC患者(n=170)中粪便Fn的丰度明显更高。此外,与对照受试者相比,CRC患者中Ch(P<0.0001)和m7(P<0.0001)的丰度显著升高,且Bc(P<0.05)和Ri(P<0.05)的丰度降低。双变量相关性检验显示出,所有五种细菌的丰度与CRC显著相关,但与肿瘤-淋巴结-转移(TNM)分期或肿瘤位置无关(表2)。这五种细菌的发生率,在CRC患者与健康对照受试者之间显著不同(补充表5)。这些结果共同证实了,这些细菌标志物候选物在将CRC患者与健康受试者相区分中的潜力。
Fn是用于诊断CRC患者的潜在的非侵入性粪便生物标志物
在所有五种细菌中,Fn在区分CRC与健康对照中表现出最佳的性能,接受者操作曲线下的面积(AUROC)为0.868(0.831-0.904,95%置信区间;P<0.0001)(图3b)。在使灵敏度和特异性之和最大化的最佳截断值,在170个CRC患者和200个健康受试者的第一群组中,Fn可以将CRC与对照相区分,灵敏度为77.7%,特异性为79.5%,阴性预测值(NPV)为80.7%,且阳性预测值(PPV)为76.3%。这在33个CRC患者和36个健康对照的第二独立群组中得到了进一步验证。与健康对照相比,CRC患者中的Fn丰度显著更高(P=0.012)(图3c)。作为区分CRC患者与对照受试者的单一因素,粪便Fn的AUROC为0.675(0.545-0.804;P=0.013)。在第二群组中,Fn的最佳截断值可以区分CRC与对照,灵敏度为81.8%,特异性为52.8%,NPV为76.0%,PPV为61.4%。
Fn、m7、Bc和Ch的组合改善了单独Fn对CRC患者的诊断能力
线性回归分析显示出,Fn、m7和Bc的丰度与CRC诊断显著相关(所有P<0.05),且Ch的丰度与CRC略微相关(P=0.073),而Ri的丰度与CRC之间的关联不显著(表3)。因此,评估三种(Fn、m7和Bc)或四种(Fn、m7、Bc和Ch)细菌用于诊断CRC的能力。在第一群组中发现,与三细菌(0.877)、单独Fn(0.868)以及包括所有四种细菌的逻辑回归模型(0.869)相比,四细菌的简单线性组合(0.886)使AUROC增加(图4a)。与健康对照相比,CRC患者中四细菌的组合丰度显著更高(P<0.0001)(图4b)。在最佳截断值,这组四细菌(Fn、m7、Bc和Ch)可以区分CRC患者和健康对照,灵敏度为77.7%,特异性为81.5%,NPV为81.1%,PPV为78.1%,其比单独Fn表现出更好的诊断性能(表4)。在第二独立群组中,进一步验证了四细菌的改善的性能。与三细菌(0.731)、单独Fn(0.675)或逻辑回归模型(0.746)相比,四细菌的组合还表现出增加的AUROC(0.756)(图4c)。CRC患者中四细菌的组合丰度显著高于健康对照(P=0.0002)(图4d)。在最佳截断值,这组细菌可以区分CRC与对照,灵敏度为84.9%,特异性为61.1%,NPV为81.5%,PPV为66.7%,这也显示出比单独Fn更好的诊断性能。因此,在区分CRC与健康对照时,Fn、m7、Bc和Ch的细菌组可以提高单独Fn的诊断能力。
细菌标志物与FIT的组合改善了单独细菌对CRC患者的诊断能力
对111个CRC患者和119个对照受试者的粪便样品进行FIT。发现70.3%(78/111)的CRC患者的粪便样品显示出FIT阳性。在此CRC患者的亚群组中,FIT的检测率小于单独Fn(82.0%)或四细菌组(83.8%)(通过卡方,两者均P<0.05)的定量。FIT与TNM分期略微相关(P=0.084),而四细菌或单独Fn的丰度与TNM分期不相关(补充表6)。根据TNM期亚群,癌症检测的比较结果证明,与I期癌症的FIT相比,细菌标志物的定量显示出显著更高的灵敏度(图5)。还观察到相比通过FIT,通过细菌对II期和III期癌症的检测率更高,但对晚期IV期癌症则并非如此。这些结果表明,对于CRC(尤其是对于早期CRC)的检测,细菌标志物的定量比FIT显著更灵敏。
细菌标志物与FIT的组合显著地将Fn的灵敏度从82.0%提高至92.8%,将四细菌的灵敏度从83.8%提高至92.8%,随之改善PPV和NPV并几乎不改变特异性(表5)。根据TNM分期,对于I、II和III期癌症,相比单独使用FIT,细菌标志物与FIT的组合显示出显著更高的灵敏度(图5)。这些结果表明,对于CRC患者的非侵入性诊断价值而言,细菌标志物和FIT的组合具有最佳的灵敏度和特异性。
讨论
根据最新的对于CRC筛选的亚太共识性建议,将FIT应用于选择结肠镜检查高风险的患者(16)。FIT已广泛应用于世界其它地区(17)。然而,根据Lee等人最近的系统性综述和元分析,FIT的灵敏度在CRC中受限[0.79(95%CI,0.69至0.86)],并且在各种研究中存在很大差异(17)。然而,FIT的广泛应用使得容易获得粪便样品。在粪便样品中检测分子生物标志物用于非侵入性诊断CRC,这可能是比在目前临床中实施的血液/血浆生物标志物更有前途的一种替代。随着焦磷酸测序和宏基因组测序在微生物群领域的广泛应用,越来越多的CRC相关细菌被确定,其中包括发明人所确定的那些(12)。迫切需要验证这些候选标志物,并通过靶向定量方法来评估其临床应用价值。
为了开发方便且可靠的用于针对细菌候选物的有效性和潜在的临床实施来靶向定量细菌候选物的方法,建立了用于在粪便样品中定量的qPCR平台。基于可获得的所有16SrRNA基因的保守序列,设计靶向16S rRNA基因的引物-探针组(14),以保证足够的覆盖并适合于qPCR的扩增子大小(小于150bp)。这一内部对照被证实能很好地代表不同样品中的细菌DNA含量。然后,基于探针的双重qPCR分析允许在各个样品的相同反应中检测内部对照和靶标,以节省试剂和样品,并产生更可靠的数据。通过ΔCp法计算相对于总细菌含量的靶标志物丰度。本发明人首次定义了应受限制的DNA模板浓度(小于10ng/μL)以避免由粪便DNA引起的抑制效应,且大于0.1ng/μL以避免使用发明人的双重qPCR分析的靶标的假阴性评估。通过宏基因组学方法和qPCR分析,在细菌候选物的定量中进一步显示出良好的相关性。因此,双重qPCR分析是可靠且方便的,并且在靶细菌的定量检测中具有极大的临床应用价值。
使用这一平台,进一步证实了Fn作为用于基于粪便的CRC诊断的生物标志物的潜在价值。CRC患者中粪便Fn的丰度显著高于健康对照受试者。作为区分CRC患者与健康受试者的单一因素,在170个CRC患者和200个健康对照受试者的第一群组中,Fn具有77.7%的灵敏度和79.5%的特异性。还显示出,相比对照受试者,CRC患者中Bc、Ri、Ch和m7的粪便丰度显著增加或减少,这与宏基因组学研究的结果相一致。尽管由于CRC患者或对照受试者中的发生率受限,这些单个细菌的区分CRC患者与健康受试者的能力受到限制,但发现将Bc、Ch和m7的丰度与Fn的丰度组合,可以改善Fn对CRC的诊断能力。Ri的丰度没有提高Fn对CRC的诊断能力,并且其在进一步的分析中被排除。在使灵敏度和特异性之和最大化的最佳截断值处,在370个受试者的第一群组中,组合的四细菌组具有77.7%的灵敏度和81.5%的特异性。重要的是,还在CRC患者和健康对照的粪便样品的第二独立群组中,验证了用于诊断CRC的Fn和四细菌标志物的组合(Fn、Bc、Ch和m7)。
与FIT相比,发现细菌标志物在CRC(尤其是早期CRC)诊断的灵敏度上更为优越。令人感兴趣的是,在II期和III期中的16个和15个样品分别在细菌标志物或FIT中显示出阳性(补充表7),总计达到II期和III期案例的36.5%。结合在细菌标志物和FIT中显示为阳性的60%的案例(II:26/42和III:25/43),细菌与FIT的组合检测到了96.5%的II期和III期CRC。已显示,宏基因组分析与标准粪便隐血试验(FOBT)的结合改善了CRC检测的灵敏度(18)。因此,可以预期,在CRC的非侵入性诊断中,细菌标志物定量分析与广泛应用的FIT的结合,可以提高诊断灵敏度。
Bc是2010年从人类粪便中分离的革兰氏阴性、专性厌氧、非孢子形成的棒状细菌物种(19)。Ch是严格缺氧、革兰氏阳性、孢子形成的杆状细菌,其使用碳水化合物作为可发酵底物参与葡萄糖代谢,以产生乙酸盐、乙醇、二氧化碳和氢(20)。与已知促进CRC肿瘤发生的得到良好表征的Fn不同,Ri、Bc或m7的丰度改变是否在CRC发展中起致病作用或是否是CRC发生的结果,需要进一步研究。
总之,单独Fn的定量可以作为具有中等灵敏度和特异性的CRC的非侵入性诊断方法。四种细菌标志物(Fn、Bc、Ch和m7)的组合,改善了单独Fn对CRC的诊断能力。此外,细菌标志物和FIT的组合,对CRC(尤其是对早期CRC)诊断显示出最佳的灵敏度和特异性。因此,基于粪便的细菌标志物检测,可作为CRC患者的新型非侵入性诊断方法。
表1.CRC患者和健康对照受试者粪便样品中的细菌候选物的丰度
Figure GDA0003521621830000451
注:*Fn,核梭杆菌(Fusobacterium nucleatum);Ch,哈撒韦梭菌(Clostridiumhathewayi);m7,未知物种的内部标签;Bc,克拉鲁斯拟杆菌(Bacteroides clarus);Ri,肠道罗斯氏菌(Roseburia intestinalis);**n=370(170个CRC和200个健康对照)
表2.显示出细菌候选物和CRC患者之间的相关性的双变量相关性分析
Figure GDA0003521621830000452
注:*Fn,核梭杆菌;Ch,哈撒韦梭菌;m7,未知物种的内部标签;Bc,克拉鲁斯拟杆菌;Ri,肠道罗斯氏菌;**n=170
表3.细菌丰度和CRC状态的单变量线性回归分析
细菌* 系数 95%置信区间 P值
Fn 0.13 0.093-0.167 <0.001
Ch 0.035 (-0.003)-0.073 0.073
m7 0.016 0-0.032 0.043
Bc -0.005 (-0.010)-0.001 0.019
Ri -0.002 (-0.007)-0.004 0.520
注:*Fn,核梭杆菌;Ch,哈撒韦梭菌;m7,未知物种的内部标签;Bc,克拉鲁斯拟杆菌;Ri,肠道罗斯氏菌
表4.单独Fn和与其它细菌的组合用于CRC诊断的性能
变量 Fn Fn、Bc、Ch和m7的组合
AUROC 0.868 0.886
截断 0.0007072 0.001774
灵敏度 77.7% 77.7%
特异性 79.5% 81.5%
PPV 76.3% 78.1%
NPV 80.7% 81.1%
注:采用使灵敏度和特异性最大化的最佳截断值
PPV,阳性预测值;NPV,阴性预测值;AUROC,接受者操作特征曲线下面积。
n=370(170个CRC和200个健康对照)。
Fn,核梭杆菌;Ch,哈撒韦梭菌;m7,未知物种的内部标签;Bc,克拉鲁斯拟杆菌;Ri,肠道罗斯氏菌
表5.FIT或单独Fn和与其它细菌的组合用于CRC诊断的性能
变量 FIT Fn Fn+FIT 四细菌 四细菌+FIT
灵敏度 70.3% 82.0% 92.8% 83.8% 92.8%
特异性 98.3% 80.7% 79.8% 83.2% 81.5%
PPV 97.5% 79.8% 81.1% 82.3% 82.4%
NPV 78.0% 82.8% 92.2% 84.6% 92.4%
注:包括在HK群组中的具有FIT结果的230个受试者(111个CRC和119个健康对照)。
PPV,阳性预测值;NPV,阴性预测值;AUROC,接受者操作特征(ROC)曲线下的面积。四细菌包括Fn、Bc、Ch和m7。
补充表1:健康受试者和结肠直肠癌患者的临床特征
Figure GDA0003521621830000481
CRC,结肠直肠癌;FIT,粪便免疫化学测试;BMI,体重指数;TNM,肿瘤-淋巴结-转移
*通过卡方的性别;通过T-检验的年龄和BMI
#由于大多数的CRC案例是中度分化的,分化状态不包括在进一步的分析中。
补充表2:用于本研究的引物和探针
Figure GDA0003521621830000482
*根据采用Benjamini-Hochberg校正的Wilcoxon秩和检验,与CRC相关的MLG物种具有q<0.05的显著水平。对于未定义的物种“m7”,不能计算物种的秩平均值,因此,所示的p值和q值是基于基因标志物“3246804”。
补充表3:用于本研究的引物和探针
Figure GDA0003521621830000491
补充表4:通过宏基因组测序的CRC患者粪便样品中的m1704941(基因标志物水平,99.13%同一性)和核梭杆菌(物种水平)的丰度
Figure GDA0003521621830000492
Figure GDA0003521621830000501
补充表5:CRC患者和健康对照受试者粪便样品中的细菌候选物的发生率
细菌 CRC中的发生率 对照中的发生率 P值(x2)
核梭杆菌(Fn) 98.2% 72.0% <0.0001
哈撒韦梭菌(Ch) 35.3% 8.0% <0.0001
m7 53.5% 37.0% 0.001
克拉鲁斯拟杆菌(Bc) 12.9% 21.5% 0.031
肠道罗斯氏菌(Ri) 22.9% 36.0% 0.006
补充表6:细菌丰度、FIT与CRC诊断和分期的相关性
Figure GDA0003521621830000511
包括了具有粪便免疫化学测试(FIT)结果的230个受试者(111个CRC和119个健康对照)的亚群
补充表7:将细菌标志物和FIT组合用于诊断
Figure GDA0003521621830000521
在具有170个CRC和200个对照的较大群组中确定使灵敏度和特异性最大化的最佳截断值(Fn=0.0007072;4-标志物=0.001774)。
参考文献
1.Sung JJ,Lau JY,Goh KL,et al.Increasing incidence of colorectalcancer in Asia:implications for screening.Lancet Oncol 2005;6:871-6.
2.Irrazabal T,Belcheva A,Girardin SE,et al.The multifaceted role ofthe intestinal microbiota in colon cancer.Mol Cell 2014;54:309-20.
3.Ahn J,Sinha R,Pei Z,et al.Human gut microbiome and risk forcolorectalcancer.J Natl Cancer Inst 2013;105:1907-11.
4.Kassinen A,Krogius-Kurikka L,Makivuokko H,et al.The fecalmicrobiota of irritable bowel syndrome patients differs significantly fromthat of healthy subjects.Gastroenterology 2007;133:24-33.
5.Castellarin M,Warren RL,Freeman JD,et al.Fusobacterium nucleatuminfection is prevalent in human colorectal carcinoma.Genome Res2012;22:299-306.
6.Qin J,Li Y,Cai Z,et al.A metagenome-wide association study of gutmicrobiota in type 2diabetes.Nature 2012;490:55-60.
7.Shin NR,Lee JC,Lee HY,et al.An increase in the Akkermansiaspp.population induced by metformin treatment improves glucose homeostasis indiet-induced obese mice.Gut 2014;63:727-35.
8.McCoy AN,Araujo-Perez F,Azcarate-Peril A,et al.Fusobacterium isassociated with colorectal adenomas.PLoS One 2013;8:e53653.
9.Kostic AD,Chun E,Robertson L,et al.Fusobacterium nucleatumpotentiates intestinal tumorigenesis and modulates the tumor-immunemicroenvironment.Cell Host Microbe 2013;14:207-15.23
10.Rubinstein MR,Wang X,Liu W,et al.Fusobacterium nucleatum promotescolorectal carcinogenesis by modulating E-cadherin/beta-catenin signaling viaits FadA adhesin.Cell Host Microbe 2013;14:195-206.
11.Nakatsu G,Li X,Zhou H,et al.Gut mucosal microbiome across stagesof colorectal carcinogenesis.Nat Commun 2015;6:8727.
12.Yu J,Feng Q,Wong SH,et al.Metagenomic analysis of faecalmicrobiome as a tool towards targeted non-invasive biomarkers for colorectalcancer.Gut 2015:Sep 25.pii:gutjnl-2015-309800.
13.Jalanka J,Salonen A,Salojarvi J,et al.Effects of bowel cleansingon the intestinal microbiota.Gut 2015;64:1562-8.
14.Wang Y,Qian PY.Conservative fragments in bacterial 16S rRNA genesand primer design for 16S ribosomal DNAamplicons in metagenomic studies.PLoSOne 2009;4:e7401.
15.Huang Y,Li Q,Ge W,et al.Predictive power of quantitative andqualitative fecal immunochemical tests for hemoglobin in population screeningfor colorectal neoplasm.Eur J Cancer Prev 2014;23:27-34.
16.Sung JJ,Ng SC,Chan FK,et al.An updated Asia Pacific ConsensusRecommendations on colorectal cancer screening.Gut 2015;64:121-32.
17.Lee JK,Liles EG,Bent S,et al.Accuracy of fecal immunochemicaltests for colorectal cancer:systematic review and meta-analysis.Ann InternMed 2014;160:171.
18.Zeller G,Tap J,Voigt AY,et al.Potential of fecal microbiota forearly-stage detection of colorectal cancer.Mol Syst Biol 2014;10:766.24
19.Watanabe Y,Nagai F,Morotomi M,et al.Bacteroides clarus sp.nov.,Bacteroides fluxus sp.nov.and Bacteroides oleiciplenus sp.nov.,isolated fromhuman faeces.Int J Syst Evol Microbiol 2010;60:1864-9.
20.Steer T,Collins MD,Gibson GR,et al.Clostridium hathewayi sp.nov.,from human faeces.Syst Appl Microbiol 2001;24:353-7.
本申请所引用的所有专利、专利申请和其它出版物(包括GenBank登录号),出于所有目的通过引用以其整体并入本文。
序列表
<110> 香港中文大学
<120> 结肠直肠癌的粪便细菌标志物
<130> 17C10328CN
<150> US 62/379,635
<151> 2016-08-25
<160> 86
<170> SIPOSequenceListing 1.0
<210> 1
<211> 1062
<212> DNA
<213> 肠道罗斯氏菌(Roseburia intestinalis)
<400> 1
atggaaaaag taaaggcatt ttgtaaacgg aaaaacattg agatatccgt caagcgctac 60
ctgattgatg cacttggtgc gatggcacag ggattatttg catcgctttt gatcggaacg 120
atcatcagta cacttggaac gcagcttaat attccgattc ttgtgacagt cgggacttac 180
gcgaaagcgg cagtcggacc ggcaatggcg atcgcaatcg gatatgcact gcaggcagcg 240
cctttagtac tgttttcact tgcggcagtc ggtgcggcgg caaatgaact tggcggggca 300
ggcggaccgc ttgcggtact tgtggttgca atttttgcag cagaatttgg aaaagcagtt 360
tccaaagaga caaaaatcga tattattgtc actccgtttg tgaccatttt tgtcggggtc 420
gcgctttcta tctggtgggc tccggcgatc ggtgcggcag cgagtgcagt cggtaatgcg 480
atcatgtggg caaccgagct gcagccgttt ttcatgggaa tcattgtatc tgtgatcgtc 540
gggattgcac tgacactgcc gatcagcagc gcagcaatct gtgcagcact tggactgacc 600
ggattagccg gtggtgcagc acttgccgga tgctgtgcgc agatggtcgg atttgcagtg 660
gcaagtttcc gtgaaaataa atggggcgga ttgtttgcac agggaatcgg tacatccatg 720
cttcagatgg gtaatatcgt gaaaaatccg cgcatctggc tgccggcgac attggcgtct 780
gcaatcaccg gaccgatcgc aatgtgtctg ttccatttac agatgaatgg tgcagcagtt 840
tcctccggta tgggaacctg tggactggtc ggacagattg gtgtctatac gggatggatc 900
gcagatattg aagcgggaag caaagctgcc attacaccga tggactggat cggactgatt 960
ttcgtaagct ttcttctgcc gggcgtttta tcatggcttt ttagtgtgtt attccgtaag 1020
atcggctgga tcaaagaagg cgatatgagg ctggacttat aa 1062
<210> 2
<211> 1161
<212> DNA
<213> 克拉鲁斯拟杆菌(Bacteroides clarus)
<400> 2
atgaaaatca aacaattagc gaaaagcgca tcattcttgc tggtggcagg ttttatcagt 60
tttactattc cgtcgtgtag cagtgaagaa gaaatcatca tccttcagga tgtaaaagta 120
aacagtgaaa gcttcaatct ggccgaagac ggcagtacga ccatagaagt caaggtagta 180
cccgaaaata ctccaatagc caaagccgta ctcagcacat cattatttaa tgaaagcggt 240
gttttcgaag taacccgact cactcccaaa ggtaacggtg tatggcagat agcagcaaaa 300
gtaaaggact tctcacgcat tcaaaacggt caggacgtaa tactttccgt ctatcaggaa 360
gataatatgt atatccaaac cacattgaaa ataaacgacc catatagcat cgagggtaaa 420
tatacaccgg tccatccgca agcctttact ttctacagtg ccgaagacgg caaactgatg 480
gagattccgt tcatcatcac agccgacaac gcagccgacc ttgccgccat cagctacgac 540
aatataaagg tagtcaatgg caccggaagc tctacaccca gcataagtat cacacatttc 600
gcaatagctc cgatgacagg taaaacaggc ttctatctgc aagtggataa cgcccaactc 660
gaaacggtaa aaaaagccat cacaaccatc gcttttttgg actgccgggt tatgataacc 720
ggccctaacg gccgtgttgc ctatactcct gtgcgcctca ttgtttcttc tccgaagtgc 780
atcatcaagg acgaccaact cagcctgctg catacagaat tgtccgcccc ggagtttaat 840
agacaaatca ccatagatat gacccacgat ttttatcgtt tgggcaaaca gaatgataaa 900
acaacctttg aggcgtttga aaaccgaggc ttgtataact cacaaggaga aatggcagat 960
gcagaccctc agttcatttc gttgggttat accactcagg gcaaaaatac aacatgtaac 1020
gtaactttaa aacatgatgc cacaattcct gcaatcggca cttaccacat ggtagaacgc 1080
ctaaaaggat attgggaata tgacggaaag aaatatccga ccgtttgtac agacctgcaa 1140
ttccaaatca cgattaaata a 1161
<210> 3
<211> 1935
<212> DNA
<213> 拉氏梭菌(Lachnoclostridium sp.)
<400> 3
aatatccgat atggcaacgg agctctggta gtagtccggg caagggaaaa ccttgtacat 60
ggcgaagcag agcagattac cttcaatact aaaatattag aaaggtgcgt gaggcatttg 120
agaaatccga ttgaagtatt gaaaactcta caagagaaag caggcaacga gaactatcaa 180
tttgaacgcc tgtaccgaaa tctgtacaac gaggagtttt tcctattggc atacggaaat 240
ctctctgcaa aagagggaaa tctgaccaag ggaacagacg gcgccacaat agacggaatg 300
ggaatggagc ggattcgcaa gctgattgaa agcctgcgga accacagtta ccagccgtcc 360
cctgcgagac gtgcctatat cccaaaatct aatggaaaac ggcgtccgtt aggcataccc 420
tctgttgacg ataagctggt gcaggaagtt gtgaggttaa ttctcgaaag tgtgtatgaa 480
agcaattttt ctgaacattc gcatggtttt agaccgaaca ggagctgtca cacggcactg 540
acccagattc aaagaaactt cacaggggtt aaatggttca ttgaggggga catcaaaggt 600
tattttgaca ccatcgacca ccatatcctt gtggatattt taagaaggcg cataaaggac 660
gaatacctaa tctcgctgat atggaaattt ctgaaagccg gatacttaga agactggaaa 720
ttcaatccta cctattccgg cactccgcaa ggctcggtca tcagtccaat acttgccaat 780
atctacctta acgaattcga tacctatgtt gaagaataca tagagaaatt caaccgtggt 840
aaaagacgtg aaagaaacag tgagtatcgc ttttatagtg atggcgcatc gaaactgagg 900
gtaaagtacc gcgggttatg ggaaataatg acagccgatg aaaaagaaaa agccaaatgt 960
gaagtaaatg agctcatgaa aaaagcaaaa cagattccag ctatgaatcc gatggacagc 1020
aattaccgcc gtctgctcta ttgcaggtat gcggatgatt ttatttgcgg agtaatcgga 1080
agcaaggaag atgcagaaac catcaaggct gattttagcc ggtacctgaa agaaaagctg 1140
ggactggata tgtcggaaga aaagacactg attacacact caaacgaaaa agcggcgttc 1200
cttggctacg aaatcgctgt ttccagaagc aatgaataca aaaagataag caacggacag 1260
aaggcaagaa cctttaatgg gcgtgttcat ctatttatgc cacataataa atgggttaag 1320
aagctgacca gttgcggagc aatggaaatc aaacagcagg acggcaaaga aatatggaaa 1380
ccgcaggcga ggaaagacct catcaacaaa gagccgattg aaatcctaag catttacaat 1440
gccgaaattc gtgggctgta caattattat tgtttggcaa gcaacgtatg caagctgcag 1500
aaatattact acatcatgga atacagcatg taccagacgt ttgcagcgaa gtaccgtgat 1560
aatttgcgga aaacgattaa caagcatacc cgaaacggcg tgtttggtgt cagctacact 1620
acaaaaaccg gcaacgagaa acgggcgaca ttcgtgaaag gaagcttcca aaaacggact 1680
gtcagcttag attacagtga tgaaatcccc tcttatcctg ccgcaaaata tagtcggaaa 1740
aacggcttaa ttgagcggtt acagggtgga aaatgtgaac tatgcggaca gcagaccgac 1800
aatgtaaaag ttcatcatgt caggaagctg aaagaattag ccggtatgaa agaatgggaa 1860
agaaaaatgg ttcagatgaa cagaaaaact ctggttgttt gtaatacatg ttatggaaac 1920
ataacaggca agtaa 1935
<210> 4
<211> 930
<212> DNA
<213> Parvimonas micra
<400> 4
aatcaattta gaattggttt atcaagaatg gagagagttg ttagagaaag aatgtcaact 60
caagatccag accttgctac gcctcaagga cttattaata taagacctct tgttgcgtct 120
ttaaaagaat tcttcggttc ttcacaatta tcacaattca tggatcaaaa caatccactt 180
gcagaactta ctcataagag aagattatca gcattaggac ctggtggtct tagtagagat 240
agagcaggat acgaagtaag agacgttcat gaaagtcact acggaagaat ttgtccgata 300
gaaactccag aaggtccaaa catcggtctt attacttctc ttacaactta tgcaagagtt 360
gatcaatatg gatttattga aacaccatat cgtgttgtaa ataatggaat tgctacaaag 420
gacattgttt atttaactgc tgatgaagaa gatgaagtta ttatcgctca agccaatgaa 480
ccacttgatg aaaatggacg ttttgtaaac gaaagagtaa gtggtcgtgg tattaatggc 540
gaaaatgata tttatccaag agatacaatt caacttatgg acgtttctcc tcaacaaatt 600
gtatcagttg gtacagcaat gattcctttc cttgaaaatg acgatgctac tcgtgcgttg 660
atgggttcaa acatgcaaag acaagcagtg cctctacttg ttactgaagc tcctattgta 720
ggaaccggta tagaacataa agcggcaaga gatagtggtg ttgttatcat tgctaaaaat 780
tcaggaattg ttacaaaagt tgatagtgat gaaattcata ttaaaagaga tttagataat 840
gtagttgata aatatagatt acttaaattt aaacgttcaa atcaaggaac aacaattaat 900
caaagaccta tagttaatga aaatgacaga 930
<210> 5
<211> 687
<212> DNA
<213> 核梭杆菌(Fusobacterium nucleatum)
<400> 5
tctgcaaaag aaaaagttgc tgcattagtt gctgcattaa aagcagatgg atatgatttt 60
actgttggta tccctcttga tacaccaata ggaaaatctg aaagagttgt aagtgctggt 120
aaagggattg gagataaaaa gaatatgaag ctaattgaaa acttagcaaa acaagctgga 180
gcttctattg gttcttctcg tccagtggca gaaacattgc aatatgtacc tcttgaccgt 240
tatgtaggaa tgtcaggaca aaaatttgtt ggaaaccttt atatagcttg tggaatttca 300
ggagctttac aacatttaaa aggaattaaa gatgcaacaa caatagttgc tataaataca 360
aactcaaatg ctccaatatt taagaatgca gactatggaa tagttggaga tttagcagaa 420
attttacctt tattaactaa ggaattagat aatggagaag ctaaaaaaga tgcaccacct 480
atgaagaaaa tgaagagagt tatacctaga gtagtgtata gtcctcatgt atatgtatgt 540
agtggttgtg gacatgaata caatcctgat ttaggagatg aagattctga cataaaacca 600
ggaactagat ttaaagattt accagaagat tggacttgtc ctgattgtgg agatccaaaa 660
tctggatata tagatgcaaa aaaataa 687
<210> 6
<211> 627
<212> DNA
<213> 哈撒韦梭菌(Clostridium hathewayi)
<400> 6
atgcctatac ttcagcagct tctcacatta gtagagcagc acttcggtaa caaatgcgaa 60
atcgtgcttc atgatctgac aaaggattac aaccatacca ttgtcgatat ccgaaacgga 120
gacattaccc atcgttccat cgggggctgc ggaagcaact tagggctgga agtcctgcgc 180
ggaaccgtgc tggatgggga tcgttttaac tatgttacca ccacacagga cggaaagatt 240
ctccgttcct catcgatcta tctaaaaaat gatcagggcg aggtcatcgg atcgatctgc 300
gtgaacctgg atatcacaga gacacttcag tttgaagggt atttacgcca gtttaaccag 360
tttgacagct ttacttccaa cgacgaggag attttcgctc ccgacgtgaa taatcttctc 420
agccatctga ttcagatggg acaggaacag atcggaaagc ctgcgctgga gatgaacaag 480
aacgagaaga ttgagtttat ccgtttcctt gaccagaaag gagcattcct catcacgaag 540
tccggggaac agatctgtga acttctggga atcagcaaat ttacctttta taattacctt 600
gaaagcagcc gcagccagtc ggattcg 627
<210> 7
<211> 1305
<212> DNA
<213> m7
<400> 7
atgttagcaa tcgtaggttt attaactatc ctggtcgtaa tgtttctgat tatgacaaaa 60
aaatgttcga ctctggtcgc actgattgca gttcccatga ttgcatgtgt tattgtgggt 120
cagggcgccg atatgggagg gtacataacg gccggtatca aaagtgtggc cgccaccgga 180
gtcatgttta tttttgcagt ggcctttttc ggtgtcatgg gtgatgtggg tgcatttgaa 240
atcgtagtga ataaaatact caggattatt gggaaagatc ctttgaaaat ctgtatcggc 300
acgctgatta tcacattgat gacccacctg gacggctccg gcgcaacgac atttttgatc 360
acaataccgg cgctgctgcc gatatacgat aaattgaaga tggatcggcg tgtgctggca 420
actatagtgg cggcaggagc aggaaccatg aatctcgtcc cttggggagg gccgacgatc 480
cgagcagcga cggcactgga ggtctcactg accgagcttt acaatcctat gattgtccct 540
cagctttgcg gagtcgccgc ctgcgtgaca gtggcggtga tgtttggcct gaaggaacgg 600
aaacgtttaa aagggactct ggaatctgtt tcggtagagc ctccgaaatt tgaggactta 660
ccggaggagg agagagtgaa acgccgtccc caccttgtct ggtttaacat tctgctcatt 720
atagttacaa ttgtgtcatt ggttatggag cttttgccgc cggccggctg ttttatggcg 780
gcgctgtgca tcgcaatgct ggttaactac cgtgatttaa aggatcaggg aaaacggatg 840
gacgagcatg cggtagcggc catgatgatg gcatccaccc tgtttggcgc aggctgcttt 900
accggtatcc tgggaggctg cggcatgctg gaagcgatgg cccagggact ctgtgatatt 960
ctcccggtag ccattatggg tcacattgcg attttggtgg cagttttctc catgcctctg 1020
tcgctgatgt tcgatccgga cagcttctac tatgcagtac ttccggtaat tgcagtggcg 1080
gccgaggtgg ccggtgttcc ggcattggca gtgggccgcg cggcgatatg cggacagatt 1140
actgttggat tccccatttc accactgact ccatccacct tccttctgac aggactaacg 1200
ggcgtggatc tcggggacca tcagaagcac agtttcgtgt ggctgtggct gatttccctg 1260
acgattgtgc tggttgccgt ggtgatgggc gtaattccgg tatag 1305
<210> 8
<211> 504
<212> DNA
<213> 未知(Unknown)
<400> 8
atggttgcac ttgtatggct actgattgaa atgaaatata aaatcagtgt cccatctcca 60
ctgttgctca gcatggttta caaacttttg cttccggcta tgcctgccta tcttctggct 120
aaaatcccct ctgggaaatt aacggccagc ttgagaagaa tgccgatttc tacccatatc 180
atgcttgtat tgatcgtcat gctccgcttt gcgccgactg tgctgcatga atttggagaa 240
gtcagggaag ccatgaaaat tcgtggcttc ttaaaatcgg tcggtaatgt tttgaggcat 300
ccaatggaca cgttggaata cgccattgtt ccgatggtgt tccgctcctt aaagatcgcg 360
gacgagttag cagcttctgc catagtcagg ggaattgaaa gcccctacaa gaaagaaagc 420
tactatgtca gccggatcgc tgcgctggat tactttttga ttgttgtcag cgtgggagct 480
gccgtgtgct gctgtctttt atag 504
<210> 9
<211> 750
<212> DNA
<213> 卵形瘤胃球菌(Ruminococcus obeum)
<400> 9
atgaaaggaa aaagagttat tgcaggcatt ctgcttgcag gaattttagc agttaccctg 60
gcagggtgta aaaacacaga taacactaaa gaagaatcag aaaagccggt tattaccctc 120
ggcagcgata gctatccacc atacaattat ctgaatgagg atggtgtacc gacgggcata 180
gatgtggaac tagctacaga agctttcaaa agaatgggat atcaggtgaa tgtcgtccaa 240
atcaactggg aggagaaaaa agaactggta gagagtggaa agatcgattg tatcatgggt 300
tgtttttcta tggaaggacg tcttgacgat taccgctggg caggggcgta catagcaagc 360
cgtcaggttg tagcggtaaa tgaggacagt gatatttata aattgagtga ccttgaggga 420
aagaacctgg ctgtccagtc cacaactaaa ccggaagtta tatttctgaa ccggttggat 480
aagagaatcc acaaactggg aaatctgatc agtcttggac accgcgagct gatatataca 540
tttcttggga aaggatatgt agatgcagtt gccgcacatg aggaatcaat catccagtat 600
atgaaggatt atgacataga cttccgtatc ctggaagaat cgctgatgat tacggggata 660
ggtgttgctt tcgcaaaaga tgatgacaga ggaattgtga gcagatggac cagacccttg 720
aagaaatgcg taaggatggc acgtctttga 750
<210> 10
<211> 594
<212> DNA
<213> 未知(Unknown)
<400> 10
atggcaatgc tcactgtaga aaatatcaat gtatattacg gcgtgatcca cgcccttaaa 60
gacatctcct ttcaggtaaa cgaaggcgag atcgtcgcac tgatcggcgc aaacggtgcc 120
ggcaaaacca ccaccctgca gactgtcagc ggcatgctga gcgcaaagtc cggttcgatc 180
cgatttcagg atcaggagat ttccagaatg ccggagcaca aaatcgtgaa gcagggaatt 240
tcccacgtcc ccgaaggacg ccggatgttc tccaatctga cggttttgga aaacctgaaa 300
atgggcgctt acaccagaaa agacaagcag gaaatcaaca attccctgga aatggtttat 360
gagcggtttc cccgcttaaa ggaacgtacc cgccagctgg caggaactct ttccggcggt 420
gaacagcaga tgcttgcaat gggacgtgca ctgatgtctc atccgaagat catccttctg 480
gatgaaccgt ctatgggact ttcaccgatt tttgtaaatg agattttcga aattatcaag 540
aaagtcagtg cagccggcac gaccgtactt ctggtagagc agaatgcaaa gaaa 594
<210> 11
<211> 708
<212> DNA
<213> 未知(Unknown)
<400> 11
gcagcttcaa actacgacct ttgtacaaca atccttagaa atgaatgggg atacgatggt 60
atcgtaatga ctgactggtg ggccaagatg aacgacgttg tagaaggtgg cgaagaatca 120
aatcaggata caagagatat ggttcgctca cagaacgacg tatatatggt tgtaaacaat 180
aacggcgcag aagttaactc aaacaacgac aacacagaga aatcaattaa agagggaaga 240
cttacaatcg gagaacttca gcgagctgca atcaacatct gcaacttcat tctttcagca 300
cctgttattg aaagagaatt agttgacaca gacgttgcaa aacattacga ttcagttcca 360
aatgatcagg ccaagtatga agtatttaac attgaaaaag acaataaggt aatgttcaat 420
agcggagcag aagcaacatt ggaagttgaa gacgaagggg aatacacaat tattgttaac 480
atctcatttg acaagtccaa cttatcacag tcaacagtaa acgttaatgc caacggcaca 540
acaatggtag taatccagac taatggaaca gacggcaact ggattacaca gaagctttgc 600
aaggttaaac ttgacaaggg tgtatacaac ttaaaacttg aagaagtatt agcaggaatc 660
aaagttaaat atattcagtt taagaagatt cctaagaaaa ataaataa 708
<210> 12
<211> 1401
<212> DNA
<213> 普拉梭菌(Faecalibacterium prausnitzii)
<400> 12
atgccgaacg aacgacatta ctccaatgaa ctgaatctgg aaagcgtggg catcaatctg 60
ccctacaaca tgcaggccga gcagagcgtg ctgggtgcgg tgctgctcaa gccggaaaca 120
ctgaccgacc tggttgagat catccggccg gaaatgttct acacccggca gaacgcccaa 180
atttattcgg aaatgctccg gctgttcacc agcgaccaga ccattgattt cgtcaccctg 240
ctggacgcgg tcatctcaga cggcgtgttt cccagcgcgg acgaggcgaa agtctacctg 300
accggtctgg ccgagacggt gcccagcatc tccaacgtga aagcctacgc ccagatcgtg 360
caggaaaaat atctggtccg ccagctcatg ggtgtggcga aagatatctt gcaggatgcg 420
ggcgacgagc cggacgcgga cctgctgctg gaaaacgccg agcagcgcat ttatgagatc 480
cgctccgggc gggattccag cgccctgacg cccctttctt ccagcatggt ggaaacgctg 540
accaatctgc agaagatcag cggcccggat gccgataagt acaagggcat ccctacaggc 600
ttccgcctgc tggacaccgt gctcaccggc cttggccgcg gcgaccttat tattctggct 660
gcccgccccg gtatgggcaa gaccagtttt gcgctgaaca ttgccacccg cgtggccatg 720
cagcagaaag taccggtggc catcttcagc ctcgaaatga ccaaggagca gctgaccaac 780
cggatcctct cggcggaggc cggcatcgac agccaggcgt tccgcaccgg cgccctccgg 840
gcggaggact gggagtacct ggcccttgcc accgagaagc tccatgacgc gcccatttat 900
atggatgaca cctcgggcat caccatcacc gagatgaaag ccaagatccg ccgggtgaac 960
caggacccca gccgccccaa tgtggggctc atcgtcatcg actatctgca gctgatgacc 1020
acgggccagc gcaccgagaa ccgtgtacag gagatcagct ccatcacccg aaacctcaag 1080
atcatggcca aagagatgaa tgtgcccatc attgcgctga gccagctgtc ccgtgcggtg 1140
gaaaagcagg gcaacaactc ctcccaccgc ccccagctgt ccgacctgcg tgattccggt 1200
tccatcgagc aggacgccga ctgcgtgctg ttcctctacc gtgattctta ttacgccagc 1260
cagaacccgg acggtgccga ggtggacgcc gacacggccg agtgcatcgt ggccaaaaac 1320
cgccacggtg agaccagtac cgtgccgctg ggctgggatg gtgcccacac ccgctttatg 1380
gatgtggact tcaaacgctg a 1401
<210> 13
<211> 777
<212> DNA
<213> Ruminococcus bicirculans
<400> 13
atgaagaata tgataaaaat atttgaaaat gacgaattcg gaaaagtgag aacagtcatt 60
aaggacggcg aaccgtggct tgtaggaaaa gatgttgcgg aaattttagg gtattccaac 120
acaagggacg ctctttcacg tcatgtggat accgaggata aaaccaccgt cgtgatttcc 180
gacagtggtt caaattacaa gagcaagacc actattatca atgaaagcgg cttttacagc 240
ttagttctct caagcaaaat gccgagagcc aaagagttca ggcgttgggt gaccgccgaa 300
gtcctcccca ccatcagacg caccggcggc tacgtttcca acgaggatat gttcatcaaa 360
aactatctcc cctttctcga cgagccatac cgtgacctgt tccgacttca aatgaccatt 420
atcaacaagc tgaatgaacg tatccgccac gatcagccgc tggtggagtt tgcgaatcag 480
gtgtcaaata ccgataatct tatcgacatg aacgcaatgg caaagcttgc gagagcggaa 540
aatatccccg tcggcagaaa caagctttac ggctggctga aaggaaaagg tgtgcttatg 600
gcaaacaatc tgccgtatca ggcttttatc gaccgcggat atttttccgt aaaggagtcg 660
gtgtttgaaa ctgcgactat gacaaagact tatcagcaga cgtttgttac gggcaggggg 720
cagcagttcg tcataaattt gctgaagaaa tattatggga aggaggtttt gcaataa 777
<210> 14
<211> 858
<212> DNA
<213> 普拉梭菌(Faecalibacterium prausnitzii)
<400> 14
atctccaaac tggaaaaaac gctgcgggca cggttcccga aaacgcagca gggcgaactg 60
ctggccgggg cggtgctggc cttctgcctg ccggtgggca cctttctgct cacaagcgcc 120
gtgtgccttc tggcggcaaa aatcagcccc tggctcggcc ttgccgtgca gatgttctgg 180
tgcgggcagg cgctggcggc aaagggactt gtgcaggaga gccggaacgt ttacaacaag 240
ctggtaaagc ccgacctgcc cgccgcccgc aaggccgtga gccgcatcgt ggggcgggac 300
accgagaacc tgaccgccga gggcgtgacc aaggctgccg tggagactgt ggccgagaat 360
gccagcgacg gcgtgattgc gccgctgctg tacatgctgc tgggcggcgc gccgctggcg 420
ctgacctaca aggccgtcaa caccatggac agcatggtgg gctacaaaaa cgagacctat 480
ctctacttcg gccgggcggc ggcaaagctg gacgatatgg caaactacat tcccagccgc 540
cttgccgccc tgctgtgggc ggcggctgct gccctgaccg gcaacgatgc caaaggcgcg 600
tggcgcatct ggcggcggga ccggcgcaat cacgccagcc ccaacagcgc ccagaccgaa 660
agcgcctgcg ccggtgcgct gggcgtgcag ctggccgggc cggcctacta ctttggcgaa 720
tactacccga aacccaccat cggcgatgcc ctgcgcccca ttgagccgca ggacatcctg 780
cgggccgacc gcatgatgta cgccgccagc attctggcgc tggtgctcgg gcttgtgata 840
cgggggttcg ttgtatga 858
<210> 15
<211> 945
<212> DNA
<213> 普拉梭菌(Faecalibacterium prausnitzii)
<400> 15
atgaacagag aaacggtgaa catggtgcgc agtccgattt ctgtggaggg gaacatccgg 60
cttgttccgt attatccggc ctacgataca gcacttgcgt ggtatcagga tgcacagctc 120
tgcaaacagg tagataacag ggacttcgtt tatgatttgc cgctgctgaa gcggatgtat 180
cattatctgg acacacacgg ggaactgttt tatattgagt atcggggtgt gctttgtggt 240
gacgtcagcc tgcggacgac cggcgagctg gccatcgtca tctgcaagga gtaccagaat 300
aaacacatcg ggcggaaggt catcgaaaaa atgctggagc tggctcggga aaggggcttg 360
gcggagtgct tcgcgcacat ctattctttc aatacccagt cgcagaaaat gtttgaatcc 420
attggctttg tcccacagga cgaagaacgc tatatctaca aattgcaaaa aggagaaccg 480
actatgacaa aactgactct ggaagaaaag caggagctca tccggatggc ccttgcggcc 540
agggagaggg cttacgtgcc ttacagcgac tttatggtgg gcgctgccct gcgcgccgag 600
gatggccgtg tctttaccgg ctgccatgtg gagaatgccg cctttacccc caccagctgc 660
gccgagcgca ccgcgctgtt caaagccgtg agcgagggcg tgaccaaatt tacggacatc 720
gccgtggtag gctcccgccg gggcgagatc aatcagcaga tcacctcgcc ctgcggcgtc 780
tgccgtcagg cactgtttga gtttggcggc ccggagctga acgtcatcat ggccaaaacg 840
ccggatgatt tcatggagcg cagcatggat gagctgctgc cctttggctt cggtccctcc 900
aatgtggcgg gcaacaaggc cgtggaagag gaagaaaaag gctga 945
<210> 16
<211> 1206
<212> DNA
<213> 未知(Unknown)
<400> 16
atgaggttat tttttgatat ggtatgtaac ggcagggcat tgcaaaatgt acaaatgtat 60
aaattgaata tggttttaga tgtacacccc tatgctatta cagcaccgtc aaaaactggt 120
ggccgttggc agacatatgt aaaggaaggt gataagcgta agattataag ggcttcttca 180
aaggaaaaac taatggacaa attatatact gcctattttg ttcaaaatgg tgtttctggt 240
atgaccatgg acaagctttt tctcgaatgg ttagcttata aggaatgtat cacaaatagt 300
atgaatacga ttcgcagaca tgaacaacac tggaaaaagt attttcagga tatttcccca 360
aataaggtat cttcctatga tcgtctggaa ttgcagaaag aatgtaatca gttaataaaa 420
gttaataacc tttcttccaa agaatggcag aatgtaaaaa caattctttt aggtatgttt 480
gactatgcct ttgaaaaagg atatattaat acaaacccca tgcccagtat taaaatcact 540
gttaaattcc gtcaggtcaa taaaaagagt ggtaggactg aaacatatca gacagacgaa 600
tacaaagcac ttatgcaata tctagatgca gaatatacag ctacagaaga ccttgcttta 660
ttggctgtta aatttgattt ttttattgga tgccgtgttg ctgagttggt agctctcaag 720
tggtgtgatg ttgaaaatct acggcattta catatttgta gggaagaggt taaagagtct 780
gtccgtgttg gtgatacctg gaaagatgtt tataccgttt cagagcatac taagacatat 840
acagaccggt ctataaattt agttcctaat gcgattgcta ttttaaatca tatccgtctt 900
aaaatggctt ataatgtatc tgacgatgat tatatcttta cccggaacgg ttcccggatc 960
acttcacgcc agattaatta tattcttgaa aaagcatgta caaaactggg aattatgatt 1020
aagaggtcgc ataaggtaag aaaaacggtt gcaagtcgtc tcaatgtcgg tgaggttccg 1080
ttagattcta ttcgtgagct gttaggtcat gcaaatttaa gcactacact aagttatatt 1140
tataatccgt tatcggaaaa agaaacctat aacctgatgt ccagagcctt ggggaaagtt 1200
caatag 1206
<210> 17
<211> 336
<212> DNA
<213> 未知(Unknown)
<400> 17
atggcgattg atactgaatt agcaaaaaga ttacgttcat atcgtaattt taaacattta 60
acacaaaaag atgttgctgc gcatttaaat gttcctcatt ctgcaatttc cgatatagaa 120
aatggtaaaa gagacattac tgttagcgag ttaaaagtgt tttcaaattt atatggtaga 180
agtgtagaag aaattatgag cgggaaaaaa tatgactatt ataatattgc caatatcgct 240
cgtttactta ctgaacttcc tgatgatgat ttaaaagaaa tcatgtttat tattgaatat 300
aaaagaaaaa gaaatgaaga acgtcatttg aaataa 336
<210> 18
<211> 816
<212> DNA
<213> 梅毒螺旋体(Treponema sp.)
<400> 18
atggccaaaa cacctatcgt agataagggg tgcttcatat cgaatgatgt taaaaggtca 60
atagttttaa acctatgtga gactaagtca atggatctaa ttgcaagaga acactgtgta 120
tctcctagta gtgttgccag aatacttcgt ttaactgaag ataggagaag aaaaaattat 180
cttcctagga ttctatcaat agacgaattc aagtcagtaa atacagttga tgcgtctatg 240
agtgtaaatt taactgattt agaaggcggt catatttttg atatcctggt ggataggagg 300
caaagatacc tctttgagta ctttaattcc tatcccttga aggtcagaaa aagggtagaa 360
tatgtgacta cagacatgta taagccatat attgatcttg ccaagaaggt ctttccaaat 420
gccaatattg tggtagataa attccatata gtacagctct tgacaagaga gctaaacaag 480
ttaaggataa atgagatgaa gaagcttaat accaggtcta gagagtataa aatactgaag 540
agatactgga aaatacccct taggaagaag agagacttaa acagtatata tttttacaag 600
aataggcact ttaaaaatat gaccagttca attgatatat tagactatat gttaaaggaa 660
tttcccaact taaaagaggc ctatgatttt tatcaaaact tcctattaag tatatctaat 720
aatgatgtcg ctatgcttga agacattcta aatactagga ctgatgaaat tcccatgtgt 780
tttaggaaga gtataaaaag ccttaaaaag cttaga 816
<210> 19
<211> 432
<212> DNA
<213> 未知(Unknown)
<400> 19
tatttttaca agaataggca ctttaaaaat atgaccagtt cagttgatat attagattat 60
atgttaaaag aatttcccaa cttaaaagat gcctatgatt tttatcaaaa cttcctatta 120
agtatatcta ataatgatgt ggctatgctt gaagatattc taaatactag gactgataaa 180
ataccaatgt gttttaggaa gagtataaaa agccttaaaa agtttagaaa gtatgtggta 240
aattcactga aatatgacta tacgaatgcc atggtggagg gtaaaaacaa caagataaag 300
gtaattaaaa gagtatccta cggatatagg agttttagga attttaaggc aaggataatg 360
ctaatggaaa ggtataaaat acaaaagggc aacatccata gttatcagtt tgctatggat 420
gctgccgcat aa 432
<210> 20
<211> 873
<212> DNA
<213> 未知(Unknown)
<400> 20
atgaaacgta ttttattaac tggagcaagt ggatttatag gtaaaaacat taaagagaca 60
ttaaacagta aatatgacat atggagcccg tcaagccagg agctggattt aaaagatacc 120
gaatgcgttg aagcatattt gaagcagcat tctttcgatg taatattgca tgcagcaaat 180
tgtaatgata caaggaattc catatcagca tacgatgtac tcaatggaaa tctcagaatg 240
ttttttaacc tagagagatg ttctcactat tatggaaaaa tgatttattt tgggtctggg 300
gcagaatatg acagaagtaa taacatccct aatatgtcag aggactattt tgataccagt 360
gttccgaaag atgcttacgg actttcaaaa tatattatgg caaaagcctg tttaaatcag 420
aagaacattt atgaattgtg tttatttgga gtatacggaa aatatgagga atgggagaga 480
agatttatct ctaatgcgat atgtcgtgca ttaaagggta tggatattac gcttcataaa 540
aatgtatact ttgattattt gtgggtagat gacctcataa aaattatttc ttttttcatt 600
gagaaagata acttgaggta caagaggtac aatgtgtgta gaggcgagaa ggttgatcta 660
tattcgctgg cagtacaggt aaagaagact ttggatagcg aatgttcaat attagttggt 720
gagcctggat ggaagaggga gtatactgcg gataacaata gaatgttgaa cgaaatgaat 780
ggtttatctt ttacaaaact ggaagtgacg atagctgaat tgtgtgaata ttataaagag 840
catttatcag aaatagttac tgaaaaattg taa 873
<210> 21
<211> 20
<212> DNA/RNA
<213> 人工序列(Artificial Sequence)
<400> 21
cggatttgca gtggcaagtt 20
<210> 22
<211> 20
<212> DNA/RNA
<213> 人工序列(Artificial Sequence)
<400> 22
tgattgcaga cgccaatgtc 20
<210> 23
<211> 23
<212> DNA/RNA
<213> 人工序列(Artificial Sequence)
<400> 23
cgtgaaaaat ccgcgcatct ggc 23
<210> 24
<211> 20
<212> DNA/RNA
<213> 人工序列(Artificial Sequence)
<400> 24
tccatccgca agcctttact 20
<210> 25
<211> 20
<212> DNA/RNA
<213> 人工序列(Artificial Sequence)
<400> 25
gcttccggtg ccattgacta 20
<210> 26
<211> 24
<212> DNA/RNA
<213> 人工序列(Artificial Sequence)
<400> 26
ttcatcatca cagccgacaa cgca 24
<210> 27
<211> 20
<212> DNA/RNA
<213> 人工序列(Artificial Sequence)
<400> 27
aatgggaatg gagcggattc 20
<210> 28
<211> 21
<212> DNA/RNA
<213> 人工序列(Artificial Sequence)
<400> 28
cctgcaccag cttatcgtca a 21
<210> 29
<211> 26
<212> DNA/RNA
<213> 人工序列(Artificial Sequence)
<400> 29
aagcctgcgg aaccacagtt accagc 26
<210> 30
<211> 29
<212> DNA/RNA
<213> 人工序列(Artificial Sequence)
<400> 30
aagaatggag agagttgtta gagaaagaa 29
<210> 31
<211> 26
<212> DNA/RNA
<213> 人工序列(Artificial Sequence)
<400> 31
ttgtgataat tgtgaagaac cgaaga 26
<210> 32
<211> 30
<212> DNA/RNA
<213> 人工序列(Artificial Sequence)
<400> 32
aactcaagat ccagaccttg ctacgcctca 30
<210> 33
<211> 24
<212> DNA/RNA
<213> 人工序列(Artificial Sequence)
<400> 33
ttgtaagtgc tggtaaaggg attg 24
<210> 34
<211> 26
<212> DNA/RNA
<213> 人工序列(Artificial Sequence)
<400> 34
cattcctaca taacggtcaa gaggta 26
<210> 35
<211> 30
<212> DNA/RNA
<213> 人工序列(Artificial Sequence)
<400> 35
agcttctatt ggttcttctc gtccagtggc 30
<210> 36
<211> 23
<212> DNA/RNA
<213> 人工序列(Artificial Sequence)
<400> 36
ttcaataaaa gtggcaggtc aag 23
<210> 37
<211> 23
<212> DNA/RNA
<213> 人工序列(Artificial Sequence)
<400> 37
taacaacaca tgcaggtcaa tgg 23
<210> 38
<211> 24
<212> DNA/RNA
<213> 人工序列(Artificial Sequence)
<400> 38
actcgaaccc ccaaccctcg gttt 24
<210> 39
<211> 19
<212> DNA/RNA
<213> 人工序列(Artificial Sequence)
<400> 39
gggctgcgga agcaactta 19
<210> 40
<211> 20
<212> DNA/RNA
<213> 人工序列(Artificial Sequence)
<400> 40
gatgacctcg ccctgatcat 20
<210> 41
<211> 28
<212> DNA/RNA
<213> 人工序列(Artificial Sequence)
<400> 41
accaccacac aggacggaaa gattctcc 28
<210> 42
<211> 20
<212> DNA/RNA
<213> 人工序列(Artificial Sequence)
<400> 42
tcggcacgct gattatcaca 20
<210> 43
<211> 19
<212> DNA/RNA
<213> 人工序列(Artificial Sequence)
<400> 43
cacacgccga tccatcttc 19
<210> 44
<211> 20
<212> DNA/RNA
<213> 人工序列(Artificial Sequence)
<400> 44
acccacctgg acggctccgg 20
<210> 45
<211> 20
<212> DNA/RNA
<213> 人工序列(Artificial Sequence)
<400> 45
aagatcgcgg acgagttagc 20
<210> 46
<211> 20
<212> DNA/RNA
<213> 人工序列(Artificial Sequence)
<400> 46
gctcccacgc tgacaacaat 20
<210> 47
<211> 28
<212> DNA/RNA
<213> 人工序列(Artificial Sequence)
<400> 47
aaagctacta tgtcagccgg atcgctgc 28
<210> 48
<211> 21
<212> DNA/RNA
<213> 人工序列(Artificial Sequence)
<400> 48
cctggcaggg tgtaaaaaca c 21
<210> 49
<211> 20
<212> DNA/RNA
<213> 人工序列(Artificial Sequence)
<400> 49
tatgcccgtc ggtacaccat 20
<210> 50
<211> 23
<212> DNA/RNA
<213> 人工序列(Artificial Sequence)
<400> 50
ccggttatta ccctcggcag cga 23
<210> 51
<211> 20
<212> DNA/RNA
<213> 人工序列(Artificial Sequence)
<400> 51
aatgggcgct tacaccagaa 20
<210> 52
<211> 19
<212> DNA/RNA
<213> 人工序列(Artificial Sequence)
<400> 52
tcaccgccgg aaagagttc 19
<210> 53
<211> 25
<212> DNA/RNA
<213> 人工序列(Artificial Sequence)
<400> 53
ttccccgctt aaaggaacgt acccg 25
<210> 54
<211> 23
<212> DNA/RNA
<213> 人工序列(Artificial Sequence)
<400> 54
cagaagcaac attggaagtt gaa 23
<210> 55
<211> 23
<212> DNA/RNA
<213> 人工序列(Artificial Sequence)
<400> 55
tgtaatccag ttgccgtctg ttc 23
<210> 56
<211> 28
<212> DNA/RNA
<213> 人工序列(Artificial Sequence)
<400> 56
tcaacagtaa acgttaatgc caacggca 28
<210> 57
<211> 20
<212> DNA/RNA
<213> 人工序列(Artificial Sequence)
<400> 57
cggccggaaa tgttctacac 20
<210> 58
<211> 21
<212> DNA/RNA
<213> 人工序列(Artificial Sequence)
<400> 58
gaaacacgcc gtctgagatg a 21
<210> 59
<211> 26
<212> DNA/RNA
<213> 人工序列(Artificial Sequence)
<400> 59
ccagaccatt gatttcgtca ccctgc 26
<210> 60
<211> 20
<212> DNA/RNA
<213> 人工序列(Artificial Sequence)
<400> 60
ctggtggagt ttgcgaatca 20
<210> 61
<211> 20
<212> DNA/RNA
<213> 人工序列(Artificial Sequence)
<400> 61
cagccagccg taaagcttgt 20
<210> 62
<211> 23
<212> DNA/RNA
<213> 人工序列(Artificial Sequence)
<400> 62
cggaaaatat ccccgtcggc aga 23
<210> 63
<211> 19
<212> DNA/RNA
<213> 人工序列(Artificial Sequence)
<400> 63
gggcaccttt ctgctcaca 19
<210> 64
<211> 20
<212> DNA/RNA
<213> 人工序列(Artificial Sequence)
<400> 64
cgggctttac cagcttgttg 20
<210> 65
<211> 22
<212> DNA/RNA
<213> 人工序列(Artificial Sequence)
<400> 65
aaaaatcagc ccctggctcg gc 22
<210> 66
<211> 20
<212> DNA/RNA
<213> 人工序列(Artificial Sequence)
<400> 66
gtgcgcagtc cgatttctgt 20
<210> 67
<211> 20
<212> DNA/RNA
<213> 人工序列(Artificial Sequence)
<400> 67
cagcggcaaa tcataaacga 20
<210> 68
<211> 28
<212> DNA/RNA
<213> 人工序列(Artificial Sequence)
<400> 68
tccgtattat ccggcctacg atacagca 28
<210> 69
<211> 25
<212> DNA/RNA
<213> 人工序列(Artificial Sequence)
<400> 69
agctttttct cgaatggtta gctta 25
<210> 70
<211> 23
<212> DNA/RNA
<213> 人工序列(Artificial Sequence)
<400> 70
ctgcaattcc agacgatcat agg 23
<210> 71
<211> 30
<212> DNA/RNA
<213> 人工序列(Artificial Sequence)
<400> 71
aatacgattc gcagacatga acaacactgg 30
<210> 72
<211> 19
<212> DNA/RNA
<213> 人工序列(Artificial Sequence)
<400> 72
aaagatgttg ctgcgcatt 19
<210> 73
<211> 21
<212> DNA/RNA
<213> 人工序列(Artificial Sequence)
<400> 73
tttcccgctc ataatttctt c 21
<210> 74
<211> 27
<212> DNA/RNA
<213> 人工序列(Artificial Sequence)
<400> 74
aaatgttcct cattctgcaa tttccga 27
<210> 75
<211> 21
<212> DNA/RNA
<213> 人工序列(Artificial Sequence)
<400> 75
tcctatccct tgaaggtcag a 21
<210> 76
<211> 27
<212> DNA/RNA
<213> 人工序列(Artificial Sequence)
<400> 76
tgtcaagagc tgtactatat ggaattt 27
<210> 77
<211> 25
<212> DNA/RNA
<213> 人工序列(Artificial Sequence)
<400> 77
ttgccaagaa ggtctttcca aatgc 25
<210> 78
<211> 26
<212> DNA/RNA
<213> 人工序列(Artificial Sequence)
<400> 78
tgtggtaaat tcactgaaat atgact 26
<210> 79
<211> 21
<212> DNA/RNA
<213> 人工序列(Artificial Sequence)
<400> 79
tccattagca ttatccttgc c 21
<210> 80
<211> 21
<212> DNA/RNA
<213> 人工序列(Artificial Sequence)
<400> 80
accctccacc atggcattcg t 21
<210> 81
<211> 20
<212> DNA/RNA
<213> 人工序列(Artificial Sequence)
<400> 81
tgtgtgtaga ggcgagaagg 20
<210> 82
<211> 22
<212> DNA/RNA
<213> 人工序列(Artificial Sequence)
<400> 82
ccattcattt cgttcaacat tc 22
<210> 83
<211> 22
<212> DNA/RNA
<213> 人工序列(Artificial Sequence)
<400> 83
ccctcttcca tccaggctca cc 22
<210> 84
<211> 19
<212> DNA/RNA
<213> 人工序列(Artificial Sequence)
<400> 84
cgtcagctcg tgycgtgag 19
<210> 85
<211> 17
<212> DNA/RNA
<213> 人工序列(Artificial Sequence)
<400> 85
cgtcrtcccc rccttcc 17
<210> 86
<211> 25
<212> DNA/RNA
<213> 人工序列(Artificial Sequence)
<400> 86
ttaagtcccr yaacgagcgc aaccc 25

Claims (27)

1.检测受试者的结肠癌的试剂盒,包括:
(1)标准对照,其提供粪便样品中的下述物质的平均量:核梭杆菌(Fusobacterium nucleatum)、哈撒韦梭菌(Clostridium hathewayi)、克拉鲁斯拟杆菌(Bacteroides clarus)以及m7的基因标志物m3246804;和
(2)试剂,其分别特异性且定量地鉴定核梭杆菌的基因nusG、哈撒韦梭菌的基因标志物m2736705、克拉鲁斯拟杆菌的基因标志物m370640和m7的基因标志物m3246804,
其中所述哈撒韦梭菌的基因标志物m2736705的核苷酸序列如SEQ ID NO: 6所示;所述克拉鲁斯拟杆菌的基因标志物m370640的核苷酸序列如SEQ ID NO: 2所示;和所述m7的基因标志物m3246804的核苷酸序列如SEQ ID NO: 7所示。
2.如权利要求1所述的试剂盒,其中所述试剂是特异性结合基因nusG的多核苷酸探针。
3. 如权利要求2所述的试剂盒,其中所述多核苷酸探针是SEQ ID NO: 38。
4.如权利要求1所述的试剂盒,其中所述试剂是特异性结合基因标志物m2736705的多核苷酸探针。
5. 如权利要求4所述的试剂盒,其中所述多核苷酸探针是SEQ ID NO: 41。
6.如权利要求1所述的试剂盒,其中所述试剂是特异性结合基因标志物m370640的多核苷酸探针。
7. 如权利要求6所述的试剂盒,其中所述多核苷酸探针是SEQ ID NO: 26。
8.如权利要求1所述的试剂盒,其中所述试剂是特异性结合基因标志物m3246804的多核苷酸探针。
9. 如权利要求8所述的试剂盒,其中所述多核苷酸探针是SEQ ID NO: 44。
10.如权利要求2-9中任一项所述的试剂盒,其中所述多核苷酸探针包含可检测部分。
11.如权利要求1所述的试剂盒,还包含两个一组的寡核苷酸引物。
12. 如权利要求11所述的试剂盒,其中所述两个一组的寡核苷酸引物是SEQ ID NO:24和25、SEQ ID NO:36和37、SEQ ID NO:39和40或SEQ ID NO:42和43。
13.如权利要求1所述的试剂盒,还包括操作手册。
14.如权利要求1所述的试剂盒,其还包括用于粪便免疫化学测试(FIT)的试剂。
15. 下述物质在制备检测受试者的结肠癌的试剂盒中的用途:(1)标准对照,其提供粪便样品中的下述物质的平均量:核梭杆菌(Fusobacterium nucleatum)、哈撒韦梭菌(Clostridium hathewayi)、克拉鲁斯拟杆菌(Bacteroides clarus)以及m7的基因标志物m3246804;和(2)试剂,其分别特异性且定量地鉴定核梭杆菌的基因nusG、哈撒韦梭菌的基因标志物m2736705、克拉鲁斯拟杆菌的基因标志物m370640和m7的基因标志物m3246804,
其中所述哈撒韦梭菌的基因标志物m2736705的核苷酸序列如SEQ ID NO: 6所示;所述克拉鲁斯拟杆菌的基因标志物m370640的核苷酸序列如SEQ ID NO: 2所示;和所述m7的基因标志物m3246804的核苷酸序列如SEQ ID NO: 7所示。
16.如权利要求15所述的用途,其中所述试剂是特异性结合基因nusG的多核苷酸探针。
17. 如权利要求16所述的用途,其中所述多核苷酸探针是SEQ ID NO: 38。
18.如权利要求15所述的用途,其中所述试剂是特异性结合基因标志物m2736705的多核苷酸探针。
19. 如权利要求18所述的用途,其中所述多核苷酸探针是SEQ ID NO: 41。
20.如权利要求15所述的用途,其中所述试剂是特异性结合基因标志物m370640的多核苷酸探针。
21. 如权利要求20所述的用途,其中所述多核苷酸探针是SEQ ID NO: 26。
22.如权利要求15所述的用途,其中所述试剂是特异性结合基因标志物m3246804的多核苷酸探针。
23. 如权利要求22所述的用途,其中所述多核苷酸探针是SEQ ID NO: 44。
24.如权利要求16-23中任一项所述的用途,其中所述多核苷酸探针包含可检测部分。
25.如权利要求15所述的用途,其中所述试剂盒还包含两个一组的寡核苷酸引物。
26. 如权利要求25所述的用途,其中所述两个一组的寡核苷酸引物是SEQ ID NO:24和25、SEQ ID NO:36和37、SEQ ID NO:39和40或SEQ ID NO:42和43。
27.如权利要求15所述的用途,其中所述试剂盒还包括(3)用于粪便免疫化学测试(FIT)的试剂。
CN201710261558.9A 2016-08-25 2017-04-20 结肠直肠癌的粪便细菌标志物 Active CN107779505B (zh)

Priority Applications (4)

Application Number Priority Date Filing Date Title
TW106128299A TWI769173B (zh) 2016-08-25 2017-08-21 結腸直腸癌的糞便細菌標誌物
US16/327,560 US11603567B2 (en) 2016-08-25 2017-08-23 Fecal bacterial markers for colorectal cancer
EP17842925.4A EP3504346B1 (en) 2016-08-25 2017-08-23 Fecal bacterial markers for colorectal cancer
PCT/CN2017/098592 WO2018036503A1 (en) 2016-08-25 2017-08-23 Fecal bacterial markers for colorectal cancer

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US201662379635P 2016-08-25 2016-08-25
US62/379,635 2016-08-25

Publications (2)

Publication Number Publication Date
CN107779505A CN107779505A (zh) 2018-03-09
CN107779505B true CN107779505B (zh) 2023-06-06

Family

ID=61437766

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710261558.9A Active CN107779505B (zh) 2016-08-25 2017-04-20 结肠直肠癌的粪便细菌标志物

Country Status (4)

Country Link
US (1) US11603567B2 (zh)
EP (1) EP3504346B1 (zh)
CN (1) CN107779505B (zh)
TW (1) TWI769173B (zh)

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3785033A1 (en) * 2018-04-24 2021-03-03 Universiteit Gent Intestinal and fecal biomarkers for intestinal health of poultry
CN111041090B (zh) * 2018-10-11 2024-06-04 深圳华大生命科学研究院 结直肠癌标志物及其应用
BR112021019550A2 (pt) * 2019-04-01 2021-11-30 Dupont Nutrition Biosci Aps Biomarcadores intestinais para a saúde intestinal de aves domésticas
CN110643721A (zh) * 2019-09-04 2020-01-03 上海派森诺生物科技股份有限公司 一种检测结直肠癌指示菌的试剂盒
CN116782950A (zh) * 2020-11-19 2023-09-19 香港中文大学 通过非侵入性方法评估结肠直肠腺瘤复发风险
US20240301510A1 (en) * 2020-11-19 2024-09-12 The Chinese University Of Hong Kong Assessing risk for colorectal adenoma recurrence by noninvasive means
CN114369673B (zh) * 2022-01-06 2023-07-14 同济大学 结直肠腺瘤生物标志物、试剂盒及生物标志物的筛选方法
CN115678994B (zh) * 2022-01-27 2025-01-21 上海爱谱蒂康生物科技有限公司 一种生物标志物组合、含其的试剂及其应用
CN114574604A (zh) * 2022-03-31 2022-06-03 聚点(重庆)生物医学研究有限公司 一种辅助诊断结直肠癌高危人群的生物标志物及方法
CN116042827B (zh) * 2022-12-07 2023-12-22 臻傲生物科技检测(深圳)有限公司 预测结直肠癌风险的新型微生物标志物
CN116377070B (zh) * 2023-03-06 2024-11-15 臻傲生物科技检测(深圳)有限公司 预测结直肠癌或结直肠腺瘤风险的新型微生物标志物
CN116356026B (zh) * 2023-03-06 2024-10-01 臻傲生物科技检测(深圳)有限公司 预测结直肠癌或结直肠腺瘤风险的新型微生物标志物
WO2025064621A1 (en) * 2023-09-19 2025-03-27 Flagship Pioneering Innovations Vi, Llc Compositions and methods for treating colorectal cancer

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105473738A (zh) * 2013-08-06 2016-04-06 深圳华大基因科技有限公司 结直肠癌生物标志物
WO2016112488A1 (en) * 2015-01-13 2016-07-21 BGI Shenzhen Co.,Limited Biomarkers for colorectal cancer related diseases

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2012142605A1 (en) 2011-04-15 2012-10-18 Samaritan Health Services Rapid recolonization deployment agent
US11060148B2 (en) * 2012-10-16 2021-07-13 Dana-Farber Cancer Institute, Inc. Diagnosing and treating colorectal cancer
WO2015018307A1 (en) * 2013-08-06 2015-02-12 Bgi Shenzhen Co., Limited Biomarkers for colorectal cancer
CN105473739B (zh) 2013-08-06 2018-03-23 深圳华大基因科技有限公司 结直肠癌生物标志物
EP2955232B1 (en) 2014-06-12 2017-08-23 Peer Bork Method for diagnosing adenomas and/or colorectal cancer (CRC) based on analyzing the gut microbiome
FR3033446B1 (fr) 2015-03-06 2017-03-31 Socomec Sa Systeme de commande de pole de coupure avec forcage et appareil de coupure
CN105368944B (zh) 2015-11-23 2019-03-19 广州基迪奥生物科技有限公司 可检测疾病的生物标志物及其用途
CN105803061A (zh) * 2016-03-18 2016-07-27 上海交通大学医学院附属仁济医院 一种用于检测共生梭菌的试剂及其应用

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105473738A (zh) * 2013-08-06 2016-04-06 深圳华大基因科技有限公司 结直肠癌生物标志物
WO2016112488A1 (en) * 2015-01-13 2016-07-21 BGI Shenzhen Co.,Limited Biomarkers for colorectal cancer related diseases

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
303 Fecal bacteria act as novel biomarkers for non-invasive diagnosis of colorectal cancer;Qiaoyi Liang等;《GASTROENTEROLOGY》;20160430;第150卷(第4期);S69左栏 *
Fecal bacteria plus FIT promising in diagnosis of colorectal cancer;Alice Goodman;《HCV Hub》;20160523;第1-3页 *
Metagenomic analysis of faecal microbiome as a tool towards targeted non-invasive biomarkers for colorectal cancer;Jun Yu等;《Gut microbiota》;20150925;第66卷(第1期);摘要,第71-75页,补充附表S13、S27 *

Also Published As

Publication number Publication date
EP3504346A4 (en) 2020-07-01
EP3504346B1 (en) 2023-08-16
US20200002769A1 (en) 2020-01-02
EP3504346A1 (en) 2019-07-03
US11603567B2 (en) 2023-03-14
HK1252142A1 (zh) 2019-05-17
CN107779505A (zh) 2018-03-09
TWI769173B (zh) 2022-07-01
TW201819639A (zh) 2018-06-01

Similar Documents

Publication Publication Date Title
CN107779505B (zh) 结肠直肠癌的粪便细菌标志物
WO2018036503A1 (en) Fecal bacterial markers for colorectal cancer
JP6430560B2 (ja) 前立腺癌マーカーとしてのホスホジエステラーゼ4d7
US11111547B2 (en) Tumor suppressor REC8 as a biomarker for gastric cancer
CN103627785A (zh) 胃癌的生物标志物dact1
US20240301510A1 (en) Assessing risk for colorectal adenoma recurrence by noninvasive means
US8962236B2 (en) Epigenetic biomarker ADAMTS9 for diagnosis and prognosis of gastric cancer
US20120184494A1 (en) Multiple myeloma prognosis and treatment
He et al. The prognostic significance of CTSV expression in patients with hepatocellular carcinoma
HK1252142B (zh) 结肠直肠癌的粪便细菌标志物
US11746383B2 (en) Biomarker DLEC1 for cancer
CN102998459B (zh) 胃癌的生物标志物
US10294530B2 (en) Biomarker FOXF2 for gastric cancer
CN116782950A (zh) 通过非侵入性方法评估结肠直肠腺瘤复发风险
US20230357851A1 (en) Frataxin-sensitive markers for monitoring frataxin-replacement therapy
US10379124B2 (en) Tumor suppressor VSTM2A as a biomarker for colorectal cancer
Gümüşoğlu-acar et al. The Expression Analysis of Specific Genes in Ovarian Cancer
US10457993B2 (en) Biomarker RNF6 for colorectal cancer
HK40036194A (zh) 结肠直肠癌的mirna标志物
CN108048568A (zh) Plcd4基因作为胃腺癌转移诊断标志物的用途
HK1177502B (zh) 胃癌的生物标志物
HK1190170B (zh) 胃癌的生物標誌物dact1
HK1190170A (zh) 胃癌的生物標誌物dact1

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 1252142

Country of ref document: HK

EE01 Entry into force of recordation of patent licensing contract
EE01 Entry into force of recordation of patent licensing contract

Application publication date: 20180309

Assignee: Zhenao Biotechnology Testing (Shenzhen) Co.,Ltd.

Assignor: Jingjin Microbiology Technology Co.,Ltd.

Contract record no.: X2023990000187

Denomination of invention: Fecal bacterial markers of colorectal cancer

License type: Common License

Record date: 20230207

GR01 Patent grant
GR01 Patent grant
EE01 Entry into force of recordation of patent licensing contract
EE01 Entry into force of recordation of patent licensing contract

Application publication date: 20180309

Assignee: Zhenao Biotechnology Testing (Guangzhou) Co.,Ltd.

Assignor: Jingjin Microbiology Technology Co.,Ltd.

Contract record no.: X2025990000096

Denomination of invention: Fecal bacterial markers for colorectal cancer

Granted publication date: 20230606

License type: Common License

Record date: 20250307