[go: up one dir, main page]

CN115176032B - 用于评估微生物群体的组合物和方法 - Google Patents

用于评估微生物群体的组合物和方法 Download PDF

Info

Publication number
CN115176032B
CN115176032B CN202080082093.0A CN202080082093A CN115176032B CN 115176032 B CN115176032 B CN 115176032B CN 202080082093 A CN202080082093 A CN 202080082093A CN 115176032 B CN115176032 B CN 115176032B
Authority
CN
China
Prior art keywords
nucleic acid
seq
nos
sequence
sequences
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202080082093.0A
Other languages
English (en)
Other versions
CN115176032A (zh
Inventor
S·萨达
A·麦克吉齐
R·哥蒂姆卡拉
D·马力欧
H·欣
A·埃维因
W·李
B·吉乌斯
F·海兰
J·奥阳
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Life Technologies Corp
Original Assignee
Life Technologies Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Life Technologies Corp filed Critical Life Technologies Corp
Publication of CN115176032A publication Critical patent/CN115176032A/zh
Application granted granted Critical
Publication of CN115176032B publication Critical patent/CN115176032B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6888Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms
    • C12Q1/689Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms for bacteria
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6876Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
    • C12Q1/6888Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6844Nucleic acid amplification reactions
    • C12Q1/686Polymerase chain reaction [PCR]
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • C12Q1/6874Methods for sequencing involving nucleic acid arrays, e.g. sequencing by hybridisation
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B10/00ICT specially adapted for evolutionary bioinformatics, e.g. phylogenetic tree construction or analysis
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/40Population genetics; Linkage disequilibrium
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • G16B30/10Sequence alignment; Homology search
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/16Primer sets for multiplex assays
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2600/00Oligonucleotides characterized by their use
    • C12Q2600/166Oligonucleotides used as internal standards, controls or normalisation probes

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Health & Medical Sciences (AREA)
  • Organic Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Analytical Chemistry (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biotechnology (AREA)
  • Biophysics (AREA)
  • General Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Molecular Biology (AREA)
  • Biochemistry (AREA)
  • Immunology (AREA)
  • Microbiology (AREA)
  • General Engineering & Computer Science (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Evolutionary Biology (AREA)
  • Theoretical Computer Science (AREA)
  • Medical Informatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Physiology (AREA)
  • Animal Behavior & Ethology (AREA)
  • Ecology (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本公开提供了组合物和方法,以及包含所述组合物和方法的组合、试剂盒和系统,用于样品,具体地说,生物样品中的核酸的扩增、检测、表征、评估、剖析和/或测量。本文提供的组合物和方法包含用于选择性扩增的微生物种靶特异性核酸引物的组合和/或用于扩增来自一大群分类学相关微生物的核酸的引物的组合。在一方面,使用所述组合物和方法获得的经扩增的核酸可用于各种过程,包含核酸测序,并用于检测微生物种的存在和评估各种样品中的微生物群体。根据教导和原理,提供了新的方法、系统和非暂时性机器可读存储介质来压缩参考序列数据库,所述参考序列数据库用于映射序列读段以用于微生物群体的分析和剖析。

Description

用于评估微生物群体的组合物和方法
相关申请的交叉引用
本申请要求于2019年10月11日提交的美国临时申请第62/914,366号和于2019年10月11日提交的美国临时申请第62/914,368号以及于2019年12月6日提交的美国临时申请第62/944,877号的优先权和权益,所述美国临时申请中的每一个均通过引用整体并入本文。
序列表
本申请在此通过引用整体并入与其同时提交的电子序列表的材料。电子序列表中的材料以2020年10月8日创建的标题为“LT01495_ST25.txt”的文本(.txt)文档形式提交,其文件大小为408千字节。
背景技术
随着科学界和医学界对微生物群在生态系统以及个人和群体健康中的重要作用越来越了解,各种环境中微生物群的多样性已成为深入研究的领域。在一个实例中,肠道微生物群(也被称为肠道微生物组)由数以万亿计的细菌、真菌和其它微生物组成。人类三分之一的肠道微生物群对大多数人来说是常见的,而三分之二是每个人特有的。健康的人体肠道有多种共存或共生细菌,它们生活在相对稳态中。当发生微生物失衡或适应不良时,会改变正常菌群的组成和比例,肠道进入生态失调状态。生态失调通常会导致肠细胞壁发炎,破坏粘液屏障、上皮屏障和胃肠道内的免疫敏感细胞。肠道微生物群失衡与疾病、慢性健康状况和对免疫肿瘤治疗的反应有关。例如,肠道微生物群失衡与肠易激综合征(IBS)、炎症性肠病(IBD)和肥胖症等肠道疾病以及乳糜泻、狼疮和类风湿性关节炎(RA)等自身免疫性病症有关。此外,肠道微生物群的组成可能会影响对肿瘤病状(如癌症)的易感性以及对癌症疗法的反应性。由于肠道微生物群涉及跨包含人类、动物和昆虫在内的动物种的广泛病症和疾病,肠道微生物群的表征和研究已成为促进对健康和疾病的理解以及开发针对相关病状的疗法的主要研究重点。
已经采用了几种不同的技术来尝试鉴定各种环境和生物体样品中的微生物。最初的技术依赖于微生物培养过程,所述过程耗时且提供的信息有限,部分原因在于获得不同微生物培养物所需的不同生长条件。许多不需要培养的最新技术涉及使用核酸分析方法分析样品中含有的微生物细胞的基因组成,所述核酸分析方法包含例如核酸扩增(例如,PCR)和/或测序。通常,此类方法涉及微生物16S rRNA基因节段的扩增和分析。虽然16S rRNA序列的分析减少了一些其它评估样品微生物组成的方法所需的时间和劳动力,但通过基于16S rRNA基因序列分析的方法获得的信息的全面性、准确性、质量和深度可能会有所不同并受到限制,例如,通过方法中使用的靶标扩增子和引物。因此,需要更灵敏和全面的方法,用于通过鉴定和区分含有多个种的样品中的微生物种及其水平来准确表征样品中的整个微生物群体。这些方法将在许多研究领域发挥重要作用,包含针对多因素病症和疾病的原因、并发症和诊断的研究,以及在促进对健康和疾病中肠道微生物群的研究和理解中发挥重要作用。
发明内容
本文提供了组合物和方法,以及包含所述组合物和方法的组合、试剂盒和系统,用于核酸的扩增、检测、表征、评估、剖析和/或测量。在一些实施例中,本文提供的组合物包含用作引物和/或探针的核酸,例如单链核酸。在一些实施例中,本文提供的组合物包含多种核酸的组合。在特定实施例中,所述引物和/或探针能够与微生物(例如,细菌)的靶核酸结合、杂交、扩增所述靶核酸和/或检测所述靶核酸,如可能存在于样品(例如,生物样品)中,例如,动物消化道内容物的样品。本文提供的此类核酸包含特异性或选择性地扩增微生物基因组的预定独特核酸序列、与所述预定独特核酸序列结合、杂交和/或检测所述预定独特核酸序列的引物和探针,以及扩增一个或多个基因中的核酸序列、与所述核酸序列结合、杂交和/或检测所述核酸序列的引物和探针,所述一个或多个基因在生物体(例如,微生物)的分类学类别(例如,域、界、门、类、目、属、种)的大多数或基本上所有成员中是同源的,但在不同生物体之间有所不同。在某些实施例中,此类核酸含有一种或多种促进核酸的操作和/或多重扩增的修饰。例如,此类修饰包含相对于不包含修饰的核酸增加核酸对切割的易感性的修饰。在一些实施例中,所述核酸包含用作用于扩增靶核酸的引物(例如,引物对)的一对或多对核酸,如例如,微生物种所独有的特异性核酸或多种不同微生物共有的同源基因(例如,16S核糖体RNA(rRNA)基因)内含有的一种或多种或多种核酸。例如,在某些实施例中,所述核酸包含一个或多个引物对,其单独地扩增原核16S rRNA基因中的两个或更多个区域,例如高变区。在一些实施例中,所述核酸包含多个引物对的组合。在某些实施例中,多个引物对的所述组合被设计成以种靶向和/或界涵盖的方式扩增样品中的一种、一些、大部分或基本上所有微生物(如例如,细菌)中的核酸。本文还提供了含有核酸混合物的组合物,其中大部分或基本上所有核酸含有微生物(例如,细菌)基因组的一部分的序列。在一些实施例中,所述微生物基因组部分的所述序列长度小于250个核苷酸或为约250个核苷酸。在一些实施例中,所述核酸包含含有尿嘧啶核碱基的核苷酸。在一些实施例中,所述组合物含有一种或多种或多种引物,例如本文所述的任何实施例的核酸和/或引物对。在一些实施例中,所述组合物包含DNA聚合酶、DNA连接酶和/或至少一种尿嘧啶切割或修饰酶。
在本文提供的扩增方法的一些实施例中,使用本文所述的核酸作为扩增引物对核酸进行扩增。在一些实施例中,所述核酸扩增是多重扩增。在一些实施例中,所述扩增方法包含多个核酸引物,例如引物对,其单独地扩增一个或多个基因中的两个或更多个区域,所述一个或多个基因在生物体的分类学类别(例如,域、界、门、类、目、属、种)的大多数或基本上所有成员中是同源的。例如,在一些实施例中,多个核酸引物包含单独地扩增原核16SrRNA基因中的一个或多个或多个高变区的引物或引物对。在一些实施例中,所述扩增方法包含一个或多个或多个核酸引物,例如引物对,其扩增生物体种(例如,如细菌等微生物)所独有的特异性核酸。在一些实施例中,所述扩增方法包含:多个核酸引物,例如引物对,其包含单独地扩增一个或多个基因中的两个或更多个区域的引物的组合,所述一个或多个基因在生物体的分类学类别的大多数或基本上所有成员中是同源的;以及一个或多个或多个核酸引物,例如引物对,其扩增生物体种所独有的特异性核酸。在一些实施例中,用于扩增方法的引物包含含有本文提供的核酸或由本文提供的核酸组成的核酸和/或能够扩增含有本文提供的靶序列或基本上由本文提供的靶序列组成的核酸的核酸。
在检测和/或测量本文提供的核酸的方法的一些实施例中,本文所述的核酸用作引物和/或探针。例如,在检测和/或测量核酸的一些方法中,使用本文所述的核酸作为扩增引物对核酸进行核酸扩增,并检测是否存在一种或多种核酸扩增产物。在一些实施例中,所述扩增使用多个核酸引物对进行并且在单个多重扩增反应混合物中进行。在一些实施例中,根据本文提供的扩增方法使用本文所述的任何一种或多种引物或引物或引物对的组合进行扩增。在一些实施例中,使核酸与含有本文所述核酸的探针在杂交条件下接触,并检测是否存在所述杂交探针。在一些实施例中,使用本文提供的一种或多种核酸作为探针(例如,可检测的或标记的探针)来检测是否存在一种或多种核酸扩增产物。在一些实施例中,通过获得一种或多种核酸扩增产物的核苷酸序列信息来检测是否存在一种或多种核酸扩增产物。在一些实施例中,测量并确定检测到的扩增产物的水平(绝对或相对)。在一些实施例中,测量并确定检测到的杂交探针的水平(绝对或相对)。在一些实施例中,被检测和/或测量的核酸是微生物(例如,细菌)的核酸。在一些实施例中,被检测和/或测量的核酸是样品中的或来自样品的核酸,例如,生物体消化道内容物的样品。
本文还提供了组合物和方法,以及包含所述组合物和方法的组合、试剂盒和系统,用于对样品(例如,生物样品),例如动物消化道内容物的样品中的微生物(例如,细菌)群体和/或其组分或组成进行表征、评估、剖析和/或测量。在一些实施例中,用于对样品中的微生物群体进行表征、评估、剖析和/或测量的方法包含使用特异性地扩增微生物基因组的预定独特核酸序列的核酸引物对和/或扩增出现在同源基因或基因组区域中的核酸序列的引物对的组合来对样品中的或来自样品的核酸进行核酸扩增,所述同源基因或基因组区域是多种微生物共有的,但在不同微生物之间存在差异。在特定实施例中,扩增出现在同源基因或基因组区域中的核酸序列的所述引物对包含一个或多个引物对,其扩增包括原核16SrRNA基因的一个或多个高变区的核苷酸序列的核酸。在一些实施例中,使用核酸引物对的组合的所述扩增在单个多重扩增反应混合物中进行。在一些实施例中,用于对微生物群体进行表征、评估、剖析和/或测量的方法包含使用引物对的组合从扩增的核酸产物中获得序列信息和/或确定扩增的核酸产物的水平(例如,相对和/或绝对水平)并使用序列信息和/或水平确定来鉴定所述样品中微生物的属和所述样品中一种或多种微生物的种,以及任选地其相对和/或绝对水平,以对所述样品中的微生物群体和/或其组分或组成进行表征、评估、剖析和/或测量。
本文还提供了组合物和方法,以及包含所述组合物和方法的组合、试剂盒和系统,用于受试者中的微生物(例如,细菌)失衡和/或生态失调以及与之相关的病状、病症和疾病的诊断和/或治疗、症状减轻或预防。例如,在一些情况下,所述微生物失衡和/或生态失调在所述受试者的消化道或胃肠道中。在一些实施例中,受试者中的微生物失衡和/或生态失调的诊断和/或治疗、症状减轻或预防包含:对来自受试者的一个或多个样品中的或来自所述一个或多个样品的核酸进行核酸扩增;获得所述核酸扩增产物的序列信息;检测所述样品中是否存在一种或多种微生物;以及检测所述样品中是否存在不成比例水平的一种或多种微生物,其中不成比例水平的一种或多种微生物的存在指示所述受试者中的微生物失衡和/或生态失调。在治疗具有微生物失衡和/或生态失调的受试者的一些实施例中,治疗具有不成比例水平的一种或多种微生物的受试者以在所述受试者中建立微生物或生命现象(biosis)的平衡。在一些实施例中,使用多个核酸引物对进行所述扩增。在一些实施例中,检测样品中是否存在一种或多种微生物包含鉴定所述样品中一种或多种微生物的属。在一些实施例中,检测样品中是否存在一种或多种微生物包含鉴定所述样品中一种或多种微生物的属和鉴定所述样品中微生物的一个或多个种。在一些实施例中,使用特异性地扩增微生物基因组的预定独特核酸序列的核酸引物对的组合和/或扩增出现在同源基因或基因组区域中的核酸序列的引物对来进行扩增,所述同源基因或基因组区域是多种微生物共有的,但在不同微生物之间存在差异。在特定实施例中,扩增出现在同源基因或基因组区域中的核酸序列的所述引物对包含一个或多个引物对,其扩增包括原核16S rRNA基因的一个或多个高变区的序列的核酸。在一些实施例中,所述扩增在单个多重扩增反应混合物中进行。在一些实施例中,获得核酸扩增产物的核苷酸序列信息包含使用本文提供的核酸作为探针(例如,可检测的或标记的探针)来检测核苷酸序列。在一些实施例中,获得核酸扩增产物的核苷酸序列信息包含对所述扩增产物进行测序。在一些实施例中,检测所述样品中是否存在不成比例水平的一种或多种微生物包含确定所述样品中一种或多种微生物的相对水平。在一些实施例中,治疗具有不成比例水平的一种或多种微生物的受试者包含向所述受试者施用一种或多种微生物和/或一种或多种降低某些微生物的水平或消除某些微生物的组合物,例如,含抗生素的组合物。
根据本申请中体现的教导和原理,提供了新的方法、系统和非暂时性机器可读存储介质来压缩参考序列数据库,所述参考序列数据库用于映射序列读段以用于微生物群体的分析和剖析。
附图说明
并入到说明书中且形成说明书的一部分的随附图式说明一个或多个示例性实施例且用以解释各个示例性实施例的原理。图式仅是示例性和解释性的,且不应理解为以任何方式限制或约束。
图1是描绘原核16S核糖体RNA(rRNA)基因的结构的图示,其示出了散布在基因的保守区(未标记的白色框)之间的9个高变区101(标记为V1-V9的框)。基因上方的箭头描绘了正向和反向引物,它们与指定位置处的8个靶向保守高变节段区域102的序列杂交以扩增箭头之间的高变区域。
图2说明了用于分析本文提供的方法中产生的核苷酸序列信息的工作流程。
图3是用于处理从使用16S rRNA基因引物扩增微生物核酸中产生的扩增核酸测序获得的序列读段数据的示例性工作流程的框图。
图4是处理从使用种特异性核酸引物扩增微生物核酸中产生的扩增核酸测序获得的序列读段数据的示例性工作流程的框图。
图5A和图5B各自是使用斯皮尔曼相关系数(Spearman's rho)的分析的结果的图形表示,所述分析比较了使用用于扩增的16S rRNA基因引物池(图5A)或使用用于扩增的种特异性引物池(图5B)从六个细菌样品产生的DNA扩增子文库的四个重复等分试样的测序数据。
图6A是条形图,其示出了来自使用用于核酸扩增的16S rRNA基因引物池对从混合细菌样品产生的DNA扩增子文库进行的测序的读段分析结果。示出了映射到不同细菌属的读段的数量。图6B描绘了来自所述分析的分析学。
图7示出了使用用于扩增的16S引物池对由细菌DNA混合物(样品1号(MSA1002))产生的文库的四个重复等分试样的测序结果的斯皮尔曼相关系数分析图。
图8A是条形图,其示出了来自使用用于核酸扩增的种特异性基因引物池对从混合细菌样品产生的DNA扩增子文库进行的测序的读段分析结果。示出了映射到不同细菌种的读段的数量。图6B描绘了来自所述分析的分析学。
图9示出了使用用于扩增的种特异性引物池对由细菌DNA混合物(样品1号(MSA1002))产生的文库的四个重复等分试样的测序结果的斯皮尔曼相关系数分析图。
图10是描绘核酸测序平台的各个实施例的框图,例如,测序仪器200可以包含流体递送和控制单元202、样品处理单元204、信号检测单元206以及数据采集、分析和控制单元208。
具体实施方式
对各种示例性实施例的以下描述仅是示例性和说明性的,并且不应以任何方式解释为有限或限制性的。根据说明书和附图以及权利要求,本教导的其它实施例、特征、目的和优点将显而易见。除非另外定义,否则本文所使用的所有技术和科学术语都具有与本发明所属领域的普通技术人员通常所理解的含义相同的含义。
本文提供了组合物和方法,以及包含所述组合物和方法的组合、试剂盒和系统,用于核酸,如微生物(包含微生物,例如细菌)的核酸的扩增、检测、表征、评估、剖析和/或测量。本文提供的组合物和方法能够对含有复杂微生物群体和其它生物材料(例如,不是微生物的细胞)的样品中的一种或多种微生物进行高度灵敏、特异性、准确、可重复的检测和鉴定。所述组合物和方法进一步提供了对此类样品中不同微生物的相对和/或绝对水平或丰度的准确确定。本文提供的组合物和方法的这些和其它方面使它们理想地适用于例如许多方法,包含但不限于用于评估或表征样品(例如,生物样品)中的微生物群体的准确且全面的方法,或用于诊断和/或治疗受试者中的微生物失衡和/或生态失调、减轻所述微生物失衡和/或生态失调的症状或预防所述微生物失衡和/或生态失调的方法,包含本文描述和提供的此类方法。在一些实施例中,所述组合物和方法进一步能够在单个扩增反应混合物中实现微生物核酸的多重(包含高度多重)扩增,从而提供对来自大量不同微生物的核酸的快速、高通量、灵敏且易于识别的扩增,所述大量不同微生物例如可以在许多不同的样品中发现,如来自食物、水、土壤和动物(例如人类)样本,如生物流体(例如,唾液、痰、粘液、血液、尿液、精液)、组织、皮肤、呼吸道、泌尿生殖道和动物消化道(例如肠道)的微生物群。在一些实施例中,本文提供的方法包含用于对微生物群体进行准确、灵敏、高通量的评估、表征或剖析的多重下一代测序工作流程,其用于例如将受试者的微生物组成(例如,受试者的消化道、胃肠道、消化管或其部分的微生物群)与健康状态和疾病或病症相关联。
定义
如本文所使用的,术语“包括(comprises/comprising)”、“包含(includes/including)”、“具有(has/having)”或其任何其它变化形式打算涵盖非排他性的包括。例如,包括一系列特征的过程、方法、物品或设备并不一定仅限于那些特征,而是可以包含未明确列出的或为此类过程、方法、物品或设备所固有的其它特征。此外,除非明确相反地陈述,否则“或”是指包括性的或而非排他性的或。
如本文所使用的,“生物体”是指生命形式或生物。生物体的实例包含微生物、单细胞生物体、多细胞生物体、植物和动物。动物的实例包含昆虫、鱼类、鸟类和哺乳动物,包含人类和非人类哺乳动物。
如本文所使用的,“受试者”是指生物体,通常是动物,例如人类或非人类动物,如哺乳动物,其是研究、调查、治疗的焦点和/或从中寻找和/或获得信息和/或材料(例如,样品或样本)。在一些情况下,受试者可以是患者。
如本文所使用的,与本文中的“微生物(microbe)”可互换使用的“微生物(microorganism)”是指具有微观或亚微观大小的生物体。微生物的实例包含细菌、古细菌、原生生物和真菌。许多微生物是单细胞的,并且能够分裂和增殖。微生物包含原核生物,例如细菌,和非原核生物体,例如真核生物体。
如本文所使用的,“微生物群”是指栖息在特定生物生态位或生态系统中的微生物的集合、群体或群落。发现微生物群的环境包含土壤、水、热液喷口和宿主,例如动物宿主。例如,人类微生物群由定居于人类(如人类组织和生物体液之上或之内)的微生物的阵列组成。人类微生物群中有几个栖息地,如皮肤、口腔黏膜、呼吸道、结膜、泌尿生殖道和消化道或消化管,或胃肠道,通常被称为“肠道”微生物群。微生物群中所有微生物细胞的遗传组分(例如,基因和基因组)在本文中被称为“微生物组”。
如本文所使用的,关于样品中微生物(例如细菌)的检测和/或鉴定的“灵敏度”是检测或鉴定微生物的方法的性能度量,例如在该属和/或种水平下,即基于计算真阳性率,即被正确鉴定的实际阳性的比例。例如,确定核酸测序灵敏度的一种方法以及检测或鉴定微生物的分析方法是对微生物的已知对照样品执行该方法,然后确定正确且明确地分配给样品中的特定属或种的序列读段的百分比。检测或鉴定的灵敏度越高,检测样品中特定属或种的实际存在的失败次数就越少。
如本文所使用的,关于样品中微生物(例如细菌)的检测和/或鉴定的“特异性”是检测或鉴定微生物的方法的性能度量,例如在该属和/或种水平下,即基于计算真阴性率,即被正确鉴定的实际阴性的比例。例如,确定核酸测序特异性的一种方法以及检测或鉴定微生物的分析方法是对已知不包含特定微生物的微生物的已知对照样品执行该方法,然后确定错误地分配给样品中不存在的特定属或种的序列读段的百分比。检测或鉴定的特异性越高,鉴定样品中特定属或种的错误数量就越少。
如本文所使用的,术语“核酸”是指天然核酸、人工核酸、其类似物或其组合,包含多核苷酸和寡核苷酸。如本文所使用的,术语“多核苷酸”和“寡核苷酸”可互换使用,并且意指核苷酸的单链、双链、部分双链聚合物,包含但不限于通过核苷酸间磷酸二酯键连接例如3'-5'和2'-5'、反向连接例如3'-3'和5'-5'、支链结构或类似物核酸连接的2'-脱氧核糖核苷酸(DNA)和核糖核苷酸(RNA)。部分双链核酸的实例包含,例如,具有5'和/或3'单链突出端的双链分子。多核苷酸具有相关的抗衡离子,例如H+、NH4+、三烷基铵、Mg2+、Na+等。寡核苷酸可以完全由脱氧核糖核苷酸构成,完全由核糖核苷酸构成,或由其嵌合混合物构成。寡核苷酸可以包括核碱基和糖类似物。聚核苷酸的大小通常在几个,例如5-40个单体单元(当其在所属领域中更普遍被称为寡核苷酸时)到数千个单体核苷酸单元(当其在所属领域中更普遍被称为聚核苷酸时)范围内;然而,出于本公开的目的,寡核苷酸和聚核苷酸都可以具有任何合适的长度。除非另外表示,否则每当表示寡核苷酸序列时,应理解,核苷酸从左到右呈5'到3'顺序,并且“A”表示脱氧腺苷,“C”表示脱氧胞苷,“G”表示脱氧鸟苷,“T”表示胸苷,并且“U”表示脱氧尿苷。如在本领域中标准的,字母A、C、G和T可以用于指碱基本身、核苷或包括碱基的核苷酸。寡核苷酸被称为具有“5'端”和“3'端”,因为单核苷酸通常通过将5'磷酸或一个核苷酸的等同基团连接到(任选地通过磷酸二酯或其它合适的键)其相邻核苷酸的3'羟基或等同基团而反应形成寡核苷酸。
如本文所使用的,术语“核苷酸”及其变型包括任何化合物,包含但不限于任何天然存在的核苷酸或其类似物,其能够与另一核苷酸杂交和/或可以结合至聚合酶,或可以通过聚合酶聚合。典型地但未必,核苷酸与聚合酶的选择性结合后面是核苷酸通过聚合酶聚合成核酸链;然而偶尔,核苷酸可从聚合酶解离而不变得并入到核酸链中,这是在本文中被称为“非生产性”事件的事件。此类核苷酸不仅包含天然存在的核苷酸,而且包含可与聚合酶选择性结合或可通过聚合酶聚合的任何类似物(与其结构无关)。虽然天然存在的核苷酸通常包括碱基、糖和磷酸酯部分,但本公开的核苷酸可以包含不具有此类部分中的任一个、一些或全部的化合物。在一些实施例中,核苷酸可以任选地包含包括三个、四个、五个、六个、七个、八个、九个、十个或更多个磷原子的磷原子链。在一些实施例中,磷链可以连接到糖环的任何碳,如5'碳。可以用中间的O或S将磷链与糖连接。在一个实施例中,链中的一个或多个磷原子可以是具有P和O的磷酸基的一部分。在另一个实施例中,链中的磷原子可以用中间的O、NH、S、亚甲基、经取代亚甲基、亚乙基、经取代亚乙基、CNH2、C(O)、C(CH2)、CH2CH2、或C(OH)CH2R(其中R可以为4-吡啶或1-咪唑)连接在一起。在一个实施例中,链中的磷原子可以具有含O、BH3或S的侧基。在磷链中,具有除O之外的侧基的磷原子可以是经取代的磷酸基。在磷链中,具有除O之外的中间原子的磷原子可以是经取代的磷酸基。核苷酸类似物的一些实例描述于Xu的美国专利第7,405,281号中。在一些实施例中,核苷酸包括标记并且在本文中被称为“经标记的核苷酸”;经标记的核苷酸的标记在本文中被称为“核苷酸标记”。在一些实施例中,标记可呈连接到末端磷酸基(即距离糖最远的磷酸基)的荧光染料形式。可以用于所公开的方法和组合物中的核苷酸的一些实例包含但不限于核糖核苷酸、脱氧核糖核苷酸、经修饰的核糖核苷酸、经修饰的脱氧核糖核苷酸、核糖核苷酸聚磷酸、脱氧核糖核苷酸聚磷酸、经修饰的核糖核苷酸聚磷酸、经修饰的脱氧核糖核苷酸聚磷酸、肽核苷酸、经修饰的肽核苷酸、金属核苷、膦酸核苷和经修饰的磷酸-糖主链核苷酸,前述化合物的类似物、衍生物或变体等。在一些实施例中,核苷酸可以包括非氧部分(如硫基或硼烷部分)代替氧部分,所述氧部分桥连核苷酸的α磷酸酯与糖,或核苷酸的α与β磷酸酯,或核苷酸的β与γ磷酸酯,或在核苷酸的任何其它两种磷酸酯之间,或其任何组合。“核苷酸5'-三磷酸”是指在5'位置具有三磷酸酯基并且有时表示为“NTP”或“dNTP”和“ddNTP”以特别指出核糖的结构特征的核苷酸。三磷酸酯基可以包含硫取代各种氧,例如α-硫基-核苷酸5'-三磷酸。关于核酸化学的综述,参见:Shabarova,Z.和Bogdanov,A.,《核酸的高级有机化学(Advanced Organic Chemistry of Nucleic Acids)》,德国化学学会出版社(VCH),纽约(New York),1994。
如本文所使用的,术语“杂交”符合其在所属领域中的用途,并且指用于使两个核酸分子进行碱基配对相互作用的方法。当一个核酸分子的任何部分与另一个核酸分子的任何部分碱基配对时,两个核酸分子分子被称为杂交;未必需要两个核酸分子跨越其整个相应长度杂交并且在一些实施例中,至少一个核酸分子可以包含不与另一个核酸分子杂交的部分。“杂交条件”是适合于含有能够进行碱基配对相互作用的核苷酸序列的两个核酸杂交的条件(例如,温度、离子强度等)。短语“在严格条件下杂交”及其变型是指两个核酸序列(例如靶特异性引物和靶序列)在存在高杂交温度和低离子强度的情况下发生杂交的条件。在一个示例性实施例中,严格杂交条件包含在约60-68℃下含有约30mM硫酸镁、约300mMTris-硫酸盐(pH8.9)和约90mM硫酸铵的水性环境或其等效物。如本文所使用的,短语“标准杂交条件”及其变型是指两种核酸在存在高杂交温度和低离子强度的情况下发生杂交的条件。在一个示例性实施例中,标准杂交条件包含在约50-55℃下含有约100mM硫酸镁、约500mM Tris-硫酸盐(pH 8.9)和约200mM硫酸铵的水性环境或其等效物。
如本文所使用的,术语“同一性”和“相同的”及其变型,当用于提及两个或更多个核酸序列时,是指两个或更多个序列(例如,核苷酸或多肽序列)的序列相似性。在两个或更多个同源序列的情况下,序列或其子序列的同一性、相似性或同源性百分比指示相同(即,约70%同一性或更多,约75%、80%、85%、90%、95%、98%或99%同一性)的所有单体单元(例如,核苷酸或氨基酸)的百分比。同一性百分比可在规定区内,当出于比较窗内的最大对应而比较和比对时,或在指定区内,如使用BLAST或BLAST 2.0序列比较算法用下文所描述的默认参数或通过手动比对和目视检查所测量。当氨基酸水平或核苷酸水平存在至少85%同一性时,序列被称为“基本上相同”。优选地,同一性存在于至少约25、50或100个残基长的区内或至少一个所比较的序列的整个长度上。用于确定序列同一性百分比和序列类似性的典型算法为BLAST和BLAST 2.0算法,其描述于Altschul等人,《核算研究(Nuc.AcidsRes.)》25:3389-3402(1977)中。其它方法包含Smith和Waterman,《应用数学进展(Adv.Appl.Math.)》2:482(1981)以及Needleman和Wunsch,《分子生物学杂志(J.Mol.Biol.)》48:443(1970)描述的算法等。两个核酸序列基本上相同的另一个指示是,两个分子或其补体在严格杂交条件下彼此杂交。
如本文中所使用,术语“互补”和“补体”以及其派生词指可在反平行定向中(如在杂交双螺旋中)的两个或更多个独立对应位置经历累积碱基配对的任何两个或更多个核酸序列(例如部分或全部模板核酸分子、靶序列和/或引物)。此类碱基配对可根据任何现有规则集合进行,例如根据沃森-克里克碱基配对规则或根据一些其它碱基配对范例。任选地,在第一与第二核酸序列之间可存在“完全”或“总体”互补,其中在第一核酸序列中的每个核苷酸可进行与第二核酸序列上的对应的反平行位置中的核苷酸的稳定化碱基配对相互作用。“部分”互补描述一个核酸序列的至少20%但少于100%的残基与在另一个核酸序列中的残基互补的核酸序列。在一些实施例中,一个核酸序列的至少50%但少于100%的残基与在另一个核酸序列中的残基互补。在一些实施例中,一个核酸序列的至少70%、80%、90%、95%或98%但少于100%的残基与在另一个核酸序列中的残基互补。当一个核酸序列中的至少85%的残基与另一个核酸序列中的残基互补时,序列被称为“基本上互补”。在一些实施例中,两个互补或基本上互补序列能够在标准或严格杂交条件下彼此杂交。“不互补”描述其中一个核酸序列的少于20%的残基与在另一个核酸序列中的残基互补的核酸序列。当一个核酸序列中的少于15%的残基与在另一个核酸序列中的残基互补时,序列被称为“基本上不互补”。在一些实施例中,两个不互补或基本上不互补序列无法在标准或严格杂交条件下彼此杂交。“错配”存在于不互补的两个相对核苷酸中的任何位置。互补核苷酸包含在生理条件下,在DNA复制期间通过彼此相对的DNA聚合酶有效并入的核苷酸。在典型的实施例中,在彼此位于反平行位置的核苷酸和/或多核苷酸的核碱基之间,互补核苷酸可彼此形成碱基对,如通过特异性沃森-克里克型氢键形成的A-T/U和G-C碱基对,或通过某种其它类型的碱基配对范例形成的碱基对。其它人工碱基对的互补性可以是基于其它类型的氢键和/或碱基的疏水性和/或碱基之间的形状互补性。
如本文所使用的,“样品”及其派生词以其最广泛含义使用并且包含可能包含目标组合物(如靶标)的任何样本、培养物等。在一些实施例中,样品包括cDNA、RNA、PNA、LNA、嵌合、杂交或多重形式的核酸。样品可以包含任何含有一种或多种生物体和/或核酸的基于生物、临床、手术、农业、大气或水的样本。生物或临床样品的一个实例是动物消化道内容物的样品。消化道是一条连续的通道,从口腔开始,到肛门结束,食物和液体通过其被摄入、消化和吸收,并且废弃物通过其被处理和消除。消化道或消化道在本文中也被称为胃肠道和肠道,并且包含多个器官。来自消化道的样品的实例是粪便样品。在一些情况下,样品中的至少一些核酸可以包含在细胞内。在一些情况下,可以从样品中的一个或多个细胞中提取核酸。在一些情况下,术语“核酸样品”可以指含有在细胞或生物体内或不在细胞或生物体内的核酸和/或从样品中提取的核酸的样品。所述术语还包含任何经分离的核酸样品,如经表达的RNA、新鲜冷冻或福尔马林(formalin)固定石蜡包埋的核酸样本。
如本文所使用的,“同源的”或“同源物”及其派生词,当用于提及基因组或基因的一部分时,是指在多种生物体(例如,域、界、门、纲、目、科、属和/或种的多种生物体)中显示具有实质上的序列相似性的保守序列但在序列上也有差异的基因组节段或基因。同源基因的实例包含但不限于16S rRNA基因、18S rRNA基因、23S rRNA基因和ABC转运蛋白基因。
如本文所使用的,“独特的”,当用于提及生物体或生物体群组中的核酸序列时,是指生物体或生物体群组中的核酸(例如,基因组的节段或部分)的核苷酸序列,所述核苷酸序列与其它生物体或其它生物体群组的基因组中的序列有足够的不同,使得其可以用于选择性地检测或鉴定生物体或生物体群组的成员,和/或将生物体或生物体群组的成员与一些、大部分、大多数或基本上所有不同的生物体或不属于该生物体群组的生物体区分开来。这种独特的序列在本文中也被称为生物体或生物体群组的核酸的“特征序列”或“特征区域”。例如,核苷酸的核酸序列可以是个体生物体所独有的、一个生物体种的菌株的成员所独有的、一个生物体种的成员所独有的、一个生物体属的成员所独有的、一个生物体科的成员所独有的、一个生物体目的成员所独有的、一个生物体纲的成员所独有的、一个生物体门的成员所独有的、一个生物体界的成员所独有的和/或一个生物体域的成员所独有的。通常,独特序列的差异是序列中连续核苷酸或核碱基的同一性和/或顺序。在一些实施例中,与一些特定的生物体群组(例如,同一界、门、纲、目、科、属、种中的生物体)相比或就一些特定的生物体群组而言,独特序列是生物体所独有的,但与所有其它生物体或指定组之外的所有其它生物体的总和相比,可能不是该生物体所独有的。独特的核苷酸序列可以是任何长度,例如,介于约20和1000个核苷酸之间、30和750个核苷酸之间、40和500个核苷酸之间、50和400个核苷酸之间、50和350个核苷酸之间、50和300个核苷酸之间、50和250个核苷酸之间、50和200个核苷酸之间、50和150个核苷酸之间或50和100个核苷酸之间。在一些实施例中,独特的核苷酸序列的长度可以是约1000个核苷酸或更少、约750个核苷酸或更少、约500个核苷酸或更少、约400个核苷酸或更少、约350个核苷酸或更少、约300个核苷酸或更少、约250个核苷酸或长度为更少、约200个核苷酸或更少、约150个核苷酸或更少、约100个核苷酸或更少或约50个核苷酸或更少。在一些实施例中,独特的核苷酸序列的长度可以大于约25个核苷酸、大于约40个核苷酸、大于约50个核苷酸、大于约60个核苷酸、大于约70个核苷酸、大于约75个核苷酸、大于约90个核苷酸核苷酸、大于约95个核苷酸、大于约100个核苷酸、大于约150个核苷酸、大于约175个核苷酸、大于约200个核苷酸、大于约250个核苷酸、大于约275个核苷酸、大于约300个核苷酸、大于约325个核苷酸、大于约350个核苷酸或大于约400个核苷酸。在一些实施例中,独特的序列使得其可用于通过与特异性或选择性或独特地与独特序列结合、杂交和/或扩增所述独特序列的特异性核酸探针和/或引物结合、杂交和/或被其扩增来选择性地检测、鉴定和/或区分生物体或生物体群组的成员,具体地说,在存在其它生物体或不属于该生物体群组成员的生物体的核酸的情况下。例如,在一些实施例中,生物体(例如,微生物,如细菌)或生物体群组的独特或特征序列是与不同生物体或特定生物体群组中的核苷酸序列具有小于60%、小于65%、小于70%、小于75%、小于80%、小于81%、小于82%、小于83%、小于84%、小于85%、小于86%、小于87%、小于88%、小于89%、小于90%、小于91%、小于92%、小于93%、小于94%或小于95%的同一性的序列。在一些实施例中,独特序列与不同生物体或特定生物体群组中的核苷酸序列具有小于90%的同一性。在一些实施例中,生物体(例如,微生物,如细菌)或生物体群组的独特或特征序列具有少于25%、少于20%、少于19%、少于18%、少于17%、少于16%、少于15%、少于14%、少于13%、少于12%、少于10%的核苷酸与不同生物体或特定生物体群组中长度相似的核苷酸序列中的核苷酸相匹配。在一些实施例中,独特序列具有少于17%的核苷酸与不同生物体或特定生物体群组中的核苷酸序列中的核苷酸相匹配。在一些实施例中,独特序列与不同生物体或特定生物体群组中的核苷酸序列具有小于90%的同一性,并且具有少于17%的核苷酸与不同生物体或特定生物体群组中的核苷酸序列中的核苷酸相匹配。在一些实施例中,生物体群组(例如,细菌种)内的独特序列在该组(例如,种)的大多数或基本上所有成员(例如,种的菌株)中为至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%相同。在一些实施例中,生物体群组内的独特序列在该组的大多数或基本上所有成员(例如,种的菌株)中为至少95%、至少96%、至少97%相同。在一些实施例中,生物体群组内的独特序列的特定同一性在至少或大于75%、至少或大于80%、至少或大于85%、至少或大于90%或至少或大于95%的该组成员中。在一些实施例中,生物体群组(例如,细菌种)内的独特序列的核苷酸序列在该组成员中具有至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%的匹配核苷酸。在一些实施例中,生物体群组内的独特序列的核苷酸序列在该组成员中具有至少95%的核苷酸匹配。在一些实施例中,生物体群组(例如,细菌种)内的独特序列在至少或大于90%的该组成员中为至少95%相同,并且具有至少95%的核苷酸匹配。
如本文所使用的,“合成”及其派生词是指涉及聚合酶的核苷酸聚合的反应,任选地以模板依赖性方式。聚合酶通过将核苷一磷酸从核苷三磷酸(NTP)、脱氧核苷三磷酸(dNTP)或双脱氧核苷三磷酸(ddNTP)转移至延伸的寡核苷酸链的3'羟基来合成寡核苷酸。出于本公开的目的,合成包含经由从脱氧核苷三磷酸转移核苷一磷酸来连续延伸杂交的衔接子或靶特异性引物。
如本文所用,“聚合酶”及其派生词指可催化核苷酸(包含其类似物)聚合成核酸链的任何酶。通常但未必,此类核苷酸聚合可以模板依赖性方式进行。此类聚合酶可以包含但不限于天然存在的聚合酶和其任何子单元和截短物、突变型聚合酶、变异型聚合酶、重组、融合或以其它方式工程改造的聚合酶、经化学修饰的聚合酶、合成分子或组合件以及保留催化此类聚合的能力的任何类似物、衍生物或其片段。任选地,聚合酶可以是包括一个或多个突变的突变型聚合酶,所述突变涉及用其它氨基酸置换一个或多个氨基酸,来自聚合酶的一个或多个氨基酸的插入或缺失或两个或更多个聚合酶的部分的连接。典型地,聚合酶包括可以进行核苷酸结合和/或核苷酸聚合催化的一个或多个活性位点。一些示例性聚合酶包含但不限于DNA聚合酶和RNA聚合酶。如本文所使用的,术语“聚合酶”和其变化形式还指包括至少两个彼此连接的部分的融合蛋白质,其中第一部分包括可催化核苷酸聚合成核酸链的肽并且所述第一部分连接到包括第二多肽的第二部分。在一些实施例中,第二多肽可以包含报告基因酶或增强持续合成能力的结构域。任选地,聚合酶可以具有5'核酸外切酶活性或末端转移酶活性。在一些实施例中,聚合酶可以任选地再活化,例如通过使用热、化学物质或将新的量的聚合酶再添加到反应混合物中。在一些实施例中,聚合酶可以包含可任选地再活化的热起始聚合酶或基于适体的聚合酶。
如本文所使用的,“扩增(amplify/amplifying)”或“扩增反应”及其派生词是指复制或拷贝至少一部分核酸分子(被称为模板核酸分子,其可以含有靶序列)到至少一种另外的核酸分子中的任何作用或过程。另外的核酸分子任选地包含与模板核酸分子的至少一些部分基本上相同或基本上互补的序列。模板核酸分子可为单链或双链并且另一个核酸分子可独立地为单链或双链。在一些实施例中,扩增包含模板依赖性体外酶催化反应,其用于制备核酸分子的至少某一部分的至少一个拷贝或制备与核酸分子的至少某一部分互补的核酸序列的至少一个拷贝。扩增任选地包含核酸分子的线性或指数复制。在一些实施例中,使用等温条件进行此类扩增;在其它实施例中,此类扩增可以包含热循环。在一些实施例中,扩增为多重扩增,其包含在单个扩增反应中同时扩增多个靶序列。至少一些靶序列可以位于单个扩增反应中所包含的相同核酸分子或不同靶核酸分子上。在一些实施例中,“扩增”包含单独或呈组合形式的基于DNA和RNA的核酸的至少某一部分的扩增。扩增反应可以包含单链或双链核酸底物,并且可以进一步包含本领域的普通技术人员已知的任何扩增技术过程。在一些实施例中,扩增反应包含聚合酶链反应(PCR)。
如本文所使用的,“扩增条件”及其派生词是指适用于扩增一个或多个核酸序列的条件。此类扩增可以是线性或指数的。在一些实施例中,扩增条件可以包含等温条件或可替代地可以包含热循环条件或等温和热循环条件的组合。在一些实施例中,适用于扩增一个或多个核酸序列的条件包含聚合酶链反应(PCR)条件。通常,扩增条件是指足以扩增如一个或多个靶序列的核酸或扩增连接到一个或多个衔接子的扩增的靶序列(例如,衔接子连接的扩增的靶序列)的反应混合物。扩增条件包含用于扩增或用于核酸合成的催化剂,例如聚合酶;与待扩增的核酸具有一定程度的互补的引物;以及核苷酸,如脱氧核糖核苷酸三磷酸酯(dNTP),以促进与核酸杂交之后引物的延伸。扩增条件可能需要引物与核酸的杂交或退火、引物的延伸和解离步骤,例如变性,其中延伸的引物与经历扩增的核酸序列分离。通常但未必,扩增条件可以包含热循环;在一些实施例中,扩增条件包含重复退火、延伸和分离的扩增步骤的多个循环。通常,扩增条件包含阳离子,如Mg++或Mn++(例如MgCl2等),并且还可以包含多种离子强度调节剂。
如本文中所定义的,“多重扩增”是指使用至少一种特异性引物进行的样品内的两个或更多个靶序列的选择性和非随机扩增。在一些实施例中,进行多重扩增,使得一些或全部靶序列在单个反应容器内扩增。既定多重扩增的“重数(plexy)”或“重(plex)”是指在所述单个多重扩增期间扩增的不同靶特异性序列的数目。在一些实施例中,重数可以是约12重、24重、48重、74重、96重、120重、144重、168重、192重、216重、240重、264重、288重、312重、336重、360重、384重或398重。
本文所用的术语“聚合酶链式反应”(“PCR”)是指K.B.Mullis美国专利第4,683,195号和第4,683,202号的方法,在此以引用的方式并入,其描述用于在不进行克隆或纯化的情况下增加基因组RNA或cDNA的混合物中目标多核苷酸的节段的浓度的方法。这种用于扩增目标多核苷酸的过程由以下组成:将大量过量的两种寡核苷酸引物引入含有所需目标多核苷酸的DNA混合物,接着在DNA聚合酶存在下热循环的精确序列。两种引物与目标双链多核苷酸的其相应链互补。为了实现扩增,使混合物变性,并且接着使引物退火到目标多核苷酸分子内的其互补序列。在退火之后,用聚合酶使引物延伸以形成一对新的互补链。变性、引物退火和聚合酶延伸的步骤可重复多次(即,变性、退火和延伸构成一个“循环”;可存在许多“循环”)以获得高浓度的所需目标多核苷酸的经扩增的节段。所需目标聚核苷酸的经扩增的节段(扩增子)的长度通过引物相对于彼此的相对位置确定,并且因此此长度为可控参数。借助于重复所述过程,所述方法被称为“聚合酶链反应”(在下文中称为“PCR”)。因为目标聚核苷酸的所需经扩增的节段变成混合物中的主要核酸序列(就浓度来说),所以其被称为“PCR扩增的”。如本文中所定义,包含多个靶核酸分子的样品内的靶核酸分子经由PCR扩增。在上文所论述的方法的一个改进中,靶核酸分子可以使用多个不同引物对,在一些情况下,每个目标靶核酸分子一个或多个引物对进行PCR扩增,由此形成多重PCR反应。使用多重PCR,有可能同时从样品扩增多种目标核酸分子以形成经扩增的靶序列。还可能通过若干种不同方法(例如,用生物分析仪或qPCR定量,用经标记的探针杂交;并入生物素化的引物,接着进行抗生物素蛋白-酶结合物检测;将经32P标记的脱氧核苷酸三磷酸酯(如dCTP或dATP)并入经扩增的靶序列中)检测经扩增的靶序列。任何寡核苷酸序列可用适当的引物集进行扩增,从而实现靶核酸分子从RNA、cDNA、福尔马林固定石蜡包埋DNA、细针穿刺活检(fine-needle biopsies)和多种其它来源的扩增。具体来说,由如本文中所公开的多重PCR过程产生的扩增的靶序列本身是用于后续PCR扩增或多种下游测定或操作的有效底物。
如本文所用,“再扩增(reamplifying或reamplification)”及其派生词是指经由任何合适的扩增过程进一步扩增至少一部分扩增的核酸分子的任何过程(在一些实施例中称为“二级”扩增或“再扩增”),从而产生再扩增的核酸分子。二级扩增不需要与产生扩增的核酸分子的原始扩增过程相同;也不需要再扩增的核酸分子与扩增的核酸分子完全相同或完全互补;所需要的只是再扩增的核酸分子包含至少一部分扩增的核酸分子或其补体。例如,再扩增可涉及使用不同的扩增条件和/或不同的引物,包含与初级扩增不同的靶特异性引物。
如本文所使用的,当关于既定引物使用时,术语“延伸”及其变型包括涉及一个或多个核苷酸在现有核酸分子的端上的聚合的既定聚合酶的任何体内或体外酶促活性特征。通常但未必,此类引物延伸以模板依赖性方式进行;在模板依赖性延伸期间,通过既定碱基配对规则进行碱基的排序和选择,所述规则可以包含沃森-克里克型碱基配对规则,或替代地(并且尤其在涉及核苷酸类似物的延伸反应的情况下)通过一些其它类型的碱基配对范例进行。在一个非限制性实例中,延伸通过聚合酶经由核酸分子的3'OH端上核苷酸的聚合进行。
如本文所使用的,术语“部分”及其变型,当用于提及给定的核酸分子(例如引物或模板核酸分子)时,包括核酸分子的长度(包含核酸分子的部分或整个长度)内的任何数目的相邻核苷酸。
如本文所使用的,“靶序列”或“目标靶序列”及其派生词是指可根据本公开结合、杂交、扩增和/或合成的任何单链或双链核酸序列,包含例如任何疑似存在、预计存在或可能存在于样品中的核酸序列。在一些实施例中,在添加特异性引物或附接的衔接子之前,靶序列以双链形式存在并且包含待结合、杂交、扩增和/或合成的特定核苷酸序列或其补体的至少一部分。在一些实施例中,靶序列是靶标的一部分。例如,靶核酸序列可以是位于靶基因、靶基因组和/或靶生物体(例如细菌,或靶生物体的特定科、属或种,例如瘤胃菌科(Ruminococcaceae family)、瘤胃球菌属(Ruminococcus genus)和活泼瘤胃球菌(R.gnavus species))中的序列。靶序列可以包含用于扩增或合成反应的引物在通过聚合酶延伸之前可以与其杂交的核酸。在一些情况下,靶序列是与用于扩增靶序列的引物杂交的序列相邻且邻接的序列。在一些实施例中,所述术语是指核酸序列,其序列同一性、核苷酸的次序或位置由本公开的方法中的一种或多种确定。
如本文所使用的,“经扩增的靶序列”及其派生词是指通过使用特异性引物和本文提供的方法扩增/扩增靶序列而产生的核酸序列。经扩增的靶序列相对于靶序列可以是同义(第二轮和后续偶数轮扩增中产生的正链)或反义(即,在第一轮和后续奇数轮扩增期间产生的负链)中的任一种。在一些实施例中,所述经扩增的靶序列与反应中另一个经扩增的靶序列的任何部分通常具有小于50%的互补性。如本文所使用的,“扩增子”是指由使用如本文提供的引物和方法进行扩增产生的总核酸。在一些情况下,扩增子可能与靶序列相同。在一些情况下,当靶核酸序列被定义为不包含引物序列时,扩增子包含经扩增的靶序列以及用于扩增位于所述经扩增的靶序列每一端处的靶序列的引物。在这种情况下,靶序列可以被称为扩增子的“插入物”。
如本文所使用的,术语“引物”、“探针”及其衍生物是指可与目标靶序列杂交的任何多核苷酸。在一些实施例中,引物也可以用于引发核酸合成。通常,引物充当底物,其上可由聚合酶聚合核苷酸;然而,在一些实施例中,引物可变得并入合成的核酸链中并且提供另一引物可杂交的位点以引发与所合成的核酸分子互补的新链的合成。引物或探针可以包括核苷酸或其类似物的任何组合,其可以任选地连接以形成任何合适长度的线形聚合物。在一些实施例中,引物为单链寡核苷酸或多核苷酸。(出于本公开的目的,术语“聚核苷酸”和“寡核苷酸”在本文中可以互换地使用并且未必指示两个核苷酸之间长度的任何差异)。在一些实施例中,引物或探针为单链,但其也可以为双链。引物或探针任选地天然产生,如在纯化的限制性消化物中,或可以以合成方式产生。在一些实施例中,当暴露于扩增或合成条件时,引物充当用于扩增或合成的起始点;此类扩增或合成可以以模板依赖性方式进行并且任选地形成与至少一部分靶序列互补的引物延伸产物。示例性扩增或合成条件可以包含使引物与多核苷酸模板(例如,包含靶序列的模板)、核苷酸和诱导剂(如聚合酶)在合适的温度和pH下接触,以诱导靶特异性引物的末端上核苷酸的聚合。如果为双链,那么在用于制备引物延伸产物之前,可以任选地处理引物或探针以分离其链。在一些实施例中,引物探针是寡脱氧核苷酸或寡核糖核苷酸。在一些实施例中,引物或探针可以包含一个或多个核苷酸类似物。引物或探针的精确长度和/或组成(包含序列)可能影响许多性质,包含解链温度(Tm)、GC含量、二级结构的形成、重复核苷酸基序、预测的引物延伸产物的长度、跨目标核酸分子的覆盖范围、单个扩增或合成反应中存在的引物的数量、引物内核苷酸类似物或经修饰的核苷酸的存在等。在一些实施例中,引物可以在扩增或合成反应中与相容的引物配对以形成由正向引物和反向引物组成的引物对。在一些实施例中,引物对的正向引物包含基本上与核酸分子的一个链的至少一部分互补的序列,并且引物对的反向引物包含基本上与所述链的至少一部分相同的序列。在一些实施例中,正向引物和反向引物能够与核酸双螺旋的相对链杂交。任选地,正向引物引发第一核酸链的合成,并且反向引物引发第二核酸链的合成,其中第一和第二链基本上彼此互补,或可杂交以形成双链核酸分子。在一些实施例中,扩增或合成产物的一端由正向引物定义并且扩增或合成产物的另一端由反向引物定义。在一些实施例中,当需要扩增或合成冗长引物延伸产物(如扩增外显子、编码区或基因)时,可以产生跨越所需长度的若干引物对以实现所述区域的充分扩增。在一些实施例中,引物或探针可以包含一个或多个可切割基团。引物和探针可以是任何长度。在一些实施例中,探针的长度可以为约200个核苷酸或更少、175个核苷酸或更少、150个或更少核苷酸、125个核苷酸或更少、100个或更少核苷酸、90个核苷酸或更少、80个或更少核苷酸、75个核苷酸或更少、70个或更少核苷酸、60个核苷酸或更少、55个核苷酸或更少、50个核苷酸或更少、40个核苷酸或更少、35个核苷酸或更少、30个核苷酸或更少、25个核苷酸或更少、20个核苷酸或更少、15个核苷酸或更少或10个核苷酸或更少。在一些实施例中,引物长度在约10到约60个核苷酸、约12到约50个核苷酸和约15到约40个核苷酸长度范围内。通常,当在存在dNTP和聚合酶的情况下暴露于扩增条件时,引物能够与对应的靶序列杂交并且进行引物延伸。在一些情况下,特定核苷酸序列或引物的一部分在扩增反应开始时是已知的或可以通过本文中所公开的方法中的一种或多种测定。在一些实施例中,引物在引物内的一个或多个位置处包含一个或多个可切割基团。在一些实施例中,引物的混合物可以是简并引物。简并引物是具有相似序列但在一个或多个核苷酸位置处不同的引物,使得一个引物可能在该位置具有A,另一个可能在相同位置具有G,另一个可能在相同位置具有T,并且第四个引物可能在相同位置具有C。可以标记探针和/或引物。标记经常用于检测已与另一种核酸结合或杂交的引物或探针,例如,为了检测引物或探针特异性结合的特定序列。用于标记核酸以用作可检测探针的组合物和方法在本领域中是已知的,并且包含将报告基因或信号产生部分连接到探针上。可检测标记的实例包含但不限于荧光、发光、化学发光、显色、放射性和比色部分。标记可以是直接可检测的或者可以是用于产生可检测信号的系统的一部分。
如本文所使用的,当提及如扩增、结合或杂交等过程时,“能够”是指核酸(例如引物或引物对)以执行、参与执行和/或完成所述过程的方式与另一种核酸(例如,靶核酸、靶序列、模板)相互作用的能力。例如,能够通过分子间力或键与另一种核酸或其它分子结合的核酸能够与另一种核酸或分子形成稳定的连接。能够与另一种核酸杂交的核酸能够与另一种核酸发生碱基配对相互作用。在一些实施例中,核酸能够在低或高严格条件下杂交。能够扩增另一种核酸的核酸能够在聚合反应中充当引物,所述聚合反应导致核酸延伸并产生模板核酸链的补体,所述补体可以是模板核酸链的相对链的拷贝。如果核酸能够与某一靶分子结合、与某一靶核酸杂交和/或扩增某一靶核酸而与并非靶分子或核酸的分子或核酸基本上不结合、不杂交和/或基本上不扩增所述分子或核酸,则核酸特异性或选择性地能够结合、杂交和/或扩增。在一些情况下,这种结合、杂交和/或扩增被称为“独特地”结合、杂交和/或扩增靶分子或核酸。
如本文所使用的,术语“单独地”在用于提及扩增核酸时是指用于扩增核酸(例如,基因)的特定限定区域而不扩增核酸的另一个区域的引物或引物对。例如,单独地扩增16SrRNA基因的不同高变区的引物对各自仅扩增单个高变区,从而为每个不同区域生成单独的扩增子,并且不生成含有多个高变区的扩增子。
如本文中所定义,“可切割基团”指在并入核酸后可在适当条件下切割的任何部分。例如,可以将可切割基团并入靶特异性引物、经扩增的序列、衔接子或样品的核酸分子中。在示例性实施例中,靶特异性引物可以包含可切割基团,其变成并入扩增的产物中并且随后在扩增之后切割,从而从经扩增的产物中移除一部分或所有靶特异性引物。可切割基团可切割或以其它方式通过任何可接受的手段从样品的靶特异性引物、经扩增的序列、衔接子或核酸分子中移除。例如,可以通过酶促、热学、光氧化或化学处理从样品的靶特异性引物、扩增序列、衔接子或核酸分子中移除可切割基团。在一个方面中,可切割基团可以包含非天然存在的核碱基。例如,寡脱氧核苷酸可以包含一个或多个RNA核碱基,如可通过尿嘧啶糖基化酶移除的尿嘧啶。在一些实施例中,可切割基团可以包含一个或多个经修饰的核碱基(如7-甲基鸟嘌呤、8-氧代-鸟嘌呤、黄嘌呤、次黄嘌呤、5,6-二氢尿嘧啶或5-甲基胞嘧啶)或一个或多个修饰的核苷(即,7-甲基鸟苷、8-氧代-脱氧鸟苷、黄嘌呤核苷、肌苷、二氢尿苷或5-甲基胞啶)。可通过酶促、化学或热学手段从核酸中移除经修饰的核碱基或核苷酸。在一个实施例中,可切割基团可以包含在暴露于紫外光(即,溴脱氧尿苷)时,可在扩增(或合成)之后从引物中移除的部分。在另一个实施例中,可切割基团可以包含甲基化胞嘧啶。通常,甲基化胞嘧啶可由引物切割,例如在诱导扩增(或合成)之后、在亚硫酸氢钠处理时。在一些实施例中,可切割部分可以包含限制位点。例如,引物或靶序列可以包含对一种或多种限制酶具有特异性的核酸序列,并且在扩增(或合成)之后,引物或靶序列可用一种或多种限制酶处理使得可切割基团被移除。通常,可在一个或多个位置包含一个或多个可切割基团以及样品的靶特异性引物、扩增的序列、衔接子或核酸分子。
如本文所使用的,“切割步骤”及其派生词是指可切割基团从样品的靶特异性引物、经扩增的序列、衔接子或核酸分子中切割或以其它方式移除的任何过程。在一些实施例中,切割步骤可以涉及化学、热学、光氧化或消化过程。
在一些实施例中,引物是单链或双链多核苷酸,通常是寡核苷酸,其包含至少一个与包含靶序列的核酸分子的至少一部分至少50%互补、典型地至少75%互补或至少85%互补,更典型地至少90%互补、更典型地至少95%互补、更典型地至少98%或至少99%互补、或100%互补或相同的序列。在这种情况下,引物和靶序列被描述为彼此“对应”,并且在一些情况下,引物可以被称为“针对”靶序列。在一些实施例中,引物能够与其对应靶序列的至少一部分(或靶序列的补体)杂交;此类杂交可任选地在标准杂交条件下或在严格杂交条件下进行。在一些实施例中,引物不能与靶序列或其补体杂交,但能够与包含靶序列的核酸链的一部分或其补体杂交,例如,靶序列上游或下游或与靶序列相邻的序列。在一些实施例中,引物包含至少一个与靶序列本身的至少一部分至少75%互补、典型地至少85%互补、更典型地至少90%互补、更典型地至少95%互补、更典型地至少98%互补、或更典型地至少99%互补的序列;在一些实施例中,引物包含至少一个与除靶序列之外的核酸分子的至少一部分至少75%互补、典型地至少85%互补、更典型地至少90%互补、更典型地至少95%互补、更典型地至少98%互补、或更典型地至少99%互补的序列。在一些实施例中,此类引物被称为“特异性引物”或“选择性引物”,其与除了其对应的靶序列之外的靶序列或其对应的核酸部分(包含靶序列)基本上不互补;任选地,特异性引物或选择性引物与可能存在于核酸混合物中(例如,样品中)的其它核酸分子基本上不互补。在一些实施例中,存在于样品中的不包含或对应于靶序列(或靶序列的补体)的核酸分子被称为“非特异性”序列或“非特异性核酸”。在一些实施例中,特异性引物或选择性引物被设计成包含与其对应靶序列的至少一部分基本上互补的核苷酸序列。在一些实施例中,特异性引物或选择性引物跨其整个长度与包含其对应靶序列的核酸分子的至少一部分至少95%互补或至少99%互补、100%互补或相同。在一些实施例中,特异性引物或选择性引物可以跨其整个长度与其对应靶序列的至少一部分至少90%、至少95%互补、至少98%互补或至少99%互补、100%互补或相同。在一些实施例中,正向特异性引物和反向特异性引物定义了可用于通过模板依赖性引物延伸扩增靶序列的特异性引物对(或选择性引物对)。通常,特异性引物对中的每个引物包含至少一个与包含对应靶序列的核酸分子的至少一部分基本上互补但与混合物或样品中的至少一个其它靶序列小于50%互补的序列。在一些实施例中,可以在单个扩增反应中使用多个特异性引物对进行扩增,其中每个引物对包含正向特异性引物和反向特异性引物,其各自包含至少一个与混合物或样品中的对应靶序列基本上互补或基本上相同的序列,并且每个特异性引物对具有不同的对应靶序列。在一些实施例中,特异性引物可以在其3'端或其5'端与扩增反应中存在的任何其它特异性引物基本上不互补。在一些实施例中,特异性引物可以包含在扩增反应中与其它特异性引物的最小交叉杂交。在一些实施例中,特异性引物包含与扩增反应混合物中的非特异性序列的最小交叉杂交。在一些实施例中,特异性引物包含最小的自身互补性。在一些实施例中,特异性引物可以包含位于3'端的一个或多个可切割基团。在一些实施例中,特异性引物可以包含位于该特异性引物的中心核苷酸附近或周围的一个或多个可切割基团。在一些实施例中,一个或多个特异性引物仅包含在该特异性引物的5'端处的不可切割核苷酸。在一些实施例中,与一个或多个不同的特异性引物相比,特异性引物在引物的3'端或5'端处包含最小的核苷酸序列重叠,任选地在同一扩增反应中。在一些实施例中,单个反应混合物中的1个、2个、3个、4个、5个、6个、7个、8个、9个、10个或更多个特异性引物包含以上实施例中的一个或多个。在一些实施例中,单个反应混合物中的多个特异性引物基本上全部包含以上实施例中的一个或多个。
如本文所使用的,术语“连接(ligating/ligation)”及其派生词指用于将两个或更多个分子共价连接在一起(例如使两个或更多个核酸分子彼此共价连接)的动作或方法。在一些实施例中,连接包含在核酸的相邻核苷酸之间的连接切口。在一些实施例中,连接包含形成在第一核酸分子的端与第二核酸分子的端之间的共价键。在一些实施例中,例如其中待连接的核酸分子包含常规核苷酸残基的实施例,连接可以包含形成在一个核酸的5'磷酸基与第二核酸的3'羟基之间的共价键,从而形成经连接的核酸分子。在一些实施例中,可以采用任何用于在相邻核苷酸之间使5'磷酸与3'羟基连接或结合的方法。在示例性实施例中,可以使用酶,如连接酶。出于本公开的目的,扩增的靶序列可以连接到衔接子以产生衔接子连接的扩增的靶序列。
如本文所使用的,“连接酶”及其派生词是指任何能够催化两个底物分子的连接的试剂。在一些实施例中,连接酶包含能够催化在核酸的相邻核苷酸之间的切口的连接的酶。在一些实施例中,连接酶包含能够催化在一个核酸分子的5'磷酸与另一个核酸分子的3'羟基之间形成共价键,从而形成经连接的核酸分子的酶。合适的连接酶可以包含但不限于T4DNA连接酶、T4 RNA连接酶和大肠杆菌(E.coli)DNA连接酶。
如本文所使用的,“连接条件”及其派生词是指适合于将两个分子彼此连接的条件。在一些实施例中,连接条件适合于密封核酸之间的切口或间隙。如本文所定义,“切口”或“间隙”是指在核酸序列的内部核苷酸内缺少单核苷酸戊糖环的5'磷酸直接与相邻单核苷酸戊糖环的3'羟基结合的核酸分子。如本文所使用的,术语切口或间隙与所属领域术语的使用一致。通常,切口或间隙可以在适当的温度和pH下在酶(如连接酶)的存在下连接。在一些实施例中,T4 DNA连接酶可在约70-72℃的温度下在核酸之间连接切口。
如本文所使用的,“平末端连接”及其派生词指两个平末端双链核酸分子彼此连接。“平末端”指其中核酸分子的一个链端中的基本上所有核苷酸与同一个核酸分子的另一个链中的相对核苷酸碱基配对的双链核酸分子的端。如果核酸分子具有包含长度大于两个核苷酸的单链部分的端(本文中称为“突出”),那么其不是平末端的。在一些实施例中,核酸分子的端不包含任何单链部分,使得端的一个链中的每个核苷酸与同一个核酸分子的另一个链中的相对核苷酸碱基配对。在一些实施例中,变成彼此连接的两个平末端核酸分子的端不包含任何重叠、共有或互补序列。通常,平末端连接不包含使用其它寡核苷酸衔接子帮助双链扩增的靶序列与双链衔接子的连接,如2010年5月27日公开的Mitra和Varley,US2010/0129874中所描述的补丁寡核苷酸。在一些实施例中,平末端连接包含用于密封在连接过程期间产生的切口的切口平移反应。
如本文所使用的,术语“衔接子”或“衔接子和其补体”及其派生词指任何可与本公开的核酸分子连接的线形寡核苷酸。任选地,衔接子包含与样品内至少一个靶序列的3'端或5'端基本上不互补的核酸序列。在一些实施例中,衔接子与样品中任何靶序列的3'端或5'端基本上不互补。在一些实施例中,衔接子包含与经扩增的靶序列基本上不互补的任何单链或双链线性寡核苷酸。在一些实施例中,衔接子与样品的至少一个、一些或全部核酸分子基本上不互补。在一些实施例中,合适的衔接子长度在长度为约10-100个核苷酸、约12-60个核苷酸和约15-50个核苷酸的范围内。衔接子可以包含核苷酸和/或核酸的任何组合。在一些方面中,衔接子可以在一个或多个位置处包含一个或多个可切割基团。在另一方面中,衔接子可以包含与引物(例如通用引物)的至少一部分基本上相同或基本上互补的序列。在一些实施例中,衔接子可以包含条形码或标签以辅助下游编目、鉴定或测序。在一些实施例中,当与经扩增的靶序列连接时,具体地说,在合适的温度和pH下在存在聚合酶和dNTP的情况下,单股衔接子可以充当用于扩增的底物。
如本文所使用的,“DNA条形码”或“DNA标记序列”及其派生词是指可充当用于区分或分离样品中多个经扩增的靶序列的‘钥匙’的衔接子内的独特短(6-14个核苷酸)核酸序列。出于本公开的目的,DNA条形码或DNA标签序列可以并入衔接子的核苷酸序列中。
如本文所使用的,“GC含量”及其派生词是指核酸分子的胞嘧啶和鸟嘌呤含量。在一些实施例中,特异性引物(或衔接子)的GC含量为85%或更低。在一些实施例中,特异性引物或衔接子的GC含量15-85%之间。
组合物
本文提供的组合物包含含有一种或多种核酸的组合物,所述一种或多种核酸包含例如但不限于双链、部分双链、单链、经修饰和未修饰的核酸。在一些实施例中,核酸是单链的,例如可用作引物和/或探针的单链寡核苷酸。在一些实施例中,本文提供的组合物含有能够在核酸扩增过程或反应中扩增特定核酸的两种核酸,例如,核酸引物对。本文还提供了含有多个核酸(例如引物和/或探针,包含例如多个引物对)或由多个核酸组成的组合物。在一些实施例中,本文提供的组合物中的核酸和/或核酸对(例如,引物对)能够与包含在一种或多种微生物(如例如,细菌或古细菌)的基因组内的核酸结合、杂交和/或扩增所述核酸。在一些实施例中,本文提供的组合物中的一种或多种核酸(例如,引物对)能够与含有表17中的SEQ ID NO:1605-1979、或表17中的SEQ ID NO:1605-1826、或表17A中的SEQ ID NO:1605-1820、或表17C中的SEQ ID NO:1827-1979、或表17C中的SEQ ID NO:1827-1976或任何这些序列的基本上相同或相似的序列中所示的核苷酸序列的核酸(例如,来自如细菌等微生物的核酸)结合、杂交和/或扩增所述核酸,或与所述核酸特异性地结合、杂交和/或特异性地扩增所述核酸。在一些实施例中,本文提供的组合物中的一种或多种核酸(例如,引物对)能够扩增或特异性地扩增含有表17中的SEQ ID NO:1605-1979、或表17中的SEQ ID NO:1605-1826、或表17A中的SEQ ID NO:1605-1820、或表17C中的SEQ ID NO:1827-1979或表17C中的SEQ ID NO:1827-1976中所示的核苷酸序列的核酸,如来自微生物(例如,细菌)的核酸,以产生长度小于约500个、小于约475个、小于约450个、小于约400个、小于约375个、小于约350个、小于约300个、小于约275个、小于约250个、小于约200个、小于约175个、小于约150个或小于约100个核苷酸的扩增子序列,或基本上由选自表17中的SEQ ID NO:1605-1979、或表17中的SEQ ID NO:1605-1826、或表17A中的SEQ ID NO:1605-1820、或表17C中的SEQ ID NO:1827-1979、或表17C中的SEQ ID NO:1827-1976或基本上相同或相似的序列并且任选地在序列的5'端和3'端含有核酸引物序列的序列组成的扩增子序列。在一些实施例中,组合物含有多种核酸,所述多种核酸能够与多种核酸结合、杂交和/或扩增所述多种核酸,或与所述多种核酸特异性地结合、杂交和/或特异性地扩增所述多种核酸,所述多种核酸中的每一种含有选自表17中的SEQ ID NO:1605-1979、或表17中的SEQ ID NO:1605-1826、或表17A中的SEQ ID NO:1605-1820、或表17C中的SEQ ID NO:1827-1979或表17C中的SEQ ID NO:1827-1976的核苷酸序列。在一些实施例中,组合物含有多种核酸(例如,引物对),所述多种核酸能够扩增或特异性地扩增多种核酸(如来自微生物(例如,细菌)的核酸),所述多种核酸中的每一种含有选自表17中的SEQ ID NO:1605-1979、或表17中的SEQID NO:1605-1826、或表17A中的SEQ ID NO:1605-1820、或表17C中的SEQ ID NO:1827-1979、或表17C中的SEQ ID NO:1827-1976或基本上相同或相似的序列的核苷酸序列,以产生长度小于约500个、小于约475个、小于约450个、小于约400个、小于约375个、小于约350个、小于约300个、小于约275个、小于约250个、小于约200个、小于约175个、小于约150个或小于约100个核苷酸的扩增子序列,或基本上由选自表17中的SEQ ID NO:1605-1979、或表17中的SEQ ID NO:1605-1826、或表17A中的SEQ ID NO:1605-1820、或表17C中的SEQ IDNO:1827-1979或表17C中的SEQ ID NO:1827-1976并且任选地在序列的5'端和3'端含有核酸引物序列的序列组成的扩增子序列。在一些实施例中,本文提供的组合物含有多种核酸,所述多种核酸中的每一种包括选自表17中的SEQ ID NO:1605-1979、或表17中的SEQ IDNO:1605-1826、或表17A中的SEQ ID NO:1605-1820、或表17C中的SEQ ID NO:1827-1979、或表17C中的SEQ ID NO:1827-1976或基本上相同或相似的序列的核苷酸序列。在一些实施例中,所述组合物含有多种核酸,所述多种核酸中的每一种含有选自表17中的SEQ ID NO:1605-1826、或表17A中的SEQ ID NO:1605-1820或基本上相同或相似的序列并且任选地在序列的5'端和3'端含有核酸引物序列的核苷酸序列或基本上由所述核苷酸序列组成,并且所述核苷酸序列的长度小于约500个、小于约475个、小于约450个、小于约400个、小于约375个、小于约350个、小于约300个、小于约275个、小于约250个、小于约200个、小于约175个、小于约150个或小于约100个核苷酸。
在一些实施例中,本文提供的组合物中的核酸包含表15或表16中的核苷酸序列或基本上由表15或表16中的核苷酸序列组成,其中一个或多个胸腺嘧啶碱基被尿嘧啶碱基取代。在一些实施例中,本文提供的核酸包含选自以下的核苷酸序列或基本上由选自以下的核苷酸序列组成:表15的SEQ ID NO:11-16、23和24;表15的SEQ ID NO:35-40、47和48;表16A的SEQ ID NO:49-480;表16A的SEQ ID NO:49-452和457-472;表16C的SEQ ID NO:521-820;表16D的SEQ ID NO:827-1258;表16D的SEQ ID NO:827-1230和1235-1250;或表16F的SEQ ID NO:1299-1598;或基本上相同或相似的序列。在一些实施例中,组合物含有多种核酸或基本上由多种核酸组成,所述多种核酸中的每一种含有选自以下的序列或基本上由选自以下的序列组成:表15中的序列;表15的SEQ ID NO:1-24;表15的SEQ ID NO:11-16、23和24;表15的SEQ ID NO:25-48;表15的SEQ ID NO:35-40、47和48;表16中的序列;表16的SEQID NO:49-520;表16的SEQ ID NO:49-452、457-472和481-520;表16的SEQ ID NO:49-492;表16的SEQ ID NO:49-452、457-472和481-492;表16A的SEQ ID NO:49-480;表16A的SEQ IDNO:49-452和457-472;表16C的SEQ ID NO:521-826;表16C的SEQ ID NO:521-820;表16的SEQ ID NO:827-1298;表16的SEQ ID NO:827-1230、1235-1250和1259-1298;表16的SEQ IDNO:827-1270;表16的SEQ ID NO:827-1230、1235-1250和1259-1270;表16D的SEQ ID NO:827-1258;表16D的SEQ ID NO:827-1230和1235-1250;表16F的SEQ ID NO:1299-1604;表16F的SEQ ID NO:1299-1598;基本上相同或相似的序列,和/或任何上述核苷酸序列,其中一个或多个胸腺嘧啶碱基被尿嘧啶碱基取代。在一些实施例中,本文提供的组合物中的核酸包含一对或多对核酸(例如,引物对)。引物对包含可用于扩增核酸的成对(即2个)核酸(多核苷酸)。引物对的实例在表15和16中显示为表的每一行中的“引物1”和“引物2”,它们能够扩增包含在原核(例如,细菌)16S rRNA基因的对应区域(高变区)中(表15)或包含在对应的微生物种中(表16)的核酸序列。在一些实施例中,本文提供的组合物中的核酸包含一对或多对核酸或基本上由一对或多对核酸组成,所述一对或多对核酸含有以下各项的核苷酸序列或基本上由以下各项的核苷酸序列组成:表15或表16中的一对或多对核苷酸序列;选自以下各项中所示的序列对的一对或多对核苷酸序列:表15的SEQ ID NO:1-24;表15的SEQ ID NO:25-48;表15的SEQ ID NO:11-16、23和24;表15的SEQ ID NO:35-40、47和48;表16的SEQ ID NO:49-520;表16的SEQ ID NO:49-452、457-472和481-520;表16的SEQ ID NO:49-492;表16的SEQ ID NO:49-452、457-472和481-492;表16A的SEQ ID NO:49-480;表16A的SEQ ID NO:49-452和457-472;表16C的SEQ ID NO:521-826;表16C的SEQ ID NO:521-820;表16的SEQ ID NO:827-1298;表16的SEQ ID NO:827-1230、1235-1250和1259-1298;表16的SEQ ID NO:827-1270;表16的SEQ ID NO:827-1230、1235-1250和1259-1270;表16D的SEQ ID NO:827-1258;表16D的SEQ ID NO:827-1230和1235-1250;表16F的SEQ ID NO:1299-1604;或表16F的SEQ ID NO:1299-1598;基本上相同或相似的序列,和/或任何上述引物对的核苷酸序列,其中一个或多个胸腺嘧啶碱基被尿嘧啶碱基取代。在一些实施例中,组合物含有多对核酸(例如,引物对)或基本上由多对核酸组成,所述多对核酸含有以下各项的核苷酸序列或基本上由以下各项的核苷酸序列组成:表15或表16中的两对或更多对核苷酸序列;选自以下各项中所示的序列对的两对或更多对核苷酸序列:表15的SEQ ID NO:1-24;表15的SEQ ID NO:25-48;表15的SEQ ID NO:11-16、23和24;表15的SEQ ID NO:35-40、47和48;表16的SEQ ID NO:49-520;表16的SEQ ID NO:49-452、457-472和481-520;表16的SEQ ID NO:49-492;表16的SEQ ID NO:49-452、457-472和481-492;表16A的SEQ ID NO:49-480;表16A的SEQ ID NO:49-452和457-472;表16C的SEQ ID NO:521-826;表16C的SEQ IDNO:521-820;表16的SEQ ID NO:827-1298;表16的SEQ ID NO:827-1230、1235-1250和1259-1298;表16的SEQ ID NO:827-1270;表16的SEQ ID NO:827-1230、1235-1250和1259-1270;表16D的SEQ ID NO:827-1258;表16D的SEQ ID NO:827-1230和1235-1250;表16F的SEQ IDNO:1299-1604;或表16F的SEQ ID NO:1299-1598;或基本上相同或相似的序列,和/或任何上述引物对的核苷酸序列,其中一个或多个胸腺嘧啶碱基被尿嘧啶碱基取代。
在一些实施例中,核酸或核酸对以及任选地其简并序列与特定微生物(例如,细菌种)所独有的特异性核酸序列结合、杂交和/或扩增所述特异性核酸序列。这种核酸或核酸对,以及任选地简并序列,在本文中被称为“微生物特异性”或“种特异性”,并且以微生物特异性或种特异性方式扩增核酸以在扩增反应中存在来自微生物的核酸的情况下,在微生物(例如,细菌)或微生物群组中产生具有独特序列的单个扩增产物。此类核酸和核酸引物对的序列的非限制性实例在表16中提供。
在一些实施例中,核酸对,以及任选地其简并序列,能够扩增对于分类学群组中的多个、大部分、大多数、基本上所有或所有微生物而言是共有的但在不同的微生物之间会有所不同的同源基因或基因组区域中的序列。分类学群组包含界、域、门、纲、目、科和种。在一个实施例中,分类学群组是细菌界。能够扩增对于界中的多个、大部分、大多数、基本上所有或所有微生物而言是共有的但在不同界的微生物之间会有所不同的同源基因或基因组区域中的序列的此类核酸对或引物对,以及任选地简并序列,在本文中称为“界涵盖”,并且以界涵盖的方式扩增界内微生物中的核酸,以在扩增反应中存在来自微生物(例如,细菌)的核酸的情况下,产生具有界内不同微生物(例如,不同细菌)的不同核苷酸序列的多种扩增产物。核酸的保守序列可以在不同生物体或微生物的基因组中找到。此类序列在不同的基因组中可以是相同的或具有实质上的相似性(参见例如,Isenbarger等人(2008)《生命起源与生物圈演化(Orig Life Evol Biosph)》doi:10.1007/s11084-008-9148-z)。在许多情况下,保守序列位于必需基因中,例如管家基因,这些基因编码跨一类或一组生物体或微生物所需的元素,用于执行基础的生存生化功能。然而,通过生物体和微生物对不同条件的进化和适应,即使是同源基因也发生了分歧,并且含有在不同生物体和微生物之间变化的序列,这些序列可能如此不同,以至于对于特定的生物体或微生物来说是独一无二的,使得它们可以用于鉴定单个生物体或微生物或生物体或微生物的相关群组(例如,种)。同源基因包含,例如,微生物基础功能和生存所需的一些必需基因。在一些实施例中,同源基因是多种不同生物体或微生物(例如,多种不同细菌)所共有的16S rRNA基因、18S rRNA基因或23SrRNA基因。例如,在某些实施例中,所述核酸包含一个或多个引物对,其单独地扩增原核(例如,细菌)16S rRNA基因中的两个或更多个区域,例如高变区。此类核酸引物对的非限制性实例在表15中提供。
可变区分析已用于原核生物的分类学分类,例如,在使用与可变区两侧的保守序列杂交的核酸引物的方法中。含有散布在保守区之间的多个可变区的同源基因在此类方法中特别有用,因为它们提供了多个序列,可以对所述多个序列进行分析以更准确和明确地鉴定靶标元件群体的各个组成部分。这种基因的一个实例是编码核糖体RNA的原核16SrRNA基因,所述核糖体RNA是核糖体的主要结构和催化组分。细菌和古细菌的16S核糖体RNA(rRNA)基因长约1500-1700个碱基对,并且包含散布在保守区之间的9个不同保守性的高变区,通常被称为V1-V9(图1)(参见例如,Wang和Qian(2009)《公共科学图书馆-综合(PloSONE)》4:e7401以及Kim的(2011)《微生物学方法杂志(J Microbiol Meth)》84:81-87)。示例性16S rRNA基因序列是已知的,并且包含Greengenes数据库(http://greengenes.lbl.gov)、SILVA数据库(www.arb-silva.de)和基于GRD-基因组的16核糖体RNA数据库(https://metasystems.riken.jp/grd/)中所含有的序列。在不同微生物中不同的16S rRNA基因的高变区序列可用于鉴定样品中的微生物。并非通过使用许多寡核苷酸引物(每个引物对每个生物体的高变区都是特异性的)特异性地扩增可能存在于样品中的每种可能微生物的高变区,而是可以利用位于高变区两侧的保守、高度相似或相同的序列作为引物结合序列,一个或少量引物对将结合至所述引物结合序列,并扩增样品中基本上所有微生物(例如,细菌)中的高变区。这允许从基本上所有微生物中扩增可用于鉴定微生物的特异性核酸,然后可对其进行测序以有效地对群体进行剖析。然而,这些方法的结果往往不一致,并且在确定样品(具体地说,含有多种不同微生物的样品)中存在的大多数或所有微生物时往往是不完整的。此外,这些方法通常不能可靠或准确地区分微生物的种,如果它们能够区分种的话。大多数此类方法使用旨在扩增16S rRNA基因的一个或几个(而不是全部)高变区的引物。如果在这些方法中以多于有限数量的高变区为靶标进行扩增,则由于引物序列的重叠,该方法通常需要针对不同引物进行多次单独的扩增反应,所述引物序列的重叠会导致方法的资源使用和时间效率低下。此外,此类方法通常包含被设计成将两个或更多个高变区(例如,V2-V3或V3-V4)扩增为单个扩增子的引物对,这会导致更长的扩增子用于测序。
界涵盖核酸
本文提供了核酸引物对,其单独地扩增包括位于原核16S rRNA基因的多个高变区中的序列的核酸。在一些实施例中,单独扩增包括位于多个高变区中的序列的核酸的任何两个16s rRNA基因引物的核苷酸序列轻微重叠(例如,小于或等于7个核苷酸)或没有重叠。在一些方面,引物对扩增长度小于或等于约200个核苷酸,例如长度介于约125和200个核苷酸之间的16s rRNA基因序列。在一些实施例中,本文提供的组合物含有多个核酸引物对,其包含至少2个、至少3个、至少4个、至少5个、至少6个或至少7个单独的引物对,以及任选地其简并变体,其在核酸扩增反应中单独地扩增包括原核16s rRNA基因中2个、3个、4个、5个、6个或7个不同高变区中的一个不同高变区的序列的核酸。在一些实施例中,本文提供的组合物含有多个核酸引物对,其包含至少8个单独的引物对,以及任选地其简并变体,其在核酸扩增反应中单独地扩增包括原核16s rRNA基因中8个不同高变区之一的序列的核酸。在一些实施例中,组合物包含引物对的组合,其中引物对组合中的引物对单独地扩增包括位于原核16S rRNA基因的3个或更多个高变区中的序列的核酸,并且其中3个或更多个区域之一是V5区。一些组合物中包含简并引物变体,例如在引物序列中的1个或2个位置处含有不同的核苷酸,以确保扩增在保守区中含有微小变化的16S rRNA基因。单独地扩增原核16SrRNA基因的8个高变区(V2、V3、V4、V5、V6、V7、V8和V9)的引物对的核苷酸序列的非限制性实例列于表15中。在一些实施例中,本文提供的组合物包含至少1个、至少2个、至少3个、至少4个、至少5个、至少6个、至少7个、至少8个、至少9个、至少10个、至少11个、至少12个、至少13个、至少14个、至少15个、至少16个、至少17个、至少18个、至少19个、至少20个、至少21个、至少22个、至少23个、至少24个核酸或引物对或基本上由所述核酸或引物对组成,其中所述核酸或引物对含有选自以下的序列或基本上由选自以下的序列组成:表15中的序列或来自表15的SEQ ID NO:1-24、表15的SEQ ID NO:25-48、表15的SEQ ID NO:11-16、23和24或表15的SEQ ID NO:35-40、47和48的序列,或基本上相同或相似的序列。在一些实施例中,本文提供的组合物含有核酸或引物对或基本上由所述核酸或引物对组成,其中所述核酸或引物对分别含有表15的SEQ ID NO:1-24的所有序列和/或表15的SEQ ID NO:25-48的所有序列或基本上由这些序列组成。在本文提供的含有单独地扩增包括位于原核16S rRNA基因的多个高变区中的序列的核酸的多个核酸引物对的组合物的一些实施例中,所述多个引物对在含有细菌16S rRNA基因序列的给定数据库中提供不同细菌16S rRNA基因序列的至少85%、或至少90%、或至少92%、或至少95%或至少98%、或至少99%或100%的覆盖率。在本文提供的含有单独地扩增包括位于原核16S rRNA基因的多个高变区中的序列的核酸的多个核酸引物对的组合物的一些实施例中,所述多个引物对能够扩增样品中所有或基本上所有微生物(例如,细菌)核酸,所述样品含有至少10个、至少15个、至少20个、至少25个、至少30个、至少35个、至少40个、至少45个、至少50个、至少55个、至少60个、至少65个、至少70个、至少75个、至少80个、至少85个、至少90个、至少95个或至少100个或更多个不同属的微生物(例如细菌)的混合物。
种/微生物特异性核酸
本文提供了核酸和核酸对(例如,引物对),其与特定微生物(例如,细菌的种、亚种或菌株)所独有的特异性核酸序列结合、杂交和/或扩增所述特异性核酸序列。此类微生物特异性(例如,细菌特异性或种特异性)核酸可用作例如特异性、选择性探针和/或引物,以极大地提高样品中微生物的检测和鉴定的深度和准确度,并显著增强微生物群体或群落及其组分或组成的表征、评估、测量和/或剖析。需要此类信息才能全面了解微生物群落的生物多样性,例如,动物消化道的微生物群。表16中提供的示例性核酸序列与多于40个不同微生物(细菌)属或至少43个不同微生物属所独有的或多于70个、或至少73个、或至少74个或至少75个不同微生物(细菌)种所独有的特异性核酸序列结合、杂交和/或扩增所述特异性核酸序列。
微生物特异性核酸提供了许多优点,例如,在完全和准确地评估、表征、测量和/或剖析微生物群体(例如,微生物群)的组成并确定个体微生物的关系,以及关联和/或联系微生物群落,以及受试者和/或环境的状态(例如,健康、平衡程度、对某些条件的易感性、对治疗的反应性)方面。与人类受试者的不同区域相关联的人类的微生物群(即微生物,包含细菌)所含有的微生物细胞比人类细胞多10倍以上。除了病原微生物的出现外,微生物群还包含共生微生物。虽然鉴定动物体内的病原微生物的意义相对明确,但剖析微生物群中所有类型微生物的复杂组成对于了解动物的健康和潜在的病症和疾病治疗干预也具有重要意义。例如,存在于动物消化道中的微生物,通常被称为“肠道微生物组”,有助于动物的新陈代谢,并且证据支持肠道微生物组在炎症性肠病、自身免疫性病症、心脏代谢病症、癌症和神经精神病症和疾病中的作用。
本文提供的组合物和方法,包含微生物特异性和界涵盖核酸,以及它们在样品分析中的用途,不仅能够全面调查微生物(例如,细菌)属的整体和相对水平,还可以详细鉴定微生物的种,所述微生物的种可以被定制以专注于一种或多种特定的目标微生物,这些微生物在某些健康和疾病或失衡状态中可能很重要。例如,本文提供的是与特定微生物(例如,细菌的种、亚种或菌株)所独有的特异性核酸序列结合、杂交和/或扩增所述特异性核酸序列的核酸和/或核酸引物对,即,微生物特异性核酸。在一些实施例中,核酸能够在包括多种不同微生物的核酸的混合物中,例如在包括与含有靶核酸序列的微生物来自同一属的不同微生物的基因组的核酸的混合物中,与微生物的基因组内含有的靶核酸序列特异性地结合和/或杂交。在一些实施例中,与微生物的基因组内含有的核酸序列特异性地结合和/或杂交的核酸不与包含在任何其它微生物属或任何其它微生物种内的核酸结合或杂交。在一些实施例中,在包括多种不同微生物的基因组的核酸的扩增反应混合物中,并且在特定实施例中,在包括与含有靶核酸序列的微生物来自同一属的不同微生物的基因组的核酸的扩增反应混合物中,引物对特异性地扩增特定微生物所独有的特异性靶核酸序列。在一些实施例中,引物对不扩增包含在任何其它微生物属或任何其它生物体种内的核酸序列。在一些实施例中,核酸的组合包含微生物特异性核酸和/或引物对,其与包含在一种或多种微生物(例如,细菌)的基因组中的核酸序列特异性地结合、杂交和/或特异性地扩增所述核酸序列,所述一种或多种微生物与一种或多种病状、病症和/或疾病有关。在本文提供的组合物的特定实施例中,所述组合物包含核酸和/或引物对,其与包含在选自表1中微生物的微生物的基因组内的靶核酸序列特异性地结合、杂交和/或特异性地扩增所述靶核酸序列。在特定实施例中,包含在选自表1中微生物的微生物的基因组中的靶核酸序列是微生物所独有的。在一些实施例中,所述组合物包含多个核酸和/或引物对或基本上由多个核酸和/或引物对组成,所述多个核酸和/或引物对包含与表1中每种微生物的靶核酸特异性地结合和/或杂交的至少一个核酸和/或特异性地扩增表1中每种微生物的基因组靶核酸的至少一个引物对。在一些实施例中,所述组合物包含多个核酸和/或引物对或基本上由多个核酸和/或引物对组成,所述多个核酸和/或引物对包含与表1中每种微生物的靶核酸特异性地结合和/或杂交的至少一个核酸,除了或不包含粘性放线菌(Actinomyces viscosus)和/或类球布劳特氏菌(Blautia coccoides),或除了或不包含粘性放线菌、类球布劳特氏菌和/或扎氏螺杆菌(Helicobacter salomonis)。在一些实施例中,所述组合物包含多个核酸和/或引物对或基本上由多个核酸和/或引物对组成,所述多个核酸和/或引物对包含特异性地扩增表1中每种微生物的基因组靶核酸的至少一个引物对,除了或不包含粘性放线菌和/或类球布劳特氏菌,或除了或不包含粘性放线菌、类球布劳特氏菌和/或扎氏螺杆菌。在一些实施例中,多个引物对包含不同的引物对或基本上由不同的引物对组成,所述不同的引物对特异性地和单独地扩增包含在或至少在表1微生物中的5种、10种、15种、20种、25种、30种、35种、40种、45种、50种、55种、60种、70种、71种、72种、73种、74种、75种或更多种微生物内的不同基因组靶核酸。在一些实施例中,多个核酸引物对包含核酸引物对集或基本上由所述核酸引物对集组成,其中每个不同的核酸引物对特异性地扩增包含在表1中的微生物组或表1中的微生物组的每个基因组的不同基因组中的不同的独特核酸序列,除了或不包含粘性放线菌和/或类球布劳特氏菌,或除了或不包含粘性放线菌、类球布劳特氏菌和/或扎氏螺杆菌。在特定实施例中,包含在不同微生物基因组中的靶核酸序列是每种微生物所独有的。
在一些实施例中,本文提供的核酸和/或核酸引物对与核酸(如来自微生物(例如,细菌)的核酸)结合、杂交和/或扩增所述核酸,或与所述核酸特异性地结合、杂交和/或特异性地扩增所述核酸,所述核酸含有选自表17中的SEQ ID NO:1605-1979、或表17中的SEQ IDNO:1605-1826、或表17中的1605-1806、1809-1816和1821-1826、或表17A中的SEQ ID NO:1605-1820、或表17A中的SEQ ID NO:1605-1806和1809-1816、或表17C中的SEQ ID NO:1827-1979或表17C中的SEQ ID NO:1827-1976的核苷酸序列和/或基本上相同或相似的核苷酸序列,或基本上由所述核苷酸序列组成。在一些实施例中,本文提供的核酸引物对能够扩增或特异性地扩增核酸(如来自微生物(例如,细菌)的核酸),所述核酸含有选自表17中的SEQ ID NO:1605-1979、或表17中的SEQ ID NO:1605-1826、或表17中的SEQ ID NO:1605-1806、1809-1816和1821-1826、或表17A中的SEQ ID NO:1605-1820、或表17A中的SEQ IDNO:1605-1806和1809-1816、或表17C中的SEQ ID NO:1827-1979或表17C中的SEQ ID NO:1827-1976的核苷酸序列或基本上由所述核苷酸序列组成,以产生长度小于约500个、小于约475个、小于约450个、小于约400个、小于约375个、小于约350个、小于约300个、小于约275个、小于约250个、小于约200个、小于约175个、小于约150个或小于约100个核苷酸的扩增子序列,或基本上由选自表17中的SEQ ID NO:1605-1979、或表17中的SEQ ID NO:1605-1826、或表17中的SEQ ID NO:1605-1806、1809-1816和1821-1826、或表17A中的SEQ ID NO:1605-1820、或表17A中的SEQ ID NO:1605-1806和1809-1816、或表17C中的SEQ ID NO:1827-1979或表17C中的SEQ ID NO:1827-1976并且任选地含有连接在5'端和3'端处的引物序列的核苷酸序列组成的扩增子。在一些实施例中,本文提供的组合物含有多个微生物特异性核酸和/或引物对的组合,其中在所述多个核酸和/或引物对内,存在与至少2个、至少3个、至少4个、至少5个、至少6个、至少7个、至少8个、至少9个、至少10个、至少15个、至少20个、至少25个、至少30个、至少35个、至少40个、至少45个、至少50个、至少55个、至少60个、至少65个、至少70个、至少75个、至少80个、至少85个、至少90个、至少95个、至少100个、至少125个、至少150个、至少175个、至少200个、至少225个、至少250个、至少275个或至少300个或更多个不同的核酸结合、杂交和/或扩增所述不同的核酸(与所述不同的核酸特异性地结合、特异性地杂交和/或特异性地扩增所述不同的核酸)的不同核酸和/或引物对,所述不同的核酸含有以下序列中的不同序列或基本上由以下序列中的不同序列组成:表17中的SEQ ID NO:1605-1979、或表17中的SEQ ID NO:1605-1826、或表17中的SEQ ID NO:1605-1806、1809-1816和1821-1826、或表17A中的SEQ ID NO:1605-1820、或表17A中的SEQ ID NO:1605-1806和1809-1816、或表17C中的SEQ ID NO:1827-1979或表17C中的SEQ ID NO:1827-1976或基本上相同或相似的序列,并且任选地含有连接在3'端和5'端处的引物。在一些实施例中,此类不同的核酸和/或引物对扩增不同的核酸,所述不同的核酸含有以下序列中的不同序列:表17中的SEQ ID NO:1605-1979、或表17中的SEQ ID NO:1605-1826、或表17中的SEQ IDNO:1605-1806、1809-1816和1821-1826、或表17A中的SEQ ID NO:1605-1820、或表17A中的SEQ ID NO:1605-1806和1809-1816、或表17C中的SEQ ID NO:1827-1979或表17C中的SEQID NO:1827-1976,以产生长度小于约500个、小于约475个、小于约450个、小于约400个、小于约375个、小于约350个、小于约300个、小于约275个、小于约250个、小于约200个、小于约175个、小于约150个或小于约100个核苷酸的扩增子序列,或基本上由选自表17中的SEQ IDNO:1605-1979、或表17中的SEQ ID NO:1605-1826、或表17中的SEQ ID NO:1605-1806、1809-1816和1821-1826、或表17A中的SEQ ID NO:1605-1820、或表17A中的SEQ ID NO:1605-1806和1809-1816、或表17C中的SEQ ID NO:1827-1979或表17C中的SEQ ID NO:1827-1976并且任选地含有连接在序列的5'端和3'端的引物序列的核苷酸序列组成的扩增子序列。在一些实施例中,微生物特异性核酸或核酸引物对的组合包含两个或更多个核酸或引物对或基本上由两个或更多个核酸或引物对组成,所述两个或更多个核酸或引物对含有选自以下的核苷酸序列或序列对(对于引物对)或基本上由选自以下的核苷酸序列或序列对组成:表16;或表16的SEQ ID NO:49-520;或表16的SEQ ID NO:49-452、457-472和481-520;或表16的SEQ ID NO:49-492;或表16的SEQ ID NO:49-452、457-472和481-492;或表16A的SEQ ID NO:49-480;或表16A的SEQ ID NO:49-452和457-472;或表16C的SEQ ID NO:521-826;或表16C的SEQ ID NO:521-820;或表16的SEQ ID NO:827-1298;或表16的SEQ ID NO:827-1230、1235-1250和1259-1298;或SEQ ID NO:827-1270;或表16的SEQ ID NO:827-1230、1235-1250和1259-1270;或表16D的SEQ ID NO:827-1258;或表16D的SEQ ID NO:827-1230和1235-1250;或表16F的SEQ ID NO:1299-1604;或表16F的SEQ ID NO:1299-1598;或与其基本上相同或相似的一个或多个序列,或任何上述核酸或引物对的核苷酸序列,其中一个或多个胸腺嘧啶碱基被尿嘧啶碱基取代。在一些实施例中,微生物特异性核酸或核酸引物对的组合包含多个核酸或引物对或基本上由多个核酸或引物对组成,其中存在至少一个核酸或引物对,其分别含有以下序列的每个核苷酸序列或序列对(对于引物对)或基本上由所述每个核苷酸序列或序列对组成:表16的SEQ ID NO:49-520;或表16的SEQ ID NO:49-452、457-472和481-520;或表16的SEQ ID NO:49-492;或表16的SEQ ID NO:49-452、457-472和481-492;或表16A的SEQ ID NO:49-480;或表16A的SEQ ID NO:49-452和457-472;或表16C的SEQ ID NO:521-826;或表16C的SEQ ID NO:521-820;或表16的SEQ ID NO:827-1298;或表16的SEQ ID NO:827-1230、1235-1250和1259-1298;或SEQ ID NO:827-1270;或表16的SEQ ID NO:827-1230、1235-1250和1259-1270;或表16D的SEQ ID NO:827-1258;或表16D的SEQ ID NO:827-1230和1235-1250;或表16F的SEQ ID NO:1299-1604;或表16F的SEQ ID NO:1299-1598;或基本上相同或相似的序列,和/或任何上述核酸或引物对的核苷酸序列,其中一个或多个胸腺嘧啶碱基被尿嘧啶碱基取代。在一些实施例中,本文提供的组合物含有以下各项或基本上由以下各项组成:至少1个、至少2个、至少3个、至少4个、至少5个、至少6个、至少7个、至少8个、至少9个、至少10个、至少15个、至少20个、至少25个、至少30个、至少35个、至少40个、至少45个、至少50个、至少55个、至少60个、至少65个、至少70个、至少75个、至少80个、至少85个、至少90个、至少95个、至少100个、至少125个、至少150个、至少175个、至少200个、至少225个、至少250个、至少275个、至少300个或更多个,或所有核酸,或所有引物对,所述核酸或引物对含有选自以下的序列或基本上由选自以下的序列组成:表16;或表16的SEQ ID NO:49-520;或表16的SEQ ID NO:49-452、457-472和481-520;或表16的SEQ ID NO:49-492;或表16的SEQ ID NO:49-452、457-472和481-492;或表16A的SEQ IDNO:49-480;或表16A的SEQ ID NO:49-452和457-472;或表16C的SEQ ID NO:521-826;或表16C的SEQ ID NO:521-820;或表16的SEQ ID NO:827-1298;或表16的SEQ ID NO:827-1230、1235-1250和1259-1298;或SEQ ID NO:827-1270;或表16的SEQ ID NO:827-1230、1235-1250和1259-1270;或表16D的SEQ ID NO:827-1258;或表16D的SEQ ID NO:827-1230和1235-1250;或表16F的SEQ ID NO:1299-1604;或表16F的SEQ ID NO:1299-1598;或与其基本上相同或相似的一个或多个序列,或任何上述核酸或引物对的核苷酸序列,其中一个或多个胸腺嘧啶碱基被尿嘧啶碱基取代。
在一些实施例中,核酸和/或核酸引物对的组合包含两个或更多个核酸和/或核酸引物对,其与包含在以下一项或多项的基因组中的独特核酸序列结合、杂交和/或扩增所述独特核酸序列,或与所述独特核酸序列特异性地结合、杂交和/或特异性地扩增所述独特核酸序列:嗜黏蛋白阿克曼菌、普通拟杆菌、青春双歧杆菌、空肠弯曲杆菌、简明弯曲杆菌、艰难梭菌、大肠杆菌(Escherichia coli)、直肠真杆菌、胆型螺杆菌、肝螺杆菌、德氏乳杆菌、狄氏副拟杆菌、布氏瘤胃球菌、解没食子酸链球菌和婴儿链球菌(在本文中被称为“A组”微生物;参见表2A),它们是涉及在多种病状、疾病和/或病症中起作用的种,所述多种病状、疾病和/或病症包含例如肿瘤病状(包含例如对免疫肿瘤治疗和癌症的反应)、胃肠道病症(包含例如肠易激综合征、炎症性肠病和乳糜泻)以及自身免疫性疾病(包含例如狼疮和类风湿性关节炎)。在一些实施例中,核酸和/或核酸引物对的组合包含核酸引物对集,其中每个不同的核酸引物对特异性地扩增包含在A组中不同微生物的每个基因组的不同基因组中的不同独特核酸序列。在一些实施例中,核酸和/或核酸引物对的组合包含核酸和/或核酸引物对或基本上由核酸和/或核酸引物对组成,所述核酸和/或核酸引物对与核酸(如来自微生物(例如,细菌)的核酸)结合、杂交和/或扩增所述核酸,或与所述核酸特异性地结合、杂交和/或特异性地扩增所述核酸,所述核酸含有选自表17的SEQ ID NO:1607-1609、1619、1620、1635-1637、1643-1645、1663-1670、1679-1684、1699-1701、1728-1730、1752、1753、1801、1802、1809、1810、1827、1828、1831-1833、1844、1845、1852-1856、1864、1876-1885、1889-1891、1899、1900、1932、1933、1968和1972的序列,或与任何上述序列基本上相同或相似的序列。在一些实施例中,核酸和/或核酸引物对的组合包含以下核酸和/或核酸引物对或基本上由以下核酸和/或核酸引物对组成,所述核酸和/或核酸引物对与核酸(如来自微生物(例如,细菌)的核酸)结合、杂交和/或扩增所述核酸,或与所述核酸特异性地结合、杂交和/或特异性地扩增所述核酸,所述核酸含有选自表17的SEQ ID NO:1607-1609、1619、1620、1635-1637、1643-1645、1663-1670、1679-1684、1699-1701、1728-1730、1752、1753、1801、1802、1809和1810的序列,或与任何上述序列基本上相同或相似的序列。在一些实施例中,核酸和/或核酸引物对的组合包含能够扩增或特异性地扩增核酸(如来自微生物(例如,细菌)的核酸)的引物和/或引物对或基本上由所述引物和/或引物对组成,所述核酸含有选自表17的SEQ ID NO:1607-1609、1619、1620、1635-1637、1643-1645、1663-1670、1679-1684、1699-1701、1728-1730、1752、1753、1801、1802、1809、1810、1827、1828、1831-1833、1844、1845、1852-1856、1864、1876-1885、1889-1891、1899、1900、1932、1933、1968和1972的序列(或与任何上述序列基本上相同或相似的序列),以产生长度小于约500个、小于约475个、小于约450个、小于约400个、小于约375个、小于约350个、小于约300个、小于约275个、小于约250个、小于约200个、小于约175个、小于约150个或小于约100个核苷酸的扩增子序列,或基本上由选自表17的SEQ ID NO:1607-1609、1619、1620、1635-1637、1643-1645、1663-1670、1679-1684、1699-1701、1728-1730、1752、1753、1801、1802、1809、1810、1827、1828、1831-1833、1844、1845、1852-1856、1864、1876-1885、1889-1891、1899、1900、1932、1933、1968和1972或与任何上述序列基本上相同或相似的序列并且任选地在序列的5'端和3'端含有核酸引物序列的核苷酸序列组成的扩增子序列。在一些实施例中,核酸和/或核酸引物对的组合包含能够扩增或特异性地扩增核酸(如来自微生物(例如,细菌)的核酸)的引物和/或引物对或基本上由所述引物和/或引物对组成,所述核酸含有选自表17的SEQ ID NO:1607-1609、1619、1620、1635-1637、1643-1645、1663-1670、1679-1684、1699-1701、1728-1730、1752、1753、1801、1802、1809和1810的序列(或与任何上述序列基本上相同或相似的序列),以产生长度小于约500个、小于约475个、小于约450个、小于约400个、小于约375个、小于约350个、小于约300个、小于约275个、小于约250个、小于约200个、小于约175个、小于约150个或小于约100个核苷酸的扩增子序列,或基本上由选自表17的SEQ ID NO:1607-1609、1619、1620、1635-1637、1643-1645、1663-1670、1679-1684、1699-1701、1728-1730、1752、1753、1801、1802、1809和1810或与任何上述序列基本上相同或相似的序列并且任选地在序列的5'端和3'端含有核酸引物序列的核苷酸序列组成的扩增子序列。在一些实施例中,核酸和/或核酸引物对的组合包含以下核酸和/或核酸引物对或基本上由以下核酸和/或核酸引物对组成,所述核酸和/或核酸引物对含有选自以下的一个或多个核苷酸序列(在引物对的情况下)或基本上由选自以下的一个或多个核苷酸序列组成:表16中的SEQ IDNO:53-58、77-80、109-114、125-130、165-180、197-208、237-242、295-300、343-346、441-444、457-460、493-498、511-520、521-524、529-534、555-558、571-580、595、596、619-638、645-650、665-668、731-734、803、804、811、812和/或SEQ ID NO:831-836、855-858、887-892、903-908、943-958、975-986、1015-1020、1073-1078、1121-1124、1219-1222、1235-1238、1271-1276、1289-1298、1299-1302、1307-1312、1333-1336、1349-1358、1373、1374、1397-1416、1423-1428、1443-1446、1509-1512、1581、1582、1589和1590或基本上相同或相似的序列,或任何上述核酸或引物对的核苷酸序列,其中一个或多个胸腺嘧啶碱基被尿嘧啶碱基取代。在一些实施例中,核酸和/或核酸引物对的组合包含以下核酸和/或核酸引物对或基本上由以下核酸和/或核酸引物对组成,所述核酸和/或核酸引物对含有选自以下的一个或多个核苷酸序列(在引物对的情况下)或基本上由选自以下的一个或多个核苷酸序列组成:表16中的SEQ ID NO:53-58、77-80、109-114、125-130、165-180、197-208、237-242、295-300、343-346、441-444、457-460、493-498和511-520和/或表16中的SEQ ID NO:831-836、855-858、887-892、903-908、943-958、975-986、1015-1020、1073-1078、1121-1124、1219-1222、1235-1238、1271-1276、1289-1298或基本上相同或相似的序列,或任何上述核酸或引物对的核苷酸序列,其中一个或多个胸腺嘧啶碱基被尿嘧啶碱基取代。在一些实施例中,核酸和/或核酸引物对的组合包含以下核酸和/或核酸引物对或基本上由以下核酸和/或核酸引物对组成,所述核酸和/或核酸引物对含有选自以下的一个或多个核苷酸序列(在引物对的情况下)或基本上由选自以下的一个或多个核苷酸序列组成:表16A中的SEQID NO:53-58、77-80、109-114、125-130、165-180、197-208、237-242、295-300、343-346、441-444、457-460和/或表16D中的SEQ ID NO:831-836、855-858、887-892、903-908、943-958、975-986、1015-1020、1073-1078、1121-1124、1219-1222、1235-1238或基本上相同或相似的序列,或任何上述核酸或引物对的核苷酸序列,其中一个或多个胸腺嘧啶碱基被尿嘧啶碱基取代。在一些实施例中,所述组合包含不同的核酸或引物或基本上由不同的核酸或引物组成,所述不同的核酸或引物分别含有以下不同序列中的每一个或基本上由以下不同序列中的每一个组成:表16中的SEQ ID NO:53-58、77-80、109-114、125-130、165-180、197-208、237-242、295-300、343-346、441-444、457-460、493-498和511-520和/或表16中的SEQID NO:831-836、855-858、887-892、903-908、943-958、975-986、1015-1020、1073-1078、1121-1124、1219-1222、1235-1238、1271-1276、1289-1298或基本上相同或相似的序列,或任何上述核酸或引物对的核苷酸序列,其中一个或多个胸腺嘧啶碱基被尿嘧啶碱基取代。在一些实施例中,所述组合包含不同的核酸或引物或基本上由不同的核酸或引物组成,所述不同的核酸或引物分别含有以下不同序列中的每一个或基本上由以下不同序列中的每一个组成:表16A中的SEQ ID NO:53-58、77-80、109-114、125-130、165-180、197-208、237-242、295-300、343-346、441-444、457-460和/或表16D中的SEQ ID NO:831-836、855-858、887-892、903-908、943-958、975-986、1015-1020、1073-1078、1121-1124、1219-1222、1235-1238或基本上相同或相似的序列,或任何上述核酸或引物对的核苷酸序列,其中一个或多个胸腺嘧啶碱基被尿嘧啶碱基取代。
在一些实施例中,核酸和/或核酸引物对的组合包含两个或更多个核酸和/或核酸引物对,其与包含在以下一项或多项的基因组中的独特核酸序列特异性地结合、杂交和/或特异性地扩增所述独特核酸序列:嗜黏蛋白阿克曼菌、阴道厌氧球菌、极小奇异菌、诺迪拟杆菌、多形拟杆菌、普通拟杆菌、青春双歧杆菌、长双歧杆菌、产气柯林斯菌、粪便柯林斯菌、阿拉斯加脱硫弧菌、产甲酸多尔氏菌、屎肠球菌、直肠真杆菌、普氏栖粪杆菌、阴道加特纳菌、甲酸芽殖菌、丝状霍尔德曼氏菌、肺炎克雷伯氏菌、狄氏副拟杆菌、屎副拟杆菌、粪考拉杆菌、栖组织普氏菌、肠道罗斯氏菌、布氏瘤胃球菌、弱生斯莱克氏菌、婴儿链球菌和小韦荣氏球菌(在本文中被称为“B组”微生物;参见表2B),它们是被认为与免疫肿瘤治疗反应有关的种。在一些实施例中,核酸和/或核酸引物对的组合包含核酸引物对集,其中每个不同的核酸引物对特异性地扩增包含在B组中不同微生物的每个基因组的不同基因组中的不同独特核酸序列。在一些实施例中,核酸和/或核酸引物对的组合包含核酸和/或核酸引物对或基本上由核酸和/或核酸引物对组成,所述核酸和/或核酸引物对与核酸(如来自微生物(例如,细菌)的核酸)结合、杂交和/或扩增所述核酸,或与所述核酸特异性地结合、杂交和/或特异性地扩增所述核酸,所述核酸含有选自表17的SEQ ID NO:1605、1606、1643-1645、1648-1650、1659-1667、1682-1684、1689-1694、1702-1704、1718-1723、1728-1730、1735-1742、1748-1751、1754-1766、1780-1783、1791、1792、1801、1802、1809-1816、1821-1826、1829、1830、1864、1869-1871、1874-1882、1890-1896、1901-1903、1910-1915、1920-1922、1930-1931、1934-1939、1954、1955、1961-1964、1968、1972-1974和1977-1979的序列,和/或基本上相同或相似的序列。在一些实施例中,核酸和/或核酸引物对的组合包含以下核酸和/或核酸引物对或基本上由以下核酸和/或核酸引物对组成,所述核酸和/或核酸引物对与核酸(如来自微生物(例如,细菌)的核酸)结合、杂交和/或扩增所述核酸,或与所述核酸特异性地结合、杂交和/或特异性地扩增所述核酸,所述核酸含有选自表17的SEQ ID NO:1605、1606、1643-1645、1648-1650、1659-1667、1682-1684、1689-1694、1702-1704、1718-1723、1728-1730、1735-1742、1748-1751、1754-1766、1780-1783、1791、1792、1801、1802、1809-1816和1821-1826的序列,和/或基本上相同或相似的序列。在一些实施例中,核酸和/或核酸引物对的组合包含以下核酸和/或核酸引物对或基本上由以下核酸和/或核酸引物对组成,所述核酸和/或核酸引物对与核酸(如来自微生物(例如,细菌)的核酸)结合、杂交和/或扩增所述核酸,或与所述核酸特异性地结合、杂交和/或特异性地扩增所述核酸,所述核酸含有选自表17A的SEQ ID NO:1605、1606、1643-1645、1648-1650、1659-1667、1682-1684、1689-1694、1702-1704、1718-1723、1728-1730、1735-1742、1748-1751、1754-1766、1780-1783、1791、1792、1801、1802和1809-1816的序列,和/或基本上相同或相似的序列。在一些实施例中,核酸和/或核酸引物对的组合包含能够扩增或特异性地扩增核酸(如来自微生物(例如,细菌)的核酸)的引物和/或引物对或基本上由所述引物和/或引物对组成,所述核酸含有选自表17的SEQ ID NO:1605、1606、1643-1645、1648-1650、1659-1667、1682-1684、1689-1694、1702-1704、1718-1723、1728-1730、1735-1742、1748-1751、1754-1766、1780-1783、1791、1792、1801、1802、1809-1816、1821-1826、1829、1830、1864、1869-1871、1874-1882、1890-1896、1901-1903、1910-1915、1920-1922、1930-1931、1934-1939、1954、1955、1961-1964、1968、1972-1974和1977-1979的序列(或与任何上述序列基本上相同或相似的序列),以产生长度小于约500个、小于约475个、小于约450个、小于约400个、小于约375个、小于约350个、小于约300个、小于约275个、小于约250个、小于约200个、小于约175个、小于约150个或小于约100个核苷酸的扩增子序列,或基本上由选自表17的SEQ ID NO:1605、1606、1643-1645、1648-1650、1659-1667、1682-1684、1689-1694、1702-1704、1718-1723、1728-1730、1735-1742、1748-1751、1754-1766、1780-1783、1791、1792、1801、1802、1809-1816、1821-1826、1829、1830、1864、1869-1871、1874-1882、1890-1896、1901-1903、1910-1915、1920-1922、1930-1931、1934-1939、1954、1955、1961-1964、1968、1972-1974和1977-1979或与任何上述序列基本上相同或相似的序列并且任选地在序列的5'端和3'端含有核酸引物序列的核苷酸序列组成的扩增子序列。在一些实施例中,核酸和/或核酸引物对的组合包含能够扩增或特异性地扩增核酸(如来自微生物(例如,细菌)的核酸)的引物和/或引物对或基本上由所述引物和/或引物对组成,所述核酸含有选自表17的SEQ ID NO:1605、1606、1643-1645、1648-1650、1659-1667、1682-1684、1689-1694、1702-1704、1718-1723、1728-1730、1735-1742、1748-1751、1754-1766、1780-1783、1791、1792、1801、1802、1809-1816和1821-1826的序列(或与任何上述序列基本上相同或相似的序列),以产生长度小于约500个、小于约475个、小于约450个、小于约400个、小于约375个、小于约350个、小于约300个、小于约275个、小于约250个、小于约200个、小于约175个、小于约150个或小于约100个核苷酸的扩增子序列,或基本上由选自表17的SEQ ID NO:1605、1606、1643-1645、1648-1650、1659-1667、1682-1684、1689-1694、1702-1704、1718-1723、1728-1730、1735-1742、1748-1751、1754-1766、1780-1783、1791、1792、1801、1802、1809-1816和1821-1826或与任何上述序列基本上相同或相似的序列并且任选地在序列的5'端和3'端含有核酸引物序列的核苷酸序列组成的扩增子序列。在一些实施例中,核酸和/或核酸引物对的组合包含能够扩增或特异性地扩增核酸(如来自微生物(例如,细菌)的核酸)的引物和/或引物对或基本上由所述引物和/或引物对组成,所述核酸含有选自表17A的SEQ ID NO:1605、1606、1643-1645、1648-1650、1659-1667、1682-1684、1689-1694、1702-1704、1718-1723、1728-1730、1735-1742、1748-1751、1754-1766、1780-1783、1791、1792、1801、1802和1809-1816的序列(或与任何上述序列基本上相同或相似的序列),以产生长度小于约500个、小于约475个、小于约450个、小于约400个、小于约375个、小于约350个、小于约300个、小于约275个、小于约250个、小于约200个、小于约175个、小于约150个或小于约100个核苷酸的扩增子序列,或基本上由选自表17A的SEQ ID NO:1605、1606、1643-1645、1648-1650、1659-1667、1682-1684、1689-1694、1702-1704、1718-1723、1728-1730、1735-1742、1748-1751、1754-1766、1780-1783、1791、1792、1801、1802和1809-1816或与任何上述序列基本上相同或相似的序列并且任选地在序列的5'端和3'端含有核酸引物序列的核苷酸序列组成的扩增子序列。在一些实施例中,核酸和/或核酸引物对的组合包含以下核酸和/或核酸引物对或基本上由以下核酸和/或核酸引物对组成,所述核酸和/或核酸引物对含有选自以下的一个或多个核苷酸序列(在引物对的情况下)或基本上由选自以下的一个或多个核苷酸序列组成:表16中的SEQ IDNO:49-52、125-130、135-140、157-174、203-208、217-228、243-248、275-286、295-300、309-324、335-342、347-372、399-406、421-424、441-444、457-472、481-492、525-528、595、596、605-610、615-632、647-660、669-674、687-698、707-712、727-730、735-746、775-778、789-796、803、804、811-816、821-826和/或SEQ ID NO:827-830、903-908、913-918、935-952、981-986、995-1006、1021-1026、1053-1064、1073-1078、1087-1102、1113-1120、1125-1150、1177-1184、1199-1202、1219-1222、1235-1250、1259-1270、1303-1306、1373、1374、1383-1388、1393-1410、1425-1438、1447-1452、1465-1476、1485-1490、1505-1508、1513-1524、1553-1556、1567-1574、1581、1582、1589-1594、1599-1604或基本上相同或相似的序列,或任何上述核酸或引物对的核苷酸序列,其中一个或多个胸腺嘧啶碱基被尿嘧啶碱基取代。在一些实施例中,核酸和/或核酸引物对的组合包含以下核酸和/或核酸引物对或基本上由以下核酸和/或核酸引物对组成,所述核酸和/或核酸引物对含有选自以下的一个或多个核苷酸序列(在引物对的情况下)或基本上由选自以下的一个或多个核苷酸序列组成:表16中的SEQ ID NO:49-52、125-130、135-140、157-174、203-208、217-228、243-248、275-286、295-300、309-324、335-342、347-372、399-406、421-424、441-444、457-472、481-492和/或SEQ ID NO:827-830、903-908、913-918、935-952、981-986、995-1006、1021-1026、1053-1064、1073-1078、1087-1102、1113-1120、1125-1150、1177-1184、1199-1202、1219-1222、1235-1250、1259-1270或基本上相同或相似的序列,或任何上述核酸或引物对的核苷酸序列,其中一个或多个胸腺嘧啶碱基被尿嘧啶碱基取代。在一些实施例中,核酸和/或核酸引物对的组合包含以下核酸和/或核酸引物对或基本上由以下核酸和/或核酸引物对组成,所述核酸和/或核酸引物对含有选自以下的一个或多个核苷酸序列(在引物对的情况下)或基本上由选自以下的一个或多个核苷酸序列组成:表16A中的SEQ ID NO:49-52、125-130、135-140、157-174、203-208、217-228、243-248、275-286、295-300、309-324、335-342、347-372、399-406、421-424、441-444、457-472和/或表16D中的SEQ ID NO:827-830、903-908、913-918、935-952、981-986、995-1006、1021-1026、1053-1064、1073-1078、1087-1102、1113-1120、1125-1150、1177-1184、1199-1202、1219-1222、1235-1250或基本上相同或相似的序列,或任何上述核酸或引物对的核苷酸序列,其中一个或多个胸腺嘧啶碱基被尿嘧啶碱基取代。在一些实施例中,所述组合包含不同的核酸或引物或基本上由不同的核酸或引物组成,所述不同的核酸或引物分别含有以下不同序列中的每一个或基本上由以下不同序列中的每一个组成:表16中的49-52、125-130、135-140、157-174、203-208、217-228、243-248、275-286、295-300、309-324、335-342、347-372、399-406、421-424、441-444、457-472、481-492和/或SEQ ID NO:827-830、903-908、913-918、935-952、981-986、995-1006、1021-1026、1053-1064、1073-1078、1087-1102、1113-1120、1125-1150、1177-1184、1199-1202、1219-1222、1235-1250、1259-1270或基本上相同或相似的序列,或任何上述核酸或引物对的核苷酸序列,其中一个或多个胸腺嘧啶碱基被尿嘧啶碱基取代。在一些实施例中,所述组合包含不同的核酸或引物或基本上由不同的核酸或引物组成,所述不同的核酸或引物分别含有以下不同序列中的每一个或基本上由以下不同序列中的每一个组成:表16A中的SEQID NO:49-52、125-130、135-140、157-174、203-208、217-228、243-248、275-286、295-300、309-324、335-342、347-372、399-406、421-424、441-444、457-472和/或表16D中的SEQ IDNO:827-830、903-908、913-918、935-952、981-986、995-1006、1021-1026、1053-1064、1073-1078、1087-1102、1113-1120、1125-1150、1177-1184、1199-1202、1219-1222、1235-1250或基本上相同或相似的序列,或任何上述核酸或引物对的核苷酸序列,其中一个或多个胸腺嘧啶碱基被尿嘧啶碱基取代。
在一些实施例中,核酸和/或核酸引物对的组合包含两个或更多个核酸和/或核酸引物对,其与包含在以下一项或多项的基因组中的独特核酸序列特异性地结合、杂交和/或特异性地扩增所述独特核酸序列:脆弱拟杆菌、空肠弯曲杆菌、痤疮丙酸杆菌、大肠杆菌、具核梭杆菌、胆型螺杆菌、毕氏螺杆菌、肝螺杆菌、幽门螺杆菌、扎氏螺杆菌、口腔消化链球菌和解没食子酸链球菌(在本文中被称为“C组”微生物;参见表2C),它们是被认为与癌症有关的种。在一些实施例中,核酸和/或核酸引物对的组合包含两个或更多个核酸和/或核酸引物对,其与包含在以下一项或多项的基因组中的独特核酸序列特异性地结合、杂交和/或特异性地扩增所述独特核酸序列:脆弱拟杆菌、空肠弯曲杆菌、痤疮丙酸杆菌、大肠杆菌、具核梭杆菌、胆型螺杆菌、毕氏螺杆菌、肝螺杆菌、幽门螺杆菌、口腔消化链球菌和解没食子酸链球菌(在本文中被称为C组微生物的“亚组1”)。在一些实施例中,核酸和/或核酸引物对的组合包含核酸引物对集,其中每个不同的核酸引物对特异性地扩增包含在C组或不包含扎氏螺杆菌的C组(即,C组的亚组1)中不同微生物的每个基因组的不同基因组中的不同独特核酸序列。在一些实施例中,核酸和/或核酸引物对的组合包含以下核酸和/或核酸引物对或基本上由以下核酸和/或核酸引物对组成,所述核酸和/或核酸引物对与核酸(如来自微生物(例如,细菌)的核酸)结合、杂交和/或扩增所述核酸,或与所述核酸特异性地结合、杂交和/或特异性地扩增所述核酸,所述核酸含有选自表17的SEQ ID NO:1616、1619、1620、1625-1628、1635-1640、1699、1700、1705-1708、1752、1753、1784-1786、1817-1820、1827、1828、1840、1841、1844、1845、1852-1859、1899、1900、1904、1905、1932、1933、1956-1958、1975、1976的序列和/或基本上相同或相似的序列,或所述核酸含有选自表17的SEQ ID NO:1616、1619、1620、1625-1628、1635-1640、1699、1700、1705-1708、1752、1753、1784-1786、1827、1828、1840、1841、1844、1845、1852-1859、1899、1900、1904、1905、1932、1933、1956、1957、1958的序列和/或基本上相同或相似的序列。在一些实施例中,核酸和/或核酸引物对的组合包含以下核酸和/或核酸引物对或基本上由以下核酸和/或核酸引物对组成,所述核酸和/或核酸引物对与核酸(如来自微生物(例如,细菌)的核酸)结合、杂交和/或扩增所述核酸,或与所述核酸特异性地结合、杂交和/或特异性地扩增所述核酸,所述核酸含有选自表17A的SEQ ID NO:1616、1619、1620、1625-1628、1635-1640、1699、1700、1705-1708、1752、1753、1784-1786、1817-1820的序列和/或基本上相同或相似的序列,或所述核酸含有选自表17A的SEQ ID NO:1616、1619、1620、1625-1628、1635-1640、1699、1700、1705-1708、1752、1753、1784-1786的序列和/或基本上相同或相似的序列。在一些实施例中,核酸和/或核酸引物对的组合包含能够扩增或特异性地扩增核酸(如来自微生物(例如,细菌)的核酸)的引物和/或引物对或基本上由所述引物和/或引物对组成,所述核酸含有选自表17的SEQ IDNO:1616、1619、1620、1625-1628、1635-1640、1699、1700、1705-1708、1752、1753、1784-1786、1817-1820、1827、1828、1840、1841、1844、1845、1852-1859、1899、1900、1904、1905、1932、1933、1956-1958、1975、1976的序列(或与任何上述序列基本上相同或相似的序列),以产生长度小于约500个、小于约475个、小于约450个、小于约400个、小于约375个、小于约350个、小于约300个、小于约275个、小于约250个、小于约200个、小于约175个、小于约150个或小于约100个核苷酸的扩增子序列,或基本上由选自表17的SEQ ID NO:1616、1619、1620、1625-1628、1635-1640、1699、1700、1705-1708、1752、1753、1784-1786、1817-1820、1827、1828、1840、1841、1844、1845、1852-1859、1899、1900、1904、1905、1932、1933、1956-1958、1975、1976或与任何上述序列基本上相同或相似的序列并且任选地在序列的5'端和3'端含有核酸引物序列的核苷酸序列组成的扩增子序列。在一些实施例中,核酸和/或核酸引物对的组合包含能够扩增或特异性地扩增核酸(如来自微生物(例如,细菌)的核酸)的引物和/或引物对或基本上由所述引物和/或引物对组成,所述核酸含有选自表17A的SEQ ID NO:1616、1619、1620、1625-1628、1635-1640、1699、1700、1705-1708、1752、1753、1784-1786、1817-1820的序列(或与任何上述序列基本上相同或相似的序列),以产生长度小于约500个、小于约475个、小于约450个、小于约400个、小于约375个、小于约350个、小于约300个、小于约275个、小于约250个、小于约200个、小于约175个、小于约150个或小于约100个核苷酸的扩增子序列,或基本上由选自表17A的SEQ ID NO:1616、1619、1620、1625-1628、1635-1640、1699、1700、1705-1708、1752、1753、1784-1786、1817-1820或与任何上述序列基本上相同或相似的序列并且任选地在序列的5'端和3'端含有核酸引物序列的核苷酸序列组成的扩增子序列。在一些实施例中,核酸和/或核酸引物对的组合包含以下核酸和/或核酸引物对或基本上由以下核酸和/或核酸引物对组成,所述核酸和/或核酸引物对含有选自以下的一个或多个核苷酸序列(在引物对的情况下)或基本上由选自以下的一个或多个核苷酸序列组成:表16中的SEQ ID NO:71、72、77-80、89-96、109-120、237-242、249-256、343-346、407-412、473-480、493-496、511-520、521-524、547-550、555-558、561-568、571-586、665-668、675-678、731-734、779-784、817-820和/或SEQ ID NO:849、850、855-858、867-874、887-898、1012-1020、1025-1034、1121-1124、1185-1190、1251-1258、1271-1276、1289-1298、1299-1302、1325-1328、1333-1336、1339-1346、1349-1364、1443-1446、1453-1456、1509-1512、1557-1562、1595-1598或基本上相同或相似的序列,或任何上述核酸或引物对的核苷酸序列,其中一个或多个胸腺嘧啶碱基被尿嘧啶碱基取代。在一些实施例中,核酸和/或核酸引物对的组合包含以下核酸和/或核酸引物对或基本上由以下核酸和/或核酸引物对组成,所述核酸和/或核酸引物对含有选自以下的一个或多个核苷酸序列(在引物对的情况下)或基本上由选自以下的一个或多个核苷酸序列组成:表16中的SEQ ID NO:71、72、77-80、89-96、109-120、237-242、249-256、343-346、407-412、473-480、493-496、511-520和/或SEQ ID NO:849、850、855-858、867-874、887-898、1012-1020、1025-1034、1121-1124、1185-1190、1251-1258、1271-1276、1289-1298或基本上相同或相似的序列,或任何上述核酸或引物对的核苷酸序列,其中一个或多个胸腺嘧啶碱基被尿嘧啶碱基取代。在一些实施例中,核酸和/或核酸引物对的组合包含以下核酸和/或核酸引物对或基本上由以下核酸和/或核酸引物对组成,所述核酸和/或核酸引物对含有选自以下的一个或多个核苷酸序列(在引物对的情况下)或基本上由选自以下的一个或多个核苷酸序列组成:表16中的SEQ IDNO:71、72、77-80、89-96、109-120、237-242、249-256、343-346、407-412、473-480和/或SEQID NO:849、850、855-858、867-874、887-898、1012-1020、1025-1034、1121-1124、1185-1190、1251-1258或基本上相同或相似的序列,或任何上述核酸或引物对的核苷酸序列,其中一个或多个胸腺嘧啶碱基被尿嘧啶碱基取代。在一些实施例中,所述组合包含不同的核酸或引物或基本上由不同的核酸或引物组成,所述不同的核酸或引物分别含有以下不同序列中的每一个或基本上由以下不同序列中的每一个组成:表16中的SEQ ID NO:71、72、77-80、89-96、109-120、237-242、249-256、343-346、407-412、473-480、493-496、511-520、521-524、547-550、555-558、561-568、571-586、665-668、675-678、731-734、779-784、817-820和/或SEQ ID NO:849、850、855-858、867-874、887-898、1012-1020、1025-1034、1121-1124、1185-1190、1251-1258、1271-1276、1289-1298、1299-1302、1325-1328、1333-1336、1339-1346、1349-1364、1443-1446、1453-1456、1509-1512、1557-1562、1595-1598或基本上相同或相似的序列,或任何上述核酸或引物对的核苷酸序列,其中一个或多个胸腺嘧啶碱基被尿嘧啶碱基取代。在一些实施例中,所述组合包含不同的核酸或引物或基本上由不同的核酸或引物组成,所述不同的核酸或引物分别含有以下不同序列中的每一个或基本上由以下不同序列中的每一个组成:表16中的SEQ ID NO:71、72、77-80、89-96、109-120、237-242、249-256、343-346、407-412、493-496、511-520、521-524、547-550、555-558、561-568、571-586、665-668、675-678、731-734、779-784和/或SEQ ID NO:849、850、855-858、867-874、887-898、1012-1020、1025-1034、1121-1124、1185-1190、1271-1276、1289-1298、1299-1302、1325-1328、1333-1336、1339-1346、1349-1364、1443-1446、1453-1456、1509-1512、1557-1562或基本上相同或相似的序列,或任何上述核酸或引物对的核苷酸序列,其中一个或多个胸腺嘧啶碱基被尿嘧啶碱基取代。在一些实施例中,所述组合包含不同的核酸或引物或基本上由不同的核酸或引物组成,所述不同的核酸或引物分别含有以下不同序列中的每一个或基本上由以下不同序列中的每一个组成:表16中的SEQ ID NO:71、72、77-80、89-96、109-120、237-242、249-256、343-346、407-412、473-480、493-496、511-520和/或SEQ IDNO:849、850、855-858、867-874、887-898、1012-1020、1025-1034、1121-1124、1185-1190、1251-1258、1271-1276、1289-1298或基本上相同或相似的序列,或任何上述核酸或引物对的核苷酸序列,其中一个或多个胸腺嘧啶碱基被尿嘧啶碱基取代。在一些实施例中,所述组合包含不同的核酸或引物或基本上由不同的核酸或引物组成,所述不同的核酸或引物分别含有以下不同序列中的每一个或基本上由以下不同序列中的每一个组成:表16中的SEQ IDNO:71、72、77-80、89-96、109-120、237-242、249-256、343-346、407-412、493-496、511-520和/或SEQ ID NO:849、850、855-858、867-874、887-898、1012-1020、1025-1034、1121-1124、1185-1190、1271-1276、1289-1298或基本上相同或相似的序列,或任何上述核酸或引物对的核苷酸序列,其中一个或多个胸腺嘧啶碱基被尿嘧啶碱基取代。在一些实施例中,所述组合包含不同的核酸或引物或基本上由不同的核酸或引物组成,所述不同的核酸或引物分别含有以下不同序列中的每一个或基本上由以下不同序列中的每一个组成:表16中的SEQ IDNO:71、72、77-80、89-96、109-120、237-242、249-256、343-346、407-412、473-480和/或SEQID NO:849、850、855-858、867-874、887-898、1012-1020、1025-1034、1121-1124、1185-1190、1251-1258或基本上相同或相似的序列,或任何上述核酸或引物对的核苷酸序列,其中一个或多个胸腺嘧啶碱基被尿嘧啶碱基取代。在一些实施例中,所述组合包含不同的核酸或引物或基本上由不同的核酸或引物组成,所述不同的核酸或引物分别含有以下不同序列中的每一个或基本上由以下不同序列中的每一个组成:表16中的SEQ ID NO:71、72、77-80、89-96、109-120、237-242、249-256、343-346、407-412和/或SEQ ID NO:849、850、855-858、867-874、887-898、1012-1020、1025-1034、1121-1124、1185-1190或基本上相同或相似的序列,或任何上述核酸或引物对的核苷酸序列,其中一个或多个胸腺嘧啶碱基被尿嘧啶碱基取代。
在一些实施例中,核酸和/或核酸引物对的组合包含两个或更多个核酸和/或核酸引物对,其与包含在以下一项或多项的基因组中的独特核酸序列特异性地结合、杂交和/或特异性地扩增所述独特核酸序列:嗜黏蛋白阿克曼菌、两歧双歧杆菌、长双歧杆菌、类球布劳特氏菌、简明弯曲杆菌、曲形弯曲杆菌、空肠弯曲杆菌、直肠弯曲杆菌、艰难梭菌、大肠杆菌、直肠真杆菌、具核梭杆菌、胆型螺杆菌、肝螺杆菌、幽门螺杆菌、肺炎克雷伯氏菌、德氏乳杆菌、狄氏副拟杆菌、奇异变形杆菌、布氏瘤胃球菌和活泼瘤胃球菌(在本文中被称为“D组”微生物;参见表2D),它们是被认为与胃肠道病症有关的种,所述胃肠道病症包含例如肠易激综合征、炎症性肠病和乳糜泻。在一些实施例中,核酸和/或核酸引物对的组合包含核酸引物对集,其中每个不同的核酸引物对特异性地扩增包含在D组中不同微生物的每个基因组的不同基因组中的不同独特核酸序列。在一些实施例中,核酸和/或核酸引物对的组合包含核酸和/或核酸引物对或基本上由核酸和/或核酸引物对组成,所述核酸和/或核酸引物对与核酸(如来自微生物(例如,细菌)的核酸)结合、杂交和/或扩增所述核酸,或与所述核酸特异性地结合、杂交和/或特异性地扩增所述核酸,所述核酸含有选自以下的序列:表17中的序列、或表17中不包含SEQ ID NO:1807、1808和1971的序列、或表17A和表17B中的序列、或表17B和表17A中不包含SEQ ID NO:1807和1808的序列,和/或基本上相同或相似的序列,其对应于D组微生物。在一些实施例中,核酸和/或核酸引物对的组合包含能够扩增或特异性地扩增核酸(如来自微生物(例如,细菌)的核酸)的引物和/或引物对或基本上由所述引物和/或引物对组成,所述核酸含有选自以下的序列:表17中的序列、或表17中不包含SEQID NO:1807、1808和1971的序列、或表17A和表17B中的序列、或表17B和表17A中不包含SEQID NO:1807和1808的序列,和/或基本上相同或相似的序列,其对应于D组微生物(或与任何上述序列基本上相同或相似的序列),以产生长度小于约500个、小于约475个、小于约450个、小于约400个、小于约375个、小于约350个、小于约300个、小于约275个、小于约250个、小于约200个、小于约175个、小于约150个或小于约100个核苷酸的扩增子序列,或基本上由选自以下各项并且任选地在序列的5'端和3'端含有核酸引物序列的核苷酸序列组成的扩增子序列:表17中的序列、或表17中不包含SEQ ID NO:1807、1808和1971的序列、或表17A和表17B中的序列、或表17B和表17A中不包含SEQ ID NO:1807和1808的序列,和/或基本上相同或相似的序列,其对应于D组微生物,或与任何上述序列基本上相同或相似的序列。在一些实施例中,核酸和/或核酸引物对的组合包含能够扩增或特异性地扩增核酸(如来自微生物(例如,细菌)的核酸)的引物和/或引物对或基本上由所述引物和/或引物对组成,所述核酸含有选自以下的序列:表17中的序列、或表17中不包含SEQ ID NO:1807、1808和1971的序列、或表17A和表17B中的序列、或表17B和表17A中不包含SEQ ID NO:1807和1808的序列(或与任何上述序列基本上相同或相似的序列),其对应于D组微生物,以产生长度小于约500个、小于约475个、小于约450个、小于约400个、小于约375个、小于约350个、小于约300个、小于约275个、小于约250个、小于约200个、小于约175个、小于约150个或小于约100个核苷酸的扩增子序列,或基本上由选自表17或表17A和表17B中的序列(其对应于D组微生物)或与任何上述序列基本上相同或相似的序列并且任选地在序列的5'端和3'端含有核酸引物序列的核苷酸序列组成的扩增子序列。在一些实施例中,核酸和/或核酸引物对的组合包含以下核酸和/或核酸引物对或基本上由以下核酸和/或核酸引物对组成,所述核酸和/或核酸引物对含有选自以下的一个或多个核苷酸序列(在引物对的情况下)或基本上由选自以下的一个或多个核苷酸序列组成:表16中对应于D组微生物的序列;或表16中不包含SEQ IDNO:453-456、809、810、1231-1234和1587-1588的序列;或表16的SEQ ID NO:49-520;或表16的SEQ ID NO:49-452和457-520;或表16的SEQ ID NO:49-492;或表16的SEQ ID NO:49-452和457-492;或表16A的SEQ ID NO:49-480;或表16A的SEQ ID NO:49-452和457-480;或表16C的SEQ ID NO:521-826;或表16C的SEQ ID NO:521-820;或表16的SEQ ID NO:827-1298;或表16的SEQ ID NO:827-1230和1235-1298;或表16D的SEQ ID NO:827-1258;或表16D的SEQ ID NO:827-1230和1235-1258;或表16F的SEQ ID NO:1299-1604;或表16F的SEQ IDNO:1299-1598;或基本上相同或相似的序列,或任何上述核酸或引物对的核苷酸序列,其中一个或多个胸腺嘧啶碱基被尿嘧啶碱基取代。在一些实施例中,核酸和/或核酸引物对的组合包含以下核酸和/或核酸引物对或基本上由以下核酸和/或核酸引物对组成,所述核酸和/或核酸引物对含有选自以下的一个或多个核苷酸序列(在引物对的情况下)或基本上由选自以下的一个或多个核苷酸序列组成:表16中对应于D组微生物的序列;或表16中不包含SEQ ID NO:453-456、809、810、1231-1234和1587-1588的序列;或表16的SEQ ID NO:49-520;或表16的SEQ ID NO:49-452和457-520;或表16的SEQ ID NO:49-492;或表16的SEQ IDNO:49-452和457-492;或表16A的SEQ ID NO:49-480;或表16A的SEQ ID NO:49-452和457-480;或表16C的SEQ ID NO:521-826;或表16C的SEQ ID NO:521-820;或表16的SEQ ID NO:827-1298;或表16的SEQ ID NO:827-1230和1235-1298;或表16D的SEQ ID NO:827-1258;或表16D的SEQ ID NO:827-1230和1235-1258;或表16F的SEQ ID NO:1299-1604;或表16F的SEQ ID NO:1299-1598;或基本上相同或相似的序列,或任何上述核酸或引物对的核苷酸序列,其中一个或多个胸腺嘧啶碱基被尿嘧啶碱基取代。在一些实施例中,核酸和/或核酸引物对的组合包含以下核酸和/或核酸引物对或基本上由以下核酸和/或核酸引物对组成,所述核酸和/或核酸引物对含有选自以下的一个或多个核苷酸序列(在引物对的情况下)或基本上由选自以下的一个或多个核苷酸序列组成:表16中对应于D组微生物的序列;或表16中不包含SEQ ID NO:453-456、809、810、1231-1234和1587-1588的序列;或表16的SEQ ID NO:49-520;或表16的SEQ ID NO:49-452和457-520;或表16的SEQ ID NO:49-492;或表16的SEQID NO:49-452和457-492;或表16A的SEQ ID NO:49-480;或表16A的SEQ ID NO:49-452和457-480;或表16C的SEQ ID NO:521-826;或表16C的SEQ ID NO:521-820;或表16的SEQ IDNO:827-1298;或表16的SEQ ID NO:827-1230和1235-1298;或表16D的SEQ ID NO:827-1258;或表16D的SEQ ID NO:827-1230和1235-1258;或表16F的SEQ ID NO:1299-1604;或表16F的SEQ ID NO:1299-1598;或基本上相同或相似的序列,或任何上述核酸或引物对的核苷酸序列,其中一个或多个胸腺嘧啶碱基被尿嘧啶碱基取代。在一些实施例中,所述组合包含不同的核酸或引物或基本上由不同的核酸或引物组成,所述不同的核酸或引物分别含有以下不同序列中的每一个或基本上由以下不同序列中的每一个组成:表16中对应于D组微生物的序列;或表16中不包含SEQ ID NO:453-456、809、810、1231-1234和1587-1588的序列;或表16的SEQ ID NO:49-520;或表16的SEQ ID NO:49-452和457-520;或表16的SEQ IDNO:49-492;或表16的SEQ ID NO:49-452和457-492;或表16A的SEQ ID NO:49-480;或表16A的SEQ ID NO:49-452和457-480;或表16C的SEQ ID NO:521-826;或表16C的SEQ ID NO:521-820;或表16的SEQ ID NO:827-1298;或表16的SEQ ID NO:827-1230和1235-1298;或表16D的SEQ ID NO:827-1258;或表16D的SEQ ID NO:827-1230和1235-1258;或表16F的SEQID NO:1299-1604;或表16F的SEQ ID NO:1299-1598;或基本上相同或相似的序列,或任何上述核酸或引物对的核苷酸序列,其中一个或多个胸腺嘧啶碱基被尿嘧啶碱基取代。
在一些实施例中,核酸和/或核酸引物对的组合包含两个或更多个核酸和/或核酸引物对,其与包含在以下一项或多项的基因组中的独特核酸序列特异性地结合、杂交和/或特异性地扩增所述独特核酸序列:嗜黏蛋白阿克曼菌、脆弱拟杆菌、普通拟杆菌、青春双歧杆菌、简明弯曲杆菌、空肠弯曲杆菌、鼠柠檬酸杆菌、艰难梭菌、鹑鸡肠球菌、大肠杆菌、胆型螺杆菌、德氏乳杆菌、鼠乳杆菌、罗伊氏乳杆菌、鼠李糖乳杆菌、乳酸乳杆菌和人体普氏菌(在本文中被称为“E组”微生物;参见表2E),它们是被认为与自身免疫性病症有关的种,所述自身免疫性病症包含但不限于狼疮和类风湿性关节炎。在一些实施例中,核酸和/或核酸引物对的组合包含核酸引物对集,其中每个不同的核酸引物对特异性地扩增包含在E组中不同微生物的每个基因组的不同基因组中的不同独特核酸序列。在一些实施例中,核酸和/或核酸引物对的组合包含核酸和/或核酸引物对或基本上由核酸和/或核酸引物对组成,所述核酸和/或核酸引物对与核酸(如来自微生物(例如,细菌)的核酸)结合、杂交和/或扩增所述核酸,或与所述核酸特异性地结合、杂交和/或特异性地扩增所述核酸,所述核酸含有选自以下的序列:表17或表17A和表17B中的序列,和/或基本上相同或相似的序列,其对应于E组微生物。在一些实施例中,核酸和/或核酸引物对的组合包含能够扩增或特异性地扩增核酸(如来自微生物(例如,细菌)的核酸)的引物和/或引物对或基本上由所述引物和/或引物对组成,所述核酸含有选自以下的序列:表17或表17A和表17B中的序列,和/或基本上相同或相似的序列,其对应于E组微生物(或与任何上述序列基本上相同或相似的序列),以产生长度小于约500个、小于约475个、小于约450个、小于约400个、小于约375个、小于约350个、小于约300个、小于约275个、小于约250个、小于约200个、小于约175个、小于约150个或小于约100个核苷酸的扩增子序列,或基本上由选自表17或表17A和表17B中的序列和/或基本上相同或相似的序列(其对应于E组微生物)或与任何上述序列基本上相同或相似的序列并且任选地在序列的5'端和3'端含有核酸引物序列的核苷酸序列组成的扩增子序列。在一些实施例中,核酸和/或核酸引物对的组合包含能够扩增或特异性地扩增核酸(如来自微生物(例如,细菌)的核酸)的引物和/或引物对或基本上由所述引物和/或引物对组成,所述核酸含有选自以下的序列:表17或表17A和表17B中的序列(或与任何上述序列基本上相同或相似的序列),其对应于E组微生物,以产生长度小于约500个、小于约475个、小于约450个、小于约400个、小于约375个、小于约350个、小于约300个、小于约275个、小于约250个、小于约200个、小于约175个、小于约150个或小于约100个核苷酸的扩增子序列,或基本上由选自表17或表17A和表17B中的序列(其对应于E组微生物)或与任何上述序列基本上相同或相似的序列并且任选地在序列的5'端和3'端含有核酸引物序列的核苷酸序列组成的扩增子序列。在一些实施例中,核酸和/或核酸引物对的组合包含以下核酸和/或核酸引物对或基本上由以下核酸和/或核酸引物对组成,所述核酸和/或核酸引物对含有选自以下的一个或多个核苷酸序列(在引物对的情况下)或基本上由选自以下的一个或多个核苷酸序列组成:表16中对应于E组微生物的序列;表16的SEQ ID NO:49-520;表16的SEQ ID NO:49-492;表16A的SEQ ID NO:49-480;表16C的SEQ ID NO:521-826;表16C的SEQ ID NO:521-820;表16的SEQ ID NO:827-1298;表16D的SEQ ID NO:827-1258;表16F的SEQ ID NO:1299-1604;或表16F的SEQ ID NO:1299-1598;或基本上相同或相似的序列,或任何上述核酸或引物对的核苷酸序列,其中一个或多个胸腺嘧啶碱基被尿嘧啶碱基取代。在一些实施例中,核酸和/或核酸引物对的组合包含以下核酸和/或核酸引物对或基本上由以下核酸和/或核酸引物对组成,所述核酸和/或核酸引物对含有选自以下的一个或多个核苷酸序列(在引物对的情况下)或基本上由选自以下的一个或多个核苷酸序列组成:表16中对应于E组微生物的序列;表16的SEQ ID NO:49-520;表16的SEQ ID NO:49-492;表16A的SEQ ID NO:49-480;表16C的SEQ ID NO:521-826;表16C的SEQ ID NO:521-820;表16的SEQ ID NO:827-1298;表16D的SEQ ID NO:827-1258;表16F的SEQ ID NO:1299-1604;或表16F的SEQ ID NO:1299-1598;或基本上相同或相似的序列,或任何上述核酸或引物对的核苷酸序列,其中一个或多个胸腺嘧啶碱基被尿嘧啶碱基取代。在一些实施例中,核酸和/或核酸引物对的组合包含以下核酸和/或核酸引物对或基本上由以下核酸和/或核酸引物对组成,所述核酸和/或核酸引物对含有选自以下的一个或多个核苷酸序列(在引物对的情况下)或基本上由选自以下的一个或多个核苷酸序列组成:表16中对应于E组微生物的序列;表16的SEQ ID NO:49-520;表16的SEQ ID NO:49-492;表16A的SEQ ID NO:49-480;表16C的SEQ ID NO:521-826;表16C的SEQ ID NO:521-820;表16的SEQ ID NO:827-1298;表16D的SEQ ID NO:827-1258;表16F的SEQ ID NO:1299-1604;或表16F的SEQ ID NO:1299-1598;或基本上相同或相似的序列,或任何上述核酸或引物对的核苷酸序列,其中一个或多个胸腺嘧啶碱基被尿嘧啶碱基取代。在一些实施例中,所述组合包含不同的核酸或引物或基本上由不同的核酸或引物组成,所述不同的核酸或引物分别含有以下不同序列中的每一个或基本上由以下不同序列中的每一个组成:表16中对应于E组微生物的序列;表16的SEQ ID NO:49-520;表16的SEQ ID NO:49-492;表16A的SEQ ID NO:49-480;表16C的SEQ ID NO:521-826;表16C的SEQ ID NO:521-820;表16的SEQ ID NO:827-1298;表16D的SEQ ID NO:827-1258;表16F的SEQ ID NO:1299-1604;或表16F的SEQ ID NO:1299-1598;或基本上相同或相似的序列,或任何上述核酸或引物对的核苷酸序列,其中一个或多个胸腺嘧啶碱基被尿嘧啶碱基取代。
核酸组合
为了准确地评估、剖析和表征微生物群体,以便在动物或环境的微生物组与健康状态或体内平衡和失衡或疾病之间建立有意义的相关性,然后评估和表征微生物组样品以检测和/或诊断失衡、易感性、病症和/或疾病,必须能够对微生物群体中的微生物组成进行全面、具体和成比例的评估。微生物群体的准确分析依赖于至少在属水平上全面检测和鉴定群体中存在的所有微生物(例如,细菌),以及检测和鉴定一些微生物,例如在健康和疾病中特别重要的微生物,大部分、大多数或基本上所有存在于群体中的微生物种,以实现群体中微生物组成的足够深度。本文提供了组合物和方法,以及包含所述组合物和方法的组合、试剂盒和系统,用于对微生物(例如,细菌)的混合物或群体进行准确、全面、信息丰富、敏感、特异性、快速、高通量和高成本效益的评估、剖析或表征。在一些实施例中,微生物的混合物或群体存在于样品(例如,生物样品)中,例如,生物体(如动物)消化道内容物的样品。在一些实施例中,本文提供的用于微生物(例如,细菌)的混合物或群体的此类评估、剖析或表征的组合物包含以下的组合:(1)一个或多个界涵盖核酸引物对,其能够扩增对于界中的多个、大部分、大多数、基本上所有或所有微生物(例如,细菌)而言是共有的但在不同界的微生物之间会有所不同的同源基因或基因组区域中的序列;和/或(2)微生物特异性核酸和/或核酸引物对,其能够扩增或特异性或选择性地扩增特定微生物(例如,如细菌等微生物的种、亚种或菌株)所独有的特异性核酸序列。本文提供了可用于核酸组合中的界涵盖核酸引物对和微生物特异性核酸引物对的许多实施例。
例如,在一些实施例中,核酸组合中的界涵盖核酸包含一个或多个引物对,其单独地扩增原核(例如,细菌)16S rRNA基因中的两个或更多个区域,例如高变区。在一些实施例中,单独扩增包括位于多个高变区中的序列的核酸的任何两个16s rRNA基因引物的核苷酸序列轻微重叠(例如,小于或等于7个核苷酸、或6个核苷酸、或5个核苷酸、或4个核苷酸、或3个核苷酸、或2个核苷酸、或1个核苷酸)或没有重叠。在一些方面,界涵盖核酸引物对扩增长度小于或等于约200个核苷酸,例如长度介于约125和200个核苷酸之间的16s rRNA基因序列。在一些实施例中,核酸组合中的界涵盖核酸包含多个核酸引物对,其包含至少2个、至少3个、至少4个、至少5个、至少6个、至少7个、至少8个或至少9个单独的引物对,以及任选地其简并变体,其在核酸扩增反应中单独地扩增含有分别位于原核16s rRNA基因中2个、3个、4个、5个、6个、7个、8个或9个不同高变区中的序列的核酸。在一些实施例中,核酸组合中的界涵盖核酸包含至少8个单独的引物对,以及任选地其简并变体,其在核酸扩增反应中单独地扩增含有位于原核16s rRNA基因中8个不同高变区中的序列的核酸。在一些实施例中,核酸组合中的界涵盖核酸包含多个引物对,其单独地扩增含有位于原核16S rRNA基因的3个或更多个高变区中的序列的核酸,并且其中3个或更多个区域之一是V5区。一些组合物中包含简并引物变体,例如在引物序列中的1个或2个位置处含有不同的核苷酸,以确保扩增在保守区中含有微小变化的16S rRNA基因。单独地扩增原核16S rRNA基因的8个高变区(V2、V3、V4、V5、V6、V7、V8和V9)的引物对的核苷酸序列的限制性实例列于表15中。在一些实施例中,核酸组合中的界涵盖核酸包含至少1个、至少2个、至少3个、至少4个、至少5个、至少6个、至少7个、至少8个、至少9个、至少10个、至少15个、至少20个、至少24个、至少30个、至少35个、至少40个、至少45个或更多个,或所有引物,或所有引物对,所述引物或引物对具有表15或表15中的SEQ ID NO:1-24和/或表15中的SEQ ID NO:25-48或表15中的SEQ ID NO:11-16、23和24和/或表15中的SEQ ID NO:35-40、47和48中所列的序列或基本上由所述序列组成。在一些实施例中,核酸组合中的界涵盖核酸包含一个或多个引物对,其在含有细菌16SrRNA基因序列的给定数据库(例如,GreenGenes细菌16S rRNA基因序列;www.greengenes.lbl.gov;SILVA数据库(www.arb-silva.de))中提供不同细菌16S rRNA基因序列的至少85%、或至少90%、或至少92%、或至少95%或至少98%、或至少99%或100%的覆盖率。在一些实施例中,包含在引物对组合中的一个或多个微生物特异性核酸引物对中的每一个能够扩增或特异性地扩增特异性核酸(例如,来自如细菌等微生物的核酸序列),所述特异性核酸含有选自表17的SEQ ID NO:1605-1979、或表17的SEQ ID NO:1605-1806、1809-1816、1821-1970、1972-1974和1977-1979、或表17中的SEQ ID NO:1605-1826、或表17中的SEQ ID NO:1605-1806、1809-1816和1821-1826、或表17A中的SEQ ID NO:1605-1820、或表17A中的SEQ ID NO:1605-1806和1809-1816、或表17C中的SEQ ID NO:1827-1979或表17C中的SEQ ID NO:1827-1976的核苷酸序列或基本上由所述核苷酸序列组成。在一些实施例中,包含在引物对组合中的一个或多个微生物特异性核酸引物对中的每一个能够扩增或特异性地扩增特异性核酸序列,所述特异性核酸序列含有选自以下的核苷酸序列:表17中的SEQ ID NO:1605-1979;或表17的SEQ ID NO:1605-1806、1809-1816、1821-1970、1972-1974和1977-1979;或表17中的SEQ ID NO:1605-1826;或表17中的SEQ ID NO:1605-1806、1809-1816和1821-1826;或表17A中的SEQ ID NO:1605-1820;或表17A中的SEQ IDNO:1605-1806和1809-1816;或表17C中的SEQ ID NO:1827-1979;或表17C中的SEQ ID NO:1827-1976,或基本上相同或相似的序列,以产生长度小于约500个、小于约475个、小于约450个、小于约400个、小于约375个、小于约350个、小于约300个、小于约275个、小于约250个、小于约200个、小于约175个、小于约150个或小于约100个核苷酸的扩增子序列,或基本上由选自表17中的SEQ ID NO:1605-1979、或表17的SEQ ID NO:1605-1806、1809-1816、1821-1970、1972-1974和1977-1979、或表17中的SEQ ID NO:1605-1826、或表17中的SEQ IDNO:1605-1806、1809-1816和1821-1826、或表17A中的SEQ ID NO:1605-1820、或表17A中的SEQ ID NO:1605-1806和1809-1816、或表17C中的SEQ ID NO:1827-1979、或表17C中的SEQID NO:1827-1976或基本上相同或相似的序列并且任选地在序列的5'端和3'端含有核酸引物序列的序列组成的扩增子序列。在一些实施例中,组合中的微生物特异性核酸引物对的集合能够在多重反应中扩增或特异性地扩增至少2个、至少3个、至少4个、至少5个、至少6个、至少7个、至少8个、至少9个、至少10个、至少15个、至少20个、至少25个、至少30个、至少35个、至少40个、至少45个、至少50个、至少55个、至少60个、至少65个、至少70个、至少75个、至少80个、至少85个、至少90个、至少95个、至少100个、至少125个、至少150个、至少175个、至少200个、至少225个、或至少230个或更多个不同的核酸,所述不同的核酸含有以下不同序列:表17中的SEQ ID NO:1605-1979、或表17的SEQ ID NO:1605-1806、1809-1816、1821-1970、1972-1974和1977-1979、或表17中的SEQ ID NO:1605-1826、或表17中的SEQ ID NO:1605-1806、1809-1816和1821-1826、或表17A中的SEQ ID NO:1605-1820、或表17A中的SEQID NO:1605-1806和1809-1816、或表17C中的SEQ ID NO:1827-1979、或表17C中的SEQ IDNO:1827-1976。在一些此类实施例中,组合中的微生物特异性核酸引物对可以扩增不同的核酸,所述不同的核酸含有以下不同序列:表17中的SEQ ID NO:1605-1979、或表17的SEQID NO:1605-1806、1809-1816、1821-1970、1972-1974、或表17中的SEQ ID NO:1605-1826、或表17中的SEQ ID NO:1605-1806、1809-1816和1821-1826、或表17A中的SEQ ID NO:1605-1820、或表17A中的SEQ ID NO:1605-1806和1809-1816、或表17C中的SEQ ID NO:1827-1979、或表17C中的SEQ ID NO:1827-1976,或基本上相同或相似的序列,以产生长度小于约500个、小于约475个、小于约450个、小于约400个、小于约375个、小于约350个、小于约300个、小于约275个、小于约250个、小于约200个、小于约175个、小于约150个或小于约100个核苷酸的扩增子序列,或基本上由选自表17中的SEQ ID NO:1605-1979、或表17的SEQ ID NO:1605-1806、1809-1816、1821-1970、1972-1974和1977-1979、或表17中的SEQ ID NO:1605-1826、或表17中的SEQ ID NO:1605-1806、1809-1816和1821-1826、或表17A中的SEQ ID NO:1605-1820、或表17A中的SEQ ID NO:1605-1806和1809-1816、或表17C中的SEQ ID NO:1827-1979、或表17C中的SEQ ID NO:1827-1976或基本上相同或相似的序列并且任选地在序列的5'端和3'端含有核酸引物序列的核苷酸序列组成的扩增子序列。在一些实施例中,组合中的微生物特异性核酸引物对包含一个或多个引物对,所述一个或多个引物对具有选自以下的核苷酸序列或序列对(对于引物对)或基本上由选自以下的核苷酸序列或序列对组成:表16;或表16的SEQ ID NO:49-520;或表16的SEQ ID NO:49-452、457-472和481-520;或表16的SEQ ID NO:49-492;或表16的SEQ ID NO:49-452、457-472和481-492;或表16A的SEQ ID NO:49-480;或表16A的SEQ ID NO:49-452和457-472;或表16C的SEQ ID NO:521-826;或表16C的SEQ ID NO:521-820;或表16的SEQ ID NO:827-1298;或表16的SEQ ID NO:827-1230、1235-1250和1259-1298;或表16的SEQ ID NO:827-1270;或表16的SEQ ID NO:827-1230、1235-1250和1259-1270;或表16D的SEQ ID NO:827-1258;或表16D的SEQ ID NO:827-1230和1235-1250;或表16F的SEQ ID NO:1299-1604;或表16F的SEQ ID NO:1299-1598;或与其基本上相同或相似的一个或多个序列,或任何上述核酸或引物对的核苷酸序列,其中一个或多个胸腺嘧啶碱基被尿嘧啶碱基取代。在一些实施例中,组合中的微生物特异性核酸引物对包含至少2个、至少3个、至少4个、至少5个、至少6个、至少7个、至少8个、至少9个、至少10个、至少15个、至少20个、至少25个、至少30个、至少35个、至少40个、至少45个、至少50个、至少55个、至少60个、至少65个、至少70个、至少75个、至少80个、至少85个、至少90个、至少95个、至少100个、至少125个、至少150个、至少175个、至少200个、至少225个、至少230个或所有核酸引物对,所述核酸引物对具有选自以下的序列或基本上由选自以下的序列组成:表16;或表16的SEQ ID NO:49-520;或表16的SEQ ID NO:49-452、457-472和481-520;或表16的SEQ ID NO:49-492;或表16的SEQ ID NO:49-452、457-472和481-492;或表16A的SEQ ID NO:49-480;或表16A的SEQ ID NO:49-452和457-472;或表16C的SEQ IDNO:521-826;或表16C的SEQ ID NO:521-820;或表16的SEQ ID NO:827-1298;或表16的SEQID NO:827-1230、1235-1250和1259-1298;或表16的SEQ ID NO:827-1270;或表16的SEQ IDNO:827-1230、1235-1250和1259-1270;或表16D的SEQ ID NO:827-1258;或表16D的SEQ IDNO:827-1230和1235-1250;或表16F的SEQ ID NO:1299-1604;或表16F的SEQ ID NO:1299-1598;或与其基本上相同或相似的一个或多个序列,或任何上述核酸或引物对的核苷酸序列,其中一个或多个胸腺嘧啶碱基被尿嘧啶碱基取代。在一些实施例中,组合包含一个或多个微生物特异性核酸引物对,其扩增与一种或多种病状、病症和/或疾病有关的一种或多种微生物(例如,细菌)所独有的特异性核酸序列。
在本文描述的包含一个或多个、或多个核酸、引物或核酸引物对、或核酸、引物或核酸引物对的组合的组合物的任何实施例中,一个或多个核酸,或一个或多个引物或引物对可以包含修饰。在一些实施例中,修饰是促进核酸操作、扩增、连接和/或扩增产物测序和/或减少或消除引物二聚体的修饰。在特定实施例中,修饰是促进多重核酸扩增、连接和/或多重扩增产物测序的修饰。在一些实施例中,引物对中的至少一个引物或引物对中的两个引物含有相对于待扩增的核酸序列的修饰,其增加引物对切割的易感性。例如,在一些实施例中,引物对中的一个或多个核酸或引物、或两个引物具有至少一个可切割基团,所述可切割基团位于a)3'端或5'端和/或位于b)核酸或引物的大约中心核苷酸位置,并且其中核酸、引物或引物对可以与组合物中的其它核酸、引物或引物对基本上不互补。在一些实施例中,组合物包括至少50个、100个、150个、200个、250个、300个、350个、398个或更多个引物对。在一些实施例中,引物对包括约15个核苷酸到约40个核苷酸的长度。在一些实施例中,一个或多个引物的至少一个核苷酸被可切割基团置换。在一些实施例中,可切割基团可以是尿苷核苷酸。在一些实施例中,模板、一个或多个引物和/或扩增产物包含可以被特异性酶识别的核苷酸或核碱基。在一些实施例中,核苷酸或核碱基可以被特异性酶结合。任选地,特异性酶还可以在一个或多个位点切割模板、一个或多个引物和/或扩增产物。在一些实施例中,此类切割可发生在模板、一个或多个引物和/或扩增产物内的特定核苷酸处。例如,模板、一个或多个引物和/或扩增产物可以包含一个或多个核苷酸或核碱基,包含尿嘧啶,所述一个或多个核苷酸或核碱基可被如尿嘧啶DNA糖基化酶(UDG,也被称为UNG)或甲酰胺嘧啶DNA糖基化酶(Fpg)等酶识别和/或切割。模板、一个或多个引物和/或扩增产物可以包含一个或多个核苷酸或核碱基,包含RNA特异性碱基,所述一个或多个核苷酸或核碱基可被如RNAseH等酶识别和/或切割。在一些实施例中,模板、一个或多个引物和/或扩增产物可以包含一个或多个脱碱基位点,所述一个或多个脱碱基位点可使用各种校对聚合酶或腺苷三磷酸双磷酸酶处理来进行识别和/或切割。在一些实施例中,模板、一个或多个引物和/或扩增产物可以包含7,8-二氢-8-氧代鸟嘌呤(8-oxoG)核碱基,其可以被如Fpg等酶识别或切割。在一些实施例中,一个或多个经扩增的靶序列可以被FuPa试剂部分消化。在一些实施例中,引物包含足够数量的经修饰的核苷酸以允许通过切割处理在功能上完全降解引物,但不至于在这种切割处理之前干扰引物的特异性或功能性,例如在扩增中反应。在一些实施例中,引物包含至少一个经修饰的核苷酸,但引物的不超过75%的核苷酸被修饰。例如,引物可以包含含有尿嘧啶的核碱基,其可使用UNG/UDG(任选地加热和/或碱)选择性地切割。在一些实施例中,引物可以包含含有尿嘧啶的核苷酸,其可使用UNG和Fpg选择性地切割。在一些实施例中,切割处理包含暴露于氧化条件以选择性地切割二硫醇,用RNAseH处理以选择性地切割经修饰的核苷酸,包含RNA特异性部分(例如,核糖等)等。该切割处理可以有效地将原始扩增引物和非特异性扩增产物分裂成小核酸片段,所述小核酸片段包含相对较少的核苷酸。此类片段通常不能在升高的温度下促进另外扩增。通过所属领域已知的各种扩增后净化程序(例如,离心柱、NaEtOH沉淀等),也可相对容易地从反应池中除去此类片段。
在一些实施例中,本文提供的组合物包含含有多种微生物的样品,或来自含有多种微生物的这种样品的核酸,以及本文所述组合物的任何实施例的一个或多个核酸、引物和/或引物对,和任选的聚合酶,例如DNA聚合酶。在一些实施例中,样品是生物样品,如例如环境样品或来自动物受试者(例如,人)的样品。样品包含但不限于生物流体样品、血液样品、皮肤样品、粘液样品、唾液样品、痰样品、来自受试者口腔或鼻腔的样品、呼吸道样品、阴道样品、消化道样品和粪便样品。在一些实施例中,样品来自动物的消化道,如例如粪便或粪便样品。在特定实施例中,组合物包含一个或多个界涵盖核酸引物对,其能够扩增对于界中的多个、大部分、大多数、基本上所有或所有微生物(例如,细菌)而言是共有的但在不同界的微生物之间会有所不同的同源基因或基因组区域中的序列,和/或一个或多个微生物特异性核酸引物对,其扩增特定微生物(例如,如细菌等微生物的种、亚种或菌株)所独有的特异性核酸序列。本文提供了可用于核酸组合中的界涵盖核酸引物对和微生物特异性核酸引物对的许多实施例。例如,在一些实施例中,核酸组合中的界涵盖核酸包含一个或多个引物对,其单独地扩增原核(例如,细菌)16S rRNA基因中的两个或更多个、三个或更多个、四个或更多个、五个或更多个、6个或更多个、7个或更多个、或8个或更多个区域,例如高变区。在一些实施例中,一个或多个微生物特异性核酸引物对中的至少一个核酸引物对能够扩增或特异性地扩增特异性核酸序列,所述特异性核酸序列含有选自以下的核苷酸序列:表17中的SEQ ID NO:1605-1979;或表17的SEQ ID NO:1605-1806、1809-1816、1821-1970、1972-1974和1977-1979;或表17中的SEQ ID NO:1605-1826;或表17中的SEQ ID NO:1605-1806、1809-1816和1821-1826;或表17A中的SEQ ID NO:1605-1820;或表17A中的SEQ ID NO:1605-1806和1809-1816;或表17C中的SEQ ID NO:1827-1979;或表17C中的SEQ ID NO:1827-1976,或基本上相同或相似的序列,以产生长度小于约500个、小于约475个、小于约450个、小于约400个、小于约375个、小于约350个、小于约300个、小于约275个、小于约250个、小于约200个、小于约175个、小于约150个或小于约100个核苷酸的扩增子序列,或基本上由选自表17中的SEQ ID NO:1605-1979、或表17的SEQ ID NO:1605-1806、1809-1816、1821-1970、1972-1974和1977-1979、或表17中的SEQ ID NO:1605-1826、或表17中的SEQ IDNO:1605-1806、1809-1816和1821-1826、或表17A中的SEQ ID NO:1605-1820、或表17A中的SEQ ID NO:1605-1806和1809-1816、或表17C中的SEQ ID NO:1827-1979、或表17C中的SEQID NO:1827-1976或基本上相同或相似的序列并且任选地在序列的5'端和3'端含有核酸引物序列的序列组成的扩增子序列。在一些实施例中,一个或多个微生物特异性核酸引物对是多个这样的引物对,其中所述引物对中的每一个能够扩增或特异性地扩增特异性核酸序列,所述特异性核酸序列含有选自以下的核苷酸序列:表17中的SEQ ID NO:1605-1979、或表17的SEQ ID NO:1605-1806、1809-1816、1821-1970、1972-1974和1977-1979、或表17中的SEQ ID NO:1605-1826、或表17中的SEQ ID NO:1605-1806、1809-1816和1821-1826、或表17A中的SEQ ID NO:1605-1820、或表17A中的SEQ ID NO:1605-1806和1809-1816、或表17C中的SEQ ID NO:1827-1979或表17C中的SEQ ID NO:1827-1976。在一些实施例中,一个或多个微生物特异性核酸引物对是多个这样的引物对,其中所述引物对中的每一个能够扩增或特异性地扩增特异性核酸序列,所述特异性核酸序列含有选自以下的核苷酸序列:表17中的SEQ ID NO:1605-1979;或表17的SEQ ID NO:1605-1806、1809-1816、1821-1970、1972-1974和1977-1979;或表17中的SEQ ID NO:1605-1826;或表17中的SEQ ID NO:1605-1806、1809-1816和1821-1826;或表17A中的SEQ ID NO:1605-1820;或表17A中的SEQ ID NO:1605-1806和1809-1816;或表17C中的SEQ ID NO:1827-1979;或表17C中的SEQ ID NO:1827-1976,或基本上相同或相似的序列,以产生长度小于约500个、小于约475个、小于约450个、小于约400个、小于约375个、小于约350个、小于约300个、小于约275个、小于约250个、小于约200个、小于约175个、小于约150个或小于约100个核苷酸的扩增子序列,或基本上由选自表17中的SEQ ID NO:1605-1979、或表17的SEQ ID NO:1605-1806、1809-1816、1821-1970、1972-1974和1977-1979、或表17中的SEQ ID NO:1605-1826、或表17中的SEQ IDNO:1605-1806、1809-1816和1821-1826、或表17A中的SEQ ID NO:1605-1820、或表17A中的SEQ ID NO:1605-1806和1809-1816、或表17C中的SEQ ID NO:1827-1979、或表17C中的SEQID NO:1827-1976或基本上相同或相似的序列并且任选地在序列的5'端和3'端含有核酸引物序列的核苷酸序列组成的扩增子序列。
本文还提供了含有核酸混合物的组合物,其中大部分或基本上所有核酸含有微生物(例如,细菌)基因组的一部分的序列。在一些实施例中,核酸混合物包含含有至少2种、至少5种、至少10种、至少20种、至少25种、至少30种、至少35种、至少40、至少50种、至少75种、至少100种、至少150种、至少200种、至少250种、至少300种、至少350种、至少400种或至少500种或更多种不同的微生物(例如,不同种的微生物,如细菌)的一部分的序列的核酸。在一些实施例中,微生物基因组部分的序列的长度各自少于约1000个核苷酸、少于约900个核苷酸、少于约1000个核苷酸、少于约900个核苷酸、少于约800个核苷酸、少于约700个核苷酸少于约600个核苷酸、少于约500个核苷酸、少于约450个核苷酸、少于约400个核苷酸、少于约350个核苷酸、少于约300个核苷酸、少于约250个核苷酸或少于约200个核苷酸。在一些实施例中,所述微生物基因组部分的所述序列长度各自小于250个核苷酸或为约250个核苷酸。在一些实施例中,核酸包含双链、部分双链和/或单链核酸。在一些实施例中,核酸包含在来自一种或多种或多种微生物(如多种不同的微生物,例如,细菌)的核酸的核酸扩增反应中产生的扩增子。在一些实施例中,所述核酸包含含有尿嘧啶核碱基的核苷酸。在一些实施例中,核酸含有5'和/或3'突出端。在一些实施例中,所述组合物含有一种或多种或多种引物,例如本文所述的任何实施例的核酸和/或引物对。在一些实施例中,所述组合物包含DNA聚合酶、DNA连接酶和/或至少一种尿嘧啶切割或修饰酶。在一些实施例中,核酸包含以下中的一项或多项:
(1)一个或多个核酸,其含有原核16S rRNA基因的高变区(例如,V1、V2、V3、V4、V5、V6、V7、V8和/或V9区)的核苷酸序列或基本上由所述核苷酸序列组成,
(2)多个核酸,其含有原核16S rRNA基因的高变区(例如,V1、V2、V3、V4、V5、V6、V7、V8和/或V9区)的核苷酸序列或基本上由所述核苷酸序列组成,
(3)一个或多个或多个核酸,其含有原核16S rRNA基因的高变区(例如,V1、V2、V3、V4、V5、V6、V7、V8和/或V9区)的核苷酸序列或基本上由所述核苷酸序列组成,其中所述序列具有来自仅一个高变区的序列,
(4)一个或多个核酸,其含有原核16S rRNA基因的高变区(例如,V1、V2、V3、V4、V5、V6、V7、V8和/或V9区)的核苷酸序列或基本上由所述核苷酸序列组成,其中所述序列包含选自表15或表15中的SEQ ID NO:1-24和/或表15中的SEQ ID NO:25-48或表15中的SEQ IDNO:11-16、23和24和/或表15中的SEQ ID NO:35-40、47和48中所列的序列的一个或多个序列,和/或
(5)一个或多个单链核酸,其含有选自表17中的SEQ ID NO:1605-1979、或表17的SEQ ID NO:1605-1806、1809-1816、1821-1970、1972-1974和1977-1979、或表17中的SEQ IDNO:1605-1826、或表17中的SEQ ID NO:1605-1806、1809-1816和1821-1826、或表17A中的SEQ ID NO:1605-1820、或表17A中的SEQ ID NO:1605-1806和1809-1816、或表17C中的SEQID NO:1827-1979、或表17C中的SEQ ID NO:1827-1976或基本上相同或相似的序列并且任选地在3'端和/或5'端含有一个或多个引物序列的核苷酸序列(例如,选自表16、或表16的SEQ ID NO:49-520、或表16的SEQ ID NO:49-452、457-472和481-520、或表16的SEQ ID NO:49-492、或表16的SEQ ID NO:49-452、457-472和481-492、或表16A的SEQ ID NO:49-480、或表16A的SEQ ID NO:49-452和457-472、或表16C的SEQ ID NO:521-826、或表16C的SEQ IDNO:521-820、或表16的SEQ ID NO:827-1298、或表16的SEQ ID NO:827-1230、1235-1250和1259-1298、或表16的SEQ ID NO:827-1270、或表16的SEQ ID NO:827-1230、1235-1250和1259-1270、或表16D的SEQ ID NO:827-1258、或表16D的SEQ ID NO:827-1230和1235-1250、或表16F的SEQ ID NO:1299-1604、或表16F的SEQ ID NO:1299-1598的序列)或其补体,或基本上由所述核苷酸序列或其补体组成,和/或一个或多个双链或部分双链核酸,其含有选自表17中的SEQ ID NO:1605-1979、或表17的SEQ ID NO:1605-1806、1809-1816、1821-1970、1972-1974和1977-1979、或表17中的SEQ ID NO:1605-1826、或表17中的SEQ ID NO:1605-1806、1809-1816和1821-1826、或表17A中的SEQ ID NO:1605-1820、或表17A中的SEQ IDNO:1605-1806和1809-1816、或表17C中的SEQ ID NO:1827-1979、或表17C中的SEQ ID NO:1827-1976或基本上相同或相似的序列并且任选地在3'端和/或5'端含有一个或多个引物序列的核苷酸序列(例如,选自表16、或表16的SEQ ID NO:49-520、或表16的SEQ ID NO:49-452、457-472和481-520、或表16的SEQ ID NO:49-492、或表16的SEQ ID NO:49-452、457-472和481-492、或表16A的SEQ ID NO:49-480、或表16A的SEQ ID NO:49-452和457-472、或表16C的SEQ ID NO:521-826、或表16C的SEQ ID NO:521-820、或表16的SEQ ID NO:827-1298、或表16的SEQ ID NO:827-1230、1235-1250和1259-1298、或表16的SEQ ID NO:827-1270、或表16的SEQ ID NO:827-1230、1235-1250和1259-1270、或表16D的SEQ ID NO:827-1258、或表16D的SEQ ID NO:827-1230和1235-1250、或表16F的SEQ ID NO:1299-1604、或表16F的SEQ ID NO:1299-1598的序列)和与其杂交的互补核苷酸序列,或基本上由所述核苷酸序列和与其杂交的互补核苷酸序列组成。
在一些实施例中,核酸包含以上(1)、(2)、(3)或(4)的核酸与以上(5)的核酸的任何组合。在含有核酸混合物的组合物的一些实施例中,其中大多数或基本上所有核酸含有本文提供的微生物(例如,细菌)的基因组的一部分的序列,所述组合物是或含有一个或更个微生物(例如,细菌)核酸文库。在一些实施例中,核酸混合物是通过使用本文提供的引物和/或引物对在含有微生物(例如,细菌)的样品中或从含有微生物(例如,细菌)的样品中扩增核酸而产生的。在一些实施例中,核酸混合物可以通过使用以下对核酸进行扩增而产生:(1)一个或多个界涵盖核酸引物对,其能够扩增对于界中的多个、大部分、大多数、基本上所有或所有微生物(例如,细菌)而言是共有的但在不同界的微生物之间会有所不同的同源基因或基因组区域中的序列;和/或(2)一个或多个微生物特异性核酸和/或核酸引物对,其能够扩增或特异性或选择性地扩增特定微生物(例如,如细菌等微生物的种、亚种或菌株)所独有的特异性核酸序列。本文提供了可用于产生核酸组合的界涵盖核酸引物对和微生物特异性核酸引物对的许多实施例。在一些实施例中,通过在单个反应混合物中使用界涵盖核酸引物对和微生物特异性核酸引物和/或核酸引物对扩增微生物核酸来产生混合物。在一些实施例中,通过例如从单个样品中分别在一个扩增反应中使用界涵盖核酸引物对并在单独的扩增反应中使用微生物特异性核酸引物和/或核酸引物对扩增微生物核酸然后组合两个扩增反应的产物来产生混合物。在一些实施例中,核酸混合物包括以下或基本上由以下组成:原核16S rRNA基因的部分,如来自一种或多种或多种微生物的原核(例如,细菌)16SrRNA基因的高变区(例如,V1、V2、V3、V4、V5、V6、V7、V8和/或V9区)的核苷酸序列;以及来自一种或多种或多种微生物的微生物(例如,细菌)基因组的部分,其不包含在原核16S rRNA基因内。
用于核酸扩增的方法
本文提供的方法包含用于扩增和/或检测核酸的方法。在特定实施例中,被扩增和/或检测的核酸来自微生物,包含例如细菌和古细菌。如本文进一步描述的,本文提供的用于扩增和/或检测来自微生物的核酸的方法代表了相对于先前方法的显著改进,包含但不限于微生物核酸扩增和/或检测覆盖率、灵敏度、效率、规模、成本效益和/或在其它方法中的应用或使用方面的改进。在一些实施例中,使用例如本文提供的任何核酸作为探针和/或扩增引物,对核酸进行核酸杂交和/或扩增。在一些实施例中,检测是否存在一种或多种杂交和/或核酸扩增产物。在一些实施例中,所述核酸扩增是多重扩增。在一些实施例中,所述扩增使用多个核酸引物对进行并且在单个多重扩增反应混合物中进行。在一些实施例中,使用本文提供的一种或多种核酸作为探针(例如,可检测的或标记的探针)来检测是否存在一种或多种核酸和/或扩增产物。在一些实施例中,通过获得一种或多种核酸扩增产物的核苷酸序列信息来检测是否存在一种或多种核酸扩增产物。
用于扩增选定微生物的核酸的方法
在一些实施例中,本文提供的用于扩增一种或多种微生物的靶核酸的方法包含(a)获得一种或多种微生物的核酸,所述一种或多种微生物选自表1(或表1,除了或不包含粘性放线菌和/或类球布劳特氏菌;或表1,除了或不包含粘性放线菌、类球布劳特氏菌和/或扎氏螺杆菌)中列出的微生物;和(b)使用能够特异性地扩增包含在微生物的基因组内的靶核酸序列的至少一个引物对对核酸进行核酸扩增,所述微生物选自表1(或表1,除了或不包含粘性放线菌和/或类球布劳特氏菌;或表1,除了或不包含粘性放线菌、类球布劳特氏菌和/或扎氏螺杆菌)的微生物,从而产生靶核酸的扩增拷贝。在一些实施例中,靶核酸是微生物所独有的。在一些实施例中,靶核酸不包含在原核16S rRNA基因内。在一些实施例中,进行扩增的核酸包含来自表1中列出的多种不同微生物的核酸。在一些此类实施例中,产生了表1(或表1,除了或不包含粘性放线菌和/或类球布劳特氏菌;或表1,除了或不包含粘性放线菌、类球布劳特氏菌和/或扎氏螺杆菌)中多种不同微生物的扩增拷贝,例如在多重核酸扩增中。在一些实施例中,进行扩增的核酸包含选自表1(或表1,除了或不包含粘性放线菌和/或类球布劳特氏菌;或表1,除了或不包含粘性放线菌、类球布劳特氏菌和/或扎氏螺杆菌)中列出的微生物的一种或多种或多种微生物和未在表1中列出的一种或多种微生物(例如,细菌)的核酸的混合物。在一些实施例中,选自表1所列微生物的一种或多种微生物的核酸获自生物样品,如例如动物消化道内容物的样品。在一些实施例中,样品是粪便样品。在一些实施例中,至少一个,或一个或多个靶核酸序列包括选自以下的核苷酸序列或基本上由选自以下的核苷酸序列组成:表17中的SEQ ID NO:1605-1979、或表17的SEQ ID NO:1605-1806、1809-1816、1821-1970、1972-1974和1977-1979、或表17中的SEQ ID NO:1605-1826、或表17中的SEQ ID NO:1605-1806、1809-1816和1821-1826、或表17A中的SEQ ID NO:1605-1820、或表17A中的SEQ ID NO:1605-1806和1809-1816、或表17C中的SEQ ID NO:1827-1979、或表17C中的SEQ ID NO:1827-1976的核苷酸序列,或基本上相同或相似的序列。在一些实施例中,至少一个,或一个或多个核酸扩增产物包括选自表17中的SEQ ID NO:1605-1979、或表17的SEQ ID NO:1605-1806、1809-1816、1821-1970、1972-1974和1977-1979、或表17中的SEQ ID NO:1605-1826、或表17中的SEQ ID NO:1605-1806、1809-1816和1821-1826、或表17A中的SEQ ID NO:1605-1820、或表17A中的SEQ ID NO:1605-1806和1809-1816、或表17C中的SEQ ID NO:1827-1979、或表17C中的SEQ ID NO:1827-1976或基本上相同或相似的序列或其补体并且任选地在序列的5'和/或3'端具有一个或多个引物序列(如本文提供的任何引物序列)的核苷酸序列,或基本上由所述核苷酸序列组成。在一些实施例中,至少一个引物对不会可检测地扩增包含在除含有靶核酸序列的微生物属之外的任何属内的核酸序列。在一些实施例中,至少一个引物对不会可检测地扩增包含在除含有靶核酸序列的微生物种之外的任何种内的核酸序列。在一些实施例中,引物对中的至少一个引物,或至少一个引物对,含有以下各项或基本上由以下各项组成:表16中的引物或引物对的一个或多个序列;或表16的SEQ ID NO:49-520;或表16的SEQ ID NO:49-452、457-472和481-520;或表16的SEQ ID NO:49-492;或表16的SEQ ID NO:49-452、457-472和481-492;或表16A的SEQ ID NO:49-480;或表16A的SEQ ID NO:49-452和457-472;或表16C的SEQ IDNO:521-826;或表16C的SEQ ID NO:521-820;或表16的SEQ ID NO:827-1298;或表16的SEQID NO:827-1230、1235-1250和1259-1298;或表16的SEQ ID NO:827-1270;或表16的SEQ IDNO:827-1230、1235-1250和1259-1270;或表16D的SEQ ID NO:827-1258;或表16D的SEQ IDNO:827-1230和1235-1250;或表16F的SEQ ID NO:1299-1604;或表16F的SEQ ID NO:1299-1598,或基本上相同或相似的序列,或任何上述核酸或引物对的核苷酸序列,其中一个或多个胸腺嘧啶碱基被尿嘧啶碱基取代。在一些实施例中,使用多个引物或引物对对核酸进行核酸扩增,所述多个引物或引物对各自含有以下各项或基本上由以下各项组成:表16中的引物对的一个或多个序列;或表16的SEQ ID NO:49-520;或表16的SEQ ID NO:49-452、457-472和481-520;或表16的SEQ ID NO:49-492;或表16的SEQ ID NO:49-452、457-472和481-492;或表16A的SEQ ID NO:49-480;或表16A的SEQ ID NO:49-452和457-472;或表16C的SEQID NO:521-826;或表16C的SEQ ID NO:521-820;或表16的SEQ ID NO:827-1298;或表16的SEQ ID NO:827-1230、1235-1250和1259-1298;或表16的SEQ ID NO:827-1270;或表16的SEQ ID NO:827-1230、1235-1250和1259-1270;或表16D的SEQ ID NO:827-1258;或表16D的SEQ ID NO:827-1230和1235-1250;或表16F的SEQ ID NO:1299-1604;或表16F的SEQ IDNO:1299-1598;或基本上相同或相似的序列,或任何上述核酸或引物对的核苷酸序列,其中一个或多个胸腺嘧啶碱基被尿嘧啶碱基取代。在使用多于一个或多个引物或引物对对核酸进行核酸扩增的一些实施例中,扩增是在单个反应混合物中进行的多重扩增。在一些实施例中,至少一个引物或一个引物对包含促进核酸操作、扩增、连接和/或扩增产物测序和/或减少或消除引物二聚体的修饰。在特定实施例中,修饰是促进多重核酸扩增、连接和/或多重扩增产物测序的修饰。
用于基因的多个区域的多重扩增的方法
在一些实施例中,本文提供的多重扩增方法用于扩增一种或多种微生物(例如,细菌)的基因的多个区域。在一个实施例中,所述方法包含(a)获得包括16S rRNA基因的一种或多种微生物的核酸以及(b)使用包含至少两个引物对的引物对组合对核酸进行核酸扩增,所述至少两个引物对单独地扩增含有原核16S rRNA基因的不同高变区序列的核酸,从而产生含有一种或多种微生物的16S rRNA基因的不同高变区序列的核酸序列的扩增拷贝。在一些实施例中,微生物是细菌。在一些实施例中,原核16S rRNA基因是细菌基因。在一些实施例中,进行扩增的核酸包含来自多种不同微生物的核酸。在一些实施例中,包括16SrRNA基因的一种或多种微生物的核酸获自生物样品,如例如动物消化道内容物的样品。在一些实施例中,样品是粪便样品。在一些实施例中,引物对组合中的引物针对包含在16SrRNA基因的保守区中的核酸序列,或与所述核酸序列结合或杂交。在一些实施例中,引物对组合中的每个引物含有少于10个、少于9个、少于8个、少于7个、少于6个、少于5个、少于4个、少于3个或少于2个连续核苷酸,其序列与引物对组合中另一引物的连续核苷酸序列相同。在一些实施例中,被扩增的核酸序列的长度小于约300bp、小于约250bp、小于约200bp、小于约175bp、小于约150bp或小于约125bp。在一些实施例中,引物对的组合单独地扩增含有原核16S rRNA基因的3个或更多个、4个或更多个、5个或更多个、6个或更多个、7个或更多个、8个或更多个或9个不同高变区的序列的核酸,从而产生含有一种或多种微生物的16S rRNA基因的3个或更多个、4个或更多个、5个或更多个、6个或更多个、7个或更多个、8个或更多个或9个不同高变区的序列的核酸的扩增拷贝,其中不同高变区的扩增拷贝是单独的扩增子。在一些实施例中,引物对的组合单独地扩增8种不同的核酸,所述核酸分别含有原核16SrRNA基因的8个不同高变区的序列。在一些实施例中,8个不同的高变区是V2-V9。在一些实施例中,引物对的组合单独地扩增至少3种不同的核酸,每种核酸分别含有原核16S rRNA基因的不同高变区的序列,其中3个或更多个区域之一是V5区,从而产生分别含有一种或多种微生物的16S rRNA基因的3个或更多个高变区的序列的核酸的扩增拷贝。在一些实施例中,引物对的组合包含一个或多个引物对中的一个或多个引物的简并序列。例如,在一些实施例中,对于通过引物对组合扩增的至少一个高变区,引物对组合中的至少两个不同的引物对单独地扩增同一原核属的2个或更多个种或同一原核属的2个或更多个菌株的同一高变区内的核酸序列,所述原核属在同一高变区的核酸序列中存在差异。在一些这样的情况下,引物对组合中的至少两个不同的引物对单独地扩增同一原核属的2个或更多个种或同一原核种的2个或更多个菌株的V2高变区内的核酸序列,在V2高变区的核酸序列存在差异,和/或引物对组合中的至少两个不同的引物对单独地扩增同一原核属的2个或更多个种或同一原核种的2个或更多个菌株的V8高变区内的核酸序列,所述原核属在V8高变区的核酸序列中存在差异。在一些实施例中,扩增含有原核16S rRNA基因的高变区序列的核酸的引物对组合包括引物和/或引物对,所述引物和/或引物对含有以下各项或基本上由以下各项组成:表15中的引物或引物对的一个或多个序列;或表15中的SEQ ID NO:1-24和/或表15中的SEQ ID NO:25-48;或表15中的SEQ ID NO:11-16、23和24和/或表15中的SEQ ID NO:35-40、47和48,或基本上相同或相似的序列,并且任选地其中一个或多个胸腺嘧啶碱基被尿嘧啶碱基取代。在一些实施例中,扩增是在单个反应混合物中进行的多重扩增。在一些实施例中,组合中的至少一个引物或引物对包含促进核酸操作、扩增、连接和/或扩增产物测序和/或减少或消除引物二聚体的修饰。在特定实施例中,修饰是促进多重核酸扩增、连接和/或多重扩增产物测序的修饰。
用于扩增微生物的基因组的多个区域的方法
在一些实施例中,提供了一种用于扩增一种或多种微生物的基因组的多个区域的扩增方法。在一些实施例中,所述方法包含(a)获得包括16S rRNA基因的一种或多种微生物的核酸以及(b)使用引物对组合对核酸进行核酸扩增,所述引物对组合包括:(i)扩增含有原核16S rRNA基因的高变区序列的核酸的一个或多个引物对(被称为“16S rRNA基因引物和引物对”);以及(ii)扩增微生物的基因组内含有的靶核酸序列的一个或多个引物对,所述靶核酸序列不包含在原核16S rRNA基因的高变区内,其中不同的引物对扩增不同基因组内含有的不同靶核酸序列(被称为“非16S rRNA基因引物和引物对”),从而产生一种或多种微生物基因组的至少两个不同区域的扩增拷贝。在一些实施例中,微生物是细菌。在一些实施例中,原核16S rRNA基因是细菌基因和/或原核微生物是细菌。在一些实施例中,扩增含有原核16S rRNA基因的高变区序列的核酸的一个或多个引物对单独地扩增不同高变区的核酸序列。在一些实施例中,(i)的一个或多个引物对中的引物针对包含在原核16S rRNA基因的保守区中的核酸序列,或与所述核酸序列结合或杂交。在一些实施例中,扩增是在单个反应混合物中进行的多重扩增。在一些实施例中,用于扩增一种或多种微生物的基因组的多个区域的扩增方法包含(a)获得包括16S rRNA基因的一种或多种微生物的核酸以及(b)使用用于一个核酸扩增反应的第一引物对集和用于另一个核酸扩增反应的第二引物对集对核酸进行两个或更多个单独的核酸扩增反应,其中(i)第一引物对集包括扩增含有原核16S rRNA基因的高变区序列的核酸的一个或多个引物对(被称为“16S rRNA基因引物和引物对”),并且(ii)第二引物对集包括扩增微生物的基因组内含有的靶核酸序列的一个或多个引物对,所述靶核酸序列不包含在原核16S rRNA基因的高变区内,其中不同的引物对扩增不同基因组内含有的不同靶核酸序列(被称为“非16S rRNA基因引物和引物对”),从而产生一种或多种微生物基因组的至少两个不同区域的扩增拷贝。在一些实施例中,微生物是细菌。在一些实施例中,原核16S rRNA基因是细菌基因和/或原核微生物是细菌。在一些实施例中,扩增含有原核16S rRNA基因的高变区序列的核酸的一个或多个引物对单独地扩增不同高变区的核酸序列。在一些实施例中,(i)的一个或多个引物对中的引物针对包含在原核16S rRNA基因的保守区中的核酸序列,或与所述核酸序列结合或杂交。在一些实施例中,扩增是在单个反应混合物中进行的多重扩增。
在一些实施例中,在用于扩增一种或多种微生物的基因组的多个区域的扩增方法中,包含在原核微生物(例如,细菌)的基因组内的靶核酸序列是微生物所独有的。在一些实施例中,一个或多个16S rRNA基因引物对扩增来自不同属的多种微生物(例如,细菌)中的核酸序列。在一些实施例中,获得至少两种不同微生物(例如,细菌)的核酸混合物并进行核酸扩增,并且仅一种微生物的基因组含有由非16S rRNA基因引物对特异性地扩增的靶序列。在一些此类实施例中,所产生的扩增拷贝含有通过非16S rRNA基因引物对从一种微生物的基因组的核酸中扩增的靶核酸序列的拷贝,但不包含通过非16S rRNA基因引物对从任何其它经受过核酸扩增的微生物的基因组的核酸中扩增的靶核酸序列的拷贝。同样在一些此类实施例中,所产生的扩增拷贝含有通过16S rRNA基因引物对从多种微生物的基因组的核酸中扩增的高变区的核酸序列的拷贝。在一些实施例中,进行核酸扩增的核酸包含来自多种不同微生物的核酸。在一些实施例中,包括16S rRNA基因的一种或多种微生物(例如,细菌)的核酸获自生物样品,如例如动物消化道内容物的样品。在一些实施例中,样品是粪便样品。在一些实施例中,一个或多个16S rRNA基因引物对中的每个引物含有少于10个、少于9个、少于8个、少于7个、少于6个、少于5个、少于4个、少于3个或少于2个连续核苷酸,其序列与引物对组合中另一引物的连续核苷酸序列相同。在一些实施例中,由一个或多个16SrRNA基因引物对扩增的核酸序列的长度小于约300bp、小于约250bp、小于约200bp、小于约175bp、小于约150bp或小于约125bp。在一些实施例中,16S rRNA基因引物对单独地扩增分别含有原核16S rRNA基因的3个或更多个、4个或更多个、5个或更多个、6个或更多个、7个或更多个、8个或更多个或9个不同高变区中的不同高变区的核酸,从而产生分别含有一种或多种微生物的16S rRNA基因的3个或更多个、4个或更多个、5个或更多个、6个或更多个、7个或更多个、8个或更多个或9个不同高变区之一的序列的核酸的扩增拷贝,其中不同高变区的扩增拷贝是单独的扩增子。在一些实施例中,16S rRNA基因引物对单独地扩增分别含有原核16S rRNA基因的8个不同高变区的序列的核酸。在一些实施例中,8个不同的高变区是V2-V9。在一些实施例中,16S rRNA基因引物对单独地扩增分别含有原核16S rRNA基因的3个或更多个不同高变区的序列的核酸,其中3个或更多个区域之一是V5区,从而产生分别含有一种或多种微生物的16S rRNA基因的3个或更多个不同高变区的序列的核酸的扩增拷贝。在一些实施例中,引物对的组合包含一个或多个引物对中的一个或多个引物的简并序列。在一些实施例中,16S rRNA基因引物对包括引物和/或引物对,所述引物和/或引物对含有以下各项或基本上由以下各项组成:表15中的引物或引物对的一个或多个序列;或表15中的SEQ ID NO:1-24和/或表15中的SEQ ID NO:25-48;或表15中的SEQ ID NO:11-16、23和24和/或表15中的SEQ ID NO:35-40、47和48,或基本上相同或相似的序列,并且任选地其中一个或多个胸腺嘧啶碱基被尿嘧啶碱基取代。在一些实施例中,所述至少一个非16S rRNA基因引物对特异性地扩增包含在选自表1(或表1,除了或不包含粘性放线菌和/或类球布劳特氏菌;或表1,除了或不包含粘性放线菌、类球布劳特氏菌和/或扎氏螺杆菌)微生物的微生物的基因组内的靶核酸序列。在一些实施例中,靶核酸是微生物所独有的。在一些实施例中,进行扩增的核酸包含来自表1中列出的多种不同微生物的核酸。在一些此类实施例中,产生了表1(或表1,除了或不包含粘性放线菌和/或类球布劳特氏菌;或表1,除了或不包含粘性放线菌、类球布劳特氏菌和/或扎氏螺杆菌)中多种不同微生物的扩增拷贝。在一些实施例中,进行扩增的核酸包含选自表1(或表1,除了或不包含粘性放线菌和/或类球布劳特氏菌;或表1,除了或不包含粘性放线菌、类球布劳特氏菌和/或扎氏螺杆菌)中列出的微生物的一种或多种或多种微生物和未在表1中列出的一种或多种微生物(例如,细菌)的核酸的混合物。在一些实施例中,至少一个,或一个或多个靶核酸序列包括选自以下的核苷酸序列或基本上由选自以下的核苷酸序列组成:表17中的SEQ ID NO:1605-1979、或表17的SEQID NO:1605-1806、1809-1816、1821-1970、1972-1974和1977-1979、或表17中的SEQ ID NO:1605-1826、或表17中的SEQ ID NO:1605-1806、1809-1816和1821-1826、或表17A中的SEQID NO:1605-1820、或表17A中的SEQ ID NO:1605-1806和1809-1816、或表17C中的SEQ IDNO:1827-1979、或表17C中的SEQ ID NO:1827-1976的核苷酸序列,或基本上相同或相似的序列。在一些实施例中,至少一个,或一个或多个核酸扩增产物包括选自表17中的SEQ IDNO:1605-1979、或表17的SEQ ID NO:1605-1806、1809-1816、1821-1970、1972-1974和1977-1979、或表17中的SEQ ID NO:1605-1826、或表17中的SEQ ID NO:1605-1806、1809-1816和1821-1826、或表17A中的SEQ ID NO:1605-1820、或表17A中的SEQ ID NO:1605-1806和1809-1816、或表17C中的SEQ ID NO:1827-1979、或表17C中的SEQ ID NO:1827-1976或基本上相同或相似的序列或其补体并且任选地在序列的5'和/或3'端具有一个或多个引物序列(如本文提供的任何引物序列)的核苷酸序列,或基本上由所述核苷酸序列组成。在一些实施例中,至少一个,或一个或多个核酸扩增产物的长度小于约500个、小于约475个、小于约450个、小于约400个、小于约375个、小于约350个、小于约300个、小于约275个、小于约250个、小于约200个、小于约175个、小于约150个或小于约100个核苷酸。在一些实施例中,至少一个非16S rRNA基因引物对不会可检测地扩增包含在除含有靶核酸序列的微生物属之外的任何属内的核酸序列。在一些实施例中,至少一个非16S rRNA基因引物对不会可检测地扩增包含在除含有靶核酸序列的微生物种之外的任何种内的核酸序列。在一些实施例中,非16S rRNA基因引物对中的至少一个引物,或至少一个非16S rRNA基因引物对,含有以下各项或基本上由以下各项组成:表16中的引物或引物对的一个或多个序列;或表16的SEQID NO:49-520;或表16的SEQ ID NO:49-452、457-472和481-520;或表16的SEQ ID NO:49-492;或表16的SEQ ID NO:49-452、457-472和481-492;或表16A的SEQ ID NO:49-480;或表16A的SEQ ID NO:49-452和457-472;或表16C的SEQ ID NO:521-826;或表16C的SEQ ID NO:521-820;或表16的SEQ ID NO:827-1298;或表16的SEQ ID NO:827-1230、1235-1250和1259-1298;或表16的SEQ ID NO:827-1270;或表16的SEQ ID NO:827-1230、1235-1250和1259-1270;或表16D的SEQ ID NO:827-1258;或表16D的SEQ ID NO:827-1230和1235-1250;或表16F的SEQ ID NO:1299-1604;或表16F的SEQ ID NO:1299-1598,或基本上相同或相似的序列,或任何上述核酸或引物对的核苷酸序列,其中一个或多个胸腺嘧啶碱基被尿嘧啶碱基取代。在一些实施例中,使用多个非16S rRNA基因引物或引物对对核酸进行核酸扩增,所述多个引物或引物对各自含有以下各项或基本上由以下各项组成:表16中的引物对的一个或多个序列;或表16的SEQ ID NO:49-520;或表16的SEQ ID NO:49-452、457-472和481-520;或表16的SEQ ID NO:49-492;或表16的SEQ ID NO:49-452、457-472和481-492;或表16A的SEQ ID NO:49-480;或表16A的SEQ ID NO:49-452和457-472;或表16C的SEQ ID NO:521-826;或表16C的SEQ ID NO:521-820;或表16的SEQ ID NO:827-1298;或表16的SEQ IDNO:827-1230、1235-1250和1259-1298;或表16的SEQ ID NO:827-1270;或表16的SEQ IDNO:827-1230、1235-1250和1259-1270;或表16D的SEQ ID NO:827-1258;或表16D的SEQ IDNO:827-1230和1235-1250;或表16F的SEQ ID NO:1299-1604;或表16F的SEQ ID NO:1299-1598;或基本上相同或相似的序列,或任何上述核酸或引物对的核苷酸序列,其中一个或多个胸腺嘧啶碱基被尿嘧啶碱基取代。在一些实施例中,引物对组合中的至少一个引物或一个引物对包含促进核酸操作、扩增、连接和/或扩增产物测序和/或减少或消除引物二聚体的修饰。在特定实施例中,修饰是促进多重核酸扩增、连接和/或多重扩增产物测序的修饰。
用于核酸扩增方法的程序/技术
用于例如从样品中获得核酸的方法在本文中描述和/或是本领域技术人员已知的。含有微生物的样品可以来自多种来源,包含例如环境来源,例如水、土壤和生物体来源,例如动物,包含但不限于昆虫、家畜(例如牛、羊、猪、马、狗、猫等)、哺乳动物(例如,人类)。常见的动物样品包含但不限于唾液、活组织检查、肿瘤、刮屑、拭子、血液、粘液、尿液、血浆、精液、毛发、激光捕获显微解剖、手术切除、粪便和其它临床或实验室获得的样品。粪便样品通常用作动物消化道或肠道微生物的来源。用于从动物样品中提取核酸的试剂盒、方案和仪器可从商业公共来源获得,包含例如MagMAXTM微生物组超核酸分离试剂盒(赛默飞世尔科技公司(Thermo Fisher Scientific);目录号A42357(带板)或A42358(带管)),其可以与带有96个深孔头的Thermo ScientificTM KingfisherTM Flex磁性粒子处理器(赛默飞世尔科技公司;目录号5400630)一起使用。如可在本文提供的方法的实施例中进行的成功的多重扩增反应所需的核酸材料的量可为约1ng。在一些实施例中,核酸材料的量可以为约10ng到约50ng、约10ng到约100ng或约1ng到约200ng的核酸材料。可以使用更高量的输入材料,然而本公开的一个方面是从大约低(ng)的起始材料中选择性地扩增多个靶序列。
本文提供的扩增方法通常包含制备含有试剂的扩增反应混合物,所述试剂用于进行反应并使混合物经受条件以实现引物与模板核酸退火、引物延伸以及延伸引物和模板链的解离的重复循环(例如,变性)。用于扩增核酸的各种技术可用于扩增方法,例如基于聚合酶链反应(PCR)的技术、解旋酶依赖性扩增(HDA)、环介导等温扩增(LAMP)和链置换扩增。在一些实施例中,所述方法包括将引物对中的一个或多个引物与靶模板序列杂交、延伸引物对中的第一引物、使来自核酸分子群体的经延伸的第一引物产物变性、使经延伸的第一引物产物与引物对中的第二引物杂交、延伸第二引物以形成双链产物,以及在一些实施例中,远离双链产物消化靶特异性引物对以产生多个经扩增的靶序列。在一些实施例中,消化包含从经扩增靶序列中部分消化一种或多种靶特异性引物。在一些实施例中,进行多重PCR扩增的方法包含:使具有正向和反向引物的多个引物对与例如样品中的或来自样品的模板核酸序列群体接触以形成多个模板/引物双螺旋;向所述多个模板/引物双螺旋中添加DNA聚合酶和dNTP的混合物,在足够温度下持续足够时间,以经由模板依赖性合成延伸每个靶特异性引物对中的正向或反向引物(或两者),进而产生多个延伸的引物产物/模板双螺旋;使所述延伸的引物产物/模板双螺旋变性;将来自靶特异性引物对的互补引物与延伸的引物产物退火;以及在存在DNA聚合酶和dNTP的情况下延伸经退火的引物,以形成多个靶特异性双链核酸分子。在一些实施例中,扩增PCR方法的步骤可以以任何顺序进行。在一些情况下,可以进一步优化本文公开的方法以移除一个或多个步骤,并且仍然获得足够的扩增的靶序列以用于各种下游过程。例如,可以修改纯化或清除步骤的数量以包含比本文公开的更多或更少的步骤,条件是以足够的产率产生扩增的靶序列。在一些实施例中,多重PCR包括使一个或多个靶特异性引物对与核酸分子杂交,在存在DNA聚合酶和dNTP的情况下通过模板依赖性合成延伸靶特异性引物对中的引物;重复杂交和延伸步骤足够的时间和足够的温度,从而产生多个经扩增的靶序列。在一些实施例中,多重扩增反应方法的步骤可以以任何顺序进行。本文公开的多重PCR扩增反应可以包含通常在热循环仪上进行的多个“循环”。每个循环包含至少一个退火步骤和至少一个延伸步骤。在一个实施例中,进行多重PCR扩增反应,其中靶特异性引物对与靶序列杂交;延伸杂交的引物,从而产生延伸的引物产物/核酸双螺旋;使延伸的引物产物/核酸双螺旋变性,从而使互补引物与延伸的引物产物杂交,其中延伸互补引物以产生多个经扩增的靶序列。在一个实施例中,本文公开的方法每个预扩增反应具有约5到约18个循环。每个循环的退火温度和/或退火持续时间可以相同;可以包含增量增加或减少,或两者的组合。每个循环的延伸温度和/或延伸持续时间可以相同;可以包含增量增加或减少,或两者的组合。例如,退火温度或延伸温度可以每循环保持恒定。在一些实施例中,退火温度可以在每个循环中保持恒定,并且延伸持续时间可以每个循环递增地增加。在一些实施例中,持续时间的增加或减少可以以15秒、30秒、1分钟、2分钟或4分钟的增量发生。在一些实施例中,温度的升高或降低可以发生为0.5、1、2、3或4摄氏度的偏差。在一些实施例中,可以使用热启动PCR技术进行扩增反应。这些技术包含在聚合开始之前使用加热步骤(>60℃),以减少不期望的PCR产物的形成。其它技术,如反应的一种或多种关键试剂的可逆失活或物理分离,例如镁或DNA聚合酶可以隔离在蜡珠中,所述蜡珠在变性步骤中加热反应时熔化,从而仅在更高的温度下释放试剂。DNA聚合酶也可以通过与适体或抗体结合而保持活性状态。这种结合在较高温度下被破坏,从而释放出可以不受阻碍地进行PCR的功能性DNA聚合酶。
在一些实施例中,经扩增的靶序列可以与一个或多个衔接子连接。在一些实施例中,衔接子可以包含一个或多个核酸条形码或标记序列。在一些实施例中,经扩增的靶序列一旦连接到衔接子,就可以经历切口平移反应和/或进一步扩增来产生衔接子连接的经扩增靶序列库。在一个实施例中,扩增方法涉及使用具有可切割基团的多个引物对核酸样品进行多重PCR。在一些实施例中,多重PCR扩增反应使用本文提供的多种引物进行,这些引物具有可切割基团,并且包含DNA聚合酶、衔接子、dATP、dCTP、dGTP和dTTP。在一些实施例中,可切割基团可以是尿嘧啶核苷酸。在一些实施例中,正向和反向引物对含有尿嘧啶核苷酸作为一个或多个可切割基团。在一个实施例中,引物对可以在每个引物对的每个正向和反向引物中包含一个尿嘧啶核苷酸。在一个实施例中,正向或反向引物含有一个、两个、三个或更多个尿嘧啶核苷酸。在一些实施例中,方法涉及使用含有至少两个尿嘧啶核苷酸的靶特异性正向和反向引物对从具有多个靶序列的核酸群体中扩增至少10个、50个、100个、150个、200个、250个、300个、350个、398个或更多个靶序列。所述反应还可以包含一种或多种抗体和/或核酸条形码。在一些实施例中,所述方法包含用于减少多重PCR中扩增伪影的形成的过程。在一些实施例中,与现有技术的标准多重PCR相比,以较低的数量或产率获得引物二聚体或非特异性扩增产物。在一些实施例中,扩增伪影的减少部分地受多重PCR反应中特异性引物对的使用控制。在一个实施例中,多重PCR反应中特异性引物对的数量可以大于50、100、150、200、250、300或更多。在一些实施例中,使用含有可切割基团的引物进行多重PCR。在一个实施例中,含有可切割基团的引物可以包含每个引物对中的每个引物的一个或多个可切割部分。在一些实施例中,含有可切割基团的引物包含既不正常存在于样品中也不天然存在于经历多重PCR的核酸群体中的核苷酸。例如,引物可以包含一种或多种非天然核酸分子,如但不限于胸腺嘧啶二聚体、8-氧代-2'-脱氧鸟苷、肌苷、脱氧尿苷、溴脱氧尿苷、无嘌呤核苷酸等。
在一些实施例中,所公开的方法可以任选地包含破坏含一种或多种引物的扩增伪影,例如,引物-二聚体、二聚体-二聚体或超级扩增子。在一些实施例中,破坏可以任选地包含处理引物和/或扩增产物,以便切割引物和/或扩增产物中存在的特定可切割基团。在一些实施例中,处理可以包含一种或多种靶特异性引物的部分或完全消化。在一个实施例中,处理可以包含从扩增产物中移除至少40%的靶特异性引物。可切割处理可以包含酶、酸、碱、热、光或化学活性。可切割处理可导致引物的一个或多个核苷酸之间或扩增产物的一个或多个核苷酸之间的连接的切割或其它破坏。引物和/或扩增产物可以任选地包含一个或多个经修饰的核苷酸或核碱基。在一些实施例中,切割可以选择性地发生在这些位点,或与经修饰的核苷酸或核碱基相邻。在一些实施例中,引物包含足够数量的经修饰的核苷酸以允许通过切割处理在功能上完全降解引物,但不至于在这种切割处理之前干扰引物的特异性或功能性,例如在扩增中反应。在一些实施例中,引物包含至少一个经修饰的核苷酸,但引物的不超过75%的核苷酸被修饰。在一些实施例中,经扩增的靶序列的切割或处理可导致形成磷酸化的经扩增的靶序列。在一些实施例中,经扩增的靶序列在5'端被磷酸化。
在一些实施例中,可以使用根据指定设计标准产生寡核苷酸序列的算法从头设计引物。例如,可以根据本文指定的任何一种或多种标准选择引物。在一些实施例中,选择或设计一种或多种引物以满足以下标准中的任何一种或多种:(1)在所述引物序列内包含两个或更多个经修饰的核苷酸,所述核苷酸中的至少一个核苷酸包含在所述引物的末端附近或末端处,并且所述核苷酸中的至少一个核苷酸包含在所述引物序列的中心核苷酸位置处或中心核苷酸位置周围;(2)引物长度为约15到约40个碱基;(3)Tm为约60℃到约70℃;(4)与靶基因组或目标样品中存在的非靶序列的低交叉反应性;(5)对于给定反应中的每个引物,至少前四个核苷酸的序列(从3'到5'方向)与在同一反应中存在的任何其它引物内的任何序列不互补;以及(6)没有扩增子包含与任何其它扩增子内的任何序列互补的至少5个核苷酸的任何连续片段。在一些实施例中,引物包含一个或多个引物对,其被设计成从样品中扩增长度为约100个碱基对到约500个碱基对的靶序列。在一些实施例中,引物包含被设计成扩增靶序列的多个引物对,其中预计经扩增的靶序列彼此的长度变化不超过50%,典型地不超过25%,甚至更典型地不超过10%或5%。例如,如果选择或预测一个引物对扩增长度为100个核苷酸的产物,则选择或预测其它引物对扩增长度在50-150个核苷酸之间(典型地,长度在75-125个核苷酸之间,甚至更典型地,长度在90-110个核苷酸之间,或为95-105个核苷酸,或99-101个核苷酸)的产物。在一些实施例中,根据任何预定的选择标准,并非从头设计扩增反应中的至少一个引物对。例如,至少一个引物对可以是随机选择或产生的寡核苷酸序列,或是先前针对其它应用选择或产生的寡核苷酸序列。在一个示例性实施例中,扩增反应可以包含选自探针试剂(罗氏分子系统公司(Roche MolecularSystems))的至少一个引物对。试剂包含经标记的探针,并且尤其可用于测量样品中存在的靶序列的量,任选地实时进行。TaqMan技术的一些实例公开在美国专利第5,210,015号、第5,487,972号、第5,804,375号、第6,214,979号、第7,141,377号和第7,445,900中,所述美国专利在此通过引用整体并入。在一些实施例中,扩增反应中的至少一种引物可以例如用光学可检测的标记进行标记,以促进特定的目标应用。例如,标记可以促进靶模板和/或扩增产物的定量、靶模板和/或扩增产物的分离等。在一些实施例中,引物不包含碳间隔子或末端接头。在一些实施例中,引物或经扩增的靶序列不包含酶标记、磁性标记、光学标记或荧光标记。
在一些实施例中,合成与核酸模板链的不连续节段互补并且可与其杂交的引物,包含:可与模板的5'区域杂交的引物,其涵盖与正向或反向扩增引物互补的序列。在一些实施例中,正向引物、反向引物或两者不共享共同的核酸序列,使得它们与不同的核酸序列杂交。例如,可以制备靶标特异性正向和反向引物,其不与引物池内的其它引物对竞争以扩增相同的核酸序列。在该实例中,不与引物池中的其它引物对竞争的引物对有助于减少非特异性或假扩增产物。在一些实施例中,每个引物对的正向和反向引物是独特的,因为每个引物的核苷酸序列是非互补的并且与引物对中的其它引物不同。在一些实施例中,引物对的差异可以是至少10%、至少20%、至少30%、至少40%、至少50%、至少60%、至少70%、至少75%、至少80%、至少85%、或至少90%的核苷酸同一性。在一些实施例中,每个引物对中的正向和反向引物与引物池或多重反应中的其它引物对是非互补的或不相同的。例如,引物池或多重反应中的引物对可以与引物池或多重反应中的其它引物对相差至少5%、至少10%、至少20%、至少30%、至少40%、至少50%、至少60%或至少70%的核苷酸同一性。引物被设计成使引物-二聚体、二聚体-二聚体或其它非特异性扩增产物的形成最小化。通常,优化引物以在扩增反应期间降低GC偏差和低解链温度(Tm)。在一些实施例中,引物被设计成具有约55℃到约72℃的Tm。在一些实施例中,引物池的引物可以具有约59℃到约70℃、60℃到约68℃、或60℃到约65℃的Tm。在一些实施例中,引物池可以具有偏差不超过5℃的Tm
在一些实施例中,用于产生扩增子文库的引物对可导致具有以下一种或多种指标的靶特异性核酸分子的扩增:如果归一化至100x平均覆盖深度,则在20x下大于97%的靶覆盖率;平均值大于0.2倍下,大于97%的碱基;大于90%的碱基,而没有链偏差;大于95%的所有靶上读段;平均值大于0.01倍下,大于99%的碱基;和每个碱基准确性超过99.5%。
在一些实施例中,引物可以作为引物对集提供在单个扩增容器中。在一些实施例中,引物可以在一个或多个引物对等分试样中提供,在单个扩增容器或反应室中进行多重PCR反应之前,这些等分试样可以合并。在一个实施例中,引物可以作为正向引物池和单独的反向引物池提供。在另一个实施例中,可以将引物对合并成子集,如不重叠的引物对。在一些实施例中,引物对池可以提供在单个反应室或微孔中,例如在PCR板上,以使用热循环仪进行多重PCR。在一些实施例中,正向和反向引物对可以与靶序列基本上互补。在一些实施例中,引物对在引物的3'端或5'端不包含共同的延伸(尾)。在另一个实施例中,引物不包含标签或通用序列。在一些实施例中,引物对被设计成消除或减少促进非特异性扩增形成的相互作用。
用于检测和/或测量样品中是否存在微生物的方法
本文还提供了检测和/或测量样品中是否存在微生物的基于核酸的方法。在检测和/或测量方法的一些实施例中,使用例如本文提供的任何核酸作为探针和/或扩增引物,对样品中的或来自样品的核酸进行核酸杂交和/或扩增。在一些实施例中,检测是否存在一种或多种杂交和/或核酸扩增产物,从而检测是否存在微生物。
在一些实施例中,本文提供的用于检测、确定样品中是否存在一种或多种微生物和/或测量样品中的一种或多种微生物的方法包含(a)使用一个或多个引物对对样品中的或来自样品的核酸进行核酸扩增,所述一个或多个引物对特异性地扩增包含在选自表1(或表1,除了或不包含粘性放线菌和/或类球布劳特氏菌;或表1,除了或不包含粘性放线菌、类球布劳特氏菌和/或扎氏螺杆菌)所列微生物的微生物的基因组内的靶核酸序列;以及(b)检测一种或多种扩增产物(或其是否存在),从而检测和/或测量选自表1(或表1,除了或不包含粘性放线菌和/或类球布劳特氏菌;或表1,除了或不包含粘性放线菌、类球布劳特氏菌和/或扎氏螺杆菌)所列微生物的一种或多种微生物,或确定是否存在选自表1(或表1,除了或不包含粘性放线菌和/或类球布劳特氏菌;或表1,除了或不包含粘性放线菌、类球布劳特氏菌和/或扎氏螺杆菌)所列微生物的一种或多种微生物。在一些实施例中,靶核酸是微生物所独有的。在一些实施例中,靶核酸不包含在原核16S rRNA基因内。本文提供的用于使用一个或多个引物对对核酸进行扩增的任何实施例都可以在该方法的任何实施例中用于检测样品中是否存在微生物,所述一个或多个引物对特异性地扩增包含在表1所列微生物的基因组内的靶核酸序列。在一些实施例中,至少一个引物对不会可检测地扩增包含在除微生物属之外的任何属内的核酸序列。在一些实施例中,至少一个引物对不会可检测地扩增包含在除微生物种之外的任何种内的核酸序列。在一些实施例中,样品中的或来自样品的核酸包含来自表1(或表1,除了或不包含粘性放线菌和/或类球布劳特氏菌;或表1,除了或不包含粘性放线菌、类球布劳特氏菌和/或扎氏螺杆菌)中列出的多种不同微生物和/或未在表1中列出的多种不同微生物(例如,细菌)的核酸。在一些实施例中,样品是生物样品,如例如动物消化道内容物的样品。在一些实施例中,样品是粪便样品。在一些实施例中,靶核酸序列包括选自以下的核苷酸序列或基本上由选自以下的核苷酸序列组成:表17中的SEQID NO:1605-1979、或表17的SEQ ID NO:1605-1806、1809-1816、1821-1970、1972-1974和1977-1979、或表17中的SEQ ID NO:1605-1826、或表17中的SEQ ID NO:1605-1806、1809-1816和1821-1826、或表17A中的SEQ ID NO:1605-1820、或表17A中的SEQ ID NO:1605-1806和1809-1816、或表17C中的SEQ ID NO:1827-1979、或表17C中的SEQ ID NO:1827-1976,或基本上相同或相似的序列。在一些实施例中,检测是否存在一种或多种扩增产物包括检测是否存在选自以下的一种或多种核苷酸序列:表17中的SEQ ID NO:1605-1979、或表17的SEQ ID NO:1605-1806、1809-1816、1821-1970、1972-1974和1977-1979、或表17中的SEQ IDNO:1605-1826、或表17中的SEQ ID NO:1605-1806、1809-1816和1821-1826、或表17A中的SEQ ID NO:1605-1820、或表17A中的SEQ ID NO:1605-1806和1809-1816、或表17C中的SEQID NO:1827-1979、或表17C中的SEQ ID NO:1827-1976,或基本上相同或相似的序列,或其补体。在一些实施例中,至少一个引物对不会可检测地扩增包含在除含有靶核酸序列的微生物属之外的任何属内的核酸序列。在一些实施例中,至少一个引物对不会可检测地扩增包含在除含有靶核酸序列的微生物种之外的任何种内的核酸序列。在一些实施例中,引物对中的至少一个引物,或至少一个引物对,含有以下各项或基本上由以下各项组成:表16中的引物或引物对的一个或多个序列;或表16的SEQ ID NO:49-520;或表16的SEQ ID NO:49-452、457-472和481-520;或表16的SEQ ID NO:49-492;或表16的SEQ ID NO:49-452、457-472和481-492;或表16A的SEQ ID NO:49-480;或表16A的SEQ ID NO:49-452和457-472;或表16C的SEQ ID NO:521-826;或表16C的SEQ ID NO:521-820;或表16的SEQ ID NO:827-1298;或表16的SEQ ID NO:827-1230、1235-1250和1259-1298;或表16的SEQ ID NO:827-1270;或表16的SEQ ID NO:827-1230、1235-1250和1259-1270;或表16D的SEQ ID NO:827-1258;或表16D的SEQ ID NO:827-1230和1235-1250;或表16F的SEQ ID NO:1299-1604;或表16F的SEQ ID NO:1299-1598,或基本上相同或相似的序列,或任何上述核酸或引物对的核苷酸序列,其中一个或多个胸腺嘧啶碱基被尿嘧啶碱基取代。在一些实施例中,使用多个引物或引物对对核酸进行核酸扩增,所述多个引物或引物对各自含有选自以下的一个或多个序列或基本上由选自以下的一个或多个序列组成:表16中的引物的序列;或表16的SEQ IDNO:49-520;或表16的SEQ ID NO:49-452、457-472和481-520;或表16的SEQ ID NO:49-492;或表16的SEQ ID NO:49-452、457-472和481-492;或表16A的SEQ ID NO:49-480;或表16A的SEQ ID NO:49-452和457-472;或表16C的SEQ ID NO:521-826;或表16C的SEQ ID NO:521-820;或表16的SEQ ID NO:827-1298;或表16的SEQ ID NO:827-1230、1235-1250和1259-1298;或表16的SEQ ID NO:827-1270;或表16的SEQ ID NO:827-1230、1235-1250和1259-1270;或表16D的SEQ ID NO:827-1258;或表16D的SEQ ID NO:827-1230和1235-1250;或表16F的SEQ ID NO:1299-1604;或表16F的SEQ ID NO:1299-1598;或基本上相同或相似的序列,或任何上述核酸或引物对的核苷酸序列,其中一个或多个胸腺嘧啶碱基被尿嘧啶碱基取代。在使用多于一个或多个引物或引物对对核酸进行核酸扩增的一些实施例中,扩增是在单个反应混合物中进行的多重扩增。在一些实施例中,至少一个引物或一个引物对包含促进核酸操作、扩增、连接和/或扩增产物测序和/或减少或消除引物二聚体的修饰。在特定实施例中,修饰是促进多重核酸扩增、连接和/或多重扩增产物测序的修饰。
用于检测和/或测量微生物群组的方法
在用于检测、确定样品中是否存在一种或多种微生物和/或测量样品中的一种或多种微生物的方法的一些实施例中,所述方法被设计成专注于检测和/或测量某一群组的微生物。在此类实施例中,所述方法中使用的一个或多个引物对是引物和/或引物对的组合,其包含微生物特异性核酸的选定组或亚组,使得能够对样品进行定向调查,以鉴定可能例如在某些健康和疾病状态或微生物群失衡(例如,生态失调)中具有重要意义的微生物种。在一些实施例中,核酸的组合包含微生物特异性核酸和/或引物对,其特异性地扩增包含在一种或多种微生物(例如,细菌)的基因组中的核酸序列,所述一种或多种微生物与一种或多种病状、病症和/或疾病有关(在本文中被称为微生物的“条件伴随组”。在特定实施例中,核酸引物和/或引物对的组合包含特异性地扩增包含在选自表1(或表1,除了或不包含粘性放线菌和/或类球布劳特氏菌;或表1,除了或不包含粘性放线菌、类球布劳特氏菌和/或扎氏螺杆菌)中微生物的微生物的基因组内的靶核酸序列的核酸和/或引物对。在一些实施例中,所述组合包含多个核酸和/或引物对,所述多个核酸和/或引物对包含特异性地扩增表1(或表1,除了或不包含粘性放线菌和/或类球布劳特氏菌;或表1,除了或不包含粘性放线菌、类球布劳特氏菌和/或扎氏螺杆菌)中每种微生物中的靶核酸的至少一个核酸引物对。在一些实施例中,多个引物对包含特异性地扩增包含在表1(或表1,除了或不包含粘性放线菌和/或类球布劳特氏菌;或表1,除了或不包含粘性放线菌、类球布劳特氏菌和/或扎氏螺杆菌)中至少5种、10种、15种、20种、25种、30种、35种、40种、45种、50种、55种、60种或70种微生物内的基因组靶核酸的引物对。在特定实施例中,包含在不同微生物基因组中的靶核酸序列是每种微生物所独有的。在一些实施例中,核酸和/或核酸引物对的组合包含两个或更多个核酸和/或核酸引物对,其特异性地扩增包含在一种或多种A组微生物(参见表2A)的基因组中的独特核酸序列,所述A组微生物是涉及在多种病状、疾病和/或病症中起作用的种,所述多种病状、疾病和/或病症包含例如肿瘤病状(包含例如对免疫肿瘤治疗和癌症的反应)、胃肠道病症(包含例如肠易激综合征、炎症性肠病和乳糜泻)以及自身免疫性疾病(包含例如狼疮和类风湿性关节炎)。在一些实施例中,核酸和/或核酸引物对的组合包含核酸引物对集,其中每个不同的核酸引物对特异性地扩增包含在A组中不同微生物的每个基因组的不同基因组中的不同独特核酸序列。在一些实施例中,核酸和/或核酸引物对的组合包含核酸和/或核酸引物对,所述核酸和/或核酸引物对与针对A组微生物基因组的示例性核酸、引物和引物对的如表2A中所列的序列特异性地结合、杂交和/或特异性地扩增所述序列。在一些实施例中,核酸和/或核酸引物对的组合包含核酸和/或核酸引物对,所述核酸和/或核酸引物对具有针对A组微生物基因组的示例性核酸、引物和引物对的如表2A中所列的一个或多个核苷酸序列。
在一些实施例中,用于检测和/或测量某一组微生物的方法中的核酸和/或核酸引物对的组合包含两个或更多个核酸和/或核酸引物对,其特异性地扩增包含在一种或多种B组微生物(参见表2B)的基因组中的独特核酸序列,所述B组微生物是被认为与免疫肿瘤治疗反应有关的种。在一些实施例中,核酸和/或核酸引物对的组合包含核酸引物对集,其中每个不同的核酸引物对特异性地扩增包含在B组中不同微生物的每个基因组的不同基因组中的不同独特核酸序列。在一些实施例中,核酸和/或核酸引物对的组合包含核酸和/或核酸引物对,所述核酸和/或核酸引物对与针对B组微生物基因组的示例性核酸、引物和引物对的如表2B中所列的序列特异性地结合、杂交和/或特异性地扩增所述序列。在一些实施例中,核酸和/或核酸引物对的组合包含核酸和/或核酸引物对,所述核酸和/或核酸引物对具有针对B组微生物基因组的示例性核酸、引物和引物对的如表2B中所列的一个或多个核苷酸序列。
在一些实施例中,用于检测和/或测量某一组微生物的方法中的核酸和/或核酸引物对的组合包含两个或更多个核酸和/或核酸引物对,其特异性地扩增包含在一种或多种C组微生物(参见表2C)或不包含扎氏螺杆菌的C组微生物(C组微生物的亚组1)的基因组中的独特核酸序列,所述C组微生物是被认为与癌症有关的种。在一些实施例中,核酸和/或核酸引物对的组合包含核酸引物对集,其中每个不同的核酸引物对特异性地扩增包含在C组或不包含扎氏螺杆菌的C组微生物(C组微生物的亚组1)中不同微生物的每个基因组的不同基因组中的不同独特核酸序列。在一些实施例中,核酸和/或核酸引物对的组合包含核酸和/或核酸引物对,所述核酸和/或核酸引物对与针对C组微生物基因组的示例性核酸、引物和引物对的如表2C中所列的序列特异性地结合、杂交和/或特异性地扩增所述序列。在一些实施例中,核酸和/或核酸引物对的组合包含以下核酸和/或核酸引物对,所述核酸和/或核酸引物对与以下序列特异性地结合、杂交和/或特异性地扩增以下序列:选自表17的SEQ IDNO:1616、1619、1620、1625-1628、1635-1640、1699、1700、1705-1708、1752、1753、1784-1786、1817-1820、1827、1828、1840、1841、1844、1845、1852-1859、1899、1900、1904、1905、1932、1933、1956-1958、1975、1976的序列和/或基本上相同或相似的序列,或选自表17的SEQ ID NO:1616、1619、1620、1625-1628、1635-1640、1699、1700、1705-1708、1752、1753、1784-1786、1827、1828、1840、1841、1844、1845、1852-1859、1899、1900、1904、1905、1932、1933、1956、1957、1958的序列和/或基本上相同或相似的序列。在一些实施例中,核酸和/或核酸引物对的组合包含核酸和/或核酸引物对,所述核酸和/或核酸引物对具有针对C组微生物基因组的示例性核酸、引物和引物对的如表2C中所列的一个或多个核苷酸序列。在一些实施例中,核酸和/或核酸引物对的组合包含以下核酸和/或核酸引物对,所述核酸和/或核酸引物对具有选自以下的一个或多个核苷酸序列:表16中的SEQ ID NO:71、72、77-80、89-96、109-120、237-242、249-256、343-346、407-412、493-496、511-520、521-524、547-550、555-558、561-568、571-586、665-668、675-678、731-734、779-784和/或SEQ ID NO:849、850、855-858、867-874、887-898、1012-1020、1025-1034、1121-1124、1185-1190、1271-1276、1289-1298、1299-1302、1325-1328、1333-1336、1339-1346、1349-1364、1443-1446、1453-1456、1509-1512、1557-1562或基本上相同或相似的序列,或任何上述核酸或引物对的核苷酸序列,其中一个或多个胸腺嘧啶碱基被尿嘧啶碱基取代。在一些实施例中,核酸和/或核酸引物对的组合包含以下核酸和/或核酸引物对,所述核酸和/或核酸引物对具有选自以下的一个或多个核苷酸序列:表16中的SEQ ID NO:71、72、77-80、89-96、109-120、237-242、249-256、343-346、407-412、493-496、511-520和/或SEQ ID NO:849、850、855-858、867-874、887-898、1012-1020、1025-1034、1121-1124、1185-1190、1271-1276、1289-1298或基本上相同或相似的序列,或任何上述核酸或引物对的核苷酸序列,其中一个或多个胸腺嘧啶碱基被尿嘧啶碱基取代。在一些实施例中,核酸和/或核酸引物对的组合包含以下核酸和/或核酸引物对,所述核酸和/或核酸引物对具有选自以下的一个或多个核苷酸序列:表16中的SEQ ID NO:71、72、77-80、89-96、109-120、237-242、249-256、343-346、407-412和/或SEQ ID NO:849、850、855-858、867-874、887-898、1012-1020、1025-1034、1121-1124、1185-1190或基本上相同或相似的序列,或任何上述核酸或引物对的核苷酸序列,其中一个或多个胸腺嘧啶碱基被尿嘧啶碱基取代。
在一些实施例中,用于检测和/或测量某一组微生物的方法中的核酸和/或核酸引物对的组合包含两个或更多个核酸和/或核酸引物对,其特异性地扩增包含在一种或多种D组微生物(参见表2D)的基因组中的独特核酸序列,所述D组微生物是被认为与胃肠道病症有关的种,所述胃肠道病症包含例如肠易激综合征、炎症性肠病和乳糜泻。在一些实施例中,核酸和/或核酸引物对的组合包含核酸引物对集,其中每个不同的核酸引物对特异性地扩增包含在D组中不同微生物的每个基因组的不同基因组中的不同独特核酸序列。在一些实施例中,核酸和/或核酸引物对的组合包含核酸和/或核酸引物对,所述核酸和/或核酸引物对与针对D组微生物基因组的示例性核酸、引物和引物对的如表2D中所列的序列特异性地结合、杂交和/或特异性地扩增所述序列。在一些实施例中,核酸和/或核酸引物对的组合包含核酸和/或核酸引物对,所述核酸和/或核酸引物对具有针对D组微生物基因组的示例性核酸、引物和引物对的如表2D中所列的一个或多个核苷酸序列。
在一些实施例中,用于检测和/或测量某一组微生物的方法中的核酸和/或核酸引物对的组合包含两个或更多个核酸和/或核酸引物对,其特异性地扩增包含在一种或多种E组微生物(参见表2E)的基因组中的独特核酸序列,所述E组微生物是被认为与自身免疫性病症有关的种,所述自身免疫性病症包含但不限于狼疮和类风湿性关节炎。在一些实施例中,核酸和/或核酸引物对的组合包含核酸引物对集,其中每个不同的核酸引物对特异性地扩增包含在E组中不同微生物的每个基因组的不同基因组中的不同独特核酸序列。在一些实施例中,核酸和/或核酸引物对的组合包含核酸和/或核酸引物对,所述核酸和/或核酸引物对与针对E组微生物基因组的示例性核酸、引物和引物对的如表2E中所列的序列特异性地结合、杂交和/或特异性地扩增所述序列。在一些实施例中,核酸和/或核酸引物对的组合包含核酸和/或核酸引物对,所述核酸和/或核酸引物对具有针对E组微生物基因组的示例性核酸、引物和引物对的如表2E中所列的一个或多个核苷酸序列。
在一些实施例中,如本文所提供的检测、确定一种或多种核酸扩增产物是否存在和/或测量一种或多种核酸扩增产物通过具有本文提供的组合物的核酸序列的标记探针进行检测,所述标记探针特异性地鉴定特定的核酸产物。例如,此类方法可以使用连接到基板(例如,芯片)的寡核苷酸的核酸微阵列来捕获扩增产物,然后使所述扩增产物在适合杂交的条件下与标记的(例如,荧光标记的)特异性探针接触,这可以在与互补产物结合时检测到,从而检测样品中微生物的存在。用于检测标记的方法在本领域中是已知的并且包含例如光学方法,如使用共焦激光显微镜或CCD相机进行扫描。此类方法还允许对杂交进行定量以评估标记的核酸产物的丰度。在一些实施例中,通过获得一种或多种核酸扩增产物的核苷酸序列信息来检测是否存在一种或多种核酸扩增产物。用于对核酸进行测序的方法在本文中描述和/或在本领域中是已知的。扩增产物的序列也可用于鉴定各种特异性水平的微生物,例如,界、门、纲、目、科、属和/或种。如果样品中存在待确定是否存在的表1或2的微生物,则至少一种扩增产物的序列将是由来自微生物基因组的一个或多个引物对特异性地扩增的靶序列,因此检测到扩增产物的存在。如果样品中不存在微生物,则不会产生含有由一个或多个引物对特异性地扩增的靶序列的扩增产物,因此检测到扩增产物的不存在。在一些实施例中,检测是否存在核酸扩增产物包含将一种或多种核酸扩增产物的序列与表1或2中的一种或多种微生物的基因组的核酸序列进行比较。表1或2中的微生物的基因组序列可在公共数据库中获得(例如,NCBI公共数据库;www.ncbi.nlm.nih.gov/genome/microbes/)。在一些实施例中,将核酸扩增产物的序列与参考基因组序列进行比较包含进行序列的计算机辅助比对并将其映射到参考基因组。本文提供了用于映射扩增产物的序列读段的示例性核苷酸序列分析工作流程。在特定实施例中,检测是否存在核酸扩增产物包含检测是否存在含有以下序列的扩增产物:表17中的SEQ ID NO:1605-1979、或表17的SEQID NO:1605-1806、1809-1816、1821-1970、1972-1974和1977-1979、或表17中的SEQ ID NO:1605-1826、或表17中的SEQ ID NO:1605-1806、1809-1816和1821-1826、或表17A中的SEQID NO:1605-1820、或表17A中的SEQ ID NO:1605-1806和1809-1816、或表17C中的SEQ IDNO:1827-1979、或表17C中的SEQ ID NO:1827-1976,或基本上相同或相似的序列。
用于提高检测和/或测量样品中微生物的准确性、特异性和/或灵敏度的方法
在一些实施例中,本文提供的用于检测、确定样品中是否存在一种或多种微生物和/或测量样品中的一种或多种微生物的方法包含(a)使用一个或多个引物对或引物对的组合对样品中的或来自样品的核酸进行核酸扩增,所述一个或多个引物对或引物对的组合能够单独地扩增分别含有原核16S rRNA基因的一个或多个不同高变区的序列的核酸;以及(b)检测一种或多种扩增产物,从而检测样品中的一种或多种微生物或确定样品中是否存在一种或多种微生物。在一些实施例中,微生物是细菌。在一些实施例中,在微生物属的水平上检测是否存在一种或多种微生物。在一些实施例中,在微生物种的水平上检测是否存在一种或多种微生物。在一些实施例中,原核16S rRNA基因是细菌基因。在一些实施例中,所述一个或多个引物对或引物对的组合单独地扩增含有不同可变区的序列的核酸。在一些实施例中,引物对中的引物针对包含在原核16S rRNA基因的保守区中的核酸序列,或与所述核酸序列结合或杂交。在一些实施例中,所述一个或多个引物对或引物对的组合扩增或单独地扩增分别含有原核16S rRNA基因的2个或更多个、3个或更多个、4个或更多个、5个或更多个、6个或更多个、7个或更多个、8个或更多个或9个不同高变区的序列的核酸,从而产生分别含有一种或多种微生物的16S rRNA基因的2个或更多个、3个或更多个、4个或更多个、5个或更多个、6个或更多个、7个或更多个、8个或更多个或9个不同高变区的序列的核酸的扩增拷贝,其中在一些实施例中,不同高变区的扩增拷贝是单独的扩增子。在一些实施例中,所述一个或多个引物对或引物对的组合单独地扩增分别含有原核16S rRNA基因的8个不同高变区的序列的核酸。在一些实施例中,8个不同的高变区是V2-V9。在一些实施例中,所述一个或多个引物对或引物对的组合单独地扩增分别含有原核16S rRNA基因的3个或更多个不同高变区的序列的核酸,其中3个或更多个不同区域之一是V5差值区,从而产生分别含有一种或多种微生物的16S rRNA基因的3个或更多个不同高变区的序列的核酸的扩增拷贝。在一些实施例中,引物对包含一个或多个引物对中的一个或多个引物的简并序列。在一些实施例中,所述一个或多个引物对或引物对的组合选自本文所述的任何引物对,其单独地扩增含有原核16S rRNA基因的一个或多个高变区的序列的核酸。例如,在一些实施例中,能够单独地扩增含有原核16S rRNA基因的一个或多个高变区的序列的核酸的所述一个或多个引物对或引物对的组合包括含有选自以下的序列的一个或多个引物对:表15中的引物或引物对的一个或多个序列;或表15中的SEQ ID NO:1-24和/或表15中的SEQ ID NO:25-48;或表15中的SEQ ID NO:11-16、23和24和/或表15中的SEQ ID NO:35-40、47和48,或基本上相同或相似的序列,并且任选地其中一个或多个胸腺嘧啶碱基被尿嘧啶碱基取代。在一些实施例中,单独地扩增含有原核16S rRNA基因的一个或多个高变区的序列的核酸的所述一个或多个引物对或引物对的组合包括含有选自以下的序列的一个或多个引物对:表15中的SEQ ID NO:25-48和/或表15中的SEQ ID NO:35-40、47和48,或基本上相同或相似的序列,其中一个或多个胸腺嘧啶碱基被尿嘧啶碱基取代的基本相同或相似的序列。在一些实施例中,通过获得一种或多种核酸扩增产物的核苷酸序列信息来检测是否存在一种或多种核酸扩增产物。如果对于扩增的一个或多个高变区中的每一个仅获得一个序列,则序列信息指示样品中仅存在一种微生物。如果对于扩增的一个或多个高变区中的每一个获得2个或更多个不同序列,则序列信息指示样品中存在2种或更多种不同微生物。此外,使用单独地扩增多个不同高变区的16S rRNA基因引物进行扩增的组合结果通过减少在仅基于使用扩增一个或仅几个(例如,少于8个或少于5个)高变区或将组合区域(例如,V2-V3或V3-V4等)作为单个扩增子扩增的16S rRNA引物进行扩增的结果确定时可能发生的假阴性或假阳性(如果扩增引物不针对多个区域两侧的高度保守序列),提高检测和/或测量样品中一种或多种微生物的准确性。例如,由于某些种或微生物菌株(例如,细菌)中16S rRNA基因保守区的可能序列变异,被设计成扩增所有细菌的特定高变区的引物可能无法扩增样品中存在的某些细菌核酸,从而产生假阴性结果。如果引物被设计成将组合区域作为单个扩增子扩增并且不针对位于多个区域两侧的高度保守序列,则这种失败可能会更加复杂,因为不仅一个区域可能未被扩增,两个或更多个区域也可能未被扩增。然而,使用被设计成单独地扩增此类微生物中的多个高变区的16S rRNA基因引物扩增相同的核酸可能会扩增微生物中的至少一个高变序列并能够检测样品中微生物的存在。单独地扩增多个高变区增加了序列的覆盖范围并提供了更多有用的信息并增加了检测的准确性和分辨率。此外,当使用单独地扩增多个(例如,3个、4个、5个、6个、7个、8个或9个)高变区的16S rRNA基因引物时,使用不同高变区引物的扩增产物的数量(和序列)为过滤和消除仅在一个(或少于3个、或少于4个、或少于5个、或少于6个或另一个阈值量)16S rRNA基因高变区扩增中扩增的特定微生物的高变区序列从而使其不被认为是不可靠的提供了基础,因为样品中真正存在的来自细菌微生物的16S rRNA基因核酸应在大多数扩增中使用单独地扩增多个高变区的引物进行扩增。扩增产物的序列也可用于鉴定各种特异性水平的微生物,例如,界、门、纲、目、科、属和/或种。在一些实施例中,检测、确定核酸扩增产物是否存在和/或测量核酸扩增产物包含将一种或多种核酸扩增产物的序列与一种或多种微生物的原核(例如,细菌)16S rRNA基因的核酸序列进行比较。原核16S rRNA基因的序列可在公共数据库中获得(参见,例如,GreenGenes细菌16S rRNA基因序列;例如,www.greengenes.lbl.gov)。在一些实施例中,将核酸扩增产物的序列与参考基因组序列进行比较包含进行序列的计算机辅助比对并将其映射到参考基因组。本文提供了用于映射扩增产物的序列读段的示例性核苷酸序列分析工作流程。在一些实施例中,确定或测量一种或多种微生物的相对和/或绝对水平。例如,在一些实施例中,可以测量一种或多种核酸扩增产物和/或序列读段的丰度水平以提供一种或多种微生物的相对和/或绝对水平。用于对核酸(例如,扩增产物)和/或序列读段进行定量的技术是本领域已知的和/或本文提供的。
在一些实施例中,本文提供的用于检测、确定样品中是否存在一种或多种微生物和/或测量样品中的一种或多种微生物的方法包含(a)使用引物对的组合对样品中的或来自样品的核酸进行核酸扩增,所述引物对的组合包括:(i)能够扩增含有原核16S rRNA基因的一个或多个高变区序列的核酸的一个或多个引物对(被称为“16S rRNA基因引物和引物对”);以及(ii)能够扩增微生物的基因组内含有的靶核酸序列的一个或多个引物对,所述靶核酸序列不包含在原核16S rRNA基因的高变区内,其中不同的引物对扩增不同基因组内含有的不同靶核酸序列(被称为“非16S rRNA基因引物和引物对”);以及(b)检测一种或多种扩增产物,从而检测或确定是否存在微生物。在一些实施例中,微生物是细菌。在一些实施例中,原核16S rRNA基因是细菌基因和/或原核微生物是细菌。在一些实施例中,扩增含有原核16S rRNA基因的高变区序列的核酸的一个或多个引物对单独地扩增不同高变区的核酸序列。在一些实施例中,(i)的一个或多个引物对中的引物针对包含在原核16S rRNA基因的保守区中的核酸序列,或与所述核酸序列结合或杂交。在一些实施例中,扩增是在单个反应混合物中进行的多重扩增。在一些实施例中,本文提供的用于检测样品中的一种或多种微生物的方法包含(a)使用用于一个核酸扩增反应的第一引物对集和用于另一个核酸扩增反应的第二引物对集对样品中的或来自样品的核酸进行两个或更多个单独的核酸扩增反应,其中:(i)第一引物对集包括能够扩增含有原核16S rRNA基因的高变区序列的核酸的一个或多个引物对(被称为“16S rRNA基因引物和引物对”),并且(ii)第二引物对集包括能够扩增或特异性地扩增微生物的基因组内含有的靶核酸序列的一个或多个引物对,所述靶核酸序列不包含在原核16S rRNA基因的高变区内,其中不同的引物对扩增不同基因组内含有的不同靶核酸序列(被称为“非16S rRNA基因引物和引物对”);以及(b)检测一种或多种扩增产物,从而检测或确定是否存在微生物。在一些实施例中,微生物是细菌。在一些实施例中,原核16S rRNA基因是细菌基因和/或原核微生物是细菌。在一些实施例中,扩增含有原核16S rRNA基因的高变区序列的核酸的一个或多个引物对单独地扩增含有不同高变区的序列的核酸。在一些实施例中,(i)的一个或多个引物对中的引物针对包含在原核16SrRNA基因的保守区中的核酸序列,或与所述核酸序列结合或杂交。在一些实施例中,扩增是在单个反应混合物中进行的多重扩增。
在用于检测和/或测量样品中是否存在一种或多种微生物的方法的任何实施例中,其中所述方法包含分别使用第一组16S rRNA引物对和第二组非16S rRNA基因引物对或其组合对样品中的或来自样品的核酸进行核酸扩增,核酸扩增可以根据本文提供的用于此类扩增的任何实施例进行。例如,在一些实施例中,包含在原核微生物(例如,细菌)的基因组内的靶核酸序列是微生物所独有的。在一些实施例中,一个或多个16S rRNA基因引物对扩增来自不同属的多种微生物(例如,细菌)中的核酸序列。在一些实施例中,样品包含来自多种不同微生物的核酸。在一些实施例中,样品是生物样品,如例如动物消化道内容物的样品。在一些实施例中,样品是粪便样品。在一些实施例中,一个或多个16S rRNA基因引物对中的每个引物含有少于10个、少于9个、少于8个、少于7个、少于6个、少于5个、少于4个、少于3个或少于2个连续核苷酸,其序列与引物对组合中另一引物的连续核苷酸序列相同。在一些实施例中,由一个或多个16S rRNA基因引物对扩增的核酸序列的长度小于约300bp、小于约250bp、小于约200bp、小于约175bp、小于约150bp或小于约125bp。在一些实施例中,16SrRNA基因引物对单独地扩增分别含有原核16S rRNA基因的3个或更多个、4个或更多个、5个或更多个、6个或更多个、7个或更多个、8个或更多个或9个不同高变区的序列的核酸,从而产生含有一种或多种微生物的16S rRNA基因的3个或更多个、4个或更多个、5个或更多个、6个或更多个、7个或更多个、8个或更多个或9个不同高变区的序列的核酸的扩增拷贝,其中不同高变区的扩增拷贝是单独的扩增子。在一些实施例中,16S rRNA基因引物对单独地扩增分别含有原核16S rRNA基因的8个不同高变区的序列的核酸。在一些实施例中,8个不同的高变区是V2-V9。在一些实施例中,16S rRNA基因引物对单独地扩增分别含有原核16SrRNA基因的3个或更多个高变区的序列的核酸,其中3个或更多个区域之一是V5区,从而产生含有一种或多种微生物的16S rRNA基因的3个或更多个高变区的序列的核酸的扩增拷贝。在一些实施例中,引物对的组合包含一个或多个引物对中的一个或多个引物的简并序列。在一些实施例中,16S rRNA基因引物对包括引物和/或引物对,所述引物和/或引物对含有以下各项或基本上由以下各项组成:表15中的引物或引物对的一个或多个序列;或表15中的SEQ ID NO:1-24和/或表15中的SEQ ID NO:25-48;或表15中的SEQ ID NO:11-16、23和24和/或表15中的SEQ ID NO:35-40、47和48,或基本上相同或相似的序列,并且任选地其中一个或多个胸腺嘧啶碱基被尿嘧啶碱基取代。在一些实施例中,所述一个或多个非16SrRNA基因引物对特异性地扩增包含在选自表1(或表1,除了或不包含粘性放线菌和/或类球布劳特氏菌;或表1,除了或不包含粘性放线菌、类球布劳特氏菌和/或扎氏螺杆菌)微生物的微生物的基因组内的靶核酸序列。在一些实施例中,靶核酸是微生物所独有的。在一些实施例中,样品包含来自表1(或表1,除了或不包含粘性放线菌和/或类球布劳特氏菌;或表1,除了或不包含粘性放线菌、类球布劳特氏菌和/或扎氏螺杆菌)中列出的多种不同微生物的核酸。在一些此类实施例中,产生了表1中多种不同微生物的扩增拷贝。在一些实施例中,样品包含选自表1(或表1,除了或不包含粘性放线菌和/或类球布劳特氏菌;或表1,除了或不包含粘性放线菌、类球布劳特氏菌和/或扎氏螺杆菌)中列出的微生物的一种或多种或多种微生物和未在表1中列出的一种或多种微生物(例如,细菌)的核酸的混合物。在一些实施例中,至少一个,或一个或多个靶核酸序列包括选自以下的核苷酸序列或基本上由选自以下的核苷酸序列组成:表17中的SEQ ID NO:1605-1979、或表17的SEQ ID NO:1605-1806、1809-1816、1821-1970、1972-1974和1977-1979、或表17中的SEQ ID NO:1605-1826、或表17中的SEQ ID NO:1605-1806、1809-1816和1821-1826、或表17A中的SEQ ID NO:1605-1820、或表17A中的SEQ ID NO:1605-1806和1809-1816、或表17C中的SEQ ID NO:1827-1979、或表17C中的SEQ ID NO:1827-1976的核苷酸序列,或基本上相同或相似的序列。在一些实施例中,至少一个,或一个或多个核酸扩增产物包括选自表17中的SEQ ID NO:1605-1979、或表17的SEQ ID NO:1605-1806、1809-1816、1821-1970、1972-1974和1977-1979、或表17中的SEQ ID NO:1605-1826、或表17中的SEQ ID NO:1605-1806、1809-1816和1821-1826、或表17A中的SEQ ID NO:1605-1820、或表17A中的SEQ ID NO:1605-1806和1809-1816、或表17C中的SEQ ID NO:1827-1979、或表17C中的SEQ ID NO:1827-1976或基本上相同或相似的序列或其补体并且任选地在序列的5'和/或3'端具有一个或多个引物序列(如本文提供的任何引物序列)的核苷酸序列,或基本上由所述核苷酸序列组成。在一些实施例中,至少一个,或一个或多个核酸扩增产物的长度小于约500个、小于约475个、小于约450个、小于约400个、小于约375个、小于约350个、小于约300个、小于约275个、小于约250个、小于约200个、小于约175个、小于约150个或小于约100个核苷酸。在一些实施例中,至少一个非16S rRNA基因引物对不会可检测地扩增包含在除含有靶核酸序列的微生物属之外的任何属内的核酸序列。在一些实施例中,至少一个非16S rRNA基因引物对不会可检测地扩增包含在除含有靶核酸序列的微生物种之外的任何种内的核酸序列。在一些实施例中,非16S rRNA基因引物对中的至少一个引物,或至少一个非16S rRNA基因引物对,含有以下各项或基本上由以下各项组成:表16中的引物或引物对的一个或多个序列;或表16的SEQ ID NO:49-520;或表16的SEQ ID NO:49-452、457-472和481-520;或表16的SEQ ID NO:49-492;或表16的SEQ IDNO:49-452、457-472和481-492;或表16A的SEQ ID NO:49-480;或表16A的SEQ ID NO:49-452和457-472;或表16C的SEQ ID NO:521-826;或表16C的SEQ ID NO:521-820;或表16的SEQ ID NO:827-1298;或表16的SEQ ID NO:827-1230、1235-1250和1259-1298;或表16的SEQ ID NO:827-1270;或表16的SEQ ID NO:827-1230、1235-1250和1259-1270;或表16D的SEQ ID NO:827-1258;或表16D的SEQ ID NO:827-1230和1235-1250;或表16F的SEQ ID NO:1299-1604;或表16F的SEQ ID NO:1299-1598,或基本上相同或相似的序列,或任何上述核酸或引物对的核苷酸序列,其中一个或多个胸腺嘧啶碱基被尿嘧啶碱基取代。在一些实施例中,使用多个非16S rRNA基因引物或引物对对核酸进行核酸扩增,所述多个引物或引物对各自含有以下各项或基本上由以下各项组成:表16中的引物对的一个或多个序列;或表16的SEQ ID NO:49-520;或表16的SEQ ID NO:49-452、457-472和481-520;或表16的SEQ IDNO:49-492;或表16的SEQ ID NO:49-452、457-472和481-492;或表16A的SEQ ID NO:49-480;或表16A的SEQ ID NO:49-452和457-472;或表16C的SEQ ID NO:521-826;或表16C的SEQ ID NO:521-820;或表16的SEQ ID NO:827-1298;或表16的SEQ ID NO:827-1230、1235-1250和1259-1298;或表16的SEQ ID NO:827-1270;或表16的SEQ ID NO:827-1230、1235-1250和1259-1270;或表16D的SEQ ID NO:827-1258;或表16D的SEQ ID NO:827-1230和1235-1250;或表16F的SEQ ID NO:1299-1604;或表16F的SEQ ID NO:1299-1598;或基本上相同或相似的序列,或任何上述核酸或引物对的核苷酸序列,其中一个或多个胸腺嘧啶碱基被尿嘧啶碱基取代。在一些实施例中,引物对组合中的至少一个引物或一个引物对包含促进核酸操作、扩增、连接和/或扩增产物测序和/或减少或消除引物二聚体的修饰。在特定实施例中,修饰是促进多重核酸扩增、连接和/或多重扩增产物测序的修饰。
在用于检测、确定样品中是否存在一种或多种微生物和/或测量样品中的一种或多种微生物的方法的一些实施例中,其中所述方法包含使用第一组16S rRNA引物对和第二组非16S rRNA基因引物对或其组合对样品中的或来自样品的核酸进行核酸扩增,通过获得一种或多种核酸扩增产物的核苷酸序列信息来检测一种或多种核酸扩增产物。检测、确定样品中是否存在一种或多种微生物和/或测量样品中的一种或多种微生物可以基于来自一个、一些、少数、大部分、大多数、或基本上所有、或少于大多数、或少于基本上所有扩增的产物的核苷酸序列信息,这些扩增是使用在该方法中使用的引物对组合中的每个不同引物对进行的。在一些实施例中,检测和/或测量样品中仅一种或多种特定微生物不考虑样品中是否存在任何其它、或一些其它、或大部分其它微生物(或来自其它来源的核酸)。因此,在检测、确定微生物是否存在和/或测量微生物的方法的一些实施例中,可以基于仅来自用不同引物对进行的一些扩增的产物的核苷酸序列信息,或来自所有较少或有限数量的扩增的产物的核苷酸序列信息来确定是否存在。在一些情况下,即使没有确定一些或所有微生物的身份,使用不同引物(例如,16S rRNA基因引物(和/或引物扩增的特定高变区的数量)对比非16S rRNA基因引物(和/或引物扩增的特定靶核酸的数量))的组合对样品核酸进行的扩增的产物中不同序列的数量不仅提供有关是否存在目标微生物的有用信息,还提供有关是否存在其它微生物以及微生物的相对丰度的有用信息。例如,在一些情况下,从使用一个或多个非16S rRNA基因引物对样品核酸进行的扩增中未检测到扩增产物。缺乏来自扩增的特定产物表明,含有通过一个或多个非16S rRNA基因引物对扩增的靶核酸的一种或多种微生物不存在于样品中或以低于检测限的量存在。在这种情况下,如果从使用一个或多个16SrRNA基因引物对样品核酸进行的扩增中检测到扩增产物,则表明样品中存在其它微生物。此外,在这种情况下,如果从使用一个或多个16S rRNA基因引物对特定高变区进行的扩增中检测到2个或更多个扩增产物,并且2个或更多个扩增产物的序列不同,则表明样品中存在多种微生物,这些微生物不是含有由一个或多个非16S rRNA基因引物对扩增的靶核酸的微生物。在另一个实例中,如果在扩增中使用了扩增不同微生物中的靶核酸的两个或更多个不同的非16S rRNA基因引物对,并且扩增产物仅含有单个靶核酸序列的拷贝,则表明样品中存在一种微生物而不存在另一种微生物。此外,如果在本实施例中,从使用一个或多个16S rRNA基因引物对特定高变区进行的扩增中检测到两个或更多个扩增产物,并且两个或更多个扩增产物的序列不同,则表明样品中存在多种微生物,其中只有一种微生物含有由一对非16S引物扩增的靶核酸序列。此外,使用16S rRNA基因引物(并且具体地说,单独地扩增多个不同高变区的引物)和非16S rRNA基因引物进行的扩增的组合结果通过减少在仅基于使用16S rRNA引物进行扩增的结果确定时可能发生的假阴性和/或减少或消除在仅基于使用扩增种特异性核酸的非16S rRNA基因引物对进行扩增的结果确定时可能发生的假阳性数量,提高检测和/或测量样品中一种或多种微生物的准确性和特异性。例如,由于某些种或微生物菌株(例如,细菌)中16S rRNA基因保守区的可能序列变异,被设计成扩增所有细菌的16S rRNA基因高变区的引物可能无法扩增样品中存在的某些细菌核酸,从而产生假阴性结果。然而,使用扩增此类微生物中的特异性靶核酸的非16S rRNA基因引物扩增相同核酸的结果将能够检测样品中微生物的存在。在另一个实例中,假阳性结果可能发生在使用扩增靶核酸序列的非16S rRNA基因引物对进行的扩增中,所述靶核酸序列对于旨在通过使用引物对扩增来检测的微生物的基因组而言不是独特的。然而,从使用一个或通常多个16S rRNA基因引物对对相同核酸进行的扩增的产物中获得的序列信息将揭示目标微生物不存在任何16S rRNA基因高变序列,从而产生检测到样品中不存在微生物的结果。在一些实施例中,检测是否存在核酸扩增产物包含将一种或多种核酸扩增产物的序列与微生物(例如,细菌)和/或原核(例如,细菌)16S rRNA基因的基因组的参考核酸序列进行比较。在一些实施例中,将核酸扩增产物的序列与参考基因组序列进行比较包含进行序列的计算机辅助比对并将其映射到参考基因组。本文提供了用于映射扩增产物的序列读段的示例性核苷酸序列分析工作流程。在一些实施例中,确定或测量一种或多种微生物的相对和/或绝对水平。例如,在一些实施例中,可以测量一种或多种核酸扩增产物和/或序列读段的丰度水平以提供一种或多种微生物的相对和/或绝对水平。用于对核酸(例如,扩增产物)和/或序列读段进行定量的技术是本领域已知的和/或本文提供的。
用于评估、表征、剖析和/或测量微生物群体的方法
本文还提供了用于表征、剖析、评估和/或测量样品中微生物(例如,细菌)群体的方法。在所述方法的一些实施例中,使用例如本文提供的任何核酸作为探针和/或扩增引物,对样品中的或来自样品的核酸进行核酸杂交、退火和/或扩增。
在一些实施例中,用于对本文提供的样品中的微生物(例如,细菌)群体和/或其组成或组分进行表征、剖析、评估和/或测量的方法包含(a)使用引物对的组合对样品中的或来自样品的核酸进行核酸扩增,所述引物对的组合包括:(i)能够扩增含有原核16S rRNA基因的一个或多个高变区序列的核酸的一个或多个引物对(被称为“16S rRNA基因引物或引物对”);以及(ii)能够扩增微生物的基因组内含有的靶核酸序列的一个或多个引物对,所述靶核酸序列不包含在原核16S rRNA基因的高变区内,其中不同的引物对扩增不同基因组内含有的不同靶核酸序列(被称为“非16S rRNA基因引物或引物对”);(b)从通过(i)和(ii)的引物对的组合扩增的核酸产物中获得序列信息;以及(c)鉴定样品中微生物的属和样品中一种或多种微生物的种,从而表征样品中的微生物群体。在一些实施例中,所述方法进一步包含确定由(i)即16S rRNA基因引物对和/或(ii)即非16S rRNA基因引物对中的一个或多个引物对扩增的核酸产物的水平(例如相对和/或绝对水平),或其序列读段。在一些实施例中,用于对本文提供的样品中的微生物群体进行表征、剖析、评估和/或测量的方法包含(a)使用用于一个核酸扩增反应的第一引物对集和用于另一个核酸扩增反应的第二引物对集对核酸进行两个或更多个单独的核酸扩增反应,其中(i)第一引物对集包括扩增含有原核16S rRNA基因的一个或多个高变区序列的核酸的一个或多个引物对(被称为“16S rRNA基因引物或引物对”),并且(ii)第二引物对集包括扩增微生物的基因组内含有的靶核酸序列的一个或多个引物对,所述靶核酸序列不包含在原核16S rRNA基因的高变区内,其中不同的引物对扩增不同基因组内含有的不同靶核酸序列(被称为“非16S rRNA基因引物或引物对”);(b)从通过(i)和(ii)的引物对扩增的核酸产物中获得序列信息;以及(c)鉴定样品中微生物的属和样品中一种或多种微生物的种,从而表征样品中的微生物群体。在一些实施例中,所述方法进一步包含确定由(i)和/或(ii)中的一个或多个引物对扩增的核酸产物的水平(例如相对和/或绝对水平),或其序列读段。
在本文提供的用于表征、剖析、评估和/或测量样品中的微生物群体和/或其组成或组分的方法的任何实施例中,所述方法可以包含如本文所述的用于检测和/或测量样品中是否存在一种或多种微生物的方法的任何实施例。例如,在一些实施例中,微生物是细菌。在一些实施例中,原核16S rRNA基因是细菌基因和/或原核微生物是细菌。在一些实施例中,包含在原核微生物(例如,细菌)的基因组内的靶核酸序列是微生物所独有的。在一些实施例中,一个或多个16S rRNA基因引物对扩增来自不同属的多种微生物(例如,细菌)中的核酸序列。在一些实施例中,样品是生物样品,如例如动物消化道内容物的样品。在一些实施例中,样品是粪便样品。
在用于表征、剖析、评估和/或测量样品中的微生物群体和/或其组成或组分的方法的任何实施例中,可以根据本文提供的用于此类扩增的任何实施例进行核酸扩增。例如,在一些实施例中,扩增含有原核16S rRNA基因的高变区序列的核酸的一个或多个引物对单独地扩增含有不同高变区的序列的核酸。在一些实施例中,一个或多个16S rRNA基因引物对中的引物针对包含在原核16S rRNA基因的保守区中的核酸序列,或与所述核酸序列结合或杂交。在一些实施例中,一个或多个16S rRNA基因引物对和/或非16S rRNA基因引物对包括多个引物对。例如,一个或多个16S rRNA基因引物对可以包括扩增含有原核16S rRNA基因的多个高变区序列的核酸的多个引物对,和/或一个或多个非16S rRNA基因引物对可以包括扩增包含在多种微生物的基因组中的靶核酸序列的多个引物对。在一些实施例中,扩增或两个或更多个单独的核酸扩增反应是在单个反应混合物中进行的多重扩增。在一些实施例中,一个或多个16S rRNA基因引物对中的每个引物含有少于10个、少于9个、少于8个、少于7个、少于6个、少于5个、少于4个、少于3个或少于2个连续核苷酸,其序列与引物对组合中另一引物的连续核苷酸序列相同。在一些实施例中,由一个或多个16S rRNA基因引物对扩增的核酸序列的长度小于约300bp、小于约250bp、小于约200bp、小于约175bp、小于约150bp或小于约125bp。在一些实施例中,16S rRNA基因引物对单独地扩增分别含有原核16SrRNA基因的3个或更多个、4个或更多个、5个或更多个、6个或更多个、7个或更多个、8个或更多个或9个不同高变区的序列的核酸,从而产生含有一种或多种微生物的16S rRNA基因的3个或更多个、4个或更多个、5个或更多个、6个或更多个、7个或更多个、8个或更多个或9个不同高变区的序列的核酸的扩增拷贝,其中不同高变区的扩增拷贝是单独的扩增子。在一些实施例中,16S rRNA基因引物对单独地扩增含有原核16S rRNA基因的8个不同高变区的序列的核酸。在一些实施例中,8个不同的高变区是V2-V9。在一些实施例中,16S rRNA基因引物对单独地扩增分别含有原核16S rRNA基因的3个或更多个高变区的序列的核酸,其中3个或更多个不同区域之一是V5区,从而产生含有一种或多种微生物的16S rRNA基因的3个或更多个不同高变区的序列的核酸的扩增拷贝。在一些实施例中,引物对的组合包含一个或多个引物对中的一个或多个引物的简并序列。在一些实施例中,16S rRNA基因引物对包括引物和/或引物对,所述引物和/或引物对含有以下各项或基本上由以下各项组成:表15中的引物或引物对的一个或多个序列;或表15中的SEQ ID NO:1-24和/或表15中的SEQ IDNO:25-48;或表15中的SEQ ID NO:11-16、23和24和/或表15中的SEQ ID NO:35-40、47和48,或基本上相同或相似的序列,并且任选地其中一个或多个胸腺嘧啶碱基被尿嘧啶碱基取代。
在用于表征、剖析、评估和/或测量样品中的微生物群体和/或其组成或组分的方法的一些实施例中,所述一个或多个非16S rRNA基因引物对特异性地扩增包含在选自表1(或表1,除了或不包含粘性放线菌和/或类球布劳特氏菌;或表1,除了或不包含粘性放线菌、类球布劳特氏菌和/或扎氏螺杆菌)微生物的微生物的基因组内的靶核酸序列。在一些实施例中,靶核酸是微生物所独有的。在一些实施例中,样品包含来自表1中列出的多种不同微生物的核酸。在一些此类实施例中,产生了表1(或表1,除了或不包含粘性放线菌和/或类球布劳特氏菌;或表1,除了或不包含粘性放线菌、类球布劳特氏菌和/或扎氏螺杆菌)中多种不同微生物的扩增拷贝。在一些实施例中,样品包含选自表1(或表1,除了或不包含粘性放线菌和/或类球布劳特氏菌;或表1,除了或不包含粘性放线菌、类球布劳特氏菌和/或扎氏螺杆菌)中列出的微生物的一种或多种或多种微生物和未在表1中列出的一种或多种微生物(例如,细菌)的核酸的混合物。在一些实施例中,至少一个,或一个或多个靶核酸序列包括选自以下的核苷酸序列或基本上由选自以下的核苷酸序列组成:表17中的SEQ IDNO:1605-1979、或表17的SEQ ID NO:1605-1806、1809-1816、1821-1970、1972-1974和1977-1979、或表17中的SEQ ID NO:1605-1826、或表17中的SEQ ID NO:1605-1806、1809-1816和1821-1826、或表17A中的SEQ ID NO:1605-1820、或表17A中的SEQ ID NO:1605-1806和1809-1816、或表17C中的SEQ ID NO:1827-1979、或表17C中的SEQ ID NO:1827-1976的核苷酸序列,或基本上相同或相似的序列,或其补体。在一些实施例中,至少一个,或一个或多个核酸扩增产物包括选自表17中的SEQ ID NO:1605-1979、或表17的SEQ ID NO:1605-1806、1809-1816、1821-1970、1972-1974和1977-1979、或表17中的SEQ ID NO:1605-1826、或表17中的SEQ ID NO:1605-1806、1809-1816和1821-1826、或表17A中的SEQ ID NO:1605-1820、或表17A中的SEQ ID NO:1605-1806和1809-1816、或表17C中的SEQ ID NO:1827-1979、或表17C中的SEQ ID NO:1827-1976或基本上相同或相似的序列或其补体并且任选地在序列的5'和/或3'端具有一个或多个引物序列(如本文提供的任何引物序列)的核苷酸序列,或基本上由所述核苷酸序列组成,并且长度小于约500个、小于约475个、小于约450个、小于约400个、小于约375个、小于约350个、小于约300个、小于约275个、小于约250个、小于约200个、小于约175个、小于约150个或小于约100个核苷酸。在一些实施例中,至少一个非16SrRNA基因引物对不会可检测地扩增包含在除含有靶核酸序列的微生物属之外的任何属内的核酸序列。在一些实施例中,至少一个非16S rRNA基因引物对不会可检测地扩增包含在除含有靶核酸序列的微生物种之外的任何种内的核酸序列。在一些实施例中,非16S rRNA基因引物对中的至少一个引物,或至少一个非16S rRNA基因引物对,含有以下各项或基本上由以下各项组成:表16中的引物或引物对的一个或多个序列;或表16的SEQ ID NO:49-520;或表16的SEQ ID NO:49-452、457-472和481-520;或表16的SEQ ID NO:49-492;或表16的SEQ ID NO:49-452、457-472和481-492;或表16A的SEQ ID NO:49-480;或表16A的SEQ IDNO:49-452和457-472;或表16C的SEQ ID NO:521-826;或表16C的SEQ ID NO:521-820;或表16的SEQ ID NO:827-1298;或表16的SEQ ID NO:827-1230、1235-1250和1259-1298;或表16的SEQ ID NO:827-1270;或表16的SEQ ID NO:827-1230、1235-1250和1259-1270;或表16D的SEQ ID NO:827-1258;或表16D的SEQ ID NO:827-1230和1235-1250;或表16F的SEQ IDNO:1299-1604;或表16F的SEQ ID NO:1299-1598,或基本上相同或相似的序列,或任何上述核酸或引物对的核苷酸序列,其中一个或多个胸腺嘧啶碱基被尿嘧啶碱基取代。在一些实施例中,使用多个非16S rRNA基因引物或引物对对核酸进行核酸扩增,所述多个引物或引物对各自含有以下各项或基本上由以下各项组成:表16中的引物对的一个或多个序列;或表16的SEQ ID NO:49-520;或表16的SEQ ID NO:49-452、457-472和481-520;或表16的SEQID NO:49-492;或表16的SEQ ID NO:49-452、457-472和481-492;或表16A的SEQ ID NO:49-480;或表16A的SEQ ID NO:49-452和457-472;或表16C的SEQ ID NO:521-826;或表16C的SEQ ID NO:521-820;或表16的SEQ ID NO:827-1298;或表16的SEQ ID NO:827-1230、1235-1250和1259-1298;或表16的SEQ ID NO:827-1270;或表16的SEQ ID NO:827-1230、1235-1250和1259-1270;或表16D的SEQ ID NO:827-1258;或表16D的SEQ ID NO:827-1230和1235-1250;或表16F的SEQ ID NO:1299-1604;或表16F的SEQ ID NO:1299-1598;或基本上相同或相似的序列,或任何上述核酸或引物对的核苷酸序列,其中一个或多个胸腺嘧啶碱基被尿嘧啶碱基取代。在一些实施例中,引物对组合中的至少一个引物或一个引物对包含促进核酸操作、扩增、连接和/或扩增产物测序和/或减少或消除引物二聚体的修饰。在特定实施例中,修饰是促进多重核酸扩增、连接和/或多重扩增产物测序的修饰。
在所述方法的一些实施例中,微生物(例如,细菌)群体和/或其组成或组分的表征、剖析、评估和/或测量被设计成专注于微生物群体的构成,特别是关于某些微生物群组以及组和/或组成员在群体中的成比例存在。在此类实施例中,引物和/或引物对的组合包含微生物特异性核酸的选定组或亚组,并且包含界涵盖核酸(例如,16S rRNA基因引物和引物对),并且不仅能够全面调查微生物(例如,细菌)属的整体和相对水平,还可以详细鉴定微生物的种,所述微生物的种可以被定制以例如专注于一种或多种特定的目标微生物,这些微生物在某些健康和疾病状态或微生物群失衡(例如,生态失调)中可能很重要。在一些实施例中,核酸的组合包含微生物特异性核酸和/或引物对,其特异性地扩增包含在一种或多种微生物(例如,细菌)的基因组中的核酸序列,所述一种或多种微生物与一种或多种病状、病症和/或疾病有关。在特定实施例中,核酸引物和/或引物对的组合包含特异性地扩增包含在选自表1(或表1,除了或不包含粘性放线菌和/或类球布劳特氏菌;或表1,除了或不包含粘性放线菌、类球布劳特氏菌和/或扎氏螺杆菌)中微生物的微生物的基因组内的靶核酸序列的核酸和/或引物对。在一些实施例中,所述组合包含多个核酸和/或引物对,所述多个核酸和/或引物对包含特异性地扩增表1(或表1,除了或不包含粘性放线菌和/或类球布劳特氏菌;或表1,除了或不包含粘性放线菌、类球布劳特氏菌和/或扎氏螺杆菌)中每种微生物中的靶核酸的至少一个核酸引物对。在一些实施例中,多个引物对包含特异性地扩增包含在表1(或表1,除了或不包含粘性放线菌和/或类球布劳特氏菌;或表1,除了或不包含粘性放线菌、类球布劳特氏菌和/或扎氏螺杆菌)中至少5种、10种、15种、20种、25种、30种、35种、40种、45种、50种、55种、60种或70种微生物内的基因组靶核酸的引物对。在特定实施例中,包含在不同微生物基因组中的靶核酸序列是每种微生物所独有的。在一些实施例中,核酸和/或核酸引物对的组合包含两个或更多个核酸和/或核酸引物对,其特异性地扩增包含在一种或多种A组微生物(参见表2A)的基因组中的独特核酸序列,所述A组微生物是涉及在多种病状、疾病和/或病症中起作用的种,所述多种病状、疾病和/或病症包含例如肿瘤病状(包含例如对免疫肿瘤治疗和癌症的反应)、胃肠道病症(包含例如肠易激综合征、炎症性肠病和乳糜泻)以及自身免疫性疾病(包含例如狼疮和类风湿性关节炎)。在一些实施例中,核酸和/或核酸引物对的组合包含核酸引物对集,其中每个不同的核酸引物对特异性地扩增包含在A组中不同微生物的每个基因组的不同基因组中的不同独特核酸序列。在一些实施例中,核酸和/或核酸引物对的组合包含核酸和/或核酸引物对,所述核酸和/或核酸引物对与针对A组微生物基因组的示例性核酸、引物和引物对的如表2A中所列的序列特异性地结合、杂交和/或特异性地扩增所述序列。在一些实施例中,核酸和/或核酸引物对的组合包含核酸和/或核酸引物对,所述核酸和/或核酸引物对具有针对A组微生物基因组的示例性核酸、引物和引物对的如表2A中所列的一个或多个核苷酸序列。
在一些实施例中,核酸和/或核酸引物对的组合包含两个或更多个核酸和/或核酸引物对,其特异性地扩增包含在一种或多种B组微生物(参见表2B)的基因组中的独特核酸序列,所述B组微生物是被认为与免疫肿瘤治疗反应有关的种。在一些实施例中,核酸和/或核酸引物对的组合包含核酸引物对集,其中每个不同的核酸引物对特异性地扩增包含在B组中不同微生物的每个基因组的不同基因组中的不同独特核酸序列。在一些实施例中,核酸和/或核酸引物对的组合包含核酸和/或核酸引物对,所述核酸和/或核酸引物对与针对B组微生物基因组的示例性核酸、引物和引物对的如表2B中所列的序列特异性地结合、杂交和/或特异性地扩增所述序列。在一些实施例中,核酸和/或核酸引物对的组合包含核酸和/或核酸引物对,所述核酸和/或核酸引物对具有针对B组微生物基因组的示例性核酸、引物和引物对的如表2B中所列的一个或多个核苷酸序列。
在一些实施例中,核酸和/或核酸引物对的组合包含两个或更多个核酸和/或核酸引物对,其特异性地扩增包含在一种或多种C组微生物(参见表2C)或不包含扎氏螺杆菌的C组微生物(C组微生物的亚组1)的基因组中的独特核酸序列,所述C组微生物是被认为与癌症有关的种。在一些实施例中,核酸和/或核酸引物对的组合包含核酸引物对集,其中每个不同的核酸引物对特异性地扩增包含在C组或不包含扎氏螺杆菌的C组微生物(C组微生物的亚组1)中不同微生物的每个基因组的不同基因组中的不同独特核酸序列。在一些实施例中,核酸和/或核酸引物对的组合包含核酸和/或核酸引物对,所述核酸和/或核酸引物对与针对C组微生物基因组的示例性核酸、引物和引物对的如表2C中所列的序列特异性地结合、杂交和/或特异性地扩增所述序列。在一些实施例中,核酸和/或核酸引物对的组合包含以下核酸和/或核酸引物对,所述核酸和/或核酸引物对与以下序列特异性地结合、杂交和/或特异性地扩增以下序列:选自表17的SEQ ID NO:1616、1619、1620、1625-1628、1635-1640、1699、1700、1705-1708、1752、1753、1784-1786、1817-1820、1827、1828、1840、1841、1844、1845、1852-1859、1899、1900、1904、1905、1932、1933、1956-1958、1975、1976的序列和/或基本上相同或相似的序列,或选自表17的SEQ ID NO:1616、1619、1620、1625-1628、1635-1640、1699、1700、1705-1708、1752、1753、1784-1786、1827、1828、1840、1841、1844、1845、1852-1859、1899、1900、1904、1905、1932、1933、1956、1957、1958的序列和/或基本上相同或相似的序列。在一些实施例中,核酸和/或核酸引物对的组合包含核酸和/或核酸引物对,所述核酸和/或核酸引物对具有针对C组微生物基因组的示例性核酸、引物和引物对的如表2C中所列的一个或多个核苷酸序列。在一些实施例中,核酸和/或核酸引物对的组合包含以下核酸和/或核酸引物对,所述核酸和/或核酸引物对具有选自以下的一个或多个核苷酸序列:表16中的SEQ ID NO:71、72、77-80、89-96、109-120、237-242、249-256、343-346、407-412、493-496、511-520、521-524、547-550、555-558、561-568、571-586、665-668、675-678、731-734、779-784和/或SEQ ID NO:849、850、855-858、867-874、887-898、1012-1020、1025-1034、1121-1124、1185-1190、1271-1276、1289-1298、1299-1302、1325-1328、1333-1336、1339-1346、1349-1364、1443-1446、1453-1456、1509-1512、1557-1562或基本上相同或相似的序列,或任何上述核酸或引物对的核苷酸序列,其中一个或多个胸腺嘧啶碱基被尿嘧啶碱基取代。在一些实施例中,核酸和/或核酸引物对的组合包含以下核酸和/或核酸引物对,所述核酸和/或核酸引物对具有选自以下的一个或多个核苷酸序列:表16中的SEQ ID NO:71、72、77-80、89-96、109-120、237-242、249-256、343-346、407-412、493-496、511-520和/或SEQ ID NO:849、850、855-858、867-874、887-898、1012-1020、1025-1034、1121-1124、1185-1190、1271-1276、1289-1298或基本上相同或相似的序列,或任何上述核酸或引物对的核苷酸序列,其中一个或多个胸腺嘧啶碱基被尿嘧啶碱基取代。在一些实施例中,核酸和/或核酸引物对的组合包含以下核酸和/或核酸引物对,所述核酸和/或核酸引物对具有选自以下的一个或多个核苷酸序列:表16中的SEQ ID NO:71、72、77-80、89-96、109-120、237-242、249-256、343-346、407-412和/或SEQ ID NO:849、850、855-858、867-874、887-898、1012-1020、1025-1034、1121-1124、1185-1190或基本上相同或相似的序列,或任何上述核酸或引物对的核苷酸序列,其中一个或多个胸腺嘧啶碱基被尿嘧啶碱基取代。
在一些实施例中,核酸和/或核酸引物对的组合包含两个或更多个核酸和/或核酸引物对,其特异性地扩增包含在一种或多种D组微生物(参见表2D)的基因组中的独特核酸序列,所述D组微生物是被认为与胃肠道病症有关的种,所述胃肠道病症包含例如肠易激综合征、炎症性肠病和乳糜泻。在一些实施例中,核酸和/或核酸引物对的组合包含核酸引物对集,其中每个不同的核酸引物对特异性地扩增包含在D组中不同微生物的每个基因组的不同基因组中的不同独特核酸序列。在一些实施例中,核酸和/或核酸引物对的组合包含核酸和/或核酸引物对,所述核酸和/或核酸引物对与针对D组微生物基因组的示例性核酸、引物和引物对的如表2D中所列的序列特异性地结合、杂交和/或特异性地扩增所述序列。在一些实施例中,核酸和/或核酸引物对的组合包含核酸和/或核酸引物对,所述核酸和/或核酸引物对具有针对D组微生物基因组的示例性核酸、引物和引物对的如表2D中所列的一个或多个核苷酸序列。
在一些实施例中,核酸和/或核酸引物对的组合包含两个或更多个核酸和/或核酸引物对,其特异性地扩增包含在一种或多种E组微生物(参见表2E)的基因组中的独特核酸序列,所述E组微生物是被认为与自身免疫性病症有关的种,所述自身免疫性病症包含但不限于狼疮和类风湿性关节炎。在一些实施例中,核酸和/或核酸引物对的组合包含核酸引物对集,其中每个不同的核酸引物对特异性地扩增包含在E组中不同微生物的每个基因组的不同基因组中的不同独特核酸序列。在一些实施例中,核酸和/或核酸引物对的组合包含核酸和/或核酸引物对,所述核酸和/或核酸引物对与针对E组微生物基因组的示例性核酸、引物和引物对的如表2E中所列的序列特异性地结合、杂交和/或特异性地扩增所述序列。在一些实施例中,核酸和/或核酸引物对的组合包含核酸和/或核酸引物对,所述核酸和/或核酸引物对具有针对E组微生物基因组的示例性核酸、引物和引物对的如表2E中所列的一个或多个核苷酸序列。
核苷酸序列信息
在所述方法的一些实施例中,微生物群体和/或其组成或组分的表征、剖析、评估和/或测量涉及利用扩增产物的核苷酸序列信息。核苷酸序列提供用于评估或测量多样性(例如,不同微生物的数量,如不同属和/或种的微生物的数量)、不同微生物的水平或丰度、不同微生物的成比例量和/或构成样品中微生物群体的微生物的身份(例如,属、种等)的信息。通常,微生物群体和/或其组成或组分的表征、剖析、评估和/或测量基于来自大多数或基本上所有扩增的产物的核苷酸序列信息,这些扩增使用该方法中使用的引物对组合中的每个不同引物对进行。其原因之一是,由不同微生物和/或其相对丰度定义的微生物群体在该方法中得到阐明。相反,扩增、检测和/或测量样品中仅一种或多种特定微生物的方法可以不考虑样品中是否存在任何其它或一些其它微生物(或来自其它来源的核酸),因此可以基于仅来自用不同引物对进行的一些扩增的产物的核苷酸序列信息,或来自所有较少或有限数量的扩增的产物的核苷酸序列信息进行确定。
在一些实施例中,用于对样品中的微生物群体和/或其组成或组分进行表征、剖析、评估和/或测量的方法包含从通过本方法中使用的引物对组合扩增的核酸产物中获得序列信息。序列信息的实例包含但不限于:扩增产物的连续多核苷酸序列(核苷酸序列确定)中的核苷酸的身份及其顺序(其可以包含例如条形码序列,例如,对应于扩增子文库来源、所使用的引物等)、核苷酸序列与参考序列的比对和/或映射(以及参考序列的属或种的身份)、映射到参考序列和/或其部分(例如,16S rRNA基因的高变区)的序列读段的数量、唯一映射到参考序列的序列读段的数量,以及序列读段映射到的参考序列的区域(例如,靶序列)的数量。在一些实施例中,序列信息提供微生物的身份(例如,属、种)和/或群体中不同微生物的数量,其指示群体的多样性。在一些实施例中,序列信息提供了群体中微生物水平(例如,相对和/或绝对水平)的度量(群体中的丰度和成比例的贡献或存在)。
用于对核酸,例如制备的核酸文库(如可以使用本文所述的组合物和方法产生的扩增子文库)中的核酸进行测序的技术在本文中提供和/或是本领域已知的,并且包含例如下一代合成测序法和Sanger测序法。任何这样的方法可以包含使用微阵列对核酸进行大规模平行测序,例如在如芯片等基板上。在一些实施例中,核酸,例如扩增子文库,可以使用Ion Torrent测序仪(生命科技公司(Life Technologies)),例如Ion Torrent PGM 318TM或Ion Torrent S5 520TM、Ion Torrent S5 530TM或Ion Torrent S5 XLTM系统进行测序。其它测序系统包含但不限于采用固相PCR的系统,其涉及使用寡核苷酸衔接子(例如,IlluminaMiSeq、NextSeq或HiSeq平台)对核酸进行桥式扩增。在一些实施例中,待测序的核酸模板可以使用本文提供的扩增方法从核酸分子群制备。在一些实施例中,测序仪可以与应用参数或软件以测定经扩增的核酸分子的序列的服务器耦接。
在一些实施例中,使用本文提供的引物制备的扩增子文库可用于下游富集应用。例如,在使用核酸组合物(例如,本文提供的引物、引物对)扩增样品核酸之后,可以进行二级和/或三级扩增过程,所述过程包含但不限于文库扩增步骤和/或克隆扩增步骤,包含例如等温核酸扩增、乳液PCR或桥式PCR。在一些实施例中,扩增子文库可以用于富集应用和测序应用。例如,可以使用任何合适的DNA测序平台对扩增子文库进行测序。在一些实施例中,可以根据Ion PGMTM Template IA 500试剂盒用户指南(参见例如赛默飞世尔科技公司的目录号A24622和出版物号MAN0009347)、Ion 540TM Kit-Chef用户指南(参见例如赛默飞世尔科技公司的目录号A30011和出版物号MAN0010851)或Ion 550TM Kit-Chef用户指南(参见例如赛默飞世尔科技公司的目录号A34541和出版物号MAN0017275)进行经扩增的扩增子的扩增和模板化。在一些实施例中,待克隆扩增的扩增靶序列中的至少一个序列可以连接到支撑物或颗粒(参见例如美国专利申请公开号US2019/0194719)。支撑物可以包括任何合适的材料,并具有任何合适的形状,包含例如平面、球状或颗粒。在一些实施例中,支撑物是如美国公开申请第20100304982中描述的支架聚合物颗粒。在一些实施例中,可以在不到24小时内对扩增子文库进行制备、富集和测序。在一些实施例中,扩增子文库可在约9小时内制备、富集和测序。在一些实施例中,扩增子文库可以是配对或组合文库,例如,含有使用16SrRNA基因引物扩增样品核酸而产生的扩增子和使用种(例如,细菌种)特异性引物扩增样品核酸而产生的扩增子的文库。在一些实施例中,可以制备待测序的文库和/或模板制备物,用于使用自动化系统进行自动测序,例如,Ion ChefTM系统(赛默飞世尔科技公司)。通过本文公开的方法产生的扩增产物可以连接到衔接子,所述衔接子可以在下游用作克隆扩增的平台。衔接子可以用作模板链,用于使用第二引物集进行后续扩增,并且因此可以对衔接子连接的扩增产物进行通用扩增。在一些实施例中,与扩增子连接的衔接子包含一个或多个条形码。在一个实施例中,一个条形码可以连接到使用16S rRNA基因引物扩增样品核酸而产生的扩增子上,并且不同的条形码可以连接到使用种(例如,细菌种)特异性引物扩增样品核酸而产生的扩增子上。并入条形码的能力可以增强样品通量,并且允许同时分析多个样品或材料来源。在一个实例中,使用本文提供的组合物和方法制备的经扩增的核酸分子可以连接到Ion TorrentTM测序衔接子(A和P1衔接子,作为离子片段库试剂盒(IonFragment Library Kit)的组分出售,生命科技公司,部件号4466464)或Ion TorrentTM DNA条形码(生命科技公司,部件号4468654)。在一些实施例中,可以将条形码或密钥并入到每个扩增产物中以帮助数据分析和例如编目。
在一些实施例中,通过本公开的教导产生的扩增子文库的产率足以用于各种下游应用,包含使用Ion TorrentTM PGM系统的Ion XpressTM模板试剂盒(例如,PCR介导的核酸片段库添加到Ion SphereTM粒子上)(生命科技公司,产品号4467389)。例如,可以在IonXpress模板试剂盒用户指南(赛默飞世尔科技公司)中找到从扩增子文库制备模板文库的说明。在离子测序用户指南(赛默飞世尔科技公司)中描述了将后续模板库加载到IonTorrentTM芯片上以用于核酸测序的说明。在一些实施例中,通过本公开的教导产生的扩增子文库可以用于配对末端测序(例如,Ion TorrentTM PGM系统(赛默飞世尔科技公司)上的配对末端测序)。对于本领域普通技术人员显而易见的是,用于克隆扩增的许多其它技术、平台或方法,如野火(wildfire)、PCR和桥式扩增,可以结合本公开的扩增产物使用。还设想本领域的普通技术人员在进一步改进或优化本文提供的条件时可以直接进行核酸测序(例如使用Ion Torrent PGMTM或ProtonTM测序仪,生命科技公司)而不进行克隆扩增步骤。获得核酸(例如,扩增子)的核苷酸序列的序列数据处理和分析程序可用,并且包含例如与离子测序仪(赛默飞世尔科技公司)一起使用的Torrent SuiteTM软件产品。
在一些实施例中,确定或测量一种或多种微生物的相对和/或绝对水平。例如,在一些实施例中,可以测量一种或多种核酸扩增产物和/或序列读段的丰度水平以提供一种或多种微生物的相对和/或绝对水平。用于对核酸(例如,扩增产物)和/或序列读段进行定量的技术是本领域已知的和/或本文提供的。
在一些实施例中,利用序列信息,例如,在检测微生物和/或鉴定样品微生物的属和/或种时,在方法中包含将一种或多种核酸扩增产物的序列相互比较,和/或与微生物(例如,细菌)和/或原核(例如,细菌)基因(如16S rRNA基因)的基因组的参考核酸序列进行比较。在一些实施例中,比较核酸扩增产物的序列包含将其相对于参考基因组进行计算机辅助映射。在一些实施例中,比较核酸扩增产物的序列包含序列与其它序列的计算机辅助比对。有几种软件产品可用于进行涉及比对和映射核酸序列的计算处理。例如,一些产品在将序列读段映射到参考数据库中的序列时使用Burrows-Wheeler变换(BWT;参见例如,Li和Durbin(2009)《生物信息学(Bioinformatics)》25:1754-1760)算法。Burrows-Wheeler比对器提供了BWT的一种实施方式(参见例如,https://sourceforge.net/projects/bio-bwa/files/)。一些产品利用散列算法(例如,SSAHA;sanger.ac.uk/science/tools/ssaha;参见例如,Ning等人(2001)《基因组研究(Genome Res)》11(10):1725-11729)和/或动态规划算法(例如,Needleman-Wunsch或Smith-Waterman),所述算法在例如可通过欧洲生物信息学研究所(参见例如,ebi.ac.uk/services/all)获得的软件工具中实施。可用于比对核苷酸序列的另一个工具是可通过国家生物技术信息中心(NCBI)获得的基本局部比对搜索工具(BLAST)(参见例如,https://blast.ncbi.nlm.nih.gov/Blast.cgi)。该程序可用于使用读段同一性、比对长度和其它参数的指标来搜索序列数据库(例如,微生物基因组数据库)中的相似序列,并且可以计算映射到特定属或种的序列读段。为核苷酸序列映射/比对提供多个选项的程序的实例是Torrent映射比对程序(TMAP)模块(参见例如,Torrent SuiteTM软件用户指南;赛默飞世尔科技公司出版号MAN0017972),其与Torrent SuiteTM软件产品一起使用,所述软件产品针对使用Ion TorrentTM测序仪系统生成的序列数据进行了优化。
在一个实施例中,本文描述了用于比对和/或映射扩增产物的序列读段的核苷酸序列分析工作流程。在一些实施例中,这些方法可用于压缩参考序列数据库,所述数据库用于映射序列读段以分析和剖析微生物群体。在来自许多微生物(例如,细菌)的基因组和基因(例如,16S rRNA基因)序列的数据库中可能有超过100,000个核苷酸序列。在本文提供的其中扩增16S rRNA基因高变区的方法中,九个高变区中扩增和测序的区域越多,必须进行的比对次数越多。因此,对样品中多种微生物的多个经扩增的核酸区域的分析可能需要大量的处理器内存和时间,并可能在分析中引入错误和不确定性。本文描述了执行降低计算要求、降低记忆要求和提高样品中核酸表征质量的此类分析的方法。在一些实施例中,可以将包含序列读段信息的未比对的BAM文件提供给处理器以分析对应于标志物区域的序列读段。可以分析从文库DNA模板测序中获得的读段,以鉴定和确定样品中微生物组成的水平。可以使用并入了Ion Torrent SuiteTM软件(赛默飞世尔科技公司)的工作流程进行分析,所述软件具有被设计成促进微生物DNA序列读段分析的运行计划模板,以及为测定中靶向的扩增子生成计数的AmpliSeq微生物组分析软件插件。用于在分析的读段映射方面进行比对的参考基因组文件可能包含在插件中。压缩的16S参考序列可能源自GreenGenes或其它16SrRNA基因序列数据库。压缩的16S参考序列包括16S rRNA基因的多个高变区。靶向9个高变区中的多个高变区(例如,V2–V9)以进行扩增的引物,如本文所述的引物,通过微生物核酸的扩增产生高变节段序列集。可以通过使用引物对对数据库中含有的全长16S rRNA基因序列应用计算机PCR模拟以提取可变区(例如,V2–V9)的预期靶节段来生成高变节段集。计算机PCR模拟可以使用可用的计算工具,使用给定的引物集和用户输入的靶DNA序列来计算理论PCR结果。一个这样的工具是Primer-BLAST(https://www.ncbi.nlm.nih.gov/tools/primer-blast/index.cgi?LINK_LOC=BlastHome),其描述于以下文献中:Ye J,CoulourisG,Zaretskaya I,Cutcutache I,Rozen S,Madden TL.(2012)“Primer-BLAST:一种设计用于聚合酶链式反应的靶特异性引物的工具(Primer-BLAST:a tool to design target-specific primers for polymerase chain reaction.)”《BMC生物信息学(BMCBioinformatics.)》13:134。源自计算机模拟的高变节段集提供了一个压缩参考,所述压缩参考仅含有完整数据库中那些预计会被引物扩增的全长16S rRNA序列的高变区序列。例如,参考碱基对的数量可以从全长序列的1500bp减少到总共1299bp的8个高变节段。GreenGenes数据库含有大约150,000个16S rRNA基因序列。
图2说明了用于分析本文提供的方法中产生的序列信息的工作流程。例如,工作流程可用作用于处理序列读段以评估样品的微生物组成的方法。条形码/样品名称解析器将序列读段分成一组对应于使用16S rRNA基因引物扩增而产生的扩增子和一组对应于使用非16S rRNA基因引物(例如,靶向种特异性引物)扩增而产生的扩增子)。碱基调用者可能会移除质量读段修剪和短读段。碱基调用可以通过分析任何合适的信号特性(例如,信号振幅或强度)来进行。与本发明的教导一起使用的传感器阵列、信号处理和碱基调用的结构和/或设计可以包含2013年4月11日公布的美国专利申请公开第2013/0090860号中描述的一种或多种特征,所述美国专利申请通过引用整体并入本文。例如,可以移除长度小于60个碱基或大于350个碱基的序列读段。可以独立分析通过使用16S rRNA基因引物和种特异性引物扩增样品核酸而产生的序列的序列读段和靶标种。在一些实施例中,不止一个引物对可以靶向给定的高变区。用于扩增每个区域的引物对中的每个引物的序列针对特定V区每一侧的“保守”序列,因此引物对理论上将扩增每个细菌基因组中的可变区。然而,每个可变区两侧的一些“保守”区,具体地说,V2和V8两侧的保守区,没有足够的保守性来扩增所有细菌的V2和V8区。因此,为了扩增V2和V8,可以使用3个引物对(而不是1个引物对),其中每个引物对的序列几乎相同但有一个或两个核苷酸不同(被称为“简并引物”)。使用这3个引物对是扩增所有细菌的V2和V8区的一种方法,即使V2和V8两侧的保守区对于不同的细菌可能略有不同。
通过对16S rRNA基因序列数据库中的种和菌株进行计算机模拟而生成的高变节段被进一步处理,以鉴定种和菌株的高变节段特性中的预期模式或特征。基于计算机模拟的扩增结果中每个靶标高变节段的存在(=1)或不存在(=0),为每个种和菌株生成预期特征。对于两个种A和B,当每个高变区V2–V9有一个引物对时,矩阵A给出了预期特征的实例。
矩阵A
SEQ.# V2 V3 V4 V5 V6 V7 V8 V9
A 1 0 1 1 1 0 0 1 0
A 2 0 0 0 1 0 0 1 0
A 3 0 1 1 1 0 0 1 0
B 4 0 1 1 1 0 0 1 0
对于种C和D,当多于一个引物对靶向两个高变区V2和V8时,矩阵B给出了预期特征的实例。在此实例中,三个引物对靶向高变区V2,并且三个引物对靶向高变区V8。
矩阵B
SEQ.# V2 V2 V2 V3 V4 V5 V6 V7 V8 V8 V8 V9
C 1 0 1 1 1 0 0 0 0 0 1 1 1
C 2 0 1 1 1 0 0 0 0 0 1 1 1
C 3 0 0 1 1 1 0 0 0 0 0 1 1
D 4 0 1 1 1 0 0 0 0 0 1 1 1
例如,对于GreenGenes数据库,可以确定150,000个预期特征,一个用于数据库中的每个基因序列。预期特征,如矩阵A和矩阵B中所示的实例,可用于组合16S的比对读段的计数,如关于图3所描述的。
图2是用于处理序列读段以确定微生物组成的方法的框图。序列读段是从使用16S引物池和种引物池扩增从样品中提取的核酸而产生的扩增子的测序中获得的。条形码/样品名称解析器202将序列读段分成对应于16S扩增子或16S序列读段的序列读段集,以及对应于靶标种扩增子或靶标种序列读段的序列读段集。碱基调用者可能会移除质量读段修剪和短读段。碱基调用可以通过分析任何合适的信号特性(例如,信号振幅或强度)来进行。与本发明的教导一起使用的传感器阵列、信号处理和碱基调用的结构和/或设计可以包含2013年4月11日公布的美国专利申请公开第2013/0090860号中描述的一种或多种特征,所述美国专利申请通过引用整体并入本文。例如,可以移除长度小于60个碱基或大于350个碱基的序列读段。16S序列读段可以由16S处理流水线204分析,并且靶标种序列读段可以由靶标种处理流水线206独立分析。16S处理流水线204可以提供关于在样品中检测到的种/属/科的信息以用于报告208。靶标种处理流水线206可以提供关于在样品中检测到的种的信息以用于报告210。
图3是根据一个实施例的16S读段数据处理流水线的框图。在步骤302中,由条形码/样品名称解析器202鉴定的16S序列读段在未比对的BAM文件中被接收。对16S序列读段进行两个映射步骤304和312。在第一映射步骤304中,将16S序列读段与压缩的16S参考集的参考高变节段进行比对,其中启用了多映射和端到端映射。映射步骤304和312确定比对的序列读段和相关的映射质量参数。与本发明的教导一起使用的用于比对序列读段的方法可以包含2012年8月2日公布的美国专利申请公开第2012/0197623号中描述的一种或多种特征,所述美国专利申请通过引用整体并入本文。映射的读段根据比对质量进行过滤。例如,最小局部比对分数可以设置为35。启用多重映射后,一个读段可以与多于一个参考高变节段进行比对。具有相同最佳分数的比对可以包含在后续步骤的观察到的读段计数中。
在步骤306中,根据经比对的BAM文件中的比对的读段信息形成每个种和菌株的每个靶标高变区的观察到的读段计数的矩阵,并且应用缩减读段计数矩阵的操作。例如,矩阵的维度可能为150,000x(每个基因的靶标高变区数量)。针对对应于矩阵B的实例的靶标高变区,矩阵C给出了观察到的读段计数矩阵的一部分或读段计数矩阵的实例。
矩阵C
SEQ.# V2 V2 V2 V3 V4 V5 V6 V7 V8 V8 V8 V9
C 1 5 10 200 1000 0 0 0 1 2 100 2000 400
C 2 15 20 100 1000 5 10 0 0 0 200 5000 500
在步骤306中,读段计数矩阵的第一次缩减减少了行数。可以将每行对应于高变区的读段计数相加以形成总和以及应用于总和的阈值TRS。例如,可以将行总和阈值TRS设置为500,以便消除少于500个读段的行。可以将行总和阈值TRS设置在100和1000之间的范围内。相同的行总和阈值TRS被应用于每行的总和。由于每一行对应一个种和菌株,因此消除的行对应于不再考虑的种和菌株。
在步骤306中,读段计数矩阵的第二次缩减基于从计算机模拟确定的预期特征(如在矩阵A或矩阵B的实例中给出的预期特征)组合行的读段计数。对于具有相同预期特征的种和菌株(行),将同一种的每个高变区(列)的读段计数相加,以给出对应于单个种的读段计数的列总和。例如,在矩阵B中,种C的预期特征seq.#1和seq.#2是相同的。对于种C,矩阵C给出了行总和>TRS的读段计数矩阵,seq.#1和seq.#2。种C的每个高变区(列)的读段计数seq.#1和seq.#2可能会被添加,因为它们对应于矩阵B中同一种C内的相同预期特征。请注意,种D也具有与种C的seq.#1和seq.#2相同的预期特征,但种D的读段计数不会添加到种C的读段计数,因为种不同。可以将组合的读段计数的列总和相加以形成组合总和。将阈值TCOMB应用于组合总和。如果组合总和大于TCOMB,则保留行计数矩阵的对应行,否则消除行计数矩阵的对应行,从而缩减行计数矩阵的大小。例如,组合总和的阈值TCOMB可以设置为10,000,并且可由用户配置。
将特征阈值TS应用于每个列总和,以通过在列总和≥TS时分配“1”并在列总和<TS时分配“0”来给出二进制值。生成的二进制值阵列提供了观察到的特征。例如,列总和阈值TS可以设置为10。
归约操作的示例性结果和观察到的特征在矩阵D中给出,对应于矩阵B和矩阵C的实例。在此实例中,种C的seq.#1和seq.#2被保留,因为组合总和大于10,000的组合阈值TCOMB
矩阵D
SEQ.# V2 V2 V2 V3 V4 V5 V6 V7 V8 V8 V8 V9 组合总和
C 1 5 10 200 1000 0 0 0 1 2 100 2000 400
C 2 15 20 100 1000 5 10 0 0 0 200 5000 500
列总和 20 30 300 2000 5 10 0 1 2 300 7000 900 10,568
观察到的特征 1 1 1 1 0 1 0 0 0 1 1 1
预期特征 0 1 1 1 0 0 0 0 0 1 1 1
在步骤308中,如下生成全长16S序列的第一缩减集。比较观察到的特征和对应的预期特征的二进制值(例如,来自矩阵B,种C,seq.#1和seq.#2),并确定匹配类别或匹配二进制值与总类别的比率。如果该比率满足最小阈值TR,则选择对应于给定种中的预期特征的全长16S rRNA基因序列作为全长参考序列的第一缩减集。否则,对应于给定种中的预期特征的全长16S rRNA基因序列不包含在全长参考序列的第一缩减集中。比率阈值TR可以设置为0.75,并且可以由用户配置。在矩阵D的实例中,观察到的和预期的特征的二进制值在12个总类别中的10个类别上一致,这大于总类别的0.75%(12个类别中的9个对应于75%)。选择对应于种C的seq.#1和seq.#2的全长16S rRNA基因序列作为全长参考序列的第一缩减集。
在步骤310中,可以通过基于序列相似性指标重新分配未注释的种菌株来进一步缩减全长16S rRNA基因序列的第一缩减集,以形成全长参考序列的第二缩减集。全长参考序列的第二缩减集用于第二映射步骤。将第一缩减集中未注释种的基因序列与第一缩减集中具有相同属的每个注释序列进行比较。计算未注释序列和具有相同属的每个注释序列之间的levenshtein距离。levenshtein距离是两个序列之间的差异(包含取代、插入和删除)的计数。如果第一缩减集中的未注释序列和注释序列之间的levenshtein距离小于阈值TLEV,则将注释序列鉴定为候选注释序列。例如,阈值TLEV可以设置为80。80个计数的阈值TLEV对应于1600bp的16S基因长度的5%。在一些情况下,可能存在单个候选注释序列。对于单个候选注释序列,未注释序列使用候选注释序列的注释进行重新注释。在一些情况下,可能有多个候选注释序列与给定的未注释序列相关联。当存在多个候选注释序列时,选择具有最小levenshtein距离的候选注释序列。给定的未注释序列使用与所选候选注释序列相对应的注释进行重新注释。当与给定的未注释序列相关联的多于一个候选注释序列具有相等的levenshtein距离时,像在全长参考序列的第二缩减集中那样包含给定的未注释序列。重新注释的序列由它们所匹配的注释序列表示,并且未注释的版本被移除以形成全长参考序列的第二缩减集。通过之前被移除的未注释序列的数量来缩减全长序列的第一缩减集的大小,以产生全长参考序列的第二缩减集。
全长参考序列的第二缩减集可以具有比数据库中的原始数量显著更少的全长16SrRNA序列。例如,GreenGenes数据库中的150,000个16S rRNA序列可能会减少到几千个全长序列。全长参考序列的第二缩减集的较小尺寸的优点是较小的存储器需求。另一个优点是第二映射步骤的搜索时间更快,因为与序列读段匹配的全长参考序列更少。另一个优点是重新注释的序列允许更多的种水平分辨率,因为重新注释的序列与种水平相关,而不是与未注释序列的属水平相关。在第二映射步骤中,序列读段将与指示种的重新注释的参考序列相关联。这导致更多的序列读段映射到给定的种,以提高种水平的读段深度。此外,全长参考序列的第二缩减集更有可能匹配第二映射步骤中的序列读段,因为它们是基于从第一映射步骤产生的观察到的读段计数确定的。
在第二映射步骤312中,序列读段被映射到全长16S rRNA基因序列的第二缩减集。在步骤314中,对每个序列读段一个最佳命中进行计数(即,多映射被禁用)。在第一归一化步骤316中,通过将读段计数除以预期特征中1的数量,对在第二映射步骤312之后获得的每个16S参考序列的读段计数进行归一化,以形成第一归一化计数。对于矩阵D的实例,预期特征具有六个1并对应于种C的两个16S参考序列。将对应于种C的相同预期特征的每个16S参考序列的读段计数除以六,给出对应的第一归一化计数。在第二归一化步骤318中,将第一归一化计数除以种的16S基因的平均拷贝数以形成第二归一化计数。该种的拷贝数可以从16S拷贝数数据库中获得,如rrnDB(https://rrndb.umms.med.umich.edu/;Stoddard S.F,Smith B.J.,Hein R.,Roller B.R.K.和Schmidt T.M.(2015)“rrnDB:用于解释细菌和古细菌中rRNA基因丰度的改进工具和未来发展的新基础(rrnDB:improved tools forinterpreting rRNA gene abundance in bacteria and archaea and a new foundationfor future development.)”《核酸研究(Nucleic Acids Research)》2014;doi:10.1093/nar/gku1201)。对于给定的种,可以将数据库记录中给出的16S基因的拷贝数平均,以形成用于第二归一化步骤318的平均拷贝数。第二归一化步骤318可以是任选的。
在步骤320中,针对种水平、属水平和科水平聚合或添加第二归一化计数。计算聚合计数与映射读段的总数的百分比,并且如果满足阈值标准,则可以将阈值应用于种检测、属检测和科检测以给出相对丰度。如果百分比值大于相应的阈值,则种、属和/或科可被报告为存在。例如,可以将应用的阈值设置为下表中显示的值。阈值可由用户设置。用于检测的阈值也可以被称为噪声阈值。在步骤322中,可以向用户报告种/属/科水平的相对丰度报告。
表E.实例阈值
聚合计数/总映射读段(%) 阈值
0.1%
0.5%
1.0%
上述方法可以在属水平上提供大于90%的灵敏度并在属水平上提供大于85%的PPV。阈值可用于将聚合计数/映射读段的百分比高于阈值的相应种、属或科称为存在于样品中。用户可以调整此阈值,以根据用户的应用优化灵敏度和特异性。
参考图2,来自使用种引物池产生的扩增子的读段由靶标种分析流水线206单独分析。在图4中的映射步骤404之前,微生物基因组数据库,例如NCBI公共数据库,可以被预处理以提供对应于预期扩增子的分段参考序列。在该预处理中,可以对数据库中的微生物基因组序列进行计算机PCR模拟,所述模拟使用种引物池中的引物进行,以从数据库中所有微生物菌株的全基因组生成预期的扩增子(引物+插入物)序列。计算机PCR结果鉴定数据库中含有将由种引物池中的引物扩增的序列的基因组。计算机模拟提供了与靶标种和可能的非靶种的预期扩增子相对应的分段参考序列。不包含将被种引物扩增的序列的任何基因组都从被数据库中消除。对含有将使用种引物进行扩增但预计不包含此类序列的序列的任何基因组进行评估,以确定基因组与预计通过引物扩增的基因组之间的平均核苷酸同一性(ANI)以评估可能的基因组错误分类和重新注释,以及基因组在数据库中的保留。对于可能被错误分类的基因组,创建了具有已知菌株的身份直方图。只有当一个基因组与其被重新分类的已知基因组具有大于95%的同一性时,它才会被重新分类。对于给定的引物集,分段参考序列可以生成一次,并应用于多个实验。在映射步骤中,可以使用分段参考序列代替种的全长参考基因组。靶标种的压缩参考数据库包含每个菌株(包含任何重新注释的菌株)的分段参考序列。例如,菌株的分段参考序列可以包含1到8个节段,并且每个节段可以包含6到300个碱基,从而给出最多几千个碱基的总数。例如,大肠杆菌菌株的全长参考基因组可能包含4.6到5.3M碱基。
图4是根据一个实施例的靶标种处理流水线的框图。在步骤402中,由条形码/样品名称解析器202鉴定的靶标种序列读段在未比对的BAM文件中被接收。在参考数据库的预处理之后,在映射步骤404中,靶标种序列读段被映射到压缩的靶标种参考中的种和菌株的分段参考序列,其中启用了端到端映射。映射的读段根据比对质量进行过滤。例如,最小局部比对分数可以设置为25。在步骤406中,唯一映射到单个种(或者唯一映射到种的单个菌株的一个分段参考序列或同一种的多个菌株的多个分段参考序列)的那些读段包含在读段计数中。矩阵E给出映射到种A、B和C的菌株的读段W、X、Y和Z的实例。
矩阵E
SEQ.# 读段W 读段X 读段Y 读段Z
A 1 映射的
A 2 映射的 映射的
B 1 映射的
B 2 映射的
C 1 映射的
C 2 映射的
在矩阵E的实例中,读段W、Y和Z将包含在读段计数中,并且读段X将不被包含在读段计数中。读段W和Y映射到分别对应于同一种A和C的两个菌株的分段参考序列。读段Z映射到种B菌株的分段参考序列的单个菌株。读段X映射到种A菌株并且也映射到种B菌株,因此不会被计数。
在步骤408中,计算映射到种(包含种的菌株)的分段参考序列的序列读段的数量以形成每个种的聚合读段计数。在步骤410中,将每个种的聚合读段计数通过该种的扩增性扩增子的数量进行归一化。扩增性扩增子具有最少数量的映射读段。例如,映射读段的最小数量可以设置为10。将每个种的聚合读段计数除以该种的总扩增性扩增子的数量,给出每个种的归一化读段计数。将所有种的归一化读段计数相加以形成归一化读段计数的总和。将每个种的归一化读段计数除以归一化读段计数的总和,以形成归一化读段计数的比率。可以将种的归一化读段计数的比率与阈值T进行比较,以确定样品中是否存在种。例如,阈值T可以设置为0.1%,并且如果归一化读段计数的比率大于0.1%,则可以确定种存在。阈值T可由用户设置。在步骤412中,可以将每个种的归一化读段计数和检测到的种的结果报告给用户。
用于检测、诊断、预防和/或治疗微生物失衡的方法
本文还提供了用于受试者中的微生物(例如,细菌)失衡和/或生态失调以及与之相关的病状、病症和疾病的检测、诊断、预防和/或治疗、症状减轻和/或预防的方法。在一些实施例中,受试者是动物,例如昆虫或哺乳动物,如家养或农业哺乳动物或人。在一些情况下,所述微生物失衡和/或生态失调在所述受试者的消化道或胃肠道(通常被称为“肠道微生物群”)中。肠道微生物群包含与受试者具有共生关系的多种细菌群体。肠道微生物群中的大多数细菌来自七个门:厚壁菌门、拟杆菌门、变形菌门、梭杆菌门、疣微菌门、蓝细菌和放线菌门,其中超过90%的人类肠道微生物群来自厚壁菌门和拟杆菌门。肠道微生物群的组成与动物受试者的许多病状以及健康或疾病状态相关和/或在其中发挥作用,并导致病症的发展,所述病症包含例如肠易激综合征(IBS)、炎症性肠病(IBD)和肥胖症,以及乳糜泻、狼疮和类风湿性关节炎(RA)等自身免疫性病症。此外,肠道微生物组的组成可能会影响对肿瘤病状(如癌症)的易感性以及对癌症疗法的反应性。例如,肠道微生物组的组成被认为是癌症免疫疗法的生物标志物,包含例如免疫检查点抑制剂。本文提供的用于检测、诊断、预防和/或治疗与微生物失衡和/或生态失调有关的病状的方法可以包含检测、测量、表征、剖析、评估和/或监测受试者的微生物群的细菌组成。在一些实施例中,本文提供的用于检测、诊断、预防和/或治疗病状的方法基于检测、测量、表征、剖析、评估和/或监测与影响动物健康和对疗法的反应性的病状、疾病和病症相关的消化道微生物群的细菌组成。
在一些实施例中,本文提供的检测和/或诊断受试者中微生物失衡或生态失调的方法包含:扩增受试者样品中的或来自受试者样品的核酸;获得核酸扩增产物的序列信息;以及,任选地确定核酸扩增产物的水平;通过鉴定样品中微生物的属,以及任选地其相对水平,以及样品中一种或多种微生物的种来确定样品的微生物组成;将样品的微生物组成与参考微生物组成进行比较;并且如果样品中一种或多种微生物的水平与参考微生物组成中的微生物水平不同、参考组成中的一种或多种微生物不存在于样品中和/或样品中存在的一种或多种微生物不存在于参考微生物组成中,则检测受试者中的微生物失衡。在所述方法的一些实施例中,来自受试者的样品是来自受试者消化道的样品,例如,粪便样品。在一些实施例中,参考微生物组成包括具有正常生物受试者的微生物群特性(细菌的代表性类型和相对水平)的细菌群体。正常生物受试者是健康的并且没有微生物(例如,细菌)失衡,因此处于与生态失调相反的正常生物状态。通常,在正常生物状态下,具有潜在健康益处的微生物在数量上超过微生物群中潜在的有害微生物。当不处于失衡或生态失调状态时,或当处于没有与失衡或生态失调相关的不健康状态的病症、疾病、病状和/或症状的健康状态时,受试者的微生物群中的一种或多种微生物的失衡也可能与同一受试者的参考微生物群中的微生物组成有关。受试者微生物群中的一种或多种微生物的失衡可以与微生物的平均水平有关,所述微生物通常存在于不处于失衡或生态失调状态的任何受试者或处于没有与失衡或生态失调相关的不健康状态的病症、疾病、病状和/或症状的健康状态的任何受试者中。受试者微生物群中细菌组成的类型和相对水平与正常生物受试者细菌群体的类型和相对水平的显著偏差表明生态失调。此外,具有微生物失衡的受试者的微生物群(即,受试者的微生物群谱)中不同类型细菌的组成及其水平可以指示对特定病状、病症或疾病的易感性或其发生率。因此,将具有微生物失衡的受试者的微生物群中的细菌组成及其相对水平与某些病症和疾病的微生物群谱特性进行比较可以作为诊断受试者的相关病症或疾病的考虑因素。例如,可能导致肠易激综合征(IBS)中肠道微生物群生态失调的细菌包含厚壁菌门、变形菌门(志贺氏菌(Shigella)和埃希氏菌(Escherichia))、放线菌和活泼瘤胃球菌,而可能导致炎症性肠病(IBD)中肠道微生物群生态失调的细菌包含变形菌门(志贺氏菌和埃希氏菌)、厚壁菌门(具体地说,普氏栖粪杆菌)和拟杆菌门(副拟杆菌和普氏菌)(参见例如,Casen等人(2015)《营养药理学与治疗学(Aliment Pharmacol Ther)》42:71-83)。通常,IBD中发生的肠道微生物群多样性的减少包含促炎细菌(例如,肠杆菌(Enterobacteriaceae)和梭杆菌(Fusobacteriaceae))的扩增和具有抗炎性质的门(例如,厚壁菌门)的缩减。在另一个实例中,与健康对照相比,原发性肝细胞癌的肠道微生物群中的脱硫球菌(Desulfococcus)、肠杆菌(Enterobacter)、普氏菌和韦荣氏球菌可能会增加(参见例如,Ni等人(2019)《微生物学前沿(Front Microbiol)》第10卷第1458条)。在本文提供的检测和/或诊断受试者中的微生物失衡或生态失调的方法的一些实施例中,如果一种或多种微生物的水平(相对和/或绝对)与参考微生物组成中一种或多种微生物的水平不同,则检测到受试者中的微生物失衡。在一些实施例中,如果参考组成中的一种或多种微生物不存在于样品中,和/或样品中存在的一种或多种微生物不存在于参考微生物组成中,则检测到受试者中的微生物失衡。在一些实施例中,通过对从样品中的核酸扩增的核酸产物的序列读段进行计数并如本文所述将序列读段计数归一化来确定受试者的样品中一种或多种微生物的相对水平。
本文还提供了治疗受试者中微生物失衡或生态失调的方法。在治疗具有微生物失衡或生态失调的受试者的一些实施例中,治疗具有不成比例水平的一种或多种微生物的受试者以在所述受试者中建立微生物或生命现象(biosis)的平衡。在一些实施例中,本文提供的治疗具有微生物失衡或生态失调的受试者的方法包含:扩增受试者样品中的或来自受试者样品的核酸;获得核酸扩增产物的序列信息;以及,任选地确定核酸扩增产物的水平;通过鉴定样品中微生物的属,以及任选地其相对水平,以及样品中一种或多种微生物的种来确定样品的微生物组成;检测受试者中微生物的失衡;并治疗受试者以在所述受试者中建立微生物或生命现象(或正常生物)的平衡。在所述方法的一些实施例中,来自受试者的样品是来自受试者消化道的样品,例如,粪便样品。在一些实施例中,检测微生物的失衡包含将样品的微生物组成与参考微生物组成进行比较,并且如果样品中一种或多种微生物的水平与参考微生物组成中微生物的水平不同、参考组成中的一种或多种微生物不存在于样品中和/或样品中存在的一种或多种微生物不存在于参考微生物组成中,则检测到受试者中的微生物失衡。在一些实施例中,治疗受试者以在受试者中建立微生物平衡包含但不限于:向受试者施用微生物,例如细菌,其在微生物群中的代表性不足或不存在;创造不利于微生物群中过多的微生物存活或生长的条件;和/或创造有利于微生物群中代表性不足或不存在的微生物的存活或生长的条件。例如,在微生物失衡或消化道微生物群生态失调的情况下,向受试者施用细菌可以包含摄入益生菌,所述益生菌是通常在食物中递送的活微生物。将细菌施用于受试者的另一种技术是通常通过经结肠镜输注对来自健康供体的细菌群进行粪便微生物移植,以取代受试者的失衡微生物群(参见例如,van Nood等人(2014)《肠胃病学当前观点(Curr Opin Gastroenterol)》30(1):34-39)。在受试者的微生物群中创造有利于微生物存活和/或生长的条件包含例如施用益生元。益生元是通常作为食品成分或补充剂递送的组合物,其选择性地刺激一种微生物或一组选定微生物的生长和/或活性,所述益生元包含例如菊粉型果聚糖(ITF)和低聚半乳糖(GOS)。如ITF和GOS等益生元已被证明对双歧杆菌和乳酸杆菌具有促进生长的作用。在受试者的微生物群中创造不利于微生物存活和/或生长的条件包含例如施用抗生素,例如利福昔明(rifaximin),以及改变饮食以消除或减少有利于某些微生物生长的组合物的摄入,如硫酸盐、动物蛋白和精制糖。可用于建立生命现象或肠道微生物稳态的任何这些和其它可能的干预(参见例如,Bull和Plummer(2015)《结合医学(Integrative Medicine)》14(1):25-33)可用于在本文所述的方法中治疗受试者。
在本文提供的用于受试者中的微生物(例如,细菌)失衡和/或生态失调以及与之相关的病状、病症和疾病的检测、诊断、预防和/或治疗、症状减轻和/或预防的方法的一些实施例中,扩增受试者样品中的或来自受试者样品的核酸的步骤包含(a)使用引物对的组合对受试者样品中的或来自受试者样品的核酸进行核酸扩增,所述引物对的组合包括:(i)能够扩增原核16S rRNA基因的一个或多个高变区的核酸序列的一个或多个引物对(被称为“16S rRNA基因引物或引物对”);以及(ii)能够扩增微生物的基因组内含有的靶核酸序列的一个或多个引物对,所述靶核酸序列不包含在原核16S rRNA基因的高变区内,其中不同的引物对扩增不同基因组内含有的不同靶核酸序列(被称为“非16S rRNA基因引物或引物对”)。在一些实施例中,从经扩增的核酸产物中获得序列信息包括从通过(i)和(ii)的引物对的组合扩增的核酸产物中获得序列信息,以及任选地确定由(i)的一个或多个引物对扩增的核酸产物的水平。在一些实施例中,所述方法包含确定由(i)即16S rRNA基因引物对和/或(ii)即非16S rRNA基因引物对中的一个或多个引物对扩增的核酸产物的水平(例如相对和/或绝对水平),或其序列读段。在一些实施例中,扩增受试者样品中的或来自受试者样品的核酸的步骤包含(a)使用用于一个核酸扩增反应的第一引物对集和用于另一个核酸扩增反应的第二引物对集对核酸进行两个或更多个单独的核酸扩增反应,其中(i)第一引物对集包括扩增原核16S rRNA基因的一个或多个高变区的核酸序列的一个或多个引物对(被称为“16S rRNA基因引物或引物对”),并且(ii)第二引物对集包括扩增微生物的基因组内含有的靶核酸序列的一个或多个引物对,所述靶核酸序列不包含在原核16S rRNA基因的高变区内,其中不同的引物对扩增不同基因组内含有的不同靶核酸序列(被称为“非16SrRNA基因引物或引物对”),并且获得序列信息包括从通过(i)和(ii)的引物对扩增的核酸产物中获得序列信息。在一些实施例中,所述方法包含确定由(i)和/或(ii)中的一个或多个引物对扩增的核酸产物的水平(例如相对和/或绝对水平),或其序列读段。
在本文提供的用于受试者中的微生物(例如,细菌)失衡和/或生态失调以及与之相关的病状、病症和疾病的检测、诊断、预防和/或治疗、症状减轻和/或预防的方法的任何实施例中,所述方法可以包含如本文所述的用于检测和/或测量样品中是否存在一种或多种微生物的方法的任何实施例。例如,在一些实施例中,微生物是细菌。在一些实施例中,原核16S rRNA基因是细菌基因和/或微生物是细菌。在一些实施例中,包含在微生物(例如,细菌)的基因组内的靶核酸序列是微生物所独有的。在一些实施例中,一个或多个16S rRNA基因引物对扩增来自不同属的多种微生物(例如,细菌)中的核酸序列。在一些实施例中,样品是动物消化道内容物的样品。在一些实施例中,样品是粪便样品。
在本文提供的用于受试者中的微生物(例如,细菌)失衡和/或生态失调以及与之相关的病状、病症和疾病的检测、诊断、预防和/或治疗、症状减轻和/或预防的方法的任何实施例中,可以根据本文提供的用于此类扩增的任何实施例进行核酸扩增。例如,在一些实施例中,扩增含有原核16S rRNA基因的高变区序列的核酸的一个或多个引物对单独地扩增含有不同高变区的序列的核酸。在一些实施例中,一个或多个16S rRNA基因引物对中的引物针对包含在原核16S rRNA基因的保守区中的核酸序列,或与所述核酸序列结合或杂交。在一些实施例中,一个或多个16S rRNA基因引物对和/或非16S rRNA基因引物对包括多个引物对。例如,一个或多个16S rRNA基因引物对可以包括扩增原核16S rRNA基因的多个高变区的核酸序列的多个引物对,和/或一个或多个非16S rRNA基因引物对可以包括扩增包含在多种不同微生物的基因组中的不同靶核酸序列的多个引物对。在一些实施例中,扩增或两个或更多个单独的核酸扩增反应是在单个反应混合物中进行的多重扩增。在一些实施例中,一个或多个16S rRNA基因引物对中的每个引物含有少于10个、少于9个、少于8个、少于7个、少于6个、少于5个、少于4个、少于3个或少于2个连续核苷酸,其序列与引物对组合中另一引物的连续核苷酸序列相同。在一些实施例中,由一个或多个16S rRNA基因引物对扩增的核酸序列的长度小于约300bp、小于约250bp、小于约200bp、小于约175bp、小于约150bp或小于约125bp。在一些实施例中,16S rRNA基因引物对单独地扩增分别含有原核16S rRNA基因的3个或更多个、4个或更多个、5个或更多个、6个或更多个、7个或更多个、8个或更多个或9个不同高变区的序列的核酸,从而产生含有一种或多种微生物的16S rRNA基因的3个或更多个、4个或更多个、5个或更多个、6个或更多个、7个或更多个、8个或更多个或9个不同高变区的序列的核酸的扩增拷贝,其中不同高变区的扩增拷贝是单独的扩增子。在一些实施例中,16S rRNA基因引物对单独地扩增含有原核16S rRNA基因的8个不同高变区的序列的核酸。在一些实施例中,8个不同的高变区是V2-V9。在一些实施例中,16S rRNA基因引物对单独地扩增含有原核16S rRNA基因的3个或更多个高变区的序列的核酸,其中3个或更多个不同区域之一是V5区,从而产生含有一种或多种微生物的16S rRNA基因的3个或更多个高变区的序列的核酸的扩增拷贝。在一些实施例中,引物对的组合包含一个或多个引物对中的一个或多个引物的简并序列。在一些实施例中,16S rRNA基因引物对包括引物和/或引物对,所述引物和/或引物对含有以下各项或基本上由以下各项组成:表15中的引物或引物对的一个或多个序列;或表15中的SEQ ID NO:1-24和/或表15中的SEQ ID NO:25-48;或表15中的SEQ ID NO:11-16、23和24和/或表15中的SEQ ID NO:35-40、47和48,或基本上相同或相似的序列,并且任选地其中一个或多个胸腺嘧啶碱基被尿嘧啶碱基取代。
在本文提供的用于受试者中的微生物(例如,细菌)失衡和/或生态失调以及与之相关的病状、病症和疾病的检测、诊断、预防和/或治疗、症状减轻和/或预防的方法的一些实施例中,所述一个或多个非16S rRNA基因引物对特异性地扩增包含在选自表1(或表1,除了或不包含粘性放线菌和/或类球布劳特氏菌;或表1,除了或不包含粘性放线菌、类球布劳特氏菌和/或扎氏螺杆菌)微生物的微生物的基因组内的靶核酸序列。在一些实施例中,靶核酸是微生物所独有的。在一些此类实施例中,产生了来自表1(或表1,除了或不包含粘性放线菌和/或类球布劳特氏菌;或表1,除了或不包含粘性放线菌、类球布劳特氏菌和/或扎氏螺杆菌)中多种不同微生物的核酸的扩增拷贝。在一些实施例中,至少一个,或一个或多个靶核酸序列包括选自以下的核苷酸序列或基本上由选自以下的核苷酸序列组成:表17中的SEQ ID NO:1605-1979、或表17的SEQ ID NO:1605-1806、1809-1816、1821-1970、1972-1974和1977-1979、或表17中的SEQ ID NO:1605-1826、或表17中的SEQ ID NO:1605-1806、1809-1816和1821-1826、或表17A中的SEQ ID NO:1605-1820、或表17A中的SEQ ID NO:1605-1806和1809-1816、或表17C中的SEQ ID NO:1827-1979、或表17C中的SEQ ID NO:1827-1976的核苷酸序列,或基本上相同或相似的序列,或其补体。在一些实施例中,至少一个,或一个或多个靶核酸序列包括选自以下序列的核苷酸序列:表17中的SEQ ID NO:1605-1979、或表17的SEQ ID NO:1605-1806、1809-1816、1821-1970、1972-1974和1977-1979、或表17中的SEQ ID NO:1605-1826、或表17中的SEQ ID NO:1605-1806、1809-1816和1821-1826、或表17A中的SEQ ID NO:1605-1820、或表17A中的SEQ ID NO:1605-1806和1809-1816、或表17C中的SEQ ID NO:1827-1979、或表17C中的SEQ ID NO:1827-1976或基本上相同或相似的序列或其补体,并且长度小于约500个、小于约475个、小于约450个、小于约400个、小于约375个、小于约350个、小于约300个、小于约275个、小于约250个、小于约200个、小于约175个、小于约150个或小于约100个核苷酸。在一些实施例中,至少一个,或一个或多个核酸扩增产物包括选自表17中的SEQ ID NO:1605-1979、或表17的SEQ ID NO:1605-1806、1809-1816、1821-1970、1972-1974和1977-1979、或表17中的SEQ ID NO:1605-1826、或表17中的SEQ ID NO:1605-1806、1809-1816和1821-1826、或表17A中的SEQ ID NO:1605-1820、或表17A中的SEQ ID NO:1605-1806和1809-1816、或表17C中的SEQ ID NO:1827-1979、或表17C中的SEQ ID NO:1827-1976或基本上相同或相似的序列或其补体并且任选地在序列的5'和/或3'端具有一个或多个引物序列(如本文提供的任何引物序列)的核苷酸序列,或基本上由所述核苷酸序列组成,并且长度小于约500个、小于约475个、小于约450个、小于约400个、小于约375个、小于约350个、小于约300个、小于约275个、小于约250个、小于约200个、小于约175个、小于约150个或小于约100个核苷酸。在一些实施例中,至少一个非16SrRNA基因引物对不会可检测地扩增包含在除含有靶核酸序列的微生物属之外的任何属内的核酸序列。在一些实施例中,至少一个非16S rRNA基因引物对不会可检测地扩增包含在除含有靶核酸序列的微生物种之外的任何种内的核酸序列。在一些实施例中,非16S rRNA基因引物对中的至少一个引物,或至少一个非16S rRNA基因引物对,含有以下各项或基本上由以下各项组成:表16中的引物或引物对的一个或多个序列;或表16的SEQ ID NO:49-520;或表16的SEQ ID NO:49-452、457-472和481-520;或表16的SEQ ID NO:49-492;或表16的SEQ ID NO:49-452、457-472和481-492;或表16A的SEQ ID NO:49-480;或表16A的SEQ IDNO:49-452和457-472;或表16C的SEQ ID NO:521-826;或表16C的SEQ ID NO:521-820;或表16的SEQ ID NO:827-1298;或表16的SEQ ID NO:827-1230、1235-1250和1259-1298;或表16的SEQ ID NO:827-1270;或表16的SEQ ID NO:827-1230、1235-1250和1259-1270;或表16D的SEQ ID NO:827-1258;或表16D的SEQ ID NO:827-1230和1235-1250;或表16F的SEQ IDNO:1299-1604;或表16F的SEQ ID NO:1299-1598,或基本上相同或相似的序列,或任何上述核酸或引物对的核苷酸序列,其中一个或多个胸腺嘧啶碱基被尿嘧啶碱基取代。在一些实施例中,使用多个非16S rRNA基因引物或引物对对核酸进行核酸扩增,所述多个引物或引物对各自含有以下各项或基本上由以下各项组成:表16中的引物对的一个或多个序列;或表16的SEQ ID NO:49-520;或表16的SEQ ID NO:49-452、457-472和481-520;或表16的SEQID NO:49-492;或表16的SEQ ID NO:49-452、457-472和481-492;或表16A的SEQ ID NO:49-480;或表16A的SEQ ID NO:49-452和457-472;或表16C的SEQ ID NO:521-826;或表16C的SEQ ID NO:521-820;或表16的SEQ ID NO:827-1298;或表16的SEQ ID NO:827-1230、1235-1250和1259-1298;或表16的SEQ ID NO:827-1270;或表16的SEQ ID NO:827-1230、1235-1250和1259-1270;或表16D的SEQ ID NO:827-1258;或表16D的SEQ ID NO:827-1230和1235-1250;或表16F的SEQ ID NO:1299-1604;或表16F的SEQ ID NO:1299-1598;或基本上相同或相似的序列,或任何上述核酸或引物对的核苷酸序列,其中一个或多个胸腺嘧啶碱基被尿嘧啶碱基取代。在一些实施例中,引物对组合中的至少一个引物或一个引物对包含促进核酸操作、扩增、连接和/或扩增产物测序和/或减少或消除引物二聚体的修饰。在特定实施例中,修饰是促进多重核酸扩增、连接和/或多重扩增产物测序的修饰。
在本文提供的用于受试者中的微生物(例如,细菌)失衡和/或生态失调以及与之相关的病状、病症和疾病的检测、诊断、预防和/或治疗、症状减轻和/或预防的方法的一些实施例中,所述方法被设计成关注样品中微生物群体的构成或组成,特别是关于某些微生物群组,并且在一些实施例中,组和/或组成员在群体中的成比例存在。在此类实施例中,引物和/或引物对的组合包含微生物特异性核酸的选定组或亚组,并且包含界涵盖核酸(例如,16S rRNA基因引物和引物对),并且能够专注于一种或多种特定的目标微生物,这些微生物在某些健康和疾病状态或微生物群失衡中可能很重要。在一些实施例中,核酸的组合包含微生物特异性核酸和/或引物对,其特异性地扩增包含在一种或多种微生物(例如,细菌)的基因组中的核酸序列,所述一种或多种微生物与一种或多种病状、病症和/或疾病有关。在特定实施例中,核酸引物和/或引物对的组合特异性地扩增包含在选自表1中微生物的微生物的基因组内的靶核酸序列的核酸和/或引物对。在一些实施例中,所述组合包含多个核酸和/或引物对,所述多个核酸和/或引物对包含特异性地扩增表1(或表1,除了或不包含粘性放线菌和/或类球布劳特氏菌;或表1,除了或不包含粘性放线菌、类球布劳特氏菌和/或扎氏螺杆菌)中每种微生物中的靶核酸的至少一个核酸引物对。在一些实施例中,多个引物对包含特异性地扩增包含在表1(或表1,除了或不包含粘性放线菌和/或类球布劳特氏菌;或表1,除了或不包含粘性放线菌、类球布劳特氏菌和/或扎氏螺杆菌)中至少5种、10种、15种、20种、25种、30种、35种、40种、45种、50种、55种、60种或70种微生物内的基因组靶核酸的引物对。在特定实施例中,包含在不同微生物基因组中的靶核酸序列是每种微生物所独有的。在一些实施例中,核酸和/或核酸引物对的组合包含两个或更多个核酸和/或核酸引物对,其特异性地扩增包含在一种或多种A组微生物、B组微生物、C组微生物、不包含扎氏螺杆菌的C组微生物(C组的亚组1)、D组微生物或E组微生物(参见表2)的基因组中的独特核酸序列。在一些实施例中,核酸和/或核酸引物对的组合包含核酸引物对集,其中每个不同的核酸引物对特异性地扩增包含在A组、B组、C组、C组的亚组1(不包含扎氏螺杆菌的C组微生物)、D组或E组中不同微生物的每个基因组的不同基因组中的不同独特核酸序列。
在本文提供的用于受试者中的微生物(例如,细菌)失衡和/或生态失调以及与之相关的病状、病症和疾病的检测、诊断、预防和/或治疗、症状减轻和/或预防的方法的一些实施例中,所述方法涉及利用扩增产物的核苷酸序列信息。此类实施例包含从通过所述方法中采用的引物对的组合扩增的核酸产物中获得序列信息。序列信息的实例在本文中提供并且包含但不限于:扩增产物的连续多核苷酸序列(核苷酸序列确定)中的核苷酸的身份及其顺序(其可以包含例如条形码序列,例如,对应于扩增子文库来源、所使用的引物等)、核苷酸序列与参考序列的比对和/或映射(以及参考序列的属或种的身份)、映射到参考序列和/或其部分(例如,16S rRNA基因的高变区)的序列读段的数量、唯一映射到参考序列的序列读段的数量,以及序列读段映射到的参考序列的区域(例如,靶序列)的数量。本文提供了用于比对和/或映射扩增产物的序列读段核酸测序和核苷酸序列分析工作流程的示例性方法。在一些实施例中,序列信息提供微生物的身份(例如,属、种)和/或群体中不同微生物的数量,其用于确定样品的微生物组成。在一些实施例中,如本文所述,序列信息提供了群体中微生物水平(例如,相对和/或绝对水平)的度量(群体中的丰度和成比例的贡献或存在),其也可用于确定样品的微生物组成。
本文还提供了用于用免疫疗法治疗受试者的方法。肠道微生物组的组成被认为是癌症免疫疗法的生物标志物,包含例如免疫检查点抑制剂和CpG-寡核苷酸(CpG-ODN)免疫疗法。CpG-寡核苷酸是含有未甲基化的胞嘧啶-鸟嘌呤基序的短单链DNA分子,其作为疫苗佐剂促进抗原特异性免疫反应,如肿瘤抗原特异性细胞毒性T淋巴细胞活化和累积。免疫检查点抑制剂是靶向和抑制免疫细胞(例如,T细胞)的检查点通路的癌症治疗剂,所述免疫细胞参与免疫抑制,具体地说,抗肿瘤免疫反应的抑制。检查点通路蛋白的实例包含但不限于PD-1、PD-L1和CTLA-4。检查点抑制剂包含与这些蛋白质结合的治疗剂,如针对蛋白质的单克隆抗体,并破坏或阻止蛋白质与其它蛋白质的相互作用。肠道微生物组的组成已被证明与对免疫检查点抑制剂(参见例如,Gong等人(2019)《临床与转化医学(Clin Trans Med)》8:9;https://doi.org/10.1186/s40169-019-0225-x)和CpG-寡核苷酸(CpG-ODN)免疫疗法(参见例如,Lida等人(2013)《科学(Science)》342(6161):967-970)的反应相关,因此是对此类免疫疗法的反应的潜在预测因子。与检查点抑制剂反应相关的特定种包含例如不明显另枝菌(Alistipes indistinctus)、阴道厌氧球菌、嗜黏蛋白阿克曼菌、极小奇异菌、粪拟杆菌(Bacteroides caccae)、脆弱粪拟杆菌、诺迪拟杆菌、多形拟杆菌、普通拟杆菌、青春双歧杆菌、短双岐杆菌(Bifidobacterium breve)、长双歧杆菌、卵形布劳特氏菌、洋葱伯克霍尔德菌(Burkholderia cepacia)、波氏克洛杆菌、产气柯林斯菌、粪便柯林斯菌、阿拉斯加脱硫弧菌、产甲酸多尔氏菌、粪肠球菌、海氏肠球菌、真杆菌、普氏栖粪杆菌、阴道加特纳菌、甲酸芽殖菌、丝状霍尔德曼氏菌、肺炎克雷伯氏菌、乳杆菌、屎副拟杆菌、狄氏副拟杆菌、粪考拉杆菌、栖组织普氏菌、肠道罗斯氏菌、布氏瘤胃球菌、弱生斯莱克氏菌、婴儿链球菌、副血链球菌(Streptococcus parasanguinis)和小韦荣氏球菌。例如,与CTLA-4抑制剂对检查点抑制的反应呈正相关的特定微生物包含拟杆菌和伯克霍尔德氏菌。在另一个实例中,与PD-L1和PD-1相互作用抑制剂对检查点抑制的反应呈正相关的特定微生物包含双歧杆菌、粪杆菌和瘤胃球菌科(具体地说,针对靶向PD-L1的抑制剂),以及嗜黏蛋白阿克曼菌、不明显另枝菌和海氏肠球菌(具体地说,针对靶向PD-1的抑制剂)。与PD-1和/或CTLA-4抑制剂对检查点抑制的反应呈负相关的微生物包含拟杆菌目(包含拟杆菌,例如,多形拟杆菌)、大肠杆菌、人结肠厌氧棍状菌(Anaerotruncus colihominis)和肠道罗斯氏菌。
在一些实施例中,用于用本文提供的免疫疗法治疗受试者的方法包含:扩增受试者样品中的或来自受试者样品的核酸;获得核酸扩增产物的序列信息;鉴定样品中微生物的属和样品中一种或多种微生物的种;并用免疫疗法或组合物治疗受试者,所述免疫疗法或组合物增加或减少样品中一种或多种微生物的水平。在一些实施例中,如果样品包含与对基于免疫检查点抑制的免疫疗法的反应呈正相关的一种或多种微生物和/或排除或具有足够低水平的与对基于免疫检查点抑制的免疫疗法的反应呈负相关的一种或多种微生物,则用基于免疫检查点抑制的免疫疗法治疗受试者。与对基于免疫检查点抑制的免疫疗法的反应呈负相关的微生物的足够低水平是不会基本上或显著干扰或降低对基于免疫检查点抑制的免疫疗法的反应的水平。在一些实施例中,如果样品缺乏一种或多种此类微生物或其足够水平,则用增加与对基于免疫检查点抑制的免疫疗法的反应呈正相关的一种或多种微生物的水平的组合物治疗受试者,和/或如果样品含有一种或多种此类微生物或其过高水平,则用消除或降低与对基于免疫检查点抑制的免疫疗法的反应呈负相关的一种或多种微生物的水平的组合物治疗受试者,并且随后或同时用基于免疫检查点抑制的免疫疗法进行治疗。与对基于免疫检查点抑制的免疫疗法的反应呈正相关的微生物水平不足是不足以提供对免疫疗法的反应的水平。与对基于免疫检查点抑制的免疫疗法的反应呈负相关的微生物的过高水平是基本上或显著干扰或降低对基于免疫检查点抑制的免疫疗法的反应的水平。在一些实施例中,基于免疫检查点抑制的免疫疗法是破坏或防止检查点抑制剂通路蛋白相互作用的组合物,所述检查点抑制剂通路蛋白包含例如但不限于PD-1、PD-L1和/或CTLA-4。在一些实施例中,基于免疫检查点抑制的免疫疗法包含针对检查点抑制剂通路蛋白的抗体,如单克隆抗体。在所述方法的一些实施例中,来自受试者的样品是来自受试者消化道的样品,例如,粪便样品。在一些实施例中,所述方法进一步包括通过对从样品中的核酸扩增的核酸产物的序列读段进行计数并如本文所述将序列读段计数归一化来确定受试者的样品中一种或多种微生物的相对水平。
在本文提供的用于用免疫疗法治疗受试者的方法的一些实施例中,扩增受试者样品中的或来自受试者样品的核酸的步骤包含(a)使用引物对的组合对受试者样品中的或来自受试者样品的核酸进行核酸扩增,所述引物对的组合包括:(i)能够扩增含有原核16SrRNA基因的一个或多个高变区序列的核酸的一个或多个引物对(被称为“16S rRNA基因引物或引物对”);以及(ii)能够扩增微生物的基因组内含有的靶核酸序列的一个或多个引物对,所述靶核酸序列不包含在原核16S rRNA基因的高变区内,其中所述微生物是与对基于免疫检查点抑制的免疫疗法的反应呈正相关或负相关的微生物(被称为“非16S rRNA基因引物或引物对”)。在一些实施例中,在所述方法中从经扩增的核酸产物中获得序列信息包括从通过(i)和(ii)的引物对的组合扩增的核酸产物中获得序列信息,以及任选地确定由(i)的一个或多个引物对扩增的核酸产物的水平。在一些实施例中,所述方法包含确定由(i)即16S rRNA基因引物对和/或(ii)即非16S rRNA基因引物对中的一个或多个引物对扩增的核酸产物的水平(例如相对和/或绝对水平),或其序列读段。在一些实施例中,扩增受试者样品中的或来自受试者样品的核酸的步骤包含(a)使用用于一个核酸扩增反应的第一引物对集和用于另一个核酸扩增反应的第二引物对集对核酸进行两个或更多个单独的核酸扩增反应,其中(i)第一引物对集包括扩增含有原核16S rRNA基因的一个或多个高变区序列的核酸的一个或多个引物对(被称为“16S rRNA基因引物或引物对”),并且(ii)第二引物对集包括扩增微生物的基因组内含有的靶核酸序列的一个或多个引物对,所述靶核酸序列不包含在原核16S rRNA基因的高变区内,其中所述微生物是与对基于免疫检查点抑制的免疫疗法的反应呈正相关或负相关的微生物(被称为“非16S rRNA基因引物或引物对”),并且获得序列信息包括从通过(i)和(ii)的引物对扩增的核酸产物中获得序列信息。在一些实施例中,所述方法包含确定由(i)和/或(ii)中的一个或多个引物对扩增的核酸产物的水平(例如相对和/或绝对水平),或其序列读段。
在本文提供的用于用免疫疗法治疗受试者的方法的一些实施例中,所述方法可以包含如本文所述的用于检测和/或测量样品中是否存在一种或多种微生物的方法的任何实施例。例如,在一些实施例中,微生物是细菌。在一些实施例中,原核16S rRNA基因是细菌基因和/或微生物是细菌。在一些实施例中,包含在微生物(例如,细菌)的基因组内的靶核酸序列是微生物所独有的。在一些实施例中,一个或多个16S rRNA基因引物对扩增来自不同属的多种微生物(例如,细菌)中的核酸序列。在一些实施例中,样品是动物消化道内容物的样品。在一些实施例中,样品是粪便样品。
在本文提供的用于用免疫疗法治疗受试者的方法的一些实施例中,可以根据本文提供的用于此类扩增的任何实施例进行核酸扩增。例如,在一些实施例中,扩增含有原核16S rRNA基因的高变区序列的核酸的一个或多个引物对单独地扩增含有不同高变区的序列的核酸。在一些实施例中,一个或多个16S rRNA基因引物对中的引物针对包含在原核16SrRNA基因的保守区中的核酸序列,或与所述核酸序列结合或杂交。在一些实施例中,一个或多个16S rRNA基因引物对和/或非16S rRNA基因引物对包括多个引物对。例如,一个或多个16S rRNA基因引物对可以包括扩增原核16S rRNA基因的多个高变区的核酸序列的多个引物对,和/或一个或多个非16S rRNA基因引物对可以包括扩增包含在多种不同微生物的基因组中的不同靶核酸序列的多个引物对。在一些实施例中,扩增或两个或更多个单独的核酸扩增反应是在单个反应混合物中进行的多重扩增。在一些实施例中,一个或多个16SrRNA基因引物对中的每个引物含有少于10个、少于9个、少于8个、少于7个、少于6个、少于5个、少于4个、少于3个或少于2个连续核苷酸,其序列与引物对组合中另一引物的连续核苷酸序列相同。在一些实施例中,由一个或多个16S rRNA基因引物对扩增的核酸序列的长度小于约300bp、小于约250bp、小于约200bp、小于约175bp、小于约150bp或小于约125bp。在一些实施例中,16S rRNA基因引物对单独地扩增分别含有原核16S rRNA基因的3个或更多个、4个或更多个、5个或更多个、6个或更多个、7个或更多个、8个或更多个或9个不同高变区的序列的核酸,从而产生含有一种或多种微生物的16S rRNA基因的3个或更多个、4个或更多个、5个或更多个、6个或更多个、7个或更多个、8个或更多个或9个不同高变区的序列的核酸的扩增拷贝,其中不同高变区的扩增拷贝是单独的扩增子。在一些实施例中,16S rRNA基因引物对单独地扩增分别含有原核16S rRNA基因的8个不同高变区的序列的核酸。在一些实施例中,8个不同的高变区是V2-V9。在一些实施例中,16S rRNA基因引物对单独地扩增含有原核16S rRNA基因的3个或更多个高变区的序列的核酸,其中3个或更多个不同区域之一是V5区,从而产生含有一种或多种微生物的16S rRNA基因的3个或更多个高变区的序列的核酸的扩增拷贝。在一些实施例中,引物对的组合包含一个或多个引物对中的一个或多个引物的简并序列。在一些实施例中,16S rRNA基因引物对包括引物和/或引物对,所述引物和/或引物对含有以下各项或基本上由以下各项组成:表15中的引物或引物对的一个或多个序列;或表15中的SEQ ID NO:1-24和/或表15中的SEQ ID NO:25-48;或表15中的SEQ ID NO:11-16、23和24和/或表15中的SEQ ID NO:35-40、47和48,或基本上相同或相似的序列,并且任选地其中一个或多个胸腺嘧啶碱基被尿嘧啶碱基取代。
在本文提供的用于用免疫疗法治疗受试者的方法的一些实施例中,所述一个或多个非16S rRNA基因引物对特异性地扩增包含在选自表1(或表1,除了或不包含粘性放线菌和/或类球布劳特氏菌;或表1,除了或不包含粘性放线菌、类球布劳特氏菌和/或扎氏螺杆菌)微生物的属和/或种的微生物的基因组内的靶核酸序列。在一些实施例中,靶核酸是微生物所独有的。在一些此类实施例中,产生了表1(或表1,除了或不包含粘性放线菌和/或类球布劳特氏菌;或表1,除了或不包含粘性放线菌、类球布劳特氏菌和/或扎氏螺杆菌)中多种不同微生物的扩增拷贝。在一些实施例中,至少一个,或一个或多个靶核酸序列包括选自表17或表17A和17B中对应于与检查点抑制剂反应相关的特定微生物种的核苷酸序列或其补体的核苷酸序列,或基本上由所述核苷酸序列组成。在一些实施例中,至少一个,或一个或多个靶核酸序列包括选自表17或表17A和17B中对应于与检查点抑制剂反应相关的特定微生物种的序列或其补体的核苷酸序列,并且长度小于约500个、小于约475个、小于约450个、小于约400个、小于约375个、小于约350个、小于约300个、小于约275个、小于约250个、小于约200个、小于约175个、小于约150个或小于约100个核苷酸。在一些实施例中,至少一个非16S rRNA基因引物对不会可检测地扩增包含在除含有靶核酸序列的微生物属之外的任何属内的核酸序列。在一些实施例中,至少一个非16S rRNA基因引物对不会可检测地扩增包含在除含有靶核酸序列的微生物种之外的任何种内的核酸序列。在一些实施例中,非16SrRNA基因引物对中的至少一个引物,或至少一个非16S rRNA基因引物对,含有以下各项或基本上由以下各项组成:表16中对应于与检查点抑制剂反应相关的特定微生物种的引物或引物对的一个或多个序列;或表16的SEQ ID NO:49-520;或表16的SEQ ID NO:49-452、457-472和481-520;或表16的SEQ ID NO:49-492;或表16的SEQ ID NO:49-452、457-472和481-492;或表16A的SEQ ID NO:49-480;或表16A的SEQ ID NO:49-452和457-472;或表16C的SEQID NO:521-826;或表16C的SEQ ID NO:521-820;或表16的SEQ ID NO:827-1298;或表16的SEQ ID NO:827-1230、1235-1250和1259-1298;或表16的SEQ ID NO:827-1270;或表16的SEQ ID NO:827-1230、1235-1250和1259-1270;或表16D的SEQ ID NO:827-1258;或表16D的SEQ ID NO:827-1230和1235-1250;或表16F的SEQ ID NO:1299-1604;或表16F的SEQ IDNO:1299-1598,或基本上相同或相似的序列,或任何上述核酸或引物对的核苷酸序列,其中一个或多个胸腺嘧啶碱基被尿嘧啶碱基取代。在一些实施例中,使用多个非16S rRNA基因引物或引物对对核酸进行核酸扩增,所述多个引物或引物对各自含有以下各项或基本上由以下各项组成:表16中对应于与检查点抑制剂反应相关的特定微生物种的引物或引物对的一个或多个序列;或表16的SEQ ID NO:49-520;或表16的SEQ ID NO:49-452、457-472和481-520;或表16的SEQ ID NO:49-492;或表16的SEQ ID NO:49-452、457-472和481-492;或表16A的SEQ ID NO:49-480;或表16A的SEQ ID NO:49-452和457-472;或表16C的SEQ IDNO:521-826;或表16C的SEQ ID NO:521-820;或表16的SEQ ID NO:827-1298;或表16的SEQID NO:827-1230、1235-1250和1259-1298;或表16的SEQ ID NO:827-1270;或表16的SEQ IDNO:827-1230、1235-1250和1259-1270;或表16D的SEQ ID NO:827-1258;或表16D的SEQ IDNO:827-1230和1235-1250;或表16F的SEQ ID NO:1299-1604;或表16F的SEQ ID NO:1299-1598,其中一个或多个胸腺嘧啶碱基被尿嘧啶碱基取代。在一些实施例中,引物对组合中的至少一个引物或一个引物对包含促进核酸操作、扩增、连接和/或扩增产物测序和/或减少或消除引物二聚体的修饰。在特定实施例中,修饰是促进多重核酸扩增、连接和/或多重扩增产物测序的修饰。
在本文提供的用于用免疫疗法治疗受试者的方法的一些实施例中,所述方法被设计成关注样品中微生物群体的构成或组成,特别是关于某些微生物群组,并且在一些实施例中,组和/或组成员在群体中的成比例存在。在此类实施例中,引物和/或引物对的组合包含微生物特异性核酸的选定组或亚组,并且包含界涵盖核酸(例如,16S rRNA基因引物和引物对),并且能够专注于一种或多种特定的目标微生物,这些微生物在对免疫疗法的反应中可能很重要。在一些实施例中,核酸的组合包含微生物特异性核酸和/或引物对,其特异性地扩增包含在一种或多种微生物(例如,细菌)的基因组中的核酸序列,所述一种或多种微生物与一种或多种病状、病症和/或疾病有关。在特定实施例中,包含在不同微生物基因组中的靶核酸序列是每种微生物所独有的。在一些实施例中,核酸和/或核酸引物对的组合包含两个或更多个核酸和/或核酸引物对,其特异性地扩增包含在一种或多种A组微生物和/或B组微生物(参见表2B)的基因组中的独特核酸序列。在一些实施例中,核酸和/或核酸引物对的组合包含核酸引物对集,其中每个不同的核酸引物对特异性地扩增包含在A组或B组中不同微生物的每个基因组的不同基因组中的不同独特核酸序列。
在本文提供的用于用免疫疗法治疗受试者的方法的一些实施例中,所述方法涉及利用扩增产物的核苷酸序列信息。此类实施例包含从通过所述方法中采用的引物对的组合扩增的核酸产物中获得序列信息。序列信息的实例在本文中提供并且包含但不限于:扩增产物的连续多核苷酸序列(核苷酸序列确定)中的核苷酸的身份及其顺序(其可以包含例如条形码序列,例如,对应于扩增子文库来源、所使用的引物等)、核苷酸序列与参考序列的比对和/或映射(以及参考序列的属或种的身份)、映射到参考序列和/或其部分(例如,16SrRNA基因的高变区)的序列读段的数量、唯一映射到参考序列的序列读段的数量,以及序列读段映射到的参考序列的区域(例如,靶序列)的数量。本文提供了用于比对和/或映射扩增产物的序列读段核酸测序和核苷酸序列分析工作流程的示例性方法。在一些实施例中,序列信息提供微生物的身份(例如,属、种)和/或群体中不同微生物的数量,其用于确定对受试者的治疗。在一些实施例中,如本文所述,序列信息提供了群体中微生物水平(例如,相对和/或绝对水平)的度量(群体中的丰度和成比例的贡献或存在),其也可用于确定对受试者的治疗。
试剂盒
在一些实施例中,提供了一种用于进行核酸扩增的试剂盒,所述试剂盒包括本文提供的任何一种或多种核酸引物和/或引物对,所述核酸引物和/或引物对包括选自表15和表16中的序列的一个或多个序列,或基本上由所述一个或多个序列组成。在一些实施例中,引物的长度少于约100个核苷酸、少于约90个核苷酸、少于约80个核苷酸、少于约70个核苷酸、少于约60个核苷酸、少于约50个核苷酸、少于约45个核苷酸、少于约44个核苷酸、少于约43个核苷酸、少于约42个核苷酸、少于约41个核苷酸、少于约40个核苷酸、少于约38个核苷酸、少于约35个核苷酸或少于约30个核苷酸。在一些实施例中,包括选自表15中的序列的序列或基本上由所述序列组成的一种或多种核酸引物和/或引物对选自表15中的SEQ ID NO:1-24和/或表15中的SEQ ID NO:25-48,或表15中的SEQ ID NO:11-16、23和24和/或表15中的SEQ ID NO:35-40、47和48,或基本上相同或相似的序列,并且任选地其中一个或多个胸腺嘧啶碱基被尿嘧啶碱基取代。在一些实施例中,包括选自表16中的序列的序列或基本上由所述序列组成的一种或多种核酸引物和/或引物对选自表16的SEQ ID NO:49-520、或表16的SEQ ID NO:49-452、457-472和481-520、或表16的SEQ ID NO:49-492、或表16的SEQ IDNO:49-452、457-472和481-492、或表16A的SEQ ID NO:49-480、或表16A的SEQ ID NO:49-452和457-472、或表16C的SEQ ID NO:521-826、或表16C的SEQ ID NO:521-820、或表16的SEQ ID NO:827-1298、或表16的SEQ ID NO:827-1230、1235-1250和1259-1298、或表16的SEQ ID NO:827-1270、或表16的SEQ ID NO:827-1230、1235-1250和1259-1270、或表16D的SEQ ID NO:827-1258、或表16D的SEQ ID NO:827-1230和1235-1250、或表16F的SEQ ID NO:1299-1604、或表16F的SEQ ID NO:1299-1598,或基本上相同或相似的序列,或任何上述核酸或引物对的核苷酸序列,其中一个或多个胸腺嘧啶碱基被尿嘧啶碱基取代。在一些实施例中,所述试剂盒含有一种或多种核酸引物对,其包括选自表15和表16中的序列的引物对的序列或基本上由所述序列组成。在一些实施例中,包括选自表15中的序列的引物对的序列或基本上由所述序列组成的一种或多种核酸引物对选自表15中的SEQ ID NO:1-24和/或表15中的SEQ ID NO:25-48,或表15中的SEQ ID NO:11-16、23和24和/或表15中的SEQ IDNO:35-40、47和48,或基本上相同或相似的序列,并且任选地其中一个或多个胸腺嘧啶碱基被尿嘧啶碱基取代。在一些实施例中,包括选自表16中的序列的引物对的序列或基本上由所述序列组成的一种或多种核酸引物对选自表16的SEQ ID NO:49-520、或表16的SEQ IDNO:49-452、457-472和481-520、或表16的SEQ ID NO:49-492、或表16的SEQ ID NO:49-452、457-472和481-492、或表16A的SEQ ID NO:49-480、或表16A的SEQ ID NO:49-452和457-472、或表16C的SEQ ID NO:521-826、或表16C的SEQ ID NO:521-820、或表16的SEQ ID NO:827-1298、或表16的SEQ ID NO:827-1230、1235-1250和1259-1298、或表16的SEQ ID NO:827-1270、或表16的SEQ ID NO:827-1230、1235-1250和1259-1270、或表16D的SEQ ID NO:827-1258、或表16D的SEQ ID NO:827-1230和1235-1250、或表16F的SEQ ID NO:1299-1604、或表16F的SEQ ID NO:1299-1598,或基本上相同或相似的序列,或任何上述核酸或引物对的核苷酸序列,其中一个或多个胸腺嘧啶碱基被尿嘧啶碱基取代。在一些实施例中,所述试剂盒用于进行多重核酸扩增并且包括多个引物和/或引物对,所述多个引物和/或引物对包括选自表15和表16中的序列的序列或基本上由所述序列组成。在一些实施例中,包括选自表15的序列或基本上由所述序列组成的多个引物和/或引物对选自表15中的SEQ ID NO:1-24和/或表15中的SEQ ID NO:25-48,或表15中的SEQ ID NO:11-16、23和24和/或表15中的SEQ ID NO:35-40、47和48,或基本上相同或相似的序列,并且任选地其中一个或多个胸腺嘧啶碱基被尿嘧啶碱基取代。在一些实施例中,包括选自表16的序列或基本上由所述序列组成的多个引物和/或引物对选自表16的SEQ ID NO:49-520、或表16的SEQ ID NO:49-452、457-472和481-520、或表16的SEQ ID NO:49-492、或表16的SEQ ID NO:49-452、457-472和481-492、或表16A的SEQ ID NO:49-480、或表16A的SEQ ID NO:49-452和457-472、或表16C的SEQ ID NO:521-826、或表16C的SEQ ID NO:521-820、或表16的SEQ ID NO:827-1298、或表16的SEQ ID NO:827-1230、1235-1250和1259-1298、或表16的SEQ ID NO:827-1270、或表16的SEQ ID NO:827-1230、1235-1250和1259-1270、或表16D的SEQ ID NO:827-1258、或表16D的SEQ ID NO:827-1230和1235-1250、或表16F的SEQ ID NO:1299-1604、或表16F的SEQID NO:1299-1598,或基本上相同或相似的序列,或任何上述核酸或引物对的核苷酸序列,其中一个或多个胸腺嘧啶碱基被尿嘧啶碱基取代。在一些实施例中,所述试剂盒包括含有引物和/或引物对的混合物的组合物,所述引物和/或引物对包括选自表15中的序列的序列或基本上由所述序列组成,以及含有引物和/或引物对的混合物的单独组合物,所述引物和/或引物对包括选自表16中的序列的序列或基本上由所述序列组成。在一些实施例中,含有包括选自表15中的序列的序列或基本上由所述序列组成的引物和/或引物对的混合物的组合物选自表15中的SEQ ID NO:1-24和/或表15中的SEQ ID NO:25-48,或表15中的SEQ IDNO:11-16、23和24和/或表15中的SEQ ID NO:35-40、47和48,或基本上相同或相似的序列,并且任选地其中一个或多个胸腺嘧啶碱基被尿嘧啶碱基取代。在一些实施例中,含有包括选自表16中的序列的序列或基本上由所述序列组成的引物和/或引物对的混合物的组合物选自表16的SEQ ID NO:49-520、或表16的SEQ ID NO:49-452、457-472和481-520、或表16的SEQ ID NO:49-492、或表16的SEQ ID NO:49-452、457-472和481-492、或表16A的SEQ IDNO:49-480、或表16A的SEQ ID NO:49-452和457-472、或表16C的SEQ ID NO:521-826、或表16C的SEQ ID NO:521-820、或表16的SEQ ID NO:827-1298、或表16的SEQ ID NO:827-1230、1235-1250和1259-1298、或表16的SEQ ID NO:827-1270、或表16的SEQ ID NO:827-1230、1235-1250和1259-1270、或表16D的SEQ ID NO:827-1258、或表16D的SEQ ID NO:827-1230和1235-1250、或表16F的SEQ ID NO:1299-1604、或表16F的SEQ ID NO:1299-1598,或基本上相同或相似的序列,或任何上述核酸或引物对的核苷酸序列,其中一个或多个胸腺嘧啶碱基被尿嘧啶碱基取代。在任何这些实施例中,所述试剂盒进一步包含DNA聚合酶、衔接子、dATP、dCTP、dGTP和dTTP中的一种或多种。所述试剂盒可以进一步包含一种或多种抗体、核酸条形码、纯化溶液或柱。
在一些实施例中,提供了一种试剂盒,其用于检测或测量一种或多种微生物,或用于评估、剖析或表征微生物(例如,细菌)的混合物或群体,并且包含:(1)一个或多个界涵盖核酸引物对,其能够扩增对于界中的多个、大部分、大多数、基本上所有或所有微生物(例如,细菌)而言是共有的但在不同界的微生物之间会有所不同的同源基因或基因组区域中的序列;和(2)微生物特异性核酸和/或核酸引物对,其扩增特定微生物(例如,如细菌等微生物的种、亚种或菌株)所独有的特异性核酸序列。在一些实施例中,界涵盖核酸引物对和微生物特异性核酸引物对包括分别选自表15和表16中的序列的序列或基本上由所述序列组成。在一些实施例中,界涵盖核酸引物对包括以下各项或基本上由以下各项组成:选自表15中的SEQ ID NO:1-24和/或表15中的SEQ ID NO:25-48,或表15中的SEQ ID NO:11-16、23和24和/或表15中的SEQ ID NO:35-40、47和48的序列,或基本上相同或相似的序列,并且任选地其中一个或多个胸腺嘧啶碱基被尿嘧啶碱基取代。在一些实施例中,微生物特异性核酸引物对包括以下各项或基本上由以下各项组成:选自表16的SEQ ID NO:49-520、或表16的SEQ ID NO:49-452、457-472和481-520、或表16的SEQ ID NO:49-492、或表16的SEQ IDNO:49-452、457-472和481-492、或表16A的SEQ ID NO:49-480、或表16A的SEQ ID NO:49-452和457-472、或表16C的SEQ ID NO:521-826、或表16C的SEQ ID NO:521-820、或表16的SEQ ID NO:827-1298、或表16的SEQ ID NO:827-1230、1235-1250和1259-1298、或表16的SEQ ID NO:827-1270、或表16的SEQ ID NO:827-1230、1235-1250和1259-1270、或表16D的SEQ ID NO:827-1258、或表16D的SEQ ID NO:827-1230和1235-1250、或表16F的SEQ ID NO:1299-1604、或表16F的SEQ ID NO:1299-1598的序列,或基本上相同或相似的序列,或任何上述核酸或引物对的核苷酸序列,其中一个或多个胸腺嘧啶碱基被尿嘧啶碱基取代。在一些实施例中,所述试剂盒包括含有一个或多个界涵盖核酸引物对的组合物,以及含有一个或多个种特异性引物对的单独组合物。在一些实施例中,微生物特异性核酸引物对是特异性地扩增包括表17中的一个或多个序列或基本上由所述一个或多个序列组成的序列的引物。在一些实施例中,微生物特异性核酸引物对是特异性地扩增包括以下各项或基本上由以下各项组成的序列的引物:表17中的SEQ ID NO:1605-1979、或表17的SEQ ID NO:1605-1806、1809-1816、1821-1970、1972-1974和1977-1979、或表17中的SEQ ID NO:1605-1826、或表17中的SEQ ID NO:1605-1806、1809-1816和1821-1826、或表17A中的SEQ ID NO:1605-1820、或表17A中的SEQ ID NO:1605-1806和1809-1816、或表17C中的SEQ ID NO:1827-1979、或表17C中的SEQ ID NO:1827-1976,或基本上相同或相似的序列,或其补体。在一些实施例中,所述试剂盒进一步包含DNA聚合酶、衔接子、dATP、dCTP、dGTP和dTTP中的一种或多种。所述试剂盒可以进一步包含一种或多种抗体、核酸条形码、纯化溶液或柱。在一些实施例中,引物对中的一个或多个引物具有可切割基团。在一些实施例中,可切割基团可以是尿嘧啶核苷酸。在其中引物对中的一个或多个引物具有可切割基团的一些实施例中,所述试剂盒可以进一步包含至少一种切割试剂。在一个实施例中,可切割基团可以是8-氧代-脱氧鸟苷、脱氧尿苷或溴脱氧尿苷。在一些实施例中,至少一种切割试剂包含RNaseH、尿嘧啶DNA糖基化酶、Fpg或碱。在一个实施例中,切割试剂可以是尿嘧啶DNA糖基化酶。在一些实施例中,提供了一种用于在单个反应中扩增来自核酸分子群体的多个微生物序列的试剂盒。在一些实施例中,提供试剂盒以在单个反应室或容器中进行多重核酸扩增。在一些实施例中,试剂盒包含至少一种DNA聚合酶,其可以是热稳定DNA聚合酶。在一些实施例中,与单个扩增反应相比,一种或多种DNA聚合酶的浓度以3倍过量存在。在一些实施例中,每个引物对的最终浓度以约25nM到约50nM存在。在一个实施例中,每个引物对的最终浓度可以以比常规单重PCR反应低50%的浓度存在。在一些实施例中,试剂盒在单个反应室中提供来自核酸分子群体的至少100个、150个、200个、250个、300个、350个、398个或更多个微生物序列的扩增。在特定实施例中,本发明提供的试剂盒是测试试剂盒。在一些实施例中,试剂盒进一步包括一个或多个衔接子、条形码和/或抗体。
用于压缩参考数据库并分析序列数据以剖析微生物群体的方法
在一些实施例中,本文所述的方法可用于压缩参考核酸序列并分析通过对活生物体、微生物、寄生虫或传染原的基因组部分的核酸进行测序而产生的序列读段。在一些实施例中,生物体是相关的,例如,属于共同的分类学群组(例如,界、门、纲、目、科、属和/或种)。在一些实施例中,生物体是微生物,如例如原核生物,包含细菌和古生菌。在一些实施例中,生物体是真核生物,包含例如动物(例如,哺乳动物、昆虫)、植物、真菌和藻类。在一些实施例中,核酸来自微生物,例如,细菌、古细菌或病毒,其也是传染原。在一些实施例中,使用寡核苷酸(如引物)获得核酸,以扩增生物体、微生物、寄生虫和/或传染原的核酸部分。在一些实施例中,寡核苷酸包含在被称为基因面板(gene panel)的集合中,所述集合被设计成剖析样品或环境(如例如,微生物环境)的组成。待剖析的微生物可以包含细菌、真菌或病毒。被面板靶向的基因的特性可能包含同源基因。同源基因是在多种生物体或微生物中显示保守序列但也可能在序列上有差异的基因。同源基因的实例包含但不限于16S rRNA基因、18SrRNA基因、23S rRNA基因和ABC转运蛋白基因。例如,16S rRNA基因含有高变节段,这些节段在不同生物体或微生物中的序列可能不同,但在不同生物体或微生物中被相似或几乎相同序列的保守节段分隔开。本文所述方法的各个实施例可用于在以下应用中剖析微生物组:肠道微生物组、皮肤微生物组、口腔微生物组、呼吸道微生物组、败血症、传染病、女性健康、病毒类型、真菌样品、宏基因组学–土壤和水样分析、食物病原体。
在一些实施例中,本公开提供了来自靶核酸分子群体的多个靶特异性序列的扩增。在一些实施例中,所述方法包括将一个或多个靶特异性引物对与靶序列杂交、延伸引物对中的第一引物、使来自核酸分子群体的经延伸的第一引物产物变性、使经延伸的第一引物产物与引物对中的第二引物杂交、延伸第二引物以形成双链,以及远离双链产物消化靶特异性引物对以产生多个经扩增的靶序列。在一些实施例中,消化包含从经扩增靶序列中部分消化一种或多种靶特异性引物。在一些实施例中,经扩增的靶序列可以与一个或多个衔接子连接。在一些实施例中,衔接子可以包含一个或多个DNA条形码或标记序列。在一些实施例中,经扩增的靶序列一旦连接到衔接子,就可以经历切口平移反应和/或进一步扩增来产生衔接子连接的经扩增靶序列库。
在一些实施例中,本公开的方法包含选择性地扩增含有多个核酸分子的样品中的靶序列,并将经扩增的靶序列连接到至少一个衔接子和/或条形码。用于分子生物学文库制备技术的衔接子和条形码是所属领域的技术人员众所周知的。如本文所使用的,衔接子和条形码的定义与所属领域中使用的术语一致。例如,条形码的使用允许每个多重反应检测和分析多个样品、来源、组织或核酸分子群体。条形码化和经扩增的靶序列含有独特的核酸序列,通常是短的6-15个核苷酸序列,其鉴定和区分一个经扩增的核酸分子与另一个经扩增的核酸分子,即使当减去条形码的两个核酸分子都含有相同的核酸序列时也是如此。衔接子的使用允许以均匀的方式扩增每个经扩增的核酸分子并且有助于减少链偏差。衔接子可以包含通用衔接子或专用衔接子,二者都可以在下游使用以执行一个或多个不同的功能。例如,由本文中公开的方法制备的经扩增的靶序列可以连接到可以在下游用作克隆扩增平台的衔接子。衔接子可以充当模板链,用于随后使用第二引物集进行扩增,并且因此允许对衔接子连接的经扩增的靶序列进行通用扩增。在一些实施例中,用于产生扩增子池的靶核酸的选择性扩增可以进一步包括将一个或多个条形码和/或衔接子连接到经扩增的靶序列。并入条形码的能力可以增强样品通量,并且允许同时分析多个样品或材料来源。
核酸的保守序列可以在不同生物体或微生物的基因组中找到。此类序列在不同的基因组中可以是相同的或具有实质上的相似性(参见例如,Isenbarger等人(2008)《生命起源与生物圈演化(Orig Life Evol Biosph)》doi:10.1007/s11084-008-9148-z)。在许多情况下,保守序列位于必需基因中,例如管家基因,这些基因编码跨一类或一组生物体或微生物所需的元素,用于执行基础的生存生化功能。此类载体在本文中被称为“表达载体”。然而,通过生物体和微生物对不同条件的进化和适应,即使是同源基因也发生了分歧,并且含有在不同生物体和微生物之间变化的序列,这些序列可能如此不同,以至于对于特定的生物体或微生物来说是独一无二的,使得它们可以用于鉴定单个生物体或微生物或生物体或微生物的相关群组(例如,种)。可以利用这些同源基因的这些特征来表征或剖析样品(如例如,生物或环境样品)的核酸组合物。例如,在剖析样品的微生物群时,目标不仅要确定样品中的微生物存在,而且要生成总微生物群体的综合表征,包含微生物组成的身份(例如,属、种)和不同微生物的相对水平。分析含有跨样品(例如,所有细菌)中被剖析的群体的基本上所有靶标元件保守的序列(例如,保守区)以及变化的序列(例如,可变区)的同源基因并提供特定于总群体中的个体或亚组的信息,提供了一种用于有效剖析样品中的群体的方法。含有散布在保守区之间的多个可变区的同源基因在此类方法中特别有用,因为它们提供了多个序列,可以对所述多个序列进行分析以更准确和明确地鉴定靶标元件群体的各个组成部分。这种基因的一个实例是编码核糖体RNA的原核16S rRNA基因,所述核糖体RNA是核糖体的主要结构和催化组分。16S rRNA基因的长度为约1500个核苷酸,并且含有九个高变区(V1-V9),所述高变区在保守区的保存序列之间穿插并位于其两侧(图1)。在不同微生物中不同的16S rRNA基因的高变区的序列可用于鉴定样品中的微生物。获得样品中微生物的高变区的核酸以便对这些区域进行测序的一种方法是通过从样品中提取的所有核酸的核酸扩增(例如,聚合酶链式反应或PCR)产生多个区域拷贝。可以通过以下方式来实现扩增:使核酸与杂交到待扩增的高变区(被称为模板)两端的序列的寡核苷酸(即,引物)接触,并通过引物的核苷酸聚合延伸合成模板每条链的补体序列。并非通过使用许多寡核苷酸引物(每个引物对每个生物体的高变区都是特异性的)特异性地扩增可能存在于样品中的每种可能微生物的高变区,而是可以利用位于高变区两侧的保守、高度相似或相同的序列作为引物结合序列,一个或少量引物对将结合至所述引物结合序列,并扩增样品中基本上所有微生物(例如,细菌)中的高变区。这允许从基本上所有微生物中扩增可用于鉴定微生物的特异性核酸,然后可对其进行测序以有效地对群体进行剖析。
可以通过计算机辅助序列比对将样品中存在的所有微生物的经扩增的高变区核酸的序列与特定微生物(microorganism或microbe)的参考序列进行比较,并映射到已知微生物的基因以鉴定样品微生物。来自许多微生物(例如,细菌)的16S rRNA基因序列的数据库是公开的(参见例如,www.greengenes.lbl.gov and www.arb-silva.de)。数据库中可以有超过100,000个序列。此外,九个高变区中扩增和测序的区域越多,必须进行的比对次数越多。因此,对样品中多种微生物的多个经扩增的核酸区域的分析可能需要大量的处理器内存和时间,并可能在分析中引入错误和不确定性。本文提供了执行降低计算要求、降低记忆要求和提高样品中核酸表征质量的此类分析的方法。
本文还提供了用于促进和提高将样品核酸映射到特定微生物所独有的非保守基因组区域的效率的方法,所述方法能够准确鉴定样品中的核酸,所述样品可能含有来自多种不同的生物体和/或微生物的核酸的混合物。
在一些实施例中,可以将包含序列读段信息的未比对的BAM文件提供给处理器以分析对应于标志物区域的序列读段。可以分析从文库DNA模板测序中获得的读段,以鉴定和确定样品中微生物组成的水平。可以使用并入了Ion Torrent SuiteTM软件(赛默飞世尔科技公司)的工作流程进行分析,所述软件具有被设计成促进微生物DNA序列读段分析的运行计划模板,以及为测定中靶向的扩增子生成计数的AmpliSeq微生物组分析软件插件。用于在分析的读段映射方面进行比对的参考基因组文件可能包含在插件中。源自GreenGenes细菌16S rRNA基因序列公共数据库(参见例如,www.greengenes.lbl.gov)的参考序列可用于映射从使用16S引物池生成的扩增子的测序中获得的读段。在一些实施例中,可以使用含有16S rRNA基因序列信息的其它数据库,如核糖体数据库项目(RDP)(https://rdp.cme.msu.edu/)、GRD(https://metasystems.riken.jp/grd/)、SILVA(https:// www.arb-silva.de/)和ExBioCloud(https://help.ezbiocloud.net/ezbiocloud-16s-database/)。NCBI公共数据库(参见www.ncbi.nlm.nih.gov/genome/microbes/)中提供的参考微生物基因组序列可用于映射从使用种引物池生成的扩增子的测序中获得的读段。压缩的16S参考序列可以源自GreenGenes或其它16S rRNA基因序列数据库。压缩的16S参考序列包括16S rRNA基因的多个高变区。图1说明了具有高变区的16S rRNA基因的实例。全长16S rRNA基因可以包含1000到1700bp。在此实例中,全长16S rRNA基因101包含1500bp和9个高变区,V1–V9。靶向用于扩增的9个高变区中的8个(V2–V9)的引物池设计产生高变节段集102。可以通过使用靶向V2–V9的引物对对数据库中含有的全长16S序列应用计算机PCR模拟以提取V2–V9的预期靶节段来生成高变节段集102。计算机PCR模拟可以使用可用的计算工具,使用给定的引物集和用户输入的靶DNA序列来计算理论PCR结果。一个这样的工具是Primer-BLAST(https://www.ncbi.nlm.nih.gov/tools/primer-blast/index.cgi?LINK_LOC=BlastHome),其描述于以下文献中:Ye J,Coulouris G,Zaretskaya I,CutcutacheI,Rozen S,Madden TL.(2012)“Primer-BLAST:一种设计用于聚合酶链式反应的靶特异性引物的工具(Primer-BLAST:a tool to design target-specific primers forpolymerase chain reaction.)”《BMC生物信息学(BMC Bioinformatics.)》13:134,以及“NCBI Primer-BLAST:一种用于设计靶特异性PCR引物对(带有内部探针)的在线工具(NCBIPrimer-BLAST An online tool for designing target-specific PCR primer pairs(with internal probes))”,NCBI讲义系列|Primer-BLAST|最后更新于2016年9月8日(https://ftp.ncbi.nih.gov/pub/factsheets/HowTo_PrimerBLAST.pdf)。在一些实施例中,用于计算机PCR模拟的专有模拟工具可用于确定高变节段集102。
对于图1的实例,源自计算机模拟的高变节段集102提供了一个压缩参考,所述压缩参考含有完整数据库中那些预计会被引物扩增的全长16S rRNA序列的高变区序列。对于此实例,碱基对的数量从全长序列101的1500bp减少到总共1299bp的8个高变节段102。GreenGenes数据库含有大约150,000个16S rRNA基因序列。
在一些实施例中,不止一个引物对可以靶向给定的高变区。用于扩增每个区域的引物对中的每个引物的序列针对特定V区每一侧的“保守”序列,因此引物对理论上将扩增每个细菌基因组中的可变区。然而,每个可变区两侧的一些“保守”区,具体地说,V2和V8两侧的保守区,没有足够的保守性来扩增所有细菌的V2和V8区。因此,为了扩增V2和V8,可以使用3个引物对(而不是1个引物对),其中每个引物对的序列几乎相同但有一个或两个核苷酸不同(被称为“简并引物”)。使用这3个引物对是扩增所有细菌的V2和V8区的一种方法,即使V2和V8两侧的保守区对于不同的细菌可能略有不同。
BAM文件格式结构在2014年9月12日的“序列比对/地图格式规范(SequenceAlignment/Map Format Specification)”中进行了描述(https://github.com/samtools/hts-specs)。如本文中所描述,“BAM文件”是指与BAM格式兼容的文件。如本文中所描述,未经比对的BAM文件是指不包含经比对的序列读段信息和映射质量参数的BAM文件,而经比对的BAM文件是指含有经比对的序列读段信息和映射质量参数的BAM文件。
核酸序列数据可以使用包含但不限于以下的各种技巧、平台或技术产生:毛细电泳法、微阵列、基于连接的系统、基于聚合酶的系统、基于杂交的系统、直接或间接核苷酸鉴定系统、焦磷酸测序、基于离子或pH的检测系统、基于电子签名的系统等。
核酸测序平台(如核酸测序仪)的各个实施例可以包含如图10的框图中所显示的组件。根据各个实施例,测序仪器200可以包含流体递送和控制单元202、样品处理单元204、信号检测单元206以及数据采集、分析和控制单元208。用于下一代测序的仪表、试剂、库和方法的各个实施例描述于美国专利申请公开案第2009/0127589号和第2009/0026082号中。仪器200的各个实施例可以提供可以用于并行地,例如基本上同时从多个序列收集序列信息的自动化测序。
在各个实施例中,流体学递送和控制单元202可以包含试剂递送系统。试剂递送系统可以包含用于存储各种试剂的试剂储集器。试剂可以包含基于RNA的引物、正向/反向DNA引物、用于连接测序的寡核苷酸混合物、用于合成测序的核苷酸混合物、任选的ECC寡核苷酸混合物、缓冲剂、洗涤试剂、阻断试剂、汽提试剂等。另外,试剂递送系统可以包含移液系统或连续流动系统,其将样品处理单元与试剂储集器连接。
在各个实施例中,样品处理单元204可以包含样品室,例如流槽、基板、微阵列、多孔盘等。样品处理单元204可以包含多个通道、多个槽道、多个孔或其它基本上同时处理多个样品集的手段。另外地,样品处理单元可以包含多个样品室以使得能够同时处理多个轮次。在特定实施例中,系统可以对一个样品室执行信号检测,并且基本上同时处理另一样品室。另外地,样品处理单元可以包含用于移动或操纵样品室的自动化系统。
在各个实施例中,信号检测单元206可以包含成像或检测传感器。例如,成像或检测传感器可以包含CCD、CMOS、离子或化学传感器(如覆盖CMOS或FET的离子敏感层)、电流或电压检测器等。信号检测单元206可以包含励磁系统以引起探针(如荧光染料)发射信号。励磁系统可以包含照明源,例如弧光灯、激光、发光二极管(LED)等。在特定实施例中,信号检测单元206可以包含用于将光从照明源传输到样品或从样品传输到成像或检测传感器的光学系统。可替代地,信号检测单元206可以提供基于电子或非光子的检测方法并且因此不包含照明源。在各个实施例中,基于电子的信号检测可以在测序反应期间产生可检测信号或物质时进行。例如,信号可以通过与离子或化学敏感层相互作用的所释放的副产物或部分(如所释放的离子,如氢离子)的相互作用而产生。在其它实施例中,可检测信号可以由于如用于焦磷酸测序(参见例如美国专利申请公开案第2009/0325145号)中的酶促级联产生,其中焦磷酸酯通过聚合酶的碱基并入产生,所述聚合酶进一步与ATP硫酸化酶在腺苷5'磷酰硫酸存在下反应来产生ATP,其中所产生的ATP可以在荧光素酶介导的反应中耗尽来产生化学发光信号。在另一个实例中,电流的变化可以在核酸穿过纳米孔时在不需要照明源的情况下检测。
在各个实施例中,数据采集分析和控制单元208可以监测各种系统参数。系统参数可以包含仪器200的各部分(如样品处理单元或试剂储集器)的温度、各种试剂的体积、各生殖系统子组件(如操纵器、步进式电机、泵等)的状态、或其任何组合。
本领域的技术人员应了解,仪器200的各个实施例可以用于实践多种测序方法,包含基于连接的方法、合成测序、单分子方法、纳米孔测序以及其它测序技术。
在各个实施例中,测序仪器200可以确定核酸,如聚核苷酸或寡核苷酸的序列。核酸可以包含DNA或RNA,并且可以是单链的,如ssDNA和RNA,或双链的,如dsDNA或RNA/cDNA对。在各个实施例中,核酸可以包含或源自片段库、配对库、ChIP片段等。在特定实施例中,测序仪器200可以从单个核酸分子或从一组基本上相同的核酸分子获得序列信息。
在各个实施例中,测序仪器200可以包含但不限于以下的多种不同输出数据文件类型/格式输出核酸测序读段数据:*.fasta、*.csfasta、*seq.txt、*qseq.txt、*.fastq、*.sff、*prb.txt、*.sms、*srs和/或*.qv。
根据各个示例性实施例,可以使用适当配置和/或编程的硬件和/或软件元件来执行或实施上述教示内容和/或示例性实施例中的任一个或多个的一个或多个特征。确定是否使用硬件和/或软件元件来实施实施例可基于任何数目的因素,例如期望的计算速率、功率水平、耐热性、处理周期预算、输入数据速率、输出数据速率、存储器资源、数据总线速度等,以及其它设计或性能限制。
硬件元件的实例可以包含通过以下以通信方式耦合的处理器、微处理器、一个或多个输入设备和/或一个或多个输出装置(I/O)(或外围设备):本地接口电路、电路元件(例如晶体管、电阻器、电容器、电感器等)、集成电路、专用集成电路(ASIC)、可编程逻辑装置(PLD)、数字信号处理器(DSP)、现场可编程门阵列(FPGA)、逻辑门、寄存器、半导体装置、芯片、微芯片、芯片集等。本地接口可以包含例如一个或多个总线或其它有线或无线连接、控制器、缓冲器(缓存器)、驱动器、中继器和接收器等,以允许硬件组件之间的适当通信。处理器是用于执行软件,尤其是存储在存储器中的软件的硬件装置。处理器可以是任何定制的或市售的处理器、中央处理单元(CPU)、与计算机相关联的若干处理器中的辅助处理器、基于半导体的微处理器(例如呈微芯片或芯片集的形式)、宏处理器,或通常用于执行软件指令的任何装置。处理器还可以表示分布式处理架构。I/O设备可以包含输入设备,例如键盘、鼠标、扫描仪、麦克风、触摸屏、用于各种医疗设备和/或实验室仪器的接口、条形码读段器、触控笔、激光读段器、射频装置读段器等。此外,I/O设备还可以包含输出设备,例如打印机、条形码打印机、显示器等。最后,I/O设备还可以包含以输入和输出的形式连通的设备,例如调制器/解调器(调制解调器;用于接入另一个装置、系统或网络)、射频(RF)或其它收发器、电话接口、网桥、路由器等。
软件的实例可以包含软件组件、程序、应用、计算机程序、应用程序、系统程序、机器程序、操作系统软件、中间件、固件、软件模块、例程、子例程、函数、方法、操作步骤、软件接口、应用程序接口(API)、指令集、计算代码、计算机代码、代码段、计算机代码段、字、值、符号或其任何组合。在存储器中的软件可以包含一个或多个独立程序,其可以包含用于执行逻辑功能的可执行指令的有序列表。在存储器中的软件可以包含用于鉴定根据本发明的教示内容的数据流的系统和任何合适的定制或可商购的操作系统(O/S),其可控制例如系统等其它计算机程序的执行,并且提供排程、输入-输出控制、文件和数据管理、存储器管理、通信控制等。
根据各个示例性实施例,可使用可存储指令或指令集的适当地配置和/或编程的非暂时性机器可读介质或物件来执行或实施上述教示内容和/或示例性实施例中的任一个或多个的一个或多个特征,所述指令或指令集如果由机器执行,那么可使机器执行根据示例性实施例的方法和/或操作。此类机器可以包含例如任何合适的处理平台、计算平台、计算装置、处理装置、计算系统、处理系统、计算机、处理器、科学或实验室仪器等,并且可使用硬件和/或软件的任何合适的组合来实施。机器可读介质或物件可以包含例如任何合适类型的存储器单元、存储器装置、存储器物件、存储器介质、存储装置、存储物件、存储介质和/或存储单元,例如存储器、可移动介质或不可移动介质、可擦除介质或不可擦除介质、可写或可重写介质、数字或模拟介质、硬盘、软盘、只读存储器光盘(CD-ROM)、可刻录光盘(CD-R)、可重写光盘(CD-RW)、光盘、磁性介质、磁光介质、可移动存储卡或盘、各种类型的数字多功能光盘(DVD)、磁带、磁带盒等,包含适用于计算机的任何介质。存储器可以包含易失性存储器元件(例如随机存取存储器(RAM,如DRAM、SRAM、SDRAM等))和非易失性存储器元件(例如ROM、EPROM、EEROM、闪存存储器、硬盘驱动器、磁带、CDROM等)中的任一个或组合。此外,存储器可并入电子、磁性、光学和/或其它类型的存储介质。存储器可以具有分布式结构,其中各种组件彼此远离地定位,但仍通过处理器接入。指令可以包含使用任何合适的高阶、低阶、面向对象、视觉、经编译和/或经解译的编程语言实施的任何合适类型的代码,例如源代码、经编译的代码、解译的代码、可执行码、静态代码、动态代码、加密的代码等。
根据各个示例性实施例,可至少部分地使用分布式、丛集、远程或云计算资源来执行或实施上述教示内容和/或示例性实施例中的任一个或多个的一个或多个特征。
根据各个示例性实施例,上述教示内容和/或示例性实施例中的任一个或多个的一个或多个特征可使用源程序、可执行程序(靶代码)、脚本或任何其它包括待执行的指令集的实体来执行或实施。在源程序情况下,所述程序可以通过可以包含或不包含在存储器中的编译器、汇编器、解释器等翻译以便与O/S一起正确地操作。指令可以使用以下来书写:(a)具有数据类和方法类的面向对象的编程语言;或(b)具有例程、子例程和/或函数的过程编程语言,可以包含例如C、C++、R、Pascal、Basic、Fortran、Cobol、Perl、Java和Ada。
根据各个示例性实施例,上述示例性实施例中的一个或多个可以包含向用户接口装置、计算机可读存储介质、本地计算机系统或远程计算机系统发送、显示、存储、打印或输出与可以通过此类示例性实施例生成、访问或使用的任何信息、信号、数据和/或中间结果或最终结果有关的信息。例如,此类发送、显示、存储、打印或输出的信息可以采用可搜索和/或可过滤的运行和报告、图片、表格、图表、图形、电子表格、相关性、序列和其组合列表的形式。
实例
实例1–测定材料和方法
用使用两个单独的引物池从样品核酸产生的DNA扩增子文库进行基于核酸测序的测定,以鉴定和表征样品的微生物组成。使用用于靶向扩增微生物16S rRNA DNA的引物池(“16S引物池”)制备一个文库,并且使用用于靶向扩增不同微生物种的独特DNA序列的引物池(“种引物池”)制备另一个文库。16S引物池中使用的引物包含表15中SEQ ID NO:1-27所列的引物对(参见实例5),并且种引物池中使用的引物包含表16中SEQ ID NO:49-520所列的引物对(参见实例5),所述引物对被设计成扩增种特异性靶序列,包含表17中SEQ ID NO:1605-1826所列的序列(参见实例5)。生成文库后,通过扩增文库扩增子制备模板,例如使用Ion ChefTM或Ion OneTouchTM 2系统,并使用下一代测序技术(例如,Ion S5TM、Ion PGMTM系统)对模板进行测序。
样品处理和核酸提取
当样品为生物样本(如人类粪便样本)时,使用MagMAXTM微生物组超核酸分离试剂盒(赛默飞世尔科技公司;目录号A42357(带板)或A42358(带管))和带有96个深孔头的Thermo ScientificTM KingfisherTM Flex磁性粒子处理器(赛默飞世尔科技公司;目录号5400630)从样本中提取总核酸(包含DNA和RNA)(例如,50-250mg),用于在使用MagMaxTM微生物组试剂盒进行初始珠击裂解步骤后的自动裂解物颗粒处理。提取的核酸的典型洗脱体积为200μl,并且典型回收体积为180μl。根据制造商的说明进行提取,不同之处在于,在纯化之前将RNaseA添加到Wash-I Plate 1和Wash-I-Plate2以从提取的核酸中移除RNA并获得用于测定的分离的DNA。从ATCC获得的细菌样品是已经提取的DNA。
根据制造商的说明,使用QubitTM dsDNA BR测定试剂盒(赛默飞世尔科技公司;目录号Q32853)或QubitTM dsDNA HS测定试剂盒(赛默飞世尔科技公司目录号Q32851)对提取的DNA进行定量。优选至少为1.67ng/μl,并且优选地,大于10ng/μl的DNA浓度。
DNA扩增子文库制备
对于每次测定,从每个样品制备两个DNA扩增子文库(16S rRNA基因节段DNA文库和靶向细菌种DNA文库)。使用Ion AmpliSeqTM Library Kit Plus(赛默飞世尔科技公司;目录号A35907;参见表3)中的试剂生成文库,用于对数百个靶序列进行高度多重PCR扩增。
未使用试剂盒中提供的25X文库扩增引物和1X文库扩增混合物。相反,使用了以下引物,如表3A所示。
每个引物池中各个引物中的每一个的浓度为1,000nM(在5X浓度下)。扩增反应中各个引物的浓度为200nM(1X反应浓度)。在进行扩增方案之前,将低TE瓶从冷藏的文库试剂盒中取出,解冻并储存在环境位置。还制备了用于文库纯化的乙醇(70%)。为了开始扩增方案,将来自文库试剂盒的HiFi混合物解冻并涡旋5秒以混合。从冷藏中取出引物池(16S引物池和种引物池),温热至室温,涡旋5秒以混合,并快速旋转以将液体抽至管底。接下来,对于每个单独的引物池反应,将引物池、Hifi混合物、待扩增的样品DNA和无核酸酶水(例如,未经DEPC处理的InvitrogenTM无核酸酶水;赛默飞世尔科技公司;目录号AM9937)组合在表4和表5中列出的96孔反应板中(对每个样品进行两个单独的扩增反应:两个引物池中的每一个都进行一个扩增反应)。
将96孔反应板用MicroAmpTM澄清粘合膜(赛默飞世尔科技公司;目录号4306311)密封,并涡旋5秒以彻底混合组分。快速旋转板以将液体吸到板的底部,并将MicroAmpTM压缩垫放置在板上,然后将板放置在热循环仪中。使用表6中列出的循环参数进行扩增反应。
为了修剪扩增子的末端,将引物末端用来自文库试剂盒的FuPa试剂部分消化。将板从热循环仪中取出并快速旋转以将液体抽到板的底部,然后开封。将FuPa试剂(2μl)添加到20μl经扩增的DNA样品中。将板用MicroAmpTM澄清粘合膜密封,涡旋5秒以彻底混合组分,并快速旋转。将MicroAmpTM压缩垫放置在板上,然后将板放置在热循环仪中。使用表6中列出的循环参数进行消化反应。
然后将来自每个反应的经修剪的扩增子与IONCodeTM条形码衔接子1-384(赛默飞世尔科技公司;目录号A29751)连接。不同的衔接子对连接到单独的扩增子文库。每个衔接子对含有条形码衔接子和ION P1衔接子,以便在GeneStudioTM S5测序系统中实现不同文库的唯一鉴定和测序。在准备连接反应时,将文库试剂盒中的交换溶液和条形码衔接子分别温热至室温,涡旋5秒并快速旋转。从热循环仪中取出来自消化反应的文库板,快速旋转,并从板中取出密封膜。然后将连接反应的组分添加到板的孔中,如表7所示。
将反应板用MicroAmpTM澄清粘合膜密封,涡旋5秒以彻底混合组分,快速旋转并将MicroAmpTM压缩垫放置在板上,然后将板放置在热循环仪中。使用表6中列出的热参数进行连接反应。
使用Agencourt AMPure XP试剂(赛默飞世尔科技公司;目录号NC9959336)纯化文库。首先,通过将100%乙醇与无核酸酶水组合来制备70%乙醇(需要每个文库300μl加上死体积:210μl 100%乙醇+90μl无核酸酶水)。将Agencourt AMPure XP试剂温热至室温并在使用前立即涡旋30秒。从热循环仪中取出文库板,快速旋转,并从板中取出密封膜。将Agencourt AMPure XP试剂(45μl)添加到每个文库中,并将每个文库的内容物上下移液5次以混合组分。将混合物在室温下温育5分钟,然后将板置于DynaMag-96 Side Magnet板架中并在室温下温育2分钟或直至混合物澄清。第一个洗涤步骤通过以下进行的:在不干扰沉淀的情况下移除上清液,添加150μl新鲜制备的70%乙醇并将板在DynaMag板支架中左右移动3次以清洗珠子。洗涤步骤重复一次,并且在洗涤后,移除所有上清液,将板风干5分钟,然后从DynaMag板架中取出。为了从AMPure XP珠子中洗脱文库DNA,将文库试剂盒中的50μl低TE添加到每个文库中,并将板用MicroAmpTM澄清粘合膜密封,涡旋5秒,快速旋转并在室温下温育2分钟。将板置于DynaMag-96 Side Magnet板架中并在室温下温育2分钟或直至混合物澄清。然后从板上取下密封件,将含有经洗脱的文库的上清液转移到新的96孔板或管中,而不干扰沉淀。板或管标有样品信息,并在+4℃短期或-20℃长期下储存。
使用实时PCR和Ion Library TaqManTM定量试剂盒(赛默飞世尔科技公司;目录号4468802)中提供的试剂对每个经洗脱的文库进行定量,同时对对照文库进行PCR反应进行系列稀释以创建标准曲线和无模板对照。对每个经洗脱的文库、对照文库和无模板对照进行两次重复定量反应,并使用平均值计算最终文库浓度。能够在单个反应板上对四十四个经洗脱的文库进行定量。在测量浓度之前,将经洗脱的文库在低TE中预稀释(例如,1:500)。所使用的板布局的实例如表8所示。
表8–44个文库、3个对照文库和1个无模板对照的文库定量模板布局
将来自定量试剂盒的TaqMan PCR预混物管、TaqMan定量测定管和对照文库管温热至室温,涡旋5秒以混合并快速旋转。制备来自对照文库的原液浓度(68pM)的三个1:10系列稀释液,用于生成如下标准曲线。将低TE(45μl)添加到被标记为STD01、STD02、STD03和NTC的4个微量离心管中的每一个中。将原液浓度对照文库(5μl)添加到标有STD01的管中,然后盖上盖子,涡旋5秒并快速旋转。将来自STD01管的五微升经稀释的文库添加到STD02管中,然后盖上盖子,涡旋5秒并快速旋转,然后将来自STD02管的5μl经稀释的文库添加到STD03管中,该管也盖上盖子,涡旋5秒并快速旋转。这产生了3个对照文库系列稀释液用作标准品,其浓度如下:6.8pm(STD01)、0.68pM(STD02)和0.068pM(STD03)。无模板对照(NTC)管不包含文库。然后制备扩增反应。每个文库有两个重复的反应,对其结果取平均值。每个反应包含来自预混物管、测定管和文库管(经洗脱的样品、STD或NTC)的等分试样,如表9中所列。
将反应板用粘合膜密封,涡旋5秒,快速旋转并置于实时PCR仪中。使用表10和11中列出的热循环参数和板运行设置设置进行文库定量反应。
将每个文库都归一化为50pM的浓度。施用文库定量的结果计算达到50pM浓度所需的稀释因子。如果文库浓度等于或低于50pM,则不需要稀释。为了归一化文库,使用以下公式计算将文库归一化为50pM所需的稀释因子:稀释因子=(经洗脱的文库浓度pM)/(50pM)。将经洗脱的文库温热至室温,涡旋5秒并快速旋转。在微量离心管或板中使用计算出的稀释因子将经洗脱的文库与稀释液(低TE缓冲液)组合。使用至少5μl经洗脱的文库创建归一化的文库。将经稀释的文库涡旋5秒,快速旋转并在+4℃短期或-20℃长期下储存。
为了进行文库的测序,将由16S和种引物池产生的所有归一化的文库以等摩尔浓度组合,以形成浓度为50pM的池。文库池是通过组合等量的每个归一化的文库来创建的。通常使用至少5μl的每个洗脱文库来创建文库池。如果经洗脱的文库浓度等于或低于50pM,则将等体积的经洗脱的文库添加到池中。浓度低于50M的库可能无法生成足够的可用读段进行分析。将组合的文库池涡旋5秒,快速旋转并在+4℃短期或-20℃长期下储存。
准备文库用于测序
根据制造商的说明,使用Ion ChefTM仪器和Ion 540TM Kit-Chef和Ion 540TM芯片试剂盒,将最终文库的等分试样用于将文库扩增子模板化到珠支撑物(例如,离子微球颗粒)上。
实例2–文库模板DNA的测序
将含有文库DNA模板化珠子的半导体芯片加载到Ion S5测序仪(赛默飞世尔科技公司)中,并根据制造商的说明进行DNA模板的测序。
实例3–数据分析
分析从文库DNA模板测序中获得的读段,以鉴定和确定样品中微生物组成的水平。使用并入了Ion Torrent SuiteTM软件(赛默飞世尔科技公司)的工作流程和被设计成促进微生物DNA序列读段分析的运行计划模板进行分析。包含本文所述的计算方法的分析程序被称为AmpliSeq微生物组分析软件插件,所述插件为测定中靶向的扩增子生成计数。使用源自GreenGenes细菌16S rRNA基因序列公共数据库(参见例如,www.greengenes.lbl.gov)的参考序列映射从使用16S引物池生成的扩增子的测序中获得的读段。使用NCBI公共数据库(参见www.ncbi.nlm.nih.gov/genome/microbes/)中可用的参考微生物基因组序列映射从使用种引物池生成的扩增子的测序中获得的读段。
如图2所示,其是用于处理序列读段以确定微生物组成的方法的框图,分别分析了来自两个扩增子文库(16S引物池文库和种引物池文库)的读段。条形码/样品名称解析器将序列读段分成一组对应于使用16S引物池生成的扩增子(16S扩增子)的读段,一组对应于使用种引物池生成的扩增子(种扩增子)的读段。在此过程中,首先修剪来自BAM文件的未经比对的序列读段(使用BaseCaller软件执行质量和长度修剪),然后过滤以移除可能并非源自经扩增的DNA产物的短(例如,<60bp)读段。然后将BAM文件读段映射到参考序列。
图3是用于分析使用16S引物池生成的扩增子文库的扩增子处理流水线的框图。对16S扩增子读段进行两个比对/映射步骤。在第一个比对步骤中,在启用多重映射和端到端映射的情况下,将读段比对并映射到通过对全长细菌16S rRNA参考基因集进行计算机PCR获得的细菌16S rRNA参考基因序列的节段(例如,GreenGenes数据库),以生成预计将使用16S引物扩增的扩增子序列(即,预期的高变区扩增子)。基于每个16S引物对中的哪一个预计会扩增微生物中的序列以及16S引物对中的哪一个预计不会扩增微生物中的序列,产生了每种微生物预期的高变区扩增子的预期特征模式,所述每种微生物通过计算机PCR被鉴定为含有预期的高变区扩增子序列。例如,基于预计扩增子是否会针对微生物进行扩增,向每个微生物16S rRNA参考基因序列的可通过16S引物对扩增的8个高变区中的每一个高变区的扩增子分配二进制符号,以产生预期的特征模式,即1(表示预计会产生扩增子)和0(表示预计不会产生扩增子)。因此,例如,为了说明的目的,特定种的微生物可能具有以下预期高变区扩增子的特征模式:V2(1)、V2(0)、V2(1)、V3(1)、V4(0)、V5(1)、V6(1)、V7(0)、V8(1)、V8(0)、V8(1)、V9(0)。在此图中,用于对全长细菌16S rRNA参考基因集进行计算机PCR的16S引物池将包含用于扩增V2区的3个版本的引物(即,简并引物)、用于扩增V8区的3个版本的引物(即,简并引物),并且每个仅一个引物对用于扩增其它高变区(即,V3、V4、V5、V6、V7和V9)中的每一个高变区。在第一映射步骤中,将读段与的16S参考集的参考高变节段进行比对,其中启用了多映射和端到端映射。映射步骤确定比对的序列读段和相关的映射质量参数。映射的读段根据比对质量进行过滤。在第一个比对步骤之后,基于比对,根据由单独的16S引物对产生的不同预期高变区扩增子,将序列读段分离并分配到一个高变区,以生成每个种和菌株的每个靶标高变区的观察到的读段计数的矩阵。对分配给每种微生物的每个预期高变区的序列读段的数量进行计数以获得每种微生物的总序列读段计数,并且应用读段阈值(包含每个高变区的读段计数阈值,以及每个16S rRNA基因序列的总读段计数)执行如本文所述的一系列计算步骤,以减少将在第二次比对和映射中使用的参考序列的数量。因此,通过使用每个高变区的读段计数阈值以及每个16S rRNA基因序列的总读段计数来确定是否在第二个比对步骤中包含16S rRNA基因参考序列的决定。只有满足以下标准的那些16S rRNA基因参考序列未被从第二个映射步骤中所使用的参考序列中排除:每个序列的总读段计数至少达到阈值,每个高变区的读段计数至少达到阈值,并且读段的观察到的模式与预期的特征模式至少具有阈值水平的相似性。这组微生物被用作一组经过处理的、减少的、过滤后的、高置信度的微生物全长16S rRNA参考基因序列(与GreenGenes数据库中含有的原始完整的16S rRNA参考基因序列集相比),所有序列读段都在第二个比对步骤中与其进行比对。在用这种方法处理16S rRNA基因序列的原始数据库时,在第二个也是最后一个比对步骤中使用的参考序列的数量通常减少了至少50倍、75倍或更多,具体取决于样品中微生物的数量。此外,在第二个比对步骤中使用的参考序列的质量相对于原始数据库参考序列得到了极大的提高,因为在数据库的处理过程中未注释和错误分类的参考序列被鉴定、重新注释和纠正(基于序列相似性指标(levenshtein距离))。在第二个比对步骤之后,与过滤后的微生物序列组的每个参考16S rRNA基因序列比对的序列读段的总数被确定为每个参考序列的序列读段计数。只有与预期扩增子序列比对的序列读段被包含在读段计数中(即,基于扩增中使用的引物与16S rRNA基因中的未预期序列比对的读段被排除在计数之外)。通过将每个读段计数除以微生物的预期高变区扩增子的数量(例如,预期特征模式中“一”的数量)来对其进行归一化。在第二归一化步骤中,将第一归一化计数除以种的16S基因的平均拷贝数以形成第二归一化计数。该种的拷贝数可以从16S拷贝数数据库中获得,如rrnDB(https://rrndb.umms.med.umich.edu/;Stoddard S.F,Smith B.J.,Hein R.,Roller B.R.K.和Schmidt T.M.(2015)“rrnDB:用于解释细菌和古细菌中rRNA基因丰度的改进工具和未来发展的新基础(rrnDB:improved tools for interpreting rRNA geneabundance in bacteria and archaea and a new foundation for futuredevelopment.)”《核酸研究(Nucleic Acids Research)》2014;doi:10.1093/nar/gku1201)。对于给定的种,可以将数据库记录中给出的16S基因的拷贝数平均,以形成用于第二归一化步骤的平均拷贝数。然后将每个参考序列的归一化读段计数用于通过对每个种、属和科的读段计数进行求和来确定聚合读段计数。针对种水平、属水平和科水平聚合或添加第二归一化计数。计算聚合计数与映射读段的总数的百分比,并且如果满足阈值标准,则将阈值应用于种检测、属检测和科检测以给出相对丰度。如果百分比值大于相应的阈值,则种、属和/或科可被报告为存在。用于检测的阈值也可以被称为噪声阈值。
基于聚合读段计数,确定样品中是否存在种(种聚合读段计数必须满足大于总归一化读段计数的0.1%的阈值)、样品中是否存在属(属聚合读段计数必须满足大于总归一化读段计数的0.5%的阈值)以及样品中是否存在科(科聚合读段计数必须满足大于总归一化读段计数的1%的阈值)。相对丰度被报告为种特异性、属特异性和科特异性归一化读段计数各自除以总归一化读段计数。
使用微生物基因组序列作为参考(所述参考不限于基因子集),单独分析来自使用种引物池产生的扩增子的读段(图4),正如用于映射使用16S引物池生成的扩增子的读段的参考一样。在映射之前,对微生物基因组数据库进行了预处理,以提供更有效和更准确的扩增子读段与参考序列的比对。在该预处理中,对数据库中的微生物基因组序列进行计算机PCR分析,所述模拟使用种引物池中的引物进行,以从数据库中所有微生物菌株的全基因组生成预期的扩增子(引物+插入物)序列。计算机PCR结果鉴定数据库中含有将由种引物池中的引物扩增的序列的基因组。不包含将被种引物扩增的序列的任何基因组都从被数据库中消除。对含有将使用种引物进行扩增但预计不包含此类序列的序列的任何基因组进行评估,以确定基因组与预计通过引物扩增的基因组之间的平均核苷酸同一性(ANI)以评估可能的基因组错误分类和重新注释,以及基因组在数据库中的保留。只有当一个基因组与其被重新分类的基因组具有大于95%的同一性时,它才会被重新分类。在对参考数据库进行预处理之后,对序列读段进行比对并进行比对质量过滤。只有唯一映射到单个种(或者唯一映射到一个参考序列或同一种的多个参考序列)的那些读段包含在读段计数中。计算映射到一个种的读段数量,并确定每个种的聚合读段计数,通过将一个种的聚合数量除以该种的总扩增子数量(即,比对序列读段有最小阈值(例如,大于10)的种的扩增子总数)来进行归一化,并在种水平上报告。基于聚合读段计数,确定样品中是否存在种(种聚合读段计数必须满足大于总归一化读段计数的0.1%的阈值)。相对丰度被报告为种特异性归一化读段计数除以总归一化读段计数。
实例4–测定结果
制备了含有来自微生物种的DNA的样品混合物,如表12所示。样品是已知微生物DNA的混合物,具有不同的检测限。样品编号1-15含有等于或高于5%LOD的微生物DNA。样品编号16用作阴性对照。
如实例1中所述为每个样品制备两个文库:一个文库使用含有12个引物对(SEQ IDNO:1-24;参见表15)的16S引物池产生,1个文库使用含有236个引物对(SEQ ID NO:49-520参见表16)是种引物池产生。每个文库的四个重复等分试样包含在半导体测序芯片上,并如实例2所述进行测序。使用斯皮尔曼相关系数评估重复样品细菌检测结果的能力,其是一种用于测量两个变量之间关联强度的非参数检验(等级顺序相关性),其中r=1表示完全正相关。该测试基于检测两个变量(即,重复)之间的单调趋势,而不仅仅是线性趋势。这种分析更适合读段计数,因为它没有假设正态分布。图5A是用于对使用16S引物池生成的文库进行重复测序的斯皮尔曼相关系数的绘图。图5B是用于对使用种引物池生成的文库进行重复测序的斯皮尔曼相关系数的绘图。如5A和5B所示,其描绘了从六个样品产生的文库的四个重复等分试样的测序结果的比较,该测定在样品间是非常可重复的。
使用16S引物池对从样品编号1产生的文库进行测序的16S序列读段的分析结果的实例显示在图6A和6B中(图6A中所示的丙酸杆菌(Propionibacterium)是丙酸杆菌(Cutibacterium)的学名)。图6A显示,在测序测定中检测到样品编号1(MSA1002)中存在的18个细菌属中的所有18个细菌属。图6A示出了使用全长16S rRNA基因序列的第一缩减集(没有重新注释)并且在没有第一和第二归一化步骤316(参见图3中的框图)的情况下应用第二映射步骤312的结果。图6A中的虚线602是y轴上的映射读段总数的1.5%,其代表了该分析中被视为“噪声”或背景的映射读段的数量阈值。该阈值可以针对任何给定的分析而变化,其是映射读段总数中映射读段的数量,所述映射读段可被认为归因于非特异性序列,如引物二聚体、错误扩增产物和截断的读段。超过噪声阈值的每个属或种的映射读段的数量是那些被认为是特定的、相关的和与等于或低于读段阈值数量的读段不同的读段。图6B给出了使用16S引物池生成的样品编号1(MSA1002)文库的实例的噪声阈值、灵敏度和PPV的表格。该测定具有高度的可重复性,如在使用16S引物池从样品编号1(MSA1002)生成的文库的四个重复等分试样的测序结果的比较分析中所示(参见图7)。
来自对使用种引物池从样品编号1生成的文库的测序的靶标种序列读段的分析结果的实例显示在图8A和8B中。样品编号1(MSA1002)含有20个不同的细菌种,其中7个使用种引物池通过文库制备扩增(如实例1中所述)进行靶向。在图8A中,在从样品编号1生成文库时被种引物靶向的所有7个细菌种(普通拟杆菌、大肠杆菌、牙龈卟啉单胞菌、痤疮丙酸杆菌、幽门螺杆菌、粪肠球菌和青春双歧杆菌)被检测到并正确地鉴定,而在1%的映射读段的噪声阈值下未检测到其它非靶标种。图8A中的虚线802是y轴上的映射读段总数的1.0%,其代表了可以检测到样品中存在的种的阈值。用户可以为任何给定的分析设置此阈值。使用种引物池产生文库扩增子的测定的分辨率高于使用16S引物池的测定的分辨率。例如,在使用种引物池从样品编号1(MSA1002)生成的文库中检测到的唯一双歧杆菌种是青春双歧杆菌,其是样品编号1中含有的唯一双歧杆菌种。然而,来自使用16S引物池从样品编号1生成的文库的序列的读段映射到另外四个双歧杆菌种,以及映射到青春双歧杆菌,在读段所映射到的5个双歧杆菌种中,所述青春双歧杆菌确实具有最大数量的读段计数。图8B给出了使用种引物池生成的样品编号1(MSA1002)文库的实例的噪声阈值、灵敏度和PPV的表格。该测定具有高度的可重复性,如在使用种引物池从样品编号1(MSA1002)生成的文库的四个重复等分试样的测序结果的比较分析中所示(参见图9)。
为对样品测序结果进行的分析评估的性能指标包含计算精度(或阳性预测值;PPV)和灵敏度(或召回率)以及生成精度召回率(PR)曲线。PR评估是预测成功与否的有用度量,特别是对于不等的类分布。精度是结果相关性的度量,而召回率是分析中返回的相关结果的数量的度量。高精度与低假阳性率相关,并且高召回率与低假阴性率相关。精度的计算方法是在测试中被鉴定为阳性的结果的数量(即,真阳性)除以在测试中被鉴定为阳性的结果的总数(即,真阳性+假阳性)。召回率的计算方法是在测试中被鉴定为阳性的结果的数量(即,真阳性)除以真阳性数加上假阴性数。PR曲线是不同阈值的精度对比召回率的关系图。PR曲线下的高面积(AUC)反映了高召回率和高精度以及许多正确鉴定的结果。为分析从一个芯片的测序获得的序列读段确定的性能指标显示在表13和14中。表13示出了16S序列读段的结果的实例,其中为属水平检测设置了噪声阈值。表14示出了靶标种序列读段的结果的实例,其中为种水平检测设置了噪声阈值。
a噪声阈值占映射读段的百分比
b通过16S rRNA基因高变区分析很难分辨肠杆菌科(参见例如,Chakravorty等人(2007)《微生物学方法杂志》69(2):330-339)。
实例5–引物和扩增子序列
此实例提供了引物序列,所述引物序列可以包含在用于在测定中扩增微生物16SrRNA(表15)和微生物种特异性DNA序列(表16)以鉴定微生物和/或表征样品中的微生物群体的池中。表17提供了微生物序列,所述微生物序列中的一些或全部可以被用于此类测定的种引物池中的引物靶向。
示例性实施例
本章节提供了本文所述的组合物和方法的示例性实施例:
A1.一种组合物,其包括一个或多个引物或引物对,所述一个或多个引物或引物对能够特异性地扩增微生物的基因组内含有的靶核酸序列,所述微生物选自:
(a)粘性放线菌、嗜黏蛋白阿克曼菌、阴道厌氧球菌、极小奇异菌、脆弱拟杆菌、诺迪拟杆菌、多形拟杆菌、普通拟杆菌、肠道巴恩斯氏菌、青春双歧杆菌、动物双歧杆菌、两歧双歧杆菌、长双歧杆菌、类球布劳特氏菌、卵形布劳特氏菌、伯氏疏螺旋体、简明弯曲杆菌、曲形弯曲杆菌、纤细弯曲杆菌、人弯曲杆菌、空肠弯曲杆菌、直肠弯曲杆菌、肺炎衣原体、沙眼衣原体、鼠柠檬酸杆菌、波氏克洛杆菌、艰难梭菌、产气柯林斯菌、粪便柯林斯菌、痤疮丙酸杆菌、阿拉斯加脱硫弧菌、产甲酸多尔氏菌、屎肠球菌、粪肠球菌、鹑鸡肠球菌、海氏肠球菌、大肠杆菌、粘液真杆菌、直肠真杆菌、普氏栖粪杆菌、具核梭杆菌、阴道加特纳菌、甲酸芽殖菌、胆型螺杆菌、毕氏螺杆菌、肝螺杆菌、幽门螺杆菌、扎氏螺杆菌、丝状霍尔德曼氏菌、肺炎克雷伯氏菌、嗜酸乳杆菌、德氏乳杆菌、约氏乳杆菌、鼠乳杆菌、罗伊氏乳杆菌、鼠李糖乳杆菌、乳酸乳球菌、发酵支原体、渗透支原体、狄氏副拟杆菌、屎副拟杆菌、微小微单胞菌、厌氧消化链球菌、口腔消化链球菌、粪考拉杆菌、牙龈卟啉单胞菌、人体普氏菌、栖组织普氏菌、奇异变形杆菌、肠道罗斯氏菌、布氏瘤胃球菌、活泼瘤胃球菌、弱生斯莱克氏菌、解没食子酸链球菌、婴儿链球菌、小韦荣氏球菌,或
(b)(a)的微生物,不包含粘性放线菌,或
(c)嗜黏蛋白阿克曼菌、阴道厌氧球菌、极小奇异菌、脆弱拟杆菌、诺迪拟杆菌、多形拟杆菌、普通拟杆菌、肠道巴恩斯氏菌、青春双歧杆菌、动物双歧杆菌、两歧双歧杆菌、长双歧杆菌、类球布劳特氏菌、卵形布劳特氏菌、伯氏疏螺旋体、简明弯曲杆菌、曲形弯曲杆菌、纤细弯曲杆菌、人弯曲杆菌、空肠弯曲杆菌、直肠弯曲杆菌、肺炎衣原体、沙眼衣原体、鼠柠檬酸杆菌、波氏克洛杆菌、艰难梭菌、产气柯林斯菌、粪便柯林斯菌、痤疮丙酸杆菌、阿拉斯加脱硫弧菌、产甲酸多尔氏菌、屎肠球菌、粪肠球菌、鹑鸡肠球菌、海氏肠球菌、大肠杆菌、粘液真杆菌、直肠真杆菌、普氏栖粪杆菌、具核梭杆菌、阴道加特纳菌、甲酸芽殖菌、胆型螺杆菌、毕氏螺杆菌、肝螺杆菌、幽门螺杆菌、扎氏螺杆菌、丝状霍尔德曼氏菌、肺炎克雷伯氏菌、嗜酸乳杆菌、德氏乳杆菌、约氏乳杆菌、鼠乳杆菌、罗伊氏乳杆菌、鼠李糖乳杆菌、乳酸乳球菌、发酵支原体、渗透支原体、狄氏副拟杆菌、屎副拟杆菌、微小微单胞菌、厌氧消化链球菌、口腔消化链球菌、粪考拉杆菌、牙龈卟啉单胞菌、人体普氏菌、栖组织普氏菌、奇异变形杆菌、肠道罗斯氏菌、布氏瘤胃球菌、活泼瘤胃球菌、弱生斯莱克氏菌、解没食子酸链球菌、婴儿链球菌、小韦荣氏球菌,或
(d)(c)的微生物,不包含类球布劳特氏菌和/或扎氏螺杆菌。
A2.一种组合物,其包括一种或多种核酸,所述一种或多种核酸与选自实施例A1中所列微生物的微生物的基因组内含有的靶核酸序列特异性地结合和/或杂交。
A3.根据实施例A2所述的组合物,其中所述一种或多种核酸在包括多种不同微生物的基因组的核酸的混合物中与所述微生物的基因组内含有的靶核酸序列特异性地结合和/或杂交。
A4.根据实施例A3所述的组合物,其中所述混合物包括与含有所述靶核酸序列的微生物来自同一属的不同微生物的基因组的核酸。
A5.根据实施例A2所述的组合物,其中与微生物的基因组内含有的靶核酸序列特异性地结合和/或杂交的所述一种或多种核酸不与任何其它属的微生物内含有的核酸结合和/或杂交。
A6.根据实施例A2所述的组合物,其中与微生物的基因组内含有的核酸序列特异性地结合和/或杂交的所述一种或多种核酸不与任何其它种的微生物内含有的核酸结合和/或杂交。
A7.根据实施例A2所述的组合物,其中所述一种或多种核酸包括选自以下的核苷酸序列或基本上由选自以下的核苷酸序列组成:表16中的序列;或表16的SEQ ID NO:49-520;或表16的SEQ ID NO:49-452、457-472和481-520;或表16的SEQ ID NO:49-492;或表16的SEQ ID NO:49-452、457-472和481-492;或表16A的SEQ ID NO:49-480;或表16A的SEQ IDNO:49-452和457-472;或表16C的SEQ ID NO:521-826;或表16C的SEQ ID NO:521-820;或表16的SEQ ID NO:827-1298;或表16的SEQ ID NO:827-1230、1235-1250和1259-1298;或表16的SEQ ID NO:827-1270;或表16的SEQ ID NO:827-1230、1235-1250和1259-1270;或表16D的SEQ ID NO:827-1258;或表16D的SEQ ID NO:827-1230和1235-1250;或表16F的SEQ IDNO:1299-1604;或表16F的SEQ ID NO:1299-1598,或与其基本上相同或相似的序列,或任何上述核苷酸序列,其中一个或多个胸腺嘧啶碱基被尿嘧啶碱基取代。
A8.根据实施例A1或A2所述的组合物,其中微生物的基因组内含有的所述靶核酸序列包括选自以下的核苷酸序列或基本上由选自以下的核苷酸序列组成:表17中的SEQ IDNO:1605-1979、或表17的SEQ ID NO:1605-1806、1809-1816、1821-1970、1972-1974和1977-1979、或表17中的SEQ ID NO:1605-1826、或表17中的SEQ ID NO:1605-1806、1809-1816和1821-1826、或表17A中的SEQ ID NO:1605-1820、或表17A中的SEQ ID NO:1605-1806和1809-1816、或表17C中的SEQ ID NO:1827-1979、或表17C中的SEQ ID NO:1827-1976中的核苷酸序列,或其补体。
A9.根据实施例A1所述的组合物,其中所述引物对在包括多种不同微生物的基因组的核酸的扩增反应混合物中特异性地扩增所述靶核酸。
A10.根据实施例A9所述的组合物,其中所述扩增反应混合物包括与含有所述靶核酸序列的微生物来自同一属的不同微生物的基因组的核酸。
A11.根据实施例A1所述的组合物,其中所述引物对不扩增任何其它属的微生物内含有的核酸序列。
A12.根据实施例A1所述的组合物,其中所述引物对不扩增任何其它种的微生物内含有的核酸序列。
A13.根据实施例A1所述的组合物,其中所述引物或引物对包括选自以下的一个或多个序列或基本上由选自以下的一个或多个序列组成:表16中的序列;或表16的SEQ IDNO:49-520;或表16的SEQ ID NO:49-452、457-472和481-520;或表16的SEQ ID NO:49-492;或表16的SEQ ID NO:49-452、457-472和481-492;或表16A的SEQ ID NO:49-480;或表16A的SEQ ID NO:49-452和457-472;或表16C的SEQ ID NO:521-826;或表16C的SEQ ID NO:521-820;或表16的SEQ ID NO:827-1298;或表16的SEQ ID NO:827-1230、1235-1250和1259-1298;或表16的SEQ ID NO:827-1270;或表16的SEQ ID NO:827-1230、1235-1250和1259-1270;或表16D的SEQ ID NO:827-1258;或表16D的SEQ ID NO:827-1230和1235-1250;或表16F的SEQ ID NO:1299-1604;或表16F的SEQ ID NO:1299-1598,或与其基本上相同或相似的序列,或任何上述核苷酸序列,其中一个或多个胸腺嘧啶碱基被尿嘧啶碱基取代。
A14.根据实施例A1和A8-A13中任一项所述的组合物,其中所述引物对中的至少一个引物或所述引物对中的两个引物含有相对于所述靶核酸序列的修饰,其增加所述引物对切割的易感性。
A15.根据实施例A1和A8-A13中任一项所述的组合物,其中所述引物对中的至少一个引物含有一个或多个或两个或更多个尿嘧啶核碱基,或者其中所述引物对中的两个引物含有一个或多个或两个或更多个尿嘧啶核碱基。
A16.一种组合物,其包括根据实施例A1-A15中任一项所述的多个核酸和/或核酸引物或引物对。
A17.根据实施例A16所述的组合物,其中所述多个核酸、引物和/或引物对包括与实施例A1中列出的每种微生物的基因组靶核酸特异性地结合和/或杂交的至少一种核酸和/或特异性地扩增所述基因组靶核酸的至少一个引物对。
A18.根据实施例A16所述的组合物,其中所述多个引物对包括至少一个引物对,所述至少一个引物对特异性地和单独地扩增实施例A1的至少5种、10种、15种、20种、25种、30种、35种、40种、45种、50种、55种、60种、70种微生物中的每一种微生物的基因组靶核酸。
A19.根据实施例A16–A18中任一项所述的组合物,其中所述多个引物对包括至少一个引物对,所述至少一个引物对扩增包括选自以下的核苷酸序列的靶核酸序列:表17;或表17中的SEQ ID NO:1605-1979;或表17的SEQ ID NO:1605-1806、1809-1816、1821-1970、1972-1974和1977-1979;或表17中的SEQ ID NO:1605-1826;或表17中的SEQ ID NO:1605-1806、1809-1816和1821-1826;或表17A中的SEQ ID NO:1605-1820;或表17A中的SEQ IDNO:1605-1806和1809-1816;或表17C中的SEQ ID NO:1827-1979;或表17C中的SEQ ID NO:1827-1976,或基本上相同或相似的序列,或其补体,以产生长度小于约500个、小于约475个、小于约450个、小于约400个、小于约375个、小于约350个、小于约300个、小于约275个、小于约250个、小于约200个、小于约175个、小于约150个或小于约100个核苷酸的扩增子序列,或基本上由选自表17、或表17中的SEQ ID NO:1605-1979、或表17的SEQ ID NO:1605-1806、1809-1816、1821-1970、1972-1974和1977-1979、或表17中的SEQ ID NO:1605-1826、或表17中的SEQ ID NO:1605-1806、1809-1816和1821-1826、或表17A中的SEQ ID NO:1605-1820、或表17A中的SEQ ID NO:1605-1806和1809-1816、或表17C中的SEQ ID NO:1827-1979、或表17C中的SEQ ID NO:1827-1976或基本上相同或相似的序列并且任选地在序列的5'和/或3'端含有一个或多个核酸引物序列的核苷酸序列组成的扩增子序列。
A20.根据实施例A16-A19中任一项所述的组合物,其中所述多个引物对中的每个引物对特异性地扩增不同的靶核酸序列。
A21.根据实施例A16所述的组合物,其中所述多个引物对的序列包括以下各项或基本上由以下各项组成:表16中的序列;或表16的SEQ ID NO:49-520;或表16的SEQ ID NO:49-452、457-472和481-520;或表16的SEQ ID NO:49-492;或表16的SEQ ID NO:49-452、457-472和481-492;或表16A的SEQ ID NO:49-480;或表16A的SEQ ID NO:49-452和457-472;或表16C的SEQ ID NO:521-826;或表16C的SEQ ID NO:521-820;或表16的SEQ ID NO:827-1298;或表16的SEQ ID NO:827-1230、1235-1250和1259-1298;或表16的SEQ ID NO:827-1270;或表16的SEQ ID NO:827-1230、1235-1250和1259-1270;或表16D的SEQ ID NO:827-1258;或表16D的SEQ ID NO:827-1230和1235-1250;或表16F的SEQ ID NO:1299-1604;或表16F的SEQ ID NO:1299-1598,或与其基本上相同或相似的序列,或任何上述核苷酸序列,其中一个或多个胸腺嘧啶碱基被尿嘧啶碱基取代。
A22.根据实施例A1和A8-A21中任一项所述的组合物,其进一步包括一个或多个引物或引物对,所述一个或多个引物或引物对单独地扩增包括原核16S rRNA基因的高变区内含有的核苷酸序列的核酸。
A23.根据实施例A22所述的组合物,其中扩增包括原核16S rRNA基因的高变区内含有的核苷酸序列的核酸的所述一个或多个引物或引物对单独地扩增包括原核16S rRNA基因的高变区内含有的核苷酸序列的核酸。
A24.根据实施例A1–A23中任一项所述的组合物,其进一步包括来自生物体消化道的样品的核酸。
A25.根据实施例A24所述的组合物,其中所述样品是粪便样品。
A26.根据实施例A1-A25中任一项所述的组合物,其进一步包括聚合酶。
A27.一种组合物,其包括能够扩增靶核酸序列的一个或多个引物对,所述靶核酸序列包括选自以下的核苷酸序列:表17;或表17中的SEQ ID NO:1605-1979;或表17的SEQID NO:1605-1806、1809-1816、1821-1970、1972-1974和1977-1979;或表17中的SEQ ID NO:1605-1826;或表17中的SEQ ID NO:1605-1806、1809-1816和1821-1826;或表17A中的SEQID NO:1605-1820;或表17A中的SEQ ID NO:1605-1806和1809-1816;或表17C中的SEQ IDNO:1827-1979;或表17C中的SEQ ID NO:1827-1976,或基本上相同或相似的序列,或其补体。
A28.根据实施例A27所述的组合物,其中所述引物对特异性地扩增所述靶核酸序列。
A29.根据实施例A27或实施例A28所述的组合物,其中所述引物对中的至少一个引物或所述引物对中的两个引物含有相对于所述靶核酸序列的修饰,其增加所述引物对切割的易感性。
A30.根据实施例A27或实施例A28所述的组合物,其中所述引物对中的至少一个引物含有一个或多个或两个或更多个尿嘧啶核碱基,或者其中所述引物对中的两个引物含有一个或多个或两个或更多个尿嘧啶核碱基。
A31.一种组合物,其包括根据实施例A27-A30中任一项所述的多个引物对。
A32.根据实施例A31所述的组合物,其中所述多个引物对中的每个引物对扩增不同的靶核酸序列。
A33.一种包括引物对组合的组合物,其中所述引物对组合中的至少三个引物对中的每一个能够单独地扩增包括原核16S rRNA基因的不同高变区的序列的核酸,并且其中所述高变区之一是V5区。
A34.一种包括引物对组合的组合物,其中所述引物对组合中的至少八个不同引物对中的每一个能够单独地扩增包括原核16S rRNA基因的不同高变区的序列的核酸。
A35.根据实施例A33所述的组合物,其中所述引物对组合中的至少4个、至少5个、至少6个、至少7个或至少8个或更多个不同引物对中的每一个能够单独地扩增包括原核16SrRNA基因的不同高变区的序列的核酸。
A36.根据实施例A33-A35中任一项所述的组合物,其中包括高变区的序列的所述核酸的长度小于约200bp、或小于约175bp、或小于约150bp、或小于约125bp。
A37.根据实施例A33-A36中任一项所述的组合物,其中所述引物对组合中的每个引物含有少于7个连续核苷酸,其序列与所述引物对组合中另一引物的连续核苷酸序列相同。
A38.根据实施例A33-A37中任一项所述的组合物,其中包括高变区的序列的所述核酸还含有原核16S rRNA基因的保守区序列。
A39.根据实施例A38所述的组合物,其中对于通过所述引物对组合扩增的所述高变区序列中的至少一个,所述引物对组合中的至少两个不同的引物对单独地扩增含有原核属的2个或更多个种的同一高变区的序列的核酸,所述原核属在同一保守区的核酸序列中存在差异。
A40.根据实施例A39所述的组合物,其中所述至少一个高变区是V2区和/或V8区。
A41.根据实施例A33所述的组合物,其中所述引物对的组合包括含有选自表15中的SEQ ID NO:1-48的序列的引物对。
A42.根据实施例A34所述的组合物,其中所述引物对的组合包括含有选自表15中的SEQ ID NO:1-48的序列的引物对。
A43.根据实施例A33或实施例A34所述的组合物,其中所述引物对的组合包括含有选自表15的SEQ ID NO:1-24和/或表15的SEQ ID NO:25-48的序列的引物对。
A44.根据实施例A33或实施例A34所述的组合物,其中所述引物对的组合包括含有选自表15的SEQ ID NO:25-48的序列的引物对,其中一个或多个胸腺嘧啶碱基被尿嘧啶碱基取代。
A45.一种包括两个或更多个引物的组合物,其中所述引物包括选自SEQ ID NO:11-16、23和24的序列,或基本上由所述序列组成。
A46.一种包括两个或更多个引物的组合物,其中所述引物包括选自SEQ ID NO:35-40、47和48的序列,或基本上由所述序列组成。
A47.根据实施例A33-A46中任一项所述的组合物,其中至少一个引物对中的至少一个引物或两个引物含有相对于被扩增的核酸序列的修饰,其中所述修饰增加所述引物对切割的易感性。
A48.根据实施例A33-A46中任一项所述的组合物,其中至少一个引物对中的至少一个引物或两个引物含有一个或多个或两个或更多个尿嘧啶核碱基。
A49.一种包括核酸的组合物,其中所述核酸包括基本上由选自以下的核苷酸序列组成的一个或多个单链核酸:表17、或表17中的SEQ ID NO:1605-1979、或表17的SEQ IDNO:1605-1806、1809-1816、1821-1970、1972-1974和1977-1979、或表17中的SEQ ID NO:1605-1826、或表17中的SEQ ID NO:1605-1806、1809-1816和1821-1826、或表17A中的SEQID NO:1605-1820、或表17A中的SEQ ID NO:1605-1806和1809-1816、或表17C中的SEQ IDNO:1827-1979、或表17C中的SEQ ID NO:1827-1976或基本上相同或相似的序列或其补体,和/或基本上由选自以下的核苷酸序列组成的一个或多个双链核酸:表17、或表17中的SEQID NO:1605-1826、或表17A中的SEQ ID NO:1605-1820、或表17C中的SEQ ID NO:1827-1979、或表17C中的SEQ ID NO:1827-1976或基本上相同或相似的序列或其补体,以及与其杂交的互补核苷酸序列。
A50.一种包括核酸的组合物,其中所述核酸包括一个或多个单链核酸,所述一个或多个单链核酸基本上由以下组成:
(a)选自表17、或表17中的SEQ ID NO:1605-1979、或表17的SEQ ID NO:1605-1806、1809-1816、1821-1970、1972-1974和1977-1979、或表17中的SEQ ID NO:1605-1826、或表17中的SEQ ID NO:1605-1806、1809-1816和1821-1826、或表17A中的SEQ ID NO:1605-1820、或表17A中的SEQ ID NO:1605-1806和1809-1816、或表17C中的SEQ ID NO:1827-1979、或表17C中的SEQ ID NO:1827-1976的核苷酸序列,或基本上相同或相似的序列,或其补体,以及
(b)核酸的5'和/或3'端的一个或多个序列,其中所述一个或多个序列选自表16、或表16的SEQ ID NO:49-520、或表16的SEQ ID NO:49-452、457-472和481-520、或表16的SEQ ID NO:49-492、或表16的SEQ ID NO:49-452、457-472和481-492、或表16A的SEQ IDNO:49-480、或表16A的SEQ ID NO:49-452和457-472、或表16C的SEQ ID NO:521-826、或表16C的SEQ ID NO:521-820、或表16的SEQ ID NO:827-1298、或表16的SEQ ID NO:827-1230、1235-1250和1259-1298、或表16的SEQ ID NO:827-1270、或表16的SEQ ID NO:827-1230、1235-1250和1259-1270、或表16D的SEQ ID NO:827-1258、或表16D的SEQ ID NO:827-1230和1235-1250、或表16F的SEQ ID NO:1299-1604、或表16F的SEQ ID NO:1299-1598,或与其基本上相同或相似的序列,或其补体。
A51.一种包括核酸的组合物,其中所述核酸包括一个或多个双链核酸,所述一个或多个双链核酸基本上由以下组成:
(a)选自表17、或表17中的SEQ ID NO:1605-1979、或表17的SEQ ID NO:1605-1806、1809-1816、1821-1970、1972-1974和1977-1979、或表17中的SEQ ID NO:1605-1826、或表17中的SEQ ID NO:1605-1806、1809-1816和1821-1826、或表17A中的SEQ ID NO:1605-1820、或表17A中的SEQ ID NO:1605-1806和1809-1816、或表17C中的SEQ ID NO:1827-1979、或表17C中的SEQ ID NO:1827-1976的核苷酸序列,或基本上相同或相似的序列,以及与其杂交的互补核苷酸序列,以及
(b)核酸的5'和/或3'端的一个或多个序列,其中所述一个或多个序列选自表16、或表16的SEQ ID NO:49-520、或表16的SEQ ID NO:49-452、457-472和481-520、或表16的SEQ ID NO:49-492、或表16的SEQ ID NO:49-452、457-472和481-492、或表16A的SEQ IDNO:49-480、或表16A的SEQ ID NO:49-452和457-472、或表16C的SEQ ID NO:521-826、或表16C的SEQ ID NO:521-820、或表16的SEQ ID NO:827-1298、或表16的SEQ ID NO:827-1230、1235-1250和1259-1298、或表16的SEQ ID NO:827-1270、或表16的SEQ ID NO:827-1230、1235-1250和1259-1270、或表16D的SEQ ID NO:827-1258、或表16D的SEQ ID NO:827-1230和1235-1250、或表16F的SEQ ID NO:1299-1604、或表16F的SEQ ID NO:1299-1598,或与其基本上相同或相似的序列,以及与其杂交的互补核苷酸序列。
A52.一种组合物,其包括:
(a)样品中的或来自样品的核酸,其中所述样品包括多种微生物,以及
(b)组合物,所述组合物包括根据实施例A1-A48中任一项所述的核酸、一个或多个引物和/或引物对。
A53.根据实施例A52所述的组合物,其进一步包括聚合酶。
A54.根据实施例A52或A53所述的组合物,其中所述样品来自动物消化道的内容物。
A55.根据实施例A54所述的组合物,其中所述样品是粪便样品。
A56.根据实施例A54或实施例A55所述的组合物,其中所述动物是哺乳动物。
A57.根据实施例A56所述的组合物,其中所述动物是人。
A58.一种组合物,其包括:
(a)至少76个核酸引物对,其中所述核酸引物对的组合能够特异性地扩增选自以下的任何微生物的基因组内含有的不同靶核酸序列:粘性放线菌、嗜黏蛋白阿克曼菌、阴道厌氧球菌、极小奇异菌、脆弱拟杆菌、诺迪拟杆菌、多形拟杆菌、普通拟杆菌、肠道巴恩斯氏菌、青春双歧杆菌、动物双歧杆菌、两歧双歧杆菌、长双歧杆菌、类球布劳特氏菌、卵形布劳特氏菌、伯氏疏螺旋体、简明弯曲杆菌、曲形弯曲杆菌、纤细弯曲杆菌、人弯曲杆菌、空肠弯曲杆菌、直肠弯曲杆菌、肺炎衣原体、沙眼衣原体、鼠柠檬酸杆菌、波氏克洛杆菌、艰难梭菌、产气柯林斯菌、粪便柯林斯菌、痤疮丙酸杆菌、阿拉斯加脱硫弧菌、产甲酸多尔氏菌、屎肠球菌、粪肠球菌、鹑鸡肠球菌、海氏肠球菌、大肠杆菌、粘液真杆菌、直肠真杆菌、普氏栖粪杆菌、具核梭杆菌、阴道加特纳菌、甲酸芽殖菌、胆型螺杆菌、毕氏螺杆菌、肝螺杆菌、幽门螺杆菌、扎氏螺杆菌、丝状霍尔德曼氏菌、肺炎克雷伯氏菌、嗜酸乳杆菌、德氏乳杆菌、约氏乳杆菌、鼠乳杆菌、罗伊氏乳杆菌、鼠李糖乳杆菌、乳酸乳球菌、发酵支原体、渗透支原体、狄氏副拟杆菌、屎副拟杆菌、微小微单胞菌、厌氧消化链球菌、口腔消化链球菌、粪考拉杆菌、牙龈卟啉单胞菌、人体普氏菌、栖组织普氏菌、奇异变形杆菌、肠道罗斯氏菌、布氏瘤胃球菌、活泼瘤胃球菌、弱生斯莱克氏菌、解没食子酸链球菌、婴儿链球菌、小韦荣氏球菌;
(b)至少75个核酸引物对,其中所述核酸引物对的组合能够特异性地扩增选自以下的任何微生物的基因组内含有的不同靶核酸序列:嗜黏蛋白阿克曼菌、阴道厌氧球菌、极小奇异菌、脆弱拟杆菌、诺迪拟杆菌、多形拟杆菌、普通拟杆菌、肠道巴恩斯氏菌、青春双歧杆菌、动物双歧杆菌、两歧双歧杆菌、长双歧杆菌、类球布劳特氏菌、卵形布劳特氏菌、伯氏疏螺旋体、简明弯曲杆菌、曲形弯曲杆菌、纤细弯曲杆菌、人弯曲杆菌、空肠弯曲杆菌、直肠弯曲杆菌、肺炎衣原体、沙眼衣原体、鼠柠檬酸杆菌、波氏克洛杆菌、艰难梭菌、产气柯林斯菌、粪便柯林斯菌、痤疮丙酸杆菌、阿拉斯加脱硫弧菌、产甲酸多尔氏菌、屎肠球菌、粪肠球菌、鹑鸡肠球菌、海氏肠球菌、大肠杆菌、粘液真杆菌、直肠真杆菌、普氏栖粪杆菌、具核梭杆菌、阴道加特纳菌、甲酸芽殖菌、胆型螺杆菌、毕氏螺杆菌、肝螺杆菌、幽门螺杆菌、扎氏螺杆菌、丝状霍尔德曼氏菌、肺炎克雷伯氏菌、嗜酸乳杆菌、德氏乳杆菌、约氏乳杆菌、鼠乳杆菌、罗伊氏乳杆菌、鼠李糖乳杆菌、乳酸乳球菌、发酵支原体、渗透支原体、狄氏副拟杆菌、屎副拟杆菌、微小微单胞菌、厌氧消化链球菌、口腔消化链球菌、粪考拉杆菌、牙龈卟啉单胞菌、人体普氏菌、栖组织普氏菌、奇异变形杆菌、肠道罗斯氏菌、布氏瘤胃球菌、活泼瘤胃球菌、弱生斯莱克氏菌、解没食子酸链球菌、婴儿链球菌、小韦荣氏球菌;
(c)至少74个核酸引物对,其中所述核酸引物对的组合能够特异性地扩增选自以下的任何微生物的基因组内含有的不同靶核酸序列:嗜黏蛋白阿克曼菌、阴道厌氧球菌、极小奇异菌、脆弱拟杆菌、诺迪拟杆菌、多形拟杆菌、普通拟杆菌、肠道巴恩斯氏菌、青春双歧杆菌、动物双歧杆菌、两歧双歧杆菌、长双歧杆菌、卵形布劳特氏菌、伯氏疏螺旋体、简明弯曲杆菌、曲形弯曲杆菌、纤细弯曲杆菌、人弯曲杆菌、空肠弯曲杆菌、直肠弯曲杆菌、肺炎衣原体、沙眼衣原体、鼠柠檬酸杆菌、波氏克洛杆菌、艰难梭菌、产气柯林斯菌、粪便柯林斯菌、痤疮丙酸杆菌、阿拉斯加脱硫弧菌、产甲酸多尔氏菌、屎肠球菌、粪肠球菌、鹑鸡肠球菌、海氏肠球菌、大肠杆菌、粘液真杆菌、直肠真杆菌、普氏栖粪杆菌、具核梭杆菌、阴道加特纳菌、甲酸芽殖菌、胆型螺杆菌、毕氏螺杆菌、肝螺杆菌、幽门螺杆菌、扎氏螺杆菌、丝状霍尔德曼氏菌、肺炎克雷伯氏菌、嗜酸乳杆菌、德氏乳杆菌、约氏乳杆菌、鼠乳杆菌、罗伊氏乳杆菌、鼠李糖乳杆菌、乳酸乳球菌、发酵支原体、渗透支原体、狄氏副拟杆菌、屎副拟杆菌、微小微单胞菌、厌氧消化链球菌、口腔消化链球菌、粪考拉杆菌、牙龈卟啉单胞菌、人体普氏菌、栖组织普氏菌、奇异变形杆菌、肠道罗斯氏菌、布氏瘤胃球菌、活泼瘤胃球菌、弱生斯莱克氏菌、解没食子酸链球菌、婴儿链球菌、小韦荣氏球菌;
(d)至少74个核酸引物对,其中所述核酸引物对的组合能够特异性地扩增选自以下的任何微生物的基因组内含有的不同靶核酸序列:嗜黏蛋白阿克曼菌、阴道厌氧球菌、极小奇异菌、脆弱拟杆菌、诺迪拟杆菌、多形拟杆菌、普通拟杆菌、肠道巴恩斯氏菌、青春双歧杆菌、动物双歧杆菌、两歧双歧杆菌、长双歧杆菌、类球布劳特氏菌、卵形布劳特氏菌、伯氏疏螺旋体、简明弯曲杆菌、曲形弯曲杆菌、纤细弯曲杆菌、人弯曲杆菌、空肠弯曲杆菌、直肠弯曲杆菌、肺炎衣原体、沙眼衣原体、鼠柠檬酸杆菌、波氏克洛杆菌、艰难梭菌、产气柯林斯菌、粪便柯林斯菌、痤疮丙酸杆菌、阿拉斯加脱硫弧菌、产甲酸多尔氏菌、屎肠球菌、粪肠球菌、鹑鸡肠球菌、海氏肠球菌、大肠杆菌、粘液真杆菌、直肠真杆菌、普氏栖粪杆菌、具核梭杆菌、阴道加特纳菌、甲酸芽殖菌、胆型螺杆菌、毕氏螺杆菌、肝螺杆菌、幽门螺杆菌、丝状霍尔德曼氏菌、肺炎克雷伯氏菌、嗜酸乳杆菌、德氏乳杆菌、约氏乳杆菌、鼠乳杆菌、罗伊氏乳杆菌、鼠李糖乳杆菌、乳酸乳球菌、发酵支原体、渗透支原体、狄氏副拟杆菌、屎副拟杆菌、微小微单胞菌、厌氧消化链球菌、口腔消化链球菌、粪考拉杆菌、牙龈卟啉单胞菌、人体普氏菌、栖组织普氏菌、奇异变形杆菌、肠道罗斯氏菌、布氏瘤胃球菌、活泼瘤胃球菌、弱生斯莱克氏菌、解没食子酸链球菌、婴儿链球菌、小韦荣氏球菌;或
(e)至少73个核酸引物对,其中所述核酸引物对的组合能够特异性地扩增选自以下的任何微生物的基因组内含有的不同靶核酸序列:嗜黏蛋白阿克曼菌、阴道厌氧球菌、极小奇异菌、脆弱拟杆菌、诺迪拟杆菌、多形拟杆菌、普通拟杆菌、肠道巴恩斯氏菌、青春双歧杆菌、动物双歧杆菌、两歧双歧杆菌、长双歧杆菌、卵形布劳特氏菌、伯氏疏螺旋体、简明弯曲杆菌、曲形弯曲杆菌、纤细弯曲杆菌、人弯曲杆菌、空肠弯曲杆菌、直肠弯曲杆菌、肺炎衣原体、沙眼衣原体、鼠柠檬酸杆菌、波氏克洛杆菌、艰难梭菌、产气柯林斯菌、粪便柯林斯菌、痤疮丙酸杆菌、阿拉斯加脱硫弧菌、产甲酸多尔氏菌、屎肠球菌、粪肠球菌、鹑鸡肠球菌、海氏肠球菌、大肠杆菌、粘液真杆菌、直肠真杆菌、普氏栖粪杆菌、具核梭杆菌、阴道加特纳菌、甲酸芽殖菌、胆型螺杆菌、毕氏螺杆菌、肝螺杆菌、幽门螺杆菌、丝状霍尔德曼氏菌、肺炎克雷伯氏菌、嗜酸乳杆菌、德氏乳杆菌、约氏乳杆菌、鼠乳杆菌、罗伊氏乳杆菌、鼠李糖乳杆菌、乳酸乳球菌、发酵支原体、渗透支原体、狄氏副拟杆菌、屎副拟杆菌、微小微单胞菌、厌氧消化链球菌、口腔消化链球菌、粪考拉杆菌、牙龈卟啉单胞菌、人体普氏菌、栖组织普氏菌、奇异变形杆菌、肠道罗斯氏菌、布氏瘤胃球菌、活泼瘤胃球菌、弱生斯莱克氏菌、解没食子酸链球菌、婴儿链球菌、小韦荣氏球菌。
A59.根据实施例A58所述的组合物,其中所述核酸引物对的组合能够在多重核酸扩增反应中同时特异性地扩增所有微生物的基因组中的不同靶核酸序列。
A60.根据实施例A58或实施例A59所述的组合物,其中所述核酸引物对中的一个或两个引物含有相对于所述靶核酸序列的修饰,其增加所述引物对切割的易感性。
A61.根据实施例A58-A60中任一项所述的组合物,其中所述不同微生物的基因组的不同靶核酸序列包含选自以下的序列:表17、或表17中的SEQ ID NO:1605-1979、或表17的SEQ ID NO:1605-1806、1809-1816、1821-1970、1972-1974和1977-1979、或表17中的SEQID NO:1605-1826、或表17中的SEQ ID NO:1605-1806、1809-1816和1821-1826、或表17A中的SEQ ID NO:1605-1820、或表17A中的SEQ ID NO:1605-1806和1809-1816、或表17C中的SEQ ID NO:1827-1979、或表17C中的SEQ ID NO:1827-1976中的核苷酸序列,或其补体。
A62.根据实施例A58所述的组合物,其中所述核酸引物对的序列包括选自表16或SEQ ID NO:49-1604中的引物对序列的序列。
A63.根据实施例A62所述的组合物,其中所述核酸引物对的序列基本上由选自表16或SEQ ID NO:49-1604中的引物对序列的序列组成。
A64.根据实施例A58所述的组合物,其中所述核酸引物对的序列包括表16A和16B或SEQ ID NO:49-520中的引物对序列。
A65.根据实施例A58所述的组合物,其中所述核酸引物对的序列基本上由表16A和16B或SEQ ID NO:49-520中的引物对序列组成。
A66.根据实施例A58所述的组合物,其中所述核酸引物对的序列包括表16D和16E或SEQ ID NO:827-1298中的引物对序列。
A67.根据实施例A58所述的组合物,其中所述核酸引物对的序列基本上由表16D和16E或SEQ ID NO:827-1298中的引物对序列组成。
A68.一种包括多个引物对的组合物,其中所述多个引物对中的至少三个引物对中的每一个能够单独地扩增包括原核16S rRNA基因的一个不同高变区的序列的单独核酸,并且其中所述高变区之一是V5区。
A69.一种包括多个引物对的组合物,其中所述多个引物对中的至少八个不同引物对中的每一个能够单独地扩增包括原核16S rRNA基因的一个不同高变区的序列的核酸。
A70.一种试剂盒,其包括根据实施例A1-A69所述的任何组合物。
A71.根据实施例A70所述的试剂盒,其进一步包括一种或多种聚合酶。
A72.根据实施例A70或实施例A71所述的试剂盒,其进一步包括一种或多种寡核苷酸衔接子。
A73.根据实施例A70-A72中任一项所述的试剂盒,其进一步包括一种或多种连接酶。
B1.一种用于检测或确定样品中是否存在微生物的方法,所述方法包括:
(a)使用引物对组合对样品中的或来自样品的核酸进行核酸扩增,所述引物对组合包括:
(i)能够扩增原核16S rRNA基因的高变区的核酸序列的一个或多个引物对,以及
(ii)能够扩增靶微生物的基因组内含有的靶核酸序列的一个或多个引物对,所述靶核酸序列不包含在原核16S rRNA基因的高变区内,其中不同的引物对扩增不同微生物的基因组内含有的不同靶核酸序列;以及
(b)检测一种或多种扩增产物,从而检测所述样品中是否存在所述靶微生物。
B2.一种用于检测或确定样品中是否存在微生物的方法,所述方法包括:
(a)使用用于一个核酸扩增反应的第一引物对集和用于另一个核酸扩增反应的第二引物对集对样品中的或来自样品的核酸进行两个单独的核酸扩增反应,其中:
(i)所述第一引物对集包括能够扩增原核16S rRNA基因的高变区的核酸序列的一个或多个引物对,并且
(ii)所述第二引物对集包括能够扩增靶微生物的基因组内含有的靶核酸序列的一个或多个引物对,所述靶核酸序列不包含在原核16S rRNA基因的高变区内,其中不同的引物对扩增不同微生物的基因组内含有的不同靶核酸序列;以及
(b)检测一种或多种扩增产物,从而检测所述样品中是否存在所述靶微生物。
B3.根据实施例B1或实施例B2所述的方法,其中使用(i)的一个或多个引物对检测到一种或多种扩增产物并且使用(ii)的一个或多个引物对未检测到扩增产物指示不存在所述靶微生物以及存在不同于所述靶微生物的一种或多种微生物。
B4.根据实施例B3所述的方法,其中不同于所述靶微生物的所述一种或多种微生物是与所述靶微生物不同的种。
B5.一种用于检测或确定样品中是否存在一种或多种微生物的方法,所述方法包括:
(a)使用多个引物对对样品中的或来自样品的核酸进行核酸扩增,其中所述多个引物对中的至少三个引物对中的每一个能够单独地扩增原核16S rRNA基因的一个不同高变区的单独核酸序列,并且其中所述高变区之一是V5区;以及
(b)检测一种或多种扩增产物,从而在样品中存在一种或多种微生物的情况下检测所述样品中的所述一种或多种微生物。
B6.一种用于检测或确定样品中是否存在一种或多种微生物的方法,所述方法包括:
(a)使用多个引物对对样品中的或来自样品的核酸进行核酸扩增,其中所述多个引物对中的至少8个引物对中的每一个能够单独地扩增包括原核16S rRNA基因的一个不同高变区的序列的单独核酸;以及
(b)检测一种或多种扩增产物,从而在样品中存在一种或多种微生物的情况下检测所述样品中的一种或多种微生物。
B7.一种用于检测或确定样品中是否存在微生物的方法,所述方法包括:
(a)使用一个或多个引物对对样品中的或来自样品的核酸进行核酸扩增,其中所述一个或多个引物对中的至少一个引物对能够特异性地扩增微生物的基因组内含有的靶核酸序列,所述微生物选自实施例A1的微生物;以及
(b)检测一种或多种扩增产物,从而在样品中存在一种或多种微生物的情况下检测所述样品中的选自实施例A1的微生物的一种或多种微生物。
B8.根据实施例B1或实施例B2所述的方法,其中能够扩增微生物的基因组内含有的靶核酸序列(所述靶核酸序列所述不包含在原核16S rRNA基因的高变区中)的所述一个或多个引物对特异性地扩增所述微生物的基因组内含有的靶核酸序列。
B9.根据实施例B1、实施例B2或实施例B8所述的方法,其中能够扩增原核16S rRNA基因的高变区的核酸序列的所述一个或多个引物对包括:至少2个或更多个引物对,其中每个引物对单独地扩增原核16S rRNA基因的不同高变区的核酸序列;至少3个或更多个引物对,其中每个引物对单独地扩增原核16S rRNA基因的不同高变区的核酸序列;至少4个或更多个引物对,其中每个引物对单独地扩增原核16S rRNA基因的不同高变区的核酸序列;至少5个或更多个引物对,其中每个引物对单独地扩增原核16S rRNA基因的不同高变区的核酸序列;至少6个或更多个引物对,其中每个引物对单独地扩增原核16S rRNA基因的不同高变区的核酸序列;至少7个或更多个引物对,其中每个引物对单独地扩增原核16S rRNA基因的不同高变区的核酸序列;或至少8个或更多个引物对,其中每个引物对单独地扩增原核16S rRNA基因的不同高变区的核酸序列。
B10.根据实施例B1、实施例B2或实施例B8所述的方法,其中能够扩增原核16SrRNA基因的高变区的核酸序列的所述一个或多个引物对包括至少3个或更多个引物对,其中每个引物对单独地扩增原核16S rRNA基因的不同高变区的核酸序列,并且其中所述3个或更多个区域之一是V5区。
B11.根据实施例B1、B2、B8或B9所述的方法,其中能够扩增不包含在原核16S rRNA基因的高变区中的靶核酸序列的所述一个或多个引物对不扩增任何其它属的微生物的基因组内含有的靶核酸序列。
B12.根据实施例B1、B2、B8或B9所述的方法,其中能够扩增不包含在原核16S rRNA基因的高变区中的靶核酸序列的所述一个或多个引物对不扩增任何其它种的微生物的基因组内含有的靶核酸序列。
B13.根据实施例B1、B2、B8或B9所述的方法,其中能够扩增不包含在原核16S rRNA基因的高变区中的靶核酸序列的所述一个或多个引物对选自表16或SEQ ID NO:49-1604中的引物对。
B14.根据实施例B1、B2、B8、B9、B10、B11、B12或B13所述的方法,其中所述微生物的属选自实施例A1中所列的属。
B15.根据实施例B1、B2、B8、B9、B10、B11、B12或B13所述的方法,其中所述微生物选自实施例A1中所列的种。
B16.根据实施例B1、B2、B8或B9所述的方法,其中所述微生物的基因组内含有的所述靶核酸序列包括选自以下的核苷酸序列或基本上由选自以下的核苷酸序列组成:表17、或表17中的SEQ ID NO:1605-1979、或表17的SEQ ID NO:1605-1806、1809-1816、1821-1970、1972-1974和1977-1979、或表17中的SEQ ID NO:1605-1826、或表17中的SEQ ID NO:1605-1806、1809-1816和1821-1826、或表17A中的SEQ ID NO:1605-1820、或表17A中的SEQID NO:1605-1806和1809-1816、或表17C中的SEQ ID NO:1827-1979、或表17C中的SEQ IDNO:1827-1976中的核苷酸序列,基本上相同或相似的序列,或其补体。
B17.根据实施例B1、B2、B8或B9所述的方法,其中所述核酸扩增的产物包括选自以下的核苷酸序列:表17、或表17中的SEQ ID NO:1605-1979、或表17的SEQ ID NO:1605-1806、1809-1816、1821-1970、1972-1974和1977-1979、或表17中的SEQ ID NO:1605-1826、或表17中的SEQ ID NO:1605-1806、1809-1816和1821-1826、或表17A中的SEQ ID NO:1605-1820、或表17A中的SEQ ID NO:1605-1806和1809-1816、或表17C中的SEQ ID NO:1827-1979、或表17C中的SEQ ID NO:1827-1976中的核苷酸序列,基本上相同或相似的序列,或其补体。
B18.根据实施例B1-B17中任一项所述的方法,其中所述一种或多种微生物是细菌。
B19.根据实施例B1-B18中任一项所述的方法,其中所述原核16S rRNA基因是细菌基因。
B20.根据实施例B5所述的方法,其中所述多个引物对中的至少4个引物对中的每一个能够单独地扩增原核16S rRNA基因的一个不同高变区的单独核酸序列,其中所述多个引物对中的至少5个引物对中的每一个能够单独地扩增原核16S rRNA基因的一个不同高变区的单独核酸序列,其中所述多个引物对中的至少6个引物对中的每一个能够单独地扩增原核16S rRNA基因的一个不同高变区的单独核酸序列,其中所述多个引物对中的至少7个引物对中的每一个能够单独地扩增原核16S rRNA基因的一个不同高变区的单独核酸序列,其中所述多个引物对中的至少8个引物对中的每一个能够单独地扩增原核16S rRNA基因的一个不同高变区的单独核酸序列,或其中所述多个引物对中的至少9个引物对中的每一个能够单独地扩增原核16S rRNA基因的一个不同高变区的单独核酸序列。
B21.根据实施例B6所述的方法,其中所述多个引物对包括能够单独地扩增原核16S rRNA基因的8个不同高变区的单独核酸序列的引物对组合。
B22.根据实施例B20或实施例B21所述的方法,其中所述核酸序列的长度小于约200bp、或小于约175bp、或小于约150bp、或小于约125bp。
B23.根据实施例B20-B22中任一项所述的方法,其中所述多个引物对中的每个引物含有少于7个连续核苷酸,其序列与所述引物对组合中另一引物的连续核苷酸序列相同。
B24.根据实施例B20-B23中任一项所述的方法,其中对于由所述多个引物对扩增的所述高变区中的至少一个高变区,所述多个引物对中的至少两个不同的引物对单独地扩增原核属的2个或更多个种的同一高变区内的核酸序列,所述原核属在同一高变区的核酸序列中存在差异。
B25.根据实施例B20-B23中任一项所述的方法,其中对于由所述多个引物对扩增的所述高变区中的至少一个高变区,所述多个引物对中的至少两个不同的引物对单独地扩增原核种的2个或更多个菌株的同一高变区内的核酸序列,所述原核属在同一高变区的核酸序列中存在差异。
B26.根据实施例B24或实施例B25所述的方法,其中所述至少一个高变区是V2区和/或V8区。
B27.根据实施例B20-B26中任一项所述的方法,其中所述一种或多种微生物是细菌。
B28.根据实施例B20-B27中任一项所述的方法,其中所述原核16S rRNA基因是细菌基因。
B29.根据实施例B7所述的方法,其中所述至少一个引物对不会可检测地扩增包含在除微生物属之外的任何属内的核酸序列。
B30.根据实施例B7所述的方法,其中所述至少一个引物对不会可检测地扩增包含在除微生物种之外的任何种内的核酸序列。
B31.根据实施例B7所述的方法,其中所述一个或多个引物对中的至少一个引物对,或所述一个或多个引物对中的至少一个引物包括选自以下的引物序列或引物对序列或基本上由选自以下的引物序列或引物对序列组成:表16中的序列;或表16的SEQ ID NO:49-520;或表16的SEQ ID NO:49-452、457-472和481-520;或表16的SEQ ID NO:49-492;或表16的SEQ ID NO:49-452、457-472和481-492;或表16A的SEQ ID NO:49-480;或表16A的SEQ IDNO:49-452和457-472;或表16C的SEQ ID NO:521-826;或表16C的SEQ ID NO:521-820;或表16的SEQ ID NO:827-1298;或表16的SEQ ID NO:827-1230、1235-1250和1259-1298;或表16的SEQ ID NO:827-1270;或表16的SEQ ID NO:827-1230、1235-1250和1259-1270;或表16D的SEQ ID NO:827-1258;或表16D的SEQ ID NO:827-1230和1235-1250;或表16F的SEQ IDNO:1299-1604;或表16F的SEQ ID NO:1299-1598,或基本上相同或相似的序列,或任何上述核苷酸序列,其中一个或多个胸腺嘧啶碱基被尿嘧啶碱基取代。
B32.根据实施例B7所述的方法,其中所述一个或多个引物对中的至少一个引物对,或所述一个或多个引物对中的至少一个引物包括选自以下的引物序列或引物对序列或基本上由选自以下的引物序列或引物对序列组成:表16D、16E和16F中的序列;或表16的SEQID NO:827-1604;或表16的SEQ ID NO:827-1298;或表16的SEQ ID NO:827-1230、1235-1250和1259-1298;或表16的SEQ ID NO:827-1270;或表16的SEQ ID NO:827-1230、1235-1250和1259-1270;或表16D的SEQ ID NO:827-1258;或表16D的SEQ ID NO:827-1230和1235-1250;或表16F的SEQ ID NO:1299-1604;或表16F的SEQ ID NO:1299-1598,或基本上相同或相似的序列,其中一个或多个胸腺嘧啶碱基被尿嘧啶碱基取代。
B33.根据实施例B7所述的方法,其中使用多个引物或引物对对核酸进行核酸扩增,所述多个引物或引物对各自含有选自以下的一个或多个序列或基本上由选自以下的一个或多个序列组成:表16中的序列;或表16的SEQ ID NO:49-520;或表16的SEQ ID NO:49-452、457-472和481-520;或表16的SEQ ID NO:49-492;或表16的SEQ ID NO:49-452、457-472和481-492;或表16A的SEQ ID NO:49-480;或表16A的SEQ ID NO:49-452和457-472;或表16C的SEQ ID NO:521-826;或表16C的SEQ ID NO:521-820;或表16的SEQ ID NO:827-1298;或表16的SEQ ID NO:827-1230、1235-1250和1259-1298;或表16的SEQ ID NO:827-1270;或表16的SEQ ID NO:827-1230、1235-1250和1259-1270;或表16D的SEQ ID NO:827-1258;或表16D的SEQ ID NO:827-1230和1235-1250;或表16F的SEQ ID NO:1299-1604;或表16F的SEQ ID NO:1299-1598;或基本上相同或相似的序列,或任何上述核苷酸序列,其中一个或多个胸腺嘧啶碱基被尿嘧啶碱基取代。
B34.根据实施例B7所述的方法,其中使用多个引物或引物对对核酸进行核酸扩增,所述多个引物或引物对各自含有选自以下的一个或多个序列或基本上由选自以下的一个或多个序列组成:表16D、16E和16F中的序列;或表16的SEQ ID NO:827-1604;或表16的SEQ ID NO:827-1298;或表16的SEQ ID NO:827-1230、1235-1250和1259-1298;或表16的SEQ ID NO:827-1270;或表16的SEQ ID NO:827-1230、1235-1250和1259-1270;或表16D的SEQ ID NO:827-1258;或表16D的SEQ ID NO:827-1230和1235-1250;或表16F的SEQ ID NO:1299-1604;或表16F的SEQ ID NO:1299-1598;或基本上相同或相似的序列,其中一个或多个胸腺嘧啶碱基被尿嘧啶碱基取代。
B35.根据实施例B7所述的方法,其中所述靶核酸序列包括选自以下的核苷酸序列:表17、或表17中的SEQ ID NO:1605-1979、或表17的SEQ ID NO:1605-1806、1809-1816、1821-1970、1972-1974和1977-1979、或表17中的SEQ ID NO:1605-1826、或表17中的SEQ IDNO:1605-1806、1809-1816和1821-1826、或表17A中的SEQ ID NO:1605-1820、或表17A中的SEQ ID NO:1605-1806和1809-1816、或表17C中的SEQ ID NO:1827-1979、或表17C中的SEQID NO:1827-1976中的核苷酸序列,基本上相同或相似的序列,或其补体。
B36.根据实施例B7所述的方法,其中检测一种或多种扩增产物包括检测一个或多个核苷酸序列,所述一个或多个核苷酸序列选自表17中的序列、或表17中的SEQ ID NO:1605-1979、或表17的SEQ ID NO:1605-1806、1809-1816、1821-1970、1972-1974和1977-1979、或表17中的SEQ ID NO:1605-1826、或表17中的SEQ ID NO:1605-1806、1809-1816和1821-1826、或表17A中的SEQ ID NO:1605-1820、或表17A中的SEQ ID NO:1605-1806和1809-1816、或表17C中的SEQ ID NO:1827-1979、或表17C中的SEQ ID NO:1827-1976,基本上相同或相似的序列,或其补体。
B37.根据实施例B7所述的方法,其中检测一种或多种扩增产物包括检测一个或多个核苷酸序列,所述一个或多个核苷酸序列选自表17中的序列、或表17中的SEQ ID NO:1605-1979、或表17的SEQ ID NO:1605-1806、1809-1816、1821-1970、1972-1974和1977-1979、或表17中的SEQ ID NO:1605-1826、或表17中的SEQ ID NO:1605-1806、1809-1816和1821-1826、或表17A中的SEQ ID NO:1605-1820、或表17A中的SEQ ID NO:1605-1806和1809-1816、或表17C中的SEQ ID NO:1827-1979、或表17C中的SEQ ID NO:1827-1976,基本上相同或相似的序列或其补体,并且任选地在序列的5'和/或3'端具有一个或多个引物序列。
B38.根据实施例B7所述的方法,其中所述靶核酸不包含在原核16S rRNA基因内。
B39.根据实施例B1、实施例B5、实施例B6或实施例B8-B28所述的方法,其中能够扩增原核16S rRNA基因的高变区的核酸序列的引物对或多个引物对包括选自以下的一个或多个引物对:表15中的引物对的序列,或基本上相同或相似的序列,或任何上述核苷酸序列,其中一个或多个胸腺嘧啶碱基被尿嘧啶碱基取代。
B40.根据实施例B1、B2、B5、B6或B8-B21所述的方法,其中能够扩增原核16S rRNA基因的一个或多个高变区的核酸序列的引物对或多个引物对包括一个或多个引物对,所述一个或多个引物对含有选自以下的序列或基本上由选自以下的序列组成:表15、或表15的SEQ ID NO:1-24和/或表15的SEQ ID NO:25-48,或基本上相同或相似的序列。
B41.根据实施例B1、实施例B2、实施例B5、实施例B6或实施例B8-B21所述的方法,其中能够扩增原核16S rRNA基因的一个或多个高变区的核酸序列的引物对或多个引物对包括一个或多个引物对,所述一个或多个引物对含有选自以下的序列或基本上由选自以下的序列组成:表15的SEQ ID NO:25-48,或基本上相同或相似的序列,其中一个或多个胸腺嘧啶碱基被尿嘧啶碱基取代。
B42.根据实施例B1-B30或B31-B36中任一项所述的方法,其中一个或多个引物对中的一个或两个引物含有相对于由所述引物对扩增的核酸序列的修饰,其中所述修饰减少所述引物与其它引物的结合。
B43.根据实施例B1-B30或B31-B36中任一项所述的方法,其中一个或多个引物对中的一个或两个引物含有相对于由所述引物对扩增的核酸序列的修饰,其中所述修饰增加所述引物对切割的易感性。
B44.根据实施例B1-B43中任一项所述的方法,其中一个或多个引物对中的一个或两个引物含有一个或多个或两个或更多个尿嘧啶核碱基。
B45.根据实施例B1-B44中任一项所述的方法,其中所述样品包括多种不同微生物的基因组的核酸。
B46.根据实施例B1-B44中任一项所述的方法,其中所述样品包括与被检测的微生物来自同一属的不同微生物的基因组的核酸。
B47.根据实施例B1-B44中任一项所述的方法,其中检测所述样品中的两种或更多种微生物。
B48.根据实施例B1-B44中任一项所述的方法,其中所述一个或多个引物对,或多个引物对,或引物对的组合包括至少2个、5个、10个、20个、30个、40个、50个、60个、70个、80个、90个、100个、120个、130个、140个、150个、160个、170个、180个、190个、200个、210个、220个、230个或更多个引物对。
B49.根据实施例B48所述的方法,其中所述核酸扩增在单个扩增反应混合物中进行。
B50.根据实施例B1-B49中任一项所述的方法,其中检测包括使核酸扩增后的扩增反应混合物与一种或多种可检测探针接触,所述一种或多种可检测探针与核酸扩增产物特异性地相互作用,所述核酸扩增产物包括由所述一个或多个引物对或所述多个引物对或所述引物对组合扩增的序列。
B51.根据实施例B1-B49中任一项所述的方法,其中检测包括在核酸扩增后对扩增反应混合物进行核酸测序。
B52.根据实施例B51所述的方法,其进一步包括将从测序中获得的核苷酸序列与参考序列进行比对。
B53.根据实施例B1-B52中任一项所述的方法,其进一步包括确定所述样品中存在的一种或多种微生物的丰度。
B54.根据实施例B1-B52中任一项所述的方法,其中检测包括鉴定所述样品中存在的一种或多种微生物的属和种。
B55.根据实施例B1-B52中任一项所述的方法,其中检测包括鉴定所述样品中存在的两种或更多种微生物的属和种。
B56.根据实施例B1-B55中任一项所述的方法,其中所述样品是生物样品。
B57.根据实施例B56所述的方法,其中所述样品是粪便样品。
B58.一种用于扩增一种或多种微生物的靶核酸的方法,所述方法包括:
(a)获得选自实施例A1的微生物的一种或多种微生物的核酸;以及
(b)使用至少一个引物对对所述核酸进行核酸扩增,所述至少一个引物对特异性地扩增选自实施例A1的微生物的微生物的基因组内含有的靶核酸序列,从而产生所述靶核酸的扩增拷贝。
B59.根据实施例B58所述的方法,其中所述至少一个引物对不会可检测地扩增包含在除含有所述靶核酸序列的微生物属之外的任何属内的核酸序列。
B60.根据实施例B58所述的方法,其中所述至少一个引物对不会可检测地扩增包含在除含有所述靶核酸序列的微生物种之外的任何种内的核酸序列。
B61.根据实施例B58所述的方法,其中所述至少一个引物对选自:表16中的引物对的序列;或表16的SEQ ID NO:49-520;或表16的SEQ ID NO:49-452、457-472和481-520;或表16的SEQ ID NO:49-492;或表16的SEQ ID NO:49-452、457-472和481-492;或表16A的SEQID NO:49-480;或表16A的SEQ ID NO:49-452和457-472;或表16C的SEQ ID NO:521-826;或表16C的SEQ ID NO:521-820;或表16的SEQ ID NO:827-1298;或表16的SEQ ID NO:827-1230、1235-1250和1259-1298;或表16的SEQ ID NO:827-1270;或表16的SEQ ID NO:827-1230、1235-1250和1259-1270;或表16D的SEQ ID NO:827-1258;或表16D的SEQ ID NO:827-1230和1235-1250;或表16F的SEQ ID NO:1299-1604;或表16F的SEQ ID NO:1299-1598,或基本上相同或相似的序列,或任何上述核苷酸序列,其中一个或多个胸腺嘧啶碱基被尿嘧啶碱基取代。
B62.根据实施例B58所述的方法,其中所述靶核酸序列包括选自以下的核苷酸序列:表17、或表17中的SEQ ID NO:1605-1979、或表17的SEQ ID NO:1605-1806、1809-1816、1821-1970、1972-1974和1977-1979、或表17中的SEQ ID NO:1605-1826、或表17中的SEQ IDNO:1605-1806、1809-1816和1821-1826、或表17A中的SEQ ID NO:1605-1820、或表17A中的SEQ ID NO:1605-1806和1809-1816、或表17C中的SEQ ID NO:1827-1979、或表17C中的SEQID NO:1827-1976中的核苷酸序列,基本上相同或相似的序列,或其补体。
B63.根据实施例B58所述的方法,其中所述核酸扩增产物包括以下核苷酸序列,所述核苷酸序列选自表17、或表17中的SEQ ID NO:1605-1979、或表17的SEQ ID NO:1605-1806、1809-1816、1821-1970、1972-1974和1977-1979、或表17中的SEQ ID NO:1605-1826、或表17中的SEQ ID NO:1605-1806、1809-1816和1821-1826、或表17A中的SEQ ID NO:1605-1820、或表17A中的SEQ ID NO:1605-1806和1809-1816、或表17C中的SEQ ID NO:1827-1979、或表17C中的SEQ ID NO:1827-1976,基本上相同或相似的序列或其补体,并且任选地在序列的5'和/或3'端具有一个或多个引物序列。
B64.根据实施例B58-B63中任一项所述的方法,其中所述方法包括获得两种或更多种或多种微生物的核酸,并使用至少两个或更多个引物对对所述核酸进行多重核酸扩增。
B65.一种用于扩增一种或多种微生物的基因的多个区域的方法,所述方法包括:
(a)获得包括16S rRNA基因的一种或多种微生物的核酸;
(b)使用多个引物对对所述核酸进行核酸扩增,其中所述多个引物对中的至少3个引物对中的每一个能够单独地扩增原核16S rRNA基因的一个不同高变区的单独核酸序列,并且其中所述高变区之一是V5区,从而产生一种或多种微生物的16S rRNA基因的至少3个不同高变区的单独核酸序列的单独扩增拷贝。
B66.一种用于扩增一种或多种微生物的基因的多个区域的方法,所述方法包括:
(a)获得包括16S rRNA基因的一种或多种微生物的核酸;
(b)使用多个引物对对所述核酸进行核酸扩增,其中所述多个引物对中的至少8个引物对中的每一个能够单独地扩增原核16S rRNA基因的一个不同高变区的单独核酸序列,从而产生一种或多种微生物的16S rRNA基因的至少8个不同高变区的单独核酸序列的单独扩增拷贝。
B67.根据实施例B65或实施例B66所述的方法,其中单独核酸序列的所述扩增拷贝的长度小于约200bp、或小于约175bp、或小于约150bp、或小于约125bp。
B68.根据实施例B65-B67中任一项所述的方法,其中所述多个引物对中的每个引物含有少于7个连续核苷酸,其序列与所述多个引物对中另一引物的连续核苷酸序列相同。
B69.根据实施例B65-B68中任一项所述的方法,其中对于由所述多个引物对扩增的不同高变区的核酸序列中的至少一个核酸序列,所述多个引物对中的至少两个不同的引物对单独地扩增同一原核属的2个或更多个种的同一高变区的核酸序列,所述原核属在同一高变区的核酸序列中存在差异。
B70.根据实施例B65-B68中任一项所述的方法,其中对于由所述多个引物对扩增的不同高变区的核酸序列中的至少一个核酸序列,所述引物对组合中的至少两个不同的引物对单独地扩增同一原核种的2个或更多个菌株的同一高变区的核酸序列,所述原核属在同一高变区的核酸序列中存在差异。
B71.根据实施例B69或实施例B70所述的方法,其中所述同一高变区是V2区和/或V8区。
B72.根据实施例B65或实施例B66所述的方法,其中单独地扩增原核16S rRNA基因的不同高变区的单独核酸序列的所述多个引物对包括引物对,所述引物对含有选自表15的序列或基本上相同或相似的序列或基本上由所述序列组成。
B73.根据实施例B65或实施例B66所述的方法,其中单独地扩增原核16S rRNA基因的不同高变区的单独核酸序列的所述多个引物对包括引物对,所述引物对含有选自以下的序列或基本上由选自以下的序列组成:表15的SEQ ID NO:1-24和/或表15的SEQ ID NO:25-48,或基本上相同或相似的序列。
B74.根据实施例B65或实施例B66所述的方法,其中单独地扩增原核16S rRNA基因的不同高变区的单独核酸序列的所述多个引物对包括引物对,所述引物对含有选自以下的序列或基本上由选自以下的序列组成:表15的SEQ ID NO:25-48,或基本上相同或相似的序列,其中一个或多个胸腺嘧啶碱基被尿嘧啶碱基取代。
B75.根据实施例B65-B74中任一项所述的方法,其中所述方法包括获得两种或更多种或多种微生物的核酸,并使用所述多个引物对对所述核酸进行多重核酸扩增。
B76.根据实施例B65-B75中任一项所述的方法,其中所述一种或多种微生物是细菌。
B77.一种用于扩增一种或多种微生物的基因组区域的方法,所述方法包括:
(a)获得包括16S rRNA基因的一种或多种微生物的核酸,
(b)使用引物对组合对所述核酸进行核酸扩增,所述引物对组合包括:
(i)单独地扩增原核16S rRNA基因的高变区的核酸序列的一个或多个引物对,以及
(ii)扩增微生物的基因组内含有的靶核酸序列的一个或多个引物对,所述靶核酸序列不包含在原核16S rRNA基因的高变区内,其中不同的引物对扩增不同微生物的基因组内含有的不同靶核酸序列;以及
(c)产生一种或多种微生物的基因组的至少两个不同区域的扩增拷贝。
B78.一种用于扩增一种或多种微生物的基因组区域的方法,所述方法包括:
(a)获得包括16S rRNA基因的一种或多种微生物的核酸,
(b)使用用于一个核酸扩增反应的第一引物对集和用于另一个核酸扩增反应的第二引物对集对所述核酸进行两个单独的核酸扩增反应,其中:
(i)所述第一引物对集包括单独地扩增原核16S rRNA基因的高变区的核酸序列的一个或多个引物对,并且
(ii)所述第二引物对集包括扩增微生物的基因组内含有的靶核酸序列的一个或多个引物对,所述靶核酸序列不包含在原核16S rRNA基因的高变区内,其中不同的引物对扩增不同微生物的基因组内含有的不同靶核酸序列;以及
(c)产生一种或多种微生物的基因组的至少两个不同区域的扩增拷贝。
B79.根据实施例B77或实施例B78所述的方法,其中(i)的一个或多个引物对扩增来自不同属的多种微生物中的核酸序列。
B80.根据实施例B79所述的方法,其中获得至少两种不同微生物的核酸混合物并进行核酸扩增,并且仅一种微生物的基因组含有由(ii)的引物对特异性地扩增的靶序列。
B81.根据实施例B80所述的方法,其中所产生的扩增拷贝含有通过(ii)的引物对从一种微生物的基因组的核酸中扩增的靶核酸序列的拷贝,但不包含通过(ii)的引物对从任何其它经受过核酸扩增的微生物的基因组的核酸中扩增的靶核酸序列的拷贝。
B82.根据实施例B81所述的方法,其中所产生的扩增拷贝含有包含在通过(i)的引物对从多种微生物的基因组的核酸中扩增的高变区内的核酸序列的拷贝。
B83根据实施例B77-B82中任一项所述的方法,其中所述一种或多种微生物是细菌。
B84.根据实施例B77-B83中任一项所述的方法,其中所述原核16S rRNA基因是细菌基因。
B85.根据实施例B58-B84中任一项所述的方法,其中一个或多个引物对中的一个或两个引物含有相对于由所述引物对扩增的核酸序列的修饰,其中所述修饰减少所述引物与其它引物的结合。
B86.根据实施例B58-B84中任一项所述的方法,其中一个或多个引物对中的一个或两个引物含有相对于由所述引物对扩增的核酸序列的修饰,其中所述修饰增加所述引物对切割的易感性。
B87.根据实施例B58-B84中任一项所述的方法,其中一个或多个引物对中的一个或两个引物含有一个或多个或两个或更多个尿嘧啶核碱基。
B88.一种用于表征样品中的微生物群体的方法,所述方法包括:
(a)使用引物对组合对所述样品中的或来自所述样品的核酸进行核酸扩增,所述引物对组合包括:
(i)能够扩增原核16S rRNA基因的一个或多个高变区的核酸序列的一个或多个引物对,以及
(ii)能够扩增微生物的基因组内含有的靶核酸序列的一个或多个引物对,所述靶核酸序列不包含在原核16S rRNA基因的高变区内,其中不同的引物对扩增不同微生物的基因组内含有的不同靶核酸序列;
(b)从通过(i)和(ii)的引物对的组合扩增的核酸产物中获得序列信息,以及确定由(i)的一个或多个引物对扩增的核酸产物的水平;以及
(c)鉴定所述样品中微生物的属和所述样品中一种或多种微生物的种,从而表征所述样品中的微生物群体。
B89.一种用于表征样品中的微生物群体的方法,所述方法包括:
(a)使用用于一个核酸扩增反应的第一引物对集和用于另一个核酸扩增反应的第二引物对集对所述核酸进行两个单独的核酸扩增反应,其中:
(i)所述第一引物对集包括能够扩增原核16S rRNA基因的一个或多个高变区的核酸序列的一个或多个引物对,并且
(ii)所述第二引物对集包括能够扩增微生物的基因组内含有的靶核酸序列的一个或多个引物对,所述靶核酸序列不包含在原核16S rRNA基因的高变区内,其中不同的引物对扩增不同微生物的基因组内含有的不同靶核酸序列;
(b)从通过(i)和(ii)的引物对扩增的核酸产物中获得序列信息,以及确定由(i)的一个或多个引物对扩增的核酸产物的水平;以及
(c)鉴定所述样品中微生物的属和所述样品中一种或多种微生物的种,从而表征所述样品中的微生物群体。
B90.根据实施例B88或实施例B89所述的方法,其中(ii)的一个或多个引物对包括多个引物对,所述多个引物对扩增多种微生物的基因组中含有的靶核酸序列,所述靶核酸序列不包含在原核16S rRNA基因的高变区内中。
B91.根据实施例B88、B89或实施例B90所述的方法,其中(ii)的一个或多个引物对中的至少一个引物对特异性地扩增微生物的基因组内含有的靶核酸序列。
B92.根据实施例B88-B91中任一项所述的方法,其中(ii)的一个或多个引物对扩增选自实施例A1的微生物的微生物的基因组内含有的靶核酸序列。
B93.根据实施例B88-B90中任一项所述的方法,其中(i)的一个或多个引物对包括:至少2个或更多个引物对,其中每个引物对单独地扩增原核16S rRNA基因的不同高变区的核酸序列;至少3个或更多个引物对,其中每个引物对单独地扩增原核16S rRNA基因的不同高变区的核酸序列;至少4个或更多个引物对,其中每个引物对单独地扩增原核16S rRNA基因的不同高变区的核酸序列;至少5个或更多个引物对,其中每个引物对单独地扩增原核16S rRNA基因的不同高变区的核酸序列;至少6个或更多个引物对,其中每个引物对单独地扩增原核16S rRNA基因的不同高变区的核酸序列;至少7个或更多个引物对,其中每个引物对单独地扩增原核16S rRNA基因的不同高变区的核酸序列;或至少8个或更多个引物对,其中每个引物对单独地扩增原核16S rRNA基因的不同高变区的核酸序列。
B94.根据实施例B88-B92中任一项所述的方法,其中(i)的一个或多个引物对包括至少3个或更多个引物对,其中每个引物对单独地扩增原核16S rRNA基因的不同高变区的核酸序列,并且其中所述3个或更多个区域之一是V5区。
B95.根据实施例B88-B94中任一项所述的方法,其中(ii)的一个或多个引物对不扩增任何其它属的微生物内含有的核酸序列。
B96.根据实施例B88-B94中任一项所述的方法,其中(ii)的一个或多个引物对中的至少一个引物对不扩增任何其它种的微生物内含有的核酸序列。
B97.根据实施例B88-B94中任一项所述的方法,其中(ii)的一个或多个引物对中的至少一个引物对扩增微生物的基因组内含有的靶核酸序列,所述微生物的属选自实施例A1中所列的属。
B98.根据实施例B97所述的方法,其中所述至少一个引物对特异性地扩增仅包含在选自实施例A1中所列的属的微生物属的基因组内的靶核酸序列。
B99.根据实施例B97所述的方法,其中所述至少一个引物对特异性地扩增仅包含在选自实施例A1中所列的微生物的微生物的基因组内的靶核酸序列。
B100.根据实施例B88-B99中任一项所述的方法,其中(ii)的一个或多个引物对中的至少一个引物,或所述一个或多个引物对中的至少一个引物对包括以下各项或基本上由以下各项组成:表16中的引物或引物对的一个或多个序列;或表16的SEQ ID NO:49-520;或表16的SEQ ID NO:49-452、457-472和481-520;或表16的SEQ ID NO:49-492;或表16的SEQID NO:49-452、457-472和481-492;或表16A的SEQ ID NO:49-480;或表16A的SEQ ID NO:49-452和457-472;或表16C的SEQ ID NO:521-826;或表16C的SEQ ID NO:521-820;或表16的SEQ ID NO:827-1298;或表16的SEQ ID NO:827-1230、1235-1250和1259-1298;或表16的SEQ ID NO:827-1270;或表16的SEQ ID NO:827-1230、1235-1250和1259-1270;或表16D的SEQ ID NO:827-1258;或表16D的SEQ ID NO:827-1230和1235-1250;或表16F的SEQ ID NO:1299-1604;或表16F的SEQ ID NO:1299-1598,或基本上相同或相似的序列,或任何上述核苷酸序列,其中一个或多个胸腺嘧啶碱基被尿嘧啶碱基取代。
B101.根据实施例B88-B99中任一项所述的方法,其中(ii)的一个或多个引物对中的至少一个引物,或所述一个或多个引物对中的至少一个引物对包括以下各项或基本上由以下各项组成:表16的SEQ ID NO:827-1298、或表16的SEQ ID NO:827-1230、1235-1250和1259-1298、或表16的SEQ ID NO:827-1270、或表16的SEQ ID NO:827-1230、1235-1250和1259-1270、或表16D的SEQ ID NO:827-1258、或表16D的SEQ ID NO:827-1230和1235-1250、或表16F的SEQ ID NO:1299-1604、或表16F的SEQ ID NO:1299-1598中的引物或引物对的一个或多个序列,或基本上相同或相似的序列,其中一个或多个胸腺嘧啶碱基被尿嘧啶碱基取代。
B102.根据实施例B88-B101在任一项所述的方法,其中所述微生物的基因组内含有的所述靶核酸序列包括选自以下的核苷酸序列或基本上由选自以下的核苷酸序列组成:表17;或表17中的SEQ ID NO:1605-1979;或表17的SEQ ID NO:1605-1806、1809-1816、1821-1970、1972-1974和1977-1979;或表17中的SEQ ID NO:1605-1826;或表17中的SEQ IDNO:1605-1806、1809-1816和1821-1826;或表17A中的SEQ ID NO:1605-1820;或表17A中的SEQ ID NO:1605-1806和1809-1816;或表17C中的SEQ ID NO:1827-1979;或表17C中的SEQID NO:1827-1976,基本上相同或相似的序列,或其补体。
B103.根据实施例B88-102中任一项所述的方法,其中所述核酸扩增产物包括以下核苷酸序列,所述核苷酸序列选自表17、或表17中的SEQ ID NO:1605-1979、或表17的SEQID NO:1605-1806、1809-1816、1821-1970、1972-1974和1977-1979、或表17中的SEQ ID NO:1605-1826、或表17中的SEQ ID NO:1605-1806、1809-1816和1821-1826、或表17A中的SEQID NO:1605-1820、或表17A中的SEQ ID NO:1605-1806和1809-1816、或表17C中的SEQ IDNO:1827-1979、或表17C中的SEQ ID NO:1827-1976,基本上相同或相似的序列或其补体,并且任选地在序列的5'和/或3'端具有一个或多个引物序列。
B104.根据实施例B88-B103中任一项所述的方法,其中(i)的一个或多个引物对包括引物或引物对,所述引物或引物对包括以下各项或基本上由以下各项组成:表15的SEQID NO:1-24和/或表15的SEQ ID NO:25-48中的一个或多个序列,或基本上相同或相似的序列。
B105.根据实施例B88-B103中任一项所述的方法,其中(i)的一个或多个引物对包括引物或引物对,所述引物或引物对包括以下各项或基本上由以下各项组成:表15的SEQID NO:25-48中的一个或多个序列,或基本上相同或相似的序列,其中一个或多个胸腺嘧啶碱基被尿嘧啶碱基取代。
B106.根据实施例B88-B105中任一项所述的方法,其中(i)的引物对中的每个引物含有少于10个、少于9个、少于8个、少于7个、少于6个、少于5个、少于4个、少于3个或少于2个连续核苷酸,其序列与所述引物对中另一引物的连续核苷酸序列相同。
B107.根据实施例B88-B104中任一项所述的方法,其中(i)的一个或多个引物对扩增来自不同属的多种微生物中的核酸序列。
B108根据实施例B88-B107中任一项所述的方法,其中(i)的一个或多个引物对中的引物选择性地与原核16S rRNA基因的保守区中含有的核酸序列杂交。
B109.根据实施例B88-B108中任一项所述的方法,其中对于由(i)的引物对扩增的高变区中的至少一个高变区,(i)的引物对中的至少两个不同的引物对单独地扩增原核属的2个或更多个种的同一高变区内的核酸序列,所述原核属在同一高变区的核酸序列中存在差异。
B110.根据实施例B88-B108中任一项所述的方法,其中对于由(i)的引物对扩增的高变区中的至少一个高变区,(i)的引物对中的至少两个不同的引物对单独地扩增原核种的2个或更多个菌株的同一高变区内的核酸序列,所述原核属在同一高变区的核酸序列中存在差异。
B111.根据实施例B109或实施例B110所述的方法,其中所述至少一个高变区是V2区和/或V8区。
B112.根据实施例B88-B111中任一项所述的方法,其中从通过引物对组合扩增的核酸产物中获得序列信息包括对经扩增的核酸产物进行核酸测序并获得序列读段,并且其中确定经扩增的核酸产物的水平包括对所述序列读段进行计数。
B113.根据实施例B112所述的方法,其中对所述序列读段进行计数包括确定映射到微生物的基因组中的序列的序列读段的总数,所述微生物含有通过所述引物对组合扩增的序列,并通过以下方式对映射的序列读段的总数进行归一化:将映射的序列读段的总数除以预计通过所述引物对组合在微生物的基因组中扩增的扩增子序列的数量以获得序列读段的归一化数量,以及任选地将映射到微生物的基因组中的序列的微生物的序列读段的所述归一化数量除以对样品中所有核酸进行测序而获得的归一化读段的总数以获得相对丰度分数。
B114.根据实施例B112所述的方法,其中通过(i)的引物对组合扩增的核酸产物含有第一共同条形码序列,并且通过(ii)的引物对组合扩增的核酸产物含有不同于所述第一共同条形码序列的第二共同条形码序列。
B115.根据实施例B112所述的方法,其中鉴定所述样品中微生物的属包括
(1)将通过(i)的引物对组合扩增的核酸产物的序列读段与过滤后的微生物群组的参考原核16S rRNA基因的全长核苷酸序列的集合进行比对,所述全长核苷酸序列选自原核16S rRNA基因参考数据库中未经过滤的全长核苷酸序列且少于其总数,
(2)基于读段与过滤后的微生物群组的原核16S rRNA基因的全长核苷酸序列的比对,将序列读段分配给微生物属;以及
(3)基于将序列读段分配给微生物属,以至少90%的灵敏度、或至少91%的灵敏度、或至少92%的灵敏度、或至少93%的灵敏度、或至少94%的灵敏度、或至少95%的灵敏度、或100%的灵敏度来鉴定所述样品中微生物的属。
B116.根据实施例B115所述的方法,其中过滤后的微生物群组的原核16S rRNA基因的核苷酸序列的集合通过以下方式获得:
(A)使用(i)的一个或多个引物对预先确定预计通过对原核16S rRNA基因参考数据库中的序列进行核酸扩增而生成的含高变区序列的扩增子的序列,并鉴定含有一个或多个预计由每个单独的引物对产生的含高变区序列的扩增子的微生物,
(B)为含有预期高变区扩增子序列的每种微生物生成预期的含高变区序列的扩增子的特征模式,其中所述特征模式基于(i)的每个引物对中的哪一个预计将扩增微生物中的序列,以及(i)的引物对中的哪一个预计将不会扩增微生物中的序列,
(C)将通过(i)的引物对组合扩增的核酸产物的序列读段与预期的含高变区序列的扩增子的序列进行比对,并基于所述比对根据由单独的引物对产生的不同的预期的含高变区序列的扩增子,对所述序列读段进行分离和分配,
(D)确定与每种微生物的每个预期的含高变区序列的扩增子比对的序列读段的数量,并选择最小阈值的序列读段比对的第一组微生物,
(E)对于所述第一组微生物中的每种微生物,确定获得序列读段的实际高变区扩增子的观察到的模式,并将微生物的实际高变区扩增子的观察到的模式与预期的高变区扩增子的特征模式进行比较;以及
(F)选择仅在过滤后的微生物群组的原核16S rRNA基因的核苷酸序列集合中包含具有高变区扩增子的特征模式且实际扩增子的观察到的模式满足最小相似性阈值的那些微生物的序列。
B117.根据实施例B116所述的方法,其进一步包括,在将通过(i)的引物对组合扩增的核酸产物的序列读段与过滤后的微生物群组的原核16S rRNA基因的全长核苷酸序列的集合进行比对后,确定与每个参考原核16S rRNA基因序列比对的序列读段的数量,并通过将每个序列读段数量除以微生物的预期高变区扩增子的数量来对每个序列读段数量进行归一化。
B118.根据实施例B88-B117中任一项所述的方法,其中鉴定所述样品中微生物的种包括将来自由(ii)的引物对扩增的核酸产物的序列读段与多个微生物参考基因组的核苷酸序列进行比对,并鉴定序列读段最接近比对的参考基因组的种,从而鉴定所述样品中微生物的种。
B119.根据实施例B118所述的方法,其中以至少95%的灵敏度、或至少96%的灵敏度、或至少97%的灵敏度、或至少98%的灵敏度、或至少99%的灵敏度、或100%的灵敏度来鉴定所述样品中微生物的种。
B120.根据实施例B118或实施例B119所述的方法,其中所述多个微生物参考基因组包括通过鉴定微生物基因组选择的参考基因组,所述微生物基因组含有能使用(ii)的引物对扩增的序列并且预计含有能使用(ii)的引物对扩增的序列。
B121.根据实施例B118-B120中任一项所述的方法,其进一步包括鉴定由(ii)的引物对扩增的产物的序列读段,所述序列读段仅与一个参考基因组比对或与多个参考基因组比对,其中所述多个参考基因组是同一种的微生物的基因组。
B122.根据实施例B121所述的方法,其进一步包括:
(A)确定仅与一个参考基因组比对或与多个参考基因组比对的序列读段的总数,其中所述多个参考基因组是同一种的微生物的基因组,
(B)选择比对序列读段的数量等于或大于阈值的种,并且对于那些种,通过将种的比对序列读段的总数除以序列读段比对的种基因组内的扩增子的数量来对比对序列读段的数量进行归一化;以及
(C)仅选择比对序列读段的归一化数量大于所有种的比对序列读段的归一化数量之和的最小阈值百分比的种。
B123.根据实施例B88-B122中任一项所述的方法,其中所述微生物群体是细菌群体。
B124.根据实施例B88-122中任一项所述的方法,其中所述原核16S rRNA基因是细菌基因。
B125.一种检测受试者中的微生物失衡的方法,所述方法包括:
(a)使用引物对组合对受试者样品中的或来自受试者样品的核酸进行核酸扩增,所述引物对组合包括:
(i)能够扩增原核16S rRNA基因的一个或多个高变区的核酸序列的一个或多个引物对,以及
(ii)能够扩增微生物的基因组内含有的靶核酸序列的一个或多个引物对,所述靶核酸序列不包含在原核16S rRNA基因的高变区内,其中不同的引物对扩增不同微生物的基因组内含有的不同靶核酸序列;
(b)从通过(i)和(ii)的引物对的组合扩增的核酸产物中获得序列信息,以及任选地确定由(i)的一个或多个引物对扩增的核酸产物的水平;
(c)通过鉴定所述样品中微生物的属,以及任选地其相对水平,以及所述样品中一种或多种微生物的种来确定所述样品的微生物组成;
(d)将所述样品的所述微生物组成与参考微生物组成进行比较;以及
(e)如果样品中一种或多种微生物的水平与参考微生物组成中微生物的水平不同、参考组成中的一种或多种微生物不存在于样品中和/或样品中存在的一种或多种微生物不存在于参考微生物组成中,则检测到受试者中的微生物失衡。
B126.一种检测受试者中的微生物失衡的方法,所述方法包括:
(a)使用用于一个核酸扩增反应的第一引物对集和用于另一个核酸扩增反应的第二引物对集对受试者样品中的或来自受试者样品的核酸进行两个单独的核酸扩增反应,其中:
(i)所述第一引物对集包括能够扩增原核16S rRNA基因的一个或多个高变区的核酸序列的一个或多个引物对,并且
(ii)所述第二引物对集包括能够扩增微生物的基因组内含有的靶核酸序列的一个或多个引物对,所述靶核酸序列不包含在原核16S rRNA基因的高变区内,其中不同的引物对扩增不同微生物的基因组内含有的不同靶核酸序列;
(b)从通过(i)和(ii)的引物对扩增的核酸产物中获得序列信息,以及任选地确定由(i)的一个或多个引物对扩增的核酸产物的水平;
(c)通过鉴定所述样品中微生物的属,以及任选地其相对水平,以及所述样品中一种或多种微生物的种来确定所述样品的微生物组成;
(d)将所述样品的所述微生物组成与参考微生物组成进行比较;以及
(e)如果样品中一种或多种微生物的水平与参考微生物组成中微生物的水平不同、参考组成中的一种或多种微生物不存在于样品中和/或样品中存在的一种或多种微生物不存在于参考微生物组成中,则检测到受试者中的微生物失衡。
B127.一种治疗具有微生物失衡的受试者的方法,所述方法包括:
(a)使用引物对组合对受试者样品中的或来自受试者样品的核酸进行核酸扩增,所述引物对组合包括:
(i)能够扩增原核16S rRNA基因的一个或多个高变区的核酸序列的一个或多个引物对,以及
(ii)能够扩增微生物的基因组内含有的靶核酸序列的一个或多个引物对,所述靶核酸序列不包含在原核16S rRNA基因的高变区内,其中不同的引物对扩增不同微生物的基因组内含有的不同靶核酸序列;
(b)从通过(i)和(ii)的引物对的组合扩增的核酸产物中获得序列信息,以及任选地确定由(i)的一个或多个引物对扩增的核酸产物的水平;
(c)通过鉴定所述样品中微生物的属,以及任选地其相对水平,以及所述样品中一种或多种微生物的种来确定所述样品的微生物组成;
(d)检测所述受试者中的微生物失衡;以及
(e)治疗所述受试者以建立所述受试者中的微生物失衡。
B128.一种治疗具有微生物失衡的受试者的方法,所述方法包括:
(a)使用用于一个核酸扩增反应的第一引物对集和用于另一个核酸扩增反应的第二引物对集对受试者样品中的或来自受试者样品的核酸进行两个单独的核酸扩增反应,其中:
(i)所述第一引物对集包括能够扩增原核16S rRNA基因的一个或多个高变区的核酸序列的一个或多个引物对,并且
(ii)所述第二引物对集包括能够扩增微生物的基因组内含有的靶核酸序列的一个或多个引物对,所述靶核酸序列不包含在原核16S rRNA基因的高变区内,其中不同的引物对扩增不同微生物的基因组内含有的不同靶核酸序列;
(b)从通过(i)和(ii)的引物对扩增的核酸产物中获得序列信息,以及任选地确定由(i)的一个或多个引物对扩增的核酸产物的水平;
(c)通过鉴定所述样品中微生物的属,以及任选地其相对水平,以及所述样品中一种或多种微生物的种来确定所述样品的微生物组成;
(d)检测所述受试者中的微生物失衡;以及
(e)治疗所述受试者以建立所述受试者中的微生物失衡。
B129.一种用于用免疫疗法治疗受试者的方法,所述方法包括:
(a)使用引物对组合对受试者样品中的或来自受试者样品的核酸进行核酸扩增,所述引物对组合包括:
(i)能够扩增原核16S rRNA基因的一个或多个高变区的核酸序列的一个或多个引物对,以及
(ii)能够扩增微生物的基因组内含有的靶核酸序列的一个或多个引物对,所述靶核酸序列不包含在原核16S rRNA基因的高变区内,其中所述微生物是与对基于免疫检查点抑制的免疫疗法的反应呈正相关或负相关的微生物;
(b)从通过(i)和(ii)的引物对的组合扩增的核酸产物中获得序列信息,以及任选地确定由(i)的一个或多个引物对扩增的核酸产物的水平;
(c)鉴定所述样品中微生物的属和所述样品中一种或多种微生物的种;以及
(d)如下治疗所述受试者:
(1)如果所述样品包含与对基于免疫检查点抑制的免疫疗法的反应呈正相关的一种或多种微生物和/或排除或具有足够低水平的与对基于免疫检查点抑制的免疫疗法的反应呈负相关的一种或多种微生物,则用基于免疫检查点抑制的免疫疗法治疗所述受试者;或
(2)如果所述样品缺乏与对基于免疫检查点抑制的免疫疗法的反应呈正相关的一种或多种微生物或其足够水平,则用增加与对基于免疫检查点抑制的免疫疗法的反应呈正相关的一种或多种微生物的水平的组合物治疗所述受试者,和/或如果所述样品含有与对基于免疫检查点抑制的免疫疗法的反应呈负相关的一种或多种微生物或其过高水平,则用消除或降低与对基于免疫检查点抑制的免疫疗法的反应呈负相关的一种或多种微生物的水平的组合物治疗所述受试者;并用基于免疫检查点抑制的免疫疗法治疗所述受试者。
B130.一种用于用免疫疗法治疗受试者的方法,所述方法包括:
(a)使用用于一个核酸扩增反应的第一引物对集和用于另一个核酸扩增反应的第二引物对集对受试者样品中的或来自受试者样品的核酸进行两个单独的核酸扩增反应,其中:
(i)所述第一引物对集包括能够扩增原核16S rRNA基因的一个或多个高变区的核酸序列的一个或多个引物对,并且
(ii)所述第二引物对集包括扩增微生物的基因组内含有的靶核酸序列的一个或多个引物对,所述靶核酸序列不包含在原核16S rRNA基因的高变区内,其中所述微生物是与对基于免疫检查点抑制的免疫疗法的反应呈正相关或负相关的微生物;
(b)从通过(i)和(ii)的引物对扩增的核酸产物中获得序列信息,以及任选地确定由(i)的一个或多个引物对扩增的核酸产物的水平;
(c)鉴定所述样品中微生物的属和所述样品中一种或多种微生物的种;以及
(d)如下治疗所述受试者:
(1)如果所述样品包含与对基于免疫检查点抑制的免疫疗法的反应呈正相关的一种或多种微生物和/或排除或具有足够低水平的与对基于免疫检查点抑制的免疫疗法的反应呈负相关的一种或多种微生物,则用基于免疫检查点抑制的免疫疗法治疗所述受试者;或
(2)如果所述样品缺乏与对基于免疫检查点抑制的免疫疗法的反应呈正相关的一种或多种微生物或其足够水平,则用增加与对基于免疫检查点抑制的免疫疗法的反应呈正相关的一种或多种微生物的水平的组合物治疗所述受试者,和/或如果所述样品含有与对基于免疫检查点抑制的免疫疗法的反应呈负相关的一种或多种微生物或其过高水平,则用消除或降低与对基于免疫检查点抑制的免疫疗法的反应呈负相关的一种或多种微生物的水平的组合物治疗所述受试者;并用基于免疫检查点抑制的免疫疗法治疗所述受试者。
C1.一种试剂盒,其包括根据实施例A1-A45所述的任何组合物。
C2.根据实施例C1所述的试剂盒,其进一步包括一种或多种聚合酶。
C3.根据实施例C1或实施例C2述的试剂盒,其进一步包括一种或多种寡核苷酸衔接子。
C4.根据实施例C1-C3中任一项所述的试剂盒,其进一步包括一种或多种连接酶。
D1.一种方法,其包括:
(a)接收多个核酸序列读段,其中所述序列读段包含多个16S序列读段;
(b)第一次将所述多个16S序列读段映射到多个压缩的16S参考序列,其中每个压缩的16S参考序列包含用于种的对应菌株的高变节段集;
(c)生成含有映射到所述高变节段集中的每个高变节段的16S序列读段的读段计数的读段计数矩阵,其中所述读段计数矩阵的行对应于种的菌株并且列对应于所述高变节段;
(d)通过对所述读段计数应用取阈值来缩减所述读段计数矩阵,以形成缩减的读段计数矩阵;
(e)基于所述缩减的读段计数矩阵压缩全长16S参考序列的数据库以形成全长16S参考序列的缩减集,全长16S参考序列的所述缩减集存储在存储器中;
(f)第二次将所述多个16S序列读段映射到全长16S参考序列的所述缩减集;
(g)对映射到全长16S参考序列的所述缩减集中的每个全长参考的16S序列读段进行计数,以形成第二读段计数集;
(h)将所述第二读段计数集中的读段计数归一化,以形成归一化计数;
(i)针对给定水平聚合所述归一化计数以形成聚合计数,其中所述给定水平是种水平、属水平或科水平;以及
(j)对所述聚合计数应用阈值以检测样品中给定水平的微生物的存在。
D2.根据实施例D1所述的方法,其中缩减所述读段计数矩阵进一步包括:当行内的读段计数的总和小于行总和阈值时,消除所述读段计数矩阵的行以形成第一个缩减的读段计数矩阵。
D3.根据实施例D2所述的方法,其中缩减所述读段计数矩阵进一步包括:(a)将对应于对应种的相同预期特征的所述第一个缩减的读段计数矩阵的行的读段计数相加,以形成列总和;以及
(b)将所述列总和相加以形成组合总和,其中预期特征包括二进制值,所述二进制值对应于所述高变节段集中的高变节段在菌株中预计存在(=1)或不存在(=0)。
D4.根据实施例D3所述的方法,其中缩减所述读段计数矩阵进一步包括当所述组合总和小于组合总和阈值时消除所述第一个缩减的读段计数矩阵的行以形成第二个缩减的读段计数矩阵。
D5.根据实施例D3所述的方法,其中缩减所述读段计数矩阵进一步包括将特征阈值应用于所述列总和以分配二进制值以形成所述第二个缩减的读段计数矩阵的每一行的观察到的特征,所述观察到的特征和预期特征各自具有类别总数。
D6.根据实施例D5所述的方法,其中所述压缩进一步包括确定在所述观察到的特征和所述预期特征中具有匹配二进制值的类别与所述类别总数的比率。
D7.根据实施例D6所述的方法,其中所述压缩进一步包括当所述比率大于比率阈值时,从存储在存储器中的全长16S参考序列的数据库中为全长16S参考序列的第一缩减集选择对应的全长16S参考序列。
D8.根据实施例D7所述的方法,其中所述第二映射步骤使用全长16S参考序列的所述第一缩减集作为全长16S参考序列的缩减集。
D9.根据实施例D7所述的方法,其中所述压缩进一步包括基于序列相似性指标将未注释的菌株重新分配给全长16S参考序列的所述第一缩减集中的注释菌株,以形成全长16S参考序列的第二缩减集。
D10.根据实施例D9所述的方法,其中所述第二映射步骤使用全长16S参考序列的所述第二缩减集作为全长16S参考序列的缩减集。
D11.根据实施例D3所述的方法,其中所述归一化步骤进一步包括通过将所述第二读段计数集中的读段计数除以所述预期特征中1的数量以形成所述归一化读段计数。
D12.根据实施例D11所述的方法,其中所述归一化步骤进一步包括将所述归一化计数除以对应的16S基因的平均拷贝数。
D13.根据实施例D1所述的方法,其中应用阈值的步骤进一步包括将所述阈值应用于所述聚合计数与映射的16S序列读段的总数的比率。
D14.根据实施例D1所述的方法,其中所述多个核酸序列读段进一步包含多个靶标种序列读段。
D15.根据实施例D14所述的方法,其进一步包括将所述靶标种序列读段映射到分段参考序列以形成靶标种映射读段,其中每个分段参考序列包括对应于靶标种的菌株的预期扩增子的节段。
D16.根据实施例D15所述的方法,其进一步包括聚合所述靶标种映射读段的计数以形成每个种的聚合读段计数。
D17.根据实施例D16所述的方法,其进一步包括通过除以扩增性扩增子的总数来对每个种的所述聚合读段计数进行归一化,以形成每个种的归一化读段计数。
D18.根据实施例D17所述的方法,其进一步包括将每个种的所述归一化读段计数跨整个种相加以形成归一化读段计数的总和。
D19.根据实施例D18所述的方法,其进一步包括将每个种的每个归一化读段计数除以每个种的归一化读段计数的总和以形成每个种的比率。
D20.根据实施例D19所述的方法,其进一步包括将第二阈值应用于每个种的比率以检测所述样品中靶标种的存在。
D21.根据实施例D15所述的方法,其进一步包括通过应用基于种引物池中的引物的计算机PCR来生成所述分段参考序列。
D22.根据实施例D1所述的方法,其进一步包括通过应用基于16S引物池中的引物的计算机PCR来生成压缩的16S参考序列。
D23.根据实施例D1所述的方法,其中所述多个16S序列读段对应于通过在存在靶向原核16S rRNA基因的一个或多个高变区的一个或多个引物对的情况下扩增核酸样品而产生的扩增子。
D24.根据实施例D14所述的方法,其中所述多个靶标种序列读段对应于通过扩增包含在原核16S rRNA基因的高变区之外的微生物的基因组内的靶核酸序列而产生的扩增子,其中不同的引物对扩增核酸样品中不同微生物的基因组内含有的不同靶核酸序列。
E1.一种方法,其包括:
(a)在处理器处接收多个核酸序列读段,其中所述序列读段包含多个16S序列读段;
(b)第一次将所述读段所述多个16S序列读段映射到多个压缩的16S参考序列,其中每个压缩的16S参考序列包含用于种的对应菌株的高变节段集;
(c)对映射到所述高变节段集中的每个高变节段的16S序列读段进行计数,以形成第一读段计数集;
(d)基于映射到所述压缩的16S参考序列的16S序列读段的所述第一读段计数集,压缩全长16S参考序列的数据库以形成全长16S参考序列的缩减集,全长16S参考序列的所述缩减集存储在存储器中;
(e)第二次将所述多个16S序列读段映射到全长16S参考序列的所述缩减集;
(f)对映射到全长16S参考序列的所述缩减集中的每个全长参考序列的16S序列读段进行计数,以形成第二读段计数集;以及
(g)基于所述第二读段计数集检测所述样品中微生物在种水平、属水平或科水平上的存在。
E2.根据实施例E1所述的方法,其中所述多个核酸序列读段进一步包含多个靶标种序列读段。
E3.根据实施例E2所述的方法,其进一步包括将所述靶标种序列读段映射到分段参考序列以形成靶标种映射读段,其中每个分段参考序列包括对应于靶标种的菌株的预期扩增子的节段。
E4.根据实施例E3所述的方法,其进一步包括聚合所述靶标种映射读段的计数以形成每个种的聚合读段计数。
E5.根据实施例E4所述的方法,其进一步包括基于每个种的聚合读段计数检测所述样品中靶标种的存在。
E6.根据实施例E3所述的方法,其进一步包括通过应用基于种引物池中的引物的计算机PCR来生成所述分段参考序列。
E7.根据实施例E1所述的方法,其进一步包括通过应用基于16S引物池中的引物的计算机PCR来生成压缩的16S参考序列。
E8.根据实施例E1所述的方法,其中所述多个16S序列读段对应于通过在存在靶向原核16S rRNA基因的一个或多个高变区的一个或多个引物对的情况下扩增核酸样品而产生的扩增子。
E9.根据实施例E2所述的方法,其中所述多个靶标种序列读段对应于通过扩增包含在原核16S rRNA基因的高变区之外的微生物的基因组内的靶核酸序列而产生的扩增子,其中不同的引物对扩增核酸样品中不同微生物的基因组内含有的不同靶核酸序列。
F1.一种系统,其包括:
(a)机器可读存储器;以及
(b)处理器,所述处理器被配置成执行机器可读指令,所述机器可读指令当由所述处理器执行时使所述系统执行方法,所述方法包括:
(i)在所述处理器处接收多个核酸序列读段,其中所述序列读段包含多个16S序列读段;
(ii)第一次将所述多个16S序列读段映射到多个压缩的16S参考序列,其中每个压缩的16S参考序列包含用于种的对应菌株的高变节段集;
(iii)生成含有映射到所述高变节段集中的每个高变节段的16S序列读段的读段计数的读段计数矩阵,其中所述读段计数矩阵的行对应于种的菌株并且列对应于所述高变节段;
(iv)通过对所述读段计数应用取阈值来缩减所述读段计数矩阵,以形成缩减的读段计数矩阵;
(v)基于所述缩减的读段计数矩阵压缩全长16S参考序列的数据库以形成全长16S参考序列的缩减集,全长16S参考序列的所述缩减集存储在所述存储器中;
(vi)第二次将所述多个16S序列读段映射到全长16S参考序列的所述缩减集;
(vii)对映射到全长16S参考序列的所述缩减集中的每个全长参考的16S序列读段进行计数,以形成第二读段计数集;
(viii)将所述第二读段计数集中的读段计数归一化,以形成归一化计数;
(ix)针对给定水平聚合所述归一化计数以形成聚合计数,其中所述给定水平是种水平、属水平或科水平;以及
(x)对所述聚合计数应用阈值以检测样品中给定水平的微生物的存在。
F2.根据实施例F1所述的系统,其中缩减所述读段计数矩阵进一步包括当行内的读段计数的总和小于行总和阈值时,消除所述读段计数矩阵的行以形成第一个缩减的读段计数矩阵。
F3.根据实施例F2所述的系统,其中缩减所述读段计数矩阵进一步包括:
(a)将对应于对应种的相同预期特征的所述第一个缩减的读段计数矩阵的行的读段计数相加,以形成列总和;以及
(b)将所述列总和相加以形成组合总和,其中预期特征包括二进制值,所述二进制值对应于所述高变节段集中的高变节段在菌株中预计存在(=1)或不存在(=0)。
F4.根据实施例F3所述的系统,其中缩减所述读段计数矩阵进一步包括当所述组合总和小于组合总和阈值时消除所述第一个缩减的读段计数矩阵的行以形成第二个缩减的读段计数矩阵。
F5.根据实施例F3所述的系统,其中缩减所述读段计数矩阵进一步包括将特征阈值应用于所述列总和以分配二进制值以形成所述第二个缩减的读段计数矩阵的每一行的观察到的特征,所述观察到的特征和预期特征各自具有类别总数。
F6.根据实施例F5所述的系统,其中所述压缩进一步包括确定在所述观察到的特征和所述预期特征中具有匹配二进制值的类别与所述类别总数的比率。
F7.根据实施例F6所述的系统,其中所述压缩进一步包括当所述比率大于比率阈值时,从存储在存储器中的全长16S参考序列的数据库中为全长16S参考序列的第一缩减集选择对应的全长16S参考序列。
F8.根据实施例F7所述的系统,其中所述第二映射步骤使用全长16S参考序列的所述第一缩减集作为全长16S参考序列的缩减集。
F9.根据实施例F7所述的系统,其中所述压缩进一步包括基于序列相似性指标将未注释的菌株重新分配给全长16S参考序列的所述第一缩减集中的注释菌株,以形成全长16S参考序列的第二缩减集。
F10.根据实施例F9所述的系统,其中所述第二映射步骤使用全长16S参考序列的所述第二缩减集作为全长16S参考序列的缩减集。
F11.根据实施例F3所述的系统,其中所述归一化步骤进一步包括通过将所述第二读段计数集中的读段计数除以所述预期特征中1的数量以形成所述归一化读段计数。
F12.根据实施例F11所述的系统,其中所述归一化步骤进一步包括将所述归一化计数除以对应的16S基因的平均拷贝数。
F13.根据实施例F1所述的系统,其中应用阈值的步骤进一步包括将所述阈值应用于所述聚合计数与映射的16S序列读段的总数的比率。
F14.根据实施例F1所述的系统,其中所述多个核酸序列读段进一步包含多个靶标种序列读段。
F15.根据实施例F14所述的系统,其进一步包括将所述靶标种序列读段映射到分段参考序列以形成靶标种映射读段,其中每个分段参考序列包括对应于靶标种的菌株的预期扩增子的节段。
F16.根据实施例F15所述的系统,其进一步包括聚合所述靶标种映射读段的计数以形成每个种的聚合读段计数。
F17.根据实施例F16所述的系统,其进一步包括通过除以扩增性扩增子的总数来对每个种的所述聚合读段计数进行归一化,以形成每个种的归一化读段计数。
F18.根据实施例F17所述的系统,其进一步包括将每个种的所述归一化读段计数跨整个种相加以形成归一化读段计数的总和。
F19.根据实施例F18所述的系统,其进一步包括将每个种的每个归一化读段计数除以每个种的归一化读段计数的总和以形成每个种的比率。
F20.根据实施例F19所述的系统,其进一步包括将第二阈值应用于每个种的比率以检测所述样品中靶标种的存在。
F21.根据实施例F15所述的系统,其进一步包括通过应用基于种引物池中的引物的计算机PCR来生成所述分段参考序列。
F22.根据实施例F1所述的系统,其进一步包括通过应用基于16S引物池中的引物的计算机PCR来生成压缩的16S参考序列。
F23.根据实施例F1所述的系统,其中所述多个16S序列读段对应于通过在存在靶向原核16S rRNA基因的一个或多个高变区的一个或多个引物对的情况下扩增核酸样品而产生的扩增子。
F24.根据实施例F14所述的系统,其中所述多个靶标种序列读段对应于通过扩增包含在原核16S rRNA基因的高变区之外的微生物的基因组内的靶核酸序列而产生的扩增子,其中不同的引物对扩增核酸样品中不同微生物的基因组内含有的不同靶核酸序列。
G1.一种系统,其包括:
(a)机器可读存储器;以及
(b)处理器,所述处理器被配置成执行机器可读指令,所述机器可读指令当由所述处理器执行时使所述系统执行方法,所述方法包括:
(i)在所述处理器处接收多个核酸序列读段,其中所述序列读段包含多个16S序列读段;
(ii)第一次将所述读段所述多个16S序列读段映射到多个压缩的16S参考序列,其中每个压缩的16S参考序列包含用于种的对应菌株的高变节段集;
(iii)对映射到所述高变节段集中的每个高变节段的16S序列读段进行计数,以形成第一读段计数集;
(iv)基于映射到所述压缩的16S参考序列的16S序列读段的所述第一读段计数集,压缩全长16S参考序列的数据库以形成全长16S参考序列的缩减集,全长16S参考序列的所述缩减集存储在所述存储器中;
(v)第二次将所述多个16S序列读段映射到全长16S参考序列的所述缩减集;
(vi)对映射到全长16S参考序列的所述缩减集中的每个全长参考序列的16S序列读段进行计数,以形成第二读段计数集;以及
(vii)基于所述第二读段计数集检测所述样品中微生物在种水平、属水平或科水平上的存在。
G2.根据实施例G1所述的系统,其中所述多个核酸序列读段进一步包含多个靶标种序列读段。
G3.根据实施例G2所述的系统,其进一步包括将所述靶标种序列读段映射到分段参考序列以形成靶标种映射读段,其中每个分段参考序列包括对应于靶标种的菌株的预期扩增子的节段。
G4.根据实施例G3所述的系统,其进一步包括聚合所述靶标种映射读段的计数以形成每个种的聚合读段计数。
G5.根据实施例G4所述的系统,其进一步包括基于每个种的聚合读段计数检测所述样品中靶标种的存在。
G6.根据实施例G3所述的系统,其进一步包括通过应用基于种引物池中的引物的计算机PCR来生成所述分段参考序列。
G7.根据实施例G1所述的系统,其进一步包括通过应用基于16S引物池中的引物的计算机PCR来生成压缩的16S参考序列。
G8.根据实施例G1所述的系统,其中所述多个16S序列读段对应于通过在存在靶向原核16S rRNA基因的一个或多个高变区的一个或多个引物对的情况下扩增核酸样品而产生的扩增子。
G9.根据实施例G2所述的系统,其中所述多个靶标种序列读段对应于通过扩增包含在原核16S rRNA基因的高变区之外的微生物的基因组内的靶核酸序列而产生的扩增子,其中不同的引物对扩增核酸样品中不同微生物的基因组内含有的不同靶核酸序列。
H1.一种非暂时性机器可读存储介质,其包括指令,所述指令当由处理器执行时使所述处理器执行方法,所述方法包括:
(a)在所述处理器处接收多个核酸序列读段,其中所述序列读段包含多个16S序列读段;
(b)第一次将所述多个16S序列读段映射到多个压缩的16S参考序列,其中每个压缩的16S参考序列包含用于种的对应菌株的高变节段集;
(c)生成含有映射到所述高变节段集中的每个高变节段的16S序列读段的读段计数的读段计数矩阵,其中所述读段计数矩阵的行对应于种的菌株并且列对应于所述高变节段;
(d)通过对所述读段计数应用取阈值来缩减所述读段计数矩阵,以形成缩减的读段计数矩阵;
(e)基于所述缩减的读段计数矩阵压缩全长16S参考序列的数据库以形成全长16S参考序列的缩减集,全长16S参考序列的所述缩减集存储在存储器中;
(f)第二次将所述多个16S序列读段映射到全长16S参考序列的所述缩减集;
(g)对映射到全长16S参考序列的所述缩减集中的每个全长参考的16S序列读段进行计数,以形成第二读段计数集;
(h)将所述第二读段计数集中的读段计数归一化,以形成归一化计数;
(i)针对给定水平聚合所述归一化计数以形成聚合计数,其中所述给定水平是种水平、属水平或科水平;以及
(j)对所述聚合计数应用阈值以检测样品中给定水平的微生物的存在。
H2.根据实施例H1所述的非暂时性机器可读存储介质,其进一步包括使所述处理器执行所述方法的指令,其中缩减所述读段计数矩阵进一步包括当行内的读段计数的总和小于行总和阈值时,消除所述读段计数矩阵的行以形成第一个缩减的读段计数矩阵。
H3.根据实施例H2所述的非暂时性机器可读存储介质,其进一步包括使所述处理器执行所述方法的指令,其中缩减所述读段计数矩阵进一步包括:
(a)将对应于对应种的相同预期特征的所述第一个缩减的读段计数矩阵的行的读段计数相加,以形成列总和;以及
(b)将所述列总和相加以形成组合总和,其中预期特征包括二进制值,所述二进制值对应于所述高变节段集中的高变节段在菌株中预计存在(=1)或不存在(=0)。
H4.根据实施例H3所述的非暂时性机器可读存储介质,其进一步包括使所述处理器执行所述方法的指令,其中缩减所述读段计数矩阵进一步包括当所述组合总和小于组合总和阈值时消除所述第一个缩减的读段计数矩阵的行以形成第二个缩减的读段计数矩阵。
H5.根据实施例H3所述的非暂时性机器可读存储介质,其进一步包括使所述处理器执行所述方法的指令,其中缩减所述读段计数矩阵进一步包括将特征阈值应用于所述列总和以分配二进制值以形成所述第二个缩减的读段计数矩阵的每一行的观察到的特征,所述观察到的特征和预期特征各自具有类别总数。
H6.根据实施例H5所述的非暂时性机器可读存储介质,其进一步包括使所述处理器执行所述方法的指令,其中所述压缩进一步包括确定在所述观察到的特征和所述预期特征中具有匹配二进制值的类别与所述类别总数的比率。
H7.根据实施例H6所述的非暂时性机器可读存储介质,其进一步包括使所述处理器执行所述方法的指令,其中所述压缩进一步包括当所述比率大于比率阈值时,从存储在存储器中的全长16S参考序列的数据库中为全长16S参考序列的第一缩减集选择对应的全长16S参考序列。
H8.根据实施例H7所述的非暂时性机器可读存储介质,其进一步包括使所述处理器执行所述方法的指令,其中所述第二映射步骤使用全长16S参考序列的所述第一缩减集作为全长16S参考序列的缩减集。
H9.根据实施例H7所述的非暂时性机器可读存储介质,其进一步包括使所述处理器执行所述方法的指令,其中所述压缩进一步包括基于序列相似性指标将未注释的菌株重新分配给全长16S参考序列的所述第一缩减集中的注释菌株,以形成全长16S参考序列的第二缩减集。
H10.根据实施例H9所述的非暂时性机器可读存储介质,其进一步包括使所述处理器执行所述方法的指令,其中所述第二映射步骤使用全长16S参考序列的所述第二缩减集作为全长16S参考序列的缩减集。
H11.根据实施例H3所述的非暂时性机器可读存储介质,其进一步包括使所述处理器执行所述方法的指令,其中所述归一化步骤进一步包括通过将所述第二读段计数集中的读段计数除以所述预期特征中1的数量以形成所述归一化读段计数。
H12.根据实施例H11所述的非暂时性机器可读存储介质,其进一步包括使所述处理器执行所述方法的指令,其中所述归一化步骤进一步包括将所述归一化计数除以对应的16S基因的平均拷贝数。
H13.根据实施例H1所述的非暂时性机器可读存储介质,其进一步包括使所述处理器执行所述方法的指令,其中应用阈值的步骤进一步包括将所述阈值应用于所述聚合计数与映射的16S序列读段的总数的比率。
H14.根据实施例H1所述的非暂时性机器可读存储介质,其进一步包括使所述处理器执行所述方法的指令,其中所述多个核酸序列读段进一步包含多个靶标种序列读段。
H15.根据实施例H14所述的非暂时性机器可读存储介质,其进一步包括使所述处理器执行所述方法的指令,所述方法进一步包括将所述靶标种序列读段映射到分段参考序列以形成靶标种映射读段,其中每个分段参考序列包括对应于靶标种的菌株的预期扩增子的节段。
H16.根据实施例H15所述的非暂时性机器可读存储介质,其进一步包括使所述处理器执行所述方法的指令,所述方法进一步包括聚合所述靶标种映射读段的计数以形成每个种的聚合读段计数。
H17.根据实施例H16所述的非暂时性机器可读存储介质,其进一步包括使所述处理器执行所述方法的指令,所述方法进一步包括通过除以扩增性扩增子的总数来对每个种的所述聚合读段计数进行归一化,以形成每个种的归一化读段计数。
H18.根据实施例H17所述的非暂时性机器可读存储介质,其进一步包括使所述处理器执行所述方法的指令,所述方法进一步包括将每个种的所述归一化读段计数跨整个种相加以形成归一化读段计数的总和。
H19.根据实施例H18所述的非暂时性机器可读存储介质,其进一步包括使所述处理器执行所述方法的指令,所述方法进一步包括将每个种的每个归一化读段计数除以每个种的归一化读段计数的总和以形成每个种的比率。
H20.根据实施例H19所述的非暂时性机器可读存储介质,其进一步包括使所述处理器执行所述方法的指令,所述方法进一步包括将第二阈值应用于每个种的比率以检测所述样品中靶标种的存在。
H21.根据实施例H15所述的非暂时性机器可读存储介质,其进一步包括使所述处理器执行所述方法的指令,所述方法进一步包括通过应用基于种引物池中的引物的计算机PCR来生成所述分段参考序列。
H22.根据实施例H1所述的非暂时性机器可读存储介质,其进一步包括使所述处理器执行所述方法的指令,所述方法进一步包括通过应用基于16S引物池中的引物的计算机PCR来生成压缩的16S参考序列。
H23.根据实施例H1所述的非暂时性机器可读存储介质,其进一步包括使所述处理器执行所述方法的指令,其中所述多个16S序列读段对应于通过在存在靶向原核16S rRNA基因的一个或多个高变区的一个或多个引物对的情况下扩增核酸样品而产生的扩增子。
H24.根据实施例H14所述的非暂时性机器可读存储介质,其进一步包括使所述处理器执行所述方法的指令,其中所述多个靶标种序列读段对应于通过扩增包含在原核16SrRNA基因的高变区之外的微生物的基因组内的靶核酸序列而产生的扩增子,其中不同的引物对扩增核酸样品中不同微生物的基因组内含有的不同靶核酸序列。
J1.一种非暂时性机器可读存储介质,其包括指令,所述指令当由处理器执行时使所述处理器执行方法,所述方法包括:
(a)在所述处理器处接收多个核酸序列读段,其中所述序列读段包含多个16S序列读段;
(b)第一次将所述读段所述多个16S序列读段映射到多个压缩的16S参考序列,其中每个压缩的16S参考序列包含用于种的对应菌株的高变节段集;
(c)对映射到所述高变节段集中的每个高变节段的16S序列读段进行计数,以形成第一读段计数集;
(d)基于映射到所述压缩的16S参考序列的16S序列读段的所述第一读段计数集,压缩全长16S参考序列的数据库以形成全长16S参考序列的缩减集,全长16S参考序列的所述缩减集存储在存储器中;
(e)第二次将所述多个16S序列读段映射到全长16S参考序列的所述缩减集;
(f)对映射到全长16S参考序列的所述缩减集中的每个全长参考序列的16S序列读段进行计数,以形成第二读段计数集;以及
(g)基于所述第二读段计数集检测所述样品中微生物在种水平、属水平或科水平上的存在。
J2.根据实施例J1所述的非暂时性机器可读存储介质,其进一步包括使所述处理器执行所述方法的指令,其中所述多个核酸序列读段进一步包含多个靶标种序列读段。
J3.根据实施例J2所述的非暂时性机器可读存储介质,其进一步包括使所述处理器执行所述方法的指令,所述方法进一步包括将所述靶标种序列读段映射到分段参考序列以形成靶标种映射读段,其中每个分段参考序列包括对应于靶标种的菌株的预期扩增子的节段。
J4.根据实施例J3所述的非暂时性机器可读存储介质,其进一步包括使所述处理器执行所述方法的指令,所述方法进一步包括聚合所述靶标种映射读段的计数以形成每个种的聚合读段计数。
J5.根据实施例J4所述的非暂时性机器可读存储介质,其进一步包括使所述处理器执行所述方法的指令,所述方法进一步包括基于每个种的聚合读段计数检测所述样品中靶标种的存在。
J6.根据实施例J3所述的非暂时性机器可读存储介质,其进一步包括使所述处理器执行所述方法的指令,所述方法进一步包括通过应用基于种引物池中的引物的计算机PCR来生成所述分段参考序列。
J7.根据实施例J1所述的非暂时性机器可读存储介质,其进一步包括使所述处理器执行所述方法的指令,所述方法进一步包括通过应用基于16S引物池中的引物的计算机PCR来生成压缩的16S参考序列。
J8.根据实施例J1所述的非暂时性机器可读存储介质,其进一步包括使所述处理器执行所述方法的指令,其中所述多个16S序列读段对应于通过在存在靶向原核16S rRNA基因的一个或多个高变区的一个或多个引物对的情况下扩增核酸样品而产生的扩增子。
J9.根据实施例J2所述的非暂时性机器可读存储介质,其进一步包括使所述处理器执行所述方法的指令,其中所述多个靶标种序列读段对应于通过扩增包含在原核16SrRNA基因的高变区之外的微生物的基因组内的靶核酸序列而产生的扩增子,其中不同的引物对扩增核酸样品中不同微生物的基因组内含有的不同靶核酸序列。
本文所引用的任何专利、专利申请、出版物、GENBANK(和其它数据库)序列、网站和其它已出版材料的公开内容和内容通过引用整体并入本文。对任何专利、专利申请、出版物、GENBANK(和其它数据库)序列、网站和其它已出版材料的引用并不承认上述任何内容是相关的现有技术,也不构成对内容或出版日期的任何承认。

Claims (19)

1. 一种系统,其包括:
机器可读存储器;和
处理器,所述处理器被配置成执行机器可读指令,所述机器可读指令当由所述处理器执行时使所述系统执行方法,所述方法包括:接收多个核酸序列读段,其中所述序列读段包含多个16S序列读段;
第一次将所述多个16S序列读段映射到多个压缩的16S参考序列,其中每个压缩的16S参考序列包含用于种的对应菌株的高变节段集,其中对16SrRNA基因序列数据库中含有的全长16S rRNA基因序列应用计算机PCR模拟,基于16S引物池中的引物生成压缩的16S参考序列;
生成含有映射到所述高变节段集中的每个高变节段的16S序列读段的读段计数的读段计数矩阵,其中所述读段计数矩阵的行对应于种的菌株并且列对应于所述高变节段;
通过对所述读段计数应用取阈值来缩减所述读段计数矩阵,以形成缩减的读段计数矩阵;
基于使用所述缩减的读段计数矩阵从全长16S参考序列的数据库选择相应的全长16S参考序列压缩全长16S参考序列的数据库以形成全长16S参考序列的缩减集,全长16S参考序列的所述缩减集存储在存储器中;
第二次将所述多个16S序列读段映射到全长16S参考序列的所述缩减集;
对映射到全长16S参考序列的所述缩减集中的每个全长参考的16S序列读段进行计数,以形成第二读段计数集;
将所述第二读段计数集中的读段计数归一化,以形成归一化计数;
针对给定水平聚合所述归一化计数以形成聚合计数,其中所述给定水平是种水平、属水平或科水平;以及
对所述聚合计数应用阈值以检测样品中给定水平的微生物的存在。
2. 根据权利要求1所述的系统,其中缩减所述读段计数矩阵进一步包括当行内的读段计数的总和小于行总和阈值时,消除所述读段计数矩阵的行以形成第一个缩减的读段计数矩阵。
3. 根据权利要求2所述的系统,其中缩减所述读段计数矩阵进一步包括
将对应于对应种的相同预期特征的所述第一个缩减的读段计数矩阵的行的读段计数相加,以形成列总和;以及
将所述列总和相加以形成组合总和,其中预期特征包括二进制值,所述二进制值对应于所述高变节段集中的高变节段在菌株中预计存在(=1)或不存在(=0)。
4.根据权利要求3所述的系统,其中缩减所述读段计数矩阵进一步包括当所述组合总和小于组合总和阈值时消除所述第一个缩减的读段计数矩阵的行以形成第二个缩减的读段计数矩阵。
5.根据权利要求3所述的系统,其中缩减所述读段计数矩阵进一步包括将特征阈值应用于所述列总和以分配二进制值以形成第二个缩减的读段计数矩阵的每一行的观察到的特征,所述观察到的特征和预期特征各自具有类别总数。
6.根据权利要求5所述的系统,其中所述压缩进一步包括确定在所述观察到的特征和所述预期特征中具有匹配二进制值的类别与所述类别总数的比率。
7.根据权利要求6所述的系统,其中所述压缩进一步包括当所述比率大于比率阈值时,从存储在存储器中的全长16S参考序列的数据库中为全长16S参考序列的第一缩减集选择对应的全长16S参考序列。
8.根据权利要求1所述的系统,其中所述多个核酸序列读段进一步包含多个靶标种序列读段。
9.根据权利要求8所述的系统,其进一步包括将所述靶标种序列读段映射到分段参考序列以形成靶标种映射读段,其中每个分段参考序列包括对应于靶标种的菌株的预期扩增子的节段。
10. 根据权利要求1所述的系统,其中所述多个16S序列读段对应于通过在存在靶向原核16S rRNA基因的一个或多个高变区的一个或多个引物对的情况下扩增核酸样品而产生的扩增子。
11. 根据权利要求8所述的系统,其中所述多个靶标种序列读段对应于通过扩增包含在原核16S rRNA基因的高变区之外的微生物的基因组内的靶核酸序列而产生的扩增子,其中不同的引物对扩增核酸样品中不同微生物的基因组内含有的不同靶核酸序列。
12.一种系统,其包括:
在处理器处接收多个核酸序列读段,其中所述序列读段包含多个16S序列读段;
第一次将所述读段所述多个16S序列读段映射到多个压缩的16S参考序列,其中每个压缩的16S参考序列包含用于种的对应菌株的高变节段集;
对映射到所述高变节段集中的每个高变节段的16S序列读段进行计数,以形成第一读段计数集;
基于映射到所述压缩的16S参考序列的16S序列读段的所述第一读段计数集,压缩全长16S参考序列的数据库以形成全长16S参考序列的缩减集,全长16S参考序列的所述缩减集存储在存储器中;
第二次将所述多个16S序列读段映射到全长16S参考序列的所述缩减集;
对映射到全长16S参考序列的所述缩减集中的每个全长参考序列的16S序列读段进行计数,以形成第二读段计数集;以及
基于所述第二读段计数集检测样品中微生物在种水平、属水平或科水平上的存在。
13.根据权利要求12所述的系统,其中所述多个核酸序列读段进一步包含多个靶标种序列读段。
14.根据权利要求13所述的系统,其进一步包括将所述靶标种序列读段映射到分段参考序列以形成靶标种映射读段,其中每个分段参考序列包括对应于靶标种的菌株的预期扩增子的节段。
15.根据权利要求14所述的系统,其进一步包括聚合所述靶标种映射读段的计数以形成每个种的聚合读段计数。
16.根据权利要求15所述的系统,其进一步包括基于每个种的聚合读段计数检测所述样品中靶标种的存在。
17.根据权利要求14所述的系统,其进一步包括通过应用基于种引物池中的引物的计算机PCR来生成所述分段参考序列。
18. 根据权利要求12所述的系统,其中所述多个16S序列读段对应于通过在存在靶向原核16S rRNA基因的一个或多个高变区的一个或多个引物对的情况下扩增核酸样品而产生的扩增子。
19. 根据权利要求13所述的系统,其中所述多个靶标种序列读段对应于通过扩增包含在原核16S rRNA基因的高变区之外的微生物的基因组内的靶核酸序列而产生的扩增子,其中不同的引物对扩增核酸样品中不同微生物的基因组内含有的不同靶核酸序列。
CN202080082093.0A 2019-10-11 2020-10-09 用于评估微生物群体的组合物和方法 Active CN115176032B (zh)

Applications Claiming Priority (7)

Application Number Priority Date Filing Date Title
US201962914368P 2019-10-11 2019-10-11
US201962914366P 2019-10-11 2019-10-11
US62/914,366 2019-10-11
US62/914,368 2019-10-11
US201962944877P 2019-12-06 2019-12-06
US62/944,877 2019-12-06
PCT/US2020/070643 WO2021072439A1 (en) 2019-10-11 2020-10-09 Compositions and methods for assessing microbial populations

Publications (2)

Publication Number Publication Date
CN115176032A CN115176032A (zh) 2022-10-11
CN115176032B true CN115176032B (zh) 2025-05-13

Family

ID=73060141

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202080082093.0A Active CN115176032B (zh) 2019-10-11 2020-10-09 用于评估微生物群体的组合物和方法

Country Status (4)

Country Link
US (1) US20220251669A1 (zh)
EP (1) EP4041918B1 (zh)
CN (1) CN115176032B (zh)
WO (1) WO2021072439A1 (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20250054578A1 (en) * 2021-12-16 2025-02-13 Sapient Bioanalytics, Llc Systems and methods for identifying microbial species and improving health
EP4469607A4 (en) * 2022-01-24 2026-01-07 Gusto Global Llc SINGLE-POINT TARGETED AMPLICO FRAGMENT SEQUENCING AT SINGLE AND MULTI-LOCI LOCI
CN115960789A (zh) * 2023-01-03 2023-04-14 中国药科大学 一种治疗艰难梭菌感染的合成微生物群构建方法及应用
WO2025024111A1 (en) * 2023-07-25 2025-01-30 Gusto Global, Llc Single point amplicon fragment sequencing and methods for diagnosing and monitoring disease
WO2025072465A1 (en) * 2023-09-27 2025-04-03 Drexel University Reagents, methods, and kits for identifying organisms across taxonomic domains

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107111692A (zh) * 2014-10-10 2017-08-29 生命科技股份有限公司 用于计算经校正扩增子覆盖度的方法、系统及计算机可读媒体
WO2019046347A2 (en) * 2017-08-28 2019-03-07 uBiome, Inc. METHOD AND SYSTEM FOR CHARACTERIZING CONDITIONS RELATED TO A FEMININE REPRODUCTIVE SYSTEM ASSOCIATED WITH MICROORGANISMS

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4683202A (en) 1985-03-28 1987-07-28 Cetus Corporation Process for amplifying nucleic acid sequences
US4683195A (en) 1986-01-30 1987-07-28 Cetus Corporation Process for amplifying, detecting, and/or-cloning nucleic acid sequences
US5210015A (en) 1990-08-06 1993-05-11 Hoffman-La Roche Inc. Homogeneous assay system using the nuclease activity of a nucleic acid polymerase
US7405281B2 (en) 2005-09-29 2008-07-29 Pacific Biosciences Of California, Inc. Fluorescent nucleotide analogs and uses therefor
US20090325145A1 (en) 2006-10-20 2009-12-31 Erwin Sablon Methodology for analysis of sequence variations within the hcv ns5b genomic region
EP3285067B1 (en) 2006-12-14 2022-06-22 Life Technologies Corporation Apparatus for measuring analytes using fet arrays
US8262900B2 (en) 2006-12-14 2012-09-11 Life Technologies Corporation Methods and apparatus for measuring analytes using large scale FET arrays
US8586310B2 (en) 2008-09-05 2013-11-19 Washington University Method for multiplexed nucleic acid patch polymerase chain reaction
US8574835B2 (en) 2009-05-29 2013-11-05 Life Technologies Corporation Scaffolded nucleic acid polymer particles and methods of making and using
US20130090860A1 (en) 2010-12-30 2013-04-11 Life Technologies Corporation Methods, systems, and computer readable media for making base calls in nucleic acid sequencing
US8594951B2 (en) 2011-02-01 2013-11-26 Life Technologies Corporation Methods and systems for nucleic acid sequence analysis
AU2016253004B2 (en) * 2015-04-24 2022-10-06 University Of Utah Research Foundation Methods and systems for multiple taxonomic classification
US11293056B2 (en) 2017-11-07 2022-04-05 Life Technologies Corporation Methods and compositions for manipulating nucleic acids

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107111692A (zh) * 2014-10-10 2017-08-29 生命科技股份有限公司 用于计算经校正扩增子覆盖度的方法、系统及计算机可读媒体
WO2019046347A2 (en) * 2017-08-28 2019-03-07 uBiome, Inc. METHOD AND SYSTEM FOR CHARACTERIZING CONDITIONS RELATED TO A FEMININE REPRODUCTIVE SYSTEM ASSOCIATED WITH MICROORGANISMS

Also Published As

Publication number Publication date
US20220251669A1 (en) 2022-08-11
WO2021072439A1 (en) 2021-04-15
EP4041918A1 (en) 2022-08-17
EP4041918B1 (en) 2025-12-10
CN115176032A (zh) 2022-10-11

Similar Documents

Publication Publication Date Title
CN115176032B (zh) 用于评估微生物群体的组合物和方法
Fuks et al. Combining 16S rRNA gene variable regions enables high-resolution microbial community profiling
Gohl et al. Systematic improvement of amplicon marker gene methods for increased accuracy in microbiome studies
Mardis The impact of next-generation sequencing technology on genetics
Yelagandula et al. Multiplexed detection of SARS-CoV-2 and other respiratory infections in high throughput by SARSeq
US20130261196A1 (en) Nucleic Acids For Multiplex Organism Detection and Methods Of Use And Making The Same
US20150344973A1 (en) Method and System for Detection of an Organism
CA3038661C (en) METHOD AND SYSTEM FOR PREPARING AND SEQUENCING CRISPR-BASED BANK
US20150167068A1 (en) HUMAN IDENTIFICATION USING A PANEL OF SNPs
Fabyanic et al. Joint single-cell profiling resolves 5mC and 5hmC and reveals their distinct gene regulatory effects
TW201525145A (zh) 用於偵測細菌污染之方法及組合物
CA2848304A1 (en) Methods for sequencing a polynucleotide
JP2009502137A (ja) 核酸変種の迅速な同定および定量のための方法
EP4570919A2 (en) Amplification of single stranded dna
KR20220025213A (ko) 시퀀싱 공정
WO2013173774A2 (en) Molecular inversion probes
WO2020078378A1 (en) Methods and systems for profiling microbes
JP2020535121A (ja) 配列決定ライブラリのための正規化
JP6474173B2 (ja) 標的核酸の定量方法のためのキット
Del Chierico et al. Choice of next-generation sequencing pipelines
Zhai et al. A single-stranded based library preparation method for virome characterization
WO2013173795A1 (en) Realtime sequence based biosurveillance system
US20260028669A1 (en) Methods and compositions for nucleic acid analysis
Zhai et al. A single strand-based library preparation method for unbiased virome characterization
Liu et al. A streamlined nanopore-compatible 5PSeq protocol for rapid phenotypic antimicrobial sensitivity testing

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant