发明详述
I.引言
当在后期检测到疾病时,结肠直肠癌患者常常面临严酷的预后。因此,早期检测结肠直肠癌对于提高患者生存率至关重要。虽然先前已知人肠中存在的细菌群体在结肠直肠癌的肿瘤发生和发展中起作用,但没有足够的信息可用于开发允许基于粪便细菌标志物快速和可靠地检测所述疾病的非侵入性诊断工具。
本发明人首次发现,如通过相关细菌的DNA、RNA或蛋白质的水平增加所证实的,某些细菌物种在粪便中存在的增加,与患者中结肠直肠癌的存在或升高的风险相关。相关细菌物种在结肠直肠癌患者的结肠中富集这一发现,提供了以非侵入性方式早期检测结肠直肠癌的重要手段,以及在监测或治疗疾病中的影响。通常,测试受试者的粪便样品中可见的相关细菌DNA、RNA或蛋白质的水平高于正常水平(其可能呈现或可能不呈现结肠病症或异常的任何迹象),这表明受试者有高可能性已经患有或将在以后发展成结肠直肠癌。如果进一步的诊断方法确认了该疾病的存在,此类升高的风险的识别允许立即治疗患者,或者如果疾病还没有发生,此类升高的风险的识别允许对患者进行密切监测和/或采用预防措施。
在发明人的第二研究中,发明人通过宏基因组测序鉴定出,五个细菌候选物(包括核梭杆菌(Fn)、克拉鲁斯拟杆菌(Bc)、肠道罗斯氏菌(Ri)、哈撒韦梭菌(Ch)和一种未定义的物种(m7)的丰度,在双重qPCR分析所示的CRC患者的粪便样品与健康对照的比较中有显著的差异。粪便Fn的值,作为用于CRC诊断的基于粪便的生物标志物被证实(灵敏度为77.7%,特异性为79.5%)。四个细菌标志物候选物(Fn、Bc、Ch和m7)的简单线性组合,提高了单独Fn对CRC的诊断能力。作为检测CRC的生物标志物,在与粪便免疫化学测试(FIT)的组合时,增加了Fn(灵敏度为92.8%,特异性为79.8%)和四细菌(灵敏度为92.8%,特异性为81.5%)的性能。
本发明描述了用于定量细菌DNA含量的基于探针的内部对照分析,以及用于通过宏基因组测序来定量发明人新鉴定的粪便细菌标志物的进一步双重qPCR分析。通过如下方面良好地建立并优化内部对照分析:1)设计简并引物-探针组,使其具有适合于靶向16SrRNA基因的保守区域的qPCR定量的扩增子大小(小于150bp),并在核糖体数据库项目版本10.8中,覆盖大于90%的真细菌群体;2)使用良好优化的实验方案,Cq值与Log2 DNA量良好相关(R2=0.6466)。简言之,发明人已经建立了用于方便地转化应用新细菌标志物的可靠平台。通过本文所述的宏基因组测序研究所鉴定的基于粪便的CRC相关的细菌,可以作为用于对CRC患者进行非侵入性诊断的新型生物标志物。
II.一般方法
本发明的实践利用分子生物学领域的常规技术。公开了本发明使用的一般方法的基础教科书包括:Sambrook和Russell,Molecular Cloning,A Laboratory Manual(第3版,2001);Kriegler,Gene Transfer and Expression:A Laboratory Manual(1990);以及Current Protocols in Molecular Biology(Ausubel等人编,1994))。
对于核酸,以千碱基对(kb)或碱基对(bp)给出大小。核酸大小是从琼脂糖或丙烯酰胺凝胶电泳、从测序的核酸或从公开的DNA序列得到的估计值。对于蛋白,以千道尔顿(kDa)或氨基酸残基数给出大小。蛋白大小是从凝胶电泳、从测序的蛋白、从导出的氨基酸序列或从公开的蛋白序列估算的。
例如,使用Van Devanter等人,Nucleic Acids Res.12:6159-6168(1984)中的描述的自动化合成仪,根据Beaucage和Caruthers,Tetrahedron Lett.22:1859-1862(1981)中首先描述的固相亚磷酰胺三酯法,可以通过化学方法合成不能商购的寡核苷酸。利用任何本领域公认的策略,例如天然丙烯酰胺凝胶电泳或Pearson和Reanier,J.Chrom.255:137-149(1983)中所描述的阴离子交换高效液相色谱(HPLC),进行寡核苷酸的纯化。
利用例如Wallace等人,Gene 16:21-26(1981)中的用于双链模板的链终止法,可以验证本发明所用的目的序列,例如相关细菌DNA或RNA的多核苷酸序列,以及合成的寡核苷酸(例如,引物)。
III.获取样品和分析细菌DNA或RNA
本发明涉及测量在人粪便样品中发现的一种或多种细菌物种的识别标志DNA或RNA的水平或量,将其作为检测结肠癌的存在、评估发展成结肠癌的风险和/或监测结肠癌的进展或治疗功效(包括评估疾病复发的可能性)的手段。因此,实施本发明的第一步骤是,从测试受试者获得粪便样品并从所述样品中提取DNA或RNA。
A.粪便样品的获取和制备
使用本发明的方法,从待测试或监测结肠癌的人获得粪便样品。可以在诊所或在患者家中容易地实现收集个体的粪便样品。收集适量的粪便,并且可以在进一步的制备之前,根据标准程序储存粪便。可以使用已建立的技术,对根据本发明的患者粪便样品中发现的细菌DNA或RNA进行分析。制备用于核酸提取的粪便样品的方法是本领域技术人员熟知的。参见,例如Yu等人,Gut.2015年9月25日pii:gutjnl-2015-309800.doi:10.1136/gutjnl-2015-309800。
B.DNA和RNA的提取和定量
从生物样品中提取DNA的方法是公知的,并在分子生物学领域中是常规实施的(例如,描述于Sambrook和Russell,Molecular Cloning:A Laboratory Manual第三版,2001)。应消除RNA污染以避免干扰DNA分析。
同样,有许多用于从生物样品中提取mRNA的方法。可以遵循mRNA制备的一般方法,参见,例如Sambrook和Russell,同上;各种可商购的试剂或试剂盒,如Trizol试剂(Invitrogen,Carlsbad,CA),Oligotex Direct mRNA试剂盒(Qiagen,Valencia,CA),RNeasy Mini试剂盒(Qiagen,Hilden,Germany)和
Series 9600
TM(Promega,Madison,WI),也可以用于从测试受试者的生物样品中获得mRNA。也可以使用这些方法中多于一种方法的组合。从RNA制剂中消除所有污染的DNA是重要的。因此,应仔细处理样品,用DNA酶彻底处理,并在扩增和定量步骤中使用适当的阴性对照。
1.基于PCR的DNA或RNA水平的定量测定
当从样品中提取DNA或mRNA,可以定量所预定的细菌DNA或RNA(如由细菌物种特有的细菌基因所编码的16s rDNA或RNA)的量。测定所述DNA或RNA水平的优选方法是基于扩增的方法,例如通过聚合酶链反应(PCR),其包括用于RNA定量分析的逆转录-聚合酶链式反应(RT-PCR)。
当细菌DNA直接进行扩增时,必须首先反转录细菌RNA。在扩增步骤之前,必须合成靶RNA的DNA拷贝(cDNA)。这一过程是通过逆转录实现的,其可以作为单独步骤进行,或在均相逆转录-聚合酶链反应(RT-PCR)中进行,所述RT-PCR是用于扩增RNA的一种改良的聚合酶链式反应。适于通过PCR扩增核糖核酸的方法描述于:Romero和Rotbart,DiagnosticMolecular Biology:Principles and Applications pp.401-406;Persing等人编,MayoFoundation,Rochester,MN,1993;Egger等人,J.Clin.Microbiol.33:1442-1447,1995;以及美国专利第5,075,212号。
PCR的一般方法是本领域公知的,并且因而在本文没有详细描述。对于PCR方法、实验方案和设计引物的原理的综述,参见例如,Innis等人,PCR Protocols:A Guide toMethods and Applications,Academic Press,Inc.N.Y.,1990。PCR试剂和实验方案还可以从供应商如Roche Molecular Systems获得。
最通常的情况下,利用热稳定酶以自动化过程来实施PCR。在该过程中,使反应混合物的温度自动地通过变性区、引物退火区和延伸反应区进行循环。专门适用于该目的的仪器是可商购获得的。
尽管在实施本发明中通常使用靶细菌DNA或RNA的PCR扩增,但本领域技术人员应当认识到,通过任何已知的方法可以实现样品中这些DNA或RNA种类的扩增,如连接酶链式反应(LCR)、转录介导的扩增和半保留序列复制或基于核酸序列的扩增(NASBA),这些方法中的每一种都能提供充分的扩增。最近研发的支链DNA技术也可以用于定量地测定样品中DNA或mRNA的量。对于直接定量临床样品中核酸序列的支链DNA信号扩增的综述,参见Nolte,Adv.Clin.Chem.33:201-235,1998。
2.其它定量方法
还可以利用本领域技术人员公知的其它标准技术来检测靶细菌DNA或RNA。尽管在检测步骤之前通常进行扩增步骤,但是本发明方法不是一定需要扩增。例如,无论事先是否进行扩增步骤,都可以通过大小分级(例如,凝胶电泳)来鉴定DNA或RNA。在琼脂糖或聚丙烯酰胺凝胶中运行样品并按照公知的技术用溴化乙锭进行标记(参见例如,Sambrook和Russell,同上)之后,与标准对照具有相同大小的条带的存在指示出靶DNA或RNA的存在,然后基于条带的强度将所述靶DNA或RNA的量与对照进行比较。或者,可将对靶细菌DNA或RNA具有特异性的寡核苷酸探针用于检测此类DNA或RNA的存在,并基于探针提供的信号强度,通过与标准对照比较来指示出细菌DNA或RNA的量。
序列特异性探针杂交是检测包含其它种类核酸的特定核酸的公知方法。在足够严紧的杂交条件下,所述探针只与基本上互补的序列特异性杂交。可以放松杂交条件的严紧性,以允许不同量的序列错配。
本领域中公知有很多杂交模式,包括但不限于:液相、固相或混合相杂交测定。下面的文章提供了多种杂交测定模式的综述:Singer等人,Biotechniques 4:230,1986;Haase等人,Methods in Virology,pp.189-226,1984;Wilkinson,In situHybridization,Wilkinson编,IRL Press,Oxford University Press,Oxford;以及Hames和Higgins编,Nucleic Acid Hybridization:A Practical Approach,IRL Press,1987。
按照公知的技术检测杂交复合物。通过常用于检测杂交核酸存在的数种方法中任一种,可以标记能够与靶核酸(即细菌16s rDNA)特异性杂交的核酸探针。一种常用的检测方法是,利用以3H、125I、35S、14C或32P等标记的探针的放射自显影技术。因为合成的便利性、稳定性和所选同位素的半衰期,放射性同位素的选择取决于研究的参数选择。其它标记包括化合物(例如,生物素和地高辛),其与用荧光团、化学发光试剂和酶标记的抗配体或抗体结合。或者,探针可以与诸如荧光团、化学发光试剂和酶的标记直接缀合。标记的选择取决于所需的敏感度、与探针缀合的便利性、稳定性需要和可利用的仪器。
利用公知的技术,可以合成和标记实施本发明所需的探针和引物。例如,使用Needham-Van Devanter等人,Nucleic Acids Res.12:6159-6168,1984中所描述的自动化合成仪,按照Beaucage和Caruthers,Tetrahedron Lett.22:1859-1862,1981首次描述的固相亚磷酰胺三酯法,可以通过化学方法合成用作探针和引物的寡核苷酸。通过天然丙烯酰胺凝胶电泳,或通过Pearson和Reanier,J.Chrom.255:137-149,1983中所描述的阴离子交换HPLC,可以进行寡核苷酸的纯化。
IV.细菌蛋白的定量
A.准备用于细菌蛋白检测的样品
还可以通过分析细菌特有的一种或多种蛋白质来定量测定样品中的相关细菌物种的存在。将来自受试者的粪便样品用于实施本发明,并且可以根据已知的方法或如前面章节所述获得并处理以进行分析。
B.测定细菌蛋白的水平
可以利用多种免疫学分析来检测蛋白质,例如指示细菌身份的蛋白质。在一些实施方案中,通过使用对靶蛋白具有特异性结合亲和力的抗体来从测试样品捕获所述靶蛋白,可以进行夹心法分析。然后,可以用对所述蛋白具有特异性结合亲和力的标记抗体来检测它。可以利用微流式装置(如微阵列蛋白芯片)来实施此类免疫学分析。还可以通过凝胶电泳(如二维凝胶电泳)和利用特异性抗体的Western印迹分析,来检测目的蛋白(例如,细菌物种特有的蛋白质)。或者,可以通过利用合适的抗体的标准免疫组织学技术来检测靶蛋白。单克隆抗体和多克隆抗体(包括具有期望的结合特异性的抗体片段),可用于靶蛋白的特异性检测。可以通过已知技术来产生对特定蛋白具有特异性结合亲和力的抗体及其结合片段。
在实施本发明中,还可以利用其它方法来测定标志物蛋白的水平。例如,基于质谱测量技术已开发出多种技术来快速和精确定量靶蛋白(甚至在大量样品中)。这些方法涉及高精密仪器,如利用多反应监测(MRM)技术的三个四极杆(triple Q)仪器、基质辅助激光解吸/电离飞行时间串联质谱仪(MALDI TOF/TOF)、利用选择性离子检测(SIM)模式的离子阱仪器,以及基于电喷雾离子化(ESI)的QTOP质谱仪。参见例如,Pan等人,J ProteomeRes.2009年2月;8(2):787–797。
V.建立标准对照
为了建立用于实施本发明方法的标准对照,首先选择未患有常规定义的任何结肠病(尤其是任何形式的肿瘤如结肠癌)的一组健康人。为了利用本发明的方法筛查和/或监测结肠癌,如果可以的话,这些个体符合合适的参数。任选地,所述个体为相同的性别、相似的年龄或相似的种族背景。
通过成熟的、常规使用的方法来确认所选个体的健康状态,所述方法包括但不限于个体的一般身体检查及其医疗史的总体回顾。
此外,所选的健康个体组必须具有合理的样品大小,使得从组中获得的粪便样品中相关的细菌、其DNA、mRNA或蛋白质的平均量/浓度,能够被合理地看作代表一般健康人群中的正常或平均水平。优选地,选择的组包括至少10个人类受试者。
一旦基于所选健康对照组每个受试者的个体值,建立了细菌、其标志物DNA、mRNA或蛋白质的平均值,该平均值、或中值、或代表值、或特征被视为标准对照。在相同的过程中还确定标准差。在一些情况下,可以为具有不同特征(如年龄、性别或种族背景)的单独定义的组,建立单独的标准对照。
VI.结肠癌的预防性治疗
通过说明人肠道中某些细菌物种的富集与结肠癌的相关性,本发明提供了用于预防性治疗具有增加的后续发展成结肠癌风险的患者的预防措施:通过抑制相关细菌物种并降低其在患者肠道中的存在的方式。相比之下,本发明人已经示出了在CRC患者结肠中某些其它细菌物种具有受抑制的群体或低于正常群体。然后可以设计预防措施,以用于预防性治疗具有增加的后续发展成结肠癌风险的患者:通过促进相关细菌物种和增加/恢复其在患者结肠中的存在的方式。
如本文所用,结肠癌的预防性治疗包括预防或延迟所述疾病的一种或多种相关症状的发作,其包括降低已经接受初始治疗的患者的死亡率或疾病复发可能性。相关细菌物种的抑制剂实际上可具有任何化学性质和结构性质:它们可以是多肽(例如抗体、抗体片段、适体)、多核苷酸(例如反义DNA/RNA、小抑制性RNA或微小RNA)以及小分子。只要它们具有经证实的对靶细菌的抑制作用(例如,抑制细菌增殖或诱导细菌细胞死亡),则此类抑制剂可用于抑制患者肠道中结肠癌细胞的发展,因此可用于治疗结肠癌。类似地,相关细菌物种的激活剂实际上可具有任何化学性质和结构性质,只要它们具有经证实的对靶细菌的增强作用(例如,促进细菌增殖或抑制细菌细胞死亡)。
A.相关细菌物种的调节剂
通过使用靶向特异性细菌基因的抑制剂核酸(如siRNA、微小RNA、微型RNA(miniRNA)、lncRNA、反义寡核苷酸、适体),可以实现细菌物种的抑制。此类核酸可以是单链核酸(例如mRNA)或双链核酸(例如DNA),其可以在合适的条件下转化为靶细菌RNA的抑制剂的活性形式。
在一个实施方案中,以表达盒的形式提供编码抑制剂的核酸,其通常是重组产生的,具有可操作地连接于编码所述抑制剂的多核苷酸序列的启动子。在一些情况下,所述启动子是在选择的细菌细胞中特异性表达的启动子。施用此类核酸可以抑制靶细菌的基因表达,并因此抑制细菌群体。由于几乎所有已知的细菌均已完全测序,并且信息已被存储在数据库中,因此可以基于序列信息来设计合适的抑制剂核酸。
在细菌培养物暴露于候选化合物时,可以在分析中确认相关细菌物种的抑制剂和激活剂,并且分析所述化合物对培养物的影响。例如,可以观察到抑制剂对细菌培养物表现出抑制或抑制作用,导致生长减弱和/或细菌细胞死亡增加。相比之下,可以观察到激活剂对细菌培养物表现出积极作用,促进细菌的存活以及增殖/生长。当在测试组中确立了对细菌培养物的负面作用时,则检测到抑制作用。优选地,负面作用是至少10%的降低;更优选地,降低是C。类似地,激活剂表现出在细胞增殖中至少10%、20%、50%或更高增加的作用,更优选地,增加是至少1倍、或2倍、或甚至5倍。
如上所述,这些细菌抑制剂或激活剂可具有不同的化学特征和结构特征。例如,抑制剂或激活剂可以是仅影响特定细菌物种生长或存活的任何小分子或大分子。基本上任何化合物都可以作为潜在的抑制剂或激活剂进行测试。此类调节剂可以通过筛选含有大量潜在的有效化合物的组合文库来鉴定。如本文所述,可以在一个或多个分析中筛选此类组合化学文库,以鉴定显示所需特征活性的那些文库成员(特定的化学物质种类或亚类)。因此,所鉴定的化合物可以用作常规的“先导化合物”,或者可以将其本身用作潜在的或实际的治疗剂。
组合化学文库的制备和筛选是本领域技术人员公知的。此类组合化学文库包括但不限于:肽文库(参见例如,美国专利第5,010,175号,Furka,Int.J.Pept.Prot.Res.37:487-493(1991)和Houghton等人,Nature 354:84-88(1991)),以及碳水化合物文库(参见例如,Liang等人,Science,274:1520-1522(1996)和美国专利第5,593,853号)。也可以使用用于产生化学多样性文库的其它化学品。此类化学物质包括但不限于:拟肽(PCT公开WO 91/19735)、编码的肽(PCT公开WO 93/20242)、随机生物寡聚物(PCT公开WO 92/00091)、苯二氮卓类(美国专利第5,288,514号)、Diversomer例如乙内酰脲、苯二氮卓类和二肽(Hobbs等人,Proc.Nat.Acad.Sci.USA 90:6909-6913(1993))、插烯多肽(vinylogouspolypeptides)(Hagihara等人,J.Amer.Chem.Soc.114:6568(1992))、具有β-D-葡萄糖骨架的非肽类肽模拟物(Hirschmann等人,J.Amer.Chem.Soc.114:9217-9218(1992))、小化合物的类似有机合成的文库(Chen等人,J.Amer.Chem.Soc.116:2661(1994))、寡聚氨基甲酸酯(Cho等人,Science 261:1303(1993))和/或肽基膦酸酯(Campbell等人,J.Org.Chem.59:658(1994)、核酸文库(参见Ausubel、Berger和Sambrook,全部同上)、肽核酸文库(参见例如,美国专利第5,539,083号)、抗体文库(参见例如,Vaughn等人,Nature BioteChnology,14(3):309-314(1996)和PCT/US96/10287)、小有机分子文库(参见例如,苯二氮卓类,BaumC&EN,1月18日,第33页(1993);类异戊二烯,美国专利第5,569,588号;噻唑烷酮和间噻嗪烷酮,美国专利第5,549,974号;吡咯烷,美国专利第5,525,735号和第5,519,134号;吗啉化合物,美国专利第5,506,337号;和苯二氮卓类,美国专利第5,288,514号)。
B.药物组合物
1.制剂
相关细菌物种的调节剂可用于药物组合物或药物的制备。可以将药物组合物或药物施用于个体以治疗结肠癌,尤其是用于预防。
本发明的治疗方法中所用的化合物,可用于制备包含有效量的所述化合物的药物组合物或药物,所述有效量的化合物与适于应用的赋形剂或载体组合或混合。
用于此类治疗用途的示例性药物组合物包含:(i)包含编码本文所述的抑制剂(例如siRNA、微小RNA、微型RNA、lncRNA、反义寡核苷酸)的多核苷酸序列的表达盒,和(ii)药学上可接受的赋形剂或载体。术语“药学上可接受的”和“生理学上可接受的”,在本文可同义使用。对于本文所述的治疗方法中的使用,可以提供治疗有效剂量的表达盒。
可以通过脂质体施用抑制剂或激活剂,脂质体用作将缀合物靶向特定的组织,以及增加组合物的半衰期。脂质体包括乳剂、起泡剂、胶束、不溶性单层、液态晶体、磷脂分散剂、片状层等。在这些制剂中,将待递送的抑制剂作为脂质体的一部分,所述抑制剂单独的或与能结合例如靶细胞中广泛存在的受体的分子或其它治疗性或免疫原性组合物联合。因此,用本发明所需的调节剂填充的脂质体,可被引导至治疗位点(例如结肠),然后在该治疗位点,所述脂质体递送所选的抑制剂组合物。用于本发明中的脂质体由标准的囊泡形成脂质形成,所述囊泡形成脂质通常包括中性和带负电的磷脂和甾醇(如胆固醇)。通常考虑以下因素来指导脂质的选择,例如,脂质体尺寸、血流中脂质体的酸不稳定性和稳定性。可获得用于制备脂质体的多种方法,其描述于例如Szoka等人(1980)Ann.Rev.Biophys.Bioeng.9:467,美国专利第4,235,871号、第4,501,728号和第4,837,028号。
利用一种或多种生理学上可接受的载体或赋形剂,通过标准技术可制备用于本发明中的药物组合物或药物。合适的药物载体在本文和E.W.Martin的“Remington'sPharmaceutical Sciences”中有描述。可以将本发明的化合物和药剂及它们的生理学上可接受的盐及溶剂化物配制为用于通过任何合适的途径进行给药,包括吸入给药、局部给药、经鼻给药、经口给药、肠胃外给药或直肠给药。
用于局部给药的典型剂型包括乳膏、软膏、喷雾、洗液和膏药。然而,药物组合物可以被配制成用于任何类型的给药,例如,利用注射器或其它装置的皮内注射、皮下注射、静脉内注射、肌肉内注射、鼻内注射、大脑内注射、气管内注射、动脉内注射、腹膜内注射、膀胱内注射、胸膜内注射、冠状动脉内或肿瘤内注射。还考虑了通过吸入(例如,气雾剂)给药或口服给药、直肠给药或阴道给药的剂型。
2.给药途径
用于局部施加于例如皮肤和眼部的合适剂型,优选本领域内公知的水性溶液、软膏、乳膏或凝胶。这种剂型可以含有增溶剂、稳定剂、张力增强剂、缓冲剂和防腐剂。
用于经皮施加的合适剂型,包括伴随载体的有效量本发明的调节剂。优选的载体包括可吸收的、药学上可接受的溶剂,以有助于透过宿主皮肤。例如,透皮装置采用绷带的形式,所述绷带包括支持构件、容纳化合物和任选的载体的贮存器,任选的速率控制屏障,以及将所述装置固定于皮肤的器具,其中所述速率控制屏障能以受控和预定的速率在长的时间段内将化合物递送至宿主皮肤。还可以使用基质透皮剂型。
对于口服给药,药物组合物或药物可以采用例如用药学上可接受的赋形剂通过常规方式制备的片剂或胶囊形式。优选的是包含以下物质的片剂和明胶胶囊:活性成分(即抑制剂或激活剂),以及(a)稀释剂或填充剂,例如,乳糖、葡萄糖、蔗糖、甘露醇、山梨醇、纤维素(例如,乙基纤维素、微晶纤维素)、糖胶、果胶、聚丙烯酸酯和/或磷酸氢钙、硫酸钙,(b)润滑剂,例如,硅石、滑石、硬脂酸、硬脂酸镁或硬脂酸钙、金属硬脂酸盐、胶体二氧化硅、氢化植物油、玉米淀粉、苯甲酸钠、醋酸钠和/或聚乙二醇;对于片剂,还可以包含(c)粘合剂,例如,硅酸镁铝、淀粉糊、明胶、黄芪胶、甲基纤维素、羧甲基纤维素钠、聚乙烯吡咯烷酮和/或羟丙基纤维素;如果需要,还可以包含(d)崩解剂,例如,淀粉(例如,马铃薯淀粉或淀粉钠)、乙醇酸盐(酯)、琼脂、褐藻酸或其钠盐、或起泡混合物,(e)润湿剂,例如,月桂基硫酸钠,和/或(f)吸收剂、着色剂、芳香剂和甜味剂。
还可以根据本领域内已知的方法,用薄膜包被片剂或用肠衣包被片剂。用于口服给药的液体制剂,可以采用例如溶液、糖浆或悬浮液的形式,或者可以将它们提供为干的产品,用于在使用前用水或其它合适介质复原。使用药学上可接受的添加剂,通过常规方式可制备这种液体制剂,所述添加剂为例如,悬浮剂,例如,山梨醇糖浆、纤维素衍生物或氢化可食脂肪;乳化剂,例如,卵磷脂或阿拉伯树胶;非水性介质,例如,杏仁油、油酯、乙醇或分级的植物油;以及防腐剂,例如,对羟基苯甲酸甲酯或对羟基苯甲酸丙酯或山梨酸。视情况而定,所述制剂还可以含有缓冲盐、芳香剂、着色剂和/或甜味剂。需要时,口服给药的制剂可以被适当配制以实现活性化合物的控释。
本发明的化合物和药剂,可以配制成通过注射用于肠胃外给药,例如通过快速推注或连续输注。可以以单位剂量形式提供用于注射的剂型,例如,添加了防腐剂的安瓿或多剂量容器。可注射的组合物优选是水性等渗溶液或悬浮液,并且优选为由脂肪乳剂或悬浮液制备的栓剂。组合物可以是无菌的和/或含有佐剂,如防腐剂、稳定剂、润湿剂或乳化剂、溶解促进剂、调节渗透压的盐和/或缓冲剂。或者,活性成分可以为粉末形式,在使用前用合适的介质(例如,无菌无热原的水)复原。此外,它们还可以含有其它有治疗价值的物质。分别按照常规的混合、粒化或包被方法来制备组合物,且组合物含有约0.1%至75%,优选约1%至50%的活性成分。
为了通过吸入给药,使用合适的推进剂,可从加压包或或喷雾器中以气雾剂喷雾的方式便利地递送活性成分,所述推进剂例如,二氯二氟甲烷、三氯氟甲烷、二氯四氟乙烷、二氧化碳或其它合适的气体。就加压气雾剂而言,通过提供阀可以确定剂量单位,以递送计量的量。例如,在吸入器或吹入器中使用的明胶胶囊或明胶盒,可以被制备成含有化合物和合适的粉末基质(例如,乳糖或淀粉)的粉末混合物。
还可以将调节剂配制在直肠组合物中,例如,栓剂或保留灌肠剂,例如,含有常规的栓剂基质,例如,可可油或其它甘油酯。
此外,可以将活性成分配制成贮库制剂。这种长效剂型可以通过植入(例如,皮下或肌肉内)或肌肉内注射来给药。因此,例如,活性成分可以与合适的聚合材料或疏水材料(例如作为可接受的油中的乳剂)或离子交换树脂一起配制,或者可以被配制成难溶的衍生物,例如,难溶性盐。
在一些情况下,本发明的药物组合物或药物包含:(i)有效量的如本文所述的化合物,其抑制或促进本文鉴定的一种或多种相关细菌物种的群体,和(ii)另一种治疗剂。当与本发明的化合物一起使用时,所述治疗剂可以单独使用、依次使用或与一种或多种其它这类治疗剂(例如,第一治疗剂、第二治疗剂和本发明的调节剂)联合使用。可以通过相同或不同的给药途径进行给药或可以在同一药物制剂中进行给药。
3.剂量
可以以能预防、治疗或控制本文所述的结肠癌的治疗有效剂量给予个体药物组合物或药物。以足以引起个体中有效的治疗反应的量给予药物组合物或药物。
所给予的活性剂的剂量取决于个体的体重、年龄、个体状况、待治疗的区域的表面积或体积以及给药形式。剂量大小还由具体个体中具体化合物的给药所伴随的任何不良反应的存在、性质和程度来决定。例如,每种类型的抑制剂或编码抑制剂的核酸都可能具有独特的剂量。用于向约50至70kg的哺乳动物口服给予单位剂量,可以含有约5至500mg的活性成分。通常,本发明的活性化合物的剂量是足以实现期望效应的剂量。最佳给药方案可以从个体体内药剂累积的测量值来计算。通常,可以每天、每周、或每月一次或多次地给予剂量。本领域技术人员能够容易地确定最佳剂量、给药方法和重复率。
为了实现期望的治疗效应,可以以治疗有效的每日剂量分多日给予化合物或药剂。因此,治疗有效地给予化合物以治疗个体中本文所述的相关疾病状态或疾病,需要持续3天至两周或更长时间的周期性(例如,每日)给药。通常,药剂的给药持续至少连续3天,通常至少连续5天,更通常至少连续10天,有时连续20、30、40或更多天。尽管连续的每日给药是达到治疗有效剂量的优选途径,但是,即使没有每天给予药剂也能实现治疗有利效应,只要足够频繁地重复给药以维持个体中药剂的治疗有效浓度。例如,可以每隔一天、每三天给予药剂,或者如果使用更高的剂量范围并且能被个体所耐受,则每周给予一次。
所述化合物或药剂的最佳剂量、毒性或治疗功效,可以随个体化合物或药剂的相对效力而不同,并且可以通过细胞培养物或实验动物中的标准药学方法来测定,例如,通过测定LD50(导致50%的群体死亡的剂量)和ED50(在50%的群体中治疗有效的剂量)。毒性效应和治疗效应的剂量比是治疗指数,且可以表示为比值LD50/ED50。优选表现出大的治疗指数的药剂。尽管可以使用表现出毒副作用的药剂,但是应当考虑设计能将这类药剂靶向受累组织位点的递送系统,从而使对正常细胞的潜在破坏最小化,进而降低副作用。
例如,从细胞培养测定和动物研究获得的数据,可以用于制定人类中使用的剂量范围。这类化合物的剂量优选位于包括ED50但具有较小毒性或没有毒性的循环浓度范围内。剂量可以在该范围内变化,这取决于所用的剂量形式和给药途径。对于本发明方法中所用的任何药剂,首先可以从细胞培养测定中估算治疗有效剂量。可以在动物模型中制定剂量,以实现包括在细胞培养中所测定的IC50(能实现症状最大抑制的一半的药剂浓度)的循环血浆浓度范围。这些信息可用于更精确地确定人类可用的剂量。例如,可以通过高效液相色谱(HPLC)测量血浆中的水平。通常,对于典型的个体,药剂的剂量当量为约1ng/kg至100mg/kg。
提供了本文所述的抑制剂或编码抑制剂的核酸的示例性剂量。当采用IV给药时,编码抑制剂的核酸(例如表达载体)的剂量可以为0.1-0.5mg(例如,5-30mg/kg)。可以以5-1000mg口服给予小的有机化合物抑制剂,或以10-500mg/ml静脉内输注小的有机化合物抑制剂。可以按照以下量通过静脉内注射或输注给予多肽抑制剂:50-500mg/ml(120分钟的时间内);1-500mg/kg(60分钟的时间内);或1-100mg/kg(快速推注),每周5次。可以以10-500mg皮下给予调节剂;以0.1-500mg/kg每天两次,或约50mg每周一次,或25mg每周两次,静脉内给予调节剂。
可以单独给予本发明的药物组合物,或可以将其与至少一种其它治疗性化合物联合给药。示例性的有利的治疗性化合物,包括全身和局部抗炎药、止疼药、抗组织胺药、麻醉化合物等。其它治疗性化合物可以与主要的活性成分同时给药,或者甚至在同一组合物中进行给药。还可以在单独的组合物中,或以与主要的活性成分不同的剂量形式,单独给予其它治疗性化合物。主要成分的部分剂量可以与其它治疗性化合物同时给药,而其它剂量可以单独给药,这取决于肠细菌群体的具体发现和个体的特征。
可以在治疗过程中,根据各种因素(包括患者肠细菌群体的分布和对治疗方案的生理应答)来调整本发明药物组合物的剂量。本领域技术人员通常参与这种治疗方案的调整。
VII.试剂盒和装置
本发明提供了用于实施本文所述方法的组合物和试剂盒,以评估从受试者获得的粪便样品中一种或多种相关细菌物种的水平。例如,可以分析一种或多种指示相关细菌物种的基因标志物,用以检测或诊断结肠癌的存在,确定发展成结肠癌的风险,并监测患者结肠癌的发展,使得可以例如通过手术、化学疗法和/或放射疗法来治疗患者。在预防性治疗的情况下,尚未发展成结肠癌但被认为后续具有发展成疾病的风险增加的患者,可以接受包含相关细菌物种的一种或多种调节剂(抑制剂和/或激活剂)的药物。
用于进行分析以确定特定细菌DNA或RNA水平的试剂盒,通常包括至少一种可用于与靶DNA或RNA序列或其互补序列的至少一个区段特异性杂交的寡核苷酸。任选地,用可检测的部分标记这一寡核苷酸。在一些情况下,试剂盒可以包括至少两个能用于通过PCR(包括通过RT-PCR)扩增靶细菌DNA或RNA的至少一个区段的寡核苷酸引物。
用于进行分析以确定细菌蛋白质水平的试剂盒,通常包括至少一种可用于与所述蛋白质特异性结合的抗体。任选地,用可检测的部分标记所述抗体。抗体可以是单克隆抗体或多克隆抗体。在一些情况下,试剂盒可以包括至少两种不同的抗体,一种用于与靶细菌蛋白特异性结合(即一抗),另一种用于一抗的检测(即二抗),二抗通常与可检测的部分连接。
通常,试剂盒还包括合适的标准对照。标准对照指示既未患结肠癌也不具有发展成结肠癌的任何增加的风险的健康受试者粪便中发现的所选细菌DNA、RNA或蛋白质的平均水平。在一些情况下,可以以设定值的方式提供此类标准对照。此外,本发明的试剂盒可以提供说明书手册,以指导使用者分析测试样品和评价测试受试者中结肠癌的存在或风险。
在另一方面,还可以在一种装置或包括一个或多个这种装置的系统中实施本发明,所述装置或系统能实施本文所述的所有或部分方法步骤。例如,在一些情况下,在收到粪便样品、评价发展成结肠癌的风险、或监测病况的进展后,所述装置或系统执行以下步骤:(a)确定样品中相关细菌物种的量或水平(例如,以测量指示细菌物种的细菌DNA、RNA或蛋白质的量或水平的方式);(b)将所述量或水平与标准对照值进行比较;以及(c)提供指示如下的结果:受试者中是否存在结肠癌、或受试者是否具有将来发展成结肠癌的风险、或受试者结肠癌病况是否有变化(即,恶化或改善)、或患者是否具有增加的复发结肠癌的可能性(例如在初始诊断和/或治疗后)。在其它情况下,在进行步骤(a)且将来自(a)的量或浓度输入所述装置之后,本发明的装置或系统执行步骤(b)和(c)的任务。优选地,所述装置或系统是部分或完全自动化的。
实施例
提供以下实施例仅用作说明而不是限制。本领域技术人员将容易地认识到,可以改变或修改各种非关键参数,以产生基本相同或相似的结果。
用于本研究的引物和探针的列表
使用克拉鲁斯拟杆菌、肠道罗斯氏菌、哈撒韦梭菌、M7和核梭杆菌作为CRC的粪便标志物
肠道微生物群是结肠直肠癌(CRC)发展中的重要病因学因素。本研究的目的是通过宏基因组测序来评估新鉴定的粪便细菌标志物候选物对CRC诊断的效用。在本研究中,通过双重定量PCR(qPCR)分析,在来自两个独立群组的439个受试者(203个CRC和236个健康受试者)的粪便样品中,对五种细菌的丰度进行定量。通过双重qPCR,在203个CRC患者和236个健康对照的粪便样品中,检查通过宏基因组测序鉴定的候选物(包括核梭杆菌(Fn)、克拉鲁斯拟杆菌(Bc)、肠道罗斯氏菌(Ri)、哈撒韦梭菌(Ch)和一种未定义的物种(标记为m7))。通过qPCR分析和宏基因组学方法,在各个候选物的定量之间证明了强的正相关性(r=0.801~0.934,全部P<0.0001)。在五个候选者中,CRC中的Fn丰度显著高于对照(P<0.0001),接受者操作曲线下面积(AUROC)为0.868(P<0.0001)。在最佳截断值,在群组I中,Fn将CRC与对照相区分,灵敏度为77.7%,特异性为79.5%。在群组I中,与单独Fn相比,四细菌(Fn、Bc、Ch和m7)的简单线性组合显示出改善的诊断能力(AUROC=0.886,P<0.0001)。这些发现也在独立群组II中得到证实。特别地,在与粪便免疫化学测试(FIT)组合以检测CRC时,实现了改善的单独Fn(灵敏度为92.8%,特异性为79.8%)和四细菌(灵敏度为92.8%,特异性为81.5%)的诊断性能。总之,本研究提供了基于粪便的CRC相关的细菌可作为CRC的新型非侵入性诊断生物标志物的证据。
引言
结肠直肠癌(CRC)是全世界最常见的恶性肿瘤之一。包括中国在内的许多亚洲国家在过去十年中CRC发病率增加了2至4倍(1)。肠道微生物群组成的异常,已被认为是在CRC起始和发展中潜在的重要病因学因素(2)。随着宏基因组测序和焦磷酸测序在肠微生物群研究中的广泛应用,越来越多的细菌已被确定与CRC的发病率呈正相关(3-7)。最近的研究表明,梭杆菌(尤其是核梭杆菌(Fn))与CRC相关。Fn在CRC患者的粪便和结肠粘膜中富集(3,5,8),并在结肠直肠癌发生中起重要作用(9,10)。在最近的研究中,在结肠直肠肿瘤发生的不同期,使用16SrRNA测序对人肠道粘膜中的微生物群落进行分类,还发现了梭杆菌在结肠直肠肿瘤中富集(11)。然后,通过使用宏基因组学分析,比较74个CRC患者和54个健康受试者的粪便微生物组,发明人已经鉴定了可以用作CRC的非侵入性生物标志物的细菌候选物(12),这包括Fn、克拉鲁斯拟杆菌(Bc)、肠道罗斯氏菌(Ri)、哈撒韦梭菌(Ch)、一种未定义的物种(标记为m7)。与Fn不同,其它细菌尚未与CRC相关。此外,将这些细菌候选物转化应用为诊断生物标志物,需要使用简单、具有成本效益和靶向的方法(如定量PCR(qPCR))的进一步研究。
在该研究中,在203个CRC患者和236个对照受试者的大群组中,验证了基于粪便的细菌候选标志物,以鉴定作为CRC的新型诊断工具的、具有良好灵敏度和特异性的一组标志物。发明人建立了用于定量细菌的基于探针的双重qPCR分析;与目前可用的测试相比,所涉及的技术易于实施且成本更低。
方法
人类粪便样品收集
粪便样品(n=439)收集自两个独立的群组,所述群组包括群组I-香港:370个受试者,其由170个CRC患者(平均年龄67.2±11.6岁;100个男性和70个女性)和200个正常对照(59.3±5.8岁;77个男性和123个女性)组成,2009年至2013年间在香港中文大学的威尔斯亲王医院(the Prince of Wales Hospital)(补充表1),以及群组II-上海:69个受试者,其由33个CRC患者(平均年龄63.4±9.6岁;17个男性和16个女性)和36个正常对照(53.2±12.2岁;10个男性和26个女性)组成,2014年至2015年间在上海交通大学的仁济医院(RenjiHospital)(补充表1)。用以收集粪便样品所招募的受试者包括呈现诸如肠习惯改变、直肠出血、腹痛或贫血症状的个体,以及如先前宏基因组学研究中进行了结肠镜筛查的年龄50岁或以上的无症状个体(12)。在结肠镜筛查前或结肠镜筛查后一个月收集样品,此时肠道微生物组应恢复到基线(13)。排除标准是:1)在过去3个月内使用抗生素;2)素食饮食;3)在过去3个月内有侵入性医疗干预;4)具有任何癌症或肠炎性疾病的既往病史。要求受试者于家中在标准化容器内收集粪便样品,并立即将样品存储在其家用-20℃冷冻箱中。然后将冷冻样品置于绝缘聚苯乙烯泡沫容器中并递送到医院,并立即储存在-80℃直到进一步分析。通过结肠镜检查和任何所进行的活组织检查的组织病理学检查来诊断患者。从所有受试者获得知情同意书。研究获得香港中文大学临床研究伦理委员会和上海交通大学仁济医院伦理委员会的批准。
DNA提取
将粪便样品在冰上解冻,并使用QIAamp DNA Stool Mini Kit,按照制造商的说明书(Qiagen,Hilden,Germany)进行DNA提取。然后用无DNA酶的RNA酶处理提取物以消除RNA污染。使用NanoDrop2000分光光度计(Thermo Fisher Scientific,Wilmington,DE),测定DNA的质量和数量。
引物和探针的设计
基于细菌16S rRNA基因中的保守片段,人工设计用于内部对照的引物和探针序列(14),然后使用PrimerExpress v3.0工具(Applied Biosystems,Foster City,CA)测试它们,用于确定Tm、GC含量和可能的二级结构。简并位点包括在引物和探针中以增加靶标覆盖;简并位点不接近引物的3'末端和探针的5'末端。扩增子靶标是对应的大肠杆菌基因组的nt1063-1193。
选择通过先前宏基因组测序所鉴定的五个细菌标志物候选物用于qPCR定量,包括核梭杆菌(Fn)、克拉鲁斯拟杆菌(Bc)、肠道罗斯氏菌(Ri)、哈撒韦梭菌(Ch)、一种未定义的物种(标记为m7)(补充表2)。使用在一个先前的宏基因组研究中以结肠镜检查作为分层因素的封闭的独立Wilcoxon秩和检验,通过消除结肠镜检查的混杂效应来鉴定这些候选者(12)。Fn也已经被其他人鉴定为在CRC患者中富集(3,5,8),而其他研究者认为其它四种与CRC没有关联。使用PrimerExpress设计靶向Fn的nusG基因(登录号#GMHS-1916)和我们先前的基因组测序研究中鉴定的基因标志物(包括Bc(ID m370640)、Ch(ID m2736705)、Ri(IDm181682)和m7(ID m3246804))的引物和探针序列(12)。引物-探针组特异性检测出预期靶标,而不检测由Blast搜索确认的任何其它已知序列。各个探针携带有5'报告染料FAM(6-羧基荧光素)或VIC(4,7,2'-三氯-7'-苯基-6-羧基荧光素)和3'淬灭染料TAMRA(6-羧基四甲基-罗丹明)。引物和水解探针由Invitrogen(Carlsbad,CA)合成。引物和探针的核苷酸序列列于补充表3中。通过PCR产物的直接Sanger测序,或通过对随机挑选的TA克隆测序,来确认PCR扩增的特异性。
定量PCR(qPCR)
在粘合密封的MicroAmp快速光学96孔反应板(Applied Biosystems)中,在含有0.3μM的各个引物和0.2μM的各个探针的20μL的TaqMan Universal Master Mix II(Applied Biosystems)的反应体系中,进行qPCR扩增。ABI PRISM 7900HT序列检测系统的热循环仪参数为,95℃10分钟和(95℃15秒,60℃1分钟)×45个循环。在每个实验中都包括阳性/参考对照和阴性对照(H2O作为模板)。对每个样品进行三次重复测量。对于所有临床样品,使用序列检测软件(Applied Biosystems),并人工设置阈值=0.05且基线从3-15个循环来分析qPCR数据。如果它们的阴性对照Cq值<42,则实验不合格。根据ΔCq法进行数据分析,其中ΔCq=Cq靶标-Cq对照,且丰度=POWER(2,-ΔCq)。
粪便免疫化学测试(FIT)
如前所述,使用由中国国家食品药品管理局认证的HemoSure免疫金标记的FIT浸渍条(WHPM Co.Ltd,北京,中国)(15)。
统计分析
数值适当地都表示为平均值±SD或中值(四分位间距[IQR])。通过Wilcoxon符号秩检验或Mann-Whitney U检验,确定特异性的细菌丰度的差异。通过T检验比较连续的临床和病理变量,而通过卡方检验比较分类变量。使用斯皮尔曼(Spearman)相关系数,以估计细菌丰度和若干感兴趣的因素的关联。使用单变量和多变量线性回归,估计与CRC诊断独立相关的因素。使用接受者操作特征(ROC)曲线,以评估细菌候选物在区分CRC中的诊断价值。应用逻辑回归模型以获得用于估计在所有受试者中CRC发生率的概率图值。然后构建逻辑回归模型的ROC曲线。通过Graphpad Prism 5.0(Graphpad Software Inc.,San Diego,CA)或SPSS软件v17.0(SPSS,Chicago,IL)进行所有测试。将P<0.05视为统计学显著。
结果
方便且可靠地定量细菌丰度的双重qPCR分析
为了便于定量细菌含量,发明人设计了简并引物-探针(VIC标记的)组,其扩增子大小适用于靶向16S rRNA基因的131-bp保守区域的qPCR定量。在核糖体数据库项目版本10.8中,引物和探针序列覆盖了大于90%的真细菌群体(14)。使用不同粪便DNA样品的测试表明,这一内部对照分析能够在终反应体系中,以小于10ng/μL的DNA模板评估总细菌(图1a)。较高的模板浓度抑制PCR扩增,这可能是由于从粪便中分离出的DNA中的常见杂质,这是因为从培养的大肠杆菌中提取的纯的总DNA,达到至少25ng/μL都没有观察到抑制。使用浓度小于10ng/μL的模板,Cq值与Log2 DNA量良好相关(R=0.804)(图1b)。然后使用VIC标记的内部对照和FAM标记的引物-探针组开发双重qPCR分析,以便特异性靶向细菌候选物。可以用小于10ng/μL的模板一致地定量单个样品中靶细菌的相对丰度(图1c),但模板浓度应当大于0.1ng/μL以避免在具有低丰度靶细菌的样品中的假阴性结果(图1d)。使用发明人的qPCR分析进行细菌丰度的定量,可以很好地重复(图6),并且不受人类DNA污染的干扰(图7)。这一平台和明确的实验条件,可以保证使用双重qPCR分析来可靠且方便地定量细菌靶标。
通过宏基因组学方法对各个细菌候选物的定量与qPCR分析相关
为了验证通过qPCR分析测量的基因丰度是否与宏基因组学测序具有可比性,将通过qPCR的受试者亚组(51个CRC和45个对照)中四种细菌候选物(Bc、Ch、Ri和m7)的丰度与宏基因组测序相比较。通过qPCR分析与宏基因组测序相比较,这些细菌中每一种的定量都显示出强相关性(Spearman R=0.816-0.934;图2a)。来自Fn的基因标志物丁酰辅酶A脱氢酶(m1704941;99.13%同一性),在CRC患者中显示出仅2.7%的发生率(74个中的39个);而在物种水平上,Fn在CRC患者中显示出83.8%的发生率(74个中的62个)(补充表4),这推断出对于CRC的诊断而言,在物种水平上Fn好于基因标志物m1704941。因此,发明人建立了靶向Fn的nusG基因(据报道,其在结肠直肠肿瘤中比在匹配的正常样品中转录更有活性(5))的双重qPCR分析,以评估Fn对于CRC的诊断价值。通过宏基因组测序,这一qPCR分析显示出在物种水平上与Fn的良好相关性(图2b),这表明靶向nusG的qPCR可以覆盖更多的Fn株,并且可以在检测CRC中更灵敏。
与健康对照相比,在CRC患者中,Fn、Ch和m7的丰度显著升高,且Bc和Ri的丰度降低
通过qPCR定量,与健康对照(n=200)(P<0.0001;图3a和表1)相比,CRC患者(n=170)中粪便Fn的丰度明显更高。此外,与对照受试者相比,CRC患者中Ch(P<0.0001)和m7(P<0.0001)的丰度显著升高,且Bc(P<0.05)和Ri(P<0.05)的丰度降低。双变量相关性检验显示出,所有五种细菌的丰度与CRC显著相关,但与肿瘤-淋巴结-转移(TNM)分期或肿瘤位置无关(表2)。这五种细菌的发生率,在CRC患者与健康对照受试者之间显著不同(补充表5)。这些结果共同证实了,这些细菌标志物候选物在将CRC患者与健康受试者相区分中的潜力。
Fn是用于诊断CRC患者的潜在的非侵入性粪便生物标志物
在所有五种细菌中,Fn在区分CRC与健康对照中表现出最佳的性能,接受者操作曲线下的面积(AUROC)为0.868(0.831-0.904,95%置信区间;P<0.0001)(图3b)。在使灵敏度和特异性之和最大化的最佳截断值,在170个CRC患者和200个健康受试者的第一群组中,Fn可以将CRC与对照相区分,灵敏度为77.7%,特异性为79.5%,阴性预测值(NPV)为80.7%,且阳性预测值(PPV)为76.3%。这在33个CRC患者和36个健康对照的第二独立群组中得到了进一步验证。与健康对照相比,CRC患者中的Fn丰度显著更高(P=0.012)(图3c)。作为区分CRC患者与对照受试者的单一因素,粪便Fn的AUROC为0.675(0.545-0.804;P=0.013)。在第二群组中,Fn的最佳截断值可以区分CRC与对照,灵敏度为81.8%,特异性为52.8%,NPV为76.0%,PPV为61.4%。
Fn、m7、Bc和Ch的组合改善了单独Fn对CRC患者的诊断能力
线性回归分析显示出,Fn、m7和Bc的丰度与CRC诊断显著相关(所有P<0.05),且Ch的丰度与CRC略微相关(P=0.073),而Ri的丰度与CRC之间的关联不显著(表3)。因此,评估三种(Fn、m7和Bc)或四种(Fn、m7、Bc和Ch)细菌用于诊断CRC的能力。在第一群组中发现,与三细菌(0.877)、单独Fn(0.868)以及包括所有四种细菌的逻辑回归模型(0.869)相比,四细菌的简单线性组合(0.886)使AUROC增加(图4a)。与健康对照相比,CRC患者中四细菌的组合丰度显著更高(P<0.0001)(图4b)。在最佳截断值,这组四细菌(Fn、m7、Bc和Ch)可以区分CRC患者和健康对照,灵敏度为77.7%,特异性为81.5%,NPV为81.1%,PPV为78.1%,其比单独Fn表现出更好的诊断性能(表4)。在第二独立群组中,进一步验证了四细菌的改善的性能。与三细菌(0.731)、单独Fn(0.675)或逻辑回归模型(0.746)相比,四细菌的组合还表现出增加的AUROC(0.756)(图4c)。CRC患者中四细菌的组合丰度显著高于健康对照(P=0.0002)(图4d)。在最佳截断值,这组细菌可以区分CRC与对照,灵敏度为84.9%,特异性为61.1%,NPV为81.5%,PPV为66.7%,这也显示出比单独Fn更好的诊断性能。因此,在区分CRC与健康对照时,Fn、m7、Bc和Ch的细菌组可以提高单独Fn的诊断能力。
细菌标志物与FIT的组合改善了单独细菌对CRC患者的诊断能力
对111个CRC患者和119个对照受试者的粪便样品进行FIT。发现70.3%(78/111)的CRC患者的粪便样品显示出FIT阳性。在此CRC患者的亚群组中,FIT的检测率小于单独Fn(82.0%)或四细菌组(83.8%)(通过卡方,两者均P<0.05)的定量。FIT与TNM分期略微相关(P=0.084),而四细菌或单独Fn的丰度与TNM分期不相关(补充表6)。根据TNM期亚群,癌症检测的比较结果证明,与I期癌症的FIT相比,细菌标志物的定量显示出显著更高的灵敏度(图5)。还观察到相比通过FIT,通过细菌对II期和III期癌症的检测率更高,但对晚期IV期癌症则并非如此。这些结果表明,对于CRC(尤其是对于早期CRC)的检测,细菌标志物的定量比FIT显著更灵敏。
细菌标志物与FIT的组合显著地将Fn的灵敏度从82.0%提高至92.8%,将四细菌的灵敏度从83.8%提高至92.8%,随之改善PPV和NPV并几乎不改变特异性(表5)。根据TNM分期,对于I、II和III期癌症,相比单独使用FIT,细菌标志物与FIT的组合显示出显著更高的灵敏度(图5)。这些结果表明,对于CRC患者的非侵入性诊断价值而言,细菌标志物和FIT的组合具有最佳的灵敏度和特异性。
讨论
根据最新的对于CRC筛选的亚太共识性建议,将FIT应用于选择结肠镜检查高风险的患者(16)。FIT已广泛应用于世界其它地区(17)。然而,根据Lee等人最近的系统性综述和元分析,FIT的灵敏度在CRC中受限[0.79(95%CI,0.69至0.86)],并且在各种研究中存在很大差异(17)。然而,FIT的广泛应用使得容易获得粪便样品。在粪便样品中检测分子生物标志物用于非侵入性诊断CRC,这可能是比在目前临床中实施的血液/血浆生物标志物更有前途的一种替代。随着焦磷酸测序和宏基因组测序在微生物群领域的广泛应用,越来越多的CRC相关细菌被确定,其中包括发明人所确定的那些(12)。迫切需要验证这些候选标志物,并通过靶向定量方法来评估其临床应用价值。
为了开发方便且可靠的用于针对细菌候选物的有效性和潜在的临床实施来靶向定量细菌候选物的方法,建立了用于在粪便样品中定量的qPCR平台。基于可获得的所有16SrRNA基因的保守序列,设计靶向16S rRNA基因的引物-探针组(14),以保证足够的覆盖并适合于qPCR的扩增子大小(小于150bp)。这一内部对照被证实能很好地代表不同样品中的细菌DNA含量。然后,基于探针的双重qPCR分析允许在各个样品的相同反应中检测内部对照和靶标,以节省试剂和样品,并产生更可靠的数据。通过ΔCp法计算相对于总细菌含量的靶标志物丰度。本发明人首次定义了应受限制的DNA模板浓度(小于10ng/μL)以避免由粪便DNA引起的抑制效应,且大于0.1ng/μL以避免使用发明人的双重qPCR分析的靶标的假阴性评估。通过宏基因组学方法和qPCR分析,在细菌候选物的定量中进一步显示出良好的相关性。因此,双重qPCR分析是可靠且方便的,并且在靶细菌的定量检测中具有极大的临床应用价值。
使用这一平台,进一步证实了Fn作为用于基于粪便的CRC诊断的生物标志物的潜在价值。CRC患者中粪便Fn的丰度显著高于健康对照受试者。作为区分CRC患者与健康受试者的单一因素,在170个CRC患者和200个健康对照受试者的第一群组中,Fn具有77.7%的灵敏度和79.5%的特异性。还显示出,相比对照受试者,CRC患者中Bc、Ri、Ch和m7的粪便丰度显著增加或减少,这与宏基因组学研究的结果相一致。尽管由于CRC患者或对照受试者中的发生率受限,这些单个细菌的区分CRC患者与健康受试者的能力受到限制,但发现将Bc、Ch和m7的丰度与Fn的丰度组合,可以改善Fn对CRC的诊断能力。Ri的丰度没有提高Fn对CRC的诊断能力,并且其在进一步的分析中被排除。在使灵敏度和特异性之和最大化的最佳截断值处,在370个受试者的第一群组中,组合的四细菌组具有77.7%的灵敏度和81.5%的特异性。重要的是,还在CRC患者和健康对照的粪便样品的第二独立群组中,验证了用于诊断CRC的Fn和四细菌标志物的组合(Fn、Bc、Ch和m7)。
与FIT相比,发现细菌标志物在CRC(尤其是早期CRC)诊断的灵敏度上更为优越。令人感兴趣的是,在II期和III期中的16个和15个样品分别在细菌标志物或FIT中显示出阳性(补充表7),总计达到II期和III期案例的36.5%。结合在细菌标志物和FIT中显示为阳性的60%的案例(II:26/42和III:25/43),细菌与FIT的组合检测到了96.5%的II期和III期CRC。已显示,宏基因组分析与标准粪便隐血试验(FOBT)的结合改善了CRC检测的灵敏度(18)。因此,可以预期,在CRC的非侵入性诊断中,细菌标志物定量分析与广泛应用的FIT的结合,可以提高诊断灵敏度。
Bc是2010年从人类粪便中分离的革兰氏阴性、专性厌氧、非孢子形成的棒状细菌物种(19)。Ch是严格缺氧、革兰氏阳性、孢子形成的杆状细菌,其使用碳水化合物作为可发酵底物参与葡萄糖代谢,以产生乙酸盐、乙醇、二氧化碳和氢(20)。与已知促进CRC肿瘤发生的得到良好表征的Fn不同,Ri、Bc或m7的丰度改变是否在CRC发展中起致病作用或是否是CRC发生的结果,需要进一步研究。
总之,单独Fn的定量可以作为具有中等灵敏度和特异性的CRC的非侵入性诊断方法。四种细菌标志物(Fn、Bc、Ch和m7)的组合,改善了单独Fn对CRC的诊断能力。此外,细菌标志物和FIT的组合,对CRC(尤其是对早期CRC)诊断显示出最佳的灵敏度和特异性。因此,基于粪便的细菌标志物检测,可作为CRC患者的新型非侵入性诊断方法。
表1.CRC患者和健康对照受试者粪便样品中的细菌候选物的丰度
注:*Fn,核梭杆菌(Fusobacterium nucleatum);Ch,哈撒韦梭菌(Clostridiumhathewayi);m7,未知物种的内部标签;Bc,克拉鲁斯拟杆菌(Bacteroides clarus);Ri,肠道罗斯氏菌(Roseburia intestinalis);**n=370(170个CRC和200个健康对照)
表2.显示出细菌候选物和CRC患者之间的相关性的双变量相关性分析
注:*Fn,核梭杆菌;Ch,哈撒韦梭菌;m7,未知物种的内部标签;Bc,克拉鲁斯拟杆菌;Ri,肠道罗斯氏菌;**n=170
表3.细菌丰度和CRC状态的单变量线性回归分析
细菌* |
系数 |
95%置信区间 |
P值 |
Fn |
0.13 |
0.093-0.167 |
<0.001 |
Ch |
0.035 |
(-0.003)-0.073 |
0.073 |
m7 |
0.016 |
0-0.032 |
0.043 |
Bc |
-0.005 |
(-0.010)-0.001 |
0.019 |
Ri |
-0.002 |
(-0.007)-0.004 |
0.520 |
注:*Fn,核梭杆菌;Ch,哈撒韦梭菌;m7,未知物种的内部标签;Bc,克拉鲁斯拟杆菌;Ri,肠道罗斯氏菌
表4.单独Fn和与其它细菌的组合用于CRC诊断的性能
变量 |
Fn |
Fn、Bc、Ch和m7的组合 |
AUROC |
0.868 |
0.886 |
截断 |
0.0007072 |
0.001774 |
灵敏度 |
77.7% |
77.7% |
特异性 |
79.5% |
81.5% |
PPV |
76.3% |
78.1% |
NPV |
80.7% |
81.1% |
注:采用使灵敏度和特异性最大化的最佳截断值
PPV,阳性预测值;NPV,阴性预测值;AUROC,接受者操作特征曲线下面积。
n=370(170个CRC和200个健康对照)。
Fn,核梭杆菌;Ch,哈撒韦梭菌;m7,未知物种的内部标签;Bc,克拉鲁斯拟杆菌;Ri,肠道罗斯氏菌
表5.FIT或单独Fn和与其它细菌的组合用于CRC诊断的性能
变量 |
FIT |
Fn |
Fn+FIT |
四细菌 |
四细菌+FIT |
灵敏度 |
70.3% |
82.0% |
92.8% |
83.8% |
92.8% |
特异性 |
98.3% |
80.7% |
79.8% |
83.2% |
81.5% |
PPV |
97.5% |
79.8% |
81.1% |
82.3% |
82.4% |
NPV |
78.0% |
82.8% |
92.2% |
84.6% |
92.4% |
注:包括在HK群组中的具有FIT结果的230个受试者(111个CRC和119个健康对照)。
PPV,阳性预测值;NPV,阴性预测值;AUROC,接受者操作特征(ROC)曲线下的面积。四细菌包括Fn、Bc、Ch和m7。
补充表1:健康受试者和结肠直肠癌患者的临床特征
CRC,结肠直肠癌;FIT,粪便免疫化学测试;BMI,体重指数;TNM,肿瘤-淋巴结-转移
*通过卡方的性别;通过T-检验的年龄和BMI
#由于大多数的CRC案例是中度分化的,分化状态不包括在进一步的分析中。
补充表2:用于本研究的引物和探针
*根据采用Benjamini-Hochberg校正的Wilcoxon秩和检验,与CRC相关的MLG物种具有q<0.05的显著水平。对于未定义的物种“m7”,不能计算物种的秩平均值,因此,所示的p值和q值是基于基因标志物“3246804”。
补充表3:用于本研究的引物和探针
补充表4:通过宏基因组测序的CRC患者粪便样品中的m1704941(基因标志物水平,99.13%同一性)和核梭杆菌(物种水平)的丰度
补充表5:CRC患者和健康对照受试者粪便样品中的细菌候选物的发生率
细菌 |
CRC中的发生率 |
对照中的发生率 |
P值(x2) |
核梭杆菌(Fn) |
98.2% |
72.0% |
<0.0001 |
哈撒韦梭菌(Ch) |
35.3% |
8.0% |
<0.0001 |
m7 |
53.5% |
37.0% |
0.001 |
克拉鲁斯拟杆菌(Bc) |
12.9% |
21.5% |
0.031 |
肠道罗斯氏菌(Ri) |
22.9% |
36.0% |
0.006 |
补充表6:细菌丰度、FIT与CRC诊断和分期的相关性
包括了具有粪便免疫化学测试(FIT)结果的230个受试者(111个CRC和119个健康对照)的亚群
补充表7:将细菌标志物和FIT组合用于诊断
在具有170个CRC和200个对照的较大群组中确定使灵敏度和特异性最大化的最佳截断值(Fn=0.0007072;4-标志物=0.001774)。
参考文献
1.Sung JJ,Lau JY,Goh KL,et al.Increasing incidence of colorectalcancer in Asia:implications for screening.Lancet Oncol 2005;6:871-6.
2.Irrazabal T,Belcheva A,Girardin SE,et al.The multifaceted role ofthe intestinal microbiota in colon cancer.Mol Cell 2014;54:309-20.
3.Ahn J,Sinha R,Pei Z,et al.Human gut microbiome and risk forcolorectalcancer.J Natl Cancer Inst 2013;105:1907-11.
4.Kassinen A,Krogius-Kurikka L,Makivuokko H,et al.The fecalmicrobiota of irritable bowel syndrome patients differs significantly fromthat of healthy subjects.Gastroenterology 2007;133:24-33.
5.Castellarin M,Warren RL,Freeman JD,et al.Fusobacterium nucleatuminfection is prevalent in human colorectal carcinoma.Genome Res2012;22:299-306.
6.Qin J,Li Y,Cai Z,et al.A metagenome-wide association study of gutmicrobiota in type 2diabetes.Nature 2012;490:55-60.
7.Shin NR,Lee JC,Lee HY,et al.An increase in the Akkermansiaspp.population induced by metformin treatment improves glucose homeostasis indiet-induced obese mice.Gut 2014;63:727-35.
8.McCoy AN,Araujo-Perez F,Azcarate-Peril A,et al.Fusobacterium isassociated with colorectal adenomas.PLoS One 2013;8:e53653.
9.Kostic AD,Chun E,Robertson L,et al.Fusobacterium nucleatumpotentiates intestinal tumorigenesis and modulates the tumor-immunemicroenvironment.Cell Host Microbe 2013;14:207-15.23
10.Rubinstein MR,Wang X,Liu W,et al.Fusobacterium nucleatum promotescolorectal carcinogenesis by modulating E-cadherin/beta-catenin signaling viaits FadA adhesin.Cell Host Microbe 2013;14:195-206.
11.Nakatsu G,Li X,Zhou H,et al.Gut mucosal microbiome across stagesof colorectal carcinogenesis.Nat Commun 2015;6:8727.
12.Yu J,Feng Q,Wong SH,et al.Metagenomic analysis of faecalmicrobiome as a tool towards targeted non-invasive biomarkers for colorectalcancer.Gut 2015:Sep 25.pii:gutjnl-2015-309800.
13.Jalanka J,Salonen A,Salojarvi J,et al.Effects of bowel cleansingon the intestinal microbiota.Gut 2015;64:1562-8.
14.Wang Y,Qian PY.Conservative fragments in bacterial 16S rRNA genesand primer design for 16S ribosomal DNAamplicons in metagenomic studies.PLoSOne 2009;4:e7401.
15.Huang Y,Li Q,Ge W,et al.Predictive power of quantitative andqualitative fecal immunochemical tests for hemoglobin in population screeningfor colorectal neoplasm.Eur J Cancer Prev 2014;23:27-34.
16.Sung JJ,Ng SC,Chan FK,et al.An updated Asia Pacific ConsensusRecommendations on colorectal cancer screening.Gut 2015;64:121-32.
17.Lee JK,Liles EG,Bent S,et al.Accuracy of fecal immunochemicaltests for colorectal cancer:systematic review and meta-analysis.Ann InternMed 2014;160:171.
18.Zeller G,Tap J,Voigt AY,et al.Potential of fecal microbiota forearly-stage detection of colorectal cancer.Mol Syst Biol 2014;10:766.24
19.Watanabe Y,Nagai F,Morotomi M,et al.Bacteroides clarus sp.nov.,Bacteroides fluxus sp.nov.and Bacteroides oleiciplenus sp.nov.,isolated fromhuman faeces.Int J Syst Evol Microbiol 2010;60:1864-9.
20.Steer T,Collins MD,Gibson GR,et al.Clostridium hathewayi sp.nov.,from human faeces.Syst Appl Microbiol 2001;24:353-7.
本申请所引用的所有专利、专利申请和其它出版物(包括GenBank登录号),出于所有目的通过引用以其整体并入本文。
序列表
<110> 香港中文大学
<120> 结肠直肠癌的粪便细菌标志物
<130> 17C10328CN
<150> US 62/379,635
<151> 2016-08-25
<160> 86
<170> SIPOSequenceListing 1.0
<210> 1
<211> 1062
<212> DNA
<213> 肠道罗斯氏菌(Roseburia intestinalis)
<400> 1
atggaaaaag taaaggcatt ttgtaaacgg aaaaacattg agatatccgt caagcgctac 60
ctgattgatg cacttggtgc gatggcacag ggattatttg catcgctttt gatcggaacg 120
atcatcagta cacttggaac gcagcttaat attccgattc ttgtgacagt cgggacttac 180
gcgaaagcgg cagtcggacc ggcaatggcg atcgcaatcg gatatgcact gcaggcagcg 240
cctttagtac tgttttcact tgcggcagtc ggtgcggcgg caaatgaact tggcggggca 300
ggcggaccgc ttgcggtact tgtggttgca atttttgcag cagaatttgg aaaagcagtt 360
tccaaagaga caaaaatcga tattattgtc actccgtttg tgaccatttt tgtcggggtc 420
gcgctttcta tctggtgggc tccggcgatc ggtgcggcag cgagtgcagt cggtaatgcg 480
atcatgtggg caaccgagct gcagccgttt ttcatgggaa tcattgtatc tgtgatcgtc 540
gggattgcac tgacactgcc gatcagcagc gcagcaatct gtgcagcact tggactgacc 600
ggattagccg gtggtgcagc acttgccgga tgctgtgcgc agatggtcgg atttgcagtg 660
gcaagtttcc gtgaaaataa atggggcgga ttgtttgcac agggaatcgg tacatccatg 720
cttcagatgg gtaatatcgt gaaaaatccg cgcatctggc tgccggcgac attggcgtct 780
gcaatcaccg gaccgatcgc aatgtgtctg ttccatttac agatgaatgg tgcagcagtt 840
tcctccggta tgggaacctg tggactggtc ggacagattg gtgtctatac gggatggatc 900
gcagatattg aagcgggaag caaagctgcc attacaccga tggactggat cggactgatt 960
ttcgtaagct ttcttctgcc gggcgtttta tcatggcttt ttagtgtgtt attccgtaag 1020
atcggctgga tcaaagaagg cgatatgagg ctggacttat aa 1062
<210> 2
<211> 1161
<212> DNA
<213> 克拉鲁斯拟杆菌(Bacteroides clarus)
<400> 2
atgaaaatca aacaattagc gaaaagcgca tcattcttgc tggtggcagg ttttatcagt 60
tttactattc cgtcgtgtag cagtgaagaa gaaatcatca tccttcagga tgtaaaagta 120
aacagtgaaa gcttcaatct ggccgaagac ggcagtacga ccatagaagt caaggtagta 180
cccgaaaata ctccaatagc caaagccgta ctcagcacat cattatttaa tgaaagcggt 240
gttttcgaag taacccgact cactcccaaa ggtaacggtg tatggcagat agcagcaaaa 300
gtaaaggact tctcacgcat tcaaaacggt caggacgtaa tactttccgt ctatcaggaa 360
gataatatgt atatccaaac cacattgaaa ataaacgacc catatagcat cgagggtaaa 420
tatacaccgg tccatccgca agcctttact ttctacagtg ccgaagacgg caaactgatg 480
gagattccgt tcatcatcac agccgacaac gcagccgacc ttgccgccat cagctacgac 540
aatataaagg tagtcaatgg caccggaagc tctacaccca gcataagtat cacacatttc 600
gcaatagctc cgatgacagg taaaacaggc ttctatctgc aagtggataa cgcccaactc 660
gaaacggtaa aaaaagccat cacaaccatc gcttttttgg actgccgggt tatgataacc 720
ggccctaacg gccgtgttgc ctatactcct gtgcgcctca ttgtttcttc tccgaagtgc 780
atcatcaagg acgaccaact cagcctgctg catacagaat tgtccgcccc ggagtttaat 840
agacaaatca ccatagatat gacccacgat ttttatcgtt tgggcaaaca gaatgataaa 900
acaacctttg aggcgtttga aaaccgaggc ttgtataact cacaaggaga aatggcagat 960
gcagaccctc agttcatttc gttgggttat accactcagg gcaaaaatac aacatgtaac 1020
gtaactttaa aacatgatgc cacaattcct gcaatcggca cttaccacat ggtagaacgc 1080
ctaaaaggat attgggaata tgacggaaag aaatatccga ccgtttgtac agacctgcaa 1140
ttccaaatca cgattaaata a 1161
<210> 3
<211> 1935
<212> DNA
<213> 拉氏梭菌(Lachnoclostridium sp.)
<400> 3
aatatccgat atggcaacgg agctctggta gtagtccggg caagggaaaa ccttgtacat 60
ggcgaagcag agcagattac cttcaatact aaaatattag aaaggtgcgt gaggcatttg 120
agaaatccga ttgaagtatt gaaaactcta caagagaaag caggcaacga gaactatcaa 180
tttgaacgcc tgtaccgaaa tctgtacaac gaggagtttt tcctattggc atacggaaat 240
ctctctgcaa aagagggaaa tctgaccaag ggaacagacg gcgccacaat agacggaatg 300
ggaatggagc ggattcgcaa gctgattgaa agcctgcgga accacagtta ccagccgtcc 360
cctgcgagac gtgcctatat cccaaaatct aatggaaaac ggcgtccgtt aggcataccc 420
tctgttgacg ataagctggt gcaggaagtt gtgaggttaa ttctcgaaag tgtgtatgaa 480
agcaattttt ctgaacattc gcatggtttt agaccgaaca ggagctgtca cacggcactg 540
acccagattc aaagaaactt cacaggggtt aaatggttca ttgaggggga catcaaaggt 600
tattttgaca ccatcgacca ccatatcctt gtggatattt taagaaggcg cataaaggac 660
gaatacctaa tctcgctgat atggaaattt ctgaaagccg gatacttaga agactggaaa 720
ttcaatccta cctattccgg cactccgcaa ggctcggtca tcagtccaat acttgccaat 780
atctacctta acgaattcga tacctatgtt gaagaataca tagagaaatt caaccgtggt 840
aaaagacgtg aaagaaacag tgagtatcgc ttttatagtg atggcgcatc gaaactgagg 900
gtaaagtacc gcgggttatg ggaaataatg acagccgatg aaaaagaaaa agccaaatgt 960
gaagtaaatg agctcatgaa aaaagcaaaa cagattccag ctatgaatcc gatggacagc 1020
aattaccgcc gtctgctcta ttgcaggtat gcggatgatt ttatttgcgg agtaatcgga 1080
agcaaggaag atgcagaaac catcaaggct gattttagcc ggtacctgaa agaaaagctg 1140
ggactggata tgtcggaaga aaagacactg attacacact caaacgaaaa agcggcgttc 1200
cttggctacg aaatcgctgt ttccagaagc aatgaataca aaaagataag caacggacag 1260
aaggcaagaa cctttaatgg gcgtgttcat ctatttatgc cacataataa atgggttaag 1320
aagctgacca gttgcggagc aatggaaatc aaacagcagg acggcaaaga aatatggaaa 1380
ccgcaggcga ggaaagacct catcaacaaa gagccgattg aaatcctaag catttacaat 1440
gccgaaattc gtgggctgta caattattat tgtttggcaa gcaacgtatg caagctgcag 1500
aaatattact acatcatgga atacagcatg taccagacgt ttgcagcgaa gtaccgtgat 1560
aatttgcgga aaacgattaa caagcatacc cgaaacggcg tgtttggtgt cagctacact 1620
acaaaaaccg gcaacgagaa acgggcgaca ttcgtgaaag gaagcttcca aaaacggact 1680
gtcagcttag attacagtga tgaaatcccc tcttatcctg ccgcaaaata tagtcggaaa 1740
aacggcttaa ttgagcggtt acagggtgga aaatgtgaac tatgcggaca gcagaccgac 1800
aatgtaaaag ttcatcatgt caggaagctg aaagaattag ccggtatgaa agaatgggaa 1860
agaaaaatgg ttcagatgaa cagaaaaact ctggttgttt gtaatacatg ttatggaaac 1920
ataacaggca agtaa 1935
<210> 4
<211> 930
<212> DNA
<213> Parvimonas micra
<400> 4
aatcaattta gaattggttt atcaagaatg gagagagttg ttagagaaag aatgtcaact 60
caagatccag accttgctac gcctcaagga cttattaata taagacctct tgttgcgtct 120
ttaaaagaat tcttcggttc ttcacaatta tcacaattca tggatcaaaa caatccactt 180
gcagaactta ctcataagag aagattatca gcattaggac ctggtggtct tagtagagat 240
agagcaggat acgaagtaag agacgttcat gaaagtcact acggaagaat ttgtccgata 300
gaaactccag aaggtccaaa catcggtctt attacttctc ttacaactta tgcaagagtt 360
gatcaatatg gatttattga aacaccatat cgtgttgtaa ataatggaat tgctacaaag 420
gacattgttt atttaactgc tgatgaagaa gatgaagtta ttatcgctca agccaatgaa 480
ccacttgatg aaaatggacg ttttgtaaac gaaagagtaa gtggtcgtgg tattaatggc 540
gaaaatgata tttatccaag agatacaatt caacttatgg acgtttctcc tcaacaaatt 600
gtatcagttg gtacagcaat gattcctttc cttgaaaatg acgatgctac tcgtgcgttg 660
atgggttcaa acatgcaaag acaagcagtg cctctacttg ttactgaagc tcctattgta 720
ggaaccggta tagaacataa agcggcaaga gatagtggtg ttgttatcat tgctaaaaat 780
tcaggaattg ttacaaaagt tgatagtgat gaaattcata ttaaaagaga tttagataat 840
gtagttgata aatatagatt acttaaattt aaacgttcaa atcaaggaac aacaattaat 900
caaagaccta tagttaatga aaatgacaga 930
<210> 5
<211> 687
<212> DNA
<213> 核梭杆菌(Fusobacterium nucleatum)
<400> 5
tctgcaaaag aaaaagttgc tgcattagtt gctgcattaa aagcagatgg atatgatttt 60
actgttggta tccctcttga tacaccaata ggaaaatctg aaagagttgt aagtgctggt 120
aaagggattg gagataaaaa gaatatgaag ctaattgaaa acttagcaaa acaagctgga 180
gcttctattg gttcttctcg tccagtggca gaaacattgc aatatgtacc tcttgaccgt 240
tatgtaggaa tgtcaggaca aaaatttgtt ggaaaccttt atatagcttg tggaatttca 300
ggagctttac aacatttaaa aggaattaaa gatgcaacaa caatagttgc tataaataca 360
aactcaaatg ctccaatatt taagaatgca gactatggaa tagttggaga tttagcagaa 420
attttacctt tattaactaa ggaattagat aatggagaag ctaaaaaaga tgcaccacct 480
atgaagaaaa tgaagagagt tatacctaga gtagtgtata gtcctcatgt atatgtatgt 540
agtggttgtg gacatgaata caatcctgat ttaggagatg aagattctga cataaaacca 600
ggaactagat ttaaagattt accagaagat tggacttgtc ctgattgtgg agatccaaaa 660
tctggatata tagatgcaaa aaaataa 687
<210> 6
<211> 627
<212> DNA
<213> 哈撒韦梭菌(Clostridium hathewayi)
<400> 6
atgcctatac ttcagcagct tctcacatta gtagagcagc acttcggtaa caaatgcgaa 60
atcgtgcttc atgatctgac aaaggattac aaccatacca ttgtcgatat ccgaaacgga 120
gacattaccc atcgttccat cgggggctgc ggaagcaact tagggctgga agtcctgcgc 180
ggaaccgtgc tggatgggga tcgttttaac tatgttacca ccacacagga cggaaagatt 240
ctccgttcct catcgatcta tctaaaaaat gatcagggcg aggtcatcgg atcgatctgc 300
gtgaacctgg atatcacaga gacacttcag tttgaagggt atttacgcca gtttaaccag 360
tttgacagct ttacttccaa cgacgaggag attttcgctc ccgacgtgaa taatcttctc 420
agccatctga ttcagatggg acaggaacag atcggaaagc ctgcgctgga gatgaacaag 480
aacgagaaga ttgagtttat ccgtttcctt gaccagaaag gagcattcct catcacgaag 540
tccggggaac agatctgtga acttctggga atcagcaaat ttacctttta taattacctt 600
gaaagcagcc gcagccagtc ggattcg 627
<210> 7
<211> 1305
<212> DNA
<213> m7
<400> 7
atgttagcaa tcgtaggttt attaactatc ctggtcgtaa tgtttctgat tatgacaaaa 60
aaatgttcga ctctggtcgc actgattgca gttcccatga ttgcatgtgt tattgtgggt 120
cagggcgccg atatgggagg gtacataacg gccggtatca aaagtgtggc cgccaccgga 180
gtcatgttta tttttgcagt ggcctttttc ggtgtcatgg gtgatgtggg tgcatttgaa 240
atcgtagtga ataaaatact caggattatt gggaaagatc ctttgaaaat ctgtatcggc 300
acgctgatta tcacattgat gacccacctg gacggctccg gcgcaacgac atttttgatc 360
acaataccgg cgctgctgcc gatatacgat aaattgaaga tggatcggcg tgtgctggca 420
actatagtgg cggcaggagc aggaaccatg aatctcgtcc cttggggagg gccgacgatc 480
cgagcagcga cggcactgga ggtctcactg accgagcttt acaatcctat gattgtccct 540
cagctttgcg gagtcgccgc ctgcgtgaca gtggcggtga tgtttggcct gaaggaacgg 600
aaacgtttaa aagggactct ggaatctgtt tcggtagagc ctccgaaatt tgaggactta 660
ccggaggagg agagagtgaa acgccgtccc caccttgtct ggtttaacat tctgctcatt 720
atagttacaa ttgtgtcatt ggttatggag cttttgccgc cggccggctg ttttatggcg 780
gcgctgtgca tcgcaatgct ggttaactac cgtgatttaa aggatcaggg aaaacggatg 840
gacgagcatg cggtagcggc catgatgatg gcatccaccc tgtttggcgc aggctgcttt 900
accggtatcc tgggaggctg cggcatgctg gaagcgatgg cccagggact ctgtgatatt 960
ctcccggtag ccattatggg tcacattgcg attttggtgg cagttttctc catgcctctg 1020
tcgctgatgt tcgatccgga cagcttctac tatgcagtac ttccggtaat tgcagtggcg 1080
gccgaggtgg ccggtgttcc ggcattggca gtgggccgcg cggcgatatg cggacagatt 1140
actgttggat tccccatttc accactgact ccatccacct tccttctgac aggactaacg 1200
ggcgtggatc tcggggacca tcagaagcac agtttcgtgt ggctgtggct gatttccctg 1260
acgattgtgc tggttgccgt ggtgatgggc gtaattccgg tatag 1305
<210> 8
<211> 504
<212> DNA
<213> 未知(Unknown)
<400> 8
atggttgcac ttgtatggct actgattgaa atgaaatata aaatcagtgt cccatctcca 60
ctgttgctca gcatggttta caaacttttg cttccggcta tgcctgccta tcttctggct 120
aaaatcccct ctgggaaatt aacggccagc ttgagaagaa tgccgatttc tacccatatc 180
atgcttgtat tgatcgtcat gctccgcttt gcgccgactg tgctgcatga atttggagaa 240
gtcagggaag ccatgaaaat tcgtggcttc ttaaaatcgg tcggtaatgt tttgaggcat 300
ccaatggaca cgttggaata cgccattgtt ccgatggtgt tccgctcctt aaagatcgcg 360
gacgagttag cagcttctgc catagtcagg ggaattgaaa gcccctacaa gaaagaaagc 420
tactatgtca gccggatcgc tgcgctggat tactttttga ttgttgtcag cgtgggagct 480
gccgtgtgct gctgtctttt atag 504
<210> 9
<211> 750
<212> DNA
<213> 卵形瘤胃球菌(Ruminococcus obeum)
<400> 9
atgaaaggaa aaagagttat tgcaggcatt ctgcttgcag gaattttagc agttaccctg 60
gcagggtgta aaaacacaga taacactaaa gaagaatcag aaaagccggt tattaccctc 120
ggcagcgata gctatccacc atacaattat ctgaatgagg atggtgtacc gacgggcata 180
gatgtggaac tagctacaga agctttcaaa agaatgggat atcaggtgaa tgtcgtccaa 240
atcaactggg aggagaaaaa agaactggta gagagtggaa agatcgattg tatcatgggt 300
tgtttttcta tggaaggacg tcttgacgat taccgctggg caggggcgta catagcaagc 360
cgtcaggttg tagcggtaaa tgaggacagt gatatttata aattgagtga ccttgaggga 420
aagaacctgg ctgtccagtc cacaactaaa ccggaagtta tatttctgaa ccggttggat 480
aagagaatcc acaaactggg aaatctgatc agtcttggac accgcgagct gatatataca 540
tttcttggga aaggatatgt agatgcagtt gccgcacatg aggaatcaat catccagtat 600
atgaaggatt atgacataga cttccgtatc ctggaagaat cgctgatgat tacggggata 660
ggtgttgctt tcgcaaaaga tgatgacaga ggaattgtga gcagatggac cagacccttg 720
aagaaatgcg taaggatggc acgtctttga 750
<210> 10
<211> 594
<212> DNA
<213> 未知(Unknown)
<400> 10
atggcaatgc tcactgtaga aaatatcaat gtatattacg gcgtgatcca cgcccttaaa 60
gacatctcct ttcaggtaaa cgaaggcgag atcgtcgcac tgatcggcgc aaacggtgcc 120
ggcaaaacca ccaccctgca gactgtcagc ggcatgctga gcgcaaagtc cggttcgatc 180
cgatttcagg atcaggagat ttccagaatg ccggagcaca aaatcgtgaa gcagggaatt 240
tcccacgtcc ccgaaggacg ccggatgttc tccaatctga cggttttgga aaacctgaaa 300
atgggcgctt acaccagaaa agacaagcag gaaatcaaca attccctgga aatggtttat 360
gagcggtttc cccgcttaaa ggaacgtacc cgccagctgg caggaactct ttccggcggt 420
gaacagcaga tgcttgcaat gggacgtgca ctgatgtctc atccgaagat catccttctg 480
gatgaaccgt ctatgggact ttcaccgatt tttgtaaatg agattttcga aattatcaag 540
aaagtcagtg cagccggcac gaccgtactt ctggtagagc agaatgcaaa gaaa 594
<210> 11
<211> 708
<212> DNA
<213> 未知(Unknown)
<400> 11
gcagcttcaa actacgacct ttgtacaaca atccttagaa atgaatgggg atacgatggt 60
atcgtaatga ctgactggtg ggccaagatg aacgacgttg tagaaggtgg cgaagaatca 120
aatcaggata caagagatat ggttcgctca cagaacgacg tatatatggt tgtaaacaat 180
aacggcgcag aagttaactc aaacaacgac aacacagaga aatcaattaa agagggaaga 240
cttacaatcg gagaacttca gcgagctgca atcaacatct gcaacttcat tctttcagca 300
cctgttattg aaagagaatt agttgacaca gacgttgcaa aacattacga ttcagttcca 360
aatgatcagg ccaagtatga agtatttaac attgaaaaag acaataaggt aatgttcaat 420
agcggagcag aagcaacatt ggaagttgaa gacgaagggg aatacacaat tattgttaac 480
atctcatttg acaagtccaa cttatcacag tcaacagtaa acgttaatgc caacggcaca 540
acaatggtag taatccagac taatggaaca gacggcaact ggattacaca gaagctttgc 600
aaggttaaac ttgacaaggg tgtatacaac ttaaaacttg aagaagtatt agcaggaatc 660
aaagttaaat atattcagtt taagaagatt cctaagaaaa ataaataa 708
<210> 12
<211> 1401
<212> DNA
<213> 普拉梭菌(Faecalibacterium prausnitzii)
<400> 12
atgccgaacg aacgacatta ctccaatgaa ctgaatctgg aaagcgtggg catcaatctg 60
ccctacaaca tgcaggccga gcagagcgtg ctgggtgcgg tgctgctcaa gccggaaaca 120
ctgaccgacc tggttgagat catccggccg gaaatgttct acacccggca gaacgcccaa 180
atttattcgg aaatgctccg gctgttcacc agcgaccaga ccattgattt cgtcaccctg 240
ctggacgcgg tcatctcaga cggcgtgttt cccagcgcgg acgaggcgaa agtctacctg 300
accggtctgg ccgagacggt gcccagcatc tccaacgtga aagcctacgc ccagatcgtg 360
caggaaaaat atctggtccg ccagctcatg ggtgtggcga aagatatctt gcaggatgcg 420
ggcgacgagc cggacgcgga cctgctgctg gaaaacgccg agcagcgcat ttatgagatc 480
cgctccgggc gggattccag cgccctgacg cccctttctt ccagcatggt ggaaacgctg 540
accaatctgc agaagatcag cggcccggat gccgataagt acaagggcat ccctacaggc 600
ttccgcctgc tggacaccgt gctcaccggc cttggccgcg gcgaccttat tattctggct 660
gcccgccccg gtatgggcaa gaccagtttt gcgctgaaca ttgccacccg cgtggccatg 720
cagcagaaag taccggtggc catcttcagc ctcgaaatga ccaaggagca gctgaccaac 780
cggatcctct cggcggaggc cggcatcgac agccaggcgt tccgcaccgg cgccctccgg 840
gcggaggact gggagtacct ggcccttgcc accgagaagc tccatgacgc gcccatttat 900
atggatgaca cctcgggcat caccatcacc gagatgaaag ccaagatccg ccgggtgaac 960
caggacccca gccgccccaa tgtggggctc atcgtcatcg actatctgca gctgatgacc 1020
acgggccagc gcaccgagaa ccgtgtacag gagatcagct ccatcacccg aaacctcaag 1080
atcatggcca aagagatgaa tgtgcccatc attgcgctga gccagctgtc ccgtgcggtg 1140
gaaaagcagg gcaacaactc ctcccaccgc ccccagctgt ccgacctgcg tgattccggt 1200
tccatcgagc aggacgccga ctgcgtgctg ttcctctacc gtgattctta ttacgccagc 1260
cagaacccgg acggtgccga ggtggacgcc gacacggccg agtgcatcgt ggccaaaaac 1320
cgccacggtg agaccagtac cgtgccgctg ggctgggatg gtgcccacac ccgctttatg 1380
gatgtggact tcaaacgctg a 1401
<210> 13
<211> 777
<212> DNA
<213> Ruminococcus bicirculans
<400> 13
atgaagaata tgataaaaat atttgaaaat gacgaattcg gaaaagtgag aacagtcatt 60
aaggacggcg aaccgtggct tgtaggaaaa gatgttgcgg aaattttagg gtattccaac 120
acaagggacg ctctttcacg tcatgtggat accgaggata aaaccaccgt cgtgatttcc 180
gacagtggtt caaattacaa gagcaagacc actattatca atgaaagcgg cttttacagc 240
ttagttctct caagcaaaat gccgagagcc aaagagttca ggcgttgggt gaccgccgaa 300
gtcctcccca ccatcagacg caccggcggc tacgtttcca acgaggatat gttcatcaaa 360
aactatctcc cctttctcga cgagccatac cgtgacctgt tccgacttca aatgaccatt 420
atcaacaagc tgaatgaacg tatccgccac gatcagccgc tggtggagtt tgcgaatcag 480
gtgtcaaata ccgataatct tatcgacatg aacgcaatgg caaagcttgc gagagcggaa 540
aatatccccg tcggcagaaa caagctttac ggctggctga aaggaaaagg tgtgcttatg 600
gcaaacaatc tgccgtatca ggcttttatc gaccgcggat atttttccgt aaaggagtcg 660
gtgtttgaaa ctgcgactat gacaaagact tatcagcaga cgtttgttac gggcaggggg 720
cagcagttcg tcataaattt gctgaagaaa tattatggga aggaggtttt gcaataa 777
<210> 14
<211> 858
<212> DNA
<213> 普拉梭菌(Faecalibacterium prausnitzii)
<400> 14
atctccaaac tggaaaaaac gctgcgggca cggttcccga aaacgcagca gggcgaactg 60
ctggccgggg cggtgctggc cttctgcctg ccggtgggca cctttctgct cacaagcgcc 120
gtgtgccttc tggcggcaaa aatcagcccc tggctcggcc ttgccgtgca gatgttctgg 180
tgcgggcagg cgctggcggc aaagggactt gtgcaggaga gccggaacgt ttacaacaag 240
ctggtaaagc ccgacctgcc cgccgcccgc aaggccgtga gccgcatcgt ggggcgggac 300
accgagaacc tgaccgccga gggcgtgacc aaggctgccg tggagactgt ggccgagaat 360
gccagcgacg gcgtgattgc gccgctgctg tacatgctgc tgggcggcgc gccgctggcg 420
ctgacctaca aggccgtcaa caccatggac agcatggtgg gctacaaaaa cgagacctat 480
ctctacttcg gccgggcggc ggcaaagctg gacgatatgg caaactacat tcccagccgc 540
cttgccgccc tgctgtgggc ggcggctgct gccctgaccg gcaacgatgc caaaggcgcg 600
tggcgcatct ggcggcggga ccggcgcaat cacgccagcc ccaacagcgc ccagaccgaa 660
agcgcctgcg ccggtgcgct gggcgtgcag ctggccgggc cggcctacta ctttggcgaa 720
tactacccga aacccaccat cggcgatgcc ctgcgcccca ttgagccgca ggacatcctg 780
cgggccgacc gcatgatgta cgccgccagc attctggcgc tggtgctcgg gcttgtgata 840
cgggggttcg ttgtatga 858
<210> 15
<211> 945
<212> DNA
<213> 普拉梭菌(Faecalibacterium prausnitzii)
<400> 15
atgaacagag aaacggtgaa catggtgcgc agtccgattt ctgtggaggg gaacatccgg 60
cttgttccgt attatccggc ctacgataca gcacttgcgt ggtatcagga tgcacagctc 120
tgcaaacagg tagataacag ggacttcgtt tatgatttgc cgctgctgaa gcggatgtat 180
cattatctgg acacacacgg ggaactgttt tatattgagt atcggggtgt gctttgtggt 240
gacgtcagcc tgcggacgac cggcgagctg gccatcgtca tctgcaagga gtaccagaat 300
aaacacatcg ggcggaaggt catcgaaaaa atgctggagc tggctcggga aaggggcttg 360
gcggagtgct tcgcgcacat ctattctttc aatacccagt cgcagaaaat gtttgaatcc 420
attggctttg tcccacagga cgaagaacgc tatatctaca aattgcaaaa aggagaaccg 480
actatgacaa aactgactct ggaagaaaag caggagctca tccggatggc ccttgcggcc 540
agggagaggg cttacgtgcc ttacagcgac tttatggtgg gcgctgccct gcgcgccgag 600
gatggccgtg tctttaccgg ctgccatgtg gagaatgccg cctttacccc caccagctgc 660
gccgagcgca ccgcgctgtt caaagccgtg agcgagggcg tgaccaaatt tacggacatc 720
gccgtggtag gctcccgccg gggcgagatc aatcagcaga tcacctcgcc ctgcggcgtc 780
tgccgtcagg cactgtttga gtttggcggc ccggagctga acgtcatcat ggccaaaacg 840
ccggatgatt tcatggagcg cagcatggat gagctgctgc cctttggctt cggtccctcc 900
aatgtggcgg gcaacaaggc cgtggaagag gaagaaaaag gctga 945
<210> 16
<211> 1206
<212> DNA
<213> 未知(Unknown)
<400> 16
atgaggttat tttttgatat ggtatgtaac ggcagggcat tgcaaaatgt acaaatgtat 60
aaattgaata tggttttaga tgtacacccc tatgctatta cagcaccgtc aaaaactggt 120
ggccgttggc agacatatgt aaaggaaggt gataagcgta agattataag ggcttcttca 180
aaggaaaaac taatggacaa attatatact gcctattttg ttcaaaatgg tgtttctggt 240
atgaccatgg acaagctttt tctcgaatgg ttagcttata aggaatgtat cacaaatagt 300
atgaatacga ttcgcagaca tgaacaacac tggaaaaagt attttcagga tatttcccca 360
aataaggtat cttcctatga tcgtctggaa ttgcagaaag aatgtaatca gttaataaaa 420
gttaataacc tttcttccaa agaatggcag aatgtaaaaa caattctttt aggtatgttt 480
gactatgcct ttgaaaaagg atatattaat acaaacccca tgcccagtat taaaatcact 540
gttaaattcc gtcaggtcaa taaaaagagt ggtaggactg aaacatatca gacagacgaa 600
tacaaagcac ttatgcaata tctagatgca gaatatacag ctacagaaga ccttgcttta 660
ttggctgtta aatttgattt ttttattgga tgccgtgttg ctgagttggt agctctcaag 720
tggtgtgatg ttgaaaatct acggcattta catatttgta gggaagaggt taaagagtct 780
gtccgtgttg gtgatacctg gaaagatgtt tataccgttt cagagcatac taagacatat 840
acagaccggt ctataaattt agttcctaat gcgattgcta ttttaaatca tatccgtctt 900
aaaatggctt ataatgtatc tgacgatgat tatatcttta cccggaacgg ttcccggatc 960
acttcacgcc agattaatta tattcttgaa aaagcatgta caaaactggg aattatgatt 1020
aagaggtcgc ataaggtaag aaaaacggtt gcaagtcgtc tcaatgtcgg tgaggttccg 1080
ttagattcta ttcgtgagct gttaggtcat gcaaatttaa gcactacact aagttatatt 1140
tataatccgt tatcggaaaa agaaacctat aacctgatgt ccagagcctt ggggaaagtt 1200
caatag 1206
<210> 17
<211> 336
<212> DNA
<213> 未知(Unknown)
<400> 17
atggcgattg atactgaatt agcaaaaaga ttacgttcat atcgtaattt taaacattta 60
acacaaaaag atgttgctgc gcatttaaat gttcctcatt ctgcaatttc cgatatagaa 120
aatggtaaaa gagacattac tgttagcgag ttaaaagtgt tttcaaattt atatggtaga 180
agtgtagaag aaattatgag cgggaaaaaa tatgactatt ataatattgc caatatcgct 240
cgtttactta ctgaacttcc tgatgatgat ttaaaagaaa tcatgtttat tattgaatat 300
aaaagaaaaa gaaatgaaga acgtcatttg aaataa 336
<210> 18
<211> 816
<212> DNA
<213> 梅毒螺旋体(Treponema sp.)
<400> 18
atggccaaaa cacctatcgt agataagggg tgcttcatat cgaatgatgt taaaaggtca 60
atagttttaa acctatgtga gactaagtca atggatctaa ttgcaagaga acactgtgta 120
tctcctagta gtgttgccag aatacttcgt ttaactgaag ataggagaag aaaaaattat 180
cttcctagga ttctatcaat agacgaattc aagtcagtaa atacagttga tgcgtctatg 240
agtgtaaatt taactgattt agaaggcggt catatttttg atatcctggt ggataggagg 300
caaagatacc tctttgagta ctttaattcc tatcccttga aggtcagaaa aagggtagaa 360
tatgtgacta cagacatgta taagccatat attgatcttg ccaagaaggt ctttccaaat 420
gccaatattg tggtagataa attccatata gtacagctct tgacaagaga gctaaacaag 480
ttaaggataa atgagatgaa gaagcttaat accaggtcta gagagtataa aatactgaag 540
agatactgga aaatacccct taggaagaag agagacttaa acagtatata tttttacaag 600
aataggcact ttaaaaatat gaccagttca attgatatat tagactatat gttaaaggaa 660
tttcccaact taaaagaggc ctatgatttt tatcaaaact tcctattaag tatatctaat 720
aatgatgtcg ctatgcttga agacattcta aatactagga ctgatgaaat tcccatgtgt 780
tttaggaaga gtataaaaag ccttaaaaag cttaga 816
<210> 19
<211> 432
<212> DNA
<213> 未知(Unknown)
<400> 19
tatttttaca agaataggca ctttaaaaat atgaccagtt cagttgatat attagattat 60
atgttaaaag aatttcccaa cttaaaagat gcctatgatt tttatcaaaa cttcctatta 120
agtatatcta ataatgatgt ggctatgctt gaagatattc taaatactag gactgataaa 180
ataccaatgt gttttaggaa gagtataaaa agccttaaaa agtttagaaa gtatgtggta 240
aattcactga aatatgacta tacgaatgcc atggtggagg gtaaaaacaa caagataaag 300
gtaattaaaa gagtatccta cggatatagg agttttagga attttaaggc aaggataatg 360
ctaatggaaa ggtataaaat acaaaagggc aacatccata gttatcagtt tgctatggat 420
gctgccgcat aa 432
<210> 20
<211> 873
<212> DNA
<213> 未知(Unknown)
<400> 20
atgaaacgta ttttattaac tggagcaagt ggatttatag gtaaaaacat taaagagaca 60
ttaaacagta aatatgacat atggagcccg tcaagccagg agctggattt aaaagatacc 120
gaatgcgttg aagcatattt gaagcagcat tctttcgatg taatattgca tgcagcaaat 180
tgtaatgata caaggaattc catatcagca tacgatgtac tcaatggaaa tctcagaatg 240
ttttttaacc tagagagatg ttctcactat tatggaaaaa tgatttattt tgggtctggg 300
gcagaatatg acagaagtaa taacatccct aatatgtcag aggactattt tgataccagt 360
gttccgaaag atgcttacgg actttcaaaa tatattatgg caaaagcctg tttaaatcag 420
aagaacattt atgaattgtg tttatttgga gtatacggaa aatatgagga atgggagaga 480
agatttatct ctaatgcgat atgtcgtgca ttaaagggta tggatattac gcttcataaa 540
aatgtatact ttgattattt gtgggtagat gacctcataa aaattatttc ttttttcatt 600
gagaaagata acttgaggta caagaggtac aatgtgtgta gaggcgagaa ggttgatcta 660
tattcgctgg cagtacaggt aaagaagact ttggatagcg aatgttcaat attagttggt 720
gagcctggat ggaagaggga gtatactgcg gataacaata gaatgttgaa cgaaatgaat 780
ggtttatctt ttacaaaact ggaagtgacg atagctgaat tgtgtgaata ttataaagag 840
catttatcag aaatagttac tgaaaaattg taa 873
<210> 21
<211> 20
<212> DNA/RNA
<213> 人工序列(Artificial Sequence)
<400> 21
cggatttgca gtggcaagtt 20
<210> 22
<211> 20
<212> DNA/RNA
<213> 人工序列(Artificial Sequence)
<400> 22
tgattgcaga cgccaatgtc 20
<210> 23
<211> 23
<212> DNA/RNA
<213> 人工序列(Artificial Sequence)
<400> 23
cgtgaaaaat ccgcgcatct ggc 23
<210> 24
<211> 20
<212> DNA/RNA
<213> 人工序列(Artificial Sequence)
<400> 24
tccatccgca agcctttact 20
<210> 25
<211> 20
<212> DNA/RNA
<213> 人工序列(Artificial Sequence)
<400> 25
gcttccggtg ccattgacta 20
<210> 26
<211> 24
<212> DNA/RNA
<213> 人工序列(Artificial Sequence)
<400> 26
ttcatcatca cagccgacaa cgca 24
<210> 27
<211> 20
<212> DNA/RNA
<213> 人工序列(Artificial Sequence)
<400> 27
aatgggaatg gagcggattc 20
<210> 28
<211> 21
<212> DNA/RNA
<213> 人工序列(Artificial Sequence)
<400> 28
cctgcaccag cttatcgtca a 21
<210> 29
<211> 26
<212> DNA/RNA
<213> 人工序列(Artificial Sequence)
<400> 29
aagcctgcgg aaccacagtt accagc 26
<210> 30
<211> 29
<212> DNA/RNA
<213> 人工序列(Artificial Sequence)
<400> 30
aagaatggag agagttgtta gagaaagaa 29
<210> 31
<211> 26
<212> DNA/RNA
<213> 人工序列(Artificial Sequence)
<400> 31
ttgtgataat tgtgaagaac cgaaga 26
<210> 32
<211> 30
<212> DNA/RNA
<213> 人工序列(Artificial Sequence)
<400> 32
aactcaagat ccagaccttg ctacgcctca 30
<210> 33
<211> 24
<212> DNA/RNA
<213> 人工序列(Artificial Sequence)
<400> 33
ttgtaagtgc tggtaaaggg attg 24
<210> 34
<211> 26
<212> DNA/RNA
<213> 人工序列(Artificial Sequence)
<400> 34
cattcctaca taacggtcaa gaggta 26
<210> 35
<211> 30
<212> DNA/RNA
<213> 人工序列(Artificial Sequence)
<400> 35
agcttctatt ggttcttctc gtccagtggc 30
<210> 36
<211> 23
<212> DNA/RNA
<213> 人工序列(Artificial Sequence)
<400> 36
ttcaataaaa gtggcaggtc aag 23
<210> 37
<211> 23
<212> DNA/RNA
<213> 人工序列(Artificial Sequence)
<400> 37
taacaacaca tgcaggtcaa tgg 23
<210> 38
<211> 24
<212> DNA/RNA
<213> 人工序列(Artificial Sequence)
<400> 38
actcgaaccc ccaaccctcg gttt 24
<210> 39
<211> 19
<212> DNA/RNA
<213> 人工序列(Artificial Sequence)
<400> 39
gggctgcgga agcaactta 19
<210> 40
<211> 20
<212> DNA/RNA
<213> 人工序列(Artificial Sequence)
<400> 40
gatgacctcg ccctgatcat 20
<210> 41
<211> 28
<212> DNA/RNA
<213> 人工序列(Artificial Sequence)
<400> 41
accaccacac aggacggaaa gattctcc 28
<210> 42
<211> 20
<212> DNA/RNA
<213> 人工序列(Artificial Sequence)
<400> 42
tcggcacgct gattatcaca 20
<210> 43
<211> 19
<212> DNA/RNA
<213> 人工序列(Artificial Sequence)
<400> 43
cacacgccga tccatcttc 19
<210> 44
<211> 20
<212> DNA/RNA
<213> 人工序列(Artificial Sequence)
<400> 44
acccacctgg acggctccgg 20
<210> 45
<211> 20
<212> DNA/RNA
<213> 人工序列(Artificial Sequence)
<400> 45
aagatcgcgg acgagttagc 20
<210> 46
<211> 20
<212> DNA/RNA
<213> 人工序列(Artificial Sequence)
<400> 46
gctcccacgc tgacaacaat 20
<210> 47
<211> 28
<212> DNA/RNA
<213> 人工序列(Artificial Sequence)
<400> 47
aaagctacta tgtcagccgg atcgctgc 28
<210> 48
<211> 21
<212> DNA/RNA
<213> 人工序列(Artificial Sequence)
<400> 48
cctggcaggg tgtaaaaaca c 21
<210> 49
<211> 20
<212> DNA/RNA
<213> 人工序列(Artificial Sequence)
<400> 49
tatgcccgtc ggtacaccat 20
<210> 50
<211> 23
<212> DNA/RNA
<213> 人工序列(Artificial Sequence)
<400> 50
ccggttatta ccctcggcag cga 23
<210> 51
<211> 20
<212> DNA/RNA
<213> 人工序列(Artificial Sequence)
<400> 51
aatgggcgct tacaccagaa 20
<210> 52
<211> 19
<212> DNA/RNA
<213> 人工序列(Artificial Sequence)
<400> 52
tcaccgccgg aaagagttc 19
<210> 53
<211> 25
<212> DNA/RNA
<213> 人工序列(Artificial Sequence)
<400> 53
ttccccgctt aaaggaacgt acccg 25
<210> 54
<211> 23
<212> DNA/RNA
<213> 人工序列(Artificial Sequence)
<400> 54
cagaagcaac attggaagtt gaa 23
<210> 55
<211> 23
<212> DNA/RNA
<213> 人工序列(Artificial Sequence)
<400> 55
tgtaatccag ttgccgtctg ttc 23
<210> 56
<211> 28
<212> DNA/RNA
<213> 人工序列(Artificial Sequence)
<400> 56
tcaacagtaa acgttaatgc caacggca 28
<210> 57
<211> 20
<212> DNA/RNA
<213> 人工序列(Artificial Sequence)
<400> 57
cggccggaaa tgttctacac 20
<210> 58
<211> 21
<212> DNA/RNA
<213> 人工序列(Artificial Sequence)
<400> 58
gaaacacgcc gtctgagatg a 21
<210> 59
<211> 26
<212> DNA/RNA
<213> 人工序列(Artificial Sequence)
<400> 59
ccagaccatt gatttcgtca ccctgc 26
<210> 60
<211> 20
<212> DNA/RNA
<213> 人工序列(Artificial Sequence)
<400> 60
ctggtggagt ttgcgaatca 20
<210> 61
<211> 20
<212> DNA/RNA
<213> 人工序列(Artificial Sequence)
<400> 61
cagccagccg taaagcttgt 20
<210> 62
<211> 23
<212> DNA/RNA
<213> 人工序列(Artificial Sequence)
<400> 62
cggaaaatat ccccgtcggc aga 23
<210> 63
<211> 19
<212> DNA/RNA
<213> 人工序列(Artificial Sequence)
<400> 63
gggcaccttt ctgctcaca 19
<210> 64
<211> 20
<212> DNA/RNA
<213> 人工序列(Artificial Sequence)
<400> 64
cgggctttac cagcttgttg 20
<210> 65
<211> 22
<212> DNA/RNA
<213> 人工序列(Artificial Sequence)
<400> 65
aaaaatcagc ccctggctcg gc 22
<210> 66
<211> 20
<212> DNA/RNA
<213> 人工序列(Artificial Sequence)
<400> 66
gtgcgcagtc cgatttctgt 20
<210> 67
<211> 20
<212> DNA/RNA
<213> 人工序列(Artificial Sequence)
<400> 67
cagcggcaaa tcataaacga 20
<210> 68
<211> 28
<212> DNA/RNA
<213> 人工序列(Artificial Sequence)
<400> 68
tccgtattat ccggcctacg atacagca 28
<210> 69
<211> 25
<212> DNA/RNA
<213> 人工序列(Artificial Sequence)
<400> 69
agctttttct cgaatggtta gctta 25
<210> 70
<211> 23
<212> DNA/RNA
<213> 人工序列(Artificial Sequence)
<400> 70
ctgcaattcc agacgatcat agg 23
<210> 71
<211> 30
<212> DNA/RNA
<213> 人工序列(Artificial Sequence)
<400> 71
aatacgattc gcagacatga acaacactgg 30
<210> 72
<211> 19
<212> DNA/RNA
<213> 人工序列(Artificial Sequence)
<400> 72
aaagatgttg ctgcgcatt 19
<210> 73
<211> 21
<212> DNA/RNA
<213> 人工序列(Artificial Sequence)
<400> 73
tttcccgctc ataatttctt c 21
<210> 74
<211> 27
<212> DNA/RNA
<213> 人工序列(Artificial Sequence)
<400> 74
aaatgttcct cattctgcaa tttccga 27
<210> 75
<211> 21
<212> DNA/RNA
<213> 人工序列(Artificial Sequence)
<400> 75
tcctatccct tgaaggtcag a 21
<210> 76
<211> 27
<212> DNA/RNA
<213> 人工序列(Artificial Sequence)
<400> 76
tgtcaagagc tgtactatat ggaattt 27
<210> 77
<211> 25
<212> DNA/RNA
<213> 人工序列(Artificial Sequence)
<400> 77
ttgccaagaa ggtctttcca aatgc 25
<210> 78
<211> 26
<212> DNA/RNA
<213> 人工序列(Artificial Sequence)
<400> 78
tgtggtaaat tcactgaaat atgact 26
<210> 79
<211> 21
<212> DNA/RNA
<213> 人工序列(Artificial Sequence)
<400> 79
tccattagca ttatccttgc c 21
<210> 80
<211> 21
<212> DNA/RNA
<213> 人工序列(Artificial Sequence)
<400> 80
accctccacc atggcattcg t 21
<210> 81
<211> 20
<212> DNA/RNA
<213> 人工序列(Artificial Sequence)
<400> 81
tgtgtgtaga ggcgagaagg 20
<210> 82
<211> 22
<212> DNA/RNA
<213> 人工序列(Artificial Sequence)
<400> 82
ccattcattt cgttcaacat tc 22
<210> 83
<211> 22
<212> DNA/RNA
<213> 人工序列(Artificial Sequence)
<400> 83
ccctcttcca tccaggctca cc 22
<210> 84
<211> 19
<212> DNA/RNA
<213> 人工序列(Artificial Sequence)
<400> 84
cgtcagctcg tgycgtgag 19
<210> 85
<211> 17
<212> DNA/RNA
<213> 人工序列(Artificial Sequence)
<400> 85
cgtcrtcccc rccttcc 17
<210> 86
<211> 25
<212> DNA/RNA
<213> 人工序列(Artificial Sequence)
<400> 86
ttaagtcccr yaacgagcgc aaccc 25