CN101065393A

CN101065393A - 用于结肠直肠癌早期检测的药物筛选和分子诊断检测：试剂、方法及其试剂盒

Info

Publication number: CN101065393A
Application number: CNA2005800330138A
Authority: CN
Inventors: 南希·M·李
Original assignee: IntelliGeneScan Inc
Current assignee: IntelliGeneScan Inc
Priority date: 2004-09-30
Filing date: 2005-09-30
Publication date: 2007-10-31

Abstract

本发明公开了一种早期检测结肠直肠癌(“CRC”)的新方法，其使用分子诊断检测来评估用于结肠直肠癌早期检测的大体上看起来正常的结肠组织。所述大体上看起来正常的结肠黏膜细胞可以通过非侵入性的或最低程度侵入性的方法收集。本发明还公开了新型生物标记组用于药物筛选的应用。这样的生物标记组可以完全或部分用作监测有前景的药物在病理干涉中的效用的替代终端，所述病理诸如癌症，例如CRC、肺癌、前列腺癌和乳腺癌，和神经退行性疾病，例如阿尔茨海默病和ALS。

Description

用于结肠直肠癌早期检测的药物筛选和分子诊断检测：试剂、方法及其试剂盒

优先权要求

美国临时专利申请号60/614,746，题目为MOLECULARDIAGNOSTIC TEST FOR EARLY DETECTION OF COLORECTALCANCER：REAGENTS，METHODS，AND KITS THEREOF，由Nancy M.Lee，等.于2004年9月30日提交(Attorney Docket No.NLEE-01001US0)；

美国临时专利申请号60/651,344，题目为METHODS OF USE OF ABIOMARKER PANEL FOR DRUG SCREENING，由Nancy M.Lee，等.于2005年2月8日提交(Attorney Docket No.NLEE-01002US0)；和

美国专利申请号1/＿，＿，题目为DRUG SCREENING ANDMOLECULAR DIAGNOSTIC TEST FOR EARLY DETECTION OFCOLORECTAL CANCER：REAGENTS，METHODS，AND KITSTHEREOF，由Nancy M.Lee，等.于2005年9月29日提交(Attorney DocketNo.NLEE-01001US1)。

相关申请的交叉参考

本申请与由Nancy M.Lee等于2004年7月14日提交的题目为“Biomarker Panel for Colorectal Cancer”的PCT/US2004/022594相关，它要求由Nancy M.Lee等于2003年7月18日提交的题目为″MolecularBiomarker Panel for Determination of Colorectal Cancer″的美国临时申请号60/488,660(Attorney Docket No.CPMC-01000US0)的优先权，并且还要求由Nancy M.Lee等于2003年10月22日提交的题目为″Biomarker Panel forColorectal Cancer″的美国专利申请号10/690,880(Attorney Docket No.CPMC-01000US1)的优先权，每一申请通过参考完全结合于此。

核苷酸和/或氨基酸序列列表以计算机可读的形式和硬拷贝(hard-copy)包含在本申请中。以计算机可读形式包含的信息通过参考完全结合于此。计算机可读形式的信息还包含在磁盘上，并且在磁盘上提交的这样的信息通过参考完全结合于此。1号压缩磁盘包含下述文件：NLEE1001WO0.ST25.txt(9/30/2005产生，96K)。提交的磁盘总数为1。

背景

本公开内容的技术领域涉及用于结肠直肠癌(“CRC”)早期检测的试剂、方法和试剂盒，和用于筛选对病理诸如癌症和神经退行性疾病治疗有效的药物的方法，所述癌症例如CRC、肺癌、前列腺癌和乳腺癌，所述神经退行性疾病例如阿尔茨海默病和ALS。这些试剂、方法和试剂盒基于一组生物标记，所述生物标记有效用于CRC和其它这样的病理的危险评估、早期检测、建立预后、干涉评估、复发，以及关于治疗干涉的药物发明。

在医学领域，很久以来就开始探求用于CRC危险评估和早期检测的临床方法。目前，CRC是西方国家中癌症-相关的死亡中的第二主要原因。通过十几年的关于CRC的研究清楚显现出的一幅图像就是，早期检测是增加生存率的关键。

因此，对于CRC早期检测的一种长期探求的途径已经成为对于有效进行CRC早期检测并且因此有效地用于CRC治疗的生物标记的寻求。自从发现了癌胚抗原(“CEA”)，对于有效用于CRC早期检测的生物标记的寻求已经持续了四十多年。它还对于在与CRC早期诊断检测联合应用的取样方法成为最低程度侵入性或非侵入性是有利的。非侵入性和最低程度侵入性的取样方法增加了患者的顺应性，并且通常减少了成本。另外，用于分析生物分析典型的复杂的、多变量数据的生物信息学方法，其基于这样的数据设定产生可靠的诊断评估，也是理想的。

对于许多类型癌症诸如CRC、肺癌、前列腺癌和乳腺癌的治疗干涉，包括手术、化学治疗和放射治疗、以及它们的组合。对于CRC，除了寻找早期检测的非侵入性方法之外，继续研究和开发的当前领域在药物开发领域内。

通过十几年的关于CRC的研究已经清楚地显现出这样一副画面，伴随有效的治疗干涉的早期检测是增加存活率的关键。到目前为止，CRC治疗中最常用的药物是5-氟尿嘧啶(“5FU”)，其通常与叶酸维生素、亚叶酸组合进行静脉内施用。当转移已经发生，并且癌症已经扩散到机体的不同部分时，使用一种叫作初级化学治疗的策略。对于CRC，初级化学治疗的现有策略是施用口服形式的5FU、卡培他滨，其与下列各项组合：盐酸伊立替康和山梨醇注射剂，一种拓扑异构酶I抑制因子，或奥沙利铂，一种抑制DNA合成的有机金属的、含有铂的药物。

目前，对于CRC新药开发的策略包括两个研究领域：血管生成抑制剂和信号传导抑制剂。

新的生物药物包括基于蛋白和核糖酶的治疗剂。基于人源化抗体的治疗剂包括实例诸如Erbitux和Avastin。Erbitux，一种信号传导抑制剂，目的是抑制癌细胞表面上的表皮生长因子受体(“EGFR”)。Avastin，一种血管生成抑制剂，目的是抑制已知促进血管生长的血管内皮生长因子(“VEGF”)。另外，血管酶(Angiozyme)，一种基于核糖酶治疗的实例，是针对VEGF-R1受体表达的血管生成抑制剂。基于传统小分子的新药包括实例诸如Iressa，其基于喹唑啉模板，并且作用为信号传导抑制剂，和SU11248，其基于吲哚满酮模板，作用为抗血管生成抑制剂。

对于这些CRC治疗的新生药物仍然存在许多潜在的缺点和不确定性。对于许多有希望的候选药物，除了典型的禁忌征候，诸如反胃、呕吐、头痛和腹泻，已经观察到其它更严重的副作用，诸如肠胃穿孔、升高或降低的血压、极度疲劳和内出血。另外，尽管许多基于血管生产抑制或信号传导抑制的药物治疗看起来是有希望的，但是它们处于临床试验的非常早期的阶段。

因此，在本领域中存在对于生物标记和生物信息方法的需要，所述生物标记有效地早期检测CRC，伴随着最低程度或非侵入性的取样方法，所述生物信息方法与生物标记一起为CRC的早期检测产生强有力的诊断检测。本领域中还存在对于药物研发的需要，其可以在诊断患有病状的患者的癌症发展之前提供有效的治疗，同时将严重的副作用最小化，所述病状诸如癌症，例如CRC、肺癌、前列腺癌和乳腺癌，以及神经退行性疾病，例如阿尔茨海默病和ALS。

附图简述

图1是列出本公开的发明的一组生物标记的序列表的实施方案。

图2是用图1生物标记组的一方面以及本公开发明的生物信息学评估的一方面评估的对照受试者相对测试受试者的分布曲线。

图3显示基因PPAR-γ、IL-8、SAA 1和COX-2的log(base2)表达值的分布和它们的截断点。

图4A和4B显示不同基因的表达在患有结肠癌家族病史的个体的MNCM的不同位点改变。

图5显示用于评估数据的生物信息学方法的一方面的流程图。

图6是对于结肠黏膜细胞最低程度侵入性取样的擦拭取样(swabsampling)和转运系统的实施方案。

图7是描述药物筛选内容一方面的流程图。

图8是描述药物筛选内容另一方面的流程图。

详述

到目前为止，通过腺瘤性结肠息肉(“APC”)、p53和Ki-ras基因，以及相应的蛋白，及其参与调控的相关途径的研究，已经获得了对CRC生物学的更多的理解。然而，在对于具体的基因、其表达、蛋白产物和调控的研究，与理解什么基因是关键包含在用于CRC分析的组内的之间存在明显的差异，所述用于CRC分析的组有效用于管理疾病患者的护理。对于CRC所建议的组包括APC、p53和Ki-ras以及微卫星不稳定标记基因BAT-26的特异性点突变。

对于CRC，很久以来就开始寻求用于危险评估和CRC早期检测的生物标记。危险评估和早期检测之间的差异是关于获得性CRC确定性的程度。用于危险评估的生物标记在一时间间隔内赋予低于100％的CRC确定性，而用于早期检测的生物标记在特定的时间间隔内赋予疾病发作的几乎100％的确定性。危险因子可以用作未诊断患有癌症的个体的替代终端(surogate endpoint)，条件是在所述替代终端和确定的结果之间存在确定的关系。确定的CRC终端的实例是腺瘤性息肉的实例。已经确定的是，对于后来发展CRC的个体，腺瘤性息肉的发生是必要非充分条件。这由这样的事实证明，即，所有侵入前癌症损伤的90％是腺瘤性息肉或先兆，但是不是所有具有腺瘤性息肉的个体后来都继续发展成CRC。

腺瘤性息肉已经被确定为CRC的替代终端，并且腺瘤性息肉是通过结肠镜检或乙状结肠镜肉眼可确认的。在这样的侵入性方法中，组织活检样品可以取自用于组织的组织学评估的息肉或损伤。本文公开的分子诊断方法用于大体上看起来正常的结肠黏膜细胞，其不是来自肉眼可确定的息肉或损伤。然而，正如在本文中进一步公开的那样，侵入性方法不必用来获得患者样品用于组织学评估。非侵入性或最低程度侵入性方法可以用来获得，例如，血液样品、粪便样品、或大体上看起来正常的直肠细胞的擦拭取样，在这些样品上可以进行分子诊断检测以评估CRC的存在或不存在。对于CRC早期检测的早先描述的方法没有公开大体上看起来正常的结肠黏膜细胞(直肠细胞的组织活检或擦拭取样)、血液样品和/或粪便样品的非侵入性或最低程度侵入性的收集，之后进行分子和/或蛋白表达诊断检测，其可以在表明CRC是显而易见的任何不利组织学变化之前检测到组织中的变化。

图1是给出本公开内容中包含的序列表概述的表格。图1的表格列出实施本公开发明所用的一组生物标记。生物标记组的一个实施方案是由SEQ.ID NOs 1-16给出的16个确定的编码序列，而生物标记组的另一个实施方案是由SEQ.ID NOs 17-32给出的16个确定的蛋白序列。这两个实施方案代表为CRC早期检测提供必要的选择性和灵敏性的分子标记组。应该理解，所述序列表中所述的生物标记的片段和变体也是用于CRC早期检测的实施方案组中的有效生物标记。片段意指在序列表中的多聚核苷酸或多肽的任何不完整或分离的片段。此外，应该认识到，几乎每天都要宣布关于基因变体，特别是处于热点研究中的那些基因，诸如参与疾病如癌症的基因的新发现。因此，给出的序列表对于现在报道的基因是示例性的，但是应该认识到，出于分析方法学目的，基因的变体及它们的片段也包含在内。

在图1中，表格中第1-16项是生物标记组的一方面，其为多聚核苷酸编码序列，并且包括基因的命名和缩写。图1的第17-32项是生物标记组的另一个实施方案，其为与第1-16项的编码序列相对应的蛋白或多肽、氨基酸序列。由国家卫生研究院(National Institutes of Health(“NIH”))定义的生物标记是具体的生物特征的分子指示剂；可以用来测定疾病进展或治疗效果的生物化学特征或方面。生物标记组是生物标记的选择，其综合在一起可以用来测定疾病进展或治疗效果。生物标记可以是各种种类的分子。如先前所提到的，存在对于具有有效用于CRC早期检测所需的选择性和灵敏性的CRC生物标记的需求。因此，本文所公开的一个实施方案是选择一套在提供CRC早期检测根据中区分的有效的生物标记。

在本公开内容的一方面，对于CRC的早期检测，从通过非侵入性或最低程度侵入性方法取自患者的样品的细胞而确定由SEQ.ID NOs 1-16显示的多聚核苷酸的表达水平。考虑的方法包括血液取样、粪便取样和直肠细胞擦拭取样或活组织检查。在本领域内，多聚核苷酸表达水平的这样的分析通常叫作基因表达分布作图。对于基因表达分布作图，测定样品中mRNA水平作为生物状态的主要指示因子——在这一情形中，作为CRC的指示因子。对于分析基因表达分布作图的一种最常见的方法是，使用已知为反转录的方法从生物样品(所述样品通过非-或者最低程度侵入性方法取自上文公开的患者)的mRNA产生多个拷贝。在反转录方法中，通过本领域公知的方法，将样品的mRNA从生物样品细胞分离。然后，将所述mRNA用于产生mRNA最初从其转录的对应的DNA序列拷贝。在反转录扩增过程中，产生的DNA拷贝在基因中没有调控区(即，内含子)。因此，这些由mRNA制成的多个拷贝叫作“cDNA”，其代表互补的或复制的DNA。第33-64项是成套的引物，其可以用于在第1-16项列出的每种生物标记的反转录过程。SEQ.ID NOs 1-64中确定的所有核苷酸和氨基酸生物标记序列可以在附上的打印输出中找到，并且包括本申请的主旨，并且可以在磁盘上找到，所述磁盘作为本申请的一部分包含于此并且通过参考结合于此。

由于反转录方法与样品中初始mRNA水平成比例地扩增cDNA拷贝，它已经成为允许鉴定并且量化生物样品中存在的即使低水平的mRNA的标准方法。在任何具体的生物状态，基因可以被增量调控或减量调控，并且因此mRNA水平据此转变。

在本公开内容的一方面，基因表达分布作图的方法包括，在通过非-或最低程度-侵入性方法，诸如血液取样、粪便取样、直肠细胞擦拭取样、和/或直肠细胞组织活检而从患者采取的生物样品中，选自SEQ.ID NOs.1-16的生物标记组的至少2种生物标记的cDNA水平的定量测量。采取的组织不必是明显患病的；实际上，本公开的发明考虑用于评估即使大体上看起来正常(grossly normal-appearing)的细胞而进行CRC检测。这样的基因表达分布作图方法需要使用引物、酶和用于cDNAs制备、检测和定量的其它试剂。从样品mRNA产生cDNA的方法叫作反转录酶聚合酶链式反应(“RT-PCR”)。SEQ.ID NOs 33-64列出的引物特别适用于基于生物标记组中公开的生物标记应用RT-PCR进行基因表达分布作图。应用Primer Express Software(Applied Biosystems，Foster City，CA)设计了一系列引物。选择特殊的候选，然后检测证实只有cDNA得到扩增而没有受到基因组DNA的污染。据此，特别设计、选择并且检测了SEQ.ID NOs 33-64列出的引物。

在后来从分离的细胞RNA产生cDNA的步骤中，SEQ.ID NOs 33-64列出的引物是重要的，用于在实时PCR中定量地扩增目的基因表达产物的拷贝。最理想的引物序列和最理想的引物长度是引物设计的主要考虑。最理想的引物序列可以影响引物与模板结合的特异性和灵敏性。认为18-30个碱基的引物长度是最理想的范围。理论上，18个碱基是代表独特序列的最短长度，其在大多数真核基因组中将在唯一一个位置杂交。SEQ.ID NOs 33-64列出的引物在引物长度上在21-27个碱基范围，并且设计和有效用来扩增选自SEQ.ID NOs 1-16的核苷酸组的cDNA。引物的特异性通过在10％聚丙烯酰胺凝胶电泳(“PAGE”)上的单一产物，和PCR产物的单一解离曲线而证明。

一旦引物已经设计，并且验证了特异性，它们可以大量合成，并且保存以便方便地用于将来应用。由于PCR反应对缓冲液浓度和缓冲液组成敏感，所以引物应该保持在不干扰扩增反应的适宜的稀释剂中。适宜的稀释剂的一个实例是10mM Tris缓冲液，有或无1mM EDTA，这取决于对于EDTA的检测灵敏性。备选地，用于引物的另一适宜的稀释剂的实例是没有核酸酶的去离子水。引物可以等分在适当的容器中，诸如硅化管中，并且如果需要的话将其冻干。液体或冻干的样品优选地保存在定义为生物样品长期保存的冷藏温度，在约-20℃到约-70℃。扩增反应中引物的浓度典型地在0.1-0.5mM。从储液到最终反应混合物的典型的稀释因子约10倍，以便等分的引物储液典型地在约1和5mM之间。

除了SEQ.ID Nos.33-64列出的特别设计的引物外，对于RT-PCR还需要下列试剂，例如含有二核苷酸三磷酸混合物的试剂，其具有全部4种二核苷酸三磷酸(例如，dATP，dGTP，dCTP和dTTP)，具有反转录酶的试剂，和具有热稳定性DNA聚合酶的试剂。另外，对于RT-PCR过程还需要缓冲液、抑制剂和激活剂。

图2描述用于CRC早期检测的生物信息学数据减少方法的一方面，其显示17名对照(左)的Mahalanobis距离分布，其与14名具有CRC家族病史的个体(中)和24名患有息肉的个体(右)相比较。使用选自SEQ.ID NOs.1-16的多聚核苷酸的生物标记组，评估从大体上看起来正常的结肠黏膜组织采取的组织样品。对于每一对照和检测受试者，关于由选自SEQ.ID NOs 1-16的多聚核苷酸代表的16种基因的每一种的基因表达水平的平均数在log base 2域计算。然后，基于多变量的正态分布，为对照确定16维空间的多变量平均数，以确定正常表达水平的界限。对于每一对照，测定其它16个对照的多变量平均数的Mahalanobis距离(“M-dist”)，而对17个对照的多变量平均数确定每一名检测受试者的M-dist。在图2显示的每一组中，来自单一个体的所有组织活检形成垂直的一排。对于患有息肉的个体，星号标记来自患有增生性息肉的个体的组织活检。水平线表示具有16自由度的-卡方分布的95％ile。在这一线上的所有值(对应约25的M-dist)在p＜0.05水平上不同于对照的平均值。所述数据清楚地表明，在检测受试者的大体正常的结肠黏膜组织样品中存在改变的基因表达模式。因此，所述数据证明使用选自SEQ.ID NOs.1-16的多聚核苷酸的生物标记组的诊断检测的增强的灵敏性和选择性。

图3显示使用选自SEQ.ID Nos.1-16的多聚核苷酸的表达分布作图用于评估所分析的样品数据的生物信息学方法的一方面的流程图300。使用选自SEQ.ID Nos.1-16的多聚核苷酸组，用于分析分子诊断检测的基因表达数据的生物信息学分析的目的是使用异常(abnormality)的单一的、易于计算的测定。由于综合看来多变量分析确定所有表达水平变化的显著性，所以需要通过多变量分析对选自SEQ.ID NOs 1-16全体的所有基因的表达模式进行分析。存在一些种类的多变量检测，其可以有效用于生物信息学分析，所述生物信息学分析用于评估使用本文公开的分子诊断检测而检测的患者样品中结肠直肠癌的存在或不存在。用于评估使用选自SEQ.ID NOs 1-16的多聚核苷酸生物标记组而检测的患者样品数据的多变量分析的实例包括ANOVA和Mahalanobis距离(“M-Dist”)检测。

ANOVA是解释表达水平间的相互关系的通用检测。对于多变量ANOVA检测有必要基于Wilks′λ标准，并且在使用选自SEQ.ID NOs 1-16的多聚核苷酸组进行分子诊断检测获得的数据的log(base 2)值上进行，以获得值的正态分布。

M-dist分析是多变量分析的另一实例，考虑到每种基因表达的可变性和基因对之间的相关性，其以单一数字总结了两种基因表达模式之间的不同。M-dist通常以多元数据用作局外人(显著不同于组中所有其它个体病例的个体病例)的检测。M-dist可以通过参考具有等于变量(即，基因)数目的自由度的-卡方分布而转换成p-值。然而，为了避免对于假定的多变量常态的依赖性，需要使用秩和检验，Mann-Whitney检验，比较个体病例(即，患有息肉的那些)和对照的M-dist。通过使用Mann-Whitney分析，关于表达模式的差异的推论不依赖于多变量常态的假设。因此，这一方法允许综合起来的所有试验受试者表达水平的显著性的确定，以及每个个体表达值的显著性的确定。

下文提供了上述公开内容的一个工作实例。Hao，C-Y，等.，Alterationof Gene Expression in Macroscopically Normal Colonic Mucosa fromIndividuals with a Family History of Sporadic Colon Cancer，11 Clin.CancerRes.，1400-07(Feb.15，2005)。提供所述实例作为本领域普通技能的实践者的进一步指导，并且不能以任何方式解释为本发明的限制。

采用这一实例研究，在没有发展结肠癌但是由于CRC家族病史而处于患有结肠癌的高危险中的个体的形态正常的结肠黏膜(“MNCM”)中，一些基因的表达是否改变。

人受试者

在访问California Pacific Medical Center(“CPMC”)的个体的常规结肠镜检时，进行直肠和乙状结肠的MNCM组织活检，所述个体没有结肠癌病史或先前的结肠癌，并且在检查时没有腺瘤性息肉、结肠癌或其它结肠性损伤。本研究包括了12名在第一级亲属中具有结肠癌家族病史的个体(表3)和16名没有已知结肠癌家族病史的个体。尽管家族癌症病史的信息通过患者的自我报告获得而没有从医院癌症登记处得到证实，但是，最近的研究已经证实了关于结肠癌的自我报告家族病史的准确性。在具有结肠癌家族病史的12名个体中，2名是母女(表3中的病例#6和7)，2名是姐弟(病例#11和12)，其余的是不相关的。在具有结肠癌家族病史的组中，研究的受试者年龄在18-64岁范围，对照组在16-83岁(16岁的受试者由于慢性腹痛已经进行了结肠镜检)。获得研究的正常组织活检样品的研究流程得到CPMC Institutional Review Board的认可。对于所有的研究受试者进行获得被告知内容的适当的方法。

RNA和cDNA的提取和制备

将从盲肠和肝弯曲部之间的结肠片段获得的组织活检样品分类为升结肠样品；从肝弯曲部和脾弯曲部之间的结肠片段获得的那些样品分类为横结肠样品；从低于脾弯曲部的结肠片段获得的那些样品分类为降结肠；从低于降结肠的结肠蜿蜒部分获得的那些样品分类为直肠乙状结肠样品(从直肠约5-25cm)。从每个患者获得的组织活检样品数目不同。除了从家族病史组的一名受试者的横结肠片段和降结肠片段只获得1份样品外，从每个结肠片段获得2-8份组织活检样品。从12名具有结肠癌家族病史的个体中总共获得39份升结肠样品、37份横结肠样品、45份降结肠样品和77份直肠乙状结肠样品；从16名没有结肠癌家族病史的个体总共获得53份升结肠样品、48份横结肠样品、49份降结肠样品和104份直肠乙状结肠样品。将所有的组织活检样品在干冰上速冻，并且立即拿到实验室进行所述RNA制备和反转录。

基因表达分析

通过定量RT-PCR分析下列各项的表达水平：癌基因c-myc，CD44抗原(“CD44”)，环加氧酶1和2(“COX-1”和“COX-2”)，cyclin D1，cyclin-依赖型激酶抑制因子(“p21^cip/waf1”)，白介素8(“IL-8”)，白介素8受体(“CXCR2”)，骨桥蛋白(“OPN”)，黑素瘤生长刺激活性(“Groα/MGSA”)，GRO3癌基因(“Groγ”)，巨噬细胞集落刺激因子1(“MCSF-1”)，过氧化物增殖性激活受体，α，δ和γ(“PPAR-α，δ和γ”)和血清淀粉样A1(“SAA1”)。进行定量RT-PCR。简要地，当积累的PCR产品超过任意定的阈值时，记录循环数(“C_T值”)。为了使这一值标准化，将ΔC_T值确定为检测的每种基因的C_T值和β-肌动蛋白的C_T值之间的差别。计算对照组中每种基因的平均ΔC_T值。将ΔΔC_T值确定为每份个体样品的ΔC_T值和从对照样品获得的这一基因的平均ΔC_T值之间的差别。然后，按所述那样，将这些ΔΔC_T值用来计算相对基因表达值。(Applied Biosystems，User Bulletin #2，December 11，1997)。当可以得到cDNA样品时，所有的PCR一式两份进行。还应用组氨酰-tRNA合成酶作为内部对照而验证所述结果。应用β-肌动蛋白或his-tRNA合成酶作为参照，相对基因表达值产生相似的结果。这里应用β-肌动蛋白作为标准化对照获得统计学分析。

统计学分析

在具有结肠癌家族病史的个体和没有结肠癌家族病史的对照组受试者之间比较基因表达模式。不是独立地检验每种基因的表达和通过减少统计指数(statistical power)的方法调整多重比较，我们通过具有Wilks′λ标准的差异多变量分析(“MANOVA”)而检验所有基因的表达模式。这一检测是用于差异单变量分析的F-检验的多变量类似物，其检验平均值的等同性。这种类型的分析考虑了基因表达水平间的相互关系，并且通过基于子集中的所有基因提供表达模式是否在组与组之间不同的单一检验而控制假阳性率。

通过存在表达模式在组与组之间不同的证据，那么我们应用单一变量t-检验来确定哪些基因对综合差异起作用。由于完成正态分布需要这一转化，所以，所有的MANOVA检验基于Wilks′λ标准，并且在表达水平的log(base 2)上进行。我们的数据由每组(家族病史对没有家族病史)不同数目个体的每名受试者的不同数目的样品组成。分析包括关于组内个体的和关于个体内样品的随机effects terms，以说明取样方案。如果Y_ijk表示第i组的第j名患者的第k份样品的log2基因表达值，那么统计学模型通过下列方程数学表示：Y_ijk＝M+A_i+B_ij+e_ijk，其中A_i是(固定的)组effect，B_ij是(随机的)患者effect，和e_ijk是患者effect内的(随机)样品。

通过用值1定义来自升结肠的样品的变量，值2定义来自横结肠的样品的变量，值3定义来自降结肠的样品的变量，和值4定义来自结肠的直肠乙状结肠部分的样品的变量，我们还检测了微分式的数量级(在式上或式下)是否从升结肠部分到直肠沿着结肠增加。将这一变量添加到模型中，以便可以应用单一变量ANOVA检测到它对某些基因的影响。

截断点的定义

将来自对照组所有组织活检样品的表达水平的log(base 2)用来计算每种基因增量调控或减量调控的截断点。正态分布的公差限度表用来定义截断点，以致对于增量调控的基因，不大于P的分布部分将高于截断点，或者对于减量调控的基因低于截断点。通过截断点＝平均值+k(SD)定义每个截断点，其中平均值和SD(标准偏差)基于对照组的值。k值在表中找到，并且取决于P值和正常样品的数目。Owen，D.B.，Noncentral t andtolerance limits，in Brimbauim ZW，ed.Handbook of Statistical Tables，Reading，MA：Addison-Wesley，1962，108-127。假定每种基因表达水平的高斯分布，人们可以预计少于1％的来自正常群体的活组织切片具有超过99％公差极限(p＝0.01)的表达水平。

为了计算在每种情形中高出99％ile观察到的样品数目是由于偶然性的可能性，我们应用二项式分布法，p＝0.01和n＝每种情形样品数目乘以检测的基因数目。例如，对于病例#1(表3)，我们具有2份样品；二者都表现出PPAR-γ和SAA1的异常表达，二者之一对于PPAR-δ表达异常，并且没有一个对于IL-8和COX-2是异常的。因此，对于这一病例，10份检测的样品中有5份超过上限0.01。这是偶然发生的可能性是2.4×10^-8。通用公式给出如下：

\Pr {x &GreaterEqual; k | p, n} = Σ_{i = k}^{5 n} {(0.01)}^{i} {(0.99)}^{5 n - i},

其中k是超过99％ile的数目和n是样品数目(检测的基因数目是5)。

结果

在具有结肠癌家族病史的个体的直肠乙状结肠黏膜中的改变的基因表达：

12名个体(10名女性和2名男性)组成具有结肠癌家族病史的组；16名个体(9名女性和7名男性)作为对照组。(表1)对于16种基因的表达水平，我们总共分析了92份升结肠样品，85份横结肠样品，94份降结肠组织活检样品和181份直肠乙状结肠组织活检样品。已知这些基因的表达水平在人结肠癌晚期改变。我们还证明这些基因中的一些在结肠癌患者的手术切除的MNCM中改变。

继续参考表1，结果代表来自没有家族病史的16名个体的104份组织活检样品的分析，和来自具有结肠癌家族病史的第一级亲属的12名个体的77份组织活检样品的分析。按照方法中所述分析样品的基因表达。表中的数字代表相对于对照组平均MCT的表达水平。如果在个体间没有变化，对照组的正常基因表达水平应该等于1。应用Wilksλ标准的多变量分析在16种基因的log2表达值上进行，以确定两组之间的差异显著性。从最小到最大的P值将基因列出。

所有16种基因表达值的多变量分析表明，在来自具有和没有散发性结肠癌的那些患者的直肠乙状结肠区域的组织活检样品的显著差异(p＝0.01)。在这两组个体之间，在来自降结肠、升结肠和横结肠的组织活检样品的基因表达没有显著地不同(分别地，p＝0.06，0.22和0.52)。直肠乙状结肠组织活检样品的大部分差异仅由这些基因的5种(表1)提供：PPAR-γ，SAA1，IL-8，COX-2和PPAR-δ。与癌症患者的MNCM中基因表达的改变相似，我们发现，在具有散发性结肠癌家族病史的个体的MNCM中，SAA1、IL-8和COX-2的表达水平得到增量调控，和PPAR-γ与PPAR-δ的表达水平得到减量调控。

大概是由于在具有结肠癌家族病史的组中需要早期进行结肠镜检的增强的意识，家族病史组的平均(±SD)年龄(45±12岁)比对照组的(56±16岁)年轻。另外，在这两组之间存在性别差异(在具有家族病史组中10名女性和2名男性，相对于在对照组中的9名女性和7名男性)。然而，我们发现性别没有影响基因表达水平(p＝0.67)。并且，除了PPAR-δ0.01，在年龄和SAA1、IL-8、COX2和PPAR-γ的表达水平(所有的p＞0.05)之间没有相关性。然而，PPAR-δ的异常表达(减量调控)随着年龄增加。因此，在年轻的家族病史组和年老的对照之间的比较将倾向于在家族病史组中发现更少的而不是更多的异常表达。换句话说，我们可能低估PPAR-δ在家族病史组中的改变的表达的发生率。

表1.与对照相比，在来自具有结肠癌家族病史的个体的正常直肠乙状结肠组织活检样品中的基因表达水平

基因	对照(n＝104)		具有家族病史的患者(n＝77)		P值
基因	对照(n＝104)		具有家族病史的患者(n＝77)		P值		范围	平均值±(S.D.)	范围	平均值±(S.D.)
PPAR-γ	0.44-1.65	1.07±0.41	0.20-2.59	0.79±0.40	0.006		范围	平均值±(S.D.)	范围	平均值±(S.D.)
PPAR-γ	0.44-1.65	1.07±0.41	0.20-2.59	0.79±0.40	0.006	SAA1	0.17-22	2.16±3.67	0.33-2343	151±452	0.02
IL-8	0.14-13	1.71±1.94	6.84-13	6.84±2.82	0.02	SAA1	0.17-22	2.16±3.67	0.33-2343	151±452	0.02
IL-8	0.14-13	1.71±1.94	6.84-13	6.84±2.82	0.02	COX-2	0.17-18	1.82±2.75	0.24-30	5.11±9.01	0.07
PPAR-δ	0.39-2.66	1.11±0.48	0.16-2.22	0.89±0.46	0.07	COX-2	0.17-18	1.82±2.75	0.24-30	5.11±9.01	0.07
PPAR-δ	0.39-2.66	1.11±0.48	0.16-2.22	0.89±0.46	0.07	CD44	0.35-4.13	1.14±0.64	0.11-4.98	1.41±0.78	0.12
c-Myc	0.24-3.66	1.21±0.75	0.26-4.31	1.48±0.82	0.14	CD44	0.35-4.13	1.14±0.64	0.11-4.98	1.41±0.78	0.12
c-Myc	0.24-3.66	1.21±0.75	0.26-4.31	1.48±0.82	0.14	MCSF-1	0.38-22	1.81±2.59	0.20-11	2.04±2.19	0.21
Gro-α	0.01-51	2.61±5.48	0.34-57	5.76±11.63	0.22	MCSF-1	0.38-22	1.81±2.59	0.20-11	2.04±2.19	0.21
Gro-α	0.01-51	2.61±5.48	0.34-57	5.76±11.63	0.22	Gro-γ	0.16-35	2.18±4.29	0.12-41	2.55±5.91	0.25
P21	0.51-2.15	1.10±0.62	0.20-7.68	0.90±0.32	0.27	Gro-γ	0.16-35	2.18±4.29	0.12-41	2.55±5.91	0.25
P21	0.51-2.15	1.10±0.62	0.20-7.68	0.90±0.32	0.27	PPAR-α	0.31-2.38	1.09±0.55	0.26-2.21	1.00±0.40	0.54
CXCR2	0.22-13	1.45±1.78	0.43-4.44	1.49±1.55	0.55	PPAR-α	0.31-2.38	1.09±0.55	0.26-2.21	1.00±0.40	0.54
CXCR2	0.22-13	1.45±1.78	0.43-4.44	1.49±1.55	0.55	OPN	0.19-13	1.66±2.05	0.15-12	1.41±1.92	0.73
CyclinD	0.34-3.48	1.28±0.85	0.13-3.21	1.29±0.79	0.81	OPN	0.19-13	1.66±2.05	0.15-12	1.41±1.92	0.73
CyclinD	0.34-3.48	1.28±0.85	0.13-3.21	1.29±0.79	0.81	COX-1	0.27-5.97	1.21±0.85	0.25-2.63	1.09±0.51	0.87

对于“正常”基因表达的截断点比较

直肠乙状结肠样品中的相对基因表达水平在个体间不同，在从具有结肠癌家族病史的个体获得的样品中比来自对照的对应值多得多(表1)。因此，通过计算每种基因的截断点(p＝0.01)，我们应用对照组的每种基因的表达水平来定义每种基因的“正常”表达水平。图3显示基因PPAR-γ，IL-8，SAA1和COX-2的log(base2)表达值的分布以及它们的截断点。如预计那样，少于1％的来自对照组的组织活检样品具有高于或低于截断线的这些基因的表达(p＝0.01，图3)。然而，21％，12％和8％的来自家族病史组的组织活检样品分别具有高于截断点的SAA1、IL-8和COX-2的表达，并且12％的所述样品具有低于截断点的PPAR-γ表达(表2)。

表2.在正常个体和具有结肠癌家族病史的个体中，具有高于/低于截断点的基因表达的组织活检样品数目(N)

基因	来自正常对照的组织活检样品(n＝104)N(％)	来自具有家族病史的组织活检样品(n＝77)N(％)
基因	来自正常对照的组织活检样品(n＝104)N(％)	来自具有家族病史的组织活检样品(n＝77)N(％)	PPAR-γ	0	9(12％)
SAAI	0	16(21％)^*	PPAR-γ	0	9(12％)
SAAI	0	16(21％)^*	IL-8	0	9(12％)^*
COX-2	1(1％)^*	6(8％)^*	IL-8	0	9(12％)^*
COX-2	1(1％)^*	6(8％)^*	PPAR-δ	0	2(3％)
Gro-γ	1(1％)^*	2(3％)^*	PPAR-δ	0	2(3％)
Gro-γ	1(1％)^*	2(3％)^*	PPAR-α	0	2(3％)
Gro-α	0	0	PPAR-α	0	2(3％)
Gro-α	0	0	MCSF-1	1(1％)^*	0
OPN	1(1％)^*	0	MCSF-1	1(1％)^*	0
OPN	1(1％)^*	0	P21	0	0
CD44	1(1％)^*	0	P21	0	0
CD44	1(1％)^*	0	CXCR2	1(1％)^*	0

c-Myc
c-Myc	CyclinD	0	0
COX-1	CyclinD	0	0

具有低于截断点的基因表达水平

^*具有高于截断点的基因表达水平

具有改变的患者数目在表3中列出。

然后，我们分析了家族病史组中的每一个体(表3)。显示了表现出低于(对于PPAR-γ和δ)或者高于(对于IL-8、SAA1和COX-2)截断点的表达水平的组织活检样品数目。所有组织活检样品都表现出在正常范围内的表达水平的个体用(-)符号表示。在本研究中患有结肠癌的所有祖父母都是母方。当结肠癌得以诊断时家族成员的年龄表示如下：^***表示结肠癌在50岁之前得到诊断；^**表示在60岁之前；和^*表示在60岁后。当结肠癌得以诊断时其余家族成员的年龄不可获得。除了病例#10的患者父亲在20世纪70年代患肺癌之外，家族病史组中的12名患者没有一名在家族中报道其它类型的癌症。

如在表3中表示的，对于5种最常改变的基因，具有结肠癌家族病史的12名个体中的9名具有至少一种表达水平低于或者高于截断点的组织活检样品。2名个体(病例#1和2)在显然正常的直肠乙状结肠黏膜中具有3种这样的基因的改变的表达。相反，对照组16名个体中只有1名具有这5种基因中的一种的改变的表达(参见表2)。设定截断值，以便1％的表达将是假阳性。然而，从每个个体获得的组织获奖样品数目是不同的。为了调整样品数目，对于每一病例，我们还计算了在高于99％ile外观察到的样品数目是由于偶然性引起的可能性。这一计算是基于二项式分布。如表3中所示，在12名家族病史组个体中的7名中观察到的改变的基因表达不可能是由于偶然性引起(p＜0.01)。在这7个病例中，5种基因至少2种的表达被改变。另外，在分析的16种基因中，PPAR-γ和SAA1是在具有结肠癌家族病史的12名个体的5名中发生的最常改变的基因(表3)。

表3.PPAR-γ，IL-8，SAA1，COX-2和PPAR-δ在具有结肠癌家族病史的个体的直肠乙状结肠组织活检样品中表达的总结

病例	性别	年龄(岁)	患有癌症的家族成员	#分析的组织活检样品	PPAR-γ	SAA1	IL-8	COX-2	PPAR-δ	#改变表达的基因	由于偶然性改变的可能性
				#分析的组织活检样品	PPAR-γ	SAA1	IL-8	COX-2	PPAR-δ	#改变表达的基因	由于偶然性改变的可能性		#具有改变的表达的样品
				1	F	53	母亲^***	2	2	2	-		#具有改变的表达的样品							-	1	3	＜0.001
2	F	53	母亲^*	1	F	53	母亲^***	2	2	2	-	6	2	-	1	-	1	3	＜0.001	-	1	3	＜0.001
2	F	53	母亲^*	3	M	43	父亲^*	5	3	1	-	6	2	-	1	-	1	3	＜0.001	-	-	2	＜0.001
4	F	47	母亲^*	3	M	43	父亲^*	5	3	1	-	7	-	7	1	-	-	2	＜0.001	-	-	2	＜0.001
4	F	47	母亲^*	5	F	52	母亲	8	-	-	-	7	-	7	1	-	-	2	＜0.001	-	-	0	1
6	F	52	父亲和女儿^***	5	F	52	母亲	8	-	-	-	6	-	-	1	-	-	1	0.26	-	-	0	1
6	F	52	父亲和女儿^***	7	F	18	祖父和女儿^***	8	2	-	-	6	-	-	1	-	-	1	0.26	1	-	2	＜0.01
8	F	35	母亲^*和祖母	7	F	18	祖父和女儿^***	8	2	-	-	8	-	-	8	6	-	2	＜0.001	1	-	2	＜0.01
8	F	35	母亲^*和祖母	9	F	46	父亲^**	8	-	-	-	8	-	-	8	6	-	2	＜0.001	-	-	0	1
10	F	64	姐姐^*	9	F	46	父亲^**	8	-	-	-	6	-	1	-	-	-	1	0.26	-	-	0	1
10	F	64	姐姐^*	11	F	36	母亲和祖父	7	-	-	-	6	-	1	-	-	-	1	0.26	-	-	0	1
12	M	38	母亲和祖父	11	F	36	母亲和祖父	7	-	-	-	6	1	6	-	-	-	2	＜0.001	-	-	0	1
12	M	38	母亲和祖父	#具有改变的基因表达的个体					5	5	4	6	1	6	-	-	-	2	＜0.001	2	2

不同基因的表达在具有结肠癌家族病史的个体的MNCM的不同位点而改变。

家族病史组个体病例的分析表明，不同的基因在不同受试者的直肠乙状结肠组织活检样品中改变。例如，在病例#3中SAA1和PPAR-γ被改变，在病例#4中IL-8和SAA1被改变；而在病例#8中COX-2和IL-8而不是SAA1被改变(图4A)。另外，一些基因在同一患者的所有直肠乙状结肠组织活检样品中被改变(诸如病例#4中的SAA和病例#8中的IL-8)，而有些只在一些这样的组织活检样品中改变(即，病例#3中的SAA1和PPAR-γ，病例#4中的IL-8和病例#8中的COX-2)。另外，一些这样的改变局限于直肠乙状结肠区域，诸如病例#4中的IL-8；而一些可以扩展到结肠的其它区域，诸如病例#4中的SAA1(图4B)。

我们还观察到，对于PPAR-γ(p＝0.001倾向)和SAA1(p＜0.001)，而不是对于IL-8(p＝0.20)、COX2(p＝0.58)、也不是PPAR-δ(p＝0.54)，两组个体之间的基因表达的差异随着结肠的长度而增加。这些结果表明，在两组个体之间从升结肠到直肠部分沿着结肠存在增加的异常性，尽管在本研究中向升结肠部分的样品数目减少了，其仍可以被检测到。

从前述实例中，可以得出下述结论。大约5-10％的结肠直肠癌发生在患有2种常染色体显性遗传形式的结肠癌(家族性腺瘤性息肉病和遗传性非息肉结肠直肠癌)的一种的患者中，或者发生在患有炎性肠病的患者中(Burt R.，Peterson G.M.In：Young G.，Rozen，P.& Levin，B.Saunders，ed.inPrevention and Early Detection of Colorectal Cancer，Philadelphia，171-194(1996))。其余的结肠癌中，大约20％与结肠癌家族病史有关，结肠癌家族病史与发展结肠癌的2倍增加的危险相关(Smith R.A.，von EschenbachA.C.，Wender R.，等.，American Cancer Society guidelines for the earlydetection of cancer：update of early detection guidelines for prostate，colorectal，and endometrial cancers，and Update 2001--testing for early lungcancer detection，51 CA Cancer J Clin.38-75；quiz 77-80(2001))。尽管在家族性结肠直肠癌患者子集中已经报道了染色体15q13-14和9q22.2-31.2的连锁(Wiesner G.L.，Daley D.，Lewis S.，等.，A subset of familial colorectalneoplasia kindreds linked to chromosome 9g 22.2-31.2，100 Proc Natl Acad SciUSA，12961-5(2003))，但是大多数这些病例的遗传基础是未知的。在本研究中，我们已经证明了PPAR-γ、IL-8和SAA1在具有散发性结肠癌家族病史的患者的直肠乙状结肠MNCM中表达的本质改变，即使这些个体并没有可检测到的结肠异常。我们早先的研究表明，除了PPAR-γ、IL-8和SAA1之外，当与没有结肠癌、息肉和家族病史的正常个体相比时，在结肠癌患者的MNCM中，PPAR-δ、p21、OPN、COX-2、CXCR2、MCSF-1和CD44的表达也显著地改变了。这些观察表明，MNCM中与癌症发展相关的基因的改变的表达可能是一种结果性事件，并且可能比明显的形态学异常的出现发生地更早。例如，PPAR-γ、SAA1和IL-8的改变的表达可能发生在还没有发展结肠癌但是处于发展结肠癌的高对危险中的个体的MNCM中；而其它基因诸如PPAR-δ、p21、OPN、COX-2、CXCR2、MCSF-1和CD44的改变的表达，可能晚一些时候发生在已经发展了结肠癌的个体的MNCM中(Chen L-C，Hao C-Y，Chiu Y.S.Y.，等.，Alteration ofGene Expression in Normal Appearing Colon Mucosa of APCmin Mice andHuman Cancer Patients，64 Cancer Research 3694-3700(2004))。

已经在一些肿瘤的肉眼可见的正常组织中报道了遗传和后生的改变(Tycko B.，Genetic and epigenetic mosaicism in cancer precursor tissues，983Ann N Y Acad Sci.，43-54(2003))。例如，等位基因丢失已经在邻近初级乳腺癌的正常乳腺末端导管小叶中得到了证明。(Deng G.，Lu Y.，Zlotnikov G.，Thor A.D.，Smith H.S.，Loss of heterozygosity in normal tissue adjacent tobreast carcinomas，274 Science，2057-9(1996))。这样的等位基因丢失与局部复发的增加的危险性相关(Li Z.，Moore D.H.，Meng Z.H.，Ljung B.M.，Gray J.W.，Dairkee S.H.，Increased risk of local recurrence is associated withallelic loss in normal lobules of breast cancer patients，62 Cancer Res.，1000-3(2002))。另外，患有前结肠癌(prior colon cancer)个体的看起来正常的结肠黏膜细胞比没有患有前结肠癌的个体的黏膜细胞更能抵抗胆酸诱导的细胞程序性死亡(Bernstein C.，Bernstein H.，Garewal H.，等.，A bileacid-induced apoptosis assay for colon cancer risk and associated qualitycontrol studies，59 Cancer Res.，2353-7(1999)；和Bedi A.，Pasricha P.J.，Akhtar A.J.，等.，Inhibition of apoptosis during development of colorectalcancer.，55 Cancer Res.，1811-6(1995))。由于在结肠上皮细胞中细胞程序性死亡对于去除具有未修复的DNA损伤的细胞是重要的(Payne C.M.，Bernstein H.，Bernstein C.，Garewal H.，Role of apoptosis in biology andpathology：resistance to apoptosis in colon carcinogenesis，19 UltrastructPathol.，221-48(1995))，程序性细胞死亡的减少可能导致DNA-损伤细胞的滞留，并且增加致癌突变的危险。

在一些癌症中PPAR-γ受到减量调控。PPAR-γ的配体抑制细胞生长并且诱导细胞分化(Kitamura S.，Miyazaki Y.，Shinomura Y.，Kondo S.，Kanayama S.，Matsuzawa Y.，Peroxisome proliferator-activated receptorgamma induces growth arrest and differentiation markers of human coloncancer cells，90 Jpn J Cancer Res 75-80(1999))，并且在人结肠癌中已经报道了PPAR-γ失去功能的突变(Sarraf P.，Mueller E.，Smith W.M.，等.，Loss-of-function mutations in PPAR gamma associated with human coloncancer，3 Mol.Cell，799-804(1999))。因此，我们观察到的PPAR-γ在MNCM中表达的减量调控可能代表促进结肠上皮细胞生长和抑制细胞分化的早期事件。另外，PPAR-γ还负调控炎性应答(Welch J.S.，Ricote M.，AkiyamaT.E.，Gonzalez F.J.，Glass C.K.，PPAR gamma and PPAR delta negativelyregulate specific subsets of lipopolysaccharide and IFN-gamma target genesin macrophages，100 Proc Natl Acad Sci USA 6712-7(2003))。炎症通过刺激血管生成和细胞增殖而有利于肿瘤发生(Nakajima N.，Kuwayama H.，ItoY.，Iwasaki A.，Arakawa Y.，Helicobacter pylori，neutrophils，interleukins，andgastric epithelial proliferation，25 Suppl.1 J Clin Gastroenterol.，98-202(1997))。类似地，IL-8和急性期蛋白SAAl调控炎症过程(Dhawan P.，Richmond A.，Role of CXCL 1 in tumorigenesis of melanoma，72 J LeukocBiol.，9-18(2002)；和Urieli-Shoval S.，Linke R.P.，Matzner Y.，Expressionand function of serum amyloid A，a major acute-phase protein，in normal anddisease states，7 Curr Opin Hematol.，64-9(2000))。在患有炎性肠病个体的结肠黏膜中(Niederau C.，Backmerhoff F.，Schumacher B.，Inflammatorymediators and acute phase proteins in patients with Crohn′s disease andulcerative colitis，44 Hepatogastroenterology，90-107(1997)；和KeshavarzianA.，Fusunyan R.D.，Jacyno M.，Winship D.，MacDermott R.P.，Sanderson I.R.，Increased interleukin-8(IL-8)in rectal dialysate from patients with ulcerativecolitis：evidence for a biological role for IL-8 in inflammation of the colon，94Am J Gastroenterol.，704-12(1999))，在处于发展结肠癌的高度危险中的个体的结肠黏膜中(Bachwich D.R.，Lichtenstein G.R.，Traber P.G.，Cancer ininflammatory bowel disease，78 Med Clin North Am.，1399-412(1994))，已经报道了促炎细胞因子和急性期蛋白的增量调控。流行病学观察还表明，慢性炎症预先倾向于结肠直肠癌(Rhodes J.M.，Campbell B.J.，Inflammationand colorectal cancer：IBD-associated and sporadic cancer compared，8Trends Mol Med.，10-6(2002)；和Farrell R.J.，Peppercorn M.A.，Ulcerativecolitis，359 Lancet 331-40(2002))。因此，在具有散发性结肠癌家族病史个体和在患有炎性肠病的个体的正常黏膜中观察到的PPAR-γ的减量调控和IL-8与SAA1的增量调控，可能表明常规途径参与引起这2组的结肠肿瘤发生。

我们在具有结肠癌家族病史的一些个体的正常结肠黏膜中观察到的与癌症和炎症相关基因的改变表达，与最近的报道一致，最近的报道与在发展结肠癌前升高的血清C-活性蛋白(“CRP”)浓度相关(Erlinger T.P.，PlatzE.A.，Rifai N.，Helzlsouer K.J.，C-reactive protein and the risk of incidentcolorectal cancer.，291 JAMA，585-90(2004))。这些发现表明，在平均危险性个体(id.)中，炎症是发展结肠癌的危险因素。然而，CRP是炎症的非特异性标记，期可能指示在除结肠之外的组织中的炎症。在我们的研究中，我们分析了结肠癌发生的组织，并且将更加特异性地评估发展结肠癌的危险。

我们不知道哪种细胞型负责观察到的改变的基因表达。在结肠黏膜中存在许多细胞类型，包括一些类型的黏膜上皮细胞、基质细胞和血源性细胞。我们组和其他组的研究已经证明COX-2蛋白在MNCM中的增量调控主要位于渗透性巨噬细胞和次要地位于APC^min小鼠MNCM中异常隐窝病灶中的上皮细胞(Chen L-C，Hao C-Y，Chiu Y.S.Y.，等.，Alteration of GeneExpression in Normal Appearing Colon Mucosa of APC^min Mice and HumanCancer Patients，64 Cancer Research 3694-3700(2004)；和Hull M.A.，BoothJ.K.，Tisbury A.，等.，Cyclooxygenase 2 is up-regulated and localized tomacrophages in the intestine of Min mice，79 Br J Cancer，1399-405(1999))。从我们关于APC^min小鼠MNCM的早期研究中，可能由于分泌蛋白，诸如IL-8和SAA1，在组织切片上很快就消失(Chen L-C，Hao C-Y，Chiu Y.S.Y.，等.，Alteration of Gene Expression in Normal Appearing Colon Mucosa ofAPC^min Mice and Human Cancer Patients，64 Cancer Research 3694-3700(2004))，我们发现通过免疫组织化学染色检测在MNCM中增量-或减量-调控的基因产物是有技术难度的。由于有限数量的活体组织解剖样品和技术困难，我们不能进行免疫组织化学染色来证明引起改变的基因表达的细胞类型。如果绝对的RNA量是充分的，那么RNA原位杂交可以是确定改变的细胞位置的更好的方法。备选地，激光显微解剖之后进行RT-PCR可以能够确定包括的细胞类型。不管负责改变的基因表达的细胞类型，我们的结果证明，相对于没有结肠癌家族病史的正常个体，改变的基因表达存在于具有结肠癌家族病史的一些个体的正常结肠黏膜中并且这些个体已知具有形成结肠癌的增加的危险(Burt R.，Peterson G.M.In：Young G.，Rozen，P.& Levin，B.Saunders，ed.in Prevention and Early Detection ofColorectal Cancer，Philadelphia，171-194(1996))。

在直肠乙状结肠组织活检样品中具有改变的基因表达的患者中，一些患者在所有组织活检样品中都表现出改变(即，病例#4和12中SAA1的表达)，而有些患者只在一些组织活检样品中表现出改变的表达(即，病例#2和#3中的PPAR-γ，图2)。由于大多数样品用一式两份的多个基因进行评估，以确保cDNA的质量，所以，这样的异质性不可能由技术变化引起。我们推测这种异质性可能反映这些个体中“热点(hot spots)”的频率和/或分布。可能地，在所有直肠乙状结肠组织活检样品中具有改变的基因表达的个体可能在其直肠乙状结肠黏膜中具有广泛扩散的分子异常，而在一些组织活检样品中具有改变的表达的那些个体具有离散的热点。因此，在前组中的个体可能具有发展结肠息肉或结肠癌的综合趋势，而后组中的那些个体可能具有局部趋势。在这2组之间发展结肠癌或息肉的危险性是否不同还不清楚。另外，在具有家族病史组个体的直肠乙状结肠组织活检样品中观察到不同基因组合的改变的表达。这一观察表明，不同的分子途径可能参与结肠癌发生的早期阶段。在某些分子途径中改变的基因表达是否于息肉或癌症的更高的危险性相关还是没有确定。

与在散发性结肠癌患者和致癌物质处理的小鼠的远端结肠中有比在近端结肠中更多的隐窝病灶(前肿瘤结肠损伤)的报道一致(Shpitz B.，Bomstein Y.，Mekori Y.，等.，Aberrant crypt foci in human colons：distributionand histomorphologic characteristics，29 Hum Pathol.，469-75(1998)；和Salim E.I.，Wanibuchi H.，Morimura K.，等.，Induction of tumors in the colonand liver of the immunodeficient(SCID)mouse by2-amino-3-methylimidazo[4，5-f]quinoline(IQ)-modulation by long chain fattyacids，23 Carcinogenesis，1519-29(2002))，我们发现，基因表达中的大多数改变是在家族病史组的个体的远端结肠中发现的。我们推测，当大部分水分在大肠末端被重吸收后，与在其它结肠区域的黏膜相比，敏感个体的远端结肠黏膜可能暴露于更高浓度的存在于粪便中的外源物质，并且这样的暴露可能在这一区域引起更高概率的改变的基因表达。

我们已经证明，结肠癌家族病史，而不是年龄或性别，是为在这2组的直肠乙状结肠黏膜中观察到的基因表达差异负责的因素。可用信息没有显示在这2组患者间的饮食或药物治疗中的任何具体的不同。然而，不经过进一步研究，我们不能排除饮食或药物治疗影响基因表达的可能性。并不是所有具有结肠癌家族病史的个体都将发展结肠癌或结肠腺瘤性息肉(Smith，R.A.，von Eschenbach A.C.，Wender，R.，等.，American Cancer Societyguidelines for the early detection of cancer：update of early detectionguidelines for prostate，colorectal，and endometrial cancers，and Update2001-testing for early lung cancer detection，51 CA Cancer J.Clin.，38-75；quiz 77-80(2001).)。与这一临床观察一致，我们的分析还表明，不是所有具有结肠癌家族病史的个体都在MNCM中具有改变的基因表达。由于在本研究中分析的基因参与结肠癌的发展，我们猜测在MNCM具有改变的基因表达的个体可能比没有改变的基因表达的那些个体更容易发展息肉或癌症。为了验证这一假说，需要对大量研究受试者的远景调查。如果这样的相关性得到证实，可能通过应用直肠乙状结肠组织活检样品的基因表达分析而确定处于发展结肠癌的增加的危险中的个体。理论上，通过分析随机的MNCM样品，与具有局部改变的个体相比，更容易确定在MNCm具有综合改变的个体。然而，如果为应用多样品的分析选择适宜的基因组，那么它可能有充分的预测力来确定这样的患者。

现在来看图5，应用常规通用目的或专用的数字计算机和/或按照本公开内容的教导编程的处理器，这对于计算机领域的技术人员是显而易见的，可以实现图5的各个方面。基于本公开内容的教导，这对于计算机领域的技术人员是显而易见的，适宜的软件编码可以由熟练的程序员容易地制定。本发明还可以通过制定集成电路和/或通过将适宜的计算机电路网络相互连接而实现，这对于计算机领域的技术人员是非常显而易见的。

各个方面包括一种计算机程序产物，其是一种具有指示和/或存储于其上/其中的信息的存储介质，所述存储介质可以用于编程通用目的的或专用的计算处理器/装置，以完成本文描述的任何特征。存储介质可以包括但不限于，一种或多种的下列各项：任何类型的物理介质，包括软盘、光盘、DVDs、CD-ROMs、微驱动(microdrives)、磁光盘、全息照相存储装置、ROMs、RAMs、EPROMs、EEPROMs、DRAMs、PRAMS、VRAMs、闪存装置、磁或光卡、纳米-系统(包括分子记忆ICs)；纸或基于纸的介质；以及适用于存储指示和/或信息的任何类型的介质或装置。各个方面包括一种可以全部或部分并且越过一个或多个公共的和/或私人网络而传输的计算机程序产物，其中所述传输包括指示(instruction)和/或信息，其可以由一个或多个处理器用来完成本文所述的任何特征。在各个方面中，传输可以包括多种独立的传输。

保存在一种或多种计算机可读的介质(媒体)上，本公开内容包括控制通用目的/专用计算机和/或处理器的硬件，和使得所述计算机和/或处理器能够同人使用者或应用本发明结果的其它机械装置相互作用的软件。这样的软件可以包括但不限于，装置驱动器、操作系统、执行环境/容器、用户界面和应用软件。

编码的执行可以是直接的或间接的。编码可以包括汇编、翻译和其它类型的语言。除非另外由要求的语言所限定，编码的执行和/或传输和/或功能编码片段可以包括对其它软件或装置，局域的或远程的援引或调用，以行使所述功能。所述援引或调用可以包括对图书馆模块、装置驱动器和远程软件的援引或调用，以行使所述功能。援引或调用可以包括在分布式的和客户/服务器系统的援引或调用。

图6描述本公开内容的一个方面，其具有用于结肠黏膜细胞最低程度侵入性取样的擦拭取样和传送系统400。图6的系统400由药签410和容器420组成。容器420，诸如通过图6所示的这方面内容所描述的一种，被设置以稳定、提取并且保存结肠黏膜细胞样品，直到可以使用公开的生物标记组对样品进行CRC早期检测的诊断检测。

药签410具有从杆414末端延伸出来的头412。头410可以式许多形状，诸如椭圆形的、正方形的、矩形的、圆的等，并且沿着杆的末端具有约0.5cm-1.0cm的最大宽度，和约1.0cm-10.0cm的长度。头412可以由许多材料组成，诸如例如棉花、人造纤维、聚酯、和聚合物泡沫、或者这样的材料的组合。杆414由具有充分的机械强度和充分的弹性的材料制成，所述机械强度足以擦拭直肠区域，充分的弹性足以防止伤害。用于直肠药签的具有强度和弹性的杆材料的实例包括木材、纸和各种聚合物材料，诸如聚酯、聚苯乙烯、和聚氨酯、以及这样的聚合物的组合物。

容器420具有主体412和帽424。主体412可以具有各种长度和直径，以容纳上文所述的具有头412的大小和杆414的长度范围的药签410。容器的主体412可以由许多聚合物材料制成，诸如聚乙烯、聚丙稀、聚碳酸酯、聚碳氟化合物、或玻璃，而帽424典型地由理想的聚合物材料制成，诸如用于主体412给出的实例。容器420在底部具有试剂426，当作为最低程度侵入性取样技术进行直肠区域擦拭取样时，其适于稳定并且提取在药签410上收集的结肠黏膜细胞。另外，可以使用不需要药签410的容器420，其具有适于稳定并且从粪便样品提取结肠黏膜细胞样品的试剂426。

试剂426含有浓度至少约0.4M的缓冲的硫氰酸胍溶液，和浓度约0.1-10％的其它组织变性剂诸如生物表面活性剂。理想的生物表面活性剂可以是两性离子的，诸如CHAPS或CHAPSO，非离子的，诸如TWEEN，或任何烷基糖苷(alkylglucoside)表面活性剂，或离子的，诸如SDS。可以使用各种缓冲液，例如，通常已知为Good’s缓冲液的那些，诸如Tris。为了将试剂426有效地缓冲到约7.0-8.5的pH，缓冲液的浓度可能不同。

还考虑了使用如图6中公开内容的一方面的擦拭取样方式和传送系统400提取的样品可以进行处理，并且数据在使用上文公开的计算机硬件和软件的单一仪器中进行分析。即，从图6公开内容的一方面获得的样品可以按照图5在单一仪器中进行分析。然而，还考虑了患者的血液或粪便样品可以在单一仪器中进行分析。在一个实施方案中，所述仪器的一个方面是第一元件，其用于对患者样品进行RT-PCR，以进行基因表达分布作图，如上文所述那样。基因表达分布作图允许对SEQ.ID Nos 1-16的cDNA定量，所述cDNA是从患者样品细胞制备的mRNA反转录的。SEQ.ID Nos33-64的成套引物用于RT-PCR反应，以引发与SEQ.ID Nos 1-16对应的mRNA链，并且由此合成与SEQ.ID Nos 1-16对应的cDNA。

从RT-PCR获得cDNAs后，数据由所述仪器的第二元件进行比较，以控制已经存储在所述仪器的存储介质上的数据。应用软件使用上文公开的多变量分析，以执行ANOVA、M-Dist或其它多变量分析方式的指示。基于统计学分析，合格的诊断专家可以评估CRC的存在或不存在，CRC的进展，和/或CRC的治疗效果。

在本公开内容的另一方面，对于CRC的早期检测，可以使用单一仪器，进行患者样品的蛋白表达分布作图。术语“多肽(polypeptide)”或“多肽(polypeptides)”在本文中可以与术语“蛋白(protein)”或“蛋白(proteins)”互换地使用。如先前讨论的那样，已经对蛋白研究了很久，研究其作为生物标记的潜力，但是有很少的成功。作为多聚核苷酸生物标记的补充，蛋白生物标记存在有价值。使得信息由两种类型的生物标记提供的原因包括目前这样的观察，即，mRNA表达水平不是蛋白表达水平的良好的预报因子，和mRNA表达水平没有提供任何蛋白翻译后修饰的信息，而蛋白翻译后修饰对于其生物活性是关键的。因此，为了理解蛋白的表达水平，以及它们完整的结构，需要对蛋白进行直接分析。

本文公开的是在SEQ.ID NOs 17-32列出的蛋白，其与SEQ.ID NOs1-16表示的基因相对应。本公开发明的另一方面是确定SEQ.ID NOs.17-32表示的蛋白的表达水平。通过上文公开的非-或者最低程度侵入性方法提取的患者样品可以用来制备固定细胞或者样品细胞的蛋白提取物。用于蛋白表达分布作图的细胞可以通过图6的方法获得，或者备选地例如通过血液样品或粪便样品、或其它非侵入性或最低程度侵入性方法(或者当然通过更常规的侵入性方法，包括例如乙状结肠镜检和其它方法)而获得。

在所述仪器的第一元件中，细胞或蛋白提取物可以用一组针对所申请的全体生物标记的抗体——单克隆的或多克隆的——进行检测，以测定目的多肽的水平。所述检测的目的是检测并且定量与SEQ.ID NOs 1-16中生物标记的基因序列相对应的蛋白，即SEQ.ID NOs 17-32的表达。

在考虑到所述方法的本公开内容的一方面，基于生物标记组的抗体组的抗体可以结合到固体支持物上。用于蛋白表达分布作图的方法可以使用第二抗体，其具有针对某些结合的、目的多肽部分的特异性。这样的第二抗体可以用有效检测并且量化所结合的多肽的分子进行标记，并且因此在与所述多肽结合时，将其标记用于检测和定量。另外，考虑了其它试剂用于标记所结合的多肽以便检测和定量。这样的试剂可以直接标记结合的多肽，或者与第二抗体类似，可以是对具有标记的结合的多肽具有特异性的部分。这样的部分的实例包括但不限于小分子，诸如辅因子、底物、配位剂等，或大分子，诸如凝集素、肽、寡核苷酸等。这样的部分可以是天然存在的或合成的。

关于所公开的方法的检测方式的实例包括但不限于分光镜技术，诸如荧光和UV-Vis分光镜，闪烁计数和质谱。作为这些检测方式的补充，这些方法中应用的检测和量化目的的标记的实例包括但不限于发色团标记、闪烁标记和大量标记(mass labels)。使用这些方法在仪器的第二元件中测定的多聚核苷酸和多肽的表达水平可以相对于为目标确定目的确定的对照进行标准化。对照数据存储在计算机内，其为所述仪器的第三元件。

第四软件元件将从一名或多名患者样品获得的数据与对照数据相比较。比较将包括至少一种多变量分析，并且可以包括ANOVA、MANOVA、M-Dist和本领域的普通技术人员已知的其它方法。一旦统计学分析和比较进行并且完成，医师或其它合格的人员可以为一名或多名患者的CRC状况做出诊断。

现在来看本公开内容的药物筛选方面，应该意识到，本文公开的生物标记组是基因及其表达产物，已知它们参与下述代谢途径和过程：1)氧化压力/炎症；2)APC/b-联蛋白途径；3)细胞周期/转录因子；和4)参与细胞/细胞通信、生长、修复和对损伤和外伤应答的细胞因子和其它因子的作用。存在越来越多的证据，这些途径，并且因此本生物标记组的成员还参与除CRC外的许多其它种类的癌症，诸如肺癌、前列腺癌和乳腺癌，以及神经退行性疾病，诸如阿尔茨海默病和肌萎缩性侧索硬化症(“ALS”)。在这样的病理中，参与这些途径的基因及其表达产物对于许多不同类型的细胞的生长、维持和压力应答是基本的。在病理学如癌症和神经退化中，某些改变的基因的改变的表达导致一种或多种病理症状，以致这些基因及其表达产物的改变是所述具体病理的特征性生物标记。在这一方面，表面上不相关的病理，诸如各种癌症和神经退行性疾病，是非常复杂的病理的表现，所述每一种病理包括所述生物标记的离散的成员，所述生物标记是来源于上述途径和过程组的基因及其表达产物。作为这一点的实践证据，现在应该理解，COX-2抑制剂不但对于包括结肠癌和其它癌症的广泛种类的疾病，而且还对神经退行性疾病有治疗价值。

本文公开的是图1的主题生物标记组在药物发明方法中的应用，所述药物发现方法关于病理诸如癌症，例如CRC、肺癌、前列腺癌和乳腺癌，和神经退行性疾病，例如阿尔茨海默病和ALS。如上文提及的，改变的基因及其表达产物的离散模式为每种特殊的疾病提供了唯一的识别标记，所以所述组为各种病理提供了必需的选择性。药物意指用于病理治疗的任何治疗性药剂。这包括常规合成的分子、天然产物、合成修饰的天然产物、和生物制药产物、诸如多肽和多聚核苷酸、以及它们的组合、提取物和制剂。

药物筛选是叫作药物发明期的药物开发的第一阶段。通过药物筛选过程合格的有希望的药物典型地叫作leads，也就是说，当通过筛选过程的标准时，它们是先进的，进一步在通常叫作lead最优化(lead optimization)的药物发明阶段进行检测。如果通过药物发明的lead最优化阶段，所述leads就是合格的候选，并且优先越过药物发明阶段到叫作预临床试验的药物开发的下一阶段，并且被称为研究性新药(“IND”)。如果所述IND是先进的，那么它优先进行临床试验，在这种情形中它在人受试者中进行检验。最后，如果所述IND通过临床试验阶段表现的有希望，那么在FDA正式批准后，它可以被商业化。已知对于单一候选的整个药物开发过程要花费10-15年，和数百万美元的开发费用。由于这一原因，药物开发机构目前的策略是集中在药物发明阶段，有效地找出有希望的药物，并且只将具有高成功潜力的候选进一步通过余下的药物开发周期。

在药物发明的筛选阶段，评估有希望的药物的特异性检测针对合格的生物模型系统进行，为其监测特异性的终端。用作关于病理诸如癌症，例如CRC、肺癌、前列腺癌和乳腺癌，和神经退行性疾病例如阿尔茨海默病和ALS的药物筛选的替代终端的生物标记组，不但是有效用于这样的病理的早期检测的组，而且还表现出这样的调控，即，所述调控通过药物以与病理发生或复发减少相关的方式进行。另外地，有效用于这样的病理的早期检测的生物标记组的一个或多个成员，还可以用作对于这样的病理的药物筛选的目标。随后要讨论，图1所述的生物标记可以用作模式生物系统的替代终端，以及药物筛选的目标。

在筛选阶段，可以评估大文库的有希望的药物，代表在单一筛选方案中数万种化合物的通量。视为低通量筛选(“LTS”)的为约10,000-约50,000种有希望的药物，而中等通量筛选(“MTS”)代表约50,00-约100,00种有希望的药物，并且高通量筛选(“HTS”)是100,000-约500,000种有希望的药物。

筛选方案的意思包括进行筛选的检测流程和分析方法。那么，筛选方案包括下列因素，诸如将要用于所述检测的生物模型的类型；进行检测的条件；要用的有希望的药物候选或有希望的候选的文库的类型；要使用的设备的类型；和数据收集、处理和存储的方式。筛选方案——LTS、MTS或HIS——的规模受到下列因素的影响，诸如检测流程(例如，检测类型)、分析方法(例如，小型化、自动化)、以及计算能力和容量。生物模型系统的意思包括全部生物体、全部细胞、细胞裂解物和目标分子。在考虑治疗应用时，有希望的药物候选的意思是任何类型的分子或分子制剂或混悬液。例如，有希望的药物候选可以是合成的分子、天然产物、合成修饰的天然产物、和生物制药产物、诸如多肽和多聚核苷酸、以及它们的组合、提取物和制剂。

如上文所讨论的那样，图1提供用于实践本公开发明的生物标记组的序列表。本公开内容的一方面是SEQ.ID NOs 1-16给出的16种确定的编码序列的生物标记组，而生物标记组的另一方面是SEQ.ID NOs 17-31给出的16种确定的蛋白。本发明的这两方面提供了病理早期检测所需要的选择性和灵敏性，所述病理诸如癌症，例如CRC、肺癌、前列腺癌和乳腺癌，和神经退行性疾病，例如阿尔茨海默病和ALS。

如先前提及的那样，CRC是关于新药开发的一种典型的病理。对于CRC，还没有确定对于CRC早期检测具有可接受的高度选择性和灵敏性的生物标记或生物标记组。因此，图1所述的是在为CRC早期检测提供基础中分化的生物标记组的方面。临床定义的生物标记的选择性是指正确诊断的患者百分数。临床内容中的生物标记的灵敏性定义为疾病在可治愈阶段被检测出来的可能性。理想地，生物标记将具有100％的临床选择性和100％的临床灵敏性。到目前为止，还没有确定这样的生物标记或生物标记组，其具有有效用于患者护理管理的宽范围需求所需要的可接受的高度的选择性和灵敏性。

进行筛选的分析方法可以包括上文公开的用于CRC早期检测方法，即，从生物样品的mRNA进行基因表达分布作图，以确定生物标记的基因表达，和它们的表达水平怎样受到有希望的药物候选的影响(包括使用RT-PCR)，和/或由于应用有希望的药物候选引起的图1多肽生物标记的蛋白表达水平；然后应用多变量统计学分析来确定，使用和不使用所述有希望的药物候选，组中各种标记的表达水平的统计学显著性。

参考图7，药物筛选公开内容的一方面考虑获得组织样品，诸如擦拭样品(见图6)、血液样品或组织活检，所述样品可以通过，例如，最低程度侵入性的、侵入性的或非侵入性的方法提取。可以使用适宜的裂解缓冲液来提取并且保存组织样品中细胞的RNA。然后，可以在提取的RNA上进行RT-PCR，并且转化成cDNA，如上文公开的那样，使用，例如至少2条SEQ.ID NOs 33-64列出的对图1的生物标记组特异的引物，来筛选药物的作用效果。然后，检测的结果可以进行多变量分析和M-dist，如上文所述那样，并且将结果与对照数据进行比较。

图8描述药物筛选公开内容的另一方面，其中制备针对SEQ.ID NOs17-32列出的至少2种生物标记蛋白的抗体，并且将所述抗体用来从例如上文列出的组织活检和其它组织样品中检测生物系统，例如，全细胞、细胞裂解物等。所述抗体用于检测并且量化SEQ.ID NOs 17-32确定的生物标记肽的表达，以致这些生物标记肽的表达可以作为给所述生物系统定量给予潜力药物的函数而进行监测。结果可以进行多变量和单一变量分析和M-dist.，如上文公开的那样，并且与对照数据进行比较。

出于举例说明和描述的目的提供本文公开的内容。不是意欲穷尽或者将公开的内容局限在所述的精确形式上。对于本领域熟练的实践者，许多改进和变化是显而易见的。为了更好地解释所述技术公开的实施方案的原理和实践应用，因而使得本领域的其它技术人员能够理解适于考虑的具体应用的各种实施方案和各种改进，选择并且描述了公开的内容。

上文引用的参考文献通过参考完全结合于此。

序列表

<110>南希.M.李

<120>用于结肠直肠癌早期检测的药物筛选和分子诊断检测：试剂、方法及其试剂盒

<130>NLEE-01001WO0 MCF/MLB

<150>60/614,746

<151>2004-09-30

<150>60/651,344

<151>2005-02-08

<150>Not Assigned

<151>2005-09-29

<160>64

<170>PatentIn version 3.3

<210>1

<211>1629

<212>DNA

<213>人

<400>1

gcagagcaca caagcttcta ggacaagagc caggaagaaa ccaccggaag gaaccatctc 60

actgtgtgta aacatgactt ccaagctggc cgtggctctc ttggcagcct tcctgatttc 120

cgcagctctg tgtgaaggtg cagttttgcc aaggagtgct aaagaactta gatgtcagtg 180

cataaagaca tactccaaac ctttccaccc caaatttatc aaagaactga gagtgattga 240

gagtggacca cactgcgcca acacagaaat tatgtaaagc tttctgatgg aagagagctc 300

cgtctggacc ccaaggaaaa ctgggtgcag agggttgtgg agaagttttt gaagagggct 360

gagaattcag aattcataaa aaaattcatt ctctgtggta tccaagaatc agtgaagatg 420

ccagtgaaac ttcaagcaaa tctacttcaa cacttcatgt attgtgtggg tctgttgtag 480

ttgccaga tgcaatacaa gattcctggt taaatttgaa tttcagtaaa caatgaatag 540

cttttcattg taccatgaaa tatccagaac atacttatat gtaaagtatt atttatttga 600

atctacaaaa aacaacaaat aatttttaaa tataaggatt ttcctagata ttgcacggga 660

gaatatacaa atagcaaaat tgaggccaag ggccaagaga atatccgaac tttaatttca 720

ggaattgaat gggtttgcta gaatgtgata tttgaagcat cacataaaaa tgatgggaca 780

ataaattttg ccataaagtc aaatttagct ggaaatcctg gatttttttc tgttaaatct 840

ggcaacccta gtctgctagc caggatccac aagtccttgt tccactgtgc cttggtttct 900

cctttatttc taagtggaaa aagtattagc caccatctta cctcacagtg atgttgtgag 960

gacatgtgga agcactttaa gttttttcat cataacataa attattttca agtgtaactt 1020

attaacctat ttattattta tgtatttatt taagcatcaa atatttgtgc aagaatttgg 1080

aaaaatagaa gatgaatcat tgattgaata gttataaaga tgttatagta aatttatttt 1140

attttagata ttaaatgatg ttttattaga taaatttcaa tcagggtttt tagattaaac 1200

aaacaaacaa ttgggtaccc agttaaattt tcatttcaga taaacaacaa ataatttttt 1260

agtataagta cattattgtt tatctgaaat tttaattgaa ctaacaatcc tagtttgata 1320

ctcccagtct tgtcattgcc agctgtgttg gtagtgctgt gttgaattac ggaataatga 1380

gttagaacta ttaaaacagc caaaactcca cagtcaatat tagtaatttc ttgctggttg 1440

aaacttgttt attatgtaca aatagattct tataatatta tttaaatgac tgcattttta 1500

aatacaaggc tttatatttt taactttaag atgtttttat gtgctctcca aatttttttt 1560

actgtttctg attgtatgga aatataaaag taaatatgaa acatttaaaa tataatttgt 1620

tgtcaaagt 1629

<210>2

<211>3356

<212>DNA

<213>人

<400>2

gtccaggaac tcctcagcag cgcctccttc agctccacag ccagacgccc tcagacagca 60

aagcctaccc ccgcgccgcg ccctgcccgc cgctgcgatg ctcgcccgcg ccctgctgct 120

gtgcgcggtc ctggcgctca gccatacagc aaatccttgc tgttcccacc catgtcaaaa 180

ccgaggtgta tgtatgagtg tgggatttga ccagtataag tgcgattgta cccggacagg 240

attctatgga gaaaactgct caacaccgga atttttgaca agaataaaat tatttctgaa 300

acccactcca aacacagtgc actacatact tacccacttc aagggatttt ggaacgttgt 360

gaataacatt cccttccttc gaaatgcaat tatgagttat gtgttgacat ccagatcaca 420

tttgattgac agtccaccaa cttacaatgc tgactatggc tacaaaagct gggaagcctt 480

ctctaacctc tcctattata ctagagccct tcctcctgtg cctgatgatt gcccgactcc 540

cttgggtgtc aaaggtaaaa agcagcttcc tgattcaaat gagattgtgg aaaaattgct 600

tctaagaaga aagttcatcc ctgatcccca gggctcaaac atgatgtttg cattctttgc 660

ccagcacttc acgcatcagt ttttcaagac agatcataag cgagggccag ctttcaccaa 720

cgggctgggc catggggtgg acttaaatca tatttacggt gaaactctgg ctagacagcg 780

taaactgcgc cttttcaagg atggaaaaat gaaatatcag ataattgatg gagagatgta 840

tcctcccaca gtcaaagata ctcaggcaga gatgatctac cctcctcaag tccctgagca 900

tctacggttt gctgtggggc aggaggtctt tggtctggtg cctggtctga tgatgtatgc 960

cacaatctgg ctgcgggaac acaacagagt atgcgatgtg cttaaacagg agcatcctga 1020

atggggtgat gagcagttgt tccagacaag caggctaata ctgataggag agactattaa 1080

gattgtgatt gaagattatg tgcaacactt gagtggctat cacttcaaac tgaaatttga 1140

cccagaacta cttttcaaca aacaattcca gtaccaaaat cgtattgctg ctgaatttaa 1200

caccctctat cactggcatc cccttctgcc tgacaccttt caaattcatg accagaaata 1260

caactatcaa cagtttatct acaacaactc tatattgctg gaacatggaa ttacccagtt 1320

tgttgaatca ttcaccaggc aaattgctgg cagggttgct ggtggtagga atgttccacc 1380

cgcagtacag aaagtatcac aggcttccat tgaccagagc aggcagatga aataccagtc 1440

ttttaatgag taccgcaaac gctttatgct gaagccctat gaatcatttg aagaacttac 1500

aggagaaaag gaaatgtctg cagagttgga agcactctat ggtgacatcg atgctgtgga 1560

gctgtatcct gcccttctgg tagaaaagcc tcggccagat gccatctttg gtgaaaccat 1620

ggtagaagtt ggagcaccat tctccttgaa aggacttatg ggtaatgtta tatgttctcc 1680

tgcctactgg aagccaagca cttttggtgg agaagtgggt tttcaaatca tcaacactgc 1740

ctcaattcag tctctcatct gcaataacgt gaagggctgt ccctttactt cattcagtgt 1800

tccagatcca gagctcatta aaacagtcac catcaatgca agttcttccc gctccggact 1860

agatgatatc aatcccacag tactactaaa agaacgttcg actgaactgt agaagtctaa 1920

tgatcatatt tatttattta tatgaaccat gtctattaat ttaattattt aataatattt 1980

atattaaact ccttatgtta cttaacatct tctgtaacag aagtcagtac tcctgttgcg 2040

gagaaaggag tcatacttgt gaagactttt atgtcactac tctaaagatt ttgctgttgc 2100

tgttaagttt ggaaaacagt ttttattctg ttttataaac cagagagaaa tgagttttga 2160

cgtcttttta cttgaatttc aacttatatt ataagaacga aagtaaagat gtttgaatac 2220

ttaaacactg tcacaagatg gcaaaatgct gaaagttttt acactgtcga tgtttccaat 2280

gcatcttcca tgatgcatta gaagtaacta atgtttgaaa ttttaaagta cttttggtta 2340

tttttctgtc atcaaacaaa aacaggtatc agtgcattat taaatgaata tttaaattag 2400

acattaccag taatttcatg tctacttttt aaaatcagca atgaaacaat aatttgaaat 2460

ttctaaattc atagggtaga atcacctgta aaagcttgtt tgatttctta aagttattaa 2520

acttgtacat ataccaaaaa gaagctgtct tggatttaaa tctgtaaaat cagtagaaat 2580

tttactacaa ttgcttgtta aaatatttta taagtgatgt tcctttttca ccaagagtat 2640

aaaccttttt agtgtgactg ttaaaacttc cttttaaatc aaaatgccaa atttattaag 2700

gtggtggagc cactgcagtg ttatcttaaa ataagaatat tttgttgaga tattccagaa 2760

tttgtttata tggctggtaa catgtaaaat ctatatcagc aaaagggtct acctttaaaa 2820

taagcaataa caaagaagaa aaccaaatta ttgttcaaat ttaggtttaa acttttgaag 2880

caaacttttt tttatccttg tgcactgcag gcctggtact cagattttgc tatgaggtta 2940

atgaagtacc aagctgtgct tgaataatga tatgttttct cagattttct gttgtacagt 3000

ttaatttagc agtccatatc acattgcaaa agtagcaatg acctcataaa atacctcttc 3060

aaaatgctta aattcatttc acacattaat tttatctcag tcttgaagcc aattcagtag 3120

gtgcattgga atcaagcctg gctacctgca tgctgttcct tttcttttct tcttttagcc 3180

attttgctaa gagacacagt cttctcatca cttcgtttct cctattttgt tttactagtt 3240

ttaagatcag agttcacttt ctttggactc tgcctatatt ttcttacctg aacttttgca 3300

agttttcagg taaacctcag ctcaggactg ctatttagct cctcttaaga agatta 3356

<210>3

<211>1750

<212>DNA

<213>人

<400>3

cctacaggtg aaaagcccag cgacccagtc aggatttaag tttacctcaa aaatggaaga 60

ttttaacatg gagagtgaca gctttgaaga tttctggaaa ggtgaagatc ttagtaatta 120

cagttacagc tctaccctgc ccccttttct actagatgcc gccccatgtg aaccagaatc 180

cctggaaatc aacaagtatt ttgtggtcat tatctatgcc ctggtattcc tgctgagcct 240

gctgggaaac tccctcgtga tgctggtcat cttatacagc agggtcggcc gctccgtcac 300

tgatgtctac ctgctgaacc tagccttggc cgacctactc tttgccctga ccttgcccat 360

ctgggccgcc tccaaggtga atggctggat ttttggcaca ttcctgtgca aggtggtctc 420

actcctgaag gaagtcaact tctatagtgg catcctgcta ctggcctgca tcagtgtgga 480

ccgttacctg gccattgtcc atgccacacg cacactgacc cagaagcgct acttggtcaa 540

attcatatgt ctcagcatct ggggtctgtc cttgctcctg gccctgcctg tcttactttt 600

ccgaaggacc gtctactcat ccaatgttag cccagcctgc tatgaggaca tgggcaacaa 660

tacagcaaac tggcggatgc tgttacggat cctgccccag tcctttggct tcatcgtgcc 720

actgctgatc atgctgttct gctacggatt caccctgcgt acgctgttta aggcccacat 780

ggggcagaag caccgggcca tgcgggtcat ctttgctgtc gtcctcatct tcctgctttg 840

ctggctgccc tacaacctgg tcctgctggc agacaccctc atgaggaccc aggtgatcca 900

ggagacctgt gagcgccgca atcacatcga ccgggctctg gatgccaccg agattctggg 960

catccttcac agctgcctca accccctcat ctacgccttc attggccaga agtttcgcca 1020

tggactcctc aagattctag ctatacatgg cttgatcagc aaggactccc tgcccaaaga 1080

cagcaggcct tcctttgttg gctcttcttc agggcacact tccactactc tctaagacct 1140

cctgcctaag tgcagccccg tggggttcct cccttctctt cacagtcaca ttccaagcct 1200

catgtccact ggttcttctt ggtctcagtg tcaatgcagc ccccattgtg gtcacaggaa 1260

gcagaggagg ccacgttctt actagtttcc cttgcatggt ttagaaagct tgccctggtg 1320

cctcacccct tgccataatt actatgtcat ttgctggagc tctgcccatc ctgcccctga 1380

gcccatggca ctctatgttc taagaagtga aaatctacac tccagtgaga cagctctgca 1440

tactcattag gatggctagt atcaaaagaa agaaaatcag gctggccaac gggatgaaac 1500

cctgtctcta ctaaaaatac aaaaaaaaaa aaaaaaatta gccgggcgtg gtggtgagtg 1560

cctgtaatca cagctacttg ggaggctgag atgggagaat cacttgaacc cgggaggcag 1620

aggttgcagt gagccgagat tgtgcccctg cactccagcc tgagcgacag tgagactctg 1680

tctcagtcca tgaagatgta gaggagaaac tggaactctc gagcgttgct gggggggatt 1740

gtaaaatggt 1750

<210>4

<211>3939

<212>DNA

<213>人

<400>4

cctgggtcct ctcggcgcca gagccgctct ccgcatccca ggacagcggt gcggccctcg 60

gccggggcgc ccactccgca gcagccagcg agccagctgc cccgtatgac cgcgccgggc 120

gccgccgggc gctgccctcc cacgacatgg ctgggctccc tgctgttgtt ggtctgtctc 180

ctggcgagca ggagtatcac cgaggaggtg tcggagtact gtagccacat gattgggagt 240

ggacacctgc agtctctgca gcggctgatt gacagtcaga tggagacctc gtgccaaatt 300

acatttgagt ttgtagacca ggaacagttg aaagatccag tgtgctacct taagaaggca 360

tttctcctgg tacaagacat aatggaggac accatgcgct tcagagataa caccgccaat 420

cccatcgcca ttgtgcagct gcaggaactc tctttgaggc tgaagagctg cttcaccaag 480

gattatgaag agcatgacaa ggcctgcgtc cgaactttct atgagacacc tctccagttg 540

ctggagaagg tcaagaatgt ctttaatgaa acaaagaatc tccttgacaa ggactggaat 600

attttcagca agaactgcaa caacagcttt gctgaatgct ccagccaaga tgtggtgacc 660

aagcctgatt gcaactgcct gtaccccaaa gccatcccta gcagtgaccc ggcctctgtc 720

tcccctcatc agcccctcgc cccctccatg gcccctgtgg ctggcttgac ctgggaggac 780

tctgagggaa ctgagggcag ctccctcttg cctggtgagc agcccctgca cacagtggat 840

ccaggcagtg ccaagcagcg gccacccagg agcacctgcc agagctttga gccgccagag 900

accccagttg tcaaggacag caccatcggt ggctcaccac agcctcgccc ctctgtcggg 960

gccttcaacc ccgggatgga ggatattctt gactctgcaa tgggcactaa ttgggtccca 1020

gaagaagcct ctggagaggc cagtgagatt cccgtacccc aagggacaga gctttccccc 1080

tccaggccag gagggggcag catgcagaca gagcccgcca gacccagcaa cttcctctca 1140

gcatcttctc cactccctgc atcagcaaag ggccaacagc cggcagatgt aactgctaca 1200

gccttgccca gggtgggccc cgtgatgccc actggccagg actggaatca caccccccag 1260

aagacagacc atccatctgc cctgctcaga gaccccccgg agccaggctc tcccaggatc 1320

tcatcactgc gcccccaggc cctcagcaac ccctccaccc tctctgctca gccacagctt 1380

tccagaagcc actcctcggg cagcgtgctg ccccttgggg agctggaggg caggaggagc 1440

accagggatc ggacgagccc cgcagagcca gaagcagcac cagcaagtga aggggcagcc 1500

aggcccctgc cccgttttaa ctccgttcct ttgactgaca caggccatga gaggcagtcc 1560

gagggatcct ccagcccgca gctccaggag tctgtcttcc acctgctggt gcccagtgtc 1620

atcctggtct tgctggctgt cggaggcctc ttgttctaca ggtggaggcg gcggagccat 1680

caagagcctc agagagcgga ttctcccttg gagcaaccag agggcagccc cctgactcag 1740

gatgacagac aggtggaact gccagtgtag agggaattct aagctggacg cacagaacag 1800

tctcttcgtg ggaggagaca ttatggggcg tccaccacca cccctccctg gccatcctcc 1860

tggaatgtgg tctgccctcc accagagctc ctgcctgcca ggactggacc agagcagcca 1920

ggctggggcc cctctgtctc aacccgcaga cccttgactg aatgagagag gccagaggat 1980

gctccccatg ctgccactat ttattgtgag ccctggaggc tcccatgtgc ttgaggaagg 2040

ctggtgagcc cggctcagga ccctcttccc tcaggggctg cagcctcctc tcactccctt 2100

ccatgccgga acccaggcca gggacccacc ggcctgtggt ttgtgggaaa gcagggtgca 2160

cgctgaggag tgaaacaacc ctgcacccag agggcctgcc tggtgccaag gtatcccagc 2220

ctggacaggc atggacctgt ctccagacag aggagcctga agttcgtggg gcgggacagc 2280

ctcggcctga tttcccgtaa aggtgtgcag cctgagagac gggaagagga ggcctctgca 2340

cctgctggtc tgcactgaca gcctgaaggg tctacaccct cggctcacct aagtccctgt 2400

gctggttgcc aggcccagag gggaggccag ccctgccctc aggacctgcc tgacctgcca 2460

gtgatgccaa gagggggatc aagcactggc ctctgcccct cctccttcca gcacctgcca 2520

gagcttctcc agcaggccaa gcagaggctc ccctcatgaa ggaagccatt gcactgtgaa 2580

cactgtacct gcctgctgaa cagcctcccc ccgtccatcc atgagccagc atccgtccgt 2640

cctccactct ccagcctctc cccagcctcc tgcactgagc tggcctcacc agtcgactga 2700

gggagcccct cagccctgac cttctcctga cctggccttt gactccccgg agtggagtgg 2760

ggtgggagaa cctcctgggc cgccagccag agccgctctt taggctgtgt tcttcgccca 2820

ggtttctgca tcttccactt tgacattccc aagagggaag ggactagtgg gagagagcaa 2880

gggaggggag ggcacagaca gagagcctac agggcgagct ctgactgaag atgggccttt 2940

gaaatatagg tatgcacctg aggttggggg agggtctgca ctcccaaacc ccagcgcagt 3000

gtcctttccc tgctgccgac aggaacctgg ggctgagcag gttatccctg tcaggagccc 3060

tggactgggc tgcatctcag ccccacctgc atggtatcca gctcccatcc acttctcacc 3120

cttctttcct cctgaccttg gtcagcagtg atgacctcca actctcaccc accccctcta 3180

ccatcacctc taaccaggca agccagggtg ggagagcaat caggagagcc aggcctcagc 3240

ttccaatgcc tggagggcct ccactttgtg gccagcctgt ggtgctggct ctgaggccta 3300

ggcaacgagc gacagggctg ccagttgccc ctgggttcct ttgtgctgct gtgtgcctcc 3360

tctcctgccg ccctttgtcc tccgctaaga gaccctgccc tacctggccg ctgggccccg 3420

tgactttccc ttcctgccca ggaaagtgag ggtcggctgg ccccaccttc cctgtcctga 3480

tgccgacagc ttagggaagg gcactgaact tgcatatggg gcttagcctt ctagtcacag 3540

cctctatatt tgatgctaga aaacacatat ttttaaatgg aagaaaaata aaaaggcatt 3600

cccccttcat ccccctacct taaacatata atattttaaa ggtcaaaaaa gcaatccaac 3660

ccactgcaga agctcttttt gagcacttgg tggcatcaga gcaggaggag ccccagagcc 3720

acctctggtg tcccccaggc tacctgctca ggaacccctt ctgttctctg agaactcaac 3780

agaggacatt ggctcacgca ctgtgagatt ttgtttttat acttgcaact ggtgaattat 3840

tttttataaa gtcatttaaa tatctattta aaagatagga agctgcttat atatttaata 3900

ataaaagaag tgcacaagct gccgttgacg tagctcgag 3939

<210>5

<211>1024

<212>DNA

<213>人

<400>5

atggcccgcg ctgctctctc cgccgccccc agcaatcccc ggctcctgcg agtggcactg 60

ctgctcctgc tcctggtagc cgctggccgg cgcgcagcag gagcgtccgt ggccactgaa 120

ctgcgctgcc agtgcttgca gaccctgcag ggaattcacc ccaagaacat ccaaagtgtg 180

aacgtgaagt cccccggacc ccactgcgcc caaaccgaag tcatagccac actcaagaat 240

gggcggaaag cttgcctcaa tcctgcatcc cccatagtta agaaaatcat cgaaaagatg 300

ctgaacagtg acaaatccaa ctgaccagaa gggaggagga agctcactgg tggctgttcc 360

tgaaggaggc cctgccctta taggaacaga agaggaaaga gagacacagc tgcagaggcc 420

acctggattg tgcctaatgt gtttgagcat cgcttaggag aagtcttcta tttatttatt 480

tattcattag ttttgaagat tctatgttaa tattttaggt gtaaaataat taagggtatg 540

attaactcta cctgcacact gtcctattat attcattctt tttgaaatgt caaccccaag 600

ttagttcaat ctggattcat atttaatttg aaggtagaat gttttcaaat gttctccagt 660

cattatgtta atatttctga ggagcctgca acatgccagc cactgtgata gaggctggcg 720

gatccaagca aatggccaat gagatcattg tgaaggcagg ggaatgtatg tgcacatctg 780

ttttgtaact gtttagatga atgtcagttg ttatttattg aaatgatttc acagtgtgtg 840

gtcaacattt ctcatgttga aactttaaga actaaaatgt tctaaatatc ccttggacat 900

tttatgtctt tcttgtaagg catactgcct tgtttaatgg tagttttaca gtgtttctgg 960

cttagaacaa aggggcttaa ttattgatgt tttcatagag aatataaaaa taaagcactt 1020

atag 1024

<210>6

<211>1064

<212>DNA

<213>人

<220>

<221>misc_feature

<222>(27)..(27)

<223>n＝a，c，g，t

<220>

<221>misc_feature

<222>(766)..(766)

<223>n＝a，c，g，t

<400>6

cacagccggg tcgcaggcac ctccccngcc agctctcccg cattctgcac agcttcccga 60

cgcgtctgct gagccccatg gcccacgcca cgctctccgc cgcccccagc aatccccggc 120

tcctgcgggt ggcgctgctg ctcctgctcc tggtgggcag ccggcgcgca gcaggagcgt 180

ccgtggtcac tgaactgcgc tgccagtgct tgcagacact gcagggaatt cacctcaaga 240

acatccaaag tgtgaatgta aggtcccccg gaccccactg cgcccaaacc gaagtcatag 300

ccacactcaa gaatgggaag aaagcttgtc tcaaccccgc atcccccatg gttcagaaaa 360

tcatcgaaaa gatactgaac aaggggagca ccaactgaca ggagagaagt aagaagctta 420

tcagcgtatc attgacactt cctgcagggt ggtccctgcc cttaccagag ctgaaaatga 480

aaaagagaac agcagctttc tagggacagc tggaaaggga cttaatgtgt ttgactattt 540

cttacgaggg ttctacttat ttatgtattt atttttgaaa gcttgtattt taatatttta 600

catgctgtta tttaaagatg tgagtgtgtt tcatcaaaca tagctcagtc ctgattattt 660

aattggaata tgatgggttt taaatgtgtc attaaactaa tatttagtgg gagaccataa 720

tgtgtcagcc accttgataa atgacagggt ggggaactgg agggtngggg gattgaaatg 780

caagcaatta gtggatcact gttagggtaa gggaatgtat gtacacatct attttttata 840

cttttttttt taaaaaagaa tgtcagttgt tatttattca aattatctca cattatgtgt 900

tcaacatttt tatgctgaag tttcccttag acattttatg tcttgcttgt agggcataat 960

gccttgttta atgtccattc tgcagcgttt ctctttccct tggaaaagag aatttatcat 1020

tactgttaca tttgtacaaa tgacatgata ataaaagttt tatg 1064

<210>7

<211>1469

<212>DNA

<213>人

<400>7

agcagcagga ggaggcagag cacagcatcg tcgggaccag actcgtctca ggccagttgc 60

agccttctca gccaaacgcc gaccaaggaa aactcactac catgagaatt gcagtgattt 120

gcttttgcct cctaggcatc acctgtgcca taccagttaa acaggctgat tctggaagtt 180

ctgaggaaaa gcagctttac aacaaatacc cagatgctgt ggccacatgg ctaaaccctg 240

acccatctca gaagcagaat ctcctagccc cacagaccct tccaagtaag tccaacgaaa 300

gccatgacca catggatgat atggatgatg aagatgatga tgaccatgtg gacagccagg 360

actccattga ctcgaacgac tctgatgatg tagatgacac tgatgattct caccagtctg 420

atgagtctca ccattctgat gaatctgatg aactggtcac tgattttccc acggacctgc 480

cagcaaccga agttttcact ccagttgtcc ccacagtaga cacatatgat ggccgaggtg 540

atagtgtggt ttatggactg aggtcaaaat ctaagaagtt tcgcagacct gacatccagt 600

accctgatgc tacagacgag gacatcacct cacacatgga aagcgaggag ttgaatggtg 660

catacaaggc catccccgtt gcccaggacc tgaacgcgcc ttctgattgg gacagccgtg 720

ggaaggacag ttatgaaacg agtcagctgg atgaccagag tgctgaaacc cacagccaca 780

agcagtccag attatataag cggaaagcca atgatgagag caatgagcat tccgatgtga 840

ttgatagtca ggaactttcc aaagtcagcc gtgaattcca cagccatgaa tttcacagcc 900

atgaagatat gctggttgta gaccccaaaa gtaaggaaga agataaacac ctgaaatttc 960

gtatttctca tgaattagat agtgcatctt ctgaggtcaa ttaaaaggag aaaaaataca 1020

atttctcact ttgcatttag tcaaaagaaa aaatgcttta tagcaaaatg aaagagaaca 1080

tgaaatgctt ctttctcagt ttattggttg aatgtgtatc tatttgagtc tggaaataac 1140

taatgtgttt gataattagt ttagtttgtg gcttcatgga aactccctgt aaactaaaag 1200

cttcagggtt atgtctatgt tcattctata gaagaaatgc aaactatcac tgtattttaa 1260

tatttgttat tctctcatga atagaaattt atgtagaagc aaacaaaata cttttaccca 1320

cttaaaaaga gaatataaca ttttatgtca ctataatctt ttgtttttta agttagtgta 1380

tattttgttg tgattatctt tttgtggtgt gaataaatct tttatcttga atgtaataag 1440

aaaaaaaaaa aaaaaacaaa aaaaaaaaa 1469

<210>8

<211>1256

<212>DNA

<213>人

<400>8

gcagtagcag cgagcagcag agtccgcacg ctccggcgag gggcagaaga gcgcgaggga 60

gcgcggggca gcagaagcga gagccgagcg cggacccagc caggacccac agccctcccc 120

agctgcccag gaagagcccc agccatggaa caccagctcc tgtgctgcga agtggaaacc 180

atccgccgcg cgtaccccga tgccaacctc ctcaacgacc gggtgctgcg ggccatgctg 240

aaggcggagg agacctgcgc gccctcggtg tcctacttca aatgtgtgca gaaggaggtc 300

ctgccgtcca tgcggaagat cgtcgccacc tggatgctgg aggtctgcga ggaacagaag 360

tgcgaggagg aggtcttccc gctggccatg aactacctgg accgcttcct gtcgctggag 420

cccgtgaaaa agagccgcct gcagctgctg ggggccactt gcatgttcgt ggcctctaag 480

atgaaggaga ccatccccct gacggccgag aagctgtgca tctacaccga cggctccatc 540

cggcccgagg agctgctgca aatggagctg ctcctggtga acaagctcaa gtggaacctg 600

gccgcaatga ccccgcacga tttcattgaa cacttcctct ccaaaatgcc agaggcggag 660

gagaacaaac agatcatccg caaacacgcg cagaccttcg ttgcctcttg tgccacagat 720

gtgaagttca tttccaatcc gccctccatg gtggcagcgg ggagcgtggt ggccgcagtg 780

caaggcctga acctgaggag ccccaacaac ttcctgtcct actaccgcct cacacgcttc 840

ctctccagag tgatcaagtg tgacccagac tgcctccggg cctgccagga gcagatcgaa 900

gccctgctgg agtcaagcct gcgccaggcc cagcagaaca tggaccccaa ggccgccgag 960

gaggaggaag aggaggagga ggaggtggac ctggcttgca cacccaccga cgtgcgggac 1020

gtggacatct gaggggccca ggcaggcggg cgccaccgcc acccgcagcg agggcggagc 1080

cggccccagg tgctccacat gacagtccct cctctccgga gcattttgat accagaaggg 1140

aaagcttcat tctccttgtt gttggttgtt ttttcctttg ctctttcccc cttccatctc 1200

tgacttaagc aaaagaaaaa gattacccaa aaactgtctt taaaagagag agagag 1256

<210>9

<211>2121

<212>DNA

<213>人

<400>9

ctgctcgcgg ccgccaccgc cgggccccgg ccgtccctgg ctcccctcct gcctcgagaa 60

gggcagggct tctcagaggc ttggcgggaa aaaagaacgg agggagggat cgcgctgagt 120

ataaaagccg gttttcgggg ctttatctaa ctcgctgtag taattccagc gagaggcaga 180

gggagcgagc gggcggccgg ctagggtgga agagccgggc gagcagagct gcgctgcggg 240

cgtcctggga agggagatcc ggagcgaata gggggcttcg cctctggccc agccctcccg 300

cttgatcccc caggccagcg gtccgcaacc cttgccgcat ccacgaaact ttgcccatag 360

cagcgggcgg gcactttgca ctggaactta caacacccga gcaaggacgc gactctcccg 420

acgcggggag gctattctgc ccatttgggg acacttcccc gccgctgcca ggacccgctt 480

ctctgaaagg ctctccttgc agctgcttag acgctggatt tttttcgggt agtggaaaac 540

cagcagcctc ccgcgacgat gcccctcaac gttagcttca ccaacaggaa ctatgacctc 600

gactacgact cggtgcagcc gtatttctac tgcgacgagg aggagaactt ctaccagcag 660

cagcagcaga gcgagctgca gcccccggcg cccagcgagg atatctggaa gaaattcgag 720

ctgctgccca ccccgcccct gtcccctagc cgccgctccg ggctctgctc gccctcctac 780

gttgcggtca cacccttctc ccttcgggga gacaacgacg gcggtggcgg gagcttctcc 840

acggccgacc agctggagat ggtgaccgag ctgctgggag gagacatggt gaaccagagt 900

ttcatctgcg acccggacga cgagaccttc atcaaaaaca tcatcatcca ggactgtatg 960

tggagcggct tctcggccgc cgccaagctc gtctcagaga agctggcctc ctaccaggct 1020

gcgcgcaaag acagcggcag cccgaacccc gcccgcggcc acagcgtctg ctccacctcc 1080

agcttgtacc tgcaggatct gagcgccgcc gcctcagagt gcatcgaccc ctcggtggtc 1140

ttcccctacc ctctcaacga cagcagctcg cccaagtcct gcgcctcgca agactccagc 1200

gccttctctc cgtcctcgga ttctctgctc tcctcgacgg agtcctcccc gcagggcagc 1260

cccgagcccc tggtgctcca tgaggagaca ccgcccacca ccagcagcga ctctgaggag 1320

gaacaagaag atgaggaaga aatcgatgtt gtttctgtgg aaaagaggca ggctcctggc 1380

aaaaggtcag agtctggatc accttctgct ggaggccaca gcaaacctcc tcacagccca 1440

ctggtcctca agaggtgcca cgtctccaca catcagcaca actacgcagc gcctccctcc 1500

actcggaagg actatcctgc tgccaagagg gtcaagttgg acagtgtcag agtcctgaga 1560

cagatcagca acaaccgaaa atgcaccagc cccaggtcct cggacaccga ggagaatgtc 1620

aagaggcgaa cacacaacgt cttggagcgc cagaggagga acgagctaaa acggagcttt 1680

tttgccctgc gtgaccagat cccggagttg gaaaacaatg aaaaggcccc caaggtagtt 1740

atccttaaaa aagccacagc atacatcctg tccgtccaag cagaggagca aaagctcatt 1800

tctgaagagg acttgttgcg gaaacgacga gaacagttga aacacaaact tgaacagcta 1860

cggaactctt gtgcgtaagg aaaagtaagg aaaacgattc cttctaacag aaatgtcctg 1920

agcaatcacc tatgaacttg tttcaaatgc atgatcaaat gcaacctcac aaccttggct 1980

gagtcttgag actgaaagat ttagccataa tgtaaactgc ctcaaattgg actttgggca 2040

taaaagaact tttttatgct taccatcttt tttttttctt taacagattt gtatttaaga 2100

attgttttta aaaaatttta a 2121

<210>10

<211>2098

<212>DNA

<213>人

<400>10

cctgccgaag tcagttcctt gtggagccgg agctgggcgc ggattcgccg aggcaccgag 60

gcactcagag gaggcgccat gtcagaaccg gctggggatg tccgtcagaa cccatgcggc 120

agcaaggcct gccgccgcct cttcggccca gtggacagcg agcagctgag ccgcgactgt 180

gatgcgctaa tggcgggctg catccaggag gcccgtgagc gatggaactt cgactttgtc 240

accgagacac cactggaggg tgacttcgcc tgggagcgtg tgcggggcct tggcctgccc 300

aagctctacc ttcccacggg gccccggcga ggccgggatg agttgggagg aggcaggcgg 360

cctggcacct cacctgctct gctgcagggg acagcagagg aagaccatgt ggacctgtca 420

ctgtcttgta cccttgtgcc tcgctcaggg gagcaggctg aagggtcccc aggtggacct 480

ggagactctc agggtcgaaa acggcggcag accagcatga cagatttcta ccactccaaa 540

cgccggctga tcttctccaa gaggaagccc taatccgccc acaggaagcc tgcagtcctg 600

gaagcgcgag ggcctcaaag gcccgctcta catcttctgc cttagtctca gtttgtgtgt 660

cttaattatt atttgtgttt taatttaaac acctcctcat gtacataccc tggccgcccc 720

ctgcccccca gcctctggca ttagaattat ttaaacaaaa actaggcggt tgaatgagag 780

gttcctaaga gtgctgggca tttttatttt atgaaatact atttaaagcc tcctcatccc 840

gtgttctcct tttcctctct cccggaggtt gggtgggccg gcttcatgcc agctacttcc 900

tcctccccac ttgtccgctg ggtggtaccc tctggagggg tgtggctcct tcccatcgct 960

gtcacaggcg gttatgaaat tcaccccctt tcctggacac tcagacctga attctttttc 1020

atttgagaag taaacagatg gcactttgaa ggggcctcac cgagtggggg catcatcaaa 1080

aactttggag tcccctcacc tcctctaagg ttgggcaggg tgaccctgaa gtgagcacag 1140

cctagggctg agctggggac ctggtaccct cctggctctt gatacccccc tctgtcttgt 1200

gaaggcaggg ggaaggtggg gtcctggagc agaccacccc gcctgccctc atggcccctc 1260

tgacctgcac tggggagccc gtctcagtgt tgagcctttt ccctctttgg ctcccctgta 1320

ccttttgagg agccccagct acccttcttc tccagctggg ctctgcaatt cccctctgct 1380

gctgtccctc ccccttgtcc tttcccttca gtaccctctc agctccaggt ggctctgagg 1440

tgcctgtccc acccccaccc ccagctcaat ggactggaag gggaagggac acacaagaag 1500

aagggcaccc tagttctacc tcaggcagct caagcagcga ccgccccctc ctctagctgt 1560

gggggtgagg gtcccatgtg gtggcacagg cccccttgag tggggttatc tctgtgttag 1620

gggtatatga tgggggagta gatctttcta ggagggagac actggcccct caaatcgtcc 1680

agcgaccttc ctcatccacc ccatccctcc ccagttcatt gcactttgat tagcagcgga 1740

acaaggagtc agacatttta agatggtggc agtagaggct atggacaggg catgccacgt 1800

gggctcatat ggggctggga gtagttgtct ttcctggcac taacgttgag cccctggagg 1860

cactgaagtg cttagtgtac ttggagtatt ggggtctgac cccaaacacc ttccagctcc 1920

tgtaacatac tggcctggac tgttttctct cggctcccca tgtgtcctgg ttcccgtttc 1980

tccacctaga ctgtaaacct ctcgagggca gggaccacac cctgtactgt tctgtgtctt 2040

tcacagctcc tcccacaatg ctgatataca gcaggtgctc aataaacgat tcttagtg 2098

<210>11

<211>1850

<212>DNA

<213>人

<400>11

ggcccaggct gaagctcagg gccctgtctg ctctgtggac tcaacagttt gtggcaagac 60

aagctcagaa ctgagaagct gtcaccacag ttctggaggc tgggaagttc aagatcaaag 120

tgccagcaga ttcagtgtca tgtgaggacg tgcttcctgc ttcatagata agagcttgga 180

gctcggcgca caaccagcac catctggtcg cgatggtgga cacggaaagc ccactctgcc 240

ccctctcccc actcgaggcc ggcgatctag agagcccgtt atctgaagag ttcctgcaag 300

aaatgggaaa catccaagag atttcgcaat ccatcggcga ggatagttct ggaagctttg 360

gctttacgga ataccagtat ttaggaagct gtcctggctc agatggctcg gtcatcacgg 420

acacgctttc accagcttcg agcccctcct cggtgactta tcctgtggtc cccggcagcg 480

tggacgagtc tcccagtgga gcattgaaca tcgaatgtag aatctgcggg gacaaggcct 540

caggctatca ttacggagtc cacgcgtgtg aaggctgcaa gggcttcttt cggcgaacga 600

ttcgactcaa gctggtgtat gacaagtgcg accgcagctg caagatccag aaaaagaaca 660

gaaacaaatg ccagtattgt cgatttcaca agtgcctttc tgtcgggatg tcacacaacg 720

cgattcgttt tggacgaatg ccaagatctg agaaagcaaa actgaaagca gaaattctta 780

cctgtgaaca tgacatagaa gattctgaaa ctgcagatct caaatctctg gccaagagaa 840

tctacgaggc ctacttgaag aacttcaaca tgaacaaggt caaagcccgg gtcatcctct 900

caggaaaggc cagtaacaat ccaccttttg tcatacatga tatggagaca ctgtgtatgg 960

ctgagaagac gctggtggcc aagctggtgg ccaatggcat ccagaacaag gaggcggagg 1020

tccgcatctt tcactgctgc cagtgcacgt cagtggagac cgtcacggag ctcacggaat 1080

tcgccaaggc catcccaggc ttcgcaaact tggacctgaa cgatcaagtg acattgctaa 1140

aatacggagt ttatgaggcc atattcgcca tgctgtcttc tgtgatgaac aaagacggga 1200

tgctggtagc gtatggaaat gggtttataa ctcgtgaatt cctaaaaagc ctaaggaaac 1260

cgttctgtga tatcatggaa cccaagtttg attttgccat gaagttcaat gcactggaac 1320

tggatgacag tgatatctcc ctttttgtgg ctgctatcat ttgctgtgga gatcgtcctg 1380

gccttctaaa cgtaggacac attgaaaaaa tgcaggaggg tattgtacat gtgctcagac 1440

tccacctgca gagcaaccac ccggacgata tctttctctt cccaaaactt cttcaaaaaa 1500

tggcagacct ccggcagctg gtgacggagc atgcgcagct ggtgcagatc atcaagaaga 1560

cggagtcgga tgctgcgctg cacccgctac tgcaggagat ctacagggac atgtactgag 1620

ttccttcaga tcagccacac cttttccagg agttctgaag ctgacagcac tacaaaggag 1680

acgggggagc agcacgattt tgcacaaata tccaccactt taaccttaga gcttggacag 1740

tctgagctgt aggtaaccgg catattattc catatctttg ttttaaccag tacttctaag 1800

agcatagaac tcaaatgctg ggggaggtgg ctaatctcag gactgggaag 1850

<210>12

<211>1609

<212>DNA

<213>人

<400>12

ttcaagtctt tttcttttaa cggattgatc ttttgctaga tagagacaaa atatcagtgt 60

gaattacagc aaacccctat tccatgctgt tatgggtgaa actctgggag attctcctat 120

tgacccagaa agcgattcct tcactgatac actgtctgca aacatatcacaagaaatgac 180

catggttgac acagagatgc cattctggcc caccaacttt gggatcagct ccgtggatct 240

ctccgtaatg gaagaccact cccactcctt tgatatcaag cccttcacta ctgttgactt 300

ctccagcatt tctactccac attacgaaga cattccattc acaagaacag atccagtggt 360

tgcagattac aagtatgacc tgaaacttca agagtaccaa agtgcaatca aagtggagcc 420

tgcatctcca ccttattatt ctgagaagac tcagctctac aataagcctc atgaagagcc 480

ttccaactcc ctcatggcaa ttgaatgtcg tgtctgtgga gataaagctt ctggatttca 540

ctatggagtt catgcttgtg aaggatgcaa gggtttcttc cggagaacaa tcagattgaa 600

gcttatctat gacagatgtg atcttaactg tcggatccac aaaaaaagta gaaataaatg 660

tcagtactgt cggtttcaga aatgccttgc agtggggatg tctcataatg ccatcaggtt 720

tgggcggatg ccacaggccg agaaggagaa gctgttggcg gagatctcca gtgatatcga 780

ccagctgaat ccagagtccg ctgacctccg ggccctggca aaacatttgt atgactcata 840

cataaagtcc ttcccgctga ccaaagcaaa ggcgagggcg atcttgacag gaaagacaac 900

agacaaatca ccattcgtta tctatgacat gaattcctta atgatgggag aagataaaat 960

caagttcaaa cacatcaccc ccctgcagga gcagagcaaa gaggtggcca tccgcatctt 1020

tcagggctgc cagtttcgct ccgtggaggc tgtgcaggag atcacagagt atgccaaaag 1080

cattcctggt tttgtaaatc ttgacttgaa cgaccaagta actctcctca aatatggagt 1140

ccacgagatc atttacacaa tgctggcctc cttgatgaat aaagatgggg ttctcatatc 1200

cgagggccaa ggcttcatga caagggagtt tctaaagagc ctgcgaaagc cttttggtga 1260

ctttatggag cccaagtttg agtttgctgt gaagttcaat gcactggaat tagatgacag 1320

cgacttggca atatttattg ctgtcattat tctcagtgga gaccgcccag gtttgctgaa 1380

tgtgaagccc attgaagaca ttcaagacaa cctgctacaa gccctggagc tccagctgaa 1440

gctgaaccac cctgagtcct cacagctgtt tgccaagctg ctccagaaaa tgacagacct 1500

cagacagatt gtcacggaac acgtgcagct actgcaggtg atcaagaaga cggagacaga 1560

catgagtctt cacccgctcc tgcaggagat ctacaaggac ttgtactag 1609

<210>13

<211>3301

<212>DNA

<213>人

<220>

<221>misc_feature

<222>(2966)..(2973)

<223>n＝a，c，g，t

<400>13

gaattctgcg gagcctgcgg gacggcggcg ggttggcccg taggcagccg ggacagtgtt 60

gtacagtgtt ttgggcatgc acgtgatact cacacagtgg cttctgctca ccaacagatg 120

aagacagatg caccaacgag ggtctggaat ggtctggagt ggtctggaaa gcagggtcag 180

atacccctgg aaaactgaag cccgtggagc aatgatctct acaggactgc ttcaaggctg 240

atgggaacca ccctgtagag gtccatctgc gttcagaccc agacgatgcc agagctatga 300

ctgggcctgc aggtgtggcg ccgaggggag atcagccatg gagcagccac aggaggaagc 360

ccctgaggtc cgggaagagg aggagaaaga ggaagtggca gaggcagaag gagccccaga 420

gctcaatggg ggaccacagc atgcacttcc ttccagcagc tacacagacc tctcccggag 480

ctcctcgcca ccctcactgc tggaccaact gcagatgggc tgtgacgggg cctcatgcgg 540

cagcctcaac atggagtgcc gggtgtgcgg ggacaaggca tcgggcttcc actacggtgt 600

tcatgcatgt gaggggtgca agggcttctt ccgtcgtacg atccgcatga agctggagta 660

cgagaagtgt gagcgcagct gcaagattca gaagaagaac cgcaacaagt gccagtactg 720

ccgcttccag aagtgcctgg cactgggcat gtcacacaac gctatccgtt ttggtcggat 780

gccggaggct gagaagagga agctggtggc agggctgact gcaaacgagg ggagccagta 840

caacccacag gtggccgacc tgaaggcctt ctccaagcac atctacaatg cctacctgaa 900

aaacttcaac atgaccaaaa agaaggcccg cagcatcctc accggcaaag ccagccacac 960

ggcgcccttt gtgatccacg acatcgagac attgtggcag gcagagaagg ggctggtgtg 1020

gaagcagttg gtgaatggcc tgcctcccta caaggagatc agcgtgcacg tcttctaccg 1080

ctgccagtgc accacagtgg agaccgtgcg ggagctcact gagttcgcca agagcatccc 1140

cagcttcagc agcctcttcc tcaacgacca ggttaccctt ctcaagtatg gcgtgcacga 1200

ggccatcttc gccatgctgg cctctatcgt caacaaggac gggctgctgg tagccaacgg 1260

cagtggcttt gtcacccgtg agttcctgcg cagcctccgc aaacccttca gtgatatcat 1320

tgagcctaag tttgaatttg ctgtcaagtt caacgccctg gaacttgatg acagtgacct 1380

ggccctattc attgcggcca tcattctgtg tggagaccgg ccaggcctca tgaacgttcc 1440

acgggtggag gctatccagg acaccatcct gcgtgccctc gaattccacc tgcaggccaa 1500

ccaccctgat gcccagtacc tcttccccaa gctgctgcag aagatggctg acctgcggca 1560

actggtcacc gagcacgccc agatgatgca gcggatcaag aagaccgaaa ccgagacctc 1620

gctgcaccct ctgctccagg agatctacaa ggacatgtac taacggcggc acccaggcct 1680

ccctgcagac tccaatgggg ccagcactgg aggggcccac ccacatgact tttccattga 1740

ccagctctct tcctgtcttt gttgtctccc tctttctcag ttcctctttc ttttctaatt 1800

cctgttgctc tgtttcttcc tttctgtagg tttctctctt cccttctccc ttctcccttg 1860

ccctcccttt ctctctccta tccccacgtc tgtcctcctt tcttattctg tgagatgttt 1920

tgtattattt caccagcagc atagaacagg acctctgctt ttgcacacct tttccccagg 1980

agcagaagag agtgggcctg ccctctgccc catcattgca cctgcaggct taggtcctca 2040

cttctgtctc ctgtcttcag agcaaaagac ttgagccatc caaagaaaca ctaagctctc 2100

tgggcctggg ttccagggaa ggctaagcat ggcctggact gactgcagcc ccctatagtc 2160

atggggtccc tgctgcaaag gacagtggca gaccccggca gtagagccga gatgcctccc 2220

caagactgtc attgcccctc cgatcgtgag gccacccact gacccaatga tcctctccag 2280

cagcacacct cagccccact gacacccagt gtccttccat cttcacactg gtttgccagg 2340

ccaatgttgc tgatggcccc tccagcacac acacataagc actgaaatca ctttacctgc 2400

aggcaccatg cacctccctt ccctccctga ggcaggtgag aacccagaga gaggggcctg 2460

caggtgagca ggcagggctg ggccaggtct ccggggaggc aggggtcctg caggtcctgg 2520

tgggtcagcc cagcacctcg cccagtggga gcttcccggg ataaactgag cctgttcatt 2580

ctgatgtcca tttgtcccaa tagctctact gccctcccct tcccctttac tcagcccagc 2640

tggccaccta gaagtctccc tgcacagcct ctagtgtccg gggaccttgt gggaccagtc 2700

ccacaccgct ggtccctgcc ctcccctgct cccaggttga ggtgcgctca cctcagagca 2760

gggccaaagc acagctgggc atgccatgtc tgagcggcgc agagccctcc aggcctgcag 2820

gggcaagggg ctggctggag tctcagagca cagaggtagg agaactgggg ttcaagccca 2880

ggcttcctgg gtcctgcctg gtcctccctc ccaaggagcc attctatgtg actctgggtg 2940

gaagtgccca gcccctgcct gacggnnnnn nngatcactc tctgctggca ggattcttcc 3000

cgctccccac ctacccagct gatgggggtt ggggtgcttc tttcagccaa ggctatgaag 3060

ggacagctgc tgggacccac ctcccccctt ccccggccac atgccgcgtc cctgccccca 3120

cccgggtctg gtgctgagga tacagctctt ctcagtgtct gaacaatctc caaaattgaa 3180

atgtatattt ttgctaggag ccccagcttc ctgtgttttt aatataaata gtgtacacag 3240

actgacgaaa ctttaaataa atgggaatta aatatttaaa aaaaaaagcg gccgcgaatt 3300

c 3301

<210>14

<211>3083

<212>DNA

<213>人

<400>14

aaaaactgca gccaacttcc gaggcagcct cattgcccag cggaccccag cctctgccag 60

gttcggtccg ccatcctcgt cccgtcctcc gccggcccct gccccgcgcc cagggatcct 120

ccagctcctt tcgcccgcgc cctccgttcg ctccggacac catggacaag ttttggtggc 180

acgcagcctg gggactctgc ctcgtgccgc tgagcctggc gcagatcgat ttgaatataa 240

cctgccgctt tgcaggtgta ttccacgtgg agaaaaatgg tcgctacagc atctctcgga 300

cggaggccgc tgacctctgc aaggctttca atagcacctt gcccacaatg gcccagatgg 360

agaaagctct gagcatcgga tttgagacct gcaggtatgg gttcatagaa gggcacgtgg 420

tgattccccg gatccacccc aactccatct gtgcagcaaa caacacaggg gtgtacatcc 480

tcacatccaa cacctcccag tatgacacat attgcttcaa tgcttcagct ccacctgaag 540

aagattgtac atcagtcaca gacctgccca atgcctttga tggaccaatt accataacta 600

ttgttaaccg tgatggcacc cgctatgtcc agaaaggaga atacagaacg aatcctgaag 660

acatctaccc cagcaaccct actgatgatg acgtgagcag cggcttttct actgtacacc 720

ccatcccaga cgaagacagt ccctggatca cctcctccag tgaaaggagc agcacttcag 780

gaggttacat cttttacacc gacagcacag acagaatccc tgctaccact ttgatgagca 840

ctagtgctac agcaactgag acagcaacca agaggcaaga aacctgggat tggttttcat 900

ggttgtttct accatcagag tcaaagaatc atcttcacac aacaacacaa atggctggta 960

cgtcttcaaa taccatctca gcaggctggg agccaaatga agaaaatgaa gatgaaagag 1020

acagacacct cagtttttct ggatcaggca ttgatgatga tgaagatttt atctccagca 1080

ccatttcaac cacaccacgg gcttttgacc acacaaaaca gaaccaggac tggacccagt 1140

ggaacccaag ccattcaaat ccggaagtgc tacttcagac aaccacaagg atgactgatg 1200

tagacagaaa tggcaccact gcttatgaag gaaactggaa cccagaagca caccctcccc 1260

tcattcacca tgagcatcat gaggaagaag agaccccaca ttctacaagc acaatccagg 1320

caactcctag tagtacaacg gaagaaacag ctacccagaa ggaacagtgg tttggcaaca 1380

gatggcatga gggatatcgc caaacaccca aagaagactc ccatttcaac ccaatctcac 1440

accccatggg acgaggtcat caagcaggaa gatcgacaac agggacagct gcagcctcag 1500

ctcataccag ccatccaatg caaggaagga caacaccaag cccagaggac agttcctgga 1560

ctgatttcag gatggatatg gactccagtc atagtataac gcttcagcct actgcaaatc 1620

caaacacagg tttggtggaa gatttggaca ggacaggacc tctttcaatg acaacgcagc 1680

agagtaattc tcagagcttc tctacatcac atgaaggctt ggaagaagat aaagaccatc 1740

caacaacttc tactctgaca tcaagcaata ggaatgatgt cacaggtgga agaagagacc 1800

caaatcattc tgaaggctca actactttac tggaaggtta tacctctcat tacccacaca 1860

cgaaggaaag caggaccttc atcccagtga cctcagctaa gactgtcaat cgttccttat 1920

caggagacca agacacattc caccccagtg gggggtcctt tggagttact gcagttactg 1980

ttggagattc caactctaat gggtcccata ccactcatgg atctgaatca gatggacact 2040

cacatgggag tcaagaaggt ggagcaaaca caacctctgg tcctataagg acaccccaaa 2100

ttccagaatg gctgatcatc ttggcatccc tcttggcctt ggctttgatt cttgcagttt 2160

gcattgcagt caacagtcga agaaggtgtg ggcagaagaa aaagctagtg atcaacagtg 2220

gcaatggagc tgtggaggac agaaagccaa gtggactcaa cggagaggcc agcaagtctc 2280

aggaaatggt gcatttggtg aacaaggagt cgtcagaaac tccagaccag tttatgacag 2340

ctgatgagac aaggaacctg cagaatgtgg acatgaagat tggggtgtaa cacctacacc 2400

attatcttgg aaagaaacaa ccgttggaaa cataaccatt acagggagct gggacactta 2460

acagatgcaa tgtgctactg attgtttcat tgcgaatctt ttttagcata aaattttcta 2520

ctctttttgt tttttgtgtt ttgttcttta aagtcaggtc caatttgtaa aaacagcatt 2580

gctttctgaa attagggccc aattaataat cagcaagaat ttgatcgttc cagttcccac 2640

ttggaggcct ttcatccctc gggtgtgcta tggatggctt ctaacaaaaa ctacacatat 2700

gtattcctga tcgccaacct ttcccccacc agctaaggac atttcccagg gttaataggg 2760

cctggtccct gggaggaaat ttgaatgggt ccattttgcc cttccatagc ctaatccctg 2820

ggcattgctt tccactgagg ttgggggttg gggtgtacta gttacacatc ttcaacagac 2880

cccctctaga aatttttcag atgcttctgg gagacaccca aagggtgaag ctatttatct 2940

gtagtaaact atttatctgt gtttttgaaa tattaaaccc tggatcagtc ctttgatcag 3000

tataattttt taaagttact ttgtcagagg cacaaaaggg tttaaactga ttcataataa 3060

atatctgtac ttcttcgatc ttc 3083

<210>15

<211>2539

<212>DNA

<213>人

<400>15

ggagtctctt gctctggttc ttgctgttcc tgctcctgct cccgccgctc cccgtcctgc 60

tcgcggaccc aggggcgccc acgccagtga atccctgttg ttactatcca tgccagcacc 120

agggcatctg tgtccgcttc ggccttgacc gctaccagtg tgactgcacc cgcacgggct 180

attccggccc caactgcacc atccctggcc tgtggacctg gctccggaat tcactgcggc 240

ccagcccctc tttcacccac ttcctgctca ctcacgggcg ctggttctgg gagtttgtca 300

atgccacctt catccgagag atgctcatgc gcctggtact cacagtgcgc tccaacctta 360

tccccagtcc ccccacctac aactcagcac atgactacat cagctgggag tctttctcca 420

acgtgagcta ttacactcgt attctgccct ctgtgcctaa agattgcccc acacccatgg 480

gaaccaaagg gaagaagcag ttgccagatg cccagctcct ggcccgccgc ttcctgctca 540

ggaggaagtt catacctgac ccccaaggca ccaacctcat gtttgccttc tttgcacaac 600

acttcaccca ccagttcttc aaaacttctg gcaagatggg tcctggcttc accaaggcct 660

tgggccatgg ggtagacctc ggccacattt atggagacaa tctggagcgt cagtatcaac 720

tgcggctctt taaggatggg aaactcaagt accaggtgct ggatggagaa atgtacccgc 780

cctcggtaga agaggcgcct gtgttgatgc actacccccg aggcatcccg ccccagagcc 840

agatggctgt gggccaggag gtgtttgggc tgcttcctgg gctcatgctg tatgccacgc 900

tctggctacg tgagcacaac cgtgtgtgtg acctgctgaa ggctgagcac cccacctggg 960

gcgatgagca gcttttccag acgacccgcc tcatcctcat aggggagacc atcaagattg 1020

tcatcgagga gtacgtgcag cagctgagtg gctatttcct gcagctgaaa tttgacccag 1080

agctgctgtt cggtgtccag ttccaatacc gcaaccgcat tgccatggag ttcaaccatc 1140

tctaccactg gcaccccctc atgcctgact ccttcaaggt gggctcccag gagtacagct 1200

acgagcagtt cttgttcaac acctccatgt tggtggacta tggggttgag gccctggtgg 1260

atgccttctc tcgccagatt gctggccgga tcggtggggg caggaacatg gaccaccaca 1320

tcctgcatgt ggctgtggat gtcatcaggg agtctcggga gatgcggctg cagcccttca 1380

atgagtaccg caagaggttt ggcatgaaac cctacacctc cttccaggag ctcgtaggag 1440

agaaggagat ggcagcagag ttggaggaat tgtatggaga cattgatgcg ttggagttct 1500

accctggact gcttcttgaa aagtgccatc caaactctat ctttggggag agtatgatag 1560

agattggggc tcccttttcc ctcaagggtc tcctagggaa tcccatctgt tctccggagt 1620

actggaagcc gagcacattt ggcggcgagg tgggctttaa cattgtcaag acggccacac 1680

tgaagaagct ggtctgcctc aacaccaaga cctgtcccta cgtttccttc cgtgtgccgg 1740

atgccagtca ggatgatggg cctgctgtgg agcgaccatc cacagagctc tgaggggcag 1800

gaaagcagca ttctggaggg gagagctttg tgcttgtcat tccagagtgc tgaggccagg 1860

gctgatggtc ttaaatgctc attttctggt ttggcatggt gagtgttggg gttgacattt 1920

agaactttaa gtctcaccca ttatctggaa tattgtgatt ctgtttattc ttccagaatg 1980

ctgaactcct tgttagccct tcagattgtt aggagtggtt ctcatttggt ctgccagaat 2040

actgggttct tagttgacaa cctagaatgt cagatttctg gttgatttgt aacacagtca 2100

ttctaggatg tggagctact gatgaaatct gctagaaagt tagggggttc ttattttgca 2160

ttccagaatc ttgactttct gattggtgat tcaaagtgtt gtgttcctgg ctgatgatcc 2220

agaacagtgg ctcgtatccc aaatctgtca gcatctggct gtctagaatg tggatttgat 2280

tcattttcct gttcagtgag atatcataga gacggagatc ctaaggtcca acaagaatgc 2340

attccctgaa tctgtgcctg cactgagagg gcaaggaagt ggggtgttct tcttgggacc 2400

cccactaaga ccctggtctg aggatgtaga gagaacaggt gggctgtatt cacgccattg 2460

gttggaagct accagagctc tatccccatc caggtcttga ctcatggcag ctgtttctca 2520

tgaagctaat aaaattcgc 2539

<210>16

<211>369

<212>DNA

<213>人

<400>16

atgaagcttc tcacgggcct ggttttctgc tccttggtcc tgggtgtcag cagccgaagc 60

ttcttttcgt tccttggcga ggcttttgat ggggctcggg acatgtggag agcctactct 120

gacatgagag aagccaatta catcggctca gacaaatact tccatgctcg ggggaactat 180

gatgctgcca aaaggggacc tgggggtgtc tgggctgcag aagcgatcag cgatgccaga 240

gagaatatcc agagattctt tggccatggt gcggaggact cgctggctga tcaggctgcc 300

aatgaatggg gcaggagtgg caaagacccc aatcacttcc gacctgctgg cctgcctgag 360

aaatactga 369

<210>17

<211>67

<212>PRT

<213>人

<400>17

Met Thr Ser Lys Leu Ala Val Ala Leu Leu Ala Ala Phe Leu Ile Ser

1 5 10 15

Ala Ala Leu Cys Glu Gly Ala Val Leu Pro Arg Ser Ala Lys Glu Leu

20 25 30

Arg Cys Gln Cys Ile Lys Thr Tyr Ser Lys Pro Phe His Pro Lys Phe

35 40 45

Ile Lys Glu Leu Arg Val Ile Glu Ser Gly Pro His Cys Ala Asn Thr

50 55 60

Glu Ile Met

65

<210>18

<211>604

<212>PRT

<213>人

<400>18

Met Leu Ala Arg Ala Leu Leu Leu Cys Ala Val Leu Ala Leu Ser His

1 5 10 15

Thr Ala Asn Pro Cys Cys Ser His Pro Cys Gln Asn Arg Gly Val Cys

20 25 30

Met Ser Val Gly Phe Asp Gln Tyr Lys Cys Asp Cys Thr Arg Thr Gly

35 40 45

Phe Tyr Gly Glu Asn Cys Ser Thr Pro Glu Phe Leu Thr Arg Ile Lys

50 55 60

Leu Phe Leu Lys Pro Thr Pro Asn Thr Val His Tyr Ile Leu Thr His

65 70 75 80

Phe Lys Gly Phe Trp Asn Val Val Asn Asn Ile Pro Phe Leu Arg Asn

85 90 95

Ala Ile Met Ser Tyr Val Leu Thr Ser Arg Ser His Leu Ile Asp Ser

100 105 110

Pro Pro Thr Tyr Asn Ala Asp Tyr Gly Tyr Lys Ser Trp Glu Ala Phe

115 120 125

Ser Asn Leu Ser Tyr Tyr Thr Arg Ala Leu Pro Pro Val Pro Asp Asp

130 135 140

Cys Pro Thr Pro Leu Gly Val Lys Gly Lys Lys Gln Leu Pro Asp Ser

145 150 155 160

Asn Glu Ile Val Glu Lys Leu Leu Leu Arg Arg Lys Phe Ile Pro Asp

165 170 175

Pro Gln Gly Ser Asn Met Met Phe Ala Phe Phe Ala Gln His Phe Thr

180 185 190

His Gln Phe Phe Lys Thr Asp His Lys Arg Gly Pro Ala Phe Thr Asn

195 200 205

Gly Leu Gly His Gly Val Asp Leu Asn His Ile Tyr Gly Glu Thr Leu

210 215 220

Ala Arg Gln Arg Lys Leu Arg Leu Phe Lys Asp Gly Lys Met Lys Tyr

225 230 235 240

Gln Ile Ile Asp Gly Glu Met Tyr Pro Pro Thr Val Lys Asp Thr Gln

245 250 255

Ala Glu Met Ile Tyr Pro Pro Gln Val Pro Glu His Leu Arg Phe Ala

260 265 270

Val Gly Gln Glu Val Phe Gly Leu Val Pro Gly Leu Met Met Tyr Ala

275 280 285

Thr Ile Trp Leu Arg Glu His Asn Arg Val Cys Asp Val Leu Lys Gln

290 295 300

Glu His Pro Glu Trp Gly Asp Glu Gln Leu Phe Gln Thr Ser Arg Leu

305 310 315 320

Ile Leu Ile Gly Glu Thr Ile Lys Ile Val Ile Glu Asp Tyr Val Gln

325 330 335

His Leu Ser Gly Tyr His Phe Lys Leu Lys Phe Asp Pro Glu Leu Leu

340 345 350

Phe Asn Lys Gln Phe Gln Tyr Gln Asn Arg Ile Ala Ala Glu Phe Asn

355 360 365

Thr Leu Tyr His Trp His Pro Leu Leu Pro Asp Thr Phe Gln Ile His

370 375 380

Asp Gln Lys Tyr Asn Tyr Gln Gln Phe Ile Tyr Asn Asn Ser Ile Leu

385 390 395 400

Leu Glu His Gly Ile Thr Gln Phe Val Glu Ser Phe Thr Arg Gln Ile

405 410 415

Ala Gly Arg Val Ala Gly Gly Arg Asn Val Pro Pro Ala Val Gln Lys

420 425 430

Val Ser Gln Ala Ser Ile Asp Gln Ser Arg Gln Met Lys Tyr Gln Ser

435 440 445

Phe Asn Glu Tyr Arg Lys Arg Phe Met Leu Lys Pro Tyr Glu Ser Phe

450 455 460

Glu Glu Leu Thr Gly Glu Lys Glu Met Ser Ala Glu Leu Glu Ala Leu

465 470 475 480

Tyr Gly Asp Ile Asp Ala Val Glu Leu Tyr Pro Ala Leu Leu Val Glu

485 490 495

Lys Pro Arg Pro Asp Ala Ile Phe Gly Glu Thr Met Val Glu Val Gly

500 505 510

Ala Pro Phe Ser Leu Lys Gly Leu Met Gly Asn Val Ile Cys Ser Pro

515 520 525

Ala Tyr Trp Lys Pro Ser Thr Phe Gly Gly Glu Val Gly Phe Gln Ile

530 535 540

Ile Asn Thr Ala Ser Ile Gln Ser Leu Ile Cys Asn Asn Val Lys Gly

545 550 555 560

Cys Pro Phe Thr Ser Phe Ser Val Pro Asp Pro Glu Leu Ile Lys Thr

565 570 575

Val Thr Ile Asn Ala Ser Ser Ser Arg Ser Gly Leu Asp Asp Ile Asn

580 585 590

Pro Thr Val Leu Leu Lys Glu Arg Ser Thr Glu Leu

595 600

<210>19

<211>360

<212>PRT

<213>人

<400>19

Met Glu Asp Phe Asn Met Glu Ser Asp Ser Phe Glu Asp Phe Trp Lys

1 5 10 15

Gly Glu Asp Leu Ser Asn Tyr Ser Tyr Ser Ser Thr Leu Pro Pro Phe

20 25 30

Leu Leu Asp Ala Ala Pro Cys Glu Pro Glu Ser Leu Glu Ile Asn Lys

35 40 45

Tyr Phe Val Val Ile Ile Tyr Ala Leu Val Phe Leu Leu Ser Leu Leu

50 55 60

Gly Asn Ser Leu Val Met Leu Val Ile Leu Tyr Ser Arg Val Gly Arg

65 70 75 80

Ser Val Thr Asp Val Tyr Leu Leu Asn Leu Ala Leu Ala Asp Leu Leu

85 90 95

Phe Ala Leu Thr Leu Pro Ile Trp Ala Ala Ser Lys Val Asn Gly Trp

100 105 110

Ile Phe Gly Thr Phe Leu Cys Lys Val Val Ser Leu Leu Lys Glu Val

115 120 125

Asn Phe Tyr Ser Gly Ile Leu Leu Leu Ala Cys Ile Ser Val Asp Arg

130 135 140

Tyr Leu Ala Ile Val His Ala Thr Arg Thr Leu Thr Gln Lys Arg Tyr

145 150 155 160

Leu Val Lys Phe Ile Cys Leu Ser Ile Trp Gly Leu Ser Leu Leu Leu

165 170 175

Ala Leu Pro Val Leu Leu Phe Arg Arg Thr Val Tyr Ser Ser Asn Val

180 185 190

Ser Pro Ala Cys Tyr Glu Asp Met Gly Asn Asn Thr Ala Asn Trp Arg

195 200 205

Met Leu Leu Arg Ile Leu Pro Gln Ser Phe Gly Phe Ile Val Pro Leu

210 215 220

Leu Ile Met Leu Phe Cys Tyr Gly Phe Thr Leu Arg Thr Leu Phe Lys

225 230 235 240

Ala His Met Gly Gln Lys His Arg Ala Met Arg Val Ile Phe Ala Val

245 250 255

Val Leu Ile Phe Leu Leu Cys Trp Leu Pro Tyr Asn Leu Val Leu Leu

260 265 270

Ala Asp Thr Leu Met Arg Thr Gln Val Ile Gln Glu Thr Cys Glu Arg

275 280 285

Arg Asn His Ile Asp Arg Ala Leu Asp Ala Thr Glu Ile Leu Gly Ile

290 295 300

Leu His Ser Cys Leu Asn Pro Leu Ile Tyr Ala Phe Ile Gly Gln Lys

305 310 315 320

Phe Arg His Gly Leu Leu Lys Ile Leu Ala Ile His Gly Leu Ile Ser

325 330 335

Lys Asp Ser Leu Pro Lys Asp Ser Arg Pro Ser Phe Val Gly Ser Ser

340 345 350

Ser Gly His Thr Ser Thr Thr Leu

355 360

<210>20

<211>554

<212>PRT

<213>人

<400>20

Met Thr Ala Pro Gly Ala Ala Gly Arg Cys Pro Pro Thr Thr Trp Leu

1 5 10 15

Gly Ser Leu Leu Leu Leu Val Cys Leu Leu Ala Ser Arg Ser Ile Thr

20 25 30

Glu Glu Val Ser Glu Tyr Cys Ser His Met Ile Gly Ser Gly His Leu

35 40 45

Gln Ser Leu Gln Arg Leu Ile Asp Ser Gln Met Glu Thr Ser Cys Gln

50 55 60

Ile Thr Phe Glu Phe Val Asp Gln Glu Gln Leu Lys Asp Pro Val Cys

65 70 75 80

Tyr Leu Lys Lys Ala Phe Leu Leu Val Gln Asp Ile Met Glu Asp Thr

85 90 95

Met Arg Phe Arg Asp Asn Thr Ala Asn Pro Ile Ala Ile Val Gln Leu

100 105 110

Gln Glu Leu Ser Leu Arg Leu Lys Ser Cys Phe Thr Lys Asp Tyr Glu

115 120 125

Glu His Asp Lys Ala Cys Val Arg Thr Phe Tyr Glu Thr Pro Leu Gln

130 135 140

Leu Leu Glu Lys Val Lys Asn Val Phe Asn Glu Thr Lys Asn Leu Leu

145 150 155 160

Asp Lys Asp Trp Asn Ile Phe Ser Lys Asn Cys Asn Asn Ser Phe Ala

165 170 175

Glu Cys Ser Ser Gln Asp Val Val Thr Lys Pro Asp Cys Asn Cys Leu

180 185 190

Tyr Pro Lys Ala Ile Pro Ser Ser Asp Pro Ala Ser Val Ser Pro His

195 200 205

Gln Pro Leu Ala Pro Ser Met Ala Pro Val Ala Gly Leu Thr Trp Glu

210 215 220

Asp Ser Glu Gly Thr Glu Gly Ser Ser Leu Leu Pro Gly Glu Gln Pro

225 230 235 240

Leu His Thr Val Asp Pro Gly Ser Ala Lys Gln Arg Pro Pro Arg Ser

245 250 255

Thr Cys Gln Ser Phe Glu Pro Pro Glu Thr Pro Val Val Lys Asp Ser

260 265 270

Thr Ile Gly Gly Ser Pro Gln Pro Arg Pro Ser Val Gly Ala Phe Asn

275 280 285

Pro Gly Met Glu Asp Ile Leu Asp Ser Ala Met Gly Thr Asn Trp Val

290 295 300

Pro Glu Glu Ala Ser Gly Glu Ala Ser Glu Ile Pro Val Pro Gln Gly

305 310 315 320

Thr Glu Leu Ser Pro Ser Arg Pro Gly Gly Gly Ser Met Gln Thr Glu

325 330 335

Pro Ala Arg Pro Ser Asn Phe Leu Ser Ala Ser Ser Pro Leu Pro Ala

340 345 350

Ser Ala Lys Gly Gln Gln Pro Ala Asp Val Thr Ala Thr Ala Leu Pro

355 360 365

Arg Val Gly Pro Val Met Pro Thr Gly Gln Asp Trp Asn His Thr Pro

370 375 380

Gln Lys Thr Asp His Pro Ser Ala Leu Leu Arg Asp Pro Pro Glu Pro

385 390 395 400

Gly Ser Pro Arg Ile Ser Ser Leu Arg Pro Gln Ala Leu Ser Asn Pro

405 410 415

Ser Thr Leu Ser Ala Gln Pro Gln Leu Ser Arg Ser His Ser Ser Gly

420 425 430

Ser Val Leu Pro Leu Gly Glu Leu Glu Gly Arg Arg Ser Thr Arg Asp

435 440 445

Arg Thr Ser Pro Ala Glu Pro Glu Ala Ala Pro Ala Ser Glu Gly Ala

450 455 460

Ala Arg Pro Leu Pro Arg Phe Asn Ser Val Pro Leu Thr Asp Thr Gly

465 470 475 480

His Glu Arg Gln Ser Glu Gly Ser Ser Ser Pro Gln Leu Gln Glu Ser

485 490 495

Val Phe His Leu Leu Val Pro Ser Val Ile Leu Val Leu Leu Ala Val

500 505 510

Gly Gly Leu Leu Phe Tyr Arg Trp Arg Arg Arg Ser His Gln Glu Pro

515 520 525

Gln Arg Ala Asp Ser Pro Leu Glu Gln Pro Glu Gly Ser Pro Leu Thr

530 535 540

Gln Asp Asp Arg Gln Val Glu Leu Pro Val

545 550

<210>21

<211>107

<212>PRT

<213>人

<400>21

Met Ala Arg Ala Ala Leu Ser Ala Ala Pro Ser Asn Pro Arg Leu Leu

1 5 10 15

Arg Val Ala Leu Leu Leu Leu Leu Leu Val Ala Ala Gly Arg Arg Ala

20 25 30

Ala Gly Ala Ser Val Ala Thr Glu Leu Arg Cys Gln Cys Leu Gln Thr

35 40 45

Leu Gln Gly Ile His Pro Lys Asn Ile Gln Ser Val Asn Val Lys Ser

50 55 60

Pro Gly Pro His Cys Ala Gln Thr Glu Val Ile Ala Thr Leu Lys Asn

65 70 75 80

Gly Arg Lys Ala Cys Leu Asn Pro Ala Ser Pro Ile Val Lys Lys Ile

85 90 95

Ile Glu Lys Met Leu Asn Ser Asp Lys Ser Asn

100 105

<210>22

<211>106

<212>PRT

<213>人

<400>22

Met Ala His Ala Thr Leu Ser Ala Ala Pro Ser Asn Pro Arg Leu Leu

1 5 10 15

Arg Val Ala Leu Leu Leu Leu Leu Leu Val Gly Ser Arg Arg Ala Ala

20 25 30

Gly Ala Ser Val Val Thr Glu Leu Arg Cys Gln Cys Leu Gln Thr Leu

35 40 45

Gln Gly Ile His Leu Lys Asn Ile Gln Ser Val Asn Val Arg Ser Pro

50 55 60

Gly Pro His Cys Ala Gln Thr Glu Val Ile Ala Thr Leu Lys Asn Gly

65 70 75 80

Lys Lys Ala Cys Leu Asn Pro Ala Ser Pro Met Val Gln Lys Ile Ile

85 90 95

Glu Lys Ile Leu Asn Lys Gly Ser Thr Asn

100 105

<210>23

<211>300

<212>PRT

<213>人

<400>23

Met Arg Ile Ala Val Ile Cys Phe Cys Leu Leu Gly Ile Thr Cys Ala

1 5 10 15

Ile Pro Val Lys Gln Ala Asp Ser Gly Ser Ser Glu Glu Lys Gln Leu

20 25 30

Tyr Asn Lys Tyr Pro Asp Ala Val Ala Thr Trp Leu Asn Pro Asp Pro

35 40 45

Ser Gln Lys Gln Asn Leu Leu Ala Pro Gln Thr Leu Pro Ser Lys Ser

50 55 60

Asn Glu Ser His Asp His Met Asp Asp Met Asp Asp Glu Asp Asp Asp

65 70 75 80

Asp His Val Asp Ser Gln Asp Ser Ile Asp Ser Asn Asp Ser Asp Asp

85 90 95

Val Asp Asp Thr Asp Asp Ser His Gln Ser Asp Glu Ser His His Ser

100 105 110

Asp Glu Ser Asp Glu Leu Val Thr Asp Phe Pro Thr Asp Leu Pro Ala

115 120 125

Thr Glu Val Phe Thr Pro Val Val Pro Thr Val Asp Thr Tyr Asp Gly

130 135 140

Arg Gly Asp Ser Val Val Tyr Gly Leu Arg Ser Lys Ser Lys Lys Phe

145 150 155 160

Arg Arg Pro Asp Ile Gln Tyr Pro Asp Ala Thr Asp Glu Asp Ile Thr

165 170 175

Ser His Met Glu Ser Glu Glu Leu Asn Gly Ala Tyr Lys Ala Ile Pro

180 185 190

Val Ala Gln Asp Leu Asn Ala Pro Ser Asp Trp Asp Ser Arg Gly Lys

195 200 205

Asp Ser Tyr Glu Thr Ser Gln Leu Asp Asp Gln Ser Ala Glu Thr His

210 215 220

Ser His Lys Gln Ser Arg Leu Tyr Lys Arg Lys Ala Asn Asp Glu Ser

225 230 235 240

Asn Glu His Ser Asp Val Ile Asp Ser Gln Glu Leu Ser Lys Val Ser

245 250 255

Arg Glu Phe His Ser His Glu Phe His Ser His Glu Asp Met Leu Val

260 265 270

Val Asp Pro Lys Ser Lys Glu Glu Asp Lys His Leu Lys Phe Arg Ile

275 280 285

Ser His Glu Leu Asp Ser Ala Ser Ser Glu Val Asn

290 295 300

<210>24

<211>295

<212>PRT

<213>人

<400>24

Met Glu His Gln Leu Leu Cys Cys Glu Val Glu Thr Ile Arg Arg Ala

1 5 10 15

Tyr Pro Asp Ala Asn Leu Leu Asn Asp Arg Val Leu Arg Ala Met Leu

20 25 30

Lys Ala Glu Glu Thr Cys Ala Pro Ser Val Ser Tyr Phe Lys Cys Val

35 40 45

Gln Lys Glu Val Leu Pro Ser Met Arg Lys Ile Val Ala Thr Trp Met

50 55 60

Leu Glu Val Cys Glu Glu Gln Lys Cys Glu Glu Glu Val Phe Pro Leu

65 70 75 80

Ala Met Asn Tyr Leu Asp Arg Phe Leu Ser Leu Glu Pro Val Lys Lys

85 90 95

Ser Arg Leu Gln Leu Leu Gly Ala Thr Cys Met Phe Val Ala Ser Lys

100 105 110

Met Lys Glu Thr Ile Pro Leu Thr Ala Glu Lys Leu Cys Ile Tyr Thr

115 120 125

Asp Gly Ser Ile Arg Pro Glu Glu Leu Leu Gln Met Glu Leu Leu Leu

130 135 140

Val Asn Lys Leu Lys Trp Asn Leu Ala Ala Met Thr Pro His Asp Phe

145 150 155 160

Ile Glu His Phe Leu Ser Lys Met Pro Glu Ala Glu Glu Asn Lys Gln

165 170 175

Ile Ile Arg Lys His Ala Gln Thr Phe Val Ala Ser Cys Ala Thr Asp

180 185 190

Val Lys Phe Ile Ser Asn Pro Pro Ser Met Val Ala Ala Gly Ser Val

195 200 205

Val Ala Ala Val Gln Gly Leu Asn Leu Arg Ser Pro Asn Asn Phe Leu

210 215 220

Ser Tyr Tyr Arg Leu Thr Arg Phe Leu Ser Arg Val Ile Lys Cys Asp

225 230 235 240

Pro Asp Cys Leu Arg Ala Cys Gln Glu Gln Ile Glu Ala Leu Leu Glu

245 250 255

Ser Ser Leu Arg Gln Ala Gln Gln Asn Met Asp Pro Lys Ala Ala Glu

260 265 270

Glu Glu Glu Glu Glu Glu Glu Glu Val Asp Leu Ala Cys Thr Pro Thr

275 280 285

Asp Val Arg Asp Val Asp Ile

290 295

<210>25

<211>439

<212>PRT

<213>人

<400>25

Met Pro Leu Asn Val Ser Phe Thr Asn Arg Asn Tyr Asp Leu Asp Tyr

1 5 10 15

Asp Ser Val Gln Pro Tyr Phe Tyr Cys Asp Glu Glu Glu Asn Phe Tyr

20 25 30

Gln Gln Gln Gln Gln Ser Glu Leu Gln Pro Pro Ala Pro Ser Glu Asp

35 40 45

Ile Trp Lys Lys Phe Glu Leu Leu Pro Thr Pro Pro Leu Ser Pro Ser

50 55 60

Arg Arg Ser Gly Leu Cys Ser Pro Ser Tyr Val Ala Val Thr Pro Phe

65 70 75 80

Ser Leu Arg Gly Asp Asn Asp Gly Gly Gly Gly Ser Phe Ser Thr Ala

85 90 95

Asp Gln Leu Glu Met Val Thr Glu Leu Leu Gly Gly Asp Met Val Asn

100 105 110

Gln Ser Phe Ile Cys Asp Pro Asp Asp Glu Thr Phe Ile Lys Asn Ile

115 120 125

Ile Ile Gln Asp Cys Met Trp Ser Gly Phe Ser Ala Ala Ala Lys Leu

130 135 140

Val Ser Glu Lys Leu Ala Ser Tyr Gln Ala Ala Arg Lys Asp Ser Gly

145 150 155 160

Ser Pro Asn Pro Ala Arg Gly His Ser Val Cys Ser Thr Ser Ser Leu

165 170 175

Tyr Leu Gln Asp Leu Ser Ala Ala Ala Ser Glu Cys Ile Asp Pro Ser

180 185 190

Val Val Phe Pro Tyr Pro Leu Asn Asp Ser Ser Ser Pro Lys Ser Cys

195 200 205

Ala Ser Gln Asp Ser Ser Ala Phe Ser Pro Ser Ser Asp Ser Leu Leu

210 215 220

Ser Ser Thr Glu Ser Ser Pro Gln Gly Ser Pro Glu Pro Leu Val Leu

225 230 235 240

His Glu Glu Thr Pro Pro Thr Thr Ser Ser Asp Ser Glu Glu Glu Gln

245 250 255

Glu Asp Glu Glu Glu Ile Asp Val Val Ser Val Glu Lys Arg Gln Ala

260 265 270

Pro Gly Lys Arg Ser Glu Ser Gly Ser Pro Ser Ala Gly Gly His Ser

275 280 285

Lys Pro Pro His Ser Pro Leu Val Leu Lys Arg Cys His Val Ser Thr

290 295 300

His Gln His Asn Tyr Ala Ala Pro Pro Ser Thr Arg Lys Asp Tyr Pro

305 310 315 320

Ala Ala Lys Arg Val Lys Leu Asp Ser Val Arg Val Leu Arg Gln Ile

325 330 335

Ser Asn Asn Arg Lys Cys Thr Ser Pro Arg Ser Ser Asp Thr Glu Glu

340 345 350

Asn Val Lys Arg Arg Thr His Asn Val Leu Glu Arg Gln Arg Arg Asn

355 360 365

Glu Leu Lys Arg Ser Phe Phe Ala Leu Arg Asp Gln Ile Pro Glu Leu

370 375 380

Glu Asn Asn Glu Lys Ala Pro Lys Val Val Ile Leu Lys Lys Ala Thr

385 390 395 400

Ala Tyr Ile Leu Ser Val Gln Ala Glu Glu Gln Lys Leu Ile Ser Glu

405 410 415

Glu Asp Leu Leu Arg Lys Arg Arg Glu Gln Leu Lys His Lys Leu Glu

420 425 430

Gln Leu Arg Asn Ser Cys Ala

435

<210>26

<211>164

<212>PRT

<213>人

<400>26

Met Ser Glu Pro Ala Gly Asp Val Arg Gln Asn Pro Cys Gly Ser Lys

1 5 10 15

Ala Cys Arg Arg Leu Phe Gly Pro Val Asp Ser Glu Gln Leu Ser Arg

20 25 30

Asp Cys Asp Ala Leu Met Ala Gly Cys Ile Gln Glu Ala Arg Glu Arg

35 40 45

Trp Asn Phe Asp Phe Val Thr Glu Thr Pro Leu Glu Gly Asp Phe Ala

50 55 60

Trp Glu Arg Val Arg Gly Leu Gly Leu Pro Lys Leu Tyr Leu Pro Thr

65 70 75 80

Gly Pro Arg Arg Gly Arg Asp Glu Leu Gly Gly Gly Arg Arg Pro Gly

85 90 95

Thr Ser Pro Ala Leu Leu Gln Gly Thr Ala Glu Glu Asp His Val Asp

100 105 110

Leu Ser Leu Ser Cys Thr Leu Val Pro Arg Ser Gly Glu Gln Ala Glu

115 120 125

Gly Ser Pro Gly Gly Pro Gly Asp Ser Gln Gly Arg Lys Arg Arg Gln

130 135 140

Thr Ser Met Thr Asp Phe Tyr His Ser Lys Arg Arg Leu Ile Phe Ser

145 150 155 160

Lys Arg Lys Pro

<210>27

<211>468

<212>PRT

<213>人

<400>27

Met Val Asp Thr Glu Ser Pro Leu Cys Pro Leu Ser Pro Leu Glu Ala

1 5 10 15

Gly Asp Leu Glu Ser Pro Leu Ser Glu Glu Phe Leu Gln Glu Met Gly

20 25 30

Asn Ile Gln Glu Ile Ser Gln Ser Ile Gly Glu Asp Ser Ser Gly Ser

35 40 45

Phe Gly Phe Thr Glu Tyr Gln Tyr Leu Gly Ser Cys Pro Gly Ser Asp

50 55 60

Gly Ser Val Ile Thr Asp Thr Leu Ser Pro Ala Ser Ser Pro Ser Ser

65 70 75 80

Val Thr Tyr Pro Val Val Pro Gly Ser Val Asp Glu Ser Pro Ser Gly

85 90 95

Ala Leu Asn Ile Glu Cys Arg Ile Cys Gly Asp Lys Ala Ser Gly Tyr

100 105 110

His Tyr Gly Val His Ala Cys Glu Gly Cys Lys Gly Phe Phe Arg Arg

115 120 125

Thr Ile Arg Leu Lys Leu Val Tyr Asp Lys Cys Asp Arg Ser Cys Lys

130 135 140

Ile Gln Lys Lys Asn Arg Asn Lys Cys Gln Tyr Cys Arg Phe His Lys

145 150 155 160

Cys Leu Ser Val Gly Met Ser His Asn Ala Ile Arg Phe Gly Arg Met

165 170 175

Pro Arg Ser Glu Lys Ala Lys Leu Lys Ala Glu Ile Leu Thr Cys Glu

180 185 190

His Asp Ile Glu Asp Ser Glu Thr Ala Asp Leu Lys Ser Leu Ala Lys

195 200 205

Arg Ile Tyr Glu Ala Tyr Leu Lys Asn Phe Asn Met Asn Lys Val Lys

210 215 220

Ala Arg Val Ile Leu Ser Gly Lys Ala Ser Asn Asn Pro Pro Phe Val

225 230 235 240

Ile His Asp Met Glu Thr Leu Cys Met Ala Glu Lys Thr Leu Val Ala

245 250 255

Lys Leu Val Ala Asn Gly Ile Gln Asn Lys Glu Ala Glu Val Arg Ile

260 265 270

Phe His Cys Cys Gln Cys Thr Ser Val Glu Thr Val Thr Glu Leu Thr

275 280 285

Glu Phe Ala Lys Ala Ile Pro Gly Phe Ala Asn Leu Asp Leu Asn Asp

290 295 300

Gln Val Thr Leu Leu Lys Tyr Gly Val Tyr Glu Ala Ile Phe Ala Met

305 310 315 320

Leu Ser Ser Val Met Asn Lys Asp Gly Met Leu Val Ala Tyr Gly Asn

325 330 335

Gly Phe Ile Thr Arg Glu Phe Leu Lys Ser Leu Arg Lys Pro Phe Cys

340 345 350

Asp Ile Met Glu Pro Lys Phe Asp Phe Ala Met Lys Phe Asn Ala Leu

355 360 365

Glu Leu Asp Asp Ser Asp Ile Ser Leu Phe Val Ala Ala Ile Ile Cys

370 375 380

Cys Gly Asp Arg Pro Gly Leu Leu Asn Val Gly His Ile Glu Lys Met

385 390 395 400

Gln Glu Gly Ile Val His Val Leu Arg Leu His Leu Gln Ser Asn His

405 410 415

Pro Asp Asp Ile Phe Leu Phe Pro Lys Leu Leu Gln Lys Met Ala Asp

420 425 430

Leu Arg Gln Leu Val Thr Glu His Ala Gln Leu Val Gln Ile Ile Lys

435 440 445

Lys Thr Glu Ser Asp Ala Ala Leu His Pro Leu Leu Gln Glu Ile Tyr

450 455 460

Arg Asp Met Tyr

465

<210>28

<211>505

<212>PRT

<213>人

<400>28

Met Gly Glu Thr Leu Gly Asp Ser Pro Ile Asp Pro Glu Ser Asp Ser

1 5 10 15

Phe Thr Asp Thr Leu Ser Ala Asn Ile Ser Gln Glu Met Thr Met Val

20 25 30

Asp Thr Glu Met Pro Phe Trp Pro Thr Asn Phe Gly Ile Ser Ser Val

35 40 45

Asp Leu Ser Val Met Glu Asp His Ser His Ser Phe Asp Ile Lys Pro

50 55 60

Phe Thr Thr Val Asp Phe Ser Ser Ile Ser Thr Pro His Tyr Glu Asp

65 70 75 80

Ile Pro Phe Thr Arg Thr Asp Pro Val Val Ala Asp Tyr Lys Tyr Asp

85 90 95

Leu Lys Leu Gln Glu Tyr Gln Ser Ala Ile Lys Val Glu Pro Ala Ser

100 105 110

Pro Pro Tyr Tyr Ser Glu Lys Thr Gln Leu Tyr Asn Lys Pro His Glu

115 120 125

Glu Pro Ser Asn Ser Leu Met Ala Ile Glu Cys Arg Val Cys Gly Asp

130 135 140

Lys Ala Ser Gly Phe His Tyr Gly Val His Ala Cys Glu Gly Cys Lys

145 150 155 160

Gly Phe Phe Arg Arg Thr Ile Arg Leu Lys Leu Ile Tyr Asp Arg Cys

165 170 175

Asp Leu Asn Cys Arg Ile His Lys Lys Ser Arg Asn Lys Cys Gln Tyr

180 185 190

Cys Arg Phe Gln Lys Cys Leu Ala Val Gly Met Ser His Asn Ala Ile

195 200 205

Arg Phe Gly Arg Met Pro Gln Ala Glu Lys Glu Lys Leu Leu Ala Glu

210 215 220

Ile Ser Ser Asp Ile Asp Gln Leu Asn Pro Glu Ser Ala Asp Leu Arg

225 230 235 240

Ala Leu Ala Lys His Leu Tyr Asp Ser Tyr Ile Lys Ser Phe Pro Leu

245 250 255

Thr Lys Ala Lys Ala Arg Ala Ile Leu Thr Gly Lys Thr Thr Asp Lys

260 265 270

Ser Pro Phe Val Ile Tyr Asp Met Asn Ser Leu Met Met Gly Glu Asp

275 280 285

Lys Ile Lys Phe Lys His Ile Thr Pro Leu Gln Glu Gln Ser Lys Glu

290 295 300

Val Ala Ile Arg Ile Phe Gln Gly Cys Gln Phe Arg Ser Val Glu Ala

305 310 315 320

Val Gln Glu Ile Thr Glu Tyr Ala Lys Ser Ile Pro Gly Phe Val Asn

325 330 335

Leu Asp Leu Asn Asp Gln Val Thr Leu Leu Lys Tyr Gly Val His Glu

340 345 350

Ile Ile Tyr Thr Met Leu Ala Ser Leu Met Asn Lys Asp Gly Val Leu

355 360 365

Ile Ser Glu Gly Gln Gly Phe Met Thr Arg Glu Phe Leu Lys Ser Leu

370 375 380

Arg Lys Pro Phe Gly Asp Phe Met Glu Pro Lys Phe Glu Phe Ala Val

385 390 395 400

Lys Phe Asn Ala Leu Glu Leu Asp Asp Ser Asp Leu Ala Ile Phe Ile

405 410 415

Ala Val Ile Ile Leu Ser Gly Asp Arg Pro Gly Leu Leu Asn Val Lys

420 425 430

Pro Ile Glu Asp Ile Gln Asp Asn Leu Leu Gln Ala Leu Glu Leu Gln

435 440 445

Leu Lys Leu Asn His Pro Glu Ser Ser Gln Leu Phe Ala Lys Leu Leu

450 455 460

Gln Lys Met Thr Asp Leu Arg Gln Ile Val Thr Glu His Val Gln Leu

465 470 475 480

Leu Gln Val Ile Lys Lys Thr Glu Thr Asp Met Ser Leu His Pro Leu

485 490 495

Leu Gln Glu Ile Tyr Lys Asp Leu Tyr

500 505

<210>29

<211>441

<212>PRT

<213>人

<400>29

Met Glu Gln Pro Gln Glu Glu Ala Pro Glu Val Arg Glu Glu Glu Glu

1 5 10 15

Lys Glu Glu Val Ala Glu Ala Glu Gly Ala Pro Glu Leu Asn Gly Gly

20 25 30

Pro Gln His Ala Leu Pro Ser Ser Ser Tyr Thr Asp Leu Ser Arg Ser

35 40 45

Ser Ser Pro Pro Ser Leu Leu Asp Gln Leu Gln Met Gly Cys Asp Gly

50 55 60

Ala Ser Cys Gly Ser Leu Asn Met Glu Cys Arg Val Cys Gly Asp Lys

65 70 75 80

Ala Ser Gly Phe His Tyr Gly Val His Ala Cys Glu Gly Cys Lys Gly

85 90 95

Phe Phe Arg Arg Thr Ile Arg Met Lys Leu Glu Tyr Glu Lys Cys Glu

100 105 110

Arg Ser Cys Lys Ile Gln Lys Lys Asn Arg Asn Lys Cys Gln Tyr Cys

115 120 125

Arg Phe Gln Lys Cys Leu Ala Leu Gly Met Ser His Asn Ala Ile Arg

130 135 140

Phe Gly Arg Met Pro Glu Ala Glu Lys Arg Lys Leu Val Ala Gly Leu

145 150 155 160

Thr Ala Asn Glu Gly Ser Gln Tyr Asn Pro Gln Val Ala Asp Leu Lys

165 170 175

Ala Phe Ser Lys His Ile Tyr Asn Ala Tyr Leu Lys Asn Phe Asn Met

180 185 190

Thr Lys Lys Lys Ala Arg Ser Ile Leu Thr Gly Lys Ala Ser His Thr

195 200 205

Ala Pro Phe Val Ile His Asp Ile Glu Thr Leu Trp Gln Ala Glu Lys

210 215 220

Gly Leu Val Trp Lys Gln Leu Val Asn Gly Leu Pro Pro Tyr Lys Glu

225 230 235 240

Ile Ser Val His Val Phe Tyr Arg Cys Gln Cys Thr Thr Val Glu Thr

245 250 255

Val Arg Glu Leu Thr Glu Phe Ala Lys Ser Ile Pro Ser Phe Ser Ser

260 265 270

Leu Phe Leu Asn Asp Gln Val Thr Leu Leu Lys Tyr Gly Val His Glu

275 280 285

Ala Ile Phe Ala Met Leu Ala Ser Ile Val Asn Lys Asp Gly Leu Leu

290 295 300

Val Ala Asn Gly Ser Gly Phe Val Thr Arg Glu Phe Leu Arg Ser Leu

305 310 315 320

Arg Lys Pro Phe Ser Asp Ile Ile Glu Pro Lys Phe Glu Phe Ala Val

325 330 335

Lys Phe Asn Ala Leu Glu Leu Asp Asp Ser Asp Leu Ala Leu Phe Ile

340 345 350

Ala Ala Ile Ile Leu Cys Gly Asp Arg Pro Gly Leu Met Asn Val Pro

355 360 365

Arg Val Glu Ala Ile Gln Asp Thr Ile Leu Arg Ala Leu Glu Phe His

370 375 380

Leu Gln Ala Asn His Pro Asp Ala Gln Tyr Leu Phe Pro Lys Leu Leu

385 390 395 400

Gln Lys Met Ala Asp Leu Arg Gln Leu Val Thr Glu His Ala Gln Met

405 410 415

Met Gln Arg Ile Lys Lys Thr Glu Thr Glu Thr Ser Leu His Pro Leu

420 425 430

Leu Gln Glu Ile Tyr Lys Asp Met Tyr

435 440

<210>30

<211>742

<212>PRT

<213>人

<400>30

Met Asp Lys Phe Trp Trp His Ala Ala Trp Gly Leu Cys Leu Val Pro

1 5 10 15

Leu Ser Leu Ala Gln Ile Asp Leu Asn Ile Thr Cys Arg Phe Ala Gly

20 25 30

Val Phe His Val Glu Lys Asn Gly Arg Tyr Ser Ile Ser Arg Thr Glu

35 40 45

Ala Ala Asp Leu Cys Lys Ala Phe Asn Ser Thr Leu Pro Thr Met Ala

50 55 60

Gln Met Glu Lys Ala Leu Ser Ile Gly Phe Glu Thr Cys Arg Tyr Gly

65 70 75 80

Phe Ile Glu Gly His Val Val Ile Pro Arg Ile His Pro Asn Ser Ile

85 90 95

Cys Ala Ala Asn Asn Thr Gly Val Tyr Ile Leu Thr Ser Asn Thr Ser

100 105 110

Gln Tyr Asp Thr Tyr Cys Phe Asn Ala Ser Ala Pro Pro Glu Glu Asp

115 120 125

Cys Thr Ser Val Thr Asp Leu Pro Asn Ala Phe Asp Gly Pro Ile Thr

130 135 140

Ile Thr Ile Val Asn Arg Asp Gly Thr Arg Tyr Val Gln Lys Gly Glu

145 150 155 160

Tyr Arg Thr Asn Pro Glu Asp Ile Tyr Pro Ser Asn Pro Thr Asp Asp

165 170 175

Asp Val Ser Ser Gly Ser Ser Ser Glu Arg Ser Ser Thr Ser Gly Gly

180 185 190

Tyr Ile Phe Tyr Thr Phe Ser Thr Val His Pro Ile Pro Asp Glu Asp

195 200 205

Ser Pro Trp Ile Thr Asp Ser Thr Asp Arg Ile Pro Ala Thr Thr Leu

210 215 220

Met Ser Thr Ser Ala Thr Ala Thr Glu Thr Ala Thr Lys Arg Gln Glu

225 230 235 240

Thr Trp Asp Trp Phe Ser Trp Leu Phe Leu Pro Ser Glu Ser Lys Asn

245 250 255

His Leu His Thr Thr Thr Gln Met Ala Gly Thr Ser Ser Asn Thr Ile

260 265 270

Ser Ala Gly Trp Glu Pro Asn Glu Glu Asn Glu Asp Glu Arg Asp Arg

275 280 285

His Leu Ser Phe Ser Gly Ser Gly Ile Asp Asp Asp Glu Asp Phe Ile

290 295 300

Ser Ser Thr Ile Ser Thr Thr Pro Arg Ala Phe Asp His Thr Lys Gln

305 310 315 320

Asn Gln Asp Trp Thr Gln Trp Asn Pro Ser His Ser Asn Pro Glu Val

325 330 335

Leu Leu Gln Thr Thr Thr Arg Met Thr Asp Val Asp Arg Asn Gly Thr

340 345 350

Thr Ala Tyr Glu Gly Asn Trp Asn Pro Glu Ala His Pro Pro Leu Ile

355 360 365

His His Glu His His Glu Glu Glu Glu Thr Pro His Ser Thr Ser Thr

370 375 380

Ile Gln Ala Thr Pro Ser Ser Thr Thr Glu Glu Thr Ala Thr Gln Lys

385 390 395 400

Glu Gln Trp Phe Gly Asn Arg Trp His Glu Gly Tyr Arg Gln Thr Pro

405 410 415

Lys Glu Asp Ser His Ser Thr Thr Gly Thr Ala Ala Ala Ser Ala His

420 425 430

Thr Ser His Pro Met Gln Gly Arg Thr Thr Pro Ser Pro Glu Asp Ser

435 440 445

Ser Trp Thr Asp Phe Phe Asn Pro Ile Ser His Pro Met Gly Arg Gly

450 455 460

His Gln Ala Gly Arg Arg Met Asp Met Asp Ser Ser His Ser Ile Thr

465 470 475 480

Leu Gln Pro Thr Ala Asn Pro Asn Thr Gly Leu Val Glu Asp Leu Asp

485 490 495

Arg Thr Gly Pro Leu Ser Met Thr Thr Gln Gln Ser Asn Ser Gln Ser

500 505 510

Phe Ser Thr Ser His Glu Gly Leu Glu Glu Asp Lys Asp His Pro Thr

515 520 525

Thr Ser Thr Leu Thr Ser Ser Asn Arg Asn Asp Val Thr Gly Gly Arg

530 535 540

Arg Asp Pro Asn His Ser Glu Gly Ser Thr Thr Leu Leu Glu Gly Tyr

545 550 555 560

Thr Ser His Tyr Pro His Thr Lys Glu Ser Arg Thr Phe Ile Pro Val

565 570 575

Thr Ser Ala Lys Thr Gly Ser Phe Gly Val Thr Ala Val Thr Val Gly

580 585 590

Asp Ser Asn Ser Asn Val Asn Arg Ser Leu Ser Gly Asp Gln Asp Thr

595 600 605

Phe His Pro Ser Gly Gly Ser His Thr Thr His Gly Ser Glu Ser Asp

610 615 620

Gly His Ser His Gly Ser Gln Glu Gly Gly Ala Asn Thr Thr Ser Gly

625 630 635 640

Pro Ile Arg Thr Pro Gln Ile Pro Glu Trp Leu Ile Ile Leu Ala Ser

645 650 655

Leu Leu Ala Leu Ala Leu Ile Leu Ala Val Cys Ile Ala Val Asn Ser

660 665 670

Arg Arg Arg Cys Gly Gln Lys Lys Lys Leu Val Ile Asn Ser Gly Asn

675 680 685

Gly Ala Val Glu Asp Arg Lys Pro Ser Gly Leu Asn Gly Glu Ala Ser

690 695 700

Lys Ser Gln Glu Met Val His Leu Val Asn Lys Glu Ser Ser Glu Thr

705 710 715 720

Pro Asp Gln Phe Met Thr Ala Asp Glu Thr Arg Asn Leu Gln Asn Val

725 730 735

Asp Met Lys Ile Gly Val

740

<210>31

<211>489

<212>PRT

<213>人

<400>31

Met Leu Met Arg Leu Val Leu Thr Val Arg Ser Asn Leu Ile Pro Ser

1 5 10 15

Pro Pro Thr Tyr Asn Ser Ala His Asp Tyr Ile Ser Trp Glu Ser Phe

20 25 30

Ser Asn Val Ser Tyr Tyr Thr Arg Ile Leu Pro Ser Val Pro Lys Asp

35 40 45

Cys Pro Thr Pro Met Gly Thr Lys Gly Lys Lys Gln Leu Pro Asp Ala

50 55 60

Gln Leu Leu Ala Arg Arg Phe Leu Leu Arg Arg Lys Phe Ile Pro Asp

65 70 75 80

Pro Gln Gly Thr Asn Leu Met Phe Ala Phe Phe Ala Gln His Phe Thr

85 90 95

His Gln Phe Phe Lys Thr Ser Gly Lys Met Gly Pro Gly Phe Thr Lys

100 105 110

Ala Leu Gly His Gly Val Asp Leu Gly His Ile Tyr Gly Asp Asn Leu

115 120 125

Glu Arg Gln Tyr Gln Leu Arg Leu Phe Lys Asp Gly Lys Leu Lys Tyr

130 135 140

Gln Val Leu Asp Gly Glu Met Tyr Pro Pro Ser Val Glu Glu Ala Pro

145 150 155 160

Val Leu Met His Tyr Pro Arg Gly Ile Pro Pro Gln Ser Gln Met Ala

165 170 175

Val Gly Gln Glu Val Phe Gly Leu Leu Pro Gly Leu Met Leu Tyr Ala

180 185 190

Thr Leu Trp Leu Arg Glu His Asn Arg Val Cys Asp Leu Leu Lys Ala

195 200 205

Glu His Pro Thr Trp Gly Asp Glu Gln Leu Phe Gln Thr Thr Arg Leu

210 215 220

Ile Leu Ile Gly Glu Thr Ile Lys Ile Val Ile Glu Glu Tyr Val Gln

225 230 235 240

Gln Leu Ser Gly Tyr Phe Leu Gln Leu Lys Phe Asp Pro Glu Leu Leu

245 250 255

Phe Gly Val Gln Phe Gln Tyr Arg Asn Arg Ile Ala Met Glu Phe Asn

260 265 270

His Leu Tyr His Trp His Pro Leu Met Pro Asp Ser Phe Lys Val Gly

275 280 285

Ser Gln Glu Tyr Ser Tyr Glu Gln Phe Leu Phe Asn Thr Ser Met Leu

290 295 300

Val Asp Tyr Gly Val Glu Ala Leu Val Asp Ala Phe Ser Arg Gln Ile

305 310 315 320

Ala Gly Arg Ile Gly Gly Gly Arg Asn Met Asp His His Ile Leu His

325 330 335

Val Ala Val Asp Val Ile Arg Glu Ser Arg Glu Met Arg Leu Gln Pro

340 345 350

Phe Asn Glu Tyr Arg Lys Arg Phe Gly Met Lys Pro Tyr Thr Ser Phe

355 360 365

Gln Glu Leu Val Gly Glu Lys Glu Met Ala Ala Glu Leu Glu Glu Leu

370 375 380

Tyr Gly Asp Ile Asp Ala Leu Glu Phe Tyr Pro Gly Leu Leu Leu Glu

385 390 395 400

Lys Cys His Pro Asn Ser Ile Phe Gly Glu Ser Met Ile Glu Ile Gly

405 410 415

Ala Pro Phe Ser Leu Lys Gly Leu Leu Gly Asn Pro Ile Cys Ser Pro

420 425 430

Glu Tyr Trp Lys Pro Ser Thr Phe Gly Gly Glu Val Gly Phe Asn Ile

435 440 445

Val Lys Thr Ala Thr Leu Lys Lys Leu Val Cys Leu Asn Thr Lys Thr

450 455 460

Cys Pro Tyr Val Ser Phe Arg Val Pro Asp Ala Ser Gln Asp Asp Gly

465 470 475 480

Pro Ala Val Glu Arg Pro Ser Thr Glu

485

<210>32

<211>122

<212>PRT

<213>人

<400>32

Met Lys Leu Leu Thr Gly Leu Val Phe Cys Ser Leu Val Leu Gly Val

1 5 10 15

Ser Ser Arg Ser Phe Phe Ser Phe Leu Gly Glu Ala Phe Asp Gly Ala

20 25 30

Arg Asp Met Trp Arg Ala Tyr Ser Asp Met Arg Glu Ala Asn Tyr Ile

35 40 45

Gly Ser Asp Lys Tyr Phe His Ala Arg Gly Asn Tyr Asp Ala Ala Lys

50 55 60

Arg Gly Pro Gly Gly Val Trp Ala Ala Glu Ala Ile Ser Asp Ala Arg

65 70 75 80

Glu Asn Ile Gln Arg Phe Phe Gly His Gly Ala Glu Asp Ser Leu Ala

85 90 95

Asp Gln Ala Ala Asn Glu Trp Gly Arg Ser Gly Lys Asp Pro Asn His

100 105 110

Phe Arg Pro Ala Gly Leu Pro Glu Lys Tyr

115 120

<210>33

<211>26

<212>DNA

<213>人

<400>33

agatattgca cgggagaata tacaaa 26

<210>34

<211>27

<212>DNA

<213>人

<400>34

tcaattcctg aaattaaagt tcggata 27

<210>35

<211>23

<212>DNA

<213>人

<400>35

tctgcagagt tggaagcact cta 23

<210>36

<211>21

<212>DNA

<213>人

<400>36

gccgaggctt ttctaccaga a 21

<210>37

<211>20

<212>DNA

<213>人

<400>37

catggcttga tcagcaagga 20

<210>38

<211>21

<212>DNA

<213>人

<400>38

tggaagtgtg ccctgaagaa g 21

<210>39

<211>21

<212>DNA

<213>人

<400>39

aagcagcacc agcaagtgaa g 21

<210>40

<211>21

<212>DNA

<213>人

<400>40

tcatggcctg tgtcagtcaa a 21

<210>41

<211>22

<212>DNA

<213>人

<400>41

acatgccagc cactgtgata ga 22

<210>42

<211>21

<212>DNA

<213>人

<400>42

ccctgccttc acaatgatct c 21

<210>43

<211>23

<212>DNA

<213>人

<400>43

ggaattcacc tcaagaacat cca 23

<210>44

<211>23

<212>DNA

<213>人

<400>44

agtgtggcta tgacttcggt ttg 23

<210>45

<211>22

<212>DNA

<213>人

<400>45

cagccacaag cagtccagat ta 22

<210>46

<211>24

<212>DNA

<213>人

<400>46

cctgactatc aatcacatcg gaat 24

<210>47

<211>21

<212>DNA

<213>人

<400>47

ccaggtgctc cacatgacag t 21

<210>48

<211>24

<212>DNA

<213>人

<400>48

aaacaaccaa caacaaggag aatg 24

<210>49

<211>21

<212>DNA

<213>人

<400>49

cgtctccaca catcagcaca a 21

<210>50

<211>22

<212>DNA

<213>人

<400>50

tcttggcagc aggatagtcc tt 22

<210>51

<211>22

<212>DNA

<213>人

<400>51

gcagaccagc atgacagatt tc 22

<210>52

<211>20

<212>DNA

<213>人

<400>52

gcggattagg gcttcctctt 20

<210>53

<211>23

<212>DNA

<213>人

<400>53

tgaagttcaa tgcactggaa ctg 23

<210>54

<211>20

<212>DNA

<213>人

<400>54

caggacgatc tccacagcaa 20

<210>55

<211>23

<212>DNA

<213>人

<400>55

tggagtccac gagatcattt aca 23

<210>56

<211>19

<212>DNA

<213>人

<400>56

agccttggcc ctcggatat 19

<210>57

<211>21

<212>DNA

<213>人

<400>57

cactgagttc gccaagagca t 21

<210>58

<211>23

<212>DNA

<213>人

<400>58

cacgccatac ttgagaaggg taa 23

<210>59

<211>23

<212>DNA

<213>人

<400>59

gctagtgatc aacagtggca atg 23

<210>60

<211>18

<212>DNA

<213>人

<400>60

gctggcctct ccgttgag 18

<210>61

<211>22

<212>DNA

<213>人

<400>61

tgttcggtgt ccagttccaa ta 22

<210>62

<211>22

<212>DNA

<213>人

<400>62

tgccagtggt agagatggtt ga 22

<210>63

<211>22

<212>DNA

<213>人

<400>63

gggacatgtg gagagcctac tc 22

<210>64

<211>21

<212>DNA

<213>人

<400>64

catcatagtt cccccgagca t 21

Claims

1.一种制备用于早期检测结肠直肠癌、肺癌、前列腺癌、乳腺癌、阿尔茨海默病和ALS的试剂组合物的方法，所述方法包括：

合成来自SEQ.ID NOs 33-64的每种多聚核苷酸对的引物对；

使用稀释剂，将每种所述引物的多种独立的储液调整到至少一种需要的浓度；

将每种所述引物的每份所述储液等分到多个容器中；和

将所述多个容器在长期保存条件下保存。

2.权利要求1的方法，其中所述方法还包括将每种所述引物对的等分储液冻干。

3.一种用于结肠直肠癌、肺癌、前列腺癌、乳腺癌、阿尔茨海默病和ALS早期检测的方法，所述方法包括：

通过非侵入性的或最低程度侵入性的方法从大体上看起来正常的组织获得组织样品；

从所述样品分离RNA；

使用选自由SEQ.ID NOs 33-64组成的组的多个引物对，从RNA样品扩增cDNA拷贝，以检测选自SEQ.ID NOs.1-16的多聚核苷酸组；

量化扩增的cDNA拷贝；和

使用量化的扩增的cDNA拷贝来评估对于结肠直肠癌、肺癌、前列腺癌、乳腺癌、阿尔茨海默病和ALS的至少一种疾病的疾病进展和治疗功效中的至少一种。

4.权利要求3的方法，其中所述获得步骤还包括取样直肠黏膜细胞。

5.权利要求3的方法，其中所述获得步骤还包括采血、粪便取样和进行直肠组织活检的一种。

6.权利要求3的方法，其中所述使用步骤还包括：

通过多变量分析进行分析组织样品cDNA的量化水平；

将组织样品cDNA量化水平的多变量分析与多种对照数据进行比较，其中所述比较确定与对照数据的差异显著性，从而评估结肠直肠癌的存在。

7.权利要求6的方法，其中所述分析步骤还包括使用ANOVA检测和Mahalanobis距离检测的一种。

8.一种用于结肠直肠癌早期检测和用于评估直肠结肠癌治疗效果的方法，所述方法包括步骤：

通过非侵入性的或最低程度侵入性的方法获得组织样品，所述组织样品含有大体看起来无癌的细胞；

产生具有针对SEQ.ID NOs 17-32确定的每种多肽的不同特异性的多种抗体；

用所述多种抗体检测SEQ.ID NOs 17-32确定的多肽组中的多肽表达，其中所述检测步骤允许量化所述抗体与所述多肽的特异性结合；

基于所量化的特异性抗体结合，量化多肽组中每种不同多肽的水平；和

分析多肽组中每种不同多肽的量化水平，其中所述量化水平用来评估结肠直肠癌的存在、进展和治疗中的至少一种。

9.权利要求8的方法，其中所述获得步骤还包括取样血液、取样粪便、擦拭结肠细胞和进行直肠组织活检的一种。

10.一种用于分析监测结肠直肠癌的早期检测和治疗的数据的方法，所述方法包括下列步骤：

从患者样品获得选自SEQ.ID Nos.1-16的多聚核苷酸的多种cDNA的量化水平，其中所述样品通过非侵入性的方法或最低程度侵入性的方法采取；

应用多变量统计学分析，将患者样品的所述数据与多种存储的对照数据比较；和

基于所述比较，做出关于结肠直肠癌的诊断、结肠直肠癌的进展和对于患者的治疗效果的一种的决断。

11.一种具有存储于其上的指示的机器可读介质，当通过一种或多种处理器执行时，其使得系统：

获得SEQ.ID NOs.1-16列出的多聚核苷酸的量化的cDNA水平的数据，其中所述量化的cDNA水平来自于患者组织样品和对照组织样品；

使用至少一种多变量统计学分析，将患者组织样品的量化的cDNA水平与对照组织样品的量化的cDNA水平相比较；和

提供所述多变量统计学分析用于由受过评估结肠直肠癌训练的个体进行评估。

12.一种包含在传送介质中的计算机信号，其包括：

包括用于获得选自SEQ.ID NOs.1-16的多聚核苷酸的量化的cDNA水平的指示的编码部分，其中所述量化的cDNA水平来自于患者组织样品；

包括用于使用多变量统计学分析将来自患者组织样品的量化的cDNA水平与多种对照数据相比较的指示的编码部分；和

包括用于基于所述比较对患者组织样品做出结肠直肠癌诊断的指示的编码部分。

13.一种包含在传送介质中的计算机信号，其包括：

包括用于获得选自SEQ.ID NOs.17-33的多肽的量化水平的编码部分，其中所述多肽的量化水平来自于含有结肠黏膜细胞的患者样品；

包括用于使用多变量统计学分析将来自患者样品的量化的多肽水平与多种对照数据相比较的指示的编码部分；和

包括基于所述比较对于结肠直肠癌诊断、结肠直肠癌进展和结肠直肠癌治疗效果中的至少一种的至少一种指示的编码部分。

14.一种用于结肠直肠癌早期检测的试剂盒，所述试剂盒包括：

接收通过非侵入性的方法获得的含有直肠黏膜细胞的样品的收集容器，其中所述收集容器被设置以稳定并且保存所述样品；和

用于分析多聚核苷酸表达水平的至少一种试剂，其中所述多聚核苷酸选自SEQ.ID Nos.1-16。

15.一种用于检测结肠直肠癌的试剂盒，所述试剂盒包括：

擦拭取样和样品转移系统，其用于最低程度侵入性地取样直肠黏膜细胞，所述系统包括：

被设置以从直肠采集结肠黏膜细胞的药签；和

当采样后用于接收所述药签的收集容器，其中所述收集容器被设置以稳定、提取和保存所述样品；和

16.一种用于药物筛选的方法，所述方法包括下述步骤：

为结肠直肠癌、肺癌、前列腺癌、乳腺癌、阿尔茨海默病和ALS的至少一种选择模式生物系统；

应用适当的模式生物系统，选择至少一种有希望的药物进行筛选；

从SEQ.ID 1-32确定的生物标记组选择至少2种生物标记；

将所述至少一种有希望的药物定量给予所述模式生物系统；和

作为所述定量给药步骤的函数，监测模式生物系统种至少2种生物标记的应答。

17.权利要求16的方法，其还包括：基于所述监测步骤，确定所述有希望的药物的效果。