[go: up one dir, main page]

CN101065393A - 用于结肠直肠癌早期检测的药物筛选和分子诊断检测:试剂、方法及其试剂盒 - Google Patents

用于结肠直肠癌早期检测的药物筛选和分子诊断检测:试剂、方法及其试剂盒 Download PDF

Info

Publication number
CN101065393A
CN101065393A CNA2005800330138A CN200580033013A CN101065393A CN 101065393 A CN101065393 A CN 101065393A CN A2005800330138 A CNA2005800330138 A CN A2005800330138A CN 200580033013 A CN200580033013 A CN 200580033013A CN 101065393 A CN101065393 A CN 101065393A
Authority
CN
China
Prior art keywords
leu
ser
glu
ala
pro
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CNA2005800330138A
Other languages
English (en)
Inventor
南希·M·李
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
IntelliGeneScan Inc
Original Assignee
IntelliGeneScan Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by IntelliGeneScan Inc filed Critical IntelliGeneScan Inc
Publication of CN101065393A publication Critical patent/CN101065393A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N2800/00Detection or diagnosis of diseases
    • G01N2800/52Predicting or monitoring the response to treatment, e.g. for selection of therapy based on assay results in personalised medicine; Prognosis

Landscapes

  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明公开了一种早期检测结肠直肠癌(“CRC”)的新方法,其使用分子诊断检测来评估用于结肠直肠癌早期检测的大体上看起来正常的结肠组织。所述大体上看起来正常的结肠黏膜细胞可以通过非侵入性的或最低程度侵入性的方法收集。本发明还公开了新型生物标记组用于药物筛选的应用。这样的生物标记组可以完全或部分用作监测有前景的药物在病理干涉中的效用的替代终端,所述病理诸如癌症,例如CRC、肺癌、前列腺癌和乳腺癌,和神经退行性疾病,例如阿尔茨海默病和ALS。

Description

用于结肠直肠癌早期检测的药物筛选和分子诊断检测:试剂、方法及其试剂盒
                        优先权要求
美国临时专利申请号60/614,746,题目为MOLECULARDIAGNOSTIC TEST FOR EARLY DETECTION OF COLORECTALCANCER:REAGENTS,METHODS,AND KITS THEREOF,由Nancy M.Lee,等.于2004年9月30日提交(Attorney Docket No.NLEE-01001US0);
美国临时专利申请号60/651,344,题目为METHODS OF USE OF ABIOMARKER PANEL FOR DRUG SCREENING,由Nancy M.Lee,等.于2005年2月8日提交(Attorney Docket No.NLEE-01002US0);和
美国专利申请号1/_,_,题目为DRUG SCREENING ANDMOLECULAR DIAGNOSTIC TEST FOR EARLY DETECTION OFCOLORECTAL CANCER:REAGENTS,METHODS,AND KITSTHEREOF,由Nancy M.Lee,等.于2005年9月29日提交(Attorney DocketNo.NLEE-01001US1)。
                 相关申请的交叉参考
本申请与由Nancy M.Lee等于2004年7月14日提交的题目为“Biomarker Panel for Colorectal Cancer”的PCT/US2004/022594相关,它要求由Nancy M.Lee等于2003年7月18日提交的题目为″MolecularBiomarker Panel for Determination of Colorectal Cancer″的美国临时申请号60/488,660(Attorney Docket No.CPMC-01000US0)的优先权,并且还要求由Nancy M.Lee等于2003年10月22日提交的题目为″Biomarker Panel forColorectal Cancer″的美国专利申请号10/690,880(Attorney Docket No.CPMC-01000US1)的优先权,每一申请通过参考完全结合于此。
核苷酸和/或氨基酸序列列表以计算机可读的形式和硬拷贝(hard-copy)包含在本申请中。以计算机可读形式包含的信息通过参考完全结合于此。计算机可读形式的信息还包含在磁盘上,并且在磁盘上提交的这样的信息通过参考完全结合于此。1号压缩磁盘包含下述文件:NLEE1001WO0.ST25.txt(9/30/2005产生,96K)。提交的磁盘总数为1。
                       背景
本公开内容的技术领域涉及用于结肠直肠癌(“CRC”)早期检测的试剂、方法和试剂盒,和用于筛选对病理诸如癌症和神经退行性疾病治疗有效的药物的方法,所述癌症例如CRC、肺癌、前列腺癌和乳腺癌,所述神经退行性疾病例如阿尔茨海默病和ALS。这些试剂、方法和试剂盒基于一组生物标记,所述生物标记有效用于CRC和其它这样的病理的危险评估、早期检测、建立预后、干涉评估、复发,以及关于治疗干涉的药物发明。
在医学领域,很久以来就开始探求用于CRC危险评估和早期检测的临床方法。目前,CRC是西方国家中癌症-相关的死亡中的第二主要原因。通过十几年的关于CRC的研究清楚显现出的一幅图像就是,早期检测是增加生存率的关键。
因此,对于CRC早期检测的一种长期探求的途径已经成为对于有效进行CRC早期检测并且因此有效地用于CRC治疗的生物标记的寻求。自从发现了癌胚抗原(“CEA”),对于有效用于CRC早期检测的生物标记的寻求已经持续了四十多年。它还对于在与CRC早期诊断检测联合应用的取样方法成为最低程度侵入性或非侵入性是有利的。非侵入性和最低程度侵入性的取样方法增加了患者的顺应性,并且通常减少了成本。另外,用于分析生物分析典型的复杂的、多变量数据的生物信息学方法,其基于这样的数据设定产生可靠的诊断评估,也是理想的。
对于许多类型癌症诸如CRC、肺癌、前列腺癌和乳腺癌的治疗干涉,包括手术、化学治疗和放射治疗、以及它们的组合。对于CRC,除了寻找早期检测的非侵入性方法之外,继续研究和开发的当前领域在药物开发领域内。
通过十几年的关于CRC的研究已经清楚地显现出这样一副画面,伴随有效的治疗干涉的早期检测是增加存活率的关键。到目前为止,CRC治疗中最常用的药物是5-氟尿嘧啶(“5FU”),其通常与叶酸维生素、亚叶酸组合进行静脉内施用。当转移已经发生,并且癌症已经扩散到机体的不同部分时,使用一种叫作初级化学治疗的策略。对于CRC,初级化学治疗的现有策略是施用口服形式的5FU、卡培他滨,其与下列各项组合:盐酸伊立替康和山梨醇注射剂,一种拓扑异构酶I抑制因子,或奥沙利铂,一种抑制DNA合成的有机金属的、含有铂的药物。
目前,对于CRC新药开发的策略包括两个研究领域:血管生成抑制剂和信号传导抑制剂。
新的生物药物包括基于蛋白和核糖酶的治疗剂。基于人源化抗体的治疗剂包括实例诸如Erbitux和Avastin。Erbitux,一种信号传导抑制剂,目的是抑制癌细胞表面上的表皮生长因子受体(“EGFR”)。Avastin,一种血管生成抑制剂,目的是抑制已知促进血管生长的血管内皮生长因子(“VEGF”)。另外,血管酶(Angiozyme),一种基于核糖酶治疗的实例,是针对VEGF-R1受体表达的血管生成抑制剂。基于传统小分子的新药包括实例诸如Iressa,其基于喹唑啉模板,并且作用为信号传导抑制剂,和SU11248,其基于吲哚满酮模板,作用为抗血管生成抑制剂。
对于这些CRC治疗的新生药物仍然存在许多潜在的缺点和不确定性。对于许多有希望的候选药物,除了典型的禁忌征候,诸如反胃、呕吐、头痛和腹泻,已经观察到其它更严重的副作用,诸如肠胃穿孔、升高或降低的血压、极度疲劳和内出血。另外,尽管许多基于血管生产抑制或信号传导抑制的药物治疗看起来是有希望的,但是它们处于临床试验的非常早期的阶段。
因此,在本领域中存在对于生物标记和生物信息方法的需要,所述生物标记有效地早期检测CRC,伴随着最低程度或非侵入性的取样方法,所述生物信息方法与生物标记一起为CRC的早期检测产生强有力的诊断检测。本领域中还存在对于药物研发的需要,其可以在诊断患有病状的患者的癌症发展之前提供有效的治疗,同时将严重的副作用最小化,所述病状诸如癌症,例如CRC、肺癌、前列腺癌和乳腺癌,以及神经退行性疾病,例如阿尔茨海默病和ALS。
                    附图简述
图1是列出本公开的发明的一组生物标记的序列表的实施方案。
图2是用图1生物标记组的一方面以及本公开发明的生物信息学评估的一方面评估的对照受试者相对测试受试者的分布曲线。
图3显示基因PPAR-γ、IL-8、SAA 1和COX-2的log(base2)表达值的分布和它们的截断点。
图4A和4B显示不同基因的表达在患有结肠癌家族病史的个体的MNCM的不同位点改变。
图5显示用于评估数据的生物信息学方法的一方面的流程图。
图6是对于结肠黏膜细胞最低程度侵入性取样的擦拭取样(swabsampling)和转运系统的实施方案。
图7是描述药物筛选内容一方面的流程图。
图8是描述药物筛选内容另一方面的流程图。
                            详述
到目前为止,通过腺瘤性结肠息肉(“APC”)、p53和Ki-ras基因,以及相应的蛋白,及其参与调控的相关途径的研究,已经获得了对CRC生物学的更多的理解。然而,在对于具体的基因、其表达、蛋白产物和调控的研究,与理解什么基因是关键包含在用于CRC分析的组内的之间存在明显的差异,所述用于CRC分析的组有效用于管理疾病患者的护理。对于CRC所建议的组包括APC、p53和Ki-ras以及微卫星不稳定标记基因BAT-26的特异性点突变。
对于CRC,很久以来就开始寻求用于危险评估和CRC早期检测的生物标记。危险评估和早期检测之间的差异是关于获得性CRC确定性的程度。用于危险评估的生物标记在一时间间隔内赋予低于100%的CRC确定性,而用于早期检测的生物标记在特定的时间间隔内赋予疾病发作的几乎100%的确定性。危险因子可以用作未诊断患有癌症的个体的替代终端(surogate endpoint),条件是在所述替代终端和确定的结果之间存在确定的关系。确定的CRC终端的实例是腺瘤性息肉的实例。已经确定的是,对于后来发展CRC的个体,腺瘤性息肉的发生是必要非充分条件。这由这样的事实证明,即,所有侵入前癌症损伤的90%是腺瘤性息肉或先兆,但是不是所有具有腺瘤性息肉的个体后来都继续发展成CRC。
腺瘤性息肉已经被确定为CRC的替代终端,并且腺瘤性息肉是通过结肠镜检或乙状结肠镜肉眼可确认的。在这样的侵入性方法中,组织活检样品可以取自用于组织的组织学评估的息肉或损伤。本文公开的分子诊断方法用于大体上看起来正常的结肠黏膜细胞,其不是来自肉眼可确定的息肉或损伤。然而,正如在本文中进一步公开的那样,侵入性方法不必用来获得患者样品用于组织学评估。非侵入性或最低程度侵入性方法可以用来获得,例如,血液样品、粪便样品、或大体上看起来正常的直肠细胞的擦拭取样,在这些样品上可以进行分子诊断检测以评估CRC的存在或不存在。对于CRC早期检测的早先描述的方法没有公开大体上看起来正常的结肠黏膜细胞(直肠细胞的组织活检或擦拭取样)、血液样品和/或粪便样品的非侵入性或最低程度侵入性的收集,之后进行分子和/或蛋白表达诊断检测,其可以在表明CRC是显而易见的任何不利组织学变化之前检测到组织中的变化。
图1是给出本公开内容中包含的序列表概述的表格。图1的表格列出实施本公开发明所用的一组生物标记。生物标记组的一个实施方案是由SEQ.ID NOs 1-16给出的16个确定的编码序列,而生物标记组的另一个实施方案是由SEQ.ID NOs 17-32给出的16个确定的蛋白序列。这两个实施方案代表为CRC早期检测提供必要的选择性和灵敏性的分子标记组。应该理解,所述序列表中所述的生物标记的片段和变体也是用于CRC早期检测的实施方案组中的有效生物标记。片段意指在序列表中的多聚核苷酸或多肽的任何不完整或分离的片段。此外,应该认识到,几乎每天都要宣布关于基因变体,特别是处于热点研究中的那些基因,诸如参与疾病如癌症的基因的新发现。因此,给出的序列表对于现在报道的基因是示例性的,但是应该认识到,出于分析方法学目的,基因的变体及它们的片段也包含在内。
在图1中,表格中第1-16项是生物标记组的一方面,其为多聚核苷酸编码序列,并且包括基因的命名和缩写。图1的第17-32项是生物标记组的另一个实施方案,其为与第1-16项的编码序列相对应的蛋白或多肽、氨基酸序列。由国家卫生研究院(National Institutes of Health(“NIH”))定义的生物标记是具体的生物特征的分子指示剂;可以用来测定疾病进展或治疗效果的生物化学特征或方面。生物标记组是生物标记的选择,其综合在一起可以用来测定疾病进展或治疗效果。生物标记可以是各种种类的分子。如先前所提到的,存在对于具有有效用于CRC早期检测所需的选择性和灵敏性的CRC生物标记的需求。因此,本文所公开的一个实施方案是选择一套在提供CRC早期检测根据中区分的有效的生物标记。
在本公开内容的一方面,对于CRC的早期检测,从通过非侵入性或最低程度侵入性方法取自患者的样品的细胞而确定由SEQ.ID NOs 1-16显示的多聚核苷酸的表达水平。考虑的方法包括血液取样、粪便取样和直肠细胞擦拭取样或活组织检查。在本领域内,多聚核苷酸表达水平的这样的分析通常叫作基因表达分布作图。对于基因表达分布作图,测定样品中mRNA水平作为生物状态的主要指示因子——在这一情形中,作为CRC的指示因子。对于分析基因表达分布作图的一种最常见的方法是,使用已知为反转录的方法从生物样品(所述样品通过非-或者最低程度侵入性方法取自上文公开的患者)的mRNA产生多个拷贝。在反转录方法中,通过本领域公知的方法,将样品的mRNA从生物样品细胞分离。然后,将所述mRNA用于产生mRNA最初从其转录的对应的DNA序列拷贝。在反转录扩增过程中,产生的DNA拷贝在基因中没有调控区(即,内含子)。因此,这些由mRNA制成的多个拷贝叫作“cDNA”,其代表互补的或复制的DNA。第33-64项是成套的引物,其可以用于在第1-16项列出的每种生物标记的反转录过程。SEQ.ID NOs 1-64中确定的所有核苷酸和氨基酸生物标记序列可以在附上的打印输出中找到,并且包括本申请的主旨,并且可以在磁盘上找到,所述磁盘作为本申请的一部分包含于此并且通过参考结合于此。
由于反转录方法与样品中初始mRNA水平成比例地扩增cDNA拷贝,它已经成为允许鉴定并且量化生物样品中存在的即使低水平的mRNA的标准方法。在任何具体的生物状态,基因可以被增量调控或减量调控,并且因此mRNA水平据此转变。
在本公开内容的一方面,基因表达分布作图的方法包括,在通过非-或最低程度-侵入性方法,诸如血液取样、粪便取样、直肠细胞擦拭取样、和/或直肠细胞组织活检而从患者采取的生物样品中,选自SEQ.ID NOs.1-16的生物标记组的至少2种生物标记的cDNA水平的定量测量。采取的组织不必是明显患病的;实际上,本公开的发明考虑用于评估即使大体上看起来正常(grossly normal-appearing)的细胞而进行CRC检测。这样的基因表达分布作图方法需要使用引物、酶和用于cDNAs制备、检测和定量的其它试剂。从样品mRNA产生cDNA的方法叫作反转录酶聚合酶链式反应(“RT-PCR”)。SEQ.ID NOs 33-64列出的引物特别适用于基于生物标记组中公开的生物标记应用RT-PCR进行基因表达分布作图。应用Primer Express Software(Applied Biosystems,Foster City,CA)设计了一系列引物。选择特殊的候选,然后检测证实只有cDNA得到扩增而没有受到基因组DNA的污染。据此,特别设计、选择并且检测了SEQ.ID NOs 33-64列出的引物。
在后来从分离的细胞RNA产生cDNA的步骤中,SEQ.ID NOs 33-64列出的引物是重要的,用于在实时PCR中定量地扩增目的基因表达产物的拷贝。最理想的引物序列和最理想的引物长度是引物设计的主要考虑。最理想的引物序列可以影响引物与模板结合的特异性和灵敏性。认为18-30个碱基的引物长度是最理想的范围。理论上,18个碱基是代表独特序列的最短长度,其在大多数真核基因组中将在唯一一个位置杂交。SEQ.ID NOs 33-64列出的引物在引物长度上在21-27个碱基范围,并且设计和有效用来扩增选自SEQ.ID NOs 1-16的核苷酸组的cDNA。引物的特异性通过在10%聚丙烯酰胺凝胶电泳(“PAGE”)上的单一产物,和PCR产物的单一解离曲线而证明。
一旦引物已经设计,并且验证了特异性,它们可以大量合成,并且保存以便方便地用于将来应用。由于PCR反应对缓冲液浓度和缓冲液组成敏感,所以引物应该保持在不干扰扩增反应的适宜的稀释剂中。适宜的稀释剂的一个实例是10mM Tris缓冲液,有或无1mM EDTA,这取决于对于EDTA的检测灵敏性。备选地,用于引物的另一适宜的稀释剂的实例是没有核酸酶的去离子水。引物可以等分在适当的容器中,诸如硅化管中,并且如果需要的话将其冻干。液体或冻干的样品优选地保存在定义为生物样品长期保存的冷藏温度,在约-20℃到约-70℃。扩增反应中引物的浓度典型地在0.1-0.5mM。从储液到最终反应混合物的典型的稀释因子约10倍,以便等分的引物储液典型地在约1和5mM之间。
除了SEQ.ID Nos.33-64列出的特别设计的引物外,对于RT-PCR还需要下列试剂,例如含有二核苷酸三磷酸混合物的试剂,其具有全部4种二核苷酸三磷酸(例如,dATP,dGTP,dCTP和dTTP),具有反转录酶的试剂,和具有热稳定性DNA聚合酶的试剂。另外,对于RT-PCR过程还需要缓冲液、抑制剂和激活剂。
图2描述用于CRC早期检测的生物信息学数据减少方法的一方面,其显示17名对照(左)的Mahalanobis距离分布,其与14名具有CRC家族病史的个体(中)和24名患有息肉的个体(右)相比较。使用选自SEQ.ID NOs.1-16的多聚核苷酸的生物标记组,评估从大体上看起来正常的结肠黏膜组织采取的组织样品。对于每一对照和检测受试者,关于由选自SEQ.ID NOs 1-16的多聚核苷酸代表的16种基因的每一种的基因表达水平的平均数在log base 2域计算。然后,基于多变量的正态分布,为对照确定16维空间的多变量平均数,以确定正常表达水平的界限。对于每一对照,测定其它16个对照的多变量平均数的Mahalanobis距离(“M-dist”),而对17个对照的多变量平均数确定每一名检测受试者的M-dist。在图2显示的每一组中,来自单一个体的所有组织活检形成垂直的一排。对于患有息肉的个体,星号标记来自患有增生性息肉的个体的组织活检。水平线表示具有16自由度的-卡方分布的95%ile。在这一线上的所有值(对应约25的M-dist)在p<0.05水平上不同于对照的平均值。所述数据清楚地表明,在检测受试者的大体正常的结肠黏膜组织样品中存在改变的基因表达模式。因此,所述数据证明使用选自SEQ.ID NOs.1-16的多聚核苷酸的生物标记组的诊断检测的增强的灵敏性和选择性。
图3显示使用选自SEQ.ID Nos.1-16的多聚核苷酸的表达分布作图用于评估所分析的样品数据的生物信息学方法的一方面的流程图300。使用选自SEQ.ID Nos.1-16的多聚核苷酸组,用于分析分子诊断检测的基因表达数据的生物信息学分析的目的是使用异常(abnormality)的单一的、易于计算的测定。由于综合看来多变量分析确定所有表达水平变化的显著性,所以需要通过多变量分析对选自SEQ.ID NOs 1-16全体的所有基因的表达模式进行分析。存在一些种类的多变量检测,其可以有效用于生物信息学分析,所述生物信息学分析用于评估使用本文公开的分子诊断检测而检测的患者样品中结肠直肠癌的存在或不存在。用于评估使用选自SEQ.ID NOs 1-16的多聚核苷酸生物标记组而检测的患者样品数据的多变量分析的实例包括ANOVA和Mahalanobis距离(“M-Dist”)检测。
ANOVA是解释表达水平间的相互关系的通用检测。对于多变量ANOVA检测有必要基于Wilks′λ标准,并且在使用选自SEQ.ID NOs 1-16的多聚核苷酸组进行分子诊断检测获得的数据的log(base 2)值上进行,以获得值的正态分布。
M-dist分析是多变量分析的另一实例,考虑到每种基因表达的可变性和基因对之间的相关性,其以单一数字总结了两种基因表达模式之间的不同。M-dist通常以多元数据用作局外人(显著不同于组中所有其它个体病例的个体病例)的检测。M-dist可以通过参考具有等于变量(即,基因)数目的自由度的-卡方分布而转换成p-值。然而,为了避免对于假定的多变量常态的依赖性,需要使用秩和检验,Mann-Whitney检验,比较个体病例(即,患有息肉的那些)和对照的M-dist。通过使用Mann-Whitney分析,关于表达模式的差异的推论不依赖于多变量常态的假设。因此,这一方法允许综合起来的所有试验受试者表达水平的显著性的确定,以及每个个体表达值的显著性的确定。
下文提供了上述公开内容的一个工作实例。Hao,C-Y,等.,Alterationof Gene Expression in Macroscopically Normal Colonic Mucosa fromIndividuals with a Family History of Sporadic Colon Cancer,11 Clin.CancerRes.,1400-07(Feb.15,2005)。提供所述实例作为本领域普通技能的实践者的进一步指导,并且不能以任何方式解释为本发明的限制。
采用这一实例研究,在没有发展结肠癌但是由于CRC家族病史而处于患有结肠癌的高危险中的个体的形态正常的结肠黏膜(“MNCM”)中,一些基因的表达是否改变。
人受试者
在访问California Pacific Medical Center(“CPMC”)的个体的常规结肠镜检时,进行直肠和乙状结肠的MNCM组织活检,所述个体没有结肠癌病史或先前的结肠癌,并且在检查时没有腺瘤性息肉、结肠癌或其它结肠性损伤。本研究包括了12名在第一级亲属中具有结肠癌家族病史的个体(表3)和16名没有已知结肠癌家族病史的个体。尽管家族癌症病史的信息通过患者的自我报告获得而没有从医院癌症登记处得到证实,但是,最近的研究已经证实了关于结肠癌的自我报告家族病史的准确性。在具有结肠癌家族病史的12名个体中,2名是母女(表3中的病例#6和7),2名是姐弟(病例#11和12),其余的是不相关的。在具有结肠癌家族病史的组中,研究的受试者年龄在18-64岁范围,对照组在16-83岁(16岁的受试者由于慢性腹痛已经进行了结肠镜检)。获得研究的正常组织活检样品的研究流程得到CPMC Institutional Review Board的认可。对于所有的研究受试者进行获得被告知内容的适当的方法。
RNA和cDNA的提取和制备
将从盲肠和肝弯曲部之间的结肠片段获得的组织活检样品分类为升结肠样品;从肝弯曲部和脾弯曲部之间的结肠片段获得的那些样品分类为横结肠样品;从低于脾弯曲部的结肠片段获得的那些样品分类为降结肠;从低于降结肠的结肠蜿蜒部分获得的那些样品分类为直肠乙状结肠样品(从直肠约5-25cm)。从每个患者获得的组织活检样品数目不同。除了从家族病史组的一名受试者的横结肠片段和降结肠片段只获得1份样品外,从每个结肠片段获得2-8份组织活检样品。从12名具有结肠癌家族病史的个体中总共获得39份升结肠样品、37份横结肠样品、45份降结肠样品和77份直肠乙状结肠样品;从16名没有结肠癌家族病史的个体总共获得53份升结肠样品、48份横结肠样品、49份降结肠样品和104份直肠乙状结肠样品。将所有的组织活检样品在干冰上速冻,并且立即拿到实验室进行所述RNA制备和反转录。
基因表达分析
通过定量RT-PCR分析下列各项的表达水平:癌基因c-myc,CD44抗原(“CD44”),环加氧酶1和2(“COX-1”和“COX-2”),cyclin D1,cyclin-依赖型激酶抑制因子(“p21cip/waf1”),白介素8(“IL-8”),白介素8受体(“CXCR2”),骨桥蛋白(“OPN”),黑素瘤生长刺激活性(“Groα/MGSA”),GRO3癌基因(“Groγ”),巨噬细胞集落刺激因子1(“MCSF-1”),过氧化物增殖性激活受体,α,δ和γ(“PPAR-α,δ和γ”)和血清淀粉样A1(“SAA1”)。进行定量RT-PCR。简要地,当积累的PCR产品超过任意定的阈值时,记录循环数(“CT值”)。为了使这一值标准化,将ΔCT值确定为检测的每种基因的CT值和β-肌动蛋白的CT值之间的差别。计算对照组中每种基因的平均ΔCT值。将ΔΔCT值确定为每份个体样品的ΔCT值和从对照样品获得的这一基因的平均ΔCT值之间的差别。然后,按所述那样,将这些ΔΔCT值用来计算相对基因表达值。(Applied Biosystems,User Bulletin #2,December 11,1997)。当可以得到cDNA样品时,所有的PCR一式两份进行。还应用组氨酰-tRNA合成酶作为内部对照而验证所述结果。应用β-肌动蛋白或his-tRNA合成酶作为参照,相对基因表达值产生相似的结果。这里应用β-肌动蛋白作为标准化对照获得统计学分析。
统计学分析
在具有结肠癌家族病史的个体和没有结肠癌家族病史的对照组受试者之间比较基因表达模式。不是独立地检验每种基因的表达和通过减少统计指数(statistical power)的方法调整多重比较,我们通过具有Wilks′λ标准的差异多变量分析(“MANOVA”)而检验所有基因的表达模式。这一检测是用于差异单变量分析的F-检验的多变量类似物,其检验平均值的等同性。这种类型的分析考虑了基因表达水平间的相互关系,并且通过基于子集中的所有基因提供表达模式是否在组与组之间不同的单一检验而控制假阳性率。
通过存在表达模式在组与组之间不同的证据,那么我们应用单一变量t-检验来确定哪些基因对综合差异起作用。由于完成正态分布需要这一转化,所以,所有的MANOVA检验基于Wilks′λ标准,并且在表达水平的log(base 2)上进行。我们的数据由每组(家族病史对没有家族病史)不同数目个体的每名受试者的不同数目的样品组成。分析包括关于组内个体的和关于个体内样品的随机effects terms,以说明取样方案。如果Yijk表示第i组的第j名患者的第k份样品的log2基因表达值,那么统计学模型通过下列方程数学表示:Yijk=M+Ai+Bij+eijk,其中Ai是(固定的)组effect,Bij是(随机的)患者effect,和eijk是患者effect内的(随机)样品。
通过用值1定义来自升结肠的样品的变量,值2定义来自横结肠的样品的变量,值3定义来自降结肠的样品的变量,和值4定义来自结肠的直肠乙状结肠部分的样品的变量,我们还检测了微分式的数量级(在式上或式下)是否从升结肠部分到直肠沿着结肠增加。将这一变量添加到模型中,以便可以应用单一变量ANOVA检测到它对某些基因的影响。
截断点的定义
将来自对照组所有组织活检样品的表达水平的log(base 2)用来计算每种基因增量调控或减量调控的截断点。正态分布的公差限度表用来定义截断点,以致对于增量调控的基因,不大于P的分布部分将高于截断点,或者对于减量调控的基因低于截断点。通过截断点=平均值+k(SD)定义每个截断点,其中平均值和SD(标准偏差)基于对照组的值。k值在表中找到,并且取决于P值和正常样品的数目。Owen,D.B.,Noncentral t andtolerance limits,in Brimbauim ZW,ed.Handbook of Statistical Tables,Reading,MA:Addison-Wesley,1962,108-127。假定每种基因表达水平的高斯分布,人们可以预计少于1%的来自正常群体的活组织切片具有超过99%公差极限(p=0.01)的表达水平。
为了计算在每种情形中高出99%ile观察到的样品数目是由于偶然性的可能性,我们应用二项式分布法,p=0.01和n=每种情形样品数目乘以检测的基因数目。例如,对于病例#1(表3),我们具有2份样品;二者都表现出PPAR-γ和SAA1的异常表达,二者之一对于PPAR-δ表达异常,并且没有一个对于IL-8和COX-2是异常的。因此,对于这一病例,10份检测的样品中有5份超过上限0.01。这是偶然发生的可能性是2.4×10-8。通用公式给出如下: Pr { x ≥ k | p , n } = Σ i = k 5 n ( 0.01 ) i ( 0.99 ) 5 n - i , 其中k是超过99%ile的数目和n是样品数目(检测的基因数目是5)。
结果
在具有结肠癌家族病史的个体的直肠乙状结肠黏膜中的改变的基因表达:
12名个体(10名女性和2名男性)组成具有结肠癌家族病史的组;16名个体(9名女性和7名男性)作为对照组。(表1)对于16种基因的表达水平,我们总共分析了92份升结肠样品,85份横结肠样品,94份降结肠组织活检样品和181份直肠乙状结肠组织活检样品。已知这些基因的表达水平在人结肠癌晚期改变。我们还证明这些基因中的一些在结肠癌患者的手术切除的MNCM中改变。
继续参考表1,结果代表来自没有家族病史的16名个体的104份组织活检样品的分析,和来自具有结肠癌家族病史的第一级亲属的12名个体的77份组织活检样品的分析。按照方法中所述分析样品的基因表达。表中的数字代表相对于对照组平均MCT的表达水平。如果在个体间没有变化,对照组的正常基因表达水平应该等于1。应用Wilksλ标准的多变量分析在16种基因的log2表达值上进行,以确定两组之间的差异显著性。从最小到最大的P值将基因列出。
所有16种基因表达值的多变量分析表明,在来自具有和没有散发性结肠癌的那些患者的直肠乙状结肠区域的组织活检样品的显著差异(p=0.01)。在这两组个体之间,在来自降结肠、升结肠和横结肠的组织活检样品的基因表达没有显著地不同(分别地,p=0.06,0.22和0.52)。直肠乙状结肠组织活检样品的大部分差异仅由这些基因的5种(表1)提供:PPAR-γ,SAA1,IL-8,COX-2和PPAR-δ。与癌症患者的MNCM中基因表达的改变相似,我们发现,在具有散发性结肠癌家族病史的个体的MNCM中,SAA1、IL-8和COX-2的表达水平得到增量调控,和PPAR-γ与PPAR-δ的表达水平得到减量调控。
大概是由于在具有结肠癌家族病史的组中需要早期进行结肠镜检的增强的意识,家族病史组的平均(±SD)年龄(45±12岁)比对照组的(56±16岁)年轻。另外,在这两组之间存在性别差异(在具有家族病史组中10名女性和2名男性,相对于在对照组中的9名女性和7名男性)。然而,我们发现性别没有影响基因表达水平(p=0.67)。并且,除了PPAR-δ0.01,在年龄和SAA1、IL-8、COX2和PPAR-γ的表达水平(所有的p>0.05)之间没有相关性。然而,PPAR-δ的异常表达(减量调控)随着年龄增加。因此,在年轻的家族病史组和年老的对照之间的比较将倾向于在家族病史组中发现更少的而不是更多的异常表达。换句话说,我们可能低估PPAR-δ在家族病史组中的改变的表达的发生率。
表1.与对照相比,在来自具有结肠癌家族病史的个体的正常直肠乙状结肠组织活检样品中的基因表达水平
  基因   对照(n=104)   具有家族病史的患者(n=77)   P值
  范围   平均值±(S.D.)   范围   平均值±(S.D.)
  PPAR-γ   0.44-1.65   1.07±0.41   0.20-2.59   0.79±0.40   0.006
  SAA1   0.17-22   2.16±3.67   0.33-2343   151±452   0.02
  IL-8   0.14-13   1.71±1.94   6.84-13   6.84±2.82   0.02
  COX-2   0.17-18   1.82±2.75   0.24-30   5.11±9.01   0.07
  PPAR-δ   0.39-2.66   1.11±0.48   0.16-2.22   0.89±0.46   0.07
  CD44   0.35-4.13   1.14±0.64   0.11-4.98   1.41±0.78   0.12
  c-Myc   0.24-3.66   1.21±0.75   0.26-4.31   1.48±0.82   0.14
  MCSF-1   0.38-22   1.81±2.59   0.20-11   2.04±2.19   0.21
  Gro-α   0.01-51   2.61±5.48   0.34-57   5.76±11.63   0.22
  Gro-γ   0.16-35   2.18±4.29   0.12-41   2.55±5.91   0.25
  P21   0.51-2.15   1.10±0.62   0.20-7.68   0.90±0.32   0.27
  PPAR-α   0.31-2.38   1.09±0.55   0.26-2.21   1.00±0.40   0.54
  CXCR2   0.22-13   1.45±1.78   0.43-4.44   1.49±1.55   0.55
  OPN   0.19-13   1.66±2.05   0.15-12   1.41±1.92   0.73
  CyclinD   0.34-3.48   1.28±0.85   0.13-3.21   1.29±0.79   0.81
  COX-1   0.27-5.97   1.21±0.85   0.25-2.63   1.09±0.51   0.87
对于“正常”基因表达的截断点比较
直肠乙状结肠样品中的相对基因表达水平在个体间不同,在从具有结肠癌家族病史的个体获得的样品中比来自对照的对应值多得多(表1)。因此,通过计算每种基因的截断点(p=0.01),我们应用对照组的每种基因的表达水平来定义每种基因的“正常”表达水平。图3显示基因PPAR-γ,IL-8,SAA1和COX-2的log(base2)表达值的分布以及它们的截断点。如预计那样,少于1%的来自对照组的组织活检样品具有高于或低于截断线的这些基因的表达(p=0.01,图3)。然而,21%,12%和8%的来自家族病史组的组织活检样品分别具有高于截断点的SAA1、IL-8和COX-2的表达,并且12%的所述样品具有低于截断点的PPAR-γ表达(表2)。
表2.在正常个体和具有结肠癌家族病史的个体中,具有高于/低于截断点的基因表达的组织活检样品数目(N)
基因   来自正常对照的组织活检样品(n=104)N(%)   来自具有家族病史的组织活检样品(n=77)N(%)
  PPAR-γ   0   9(12%)
  SAAI   0   16(21%)*
  IL-8   0   9(12%)*
  COX-2   1(1%)*   6(8%)*
  PPAR-δ   0   2(3%)
  Gro-γ   1(1%)*   2(3%)*
  PPAR-α   0   2(3%)
  Gro-α   0   0
  MCSF-1   1(1%)*   0
  OPN   1(1%)*   0
  P21   0   0
  CD44   1(1%)*   0
  CXCR2   1(1%)*   0
  c-Myc   0   0
  CyclinD   0   0
  COX-1   0   0
具有低于截断点的基因表达水平
*具有高于截断点的基因表达水平
具有改变的患者数目在表3中列出。
然后,我们分析了家族病史组中的每一个体(表3)。显示了表现出低于(对于PPAR-γ和δ)或者高于(对于IL-8、SAA1和COX-2)截断点的表达水平的组织活检样品数目。所有组织活检样品都表现出在正常范围内的表达水平的个体用(-)符号表示。在本研究中患有结肠癌的所有祖父母都是母方。当结肠癌得以诊断时家族成员的年龄表示如下:***表示结肠癌在50岁之前得到诊断;**表示在60岁之前;和*表示在60岁后。当结肠癌得以诊断时其余家族成员的年龄不可获得。除了病例#10的患者父亲在20世纪70年代患肺癌之外,家族病史组中的12名患者没有一名在家族中报道其它类型的癌症。
如在表3中表示的,对于5种最常改变的基因,具有结肠癌家族病史的12名个体中的9名具有至少一种表达水平低于或者高于截断点的组织活检样品。2名个体(病例#1和2)在显然正常的直肠乙状结肠黏膜中具有3种这样的基因的改变的表达。相反,对照组16名个体中只有1名具有这5种基因中的一种的改变的表达(参见表2)。设定截断值,以便1%的表达将是假阳性。然而,从每个个体获得的组织获奖样品数目是不同的。为了调整样品数目,对于每一病例,我们还计算了在高于99%ile外观察到的样品数目是由于偶然性引起的可能性。这一计算是基于二项式分布。如表3中所示,在12名家族病史组个体中的7名中观察到的改变的基因表达不可能是由于偶然性引起(p<0.01)。在这7个病例中,5种基因至少2种的表达被改变。另外,在分析的16种基因中,PPAR-γ和SAA1是在具有结肠癌家族病史的12名个体的5名中发生的最常改变的基因(表3)。
表3.PPAR-γ,IL-8,SAA1,COX-2和PPAR-δ在具有结肠癌家族病史的个体的直肠乙状结肠组织活检样品中表达的总结
病例 性别 年龄(岁)   患有癌症的家族成员   #分析的组织活检样品   PPAR-γ   SAA1   IL-8   COX-2   PPAR-δ   #改变表达的基因   由于偶然性改变的可能性
  #具有改变的表达的样品
  1   F   53   母亲***   2   2   2   -   -   1   3   <0.001
  2   F   53   母亲*   6   2   -   1   -   1   3   <0.001
  3   M   43   父亲*   5   3   1   -   -   -   2   <0.001
  4   F   47   母亲*   7   -   7   1   -   -   2   <0.001
  5   F   52   母亲   8   -   -   -   -   -   0   1
  6   F   52   父亲和女儿***   6   -   -   1   -   -   1   0.26
  7   F   18   祖父和女儿***   8   2   -   -   1   -   2   <0.01
  8   F   35   母亲*和祖母   8   -   -   8   6   -   2   <0.001
  9   F   46   父亲**   8   -   -   -   -   -   0   1
  10   F   64   姐姐*   6   -   1   -   -   -   1   0.26
  11   F   36   母亲和祖父   7   -   -   -   -   -   0   1
  12   M   38   母亲和祖父   6   1   6   -   -   -   2   <0.001
  #具有改变的基因表达的个体   5   5   4   2   2
不同基因的表达在具有结肠癌家族病史的个体的MNCM的不同位点而改变。
家族病史组个体病例的分析表明,不同的基因在不同受试者的直肠乙状结肠组织活检样品中改变。例如,在病例#3中SAA1和PPAR-γ被改变,在病例#4中IL-8和SAA1被改变;而在病例#8中COX-2和IL-8而不是SAA1被改变(图4A)。另外,一些基因在同一患者的所有直肠乙状结肠组织活检样品中被改变(诸如病例#4中的SAA和病例#8中的IL-8),而有些只在一些这样的组织活检样品中改变(即,病例#3中的SAA1和PPAR-γ,病例#4中的IL-8和病例#8中的COX-2)。另外,一些这样的改变局限于直肠乙状结肠区域,诸如病例#4中的IL-8;而一些可以扩展到结肠的其它区域,诸如病例#4中的SAA1(图4B)。
我们还观察到,对于PPAR-γ(p=0.001倾向)和SAA1(p<0.001),而不是对于IL-8(p=0.20)、COX2(p=0.58)、也不是PPAR-δ(p=0.54),两组个体之间的基因表达的差异随着结肠的长度而增加。这些结果表明,在两组个体之间从升结肠到直肠部分沿着结肠存在增加的异常性,尽管在本研究中向升结肠部分的样品数目减少了,其仍可以被检测到。
从前述实例中,可以得出下述结论。大约5-10%的结肠直肠癌发生在患有2种常染色体显性遗传形式的结肠癌(家族性腺瘤性息肉病和遗传性非息肉结肠直肠癌)的一种的患者中,或者发生在患有炎性肠病的患者中(Burt R.,Peterson G.M.In:Young G.,Rozen,P.& Levin,B.Saunders,ed.inPrevention and Early Detection of Colorectal Cancer,Philadelphia,171-194(1996))。其余的结肠癌中,大约20%与结肠癌家族病史有关,结肠癌家族病史与发展结肠癌的2倍增加的危险相关(Smith R.A.,von EschenbachA.C.,Wender R.,等.,American Cancer Society guidelines for the earlydetection of cancer:update of early detection guidelines for prostate,colorectal,and endometrial cancers,and Update 2001--testing for early lungcancer detection,51 CA Cancer J Clin.38-75;quiz 77-80(2001))。尽管在家族性结肠直肠癌患者子集中已经报道了染色体15q13-14和9q22.2-31.2的连锁(Wiesner G.L.,Daley D.,Lewis S.,等.,A subset of familial colorectalneoplasia kindreds linked to chromosome 9g 22.2-31.2,100 Proc Natl Acad SciUSA,12961-5(2003)),但是大多数这些病例的遗传基础是未知的。在本研究中,我们已经证明了PPAR-γ、IL-8和SAA1在具有散发性结肠癌家族病史的患者的直肠乙状结肠MNCM中表达的本质改变,即使这些个体并没有可检测到的结肠异常。我们早先的研究表明,除了PPAR-γ、IL-8和SAA1之外,当与没有结肠癌、息肉和家族病史的正常个体相比时,在结肠癌患者的MNCM中,PPAR-δ、p21、OPN、COX-2、CXCR2、MCSF-1和CD44的表达也显著地改变了。这些观察表明,MNCM中与癌症发展相关的基因的改变的表达可能是一种结果性事件,并且可能比明显的形态学异常的出现发生地更早。例如,PPAR-γ、SAA1和IL-8的改变的表达可能发生在还没有发展结肠癌但是处于发展结肠癌的高对危险中的个体的MNCM中;而其它基因诸如PPAR-δ、p21、OPN、COX-2、CXCR2、MCSF-1和CD44的改变的表达,可能晚一些时候发生在已经发展了结肠癌的个体的MNCM中(Chen L-C,Hao C-Y,Chiu Y.S.Y.,等.,Alteration ofGene Expression in Normal Appearing Colon Mucosa of APCmin Mice andHuman Cancer Patients,64 Cancer Research 3694-3700(2004))。
已经在一些肿瘤的肉眼可见的正常组织中报道了遗传和后生的改变(Tycko B.,Genetic and epigenetic mosaicism in cancer precursor tissues,983Ann N Y Acad Sci.,43-54(2003))。例如,等位基因丢失已经在邻近初级乳腺癌的正常乳腺末端导管小叶中得到了证明。(Deng G.,Lu Y.,Zlotnikov G.,Thor A.D.,Smith H.S.,Loss of heterozygosity in normal tissue adjacent tobreast carcinomas,274 Science,2057-9(1996))。这样的等位基因丢失与局部复发的增加的危险性相关(Li Z.,Moore D.H.,Meng Z.H.,Ljung B.M.,Gray J.W.,Dairkee S.H.,Increased risk of local recurrence is associated withallelic loss in normal lobules of breast cancer patients,62 Cancer Res.,1000-3(2002))。另外,患有前结肠癌(prior colon cancer)个体的看起来正常的结肠黏膜细胞比没有患有前结肠癌的个体的黏膜细胞更能抵抗胆酸诱导的细胞程序性死亡(Bernstein C.,Bernstein H.,Garewal H.,等.,A bileacid-induced apoptosis assay for colon cancer risk and associated qualitycontrol studies,59 Cancer Res.,2353-7(1999);和Bedi A.,Pasricha P.J.,Akhtar A.J.,等.,Inhibition of apoptosis during development of colorectalcancer.,55 Cancer Res.,1811-6(1995))。由于在结肠上皮细胞中细胞程序性死亡对于去除具有未修复的DNA损伤的细胞是重要的(Payne C.M.,Bernstein H.,Bernstein C.,Garewal H.,Role of apoptosis in biology andpathology:resistance to apoptosis in colon carcinogenesis,19 UltrastructPathol.,221-48(1995)),程序性细胞死亡的减少可能导致DNA-损伤细胞的滞留,并且增加致癌突变的危险。
在一些癌症中PPAR-γ受到减量调控。PPAR-γ的配体抑制细胞生长并且诱导细胞分化(Kitamura S.,Miyazaki Y.,Shinomura Y.,Kondo S.,Kanayama S.,Matsuzawa Y.,Peroxisome proliferator-activated receptorgamma induces growth arrest and differentiation markers of human coloncancer cells,90 Jpn J Cancer Res 75-80(1999)),并且在人结肠癌中已经报道了PPAR-γ失去功能的突变(Sarraf P.,Mueller E.,Smith W.M.,等.,Loss-of-function mutations in PPAR gamma associated with human coloncancer,3 Mol.Cell,799-804(1999))。因此,我们观察到的PPAR-γ在MNCM中表达的减量调控可能代表促进结肠上皮细胞生长和抑制细胞分化的早期事件。另外,PPAR-γ还负调控炎性应答(Welch J.S.,Ricote M.,AkiyamaT.E.,Gonzalez F.J.,Glass C.K.,PPAR gamma and PPAR delta negativelyregulate specific subsets of lipopolysaccharide and IFN-gamma target genesin macrophages,100 Proc Natl Acad Sci USA 6712-7(2003))。炎症通过刺激血管生成和细胞增殖而有利于肿瘤发生(Nakajima N.,Kuwayama H.,ItoY.,Iwasaki A.,Arakawa Y.,Helicobacter pylori,neutrophils,interleukins,andgastric epithelial proliferation,25 Suppl.1 J Clin Gastroenterol.,98-202(1997))。类似地,IL-8和急性期蛋白SAAl调控炎症过程(Dhawan P.,Richmond A.,Role of CXCL 1 in tumorigenesis of melanoma,72 J LeukocBiol.,9-18(2002);和Urieli-Shoval S.,Linke R.P.,Matzner Y.,Expressionand function of serum amyloid A,a major acute-phase protein,in normal anddisease states,7 Curr Opin Hematol.,64-9(2000))。在患有炎性肠病个体的结肠黏膜中(Niederau C.,Backmerhoff F.,Schumacher B.,Inflammatorymediators and acute phase proteins in patients with Crohn′s disease andulcerative colitis,44 Hepatogastroenterology,90-107(1997);和KeshavarzianA.,Fusunyan R.D.,Jacyno M.,Winship D.,MacDermott R.P.,Sanderson I.R.,Increased interleukin-8(IL-8)in rectal dialysate from patients with ulcerativecolitis:evidence for a biological role for IL-8 in inflammation of the colon,94Am J Gastroenterol.,704-12(1999)),在处于发展结肠癌的高度危险中的个体的结肠黏膜中(Bachwich D.R.,Lichtenstein G.R.,Traber P.G.,Cancer ininflammatory bowel disease,78 Med Clin North Am.,1399-412(1994)),已经报道了促炎细胞因子和急性期蛋白的增量调控。流行病学观察还表明,慢性炎症预先倾向于结肠直肠癌(Rhodes J.M.,Campbell B.J.,Inflammationand colorectal cancer:IBD-associated and sporadic cancer compared,8Trends Mol Med.,10-6(2002);和Farrell R.J.,Peppercorn M.A.,Ulcerativecolitis,359 Lancet 331-40(2002))。因此,在具有散发性结肠癌家族病史个体和在患有炎性肠病的个体的正常黏膜中观察到的PPAR-γ的减量调控和IL-8与SAA1的增量调控,可能表明常规途径参与引起这2组的结肠肿瘤发生。
我们在具有结肠癌家族病史的一些个体的正常结肠黏膜中观察到的与癌症和炎症相关基因的改变表达,与最近的报道一致,最近的报道与在发展结肠癌前升高的血清C-活性蛋白(“CRP”)浓度相关(Erlinger T.P.,PlatzE.A.,Rifai N.,Helzlsouer K.J.,C-reactive protein and the risk of incidentcolorectal cancer.,291 JAMA,585-90(2004))。这些发现表明,在平均危险性个体(id.)中,炎症是发展结肠癌的危险因素。然而,CRP是炎症的非特异性标记,期可能指示在除结肠之外的组织中的炎症。在我们的研究中,我们分析了结肠癌发生的组织,并且将更加特异性地评估发展结肠癌的危险。
我们不知道哪种细胞型负责观察到的改变的基因表达。在结肠黏膜中存在许多细胞类型,包括一些类型的黏膜上皮细胞、基质细胞和血源性细胞。我们组和其他组的研究已经证明COX-2蛋白在MNCM中的增量调控主要位于渗透性巨噬细胞和次要地位于APCmin小鼠MNCM中异常隐窝病灶中的上皮细胞(Chen L-C,Hao C-Y,Chiu Y.S.Y.,等.,Alteration of GeneExpression in Normal Appearing Colon Mucosa of APCmin Mice and HumanCancer Patients,64 Cancer Research 3694-3700(2004);和Hull M.A.,BoothJ.K.,Tisbury A.,等.,Cyclooxygenase 2 is up-regulated and localized tomacrophages in the intestine of Min mice,79 Br J Cancer,1399-405(1999))。从我们关于APCmin小鼠MNCM的早期研究中,可能由于分泌蛋白,诸如IL-8和SAA1,在组织切片上很快就消失(Chen L-C,Hao C-Y,Chiu Y.S.Y.,等.,Alteration of Gene Expression in Normal Appearing Colon Mucosa ofAPCmin Mice and Human Cancer Patients,64 Cancer Research 3694-3700(2004)),我们发现通过免疫组织化学染色检测在MNCM中增量-或减量-调控的基因产物是有技术难度的。由于有限数量的活体组织解剖样品和技术困难,我们不能进行免疫组织化学染色来证明引起改变的基因表达的细胞类型。如果绝对的RNA量是充分的,那么RNA原位杂交可以是确定改变的细胞位置的更好的方法。备选地,激光显微解剖之后进行RT-PCR可以能够确定包括的细胞类型。不管负责改变的基因表达的细胞类型,我们的结果证明,相对于没有结肠癌家族病史的正常个体,改变的基因表达存在于具有结肠癌家族病史的一些个体的正常结肠黏膜中并且这些个体已知具有形成结肠癌的增加的危险(Burt R.,Peterson G.M.In:Young G.,Rozen,P.& Levin,B.Saunders,ed.in Prevention and Early Detection ofColorectal Cancer,Philadelphia,171-194(1996))。
在直肠乙状结肠组织活检样品中具有改变的基因表达的患者中,一些患者在所有组织活检样品中都表现出改变(即,病例#4和12中SAA1的表达),而有些患者只在一些组织活检样品中表现出改变的表达(即,病例#2和#3中的PPAR-γ,图2)。由于大多数样品用一式两份的多个基因进行评估,以确保cDNA的质量,所以,这样的异质性不可能由技术变化引起。我们推测这种异质性可能反映这些个体中“热点(hot spots)”的频率和/或分布。可能地,在所有直肠乙状结肠组织活检样品中具有改变的基因表达的个体可能在其直肠乙状结肠黏膜中具有广泛扩散的分子异常,而在一些组织活检样品中具有改变的表达的那些个体具有离散的热点。因此,在前组中的个体可能具有发展结肠息肉或结肠癌的综合趋势,而后组中的那些个体可能具有局部趋势。在这2组之间发展结肠癌或息肉的危险性是否不同还不清楚。另外,在具有家族病史组个体的直肠乙状结肠组织活检样品中观察到不同基因组合的改变的表达。这一观察表明,不同的分子途径可能参与结肠癌发生的早期阶段。在某些分子途径中改变的基因表达是否于息肉或癌症的更高的危险性相关还是没有确定。
与在散发性结肠癌患者和致癌物质处理的小鼠的远端结肠中有比在近端结肠中更多的隐窝病灶(前肿瘤结肠损伤)的报道一致(Shpitz B.,Bomstein Y.,Mekori Y.,等.,Aberrant crypt foci in human colons:distributionand histomorphologic characteristics,29 Hum Pathol.,469-75(1998);和Salim E.I.,Wanibuchi H.,Morimura K.,等.,Induction of tumors in the colonand liver of the immunodeficient(SCID)mouse by2-amino-3-methylimidazo[4,5-f]quinoline(IQ)-modulation by long chain fattyacids,23 Carcinogenesis,1519-29(2002)),我们发现,基因表达中的大多数改变是在家族病史组的个体的远端结肠中发现的。我们推测,当大部分水分在大肠末端被重吸收后,与在其它结肠区域的黏膜相比,敏感个体的远端结肠黏膜可能暴露于更高浓度的存在于粪便中的外源物质,并且这样的暴露可能在这一区域引起更高概率的改变的基因表达。
我们已经证明,结肠癌家族病史,而不是年龄或性别,是为在这2组的直肠乙状结肠黏膜中观察到的基因表达差异负责的因素。可用信息没有显示在这2组患者间的饮食或药物治疗中的任何具体的不同。然而,不经过进一步研究,我们不能排除饮食或药物治疗影响基因表达的可能性。并不是所有具有结肠癌家族病史的个体都将发展结肠癌或结肠腺瘤性息肉(Smith,R.A.,von Eschenbach A.C.,Wender,R.,等.,American Cancer Societyguidelines for the early detection of cancer:update of early detectionguidelines for prostate,colorectal,and endometrial cancers,and Update2001-testing for early lung cancer detection,51 CA Cancer J.Clin.,38-75;quiz 77-80(2001).)。与这一临床观察一致,我们的分析还表明,不是所有具有结肠癌家族病史的个体都在MNCM中具有改变的基因表达。由于在本研究中分析的基因参与结肠癌的发展,我们猜测在MNCM具有改变的基因表达的个体可能比没有改变的基因表达的那些个体更容易发展息肉或癌症。为了验证这一假说,需要对大量研究受试者的远景调查。如果这样的相关性得到证实,可能通过应用直肠乙状结肠组织活检样品的基因表达分析而确定处于发展结肠癌的增加的危险中的个体。理论上,通过分析随机的MNCM样品,与具有局部改变的个体相比,更容易确定在MNCm具有综合改变的个体。然而,如果为应用多样品的分析选择适宜的基因组,那么它可能有充分的预测力来确定这样的患者。
现在来看图5,应用常规通用目的或专用的数字计算机和/或按照本公开内容的教导编程的处理器,这对于计算机领域的技术人员是显而易见的,可以实现图5的各个方面。基于本公开内容的教导,这对于计算机领域的技术人员是显而易见的,适宜的软件编码可以由熟练的程序员容易地制定。本发明还可以通过制定集成电路和/或通过将适宜的计算机电路网络相互连接而实现,这对于计算机领域的技术人员是非常显而易见的。
各个方面包括一种计算机程序产物,其是一种具有指示和/或存储于其上/其中的信息的存储介质,所述存储介质可以用于编程通用目的的或专用的计算处理器/装置,以完成本文描述的任何特征。存储介质可以包括但不限于,一种或多种的下列各项:任何类型的物理介质,包括软盘、光盘、DVDs、CD-ROMs、微驱动(microdrives)、磁光盘、全息照相存储装置、ROMs、RAMs、EPROMs、EEPROMs、DRAMs、PRAMS、VRAMs、闪存装置、磁或光卡、纳米-系统(包括分子记忆ICs);纸或基于纸的介质;以及适用于存储指示和/或信息的任何类型的介质或装置。各个方面包括一种可以全部或部分并且越过一个或多个公共的和/或私人网络而传输的计算机程序产物,其中所述传输包括指示(instruction)和/或信息,其可以由一个或多个处理器用来完成本文所述的任何特征。在各个方面中,传输可以包括多种独立的传输。
保存在一种或多种计算机可读的介质(媒体)上,本公开内容包括控制通用目的/专用计算机和/或处理器的硬件,和使得所述计算机和/或处理器能够同人使用者或应用本发明结果的其它机械装置相互作用的软件。这样的软件可以包括但不限于,装置驱动器、操作系统、执行环境/容器、用户界面和应用软件。
编码的执行可以是直接的或间接的。编码可以包括汇编、翻译和其它类型的语言。除非另外由要求的语言所限定,编码的执行和/或传输和/或功能编码片段可以包括对其它软件或装置,局域的或远程的援引或调用,以行使所述功能。所述援引或调用可以包括对图书馆模块、装置驱动器和远程软件的援引或调用,以行使所述功能。援引或调用可以包括在分布式的和客户/服务器系统的援引或调用。
图6描述本公开内容的一个方面,其具有用于结肠黏膜细胞最低程度侵入性取样的擦拭取样和传送系统400。图6的系统400由药签410和容器420组成。容器420,诸如通过图6所示的这方面内容所描述的一种,被设置以稳定、提取并且保存结肠黏膜细胞样品,直到可以使用公开的生物标记组对样品进行CRC早期检测的诊断检测。
药签410具有从杆414末端延伸出来的头412。头410可以式许多形状,诸如椭圆形的、正方形的、矩形的、圆的等,并且沿着杆的末端具有约0.5cm-1.0cm的最大宽度,和约1.0cm-10.0cm的长度。头412可以由许多材料组成,诸如例如棉花、人造纤维、聚酯、和聚合物泡沫、或者这样的材料的组合。杆414由具有充分的机械强度和充分的弹性的材料制成,所述机械强度足以擦拭直肠区域,充分的弹性足以防止伤害。用于直肠药签的具有强度和弹性的杆材料的实例包括木材、纸和各种聚合物材料,诸如聚酯、聚苯乙烯、和聚氨酯、以及这样的聚合物的组合物。
容器420具有主体412和帽424。主体412可以具有各种长度和直径,以容纳上文所述的具有头412的大小和杆414的长度范围的药签410。容器的主体412可以由许多聚合物材料制成,诸如聚乙烯、聚丙稀、聚碳酸酯、聚碳氟化合物、或玻璃,而帽424典型地由理想的聚合物材料制成,诸如用于主体412给出的实例。容器420在底部具有试剂426,当作为最低程度侵入性取样技术进行直肠区域擦拭取样时,其适于稳定并且提取在药签410上收集的结肠黏膜细胞。另外,可以使用不需要药签410的容器420,其具有适于稳定并且从粪便样品提取结肠黏膜细胞样品的试剂426。
试剂426含有浓度至少约0.4M的缓冲的硫氰酸胍溶液,和浓度约0.1-10%的其它组织变性剂诸如生物表面活性剂。理想的生物表面活性剂可以是两性离子的,诸如CHAPS或CHAPSO,非离子的,诸如TWEEN,或任何烷基糖苷(alkylglucoside)表面活性剂,或离子的,诸如SDS。可以使用各种缓冲液,例如,通常已知为Good’s缓冲液的那些,诸如Tris。为了将试剂426有效地缓冲到约7.0-8.5的pH,缓冲液的浓度可能不同。
还考虑了使用如图6中公开内容的一方面的擦拭取样方式和传送系统400提取的样品可以进行处理,并且数据在使用上文公开的计算机硬件和软件的单一仪器中进行分析。即,从图6公开内容的一方面获得的样品可以按照图5在单一仪器中进行分析。然而,还考虑了患者的血液或粪便样品可以在单一仪器中进行分析。在一个实施方案中,所述仪器的一个方面是第一元件,其用于对患者样品进行RT-PCR,以进行基因表达分布作图,如上文所述那样。基因表达分布作图允许对SEQ.ID Nos 1-16的cDNA定量,所述cDNA是从患者样品细胞制备的mRNA反转录的。SEQ.ID Nos33-64的成套引物用于RT-PCR反应,以引发与SEQ.ID Nos 1-16对应的mRNA链,并且由此合成与SEQ.ID Nos 1-16对应的cDNA。
从RT-PCR获得cDNAs后,数据由所述仪器的第二元件进行比较,以控制已经存储在所述仪器的存储介质上的数据。应用软件使用上文公开的多变量分析,以执行ANOVA、M-Dist或其它多变量分析方式的指示。基于统计学分析,合格的诊断专家可以评估CRC的存在或不存在,CRC的进展,和/或CRC的治疗效果。
在本公开内容的另一方面,对于CRC的早期检测,可以使用单一仪器,进行患者样品的蛋白表达分布作图。术语“多肽(polypeptide)”或“多肽(polypeptides)”在本文中可以与术语“蛋白(protein)”或“蛋白(proteins)”互换地使用。如先前讨论的那样,已经对蛋白研究了很久,研究其作为生物标记的潜力,但是有很少的成功。作为多聚核苷酸生物标记的补充,蛋白生物标记存在有价值。使得信息由两种类型的生物标记提供的原因包括目前这样的观察,即,mRNA表达水平不是蛋白表达水平的良好的预报因子,和mRNA表达水平没有提供任何蛋白翻译后修饰的信息,而蛋白翻译后修饰对于其生物活性是关键的。因此,为了理解蛋白的表达水平,以及它们完整的结构,需要对蛋白进行直接分析。
本文公开的是在SEQ.ID NOs 17-32列出的蛋白,其与SEQ.ID NOs1-16表示的基因相对应。本公开发明的另一方面是确定SEQ.ID NOs.17-32表示的蛋白的表达水平。通过上文公开的非-或者最低程度侵入性方法提取的患者样品可以用来制备固定细胞或者样品细胞的蛋白提取物。用于蛋白表达分布作图的细胞可以通过图6的方法获得,或者备选地例如通过血液样品或粪便样品、或其它非侵入性或最低程度侵入性方法(或者当然通过更常规的侵入性方法,包括例如乙状结肠镜检和其它方法)而获得。
在所述仪器的第一元件中,细胞或蛋白提取物可以用一组针对所申请的全体生物标记的抗体——单克隆的或多克隆的——进行检测,以测定目的多肽的水平。所述检测的目的是检测并且定量与SEQ.ID NOs 1-16中生物标记的基因序列相对应的蛋白,即SEQ.ID NOs 17-32的表达。
在考虑到所述方法的本公开内容的一方面,基于生物标记组的抗体组的抗体可以结合到固体支持物上。用于蛋白表达分布作图的方法可以使用第二抗体,其具有针对某些结合的、目的多肽部分的特异性。这样的第二抗体可以用有效检测并且量化所结合的多肽的分子进行标记,并且因此在与所述多肽结合时,将其标记用于检测和定量。另外,考虑了其它试剂用于标记所结合的多肽以便检测和定量。这样的试剂可以直接标记结合的多肽,或者与第二抗体类似,可以是对具有标记的结合的多肽具有特异性的部分。这样的部分的实例包括但不限于小分子,诸如辅因子、底物、配位剂等,或大分子,诸如凝集素、肽、寡核苷酸等。这样的部分可以是天然存在的或合成的。
关于所公开的方法的检测方式的实例包括但不限于分光镜技术,诸如荧光和UV-Vis分光镜,闪烁计数和质谱。作为这些检测方式的补充,这些方法中应用的检测和量化目的的标记的实例包括但不限于发色团标记、闪烁标记和大量标记(mass labels)。使用这些方法在仪器的第二元件中测定的多聚核苷酸和多肽的表达水平可以相对于为目标确定目的确定的对照进行标准化。对照数据存储在计算机内,其为所述仪器的第三元件。
第四软件元件将从一名或多名患者样品获得的数据与对照数据相比较。比较将包括至少一种多变量分析,并且可以包括ANOVA、MANOVA、M-Dist和本领域的普通技术人员已知的其它方法。一旦统计学分析和比较进行并且完成,医师或其它合格的人员可以为一名或多名患者的CRC状况做出诊断。
现在来看本公开内容的药物筛选方面,应该意识到,本文公开的生物标记组是基因及其表达产物,已知它们参与下述代谢途径和过程:1)氧化压力/炎症;2)APC/b-联蛋白途径;3)细胞周期/转录因子;和4)参与细胞/细胞通信、生长、修复和对损伤和外伤应答的细胞因子和其它因子的作用。存在越来越多的证据,这些途径,并且因此本生物标记组的成员还参与除CRC外的许多其它种类的癌症,诸如肺癌、前列腺癌和乳腺癌,以及神经退行性疾病,诸如阿尔茨海默病和肌萎缩性侧索硬化症(“ALS”)。在这样的病理中,参与这些途径的基因及其表达产物对于许多不同类型的细胞的生长、维持和压力应答是基本的。在病理学如癌症和神经退化中,某些改变的基因的改变的表达导致一种或多种病理症状,以致这些基因及其表达产物的改变是所述具体病理的特征性生物标记。在这一方面,表面上不相关的病理,诸如各种癌症和神经退行性疾病,是非常复杂的病理的表现,所述每一种病理包括所述生物标记的离散的成员,所述生物标记是来源于上述途径和过程组的基因及其表达产物。作为这一点的实践证据,现在应该理解,COX-2抑制剂不但对于包括结肠癌和其它癌症的广泛种类的疾病,而且还对神经退行性疾病有治疗价值。
本文公开的是图1的主题生物标记组在药物发明方法中的应用,所述药物发现方法关于病理诸如癌症,例如CRC、肺癌、前列腺癌和乳腺癌,和神经退行性疾病,例如阿尔茨海默病和ALS。如上文提及的,改变的基因及其表达产物的离散模式为每种特殊的疾病提供了唯一的识别标记,所以所述组为各种病理提供了必需的选择性。药物意指用于病理治疗的任何治疗性药剂。这包括常规合成的分子、天然产物、合成修饰的天然产物、和生物制药产物、诸如多肽和多聚核苷酸、以及它们的组合、提取物和制剂。
药物筛选是叫作药物发明期的药物开发的第一阶段。通过药物筛选过程合格的有希望的药物典型地叫作leads,也就是说,当通过筛选过程的标准时,它们是先进的,进一步在通常叫作lead最优化(lead optimization)的药物发明阶段进行检测。如果通过药物发明的lead最优化阶段,所述leads就是合格的候选,并且优先越过药物发明阶段到叫作预临床试验的药物开发的下一阶段,并且被称为研究性新药(“IND”)。如果所述IND是先进的,那么它优先进行临床试验,在这种情形中它在人受试者中进行检验。最后,如果所述IND通过临床试验阶段表现的有希望,那么在FDA正式批准后,它可以被商业化。已知对于单一候选的整个药物开发过程要花费10-15年,和数百万美元的开发费用。由于这一原因,药物开发机构目前的策略是集中在药物发明阶段,有效地找出有希望的药物,并且只将具有高成功潜力的候选进一步通过余下的药物开发周期。
在药物发明的筛选阶段,评估有希望的药物的特异性检测针对合格的生物模型系统进行,为其监测特异性的终端。用作关于病理诸如癌症,例如CRC、肺癌、前列腺癌和乳腺癌,和神经退行性疾病例如阿尔茨海默病和ALS的药物筛选的替代终端的生物标记组,不但是有效用于这样的病理的早期检测的组,而且还表现出这样的调控,即,所述调控通过药物以与病理发生或复发减少相关的方式进行。另外地,有效用于这样的病理的早期检测的生物标记组的一个或多个成员,还可以用作对于这样的病理的药物筛选的目标。随后要讨论,图1所述的生物标记可以用作模式生物系统的替代终端,以及药物筛选的目标。
在筛选阶段,可以评估大文库的有希望的药物,代表在单一筛选方案中数万种化合物的通量。视为低通量筛选(“LTS”)的为约10,000-约50,000种有希望的药物,而中等通量筛选(“MTS”)代表约50,00-约100,00种有希望的药物,并且高通量筛选(“HTS”)是100,000-约500,000种有希望的药物。
筛选方案的意思包括进行筛选的检测流程和分析方法。那么,筛选方案包括下列因素,诸如将要用于所述检测的生物模型的类型;进行检测的条件;要用的有希望的药物候选或有希望的候选的文库的类型;要使用的设备的类型;和数据收集、处理和存储的方式。筛选方案——LTS、MTS或HIS——的规模受到下列因素的影响,诸如检测流程(例如,检测类型)、分析方法(例如,小型化、自动化)、以及计算能力和容量。生物模型系统的意思包括全部生物体、全部细胞、细胞裂解物和目标分子。在考虑治疗应用时,有希望的药物候选的意思是任何类型的分子或分子制剂或混悬液。例如,有希望的药物候选可以是合成的分子、天然产物、合成修饰的天然产物、和生物制药产物、诸如多肽和多聚核苷酸、以及它们的组合、提取物和制剂。
如上文所讨论的那样,图1提供用于实践本公开发明的生物标记组的序列表。本公开内容的一方面是SEQ.ID NOs 1-16给出的16种确定的编码序列的生物标记组,而生物标记组的另一方面是SEQ.ID NOs 17-31给出的16种确定的蛋白。本发明的这两方面提供了病理早期检测所需要的选择性和灵敏性,所述病理诸如癌症,例如CRC、肺癌、前列腺癌和乳腺癌,和神经退行性疾病,例如阿尔茨海默病和ALS。
如先前提及的那样,CRC是关于新药开发的一种典型的病理。对于CRC,还没有确定对于CRC早期检测具有可接受的高度选择性和灵敏性的生物标记或生物标记组。因此,图1所述的是在为CRC早期检测提供基础中分化的生物标记组的方面。临床定义的生物标记的选择性是指正确诊断的患者百分数。临床内容中的生物标记的灵敏性定义为疾病在可治愈阶段被检测出来的可能性。理想地,生物标记将具有100%的临床选择性和100%的临床灵敏性。到目前为止,还没有确定这样的生物标记或生物标记组,其具有有效用于患者护理管理的宽范围需求所需要的可接受的高度的选择性和灵敏性。
进行筛选的分析方法可以包括上文公开的用于CRC早期检测方法,即,从生物样品的mRNA进行基因表达分布作图,以确定生物标记的基因表达,和它们的表达水平怎样受到有希望的药物候选的影响(包括使用RT-PCR),和/或由于应用有希望的药物候选引起的图1多肽生物标记的蛋白表达水平;然后应用多变量统计学分析来确定,使用和不使用所述有希望的药物候选,组中各种标记的表达水平的统计学显著性。
参考图7,药物筛选公开内容的一方面考虑获得组织样品,诸如擦拭样品(见图6)、血液样品或组织活检,所述样品可以通过,例如,最低程度侵入性的、侵入性的或非侵入性的方法提取。可以使用适宜的裂解缓冲液来提取并且保存组织样品中细胞的RNA。然后,可以在提取的RNA上进行RT-PCR,并且转化成cDNA,如上文公开的那样,使用,例如至少2条SEQ.ID NOs 33-64列出的对图1的生物标记组特异的引物,来筛选药物的作用效果。然后,检测的结果可以进行多变量分析和M-dist,如上文所述那样,并且将结果与对照数据进行比较。
图8描述药物筛选公开内容的另一方面,其中制备针对SEQ.ID NOs17-32列出的至少2种生物标记蛋白的抗体,并且将所述抗体用来从例如上文列出的组织活检和其它组织样品中检测生物系统,例如,全细胞、细胞裂解物等。所述抗体用于检测并且量化SEQ.ID NOs 17-32确定的生物标记肽的表达,以致这些生物标记肽的表达可以作为给所述生物系统定量给予潜力药物的函数而进行监测。结果可以进行多变量和单一变量分析和M-dist.,如上文公开的那样,并且与对照数据进行比较。
出于举例说明和描述的目的提供本文公开的内容。不是意欲穷尽或者将公开的内容局限在所述的精确形式上。对于本领域熟练的实践者,许多改进和变化是显而易见的。为了更好地解释所述技术公开的实施方案的原理和实践应用,因而使得本领域的其它技术人员能够理解适于考虑的具体应用的各种实施方案和各种改进,选择并且描述了公开的内容。
上文引用的参考文献通过参考完全结合于此。
                               序列表
<110>南希.M.李
<120>用于结肠直肠癌早期检测的药物筛选和分子诊断检测:试剂、方法及其试剂盒
<130>NLEE-01001WO0 MCF/MLB
<150>60/614,746
<151>2004-09-30
<150>60/651,344
<151>2005-02-08
<150>Not Assigned
<151>2005-09-29
<160>64
<170>PatentIn version 3.3
<210>1
<211>1629
<212>DNA
<213>人
<400>1
gcagagcaca caagcttcta ggacaagagc caggaagaaa ccaccggaag gaaccatctc    60
actgtgtgta aacatgactt ccaagctggc cgtggctctc ttggcagcct tcctgatttc    120
cgcagctctg tgtgaaggtg cagttttgcc aaggagtgct aaagaactta gatgtcagtg    180
cataaagaca tactccaaac ctttccaccc caaatttatc aaagaactga gagtgattga    240
gagtggacca cactgcgcca acacagaaat tatgtaaagc tttctgatgg aagagagctc    300
cgtctggacc ccaaggaaaa ctgggtgcag agggttgtgg agaagttttt gaagagggct    360
gagaattcag aattcataaa aaaattcatt ctctgtggta tccaagaatc agtgaagatg    420
ccagtgaaac ttcaagcaaa tctacttcaa cacttcatgt attgtgtggg tctgttgtag    480
 ttgccaga  tgcaatacaa gattcctggt taaatttgaa tttcagtaaa caatgaatag    540
cttttcattg taccatgaaa tatccagaac atacttatat gtaaagtatt atttatttga    600
atctacaaaa aacaacaaat aatttttaaa tataaggatt ttcctagata ttgcacggga    660
gaatatacaa atagcaaaat tgaggccaag ggccaagaga atatccgaac tttaatttca    720
ggaattgaat gggtttgcta gaatgtgata tttgaagcat cacataaaaa tgatgggaca    780
ataaattttg ccataaagtc aaatttagct ggaaatcctg gatttttttc tgttaaatct    840
ggcaacccta gtctgctagc caggatccac aagtccttgt tccactgtgc cttggtttct    900
cctttatttc taagtggaaa aagtattagc caccatctta cctcacagtg atgttgtgag    960
gacatgtgga agcactttaa gttttttcat cataacataa attattttca agtgtaactt  1020
attaacctat ttattattta tgtatttatt taagcatcaa atatttgtgc aagaatttgg  1080
aaaaatagaa gatgaatcat tgattgaata gttataaaga tgttatagta aatttatttt  1140
attttagata ttaaatgatg ttttattaga taaatttcaa tcagggtttt tagattaaac  1200
aaacaaacaa ttgggtaccc agttaaattt tcatttcaga taaacaacaa ataatttttt  1260
agtataagta cattattgtt tatctgaaat tttaattgaa ctaacaatcc tagtttgata  1320
ctcccagtct tgtcattgcc agctgtgttg gtagtgctgt gttgaattac ggaataatga  1380
gttagaacta ttaaaacagc caaaactcca cagtcaatat tagtaatttc ttgctggttg  1440
aaacttgttt attatgtaca aatagattct tataatatta tttaaatgac tgcattttta  1500
aatacaaggc tttatatttt taactttaag atgtttttat gtgctctcca aatttttttt  1560
actgtttctg attgtatgga aatataaaag taaatatgaa acatttaaaa tataatttgt  1620
tgtcaaagt                                                          1629
<210>2
<211>3356
<212>DNA
<213>人
<400>2
gtccaggaac tcctcagcag cgcctccttc agctccacag ccagacgccc tcagacagca    60
aagcctaccc ccgcgccgcg ccctgcccgc cgctgcgatg ctcgcccgcg ccctgctgct    120
gtgcgcggtc ctggcgctca gccatacagc aaatccttgc tgttcccacc catgtcaaaa    180
ccgaggtgta tgtatgagtg tgggatttga ccagtataag tgcgattgta cccggacagg    240
attctatgga gaaaactgct caacaccgga atttttgaca agaataaaat tatttctgaa    300
acccactcca aacacagtgc actacatact tacccacttc aagggatttt ggaacgttgt    360
gaataacatt cccttccttc gaaatgcaat tatgagttat gtgttgacat ccagatcaca    420
tttgattgac agtccaccaa cttacaatgc tgactatggc tacaaaagct gggaagcctt    480
ctctaacctc tcctattata ctagagccct tcctcctgtg cctgatgatt gcccgactcc    540
cttgggtgtc aaaggtaaaa agcagcttcc tgattcaaat gagattgtgg aaaaattgct    600
tctaagaaga aagttcatcc ctgatcccca gggctcaaac atgatgtttg cattctttgc    660
ccagcacttc acgcatcagt ttttcaagac agatcataag cgagggccag ctttcaccaa    720
cgggctgggc catggggtgg acttaaatca tatttacggt gaaactctgg ctagacagcg    780
taaactgcgc cttttcaagg atggaaaaat gaaatatcag ataattgatg gagagatgta    840
tcctcccaca gtcaaagata ctcaggcaga gatgatctac cctcctcaag tccctgagca    900
tctacggttt gctgtggggc aggaggtctt tggtctggtg cctggtctga tgatgtatgc    960
cacaatctgg ctgcgggaac acaacagagt atgcgatgtg cttaaacagg agcatcctga    1020
atggggtgat gagcagttgt tccagacaag caggctaata ctgataggag agactattaa    1080
gattgtgatt gaagattatg tgcaacactt gagtggctat cacttcaaac tgaaatttga    1140
cccagaacta cttttcaaca aacaattcca gtaccaaaat cgtattgctg ctgaatttaa    1200
caccctctat cactggcatc cccttctgcc tgacaccttt caaattcatg accagaaata    1260
caactatcaa cagtttatct acaacaactc tatattgctg gaacatggaa ttacccagtt    1320
tgttgaatca ttcaccaggc aaattgctgg cagggttgct ggtggtagga atgttccacc    1380
cgcagtacag aaagtatcac aggcttccat tgaccagagc aggcagatga aataccagtc    1440
ttttaatgag taccgcaaac gctttatgct gaagccctat gaatcatttg aagaacttac    1500
aggagaaaag gaaatgtctg cagagttgga agcactctat ggtgacatcg atgctgtgga    1560
gctgtatcct gcccttctgg tagaaaagcc tcggccagat gccatctttg gtgaaaccat    1620
ggtagaagtt ggagcaccat tctccttgaa aggacttatg ggtaatgtta tatgttctcc    1680
tgcctactgg aagccaagca cttttggtgg agaagtgggt tttcaaatca tcaacactgc    1740
ctcaattcag tctctcatct gcaataacgt gaagggctgt ccctttactt cattcagtgt    1800
tccagatcca gagctcatta aaacagtcac catcaatgca agttcttccc gctccggact    1860
agatgatatc aatcccacag tactactaaa agaacgttcg actgaactgt agaagtctaa    1920
tgatcatatt tatttattta tatgaaccat gtctattaat ttaattattt aataatattt    1980
atattaaact ccttatgtta cttaacatct tctgtaacag aagtcagtac tcctgttgcg    2040
gagaaaggag tcatacttgt gaagactttt atgtcactac tctaaagatt ttgctgttgc    2100
tgttaagttt ggaaaacagt ttttattctg ttttataaac cagagagaaa tgagttttga    2160
cgtcttttta cttgaatttc aacttatatt ataagaacga aagtaaagat gtttgaatac    2220
ttaaacactg tcacaagatg gcaaaatgct gaaagttttt acactgtcga tgtttccaat    2280
gcatcttcca tgatgcatta gaagtaacta atgtttgaaa ttttaaagta cttttggtta    2340
tttttctgtc atcaaacaaa aacaggtatc agtgcattat taaatgaata tttaaattag    2400
acattaccag taatttcatg tctacttttt aaaatcagca atgaaacaat aatttgaaat    2460
ttctaaattc atagggtaga atcacctgta aaagcttgtt tgatttctta aagttattaa    2520
acttgtacat ataccaaaaa gaagctgtct tggatttaaa tctgtaaaat cagtagaaat    2580
tttactacaa ttgcttgtta aaatatttta taagtgatgt tcctttttca ccaagagtat    2640
aaaccttttt agtgtgactg ttaaaacttc cttttaaatc aaaatgccaa atttattaag    2700
gtggtggagc cactgcagtg ttatcttaaa ataagaatat tttgttgaga tattccagaa    2760
tttgtttata tggctggtaa catgtaaaat ctatatcagc aaaagggtct acctttaaaa    2820
taagcaataa caaagaagaa aaccaaatta ttgttcaaat ttaggtttaa acttttgaag    2880
caaacttttt tttatccttg tgcactgcag gcctggtact cagattttgc tatgaggtta    2940
atgaagtacc aagctgtgct tgaataatga tatgttttct cagattttct gttgtacagt    3000
ttaatttagc agtccatatc acattgcaaa agtagcaatg acctcataaa atacctcttc    3060
aaaatgctta aattcatttc acacattaat tttatctcag tcttgaagcc aattcagtag    3120
gtgcattgga atcaagcctg gctacctgca tgctgttcct tttcttttct tcttttagcc    3180
attttgctaa gagacacagt cttctcatca cttcgtttct cctattttgt tttactagtt    3240
ttaagatcag agttcacttt ctttggactc tgcctatatt ttcttacctg aacttttgca    3300
agttttcagg taaacctcag ctcaggactg ctatttagct cctcttaaga agatta        3356
<210>3
<211>1750
<212>DNA
<213>人
<400>3
cctacaggtg aaaagcccag cgacccagtc aggatttaag tttacctcaa aaatggaaga    60
ttttaacatg gagagtgaca gctttgaaga tttctggaaa ggtgaagatc ttagtaatta    120
cagttacagc tctaccctgc ccccttttct actagatgcc gccccatgtg aaccagaatc    180
cctggaaatc aacaagtatt ttgtggtcat tatctatgcc ctggtattcc tgctgagcct    240
gctgggaaac tccctcgtga tgctggtcat cttatacagc agggtcggcc gctccgtcac    300
tgatgtctac ctgctgaacc tagccttggc cgacctactc tttgccctga ccttgcccat    360
ctgggccgcc tccaaggtga atggctggat ttttggcaca ttcctgtgca aggtggtctc    420
actcctgaag gaagtcaact tctatagtgg catcctgcta ctggcctgca tcagtgtgga    480
ccgttacctg gccattgtcc atgccacacg cacactgacc cagaagcgct acttggtcaa    540
attcatatgt ctcagcatct ggggtctgtc cttgctcctg gccctgcctg tcttactttt    600
ccgaaggacc gtctactcat ccaatgttag cccagcctgc tatgaggaca tgggcaacaa    660
tacagcaaac tggcggatgc tgttacggat cctgccccag tcctttggct tcatcgtgcc    720
actgctgatc atgctgttct gctacggatt caccctgcgt acgctgttta aggcccacat    780
ggggcagaag caccgggcca tgcgggtcat ctttgctgtc gtcctcatct tcctgctttg    840
ctggctgccc tacaacctgg tcctgctggc agacaccctc atgaggaccc aggtgatcca    900
ggagacctgt gagcgccgca atcacatcga ccgggctctg gatgccaccg agattctggg    960
catccttcac agctgcctca accccctcat ctacgccttc attggccaga agtttcgcca    1020
tggactcctc aagattctag ctatacatgg cttgatcagc aaggactccc tgcccaaaga    1080
cagcaggcct tcctttgttg gctcttcttc agggcacact tccactactc tctaagacct    1140
cctgcctaag tgcagccccg tggggttcct cccttctctt cacagtcaca ttccaagcct    1200
catgtccact ggttcttctt ggtctcagtg tcaatgcagc ccccattgtg gtcacaggaa    1260
gcagaggagg ccacgttctt actagtttcc cttgcatggt ttagaaagct tgccctggtg    1320
cctcacccct tgccataatt actatgtcat ttgctggagc tctgcccatc ctgcccctga    1380
gcccatggca ctctatgttc taagaagtga aaatctacac tccagtgaga cagctctgca    1440
tactcattag gatggctagt atcaaaagaa agaaaatcag gctggccaac gggatgaaac    1500
cctgtctcta ctaaaaatac aaaaaaaaaa aaaaaaatta gccgggcgtg gtggtgagtg    1560
cctgtaatca cagctacttg ggaggctgag atgggagaat cacttgaacc cgggaggcag    1620
aggttgcagt gagccgagat tgtgcccctg cactccagcc tgagcgacag tgagactctg    1680
tctcagtcca tgaagatgta gaggagaaac tggaactctc gagcgttgct gggggggatt    1740
gtaaaatggt                                                           1750
<210>4
<211>3939
<212>DNA
<213>人
<400>4
cctgggtcct ctcggcgcca gagccgctct ccgcatccca ggacagcggt gcggccctcg    60
gccggggcgc ccactccgca gcagccagcg agccagctgc cccgtatgac cgcgccgggc    120
gccgccgggc gctgccctcc cacgacatgg ctgggctccc tgctgttgtt ggtctgtctc    180
ctggcgagca ggagtatcac cgaggaggtg tcggagtact gtagccacat gattgggagt    240
ggacacctgc agtctctgca gcggctgatt gacagtcaga tggagacctc gtgccaaatt    300
acatttgagt ttgtagacca ggaacagttg aaagatccag tgtgctacct taagaaggca    360
tttctcctgg tacaagacat aatggaggac accatgcgct tcagagataa caccgccaat    420
cccatcgcca ttgtgcagct gcaggaactc tctttgaggc tgaagagctg cttcaccaag    480
gattatgaag agcatgacaa ggcctgcgtc cgaactttct atgagacacc tctccagttg    540
ctggagaagg tcaagaatgt ctttaatgaa acaaagaatc tccttgacaa ggactggaat    600
attttcagca agaactgcaa caacagcttt gctgaatgct ccagccaaga tgtggtgacc    660
aagcctgatt gcaactgcct gtaccccaaa gccatcccta gcagtgaccc ggcctctgtc    720
tcccctcatc agcccctcgc cccctccatg gcccctgtgg ctggcttgac ctgggaggac    780
tctgagggaa ctgagggcag ctccctcttg cctggtgagc agcccctgca cacagtggat    840
ccaggcagtg ccaagcagcg gccacccagg agcacctgcc agagctttga gccgccagag    900
accccagttg tcaaggacag caccatcggt ggctcaccac agcctcgccc ctctgtcggg    960
gccttcaacc ccgggatgga ggatattctt gactctgcaa tgggcactaa ttgggtccca    1020
gaagaagcct ctggagaggc cagtgagatt cccgtacccc aagggacaga gctttccccc    1080
tccaggccag gagggggcag catgcagaca gagcccgcca gacccagcaa cttcctctca    1140
gcatcttctc cactccctgc atcagcaaag ggccaacagc cggcagatgt aactgctaca    1200
gccttgccca gggtgggccc cgtgatgccc actggccagg actggaatca caccccccag    1260
aagacagacc atccatctgc cctgctcaga gaccccccgg agccaggctc tcccaggatc    1320
tcatcactgc gcccccaggc cctcagcaac ccctccaccc tctctgctca gccacagctt    1380
tccagaagcc actcctcggg cagcgtgctg ccccttgggg agctggaggg caggaggagc    1440
accagggatc ggacgagccc cgcagagcca gaagcagcac cagcaagtga aggggcagcc    1500
aggcccctgc cccgttttaa ctccgttcct ttgactgaca caggccatga gaggcagtcc    1560
gagggatcct ccagcccgca gctccaggag tctgtcttcc acctgctggt gcccagtgtc    1620
atcctggtct tgctggctgt cggaggcctc ttgttctaca ggtggaggcg gcggagccat    1680
caagagcctc agagagcgga ttctcccttg gagcaaccag agggcagccc cctgactcag    1740
gatgacagac aggtggaact gccagtgtag agggaattct aagctggacg cacagaacag    1800
tctcttcgtg ggaggagaca ttatggggcg tccaccacca cccctccctg gccatcctcc    1860
tggaatgtgg tctgccctcc accagagctc ctgcctgcca ggactggacc agagcagcca    1920
ggctggggcc cctctgtctc aacccgcaga cccttgactg aatgagagag gccagaggat    1980
gctccccatg ctgccactat ttattgtgag ccctggaggc tcccatgtgc ttgaggaagg    2040
ctggtgagcc cggctcagga ccctcttccc tcaggggctg cagcctcctc tcactccctt    2100
ccatgccgga acccaggcca gggacccacc ggcctgtggt ttgtgggaaa gcagggtgca    2160
cgctgaggag tgaaacaacc ctgcacccag agggcctgcc tggtgccaag gtatcccagc    2220
ctggacaggc atggacctgt ctccagacag aggagcctga agttcgtggg gcgggacagc    2280
ctcggcctga tttcccgtaa aggtgtgcag cctgagagac gggaagagga ggcctctgca    2340
cctgctggtc tgcactgaca gcctgaaggg tctacaccct cggctcacct aagtccctgt    2400
gctggttgcc aggcccagag gggaggccag ccctgccctc aggacctgcc tgacctgcca    2460
gtgatgccaa gagggggatc aagcactggc ctctgcccct cctccttcca gcacctgcca    2520
gagcttctcc agcaggccaa gcagaggctc ccctcatgaa ggaagccatt gcactgtgaa    2580
cactgtacct gcctgctgaa cagcctcccc ccgtccatcc atgagccagc atccgtccgt    2640
cctccactct ccagcctctc cccagcctcc tgcactgagc tggcctcacc agtcgactga    2700
gggagcccct cagccctgac cttctcctga cctggccttt gactccccgg agtggagtgg    2760
ggtgggagaa cctcctgggc cgccagccag agccgctctt taggctgtgt tcttcgccca    2820
ggtttctgca tcttccactt tgacattccc aagagggaag ggactagtgg gagagagcaa    2880
gggaggggag ggcacagaca gagagcctac agggcgagct ctgactgaag atgggccttt    2940
gaaatatagg tatgcacctg aggttggggg agggtctgca ctcccaaacc ccagcgcagt    3000
gtcctttccc tgctgccgac aggaacctgg ggctgagcag gttatccctg tcaggagccc    3060
tggactgggc tgcatctcag ccccacctgc atggtatcca gctcccatcc acttctcacc    3120
cttctttcct cctgaccttg gtcagcagtg atgacctcca actctcaccc accccctcta    3180
ccatcacctc taaccaggca agccagggtg ggagagcaat caggagagcc aggcctcagc    3240
ttccaatgcc tggagggcct ccactttgtg gccagcctgt ggtgctggct ctgaggccta    3300
ggcaacgagc gacagggctg ccagttgccc ctgggttcct ttgtgctgct gtgtgcctcc    3360
tctcctgccg ccctttgtcc tccgctaaga gaccctgccc tacctggccg ctgggccccg    3420
tgactttccc ttcctgccca ggaaagtgag ggtcggctgg ccccaccttc cctgtcctga    3480
tgccgacagc ttagggaagg gcactgaact tgcatatggg gcttagcctt ctagtcacag    3540
cctctatatt tgatgctaga aaacacatat ttttaaatgg aagaaaaata aaaaggcatt    3600
cccccttcat ccccctacct taaacatata atattttaaa ggtcaaaaaa gcaatccaac    3660
ccactgcaga agctcttttt gagcacttgg tggcatcaga gcaggaggag ccccagagcc    3720
acctctggtg tcccccaggc tacctgctca ggaacccctt ctgttctctg agaactcaac    3780
agaggacatt ggctcacgca ctgtgagatt ttgtttttat acttgcaact ggtgaattat    3840
tttttataaa gtcatttaaa tatctattta aaagatagga agctgcttat atatttaata    3900
ataaaagaag tgcacaagct gccgttgacg tagctcgag                           3939
<210>5
<211>1024
<212>DNA
<213>人
<400>5
atggcccgcg ctgctctctc cgccgccccc agcaatcccc ggctcctgcg agtggcactg    60
ctgctcctgc tcctggtagc cgctggccgg cgcgcagcag gagcgtccgt ggccactgaa    120
ctgcgctgcc agtgcttgca gaccctgcag ggaattcacc ccaagaacat ccaaagtgtg    180
aacgtgaagt cccccggacc ccactgcgcc caaaccgaag tcatagccac actcaagaat    240
gggcggaaag cttgcctcaa tcctgcatcc cccatagtta agaaaatcat cgaaaagatg    300
ctgaacagtg acaaatccaa ctgaccagaa gggaggagga agctcactgg tggctgttcc    360
tgaaggaggc cctgccctta taggaacaga agaggaaaga gagacacagc tgcagaggcc    420
acctggattg tgcctaatgt gtttgagcat cgcttaggag aagtcttcta tttatttatt    480
tattcattag ttttgaagat tctatgttaa tattttaggt gtaaaataat taagggtatg    540
attaactcta cctgcacact gtcctattat attcattctt tttgaaatgt caaccccaag    600
ttagttcaat ctggattcat atttaatttg aaggtagaat gttttcaaat gttctccagt    660
cattatgtta atatttctga ggagcctgca acatgccagc cactgtgata gaggctggcg    720
gatccaagca aatggccaat gagatcattg tgaaggcagg ggaatgtatg tgcacatctg    780
ttttgtaact gtttagatga atgtcagttg ttatttattg aaatgatttc acagtgtgtg    840
gtcaacattt ctcatgttga aactttaaga actaaaatgt tctaaatatc ccttggacat    900
tttatgtctt tcttgtaagg catactgcct tgtttaatgg tagttttaca gtgtttctgg    960
cttagaacaa aggggcttaa ttattgatgt tttcatagag aatataaaaa taaagcactt    1020
atag                                                                 1024
<210>6
<211>1064
<212>DNA
<213>人
<220>
<221>misc_feature
<222>(27)..(27)
<223>n=a,c,g,t
<220>
<221>misc_feature
<222>(766)..(766)
<223>n=a,c,g,t
<400>6
cacagccggg tcgcaggcac ctccccngcc agctctcccg cattctgcac agcttcccga    60
cgcgtctgct gagccccatg gcccacgcca cgctctccgc cgcccccagc aatccccggc    120
tcctgcgggt ggcgctgctg ctcctgctcc tggtgggcag ccggcgcgca gcaggagcgt    180
ccgtggtcac tgaactgcgc tgccagtgct tgcagacact gcagggaatt cacctcaaga    240
acatccaaag tgtgaatgta aggtcccccg gaccccactg cgcccaaacc gaagtcatag    300
ccacactcaa gaatgggaag aaagcttgtc tcaaccccgc atcccccatg gttcagaaaa    360
tcatcgaaaa gatactgaac aaggggagca ccaactgaca ggagagaagt aagaagctta    420
tcagcgtatc attgacactt cctgcagggt ggtccctgcc cttaccagag ctgaaaatga    480
aaaagagaac agcagctttc tagggacagc tggaaaggga cttaatgtgt ttgactattt    540
cttacgaggg ttctacttat ttatgtattt atttttgaaa gcttgtattt taatatttta    600
catgctgtta tttaaagatg tgagtgtgtt tcatcaaaca tagctcagtc ctgattattt    660
aattggaata tgatgggttt taaatgtgtc attaaactaa tatttagtgg gagaccataa    720
tgtgtcagcc accttgataa atgacagggt ggggaactgg agggtngggg gattgaaatg    780
caagcaatta gtggatcact gttagggtaa gggaatgtat gtacacatct attttttata    840
cttttttttt taaaaaagaa tgtcagttgt tatttattca aattatctca cattatgtgt    900
tcaacatttt tatgctgaag tttcccttag acattttatg tcttgcttgt agggcataat    960
gccttgttta atgtccattc tgcagcgttt ctctttccct tggaaaagag aatttatcat    1020
tactgttaca tttgtacaaa tgacatgata ataaaagttt tatg                     1064
<210>7
<211>1469
<212>DNA
<213>人
<400>7
agcagcagga ggaggcagag cacagcatcg tcgggaccag actcgtctca ggccagttgc    60
agccttctca gccaaacgcc gaccaaggaa aactcactac catgagaatt gcagtgattt    120
gcttttgcct cctaggcatc acctgtgcca taccagttaa acaggctgat tctggaagtt    180
ctgaggaaaa gcagctttac aacaaatacc cagatgctgt ggccacatgg ctaaaccctg    240
acccatctca gaagcagaat ctcctagccc cacagaccct tccaagtaag tccaacgaaa    300
gccatgacca catggatgat atggatgatg aagatgatga tgaccatgtg gacagccagg    360
actccattga ctcgaacgac tctgatgatg tagatgacac tgatgattct caccagtctg    420
atgagtctca ccattctgat gaatctgatg aactggtcac tgattttccc acggacctgc    480
cagcaaccga agttttcact ccagttgtcc ccacagtaga cacatatgat ggccgaggtg    540
atagtgtggt ttatggactg aggtcaaaat ctaagaagtt tcgcagacct gacatccagt    600
accctgatgc tacagacgag gacatcacct cacacatgga aagcgaggag ttgaatggtg    660
catacaaggc catccccgtt gcccaggacc tgaacgcgcc ttctgattgg gacagccgtg    720
ggaaggacag ttatgaaacg agtcagctgg atgaccagag tgctgaaacc cacagccaca    780
agcagtccag attatataag cggaaagcca atgatgagag caatgagcat tccgatgtga    840
ttgatagtca ggaactttcc aaagtcagcc gtgaattcca cagccatgaa tttcacagcc    900
atgaagatat gctggttgta gaccccaaaa gtaaggaaga agataaacac ctgaaatttc    960
gtatttctca tgaattagat agtgcatctt ctgaggtcaa ttaaaaggag aaaaaataca    1020
atttctcact ttgcatttag tcaaaagaaa aaatgcttta tagcaaaatg aaagagaaca    1080
tgaaatgctt ctttctcagt ttattggttg aatgtgtatc tatttgagtc tggaaataac    1140
taatgtgttt gataattagt ttagtttgtg gcttcatgga aactccctgt aaactaaaag    1200
cttcagggtt atgtctatgt tcattctata gaagaaatgc aaactatcac tgtattttaa    1260
tatttgttat tctctcatga atagaaattt atgtagaagc aaacaaaata cttttaccca    1320
cttaaaaaga gaatataaca ttttatgtca ctataatctt ttgtttttta agttagtgta    1380
tattttgttg tgattatctt tttgtggtgt gaataaatct tttatcttga atgtaataag    1440
aaaaaaaaaa aaaaaacaaa aaaaaaaaa                                      1469
<210>8
<211>1256
<212>DNA
<213>人
<400>8
gcagtagcag cgagcagcag agtccgcacg ctccggcgag gggcagaaga gcgcgaggga    60
gcgcggggca gcagaagcga gagccgagcg cggacccagc caggacccac agccctcccc    120
agctgcccag gaagagcccc agccatggaa caccagctcc tgtgctgcga agtggaaacc    180
atccgccgcg cgtaccccga tgccaacctc ctcaacgacc gggtgctgcg ggccatgctg    240
aaggcggagg agacctgcgc gccctcggtg tcctacttca aatgtgtgca gaaggaggtc    300
ctgccgtcca tgcggaagat cgtcgccacc tggatgctgg aggtctgcga ggaacagaag    360
tgcgaggagg aggtcttccc gctggccatg aactacctgg accgcttcct gtcgctggag    420
cccgtgaaaa agagccgcct gcagctgctg ggggccactt gcatgttcgt ggcctctaag    480
atgaaggaga ccatccccct gacggccgag aagctgtgca tctacaccga cggctccatc    540
cggcccgagg agctgctgca aatggagctg ctcctggtga acaagctcaa gtggaacctg    600
gccgcaatga ccccgcacga tttcattgaa cacttcctct ccaaaatgcc agaggcggag    660
gagaacaaac agatcatccg caaacacgcg cagaccttcg ttgcctcttg tgccacagat    720
gtgaagttca tttccaatcc gccctccatg gtggcagcgg ggagcgtggt ggccgcagtg    780
caaggcctga acctgaggag ccccaacaac ttcctgtcct actaccgcct cacacgcttc    840
ctctccagag tgatcaagtg tgacccagac tgcctccggg cctgccagga gcagatcgaa    900
gccctgctgg agtcaagcct gcgccaggcc cagcagaaca tggaccccaa ggccgccgag    960
gaggaggaag aggaggagga ggaggtggac ctggcttgca cacccaccga cgtgcgggac    1020
gtggacatct gaggggccca ggcaggcggg cgccaccgcc acccgcagcg agggcggagc    1080
cggccccagg tgctccacat gacagtccct cctctccgga gcattttgat accagaaggg    1140
aaagcttcat tctccttgtt gttggttgtt ttttcctttg ctctttcccc cttccatctc    1200
tgacttaagc aaaagaaaaa gattacccaa aaactgtctt taaaagagag agagag        1256
<210>9
<211>2121
<212>DNA
<213>人
<400>9
ctgctcgcgg ccgccaccgc cgggccccgg ccgtccctgg ctcccctcct gcctcgagaa    60
gggcagggct tctcagaggc ttggcgggaa aaaagaacgg agggagggat cgcgctgagt    120
ataaaagccg gttttcgggg ctttatctaa ctcgctgtag taattccagc gagaggcaga    180
gggagcgagc gggcggccgg ctagggtgga agagccgggc gagcagagct gcgctgcggg    240
cgtcctggga agggagatcc ggagcgaata gggggcttcg cctctggccc agccctcccg    300
cttgatcccc caggccagcg gtccgcaacc cttgccgcat ccacgaaact ttgcccatag    360
cagcgggcgg gcactttgca ctggaactta caacacccga gcaaggacgc gactctcccg    420
acgcggggag gctattctgc ccatttgggg acacttcccc gccgctgcca ggacccgctt    480
ctctgaaagg ctctccttgc agctgcttag acgctggatt tttttcgggt agtggaaaac    540
cagcagcctc ccgcgacgat gcccctcaac gttagcttca ccaacaggaa ctatgacctc    600
gactacgact cggtgcagcc gtatttctac tgcgacgagg aggagaactt ctaccagcag    660
cagcagcaga gcgagctgca gcccccggcg cccagcgagg atatctggaa gaaattcgag    720
ctgctgccca ccccgcccct gtcccctagc cgccgctccg ggctctgctc gccctcctac    780
gttgcggtca cacccttctc ccttcgggga gacaacgacg gcggtggcgg gagcttctcc    840
acggccgacc agctggagat ggtgaccgag ctgctgggag gagacatggt gaaccagagt    900
ttcatctgcg acccggacga cgagaccttc atcaaaaaca tcatcatcca ggactgtatg    960
tggagcggct tctcggccgc cgccaagctc gtctcagaga agctggcctc ctaccaggct    1020
gcgcgcaaag acagcggcag cccgaacccc gcccgcggcc acagcgtctg ctccacctcc    1080
agcttgtacc tgcaggatct gagcgccgcc gcctcagagt gcatcgaccc ctcggtggtc    1140
ttcccctacc ctctcaacga cagcagctcg cccaagtcct gcgcctcgca agactccagc    1200
gccttctctc cgtcctcgga ttctctgctc tcctcgacgg agtcctcccc gcagggcagc    1260
cccgagcccc tggtgctcca tgaggagaca ccgcccacca ccagcagcga ctctgaggag    1320
gaacaagaag atgaggaaga aatcgatgtt gtttctgtgg aaaagaggca ggctcctggc    1380
aaaaggtcag agtctggatc accttctgct ggaggccaca gcaaacctcc tcacagccca    1440
ctggtcctca agaggtgcca cgtctccaca catcagcaca actacgcagc gcctccctcc    1500
actcggaagg actatcctgc tgccaagagg gtcaagttgg acagtgtcag agtcctgaga    1560
cagatcagca acaaccgaaa atgcaccagc cccaggtcct cggacaccga ggagaatgtc    1620
aagaggcgaa cacacaacgt cttggagcgc cagaggagga acgagctaaa acggagcttt    1680
tttgccctgc gtgaccagat cccggagttg gaaaacaatg aaaaggcccc caaggtagtt    1740
atccttaaaa aagccacagc atacatcctg tccgtccaag cagaggagca aaagctcatt    1800
tctgaagagg acttgttgcg gaaacgacga gaacagttga aacacaaact tgaacagcta    1860
cggaactctt gtgcgtaagg aaaagtaagg aaaacgattc cttctaacag aaatgtcctg    1920
agcaatcacc tatgaacttg tttcaaatgc atgatcaaat gcaacctcac aaccttggct    1980
gagtcttgag actgaaagat ttagccataa tgtaaactgc ctcaaattgg actttgggca    2040
taaaagaact tttttatgct taccatcttt tttttttctt taacagattt gtatttaaga    2100
attgttttta aaaaatttta a                                              2121
<210>10
<211>2098
<212>DNA
<213>人
<400>10
cctgccgaag tcagttcctt gtggagccgg agctgggcgc ggattcgccg aggcaccgag    60
gcactcagag gaggcgccat gtcagaaccg gctggggatg tccgtcagaa cccatgcggc    120
agcaaggcct gccgccgcct cttcggccca gtggacagcg agcagctgag ccgcgactgt    180
gatgcgctaa tggcgggctg catccaggag gcccgtgagc gatggaactt cgactttgtc    240
accgagacac cactggaggg tgacttcgcc tgggagcgtg tgcggggcct tggcctgccc    300
aagctctacc ttcccacggg gccccggcga ggccgggatg agttgggagg aggcaggcgg    360
cctggcacct cacctgctct gctgcagggg acagcagagg aagaccatgt ggacctgtca    420
ctgtcttgta cccttgtgcc tcgctcaggg gagcaggctg aagggtcccc aggtggacct    480
ggagactctc agggtcgaaa acggcggcag accagcatga cagatttcta ccactccaaa    540
cgccggctga tcttctccaa gaggaagccc taatccgccc acaggaagcc tgcagtcctg    600
gaagcgcgag ggcctcaaag gcccgctcta catcttctgc cttagtctca gtttgtgtgt    660
cttaattatt atttgtgttt taatttaaac acctcctcat gtacataccc tggccgcccc    720
ctgcccccca gcctctggca ttagaattat ttaaacaaaa actaggcggt tgaatgagag    780
gttcctaaga gtgctgggca tttttatttt atgaaatact atttaaagcc tcctcatccc    840
gtgttctcct tttcctctct cccggaggtt gggtgggccg gcttcatgcc agctacttcc    900
tcctccccac ttgtccgctg ggtggtaccc tctggagggg tgtggctcct tcccatcgct    960
gtcacaggcg gttatgaaat tcaccccctt tcctggacac tcagacctga attctttttc    1020
atttgagaag taaacagatg gcactttgaa ggggcctcac cgagtggggg catcatcaaa    1080
aactttggag tcccctcacc tcctctaagg ttgggcaggg tgaccctgaa gtgagcacag    1140
cctagggctg agctggggac ctggtaccct cctggctctt gatacccccc tctgtcttgt    1200
gaaggcaggg ggaaggtggg gtcctggagc agaccacccc gcctgccctc atggcccctc    1260
tgacctgcac tggggagccc gtctcagtgt tgagcctttt ccctctttgg ctcccctgta    1320
ccttttgagg agccccagct acccttcttc tccagctggg ctctgcaatt cccctctgct    1380
gctgtccctc ccccttgtcc tttcccttca gtaccctctc agctccaggt ggctctgagg    1440
tgcctgtccc acccccaccc ccagctcaat ggactggaag gggaagggac acacaagaag    1500
aagggcaccc tagttctacc tcaggcagct caagcagcga ccgccccctc ctctagctgt    1560
gggggtgagg gtcccatgtg gtggcacagg cccccttgag tggggttatc tctgtgttag    1620
gggtatatga tgggggagta gatctttcta ggagggagac actggcccct caaatcgtcc    1680
agcgaccttc ctcatccacc ccatccctcc ccagttcatt gcactttgat tagcagcgga    1740
acaaggagtc agacatttta agatggtggc agtagaggct atggacaggg catgccacgt    1800
gggctcatat ggggctggga gtagttgtct ttcctggcac taacgttgag cccctggagg    1860
cactgaagtg cttagtgtac ttggagtatt ggggtctgac cccaaacacc ttccagctcc    1920
tgtaacatac tggcctggac tgttttctct cggctcccca tgtgtcctgg ttcccgtttc    1980
tccacctaga ctgtaaacct ctcgagggca gggaccacac cctgtactgt tctgtgtctt    2040
tcacagctcc tcccacaatg ctgatataca gcaggtgctc aataaacgat tcttagtg      2098
<210>11
<211>1850
<212>DNA
<213>人
<400>11
ggcccaggct gaagctcagg gccctgtctg ctctgtggac tcaacagttt gtggcaagac    60
aagctcagaa ctgagaagct gtcaccacag ttctggaggc tgggaagttc aagatcaaag    120
tgccagcaga ttcagtgtca tgtgaggacg tgcttcctgc ttcatagata agagcttgga    180
gctcggcgca caaccagcac catctggtcg cgatggtgga cacggaaagc ccactctgcc    240
ccctctcccc actcgaggcc ggcgatctag agagcccgtt atctgaagag ttcctgcaag    300
aaatgggaaa catccaagag atttcgcaat ccatcggcga ggatagttct ggaagctttg    360
gctttacgga ataccagtat ttaggaagct gtcctggctc agatggctcg gtcatcacgg    420
acacgctttc accagcttcg agcccctcct cggtgactta tcctgtggtc cccggcagcg    480
tggacgagtc tcccagtgga gcattgaaca tcgaatgtag aatctgcggg gacaaggcct    540
caggctatca ttacggagtc cacgcgtgtg aaggctgcaa gggcttcttt cggcgaacga    600
ttcgactcaa gctggtgtat gacaagtgcg accgcagctg caagatccag aaaaagaaca    660
gaaacaaatg ccagtattgt cgatttcaca agtgcctttc tgtcgggatg tcacacaacg    720
cgattcgttt tggacgaatg ccaagatctg agaaagcaaa actgaaagca gaaattctta    780
cctgtgaaca tgacatagaa gattctgaaa ctgcagatct caaatctctg gccaagagaa    840
tctacgaggc ctacttgaag aacttcaaca tgaacaaggt caaagcccgg gtcatcctct    900
caggaaaggc cagtaacaat ccaccttttg tcatacatga tatggagaca ctgtgtatgg    960
ctgagaagac gctggtggcc aagctggtgg ccaatggcat ccagaacaag gaggcggagg    1020
tccgcatctt tcactgctgc cagtgcacgt cagtggagac cgtcacggag ctcacggaat    1080
tcgccaaggc catcccaggc ttcgcaaact tggacctgaa cgatcaagtg acattgctaa    1140
aatacggagt ttatgaggcc atattcgcca tgctgtcttc tgtgatgaac aaagacggga    1200
tgctggtagc gtatggaaat gggtttataa ctcgtgaatt cctaaaaagc ctaaggaaac    1260
cgttctgtga tatcatggaa cccaagtttg attttgccat gaagttcaat gcactggaac  1320
tggatgacag tgatatctcc ctttttgtgg ctgctatcat ttgctgtgga gatcgtcctg  1380
gccttctaaa cgtaggacac attgaaaaaa tgcaggaggg tattgtacat gtgctcagac  1440
tccacctgca gagcaaccac ccggacgata tctttctctt cccaaaactt cttcaaaaaa  1500
tggcagacct ccggcagctg gtgacggagc atgcgcagct ggtgcagatc atcaagaaga  1560
cggagtcgga tgctgcgctg cacccgctac tgcaggagat ctacagggac atgtactgag  1620
ttccttcaga tcagccacac cttttccagg agttctgaag ctgacagcac tacaaaggag  1680
acgggggagc agcacgattt tgcacaaata tccaccactt taaccttaga gcttggacag  1740
tctgagctgt aggtaaccgg catattattc catatctttg ttttaaccag tacttctaag  1800
agcatagaac tcaaatgctg ggggaggtgg ctaatctcag gactgggaag             1850
<210>12
<211>1609
<212>DNA
<213>人
<400>12
ttcaagtctt tttcttttaa cggattgatc ttttgctaga tagagacaaa atatcagtgt    60
gaattacagc aaacccctat tccatgctgt tatgggtgaa actctgggag attctcctat    120
tgacccagaa agcgattcct tcactgatac actgtctgca aacatatcacaagaaatgac     180
catggttgac acagagatgc cattctggcc caccaacttt gggatcagct ccgtggatct    240
ctccgtaatg gaagaccact cccactcctt tgatatcaag cccttcacta ctgttgactt    300
ctccagcatt tctactccac attacgaaga cattccattc acaagaacag atccagtggt    360
tgcagattac aagtatgacc tgaaacttca agagtaccaa agtgcaatca aagtggagcc    420
tgcatctcca ccttattatt ctgagaagac tcagctctac aataagcctc atgaagagcc    480
ttccaactcc ctcatggcaa ttgaatgtcg tgtctgtgga gataaagctt ctggatttca    540
ctatggagtt catgcttgtg aaggatgcaa gggtttcttc cggagaacaa tcagattgaa    600
gcttatctat gacagatgtg atcttaactg tcggatccac aaaaaaagta gaaataaatg    660
tcagtactgt cggtttcaga aatgccttgc agtggggatg tctcataatg ccatcaggtt    720
tgggcggatg ccacaggccg agaaggagaa gctgttggcg gagatctcca gtgatatcga    780
ccagctgaat ccagagtccg ctgacctccg ggccctggca aaacatttgt atgactcata    840
cataaagtcc ttcccgctga ccaaagcaaa ggcgagggcg atcttgacag gaaagacaac    900
agacaaatca ccattcgtta tctatgacat gaattcctta atgatgggag aagataaaat    960
caagttcaaa cacatcaccc ccctgcagga gcagagcaaa gaggtggcca tccgcatctt    1020
tcagggctgc cagtttcgct ccgtggaggc tgtgcaggag atcacagagt atgccaaaag    1080
cattcctggt tttgtaaatc ttgacttgaa cgaccaagta actctcctca aatatggagt    1140
ccacgagatc atttacacaa tgctggcctc cttgatgaat aaagatgggg ttctcatatc    1200
cgagggccaa ggcttcatga caagggagtt tctaaagagc ctgcgaaagc cttttggtga    1260
ctttatggag cccaagtttg agtttgctgt gaagttcaat gcactggaat tagatgacag    1320
cgacttggca atatttattg ctgtcattat tctcagtgga gaccgcccag gtttgctgaa    1380
tgtgaagccc attgaagaca ttcaagacaa cctgctacaa gccctggagc tccagctgaa    1440
gctgaaccac cctgagtcct cacagctgtt tgccaagctg ctccagaaaa tgacagacct    1500
cagacagatt gtcacggaac acgtgcagct actgcaggtg atcaagaaga cggagacaga    1560
catgagtctt cacccgctcc tgcaggagat ctacaaggac ttgtactag                1609
<210>13
<211>3301
<212>DNA
<213>人
<220>
<221>misc_feature
<222>(2966)..(2973)
<223>n=a,c,g,t
<400>13
gaattctgcg gagcctgcgg gacggcggcg ggttggcccg taggcagccg ggacagtgtt    60
gtacagtgtt ttgggcatgc acgtgatact cacacagtgg cttctgctca ccaacagatg    120
aagacagatg caccaacgag ggtctggaat ggtctggagt ggtctggaaa gcagggtcag    180
atacccctgg aaaactgaag cccgtggagc aatgatctct acaggactgc ttcaaggctg    240
atgggaacca ccctgtagag gtccatctgc gttcagaccc agacgatgcc agagctatga    300
ctgggcctgc aggtgtggcg ccgaggggag atcagccatg gagcagccac aggaggaagc    360
ccctgaggtc cgggaagagg aggagaaaga ggaagtggca gaggcagaag gagccccaga    420
gctcaatggg ggaccacagc atgcacttcc ttccagcagc tacacagacc tctcccggag    480
ctcctcgcca ccctcactgc tggaccaact gcagatgggc tgtgacgggg cctcatgcgg    540
cagcctcaac atggagtgcc gggtgtgcgg ggacaaggca tcgggcttcc actacggtgt    600
tcatgcatgt gaggggtgca agggcttctt ccgtcgtacg atccgcatga agctggagta    660
cgagaagtgt gagcgcagct gcaagattca gaagaagaac cgcaacaagt gccagtactg    720
ccgcttccag aagtgcctgg cactgggcat gtcacacaac gctatccgtt ttggtcggat    780
gccggaggct gagaagagga agctggtggc agggctgact gcaaacgagg ggagccagta    840
caacccacag gtggccgacc tgaaggcctt ctccaagcac atctacaatg cctacctgaa    900
aaacttcaac atgaccaaaa agaaggcccg cagcatcctc accggcaaag ccagccacac    960
ggcgcccttt gtgatccacg acatcgagac attgtggcag gcagagaagg ggctggtgtg    1020
gaagcagttg gtgaatggcc tgcctcccta caaggagatc agcgtgcacg tcttctaccg    1080
ctgccagtgc accacagtgg agaccgtgcg ggagctcact gagttcgcca agagcatccc    1140
cagcttcagc agcctcttcc tcaacgacca ggttaccctt ctcaagtatg gcgtgcacga    1200
ggccatcttc gccatgctgg cctctatcgt caacaaggac gggctgctgg tagccaacgg    1260
cagtggcttt gtcacccgtg agttcctgcg cagcctccgc aaacccttca gtgatatcat    1320
tgagcctaag tttgaatttg ctgtcaagtt caacgccctg gaacttgatg acagtgacct    1380
ggccctattc attgcggcca tcattctgtg tggagaccgg ccaggcctca tgaacgttcc    1440
acgggtggag gctatccagg acaccatcct gcgtgccctc gaattccacc tgcaggccaa    1500
ccaccctgat gcccagtacc tcttccccaa gctgctgcag aagatggctg acctgcggca    1560
actggtcacc gagcacgccc agatgatgca gcggatcaag aagaccgaaa ccgagacctc    1620
gctgcaccct ctgctccagg agatctacaa ggacatgtac taacggcggc acccaggcct    1680
ccctgcagac tccaatgggg ccagcactgg aggggcccac ccacatgact tttccattga    1740
ccagctctct tcctgtcttt gttgtctccc tctttctcag ttcctctttc ttttctaatt    1800
cctgttgctc tgtttcttcc tttctgtagg tttctctctt cccttctccc ttctcccttg    1860
ccctcccttt ctctctccta tccccacgtc tgtcctcctt tcttattctg tgagatgttt    1920
tgtattattt caccagcagc atagaacagg acctctgctt ttgcacacct tttccccagg    1980
agcagaagag agtgggcctg ccctctgccc catcattgca cctgcaggct taggtcctca    2040
cttctgtctc ctgtcttcag agcaaaagac ttgagccatc caaagaaaca ctaagctctc    2100
tgggcctggg ttccagggaa ggctaagcat ggcctggact gactgcagcc ccctatagtc    2160
atggggtccc tgctgcaaag gacagtggca gaccccggca gtagagccga gatgcctccc    2220
caagactgtc attgcccctc cgatcgtgag gccacccact gacccaatga tcctctccag    2280
cagcacacct cagccccact gacacccagt gtccttccat cttcacactg gtttgccagg    2340
ccaatgttgc tgatggcccc tccagcacac acacataagc actgaaatca ctttacctgc    2400
aggcaccatg cacctccctt ccctccctga ggcaggtgag aacccagaga gaggggcctg    2460
caggtgagca ggcagggctg ggccaggtct ccggggaggc aggggtcctg caggtcctgg    2520
tgggtcagcc cagcacctcg cccagtggga gcttcccggg ataaactgag cctgttcatt    2580
ctgatgtcca tttgtcccaa tagctctact gccctcccct tcccctttac tcagcccagc    2640
tggccaccta gaagtctccc tgcacagcct ctagtgtccg gggaccttgt gggaccagtc    2700
ccacaccgct ggtccctgcc ctcccctgct cccaggttga ggtgcgctca cctcagagca    2760
gggccaaagc acagctgggc atgccatgtc tgagcggcgc agagccctcc aggcctgcag    2820
gggcaagggg ctggctggag tctcagagca cagaggtagg agaactgggg ttcaagccca    2880
ggcttcctgg gtcctgcctg gtcctccctc ccaaggagcc attctatgtg actctgggtg    2940
gaagtgccca gcccctgcct gacggnnnnn nngatcactc tctgctggca ggattcttcc    3000
cgctccccac ctacccagct gatgggggtt ggggtgcttc tttcagccaa ggctatgaag    3060
ggacagctgc tgggacccac ctcccccctt ccccggccac atgccgcgtc cctgccccca    3120
cccgggtctg gtgctgagga tacagctctt ctcagtgtct gaacaatctc caaaattgaa    3180
atgtatattt ttgctaggag ccccagcttc ctgtgttttt aatataaata gtgtacacag    3240
actgacgaaa ctttaaataa atgggaatta aatatttaaa aaaaaaagcg gccgcgaatt    3300
c                                                                    3301
<210>14
<211>3083
<212>DNA
<213>人
<400>14
aaaaactgca gccaacttcc gaggcagcct cattgcccag cggaccccag cctctgccag    60
gttcggtccg ccatcctcgt cccgtcctcc gccggcccct gccccgcgcc cagggatcct    120
ccagctcctt tcgcccgcgc cctccgttcg ctccggacac catggacaag ttttggtggc    180
acgcagcctg gggactctgc ctcgtgccgc tgagcctggc gcagatcgat ttgaatataa    240
cctgccgctt tgcaggtgta ttccacgtgg agaaaaatgg tcgctacagc atctctcgga    300
cggaggccgc tgacctctgc aaggctttca atagcacctt gcccacaatg gcccagatgg    360
agaaagctct gagcatcgga tttgagacct gcaggtatgg gttcatagaa gggcacgtgg    420
tgattccccg gatccacccc aactccatct gtgcagcaaa caacacaggg gtgtacatcc    480
tcacatccaa cacctcccag tatgacacat attgcttcaa tgcttcagct ccacctgaag    540
aagattgtac atcagtcaca gacctgccca atgcctttga tggaccaatt accataacta    600
ttgttaaccg tgatggcacc cgctatgtcc agaaaggaga atacagaacg aatcctgaag    660
acatctaccc cagcaaccct actgatgatg acgtgagcag cggcttttct actgtacacc    720
ccatcccaga cgaagacagt ccctggatca cctcctccag tgaaaggagc agcacttcag    780
gaggttacat cttttacacc gacagcacag acagaatccc tgctaccact ttgatgagca    840
ctagtgctac agcaactgag acagcaacca agaggcaaga aacctgggat tggttttcat    900
ggttgtttct accatcagag tcaaagaatc atcttcacac aacaacacaa atggctggta    960
cgtcttcaaa taccatctca gcaggctggg agccaaatga agaaaatgaa gatgaaagag    1020
acagacacct cagtttttct ggatcaggca ttgatgatga tgaagatttt atctccagca    1080
ccatttcaac cacaccacgg gcttttgacc acacaaaaca gaaccaggac tggacccagt    1140
ggaacccaag ccattcaaat ccggaagtgc tacttcagac aaccacaagg atgactgatg    1200
tagacagaaa tggcaccact gcttatgaag gaaactggaa cccagaagca caccctcccc    1260
tcattcacca tgagcatcat gaggaagaag agaccccaca ttctacaagc acaatccagg    1320
caactcctag tagtacaacg gaagaaacag ctacccagaa ggaacagtgg tttggcaaca    1380
gatggcatga gggatatcgc caaacaccca aagaagactc ccatttcaac ccaatctcac    1440
accccatggg acgaggtcat caagcaggaa gatcgacaac agggacagct gcagcctcag    1500
ctcataccag ccatccaatg caaggaagga caacaccaag cccagaggac agttcctgga    1560
ctgatttcag gatggatatg gactccagtc atagtataac gcttcagcct actgcaaatc    1620
caaacacagg tttggtggaa gatttggaca ggacaggacc tctttcaatg acaacgcagc    1680
agagtaattc tcagagcttc tctacatcac atgaaggctt ggaagaagat aaagaccatc    1740
caacaacttc tactctgaca tcaagcaata ggaatgatgt cacaggtgga agaagagacc    1800
caaatcattc tgaaggctca actactttac tggaaggtta tacctctcat tacccacaca    1860
cgaaggaaag caggaccttc atcccagtga cctcagctaa gactgtcaat cgttccttat    1920
caggagacca agacacattc caccccagtg gggggtcctt tggagttact gcagttactg    1980
ttggagattc caactctaat gggtcccata ccactcatgg atctgaatca gatggacact    2040
cacatgggag tcaagaaggt ggagcaaaca caacctctgg tcctataagg acaccccaaa    2100
ttccagaatg gctgatcatc ttggcatccc tcttggcctt ggctttgatt cttgcagttt    2160
gcattgcagt caacagtcga agaaggtgtg ggcagaagaa aaagctagtg atcaacagtg    2220
gcaatggagc tgtggaggac agaaagccaa gtggactcaa cggagaggcc agcaagtctc    2280
aggaaatggt gcatttggtg aacaaggagt cgtcagaaac tccagaccag tttatgacag    2340
ctgatgagac aaggaacctg cagaatgtgg acatgaagat tggggtgtaa cacctacacc    2400
attatcttgg aaagaaacaa ccgttggaaa cataaccatt acagggagct gggacactta    2460
acagatgcaa tgtgctactg attgtttcat tgcgaatctt ttttagcata aaattttcta    2520
ctctttttgt tttttgtgtt ttgttcttta aagtcaggtc caatttgtaa aaacagcatt    2580
gctttctgaa attagggccc aattaataat cagcaagaat ttgatcgttc cagttcccac    2640
ttggaggcct ttcatccctc gggtgtgcta tggatggctt ctaacaaaaa ctacacatat    2700
gtattcctga tcgccaacct ttcccccacc agctaaggac atttcccagg gttaataggg    2760
cctggtccct gggaggaaat ttgaatgggt ccattttgcc cttccatagc ctaatccctg    2820
ggcattgctt tccactgagg ttgggggttg gggtgtacta gttacacatc ttcaacagac    2880
cccctctaga aatttttcag atgcttctgg gagacaccca aagggtgaag ctatttatct    2940
gtagtaaact atttatctgt gtttttgaaa tattaaaccc tggatcagtc ctttgatcag    3000
tataattttt taaagttact ttgtcagagg cacaaaaggg tttaaactga ttcataataa    3060
atatctgtac ttcttcgatc ttc                                            3083
<210>15
<211>2539
<212>DNA
<213>人
<400>15
ggagtctctt gctctggttc ttgctgttcc tgctcctgct cccgccgctc cccgtcctgc    60
tcgcggaccc aggggcgccc acgccagtga atccctgttg ttactatcca tgccagcacc    120
agggcatctg tgtccgcttc ggccttgacc gctaccagtg tgactgcacc cgcacgggct    180
attccggccc caactgcacc atccctggcc tgtggacctg gctccggaat tcactgcggc    240
ccagcccctc tttcacccac ttcctgctca ctcacgggcg ctggttctgg gagtttgtca    300
atgccacctt catccgagag atgctcatgc gcctggtact cacagtgcgc tccaacctta    360
tccccagtcc ccccacctac aactcagcac atgactacat cagctgggag tctttctcca    420
acgtgagcta ttacactcgt attctgccct ctgtgcctaa agattgcccc acacccatgg    480
gaaccaaagg gaagaagcag ttgccagatg cccagctcct ggcccgccgc ttcctgctca    540
ggaggaagtt catacctgac ccccaaggca ccaacctcat gtttgccttc tttgcacaac    600
acttcaccca ccagttcttc aaaacttctg gcaagatggg tcctggcttc accaaggcct    660
tgggccatgg ggtagacctc ggccacattt atggagacaa tctggagcgt cagtatcaac    720
tgcggctctt taaggatggg aaactcaagt accaggtgct ggatggagaa atgtacccgc    780
cctcggtaga agaggcgcct gtgttgatgc actacccccg aggcatcccg ccccagagcc    840
agatggctgt gggccaggag gtgtttgggc tgcttcctgg gctcatgctg tatgccacgc    900
tctggctacg tgagcacaac cgtgtgtgtg acctgctgaa ggctgagcac cccacctggg    960
gcgatgagca gcttttccag acgacccgcc tcatcctcat aggggagacc atcaagattg    1020
tcatcgagga gtacgtgcag cagctgagtg gctatttcct gcagctgaaa tttgacccag    1080
agctgctgtt cggtgtccag ttccaatacc gcaaccgcat tgccatggag ttcaaccatc    1140
tctaccactg gcaccccctc atgcctgact ccttcaaggt gggctcccag gagtacagct    1200
acgagcagtt cttgttcaac acctccatgt tggtggacta tggggttgag gccctggtgg    1260
atgccttctc tcgccagatt gctggccgga tcggtggggg caggaacatg gaccaccaca    1320
tcctgcatgt ggctgtggat gtcatcaggg agtctcggga gatgcggctg cagcccttca    1380
atgagtaccg caagaggttt ggcatgaaac cctacacctc cttccaggag ctcgtaggag    1440
agaaggagat ggcagcagag ttggaggaat tgtatggaga cattgatgcg ttggagttct    1500
accctggact gcttcttgaa aagtgccatc caaactctat ctttggggag agtatgatag    1560
agattggggc tcccttttcc ctcaagggtc tcctagggaa tcccatctgt tctccggagt    1620
actggaagcc gagcacattt ggcggcgagg tgggctttaa cattgtcaag acggccacac    1680
tgaagaagct ggtctgcctc aacaccaaga cctgtcccta cgtttccttc cgtgtgccgg    1740
atgccagtca ggatgatggg cctgctgtgg agcgaccatc cacagagctc tgaggggcag    1800
gaaagcagca ttctggaggg gagagctttg tgcttgtcat tccagagtgc tgaggccagg    1860
gctgatggtc ttaaatgctc attttctggt ttggcatggt gagtgttggg gttgacattt    1920
agaactttaa gtctcaccca ttatctggaa tattgtgatt ctgtttattc ttccagaatg    1980
ctgaactcct tgttagccct tcagattgtt aggagtggtt ctcatttggt ctgccagaat    2040
actgggttct tagttgacaa cctagaatgt cagatttctg gttgatttgt aacacagtca    2100
ttctaggatg tggagctact gatgaaatct gctagaaagt tagggggttc ttattttgca    2160
ttccagaatc ttgactttct gattggtgat tcaaagtgtt gtgttcctgg ctgatgatcc    2220
agaacagtgg ctcgtatccc aaatctgtca gcatctggct gtctagaatg tggatttgat    2280
tcattttcct gttcagtgag atatcataga gacggagatc ctaaggtcca acaagaatgc    2340
attccctgaa tctgtgcctg cactgagagg gcaaggaagt ggggtgttct tcttgggacc    2400
cccactaaga ccctggtctg aggatgtaga gagaacaggt gggctgtatt cacgccattg    2460
gttggaagct accagagctc tatccccatc caggtcttga ctcatggcag ctgtttctca    2520
tgaagctaat aaaattcgc                                                 2539
<210>16
<211>369
<212>DNA
<213>人
<400>16
atgaagcttc tcacgggcct ggttttctgc tccttggtcc tgggtgtcag cagccgaagc    60
ttcttttcgt tccttggcga ggcttttgat ggggctcggg acatgtggag agcctactct    120
gacatgagag aagccaatta catcggctca gacaaatact tccatgctcg ggggaactat    180
gatgctgcca aaaggggacc tgggggtgtc tgggctgcag aagcgatcag cgatgccaga    240
gagaatatcc agagattctt tggccatggt gcggaggact cgctggctga tcaggctgcc    300
aatgaatggg gcaggagtgg caaagacccc aatcacttcc gacctgctgg cctgcctgag    360
aaatactga                                                            369
<210>17
<211>67
<212>PRT
<213>人
<400>17
Met Thr Ser Lys Leu Ala Val Ala Leu Leu Ala Ala Phe Leu Ile Ser
1               5                   10                  15
Ala Ala Leu Cys Glu Gly Ala Val Leu Pro Arg Ser Ala Lys Glu Leu
            20                  25                  30
Arg Cys Gln Cys Ile Lys Thr Tyr Ser Lys Pro Phe His Pro Lys Phe
        35                  40                  45
Ile Lys Glu Leu Arg Val Ile Glu Ser Gly Pro His Cys Ala Asn Thr
    50                  55                  60
Glu Ile Met
65
<210>18
<211>604
<212>PRT
<213>人
<400>18
Met Leu Ala Arg Ala Leu Leu Leu Cys Ala Val Leu Ala Leu Ser His
1               5                   10                  15
Thr Ala Asn Pro Cys Cys Ser His Pro Cys Gln Asn Arg Gly Val Cys
            20                  25                  30
Met Ser Val Gly Phe Asp Gln Tyr Lys Cys Asp Cys Thr Arg Thr Gly
        35                  40                  45
Phe Tyr Gly Glu Asn Cys Ser Thr Pro Glu Phe Leu Thr Arg Ile Lys
    50                  55                  60
Leu Phe Leu Lys Pro Thr Pro Asn Thr Val His Tyr Ile Leu Thr His
65                  70                  75                  80
Phe Lys Gly Phe Trp Asn Val Val Asn Asn Ile Pro Phe Leu Arg Asn
                85                  90                  95
Ala Ile Met Ser Tyr Val Leu Thr Ser Arg Ser His Leu Ile Asp Ser
            100                 105                 110
Pro Pro Thr Tyr Asn Ala Asp Tyr Gly Tyr Lys Ser Trp Glu Ala Phe
        115                 120                 125
Ser Asn Leu Ser Tyr Tyr Thr Arg Ala Leu Pro Pro Val Pro Asp Asp
    130                 135                 140
Cys Pro Thr Pro Leu Gly Val Lys Gly Lys Lys Gln Leu Pro Asp Ser
145                 150                 155                 160
Asn Glu Ile Val Glu Lys Leu Leu Leu Arg Arg Lys Phe Ile Pro Asp
                165                 170                 175
Pro Gln Gly Ser Asn Met Met Phe Ala Phe Phe Ala Gln His Phe Thr
            180                 185                 190
His Gln Phe Phe Lys Thr Asp His Lys Arg Gly Pro Ala Phe Thr Asn
        195                 200                 205
Gly Leu Gly His Gly Val Asp Leu Asn His Ile Tyr Gly Glu Thr Leu
    210                 215                 220
Ala Arg Gln Arg Lys Leu Arg Leu Phe Lys Asp Gly Lys Met Lys Tyr
225                 230                 235                 240
Gln Ile Ile Asp Gly Glu Met Tyr Pro Pro Thr Val Lys Asp Thr Gln
                245                 250                 255
Ala Glu Met Ile Tyr Pro Pro Gln Val Pro Glu His Leu Arg Phe Ala
            260                 265                 270
Val Gly Gln Glu Val Phe Gly Leu Val Pro Gly Leu Met Met Tyr Ala
        275                 280                 285
Thr Ile Trp Leu Arg Glu His Asn Arg Val Cys Asp Val Leu Lys Gln
    290                 295                 300
Glu His Pro Glu Trp Gly Asp Glu Gln Leu Phe Gln Thr Ser Arg Leu
305                 310                 315                 320
Ile Leu Ile Gly Glu Thr Ile Lys Ile Val Ile Glu Asp Tyr Val Gln
                325                 330                 335
His Leu Ser Gly Tyr His Phe Lys Leu Lys Phe Asp Pro Glu Leu Leu
            340                 345                 350
Phe Asn Lys Gln Phe Gln Tyr Gln Asn Arg Ile Ala Ala Glu Phe Asn
        355                 360                 365
Thr Leu Tyr His Trp His Pro Leu Leu Pro Asp Thr Phe Gln Ile His
    370                 375                 380
Asp Gln Lys Tyr Asn Tyr Gln Gln Phe Ile Tyr Asn Asn Ser Ile Leu
385                 390                 395                 400
Leu Glu His Gly Ile Thr Gln Phe Val Glu Ser Phe Thr Arg Gln Ile
                405                 410                 415
Ala Gly Arg Val Ala Gly Gly Arg Asn Val Pro Pro Ala Val Gln Lys
            420                 425                 430
Val Ser Gln Ala Ser Ile Asp Gln Ser Arg Gln Met Lys Tyr Gln Ser
        435                 440                 445
Phe Asn Glu Tyr Arg Lys Arg Phe Met Leu Lys Pro Tyr Glu Ser Phe
    450                 455                 460
Glu Glu Leu Thr Gly Glu Lys Glu Met Ser Ala Glu Leu Glu Ala Leu
465                 470                 475                 480
Tyr Gly Asp Ile Asp Ala Val Glu Leu Tyr Pro Ala Leu Leu Val Glu
                485                 490                 495
Lys Pro Arg Pro Asp Ala Ile Phe Gly Glu Thr Met Val Glu Val Gly
            500                 505                 510
Ala Pro Phe Ser Leu Lys Gly Leu Met Gly Asn Val Ile Cys Ser Pro
        515                 520                 525
Ala Tyr Trp Lys Pro Ser Thr Phe Gly Gly Glu Val Gly Phe Gln Ile
    530                 535                 540
Ile Asn Thr Ala Ser Ile Gln Ser Leu Ile Cys Asn Asn Val Lys Gly
545                 550                 555                 560
Cys Pro Phe Thr Ser Phe Ser Val Pro Asp Pro Glu Leu Ile Lys Thr
                565                 570                 575
Val Thr Ile Asn Ala Ser Ser Ser Arg Ser Gly Leu Asp Asp Ile Asn
            580                 585                 590
Pro Thr Val Leu Leu Lys Glu Arg Ser Thr Glu Leu
        595                 600
<210>19
<211>360
<212>PRT
<213>人
<400>19
Met Glu Asp Phe Asn Met Glu Ser Asp Ser Phe Glu Asp Phe Trp Lys
1               5                   10                  15
Gly Glu Asp Leu Ser Asn Tyr Ser Tyr Ser Ser Thr Leu Pro Pro Phe
            20                  25                  30
Leu Leu Asp Ala Ala Pro Cys Glu Pro Glu Ser Leu Glu Ile Asn Lys
        35                  40                  45
Tyr Phe Val Val Ile Ile Tyr Ala Leu Val Phe Leu Leu Ser Leu Leu
    50                  55                  60
Gly Asn Ser Leu Val Met Leu Val Ile Leu Tyr Ser Arg Val Gly Arg
65                  70                  75                  80
Ser Val Thr Asp Val Tyr Leu Leu Asn Leu Ala Leu Ala Asp Leu Leu
                85                  90                  95
Phe Ala Leu Thr Leu Pro Ile Trp Ala Ala Ser Lys Val Asn Gly Trp
            100                 105                 110
Ile Phe Gly Thr Phe Leu Cys Lys Val Val Ser Leu Leu Lys Glu Val
        115                 120                 125
Asn Phe Tyr Ser Gly Ile Leu Leu Leu Ala Cys Ile Ser Val Asp Arg
    130                 135                 140
Tyr Leu Ala Ile Val His Ala Thr Arg Thr Leu Thr Gln Lys Arg Tyr
145                 150                 155                 160
Leu Val Lys Phe Ile Cys Leu Ser Ile Trp Gly Leu Ser Leu Leu Leu
                165                 170                 175
Ala Leu Pro Val Leu Leu Phe Arg Arg Thr Val Tyr Ser Ser Asn Val
            180                 185                 190
Ser Pro Ala Cys Tyr Glu Asp Met Gly Asn Asn Thr Ala Asn Trp Arg
        195                 200                 205
Met Leu Leu Arg Ile Leu Pro Gln Ser Phe Gly Phe Ile Val Pro Leu
    210                 215                 220
Leu Ile Met Leu Phe Cys Tyr Gly Phe Thr Leu Arg Thr Leu Phe Lys
225                 230                 235                 240
Ala His Met Gly Gln Lys His Arg Ala Met Arg Val Ile Phe Ala Val
                245                 250                 255
Val Leu Ile Phe Leu Leu Cys Trp Leu Pro Tyr Asn Leu Val Leu Leu
            260                 265                 270
Ala Asp Thr Leu Met Arg Thr Gln Val Ile Gln Glu Thr Cys Glu Arg
        275                 280                 285
Arg Asn His Ile Asp Arg Ala Leu Asp Ala Thr Glu Ile Leu Gly Ile
    290                 295                 300
Leu His Ser Cys Leu Asn Pro Leu Ile Tyr Ala Phe Ile Gly Gln Lys
305                 310                 315                 320
Phe Arg His Gly Leu Leu Lys Ile Leu Ala Ile His Gly Leu Ile Ser
                325                 330                 335
Lys Asp Ser Leu Pro Lys Asp Ser Arg Pro Ser Phe Val Gly Ser Ser
            340                 345                 350
Ser Gly His Thr Ser Thr Thr Leu
        355                 360
<210>20
<211>554
<212>PRT
<213>人
<400>20
Met Thr Ala Pro Gly Ala Ala Gly Arg Cys Pro Pro Thr Thr Trp Leu
1               5                   10                  15
Gly Ser Leu Leu Leu Leu Val Cys Leu Leu Ala Ser Arg Ser Ile Thr
            20                  25                  30
Glu Glu Val Ser Glu Tyr Cys Ser His Met Ile Gly Ser Gly His Leu
        35                  40                  45
Gln Ser Leu Gln Arg Leu Ile Asp Ser Gln Met Glu Thr Ser Cys Gln
    50                  55                  60
Ile Thr Phe Glu Phe Val Asp Gln Glu Gln Leu Lys Asp Pro Val Cys
65                  70                  75                  80
Tyr Leu Lys Lys Ala Phe Leu Leu Val Gln Asp Ile Met Glu Asp Thr
                85                  90                  95
Met Arg Phe Arg Asp Asn Thr Ala Asn Pro Ile Ala Ile Val Gln Leu
            100                 105                 110
Gln Glu Leu Ser Leu Arg Leu Lys Ser Cys Phe Thr Lys Asp Tyr Glu
        115                 120                 125
Glu His Asp Lys Ala Cys Val Arg Thr Phe Tyr Glu Thr Pro Leu Gln
    130                 135                 140
Leu Leu Glu Lys Val Lys Asn Val Phe Asn Glu Thr Lys Asn Leu Leu
145                 150                 155                 160
Asp Lys Asp Trp Asn Ile Phe Ser Lys Asn Cys Asn Asn Ser Phe Ala
                165                 170                 175
Glu Cys Ser Ser Gln Asp Val Val Thr Lys Pro Asp Cys Asn Cys Leu
            180                 185                 190
Tyr Pro Lys Ala Ile Pro Ser Ser Asp Pro Ala Ser Val Ser Pro His
        195                 200                 205
Gln Pro Leu Ala Pro Ser Met Ala Pro Val Ala Gly Leu Thr Trp Glu
    210                 215                 220
Asp Ser Glu Gly Thr Glu Gly Ser Ser Leu Leu Pro Gly Glu Gln Pro
225                 230                 235                 240
Leu His Thr Val Asp Pro Gly Ser Ala Lys Gln Arg Pro Pro Arg Ser
                245                 250                 255
Thr Cys Gln Ser Phe Glu Pro Pro Glu Thr Pro Val Val Lys Asp Ser
            260                 265                 270
Thr Ile Gly Gly Ser Pro Gln Pro Arg Pro Ser Val Gly Ala Phe Asn
        275                 280                 285
Pro Gly Met Glu Asp Ile Leu Asp Ser Ala Met Gly Thr Asn Trp Val
    290                 295                 300
Pro Glu Glu Ala Ser Gly Glu Ala Ser Glu Ile Pro Val Pro Gln Gly
305                 310                 315                 320
Thr Glu Leu Ser Pro Ser Arg Pro Gly Gly Gly Ser Met Gln Thr Glu
                325                 330                 335
Pro Ala Arg Pro Ser Asn Phe Leu Ser Ala Ser Ser Pro Leu Pro Ala
            340                 345                 350
Ser Ala Lys Gly Gln Gln Pro Ala Asp Val Thr Ala Thr Ala Leu Pro
        355                 360                 365
Arg Val Gly Pro Val Met Pro Thr Gly Gln Asp Trp Asn His Thr Pro
    370                 375                 380
Gln Lys Thr Asp His Pro Ser Ala Leu Leu Arg Asp Pro Pro Glu Pro
385                 390                 395                 400
Gly Ser Pro Arg Ile Ser Ser Leu Arg Pro Gln Ala Leu Ser Asn Pro
                405                 410                 415
Ser Thr Leu Ser Ala Gln Pro Gln Leu Ser Arg Ser His Ser Ser Gly
            420                 425                 430
Ser Val Leu Pro Leu Gly Glu Leu Glu Gly Arg Arg Ser Thr Arg Asp
        435                 440                 445
Arg Thr Ser Pro Ala Glu Pro Glu Ala Ala Pro Ala Ser Glu Gly Ala
    450                 455                 460
Ala Arg Pro Leu Pro Arg Phe Asn Ser Val Pro Leu Thr Asp Thr Gly
465                 470                 475                 480
His Glu Arg Gln Ser Glu Gly Ser Ser Ser Pro Gln Leu Gln Glu Ser
                485                 490                 495
Val Phe His Leu Leu Val Pro Ser Val Ile Leu Val Leu Leu Ala Val
            500                 505                 510
Gly Gly Leu Leu Phe Tyr Arg Trp Arg Arg Arg Ser His Gln Glu Pro
        515                 520                 525
Gln Arg Ala Asp Ser Pro Leu Glu Gln Pro Glu Gly Ser Pro Leu Thr
    530                 535                 540
Gln Asp Asp Arg Gln Val Glu Leu Pro Val
545                 550
<210>21
<211>107
<212>PRT
<213>人
<400>21
Met Ala Arg Ala Ala Leu Ser Ala Ala Pro Ser Asn Pro Arg Leu Leu
1               5                   10                  15
Arg Val Ala Leu Leu Leu Leu Leu Leu Val Ala Ala Gly Arg Arg Ala
            20                  25                  30
Ala Gly Ala Ser Val Ala Thr Glu Leu Arg Cys Gln Cys Leu Gln Thr
        35                  40                  45
Leu Gln Gly Ile His Pro Lys Asn Ile Gln Ser Val Asn Val Lys Ser
    50                  55                  60
Pro Gly Pro His Cys Ala Gln Thr Glu Val Ile Ala Thr Leu Lys Asn
65                  70                  75                  80
Gly Arg Lys Ala Cys Leu Asn Pro Ala Ser Pro Ile Val Lys Lys Ile
                85                  90                  95
Ile Glu Lys Met Leu Asn Ser Asp Lys Ser Asn
            100                 105
<210>22
<211>106
<212>PRT
<213>人
<400>22
Met Ala His Ala Thr Leu Ser Ala Ala Pro Ser Asn Pro Arg Leu Leu
1               5                   10                  15
Arg Val Ala Leu Leu Leu Leu Leu Leu Val Gly Ser Arg Arg Ala Ala
            20                  25                  30
Gly Ala Ser Val Val Thr Glu Leu Arg Cys Gln Cys Leu Gln Thr Leu
        35                  40                  45
Gln Gly Ile His Leu Lys Asn Ile Gln Ser Val Asn Val Arg Ser Pro
    50                  55                  60
Gly Pro His Cys Ala Gln Thr Glu Val Ile Ala Thr Leu Lys Asn Gly
65                  70                  75                  80
Lys Lys Ala Cys Leu Asn Pro Ala Ser Pro Met Val Gln Lys Ile Ile
                85                  90                  95
Glu Lys Ile Leu Asn Lys Gly Ser Thr Asn
            100                 105
<210>23
<211>300
<212>PRT
<213>人
<400>23
Met Arg Ile Ala Val Ile Cys Phe Cys Leu Leu Gly Ile Thr Cys Ala
1               5                   10                  15
Ile Pro Val Lys Gln Ala Asp Ser Gly Ser Ser Glu Glu Lys Gln Leu
            20                  25                  30
Tyr Asn Lys Tyr Pro Asp Ala Val Ala Thr Trp Leu Asn Pro Asp Pro
        35                  40                  45
Ser Gln Lys Gln Asn Leu Leu Ala Pro Gln Thr Leu Pro Ser Lys Ser
    50                  55                  60
Asn Glu Ser His Asp His Met Asp Asp Met Asp Asp Glu Asp Asp Asp
65                  70                  75                  80
Asp His Val Asp Ser Gln Asp Ser Ile Asp Ser Asn Asp Ser Asp Asp
                85                  90                  95
Val Asp Asp Thr Asp Asp Ser His Gln Ser Asp Glu Ser His His Ser
            100                 105                 110
Asp Glu Ser Asp Glu Leu Val Thr Asp Phe Pro Thr Asp Leu Pro Ala
        115                 120                 125
Thr Glu Val Phe Thr Pro Val Val Pro Thr Val Asp Thr Tyr Asp Gly
    130                 135                 140
Arg Gly Asp Ser Val Val Tyr Gly Leu Arg Ser Lys Ser Lys Lys Phe
145                 150                 155                 160
Arg Arg Pro Asp Ile Gln Tyr Pro Asp Ala Thr Asp Glu Asp Ile Thr
                165                 170                 175
Ser His Met Glu Ser Glu Glu Leu Asn Gly Ala Tyr Lys Ala Ile Pro
            180                 185                 190
Val Ala Gln Asp Leu Asn Ala Pro Ser Asp Trp Asp Ser Arg Gly Lys
        195                 200                 205
Asp Ser Tyr Glu Thr Ser Gln Leu Asp Asp Gln Ser Ala Glu Thr His
    210                 215                 220
Ser His Lys Gln Ser Arg Leu Tyr Lys Arg Lys Ala Asn Asp Glu Ser
225                 230                 235                 240
Asn Glu His Ser Asp Val Ile Asp Ser Gln Glu Leu Ser Lys Val Ser
                245                 250                 255
Arg Glu Phe His Ser His Glu Phe His Ser His Glu Asp Met Leu Val
            260                 265                 270
Val Asp Pro Lys Ser Lys Glu Glu Asp Lys His Leu Lys Phe Arg Ile
        275                 280                 285
Ser His Glu Leu Asp Ser Ala Ser Ser Glu Val Asn
    290                 295                 300
<210>24
<211>295
<212>PRT
<213>人
<400>24
Met Glu His Gln Leu Leu Cys Cys Glu Val Glu Thr Ile Arg Arg Ala
1               5                   10                  15
Tyr Pro Asp Ala Asn Leu Leu Asn Asp Arg Val Leu Arg Ala Met Leu
            20                  25                  30
Lys Ala Glu Glu Thr Cys Ala Pro Ser Val Ser Tyr Phe Lys Cys Val
        35                  40                  45
Gln Lys Glu Val Leu Pro Ser Met Arg Lys Ile Val Ala Thr Trp Met
    50                  55                  60
Leu Glu Val Cys Glu Glu Gln Lys Cys Glu Glu Glu Val Phe Pro Leu
65                  70                  75                  80
Ala Met Asn Tyr Leu Asp Arg Phe Leu Ser Leu Glu Pro Val Lys Lys
                85                  90                  95
Ser Arg Leu Gln Leu Leu Gly Ala Thr Cys Met Phe Val Ala Ser Lys
            100                 105                 110
Met Lys Glu Thr Ile Pro Leu Thr Ala Glu Lys Leu Cys Ile Tyr Thr
        115                 120                 125
Asp Gly Ser Ile Arg Pro Glu Glu Leu Leu Gln Met Glu Leu Leu Leu
    130                 135                 140
Val Asn Lys Leu Lys Trp Asn Leu Ala Ala Met Thr Pro His Asp Phe
145                 150                 155                 160
Ile Glu His Phe Leu Ser Lys Met Pro Glu Ala Glu Glu Asn Lys Gln
                165                 170                 175
Ile Ile Arg Lys His Ala Gln Thr Phe Val Ala Ser Cys Ala Thr Asp
            180                 185                 190
Val Lys Phe Ile Ser Asn Pro Pro Ser Met Val Ala Ala Gly Ser Val
        195                 200                 205
Val Ala Ala Val Gln Gly Leu Asn Leu Arg Ser Pro Asn Asn Phe Leu
    210                 215                 220
Ser Tyr Tyr Arg Leu Thr Arg Phe Leu Ser Arg Val Ile Lys Cys Asp
225                 230                 235                 240
Pro Asp Cys Leu Arg Ala Cys Gln Glu Gln Ile Glu Ala Leu Leu Glu
                245                 250                 255
Ser Ser Leu Arg Gln Ala Gln Gln Asn Met Asp Pro Lys Ala Ala Glu
            260                 265                 270
Glu Glu Glu Glu Glu Glu Glu Glu Val Asp Leu Ala Cys Thr Pro Thr
        275                 280                 285
Asp Val Arg Asp Val Asp Ile
    290                 295
<210>25
<211>439
<212>PRT
<213>人
<400>25
Met Pro Leu Asn Val Ser Phe Thr Asn Arg Asn Tyr Asp Leu Asp Tyr
1               5                   10                  15
Asp Ser Val Gln Pro Tyr Phe Tyr Cys Asp Glu Glu Glu Asn Phe Tyr
            20                  25                  30
Gln Gln Gln Gln Gln Ser Glu Leu Gln Pro Pro Ala Pro Ser Glu Asp
        35                  40                  45
Ile Trp Lys Lys Phe Glu Leu Leu Pro Thr Pro Pro Leu Ser Pro Ser
    50                  55                  60
Arg Arg Ser Gly Leu Cys Ser Pro Ser Tyr Val Ala Val Thr Pro Phe
65                  70                  75                  80
Ser Leu Arg Gly Asp Asn Asp Gly Gly Gly Gly Ser Phe Ser Thr Ala
                85                  90                  95
Asp Gln Leu Glu Met Val Thr Glu Leu Leu Gly Gly Asp Met Val Asn
            100                 105                 110
Gln Ser Phe Ile Cys Asp Pro Asp Asp Glu Thr Phe Ile Lys Asn Ile
        115                 120                 125
Ile Ile Gln Asp Cys Met Trp Ser Gly Phe Ser Ala Ala Ala Lys Leu
    130                 135                 140
Val Ser Glu Lys Leu Ala Ser Tyr Gln Ala Ala Arg Lys Asp Ser Gly
145                 150                 155                 160
Ser Pro Asn Pro Ala Arg Gly His Ser Val Cys Ser Thr Ser Ser Leu
                165                 170                 175
Tyr Leu Gln Asp Leu Ser Ala Ala Ala Ser Glu Cys Ile Asp Pro Ser
            180                 185                 190
Val Val Phe Pro Tyr Pro Leu Asn Asp Ser Ser Ser Pro Lys Ser Cys
        195                 200                 205
Ala Ser Gln Asp Ser Ser Ala Phe Ser Pro Ser Ser Asp Ser Leu Leu
    210                 215                 220
Ser Ser Thr Glu Ser Ser Pro Gln Gly Ser Pro Glu Pro Leu Val Leu
225                 230                 235                 240
His Glu Glu Thr Pro Pro Thr Thr Ser Ser Asp Ser Glu Glu Glu Gln
                245                 250                 255
Glu Asp Glu Glu Glu Ile Asp Val Val Ser Val Glu Lys Arg Gln Ala
            260                 265                 270
Pro Gly Lys Arg Ser Glu Ser Gly Ser Pro Ser Ala Gly Gly His Ser
        275                 280                 285
Lys Pro Pro His Ser Pro Leu Val Leu Lys Arg Cys His Val Ser Thr
    290                 295                 300
His Gln His Asn Tyr Ala Ala Pro Pro Ser Thr Arg Lys Asp Tyr Pro
305                 310                 315                 320
Ala Ala Lys Arg Val Lys Leu Asp Ser Val Arg Val Leu Arg Gln Ile
                325                 330                 335
Ser Asn Asn Arg Lys Cys Thr Ser Pro Arg Ser Ser Asp Thr Glu Glu
            340                 345                 350
Asn Val Lys Arg Arg Thr His Asn Val Leu Glu Arg Gln Arg Arg Asn
        355                 360                 365
Glu Leu Lys Arg Ser Phe Phe Ala Leu Arg Asp Gln Ile Pro Glu Leu
    370                 375                 380
Glu Asn Asn Glu Lys Ala Pro Lys Val Val Ile Leu Lys Lys Ala Thr
385                 390                 395                 400
Ala Tyr Ile Leu Ser Val Gln Ala Glu Glu Gln Lys Leu Ile Ser Glu
                405                 410                 415
Glu Asp Leu Leu Arg Lys Arg Arg Glu Gln Leu Lys His Lys Leu Glu
            420                 425                 430
Gln Leu Arg Asn Ser Cys Ala
        435
<210>26
<211>164
<212>PRT
<213>人
<400>26
Met Ser Glu Pro Ala Gly Asp Val Arg Gln Asn Pro Cys Gly Ser Lys
1               5                   10                  15
Ala Cys Arg Arg Leu Phe Gly Pro Val Asp Ser Glu Gln Leu Ser Arg
            20                  25                  30
Asp Cys Asp Ala Leu Met Ala Gly Cys Ile Gln Glu Ala Arg Glu Arg
        35                  40                  45
Trp Asn Phe Asp Phe Val Thr Glu Thr Pro Leu Glu Gly Asp Phe Ala
    50                  55                  60
Trp Glu Arg Val Arg Gly Leu Gly Leu Pro Lys Leu Tyr Leu Pro Thr
65                  70                  75                  80
Gly Pro Arg Arg Gly Arg Asp Glu Leu Gly Gly Gly Arg Arg Pro Gly
                85                  90                  95
Thr Ser Pro Ala Leu Leu Gln Gly Thr Ala Glu Glu Asp His Val Asp
            100                 105                 110
Leu Ser Leu Ser Cys Thr Leu Val Pro Arg Ser Gly Glu Gln Ala Glu
        115                 120                 125
Gly Ser Pro Gly Gly Pro Gly Asp Ser Gln Gly Arg Lys Arg Arg Gln
    130                 135                 140
Thr Ser Met Thr Asp Phe Tyr His Ser Lys Arg Arg Leu Ile Phe Ser
145                 150                 155                 160
Lys Arg Lys Pro
<210>27
<211>468
<212>PRT
<213>人
<400>27
Met Val Asp Thr Glu Ser Pro Leu Cys Pro Leu Ser Pro Leu Glu Ala
1               5                   10                  15
Gly Asp Leu Glu Ser Pro Leu Ser Glu Glu Phe Leu Gln Glu Met Gly
            20                  25                  30
Asn Ile Gln Glu Ile Ser Gln Ser Ile Gly Glu Asp Ser Ser Gly Ser
        35                  40                  45
Phe Gly Phe Thr Glu Tyr Gln Tyr Leu Gly Ser Cys Pro Gly Ser Asp
    50                  55                  60
Gly Ser Val Ile Thr Asp Thr Leu Ser Pro Ala Ser Ser Pro Ser Ser
65                  70                  75                  80
Val Thr Tyr Pro Val Val Pro Gly Ser Val Asp Glu Ser Pro Ser Gly
                85                  90                  95
Ala Leu Asn Ile Glu Cys Arg Ile Cys Gly Asp Lys Ala Ser Gly Tyr
            100                 105                 110
His Tyr Gly Val His Ala Cys Glu Gly Cys Lys Gly Phe Phe Arg Arg
        115                 120                 125
Thr Ile Arg Leu Lys Leu Val Tyr Asp Lys Cys Asp Arg Ser Cys Lys
    130                 135                 140
Ile Gln Lys Lys Asn Arg Asn Lys Cys Gln Tyr Cys Arg Phe His Lys
145                 150                 155                 160
Cys Leu Ser Val Gly Met Ser His Asn Ala Ile Arg Phe Gly Arg Met
                165                 170                 175
Pro Arg Ser Glu Lys Ala Lys Leu Lys Ala Glu Ile Leu Thr Cys Glu
            180                 185                 190
His Asp Ile Glu Asp Ser Glu Thr Ala Asp Leu Lys Ser Leu Ala Lys
        195                 200                 205
Arg Ile Tyr Glu Ala Tyr Leu Lys Asn Phe Asn Met Asn Lys Val Lys
    210                 215                 220
Ala Arg Val Ile Leu Ser Gly Lys Ala Ser Asn Asn Pro Pro Phe Val
225                 230                 235                 240
Ile His Asp Met Glu Thr Leu Cys Met Ala Glu Lys Thr Leu Val Ala
                245                 250                 255
Lys Leu Val Ala Asn Gly Ile Gln Asn Lys Glu Ala Glu Val Arg Ile
            260                 265                 270
Phe His Cys Cys Gln Cys Thr Ser Val Glu Thr Val Thr Glu Leu Thr
        275                 280                 285
Glu Phe Ala Lys Ala Ile Pro Gly Phe Ala Asn Leu Asp Leu Asn Asp
    290                 295                 300
Gln Val Thr Leu Leu Lys Tyr Gly Val Tyr Glu Ala Ile Phe Ala Met
305                 310                 315                 320
Leu Ser Ser Val Met Asn Lys Asp Gly Met Leu Val Ala Tyr Gly Asn
                325                 330                 335
Gly Phe Ile Thr Arg Glu Phe Leu Lys Ser Leu Arg Lys Pro Phe Cys
            340                 345                 350
Asp Ile Met Glu Pro Lys Phe Asp Phe Ala Met Lys Phe Asn Ala Leu
        355                 360                 365
Glu Leu Asp Asp Ser Asp Ile Ser Leu Phe Val Ala Ala Ile Ile Cys
    370                 375                 380
Cys Gly Asp Arg Pro Gly Leu Leu Asn Val Gly His Ile Glu Lys Met
385                 390                 395                 400
Gln Glu Gly Ile Val His Val Leu Arg Leu His Leu Gln Ser Asn His
                405                 410                 415
Pro Asp Asp Ile Phe Leu Phe Pro Lys Leu Leu Gln Lys Met Ala Asp
            420                 425                 430
Leu Arg Gln Leu Val Thr Glu His Ala Gln Leu Val Gln Ile Ile Lys
        435                 440                 445
Lys Thr Glu Ser Asp Ala Ala Leu His Pro Leu Leu Gln Glu Ile Tyr
    450                 455                 460
Arg Asp Met Tyr
465
<210>28
<211>505
<212>PRT
<213>人
<400>28
Met Gly Glu Thr Leu Gly Asp Ser Pro Ile Asp Pro Glu Ser Asp Ser
1               5                   10                  15
Phe Thr Asp Thr Leu Ser Ala Asn Ile Ser Gln Glu Met Thr Met Val
            20                  25                  30
Asp Thr Glu Met Pro Phe Trp Pro Thr Asn Phe Gly Ile Ser Ser Val
        35                  40                  45
Asp Leu Ser Val Met Glu Asp His Ser His Ser Phe Asp Ile Lys Pro
    50                  55                  60
Phe Thr Thr Val Asp Phe Ser Ser Ile Ser Thr Pro His Tyr Glu Asp
65                  70                  75                  80
Ile Pro Phe Thr Arg Thr Asp Pro Val Val Ala Asp Tyr Lys Tyr Asp
                85                  90                  95
Leu Lys Leu Gln Glu Tyr Gln Ser Ala Ile Lys Val Glu Pro Ala Ser
            100                 105                 110
Pro Pro Tyr Tyr Ser Glu Lys Thr Gln Leu Tyr Asn Lys Pro His Glu
        115                 120                 125
Glu Pro Ser Asn Ser Leu Met Ala Ile Glu Cys Arg Val Cys Gly Asp
    130                 135                 140
Lys Ala Ser Gly Phe His Tyr Gly Val His Ala Cys Glu Gly Cys Lys
145                 150                 155                 160
Gly Phe Phe Arg Arg Thr Ile Arg Leu Lys Leu Ile Tyr Asp Arg Cys
                165                 170                 175
Asp Leu Asn Cys Arg Ile His Lys Lys Ser Arg Asn Lys Cys Gln Tyr
            180                 185                 190
Cys Arg Phe Gln Lys Cys Leu Ala Val Gly Met Ser His Asn Ala Ile
        195                 200                 205
Arg Phe Gly Arg Met Pro Gln Ala Glu Lys Glu Lys Leu Leu Ala Glu
    210                 215                 220
Ile Ser Ser Asp Ile Asp Gln Leu Asn Pro Glu Ser Ala Asp Leu Arg
225                 230                 235                 240
Ala Leu Ala Lys His Leu Tyr Asp Ser Tyr Ile Lys Ser Phe Pro Leu
                245                 250                 255
Thr Lys Ala Lys Ala Arg Ala Ile Leu Thr Gly Lys Thr Thr Asp Lys
            260                 265                 270
Ser Pro Phe Val Ile Tyr Asp Met Asn Ser Leu Met Met Gly Glu Asp
        275                 280                 285
Lys Ile Lys Phe Lys His Ile Thr Pro Leu Gln Glu Gln Ser Lys Glu
    290                 295                 300
Val Ala Ile Arg Ile Phe Gln Gly Cys Gln Phe Arg Ser Val Glu Ala
305                 310                 315                 320
Val Gln Glu Ile Thr Glu Tyr Ala Lys Ser Ile Pro Gly Phe Val Asn
                325                 330                 335
Leu Asp Leu Asn Asp Gln Val Thr Leu Leu Lys Tyr Gly Val His Glu
            340                 345                 350
Ile Ile Tyr Thr Met Leu Ala Ser Leu Met Asn Lys Asp Gly Val Leu
        355                 360                 365
Ile Ser Glu Gly Gln Gly Phe Met Thr Arg Glu Phe Leu Lys Ser Leu
    370                 375                 380
Arg Lys Pro Phe Gly Asp Phe Met Glu Pro Lys Phe Glu Phe Ala Val
385                 390                 395                 400
Lys Phe Asn Ala Leu Glu Leu Asp Asp Ser Asp Leu Ala Ile Phe Ile
                405                 410                 415
Ala Val Ile Ile Leu Ser Gly Asp Arg Pro Gly Leu Leu Asn Val Lys
            420                 425                 430
Pro Ile Glu Asp Ile Gln Asp Asn Leu Leu Gln Ala Leu Glu Leu Gln
        435                 440                 445
Leu Lys Leu Asn His Pro Glu Ser Ser Gln Leu Phe Ala Lys Leu Leu
    450                 455                 460
Gln Lys Met Thr Asp Leu Arg Gln Ile Val Thr Glu His Val Gln Leu
465                 470                 475                 480
Leu Gln Val Ile Lys Lys Thr Glu Thr Asp Met Ser Leu His Pro Leu
                485                 490                 495
Leu Gln Glu Ile Tyr Lys Asp Leu Tyr
            500                 505
<210>29
<211>441
<212>PRT
<213>人
<400>29
Met Glu Gln Pro Gln Glu Glu Ala Pro Glu Val Arg Glu Glu Glu Glu
1               5                   10                  15
Lys Glu Glu Val Ala Glu Ala Glu Gly Ala Pro Glu Leu Asn Gly Gly
            20                  25                  30
Pro Gln His Ala Leu Pro Ser Ser Ser Tyr Thr Asp Leu Ser Arg Ser
        35                  40                  45
Ser Ser Pro Pro Ser Leu Leu Asp Gln Leu Gln Met Gly Cys Asp Gly
    50                  55                  60
Ala Ser Cys Gly Ser Leu Asn Met Glu Cys Arg Val Cys Gly Asp Lys
65                  70                  75                  80
Ala Ser Gly Phe His Tyr Gly Val His Ala Cys Glu Gly Cys Lys Gly
                85                  90                  95
Phe Phe Arg Arg Thr Ile Arg Met Lys Leu Glu Tyr Glu Lys Cys Glu
            100                 105                 110
Arg Ser Cys Lys Ile Gln Lys Lys Asn Arg Asn Lys Cys Gln Tyr Cys
        115                 120                 125
Arg Phe Gln Lys Cys Leu Ala Leu Gly Met Ser His Asn Ala Ile Arg
    130                 135                 140
Phe Gly Arg Met Pro Glu Ala Glu Lys Arg Lys Leu Val Ala Gly Leu
145                 150                 155                 160
Thr Ala Asn Glu Gly Ser Gln Tyr Asn Pro Gln Val Ala Asp Leu Lys
                165                 170                 175
Ala Phe Ser Lys His Ile Tyr Asn Ala Tyr Leu Lys Asn Phe Asn Met
            180                 185                 190
Thr Lys Lys Lys Ala Arg Ser Ile Leu Thr Gly Lys Ala Ser His Thr
        195                 200                 205
Ala Pro Phe Val Ile His Asp Ile Glu Thr Leu Trp Gln Ala Glu Lys
    210                 215                 220
Gly Leu Val Trp Lys Gln Leu Val Asn Gly Leu Pro Pro Tyr Lys Glu
225                 230                 235                 240
Ile Ser Val His Val Phe Tyr Arg Cys Gln Cys Thr Thr Val Glu Thr
                245                 250                 255
Val Arg Glu Leu Thr Glu Phe Ala Lys Ser Ile Pro Ser Phe Ser Ser
            260                 265                 270
Leu Phe Leu Asn Asp Gln Val Thr Leu Leu Lys Tyr Gly Val His Glu
        275                 280                 285
Ala Ile Phe Ala Met Leu Ala Ser Ile Val Asn Lys Asp Gly Leu Leu
    290                 295                 300
Val Ala Asn Gly Ser Gly Phe Val Thr Arg Glu Phe Leu Arg Ser Leu
305                 310                 315                 320
Arg Lys Pro Phe Ser Asp Ile Ile Glu Pro Lys Phe Glu Phe Ala Val
                325                 330                 335
Lys Phe Asn Ala Leu Glu Leu Asp Asp Ser Asp Leu Ala Leu Phe Ile
            340                 345                 350
Ala Ala Ile Ile Leu Cys Gly Asp Arg Pro Gly Leu Met Asn Val Pro
        355                 360                 365
Arg Val Glu Ala Ile Gln Asp Thr Ile Leu Arg Ala Leu Glu Phe His
    370                 375                 380
Leu Gln Ala Asn His Pro Asp Ala Gln Tyr Leu Phe Pro Lys Leu Leu
385                 390                 395                 400
Gln Lys Met Ala Asp Leu Arg Gln Leu Val Thr Glu His Ala Gln Met
                405                 410                 415
Met Gln Arg Ile Lys Lys Thr Glu Thr Glu Thr Ser Leu His Pro Leu
            420                 425                 430
Leu Gln Glu Ile Tyr Lys Asp Met Tyr
        435                 440
<210>30
<211>742
<212>PRT
<213>人
<400>30
Met Asp Lys Phe Trp Trp His Ala Ala Trp Gly Leu Cys Leu Val Pro
1               5                   10                  15
Leu Ser Leu Ala Gln Ile Asp Leu Asn Ile Thr Cys Arg Phe Ala Gly
            20                  25                  30
Val Phe His Val Glu Lys Asn Gly Arg Tyr Ser Ile Ser Arg Thr Glu
        35                  40                  45
Ala Ala Asp Leu Cys Lys Ala Phe Asn Ser Thr Leu Pro Thr Met Ala
    50                  55                  60
Gln Met Glu Lys Ala Leu Ser Ile Gly Phe Glu Thr Cys Arg Tyr Gly
65                  70                  75                  80
Phe Ile Glu Gly His Val Val Ile Pro Arg Ile His Pro Asn Ser Ile
                85                  90                  95
Cys Ala Ala Asn Asn Thr Gly Val Tyr Ile Leu Thr Ser Asn Thr Ser
            100                 105                 110
Gln Tyr Asp Thr Tyr Cys Phe Asn Ala Ser Ala Pro Pro Glu Glu Asp
        115                 120                 125
Cys Thr Ser Val Thr Asp Leu Pro Asn Ala Phe Asp Gly Pro Ile Thr
    130                 135                 140
Ile Thr Ile Val Asn Arg Asp Gly Thr Arg Tyr Val Gln Lys Gly Glu
145                 150                 155                 160
Tyr Arg Thr Asn Pro Glu Asp Ile Tyr Pro Ser Asn Pro Thr Asp Asp
                165                 170                 175
Asp Val Ser Ser Gly Ser Ser Ser Glu Arg Ser Ser Thr Ser Gly Gly
            180                 185                 190
Tyr Ile Phe Tyr Thr Phe Ser Thr Val His Pro Ile Pro Asp Glu Asp
        195                 200                 205
Ser Pro Trp Ile Thr Asp Ser Thr Asp Arg Ile Pro Ala Thr Thr Leu
    210                 215                 220
Met Ser Thr Ser Ala Thr Ala Thr Glu Thr Ala Thr Lys Arg Gln Glu
225                 230                 235                 240
Thr Trp Asp Trp Phe Ser Trp Leu Phe Leu Pro Ser Glu Ser Lys Asn
                245                 250                 255
His Leu His Thr Thr Thr Gln Met Ala Gly Thr Ser Ser Asn Thr Ile
            260                 265                 270
Ser Ala Gly Trp Glu Pro Asn Glu Glu Asn Glu Asp Glu Arg Asp Arg
        275                 280                 285
His Leu Ser Phe Ser Gly Ser Gly Ile Asp Asp Asp Glu Asp Phe Ile
    290                 295                 300
Ser Ser Thr Ile Ser Thr Thr Pro Arg Ala Phe Asp His Thr Lys Gln
305                 310                 315                 320
Asn Gln Asp Trp Thr Gln Trp Asn Pro Ser His Ser Asn Pro Glu Val
                325                 330                 335
Leu Leu Gln Thr Thr Thr Arg Met Thr Asp Val Asp Arg Asn Gly Thr
            340                 345                 350
Thr Ala Tyr Glu Gly Asn Trp Asn Pro Glu Ala His Pro Pro Leu Ile
        355                 360                 365
His His Glu His His Glu Glu Glu Glu Thr Pro His Ser Thr Ser Thr
    370                 375                 380
Ile Gln Ala Thr Pro Ser Ser Thr Thr Glu Glu Thr Ala Thr Gln Lys
385                 390                 395                 400
Glu Gln Trp Phe Gly Asn Arg Trp His Glu Gly Tyr Arg Gln Thr Pro
                405                 410                 415
Lys Glu Asp Ser His Ser Thr Thr Gly Thr Ala Ala Ala Ser Ala His
            420                 425                 430
Thr Ser His Pro Met Gln Gly Arg Thr Thr Pro Ser Pro Glu Asp Ser
        435                 440                 445
Ser Trp Thr Asp Phe Phe Asn Pro Ile Ser His Pro Met Gly Arg Gly
    450                 455                 460
His Gln Ala Gly Arg Arg Met Asp Met Asp Ser Ser His Ser Ile Thr
465                 470                 475                 480
Leu Gln Pro Thr Ala Asn Pro Asn Thr Gly Leu Val Glu Asp Leu Asp
                485                 490                 495
Arg Thr Gly Pro Leu Ser Met Thr Thr Gln Gln Ser Asn Ser Gln Ser
            500                 505                 510
Phe Ser Thr Ser His Glu Gly Leu Glu Glu Asp Lys Asp His Pro Thr
        515                 520                 525
Thr Ser Thr Leu Thr Ser Ser Asn Arg Asn Asp Val Thr Gly Gly Arg
    530                 535                 540
Arg Asp Pro Asn His Ser Glu Gly Ser Thr Thr Leu Leu Glu Gly Tyr
545                 550                 555                 560
Thr Ser His Tyr Pro His Thr Lys Glu Ser Arg Thr Phe Ile Pro Val
                565                 570                 575
Thr Ser Ala Lys Thr Gly Ser Phe Gly Val Thr Ala Val Thr Val Gly
            580                 585                 590
Asp Ser Asn Ser Asn Val Asn Arg Ser Leu Ser Gly Asp Gln Asp Thr
        595                 600                 605
Phe His Pro Ser Gly Gly Ser His Thr Thr His Gly Ser Glu Ser Asp
    610                 615                 620
Gly His Ser His Gly Ser Gln Glu Gly Gly Ala Asn Thr Thr Ser Gly
625                 630                 635                 640
Pro Ile Arg Thr Pro Gln Ile Pro Glu Trp Leu Ile Ile Leu Ala Ser
                645                 650                 655
Leu Leu Ala Leu Ala Leu Ile Leu Ala Val Cys Ile Ala Val Asn Ser
            660                 665                 670
Arg Arg Arg Cys Gly Gln Lys Lys Lys Leu Val Ile Asn Ser Gly Asn
        675                 680                 685
Gly Ala Val Glu Asp Arg Lys Pro Ser Gly Leu Asn Gly Glu Ala Ser
    690                 695                 700
Lys Ser Gln Glu Met Val His Leu Val Asn Lys Glu Ser Ser Glu Thr
705                 710                 715                 720
Pro Asp Gln Phe Met Thr Ala Asp Glu Thr Arg Asn Leu Gln Asn Val
                725                 730                 735
Asp Met Lys Ile Gly Val
            740
<210>31
<211>489
<212>PRT
<213>人
<400>31
Met Leu Met Arg Leu Val Leu Thr Val Arg Ser Asn Leu Ile Pro Ser
1               5                   10                  15
Pro Pro Thr Tyr Asn Ser Ala His Asp Tyr Ile Ser Trp Glu Ser Phe
            20                  25                  30
Ser Asn Val Ser Tyr Tyr Thr Arg Ile Leu Pro Ser Val Pro Lys Asp
        35                  40                  45
Cys Pro Thr Pro Met Gly Thr Lys Gly Lys Lys Gln Leu Pro Asp Ala
    50                  55                  60
Gln Leu Leu Ala Arg Arg Phe Leu Leu Arg Arg Lys Phe Ile Pro Asp
65                  70                  75                  80
Pro Gln Gly Thr Asn Leu Met Phe Ala Phe Phe Ala Gln His Phe Thr
                85                  90                  95
His Gln Phe Phe Lys Thr Ser Gly Lys Met Gly Pro Gly Phe Thr Lys
            100                 105                 110
Ala Leu Gly His Gly Val Asp Leu Gly His Ile Tyr Gly Asp Asn Leu
        115                 120                 125
Glu Arg Gln Tyr Gln Leu Arg Leu Phe Lys Asp Gly Lys Leu Lys Tyr
    130                 135                 140
Gln Val Leu Asp Gly Glu Met Tyr Pro Pro Ser Val Glu Glu Ala Pro
145                 150                 155                 160
Val Leu Met His Tyr Pro Arg Gly Ile Pro Pro Gln Ser Gln Met Ala
                165                 170                 175
Val Gly Gln Glu Val Phe Gly Leu Leu Pro Gly Leu Met Leu Tyr Ala
            180                 185                 190
Thr Leu Trp Leu Arg Glu His Asn Arg Val Cys Asp Leu Leu Lys Ala
        195                 200                 205
Glu His Pro Thr Trp Gly Asp Glu Gln Leu Phe Gln Thr Thr Arg Leu
    210                 215                 220
Ile Leu Ile Gly Glu Thr Ile Lys Ile Val Ile Glu Glu Tyr Val Gln
225                 230                 235                 240
Gln Leu Ser Gly Tyr Phe Leu Gln Leu Lys Phe Asp Pro Glu Leu Leu
                245                 250                 255
Phe Gly Val Gln Phe Gln Tyr Arg Asn Arg Ile Ala Met Glu Phe Asn
            260                 265                 270
His Leu Tyr His Trp His Pro Leu Met Pro Asp Ser Phe Lys Val Gly
        275                 280                 285
Ser Gln Glu Tyr Ser Tyr Glu Gln Phe Leu Phe Asn Thr Ser Met Leu
    290                 295                 300
Val Asp Tyr Gly Val Glu Ala Leu Val Asp Ala Phe Ser Arg Gln Ile
305                 310                 315                 320
Ala Gly Arg Ile Gly Gly Gly Arg Asn Met Asp His His Ile Leu His
                325                 330                 335
Val Ala Val Asp Val Ile Arg Glu Ser Arg Glu Met Arg Leu Gln Pro
            340                 345                 350
Phe Asn Glu Tyr Arg Lys Arg Phe Gly Met Lys Pro Tyr Thr Ser Phe
        355                 360                 365
Gln Glu Leu Val Gly Glu Lys Glu Met Ala Ala Glu Leu Glu Glu Leu
    370                 375                 380
Tyr Gly Asp Ile Asp Ala Leu Glu Phe Tyr Pro Gly Leu Leu Leu Glu
385                 390                 395                 400
Lys Cys His Pro Asn Ser Ile Phe Gly Glu Ser Met Ile Glu Ile Gly
                405                 410                 415
Ala Pro Phe Ser Leu Lys Gly Leu Leu Gly Asn Pro Ile Cys Ser Pro
            420                 425                 430
Glu Tyr Trp Lys Pro Ser Thr Phe Gly Gly Glu Val Gly Phe Asn Ile
        435                 440                 445
Val Lys Thr Ala Thr Leu Lys Lys Leu Val Cys Leu Asn Thr Lys Thr
    450                 455                 460
Cys Pro Tyr Val Ser Phe Arg Val Pro Asp Ala Ser Gln Asp Asp Gly
465                 470                 475                 480
Pro Ala Val Glu Arg Pro Ser Thr Glu
                485
<210>32
<211>122
<212>PRT
<213>人
<400>32
Met Lys Leu Leu Thr Gly Leu Val Phe Cys Ser Leu Val Leu Gly Val
1               5                   10                  15
Ser Ser Arg Ser Phe Phe Ser Phe Leu Gly Glu Ala Phe Asp Gly Ala
            20                  25                  30
Arg Asp Met Trp Arg Ala Tyr Ser Asp Met Arg Glu Ala Asn Tyr Ile
        35                  40                  45
Gly Ser Asp Lys Tyr Phe His Ala Arg Gly Asn Tyr Asp Ala Ala Lys
    50                  55                  60
Arg Gly Pro Gly Gly Val Trp Ala Ala Glu Ala Ile Ser Asp Ala Arg
65                  70                  75                  80
Glu Asn Ile Gln Arg Phe Phe Gly His Gly Ala Glu Asp Ser Leu Ala
                85                  90                  95
Asp Gln Ala Ala Asn Glu Trp Gly Arg Ser Gly Lys Asp Pro Asn His
            100                 105                 110
Phe Arg Pro Ala Gly Leu Pro Glu Lys Tyr
        115                 120
<210>33
<211>26
<212>DNA
<213>人
<400>33
agatattgca cgggagaata tacaaa                                   26
<210>34
<211>27
<212>DNA
<213>人
<400>34
tcaattcctg aaattaaagt tcggata                                  27
<210>35
<211>23
<212>DNA
<213>人
<400>35
tctgcagagt tggaagcact cta                                      23
<210>36
<211>21
<212>DNA
<213>人
<400>36
gccgaggctt ttctaccaga a                                        21
<210>37
<211>20
<212>DNA
<213>人
<400>37
catggcttga tcagcaagga                                          20
<210>38
<211>21
<212>DNA
<213>人
<400>38
tggaagtgtg ccctgaagaa g                                        21
<210>39
<211>21
<212>DNA
<213>人
<400>39
aagcagcacc agcaagtgaa g                                        21
<210>40
<211>21
<212>DNA
<213>人
<400>40
tcatggcctg tgtcagtcaa a                                        21
<210>41
<211>22
<212>DNA
<213>人
<400>41
acatgccagc cactgtgata ga                                       22
<210>42
<211>21
<212>DNA
<213>人
<400>42
ccctgccttc acaatgatct c                                        21
<210>43
<211>23
<212>DNA
<213>人
<400>43
ggaattcacc tcaagaacat cca                                      23
<210>44
<211>23
<212>DNA
<213>人
<400>44
agtgtggcta tgacttcggt ttg                                      23
<210>45
<211>22
<212>DNA
<213>人
<400>45
cagccacaag cagtccagat ta                                       22
<210>46
<211>24
<212>DNA
<213>人
<400>46
cctgactatc aatcacatcg gaat                                     24
<210>47
<211>21
<212>DNA
<213>人
<400>47
ccaggtgctc cacatgacag t                                        21
<210>48
<211>24
<212>DNA
<213>人
<400>48
aaacaaccaa caacaaggag aatg                                     24
<210>49
<211>21
<212>DNA
<213>人
<400>49
cgtctccaca catcagcaca a                                        21
<210>50
<211>22
<212>DNA
<213>人
<400>50
tcttggcagc aggatagtcc tt                                       22
<210>51
<211>22
<212>DNA
<213>人
<400>51
gcagaccagc atgacagatt tc                                       22
<210>52
<211>20
<212>DNA
<213>人
<400>52
gcggattagg gcttcctctt                                          20
<210>53
<211>23
<212>DNA
<213>人
<400>53
tgaagttcaa tgcactggaa ctg                                      23
<210>54
<211>20
<212>DNA
<213>人
<400>54
caggacgatc tccacagcaa                                          20
<210>55
<211>23
<212>DNA
<213>人
<400>55
tggagtccac gagatcattt aca                                      23
<210>56
<211>19
<212>DNA
<213>人
<400>56
agccttggcc ctcggatat                                           19
<210>57
<211>21
<212>DNA
<213>人
<400>57
 cactgagttc gccaagagca t                                       21
<210>58
<211>23
<212>DNA
<213>人
<400>58
cacgccatac ttgagaaggg taa                                      23
<210>59
<211>23
<212>DNA
<213>人
<400>59
gctagtgatc aacagtggca atg                                      23
<210>60
<211>18
<212>DNA
<213>人
<400>60
gctggcctct ccgttgag                                            18
<210>61
<211>22
<212>DNA
<213>人
<400>61
tgttcggtgt ccagttccaa ta                                       22
<210>62
<211>22
<212>DNA
<213>人
<400>62
tgccagtggt agagatggtt ga                                       22
<210>63
<211>22
<212>DNA
<213>人
<400>63
gggacatgtg gagagcctac tc                                       22
<210>64
<211>21
<212>DNA
<213>人
<400>64
catcatagtt cccccgagca t                                        21

Claims (17)

1.一种制备用于早期检测结肠直肠癌、肺癌、前列腺癌、乳腺癌、阿尔茨海默病和ALS的试剂组合物的方法,所述方法包括:
合成来自SEQ.ID NOs 33-64的每种多聚核苷酸对的引物对;
使用稀释剂,将每种所述引物的多种独立的储液调整到至少一种需要的浓度;
将每种所述引物的每份所述储液等分到多个容器中;和
将所述多个容器在长期保存条件下保存。
2.权利要求1的方法,其中所述方法还包括将每种所述引物对的等分储液冻干。
3.一种用于结肠直肠癌、肺癌、前列腺癌、乳腺癌、阿尔茨海默病和ALS早期检测的方法,所述方法包括:
通过非侵入性的或最低程度侵入性的方法从大体上看起来正常的组织获得组织样品;
从所述样品分离RNA;
使用选自由SEQ.ID NOs 33-64组成的组的多个引物对,从RNA样品扩增cDNA拷贝,以检测选自SEQ.ID NOs.1-16的多聚核苷酸组;
量化扩增的cDNA拷贝;和
使用量化的扩增的cDNA拷贝来评估对于结肠直肠癌、肺癌、前列腺癌、乳腺癌、阿尔茨海默病和ALS的至少一种疾病的疾病进展和治疗功效中的至少一种。
4.权利要求3的方法,其中所述获得步骤还包括取样直肠黏膜细胞。
5.权利要求3的方法,其中所述获得步骤还包括采血、粪便取样和进行直肠组织活检的一种。
6.权利要求3的方法,其中所述使用步骤还包括:
通过多变量分析进行分析组织样品cDNA的量化水平;
将组织样品cDNA量化水平的多变量分析与多种对照数据进行比较,其中所述比较确定与对照数据的差异显著性,从而评估结肠直肠癌的存在。
7.权利要求6的方法,其中所述分析步骤还包括使用ANOVA检测和Mahalanobis距离检测的一种。
8.一种用于结肠直肠癌早期检测和用于评估直肠结肠癌治疗效果的方法,所述方法包括步骤:
通过非侵入性的或最低程度侵入性的方法获得组织样品,所述组织样品含有大体看起来无癌的细胞;
产生具有针对SEQ.ID NOs 17-32确定的每种多肽的不同特异性的多种抗体;
用所述多种抗体检测SEQ.ID NOs 17-32确定的多肽组中的多肽表达,其中所述检测步骤允许量化所述抗体与所述多肽的特异性结合;
基于所量化的特异性抗体结合,量化多肽组中每种不同多肽的水平;和
分析多肽组中每种不同多肽的量化水平,其中所述量化水平用来评估结肠直肠癌的存在、进展和治疗中的至少一种。
9.权利要求8的方法,其中所述获得步骤还包括取样血液、取样粪便、擦拭结肠细胞和进行直肠组织活检的一种。
10.一种用于分析监测结肠直肠癌的早期检测和治疗的数据的方法,所述方法包括下列步骤:
从患者样品获得选自SEQ.ID Nos.1-16的多聚核苷酸的多种cDNA的量化水平,其中所述样品通过非侵入性的方法或最低程度侵入性的方法采取;
应用多变量统计学分析,将患者样品的所述数据与多种存储的对照数据比较;和
基于所述比较,做出关于结肠直肠癌的诊断、结肠直肠癌的进展和对于患者的治疗效果的一种的决断。
11.一种具有存储于其上的指示的机器可读介质,当通过一种或多种处理器执行时,其使得系统:
获得SEQ.ID NOs.1-16列出的多聚核苷酸的量化的cDNA水平的数据,其中所述量化的cDNA水平来自于患者组织样品和对照组织样品;
使用至少一种多变量统计学分析,将患者组织样品的量化的cDNA水平与对照组织样品的量化的cDNA水平相比较;和
提供所述多变量统计学分析用于由受过评估结肠直肠癌训练的个体进行评估。
12.一种包含在传送介质中的计算机信号,其包括:
包括用于获得选自SEQ.ID NOs.1-16的多聚核苷酸的量化的cDNA水平的指示的编码部分,其中所述量化的cDNA水平来自于患者组织样品;
包括用于使用多变量统计学分析将来自患者组织样品的量化的cDNA水平与多种对照数据相比较的指示的编码部分;和
包括用于基于所述比较对患者组织样品做出结肠直肠癌诊断的指示的编码部分。
13.一种包含在传送介质中的计算机信号,其包括:
包括用于获得选自SEQ.ID NOs.17-33的多肽的量化水平的编码部分,其中所述多肽的量化水平来自于含有结肠黏膜细胞的患者样品;
包括用于使用多变量统计学分析将来自患者样品的量化的多肽水平与多种对照数据相比较的指示的编码部分;和
包括基于所述比较对于结肠直肠癌诊断、结肠直肠癌进展和结肠直肠癌治疗效果中的至少一种的至少一种指示的编码部分。
14.一种用于结肠直肠癌早期检测的试剂盒,所述试剂盒包括:
接收通过非侵入性的方法获得的含有直肠黏膜细胞的样品的收集容器,其中所述收集容器被设置以稳定并且保存所述样品;和
用于分析多聚核苷酸表达水平的至少一种试剂,其中所述多聚核苷酸选自SEQ.ID Nos.1-16。
15.一种用于检测结肠直肠癌的试剂盒,所述试剂盒包括:
擦拭取样和样品转移系统,其用于最低程度侵入性地取样直肠黏膜细胞,所述系统包括:
被设置以从直肠采集结肠黏膜细胞的药签;和
当采样后用于接收所述药签的收集容器,其中所述收集容器被设置以稳定、提取和保存所述样品;和
用于分析多聚核苷酸表达水平的至少一种试剂,其中所述多聚核苷酸选自SEQ.ID Nos.1-16。
16.一种用于药物筛选的方法,所述方法包括下述步骤:
为结肠直肠癌、肺癌、前列腺癌、乳腺癌、阿尔茨海默病和ALS的至少一种选择模式生物系统;
应用适当的模式生物系统,选择至少一种有希望的药物进行筛选;
从SEQ.ID 1-32确定的生物标记组选择至少2种生物标记;
将所述至少一种有希望的药物定量给予所述模式生物系统;和
作为所述定量给药步骤的函数,监测模式生物系统种至少2种生物标记的应答。
17.权利要求16的方法,其还包括:基于所述监测步骤,确定所述有希望的药物的效果。
CNA2005800330138A 2004-09-30 2005-09-30 用于结肠直肠癌早期检测的药物筛选和分子诊断检测:试剂、方法及其试剂盒 Pending CN101065393A (zh)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US61474604P 2004-09-30 2004-09-30
US60/614,746 2004-09-30
US60/651,344 2005-02-08
US11/242,111 2005-09-29

Publications (1)

Publication Number Publication Date
CN101065393A true CN101065393A (zh) 2007-10-31

Family

ID=38965676

Family Applications (1)

Application Number Title Priority Date Filing Date
CNA2005800330138A Pending CN101065393A (zh) 2004-09-30 2005-09-30 用于结肠直肠癌早期检测的药物筛选和分子诊断检测:试剂、方法及其试剂盒

Country Status (1)

Country Link
CN (1) CN101065393A (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103160576A (zh) * 2011-12-15 2013-06-19 德赛诊断系统(上海)有限公司 基于SAA1β/β纯合子基因型的肝硬化预后诊断和/或肝硬化诊断的检测方法
WO2013086809A1 (zh) * 2011-12-15 2013-06-20 Wang Rongfang SAA1β/β纯合子基因型在肝硬化预后诊断及肝硬化诊断中的应用
CN105954515B (zh) * 2007-07-19 2019-02-22 生物梅里埃公司 体外诊断结肠直肠癌的白细胞弹性蛋白酶抑制剂测定方法
CN111755070A (zh) * 2019-03-29 2020-10-09 中山大学 一种基于级联判决系统的CircRNA功能预测方法
CN112876565A (zh) * 2021-03-08 2021-06-01 北京瀚梅生物科技有限公司 结直肠癌检测试剂盒
CN114134229A (zh) * 2021-10-28 2022-03-04 贵州百镜生物科技有限公司 结直肠癌和/或肠息肉诊断标志物、试剂盒、方法及应用
CN114174827A (zh) * 2019-05-30 2022-03-11 马瓦塔公司 用于诊断结直肠癌的方法

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105954515B (zh) * 2007-07-19 2019-02-22 生物梅里埃公司 体外诊断结肠直肠癌的白细胞弹性蛋白酶抑制剂测定方法
CN103160576A (zh) * 2011-12-15 2013-06-19 德赛诊断系统(上海)有限公司 基于SAA1β/β纯合子基因型的肝硬化预后诊断和/或肝硬化诊断的检测方法
WO2013086809A1 (zh) * 2011-12-15 2013-06-20 Wang Rongfang SAA1β/β纯合子基因型在肝硬化预后诊断及肝硬化诊断中的应用
CN103160576B (zh) * 2011-12-15 2014-12-17 德赛诊断系统(上海)有限公司 基于SAA1β/β纯合子基因型的肝硬化预后诊断和/或肝硬化诊断的检测方法
CN111755070A (zh) * 2019-03-29 2020-10-09 中山大学 一种基于级联判决系统的CircRNA功能预测方法
CN114174827A (zh) * 2019-05-30 2022-03-11 马瓦塔公司 用于诊断结直肠癌的方法
CN112876565A (zh) * 2021-03-08 2021-06-01 北京瀚梅生物科技有限公司 结直肠癌检测试剂盒
CN114134229A (zh) * 2021-10-28 2022-03-04 贵州百镜生物科技有限公司 结直肠癌和/或肠息肉诊断标志物、试剂盒、方法及应用

Similar Documents

Publication Publication Date Title
Thomas et al. Adenoviral-directed expression of the type 1A angiotensin receptor promotes cardiomyocyte hypertrophy via transactivation of the epidermal growth factor receptor
CN1890381A (zh) 诊断乳腺癌的方法
CN1957256A (zh) 用于子宫颈疾病检测的方法和组合物
CN101044247A (zh) 用于鉴定,评估,预防和治疗子宫颈癌的组合物,试剂盒及方法
CN1969047A (zh) 预测乳腺癌治疗结局
CN1867679A (zh) 用于胃癌检测的标记物
CN1533435A (zh) 用于诊断及治疗胰岛素抗性及相关病症之方法和试剂
CN101065393A (zh) 用于结肠直肠癌早期检测的药物筛选和分子诊断检测:试剂、方法及其试剂盒
CN1592793A (zh) 肝细胞癌-相关基因和多肽,以及检测肝细胞癌的方法
CN1609616A (zh) 糖尿病的特异性标记
CN1628179A (zh) 肝细胞癌相关基因和蛋白
CN1619312A (zh) 代谢综合征的特异标记
Tischkowitz et al. Identification and characterization of novel SNPs in CHEK2 in Ashkenazi Jewish men with prostate cancer
CN1726395A (zh) 胰腺癌的特异标记
US20110171675A1 (en) Fret-based membrane-type 1 matrix metalloproteinase biosensor and methods for using the same
CN1711361A (zh) 预测药物治疗副效应水肿的方法
CN1637151A (zh) 结肠直肠癌预后
CN1897951A (zh) h-PRUNE的酶抑制剂在过度表达h-PRUNE的肿瘤转移的预防和治疗中的应用
US20060134622A1 (en) Amplified cancer target genes useful in diagnosis and thereapeutic screening
CN101061239A (zh) 通过URLC8的tRNA-二氢尿苷合酶活性诊断非小细胞肺癌的方法
KR20120073261A (ko) 카텝신 h의 용도
WO2024077286A2 (en) Compositions and methods for detection and treatment of prostate cancer
CN1222616C (zh) 具有抑癌功能的新的人蛋白及其编码序列
CN1509331A (zh) 肝再生相关基因的基因图板
CN1625687A (zh) 用于测量βig-h3蛋白质的量的方法以及使用其的诊断试剂盒

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20071031