CN1554664A

CN1554664A - 用于结核病诊断的化合物和方法

Info

Publication number: CN1554664A
Application number: CNA2004100351841A
Authority: CN
Inventors: Sg; S·G·里德; W; Y·A·W·斯克凯; ¡; D·C·笛勒隆; -; A·卡穆普斯-尼托; R·胡格藤; ά; T·H·威德维克; ��ߵ´Ŀ�; D·R·特瓦德茨克
Original assignee: Corixa Corp
Current assignee: Corixa Corp
Priority date: 1995-09-01
Filing date: 1996-08-30
Publication date: 2004-12-15
Also published as: ATE324445T1; WO1997009429A3; CN1200146A; JPH11514217A; EP2154248B1; EP0850305B1; AU7158796A; DE69636075D1; CY2618B2; ATE530671T1; CA2230927A1; CN1154730C; EP0850305A2; MX9801687A; DK2154248T3; PT2154248E; ES2378051T3; EP2154248A1; WO1997009429A2

Abstract

本发明公开了用于诊断结核病的化合物和方法。所提供的化合物包括多肽以及编码这些多肽的DNA，所说的多肽含有一种或多种结核分枝杆菌分泌或非分泌蛋白质的至少一种抗原性部分。含有这些多肽或DNA序列和合适的检测试剂的诊断试剂盒可以用于在患者和生物样品中检测结核分枝杆菌感染。本发明也提供了抗这些多肽的抗体。

Description

用于结核病诊断的化合物和方法

技术领域

本发明总的来说涉及结核分枝杆菌感染的检测。更具体地说本发明涉及包含结核分枝杆菌抗原，或其部分或其它变体的多肽，以及这些多肽在结核分枝杆菌感染的血清学诊断上的用途。

发明背景

结核病是一种慢性传染病，一般由结核分枝杆菌感染引起。它在发展中国家是一种主要的疾病，在世界上发达地区也是一个日益严重的问题，每年有约8百万新病例和3百万人死亡。虽然感染可以在相当长一段时间内无症状，但是该疾病最常见地表现为急性肺炎，导致发热和非排痰性咳嗽。如果不进行治疗，则常常会出现严重的并发症并导致死亡。

虽然一般地可以采用多种抗生素控制结核病，但这样的治疗不足以阻止该疾病的传播。传染的个体可以是无症状的，但有时是传染性的。此外，虽然符合治疗方案是关键性的，但患者的行为难以监测。某些患者不完成治疗过程，这可以导致无效的治疗并产生药物抗性。

抑制结核病的传播需要有效的免疫接种和准确地早期诊断该疾病。当前，用活细菌接种是诱导保护性免疫最有效的方法。用于这一目的的最普通的分枝杆菌属是卡介苗(BCG)和牛型分枝杆菌的无毒菌株。然而，BCG的安全性和有效性上存在争议，并且一些国家(如，美国)不接种一般公众。诊断一般利用皮试进行，这牵涉到真皮内接触结核菌素PPD(纯化的蛋白质衍生物)。在注射之后48-72小时，抗原特异性T细胞反应在注射部位导致可测量的潜伏(incubation)，这表明接触到分枝杆菌抗原。然而，这一实验的灵敏度和特异性一直存在问题，用BCG接种的个体与感染的个体不能区别。

虽然巨噬细胞已显示出作为结核分枝杆菌免疫性的主要的效应细胞，但T细胞是这种免疫性的主要的诱导物。T细胞在针对结核分枝杆菌感染的保护中的十分重要的作用由在爱滋病患者中结核分枝杆菌频繁发生说明，因为CD4 T细胞的耗竭与人免疫缺损病毒(HIV)感染相关。分枝杆菌属反应性CD4 T细胞已显示出是γ-干扰素(IFN-γ)的有力的生产者，后者依次已显示出在小鼠中触发巨噬细胞的抗分枝杆菌作用。尽管IFN-γ在人类中的作用还不太清楚，但研究已表明1，25-二羟基-维生素D3单独或与IFN-γ或肿瘤坏死因子-α一道激活人巨噬细胞以阻止结核分枝杆菌感染。此外，已知IFN-γ刺激人巨噬细胞产生1，25-二羟基-维生素D3。同样地，IL-12已显示出在刺激对结核分枝杆菌感染的抗性中起作用。有关结核分枝杆菌感染的免疫学参见Chan和Kaufmann，结核病：病理，预防和治疗，Boom(编者)，ASM出版社，华盛顿，DC，1994。

因此，本领域需要用于检测结核病的改进的诊断方法。本发明满足了这一需要并进一步提供了其它相关优点。

发明概要

简言之，本发明提供了用于诊断结核病的组合物和方法。在一个方面，本发明提供了一些多肽，这些多肽包含可溶性结核分枝杆菌抗原或仅在保守取代和/或修饰上不同的该抗原的变体的抗原性部分。在这一方面的一个实施方案中，所说的可溶性抗原具有一种以下N端序列：

(a)Asp-Pro-Val-Asp-Ala-Val-Ile-Asn-Thr-Thr-Cys-Asn-Tyr-Gly-Gln-

Val-Val-Ala-Ala-Leu(SEQ ID No.115)；

(b)Ala-Val-Glu-Ser-Gly-Met-Leu-Ala-Leu-Gly-Thr-Pro-Ala-Pro-Ser

(SEQ ID No.116)；

(c)Ala-Ala-Met-Lys-Pro-Arg-Thr-Gly-Asp-Gly-Pro-Leu-Glu-Ala-

Ala-Lys-Glu-Gly-Arg(SEQ ID No.117)；

(d)Tyr-Tyr-Trp-Cys-Pro-Gly-Gln-Pro-Phe-Asp-Pro-Ala-Trp-Gly-Pro

(SEQ ID No.118)；

(e)Asp-Ile-Gly-Ser-Glu-Ser-Thr-Glu-Asp-Gln-Gln-Xaa-Ala-Val

(SEQ ID No.119)；

(f)Ala-Glu-Glu-Ser-Ile-Ser-Thr-Xaa-Glu-Xaa-Ile-Val-Pro

(SEQ ID No.120)；

(g)Asp-Pro-Glu-Pro-Ala-Pro-Pro-Val-Pro-Thr-Thr-Ala-Ala-Ser-Pro-

Pro(SEQ ID No.121)；

(h)Ala-Pro-Lys-Thr-Tyr-Xaa-Glu-Glu-Leu-Lys-Gly-Thr-Asp-Thr-

Gly(SEQ ID No.122)；

(i)Asp-Pro-Ala-Ser-Ala-Pro-Asp-Val-Pro-Thr-Ala-Ala-Gln-Leu-Thr-

Ser-Leu-Leu-Asn-Ser-Leu-Ala-Asp-Pro-Asn-Val-Ser-Phe-Ala-Asn

(SEQ ID No.123)；和

(j)Xaa-Asp-Ser-Glu-Lys-Ser-Ala-Thr-Ile-Lys-Val-Thr-Asp-Ala-Ser；

(SEQ ID No.129)

(k)Ala-Gly-Asp-Thr-Xaa-Ile-Tyr-Ile-Val-Gly-Asn-Leu-Thr-Ala-Asp；

(SEQ ID No.130)或

(l)Ala-Pro-GIu-Ser-Gly-Ala-Gly-Leu-Gly-Gly-Thr-Val-Gln-Ala-Gly；

(SEQ ID No.131)

其中Xaa可以是任何氨基酸。

在一个相关的方面，本发明提供了一些多肽，这些多肽包含结核分枝杆菌抗原或仅在保守取代和/或修饰上不同的该抗原的变体的免疫原性部分，所说的抗原具有一种以下的N端序列：

(m)Xaa-Tyr-Ile-Ala-Tyr-Xaa-Thr-Thr-Ala-Gly-Ile-Val-Pro-Gly-Lys-

Ile-Asn-Val-His-Leu-Val；(SEQ ID No.132)或

(n)Asp-Pro-Pro-Asp-Pro-His-Gln-Xaa-Asp-Met-Tbr-Lys-Gly-Tyr-Tyr-

Pro-Gly-Gly-Arg-Arg-Xaa-Phe；(SEQ ID No.124)，

其中Xaa可以是任何氨基酸。

在另一个实施方案中，所说的抗原包含可溶性结核分枝杆菌抗原或仅在保守取代和/或修饰上不同的该抗原的变体的抗原性部分，其中所说的抗原包含由选自下组的DNA序列编码的氨基酸序列：SEQ ID No.1，2，4-10，13-25，52，94和96中所示的序列、这些序列的补体、以及在中等严格条件下与SEQ ID No.1，2，4-10，13-25，52，94和96中所示的序列杂交的DNA序列或它们的补体。

在一个相关的方面，所说的多肽包含结核分枝杆菌抗原或仅在保守取代和/或修饰上不同的该抗原的变体的抗原性部分，其中所说的抗原包含由选自下组的DNA序列编码的氨基酸序列：SEQ ID No.26-51中所示的序列、这些序列的补体、和在中等严格条件下与SEQ ID No.26-51中所示的序列杂交的DNA序列或它们的补体。

在一个相关的方面，本发明提供了编码上述多肽的DNA序列，包含这些DNA序列的重组表达载体和用这样的表达载体转化或转染的宿主细胞。

另一方面，本发明提供了包含第一与第二发明多肽或者是发明多肽与已知的结核分枝杆菌抗原的融合蛋白。

主题发明的另一方面提供了用于在病人中检测结核病的方法和诊断试剂盒，所说的方法包括：(a)使生物样品与至少一种上述多肽接触；和(b)在样品中检测结合到所说多肽上的抗体的存在，由此在生物样品中检测结核分枝杆菌感染。合适的生物样品包括全血，痰、血清、血浆、唾液、脑脊液和尿。所说的诊断试剂盒包含一种或多种上述多肽以及检测试剂。

本发明也提供了用于检测结核分枝杆菌感染的方法，该方法包括：(a)从患者中获得生物样品；(b)使所说的样品与聚合酶链反应中的第一和第二寡核苷酸引物接触，所说的第一和第二寡核苷酸引物包含编码上述多肽的DNA序列的至少约10个邻接的核苷酸；和(c)在样品中检测在第一和第二寡核苷酸引物存在下扩增的DNA序列。

在另一方面，本发明提供了用于在病人中检测结核分枝杆菌感染的方法，该方法包括：(a)从患者中获得生物样品；(b)使样品与寡核苷酸探针接触，所说探针包含编码上述多肽的DNA序列的至少约15个邻接核苷酸；和(c)在样品中检测杂交到所说寡核苷酸探针上的DNA序列。

另一方面，本发明提供了结合到以上所述的多肽上的多克隆和单克隆抗体两者以及将它们用于检测结核分枝杆菌感染的方法。

参照下列详细描述和附图，本发明的这些和其他方面会很清楚。本文所公开的所有参考文献与它们单个并入作为参考一样，以它们的整体由本文一并参考。

附图和序列识别号的简要描述

图1A-1B和图1C-1D说明实施例1中描述的14Kd、20Kd和26Kd抗原对分别来源于第一和第二结核分枝杆菌免疫供体的T细胞的增殖和干扰素-γ产生的刺激作用。

图2说明与细菌溶解产物的反应性比较，两种代表性多肽与结核分枝杆菌感染的和未感染的个体的血清的反应性。

图3显示与38kD抗原的反应性比较，四种代表性多肽与结核分枝杆菌感染的和未感染的个体的血清的反应性。

图4显示重组38kD和TbRall抗原与结核分枝杆菌患者、PPD阳性供体和正常供体的血清的反应性。

图5显示抗原TbRa2A与38kD阴性血清的反应性。

图6显示SEQ ID No.60的抗原与结核分枝杆菌患者和正常供体的血清的反应性。

SEQ ID No.1是TbRal的DNA序列。

SEQ ID No.2是TbRal0的DNA序列。

SEQ ID No.3是TbRal1的DNA序列。

SEQ ID No.4是TbRal2的DNA序列。

SEQ ID No.5是TbRal3的DNA序列。

SEQ ID NO.6是TbRal6的DNA序列。

SEQ ID NO.7是TbRal7的DNA序列。

SEQ ID NO.8是TbRal8的DNA序列。

SEQ ID NO.9是TbRal9的DNA序列。

SEQ ID NO.10是TbRa24的DNA序列。

SEQ ID NO.11是TbRa26的DNA序列。

SEQ ID NO.12是TbRa28的DNA序列。

SEQ ID NO.13是TbRa29的DNA序列。

SEQ ID NO.14是TbRa2A的DNA序列。

SEQ ID NO.15是TbRa3的DNA序列。

SEQ ID NO.16是TbRa32的DNA序列。

SEQ ID NO.17是TbRa35的DNA序列。

SEQ ID NO.18是TbRa36的DNA序列。

SEQ ID NO.19是TbRa4的DNA序列。

SEQ ID NO.20是TbRa9的DNA序列。

SEQ ID NO.21是TbRaB的DNA序列。

SEQ ID NO.22是TbRaC的DNA序列。

SEQ ID NO.23是TbRaD的DNA序列。

SEQ ID NO.24是YYWCPG的DNA序列。

SEQ ID NO.25是AAMK的DNA序列。

SEQ ID NO.26是TbL-23的DNA序列。

SEQ ID NO.27是TbL-24的DNA序列。

SEQ ID NO.28是TbL-25的DNA序列。

SEQ ID NO.29是TbL-28的DNA序列。

SEQ ID NO.30是TbL-29的DNA序列。

SEQ ID NO.31是TbH-5的DNA序列。

SEQ ID NO.32是TbH-8的DNA序列。

SEQ ID NO.33是TbH-9的DNA序列。

SEQ ID NO.34是TbM-1的DNA序列。

SEQ ID NO.35是TbM-3的DNA序列。

SEQ ID NO.36是TbM-6的DNA序列。

SEQ ID NO.37是TbM-7的DNA序列。

SEQ nD No.38是TbM-9的DNA序列。

SEQ ID NO.39是TbM-12的DNA序列。

SEQ ID NO.40是TbM-13的DNA序列。

SEQ ID NO.41是TbM-14的DNA序列。

SEQ ID NO.42是TbM-15的DNA序列。

SEQ ID NO.43是TbH-4的DNA序列。

SEQ ID NO.44是TbH4-FWD的DNA序列。

SEQ ID NO.45是TbH-12的DNA序列。

SEQ ID NO.46是Tb38-1的DNA序列。

SEQ ID NO.47是Tb38-4的DNA序列。

SEQ ID NO.48是TbL-17的DNA序列。

SEQ ID NO.49是TbL-20的DNA序列。

SEQ ID NO.50是TbL-21的DNA序列。

SEQ ID NO.51是TbH-16的DNA序列。

SEQ ID NO.52是DPEP的DNA序列。

SEQ ID NO.53是DPEP的推定的氨基酸序列。

SEQ ID NO.54是DPV N-端抗原的蛋白质序列。

SEQ ID NO.55是AVGS N-端抗原的蛋白质序列。

SEQ ID NO.56是AAMK N-端抗原的蛋白质序列。

SEQ ID NO.57是YYWC N-端抗原的蛋白质序列。

SEQ ID NO.58是DIGS N-端抗原的蛋白质序列。

SEQ ID NO.59是AEES N-端抗原的蛋白质序列。

SEQ ID NO.60是DPEP N-端抗原的蛋白质序列。

SEQ ID NO.61是APKT N-端抗原的蛋白质序列。

SEQ ID NO.62是DPAS N-端抗原的蛋白质序列。

SEQ ID NO.63是TbM-1肽的推定的氨基酸序列。

SEQ ID NO.64是TbRal的推定的氨基酸序列。

SEQ ID NO.65是TbRal0的推定的氨基酸序列。

SEQ ID NO.66是TbRal1的推定的氨基酸序列。

SEQ ID NO.67是TbRal2的推定的氨基酸序列。

SEQ ID NO.68是TbRal3的推定的氨基酸序列。

SEQ iD NO.69是TbRal6的推定的氨基酸序列。

SEQ ID NO.70是TbRal7的推定的氨基酸序列。

SEQ ID NO.71是TbRal8的推定的氨基酸序列。

SEQ ID NO.72是TbRal9的推定的氨基酸序列。

SEQ ID NO.73是TbRa24的推定的氨基酸序列。

SEQ ID NO.74是TbRa26的推定的氨基酸序列。

SEQ ID NO.75是TbRa28的推定的氨基酸序列。

SEQ ID NO.76是TbRa29的推定的氨基酸序列。

SEQ ID NO.77是TbRa2A的推定的氨基酸序列。

SEQ ID NO.78是TbRa3的推定的氨基酸序列。

SEQ ID NO.79是TbRa32的推定的氨基酸序列。

SEQ ID NO.80是TbRa35的推定的氨基酸序列。

SEQ ID NO.81是TbRa36的推定的氨基酸序列。

SEQ ID NO.82是TbRa4的推定的氨基酸序列。

SEQ ID NO.83是TbRa9的推定的氨基酸序列。

SEQ ID NO.84是TbRaB的推定的氨基酸序列。

SEQ ID NO.85是TbRaC的推定的氨基酸序列。

SEQ ID NO.86是TbRaD的推定的氨基酸序列。

SEQ ID NO.87是YYWCPG的推定的氨基酸序列。

SEQ ID NO.88是TbAAMK的推定的氨基酸序列。

SEQ ID NO.89是Tb38-1的推定的氨基酸序列。

SEQ ID NO.90是TbH-4的推定的氨基酸序列。

SEQ ID NO.91是TbH-8的推定的氨基酸序列。

SEQ ID NO.92是TbH-9的推定的氨基酸序列。

SEQ ID NO.93是TbH-12的推定的氨基酸序列。

SEQ ID NO.94是DPAS的DNA序列。

SEQ ID NO.95是DPAS的推定的氨基酸序列。

SEQ ID NO.96是DPV的DNA序列。

SEQ ID NO.97是DPV的推定的氨基酸序列。

SEQ ID NO.98是ESAT-6的DNA序列。

SEQ ID NO.99是ESAT-6的推定的氨基酸序列。

SEQ ID NO.100是TbH-8-2的DNA序列。

SEQ ID NO.101是TbH-9FL的DNA序列。

SEQ ID NO.102是TbH-9FL的推定的氨基酸序列。

SEQ ID NO.103是TbH-9-1的DNA序列。

SEQ ID NO.104是TbH-9-l的推定的氨基酸序列。

SEQ ID NO.105是TbH-9-4的DNA序列。

SEQ ID NO.106是TbH-9-4的推定的氨基酸序列。

SEQ ID NO.107是Tb38-1F2 IN的DNA序列。

SEQ ID NO.108是Tb38-1F2 RP的DNA序列。

SEQ ID NO.109是Tb37-FL的推定的氨基酸序列。

SEQ ID NO.110是Tb38-IN的推定的氨基酸序列。

SEQ ID NO.111是Tb38-1F3的DNA序列。

SEQ ID NO.112是Tb38-1F3的推定的氨基酸序列。

SEQ ID NO.113是Tb38-1F5的DNA序列。

SEQ ID NO.114是Tb38-1F6的DNA序列。

SEQ ID NO.115是DPV的推定的N-端氨基酸序列。

SEQ ID NO.116是AVGS的推定的N-端氨基酸序列。

SEQ ID NO.117是AAMK的推定的N-端氨基酸序列。

SEQ ID NO.118是YYWC的推定的N-端氨基酸序列。

SEQ ID NO.119是DIGS的推定的N-端氨基酸序列。

SEQ ID NO.120是AAES的推定的N-端氨基酸序列。

SEQ ID NO.121是DPEP的推定的N-端氨基酸序列。

SEQ ID NO.122是APKT的推定的N-端氨基酸序列。

SEQ ID NO.123是DPAS的推定的N-端氨基酸序列。

SEQ ID NO.124是DPPD N-端抗原的蛋白质序列。

SEQ ID NO.125-128是四种DPPD溴化氰片段的蛋白质序列。

SEQ ID NO.129是XDS抗原的N-端蛋白质序列。

SEQ ID NO.130是AGD抗原的N-端蛋白质序列。

SEQ ID NO.131是APE抗原的N-端蛋白质序列。

SEQ ID NO.132是XYI抗原的N-端蛋白质序列。

发明详述

如上所述，本发明总的来说涉及诊断结核病的组合物和方法。本发明的组合物包含一些多肽，这些多肽包含结核分枝杆菌抗原或仅在保守取代和/或修饰上不同的该抗原的变体的至少一种抗原性部分。在本发明的范围内的多肽包括，但不限于，可溶性结核分枝杆菌抗原。″可溶性结核分枝杆菌抗原″是存在于结核分枝杆菌培养物滤液中的结核分枝杆菌源的蛋白质。如本文所使用的，术语″多肽″包括任何长度的氨基酸链，包括全长蛋白质(即，抗原)，其中的氨基酸残基由共价肽键连接。这样，包含上述一种抗原的抗原性部分的多肽可以是完全由抗原性部分组成的，或者可以含有附加序列。所说的附加序列可以是来源于天然结核分枝杆菌抗原或者可以是异源的，这样的序列可以是(但不需要是)抗原性的。

抗原的″抗原性部分″(可以是也可以不是可溶性的)是能够与从结核分枝杆菌感染个体获得的血清反应的部分(即，在本文描述的代表性ELISA测定中，用感染个体的血清产生的吸收读数至少在用未感染个体血清获得的吸收的三个标准偏差以上)。″结核分枝杆菌感染个体″是已由结核分枝杆菌感染的人(例如，具有直径至少0.5cm的对PPD的真皮内皮试反应)。感染个体可以显示出结核病的症状，或可以是无疾病症状的。通常可以单独或组合使用包含本文描述的一种或多种结核分枝杆菌抗原的至少一种抗原性部分的多肽，以在患者中检测结核病。

本发明的组合物与方法也包括上述多肽的变体。如本文所使用的″变体″是仅在保守取代和/或修饰上不同于天然抗原(以便所述多肽的抗原性特性得到保留)的多肽。通过采用本文描述的代表性方法修饰一种上述多肽序列并评价修饰的多肽的抗原性特性可以一般性地鉴别这样的变体。

″保守取代″是这样一种取代，其中一种氨基酸取代具有类似性质的另一种氨基酸，以便肽化学领域的技术人员可以期望多肽的二级结构与亲水性质实质上不变。一般来说，下组氨基酸代表保守取代：(1)ala、pro、gly、glu、asp、gln、asn、ser、thr；(2)cys、ser、tyr、thr；(3)val、ile、leu、met、ala、phe；(4)lys、arg、his；和(5)phe、tyr、trp、his。

变体也可以(或选择性地)是由例如氨基酸缺失或者添加(对多肽抗原性特性，二级结构和亲水性质具有最小限度的影响)修饰的。例如，多肽可以连结到蛋白质N端的信号(或前导)序列上，后者共翻译或翻译后指导蛋白质的转移。所述多肽也可以连结到使多肽容易合成，纯化以及鉴定或增强多肽结合到固相支持物上的接头和其他序列(例如poly-His)上。例如，多肽可以连结到免疫球蛋白Fc区上。

在一个相关的方面，本文公开了组合多肽。″组合多肽″是包含至少一种上述抗原性部分和一种或多种附加抗原性结核分枝杆菌序列(其经由肽键连接到单一的氨基酸链上)的多肽。所述的序列可以直接连接(即没有间插氨基酸)或通过不明显降低组成多肽的抗原性特性的接头序列(例如，Gly-Cys-Gly)连接。

一般来说，结核分枝杆菌抗原，编码这种抗原的DNA序列，可以多种方法的任何一种制备。例如，可溶性抗原可以用本领域技术人员已知的方法，包括阴离子交换、反相层析从结核分枝杆菌培养物滤液分离。纯化的抗原可以就所需的性质进行评价，所述性质例如与从结核分枝杆菌感染个体获得的血清的反应能力。这样的筛选可以用本文描述的代表性方法完成。可以利用例如传统的Edman化学对抗原进行部分测序。参见Edman和Berg，欧洲生物化学杂志，80：116-132，1967。

也可以用编码抗原的DNA序列(已插入到表达载体中并在合适的宿主中表达)重组产生抗原。可以通过用特异性抗可溶性结核分枝杆菌抗原产生的抗血清(例如兔)筛选合适的结核分枝杆菌表达文库来分离编码可溶性抗原的DNA分子。可以用从感染了结核分枝杆菌的病人获得的血清筛选合适的结核分枝杆菌基因组或者cDNA表达文库鉴别编码抗原(抗原可以是或者可以不是可溶性的)的DNA序列。这样的筛选一般可以利用本领域已知的技术完成，例如在Sambrook等，分子克隆：实验室手册，冷泉港实验室，冷泉港，NY，1989中所描述的那些。

编码可溶性抗原的DNA序列也可以通过就与简并寡核苷酸(该寡核苷酸来源于分离的可溶性抗原的部分氨基酸序列)杂交的DNA序列筛选适当的结核分枝杆菌cDNA或基因组DNA文库来获得。可以如(例如)Sambrook等，分子克隆：实验室手册，冷泉港实验室，冷泉港，NY(和该文引用的参考文献)中的描述设计和合成用于这种筛选的简并寡核苷酸序列，并且完成筛选。也可以使用聚合酶链反应(PCR)，用本领域已知的方法用上述寡核苷酸，以从cDNA或基因组文库分离核酸探针。然后可以使用所分离的探针完成文库的筛选。

不论是什么制备方法，本文所描述的抗原是″抗原性的″，更具体地说，所说的抗原具有与从结核分枝杆菌感染个体获得的血清反应的能力。可以采用例如本文描述的代表性的ELISA测定评价反应性，其中用感染个体的血清产生的吸收读数至少在用未感染个体血清获得的吸收的三个标准偏差以上被认为是阳性的。

也可以采用本领域已知的技术(例如在Paul，基础免疫学，第三版，Raven出版社，1993，pp.243-247和该文引用的参考文献中描述的那些技术)制备和鉴别结核分枝杆菌抗原的抗原性部分。这样的技术包括就抗原性特性筛选天然抗原的多肽部分。一般可以将本文所描述的代表性ELISA用于这些筛选。多肽的抗原性部分是这样的部分，其在这样的代表性测定中产生实质上类似由全长抗原产生的信号的这种测定中的信号。换句话说，在本文描述的模式ELISA中，结核分枝杆菌抗原的抗原性部分产生至少约20％，优选地约100％的由全长抗原所产生的信号。

结核分枝杆菌抗原的部分和其它变体可以用合成或者重组方法产生。利用本领域已知的技术，可以产生具有少于约100个氨基酸，一般少于约50个氨基酸的合成多肽。例如，这些多肽可以用任何通过商业途径可获得的固相技术合成，如Merrifield固相合成法，其中氨基酸依次添加到增长的氨基酸链上。参见Merrifield，美国化学会杂志，8：2149-2146，1963。用于多肽的自动合成的设备是可通过商业途径从供应商(如应用生物系统公司，Foster City，CA)获得的，并且可以按照制造厂商的说明操作。一般可以用标准的诱变技术(如寡核苷酸定点特异性诱变)制备天然抗原的变体。也可以用标准的技术除去DNA序列的片段，以便可以制备截短的多肽。

采用本领域技术人员熟知的各种技术，可以容易地从编码多肽的DNA序列制备包含天然抗原部分和/或变体的重组多肽。例如，将重组蛋白质分泌到培养基中的合适的宿主/载体系统的上清液可以首先采用市售的滤器浓缩。在浓缩之后，可以将浓缩液用于合适的纯化基质(如亲和性基质或离子交换树脂)上。最后，可以使用一个或多个反相HPLC步骤，以进一步纯化重组蛋白质。

本领域普通技术人员已知的各种表达载体的任何一种都可以用于表达本文所描述的重组多肽。表达可以在任何合适的宿主细胞中进行，所述的宿主细胞已用含有编码重组多肽的DNA分子的表达载体转化或转染过。合适的宿主细胞包括原核生物，酵母和高级真核细胞。优选地，使用的宿主细胞是大肠杆菌，酵母或哺乳动物细胞系，如COS或CHO。以这一方式表达的DNA序列可以编码天然存在的抗原，天然存在的抗原的部分，或者其其它变体。

一般来说，不论采用哪一种制备方法，本文所公开的多肽实质上以纯化的形式得以制备。优选地，所述多肽的纯度为至少大约80％，更优选地至少大约90％，最优选地至少大约99％。然而，就用于本文所公开的方法而言，这些实质上纯化的多肽可以是组合的。

在某些特定的实施方案中，主题发明公开了一些多肽，这些多肽包含可溶性结核分枝杆菌抗原(或这种抗原的变体)的至少一种抗原性部分，所说的抗原具有一种以下的N端序列：

(a)Asp-Pro-Val-Asp-Ala-Val-Ile-Asn-Thr-Thr-Cys-Asn-Tyr-Gly-Gln-

Val-Val-Ala-Ala-Leu(SEQ ID No.115)；

(b)Ala-Val-Glu-Ser-Gly-Met-Leu-Ala-Leu-Gly-Thr-Pro-Ala-Pro-Ser

(SEQ ID No.116)；

(c)Ala-Ala-Met-Lys-Pro-Arg-Thr-Gly-Asp-Gly-Pro-Leu-Glu-Ala-

Ala-Lys-Glu-Gly-Arg(SEQ ID No.117)；

(d)Tyr-Tyr-Trp-Cys-Pro-Gly-Gln-Pro-Phe-Asp-Pro-Ala-Trp-Gly-Pro

(SEQ ID No.118)；

(e)Asp-Ile-Gly-Ser-Glu-Ser-Thr-Glu-Asp-Gln-Gln-Xaa-Ala-Val

(SEQ ID No.119)；

(f)Ala-Glu-Glu-Ser-Ile-Ser-Thr-Xaa-Glu-Xaa-Ile-Val-Pro

(SEQ ID No.120)；

(g)AspPro-Glu-Pro-Ala-Pro-Pro-Val-Pro-Thr-Thr-Ala-Ala-Ser-Pro-

Pro(SEQ ID No.121)；

(h)Ala-Pro-Lys-Thr-Tyr-Xaa-Glu-Glu-Leu-Lys-Gly-Thr-Asp-Thr-

Gly(SEQ ID No.122)；

(i)Asp-Pro-Ala-Ser-Ala-Pro-Asp-Val-Pro-Thr-Ala-Ala-Gln-Leu-Thr-

Ser-Leu-Leu-Asn-Ser-Leu-Ala-Asp-Pro-Asn-Val-Ser-Phe-Ala-Asn

(SEQ ID No.123)；和

(j)Xaa-Asp-Ser-Glu-Lys-Ser-Ala-Thr-Ile-Lys-Val-Thr-Asp-Ala-Ser；

(SEQ ID No.129)

(k)Ala-Gly-Asp-Thr-Xaa-Ile-Tyr-Ile-Val-Gly-Asn-Leu-Thr-Ala-Asp；

(SEQ ID No.130)或

(l)Ala-Pro-Glu-Ser-Gly-Ala-Gly-Leu-Gly-Gly-Thr-Val-Gln-Ala-Gly；

(SEQ ID No.131)其中Xaa可以是任何氨基酸，优选地是半胱氨酸残基。编码以上标记有(g)的抗原的DNA序列在SEQ ID No.52中给出，其推定的氨基酸序列在SEQID No.53中给出。编码以上标记有(a)的抗原的DNA序列在SEQ ID No.96中给出，其推定的氨基酸序列在SEQ ID No.97中给出。相应于以上抗原(d)的DNA序列在SEQ ID No.24中给出，相应于以上抗原(c)的DNA序列在SEQ ID No.25中给出，相应于以上抗原(I)的DNA序列在SEQ ID No.94中给出，其推定的氨基酸序列在SEQ ID No.95中给出。

在另一个特定的实施方案中，主题发明公开了一些多肽，这些多肽包含具有一种以下的N端序列的结核分枝杆菌抗原，或仅在保守取代和/或修饰上不同的该抗原的变体的至少一种免疫原性部分：

(m)Xaa-Tyr-Ile-Ala-Tyr-Xaa-Thr-Thr-Ala-Gly-Ile-Val-Pro-Gly-Lys-

Ile-Asn-Val-His-Leu-Val；(SEQ ID No.132)或

(n)Asp-Pro-Pro-Asp-Pro-His-Gln-Xaa-Asp-Met-Thr-Lys-Gly-Tyr-

Tyr-Pro-Gly-Gly-Arg-Arg-Xaa-Phe；(SEQ ID No.124)，

其中Xaa可以是任何氨基酸，优选地是半胱氨酸残基

在其它特定的实施方案中，主题发明公开了一些多肽，这些多肽包含可溶性的结核分枝杆菌抗原(或这种抗原的变体)的至少一种抗原性部分，所述抗原(或其变体)包含由以下序列编码的一种或多种氨基酸序列：(a)SEQID No.1，2，4-10，13-25，52，94和96的DNA序列，(b)这些DNA序列的补体，或(c)实质上同源于(a)或(b)中的序列的DNA序列。

在其他特定的实施方案中，主题发明公开了一些多肽，这些多肽包含结核分枝杆菌抗原(或这种抗原的变体)的至少一种抗原性部分，所述抗原(或其变体)可以是也可以不是可溶性的，其包含由以下序列编码的一种或多种氨基酸序列：(a)SEQ ID No.26-51的DNA序列，(b)这些DNA序列的补体，或(c)实质上同源于(a)或(b)中的序列的DNA序列。

在以上讨论的特定的实施方案中，结核分枝杆菌抗原包括由实质上同源于本文特别提出的一种或多种DNA序列的DNA序列编码的变体。本文使用的“实质上的同源性”指在中等严格条件下能够杂交的DNA序列。合适的中等严格条件包括在5X SSC，0.5％SDS，1.0mM EDTA(pH8.0)溶液中预洗涤；在50℃-65℃，5X SSC下杂交一夜，或者在杂交物种同源的情况下在45℃，5X SSC下杂交；接着在65℃下洗涤两次，每次以包含0.1％SDS的2X，0.5X和0.2X SSC洗涤20分钟。这样的杂交DNA序列也在本发明的范围内，由于密码简并，编码由杂交DNA序列编码的免疫原性多肽的核苷酸序列也是如此。

在一个相关的方面，本发明提供了一些融合蛋白以及这些融合蛋白的变体，所说的融合蛋白包含第一与第二发明多肽或者是本发明多肽与已知的结核分枝杆菌抗原的融合蛋白，所述抗原如以上描述的38kD抗原或ESAT-6(SEQ ID No.98和99)。本发明的融合蛋白也可以包含在所说的第一和第二多肽之间的接头肽。

利用已知的DNA重组技术将分离的编码第一和第二多肽的DNA序列装配到适当的表达载体中，由此来构建编码本发明的融合蛋白的DNA序列。将具有或不具有肽接头的编码第一多肽的DNA序列的3’末端连接到编码第二多肽的DNA序列的5’末端，以便这些序列的读框处于可以使两种DNA序列的mRNA翻译成保持第一和第二多肽两者的生物学活性的单一融合蛋白的状态。

肽接头序列可以用于通过足以保证各多肽折叠成其二级和四级结构的距离分离第一和第二多肽。采用本领域熟知的标准技术将这样一种肽接头序列掺入到融合蛋白中。可以基于下列因素选择合适的肽接头序列：(1)它们采取柔性延伸构象的能力；(2)它们不采取二级结构(其可以与第一和第二多肽上的功能性表位相互作用)的能力；和(3)可以与多肽的功能性表位进行反应的疏水或带电残基的缺乏。优选的肽接头序列包括Gly、Asn和Ser残基。其它接近中性的氨基酸，如Thr和Ala也可以用于接头序列。可以有利地用作接头序列的氨基酸序列包括在Maratea等，基因，40：39-46，1985；Murphy等，美国科学院学报，83：8258-8562，1986；美国专利4,935,233和美国专利4,751,180中公开的那些。所说的接头序列长度可以从1到约50个氨基酸。当第一和第二多肽具有可以用来分离功能域和阻止空间位阻的非必需N端氨基酸区时，肽接头序列是不需要的。

另一方面，本发明提供了用于利用以上所描述的多肽来诊断结核病的方法。在这一方面，提供了通过单独或组合使用一种或多种以上多肽检测生物样品中结核分枝杆菌感染的方法。在采用多种多肽的实施方案中，可以包括本文特定描述的那些多肽之外的多肽，例如在Andersen和Hansen，感染免疫学，57：2481-2488，1989中描述的38kD抗原。本文所使用的″生物样品″是任何从患者所获得的含有抗体的样品。优选地样品是全血，痰，血清，血浆，唾液，脑脊液或者尿。更优选地样品是从患者或血液供体所获得的血清或者血浆样品。如以下的描述将所述多肽用于测定中，以确定样品中抗体的存在或不存在(相对于预定的切断(cut-off)值)。这样的抗体的存在表明对可以指示结核病的分枝杆菌抗原的早期致敏作用。

在使用多于一种多肽的实施方案中，所使用的多肽优选地是互补的(即一种组分多肽倾向于检测样品中不能由另一种组分多肽检测的感染)。一般可以采用各种多肽鉴别互补多肽，以分别评价从已知由结核分枝杆菌感染的一系列病人获得的血清样品。在用各多肽确定哪些样品为试验阳性(如下所述)后，可以制备能够检测大多数或所有待试样品中的感染的两种或多种多肽的组合体。这些多肽是互补性的。例如，肺结核-感染个体血清的约25-30％就针对任意单一蛋白质(如以上所论及的38kD抗原)的抗体而言是阴性的。因此，互补多肽可以与38kD抗原结合起来使用，以改进诊断试验的灵敏度。

有本领域技术人员已知的用一种或多种多肽检测样品中抗体的多种方式。参见，例如，Harlow和Lane，抗体：实验室手册，冷泉港实验室，1988，该文献本文一并参考。在一个优选的实施方案中，所说的测定包括利用固定在固相支持物上的多肽结合和除去样品中的抗体。然后，结合的抗体可以用含有报道基团的检测试剂检测。合适的检测试剂包括结合到抗体/多肽复合物和游离多肽上的抗体，其是由报道基团标记的(例如，在半竞争性测定中)。此外，可以使用竞争性测定，其中结合到多肽上的抗体以报道基团标记，并且使得可以在将抗原与样品温育后结合到固定化的抗原上。样品组分抑制标记抗体对多肽结合的程度是样品与固定化多肽反应性的指示。

固相支持物可以是任何本领域普通技术人员已知的抗原可以连接于其上的固体物质。例如，固相支持物可以是微量滴定板中的试验孔或者硝化纤维素或者其它合适的膜。此外，支持物可以是小珠或圆盘，如玻璃，玻璃纤维，乳胶或者塑料材料，如聚苯乙烯或聚氯乙烯。支持物也可以是磁性颗粒或纤维光学传感器，例如，在美国专利5,359,681中公开的那些。

所述多肽可以用任何本领域普通技术人员已知的多种技术结合到固相支持物上，这些技术在专利和科学文献中有详细的描述。在本发明的上下文中，术语″结合″指非共价缔合(如吸附)和共价连接(可以是抗原和在支持物上的官能团的直接键合，或者可以是利用交联剂连接)。通过吸附到微量滴定板中的孔上或者膜上的结合是优选的。在这样的情况下，吸附可以通过将在合适的缓冲液中的多肽与固相支持物接触一段合适的时间完成。接触时间随着温度变化，但是一般在大约1小时和1天之间。一般来说，使塑料微量滴定板(如聚苯乙烯或聚氯乙烯)的孔与范围从约10ng到约1μg，优选地约100ng量的多肽接触足以结合充分量的抗原。

通过首先将支持物与双功能试剂反应一般可以完成多肽与固相支持物的共价连接，所述的双功能试剂与支持物和多肽上的官能团(如羟基或氨基基团)两者反应。例如，所述多肽可以结合到具有合适的聚合物的支持物上(采用苯醌涂布或经将醛基团与多肽上胺或活性氢缩合)(参见，例如，Pierce免疫技术目录和手册，1991，A12-A13)。

在某些实施方案中，所述的测定是酶联免疫吸附测定(ELISA)。这一测定可以通过首先使已固定化到固相支持物(一般是微量滴定板的孔)上的多肽抗原与样品接触，以便样品中的多肽的抗体可以结合到固定化的多肽上。然后从固定化的多肽上除去未结合的样品，并加入能够结合固定化的抗体-多肽复合物的检测试剂。然后，采用适合于特定检测试剂的方法测定保持结合到固相支持物上的检测试剂的量。

更具体地说，一旦多肽如上所述固定化在支持物上，则剩下的在支持物上的蛋白质结合部位就通常被阻断。任何本领域普通技术人员已知的合适的阻断剂，如牛血清白蛋白或吐温20^TM(Sigma化学公司，St.Louis，MO)，都可以使用。然后将固定化的多肽与样品一起温育，使抗体结合到抗原上。在温育之前，样品可以以合适的稀释剂稀释，所述稀释剂如磷酸盐缓冲盐水(PBS)。一般来说，适当的接触时间(即，温育时间)是对检测结核分枝杆菌感染样品中抗体存在的足够的那段时间。优选地，所说的接触时间足以完成至少95％的结合水平(结合的和未结合的抗体之间达到平衡)。本领域普通技术人员会认识到达到平衡所需的时间可以通过测定整个期限内出现结合水平容易地确定。在室温下，约30分钟的温育时间一般是足够的。

然后，可以通过用适当的缓冲液(如包含0.1％吐温20TM的PBS)洗涤固相支持物除去未结合的样品。接着检测试剂可以加入到固相支持物上。适当的检测试剂是结合到固定化的抗体-多肽复合物上并且可以用本领域已知的各种方法之任何一种检测的任何化合物。优选地，所述的检测试剂含有结合到报道基团上的结合剂(例如，蛋白质A、蛋白质G、免疫球蛋白、凝集素或者游离抗原)。优选的报道基团包括酶(如辣根过氧化物酶)、底物、辅因子、抑制剂、染料、放射性核素、发光基团、荧光基团和生物素。可以用本领域普通技术人员已知的标准的方法完成报道基团与结合剂的结合。结合到各种报道基团上的普通的结合剂也可以从多种商业来源(例如，Zymed Laboratories，旧金山，CA，和Pierce，Rockford，IL)购得。

然后，将检测试剂与固定化的抗体-多肽复合物一起温育足以检测结合抗体的一段时间。合适的一段时间一般从制造厂商的说明确定或通过测定在整个时间内出现的结合水平确定。接着除去未结合的检测试剂，并采用报道基团检测结合的检测试剂。用于检测报道基团的方法取决于报道基团的性质。对于放射性基团，闪烁计数或放射自显影法一般是适当的。光谱学方法可以用于检测染料，发光基团和荧光基团。连接到不同报道基团(一般是放射性或者荧光基团或酶)上的生物素可以利用抗生物素蛋白检测。酶报道基团一般可以通过添加底物(一般是一段特定的时间)，然后进行反应产物的光谱或其它分析来检测。

为了确定样品中结核分枝杆菌抗体的存在或不存在，一般将从保持结合到固相支持物上的报道基团检测到的信号与相应于预定截止值的信号比较。在一个优选的实施方案中，当固定化的抗原与未感染的病人的样品一起温育时，所说的截止值是所获得的平均信号。一般来说，产生的信号在预定的截止值三个标准偏差之上的样品被认为是结核病阳性的。在另一个优选的实施方案中，按照Sackett等，临床流行病学：一种临床医学的基础科学，Little Brown and Co.，1985，pp.106-107的方法采用接受体-操纵物(Receiver Operator)曲线确定截止值。简言之，在这一实施方案中，截止值可以从真阳性大鼠(即敏感性)和假阳性大鼠(100％-特异性)对的图(其相应于诊断试验结果的各种可能的截止值)确定。在最靠近左上角图上的截止值(即圈在最大区域内的值)是最精确的截止值，产生的信号高于由这一方法确定的截止值的样品被认为是阳性的。另外，所说的截止值可以沿图移向左边(以最小化假阳性率)，或者右边(以最小化假阴性率)。一般来说，产生的信号高于由这一方法确定的截止值的样品被认为是结核病阳性的。

在相关的实施方案中，所说的测定以迅速过流或布条断裂强度试验方式完成，其中抗原固定化在膜(如硝化纤维素膜)上。在过流试验中，在样品通过膜时，样品内的抗体结合到固定化的多肽上。然后，当含有检测试剂的溶液流过膜时，检测试剂(例如，蛋白质A-胶态金)结合到抗体-多肽复合物上。然后可以按照以上的描述完成对结合的检测试剂的检测。在布条断裂强度试验方式中，将多肽结合于其上的膜的一端浸没在包含样品的溶液中。样品沿着膜迁移，穿过包含检测试剂的区域，到达固定化的多肽的区。在多肽上的检测试剂的浓度表明样品中抗结核分枝杆菌抗体的存在。典型地，在这一部位的检测试剂的浓度产生可以容易被观察的模式，如线状。缺乏这样一种模式表明阴性结果。一般来说，选择在膜上固定化的多肽的量，以便当生物样品含有足以在ELISA中产生阳性信号的抗体水平时(如以上所讨论的)，产生清楚可见的模式。优选地，固定化在膜上的多肽的量的范围从约25ng到约1μg，更优选地从约50ng到约500ng。这样的试验典型地以十分小的量(例如1滴)的病人血清或血液进行。

当然，存在适合采用本发明的多肽的许多其它测定方案。以上描述仅仅是为了例举。

在另一方面，本发明提供了针对发明多肽的抗体。可以通过各种本领域普通技术人员已知的技术的任意一种制备抗体。参见，例如，Harlow和Lane，抗体：实验室手册，冷泉港实验室，1988。在一种这样的技术中，包含抗原性多肽的免疫原起初注射进任何哺乳动物的各种品种(例如，小鼠，大鼠，兔，绵羊以及山羊)。在这一步骤中，本发明的多肽可以不经修饰作为免疫原。此外，特别是对相对比较短的多肽而言，如果多肽连接到载体蛋白(如牛血清白蛋白或匙孔血蓝蛋白)上，则可以激发高级免疫应答。将免疫原注射进动物宿主，优选地是按照掺入一种或多种加强免疫的预定方案注射，并且周期性地使动物放血。然后，对多肽特异性的多克隆抗体可以通过，例如使用连接到合适的固相支持物上的多肽的亲和层析从这样的抗血清纯化。

可以采用例如Kohler和Milstein，欧洲免疫学杂志，6：511-519，1976的技术和其改进的技术制备兴趣抗原性多肽特异性的单克隆抗体。简言之，这些方法包括制备能够产生具有所需特异性(例如，与兴趣多肽的反应性)的抗体的无限增殖细胞系。这样的细胞系可以从例如脾细胞(由按照以上的描述免疫的动物获得的)产生。然后，通过例如与骨髓瘤细胞融合配偶体(优选地是与免疫的动物同系的一种)融合使脾细胞无限增殖化。可以使用各种融合技术。例如，可以将脾细胞和骨髓瘤细胞与非离子去污剂组合在一起几分钟，然后在选择培养基上低密度平板接种，所说的选择培养基支持杂交细胞生长，但不支持骨髓瘤细胞生长。一种优选的选择技术利用HAT(次黄嘌呤，氨基蝶呤，胸苷)选择。在足够的时间(通常约1至2周)之后，观察到杂交体集落。选择单一集落，并试验针对多肽的结合活性。具有高反应性和特异性的杂交瘤是优选的。

单克隆抗体可以从生长的杂交瘤集落上清液分离。此外，各种技术可以用来提高产率，如将杂交瘤细胞系注射进合适的脊椎动物宿主(如小鼠)的腹膜腔。然后可以从腹水液或血液收获单克隆抗体。可以用常规技术从抗体除去污染物，所述技术如层析，凝胶过滤，沉淀和抽提。本发明的多肽可以用于例如，亲和性层析步骤的纯化过程中。

采用类似于以上详细描述的测定法和本领域技术人员已知的其它技术，可以将抗体用于检测结核分枝杆菌抗原存在的诊断试验中，从而提供在病人中检测结核分枝杆菌感染的方法。

本发明的诊断试剂也可以包含编码一种或多种上述多肽的DNA序列，或一种或多种其部分。例如，包含主题DNA序列的至少10个邻接寡核苷酸的引物可以用于以聚合酶链反应(PCR)为基础的试验中。同样地，包含主题DNA序列的至少15个邻接寡核苷酸的探针可以用于与特定序列杂交。基于PCR试验和杂交试验的技术是本领域已知的。这样，引物或者探针可以用于检测生物样品中的结核分枝杆菌感染，所述样品优选地是痰，血液，血清，唾液，脑脊液或者尿。包含以上描述的寡核苷酸序列的DNA探针或引物可以单独使用，相互结合使用，或者与以前鉴别的序列(例如以上讨论的38kD抗原)结合使用。

以说明性的方式但不以限制性的方式给出下列实施例。

实施例

实施例1

来源于结核分枝杆菌培养物滤液的多肽的纯化和特征确定

这一例子说明从培养物滤液制备结核分枝杆菌可溶性多肽的方法。除非有其它方式注明，下列例子的所有百分比都是重量/体积百分比。

于37℃在无菌GAS培养基中培养结核分枝杆菌(H37Ra，ATCCNo.25177或H37Rv，ATCC No.25618)14天。然后经0.45μ滤器将培养基真空过滤(留下大批细胞)到无菌的2.5L瓶中。接着经0.2μ滤器将培养基过滤到无菌的4L瓶中。向培养物滤液中加入NaN3，使其浓度达0.04％。然后将瓶置于4℃的冷室中。

通过将滤液置于已高压灭菌的12L贮器中，并将滤液供入400mlAmicon搅拌池中浓缩培养物滤液，该搅拌池已以乙醇冲洗过，并且包含10,000kDa MWCO膜。使用氮气使压力保持在60psi。这一过程使12L体积减少到约50ml。

然后，采用8,000kDa MWCO纤维素酯膜将培养物滤液对0.1％碳酸氢铵透析，两次更换碳酸氢铵溶液。接着由通过商业途径可获得的BCA测定法(Pierce，Rockford，IL)测定蛋白质浓度。

然后将透析培养物滤液进行冻干，把多肽重悬于蒸馏水中。然后，将多肽对0.01mM 1，3双[三(羟甲基)-甲氨基]丙烷，pH7.5(Bis-Tris丙烷缓冲液)(阴离子交换层析的起始条件)透析。利用在POROS 146 II Q/M阴离子交换柱4.6mm×100mm(Perseptive BioSystems，Framingham，MA)上的凝胶预熔融(profusion)层析完成分级分离，所述交换柱已在0.01mMBis-Tris丙烷缓冲液(pH7.5)中平衡过。用在上述缓冲液系统中的0-0.5MNaCl梯度洗脱多肽。在220nm波长下监测柱洗脱液。

将从离子交换柱洗脱的多肽收集物对蒸馏水透析并冻干。将所形成的物质溶解到在水中的0.1％三氟乙酸(TFA)(pH1.9)中，并且在Delta-PakC18柱(Waters，Milford，MA，300埃孔径大小，5微米颗粒大小(3.9×150mm))上纯化该多肽。用从0到60％稀释缓冲液(在乙腈中的0.1％TFA)线性梯度液从柱中洗脱多肽。流速是0.75ml/分钟，在214nm监测HPLC洗脱液。收集包含洗脱的多肽的组分，使单个样品纯度最大。获得约200个纯化的多肽。

然后，就在PBMC制剂中诱导T细胞增殖的能力筛选纯化的多肽。将PBMC(来源于称为PPD皮试阳性的供体，并且其T细胞表现出应答PPD和粗的MTB可溶性蛋白质的增殖)在包含RPMI 1640(补充有10％收集的人血清和50μg/mL庆大霉素)的培养基中培养。双份以0.5至10μg/mL的浓度添加纯化的多肽。96-孔园底平板中以200μl体积培养6天后，从各孔除去50μl培养基，以测定IFN-γ水平，如以下所述。接着用1μCi/孔含氚胸苷脉冲平板另外的18小时，收获，并用气体闪烁计数器测定氚摄取。在两个重复中产生的增殖高于在单独的培养基中培养的细胞上观察到的增殖的3倍的组分被认为是阳性的。

用酶联免疫吸附测定(ELISA)测定IFN-γ。在室温下用在PBS中的针对人类IFN-γ(Chemicon)的小鼠单克隆抗体涂布ELISA平板4小时。然后在室温下用包含5％(WN)脱脂干奶的PBS阻断各孔。接着用PBS/0.2％TWEEN-20洗涤平板6次，将在ELISA平板上的以培养基1∶2稀释的样品在室温下过夜温育。再次洗涤平板，向各孔中添加以PBS/10％正常山羊血清1∶3000稀释的多克隆兔抗-人IFN-γ血清。然后在室温下温育平板两小时，洗涤，加入以PBS/5％脱脂干奶1∶2000稀释的辣根过氧化物酶-偶联的抗-兔IgG(Jackson Labs.)。在室温下进一步温育2小时后，洗涤平板，并加入TMB底物。20分钟后用1N硫酸终止反应。用570nm为参照波长，在450nm测定光密度。在两个重复中导致给出的OD高于在单独的培养基中培养的细胞的平均OD加3个标准偏差的组分被认为是阳性的。

为了测序，将多肽单个地干燥到BiobreneTM(Perkin Elmer/AppliedBioSystems Division，Foster City，CA)处理过的玻璃纤维滤器上。将具有多肽的滤器装到Perkin Elmer/Applied BioSystems Division Procise 492蛋白质测序仪上。从氨基端测序多肽，并且用传统的Edman化学法。通过把PTH氨基酸衍生物的保留时间与适当的PTH衍生物标准比较，确定各多肽的氨基酸序列。

利用以上描述的方法，分离到具有下列N端序列的抗原：

(a)Asp-Pro-Val-Asp-Ala-Val-Ile-Asn-Thr-Thr-Xaa-Asn-Tyr-Gly-

Gln-Val-Val-Ala-Ala-Leu(SEQ ID No.54)；

(b)Ala-Val-Glu-Ser-Gly-Met-Leu-Ala-Leu-Gly-Thr-Pro-Ala-Pro-

Ser(SEQ ID No.55)；

(c)Ala-Ala-Met-Lys-Pro-Arg-Thr-Gly-Asp-Gly-Pro-LeB-Gln-Ala-

Ala-Lys-Glu-Gly-Arg(SEQ ID No.56)；

(d)Tyr-Tyr-Trp-Cys-Pro-Gly-Gln-Pro-Phe-Asp-Pro-Ala-Trp-Gly-

Pro(SEQ ID No.57)；

(e)Asp-Ile-Gly-Ser-Glu-Ser-Thr-Glu-Asp-Gln-Gln-Xaa-Ala-Val

(SEQ ID No.58)；

(f)Ala-Glu-Glu-Ser-Ile-Ser-Thr-Xaa-Glu-Xaa-Ile-Val-Pro(SEQ ID

No.59)；

(g)Asp-Pro-Glu-Pro-Ala-Pro-Pro-Val-Pro-Thr-Ala-Ala-Ala-Ala-

Pro-Pro-Ala(SEQ ID No.60)；和

(h)Ala-Pro-Lys-Thr-Tyr-Xaa-Glu-Glu-Leu-Lys-Gly-Thr-Asp-Thr-

Gly(SEQ ID No.61)；

其中Xaa可以是任何氨基酸。

除以上所描述的方法之外，通过使用微内径柱HPLC纯化步骤分离到另外的抗原。具体地说，在Aquapore C18柱(Perkin Elmer/AppliedBiosystems Division，Foster City，CA)上纯化包含以上描述的层析纯化步骤的抗原混合物的20μl组分，所说的柱具有7微米孔径大小，柱规格为1mm×100mm，在Perkin Elmer/Applied Biosystems Division 172 HPLC型中。以80μl/分钟的流速，用在水(0.05％TFA)中的乙腈(含0.05％TFA)的1％/分钟的线性梯度液从柱上洗脱各组分。在250nm下监测洗脱液。原组分被分离成4个主要的峰加其他小的组分，并且获得显示出具有12.054Kd分子量(由质谱测得)和具有以下N端序列的多肽：

(i)Asp-Pro-Ala-Ser-Ala-Pro-Asp-Val-Pro-Thr-Ala-Ala-Gln-Gln-

Thr-Ser-Leu-Leu-Asn-Asn-Leu-Ala-Asp-Pro-Asp-Val-Ser-

Phe-Ala-Asp(SEQ ID No.62)。采用以上所述的测定法，这一多肽显示出在PBMC制剂中诱导增殖和IFN-γ产生。

按照以下所述从结核分枝杆菌培养物滤液分离另外的可溶性抗原。结核分枝杆菌培养物滤液按照以上描述的方法制备。在pH 5.5下对Bis-Tris丙烷缓冲液透析后，用在Poros QE柱4.6×100mm(PerseptiveBiosystems)上的阴离子交换层析完成分级分离，所述柱在Bis-Tris丙烷缓冲液(pH 5.5)中平衡过。以10ml/分钟的流速，用在上述缓冲系统中的线性0-1.5M NaCl梯度液洗脱多肽。在214nm下检测柱洗脱液。

收集从离子交换柱洗脱的组分，并采用Poros R2柱4.6×100mm(Perseptive Biosystems)进行反相层析。以5ml/分钟的流速，用0-100％乙腈(0.1％TFA)的线性梯度液从柱上洗脱多肽，在214nm监测洗脱液。

将包含洗脱的多肽的组分冷干，并重悬于80μl 0.1％TFA水溶液中，并再在Vydac C4柱4.6×150mm(Western Analytical，Temecula，CA)上，以2ml/分钟的流速，用0-100％乙腈(0.1％TFA)线性梯度液进行反相层析。在214nm监测洗脱液。

具有生物活性的组分被分离成一个主要的峰加其它小组分。这一峰的PVDF膜上的Western印迹揭示分子量为14Kd，20Kd和26Kd的三个主要带。确定了这些多肽分别具有下列N端序列：

(j)Xaa-Asp-Ser-Glu-Lys-Ser-Ala-Thr-Ile-Lys-Val-Thr-Asp-

Ala-Ser；(SEQ ID No.129)

(k)Ala-Gly-Asp-Thr-Xaa-Ile-Tyr-Ile-Val-Gly-Asn-Leu-Thr-

Ala-Asp；(SEQ ID No.130)和

(l)Ala-Pro-Glu-Ser-Gly-Ala-Gly-Leu-Gly-Gly-Thr-Val-Gln-

Ala-Gly；(SEQ ID No.131)，其中Xaa可以是任何氨基酸。采用以上所述的测定法，这些多肽显示出在PBMC制剂中诱导增殖和IFN-γ产生。图1A-1B和图1C-1D分别显示了使用第一和第二供体的PBMC制剂进行的这种测定的结果。

通过采用³²P末端标记的简并寡核苷酸(相应于N端序列并含有结核分枝杆菌密码子偏倚)筛选结核分枝杆菌基因组文库获得编码以上指定为(a)，(c)，(d)和(g)的抗原的DNA序列。采用相应于以上抗原(a)的探针进行的筛选鉴别具有SEQ ID No.96所示的序列的克隆。由SEQ ID No.96编码的多肽在SEQ ID No.97中给出。采用相应于以上抗原(g)的探针进行的筛选鉴别具有SEQ ID No.52所示的序列的克隆。由SEQ ID No.52编码的多肽在SEQ ID No.53中给出。采用相应于以上抗原(d)的探针进行的筛选鉴别具有SEQ ID No.24所示的序列的克隆。采用相应于以上抗原(c)的探针进行的筛选鉴别具有SEQ ID No.25所示的序列的克隆。

采用DNA STAR系统，将以上氨基酸序列与基因库中的已知氨基酸序列比较。所检索的数据库含有大约173,000种蛋白质，并且是Swiss，PIR数据库以及翻译的蛋白质序列(版本87)的组合。对抗原(a)-(h)和(l)，没有检测到与所说的氨基酸序列的明显的同源性。

发现抗原(i)的氨基酸序列同源于麻风分枝杆菌的序列。利用从GENBANK获得的序列从基因组DNA扩增全长麻风分枝杆菌序列。然后，将这一序列用于筛选结核分枝杆菌文库，获得全长拷贝的结核分枝杆菌的同系物(SEQ ID No.94)。

发现抗原(j)的氨基酸序列同源于从DNA序列翻译的已知结核分枝杆菌蛋白质。就发明者所知，这一蛋白质以前还没有显示出具有T-细胞刺激活性。发现抗原(k)的氨基酸序列与麻风分枝杆菌的序列相关。

在以上描述的增殖与IFN-γ测定中，利用三个PPD阳性供体，以上所提供的代表性抗原的结果在表1中给出：

表 1

PBMC增殖和IFN-γ测定的结果

序列	增殖	IFN-γ
序列	增殖	IFN-γ	(a)	+	-
(c)	+++	+++	(a)	+	-
(c)	+++	+++	(d)	++	++
(g)	+++	+++	(d)	++	++
(g)	+++	+++	(h)	+++	+++

在表1中，给出2和4之间的刺激指数(SI)的反应(与在单独的培养基培养的细胞比较)记录为+，在1μg或更低的浓度下的4-8或2-4的SI记录为++，大于8的SI记录为+++。发现序列(i)的抗原在增殖和IFN-γ测序两者中，对一种供体具有高的SI(+++)，对两种其它供体具有较低的SI(++和+)。这些结果表明这些抗原有能力诱导增殖和/或干扰素-γ产生。

实施例2

使用病人血清分离结核分枝杆菌抗原

这一例子说明通过用结核分枝杆菌感染个体的血清筛选从结核分枝杆菌溶解产物分离抗原的方法。

将干燥的结核分枝杆菌H37Ra(Difco实验室)添加至2％NP40溶液中，此外，匀浆和超声处理三次。在13,000rpm下在微量离心管中离心所形成的悬浮液，将上清液通过0.2微米注射滤器。将滤液结合到Macro PrepDEAE小珠(BioRad，Hercules，CA)上。用20mM Tris(pH7.5)充分洗涤小珠，结合的蛋白质以1M NaCl洗脱。将NaCl洗脱液对10mMTris(pH7.5)透析一夜。在室温下用0.05mg/ml的DNase和RNase处理透析溶液30分钟，然后于室温在pH4.5下用0.5U/mgα-D-甘露糖苷酶处理。在返回到pH7.5后，在Bio Scale-Q-20柱(BioRad)上经FPLC分级分离该物质。将组分合并到九个池中，在Centriprep 10(Amicon，Beverley，MA)中浓缩，并且采用结核分枝杆菌感染病人的血清(其与本发明的其它抗原不发生免疫反应)就血清学活性经Western印迹筛选。

将反应性最强的组分在SDS-PAGE上进行分析，并转移到PVDF上。切下约85Kd的带，产生以下序列：

(m)Xaa-Tyr-Ile-Ala-Tyr-Xaa-Thr-Thr-Ala-Gly-Ile-Val-Pro-Gly-Lys-

Ile-Asn-Val-His-Leu-Val；(SEQ ID No.132)，

其中Xaa可以是任何氨基酸。

这些序列与以上描述的基因库中的那些序列的比较揭示出与已知的序列没有明显的同源性。

实施例3

制备编码结核分枝杆菌抗原的DNA序列

这一例子说明通过用从结核分枝杆菌感染病人获得的血清或者用抗结核分枝杆菌抗原产生的抗血清筛选结核分枝杆菌表达文库，制备编码结核分枝杆菌抗原的DNA序列的方法。

A.用兔抗血清制备结核分枝杆菌可溶性抗原

从结核分枝杆菌菌株H37Ra分离基因组DNA。随机剪切该DNA，并用于用Lambda ZAP表达系统(Stratagene，La Jolla，CA)构建表达文库。通过用结核分枝杆菌培养物的浓缩上清液免疫兔产生抗结核分枝杆菌菌株H37Ra，H37Rv和Erdman的分泌蛋白质的兔抗血清。具体地说，首先用200μg在含有100μg胞壁酰二肽的2ml总体积中的蛋白质抗原(Calbiochem，La Jolla，CA)和1ml弗氏不完全佐剂皮下免疫兔。四周后，用在弗氏不完全佐剂中的100μg抗原皮下加强免疫兔。最后，在四周后用50μg蛋白质抗原静脉内免疫兔。如Sambrook等，分子克隆：实验室手册，冷泉港实验室，冷泉港，NY，1989中的描述将抗血清用于筛选表达文库。纯化表达免疫反应性抗原的噬菌体噬斑。噬斑的噬粒得到救援，结核分枝杆菌克隆的核苷酸序列被推定。

纯化了32个克隆。在这些克隆中，25个代表在结核分枝杆菌中以前没有鉴别过的序列。如Skeiky等，实验医学杂志，181：1527-1537，1995中所述用IPTG诱导蛋白质，并经凝胶洗脱纯化。在这一筛选中鉴别的DNA分子的代表性部分序列在SEQ ID No.1-25中给出。相应的预言的氨基酸序列在SEQ ID No.64-88中给出。

基于采用以上所述的数据库将这些序列与基因库中的已知序列比较，发现下文中称为TbRA2A、TbRA16、TbRA18和TbRA29(SEQ ID No.77、69、71、76)的克隆显示出与以前在麻风分枝杆菌中而不是在结核分枝杆菌中鉴别的序列的某些同源性。TbRA11、TbRA26、TbRA28和TbDPEP(SEQ ID No.66、74、75、53)以前在结核分枝杆菌中已鉴定过。对TbRA1、TbRA3、TbRA4、TbRA9、TbRA10、TbRA13、TbRA17、TbRA19、TbRA29、TbRA32、TbRA36和重叠克隆TbRA35和TbRA12(分别为SEQ ID No.64、78、82、83、65、68、76、72、76、79、81、80、67)没有发现明显的同源性。克隆TbRa24与克隆TbRa29重叠。

B.使用病人血清鉴别编码结核分枝杆菌抗原的DNA序列

采用从患活动性结核病的患者获得的血清库筛选以上描述的基因组DNA文库和另外的H37Rv文库。为了制备H37Rv文库，分离结核分枝杆菌菌株H37Rv基因组的DNA，进行部分Sau3A消化，并用于采用LambdaZap表达系统(Stratagene，La JolIa，Ca)构建表达文库。将三种不同库的血清(各含有从患有活动性肺部或胸膜疾病的个体获得的血清)用于表达筛选。有关在ELISA和免疫印迹方式两者中与H37Ra溶解产物的相对反应性，这些库被指定为TbL、TbM和TbH(即，TbL＝低反应性，TbM＝中等反应性和TbH＝高反应性)。也使用了来自活动性肺结核病的七个患者血清的四个库。所有血清缺乏与重组38kD结核分枝杆菌H37Ra磷酸盐-结合蛋白的增加的反应性。

所有库用大肠杆菌溶解产物预吸附，并用于如Sambrook等，分子克隆：实验室手册，冷泉港实验室，冷泉港，NY，1989中所述筛选H37Ra和H37Rv表达文库。纯化表达免疫反应性抗原的噬菌体噬斑。噬斑的噬粒得到救援，结核分枝杆菌克隆的核苷酸序列被推定。

纯化了32个克隆。在这些克隆中，31个代表在人类结核分枝杆菌中以前没有鉴别过的序列。所鉴别的DNA分子的代表性序列在SEQ ID NO.26-51和100中给出。在这些克隆中，TbH-8和TbH-8-2(SEQ ID No.100)是相同克隆的非邻接DNA序列，TbH-4(SEQ ID No.43)和TbH-4-FWD(SEQ ID No.44)是相同克隆的非邻接序列。此后鉴别为Tb38-1、TbH-4、TbH-8、TbH-9、和TbH-12的抗原的氨基酸序列在SEQ ID NO.89-93中显示。利用以上确定的数据库将这些序列与基因库中的已知序列的比较揭示出，对TbH-4、TbH-8、TbH-9和TbM-3没有明显的同源性，虽然对TbH-9发现了弱的同源性。发现TbH-12同源于以前在副结核分枝杆菌(Acc.No.S28515)中鉴定的34kD抗原蛋白质。发现Tb38-1位于以前在牛型分枝杆菌(Acc.No.U34848)和结核分枝杆菌中鉴别的抗原ESAT-6开放读框上游34个碱基对(Sorensen等，感染免疫学，63：1710-1717，1995)。

将来源于Tb38-1和TbH-9(两者都是从H37Ra文库分离的)的探针用于鉴别H37Rv文库中的克隆。Tb38-1杂交到Tb38-1F2、Tb38-1F3、Tb38-1F5和Tb38-1F6(SEQ ID No.107、108、111、113和114)。SEQID No.107和108是来源于克隆Tb38-1F2的非邻接序列，推定了Tb38-IF2中的两个开放读框；一个相应于Tb37FL(SEQ ID No.109)，第二个(部分序列)可以是Tb38-1的同系物，并称为Tb38-IN(SEQ ID No.110)。Tb38-1F3的推定的氨基酸序列在SEQ ID No.112中给出。TbH-9探针鉴别了H37Rv文库中的三个克隆：TDH-9-FL(SEQ ID No.101)，其可以是TbH-9(R37Ra)的同系物；TbH-9-1(SEQ ID No.103)和TbH-9-4(SEQID No.105)，所有这些都是TbH-9的高度相关序列。这三个克隆的推定的氨基酸序列在SEQ ID No.102、104和106中给出。

实施例4

来源于结核菌素纯化蛋白质衍生物的多肽的纯化和特征确定

按照以下所述从结核菌素纯化蛋白质衍生物(PPD)分离结核分枝杆菌多肽。

按进行某些修改的出版的方法(Seibert，F等，结核菌素纯化蛋白质衍生物。大量制备和分析标准。美国结核病评论44：9-25，1941)制备PPD。

于37℃下在摇瓶中用合成培养基培养结核分枝杆菌Rv菌株6周。然后将含有细菌生长物的瓶子用水蒸汽加热到100℃3小时。用0.22μ滤器无菌过滤培养物，采用3kD截止膜浓缩20倍。用50％硫酸铵溶液沉淀蛋白质一次，用25％硫酸铵溶液沉淀8次。通过反相液相层析(RP-HPLC)分级分离所形成的蛋白质(PPD)，所说的层析采用在Biocad HPLC系统(Perseptive Biosystems，Framingham，MA)中的C18柱(7.8×300mM；Waters，Milford，MA)。用0-100％线性梯度缓冲液(在乙腈中的0.1％TFA)从柱中洗脱组分。流速是10ml/分钟，在214nm和280nm下监测洗脱液。

收集六个组分，干燥，悬浮在PBS中，并在结核分枝杆菌感染豚鼠中就诱导迟发型超敏(DTH)反应分别进行试验。发现一个组分诱导强的DTH反应，接着在微内径Vydac C18柱(Cat.No.218TP5115)上进一步经RP-HPLC分级分离，所说的柱在Perkin Elmer/Applied Biosystems Division172 HPLC型中。以5-100％线性梯度缓冲液(在乙腈中的0.05％TFA)洗脱各组分，流速为80μl/分钟。在215nm监测洗脱液。收集八个组分，在结核分枝杆菌感染豚鼠中试验对DTH的诱导。发现一个组分诱导约16mm硬结的强DTH。其它组分不诱导可检测的DTH。将阳性组分进行SDS-PAGE凝胶电泳，发现其含有12kD分子量的一单一蛋白质带。

如以上的描述，用Perkin Elmer/Applied Biosystems Division Procise492蛋白质测序仪从氨基末端对这一多肽(此后称作DPPD)进行测序，发现其具有SEQ ID NO.124中显示的N端序列。这一序列与以上描述的基因库中的已知序列的比较揭示没有已知的同系物。分离到DPPD的四个溴化氰片段，发现其具有SEQ ID NO.125-128中显示的序列。

实施例5

合成多肽的合成

可以采用由HPTU(O-苯并三唑-N，N，N’，N’-四甲基脲鎓六氟磷酸盐)活化的FMOC化学在Millipore 9050肽合成仪上合成多肽。Gly-Cys-Gly序列可以连接到肽的氨基末端，以提供所述肽的缀合或标记方法。可以采用下列切割混合物从固相支持物上切割肽：三氟乙酸∶乙烷二硫酚∶苯硫基甲烷∶水∶苯酚(40∶1∶2∶2∶3)。在切割两小时后，可以在冷的甲基-叔丁基醚中沉淀所说的肽。然后，肽沉淀可以溶解在含0.1％三氟乙酸(TFA)的水中，并且在经C18反相HPLC纯化之前冷干。在水(含0.1％TFA)中的0-60％乙腈(含0.1％TFA)梯度液可以用于洗脱肽。在纯组分的冷干后，可以采用电喷射质谱测定法和氨基酸分析确定肽的特征。

这一方法用来合成TbM-1肽，该肽含有一个半TbM-1序列的重复单位。TbM-1肽具有序列GCGDRSGGNLDQIRLRRDRSGGNL(SEQ IDNo.63)。

实施例6

代表性抗原在结核病血清学诊断上的用途

这一例子说明几个代表性抗原的诊断学特性。图1和2表示与细菌溶解产物和38kD抗原的反应性比较，代表性抗原与结核分枝杆菌感染和未感染个体血清的反应性。

测定在96-孔平板中完成，所述平板涂布有用碳酸盐涂布缓冲液(pH9.6)稀释成50LL的200ng抗原。在4℃将这些孔涂布过夜(或者在37℃2小时)。然后，除去平板内含物，用200μL PBS/1％BSA封阻各孔2小时。在封阻步骤后，以PBS/0.1％吐温20^TM洗涤五次。向各孔中添加以PBS/0.1％吐温20TM/0.1％BSA 1∶100稀释的50μL血清并在室温下温育30分钟。然后用PBS/0.1％吐温20^TM再洗涤平板五次。

接着用PBS/0.1％吐温20^TM/0.1％BSA 1∶10000稀释酶缀合物(辣根过氧化物酶-蛋白质A，Zymed，San Francisco，CA)，将50μL稀释的缀合物添加到各孔中，并在室温下温育30分钟。温育之后，用PBS/0.1％吐温20^TM洗涤各孔五次。加入100μL四甲基联苯胺过氧化物酶(TMB)底物(Kirkegaard和Perry实验室，Gaithersburg，MD)，不稀释，温育约15分钟。由添加100μL 1N硫酸到各孔中终止反应，用平板在450nm下读数。

图2显示了用实施例3的方法A以来源于结核分枝杆菌阳性和阴性患者的血清分离的两种重组抗原(TbRa3和TbRa9)的ELISA反应性。将这些抗原的反应性与从结核分枝杆菌菌株H37Ra(Difco，底特律，MI)分离的细菌溶解产物的反应性比较。在两种情况下，重组抗原区别阳性和阴性血清。基于从接受体-操纵物曲线获得的截止值，TbRa3检测87个阳性血清中的56个，TbRa9检测165个阳性血清中的111个。

图3说明采用实施例3的方法B分离的代表性抗原的ELISA反应性。将重组抗原TbH4，TbH12，Tb38-1和肽TbM-1(如在实施例4中所描述的)的反应性与Andersen和Hansen，感染免疫学，57：2481-2488，1989所描述的38kD抗原的反应性比较。使用试验的所有多肽再次区别阳性和阴性血清。基于从接受体-操纵物曲线获得的截止值，TbH4检测126个阳性血清中的67个，TbH12检测125个阳性血清中的50个，38-1检测101个阳性血清中的61个，TbM-1肽检测30个阳性血清中的25个。

也测定了四种抗原(TbRa3，TbRa9，TbH4和TbH12)与来源于结核分枝杆菌感染患者(在痰的酸快速染色((Smithwick和David，结核，52：226，1971))中具有不同的反应性)组的血清的反应性，并与结核分枝杆菌溶解产物和38kD抗原的反应性比较。结果示于表2中。

表2

抗原与结核分枝杆菌患者血清的反应性

患者	痰的酸快速染色	ELISA值
		ELISA值						溶解产物 38kD TbRa9 TbH12 TbH4 TbRa3
		Tb01B93I-2	++++	1.853	0.634	0.998	1.022	溶解产物 38kD TbRa9 TbH12 TbH4 TbRa3						1.030	1.314
Tb01B93I19	++++	Tb01B93I-2	++++	1.853	0.634	0.998	1.022	2.657	2.322	0.608	0.837	1.857	2.335	1.030	1.314
Tb01B93I19	++++	Tb01B93I8	+++	2.703	0.527	0.492	0.281	2.657	2.322	0.608	0.837	1.857	2.335	0.501	2.002
Tb01B93I-10	+++	Tb01B93I8	+++	2.703	0.527	0.492	0.281	1.665	1.301	0.685	0.216	0.448	0.458	0.501	2.002
Tb01B93I-10	+++	Tb01B93I-11	+++	2.817	0.697	0.509	0.301	1.665	1.301	0.685	0.216	0.448	0.458	0.173	2.608
Tb01B93I-15	+++	Tb01B93I-11	+++	2.817	0.697	0.509	0.301	1.28	0.283	0.808	0.218	1.537	0.811	0.173	2.608
Tb01B93I-15	+++	Tb01B93I-16	+++	2.908	＞3	0.899	0.441	1.28	0.283	0.808	0.218	1.537	0.811	0.593	1.080
Tb01B93I-25	+++	Tb01B93I-16	+++	2.908	＞3	0.899	0.441	0.395	0.131	0.335	0.211	0.107	0.948	0.593	1.080
Tb01B93I-25	+++	Tb01B93I-87	+++	2.653	2.432	2.282	0.977	0.395	0.131	0.335	0.211	0.107	0.948	1.221	0.857
Tb01B93I-89	+++	Tb01B93I-87	+++	2.653	2.432	2.282	0.977	1.912	2.370	2.436	0.876	0.520	0.952	1.221	0.857
Tb01B93I-89	+++	Tb01B94I-108	+++	1.639	0.341	0.797	0.368	1.912	2.370	2.436	0.876	0.520	0.952	0.654	0.798
Tb01B94I-201	+++	Tb01B94I-108	+++	1.639	0.341	0.797	0.368	1.721	0.419	0.661	0.137	0.064	0.692	0.654	0.798
Tb01B94I-201	+++	Tb01B93I-88	++	1.939	1.269	2.519	1.381	1.721	0.419	0.661	0.137	0.064	0.692	0.214	0.530
Tb01B93I-92	++	Tb01B93I-88	++	1.939	1.269	2.519	1.381	2.355	2.329	2.78	0.685	0.997	2.527	0.214	0.530
Tb01B93I-92	++	Tb01B94I-109	++	0.993	0.620	0.574	0.441	2.355	2.329	2.78	0.685	0.997	2.527	0.5	2.558
Tb01B94I-210	++	Tb01B94I-109	++	0.993	0.620	0.574	0.441	2.777	＞3	0.393	0.367	1.004	1.315	0.5	2.558
Tb01B94I-210	++	Tb01B94I-224	++	2.913	0.476	0.251	1.297	2.777	＞3	0.393	0.367	1.004	1.315	1.990	0.256
Tb01893I-9	+	Tb01B94I-224	++	2.913	0.476	0.251	1.297	2.649	0.278	0.210	0.140	0.181	1.586	1.990	0.256
Tb01893I-9	+	Tb01B93I-14	+	＞3	1.538	0.282	0.291	2.649	0.278	0.210	0.140	0.181	1.586	0.549	2.880
Tb01B93I-21	+	Tb01B93I-14	+	＞3	1.538	0.282	0.291	2.645	0.739	2.499	0.783	0.536	1.770	0.549	2.880
Tb01B93I-21	+	Tb01B93I-22	+	0.714	0.451	2.082	0.285	2.645	0.739	2.499	0.783	0.536	1.770	0.269	1.159
T01B93I-31	+	Tb01B93I-22	+	0.714	0.451	2.082	0.285	0.956	0.490	1.019	0.812	0.176	1.293	0.269	1.159
T01B93I-31	+	Tb01B93I-32	-	2.261	0.786	0.668	0.273	0.956	0.490	1.019	0.812	0.176	1.293	0.535	0.405

患者	痰的酸快速染色	ELISA值
		ELISA值						溶解产物 38kD TbRa9 TbH12 TbH4 TbRa3
		Tb01B93I-52	-	0.658	0.114	0.434	0.330	溶解产物 38kD TbRa9 TbH12 TbH4 TbRa3						0.273	1.140
Tb01B93I-99	-	Tb01B93I-52	-	0.658	0.114	0.434	0.330	2.118	0.584	1.62	0.119	0.977	0.729	0.273	1.140
Tb01B93I-99	-	Tb01B94I-130	-	1.349	0.224	0.86	0.282	2.118	0.584	1.62	0.119	0.977	0.729	0.383	2.146
Tb01B94I-131	-	Tb01B94I-130	-	1.349	0.224	0.86	0.282	0.685	0.324	1.173	0.059	0.118	1.431	0.383	2.146
Tb01B94I-131	-	AT4-0070	正常	0.072	0.043	0.092	0.071	0.685	0.324	1.173	0.059	0.118	1.431	0.040	0.039
AT4-0105	正常	AT4-0070	正常	0.072	0.043	0.092	0.071	0.397	0.121	0.118	0.103	0.078	0.390	0.040	0.039
AT4-0105	正常	3/15/94-1	正常	0.227	0.064	0.098	0.026	0.397	0.121	0.118	0.103	0.078	0.390	0.001	0.228
4/15/93-2	正常	3/15/94-1	正常	0.227	0.064	0.098	0.026	0.114	0.240	0.071	0.034	0.041	0.264	0.001	0.228
4/15/93-2	正常	5/26/94-4	正常	0.089	0.259	0.096	0.046	0.114	0.240	0.071	0.034	0.041	0.264	0.008	0.053
5/26/94-3	正常	5/26/94-4	正常	0.089	0.259	0.096	0.046	0.139	0.093	0.085	0.019	0.067	0.01	0.008	0.053

基于从接受体-操纵物曲线获得的截止值，TbRa3检测27个阳性血清中的23个，TbRa9检测27个中的22个，TbH4检测27个中的18个，TbH12检测27个中的15个。如果组合使用，这四种抗原将具有27中的27个理论敏感性，表明这些抗原在结核分枝杆菌感染的血清学检测中相互补充。此外，几种重组抗原检测采用38kD抗原未被检测到的阳性血清，表明这些抗原可以与38kD抗原互补。

通过如以上描述的ELISA测定了重组抗原TbRall与结核分枝杆菌病人血清(显示出对38kD抗原阴性)以及与PPD阳性和正常供体血清的反应性。结果在图4中显示，这些结果表明，TbRal1(尽管用PPD阳性和正常供体血清为阴性)检测用38kD抗原为阴性的血清。在所试验的13个38kD阴性的血清中，9个用TbRal1为阳性，表明这一抗原可以与38kD抗原阴性血清亚组反应。相反，在38kD阳性血清组(此时TbRall是反应性的)中，TbRall的平均OD 450低于38kD抗原的。数据表明TbRall活性的存在和38kD阳性之间的反向关系。

在间接ELISA中试验抗原TbRa2A，其中首先在室温下使用1∶100稀释的50μL血清30分钟，接着用PBS吐温洗涤，并与1∶10,000稀释的生物素酰化的蛋白质A(Zymed，San Francisco，CA)一起温育30分钟。洗涤后，加入1∶10,000稀释的50μL抗生蛋白链菌素-辣根过氧化物酶(Zymed)，将混合物温育30分钟。在洗涤之后，如以上描述用TMB底物进行测定。TbRa2A与来源于结核分枝杆菌患者和正常供体的血清的反应性示于表3中。TbRa2A与结核分枝杆菌患者之血清的反应性的平均值是0.444(具有0.309的标准偏差)。与正常供体之血清的反应性的平均值是0.109(具有0.029的标准偏差)。38kD阴性血清的试验(图5)也表明TbRa2A抗原能够检测这一类别的血清。

表 3TbRa2A与来源于结核分枝杆菌患者的和来源于正常供体的血清的反应性

血清ID	Status	OD450
血清ID	Status	OD450	Tb85	TB	0.680
Tb86	TB	0.450	Tb85	TB	0.680
Tb86	TB	0.450	Tb87	TB	0.263
Tb88	TB	0.275	Tb87	TB	0.263
Tb88	TB	0.275	Tb89	TB	0.403
Tb91	TB	0.393	Tb89	TB	0.403
Tb91	TB	0.393	Tb92	TB	0.401
Tb93	TB	0.232	Tb92	TB	0.401
Tb93	TB	0.232	Tb94	TB	0.333
Tb95	TB	0.435	Tb94	TB	0.333
Tb95	TB	0.435	Tb96	TB	0.284
Tb97	TB	0.320	Tb96	TB	0.284
Tb97	TB	0.320	Tb99	TB	0.328
Tb100	TB	0.817	Tb99	TB	0.328
Tb100	TB	0.817	Tb101	TB	0.607
Tb102	TB	0.191	Tb101	TB	0.607
Tb102	TB	0.191	Tb103	TB	0.228
Tb107	TB	0.324	Tb103	TB	0.228
Tb107	TB	0.324	Tb109	TB	1.572
Tb112	TB	0.338	Tb109	TB	1.572
Tb112	TB	0.338	DL4-0176	正常	0.036
AT4-0043	正常	0.126	DL4-0176	正常	0.036
AT4-0043	正常	0.126	AT4-0044	正常	0.130
AT4-0052	正常	0.135	AT4-0044	正常	0.130
AT4-0052	正常	0.135	AT4-0053	正常	0.133
AT4-0062	正常	0.128	AT4-0053	正常	0.133
AT4-0062	正常	0.128	AT4-0070	正常	0.088

AT4-0091	正常	0.108
AT4-0091	正常	0.108	AT4-0100	正常	0.106
AT4-0105	正常	0.108	AT4-0100	正常	0.106
AT4-0105	正常	0.108	AT4-0109	正常	0.105

通过如以上描述的ELISA测定重组抗原(g)(SEQ ID No.60)与来源于结核分枝杆菌患者的和来源于正常供体的血清的反应性。图6显示了抗原(g)以四种结核分枝杆菌阳性血清(均是与38kD抗原反应性的)和与四种供体血清的滴定结果。所有四种阳性血清均是与抗原(g)反应性的。

从以上所述可以清楚看到，虽然为说明的目的，本文描述了本发明的特定的实施方案，但是可以进行各种修改而不背离本发明的精神和范围。

序列表

(1)一般信息：

(i)申请人：Corixa公司

(ii)发明名称：用于结核病诊断的化合物和方法

(ii)序列数：132个

(iv)通讯地址：

(A)收信人：SEED和BERRY LLP

(B)街道：6300哥伦比亚中心，第五大街701号

(C)城市：Seattle

(D)州：华盛顿

(E)国家：美国

(F)ZIP：98104-7092

(v)计算机可读形式：

(A)介质类型：软盘

(B)计算机：IBM PC兼容机

(C)操作系统：PC-DOS/MS-DOS

(D)软件：PatentIn Release#1.0，版本#1.30

(vi)当前申请的数据：

(A)申请号：

(B)申请日：1996-8-27

(C)分类号：

(viii)律师/代理人信息：

(A)姓名：Maki，David J.

(B)登记号：31.392

(C)证书号：210121.417PC

(ix)电讯信息：

(A)电话：(206)622-4900

(B)传真：(206)682-6031

(2)SEQ ID NO：1的信息：

(i)序列特征：

(A)长度：766个碱基对

(B)类型：核酸

(C)链型：单链

(D)拓扑结构：线型

(xi)序列描述：SEQ ID NO：1：

CGAGGCACCG GTAGTTTGAA CCAAACGCAC AATCGACGGG CAAACGAACG GAAGAACACA 60

ACCATGAAGA TGGTGAAATC GATCGCCGCA GGTCTGACCG CCGCGGCTGC AATCGGCGCC 120

GCTGCGGCCG GTGTGACTTC GATCATGGCT GGCGGCCCGG TCGTATACCA GATGCAGCCG 180

GTCGTCTTCG GCGCGCCACT GCCGTTGGAC CCGGCATCCG CCCCTGACGT CCCGACCGCC 240

GCCCAGTTGA CCAGCCTGCT CAACAGCCTC GCCGATCCCA ACGTGTCGTT TGCGAACAAG 300

GGCAGTCTGG TCGAGGGCGG CATCGGGGGC ACCGAGGCGC GCATCGCCGA CCACAAGCTG 360

AAGAAGGCCG CCGAGCACGG GGATCTGCCG CTGTCGTTCA GCGTGACGAA CATCCAGCCG 420

GCGGCCGCCG GTTCGGCCAC CGCCGACGTT TCCGTCTCGG GTCCGAAGCT CTCGTCGCCG 480

GTCACGCAGA ACGTCACGTT CGTGAATCAA GGCGGCTGGA TGCTGTCACG CGCATCGGCG 540

ATGGAGTTGC TGCAGGCCGC AGGGNAACTG ATTGGCGGGC CGGNTTCAGC CCGCTGTTCA 600

GCTACGCCGC CCGCCTGGTG ACGCGTCCAT GTCGAACACT CGCGCGTGTA GCACGGTGCG 660

GTNTGCGCAG GGNCGCACGC ACCGCCCGGT GCAAGCCGTC CTCGAGATAG GTGGTGNCTC 720

GNCACCAGNG ANCACCCCCN NNTCGNCNNT TCTCGNTGNT GNATGA 766

(2)SEQ ID NO：2的信息：

(i)序列特征：

(A)长度：752个碱基对

(B)类型：核酸

(C)链型：单链

(D)拓扑结构：线型

(xi)序列描述：SEQ ID NO：2：

ATGCATCACC ATCACCATCA CGATGAAGTC ACGGTAGAGA CGACCTCCGT CTTCCGCGCA 60

GACTTCCTCA GCGAGCTGGA CGCTCCTGCG CAAGCGGGTA CGGAGAGCGC GGTCTCCGGG 120

GTGGAAGGGC TCCCGCCGGG CTCGGCGTTG CTGGTAGTCA AACGAGGCCC CAACGCCGGG 180

TCCCGGTTCC TACTCGACCA AGCCATCACG TCGGCTGGTC GGCATCCCGA CAGCGACATA 240

TTTCTCGACG ACGTGACCGT GAGCCGTCGC CATGCTGAAT TCCGGTTGGA AAACAACGAA 300

TTCAATGTCG TCGATGTCGG GAGTCTCAAC GGCACCTACG TCAACCGCGA GCCCGTGGAT 360

TCGGCGGTGC TGGCGAACGG CGACGAGGTC CAGATCGGCA AGCTCCGGTT GGTGTTCTTG 420

ACCGGACCCA AGCAAGGCGA GGATGACGGG AGTACCGGGG GCCCGTGAGC GCACCCGATA 480

GCCCCGCGCT GGCCGGGATG TCGATCGGGG CGGTCCTCCG ACCTGCTACG ACCGGATTTT 540

CCCTGATGTC CACCATCTCC AAGATTCGAT TCTTGGGAGG CTTGAGGGTC NGGGTGACCC 600

CCCCGCGGGC CTCATTCNGG GGTNTCGGCN GGTTTCACCC CNTACCNACT GCCNCCCGGN 660

TTGCNAATTC NTTCTTCNCT GCCCNNAAAG GGACCNTTAN CTTGCCGCTN GAAANGGTNA 720

TCCNGGGCCC NTCCTNGAAN CCCCNTCCCC CT 752

(2)SEQ ID NO：3的信息：

(i)序列特征：

(A)长度：813个碱基对

(B)类型：核酸

(C)链型：单链

(D)拓扑结构：线型

(xi)序列描述：SEQ ID NO：3：

CATATGCATC ACCATCACCA TCACACTTCT AACCGCCCAG CGCGTCGGGG GCGTCGAGCA 60

CCACGCGACA CCGGGCCCGA TCGATCTGCT AGCTTGAGTC TGGTCAGGCA TCGTCGTCAG 120

CAGCGCGATG CCCTATGTTT GTCGTCGACT CAGATATCGC GGCAATCCAA TCTCCCGCCT 180

GCGGCCGGCG GTGCTGCAAA CTACTCCCGG AGGAATTTCG ACGTGCGCAT CAAGATCTTC 240

ATGCTGGTCA CGGCTGTCGT TTTGCTCTGT TGTTCGGGTG TGGCCACGGC CGCGCCCAAG 300

ACCTACTGCG AGGAGTTGAA AGGCACCGAT ACCGGCCAGG CGTGCCAGAT TCAAATGTCC 360

GACCCGGCCT ACAACATCAA CATCAGCCTG CCCAGTTACT ACCCCGACCA GAAGTCGCTG 420

GAAAATTACA TCGCCCAGAC GCGCGACAAG TTCCTCAGCG CGGCCACATC GTCCACTCCA 480

CGCGAAGCCC CCTACGAATT GAATATCACC TCGGCCACAT ACCAGTCCGC GATACCGCCG 540

CGTGGTACGC AGGCCGTGGT GCTCAMGGTC TACCACAACG CCGGCGGCAC GCACCCAACG 600

ACCACGTACA AGGCCTTCGA TTGGGACCAG GCCTATCGCA AGCCAATCAC CTATGACACG 660

CTGTGGCAGG CTGACACCGA TCCGCTGCCA GTCGTCTTCC CCATTGTTGC AAGGTGAACT 720

GAGCAACGCA GACCGGGACA ACWGGTATCG ATAGCCGCCN AATGCCGGCT TGGAACCCNG 780

TGAAATTATC ACAACTTCGC AGTCACNAAA NAA 813

(2)SEQ ID NO：4的信息：

(i)序列特征：

(A)长度：447个碱基对

(B)类型：核酸

(C)链型：单链

(D)拓扑结构：线型

(xi)序列描述：SEQ ID NO：4：

CGGTATGAAC ACGGCCGCGT CCGATAACTT CCAGCTGTCC CAGGGTGGGC AGGGATTCGC 60

CATTCCGATC GGGCAGGCGA TGGCGATCGC GGGCCAGATC CGATCGGGTG GGGGGTCACC 120

CACCGTTCAT ATCGGGCCTA CCGCCTTCCT CGGCTTGGGT GTTGTCGACA ACAACGGCAA 180

CGGCGCACGA GTCCAACGCG TGGTCGGGAG CGCTCCGGCG GCAAGTCTCG GCATCTCCAC 240

CGGCGACGTG ATCACCGCGG TCGACGGCGC TCCGATCAAC TCGGCCACCG CGATGGCGGA 300

CGCGCTTAAC GGGCATCATC CCGGTGACGT CATCTCGGTG AACTGGCAAA CCAAGTCGGG 360

CGGCACGCGT ACAGGGAACG TGACATTGGC CGAGGGACCC CCGGCCTGAT TTCGTCGYGG 420

ATACCACCCG CCGGCCGGCC AATTGGA 447

(2)SEQ ID NO：5的信息：

(i)序列特征：

(A)长度：604个碱基对

(B)类型：核酸

(C)链型：单链

(D)拓扑结构：线型

(xi)序列描述：SEQ ID NO：5：

GTCCCACTGC GGTCGCCGAG TATGTCGCCC AGCAAATGTC TGGCAGCCGC CCAACGGAAT 60

CCGGTGATCC GACGTCGCAG GTTGTCGAAC CCGCCGCCGC GGAAGTATCG GTCCATGCCT 120

AGCCCGGCGA CGGCGAGCGC CGGAATGGCG CGAGTGAGGA GGCGGGCAAT TTGGCGGGGC 180

CCGGCGACGG NGAGCGCCGG AATGGCGCGA GTGAGGAGGT GGNCAGTCAT GCCCAGNGTG 240

ATCCAATCAA CCTGNATTCG GNCTGNGGGN CCATTTGACA ATCGAGGTAG TGAGCGCAAA 300

TGAATGATGG AAAACGGGNG GNGACGTCCG NTGTTCTGGT GGTGNTAGGT GNCTGNCTGG 360

NGTNGNGGNT ATCAGGATGT TCTTCGNCGA AANCTGATGN CGAGGAACAG GGTGTNCCCG 420

NNANNCCNAN GGNGTCCNAN CCCNNNNTCC TCGNCGANAT CANANAGNCG NTTGATGNGA 480

NAAAAGGGTG GANCAGNNNN AANTNGNGGN CCNAANAANC NNNANNGNNG NNAGNTNGNT 540

NNNTNTTNNC ANNNNNNNTG NNGNNGNNCN NNNCAANCNN NTNNNNGNAA NNGGNTTNTT 600

NAAT 604

(2)SEQ ID NO：6的信息：

(i)序列特征：

(A)长度：633个碱基对

(B)类型：核酸

(C)链型：单链

(D)拓扑结构：线型

(xi)序列描述：SEQ ID NO：6：

TTGCANGTCG AACCACCTCA CTAAAGGGAA CAAAAGCTNG AGCTCCACCG CGGTGGCGGC 60

CGCTCTAGAA CTAGTGKATM YYYCKGGCTG CAGSAATYCG GYACGAGCAT TAGGACAGTC 120

TAACGGTCCT GTTACGGTGA TCGAATGACC GACGACATCC TGCTGATCGA CACCGACGAA 180

CGGGTGCGAA CCCTCACCCT CAACCGGCCG CAGTCCCGYA ACGCGCTCTC GGCGGCGCTA 240

CGGGATCGGT TTTTCGCGGY GTTGGYCGAC GCCGAGGYCG ACGACGACAT CGACGTCGTC 300

ATCCTCACCG GYGCCGATCC GGTGTTCTGC GCCGGACTGG ACCTCAAGGT AGCTGGCCGG 360

GCAGACCGCG CTGCCGGACA TCTCACCGCG GTGGGCGGCC ATGACCAAGC CGGTGATCGG 420

CGCGATCAAC GGCGCCGCGG TCACCGGCGG GCTCGAACTG GCGCTGTACT GCGACATCCT 480

GATCGCCTCC GAGCACGCCC GCTTCGNCGA CACCCACGCC CGGGTGGGGC TGCTGCCCAC 540

CTGGGGACTC AGTGTGTGCT TGCCGCAAAA GGTCGGCATC GGNCTGGGCC GGTGGATGAG 600

CCTGACCGGC GACTACCTGT CCGTGACCGA CGC 633

(2)SEQ ID NO：7的信息：

(i)序列特征：

(A)长度：1362个碱基对

(B)类型：核酸

(C)链型：单链

(D)拓扑结构：线型

(xi)序列描述：SEQ ID NO：7：

CGACGACGAC GGCGCCGGAG AGCGGGCGCG AACGGCGATC GACGCGGCCC TGGCCAGAGT 60

CGGCACCACC CAGGAGGGAG TCGAATCATG AAATTTGTCA ACCATATTGA GCCCGTCGCG 120

CCCCGCCGAG CCGGCGGCGC GGTCGCCGAG GTCTATGCCG AGGCCCGCCG CGAGTTCGGC 180

CGGCTGCCCG AGCCGCTCGC CATGCTGTCC CCGGACGAGG GACTGCTCAC CGCCGGCTGG 240

GCGACGTTGC GCGAGACACT GCTGGTGGGC CAGGTGCCGC GTGGCCGCAA GGAAGCCGTC 300

GCCGCCGCCG TCGCGGCCAG CCTGCGCTGC CCCTGGTGCG TCGACGCACA CACCACCATG 360

CTGTACGCGG CAGGCCAAAC CGACACCGCC GCGGCGATCT TGGCCGGCAC AGCACCTGCC 420

GCCGGTGACC CGAACGCGCC GTATGTGGCG TGGGCGGCAG GAACCGGGAC ACCGGCGGGA 480

CCGCCGGCAC CGTTCGGCCC GGATGTCGCC GCCGAATACC TGGGCACCGC GGTGCAATTC 540

CACTTCATCG CACGCCTGGT CCTGGTGCTG CTGGACGAAA CCTTCCTGCC GGGGGGCCCG 600

CGCGCCCAAC AGCTCATGCG CCGCGCCGGT GGACTGGTGT TCGCCCGCAA GGTGCGCGCG 660

GAGCATCGGC CGGGCCGCTC CACCCGCCGG CTCGAGCCGC GAACGCTGCC CGACGATCTG 720

GCATGGGCAA CACCGTCCGA GCCCATAGCA ACCGCGTTCG CCGCGCTCAG CCACCACCTG 780

GACACCGCGC CGCACCTGCC GCCACCGACT CGTCAGGTGG TCAGGCGGGT CGTGGGGTCG 840

TGGCACGGCG AGCCAATGCC GATGAGCAGT CGCTGGACGA ACGAGCACAC CGCCGAGCTG 900

CCCGCCGACC TGCACGCGCC CACCCGTCTT GCCCTGCTGA CCGGCCTGGC CCCGCATCAG 960

GTGACCGACG ACGACGTCGC CGCGGCCCGA TCCCTGCTCG ACACCGATGC GGCGCTGGTT 1020

GGCGCCCTGG CCTGGGCCGC CTTCACCGCC GCGCGGCGCA TCGGCACCTG GATCGGCGCC 1080

GCCGCCGAGG GCCAGGTGTC GCGGCAAAAC CCGACTGGGT GAGTGTGCGC GCCCTGTCGG 1140

TAGGGTGTCA TCGCTGGCCC GAGGGATCTC GCGGCGGCGA ACGGAGGTGG CGACACAGGT 1200

GGAAGCTGCG CCCACTGGCT TGCGCCCCAA CGCCGTCGTG GGCGTTCGGT TGGCCGCACT 1260

GGCCGATCAG GTCGGCGCCG GCCCTTGGCC GAAGGTCCAG CTCAACGTGC CGTCACCGAA 1320

GGACCGGACG GTCACCGGGG GTCACCCTGC GCGCCCAAGG AA 1362

(2)SEQ ID NO：8的信息：

(i)序列特征：

(A)长度：1458个碱基对

(B)类型：核酸

(C)链型：单链

(D)拓扑结构：线型

(xi)序列描述：SEQ ID NO：8：

GCGACGACCC CGATATGCCG GGCACCGTAG CGAAAGCCGT CGCCGACGCA CTCGGGCGCG 60

GTATCGCTCC CGTTGAGGAC ATTCAGGACT GCGTGGAGGC CCGGCTGGGG GAAGCCGGTC 120

TGGATGACGT GGCCCGTGTT TACATCATCT ACCGGCAGCG GCGCGCCGAG CTGCGGACGG 180

CTAAGGCCTT GCTCGGCGTG CGGGACGAGT TAAAGCTGAG CTTGGCGGCC GTGACGGTAC 240

TGCGCGAGCG CTATCTGCTG CACGACGAGC AGGGCCGGCC GGCCGAGTCG ACCGGCGAGC 300

TGATGGACCG ATCGGCGCGC TGTGTCGCGG CGGCCGAGGA CCAGTATGAG CCGGGCTCGT 360

CGAGGCGGTG GGCCGAGCGG TTCGCCACGC TATTACGCAA CCTGGAATTC CTGCCGAATT 420

CGCCCACGTT GATGAACTCT GGCACCGACC TGGGACTGCT CGCCGGCTGT TTTGTTCTGC 480

CGATTGAGGA TTCGCTGCAA TCGATCTTTG CGACGCTGGG ACAGGCCGCC GAGCTGCAGC 540

GGGCTGGAGG CGGCACCGGA TATGCGTTCA GCCACCTGCG ACCCGCCGGG GATCGGGTGG 600

CCTCCACGGG CGGCACGGCC AGCGGACCGG TGTCGTTTCT ACGGCTGTAT GACAGTGCCG 660

CGGGTGTGGT CTCCATGGGC GGTCGCCGGC GTGGCGCCTG TATGGCTGTG CTTGATGTGT 720

CGCACCCGGA TATCTGTGAT TTCGTCACCG CCAAGGCCGA ATCCCCCAGC GAGCTCCCGC 780

ATTTCAACCT ATCGGTTGGT GTGACCGACG CGTTCCTGCG GGCCGTCGAA CGCAACGGCC 840

TACACCGGCT GGTCAATCCG CGAACCGGCA AGATCGTCGC GCGGATGCCC GCCGCCGAGC 900

TGTTCGACGC CATCTGCAAA GCCGCGCACG CCGGTGGCGA TCCCGGGCTG GTGTTTCTCG 960

ACACGATCAA TAGGGCAAAC CCGGTGCCGG GGAGAGGCCG CATCGAGGCG ACCAACCCGT 1020

GCGGGGAGGT CCCACTGCTG CCTTACGAGT CATGTAATCT CGGCTCGATC AACCTCGCCC 1080

GGATGCTCGC CGACGGTCGC GTCGACTGGG ACCGGCTCGA GGAGGTCGCC GGTGTGGCGG 1140

TGCGGTTCCT TGATGACGTC ATCGATGTCA GCCGCTACCC CTTCCCCGAA CTGGGTGAGG 1200

CGGCCCGCGC CACCCGCAAG ATCGGGCTGG GAGTCATGGG TTTGGCGGAA CTGCTTGCCG 1260

CACTGGGTAT TCCGTACGAC AGTGAAGAAG CCGTGCGGTT AGCCACCCGG CTCATGCGTC 1320

GCATACAGCA GGCGGCGCAC ACGGCATCGC GGAGGCTGGC CGAAGAGCGG GGCGCATTCC 1380

CGGCGTTCAC CGATAGCCGG TTCGCGCGGT CGGGCCCGAG GCGCAACGCA CAGGTCACCT 1440

CCGTCGCTCC GACGGGCA 1458

(2)SEQ ID NO：9的信息：

(i)序列特征：

(A)长度：862个碱基对

(B)类型：核酸

(C)链型：单链

(D)拓扑结构：线型

(xi)序列描述：SEQ ID NO：9：

ACGGTGTAAT CGTGCTGGAT CTGGAACCGC GTGGCCCGCT ACCTACCGAG ATCTACTGGC 60

GGCGCAGGGG GCTGGCCCTG GGCATCGCGG TCGTCGTAGT CGGGATCGCG GTGGCCATCG 120

TCATCGCCTT CGTCGACAGC AGCGCCGGTG CCAAACCGGT CAGCGCCGAC AAGCCGGCCT 180

CCGCCCAGAG CCATCCGGGC TCGCCGGCAC CCCAAGCACC CCAGCCGGCC GGGCAAACCG 240

AAGGTAACGC CGCCGCGGCC CCGCCGCAGG GCCAAAACCC CGAGACACCC ACGCCCACCG 300

CCGCGGTGCA GCCGCCGCCG GTGCTCAAGG AAGGGGACGA TTGCCCCGAT TCGACGCTGG 360

TGGTGGTCAC CAACATCGGC CTGGTGTCCT GTAAACGCGA CGTTGGGGCC GCGGTGTTGG 480

CCGCCTACGT TTACTCGCTG GACAACAAGC GGTTGTGGTC CAACCTGGAC TGCGCGCCCT 540

CGAATGAGAC GCTGGTCAAG ACGTTTTCCC CCGGTGAGCA GGTAACGACC GCGGTGACCT 600

GGACCGGGAT GGGATCGGCG CCGCGCTGCC CATTGCCGCG GCCGGCGATC GGGCCGGGCA 660

CCTACAATCT CGTGGTACAA CTGGGCAATC TGCGCTCGCT GCCGGTTCCG TTCATCCTGA 720

ATCAGCCGCC GCCGCCGCCC GGGCCGGTAC CCGCTCCGGG TCCAGCGCAG GCGCCTCCGC 780

CGGAGTCTCC CGCGCAAGGC GGATAATTAT TGATCGCTGA TGGTCGATTC CGCCAGCTGT 840

GACAACCCCT CGCCTCGTGC CG 862

(2)SEQ ID NO：10的信息：

(i)序列特征：

(A)长度：622个碱基对

(B)类型：核酸

(C)链型：单链

(D)拓扑结构：线型

(xi)序列描述：SEQ ID NO：10：

TTGATCAGCA CCGGCAAGGC GTCACATGCC TCCCTGGGTG TGCAGGTGAC CAATGACAAA 60

GACACCCCGG GCGCCAAGAT CGTCGAAGTA GTGGCCGGTG GTGCTGCCGC GAACGCTGGA 120

GTGCCGAAGG GCGTCGTTGT CACCAAGGTC GACGACCGCC CGATCAACAG CGCGGACGCG 180

TTGGTTGCCG CCGTGCGGTC CAAAGCGCCG GGCGCCACGG TGGCGCTAAC CTTTCAGGAT 240

CCCTCGGGCG GTAGCCGCAC AGTGCAAGTC ACCCTCGGCA AGGCGGAGCA GTGATGAAGG 300

TCGCCGCGCA GTGTTCAAAG CTCGGATATA CGGTGGCACC CATGGAACAG CGTGCGGAGT 360

TGGTGGTTGG CCGGGCACTT GTCGTCGTCG TTGACGATCG CACGGCGCAC GGCGATGAAG 420

ACCACAGCGG GCCGCTTGTC ACCGAGCTGC TCACCGAGGC CGGGTTTGTT GTCGACGGCG 480

TGGTGGCGGT GTCGGCCGAC GAGGTCGAGA TCCGAAATGC GCTGAACACA GCGGTGATCG 540

GCGGGGTGGA CCTGGTGGTG TCGGTCGGCG GGACCGGNGT GACGNCTCGC GATGTCACCC 600

CGGAAGCCAC CCGNGACATT CT 622

(2)SEQ ID NO：11的信息：

(i)序列特征：

(A)长度：1200个碱基对

(B)类型：核酸

(C)链型：单链

(D)拓扑结构：线型

(xi)序列描述：SEQ ID NO：11：

GGCGCAGCGG TAAGCCTGTT GGCCGCCGGC ACACTGGTGT TGACAGCATG CGGCGGTGGC 60

ACCAACAGCT CGTCGTCAGG CGCAGGCGGA ACGTCTGGGT CGGTGCACTG CGGCGGCAAG 120

AAGGAGCTCC ACTCCAGCGG CTCGACCGCA CAAGAAAATG CCATGGAGCA GTTCGTCTAT 180

GCCTACGTGC GATCGTGCCC GGGCTACACG TTGGACTACA ACGCCAACGG GTCCGGTGCC 240

GGGGTGACCC AGTTTCTCAA CAACGAAACC GATTTCGCCG GCTCGGATGT CCCGTTGAAT 300

CCGTCGACCG GTCAACCTGA CCGGTCGGCG GAGCGGTGCG GTTCCCCGGC ATGGGACCTG 360

CCGACGGTGT TCGGCCCGAT CGCGATCACC TACAATATCA AGGGCGTGAG CACGCTGAAT 420

CTTGACGGAC CCACTACCGC CAAGATTTTC AACGGCACCA TCACCGTGTG GAATGATCCA 480

CAGATCCAAG CCCTCAACTC CGGCACCGAC CTGCCGCCAA CACCGATTAG CGTTATCTTC 540

CGCAGCGACA AGTCCGGTAC GTCGGACAAC TTCCAGAAAT ACCTCGACGG TGTATCCAAC 600

GGGGCGTGGG GCAAAGGCGC CAGCGAAACG TTCAGCGGGG GCGTCGGCGT CGGCGCCAGC 660

GGGAACAACG GAACGTCGGC CCTACTGCAG ACGACCGACG GGTCGATCAC CTACAACGAG 720

TGGTCGTTTG CGGTGGGTAA GCAGTTGAAC ATGGCCCAGA TCATCACGTC GGCGGGTCCG 780

GATCCAGTGG CGATCACCAC CGAGTCGGTC GGTAAGACAA TCGCCGGGGC CAAGATCATG 840

GGACAAGGCA ACGACCTGGT ATTGGACACG TCGTCGTTCT ACAGACCCAC CCAGCCTGGC 900

TCTTACCCGA TCGTGCTGGC GACCTATGAG ATCGTCTGCT CGAAATACCC GGATGCGACG 960

ACCGGTACTG CGGTAAGGGC GTTTATGCAA GCCGCGATTG GTCCAGGCCA AGAAGGCCTG 1020

GACCAATACG GCTCCATTCC GTTGCCCAAA TCGTTCCAAG CAAAATTGGC GGCCGCGGTG 1080

AATGCTATTT CTTGACCTAG TGAAGGGAAT TCGACGGTGA GCGATGCCGT TCCGCAGGTA 1140

GGGTCGCAAT TTGGGCCGTA TCAGCTATTG CGGCTGCTGG GCCGAGGCGG GATGGGCGAG 1200

(2)SEQ ID NO：12的信息：

(i)序列特征：

(A)长度：1155个碱基对

(B)类型：核酸

(C)链型：单链

(D)拓扑结构：线型

(xi)序列描述：SEQ ID NO：12：

GCAAGCAGCT GCAGGTCGTG CTGTTCGACG AACTGGGCAT GCCGAAGACC AAACGCACCA 60

AGACCGGCTA CACCACGGAT GCCGACGCGC TGCAGTCGTT GTTCGACAAG ACCGGGCATC 120

CGTTTCTGCA ACATCTGCTC GCCCACCGCG ACGTCACCCG GCTCAAGGTC ACCGTCGACG 180

GGTTGCTCCA AGCGGTGGCC GCCGACGGCC GCATCCACAC CACGTTCAAC CAGACGATCG 240

CCGCGACCGG CCGGCTCTCC TCGACCGAAC CCAACCTGCA GAACATCCCG ATCCGCACCG 300

ACGCGGGCCG GCGGATCCGG GACGCGTTCG TGGTCGGGGA CGGTTACGCC GAGTTGATGA 360

CGGCCGACTA CAGCCAGATC GAGATGCGGA TCATGGGGCA CCTGTCCGGG GACGAGGGCC 420

TCATCGAGGC GTTCAACACC GGGGAGGACC TGTATTCGTT CGTCGCGTCC CGGGTGTTCG 480

GTGTGCCCAT CGACGAGGTC ACCGGCGAGT TGCGGCGCCG GGTCAAGGCG ATGTCCTACG 540

GGCTGGTTTA CGGGTTGAGC GCCTACGGCC TGTCGCAGCA GTTGAAAATC TCCACCGAGG 600

AAGCCAACGA GCAGATGGAC GCGTATTTCG CCCGATTCGG CGGGGTGCGC GACTACCTGC 660

GCGCCGTAGT CGAGCGGGCC CGCAAGGACG GCTACACCTC GACGGTGCTG GGCCGTCGCC 720

GCTACCTGCC CGAGCTGGAC AGCAGCAACC GTCAAGTGCG GGAGGCCGCC GAGCGGGCGG 780

CGCTGAACGC GCCGATCCAG GGCAGCGCGG CCGACATCAT CAAGGTGGCC ATGATCCAGG 840

TCGACAAGGC GCTCAACGAG GCACAGCTGG CGTCGCGCAT GCTGCTGCAG GTCCACGACG 900

AGCTGCTGTT CGAAATCGCC CCCGGTGAAC GCGAGCGGGT CGAGGCCCTG GTGCGCGACA 960

AGATGGGCGG CGCTTACCCG CTCGACGTCC CGCTGGAGGT GTCGGTGGGC TACGGCCGCA 1020

GCTGGGACGC GGCGGCGCAC TGAGTGCCGA GCGTGCATCT GGGGCGGGAA TTCGGCGATT 1080

TTTCCGCCCT GAGTTCACGC TCGGCGCAAT CGGGACCGAG TTTGTCCAGC GTGTACCCGT 1140

CGAGTAGCCT CGTCA 1155

(2)SEQ ID NO：13的信息：

(i)序列特征：

(A)长度：1771个碱基对

(B)类型：核酸

(C)链型：单链

(D)拓扑结构：线型

(xi)序列描述：SEQ ID NO：13：

GAGCGCCGTC TGGTGTTTGA ACGGTTTTAC CGGTCGGCAT CGGCACGGGC GTTGCCGGGT 60

TCGGGCCTCG GGTTGGCGAT CGTCAAACAG GTGGTGCTCA ACCACGGCGG ATTGCTGCGC 120

ATCGAAGACA CCGACCCAGG CGGCCAGCCC CCTGGAACGT CGATTTACGT GCTGCTCCCC 180

GGCCGTCGGA TGCCGATTCC GCAGCTTCCC GGTGCGACGG CTGGCGCTCG GAGCACGGAC 240

ATCGAGAACT CTCGGGGTTC GGCGAACGTT ATCTCAGTGG AATCTCAGTC CACGCGCGCA 300

ACCTAGTTGT GCAGTTACTG TTGAAAGCCA CACCCATGCC AGTCCACGCA TGGCCAAGTT 360

GGCCCGAGTA GTGGGCCTAG TACAGGAAGA GCAACCTAGC GACATGACGA ATCACCCACG 420

GTATTCGCCA CCGCCGCAGC AGCCGGGAAC CCCAGGTTAT GCTCAGGGGC AGCAGCAAAC 480

GTACAGCCAG CAGTTCGACT GGCGTTACCC ACCGTCCCCG CCCCCGCAGC CAACCCAGTA 540

CCGTCAACCC TACGAGGCGT TGGGTGGTAC CCGGCCGGGT CTGATACCTG GCGTGATTCC 600

GACCATGACG CCCCCTCCTG GGATGGTTCG CCAACGCCCT CGTGCAGGCA TGTTGGCCAT 660

CGGCGCGGTG ACGATAGCGG TGGTGTCCGC CGGCATCGGC GGCGCGGCCG CATCCCTGGT 720

CGGGTTCAAC CGGGCACCCG CCGGCCCCAG CGGCGGCCCA GTGGCTGCCA GCGCGGCGCC 780

AAGCATCCCC GCAGCAAACA TGCCGCCGGG GTCGGTCGAA CAGGTGGCGG CCAAGGTGGT 840

GCCCAGTGTC GTCATGTTGG AAACCGATCT GGGCCGCCAG TCGGAGGAGG GCTCCGGCAT 900

CATTCTGTCT GCCGAGGGGC TGATCTTGAC CAACAACCAC GTGATCGCGG CGGCCGCCAA 960

GCCTCCCCTG GGCAGTCCGC CGCCGAAAAC GACGGTAACC TTCTCTGACG GGCGGACCGC 1020

ACCCTTCACG GTGGTGGGGG CTGACCCCAC CAGTGATATC GCCGTCGTCC GTGTTCAGGG 1080

CGTCTCCGGG CTCACCCCGA TCTCCCTGGG TTCCTCCTCG GACCTGAGGG TCGGTCAGCC 1140

GGTGCTGGCG ATCGGGTCGC CGCTCGGTTT GGAGGGCACC GTGACCACGG GGATCGTCAG 1200

CGCTCTCAAC CGTCCAGTGT CGACGACCGG CGAGGCCGGC AACCAGAACA CCGTGCTGGA 1260

CGCCATTCAG ACCGACGCCG CGATCAACCC CGGTAACTCC GGGGGCGCGC TGGTGAACAT 1320

GAACGCTCAA CTCGTCGGAG TCAACTCGGC CATTGCCACG CTGGGCGCGG ACTCAGCCGA 1380

TGCGCAGAGC GGCTCGATCG GTCTCGGTTT TGCGATTCCA GTCGACCAGG CCAAGCGCAT 1440

CGCCGACGAG TTGATCAGCA CCGGCAAGGC GTCACATGCC TCCCTGGGTG TGCAGGTGAC 1500

CAATGACAAA GACACCCCGG GCGCCAAGAT CGTCGAAGTA GTGGCCGGTG GTGCTGCCGC 1560

GAACGCTGGA GTGCCGAAGG GCGTCGTTGT CACCAAGGTC GACGACCGCC CGATCAACAG 1620

CGCGGACGCG TTGGTTGCCG CCGTGCGGTC CAAAGCGCCG GGCGCCACGG TGGCGCTAAC 1680

CTTTCAGGAT CCCTCGGGCG GTAGCCGCAC AGTGCAAGTC ACCCTCGGCA AGGCGGAGCA 1740

GTGATGAAGG TCGCCGCGCA GTGTTCAAAG C 1771

(2)SEQ ID NO：14的信息：

(i)序列特征：

(A)长度：1058个碱基对

(B)类型：核酸

(C)链型：单链

(D)拓扑结构：线型

(xi)序列描述：SEQ ID NO：14：

CTCCACCGCG GTGGCGGCCG CTCTAGAACT AGTGGATCCC CCGGGCTGCA GGAATTCGGC 60

ACGAGGATCC GACGTCGCAG GTTGTCGAAC CCGCCGCCGC GGAAGTATCG GTCCATGCCT 120

AGCCCGGCGA CGGCGAGCGC CGGAATGGCG CGAGTGAGGA GGCGGGCAAT TTGGCGGGGC 180

CCGGCGACGG CGAGCGCCGG AATGGCGCGA GTGAGGAGGC GGGCAGTCAT GCCCAGCGTG 240

ATCCAATCAA CCTGCATTCG GCCTGCGGGC CCATTTGACA ATCGAGGTAG TGAGCGCAAA 300

TGAATGATGG AAAACGGGCG GTGACGTCCG CTGTTCTGGT GGTGCTAGGT GCCTGCCTGG 360

CGTTGTGGCT ATCAGGATGT TCTTCGCCGA AACCTGATGC CGAGGAACAG GGTGTTCCCG 420

TGAGCCCGAC GGCGTCCGAC CCCGCGCTCC TCGCCGAGAT CAGGCAGTCG CTTGATGCGA 480

CAAAAGGGTT GACCAGCGTG CACGTAGCGG TCCGAACAAC CGGGAAAGTC GACAGCTTGC 540

TGGGTATTAC CAGTGCCGAT GTCGACGTCC GGGCCAATCC GCTCGCGGCA AAGGGCGTAT 600

GCACCTACAA CGACGAGCAG GGTGTCCCGT TTCGGGTACA AGGCGACAAC ATCTCGGTGA 660

AACTGTTCGA CGACTGGAGC AATCTCGGCT CGATTTCTGA ACTGTCAACT TCACGCGTGC 720

TCGATCCTGC CGCTGGGGTG ACGCAGCTGC TGTCCGGTGT CACGAACCTC CAAGCGCAAG 780

GTACCGAAGT GATAGACGGA ATTTCGACCA CCAAAATCAC CGGGACCATC CCCGCGAGCT 840

CTGTCAAGAT GCTTGATCCT GGCGCCAAGA GTGCAAGGCC GGCGACCGTG TGGATTGCCC 900

AGGACGGCTC GCACCACCTC GTCCGAGCGA GCATCGACCT CGGATCCGGG TCGATTCAGC 960

TCACGCAGTC GAAATGGAAC GAACCCGTCA ACGTCGACTA GGCCGAAGTT GCGTCGACGC 1020

GTTGNTCGAA ACGCCCTTGT GAACGGTGTC AACGGNAC 1058

(2)SEQ ID NO：15的信息：

(i)序列特征：

(A)长度：542个碱基对

(B)类型：核酸

(C)链型：单链

(D)拓扑结构：线型

(xi)序列描述：SEQ ID NO：15：

GAATTCGGCA CGAGAGGTGA TCGACATCAT CGGGACCAGC CCCACATCCT GGGAACAGGC 60

GGCGGCGGAG GCGGTCCAGC GGGCGCGGGA TAGCGTCGAT GACATCCGCG TCGCTCGGGT 120

CATTGAGCAG GACATGGCCG TGGACAGCGC CGGCAAGATC ACCTACCGCA TCAAGCTCGA 180

AGTGTCGTTC AAGATGAGGC CGGCGCAACC GCGCTAGCAC GGGCCGGCGA GCAAGACGCA 240

AAATCGCACG GTTTGCGGTT GATTCGTGCG ATTTTGTGTC TGCTCGCCGA GGCCTACCAG 300

GCGCGGCCCA GGTCCGCGTG CTGCCGTATC CAGGCGTGCA TCGCGATTCC GGCGGCCACG 360

CCGGAGTTAA TGCTTCGCGT CGACCCGAAC TGGGCGATCC GCCGGNGAGC TGATCGATGA 420

CCGTGGCCAG CCCGTCGATG CCCGAGTTGC CCGAGGAAAC GTGCTGCCAG GCCGGTAGGA 480

AGCGTCCGTA GGCGGCGGTG CTGACCGGCT CTGCCTGCGC CCTCAGTGCG GCCAGCGAGC 540

GG 542

(2)SEQ ID NO：16的信息：

(i)序列特征：

(A)长度：913个碱基对

(B)类型：核酸

(C)链型：单链

(D)拓扑结构：线型

(xi)序列描述：SEQ ID NO：16：

CGGTGCCGCC CGCGCCTCCG TTGCCCCCAT TGCCGCCGTC GCCGATCAGC TGCGCATCGC 60

CACCATCACC GCCTTTGCCG CCGGCACCGC CGGTGGCGCC GGGGCCGCCG ATGCCACCGC 120

TTGACCCTGG CCGCCGGCGC CGCCATTGCC ATACAGCACC CCGCCGGGGG CACCGTTACC 180

GCCGTCGCCA CCGTCGCCGC CGCTGCCGTT TCAGGCCGGG GAGGCCGAAT GAACCGCCGC 240

CAAGCCCGCC GCCGGCACCG TTGCCGCCTT TTCCGCCCGC CCCGCCGGCG CCGCCAATTG 300

CCGAACAGCC AMGCACCGTT GCCGCCAGCC CCGCCGCCGT TAACGGCGCT GCCGGGCGCC 360

GCCGCCGGAC CCGCCATTAC CGCCGTTCCC GTTCGGTGCC CCGCCGTTAC CGGCGCCGCC 420

GTTTGCCGCC AATATTCGGC GGGCACCGCC AGACCCGCCG GGGCCACCAT TGCCGCCGGG 480

CACCGAAACA ACAGCCCAAC GGTGCCGCCG GCCCCGCCGT TTGCCGCCAT CACCGGCCAT 540

TCACCGCCAG CACCGCCGTT AATGTTTATG AACCCGGTAC CGCCAGCGCG GCCCCTATTG 600

CCGGGCGCCG GAGNGCGTGC CCGCCGGCGC CGCCAACGCC CAAAAGCCCG GGGTTGCCAC 660

CGGCCCCGCC GGACCCACCG GTCCCGCCGA TCCCCCCGTT GCCGCCGGTG CCGCCGCCAT 720

TGGTGCTGCT GAAGCCGTTA GCGCCGGTTC CGCSGGTTCC GGCGGTGGCG CCNTGGCCGC 780

CGGCCCCGCC GTTGCCGTAC AGCCACCCCC CGGTGGCGCC GTTGCCGCCA TTGCCGCCAT 840

TGCCGCCGTT GCCGCCATTG CCGCCGTTCC CGCCGCCACC GCCGGNTTGG CCGCCGGCGC 900

CGCCGGCGGC CGC 913

(2)SEQ ID NO：17的信息：

(i)序列特征：

(A)长度：1872个碱基对

(B)类型：核酸

(C)链型：单链

(D)拓扑结构：线型

(xi)序列描述：SEQ ID NO：17：

GACTACGTTG GTGTAGAAAA ATCCTGCCGC CCGGACCCTT AAGGCTGGGA CAATTTCTGA 60

TAGCTACCCC GACACAGGAG GTTACGGGAT GAGCAATTCG CGCCGCCGCT CACTCAGGTG 120

GTCATGGTTG CTGAGCGTGC TGGCTGCCGT CGGGCTGGGC CTGGCCACGG CGCCGGCCCA 180

GGCGGCCCCG CCGGCCTTGT CGCAGGACCG GTTCGCCGAC TTCCCCGCGC TGCCCCTCGA 240

CCCGTCCGCG ATGGTCGCCC AAGTGGCGCC ACAGGTGGTC AACATCAACA CCAAACTGGG 300

CTACAACAAC GCCGTGGGCG CCGGGACCGG CATCGTCATC GATCCCAACG GTGTCGTGCT 360

GACCAACAAC CACGTGATCG CGGGCGCCAC CGACATCAAT GCGTTCAGCG TCGGCTCCGG 420

CCAAACCTAC GGCGTCGATG TGGTCGGGTA TGACCGCACC CAGGATGTCG CGGTGCTGCA 480

GCTGCGCGGT GCCGGTGGCC TGCCGTCGGC GGCGATCGGT GGCGGCGTCG CGGTTGGTGA 540

GCCCGTCGTC GCGATGGGCA ACAGCGGTGG GCAGGGCGGA ACGCCCCGTG CGGTGCCTGG 600

CAGGGTGGTC GCGCTCGGCC AAACCGTGCA GGCGTCGGAT TCGCTGACCG GTGCCGAAGA 660

GACATTGAAC GGGTTGATCC AGTTCGATGC CGCAATCCAG CCCGGTGATT CGGGCGGGCC 720

CGTCGTCAAC GGCCTAGGAC AGGTGGTCGG TATGAACACG GCCGCGTCCG ATAACTTCCA 780

GCTGTCCCAG GGTGGGCAGG GATTCGCCAT TCCGATCGGG CAGGCGATGG CGATCGCGGG 840

CCAAATCCGA TCGGGTGGGG GGTCACCCAC CGTTCATATC GGGCCTACCG CCTTCCTCGG 900

CTTGGGTGTT GTCGACAACA ACGGCAACGG CGCACGAGTC CAACGCGTGG TCGGAAGCGC 960

TCCGGCGGCA AGTCTCGGCA TCTCCACCGG CGACGTGATC ACCGCGGTCG ACGGCGCTCC 1020

GATCAACTCG GCCACCGCGA TGGCGGACGC GCTTAACGGG CATCATCCCG GTGACGTCAT 1080

CTCGGTGAAC TGGCAAACCA AGTCGGGCGG CACGCGTACA GGGAACGTGA CATTGGCCGA 1140

GGGACCCCCG GCCTGATTTG TCGCGGATAC CACCCGCCGG CCGGCCAATT GGATTGGCGC 1200

CAGCCGTGAT TGCCGCGTGA GCCCCCGAGT TCCGTCTCCC GTGCGCGTGG CATTGTGGAA 1260

GCAATGAACG AGGCAGAACA CAGCGTTGAG CACCCTCCCG TGCAGGGCAG TTACGTCGAA 1320

GGCGGTGTGG TCGAGCATCC GGATGCCAAG GACTTCGGCA GCGCCGCCGC CCTGCCCGCC 1380

GATCCGACCT GGTTTAAGCA CGCCGTCTTC TACGAGGTGC TGGTCCGGGC GTTCTTCGAC 1440

GCCAGCGCGG ACGGTTCCGN CGATCTGCGT GGACTCATCG ATCGCCTCGA CTACCTGCAG 1500

TGGCTTGGCA TCGACTGCAT CTGTTGCCGC CGTTCCTACG ACTCACCGCT GCGCGACGGC 1560

GGTTACGACA TTCGCGACTT CTACAAGGTG CTGCCCGAAT TCGGCACCGT CGACGATTTC 1620

GTCGCCCTGG TCGACACCGC TCACCGGCGA GGTATCCGCA TCATCACCGA CCTGGTGATG 1680

AATCACACCT CGGAGTCGCA CCCCTGGTTT CAGGAGTCCC GCCGCGACCC AGACGGACCG 1740

TACGGTGACT ATTACGTGTG GAGCGACACC AGCGAGCGCT ACACCGACGC CCGGATCATC 1800

TTCGTCGACA CCGAAGAGTC GAACTGGTCA TTCGATCCTG TCCGCCGACA GTTNCTACTG 1860

GCACCGATTC TT 1872

(2)SEQ ID NO：18的信息：

(i)序列特征：

(A)长度：1482个碱基对

(B)类型：核酸

(C)链型：单链

(D)拓扑结构：线型

(xi)序列描述：SEQ ID NO：18：

CTTCGCCGAA ACCTGATGCC GAGGAACAGG GTGTTCCCGT GAGCCCGACG GCGTCCGACC 60

CCGCGCTCCT CGCCGAGATC AGGCAGTCGC TTGATGCGAC AAAAGGGTTG ACCAGCGTGC 120

ACGTAGCGGT CCGAACAACC GGGAAAGTCG ACAGCTTGCT GGGTATTACC AGTGCCGATG 180

TCGACGTCCG GGCCAATCCG CTCGCGGCAA AGGGCGTATG CACCTACAAC GACGAGCAGG 240

GTGTCCCGTT TCGGGTACAA GGCGACAACA TCTCGGTGAA ACTGTTCGAC GACTGGAGCA 300

ATCTCGGCTC GATTTCTGAA CTGTCAACTT CACGCGTGCT CGATCCTGCC GCTGGGGTGA 360

CGCAGCTGCT GTCCGGTGTC ACGAACCTCC AAGCGCAAGG TACCGAAGTG ATAGACGGAA 420

TTTCGACCAC CAAAATCACC GGGACCATCC CCGCGAGCTC TGTCAAGATG CTTGATCCTG 480

GCGCCAAGAG TGCAAGGCCG GCGACCGTGT GGATTGCCCA GGACGGCTCG CACCACCTCG 540

TCCGAGCGAG CATCGACCTC GGATCCGGGT CGATTCAGCT CACGCAGTCG AAATGGAACG 600

AACCCGTCAA CGTCGACTAG GCCGAAGTTG CGTCGACGCG TTGCTCGAAA CGCCCTTGTG 660

AACGGTGTCA ACGGCACCCG AAAACTGACC CCCTGACGGC ATCTGAAAAT TGACCCCCTA 720

GACCGGGCGG TTGGTGGTTA TTCTTCGGTG GTTCCGGCTG GTGGGACGCG GCCGAGGTCG 780

CGGTCTTTGA GCCGGTAGCT GTCGCCTTTG AGGGCGACGA CTTCAGCATG GTGGACGAGG 840

CGGTCGATCA TGGCGGCAGC AACGACGTCG TCGCCGCCGA AAACCTCGCC CCACCGGCCG 900

AAGGCCTTAT TGGACGTGAC GATCAAGCTG GCCCGCTCAT ACCGGGAGGA CACCAGCTGG 960

AAGAAGAGGT TGGCGGCCTC GGGCTCAAAC GGAATGTAAC CGACTTCGTC AACCACCAGG 1020

AGCGGATAGC GGCCAAACCG GGTGAGTTCG GCGTAGATGC GCCCGGCGTG GTGAGCCTCG 1080

GCGAACCGTG CTACCCATTC GGCGGCGGTG GCGAACAGCA CCCGATGACC GGCCTGACAC 1140

GCGCGTATCG CCAGGCCGAC CGCAAGATGA GTCTTCCCGG TGCCAGGCGG GGCCCAAAAA 1200

CACGACGTTA TCGCGGGCGG TGATGAAATC CAGGGTGCCC AGATGTGCGA TGGTGTCGCG 1260

TTTGAGGCCA CGAGCATGCT CAAAGTCGAA CTCTTCCAAC GACTTCCGAA CCGGGAAGCG 1320

GGCGGCGCGG ATGCGGCCCT CACCACCATG GGACTCCCGG GCTGACACTT CCCGCTGCAG 1380

GCAGGCGGCC AGGTATTCTT CGTGGCTCCA GTTCTCGGCG CGGGCGCGAT CGGCCAGCCG 1440

GGACACTGAC TCACGCAGGG TGGGAGCTTT CAATGCTCTT GT 1482

(2)SEQ ID NO：19的信息：

(i)序列特征：

(A)长度：876个碱基对

(B)类型：核酸

(C)链型：单链

(D)拓扑结构：线型

(xi)序列描述：SEQ ID NO：19：

GAATTCGGCA CGAGCCGGCG ATAGCTTCTG GGCCGCGGCC GACCAGATGG CTCGAGGGTT 60

CGTGCTCGGG GCCACCGCCG GGCGCACCAC CCTGACCGGT GAGGGCCTGC AACACGCCGA 120

CGGTCACTCG TTGCTGCTGG ACGCCACCAA CCCGGCGGTG GTTGCCTACG ACCCGGCCTT 180

CGCCTACGAA ATCGGCTACA TCGNGGAAAG CGGACTGGCC AGGATGTGCG GGGAGAACCC 240

GGAGAACATC TTCTTCTACA TCACCGTCTA CAACGAGCCG TACGTGCAGC CGCCGGAGCC 300

GGAGAACTTC GATCCCGAGG GCGTGCTGGG GGGTATCTAC CGNTATCACG CGGCCACCGA 360

GCAACGCACC AACAAGGNGC AGATCCTGGC CTCCGGGGTA GCGATGCCCG CGGCGCTGCG 420

GGCAGCACAG ATGCTGGCCG CCGAGTGGGA TGTCGCCGCC GACGTGTGGT CGGTGACCAG 480

TTGGGGCGAG CTAAACCGCG ACGGGGTGGT CATCGAGACC GAGAAGCTCC GCCACCCCGA 540

TCGGCCGGCG GGCGTGCCCT ACGTGACGAG AGCGCTGGAG AATGCTCGGG GCCCGGTGAT 600

CGCGGTGTCG GACTGGATGC GCGCGGTCCC CGAGCAGATC CGACCGTGGG TGCCGGGCAC 660

ATACCTCACG TTGGGCACCG ACGGGTTCGG TTTTTCCGAC ACTCGGCCCG CCGGTCGTCG 720

TTACTTCAAC ACCGACGCCG AATCCCAGGT TGGTCGCGGT TTTGGGAGGG GTTGGCCGGG 780

TCGACGGGTG AATATCGACC CATTCGGTGC CGGTCGTGGG CCGCCCGCCC AGTTACCCGG 840

ATTCGACGAA GGTGGGGGGT TGCGCCCGAN TAAGTT 876

(2)SEQ ID NO：20的信息：

(i)序列特征：

(A)长度：1021个碱基对

(B)类型：核酸

(C)链型：单链

(D)拓扑结构：线型

(xi)序列描述：SEQ ID NO：20：

ATCCCCCCGG GCTGCAGGAA TTCGGCACGA GAGACAAAAT TCCACGCGTT AATGCAGGAA 60

CAGATTCATA ACGAATTCAC AGCGGCACAA CAATATGTCG CGATCGCGGT TTATTTCGAC 120

AGCGAAGACC TGCCGCAGTT GGCGAAGCAT TTTTACAGCC AAGCGGTCGA GGAACGAAAC 180

CATGCAATGA TGCTCGTGCA ACACCTGCTC GACCGCGACC TTCGTGTCGA AATTCCCGGC 240

GTAGACACGG TGCGAAACCA GTTCGACAGA CCCCGCGAGG CACTGGCGCT GGCGCTCGAT 300

CAGGAACGCA CAGTCACCGA CCAGGTCGGT CGGCTGACAG CGGTGGCCCG CGACGAGGGC 360

GATTTCCTCG GCGAGCAGTT CATGCAGTGG TTCTTGCAGG AACAGATCGA AGAGGTGGCC 420

TTGATGGCAA CCCTGGTGCG GGTTGCCGAT CGGGCCGGGG CCAACCTGTT CGAGCTAGAG 480

AACTTCGTCG CACGTGAAGT GGATGTGGCG CCGGCCGCAT CAGGCGCCCC GCACGCTGCC 540

GGGGGCCGCC TCTAGATCCC TGGGGGGGAT CAGCGAGTGG TCCCGTTCGC CCGCCCGTCT 600

TCCAGCCAGG CCTTGGTGCG GCCGGGGTGG TGAGTACCAA TCCAGGCCAC CCCGACCTCC 660

CGGNAAAAGT CGATGTCCTC GTACTCATCG ACGTTCCAGG AGTACACCGC CCGGCCCTGA 720

GCTGCCGAGC GGTCAACGAG TTGCGGATAT TCCTTTAACG CAGGCAGTGA GGGTCCCACG 780

GCGGTTGGCC CGACCGCCGT GGCCGCACTG CTGGTCAGGT ATCGGGGGGT CTTGGCGAGC 840

AACAACGTCG GCAGGAGGGG TGGAGCCCGC CGGATCCGCA GACCGGGGGG GCGAAAACGA 900

CATCAACACC GCACGGGATC GATCTGCGGA GGGGGGTGCG GGAATACCGA ACCGGTGTAG 960

GAGCGCCAGC AGTTGTTTTT CCACCAGCGA AGCGTTTTCG GGTCATCGGN GGCNNTTAAG 1020

T 1021

(2)SEQ ID NO：21的信息：

(i)序列特征：

(A)长度：321个碱基对

(B)类型：核酸

(C)链型：单链

(D)拓扑结构：线型

(xi)序列描述：SEQ ID NO：21：

CGTGCCGACG AACGGAAGAA CACAACCATG AAGATGGTGA AATCGATCGC CGCAGGTCTG 60

ACCGCCGCGG CTGCAATCGG CGCCGCTGCG GCCGGTGTGA CTTCGATCAT GGCTGGCGGN 120

CCGGTCGTAT ACCAGATGCA GCCGGTCGTC TTCGGCGCGC CACTGCCGTT GGACCCGGNA 180

TCCGCCCCTG ANGTCCCGAC CGCCGCCCAG TGGACCAGNC TGCTCAACAG NCTCGNCGAT 240

CCCAACGTGT CGTTTGNGAA CAAGGGNAGT CTGGTCGAGG GNGGNATCGG NGGNANCGAG 300

GGNGNGNATC GNCGANCACA A 321

(2)SEQ ID NO：22的信息：

(i)序列特征：

(A)长度：373个碱基对

(B)类型：核酸

(C)链型：单链

(D)拓扑结构：线型

(xi)序列描述：SEQ ID NO：22：

TCTTATCGGT TCCGGTTGGC GACGGGTTTT GGGNGCGGGT GGTTAACCCG CTCGGCCAGC 60

CGATCGACGG GCGCGGAGAC GTCGACTCCG ATACTCGGCG CGCGCTGGAG CTCCAGGCGC 120

CCTCGGTGGT GNACCGGCAA GGCGTGAAGG AGCCGTTGNA GACCGGGATC AAGGCGATTG 180

ACGCGATGAC CCCGATCGGC CGCGGGCAGC GCCAGCTGAT CATCGGGGAC CGCAAGACCG 240

GCAAAAACCG CCGTCTGTGT CGGACACCAT CCTCAAACCA GCGGGAAGAA CTGGGAGTCC 300

GGTGGATCCC AAGAAGCAGG TGCGCTTGTG TATACGTTGG CCATCGGGCA AGAAGGGGAA 360

CTTACCATCG CCG 373

(2)SEQ ID NO：23的信息：

(i)序列特征：

(A)长度：352个碱基对

(B)类型：核酸

(C)链型：单链

(D)拓扑结构：线型

(xi)序列描述：SEQ ID NO：23：

GTGACGCCGT GATGGGATTC CTGGGCGGGG CCGGTCCGCT GGCGGTGGTG GATCAGCAAC 60

TGGTTACCCG GGTGCCGCAA GGCTGGTCGT TTGCTCAGGC AGCCGCTGTG CCGGTGGTGT 120

TCTTGACGGC CTGGTACGGG TTGGCCGATT TAGCCGAGAT CAAGGCGGGC GAATCGGTGC 180

TGATCCATGC CGGTACCGGC GGTGTGGGCA TGGCGGCTGT GCAGCTGGCT CGCCAGTGGG 240

GCGTGGAGGT TTTCGTCACC GCCAGCCGTG GNAAGTGGGA CACGCTGCGC GCCATNGNGT 300

TTGACGACGA NCCATATCGG NGATTCCCNC ACATNCGAAG TTCCGANGGA GA 352

(2)SEQ ID NO：24的信息：

(i)序列特征：

(A)长度：726个碱基对

(B)类型：核酸

(C)链型：单链

(D)拓扑结构：线型

(xi)序列描述：SEQ ID NO：24：

GAAATCCGCG TTCATTCCGT TCGACCAGCG GCTGGCGATA ATCGACGAAG TGATCAAGCC 60

GCGGTTCGCG GCGCTCATGG GTCACAGCGA GTAATCAGCA AGTTCTCTGG TATATCGCAC 120

CTAGCGTCCA GTTGCTTGCC AGATCGCTTT CGTACCGTCA TCGCATGTAC CGGTTCGCGT 180

GCCGCACGCT CATGCTGGCG GCGTGCATCC TGGCCACGGG TGTGGCGGGT CTCGGGGTCG 240

GCGCGCAGTC CGCAGCCCAA ACCGCGCCGG TGCCCGACTA CTACTGGTGC CCGGGGCAGC 300

CTTTCGACCC CGCATGGGGG CCCAACTGGG ATCCCTACAC CTGCCATGAC GACTTCCACC 360

GCGACAGCGA CGGCCCCGAC CACAGCCGCG ACTACCCCGG ACCCATCCTC GAAGGTCCCG 420

TGCTTGACGA TCCCGGTGCT GCGCCGCCGC CCCCGGCTGC CGGTGGCGGC GCATAGCGCT 480

CGTTGACCGG GCCGCATCAG CGAATACGCG TATAAACCCG GGCGTGCCCC CGGCAAGCTA 540

CGACCCCCGG CGGGGCAGAT TTACGCTCCC GTGCCGATGG ATCGCGCCGT CCGATGACAG 600

AAAATAGGCG ACGGTTTTGG CAACCGCTTG GAGGACGCTT GAAGGGAACC TGTCATGAAC 660

GGCGACAGCG CCTCCACCAT CGACATCGAC AAGGTTGTTA CCCGCACACC CGTTCGCCGG 720

ATCGTG 726

(2)SEQ ID NO：25的信息：

(i)序列特征：

(A)长度：580个碱基对

(B)类型：核酸

(C)链型：单链

(D)拓扑结构：线型

(xi)序列描述：SEQ ID NO：25：

CGCGACGACG ACGAACGTCG GGCCCACCAC CGCCTATGCG TTGATGCAGG CGACCGGGAT 60

GGTCGCCGAC CATATCCAAG CATGCTGGGT GCCCACTGAG CGACCTTTTG ACCAGCCGGG 120

CTGCCCGATG GCGGCCCGGT GAAGTCATTG CGCCGGGGCT TGTGCACCTG ATGAACCCGA 180

ATAGGGAACA ATAGGGGGGT GATTTGGCAG TTCAATGTCG GGTATGGCTG GAAATCCAAT 240

GGCGGGGCAT GCTCGGCGCC GACCAGGCTC GCGCAGGCGG GCCAGCCCGA ATCTGGAGGG 300

AGCACTCAAT GGCGGCGATG AAGCCCCGGA CCGGCGACGG TCCTTTGGAA GCAACTAAGG 360

AGGGGCGCGG CATTGTGATG CGAGTACCAC TTGAGGGTGG CGGTCGCCTG GTCGTCGAGC 420

TGACACCCGA CGAAGCCGCC GCACTGGGTG ACGAACTCAA AGGCGTTACT AGCTAAGACC 480

AGCCCAACGG CGAATGGTCG GCGTTACGCG CACACCTTCC GGTAGATGTC CAGTGTCTGC 540

TCGGCGATGT ATGCCCAGGA GAACTCTTGG ATACAGCGCT 580

(2)SEQ ID NO：26的信息：

(i)序列特征：

(A)长度：160个碱基对

(B)类型：核酸

(C)链型：单链

(D)拓扑结构：线型

(xi)序列描述：SEQ ID NO：26：

AACGGAGGCG CCGGGGGTTT TGGCGGGGCC GGGGCGGTCG GCGGCAACGG CGGGGCCGGC 60

GGTACCGCCG GGTTGTTCGG TGTCGGCGGG GCCGGTGGGG CCGGAGGCAA CGGCATCGCC 120

GGTGTCACGG GTACGTCGGC CAGCACACCG GGTGGATCCG 160

(2)SEQ ID NO：27的信息：

(i)序列特征：

(A)长度：272个碱基对

(B)类型：核酸

(C)链型：单链

(D)拓扑结构：线型

(xi)序列描述：SEQ ID NO：27：

GACACCGATA CGATGGTGAT GTACGCCAAC GTTGTCGACA CGCTCGAGGC GTTCACGATC 60

CAGCGCACAC CCGACGGCGT GACCATCGGC GATGCGGCCC CGTTCGCGGA GGCGGCTGCC 120

AAGGCGATGG GAATCGACAA GCTGCGGGTA ATTCATACCG GAATGGACCC CGTCGTCGCT 180

GAACGCGAAC AGTGGGACGA CGGCAACAAC ACGTTGGCGT TGGCGCCCGG TGTCGTTGTC 240

GCCTACGAGC GCAACGTACA GACCAACGCC CG 272

(2)SEQ ID NO：28的信息：

(i)序列特征：

(A)长度：317个碱基对

(B)类型：核酸

(C)链型：单链

(D)拓扑结构：线型

(xi)序列描述：SEQ ID NO：28：

GCAGCCGGTG GTTCTCGGAC TATCTGCGCA CGGTGACGCA GCGCGACGTG CGCGAGCTGA 60

AGCGGATCGA GCAGACGGAT CGCCTGCCGC GGTTCATGCG CTACCTGGCC GCTATCACCG 120

CGCAGGAGCT GAACGTGGCC GAAGCGGCGC GGGTCATCGG GGTCGACGCG GGGACGATCC 180

GTTCGGATCT GGCGTGGTTC GAGACGGTCT ATCTGGTACA TCGCCTGCCC GCCTGGTCGC 240

GGAATCTGAC CGCGAAGATC AAGAAGCGGT CAAAGATCCA CGTCGTCGAC AGTGGCTTCG 300

CGGCCTGGTT GCGCGGG 317

(2)SEQ ID NO：29的信息：

(i)序列特征：

(A)长度：182个碱基对

(B)类型：核酸

(C)链型：单链

(D)拓扑结构：线型

(xi)序列描述：SEQ ID NO：29：

GATCGTGGAG CTGTCGATGA ACAGCGTTGC CGGACGCGCG GCGGCCAGCA CGTCGGTGTA 60

GCAGCGCCGG ACCACCTCGC CGGTGGGCAG CATGGTGATG ACCACGTCGG CCTCGGCCAC 120

CGCTTCGGGC GCGCTACGAA ACACCGCGAC ACCGTGCGCG GCGGCGCCGG ACGCCGCCGT 180

GG 182

(2)SEQ ID NO：30的信息：

(i)序列特征：

(A)长度：308个碱基对

(B)类型：核酸

(C)链型：单链

(D)拓扑结构：线型

(xi)序列描述：SEQ ID NO：30：

GATCGCGAAG TTTGGTGAGC AGGTGGTCGA CGCGAAAGTC TGGGCGCCTG CGAAGCGGGT 60

CGGCGTTCAC GAGGCGAAGA CACGCCTGTC CGAGCTGCTG CGGCTCGTCT ACGGCGGGCA 120

GAGGTTGAGA TTGCCCGCCG CGGCGAGCCG GTAGCAAAGC TTGTGCCGCT GCATCCTCAT 180

GAGACTCGGC GGTTAGGCAT TGACCATGGC GTGTACCGCG TGCCCGACGA TTTGGACGCT 240

CCGTTGTCAG ACGACGTGCT CGAACGCTTT CACCGGTGAA GCGCTACCTC ATCGACACCC 300

ACGTTTGG 308

(2)SEQ ID NO：31的信息：

(i)序列特征：

(A)长度：267个碱基对

(B)类型：核酸

(C)链型：单链

(D)拓扑结构：线型

(xi)序列描述：SEQ ID NO：31：

CCGACGACGA GCAACTCACG TGGATGATGG TCGGCAGCGG CATTGAGGAC GGAGAGAATC 60

CGGCCGAAGC TGCCGCGCGG CAAGTGCTCA TAGTGACCGG CCGTAGAGGG CTCCCCCGAT 120

GGCACCGGAC TATTCTGGTG TGCCGCTGGC CGGTAAGAGC GGGTAAAAGA ATGTGAGGGG 180

ACACGATGAG CAATCACACC TACCGAGTGA TCGAGATCGT CGGGACCTCG CCCGACGGCG 240

TCGACGCGGC AATCCAGGGC GGTCTGG 267

(2)SEQ ID NO：32的信息：

(i)序列特征：

(A)长度：189个碱基对

(B)类型：核酸

(C)链型：单链

(D)拓扑结构：线型

(xi)序列描述：SEQ ID NO：32：

CTCGTGCCGA AAGAATGTGA GGGGACACGA TGAGCAATCA CACCTACCGA GTGATCGAGA 60

TCGTCGGGAC CTCGCCCGAC GGCGTCGACG CGGCAATCCA GGGCGGTCTG GCCCGAGCTG 120

CGCAGACCAT GCGCGCGCTG GACTGGTTCG AAGTACAGTC AATTCGAGGC CACCTGGTCG 180

ACGGAGCGG 189

(2)SEQ ID NO：33的信息：

(i)序列特征：

(A)长度：851个碱基对

(B)类型：核酸

(C)链型：单链

(D)拓扑结构：线型

(xi)序列描述：SEQ ID NO：33：

CTGCAGGGTG GCGTGGATGA GCGTCACCGC GGGGCAGGCC GAGCTGACCG CCGCCCAGGT 60

CCGGGTTGCT GCGGCGGCCT ACGAGACGGC GTATGGGCTG ACGGTGCCCC CGCCGGTGAT 120

CGCCGAGAAC CGTGCTGAAC TGATGATTCT GATAGCGACC AACCTCTTGG GGCAAAACAC 180

CCCGGCGATC GCGGTCAACG AGGCCGAATA CGGCGAGATG TGGGCCCAAG ACGCCGCCGC 240

GATGTTTGGC TACGCCGCGG CGACGGCGAC GGCGACGGCG ACGTTGCTGC CGTTCGAGGA 300

GGCGCCGGAG ATGACCAGCG CGGGTGGGCT CCTCGAGCAG GCCGCCGCGG TCGAGGAGGC 360

CTCCGACACC GCCGCGGCGA ACCAGTTGAT GAACAATGTG CCCCAGGCGC TGAAACAGTT 420

GGCCCAGCCC ACGCAGGGCA CCACGCCTTC TTCCAAGCTG GGTGGCCTGT GGAAGACGGT 480

CTCGCCGCAT CGGTCGCCGA TCAGCAACAT GGTGTCGATG GCCAACAACC ACATGTCGAT 540

GACCAACTCG GGTGTGTCGA TGACCAACAC CTTGAGCTCG ATGTTGAAGG GCTTTGCTCC 600

GGCGGCGGCC GCCCAGGCCG TGCAAACCGC GGCGCAAAAC GGGGTCCGGG CGATGAGCTC 660

GCTGGGCAGC TCGCTGGGTT CTTCGGGTCT GGGCGGTGGG GTGGCCGCCA ACTTGGGTCG 720

GGCGGCCTCG GTACGGTATG GTCACCGGGA TGGCGGAAAA TATGCANAGT CTGGTCGGCG 780

GAACGGTGGT CCGGCGTAAG GTTTACCCCC GTTTTCTGGA TGCGGTGAAC TTCGTCAACG 840

GAAACAGTTA C 851

(2)SEQ ID NO：34的信息：

(i)序列特征：

(A)长度：254个碱基对

(B)类型：核酸

(C)链型：单链

(D)拓扑结构：线型

(xi)序列描述：SEQ ID NO：34：

GATCGATCGG GCGGAAATTT GGACCAGATT CGCCTCCGGC GATAACCCAA TCAATCGAAC 60

CTAGATTTAT TCCGTCCAGG GGCCCGAGTA ATGGCTCGCA GGAGAGGAAC CTTACTGCTG 120

CGGGCACCTG TCGTAGGTCC TCGATACGGC GGAAGGCGTC GACATTTTCC ACCGACACCC 180

CCATCCAAAC GTTCGAGGGC CACTCCAGCT TGTGAGCGAG GCGACGCAGT CGCAGGCTGC 240

GCTTGGTCAA GATC 254

(2)SEQ ID NO：35的信息：

(i)序列特征：

(A)长度：408个碱基对

(B)类型：核酸

(C)链型：单链

(D)拓扑结构：线型

(xi)序列描述：SEQ ID NO：35：

CGGCACGAGG ATCCTGACCG AAGCGGCCGC CGCCAAGGCG AAGTCGCTGT TGGACCAGGA 60

GGGACGGGAC GATCTGGCGC TGCGGATCGC GGTTCAGCCG GGGGGGTGCG CTGGATTGCG 120

CTATAACCTT TTCTTCGACG ACCGGACGCT GGATGGTGAC CAAACCGCGG AGTTCGGTGG 180

TGTCAGGTTG ATCGTGGACC GGATGAGCGC GCCGTATGTG GAAGGCGCGT CGATCGATTT 240

CGTCGACACT ATTGAGAAGC AAGGNTTCAC CATCGACAAT CCCAACGCCA CCGGCTCCTG 300

CGCGTGCGGG GATTCGTTCA ACTGATAAAA CGCTAGTACG ACCCCGCGGT GCGCAACACG 360

TACGAGCACA CCAAGACCTG ACCGCGCTGG AAAAGCAACT GAGCGATG 408

(2)SEQ ID NO：36的信息：

(i)序列特征：

(A)长度：181个碱基对

(B)类型：核酸

(C)链型：单链

(D)拓扑结构：线型

(xi)序列描述：SEQ ID NO：36：

GCGGTGTCGG CGGATCCGGC GGGTGGTTGA ACGGCAACGG CGGGGCCGGC GGGGCCGGCG 60

GGACCGGCGC TAACGGTGGT GCCGGCGGCA ACGCCTGGTT GTTCGGGGCC GGCGGGTCCG 120

GCGGNGCCGG CACCAATGGT GGNGTCGGCG GGTCCGGCGG ATTTGTCTAC GGCAACGGCG 180

G 181

(2)SEQ ID NO：37的信息：

(i)序列特征：

(A)长度：290个碱基对

(B)类型：核酸

(C)链型：单链

(D)拓扑结构：线型

(xi)序列描述：SEQ ID NO：37：

GCGGTGTCGG CGGATCCGGC GGGTGGTTGA ACGGCAACGG CGGTGTCGGC GGCCGGGGCG 60

GCGACGGCGT CTTTGCCGGT GCCGGCGGCC AGGGCGGCCT CGGTGGGCAG GGCGGCAATG 120

GCGGCGGCTC CACCGGCGGC AACGGCGGTC TTGGCGGCGC GGGCGGTGGC GGAGGCAACG 180

CCCCGGACGG CGGCTTCGGT GGCAACGGCG GTAAGGGTGG CCAGGGCGGN ATTGGCGGCG 240

GCACTCAGAG CGCGACCGGC CTCGGNGGTG ACGGCGGTGA CGGCGGTGAC 290

(2)SEQ ID NO：38的信息：

(i)序列特征：

(A)长度：34个碱基对

(B)类型：核酸

(C)链型：单链

(D)拓扑结构：线型

(xi)序列描述：SEQ ID NO：38：

GATCCAGTGG CATGGNGGGT GTCAGTGGAA GCAT 34

(2)SEQ ID NO：39的信息：

(i)序列特征：

(A)长度：155个碱基对

(B)类型：核酸

(C)链型：单链

(D)拓扑结构：线型

(xi)序列描述：SEQ ID NO：39：

GATCGCTGCT CGTCCCCCCC TTGCCGCCGA CGCCACCGGT CCCACCGTTA CCGAACAAGC 60

TGGCGTGGTC GCCAGCACCC CCGGCACCGC CGACGCCGGA GTCGAACAAT GGCACCGTCG 120

TATCCCCACC ATTGCCGCCG GNCCCACCGG CACCG 155

(2)SEQ ID NO：40的信息：

(i)序列特征：

(A)长度：53个碱基对

(B)类型：核酸

(C)链型：单链

(D)拓扑结构：线型

(xi)序列描述：SEQ ID NO：40：

ATGGCGTTCA CGGGGCGCCG GGGACCGGGC AGCCCGGNGG GGCCGGGGGG TGG 53

(2)SEQ ID NO：41的信息：

(i)序列特征：

(A)长度：132个碱基对

(B)类型：核酸

(C)链型：单链

(D)拓扑结构：线型

(xi)序列描述：SEQ ID NO：41：

GATCCACCGC GGGTGCAGAC GGTGCCCGCG GCGCCACCCC GACCAGCGGC GGCAACGGCG 60

GCACCGGCGG CAACGGCGCG AACGCCACCG TCGTCGGNGG GGCCGGCGGG GCCGGCGGCA 120

AGGGCGGCAA CG 132

(2)SEQ ID NO：42的信息：

(i)序列特征：

(A)长度：132个碱基对

(B)类型：核酸

(C)链型：单链

(D)拓扑结构：线型

(xi)序列描述：SEQ ID NO：42：

GATCGGCGGC CGGNACGGNC GGGGACGGCG GCAAGGGCGG NAACGGGGGC GCCGNAGCCA 60

CCNGCCAAGA ATCCTCCGNG TCCNCCAATG GCGCGAATGG CGGACAGGGC GGCAACGGCG 120

GCANCGGCGG CA 132

(2)SEQ ID NO：43的信息：

(i)序列特征：

(A)长度：702个碱基对

(B)类型：核酸

(C)链型：单链

(D)拓扑结构：线型

(xi)序列描述：SEQ ID NO：43：

CGGCACGAGG ATCGGTACCC CGCGGCATCG GCAGCTGCCG ATTCGCCGGG TTTCCCCACC 60

CGAGGAAAGC CGCTACCAGA TGGCGCTGCC GAAGTAGGGC GATCCGTTCG CGATGCCGGC 120

ATGAACGGGC GGCATCAAAT TAGTGCAGGA ACCTTTCAGT TTAGCGACGA TAATGGCTAT 180

AGCACTAAGG AGGATGATCC GATATGACGC AGTCGCAGAC CGTGACGGTG GATCAGCAAG 240

AGATTTTGAA CAGGGCCAAC GAGGTGGAGG CCCCGATGGC GGACCCACCG ACTGATGTCC 300

CCATCACACC GTGCGAACTC ACGGNGGNTA AAAACGCCGC CCAACAGNTG GTNTTGTCCG 360

CCGACAACAT GCGGGAATAC CTGGCGGCCG GTGCCAAAGA GCGGCAGCGT CTGGCGACCT 420

CGCTGCGCAA CGCGGCCAAG GNGTATGGCG AGGTTGATGA GGAGGCTGCG ACCGCGCTGG 480

ACAACGACGG CGAAGGAACT GTGCAGGCAG AATCGGCCGG GGCCGTCGGA GGGGACAGTT 540

CGGCCGAACT AACCGATACG CCGAGGGTGG CCACGGCCGG TGAACCCAAC TTCATGGATC 600

TCAAAGAAGC GGCAAGGAAG CTCGAAACGG GCGACCAAGG CGCATCGCTC GCGCACTGNG 660

GGGATGGGTG GAACACTTNC ACCCTGACGC TGCAAGGCGA CG 702

(2)SEQ ID NO：44的信息：

(i)序列特征：

(A)长度：298个碱基对

(B)类型：核酸

(C)链型：单链

(D)拓扑结构：线型

(xi)序列描述：SEQ ID NO：44：

GAAGCCGCAG CGCTGTCGGG CGACGTGGCG GTCAAAGCGG CATCGCTCGG TGGCGGTGGA 60

GGCGGCGGGG TGCCGTCGGC GCCGTTGGGA TCCGCGATCG GGGGCGCCGA ATCGGTGCGG 120

CCCGCTGGCG CTGGTGACAT TGCCGGCTTA GGCCAGGGAA GGGCCGGCGG CGGCGCCGCG 180

CTGGGCGGCG GTGGCATGGG AATGCCGATG GGTGCCGCGC ATCAGGGACA AGGGGGCGCC 240

AAGTCCAAGG GTTCTCAGCA GGAAGACGAG GCGCTCTACA CCGAGGATCC TCGTGCCG 298

(2)SEQ ID NO：45的信息：

(i)序列特征：

(A)长度：1058个碱基对

(B)类型：核酸

(C)链型：单链

(D)拓扑结构：线型

(xi)序列描述：SEQ ID NO：45：

CGGCACGAGG ATCGAATCGC GTCGCCGGGA GCACAGCGTC GCACTGCACC AGTGGAGGAG 60

CCATGACCTA CTCGCCGGGT AACCCCGGAT ACCCGCAAGC GCAGCCCGCA GGCTCCTACG 120

GAGGCGTCAC ACCCTCGTTC GCCCACGCCG ATGAGGGTGC GAGCAAGCTA CCGATGTACC 180

TGAACATCGC GGTGGCAGTG CTCGGTCTGG CTGCGTACTT CGCCAGCTTC GGCCCAATGT 240

TCACCCTCAG TACCGAACTC GGGGGGGGTG ATGGCGCAGT GTCCGGTGAC ACTGGGCTGC 300

CGGTCGGGGT GGCTCTGCTG GCTGCGCTGC TTGCCGGGGT GGTTCTGGTG CCTAAGGCCA 360

AGAGCCATGT GACGGTAGTT GCGGTGCTCG GGGTACTCGG CGTATTTCTG ATGGTCTCGG 420

CGACGTTTAA CAAGCCCAGC GCCTATTCGA CCGGTTGGGC ATTGTGGGTT GTGTTGGCTT 480

TCATCGTGTT CCAGGCGGTT GCGGCAGTCC TGGCGCTCTT GGTGGAGACC GGCGCTATCA 540

CCGCGCCGGC GCCGCGGCCC AAGTTCGACC CGTATGGACA GTACGGGCGG TACGGGCAGT 600

ACGGGCAGTA CGGGGTGCAG CCGGGTGGGT ACTACGGTCA GCAGGGTGCT CAGCAGGCCG 660

CGGGACTGCA GTCGCCCGGC CCGCAGCAGT CTCCGCAGCC TCCCGGATAT GGGTCGCAGT 720

ACGGCGGCTA TTCGTCCAGT CCGAGCCAAT CGGGCAGTGG ATACACTGCT CAGCCCCCGG 780

CCCAGCCGCC GGCGCAGTCC GGGTCGCAAC AATCGCACCA GGGCCCATCC ACGCCACCTA 840

CCGGCTTTCC GAGCTTCAGC CCACCACCAC CGGTCAGTGC CGGGACGGGG TCGCAGGCTG 900

GTTCGGCTCC AGTCAACTAT TCAAACCCCA GCGGGGGCGA GCAGTCGTCG TCCCCCGGGG 960

GGGCGCCGGT CTAACCGGGC GTTCCCGCGT CCGGTCGCGC GTGTGCGCGA AGAGTGAACA 1020

GGGTGTCAGC AAGCGCGGAC GATCCTCGTG CCGAATTC 1058

(2)SEQ ID NO：46的信息：

(i)序列特征：

(A)长度：327个碱基对

(B)类型：核酸

(C)链型：单链

(D)拓扑结构：线型

(xi)序列描述：SEQ ID NO：46：

CGGCACGAGA GACCGATGCC GCTACCCTCG CGCAGGAGGC AGGTAATTTC GAGCGGATCT 60

CCGGCGACCT GAAAACCCAG ATCGACCAGG TGGAGTCGAC GGCAGGTTCG TTGCAGGGCC 120

AGTGGCGCGG CGCGGCGGGG ACGGCCGCCC AGGCCGCGGT GGTGCGCTTC CAAGAAGCAG 180

CCAATAAGCA GAAGCAGGAA CTCGACGAGA TCTCGACGAA TATTCGTCAG GCCGGCGTCC 240

AATACTCGAG GGCCGACGAG GAGCAGCAGC AGGCGCTGTC CTCGCAAATG GGCTTCTGAC 300

CCGCTAATAC GAAAAGAAAC GGAGCAA 327

(2)SEQ ID NO：47的信息：

(i)序列特征：

(A)长度：170个碱基对

(B)类型：核酸

(C)链型：单链

(D)拓扑结构：线型

(xi)序列描述：SEQ ID NO：47：

CGGTCGCGAT GATGGCGTTG TCGAACGTGA CCGATTCTGT ACCGCCGTCG TTGAGATCAA 60

CCAACAACGT GTTGGCGTCG GCAAATGTGC CGNACCCGTG GATCTCGGTG ATCTTGTTCT 120

TCTTCATCAG GAAGTGCACA CCGGCCACCC TGCCCTCGGN TACCTTTCGG 170

(2)SEQ ID NO：48的信息：

(i)序列特征：

(A)长度：127个碱基对

(B)类型：核酸

(C)链型：单链

(D)拓扑结构：线型

(xi)序列描述：SEQ ID NO：48：

GATCCGGCGG CACGGGGGGT GCCGGCGGCA GCACCGCTGG CGCTGGCGGC AACGGCGGGG 60

CCGGGGGTGG CGGCGGAACC GGTGGGTTGC TCTTCGGCAA CGGCGGTGCC GGCGGGCACG 120

GGGCCGT 127

(2)SEQ ID NO：49的信息：

(i)序列特征：

(A)长度：81个碱基对

(B)类型：核酸

(C)链型：单链

(D)拓扑结构：线型

(xi)序列描述：SEQ ID NO：49：

CGGCGGCAAG GGCGGCACCG CCGGCAACGG GAGCGGCGCG GCCGGCGGCA ACGGCGGCAA 60

CGGCGGCTCC GGCCTCAACG G 81

(2)SEQ ID NO：50的信息：

(i)序列特征：

(A)长度：149个碱基对

(B)类型：核酸

(C)链型：单链

(D)拓扑结构：线型

(xi)序列描述：SEQ ID NO：50：

GATCAGGGCT GGCCGGCTCC GGCCAGAAGG GCGGTAACGG AGGAGCTGCC GGATTGTTTG 60

GCAACGGCGG GGCCGGNGGT GCCGGCGCGT CCAACCAAGC CGGTAACGGC GGNGCCGGCG 120

GAAACGGTGG TGCCGGTGGG CTGATCTGG 149

(2)SEQ ID NO：51的信息：

(i)序列特征：

(A)长度：355个碱基对

(B)类型：核酸

(C)链型：单链

(D)拓扑结构：线型

(xi)序列描述：SEQ ID NO：51：

CGGCACGAGA TCACACCTAC CGAGTGATCG AGATCGTCGG GACCTCGCCC GACGGTGTCG 60

ACGCGGNAAT CCAGGGCGGT CTGGCCCGAG CTGCGCAGAC CATGCGCGCG CTGGACTGGT 120

TCGAAGTACA GTCAATTCGA GGCCACCTGG TCGACGGAGC GGTCGCGCAC TTCCAGGTGA 180

CTATGAAAGT CGGCTTCCGC CTGGAGGATT CCTGAACCTT CAAGCGCGGC CGATAACTGA 240

GGTGCATCAT TAAGCGACTT TTCCAGAACA TCCTGACGCG CTCGAAACGC GGTTCAGCCG 300

ACGGTGGCTC CGCCGAGGCG CTGCCTCCAA AATCCCTGCG ACAATTCGTC GGCGG 255

(2)SEQ ID NO：52的信息：

(i)序列特征：

(A)长度：999个碱基对

(B)类型：核酸

(C)链型：单链

(D)拓扑结构：线型

(xi)序列描述：SEQ ID NO：52：

ATGCATCACC ATCACCATCA CATGCATCAG GTGGACCCCA ACTTGACACG TCGCAAGGGA 60

CGATTGGCGG CACTGGCTAT CGCGGCGATG GCCAGCGCCA GCCTGGTGAC CGTTGCGGTG 120

CCCGCGACCG CCAACGCCGA TCCGGAGCCA GCGCCCCCGG TACCCACAAC GGCCGCCTCG 180

CCGCCGTCGA CCGCTGCAGC GCCACCCGCA CCGGCGACAC CTGTTGCCCC CCCACCACCG 240

GCCGCCGCCA ACACGCCGAA TGCCCAGCCG GGCGATCCCA ACGCAGCACC TCCGCCGGCC 300

GACCCGAACG CACCGCCGCC ACCTGTCATT GCCCCAAACG CACCCCAACC TGTCCGGATC 360

GACAACCCGG TTGGAGGATT CAGCTTCGCG CTGCCTGCTG GCTGGGTGGA GTCTGACGCC 420

GCCCACTTCG ACTACGGTTC AGCACTCCTC AGCAAAACCA CCGGGGACCC GCCATTTCCC 480

GGACAGCCGC CGCCGGTGGC CAATGACACC CGTATCGTGC TCGGCCGGCT AGACCAAAAG 540

CTTTACGCCA GCGCCGAAGC CACCGACTCC AAGGCCGCGG CCCGGTTGGG CTCGGACATG 600

GGTGAGTTCT ATATGCCCTA CCCGGGCACC CGGATCAACC AGGAAACCGT CTCGCTCGAC 660

GCCAACGGGG TGTCTGGAAG CGCGTCGTAT TACGAAGTCA AGTTCAGCGA TCCGAGTAAG 720

CCGAACGGCC AGATCTGGAC GGGCGTAATC GGCTCGCCCG CGGCGAACGC ACCGGACGCC 780

GGGCCCCCTC AGCGCTGGTT TGTGGTATGG CTCGGGACCG CCAACAACCC GGTGGACAAG 840

GGCGCGGCCA AGGCGCTGGC CGAATCGATC CGGCCTTTGG TCGCCCCGCC GCCGGCGCCG 900

GCACCGGCTC CTGCAGAGCC CGCTCCGGCG CCGGCGCCGG CCGGGGAAGT CGCTCCTACC 960

CCGACGACAC CGACACCGCA GCGGACCTTA CCGGCCTGA 999

(2)SEQ ID NO：53的信息：

(i)序列特征：

(A)长度：332个氨基酸

(B)类型：氨基酸

(C)链型：单链

(D)拓扑结构：线型

(xi)序列描述：SEQ ID NO：53：

Met His His His His His His Met His Gln Val Asp Pro Asn Leu Thr

1 5 10 15

Arg Arg Lys Gly Arg Leu Ala Ala Leu Ala Ile Ala Ala Met Ala Ser

20 25 30

Ala Ser Leu Val Thr Val Ala Val Pro Ala Thr Ala Asn Ala Asp Pro

35 40 45

Glu Pro Ala Pro Pro Val Pro Thr Thr Ala Ala Ser Pro Pro Ser Thr

50 55 60

Ala Ala Ala Pro Pro Ala Pro Ala Thr Pro Val Ala Pro Pro Pro Pro

65 70 75 80

Ala Ala Ala Asn Thr Pro Asn Ala Gln Pro Gly Asp Pro Asn Ala Ala

85 90 95

Pro Pro Pro Ala Asp Pro Asn Ala Pro Pro Pro Pro Val Ile Ala Pro

100 105 110

Asn Ala Pro Gln Pro Val Arg Ile Asp Asn Pro Val Gly Gly Phe Ser

115 120 125

Phe Ala Leu Pro Ala Gly Trp Val Glu Ser Asp Ala Ala His Phe Asp

130 135 140

Tyr Gly Ser Ala Leu Leu Ser Lys Thr Thr Gly Asp Pro Pro Phe Pro

145 150 155 160

Gly Gln Pro Pro Pro Val Ala Asn Asp Thr Arg Ile Val Leu Gly Arg

165 170 175

Leu Asp Gln Lys Leu Tyr Ala Ser Ala Glu Ala Thr Asp Ser Lys Ala

180 185 190

Ala Ala Arg Leu Gly Ser Asp Met Gly Glu Phe Tyr Met Pro Tyr Pro

195 200 205

Gly Thr Arg Ile Asn Gln Glu Thr Val Ser Leu Asp Ala Asn Gly Val

210 215 220

Ser Gly Ser Ala Ser Tyr Tyr Glu Val Lys Phe Ser Asp Pro Ser Lys

225 230 235 240

Pro Asn Gly Gln Ile Trp Thr Gly Val Ile Gly Ser Pro Ala Ala Asn

245 250 255

Ala Pro Asp Ala Gly Pro Pro Gln Arg Trp Phe Val Val Trp Leu Gly

260 265 270

Thr Ala Asn Asn Pro Val Asp Lys Gly Ala Ala Lys Ala Leu Ala Glu

275 280 285

Ser Ile Arg Pro Leu Val Ala Pro Pro Pro Ala Pro Ala Pro Ala Pro

290 295 300

Ala Glu Pro Ala Pro Ala Pro Ala Pro Ala Gly Glu Val Ala Pro Thr

305 310 315 320

Pro Thr Thr Pro Thr Pro Gln Arg Thr Leu Pro Ala

325 330

(2)SEQ ID NO：54的信息：

(i)序列特征：

(A)长度：20个氨基酸

(B)类型：氨基酸

(C)链型：单链

(D)拓扑结构：线型

(xi)序列描述：SEQ ID NO：54：

Asp Pro Val Asp Ala Val Ile Asn Thr Thr Xaa Asn Tyr Gly Gln Val

1 5 10 15

Val Ala Ala Leu

20

(2)SEQ ID NO：55的信息：

(i)序列特征：

(A)长度：15个氨基酸

(B)类型：氨基酸

(C)链型：单链

(D)拓扑结构：线型

(xi)序列描述：SEQ ID NO：55：

Ala Val Glu Ser Gly Met Leu Ala Leu Gly Thr Pro Ala Pro Ser

1 5 10 15

(2)SEQ ID NO：56的信息：

(i)序列特征：

(A)长度：19个氨基酸

(B)类型：氨基酸

(C)链型：单链

(D)拓扑结构：线型

(xi)序列描述：SEQ ID NO：56：

Ala Ala Met Lys Pro Arg Thr Gly Asp Gly Pro Leu Glu Ala Ala Lys

1 5 10 15

Glu Gly Arg

(2)SEQ ID NO：57的信息：

(i)序列特征：

(A)长度：15个氨基酸

(B)类型：氨基酸

(C)链型：单链

(D)拓扑结构：线型

(xi)序列描述：SEQ ID NO：57：

Tyr Tyr Trp Cys Pro Gly Gln Pro Phe Asp Pro Ala Trp Gly Pro

1 5 10 15

(2)SEQ ID NO：58的信息：

(i)序列特征：

(A)长度：14个氨基酸

(B)类型：氨基酸

(C)链型：单链

(D)拓扑结构：线型

(xi)序列描述：SEQ ID NO：58：

Asp Ile Gly Ser Glu Ser Thr Glu Asp Gln Gln Xaa Ala Val

1 5 10

(2)SEQ ID NO：59的信息：

(i)序列特征：

(A)长度：13个氨基酸

(B)类型：氨基酸

(C)链型：单链

(D)拓扑结构：线型

(xi)序列描述：SEQ ID NO：59：

Ala Glu Glu Ser Ile Ser Thr Xaa Glu Xaa Ile Val Pro

1 5 10

(2)SEQ ID NO：60的信息：

(i)序列特征：

(A)长度：17个氨基酸

(B)类型：氨基酸

(C)链型：单链

(D)拓扑结构：线型

(xi)序列描述：SEQ ID NO：60：

Asp Pro Glu Pro Ala Pro Pro Val Pro Thr Ala Ala Ala Ala Pro Pro

1 5 10 15

Ala

(2)SEQ ID NO：61的信息：

(i)序列特征：

(A)长度：15个氨基酸

(B)类型：氨基酸

(C)链型：单链

(D)拓扑结构：线型

(xi)序列描述：SEQ ID NO：61：

Ala Pro Lys Thr Tyr Xaa Glu Glu Leu Lys Gly Thr Asp Thr Gly

1 5 10 15

(2)SEQ ID NO：62的信息：

(i)序列特征：

(A)长度：30个氨基酸

(B)类型：氨基酸

(C)链型：单链

(D)拓扑结构：线型

(xi)序列描述：SEQ ID NO：62：

Asp Pro Ala Ser Ala Pro Asp Val Pro Thr Ala Ala Gln Gln Thr Ser

1 5 10 15

Leu Leu Asn Asn Leu Ala Asp Pro Asp Val Ser Phe Ala Asp

20 25 30

(2)SEQ ID NO：63的信息：

(i)序列特征：

(A)长度：24个氨基酸

(B)类型：氨基酸

(C)链型：单链

(D)拓扑结构：线型

(xi)序列描述：SEQ ID NO：63：

Gly Cys Gly Asp Arg Ser Gly Gly Asn Leu Asp Gln Ile Arg Leu Arg

1 5 10 15

Arg Asp Arg Ser Gly Gly Asn Leu

20

(2)SEQ ID NO：64的信息：

(i)序列特征：

(A)长度：187个氨基酸

(B)类型：氨基酸

(C)链型：单链

(D)拓扑结构：线型

(xi)序列描述：SEQ ID NO：64：

Thr Gly Ser Leu Asn Gln Thr His Asn Arg Arg Ala Asn Glu Arg Lys

1 5 10 15

Asn Thr Thr Met Lys Met Val Lys Ser Ile Ala Ala Gly Leu Thr Ala

20 25 30

Ala Ala Ala Ile Gly Ala Ala Ala Ala Gly Val Thr Ser Ile Met Ala

35 40 45

Gly Gly Pro Val Val Tyr Gln Met Gln Pro Val Val Phe Gly Ala Pro

50 55 60

Leu Pro Leu Asp Pro Ala Ser Ala Pro Asp Val Pro Thr Ala Ala Gln

65 70 75 80

Leu Thr Ser Leu Leu Asn Ser Leu Ala Asp Pro Asn Val Ser Phe Ala

85 90 95

Asn Lys Gly Ser Leu Val Glu Gly Gly Ile Gly Gly Thr Glu Ala Arg

100 105 110

Ile Ala Asp His Lys Leu Lys Lys Ala Ala Glu His Gly Asp Leu Pro

115 120 125

Leu Ser Phe Ser Val Thr Asn Ile Gln Pro Ala Ala Ala Gly Ser Ala

130 135 140

Thr Ala Asp Val Ser Val Ser Gly Pro Lys Leu Ser Ser Pro Val Thr

145 150 155 160

Gln Asn Val Thr Phe Val Asn Gln Gly Gly Trp Met Leu Ser Arg Ala

165 170 175

Ser Ala Met Glu Leu Leu Gln Ala Ala Gly Xaa

180 185

(2)SEQ ID NO：65的信息：

(i)序列特征：

(A)长度：148个氨基酸

(B)类型：氨基酸

(C)链型：单链

(D)拓扑结构：线型

(xi)序列描述：SEQ ID NO：65：

Asp Glu Val Thr Val Glu Thr Thr Ser Val Phe Arg Ala Asp Phe Leu

1 5 10 15

Ser Glu Leu Asp Ala Pro Ala Gln Ala Gly Thr Glu Ser Ala Val Ser

20 25 30

Gly Val Glu Gly Leu Pro Pro Gly Ser Ala Leu Leu Val Val Lys Arg

35 40 45

Gly Pro Asn Ala Gly Ser Arg Phe Leu Leu Asp Gln Ala Ile Thr Ser

50 55 60

Ala Gly Arg His Pro Asp Ser Asp Ile Phe Leu Asp Asp Val Thr Val

65 70 75 80

Ser Arg Arg His Ala Glu Phe Arg Leu Glu Asn Asn Glu Phe Asn Val

85 90 95

Val Asp Val Gly Ser Leu Asn Gly Thr Tyr Val Asn Arg Glu Pro Val

100 105 110

Asp Ser Ala Val Leu Ala Asn Gly Asp Glu Val Gln Ile Gly Lys Leu

115 120 125

Arg Leu Val Phe Leu Thr Gly Pro Lys Gln Gly Glu Asp Asp Gly Ser

130 135 140

Thr Gly Gly Pro

145

(2)SEQ ID NO：66的信息：

(i)序列特征：

(A)长度：230个氨基酸

(B)类型：氨基酸

(C)链型：单链

(D)拓扑结构：线型

(xi)序列描述：SEQ ID NO：66：

Thr Ser Asn Arg Pro Ala Arg Arg Gly Arg Arg Ala Pro Arg Asp Thr

1 5 10 15

Gly Pro Asp Arg Ser Ala Ser Leu Ser Leu Val Arg His Arg Arg Gln

20 25 30

Gln Arg Asp Ala Leu Cys Leu Ser Ser Thr Gln Ile Ser Arg Gln Ser

35 40 45

Asn Leu Pro Pro Ala Ala Gly Gly Ala Ala Asn Tyr Ser Arg Arg Asn

50 55 60

Phe Asp Val Arg Ile Lys Ile Phe Met Leu Val Thr Ala Val Val Leu

65 70 75 80

Leu Cys Cys Ser Gly Val Ala Thr Ala Ala Pro Lys Thr Tyr Cys Glu

85 90 95

Glu Leu Lys Gly Thr Asp Thr Gly Gln Ala Cys Gln Ile Gln Met Ser

100 105 110

Asp Pro Ala Tyr Asn Ile Asn Ile Ser Leu Pro Ser Tyr Tyr Pro Asp

115 120 125

Gln Lys Ser Leu Glu Asn Tyr Ile Ala Gln Thr Arg Asp Lys Phe Leu

130 135 140

Ser Ala Ala Thr Ser Ser Thr Pro Arg Glu Ala Pro Tyr Glu Leu Asn

145 150 155 160

Ile Thr Ser Ala Thr Tyr Gln Ser Ala Ile Pro Pro Arg Gly Thr Gln

165 170 175

Ala Val Val Leu Xaa Val Tyr His Asn Ala Gly Gly Thr His Pro Thr

180 185 190

Thr Thr Tyr Lys Ala Phe Asp Trp Asp Gln Ala Tyr Arg Lys Pro Ile

195 200 205

Thr Tyr Asp Thr Leu Trp Gln Ala Asp Thr Asp Pro Leu Pro Val Val

210 215 220

Phe Pro Ile Val Ala Arg

225 230

(2)SEQ ID NO：67的信息：

(i)序列特征：

(A)长度：132个氨基酸

(B)类型：氨基酸

(C)链型：单链

(D)拓扑结构：线型

(xi)序列描述：SEQ ID NO：67：

Thr Ala Ala Ser Asp Asn Phe Gln Leu Ser Gln Gly Gly Gln Gly Phe

1 5 10 15

Ala Ile Pro Ile Gly Gln Ala Met Ala Ile Ala Gly Gln Ile Arg Ser

20 25 30

Gly Gly Gly Ser Pro Thr Val His Ile Gly Pro Thr Ala Phe Leu Gly

35 40 45

Leu Gly Val Val Asp Asn Asn Gly Asn Gly Ala Arg Val Gln Arg Val

50 55 60

Val Gly Ser Ala Pro Ala Ala Ser Leu Gly Ile Ser Thr Gly Asp Val

65 70 75 80

Ile Thr Ala Val Asp Gly Ala Pro Ile Asn Ser Ala Thr Ala Met Ala

85 90 95

Asp Ala Leu Asn Gly His His Pro Gly Asp Val Ile Ser Val Asn Trp

100 105 110

Gln Thr Lys Ser Gly Gly Thr Arg Thr Gly Asn Val Thr Leu Ala Glu

115 120 125

Gly Pro Pro Ala

130

(2)SEQ ID NO：68的信息：

(i)序列特征：

(A)长度：100个氨基酸

(B)类型：氨基酸

(C)链型：单链

(D)拓扑结构：线型

(xi)序列描述：SEQ ID NO：68：

Val Pro Leu Arg Ser Pro Ser Met Ser Pro Ser Lys Cys Leu Ala Ala

1 5 10 15

Ala Gln Arg Asn Pro Val Ile Arg Arg Arg Arg Leu Ser Asn Pro Pro

20 25 30

Pro Arg Lys Tyr Arg Ser Met Pro Ser Pro Ala Thr Ala Ser Ala Gly

35 40 45

Met Ala Arg Val Arg Arg Arg Ala Ile Trp Arg Gly Pro Ala Thr Xaa

50 55 60

Ser Ala Gly Met Ala Arg Val Arg Arg Trp Xaa Val Met Pro Xaa Val

65 70 75 80

Ile Gln Ser Thr Xaa Ile Arg Xaa Xaa Gly Pro Phe Asp Asn Arg Gly

85 90 95

Ser Glu Arg Lys

100

(2)SEQ ID NO：69的信息：

(i)序列特征：

(A)长度：163个氨基酸

(B)类型：氨基酸

(C)链型：单链

(D)拓扑结构：线型

(xi)序列描述：SEQ ID NO：69：

Met Thr Asp Asp Ile Leu Leu Ile Asp Thr Asp Glu Arg Val Arg Thr

1 5 10 15

Leu Thr Leu Asn Arg Pro Gln Ser Arg Asn Ala Leu Ser Ala Ala Leu

20 25 30

Arg Asp Arg Phe Phe Ala Xaa Leu Xaa Asp Ala Glu Xaa Asp Asp Asp

35 40 45

Ile Asp Val Val Ile Leu Thr Gly Ala Asp Pro Val Phe Cys Ala Gly

50 55 60

Leu Asp Leu Lys Val Ala Gly Arg Ala Asp Arg Ala Ala Gly His Leu

65 70 75 80

Thr Ala Val Gly Gly His Asp Gln Ala Gly Asp Arg Arg Asp Gln Arg

85 90 95

Arg Arg Gly His Arg Arg Ala Arg Thr Gly Ala Val Leu Arg His Pro

100 105 110

Asp Arg Leu Arg Ala Arg Pro Leu Arg Arg His Pro Arg Pro Gly Gly

115 120 125

Ala Ala Ala His Leu Gly Thr Gln Cys Val Leu Ala Ala Lys Gly Arg

130 135 140

His Arg Xaa Gly Pro Val Asp Glu Pro Asp Arg Arg Leu Pro Val Arg

145 150 155 160

Asp Arg Arg

(2)SEQ ID NO：70的信息：

(i)序列特征：

(A)长度：344个氨基酸

(B)类型：氨基酸

(C)链型：单链

(D)拓扑结构：线型

(xi)序列描述：SEQ ID NO：70：

Met Lys Phe Val Asn His Ile Glu Pro Val Ala Pro Arg Arg Ala Gly

1 5 10 15

Gly Ala Val Ala Glu Val Tyr Ala Glu Ala Arg Arg Glu Phe Gly Arg

20 25 30

Leu Pro Glu Pro Leu Ala Met Leu Ser Pro Asp Glu Gly Leu Leu Thr

35 40 45

Ala Gly Trp Ala Thr Leu Arg Glu Thr Leu Leu Val Gly Gln Val Pro

50 55 60

Arg Gly Arg Lys Glu Ala Val Ala Ala Ala Val Ala Ala Ser Leu Arg

65 70 75 80

Cys Pro Trp Cys Val Asp Ala His Thr Thr Met Leu Tyr Ala Ala Gly

85 90 95

Gln Thr Asp Thr Ala Ala Ala Ile Leu Ala Gly Thr Ala Pro Ala Ala

100 105 110

Gly Asp Pro Asn Ala Pro Tyr Val Ala Trp Ala Ala Gly Thr Gly Thr

115 120 125

Pro Ala Gly Pro Pro Ala Pro Phe Gly Pro Asp Val Ala Ala Glu Tyr

130 135 140

Leu Gly Thr Ala Val Gln Phe His Phe Ile Ala Arg Leu Val Leu Val

145 150 155 160

Leu Leu Asp Glu Thr Phe Leu Pro Gly Gly Pro Arg Ala Gln Gln Leu

165 170 175

Met Arg Arg Ala Gly Gly Leu Val Phe Ala Arg Lys Val Arg Ala Glu

180 185 190

His Arg Pro Gly Arg Ser Thr Arg Arg Leu Glu Pro Arg Thr Leu Pro

195 200 205

Asp Asp Leu Ala Trp Ala Thr Pro Ser Glu Pro Ile Ala Thr Ala Phe

210 215 220

Ala Ala Leu Ser His His Leu Asp Thr Ala Pro His Leu Pro Pro Pro

225 230 235 240

Thr Arg Gln Val Val Arg Arg Val Val Gly Ser Trp His Gly Glu Pro

245 250 255

Met Pro Met Ser Ser Arg Trp Thr Asn Glu His Thr Ala Glu Leu Pro

260 265 270

Ala Asp Leu His Ala Pro Thr Arg Leu Ala Leu Leu Thr Gly Leu Ala

275 280 285

Pro His Gln Val Thr Asp Asp Asp Val Ala Ala Ala Arg Ser Leu Leu

290 295 300

Asp Thr Asp Ala Ala Leu Val Gly Ala Leu Ala Trp Ala Ala Phe Thr

305 310 315 320

Ala Ala Arg Arg Ile Gly Thr Trp Ile Gly Ala Ala Ala Glu Gly Gln

325 330 335

Val Ser Arg Gln Asn Pro Thr Gly

340

(2)SEQ ID NO：71的信息：

(i)序列特征：

(A)长度：485个氨基酸

(B)类型：氨基酸

(C)链型：单链

(D)拓扑结构：线型

(xi)序列描述：SEQ ID NO：71：

Asp Asp Pro Asp Met Pro Gly Thr Val Ala Lys Ala Val Ala Asp Ala

1 5 10 15

Leu Gly Arg Gly Ile Ala Pro Val Glu Asp Ile Gln Asp Cys Val Glu

20 25 30

Ala Arg Leu Gly Glu Ala Gly Leu Asp Asp Val Ala Arg Val Tyr Ile

35 40 45

Ile Tyr Arg Gln Arg Arg Ala Glu Leu Arg Thr Ala Lys Ala Leu Leu

50 55 60

Gly Val Arg Asp Glu Leu Lys Leu Ser Leu Ala Ala Val Thr Val Leu

65 70 75 80

Arg Glu Arg Tyr Leu Leu His Asp Glu Gln Gly Arg Pro Ala Glu Ser

85 90 95

Thr Gly Glu Leu Met Asp Arg Ser Ala Arg Cys Val Ala Ala Ala Glu

100 105 110

Asp Gln Tyr Glu Pro Gly Ser Ser Arg Arg Trp Ala Glu Arg Phe Ala

115 120 125

Thr Leu Leu Arg Asn Leu Glu Phe Leu Pro Asn Ser Pro Thr Leu Met

130 135 140

Asn Ser Gly Thr Asp Leu Gly Leu Leu Ala Gly Cys Phe Val Leu Pro

145 150 155 160

Ile Glu Asp Ser Leu Gln Ser Ile Phe Ala Thr Leu Gly Gln Ala Ala

165 170 175

Glu Leu Gly Arg Ala Gly Gly Gly Thr Gly Tyr Ala Phe Ser His Leu

180 185 190

Arg Pro Ala Gly Asp Arg Val Ala Ser Thr Gly Gly Thr Ala Ser Gly

195 200 205

Pro Val Ser Phe Leu Arg Leu Tyr Asp Ser Ala Ala Gly Val Val Ser

210 215 220

Met Gly Gly Arg Arg Arg Gly Ala Cys Met Ala Val Leu Asp Val Ser

225 230 235 240

His Pro Asp Ile Cys Asp Phe Val Thr Ala Lys Ala Glu Ser Pro Ser

245 250 255

Glu Leu Pro His Phe Asn Leu Ser Val Gly Val Thr Asp Ala Phe Leu

260 265 270

Arg Ala Val Glu Arg Asn Gly Leu His Arg Leu Val Asn Pro Arg Thr

275 280 285

Gly Lys Ile Val Ala Arg Met Pro Ala Ala Glu Leu Phe Asp Ala Ile

290 295 300

Cys Lys Ala Ala His Ala Gly Gly Asp Pro Gly Leu Val Phe Leu Asp

305 310 315 320

Thr Ile Asn Arg Ala Asn Pro Val Pro Gly Arg Gly Arg Ile Glu Ala

325 330 335

Thr Asn Pro Cys Gly Glu Val Pro Leu Leu Pro Tyr Glu Ser Cys Asn

340 345 350

Leu Gly Ser Ile Asn Leu Ala Arg Met Leu Ala Asp Gly Arg Val Asp

355 360 365

Trp Asp Arg Leu Glu Glu Val Ala Gly Val Ala Val Arg Phe Leu Asp

370 375 380

Asp Val Ile Asp Val Ser Arg Tyr Pro Phe Pro Glu Leu Gly Glu Ala

385 390 395 400

Ala Arg Ala Thr Arg Lys Ile Gly Leu Gly Val Met Gly Leu Ala Glu

405 410 415

Leu Leu Ala Ala Leu Gly Ile Pro Tyr Asp Ser Glu Glu Ala Val Arg

420 425 430

Leu Ala Thr Arg Leu Met Arg Arg Ile Gln Gln Ala Ala His Thr Ala

435 440 445

Ser Arg Arg Leu Ala Glu Glu Arg Gly Ala Phe Pro Ala Phe Thr Asp

450 455 460

Ser Arg Phe Ala Arg Ser Gly Pro Arg Arg Asn Ala Gln Val Thr Ser

465 470 475 480

Val Ala Pro Thr Gly

485

(2)SEQ ID NO：72的信息：

(i)序列特征：

(A)长度：267个氨基酸

(B)类型：氨基酸

(C)链型：单链

(D)拓扑结构：线型

(xi)序列描述：SEQ ID NO：72：

Gly Val Ile Val Leu Asp Leu Glu Pro Arg Gly Pro Leu Pro Thr Glu

1 5 10 15

Ile Tyr Trp Arg Arg Arg Gly Leu Ala Leu Gly Ile Ala Val Val Val

20 25 30

Val Gly Ile Ala Val Ala Ile Val Ile Ala Phe Val Asp Ser Ser Ala

35 40 45

Gly Ala Lys Pro Val Ser Ala Asp Lys Pro Ala Ser Ala Gln Ser His

50 55 60

Pro Gly Ser Pro Ala Pro Gln Ala Pro Gln Pro Ala Gly Gln Thr Glu

65 70 75 80

Gly Asn Ala Ala Ala Ala Pro Pro Gln Gly Gln Asn Pro Glu Thr Pro

85 90 95

Thr Pro Thr Ala Ala Val Gln Pro Pro Pro Val Leu Lys Glu Gly Asp

100 105 110

Asp Cys Pro Asp Ser Thr Leu Ala Val Lys Gly Leu Thr Asn Ala Pro

115 120 125

Gln Tyr Tyr Val Gly Asp Gln Pro Lys Phe Thr Met Val Val Thr Asn

130 135 140

Ile Gly Leu Val Ser Cys Lys Arg Asp Val Gly Ala Ala Val Leu Ala

145 150 155 160

Ala Tyr Val Tyr Ser Leu Asp Asn Lys Arg Leu Trp Ser Asn Leu Asp

165 170 175

Cys Ala Pro Ser Asn Glu Thr Leu Val Lys Thr Phe Ser Pro Gly Glu

180 185 190

Gln Val Thr Thr Ala Val Thr Trp Thr Gly Met Gly Ser Ala Pro Arg

195 200 205

Cys Pro Leu Pro Arg Pro Ala Ile Gly Pro Gly Thr Tyr Asn Leu Val

210 215 220

Val Gln Leu Gly Asn Leu Arg Ser Leu Pro Val Pro Phe Ile Leu Asn

225 230 235 240

Gln Pro Pro Pro Pro Pro Gly Pro Val Pro Ala Pro Gly Pro Ala Gln

245 250 255

Ala Pro Pro Pro Glu Ser Pro Ala Gln Gly Gly

260 265

(2)SEQ ID NO：73的信息：

(i)序列特征：

(A)长度：97个氨基酸

(B)类型：氨基酸

(C)链型：单链

(D)拓扑结构：线型

(xi)序列描述：SEQ ID NO：73：

Leu Ile Ser Thr Gly Lys Ala Ser His Ala Ser Leu Gly Val Gln Val

1 5 10 15

Thr Asn Asp Lys Asp Thr Pro Gly Ala Lys Ile Val Glu Val Val Ala

20 25 30

Gly Gly Ala Ala Ala Asn Ala Gly Val Pro Lys Gly Val Val Val Thr

35 40 45

Lys Val Asp Asp Arg Pro Ile Asn Ser Ala Asp Ala Leu Val Ala Ala

50 55 60

Val Arg Ser Lys Ala Pro Gly Ala Thr Val Ala Leu Thr Phe Gln Asp

65 70 75 80

Pro Ser Gly Gly Ser Arg Thr Val Gln Val Thr Leu Gly Lys Ala Glu

85 90 95

Gln

(2)SEQ ID NO：74的信息：

(i)序列特征：

(A)长度：364个氨基酸

(B)类型：氨基酸

(C)链型：单链

(D)拓扑结构：线型

(xi)序列描述：SEQ ID NO：74：

Gly Ala Ala Val Ser Leu Leu Ala Ala Gly Thr Leu Val Leu Thr Ala

1 5 10 15

Cys Gly Gly Gly Thr Asn Ser Ser Ser Ser Gly Ala Gly Gly Thr Ser

20 25 30

Gly Ser Val His Cys Gly Gly Lys Lys Glu Leu His Ser Ser Gly Ser

35 40 45

Thr Ala Gln Glu Asn Ala Met Glu Gln Phe Val Tyr Ala Tyr Val Arg

50 55 60

Ser Cys Pro Gly Tyr Thr Leu Asp Tyr Asn Ala Asn Gly Ser Gly Ala

65 70 75 80

Gly Val Thr Gln Phe Leu Asn Asn Glu Thr Asp Phe Ala Gly Ser Asp

85 90 95

Val Pro Leu Asn Pro Ser Thr Gly Gln Pro Asp Arg Ser Ala Glu Arg

100 105 110

Cys Gly Ser Pro Ala Trp Asp Leu Pro Thr Val Phe Gly Pro Ile Ala

115 120 125

Ile Thr Tyr Asn Ile Lys Gly Val Ser Thr Leu Asn Leu Asp Gly Pro

130 135 140

Thr Thr Ala Lys Ile Phe Asn Gly Thr Ile Thr Val Trp Asn Asp Pro

145 150 155 160

Gln Ile Gln Ala Leu Asn Ser Gly Thr Asp Leu Pro Pro Thr Pro Ile

165 170 175

Ser Val Ile Phe Arg Ser Asp Lys Ser Gly Thr Ser Asp Asn Phe Gln

180 185 190

Lys Tyr Leu Asp Gly Val Ser Asn Gly Ala Trp Gly Lys Gly Ala Ser

195 200 205

Glu Thr Phe Ser Gly Gly Val Gly Val Gly Ala Ser Gly Asn Asn Gly

210 215 220

Thr Ser Ala Leu Leu Gln Thr Thr Asp Gly Ser Ile Thr Tyr Asn Glu

225 230 235 240

Trp Ser Phe Ala Val Gly Lys Gln Leu Asn Met Ala Gln Ile Ile Thr

245 250 255

Ser Ala Gly Pro Asp Pro Val Ala Ile Thr Thr Glu Ser Val Gly Lys

260 265 270

Thr Ile Ala Gly Ala Lys Ile Met Gly Gln Gly Asn Asp Leu Val Leu

275 280 285

Asp Thr Ser Ser Phe Tyr Arg Pro Thr Gln Pro Gly Ser Tyr Pro Ile

290 295 300

Val Leu Ala Thr Tyr Glu Ile Val Cys Ser Lys Tyr Pro Asp Ala Thr

305 310 315 320

Thr Gly Thr Ala Val Arg Ala Phe Met Gln Ala Ala Ile Gly Pro Gly

325 330 335

Gln Glu Gly Leu Asp Gln Tyr Gly Ser Ile Pro Leu Pro Lys Ser Phe

340 345 350

Gln Ala Lys Leu Ala Ala Ala Val Asn Ala Ile Ser

355 360

(2)SEQ ID NO：75的信息：

(i)序列特征：

(A)长度：309个氨基酸

(B)类型：氨基酸

(C)链型：单链

(D)拓扑结构：线型

(xi)序列描述：SEQ ID NO：75：

Gln Ala Ala Ala Gly Arg Ala Val Arg Arg Thr Gly His Ala Glu Asp

1 5 10 15

Gln Thr His Gln Asp Arg Leu His His Gly Cys Arg Arg Ala Ala Val

20 25 30

Val Val Arg Gln Asp Arg Ala Ser Val Ser Ala Thr Ser Ala Arg Pro

35 40 45

Pro Arg Arg His Pro Ala Gln Gly His Arg Arg Arg Val Ala Pro Ser

50 55 60

Gly Gly Arg Arg Arg Pro His Pro His His Val Gln Pro Asp Asp Arg

65 70 75 80

Arg Asp Arg Pro Ala Leu Leu Asp Arg Thr Gln Pro Ala Glu His Pro

85 90 95

Asp Pro His Arg Arg Gly Pro Ala Asp Pro Gly Arg Val Arg Gly Arg

100 105 110

Gly Arg Leu Arg Arg Val Asp Asp Gly Arg Leu Gln Pro Asp Arg Asp

115 120 125

Ala Asp His Gly Ala Pro Val Arg Gly Arg Gly Pro His Arg Gly Val

130 135 140

Gln His Arg Gly Gly Pro Val Phe Val Arg Arg Val Pro Gly Val Arg

145 150 155 160

Cys Ala His Arg Arg Gly His Arg Arg Val Ala Ala Pro Gly Gln Gly

165 170 175

Asp Val Leu Arg Ala Gly Leu Arg Val Glu Arg Leu Arg Pro Val Ala

180 185 190

Ala Val Glu Asn Leu His Arg Gly Ser Gln Arg Ala Asp Gly Arg Val

195 200 205

Phe Arg Pro Ile Arg Arg Gly Ala Arg Leu Pro Ala Arg Arg Ser Arg

210 215 220

Ala Gly Pro Gln Gly Arg Leu His Leu Asp Gly Ala Gly Pro Ser Pro

225 230 235 240

Leu Pro Ala Arg Ala Gly Gln Gln Gln Pro Ser Ser Ala Gly Gly Arg

245 250 255

Arg Ala Gly Gly Ala Glu Arg Ala Asp Pro Gly Gln Arg Gly Arg His

260 265 270

His Gln Gly Gly His Asp Pro Gly Arg Gln Gly Ala Gln Arg Gly Thr

275 280 285

Ala Gly Val Ala His Ala Ala Ala Gly Pro Arg Arg Ala Ala Val Arg

290 295 300

Asn Arg Pro Arg Arg

305

(2)SEQ ID NO：76的信息：

(i)序列特征：

(A)长度：580个氨基酸

(B)类型：氨基酸

(C)链型：单链

(D)拓扑结构：线型

(xi)序列描述：SEQ ID NO：76：

Ser Ala Val Trp Cys Leu Asn Gly Phe Thr Gly Arg His Arg His Gly

1 5 10 15

Arg Cys Arg Val Arg Ala Ser Gly Trp Arg Ser Ser Asn Arg Trp Cys

20 25 20

Ser Thr Thr Ala Asp Cys Cys Ala Ser Lys Thr Pro Thr Gln Ala Ala

35 40 45

Ser Pro Leu Glu Arg Arg Phe Thr Cys Cys Ser Pro Ala Val Gly Cys

50 55 60

Arg Phe Arg Ser Phe Pro Val Arg Arg Leu Ala Leu Gly Ala Arg Thr

65 70 75 80

Ser Arg Thr Leu Gly Val Arg Arg Thr Leu Ser Gln Trp Asn Leu Ser

85 90 95

Pro Arg Ala Gln Pro Ser Cys Ala Val Thr Val Glu Ser His Thr His

100 105 110

Ala Ser Pro Arg Met Ala Lys Leu Ala Arg Val Val Gly Leu Val Gln

115 120 125

Glu Glu Gln Pro Ser Asp Met Thr Asn His Pro Arg Tyr Ser Pro Pro

130 135 140

Pro Gln Gln Pro Gly Thr Pro Gly Tyr Ala Gln Gly Gln Gln Gln Thr

145 150 155 160

Tyr Ser Gln Gln Phe Asp Trp Arg Tyr Pro Pro Ser Pro Pro Pro Gln

165 170 175

Pro Thr Gln Tyr Arg Gln Pro Tyr Glu Ala Leu Gly Gly Thr Arg Pro

180 185 190

Gly Leu Ile Pro Gly Val Ile Pro Thr Met Thr Pro Pro Pro Gly Met

195 200 205

Val Arg Gln Arg Pro Arg Ala Gly Met Leu Ala Ile Gly Ala Val Thr

210 215 220

Ile Ala Val Val Ser Ala Gly Ile Gly Gly Ala Ala Ala Ser Leu Val

225 230 235 240

Gly Phe Asn Arg Ala Pro Ala Gly Pro Ser Gly Gly Pro Val Ala Ala

245 250 255

Ser Ala Ala Pro Ser Ile Pro Ala Ala Asn Met Pro Pro Gly Ser Val

260 265 270

Glu Gln Val Ala Ala Lys Val Val Pro Ser Val Val Met Leu Glu Thr

275 280 285

Asp Leu Gly Arg Gln Ser Glu Glu Gly Ser Gly Ile Ile Leu Ser Ala

290 295 300

Glu Gly Leu Ile Leu Thr Asn Asn His Val Ile Ala Ala Ala Ala Lys

305 310 315 320

Pro Pro Leu Gly Ser Pro Pro Pro Lys Thr Thr Val Thr Phe Ser Asp

325 330 335

Gly Arg Thr Ala Pro Phe Thr Val Val Gly Ala Asp Pro Thr Ser Asp

340 345 350

Ile Ala Val Val Arg Val Gln Gly Val Ser Gly Leu Thr Pro Ile Ser

355 360 365

Leu Gly Ser Ser Ser Asp Leu Arg Val Gly Gln Pro Val Leu Ala Ile

370 375 380

Gly Ser Pro Leu Gly Leu Glu Gly Thr Val Thr Thr Gly Ile Val Ser

385 390 395 400

Ala Leu Asn Arg Pro Val Ser Thr Thr Gly Glu Ala Gly Asn Gln Asn

405 410 415

Thr Val Leu Asp Ala Ile Gln Thr Asp Ala Ala Ile Asn Pro Gly Asn

420 425 430

Ser Gly Gly Ala Leu Val Asn Met Asn Ala Gln Leu Val Gly Val Asn

435 440 445

Ser Ala Ile Ala Thr Leu Gly Ala Asp Ser Ala Asp Ala Gln Ser Gly

450 455 460

Ser Ile Gly Leu Gly Phe Ala Ile Pro Val Asp Gln Ala Lys Arg Ile

465 470 475 480

Ala Asp Glu Leu Ile Ser Thr Gly Lys Ala Ser His Ala Ser Leu Gly

485 490 495

Val Gln Val Thr Asn Asp Lys Asp Thr Pro Gly Ala Lys Ile Val Glu

500 505 510

Val Val Ala Gly Gly Ala Ala Ala Asn Ala Gly Val Pro Lys Gly Val

515 520 525

Val Val Thr Lys Val Asp Asp Arg Pro Ile Asn Ser Ala Asp Ala Leu

530 535 540

Val Ala Ala Val Arg Ser Lys Ala Pro Gly Ala Thr Val Ala Leu Thr

545 550 555 560

Phe Gln Asp Pro Ser Gly Gly Ser Arg Thr Val Gln Val Thr Leu Gly

565 570 575

Lys Ala Glu Gln

580

(2)SEQ ID NO：77的信息：

(i)序列特征：

(A)长度：233个氨基酸

(B)类型：氨基酸

(C)链型：单链

(D)拓扑结构：线型

(xi)序列描述：SEQ ID NO：77：

Met Asn Asp Gly Lys Arg Ala Val Thr Ser Ala Val Leu Val Val Leu

1 5 10 15

Gly Ala Cys Leu Ala Leu Trp Leu Ser Gly Cys Ser Ser Pro Lys Pro

20 25 30

Asp Ala Glu Glu Gln Gly Val Pro Val Ser Pro Thr Ala Ser Asp Pro

35 40 45

Ala Leu Leu Ala Glu Ile Arg Gln Ser Leu Asp Ala Thr Lys Gly Leu

50 55 60

Thr Ser Val His Val Ala Val Arg Thr Thr Gly Lys Val Asp Ser Leu

65 70 75 80

Leu Gly Ile Thr Ser Ala Asp Val Asp Val Arg Ala Asn Pro Leu Ala

85 90 95

Ala Lys Gly Val Cys Thr Tyr Asn Asp Glu Gln Gly Val Pro Phe Arg

100 105 110

Val Gln Gly Asp Asn Ile Ser Val Lys Leu Phe Asp Asp Trp Ser Asn

115 120 125

Leu Gly Ser Ile Ser Glu Leu Ser Thr Ser Arg Val Leu Asp Pro Ala

130 135 140

Ala Gly Val Thr Gln Leu Leu Ser Gly Val Thr Asn Leu Gln Ala Gln

145 150 155 160

Gly Thr Glu Val Ile Asp Gly Ile Ser Thr Thr Lys Ile Thr Gly Thr

165 170 175

Ile Pro Ala Ser Ser Val Lys Met Leu Asp Pro Gly Ala Lys Ser Ala

180 185 190

Arg Pro Ala Thr Val Trp Ile Ala Gln Asp Gly Ser His His Leu Val

195 200 205

Arg Ala Ser Ile Asp Leu Gly Ser Gly Ser Ile Gln Leu Thr Gln Ser

210 215 220

Lys Trp Asn Glu Pro Val Asn Val Asp

225 230

(2)SEQ ID NO：78的信息：

(i)序列特征：

(A)长度：66个氨基酸

(B)类型：氨基酸

(C)链型：单链

(D)拓扑结构：线型

(xi)序列描述：SEQ ID NO：78：

Val Ile Asp Ile Ile Gly Thr Ser Pro Thr Ser Trp Glu Gln Ala Ala

1 5 10 15

Ala Glu Ala Val Gln Arg Ala Arg Asp Ser Val Asp Asp Ile Arg Val

20 25 30

Ala Arg Val Ile Glu Gln Asp Met Ala Val Asp Ser Ala Gly Lys Ile

35 40 45

Thr Tyr Arg Ile Lys Leu Glu Val Ser Phe Lys Met Arg Pro Ala Gln

50 55 60

Pro Arg

65

(2)SEQ ID NO：79的信息：

(i)序列特征：

(A)长度：69个氨基酸

(B)类型：氨基酸

(C)链型：单链

(D)拓扑结构：线型

(xi)序列描述：SEQ ID NO：79：

Val Pro Pro Ala Pro Pro Leu Pro Pro Leu Pro Pro Ser Pro Ile Ser

1 5 10 15

Cys Ala Ser Pro Pro Ser Pro Pro Leu Pro Pro Ala Pro Pro Val Ala

20 25 30

Pro Gly Pro Pro Met Pro Pro Leu Asp Pro Trp Pro Pro Ala Pro Pro

35 40 45

Leu Pro Tyr Ser Thr Pro Pro Gly Ala Pro Leu Pro Pro Ser Pro Pro

50 55 60

Ser Pro Pro Leu Pro

65

(2)SEQ ID NO：80的信息：

(i)序列特征：

(A)长度：355个氨基酸

(B)类型：氨基酸

(C)链型：单链

(D)拓扑结构：线型

(xi)序列描述：SEQ ID NO：80：

Met Ser Asn Ser Arg Arg Arg Ser Leu Arg Trp Ser Trp Leu Leu Ser

1 5 10 15

Val Leu Ala Ala Val Gly Leu Gly Leu Ala Thr Ala Pro Ala Gln Ala

20 25 30

Ala Pro Pro Ala Leu Ser Gln Asp Arg Phe Ala Asp Phe Pro Ala Leu

35 40 45

Pro Leu Asp Pro Ser Ala Met Val Ala Gln Val Ala Pro Gln Val Val

50 55 60

Asn Ile Asn Thr Lys Leu Gly Tyr Asn Asn Ala Val Gly Ala Gly Thr

65 70 75 80

Gly Ile Val Ile Asp Pro Asn Gly Val Val Leu Thr Asn Asn His Val

85 90 95

Ile Ala Gly Ala Thr Asp Ile Asn Ala Phe Ser Val Gly Ser Gly Gln

100 105 110

Thr Tyr Gly Val Asp Val Val Gly Tyr Asp Arg Thr Gln Asp Val Ala

115 120 125

Val Leu Gln Leu Arg Gly Ala Gly Gly Leu Pro Ser Ala Ala Ile Gly

130 135 140

Gly Gly Val Ala Val Gly Glu Pro Val Val Ala Met Gly Asn Ser Gly

145 150 155 160

Gly Gln Gly Gly Thr Pro Arg Ala Val Pro Gly Arg Val Val Ala Leu

165 170 175

Gly Gln Thr Val Gln Ala Ser Asp Ser Leu Thr Gly Ala Glu Glu Thr

180 185 190

Leu Asn Gly Leu Ile Gln Phe Asp Ala Ala Ile Gln Pro Gly Asp Ser

195 200 205

Gly Gly Pro Val Val Asn Gly Leu Gly Gln Val Val Gly Met Asn Thr

210 215 220

Ala Ala Ser Asp Asn Phe Gln Leu Ser Gln Gly Gly Gln Gly Phe Ala

225 230 235 240

Ile Pro Ile Gly Gln Ala Met Ala Ile Ala Gly Gln Ile Arg Ser Gly

245 250 255

Gly Gly Ser Pro Thr Val His Ile Gly Pro Thr Ala Phe Leu Gly Leu

260 265 270

Gly Val Val Asp Asn Asn Gly Asn Gly Ala Arg Val Gln Arg Val Val

275 280 285

Gly Ser Ala Pro Ala Ala Ser Leu Gly Ile Ser Thr Gly Asp Val Ile

290 295 300

Thr Ala Val Asp Gly Ala Pro Ile Asn Ser Ala Thr Ala Met Ala Asp

305 310 315 320

Ala Leu Asn Gly His His Pro Gly Asp Val Ile Ser Val Asn Trp Gln

325 330 335

Thr Lys Ser Gly Gly Thr Arg Thr Gly Asn Val Thr Leu Ala Glu Gly

340 345 350

Pro Pro Ala

355

(2)SEQ ID NO：81的信息：

(i)序列特征：

(A)长度：205个氨基酸

(B)类型：氨基酸

(C)链型：单链

(D)拓扑结构：线型

(xi)序列描述：SEQ ID NO：81：

Ser Pro Lys Pro Asp Ala Glu Glu Gln Gly Val Pro Val Ser Pro Thr

1 5 10 15

Ala Ser Asp Pro Ala Leu Leu Ala Glu Ile Arg Gln Ser Leu Asp Ala

20 25 30

Thr Lys Gly Leu Thr Ser Val His Val Ala Val Arg Thr Thr Gly Lys

35 40 45

Val Asp Ser Leu Leu Gly Ile Thr Ser Ala Asp Val Asp Val Arg Ala

50 55 60

Asn Pro Leu Ala Ala Lys Gly Val Cys Thr Tyr Asn Asp Glu Gln Gly

65 70 75 80

Val Pro Phe Arg Val Gln Gly Asp Asn Ile Ser Val Lys Leu Phe Asp

85 90 95

Asp Trp Ser Asn Leu Gly Ser Ile Ser Glu Leu Ser Thr Ser Arg Val

100 105 110

Leu Asp Pro Ala Ala Gly Val Thr Gln Leu Leu Ser Gly Val Thr Asn

115 120 125

Leu Gln Ala Gln Gly Thr Glu Val Ile Asp Gly Ile Ser Thr Thr Lys

130 135 140

Ile Thr Gly Thr Ile Pro Ala Ser Ser Val Lys Met Leu Asp Pro Gly

145 150 155 160

Ala Lys Ser Ala Arg Pro Ala Thr Val Trp Ile Ala Gln Asp Gly Ser

165 170 175

His His Leu Val Arg Ala Ser Ile Asp Leu Gly Ser Gly Ser Ile Gln

180 185 190

Leu Thr Gln Ser Lys Trp Asn Glu Pro Val Asn Val Asp

195 200 205

(2)SEQ ID NO：82的信息：

(i)序列特征：

(A)长度：286个氨基酸

(B)类型：氨基酸

(C)链型：单链

(D)拓扑结构：线型

(xi)序列描述：SEQ ID NO：82：

Gly Asp Ser Phe Trp Ala Ala Ala Asp Gln Met Ala Arg Gly Phe Val

1 5 10 15

Leu Gly Ala Thr Ala Gly Arg Thr Thr Leu Thr Gly Glu Gly Leu Gln

20 25 30

His Ala Asp Gly His Ser Leu Leu Leu Asp Ala Thr Asn Pro Ala Val

35 40 45

Val Ala Tyr Asp Pro Ala Phe Ala Tyr Glu Ile Gly Tyr Ile Xaa Glu

50 55 60

Ser Gly Leu Ala Arg Met Cys Gly Glu Asn Pro Glu Asn Ile Phe Phe

65 70 75 80

Tyr Ile Thr Val Tyr Asn Glu Pro Tyr Val Gln Pro Pro Glu Pro Glu

85 90 95

Asn Phe Asp Pro Glu Gly Val Leu Gly Gly Ile Tyr Arg Tyr His Ala

100 105 110

Ala Thr Glu Gln Arg Thr Asn Lys Xaa Gln Ile Leu Ala Ser Gly Val

115 120 125

Ala Met Pro Ala Ala Leu Arg Ala Ala Gln Met Leu Ala Ala Glu Trp

130 135 140

Asp Val Ala Ala Asp Val Trp Ser Val Thr Ser Trp Gly Glu Leu Asn

145 150 155 160

Arg Asp Gly Val Val Ile Glu Thr Glu Lys Leu Arg His Pro Asp Arg

165 170 175

Pro Ala Gly Val Pro Tyr Val Thr Arg Ala Leu Glu Asn Ala Arg Gly

180 185 190

Pro Val Ile Ala Val Ser Asp Trp Met Arg Ala Val Pro Glu Gln Ile

195 200 205

Arg Pro Trp Val Pro Gly Thr Tyr Leu Thr Leu Gly Thr Asp Gly Phe

210 215 220

Gly Phe Ser Asp Thr Arg Pro Ala Gly Arg Arg Tyr Phe Asn Thr Asp

225 230 235 240

Ala Glu Ser Gln Val Gly Arg Gly Phe Gly Arg Gly Trp Pro Gly Arg

245 250 255

Arg Val Asn Ile Asp Pro Phe Gly Ala Gly Arg Gly Pro Pro Ala Gln

260 265 270

Leu Pro Gly Phe Asp Glu Gly Gly Gly Leu Arg Pro Xaa Lys

275 280 285

(2)SEQ ID NO：83的信息：

(i)序列特征：

(A)长度：173个氨基酸

(B)类型：氨基酸

(C)链型：单链

(D)拓扑结构：线型

(xi)序列描述：SEQ ID NO：83：

Thr Lys Phe His Ala Leu Met Gln Glu Gln Ile His Asn Glu Phe Thr

1 5 10 15

Ala Ala Gln Gln Tyr Val Ala Ile Ala Val Tyr Phe Asp Ser Glu Asp

20 25 30

Leu Pro Gln Leu Ala Lys His Phe Tyr Ser Gln Ala Val Glu Glu Arg

35 40 45

Asn His Ala Met Met Leu Val Gln His Leu Leu Asp Arg Asp Leu Arg

50 55 60

Val Glu Ile Pro Gly Val Asp Thr Val Arg Asn Gln Phe Asp Arg Pro

65 70 75 80

Arg Glu Ala Leu Ala Leu Ala Leu Asp Gln Glu Arg Thr Val Thr Asp

85 90 95

Gln Val Gly Arg Leu Thr Ala Val Ala Arg Asp Glu Gly Asp Phe Leu

100 105 110

Gly Glu Gln Phe Met Gln Trp Phe Leu Gln Glu Gln Ile Glu Glu Val

115 120 125

Ala Leu Met Ala Thr Leu Val Arg Val Ala Asp Arg Ala Gly Ala Asn

130 135 140

Leu Phe Glu Leu Glu Asn Phe Val Ala Arg Glu Val Asp Val Ala Pro

145 150 155 160

Ala Ala Ser Gly Ala Pro His Ala Ala Gly Gly Arg Leu

165 170

(2)SEQ ID NO：84的信息：

(i)序列特征：

(A)长度：107个氨基酸

(B)类型：氨基酸

(C)链型：单链

(D)拓扑结构：线型

(xi)序列描述：SEQ ID NO：84：

Arg Ala Asp Glu Arg Lys Asn Thr Thr Met Lys Met Val Lys Ser Ile

1 5 10 15

Ala Ala Gly Leu Thr Ala Ala Ala Ala Ile Gly Ala Ala Ala Ala Gly

20 25 30

Val Thr Ser Ile Met Ala Gly Gly Pro Val Val Tyr Gln Met Gln Pro

35 40 45

Val Val Phe Gly Ala Pro Leu Pro Leu Asp Pro Xaa Ser Ala Pro Xaa

50 55 60

Val Pro Thr Ala Ala Gln Trp Thr Xaa Leu Leu Asn Xaa Leu Xaa Asp

65 70 75 80

Pro Asn Val Ser Phe Xaa Asn Lys Gly Ser Leu Val Glu Gly Gly Ile

85 90 95

Gly Gly Xaa Glu Gly Xaa Xaa Arg Arg Xaa Gln

100 105

(2)SEQ ID NO：85的信息：

(i)序列特征：

(A)长度：125个氨基酸

(B)类型：氨基酸

(C)链型：单链

(D)拓扑结构：线型

(xi)序列描述：SEQ ID NO：85：

Val Leu Ser Val Pro Val Gly Asp Gly Phe Trp Xaa Arg Val Val Asn

1 5 10 15

Pro Leu Gly Gln Pro Ile Asp Gly Arg Gly Asp Val Asp Ser Asp Thr

20 25 30

Arg Arg Ala Leu Glu Leu Gln Ala Pro Ser Val Val Xaa Arg Gln Gly

35 40 45

Val Lys Glu Pro Leu Xaa Thr Gly Ile Lys Ala Ile Asp Ala Met Thr

50 55 60

Pro Ile Gly Arg Gly Gln Arg Gln Leu Ile Ile Gly Asp Arg Lys Thr

65 70 75 80

Gly Lys Asn Arg Arg Leu Cys Arg Thr Pro Ser Ser Asn Gln Arg Glu

85 90 95

Glu Leu Gly Val Arg Trp Ile Pro Arg Ser Arg Cys Ala Cys Val Tyr

100 105 110

Val Gly His Arg Ala Arg Arg Gly Thr Tyr His Arg Arg

115 120 125

(2)SEQ ID NO：86的信息：

(i)序列特征：

(A)长度：117个氨基酸

(B)类型：氨基酸

(C)链型：单链

(D)拓扑结构：线型

(xi)序列描述：SEQ ID NO：86：

Cys Asp Ala Val Met Gly Phe Leu Gly Gly Ala Gly Pro Leu Ala Val

1 5 10 15

Val Asp Gln Gln Leu Val Thr Arg Val Pro Gln Gly Trp Ser Phe Ala

20 25 30

Gln Ala Ala Ala Val Pro Val Val Phe Leu Thr Ala Trp Tyr Gly Leu

35 40 45

Ala Asp Leu Ala Glu Ile Lys Ala Gly Glu Ser Val Leu Ile His Ala

50 55 60

Gly Thr Gly Gly Val Gly Met Ala Ala Val Gln Leu Ala Arg Gln Trp

65 70 75 80

Gly Val Glu Val Phe Val Thr Ala Ser Arg Gly Lys Trp Asp Thr Leu

85 90 95

Arg Ala Xaa Xaa Phe Asp Asp Xaa Pro Tyr Arg Xaa Phe Pro His Xaa

100 105 110

Arg Ser Ser Xaa Gly

115

(2)SEQ ID NO：87的信息：

(i)序列特征：

(A)长度：103个氨基酸

(B)类型：氨基酸

(C)链型：单链

(D)拓扑结构：线型

(xi)序列描述：SEQ ID NO：87：

Met Tyr Arg Phe Ala Cys Arg Thr Leu Met Leu Ala Ala Cys Ile Leu

1 5 10 15

Ala Thr Gly Val Ala Gly Leu Gly Val Gly Ala Gln Ser Ala Ala Gln

20 25 30

Thr Ala Pro Val Pro Asp Tyr Tyr Trp Cys Pro Gly Gln Pro Phe Asp

35 40 45

Pro Ala Trp Gly Pro Asn Trp Asp Pro Tyr Thr Cys His Asp Asp Phe

50 55 60

His Arg Asp Ser Asp Gly Pro Asp His Ser Arg Asp Tyr Pro Gly Pro

65 70 75 80

Ile Leu Glu Gly Pro Val Leu Asp Asp Pro Gly Ala Ala Pro Pro Pro

85 90 95

Pro Ala Ala Gly Gly Gly Ala

100

(2)SEQ ID NO：88的信息：

(i)序列特征：

(A)长度：88个氨基酸

(B)类型：氨基酸

(C)链型：单链

(D)拓扑结构：线型

(xi)序列描述：SEQ ID NO：88：

Val Gln Cys Arg Val Trp Leu Glu Ile Gln Trp Arg Gly Met Leu Gly

1 5 10 15

Ala Asp Gln Ala Arg Ala Gly Gly Pro Ala Arg Ile Trp Arg Glu His

20 25 30

Ser Met Ala Ala Met Lys Pro Arg Thr Gly Asp Gly Pro Leu Glu Ala

35 40 45

Thr Lys Glu Gly Arg Gly Ile Val Met Arg Val Pro Leu Glu Gly Gly

50 55 60

Gly Arg Leu Val Val Glu Leu Thr Pro Asp Glu Ala Ala Ala Leu Gly

65 70 75 80

Asp Glu Leu Lys Gly Val Thr Ser

85

(2)SEQ ID NO：89的信息：

(i)序列特征：

(A)长度：95个氨基酸

(B)类型：氨基酸

(C)链型：单链

(D)拓扑结构：线型

(xi)序列描述：SEQ ID NO：89：

Thr Asp Ala Ala Thr Leu Ala Gln Glu Ala Gly Asn Phe Glu Arg Ile

1 5 10 15

Ser Gly Asp Leu Lys Thr Gln Ile Asp Gln Val Glu Ser Thr Ala Gly

20 25 30

Ser Leu Gln Gly Gln Trp Arg Gly Ala Ala Gly Thr Ala Ala Gln Ala

35 40 45

Ala Val Val Arg Phe Gln Glu Ala Ala Asn Lys Gln Lys Gln Glu Leu

50 55 60

Asp Glu Ile Ser Thr Asn Ile Arg Gln Ala Gly Val Gln Tyr Ser Arg

65 70 75 80

Ala Asp Glu Glu Gln Gln Gln Ala Leu Ser Ser Gln Met Gly Phe

85 90 95

(2)SEQ ID NO：90的信息：

(i)序列特征：

(A)长度：166个氨基酸

(B)类型：氨基酸

(C)链型：单链

(D)拓扑结构：线型

(xi)序列描述：SEQ ID NO：90：

Met Thr Gln Ser Gln Thr Val Thr Val Asp Gln Gln Glu Ile Leu Asn

1 5 10 15

Arg Ala Asn Glu Val Glu Ala Pro Met Ala Asp Pro Pro Thr Asp Val

20 25 30

Pro Ile Thr Pro Cys Glu Leu Thr Xaa Xaa Lys Asn Ala Ala Gln Gln

35 40 45

Xaa Val Leu Ser Ala Asp Asn Met Arg Glu Tyr Leu Ala Ala Gly Ala

50 55 60

Lys Glu Arg Gln Arg Leu Ala Thr Ser Leu Arg Asn Ala Ala Lys Xaa

65 70 75 80

Tyr Gly Glu Val Asp Glu Glu Ala Ala Thr Ala Leu Asp Asn Asp Gly

85 90 95

Glu Gly Thr Val Gln Ala Glu Ser Ala Gly Ala Val Gly Gly Asp Ser

100 105 110

Ser Ala Glu Leu Thr Asp Thr Pro Arg Val Ala Thr Ala Gly Glu Pro

115 120 125

Asn Phe Met Asp Leu Lys Glu Ala Ala Arg Lys Leu Glu Thr Gly Asp

130 135 140

Gln Gly Ala Ser Leu Ala His Xaa Gly Asp Gly Trp Asn Thr Xaa Thr

145 150 155 160

Leu Thr Leu Gln Gly Asp

165

(2)SEQ ID NO：91的信息：

(i)序列特征：

(A)长度：5个氨基酸

(B)类型：氨基酸

(C)链型：单链

(D)拓扑结构：线型

(xi)序列描述：SEQ ID NO：91：

Arg Ala Glu Arg Met

1 5

(2)SEQ ID NO：92的信息：

(i)序列特征：

(A)长度：263个氨基酸

(B)类型：氨基酸

(C)链型：单链

(D)拓扑结构：线型

(xi)序列描述：SEQ ID NO：92：

Val Ala Trp Met Ser Val Thr Ala Gly Gln Ala Glu Leu Thr Ala Ala

1 5 10 15

Gln Val Arg Val Ala Ala Ala Ala Tyr Glu Thr Ala Tyr Gly Leu Thr

20 25 30

Val Pro Pro Pro Val Ile Ala Glu Asn Arg Ala Glu Leu Met Ile Leu

35 40 45

Ile Ala Thr Asn Leu Leu Gly Gln Asn Thr Pro Ala Ile Ala Val Asn

50 55 60

Glu Ala Glu Tyr Gly Glu Met Trp Ala Gln Asp Ala Ala Ala Met Phe

65 70 75 80

Gly Tyr Ala Ala Ala Thr Ala Thr Ala Thr Ala Thr Leu Leu Pro Phe

85 90 95

Glu Glu Ala Pro Glu Met Thr Ser Ala Gly Gly Leu Leu Glu Gln Ala

100 105 110

Ala Ala Val Glu Glu Ala Ser Asp Thr Ala Ala Ala Asn Gln Leu Met

115 120 125

Asn Asn Val Pro Gln Ala Leu Lys Gln Leu Ala Gln Pro Thr Gln Gly

130 135 140

Thr Thr Pro Ser Ser Lys Leu Gly Gly Leu Trp Lys Thr Val Ser Pro

145 150 155 160

His Arg Ser Pro Ile Ser Asn Met Val Ser Met Ala Asn Asn His Met

165 170 175

Ser Met Thr Asn Ser Gly Val Ser Met Thr Asn Thr Leu Ser Ser Met

180 185 190

Leu Lys Gly Phe Ala Pro Ala Ala Ala Ala Gln Ala Val Gln Thr Ala

195 200 205

Ala Gln Asn Gly Val Arg Ala Met Ser Ser Leu Gly Ser Ser Leu Gly

210 215 220

Ser Ser Gly Leu Gly Gly Gly Val Ala Ala Asn Leu Gly Arg Ala Ala

225 230 235 240

Ser Val Arg Tyr Gly His Arg Asp Gly Gly Lys Tyr Ala Xaa Ser Gly

245 250 255

Arg Arg Asn Gly Gly Pro Ala

260

(2)SEQ ID NO：93的信息：

(i)序列特征：

(A)长度：303个氨基酸

(B)类型：氨基酸

(C)链型：单链

(D)拓扑结构：线型

(xi)序列描述：SEQ ID NO：93：

Met Thr Tyr Ser Pro Gly Asn Pro Gly Tyr Pro Gln Ala Gln Pro Ala

1 5 10 15

Gly Ser Tyr Gly Gly Val Thr Pro Ser Phe Ala His Ala Asp Glu Gly

20 25 30

Ala Ser Lys Leu Pro Met Tyr Leu Asn Ile Ala Val Ala Val Leu Gly

35 40 45

Leu Ala Ala Tyr Phe Ala Ser Phe Gly Pro Met Phe Thr Leu Ser Thr

50 55 60

Glu Leu Gly Gly Gly Asp Gly Ala Val Ser Gly Asp Thr Gly Leu Pro

65 70 75 80

Val Gly Val Ala Leu Leu Ala Ala Leu Leu Ala Gly Val Val Leu Val

85 90 95

Pro Lys Ala Lys Ser His Val Thr Val Val Ala Val Leu Gly Val Leu

100 105 110

Gly Val Phe Leu Met Val Ser Ala Thr Phe Asn Lys Pro Ser Ala Tyr

115 120 125

Ser Thr Gly Trp Ala Leu Trp Val Val Leu Ala Phe Ile Val Phe Gln

130 135 140

Ala Val Ala Ala Val Leu Ala Leu Leu Val Glu Thr Gly Ala Ile Thr

145 150 155 160

Ala Pro Ala Pro Arg Pro Lys Phe Asp Pro Tyr Gly Gln Tyr Gly Arg

165 170 175

Tyr Gly Gln Tyr Gly Gln Tyr Gly Val Gln Pro Gly Gly Tyr Tyr Gly

180 185 190

Gln Gln Gly Ala Gln Gln Ala Ala Gly Leu Gln Ser Pro Gly Pro Gln

195 200 205

Gln Ser Pro Gln Pro Pro Gly Tyr Gly Ser Gln Tyr Gly Gly Tyr Ser

210 215 220

Ser Ser Pro Ser Gln Ser Gly Ser Gly Tyr Thr Ala Gln Pro Pro Ala

225 230 235 240

Gln Pro Pro Ala Gln Ser Gly Ser Gln Gln Ser His Gln Gly Pro Ser

245 250 255

Thr Pro Pro Thr Gly Phe Pro Ser Phe Ser Pro Pro Pro Pro Val Ser

260 265 270

Ala Gly Thr Gly Ser Gln Ala Gly Ser Ala Pro Val Asn Tyr Ser Asn

275 280 285

Pro Ser Gly Gly Glu Gln Ser Ser Ser Pro Gly Gly Ala Pro Val

290 295 300

(2)SEQ ID NO：94的信息：

(i)序列特征：

(A)长度：168个氨基酸

(B)类型：氨基酸

(C)链型：单链

(D)拓扑结构：线型

(xi)序列描述：SEQ ID NO：94：

Met Lys Met Val Lys Ser Ile Ala Ala Gly Leu Thr Ala Ala Ala Ala

1 5 10 15

Ile Gly Ala Ala Ala Ala Gly Val Thr Ser Ile Met Ala Gly Gly Pro

20 25 30

Val Val Tyr Gln Met Gln Pro Val Val Phe Gly Ala Pro Leu Pro Leu

35 40 45

Asp Pro Ala Ser Ala Pro Asp Val Pro Thr Ala Ala Gln Leu Thr Ser

50 55 60

Leu Leu Asn Ser Leu Ala Asp Pro Asn Val Ser Phe Ala Asn Lys Gly

65 70 75 80

Ser Leu Val Glu Gly Gly Ile Gly Gly Thr Glu Ala Arg Ile Ala Asp

85 90 95

His Lys Leu Lys Lys Ala Ala Glu His Gly Asp Leu Pro Leu Ser Phe

100 105 110

Ser Val Thr Asn Ile Gln Pro Ala Ala Ala Gly Ser Ala Thr Ala Asp

115 120 125

Val Ser Val Ser Gly Pro Lys Leu Ser Ser Pro Val Thr Gln Asn Val

130 135 140

Thr Phe Val Asn Gln Gly Gly Trp Met Leu Ser Arg Ala Ser Ala Met

145 150 155 160

Glu Leu Leu Gln Ala Ala Gly Asn

165

(2)SEQ ID NO：95的信息：

(i)序列特征：

(A)长度：332个氨基酸

(B)类型：氨基酸

(C)链型：单链

(D)拓扑结构：线型

(xi)序列描述：SEQ ID NO：95：

Met His His His His His His Met His Gln Val Asp Pro Asn Leu Thr

1 5 10 15

Arg Arg Lys Gly Arg Leu Ala Ala Leu Ala Ile Ala Ala Met Ala Ser

20 25 30

Ala Ser Leu Val Thr Val Ala Val Pro Ala Thr Ala Asn Ala Asp Pro

35 40 45

Glu Pro Ala Pro Pro Val Pro Thr Thr Ala Ala Ser Pro Pro Ser Thr

50 55 60

Ala Ala Ala Pro Pro Ala Pro Ala Thr Pro Val Ala Pro Pro Pro Pro

65 70 75 80

Ala Ala Ala Asn Thr Pro Asn Ala Gln Pro Gly Asp Pro Asn Ala Ala

85 90 95

Pro Pro Pro Ala Asp Pro Asn Ala Pro Pro Pro Pro Val Ile Ala Pro

100 105 110

Asn Ala Pro Gln Pro Val Arg Ile Asp Asn Pro Val Gly Gly Phe Ser

115 120 125

Phe Ala Leu Pro Ala Gly Trp Val Glu Ser Asp Ala Ala His Phe Asp

130 135 140

Tyr Gly Ser Ala Leu Leu Ser Lys Thr Thr Gly Asp Pro Pro Phe Pro

145 150 155 160

Gly Gln Pro Pro Pro Val Ala Asn Asp Thr Arg Ile Val Leu Gly Arg

165 170 175

Leu Asp Gln Lys Leu Tyr Ala Ser Ala Glu Ala Thr Asp Ser Lys Ala

180 185 190

Ala Ala Arg Leu Gly Ser Asp Met Gly Glu Phe Tyr Met Pro Tyr Pro

195 200 205

Gly Thr Arg Ile Asn Gln Glu Thr Val Ser Leu Asp Ala Asn Gly Val

210 215 220

Ser Gly Ser Ala Ser Tyr Tyr Glu Val Lys Phe Ser Asp Pro Ser Lys

225 230 235 240

Pro Asn Gly Gln Ile Trp Thr Gly Val Ile Gly Ser Pro Ala Ala Asn

245 250 255

Ala Pro Asp Ala Gly Pro Pro Gln Arg Trp Phe Val Val Trp Leu Gly

260 265 270

Thr Ala Asn Asn Pro Val Asp Lys Gly Ala Ala Lys Ala Leu Ala Glu

275 280 285

Ser Ile Arg Pro Leu Val Ala Pro Pro Pro Ala Pro Ala Pro Ala Pro

290 295 300

Ala Glu Pro Ala Pro Ala Pro Ala Pro Ala Gly Glu Val Ala Pro Thr

305 310 315 320

Pro Thr Thr Pro Thr Pro Gln Arg Thr Leu Pro Ala

325 330

(2)SEQ ID NO：96的信息：

(i)序列特征：

(A)长度：500个碱基对

(B)类型：核酸

(C)链型：单链

(D)拓扑结构：线型

(xi)序列描述：SEQ ID NO：96：

CGTGGCAATG TCGTTGACCG TCGGGGCCGG GGTCGCCTCC GCAGATCCCG TGGACGCGGT 60

CATTAACACC ACCTGCAATT ACGGGCAGGT AGTAGCTGCG CTCAACGCGA CGGATCCGGG 120

GGCTGCCGCA CAGTTCAACG CCTCACCGGT GGCGCAGTCC TATTTGCGCA ATTTCCTCGC 180

CGCACCGCCA CCTCAGCGCG CTGCCATGGC CGCGCAATTG CAAGCTGTGC CGGGGGCGGC 240

ACAGTACATC GGCCTTGTCG AGTCGGTTGC CGGCTCCTGC AACAACTATT AAGCCCATGC 300

GGGCCCCATC CCGCGACCCG GCATCGTCGC CGGGGCTAGG CCAGATTGCC CCGCTCCTCA 360

ACGGGCCGCA TCCCGCGACC CGGCATCGTC GCCGGGGCTA GGCCAGATTG CCCCGCTCCT 420

CAACGGGCCG CATCTCGTGC CGAATTCCTG CAGCCCGGGG GATCCACTAG TTCTAGAGCG 480

GCCGCCACCG CGGTGGAGCT 500

(2)SEQ ID NO：97的信息：

(i)序列特征：

(A)长度：96个氨基酸

(B)类型：氨基酸

(C)链型：单链

(D)拓扑结构：线型

(xi)序列描述：SEQ ID NO：97：

Val Ala Met Ser Leu Thr Val Gly Ala Gly Val Ala Ser Ala Asp Pro

1 5 10 15

Val Asp Ala Val Ile Asn Thr Thr Cys Asn Tyr Gly Gln Val Val Ala

20 25 30

Ala Leu Asn Ala Thr Asp Pro Gly Ala Ala Ala Gln Phe Asn Ala Ser

35 40 45

Pro Val Ala Gln Ser Tyr Leu Arg Asn Phe Leu Ala Ala Pro Pro Pro

50 55 60

Gln Arg Ala Ala Met Ala Ala Gln Leu Gln Ala Val Pro Gly Ala Ala

65 70 75 80

Gln Tyr Ile Gly Leu Val Glu Ser Val Ala Gly Ser Cys Asn Asn Tyr

85 90 95

(2)SEQ ID NO：98的信息：

(i)序列特征：

(A)长度：154个碱基对

(B)类型：核酸

(C)链型：单链

(D)拓扑结构：线型

(xi)序列描述：SEQ ID NO：98：

ATGACAGAGC AGCAGTGGAA TTTCGCGGGT ATCGAGGCCG CGGCAAGCGC AATCCAGGGA 60

AATGTCACGT CCATTCATTC CCTCCTTGAC GAGGGGAAGC AGTCCCTGAC CAAGCTCGCA 120

GCGGCCTGGG GCGGTAGCGG TTCGGAAGCG TACC 154

(2)SEQ ID NO：99的信息：

(i)序列特征：

(A)长度：51个氨基酸

(B)类型：氨基酸

(C)链型：单链

(D)拓扑结构：线型

(xi)序列描述：SEQ ID NO：99：

Met Thr Glu Gln Gln Trp Asn Phe Ala Gly Ile Glu Ala Ala Ala Ser

1 5 10 15

Ala Ile Gln Gly Asn Val Thr Ser Ile His Ser Leu Leu Asp Glu Gly

20 25 30

Lys Gln Ser Leu Thr Lys Leu Ala Ala Ala Trp Gly Gly Ser Gly Ser

35 40 45

Glu Ala Tyr

50

(2)SEQ ID NO：100的信息：

(i)序列特征：

(A)长度：282个碱基对

(B)类型：核酸

(C)链型：单链

(D)拓扑结构：线型

(xi)序列描述：SEQ ID NO：100：

CGGTCGCGCA CTTCCAGGTG ACTATGAAAG TCGGCTTCCG NCTGGAGGAT TCCTGAACCT 60

TCAAGCGCGG CCGATAACTG AGGTGCATCA TTAAGCGACT TTTCCAGAAC ATCCTGACGC 120

GCTCGAAACG CGGCACAGCC GACGGTGGCT CCGNCGAGGC GCTGNCTCCA AAATCCCTGA 180

GACAATTCGN CGGGGGCGCC TACAAGGAAG TCGGTGCTGA ATTCGNCGNG TATCTGGTCG 240

ACCTGTGTGG TCTGNAGCCG GACGAAGCGG TGCTCGACGT CG 282

(2)SEQ ID NO：101的信息：

(i)序列特征：

(A)长度：1565个碱基对

(B)类型：核酸

(C)链型：单链

(D)拓扑结构：线型

(xi)序列描述：SEQ ID NO：101：

GTATGCGGCC ACTGAAGTCG CCAATGCGGC GGCGGCCAGC TAAGCCAGGA ACAGTCGGCA 60

CGAGAAACCA CGAGAAATAG GGACACGTAA TGGTGGATTT CGGGGCGTTA CCACCGGAGA 120

TCAACTCCGC GAGGATGTAC GCCGGCCCGG GTTCGGCCTC GCTGGTGGCC GCGGCTCAGA 180

TGTGGGACAG CGTGGCGAGT GACCTGTTTT CGGCCGCGTC GGCGTTTCAG TCGGTGGTCT 240

GGGGTCTGAC GGTGGGGTCG TGGATAGGTT CGTCGGCGGG TCTGATGGTG GCGGCGGCCT 300

CGCCGTATGT GGCGTGGATG AGCGTCACCG CGGGGCAGGC CGAGCTGACC GCCGCCCAGG 360

TCCGGGTTGC TGCGGCGGCC TACGAGACGG CGTATGGGCT GACGGTGCCC CCGCCGGTGA 420

TCGCCGAGAA CCGTGCTGAA CTGATGATTC TGATAGCGAC CAACCTCTTG GGGCAAAACA 480

CCCCGGCGAT CGCGGTCAAC GAGGCCGAAT ACGGCGAGAT GTGGGCCCAA GACGCCGCCG 540

CGATGTTTGG CTACGCCGCG GCGACGGCGA CGGCGACGGC GACGTTGCTG CCGTTCGAGG 600

AGGCGCCGGA GATGACCAGC GCGGGTGGGC TCCTCGAGCA GGCCGCCGCG GTCGAGGAGG 660

CCTCCGACAC CGCCGCGGCG AACCAGTTGA TGAACAATGT GCCCCAGGCG CTGCAACAGC 720

TGGCCCAGCC CACGCAGGGC ACCACGCCTT CTTCCAAGCT GGGTGGCCTG TGGAAGACGG 780

TCTCGCCGCA TCGGTCGCCG ATCAGCAACA TGGTGTCAAT GGCCAACAAC CACATGTCAA 840

TGACCAACTC GGGTGTGTCA ATGACCAACA CCTTGAGCTC GATGTTGAAG GGCTTTGCTC 900

CGGCGGCGGC CGCCCAGGCC GTGCAAACCG CGGCGCAAAA CGGGGTCCGG GCGATGAGCT 960

CGCTGGGCAG CTCGCTGGGT TCTTCGGGTC TGGGCGGTGG GGTGGCCGCC AACTTGGGTC 1020

GGGCGGCCTC GGTCGGTTCG TTGTCGGTGC CGCAGGCCTG GGCCGCGGCC AACCAGGCAG 1080

TCACCCCGGC GGCGCGGGCG CTGCCGCTGA CCAGCCTGAC CAGCGCCGCG GAAAGAGGGC 1140

CCGGGCAGAT GCTGGGCGGG CTGCCGGTGG GGCAGATGGG CGCCAGGGCC GGTGGTGGGC 1200

TCAGTGGTGT GCTGCGTGTT CCGCCGCGAC CCTATGTGAT GCCGCATTCT CCGGCGGCCG 1260

GCTAGGAGAG GGGGCGCAGA CTGTCGTTAT TTGACCAGTG ATCGGCGGTC TCGGTGTTTC 1320

CGCGGCCGGC TATGACAACA GTCAATGTGC ATGACAAGTT ACAGGTATTA GGTCCAGGTT 1380

CAACAAGGAG ACAGGCAACA TGGCCTCACG TTTTATGACG GATCCGCACG CGATGCGGGA 1440

CATGGCGGGC CGTTTTGAAG TGCACGCCCA GACGGTGGAG GACGAGGCTC GCCGGATGTG 1500

GGCGTCCGCG CAAAACATTT CCGGTGCGGG CTGGAGTGGC ATGGCCGAGG CGACCTCGCT 1560

AGACA 1565

(2)SEQ ID NO：102的信息：

(i)序列特征：

(A)长度：391个氨基酸

(B)类型：氨基酸

(C)链型：单链

(D)拓扑结构：线型

(xi)序列描述：SEQ ID NO：102：

Met Val Asp Phe Gly Ala Leu Pro Pro Glu Ile Asn Ser Ala Arg Met

1 5 10 15

Tyr Ala Gly Pro Gly Ser Ala Ser Leu Val Ala Ala Ala Gln Met Trp

20 25 30

Asp Ser Val Ala Ser Asp Leu Phe Ser Ala Ala Ser Ala Phe Gln Ser

35 40 45

Val Val Trp Gly Leu Thr Val Gly Ser Trp Ile Gly Ser Ser Ala Gly

50 55 60

Leu Met Val Ala Ala Ala Ser Pro Tyr Val Ala Trp Met Ser Val Thr

65 70 75 80

Ala Gly Gln Ala Glu Leu Thr Ala Ala Gln Val Arg Val Ala Ala Ala

85 90 95

Ala Tyr Glu Thr Ala Tyr Gly Leu Thr Val Pro Pro Pro Val Ile Ala

100 105 110

Glu Asn Arg Ala Glu Leu Met Ile Leu Ile Ala Thr Asn Leu Leu Gly

115 120 125

Gln Asn Thr Pro Ala Ile Ala Val Asn Glu Ala Glu Tyr Gly Glu Met

130 135 140

Trp Ala Gln Asp Ala Ala Ala Met Phe Gly Tyr Ala Ala Ala Thr Ala

145 150 155 160

Thr Ala Thr Ala Thr Leu Leu Pro Phe Glu Glu Ala Pro Glu Met Thr

165 170 175

Ser Ala Gly Gly Leu Leu Glu Gln Ala Ala Ala Val Glu Glu Ala Ser

180 185 190

Asp Thr Ala Ala Ala Asn Gln Leu Met Asn Asn Val Pro Gln Ala Leu

195 200 205

Gln Gln Leu Ala Gln Pro Thr Gln Gly Thr Thr Pro Ser Ser Lys Leu

210 215 220

Gly Gly Leu Trp Lys Thr Val Ser Pro His Arg Ser Pro Ile Ser Asn

225 230 235 240

Met Val Ser Met Ala Asn Asn His Met Ser Met Thr Asn Ser Gly Val

245 250 255

Ser Met Thr Asn Thr Leu Ser Ser Met Leu Lys Gly Phe Ala Pro Ala

260 265 270

Ala Ala Ala Gln Ala Val Gln Thr Ala Ala Gln Asn Gly Val Arg Ala

275 280 285

Met Ser Ser Leu Gly Ser Ser Leu Gly Ser Ser Gly Leu Gly Gly Gly

290 295 300

Val Ala Ala Asn Leu Gly Arg Ala Ala Ser Val Gly Ser Leu Ser Val

305 310 315 320

Pro Gln Ala Trp Ala Ala Ala Asn Gln Ala Val Thr Pro Ala Ala Arg

325 330 335

Ala Leu Pro Leu Thr Ser Leu Thr Ser Ala Ala Glu Arg Gly Pro Gly

340 345 350

Gln Met Leu Gly Gly Leu Pro Val Gly Gln Met Gly Ala Arg Ala Gly

355 360 365

Gly Gly Leu Ser Gly Val Leu Arg Val Pro Pro Arg Pro Tyr Val Met

370 375 380

Pro His Ser Pro Ala Ala Gly

385 390

(2)SEQ ID NO：103的信息：

(i)序列特征：

(A)长度：259个碱基对

(B)类型：核酸

(C)链型：单链

(D)拓扑结构：线型

(xi)序列描述：SEQ ID NO：103：

ACCAACACCT TGCACTCNAT GTTGAAGGGC TTAGCTCCGG CGGCGGCTCA GGCCGTGGAA 60

ACCGCGGCGG AAAACGGGGT CTGGGCAATG AGCTCGCTGG GCAGCCAGCT GGGTTCGTCG 120

CTGGGTTCTT CGGGTCTGGG CGCTGGGGTG GCCGCCAACT TGGGTCGGGC GGCCTCGGTC 180

GGTTCGTTGT CGGTGCCGCC AGCATGGGCC GCGGCCAACC AGGCGGTCAC CCCGGCGGCG 240

CGGGCGCTGC CGCTGACCA 259

(2)SEQ ID NO：104的信息：

(i)序列特征：

(A)长度：86个氨基酸

(B)类型：氨基酸

(C)链型：单链

(D)拓扑结构：线型

(xi)序列描述：SEQ ID NO：104：

Thr Asn Thr Leu His Ser Met Leu Lys Gly Leu Ala Pro Ala Ala Ala

1 5 10 15

Gln Ala Val Glu Thr Ala Ala Glu Asn Gly Val Trp Ala Met Ser Ser

20 25 30

Leu Gly Ser Gln Leu Gly Ser Ser Leu Gly Ser Ser Gly Leu Gly Ala

35 40 45

Gly Val Ala Ala Asn Leu Gly Arg Ala Ala Ser Val Gly Ser Leu Ser

50 55 60

Val Pro Pro Ala Trp Ala Ala Ala Asn Gln Ala Val Thr Pro Ala Ala

65 70 75 80

Arg Ala Leu Pro Leu Thr

85

(2)SEQ ID NO：105的信息：

(i)序列特征：

(A)长度：1109个碱基对

(B)类型：核酸

(C)链型：单链

(D)拓扑结构：线型

(xi)序列描述：SEQ ID NO：105：

TACTTGAGAG AATTTGACCT GTTGCCGACG TTGTTTGCTG TCCATCATTG GTGCTAGTTA 60

TGGCCGAGCG GAAGGATTAT CGAAGTGGTG GACTTCGGGG CGTTACCACC GGAGATCAAC 120

TCCGCGAGGA TGTACGCCGG CCCGGGTTCG GCCTCGCTGG TGGCCGCCGC GAAGATGTGG 180

GACAGCGTGG CGAGTGACCT GTTTTCGGCC GCGTCGGCGT TTCAGTCGGT GGTCTGGGGT 240

CTGACGACGG GATCGTGGAT AGGTTCGTCG GCGGGTCTGA TGGTGGCGGC GGCCTCGCCG 300

TATGTGGCGT GGATGAGCGT CACCGCGGGG CAGGCCGAGC TGACCGCCGC CCAGGTCCGG 360

GTTGCTGCGG CGGCCTACGA GACGGCGTAT GGGCTGACGG TGCCCCCGCC GGTGATCGCC 420

GAGAACCGTG CTGAACTGAT GATTCTGATA GCGACCAACC TCTTGGGGCA AAACACCCCG 480

GCGATCGCGG TCAACGAGGC CGAATACGGG GAGATGTGGG CCCAAGACGC CGCCGCGATG 540

TTTGGCTACG CCGCCACGGC GGCGACGGCG ACCGAGGCGT TGCTGCCGTT CGAGGACGCC 600

CCACTGATCA CCAACCCCGG CGGGCTCCTT GAGCAGGCCG TCGCGGTCGA GGAGGCCATC 660

GACACCGCCG CGGCGAACCA GTTGATGAAC AATGTGCCCC AAGCGCTGCA ACAACTGGCC 720

CAGCCCACGA AAAGCATCTG GCCGTTCGAC CAACTGAGTG AACTCTGGAA AGCCATCTCG 780

CCGCATCTGT CGCCGCTCAG CAACATCGTG TCGATGCTCA ACAACCACGT GTCGATGACC 840

AACTCGGGTG TGTCAATGGC CAGCACCTTG CACTCAATGT TGAAGGGCTT TGCTCCGGCG 900

GCGGCTCAGG CCGTGGAAAC CGCGGCGCAA AACGGGGTCC AGGCGATGAG CTCGCTGGGC 960

AGCCAGCTGG GTTCGTCGCT GGGTTCTTCG GGTCTGGGCG CTGGGGTGGC CGCCAACTTG 1020

GGTCGGGCGG CCTCGGTCGG TTCGTTGTCG GTGCCGCAGG CCTGGGCCGC GGCCAACCAG 1080

GCGGTCACCC CGGCGGCGCG GGCGCTGCC 1109

(2)SEQ ID NO：106的信息：

(i)序列特征：

(A)长度：341个氨基酸

(B)类型：氨基酸

(C)链型：单链

(D)拓扑结构：线型

(xi)序列描述：SEQ ID NO：106：

Val Val Asp Phe Gly Ala Leu Pro Pro Glu Ile Asn Ser Ala Arg Met

1 5 10 15

Tyr Ala Gly Pro Gly Ser Ala Ser Leu Val Ala Ala Ala Lys Met Trp

20 25 30

Asp Ser Val Ala Ser Asp Leu Phe Ser Ala Ala Ser Ala Phe Gln Ser

35 40 45

Val Val Trp Gly Leu Thr Thr Gly Ser Trp Ile Gly Ser Ser Ala Gly

50 55 60

Leu Met Val Ala Ala Ala Ser Pro Tyr Val Ala Trp Met Ser Val Thr

65 70 75 80

Ala Gly Gln Ala Glu Leu Thr Ala Ala Gln Val Arg Val Ala Ala Ala

85 90 95

Ala Tyr Glu Thr Ala Tyr Gly Leu Thr Val Pro Pro Pro Val Ile Ala

100 105 110

Glu Asn Arg Ala Glu Leu Met Ile Leu Ile Ala Thr Asn Leu Leu Gly

115 120 125

Gln Asn Thr Pro Ala Ile Ala Val Asn Glu Ala Glu Tyr Gly Glu Met

130 135 140

Trp Ala Gln Asp Ala Ala Ala Met Phe Gly Tyr Ala Ala Thr Ala Ala

145 150 155 160

Thr Ala Thr Glu Ala Leu Leu Pro Phe Glu Asp Ala Pro Leu Ile Thr

165 170 175

Asn Pro Gly Gly Leu Leu Glu Gln Ala Val Ala Val Glu Glu Ala Ile

180 185 190

Asp Thr Ala Ala Ala Asn Gln Leu Met Asn Asn Val Pro Gln Ala Leu

195 200 205

Gln Gln Leu Ala Gln Pro Thr Lys Ser Ile Trp Pro Phe Asp Gln Leu

210 215 220

Ser Glu Leu Trp Lys Ala Ile Ser Pro His Leu Ser Pro Leu Ser Asn

225 230 235 240

Ile Val Ser Met Leu Asn Asn His Val Ser Met Thr Asn Ser Gly Val

245 250 255

Ser Met Ala Ser Thr Leu His Ser Met Leu Lys Gly Phe Ala Pro Ala

260 265 270

Ala Ala Gln Ala Val Glu Thr Ala Ala Gln Asn Gly Val Gln Ala Met

275 280 285

Ser Ser Leu Gly Ser Gln Leu Gly Ser Ser Leu Gly Ser Ser Gly Leu

290 295 300

Gly Ala Gly Val Ala Ala Asn Leu Gly Arg Ala Ala Ser Val Gly Ser

305 310 315 320

Leu Ser Val Pro Gln Ala Trp Ala Ala Ala Asn Gln Ala Val Thr Pro

325 330 335

Ala Ala Arg Ala Leu

340

(2)SEQ ID NO：107的信息：

(i)序列特征：

(A)长度：1256个碱基对

(B)类型：核酸

(C)链型：单链

(D)拓扑结构：线型

(xi)序列描述：SEQ ID NO：107：

CATCGGAGGG AGTGATCACC ATGCTGTGGC ACGCAATGCC ACCGGAGNTA AATACCGCAC 60

GGCTGATGGC CGGCGCGGGT CCGGCTCCAA TGCTTGCGGC GGCCGCGGGA TGGCAGACGC 120

TTTCGGCGGC TCTGGACGCT CAGGCCGTCG AGTTGACCGC GCGCCTGAAC TCTCTGGGAG 180

AAGCCTGGAC TGGAGGTGGC AGCGACAAGG CGCTTGCGGC TGCAACGCCG ATGGTGGTCT 240

GGCTACAAAC CGCGTCAACA CAGGCCAAGA CCCGTGCGAT GCAGGCGACG GCGCAAGCCG 300

CGGCATACAC CCAGGCCATG GCCACGACGC CGTCGCTGCC GGAGATCGCC GCCAACCACA 360

TCACCCAGGC CGTCCTTACG GCCACCAACT TCTTCGGTAT CAACACGATC CCGATCGCGT 420

TGACCGAGAT GGATTATTTC ATCCGTATGT GGAACCAGGC AGCCCTGGCA ATGGAGGTCT 480

ACCAGGCCGA GACCGCGGTT AACACGCTTT TCGAGAAGCT CGAGCCGATG GCGTCGATCC 540

TTGATCCCGG CGCGAGCCAG AGCACGACGA ACCCGATCTT CGGAATGCCC TCCCCTGGCA 600

GCTCAACACC GGTTGGCCAG TTGCCGCCGG CGGCTACCCA GACCCTCGGC CAACTGGGTG 660

AGATGAGCGG CCCGATGCAG CAGCTGACCC AGCCGCTGCA GCAGGTGACG TCGTTGTTCA 720

GCCAGGTGGG CGGCACCGGC GGCGGCAACC CAGCCGACGA GGAAGCCGCG CAGATGGGCC 780

TGCTCGGCAC CAGTCCGCTG TCGAACCATC CGCTGGCTGG TGGATCAGGC CCCAGCGCGG 840

GCGCGGGCCT GCTGCGCGCG GAGTCGCTAC CTGGCGCAGG TGGGTCGTTG ACCCGCACGC 900

CGCTGATGTC TCAGCTGATC GAAAAGCCGG TTGCCCCCTC GGTGATGCCG GCGGCTGCTG 960

CCGGATCGTC GGCGACGGGT GGCGCCGCTC CGGTGGGTGC GGGAGCGATG GGCCAGGGTG 1020

CGCAATCCGG CGGCTCCACC AGGCCGGGTC TGGTCGCGCC GGCACCGCTC GCGCAGGAGC 1080

GTGAAGAAGA CGACGAGGAC GACTGGGACG AAGAGGACGA CTGGTGAGCT CCCGTAATGA 1140

CAACAGACTT CCCGGCCACC CGGGCCGGAA GACTTGCCAA CATTTTGGCG AGGAAGGTAA 1200

AGAGAGAAAG TAGTCCAGCA TGGCAGAGAT GAAGACCGAT GCCGCTACCC TCGCGC 1256

(2)SEQ ID NO：108的信息：

(i)序列特征：

(A)长度：432个碱基对

(B)类型：核酸

(C)链型：单链

(D)拓扑结构：线型

(xi)序列描述：SEQ ID NO：108：

CTAGTGGATG GGACCATGGC CATTTTCTGC AGTCTCACTG CCTTCTGTGT TGACATTTTG 60

GCACGCCGGC GGAAACGAAG CACTGGGGTC GAAGAACGGC TGCGCTGCCA TATCGTCCGG 120

AGCTTCCATA CCTTCGTGCG GCCGGAAGAG CTTGTCGTAG TCGGCCGCCA TGACAACCTC 180

TCAGAGTGCG CTCAAACGTA TAAACACGAG AAAGGGCGAG ACCGACGGAA GGTCGAACTC 240

GCCCGATCCC GTGTTTCGCT ATTCTACGCG AACTCGGCGT TGCCCTATGC GAACATCCCA 300

GTGACGTTGC CTTCGGTCGA AGCCATTGCC TGACCGGCTT CGCTGATCGT CCGCGCCAGG 360

TTCTGCAGCG CGTTGTTCAG CTCGGTAGCC GTGGCGTCCC ATTTTTGCTG GACACCCTGG 420

TACGCCTCCG AA 432

(2)SEQ ID NO：109的信息：

(i)序列特征：

(A)长度：368个氨基酸

(B)类型：氨基酸

(C)链型：单链

(D)拓扑结构：线型

(xi)序列描述：SEQ ID NO：109：

Met Leu Trp His Ala Met Pro Pro Glu Xaa Asn Thr Ala Arg Leu Met

1 5 10 15

Ala Gly Ala Gly Pro Ala Pro Met Leu Ala Ala Ala Ala Gly Trp Gln

20 25 30

Thr Leu Ser Ala Ala Leu Asp Ala Gln Ala Val Glu Leu Thr Ala Arg

35 40 45

Leu Asn Ser Leu Gly Glu Ala Trp Thr Gly Gly Gly Ser Asp Lys Ala

50 55 60

Leu Ala Ala Ala Thr Pro Met Val Val Trp Leu Gln Thr Ala Ser Thr

65 70 75 80

Gln Ala Lys Thr Arg Ala Met Gln Ala Thr Ala Gln Ala Ala Ala Tyr

85 90 95

Thr Gln Ala Met Ala Thr Thr Pro Ser Leu Pro Glu Ile Ala Ala Asn

100 105 110

His Ile Thr Gln Ala Val Leu Thr Ala Thr Asn Phe Phe Gly Ile Asn

115 120 125

Thr Ile Pro Ile Ala Leu Thr Glu Met Asp Tyr Phe Ile Arg Met Trp

130 135 140

Asn Gln Ala Ala Leu Ala Met Glu Val Tyr Gln Ala Glu Thr Ala Val

145 150 155 160

Asn Thr Leu Phe Glu Lys Leu Glu Pro Met Ala Ser Ile Leu Asp Pro

165 170 175

Gly Ala Ser Gln Ser Thr Thr Asn Pro Ile Phe Gly Met Pro Ser Pro

180 185 190

Gly Ser Ser Thr Pro Val Gly Gln Leu Pro Pro Ala Ala Thr Gln Thr

195 200 205

Leu Gly Gln Leu Gly Glu Met Ser Gly Pro Met Gln Gln Leu Thr Gln

210 215 220

Pro Leu Gln Gln Val Thr Ser Leu Phe Ser Gln Val Gly Gly Thr Gly

225 230 235 240

Gly Gly Asn Pro Ala Asp Glu Glu Ala Ala Gln Met Gly Leu Leu Gly

245 250 255

Thr Ser Pro Leu Ser Asn His Pro Leu Ala Gly Gly Ser Gly Pro Ser

260 265 270

Ala Gly Ala Gly Leu Leu Arg Ala Glu Ser Leu Pro Gly Ala Gly Gly

275 280 285

Ser Leu Thr Arg Thr Pro Leu Met Ser Gln Leu Ile Glu Lys Pro Val

290 295 300

Ala Pro Ser Val Met Pro Ala Ala Ala Ala Gly Ser Ser Ala Thr Gly

305 310 315 320

Gly Ala Ala Pro Val Gly Ala Gly Ala Met Gly Gln Gly Ala Gln Ser

325 330 335

Gly Gly Ser Thr Arg Pro Gly Leu Val Ala Pro Ala Pro Leu Ala Gln

340 345 350

Glu Arg Glu Glu Asp Asp Glu Asp Asp Trp Asp Glu Glu Asp Asp Trp

355 360 365

(2)SEQ ID NO：110的信息：

(i)序列特征：

(A)长度：12个氨基酸

(B)类型：氨基酸

(C)链型：单链

(D)拓扑结构：线型

(xi)序列描述：SEQ ID NO：110：

Met Ala Glu Met Lys Thr Asp Ala Ala Thr Leu Ala

1 5 10

(2)SEQ ID NO：111的信息：

(i)序列特征：

(A)长度：396个碱基对

(B)类型：核酸

(C)链型：单链

(D)拓扑结构：线型

(xi)序列描述：SEQ ID NO：111：

GATCTCCGGC GACCTGAAAA CCCAGATCGA CCAGGTGGAG TCGACGGCAG GTTCGTTGCA 60

GGGCCAGTGG CGCGGCGCGG CGGGGACGGC CGCCCAGGCC GCGGTGGTGC GCTTCCAAGA 120

AGCAGCCAAT AAGCAGAAGC AGGAACTCGA CGAGATCTCG ACGAATATTC GTCAGGCCGG 180

CGTCCAATAC TCGAGGGCCG ACGAGGAGCA GCAGCAGGCG CTGTCCTCGC AAATGGGCTT 240

CTGACCCGCT AATACGAAAA GAAACGGAGC AAAAACATGA CAGAGCAGCA GTGGAATTTC 300

GCGGGTATCG AGGCCGCGGC AAGCGCAATC CAGGGAAATG TCACGTCCAT TCATTCCCTC 360

CTTGACGAGG GGAAGCAGTC CCTGACCAAG CTCGCA 396

(2)SEQ ID NO：112的信息：

(i)序列特征：

(A)长度：80个氨基酸

(B)类型：氨基酸

(C)链型：单链

(D)拓扑结构：线型

(xi)序列描述：SEQ ID NO：112：

Ile Ser Gly Asp Leu Lys Thr Gln Ile Asp Gln Val Glu Ser Thr Ala

1 5 10 15

Gly Ser Leu Gln Gly Gln Trp Arg Gly Ala Ala Gly Thr Ala Ala Gln

20 25 30

Ala Ala Val Val Arg Phe Gln Glu Ala Ala Asn Lys Gln Lys Gln Glu

35 40 45

Leu Asp Glu Ile Ser Thr Asn Ile Arg Gln Ala Gly Val Gln Tyr Ser

50 55 60

Arg Ala Asp Glu Glu Gln Gln Gln Ala Leu Ser Ser Gln Met Gly Phe

65 70 75 80

(2)SEQ ID NO：113的信息：

(i)序列特征：

(A)长度：387个碱基对

(B)类型：核酸

(C)链型：单链

(D)拓扑结构：线型

(xi)序列描述：SEQ ID NO：113：

GTGGATCCCG ATCCCGTGTT TCGCTATTCT ACGCGAACTC GGCGTTGCCC TATGCGAACA 60

TCCCAGTGAC GTTGCCTTCG GTCGAAGCCA TTGCCTGACC GGCTTCGCTG ATCGTCCGCG 120

CCAGGTTCTG CAGCGCGTTG TTCAGCTCGG TAGCCGTGGC GTCCCATTTT TGCTGGACAC 180

CCTGGTACGC CTCCGAACCG CTACCGCCCC AGGCCGCTGC GAGCTTGGTC AGGGACTGCT 240

TCCCCTCGTC AAGGAGGGAA TGAATGGACG TGACATTTCC CTGGATTGCG CTTGCCGCGG 300

CCTCGATACC CGCGAAATTC CACTGCTGCT CTGTCATGTT TTTGCTCCGT TTCTTTTCGT 360

ATTAGCGGGT CAGAAGCCCA TTTGCGA 387

(2)SEQ ID NO：114的信息：

(i)序列特征：

(A)长度：272个碱基对

(B)类型：核酸

(C)链型：单链

(D)拓扑结构：线型

(xi)序列描述：SEQ ID NO：114：

CGGCACGAGG ATCTCGGTTG GCCCAACGGC GCTGGCGAGG GCTCCGTTCC GGGGGCGAGC 60

TGCGCGCCGG ATGCTTCCTC TGCCCGCAGC CGCGCCTGGA TGGATGGACC AGTTGCTACC 120

TTCCCGACGT TTCGTTCGGT GTCTGTGCGA TAGCGGTGAC CCCGGCGCGC ACGTCGGGAG 180

TGTTGGGGGG CAGGCCGGGT CGGTGGTTCG GCCGGGGACG CAGACGGTCT GGACGGAACG 240

GGCGGGGGTT CGCCGATTGG CATCTTTGCC CA 272

(2)SEQ ID NO：115的信息：

(i)序列特征：

(A)长度：20个氨基酸

(B)类型：氨基酸

(C)链型：

(D)拓扑结构：线型

(xi)序列描述：SEQ ID NO：115：

Asp Pro Val Asp Ala Val Ile Asn Thr Thr Cys Asn Tyr Gly Gln Val

1 5 10 15

Val Ala Ala Leu

20

(2)SEQ ID NO：116的信息：

(i)序列特征：

(A)长度：15个氨基酸

(B)类型：氨基酸

(C)链型：

(D)拓扑结构：线型

(xi)序列描述：SEQ ID NO：116：

Ala Val Glu Ser Gly Met Leu Ala Leu Gly Thr Pro Ala Pro Ser

1 5 10 15

(2)SEQ ID NO：117的信息：

(i)序列特征：

(A)长度：19个氨基酸

(B)类型：氨基酸

(C)链型：

(D)拓扑结构：线型

(xi)序列描述：SEQ ID NO：117：

Ala Ala Met Lys Pro Arg Thr Gly Asp Gly Pro Leu Glu Ala Ala Lys

1 5 10 15

Glu Gly Arg

(2)SEQ ID NO：118的信息：

(i)序列特征：

(A)长度：15个氨基酸

(B)类型：氨基酸

(C)链型：

(D)拓扑结构：线型

(xi)序列描述：SEQ ID NO：118：

Tyr Tyr Trp Cys Pro Gly Gln Pro Phe Asp Pro Ala Trp Gly Pro

1 5 10 15

(2)SEQ ID NO：119的信息：

(i)序列特征：

(A)长度：14个氨基酸

(B)类型：氨基酸

(C)链型：

(D)拓扑结构：线型

(xi)序列描述：SEQ ID NO：119：

Asp Ile Gly Ser Glu Ser Thr Glu Asp Gln Gln Xaa Ala Val

1 5 10

(2)SEQ ID NO：120的信息：

(i)序列特征：

(A)长度：13个氨基酸

(B)类型：氨基酸

(C)链型：

(D)拓扑结构：线型

(xi)序列描述：SEQ ID NO：120：

Ala Glu Glu Ser Ile Ser Thr Xaa Glu Xaa Ile Val Pro

1 5 10

(2)SEQ ID NO：121的信息：

(i)序列特征：

(A)长度：17个氨基酸

(B)类型：氨基酸

(C)链型：

(D)拓扑结构：线型

(xi)序列描述：SEQ ID NO：121：

Asp Pro Glu Pro Ala Pro Pro Val Pro Thr Thr Ala Ala Ser Pro Pro

1 5 10 15

Ser

(2)SEQ ID NO：122的信息：

(i)序列特征：

(A)长度：15个氨基酸

(B)类型：氨基酸

(C)链型：

(D)拓扑结构：线型

(xi)序列描述：SEQ ID NO：122：

Ala Pro Lys Thr Tyr Xaa Glu Glu Leu Lys Gly Thr Asp Thr Gly

1 5 10 15

(2)SEQ ID NO：123的信息：

(i)序列特征：

(A)长度：30个氨基酸

(B)类型：氨基酸

(C)链型：

(D)拓扑结构：线型

(xi)序列描述：SEQ ID NO：123：

Asp Pro Ala Ser Ala Pro Asp Val Pro Thr Ala Ala Gln Leu Thr Ser

1 5 10 15

Leu Leu Asn Ser Leu Ala Asp Pro Asn Val Ser Phe Ala Asn

20 25 30

(2)SEQ ID NO：124的信息：

(i)序列特征：

(A)长度：22个氨基酸

(B)类型：氨基酸

(C)链型：

(D)拓扑结构：线型

(xi)序列描述：SEQ ID NO：124：

Asp Pro Pro Asp Pro His Gln Xaa Asp Met Thr Lys Gly Tyr Tyr Pro

1 5 10 15

Gly Gly Arg Arg Xaa Phe

20

(2)SEQ ID NO：125的信息：

(i)序列特征：

(A)长度：7个氨基酸

(B)类型：氨基酸

(C)链型：

(D)拓扑结构：线型

(xi)序列描述：SEQ ID NO：125：

Asp Pro Gly Tyr Thr Pro Gly

1 5

(2)SEQ ID NO：126的信息：

(i)序列特征：

(A)长度：10个氨基酸

(B)类型：氨基酸

(C)链型：

(D)拓扑结构：线型

(ix)特征：

(D)其它信息：/注＝“第二残基可以是Pro或者Thr”

(xi)序列描述：SEQ ID NO：126：

Xaa Xaa Gly Phe Thr Gly Pro Gln Phe Tyr

1 5 10

(2)SEQ ID NO：127的信息：

(i)序列特征：

(A)长度：9个氨基酸

(B)类型：氨基酸

(C)链型：

(D)拓扑结构：线型

(ix)特征：

(D)其它信息：/注＝“第三残基可以是Gln或者Leu”

(xi)序列描述：SEQ ID NO：127：

Xaa Pro Xaa Val Thr Ala Tyr Ala Gly

1 5

(2)SEQ ID NO：128的信息：

(i)序列特征：

(A)长度：9个氨基酸

(B)类型：氨基酸

(C)链型：

(D)拓扑结构：线型

(xi)序列描述：SEQ ID NO：128：

Xaa Xaa Xaa Glu Lys Pro Phe Leu Arg

1 5

(2)SEQ ID NO：129的信息：

(i)序列特征：

(A)长度：15个氨基酸

(B)类型：氨基酸

(C)链型：

(D)拓扑结构：线型

(xi)序列描述：SEQ ID NO：129：

Xaa Asp Ser Glu Lys Ser Ala Thr Ile Lys Val Thr Asp Ala Ser

1 5 10 15

(2)SEQ ID NO：130的信息：

(i)序列特征：

(A)长度：15个氨基酸

(B)类型：氨基酸

(C)链型：

(D)拓扑结构：线型

(xi)序列描述：SEQ ID NO：130：

Ala Gly Asp Thr Xaa Ile Tyr Ile Val Gly Asn Leu Thr Ala Asp

1 5 10 15

(2)SEQ ID NO：131的信息：

(i)序列特征：

(A)长度：15个氨基酸

(B)类型：氨基酸

(C)链型：

(D)拓扑结构：线型

(xi)序列描述：SEQ ID NO：131：

Ala Pro Glu Ser Gly Ala Gly Leu Gly Gly Thr Val Gln Ala Gly

1 5 10 15

(2)SEQ ID NO：132的信息：

(i)序列特征：

(A)长度：21个氨基酸

(B)类型：氨基酸

(C)链型：

(D)拓扑结构：线型

(xi)序列描述：SEQ ID NO：132：

Xaa Tyr Ile Ala Tyr Xaa Thr Thr Ala Gly Ile Val Pro Gly Lys Ile

1 5 10 15

Asn Val His Leu Val

20

Claims

1.一种多肽，该多肽包含可溶性结核分枝杆菌抗原或仅在保守取代和/或修饰上不同的该抗原的变体的抗原性部分，其中所说的抗原具有选自下组的N端序列：

(a)Asp-Pro-Val-Asp-Ala-Val-Ile-Asn-Thr-Thr-Cys-Asn-Tyr-Gly-Gln-Val-Val-Ala-Ala-Leu(SEQ ID No.115)；

(b)Ala-Val-Glu-Ser-Gly-Met-Leu-Ala-Leu-Gly-Thr-Pro-Ala-Pro-Ser(SEQ ID No.116)；

(c)Ala-Ala-Met-Lys-Pro-Arg-Thr-Gly-Asp-Gly-Pro-Leu-Glu-Ala-Ala-Lys-Glu-Gly-Arg(SEQ ID No.117)；

(d)Tyr-Tyr-Trp-Cys-Pro-Gly-Gln-Pro-Phe-Asp-Pro-Ala-Trp-Gly-Pro(SEQ ID No.118)；

(e)Asp-Ile-Gly-Ser-Glu-Ser-Thr-Glu-Asp-Gln-Gln-Xaa-Ala-Val(SEQ ID No.119)；

(f)Ala-Glu-Glu-Ser-Ile-Ser-Thr-Xaa-Glu-Xaa-Ile-Val-Pro(SEQ ID No.120)；

(g)Asp-Pro-Glu-Pro-Ala-Pro-Pro-Val-Pro-Thr-Thr-Ala-Ala-Ser-Pro-Ser(SEQ ID No.121)；

(h)Ala-Pro-Lys-Thr-Tyr-Xaa-Glu-Glu-Leu-Lys-Gly-Thr-Asp-Thr-Gly(SEQ ID No.122)；

(i)Asp-Pro-Ala-Ser-Ala-Pro-Asp-Val-Pro-Thr-Ala-Ala-Gln-Leu-Thr-Ser-Leu-Leu-Asn-Ser-Leu-Ala-Asp-Pro-Asn-Val-Ser-Phe-Ala-Asn(SEQ ID No.123)；和

(j)Ala-Pro-Glu-Ser-Gly-Ala-Gly-Leu-Gly-Gly-Thr-Val-Gln-Ala-Gly；(SEQ ID No.131)

其中Xaa可以是任何氨基酸。

2.一种多肽，该多肽包含结核分枝杆菌抗原或仅在保守取代和/或修饰上不同的该抗原的变体的免疫原性部分，其中所说的抗原具有选自下组的N端序列：

(a)Asp-Pro-Pro-Asp-Pro-His-Gln-Xaa-Asp-Met-Thr-Lys-Gly-Tyr-Tyr-Pro-Gly-Gly-Arg-Arg-Xaa-Phe；(SEQ ID No.124)和

(b)Xaa-Tyr-Ile-Ala-Tyr-Xaa-Thr-Thr-Ala-Gly-Ile-Val-Pro-Gly-Lys-Ile-Asn-Val-His-Leu-Val；(SEQ ID No.132)，

其中Xaa可以是任何氨基酸。

3.一种多肽，该多肽包含可溶性结核分枝杆菌抗原或仅在保守取代和/或修饰上不同的该抗原的变体的抗原性部分，其中所说的抗原包含由选自下组的DNA序列编码的氨基酸序列：SEQ ID No.1，2，4-10，13-25，52，94和96中所示的序列、这些序列的补体、以及在中等严格条件下与SEQ ID No.1，2，4-10，13-25，52，94和96中所示的序列杂交的DNA序列或它们的补体。

4.一种多肽，该多肽包含结核分枝杆菌抗原或仅在保守取代和/或修饰上不同的该抗原的变体的抗原性部分，其中所说的抗原包含由选自下组的DNA序列编码的氨基酸序列：SEQ ID No.26-51中所示的序列、这些序列的补体、和在中等严格条件下与SEQ ID No.26-51中所示的序列杂交的DNA序列或它们的补体。

5.一种DNA分子，该分子包含编码按照权利要求1-4之任一的多肽的核苷酸序列。

6.一种重组表达载体，该载体包含按照权利要求5的DNA分子。

7.一种宿主细胞，该宿主细胞由按照权利要求6的表达载体转化过。

8.权利要求7的宿主细胞，其中所说的宿主细胞选自大肠杆菌、酵母和哺乳动物细胞。

9.一种用于检测生物样品中的结核分枝杆菌感染的方法，该方法包括：

(a)使生物样品与按照权利要求1-4之任一的一种或多种多肽接触；和

(b)在样品中检测结合到至少一种所说多肽上的抗体的存在，由此检测生物样品中的结核分枝杆菌感染。

10.一种用于检测生物样品中的结核分枝杆菌感染的方法，该方法包括：

(a)使生物样品与具有选自由SEQ ID No.129和130给出的序列的N端序列的多肽接触；和

11.一种用于在生物样品中检测结核分枝杆菌感染的方法，该方法包括：

(a)使生物样品与由选自下组的DNA序列编码的一种或多种多肽接触：SEQ ID No.3，11和12的序列、这些序列的补体、以及与SEQ ID No.3，11和12所示的序列杂交的DNA序列；和

12.权利要求9-11之任一的方法，其中步骤(a)还包括使生物样品与38kD结核分枝杆菌抗原接触，并且步骤(b)还包括在样品中检测结合到38kD结核分枝杆菌抗原上的抗体的存在。

13.权利要求9-11之任一的方法，其中所说的多肽是结合到固相支持物上的。

14.权利要求13的方法，其中所说的固相支持物包含硝化纤维素、乳胶或塑料材料。

15.权利要求9-11之任一的方法，其中所说的生物样品选自全血、血清、血浆、唾液、脑脊液和尿。

16.权利要求15的方法，其中所说的生物样品是全血或血清。

17.一种用于检测生物样品中的结核分枝杆菌感染的方法，该方法包括：

(a)使所说的样品与聚合酶链反应中的第一和第二寡核苷酸引物接触，所说的第一和第二寡核苷酸引物包含按照权利要求5的DNA分子的至少约10个邻接的核苷酸；和

(b)在样品中检测在第一和第二寡核苷酸引物存在下扩增的DNA序列，由此检测结核分枝杆菌感染。

18.一种用于检测生物样品中的结核分枝杆菌感染的方法，该方法包括：

(a)使所说的样品与聚合酶链反应中的第一和第二寡核苷酸引物接触，所说的第一和第二寡核苷酸引物包含选自SEQ ID No.3，11和12的DNA序列的至少约10个邻接的核苷酸；和

19.权利要求17或18的方法，其中所说的生物样品选自全血、痰、血清、血浆、唾液、脑脊液和尿。

20.一种用于检测生物样品中的结核分枝杆菌感染的方法，该方法包括：

(a)使样品与一种或多种寡核苷酸探针接触，所说探针包含按照权利要求5的DNA分子的至少约15个邻接核苷酸；和

(b)在样品中检测杂交到所说寡核苷酸探针上的DNA序列，由此检测结核分枝杆菌感染。

21.一种用于检测生物样品中的结核分枝杆菌感染的方法，该方法包括：

(a)使样品与一种或多种寡核苷酸探针接触，所说探针包含选自SEQID No.3，11和12的DNA序列的至少约15个邻接核苷酸；和

22.权利要求20或21的方法，其中所说的生物样品选自全血，痰、血清、血浆、唾液、脑脊液和尿。

23.一种用于检测生物样品中的结核分枝杆菌感染的方法，该方法包括：

(a)使所说的生物样品与能够结合到按照权利要求1-4之任一的多肽上的结合剂接触；和

(b)在样品中检测结合到结合剂上的蛋白质或多肽，由此检测生物样品中的结核分枝杆菌感染。

24.一种用于检测生物样品中的结核分枝杆菌感染的方法，该方法包括：

(a)使所说的生物样品与能够结合到多肽上的结合剂接触，所说的多肽具有由SEQ ID No.129和130给出的序列的N端序列；和

25.一种用于检测生物样品中的结核分枝杆菌感染的方法，该方法包括：

(a)使所说的生物样品与能够结合到多肽上的结合剂接触，所说的多肽由选自下组的DNA序列编码：SEQ ID No.3，11和12的序列、这些序列的补体、以及与SEQ ID No.3，11和12所示的序列杂交的DNA序列；和

26.权利要求23-25之任一的方法，其中所说的结合剂是单克隆抗体。

27.权利要求23-25之任一的方法，其中所说的结合剂是多克隆抗体。

28.一种诊断试剂盒，该试剂盒包含：

(a)一种或多种按照权利要求1-4之任一的多肽；和

(b)一种检测试剂。

29.一种诊断试剂盒，该试剂盒包含：

(a)一种或多种具有选自由SEQ ID No.129和130给出的序列的N端序列的多肽；和

(b)一种检测试剂。

30.一种诊断试剂盒，该试剂盒包含：

(a)一种或多种由选自下组的DNA序列：SEQ ID No.3，11和12的序列、这些序列的补体、以及与SEQ ID No.3，11和12所示的序列杂交的DNA序列编码的多肽；和

(b)一种检测试剂。

31.权利要求28-30之任一的试剂盒，其中所说的多肽是固定化在固相支持物上的。

32.权利要求31的试剂盒，其中所说的固相支持物包含硝化纤维素、乳胶或塑料材料。

33.权利要求28-30之任一的试剂盒，其中所说的检测试剂包含结合到结合剂上的报道基团。

34.权利要求33的试剂盒，其中所说的结合剂选自抗-免疫球蛋白、蛋白质G，蛋白质A和凝集素。

35.权利要求33的试剂盒，其中所说的报道基团选自放射性同位素、荧光基团、发光基团、酶、生物素以及染料颗粒。

36.一种诊断试剂盒，该试剂盒包含第一聚合酶链反应引物与第二聚合酶链反应引物，所说的第一和第二引物包含按照权利要求5的DNA分子的至少约10个邻接的核苷酸。

37.一种诊断试剂盒，该试剂盒包含第一聚合酶链反应引物与第二聚合酶链反应引物，所说的第一和第二引物包含选自SEQ ID No.3，11和12的DNA序列的至少约10个邻接的核苷酸。

38.一种诊断试剂盒，该试剂盒包含至少一种寡核苷酸探针，所说寡核苷酸探针包含按照权利要求5的DNA分子的至少约15个邻接核苷酸。

39.一种诊断试剂盒，该试剂盒包含至少一种寡核苷酸探针，所说寡核苷酸探针包含选自SEQ ID No.3，11和12的DNA序列的至少约15个邻接核苷酸。

40.一种单克隆抗体，该抗体结合到按照权利要求1-4之任一的多肽上。

41.一种多克隆抗体，该抗体结合到按照权利要求1-4之任一的多肽上。

42.一种融合蛋白，该融合蛋白包含按照权利要求1-4之任一的两种或多种多肽。

43.一种融合蛋白，该融合蛋白包含按照权利要求1-4之任一的一种或多种多肽以及ESAT-6(SEQ ID No.99)。

44.一种融合蛋白，该融合蛋白包含具有由SEQ ID No.129和130给出的序列的N端序列的多肽。