CN1554664A - 用于结核病诊断的化合物和方法 - Google Patents
用于结核病诊断的化合物和方法 Download PDFInfo
- Publication number
- CN1554664A CN1554664A CNA2004100351841A CN200410035184A CN1554664A CN 1554664 A CN1554664 A CN 1554664A CN A2004100351841 A CNA2004100351841 A CN A2004100351841A CN 200410035184 A CN200410035184 A CN 200410035184A CN 1554664 A CN1554664 A CN 1554664A
- Authority
- CN
- China
- Prior art keywords
- ala
- gly
- pro
- val
- leu
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6876—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
- C12Q1/6888—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms
- C12Q1/689—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes for detection or identification of organisms for bacteria
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P31/00—Antiinfectives, i.e. antibiotics, antiseptics, chemotherapeutics
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61P—SPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
- A61P31/00—Antiinfectives, i.e. antibiotics, antiseptics, chemotherapeutics
- A61P31/04—Antibacterial agents
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/195—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria
- C07K14/35—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria from Mycobacteriaceae (F)
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N33/00—Investigating or analysing materials by specific methods not covered by groups G01N1/00 - G01N31/00
- G01N33/48—Biological material, e.g. blood, urine; Haemocytometers
- G01N33/50—Chemical analysis of biological material, e.g. blood, urine; Testing involving biospecific ligand binding methods; Immunological testing
- G01N33/53—Immunoassay; Biospecific binding assay; Materials therefor
- G01N33/569—Immunoassay; Biospecific binding assay; Materials therefor for microorganisms, e.g. protozoa, bacteria, viruses
- G01N33/56911—Bacteria
- G01N33/5695—Mycobacteria
Landscapes
- Health & Medical Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Organic Chemistry (AREA)
- General Health & Medical Sciences (AREA)
- Engineering & Computer Science (AREA)
- Immunology (AREA)
- Analytical Chemistry (AREA)
- Medicinal Chemistry (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Molecular Biology (AREA)
- Biochemistry (AREA)
- Physics & Mathematics (AREA)
- General Chemical & Material Sciences (AREA)
- Veterinary Medicine (AREA)
- Urology & Nephrology (AREA)
- Animal Behavior & Ethology (AREA)
- Biophysics (AREA)
- Genetics & Genomics (AREA)
- Pharmacology & Pharmacy (AREA)
- Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
- Biomedical Technology (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Oncology (AREA)
- Biotechnology (AREA)
- Communicable Diseases (AREA)
- Microbiology (AREA)
- Wood Science & Technology (AREA)
- Zoology (AREA)
- Public Health (AREA)
- Hematology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Physics & Mathematics (AREA)
- Tropical Medicine & Parasitology (AREA)
- Cell Biology (AREA)
- General Engineering & Computer Science (AREA)
- Gastroenterology & Hepatology (AREA)
- Food Science & Technology (AREA)
- Virology (AREA)
- Pathology (AREA)
Abstract
本发明公开了用于诊断结核病的化合物和方法。所提供的化合物包括多肽以及编码这些多肽的DNA,所说的多肽含有一种或多种结核分枝杆菌分泌或非分泌蛋白质的至少一种抗原性部分。含有这些多肽或DNA序列和合适的检测试剂的诊断试剂盒可以用于在患者和生物样品中检测结核分枝杆菌感染。本发明也提供了抗这些多肽的抗体。
Description
技术领域
本发明总的来说涉及结核分枝杆菌感染的检测。更具体地说本发明涉及包含结核分枝杆菌抗原,或其部分或其它变体的多肽,以及这些多肽在结核分枝杆菌感染的血清学诊断上的用途。
发明背景
结核病是一种慢性传染病,一般由结核分枝杆菌感染引起。它在发展中国家是一种主要的疾病,在世界上发达地区也是一个日益严重的问题,每年有约8百万新病例和3百万人死亡。虽然感染可以在相当长一段时间内无症状,但是该疾病最常见地表现为急性肺炎,导致发热和非排痰性咳嗽。如果不进行治疗,则常常会出现严重的并发症并导致死亡。
虽然一般地可以采用多种抗生素控制结核病,但这样的治疗不足以阻止该疾病的传播。传染的个体可以是无症状的,但有时是传染性的。此外,虽然符合治疗方案是关键性的,但患者的行为难以监测。某些患者不完成治疗过程,这可以导致无效的治疗并产生药物抗性。
抑制结核病的传播需要有效的免疫接种和准确地早期诊断该疾病。当前,用活细菌接种是诱导保护性免疫最有效的方法。用于这一目的的最普通的分枝杆菌属是卡介苗(BCG)和牛型分枝杆菌的无毒菌株。然而,BCG的安全性和有效性上存在争议,并且一些国家(如,美国)不接种一般公众。诊断一般利用皮试进行,这牵涉到真皮内接触结核菌素PPD(纯化的蛋白质衍生物)。在注射之后48-72小时,抗原特异性T细胞反应在注射部位导致可测量的潜伏(incubation),这表明接触到分枝杆菌抗原。然而,这一实验的灵敏度和特异性一直存在问题,用BCG接种的个体与感染的个体不能区别。
虽然巨噬细胞已显示出作为结核分枝杆菌免疫性的主要的效应细胞,但T细胞是这种免疫性的主要的诱导物。T细胞在针对结核分枝杆菌感染的保护中的十分重要的作用由在爱滋病患者中结核分枝杆菌频繁发生说明,因为CD4 T细胞的耗竭与人免疫缺损病毒(HIV)感染相关。分枝杆菌属反应性CD4 T细胞已显示出是γ-干扰素(IFN-γ)的有力的生产者,后者依次已显示出在小鼠中触发巨噬细胞的抗分枝杆菌作用。尽管IFN-γ在人类中的作用还不太清楚,但研究已表明1,25-二羟基-维生素D3单独或与IFN-γ或肿瘤坏死因子-α一道激活人巨噬细胞以阻止结核分枝杆菌感染。此外,已知IFN-γ刺激人巨噬细胞产生1,25-二羟基-维生素D3。同样地,IL-12已显示出在刺激对结核分枝杆菌感染的抗性中起作用。有关结核分枝杆菌感染的免疫学参见Chan和Kaufmann,结核病:病理,预防和治疗,Boom(编者),ASM出版社,华盛顿,DC,1994。
因此,本领域需要用于检测结核病的改进的诊断方法。本发明满足了这一需要并进一步提供了其它相关优点。
发明概要
简言之,本发明提供了用于诊断结核病的组合物和方法。在一个方面,本发明提供了一些多肽,这些多肽包含可溶性结核分枝杆菌抗原或仅在保守取代和/或修饰上不同的该抗原的变体的抗原性部分。在这一方面的一个实施方案中,所说的可溶性抗原具有一种以下N端序列:
(a)Asp-Pro-Val-Asp-Ala-Val-Ile-Asn-Thr-Thr-Cys-Asn-Tyr-Gly-Gln-
Val-Val-Ala-Ala-Leu(SEQ ID No.115);
(b)Ala-Val-Glu-Ser-Gly-Met-Leu-Ala-Leu-Gly-Thr-Pro-Ala-Pro-Ser
(SEQ ID No.116);
(c)Ala-Ala-Met-Lys-Pro-Arg-Thr-Gly-Asp-Gly-Pro-Leu-Glu-Ala-
Ala-Lys-Glu-Gly-Arg(SEQ ID No.117);
(d)Tyr-Tyr-Trp-Cys-Pro-Gly-Gln-Pro-Phe-Asp-Pro-Ala-Trp-Gly-Pro
(SEQ ID No.118);
(e)Asp-Ile-Gly-Ser-Glu-Ser-Thr-Glu-Asp-Gln-Gln-Xaa-Ala-Val
(SEQ ID No.119);
(f)Ala-Glu-Glu-Ser-Ile-Ser-Thr-Xaa-Glu-Xaa-Ile-Val-Pro
(SEQ ID No.120);
(g)Asp-Pro-Glu-Pro-Ala-Pro-Pro-Val-Pro-Thr-Thr-Ala-Ala-Ser-Pro-
Pro(SEQ ID No.121);
(h)Ala-Pro-Lys-Thr-Tyr-Xaa-Glu-Glu-Leu-Lys-Gly-Thr-Asp-Thr-
Gly(SEQ ID No.122);
(i)Asp-Pro-Ala-Ser-Ala-Pro-Asp-Val-Pro-Thr-Ala-Ala-Gln-Leu-Thr-
Ser-Leu-Leu-Asn-Ser-Leu-Ala-Asp-Pro-Asn-Val-Ser-Phe-Ala-Asn
(SEQ ID No.123);和
(j)Xaa-Asp-Ser-Glu-Lys-Ser-Ala-Thr-Ile-Lys-Val-Thr-Asp-Ala-Ser;
(SEQ ID No.129)
(k)Ala-Gly-Asp-Thr-Xaa-Ile-Tyr-Ile-Val-Gly-Asn-Leu-Thr-Ala-Asp;
(SEQ ID No.130)或
(l)Ala-Pro-GIu-Ser-Gly-Ala-Gly-Leu-Gly-Gly-Thr-Val-Gln-Ala-Gly;
(SEQ ID No.131)
其中Xaa可以是任何氨基酸。
在一个相关的方面,本发明提供了一些多肽,这些多肽包含结核分枝杆菌抗原或仅在保守取代和/或修饰上不同的该抗原的变体的免疫原性部分,所说的抗原具有一种以下的N端序列:
(m)Xaa-Tyr-Ile-Ala-Tyr-Xaa-Thr-Thr-Ala-Gly-Ile-Val-Pro-Gly-Lys-
Ile-Asn-Val-His-Leu-Val;(SEQ ID No.132)或
(n)Asp-Pro-Pro-Asp-Pro-His-Gln-Xaa-Asp-Met-Tbr-Lys-Gly-Tyr-Tyr-
Pro-Gly-Gly-Arg-Arg-Xaa-Phe;(SEQ ID No.124),
其中Xaa可以是任何氨基酸。
在另一个实施方案中,所说的抗原包含可溶性结核分枝杆菌抗原或仅在保守取代和/或修饰上不同的该抗原的变体的抗原性部分,其中所说的抗原包含由选自下组的DNA序列编码的氨基酸序列:SEQ ID No.1,2,4-10,13-25,52,94和96中所示的序列、这些序列的补体、以及在中等严格条件下与SEQ ID No.1,2,4-10,13-25,52,94和96中所示的序列杂交的DNA序列或它们的补体。
在一个相关的方面,所说的多肽包含结核分枝杆菌抗原或仅在保守取代和/或修饰上不同的该抗原的变体的抗原性部分,其中所说的抗原包含由选自下组的DNA序列编码的氨基酸序列:SEQ ID No.26-51中所示的序列、这些序列的补体、和在中等严格条件下与SEQ ID No.26-51中所示的序列杂交的DNA序列或它们的补体。
在一个相关的方面,本发明提供了编码上述多肽的DNA序列,包含这些DNA序列的重组表达载体和用这样的表达载体转化或转染的宿主细胞。
另一方面,本发明提供了包含第一与第二发明多肽或者是发明多肽与已知的结核分枝杆菌抗原的融合蛋白。
主题发明的另一方面提供了用于在病人中检测结核病的方法和诊断试剂盒,所说的方法包括:(a)使生物样品与至少一种上述多肽接触;和(b)在样品中检测结合到所说多肽上的抗体的存在,由此在生物样品中检测结核分枝杆菌感染。合适的生物样品包括全血,痰、血清、血浆、唾液、脑脊液和尿。所说的诊断试剂盒包含一种或多种上述多肽以及检测试剂。
本发明也提供了用于检测结核分枝杆菌感染的方法,该方法包括:(a)从患者中获得生物样品;(b)使所说的样品与聚合酶链反应中的第一和第二寡核苷酸引物接触,所说的第一和第二寡核苷酸引物包含编码上述多肽的DNA序列的至少约10个邻接的核苷酸;和(c)在样品中检测在第一和第二寡核苷酸引物存在下扩增的DNA序列。
在另一方面,本发明提供了用于在病人中检测结核分枝杆菌感染的方法,该方法包括:(a)从患者中获得生物样品;(b)使样品与寡核苷酸探针接触,所说探针包含编码上述多肽的DNA序列的至少约15个邻接核苷酸;和(c)在样品中检测杂交到所说寡核苷酸探针上的DNA序列。
另一方面,本发明提供了结合到以上所述的多肽上的多克隆和单克隆抗体两者以及将它们用于检测结核分枝杆菌感染的方法。
参照下列详细描述和附图,本发明的这些和其他方面会很清楚。本文所公开的所有参考文献与它们单个并入作为参考一样,以它们的整体由本文一并参考。
附图和序列识别号的简要描述
图1A-1B和图1C-1D说明实施例1中描述的14Kd、20Kd和26Kd抗原对分别来源于第一和第二结核分枝杆菌免疫供体的T细胞的增殖和干扰素-γ产生的刺激作用。
图2说明与细菌溶解产物的反应性比较,两种代表性多肽与结核分枝杆菌感染的和未感染的个体的血清的反应性。
图3显示与38kD抗原的反应性比较,四种代表性多肽与结核分枝杆菌感染的和未感染的个体的血清的反应性。
图4显示重组38kD和TbRall抗原与结核分枝杆菌患者、PPD阳性供体和正常供体的血清的反应性。
图5显示抗原TbRa2A与38kD阴性血清的反应性。
图6显示SEQ ID No.60的抗原与结核分枝杆菌患者和正常供体的血清的反应性。
SEQ ID No.1是TbRal的DNA序列。
SEQ ID No.2是TbRal0的DNA序列。
SEQ ID No.3是TbRal1的DNA序列。
SEQ ID No.4是TbRal2的DNA序列。
SEQ ID No.5是TbRal3的DNA序列。
SEQ ID NO.6是TbRal6的DNA序列。
SEQ ID NO.7是TbRal7的DNA序列。
SEQ ID NO.8是TbRal8的DNA序列。
SEQ ID NO.9是TbRal9的DNA序列。
SEQ ID NO.10是TbRa24的DNA序列。
SEQ ID NO.11是TbRa26的DNA序列。
SEQ ID NO.12是TbRa28的DNA序列。
SEQ ID NO.13是TbRa29的DNA序列。
SEQ ID NO.14是TbRa2A的DNA序列。
SEQ ID NO.15是TbRa3的DNA序列。
SEQ ID NO.16是TbRa32的DNA序列。
SEQ ID NO.17是TbRa35的DNA序列。
SEQ ID NO.18是TbRa36的DNA序列。
SEQ ID NO.19是TbRa4的DNA序列。
SEQ ID NO.20是TbRa9的DNA序列。
SEQ ID NO.21是TbRaB的DNA序列。
SEQ ID NO.22是TbRaC的DNA序列。
SEQ ID NO.23是TbRaD的DNA序列。
SEQ ID NO.24是YYWCPG的DNA序列。
SEQ ID NO.25是AAMK的DNA序列。
SEQ ID NO.26是TbL-23的DNA序列。
SEQ ID NO.27是TbL-24的DNA序列。
SEQ ID NO.28是TbL-25的DNA序列。
SEQ ID NO.29是TbL-28的DNA序列。
SEQ ID NO.30是TbL-29的DNA序列。
SEQ ID NO.31是TbH-5的DNA序列。
SEQ ID NO.32是TbH-8的DNA序列。
SEQ ID NO.33是TbH-9的DNA序列。
SEQ ID NO.34是TbM-1的DNA序列。
SEQ ID NO.35是TbM-3的DNA序列。
SEQ ID NO.36是TbM-6的DNA序列。
SEQ ID NO.37是TbM-7的DNA序列。
SEQ nD No.38是TbM-9的DNA序列。
SEQ ID NO.39是TbM-12的DNA序列。
SEQ ID NO.40是TbM-13的DNA序列。
SEQ ID NO.41是TbM-14的DNA序列。
SEQ ID NO.42是TbM-15的DNA序列。
SEQ ID NO.43是TbH-4的DNA序列。
SEQ ID NO.44是TbH4-FWD的DNA序列。
SEQ ID NO.45是TbH-12的DNA序列。
SEQ ID NO.46是Tb38-1的DNA序列。
SEQ ID NO.47是Tb38-4的DNA序列。
SEQ ID NO.48是TbL-17的DNA序列。
SEQ ID NO.49是TbL-20的DNA序列。
SEQ ID NO.50是TbL-21的DNA序列。
SEQ ID NO.51是TbH-16的DNA序列。
SEQ ID NO.52是DPEP的DNA序列。
SEQ ID NO.53是DPEP的推定的氨基酸序列。
SEQ ID NO.54是DPV N-端抗原的蛋白质序列。
SEQ ID NO.55是AVGS N-端抗原的蛋白质序列。
SEQ ID NO.56是AAMK N-端抗原的蛋白质序列。
SEQ ID NO.57是YYWC N-端抗原的蛋白质序列。
SEQ ID NO.58是DIGS N-端抗原的蛋白质序列。
SEQ ID NO.59是AEES N-端抗原的蛋白质序列。
SEQ ID NO.60是DPEP N-端抗原的蛋白质序列。
SEQ ID NO.61是APKT N-端抗原的蛋白质序列。
SEQ ID NO.62是DPAS N-端抗原的蛋白质序列。
SEQ ID NO.63是TbM-1肽的推定的氨基酸序列。
SEQ ID NO.64是TbRal的推定的氨基酸序列。
SEQ ID NO.65是TbRal0的推定的氨基酸序列。
SEQ ID NO.66是TbRal1的推定的氨基酸序列。
SEQ ID NO.67是TbRal2的推定的氨基酸序列。
SEQ ID NO.68是TbRal3的推定的氨基酸序列。
SEQ iD NO.69是TbRal6的推定的氨基酸序列。
SEQ ID NO.70是TbRal7的推定的氨基酸序列。
SEQ ID NO.71是TbRal8的推定的氨基酸序列。
SEQ ID NO.72是TbRal9的推定的氨基酸序列。
SEQ ID NO.73是TbRa24的推定的氨基酸序列。
SEQ ID NO.74是TbRa26的推定的氨基酸序列。
SEQ ID NO.75是TbRa28的推定的氨基酸序列。
SEQ ID NO.76是TbRa29的推定的氨基酸序列。
SEQ ID NO.77是TbRa2A的推定的氨基酸序列。
SEQ ID NO.78是TbRa3的推定的氨基酸序列。
SEQ ID NO.79是TbRa32的推定的氨基酸序列。
SEQ ID NO.80是TbRa35的推定的氨基酸序列。
SEQ ID NO.81是TbRa36的推定的氨基酸序列。
SEQ ID NO.82是TbRa4的推定的氨基酸序列。
SEQ ID NO.83是TbRa9的推定的氨基酸序列。
SEQ ID NO.84是TbRaB的推定的氨基酸序列。
SEQ ID NO.85是TbRaC的推定的氨基酸序列。
SEQ ID NO.86是TbRaD的推定的氨基酸序列。
SEQ ID NO.87是YYWCPG的推定的氨基酸序列。
SEQ ID NO.88是TbAAMK的推定的氨基酸序列。
SEQ ID NO.89是Tb38-1的推定的氨基酸序列。
SEQ ID NO.90是TbH-4的推定的氨基酸序列。
SEQ ID NO.91是TbH-8的推定的氨基酸序列。
SEQ ID NO.92是TbH-9的推定的氨基酸序列。
SEQ ID NO.93是TbH-12的推定的氨基酸序列。
SEQ ID NO.94是DPAS的DNA序列。
SEQ ID NO.95是DPAS的推定的氨基酸序列。
SEQ ID NO.96是DPV的DNA序列。
SEQ ID NO.97是DPV的推定的氨基酸序列。
SEQ ID NO.98是ESAT-6的DNA序列。
SEQ ID NO.99是ESAT-6的推定的氨基酸序列。
SEQ ID NO.100是TbH-8-2的DNA序列。
SEQ ID NO.101是TbH-9FL的DNA序列。
SEQ ID NO.102是TbH-9FL的推定的氨基酸序列。
SEQ ID NO.103是TbH-9-1的DNA序列。
SEQ ID NO.104是TbH-9-l的推定的氨基酸序列。
SEQ ID NO.105是TbH-9-4的DNA序列。
SEQ ID NO.106是TbH-9-4的推定的氨基酸序列。
SEQ ID NO.107是Tb38-1F2 IN的DNA序列。
SEQ ID NO.108是Tb38-1F2 RP的DNA序列。
SEQ ID NO.109是Tb37-FL的推定的氨基酸序列。
SEQ ID NO.110是Tb38-IN的推定的氨基酸序列。
SEQ ID NO.111是Tb38-1F3的DNA序列。
SEQ ID NO.112是Tb38-1F3的推定的氨基酸序列。
SEQ ID NO.113是Tb38-1F5的DNA序列。
SEQ ID NO.114是Tb38-1F6的DNA序列。
SEQ ID NO.115是DPV的推定的N-端氨基酸序列。
SEQ ID NO.116是AVGS的推定的N-端氨基酸序列。
SEQ ID NO.117是AAMK的推定的N-端氨基酸序列。
SEQ ID NO.118是YYWC的推定的N-端氨基酸序列。
SEQ ID NO.119是DIGS的推定的N-端氨基酸序列。
SEQ ID NO.120是AAES的推定的N-端氨基酸序列。
SEQ ID NO.121是DPEP的推定的N-端氨基酸序列。
SEQ ID NO.122是APKT的推定的N-端氨基酸序列。
SEQ ID NO.123是DPAS的推定的N-端氨基酸序列。
SEQ ID NO.124是DPPD N-端抗原的蛋白质序列。
SEQ ID NO.125-128是四种DPPD溴化氰片段的蛋白质序列。
SEQ ID NO.129是XDS抗原的N-端蛋白质序列。
SEQ ID NO.130是AGD抗原的N-端蛋白质序列。
SEQ ID NO.131是APE抗原的N-端蛋白质序列。
SEQ ID NO.132是XYI抗原的N-端蛋白质序列。
发明详述
如上所述,本发明总的来说涉及诊断结核病的组合物和方法。本发明的组合物包含一些多肽,这些多肽包含结核分枝杆菌抗原或仅在保守取代和/或修饰上不同的该抗原的变体的至少一种抗原性部分。在本发明的范围内的多肽包括,但不限于,可溶性结核分枝杆菌抗原。″可溶性结核分枝杆菌抗原″是存在于结核分枝杆菌培养物滤液中的结核分枝杆菌源的蛋白质。如本文所使用的,术语″多肽″包括任何长度的氨基酸链,包括全长蛋白质(即,抗原),其中的氨基酸残基由共价肽键连接。这样,包含上述一种抗原的抗原性部分的多肽可以是完全由抗原性部分组成的,或者可以含有附加序列。所说的附加序列可以是来源于天然结核分枝杆菌抗原或者可以是异源的,这样的序列可以是(但不需要是)抗原性的。
抗原的″抗原性部分″(可以是也可以不是可溶性的)是能够与从结核分枝杆菌感染个体获得的血清反应的部分(即,在本文描述的代表性ELISA测定中,用感染个体的血清产生的吸收读数至少在用未感染个体血清获得的吸收的三个标准偏差以上)。″结核分枝杆菌感染个体″是已由结核分枝杆菌感染的人(例如,具有直径至少0.5cm的对PPD的真皮内皮试反应)。感染个体可以显示出结核病的症状,或可以是无疾病症状的。通常可以单独或组合使用包含本文描述的一种或多种结核分枝杆菌抗原的至少一种抗原性部分的多肽,以在患者中检测结核病。
本发明的组合物与方法也包括上述多肽的变体。如本文所使用的″变体″是仅在保守取代和/或修饰上不同于天然抗原(以便所述多肽的抗原性特性得到保留)的多肽。通过采用本文描述的代表性方法修饰一种上述多肽序列并评价修饰的多肽的抗原性特性可以一般性地鉴别这样的变体。
″保守取代″是这样一种取代,其中一种氨基酸取代具有类似性质的另一种氨基酸,以便肽化学领域的技术人员可以期望多肽的二级结构与亲水性质实质上不变。一般来说,下组氨基酸代表保守取代:(1)ala、pro、gly、glu、asp、gln、asn、ser、thr;(2)cys、ser、tyr、thr;(3)val、ile、leu、met、ala、phe;(4)lys、arg、his;和(5)phe、tyr、trp、his。
变体也可以(或选择性地)是由例如氨基酸缺失或者添加(对多肽抗原性特性,二级结构和亲水性质具有最小限度的影响)修饰的。例如,多肽可以连结到蛋白质N端的信号(或前导)序列上,后者共翻译或翻译后指导蛋白质的转移。所述多肽也可以连结到使多肽容易合成,纯化以及鉴定或增强多肽结合到固相支持物上的接头和其他序列(例如poly-His)上。例如,多肽可以连结到免疫球蛋白Fc区上。
在一个相关的方面,本文公开了组合多肽。″组合多肽″是包含至少一种上述抗原性部分和一种或多种附加抗原性结核分枝杆菌序列(其经由肽键连接到单一的氨基酸链上)的多肽。所述的序列可以直接连接(即没有间插氨基酸)或通过不明显降低组成多肽的抗原性特性的接头序列(例如,Gly-Cys-Gly)连接。
一般来说,结核分枝杆菌抗原,编码这种抗原的DNA序列,可以多种方法的任何一种制备。例如,可溶性抗原可以用本领域技术人员已知的方法,包括阴离子交换、反相层析从结核分枝杆菌培养物滤液分离。纯化的抗原可以就所需的性质进行评价,所述性质例如与从结核分枝杆菌感染个体获得的血清的反应能力。这样的筛选可以用本文描述的代表性方法完成。可以利用例如传统的Edman化学对抗原进行部分测序。参见Edman和Berg,欧洲生物化学杂志,80:116-132,1967。
也可以用编码抗原的DNA序列(已插入到表达载体中并在合适的宿主中表达)重组产生抗原。可以通过用特异性抗可溶性结核分枝杆菌抗原产生的抗血清(例如兔)筛选合适的结核分枝杆菌表达文库来分离编码可溶性抗原的DNA分子。可以用从感染了结核分枝杆菌的病人获得的血清筛选合适的结核分枝杆菌基因组或者cDNA表达文库鉴别编码抗原(抗原可以是或者可以不是可溶性的)的DNA序列。这样的筛选一般可以利用本领域已知的技术完成,例如在Sambrook等,分子克隆:实验室手册,冷泉港实验室,冷泉港,NY,1989中所描述的那些。
编码可溶性抗原的DNA序列也可以通过就与简并寡核苷酸(该寡核苷酸来源于分离的可溶性抗原的部分氨基酸序列)杂交的DNA序列筛选适当的结核分枝杆菌cDNA或基因组DNA文库来获得。可以如(例如)Sambrook等,分子克隆:实验室手册,冷泉港实验室,冷泉港,NY(和该文引用的参考文献)中的描述设计和合成用于这种筛选的简并寡核苷酸序列,并且完成筛选。也可以使用聚合酶链反应(PCR),用本领域已知的方法用上述寡核苷酸,以从cDNA或基因组文库分离核酸探针。然后可以使用所分离的探针完成文库的筛选。
不论是什么制备方法,本文所描述的抗原是″抗原性的″,更具体地说,所说的抗原具有与从结核分枝杆菌感染个体获得的血清反应的能力。可以采用例如本文描述的代表性的ELISA测定评价反应性,其中用感染个体的血清产生的吸收读数至少在用未感染个体血清获得的吸收的三个标准偏差以上被认为是阳性的。
也可以采用本领域已知的技术(例如在Paul,基础免疫学,第三版,Raven出版社,1993,pp.243-247和该文引用的参考文献中描述的那些技术)制备和鉴别结核分枝杆菌抗原的抗原性部分。这样的技术包括就抗原性特性筛选天然抗原的多肽部分。一般可以将本文所描述的代表性ELISA用于这些筛选。多肽的抗原性部分是这样的部分,其在这样的代表性测定中产生实质上类似由全长抗原产生的信号的这种测定中的信号。换句话说,在本文描述的模式ELISA中,结核分枝杆菌抗原的抗原性部分产生至少约20%,优选地约100%的由全长抗原所产生的信号。
结核分枝杆菌抗原的部分和其它变体可以用合成或者重组方法产生。利用本领域已知的技术,可以产生具有少于约100个氨基酸,一般少于约50个氨基酸的合成多肽。例如,这些多肽可以用任何通过商业途径可获得的固相技术合成,如Merrifield固相合成法,其中氨基酸依次添加到增长的氨基酸链上。参见Merrifield,美国化学会杂志,8:2149-2146,1963。用于多肽的自动合成的设备是可通过商业途径从供应商(如应用生物系统公司,Foster City,CA)获得的,并且可以按照制造厂商的说明操作。一般可以用标准的诱变技术(如寡核苷酸定点特异性诱变)制备天然抗原的变体。也可以用标准的技术除去DNA序列的片段,以便可以制备截短的多肽。
采用本领域技术人员熟知的各种技术,可以容易地从编码多肽的DNA序列制备包含天然抗原部分和/或变体的重组多肽。例如,将重组蛋白质分泌到培养基中的合适的宿主/载体系统的上清液可以首先采用市售的滤器浓缩。在浓缩之后,可以将浓缩液用于合适的纯化基质(如亲和性基质或离子交换树脂)上。最后,可以使用一个或多个反相HPLC步骤,以进一步纯化重组蛋白质。
本领域普通技术人员已知的各种表达载体的任何一种都可以用于表达本文所描述的重组多肽。表达可以在任何合适的宿主细胞中进行,所述的宿主细胞已用含有编码重组多肽的DNA分子的表达载体转化或转染过。合适的宿主细胞包括原核生物,酵母和高级真核细胞。优选地,使用的宿主细胞是大肠杆菌,酵母或哺乳动物细胞系,如COS或CHO。以这一方式表达的DNA序列可以编码天然存在的抗原,天然存在的抗原的部分,或者其其它变体。
一般来说,不论采用哪一种制备方法,本文所公开的多肽实质上以纯化的形式得以制备。优选地,所述多肽的纯度为至少大约80%,更优选地至少大约90%,最优选地至少大约99%。然而,就用于本文所公开的方法而言,这些实质上纯化的多肽可以是组合的。
在某些特定的实施方案中,主题发明公开了一些多肽,这些多肽包含可溶性结核分枝杆菌抗原(或这种抗原的变体)的至少一种抗原性部分,所说的抗原具有一种以下的N端序列:
(a)Asp-Pro-Val-Asp-Ala-Val-Ile-Asn-Thr-Thr-Cys-Asn-Tyr-Gly-Gln-
Val-Val-Ala-Ala-Leu(SEQ ID No.115);
(b)Ala-Val-Glu-Ser-Gly-Met-Leu-Ala-Leu-Gly-Thr-Pro-Ala-Pro-Ser
(SEQ ID No.116);
(c)Ala-Ala-Met-Lys-Pro-Arg-Thr-Gly-Asp-Gly-Pro-Leu-Glu-Ala-
Ala-Lys-Glu-Gly-Arg(SEQ ID No.117);
(d)Tyr-Tyr-Trp-Cys-Pro-Gly-Gln-Pro-Phe-Asp-Pro-Ala-Trp-Gly-Pro
(SEQ ID No.118);
(e)Asp-Ile-Gly-Ser-Glu-Ser-Thr-Glu-Asp-Gln-Gln-Xaa-Ala-Val
(SEQ ID No.119);
(f)Ala-Glu-Glu-Ser-Ile-Ser-Thr-Xaa-Glu-Xaa-Ile-Val-Pro
(SEQ ID No.120);
(g)AspPro-Glu-Pro-Ala-Pro-Pro-Val-Pro-Thr-Thr-Ala-Ala-Ser-Pro-
Pro(SEQ ID No.121);
(h)Ala-Pro-Lys-Thr-Tyr-Xaa-Glu-Glu-Leu-Lys-Gly-Thr-Asp-Thr-
Gly(SEQ ID No.122);
(i)Asp-Pro-Ala-Ser-Ala-Pro-Asp-Val-Pro-Thr-Ala-Ala-Gln-Leu-Thr-
Ser-Leu-Leu-Asn-Ser-Leu-Ala-Asp-Pro-Asn-Val-Ser-Phe-Ala-Asn
(SEQ ID No.123);和
(j)Xaa-Asp-Ser-Glu-Lys-Ser-Ala-Thr-Ile-Lys-Val-Thr-Asp-Ala-Ser;
(SEQ ID No.129)
(k)Ala-Gly-Asp-Thr-Xaa-Ile-Tyr-Ile-Val-Gly-Asn-Leu-Thr-Ala-Asp;
(SEQ ID No.130)或
(l)Ala-Pro-Glu-Ser-Gly-Ala-Gly-Leu-Gly-Gly-Thr-Val-Gln-Ala-Gly;
(SEQ ID No.131)其中Xaa可以是任何氨基酸,优选地是半胱氨酸残基。编码以上标记有(g)的抗原的DNA序列在SEQ ID No.52中给出,其推定的氨基酸序列在SEQID No.53中给出。编码以上标记有(a)的抗原的DNA序列在SEQ ID No.96中给出,其推定的氨基酸序列在SEQ ID No.97中给出。相应于以上抗原(d)的DNA序列在SEQ ID No.24中给出,相应于以上抗原(c)的DNA序列在SEQ ID No.25中给出,相应于以上抗原(I)的DNA序列在SEQ ID No.94中给出,其推定的氨基酸序列在SEQ ID No.95中给出。
在另一个特定的实施方案中,主题发明公开了一些多肽,这些多肽包含具有一种以下的N端序列的结核分枝杆菌抗原,或仅在保守取代和/或修饰上不同的该抗原的变体的至少一种免疫原性部分:
(m)Xaa-Tyr-Ile-Ala-Tyr-Xaa-Thr-Thr-Ala-Gly-Ile-Val-Pro-Gly-Lys-
Ile-Asn-Val-His-Leu-Val;(SEQ ID No.132)或
(n)Asp-Pro-Pro-Asp-Pro-His-Gln-Xaa-Asp-Met-Thr-Lys-Gly-Tyr-
Tyr-Pro-Gly-Gly-Arg-Arg-Xaa-Phe;(SEQ ID No.124),
其中Xaa可以是任何氨基酸,优选地是半胱氨酸残基
在其它特定的实施方案中,主题发明公开了一些多肽,这些多肽包含可溶性的结核分枝杆菌抗原(或这种抗原的变体)的至少一种抗原性部分,所述抗原(或其变体)包含由以下序列编码的一种或多种氨基酸序列:(a)SEQID No.1,2,4-10,13-25,52,94和96的DNA序列,(b)这些DNA序列的补体,或(c)实质上同源于(a)或(b)中的序列的DNA序列。
在其他特定的实施方案中,主题发明公开了一些多肽,这些多肽包含结核分枝杆菌抗原(或这种抗原的变体)的至少一种抗原性部分,所述抗原(或其变体)可以是也可以不是可溶性的,其包含由以下序列编码的一种或多种氨基酸序列:(a)SEQ ID No.26-51的DNA序列,(b)这些DNA序列的补体,或(c)实质上同源于(a)或(b)中的序列的DNA序列。
在以上讨论的特定的实施方案中,结核分枝杆菌抗原包括由实质上同源于本文特别提出的一种或多种DNA序列的DNA序列编码的变体。本文使用的“实质上的同源性”指在中等严格条件下能够杂交的DNA序列。合适的中等严格条件包括在5X SSC,0.5%SDS,1.0mM EDTA(pH8.0)溶液中预洗涤;在50℃-65℃,5X SSC下杂交一夜,或者在杂交物种同源的情况下在45℃,5X SSC下杂交;接着在65℃下洗涤两次,每次以包含0.1%SDS的2X,0.5X和0.2X SSC洗涤20分钟。这样的杂交DNA序列也在本发明的范围内,由于密码简并,编码由杂交DNA序列编码的免疫原性多肽的核苷酸序列也是如此。
在一个相关的方面,本发明提供了一些融合蛋白以及这些融合蛋白的变体,所说的融合蛋白包含第一与第二发明多肽或者是本发明多肽与已知的结核分枝杆菌抗原的融合蛋白,所述抗原如以上描述的38kD抗原或ESAT-6(SEQ ID No.98和99)。本发明的融合蛋白也可以包含在所说的第一和第二多肽之间的接头肽。
利用已知的DNA重组技术将分离的编码第一和第二多肽的DNA序列装配到适当的表达载体中,由此来构建编码本发明的融合蛋白的DNA序列。将具有或不具有肽接头的编码第一多肽的DNA序列的3’末端连接到编码第二多肽的DNA序列的5’末端,以便这些序列的读框处于可以使两种DNA序列的mRNA翻译成保持第一和第二多肽两者的生物学活性的单一融合蛋白的状态。
肽接头序列可以用于通过足以保证各多肽折叠成其二级和四级结构的距离分离第一和第二多肽。采用本领域熟知的标准技术将这样一种肽接头序列掺入到融合蛋白中。可以基于下列因素选择合适的肽接头序列:(1)它们采取柔性延伸构象的能力;(2)它们不采取二级结构(其可以与第一和第二多肽上的功能性表位相互作用)的能力;和(3)可以与多肽的功能性表位进行反应的疏水或带电残基的缺乏。优选的肽接头序列包括Gly、Asn和Ser残基。其它接近中性的氨基酸,如Thr和Ala也可以用于接头序列。可以有利地用作接头序列的氨基酸序列包括在Maratea等,基因,40:39-46,1985;Murphy等,美国科学院学报,83:8258-8562,1986;美国专利4,935,233和美国专利4,751,180中公开的那些。所说的接头序列长度可以从1到约50个氨基酸。当第一和第二多肽具有可以用来分离功能域和阻止空间位阻的非必需N端氨基酸区时,肽接头序列是不需要的。
另一方面,本发明提供了用于利用以上所描述的多肽来诊断结核病的方法。在这一方面,提供了通过单独或组合使用一种或多种以上多肽检测生物样品中结核分枝杆菌感染的方法。在采用多种多肽的实施方案中,可以包括本文特定描述的那些多肽之外的多肽,例如在Andersen和Hansen,感染免疫学,57:2481-2488,1989中描述的38kD抗原。本文所使用的″生物样品″是任何从患者所获得的含有抗体的样品。优选地样品是全血,痰,血清,血浆,唾液,脑脊液或者尿。更优选地样品是从患者或血液供体所获得的血清或者血浆样品。如以下的描述将所述多肽用于测定中,以确定样品中抗体的存在或不存在(相对于预定的切断(cut-off)值)。这样的抗体的存在表明对可以指示结核病的分枝杆菌抗原的早期致敏作用。
在使用多于一种多肽的实施方案中,所使用的多肽优选地是互补的(即一种组分多肽倾向于检测样品中不能由另一种组分多肽检测的感染)。一般可以采用各种多肽鉴别互补多肽,以分别评价从已知由结核分枝杆菌感染的一系列病人获得的血清样品。在用各多肽确定哪些样品为试验阳性(如下所述)后,可以制备能够检测大多数或所有待试样品中的感染的两种或多种多肽的组合体。这些多肽是互补性的。例如,肺结核-感染个体血清的约25-30%就针对任意单一蛋白质(如以上所论及的38kD抗原)的抗体而言是阴性的。因此,互补多肽可以与38kD抗原结合起来使用,以改进诊断试验的灵敏度。
有本领域技术人员已知的用一种或多种多肽检测样品中抗体的多种方式。参见,例如,Harlow和Lane,抗体:实验室手册,冷泉港实验室,1988,该文献本文一并参考。在一个优选的实施方案中,所说的测定包括利用固定在固相支持物上的多肽结合和除去样品中的抗体。然后,结合的抗体可以用含有报道基团的检测试剂检测。合适的检测试剂包括结合到抗体/多肽复合物和游离多肽上的抗体,其是由报道基团标记的(例如,在半竞争性测定中)。此外,可以使用竞争性测定,其中结合到多肽上的抗体以报道基团标记,并且使得可以在将抗原与样品温育后结合到固定化的抗原上。样品组分抑制标记抗体对多肽结合的程度是样品与固定化多肽反应性的指示。
固相支持物可以是任何本领域普通技术人员已知的抗原可以连接于其上的固体物质。例如,固相支持物可以是微量滴定板中的试验孔或者硝化纤维素或者其它合适的膜。此外,支持物可以是小珠或圆盘,如玻璃,玻璃纤维,乳胶或者塑料材料,如聚苯乙烯或聚氯乙烯。支持物也可以是磁性颗粒或纤维光学传感器,例如,在美国专利5,359,681中公开的那些。
所述多肽可以用任何本领域普通技术人员已知的多种技术结合到固相支持物上,这些技术在专利和科学文献中有详细的描述。在本发明的上下文中,术语″结合″指非共价缔合(如吸附)和共价连接(可以是抗原和在支持物上的官能团的直接键合,或者可以是利用交联剂连接)。通过吸附到微量滴定板中的孔上或者膜上的结合是优选的。在这样的情况下,吸附可以通过将在合适的缓冲液中的多肽与固相支持物接触一段合适的时间完成。接触时间随着温度变化,但是一般在大约1小时和1天之间。一般来说,使塑料微量滴定板(如聚苯乙烯或聚氯乙烯)的孔与范围从约10ng到约1μg,优选地约100ng量的多肽接触足以结合充分量的抗原。
通过首先将支持物与双功能试剂反应一般可以完成多肽与固相支持物的共价连接,所述的双功能试剂与支持物和多肽上的官能团(如羟基或氨基基团)两者反应。例如,所述多肽可以结合到具有合适的聚合物的支持物上(采用苯醌涂布或经将醛基团与多肽上胺或活性氢缩合)(参见,例如,Pierce免疫技术目录和手册,1991,A12-A13)。
在某些实施方案中,所述的测定是酶联免疫吸附测定(ELISA)。这一测定可以通过首先使已固定化到固相支持物(一般是微量滴定板的孔)上的多肽抗原与样品接触,以便样品中的多肽的抗体可以结合到固定化的多肽上。然后从固定化的多肽上除去未结合的样品,并加入能够结合固定化的抗体-多肽复合物的检测试剂。然后,采用适合于特定检测试剂的方法测定保持结合到固相支持物上的检测试剂的量。
更具体地说,一旦多肽如上所述固定化在支持物上,则剩下的在支持物上的蛋白质结合部位就通常被阻断。任何本领域普通技术人员已知的合适的阻断剂,如牛血清白蛋白或吐温20TM(Sigma化学公司,St.Louis,MO),都可以使用。然后将固定化的多肽与样品一起温育,使抗体结合到抗原上。在温育之前,样品可以以合适的稀释剂稀释,所述稀释剂如磷酸盐缓冲盐水(PBS)。一般来说,适当的接触时间(即,温育时间)是对检测结核分枝杆菌感染样品中抗体存在的足够的那段时间。优选地,所说的接触时间足以完成至少95%的结合水平(结合的和未结合的抗体之间达到平衡)。本领域普通技术人员会认识到达到平衡所需的时间可以通过测定整个期限内出现结合水平容易地确定。在室温下,约30分钟的温育时间一般是足够的。
然后,可以通过用适当的缓冲液(如包含0.1%吐温20TM的PBS)洗涤固相支持物除去未结合的样品。接着检测试剂可以加入到固相支持物上。适当的检测试剂是结合到固定化的抗体-多肽复合物上并且可以用本领域已知的各种方法之任何一种检测的任何化合物。优选地,所述的检测试剂含有结合到报道基团上的结合剂(例如,蛋白质A、蛋白质G、免疫球蛋白、凝集素或者游离抗原)。优选的报道基团包括酶(如辣根过氧化物酶)、底物、辅因子、抑制剂、染料、放射性核素、发光基团、荧光基团和生物素。可以用本领域普通技术人员已知的标准的方法完成报道基团与结合剂的结合。结合到各种报道基团上的普通的结合剂也可以从多种商业来源(例如,Zymed Laboratories,旧金山,CA,和Pierce,Rockford,IL)购得。
然后,将检测试剂与固定化的抗体-多肽复合物一起温育足以检测结合抗体的一段时间。合适的一段时间一般从制造厂商的说明确定或通过测定在整个时间内出现的结合水平确定。接着除去未结合的检测试剂,并采用报道基团检测结合的检测试剂。用于检测报道基团的方法取决于报道基团的性质。对于放射性基团,闪烁计数或放射自显影法一般是适当的。光谱学方法可以用于检测染料,发光基团和荧光基团。连接到不同报道基团(一般是放射性或者荧光基团或酶)上的生物素可以利用抗生物素蛋白检测。酶报道基团一般可以通过添加底物(一般是一段特定的时间),然后进行反应产物的光谱或其它分析来检测。
为了确定样品中结核分枝杆菌抗体的存在或不存在,一般将从保持结合到固相支持物上的报道基团检测到的信号与相应于预定截止值的信号比较。在一个优选的实施方案中,当固定化的抗原与未感染的病人的样品一起温育时,所说的截止值是所获得的平均信号。一般来说,产生的信号在预定的截止值三个标准偏差之上的样品被认为是结核病阳性的。在另一个优选的实施方案中,按照Sackett等,临床流行病学:一种临床医学的基础科学,Little Brown and Co.,1985,pp.106-107的方法采用接受体-操纵物(Receiver Operator)曲线确定截止值。简言之,在这一实施方案中,截止值可以从真阳性大鼠(即敏感性)和假阳性大鼠(100%-特异性)对的图(其相应于诊断试验结果的各种可能的截止值)确定。在最靠近左上角图上的截止值(即圈在最大区域内的值)是最精确的截止值,产生的信号高于由这一方法确定的截止值的样品被认为是阳性的。另外,所说的截止值可以沿图移向左边(以最小化假阳性率),或者右边(以最小化假阴性率)。一般来说,产生的信号高于由这一方法确定的截止值的样品被认为是结核病阳性的。
在相关的实施方案中,所说的测定以迅速过流或布条断裂强度试验方式完成,其中抗原固定化在膜(如硝化纤维素膜)上。在过流试验中,在样品通过膜时,样品内的抗体结合到固定化的多肽上。然后,当含有检测试剂的溶液流过膜时,检测试剂(例如,蛋白质A-胶态金)结合到抗体-多肽复合物上。然后可以按照以上的描述完成对结合的检测试剂的检测。在布条断裂强度试验方式中,将多肽结合于其上的膜的一端浸没在包含样品的溶液中。样品沿着膜迁移,穿过包含检测试剂的区域,到达固定化的多肽的区。在多肽上的检测试剂的浓度表明样品中抗结核分枝杆菌抗体的存在。典型地,在这一部位的检测试剂的浓度产生可以容易被观察的模式,如线状。缺乏这样一种模式表明阴性结果。一般来说,选择在膜上固定化的多肽的量,以便当生物样品含有足以在ELISA中产生阳性信号的抗体水平时(如以上所讨论的),产生清楚可见的模式。优选地,固定化在膜上的多肽的量的范围从约25ng到约1μg,更优选地从约50ng到约500ng。这样的试验典型地以十分小的量(例如1滴)的病人血清或血液进行。
当然,存在适合采用本发明的多肽的许多其它测定方案。以上描述仅仅是为了例举。
在另一方面,本发明提供了针对发明多肽的抗体。可以通过各种本领域普通技术人员已知的技术的任意一种制备抗体。参见,例如,Harlow和Lane,抗体:实验室手册,冷泉港实验室,1988。在一种这样的技术中,包含抗原性多肽的免疫原起初注射进任何哺乳动物的各种品种(例如,小鼠,大鼠,兔,绵羊以及山羊)。在这一步骤中,本发明的多肽可以不经修饰作为免疫原。此外,特别是对相对比较短的多肽而言,如果多肽连接到载体蛋白(如牛血清白蛋白或匙孔血蓝蛋白)上,则可以激发高级免疫应答。将免疫原注射进动物宿主,优选地是按照掺入一种或多种加强免疫的预定方案注射,并且周期性地使动物放血。然后,对多肽特异性的多克隆抗体可以通过,例如使用连接到合适的固相支持物上的多肽的亲和层析从这样的抗血清纯化。
可以采用例如Kohler和Milstein,欧洲免疫学杂志,6:511-519,1976的技术和其改进的技术制备兴趣抗原性多肽特异性的单克隆抗体。简言之,这些方法包括制备能够产生具有所需特异性(例如,与兴趣多肽的反应性)的抗体的无限增殖细胞系。这样的细胞系可以从例如脾细胞(由按照以上的描述免疫的动物获得的)产生。然后,通过例如与骨髓瘤细胞融合配偶体(优选地是与免疫的动物同系的一种)融合使脾细胞无限增殖化。可以使用各种融合技术。例如,可以将脾细胞和骨髓瘤细胞与非离子去污剂组合在一起几分钟,然后在选择培养基上低密度平板接种,所说的选择培养基支持杂交细胞生长,但不支持骨髓瘤细胞生长。一种优选的选择技术利用HAT(次黄嘌呤,氨基蝶呤,胸苷)选择。在足够的时间(通常约1至2周)之后,观察到杂交体集落。选择单一集落,并试验针对多肽的结合活性。具有高反应性和特异性的杂交瘤是优选的。
单克隆抗体可以从生长的杂交瘤集落上清液分离。此外,各种技术可以用来提高产率,如将杂交瘤细胞系注射进合适的脊椎动物宿主(如小鼠)的腹膜腔。然后可以从腹水液或血液收获单克隆抗体。可以用常规技术从抗体除去污染物,所述技术如层析,凝胶过滤,沉淀和抽提。本发明的多肽可以用于例如,亲和性层析步骤的纯化过程中。
采用类似于以上详细描述的测定法和本领域技术人员已知的其它技术,可以将抗体用于检测结核分枝杆菌抗原存在的诊断试验中,从而提供在病人中检测结核分枝杆菌感染的方法。
本发明的诊断试剂也可以包含编码一种或多种上述多肽的DNA序列,或一种或多种其部分。例如,包含主题DNA序列的至少10个邻接寡核苷酸的引物可以用于以聚合酶链反应(PCR)为基础的试验中。同样地,包含主题DNA序列的至少15个邻接寡核苷酸的探针可以用于与特定序列杂交。基于PCR试验和杂交试验的技术是本领域已知的。这样,引物或者探针可以用于检测生物样品中的结核分枝杆菌感染,所述样品优选地是痰,血液,血清,唾液,脑脊液或者尿。包含以上描述的寡核苷酸序列的DNA探针或引物可以单独使用,相互结合使用,或者与以前鉴别的序列(例如以上讨论的38kD抗原)结合使用。
以说明性的方式但不以限制性的方式给出下列实施例。
实施例
实施例1
来源于结核分枝杆菌培养物滤液的多肽的纯化和特征确定
这一例子说明从培养物滤液制备结核分枝杆菌可溶性多肽的方法。除非有其它方式注明,下列例子的所有百分比都是重量/体积百分比。
于37℃在无菌GAS培养基中培养结核分枝杆菌(H37Ra,ATCCNo.25177或H37Rv,ATCC No.25618)14天。然后经0.45μ滤器将培养基真空过滤(留下大批细胞)到无菌的2.5L瓶中。接着经0.2μ滤器将培养基过滤到无菌的4L瓶中。向培养物滤液中加入NaN3,使其浓度达0.04%。然后将瓶置于4℃的冷室中。
通过将滤液置于已高压灭菌的12L贮器中,并将滤液供入400mlAmicon搅拌池中浓缩培养物滤液,该搅拌池已以乙醇冲洗过,并且包含10,000kDa MWCO膜。使用氮气使压力保持在60psi。这一过程使12L体积减少到约50ml。
然后,采用8,000kDa MWCO纤维素酯膜将培养物滤液对0.1%碳酸氢铵透析,两次更换碳酸氢铵溶液。接着由通过商业途径可获得的BCA测定法(Pierce,Rockford,IL)测定蛋白质浓度。
然后将透析培养物滤液进行冻干,把多肽重悬于蒸馏水中。然后,将多肽对0.01mM 1,3双[三(羟甲基)-甲氨基]丙烷,pH7.5(Bis-Tris丙烷缓冲液)(阴离子交换层析的起始条件)透析。利用在POROS 146 II Q/M阴离子交换柱4.6mm×100mm(Perseptive BioSystems,Framingham,MA)上的凝胶预熔融(profusion)层析完成分级分离,所述交换柱已在0.01mMBis-Tris丙烷缓冲液(pH7.5)中平衡过。用在上述缓冲液系统中的0-0.5MNaCl梯度洗脱多肽。在220nm波长下监测柱洗脱液。
将从离子交换柱洗脱的多肽收集物对蒸馏水透析并冻干。将所形成的物质溶解到在水中的0.1%三氟乙酸(TFA)(pH1.9)中,并且在Delta-PakC18柱(Waters,Milford,MA,300埃孔径大小,5微米颗粒大小(3.9×150mm))上纯化该多肽。用从0到60%稀释缓冲液(在乙腈中的0.1%TFA)线性梯度液从柱中洗脱多肽。流速是0.75ml/分钟,在214nm监测HPLC洗脱液。收集包含洗脱的多肽的组分,使单个样品纯度最大。获得约200个纯化的多肽。
然后,就在PBMC制剂中诱导T细胞增殖的能力筛选纯化的多肽。将PBMC(来源于称为PPD皮试阳性的供体,并且其T细胞表现出应答PPD和粗的MTB可溶性蛋白质的增殖)在包含RPMI 1640(补充有10%收集的人血清和50μg/mL庆大霉素)的培养基中培养。双份以0.5至10μg/mL的浓度添加纯化的多肽。96-孔园底平板中以200μl体积培养6天后,从各孔除去50μl培养基,以测定IFN-γ水平,如以下所述。接着用1μCi/孔含氚胸苷脉冲平板另外的18小时,收获,并用气体闪烁计数器测定氚摄取。在两个重复中产生的增殖高于在单独的培养基中培养的细胞上观察到的增殖的3倍的组分被认为是阳性的。
用酶联免疫吸附测定(ELISA)测定IFN-γ。在室温下用在PBS中的针对人类IFN-γ(Chemicon)的小鼠单克隆抗体涂布ELISA平板4小时。然后在室温下用包含5%(WN)脱脂干奶的PBS阻断各孔。接着用PBS/0.2%TWEEN-20洗涤平板6次,将在ELISA平板上的以培养基1∶2稀释的样品在室温下过夜温育。再次洗涤平板,向各孔中添加以PBS/10%正常山羊血清1∶3000稀释的多克隆兔抗-人IFN-γ血清。然后在室温下温育平板两小时,洗涤,加入以PBS/5%脱脂干奶1∶2000稀释的辣根过氧化物酶-偶联的抗-兔IgG(Jackson Labs.)。在室温下进一步温育2小时后,洗涤平板,并加入TMB底物。20分钟后用1N硫酸终止反应。用570nm为参照波长,在450nm测定光密度。在两个重复中导致给出的OD高于在单独的培养基中培养的细胞的平均OD加3个标准偏差的组分被认为是阳性的。
为了测序,将多肽单个地干燥到BiobreneTM(Perkin Elmer/AppliedBioSystems Division,Foster City,CA)处理过的玻璃纤维滤器上。将具有多肽的滤器装到Perkin Elmer/Applied BioSystems Division Procise 492蛋白质测序仪上。从氨基端测序多肽,并且用传统的Edman化学法。通过把PTH氨基酸衍生物的保留时间与适当的PTH衍生物标准比较,确定各多肽的氨基酸序列。
利用以上描述的方法,分离到具有下列N端序列的抗原:
(a)Asp-Pro-Val-Asp-Ala-Val-Ile-Asn-Thr-Thr-Xaa-Asn-Tyr-Gly-
Gln-Val-Val-Ala-Ala-Leu(SEQ ID No.54);
(b)Ala-Val-Glu-Ser-Gly-Met-Leu-Ala-Leu-Gly-Thr-Pro-Ala-Pro-
Ser(SEQ ID No.55);
(c)Ala-Ala-Met-Lys-Pro-Arg-Thr-Gly-Asp-Gly-Pro-LeB-Gln-Ala-
Ala-Lys-Glu-Gly-Arg(SEQ ID No.56);
(d)Tyr-Tyr-Trp-Cys-Pro-Gly-Gln-Pro-Phe-Asp-Pro-Ala-Trp-Gly-
Pro(SEQ ID No.57);
(e)Asp-Ile-Gly-Ser-Glu-Ser-Thr-Glu-Asp-Gln-Gln-Xaa-Ala-Val
(SEQ ID No.58);
(f)Ala-Glu-Glu-Ser-Ile-Ser-Thr-Xaa-Glu-Xaa-Ile-Val-Pro(SEQ ID
No.59);
(g)Asp-Pro-Glu-Pro-Ala-Pro-Pro-Val-Pro-Thr-Ala-Ala-Ala-Ala-
Pro-Pro-Ala(SEQ ID No.60);和
(h)Ala-Pro-Lys-Thr-Tyr-Xaa-Glu-Glu-Leu-Lys-Gly-Thr-Asp-Thr-
Gly(SEQ ID No.61);
其中Xaa可以是任何氨基酸。
除以上所描述的方法之外,通过使用微内径柱HPLC纯化步骤分离到另外的抗原。具体地说,在Aquapore C18柱(Perkin Elmer/AppliedBiosystems Division,Foster City,CA)上纯化包含以上描述的层析纯化步骤的抗原混合物的20μl组分,所说的柱具有7微米孔径大小,柱规格为1mm×100mm,在Perkin Elmer/Applied Biosystems Division 172 HPLC型中。以80μl/分钟的流速,用在水(0.05%TFA)中的乙腈(含0.05%TFA)的1%/分钟的线性梯度液从柱上洗脱各组分。在250nm下监测洗脱液。原组分被分离成4个主要的峰加其他小的组分,并且获得显示出具有12.054Kd分子量(由质谱测得)和具有以下N端序列的多肽:
(i)Asp-Pro-Ala-Ser-Ala-Pro-Asp-Val-Pro-Thr-Ala-Ala-Gln-Gln-
Thr-Ser-Leu-Leu-Asn-Asn-Leu-Ala-Asp-Pro-Asp-Val-Ser-
Phe-Ala-Asp(SEQ ID No.62)。采用以上所述的测定法,这一多肽显示出在PBMC制剂中诱导增殖和IFN-γ产生。
按照以下所述从结核分枝杆菌培养物滤液分离另外的可溶性抗原。结核分枝杆菌培养物滤液按照以上描述的方法制备。在pH 5.5下对Bis-Tris丙烷缓冲液透析后,用在Poros QE柱4.6×100mm(PerseptiveBiosystems)上的阴离子交换层析完成分级分离,所述柱在Bis-Tris丙烷缓冲液(pH 5.5)中平衡过。以10ml/分钟的流速,用在上述缓冲系统中的线性0-1.5M NaCl梯度液洗脱多肽。在214nm下检测柱洗脱液。
收集从离子交换柱洗脱的组分,并采用Poros R2柱4.6×100mm(Perseptive Biosystems)进行反相层析。以5ml/分钟的流速,用0-100%乙腈(0.1%TFA)的线性梯度液从柱上洗脱多肽,在214nm监测洗脱液。
将包含洗脱的多肽的组分冷干,并重悬于80μl 0.1%TFA水溶液中,并再在Vydac C4柱4.6×150mm(Western Analytical,Temecula,CA)上,以2ml/分钟的流速,用0-100%乙腈(0.1%TFA)线性梯度液进行反相层析。在214nm监测洗脱液。
具有生物活性的组分被分离成一个主要的峰加其它小组分。这一峰的PVDF膜上的Western印迹揭示分子量为14Kd,20Kd和26Kd的三个主要带。确定了这些多肽分别具有下列N端序列:
(j)Xaa-Asp-Ser-Glu-Lys-Ser-Ala-Thr-Ile-Lys-Val-Thr-Asp-
Ala-Ser;(SEQ ID No.129)
(k)Ala-Gly-Asp-Thr-Xaa-Ile-Tyr-Ile-Val-Gly-Asn-Leu-Thr-
Ala-Asp;(SEQ ID No.130)和
(l)Ala-Pro-Glu-Ser-Gly-Ala-Gly-Leu-Gly-Gly-Thr-Val-Gln-
Ala-Gly;(SEQ ID No.131),其中Xaa可以是任何氨基酸。采用以上所述的测定法,这些多肽显示出在PBMC制剂中诱导增殖和IFN-γ产生。图1A-1B和图1C-1D分别显示了使用第一和第二供体的PBMC制剂进行的这种测定的结果。
通过采用32P末端标记的简并寡核苷酸(相应于N端序列并含有结核分枝杆菌密码子偏倚)筛选结核分枝杆菌基因组文库获得编码以上指定为(a),(c),(d)和(g)的抗原的DNA序列。采用相应于以上抗原(a)的探针进行的筛选鉴别具有SEQ ID No.96所示的序列的克隆。由SEQ ID No.96编码的多肽在SEQ ID No.97中给出。采用相应于以上抗原(g)的探针进行的筛选鉴别具有SEQ ID No.52所示的序列的克隆。由SEQ ID No.52编码的多肽在SEQ ID No.53中给出。采用相应于以上抗原(d)的探针进行的筛选鉴别具有SEQ ID No.24所示的序列的克隆。采用相应于以上抗原(c)的探针进行的筛选鉴别具有SEQ ID No.25所示的序列的克隆。
采用DNA STAR系统,将以上氨基酸序列与基因库中的已知氨基酸序列比较。所检索的数据库含有大约173,000种蛋白质,并且是Swiss,PIR数据库以及翻译的蛋白质序列(版本87)的组合。对抗原(a)-(h)和(l),没有检测到与所说的氨基酸序列的明显的同源性。
发现抗原(i)的氨基酸序列同源于麻风分枝杆菌的序列。利用从GENBANK获得的序列从基因组DNA扩增全长麻风分枝杆菌序列。然后,将这一序列用于筛选结核分枝杆菌文库,获得全长拷贝的结核分枝杆菌的同系物(SEQ ID No.94)。
发现抗原(j)的氨基酸序列同源于从DNA序列翻译的已知结核分枝杆菌蛋白质。就发明者所知,这一蛋白质以前还没有显示出具有T-细胞刺激活性。发现抗原(k)的氨基酸序列与麻风分枝杆菌的序列相关。
在以上描述的增殖与IFN-γ测定中,利用三个PPD阳性供体,以上所提供的代表性抗原的结果在表1中给出:
表 1
PBMC增殖和IFN-γ测定的结果
序列 | 增殖 | IFN-γ |
(a) | + | - |
(c) | +++ | +++ |
(d) | ++ | ++ |
(g) | +++ | +++ |
(h) | +++ | +++ |
在表1中,给出2和4之间的刺激指数(SI)的反应(与在单独的培养基培养的细胞比较)记录为+,在1μg或更低的浓度下的4-8或2-4的SI记录为++,大于8的SI记录为+++。发现序列(i)的抗原在增殖和IFN-γ测序两者中,对一种供体具有高的SI(+++),对两种其它供体具有较低的SI(++和+)。这些结果表明这些抗原有能力诱导增殖和/或干扰素-γ产生。
实施例2
使用病人血清分离结核分枝杆菌抗原
这一例子说明通过用结核分枝杆菌感染个体的血清筛选从结核分枝杆菌溶解产物分离抗原的方法。
将干燥的结核分枝杆菌H37Ra(Difco实验室)添加至2%NP40溶液中,此外,匀浆和超声处理三次。在13,000rpm下在微量离心管中离心所形成的悬浮液,将上清液通过0.2微米注射滤器。将滤液结合到Macro PrepDEAE小珠(BioRad,Hercules,CA)上。用20mM Tris(pH7.5)充分洗涤小珠,结合的蛋白质以1M NaCl洗脱。将NaCl洗脱液对10mMTris(pH7.5)透析一夜。在室温下用0.05mg/ml的DNase和RNase处理透析溶液30分钟,然后于室温在pH4.5下用0.5U/mgα-D-甘露糖苷酶处理。在返回到pH7.5后,在Bio Scale-Q-20柱(BioRad)上经FPLC分级分离该物质。将组分合并到九个池中,在Centriprep 10(Amicon,Beverley,MA)中浓缩,并且采用结核分枝杆菌感染病人的血清(其与本发明的其它抗原不发生免疫反应)就血清学活性经Western印迹筛选。
将反应性最强的组分在SDS-PAGE上进行分析,并转移到PVDF上。切下约85Kd的带,产生以下序列:
(m)Xaa-Tyr-Ile-Ala-Tyr-Xaa-Thr-Thr-Ala-Gly-Ile-Val-Pro-Gly-Lys-
Ile-Asn-Val-His-Leu-Val;(SEQ ID No.132),
其中Xaa可以是任何氨基酸。
这些序列与以上描述的基因库中的那些序列的比较揭示出与已知的序列没有明显的同源性。
实施例3
制备编码结核分枝杆菌抗原的DNA序列
这一例子说明通过用从结核分枝杆菌感染病人获得的血清或者用抗结核分枝杆菌抗原产生的抗血清筛选结核分枝杆菌表达文库,制备编码结核分枝杆菌抗原的DNA序列的方法。
A.用兔抗血清制备结核分枝杆菌可溶性抗原
从结核分枝杆菌菌株H37Ra分离基因组DNA。随机剪切该DNA,并用于用Lambda ZAP表达系统(Stratagene,La Jolla,CA)构建表达文库。通过用结核分枝杆菌培养物的浓缩上清液免疫兔产生抗结核分枝杆菌菌株H37Ra,H37Rv和Erdman的分泌蛋白质的兔抗血清。具体地说,首先用200μg在含有100μg胞壁酰二肽的2ml总体积中的蛋白质抗原(Calbiochem,La Jolla,CA)和1ml弗氏不完全佐剂皮下免疫兔。四周后,用在弗氏不完全佐剂中的100μg抗原皮下加强免疫兔。最后,在四周后用50μg蛋白质抗原静脉内免疫兔。如Sambrook等,分子克隆:实验室手册,冷泉港实验室,冷泉港,NY,1989中的描述将抗血清用于筛选表达文库。纯化表达免疫反应性抗原的噬菌体噬斑。噬斑的噬粒得到救援,结核分枝杆菌克隆的核苷酸序列被推定。
纯化了32个克隆。在这些克隆中,25个代表在结核分枝杆菌中以前没有鉴别过的序列。如Skeiky等,实验医学杂志,181:1527-1537,1995中所述用IPTG诱导蛋白质,并经凝胶洗脱纯化。在这一筛选中鉴别的DNA分子的代表性部分序列在SEQ ID No.1-25中给出。相应的预言的氨基酸序列在SEQ ID No.64-88中给出。
基于采用以上所述的数据库将这些序列与基因库中的已知序列比较,发现下文中称为TbRA2A、TbRA16、TbRA18和TbRA29(SEQ ID No.77、69、71、76)的克隆显示出与以前在麻风分枝杆菌中而不是在结核分枝杆菌中鉴别的序列的某些同源性。TbRA11、TbRA26、TbRA28和TbDPEP(SEQ ID No.66、74、75、53)以前在结核分枝杆菌中已鉴定过。对TbRA1、TbRA3、TbRA4、TbRA9、TbRA10、TbRA13、TbRA17、TbRA19、TbRA29、TbRA32、TbRA36和重叠克隆TbRA35和TbRA12(分别为SEQ ID No.64、78、82、83、65、68、76、72、76、79、81、80、67)没有发现明显的同源性。克隆TbRa24与克隆TbRa29重叠。
B.使用病人血清鉴别编码结核分枝杆菌抗原的DNA序列
采用从患活动性结核病的患者获得的血清库筛选以上描述的基因组DNA文库和另外的H37Rv文库。为了制备H37Rv文库,分离结核分枝杆菌菌株H37Rv基因组的DNA,进行部分Sau3A消化,并用于采用LambdaZap表达系统(Stratagene,La JolIa,Ca)构建表达文库。将三种不同库的血清(各含有从患有活动性肺部或胸膜疾病的个体获得的血清)用于表达筛选。有关在ELISA和免疫印迹方式两者中与H37Ra溶解产物的相对反应性,这些库被指定为TbL、TbM和TbH(即,TbL=低反应性,TbM=中等反应性和TbH=高反应性)。也使用了来自活动性肺结核病的七个患者血清的四个库。所有血清缺乏与重组38kD结核分枝杆菌H37Ra磷酸盐-结合蛋白的增加的反应性。
所有库用大肠杆菌溶解产物预吸附,并用于如Sambrook等,分子克隆:实验室手册,冷泉港实验室,冷泉港,NY,1989中所述筛选H37Ra和H37Rv表达文库。纯化表达免疫反应性抗原的噬菌体噬斑。噬斑的噬粒得到救援,结核分枝杆菌克隆的核苷酸序列被推定。
纯化了32个克隆。在这些克隆中,31个代表在人类结核分枝杆菌中以前没有鉴别过的序列。所鉴别的DNA分子的代表性序列在SEQ ID NO.26-51和100中给出。在这些克隆中,TbH-8和TbH-8-2(SEQ ID No.100)是相同克隆的非邻接DNA序列,TbH-4(SEQ ID No.43)和TbH-4-FWD(SEQ ID No.44)是相同克隆的非邻接序列。此后鉴别为Tb38-1、TbH-4、TbH-8、TbH-9、和TbH-12的抗原的氨基酸序列在SEQ ID NO.89-93中显示。利用以上确定的数据库将这些序列与基因库中的已知序列的比较揭示出,对TbH-4、TbH-8、TbH-9和TbM-3没有明显的同源性,虽然对TbH-9发现了弱的同源性。发现TbH-12同源于以前在副结核分枝杆菌(Acc.No.S28515)中鉴定的34kD抗原蛋白质。发现Tb38-1位于以前在牛型分枝杆菌(Acc.No.U34848)和结核分枝杆菌中鉴别的抗原ESAT-6开放读框上游34个碱基对(Sorensen等,感染免疫学,63:1710-1717,1995)。
将来源于Tb38-1和TbH-9(两者都是从H37Ra文库分离的)的探针用于鉴别H37Rv文库中的克隆。Tb38-1杂交到Tb38-1F2、Tb38-1F3、Tb38-1F5和Tb38-1F6(SEQ ID No.107、108、111、113和114)。SEQID No.107和108是来源于克隆Tb38-1F2的非邻接序列,推定了Tb38-IF2中的两个开放读框;一个相应于Tb37FL(SEQ ID No.109),第二个(部分序列)可以是Tb38-1的同系物,并称为Tb38-IN(SEQ ID No.110)。Tb38-1F3的推定的氨基酸序列在SEQ ID No.112中给出。TbH-9探针鉴别了H37Rv文库中的三个克隆:TDH-9-FL(SEQ ID No.101),其可以是TbH-9(R37Ra)的同系物;TbH-9-1(SEQ ID No.103)和TbH-9-4(SEQID No.105),所有这些都是TbH-9的高度相关序列。这三个克隆的推定的氨基酸序列在SEQ ID No.102、104和106中给出。
实施例4
来源于结核菌素纯化蛋白质衍生物的多肽的纯化和特征确定
按照以下所述从结核菌素纯化蛋白质衍生物(PPD)分离结核分枝杆菌多肽。
按进行某些修改的出版的方法(Seibert,F等,结核菌素纯化蛋白质衍生物。大量制备和分析标准。美国结核病评论44:9-25,1941)制备PPD。
于37℃下在摇瓶中用合成培养基培养结核分枝杆菌Rv菌株6周。然后将含有细菌生长物的瓶子用水蒸汽加热到100℃3小时。用0.22μ滤器无菌过滤培养物,采用3kD截止膜浓缩20倍。用50%硫酸铵溶液沉淀蛋白质一次,用25%硫酸铵溶液沉淀8次。通过反相液相层析(RP-HPLC)分级分离所形成的蛋白质(PPD),所说的层析采用在Biocad HPLC系统(Perseptive Biosystems,Framingham,MA)中的C18柱(7.8×300mM;Waters,Milford,MA)。用0-100%线性梯度缓冲液(在乙腈中的0.1%TFA)从柱中洗脱组分。流速是10ml/分钟,在214nm和280nm下监测洗脱液。
收集六个组分,干燥,悬浮在PBS中,并在结核分枝杆菌感染豚鼠中就诱导迟发型超敏(DTH)反应分别进行试验。发现一个组分诱导强的DTH反应,接着在微内径Vydac C18柱(Cat.No.218TP5115)上进一步经RP-HPLC分级分离,所说的柱在Perkin Elmer/Applied Biosystems Division172 HPLC型中。以5-100%线性梯度缓冲液(在乙腈中的0.05%TFA)洗脱各组分,流速为80μl/分钟。在215nm监测洗脱液。收集八个组分,在结核分枝杆菌感染豚鼠中试验对DTH的诱导。发现一个组分诱导约16mm硬结的强DTH。其它组分不诱导可检测的DTH。将阳性组分进行SDS-PAGE凝胶电泳,发现其含有12kD分子量的一单一蛋白质带。
如以上的描述,用Perkin Elmer/Applied Biosystems Division Procise492蛋白质测序仪从氨基末端对这一多肽(此后称作DPPD)进行测序,发现其具有SEQ ID NO.124中显示的N端序列。这一序列与以上描述的基因库中的已知序列的比较揭示没有已知的同系物。分离到DPPD的四个溴化氰片段,发现其具有SEQ ID NO.125-128中显示的序列。
实施例5
合成多肽的合成
可以采用由HPTU(O-苯并三唑-N,N,N’,N’-四甲基脲鎓六氟磷酸盐)活化的FMOC化学在Millipore 9050肽合成仪上合成多肽。Gly-Cys-Gly序列可以连接到肽的氨基末端,以提供所述肽的缀合或标记方法。可以采用下列切割混合物从固相支持物上切割肽:三氟乙酸∶乙烷二硫酚∶苯硫基甲烷∶水∶苯酚(40∶1∶2∶2∶3)。在切割两小时后,可以在冷的甲基-叔丁基醚中沉淀所说的肽。然后,肽沉淀可以溶解在含0.1%三氟乙酸(TFA)的水中,并且在经C18反相HPLC纯化之前冷干。在水(含0.1%TFA)中的0-60%乙腈(含0.1%TFA)梯度液可以用于洗脱肽。在纯组分的冷干后,可以采用电喷射质谱测定法和氨基酸分析确定肽的特征。
这一方法用来合成TbM-1肽,该肽含有一个半TbM-1序列的重复单位。TbM-1肽具有序列GCGDRSGGNLDQIRLRRDRSGGNL(SEQ IDNo.63)。
实施例6
代表性抗原在结核病血清学诊断上的用途
这一例子说明几个代表性抗原的诊断学特性。图1和2表示与细菌溶解产物和38kD抗原的反应性比较,代表性抗原与结核分枝杆菌感染和未感染个体血清的反应性。
测定在96-孔平板中完成,所述平板涂布有用碳酸盐涂布缓冲液(pH9.6)稀释成50LL的200ng抗原。在4℃将这些孔涂布过夜(或者在37℃2小时)。然后,除去平板内含物,用200μL PBS/1%BSA封阻各孔2小时。在封阻步骤后,以PBS/0.1%吐温20TM洗涤五次。向各孔中添加以PBS/0.1%吐温20TM/0.1%BSA 1∶100稀释的50μL血清并在室温下温育30分钟。然后用PBS/0.1%吐温20TM再洗涤平板五次。
接着用PBS/0.1%吐温20TM/0.1%BSA 1∶10000稀释酶缀合物(辣根过氧化物酶-蛋白质A,Zymed,San Francisco,CA),将50μL稀释的缀合物添加到各孔中,并在室温下温育30分钟。温育之后,用PBS/0.1%吐温20TM洗涤各孔五次。加入100μL四甲基联苯胺过氧化物酶(TMB)底物(Kirkegaard和Perry实验室,Gaithersburg,MD),不稀释,温育约15分钟。由添加100μL 1N硫酸到各孔中终止反应,用平板在450nm下读数。
图2显示了用实施例3的方法A以来源于结核分枝杆菌阳性和阴性患者的血清分离的两种重组抗原(TbRa3和TbRa9)的ELISA反应性。将这些抗原的反应性与从结核分枝杆菌菌株H37Ra(Difco,底特律,MI)分离的细菌溶解产物的反应性比较。在两种情况下,重组抗原区别阳性和阴性血清。基于从接受体-操纵物曲线获得的截止值,TbRa3检测87个阳性血清中的56个,TbRa9检测165个阳性血清中的111个。
图3说明采用实施例3的方法B分离的代表性抗原的ELISA反应性。将重组抗原TbH4,TbH12,Tb38-1和肽TbM-1(如在实施例4中所描述的)的反应性与Andersen和Hansen,感染免疫学,57:2481-2488,1989所描述的38kD抗原的反应性比较。使用试验的所有多肽再次区别阳性和阴性血清。基于从接受体-操纵物曲线获得的截止值,TbH4检测126个阳性血清中的67个,TbH12检测125个阳性血清中的50个,38-1检测101个阳性血清中的61个,TbM-1肽检测30个阳性血清中的25个。
也测定了四种抗原(TbRa3,TbRa9,TbH4和TbH12)与来源于结核分枝杆菌感染患者(在痰的酸快速染色((Smithwick和David,结核,52:226,1971))中具有不同的反应性)组的血清的反应性,并与结核分枝杆菌溶解产物和38kD抗原的反应性比较。结果示于表2中。
表2
抗原与结核分枝杆菌患者血清的反应性
患者 | 痰的酸快速染色 | ELISA值 | |||||
溶解产物 38kD TbRa9 TbH12 TbH4 TbRa3 | |||||||
Tb01B93I-2 | ++++ | 1.853 | 0.634 | 0.998 | 1.022 | 1.030 | 1.314 |
Tb01B93I19 | ++++ | 2.657 | 2.322 | 0.608 | 0.837 | 1.857 | 2.335 |
Tb01B93I8 | +++ | 2.703 | 0.527 | 0.492 | 0.281 | 0.501 | 2.002 |
Tb01B93I-10 | +++ | 1.665 | 1.301 | 0.685 | 0.216 | 0.448 | 0.458 |
Tb01B93I-11 | +++ | 2.817 | 0.697 | 0.509 | 0.301 | 0.173 | 2.608 |
Tb01B93I-15 | +++ | 1.28 | 0.283 | 0.808 | 0.218 | 1.537 | 0.811 |
Tb01B93I-16 | +++ | 2.908 | >3 | 0.899 | 0.441 | 0.593 | 1.080 |
Tb01B93I-25 | +++ | 0.395 | 0.131 | 0.335 | 0.211 | 0.107 | 0.948 |
Tb01B93I-87 | +++ | 2.653 | 2.432 | 2.282 | 0.977 | 1.221 | 0.857 |
Tb01B93I-89 | +++ | 1.912 | 2.370 | 2.436 | 0.876 | 0.520 | 0.952 |
Tb01B94I-108 | +++ | 1.639 | 0.341 | 0.797 | 0.368 | 0.654 | 0.798 |
Tb01B94I-201 | +++ | 1.721 | 0.419 | 0.661 | 0.137 | 0.064 | 0.692 |
Tb01B93I-88 | ++ | 1.939 | 1.269 | 2.519 | 1.381 | 0.214 | 0.530 |
Tb01B93I-92 | ++ | 2.355 | 2.329 | 2.78 | 0.685 | 0.997 | 2.527 |
Tb01B94I-109 | ++ | 0.993 | 0.620 | 0.574 | 0.441 | 0.5 | 2.558 |
Tb01B94I-210 | ++ | 2.777 | >3 | 0.393 | 0.367 | 1.004 | 1.315 |
Tb01B94I-224 | ++ | 2.913 | 0.476 | 0.251 | 1.297 | 1.990 | 0.256 |
Tb01893I-9 | + | 2.649 | 0.278 | 0.210 | 0.140 | 0.181 | 1.586 |
Tb01B93I-14 | + | >3 | 1.538 | 0.282 | 0.291 | 0.549 | 2.880 |
Tb01B93I-21 | + | 2.645 | 0.739 | 2.499 | 0.783 | 0.536 | 1.770 |
Tb01B93I-22 | + | 0.714 | 0.451 | 2.082 | 0.285 | 0.269 | 1.159 |
T01B93I-31 | + | 0.956 | 0.490 | 1.019 | 0.812 | 0.176 | 1.293 |
Tb01B93I-32 | - | 2.261 | 0.786 | 0.668 | 0.273 | 0.535 | 0.405 |
患者 | 痰的酸快速染色 | ELISA值 | |||||
溶解产物 38kD TbRa9 TbH12 TbH4 TbRa3 | |||||||
Tb01B93I-52 | - | 0.658 | 0.114 | 0.434 | 0.330 | 0.273 | 1.140 |
Tb01B93I-99 | - | 2.118 | 0.584 | 1.62 | 0.119 | 0.977 | 0.729 |
Tb01B94I-130 | - | 1.349 | 0.224 | 0.86 | 0.282 | 0.383 | 2.146 |
Tb01B94I-131 | - | 0.685 | 0.324 | 1.173 | 0.059 | 0.118 | 1.431 |
AT4-0070 | 正常 | 0.072 | 0.043 | 0.092 | 0.071 | 0.040 | 0.039 |
AT4-0105 | 正常 | 0.397 | 0.121 | 0.118 | 0.103 | 0.078 | 0.390 |
3/15/94-1 | 正常 | 0.227 | 0.064 | 0.098 | 0.026 | 0.001 | 0.228 |
4/15/93-2 | 正常 | 0.114 | 0.240 | 0.071 | 0.034 | 0.041 | 0.264 |
5/26/94-4 | 正常 | 0.089 | 0.259 | 0.096 | 0.046 | 0.008 | 0.053 |
5/26/94-3 | 正常 | 0.139 | 0.093 | 0.085 | 0.019 | 0.067 | 0.01 |
基于从接受体-操纵物曲线获得的截止值,TbRa3检测27个阳性血清中的23个,TbRa9检测27个中的22个,TbH4检测27个中的18个,TbH12检测27个中的15个。如果组合使用,这四种抗原将具有27中的27个理论敏感性,表明这些抗原在结核分枝杆菌感染的血清学检测中相互补充。此外,几种重组抗原检测采用38kD抗原未被检测到的阳性血清,表明这些抗原可以与38kD抗原互补。
通过如以上描述的ELISA测定了重组抗原TbRall与结核分枝杆菌病人血清(显示出对38kD抗原阴性)以及与PPD阳性和正常供体血清的反应性。结果在图4中显示,这些结果表明,TbRal1(尽管用PPD阳性和正常供体血清为阴性)检测用38kD抗原为阴性的血清。在所试验的13个38kD阴性的血清中,9个用TbRal1为阳性,表明这一抗原可以与38kD抗原阴性血清亚组反应。相反,在38kD阳性血清组(此时TbRall是反应性的)中,TbRall的平均OD 450低于38kD抗原的。数据表明TbRall活性的存在和38kD阳性之间的反向关系。
在间接ELISA中试验抗原TbRa2A,其中首先在室温下使用1∶100稀释的50μL血清30分钟,接着用PBS吐温洗涤,并与1∶10,000稀释的生物素酰化的蛋白质A(Zymed,San Francisco,CA)一起温育30分钟。洗涤后,加入1∶10,000稀释的50μL抗生蛋白链菌素-辣根过氧化物酶(Zymed),将混合物温育30分钟。在洗涤之后,如以上描述用TMB底物进行测定。TbRa2A与来源于结核分枝杆菌患者和正常供体的血清的反应性示于表3中。TbRa2A与结核分枝杆菌患者之血清的反应性的平均值是0.444(具有0.309的标准偏差)。与正常供体之血清的反应性的平均值是0.109(具有0.029的标准偏差)。38kD阴性血清的试验(图5)也表明TbRa2A抗原能够检测这一类别的血清。
表 3TbRa2A与来源于结核分枝杆菌患者的和来源于正常供体的血清的反应性
血清ID | Status | OD450 |
Tb85 | TB | 0.680 |
Tb86 | TB | 0.450 |
Tb87 | TB | 0.263 |
Tb88 | TB | 0.275 |
Tb89 | TB | 0.403 |
Tb91 | TB | 0.393 |
Tb92 | TB | 0.401 |
Tb93 | TB | 0.232 |
Tb94 | TB | 0.333 |
Tb95 | TB | 0.435 |
Tb96 | TB | 0.284 |
Tb97 | TB | 0.320 |
Tb99 | TB | 0.328 |
Tb100 | TB | 0.817 |
Tb101 | TB | 0.607 |
Tb102 | TB | 0.191 |
Tb103 | TB | 0.228 |
Tb107 | TB | 0.324 |
Tb109 | TB | 1.572 |
Tb112 | TB | 0.338 |
DL4-0176 | 正常 | 0.036 |
AT4-0043 | 正常 | 0.126 |
AT4-0044 | 正常 | 0.130 |
AT4-0052 | 正常 | 0.135 |
AT4-0053 | 正常 | 0.133 |
AT4-0062 | 正常 | 0.128 |
AT4-0070 | 正常 | 0.088 |
AT4-0091 | 正常 | 0.108 |
AT4-0100 | 正常 | 0.106 |
AT4-0105 | 正常 | 0.108 |
AT4-0109 | 正常 | 0.105 |
通过如以上描述的ELISA测定重组抗原(g)(SEQ ID No.60)与来源于结核分枝杆菌患者的和来源于正常供体的血清的反应性。图6显示了抗原(g)以四种结核分枝杆菌阳性血清(均是与38kD抗原反应性的)和与四种供体血清的滴定结果。所有四种阳性血清均是与抗原(g)反应性的。
从以上所述可以清楚看到,虽然为说明的目的,本文描述了本发明的特定的实施方案,但是可以进行各种修改而不背离本发明的精神和范围。
序列表
(1)一般信息:
(i)申请人:Corixa公司
(ii)发明名称:用于结核病诊断的化合物和方法
(ii)序列数:132个
(iv)通讯地址:
(A)收信人:SEED和BERRY LLP
(B)街道:6300哥伦比亚中心,第五大街701号
(C)城市:Seattle
(D)州:华盛顿
(E)国家:美国
(F)ZIP:98104-7092
(v)计算机可读形式:
(A)介质类型:软盘
(B)计算机:IBM PC兼容机
(C)操作系统:PC-DOS/MS-DOS
(D)软件:PatentIn Release#1.0,版本#1.30
(vi)当前申请的数据:
(A)申请号:
(B)申请日:1996-8-27
(C)分类号:
(viii)律师/代理人信息:
(A)姓名:Maki,David J.
(B)登记号:31.392
(C)证书号:210121.417PC
(ix)电讯信息:
(A)电话:(206)622-4900
(B)传真:(206)682-6031
(2)SEQ ID NO:1的信息:
(i)序列特征:
(A)长度:766个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线型
(xi)序列描述:SEQ ID NO:1:
CGAGGCACCG GTAGTTTGAA CCAAACGCAC AATCGACGGG CAAACGAACG GAAGAACACA 60
ACCATGAAGA TGGTGAAATC GATCGCCGCA GGTCTGACCG CCGCGGCTGC AATCGGCGCC 120
GCTGCGGCCG GTGTGACTTC GATCATGGCT GGCGGCCCGG TCGTATACCA GATGCAGCCG 180
GTCGTCTTCG GCGCGCCACT GCCGTTGGAC CCGGCATCCG CCCCTGACGT CCCGACCGCC 240
GCCCAGTTGA CCAGCCTGCT CAACAGCCTC GCCGATCCCA ACGTGTCGTT TGCGAACAAG 300
GGCAGTCTGG TCGAGGGCGG CATCGGGGGC ACCGAGGCGC GCATCGCCGA CCACAAGCTG 360
AAGAAGGCCG CCGAGCACGG GGATCTGCCG CTGTCGTTCA GCGTGACGAA CATCCAGCCG 420
GCGGCCGCCG GTTCGGCCAC CGCCGACGTT TCCGTCTCGG GTCCGAAGCT CTCGTCGCCG 480
GTCACGCAGA ACGTCACGTT CGTGAATCAA GGCGGCTGGA TGCTGTCACG CGCATCGGCG 540
ATGGAGTTGC TGCAGGCCGC AGGGNAACTG ATTGGCGGGC CGGNTTCAGC CCGCTGTTCA 600
GCTACGCCGC CCGCCTGGTG ACGCGTCCAT GTCGAACACT CGCGCGTGTA GCACGGTGCG 660
GTNTGCGCAG GGNCGCACGC ACCGCCCGGT GCAAGCCGTC CTCGAGATAG GTGGTGNCTC 720
GNCACCAGNG ANCACCCCCN NNTCGNCNNT TCTCGNTGNT GNATGA 766
(2)SEQ ID NO:2的信息:
(i)序列特征:
(A)长度:752个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线型
(xi)序列描述:SEQ ID NO:2:
ATGCATCACC ATCACCATCA CGATGAAGTC ACGGTAGAGA CGACCTCCGT CTTCCGCGCA 60
GACTTCCTCA GCGAGCTGGA CGCTCCTGCG CAAGCGGGTA CGGAGAGCGC GGTCTCCGGG 120
GTGGAAGGGC TCCCGCCGGG CTCGGCGTTG CTGGTAGTCA AACGAGGCCC CAACGCCGGG 180
TCCCGGTTCC TACTCGACCA AGCCATCACG TCGGCTGGTC GGCATCCCGA CAGCGACATA 240
TTTCTCGACG ACGTGACCGT GAGCCGTCGC CATGCTGAAT TCCGGTTGGA AAACAACGAA 300
TTCAATGTCG TCGATGTCGG GAGTCTCAAC GGCACCTACG TCAACCGCGA GCCCGTGGAT 360
TCGGCGGTGC TGGCGAACGG CGACGAGGTC CAGATCGGCA AGCTCCGGTT GGTGTTCTTG 420
ACCGGACCCA AGCAAGGCGA GGATGACGGG AGTACCGGGG GCCCGTGAGC GCACCCGATA 480
GCCCCGCGCT GGCCGGGATG TCGATCGGGG CGGTCCTCCG ACCTGCTACG ACCGGATTTT 540
CCCTGATGTC CACCATCTCC AAGATTCGAT TCTTGGGAGG CTTGAGGGTC NGGGTGACCC 600
CCCCGCGGGC CTCATTCNGG GGTNTCGGCN GGTTTCACCC CNTACCNACT GCCNCCCGGN 660
TTGCNAATTC NTTCTTCNCT GCCCNNAAAG GGACCNTTAN CTTGCCGCTN GAAANGGTNA 720
TCCNGGGCCC NTCCTNGAAN CCCCNTCCCC CT 752
(2)SEQ ID NO:3的信息:
(i)序列特征:
(A)长度:813个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线型
(xi)序列描述:SEQ ID NO:3:
CATATGCATC ACCATCACCA TCACACTTCT AACCGCCCAG CGCGTCGGGG GCGTCGAGCA 60
CCACGCGACA CCGGGCCCGA TCGATCTGCT AGCTTGAGTC TGGTCAGGCA TCGTCGTCAG 120
CAGCGCGATG CCCTATGTTT GTCGTCGACT CAGATATCGC GGCAATCCAA TCTCCCGCCT 180
GCGGCCGGCG GTGCTGCAAA CTACTCCCGG AGGAATTTCG ACGTGCGCAT CAAGATCTTC 240
ATGCTGGTCA CGGCTGTCGT TTTGCTCTGT TGTTCGGGTG TGGCCACGGC CGCGCCCAAG 300
ACCTACTGCG AGGAGTTGAA AGGCACCGAT ACCGGCCAGG CGTGCCAGAT TCAAATGTCC 360
GACCCGGCCT ACAACATCAA CATCAGCCTG CCCAGTTACT ACCCCGACCA GAAGTCGCTG 420
GAAAATTACA TCGCCCAGAC GCGCGACAAG TTCCTCAGCG CGGCCACATC GTCCACTCCA 480
CGCGAAGCCC CCTACGAATT GAATATCACC TCGGCCACAT ACCAGTCCGC GATACCGCCG 540
CGTGGTACGC AGGCCGTGGT GCTCAMGGTC TACCACAACG CCGGCGGCAC GCACCCAACG 600
ACCACGTACA AGGCCTTCGA TTGGGACCAG GCCTATCGCA AGCCAATCAC CTATGACACG 660
CTGTGGCAGG CTGACACCGA TCCGCTGCCA GTCGTCTTCC CCATTGTTGC AAGGTGAACT 720
GAGCAACGCA GACCGGGACA ACWGGTATCG ATAGCCGCCN AATGCCGGCT TGGAACCCNG 780
TGAAATTATC ACAACTTCGC AGTCACNAAA NAA 813
(2)SEQ ID NO:4的信息:
(i)序列特征:
(A)长度:447个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线型
(xi)序列描述:SEQ ID NO:4:
CGGTATGAAC ACGGCCGCGT CCGATAACTT CCAGCTGTCC CAGGGTGGGC AGGGATTCGC 60
CATTCCGATC GGGCAGGCGA TGGCGATCGC GGGCCAGATC CGATCGGGTG GGGGGTCACC 120
CACCGTTCAT ATCGGGCCTA CCGCCTTCCT CGGCTTGGGT GTTGTCGACA ACAACGGCAA 180
CGGCGCACGA GTCCAACGCG TGGTCGGGAG CGCTCCGGCG GCAAGTCTCG GCATCTCCAC 240
CGGCGACGTG ATCACCGCGG TCGACGGCGC TCCGATCAAC TCGGCCACCG CGATGGCGGA 300
CGCGCTTAAC GGGCATCATC CCGGTGACGT CATCTCGGTG AACTGGCAAA CCAAGTCGGG 360
CGGCACGCGT ACAGGGAACG TGACATTGGC CGAGGGACCC CCGGCCTGAT TTCGTCGYGG 420
ATACCACCCG CCGGCCGGCC AATTGGA 447
(2)SEQ ID NO:5的信息:
(i)序列特征:
(A)长度:604个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线型
(xi)序列描述:SEQ ID NO:5:
GTCCCACTGC GGTCGCCGAG TATGTCGCCC AGCAAATGTC TGGCAGCCGC CCAACGGAAT 60
CCGGTGATCC GACGTCGCAG GTTGTCGAAC CCGCCGCCGC GGAAGTATCG GTCCATGCCT 120
AGCCCGGCGA CGGCGAGCGC CGGAATGGCG CGAGTGAGGA GGCGGGCAAT TTGGCGGGGC 180
CCGGCGACGG NGAGCGCCGG AATGGCGCGA GTGAGGAGGT GGNCAGTCAT GCCCAGNGTG 240
ATCCAATCAA CCTGNATTCG GNCTGNGGGN CCATTTGACA ATCGAGGTAG TGAGCGCAAA 300
TGAATGATGG AAAACGGGNG GNGACGTCCG NTGTTCTGGT GGTGNTAGGT GNCTGNCTGG 360
NGTNGNGGNT ATCAGGATGT TCTTCGNCGA AANCTGATGN CGAGGAACAG GGTGTNCCCG 420
NNANNCCNAN GGNGTCCNAN CCCNNNNTCC TCGNCGANAT CANANAGNCG NTTGATGNGA 480
NAAAAGGGTG GANCAGNNNN AANTNGNGGN CCNAANAANC NNNANNGNNG NNAGNTNGNT 540
NNNTNTTNNC ANNNNNNNTG NNGNNGNNCN NNNCAANCNN NTNNNNGNAA NNGGNTTNTT 600
NAAT 604
(2)SEQ ID NO:6的信息:
(i)序列特征:
(A)长度:633个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线型
(xi)序列描述:SEQ ID NO:6:
TTGCANGTCG AACCACCTCA CTAAAGGGAA CAAAAGCTNG AGCTCCACCG CGGTGGCGGC 60
CGCTCTAGAA CTAGTGKATM YYYCKGGCTG CAGSAATYCG GYACGAGCAT TAGGACAGTC 120
TAACGGTCCT GTTACGGTGA TCGAATGACC GACGACATCC TGCTGATCGA CACCGACGAA 180
CGGGTGCGAA CCCTCACCCT CAACCGGCCG CAGTCCCGYA ACGCGCTCTC GGCGGCGCTA 240
CGGGATCGGT TTTTCGCGGY GTTGGYCGAC GCCGAGGYCG ACGACGACAT CGACGTCGTC 300
ATCCTCACCG GYGCCGATCC GGTGTTCTGC GCCGGACTGG ACCTCAAGGT AGCTGGCCGG 360
GCAGACCGCG CTGCCGGACA TCTCACCGCG GTGGGCGGCC ATGACCAAGC CGGTGATCGG 420
CGCGATCAAC GGCGCCGCGG TCACCGGCGG GCTCGAACTG GCGCTGTACT GCGACATCCT 480
GATCGCCTCC GAGCACGCCC GCTTCGNCGA CACCCACGCC CGGGTGGGGC TGCTGCCCAC 540
CTGGGGACTC AGTGTGTGCT TGCCGCAAAA GGTCGGCATC GGNCTGGGCC GGTGGATGAG 600
CCTGACCGGC GACTACCTGT CCGTGACCGA CGC 633
(2)SEQ ID NO:7的信息:
(i)序列特征:
(A)长度:1362个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线型
(xi)序列描述:SEQ ID NO:7:
CGACGACGAC GGCGCCGGAG AGCGGGCGCG AACGGCGATC GACGCGGCCC TGGCCAGAGT 60
CGGCACCACC CAGGAGGGAG TCGAATCATG AAATTTGTCA ACCATATTGA GCCCGTCGCG 120
CCCCGCCGAG CCGGCGGCGC GGTCGCCGAG GTCTATGCCG AGGCCCGCCG CGAGTTCGGC 180
CGGCTGCCCG AGCCGCTCGC CATGCTGTCC CCGGACGAGG GACTGCTCAC CGCCGGCTGG 240
GCGACGTTGC GCGAGACACT GCTGGTGGGC CAGGTGCCGC GTGGCCGCAA GGAAGCCGTC 300
GCCGCCGCCG TCGCGGCCAG CCTGCGCTGC CCCTGGTGCG TCGACGCACA CACCACCATG 360
CTGTACGCGG CAGGCCAAAC CGACACCGCC GCGGCGATCT TGGCCGGCAC AGCACCTGCC 420
GCCGGTGACC CGAACGCGCC GTATGTGGCG TGGGCGGCAG GAACCGGGAC ACCGGCGGGA 480
CCGCCGGCAC CGTTCGGCCC GGATGTCGCC GCCGAATACC TGGGCACCGC GGTGCAATTC 540
CACTTCATCG CACGCCTGGT CCTGGTGCTG CTGGACGAAA CCTTCCTGCC GGGGGGCCCG 600
CGCGCCCAAC AGCTCATGCG CCGCGCCGGT GGACTGGTGT TCGCCCGCAA GGTGCGCGCG 660
GAGCATCGGC CGGGCCGCTC CACCCGCCGG CTCGAGCCGC GAACGCTGCC CGACGATCTG 720
GCATGGGCAA CACCGTCCGA GCCCATAGCA ACCGCGTTCG CCGCGCTCAG CCACCACCTG 780
GACACCGCGC CGCACCTGCC GCCACCGACT CGTCAGGTGG TCAGGCGGGT CGTGGGGTCG 840
TGGCACGGCG AGCCAATGCC GATGAGCAGT CGCTGGACGA ACGAGCACAC CGCCGAGCTG 900
CCCGCCGACC TGCACGCGCC CACCCGTCTT GCCCTGCTGA CCGGCCTGGC CCCGCATCAG 960
GTGACCGACG ACGACGTCGC CGCGGCCCGA TCCCTGCTCG ACACCGATGC GGCGCTGGTT 1020
GGCGCCCTGG CCTGGGCCGC CTTCACCGCC GCGCGGCGCA TCGGCACCTG GATCGGCGCC 1080
GCCGCCGAGG GCCAGGTGTC GCGGCAAAAC CCGACTGGGT GAGTGTGCGC GCCCTGTCGG 1140
TAGGGTGTCA TCGCTGGCCC GAGGGATCTC GCGGCGGCGA ACGGAGGTGG CGACACAGGT 1200
GGAAGCTGCG CCCACTGGCT TGCGCCCCAA CGCCGTCGTG GGCGTTCGGT TGGCCGCACT 1260
GGCCGATCAG GTCGGCGCCG GCCCTTGGCC GAAGGTCCAG CTCAACGTGC CGTCACCGAA 1320
GGACCGGACG GTCACCGGGG GTCACCCTGC GCGCCCAAGG AA 1362
(2)SEQ ID NO:8的信息:
(i)序列特征:
(A)长度:1458个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线型
(xi)序列描述:SEQ ID NO:8:
GCGACGACCC CGATATGCCG GGCACCGTAG CGAAAGCCGT CGCCGACGCA CTCGGGCGCG 60
GTATCGCTCC CGTTGAGGAC ATTCAGGACT GCGTGGAGGC CCGGCTGGGG GAAGCCGGTC 120
TGGATGACGT GGCCCGTGTT TACATCATCT ACCGGCAGCG GCGCGCCGAG CTGCGGACGG 180
CTAAGGCCTT GCTCGGCGTG CGGGACGAGT TAAAGCTGAG CTTGGCGGCC GTGACGGTAC 240
TGCGCGAGCG CTATCTGCTG CACGACGAGC AGGGCCGGCC GGCCGAGTCG ACCGGCGAGC 300
TGATGGACCG ATCGGCGCGC TGTGTCGCGG CGGCCGAGGA CCAGTATGAG CCGGGCTCGT 360
CGAGGCGGTG GGCCGAGCGG TTCGCCACGC TATTACGCAA CCTGGAATTC CTGCCGAATT 420
CGCCCACGTT GATGAACTCT GGCACCGACC TGGGACTGCT CGCCGGCTGT TTTGTTCTGC 480
CGATTGAGGA TTCGCTGCAA TCGATCTTTG CGACGCTGGG ACAGGCCGCC GAGCTGCAGC 540
GGGCTGGAGG CGGCACCGGA TATGCGTTCA GCCACCTGCG ACCCGCCGGG GATCGGGTGG 600
CCTCCACGGG CGGCACGGCC AGCGGACCGG TGTCGTTTCT ACGGCTGTAT GACAGTGCCG 660
CGGGTGTGGT CTCCATGGGC GGTCGCCGGC GTGGCGCCTG TATGGCTGTG CTTGATGTGT 720
CGCACCCGGA TATCTGTGAT TTCGTCACCG CCAAGGCCGA ATCCCCCAGC GAGCTCCCGC 780
ATTTCAACCT ATCGGTTGGT GTGACCGACG CGTTCCTGCG GGCCGTCGAA CGCAACGGCC 840
TACACCGGCT GGTCAATCCG CGAACCGGCA AGATCGTCGC GCGGATGCCC GCCGCCGAGC 900
TGTTCGACGC CATCTGCAAA GCCGCGCACG CCGGTGGCGA TCCCGGGCTG GTGTTTCTCG 960
ACACGATCAA TAGGGCAAAC CCGGTGCCGG GGAGAGGCCG CATCGAGGCG ACCAACCCGT 1020
GCGGGGAGGT CCCACTGCTG CCTTACGAGT CATGTAATCT CGGCTCGATC AACCTCGCCC 1080
GGATGCTCGC CGACGGTCGC GTCGACTGGG ACCGGCTCGA GGAGGTCGCC GGTGTGGCGG 1140
TGCGGTTCCT TGATGACGTC ATCGATGTCA GCCGCTACCC CTTCCCCGAA CTGGGTGAGG 1200
CGGCCCGCGC CACCCGCAAG ATCGGGCTGG GAGTCATGGG TTTGGCGGAA CTGCTTGCCG 1260
CACTGGGTAT TCCGTACGAC AGTGAAGAAG CCGTGCGGTT AGCCACCCGG CTCATGCGTC 1320
GCATACAGCA GGCGGCGCAC ACGGCATCGC GGAGGCTGGC CGAAGAGCGG GGCGCATTCC 1380
CGGCGTTCAC CGATAGCCGG TTCGCGCGGT CGGGCCCGAG GCGCAACGCA CAGGTCACCT 1440
CCGTCGCTCC GACGGGCA 1458
(2)SEQ ID NO:9的信息:
(i)序列特征:
(A)长度:862个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线型
(xi)序列描述:SEQ ID NO:9:
ACGGTGTAAT CGTGCTGGAT CTGGAACCGC GTGGCCCGCT ACCTACCGAG ATCTACTGGC 60
GGCGCAGGGG GCTGGCCCTG GGCATCGCGG TCGTCGTAGT CGGGATCGCG GTGGCCATCG 120
TCATCGCCTT CGTCGACAGC AGCGCCGGTG CCAAACCGGT CAGCGCCGAC AAGCCGGCCT 180
CCGCCCAGAG CCATCCGGGC TCGCCGGCAC CCCAAGCACC CCAGCCGGCC GGGCAAACCG 240
AAGGTAACGC CGCCGCGGCC CCGCCGCAGG GCCAAAACCC CGAGACACCC ACGCCCACCG 300
CCGCGGTGCA GCCGCCGCCG GTGCTCAAGG AAGGGGACGA TTGCCCCGAT TCGACGCTGG 360
TGGTGGTCAC CAACATCGGC CTGGTGTCCT GTAAACGCGA CGTTGGGGCC GCGGTGTTGG 480
CCGCCTACGT TTACTCGCTG GACAACAAGC GGTTGTGGTC CAACCTGGAC TGCGCGCCCT 540
CGAATGAGAC GCTGGTCAAG ACGTTTTCCC CCGGTGAGCA GGTAACGACC GCGGTGACCT 600
GGACCGGGAT GGGATCGGCG CCGCGCTGCC CATTGCCGCG GCCGGCGATC GGGCCGGGCA 660
CCTACAATCT CGTGGTACAA CTGGGCAATC TGCGCTCGCT GCCGGTTCCG TTCATCCTGA 720
ATCAGCCGCC GCCGCCGCCC GGGCCGGTAC CCGCTCCGGG TCCAGCGCAG GCGCCTCCGC 780
CGGAGTCTCC CGCGCAAGGC GGATAATTAT TGATCGCTGA TGGTCGATTC CGCCAGCTGT 840
GACAACCCCT CGCCTCGTGC CG 862
(2)SEQ ID NO:10的信息:
(i)序列特征:
(A)长度:622个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线型
(xi)序列描述:SEQ ID NO:10:
TTGATCAGCA CCGGCAAGGC GTCACATGCC TCCCTGGGTG TGCAGGTGAC CAATGACAAA 60
GACACCCCGG GCGCCAAGAT CGTCGAAGTA GTGGCCGGTG GTGCTGCCGC GAACGCTGGA 120
GTGCCGAAGG GCGTCGTTGT CACCAAGGTC GACGACCGCC CGATCAACAG CGCGGACGCG 180
TTGGTTGCCG CCGTGCGGTC CAAAGCGCCG GGCGCCACGG TGGCGCTAAC CTTTCAGGAT 240
CCCTCGGGCG GTAGCCGCAC AGTGCAAGTC ACCCTCGGCA AGGCGGAGCA GTGATGAAGG 300
TCGCCGCGCA GTGTTCAAAG CTCGGATATA CGGTGGCACC CATGGAACAG CGTGCGGAGT 360
TGGTGGTTGG CCGGGCACTT GTCGTCGTCG TTGACGATCG CACGGCGCAC GGCGATGAAG 420
ACCACAGCGG GCCGCTTGTC ACCGAGCTGC TCACCGAGGC CGGGTTTGTT GTCGACGGCG 480
TGGTGGCGGT GTCGGCCGAC GAGGTCGAGA TCCGAAATGC GCTGAACACA GCGGTGATCG 540
GCGGGGTGGA CCTGGTGGTG TCGGTCGGCG GGACCGGNGT GACGNCTCGC GATGTCACCC 600
CGGAAGCCAC CCGNGACATT CT 622
(2)SEQ ID NO:11的信息:
(i)序列特征:
(A)长度:1200个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线型
(xi)序列描述:SEQ ID NO:11:
GGCGCAGCGG TAAGCCTGTT GGCCGCCGGC ACACTGGTGT TGACAGCATG CGGCGGTGGC 60
ACCAACAGCT CGTCGTCAGG CGCAGGCGGA ACGTCTGGGT CGGTGCACTG CGGCGGCAAG 120
AAGGAGCTCC ACTCCAGCGG CTCGACCGCA CAAGAAAATG CCATGGAGCA GTTCGTCTAT 180
GCCTACGTGC GATCGTGCCC GGGCTACACG TTGGACTACA ACGCCAACGG GTCCGGTGCC 240
GGGGTGACCC AGTTTCTCAA CAACGAAACC GATTTCGCCG GCTCGGATGT CCCGTTGAAT 300
CCGTCGACCG GTCAACCTGA CCGGTCGGCG GAGCGGTGCG GTTCCCCGGC ATGGGACCTG 360
CCGACGGTGT TCGGCCCGAT CGCGATCACC TACAATATCA AGGGCGTGAG CACGCTGAAT 420
CTTGACGGAC CCACTACCGC CAAGATTTTC AACGGCACCA TCACCGTGTG GAATGATCCA 480
CAGATCCAAG CCCTCAACTC CGGCACCGAC CTGCCGCCAA CACCGATTAG CGTTATCTTC 540
CGCAGCGACA AGTCCGGTAC GTCGGACAAC TTCCAGAAAT ACCTCGACGG TGTATCCAAC 600
GGGGCGTGGG GCAAAGGCGC CAGCGAAACG TTCAGCGGGG GCGTCGGCGT CGGCGCCAGC 660
GGGAACAACG GAACGTCGGC CCTACTGCAG ACGACCGACG GGTCGATCAC CTACAACGAG 720
TGGTCGTTTG CGGTGGGTAA GCAGTTGAAC ATGGCCCAGA TCATCACGTC GGCGGGTCCG 780
GATCCAGTGG CGATCACCAC CGAGTCGGTC GGTAAGACAA TCGCCGGGGC CAAGATCATG 840
GGACAAGGCA ACGACCTGGT ATTGGACACG TCGTCGTTCT ACAGACCCAC CCAGCCTGGC 900
TCTTACCCGA TCGTGCTGGC GACCTATGAG ATCGTCTGCT CGAAATACCC GGATGCGACG 960
ACCGGTACTG CGGTAAGGGC GTTTATGCAA GCCGCGATTG GTCCAGGCCA AGAAGGCCTG 1020
GACCAATACG GCTCCATTCC GTTGCCCAAA TCGTTCCAAG CAAAATTGGC GGCCGCGGTG 1080
AATGCTATTT CTTGACCTAG TGAAGGGAAT TCGACGGTGA GCGATGCCGT TCCGCAGGTA 1140
GGGTCGCAAT TTGGGCCGTA TCAGCTATTG CGGCTGCTGG GCCGAGGCGG GATGGGCGAG 1200
(2)SEQ ID NO:12的信息:
(i)序列特征:
(A)长度:1155个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线型
(xi)序列描述:SEQ ID NO:12:
GCAAGCAGCT GCAGGTCGTG CTGTTCGACG AACTGGGCAT GCCGAAGACC AAACGCACCA 60
AGACCGGCTA CACCACGGAT GCCGACGCGC TGCAGTCGTT GTTCGACAAG ACCGGGCATC 120
CGTTTCTGCA ACATCTGCTC GCCCACCGCG ACGTCACCCG GCTCAAGGTC ACCGTCGACG 180
GGTTGCTCCA AGCGGTGGCC GCCGACGGCC GCATCCACAC CACGTTCAAC CAGACGATCG 240
CCGCGACCGG CCGGCTCTCC TCGACCGAAC CCAACCTGCA GAACATCCCG ATCCGCACCG 300
ACGCGGGCCG GCGGATCCGG GACGCGTTCG TGGTCGGGGA CGGTTACGCC GAGTTGATGA 360
CGGCCGACTA CAGCCAGATC GAGATGCGGA TCATGGGGCA CCTGTCCGGG GACGAGGGCC 420
TCATCGAGGC GTTCAACACC GGGGAGGACC TGTATTCGTT CGTCGCGTCC CGGGTGTTCG 480
GTGTGCCCAT CGACGAGGTC ACCGGCGAGT TGCGGCGCCG GGTCAAGGCG ATGTCCTACG 540
GGCTGGTTTA CGGGTTGAGC GCCTACGGCC TGTCGCAGCA GTTGAAAATC TCCACCGAGG 600
AAGCCAACGA GCAGATGGAC GCGTATTTCG CCCGATTCGG CGGGGTGCGC GACTACCTGC 660
GCGCCGTAGT CGAGCGGGCC CGCAAGGACG GCTACACCTC GACGGTGCTG GGCCGTCGCC 720
GCTACCTGCC CGAGCTGGAC AGCAGCAACC GTCAAGTGCG GGAGGCCGCC GAGCGGGCGG 780
CGCTGAACGC GCCGATCCAG GGCAGCGCGG CCGACATCAT CAAGGTGGCC ATGATCCAGG 840
TCGACAAGGC GCTCAACGAG GCACAGCTGG CGTCGCGCAT GCTGCTGCAG GTCCACGACG 900
AGCTGCTGTT CGAAATCGCC CCCGGTGAAC GCGAGCGGGT CGAGGCCCTG GTGCGCGACA 960
AGATGGGCGG CGCTTACCCG CTCGACGTCC CGCTGGAGGT GTCGGTGGGC TACGGCCGCA 1020
GCTGGGACGC GGCGGCGCAC TGAGTGCCGA GCGTGCATCT GGGGCGGGAA TTCGGCGATT 1080
TTTCCGCCCT GAGTTCACGC TCGGCGCAAT CGGGACCGAG TTTGTCCAGC GTGTACCCGT 1140
CGAGTAGCCT CGTCA 1155
(2)SEQ ID NO:13的信息:
(i)序列特征:
(A)长度:1771个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线型
(xi)序列描述:SEQ ID NO:13:
GAGCGCCGTC TGGTGTTTGA ACGGTTTTAC CGGTCGGCAT CGGCACGGGC GTTGCCGGGT 60
TCGGGCCTCG GGTTGGCGAT CGTCAAACAG GTGGTGCTCA ACCACGGCGG ATTGCTGCGC 120
ATCGAAGACA CCGACCCAGG CGGCCAGCCC CCTGGAACGT CGATTTACGT GCTGCTCCCC 180
GGCCGTCGGA TGCCGATTCC GCAGCTTCCC GGTGCGACGG CTGGCGCTCG GAGCACGGAC 240
ATCGAGAACT CTCGGGGTTC GGCGAACGTT ATCTCAGTGG AATCTCAGTC CACGCGCGCA 300
ACCTAGTTGT GCAGTTACTG TTGAAAGCCA CACCCATGCC AGTCCACGCA TGGCCAAGTT 360
GGCCCGAGTA GTGGGCCTAG TACAGGAAGA GCAACCTAGC GACATGACGA ATCACCCACG 420
GTATTCGCCA CCGCCGCAGC AGCCGGGAAC CCCAGGTTAT GCTCAGGGGC AGCAGCAAAC 480
GTACAGCCAG CAGTTCGACT GGCGTTACCC ACCGTCCCCG CCCCCGCAGC CAACCCAGTA 540
CCGTCAACCC TACGAGGCGT TGGGTGGTAC CCGGCCGGGT CTGATACCTG GCGTGATTCC 600
GACCATGACG CCCCCTCCTG GGATGGTTCG CCAACGCCCT CGTGCAGGCA TGTTGGCCAT 660
CGGCGCGGTG ACGATAGCGG TGGTGTCCGC CGGCATCGGC GGCGCGGCCG CATCCCTGGT 720
CGGGTTCAAC CGGGCACCCG CCGGCCCCAG CGGCGGCCCA GTGGCTGCCA GCGCGGCGCC 780
AAGCATCCCC GCAGCAAACA TGCCGCCGGG GTCGGTCGAA CAGGTGGCGG CCAAGGTGGT 840
GCCCAGTGTC GTCATGTTGG AAACCGATCT GGGCCGCCAG TCGGAGGAGG GCTCCGGCAT 900
CATTCTGTCT GCCGAGGGGC TGATCTTGAC CAACAACCAC GTGATCGCGG CGGCCGCCAA 960
GCCTCCCCTG GGCAGTCCGC CGCCGAAAAC GACGGTAACC TTCTCTGACG GGCGGACCGC 1020
ACCCTTCACG GTGGTGGGGG CTGACCCCAC CAGTGATATC GCCGTCGTCC GTGTTCAGGG 1080
CGTCTCCGGG CTCACCCCGA TCTCCCTGGG TTCCTCCTCG GACCTGAGGG TCGGTCAGCC 1140
GGTGCTGGCG ATCGGGTCGC CGCTCGGTTT GGAGGGCACC GTGACCACGG GGATCGTCAG 1200
CGCTCTCAAC CGTCCAGTGT CGACGACCGG CGAGGCCGGC AACCAGAACA CCGTGCTGGA 1260
CGCCATTCAG ACCGACGCCG CGATCAACCC CGGTAACTCC GGGGGCGCGC TGGTGAACAT 1320
GAACGCTCAA CTCGTCGGAG TCAACTCGGC CATTGCCACG CTGGGCGCGG ACTCAGCCGA 1380
TGCGCAGAGC GGCTCGATCG GTCTCGGTTT TGCGATTCCA GTCGACCAGG CCAAGCGCAT 1440
CGCCGACGAG TTGATCAGCA CCGGCAAGGC GTCACATGCC TCCCTGGGTG TGCAGGTGAC 1500
CAATGACAAA GACACCCCGG GCGCCAAGAT CGTCGAAGTA GTGGCCGGTG GTGCTGCCGC 1560
GAACGCTGGA GTGCCGAAGG GCGTCGTTGT CACCAAGGTC GACGACCGCC CGATCAACAG 1620
CGCGGACGCG TTGGTTGCCG CCGTGCGGTC CAAAGCGCCG GGCGCCACGG TGGCGCTAAC 1680
CTTTCAGGAT CCCTCGGGCG GTAGCCGCAC AGTGCAAGTC ACCCTCGGCA AGGCGGAGCA 1740
GTGATGAAGG TCGCCGCGCA GTGTTCAAAG C 1771
(2)SEQ ID NO:14的信息:
(i)序列特征:
(A)长度:1058个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线型
(xi)序列描述:SEQ ID NO:14:
CTCCACCGCG GTGGCGGCCG CTCTAGAACT AGTGGATCCC CCGGGCTGCA GGAATTCGGC 60
ACGAGGATCC GACGTCGCAG GTTGTCGAAC CCGCCGCCGC GGAAGTATCG GTCCATGCCT 120
AGCCCGGCGA CGGCGAGCGC CGGAATGGCG CGAGTGAGGA GGCGGGCAAT TTGGCGGGGC 180
CCGGCGACGG CGAGCGCCGG AATGGCGCGA GTGAGGAGGC GGGCAGTCAT GCCCAGCGTG 240
ATCCAATCAA CCTGCATTCG GCCTGCGGGC CCATTTGACA ATCGAGGTAG TGAGCGCAAA 300
TGAATGATGG AAAACGGGCG GTGACGTCCG CTGTTCTGGT GGTGCTAGGT GCCTGCCTGG 360
CGTTGTGGCT ATCAGGATGT TCTTCGCCGA AACCTGATGC CGAGGAACAG GGTGTTCCCG 420
TGAGCCCGAC GGCGTCCGAC CCCGCGCTCC TCGCCGAGAT CAGGCAGTCG CTTGATGCGA 480
CAAAAGGGTT GACCAGCGTG CACGTAGCGG TCCGAACAAC CGGGAAAGTC GACAGCTTGC 540
TGGGTATTAC CAGTGCCGAT GTCGACGTCC GGGCCAATCC GCTCGCGGCA AAGGGCGTAT 600
GCACCTACAA CGACGAGCAG GGTGTCCCGT TTCGGGTACA AGGCGACAAC ATCTCGGTGA 660
AACTGTTCGA CGACTGGAGC AATCTCGGCT CGATTTCTGA ACTGTCAACT TCACGCGTGC 720
TCGATCCTGC CGCTGGGGTG ACGCAGCTGC TGTCCGGTGT CACGAACCTC CAAGCGCAAG 780
GTACCGAAGT GATAGACGGA ATTTCGACCA CCAAAATCAC CGGGACCATC CCCGCGAGCT 840
CTGTCAAGAT GCTTGATCCT GGCGCCAAGA GTGCAAGGCC GGCGACCGTG TGGATTGCCC 900
AGGACGGCTC GCACCACCTC GTCCGAGCGA GCATCGACCT CGGATCCGGG TCGATTCAGC 960
TCACGCAGTC GAAATGGAAC GAACCCGTCA ACGTCGACTA GGCCGAAGTT GCGTCGACGC 1020
GTTGNTCGAA ACGCCCTTGT GAACGGTGTC AACGGNAC 1058
(2)SEQ ID NO:15的信息:
(i)序列特征:
(A)长度:542个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线型
(xi)序列描述:SEQ ID NO:15:
GAATTCGGCA CGAGAGGTGA TCGACATCAT CGGGACCAGC CCCACATCCT GGGAACAGGC 60
GGCGGCGGAG GCGGTCCAGC GGGCGCGGGA TAGCGTCGAT GACATCCGCG TCGCTCGGGT 120
CATTGAGCAG GACATGGCCG TGGACAGCGC CGGCAAGATC ACCTACCGCA TCAAGCTCGA 180
AGTGTCGTTC AAGATGAGGC CGGCGCAACC GCGCTAGCAC GGGCCGGCGA GCAAGACGCA 240
AAATCGCACG GTTTGCGGTT GATTCGTGCG ATTTTGTGTC TGCTCGCCGA GGCCTACCAG 300
GCGCGGCCCA GGTCCGCGTG CTGCCGTATC CAGGCGTGCA TCGCGATTCC GGCGGCCACG 360
CCGGAGTTAA TGCTTCGCGT CGACCCGAAC TGGGCGATCC GCCGGNGAGC TGATCGATGA 420
CCGTGGCCAG CCCGTCGATG CCCGAGTTGC CCGAGGAAAC GTGCTGCCAG GCCGGTAGGA 480
AGCGTCCGTA GGCGGCGGTG CTGACCGGCT CTGCCTGCGC CCTCAGTGCG GCCAGCGAGC 540
GG 542
(2)SEQ ID NO:16的信息:
(i)序列特征:
(A)长度:913个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线型
(xi)序列描述:SEQ ID NO:16:
CGGTGCCGCC CGCGCCTCCG TTGCCCCCAT TGCCGCCGTC GCCGATCAGC TGCGCATCGC 60
CACCATCACC GCCTTTGCCG CCGGCACCGC CGGTGGCGCC GGGGCCGCCG ATGCCACCGC 120
TTGACCCTGG CCGCCGGCGC CGCCATTGCC ATACAGCACC CCGCCGGGGG CACCGTTACC 180
GCCGTCGCCA CCGTCGCCGC CGCTGCCGTT TCAGGCCGGG GAGGCCGAAT GAACCGCCGC 240
CAAGCCCGCC GCCGGCACCG TTGCCGCCTT TTCCGCCCGC CCCGCCGGCG CCGCCAATTG 300
CCGAACAGCC AMGCACCGTT GCCGCCAGCC CCGCCGCCGT TAACGGCGCT GCCGGGCGCC 360
GCCGCCGGAC CCGCCATTAC CGCCGTTCCC GTTCGGTGCC CCGCCGTTAC CGGCGCCGCC 420
GTTTGCCGCC AATATTCGGC GGGCACCGCC AGACCCGCCG GGGCCACCAT TGCCGCCGGG 480
CACCGAAACA ACAGCCCAAC GGTGCCGCCG GCCCCGCCGT TTGCCGCCAT CACCGGCCAT 540
TCACCGCCAG CACCGCCGTT AATGTTTATG AACCCGGTAC CGCCAGCGCG GCCCCTATTG 600
CCGGGCGCCG GAGNGCGTGC CCGCCGGCGC CGCCAACGCC CAAAAGCCCG GGGTTGCCAC 660
CGGCCCCGCC GGACCCACCG GTCCCGCCGA TCCCCCCGTT GCCGCCGGTG CCGCCGCCAT 720
TGGTGCTGCT GAAGCCGTTA GCGCCGGTTC CGCSGGTTCC GGCGGTGGCG CCNTGGCCGC 780
CGGCCCCGCC GTTGCCGTAC AGCCACCCCC CGGTGGCGCC GTTGCCGCCA TTGCCGCCAT 840
TGCCGCCGTT GCCGCCATTG CCGCCGTTCC CGCCGCCACC GCCGGNTTGG CCGCCGGCGC 900
CGCCGGCGGC CGC 913
(2)SEQ ID NO:17的信息:
(i)序列特征:
(A)长度:1872个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线型
(xi)序列描述:SEQ ID NO:17:
GACTACGTTG GTGTAGAAAA ATCCTGCCGC CCGGACCCTT AAGGCTGGGA CAATTTCTGA 60
TAGCTACCCC GACACAGGAG GTTACGGGAT GAGCAATTCG CGCCGCCGCT CACTCAGGTG 120
GTCATGGTTG CTGAGCGTGC TGGCTGCCGT CGGGCTGGGC CTGGCCACGG CGCCGGCCCA 180
GGCGGCCCCG CCGGCCTTGT CGCAGGACCG GTTCGCCGAC TTCCCCGCGC TGCCCCTCGA 240
CCCGTCCGCG ATGGTCGCCC AAGTGGCGCC ACAGGTGGTC AACATCAACA CCAAACTGGG 300
CTACAACAAC GCCGTGGGCG CCGGGACCGG CATCGTCATC GATCCCAACG GTGTCGTGCT 360
GACCAACAAC CACGTGATCG CGGGCGCCAC CGACATCAAT GCGTTCAGCG TCGGCTCCGG 420
CCAAACCTAC GGCGTCGATG TGGTCGGGTA TGACCGCACC CAGGATGTCG CGGTGCTGCA 480
GCTGCGCGGT GCCGGTGGCC TGCCGTCGGC GGCGATCGGT GGCGGCGTCG CGGTTGGTGA 540
GCCCGTCGTC GCGATGGGCA ACAGCGGTGG GCAGGGCGGA ACGCCCCGTG CGGTGCCTGG 600
CAGGGTGGTC GCGCTCGGCC AAACCGTGCA GGCGTCGGAT TCGCTGACCG GTGCCGAAGA 660
GACATTGAAC GGGTTGATCC AGTTCGATGC CGCAATCCAG CCCGGTGATT CGGGCGGGCC 720
CGTCGTCAAC GGCCTAGGAC AGGTGGTCGG TATGAACACG GCCGCGTCCG ATAACTTCCA 780
GCTGTCCCAG GGTGGGCAGG GATTCGCCAT TCCGATCGGG CAGGCGATGG CGATCGCGGG 840
CCAAATCCGA TCGGGTGGGG GGTCACCCAC CGTTCATATC GGGCCTACCG CCTTCCTCGG 900
CTTGGGTGTT GTCGACAACA ACGGCAACGG CGCACGAGTC CAACGCGTGG TCGGAAGCGC 960
TCCGGCGGCA AGTCTCGGCA TCTCCACCGG CGACGTGATC ACCGCGGTCG ACGGCGCTCC 1020
GATCAACTCG GCCACCGCGA TGGCGGACGC GCTTAACGGG CATCATCCCG GTGACGTCAT 1080
CTCGGTGAAC TGGCAAACCA AGTCGGGCGG CACGCGTACA GGGAACGTGA CATTGGCCGA 1140
GGGACCCCCG GCCTGATTTG TCGCGGATAC CACCCGCCGG CCGGCCAATT GGATTGGCGC 1200
CAGCCGTGAT TGCCGCGTGA GCCCCCGAGT TCCGTCTCCC GTGCGCGTGG CATTGTGGAA 1260
GCAATGAACG AGGCAGAACA CAGCGTTGAG CACCCTCCCG TGCAGGGCAG TTACGTCGAA 1320
GGCGGTGTGG TCGAGCATCC GGATGCCAAG GACTTCGGCA GCGCCGCCGC CCTGCCCGCC 1380
GATCCGACCT GGTTTAAGCA CGCCGTCTTC TACGAGGTGC TGGTCCGGGC GTTCTTCGAC 1440
GCCAGCGCGG ACGGTTCCGN CGATCTGCGT GGACTCATCG ATCGCCTCGA CTACCTGCAG 1500
TGGCTTGGCA TCGACTGCAT CTGTTGCCGC CGTTCCTACG ACTCACCGCT GCGCGACGGC 1560
GGTTACGACA TTCGCGACTT CTACAAGGTG CTGCCCGAAT TCGGCACCGT CGACGATTTC 1620
GTCGCCCTGG TCGACACCGC TCACCGGCGA GGTATCCGCA TCATCACCGA CCTGGTGATG 1680
AATCACACCT CGGAGTCGCA CCCCTGGTTT CAGGAGTCCC GCCGCGACCC AGACGGACCG 1740
TACGGTGACT ATTACGTGTG GAGCGACACC AGCGAGCGCT ACACCGACGC CCGGATCATC 1800
TTCGTCGACA CCGAAGAGTC GAACTGGTCA TTCGATCCTG TCCGCCGACA GTTNCTACTG 1860
GCACCGATTC TT 1872
(2)SEQ ID NO:18的信息:
(i)序列特征:
(A)长度:1482个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线型
(xi)序列描述:SEQ ID NO:18:
CTTCGCCGAA ACCTGATGCC GAGGAACAGG GTGTTCCCGT GAGCCCGACG GCGTCCGACC 60
CCGCGCTCCT CGCCGAGATC AGGCAGTCGC TTGATGCGAC AAAAGGGTTG ACCAGCGTGC 120
ACGTAGCGGT CCGAACAACC GGGAAAGTCG ACAGCTTGCT GGGTATTACC AGTGCCGATG 180
TCGACGTCCG GGCCAATCCG CTCGCGGCAA AGGGCGTATG CACCTACAAC GACGAGCAGG 240
GTGTCCCGTT TCGGGTACAA GGCGACAACA TCTCGGTGAA ACTGTTCGAC GACTGGAGCA 300
ATCTCGGCTC GATTTCTGAA CTGTCAACTT CACGCGTGCT CGATCCTGCC GCTGGGGTGA 360
CGCAGCTGCT GTCCGGTGTC ACGAACCTCC AAGCGCAAGG TACCGAAGTG ATAGACGGAA 420
TTTCGACCAC CAAAATCACC GGGACCATCC CCGCGAGCTC TGTCAAGATG CTTGATCCTG 480
GCGCCAAGAG TGCAAGGCCG GCGACCGTGT GGATTGCCCA GGACGGCTCG CACCACCTCG 540
TCCGAGCGAG CATCGACCTC GGATCCGGGT CGATTCAGCT CACGCAGTCG AAATGGAACG 600
AACCCGTCAA CGTCGACTAG GCCGAAGTTG CGTCGACGCG TTGCTCGAAA CGCCCTTGTG 660
AACGGTGTCA ACGGCACCCG AAAACTGACC CCCTGACGGC ATCTGAAAAT TGACCCCCTA 720
GACCGGGCGG TTGGTGGTTA TTCTTCGGTG GTTCCGGCTG GTGGGACGCG GCCGAGGTCG 780
CGGTCTTTGA GCCGGTAGCT GTCGCCTTTG AGGGCGACGA CTTCAGCATG GTGGACGAGG 840
CGGTCGATCA TGGCGGCAGC AACGACGTCG TCGCCGCCGA AAACCTCGCC CCACCGGCCG 900
AAGGCCTTAT TGGACGTGAC GATCAAGCTG GCCCGCTCAT ACCGGGAGGA CACCAGCTGG 960
AAGAAGAGGT TGGCGGCCTC GGGCTCAAAC GGAATGTAAC CGACTTCGTC AACCACCAGG 1020
AGCGGATAGC GGCCAAACCG GGTGAGTTCG GCGTAGATGC GCCCGGCGTG GTGAGCCTCG 1080
GCGAACCGTG CTACCCATTC GGCGGCGGTG GCGAACAGCA CCCGATGACC GGCCTGACAC 1140
GCGCGTATCG CCAGGCCGAC CGCAAGATGA GTCTTCCCGG TGCCAGGCGG GGCCCAAAAA 1200
CACGACGTTA TCGCGGGCGG TGATGAAATC CAGGGTGCCC AGATGTGCGA TGGTGTCGCG 1260
TTTGAGGCCA CGAGCATGCT CAAAGTCGAA CTCTTCCAAC GACTTCCGAA CCGGGAAGCG 1320
GGCGGCGCGG ATGCGGCCCT CACCACCATG GGACTCCCGG GCTGACACTT CCCGCTGCAG 1380
GCAGGCGGCC AGGTATTCTT CGTGGCTCCA GTTCTCGGCG CGGGCGCGAT CGGCCAGCCG 1440
GGACACTGAC TCACGCAGGG TGGGAGCTTT CAATGCTCTT GT 1482
(2)SEQ ID NO:19的信息:
(i)序列特征:
(A)长度:876个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线型
(xi)序列描述:SEQ ID NO:19:
GAATTCGGCA CGAGCCGGCG ATAGCTTCTG GGCCGCGGCC GACCAGATGG CTCGAGGGTT 60
CGTGCTCGGG GCCACCGCCG GGCGCACCAC CCTGACCGGT GAGGGCCTGC AACACGCCGA 120
CGGTCACTCG TTGCTGCTGG ACGCCACCAA CCCGGCGGTG GTTGCCTACG ACCCGGCCTT 180
CGCCTACGAA ATCGGCTACA TCGNGGAAAG CGGACTGGCC AGGATGTGCG GGGAGAACCC 240
GGAGAACATC TTCTTCTACA TCACCGTCTA CAACGAGCCG TACGTGCAGC CGCCGGAGCC 300
GGAGAACTTC GATCCCGAGG GCGTGCTGGG GGGTATCTAC CGNTATCACG CGGCCACCGA 360
GCAACGCACC AACAAGGNGC AGATCCTGGC CTCCGGGGTA GCGATGCCCG CGGCGCTGCG 420
GGCAGCACAG ATGCTGGCCG CCGAGTGGGA TGTCGCCGCC GACGTGTGGT CGGTGACCAG 480
TTGGGGCGAG CTAAACCGCG ACGGGGTGGT CATCGAGACC GAGAAGCTCC GCCACCCCGA 540
TCGGCCGGCG GGCGTGCCCT ACGTGACGAG AGCGCTGGAG AATGCTCGGG GCCCGGTGAT 600
CGCGGTGTCG GACTGGATGC GCGCGGTCCC CGAGCAGATC CGACCGTGGG TGCCGGGCAC 660
ATACCTCACG TTGGGCACCG ACGGGTTCGG TTTTTCCGAC ACTCGGCCCG CCGGTCGTCG 720
TTACTTCAAC ACCGACGCCG AATCCCAGGT TGGTCGCGGT TTTGGGAGGG GTTGGCCGGG 780
TCGACGGGTG AATATCGACC CATTCGGTGC CGGTCGTGGG CCGCCCGCCC AGTTACCCGG 840
ATTCGACGAA GGTGGGGGGT TGCGCCCGAN TAAGTT 876
(2)SEQ ID NO:20的信息:
(i)序列特征:
(A)长度:1021个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线型
(xi)序列描述:SEQ ID NO:20:
ATCCCCCCGG GCTGCAGGAA TTCGGCACGA GAGACAAAAT TCCACGCGTT AATGCAGGAA 60
CAGATTCATA ACGAATTCAC AGCGGCACAA CAATATGTCG CGATCGCGGT TTATTTCGAC 120
AGCGAAGACC TGCCGCAGTT GGCGAAGCAT TTTTACAGCC AAGCGGTCGA GGAACGAAAC 180
CATGCAATGA TGCTCGTGCA ACACCTGCTC GACCGCGACC TTCGTGTCGA AATTCCCGGC 240
GTAGACACGG TGCGAAACCA GTTCGACAGA CCCCGCGAGG CACTGGCGCT GGCGCTCGAT 300
CAGGAACGCA CAGTCACCGA CCAGGTCGGT CGGCTGACAG CGGTGGCCCG CGACGAGGGC 360
GATTTCCTCG GCGAGCAGTT CATGCAGTGG TTCTTGCAGG AACAGATCGA AGAGGTGGCC 420
TTGATGGCAA CCCTGGTGCG GGTTGCCGAT CGGGCCGGGG CCAACCTGTT CGAGCTAGAG 480
AACTTCGTCG CACGTGAAGT GGATGTGGCG CCGGCCGCAT CAGGCGCCCC GCACGCTGCC 540
GGGGGCCGCC TCTAGATCCC TGGGGGGGAT CAGCGAGTGG TCCCGTTCGC CCGCCCGTCT 600
TCCAGCCAGG CCTTGGTGCG GCCGGGGTGG TGAGTACCAA TCCAGGCCAC CCCGACCTCC 660
CGGNAAAAGT CGATGTCCTC GTACTCATCG ACGTTCCAGG AGTACACCGC CCGGCCCTGA 720
GCTGCCGAGC GGTCAACGAG TTGCGGATAT TCCTTTAACG CAGGCAGTGA GGGTCCCACG 780
GCGGTTGGCC CGACCGCCGT GGCCGCACTG CTGGTCAGGT ATCGGGGGGT CTTGGCGAGC 840
AACAACGTCG GCAGGAGGGG TGGAGCCCGC CGGATCCGCA GACCGGGGGG GCGAAAACGA 900
CATCAACACC GCACGGGATC GATCTGCGGA GGGGGGTGCG GGAATACCGA ACCGGTGTAG 960
GAGCGCCAGC AGTTGTTTTT CCACCAGCGA AGCGTTTTCG GGTCATCGGN GGCNNTTAAG 1020
T 1021
(2)SEQ ID NO:21的信息:
(i)序列特征:
(A)长度:321个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线型
(xi)序列描述:SEQ ID NO:21:
CGTGCCGACG AACGGAAGAA CACAACCATG AAGATGGTGA AATCGATCGC CGCAGGTCTG 60
ACCGCCGCGG CTGCAATCGG CGCCGCTGCG GCCGGTGTGA CTTCGATCAT GGCTGGCGGN 120
CCGGTCGTAT ACCAGATGCA GCCGGTCGTC TTCGGCGCGC CACTGCCGTT GGACCCGGNA 180
TCCGCCCCTG ANGTCCCGAC CGCCGCCCAG TGGACCAGNC TGCTCAACAG NCTCGNCGAT 240
CCCAACGTGT CGTTTGNGAA CAAGGGNAGT CTGGTCGAGG GNGGNATCGG NGGNANCGAG 300
GGNGNGNATC GNCGANCACA A 321
(2)SEQ ID NO:22的信息:
(i)序列特征:
(A)长度:373个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线型
(xi)序列描述:SEQ ID NO:22:
TCTTATCGGT TCCGGTTGGC GACGGGTTTT GGGNGCGGGT GGTTAACCCG CTCGGCCAGC 60
CGATCGACGG GCGCGGAGAC GTCGACTCCG ATACTCGGCG CGCGCTGGAG CTCCAGGCGC 120
CCTCGGTGGT GNACCGGCAA GGCGTGAAGG AGCCGTTGNA GACCGGGATC AAGGCGATTG 180
ACGCGATGAC CCCGATCGGC CGCGGGCAGC GCCAGCTGAT CATCGGGGAC CGCAAGACCG 240
GCAAAAACCG CCGTCTGTGT CGGACACCAT CCTCAAACCA GCGGGAAGAA CTGGGAGTCC 300
GGTGGATCCC AAGAAGCAGG TGCGCTTGTG TATACGTTGG CCATCGGGCA AGAAGGGGAA 360
CTTACCATCG CCG 373
(2)SEQ ID NO:23的信息:
(i)序列特征:
(A)长度:352个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线型
(xi)序列描述:SEQ ID NO:23:
GTGACGCCGT GATGGGATTC CTGGGCGGGG CCGGTCCGCT GGCGGTGGTG GATCAGCAAC 60
TGGTTACCCG GGTGCCGCAA GGCTGGTCGT TTGCTCAGGC AGCCGCTGTG CCGGTGGTGT 120
TCTTGACGGC CTGGTACGGG TTGGCCGATT TAGCCGAGAT CAAGGCGGGC GAATCGGTGC 180
TGATCCATGC CGGTACCGGC GGTGTGGGCA TGGCGGCTGT GCAGCTGGCT CGCCAGTGGG 240
GCGTGGAGGT TTTCGTCACC GCCAGCCGTG GNAAGTGGGA CACGCTGCGC GCCATNGNGT 300
TTGACGACGA NCCATATCGG NGATTCCCNC ACATNCGAAG TTCCGANGGA GA 352
(2)SEQ ID NO:24的信息:
(i)序列特征:
(A)长度:726个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线型
(xi)序列描述:SEQ ID NO:24:
GAAATCCGCG TTCATTCCGT TCGACCAGCG GCTGGCGATA ATCGACGAAG TGATCAAGCC 60
GCGGTTCGCG GCGCTCATGG GTCACAGCGA GTAATCAGCA AGTTCTCTGG TATATCGCAC 120
CTAGCGTCCA GTTGCTTGCC AGATCGCTTT CGTACCGTCA TCGCATGTAC CGGTTCGCGT 180
GCCGCACGCT CATGCTGGCG GCGTGCATCC TGGCCACGGG TGTGGCGGGT CTCGGGGTCG 240
GCGCGCAGTC CGCAGCCCAA ACCGCGCCGG TGCCCGACTA CTACTGGTGC CCGGGGCAGC 300
CTTTCGACCC CGCATGGGGG CCCAACTGGG ATCCCTACAC CTGCCATGAC GACTTCCACC 360
GCGACAGCGA CGGCCCCGAC CACAGCCGCG ACTACCCCGG ACCCATCCTC GAAGGTCCCG 420
TGCTTGACGA TCCCGGTGCT GCGCCGCCGC CCCCGGCTGC CGGTGGCGGC GCATAGCGCT 480
CGTTGACCGG GCCGCATCAG CGAATACGCG TATAAACCCG GGCGTGCCCC CGGCAAGCTA 540
CGACCCCCGG CGGGGCAGAT TTACGCTCCC GTGCCGATGG ATCGCGCCGT CCGATGACAG 600
AAAATAGGCG ACGGTTTTGG CAACCGCTTG GAGGACGCTT GAAGGGAACC TGTCATGAAC 660
GGCGACAGCG CCTCCACCAT CGACATCGAC AAGGTTGTTA CCCGCACACC CGTTCGCCGG 720
ATCGTG 726
(2)SEQ ID NO:25的信息:
(i)序列特征:
(A)长度:580个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线型
(xi)序列描述:SEQ ID NO:25:
CGCGACGACG ACGAACGTCG GGCCCACCAC CGCCTATGCG TTGATGCAGG CGACCGGGAT 60
GGTCGCCGAC CATATCCAAG CATGCTGGGT GCCCACTGAG CGACCTTTTG ACCAGCCGGG 120
CTGCCCGATG GCGGCCCGGT GAAGTCATTG CGCCGGGGCT TGTGCACCTG ATGAACCCGA 180
ATAGGGAACA ATAGGGGGGT GATTTGGCAG TTCAATGTCG GGTATGGCTG GAAATCCAAT 240
GGCGGGGCAT GCTCGGCGCC GACCAGGCTC GCGCAGGCGG GCCAGCCCGA ATCTGGAGGG 300
AGCACTCAAT GGCGGCGATG AAGCCCCGGA CCGGCGACGG TCCTTTGGAA GCAACTAAGG 360
AGGGGCGCGG CATTGTGATG CGAGTACCAC TTGAGGGTGG CGGTCGCCTG GTCGTCGAGC 420
TGACACCCGA CGAAGCCGCC GCACTGGGTG ACGAACTCAA AGGCGTTACT AGCTAAGACC 480
AGCCCAACGG CGAATGGTCG GCGTTACGCG CACACCTTCC GGTAGATGTC CAGTGTCTGC 540
TCGGCGATGT ATGCCCAGGA GAACTCTTGG ATACAGCGCT 580
(2)SEQ ID NO:26的信息:
(i)序列特征:
(A)长度:160个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线型
(xi)序列描述:SEQ ID NO:26:
AACGGAGGCG CCGGGGGTTT TGGCGGGGCC GGGGCGGTCG GCGGCAACGG CGGGGCCGGC 60
GGTACCGCCG GGTTGTTCGG TGTCGGCGGG GCCGGTGGGG CCGGAGGCAA CGGCATCGCC 120
GGTGTCACGG GTACGTCGGC CAGCACACCG GGTGGATCCG 160
(2)SEQ ID NO:27的信息:
(i)序列特征:
(A)长度:272个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线型
(xi)序列描述:SEQ ID NO:27:
GACACCGATA CGATGGTGAT GTACGCCAAC GTTGTCGACA CGCTCGAGGC GTTCACGATC 60
CAGCGCACAC CCGACGGCGT GACCATCGGC GATGCGGCCC CGTTCGCGGA GGCGGCTGCC 120
AAGGCGATGG GAATCGACAA GCTGCGGGTA ATTCATACCG GAATGGACCC CGTCGTCGCT 180
GAACGCGAAC AGTGGGACGA CGGCAACAAC ACGTTGGCGT TGGCGCCCGG TGTCGTTGTC 240
GCCTACGAGC GCAACGTACA GACCAACGCC CG 272
(2)SEQ ID NO:28的信息:
(i)序列特征:
(A)长度:317个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线型
(xi)序列描述:SEQ ID NO:28:
GCAGCCGGTG GTTCTCGGAC TATCTGCGCA CGGTGACGCA GCGCGACGTG CGCGAGCTGA 60
AGCGGATCGA GCAGACGGAT CGCCTGCCGC GGTTCATGCG CTACCTGGCC GCTATCACCG 120
CGCAGGAGCT GAACGTGGCC GAAGCGGCGC GGGTCATCGG GGTCGACGCG GGGACGATCC 180
GTTCGGATCT GGCGTGGTTC GAGACGGTCT ATCTGGTACA TCGCCTGCCC GCCTGGTCGC 240
GGAATCTGAC CGCGAAGATC AAGAAGCGGT CAAAGATCCA CGTCGTCGAC AGTGGCTTCG 300
CGGCCTGGTT GCGCGGG 317
(2)SEQ ID NO:29的信息:
(i)序列特征:
(A)长度:182个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线型
(xi)序列描述:SEQ ID NO:29:
GATCGTGGAG CTGTCGATGA ACAGCGTTGC CGGACGCGCG GCGGCCAGCA CGTCGGTGTA 60
GCAGCGCCGG ACCACCTCGC CGGTGGGCAG CATGGTGATG ACCACGTCGG CCTCGGCCAC 120
CGCTTCGGGC GCGCTACGAA ACACCGCGAC ACCGTGCGCG GCGGCGCCGG ACGCCGCCGT 180
GG 182
(2)SEQ ID NO:30的信息:
(i)序列特征:
(A)长度:308个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线型
(xi)序列描述:SEQ ID NO:30:
GATCGCGAAG TTTGGTGAGC AGGTGGTCGA CGCGAAAGTC TGGGCGCCTG CGAAGCGGGT 60
CGGCGTTCAC GAGGCGAAGA CACGCCTGTC CGAGCTGCTG CGGCTCGTCT ACGGCGGGCA 120
GAGGTTGAGA TTGCCCGCCG CGGCGAGCCG GTAGCAAAGC TTGTGCCGCT GCATCCTCAT 180
GAGACTCGGC GGTTAGGCAT TGACCATGGC GTGTACCGCG TGCCCGACGA TTTGGACGCT 240
CCGTTGTCAG ACGACGTGCT CGAACGCTTT CACCGGTGAA GCGCTACCTC ATCGACACCC 300
ACGTTTGG 308
(2)SEQ ID NO:31的信息:
(i)序列特征:
(A)长度:267个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线型
(xi)序列描述:SEQ ID NO:31:
CCGACGACGA GCAACTCACG TGGATGATGG TCGGCAGCGG CATTGAGGAC GGAGAGAATC 60
CGGCCGAAGC TGCCGCGCGG CAAGTGCTCA TAGTGACCGG CCGTAGAGGG CTCCCCCGAT 120
GGCACCGGAC TATTCTGGTG TGCCGCTGGC CGGTAAGAGC GGGTAAAAGA ATGTGAGGGG 180
ACACGATGAG CAATCACACC TACCGAGTGA TCGAGATCGT CGGGACCTCG CCCGACGGCG 240
TCGACGCGGC AATCCAGGGC GGTCTGG 267
(2)SEQ ID NO:32的信息:
(i)序列特征:
(A)长度:189个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线型
(xi)序列描述:SEQ ID NO:32:
CTCGTGCCGA AAGAATGTGA GGGGACACGA TGAGCAATCA CACCTACCGA GTGATCGAGA 60
TCGTCGGGAC CTCGCCCGAC GGCGTCGACG CGGCAATCCA GGGCGGTCTG GCCCGAGCTG 120
CGCAGACCAT GCGCGCGCTG GACTGGTTCG AAGTACAGTC AATTCGAGGC CACCTGGTCG 180
ACGGAGCGG 189
(2)SEQ ID NO:33的信息:
(i)序列特征:
(A)长度:851个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线型
(xi)序列描述:SEQ ID NO:33:
CTGCAGGGTG GCGTGGATGA GCGTCACCGC GGGGCAGGCC GAGCTGACCG CCGCCCAGGT 60
CCGGGTTGCT GCGGCGGCCT ACGAGACGGC GTATGGGCTG ACGGTGCCCC CGCCGGTGAT 120
CGCCGAGAAC CGTGCTGAAC TGATGATTCT GATAGCGACC AACCTCTTGG GGCAAAACAC 180
CCCGGCGATC GCGGTCAACG AGGCCGAATA CGGCGAGATG TGGGCCCAAG ACGCCGCCGC 240
GATGTTTGGC TACGCCGCGG CGACGGCGAC GGCGACGGCG ACGTTGCTGC CGTTCGAGGA 300
GGCGCCGGAG ATGACCAGCG CGGGTGGGCT CCTCGAGCAG GCCGCCGCGG TCGAGGAGGC 360
CTCCGACACC GCCGCGGCGA ACCAGTTGAT GAACAATGTG CCCCAGGCGC TGAAACAGTT 420
GGCCCAGCCC ACGCAGGGCA CCACGCCTTC TTCCAAGCTG GGTGGCCTGT GGAAGACGGT 480
CTCGCCGCAT CGGTCGCCGA TCAGCAACAT GGTGTCGATG GCCAACAACC ACATGTCGAT 540
GACCAACTCG GGTGTGTCGA TGACCAACAC CTTGAGCTCG ATGTTGAAGG GCTTTGCTCC 600
GGCGGCGGCC GCCCAGGCCG TGCAAACCGC GGCGCAAAAC GGGGTCCGGG CGATGAGCTC 660
GCTGGGCAGC TCGCTGGGTT CTTCGGGTCT GGGCGGTGGG GTGGCCGCCA ACTTGGGTCG 720
GGCGGCCTCG GTACGGTATG GTCACCGGGA TGGCGGAAAA TATGCANAGT CTGGTCGGCG 780
GAACGGTGGT CCGGCGTAAG GTTTACCCCC GTTTTCTGGA TGCGGTGAAC TTCGTCAACG 840
GAAACAGTTA C 851
(2)SEQ ID NO:34的信息:
(i)序列特征:
(A)长度:254个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线型
(xi)序列描述:SEQ ID NO:34:
GATCGATCGG GCGGAAATTT GGACCAGATT CGCCTCCGGC GATAACCCAA TCAATCGAAC 60
CTAGATTTAT TCCGTCCAGG GGCCCGAGTA ATGGCTCGCA GGAGAGGAAC CTTACTGCTG 120
CGGGCACCTG TCGTAGGTCC TCGATACGGC GGAAGGCGTC GACATTTTCC ACCGACACCC 180
CCATCCAAAC GTTCGAGGGC CACTCCAGCT TGTGAGCGAG GCGACGCAGT CGCAGGCTGC 240
GCTTGGTCAA GATC 254
(2)SEQ ID NO:35的信息:
(i)序列特征:
(A)长度:408个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线型
(xi)序列描述:SEQ ID NO:35:
CGGCACGAGG ATCCTGACCG AAGCGGCCGC CGCCAAGGCG AAGTCGCTGT TGGACCAGGA 60
GGGACGGGAC GATCTGGCGC TGCGGATCGC GGTTCAGCCG GGGGGGTGCG CTGGATTGCG 120
CTATAACCTT TTCTTCGACG ACCGGACGCT GGATGGTGAC CAAACCGCGG AGTTCGGTGG 180
TGTCAGGTTG ATCGTGGACC GGATGAGCGC GCCGTATGTG GAAGGCGCGT CGATCGATTT 240
CGTCGACACT ATTGAGAAGC AAGGNTTCAC CATCGACAAT CCCAACGCCA CCGGCTCCTG 300
CGCGTGCGGG GATTCGTTCA ACTGATAAAA CGCTAGTACG ACCCCGCGGT GCGCAACACG 360
TACGAGCACA CCAAGACCTG ACCGCGCTGG AAAAGCAACT GAGCGATG 408
(2)SEQ ID NO:36的信息:
(i)序列特征:
(A)长度:181个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线型
(xi)序列描述:SEQ ID NO:36:
GCGGTGTCGG CGGATCCGGC GGGTGGTTGA ACGGCAACGG CGGGGCCGGC GGGGCCGGCG 60
GGACCGGCGC TAACGGTGGT GCCGGCGGCA ACGCCTGGTT GTTCGGGGCC GGCGGGTCCG 120
GCGGNGCCGG CACCAATGGT GGNGTCGGCG GGTCCGGCGG ATTTGTCTAC GGCAACGGCG 180
G 181
(2)SEQ ID NO:37的信息:
(i)序列特征:
(A)长度:290个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线型
(xi)序列描述:SEQ ID NO:37:
GCGGTGTCGG CGGATCCGGC GGGTGGTTGA ACGGCAACGG CGGTGTCGGC GGCCGGGGCG 60
GCGACGGCGT CTTTGCCGGT GCCGGCGGCC AGGGCGGCCT CGGTGGGCAG GGCGGCAATG 120
GCGGCGGCTC CACCGGCGGC AACGGCGGTC TTGGCGGCGC GGGCGGTGGC GGAGGCAACG 180
CCCCGGACGG CGGCTTCGGT GGCAACGGCG GTAAGGGTGG CCAGGGCGGN ATTGGCGGCG 240
GCACTCAGAG CGCGACCGGC CTCGGNGGTG ACGGCGGTGA CGGCGGTGAC 290
(2)SEQ ID NO:38的信息:
(i)序列特征:
(A)长度:34个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线型
(xi)序列描述:SEQ ID NO:38:
GATCCAGTGG CATGGNGGGT GTCAGTGGAA GCAT 34
(2)SEQ ID NO:39的信息:
(i)序列特征:
(A)长度:155个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线型
(xi)序列描述:SEQ ID NO:39:
GATCGCTGCT CGTCCCCCCC TTGCCGCCGA CGCCACCGGT CCCACCGTTA CCGAACAAGC 60
TGGCGTGGTC GCCAGCACCC CCGGCACCGC CGACGCCGGA GTCGAACAAT GGCACCGTCG 120
TATCCCCACC ATTGCCGCCG GNCCCACCGG CACCG 155
(2)SEQ ID NO:40的信息:
(i)序列特征:
(A)长度:53个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线型
(xi)序列描述:SEQ ID NO:40:
ATGGCGTTCA CGGGGCGCCG GGGACCGGGC AGCCCGGNGG GGCCGGGGGG TGG 53
(2)SEQ ID NO:41的信息:
(i)序列特征:
(A)长度:132个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线型
(xi)序列描述:SEQ ID NO:41:
GATCCACCGC GGGTGCAGAC GGTGCCCGCG GCGCCACCCC GACCAGCGGC GGCAACGGCG 60
GCACCGGCGG CAACGGCGCG AACGCCACCG TCGTCGGNGG GGCCGGCGGG GCCGGCGGCA 120
AGGGCGGCAA CG 132
(2)SEQ ID NO:42的信息:
(i)序列特征:
(A)长度:132个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线型
(xi)序列描述:SEQ ID NO:42:
GATCGGCGGC CGGNACGGNC GGGGACGGCG GCAAGGGCGG NAACGGGGGC GCCGNAGCCA 60
CCNGCCAAGA ATCCTCCGNG TCCNCCAATG GCGCGAATGG CGGACAGGGC GGCAACGGCG 120
GCANCGGCGG CA 132
(2)SEQ ID NO:43的信息:
(i)序列特征:
(A)长度:702个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线型
(xi)序列描述:SEQ ID NO:43:
CGGCACGAGG ATCGGTACCC CGCGGCATCG GCAGCTGCCG ATTCGCCGGG TTTCCCCACC 60
CGAGGAAAGC CGCTACCAGA TGGCGCTGCC GAAGTAGGGC GATCCGTTCG CGATGCCGGC 120
ATGAACGGGC GGCATCAAAT TAGTGCAGGA ACCTTTCAGT TTAGCGACGA TAATGGCTAT 180
AGCACTAAGG AGGATGATCC GATATGACGC AGTCGCAGAC CGTGACGGTG GATCAGCAAG 240
AGATTTTGAA CAGGGCCAAC GAGGTGGAGG CCCCGATGGC GGACCCACCG ACTGATGTCC 300
CCATCACACC GTGCGAACTC ACGGNGGNTA AAAACGCCGC CCAACAGNTG GTNTTGTCCG 360
CCGACAACAT GCGGGAATAC CTGGCGGCCG GTGCCAAAGA GCGGCAGCGT CTGGCGACCT 420
CGCTGCGCAA CGCGGCCAAG GNGTATGGCG AGGTTGATGA GGAGGCTGCG ACCGCGCTGG 480
ACAACGACGG CGAAGGAACT GTGCAGGCAG AATCGGCCGG GGCCGTCGGA GGGGACAGTT 540
CGGCCGAACT AACCGATACG CCGAGGGTGG CCACGGCCGG TGAACCCAAC TTCATGGATC 600
TCAAAGAAGC GGCAAGGAAG CTCGAAACGG GCGACCAAGG CGCATCGCTC GCGCACTGNG 660
GGGATGGGTG GAACACTTNC ACCCTGACGC TGCAAGGCGA CG 702
(2)SEQ ID NO:44的信息:
(i)序列特征:
(A)长度:298个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线型
(xi)序列描述:SEQ ID NO:44:
GAAGCCGCAG CGCTGTCGGG CGACGTGGCG GTCAAAGCGG CATCGCTCGG TGGCGGTGGA 60
GGCGGCGGGG TGCCGTCGGC GCCGTTGGGA TCCGCGATCG GGGGCGCCGA ATCGGTGCGG 120
CCCGCTGGCG CTGGTGACAT TGCCGGCTTA GGCCAGGGAA GGGCCGGCGG CGGCGCCGCG 180
CTGGGCGGCG GTGGCATGGG AATGCCGATG GGTGCCGCGC ATCAGGGACA AGGGGGCGCC 240
AAGTCCAAGG GTTCTCAGCA GGAAGACGAG GCGCTCTACA CCGAGGATCC TCGTGCCG 298
(2)SEQ ID NO:45的信息:
(i)序列特征:
(A)长度:1058个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线型
(xi)序列描述:SEQ ID NO:45:
CGGCACGAGG ATCGAATCGC GTCGCCGGGA GCACAGCGTC GCACTGCACC AGTGGAGGAG 60
CCATGACCTA CTCGCCGGGT AACCCCGGAT ACCCGCAAGC GCAGCCCGCA GGCTCCTACG 120
GAGGCGTCAC ACCCTCGTTC GCCCACGCCG ATGAGGGTGC GAGCAAGCTA CCGATGTACC 180
TGAACATCGC GGTGGCAGTG CTCGGTCTGG CTGCGTACTT CGCCAGCTTC GGCCCAATGT 240
TCACCCTCAG TACCGAACTC GGGGGGGGTG ATGGCGCAGT GTCCGGTGAC ACTGGGCTGC 300
CGGTCGGGGT GGCTCTGCTG GCTGCGCTGC TTGCCGGGGT GGTTCTGGTG CCTAAGGCCA 360
AGAGCCATGT GACGGTAGTT GCGGTGCTCG GGGTACTCGG CGTATTTCTG ATGGTCTCGG 420
CGACGTTTAA CAAGCCCAGC GCCTATTCGA CCGGTTGGGC ATTGTGGGTT GTGTTGGCTT 480
TCATCGTGTT CCAGGCGGTT GCGGCAGTCC TGGCGCTCTT GGTGGAGACC GGCGCTATCA 540
CCGCGCCGGC GCCGCGGCCC AAGTTCGACC CGTATGGACA GTACGGGCGG TACGGGCAGT 600
ACGGGCAGTA CGGGGTGCAG CCGGGTGGGT ACTACGGTCA GCAGGGTGCT CAGCAGGCCG 660
CGGGACTGCA GTCGCCCGGC CCGCAGCAGT CTCCGCAGCC TCCCGGATAT GGGTCGCAGT 720
ACGGCGGCTA TTCGTCCAGT CCGAGCCAAT CGGGCAGTGG ATACACTGCT CAGCCCCCGG 780
CCCAGCCGCC GGCGCAGTCC GGGTCGCAAC AATCGCACCA GGGCCCATCC ACGCCACCTA 840
CCGGCTTTCC GAGCTTCAGC CCACCACCAC CGGTCAGTGC CGGGACGGGG TCGCAGGCTG 900
GTTCGGCTCC AGTCAACTAT TCAAACCCCA GCGGGGGCGA GCAGTCGTCG TCCCCCGGGG 960
GGGCGCCGGT CTAACCGGGC GTTCCCGCGT CCGGTCGCGC GTGTGCGCGA AGAGTGAACA 1020
GGGTGTCAGC AAGCGCGGAC GATCCTCGTG CCGAATTC 1058
(2)SEQ ID NO:46的信息:
(i)序列特征:
(A)长度:327个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线型
(xi)序列描述:SEQ ID NO:46:
CGGCACGAGA GACCGATGCC GCTACCCTCG CGCAGGAGGC AGGTAATTTC GAGCGGATCT 60
CCGGCGACCT GAAAACCCAG ATCGACCAGG TGGAGTCGAC GGCAGGTTCG TTGCAGGGCC 120
AGTGGCGCGG CGCGGCGGGG ACGGCCGCCC AGGCCGCGGT GGTGCGCTTC CAAGAAGCAG 180
CCAATAAGCA GAAGCAGGAA CTCGACGAGA TCTCGACGAA TATTCGTCAG GCCGGCGTCC 240
AATACTCGAG GGCCGACGAG GAGCAGCAGC AGGCGCTGTC CTCGCAAATG GGCTTCTGAC 300
CCGCTAATAC GAAAAGAAAC GGAGCAA 327
(2)SEQ ID NO:47的信息:
(i)序列特征:
(A)长度:170个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线型
(xi)序列描述:SEQ ID NO:47:
CGGTCGCGAT GATGGCGTTG TCGAACGTGA CCGATTCTGT ACCGCCGTCG TTGAGATCAA 60
CCAACAACGT GTTGGCGTCG GCAAATGTGC CGNACCCGTG GATCTCGGTG ATCTTGTTCT 120
TCTTCATCAG GAAGTGCACA CCGGCCACCC TGCCCTCGGN TACCTTTCGG 170
(2)SEQ ID NO:48的信息:
(i)序列特征:
(A)长度:127个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线型
(xi)序列描述:SEQ ID NO:48:
GATCCGGCGG CACGGGGGGT GCCGGCGGCA GCACCGCTGG CGCTGGCGGC AACGGCGGGG 60
CCGGGGGTGG CGGCGGAACC GGTGGGTTGC TCTTCGGCAA CGGCGGTGCC GGCGGGCACG 120
GGGCCGT 127
(2)SEQ ID NO:49的信息:
(i)序列特征:
(A)长度:81个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线型
(xi)序列描述:SEQ ID NO:49:
CGGCGGCAAG GGCGGCACCG CCGGCAACGG GAGCGGCGCG GCCGGCGGCA ACGGCGGCAA 60
CGGCGGCTCC GGCCTCAACG G 81
(2)SEQ ID NO:50的信息:
(i)序列特征:
(A)长度:149个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线型
(xi)序列描述:SEQ ID NO:50:
GATCAGGGCT GGCCGGCTCC GGCCAGAAGG GCGGTAACGG AGGAGCTGCC GGATTGTTTG 60
GCAACGGCGG GGCCGGNGGT GCCGGCGCGT CCAACCAAGC CGGTAACGGC GGNGCCGGCG 120
GAAACGGTGG TGCCGGTGGG CTGATCTGG 149
(2)SEQ ID NO:51的信息:
(i)序列特征:
(A)长度:355个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线型
(xi)序列描述:SEQ ID NO:51:
CGGCACGAGA TCACACCTAC CGAGTGATCG AGATCGTCGG GACCTCGCCC GACGGTGTCG 60
ACGCGGNAAT CCAGGGCGGT CTGGCCCGAG CTGCGCAGAC CATGCGCGCG CTGGACTGGT 120
TCGAAGTACA GTCAATTCGA GGCCACCTGG TCGACGGAGC GGTCGCGCAC TTCCAGGTGA 180
CTATGAAAGT CGGCTTCCGC CTGGAGGATT CCTGAACCTT CAAGCGCGGC CGATAACTGA 240
GGTGCATCAT TAAGCGACTT TTCCAGAACA TCCTGACGCG CTCGAAACGC GGTTCAGCCG 300
ACGGTGGCTC CGCCGAGGCG CTGCCTCCAA AATCCCTGCG ACAATTCGTC GGCGG 255
(2)SEQ ID NO:52的信息:
(i)序列特征:
(A)长度:999个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线型
(xi)序列描述:SEQ ID NO:52:
ATGCATCACC ATCACCATCA CATGCATCAG GTGGACCCCA ACTTGACACG TCGCAAGGGA 60
CGATTGGCGG CACTGGCTAT CGCGGCGATG GCCAGCGCCA GCCTGGTGAC CGTTGCGGTG 120
CCCGCGACCG CCAACGCCGA TCCGGAGCCA GCGCCCCCGG TACCCACAAC GGCCGCCTCG 180
CCGCCGTCGA CCGCTGCAGC GCCACCCGCA CCGGCGACAC CTGTTGCCCC CCCACCACCG 240
GCCGCCGCCA ACACGCCGAA TGCCCAGCCG GGCGATCCCA ACGCAGCACC TCCGCCGGCC 300
GACCCGAACG CACCGCCGCC ACCTGTCATT GCCCCAAACG CACCCCAACC TGTCCGGATC 360
GACAACCCGG TTGGAGGATT CAGCTTCGCG CTGCCTGCTG GCTGGGTGGA GTCTGACGCC 420
GCCCACTTCG ACTACGGTTC AGCACTCCTC AGCAAAACCA CCGGGGACCC GCCATTTCCC 480
GGACAGCCGC CGCCGGTGGC CAATGACACC CGTATCGTGC TCGGCCGGCT AGACCAAAAG 540
CTTTACGCCA GCGCCGAAGC CACCGACTCC AAGGCCGCGG CCCGGTTGGG CTCGGACATG 600
GGTGAGTTCT ATATGCCCTA CCCGGGCACC CGGATCAACC AGGAAACCGT CTCGCTCGAC 660
GCCAACGGGG TGTCTGGAAG CGCGTCGTAT TACGAAGTCA AGTTCAGCGA TCCGAGTAAG 720
CCGAACGGCC AGATCTGGAC GGGCGTAATC GGCTCGCCCG CGGCGAACGC ACCGGACGCC 780
GGGCCCCCTC AGCGCTGGTT TGTGGTATGG CTCGGGACCG CCAACAACCC GGTGGACAAG 840
GGCGCGGCCA AGGCGCTGGC CGAATCGATC CGGCCTTTGG TCGCCCCGCC GCCGGCGCCG 900
GCACCGGCTC CTGCAGAGCC CGCTCCGGCG CCGGCGCCGG CCGGGGAAGT CGCTCCTACC 960
CCGACGACAC CGACACCGCA GCGGACCTTA CCGGCCTGA 999
(2)SEQ ID NO:53的信息:
(i)序列特征:
(A)长度:332个氨基酸
(B)类型:氨基酸
(C)链型:单链
(D)拓扑结构:线型
(xi)序列描述:SEQ ID NO:53:
Met His His His His His His Met His Gln Val Asp Pro Asn Leu Thr
1 5 10 15
Arg Arg Lys Gly Arg Leu Ala Ala Leu Ala Ile Ala Ala Met Ala Ser
20 25 30
Ala Ser Leu Val Thr Val Ala Val Pro Ala Thr Ala Asn Ala Asp Pro
35 40 45
Glu Pro Ala Pro Pro Val Pro Thr Thr Ala Ala Ser Pro Pro Ser Thr
50 55 60
Ala Ala Ala Pro Pro Ala Pro Ala Thr Pro Val Ala Pro Pro Pro Pro
65 70 75 80
Ala Ala Ala Asn Thr Pro Asn Ala Gln Pro Gly Asp Pro Asn Ala Ala
85 90 95
Pro Pro Pro Ala Asp Pro Asn Ala Pro Pro Pro Pro Val Ile Ala Pro
100 105 110
Asn Ala Pro Gln Pro Val Arg Ile Asp Asn Pro Val Gly Gly Phe Ser
115 120 125
Phe Ala Leu Pro Ala Gly Trp Val Glu Ser Asp Ala Ala His Phe Asp
130 135 140
Tyr Gly Ser Ala Leu Leu Ser Lys Thr Thr Gly Asp Pro Pro Phe Pro
145 150 155 160
Gly Gln Pro Pro Pro Val Ala Asn Asp Thr Arg Ile Val Leu Gly Arg
165 170 175
Leu Asp Gln Lys Leu Tyr Ala Ser Ala Glu Ala Thr Asp Ser Lys Ala
180 185 190
Ala Ala Arg Leu Gly Ser Asp Met Gly Glu Phe Tyr Met Pro Tyr Pro
195 200 205
Gly Thr Arg Ile Asn Gln Glu Thr Val Ser Leu Asp Ala Asn Gly Val
210 215 220
Ser Gly Ser Ala Ser Tyr Tyr Glu Val Lys Phe Ser Asp Pro Ser Lys
225 230 235 240
Pro Asn Gly Gln Ile Trp Thr Gly Val Ile Gly Ser Pro Ala Ala Asn
245 250 255
Ala Pro Asp Ala Gly Pro Pro Gln Arg Trp Phe Val Val Trp Leu Gly
260 265 270
Thr Ala Asn Asn Pro Val Asp Lys Gly Ala Ala Lys Ala Leu Ala Glu
275 280 285
Ser Ile Arg Pro Leu Val Ala Pro Pro Pro Ala Pro Ala Pro Ala Pro
290 295 300
Ala Glu Pro Ala Pro Ala Pro Ala Pro Ala Gly Glu Val Ala Pro Thr
305 310 315 320
Pro Thr Thr Pro Thr Pro Gln Arg Thr Leu Pro Ala
325 330
(2)SEQ ID NO:54的信息:
(i)序列特征:
(A)长度:20个氨基酸
(B)类型:氨基酸
(C)链型:单链
(D)拓扑结构:线型
(xi)序列描述:SEQ ID NO:54:
Asp Pro Val Asp Ala Val Ile Asn Thr Thr Xaa Asn Tyr Gly Gln Val
1 5 10 15
Val Ala Ala Leu
20
(2)SEQ ID NO:55的信息:
(i)序列特征:
(A)长度:15个氨基酸
(B)类型:氨基酸
(C)链型:单链
(D)拓扑结构:线型
(xi)序列描述:SEQ ID NO:55:
Ala Val Glu Ser Gly Met Leu Ala Leu Gly Thr Pro Ala Pro Ser
1 5 10 15
(2)SEQ ID NO:56的信息:
(i)序列特征:
(A)长度:19个氨基酸
(B)类型:氨基酸
(C)链型:单链
(D)拓扑结构:线型
(xi)序列描述:SEQ ID NO:56:
Ala Ala Met Lys Pro Arg Thr Gly Asp Gly Pro Leu Glu Ala Ala Lys
1 5 10 15
Glu Gly Arg
(2)SEQ ID NO:57的信息:
(i)序列特征:
(A)长度:15个氨基酸
(B)类型:氨基酸
(C)链型:单链
(D)拓扑结构:线型
(xi)序列描述:SEQ ID NO:57:
Tyr Tyr Trp Cys Pro Gly Gln Pro Phe Asp Pro Ala Trp Gly Pro
1 5 10 15
(2)SEQ ID NO:58的信息:
(i)序列特征:
(A)长度:14个氨基酸
(B)类型:氨基酸
(C)链型:单链
(D)拓扑结构:线型
(xi)序列描述:SEQ ID NO:58:
Asp Ile Gly Ser Glu Ser Thr Glu Asp Gln Gln Xaa Ala Val
1 5 10
(2)SEQ ID NO:59的信息:
(i)序列特征:
(A)长度:13个氨基酸
(B)类型:氨基酸
(C)链型:单链
(D)拓扑结构:线型
(xi)序列描述:SEQ ID NO:59:
Ala Glu Glu Ser Ile Ser Thr Xaa Glu Xaa Ile Val Pro
1 5 10
(2)SEQ ID NO:60的信息:
(i)序列特征:
(A)长度:17个氨基酸
(B)类型:氨基酸
(C)链型:单链
(D)拓扑结构:线型
(xi)序列描述:SEQ ID NO:60:
Asp Pro Glu Pro Ala Pro Pro Val Pro Thr Ala Ala Ala Ala Pro Pro
1 5 10 15
Ala
(2)SEQ ID NO:61的信息:
(i)序列特征:
(A)长度:15个氨基酸
(B)类型:氨基酸
(C)链型:单链
(D)拓扑结构:线型
(xi)序列描述:SEQ ID NO:61:
Ala Pro Lys Thr Tyr Xaa Glu Glu Leu Lys Gly Thr Asp Thr Gly
1 5 10 15
(2)SEQ ID NO:62的信息:
(i)序列特征:
(A)长度:30个氨基酸
(B)类型:氨基酸
(C)链型:单链
(D)拓扑结构:线型
(xi)序列描述:SEQ ID NO:62:
Asp Pro Ala Ser Ala Pro Asp Val Pro Thr Ala Ala Gln Gln Thr Ser
1 5 10 15
Leu Leu Asn Asn Leu Ala Asp Pro Asp Val Ser Phe Ala Asp
20 25 30
(2)SEQ ID NO:63的信息:
(i)序列特征:
(A)长度:24个氨基酸
(B)类型:氨基酸
(C)链型:单链
(D)拓扑结构:线型
(xi)序列描述:SEQ ID NO:63:
Gly Cys Gly Asp Arg Ser Gly Gly Asn Leu Asp Gln Ile Arg Leu Arg
1 5 10 15
Arg Asp Arg Ser Gly Gly Asn Leu
20
(2)SEQ ID NO:64的信息:
(i)序列特征:
(A)长度:187个氨基酸
(B)类型:氨基酸
(C)链型:单链
(D)拓扑结构:线型
(xi)序列描述:SEQ ID NO:64:
Thr Gly Ser Leu Asn Gln Thr His Asn Arg Arg Ala Asn Glu Arg Lys
1 5 10 15
Asn Thr Thr Met Lys Met Val Lys Ser Ile Ala Ala Gly Leu Thr Ala
20 25 30
Ala Ala Ala Ile Gly Ala Ala Ala Ala Gly Val Thr Ser Ile Met Ala
35 40 45
Gly Gly Pro Val Val Tyr Gln Met Gln Pro Val Val Phe Gly Ala Pro
50 55 60
Leu Pro Leu Asp Pro Ala Ser Ala Pro Asp Val Pro Thr Ala Ala Gln
65 70 75 80
Leu Thr Ser Leu Leu Asn Ser Leu Ala Asp Pro Asn Val Ser Phe Ala
85 90 95
Asn Lys Gly Ser Leu Val Glu Gly Gly Ile Gly Gly Thr Glu Ala Arg
100 105 110
Ile Ala Asp His Lys Leu Lys Lys Ala Ala Glu His Gly Asp Leu Pro
115 120 125
Leu Ser Phe Ser Val Thr Asn Ile Gln Pro Ala Ala Ala Gly Ser Ala
130 135 140
Thr Ala Asp Val Ser Val Ser Gly Pro Lys Leu Ser Ser Pro Val Thr
145 150 155 160
Gln Asn Val Thr Phe Val Asn Gln Gly Gly Trp Met Leu Ser Arg Ala
165 170 175
Ser Ala Met Glu Leu Leu Gln Ala Ala Gly Xaa
180 185
(2)SEQ ID NO:65的信息:
(i)序列特征:
(A)长度:148个氨基酸
(B)类型:氨基酸
(C)链型:单链
(D)拓扑结构:线型
(xi)序列描述:SEQ ID NO:65:
Asp Glu Val Thr Val Glu Thr Thr Ser Val Phe Arg Ala Asp Phe Leu
1 5 10 15
Ser Glu Leu Asp Ala Pro Ala Gln Ala Gly Thr Glu Ser Ala Val Ser
20 25 30
Gly Val Glu Gly Leu Pro Pro Gly Ser Ala Leu Leu Val Val Lys Arg
35 40 45
Gly Pro Asn Ala Gly Ser Arg Phe Leu Leu Asp Gln Ala Ile Thr Ser
50 55 60
Ala Gly Arg His Pro Asp Ser Asp Ile Phe Leu Asp Asp Val Thr Val
65 70 75 80
Ser Arg Arg His Ala Glu Phe Arg Leu Glu Asn Asn Glu Phe Asn Val
85 90 95
Val Asp Val Gly Ser Leu Asn Gly Thr Tyr Val Asn Arg Glu Pro Val
100 105 110
Asp Ser Ala Val Leu Ala Asn Gly Asp Glu Val Gln Ile Gly Lys Leu
115 120 125
Arg Leu Val Phe Leu Thr Gly Pro Lys Gln Gly Glu Asp Asp Gly Ser
130 135 140
Thr Gly Gly Pro
145
(2)SEQ ID NO:66的信息:
(i)序列特征:
(A)长度:230个氨基酸
(B)类型:氨基酸
(C)链型:单链
(D)拓扑结构:线型
(xi)序列描述:SEQ ID NO:66:
Thr Ser Asn Arg Pro Ala Arg Arg Gly Arg Arg Ala Pro Arg Asp Thr
1 5 10 15
Gly Pro Asp Arg Ser Ala Ser Leu Ser Leu Val Arg His Arg Arg Gln
20 25 30
Gln Arg Asp Ala Leu Cys Leu Ser Ser Thr Gln Ile Ser Arg Gln Ser
35 40 45
Asn Leu Pro Pro Ala Ala Gly Gly Ala Ala Asn Tyr Ser Arg Arg Asn
50 55 60
Phe Asp Val Arg Ile Lys Ile Phe Met Leu Val Thr Ala Val Val Leu
65 70 75 80
Leu Cys Cys Ser Gly Val Ala Thr Ala Ala Pro Lys Thr Tyr Cys Glu
85 90 95
Glu Leu Lys Gly Thr Asp Thr Gly Gln Ala Cys Gln Ile Gln Met Ser
100 105 110
Asp Pro Ala Tyr Asn Ile Asn Ile Ser Leu Pro Ser Tyr Tyr Pro Asp
115 120 125
Gln Lys Ser Leu Glu Asn Tyr Ile Ala Gln Thr Arg Asp Lys Phe Leu
130 135 140
Ser Ala Ala Thr Ser Ser Thr Pro Arg Glu Ala Pro Tyr Glu Leu Asn
145 150 155 160
Ile Thr Ser Ala Thr Tyr Gln Ser Ala Ile Pro Pro Arg Gly Thr Gln
165 170 175
Ala Val Val Leu Xaa Val Tyr His Asn Ala Gly Gly Thr His Pro Thr
180 185 190
Thr Thr Tyr Lys Ala Phe Asp Trp Asp Gln Ala Tyr Arg Lys Pro Ile
195 200 205
Thr Tyr Asp Thr Leu Trp Gln Ala Asp Thr Asp Pro Leu Pro Val Val
210 215 220
Phe Pro Ile Val Ala Arg
225 230
(2)SEQ ID NO:67的信息:
(i)序列特征:
(A)长度:132个氨基酸
(B)类型:氨基酸
(C)链型:单链
(D)拓扑结构:线型
(xi)序列描述:SEQ ID NO:67:
Thr Ala Ala Ser Asp Asn Phe Gln Leu Ser Gln Gly Gly Gln Gly Phe
1 5 10 15
Ala Ile Pro Ile Gly Gln Ala Met Ala Ile Ala Gly Gln Ile Arg Ser
20 25 30
Gly Gly Gly Ser Pro Thr Val His Ile Gly Pro Thr Ala Phe Leu Gly
35 40 45
Leu Gly Val Val Asp Asn Asn Gly Asn Gly Ala Arg Val Gln Arg Val
50 55 60
Val Gly Ser Ala Pro Ala Ala Ser Leu Gly Ile Ser Thr Gly Asp Val
65 70 75 80
Ile Thr Ala Val Asp Gly Ala Pro Ile Asn Ser Ala Thr Ala Met Ala
85 90 95
Asp Ala Leu Asn Gly His His Pro Gly Asp Val Ile Ser Val Asn Trp
100 105 110
Gln Thr Lys Ser Gly Gly Thr Arg Thr Gly Asn Val Thr Leu Ala Glu
115 120 125
Gly Pro Pro Ala
130
(2)SEQ ID NO:68的信息:
(i)序列特征:
(A)长度:100个氨基酸
(B)类型:氨基酸
(C)链型:单链
(D)拓扑结构:线型
(xi)序列描述:SEQ ID NO:68:
Val Pro Leu Arg Ser Pro Ser Met Ser Pro Ser Lys Cys Leu Ala Ala
1 5 10 15
Ala Gln Arg Asn Pro Val Ile Arg Arg Arg Arg Leu Ser Asn Pro Pro
20 25 30
Pro Arg Lys Tyr Arg Ser Met Pro Ser Pro Ala Thr Ala Ser Ala Gly
35 40 45
Met Ala Arg Val Arg Arg Arg Ala Ile Trp Arg Gly Pro Ala Thr Xaa
50 55 60
Ser Ala Gly Met Ala Arg Val Arg Arg Trp Xaa Val Met Pro Xaa Val
65 70 75 80
Ile Gln Ser Thr Xaa Ile Arg Xaa Xaa Gly Pro Phe Asp Asn Arg Gly
85 90 95
Ser Glu Arg Lys
100
(2)SEQ ID NO:69的信息:
(i)序列特征:
(A)长度:163个氨基酸
(B)类型:氨基酸
(C)链型:单链
(D)拓扑结构:线型
(xi)序列描述:SEQ ID NO:69:
Met Thr Asp Asp Ile Leu Leu Ile Asp Thr Asp Glu Arg Val Arg Thr
1 5 10 15
Leu Thr Leu Asn Arg Pro Gln Ser Arg Asn Ala Leu Ser Ala Ala Leu
20 25 30
Arg Asp Arg Phe Phe Ala Xaa Leu Xaa Asp Ala Glu Xaa Asp Asp Asp
35 40 45
Ile Asp Val Val Ile Leu Thr Gly Ala Asp Pro Val Phe Cys Ala Gly
50 55 60
Leu Asp Leu Lys Val Ala Gly Arg Ala Asp Arg Ala Ala Gly His Leu
65 70 75 80
Thr Ala Val Gly Gly His Asp Gln Ala Gly Asp Arg Arg Asp Gln Arg
85 90 95
Arg Arg Gly His Arg Arg Ala Arg Thr Gly Ala Val Leu Arg His Pro
100 105 110
Asp Arg Leu Arg Ala Arg Pro Leu Arg Arg His Pro Arg Pro Gly Gly
115 120 125
Ala Ala Ala His Leu Gly Thr Gln Cys Val Leu Ala Ala Lys Gly Arg
130 135 140
His Arg Xaa Gly Pro Val Asp Glu Pro Asp Arg Arg Leu Pro Val Arg
145 150 155 160
Asp Arg Arg
(2)SEQ ID NO:70的信息:
(i)序列特征:
(A)长度:344个氨基酸
(B)类型:氨基酸
(C)链型:单链
(D)拓扑结构:线型
(xi)序列描述:SEQ ID NO:70:
Met Lys Phe Val Asn His Ile Glu Pro Val Ala Pro Arg Arg Ala Gly
1 5 10 15
Gly Ala Val Ala Glu Val Tyr Ala Glu Ala Arg Arg Glu Phe Gly Arg
20 25 30
Leu Pro Glu Pro Leu Ala Met Leu Ser Pro Asp Glu Gly Leu Leu Thr
35 40 45
Ala Gly Trp Ala Thr Leu Arg Glu Thr Leu Leu Val Gly Gln Val Pro
50 55 60
Arg Gly Arg Lys Glu Ala Val Ala Ala Ala Val Ala Ala Ser Leu Arg
65 70 75 80
Cys Pro Trp Cys Val Asp Ala His Thr Thr Met Leu Tyr Ala Ala Gly
85 90 95
Gln Thr Asp Thr Ala Ala Ala Ile Leu Ala Gly Thr Ala Pro Ala Ala
100 105 110
Gly Asp Pro Asn Ala Pro Tyr Val Ala Trp Ala Ala Gly Thr Gly Thr
115 120 125
Pro Ala Gly Pro Pro Ala Pro Phe Gly Pro Asp Val Ala Ala Glu Tyr
130 135 140
Leu Gly Thr Ala Val Gln Phe His Phe Ile Ala Arg Leu Val Leu Val
145 150 155 160
Leu Leu Asp Glu Thr Phe Leu Pro Gly Gly Pro Arg Ala Gln Gln Leu
165 170 175
Met Arg Arg Ala Gly Gly Leu Val Phe Ala Arg Lys Val Arg Ala Glu
180 185 190
His Arg Pro Gly Arg Ser Thr Arg Arg Leu Glu Pro Arg Thr Leu Pro
195 200 205
Asp Asp Leu Ala Trp Ala Thr Pro Ser Glu Pro Ile Ala Thr Ala Phe
210 215 220
Ala Ala Leu Ser His His Leu Asp Thr Ala Pro His Leu Pro Pro Pro
225 230 235 240
Thr Arg Gln Val Val Arg Arg Val Val Gly Ser Trp His Gly Glu Pro
245 250 255
Met Pro Met Ser Ser Arg Trp Thr Asn Glu His Thr Ala Glu Leu Pro
260 265 270
Ala Asp Leu His Ala Pro Thr Arg Leu Ala Leu Leu Thr Gly Leu Ala
275 280 285
Pro His Gln Val Thr Asp Asp Asp Val Ala Ala Ala Arg Ser Leu Leu
290 295 300
Asp Thr Asp Ala Ala Leu Val Gly Ala Leu Ala Trp Ala Ala Phe Thr
305 310 315 320
Ala Ala Arg Arg Ile Gly Thr Trp Ile Gly Ala Ala Ala Glu Gly Gln
325 330 335
Val Ser Arg Gln Asn Pro Thr Gly
340
(2)SEQ ID NO:71的信息:
(i)序列特征:
(A)长度:485个氨基酸
(B)类型:氨基酸
(C)链型:单链
(D)拓扑结构:线型
(xi)序列描述:SEQ ID NO:71:
Asp Asp Pro Asp Met Pro Gly Thr Val Ala Lys Ala Val Ala Asp Ala
1 5 10 15
Leu Gly Arg Gly Ile Ala Pro Val Glu Asp Ile Gln Asp Cys Val Glu
20 25 30
Ala Arg Leu Gly Glu Ala Gly Leu Asp Asp Val Ala Arg Val Tyr Ile
35 40 45
Ile Tyr Arg Gln Arg Arg Ala Glu Leu Arg Thr Ala Lys Ala Leu Leu
50 55 60
Gly Val Arg Asp Glu Leu Lys Leu Ser Leu Ala Ala Val Thr Val Leu
65 70 75 80
Arg Glu Arg Tyr Leu Leu His Asp Glu Gln Gly Arg Pro Ala Glu Ser
85 90 95
Thr Gly Glu Leu Met Asp Arg Ser Ala Arg Cys Val Ala Ala Ala Glu
100 105 110
Asp Gln Tyr Glu Pro Gly Ser Ser Arg Arg Trp Ala Glu Arg Phe Ala
115 120 125
Thr Leu Leu Arg Asn Leu Glu Phe Leu Pro Asn Ser Pro Thr Leu Met
130 135 140
Asn Ser Gly Thr Asp Leu Gly Leu Leu Ala Gly Cys Phe Val Leu Pro
145 150 155 160
Ile Glu Asp Ser Leu Gln Ser Ile Phe Ala Thr Leu Gly Gln Ala Ala
165 170 175
Glu Leu Gly Arg Ala Gly Gly Gly Thr Gly Tyr Ala Phe Ser His Leu
180 185 190
Arg Pro Ala Gly Asp Arg Val Ala Ser Thr Gly Gly Thr Ala Ser Gly
195 200 205
Pro Val Ser Phe Leu Arg Leu Tyr Asp Ser Ala Ala Gly Val Val Ser
210 215 220
Met Gly Gly Arg Arg Arg Gly Ala Cys Met Ala Val Leu Asp Val Ser
225 230 235 240
His Pro Asp Ile Cys Asp Phe Val Thr Ala Lys Ala Glu Ser Pro Ser
245 250 255
Glu Leu Pro His Phe Asn Leu Ser Val Gly Val Thr Asp Ala Phe Leu
260 265 270
Arg Ala Val Glu Arg Asn Gly Leu His Arg Leu Val Asn Pro Arg Thr
275 280 285
Gly Lys Ile Val Ala Arg Met Pro Ala Ala Glu Leu Phe Asp Ala Ile
290 295 300
Cys Lys Ala Ala His Ala Gly Gly Asp Pro Gly Leu Val Phe Leu Asp
305 310 315 320
Thr Ile Asn Arg Ala Asn Pro Val Pro Gly Arg Gly Arg Ile Glu Ala
325 330 335
Thr Asn Pro Cys Gly Glu Val Pro Leu Leu Pro Tyr Glu Ser Cys Asn
340 345 350
Leu Gly Ser Ile Asn Leu Ala Arg Met Leu Ala Asp Gly Arg Val Asp
355 360 365
Trp Asp Arg Leu Glu Glu Val Ala Gly Val Ala Val Arg Phe Leu Asp
370 375 380
Asp Val Ile Asp Val Ser Arg Tyr Pro Phe Pro Glu Leu Gly Glu Ala
385 390 395 400
Ala Arg Ala Thr Arg Lys Ile Gly Leu Gly Val Met Gly Leu Ala Glu
405 410 415
Leu Leu Ala Ala Leu Gly Ile Pro Tyr Asp Ser Glu Glu Ala Val Arg
420 425 430
Leu Ala Thr Arg Leu Met Arg Arg Ile Gln Gln Ala Ala His Thr Ala
435 440 445
Ser Arg Arg Leu Ala Glu Glu Arg Gly Ala Phe Pro Ala Phe Thr Asp
450 455 460
Ser Arg Phe Ala Arg Ser Gly Pro Arg Arg Asn Ala Gln Val Thr Ser
465 470 475 480
Val Ala Pro Thr Gly
485
(2)SEQ ID NO:72的信息:
(i)序列特征:
(A)长度:267个氨基酸
(B)类型:氨基酸
(C)链型:单链
(D)拓扑结构:线型
(xi)序列描述:SEQ ID NO:72:
Gly Val Ile Val Leu Asp Leu Glu Pro Arg Gly Pro Leu Pro Thr Glu
1 5 10 15
Ile Tyr Trp Arg Arg Arg Gly Leu Ala Leu Gly Ile Ala Val Val Val
20 25 30
Val Gly Ile Ala Val Ala Ile Val Ile Ala Phe Val Asp Ser Ser Ala
35 40 45
Gly Ala Lys Pro Val Ser Ala Asp Lys Pro Ala Ser Ala Gln Ser His
50 55 60
Pro Gly Ser Pro Ala Pro Gln Ala Pro Gln Pro Ala Gly Gln Thr Glu
65 70 75 80
Gly Asn Ala Ala Ala Ala Pro Pro Gln Gly Gln Asn Pro Glu Thr Pro
85 90 95
Thr Pro Thr Ala Ala Val Gln Pro Pro Pro Val Leu Lys Glu Gly Asp
100 105 110
Asp Cys Pro Asp Ser Thr Leu Ala Val Lys Gly Leu Thr Asn Ala Pro
115 120 125
Gln Tyr Tyr Val Gly Asp Gln Pro Lys Phe Thr Met Val Val Thr Asn
130 135 140
Ile Gly Leu Val Ser Cys Lys Arg Asp Val Gly Ala Ala Val Leu Ala
145 150 155 160
Ala Tyr Val Tyr Ser Leu Asp Asn Lys Arg Leu Trp Ser Asn Leu Asp
165 170 175
Cys Ala Pro Ser Asn Glu Thr Leu Val Lys Thr Phe Ser Pro Gly Glu
180 185 190
Gln Val Thr Thr Ala Val Thr Trp Thr Gly Met Gly Ser Ala Pro Arg
195 200 205
Cys Pro Leu Pro Arg Pro Ala Ile Gly Pro Gly Thr Tyr Asn Leu Val
210 215 220
Val Gln Leu Gly Asn Leu Arg Ser Leu Pro Val Pro Phe Ile Leu Asn
225 230 235 240
Gln Pro Pro Pro Pro Pro Gly Pro Val Pro Ala Pro Gly Pro Ala Gln
245 250 255
Ala Pro Pro Pro Glu Ser Pro Ala Gln Gly Gly
260 265
(2)SEQ ID NO:73的信息:
(i)序列特征:
(A)长度:97个氨基酸
(B)类型:氨基酸
(C)链型:单链
(D)拓扑结构:线型
(xi)序列描述:SEQ ID NO:73:
Leu Ile Ser Thr Gly Lys Ala Ser His Ala Ser Leu Gly Val Gln Val
1 5 10 15
Thr Asn Asp Lys Asp Thr Pro Gly Ala Lys Ile Val Glu Val Val Ala
20 25 30
Gly Gly Ala Ala Ala Asn Ala Gly Val Pro Lys Gly Val Val Val Thr
35 40 45
Lys Val Asp Asp Arg Pro Ile Asn Ser Ala Asp Ala Leu Val Ala Ala
50 55 60
Val Arg Ser Lys Ala Pro Gly Ala Thr Val Ala Leu Thr Phe Gln Asp
65 70 75 80
Pro Ser Gly Gly Ser Arg Thr Val Gln Val Thr Leu Gly Lys Ala Glu
85 90 95
Gln
(2)SEQ ID NO:74的信息:
(i)序列特征:
(A)长度:364个氨基酸
(B)类型:氨基酸
(C)链型:单链
(D)拓扑结构:线型
(xi)序列描述:SEQ ID NO:74:
Gly Ala Ala Val Ser Leu Leu Ala Ala Gly Thr Leu Val Leu Thr Ala
1 5 10 15
Cys Gly Gly Gly Thr Asn Ser Ser Ser Ser Gly Ala Gly Gly Thr Ser
20 25 30
Gly Ser Val His Cys Gly Gly Lys Lys Glu Leu His Ser Ser Gly Ser
35 40 45
Thr Ala Gln Glu Asn Ala Met Glu Gln Phe Val Tyr Ala Tyr Val Arg
50 55 60
Ser Cys Pro Gly Tyr Thr Leu Asp Tyr Asn Ala Asn Gly Ser Gly Ala
65 70 75 80
Gly Val Thr Gln Phe Leu Asn Asn Glu Thr Asp Phe Ala Gly Ser Asp
85 90 95
Val Pro Leu Asn Pro Ser Thr Gly Gln Pro Asp Arg Ser Ala Glu Arg
100 105 110
Cys Gly Ser Pro Ala Trp Asp Leu Pro Thr Val Phe Gly Pro Ile Ala
115 120 125
Ile Thr Tyr Asn Ile Lys Gly Val Ser Thr Leu Asn Leu Asp Gly Pro
130 135 140
Thr Thr Ala Lys Ile Phe Asn Gly Thr Ile Thr Val Trp Asn Asp Pro
145 150 155 160
Gln Ile Gln Ala Leu Asn Ser Gly Thr Asp Leu Pro Pro Thr Pro Ile
165 170 175
Ser Val Ile Phe Arg Ser Asp Lys Ser Gly Thr Ser Asp Asn Phe Gln
180 185 190
Lys Tyr Leu Asp Gly Val Ser Asn Gly Ala Trp Gly Lys Gly Ala Ser
195 200 205
Glu Thr Phe Ser Gly Gly Val Gly Val Gly Ala Ser Gly Asn Asn Gly
210 215 220
Thr Ser Ala Leu Leu Gln Thr Thr Asp Gly Ser Ile Thr Tyr Asn Glu
225 230 235 240
Trp Ser Phe Ala Val Gly Lys Gln Leu Asn Met Ala Gln Ile Ile Thr
245 250 255
Ser Ala Gly Pro Asp Pro Val Ala Ile Thr Thr Glu Ser Val Gly Lys
260 265 270
Thr Ile Ala Gly Ala Lys Ile Met Gly Gln Gly Asn Asp Leu Val Leu
275 280 285
Asp Thr Ser Ser Phe Tyr Arg Pro Thr Gln Pro Gly Ser Tyr Pro Ile
290 295 300
Val Leu Ala Thr Tyr Glu Ile Val Cys Ser Lys Tyr Pro Asp Ala Thr
305 310 315 320
Thr Gly Thr Ala Val Arg Ala Phe Met Gln Ala Ala Ile Gly Pro Gly
325 330 335
Gln Glu Gly Leu Asp Gln Tyr Gly Ser Ile Pro Leu Pro Lys Ser Phe
340 345 350
Gln Ala Lys Leu Ala Ala Ala Val Asn Ala Ile Ser
355 360
(2)SEQ ID NO:75的信息:
(i)序列特征:
(A)长度:309个氨基酸
(B)类型:氨基酸
(C)链型:单链
(D)拓扑结构:线型
(xi)序列描述:SEQ ID NO:75:
Gln Ala Ala Ala Gly Arg Ala Val Arg Arg Thr Gly His Ala Glu Asp
1 5 10 15
Gln Thr His Gln Asp Arg Leu His His Gly Cys Arg Arg Ala Ala Val
20 25 30
Val Val Arg Gln Asp Arg Ala Ser Val Ser Ala Thr Ser Ala Arg Pro
35 40 45
Pro Arg Arg His Pro Ala Gln Gly His Arg Arg Arg Val Ala Pro Ser
50 55 60
Gly Gly Arg Arg Arg Pro His Pro His His Val Gln Pro Asp Asp Arg
65 70 75 80
Arg Asp Arg Pro Ala Leu Leu Asp Arg Thr Gln Pro Ala Glu His Pro
85 90 95
Asp Pro His Arg Arg Gly Pro Ala Asp Pro Gly Arg Val Arg Gly Arg
100 105 110
Gly Arg Leu Arg Arg Val Asp Asp Gly Arg Leu Gln Pro Asp Arg Asp
115 120 125
Ala Asp His Gly Ala Pro Val Arg Gly Arg Gly Pro His Arg Gly Val
130 135 140
Gln His Arg Gly Gly Pro Val Phe Val Arg Arg Val Pro Gly Val Arg
145 150 155 160
Cys Ala His Arg Arg Gly His Arg Arg Val Ala Ala Pro Gly Gln Gly
165 170 175
Asp Val Leu Arg Ala Gly Leu Arg Val Glu Arg Leu Arg Pro Val Ala
180 185 190
Ala Val Glu Asn Leu His Arg Gly Ser Gln Arg Ala Asp Gly Arg Val
195 200 205
Phe Arg Pro Ile Arg Arg Gly Ala Arg Leu Pro Ala Arg Arg Ser Arg
210 215 220
Ala Gly Pro Gln Gly Arg Leu His Leu Asp Gly Ala Gly Pro Ser Pro
225 230 235 240
Leu Pro Ala Arg Ala Gly Gln Gln Gln Pro Ser Ser Ala Gly Gly Arg
245 250 255
Arg Ala Gly Gly Ala Glu Arg Ala Asp Pro Gly Gln Arg Gly Arg His
260 265 270
His Gln Gly Gly His Asp Pro Gly Arg Gln Gly Ala Gln Arg Gly Thr
275 280 285
Ala Gly Val Ala His Ala Ala Ala Gly Pro Arg Arg Ala Ala Val Arg
290 295 300
Asn Arg Pro Arg Arg
305
(2)SEQ ID NO:76的信息:
(i)序列特征:
(A)长度:580个氨基酸
(B)类型:氨基酸
(C)链型:单链
(D)拓扑结构:线型
(xi)序列描述:SEQ ID NO:76:
Ser Ala Val Trp Cys Leu Asn Gly Phe Thr Gly Arg His Arg His Gly
1 5 10 15
Arg Cys Arg Val Arg Ala Ser Gly Trp Arg Ser Ser Asn Arg Trp Cys
20 25 20
Ser Thr Thr Ala Asp Cys Cys Ala Ser Lys Thr Pro Thr Gln Ala Ala
35 40 45
Ser Pro Leu Glu Arg Arg Phe Thr Cys Cys Ser Pro Ala Val Gly Cys
50 55 60
Arg Phe Arg Ser Phe Pro Val Arg Arg Leu Ala Leu Gly Ala Arg Thr
65 70 75 80
Ser Arg Thr Leu Gly Val Arg Arg Thr Leu Ser Gln Trp Asn Leu Ser
85 90 95
Pro Arg Ala Gln Pro Ser Cys Ala Val Thr Val Glu Ser His Thr His
100 105 110
Ala Ser Pro Arg Met Ala Lys Leu Ala Arg Val Val Gly Leu Val Gln
115 120 125
Glu Glu Gln Pro Ser Asp Met Thr Asn His Pro Arg Tyr Ser Pro Pro
130 135 140
Pro Gln Gln Pro Gly Thr Pro Gly Tyr Ala Gln Gly Gln Gln Gln Thr
145 150 155 160
Tyr Ser Gln Gln Phe Asp Trp Arg Tyr Pro Pro Ser Pro Pro Pro Gln
165 170 175
Pro Thr Gln Tyr Arg Gln Pro Tyr Glu Ala Leu Gly Gly Thr Arg Pro
180 185 190
Gly Leu Ile Pro Gly Val Ile Pro Thr Met Thr Pro Pro Pro Gly Met
195 200 205
Val Arg Gln Arg Pro Arg Ala Gly Met Leu Ala Ile Gly Ala Val Thr
210 215 220
Ile Ala Val Val Ser Ala Gly Ile Gly Gly Ala Ala Ala Ser Leu Val
225 230 235 240
Gly Phe Asn Arg Ala Pro Ala Gly Pro Ser Gly Gly Pro Val Ala Ala
245 250 255
Ser Ala Ala Pro Ser Ile Pro Ala Ala Asn Met Pro Pro Gly Ser Val
260 265 270
Glu Gln Val Ala Ala Lys Val Val Pro Ser Val Val Met Leu Glu Thr
275 280 285
Asp Leu Gly Arg Gln Ser Glu Glu Gly Ser Gly Ile Ile Leu Ser Ala
290 295 300
Glu Gly Leu Ile Leu Thr Asn Asn His Val Ile Ala Ala Ala Ala Lys
305 310 315 320
Pro Pro Leu Gly Ser Pro Pro Pro Lys Thr Thr Val Thr Phe Ser Asp
325 330 335
Gly Arg Thr Ala Pro Phe Thr Val Val Gly Ala Asp Pro Thr Ser Asp
340 345 350
Ile Ala Val Val Arg Val Gln Gly Val Ser Gly Leu Thr Pro Ile Ser
355 360 365
Leu Gly Ser Ser Ser Asp Leu Arg Val Gly Gln Pro Val Leu Ala Ile
370 375 380
Gly Ser Pro Leu Gly Leu Glu Gly Thr Val Thr Thr Gly Ile Val Ser
385 390 395 400
Ala Leu Asn Arg Pro Val Ser Thr Thr Gly Glu Ala Gly Asn Gln Asn
405 410 415
Thr Val Leu Asp Ala Ile Gln Thr Asp Ala Ala Ile Asn Pro Gly Asn
420 425 430
Ser Gly Gly Ala Leu Val Asn Met Asn Ala Gln Leu Val Gly Val Asn
435 440 445
Ser Ala Ile Ala Thr Leu Gly Ala Asp Ser Ala Asp Ala Gln Ser Gly
450 455 460
Ser Ile Gly Leu Gly Phe Ala Ile Pro Val Asp Gln Ala Lys Arg Ile
465 470 475 480
Ala Asp Glu Leu Ile Ser Thr Gly Lys Ala Ser His Ala Ser Leu Gly
485 490 495
Val Gln Val Thr Asn Asp Lys Asp Thr Pro Gly Ala Lys Ile Val Glu
500 505 510
Val Val Ala Gly Gly Ala Ala Ala Asn Ala Gly Val Pro Lys Gly Val
515 520 525
Val Val Thr Lys Val Asp Asp Arg Pro Ile Asn Ser Ala Asp Ala Leu
530 535 540
Val Ala Ala Val Arg Ser Lys Ala Pro Gly Ala Thr Val Ala Leu Thr
545 550 555 560
Phe Gln Asp Pro Ser Gly Gly Ser Arg Thr Val Gln Val Thr Leu Gly
565 570 575
Lys Ala Glu Gln
580
(2)SEQ ID NO:77的信息:
(i)序列特征:
(A)长度:233个氨基酸
(B)类型:氨基酸
(C)链型:单链
(D)拓扑结构:线型
(xi)序列描述:SEQ ID NO:77:
Met Asn Asp Gly Lys Arg Ala Val Thr Ser Ala Val Leu Val Val Leu
1 5 10 15
Gly Ala Cys Leu Ala Leu Trp Leu Ser Gly Cys Ser Ser Pro Lys Pro
20 25 30
Asp Ala Glu Glu Gln Gly Val Pro Val Ser Pro Thr Ala Ser Asp Pro
35 40 45
Ala Leu Leu Ala Glu Ile Arg Gln Ser Leu Asp Ala Thr Lys Gly Leu
50 55 60
Thr Ser Val His Val Ala Val Arg Thr Thr Gly Lys Val Asp Ser Leu
65 70 75 80
Leu Gly Ile Thr Ser Ala Asp Val Asp Val Arg Ala Asn Pro Leu Ala
85 90 95
Ala Lys Gly Val Cys Thr Tyr Asn Asp Glu Gln Gly Val Pro Phe Arg
100 105 110
Val Gln Gly Asp Asn Ile Ser Val Lys Leu Phe Asp Asp Trp Ser Asn
115 120 125
Leu Gly Ser Ile Ser Glu Leu Ser Thr Ser Arg Val Leu Asp Pro Ala
130 135 140
Ala Gly Val Thr Gln Leu Leu Ser Gly Val Thr Asn Leu Gln Ala Gln
145 150 155 160
Gly Thr Glu Val Ile Asp Gly Ile Ser Thr Thr Lys Ile Thr Gly Thr
165 170 175
Ile Pro Ala Ser Ser Val Lys Met Leu Asp Pro Gly Ala Lys Ser Ala
180 185 190
Arg Pro Ala Thr Val Trp Ile Ala Gln Asp Gly Ser His His Leu Val
195 200 205
Arg Ala Ser Ile Asp Leu Gly Ser Gly Ser Ile Gln Leu Thr Gln Ser
210 215 220
Lys Trp Asn Glu Pro Val Asn Val Asp
225 230
(2)SEQ ID NO:78的信息:
(i)序列特征:
(A)长度:66个氨基酸
(B)类型:氨基酸
(C)链型:单链
(D)拓扑结构:线型
(xi)序列描述:SEQ ID NO:78:
Val Ile Asp Ile Ile Gly Thr Ser Pro Thr Ser Trp Glu Gln Ala Ala
1 5 10 15
Ala Glu Ala Val Gln Arg Ala Arg Asp Ser Val Asp Asp Ile Arg Val
20 25 30
Ala Arg Val Ile Glu Gln Asp Met Ala Val Asp Ser Ala Gly Lys Ile
35 40 45
Thr Tyr Arg Ile Lys Leu Glu Val Ser Phe Lys Met Arg Pro Ala Gln
50 55 60
Pro Arg
65
(2)SEQ ID NO:79的信息:
(i)序列特征:
(A)长度:69个氨基酸
(B)类型:氨基酸
(C)链型:单链
(D)拓扑结构:线型
(xi)序列描述:SEQ ID NO:79:
Val Pro Pro Ala Pro Pro Leu Pro Pro Leu Pro Pro Ser Pro Ile Ser
1 5 10 15
Cys Ala Ser Pro Pro Ser Pro Pro Leu Pro Pro Ala Pro Pro Val Ala
20 25 30
Pro Gly Pro Pro Met Pro Pro Leu Asp Pro Trp Pro Pro Ala Pro Pro
35 40 45
Leu Pro Tyr Ser Thr Pro Pro Gly Ala Pro Leu Pro Pro Ser Pro Pro
50 55 60
Ser Pro Pro Leu Pro
65
(2)SEQ ID NO:80的信息:
(i)序列特征:
(A)长度:355个氨基酸
(B)类型:氨基酸
(C)链型:单链
(D)拓扑结构:线型
(xi)序列描述:SEQ ID NO:80:
Met Ser Asn Ser Arg Arg Arg Ser Leu Arg Trp Ser Trp Leu Leu Ser
1 5 10 15
Val Leu Ala Ala Val Gly Leu Gly Leu Ala Thr Ala Pro Ala Gln Ala
20 25 30
Ala Pro Pro Ala Leu Ser Gln Asp Arg Phe Ala Asp Phe Pro Ala Leu
35 40 45
Pro Leu Asp Pro Ser Ala Met Val Ala Gln Val Ala Pro Gln Val Val
50 55 60
Asn Ile Asn Thr Lys Leu Gly Tyr Asn Asn Ala Val Gly Ala Gly Thr
65 70 75 80
Gly Ile Val Ile Asp Pro Asn Gly Val Val Leu Thr Asn Asn His Val
85 90 95
Ile Ala Gly Ala Thr Asp Ile Asn Ala Phe Ser Val Gly Ser Gly Gln
100 105 110
Thr Tyr Gly Val Asp Val Val Gly Tyr Asp Arg Thr Gln Asp Val Ala
115 120 125
Val Leu Gln Leu Arg Gly Ala Gly Gly Leu Pro Ser Ala Ala Ile Gly
130 135 140
Gly Gly Val Ala Val Gly Glu Pro Val Val Ala Met Gly Asn Ser Gly
145 150 155 160
Gly Gln Gly Gly Thr Pro Arg Ala Val Pro Gly Arg Val Val Ala Leu
165 170 175
Gly Gln Thr Val Gln Ala Ser Asp Ser Leu Thr Gly Ala Glu Glu Thr
180 185 190
Leu Asn Gly Leu Ile Gln Phe Asp Ala Ala Ile Gln Pro Gly Asp Ser
195 200 205
Gly Gly Pro Val Val Asn Gly Leu Gly Gln Val Val Gly Met Asn Thr
210 215 220
Ala Ala Ser Asp Asn Phe Gln Leu Ser Gln Gly Gly Gln Gly Phe Ala
225 230 235 240
Ile Pro Ile Gly Gln Ala Met Ala Ile Ala Gly Gln Ile Arg Ser Gly
245 250 255
Gly Gly Ser Pro Thr Val His Ile Gly Pro Thr Ala Phe Leu Gly Leu
260 265 270
Gly Val Val Asp Asn Asn Gly Asn Gly Ala Arg Val Gln Arg Val Val
275 280 285
Gly Ser Ala Pro Ala Ala Ser Leu Gly Ile Ser Thr Gly Asp Val Ile
290 295 300
Thr Ala Val Asp Gly Ala Pro Ile Asn Ser Ala Thr Ala Met Ala Asp
305 310 315 320
Ala Leu Asn Gly His His Pro Gly Asp Val Ile Ser Val Asn Trp Gln
325 330 335
Thr Lys Ser Gly Gly Thr Arg Thr Gly Asn Val Thr Leu Ala Glu Gly
340 345 350
Pro Pro Ala
355
(2)SEQ ID NO:81的信息:
(i)序列特征:
(A)长度:205个氨基酸
(B)类型:氨基酸
(C)链型:单链
(D)拓扑结构:线型
(xi)序列描述:SEQ ID NO:81:
Ser Pro Lys Pro Asp Ala Glu Glu Gln Gly Val Pro Val Ser Pro Thr
1 5 10 15
Ala Ser Asp Pro Ala Leu Leu Ala Glu Ile Arg Gln Ser Leu Asp Ala
20 25 30
Thr Lys Gly Leu Thr Ser Val His Val Ala Val Arg Thr Thr Gly Lys
35 40 45
Val Asp Ser Leu Leu Gly Ile Thr Ser Ala Asp Val Asp Val Arg Ala
50 55 60
Asn Pro Leu Ala Ala Lys Gly Val Cys Thr Tyr Asn Asp Glu Gln Gly
65 70 75 80
Val Pro Phe Arg Val Gln Gly Asp Asn Ile Ser Val Lys Leu Phe Asp
85 90 95
Asp Trp Ser Asn Leu Gly Ser Ile Ser Glu Leu Ser Thr Ser Arg Val
100 105 110
Leu Asp Pro Ala Ala Gly Val Thr Gln Leu Leu Ser Gly Val Thr Asn
115 120 125
Leu Gln Ala Gln Gly Thr Glu Val Ile Asp Gly Ile Ser Thr Thr Lys
130 135 140
Ile Thr Gly Thr Ile Pro Ala Ser Ser Val Lys Met Leu Asp Pro Gly
145 150 155 160
Ala Lys Ser Ala Arg Pro Ala Thr Val Trp Ile Ala Gln Asp Gly Ser
165 170 175
His His Leu Val Arg Ala Ser Ile Asp Leu Gly Ser Gly Ser Ile Gln
180 185 190
Leu Thr Gln Ser Lys Trp Asn Glu Pro Val Asn Val Asp
195 200 205
(2)SEQ ID NO:82的信息:
(i)序列特征:
(A)长度:286个氨基酸
(B)类型:氨基酸
(C)链型:单链
(D)拓扑结构:线型
(xi)序列描述:SEQ ID NO:82:
Gly Asp Ser Phe Trp Ala Ala Ala Asp Gln Met Ala Arg Gly Phe Val
1 5 10 15
Leu Gly Ala Thr Ala Gly Arg Thr Thr Leu Thr Gly Glu Gly Leu Gln
20 25 30
His Ala Asp Gly His Ser Leu Leu Leu Asp Ala Thr Asn Pro Ala Val
35 40 45
Val Ala Tyr Asp Pro Ala Phe Ala Tyr Glu Ile Gly Tyr Ile Xaa Glu
50 55 60
Ser Gly Leu Ala Arg Met Cys Gly Glu Asn Pro Glu Asn Ile Phe Phe
65 70 75 80
Tyr Ile Thr Val Tyr Asn Glu Pro Tyr Val Gln Pro Pro Glu Pro Glu
85 90 95
Asn Phe Asp Pro Glu Gly Val Leu Gly Gly Ile Tyr Arg Tyr His Ala
100 105 110
Ala Thr Glu Gln Arg Thr Asn Lys Xaa Gln Ile Leu Ala Ser Gly Val
115 120 125
Ala Met Pro Ala Ala Leu Arg Ala Ala Gln Met Leu Ala Ala Glu Trp
130 135 140
Asp Val Ala Ala Asp Val Trp Ser Val Thr Ser Trp Gly Glu Leu Asn
145 150 155 160
Arg Asp Gly Val Val Ile Glu Thr Glu Lys Leu Arg His Pro Asp Arg
165 170 175
Pro Ala Gly Val Pro Tyr Val Thr Arg Ala Leu Glu Asn Ala Arg Gly
180 185 190
Pro Val Ile Ala Val Ser Asp Trp Met Arg Ala Val Pro Glu Gln Ile
195 200 205
Arg Pro Trp Val Pro Gly Thr Tyr Leu Thr Leu Gly Thr Asp Gly Phe
210 215 220
Gly Phe Ser Asp Thr Arg Pro Ala Gly Arg Arg Tyr Phe Asn Thr Asp
225 230 235 240
Ala Glu Ser Gln Val Gly Arg Gly Phe Gly Arg Gly Trp Pro Gly Arg
245 250 255
Arg Val Asn Ile Asp Pro Phe Gly Ala Gly Arg Gly Pro Pro Ala Gln
260 265 270
Leu Pro Gly Phe Asp Glu Gly Gly Gly Leu Arg Pro Xaa Lys
275 280 285
(2)SEQ ID NO:83的信息:
(i)序列特征:
(A)长度:173个氨基酸
(B)类型:氨基酸
(C)链型:单链
(D)拓扑结构:线型
(xi)序列描述:SEQ ID NO:83:
Thr Lys Phe His Ala Leu Met Gln Glu Gln Ile His Asn Glu Phe Thr
1 5 10 15
Ala Ala Gln Gln Tyr Val Ala Ile Ala Val Tyr Phe Asp Ser Glu Asp
20 25 30
Leu Pro Gln Leu Ala Lys His Phe Tyr Ser Gln Ala Val Glu Glu Arg
35 40 45
Asn His Ala Met Met Leu Val Gln His Leu Leu Asp Arg Asp Leu Arg
50 55 60
Val Glu Ile Pro Gly Val Asp Thr Val Arg Asn Gln Phe Asp Arg Pro
65 70 75 80
Arg Glu Ala Leu Ala Leu Ala Leu Asp Gln Glu Arg Thr Val Thr Asp
85 90 95
Gln Val Gly Arg Leu Thr Ala Val Ala Arg Asp Glu Gly Asp Phe Leu
100 105 110
Gly Glu Gln Phe Met Gln Trp Phe Leu Gln Glu Gln Ile Glu Glu Val
115 120 125
Ala Leu Met Ala Thr Leu Val Arg Val Ala Asp Arg Ala Gly Ala Asn
130 135 140
Leu Phe Glu Leu Glu Asn Phe Val Ala Arg Glu Val Asp Val Ala Pro
145 150 155 160
Ala Ala Ser Gly Ala Pro His Ala Ala Gly Gly Arg Leu
165 170
(2)SEQ ID NO:84的信息:
(i)序列特征:
(A)长度:107个氨基酸
(B)类型:氨基酸
(C)链型:单链
(D)拓扑结构:线型
(xi)序列描述:SEQ ID NO:84:
Arg Ala Asp Glu Arg Lys Asn Thr Thr Met Lys Met Val Lys Ser Ile
1 5 10 15
Ala Ala Gly Leu Thr Ala Ala Ala Ala Ile Gly Ala Ala Ala Ala Gly
20 25 30
Val Thr Ser Ile Met Ala Gly Gly Pro Val Val Tyr Gln Met Gln Pro
35 40 45
Val Val Phe Gly Ala Pro Leu Pro Leu Asp Pro Xaa Ser Ala Pro Xaa
50 55 60
Val Pro Thr Ala Ala Gln Trp Thr Xaa Leu Leu Asn Xaa Leu Xaa Asp
65 70 75 80
Pro Asn Val Ser Phe Xaa Asn Lys Gly Ser Leu Val Glu Gly Gly Ile
85 90 95
Gly Gly Xaa Glu Gly Xaa Xaa Arg Arg Xaa Gln
100 105
(2)SEQ ID NO:85的信息:
(i)序列特征:
(A)长度:125个氨基酸
(B)类型:氨基酸
(C)链型:单链
(D)拓扑结构:线型
(xi)序列描述:SEQ ID NO:85:
Val Leu Ser Val Pro Val Gly Asp Gly Phe Trp Xaa Arg Val Val Asn
1 5 10 15
Pro Leu Gly Gln Pro Ile Asp Gly Arg Gly Asp Val Asp Ser Asp Thr
20 25 30
Arg Arg Ala Leu Glu Leu Gln Ala Pro Ser Val Val Xaa Arg Gln Gly
35 40 45
Val Lys Glu Pro Leu Xaa Thr Gly Ile Lys Ala Ile Asp Ala Met Thr
50 55 60
Pro Ile Gly Arg Gly Gln Arg Gln Leu Ile Ile Gly Asp Arg Lys Thr
65 70 75 80
Gly Lys Asn Arg Arg Leu Cys Arg Thr Pro Ser Ser Asn Gln Arg Glu
85 90 95
Glu Leu Gly Val Arg Trp Ile Pro Arg Ser Arg Cys Ala Cys Val Tyr
100 105 110
Val Gly His Arg Ala Arg Arg Gly Thr Tyr His Arg Arg
115 120 125
(2)SEQ ID NO:86的信息:
(i)序列特征:
(A)长度:117个氨基酸
(B)类型:氨基酸
(C)链型:单链
(D)拓扑结构:线型
(xi)序列描述:SEQ ID NO:86:
Cys Asp Ala Val Met Gly Phe Leu Gly Gly Ala Gly Pro Leu Ala Val
1 5 10 15
Val Asp Gln Gln Leu Val Thr Arg Val Pro Gln Gly Trp Ser Phe Ala
20 25 30
Gln Ala Ala Ala Val Pro Val Val Phe Leu Thr Ala Trp Tyr Gly Leu
35 40 45
Ala Asp Leu Ala Glu Ile Lys Ala Gly Glu Ser Val Leu Ile His Ala
50 55 60
Gly Thr Gly Gly Val Gly Met Ala Ala Val Gln Leu Ala Arg Gln Trp
65 70 75 80
Gly Val Glu Val Phe Val Thr Ala Ser Arg Gly Lys Trp Asp Thr Leu
85 90 95
Arg Ala Xaa Xaa Phe Asp Asp Xaa Pro Tyr Arg Xaa Phe Pro His Xaa
100 105 110
Arg Ser Ser Xaa Gly
115
(2)SEQ ID NO:87的信息:
(i)序列特征:
(A)长度:103个氨基酸
(B)类型:氨基酸
(C)链型:单链
(D)拓扑结构:线型
(xi)序列描述:SEQ ID NO:87:
Met Tyr Arg Phe Ala Cys Arg Thr Leu Met Leu Ala Ala Cys Ile Leu
1 5 10 15
Ala Thr Gly Val Ala Gly Leu Gly Val Gly Ala Gln Ser Ala Ala Gln
20 25 30
Thr Ala Pro Val Pro Asp Tyr Tyr Trp Cys Pro Gly Gln Pro Phe Asp
35 40 45
Pro Ala Trp Gly Pro Asn Trp Asp Pro Tyr Thr Cys His Asp Asp Phe
50 55 60
His Arg Asp Ser Asp Gly Pro Asp His Ser Arg Asp Tyr Pro Gly Pro
65 70 75 80
Ile Leu Glu Gly Pro Val Leu Asp Asp Pro Gly Ala Ala Pro Pro Pro
85 90 95
Pro Ala Ala Gly Gly Gly Ala
100
(2)SEQ ID NO:88的信息:
(i)序列特征:
(A)长度:88个氨基酸
(B)类型:氨基酸
(C)链型:单链
(D)拓扑结构:线型
(xi)序列描述:SEQ ID NO:88:
Val Gln Cys Arg Val Trp Leu Glu Ile Gln Trp Arg Gly Met Leu Gly
1 5 10 15
Ala Asp Gln Ala Arg Ala Gly Gly Pro Ala Arg Ile Trp Arg Glu His
20 25 30
Ser Met Ala Ala Met Lys Pro Arg Thr Gly Asp Gly Pro Leu Glu Ala
35 40 45
Thr Lys Glu Gly Arg Gly Ile Val Met Arg Val Pro Leu Glu Gly Gly
50 55 60
Gly Arg Leu Val Val Glu Leu Thr Pro Asp Glu Ala Ala Ala Leu Gly
65 70 75 80
Asp Glu Leu Lys Gly Val Thr Ser
85
(2)SEQ ID NO:89的信息:
(i)序列特征:
(A)长度:95个氨基酸
(B)类型:氨基酸
(C)链型:单链
(D)拓扑结构:线型
(xi)序列描述:SEQ ID NO:89:
Thr Asp Ala Ala Thr Leu Ala Gln Glu Ala Gly Asn Phe Glu Arg Ile
1 5 10 15
Ser Gly Asp Leu Lys Thr Gln Ile Asp Gln Val Glu Ser Thr Ala Gly
20 25 30
Ser Leu Gln Gly Gln Trp Arg Gly Ala Ala Gly Thr Ala Ala Gln Ala
35 40 45
Ala Val Val Arg Phe Gln Glu Ala Ala Asn Lys Gln Lys Gln Glu Leu
50 55 60
Asp Glu Ile Ser Thr Asn Ile Arg Gln Ala Gly Val Gln Tyr Ser Arg
65 70 75 80
Ala Asp Glu Glu Gln Gln Gln Ala Leu Ser Ser Gln Met Gly Phe
85 90 95
(2)SEQ ID NO:90的信息:
(i)序列特征:
(A)长度:166个氨基酸
(B)类型:氨基酸
(C)链型:单链
(D)拓扑结构:线型
(xi)序列描述:SEQ ID NO:90:
Met Thr Gln Ser Gln Thr Val Thr Val Asp Gln Gln Glu Ile Leu Asn
1 5 10 15
Arg Ala Asn Glu Val Glu Ala Pro Met Ala Asp Pro Pro Thr Asp Val
20 25 30
Pro Ile Thr Pro Cys Glu Leu Thr Xaa Xaa Lys Asn Ala Ala Gln Gln
35 40 45
Xaa Val Leu Ser Ala Asp Asn Met Arg Glu Tyr Leu Ala Ala Gly Ala
50 55 60
Lys Glu Arg Gln Arg Leu Ala Thr Ser Leu Arg Asn Ala Ala Lys Xaa
65 70 75 80
Tyr Gly Glu Val Asp Glu Glu Ala Ala Thr Ala Leu Asp Asn Asp Gly
85 90 95
Glu Gly Thr Val Gln Ala Glu Ser Ala Gly Ala Val Gly Gly Asp Ser
100 105 110
Ser Ala Glu Leu Thr Asp Thr Pro Arg Val Ala Thr Ala Gly Glu Pro
115 120 125
Asn Phe Met Asp Leu Lys Glu Ala Ala Arg Lys Leu Glu Thr Gly Asp
130 135 140
Gln Gly Ala Ser Leu Ala His Xaa Gly Asp Gly Trp Asn Thr Xaa Thr
145 150 155 160
Leu Thr Leu Gln Gly Asp
165
(2)SEQ ID NO:91的信息:
(i)序列特征:
(A)长度:5个氨基酸
(B)类型:氨基酸
(C)链型:单链
(D)拓扑结构:线型
(xi)序列描述:SEQ ID NO:91:
Arg Ala Glu Arg Met
1 5
(2)SEQ ID NO:92的信息:
(i)序列特征:
(A)长度:263个氨基酸
(B)类型:氨基酸
(C)链型:单链
(D)拓扑结构:线型
(xi)序列描述:SEQ ID NO:92:
Val Ala Trp Met Ser Val Thr Ala Gly Gln Ala Glu Leu Thr Ala Ala
1 5 10 15
Gln Val Arg Val Ala Ala Ala Ala Tyr Glu Thr Ala Tyr Gly Leu Thr
20 25 30
Val Pro Pro Pro Val Ile Ala Glu Asn Arg Ala Glu Leu Met Ile Leu
35 40 45
Ile Ala Thr Asn Leu Leu Gly Gln Asn Thr Pro Ala Ile Ala Val Asn
50 55 60
Glu Ala Glu Tyr Gly Glu Met Trp Ala Gln Asp Ala Ala Ala Met Phe
65 70 75 80
Gly Tyr Ala Ala Ala Thr Ala Thr Ala Thr Ala Thr Leu Leu Pro Phe
85 90 95
Glu Glu Ala Pro Glu Met Thr Ser Ala Gly Gly Leu Leu Glu Gln Ala
100 105 110
Ala Ala Val Glu Glu Ala Ser Asp Thr Ala Ala Ala Asn Gln Leu Met
115 120 125
Asn Asn Val Pro Gln Ala Leu Lys Gln Leu Ala Gln Pro Thr Gln Gly
130 135 140
Thr Thr Pro Ser Ser Lys Leu Gly Gly Leu Trp Lys Thr Val Ser Pro
145 150 155 160
His Arg Ser Pro Ile Ser Asn Met Val Ser Met Ala Asn Asn His Met
165 170 175
Ser Met Thr Asn Ser Gly Val Ser Met Thr Asn Thr Leu Ser Ser Met
180 185 190
Leu Lys Gly Phe Ala Pro Ala Ala Ala Ala Gln Ala Val Gln Thr Ala
195 200 205
Ala Gln Asn Gly Val Arg Ala Met Ser Ser Leu Gly Ser Ser Leu Gly
210 215 220
Ser Ser Gly Leu Gly Gly Gly Val Ala Ala Asn Leu Gly Arg Ala Ala
225 230 235 240
Ser Val Arg Tyr Gly His Arg Asp Gly Gly Lys Tyr Ala Xaa Ser Gly
245 250 255
Arg Arg Asn Gly Gly Pro Ala
260
(2)SEQ ID NO:93的信息:
(i)序列特征:
(A)长度:303个氨基酸
(B)类型:氨基酸
(C)链型:单链
(D)拓扑结构:线型
(xi)序列描述:SEQ ID NO:93:
Met Thr Tyr Ser Pro Gly Asn Pro Gly Tyr Pro Gln Ala Gln Pro Ala
1 5 10 15
Gly Ser Tyr Gly Gly Val Thr Pro Ser Phe Ala His Ala Asp Glu Gly
20 25 30
Ala Ser Lys Leu Pro Met Tyr Leu Asn Ile Ala Val Ala Val Leu Gly
35 40 45
Leu Ala Ala Tyr Phe Ala Ser Phe Gly Pro Met Phe Thr Leu Ser Thr
50 55 60
Glu Leu Gly Gly Gly Asp Gly Ala Val Ser Gly Asp Thr Gly Leu Pro
65 70 75 80
Val Gly Val Ala Leu Leu Ala Ala Leu Leu Ala Gly Val Val Leu Val
85 90 95
Pro Lys Ala Lys Ser His Val Thr Val Val Ala Val Leu Gly Val Leu
100 105 110
Gly Val Phe Leu Met Val Ser Ala Thr Phe Asn Lys Pro Ser Ala Tyr
115 120 125
Ser Thr Gly Trp Ala Leu Trp Val Val Leu Ala Phe Ile Val Phe Gln
130 135 140
Ala Val Ala Ala Val Leu Ala Leu Leu Val Glu Thr Gly Ala Ile Thr
145 150 155 160
Ala Pro Ala Pro Arg Pro Lys Phe Asp Pro Tyr Gly Gln Tyr Gly Arg
165 170 175
Tyr Gly Gln Tyr Gly Gln Tyr Gly Val Gln Pro Gly Gly Tyr Tyr Gly
180 185 190
Gln Gln Gly Ala Gln Gln Ala Ala Gly Leu Gln Ser Pro Gly Pro Gln
195 200 205
Gln Ser Pro Gln Pro Pro Gly Tyr Gly Ser Gln Tyr Gly Gly Tyr Ser
210 215 220
Ser Ser Pro Ser Gln Ser Gly Ser Gly Tyr Thr Ala Gln Pro Pro Ala
225 230 235 240
Gln Pro Pro Ala Gln Ser Gly Ser Gln Gln Ser His Gln Gly Pro Ser
245 250 255
Thr Pro Pro Thr Gly Phe Pro Ser Phe Ser Pro Pro Pro Pro Val Ser
260 265 270
Ala Gly Thr Gly Ser Gln Ala Gly Ser Ala Pro Val Asn Tyr Ser Asn
275 280 285
Pro Ser Gly Gly Glu Gln Ser Ser Ser Pro Gly Gly Ala Pro Val
290 295 300
(2)SEQ ID NO:94的信息:
(i)序列特征:
(A)长度:168个氨基酸
(B)类型:氨基酸
(C)链型:单链
(D)拓扑结构:线型
(xi)序列描述:SEQ ID NO:94:
Met Lys Met Val Lys Ser Ile Ala Ala Gly Leu Thr Ala Ala Ala Ala
1 5 10 15
Ile Gly Ala Ala Ala Ala Gly Val Thr Ser Ile Met Ala Gly Gly Pro
20 25 30
Val Val Tyr Gln Met Gln Pro Val Val Phe Gly Ala Pro Leu Pro Leu
35 40 45
Asp Pro Ala Ser Ala Pro Asp Val Pro Thr Ala Ala Gln Leu Thr Ser
50 55 60
Leu Leu Asn Ser Leu Ala Asp Pro Asn Val Ser Phe Ala Asn Lys Gly
65 70 75 80
Ser Leu Val Glu Gly Gly Ile Gly Gly Thr Glu Ala Arg Ile Ala Asp
85 90 95
His Lys Leu Lys Lys Ala Ala Glu His Gly Asp Leu Pro Leu Ser Phe
100 105 110
Ser Val Thr Asn Ile Gln Pro Ala Ala Ala Gly Ser Ala Thr Ala Asp
115 120 125
Val Ser Val Ser Gly Pro Lys Leu Ser Ser Pro Val Thr Gln Asn Val
130 135 140
Thr Phe Val Asn Gln Gly Gly Trp Met Leu Ser Arg Ala Ser Ala Met
145 150 155 160
Glu Leu Leu Gln Ala Ala Gly Asn
165
(2)SEQ ID NO:95的信息:
(i)序列特征:
(A)长度:332个氨基酸
(B)类型:氨基酸
(C)链型:单链
(D)拓扑结构:线型
(xi)序列描述:SEQ ID NO:95:
Met His His His His His His Met His Gln Val Asp Pro Asn Leu Thr
1 5 10 15
Arg Arg Lys Gly Arg Leu Ala Ala Leu Ala Ile Ala Ala Met Ala Ser
20 25 30
Ala Ser Leu Val Thr Val Ala Val Pro Ala Thr Ala Asn Ala Asp Pro
35 40 45
Glu Pro Ala Pro Pro Val Pro Thr Thr Ala Ala Ser Pro Pro Ser Thr
50 55 60
Ala Ala Ala Pro Pro Ala Pro Ala Thr Pro Val Ala Pro Pro Pro Pro
65 70 75 80
Ala Ala Ala Asn Thr Pro Asn Ala Gln Pro Gly Asp Pro Asn Ala Ala
85 90 95
Pro Pro Pro Ala Asp Pro Asn Ala Pro Pro Pro Pro Val Ile Ala Pro
100 105 110
Asn Ala Pro Gln Pro Val Arg Ile Asp Asn Pro Val Gly Gly Phe Ser
115 120 125
Phe Ala Leu Pro Ala Gly Trp Val Glu Ser Asp Ala Ala His Phe Asp
130 135 140
Tyr Gly Ser Ala Leu Leu Ser Lys Thr Thr Gly Asp Pro Pro Phe Pro
145 150 155 160
Gly Gln Pro Pro Pro Val Ala Asn Asp Thr Arg Ile Val Leu Gly Arg
165 170 175
Leu Asp Gln Lys Leu Tyr Ala Ser Ala Glu Ala Thr Asp Ser Lys Ala
180 185 190
Ala Ala Arg Leu Gly Ser Asp Met Gly Glu Phe Tyr Met Pro Tyr Pro
195 200 205
Gly Thr Arg Ile Asn Gln Glu Thr Val Ser Leu Asp Ala Asn Gly Val
210 215 220
Ser Gly Ser Ala Ser Tyr Tyr Glu Val Lys Phe Ser Asp Pro Ser Lys
225 230 235 240
Pro Asn Gly Gln Ile Trp Thr Gly Val Ile Gly Ser Pro Ala Ala Asn
245 250 255
Ala Pro Asp Ala Gly Pro Pro Gln Arg Trp Phe Val Val Trp Leu Gly
260 265 270
Thr Ala Asn Asn Pro Val Asp Lys Gly Ala Ala Lys Ala Leu Ala Glu
275 280 285
Ser Ile Arg Pro Leu Val Ala Pro Pro Pro Ala Pro Ala Pro Ala Pro
290 295 300
Ala Glu Pro Ala Pro Ala Pro Ala Pro Ala Gly Glu Val Ala Pro Thr
305 310 315 320
Pro Thr Thr Pro Thr Pro Gln Arg Thr Leu Pro Ala
325 330
(2)SEQ ID NO:96的信息:
(i)序列特征:
(A)长度:500个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线型
(xi)序列描述:SEQ ID NO:96:
CGTGGCAATG TCGTTGACCG TCGGGGCCGG GGTCGCCTCC GCAGATCCCG TGGACGCGGT 60
CATTAACACC ACCTGCAATT ACGGGCAGGT AGTAGCTGCG CTCAACGCGA CGGATCCGGG 120
GGCTGCCGCA CAGTTCAACG CCTCACCGGT GGCGCAGTCC TATTTGCGCA ATTTCCTCGC 180
CGCACCGCCA CCTCAGCGCG CTGCCATGGC CGCGCAATTG CAAGCTGTGC CGGGGGCGGC 240
ACAGTACATC GGCCTTGTCG AGTCGGTTGC CGGCTCCTGC AACAACTATT AAGCCCATGC 300
GGGCCCCATC CCGCGACCCG GCATCGTCGC CGGGGCTAGG CCAGATTGCC CCGCTCCTCA 360
ACGGGCCGCA TCCCGCGACC CGGCATCGTC GCCGGGGCTA GGCCAGATTG CCCCGCTCCT 420
CAACGGGCCG CATCTCGTGC CGAATTCCTG CAGCCCGGGG GATCCACTAG TTCTAGAGCG 480
GCCGCCACCG CGGTGGAGCT 500
(2)SEQ ID NO:97的信息:
(i)序列特征:
(A)长度:96个氨基酸
(B)类型:氨基酸
(C)链型:单链
(D)拓扑结构:线型
(xi)序列描述:SEQ ID NO:97:
Val Ala Met Ser Leu Thr Val Gly Ala Gly Val Ala Ser Ala Asp Pro
1 5 10 15
Val Asp Ala Val Ile Asn Thr Thr Cys Asn Tyr Gly Gln Val Val Ala
20 25 30
Ala Leu Asn Ala Thr Asp Pro Gly Ala Ala Ala Gln Phe Asn Ala Ser
35 40 45
Pro Val Ala Gln Ser Tyr Leu Arg Asn Phe Leu Ala Ala Pro Pro Pro
50 55 60
Gln Arg Ala Ala Met Ala Ala Gln Leu Gln Ala Val Pro Gly Ala Ala
65 70 75 80
Gln Tyr Ile Gly Leu Val Glu Ser Val Ala Gly Ser Cys Asn Asn Tyr
85 90 95
(2)SEQ ID NO:98的信息:
(i)序列特征:
(A)长度:154个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线型
(xi)序列描述:SEQ ID NO:98:
ATGACAGAGC AGCAGTGGAA TTTCGCGGGT ATCGAGGCCG CGGCAAGCGC AATCCAGGGA 60
AATGTCACGT CCATTCATTC CCTCCTTGAC GAGGGGAAGC AGTCCCTGAC CAAGCTCGCA 120
GCGGCCTGGG GCGGTAGCGG TTCGGAAGCG TACC 154
(2)SEQ ID NO:99的信息:
(i)序列特征:
(A)长度:51个氨基酸
(B)类型:氨基酸
(C)链型:单链
(D)拓扑结构:线型
(xi)序列描述:SEQ ID NO:99:
Met Thr Glu Gln Gln Trp Asn Phe Ala Gly Ile Glu Ala Ala Ala Ser
1 5 10 15
Ala Ile Gln Gly Asn Val Thr Ser Ile His Ser Leu Leu Asp Glu Gly
20 25 30
Lys Gln Ser Leu Thr Lys Leu Ala Ala Ala Trp Gly Gly Ser Gly Ser
35 40 45
Glu Ala Tyr
50
(2)SEQ ID NO:100的信息:
(i)序列特征:
(A)长度:282个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线型
(xi)序列描述:SEQ ID NO:100:
CGGTCGCGCA CTTCCAGGTG ACTATGAAAG TCGGCTTCCG NCTGGAGGAT TCCTGAACCT 60
TCAAGCGCGG CCGATAACTG AGGTGCATCA TTAAGCGACT TTTCCAGAAC ATCCTGACGC 120
GCTCGAAACG CGGCACAGCC GACGGTGGCT CCGNCGAGGC GCTGNCTCCA AAATCCCTGA 180
GACAATTCGN CGGGGGCGCC TACAAGGAAG TCGGTGCTGA ATTCGNCGNG TATCTGGTCG 240
ACCTGTGTGG TCTGNAGCCG GACGAAGCGG TGCTCGACGT CG 282
(2)SEQ ID NO:101的信息:
(i)序列特征:
(A)长度:1565个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线型
(xi)序列描述:SEQ ID NO:101:
GTATGCGGCC ACTGAAGTCG CCAATGCGGC GGCGGCCAGC TAAGCCAGGA ACAGTCGGCA 60
CGAGAAACCA CGAGAAATAG GGACACGTAA TGGTGGATTT CGGGGCGTTA CCACCGGAGA 120
TCAACTCCGC GAGGATGTAC GCCGGCCCGG GTTCGGCCTC GCTGGTGGCC GCGGCTCAGA 180
TGTGGGACAG CGTGGCGAGT GACCTGTTTT CGGCCGCGTC GGCGTTTCAG TCGGTGGTCT 240
GGGGTCTGAC GGTGGGGTCG TGGATAGGTT CGTCGGCGGG TCTGATGGTG GCGGCGGCCT 300
CGCCGTATGT GGCGTGGATG AGCGTCACCG CGGGGCAGGC CGAGCTGACC GCCGCCCAGG 360
TCCGGGTTGC TGCGGCGGCC TACGAGACGG CGTATGGGCT GACGGTGCCC CCGCCGGTGA 420
TCGCCGAGAA CCGTGCTGAA CTGATGATTC TGATAGCGAC CAACCTCTTG GGGCAAAACA 480
CCCCGGCGAT CGCGGTCAAC GAGGCCGAAT ACGGCGAGAT GTGGGCCCAA GACGCCGCCG 540
CGATGTTTGG CTACGCCGCG GCGACGGCGA CGGCGACGGC GACGTTGCTG CCGTTCGAGG 600
AGGCGCCGGA GATGACCAGC GCGGGTGGGC TCCTCGAGCA GGCCGCCGCG GTCGAGGAGG 660
CCTCCGACAC CGCCGCGGCG AACCAGTTGA TGAACAATGT GCCCCAGGCG CTGCAACAGC 720
TGGCCCAGCC CACGCAGGGC ACCACGCCTT CTTCCAAGCT GGGTGGCCTG TGGAAGACGG 780
TCTCGCCGCA TCGGTCGCCG ATCAGCAACA TGGTGTCAAT GGCCAACAAC CACATGTCAA 840
TGACCAACTC GGGTGTGTCA ATGACCAACA CCTTGAGCTC GATGTTGAAG GGCTTTGCTC 900
CGGCGGCGGC CGCCCAGGCC GTGCAAACCG CGGCGCAAAA CGGGGTCCGG GCGATGAGCT 960
CGCTGGGCAG CTCGCTGGGT TCTTCGGGTC TGGGCGGTGG GGTGGCCGCC AACTTGGGTC 1020
GGGCGGCCTC GGTCGGTTCG TTGTCGGTGC CGCAGGCCTG GGCCGCGGCC AACCAGGCAG 1080
TCACCCCGGC GGCGCGGGCG CTGCCGCTGA CCAGCCTGAC CAGCGCCGCG GAAAGAGGGC 1140
CCGGGCAGAT GCTGGGCGGG CTGCCGGTGG GGCAGATGGG CGCCAGGGCC GGTGGTGGGC 1200
TCAGTGGTGT GCTGCGTGTT CCGCCGCGAC CCTATGTGAT GCCGCATTCT CCGGCGGCCG 1260
GCTAGGAGAG GGGGCGCAGA CTGTCGTTAT TTGACCAGTG ATCGGCGGTC TCGGTGTTTC 1320
CGCGGCCGGC TATGACAACA GTCAATGTGC ATGACAAGTT ACAGGTATTA GGTCCAGGTT 1380
CAACAAGGAG ACAGGCAACA TGGCCTCACG TTTTATGACG GATCCGCACG CGATGCGGGA 1440
CATGGCGGGC CGTTTTGAAG TGCACGCCCA GACGGTGGAG GACGAGGCTC GCCGGATGTG 1500
GGCGTCCGCG CAAAACATTT CCGGTGCGGG CTGGAGTGGC ATGGCCGAGG CGACCTCGCT 1560
AGACA 1565
(2)SEQ ID NO:102的信息:
(i)序列特征:
(A)长度:391个氨基酸
(B)类型:氨基酸
(C)链型:单链
(D)拓扑结构:线型
(xi)序列描述:SEQ ID NO:102:
Met Val Asp Phe Gly Ala Leu Pro Pro Glu Ile Asn Ser Ala Arg Met
1 5 10 15
Tyr Ala Gly Pro Gly Ser Ala Ser Leu Val Ala Ala Ala Gln Met Trp
20 25 30
Asp Ser Val Ala Ser Asp Leu Phe Ser Ala Ala Ser Ala Phe Gln Ser
35 40 45
Val Val Trp Gly Leu Thr Val Gly Ser Trp Ile Gly Ser Ser Ala Gly
50 55 60
Leu Met Val Ala Ala Ala Ser Pro Tyr Val Ala Trp Met Ser Val Thr
65 70 75 80
Ala Gly Gln Ala Glu Leu Thr Ala Ala Gln Val Arg Val Ala Ala Ala
85 90 95
Ala Tyr Glu Thr Ala Tyr Gly Leu Thr Val Pro Pro Pro Val Ile Ala
100 105 110
Glu Asn Arg Ala Glu Leu Met Ile Leu Ile Ala Thr Asn Leu Leu Gly
115 120 125
Gln Asn Thr Pro Ala Ile Ala Val Asn Glu Ala Glu Tyr Gly Glu Met
130 135 140
Trp Ala Gln Asp Ala Ala Ala Met Phe Gly Tyr Ala Ala Ala Thr Ala
145 150 155 160
Thr Ala Thr Ala Thr Leu Leu Pro Phe Glu Glu Ala Pro Glu Met Thr
165 170 175
Ser Ala Gly Gly Leu Leu Glu Gln Ala Ala Ala Val Glu Glu Ala Ser
180 185 190
Asp Thr Ala Ala Ala Asn Gln Leu Met Asn Asn Val Pro Gln Ala Leu
195 200 205
Gln Gln Leu Ala Gln Pro Thr Gln Gly Thr Thr Pro Ser Ser Lys Leu
210 215 220
Gly Gly Leu Trp Lys Thr Val Ser Pro His Arg Ser Pro Ile Ser Asn
225 230 235 240
Met Val Ser Met Ala Asn Asn His Met Ser Met Thr Asn Ser Gly Val
245 250 255
Ser Met Thr Asn Thr Leu Ser Ser Met Leu Lys Gly Phe Ala Pro Ala
260 265 270
Ala Ala Ala Gln Ala Val Gln Thr Ala Ala Gln Asn Gly Val Arg Ala
275 280 285
Met Ser Ser Leu Gly Ser Ser Leu Gly Ser Ser Gly Leu Gly Gly Gly
290 295 300
Val Ala Ala Asn Leu Gly Arg Ala Ala Ser Val Gly Ser Leu Ser Val
305 310 315 320
Pro Gln Ala Trp Ala Ala Ala Asn Gln Ala Val Thr Pro Ala Ala Arg
325 330 335
Ala Leu Pro Leu Thr Ser Leu Thr Ser Ala Ala Glu Arg Gly Pro Gly
340 345 350
Gln Met Leu Gly Gly Leu Pro Val Gly Gln Met Gly Ala Arg Ala Gly
355 360 365
Gly Gly Leu Ser Gly Val Leu Arg Val Pro Pro Arg Pro Tyr Val Met
370 375 380
Pro His Ser Pro Ala Ala Gly
385 390
(2)SEQ ID NO:103的信息:
(i)序列特征:
(A)长度:259个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线型
(xi)序列描述:SEQ ID NO:103:
ACCAACACCT TGCACTCNAT GTTGAAGGGC TTAGCTCCGG CGGCGGCTCA GGCCGTGGAA 60
ACCGCGGCGG AAAACGGGGT CTGGGCAATG AGCTCGCTGG GCAGCCAGCT GGGTTCGTCG 120
CTGGGTTCTT CGGGTCTGGG CGCTGGGGTG GCCGCCAACT TGGGTCGGGC GGCCTCGGTC 180
GGTTCGTTGT CGGTGCCGCC AGCATGGGCC GCGGCCAACC AGGCGGTCAC CCCGGCGGCG 240
CGGGCGCTGC CGCTGACCA 259
(2)SEQ ID NO:104的信息:
(i)序列特征:
(A)长度:86个氨基酸
(B)类型:氨基酸
(C)链型:单链
(D)拓扑结构:线型
(xi)序列描述:SEQ ID NO:104:
Thr Asn Thr Leu His Ser Met Leu Lys Gly Leu Ala Pro Ala Ala Ala
1 5 10 15
Gln Ala Val Glu Thr Ala Ala Glu Asn Gly Val Trp Ala Met Ser Ser
20 25 30
Leu Gly Ser Gln Leu Gly Ser Ser Leu Gly Ser Ser Gly Leu Gly Ala
35 40 45
Gly Val Ala Ala Asn Leu Gly Arg Ala Ala Ser Val Gly Ser Leu Ser
50 55 60
Val Pro Pro Ala Trp Ala Ala Ala Asn Gln Ala Val Thr Pro Ala Ala
65 70 75 80
Arg Ala Leu Pro Leu Thr
85
(2)SEQ ID NO:105的信息:
(i)序列特征:
(A)长度:1109个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线型
(xi)序列描述:SEQ ID NO:105:
TACTTGAGAG AATTTGACCT GTTGCCGACG TTGTTTGCTG TCCATCATTG GTGCTAGTTA 60
TGGCCGAGCG GAAGGATTAT CGAAGTGGTG GACTTCGGGG CGTTACCACC GGAGATCAAC 120
TCCGCGAGGA TGTACGCCGG CCCGGGTTCG GCCTCGCTGG TGGCCGCCGC GAAGATGTGG 180
GACAGCGTGG CGAGTGACCT GTTTTCGGCC GCGTCGGCGT TTCAGTCGGT GGTCTGGGGT 240
CTGACGACGG GATCGTGGAT AGGTTCGTCG GCGGGTCTGA TGGTGGCGGC GGCCTCGCCG 300
TATGTGGCGT GGATGAGCGT CACCGCGGGG CAGGCCGAGC TGACCGCCGC CCAGGTCCGG 360
GTTGCTGCGG CGGCCTACGA GACGGCGTAT GGGCTGACGG TGCCCCCGCC GGTGATCGCC 420
GAGAACCGTG CTGAACTGAT GATTCTGATA GCGACCAACC TCTTGGGGCA AAACACCCCG 480
GCGATCGCGG TCAACGAGGC CGAATACGGG GAGATGTGGG CCCAAGACGC CGCCGCGATG 540
TTTGGCTACG CCGCCACGGC GGCGACGGCG ACCGAGGCGT TGCTGCCGTT CGAGGACGCC 600
CCACTGATCA CCAACCCCGG CGGGCTCCTT GAGCAGGCCG TCGCGGTCGA GGAGGCCATC 660
GACACCGCCG CGGCGAACCA GTTGATGAAC AATGTGCCCC AAGCGCTGCA ACAACTGGCC 720
CAGCCCACGA AAAGCATCTG GCCGTTCGAC CAACTGAGTG AACTCTGGAA AGCCATCTCG 780
CCGCATCTGT CGCCGCTCAG CAACATCGTG TCGATGCTCA ACAACCACGT GTCGATGACC 840
AACTCGGGTG TGTCAATGGC CAGCACCTTG CACTCAATGT TGAAGGGCTT TGCTCCGGCG 900
GCGGCTCAGG CCGTGGAAAC CGCGGCGCAA AACGGGGTCC AGGCGATGAG CTCGCTGGGC 960
AGCCAGCTGG GTTCGTCGCT GGGTTCTTCG GGTCTGGGCG CTGGGGTGGC CGCCAACTTG 1020
GGTCGGGCGG CCTCGGTCGG TTCGTTGTCG GTGCCGCAGG CCTGGGCCGC GGCCAACCAG 1080
GCGGTCACCC CGGCGGCGCG GGCGCTGCC 1109
(2)SEQ ID NO:106的信息:
(i)序列特征:
(A)长度:341个氨基酸
(B)类型:氨基酸
(C)链型:单链
(D)拓扑结构:线型
(xi)序列描述:SEQ ID NO:106:
Val Val Asp Phe Gly Ala Leu Pro Pro Glu Ile Asn Ser Ala Arg Met
1 5 10 15
Tyr Ala Gly Pro Gly Ser Ala Ser Leu Val Ala Ala Ala Lys Met Trp
20 25 30
Asp Ser Val Ala Ser Asp Leu Phe Ser Ala Ala Ser Ala Phe Gln Ser
35 40 45
Val Val Trp Gly Leu Thr Thr Gly Ser Trp Ile Gly Ser Ser Ala Gly
50 55 60
Leu Met Val Ala Ala Ala Ser Pro Tyr Val Ala Trp Met Ser Val Thr
65 70 75 80
Ala Gly Gln Ala Glu Leu Thr Ala Ala Gln Val Arg Val Ala Ala Ala
85 90 95
Ala Tyr Glu Thr Ala Tyr Gly Leu Thr Val Pro Pro Pro Val Ile Ala
100 105 110
Glu Asn Arg Ala Glu Leu Met Ile Leu Ile Ala Thr Asn Leu Leu Gly
115 120 125
Gln Asn Thr Pro Ala Ile Ala Val Asn Glu Ala Glu Tyr Gly Glu Met
130 135 140
Trp Ala Gln Asp Ala Ala Ala Met Phe Gly Tyr Ala Ala Thr Ala Ala
145 150 155 160
Thr Ala Thr Glu Ala Leu Leu Pro Phe Glu Asp Ala Pro Leu Ile Thr
165 170 175
Asn Pro Gly Gly Leu Leu Glu Gln Ala Val Ala Val Glu Glu Ala Ile
180 185 190
Asp Thr Ala Ala Ala Asn Gln Leu Met Asn Asn Val Pro Gln Ala Leu
195 200 205
Gln Gln Leu Ala Gln Pro Thr Lys Ser Ile Trp Pro Phe Asp Gln Leu
210 215 220
Ser Glu Leu Trp Lys Ala Ile Ser Pro His Leu Ser Pro Leu Ser Asn
225 230 235 240
Ile Val Ser Met Leu Asn Asn His Val Ser Met Thr Asn Ser Gly Val
245 250 255
Ser Met Ala Ser Thr Leu His Ser Met Leu Lys Gly Phe Ala Pro Ala
260 265 270
Ala Ala Gln Ala Val Glu Thr Ala Ala Gln Asn Gly Val Gln Ala Met
275 280 285
Ser Ser Leu Gly Ser Gln Leu Gly Ser Ser Leu Gly Ser Ser Gly Leu
290 295 300
Gly Ala Gly Val Ala Ala Asn Leu Gly Arg Ala Ala Ser Val Gly Ser
305 310 315 320
Leu Ser Val Pro Gln Ala Trp Ala Ala Ala Asn Gln Ala Val Thr Pro
325 330 335
Ala Ala Arg Ala Leu
340
(2)SEQ ID NO:107的信息:
(i)序列特征:
(A)长度:1256个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线型
(xi)序列描述:SEQ ID NO:107:
CATCGGAGGG AGTGATCACC ATGCTGTGGC ACGCAATGCC ACCGGAGNTA AATACCGCAC 60
GGCTGATGGC CGGCGCGGGT CCGGCTCCAA TGCTTGCGGC GGCCGCGGGA TGGCAGACGC 120
TTTCGGCGGC TCTGGACGCT CAGGCCGTCG AGTTGACCGC GCGCCTGAAC TCTCTGGGAG 180
AAGCCTGGAC TGGAGGTGGC AGCGACAAGG CGCTTGCGGC TGCAACGCCG ATGGTGGTCT 240
GGCTACAAAC CGCGTCAACA CAGGCCAAGA CCCGTGCGAT GCAGGCGACG GCGCAAGCCG 300
CGGCATACAC CCAGGCCATG GCCACGACGC CGTCGCTGCC GGAGATCGCC GCCAACCACA 360
TCACCCAGGC CGTCCTTACG GCCACCAACT TCTTCGGTAT CAACACGATC CCGATCGCGT 420
TGACCGAGAT GGATTATTTC ATCCGTATGT GGAACCAGGC AGCCCTGGCA ATGGAGGTCT 480
ACCAGGCCGA GACCGCGGTT AACACGCTTT TCGAGAAGCT CGAGCCGATG GCGTCGATCC 540
TTGATCCCGG CGCGAGCCAG AGCACGACGA ACCCGATCTT CGGAATGCCC TCCCCTGGCA 600
GCTCAACACC GGTTGGCCAG TTGCCGCCGG CGGCTACCCA GACCCTCGGC CAACTGGGTG 660
AGATGAGCGG CCCGATGCAG CAGCTGACCC AGCCGCTGCA GCAGGTGACG TCGTTGTTCA 720
GCCAGGTGGG CGGCACCGGC GGCGGCAACC CAGCCGACGA GGAAGCCGCG CAGATGGGCC 780
TGCTCGGCAC CAGTCCGCTG TCGAACCATC CGCTGGCTGG TGGATCAGGC CCCAGCGCGG 840
GCGCGGGCCT GCTGCGCGCG GAGTCGCTAC CTGGCGCAGG TGGGTCGTTG ACCCGCACGC 900
CGCTGATGTC TCAGCTGATC GAAAAGCCGG TTGCCCCCTC GGTGATGCCG GCGGCTGCTG 960
CCGGATCGTC GGCGACGGGT GGCGCCGCTC CGGTGGGTGC GGGAGCGATG GGCCAGGGTG 1020
CGCAATCCGG CGGCTCCACC AGGCCGGGTC TGGTCGCGCC GGCACCGCTC GCGCAGGAGC 1080
GTGAAGAAGA CGACGAGGAC GACTGGGACG AAGAGGACGA CTGGTGAGCT CCCGTAATGA 1140
CAACAGACTT CCCGGCCACC CGGGCCGGAA GACTTGCCAA CATTTTGGCG AGGAAGGTAA 1200
AGAGAGAAAG TAGTCCAGCA TGGCAGAGAT GAAGACCGAT GCCGCTACCC TCGCGC 1256
(2)SEQ ID NO:108的信息:
(i)序列特征:
(A)长度:432个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线型
(xi)序列描述:SEQ ID NO:108:
CTAGTGGATG GGACCATGGC CATTTTCTGC AGTCTCACTG CCTTCTGTGT TGACATTTTG 60
GCACGCCGGC GGAAACGAAG CACTGGGGTC GAAGAACGGC TGCGCTGCCA TATCGTCCGG 120
AGCTTCCATA CCTTCGTGCG GCCGGAAGAG CTTGTCGTAG TCGGCCGCCA TGACAACCTC 180
TCAGAGTGCG CTCAAACGTA TAAACACGAG AAAGGGCGAG ACCGACGGAA GGTCGAACTC 240
GCCCGATCCC GTGTTTCGCT ATTCTACGCG AACTCGGCGT TGCCCTATGC GAACATCCCA 300
GTGACGTTGC CTTCGGTCGA AGCCATTGCC TGACCGGCTT CGCTGATCGT CCGCGCCAGG 360
TTCTGCAGCG CGTTGTTCAG CTCGGTAGCC GTGGCGTCCC ATTTTTGCTG GACACCCTGG 420
TACGCCTCCG AA 432
(2)SEQ ID NO:109的信息:
(i)序列特征:
(A)长度:368个氨基酸
(B)类型:氨基酸
(C)链型:单链
(D)拓扑结构:线型
(xi)序列描述:SEQ ID NO:109:
Met Leu Trp His Ala Met Pro Pro Glu Xaa Asn Thr Ala Arg Leu Met
1 5 10 15
Ala Gly Ala Gly Pro Ala Pro Met Leu Ala Ala Ala Ala Gly Trp Gln
20 25 30
Thr Leu Ser Ala Ala Leu Asp Ala Gln Ala Val Glu Leu Thr Ala Arg
35 40 45
Leu Asn Ser Leu Gly Glu Ala Trp Thr Gly Gly Gly Ser Asp Lys Ala
50 55 60
Leu Ala Ala Ala Thr Pro Met Val Val Trp Leu Gln Thr Ala Ser Thr
65 70 75 80
Gln Ala Lys Thr Arg Ala Met Gln Ala Thr Ala Gln Ala Ala Ala Tyr
85 90 95
Thr Gln Ala Met Ala Thr Thr Pro Ser Leu Pro Glu Ile Ala Ala Asn
100 105 110
His Ile Thr Gln Ala Val Leu Thr Ala Thr Asn Phe Phe Gly Ile Asn
115 120 125
Thr Ile Pro Ile Ala Leu Thr Glu Met Asp Tyr Phe Ile Arg Met Trp
130 135 140
Asn Gln Ala Ala Leu Ala Met Glu Val Tyr Gln Ala Glu Thr Ala Val
145 150 155 160
Asn Thr Leu Phe Glu Lys Leu Glu Pro Met Ala Ser Ile Leu Asp Pro
165 170 175
Gly Ala Ser Gln Ser Thr Thr Asn Pro Ile Phe Gly Met Pro Ser Pro
180 185 190
Gly Ser Ser Thr Pro Val Gly Gln Leu Pro Pro Ala Ala Thr Gln Thr
195 200 205
Leu Gly Gln Leu Gly Glu Met Ser Gly Pro Met Gln Gln Leu Thr Gln
210 215 220
Pro Leu Gln Gln Val Thr Ser Leu Phe Ser Gln Val Gly Gly Thr Gly
225 230 235 240
Gly Gly Asn Pro Ala Asp Glu Glu Ala Ala Gln Met Gly Leu Leu Gly
245 250 255
Thr Ser Pro Leu Ser Asn His Pro Leu Ala Gly Gly Ser Gly Pro Ser
260 265 270
Ala Gly Ala Gly Leu Leu Arg Ala Glu Ser Leu Pro Gly Ala Gly Gly
275 280 285
Ser Leu Thr Arg Thr Pro Leu Met Ser Gln Leu Ile Glu Lys Pro Val
290 295 300
Ala Pro Ser Val Met Pro Ala Ala Ala Ala Gly Ser Ser Ala Thr Gly
305 310 315 320
Gly Ala Ala Pro Val Gly Ala Gly Ala Met Gly Gln Gly Ala Gln Ser
325 330 335
Gly Gly Ser Thr Arg Pro Gly Leu Val Ala Pro Ala Pro Leu Ala Gln
340 345 350
Glu Arg Glu Glu Asp Asp Glu Asp Asp Trp Asp Glu Glu Asp Asp Trp
355 360 365
(2)SEQ ID NO:110的信息:
(i)序列特征:
(A)长度:12个氨基酸
(B)类型:氨基酸
(C)链型:单链
(D)拓扑结构:线型
(xi)序列描述:SEQ ID NO:110:
Met Ala Glu Met Lys Thr Asp Ala Ala Thr Leu Ala
1 5 10
(2)SEQ ID NO:111的信息:
(i)序列特征:
(A)长度:396个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线型
(xi)序列描述:SEQ ID NO:111:
GATCTCCGGC GACCTGAAAA CCCAGATCGA CCAGGTGGAG TCGACGGCAG GTTCGTTGCA 60
GGGCCAGTGG CGCGGCGCGG CGGGGACGGC CGCCCAGGCC GCGGTGGTGC GCTTCCAAGA 120
AGCAGCCAAT AAGCAGAAGC AGGAACTCGA CGAGATCTCG ACGAATATTC GTCAGGCCGG 180
CGTCCAATAC TCGAGGGCCG ACGAGGAGCA GCAGCAGGCG CTGTCCTCGC AAATGGGCTT 240
CTGACCCGCT AATACGAAAA GAAACGGAGC AAAAACATGA CAGAGCAGCA GTGGAATTTC 300
GCGGGTATCG AGGCCGCGGC AAGCGCAATC CAGGGAAATG TCACGTCCAT TCATTCCCTC 360
CTTGACGAGG GGAAGCAGTC CCTGACCAAG CTCGCA 396
(2)SEQ ID NO:112的信息:
(i)序列特征:
(A)长度:80个氨基酸
(B)类型:氨基酸
(C)链型:单链
(D)拓扑结构:线型
(xi)序列描述:SEQ ID NO:112:
Ile Ser Gly Asp Leu Lys Thr Gln Ile Asp Gln Val Glu Ser Thr Ala
1 5 10 15
Gly Ser Leu Gln Gly Gln Trp Arg Gly Ala Ala Gly Thr Ala Ala Gln
20 25 30
Ala Ala Val Val Arg Phe Gln Glu Ala Ala Asn Lys Gln Lys Gln Glu
35 40 45
Leu Asp Glu Ile Ser Thr Asn Ile Arg Gln Ala Gly Val Gln Tyr Ser
50 55 60
Arg Ala Asp Glu Glu Gln Gln Gln Ala Leu Ser Ser Gln Met Gly Phe
65 70 75 80
(2)SEQ ID NO:113的信息:
(i)序列特征:
(A)长度:387个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线型
(xi)序列描述:SEQ ID NO:113:
GTGGATCCCG ATCCCGTGTT TCGCTATTCT ACGCGAACTC GGCGTTGCCC TATGCGAACA 60
TCCCAGTGAC GTTGCCTTCG GTCGAAGCCA TTGCCTGACC GGCTTCGCTG ATCGTCCGCG 120
CCAGGTTCTG CAGCGCGTTG TTCAGCTCGG TAGCCGTGGC GTCCCATTTT TGCTGGACAC 180
CCTGGTACGC CTCCGAACCG CTACCGCCCC AGGCCGCTGC GAGCTTGGTC AGGGACTGCT 240
TCCCCTCGTC AAGGAGGGAA TGAATGGACG TGACATTTCC CTGGATTGCG CTTGCCGCGG 300
CCTCGATACC CGCGAAATTC CACTGCTGCT CTGTCATGTT TTTGCTCCGT TTCTTTTCGT 360
ATTAGCGGGT CAGAAGCCCA TTTGCGA 387
(2)SEQ ID NO:114的信息:
(i)序列特征:
(A)长度:272个碱基对
(B)类型:核酸
(C)链型:单链
(D)拓扑结构:线型
(xi)序列描述:SEQ ID NO:114:
CGGCACGAGG ATCTCGGTTG GCCCAACGGC GCTGGCGAGG GCTCCGTTCC GGGGGCGAGC 60
TGCGCGCCGG ATGCTTCCTC TGCCCGCAGC CGCGCCTGGA TGGATGGACC AGTTGCTACC 120
TTCCCGACGT TTCGTTCGGT GTCTGTGCGA TAGCGGTGAC CCCGGCGCGC ACGTCGGGAG 180
TGTTGGGGGG CAGGCCGGGT CGGTGGTTCG GCCGGGGACG CAGACGGTCT GGACGGAACG 240
GGCGGGGGTT CGCCGATTGG CATCTTTGCC CA 272
(2)SEQ ID NO:115的信息:
(i)序列特征:
(A)长度:20个氨基酸
(B)类型:氨基酸
(C)链型:
(D)拓扑结构:线型
(xi)序列描述:SEQ ID NO:115:
Asp Pro Val Asp Ala Val Ile Asn Thr Thr Cys Asn Tyr Gly Gln Val
1 5 10 15
Val Ala Ala Leu
20
(2)SEQ ID NO:116的信息:
(i)序列特征:
(A)长度:15个氨基酸
(B)类型:氨基酸
(C)链型:
(D)拓扑结构:线型
(xi)序列描述:SEQ ID NO:116:
Ala Val Glu Ser Gly Met Leu Ala Leu Gly Thr Pro Ala Pro Ser
1 5 10 15
(2)SEQ ID NO:117的信息:
(i)序列特征:
(A)长度:19个氨基酸
(B)类型:氨基酸
(C)链型:
(D)拓扑结构:线型
(xi)序列描述:SEQ ID NO:117:
Ala Ala Met Lys Pro Arg Thr Gly Asp Gly Pro Leu Glu Ala Ala Lys
1 5 10 15
Glu Gly Arg
(2)SEQ ID NO:118的信息:
(i)序列特征:
(A)长度:15个氨基酸
(B)类型:氨基酸
(C)链型:
(D)拓扑结构:线型
(xi)序列描述:SEQ ID NO:118:
Tyr Tyr Trp Cys Pro Gly Gln Pro Phe Asp Pro Ala Trp Gly Pro
1 5 10 15
(2)SEQ ID NO:119的信息:
(i)序列特征:
(A)长度:14个氨基酸
(B)类型:氨基酸
(C)链型:
(D)拓扑结构:线型
(xi)序列描述:SEQ ID NO:119:
Asp Ile Gly Ser Glu Ser Thr Glu Asp Gln Gln Xaa Ala Val
1 5 10
(2)SEQ ID NO:120的信息:
(i)序列特征:
(A)长度:13个氨基酸
(B)类型:氨基酸
(C)链型:
(D)拓扑结构:线型
(xi)序列描述:SEQ ID NO:120:
Ala Glu Glu Ser Ile Ser Thr Xaa Glu Xaa Ile Val Pro
1 5 10
(2)SEQ ID NO:121的信息:
(i)序列特征:
(A)长度:17个氨基酸
(B)类型:氨基酸
(C)链型:
(D)拓扑结构:线型
(xi)序列描述:SEQ ID NO:121:
Asp Pro Glu Pro Ala Pro Pro Val Pro Thr Thr Ala Ala Ser Pro Pro
1 5 10 15
Ser
(2)SEQ ID NO:122的信息:
(i)序列特征:
(A)长度:15个氨基酸
(B)类型:氨基酸
(C)链型:
(D)拓扑结构:线型
(xi)序列描述:SEQ ID NO:122:
Ala Pro Lys Thr Tyr Xaa Glu Glu Leu Lys Gly Thr Asp Thr Gly
1 5 10 15
(2)SEQ ID NO:123的信息:
(i)序列特征:
(A)长度:30个氨基酸
(B)类型:氨基酸
(C)链型:
(D)拓扑结构:线型
(xi)序列描述:SEQ ID NO:123:
Asp Pro Ala Ser Ala Pro Asp Val Pro Thr Ala Ala Gln Leu Thr Ser
1 5 10 15
Leu Leu Asn Ser Leu Ala Asp Pro Asn Val Ser Phe Ala Asn
20 25 30
(2)SEQ ID NO:124的信息:
(i)序列特征:
(A)长度:22个氨基酸
(B)类型:氨基酸
(C)链型:
(D)拓扑结构:线型
(xi)序列描述:SEQ ID NO:124:
Asp Pro Pro Asp Pro His Gln Xaa Asp Met Thr Lys Gly Tyr Tyr Pro
1 5 10 15
Gly Gly Arg Arg Xaa Phe
20
(2)SEQ ID NO:125的信息:
(i)序列特征:
(A)长度:7个氨基酸
(B)类型:氨基酸
(C)链型:
(D)拓扑结构:线型
(xi)序列描述:SEQ ID NO:125:
Asp Pro Gly Tyr Thr Pro Gly
1 5
(2)SEQ ID NO:126的信息:
(i)序列特征:
(A)长度:10个氨基酸
(B)类型:氨基酸
(C)链型:
(D)拓扑结构:线型
(ix)特征:
(D)其它信息:/注=“第二残基可以是Pro或者Thr”
(xi)序列描述:SEQ ID NO:126:
Xaa Xaa Gly Phe Thr Gly Pro Gln Phe Tyr
1 5 10
(2)SEQ ID NO:127的信息:
(i)序列特征:
(A)长度:9个氨基酸
(B)类型:氨基酸
(C)链型:
(D)拓扑结构:线型
(ix)特征:
(D)其它信息:/注=“第三残基可以是Gln或者Leu”
(xi)序列描述:SEQ ID NO:127:
Xaa Pro Xaa Val Thr Ala Tyr Ala Gly
1 5
(2)SEQ ID NO:128的信息:
(i)序列特征:
(A)长度:9个氨基酸
(B)类型:氨基酸
(C)链型:
(D)拓扑结构:线型
(xi)序列描述:SEQ ID NO:128:
Xaa Xaa Xaa Glu Lys Pro Phe Leu Arg
1 5
(2)SEQ ID NO:129的信息:
(i)序列特征:
(A)长度:15个氨基酸
(B)类型:氨基酸
(C)链型:
(D)拓扑结构:线型
(xi)序列描述:SEQ ID NO:129:
Xaa Asp Ser Glu Lys Ser Ala Thr Ile Lys Val Thr Asp Ala Ser
1 5 10 15
(2)SEQ ID NO:130的信息:
(i)序列特征:
(A)长度:15个氨基酸
(B)类型:氨基酸
(C)链型:
(D)拓扑结构:线型
(xi)序列描述:SEQ ID NO:130:
Ala Gly Asp Thr Xaa Ile Tyr Ile Val Gly Asn Leu Thr Ala Asp
1 5 10 15
(2)SEQ ID NO:131的信息:
(i)序列特征:
(A)长度:15个氨基酸
(B)类型:氨基酸
(C)链型:
(D)拓扑结构:线型
(xi)序列描述:SEQ ID NO:131:
Ala Pro Glu Ser Gly Ala Gly Leu Gly Gly Thr Val Gln Ala Gly
1 5 10 15
(2)SEQ ID NO:132的信息:
(i)序列特征:
(A)长度:21个氨基酸
(B)类型:氨基酸
(C)链型:
(D)拓扑结构:线型
(xi)序列描述:SEQ ID NO:132:
Xaa Tyr Ile Ala Tyr Xaa Thr Thr Ala Gly Ile Val Pro Gly Lys Ile
1 5 10 15
Asn Val His Leu Val
20
Claims (44)
1.一种多肽,该多肽包含可溶性结核分枝杆菌抗原或仅在保守取代和/或修饰上不同的该抗原的变体的抗原性部分,其中所说的抗原具有选自下组的N端序列:
(a)Asp-Pro-Val-Asp-Ala-Val-Ile-Asn-Thr-Thr-Cys-Asn-Tyr-Gly-Gln-Val-Val-Ala-Ala-Leu(SEQ ID No.115);
(b)Ala-Val-Glu-Ser-Gly-Met-Leu-Ala-Leu-Gly-Thr-Pro-Ala-Pro-Ser(SEQ ID No.116);
(c)Ala-Ala-Met-Lys-Pro-Arg-Thr-Gly-Asp-Gly-Pro-Leu-Glu-Ala-Ala-Lys-Glu-Gly-Arg(SEQ ID No.117);
(d)Tyr-Tyr-Trp-Cys-Pro-Gly-Gln-Pro-Phe-Asp-Pro-Ala-Trp-Gly-Pro(SEQ ID No.118);
(e)Asp-Ile-Gly-Ser-Glu-Ser-Thr-Glu-Asp-Gln-Gln-Xaa-Ala-Val(SEQ ID No.119);
(f)Ala-Glu-Glu-Ser-Ile-Ser-Thr-Xaa-Glu-Xaa-Ile-Val-Pro(SEQ ID No.120);
(g)Asp-Pro-Glu-Pro-Ala-Pro-Pro-Val-Pro-Thr-Thr-Ala-Ala-Ser-Pro-Ser(SEQ ID No.121);
(h)Ala-Pro-Lys-Thr-Tyr-Xaa-Glu-Glu-Leu-Lys-Gly-Thr-Asp-Thr-Gly(SEQ ID No.122);
(i)Asp-Pro-Ala-Ser-Ala-Pro-Asp-Val-Pro-Thr-Ala-Ala-Gln-Leu-Thr-Ser-Leu-Leu-Asn-Ser-Leu-Ala-Asp-Pro-Asn-Val-Ser-Phe-Ala-Asn(SEQ ID No.123);和
(j)Ala-Pro-Glu-Ser-Gly-Ala-Gly-Leu-Gly-Gly-Thr-Val-Gln-Ala-Gly;(SEQ ID No.131)
其中Xaa可以是任何氨基酸。
2.一种多肽,该多肽包含结核分枝杆菌抗原或仅在保守取代和/或修饰上不同的该抗原的变体的免疫原性部分,其中所说的抗原具有选自下组的N端序列:
(a)Asp-Pro-Pro-Asp-Pro-His-Gln-Xaa-Asp-Met-Thr-Lys-Gly-Tyr-Tyr-Pro-Gly-Gly-Arg-Arg-Xaa-Phe;(SEQ ID No.124)和
(b)Xaa-Tyr-Ile-Ala-Tyr-Xaa-Thr-Thr-Ala-Gly-Ile-Val-Pro-Gly-Lys-Ile-Asn-Val-His-Leu-Val;(SEQ ID No.132),
其中Xaa可以是任何氨基酸。
3.一种多肽,该多肽包含可溶性结核分枝杆菌抗原或仅在保守取代和/或修饰上不同的该抗原的变体的抗原性部分,其中所说的抗原包含由选自下组的DNA序列编码的氨基酸序列:SEQ ID No.1,2,4-10,13-25,52,94和96中所示的序列、这些序列的补体、以及在中等严格条件下与SEQ ID No.1,2,4-10,13-25,52,94和96中所示的序列杂交的DNA序列或它们的补体。
4.一种多肽,该多肽包含结核分枝杆菌抗原或仅在保守取代和/或修饰上不同的该抗原的变体的抗原性部分,其中所说的抗原包含由选自下组的DNA序列编码的氨基酸序列:SEQ ID No.26-51中所示的序列、这些序列的补体、和在中等严格条件下与SEQ ID No.26-51中所示的序列杂交的DNA序列或它们的补体。
5.一种DNA分子,该分子包含编码按照权利要求1-4之任一的多肽的核苷酸序列。
6.一种重组表达载体,该载体包含按照权利要求5的DNA分子。
7.一种宿主细胞,该宿主细胞由按照权利要求6的表达载体转化过。
8.权利要求7的宿主细胞,其中所说的宿主细胞选自大肠杆菌、酵母和哺乳动物细胞。
9.一种用于检测生物样品中的结核分枝杆菌感染的方法,该方法包括:
(a)使生物样品与按照权利要求1-4之任一的一种或多种多肽接触;和
(b)在样品中检测结合到至少一种所说多肽上的抗体的存在,由此检测生物样品中的结核分枝杆菌感染。
10.一种用于检测生物样品中的结核分枝杆菌感染的方法,该方法包括:
(a)使生物样品与具有选自由SEQ ID No.129和130给出的序列的N端序列的多肽接触;和
(b)在样品中检测结合到至少一种所说多肽上的抗体的存在,由此检测生物样品中的结核分枝杆菌感染。
11.一种用于在生物样品中检测结核分枝杆菌感染的方法,该方法包括:
(a)使生物样品与由选自下组的DNA序列编码的一种或多种多肽接触:SEQ ID No.3,11和12的序列、这些序列的补体、以及与SEQ ID No.3,11和12所示的序列杂交的DNA序列;和
(b)在样品中检测结合到至少一种所说多肽上的抗体的存在,由此检测生物样品中的结核分枝杆菌感染。
12.权利要求9-11之任一的方法,其中步骤(a)还包括使生物样品与38kD结核分枝杆菌抗原接触,并且步骤(b)还包括在样品中检测结合到38kD结核分枝杆菌抗原上的抗体的存在。
13.权利要求9-11之任一的方法,其中所说的多肽是结合到固相支持物上的。
14.权利要求13的方法,其中所说的固相支持物包含硝化纤维素、乳胶或塑料材料。
15.权利要求9-11之任一的方法,其中所说的生物样品选自全血、血清、血浆、唾液、脑脊液和尿。
16.权利要求15的方法,其中所说的生物样品是全血或血清。
17.一种用于检测生物样品中的结核分枝杆菌感染的方法,该方法包括:
(a)使所说的样品与聚合酶链反应中的第一和第二寡核苷酸引物接触,所说的第一和第二寡核苷酸引物包含按照权利要求5的DNA分子的至少约10个邻接的核苷酸;和
(b)在样品中检测在第一和第二寡核苷酸引物存在下扩增的DNA序列,由此检测结核分枝杆菌感染。
18.一种用于检测生物样品中的结核分枝杆菌感染的方法,该方法包括:
(a)使所说的样品与聚合酶链反应中的第一和第二寡核苷酸引物接触,所说的第一和第二寡核苷酸引物包含选自SEQ ID No.3,11和12的DNA序列的至少约10个邻接的核苷酸;和
(b)在样品中检测在第一和第二寡核苷酸引物存在下扩增的DNA序列,由此检测结核分枝杆菌感染。
19.权利要求17或18的方法,其中所说的生物样品选自全血、痰、血清、血浆、唾液、脑脊液和尿。
20.一种用于检测生物样品中的结核分枝杆菌感染的方法,该方法包括:
(a)使样品与一种或多种寡核苷酸探针接触,所说探针包含按照权利要求5的DNA分子的至少约15个邻接核苷酸;和
(b)在样品中检测杂交到所说寡核苷酸探针上的DNA序列,由此检测结核分枝杆菌感染。
21.一种用于检测生物样品中的结核分枝杆菌感染的方法,该方法包括:
(a)使样品与一种或多种寡核苷酸探针接触,所说探针包含选自SEQID No.3,11和12的DNA序列的至少约15个邻接核苷酸;和
(b)在样品中检测杂交到所说寡核苷酸探针上的DNA序列,由此检测结核分枝杆菌感染。
22.权利要求20或21的方法,其中所说的生物样品选自全血,痰、血清、血浆、唾液、脑脊液和尿。
23.一种用于检测生物样品中的结核分枝杆菌感染的方法,该方法包括:
(a)使所说的生物样品与能够结合到按照权利要求1-4之任一的多肽上的结合剂接触;和
(b)在样品中检测结合到结合剂上的蛋白质或多肽,由此检测生物样品中的结核分枝杆菌感染。
24.一种用于检测生物样品中的结核分枝杆菌感染的方法,该方法包括:
(a)使所说的生物样品与能够结合到多肽上的结合剂接触,所说的多肽具有由SEQ ID No.129和130给出的序列的N端序列;和
(b)在样品中检测结合到结合剂上的蛋白质或多肽,由此检测生物样品中的结核分枝杆菌感染。
25.一种用于检测生物样品中的结核分枝杆菌感染的方法,该方法包括:
(a)使所说的生物样品与能够结合到多肽上的结合剂接触,所说的多肽由选自下组的DNA序列编码:SEQ ID No.3,11和12的序列、这些序列的补体、以及与SEQ ID No.3,11和12所示的序列杂交的DNA序列;和
(b)在样品中检测结合到结合剂上的蛋白质或多肽,由此检测生物样品中的结核分枝杆菌感染。
26.权利要求23-25之任一的方法,其中所说的结合剂是单克隆抗体。
27.权利要求23-25之任一的方法,其中所说的结合剂是多克隆抗体。
28.一种诊断试剂盒,该试剂盒包含:
(a)一种或多种按照权利要求1-4之任一的多肽;和
(b)一种检测试剂。
29.一种诊断试剂盒,该试剂盒包含:
(a)一种或多种具有选自由SEQ ID No.129和130给出的序列的N端序列的多肽;和
(b)一种检测试剂。
30.一种诊断试剂盒,该试剂盒包含:
(a)一种或多种由选自下组的DNA序列:SEQ ID No.3,11和12的序列、这些序列的补体、以及与SEQ ID No.3,11和12所示的序列杂交的DNA序列编码的多肽;和
(b)一种检测试剂。
31.权利要求28-30之任一的试剂盒,其中所说的多肽是固定化在固相支持物上的。
32.权利要求31的试剂盒,其中所说的固相支持物包含硝化纤维素、乳胶或塑料材料。
33.权利要求28-30之任一的试剂盒,其中所说的检测试剂包含结合到结合剂上的报道基团。
34.权利要求33的试剂盒,其中所说的结合剂选自抗-免疫球蛋白、蛋白质G,蛋白质A和凝集素。
35.权利要求33的试剂盒,其中所说的报道基团选自放射性同位素、荧光基团、发光基团、酶、生物素以及染料颗粒。
36.一种诊断试剂盒,该试剂盒包含第一聚合酶链反应引物与第二聚合酶链反应引物,所说的第一和第二引物包含按照权利要求5的DNA分子的至少约10个邻接的核苷酸。
37.一种诊断试剂盒,该试剂盒包含第一聚合酶链反应引物与第二聚合酶链反应引物,所说的第一和第二引物包含选自SEQ ID No.3,11和12的DNA序列的至少约10个邻接的核苷酸。
38.一种诊断试剂盒,该试剂盒包含至少一种寡核苷酸探针,所说寡核苷酸探针包含按照权利要求5的DNA分子的至少约15个邻接核苷酸。
39.一种诊断试剂盒,该试剂盒包含至少一种寡核苷酸探针,所说寡核苷酸探针包含选自SEQ ID No.3,11和12的DNA序列的至少约15个邻接核苷酸。
40.一种单克隆抗体,该抗体结合到按照权利要求1-4之任一的多肽上。
41.一种多克隆抗体,该抗体结合到按照权利要求1-4之任一的多肽上。
42.一种融合蛋白,该融合蛋白包含按照权利要求1-4之任一的两种或多种多肽。
43.一种融合蛋白,该融合蛋白包含按照权利要求1-4之任一的一种或多种多肽以及ESAT-6(SEQ ID No.99)。
44.一种融合蛋白,该融合蛋白包含具有由SEQ ID No.129和130给出的序列的N端序列的多肽。
Applications Claiming Priority (10)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US52343595A | 1995-09-01 | 1995-09-01 | |
US08/523,435 | 1995-09-01 | ||
US53213695A | 1995-09-22 | 1995-09-22 | |
US08/532,136 | 1995-09-22 | ||
US62028096A | 1996-03-22 | 1996-03-22 | |
US08/620,280 | 1996-03-22 | ||
US65880096A | 1996-06-05 | 1996-06-05 | |
US08/658,800 | 1996-06-05 | ||
US68057396A | 1996-07-12 | 1996-07-12 | |
US08/680,573 | 1996-07-12 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CNB961974672A Division CN1154730C (zh) | 1995-09-01 | 1996-08-30 | 用于结核病诊断的化合物和方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN1554664A true CN1554664A (zh) | 2004-12-15 |
Family
ID=27541833
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CNA2004100351841A Pending CN1554664A (zh) | 1995-09-01 | 1996-08-30 | 用于结核病诊断的化合物和方法 |
CNB961974672A Expired - Lifetime CN1154730C (zh) | 1995-09-01 | 1996-08-30 | 用于结核病诊断的化合物和方法 |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CNB961974672A Expired - Lifetime CN1154730C (zh) | 1995-09-01 | 1996-08-30 | 用于结核病诊断的化合物和方法 |
Country Status (13)
Country | Link |
---|---|
EP (2) | EP0850305B1 (zh) |
JP (1) | JPH11514217A (zh) |
CN (2) | CN1554664A (zh) |
AT (2) | ATE530671T1 (zh) |
AU (1) | AU7158796A (zh) |
CA (1) | CA2230927A1 (zh) |
CY (1) | CY2618B2 (zh) |
DE (1) | DE69636075D1 (zh) |
DK (1) | DK2154248T3 (zh) |
ES (1) | ES2378051T3 (zh) |
MX (1) | MX9801687A (zh) |
PT (1) | PT2154248E (zh) |
WO (1) | WO1997009429A2 (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111269856A (zh) * | 2020-02-19 | 2020-06-12 | 首都医科大学附属北京胸科医院 | 一种分离和/或富集结核分枝杆菌的方法 |
Families Citing this family (45)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6641814B1 (en) | 1997-04-02 | 2003-11-04 | Statens Serum Institut | Nucleic acids fragments and polypeptide fragments derived from M. tuberculosis |
US6991797B2 (en) | 1993-07-02 | 2006-01-31 | Statens Serum Institut | M. tuberculosis antigens |
US6458366B1 (en) | 1995-09-01 | 2002-10-01 | Corixa Corporation | Compounds and methods for diagnosis of tuberculosis |
US6592877B1 (en) | 1995-09-01 | 2003-07-15 | Corixa Corporation | Compounds and methods for immunotherapy and diagnosis of tuberculosis |
US6290969B1 (en) | 1995-09-01 | 2001-09-18 | Corixa Corporation | Compounds and methods for immunotherapy and diagnosis of tuberculosis |
JP2001500383A (ja) * | 1996-10-11 | 2001-01-16 | コリックサ コーポレーション | 結核診断用の化合物および方法 |
US6627198B2 (en) | 1997-03-13 | 2003-09-30 | Corixa Corporation | Fusion proteins of Mycobacterium tuberculosis antigens and their uses |
US6350456B1 (en) | 1997-03-13 | 2002-02-26 | Corixa Corporation | Compositions and methods for the prevention and treatment of M. tuberculosis infection |
US6544522B1 (en) | 1998-12-30 | 2003-04-08 | Corixa Corporation | Fusion proteins of mycobacterium tuberculosis antigens and their uses |
PT1449922E (pt) * | 1997-04-02 | 2007-11-09 | Statens Seruminstitut | Fragmentos de ácidos nucleicos e fragmentos polipeptídicos obtidos a partir de m. tuberculosis |
US6982085B2 (en) | 1997-04-02 | 2006-01-03 | Statens Serum Institut | TB diagnostic based on antigens from M. tuberculosis |
US7037510B2 (en) | 1997-04-18 | 2006-05-02 | Statens Serum Institut | Hybrids of M. tuberculosis antigens |
US6613881B1 (en) * | 1997-05-20 | 2003-09-02 | Corixa Corporation | Compounds for immunotherapy and diagnosis of tuberculosis and methods of their use |
US6555653B2 (en) | 1997-05-20 | 2003-04-29 | Corixa Corporation | Compounds for diagnosis of tuberculosis and methods for their use |
EP1003870A1 (en) * | 1997-07-16 | 2000-05-31 | Institut Pasteur | A polynucleotide functionally coding for the lhp protein from mycobacterium tuberculosis, its biologically active derivative fragments, as well as methods using the same |
EP1484405A1 (en) * | 1997-11-10 | 2004-12-08 | Statens Serum Institut | Nucleic acid fragments and polypeptide fragments derived from M. Tuberculosis |
NZ504951A (en) * | 1997-11-10 | 2001-06-29 | Statens Seruminstitut | Nucleic acid fragments and polypeptide fragments derived from M. tuberculosis |
EP0921397A1 (en) * | 1997-12-08 | 1999-06-09 | Kreatech Biotechnology B.V. | A method for identifying a mycobacterium species |
EP1068329A2 (en) * | 1998-04-07 | 2001-01-17 | Corixa Corporation | FUSION PROTEINS OF $i(MYCOBACTERIUM TUBERCULOSIS) ANTIGENS AND THEIR USES |
US6183957B1 (en) * | 1998-04-16 | 2001-02-06 | Institut Pasteur | Method for isolating a polynucleotide of interest from the genome of a mycobacterium using a BAC-based DNA library application to the detection of mycobacteria |
GB9808720D0 (en) * | 1998-04-23 | 1998-06-24 | Smithkline Beecham Biolog | Novel compounds |
AU5474399A (en) * | 1998-08-10 | 2000-03-06 | Chiron Corporation | Engineered antigen-presenting cells expressing an array of antigens and uses thereof |
US6465633B1 (en) | 1998-12-24 | 2002-10-15 | Corixa Corporation | Compositions and methods of their use in the treatment, prevention and diagnosis of tuberculosis |
JP4820489B2 (ja) | 1999-05-04 | 2011-11-24 | ユニバーシティー、オブ、メディシン、アンド、デンティストリー、オブ、ニュージャージー | ヒト型結核菌により発現され且つbcgによって発現されないタンパク質、ならびに診断薬およびワクチンとしてのそれらの使用 |
US7009042B1 (en) | 1999-10-07 | 2006-03-07 | Corixa Corporation | Methods of using a Mycobacterium tuberculosis coding sequence to facilitate stable and high yield expression of the heterologous proteins |
PT1517913E (pt) * | 1999-10-07 | 2007-05-31 | Corixa Corp | Sequência codificante de mycobacterium turberculosis para expressão de proteínas heterólogas. |
US6316205B1 (en) | 2000-01-28 | 2001-11-13 | Genelabs Diagnostics Pte Ltd. | Assay devices and methods of analyte detection |
AU2001241738A1 (en) | 2000-02-25 | 2001-09-03 | Corixa Corporation | Compounds and methods for diagnosis and immunotherapy of tuberculosis |
WO2001098460A2 (en) | 2000-06-20 | 2001-12-27 | Corixa Corporation | Fusion proteins of mycobacterium tuberculosis |
WO2003070187A2 (en) | 2002-02-15 | 2003-08-28 | Corixa Corporation | Fusion proteins of mycobacterium tuberculosis |
US20040072262A1 (en) | 2002-10-11 | 2004-04-15 | Montero-Julian Felix A. | Methods and systems for detecting MHC class I binding peptides |
WO2005077003A2 (en) * | 2004-02-09 | 2005-08-25 | Friedman Richard L | Pili from mycobacterium tuberculosis |
EP2226332A1 (en) * | 2004-06-17 | 2010-09-08 | Beckman Coulter, Inc. | Mycobacterium tuberculosis epitopes and methods of use thereof |
CN102220357B (zh) | 2004-11-16 | 2013-12-25 | 克鲁塞尔荷兰公司 | 包含重组病毒载体的多价疫苗 |
EP2426141B1 (en) | 2005-04-29 | 2014-10-01 | GlaxoSmithKline Biologicals S.A. | Method for preventing or treating M tuberculosis infection |
JP4943515B2 (ja) * | 2007-12-28 | 2012-05-30 | 株式会社ビーエル | 結核菌群の免疫検出法 |
EA201290590A1 (ru) | 2010-01-27 | 2013-03-29 | Глаксосмитклайн Байолоджикалс С.А. | Модифицированные туберкулезные антигены |
PH12013501204A1 (en) | 2010-12-14 | 2013-07-29 | Glaxosmithkline Biologicals Sa | Mycobacterium antigenic composition |
US9404923B2 (en) | 2012-02-07 | 2016-08-02 | Intuitive Biosciences, Inc. | Mycobacterium tuberculosis specific peptides for detection of infection or immunization in non-human primates |
CN107108704A (zh) | 2014-10-23 | 2017-08-29 | 凯杰科技有限公司 | 肽组合物及其用途 |
CN106008685A (zh) * | 2016-05-18 | 2016-10-12 | 首都医科大学附属北京胸科医院 | Trxc抗体识别的抗原多肽及其用途 |
WO2018068064A2 (en) * | 2016-09-22 | 2018-04-12 | Nguyen Hiep Hoa T | Mycobacterium tuberculosis proteins in diagnostic assays and devices for tuberculosis detection and diagnosis |
EP3399312A1 (fr) | 2017-05-05 | 2018-11-07 | Biomérieux | Procédé de détection d'une réponse cellulaire immune |
US20200191771A1 (en) | 2017-05-05 | 2020-06-18 | bioMérieux | Method for detecting an immune cellular response |
WO2021018919A1 (en) * | 2019-07-30 | 2021-02-04 | Dna Script | Template-free enzymatic synthesis of polynucleotides using poly(a) and poly(u) polymerases |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4751180A (en) | 1985-03-28 | 1988-06-14 | Chiron Corporation | Expression using fused genes providing for protein product |
US4935233A (en) | 1985-12-02 | 1990-06-19 | G. D. Searle And Company | Covalently linked polypeptide cell modulators |
EP0419355B1 (en) * | 1989-09-19 | 2000-02-09 | N.V. Innogenetics S.A. | Recombinant polypeptides and peptides, nucleic acids coding for the same and use of these polypeptides and peptides in the diagnostic of tuberculosis |
FR2677365B1 (fr) * | 1991-06-07 | 1995-08-04 | Pasteur Institut | Proteines de mycobacterium et applications. |
US5330754A (en) * | 1992-06-29 | 1994-07-19 | Archana Kapoor | Membrane-associated immunogens of mycobacteria |
US5359681A (en) | 1993-01-11 | 1994-10-25 | University Of Washington | Fiber optic sensor and methods and apparatus relating thereto |
DK79793D0 (da) * | 1993-07-02 | 1993-07-02 | Statens Seruminstitut | Diagnostic test |
DK79893D0 (da) * | 1993-07-02 | 1993-07-02 | Statens Seruminstitut | New vaccine |
-
1996
- 1996-08-30 AT AT09174756T patent/ATE530671T1/de active
- 1996-08-30 WO PCT/US1996/014675 patent/WO1997009429A2/en active Search and Examination
- 1996-08-30 CA CA002230927A patent/CA2230927A1/en not_active Abandoned
- 1996-08-30 EP EP96933010A patent/EP0850305B1/en not_active Expired - Lifetime
- 1996-08-30 JP JP9511465A patent/JPH11514217A/ja not_active Ceased
- 1996-08-30 CN CNA2004100351841A patent/CN1554664A/zh active Pending
- 1996-08-30 ES ES09174756T patent/ES2378051T3/es not_active Expired - Lifetime
- 1996-08-30 PT PT09174756T patent/PT2154248E/pt unknown
- 1996-08-30 AT AT96933010T patent/ATE324445T1/de not_active IP Right Cessation
- 1996-08-30 EP EP09174756A patent/EP2154248B1/en not_active Expired - Lifetime
- 1996-08-30 DE DE69636075T patent/DE69636075D1/de not_active Expired - Lifetime
- 1996-08-30 CN CNB961974672A patent/CN1154730C/zh not_active Expired - Lifetime
- 1996-08-30 MX MX9801687A patent/MX9801687A/es unknown
- 1996-08-30 DK DK09174756.8T patent/DK2154248T3/da active
- 1996-08-30 AU AU71587/96A patent/AU7158796A/en not_active Abandoned
-
2012
- 2012-01-25 CY CY201200004A patent/CY2618B2/el unknown
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111269856A (zh) * | 2020-02-19 | 2020-06-12 | 首都医科大学附属北京胸科医院 | 一种分离和/或富集结核分枝杆菌的方法 |
Also Published As
Publication number | Publication date |
---|---|
ATE324445T1 (de) | 2006-05-15 |
WO1997009429A3 (en) | 1997-07-17 |
CN1200146A (zh) | 1998-11-25 |
JPH11514217A (ja) | 1999-12-07 |
EP2154248B1 (en) | 2011-10-26 |
EP0850305B1 (en) | 2006-04-26 |
AU7158796A (en) | 1997-03-27 |
DE69636075D1 (de) | 2006-06-01 |
CY2618B2 (zh) | 2012-10-24 |
ATE530671T1 (de) | 2011-11-15 |
CA2230927A1 (en) | 1997-03-13 |
CN1154730C (zh) | 2004-06-23 |
EP0850305A2 (en) | 1998-07-01 |
MX9801687A (es) | 1998-11-29 |
DK2154248T3 (da) | 2012-01-30 |
PT2154248E (pt) | 2012-01-16 |
ES2378051T3 (es) | 2012-04-04 |
EP2154248A1 (en) | 2010-02-17 |
WO1997009429A2 (en) | 1997-03-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN1154730C (zh) | 用于结核病诊断的化合物和方法 | |
CN1117149C (zh) | 用于免疫治疗和诊断结核病的化合物和方法 | |
CN1312723A (zh) | 诊断结核病的化合物和方法 | |
CN1268745C (zh) | B组链球菌抗原 | |
US6338852B1 (en) | Compounds and methods for diagnosis of tuberculosis | |
CN1599751A (zh) | 分枝杆菌比较基因组学作为鉴定分枝杆菌病的诊断、预防或治疗靶的工具 | |
CZ126599A3 (cs) | Polypeptid pro imunoterapii a diagnosu tuberkulosy | |
WO1998016645A2 (en) | Compounds and methods for diagnosis of tuberculosis | |
SA99200488B1 (ar) | تركيبات وطرق لاج والوقاية من الاصابة بعدوي بكتيريا العصيات الفطرية للدرنM.tuberculosis | |
WO1998016646A9 (en) | Compounds and methods for immunotherapy and diagnosis of tuberculosis | |
CN1203180C (zh) | 来自脑膜炎奈瑟氏球菌的basb006多核苷酸和多肽 | |
CN1256147C (zh) | Cd8作为细胞免疫系统的抑制剂 | |
CN1166858A (zh) | tagA基因以及检测消化性溃疡和胃癌易感性的方法 | |
CN1968962A (zh) | 新型可溶性cd14抗原 | |
CN1798761A (zh) | 肠球菌抗原 | |
CN101066447A (zh) | 基因和蛋白质,及它们的用途 | |
CN1133594A (zh) | 单纯性疱疹病毒-2ul26基因,衣壳蛋白,免疫测定和蛋白酶抑制剂 | |
CN1694725A (zh) | 肽在早期检测分枝杆菌疾病中的应用 | |
CN1289519C (zh) | 肠道细菌的检测和识别 | |
WO2004083448A2 (en) | Molecular differences between species of the m.tuberculosis complex | |
CN1198931C (zh) | 粘膜炎莫拉氏菌basb034多肽及应用 | |
CN1484700A (zh) | aopB基因,蛋白,同系物,片段和它们的变体,以及它们在细胞表面展示方面的应用 | |
CN1241212A (zh) | 免疫治疗和诊断结核病的化合物和方法 | |
CN1653173A (zh) | 蜡状芽孢杆菌产生的呕吐毒素的合成酶、编码该酶的基因以及呕吐毒素的检测方法 | |
CN1242047A (zh) | 诊断结核病的化合物和方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
REG | Reference to a national code |
Ref country code: HK Ref legal event code: DE Ref document number: 1072061 Country of ref document: HK |
|
C12 | Rejection of a patent application after its publication | ||
RJ01 | Rejection of invention patent application after publication | ||
REG | Reference to a national code |
Ref country code: HK Ref legal event code: WD Ref document number: 1072061 Country of ref document: HK |