[go: up one dir, main page]

CN101988071A - 丙型肝炎病毒疫苗 - Google Patents

丙型肝炎病毒疫苗 Download PDF

Info

Publication number
CN101988071A
CN101988071A CN2009102512982A CN200910251298A CN101988071A CN 101988071 A CN101988071 A CN 101988071A CN 2009102512982 A CN2009102512982 A CN 2009102512982A CN 200910251298 A CN200910251298 A CN 200910251298A CN 101988071 A CN101988071 A CN 101988071A
Authority
CN
China
Prior art keywords
base pair
district
ala
leu
seq
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2009102512982A
Other languages
English (en)
Other versions
CN101988071B (zh
Inventor
E·A·埃米尼
D·C·卡斯罗
A·J·贝特
J·W·施弗
A·尼科西亚
A·拉姆
A·卢扎戈
R·科尔特斯
S·科罗卡
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
MSD Italia SRL
Merck Sharp and Dohme BV
Original Assignee
Istituto di Ricerche di Biologia Molecolare P Angeletti SpA
Schering Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Istituto di Ricerche di Biologia Molecolare P Angeletti SpA, Schering Corp filed Critical Istituto di Ricerche di Biologia Molecolare P Angeletti SpA
Publication of CN101988071A publication Critical patent/CN101988071A/zh
Application granted granted Critical
Publication of CN101988071B publication Critical patent/CN101988071B/zh
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/005Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from viruses
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P1/00Drugs for disorders of the alimentary tract or the digestive system
    • A61P1/16Drugs for disorders of the alimentary tract or the digestive system for liver or gallbladder disorders, e.g. hepatoprotective agents, cholagogues, litholytics
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P31/00Antiinfectives, i.e. antibiotics, antiseptics, chemotherapeutics
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P31/00Antiinfectives, i.e. antibiotics, antiseptics, chemotherapeutics
    • A61P31/12Antivirals
    • A61P31/14Antivirals for RNA viruses
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • C12N15/86Viral vectors
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K39/00Medicinal preparations containing antigens or antibodies
    • A61K2039/51Medicinal preparations containing antigens or antibodies comprising whole cells, viruses or DNA/RNA
    • A61K2039/525Virus
    • A61K2039/5256Virus expressing foreign proteins
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K39/00Medicinal preparations containing antigens or antibodies
    • A61K2039/51Medicinal preparations containing antigens or antibodies comprising whole cells, viruses or DNA/RNA
    • A61K2039/53DNA (RNA) vaccination
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K39/00Medicinal preparations containing antigens or antibodies
    • A61K2039/545Medicinal preparations containing antigens or antibodies characterised by the dose, timing or administration schedule
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K39/00Medicinal preparations containing antigens or antibodies
    • A61K2039/57Medicinal preparations containing antigens or antibodies characterised by the type of response, e.g. Th1, Th2
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2710/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA dsDNA viruses
    • C12N2710/00011Details
    • C12N2710/10011Adenoviridae
    • C12N2710/10311Mastadenovirus, e.g. human or simian adenoviruses
    • C12N2710/10341Use of virus, viral particle or viral elements as a vector
    • C12N2710/10343Use of virus, viral particle or viral elements as a vector viral genome or elements thereof as genetic vector
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2770/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssRNA viruses positive-sense
    • C12N2770/00011Details
    • C12N2770/24011Flaviviridae
    • C12N2770/24211Hepacivirus, e.g. hepatitis C virus, hepatitis G virus
    • C12N2770/24222New viral proteins or individual genes, new structural or functional aspects of known viral proteins or genes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2770/00MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA ssRNA viruses positive-sense
    • C12N2770/00011Details
    • C12N2770/24011Flaviviridae
    • C12N2770/24211Hepacivirus, e.g. hepatitis C virus, hepatitis G virus
    • C12N2770/24234Use of virus or viral component as vaccine, e.g. live-attenuated or inactivated virus, VLP, viral protein
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2800/00Nucleic acids vectors
    • C12N2800/10Plasmid DNA
    • C12N2800/108Plasmid DNA episomal vectors
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2840/00Vectors comprising a special translation-regulating system
    • C12N2840/20Vectors comprising a special translation-regulating system translation of more than one cistron
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N2840/00Vectors comprising a special translation-regulating system
    • C12N2840/20Vectors comprising a special translation-regulating system translation of more than one cistron
    • C12N2840/203Vectors comprising a special translation-regulating system translation of more than one cistron having an IRES

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Medicinal Chemistry (AREA)
  • Virology (AREA)
  • Animal Behavior & Ethology (AREA)
  • Pharmacology & Pharmacy (AREA)
  • General Chemical & Material Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Public Health (AREA)
  • Veterinary Medicine (AREA)
  • Molecular Biology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • Biochemistry (AREA)
  • Zoology (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Biophysics (AREA)
  • Wood Science & Technology (AREA)
  • Oncology (AREA)
  • Biomedical Technology (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Communicable Diseases (AREA)
  • Plant Pathology (AREA)
  • Microbiology (AREA)
  • Physics & Mathematics (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Medicines Containing Antibodies Or Antigens For Use As Internal Diagnostic Agents (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
  • Peptides Or Proteins (AREA)
  • Medicines Containing Material From Animals Or Micro-Organisms (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)

Abstract

丙型肝炎病毒疫苗,本发明涉及Ad6载体和编码含有失活的NS5B RNA-依赖型RNA聚合酶区的Met-NS3-NS4A-NS4B-NS5A-NS5B多肽的核酸。所述核酸特别适合用作提供多种抗原的腺病毒载体或DNA质粒疫苗的成分它,用于产生针对HCV的HCV特异性细胞介导的免疫(CMI)反应。

Description

丙型肝炎病毒疫苗 
本申请是以下申请的分案申请:申请日:2002年10月10日;申请号:02824665.9(PCT/US02/32512);发明名称:同上。 
相关申请 
本申请要求申请日为2002年3月13日的美国临时申请流水号60/363,774和申请日为2001年10月11日的美国临时申请流水号60/328,655的优先权,以上两份申请分别被收作本文参考。 
发明背景 
在本申请中所引用的参考文献并非承认是本发明的现有技术。 
世界人口的大约3%受到了丙肝病毒(HCV)的感染(Wasley等,Semin.Liver Dis.20,1-16,2000)。接触HCV导致明显的急性疾病的只占很小的百分比,而在大多数情况下所述病毒会形成慢性感染,导致肝脏炎症并且缓慢发展成肝脏衰竭和硬化(Iwarson,FEMSMicrobiol.Rev.14,201-204,1994)。另外,流行病学调查表明,HCV在肝细胞癌的发病方面起着重要作用(Kew,FEMS Microbiol.Rev.14,211-220,1994,Alter,Blood 85,1681-1695,1995)。 
在1992年对HCV进行常规血液筛查之前,大部分感染是通过意外接触受感染的血液、血液制品或移植器官而感染的。在进行HCV液筛查的地方,HCV主要是通过直接透过皮肤接触受感染的血液,即静脉内用药而感染的。较少见的传播方法包括围产期接触,血液透析,以及与HCV感染患者的性接触(Alter等,N.Engl.J.Med.341(8),556-562,1999,Alter,J.Hepatol.31Suppl.88-91,1999.Semin.Liver.Dis.201,1-16,2000)。 
HCV基因组由大约9.5kb的单链RNA组成,它编码具有大约3000个氨基酸的前体多蛋白(Choo等,Science 244,362-364,1989,Choo等,Science 244,359-362,1989,Takamizawa等,J.Virol.65,1105-1113,1991)。所述HCV多蛋白包括以下顺序的病毒蛋白: C-E1-E2-p7-NS2-NS3-NS4A-NS4B-NS5A-NS5B。 
各个病毒蛋白是通过HCV多蛋白的蛋白水解而产生的。宿主细胞蛋白酶能释放推测的结构蛋白C,E1,E2,和p7,并且在810号氨基酸上产生NS2的N-末端(Mizushima等,J.Virol.68,2731-2734,1994,Hijikata等,P.N.A.S.USA 90,10773-10777,1993)。 
推测非结构蛋白NS3,NS4A,NS4B,NS5A和NS5B形成了病毒复制机制,并且是从所述多蛋白中释放出来的。与NS2和NS3的N-末端相关的锌-依赖型蛋白酶负责NS2和NS3之间的裂解(Grakoui等,J.Virol.67,1385-1395,1993,Hijikata等,P.N.A.S.USA90,10773-10777,1993)。位于NS3的N-末端结构域中的一种特殊的丝氨酸蛋白酶,负责在NS3/NS4A,NS4A/NS4B,NS4B/NS5A和NS5A/NS5B接合处的蛋白水解裂解(Bartenschlager等,J.Virol.67,3835-3844,1993,Grakoui等,Proc.Natl.Acad.Sci.USA 90,10583-10587,1993,Tomei等,J.Virol.67,4017-4026,1993)。NS4A提供了NS3活性的辅因子(Failla等,J.Virol.68,3753-3760,1994,De Francesco等,美国专利号5,739,002)。 
NS5A是能产生干扰素抗性的高度磷酸化的蛋白(De Francesco等,Semin.Liver Dis.,20(1),69-83,2000,Pawlotsky,ViralHepat.Suppl.1,47-48,1999)。 
NS5B提供了一种RNA-依赖型RNA聚合酶(De Francesco等,国际公开号WO 96/37619,Behrens等,EMBO 15,12-22,1996,Lohmann等,Virology 249,108-118,1998)。 
发明概述 
本发明涉及Ad6载体和编码含有失活的NS5B RNA-依赖型RNA聚合酶区的Met-NS3-NS4A-NS4B-NS5A-NS5B多肽的核酸。所述核酸特别适合用作提供多种抗原的腺病毒载体或DNA质粒疫苗的成分,用于产生针对HCV的HCV特异性细胞介导的免疫(CMI)反应。 
HCV特异性CMI反应表示能识别HCV抗原的细胞毒性T淋巴细胞和T辅助细胞的产生。CMI反应还可以包括非HCV特异性免疫作用。 
优选的核酸编码Met-NS3-NS4A-NS4B-NS5A-NS5B多肽,它基本上与SEQ.ID.NO.1相似,并且具有足够的蛋白酶活性,以便对它自 身进行加工,产生基本上相似于存在于SEQ.ID.NO.1中的NS5B区的至少一种多肽。所产生的相当于NS5B区的多肽是无酶促活性的。更优选的是,所述HCV多肽具有足够的蛋白酶活性,以便产生基本上相似于存在于SEQ.ID.NO.1中的NS3,NS4A,NS4B,NS5A,和NS5B区的多肽。 
所提到的“基本上相似的序列”表示与参考序列的同一性至少为大约65%。因此,举例来说,具有基本上相似于SEQ.ID.NO.1的氨基酸序列的多肽,与SEQ.ID.NO.1具有至少大约65%的总体氨基酸同一性。 
相当于NS3,NS4A,NS4B,NS5A,和NS5B的多肽,与SEQ.ID.NO.1上的相应的区具有至少大约65%的氨基酸序列同一性。所述相应的多肽在本文中又被称为NS3,NS4A,NS4B,NS5A和NS5B多肽。 
因此,本发明的第一方面披露了包括编码基本上相似于SEQ.ID.NO.1的Met-NS3-NS4A-NS4B-NS5A-NS5B多肽的核苷酸序列的核酸。所编码的多肽具有足够的蛋白酶活性,以便对它自身进行加工,产生无酶促活性的NS5B多肽。 
在一种优选实施方案中,所述核酸是能够在需要的人细胞中表达Met-NS3-NS4A-NS4B-NS5A-NS5B多肽的表达载体。在人细胞内的表达具有治疗作用,可以有效治疗HCV感染,并且预防性治疗HCV感染。 
表达载体包括编码一种多肽的核苷酸序列以及进行正确转录和加工的调节元件。可以存在的调节元件包括与编码所述多肽的核苷酸天然相关的调节元件,以及不是与所述核苷酸序列天然相关的外源调节元件。诸如外源激发子的外源调节元件可用于在特定宿主中表达,如在人细胞中表达。可用于功能性表达的调节元件的例子包括激发子,终止子,核糖体结合位点和聚腺苷酸化信号。 
本发明的另一方面,披露了包括能够在人细胞中表达基本相似于SEQ.ID.NO.1的Met-NS3-NS4A-NS4B-NS5A-NS5B多肽的基因表达盒的核酸。所述多肽能够对它自身进行加工,以便产生无酶促活性的NS5B蛋白。所述基因表达盒至少包括以下部分: 
a)与编码多肽的核苷酸序列转录性偶联的激发子; 
b)与所述核苷酸序列功能性偶联的5′核糖体结合位点; 
c)与所述核苷酸序列的3′末端连接的终止子;和 
d)与所述核苷酸序列功能性偶联的3′聚腺苷酸化信号。 
所提到的“转录性偶联”表示所述激发子的定位使得可以通过结合在所述激发子上的RNA聚合酶使核苷酸序列转录。转录性偶联并不要求被转录的序列靠近所述激发子。 
所提到的“功能性偶联”表示介导一种对所述核苷酸序列的作用的能力。功能性偶联并不需要所偶联的序列彼此接近。与所述核苷酸序列功能性偶联的聚腺苷酸化信号有利于转录的RNA的裂解和聚腺苷酸化。与所述核苷酸序列功能性偶联的5’核糖体结合位点有利于核糖体结合。 
在优选实施方案中,所述核酸是适合用于治疗HCV的治疗性用途或用作生产治疗载体的中间物的DNA质粒载体或腺病毒载体。治疗HCV,包括主动治疗HCV感染和预防性治疗HCV感染。 
本发明的另一方面披露了包括能够表达基本上相似于SEQ.ID.NO.1的多肽的Met-NS3-NS4A-NS4B-NS5A-NS5B表达盒的腺病毒载体,所述腺病毒载体是通过以下方法生产的,该方法包括(a)同源重组和(b)腺病毒载体回收(rescue)。所述同源重组步骤中产生了一种腺病毒基因组质粒。所述腺病毒载体回收步骤产生了来自所述腺病毒基因组质粒的腺病毒载体。 
本文所披露的腺病毒基因组质粒包括一种重组腺病毒基因组,它具有一个在E1区上的缺失,和任选在E3区上的缺失,以及插入所述缺失区之一中的基因表达盒。所述重组腺病毒基因组是由基本上相似于一种或多种腺病毒血清型的区域组成的。 
本发明的另一方面披露了包括SEQ.ID.NO.4的核酸序列的腺病毒载体或它的衍生物,其中,所述衍生物的存在于SEQ.ID.NO.4上的HCV多蛋白编码序列被SEQ.ID.NO.3,SEQ.ID.NO.10或SEQ.ID.NO.11中任一个的HCV多蛋白编码序列所取代。 
本发明的另一方面披露了一种包括含有编码基本上相似于SEQ.ID.NO.1的Met-NS3-NS4A-NS4B-NS5A-NS5B多肽的序列的核酸的培养的重组细胞。所述重组细胞具有多种用途,如用于通过载体构建方法复制编码所述多肽的核酸。 
本发明的另一方面披露了一种制备包括能够表达基本上相似于SEQ.ID.NO.1的多肽的Met-NS3-NS4A-NS4B-NS5A-NS5B表达盒的 腺病毒载体的方法。该方法包括以下步骤:(a)生产包括重组腺病毒基因组的腺病毒基因组质粒,它在E1和E3区具有缺失,并且具有插入所述缺失区之一中的基因表达盒,和(b)从所述腺病毒基因组质粒中回收腺病毒载体。 
本发明的另一方面披露了包括用于表达基本上相似于SEQ.ID.NO.1的Met-NS3-NS4A-NS4B-NS5A-NS5B多肽的载体和可以药用载体的药物组合物。所述载体适合给患者施用,并且在患者体内表达多肽。 
“患者”表示能够感染HCV的哺乳动物。患者可能感染了或没有感染HCV。患者的例子有人和黑猩猩。 
本发明的另一方面披露了一种治疗患者的方法,包括给所述患者施用有效量的表达基本上相似于SEQ.ID.NO.1的Met-NS3-NS4A-NS4B-NS5A-NS5B多肽的载体的步骤。所述载体适合给患者施用,并且在患者体内表达多肽。 
进行治疗的患者可能有或没有感染HCV。对于感染了HCV的患者来说,有效量足以获得以下作用中的一种或多种:减弱HCV复制的能力,减少HCV负荷,提高对病毒的清除,并且增强一种或多种HCV特异性CMI反应。对于没有感染HCV的患者来说,有效量是足以获得下列一种或多种效果的用量:增强产生针对HCV感染的HCV特异性CMI反应的一种或多种成分的能力,降低了对HCV感染的易感性,和减弱了传染性病毒建立导致慢性疾病的持久感染的能力。 
本发明的另一方面涉及包括Ad6区和一个不存在于Ad6中的区的重组核酸。所提到的“重组”核酸表示存在两个或两个以上不是天然彼此相关的核酸区。所述Ad6重组核酸优选包括Ad6区和编码与Ad6异源的多肽的基因表达盒。 
通过本文所提供的包括不同实施例的其他说明,可以理解本发明的其他特征和优点。所提供的实施例说明了用于实施本发明的不同成分和方法。这些实施例不构成对本发明的限定。根据本发明的说明,技术人员能够确定和采用可用于实施本发明的其他成分和方法。 
附图的简要说明 
图1A和1B表示SEQ.ID.NO.1。 
图2A,2B,2C和2D表示SEQ.ID.NO.2。SEQ.ID.NO.2 提供了编码SEQ.ID.NO.1的核苷酸序列,同时提供了优化的内部核糖体进入位点和TAAA终止序列。1-6号核苷酸提供了优化的内部核糖体进入位点。7-5961号核苷酸编码HCVMet-NS3-NS4A-NS4B-NS5A-NS5B多肽,5137-5145号位置上的核苷酸提供了1711-1713号氨基酸位置上的AlaAlaGly序列,它使得NS5B失活。5962-5965号核苷酸提供了TAAA终止序列。 
图3A,3B,3C和3D表示SEQ.ID.NO.3。SEQ.ID.NO.3是SEQ.ID.NO.2的密码子优化形式。7-5961号核苷酸编码HCVMet-NS3-NS4A-NS4B-NS5A-NS5B多肽。 
图4A-4M表示MRKAd6-NSmut(SEQ.ID.NO.4)。SEQ.ID.NO.4是包括一个表达盒的腺病毒载体,其中,SEQ.ID.NO.1的多肽是由SEQ.ID.NO.2编码的。碱基对1-450相当于Ad5的碱基对1-450;碱基对462-1252相当于人CMV激发子;碱基对1258-1267相当于Kozak序列;碱基对1264-7222相当于NS基因;碱基对7231-7451相当于BGH聚腺苷酸化信号;碱基对7469-9506相当于Ad5碱基对3511-5548;碱基对9507-32121相当于Ad6碱基对5542-28156;碱基对32122-35117相当于Ad6碱基对30789-33784;碱基对35118-37089相当于Ad5碱基对33967-35935。 
图5A-50表示SEQ.ID.NOs.5和6。SEQ.ID.NO.5编码具有有活性的RNA依赖型RNA聚合酶的HCVMet-NS3-NS4A-NS4B-NS5A-NS5B多肽。SEQ.ID.NO.6提供了所述多肽的氨基酸序列。 
图6A-6C提供了pV1JnsA的核酸序列(SEQ.ID.NO.7)。 
图7A-7O提供了Ad6基因组的核酸序列(SEQ.ID.NO.8)。 
图8A-8K提供了Ad5基因组的核酸序列(SEQ.ID.NO.9)。 
图9表示Ad6基因组的不同的区。线性(35759bp)ds DNA基因组用双平行线表示,并且被划分成100个作图单位。转录单位是以相对它们在基因组上的位置和方向形式示出的。早期基因(E1A,E1B,E2A/B,E3和E4)是通过灰色箭头表示的,通过黑色箭头表示的晚期基因(LI-L5),是通过对由主要晚期激发子(MLP)产生的转录物的可变剪接而产生的,并且它们都包括位于5′末端的三联前导序列(1,2,3)。E1区位于大约1.0-11.5的作图单位,E2区位于75.0-11.5的作 图单位,E2位于76.1-86.7的作图单位,E4区位于99.5-91.2的作图单位。所述主要晚期转录单位位于16.0和91.2作图单位之间。 
图10表示回收含有Ad6和Ad5区的pAdE1-E3+的同源重组。 
图11表示回收包括Ad6区的pAdE1-E3+的同源重组。 
图12表示来自用表达不同的HCV NS盒的质粒DNA转染的293细胞的全细胞提取物的Western印迹。用特异性抗体检测成熟的NS3和NS5A产物。″pV1Jns-NS″表示pV1JnsA质粒,其中,Met-NS3-NS4A-NS4B-NS5A-NS5B多肽是由SEQ.ID.NO.5编码的,并且SEQ.ID.NO.5被插入SEQ.ID.NO.7的1881-1912号碱基之间。″pV1Jns-NSmut″表示pV1JnsA质粒,其中,SEQ.ID.NO.2被插入SEQ.ID.NO.7的1882-1925号碱基之间。″pV1Jns-NSOPTmut″表示pV1JnsA质粒,其中SEQ.ID.NO.3被插入SEQ.ID.NO.7的1881-1905号碱基之间。 
图13A和13B表示通过IFNγELIspot显示的在C57black6小鼠(A)和BalbC小鼠(B)体内诱导的T细胞反应,包括用基因电转移装置(GET)分别注射25微克和50微克的编码不同HCV NS盒的质粒DNA。 
图14表示在感染HeLa细胞之后,来自不同腺病毒载体的蛋白表达。MRKAdS-NSmut是基于Ad5序列的腺病毒载体(SEQ.ID.NO.9),其中,Ad5基因组具有碱基对451-3510的E1缺失,碱基对28134-30817的E3缺失,并且具有插入450-3511号位置之间的SEQ.ID.NO.4的碱基对451-7468所提供的NS3-NS4A-NS4B-NS5A-NS5B表达盒。Ad5-NS是基于Ad5主链的腺病毒载体,具有碱基对342-3523的E1缺失,和碱基对28134-30817的E3缺失,并且包括编码来自SEQ.ID.NO.5的NS3-NS4A-NS4B-NS5A-NS5B的表达盒。″MRKAd6-NSOPTmut″表示具有修饰过的SEQ.ID.NO.4序列的腺病毒载体,其中,SEQ.ID.NO.4的碱基对1258-7222被SEQ.ID.NO.3所取代。 
图15表示由IFNγELIspot显示的通过两次注射109vp含有不同HCV非结构基因盒的腺病毒载体,在C57black6小鼠体内诱导的T细胞反应。 
图16A-16D表示由I FN γEL I s po t显示的通过一次或两次注射 1010vp(A)或1011vp(B)含有不同HCV非结构基因盒的腺病毒载体,在猕猴体内诱导的T细胞反应。 
图17A和17B表示由IFNγELIspot显示的通过两次注射1010vp(A)或1011vp(B)编码不同HCV非结构基因盒的腺病毒载体,在猕猴体内诱导的CD8+T细胞反应。 
图18A-18F表示由大量CTL分析显示的通过两次注射1011vp的Ad5-NS(A),MRKAdS-NSmut(B),或MRKAd6-NSmut(C)在猕猴体内诱导的T细胞反应。 
图19表示质粒pE2。 
图20A-D表示部分密码子优化序列NSsuboptmut(SEQ.ID.NO.10)。Met-NS3-NS4A-NS4B-NS5A-NS5B多肽的编码序列是从7-5961号碱基。 
本发明的详细说明 
本发明涉及Ad6载体和编码含有失活的NS5B区的Met-NS3-NS4A-NS4B-NS5A-NS5B多肽的核酸。提供失活的NS5B区,提供了NS5B抗原,同时降低了由活性病毒RNA聚合酶导致的不利副作用的可能性。所述核酸的用途包括用作疫苗成分,以便将HCV多肽导入细胞,它能提供用于产生针对HCV的CMI反应的多种抗原,并且用作用于生产所述疫苗成分的中间产物。 
适应性细胞免疫反应,由于主要组织相容性复合物(MHC)I型和II型表达的普遍分布,起着能够在整体身体内的HCV感染的细胞中识别病毒抗原的作用,以便诱导免疫学记忆,并且保持免疫学记忆。上述功能是由抗原特异性CD4+T辅助细胞(Th)和CD8+细胞毒性T细胞(CTL)提供的。 
在通过它们的特异性T细胞受体激活之后,HCV特异性Th细胞实现了多种免疫调控功能,其中大部分功能是通过Th1和Th2细胞因子介导的。HCV特异性Th细胞有助于B细胞的激活和分化,并且有助于病毒特异性细胞毒性T细胞的诱导和刺激。Th细胞与CTL一起还能分泌能抑制若干病毒的复制和基因表达的IFN-γ和TNF-α。另外,Th细胞和CTL即主要效应细胞,可以诱导病毒感染过的细胞的程序凋亡和裂解。 
HCV特异性CTL是由专门的抗原呈递细胞(pAPCs)加工的抗原产生的。抗原可以是在pAPCs内合成的或者是导入的。PAPC中的抗原合成,可以通过将编码序列所述抗原的表达盒导入所述细胞而完成。 
施用核酸疫苗的一种优选途径是肌内途径。肌内施用似乎会导致将核酸导入体细胞和pAPCs,并且在那里表达。在所述体细胞中产生的HCV抗原可以转移到pAPCs,以便在I类MHC分子中呈递(Donnelly等,Annu.Rev.Immunol.15:617-648,1997)。 
PAPCs在蛋白酶体复合物中将较长的抗原加工成较小的肽抗原。所述抗原被转运到内质网/高尔基复合体分泌途径中,以便与I类MHC蛋白结合。CD8+T淋巴细胞通过T细胞受体(TCR)和CD8细胞表面蛋白识别与I类MHC结合的抗原。 
用编码Met-NS3-NS4A-NS4B-NS5A-NS5B多肽的核酸作为疫苗成分,可以从一种单一载体生产多种能够产生CMI反应的抗原。所述多肽应当能够对它自身进行充分加工,以便产生至少一个相当于NS5B的区。优选的核酸编码基本上相似于SEQ.ID.NO.1的氨基酸序列,它具有足够的蛋白酶活性,以便对它自身进行加工,产生基本上相似于存在于SEQ.ID.NO.1上的NS3,NS4A,NS4B,NS5A和NS5B的各个HCV多肽。 
基本上相似于SEQ.ID.NO.1的多肽,具有足够的蛋白酶活性,在细胞中对它自身进行加工,给所述细胞提供存在于若干不同HCV菌株中的T细胞表位。蛋白酶活性是由NS3和NS3/NS4A蛋白提供的,在合适的裂解位点上消化Met-NS3-NS4A-NS4B-NS5A-NS5B多肽,以便释放相当于NS3,NS4A,NS4B,NS5A,和NS5B的多肽。Met-NS3-NS4A-NS4B-NS5A-NS5B的自我加工,产生了接近天然存在的HCV多肽的多肽。 
根据本文所提供的指导,可以产生足够强的免疫反应,以便在患者体内获得有益作用。所提供的指导包括与HCV序列选择,载体选择,载体生产,组合治疗和施用相关的信息。 
I.HCV序列 
可以将多种不同的核酸序列用作疫苗成分,以便给细胞提供HCVMet-NS3-NS4A-NS4B-NS5A-NS5B多肽,或作为生产疫苗成分的中间 物。用于获得合适核酸序列的起点,优选是被修饰而产生失活的NS5B的天然存在的NS3-NS4A-NS4B-NS5A-NS5B多肽。 
在以下文献中披露了利用HCV核酸序列提供HCV非结构抗原,以便产生CMI反应:Cho等,Vaccine17:1136-1144,1999,Paliard等,国际公开号WO01/30812(并不被认为是本发明的现有技术),和Coit等,国际公开号WO01/38360(并不被认为是本发明的现有技术)。例如,所述文献没有披露对它自身进行加工以便产生失活的NS5B的多肽,特别是没有披露HCV序列与本文所采用的递送载体的组合。 
对HCV Met-NS3-NS4A-NS4B-NS5A-NS5B多肽序列的修饰,可以通过改变其编码核酸而产生。可以进行改变,以便产生缺失,插入和取代。 
可以在NS5B上进行小的修饰,以便通过导向于复制所必需的基序产生失活的聚合酶。NS5B活性所必需的基序的例子,以及为了生产失活的NS5B而可以进行的修饰披露于以下文献中:Lohmann等,Journal of Virology 71:8416-8426,1997,和Kolykhalov等,Journal of Virology 74:2046-2051,2000。 
在产生对HCVMet-NS3-NS4A-NS4B-NS5A-NS5B多肽的修饰时需要考虑的其他因素,包括保持自身加工的能力和保持T细胞抗原。HCV多肽进行自身加工的能力,在很大程度上是通过功能性NS3蛋白酶确定的。能保持NS3活性蛋白酶活性的修饰,可以通过NS3蛋白,用作NS3的辅因子的NS4A,和存在于NS3-NS4A-NS4B-NS5A-NS5B多肽中的NS3蛋白酶识别位点而获得。 
可以对天然存在的NS3-NS4A-NS4B-NS5A-NS5B多肽序列进行不同的修饰,以便产生能够诱导多种T细胞反应的多肽。影响一种多肽诱导多种T细胞反应的能力的因素,包括HCV特异性T细胞抗原区的保存或导入,以及不同T细胞抗原区在不同HCV分离物中的优势。 
天然存在的HCV分离物的多种例子为本领域所熟知。HCV分离物可以划分成以下六种包括一种或多种亚型的主要基因型:HCV-1/(1a,1b,1c),HCV-2/(2a,2b,2c),HCV-3/(3a,3b,10a),HCV-4/(4a),HCV-5/(5a)和HCV-6/(6a,6b,7b,8b,9a,11a)(Simmonds,J.Gen.Virol.,693-712,2001)。诸如HCV-BK,HCV-J,HCV-N,HCV-H的特定HCV序列的例子,业已在GenBank保藏,并且在多个文献中披露(例 如,参见Chamberlain等,J.Gen.Virol.,1341-1347,1997)。 
例如,HCV T细胞抗原可以通过经验性实验鉴定。鉴定T细胞抗原的一种方法包括用较大长度的多肽产生一系列重叠的短肽,然后从受感染的患者中筛选T细胞群体的阳性克隆。阳性克隆是通过特定肽激活/激发的。可以将诸如IFNγ-ELISPOT,IFNγ-细胞内染色和大量(bulk)CTL分析的技术用于测定肽活性。由此鉴定的肽可以视为代表了各病原体的T细胞表位。 
例如,通过生产包括来自两种或两种以上天然存在的序列的区域的杂合NS3-NS4A-NS4B-NS5A-NS5B多肽,可以将来自不同HCV分离物的HCV T细胞抗原区导入一种单一序列。所述杂合体可以包括其他修饰,所述修饰优选不会减弱所述多肽产生HCV CMI反应的能力。 
可以用本文所披露的或为本领域所熟知的技术,确定修饰过的Met-NS3-NS4A-NS4B-NS5A-NS5B多肽对它自身进行加工,并且产生CMI反应的能力。所述技术包括使用IFNγ-ELISPOT,IFNγ-细胞内染色和大量CTL分析,测定HCV特异性CMI反应。 
A.Met-NS3-NS4A-NS4B-NS5A-NS5B序列 
SEQ.ID.NO.1提供了优选的Met-NS3-NS4A-NS4B-NS5A-NS5B序列。SEQ.ID.NO.1包括大量的HCV特异性T细胞抗原,这些抗原存在于若干不同的HCV分离物中。SEQ.ID.NO.1与HCV BK菌株核苷酸序列(GenBank保藏号M58335)的NS3-NS4A-NS4B-NS5A-NS5B部分相似。 
在SEQ.ID.NO.1中,对于I类MHC分子识别来说,重要的锚定位点是保守的或代表HCV多蛋白的NS3-NS4A-NS4B-NS5A-NS5B部分上的20种已知T细胞表位中的18种的保守性取代。就其余两种已知的T细胞表位而言,一种在SEQ.ID.NO.1上具有一个非保守性锚定取代,该取代仍然能被不同的HLA超类型识别,而一种表位具有一个不是保守的锚定残基。HCV T-细胞表位披露于以下文献中:Chisari等,Curr.Top.Microbiol Immunol.,242:299-325,2000,和Lechner等J.Exp.Med.9:1499-1512,2000。 
HCV-BK NS3-NS4A-NS4B-NS5A-NS5B核苷酸序列和SEQ.ID.NO.1之间的差别包括在5’末端引入一个甲硫氨酸,以及修饰过的NS5B活性位点残基在SEQ.ID.NO.1上的存在。所述修饰将GlyAspAsp换成 了AlaAlaGly(1711-1713号残基),以便使NS5B失活。 
所编码的HCVMet-NS3-NS4A-NS4B-NS5A-NS5B多肽,优选具有基本上相似于SEQ.ID.NO.1的氨基酸序列。在不同的实施方案中,所编码的HCV Met-NS3-NS4A-NS4B-NS5A-NS5B多肽,与SEQ.ID.NO.1的氨基酸同一性为至少65%,至少75%,至少85%,至少95%,至少99%或100%;或与SEQ.ID.NO.1具有1-2,1-3,1-4,1-5,1-6,1-7,1-8,1-9,1-10,1-11,1-12,1-13,1-14,1-15,1-16,1-17,1-18,1-19,或1-20个氨基酸的差别。 
Met-NS3-NS4A-NS4B-NS5A-NS5B多肽和SEQ.ID.NO.1之间的氨基酸差别,是通过确定两种序列不同的氨基酸修饰的最低数量计算的。氨基酸修饰可以是缺失,添加,取代或它们的任意组合。 
氨基酸序列同一性,是通过本领域众所周知的方法确定的,所述方法将一种多肽的氨基酸序列与第二种多肽的氨基酸序列进行比较,并且产生一种序列比对。氨基酸同一性是通过所述比对计算的,包括统计具有相同氨基酸的比对的残基对的数量。 
用于确定序列同一性的方法包括披露于以下文献中的方法:Schuler,G.D.in Bioinformatics:A Practical Guide to theAnalysis of Genes and Proteins,Baxevanis,A.D.和Ouelette,B.F.F.,eds.,John Wiley&Sons,Inc,2001;Yona,等,in Bioinformatics:Sequence,structure and databanks,Higgins,D.and Taylor,W.eds,Oxford University Press,2000;andBioinformatics:Sequence and Genome Analysis,Mount,D.W.,ed.,Cold Spring Harbor Laboratory Press,2001。确定氨基酸序列同一性的方法,在可公开获得的计算机程序中进行了汇编,如GAP(Wisconsin Package Version 10.2,Genetics Computer Group(GCG),Madison,Wisc),BLAST(Altschul等,J.Mol.Biol.215(3):403-10,1990),和FASTA(Pearson,Methods in Enzymology 183:63-98,1990,R.F.Doolittle,ed)。 
在本发明的一种实施方案中,两种多肽之间的序列同一性是通过使用GAP程序确定的(Wisconsin Package Version 10.2,GeneticsComputer Group(GCG),Madison,Wisc)。GAP采用了Needleman和Wunsch的比对方法(Needleman,等,J.Mol.Biol.48:443-453, 1970)。GAP考虑了两种序列之间的所有可能的比对和空位位置,并且产生一种将匹配的残基数量最大化以及将空位的数量和大小最小化的总体比对。利用一种评分距阵确定符号匹配值。另外,为了限制向所述比对中插入空位,需要空位产生罚分和空位延伸罚分。利用GAP进行多肽比较的默认程序参数是BLOSUM62(Henikoff等,Proc.Natl.Acad.Sci.USA,89:10915-10919,1992)氨基酸评分距阵(MATrix=blosum62.cmp),空位产生参数(GAP权重=8),而空位延伸参数(LENgth权重=2)。 
更优选的HCV Met-NS3-NS4A-NS4B-NS5A-NS5B多肽,除了在它们的整个长度上基本上相似于SEQ.ID.NO.1之外,还能产生基本上相似于存在于SEQ.ID.NO.1上的相应的区域的各个NS3,NS4A,NS4B,NS5A和NS5B区,SEQ.ID.NO.1上的相应的区是以如下形式提供的:Met-NS3的1-632号氨基酸;NS4A的633-686号氨基酸;NS4B的687-947号氨基酸;NS5A的948-1394号氨基酸和NS5B的1395-1985号氨基酸。 
在不同实施方案中,NS3,NS4A,NS4B,NS5A和/或NS5B区与SEQ.ID.NO.1上的相应区域的氨基酸同一性为至少65%,至少75%,至少85%,至少95%,至少99%或100%;或具有1-2,1-3,1-4,1-5,1-6,1-7,1-8,1-9,1-10,1-11,1-12,1-13,1-14,1-15,1-16,1-17,1-18,1-19,或1-20个氨基酸的氨基酸差别。 
SEQ.ID.NO.1的氨基酸修饰,优选保持了所有的或大部分的T细胞抗原区。天然存在的氨基酸差别,是由于不同的氨基酸侧链(R基团)产生的。R基团能影响氨基酸的不同的性质,如物理尺寸,电荷,和疏水性。可以将氨基酸划分成以下不同类型:中性和疏水性(丙氨酸,缬氨酸,亮氨酸,异亮氨酸,脯氨酸,色氨酸,苯丙氨酸,和甲硫氨酸);中性和极性(甘氨酸,丝氨酸,苏氨酸,酪氨酸,半胱氨酸,天冬酰胺,和谷氨酰胺);碱性(赖氨酸,精氨酸,和组氨酸);和酸性(天冬氨酸和谷氨酸)。 
一般,在取代不同的氨基酸时,优选用具有相似性质的氨基酸取代。在特定类型内部取代不同的氨基酸,如用缬氨酸取代亮氨酸,用精氨酸取代赖氨酸,和用天冬酰胺取代谷氨酰胺是不会导致多肽三级结构改变的很好的候选取代。 
基于特定的氨基酸序列和已知的遗传密码的间并性,可以获得大量不同的编码核酸序列。遗传密码的间并性是由于几乎所有氨基酸都是由核苷酸三联体或″密码子″的不同组合编码的。特定密码子翻译成特定氨基酸为本领域所熟知(例如,参见Lewin GENESIV,p.119,Oxford University Press,1990)。氨基酸是由以下密码子编码的: 
A=Ala=丙氨酸:密码子GCA,GCC,GCG,GCU 
C=Cys=半胱氨酸:密码子UGC,UGU 
D=Asp=天冬氨酸:密码子GAC,GAU 
E=Glu=谷氨酸:密码子GAA,GAG 
F=Phe=苯丙氨酸:密码子UUC,UUU 
G=Gly=甘氨酸:密码子GGA,GGC,GGG,GGU 
H=His=组氨酸:密码子CAC,CAU 
I=Ile=异亮氨酸:密码子AUA,AUC,AUU 
K=Lys=赖氨酸:密码子AAA,AAG 
L=Leu=亮氨酸:密码子UUA,UUG,CUA,CUC,CUG,CUU 
M=Met=甲硫氨酸:密码子AUG 
N=Asn=天冬酰胺:密码子AAC,AAU 
P=Pro=脯氨酸:密码子CCA,CCC,CCG,CCU 
Q=Gln=谷氨酰胺:密码子CAA,CAG 
R=Arg=精氨酸:密码子AGA,AGG,CGA,CGC,CG G,CGU 
S=Ser=丝氨酸:密码子AGC,AGU,UCA,UCC,UCG,UCU 
T=Thr=苏氨酸:密码子ACA,ACC,ACG,ACU 
V=Val=缬氨酸:密码子GUA,GUC,GUG,GUU 
W=Trp=色氨酸:密码子UGG 
Y=Tyr=酪氨酸:密码子UAC,UAU。 
可以优化核酸序列,以便增强在宿主中的表达。要考虑的因素包括C:G含量,优选的密码子,以及避免抑制性二级结构。所述因素能够以不同的方式组合,以便获得在特定宿主中具有增强了的表达的核酸序列(例如,参见Donnelly等,国际公开号WO 97/47358)。 
特定序列在特定宿主中具有增强了的表达的能力涉及某些经验实验。所述实验包括测定保护性核酸序列的表达,以及,如果必要的话,改变所述序列。 
B.编码核苷酸序列 
SEQ.ID.NOs.2和3提供了编码Met-NS3-NS4A-NS4B-NS5A-NS5B序列的核苷酸序列的两种例子。SEQ.ID.NO.2的编码序列,与天然存在的HCV-BK序列(GenBank保藏号M58335)的NS3-NS4A-NS4B-NS5A-NS5B区相似(核苷酸序列同一性为99.4%),SEQ.ID.NO.3是SEQ.ID.NO.2的密码子优化形式。SEQ.ID.NOs.2和3具有78.3%的核苷酸序列同一性。 
HCV-BK NS3-NS4A-NS4B-NS5A-NS5B核苷酸(GenBank保藏号M58335)和SEQ.ID.NO.2之间的差别,包括SEQ.ID.NO.2具有一个核糖体结合位点,一个ATG甲硫氨酸密码子,一个编码修饰过的NS5B催化结构域的区,一种TAAA终止信号和另外30个核苷酸的差别。编码AlaAlaGly(1711-1713号残基)的修饰过的催化结构域取代了GlyAspAsp,以便使NS5B失活。 
编码HCV Met-NS3-NS4A-NS4B-NS5A-NS5B多肽的核苷酸序列,优选基本上相似于SEQ.ID.NO.2的编码区。在不同实施方案中,编码HCV Met-NS3-NS4A-NS4B-NS5A-NS5B多肽的核苷酸序列,与SEQ.ID.NO.2编码区的核苷酸序列的同一性为至少65%,至少75%,至少85%,至少95%,至少99%,或100%;或与SEQ.ID.NO.2具有1-2,1-3,1-4,1-5,1-6,1-7,1-8,1-9,1-10,1-11,1-12,1-13,1-14,1-15,1-16,1-17,1-18,1-19,1-20,1-25,1-30,1-35,1-40,1-45,或1-50个核苷酸的差别。 
编码Met-NS3-NS4A-NS4B-NS5A-NS5B的序列和SEQ.ID.NO.2编码区之间的核苷酸差别,是通过确定两种序列差别的核苷酸修饰的最低数量计算的。核苷酸修饰可以是缺失,添加,取代或它们的任意组合。 
核苷酸序列同一性,是通过本领域熟知的方法确定的,该方法比较了一种序列的核苷酸序列和另一种序列的核苷酸序列,以便产生一种序列比对。序列同一性是根据所述比对,通过统计具有相同核苷酸的比对位置的数量确定的。 
用于确定两种多核苷酸之间的核苷酸序列同一性的方法,包括披露于以下文献中的方法:Schuler,in Bioinformatics:A PracticalGuide to the Analysis of Genes and Proteins,Baxevanis,A.D. 和Ouelette,B.F.F.,eds.,John Wiley&Sons,Inc,2001;Yona等,.in Bioinformatics:Sequence,structure anddatabanks,Higgins,D.和Taylor,W.eds,Oxford UniversityPress,2000;and Bioinformatics:Sequence and Genome Analysis,Mount,D.W.,ed.,Cold Spring Harbor Laboratory Press,2001。确定核苷酸序列同一性的方法,在可公开获得的计算机程序中进行了汇编,如GAP(Wisconsin Package Version 10.2,Genetics ComputerGroup(GCG),Madison,Wisc),BLAST(Altschul等,J.Mol.Biol.215(3):403-10,1990),和FASTA(Pearson,W.R.,Methods inEnzymology 183:63-98,1990,R.F.Doolittle,ed)。 
在本发明的一种实施方案中,两种多核苷酸之间的序列同一性,是通过采用GAP确定的(Wisconsin Package Version 10.2,GeneticsComputer Group(GCG),Madison,Wisc)。GAP采用了Needleman和Wunsch的比对方法(Needleman等,J.Mol.Biol.48:443-453,1970)。GAP考虑了两种序列之间所有可能的比对和空位位置,并且产生了使匹配的残基数量最大化,并且使空位的数量和大小最小化的总体比对。用一种评分距阵确定符号匹配值。另外,需要用空位产生罚分和空位延伸罚分来限制将空位插入所述比对中。采用GAP的多核苷酸比较的默认程序参数是nwsgapdna.cmp评分距阵(MATrix=nwsgapdna.cmp),空位产生参数(GAP权重=50)和空位延伸参数(LENgth权重=3)。 
更优选的HCV Met-NS3-NS4A-NS4B-NS5A-NS5B核苷酸序列,除了在其整个长度上基本上相似之外,产生了基本上相似于存在于SEQ.ID.NO.2中的相应区域的各个NS3,NS4A,NS4B,NS5A和NS5B区。SEQ.ID.NO.2上的相应的编码区是以如下形式提供的:Met-NS3的7-1902号核苷酸;NS4A的1903-2064号核苷酸;NS4B 2065-2847号核苷酸;NS5A的2848-4188号核苷酸;NS5B的4189-5661号核苷酸。 
在不同实施方案中,NS3,NS4A,NS4B,NS5A和/或NS5B编码区与SEQ.ID.NO.2上的相应的区域上的核苷酸序列同一性为至少65%,至少75%,至少85%,至少95%,至少99%,或100%;或与SEQ.ID.NO.2具有1-2,1-3,1-4,1-5,1-6,1-7,1-8,1-9,1-10,1-11, 1-12,1-13,1-14,1-15,1-16,1-17,1-18,1-19,1-20,1-25,1-30,1-35,1-40,1-45,或1-50个核苷酸的差别。 
C.基因表达盒 
基因表达盒包括多肽表达所需要的元件。所提到的“多肽”没有提供大小限制,并且包括蛋白。存在于基因表达盒中的调节元件通常包括:(a)与编码所述多肽的核苷酸序列转录性偶联的激发子,(b)与所述核苷酸序列功能性偶联的5′核糖体结合位点,(c)与所述核苷酸序列的3′末端连接的终止子,和(d)与所述核苷酸序列功能性偶联的3′聚腺苷酸化信号。还可以存在用于增强或调控基因表达或多肽加工的其他调节元件。 
激发子是由RNA聚合酶识别,并且介导下游区域转录的遗传元件。优选的激发子是强激发子,它能提供较高水平的转录。强激发子的例子包括立即早期人巨细胞病毒激发子(CMV),和具有内含子A的CMV(Chapman等,Nucl.Acids Res.19:3979-3986,1991)。激发子的其他例子包括天然存在的激发子,如EF1α激发子,鼠CMV激发子,Rous肉瘤病毒激发子,和SV40早期/晚期激发子和β-肌动蛋白激发子;以及人工激发子,如合成的肌肉特异性激发子和嵌合型肌肉-特异性/CMV激发子(Li等,Nat.Biotechnol.17:241-245,1999,Hagstrom等,Blood 95:2536-2542,2000)。 
所述核糖体结合位点位于起始密码子上或靠近起始密码子。优选的核糖体结合位点的例子包括CCACCAUGG,CCGCCAUGG,和ACCAUGG,其中AUG是起始密码子(Kozak,Cell44:283-292,1986)。核糖体结合位点的另一种例子是GCCACCAUGG(SEQ.ID.NO.12)。 
聚腺苷酸化信号负责裂解转录的RNA,并且在所述RNA上添加poly(A)尾。高等真核生物中的聚腺苷酸化信号包括AAUAAA序列,距离聚腺苷酸化添加位点大约11-30个核苷酸。AAUAAA序列参与RNA裂解的信号传递(Lewin,Genes IV,Oxford University Press,NY,1990)。poly(A)尾对于mRNA加工来说是重要的。 
可以用作基因表达盒的一部分的聚腺苷酸化信号,包括最小兔β-珠蛋白聚腺苷酸化信号和牛生长激素聚腺苷酸化(BGH)(Xu等,Gene272:149-156,2001,Post等,美国专利U.S.5,122,458)。其他例子包括合成的聚腺苷酸化信号(SPA)和SV40聚腺苷酸化信号。所 述SPA序列如下:AAUAAAAGAUCUUUAUUUUCAUUAGAUCUGUGUGUUGGUUUUUUGUGUG(SEQ.ID.NO.13)。 
可以存在的用于增强或调控基因表达或多肽加工的其他调节元件的例子,包括增强子,前导序列和操纵子。增强子区能增强转录。增强子区的例子包括CMV增强子和SV40增强子(Hitt等,Methods inMolecular Genetics 7:13-30,1995,Xu,等,Gene 272:149-156,2001)。增强子区可以与激发子结合。 
前导序列是多肽上的氨基酸区,它能引导所述多肽进入蛋白酶体。编码序列所述前导序列的核酸是结构基因的5′末端,并且是随所述结构基因一起转录的。前导序列的例子是tPA。 
可以用操纵子序列调控基因表达。例如,可以利用Tet操纵子序列抑制基因表达。 
II.治疗性载体 
可以用适合治疗性施用的载体将编码Met-NS3-NS4A-NS4B-NS5A-NS5B多肽的核酸导入患者体内。合适的载体能够将核酸递送到靶细胞中,而又不会导致不可接受的副作用。 
细胞表达是利用编码Met-NS3-NS4A-NS4B-NS5A-NS5B多肽的基因表达盒实现的。所述基因表达盒包括用于在靶细胞内产生并且加工足够数量的核酸,以便获得有利效果的调节元件。 
可用于治疗性用途的载体的例子包括第一和第二代腺病毒载体,辅助依赖型腺病毒载体,腺伴随病毒载体,逆转录病毒载体,α病毒载体,Venezuelan马脑炎病毒载体,和质粒载体(Hitt等,Advancesin Pharmacology 40:137-206,1997,Johnston等,美国专利号6,156,588,和Johnston等,国际公开号WO 95/32733)。用于将Met-NS3-NS4A-NS4B-NS5A-NS5B多肽导入对象体内的优选载体,是第一代腺病毒载体和质粒DNA载体。 
A.第一代腺病毒载体 
用于表达基因表达盒的第一代腺病毒载体,包括E1和任选的E3缺失重组腺病毒基因组内的表达盒。E1区上的缺失足够大,以便去除腺病毒复制所必需的元件。 
用于表达Met-NS3-NS4A-NS4B-NS5A-NS5B多肽的第一代腺病毒 载体,包括E1和E3缺失的重组腺病毒基因组。E1区的缺失足够大,以便去除腺病毒复制所必需的元件。E1和E3区缺失的组合足够大,以便能容纳编码Met-NS3-NS4A-NS4B-NS5A-NS5B多肽的基因表达盒。 
所述腺病毒具有双链线性基因组,在两端具有反向末端重复。在病毒复制期间,将所述基因组包装在病毒衣壳内,以便形成毒粒。所述病毒通过病毒附着以及随后的内化,进入它的靶细胞(Hitt等,Advances in Pharmacology 40:137-206,1997)。 
腺病毒载体可以基于不同的腺病毒血清型,如出现在人或动物体内的血清型。动物腺病毒的例子包括牛,猪,黑猩猩,鼠,犬和禽(CELO)腺病毒。优选的腺病毒载体是基于人血清型的,更优选基于B,C或D型血清型。人腺病毒B,C,D或E血清型的例子包括2型(″Ad2″),4型(″Ad4″),5型(″Ad5″),6型(″Ad6″),24型(″Ad24″),26型(″Ad26″),34型(″Ad34″)和35型(″Ad35″)。腺病毒载体可以包括来自单一腺病毒或来自两种或两种以上腺病毒的区域。 
在不同的实施方案中,腺病毒是基于Ad5,Ad6,或它们的组合的。Ad5披露于以下文献中:Chroboczek等,J.Virology 186:280-285,1992。Ad6披露于图7A-7N中。包括Ad5区的基于Ad6的载体披露于下面所提供的实施例部分。 
腺病毒载体不一定完全去掉了它们的E1和E3区。相反,去掉了足够数量的E1区,使得在缺乏E1蛋白的条件下,不能复制的载体是以反式形式提供的;并且E1缺失和E1或E3缺失的组合大到足够容纳一个基因表达盒。 
E1缺失可以从Ad5的大约碱基对342开始一直进行到大约碱基对3523,或相当于来自其他腺病毒的区域。所缺失的区域包括去掉从Ad5的大约碱基对450到大约碱基对3511的区域,或来自其他腺病毒的相应区域。始于大约碱基对341的较大的E1区缺失,去掉了有利于病毒包装的元件。 
E3缺失能够从Ad5的大约27865号碱基对到大约30995号碱基对,从或者其他腺病毒载体的相应的区域获得。所述缺失区优选包括去掉了从Ad5的大约28134号碱基对到大约30817号碱基对的区域,或其他腺病毒载体的相应的区域。 
E1区以及任选的E3区的缺失的组合应当足够大,以便包括所述 基因表达盒的重组基因组的总体大小,不超过野生型腺病毒基因组的大约105%。例如,当重组腺病毒Ad5基因组的大小增加超过大约105%时,所述基因组会变得不稳定(Bett等,Journal of Virology 67:5911-5921,1993)。 
包括所述基因表达盒的重组腺病毒基因组的大小优选为野生型腺病毒基因组的大约85%-大约105%。在不同实施方案中,包括所述表达盒的重组腺病毒基因组的大小为野生型基因组大小的大约100%-大约105.2%,或大约100%。 
可以将大约7,500kb插入具有E1和E3缺失的腺病毒基因组中。在没有任何缺失的情况下,Ad5基因组为35,935个碱基对,而Ad6基因组为35,759个碱基对。 
第一代腺病毒载体的复制可以通过提供反式E1基因产物而实现。E1基因产物能够以反式形式提供,例如,通过使用业已用腺病毒E1区转化过的细胞系。用腺病毒E1区转化过的细胞和细胞系的例子有HEK 293细胞,911细胞,PERC.6TM细胞和转染过的原代人aminocytes细胞(Graham等,Journal of Virology 36:59-72,1977,Schiedner等,Human Gene Therapy 11:2105-2116,2000,Fallaux等,Human Gene Therapy 9:1909-1917,1998,Bout等,美国专利号6,033,908)。 
应当将Met-NS3-NS4A-NS4B-NS5A-NS5B表达盒插入重组腺病毒基因组的相当于缺失的E1区或缺失的E3区的区域。所述表达盒可以具有平行的或反向平行的取向。在平行取向中,所述插入基因的转录方向与缺失的E1或E3基因的方向相同。在反向平行取向的转录中,将相反的链用作模板,而转录方向是沿相反方向进行的。 
在本发明的一种实施方案中,所述腺病毒载体具有插入到E1缺失区的基因表达盒。该载体包括: 
a)从相当于Ad5或Ad6的大约碱基对1到大约碱基对450的第一腺病毒区; 
b)与所述第一区连接的E1平行或E1反向平行取向的基因表达盒; 
c)与所述表达盒连接的从相当于Ad5的大约碱基对3511到大约碱基对5548的第二腺病毒区或从相当于Ad6的大约碱基对3508到大 约碱基对5541的第二腺病毒区; 
d)与所述第二区连接的从相当于Ad5的大约碱基对5549到大约碱基对28133或从相当于Ad6的大约碱基对5542到大约碱基对28156的第三腺病毒区; 
e)与所述第三区连接的从相当于Ad5的大约碱基对30818到大约碱基对33966或从相当于Ad6的大约碱基对30789到大约碱基对33784的第四腺病毒区;和 
f)与所述第四区连接的从相当于Ad5的大约碱基对33967到大约碱基对35935或从相当于Ad6的大约碱基对33785到大约碱基对35759的第五腺病毒区。 
在本发明的另一种实施方案中,所述腺病毒载体具有插入到E3缺失区的表达盒。该载体包括: 
a)从相当于Ad5或Ad6的大约碱基对1到大约碱基对450的第一腺病毒区; 
b)与所述第一区连接的从相当于Ad5的大约碱基对3511到大约碱基对5548或从相当于Ad6的大约碱基对3508到大约碱基对5541的第二腺病毒区; 
c)与所述第二区连接的从相当于Ad5的大约碱基对5549到大约碱基对28133或从相当于Ad6的大约碱基对5542到大约碱基对28156的第三腺病毒区; 
d)与所述第三区连接的E3平行或E3反向平行取向的基因表达盒; 
e)与所述基因表达盒连接的从相当于Ad5的大约碱基对30818到大约碱基对33966或从相当于Ad6的大约碱基对30789到大约碱基对33784的第四腺病毒区;和 
f)与所述第四区连接的从相当于Ad5的大约碱基对33967到大约碱基对35935或从相当于Ad6的大约碱基对33785到大约碱基对35759的第五腺病毒区。 
在涉及腺病毒区的优选的不同实施方案中,存在:(1)相当于Ad5的第一,第二,第三,第四,和第五区;(2)相当于Ad6的第一,第二,第三,第四,和第五区;和(3)相当于Ad5的第一区,相当于Ad5的第二区,相当于Ad6的第三区,相当于Ad6的第四区,和相当于 Ad5的第五区。 
B.DNA质粒载体 
DNA疫苗质粒载体包括一个基因表达盒和有利于复制并且优选有利于载体选择的元件。优选的元件提供了用于在非哺乳动物细胞中复制的元件和选择标记。所述载体应当不包括提供在人细胞中复制的元件或用于整合到人核酸中的元件。 
有利于核酸选择的选择标记包括所述标记。优选的选择标记是能产生抗生素抗性的标记。抗生素选择基因的例子,包括编码氨苄青霉素,新霉素,和卡那霉素抗性的核酸。 
可以用含有细菌复制起点和选择标记的质粒起始生产合适的DNA疫苗载体。能提供较高产量的细菌复制起点的例子,包括ColE1质粒-衍生的细菌复制起点(Donnelly等,Annu.Rev.Immunol.15:617-648,1997)。 
细菌复制起点和选择标记的存在,使得能够在诸如大肠杆菌的细菌菌株中生产DNA载体。利用选择标记排除不包括DNA载体的细菌。 
III.AD6重组核酸 
Ad6重组核酸包括基本上相似于存在于SEQ.ID.NO.8中的Ad6区的Ad6区,和不存在于Ad6核酸中的区域。包括Ad6区的重组核酸具有不同的用途,如用于生产不同的Ad6区,作为生产基于Ad6的载体的中间物,以及用作递送重组基因的载体。 
如图9所示,Ad6的基因组组构与Ad5的基因组组构非常相似。Ad5和Ad6之间的同源性大约为98%。 
在不同实施方案中,Ad6重组核酸包括基本上相似于E1A,E1B,E2B,E2A,E3,E4,L1,L2,L3,或L4的核苷酸区,或它们的任意组合。与Ad6区基本上相似的核酸区具有至少65%,至少75%,至少85%,至少95%,至少99%或100%的核苷酸序列同一性;或具有1-2,1-3,1-4,1-5,1-6,1-7,1-8,1-9,1-10,1-11,1-12,1-13,1-14,1-15,1-16,1-17,1-18,1-19,1-20,1-25,1-30,1-35,1-40,1-45,或1-50个核苷酸的核苷酸差别。在上文的I.B.节中披露了用于确定基本上相似的核酸序列的技术和实施方案。 
重组Ad6核酸优选包括编码不存在于Ad6中的多肽的表达盒。表 达盒的例子包括编码HCV区的表达盒,和编码其他类型多肽的表达盒。 
可以采用不同量的Ad6生产不同类型的腺病毒载体,如第一代和第二代腺病毒载体。正如在上文的II.A.节中所指出的,第一代腺病毒载体是E1缺陷型的,并且在提供反式E1时能够复制。 
第二代腺病毒载体包括比第一代载体少的腺病毒基因组,并且可用于与互补的细胞系和/或补充腺病毒蛋白的辅助载体连接。在不同的参考文献中,披露了第二代腺病毒载体,如Russell,Journal ofGeneral Virology 81:2573-2604,2000;Hitt等,1997,HumanAd vectors for Gene Transfer,Advances in Pharmacology,Vol40Academic Press。 
在本发明的实施方案中,Ad6重组核酸是E1缺陷型腺病毒载体,它能够在补充反式E1时复制。可以将表达盒插入缺失的E1区和/或缺失的E3区。 
具有在缺失的E1区提供的表达盒的基于Ad6的腺病毒载体的例子包括以下成分或由其组成: 
a)从相当于Ad5或Ad6的大约碱基对1到大约碱基对450的第一腺病毒区; 
b)与所述第一区连接的E1平行或E1反向平行取向的基因表达盒; 
c)与所述表达盒连接的从相当于Ad5的大约碱基对3511到大约碱基对5548或从相当于Ad6的大约碱基对3508到大约碱基对5541的第二腺病毒区; 
d)与所述第二区连接的从相当于Ad5的大约碱基对5549到大约碱基对28133或从相当于Ad6的大约碱基对5542到大约碱基对28156的第三腺病毒区; 
e)与所述第三区连接的从相当于Ad5的大约碱基对28134到大约碱基对30817或从相当于Ad6的大约碱基对28157到大约碱基对30788的任选存在的第四个区; 
f)从相当于Ad5的大约碱基对30818到大约碱基对33966或从相当于Ad6的大约碱基对30789到大约碱基对33784的第五腺病毒区,其中,如果存在第四区,所述第五区与所述第四区连接,或如果不存 在所述第四区,所述第五区与第三区连接;和 
g)与所述第五区连接的从相当于Ad5的大约碱基对33967到大约碱基对35935或从相当于Ad6的大约碱基对33785到大约碱基对35759的第六腺病毒区; 
其中,存在至少一个Ad6区。 
在本发明的不同实施方案中,以上所有区都来自Ad6;除第一和第二区外所有的区都来自Ad6;而选自第二,第三,第四,和第五区的1,2,3或4个区来自Ad6。 
具有在缺失的E3区提供的表达盒的基于Ad6的腺病毒载体的例子包括以下成分或由其组成: 
a)从相当于Ad5或Ad6的大约碱基对1到大约碱基对450的第一腺病毒区; 
b)与所述第一区连接的从相当于Ad5的大约碱基对3511到大约碱基对5548或从相当于Ad6的大约碱基对3508到大约碱基对5541的第二腺病毒区; 
c)与所述第二区连接的从相当于Ad5的大约碱基对5549到大约碱基对28133或从相当于Ad6的大约碱基对5542到大约碱基对28156的第三腺病毒区; 
d)与所述第三区连接的E3平行或E3反向平行取向的基因表达盒; 
e)与所述基因表达盒连接的相当于从Ad5的大约碱基对30818到大约碱基对33966或从相当于Ad6的大约碱基对30789到大约碱基对33784的第四腺病毒区;和 
f)与所述第四区连接的从相当于Ad5的大约碱基对33967到大约碱基对35935或从相当于Ad6的大约碱基对33785到大约碱基对35759的第五腺病毒区; 
其中,存在至少一个Ad6区。 
在本发明的不同实施方案中,以上所有区都来自Ad6;除第一和第二区外所有的区都来自Ad6;而选自第二,第三,第四,和第五区的1,2,3或4个区来自Ad6。 
IV.载体生产 
可以用重组核酸技术生产载体,如包括使用限制酶,核酸连接,和同源重组的技术。重组核酸技术为本领域所熟知(Ausubel,CurrentProtocols in Molecular Biology,John Wiley,1987-1998,和Sambrook等,Molecular Cloning,A Laboratory Manual,2′dEdition,Cold Spring Harbor Laboratory Press,1989)。 
利用中间载体驱动治疗性载体,或将表达盒或它的一部分从一种载体转移到另一种载体。中间载体的例子包括腺病毒基因组质粒和穿梭载体。 
中间载体上的有用元件包括复制起点,选择标记,同源重组区,和常见的限制位点。可以利用常见的限制位点促进核酸序列的克隆或释放。 
同源重组区提供了与另一种核酸分子上的目标区同源的核酸序列区。该同源区位于要插入所述目标区的核酸序列侧翼。在不同实施方案中,同源区的长度优选为大约150-600个核苷酸,或长度为大约100-500个核苷酸。 
本发明的一种实施方案披露了包括Met-NS3-NS4A-NS4B-NS5A-NS5B表达盒,选择标记,细菌复制起点,导向于要插入或取代E1区的表达盒的第一腺病毒同源区和第二腺病毒同源区的穿梭载体。所述第一和第二同源区位于所述表达盒侧翼。第一同源区包括至少大约100个碱基对,它们基本上与野生型腺病毒区的大约碱基对4-450的至少右侧末端(3′末端)同源。第二同源区包括至少大约100个碱基对,它们基本上与Ad5的大约碱基到3511-5792的至少左侧末端(5’末端)或来自另一种腺病毒的相应区同源。 
所提到的“基本上同源”表示与目标区特异性重组的足够的同源性程度。在不同实施方案中,基本上同源表示至少85%,至少95%或100%的序列同一性。序列同一性可以按照上文I.B.节中所披露的方法进行。 
生产腺病毒载体的一种方法是通过产生包括一个表达盒的腺病毒基因组质粒。前腺病毒质粒包括在需要的互补细胞系中复制所需要的所有腺病毒序列。然后用限制酶消化所述前腺病毒质粒,以便释放病毒ITR′s,并且转染到所述互补细胞系中,进行病毒回收。ITR′s 必须从质粒序列上释放,以便能够进行复制。腺病毒载体回收导致了含有所述表达盒的腺病毒载体的产生。 
A.腺病毒基因组质粒 
腺病毒基因组质粒包括存在于较大长度质粒(它可以是粘粒)上的腺病毒载体序列。所述较大长度的质粒可以包括其他元件,如根据生产和保持所述质粒所采用的方法,有助于真核细胞或细菌细胞生长和选择的元件。用于生产腺病毒基因组质粒的技术,包括与使用穿梭载体和同源重组相关的技术,和与将基因表达盒插入腺病毒粘粒相关的技术(Hitt等,Methods in Molecular Genetics 7:13-30,1995,Danthinne等,Gene Therapy 7:1707-1714,2000)。 
腺病毒基因组质粒优选具有插入E1或E3缺失区的基因表达盒。在本发明的一种实施方案中,所述腺病毒基因组质粒包括插入E1缺失区的基因表达盒,复制起点,选择标记,和重组腺病毒区,该腺病毒区由以下成分组成: 
a)从相当于Ad5或Ad6的大约碱基对1到大约碱基对450的第一腺病毒区; 
b)与所述第一区连接的E1平行或E1反向平行取向的基因表达盒; 
c)与所述表达盒连接的从相当于Ad5的大约碱基对3511到大约碱基对5548或从相当于Ad6的大约碱基对3508到大约碱基对5541的第二腺病毒区; 
d)与所述第二区连接的从相当于Ad5的大约碱基对5549到大约碱基对28133或从相当于Ad6的大约碱基对5542到大约碱基对28156的第三腺病毒区; 
e)与所述第三区连接的从相当于Ad5的大约碱基对30818到大约碱基对33966或从相当于Ad6的大约碱基对30789到大约碱基对33784的第四腺病毒区; 
f)与所述第四区连接的从相当于Ad5的大约碱基对33967到大约碱基对35935或从相当于Ad6的大约碱基对33785到大约碱基对35759的第五腺病毒区;和 
g)相当于存在于Ad5或Ad6中的E3区的全部或一部分的任选存在的E3区,根据需要的腺病毒载体的总体大小,可以提供较小的插 入片段。 
在本发明的另一实施方案中,所述重组腺病毒基因组质粒具有插入到E3缺失区的基因表达盒。所述载体包括复制起点,选择标记,和以下部分: 
a)从相当于Ad5或Ad6的大约碱基对1到大约碱基对450的第一腺病毒区; 
b)与所述表达盒连接的从相当于Ad5的大约碱基对3511到大约碱基对5548或从相当于Ad6的大约碱基对3508到大约碱基对5541的第二腺病毒区; 
c)与所述第二区连接的从相当于Ad5的大约碱基对5549到大约碱基对28133或从相当于Ad6的大约碱基对5542到大约碱基对28156的第三腺病毒区; 
d)与所述第三区连接的E3平行或E3反向平行取向的基因表达盒; 
e)与所述基因表达盒结合的从相当于Ad5的大约碱基对30818到大约碱基对33966或从相当于Ad6的大约碱基对30789到大约碱基对33784的第四腺病毒区;和 
f)与所述第四区连接的从相当于Ad5的大约碱基对33967到大约碱基对35935或从相当于Ad6的大约碱基对33785到大约碱基对35759的第五腺病毒区。 
在不同实施方案中,存在相关的腺病毒区: 
(1)相当于Ad5的第一,第二,第三,第四和第五区; 
(2)相当于Ad6的第一,第二,第三,第四和第五区;和 
(3)相当于Ad5的第一区,相当于Ad5的第二区,相当于Ad6的第三区,相当于Ad6的第四区和相当于Ad5的第五区。 
本发明的一种实施方案披露了一种制备腺病毒载体的方法,包括生产腺病毒基因组质粒的同源重组步骤和腺病毒回收步骤。所述同源重组步骤包括使用其侧翼为腺病毒同源区的包括Met-NS3-NS4A-NS4B-NS5A-NS5B表达盒的穿梭载体。所述腺病毒同源区将表达盒导向于E1或E3缺失区。 
在本发明的一种实施方案中,涉及生产腺病毒基因组质粒,将基因表达盒插入载体,包括:从相当于Ad5或Ad6的大约碱基对1到大 约碱基对450的第一腺病毒区;与所述第二区连接的从相当于Ad5的大约碱基对3511到大约碱基对5548或从相当于Ad6的大约碱基对3508到大约碱基对5541的第二腺病毒区;与所述第二区连接的从相当于Ad5的大约碱基对5549到大约碱基对28133或从相当于Ad6的大约碱基对5542到大约碱基对28156的第三腺病毒区;与所述第三区连接的从相当于Ad5的大约碱基对30818到大约碱基对33966或从相当于Ad6的大约碱基对30789到大约碱基对33784的第四腺病毒区;和与所述第四区连接的从相当于Ad5的大约碱基对33967到大约碱基对35935或从相当于Ad6的大约碱基对33785到大约碱基对35759的第五腺病毒区。所述腺病毒基因组质粒应当包括复制起点和选择标记,并且可以包括Ad5或Ad6的E3区的全部或一部分。 
在涉及腺病毒区的不同实施方案中,存在:(1)相当于Ad5的第一,第二,第三,第四和第五区;(2)相当于Ad6的第一,第二,第三,第四和第五区;和(3)相当于Ad5的第一区,相当于Ad5的第二区,相当于Ad6的第三区,相当于Ad6的第四区,和相当于Ad5的第五区。 
B.腺病毒载体回收 
可以用本领域已知的或本文所披露的技术,从重组腺病毒基因组质粒中回收腺病毒载体。用于回收腺病毒的技术的例子为本领域所熟知,并且披露于以下文献中:Hitt等,Methods in Molecular Genetics7:13-30,1995,和Danthinne等,Gene Therapy 7:1707-1714,2000。 
回收本文所披露的腺病毒载体的优选方法,包括加强腺病毒复制。例如,加强腺病毒复制可以通过在独立的载体上补充腺病毒功能,如E2蛋白(聚合酶,前末端蛋白和DNA结合蛋白)以及E4或f6进行。下面的实施例10披露了加强腺病毒复制,以便回收包括密码子优化的Met-NS3-NS4A-NS4B-NS5A-NS5B表达盒的腺病毒载体。 
V.部分优化的HCV编码序列 
HCV多蛋白编码核酸的部分优化提供了优化用于在人体内表达的较少量的密码子而不是全面优化。总体目标是提供由于密码子优化而产生的增强表达的优点,同时有利于生产包括具有优化密码子的HCV 多蛋白编码核酸的腺病毒载体。 
HCV多蛋白编码序列的完全优化,提供了每一种氨基酸的最常见的人密码子。完全优化可以用本领域所熟知的密码子频率表进行,并且使用诸如BACKTRANSLATE的程序(Wisconsin Package version 10,Genetics Computer Group,GCG,Madison,Wisc.)。 
部分优化可以对所存在的完整HCV多蛋白编码序列(例如,NS3-NS5B)进行,或对存在的一个或多个局部区域进行。在不同实施方案中,所存在的完整HCV编码多肽的GC含量不超过至少大约65%;并且一个或多个局部区域的GC含量不超过大约70%。 
局部区域是存在于HCV编码核酸中的区域,并且其大小可以改变。例如,局部区域的长度可以为大约60,大约70,大约80,大约90或大约100个核苷酸。 
部分优化可以通过首先构建要根据天然存在的序列部分优化的HCV编码多蛋白序列而实现。另外,可以将优化的HCV编码序列用作比较的基础,以便产生部分优化的序列。 
VI.HCV组合治疗 
可以使用HCV Met-NS3-NS4A-NS4B-NS5A-NS5B疫苗本身来治疗患者,可以与其他HCV治疗剂组合使用,并且可以与针对其他类型疾病的试剂一起使用。其他治疗剂包括治疗HCV和具有高的HCV感染倾向人体内的疾病的其他治疗剂。针对其他类型疾病的试剂包括针对HIV和HBV的疫苗。 
用于治疗HCV的其他治疗剂,包括疫苗和非疫苗制剂(Zein,Expert Opin.Investig.Drugs 10:1457-1469,2001)。其他HCV疫苗的例子包括为了诱导针对HCV核心抗原和HCV E1,E2或p7区的免疫反应而设计的疫苗。疫苗成分可以是天然存在的HCV多肽,HCV模拟表位(mimotope)多肽或编码序列所述多肽的核酸。 
HCV模拟表位多肽包括HCV表位,但是具有与天然存在的HCV抗原不同的序列。HCV模拟表位可以与天然存在的HCV抗原融合。在以下文献中,提供了披露用于生产模拟表位的一般性技术的参考文献,并且披露了不同的HCV模拟表位:Felici等,美国专利号5,994,083和Nicosia等,国际申请号WO 99/60132。 
VII.药物施用 
可以采用本文所提供的说明以及本领域所熟知的技术,制备并且给患者施用HCV疫苗。例如,一般性药物施用的指南披露于以下文献中:Modern Vaccinology,Ed.Kurstak,Plenum Med.Co.1994;Remington′s Pharmaceutical Sciences 18thEdition,Ed.Gennaro,Mack Publishing,1990;和Modern Pharmaceutics 2″d Edition,Eds.Banker和Rhodes,Marcel Dekker,Inc.,1990,其中的每一份文献都被收作本文参考。 
HCV疫苗可以通过不同途径施用,如静脉内,腹膜内,皮下,肌内,真皮内,通过皮肤的按压或鼻内途径。优选的途径是肌内途径。 
肌内施用可以使用不同的技术进行,例如通过使用或不用一个或多个电脉冲注射。电介导的转移,可能有利于通过刺激体液和细胞免疫反应进行遗传学免疫。 
疫苗注射可以用不同的技术进行,如通过采用针头注射系统或无针头注射系统。无针头注射系统的例子是喷射注射装置(Donnelly等,国际公开号WO 99/52463)。 
A.电介导的转移 
电介导的转移或基因电-转移(GET),可以通过在核酸注射之后输送合适的电脉冲进行(参见Mathiesen,国际公开号WO 98/43702)。质粒注射和电穿孔可以用不锈钢针头进行。针头是成对的,三联的或更复杂的形式的。在一种设计中,将所述针头焊接在印刷电路板上,所述电路板是机械支持物,并且通过合适的电缆将针头与电场发生器连接在一起。 
以电脉冲形式提供电刺激。脉冲可以具有不同的形式(矩形,正弦,三角形,指数衰减)和不同的极性(具有阳性或阴性极性的单极,双极)。脉冲可以以稳定的电压或稳定的电流形式输送。 
可以利用不同形式的电治疗,将包括HCV的核酸疫苗和其他核酸疫苗导入患者体内。可行的电治疗方式包括以下方案: 
治疗1:每隔1秒钟输送10串1000个矩形双极脉冲,脉冲长度为0.2毫秒/相,频率为1000Hz,稳定电压模式,45伏/相,浮动电流。 
治疗2:每隔1秒钟输送2串100个矩形双极脉冲,脉冲长度为2毫秒/相,频率为100Hz,稳定电流模式,100毫安/相,浮动电压。 
治疗3:2串双极脉冲,脉冲长度为大约2毫秒/相,总长度为大约3秒钟,其中,穿过组织的实际电流固定在大约50毫安。 
电脉冲是通过电场发生器输送的。合适的发生器可以包括3个独立的硬件部件,它们组装于一个共同的底盘,并且通过便携式PC运行驱动程序驱动。所述软件同时管理基础功能和辅助功能。该装置的部件包括:(1)通过微处理器驱动的信号发生器,(2)电放大器和(3)数字示波器。 
所述信号发生器,在特定范围内在软件控制下输送具有任意频率和形状的信号。所述相同的软件具有用于要输送的波形的相互作用编辑器,所述发生器涉及一种数字控制的电流限制装置(控制最大电流输出的安全装置)。所述电力放大器可以将所产生的信号放大到+/-150V。所述示波器是数字化的,并且能够对由所述放大器输送的电压和电流进行取样。 
B.药用载体 
可以药用的载体有利于疫苗的保存和给对象施用。在本文中披露了可以药用的载体的例子。其他可以药用的载体为本领域所熟知。 
可以药用的载体可以包括不同的成分,如缓冲液,普通盐水或磷酸缓冲的盐水,蔗糖,盐和聚山梨酸酯。可以药用的载体的例子如下:2.5-10mM TRIS缓冲液,优选大约5mM TRIS缓冲液;25-100mM NaCl,优选大约75mM NaCl;2.5-10%蔗糖,优选大约5%蔗糖;0.01-2mMMgCl2;和0.001%-0.01%聚山梨醇酯80(来自植物的)。PH优选为大约7.0-9.0,更优选大约8.0。载体的一种具体例子包括5mM TRIS,75mM NaCl,5%蔗糖,1mM MgCl2,0.005%聚山梨醇酯80,pH 8.0。 
C.用药方案 
可以根据特定疫苗效力和诸如患者年龄,体重,性别和医学状况等因素;施用途径;需要的效果;以及用药次数,确定合适的用药方案。特定疫苗的效力取决于不同因素,如特定疫苗产生多肽的能力,所述多肽是在细胞中表达和加工的,并且以I类和II类MHC复合物的形式出现。 
给患者施用的HCV编码核酸可以是包括病毒载体在内的不同类 型载体的一部分,如腺病毒载体,和DNA质粒疫苗。在涉及施用DNA质粒的不同实施方案中,给患者施用大约0.1-10mg质粒,以及给患者施用大约1-5mg质粒。在涉及施用病毒载体,优选腺病毒载体的不同实施方案中,给患者施用大约105-1011病毒颗粒,以及给患者施用大约107-1010病毒颗粒。 
病毒载体疫苗和DNA质粒疫苗可以单独施用,或者可以作为激发和加强施用方案的一部分。激发和加强接种的一种混合形式,包括用DNA激发和用病毒载体疫苗加强,或用病毒载体疫苗激发和用DNA疫苗加强。 
可以使用多次激发,例如大约2-4次或更多次。激发和加强之间的时间长度,通常从大约4个月到1年,不过,可以采用其他时间方案。采用DNA疫苗的激发方案,可优选用于患有以前存在的腺病毒免疫反应的患者的场合。 
在本发明的一种实施方案中,将1×107-1×1012腺病毒载体颗粒,优选大约1×1010-1×1011腺病毒载体颗粒直接施用于肌肉组织中。在初次接种之后,用腺病毒载体或DNA疫苗进行加强。 
在本发明的另一种实施方案中,初次的接是通过直接进入肌肉组织中的DNA疫苗进行的。在初次免疫之后,用腺病毒载体或DNA疫苗进行加强。 
可以同时施用诸如白介素-12,GM-CSF,B7-1,B7-2,IP10,Mig-1的试剂,以便加强免疫反应。所述试剂可以作为蛋白施用,或者通过使用核酸载体施用。 
D.异源激发-加强 
异源激发-加强是一种混合形式,它包括使用一种类型的病毒载体进行激发,而用另一种类型的病毒载体进行加强。所述异源激发-加强可包括相关的载体,如基于不同腺病毒血清型的载体,以及关系更远的病毒,如腺病毒和痘病毒。在以下文献中披露了利用痘病毒和腺病毒载体防止小鼠出现疟疾:Gilbert等,Vaccine 20:1039-1045,2002。 
涉及激发和加强的不同实施方案,包括表达所需抗原的以下类型的载体,如Met-NS3-NS4A-NS4B-NS5A-NS5B:Ad5载体,随后是Ad6载体;Ad6载体,随后是Ad5载体;Ad5载体,随后是痘病毒载体; 痘病毒载体,随后是Ad5载体;Ad6载体,随后是痘病毒载体;和痘病毒载体,随后是Ad6载体。 
激发和加强之间的时间长度,通常为大约4个月到1年,不过,可以使用其他时间方案。最低时间方案应当足够允许免疫学休息。在一种实施方案中,这种休息是为期至少6个月的时间。激发可能包括用一种类型的载体多次激发,如激发2-4次。 
存在于水痘病毒载体中的表达盒,应当包括一个激发子,该激发子是天然的,或源于感兴趣的痘病毒或其他痘病毒成员。构建和使用不同类型的痘病毒型载体的不同方法,包括基于痘苗病毒,修饰过的痘苗病毒,禽痘病毒,浣熊痘病毒,修饰过的痘苗病毒Ankara,金丝雀痘病毒(如ALVAC),禽痘病毒,牛痘病毒,和NYVAC的载体是本领域所熟知的(Moss,Current Topics in Microbiology andImmunology 158:25-38,1982;Earl等,In Current Protocolsin Molecular Biology,Ausubel等eds.,New York:GreenePublishing Associates&Wiley Interscience;1991:16.16.1-16.16.7,Child等,Virology 174(2):625-9,1990;Tartaglia等,Virology 188:217-232,1992;美国专利号4,603,112,4,722,848,4,769,330,5,110,587,5,174,993,5,185,146,5,266,313,5,505,941,5,863,542,和5,942,235)。 
E.佐剂 
HCV疫苗可以与佐剂一起配制。对于DNA质粒疫苗来说,佐剂是特别有用的。佐剂的例子包括明矾,AlPO4,alhydrogel,脂质-A及其衍生物或变体,弗氏不完全佐剂,中性脂质体,含有疫苗和细胞因子的脂质体,非离子型嵌段共聚物和趋化因子。 
含有聚环氧乙烷(POE)和聚环氧丙烷(POP)的非离子型嵌段聚合物,如POE-POP-POE嵌段共聚物可以用作佐剂(Newman等,CriticalReviews in Therapeutic Drug Carrier Systems 15:89-142,1998)。可以用与阴离子型表面活性剂组合的非离子型嵌段共聚物增强核酸的免疫反应。 
佐剂制剂的一种具体例子是含有CRL-1005(CytRx ResearchLaboratories),DNA,和benzylalkonium chloride(BAK)的制剂。该制剂可以通过使用正位移移液管将纯的聚合物添加到溶解在PBS 中的质粒DNA的冷却(<5℃)溶液中而制备。然后对该溶液进行涡旋搅拌,以便使所述聚合物溶解。在所述聚合物完全溶解之后,在低于所述聚合物的絮凝点(大约6-7℃)的温度下获得了透明溶液。然后通过缓慢添加溶解在PBS中的BAK的稀释溶液,将大约4mM BAK添加到溶解在PBS中的DNA/CRL-1005溶液中。在添加聚合物和BAK之前,最初DNA浓度为大约6mg/mL,而最终DNA浓度为大约5mg/mL。在添加BAK之后,对该制剂进行充分涡旋搅拌,然后使它的温度提高到高于絮凝点大约2℃。冷却和混合同时使它的温度提高到高于絮凝点大约2℃,重复进行若干次,直到该制剂的粒度为大约200-500nm,该粒度是通过动态光学散射测定的。然后将该溶液保存在冰上一直到该溶液透明,然后放在-70℃下保存。在使用之前,让该溶液在室温下解冻。 
F.疫苗保存 
可以利用不同类型的缓冲液保存腺病毒载体和DNA疫苗。例如,可以用下面的实施例9中所披露的缓冲液A105保存载体。 
通过清除或螯合微量金属离子,可以改善对DNA的保存。可以将琥珀酸或苹果酸的试剂和螯合剂用于改善DNA疫苗的稳定性。螯合剂的例子包括多种磷酸配体和EDTA。添加诸如乙醇或甘油的非还原性自由基清除剂还可以防止因为自由基的产生对DNA质粒的破坏。另外,在所述制剂中可以控制缓冲液的类型,pH,盐浓度,光照,以及消毒方法的类型,以便优化所述DNA疫苗的稳定性。 
实施例
提供下面的实施例是为了进一步说明本发明的不同特征。这些实施例还说明了可用于实施本发明的方法。这些实施例没有限定要求保护的本发明。 
实施例1:Met-NS3-NS4A-NS4B-NS5A-NS5B表达盒 
根据1b亚型HCV BK菌株构建了编码HCVNS3-NS4A-NS4B-NS5A-NS5B的不同的基因表达盒。所编码的序列具有下列任一种序列:(1)活性NS5B序列(″NS″),(2)失活的NS5B序列(″NSmut″),(3)具有失活的NS5B序列的密码子优化序列(″NSOPTmut″)。所述表达盒还包括CMV激发子/增强子和BGH聚腺苷 酸化信号。 
NS核苷酸序列(SEQ.ID.NO.5)与HCV BK菌株GenBank保藏号M58335相比,在5952个核苷酸中有30个核苷酸不同。NS氨基酸序列(SEQ.ID.NO.6)与相应的1b基因型HCV BK菌株在1984个氨基酸中有7个氨基酸不同。为了能够起始翻译,在NS序列的5′末端存在一个ATG密码子。在NS序列的3′末端存在一个TGA终止序列。 
NSmut核苷酸序列(SEQ.ID.NO.2,图2)与NS序列相似。NSmut和NS之间的差别包括NSmut具有改变了的NS5B催化位点;在5′末端具有一个最佳核糖体结合位点;以及在3′末端具有一个TAAA终止序列。NS5B上的改变包括5138-5146号碱基,这些碱基编码1711-1713号氨基酸。所述改变导致了氨基酸GlyAspAsp改变成AlaAlaGly,并且产生了失活形式的NS5B RNA-依赖型RNA-聚合酶NS5B。 
NSOPTmut序列(SEQ.ID.NO.3,图3)是根据由NSmut编码的氨基酸序列设计的。使用GCG(Wisconsin Package version 10,Genetics Computer Group,GCG,Madison,Wisc)BACKTRANSLATE程序将NSmut氨基酸序列反向翻译成核苷酸序列。为了制备NSOPTmut核苷酸序列,其中的每一种氨基酸是由相应的最常见的人密码子编码的,该程序是这样进行的:选择最可能的氨基酸序列的产生作参数,并且规定在GCG软件包内可获得的高度表达的人基因(human-high.cod)的密码子频率表作为翻译方案。 
实施例2:制备具有NS,NSmut或NSOPTmut序列的pV1Jns质粒 
含有NS,NSmut或NSOPTmut序列的pV1Jns质粒是通过以下方法制备和表征的: 
具有NS序列的pV1Jns质粒 
将来自HCV BK型菌株的编码区Met-NS3-NS4A-NS4B-NS5A和编码区Met-NS3-NS4A-NS4B-NS5A-NS5B(Tomei等,J.Virol.67:4017-4026,1993)克隆到pcDNA3质粒(Invitrogen)上,分别制备pcD3-5a和pcD3-5b载体。用HindIII消化PcD3-5A,用Klenow填充片段补平末端,随后用XbaI消化,以便产生相当于Met-NS3-NS4A-NS4B-NS5A的编码区的片段。将该片段克隆到pV1Jns-poly上,用BglII消化,用Klenow填充片段补平末端,随后用Xba I消化,制备pV1JnsNS3-5A。 
pV1Jns-poly是pV1JnsA质粒的衍生物(Montgomery等,DNA andCell Biol.12:777-783,1993),通过将含有XbaI,PmeI,PacI的识别位点的多接头插入独特的BglII和NotI限制位点进行修饰。具有NS序列的pV1Jns质粒(pV1JnsNS3-5B)是通过以下方法获得的:同源重组到细菌菌株BJ5183中,用通过XbaI和NotI消化线性化的pV1JNS3-5A和含有大约200bp的NS5A,NS5B编码序列和大约60bp的BGH聚腺苷酸化信号共转化。所得到的质粒被称为pV1Jns-NS。 
pV1Jns-NS可以归纳如下: 
碱基        pV1JnsA的1-1881号碱基 
一个额外的  AGCTT 
随后是      Met-NS3-NS5B序列(SEQ.ID.NO.5) 
然后是      wt TGA终止子 
一个额外的  TCTAGAGCGTTTAAACCCTTAATTAAGG(SEQ.ID.NO.14) 
碱基        pV1JnsA的1912-4909号碱基 
具有NSmut序列的pV1Jns质粒 
通过添加完整Kozak序列修饰V1JnsNS3-5A质粒的5′末端的NS3编码序列。该质粒(V1JNS3-5Akozak)是通过重组到细菌菌株BJ5183中,用通过A/HI消化线性化的V1JNS3-5A和包括内含子A的近端部分,限制位点BglII,完整的Kozak翻译起始序列和NS3编码序列的一部分的PCR片段共转化获得的。 
通过用Xba I消化使所得到的质粒(V1JNS3-5Akozak)线性化,并且与包括大约200bp的NS5A,NS5B突变序列,强翻译终止序列TAAA和大约60bp的BGH聚腺苷酸化信号的PCR片段一起共转化到细菌菌株BJ5183中。所述PCR片段是通过组装两个22bp的重叠片段获得,其中,通过用于扩增它们的寡核苷酸引入了突变。所得到的质粒被称pV1Jns-NSmut。 
pV1Jns-NSmut可以归纳如下: 
碱基        pV1JnsA的1-1882号碱基 
随后是      kozak Met-NS3-NS5B(mut)TAAA序列(SEQ.ID.NO.2) 
一个额外的  TCTAGA 
碱基    pV1JnsA的1925-4909号碱基 
具有NSOPTmut序列的pVIJns质粒 
通过位于该基因5’和3’末端的BamHI和SalI限制位点消化人密码子优化的合成基因(NSOPTmut),它具有突变的NS5B,以便破坏酶促活性,完整的Kozak翻译起始序列和强翻译终止序列。然后将该基因克隆到存在于V1JnsA质粒的多接头上的BglII和SalI限制位点上,以便产生V1Jns-NSOPTmut。 
pV1Jns-NSOPTmut可以归纳如下: 
碱基            pV1JnsA的1-1881号碱基 
一个额外的      C 
然后是          kozak Met-NS3-NS5B(optmut)TAAA序列(SEQ.ID.NO.3) 
一个额外的      TTTAAATGTTTAAAC(SEQ.ID.NO.15) 
碱基            pV1JnsA的1905-4909号碱基 
质粒表征 
通过转染在补充了L-谷氨酰胺(最终浓度4mM)的10%FCS/DMEM中生长的SEK293细胞,测试HCV NS蛋白的表达。在转染之前24小时,将细胞铺平板到直径35毫米的6个孔中,以便在转染的当天到达90%-95%的铺满度。使用LIPOFECTAMINE 2000试剂,用40纳克质粒DNA(事先确定为非饱和DNA用量)和100纳克含有Rous肉瘤病毒激发子控制的荧光素酶报导基因的pRSV-Luc质粒共转染。在37℃下,将细胞保持在CO2培养箱中48小时。 
用1%Triton/TEN缓冲液制备细胞提取物。将所述提取物的荧光素酶活性标准化,并且在10%SDS聚丙烯酰胺凝胶上对系列稀释液进行电泳。将蛋白转移到硝酸纤维素上,并且用针对NS3,NS5A和NS5B的抗体分析,以便评估表达强度和正确的蛋白水解裂解。用模拟转染的细胞作为阴性对照。在图12中示出了来自测试pV1JnsNS,pV1JnsNSmut和pV1JnsNSOPTmut的典型实验的结果。 
实施例3:用质粒DNA载体对小鼠进行免疫 
将DNA质粒pV1Jns-NS,pV1Jns-NSmut和pV1JnsNSOPTmut注射到不同的小鼠株中,以便评估它们诱导抗HCV免疫反应的潜力。两个不同的株(Balb/C和C57Black6,N=9-10)用25或50μg的DNA进行 肌内注射,随后进行电脉冲。每一只动物每隔3周接受2个剂量。 
在两次用药之后,通过对细菌表达的NS3蛋白酶结构域进行ELISA,测定在C57BIack6小鼠体内诱导的针对NS3蛋白的体液免疫反应。在用所有三种载体免疫的动物体内检测到对测试抗原特异的抗体,几何平均效价(GMT)在94000-133000范围内(表1-3)。 
表1:pV1jns-NS 
表2:pV1jns-NSmut 
Figure G2009102512982D00382
表3:pV1jns-NSOPTmut 
Figure G2009102512982D00383
在以3周的间隔2次肌内注射25μg质粒DNA免疫的C57BIack6小鼠体内检测到T细胞反应。进行定量ELIspot分析,以便测定对二十聚体肽的五种合并物有反应的IFNγ分泌T细胞的数量,所述肽有10个残基的重叠,包括NS3-NS5B序列。通过用包括针对C57BIack6小鼠的CD8+表位的二十聚体肽(pep1480)进行相同的测定,分析特异性CD8+反应。 
用标准ELIspot分析,检测以抗原特异性形式分泌IFNγ的细胞。通过相同的ELIspot测定分析,以三周的间隔用50μg质粒DNA进行2次肌内注射免疫的C57BIack6小鼠体内的T细胞反应,测定对二十聚体肽的五种合并物有反应的IFNγ分泌T细胞的数量,所述肽具有10个残基的重叠,包括NS3-NS5B序列。 
用免疫过的小鼠制备脾细胞,并且重悬浮在R10培养基中(RPMI 1640,补充了10%FCS,2mM L-谷氨酰胺,50U/ml-50μg/ml青霉素/链霉素,10mM Hepes,50μM 2-巯基乙醇)。用纯化的大鼠抗小鼠INFγ抗体(PharMingen,Cat.No.18181D,PharmiMingen,10975Torreyana Road,San Diego,California 92121-1111USA)对Multiscreen 96-孔过滤平板(Millipore,Cat.No.MAIPS4510,Millipore Corporation,80Ashby Road Bedford,MA)进行包被。在培养过夜之后,用PBS 1X/0.005%Tween洗涤平板,并且用250μl/孔的R10培养基封闭。 
用免疫过的小鼠制备脾细胞,并且在存在或不存在10μM肽的条件下,以2.5×105/孔或5×105/孔的密度将它培养24小时。在充分洗涤(PBS1X/0.005%Tween)之后,添加生物素化的大鼠抗小鼠IFNγ抗体(PharMingen,Cat.No.18112D,PharMingen,10975TorreyanaRoad,San Diego,California 92121-1111USA),并且在4℃下培养过夜。为了显影,添加链亲和素-AKP(PharMingen,Cat.No.13043E,PharMingen,10975Torreyana Road,San Diego,California92121-1111USA)和1-StepTMNBT-BCIP显影溶液(Pierce,Cat.No.34042,Pierce,P.O.Box 117,Rockford,IL 61105USA)。 
利用包括HCV BK菌株NS3-NS5B的完整序列的二十聚体重叠肽的合并物显示HCV-特异性IFNγ-分泌T细胞。同样,将包括针对C57Black6小鼠的CD8+表位的单一的二十聚体肽用于检测CD8反应。在图13A和13B中示出了来自通过两次注射25或50μg质粒载体pV1Jns-NS,pV1Jns-NSmut和pV1Jns-NSOPTmut免疫的C57Black6和Balb/C小鼠(N=9-10)组的代表性数据。 
实施例4:猕猴的免疫 
通过肌内注射溶解在7.5mg/ml CRL1005,洁尔灭0.6mM中的5mg质粒pV1Jns-NSOPTmut对猕猴(N=3)进行免疫。在0和4周在每只动物的三角肌注射两剂。 
通过IFN-γELISPOT在不同的时间点测定CMI。该分析测定了HCV抗原特异性CD8+和CD4+T淋巴细胞反应,并且可用于多种哺乳动物,如人,猕猴,小鼠和大鼠。 
特定肽或肽合并物的使用可以简化在CTL细胞毒性分析,干扰素-γELISPOT分析和干扰素-γ细胞内染色分析中的抗原呈递。制备基 于各种HCV蛋白的氨基酸序列的肽(核心,E2,NS3,NS4A,NS4B,NS5A,NS5B),以便用于在所述分析中测定在HCV DNA和腺病毒载体免疫的猕猴和HCV-感染的人体内的免疫反应。各个的肽是重叠的20-聚体,错开10个氨基酸。可以将肽的大的合并物用于检测对HCV蛋白的总体反应,而将较小的合并物和各个肽用于确定一种反应的表位特异性。 
IFNγELISPOT 
IFNγ-ELISPOT分析能提供HCV特异性T淋巴细胞反应的定量测定。对PBMC进行系列稀释,并且放入用抗猕猴IFN-γ抗体(MD-1U-Cytech)包被的微量滴定板的孔中。用HCV肽合并物将它们培养20小时,导致了前体细胞和IFN-γ分泌的再刺激。洗掉所述细胞,留下与细胞附着的浓集区上的抗体包被的孔结合的分泌的IFN。用生物素化的抗猕猴IFN抗体(detector Ab U-Cytech),随后用碱性磷酸酶偶联的链亲和素(Pharmingen 13043E)检测捕获的IFN。添加不溶性碱性磷酸酶底物,导致了在所述孔中细胞所在的位置出现暗斑,为分泌IFN-γ的每一个T细胞留下一个斑点。 
每个孔的斑点的数量与抗原特异性T细胞的前体频率直接相关。在该分析中选择干扰素γ作为观察的细胞因子(使用物种特异性抗γ干扰素单克隆抗体),因为它是最常见的,并且是由激活的T淋巴细胞合成和分泌的最丰富的细胞因子之一。对于该分析来说,在存在和不存在(培养基对照)肽抗原的情况下,测定样品的每一百万PBMCs中成斑细胞(SFC)的数量。在表4中示出了在施用两种物质之后来自猕猴的PBMC的数据。 
表4
Figure G2009102512982D00411
来自通过两次注射5mg DNA/剂免疫的猕猴的PBMC的INFγELISPOT,存在于质粒pV1Jns-NSOPTmut的OPTIVAX/BAK中。数据是以SFC7106PBMC形式表达的。 
实施例5:Ad6前-腺病毒质粒的构建 
Ad6前-腺病毒质粒是通过以下方法获得的: 
构建pAd6E1-E3+前-腺病毒质粒 
利用Ad5和Ad6之间的广泛序列同一性(大约98%)或仅包括Ad6区,构建可用于制备第一代Ad6载体的基于Ad6的前-腺病毒质粒。利用同源重组将wtAd6序列克隆到细菌质粒中。 
在图10中示出了用于以含有Ad5和Ad6区的细菌质粒形式回收pAd6E1-E3+的一般方法。用纯化的wt Ad6病毒DNA和被称为Ad5 ITR盒的第二种DNA片段共转化BJ 5183细菌,导致了通过同源重组产生的病毒基因组环化。ITR盒包括来自由包括细菌复制起点和氨苄青霉素抗性基因的质粒序列隔开的Ad5基因组的右侧末端(碱基对33798-35935)和左侧末端(碱基对1-341和碱基对3525-5767)序列。ITR盒包括来自Ad5342-3524的E1序列的缺失。ITR盒中的Ad5序列提供了与纯化的Ad5病毒DNA同源的区,其中,在该区可以发生重组。 
通过限制分析,筛选潜在克隆,并且选择一个克隆作为pAd6E1-E3+。然后对该克隆进行全面测序。pAd6E1-E3+包括从碱基对1-341和碱基对3525-5548的Ad 5序列,Ad6碱基对5542-33784,Ad5碱基对33967-35935(对于Ad5和Ad6来说,碱基编号是相对wt 序列而言的)。pAd6E1-E3+包括所有Ad6毒粒结构蛋白的编码序列,构成了它的野生型特异性。 
在图11中示出了用于以含有Ad6区的细菌质粒形式回收pAd6E1-E3+的一般方法。用纯化的wt Ad6病毒DNA和被称为Ad6ITR盒的第二种DNA片段共转化BJ5183细菌,导致了通过同源重组产生的病毒基因组环化。ITR盒包括来自由包括细菌复制起点和氨苄青霉素抗性基因的质粒序列隔开的Ad6基因组的右侧末端(碱基对35460-35759)和左侧末端(碱基对1-450和碱基对3508-3807)序列。这三种片段是通过PCR产生的,并且随后克隆到NEB193中,产生了pNEBAd6-3(ITR盒)。ITR盒包括Ad5的451-3507的E1序列的缺失。ITR盒中的Ad6序列提供了与纯化的Ad6病毒DNA同源的区,其中,可以发生重组。 
pAd6E1-E3-前-腺病毒质粒的构建 
用含有Ad5区的pAd6E1-E3+作起点,构建了含有Ad5区,并且在E3区有缺失的Ad6型载体。将含有E3区(Ad6碱基对25871-31192)的pAd6E1-E3+的5322bp的亚片段亚克隆到pABS.3上,产生pABSAd6E3。然后在该质粒上产生3个E3缺失,产生了三种新的质粒pABSAd6E3(1.8Kb)(缺失了Ad6的碱基对28602-30440),pABSAd6E3(2.3Kb)(缺失了Ad6的碱基对28157-30437)和pABSAd6E3(2.6Kb)(缺失了Ad6的碱基对28157-30788)。然后利用细菌重组将3个E3缺失取代返回到pAd6E1-E3+中,产生Ad6基因组质粒pAd6E1-E3-1.8Kb,pAd6E1-E3-2.3Kb和pAd6E1-E3-2.6Kb。 
实施例6:制备具有NS序列的Ad5基因组质粒 
通过XmnI和NruI限制位点消化含有编码区NS3-NS4A-NS4B-NS5A的pcDNA3质粒(Invitrogen),并且将含有CMV激发子,NS3-NS4ANS4B-NS5A编码序列和牛生长激素(BGH)聚腺苷酸化信号的DNA片段克隆到穿梭载体pDe1E1Spa的独将的EcorV限制位点上,产生了Sva3-5A载体。 
用XmnI和EcorI消化(部分消化)含有编码区NS3-NS4A-NS4B-NS5A-NS5B的pcDNA3质粒,并且将含有部分NS5A,NS5B基因和BGH聚腺苷酸化信号的DNA片段克隆到Sva3-5A载体上,用EcorI和BglII消化,用Klenow补平末端,产生了Sva3-5B载体。 
最后通过SspI和Bst1107I限制位点消化Sva3-5B载体,并且将含有其侧翼为腺病毒序列的表达盒(CMV激发子,NS3-NS4A-NS4B-NS5A-NS5B编码序列和BGH聚腺苷酸化信号)的DNA片段与Ad5HVO(E1-,E3-)ClaI线性化的基因组质粒一起共转化到细菌菌株BJ5183中,产生pAd5HVONS。pAd5HVO包括Ad5碱基对1-341,碱基对3525-28133和碱基对30818-35935。 
实施例7:制备具有Nsmut序列的腺病毒基因组质粒 
在Ad5或Ad6背景中,制备含有NS-mut序列的腺病毒基因组质粒。Ad6背景包括Ad5区的1-450,3511-5548和33967-35935号碱基。 
用BglII和XbaI限制酶消化pV1JNS3-5Akozak,并且将含有Kozak序列和编码NS3-NS4A-NS4B-NS5A的序列的DNA片段克隆到BglII和XbaI消化过的polypMRKpde1E1穿梭载体中。所得到的载体被命名为shNS3-5Akozak。 
PolypMRKpde1E1是Rkpde1E1(Pac/pIX/pack450)+CMVmin+BGHpA(str)的衍生物。通过在CMV激发子下游的独特BglII限制位点上插入包括BglII,PmeI,SwaI,XbaI,SalI识别位点的多接头进行过修饰。MRKpdelE1(Pac/pIX/pack450)+CMVmin+BGHpA(str)包括Ad5序列的碱基对1-5792,具有E1序列的碱基对451-3510的缺失。将人CMV激发子和BGH聚腺苷酸化信号以E1平行取向插入E1缺失区,通过一个独特的BglII位点分隔它们。 
通过组装PCR并且通过同源重组插入shNS3-Sakozak载体,获得了NS5B片段,该片段发生了突变以便破坏了酶促活性,并且在3’末端具有强的翻译终止序列,产生了polypMRKpde1E1NSmut。在polypMRKpde1E1NSmut中,NS-mut编码序列受CMV激发子的控制,并且BGH聚腺苷酸化信号存在于下游。 
通过用PadI和Bst1107I限制酶切除所述基因表达盒和包括可以进行同源重组的腺病毒序列的侧翼区,并且与pAd5HVO(E1-,E3-)或pAd6E1-E3-2.6Kb ClaI线性化的基因组质粒共同转化细菌菌株BJ5183,以便分别产生pAd5HVONSmut和pAd6E1-,E3-Nsmut。 
pAd6E1-E3-2.6Kb包括Ad5碱基对1-341和碱基对3525-5548,Ad6碱基对5542-28157和碱基对30788-33784,和Ad5碱基对 33967-35935(对于Ad5和Ad6来说,碱基对编号是相对wt序列而言)。在这两种质粒上,病毒ITR′s是通过包括细菌复制起点和氨苄青霉素抗性基因的质粒序列连接的。 
实施例8:具有NSOPTmut的腺病毒基因组质粒的制备 
用BamHl和SalI限制酶消化由克隆到pCRBlunt载体(Invitrogen)上的SEQ.ID.NO.3提供的人密码子优化的合成基因(NSOPTmut),并且克隆到存在于穿梭载体pMRKpde1E1上的BglII和SalI限制位点上。所得到的克隆(polypMRKpde1E1NSOPTmut)用PacI和Bst1107I限制酶消化,并且与pAd5HVO(E1-,E3-)或pAd6E1-E3-2.6KbClaI线性化的基因组质粒一起共同转化到细菌菌株BJ5183中,分别产生pAd5HVONSOPTmut和pAd6E1-,E3-NSOPTmut。 
实施例9:腺病毒载体的回收和扩增 
在Per.6细胞中回收腺病毒载体。Per.C6是在补充了L-谷氨酰胺(最终浓度为4mM),青霉素/链霉素(最终浓度为100IU/ml)和10mMMgCl2的10%FCS/DMEM中生长的。在感染之后,将细胞保持在补充了5%马血清(HS)的相同培养基中。为了进行病毒回收,将2.5×106Per.C6铺平板到直径为6cm的Petri培养皿中。 
在铺平板24小时之后,通过磷酸钙方法,用10μg的PacI线性化的腺病毒DNA转染细胞。将所述DNA沉淀留在细胞上4小时时间。去掉所述培养基,并且添加5%HS/DMEM。 
将细胞保持在CO2培养箱中,直到出现细胞致病作用(1周)。回收细胞和上清液,并且进行3次冷冻/解冻循环(液氮/37℃的水浴)。在-4℃下,以3000rpm的速度对裂解物进行离心20分钟,并且以每个培养皿1毫升的用量,使用所回收的上清液(相当于包括仅在细胞上传代1次的病毒的细胞裂解液;P1),以便感染在直径10厘米的Petri培养皿中达到80%-90%铺满度的Per.C6。培养感染的细胞,直到出现细胞致病作用,回收细胞和上清液,并且按上述方法制备裂解液(P2)。 
将P2裂解液(4ml)用于感染2×15cm的Petri培养皿。将从该感染中回收的裂解液(P3),以等份样品形式在-80℃下保存,作为病毒的原种,以便用作大规模病毒制备的原材料。在这种情况下,1ml的原种就足以感染直径为2×15cm的Petri培养皿,并且将所得到 的裂解液(P4)用于感染要进行大规模感染的Petri培养皿。 
进一步的扩增是用P4裂解液进行的,该裂解液用不含FCS的培养基稀释,并且用于以每个培养10ml的用量感染30×15cm的Petri培养皿(Per.C6达到80%-90%的铺满度)。在CO2培养箱中培养细胞1小时,每隔20分钟进行轻微混合。在每个培养皿中添加12ml5%HS/DMEM,并且培养细胞直到出现细胞病理效应(大约48小时)。 
收集细胞和上清液,并且在4℃下以2Krpm的速度离心20分钟。将沉淀重新悬浮在15ml 0.1M Tris,pH=8.0中。通过3次冷冻/解冻循环裂解细胞(液氮/37℃的水浴)。添加150μl的2MMgCl2和75μl的DNAse(溶解在10ml的20mM Tris-HCl pH=7.4中的10mg牛胰腺脱氧核糖核酸酶I,50mM NaCl,1mM二硫苏糖醇,0.1mg/ml牛血清白蛋白,50%甘油),在37℃的水浴中培养1小时之后(每隔15分钟涡旋搅拌1次),在4℃下以4K rpm的速度对裂解液进行15分钟的离心。所回收的上清液可以加样到CsCl梯度上。CsCl梯度是按以下方法在SW40超透明试管中制备的: 
0.5ml的1.5d CsCl 
3ml的1.35d CsCl 
3ml的1.25d CsCl,在每个试管中加样5ml的病毒上清液。 
如果必要的话,在所述试管上面放置0.1Mtris-Cl,pH=8.0。用转子SW40,在10℃下以35K rpm将试管离心1小时。用注射器收集病毒带(位于1.25/1.35的界面上)。 
将所述病毒转移到新的SW40超透明试管中,并且将1.35dCsCl添加在试管的顶部。用转子SW40,在10℃下以35K rpm将试管离心24小时,然后以尽可能小的体积收集病毒,并且用缓冲液A105(5mMTris,5%蔗糖,75mM NaCl,1mM MgCl2,0.005%聚山梨醇酯80,pH=8.0)充分透析。在透析之后,以10%的最终浓度添加甘油,并且在-80℃下,以等分样品的形式保存病毒。 
实施例10:改善了的腺病毒载体回收 
发现具有HCV NSOPTmut转基因的第一代Ad5和Ad6载体难以回收。回收过程的一个可能的障碍可能是因为质粒DNA不能有效复制,它是腺病毒复制机制的一种亚最佳模板。与DNA的5’末端连接的末端蛋白的缺乏(通常存在于病毒DNA中),与插入所述载体的E1区中 的转基因的极高G-C含量相关,可能导致质粒衍生的腺病毒复制速度的显著降低。 
为了建立回收Ad载体的更有效的和可再现的方法,采用了包括受tet-诱导型激发子控制的所有E 2蛋白(聚合酶,前末端蛋白和DNA结合蛋白),以及E4orf6的表达载体(pE2;图19)。PE2的转染与PerC6和293中的正常前腺病毒质粒的组合,导致了Ad DNA复制的显著增强,并且导致了完整感染性腺病毒颗粒的更有效的产生。 
质粒构建 
pE2是基于克隆载体pBII(CLONTECH)的,具有两个附加元件,以便能够进行附加型复制,并且在细胞培养物中选择:(1)EBV-OriP(EBV[nt]7421-8042)区,当EBNA-1表达时,使得质粒能够与细胞周期同步复制,和(2)潮霉素-B磷酸转移酶(HPH)-抗性基因,使得能够阳性选择转化过的细胞。按以下方法构建了腺病毒基因E2a和b以及E4-Orf6的两个转录单位,并且在pE2中进行组装。 
Ad5-聚合酶ClaI/Sphl片段和Ad5-pTPAcc65/EcoRV片段是从pVac-Pol和pVac-pTP获得的(Stunnemberg等,NAR 16:2431-2444,1988)。用Klenow补平这两个片段,并且克隆到pBI的SalI(补平的)和EcoRV位点上,分别获得了pBI-Pol/pTP。 
通过将它克隆到pJC13-1的BamHI位点上,首先将来自pCEP4(Invitrogen)的EBV-OriP元件插入β-珠蛋白绝缘体二聚体中(Chung等,Cell 74(3):505-14,1993)。然后将来自pJC13-OriP的HS4-OriP片段克隆到pSAlmv(一种含有tk-Hygro-B抗性基因表达盒和Ad5复制起点的质粒)内部,通过PCR由pFG140获得了首尾连接排列的ITR′s(Graham,EMBO J.3:2917-2922,1984),用以下引物:5′-TCGAATCGATACGCGAACCTACGC-3′(SEQ.ID.NO.16)和5′-TCGACGTGTCGACTTCGAAGCGCACACCAAAAACGTC-3′(SEQ.ID.NO.17),因此产生了pMVHS40rip。然后将来自pMVHS40rip的包括绝缘的OriP,Ad5ITR连接和tk-HygroB盒的DNA片段插入pBI-Pol/pTP载体限制的AseI/AatII,产生了pBI-Pol/pTPHS4。 
为了构建能表达Ad5-Orf6和Ad5-DBP的第二种转录单位,首先将通过PCR获得的E4orf6(Ad5[nt]33193-34077)插入pBI载体,产生了pBI-Orf6。然后,将DBP编码DNA序列(Ad5[nt]22443-24032) 插入pBI-Orf6,获得了第二种双向Tet-调节的表达载体(pBI-DBPB4orf6)。用BGH和SV40polyA取代存在于pBI中的原始polyA信号。 
然后通过插入包括Adeno5-ITRs的DNA片段,修饰pBI-DBP/E4orf6,它们是以首尾连接形式排列的,还包括从质粒pSA-lmv中获得的潮霉素B抗性基因。然后将新的质粒pBIDBP/E4orf6shuttle用作供体质粒,以便用大肠杆菌菌株BJ5183进行同源重组,将第二种tet-调节的转录单位插入pBI-Pol/pTPHS4中,获得pE2。 
细胞系,转染和病毒扩增 
在补充了10%胎牛血清(FBS),10mM MgCl2,青霉素(100U/ml),链霉素(100ug/ml)和2mM谷氨酰胺的Dulbecco′s改良的Eagle′s培养基(DMEM)中培养PerC6细胞。 
所有瞬时转染都是按照生产商披露的方法用Lipofectamine2000(Invitrogen)进行的。用PacI消化过的3.5μg的Ad5/6NSOPTmut前-腺病毒质粒自身或与5μg pE2加1μg pUHD52.1组合转染生长在6cm平板上的铺满度为90%的PERC.6TM。pUHD52.1是反向tet反式激活蛋白2(rtTA2)的表达载体(Urlinger等,Proc.Natl.Acad.Sci.U.S.A.97(14):7963-7968,2000)。在转染时,细胞是在存在1μg/ml多西环素的条件下培养的,以便激活pE2表达。在转染之后7天收获细胞,并且通过3次冷冻/解冻循环获得细胞裂解液。将2ml细胞裂解液用于感染第二个6cm培养皿的PerC6。培养感染的细胞,直到出现完整的CPE,然后收获。按上述方法让病毒顺序传代5次,然后在氯化铯梯度上纯化。纯化病毒的DNA结构是通过内切核酸酶消化和琼脂糖凝胶电泳分析控制的,并且与原始前腺病毒质粒限制图谱进行比较。 
实施例11:HCV多蛋白编码核酸的部分优化 
进行HCV多蛋白编码核酸的部分优化,以便促进包括用于在人宿主中表达的优化密码子的腺病毒载体的产生。总体目标是提供由于密码子优化而产生的增强的表达,同时促进编码HCV多蛋白的腺病毒载体的产生。 
在生产编码HCV多蛋白的具有在人宿主中表达的优化密码子的 腺病毒载体时,遇到了若干种难题。发现包括优化序列(SEQ.ID.NO.3)的腺病毒载体,比包括非优化序列(SEQ.ID.NO.2)的腺病毒载体更难以合成和回收。 
生产包括SEQ.ID.NO.3腺病毒载体的难题是由于高的GC含量。特别有问题的区域是在NSOPTmut(SEQ.ID.NO.3)的大约3900号位置。 
设计了另一种版本的优化HCV编码核酸序列,以便有利于它在腺病毒载体上的应用。与NSOPTmut相比,将所述另一种版本设计成具有较低的总体GC含量,以便减轻/避免连续的G或C的潜在的有问题的基序的出现,同时保持高水平的密码子优化,以便能够改善所编码的多蛋白和各个裂解产物的表达。 
用于制备亚最佳密码子优化序列的起点是NSOPTmut核苷酸序列的编码区(SEQ.ID.NO.3的7-5961号碱基)。密码子使用频率的值(将每一种氨基酸标准化为总共1.0)是从在Wisconsin PackageVersion 10.3中提供件human_high.Cod中获得的(Accelrys Inc.,a wholly owned subsidiary of Pharmacopeia,Inc)。 
为了降低局部和总体GC含量,人工制备了确定每一种氨基酸的优选密码子取代的表格。对于每一种氨基酸来说,所述密码子1)与最常见的密码子相比,具有更低的GC含量,和2)选择出现较高的密码子使用频率(如在human_high.Cod中所定义的)作为取代密码子。例如,对于Arg来说,最高频率的密码子是CGC。在编码Arg的其他五种替代密码子(CGG,AGG,AGA,CGT,CGA)中,有三个(AGG,CGT,CGA)将GC含量降低了1个碱基,有1个(AGA)降低了2个碱基,并且有一个(CGG)降低了0个碱基。由于在human high.Cod中所列举的AGA密码子具有较低的使用频率(0.1),因此,取代CGC的密码子选择为具有0.18的相对频率的AGG。采用相似的标准,以便建立其他氨基酸的密码子取代,得到表5所示的清单。在以下优化方法中采用的参数是评经验确定的,以便所得到的序列保持显著改善了的密码子使用(对于每一种氨基酸而言),并且降低GC含量(总体上和连续G和/或C的局部片段形式)。 
部分优化的HCV编码序列的两种例子是由SEQ.ID.NO.10和SEQ.ID.NO.11提供的。SEQ.ID.NO.10提供了整体上部分优化的 HCV编码序列。SEQ.ID.NO.11提供了密码子使用完全优化的HCV编码序列,只有部分优化的区域例外。 
密码子优化是通过以下方法进行的: 
步骤1)使用3个密码子的滑动窗口(9个碱基),每一次循环后使所述窗口移动一个密码子,分析输入的完全优化的NSOPTmut序列的编码区。无论何时在所述窗口中检测到含有5个或5个以上连续C和/或G的片段,都采用以下取代规则:用N表示以前进行的密码子取代的数量。如果N是奇数的话,使用在表5中规定的密码子取代所述窗口中的中间密码子,如果N是偶数的话,使用在诸如human_high.cod.密码子优化表中规定的密码子取代窗口中的第三个末端密码子。如果在第二或第三个密码子存在Leu或Val,不进行任何取代,以便不导入具有很低相对密码子使用频率的Leu或Val密码子(例如,参见human_high.Cod)。在随后的循环中,对包括以前循环的取代的序列进行移动窗口分析。 
根据经验发现所述3个密码子窗口中的中间和末端密码子的其他取代,提供了更令人满意的优化密码子使用的总体保持,同时还降低了GC含量(在该方法之后根据最终序列判断)。不过,一般来说,正确的取代方法取决于由接受分析的核苷酸序列所编码的氨基酸序列,并且必须凭经验确定。 
步骤2)然后使用长度为21个密码子(63个碱基)的滑动窗口,对包括在步骤1)中进行的所有密码子取代的序列进行其他分析:根据可判断的参数,确定该窗口中总体GC含量。如果所述窗口中GC含量高于70%的话,就进行以下密码子取代方法:在所述窗口中,用表5中所提供的密码子取代氨基酸Asn,Asp,Cys,Glu,His,Ile,Lys,Phe,Tyr的密码子。对这一组氨基酸的取代的限制受到了以下事实的驱动:a)所述取代密码子仍然具有可接受的在human_high.Cod中的高的使用频率,和b)取代密码子的CUTG中的平均总体人密码子使用几乎与最常见的密码子一样高。在以下循环中,对包括前面循环的取代的序列进行移动窗口的分析。 
通过GC含量总体上的降低和各个氨基酸的高密码子优化的保持之间的折中,凭经验确定70%的阈值。与步骤1)一样,确切的取代方法(氨基酸和GC含量阈值的选择),同样取决于由接受分析的核 苷酸序列所编码的氨基酸序列,并且必须凭经验确定。 
步骤3)然后人工编辑通过步骤1)和2)产生的序列,并且按照以下标准改变其他密码子:人工检查在具有21个密码子的窗口上GC含量仍然高于70%的区域,并且按照表5中提供的方案再次取代少数密码子。 
进行随后的步骤,以便提供有用的限制位点,去掉互补链上的可能的开放读框,添加同源重组区,添加Kozac信号,并且添加一个终止子。这些步骤的编号为4-7。 
步骤4)检查步骤3)中所产生的序列的某些限制位点(BglII,PmeI和XbaI)的缺乏和仅有一个StuI位点的存在,以便可以进行随后的使用一小类显著酶的克隆策略。通过取代作为相应识别位点的一部分的密码子,从所述序列中去掉两个位点(一个BglII位点,以及一个StuI位点)。 
步骤5)然后相应修饰通过步骤1)-4)制备的序列,以便随后产生修饰过的NSOPTmut序列(通过同源重组)。在通过步骤1)-4)获得的序列中,包括3556-3755号碱基的片段和包括4456-4656号碱基的片段被来自NSOPTmut的相应的片段所取代。包括SEQ.ID.NO.10的3556-4656号碱基的片段可用于通过同源重组取代NSOPTmut上的有问题的区域(3900号位置附近),由此产生了具有SEQ.ID.NO.11的序列的NSOPTmut的变体。 
步骤6)分析在步骤1)-5)产生的序列,发现了一个潜在的、几乎跨越互补链上的完整片段的开放读框。从所述有义链上去掉所有密码子CTA和TTA(Leu)和TCA(Ser),能够有效除去所述互补链上的一个读框中的所有终止密码子。尽管转录该互补链开放读框,以及随后翻译成蛋白的可能性非常小,为了排除对有义链上的编码的序列的转录和随后翻译的潜在的干扰,大约每隔500个碱基,将编码Ser的TCA密码子导入所述有义链。在步骤5)中导入的片段中没有引入变化,以便可以进行同源重组。编码Ser的TCA密码子优于编码Leu的CTA和TTA密码子,因为与human_high.Cod中的CTA(0.02)和TTA(0.03)相比,TCA具有更高的相对频率(0.05)。另外,来自CUTG的平均人密码子使用,倾向于TCA(对于CTA和TTA来说为0.14和0.07)。 
步骤7)在最后一个步骤中,将GCCACC添加到该序列的5’末端,以便产生一个优化的内部核糖体进入位点(Kozak信号),并且在3’末端添加一个TAAA终止信号。为了保持NSsuboptmut的翻译特性的激发,所述编码区的前8个密码子保持与NSOPTmut序列相同。再次检查所得到的序列上BglII,PmeI和XbaI识别位点的缺乏,和仅有一个StuI位点的存在。 
与NSOPTmut(70.3%)相比,NSsuboptmut序列(SEQ.ID.NO.10)具有总体上较低的GC含量(63.5%),并且保持密码子使用优化的良好优化水平。NSsuboptmut与NSmut的核苷酸序列同一性为77.2%。 
表5:在步骤1)和步骤2)期间进行的密码子取代的定义 
Figure G2009102512982D00511
Figure G2009102512982D00521
实施例12:病毒表征 
通过以下方法表征腺病毒载体:(a)测定物理学颗粒/ml;(b)进行TaqMan PCR分析;和(c)在感染HeLa细胞之后检查蛋白表达。 
a)物理颗粒测定 
以1/10和1/100的比例用0.1%SDS PBS稀释氯化铯纯化的病毒。作为对照,使用缓冲液A105。在55℃下将所述稀释液培养10分钟,在对所述试管进行短时间离心之后,测定260nm下的O.D.。按以下方法计算病毒颗粒的数量:1OD 260nm=1.1×1012物理颗粒/ml。以上结果通常在5×1011和1×1012物理颗粒/ml范围内。 
b)TaqMan PCR分析 
将TaqMan PCR分析用于进行腺病毒载体基因组定量(Q-PCR颗粒/ml)。用ABI Prism 7700-序列检测仪进行TaqMan PCR分析。该反应是在50μl的最终体积中,在存在寡核苷酸(最终浓度200nM)和对腺病毒主链特异的探针(最终浓度200μM)的条件下进行的。用0.1%SDS PBS以1/10的比例稀释所述病毒,并且在55℃下培养10分钟。在对所述试管进行简单离心之后,制备系列的1/10稀释液(用水稀释)。将10μl的10-3,10-5和10-7稀释液用作PCR测定的模板。 
根据在相同实验中产生的标准曲线,计算存在于每一种样品中的颗粒的数量。典型的结果为1×1012至3×1012Q-PCR颗粒/ml。 
c)HCV非结构蛋白的表达 
通过感染HeLa细胞检测HCV NS蛋白的表达。在感染前一天,以1.5×106细胞/皿(直径10cm的Petri培养皿)的密度将细胞铺平板。将相当于m.o.i.50,250和1250pp/细胞的不同数量的氯化铯纯化的病毒稀释在培养基(无FCS)中,达到5ml的最终体积。将稀释过的病毒添加到所述细胞上,并且在37℃下,在CO2培养箱中培 养1小时(每隔20分钟进行轻柔混合)。添加5ml 5%HS-DMEM,并且在37℃下将所述细胞培养48小时。 
用1%Triton/TEN缓冲液制备细胞提取物。在10%SDS-丙烯酰胺凝胶上对提取物进行电泳,吸印到硝酸纤维素膜上,并且用针对NS3,NS5a和NS5b的抗体分析,以便检查正确的多蛋白裂解。将模拟感染的细胞用作阴性对照。在图14中示出了来自测试Ad5-NS,MRKAd5-NSmut,MRKAd6-NSmut和MRKAd6-NSOPTmut的典型实验的结果。 
实施例13:用编码不同NS盒的腺病毒载体对小鼠进行免疫 
将腺病毒载体Ad5-NS,MRKAd5-NSmut,MRKAd6-NSmut和MRKAd6-NSOPTmut注射到C57Black6小鼠株中,以便评估它们诱导抗HCV免疫反应的潜力。用109pp的CsCl纯化的病毒肌内注射各组动物(n=9-10)。每只动物以三周的间隔接受两剂。 
通过在用药之后对细菌表达的NS3蛋白酶结构域进行ELISA分析,测定在用药之后来自C57Black6免疫小鼠的两种血清中针对NS3蛋白的体液免疫反应。检测的对测试抗原特异的抗体的几何平均效价(GMT)为100-46000(表6,7,8和9)。 
表6:Ad5-NS 
Figure G2009102512982D00531
表7:Ad5-Nsmut 
表8:MRKAd5-Nsmut 
Figure G2009102512982D00533
表9:MRKAd6-NSmut 
通过定量ELISPOT测定分析TC57Black6小鼠体内的T细胞反应,其中测定对20聚体的五种合并物(从F到L+M命名)的反应的IFN-γ分泌T细胞的数量,所述肽有10个残基的重叠,包括NS3-NS5B序列。通过相同的测定,使用包括C57Black6小鼠的CD8+表位(pep1480)的20聚体肽,分析在C57Black6小鼠体内诱导的特异性CD8+反应。通过标准ELIspot测定,检测以抗原特异性方式分泌IFNγ的细胞。 
按上面实施例3所示方法生产并且处理脾细胞和肽。在图15中示出了来自通过两次注射109载体Ad5-NS,MRKAd5-Nsmut和MRKAd6-Nsmut的病毒颗粒免疫的C57Black6小鼠组(N=9-10)的代表性数据。 
例14:用腺病毒载体对猕猴进行免疫 
通过肌内注射氯化铯纯化的Ad5-NS,MRKAd5-NSmut,MRKAd6-Nsmut或MRKAd6-NSOPTmut病毒,对猕猴(N=3-4)进行免疫。在第0和第4周,每只动物在三角肌处接受两剂1011或1010vp。 
在不同的时间点通过以下方法测定CMI:a)IFN-γELISPOT(参见上文的实施例3),b)IFN-γICS,和c)大量CTL分析。以上分析方法确定了HCV抗原特异性CD8+和CD4+T淋巴细胞反应,并且可用于多种哺乳动物,如人,猕猴,小鼠和大鼠。 
特定肽或肽合并物的使用,可以简化在CTL细胞毒性分析,干扰素-γELISPOT分析,和干扰素-γ细胞内染色分析中的抗原呈递。制备基于各种HCV蛋白的氨基酸序列的肽(核心,E2,NS3,NS4A,NS4B,NS5a,NS5b),以便在所述分析中用于测定HCV DNA和腺病毒载体免疫的猕猴,以及HCV感染的人体内的免疫反应。所述各个肽是重叠的20聚体,错开10个氨基酸。可以将大的肽合并物用于检测对HCV蛋白的总体反应,同时,可以将较小的合并物和各个肽用于确定一种反应的表位特异性。 
IFN-γ1CS 
对于IFN-γICS来说,用肽合并抗原刺激存在于1ml R10(补充了10%FCS的RPMI培养基)中的2×106PBMC。每一种肽的最终浓度为2μg/ml。在37℃下,在CO2培养箱中将细胞培养1小时,然后以10μg/ml的最终浓度添加Brefeldin A,以便抑制可溶性细胞因子的分泌。在37℃下将细胞再培养14-16小时。 
在存在以下共刺激抗体的条件下进行刺激:CD28和CD49d(抗人CD28BD340975和抗人CD49d BD340976)。在培养之后,用表面抗原的荧光染料偶联的抗体对细胞进行染色:抗-CD3,抗-CD4,抗-CD8(CD3-APC Biosource APS0301,CD4-PE BD345769,CD8-PerCPBD345774)。 
为了检测细胞内细胞因子,用FACS透化缓冲液2(BD340973),2x最终浓度处理细胞。一旦固定和透化,用抗人IFN-γ,IFN-γFITC(Biosource AHC4338)的抗体培养细胞。 
将细胞重新悬浮在用PBS制备的1%甲醛中,并且在24小时之内,在FACS上分析。在装有两种激光的FACSCalibur仪器(BectonDickinson)上进行四色FACS分析。通过门控与CD3,CD8阳性细胞群偶联的正向与侧向散射中的淋巴细胞群获得数据。获得了所述门的至少30,000个事件。阳性细胞是以106淋巴细胞中IFN-γ表达细胞的数量形式表达的。 
在图16A-16D,17A和17B中,报导了在一次或两次注射1010或1011vp不同腺病毒载体之后从免疫过的猴获得的IFN-γELISPOT和IFN-γICS数据。 
大量CTL分析 
T淋巴细胞的区分效应物功能,是这种细胞群体的亚型直接裂解具有合适的MHC-相关抗原肽的细胞的能力。这种细胞毒性活性最常见的是与CD8+T淋巴细胞相关。 
在体外用能表达HCV抗原的重组疫苗病毒感染PBMC样品大约14天,以便提供记忆T细胞的抗原再刺激和扩增。测试了针对用肽抗原合并物处理过的自体B细胞系的细胞毒性。 
所述培养物的裂解功能,是以在用CTL效应细胞培养4小时期间,由靶细胞释放的铬导致的特异性裂解的百分比形式测定的。测定特异性细胞毒性,并且与不相关的抗原或赋形剂处理过的B细胞系进行比 较。这种分析是半定量的,并且是确定CTL反应是否是由疫苗引起的优选方式。在图18A-18F中示出了在两次注射1011vp/剂和腺病毒载体Ad5-NS,MRKAd5-Nsmut和MRKAd6-Nsmut之后,来自免疫过的猴的数据。 
其他实施方案在以下权利要求范围内。尽管业已示出了和说明了若干种实施方案,在不超出本发明构思和范围的前提下,可以进行各种改进。 
序列表 
<110>Merck&Co.Inc.,和Istituto Di Ricerche Di Biologia Molecolare P. 
     Angeletti S.P.A. 
<120>丙型肝炎病毒疫苗 
<130>ITR0015Y PCT 
<150>60/363,774 
<151>2002-03-13 
<150>60/328,655 
<151>2001-10-11 
<160>17 
<170>FastSEQ for Windows Version 4.0 
<210>1 
<211>1985 
<212>PRT 
<213>人工序列 
<220> 
<223>Met-NS3-NS4A-NS4B-NS5A-NS5B多肽 
<400>1 
Met Ala Pro Ile Thr Ala Tyr Ser Gln Gln Thr Arg Gly Leu Leu Gly 
 1               5                  10                  15 
Cys Ile Ile Thr Ser Leu Thr Gly Arg Asp Lys Asn Gln Val Glu Gly 
            20                  25                  30 
Glu Val Gln Val Val Ser Thr Ala Thr Gln Ser Phe Leu Ala Thr Cys 
        35                  40                  45 
Val Asn Gly Val Cys Trp Thr Val Tyr His Gly Ala Gly Ser Lys Thr 
    50                  55                  60 
Leu Ala Gly Pro Lys Gly Pro Ile Thr Gln Met Tyr Thr Asn Val Asp 
65                  70                  75                  80 
Gln Asp Leu Val Gly Trp Gln Ala Pro Pro Gly Ala Arg Ser Leu Thr 
                85                  90                  95 
Pro Cys Thr Cys Gly Ser Ser Asp Leu Tyr Leu Val Thr Arg His Ala 
            100                 105                 110 
Asp Val Ile Pro Val Arg Arg Arg Gly Asp Ser Arg Gly Ser Leu Leu 
        115                 120                 125 
Ser Pro Arg Pro Val Ser Tyr Leu Lys Gly Ser Ser Gly Gly Pro Leu 
    130                 135                 140 
Leu Cys Pro Ser Gly His Ala Val Gly Ile Phe Arg Ala Ala Val Cys 
145                 150                 155                 110 
Thr Arg Gly Val Ala Lys Ala Val Asp Phe Val Pro Val Glu Ser Met 
                165                 170                 175 
Glu Thr Thr Met Arg Ser Pro Val Phe Thr Asp Asn Ser Ser Pro Pro 
            180                 185                 190 
Ala Val Pro Gln Ser Phe Gln Val Ala His Leu His Ala Pro Thr Gly 
        195                 200                 205 
Ser Gly Lys Ser Thr Lys Val Pro Ala Ala Tyr Ala Ala Gln Gly Tyr 
    210                 215                 220 
Lys Val Leu Val Leu Asn Pro Ser Val Ala Ala Thr Leu Gly Phe Gly 
225                 230                 235                 240 
Ala Tyr Met Ser Lys Ala His Gly Ile Asp Pro Asn Ile Arg Thr Gly 
                245                 250                 255 
Val Arg Thr Ile Thr Thr Gly Ala Pro Val Thr Tyr Ser Thr Tyr Gly 
            260                 265                 270 
Lys Phe Leu Ala Asp Gly Gly Cys Ser Gly Gly Ala Tyr Asp Ile Ile 
        275                 280                 285 
Ile Cys Asp Glu Cys His Ser Thr Asp Ser Thr Thr Ile Leu Gly Ile 
    290                 295                 300 
Gly Thr Val Leu Asp Gln Ala Glu Thr Ala Gly Ala Arg Leu Val Val 
305                 310                 315                 320 
Leu Ala Thr Ala Thr Pro Pro Gly Ser Val Thr Val Pro His Pro Asn 
                325                 330                 335 
Ile Glu Glu Val Ala Leu Ser Asn Thr Gly Glu Ile Pro Phe Tyr Gly 
            340                 345                 350 
Lys Ala Ile Pro Ile Glu Ala Ile Arg Gly Gly Arg His Leu Ile Phe 
        355                 360                 365 
Cys His Ser Lys Lys Lys Cys Asp Glu Leu Ala Ala Lys Leu Ser Gly 
    370                 375                 380 
Leu Gly Ile Asn Ala Val Ala Tyr Tyr Arg Gly Leu Asp Val Ser Val 
385                 390                 395                 400 
Ile Pro Thr Ile Gly Asp Val Val Val Val Ala Thr Asp Ala Leu Met 
                405                 410                 415 
Thr Gly Tyr Thr Gly Asp Phe Asp Ser Val Ile Asp Cys Asn Thr Cys 
            420                 425                 430 
Val Thr Gln Thr Val Asp Phe Ser Leu Asp Pro Thr Phe Thr Ile Glu 
        435                 440                 445 
Thr Thr Thr Val Pro Gln Asp Ala Val Ser Arg Ser Gln Arg Arg Gly 
    450                 455                 460 
Arg Thr Gly Arg Gly Arg Arg Gly Ile Tyr Arg Phe Val Thr Pro Gly 
465                 470                 475                 480 
Glu Arg Pro Ser Gly Met Phe Asp Ser Ser Val Leu Cys Glu Cys Tyr 
                485                 490                 495 
Asp Ala Gly Cys Ala Trp Tyr Glu Leu Thr Pro Ala Glu Thr Ser Val 
            500                 505                 510 
Arg Leu Arg Ala Tyr Leu Asn Thr Pro Gly Leu Pro Val Cys Gln Asp 
        515                 520                 525 
His Leu Glu Phe Trp Glu Ser Val Phe Thr Gly Leu Thr His Ile Asp 
    530                 535                 540 
Ala His Phe Leu Ser Gln Thr Lys Gln Ala Gly Asp Asn Phe Pro Tyr 
545                 550                 555                 560 
Leu Val Ala Tyr Gln Ala Thr Val Cys Ala Arg Ala Gln Ala Pro Pro 
                565                 570                 575 
Pro Ser Trp Asp Gln Met Trp Lys Cys Leu Ile Arg Leu Lys Pro Thr 
            580                 585                 590 
Leu His Gly Pro Thr Pro Leu Leu Tyr Arg Leu Gly Ala Val Gln Asn 
        595                 600                 605 
Glu Val Thr Leu Thr His Pro Ile Thr Lys Tyr Ile Met Ala Cys Met 
    610                 615                 620 
Ser Ala Asp Leu Glu Val Val Thr Ser Thr Trp Val Leu Val Gly Gly 
625                 630                 635                 640 
Val Leu Ala Ala Leu Ala Ala Tyr Cys Leu Thr Thr Gly Ser Val Val 
                645                 650                 655 
Ile Val Gly Arg Ile Ile Leu Ser Gly Arg Pro Ala Ile Val Pro Asp 
            660                 665                 670 
Arg Glu Phe Leu Tyr Gln Glu Phe Asp Glu Met Glu Glu Cys Ala Ser 
        675                 680                 685 
His Leu Pro Tyr Ile Glu Gln Gly Met Gln Leu Ala Glu Gln Phe Lys 
    690                 695                 700 
Gln Lys Ala Leu Gly Leu Leu Gln Thr Ala Thr Lys Gln Ala Glu Ala 
705                 710                 715                 720 
Ala Ala Pro Val Val Glu Ser Lys Trp Arg Ala Leu Glu Thr Phe Trp 
                725                 730                 735 
Ala Lys His Met Trp Asn Phe Ile Ser Gly Ile Gln Tyr Leu Ala Gly 
            740                 745                 750 
Leu Ser Thr Leu Pro Gly Asn Pro Ala Ile Ala Ser Leu Met Ala Phe 
        755                 760                 765 
Thr Ala Ser Ile Thr Ser Pro Leu Thr Thr Gln Ser Thr Leu Leu Phe 
    770                 775                 780 
Asn Ile Leu Gly Gly Trp Val Ala Ala Gln Leu Ala Pro Pro Ser Ala 
785                 790                 795                 800 
Ala Ser Ala Phe Val Gly Ala Gly Ile Ala Gly Ala Ala Val Gly Ser 
                805                 810                 815 
Ile Gly Leu Gly Lys Val Leu Val Asp Ile Leu Ala Gly Tyr Gly Ala 
            820                 825                 830 
Gly Val Ala Gly Ala Leu Val Ala Phe Lys Val Met Ser Gly Glu Met 
        835                 840                 845 
Pro Ser Thr Glu Asp Leu Val Asn Leu Leu Pro Ala Ile Leu Ser Pro 
    850                 855                 860 
Gly Ala Leu Val Val Gly Val Val Cys Ala Ala Ile Leu Arg Arg His 
865                 870                 875                 880 
Val Gly Pro Gly Glu Gly Ala Val Gln Trp Met Asn Arg Leu Ile Ala 
                885                 890                 895 
Phe Ala Ser Arg Gly Asn His Val Ser Pro Thr His Tyr Val Pro Glu 
            900                 905                 910 
Ser Asp Ala Ala Ala Arg Val Thr Gln Ile Leu Ser Ser Leu Thr Ile 
        915                 920                 925 
Thr Gln Leu Leu Lys Arg Leu His Gln Trp Ile Asn Glu Asp Cys Ser 
    930                 935                 940 
Thr Pro Cys Ser Gly Ser Trp Leu Arg Asp Val Trp Asp Trp Ile Cys 
945                 950                 955                 960 
Thr Val Leu Thr Asp Phe Lys Thr Trp Leu Gln Ser Lys Leu Leu Pro 
                965                 970                 975 
Gln Leu Pro Gly Val Pro Phe Phe Ser Cys Gln Arg Gly Tyr Lys Gly 
            980                 985                 990 
Val Trp Arg Gly Asp Gly Ile Met Gln Thr Thr Cys Pro Cys Gly Ala 
        995                 1000                1005 
Gln Ile Thr Gly His Val Lys Asn Gly Ser Met Arg Ile Val Gly Pro 
    1010                1015                1020 
Lys Thr Cys Ser Asn Thr Trp His Gly Thr Phe Pro Ile Asn Ala Tyr 
1025                1030                1035                1040 
Thr Thr Gly Pro Cys Thr Pro Ser Pro Ala Pro Asn Tyr Ser Arg Ala 
                1045                1050                1055 
Leu Trp Arg Val Ala Ala Glu Glu Tyr Val Glu Val Thr Arg Val Gly 
            1060                1065                1070 
Asp Phe His Tyr Val Thr Gly Met Thr Thr Asp Asn Val Lys Cys Pro 
        1075                1080                1085 
Cys Gln Val Pro Ala Pro Glu Phe Phe Thr Glu Val Asp Gly Val Arg 
    1090                1095                1100 
Leu His Arg Tyr Ala Pro Ala Cys Arg Pro Leu Leu Arg Glu Glu Val 
1105                1110                1115                1120 
Thr Phe Gln Val Gly Leu Asn Gln Tyr Leu Val Gly Ser Gln Leu Pro 
                1125                1130                1135 
Cys Glu Pro Glu Pro Asp Val Ala Val Leu Thr Ser Met Leu Thr Asp 
            1140                1145                1150 
Pro Ser His Ile Thr Ala Glu Thr Ala Lys Arg Arg Leu Ala Arg Gly 
        1155                1160                1165 
Ser Pro Pro Ser Leu Ala Ser Ser Ser Ala Ser Gln Leu Ser Ala Pro 
    1170                1175                1180 
Ser Leu Lys Ala Thr Cys Thr Thr His His Val Ser Pro Asp Ala Asp 
1185                1190                1195                1200 
Leu Ile Glu Ala Asn Leu Leu Trp Arg Gln Glu Met Gly Gly Asn Ile 
                1205                1210                1215 
Thr Arg Val Glu Ser Glu Asn Lys Val Val Val Leu Asp Ser Phe Asp 
            1220                1225                1230 
Pro Leu Arg Ala Glu Glu Asp Glu Arg Glu Val Ser Val Pro Ala Glu 
        1235                1240                1245 
Ile Leu Arg Lys Ser Lys Lys Phe Pro Ala Ala Met Pro Ile Trp Ala 
    1250                1255                1260 
Arg Pro Asp Tyr Asn Pro Pro Leu Leu Glu Ser Trp Lys Asp Pro Asp 
1265                1270                1275                1280 
Tyr Val Pro Pro Val Val His Gly Cys Pro Leu Pro Pro Ile Lys Ala 
                1285                1290                1295 
Pro Pro Ile Pro Pro Pro Arg Arg Lys Arg Thr Val Val Leu Thr Glu 
            1300                1305                1310 
Ser Ser Val Ser Ser Ala Leu Ala Glu Leu Ala Thr Lys Thr Phe Gly 
        1315                1320                1325 
Ser Ser Glu Ser Ser Ala Val Asp Ser Gly Thr Ala Thr Ala Leu Pro 
    1330                1335                1340 
Asp Gln Ala Ser Asp Asp Gly Asp Lys Gly Ser Asp Val Glu Ser Tyr 
1345                1350                1355                1360 
Ser Ser Met Pro Pro Leu Glu Gly Glu Pro Gly Asp Pro Asp Leu Ser 
                1365                1370                1375 
Asp Gly Ser Trp Ser Thr Val Ser Glu Glu Ala Ser Glu Asp Val Val 
            1380                1385                1390 
Cys Cys Ser Met Ser Tyr Thr Trp Thr Gly Ala Leu Ile Thr Pro Cys 
        1395                1400                1405 
Ala Ala Glu Glu Ser Lys Leu Pro Ile Asn Ala Leu Ser Asn Ser Leu 
    1410                1415                1420 
Leu Arg His His Asn Met Val Tyr Ala Thr Thr Ser Arg Ser Ala Gly 
1425                1430                1435                1440 
Leu Arg Gln Lys Lys Val Thr Phe Asp Arg Leu Gln Val Leu Asp Asp 
                1445                1450                1455 
His Tyr Arg Asp Val Leu Lys Glu Met Lys Ala Lys Ala Ser Thr Val 
            1460                1465                1470 
Lys Ala Lys Leu Leu Ser Val Glu Glu Ala Cys Lys Leu Thr Pro Pro 
        1475                1480                1485 
His Ser Ala Lys Ser Lys Phe Gly Tyr Gly Ala Lys Asp Val Arg Asn 
    1490                1495                1500 
Leu Ser Ser Lys Ala Val Asn His Ile His Ser Val Trp Lys Asp Leu 
1505                1510                1515                1520 
Leu Glu Asp Thr Val Thr Pro Ile Asp Thr Thr Ile Met Ala Lys Asn 
                1525                1530                1535 
Glu Val Phe Cys Val Gln Pro Glu Lys Gly Gly Arg Lys Pro Ala Arg 
            1540                1545                1550 
Leu Ile Val Phe Pro Asp Leu Gly Val Arg Val Cys Glu Lys Met Ala 
        1555                1560                1565 
Leu Tyr Asp Val Val Ser Thr Leu Pro Gln Val Val Met Gly Ser Ser 
    1570                1575                1580 
Tyr Gly Phe Gln Tyr Ser Pro Gly Gln Arg Val Glu Phe Leu Val Asn 
1585                1590                1595                1600 
Thr Trp Lys Ser Lys Lys Asn Pro Met Gly Phe Ser Tyr Asp Thr Arg 
                1605                1610                1615 
Cys Phe Asp Ser Thr Val Thr Glu Asn Asp Ile Arg Val Glu Glu Ser 
            1620                1625                1630 
Ile Tyr Gln Cys Cys Asp Leu Ala Pro Glu Ala Arg Gln Ala Ile Lys 
        1635                1640                1645 
Ser Leu Thr Glu Arg Leu Tyr Ile Gly Gly Pro Leu Thr Asn Ser Lys 
    1650                1655                1660 
Gly Gln Asn Cys Gly Tyr Arg Arg Cys Arg Ala Ser Gly Val Leu Thr 
1665                1670                1675                1680 
Thr Ser Cys Gly Asn Thr Leu Thr Cys Tyr Leu Lys Ala Ser Ala Ala 
                1685                1690                1695 
Cys Arg Ala Ala Lys Leu Gln Asp Cys Thr Met Leu Val Asn Ala Ala 
            1700                1705                1710 
Gly Leu Val Val Ile Cys Glu Ser Ala Gly Thr Gln Glu Asp Ala Ala 
        1715                1720                1725 
Ser Leu Arg Val Phe Thr Glu Ala Met Thr Arg Tyr Ser Ala Pro Pro 
    1730                1735                1740 
Gly Asp Pro Pro Gln Pro Glu Tyr Asp Leu Glu Leu Ile Thr Ser Cys 
1745                1750                1755                1760 
Ser Ser Asn Val Ser Val Ala His Asp Ala Ser Gly Lys Arg Val Tyr 
                1765                1770                1775 
Tyr Leu Thr Arg Asp Pro Thr Thr Pro Leu Ala Arg Ala Ala Trp Glu 
            1780                1785                1790 
Thr Ala Arg His Thr Pro Val Asn Ser Trp Leu Gly Asn Ile Ile Met 
        1795                1800                1805 
Tyr Ala Pro Thr Leu Trp Ala Arg Met Ile Leu Met Thr His Phe Phe 
    1810                1815                1820 
Ser Ile Leu Leu Ala Gln Glu Gln Leu Glu Lys Ala Leu Asp Cys Gln 
1825                1830                1835                1840 
Ile Tyr Gly Ala Cys Tyr Ser Ile Glu Pro Leu Asp Leu Pro Gln Ile 
                1845                1850                1855 
Ile Glu Arg Leu His Gly Leu Ser Ala Phe Ser Leu His Ser Tyr Ser 
            1860                1865                1870 
Pro Gly Glu Ile Asn Arg Val Ala Ser Cys Leu Arg Lys Leu Gly Val 
        1875                1880                1885 
Pro Pro Leu Arg Val Trp Arg His Arg Ala Arg Ser Val Arg Ala Arg 
    1890                1895                1900 
Leu Leu Ser Gln Gly Gly Arg Ala Ala Thr Cys Gly Lys Tyr Leu Phe 
1905                1910                1915                1920 
Asn Trp Ala Val Lys Thr Lys Leu Lys Leu Thr Pro Ile Pro Ala Ala 
                1925                1930                1935 
Ser Gln Leu Asp Leu Ser Gly Trp Phe Val Ala Gly Tyr Ser Gly Gly 
            1940                1945                1950 
Asp Ile Tyr His Ser Leu Ser Arg Ala Arg Pro Arg Trp Phe Met Leu 
        1955                1960                1965 
Cys Leu Leu Leu Leu Ser Val Gly Val Gly Ile Tyr Leu Leu Pro Asn 
    1970                1975                1980 
Arg 
1985 
<210>2 
<211>5965 
<212>DNA 
<213>人工序列 
<220> 
<223>编码SEQ.ID.NO.1的未优化的cDNA序列 
<400>2 
gccaccatgg cgcccatcac ggcctactcc caacagacgc ggggcctact tggttgcatc    60 
atcactagcc ttacaggccg ggacaagaac caggtcgagg gagaggttca ggtggtttcc    120 
accgcaacac aatccttcct ggcgacctgc gtcaacggcg tgtgttggac cgtttaccat    180 
ggtgctggct caaagacctt agccggccca aaggggccaa tcacccagat gtacactaat    240 
gtggaccagg acctcgtcgg ctggcaggcg ccccccgggg cgcgttcctt gacaccatgc    300 
acctgtggca gctcagacct ttacttggtc acgagacatg ctgacgtcat tccggtgcgc    360 
cggcggggcg acagtagggg gagcctgctc tcccccaggc ctgtctccta cttgaagggc    420 
tcttcgggtg gtccactgct ctgcccttcg gggcacgctg tgggcatctt ccgggctgcc    480 
gtatgcaccc ggggggttgc gaaggcggtg gactttgtgc ccgtagagtc catggaaact    540 
actatgcggt ctccggtctt cacggacaac tcatcccccc cggccgtacc gcagtcattt    600 
caagtggccc acctacacgc tcccactggc agcggcaaga gtactaaagt gccggctgca    660 
tatgcagccc aagggtacaa ggtgctcgtc ctcaatccgt ccgttgccgc taccttaggg    720 
tttggggcgt atatgtctaa ggcacacggt attgacccca acatcagaac tggggtaagg    780 
accattacca caggcgcccc cgtcacatac tctacctatg gcaagtttct tgccgatggt    840 
ggttgctctg ggggcgctta tgacatcata atatgtgatg agtgccattc aactgactcg    900 
actacaatct tgggcatcgg cacagtcctg gaccaagcgg agacggctgg agcgcggctt    960 
gtcgtgctcg ccaccgctac gcctccggga tcggtcaccg tgccacaccc aaacatcgag   1020 
gaggtggccc tgtctaatac tggagagatc cccttctatg gcaaagccat ccccattgaa    1080 
gccatcaggg ggggaaggca tctcattttc tgtcattcca agaagaagtg cgacgagctc    1140 
gccgcaaagc tgtcaggcct cggaatcaac gctgtggcgt attaccgggg gctcgatgtg    1200 
tccgtcatac caactatcgg agacgtcgtt gtcgtggcaa cagacgctct gatgacgggc    1260 
tatacgggcg actttgactc agtgatcgac tgtaacacat gtgtcaccca gacagtcgac    1320 
ttcagcttgg atcccacctt caccattgag acgacgaccg tgcctcaaga cgcagtgtcg    1380 
cgctcgcagc ggcggggtag gactggcagg ggtaggagag gcatctacag gtttgtgact    1440 
ccgggagaac ggccctcggg catgttcgat tcctcggtcc tgtgtgagtg ctatgacgcg    1500 
ggctgtgctt ggtacgagct cacccccgcc gagacctcgg ttaggttgcg ggcctacctg    1560 
aacacaccag ggttgcccgt ttgccaggac cacctggagt tctgggagag tgtcttcaca    1620 
ggcctcaccc acatagatgc acacttcttg tcccagacca agcaggcagg agacaacttc    1680 
ccctacctgg tagcatacca agccacggtg tgcgccaggg ctcaggcccc acctccatca    1740 
tgggatcaaa tgtggaagtg tctcatacgg ctgaaaccta cgctgcacgg gccaacaccc    1800 
ttgctgtaca ggctgggagc cgtccaaaat gaggtcaccc tcacccaccc cataaccaaa    1860 
tacatcatgg catgcatgtc ggctgacctg gaggtcgtca ctagcacctg ggtgctggtg    1920 
ggcggagtcc ttgcagctct ggccgcgtat tgcctgacaa caggcagtgt ggtcattgtg    1980 
ggtaggatta tcttgtccgg gaggccggct attgttcccg acagggagtt tctctaccag    2040 
gagttcgatg aaatggaaga gtgcgcctcg cacctccctt acatcgagca gggaatgcag    2100 
ctcgccgagc aattcaagca gaaagcgctc gggttactgc aaacagccac caaacaagcg    2160 
gaggctgctg ctcccgtggt ggagtccaag tggcgagccc ttgagacatt ctgggcgaag    2220 
cacatgtgga atttcatcag cgggatacag tacttagcag gcttatccac tctgcctggg    2280 
aaccccgcaa tagcatcatt gatggcattc acagcctcta tcaccagccc gctcaccacc    2340 
caaagtaccc tcctgtttaa catcttgggg gggtgggtgg ctgcccaact cgcccccccc    2400 
agcgccgctt cggctttcgt gggcgccggc atcgccggtg cggctgttgg cagcataggc    2460 
cttgggaagg tgcttgtgga cattctggcg ggttatggag caggagtggc cggcgcgctc    2520 
gtggccttca aggtcatgag cggcgagatg ccctccaccg aggacctggt caatctactt    2580 
cctgccatcc tctctcctgg cgccctggtc gtcggggtcg tgtgtgcagc aatactgcgt    2640 
cgacacgtgg gtccgggaga gggggctgtg cagtggatga accggctgat agcgttcgcc    2700 
tcgcggggta atcatgtttc ccccacgcac tatgtgcctg agagcgacgc cgcagcgcgt    2760 
gttactcaga tcctctccag ccttaccatc actcagctgc tgaaaaggct ccaccagtgg    2820 
attaatgaag actgctccac accgtgttcc ggctcgtggc taagggatgt ttgggactgg    2880 
atatgcacgg tgttgactga cttcaagacc tggctccagt ccaagctcct gccgcagcta    2940 
ccgggagtcc cttttttctc gtgccaacgc gggtacaagg gagtctggcg gggagacggc    3000 
atcatgcaaa ccacctgccc atgtggagca cagatcaccg gacatgtcaa aaacggttcc    3060 
atgaggatcg tcgggcctaa gacctgcagc aacacgtggc atggaacatt ccccatcaac    3120 
gcatacacca cgggcccctg cacaccctct ccagcgccaa actattctag ggcgctgtgg    3180 
cgggtggccg ctgaggagta cgtggaggtc acgcgggtgg gggatttcca ctacgtgacg    3240 
ggcatgacca ctgacaacgt aaagtgccca tgccaggttc cggctcctga attcttcacg    3300 
gaggtggacg gagtgcggtt gcacaggtac gctccggcgt gcaggcctct cctacgggag    3360 
gaggttacat tccaggtcgg gctcaaccaa tacctggttg ggtcacagct accatgcgag    3420 
cccgaaccgg atgtagcagt gctcacttcc atgctcaccg acccctccca catcacagca    3480 
gaaacggcta agcgtaggtt ggccaggggg tctcccccct ccttggccag ctcttcagct    3540 
agccagttgt ctgcgccttc cttgaaggcg acatgcacta cccaccatgt ctctccggac    3600 
gctgacctca tcgaggccaa cctcctgtgg cggcaggaga tgggcgggaa catcacccgc    3660 
gtggagtcgg agaacaaggt ggtagtcctg gactctttcg acccgcttcg agcggaggag    3720 
gatgagaggg aagtatccgt tccggcggag atcctgcgga aatccaagaa gttccccgca    3780 
gcgatgccca tctgggcgcg cccggattac aaccctccac tgttagagtc ctggaaggac    3840 
ccggactacg tccctccggt ggtgcacggg tgcccgttgc cacctatcaa ggcccctcca    3900 
ataccacctc cacggagaaa gaggacggtt gtcctaacag agtcctccgt gtcttctgcc    3960 
ttagcggagc tcgctactaa gaccttcggc agctccgaat catcggccgt cgacagcggc    4020 
acggcgaccg cccttcctga ccaggcctcc gacgacggtg acaaaggatc cgacgttgag    4080 
tcgtactcct ccatgccccc ccttgagggg gaaccggggg accccgatct cagtgacggg    4140 
tcttggtcta ccgtgagcga ggaagctagt gaggatgtcg tctgctgctc aatgtcctac    4200 
acatggacag gcgccttgat cacgccatgc gctgcggagg aaagcaagct gcccatcaac    4260 
gcgttgagca actctttgct gcgccaccat aacatggttt atgccacaac atctcgcagc    4320 
gcaggcctgc ggcagaagaa ggtcaccttt gacagactgc aagtcctgga cgaccactac    4380 
cgggacgtgc tcaaggagat gaaggcgaag gcgtccacag ttaaggctaa actcctatcc    4440 
gtagaggaag cctgcaagct gacgccccca cattcggcca aatccaagtt tggctatggg    4500 
gcaaaggacg tccggaacct atccagcaag gccgttaacc acatccactc cgtgtggaag    4560 
gacttgctgg aagacactgt gacaccaatt gacaccacca tcatggcaaa aaatgaggtt    4620 
ttctgtgtcc aaccagagaa aggaggccgt aagccagccc gccttatcgt attcccagat    4680 
ctgggagtcc gtgtatgcga gaagatggcc ctctatgatg tggtctccac ccttcctcag    4740 
gtcgtgatgg gctcctcata cggattccag tactctcctg ggcagcgagt cgagttcctg    4800 
gtgaatacct ggaaatcaaa gaaaaacccc atgggctttt catatgacac tcgctgtttc    4860 
gactcaacgg tcaccgagaa cgacatccgt gttgaggagt caatttacca atgttgtgac    4920 
ttggcccccg aagccagaca ggccataaaa tcgctcacag agcggcttta tatcgggggt    4980 
cctctgacta attcaaaagg gcagaactgc ggttatcgcc ggtgccgcgc gagcggcgtg    5040 
ctgacgacta gctgcggtaa caccctcaca tgttacttga aggcctctgc agcctgtcga    5100 
gctgcgaagc tccaggactg cacgatgctc gtgaacgccg ccggccttgt cgttatctgt    5160 
gaaagcgcgg gaacccaaga ggacgcggcg agcctacgag tcttcacgga ggctatgact    5220 
aggtactctg ccccccccgg ggacccgccc caaccagaat acgacttgga gctgataaca    5280 
tcatgttcct ccaatgtgtc ggtcgcccac gatgcatcag gcaaaagggt gtactacctc    5340 
acccgtgatc ccaccacccc cctcgcacgg gctgcgtggg aaacagctag acacactcca    5400 
gttaactcct ggctaggcaa cattatcatg tatgcgccca ctttgtgggc aaggatgatt    5460 
ctgatgactc acttcttctc catccttcta gcacaggagc aacttgaaaa agccctggac    5520 
tgccagatct acggggcctg ttactccatt gagccacttg acctacctca gatcattgaa    5580 
cgactccatg gccttagcgc attttcactc catagttact ctccaggtga gatcaatagg    5640 
gtggcttcat gcctcaggaa acttggggta ccacccttgc gagtctggag acatcgggcc    5700 
aggagcgtcc gcgctaggct actgtcccag ggggggaggg ccgccacttg tggcaagtac    5760 
ctcttcaact gggcagtgaa gaccaaactc aaactcactc caatcccggc tgcgtcccag    5820 
ctggacttgt ccggctggtt cgttgctggt tacagcgggg gagacatata tcacagcctg    5880 
tctcgtgccc gaccccgctg gttcatgctg tgcctactcc tactttctgt aggggtaggc    5940 
atctacctgc tccccaaccg ataaa                                          5965 
<210>3 
<211>5965 
<212>DNA 
<213>人工序列 
<220> 
<223>编码SEQ ID NO:1的优化的cDNA 
<400>3 
gccaccatgg cccccatcac cgcctacagc cagcagaccc gcggcctgct gggctgcatc     60 
atcaccagcc tgaccggccg cgacaagaac caggtggagg gcgaggtgca ggtggtgagc    120 
accgccaccc agagcttcct ggccacctgc gtgaacggcg tgtgctggac cgtgtaccac    180 
ggcgccggca gcaagaccct ggccggcccc aagggcccca tcacccagat gtacaccaac    240 
gtggaccagg acctggtggg ctggcaggcc ccccccggcg cccgcagcct gaccccctgc    300 
acctgcggca gcagcgacct gtacctggtg acccgccacg ccgacgtgat ccccgtgcgc    360 
cgccgcggcg acagccgcgg cagcctgctg agcccccgcc ccgtgagcta cctgaagggc    420 
agcagcggcg gccccctgct gtgccccagc ggccacgccg tgggcatctt ccgcgccgcc    480 
gtgtgcaccc gcggcgtggc caaggccgtg gacttcgtgc ccgtggagag catggagacc    540 
accatgcgca gccccgtgtt caccgacaac agcagccccc ccgccgtgcc ccagagcttc    600 
caggtggccc acctgcacgc ccccaccggc agcggcaaga gcaccaaggt gcccgccgcc    660 
tacgccgccc agggctacaa ggtgctggtg ctgaacccca gcgtggccgc caccctgggc    720 
ttcggcgcct acatgagcaa ggcccacggc atcgacccca acatccgcac cggcgtgcgc    780 
accatcacca ccggcgcccc cgtgacctac agcacctacg gcaagttcct ggccgacggc    840 
ggctgcagcg gcggcgccta cgacatcatc atctgcgacg agtgccacag caccgacagc    900 
accaccatcc tgggcatcgg caccgtgctg gaccaggccg agaccgccgg cgcccgcctg    960 
gtggtgctgg ccaccgccac cccccccggc agcgtgaccg tgccccaccc caacatcgag   1020 
gaggtggccc tgagcaacac cggcgagatc cccttctacg gcaaggccat ccccatcgag   1080 
gccatccgcg gcggccgcca cctgatcttc tgccacagca agaagaagtg cgacgagctg   1140 
gccgccaagc tgagcggcct gggcatcaac gccgtggcct actaccgcgg cctggacgtg   1200 
agcgtgatcc ccaccatcgg cgacgtggtg gtggtggcca ccgacgccct gatgaccggc   1260 
tacaccggcg acttcgacag cgtgatcgac tgcaacacct gcgtgaccca gaccgtggac    1320 
ttcagcctgg accccacctt caccatcgag accaccaccg tgccccagga cgccgtgagc    1380 
cgcagccagc gccgcggccg caccggccgc ggccgccgcg gcatctaccg cttcgtgacc    1440 
cccggcgagc gccccagcgg catgttcgac agcagcgtgc tgtgcgagtg ctacgacgcc    1500 
ggctgcgcct ggtacgagct gacccccgcc gagaccagcg tgcgcctgcg cgcctacctg    1560 
aacacccccg gcctgcccgt gtgccaggac cacctggagt tctgggagag cgtgttcacc    1620 
ggcctgaccc acatcgacgc ccacttcctg agccagacca agcaggccgg cgacaacttc    1680 
ccctacctgg tggcctacca ggccaccgtg tgcgcccgcg cccaggcccc cccccccagc    1740 
tgggaccaga tgtggaagtg cctgatccgc ctgaagccca ccctgcacgg ccccaccccc    1800 
ctgctgtacc gcctgggcgc cgtgcagaac gaggtgaccc tgacccaccc catcaccaag    1860 
tacatcatgg cctgcatgag cgccgacctg gaggtggtga ccagcacctg ggtgctggtg    1920 
ggcggcgtgc tggccgccct ggccgcctac tgcctgacca ccggcagcgt ggtgatcgtg    1980 
ggccgcatca tcctgagcgg ccgccccgcc atcgtgcccg accgcgagtt cctgtaccag    2040 
gagttcgacg agatggagga gtgcgccagc cacctgccct acatcgagca gggcatgcag    2100 
ctggccgagc agttcaagca gaaggccctg ggcctgctgc agaccgccac caagcaggcc    2160 
gaggccgccg cccccgtggt ggagagcaag tggcgcgccc tggagacctt ctgggccaag    2220 
cacatgtgga acttcatcag cggcatccag tacctggccg gcctgagcac cctgcccggc    2280 
aaccccgcca tcgccagcct gatggccttc accgccagca tcaccagccc cctgaccacc    2340 
cagagcaccc tgctgttcaa catcctgggc ggctgggtgg ccgcccagct ggcccccccc    2400 
agcgccgcca gcgccttcgt gggcgccggc atcgccggcg ccgccgtggg cagcatcggc    2460 
ctgggcaagg tgctggtgga catcctggcc ggctacggcg ccggcgtggc cggcgccctg    2520 
gtggccttca aggtgatgag cggcgagatg cccagcaccg aggacctggt gaacctgctg    2580 
cccgccatcc tgagccccgg cgccctggtg gtgggcgtgg tgtgcgccgc catcctgcgc    2640 
cgccacgtgg gccccggcga gggcgccgtg cagtggatga accgcctgat cgccttcgcc    2700 
agccgcggca accacgtgag ccccacccac tacgtgcccg agagcgacgc cgccgcccgc    2760 
gtgacccaga tcctgagcag cctgaccatc acccagctgc tgaagcgcct gcaccagtgg    2820 
atcaacgagg actgcagcac cccctgcagc ggcagctggc tgcgcgacgt gtgggactgg    2880 
atctgcaccg tgctgaccga cttcaagacc tggctgcaga gcaagctgct gccccagctg    2940 
cccggcgtgc ccttcttcag ctgccagcgc ggctacaagg gcgtgtggcg cggcgacggc    3000 
atcatgcaga ccacctgccc ctgcggcgcc cagatcaccg gccacgtgaa gaacggcagc    3060 
atgcgcatcg tgggccccaa gacctgcagc aacacctggc acggcacctt ccccatcaac    3120 
gcctacacca ccggcccctg cacccccagc cccgccccca actacagccg cgccctgtgg    3180 
cgcgtggccg ccgaggagta cgtggaggtg acccgcgtgg gcgacttcca ctacgtgacc    3240 
ggcatgacca ccgacaacgt gaagtgcccc tgccaggtgc ccgcccccga gttcttcacc    3300 
gaggtggacg gcgtgcgcct gcaccgctac gcccccgcct gccgccccct gctgcgcgag    3360 
gaggtgacct tccaggtggg cctgaaccag tacctggtgg gcagccagct gccctgcgag    3420 
cccgagcccg acgtggccgt gctgaccagc atgctgaccg accccagcca catcaccgcc    3480 
gagaccgcca agcgccgcct ggcccgcggc agccccccca gcctggccag cagcagcgcc    3540 
agccagctga gcgcccccag cctgaaggcc acctgcacca cccaccacgt gagccccgac    3600 
gccgacctga tcgaggccaa cctgctgtgg cgccaggaga tgggcggcaa catcacccgc    3660 
gtggagagcg agaacaaggt ggtggtgctg gacagcttcg accccctgcg cgccgaggag    3720 
gacgagcgcg aggtgagcgt gcccgccgag atcctgcgca agagcaagaa gttccccgcc    3780 
gccatgccca tctgggcccg ccccgactac aacccccccc tgctggagag ctggaaggac    3840 
cccgactacg tgccccccgt ggtgcacggc tgccccctgc cccccatcaa ggcccccccc    3900 
atcccccccc cccgccgcaa gcgcaccgtg gtgctgaccg agagcagcgt gagcagcgcc    3960 
ctggccgagc tggccaccaa gaccttcggc agcagcgaga gcagcgccgt ggacagcggc    4020 
accgccaccg ccctgcccga ccaggccagc gacgacggcg acaagggcag cgacgtggag    4080 
agctacagca gcatgccccc cctggagggc gagcccggcg accccgacct gagcgacggc    4140 
agctggagca ccgtgagcga ggaggccagc gaggacgtgg tgtgctgcag catgagctac    4200 
acctggaccg gcgccctgat caccccctgc gccgccgagg agagcaagct gcccatcaac    4260 
gccctgagca acagcctgct gcgccaccac aacatggtgt acgccaccac cagccgcagc    4320 
gccggcctgc gccagaagaa ggtgaccttc gaccgcctgc aggtgctgga cgaccactac    4380 
cgcgacgtgc tgaaggagat gaaggccaag gccagcaccg tgaaggccaa gctgctgagc    4440 
gtggaggagg cctgcaagct gacccccccc cacagcgcca agagcaagtt cggctacggc    4500 
gccaaggacg tgcgcaacct gagcagcaag gccgtgaacc acatccacag cgtgtggaag    4560 
gacctgctgg aggacaccgt gacccccatc gacaccacca tcatggccaa gaacgaggtg    4620 
ttctgcgtgc agcccgagaa gggcggccgc aagcccgccc gcctgatcgt gttccccgac  4680 
ctgggcgtgc gcgtgtgcga gaagatggcc ctgtacgacg tggtgagcac cctgccccag  4740 
gtggtgatgg gcagcagcta cggcttccag tacagccccg gccagcgcgt ggagttcctg  4800 
gtgaacacct ggaagagcaa gaagaacccc atgggcttca gctacgacac ccgctgcttc  4860 
gacagcaccg tgaccgagaa cgacatccgc gtggaggaga gcatctacca gtgctgcgac  4920 
ctggcccccg aggcccgcca ggccatcaag agcctgaccg agcgcctgta catcggcggc  4980 
cccctgacca acagcaaggg ccagaactgc ggctaccgcc gctgccgcgc cagcggcgtg  5040 
ctgaccacca gctgcggcaa caccctgacc tgctacctga aggccagcgc cgcctgccgc  5100 
gccgccaagc tgcaggactg caccatgctg gtgaacgccg ccggcctggt ggtgatctgc  5160 
gagagcgccg gcacccagga ggacgccgcc agcctgcgcg tgttcaccga ggccatgacc  5220 
cgctacagcg ccccccccgg cgaccccccc cagcccgagt acgacctgga gctgatcacc  5280 
agctgcagca gcaacgtgag cgtggcccac gacgccagcg gcaagcgcgt gtactacctg  5340 
acccgcgacc ccaccacccc cctggcccgc gccgcctggg agaccgcccg ccacaccccc  5400 
gtgaacagct ggctgggcaa catcatcatg tacgccccca ccctgtgggc ccgcatgatc  5460 
ctgatgaccc acttcttcag catcctgctg gcccaggagc agctggagaa ggccctggac  5520 
tgccagatct acggcgcctg ctacagcatc gagcccctgg acctgcccca gatcatcgag  5580 
cgcctgcacg gcctgagcgc cttcagcctg cacagctaca gccccggcga gatcaaccgc  5640 
gtggccagct gcctgcgcaa gctgggcgtg ccccccctgc gcgtgtggcg ccaccgcgcc  5700 
cgcagcgtgc gcgcccgcct gctgagccag ggcggccgcg ccgccacctg cggcaagtac  5760 
ctgttcaact gggccgtgaa gaccaagctg aagctgaccc ccatccccgc cgccagccag  5820 
ctggacctga gcggctggtt cgtggccggc tacagcggcg gcgacatcta ccacagcctg  5880 
agccgcgccc gcccccgctg gttcatgctg tgcctgctgc tgctgagcgt gggcgtgggc  5940 
atctacctgc tgcccaaccg ctaaa                                        5965 
<210>4 
<211>37090 
<212>DNA 
<213>人工序列 
<220> 
<223>MRKAd6-NSmut核酸 
<400>4 
catcatcaat aatatacctt attttggatt gaagccaata tgataatgag ggggtggagt     60 
ttgtgacgtg gcgcggggcg tgggaacggg gcgggtgacg tagtagtgtg gcggaagtgt    120 
gatgttgcaa gtgtggcgga acacatgtaa gcgacggatg tggcaaaagt gacgtttttg    180 
gtgtgcgccg gtgtacacag gaagtgacaa ttttcgcgcg gttttaggcg gatgttgtag    240 
taaatttggg cgtaaccgag taagatttgg ccattttcgc gggaaaactg aataagagga    300 
agtgaaatct gaataatttt gtgttactca tagcgcgtaa tatttgtcta gggccgcggg    360 
gactttgacc gtttacgtgg agactcgccc aggtgttttt ctcaggtgtt ttccgcgttc    420 
cgggtcaaag ttggcgtttt attattatag gcggccgcga tccattgcat acgttgtatc    480 
catatcataa tatgtacatt tatattggct catgtccaac attaccgcca tgttgacatt    540 
gattattgac tagttattaa tagtaatcaa ttacggggtc attagttcat agcccatata    600 
tggagttccg cgttacataa cttacggtaa atggcccgcc tggctgaccg cccaacgacc    660 
cccgcccatt gacgtcaata atgacgtatg ttcccatagt aacgccaata gggactttcc    720 
attgacgtca atgggtggag tatttacggt aaactgccca cttggcagta catcaagtgt    780 
atcatatgcc aagtacgccc cctattgacg tcaatgacgg taaatggccc gcctggcatt    840 
atgcccagta catgacctta tgggactttc ctacttggca gtacatctac gtattagtca    900 
tcgctattac catggtgatg cggttttggc agtacatcaa tgggcgtgga tagcggtttg    960 
actcacgggg atttccaagt ctccacccca ttgacgtcaa tgggagtttg ttttggcacc   1020 
aaaatcaacg ggactttcca aaatgtcgta acaactccgc cccattgacg caaatgggcg   1080 
gtaggcgtgt acggtgggag gtctatataa gcagagctcg tttagtgaac cgtcagatcg   1140 
cctggagacg ccatccacgc tgttttgacc tccatagaag acaccgggac cgatccagcc   1200 
tccgcggccg ggaacggtgc attggaacgc ggattccccg tgccaagagt gagatctgcc   1260 
accatggcgc ccatcacggc ctactcccaa cagacgcggg gcctacttgg ttgcatcatc   1320 
actagcctta caggccggga caagaaccag gtcgagggag aggttcaggt ggtttccacc   1380 
gcaacacaat ccttcctggc gacctgcgtc aacggcgtgt gttggaccgt ttaccatggt   1440 
gctggctcaa agaccttagc cggcccaaag gggccaatca cccagatgta cactaatgtg   1500 
gaccaggacc tcgtcggctg gcaggcgccc cccggggcgc gttccttgac accatgcacc    1560 
tgtggcagct cagaccttta cttggtcacg agacatgctg acgtcattcc ggtgcgccgg    1620 
cggggcgaca gtagggggag cctgctctcc cccaggcctg tctcctactt gaagggctct    1680 
tcgggtggtc cactgctctg cccttcgggg cacgctgtgg gcatcttccg ggctgccgta    1740 
tgcacccggg gggttgcgaa ggcggtggac tttgtgcccg tagagtccat ggaaactact    1800 
atgcggtctc cggtcttcac ggacaactca tcccccccgg ccgtaccgca gtcatttcaa    1860 
gtggcccacc tacacgctcc cactggcagc ggcaagagta ctaaagtgcc ggctgcatat    1920 
gcagcccaag ggtacaaggt gctcgtcctc aatccgtccg ttgccgctac cttagggttt    1980 
ggggcgtata tgtctaaggc acacggtatt gaccccaaca tcagaactgg ggtaaggacc    2040 
attaccacag gcgcccccgt cacatactct acctatggca agtttcttgc cgatggtggt    2100 
tgctctgggg gcgcttatga catcataata tgtgatgagt gccattcaac tgactcgact    2160 
acaatcttgg gcatcggcac agtcctggac caagcggaga cggctggagc gcggcttgtc    2220 
gtgctcgcca ccgctacgcc tccgggatcg gtcaccgtgc cacacccaaa catcgaggag    2280 
gtggccctgt ctaatactgg agagatcccc ttctatggca aagccatccc cattgaagcc    2340 
atcagggggg gaaggcatct cattttctgt cattccaaga agaagtgcga cgagctcgcc    2400 
gcaaagctgt caggcctcgg aatcaacgct gtggcgtatt accgggggct cgatgtgtcc    2460 
gtcataccaa ctatcggaga cgtcgttgtc gtggcaacag acgctctgat gacgggctat    2520 
acgggcgact ttgactcagt gatcgactgt aacacatgtg tcacccagac agtcgacttc    2580 
agcttggatc ccaccttcac cattgagacg acgaccgtgc ctcaagacgc agtgtcgcgc    2640 
tcgcagcggc ggggtaggac tggcaggggt aggagaggca tctacaggtt tgtgactccg    2700 
ggagaacggc cctcgggcat gttcgattcc tcggtcctgt gtgagtgcta tgacgcgggc    2760 
tgtgcttggt acgagctcac ccccgccgag acctcggtta ggttgcgggc ctacctgaac    2820 
acaccagggt tgcccgtttg ccaggaccac ctggagttct gggagagtgt cttcacaggc    2880 
ctcacccaca tagatgcaca cttcttgtcc cagaccaagc aggcaggaga caacttcccc    2940 
tacctggtag cataccaagc cacggtgtgc gccagggctc aggccccacc tccatcatgg    3000 
gatcaaatgt ggaagtgtct catacggctg aaacctacgc tgcacgggcc aacacccttg    3060 
ctgtacaggc tgggagccgt ccaaaatgag gtcaccctca cccaccccat aaccaaatac    3120 
atcatggcat gcatgtcggc tgacctggag gtcgtcacta gcacctgggt gctggtgggc    3180 
ggagtccttg cagctctggc cgcgtattgc ctgacaacag gcagtgtggt cattgtgggt    3240 
aggattatct tgtccgggag gccggctatt gttcccgaca gggagtttct ctaccaggag    3300 
ttcgatgaaa tggaagagtg cgcctcgcac ctcccttaca tcgagcaggg aatgcagctc    3360 
gccgagcaat tcaagcagaa agcgctcggg ttactgcaaa cagccaccaa acaagcggag    3420 
gctgctgctc ccgtggtgga gtccaagtgg cgagcccttg agacattctg ggcgaagcac    3480 
atgtggaatt tcatcagcgg gatacagtac ttagcaggct tatccactct gcctgggaac    3540 
cccgcaatag catcattgat ggcattcaca gcctctatca ccagcccgct caccacccaa    3600 
agtaccctcc tgtttaacat cttggggggg tgggtggctg cccaactcgc cccccccagc    3660 
gccgcttcgg ctttcgtggg cgccggcatc gccggtgcgg ctgttggcag cataggcctt    3720 
gggaaggtgc ttgtggacat tctggcgggt tatggagcag gagtggccgg cgcgctcgtg    3780 
gccttcaagg tcatgagcgg cgagatgccc tccaccgagg acctggtcaa tctacttcct    3840 
gccatcctct ctcctggcgc cctggtcgtc ggggtcgtgt gtgcagcaat actgcgtcga    3900 
cacgtgggtc cgggagaggg ggctgtgcag tggatgaacc ggctgatagc gttcgcctcg    3960 
cggggtaatc atgtttcccc cacgcactat gtgcctgaga gcgacgccgc agcgcgtgtt    4020 
actcagatcc tctccagcct taccatcact cagctgctga aaaggctcca ccagtggatt    4080 
aatgaagact gctccacacc gtgttccggc tcgtggctaa gggatgtttg ggactggata    4140 
tgcacggtgt tgactgactt caagacctgg ctccagtcca agctcctgcc gcagctaccg    4200 
ggagtccctt ttttctcgtg ccaacgcggg tacaagggag tctggcgggg agacggcatc    4260 
atgcaaacca cctgcccatg tggagcacag atcaccggac atgtcaaaaa cggttccatg    4320 
aggatcgtcg ggcctaagac ctgcagcaac acgtggcatg gaacattccc catcaacgca    4380 
tacaccacgg gcccctgcac accctctcca gcgccaaact attctagggc gctgtggcgg    4440 
gtggccgctg aggagtacgt ggaggtcacg cgggtggggg atttccacta cgtgacgggc    4500 
atgaccactg acaacgtaaa gtgcccatgc caggttccgg ctcctgaatt cttcacggag    4560 
gtggacggag tgcggttgca caggtacgct ccggcgtgca ggcctctcct acgggaggag    4620 
gttacattcc aggtcgggct caaccaatac ctggttgggt cacagctacc atgcgagccc    4680 
gaaccggatg tagcagtgct cacttccatg ctcaccgacc cctcccacat cacagcagaa    4740 
acggctaagc gtaggttggc cagggggtct cccccctcct tggccagctc ttcagctagc    4800 
cagttgtctg cgccttcctt gaaggcgaca tgcactaccc accatgtctc tccggacgct    4860 
gacctcatcg aggccaacct cctgtggcgg caggagatgg gcgggaacat cacccgcgtg    4920 
gagtcggaga acaaggtggt agtcctggac tctttcgacc cgcttcgagc ggaggaggat    4980 
gagagggaag tatccgttcc ggcggagatc ctgcggaaat ccaagaagtt ccccgcagcg    5040 
atgcccatct gggcgcgccc ggattacaac cctccactgt tagagtcctg gaaggacccg    5100 
gactacgtcc ctccggtggt gcacgggtgc ccgttgccac ctatcaaggc ccctccaata    5160 
ccacctccac ggagaaagag gacggttgtc ctaacagagt cctccgtgtc ttctgcctta    5220 
gcggagctcg ctactaagac cttcggcagc tccgaatcat cggccgtcga cagcggcacg    5280 
gcgaccgccc ttcctgacca ggcctccgac gacggtgaca aaggatccga cgttgagtcg    5340 
tactcctcca tgccccccct tgagggggaa ccgggggacc ccgatctcag tgacgggtct    5400 
tggtctaccg tgagcgagga agctagtgag gatgtcgtct gctgctcaat gtcctacaca    5460 
tggacaggcg ccttgatcac gccatgcgct gcggaggaaa gcaagctgcc catcaacgcg    5520 
ttgagcaact ctttgctgcg ccaccataac atggtttatg ccacaacatc tcgcagcgca    5580 
ggcctgcggc agaagaaggt cacctttgac agactgcaag tcctggacga ccactaccgg    5640 
gacgtgctca aggagatgaa ggcgaaggcg tccacagtta aggctaaact cctatccgta    5700 
gaggaagcct gcaagctgac gcccccacat tcggccaaat ccaagtttgg ctatggggca    5760 
aaggacgtcc ggaacctatc cagcaaggcc gttaaccaca tccactccgt gtggaaggac    5820 
ttgctggaag acactgtgac accaattgac accaccatca tggcaaaaaa tgaggttttc    5880 
tgtgtccaac cagagaaagg aggccgtaag ccagcccgcc ttatcgtatt cccagatctg    5940 
ggagtccgtg tatgcgagaa gatggccctc tatgatgtgg tctccaccct tcctcaggtc    6000 
gtgatgggct cctcatacgg attccagtac tctcctgggc agcgagtcga gttcctggtg    6060 
aatacctgga aatcaaagaa aaaccccatg ggcttttcat atgacactcg ctgtttcgac    6120 
tcaacggtca ccgagaacga catccgtgtt gaggagtcaa tttaccaatg ttgtgacttg    6180 
gcccccgaag ccagacaggc cataaaatcg ctcacagagc ggctttatat cgggggtcct    6240 
ctgactaatt caaaagggca gaactgcggt tatcgccggt gccgcgcgag cggcgtgctg    6300 
acgactagct gcggtaacac cctcacatgt tacttgaagg cctctgcagc ctgtcgagct    6360 
gcgaagctcc aggactgcac gatgctcgtg aacgccgccg gccttgtcgt tatctgtgaa    6420 
agcgcgggaa cccaagagga cgcggcgagc ctacgagtct tcacggaggc tatgactagg    6480 
tactctgccc cccccgggga cccgccccaa ccagaatacg acttggagct gataacatca    6540 
tgttcctcca atgtgtcggt cgcccacgat gcatcaggca aaagggtgta ctacctcacc    6600 
cgtgatccca ccacccccct cgcacgggct gcgtgggaaa cagctagaca cactccagtt    6660 
aactcctggc taggcaacat tatcatgtat gcgcccactt tgtgggcaag gatgattctg    6720 
atgactcact tcttctccat ccttctagca caggagcaac ttgaaaaagc cctggactgc    6780 
cagatctacg gggcctgtta ctccattgag ccacttgacc tacctcagat cattgaacga    6840 
ctccatggcc ttagcgcatt ttcactccat agttactctc caggtgagat caatagggtg    6900 
gcttcatgcc tcaggaaact tggggtacca cccttgcgag tctggagaca tcgggccagg    6960 
agcgtccgcg ctaggctact gtcccagggg gggagggccg ccacttgtgg caagtacctc    7020 
ttcaactggg cagtgaagac caaactcaaa ctcactccaa tcccggctgc gtcccagctg    7080 
gacttgtccg gctggttcgt tgctggttac agcgggggag acatatatca cagcctgtct    7140 
cgtgcccgac cccgctggtt catgctgtgc ctactcctac tttctgtagg ggtaggcatc    7200 
tacctgctcc ccaaccggta aatctagagc tgtgccttct agttgccagc catctgttgt    7260 
ttgcccctcc cccgtgcctt ccttgaccct ggaaggtgcc actcccactg tcctttccta    7320 
ataaaatgag gaaattgcat cgcattgtct gagtaggtgt cattctattc tggggggtgg    7380 
ggtggggcag gacagcaagg gggaggattg ggaagacaat agcaggcatg ctggggatgc    7440 
ggtgggctct atggccgatc ggcgcgccgt actgaaatgt gtgggcgtgg cttaagggtg    7500 
ggaaagaata tataaggtgg gggtcttatg tagttttgta tctgttttgc agcagccgcc    7560 
gccgccatga gcaccaactc gtttgatgga agcattgtga gctcatattt gacaacgcgc    7620 
atgcccccat gggccggggt gcgtcagaat gtgatgggct ccagcattga tggtcgcccc    7680 
gtcctgcccg caaactctac taccttgacc tacgagaccg tgtctggaac gccgttggag    7740 
actgcagcct ccgccgccgc ttcagccgct gcagccaccg cccgcgggat tgtgactgac    7800 
tttgctttcc tgagcccgct tgcaagcagt gcagcttccc gttcatccgc ccgcgatgac    7860 
aagttgacgg ctcttttggc acaattggat tctttgaccc gggaacttaa tgtcgtttct    7920 
cagcagctgt tggatctgcg ccagcaggtt tctgccctga aggcttcctc ccctcccaat    7980 
gcggtttaaa acataaataa aaaaccagac tctgtttgga tttggatcaa gcaagtgtct    8040 
tgctgtcttt atttaggggt tttgcgcgcg cggtaggccc gggaccagcg gtctcggtcg    8100 
ttgagggtcc tgtgtatttt ttccaggacg tggtaaaggt gactctggat gttcagatac    8160 
atgggcataa gcccgtctct ggggtggagg tagcaccact gcagagcttc atgctgcggg    8220 
gtggtgttgt agatgatcca gtcgtagcag gagcgctggg cgtggtgcct aaaaatgtct    8280 
ttcagtagca agctgattgc caggggcagg cccttggtgt aagtgtttac aaagcggtta    8340 
agctgggatg ggtgcatacg tggggatatg agatgcatct tggactgtat ttttaggttg    8400 
gctatgttcc cagccatatc cctccgggga ttcatgttgt gcagaaccac cagcacagtg    8460 
tatccggtgc acttgggaaa tttgtcatgt agcttagaag gaaatgcgtg gaagaacttg    8520 
gagacgccct tgtgacctcc aagattttcc atgcattcgt ccataatgat ggcaatgggc    8580 
ccacgggcgg cggcctgggc gaagatattt ctgggatcac taacgtcata gttgtgttcc    8640 
aggatgagat cgtcataggc catttttaca aagcgcgggc ggagggtgcc agactgcggt    8700 
ataatggttc catccggccc aggggcgtag ttaccctcac agatttgcat ttcccacgct    8760 
ttgagttcag atggggggat catgtctacc tgcggggcga tgaagaaaac ggtttccggg    8820 
gtaggggaga tcagctggga agaaagcagg ttcctgagca gctgcgactt accgcagccg    8880 
gtgggcccgt aaatcacacc tattaccggc tgcaactggt agttaagaga gctgcagctg    8940 
ccgtcatccc tgagcagggg ggccacttcg ttaagcatgt ccctgactcg catgttttcc    9000 
ctgaccaaat ccgccagaag gcgctcgccg cccagcgata gcagttcttg caaggaagca    9060 
aagtttttca acggtttgag accgtccgcc gtaggcatgc ttttgagcgt ttgaccaagc    9120 
agttccaggc ggtcccacag ctcggtcacc tgctctacgg catctcgatc cagcatatct    9180 
cctcgtttcg cgggttgggg cggctttcgc tgtacggcag tagtcggtgc tcgtccagac    9240 
gggccagggt catgtctttc cacgggcgca gggtcctcgt cagcgtagtc tgggtcacgg    9300 
tgaaggggtg cgctccgggc tgcgcgctgg ccagggtgcg cttgaggctg gtcctgctgg    9360 
tgctgaagcg ctgccggtct tcgccctgcg cgtcggccag gtagcatttg accatggtgt    9420 
catagtccag cccctccgcg gcgtggccct tggcgcgcag cttgcccttg gaggaggcgc    9480 
cgcacgaggg gcagtgcaga cttttgaggg cgtagagctt gggcgcgaga aataccgatt    9540 
ccggggagta ggcatccgcg ccgcaggccc cgcagacggt ctcgcattcc acgagccagg    9600 
tgagctctgg ccgttcgggg tcaaaaacca ggtttccccc atgctttttg atgcgtttct    9660 
tacctctggt ttccatgagc cggtgtccac gctcggtgac gaaaaggctg tccgtgtccc    9720 
cgtatacaga cttgagaggc ctgtcctcga gcggtgttcc gcggtcctcc tcgtatagaa    9780 
actcggacca ctctgagacg aaggctcgcg tccaggccag cacgaaggag gctaagtggg    9840 
aggggtagcg gtcgttgtcc actagggggt ccactcgctc cagggtgtga agacacatgt    9900 
cgccctcttc ggcatcaagg aaggtgattg gtttataggt gtaggccacg tgaccgggtg     9960 
ttcctgaagg ggggctataa aagggggtgg gggcgcgttc gtcctcactc tcttccgcat    10020 
cgctgtctgc gagggccagc tgttggggtg agtactccct ctcaaaagcg ggcatgactt    10080 
ctgcgctaag attgtcagtt tccaaaaacg aggaggattt gatattcacc tggcccgcgg    10140 
tgatgccttt gagggtggcc gcgtccatct ggtcagaaaa gacaatcttt ttgttgtcaa    10200 
gcttggtggc aaacgacccg tagagggcgt tggacagcaa cttggcgatg gagcgcaggg    10260 
tttggttttt gtcgcgatcg gcgcgctcct tggccgcgat gtttagctgc acgtattcgc    10320 
gcgcaacgca ccgccattcg ggaaagacgg tggtgcgctc gtcgggcact aggtgcacgc    10380 
gccaaccgcg gttgtgcagg gtgacaaggt caacgctggt ggctacctct ccgcgtaggc    10440 
gctcgttggt ccagcagagg cggccgccct tgcgcgagca gaatggcggt agtgggtcta    10500 
gctgcgtctc gtccgggggg tctgcgtcca cggtaaagac cccgggcagc aggcgcgcgt    10560 
cgaagtagtc tatcttgcat ccttgcaagt ctagcgcctg ctgccatgcg cgggcggcaa    10620 
gcgcgcgctc gtatgggttg agtgggggac cccatggcat ggggtgggtg agcgcggagg    10680 
cgtacatgcc gcaaatgtcg taaacgtaga ggggctctct gagtattcca agatatgtag    10740 
ggtagcatct tccaccgcgg atgctggcgc gcacgtaatc gtatagttcg tgcgagggag    10800 
cgaggaggtc gggaccgagg ttgctacggg cgggctgctc tgctcggaag actatctgcc    10860 
tgaagatggc atgtgagttg gatgatatgg ttggacgctg gaagacgttg aagctggcgt    10920 
ctgtgagacc taccgcgtca cgcacgaagg aggcgtagga gtcgcgcagc ttgttgacca    10980 
gctcggcggt gacctgcacg tctagggcgc agtagtccag ggtttccttg atgatgtcat    11040 
acttatcctg tccctttttt ttccacagct cgcggttgag gacaaactct tcgcggtctt    11100 
tccagtactc ttggatcgga aacccgtcgg cctccgaacg gtaagagcct agcatgtaga    11160 
actggttgac ggcctggtag gcgcagcatc ccttttctac gggtagcgcg tatgcctgcg    11220 
cggccttccg gagcgaggtg tgggtgagcg caaaggtgtc cctaaccatg actttgaggt    11280 
actggtattt gaagtcagtg tcgtcgcatc cgccctgctc ccagagcaaa aagtccgtgc    11340 
gctttttgga acgcgggttt ggcagggcga aggtgacatc gttgaagagt atctttcccg    11400 
cgcgaggcat aaagttgcgt gtgatgcgga agggtcccgg cacctcggaa cggttgttaa    11460 
ttacctgggc ggcgagcacg atctcgtcaa agccgttgat gttgtggccc acaatgtaaa    11520 
gttccaagaa gcgcgggatg cccttgatgg aaggcaattt tttaagttcc tcgtaggtga    11580 
gctcttcagg ggagctgagc ccgtgctctg aaagggccca gtctgcaaga tgagggttgg    11640 
aagcgacgaa tgagctccac aggtcacggg ccattagcat ttgcaggtgg tcgcgaaagg    11700 
tcctaaactg gcgacctatg gccatttttt ctggggtgat gcagtagaag gtaagcgggt    11760 
cttgttccca gcggtcccat ccaaggtccg cggctaggtc tcgcgcggcg gtcactagag    11820 
gctcatctcc gccgaacttc atgaccagca tgaagggcac gagctgcttc ccaaaggccc    11880 
ccatccaagt ataggtctct acatcgtagg tgacaaagag acgctcggtg cgaggatgcg    11940 
agccgatcgg gaagaactgg atctcccgcc accagttgga ggagtggctg ttgatgtggt    12000 
gaaagtagaa gtccctgcga cgggccgaac actcgtgctg gcttttgtaa aaacgtgcgc    12060 
agtactggca gcggtgcacg ggctgtacat cctgcacgag gttgacctga cgaccgcgca    12120 
caaggaagca gagtgggaat ttgagcccct cgcctggcgg gtttggctgg tggtcttcta    12180 
cttcggctgc ttgtccttga ccgtctggct gctcgagggg agttacggtg gatcggacca    12240 
ccacgccgcg cgagcccaaa gtccagatgt ccgcgcgcgg cggtcggagc ttgatgacaa    12300 
catcgcgcag atgggagctg tccatggtct ggagctcccg cggcgtcagg tcaggcggga    12360 
gctcctgcag gtttacctcg catagccggg tcagggcgcg ggctaggtcc aggtgatacc    12420 
tgatttccag gggctggttg gtggcggcgt cgatggcttg caagaggccg catccccgcg    12480 
gcgcgactac ggtaccgcgc ggcgggcggt gggccgcggg ggtgtccttg gatgatgcat    12540 
ctaaaagcgg tgacgcgggc gggcccccgg aggtaggggg ggctcgggac ccgccgggag    12600 
agggggcagg ggcacgtcgg cgccgcgcgc gggcaggagc tggtgctgcg cgcggaggtt    12660 
gctggcgaac gcgacgacgc ggcggttgat ctcctgaatc tggcgcctct gcgtgaagac    12720 
gacgggcccg gtgagcttga acctgaaaga gagttcgaca gaatcaattt cggtgtcgtt    12780 
gacggcggcc tggcgcaaaa tctcctgcac gtctcctgag ttgtcttgat aggcgatctc    12840 
ggccatgaac tgctcgatct cttcctcctg gagatctccg cgtccggctc gctccacggt    12900 
ggcggcgagg tcgttggaga tgcgggccat gagctgcgag aaggcgttga ggcctccctc    12960 
gttccagacg cggctgtaga ccacgccccc ttcggcatcg cgggcgcgca tgaccacctg    13020 
cgcgagattg agctccacgt gccgggcgaa gacggcgtag tttcgcaggc gctgaaagag    13080 
gtagttgagg gtggtggcgg tgtgttctgc cacgaagaag tacataaccc agcgccgcaa    13140 
cgtggattcg ttgatatccc ccaaggcctc aaggcgctcc atggcctcgt agaagtccac    13200 
ggcgaagttg aaaaactggg agttgcgcgc cgacacggtt aactcctcct ccagaagacg    13260 
gatgagctcg gcgacagtgt cgcgcacctc gcgctcaaag gctacagggg cctcttcttc    13320 
ttcttcaatc tcctcttcca taagggcctc cccttcttct tcttctggcg gcggtggggg    13380 
aggggggaca cggcggcgac gacggcgcac cgggaggcgg tcgacaaagc gctcgatcat    13440 
ctccccgcgg cgacggcgca tggtctcggt gacggcgcgg ccgttctcgc gggggcgcag    13500 
ttggaagacg ccgcccgtca tgtcccggtt atgggttggc ggggggctgc cgtgcggcag    13560 
ggatacggcg ctaacgatgc atctcaacaa ttgttgtgta ggtactccgc caccgaggga    13620 
cctgagcgag tccgcatcga ccggatcgga aaacctctcg agaaaggcgt ctaaccagtc    13680 
acagtcgcaa ggtaggctga gcaccgtggc gggcggcagc gggcggcggt cggggttgtt    13740 
tctggcggag gtgctgctga tgatgtaatt aaagtaggcg gtcttgagac ggcggatggt    13800 
cgacagaagc accatgtcct tgggtccggc ctgctgaatg cgcaggcggt cggccatgcc    13860 
ccaggcttcg ttttgacatc ggcgcaggtc tttgtagtag tcttgcatga gcctttctac    13920 
cggcacttct tcttctcctt cctcttgtcc tgcatctctt gcatctatcg ctgcggcggc    13980 
ggcggagttt ggccgtaggt ggcgccctct tcctcccatg cgtgtgaccc cgaagcccct    14040 
catcggctga agcagggcca ggtcggcgac aacgcgctcg gctaatatgg cctgctgcac    14100 
ctgcgtgagg gtagactgga agtcgtccat gtccacaaag cggtggtatg cgcccgtgtt    14160 
gatggtgtaa gtgcagttgg ccataacgga ccagttaacg gtctggtgac ccggctgcga    14220 
gagctcggtg tacctgagac gcgagtaagc ccttgagtca aagacgtagt cgttgcaagt    14280 
ccgcaccagg tactggtatc ccaccaaaaa gtgcggcggc ggctggcggt agaggggcca    14340 
gcgtagggtg gccggggctc cgggggcgag gtcttccaac ataaggcgat gatatccgta    14400 
gatgtacctg gacatccagg tgatgccggc ggcggtggtg gaggcgcgcg gaaagtcacg    14460 
gacgcggttc cagatgttgc gcagcggcaa aaagtgctcc atggtcggga cgctctggcc    14520 
ggtcaggcgc gcgcagtcgt tgacgctcta gaccgtgcaa aaggagagcc tgtaagcggg    14580 
cactcttccg tggtctggtg gataaattcg caagggtatc atggcggacg accggggttc    14640 
gaaccccgga tccggccgtc cgccgtgatc catgcggtta ccgcccgcgt gtcgaaccca    14700 
ggtgtgcgac gtcagacaac gggggagcgc tccttttggc ttccttccag gcgcggcgga    14760 
tgctgcgcta gcttttttgg ccactggccg cgcgcggcgt aagcggttag gctggaaagc    14820 
gaaagcatta agtggctcgc tccctgtagc cggagggtta ttttccaagg gttgagtcgc    14880 
gggacccccg gttcgagtct cgggccggcc ggactgcggc gaacgggggt ttgcctcccc    14940 
gtcatgcaag accccgcttg caaattcctc cggaaacagg gacgagcccc ttttttgctt    15000 
ttcccagatg catccggtgc tgcggcagat gcgcccccct cctcagcagc ggcaagagca    15060 
agagcagcgg cagacatgca gggcaccctc cccttctcct accgcgtcag gaggggcaac    15120 
atccgcggct gacgcggcgg cagatggtga ttacgaaccc ccgcggcgcc ggacccggca    15180 
ctacttggac ttggaggagg gcgagggcct ggcgcggcta ggagcgccct ctcctgagcg    15240 
acacccaagg gtgcagctga agcgtgacac gcgcgaggcg tacgtgccgc ggcagaacct    15300 
gtttcgcgac cgcgagggag aggagcccga ggagatgcgg gatcgaaagt tccatgcagg    15360 
gcgcgagttg cggcatggcc tgaaccgcga gcggttgctg cgcgaggagg actttgagcc    15420 
cgacgcgcgg accgggatta gtcccgcgcg cgcacacgtg gcggccgccg acctggtaac    15480 
cgcgtacgag cagacggtga accaggagat taactttcaa aaaagcttta acaaccacgt    15540 
gcgcacgctt gtggcgcgcg aggaggtggc tataggactg atgcatctgt gggactttgt    15600 
aagcgcgctg gagcaaaacc caaatagcaa gccgctcatg gcgcagctgt tccttatagt    15660 
gcagcacagc agggacaacg aggcattcag ggatgcgctg ctaaacatag tagagcccga    15720 
gggccgctgg ctgctcgatt tgataaacat tctgcagagc atagtggtgc aggagcgcag    15780 
cttgagcctg gctgacaagg tggccgccat taactattcc atgctcagtc tgggcaagtt    15840 
ttacgcccgc aagatatacc atacccctta cgttcccata gacaaggagg taaagatcga    15900 
ggggttctac atgcgcatgg cgctgaaggt gcttaccttg agcgacgacc tgggcgttta    15960 
tcgcaacgag cgcatccaca aggccgtgag cgtgagccgg cggcgcgagc tcagcgaccg    16020 
cgagctgatg cacagcctgc aaagggccct ggctggcacg ggcagcggcg atagagaggc    16080 
cgagtcctac tttgacgcgg gcgctgacct gcgctgggcc ccaagccgac gcgccctgga    16140 
ggcagctggg gccggacctg ggctggcggt ggcacccgcg cgcgctggca acgtcggcgg    16200 
cgtggaggaa tatgacgagg acgatgagta cgagccagag gacggcgagt actaagcggt    16260 
gatgtttctg atcagatgat gcaagacgca acggacccgg cggtgcgggc ggcgctgcag    16320 
agccagccgt ccggccttaa ctccacggac gactggcgcc aggtcatgga ccgcatcatg    16380 
tcgctgactg cgcgcaaccc tgacgcgttc cggcagcagc cgcaggccaa ccggctctcc    16440 
gcaattctgg aagcggtggt cccggcgcgc gcaaacccca cgcacgagaa ggtgctggcg    16500 
atcgtaaacg cgctggccga aaacagggcc atccggcccg atgaggccgg cctggtctac    16560 
gacgcgctgc ttcagcgcgt ggctcgttac aacagcagca acgtgcagac caacctggac    16620 
cggctggtgg gggatgtgcg cgaggccgtg gcgcagcgtg agcgcgcgca gcagcagggc    16680 
aacctgggct ccatggttgc actaaacgcc ttcctgagta cacagcccgc caacgtgccg    16740 
cggggacagg aggactacac caactttgtg agcgcactgc ggctaatggt gactgagaca    16800 
ccgcaaagtg aggtgtatca gtccgggcca gactattttt tccagaccag tagacaaggc    16860 
ctgcagaccg taaacctgag ccaggctttc aagaacttgc aggggctgtg gggggtgcgg    16920 
gctcccacag gcgaccgcgc gaccgtgtct agcttgctga cgcccaactc gcgcctgttg    16980 
ctgctgctaa tagcgccctt cacggacagt ggcagcgtgt cccgggacac atacctaggt    17040 
cacttgctga cactgtaccg cgaggccata ggtcaggcgc atgtggacga gcatactttc    17100 
caggagatta caagtgttag ccgcgcgctg gggcaggagg acacgggcag cctggaggca    17160 
accctgaact acctgctgac caaccggcgg caaaaaatcc cctcgttgca cagtttaaac    17220 
agcgaggagg agcgcatttt gcgctatgtg cagcagagcg tgagccttaa cctgatgcgc    17280 
gacggggtaa cgcccagcgt ggcgctggac atgaccgcgc gcaacatgga accgggcatg    17340 
tatgcctcaa accggccgtt tatcaatcgc ctaatggact acttgcatcg cgcggccgcc    17400 
gtgaaccccg agtatttcac caatgccatc ttgaacccgc actggctacc gccccctggt    17460 
ttctacaccg ggggattcga ggtgcccgag ggtaacgatg gattcctctg ggacgacata    17520 
gacgacagcg tgttttcccc gcaaccgcag accctgctag agttgcaaca acgcgagcag    17580 
gcagaggcgg cgctgcgaaa ggaaagcttc cgcaggccaa gcagcttgtc cgatctaggc    17640 
gctgcggccc cgcggtcaga tgctagtagc ccatttccaa gcttgatagg gtctcttacc    17700 
agcactcgca ccacccgccc gcgcctgctg ggcgaggagg agtacctaaa caactcgctg    17760 
ctgcagccgc agcgcgaaaa gaacctgcct ccggcgtttc ccaacaacgg gatagagagc    17820 
ctagtggaca agatgagtag atggaagacg tatgcgcagg agcacaggga tgtgcccggc    17880 
ccgcgcccgc ccacccgtcg tcaaaggcac gaccgtcagc ggggtctggt gtgggaggac    17940 
gatgactcgg cagacgacag cagcgtcttg gatttgggag ggagtggcaa cccgtttgca    18000 
caccttcgcc ccaggctggg gagaatgttt taaaaaaaag catgatgcaa aataaaaaac    18060 
tcaccaaggc catggcaccg agcgttggtt ttcttgtatt ccccttagta tgcggcgcgc    18120 
ggcgatgtat gaggaaggtc ctcctccctc ctacgagagc gtggtgagcg cggcgccagt    18180 
ggcggcggcg ctgggttcac ccttcgatgc tcccctggac ccgccgttcg tgcctccgcg    18240 
gtacctgcgg cctaccgggg ggagaaacag catccgttac tctgagttgg cacccctatt    18300 
cgacaccacc cgtgtgtacc ttgtggacaa caagtcaacg gatgtggcat ccctgaacta    18360 
ccagaacgac cacagcaact ttctaaccac ggtcattcaa aacaatgact acagcccggg    18420 
ggaggcaagc acacagacca tcaatcttga cgaccggtcg cactggggcg gcgacctgaa    18480 
aaccatcctg cataccaaca tgccaaatgt gaacgagttc atgtttacca ataagtttaa    18540 
ggcgcgggtg atggtgtcgc gctcgcttac taaggacaaa caggtggagc tgaaatacga    18600 
gtgggtggag ttcacgctgc ccgagggcaa ctactccgag accatgacca tagaccttat    18660 
gaacaacgcg atcgtggagc actacttgaa agtgggcagg cagaacgggg ttctggaaag    18720 
cgacatcggg gtaaagtttg acacccgcaa cttcagactg gggtttgacc cagtcactgg    18780 
tcttgtcatg cctggggtat atacaaacga agccttccat ccagacatca ttttgctgcc    18840 
aggatgcggg gtggacttca cccacagccg cctgagcaac ttgttgggca tccgcaagcg    18900 
gcaacccttc caggagggct ttaggatcac ctacgatgac ctggagggtg gtaacattcc    18960 
cgcactgttg gatgtggacg cctaccaggc aagcttgaaa gatgacaccg aacagggcgg    19020 
gggtggcgca ggcggcggca acaacagtgg cagcggcgcg gaagagaact ccaacgcggc    19080 
agctgcggca atgcagccgg tggaggacat gaacgatcat gccattcgcg gcgacacctt    19140 
tgccacacgg gcggaggaga agcgcgctga ggccgaggca gcggccgaag ctgccgcccc    19200 
cgctgcggag gctgcacaac ccgaggtcga gaagcctcag aagaaaccgg tgattaaacc    19260 
cctgacagag gacagcaaga aacgcagtta caacctaata agcaatgaca gcaccttcac    19320 
ccagtaccgc agctggtacc ttgcatacaa ctacggcgac cctcaggccg ggatccgctc    19380 
atggaccctg ctttgcactc ctgacgtaac ctgcggctcg gagcaggtat actggtcgtt    19440 
gcccgacatg atgcaagacc ccgtgacctt ccgctccacg cgccagatca gcaactttcc    19500 
ggtggtgggc gccgagctgt tgcccgtgca ctccaagagc ttctacaacg accaggccgt    19560 
ctactcccag ctcatccgcc agtttacctc tctgacccac gtgttcaatc gctttcccga    19620 
gaaccagatt ttggcgcgcc cgccagcccc caccatcacc accgtcagtg aaaacgttcc    19680 
tgctctcaca gatcacggga cgctaccgct gcgcaacagc atcggaggag tccagcgagt    19740 
gaccattact gacgccagac gccgcacctg cccctacgtt tacaaggccc tgggcatagt    19800 
ctcgccgcgc gtcctatcga gccgcacttt ttgagcaagc atgtccatcc ttatatcgcc    19860 
cagcaataac acaggctggg gcctgcgctt cccaagcaag atgtttggcg gggccaagaa    19920 
gcgctccgac caacacccag tgcgcgtgcg cgggcactac cgcgcgccct ggggcgcgca    19980 
caaacgcggc cgcactgggc gcaccaccgt cgatgacgcc atcgacgcgg tggtggagga    20040 
ggcgcgcaac tacacgccca cgccgccgcc agtgtccacc gtggacgcgg ccattcagac    20100 
cgtggtgcgc ggagcccggc gctacgctaa aatgaagaga cggcggaggc gcgtagcacg    20160 
tcgccaccgc cgccgacccg gcactgccgc ccaacgcgcg gcggcggccc tgcttaaccg    20220 
cgcacgtcgc accggccgac gggcggccat gcgagccgct cgaaggctgg ccgcgggtat    20280 
tgtcactgtg ccccccaggt ccaggcgacg agcggccgcc gcagcagccg cggccattag    20340 
tgctatgact cagggtcgca ggggcaacgt gtactgggtg cgcgactcgg ttagcggcct    20400 
gcgcgtgccc gtgcgcaccc gccccccgcg caactagatt gcaataaaaa actacttaga    20460 
ctcgtactgt tgtatgtatc cagcggcggc ggcgcgcatc gaagctatgt ccaagcgcaa    20520 
aatcaaagaa gagatgctcc aggtcatcgc gccggagatc tatggccccc cgaagaagga    20580 
agagcaggat tacaagcccc gaaagctaaa gcgggtcaaa aagaaaaaga aagatgatga    20640 
tgatgatgaa cttgacgacg aggtggaact gttgcacgcg accgcgccca ggcgacgggt    20700 
acagtggaaa ggtcgacgcg taagacgtgt tttgcgaccc ggcaccaccg tagtctttac    20760 
gcccggtgag cgctccaccc gcacctacaa gcgcgtgtat gatgaggtgt acggcgacga    20820 
ggacctgctt gagcaggcca acgagcgcct cggggagttt gcctacggaa agcggcataa    20880 
ggacatgctg gcgttgccgc tggacgaggg caacccaaca cctagcctaa agcccgtgac    20940 
actgcagcag gtgctgcccg cgcttgcacc gtccgaagaa aagcgcggcc taaagcgcga    21000 
gtctggtgac ttggcaccca ccgtgcagct gatggtaccc aagcgtcagc gactggaaga    21060 
tgtcttggaa aaaatgaccg tggagcctgg gctggagccc gaggtccgcg tgcggccaat    21120 
caagcaggtg gcaccgggac tgggcgtgca gaccgtggac gttcagatac ccaccaccag    21180 
tagcactagt attgccactg ccacagaggg catggagaca caaacgtccc cggttgcctc    21240 
ggcggtggca gatgccgcgg tgcaggcggc cgctgcggcc gcgtccaaga cctctacgga    21300 
ggtgcaaacg gacccgtgga tgtttcgtgt ttcagccccc cggcgtccgc gccgttcaag    21360 
gaagtacggc gccgccagcg cgctactgcc cgaatatgcc ctacatcctt ccatcgcgcc    21420 
tacccccggc tatcgtggct acacctaccg ccccagaaga cgagcaacta cccgacgccg    21480 
aaccaccact ggaacccgcc gccgccgtcg ccgtcgccag cccgtgctgg ccccgatttc    21540 
cgtgcgcagg gtggctcgcg aaggaggcag gaccctggtg ctgccaacag cgcgctacca    21600 
ccccagcatc gtttaaaagc cggtctttgt ggttcttgca gatatggccc tcacctgccg    21660 
cctccgtttc ccggtgccgg gattccgagg aagaatgcac cgtaggaggg gcatggccgg    21720 
ccacggcctg acgggcggca tgcgtcgtgc gcaccaccgg cggcggcgcg cgtcgcaccg    21780 
tcgcatgcgc ggcggtatcc tgcccctcct tattccactg atcgccgcgg cgattggcgc    21840 
cgtgcccgga attgcatccg tggccttgca ggcgcagaga cactgattaa aaacaagtta    21900 
catgtggaaa aatcaaaata aaagtctgga ctctcacgct cgcttggtcc tgtaactatt    21960 
ttgtagaatg gaagacatca actttgcgtc actggccccg cgacacggct cgcgcccgtt    22020 
catgggaaac tggcaagata tcggcaccag caatatgagc ggtggcgcct tcagctgggg    22080 
ctcgctgtgg agcggcatta aaaatttcgg ttccgccgtt aagaactatg gcagcaaagc    22140 
ctggaacagc agcacaggcc agatgctgag ggacaagttg aaagagcaaa atttccaaca    22200 
aaaggtggta gatggcctgg cctctggcat tagcggggtg gtggacctgg ccaaccaggc    22260 
agtgcaaaat aagattaaca gtaagcttga tccccgccct cccgtagagg agcctccacc    22320 
ggccgtggag acagtgtctc cagaggggcg tggcgaaaag cgtccgcgac ccgacaggga    22380 
agaaactctg gtgacgcaaa tagacgagcc tccctcgtac gaggaggcac taaagcaagg    22440 
cctgcccacc acccgtccca tcgcgcccat ggctaccgga gtgctgggcc agcacacacc    22500 
cgtaacgctg gacctgcctc cccccgccga cacccagcag aaacctgtgc tgccaggccc    22560 
gtccgccgtt gttgtaaccc gtcctagccg cgcgtccctg cgccgcgccg ccagcggtcc    22620 
gcgatcgttg cggcccgtag ccagtggcaa ctggcaaagc acactgaaca gcatcgtggg    22680 
tttgggggtg caatccctga agcgccgacg atgcttctga tagctaacgt gtcgtatgtg    22740 
tgtcatgtat gcgtccatgt cgccgccaga ggagctgctg agccgccgcg cgcccgcttt    22800 
ccaagatggc taccccttcg atgatgccgc agtggtctta catgcacatc tcgggccagg    22860 
acgcctcgga gtacctgagc cccgggctgg tgcagttcgc ccgcgccacc gagacgtact    22920 
tcagcctgaa taacaagttt agaaacccca cggtggcgcc tacgcacgac gtgaccacag    22980 
accggtctca gcgtttgacg ctgcggttca tccccgtgga ccgcgaggat actgcgtact    23040 
cgtacaaggc gcggttcacc ctagctgtgg gtgataaccg tgtgctagac atggcttcca    23100 
cgtactttga catccgcggc gtgctggaca ggggccctac ttttaagccc tactctggca    23160 
ctgcctacaa cgcactggcc cccaagggtg cccccaactc gtgcgagtgg gaacaaaatg    23220 
aaactgcaca agtggatgct caagaacttg acgaagagga gaatgaagcc aatgaagctc    23280 
aggcgcgaga acaggaacaa gctaagaaaa cccatgtata tgcccaggct ccactgtccg    23340 
gaataaaaat aactaaagaa ggtctacaaa taggaactgc cgacgccaca gtagcaggtg    23400 
ccggcaaaga aattttcgca gacaaaactt ttcaacctga accacaagta ggagaatctc    23460 
aatggaacga agcggatgcc acagcagctg gtggaagggt tcttaaaaag acaactccca    23520 
tgaaaccctg ctatggctca tacgctagac ccaccaattc caacggcgga cagggcgtta    23580 
tggttgaaca aaatggtaaa ttggaaagtc aagtcgaaat gcaatttttt tccacatcca    23640 
caaatgccac aaatgaagtt aacaatatac aaccaacagt tgtattgtac agcgaagatg    23700 
taaacatgga aactccagat actcatcttt cttataaacc taaaatgggg gataaaaatg    23760 
ccaaagtcat gcttggacaa caagcaatgc caaacagacc aaattacatt gcttttagag    23820 
acaattttat tggtctcatg tattacaaca gcacaggtaa catgggtgtc cttgctggtc    23880 
aggcatcgca gttgaacgct gttgtagatt tgcaagacag aaacacagag ctgtcctacc    23940 
agcttttgct tgattcaatt ggcgacagaa caagatactt ttcaatgtgg aatcaagctg    24000 
ttgacagcta tgatccagat gtcagaatta ttgagaacca tggaactgag gatgagttgc    24060 
caaattattg ctttcctctt ggtggaattg ggattactga cacttttcaa gctgttaaaa    24120 
caactgctgc taacggggac caaggcaata ctacctggca aaaagattca acatttgcag    24180 
aacgcaatga aataggggtg ggaaataact ttgccatgga aattaacctg aatgccaacc    24240 
tatggagaaa tttcctttac tccaatattg cgctgtacct gccagacaag ctaaaataca    24300 
accccaccaa tgtggaaata tctgacaacc ccaacaccta cgactacatg aacaagcgag    24360 
tggtggctcc tgggcttgta gactgctaca ttaaccttgg ggcgcgctgg tctctggact    24420 
acatggacaa cgttaatccc tttaaccacc accgcaatgc gggcctgcgt taccgctcca    24480 
tgttgttggg aaacggccgc tacgtgccct ttcacattca ggtgccccaa aagttttttg    24540 
ccattaaaaa cctcctcctc ctgccaggct catacacata tgaatggaac ttcaggaagg    24600 
atgttaacat ggttctgcag agctctctgg gaaacgacct tagagttgac ggggctagca    24660 
ttaagtttga cagcatttgt ctttacgcca ccttcttccc catggcccac aacacggcct    24720 
ccacgctgga agccatgctc agaaatgaca ccaacgacca gtcctttaat gactaccttt    24780 
ccgccgccaa catgctatat cccatacccg ccaacgccac caacgtgccc atctccatcc    24840 
catcgcgcaa ctgggcagca tttcgcggtt gggccttcac acgcttgaag acaaaggaaa    24900 
ccccttccct gggatcaggc tacgaccctt actacaccta ctctggctcc ataccatacc    24960 
ttgacggaac cttctatctt aatcacacct ttaagaaggt ggccattact tttgactctt    25020 
ctgttagctg gccgggcaac gaccgcctgc ttactcccaa tgagtttgag attaagcgct    25080 
cagttgacgg ggagggctat aacgtagctc agtgcaacat gacaaaggac tggttcctag    25140 
tgcagatgtt ggccaactac aatattggct accagggctt ctacattcca gaaagctaca    25200 
aagaccgcat gtactcgttc ttcagaaact tccagcccat gagccggcaa gtggtggacg    25260 
atactaaata caaagattat cagcaggttg gaattatcca ccagcataac aactcaggct    25320 
tcgtaggcta cctcgctccc accatgcgcg agggacaagc ttaccccgct aatgttccct    25380 
acccactaat aggcaaaacc gcggttgata gtattaccca gaaaaagttt ctttgcgacc    25440 
gcaccctgtg gcgcatcccc ttctccagta actttatgtc catgggtgcg ctcacagacc    25500 
tgggccaaaa ccttctctac gcaaactccg cccacgcgct agacatgacc tttgaggtgg    25560 
atcccatgga cgagcccacc cttctttatg ttttgtttga agtctttgac gtggtccgtg    25620 
tgcaccagcc gcaccgcggc gtcatcgaga ccgtgtacct gcgcacgccc ttctcggccg    25680 
gcaacgccac aacataaaga agcaagcaac atcaacaaca gctgccgcca tgggctccag    25740 
tgagcaggaa ctgaaagcca ttgtcaaaga tcttggttgt gggccatatt ttttgggcac    25800 
ctatgacaag cgcttcccag gctttgtttc cccacacaag ctcgcctgcg ccatagttaa    25860 
cacggccggt cgcgagactg ggggcgtaca ctggatggcc tttgcctgga acccgcgctc    25920 
aaaaacatgc tacctctttg agccctttgg cttttctgac caacgtctca agcaggttta    25980 
ccagtttgag tacgagtcac tcctgcgccg tagcgccatt gcctcttccc ccgaccgctg    26040 
tataacgctg gaaaagtcca cccaaagcgt gcaggggccc aactcggccg cctgtggcct    26100 
attctgctgc atgtttctcc acgcctttgc caactggccc caaactccca tggatcacaa    26160 
ccccaccatg aaccttatta ccggggtacc caactccatg cttaacagtc cccaggtaca    26220 
gcccaccctg cgccgcaacc aggaacagct ctacagcttc ctggagcgcc actcgcccta    26280 
cttccgcagc cacagtgcgc aaattaggag cgccacttct ttttgtcact tgaaaaacat    26340 
gtaaaaataa tgtactagga gacactttca ataaaggcaa atgtttttat ttgtacactc    26400 
tcgggtgatt atttaccccc acccttgccg tctgcgccgt ttaaaaatca aaggggttct    26460 
gccgcgcatc gctatgcgcc actggcaggg acacgttgcg atactggtgt ttagtgctcc    26520 
acttaaactc aggcacaacc atccgcggca gctcggtgaa gttttcactc cacaggctgc    26580 
gcaccatcac caacgcgttt agcaggtcgg gcgccgatat cttgaagtcg cagttggggc    26640 
ctccgccctg cgcgcgcgag ttgcgataca cagggttaca gcactggaac actatcagcg    26700 
ccgggtggtg cacgctggcc agcacgctct tgtcggagat cagatccgcg tccaggtcct    26760 
ccgcgttgct cagggcgaac ggagtcaact ttggtagctg ccttcccaaa aagggtgcat    26820 
gcccaggctt tgagttgcac tcgcaccgta gtggcatcag aaggtgaccg tgcccagtct    26880 
gggcgttagg atacagcgcc tgcatgaaag ccttgatctg cttaaaagcc acctgagcct    26940 
ttgcgccttc agagaagaac atgccgcaag acttgccgga aaactgattg gccggacagg    27000 
ccgcgtcatg cacgcagcac cttgcgtcgg tgttggagat ctgcaccaca tttcggcccc    27060 
accggttctt cacgatcttg gccttgctag actgctcctt cagcgcgcgc tgcccgtttt    27120 
cgctcgtcac atccatttca atcacgtgct ccttatttat cataatgctc ccgtgtagac    27180 
acttaagctc gccttcgatc tcagcgcagc ggtgcagcca caacgcgcag cccgtgggct    27240 
cgtggtgctt gtaggttacc tctgcaaacg actgcaggta cgcctgcagg aatcgcccca    27300 
tcatcgtcac aaaggtcttg ttgctggtga aggtcagctg caacccgcgg tgctcctcgt    27360 
ttagccaggt cttgcatacg gccgccagag cttccacttg gtcaggcagt agcttgaagt    27420 
ttgcctttag atcgttatcc acgtggtact tgtccatcaa cgcgcgcgca gcctccatgc    27480 
ccttctccca cgcagacacg atcggcaggc tcagcgggtt tatcaccgtg ctttcacttt    27540 
ccgcttcact ggactcttcc ttttcctctt gcatccgcat accccgcgcc actgggtcgt    27600 
cttcattcag ccgccgcacc gtgcgcttac ctcccttgcc gtgcttgatt agcaccggtg    27660 
ggttgctgaa acccaccatt tgtagcgcca catcttctct ttcttcctcg ctgtccacga    27720 
tcacctctgg ggatggcggg cgctcgggct tgggagaggg gcgcttcttt ttctttttgg    27780 
acgcaatggc caaatccgcc gtcgaggtcg atggccgcgg gctgggtgtg cgcggcacca    27840 
gcgcatcttg tgacgagtct tcttcgtcct cggactcgag acgccgcctc agccgctttt    27900 
ttgggggcgc gcggggaggc ggcggcgacg gcgacgggga cgagacgtcc tccatggttg    27960 
gtggacgtcg cgccgcaccg cgtccgcgct cgggggtggt ttcgcgctgc tcctcttccc    28020 
gactggccat ttccttctcc tataggcaga aaaagatcat ggagtcagtc gagaaggagg    28080 
acagcctaac cgcccccttt gagttcgcca ccaccgcctc caccgatgcc gccaacgcgc    28140 
ctaccacctt ccccgtcgag gcacccccgc ttgaggagga ggaagtgatt atcgagcagg    28200 
acccaggttt tgtaagcgaa gacgacgaag atcgctcagt accaacagag gataaaaagc    28260 
aagaccagga cgacgcagag gcaaacgagg aacaagtcgg gcggggggac caaaggcatg    28320 
gcgactacct agatgtggga gacgacgtgc tgttgaagca tctgcagcgc cagtgcgcca    28380 
ttatctgcga cgcgttgcaa gagcgcagcg atgtgcccct cgccatagcg gatgtcagcc    28440 
ttgcctacga acgccacctg ttctcaccgc gcgtaccccc caaacgccaa gaaaacggca    28500 
catgcgagcc caacccgcgc ctcaacttct accccgtatt tgccgtgcca gaggtgcttg    28560 
ccacctatca catctttttc caaaactgca agatacccct atcctgccgt gccaaccgca    28620 
gccgagcgga caagcagctg gccttgcggc agggcgctgt catacctgat atcgcctcgc    28680 
tcgacgaagt gccaaaaatc tttgagggtc ttggacgcga cgagaagcgc gcggcaaacg    28740 
ctctgcaaca agaaaacagc gaaaatgaaa gtcactgtgg agtgctggtg gaacttgagg    28800 
gtgacaacgc gcgcctagcc gtgctgaaac gcagcatcga ggtcacccac tttgcctacc    28860 
cggcacttaa cctacccccc aaggttatga gcacagtcat gagcgagctg atcgtgcgcc    28920 
gtgcacgacc cctggagagg gatgcaaact tgcaagaaca aaccgaggag ggcctacccg    28980 
cagttggcga tgagcagctg gcgcgctggc ttgagacgcg cgagcctgcc gacttggagg    29040 
agcgacgcaa gctaatgatg gccgcagtgc ttgttaccgt ggagcttgag tgcatgcagc    29100 
ggttctttgc tgacccggag atgcagcgca agctagagga aacgttgcac tacacctttc    29160 
gccagggcta cgtgcgccag gcctgcaaaa tttccaacgt ggagctctgc aacctggtct    29220 
cctaccttgg aattttgcac gaaaaccgcc ttgggcaaaa cgtgcttcat tccacgctca    29280 
agggcgaggc gcgccgcgac tacgtccgcg actgcgttta cttatttctg tgctacacct    29340 
ggcaaacggc catgggcgtg tggcagcagt gcctggagga gcgcaacctg aaggagctgc    29400 
agaagctgct aaagcaaaac ttgaaggacc tatggacggc cttcaacgag cgctccgtgg    29460 
ccgcgcacct ggcggacatt atcttccccg aacgcctgct taaaaccctg caacagggtc    29520 
tgccagactt caccagtcaa agcatgttgc aaaactttag gaactttatc ctagagcgtt    29580 
caggaattct gcccgccacc tgctgtgcgc ttcctagcga ctttgtgccc attaagtacc    29640 
gtgaatgccc tccgccgctt tggggtcact gctaccttct gcagctagcc aactaccttg    29700 
cctaccactc cgacatcatg gaagacgtga gcggtgacgg cctactggag tgtcactgtc    29760 
gctgcaacct atgcaccccg caccgctccc tggtctgcaa ttcacaactg cttagcgaaa    29820 
gtcaaattat cggtaccttt gagctgcagg gtccctcgcc tgacgaaaag tccgcggctc    29880 
cggggttgaa actcactccg gggctgtgga cgtcggctta ccttcgcaaa tttgtacctg    29940 
aggactacca cgcccacgag attaggttct acgaagacca atcccgcccg ccaaatgcgg    30000 
agcttaccgc ctgcgtcatt acccagggcc acatccttgg ccaattgcaa gccattaaca    30060 
aagcccgcca agagtttctg ctacgaaagg gacggggggt ttacttggac ccccagtccg    30120 
gcgaggagct caacccaatc cccccgccgc cgcagcccta tcagcagccg cgggcccttg    30180 
cttcccagga tggcacccaa aaagaagctg cagctgccgc cgccgccacc cacggacgag    30240 
gaggaatact gggacagtca ggcagaggag gttttggacg aggaggagga gatgatggaa    30300 
gactgggaca gcctagacga ggaagcttcc gaggccgaag aggtgtcaga cgaaacaccg    30360 
tcaccctcgg tcgcattccc ctcgccggcg ccccagaaat cggcaaccgt tcccagcatt    30420 
gctacaacct ccgctcctca ggcgccgccg gcactgcccg ttcgccgacc caaccgtaga    30480 
tgggacacca ctggaaccag ggccggtaag tctaagcagc cgccgccgtt agcccaagag    30540 
caacaacagc gccaaggcta ccgctcgtgg cgcgtgcaca agaacgccat agttgcttgc    30600 
ttgcaagact gtgggggcaa catctccttc gcccgccgct ttcttctcta ccatcacggc    30660 
gtggccttcc cccgtaacat cctgcattac taccgtcatc tctacagccc ctactgcacc    30720 
ggcggcagcg gcagcaacag cagcggccac gcagaagcaa aggcgaccgg atagcaagac    30780 
tctgacaaag cccaagaaat ccacagcggc ggcagcagca ggaggaggag cactgcgtct    30840 
ggcgcccaac gaacccgtat cgacccgcga gcttagaaac aggatttttc ccactctgta    30900 
tgctatattt caacagagca ggggccaaga acaagagctg aaaataaaaa acaggtctct    30960 
gcgctccctc acccgcagct gcctgtatca caaaagcgaa gatcagcttc ggcgcacgct    31020 
ggaagacgcg gaggctctct tcagcaaata ctgcgcgctg actcttaagg actagtttcg    31080 
cgccctttct caaatttaag cgcgaaaact acgtcatctc cagcggccac acccggcgcc    31140 
agcacctgtc gtcagcgcca ttatgagcaa ggaaattccc acgccctaca tgtggagtta    31200 
ccagccacaa atgggacttg cggctggagc tgcccaagac tactcaaccc gaataaacta    31260 
catgagcgcg ggaccccaca tgatatcccg ggtcaacgga atccgcgccc accgaaaccg    31320 
aattctcctc gaacaggcgg ctattaccac cacacctcgt aataacctta atccccgtag    31380 
ttggcccgct gccctggtgt accaggaaag tcccgctccc accactgtgg tacttcccag    31440 
agacgcccag gccgaagttc agatgactaa ctcaggggcg cagcttgcgg gcggctttcg    31500 
tcacagggtg cggtcgcccg ggcagggtat aactcacctg aaaatcagag ggcgaggtat    31560 
tcagctcaac gacgagtcgg tgagctcctc tcttggtctc cgtccggacg ggacatttca    31620 
gatcggcggc gctggccgct cttcatttac gccccgtcag gcgatcctaa ctctgcagac    31680 
ctcgtcctcg gagccgcgct ccggaggcat tggaactcta caatttattg aggagttcgt    31740 
gccttcggtt tacttcaacc ccttttctgg acctcccggc cactacccgg accagtttat    31800 
tcccaacttt gacgcggtaa aagactcggc ggacggctac gactgaatga ccagtggaga    31860 
ggcagagcaa ctgcgcctga cacacctcga ccactgccgc cgccacaagt gctttgcccg    31920 
cggctccggt gagttttgtt actttgaatt gcccgaagag catatcgagg gcccggcgca    31980 
cggcgtccgg ctcaccaccc aggtagagct tacacgtagc ctgattcggg agtttaccaa    32040 
gcgccccctg ctagtggagc gggagcgggg tccctgtgtt ctgaccgtgg tttgcaactg    32100 
tcctaaccct ggattacatc aagatcttat tccattcaac taacaataaa cacacaataa    32160 
attacttact taaaatcagt cagcaaatct ttgtccagct tattcagcat cacctccttt    32220 
ccctcctccc aactctggta tttcagcagc cttttagctg cgaactttct ccaaagtcta    32280 
aatgggatgt caaattcctc atgttcttgt ccctccgcac ccactatctt catattgttg    32340 
cagatgaaac gcgccagacc gtctgaagac accttcaacc ctgtgtaccc atatgacacg    32400 
gaaaccggcc ctccaactgt gcctttcctt acccctccct ttgtgtcgcc aaatgggttc    32460 
caagaaagtc cccccggagt gctttctttg cgtctttcag aacctttggt tacctcacac    32520 
ggcatgcttg cgctaaaaat gggcagcggc ctgtccctgg atcaggcagg caaccttaca    32580 
tcaaatacaa tcactgtttc tcaaccgcta aaaaaaacaa agtccaatat aactttggaa    32640 
acatccgcgc cccttacagt cagctcaggc gccctaacca tggccacaac ttcgcctttg    32700 
gtggtctctg acaacactct taccatgcaa tcacaagcac cgctaaccgt gcaagactca    32760 
aaacttagca ttgctaccaa agagccactt acagtgttag atggaaaact ggccctgcag    32820 
acatcagccc ccctctctgc cactgataac aacgccctca ctatcactgc ctcacctcct    32880 
cttactactg caaatggtag tctggctgtt accatggaaa acccacttta caacaacaat    32940 
ggaaaacttg ggctcaaaat tggcggtcct ttgcaagtgg ccaccgactc acatgcacta    33000 
acactaggta ctggtcaggg ggttgcagtt cataacaatt tgctacatac aaaagttaca    33060 
ggcgcaatag ggtttgatac atctggcaac atggaactta aaactggaga tggcctctat    33120 
gtggatagcg ccggtcctaa ccaaaaacta catattaatc taaataccac aaaaggcctt    33180 
gcttttgaca acaccgcaat aacaattaac gctggaaaag ggttggaatt tgaaacagac    33240 
tcctcaaacg gaaatcccat aaaaacaaaa attggatcag gcatacaata taataccaat    33300 
ggagctatgg ttgcaaaact tggaacaggc ctcagttttg acagctccgg agccataaca    33360 
atgggcagca taaacaatga cagacttact ctttggacaa caccagaccc atccccaaat    33420 
tgcagaattg cttcagataa agactgcaag ctaactctgg cgctaacaaa atgtggcagt    33480 
caaattttgg gcactgtttc agctttggca gtatcaggta atatggcctc catcaatgga    33540 
actctaagca gtgtaaactt ggttcttaga tttgatgaca acggagtgct tatgtcaaat    33600 
tcatcactgg acaaacagta ttggaacttt agaaacgggg actccactaa cggtcaacca    33660 
tacacttatg ctgttgggtt tatgccaaac ctaaaagctt acccaaaaac tcaaagtaaa    33720 
actgcaaaaa gtaatattgt tagccaggtg tatcttaatg gtgacaagtc taaaccattg    33780 
cattttacta ttacgctaaa tggaacagat gaaaccaacc aagtaagcaa atactcaata    33840 
tcattcagtt ggtcctggaa cagtggacaa tacactaatg acaaatttgc caccaattcc    33900 
tataccttct cctacattgc ccaggaataa agaatcgtga acctgttgca tgttatgttt    33960 
caacgtgttt atttttcaat tgcagaaaat ttcaagtcat ttttcattca gtagtatagc    34020 
cccaccacca catagcttat actaatcacc gtaccttaat caaactcaca gaaccctagt    34080 
attcaacctg ccacctccct cccaacacac agagtacaca gtcctttctc cccggctggc    34140 
cttaaacagc atcatatcat gggtaacaga catattctta ggtgttatat tccacacggt    34200 
ctcctgtcga gccaaacgct catcagtgat gttaataaac tccccgggca gctcgcttaa    34260 
gttcatgtcg ctgtccagct gctgagccac aggctgctgt ccaacttgcg gttgctcaac    34320 
gggcggcgaa ggagaagtcc acgcctacat gggggtagag tcataatcgt gcatcaggat    34380 
agggcggtgg tgctgcagca gcgcgcgaat aaactgctgc cgccgccgct ccgtcctgca    34440 
ggaatacaac atggcagtgg tctcctcagc gatgattcgc accgcccgca gcataaggcg    34500 
ccttgtcctc cgggcacagc agcgcaccct gatctcactt aagtcagcac agtaactgca    34560 
gcacagtacc acaatattgt ttaaaatccc acagtgcaag gcgctgtatc caaagctcat    34620 
ggcggggacc acagaaccca cgtggccatc ataccacaag cgcaggtaga ttaagtggcg    34680 
acccctcata aacacgctgg acataaacat tacctctttt ggcatgttgt aattcaccac    34740 
ctcccggtac catataaacc tctgattaaa catggcgcca tccaccacca tcctaaacca    34800 
gctggccaaa acctgcccgc cggctatgca ctgcagggaa ccgggactgg aacaatgaca    34860 
gtggagagcc caggactcgt aaccatggat catcatgctc gtcatgatat caatgttggc    34920 
acaacacagg cacacgtgca tacacttcct caggattaca agctcctccc gcgtcagaac    34980 
catatcccag ggaacaaccc attcctgaat cagcgtaaat cccacactgc agggaagacc    35040 
tcgcacgtaa ctcacgttgt gcattgtcaa agtgttacat tcgggcagca gcggatgatc    35100 
ctccagtatg gtagcgcggg tttctgtctc aaaaggaggt agacgatccc tactgtacgg    35160 
agtgcgccga gacaaccgag atcgtgttgg tcgtagtgtc atgccaaatg gaacgccgga    35220 
cgtagtcata tttcctgaag caaaaccagg tgcgggcgtg acaaacagat ctgcgtctcc    35280 
ggtctcgccg cttagatcgc tctgtgtagt agttgtagta tatccactct ctcaaagcat    35340 
ccaggcgccc cctggcttcg ggttctatgt aaactccttc atgcgccgct gccctgataa    35400 
catccaccac cgcagaataa gccacaccca gccaacctac acattcgttc tgcgagtcac    35460 
acacgggagg agcgggaaga gctggaagaa ccatgttttt ttttttattc caaaagatta    35520 
tccaaaacct caaaatgaag atctattaag tgaacgcgct cccctccggt ggcgtggtca    35580 
aactctacag ccaaagaaca gataatggca tttgtaagat gttgcacaat ggcttccaaa    35640 
aggcaaacgg ccctcacgtc caagtggacg taaaggctaa acccttcagg gtgaatctcc    35700 
tctataaaca ttccagcacc ttcaaccatg cccaaataat tctcatctcg ccaccttctc    35760 
aatatatctc taagcaaatc ccgaatatta agtccggcca ttgtaaaaat ctgctccaga    35820 
gcgccctcca ccttcagcct caagcagcga atcatgattg caaaaattca ggttcctcac    35880 
agacctgtat aagattcaaa agcggaacat taacaaaaat accgcgatcc cgtaggtccc    35940 
ttcgcagggc cagctgaaca taatcgtgca ggtctgcacg gaccagcgcg gccacttccc    36000 
cgccaggaac catgacaaaa gaacccacac tgattatgac acgcatactc ggagctatgc    36060 
taaccagcgt agccccgatg taagcttgtt gcatgggcgg cgatataaaa tgcaaggtgc    36120 
tgctcaaaaa atcaggcaaa gcctcgcgca aaaaagaaag cacatcgtag tcatgctcat    36180 
gcagataaag gcaggtaagc tccggaacca ccacagaaaa agacaccatt tttctctcaa    36240 
acatgtctgc gggtttctgc ataaacacaa aataaaataa caaaaaaaca tttaaacatt    36300 
agaagcctgt cttacaacag gaaaaacaac ccttataagc ataagacgga ctacggccat    36360 
gccggcgtga ccgtaaaaaa actggtcacc gtgattaaaa agcaccaccg acagctcctc    36420 
ggtcatgtcc ggagtcataa tgtaagactc ggtaaacaca tcaggttgat tcacatcggt    36480 
cagtgctaaa aagcgaccga aatagcccgg gggaatacat acccgcaggc gtagagacaa    36540 
cattacagcc cccataggag gtataacaaa attaatagga gagaaaaaca cataaacacc    36600 
tgaaaaaccc tcctgcctag gcaaaatagc accctcccgc tccagaacaa catacagcgc    36660 
ttccacagcg gcagccataa cagtcagcct taccagtaaa aaagaaaacc tattaaaaaa    36720 
acaccactcg acacggcacc agctcaatca gtcacagtgt aaaaaagggc caagtgcaga    36780 
gcgagtatat ataggactaa aaaatgacgt aacggttaaa gtccacaaaa aacacccaga    36840 
aaaccgcacg cgaacctacg cccagaaacg aaagccaaaa aacccacaac ttcctcaaat    36900 
cgtcacttcc gttttcccac gttacgtcac ttcccatttt aagaaaacta caattcccaa    36960 
cacatacaag ttactccgcc ctaaaaccta cgtcacccgc cccgttccca cgccccgcgc    37020 
cacgtcacaa actccacccc ctcattatca tattggcttc aatccaaaat aaggtatatt    37080 
attgatgatg                                                           37090 
<210>5 
<211>5955 
<212>DNA 
<213>人工序列 
<220> 
<223>NS cDNA序列 
<221>CDS 
<222>(1)...(5955) 
<400>5 
atg gcg ccc atc acg gcc tac tcc caa cag acg cgg ggc cta ctt ggt     48 
Met Ala Pro Ile Thr Ala Tyr Ser Gln Gln Thr Arg Gly Leu Leu Gly 
 1               5                   10                  15 
tgc atc atc act agc ctt aca ggc cgg gac aag aac cag gtc gag gga     96 
Cys Ile Ile Thr Ser Leu Thr Gly Arg Asp Lys Asn Gln Val Glu Gly 
             20                  25                  30 
gag gtt cag gtg gtt tcc acc gca aca caa tcc ttc ctg gcg acc tgc    144 
Glu Val Gln Val Val Ser Thr Ala Thr Gln Ser Phe Leu Ala Thr Cys 
         35                  40                  45 
gtc aac ggc gtg tgt tgg acc gtt tac cat ggt gct ggc tca aag acc    192 
Val Asn Gly Val Cys Trp Thr Val Tyr His Gly Ala Gly Ser Lys Thr 
     50                  55                  60 
tta gcc ggc cca aag ggg cca atc acc cag atg tac act aat gtg gac    240 
Leu Ala Gly Pro Lys Gly Pro Ile Thr Gln Met Tyr Thr Asn Val Asp 
 65                  70                  75                  80 
cag gac ctc gtc ggc tgg cag gcg ccc ccc ggg gcg cgt tcc ttg aca    288 
Gln Asp Leu Val Gly Trp Gln Ala Pro Pro Gly Ala Arg Ser Leu Thr 
                 85                  90                  95 
cca tgc acc tgt ggc agc tca gac ctt tac ttg gtc acg aga cat gct    336 
Pro Cys Thr Cys Gly Ser Ser Asp Leu Tyr Leu Val Thr Arg His Ala 
            100                 105                 110 
gac gtc att ccg gtg cgc cgg cgg ggc gac agt agg ggg agc ctg ctc    384 
Asp Val Ile Pro Val Arg Arg Arg Gly Asp Ser Arg Gly Ser Leu Leu 
        115                 120                 125 
tcc ccc agg cct gtc tcc tac ttg aag ggc tct tcg ggt ggt cca ctg      432 
Ser Pro Arg Pro Val Ser Tyr Leu Lys Gly Ser Ser Gly Gly Pro Leu 
    130                 135                 140 
ctc tgc cct tcg ggg cac gct gtg ggc atc ttc cgg gct gcc gta tgc      480 
Leu Cys Pro Ser Gly His Ala Val Gly Ile Phe Arg Ala Ala Val Cys 
145                 150                 155                 160 
acc cgg ggg gtt gcg aag gcg gtg gac ttt gtg ccc gta gag tcc atg      528 
Thr Arg Gly Val Ala Lys Ala Val Asp Phe Val Pro Val Glu Ser Met 
                165                 170                 175 
gaa act act atg cgg tct ccg gtc ttc acg gac aac tca tcc ccc ccg      576 
Glu Thr Thr Met Arg Ser Pro Val Phe Thr Asp Asn Ser Ser Pro Pro 
            180                 185                 190 
gcc gta ccg cag tca ttt caa gtg gcc cac cta cac gct ccc act ggc      624 
Ala Val Pro Gln Ser Phe Gln Val Ala His Leu His Ala Pro Thr Gly 
        195                 200                 205 
agc ggc aag agt act aaa gtg ccg gct gca tat gca gcc caa ggg tac      672 
Ser Gly Lys Ser Thr Lys Val Pro Ala Ala Tyr Ala Ala Gln Gly Tyr 
    210                 215                 220 
aag gtg ctc gtc ctc aat ccg tcc gtt gcc gct acc tta ggg ttt ggg      720 
Lys Val Leu Val Leu Asn Pro Ser Val Ala Ala Thr Leu Gly Phe Gly 
225                 230                 235                 240 
gcg tat atg tct aag gca cac ggt att gac ccc aac atc aga act ggg      768 
Ala Tyr Met Ser Lys Ala His Gly Ile Asp Pro Asn Ile Arg Thr Gly 
                245                 250                 255 
gta agg acc att acc aca ggc gcc ccc gtc aca tac tct acc tat ggc      816 
Val Arg Thr Ile Thr Thr Gly Ala Pro Val Thr Tyr Ser Thr Tyr Gly 
            260                 265                 270 
aag ttt ctt gcc gat ggt ggt tgc tct ggg ggc gct tat gac atc ata      864 
Lys Phe Leu Ala Asp Gly Gly Cys Ser Gly Gly Ala Tyr Asp Ile Ile 
        275                 280                 285 
ata tgt gat gag tgc cat tca act gac tcg act aca atc ttg ggc atc      912 
Ile Cys Asp Glu Cys His Ser Thr Asp Ser Thr Thr Ile Leu Gly Ile 
    290                 295                 300 
ggc aca gtc ctg gac caa gcg gag acg gct gga gcg cgg ctt gtc gtg      960 
Gly Thr Val Leu Asp Gln Ala Glu Thr Ala Gly Ala Arg Leu Val Val 
305                 310                 315                 320 
ctc gcc acc gct acg cct ccg gga tcg gtc acc gtg cca cac cca aac     1008 
Leu Ala Thr Ala Thr Pro Pro Gly Ser Val Thr Val Pro His Pro Asn 
                325                 330                 335 
atc gag gag gtg gcc ctg tct aat act gga gag atc ccc ttc tat ggc     1056 
Ile Glu Glu Val Ala Leu Ser Asn Thr Gly Glu Ile Pro Phe Tyr Gly 
            340                 345                 350 
aaa gcc atc ccc att gaa gcc atc agg ggg gga agg cat ctc att ttc     1104 
Lys Ala Ile Pro Ile Glu Ala Ile Arg Gly Gly Arg His Leu Ile Phe 
        355                 360                 365 
tgt cat tcc aag aag aag tgc gac gag ctc gcc gca aag ctg tca ggc     1152 
Cys His Ser Lys Lys Lys Cys Asp Glu Leu Ala Ala Lys Leu Ser Gly 
    370                 375                 380 
ctc gga atc aac gct gtg gcg tat tac cgg ggg ctc gat gtg tcc gtc     1200 
Leu Gly Ile Asn Ala Val Ala Tyr Tyr Arg Gly Leu Asp Val Ser Val 
385                 390                 395                 400 
ata cca act atc gga gac gtc gtt gtc gtg gca aca gac gct ctg atg     1248 
Ile Pro Thr Ile Gly Asp Val Val Val Val Ala Thr Asp Ala Leu Met 
                405                 410                 415 
acg ggc tat acg ggc gac ttt gac tca gtg atc gac tgt aac aca tgt    1296 
Thr Gly Tyr Thr Gly Asp Phe Asp Ser Val Ile Asp Cys Asn Thr Cys 
            420                 425                 430 
gtc acc cag aca gtc gac ttc agc ttg gat ccc acc ttc acc att gag    1344 
Val Thr Gln Thr Val Asp Phe Ser Leu Asp Pro Thr Phe Thr Ile Glu 
        435                 440                 445 
acg acg acc gtg cct caa gac gca gtg tcg cgc tcg cag cgg cgg ggt    1392 
Thr Thr Thr Val Pro Gln Asp Ala Val Ser Arg Ser Gln Arg Arg Gly 
    450                 455                 460 
agg act ggc agg ggt agg aga ggc atc tac agg ttt gtg act ccg gga    1440 
Arg Thr Gly Arg Gly Arg Arg Gly Ile Tyr Arg Phe Val Thr Pro Gly 
465                 470                 475                 480 
gaa cgg ccc tcg ggc atg ttc gat tcc tcg gtc ctg tgt gag tgc tat    1488 
Glu Arg Pro Ser Gly Met Phe Asp Ser Ser Val Leu Cys Glu Cys Tyr 
                485                 490                 495 
gac gcg ggc tgt gct tgg tac gag ctc acc ccc gcc gag acc tcg gtt    1536 
Asp Ala Gly Cys Ala Trp Tyr Glu Leu Thr Pro Ala Glu Thr Ser Val 
            500                 505                 510 
agg ttg cgg gcc tac ctg aac aca cca ggg ttg ccc gtt tgc cag gac    1584 
Arg Leu Arg Ala Tyr Leu Asn Thr Pro Gly Leu Pro Val Cys Gln Asp 
        515                 520                 525 
cac ctg gag ttc tgg gag agt gtc ttc aca ggc ctc acc cac ata gat    1632 
His Leu Glu Phe Trp Glu Ser Val Phe Thr Gly Leu Thr His Ile Asp 
    530                 535                 540 
gca cac ttc ttg tcc cag acc aag cag gca gga gac aac ttc ccc tac    1680 
Ala His Phe Leu Ser Gln Thr Lys Gln Ala Gly Asp Asn Phe Pro Tyr 
545                 550                 555                 560 
ctg gta gca tac caa gcc acg gtg tgc gcc agg gct cag gcc cca cct    1728 
Leu Val Ala Tyr Gln Ala Thr Val Cys Ala Arg Ala Gln Ala Pro Pro 
                565                 570                 575 
cca tca tgg gat caa atg tgg aag tgt ctc ata cgg ctg aaa cct acg    1776 
Pro Ser Trp Asp Gln Met Trp Lys Cys Leu Ile Arg Leu Lys Pro Thr 
            580                 585                 590 
ctg cac ggg cca aca ccc ttg ctg tac agg ctg gga gcc gtc caa aat    1824 
Leu His Gly Pro Thr Pro Leu Leu Tyr Arg Leu Gly Ala Val Gln Asn 
        595                 600                 605 
gag gtc acc ctc acc cac ccc ata acc aaa tac atc atg gca tgc atg    1872 
Glu Val Thr Leu Thr His Pro Ile Thr Lys Tyr Ile Met Ala Cys Met 
    610                 615                 620 
tcg gct gac ctg gag gtc gtc act agc acc tgg gtg ctg gtg ggc gga    1920 
Ser Ala Asp Leu Glu Val Val Thr Ser Thr Trp Val Leu Val Gly Gly 
625                 630                 635                 640 
gtc ctt gca gct ctg gcc gcg tat tgc ctg aca aca ggc agt gtg gtc    1968 
Val Leu Ala Ala Leu Ala Ala Tyr Cys Leu Thr Thr Gly Ser Val Val 
                645                 650                 655 
att gtg ggt agg att atc ttg tcc ggg agg ccg gct att gtt ccc gac    2016 
Ile Val Gly Arg Ile Ile Leu Ser Gly Arg Pro Ala Ile Val Pro Asp 
            660                 665                 670 
agg gag ttt ctc tac cag gag ttc gat gaa atg gaa gag tgc gcc tcg    2064 
Arg Glu Phe Leu Tyr Gln Glu Phe Asp Glu Met Glu Glu Cys Ala Ser 
        675                 680                 685 
cac ctc cct tac atc gag cag gga atg cag ctc gcc gag caa ttc aag    2112 
His Leu Pro Tyr Ile Glu Gln Gly Met Gln Leu Ala Glu Gln Phe Lys 
    690                 695                 700 
cag aaa gcg ctc ggg tta ctg caa aca gcc acc aaa caa gcg gag gct    2160 
Gln Lys Ala Leu Gly Leu Leu Gln Thr Ala Thr Lys Gln Ala Glu Ala 
705                 710                 715                 720 
gct gct ccc gtg gtg gag tcc aag tgg cga gcc ctt gag aca ttc tgg    2208 
Ala Ala Pro Val Val Glu Ser Lys Trp Arg Ala Leu Glu Thr Phe Trp 
                725                 730                 735 
gcg aag cac atg tgg aat ttc atc agc ggg ata cag tac tta gca ggc    2256 
Ala Lys His Met Trp Asn Phe Ile Ser Gly Ile Gln Tyr Leu Ala Gly 
            740                 745                 750 
tta tcc act ctg cct ggg aac ccc gca ata gca tca ttg atg gca ttc    2304 
Leu Ser Thr Leu Pro Gly Asn Pro Ala Ile Ala Ser Leu Met Ala Phe 
        755                 760                 765 
aca gcc tct atc acc agc ccg ctc acc acc caa agt acc ctc ctg ttt    2352 
Thr Ala Ser Ile Thr Ser Pro Leu Thr Thr Gln Ser Thr Leu Leu Phe 
    770                 775                 780 
aac atc ttg ggg ggg tgg gtg gct gcc caa ctc gcc ccc ccc agc gcc    2400 
Asn Ile Leu Gly Gly Trp Val Ala Ala Gln Leu Ala Pro Pro Ser Ala 
785                 790                 795                 800 
gct tcg gct ttc gtg ggc gcc ggc atc gcc ggt gcg gct gtt ggc agc    2448 
Ala Ser Ala Phe Val Gly Ala Gly Ile Ala Gly Ala Ala Val Gly Ser 
                805                 810                 815 
ata ggc ctt ggg aag gtg ctt gtg gac att ctg gcg ggt tat gga gca    2496 
Ile Gly Leu Gly Lys Val Leu Val Asp Ile Leu Ala Gly Tyr Gly Ala 
            820                 825                 830 
gga gtg gcc ggc gcg ctc gtg gcc ttc aag gtc atg agc ggc gag atg    2544 
Gly Val Ala Gly Ala Leu Val Ala Phe Lys Val Met Ser Gly Glu Met 
        835                 840                 845 
ccc tcc acc gag gac ctg gtc aat cta ctt cct gcc atc ctc tct cct    2592 
Pro Ser Thr Glu Asp Leu Val Asn Leu Leu Pro Ala Ile Leu Ser Pro 
    850                 855                 860 
ggc gcc ctg gtc gtc ggg gtc gtg tgt gca gca ata ctg cgt cga cac    2640 
Gly Ala Leu Val Val Gly Val Val Cys Ala Ala Ile Leu Arg Arg His 
865                 870                 875                 880 
gtg ggt ccg gga gag ggg gct gtg cag tgg atg aac cgg ctg ata gcg    2688 
Val Gly Pro Gly Glu Gly Ala Val Gln Trp Met Asn Arg Leu Ile Ala 
                885                 890                 895 
ttc gcc tcg cgg ggt aat cat gtt tcc ccc acg cac tat gtg cct gag    2736 
Phe Ala Ser Arg Gly Asn His Val Ser Pro Thr His Tyr Val Pro Glu 
            900                 905                 910 
agc gac gcc gca gcg cgt gtt act cag atc ctc tcc agc ctt acc atc    2784 
Ser Asp Ala Ala Ala Arg Val Thr Gln Ile Leu Ser Ser Leu Thr Ile 
        915                 920                 925 
act cag ctg ctg aaa agg ctc cac cag tgg att aat gaa gac tgc tcc    2832 
Thr Gln Leu Leu Lys Arg Leu His Gln Trp Ile Asn Glu Asp Cys Ser 
    930                 935                 940 
aca ccg tgt tcc ggc tcg tgg cta agg gat gtt tgg gac tgg ata tgc    2880 
Thr Pro Cys Ser Gly Ser Trp Leu Arg Asp Val Trp Asp Trp Ile Cys 
945                 950                 955                 960 
acg gtg ttg act gac ttc aag acc tgg ctc cag tcc aag ctc ctg ccg    2928 
Thr Val Leu Thr Asp Phe Lys Thr Trp Leu Gln Ser Lys Leu Leu Pro 
                965                 970                 975 
cag cta ccg gga gtc cct ttt ttc tcg tgc caa cgc ggg tac aag gga    2976 
Gln Leu Pro Gly Val Pro Phe Phe Ser Cys Gln Arg Gly Tyr Lys Gly 
            980                 985                 990 
gtc tgg cgg gga gac ggc atc atg caa acc acc tgc cca tgt gga gca    3024 
Val Trp Arg Gly Asp Gly Ile Met Gln Thr Thr Cys Pro Cys Gly Ala 
         995                1000                1005 
cag atc acc gga cat gtc aaa aac ggt tcc atg agg atc gtc ggg cct    3072 
Gln Ile Thr Gly His Val Lys Asn Gly Ser Met Arg Ile Val Gly Pro 
    1010                1015                1020 
aag acc tgc agc aac acg tgg cat gga aca ttc ccc atc aac gca tac    3120 
Lys Thr Cys Ser Asn Thr Trp His Gly Thr Phe Pro Ile Asn Ala Tyr 
1025                1030                1035                1040 
acc acg ggc ccc tgc aca ccc tct cca gcg cca aac tat tct agg gcg    3168 
Thr Thr Gly Pro Cys Thr Pro Ser Pro Ala Pro Asn Tyr Ser Arg Ala 
                1045                1050                1055 
ctg tgg cgg gtg gcc gct gag gag tac gtg gag gtc acg cgg gtg ggg    3216 
Leu Trp Arg Val Ala Ala Glu Glu Tyr Val Glu Val Thr Arg Val Gly 
            1060                1065                1070 
gat ttc cac tac gtg acg ggc atg acc act gac aac gta aag tgc cca    3264 
Asp Phe His Tyr Val Thr Gly Met Thr Thr Asp Asn Val Lys Cys Pro 
        1075                1080                1085 
tgc cag gtt ccg gct cct gaa ttc ttc acg gag gtg gac gga gtg cgg    3312 
Cys Gln Val Pro Ala Pro Glu Phe Phe Thr Glu Val Asp Gly Val Arg 
    1090                1095                1100 
ttg cac agg tac gct ccg gcg tgc agg cct ctc cta cgg gag gag gtt    3360 
Leu Hi s Arg TyrAla Pro Ala Cys Arg Pro Leu Leu Arg Glu Glu Val 
1105                1110                1115                1120 
aca ttc cag gtc ggg ctc aac caa tac ctg gtt ggg tca cag cta cca    3408 
Thr Phe Gln Val Gly Leu Asn Gln Tyr Leu Val Gly Ser Gln Leu Pro 
                1125                1130                1135 
tgc gag ccc gaa ccg gat gta gca gtg ctc act tcc atg ctc acc gac    3456 
Cys Glu Pro Glu Pro Asp Val Ala Val Leu Thr Ser Met Leu Thr Asp 
            1140                1145                1150 
ccc tcc cac atc aca gca gaa acg gct aag cgt agg ttg gcc agg ggg    3504 
Pro Ser His Ile Thr Ala Glu Thr Ala Lys Arg Arg Leu Ala Arg Gly 
        1155                1160                1165 
tct ccc ccc tcc ttg gcc agc tct tca gct agc cag ttg tct gcg cct    3552 
Ser Pro Pro Ser Leu Ala Ser Ser Ser Ala Ser Gln Leu Ser Ala Pro 
    1170                1175                1180 
tcc ttg aag gcg aca tgc act acc cac cat gtc tct ccg gac gct gac    3600 
Ser Leu Lys Ala Thr Cys Thr Thr His His Val Ser Pro Asp Ala Asp 
1185                1190                1195                1200 
ctc atc gag gcc aac ctc ctg tgg cgg cag gag atg ggc ggg aac atc    3648 
Leu Ile Glu Ala Asn Leu Leu Trp Arg Gln Glu Met Gly Gly Asn Ile 
                1205                1210                1215 
acc cgc gtg gag tcg gag aac aag gtg gta gtc ctg gac tct ttc gac    3696 
Thr Arg Val Glu Ser Glu Asn Lys Val Val Val Leu Asp Ser Phe Asp 
            1220                1225                1230 
ccg ctt cga gcg gag gag gat gag agg gaa gta tcc gtt ccg gcg gag    3744 
Pro Leu Arg Ala Glu Glu Asp Glu Arg Glu Val Ser Val Pro Ala Glu 
        1235                1240                1245 
atc ctg cgg aaa tcc aag aag ttc ccc gca gcg atg ccc atc tgg gcg    3792 
Ile Leu Arg Lys Ser Lys Lys Phe Pro Ala Ala Met Pro Ile Trp Ala 
    1250                1255                1260 
cgc ccg gat tac aac cct cca ctg tta gag tcc tgg aag gac ccg gac    3840 
Arg Pro Asp Tyr Asn Pro Pro Leu Leu Glu Ser Trp Lys Asp Pro Asp 
1265                1270                1275                1280 
tac gtc cct ccg gtg gtg cac ggg tgc ccg ttg cca cct atc aag gcc    3888 
Tyr Val Pro Pro Val Val His Gly Cys Pro Leu Pro Pro Ile Lys Ala 
                1285                1290                1295 
cct cca ata cca cct cca cgg aga aag agg acg gtt gtc cta aca gag    3936 
Pro Pro Ile Pro Pro Pro Arg Arg Lys Arg Thr Val Val Leu Thr Glu 
            1300                1305                1310 
tcc tcc gtg tct tct gcc tta gcg gag ctc gct act aag acc ttc ggc    3984 
Ser Ser Val Ser Ser Ala Leu Ala Glu Leu Ala Thr Lys Thr Phe Gly 
        1315                1320                1325 
agc tcc gaa tca tcg gcc gtc gac agc ggc acg gcg acc gcc ctt cct    4032 
Ser Ser Glu Ser Ser Ala Val Asp Ser Gly Thr Ala Thr Ala Leu Pro 
    1330                1335                1340 
gac cag gcc tcc gac gac ggt gac aaa gga tcc gac gtt gag tcg tac    4080 
Asp Gln Ala Ser Asp Asp Gly Asp Lys Gly Ser Asp Val Glu Ser Tyr 
1345                1350                1355                1360 
tcc tcc atg ccc ccc ctt gag ggg gaa ccg ggg gac ccc gat ctc agt    4128 
Ser Ser Met Pro Pro Leu Glu Gly Glu Pro Gly Asp Pro Asp Leu Ser 
                1365                1370                1375 
gac ggg tct tgg tct acc gtg agc gag gaa gct agt gag gat gtc gtc    4176 
Asp Gly Ser Trp Ser Thr Val Ser Glu Glu Ala Ser Glu Asp Val Val 
            1380                1385                1390 
tgc tgc tca atg tcc tac aca tgg aca ggc gcc ttg atc acg cca tgc    4224 
Cys Cys Ser Met Ser Tyr Thr Trp Thr Gly Ala Leu Ile Thr Pro Cys 
        1395                1400                1405 
gct gcg gag gaa agc aag ctg ccc atc aac gcg ttg agc aac tct ttg    4272 
Ala Ala Glu Glu Ser Lys Leu Pro Ile Asn Ala Leu Ser Asn Ser Leu 
    1410                1415                1420 
ctg cgc cac cat aac atg gtt tat gcc aca aca tct cgc agc gca ggc    4320 
Leu Arg His His Asn Met Val Tyr Ala Thr Thr Ser Arg Ser Ala Gly 
1425                1430                1435                1440 
ctg cgg cag aag aag gtc acc ttt gac aga ctg caa gtc ctg gac gac    4368 
Leu Arg Gln Lys Lys Val Thr Phe Asp Arg Leu Gln Val Leu Asp Asp 
                1445                1450                1455 
cac tac cgg gac gtg ctc aag gag atg aag gcg aag gcg tcc aca gtt    4416 
His Tyr Arg Asp Val Leu Lys Glu Met Lys Ala Lys Ala Ser Thr Val 
            1460                1465                1470 
aag gct aaa ctc cta tcc gta gag gaa gcc tgc aag ctg acg ccc cca    4464 
Lys Ala Lys Leu Leu Ser Val Glu Glu Ala Cys Lys Leu Thr Pro Pro 
        1475                1480                1485 
cat tcg gcc aaa tcc aag ttt ggc tat ggg gca aag gac gtc cgg aac    4512 
His Ser Ala Lys Ser Lys Phe Gly Tyr Gly Ala Lys Asp Val Arg Asn 
    1490                1495                1500 
cta tcc agc aag gcc gtt aac cac atc cac tcc gtg tgg aag gac ttg    4560 
Leu Ser Ser Lys Ala Val Asn His Ile His Ser Val Trp Lys Asp Leu 
1505                1510                1515                1520 
ctg gaa gac act gtg aca cca att gac acc acc atc atg gca aaa aat    4608 
Leu Glu Asp Thr Val Thr Pro Ile Asp Thr Thr Ile Met Ala Lys Asn 
                1525                1530                1535 
gag gtt ttc tgt gtc caa cca gag aaa gga ggc cgt aag cca gcc cgc    4656 
Glu Val Phe Cys Val Gln Pro Glu Lys Gly Gly Arg Lys Pro Ala Arg 
            1540                1545                1550 
ctt atc gta ttc cca gat ctg gga gtc cgt gta tgc gag aag atg gcc    4704 
Leu Ile Val Phe Pro Asp Leu Gly Val Arg Val Cys Glu Lys Met Ala 
        1555                1560                1565 
ctc tat gat gtg gtc tcc acc ctt cct cag gtc gtg atg ggc tcc tca    4752 
Leu Tyr Asp Val Val Ser Thr Leu Pro Gln Val Val Met Gly Ser Ser 
    1570                1575                1580 
tac gga ttc cag tac tct cct ggg cag cga gtc gag ttc ctg gtg aat    4800 
Tyr Gly Phe Gln Tyr Ser Pro Gly Gln Arg Val Glu Phe Leu Val Asn 
1585                1590                1595                1600 
acc tgg aaa tca aag aaa aac ccc atg ggc ttt tca tat gac act cgc    4848 
Thr Trp Lys Ser Lys Lys Asn Pro Met Gly Phe Ser Tyr Asp Thr Arg 
                1605                1610                1615 
tgt ttc gac tca acg gtc acc gag aac gac atc cgt gtt gag gag tca    4896 
Cys Phe Asp Ser Thr Val Thr Glu Asn Asp Ile Arg Val Glu Glu Ser 
            1620                1625                1630 
att tac caa tgt tgt gac ttg gcc ccc gaa gcc aga cag gcc ata aaa    4944 
Ile Tyr Gln Cys Cys Asp Leu Ala Pro Glu Ala Arg Gln Ala Ile Lys 
        1635                1640                1645 
tcg ctc aca gag cgg ctt tat atc ggg ggt cct ctg act aat tca aaa    4992 
Ser Leu Thr Glu Arg Leu Tyr Ile Gly Gly Pro Leu Thr Asn Ser Lys 
    1650                1655                1660 
ggg cag aac tgc ggt tat cgc cgg tgc cgc gcg agc ggc gtg ctg acg    5040 
Gly Gln Asn Cys Gly Tyr Arg Arg Cys Arg Ala Ser Gly Val Leu Thr 
1665                1670                1675                1680 
act agc tgc ggt aac acc ctc aca tgt tac ttg aag gcc tct gca gcc    5088 
Thr Ser Cys Gly Asn Thr Leu Thr Cys Tyr Leu Lys Ala Ser Ala Ala 
                1685                1690                1695 
tgt cga gct gcg aag ctc cag gac tgc acg atg ctc gtg aac gga gac    5136 
Cys Arg Ala Ala Lys Leu Gln Asp Cys Thr Met Leu Val Asn Gly Asp 
            1700                1705                1710 
gac ctt gtc gtt atc tgt gaa agc gcg gga acc caa gag gac gcg gcg    5184 
Asp Leu Val Val Ile Cys Glu Ser Ala Gly Thr Gln Glu Asp Ala Ala 
        1715                1720                1725 
agc cta cga gtc ttc acg gag gct atg act agg tac tct gcc ccc ccc    5232 
Ser Leu Arg Val Phe Thr Glu Ala Met Thr Arg Tyr Ser Ala Pro Pro 
    1730                1735                1740 
ggg gac ccg ccc caa cca gaa tac gac ttg gag ctg ata aca tca tgt    5280 
Gly Asp Pro Pro Gln Pro Glu Tyr Asp Leu Glu Leu Ile Thr Ser Cys 
1745                1750                1755                1760 
tcc tcc aat gtg tcg gtc gcc cac gat gca tca ggc aaa agg gtg tac    5328 
Ser Ser Asn Val Ser Val Ala His Asp Ala Ser Gly Lys Arg Val Tyr 
                1765                1770                1775 
tac ctc acc cgt gat ccc acc acc ccc ctc gca cgg gct gcg tgg gaa    5376 
Tyr Leu Thr Arg Asp Pro Thr Thr Pro Leu Ala Arg Ala Ala Trp Glu 
            1780                1785                1790 
aca gct aga cac act cca gtt aac tcc tgg cta ggc aac att atc atg    5424 
Thr Ala Arg His Thr Pro Val Asn Ser Trp Leu Gly Asn Ile Ile Met 
        1795                1800                1805 
tat gcg ccc act ttg tgg gca agg atg att ctg atg act cac ttc ttc    5472 
Tyr Ala Pro Thr Leu Trp Ala Arg Met Ile Leu Met Thr His Phe Phe 
    1810                1815                1820 
tcc atc ctt cta gca cag gag caa ctt gaa aaa gcc ctg gac tgc cag    5520 
Ser Ile Leu Leu Ala Gln Glu Gln Leu Glu Lys Ala Leu Asp Cys Gln 
1825                1830                1835                1840 
atc tac ggg gcc tgt tac tcc att gag cca ctt gac cta cct cag atc    5568 
Ile Tyr Gly Ala Cys Tyr Ser Ile Glu Pro Leu Asp Leu Pro Gln Ile 
                1845                1850                1855 
att gaa cga ctc cat ggc ctt agc gca ttt tca ctc cat agt tac tct    5616 
Ile Glu Arg Leu His Gly Leu Ser Ala Phe Ser Leu His Ser Tyr Ser 
            1860                1865                1870 
cca ggt gag atc aat agg gtg gct tca tgc ctc agg aaa ctt ggg gta    5664 
Pro Gly Glu Ile Asn Arg Val Ala Ser Cys Leu Arg Lys Leu Gly Val 
        1875                1880                1885 
cca ccc ttg cga gtc tgg aga cat cgg gcc agg agc gtc cgc gct agg    5712 
Pro Pro Leu Arg Val Trp Arg His Arg Ala Arg Ser Val Arg Ala Arg 
    1890                1895                1900 
cta ctg tcc cag ggg ggg agg gcc gcc act tgt ggc aag tac ctc ttc    5760 
Leu Leu Ser Gln Gly Gly Arg Ala Ala Thr Cys Gly Lys Tyr Leu Phe 
1905                1910                1915                1920 
aac tgg gca gtg aag acc aaa ctc aaa ctc act cca atc ccg gct gcg    5808 
Asn Trp Ala Val Lys Thr Lys Leu Lys Leu Thr Pro Ile Pro Ala Ala 
                1925                1930                1935 
tcc cag ctg gac ttg tcc ggc tgg ttc gtt gct ggt tac agc ggg gga    5856 
Ser Gln Leu Asp Leu Ser Gly Trp Phe Val Ala Gly Tyr Ser Gly Gly 
            1940                1945                1950 
gac ata tat cac agc ctg tct cgt gcc cga ccc cgc tgg ttc atg ctg    5904 
Asp Ile Tyr His Ser Leu Ser Arg Ala Arg Pro Arg Trp Phe Met Leu 
        1955                1960                1965 
tgc cta ctc cta ctt tct gta ggg gta ggc atc tac ctg ctc ccc aac    5952 
Cys Leu Leu Leu Leu Ser Val Gly Val Gly Ile Tyr Leu Leu Pro Asn 
    1970                1975                1980 
cga                                                                5955 
Arg 
1985 
<210>6 
<211>1984 
<212>PRT 
<213>人工序列 
<220> 
<223>NS序列 
<400>6 
Ala Pro Ile Thr Ala Tyr Ser Gln Gln Thr Arg Gly Leu Leu Gly Cys 
 1               5                  10                  15 
Ile Ile Thr Ser Leu Thr Gly Arg Asp Lys Asn Gln Val Glu Gly Glu 
            20                  25                  30 
Val Gln Val Val Ser Thr Ala Thr Gln Ser Phe Leu Ala Thr Cys Val 
        35                  40                  45 
Asn Gly Val Cys Trp Thr Val Tyr His Gly Ala Gly Ser Lys Thr Leu 
    50                  55                  60 
Ala Gly Pro Lys Gly Pro Ile Thr Gln Met Tyr Thr Asn Val Asp Gln 
65                  70                  75                  80 
Asp Leu Val Gly Trp Gln Ala Pro Pro Gly Ala Arg Ser Leu Thr Pro 
                85                  90                  95 
Cys Thr Cys Gly Ser Ser Asp Leu Tyr Leu Val Thr Arg His Ala Asp 
            100                 105                 110 
Val Ile Pro Val Arg Arg Arg Gly Asp Ser Arg Gly Ser Leu Leu Ser 
        115                 120                 125 
Pro Arg Pro Val Ser Tyr Leu Lys Gly Ser Ser Gly Gly Pro Leu Leu 
    130                 135                 140 
Cys Pro Ser Gly His Ala Val Gly Ile Phe Arg Ala Ala Val Cys Thr 
145                 150                 155                 160 
Arg Gly Val Ala Lys Ala Val Asp Phe Val Pro Val Glu Ser Met Glu 
                165                 170                 175 
Thr Thr Met Arg Ser Pro Val Phe Thr Asp Asn Ser Ser Pro Pro Ala 
            180                 185                 190 
Val Pro Gln Ser Phe Gln Val Ala His Leu His Ala Pro Thr Gly Ser 
        195                 200                 205 
Gly Lys Ser Thr Lys Val Pro Ala Ala Tyr Ala Ala Gln Gly Tyr Lys 
    210                 215                 220 
Val Leu Val Leu Asn Pro Ser Val Ala Ala Thr Leu Gly Phe Gly Ala 
225                 230                 235                 240 
Tyr Met Ser Lys Ala His Gly Ile Asp Pro Asn Ile Arg Thr Gly Val 
                245                 250                 255 
Arg Thr Ile Thr Thr Gly Ala Pro Val Thr Tyr Ser Thr Tyr Gly Lys 
            260                 265                 270 
Phe Leu Ala Asp Gly Gly Cys Ser Gly Gly Ala Tyr Asp Ile Ile Ile 
        275                 280                 285 
Cys Asp Glu Cys His Ser Thr Asp Ser Thr Thr Ile Leu Gly Ile Gly 
    290                 295                 300 
Thr Val Leu Asp Gln Ala Glu Thr Ala Gly Ala Arg Leu Val Val Leu 
305                 310                 315                 320 
Ala Thr Ala Thr Pro Pro Gly Ser Val Thr Val Pro His Pro Asn Ile 
                325                 330                 335 
Glu Glu Val Ala Leu Ser Asn Thr Gly Glu Ile Pro Phe Tyr Gly Lys 
            340                 345                 350 
Ala Ile Pro Ile Glu Ala Ile Arg Gly Gly Arg His Leu Ile Phe Cys 
        355                 360                 365 
His Ser Lys Lys Lys Cys Asp Glu Leu Ala Ala Lys Leu Ser Gly Leu 
    370                 375                 380 
Gly Ile Asn Ala Val Ala Tyr Tyr Arg Gly Leu Asp Val Ser Val Ile 
385                 390                 395                 400 
Pro Thr Ile Gly Asp Val Val Val Val Ala Thr Asp Ala Leu Met Thr 
                405                 410                 415 
Gly Tyr Thr Gly Asp Phe Asp Ser Val Ile Asp Cys Asn Thr Cys Val 
            420                 425                 430 
Thr Gln Thr Val Asp Phe Ser Leu Asp Pro Thr Phe Thr Ile Glu Thr 
        435                 440                 445 
Thr Thr Val Pro Gln Asp Ala Val Ser Arg Ser Gln Arg Arg Gly Arg 
    450                 455                 460 
Thr Gly Arg Gly Arg Arg Gly Ile Tyr Arg Phe Val Thr Pro Gly Glu 
465                 470                 475                 480 
Arg Pro Ser Gly Met Phe Asp Ser Ser Val Leu Cys Glu Cys Tyr Asp 
                485                 490                 495 
Ala Gly Cys Ala Trp Tyr Glu Leu Thr Pro Ala Glu Thr Ser Val Arg 
            500                 505                 510 
Leu Arg Ala Tyr Leu Asn Thr Pro Gly Leu Pro Val Cys Gln Asp His 
        515                 520                 525 
Leu Glu Phe Trp Glu Ser Val Phe Thr Gly Leu Thr His Ile Asp Ala 
    530                 535                 540 
His Phe Leu Ser Gln Thr Lys Gln Ala Gly Asp Asn Phe Pro Tyr Leu 
545                 550                 555                 560 
Val Ala Tyr Gln Ala Thr Val Cys Ala Arg Ala Gln Ala Pro Pro Pro 
                565                 570                 575 
Ser Trp Asp Gln Met Trp Lys Cys Leu Ile Arg Leu Lys Pro Thr Leu 
            580                 585                 590 
His Gly Pro Thr Pro Leu Leu Tyr Arg Leu Gly Ala Val Gln Asn Glu 
        595                 600                 605 
Val Thr Leu Thr His Pro Ile Thr Lys Tyr Ile Met Ala Cys Met Ser 
    610                 615                 620 
Ala Asp Leu Glu Val Val Thr Ser Thr Trp Val Leu Val Gly Gly Val 
625                 630                 635                 640 
Leu Ala Ala Leu Ala Ala Tyr Cys Leu Thr Thr Gly Ser Val Val Ile 
                645                 650                 655 
Val Gly Arg Ile Ile Leu Ser Gly Arg Pro Ala Ile Val Pro Asp Arg 
            660                 665                 670 
Glu Phe Leu Tyr Gln Glu Phe Asp Glu Met Glu Glu Cys Ala Ser His 
        675                 680                 685 
Leu Pro Tyr Ile Glu Gln Gly Met Gln Leu Ala Glu Gln Phe Lys Gln 
    690                 695                 700 
Lys Ala Leu Gly Leu Leu Gln Thr Ala Thr Lys Gln Ala Glu Ala Ala 
705                 710                 715                 720 
Ala Pro Val Val Glu Ser Lys Trp Arg Ala Leu Glu Thr Phe Trp Ala 
                725                 730                 735 
Lys His Met Trp Asn Phe Ile Ser Gly Ile Gln Tyr Leu Ala Gly Leu 
            740                 745                 750 
Ser Thr Leu Pro Gly Asn Pro Ala Ile Ala Ser Leu Met Ala Phe Thr 
        755                 760                 765 
Ala Ser Ile Thr Ser Pro Leu Thr Thr Gln Ser Thr Leu Leu Phe Asn 
    770                 775                 780 
Ile Leu Gly Gly Trp Val Ala Ala Gln Leu Ala Pro Pro Ser Ala Ala 
785                 790                 795                 800 
Ser Ala Phe Val Gly Ala Gly Ile Ala Gly Ala Ala Val Gly Ser Ile 
                805                 810                 815 
Gly Leu Gly Lys Val Leu Val Asp Ile Leu Ala Gly Tyr Gly Ala Gly 
            820                 825                 830 
Val Ala Gly Ala Leu Val Ala Phe Lys Val Met Ser Gly Glu Met Pro 
        835                 840                 845 
Ser Thr Glu Asp Leu Val Asn Leu Leu Pro Ala Ile Leu Ser Pro Gly 
    850                 855                 860 
Ala Leu Val Val Gly Val Val Cys Ala Ala Ile Leu Arg Arg His Val 
865                 870                 875                 880 
Gly Pro Gly Glu Gly Ala Val Gln Trp Met Asn Arg Leu Ile Ala Phe 
                885                 890                 895 
Ala Ser Arg Gly Asn His Val Ser Pro Thr His Tyr Val Pro Glu Ser 
            900                 905                 910 
Asp Ala Ala Ala Arg Val Thr Gln Ile Leu Ser Ser Leu Thr Ile Thr 
        915                 920                 925 
Gln Leu Leu Lys Arg Leu His Gln Trp Ile Asn Glu Asp Cys Ser Thr 
    930                 935                 940 
Pro Cys Ser Gly Ser Trp Leu Arg Asp Val Trp Asp Trp Ile Cys Thr 
945                 950                 955                 960 
Val Leu Thr Asp Phe Lys Thr Trp Leu Gln Ser Lys Leu Leu Pro Gln 
                965                 970                 975 
Leu Pro Gly Val Pro Phe Phe Ser Cys Gln Arg Gly Tyr Lys Gly Val 
            980                 985                 990 
Trp Arg Gly Asp Gly Ile Met Gln Thr Thr Cys Pro Cys Gly Ala Gln 
        995                 1000                1005 
Ile Thr Gly His Val Lys Asn Gly Ser Met Arg Ile Val Gly Pro Lys 
    1010                1015                1020 
Thr Cys Ser Asn Thr Trp His Gly Thr Phe Pro Ile Asn Ala Tyr Thr 
1025                1030                1035                1040 
Thr Gly Pro Cys Thr Pro Ser Pro Ala Pro Asn Tyr Ser Arg Ala Leu 
                1045                1050                1055 
Trp Arg Val Ala Ala Glu Glu Tyr Val Glu Val Thr Arg Val Gly Asp 
            1060                1065                1070 
Phe His Tyr Val Thr Gly Met Thr Thr Asp Asn Val Lys Cys Pro Cys 
        1075                1080                1085 
Gln Val Pro Ala Pro Glu Phe Phe Thr Glu Val Asp Gly Val Arg Leu 
    1090                1095                1100 
His Arg Tyr Ala Pro Ala Cys Arg Pro Leu Leu Arg Glu Glu Val Thr 
1105                1110                1115                1120 
Phe Gln Val Gly Leu Asn Gln Tyr Leu Val Gly Ser Gln Leu Pro Cys 
                1125                1130                1135 
Glu Pro Glu Pro Asp Val Ala Val Leu Thr Ser Met Leu Thr Asp Pro 
            1140                1145                1150 
Ser His Ile Thr Ala Glu Thr Ala Lys Arg Arg Leu Ala Arg Gly Ser 
        1155                1160                1165 
Pro Pro Ser Leu Ala Ser Ser Ser Ala Ser Gln Leu Ser Ala Pro Ser 
    1170                1175                1180 
Leu Lys Ala Thr Cys Thr Thr His His Val Ser Pro Asp Ala Asp Leu 
1185                1190                1195                1200 
Ile Glu Ala Asn Leu Leu Trp Arg Gln Glu Met Gly Gly Asn Ile Thr 
                1205                1210                1215 
Arg Val Glu Ser Glu Asn Lys Val Val Val Leu Asp Ser Phe Asp Pro 
            1220                1225                1230 
Leu Arg Ala Glu Glu Asp Glu Arg Glu Val Ser Val Pro Ala Glu Ile 
        1235                1240                1245 
Leu Arg Lys Ser Lys Lys Phe Pro Ala Ala Met Pro Ile Trp Ala Arg 
    1250                1255                1260 
Pro Asp Tyr Asn Pro Pro Leu Leu Glu Ser Trp Lys Asp Pro Asp Tyr 
1265                1270                1275                1280 
Val Pro Pro Val Val His Gly Cys Pro Leu Pro Pro Ile Lys Ala Pro 
                1285                1290                1295 
Pro Ile Pro Pro Pro Arg Arg Lys Arg Thr Val Val Leu Thr Glu Ser 
            1300                1305                1310 
Ser Val Ser Ser Ala Leu Ala Glu Leu Ala Thr Lys Thr Phe Gly Ser 
        1315                1320                1325 
Ser Glu Ser Ser Ala Val Asp Ser Gly Thr Ala Thr Ala Leu Pro Asp 
    1330                1335                1340 
Gln Ala Ser Asp Asp Gly Asp Lys Gly Ser Asp Val Glu Ser Tyr Ser 
1345                1350                1355                1360 
Ser Met Pro Pro Leu Glu Gly Glu Pro Gly Asp Pro Asp Leu Ser Asp 
                1365                1370                1375 
Gly Ser Trp Ser Thr Val Ser Glu Glu Ala Ser Glu Asp Val Val Cys 
            1380                1385                1390 
Cys Ser Met Ser Tyr Thr Trp Thr Gly Ala Leu Ile Thr Pro Cys Ala 
        1395                1400                1405 
Ala Glu Glu Ser Lys Leu Pro Ile Asn Ala Leu Ser Asn Ser Leu Leu 
    1410                1415                1420 
Arg His His Asn Met Val Tyr Ala Thr Thr Ser Arg Ser Ala Gly Leu 
1425                1430                1435                1440 
Arg Gln Lys Lys Val Thr Phe Asp Arg Leu Gln Val Leu Asp Asp His 
                1445                1450                1455 
Tyr Arg Asp Val Leu Lys Glu Met Lys Ala Lys Ala Ser Thr Val Lys 
            1460                1465                1470 
Ala Lys Leu Leu Ser Val Glu Glu Ala Cys Lys Leu Thr Pro Pro His 
        1475                1480                1485 
Ser Ala Lys Ser Lys Phe Gly Tyr Gly Ala Lys Asp Val Arg Asn Leu 
    1490                1495                1500 
Ser Ser Lys Ala Val Asn His Ile His Ser Val Trp Lys Asp Leu Leu 
1505                1510                1515                1520 
Glu Asp Thr Val Thr Pro Ile Asp Thr Thr Ile Met Ala Lys Asn Glu 
                1525                1530                1535 
Val Phe Cys Val Gln Pro Glu Lys Gly Gly Arg Lys Pro Ala Arg Leu 
            1540                1545                1550 
Ile Val Phe Pro Asp Leu Gly Val Arg Val Cys Glu Lys Met Ala Leu 
        1555                1560                1565 
Tyr Asp Val Val Ser Thr Leu Pro Gln Val Val Met Gly Ser Ser Tyr 
    1570                1575                1580 
Gly Phe Gln Tyr Ser Pro Gly Gln Arg Val Glu Phe Leu Val Asn Thr 
1585                1590                1595                1600 
Trp Lys Ser Lys Lys Asn Pro Met Gly Phe Ser Tyr Asp Thr Arg Cys 
                1605                1610                1615 
Phe Asp Ser Thr Val Thr Glu Asn Asp Ile Arg Val Glu Glu Ser Ile 
            1620                1625                1630 
Tyr Gln Cys Cys Asp Leu Ala Pro Glu Ala Arg Gln Ala Ile Lys Ser 
        1635                1640                1645 
Leu Thr Glu Arg Leu Tyr Ile Gly Gly Pro Leu Thr Asn Ser Lys Gly 
    1650                1655                1660 
Gln Asn Cys Gly Tyr Arg Arg Cys Arg Ala Ser Gly Val Leu Thr Thr 
1665                1670                1675                1680 
Ser Cys Gly Asn Thr Leu Thr Cys Tyr Leu Lys Ala Ser Ala Ala Cys 
                1685                1690                1695 
Arg Ala Ala Lys Leu Gln Asp Cys Thr Met Leu Val Asn Gly Asp Asp 
            1700                1705                1710 
Leu Val Val Ile Cys Glu Ser Ala Gly Thr Gln Glu Asp Ala Ala Ser 
        1715                1720                1725 
Leu Arg Val Phe Thr Glu Ala Met Thr Arg Tyr Ser Ala Pro Pro Gly 
    1730                1735                1740 
Asp Pro Pro Gln Pro Glu Tyr Asp Leu Glu Leu Ile Thr Ser Cys Ser 
1745                1750                1755                1760 
Ser Asn Val Ser Val Ala His Asp Ala Ser Gly Lys Arg Val Tyr Tyr 
                1765                1770                1775 
Leu Thr Arg Asp Pro Thr Thr Pro Leu Ala Arg Ala Ala Trp Glu Thr 
            1780                1785                1790 
Ala Arg His Thr Pro Val Asn Ser Trp Leu Gly Asn Ile Ile Met Tyr 
        1795                1800                1805 
Ala Pro Thr Leu Trp Ala Arg Met Ile Leu Met Thr His Phe Phe Ser 
    1810                1815                1820 
Ile Leu Leu Ala Gln Glu Gln Leu Glu Lys Ala Leu Asp Cys Gln Ile 
1825                1830                1835                1840 
Tyr Gly Ala Cys Tyr Ser Ile Glu Pro Leu Asp Leu Pro Gln Ile Ile 
                1845                1850                1855 
Glu Arg Leu His Gly Leu Ser Ala Phe Ser Leu His Ser Tyr Ser Pro 
            1860                1865                1870 
Gly Glu Ile Asn Arg Val Ala Ser Cys Leu Arg Lys Leu Gly Val Pro 
        1875                1880                1885 
Pro Leu Arg Val Trp Arg His Arg Ala Arg Ser Val Arg Ala Arg Leu 
    1890                1895                1900 
Leu Ser Gln Gly Gly Arg Ala Ala Thr Cys Gly Lys Tyr Leu Phe Asn 
1905                1910                1915                1920 
Trp Ala Val Lys Thr Lys Leu Lys Leu Thr Pro Ile Pro Ala Ala Ser 
                1925                1930                1935 
Gln Leu Asp Leu Ser Gly Trp Phe Val Ala Gly Tyr Ser Gly Gly Asp 
            1940                1945                1950 
Ile Tyr His Ser Leu Ser Arg Ala Arg Pro Arg Trp Phe Met Leu Cys 
        1955                1960                1965 
Leu Leu Leu Leu Ser Val Gly Val Gly Ile Tyr Leu Leu Pro Asn Arg 
    1970                1975                1980 
<210>7 
<211>4909 
<212>DNA 
<213>人工序列 
<220> 
<223>pV1J核酸 
<400>7 
tcgcgcgttt cggtgatgac ggtgaaaacc tctgacacat gcagctcccg gagacggtca     60 
cagcttgtct gtaagcggat gccgggagca gacaagcccg tcagggcgcg tcagcgggtg    120 
ttggcgggtg tcggggctgg cttaactatg cggcatcaga gcagattgta ctgagagtgc    180 
accatatgcg gtgtgaaata ccgcacagat gcgtaaggag aaaataccgc atcagattgg    240 
ctattggcca ttgcatacgt tgtatccata tcataatatg tacatttata ttggctcatg    300 
tccaacatta ccgccatgtt gacattgatt attgactagt tattaatagt aatcaattac    360 
ggggtcatta gttcatagcc catatatgga gttccgcgtt acataactta cggtaaatgg    420 
cccgcctggc tgaccgccca acgacccccg cccattgacg tcaataatga cgtatgttcc    480 
catagtaacg ccaataggga ctttccattg acgtcaatgg gtggagtatt tacggtaaac    540 
tgcccacttg gcagtacatc aagtgtatca tatgccaagt acgcccccta ttgacgtcaa    600 
tgacggtaaa tggcccgcct ggcattatgc ccagtacatg accttatggg actttcctac    660 
ttggcagtac atctacgtat tagtcatcgc tattaccatg gtgatgcggt tttggcagta    720 
catcaatggg cgtggatagc ggtttgactc acggggattt ccaagtctcc accccattga    780 
cgtcaatggg agtttgtttt ggcaccaaaa tcaacgggac tttccaaaat gtcgtaacaa    840 
ctccgcccca ttgacgcaaa tgggcggtag gcgtgtacgg tgggaggtct atataagcag    900 
agctcgttta gtgaaccgtc agatcgcctg gagacgccat ccacgctgtt ttgacctcca    960 
tagaagacac cgggaccgat ccagcctccg cggccgggaa cggtgcattg gaacgcggat   1020 
tccccgtgcc aagagtgacg taagtaccgc ctatagactc tataggcaca cccctttggc   1080 
tcttatgcat gctatactgt ttttggcttg gggcctatac acccccgctt ccttatgcta   1140 
taggtgatgg tatagcttag cctataggtg tgggttattg accattattg accactcccc    1200 
tattggtgac gatactttcc attactaatc cataacatgg ctctttgcca caactatctc    1260 
tattggctat atgccaatac tctgtccttc agagactgac acggactctg tatttttaca    1320 
ggatggggtc ccatttatta tttacaaatt cacatataca acaacgccgt cccccgtgcc    1380 
cgcagttttt attaaacata gcgtgggatc tccacgcgaa tctcgggtac gtgttccgga    1440 
catgggctct tctccggtag cggcggagct tccacatccg agccctggtc ccatgcctcc    1500 
agcggctcat ggtcgctcgg cagctccttg ctcctaacag tggaggccag acttaggcac    1560 
agcacaatgc ccaccaccac cagtgtgccg cacaaggccg tggcggtagg gtatgtgtct    1620 
gaaaatgagc gtggagattg ggctcgcacg gctgacgcag atggaagact taaggcagcg    1680 
gcagaagaag atgcaggcag ctgagttgtt gtattctgat aagagtcaga ggtaactccc    1740 
gttgcggtgc tgttaacggt ggagggcagt gtagtctgag cagtactcgt tgctgccgcg    1800 
cgcgccacca gacataatag ctgacagact aacagactgt tcctttccat gggtcttttc    1860 
tgcagtcacc gtccttagat ctaggtacca gatatcagaa ttcagtcgac agcggccgcg    1920 
atctgctgtg ccttctagtt gccagccatc tgttgtttgc ccctcccccg tgccttcctt    1980 
gaccctggaa ggtgccactc ccactgtcct ttcctaataa aatgaggaaa ttgcatcgca    2040 
ttgtctgagt aggtgtcatt ctattctggg gggtggggtg gggcaggaca gcaaggggga    2100 
ggattgggaa gacaatagca ggcatgctgg ggatgcggtg ggctctatgg ccgctgcggc    2160 
caggtgctga agaattgacc cggttcctcc tgggccagaa agaagcaggc acatcccctt    2220 
ctctgtgaca caccctgtcc acgcccctgg ttcttagttc cagccccact cataggacac    2280 
tcatagctca ggagggctcc gccttcaatc ccacccgcta aagtacttgg agcggtctct    2340 
ccctccctca tcagcccacc aaaccaaacc tagcctccaa gagtgggaag aaattaaagc    2400 
aagataggct attaagtgca gagggagaga aaatgcctcc aacatgtgag gaagtaatga    2460 
gagaaatcat agaatttctt ccgcttcctc gctcactgac tcgctgcgct cggtcgttcg    2520 
gctgcggcga gcggtatcag ctcactcaaa ggcggtaata cggttatcca cagaatcagg    2580 
ggataacgca ggaaagaaca tgtgagcaaa aggccagcaa aaggccagga accgtaaaaa    2640 
ggccgcgttg ctggcgtttt tccataggct ccgcccccct gacgagcatc acaaaaatcg    2700 
acgctcaagt cagaggtggc gaaacccgac aggactataa agataccagg cgtttccccc    2760 
tggaagctcc ctcgtgcgct ctcctgttcc gaccctgccg cttaccggat acctgtccgc    2820 
ctttctccct tcgggaagcg tggcgctttc tcatagctca cgctgtaggt atctcagttc    2880 
ggtgtaggtc gttcgctcca agctgggctg tgtgcacgaa ccccccgttc agcccgaccg    2940 
ctgcgcctta tccggtaact atcgtcttga gtccaacccg gtaagacacg acttatcgcc    3000 
actggcagca gccactggta acaggattag cagagcgagg tatgtaggcg gtgctacaga    3060 
gttcttgaag tggtggccta actacggcta cactagaaga acagtatttg gtatctgcgc    3120 
tctgctgaag ccagttacct tcggaaaaag agttggtagc tcttgatccg gcaaacaaac    3180 
caccgctggt agcggtggtt tttttgtttg caagcagcag attacgcgca gaaaaaaagg    3240 
atctcaagaa gatcctttga tcttttctac ggggtctgac gctcagtgga acgaaaactc    3300 
acgttaaggg attttggtca tgagattatc aaaaaggatc ttcacctaga tccttttaaa    3360 
ttaaaaatga agttttaaat caatctaaag tatatatgag taaacttggt ctgacagtta    3420 
ccaatgctta atcagtgagg cacctatctc agcgatctgt ctatttcgtt catccatagt    3480 
tgcctgactc gggggggggg ggcgctgagg tctgcctcgt gaagaaggtg ttgctgactc    3540 
ataccaggcc tgaatcgccc catcatccag ccagaaagtg agggagccac ggttgatgag    3600 
agctttgttg taggtggacc agttggtgat tttgaacttt tgctttgcca cggaacggtc    3660 
tgcgttgtcg ggaagatgcg tgatctgatc cttcaactca gcaaaagttc gatttattca    3720 
acaaagccgc cgtcccgtca agtcagcgta atgctctgcc agtgttacaa ccaattaacc    3780 
aattctgatt agaaaaactc atcgagcatc aaatgaaact gcaatttatt catatcagga    3840 
ttatcaatac catatttttg aaaaagccgt ttctgtaatg aaggagaaaa ctcaccgagg    3900 
cagttccata ggatggcaag atcctggtat cggtctgcga ttccgactcg tccaacatca    3960 
atacaaccta ttaatttccc ctcgtcaaaa ataaggttat caagtgagaa atcaccatga    4020 
gtgacgactg aatccggtga gaatggcaaa agcttatgca tttctttcca gacttgttca    4080 
acaggccagc cattacgctc gtcatcaaaa tcactcgcat caaccaaacc gttattcatt    4140 
cgtgattgcg cctgagcgag acgaaatacg cgatcgctgt taaaaggaca attacaaaca    4200 
ggaatcgaat gcaaccggcg caggaacact gccagcgcat caacaatatt ttcacctgaa    4260 
tcaggatatt cttctaatac ctggaatgct gttttcccgg ggatcgcagt ggtgagtaac    4320 
catgcatcat caggagtacg gataaaatgc ttgatggtcg gaagaggcat aaattccgtc    4380 
agccagttta gtctgaccat ctcatctgta acatcattgg caacgctacc tttgccatgt    4440 
ttcagaaaca actctggcgc atcgggcttc ccatacaatc gatagattgt cgcacctgat    4500 
tgcccgacat tatcgcgagc ccatttatac ccatataaat cagcatccat gttggaattt 4560 
aatcgcggcc tcgagcaaga cgtttcccgt tgaatatggc tcataacacc ccttgtatta 4620 
ctgtttatgt aagcagacag ttttattgtt catgatgata tatttttatc ttgtgcaatg 4680 
taacatcaga gattttgaga cacaacgtgg ctttcccccc ccccccatta ttgaagcatt 4740 
tatcagggtt attgtctcat gagcggatac atatttgaat gtatttagaa aaataaacaa 4800 
ataggggttc cgcgcacatt tccccgaaaa gtgccacctg acgtctaaga aaccattatt 4860 
atcatgacat taacctataa aaataggcgt atcacgaggc cctttcgtc             4909 
<210>8 
<211>35935 
<212>DNA 
<213>腺病毒血清型6 
<400>8 
catcatcaat aatatacctt attttggatt gaagccaata tgataatgag ggggtggagt     60 
ttgtgacgtg gcgcggggcg tgggaacggg gcgggtgacg tagtagtgtg gcggaagtgt    120 
gatgttgcaa gtgtggcgga acacatgtaa gcgacggatg tggcaaaagt gacgtttttg    180 
gtgtgcgccg gtgtacacag gaagtgacaa ttttcgcgcg gttttaggcg gatgttgtag    240 
taaatttggg cgtaaccgag taagatttgg ccattttcgc gggaaaactg aataagagga    300 
agtgaaatct gaataatttt gtgttactca tagcgcgtaa tatttgtcta gggccgcggg    360 
gactttgacc gtttacgtgg agactcgccc aggtgttttt ctcaggtgtt ttccgcgttc    420 
cgggtcaaag ttggcgtttt attattatag tcagctgacg tgtagtgtat ttatacccgg    480 
tgagttcctc aagaggccac tcttgagtgc cagcgagtag agttttctcc tccgagccgc    540 
tccgacaccg ggactgaaaa tgagacatat tatctgccac ggaggtgtta ttaccgaaga    600 
aatggccgcc agtcttttgg accagctgat cgaagaggta ctggctgata atcttccacc    660 
tcctagccat tttgaaccac ctacccttca cgaactgtat gatttagacg tgacggcccc    720 
cgaagatccc aacgaggagg cggtttcgca gatttttccc gactctgtaa tgttggcggt    780 
gcaggaaggg attgacttac tcacttttcc gccggcgccc ggttctccgg agccgcctca    840 
cctttcccgg cagcccgagc agccggagca gagagccttg ggtccggttt ctatgccaaa    900 
ccttgtaccg gaggtgatcg atcttacctg ccacgaggct ggctttccac ccagtgacga    960 
cgaggatgaa gagggtgagg agtttgtgtt agattatgtg gagcaccccg ggcacggttg    1020 
caggtcttgt cattatcacc ggaggaatac gggggaccca gatattatgt gttcgctttg    1080 
ctatatgagg acctgtggca tgtttgtcta cagtaagtga aaattatggg cagtgggtga    1140 
tagagtggtg ggtttggtgt ggtaattttt tttttaattt ttacagtttt gtggtttaaa    1200 
gaattttgta ttgtgatttt tttaaaaggt cctgtgtctg aacctgagcc tgagcccgag    1260 
ccagaaccgg agcctgcaag acctacccgc cgtcctaaaa tggcgcctgc tatcctgaga    1320 
cgcccgacat cacctgtgtc tagagaatgc aatagtagta cggatagctg tgactccggt    1380 
ccttctaaca cacctcctga gatacacccg gtggtcccgc tgtgccccat taaaccagtt    1440 
gccgtgagag ttggtgggcg tcgccaggct gtggaatgta tcgaggactt gcttaacgag    1500 
cctgggcaac ctttggactt gagctgtaaa cgccccaggc cataaggtgt aaacctgtga    1560 
ttgcgtgtgt ggttaacgcc tttgtttgct gaatgagttg atgtaagttt aataaagggt    1620 
gagataatgt ttaacttgca tggcgtgtta aatggggcgg ggcttaaagg gtatataatg    1680 
cgccgtgggc taatcttggt tacatctgac ctcatggagg cttgggagtg tttggaagat    1740 
ttttctgctg tgcgtaactt gctggaacag agctctaaca gtacctcttg gttttggagg    1800 
tttctgtggg gctcatccca ggcaaagtta gtctgcagaa ttaaggagga ttacaagtgg    1860 
gaatttgaag agcttttgaa atcctgtggt gagctgtttg attctttgaa tctgggtcac    1920 
caggcgcttt tccaagagaa ggtcatcaag actttggatt tttccacacc ggggcgcgct    1980 
gcggctgctg ttgctttttt gagttttata aaggataaat ggagcgaaga aacccatctg    2040 
agcggggggt acctgctgga ttttctggcc atgcatctgt ggagagcggt tgtgagacac    2100 
aagaatcgcc tgctactgtt gtcttccgtc cgcccggcga taataccgac ggaggagcag    2160 
cagcagcagc aggaggaagc caggcggcgg cggcaggagc agagcccatg gaacccgaga    2220 
gccggcctgg accctcggga atgaatgttg tacaggtggc tgaactgtat ccagaactga    2280 
gacgcatttt gacaattaca gaggatgggc aggggctaaa gggggtaaag agggagcggg    2340 
gggcttgtga ggctacagag gaggctagga atctagcttt tagcttaatg accagacacc    2400 
gtcctgagtg tattactttt caacagatca aggataattg cgctaatgag cttgatctgc    2460 
tggcgcagaa gtattccata gagcagctga ccacttactg gctgcagcca ggggatgatt    2520 
ttgaggaggc tattagggta tatgcaaagg tggcacttag gccagattgc aagtacaaga    2580 
tcagcaaact tgtaaatatc aggaattgtt gctacatttc tgggaacggg gccgaggtgg    2640 
agatagatac ggaggatagg gtggccttta gatgtagcat gataaatatg tggccggggg    2700 
tgcttggcat ggacggggtg gttattatga atgtaaggtt tactggcccc aattttagcg    2760 
gtacggtttt cctggccaat accaacctta tcctacacgg tgtaagcttc tatgggttta    2820 
acaatacctg tgtggaagcc tggaccgatg taagggttcg gggctgtgcc ttttactgct    2880 
gctggaaggg ggtggtgtgt cgccccaaaa gcagggcttc aattaagaaa tgcctctttg    2940 
aaaggtgtac cttgggtatc ctgtctgagg gtaactccag ggtgcgccac aatgtggcct    3000 
ccgactgtgg ttgcttcatg ctagtgaaaa gcgtggctgt gattaagcat aacatggtat    3060 
gtggcaactg cgaggacagg gcctctcaga tgctgacctg ctcggacggc aactgtcacc    3120 
tgctgaagac cattcacgta gccagccact ctcgcaaggc ctggccagtg tttgagcata    3180 
acatactgac ccgctgttcc ttgcatttgg gtaacaggag gggggtgttc ctaccttacc    3240 
aatgcaattt gagtcacact aagatattgc ttgagcccga gagcatgtcc aaggtgaacc    3300 
tgaacggggt gtttgacatg accatgaaga tctggaaggt gctgaggtac gatgagaccc    3360 
gcaccaggtg cagaccctgc gagtgtggcg gtaaacatat taggaaccag cctgtgatgc    3420 
tggatgtgac cgaggagctg aggcccgatc acttggtgct ggcctgcacc cgcgctgagt    3480 
ttggctctag cgatgaagat acagattgag gtactgaaat gtgtgggcgt ggcttaaggg    3540 
tgggaaagaa tatataaggt gggggtctta tgtagttttg tatctgtttt gcagcagccg    3600 
ccgccgccat gagcaccaac tcgtttgatg gaagcattgt gagctcatat ttgacaacgc    3660 
gcatgccccc atgggccggg gtgcgtcaga atgtgatggg ctccagcatt gatggtcgcc    3720 
ccgtcctgcc cgcaaactct actaccttga cctacgagac cgtgtctgga acgccgttgg    3780 
agactgcagc ctccgccgcc gcttcagccg ctgcagccac cgcccgcggg attgtgactg    3840 
actttgcttt cctgagcccg cttgcaagca gtgcagcttc ccgttcatcc gcccgcgatg    3900 
acaagttgac ggctcttttg gcacaattgg attctttgac ccgggaactt aatgtcgttt    3960 
ctcagcagct gttggatctg cgccagcagg tttctgccct gaaggcttcc tcccctccca    4020 
atgcggttta aaacataaat aaaaaaccag actctgtttg gatttggatc aagcaagtgt    4080 
cttgctgtct ttatttaggg gttttgcgcg cgcggtaggc ccgggaccag cggtctcggt    4140 
cgttgagggt cctgtgtatt ttttccagga cgtggtaaag gtgactctgg atgttcagat    4200 
acatgggcat aagcccgtct ctggggtgga ggtagcacca ctgcagagct tcatgctgcg    4260 
gggtggtgtt gtagatgatc cagtcgtagc aggagcgctg ggcgtggtgc ctaaaaatgt    4320 
ctttcagtag caagctgatt gccaggggca ggcccttggt gtaagtgttt acaaagcggt    4380 
taagctggga tgggtgcata cgtggggata tgagatgcat cttggactgt atttttaggt    4440 
tggctatgtt cccagccata tccctccggg gattcatgtt gtgcagaacc accagcacag    4500 
tgtatccggt gcacttggga aatttgtcat gtagcttaga aggaaatgcg tggaagaact    4560 
tggagacgcc cttgtgacct ccaagatttt ccatgcattc gtccataatg atggcaatgg    4620 
gcccacgggc ggcggcctgg gcgaagatat ttctgggatc actaacgtca tagttgtgtt    4680 
ccaggatgag atcgtcatag gccattttta caaagcgcgg gcggagggtg ccagactgcg    4740 
gtataatggt tccatccggc ccaggggcgt agttaccctc acagatttgc atttcccacg    4800 
ctttgagttc agatgggggg atcatgtcta cctgcggggc gatgaagaaa acggtttccg    4860 
gggtagggga gatcagctgg gaagaaagca ggttcctgag cagctgcgac ttaccgcagc    4920 
cggtgggccc gtaaatcaca cctattaccg ggtgcaactg gtagttaaga gagctgcagc    4980 
tgccgtcatc cctgagcagg ggggccactt cgttaagcat gtccctgact cgcatgtttt    5040 
ccctgaccaa atccgccaga aggcgctcgc cgcccagcga tagcagttct tgcaaggaag    5100 
caaagttttt caacggtttg agaccgtccg ccgtaggcat gcttttgagc gtttgaccaa    5160 
gcagttccag gcggtcccac agctcggtca cctgctctac ggcatctcga tccagcatat    5220 
ctcctcgttt cgcgggttgg ggcggctttc gctgtacggc agtagtcggt gctcgtccag    5280 
acgggccagg gtcatgtctt tccacgggcg cagggtcctc gtcagcgtag tctgggtcac    5340 
ggtgaagggg tgcgctccgg gctgcgcgct ggccagggtg cgcttgaggc tggtcctgct    5400 
ggtgctgaag cgctgccggt cttcgccctg cgcgtcggcc aggtagcatt tgaccatggt    5460 
gtcatagtcc agcccctccg cggcgtggcc cttggcgcgc agcttgccct tggaggaggc    5520 
gccgcacgag gggcagtgca gacttttgag ggcgtagagc ttgggcgcga gaaataccga    5580 
ttccggggag taggcatccg cgccgcaggc cccgcagacg gtctcgcatt ccacgagcca    5640 
ggtgagctct ggccgttcgg ggtcaaaaac caggtttccc ccatgctttt tgatgcgttt    5700 
cttacctctg gtttccatga gccggtgtcc acgctcggtg acgaaaaggc tgtccgtgtc    5760 
cccgtataca gacttgagag gcctgtcctc gagcggtgtt ccgcggtcct cctcgtatag    5820 
aaactcggac cactctgaga caaaggctcg cgtccaggcc agcacgaagg aggctaagtg    5880 
ggaggggtag cggtcgttgt ccactagggg gtccactcgc tccagggtgt gaagacacat    5940 
gtcgccctct tcggcatcaa ggaaggtgat tggtttgtag gtgtaggcca cgtgaccggg    6000 
tgttcctgaa ggggggctat aaaagggggt gggggcgcgt tcgtcctcac tctcttccgc    6060 
atcgctgtct gcgagggcca gctgttgggg tgagtactcc ctctgaaaag cgggcatgac    6120 
ttctgcgcta agattgtcag tttccaaaaa cgaggaggat ttgatattca cctggcccgc    6180 
ggtgatgcct ttgagggtgg ccgcatccat ctggtcagaa aagacaatct ttttgttgtc    6240 
aagcttggtg gcaaacgacc cgtagagggc gttggacagc aacttggcga tggagcgcag    6300 
ggtttggttt ttgtcgcgat cggcgcgctc cttggccgcg atgtttagct gcacgtattc    6360 
gcgcgcaacg caccgccatt cgggaaagac ggtggtgcgc tcgtcgggca ccaggtgcac    6420 
gcgccaaccg cggttgtgca gggtgacaag gtcaacgctg gtggctacct ctccgcgtag    6480 
gcgctcgttg gtccagcaga ggcggccgcc cttgcgcgag cagaatggcg gtagggggtc    6540 
tagctgcgtc tcgtccgggg ggtctgcgtc cacggtaaag accccgggca gcaggcgcgc    6600 
gtcgaagtag tctatcttgc atccttgcaa gtctagcgcc tgctgccatg cgcgggcggc    6660 
aagcgcgcgc tcgtatgggt tgagtggggg accccatggc atggggtggg tgagcgcgga    6720 
ggcgtacatg ccgcaaatgt cgtaaacgta gaggggctct ctgagtattc caagatatgt    6780 
agggtagcat cttccaccgc ggatgctggc gcgcacgtaa tcgtatagtt cgtgcgaggg    6840 
agcgaggagg tcgggaccga ggttgctacg ggcgggctgc tctgctcgga agactatctg    6900 
cctgaagatg gcatgtgagt tggatgatat ggttggacgc tggaagacgt tgaagctggc    6960 
gtctgtgaga cctaccgcgt cacgcacgaa ggaggcgtag gagtcgcgca gcttgttgac    7020 
cagctcggcg gtgacctgca cgtctagggc gcagtagtcc agggtttcct tgatgatgtc    7080 
atacttatcc tgtccctttt ttttccacag ctcgcggttg aggacaaact cttcgcggtc    7140 
tttccagtac tcttggatcg gaaacccgtc ggcctccgaa cggtaagagc ctagcatgta    7200 
gaactggttg acggcctggt aggcgcagca tcccttttct acgggtagcg cgtatgcctg    7260 
cgcggccttc cggagcgagg tgtgggtgag cgcaaaggtg tccctgacca tgactttgag    7320 
gtactggtat ttgaagtcag tgtcgtcgca tccgccctgc tcccagagca aaaagtccgt    7380 
gcgctttttg gaacgcggat ttggcagggc gaaggtgaca tcgttgaaga gtatctttcc    7440 
cgcgcgaggc ataaagttgc gtgtgatgcg gaagggtccc ggcacctcgg aacggttgtt    7500 
aattacctgg gcggcgagca cgatctcgtc aaagccgttg atgttgtggc ccacaatgta    7560 
aagttccaag aagcgcggga tgcccttgat ggaaggcaat tttttaagtt cctcgtaggt    7620 
gagctcttca ggggagctga gcccgtgctc tgaaagggcc cagtctgcaa gatgagggtt    7680 
ggaagcgacg aatgagctcc acaggtcacg ggccattagc atttgcaggt ggtcgcgaaa    7740 
ggtcctaaac tggcgaccta tggccatttt ttctggggtg atgcagtaga aggtaagcgg    7800 
gtcttgttcc cagcggtccc atccaaggtt cgcggctagg tctcgcgcgg cagtcactag    7860 
aggctcatct ccgccgaact tcatgaccag catgaagggc acgagctgct tcccaaaggc    7920 
ccccatccaa gtataggtct ctacatcgta ggtgacaaag agacgctcgg tgcgaggatg    7980 
cgagccgatc gggaagaact ggatctcccg ccaccaattg gaggagtggc tattgatgtg    8040 
gtgaaagtag aagtccctgc gacgggccga acactcgtgc tggcttttgt aaaaacgtgc    8100 
gcagtactgg cagcggtgca cgggctgtac atcctgcacg aggttgacct gacgaccgcg    8160 
cacaaggaag cagagtggga atttgagccc ctcgcctggc gggtttggct ggtggtcttc    8220 
tacttcggct gcttgtcctt gaccgtctgg ctgctcgagg ggagttacgg tggatcggac    8280 
caccacgccg cgcgagccca aagtccagat gtccgcgcgc ggcggtcgga gcttgatgac    8340 
aacatcgcgc agatgggagc tgtccatggt ctggagctcc cgcggcgtca ggtcaggcgg    8400 
gagctcctgc aggtttacct cgcatagacg ggtcagggcg cgggctagat ccaggtgata    8460 
cctaatttcc aggggctggt tggtggcggc gtcgatggct tgcaagaggc cgcatccccg    8520 
cggcgcgact acggtaccgc gcggcgggcg gtgggccgcg ggggtgtcct tggatgatgc    8580 
atctaaaagc ggtgacgcgg gcgagccccc ggaggtaggg ggggctccgg acccgccggg    8640 
agagggggca ggggcacgtc ggcgccgcgc gcgggcagga gctggtgctg cgcgcgtagg    8700 
ttgctggcga acgcgacgac gcggcggttg atctcctgaa tctggcgcct ctgcgtgaag    8760 
acgacgggcc cggtgagctt gagcctgaaa gagagttcga cagaatcaat ttcggtgtcg    8820 
ttgacggcgg cctggcgcaa aatctcctgc acgtctcctg agttgtcttg ataggcgatc    8880 
tcggccatga actgctcgat ctcttcctcc tggagatctc cgcgtccggc tcgctccacg    8940 
gtggcggcga ggtcgttgga aatgcgggcc atgagctgcg agaaggcgtt gaggcctccc    9000 
tcgttccaga cgcggctgta gaccacgccc ccttcggcat cgcgggcgcg catgaccacc    9060 
tgcgcgagat tgagctccac gtgccgggcg aagacggcgt agtttcgcag gcgctgaaag    9120 
aggtagttga gggtggtggc ggtgtgttct gccacgaaga agtacataac ccagcgtcgc    9180 
aacgtggatt cgttgatatc ccccaaggcc tcaaggcgct ccatggcctc gtagaagtcc    9240 
acggcgaagt tgaaaaactg ggagttgcgc gccgacacgg ttaactcctc ctccagaaga    9300 
cggatgagct cggcgacagt gtcgcgcacc tcgcgctcaa aggctacagg ggcctcttct    9360 
tcttcttcaa tctcctcttc cataagggcc tccccttctt cttcttctgg cggcggtggg     9420 
ggagggggga cacggcggcg acgacggcgc accgggaggc ggtcgacaaa gcgctcgatc     9480 
atctccccgc ggcgacggcg catggtctcg gtgacggcgc ggccgttctc gcgggggcgc     9540 
agttggaaga cgccgcccgt catgtcccgg ttatgggttg gcggggggct gccatgcggc     9600 
agggatacgg cgctaacgat gcatctcaac aattgttgtg taggtactcc gccgccgagg     9660 
gacctgagcg agtccgcatc gaccggatcg gaaaacctct cgagaaaggc gtctaaccag     9720 
tcacagtcgc aaggtaggct gagcaccgtg gcgggcggca gcgggcggcg gtcggggttg     9780 
tttctggcgg aggtgctgct gatgatgtaa ttaaagtagg cggtcttgag acggcggatg     9840 
gtcgacagaa gcaccatgtc cttgggtccg gcctgctgaa tgcgcaggcg gtcggccatg     9900 
ccccaggctt cgttttgaca tcggcgcagg tctttgtagt agtcttgcat gagcctttct     9960 
accggcactt cttcttctcc ttcctcttgt cctgcatctc ttgcatctat cgctgcggcg    10020 
gcggcggagt ttggccgtag gtggcgccct cttcctccca tgcgtgtgac cccgaagccc    10080 
ctcatcggct gaagcagggc taggtcggcg acaacgcgct cggctaatat ggcctgctgc    10140 
acctgcgtga gggtagactg gaagtcatcc atgtccacaa agcggtggta tgcgcccgtg    10200 
ttgatggtgt aagtgcagtt ggccataacg gaccagttaa cggtctggtg acccggctgc    10260 
gagagctcgg tgtacctgag acgcgagtaa gccctcgagt caaatacgta gtcgttgcaa    10320 
gtccgcacca ggtactggta tcccaccaaa aagtgcggcg gcggctggcg gtagaggggc    10380 
cagcgtaggg tggccggggc tccgggggcg agatcttcca acataaggcg atgatatccg    10440 
tagatgtacc tggacatcca ggtgatgccg gcggcggtgg tggaggcgcg cggaaagtcg    10500 
cggacgcggt tccagatgtt gcgcagcggc aaaaagtgct ccatggtcgg gacgctctgg    10560 
ccggtcaggc gcgcgcaatc gttgacgctc tagaccgtgc aaaaggagag cctgtaagcg    10620 
ggcactcttc cgtggtctgg tggataaatt cgcaagggta tcatggcgga cgaccggggt    10680 
tcgagccccg tatccggccg tccgccgtga tccatgcggt taccgcccgc gtgtcgaacc    10740 
caggtgtgcg acgtcagaca acgggggagt gctccttttg gcttccttcc aggcgcggcg    10800 
gctgctgcgc tagctttttt ggccactggc cgcgcgcagc gtaagcggtt aggctggaaa    10860 
gcgaaagcat taagtggctc gctccctgta gccggagggt tattttccaa gggttgagtc    10920 
gcgggacccc cggttcgagt ctcggaccgg ccggactgcg gcgaacgggg gtttgcctcc    10980 
ccgtcatgca agaccccgct tgcaaattcc tccggaaaca gggacgagcc ccttttttgc    11040 
ttttcccaga tgcatccggt gctgcggcag atgcgccccc ctcctcagca gcggcaagag    11100 
caagagcagc ggcagacatg cagggcaccc tcccctcctc ctaccgcgtc aggaggggcg    11160 
acatccgcgg ttgacgcggc agcagatggt gattacgaac ccccgcggcg ccgggcccgg    11220 
cactacctgg acttggagga gggcgagggc ctggcgcggc taggagcgcc ctctcctgag    11280 
cggtacccaa gggtgcagct gaagcgtgat acgcgtgagg cgtacgtgcc gcggcagaac    11340 
ctgtttcgcg accgcgaggg agaggagccc gaggagatgc gggatcgaaa gttccacgca    11400 
gggcgcgagc tgcggcatgg cctgaatcgc gagcggttgc tgcgcgagga ggactttgag    11460 
cccgacgcgc gaaccgggat tagtcccgcg cgcgcacacg tggcggccgc cgacctggta    11520 
accgcatacg agcagacggt gaaccaggag attaactttc aaaaaagctt taacaaccac    11580 
gtgcgtacgc ttgtggcgcg cgaggaggtg gctataggac tgatgcatct gtgggacttt    11640 
gtaagcgcgc tggagcaaaa cccaaatagc aagccgctca tggcgcagct gttccttata    11700 
gtgcagcaca gcagggacaa cgaggcattc agggatgcgc tgctaaacat agtagagccc    11760 
gagggccgct ggctgctcga tttgataaac atcctgcaga gcatagtggt gcaggagcgc    11820 
agcttgagcc tggctgacaa ggtggccgcc atcaactatt ccatgcttag cctgggcaag    11880 
ttttacgccc gcaagatata ccatacccct tacgttccca tagacaagga ggtaaagatc    11940 
gaggggttct acatgcgcat ggcgctgaag gtgcttacct tgagcgacga cctgggcgtt    12000 
tatcgcaacg agcgcatcca caaggccgtg agcgtgagcc ggcggcgcga gctcagcgac    12060 
cgcgagctga tgcacagcct gcaaagggcc ctggctggca cgggcagcgg cgatagagag    12120 
gccgagtcct actttgacgc gggcgctgac ctgcgctggg ccccaagccg acgcgccctg    12180 
gaggcagctg gggccggacc tgggctggcg gtggcacccg cgcgcgctgg caacgtcggc    12240 
ggcgtggagg aatatgacga ggacgatgag tacgagccag aggacggcga gtactaagcg    12300 
gtgatgtttc tgatcagatg atgcaagacg caacggaccc ggcggtgcgg gcggcgctgc    12360 
agagccagcc gtccggcctt aactccacgg acgactggcg ccaggtcatg gaccgcatca    12420 
tgtcgctgac tgcgcgcaat cctgacgcgt tccggcagca gccgcaggcc aaccggctct    12480 
ccgcaattct ggaagcggtg gtcccggcgc gcgcaaaccc cacgcacgag aaggtgctgg    12540 
cgatcgtaaa cgcgctggcc gaaaacaggg ccatccggcc cgacgaggcc ggcctggtct    12600 
acgacgcgct gcttcagcgc gtggctcgtt acaacagcgg caacgtgcag accaacctgg    12660 
accggctggt gggggatgtg cgcgaggccg tggcgcagcg tgagcgcgcg cagcagcagg    12720 
gcaacctggg ctccatggtt gcactaaacg ccttcctgag tacacagccc gccaacgtgc    12780 
cgcggggaca ggaggactac accaactttg tgagcgcact gcggctaatg gtgactgaga    12840 
caccgcaaag tgaggtgtac cagtctgggc cagactattt tttccagacc agtagacaag    12900 
gcctgcagac cgtaaacctg agccaggctt tcaaaaactt gcaggggctg tggggggtgc    12960 
gggctcccac aggcgaccgc gcgaccgtgt ctagcttgct gacgcccaac tcgcgcctgt    13020 
tgctgctgct aatagcgccc ttcacggaca gtggcagcgt gtcccgggac acatacctag    13080 
gtcacttgct gacactgtac cgcgaggcca taggtcaggc gcatgtggac gagcatactt    13140 
tccaggagat tacaagtgtc agccgcgcgc tggggcagga ggacacgggc agcctggagg    13200 
caaccctaaa ctacctgctg accaaccggc ggcagaagat cccctcgttg cacagtttaa    13260 
acagcgagga ggagcgcatt ttgcgctacg tgcagcagag cgtgagcctt aacctgatgc    13320 
gcgacggggt aacgcccagc gtggcgctgg acatgaccgc gcgcaacatg gaaccgggca    13380 
tgtatgcctc aaaccggccg tttatcaacc gcctaatgga ctacttgcat cgcgcggccg    13440 
ccgtgaaccc cgagtatttc accaatgcca tcttgaaccc gcactggcta ccgccccctg    13500 
gtttctacac cgggggattc gaggtgcccg agggtaacga tggattcctc tgggacgaca    13560 
tagacgacag cgtgttttcc ccgcaaccgc agaccctgct agagttgcaa cagcgcgagc    13620 
aggcagaggc ggcgctgcga aaggaaagct tccgcaggcc aagcagcttg tccgatctag    13680 
gcgctgcggc cccgcggtca gatgctagta gcccatttcc aagcttgata gggtctctta    13740 
ccagcactcg caccacccgc ccgcgcctgc tgggcgagga ggagtaccta aacaactcgc    13800 
tgctgcagcc gcagcgcgaa aaaaacctgc ctccggcatt tcccaacaac gggatagaga    13860 
gcctagtgga caagatgagt agatggaaga cgtacgcgca ggagcacagg gacgtgccag    13920 
gcccgcgccc gcccacccgt cgtcaaaggc acgaccgtca gcggggtctg gtgtgggagg    13980 
acgatgactc ggcagacgac agcagcgtcc tggatttggg agggagtggc aacccgtttg    14040 
cgcaccttcg ccccaggctg gggagaatgt tttaaaaaaa aaaaagcatg atgcaaaata    14100 
aaaaactcac caaggccatg gcaccgagcg ttggttttct tgtattcccc ttagtatgcg    14160 
gcgcgcggcg atgtatgagg aaggtcctcc tccctcctac gagagtgtgg tgagcgcggc    14220 
gccagtggcg gcggcgctgg gttctccctt cgatgctccc ctggacccgc cgtttgtgcc    14280 
tccgcggtac ctgcggccta ccggggggag aaacagcatc cgttactctg agttggcacc    14340 
cctattcgac accacccgtg tgtacctggt ggacaacaag tcaacggatg tggcatccct    14400 
gaactaccag aacgaccaca gcaactttct gaccacggtc attcaaaaca atgactacag    14460 
cccgggggag gcaagcacac agaccatcaa tcttgacgac cggtcgcact ggggcggcga    14520 
cctgaaaacc atcctgcata ccaacatgcc aaatgtgaac gagttcatgt ttaccaataa    14580 
gtttaaggcg cgggtgatgg tgtcgcgctt gcctactaag gacaatcagg tggagctgaa    14640 
atacgagtgg gtggagttca cgctgcccga gggcaactac tccgagacca tgaccataga    14700 
ccttatgaac aacgcgatcg tggagcacta cttgaaagtg ggcagacaga acggggttct    14760 
ggaaagcgac atcggggtaa agtttgacac ccgcaacttc agactggggt ttgaccccgt    14820 
cactggtctt gtcatgcctg gggtatatac aaacgaagcc ttccatccag acatcatttt    14880 
gctgccagga tgcggggtgg acttcaccca cagccgcctg agcaacttgt tgggcatccg    14940 
caagcggcaa cccttccagg agggctttag gatcacctac gatgatctgg agggtggtaa    15000 
cattcccgca ctgttggatg tggacgccta ccaggcgagc ttgaaagatg acaccgaaca    15060 
gggcgggggt ggcgcaggcg gcagcaacag cagtggcagc ggcgcggaag agaactccaa    15120 
cgcggcagcc gcggcaatgc agccggtgga ggacatgaac gatcatgcca ttcgcggcga    15180 
cacctttgcc acacgggctg aggagaagcg cgctgaggcc gaagcagcgg ccgaagctgc    15240 
cgcccccgct gcgcaacccg aggtcgagaa gcctcagaag aaaccggtga tcaaacccct    15300 
gacagaggac agcaagaaac gcagttacaa cctaataagc aatgacagca ccttcaccca    15360 
gtaccgcagc tggtaccttg catacaacta cggcgaccct cagaccggaa tccgctcatg    15420 
gaccctgctt tgcactcctg acgtaacctg cggctcggag caggtctact ggtcgttgcc    15480 
agacatgatg caagaccccg tgaccttccg ctccacgcgc cagatcagca actttccggt    15540 
ggtgggcgcc gagctgttgc ccgtgcactc caagagcttc tacaacgacc aggccgtcta    15600 
ctcccaactc atccgccagt ttacctctct gacccacgtg ttcaatcgct ttcccgagaa    15660 
ccagattttg gcgcgcccgc cagcccccac catcaccacc gtcagtgaaa acgttcctgc    15720 
tctcacagat cacgggacgc taccgctgcg caacagcatc ggaggagtcc agcgagtgac    15780 
cattactgac gccagacgcc gcacctgccc ctacgtttac aaggccctgg gcatagtctc    15840 
gccgcgcgtc ctatcgagcc gcactttttg agcaagcatg tccatcctta tatcgcccag    15900 
caataacaca ggctggggcc tgcgcttccc aagcaagatg tttggcgggg ccaagaagcg    15960 
ctccgaccaa cacccagtgc gcgtgcgcgg gcactaccgc gcgccctggg gcgcgcacaa    16020 
acgcggccgc actgggcgca ccaccgtcga tgacgccatc gacgcggtgg tggaggaggc    16080 
gcgcaactac acgcccacgc cgccaccagt gtccacagtg gacgcggcca ttcagaccgt    16140 
ggtgcgcgga gcccggcgct atgctaaaat gaagagacgg cggaggcgcg tagcacgtcg    16200 
ccaccgccgc cgacccggca ctgccgccca acgcgcggcg gcggccctgc ttaaccgcgc    16260 
acgtcgcacc ggccgacggg cggccatgcg ggccgctcga aggctggccg cgggtattgt    16320 
cactgtgccc cccaggtcca ggcgacgagc ggccgccgca gcagccgcgg ccattagtgc    16380 
tatgactcag ggtcgcaggg gcaacgtgta ttgggtgcgc gactcggtta gcggcctgcg    16440 
cgtgcccgtg cgcacccgcc ccccgcgcaa ctagattgca agaaaaaact acttagactc    16500 
gtactgttgt atgtatccag cggcggcggc gcgcaacgaa gctatgtcca agcgcaaaat    16560 
caaagaagag atgctccagg tcatcgcgcc ggagatctat ggccccccga agaaggaaga    16620 
gcaggattac aagccccgaa agctaaagcg ggtcaaaaag aaaaagaaag atgatgatga    16680 
tgaacttgac gacgaggtgg aactgctgca cgctaccgcg cccaggcgac gggtacagtg    16740 
gaaaggtcga cgcgtaaaac gtgttttgcg acccggcacc accgtagtct ttacgcccgg    16800 
tgagcgctcc acccgcacct acaagcgcgt gtatgatgag gtgtacggcg acgaggacct    16860 
gcttgagcag gccaacgagc gcctcgggga gtttgcctac ggaaagcggc ataaggacat    16920 
gctggcgttg ccgctggacg agggcaaccc aacacctagc ctaaagcccg taacactgca    16980 
gcaggtgctg cccgcgcttg caccgtccga agaaaagcgc ggcctaaagc gcgagtctgg    17040 
tgacttggca cccaccgtgc agctgatggt acccaagcgc cagcgactgg aagatgtctt    17100 
ggaaaaaatg accgtggaac ctgggctgga gcccgaggtc cgcgtgcggc caatcaagca    17160 
ggtggcgccg ggactgggcg tgcagaccgt ggacgttcag atacccacta ccagtagcac    17220 
cagtattgcc accgccacag agggcatgga gacacaaacg tccccggttg cctcagcggt    17280 
ggcggatgcc gcggtgcagg cggtcgctgc ggccgcgtcc aagacctcta cggaggtgca    17340 
aacggacccg tggatgtttc gcgtttcagc cccccggcgc ccgcgcggtt cgaggaagta    17400 
cggcgccgcc agcgcgctac tgcccgaata tgccctacat ccttccattg cgcctacccc    17460 
cggctatcgt ggctacacct accgccccag aagacgagca actacccgac gccgaaccac    17520 
cactggaacc cgccgccgcc gtcgccgtcg ccagcccgtg ctggccccga tttccgtgcg    17580 
cagggtggct cgcgaaggag gcaggaccct ggtgctgcca acagcgcgct accaccccag    17640 
catcgtttaa aagccggtct ttgtggttct tgcagatatg gccctcacct gccgcctccg    17700 
tttcccggtg ccgggattcc gaggaagaat gcaccgtagg aggggcatgg ccggccacgg    17760 
cctgacgggc ggcatgcgtc gtgcgcacca ccggcggcgg cgcgcgtcgc accgtcgcat    17820 
gcgcggcggt atcctgcccc tccttattcc actgatcgcc gcggcgattg gcgccgtgcc    17880 
cggaattgca tccgtggcct tgcaggcgca gagacactga ttaaaaacaa gttgcatgtg    17940 
gaaaaatcaa aataaaaagt ctggactctc acgctcgctt ggtcctgtaa ctattttgta    18000 
gaatggaaga catcaacttt gcgtctctgg ccccgcgaca cggctcgcgc ccgttcatgg    18060 
gaaactggca agatatcggc accagcaata tgagcggtgg cgccttcagc tggggctcgc    18120 
tgtggagcgg cattaaaaat ttcggttcca ccgttaagaa ctatggcagc aaggcctgga    18180 
acagcagcac aggccagatg ctgagggata agttgaaaga gcaaaatttc caacaaaagg    18240 
tggtagatgg cctggcctct ggcattagcg gggtggtgga cctggccaac caggcagtgc    18300 
aaaataagat taacagtaag cttgatcccc gccctcccgt agaggagcct ccaccggccg    18360 
tggagacagt gtctccagag gggcgtggcg aaaagcgtcc gcgccccgac agggaagaaa    18420 
ctctggtgac gcaaatagac gagcctccct cgtacgagga ggcactaaag caaggcctgc    18480 
ccaccacccg tcccatcgcg cccatggcta ccggagtgct gggccagcac acacccgtaa    18540 
cgctggacct gcctcccccc gccgacaccc agcagaaacc tgtgctgcca ggcccgaccg    18600 
ccgttgttgt aacccgtcct agccgcgcgt ccctgcgccg cgccgccagc ggtccgcgat    18660 
cgttgcggcc cgtagccagt ggcaactggc aaagcacact gaacagcatc gtgggtctgg    18720 
gggtgcaatc cctgaagcgc cgacgatgct tctgaatagc taacgtgtcg tatgtgtgtc    18780 
atgtatgcgt ccatgtcgcc gccagaggag ctgctgagcc gccgcgcgcc cgctttccaa    18840 
gatggctacc ccttcgatga tgccgcagtg gtcttacatg cacatctcgg gccaggacgc    18900 
ctcggagtac ctgagccccg ggctggtgca gtttgcccgc gccaccgaga cgtacttcag    18960 
cctgaataac aagtttagaa accccacggt ggcgcctacg cacgacgtga ccacagaccg    19020 
gtcccagcgt ttgacgctgc ggttcatccc tgtggaccgt gaggatactg cgtactcgta    19080 
caaggcgcgg ttcaccctag ctgtgggtga taaccgtgtg ctggacatgg cttccacgta    19140 
ctttgacatc cgcggcgtgc tggacagggg ccctactttt aagccctact ctggcactgc    19200 
ctacaacgcc ctggctccca agggtgcccc aaatccttgc gaatgggatg aagctgctac    19260 
tgctcttgaa ataaacctag aagaagagga cgatgacaac gaagacgaag tagacgagca    19320 
agctgagcag caaaaaactc acgtatttgg gcaggcgcct tattctggta taaatattac    19380 
aaaggagggt attcaaatag gtgtcgaagg tcaaacacct aaatatgccg ataaaacatt    19440 
tcaacctgaa cctcaaatag gagaatctca gtggtacgaa actgaaatta atcatgcagc    19500 
tgggagagtc cttaaaaaga ctaccccaat gaaaccatgt tacggttcat atgcaaaacc    19560 
cacaaatgaa aatggagggc aaggcattct tgtaaagcaa caaaatggaa agctagaaag    19620 
tcaagtggaa atgcaatttt tctcaactac tgaggcgacc gcaggcaatg gtgataactt    19680 
gactcctaaa gtggtattgt acagtgaaga tgtagatata gaaaccccag acactcatat    19740 
ttcttacatg cccactatta aggaaggtaa ctcacgagaa ctaatgggcc aacaatctat    19800 
gcccaacagg cctaattaca ttgcttttag ggacaatttt attggtctaa tgtattacaa    19860 
cagcacgggt aatatgggtg ttctggcggg ccaagcatcg cagttgaatg ctgttgtaga    19920 
tttgcaagac agaaacacag agctttcata ccagcttttg cttgattcca ttggtgatag    19980 
aaccaggtac ttttctatgt ggaatcaggc tgttgacagc tatgatccag atgttagaat    20040 
tattgaaaat catggaactg aagatgaact tccaaattac tgctttccac tgggaggtgt    20100 
gattaataca gagactctta ccaaggtaaa acctaaaaca ggtcaggaaa atggatggga    20160 
aaaagatgct acagaatttt cagataaaaa tgaaataaga gttggaaata attttgccat    20220 
ggaaatcaat ctaaatgcca acctgtggag aaatttcctg tactccaaca tagcgctgta    20280 
tttgcccgac aagctaaagt acagtccttc caacgtaaaa atttctgata acccaaacac    20340 
ctacgactac atgaacaagc gagtggtggc tcccgggtta gtggactgct acattaacct    20400 
tggagcacgc tggtcccttg actatatgga caacgtcaac ccatttaacc accaccgcaa    20460 
tgctggcctg cgctaccgct caatgttgct gggcaatggt cgctatgtgc ccttccacat    20520 
ccaggtgcct cagaagttct ttgccattaa aaacctcctt ctcctgccgg gctcatacac    20580 
ctacgagtgg aacttcagga aggatgttaa catggttctg cagagctccc taggaaatga    20640 
cctaagggtt gacggagcca gcattaagtt tgatagcatt tgcctttacg ccaccttctt    20700 
ccccatggcc cacaacaccg cctccacgct tgaggccatg cttagaaacg acaccaacga    20760 
ccagtccttt aacgactatc tctccgccgc caacatgctc taccctatac ccgccaacgc    20820 
taccaacgtg cccatatcca tcccctcccg caactgggcg gctttccgcg gctgggcctt    20880 
cacgcgcctt aagactaagg aaaccccatc actgggctcg ggctacgacc cttattacac    20940 
ctactctggc tctataccct acctagatgg aaccttttac ctcaaccaca cctttaagaa    21000 
ggtggccatt acctttgact cttctgtcag ctggcctggc aatgaccgcc tgcttacccc    21060 
caacgagttt gaaattaagc gctcagttga cggggagggt tacaacgttg cccagtgtaa    21120 
catgaccaaa gactggttcc tggtacaaat gctagctaac tacaacattg gctaccaggg    21180 
cttctatatc ccagagagct acaaggaccg catgtactcc ttctttagaa acttccagcc    21240 
catgagccgt caggtggtgg atgatactaa atacaaggac taccaacagg tgggcatcct    21300 
acaccaacac aacaactctg gatttgttgg ctaccttgcc cccaccatgc gcgaaggaca    21360 
ggcctaccct gctaacttcc cctatccgct tataggcaag accgcagttg acagcattac    21420 
ccagaaaaag tttctttgcg atcgcaccct ttggcgcatc ccattctcca gtaactttat    21480 
gtccatgggc gcactcacag acctgggcca aaaccttctc tacgccaact ccgcccacgc    21540 
gctagacatg acttttgagg tggatcccat ggacgagccc acccttcttt atgttttgtt    21600 
tgaagtcttt gacgtggtcc gtgtgcaccg gccgcaccgc ggcgtcatcg aaaccgtgta    21660 
cctgcgcacg cccttctcgg ccggcaacgc cacaacataa agaagcaagc aacatcaaca    21720 
acagctgccg ccatgggctc cagtgagcag gaactgaaag ccattgtcaa agatcttggt    21780 
tgtgggccat attttttggg cacctatgac aagcgctttc caggctttgt ttctccacac    21840 
aagctcgcct gcgccatagt caatacggcc ggtcgcgaga ctgggggcgt acactggatg    21900 
gcctttgcct ggaacccgca ctcaaaaaca tgctacctct ttgagccctt tggcttttct    21960 
gaccagcgac tcaagcaggt ttaccagttt gagtacgagt cactcctgcg ccgtagcgcc    22020 
attgcttctt cccccgaccg ctgtataacg ctggaaaagt ccacccaaag cgtacagggg    22080 
cccaactcgg ccgcctgtgg actattctgc tgcatgtttc tccacgcctt tgccaactgg    22140 
ccccaaactc ccatggatca caaccccacc atgaacctta ttaccggggt acccaactcc    22200 
atgctcaaca gtccccaggt acagcccacc ctgcgtcgca accaggaaca gctctacagc    22260 
ttcctggagc gccactcgcc ctacttccgc agccacagtg cgcagattag gagcgccact    22320 
tctttttgtc acttgaaaaa catgtaaaaa taatgtacta gagacacttt caataaaggc    22380 
aaatgctttt atttgtacac tctcgggtga ttatttaccc ccacccttgc cgtctgcgcc    22440 
gtttaaaaat caaaggggtt ctgccgcgca tcgctatgcg ccactggcag ggacacgttg    22500 
cgatactggt gtttagtgct ccacttaaac tcaggcacaa ccatccgcgg cagctcggtg    22560 
aagttttcac tccacaggct gcgcaccatc accaacgcgt ttagcaggtc gggcgccgat    22620 
atcttgaagt cgcagttggg gcctccgccc tgcgcgcgcg agttgcgata cacagggttg    22680 
cagcactgga acactatcag cgccgggtgg tgcacgctgg ccagcacgct cttgtcggag    22740 
atcagatccg cgtccaggtc ctccgcgttg ctcagggcga acggagtcaa ctttggtagc    22800 
tgccttccca aaaagggcgc gtgcccaggc tttgagttgc actcgcaccg tagtggcatc    22860 
aaaaggtgac cgtgcccggt ctgggcgtta ggatacagcg cctgcataaa agccttgatc    22920 
tgcttaaaag ccacctgagc ctttgcgcct tcagagaaga acatgccgca agacttgccg    22980 
gaaaactgat tggccggaca ggccgcgtcg tgcacgcagc accttgcgtc ggtgttggag    23040 
atctgcacca catttcggcc ccaccggttc ttcacgatct tggccttgct agactgctcc    23100 
ttcagcgcgc gctgcccgtt ttcgctcgtc acatccattt caatcacgtg ctccttattt    23160 
atcataatgc ttccgtgtag acacttaagc tcgccttcga tctcagcgca gcggtgcagc    23220 
cacaacgcgc agcccgtggg ctcgtgatgc ttgtaggtca cctctgcaaa cgactgcagg    23280 
tacgcctgca ggaatcgccc catcatcgtc acaaaggtct tgttgctggt gaaggtcagc    23340 
tgcaacccgc ggtgctcctc gttcagccag gtcttgcata cggccgccag agcttccact    23400 
tggtcaggca gtagtttgaa gttcgccttt agatcgttat ccacgtggta cttgtccatc    23460 
agcgcgcgcg cagcctccat gcccttctcc cacgcagaca cgatcggcac actcagcggg    23520 
ttcatcaccg taatttcact ttccgcttcg ctgggctctt cctcttcctc ttgcgtccgc    23580 
ataccacgcg ccactgggtc gtcttcattc agccgccgca ctgtgcgctt acctcctttg    23640 
ccatgcttga ttagcaccgg tgggttgctg aaacccacca tttgtagcgc cacatcttct    23700 
ctttcttcct cgctgtccac gattacctct ggtgatggcg ggcgctcggg cttgggagaa    23760 
gggcgcttct ttttcttctt gggcgcaatg gccaaatccg ccgccgaggt cgatggccgc    23820 
gggctgggtg tgcgcggcac cagcgcgtct tgtgatgagt cttcctcgtc ctcggactcg    23880 
atacgccgcc tcatccgctt ttttgggggc gcccggggag gcggcggcga cggggacggg    23940 
gacgacacgt cctccatggt tgggggacgt cgcgccgcac cgcgtccgcg ctcgggggtg    24000 
gtttcgcgct gctcctcttc ccgactggcc atttccttct cctataggca gaaaaagatc    24060 
atggagtcag tcgagaagaa ggacagccta accgccccct ctgagttcgc caccaccgcc    24120 
tccaccgatg ccgccaacgc gcctaccacc ttccccgtcg aggcaccccc gcttgaggag    24180 
gaggaagtga ttatcgagca ggacccaggt tttgtaagcg aagacgacga ggaccgctca    24240 
gtaccaacag aggataaaaa gcaagaccag gacaacgcag aggcaaacga ggaacaagtc    24300 
gggcgggggg acgaaaggca tggcgactac ctagatgtgg gagacgacgt gctgttgaag    24360 
catctgcagc gccagtgcgc cattatctgc gacgcgttgc aagagcgcag cgatgtgccc    24420 
ctcgccatag cggatgtcag ccttgcctac gaacgccacc tattctcacc gcgcgtaccc    24480 
cccaaacgcc aagaaaacgg cacatgcgag cccaacccgc gcctcaactt ctaccccgta    24540 
tttgccgtgc cagaggtgct tgccacctat cacatctttt tccaaaactg caagataccc    24600 
ctatcctgcc gtgccaaccg cagccgagcg gacaagcagc tggccttgcg gcagggcgct    24660 
gtcatacctg atatcgcctc gctcaacgaa gtgccaaaaa tctttgaggg tcttggacgc    24720 
gacgagaagc gcgcggcaaa cgctctgcaa caggaaaaca gcgaaaatga aagtcactct    24780 
ggagtgttgg tggaactcga gggtgacaac gcgcgcctag ccgtactaaa acgcagcatc    24840 
gaggtcaccc actttgccta cccggcactt aacctacccc ccaaggtcat gagcacagtc    24900 
atgagtgagc tgatcgtgcg ccgtgcgcag cccctggaga gggatgcaaa tttgcaagaa    24960 
caaacagagg agggcctacc cgcagttggc gacgagcagc tagcgcgctg gcttcaaacg    25020 
cgcgagcctg ccgacttgga ggagcgacgc aaactaatga tggccgcagt gctcgttacc    25080 
gtggagcttg agtgcatgca gcggttcttt gctgacccgg agatgcagcg caagctagag    25140 
gaaacattgc actacacctt tcgacagggc tacgtacgcc aggcctgcaa gatctccaac    25200 
gtggagctct gcaacctggt ctcctacctt ggaattttgc acgaaaaccg ccttgggcaa    25260 
aacgtgcttc attccacgct caagggcgag gcgcgccgcg actacgtccg cgactgcgtt    25320 
tacttatttc tatgctacac ctggcagacg gccatgggcg tttggcagca gtgcttggag    25380 
gagtgcaacc tcaaggagct gcagaaactg ctaaagcaaa acttgaagga cctatggacg    25440 
gccttcaacg agcgctccgt ggccgcgcac ctggcggaca tcattttccc cgaacgcctg    25500 
cttaaaaccc tgcaacaggg tctgccagac ttcaccagtc aaagcatgtt gcagaacttt    25560 
aggaacttta tcctagagcg ctcaggaatc ttgcccgcca cctgctgtgc acttcctagc    25620 
gactttgtgc ccattaagta ccgcgaatgc cctccgccgc tttggggcca ctgctacctt    25680 
ctgcagctag ccaactacct tgcctaccac tctgacataa tggaagacgt gagcggtgac    25740 
ggtctactgg agtgtcactg tcgctgcaac ctatgcaccc cgcaccgctc cctggtttgc    25800 
aattcgcagc tgcttaacga aagtcaaatt atcggtacct ttgagctgca gggtccctcg    25860 
cctgacgaaa agtccgcggc tccggggttg aaactcactc cggggctgtg gacgtcggct    25920 
taccttcgca aatttgtacc tgaggactac cacgcccacg agattaggtt ctacgaagac    25980 
caatcccgcc cgccaaatgc ggagcttacc gcctgcgtca ttacccaggg ccacattctt    26040 
ggccaattgc aagccatcaa caaagcccgc caagagtttc tgctacgaaa gggacggggg    26100 
gtttacttgg acccccagtc cggcgaggag ctcaacccaa tccccccgcc gccgcagccc    26160 
tatcagcagc agccgcgggc ccttgcttcc caggatggca cccaaaaaga agctgcagct    26220 
gccgccgcca cccacggacg aggaggaata ctgggacagt caggcagagg aggttttgga    26280 
cgaggaggag gaggacatga tggaagactg ggagagccta gacgaggaag cttccgaggt    26340 
cgaagaggtg tcagacgaaa caccgtcacc ctcggtcgca ttcccctcgc cggcgcccca    26400 
gaaatcggca accggttcca gcatggctac aacctccgct cctcaggcgc cgccggcact    26460 
gcccgttcgc cgacccaacc gtagatggga caccactgga accagggccg gtaagtccaa    26520 
gcagccgccg ccgttagccc aagagcaaca acagcgccaa ggctaccgct catggcgcgg    26580 
gcacaagaac gccatagttg cttgcttgca agactgtggg ggcaacatct ccttcgcccg    26640 
ccgctttctt ctctaccatc acggcgtggc cttcccccgt aacatcctgc attactaccg    26700 
tcatctctac agcccatact gcaccggcgg cagcggcagc ggcagcaaca gcagcggcca    26760 
cacagaagca aaggcgaccg gatagcaaga ctctgacaaa gcccaagaaa tccacagcgg    26820 
cggcagcagc aggaggagga gcgctgcgtc tggcgcccaa cgaacccgta tcgacccgcg    26880 
agcttagaaa caggattttt cccactctgt atgctatatt tcaacagagc aggggccaag    26940 
aacaagagct gaaaataaaa aacaggtctc tgcgatccct cacccgcagc tgcctgtatc    27000 
acaaaagcga agatcagctt cggcgcacgc tggaagacgc ggaggctctc ttcagtaaat    27060 
actgcgcgct gactcttaag gactagtttc gcgccctttc tcaaatttaa gcgcgaaaac    27120 
tacgtcatct ccagcggcca cacccggcgc cagcacctgt cgtcagcgcc attatgagca    27180 
aggaaattcc cacgccctac atgtggagtt accagccaca aatgggactt gcggctggag    27240 
ctgcccaaga ctactcaacc cgaataaact acatgagcgc gggaccccac atgatatccc    27300 
gggtcaacgg aatccgcgcc caccgaaacc gaattctctt ggaacaggcg gctattacca    27360 
ccacacctcg taataacctt aatccccgta gttggcccgc tgccctggtg taccaggaaa    27420 
gtcccgctcc caccactgtg gtacttccca gagacgccca ggccgaagtt cagatgacta    27480 
actcaggggc gcagcttgcg ggcggctttc gtcacagggt gcggtcgccc gggcagggta    27540 
taactcacct gacaatcaga gggcgaggta ttcagctcaa cgacgagtcg gtgagctcct    27600 
cgcttggtct ccgtccggac gggacatttc agatcggcgg cgccggccgt ccttcattca    27660 
cgcctcgtca ggcaatccta actctgcaga cctcgtcctc tgagccgcgc tctggaggca    27720 
ttggaactct gcaatttatt gaggagtttg tgccatcggt ctactttaac cccttctcgg    27780 
gacctcccgg ccactatccg gatcaattta ttcctaactt tgacgcggta aaggactcgg    27840 
cggacggcta cgactgaatg ttaagtggag aggcagagca actgcgcctg aaacacctgg    27900 
tccactgtcg ccgccacaag tgctttgccc gcgactccgg tgagttttgc tactttgaat    27960 
tgcccgagga tcatatcgag ggcccggcgc acggcgtccg gcttaccgcc cagggagagc    28020 
ttgcccgtag cctgattcgg gagtttaccc agcgccccct gctagttgag cgggacaggg    28080 
gaccctgtgt tctcactgtg atttgcaact gtcctaacct tggattacat caagatcttt    28140 
gttgccatct ctgtgctgag tataataaat acagaaatta aaatatactg gggctcctat    28200 
cgccatcctg taaacgccac cgtcttcacc cgcccaagca aaccaaggcg aaccttacct    28260 
ggtactttta acatctctcc ctctgtgatt tacaacagtt tcaacccaga cggagtgagt    28320 
ctacgagaga acctctccga gctcagctac tccatcagaa aaaacaccac cctccttacc    28380 
tgccgggaac gtacgagtgc gtcaccggcc gctgcaccac acctaccgcc tgaccgtaaa    28440 
ccagactttt tccggacaga cctcaataac tctgtttacc agaacaggag gtgagcttag    28500 
aaaaccctta gggtattagg ccaaaggcgc agctactgtg gggtttatga acaattcaag    28560 
caactctacg ggctattcta attcaggttt ctctagaatc ggggttgggg ttattctctg    28620 
tcttgtgatt ctctttattc ttatactaac gcttctctgc ctaaggctcg ccgcctgctg    28680 
tgtgcacatt tgcatttatt gtcagctttt taaacgctgg ggtcgccacc caagatgatt    28740 
aggtacataa tcctaggttt actcaccctt gcgtcagccc acggtaccac ccaaaaggtg    28800 
gattttaagg agccagcctg taatgttaca ttcgcagctg aagctaatga gtgcaccact    28860 
cttataaaat gcaccacaga acatgaaaag ctgcttattc gccacaaaaa caaaattggc    28920 
aagtatgctg tttatgctat ttggcagcca ggtgacacta cagagtataa tgttacagtt    28980 
ttccagggta aaagtcataa aacttttatg tatacttttc cattttatga aatgtgcgac    29040 
attaccatgt acatgagcaa acagtataag ttgtggcccc cacaaaattg tgtggaaaac    29100 
actggcactt tctgctgcac tgctatgcta attacagtgc tcgctttggt ctgtacccta    29160 
ctctatatta aatacaaaag cagacgcagc tttattgagg aaaagaaaat gccttaattt    29220 
actaagttac aaagctaatg tcaccactaa ctgctttact cgctgcttgc aaaacaaatt    29280 
caaaaagtta gcattataat tagaatagga tttaaacccc ccggtcattt cctgctcaat    29340 
accattcccc tgaacaattg actctatgtg ggatatgctc cagcgctaca accttgaagt    29400 
caggcttcct ggatgtcagc atctgacttt ggccagcacc tgtcccgcgg atttgttcca    29460 
gtccaactac agcgacccac cctaacagag atgaccaaca caaccaacgc ggccgccgct    29520 
accggactta catctaccac aaatacaccc caagtttctg cctttgtcaa taactgggat    29580 
aacttgggca tgtggtggtt ctccatagcg cttatgtttg tatgccttat tattatgtgg    29640 
ctcatctgct gcctaaagcg caaacgcgcc cgaccaccca tctatagtcc catcattgtg    29700 
ctacacccaa acaatgatgg aatccataga ttggacggac tgaaacacat gttcttttct    29760 
cttacagtat gattaaatga gacatgattc ctcgagtttt tatattactg acccttgttg    29820 
cgcttttttg tgcgtgctcc acattggctg cggtttctca catcgaagta gactgcattc    29880 
cagccttcac agtctatttg ctttacggat ttgtcaccct cacgctcatc tgcagcctca    29940 
tcactgtggt catcgccttt atccagtgca ttgactgggt ctgtgtgcgc tttgcatatc    30000 
tcagacacca tccccagtac agggacagga ctatagctga gcttcttaga attctttaat    30060 
tatgaaattt actgtgactt ttctgctgat tatttgcacc ctatctgcgt tttgttcccc    30120 
gacctccaag cctcaaagac atatatcatg cagattcact cgtatatgga atattccaag    30180 
ttgctacaat gaaaaaagcg atctttccga agcctggtta tatgcaatca tctctgttat    30240 
ggtgttctgc agtaccatct tagccctagc tatatatccc taccttgaca ttggctggaa    30300 
acgaatagat gccatgaacc acccaacttt ccccgcgccc gctatgcttc cactgcaaca    30360 
agttgttgcc ggcggctttg tcccagccaa tcagcctcgc cccacttctc ccacccccac    30420 
tgaaatcagc tactttaatc taacaggagg agatgactga caccctagat ctagaaatgg    30480 
acggaattat tacagagcag cgcctgctag aaagacgcag ggcagcggcc gagcaacagc    30540 
gcatgaatca agagctccaa gacatggtta acttgcacca gtgcaaaagg ggtatctttt    30600 
gtctggtaaa gcaggccaaa gtcacctacg acagtaatac caccggacac cgccttagct    30660 
acaagttgcc aaccaagcgt cagaaattgg tggtcatggt gggagaaaag cccattacca    30720 
taactcagca ctcggtagaa accgaaggct gcattcactc accttgtcaa ggacctgagg    30780 
atctctgcac ccttattaag accctgtgcg gtctcaaaga tcttattccc tttaactaat    30840 
aaaaaaaaat aataaagcat cacttactta aaatcagtta gcaaatttct gtccagttta    30900 
ttcagcagca cctccttgcc ctcctcccag ctctggtatt gcagcttcct cctggctgca    30960 
aactttctcc acaatctaaa tggaatgtca gtttcctcct gttcctgtcc atccgcaccc    31020 
actatcttca tgttgttgca gatgaagcgc gcaagaccgt ctgaagatac cttcaacccc    31080 
gtgtatccat atgacacgga aaccggtcct ccaactgtgc cttttcttac tcctcccttt    31140 
gtatccccca atgggtttca agagagtccc cctggggtac tctctttgcg cctatccgaa    31200 
cctctagtta cctccaatgg catgcttgcg ctcaaaatgg gcaacggcct ctctctggac    31260 
gaggccggca accttacctc ccaaaatgta accactgtga gcccacctct caaaaaaacc    31320 
aagtcaaaca taaacctgga aatatctgca cccctcacag ttacctcaga agccctaact    31380 
gtggctgccg ccgcacctct aatggtcgcg ggcaacacac tcaccatgca atcacaggcc    31440 
ccgctaaccg tgcacgactc caaacttagc attgccaccc aaggacccct cacagtgtca    31500 
gaaggaaagc tagccctgca aacatcaggc cccctcacca ccaccgatag cagtaccctt    31560 
actatcactg cctcaccccc tctaactact gccactggta gcttgggcat tgacttgaaa    31620 
gagcccattt atacacaaaa tggaaaacta ggactaaagt acggggctcc tttgcatgta    31680 
acagacgacc taaacacttt gaccgtagca actggtccag gtgtgactat taataatact    31740 
tccttgcaaa ctaaagttac tggagccttg ggttttgatt cacaaggcaa tatgcaactt    31800 
aatgtagcag gaggactaag gattgattct caaaacagac gccttatact tgatgttagt    31860 
tatccgtttg atgctcaaaa ccaactaaat ctaagactag gacagggccc tctttttata    31920 
aactcagccc acaacttgga tattaactac aacaaaggcc tttacttgtt tacagcttca    31980 
aacaattcca aaaagcttga ggttaaccta agcactgcca aggggttgat gtttgacgct    32040 
acagccatag ccattaatgc aggagatggg cttgaatttg gttcacctaa tgcaccaaac    32100 
acaaatcccc tcaaaacaaa aattggccat ggcctagaat ttgattcaaa caaggctatg    32160 
gttcctaaac taggaactgg ccttagtttt gacagcacag gtgccattac agtaggaaac    32220 
aaaaataatg ataagctaac tttgtggacc acaccagctc catctcctaa ctgtagacta    32280 
aatgcagaga aagatgctaa actcactttg gtcttaacaa aatgtggcag tcaaatactt    32340 
gctacagttt cagttttggc tgttaaaggc agtttggctc caatatctgg aacagttcaa    32400 
agtgctcatc ttattataag atttgacgaa aatggagtgc tactaaacaa ttccttcctg    32460 
gacccagaat attggaactt tagaaatgga gatcttactg aaggcacagc ctatacaaac    32520 
gctgttggat ttatgcctaa cctatcagct tatccaaaat ctcacggtaa aactgccaaa    32580 
agtaacattg tcagtcaagt ttacttaaac ggagacaaaa ctaaacctgt aacactaacc    32640 
attacactaa acggtacaca ggaaacagga gacacaactc caagtgcata ctctatgtca    32700 
ttttcatggg actggtctgg ccacaactac attaatgaaa tatttgccac atcctcttac    32760 
actttttcat acattgccca agaataaaga atcgtttgtg ttatgtttca acgtgtttat    32820 
ttttcaattg cagaaaattt caagtcattt ttcattcagt agtatagccc caccaccaca    32880 
tagcttatac agatcaccgt accttaatca aactcacaga accctagtat tcaacctgcc    32940 
acctccctcc caacacacag agtacacagt cctttctccc cggctggcct taaaaagcat    33000 
catatcatgg gtaacagaca tattcttagg tgttatattc cacacggttt cctgtcgagc    33060 
caaacgctca tcagtgatat taataaactc cccgggcagc tcacttaagt tcatgtcgct    33120 
gtccagctgc tgagccacag gctgctgtcc aacttgcggt tgcttaacgg gcggcgaagg    33180 
agaagtccac gcctacatgg gggtagagtc ataatcgtgc atcaggatag ggcggtggtg    33240 
ctgcagcagc gcgcgaataa actgctgccg ccgccgctcc gtcctgcagg aatacaacat    33300 
ggcagtggtc tcctcagcga tgattcgcac cgcccgcagc ataaggcgcc ttgtcctccg    33360 
ggcacagcag cgcaccctga tctcacttaa atcagcacag taactgcagc acagcaccac    33420 
aatattgttc aaaatcccac agtgcaaggc gctgtatcca aagctcatgg cggggaccac    33480 
agaacccacg tggccatcat accacaagcg caggtagatt aagtggcgac ccctcataaa    33540 
cacgctggac ataaacatta cctcttttgg catgttgtaa ttcaccacct cccggtacca    33600 
tataaacctc tgattaaaca tggcgccatc caccaccatc ctaaaccagc tggccaaaac    33660 
ctgcccgccg gctatacact gcagggaacc gggactggaa caatgacagt ggagagccca    33720 
ggactcgtaa ccatggatca tcatgctcgt catgatatca atgttggcac aacacaggca    33780 
cacgtgcata cacttcctca ggattacaag ctcctcccgc gttagaacca tatcccaggg    33840 
aacaacccat tcctgaatca gcgtaaatcc cacactgcag ggaagacctc gcacgtaact    33900 
cacgttgtgc attgtcaaag tgttacattc gggcagcagc ggatgatcct ccagtatggt    33960 
agcgcgggtt tctgtctcaa aaggaggtag acgatcccta ctgtacggag tgcgccgaga    34020 
caaccgagat cgtgttggtc gtagtgtcat gccaaatgga acgccggacg tagtcatatt    34080 
tcctgaagca aaaccaggtg cgggcgtgac aaacagatct gcgtctccgg tctcgccgct    34140 
tagatcgctc tgtgtagtag ttgtagtata tccactctct caaagcatcc aggcgccccc    34200 
tggcttcggg ttctatgtaa actccttcat gcgccgctgc cctgataaca tccaccaccg    34260 
cagaataagc cacacccagc caacctacac attcgttctg cgagtcacac acgggaggag    34320 
cgggaagagc tggaagaacc atgttttttt ttttattcca aaagattatc caaaacctca    34380 
aaatgaagat ctattaagtg aacgcgctcc cctccggtgg cgtggtcaaa ctctacagcc    34440 
aaagaacaga taatggcatt tgtaagatgt tgcacaatgg cttccaaaag gcaaacggcc    34500 
ctcacgtcca agtggacgta aaggctaaac ccttcagggt gaatctcctc tataaacatt    34560 
ccagcacctt caaccatgcc caaataattc tcatctcgcc accttctcaa tatatctcta  34620 
agcaaatccc gaatattaag tccggccatt gtaaaaatct gctccagagc gccctccacc  34680 
ttcagcctca agcagcgaat catgattgca aaaattcagg ttcctcacag acctgtataa  34740 
gattcaaaag cggaacatta acaaaaatac cgcgatcccg taggtccctt cgcagggcca  34800 
gctgaacata atcgtgcagg tctgcacgga ccagcgcggc cacttccccg ccaggaacct  34860 
tgacaaaaga acccacactg attatgacac gcatactcgg agctatgcta accagcgtag  34920 
ccccgatgta agctttgttg catgggcggc gatataaaat gcaaggtgct gctcaaaaaa  34980 
tcaggcaaag cctcgcgcaa aaaagaaagc acatcgtagt catgctcatg cagataaagg  35040 
caggtaagct ccggaaccac cacagaaaaa gacaccattt ttctctcaaa catgtctgcg  35100 
ggtttctgca taaacacaaa ataaaataac aaaaaaacat ttaaacatta gaagcctgtc  35160 
ttacaacagg aaaaacaacc cttataagca taagacggac tacggccatg ccggcgtgac  35220 
cgtaaaaaaa ctggtcaccg tgattaaaaa gcaccaccga cagctcctcg gtcatgtccg  35280 
gagtcataat gtaagactcg gtaaacacat caggttgatt catcggtcag tgctaaaaag  35340 
cgaccgaaat agcccggggg aatacatacc cgcaggcgta gagacaacat tacagccccc  35400 
ataggaggta taacaaaatt aataggagag aaaaacacat aaacacctga aaaaccctcc  35460 
tgcctaggca aaatagcacc ctcccgctcc agaacaacat acagcgcttc acagcggcag  35520 
cctaacagtc agccttacca gtaaaaaaga aaacctatta aaaaaacacc actcgacacg  35580 
gcaccagctc aatcagtcac agtgtaaaaa agggccaagt gcagagcgag tatatatagg  35640 
actaaaaaat gacgtaacgg ttaaagtcca caaaaaacac ccagaaaacc gcacgcgaac  35700 
ctacgcccag aaacgaaagc caaaaaaccc acaacttcct caaatcgtca cttccgtttt  35760 
cccacgttac gtaacttccc attttaagaa aactacaatt cccaacacat acaagttact  35820 
ccgccctaaa acctacgtca cccgccccgt tcccacgccc cgcgccacgt cacaaactcc  35880 
accccctcat tatcatattg gcttcaatcc aaaataaggt atattattga tgatg       35935 
<210>9 
<211>35935 
<212>DNA 
<213>腺病毒血清型5 
<400>9 
catcatcaat aatatacctt attttggatt gaagccaata tgataatgag ggggtggagt     60 
ttgtgacgtg gcgcggggcg tgggaacggg gcgggtgacg tagtagtgtg gcggaagtgt    120 
gatgttgcaa gtgtggcgga acacatgtaa gcgacggatg tggcaaaagt gacgtttttg    180 
gtgtgcgccg gtgtacacag gaagtgacaa ttttcgcgcg gttttaggcg gatgttgtag    240 
taaatttggg cgtaaccgag taagatttgg ccattttcgc gggaaaactg aataagagga    300 
agtgaaatct gaataatttt gtgttactca tagcgcgtaa tatttgtcta gggccgcggg    360 
gactttgacc gtttacgtgg agactcgccc aggtgttttt ctcaggtgtt ttccgcgttc    420 
cgggtcaaag ttggcgtttt attattatag tcagctgacg tgtagtgtat ttatacccgg    480 
tgagttcctc aagaggccac tcttgagtgc cagcgagtag agttttctcc tccgagccgc    540 
tccgacaccg ggactgaaaa tgagacatat tatctgccac ggaggtgtta ttaccgaaga    600 
aatggccgcc agtcttttgg accagctgat cgaagaggta ctggctgata atcttccacc    660 
tcctagccat tttgaaccac ctacccttca cgaactgtat gatttagacg tgacggcccc    720 
cgaagatccc aacgaggagg cggtttcgca gatttttccc gactctgtaa tgttggcggt    780 
gcaggaaggg attgacttac tcacttttcc gccggcgccc ggttctccgg agccgcctca    840 
cctttcccgg cagcccgagc agccggagca gagagccttg ggtccggttt ctatgccaaa    900 
ccttgtaccg gaggtgatcg atcttacctg ccacgaggct ggctttccac ccagtgacga    960 
cgaggatgaa gagggtgagg agtttgtgtt agattatgtg gagcaccccg ggcacggttg   1020 
caggtcttgt cattatcacc ggaggaatac gggggaccca gatattatgt gttcgctttg   1080 
ctatatgagg acctgtggca tgtttgtcta cagtaagtga aaattatggg cagtgggtga   1140 
tagagtggtg ggtttggtgt ggtaattttt tttttaattt ttacagtttt gtggtttaaa   1200 
gaattttgta ttgtgatttt tttaaaaggt cctgtgtctg aacctgagcc tgagcccgag   1260 
ccagaaccgg agcctgcaag acctacccgc cgtcctaaaa tggcgcctgc tatcctgaga   1320 
cgcccgacat cacctgtgtc tagagaatgc aatagtagta cggatagctg tgactccggt   1380 
ccttctaaca cacctcctga gatacacccg gtggtcccgc tgtgccccat taaaccagtt   1440 
gccgtgagag ttggtgggcg tcgccaggct gtggaatgta tcgaggactt gcttaacgag   1500 
cctgggcaac ctttggactt gagctgtaaa cgccccaggc cataaggtgt aaacctgtga   1560 
ttgcgtgtgt ggttaacgcc tttgtttgct gaatgagttg atgtaagttt aataaagggt   1620 
gagataatgt ttaacttgca tggcgtgtta aatggggcgg ggcttaaagg gtatataatg    1680 
cgccgtgggc taatcttggt tacatctgac ctcatggagg cttgggagtg tttggaagat    1740 
ttttctgctg tgcgtaactt gctggaacag agctctaaca gtacctcttg gttttggagg    1800 
tttctgtggg gctcatccca ggcaaagtta gtctgcagaa ttaaggagga ttacaagtgg    1860 
gaatttgaag agcttttgaa atcctgtggt gagctgtttg attctttgaa tctgggtcac    1920 
caggcgcttt tccaagagaa ggtcatcaag actttggatt tttccacacc ggggcgcgct    1980 
gcggctgctg ttgctttttt gagttttata aaggataaat ggagcgaaga aacccatctg    2040 
agcggggggt acctgctgga ttttctggcc atgcatctgt ggagagcggt tgtgagacac    2100 
aagaatcgcc tgctactgtt gtcttccgtc cgcccggcga taataccgac ggaggagcag    2160 
cagcagcagc aggaggaagc caggcggcgg cggcaggagc agagcccatg gaacccgaga    2220 
gccggcctgg accctcggga atgaatgttg tacaggtggc tgaactgtat ccagaactga    2280 
gacgcatttt gacaattaca gaggatgggc aggggctaaa gggggtaaag agggagcggg    2340 
gggcttgtga ggctacagag gaggctagga atctagcttt tagcttaatg accagacacc    2400 
gtcctgagtg tattactttt caacagatca aggataattg cgctaatgag cttgatctgc    2460 
tggcgcagaa gtattccata gagcagctga ccacttactg gctgcagcca ggggatgatt    2520 
ttgaggaggc tattagggta tatgcaaagg tggcacttag gccagattgc aagtacaaga    2580 
tcagcaaact tgtaaatatc aggaattgtt gctacatttc tgggaacggg gccgaggtgg    2640 
agatagatac ggaggatagg gtggccttta gatgtagcat gataaatatg tggccggggg    2700 
tgcttggcat ggacggggtg gttattatga atgtaaggtt tactggcccc aattttagcg    2760 
gtacggtttt cctggccaat accaacctta tcctacacgg tgtaagcttc tatgggttta    2820 
acaatacctg tgtggaagcc tggaccgatg taagggttcg gggctgtgcc ttttactgct    2880 
gctggaaggg ggtggtgtgt cgccccaaaa gcagggcttc aattaagaaa tgcctctttg    2940 
aaaggtgtac cttgggtatc ctgtctgagg gtaactccag ggtgcgccac aatgtggcct    3000 
ccgactgtgg ttgcttcatg ctagtgaaaa gcgtggctgt gattaagcat aacatggtat    3060 
gtggcaactg cgaggacagg gcctctcaga tgctgacctg ctcggacggc aactgtcacc    3120 
tgctgaagac cattcacgta gccagccact ctcgcaaggc ctggccagtg tttgagcata    3180 
acatactgac ccgctgttcc ttgcatttgg gtaacaggag gggggtgttc ctaccttacc    3240 
aatgcaattt gagtcacact aagatattgc ttgagcccga gagcatgtcc aaggtgaacc    3300 
tgaacggggt gtttgacatg accatgaaga tctggaaggt gctgaggtac gatgagaccc    3360 
gcaccaggtg cagaccctgc gagtgtggcg gtaaacatat taggaaccag cctgtgatgc    3420 
tggatgtgac cgaggagctg aggcccgatc acttggtgct ggcctgcacc cgcgctgagt    3480 
ttggctctag cgatgaagat acagattgag gtactgaaat gtgtgggcgt ggcttaaggg    3540 
tgggaaagaa tatataaggt gggggtctta tgtagttttg tatctgtttt gcagcagccg    3600 
ccgccgccat gagcaccaac tcgtttgatg gaagcattgt gagctcatat ttgacaacgc    3660 
gcatgccccc atgggccggg gtgcgtcaga atgtgatggg ctccagcatt gatggtcgcc    3720 
ccgtcctgcc cgcaaactct actaccttga cctacgagac cgtgtctgga acgccgttgg    3780 
agactgcagc ctccgccgcc gcttcagccg ctgcagccac cgcccgcggg attgtgactg    3840 
actttgcttt cctgagcccg cttgcaagca gtgcagcttc ccgttcatcc gcccgcgatg    3900 
acaagttgac ggctcttttg gcacaattgg attctttgac ccgggaactt aatgtcgttt    3960 
ctcagcagct gttggatctg cgccagcagg tttctgccct gaaggcttcc tcccctccca    4020 
atgcggttta aaacataaat aaaaaaccag actctgtttg gatttggatc aagcaagtgt    4080 
cttgctgtct ttatttaggg gttttgcgcg cgcggtaggc ccgggaccag cggtctcggt    4140 
cgttgagggt cctgtgtatt ttttccagga cgtggtaaag gtgactctgg atgttcagat    4200 
acatgggcat aagcccgtct ctggggtgga ggtagcacca ctgcagagct tcatgctgcg    4260 
gggtggtgtt gtagatgatc cagtcgtagc aggagcgctg ggcgtggtgc ctaaaaatgt    4320 
ctttcagtag caagctgatt gccaggggca ggcccttggt gtaagtgttt acaaagcggt    4380 
taagctggga tgggtgcata cgtggggata tgagatgcat cttggactgt atttttaggt    4440 
tggctatgtt cccagccata tccctccggg gattcatgtt gtgcagaacc accagcacag    4500 
tgtatccggt gcacttggga aatttgtcat gtagcttaga aggaaatgcg tggaagaact    4560 
tggagacgcc cttgtgacct ccaagatttt ccatgcattc gtccataatg atggcaatgg    4620 
gcccacgggc ggcggcctgg gcgaagatat ttctgggatc actaacgtca tagttgtgtt    4680 
ccaggatgag atcgtcatag gccattttta caaagcgcgg gcggagggtg ccagactgcg    4740 
gtataatggt tccatccggc ccaggggcgt agttaccctc acagatttgc atttcccacg    4800 
ctttgagttc agatgggggg atcatgtcta cctgcggggc gatgaagaaa acggtttccg    4860 
gggtagggga gatcagctgg gaagaaagca ggttcctgag cagctgcgac ttaccgcagc    4920 
cggtgggccc gtaaatcaca cctattaccg ggtgcaactg gtagttaaga gagctgcagc    4980 
tgccgtcatc cctgagcagg ggggccactt cgttaagcat gtccctgact cgcatgtttt    5040 
ccctgaccaa atccgccaga aggcgctcgc cgcccagcga tagcagttct tgcaaggaag    5100 
caaagttttt caacggtttg agaccgtccg ccgtaggcat gcttttgagc gtttgaccaa    5160 
gcagttccag gcggtcccac agctcggtca cctgctctac ggcatctcga tccagcatat    5220 
ctcctcgttt cgcgggttgg ggcggctttc gctgtacggc agtagtcggt gctcgtccag    5280 
acgggccagg gtcatgtctt tccacgggcg cagggtcctc gtcagcgtag tctgggtcac    5340 
ggtgaagggg tgcgctccgg gctgcgcgct ggccagggtg cgcttgaggc tggtcctgct    5400 
ggtgctgaag cgctgccggt cttcgccctg cgcgtcggcc aggtagcatt tgaccatggt    5460 
gtcatagtcc agcccctccg cggcgtggcc cttggcgcgc agcttgccct tggaggaggc    5520 
gccgcacgag gggcagtgca gacttttgag ggcgtagagc ttgggcgcga gaaataccga    5580 
ttccggggag taggcatccg cgccgcaggc cccgcagacg gtctcgcatt ccacgagcca    5640 
ggtgagctct ggccgttcgg ggtcaaaaac caggtttccc ccatgctttt tgatgcgttt    5700 
cttacctctg gtttccatga gccggtgtcc acgctcggtg acgaaaaggc tgtccgtgtc    5760 
cccgtataca gacttgagag gcctgtcctc gagcggtgtt ccgcggtcct cctcgtatag    5820 
aaactcggac cactctgaga caaaggctcg cgtccaggcc agcacgaagg aggctaagtg    5880 
ggaggggtag cggtcgttgt ccactagggg gtccactcgc tccagggtgt gaagacacat    5940 
gtcgccctct tcggcatcaa ggaaggtgat tggtttgtag gtgtaggcca cgtgaccggg    6000 
tgttcctgaa ggggggctat aaaagggggt gggggcgcgt tcgtcctcac tctcttccgc    6060 
atcgctgtct gcgagggcca gctgttgggg tgagtactcc ctctgaaaag cgggcatgac    6120 
ttctgcgcta agattgtcag tttccaaaaa cgaggaggat ttgatattca cctggcccgc    6180 
ggtgatgcct ttgagggtgg ccgcatccat ctggtcagaa aagacaatct ttttgttgtc    6240 
aagcttggtg gcaaacgacc cgtagagggc gttggacagc aacttggcga tggagcgcag    6300 
ggtttggttt ttgtcgcgat cggcgcgctc cttggccgcg atgtttagct gcacgtattc    6360 
gcgcgcaacg caccgccatt cgggaaagac ggtggtgcgc tcgtcgggca ccaggtgcac    6420 
gcgccaaccg cggttgtgca gggtgacaag gtcaacgctg gtggctacct ctccgcgtag    6480 
gcgctcgttg gtccagcaga ggcggccgcc cttgcgcgag cagaatggcg gtagggggtc    6540 
tagctgcgtc tcgtccgggg ggtctgcgtc cacggtaaag accccgggca gcaggcgcgc    6600 
gtcgaagtag tctatcttgc atccttgcaa gtctagcgcc tgctgccatg cgcgggcggc    6660 
aagcgcgcgc tcgtatgggt tgagtggggg accccatggc atggggtggg tgagcgcgga    6720 
ggcgtacatg ccgcaaatgt cgtaaacgta gaggggctct ctgagtattc caagatatgt    6780 
agggtagcat cttccaccgc ggatgctggc gcgcacgtaa tcgtatagtt cgtgcgaggg    6840 
agcgaggagg tcgggaccga ggttgctacg ggcgggctgc tctgctcgga agactatctg    6900 
cctgaagatg gcatgtgagt tggatgatat ggttggacgc tggaagacgt tgaagctggc    6960 
gtctgtgaga cctaccgcgt cacgcacgaa ggaggcgtag gagtcgcgca gcttgttgac    7020 
cagctcggcg gtgacctgca cgtctagggc gcagtagtcc agggtttcct tgatgatgtc    7080 
atacttatcc tgtccctttt ttttccacag ctcgcggttg aggacaaact cttcgcggtc    7140 
tttccagtac tcttggatcg gaaacccgtc ggcctccgaa cggtaagagc ctagcatgta    7200 
gaactggttg acggcctggt aggcgcagca tcccttttct acgggtagcg cgtatgcctg    7260 
cgcggccttc cggagcgagg tgtgggtgag cgcaaaggtg tccctgacca tgactttgag    7320 
gtactggtat ttgaagtcag tgtcgtcgca tccgccctgc tcccagagca aaaagtccgt    7380 
gcgctttttg gaacgcggat ttggcagggc gaaggtgaca tcgttgaaga gtatctttcc    7440 
cgcgcgaggc ataaagttgc gtgtgatgcg gaagggtccc ggcacctcgg aacggttgtt    7500 
aattacctgg gcggcgagca cgatctcgtc aaagccgttg atgttgtggc ccacaatgta    7560 
aagttccaag aagcgcggga tgcccttgat ggaaggcaat tttttaagtt cctcgtaggt    7620 
gagctcttca ggggagctga gcccgtgctc tgaaagggcc cagtctgcaa gatgagggtt    7680 
ggaagcgacg aatgagctcc acaggtcacg ggccattagc atttgcaggt ggtcgcgaaa    7740 
ggtcctaaac tggcgaccta tggccatttt ttctggggtg atgcagtaga aggtaagcgg    7800 
gtcttgttcc cagcggtccc atccaaggtt cgcggctagg tctcgcgcgg cagtcactag    7860 
aggctcatct ccgccgaact tcatgaccag catgaagggc acgagctgct tcccaaaggc    7920 
ccccatccaa gtataggtct ctacatcgta ggtgacaaag agacgctcgg tgcgaggatg    7980 
cgagccgatc gggaagaact ggatctcccg ccaccaattg gaggagtggc tattgatgtg    8040 
gtgaaagtag aagtccctgc gacgggccga acactcgtgc tggcttttgt aaaaacgtgc    8100 
gcagtactgg cagcggtgca cgggctgtac atcctgcacg aggttgacct gacgaccgcg    8160 
cacaaggaag cagagtggga atttgagccc ctcgcctggc gggtttggct ggtggtcttc    8220 
tacttcggct gcttgtcctt gaccgtctgg ctgctcgagg ggagttacgg tggatcggac    8280 
caccacgccg cgcgagccca aagtccagat gtccgcgcgc ggcggtcgga gcttgatgac    8340 
aacatcgcgc agatgggagc tgtccatggt ctggagctcc cgcggcgtca ggtcaggcgg    8400 
gagctcctgc aggtttacct cgcatagacg ggtcagggcg cgggctagat ccaggtgata    8460 
cctaatttcc aggggctggt tggtggcggc gtcgatggct tgcaagaggc cgcatccccg    8520 
cggcgcgact acggtaccgc gcggcgggcg gtgggccgcg ggggtgtcct tggatgatgc    8580 
atctaaaagc ggtgacgcgg gcgagccccc ggaggtaggg ggggctccgg acccgccggg    8640 
agagggggca ggggcacgtc ggcgccgcgc gcgggcagga gctggtgctg cgcgcgtagg    8700 
ttgctggcga acgcgacgac gcggcggttg atctcctgaa tctggcgcct ctgcgtgaag    8760 
acgacgggcc cggtgagctt gagcctgaaa gagagttcga cagaatcaat ttcggtgtcg    8820 
ttgacggcgg cctggcgcaa aatctcctgc acgtctcctg agttgtcttg ataggcgatc    8880 
tcggccatga actgctcgat ctcttcctcc tggagatctc cgcgtccggc tcgctccacg    8940 
gtggcggcga ggtcgttgga aatgcgggcc atgagctgcg agaaggcgtt gaggcctccc    9000 
tcgttccaga cgcggctgta gaccacgccc ccttcggcat cgcgggcgcg catgaccacc    9060 
tgcgcgagat tgagctccac gtgccgggcg aagacggcgt agtttcgcag gcgctgaaag    9120 
aggtagttga gggtggtggc ggtgtgttct gccacgaaga agtacataac ccagcgtcgc    9180 
aacgtggatt cgttgatatc ccccaaggcc tcaaggcgct ccatggcctc gtagaagtcc    9240 
acggcgaagt tgaaaaactg ggagttgcgc gccgacacgg ttaactcctc ctccagaaga    9300 
cggatgagct cggcgacagt gtcgcgcacc tcgcgctcaa aggctacagg ggcctcttct    9360 
tcttcttcaa tctcctcttc cataagggcc tccccttctt cttcttctgg cggcggtggg    9420 
ggagggggga cacggcggcg acgacggcgc accgggaggc ggtcgacaaa gcgctcgatc    9480 
atctccccgc ggcgacggcg catggtctcg gtgacggcgc ggccgttctc gcgggggcgc    9540 
agttggaaga cgccgcccgt catgtcccgg ttatgggttg gcggggggct gccatgcggc    9600 
agggatacgg cgctaacgat gcatctcaac aattgttgtg taggtactcc gccgccgagg    9660 
gacctgagcg agtccgcatc gaccggatcg gaaaacctct cgagaaaggc gtctaaccag    9720 
tcacagtcgc aaggtaggct gagcaccgtg gcgggcggca gcgggcggcg gtcggggttg    9780 
tttctggcgg aggtgctgct gatgatgtaa ttaaagtagg cggtcttgag acggcggatg    9840 
gtcgacagaa gcaccatgtc cttgggtccg gcctgctgaa tgcgcaggcg gtcggccatg    9900 
ccccaggctt cgttttgaca tcggcgcagg tctttgtagt agtcttgcat gagcctttct    9960 
accggcactt cttcttctcc ttcctcttgt cctgcatctc ttgcatctat cgctgcggcg   10020 
gcggcggagt ttggccgtag gtggcgccct cttcctccca tgcgtgtgac cccgaagccc    10080 
ctcatcggct gaagcagggc taggtcggcg acaacgcgct cggctaatat ggcctgctgc    10140 
acctgcgtga gggtagactg gaagtcatcc atgtccacaa agcggtggta tgcgcccgtg    10200 
ttgatggtgt aagtgcagtt ggccataacg gaccagttaa cggtctggtg acccggctgc    10260 
gagagctcgg tgtacctgag acgcgagtaa gccctcgagt caaatacgta gtcgttgcaa    10320 
gtccgcacca ggtactggta tcccaccaaa aagtgcggcg gcggctggcg gtagaggggc    10380 
cagcgtaggg tggccggggc tccgggggcg agatcttcca acataaggcg atgatatccg    10440 
tagatgtacc tggacatcca ggtgatgccg gcggcggtgg tggaggcgcg cggaaagtcg    10500 
cggacgcggt tccagatgtt gcgcagcggc aaaaagtgct ccatggtcgg gacgctctgg    10560 
ccggtcaggc gcgcgcaatc gttgacgctc tagaccgtgc aaaaggagag cctgtaagcg    10620 
ggcactcttc cgtggtctgg tggataaatt cgcaagggta tcatggcgga cgaccggggt    10680 
tcgagccccg tatccggccg tccgccgtga tccatgcggt taccgcccgc gtgtcgaacc    10740 
caggtgtgcg acgtcagaca acgggggagt gctccttttg gcttccttcc aggcgcggcg    10800 
gctgctgcgc tagctttttt ggccactggc cgcgcgcagc gtaagcggtt aggctggaaa    10860 
gcgaaagcat taagtggctc gctccctgta gccggagggt tattttccaa gggttgagtc    10920 
gcgggacccc cggttcgagt ctcggaccgg ccggactgcg gcgaacgggg gtttgcctcc    10980 
ccgtcatgca agaccccgct tgcaaattcc tccggaaaca gggacgagcc ccttttttgc    11040 
ttttcccaga tgcatccggt gctgcggcag atgcgccccc ctcctcagca gcggcaagag    11100 
caagagcagc ggcagacatg cagggcaccc tcccctcctc ctaccgcgtc aggaggggcg    11160 
acatccgcgg ttgacgcggc agcagatggt gattacgaac ccccgcggcg ccgggcccgg    11220 
cactacctgg acttggagga gggcgagggc ctggcgcggc taggagcgcc ctctcctgag    11280 
cggtacccaa gggtgcagct gaagcgtgat acgcgtgagg cgtacgtgcc gcggcagaac    11340 
ctgtttcgcg accgcgaggg agaggagccc gaggagatgc gggatcgaaa gttccacgca    11400 
gggcgcgagc tgcggcatgg cctgaatcgc gagcggttgc tgcgcgagga ggactttgag    11460 
cccgacgcgc gaaccgggat tagtcccgcg cgcgcacacg tggcggccgc cgacctggta    11520 
accgcatacg agcagacggt gaaccaggag attaactttc aaaaaagctt taacaaccac    11580 
gtgcgtacgc ttgtggcgcg cgaggaggtg gctataggac tgatgcatct gtgggacttt    11640 
gtaagcgcgc tggagcaaaa cccaaatagc aagccgctca tggcgcagct gttccttata    11700 
gtgcagcaca gcagggacaa cgaggcattc agggatgcgc tgctaaacat agtagagccc    11760 
gagggccgct ggctgctcga tttgataaac atcctgcaga gcatagtggt gcaggagcgc    11820 
agcttgagcc tggctgacaa ggtggccgcc atcaactatt ccatgcttag cctgggcaag    11880 
ttttacgccc gcaagatata ccatacccct tacgttccca tagacaagga ggtaaagatc    11940 
gaggggttct acatgcgcat ggcgctgaag gtgcttacct tgagcgacga cctgggcgtt    12000 
tatcgcaacg agcgcatcca caaggccgtg agcgtgagcc ggcggcgcga gctcagcgac    12060 
cgcgagctga tgcacagcct gcaaagggcc ctggctggca cgggcagcgg cgatagagag    12120 
gccgagtcct actttgacgc gggcgctgac ctgcgctggg ccccaagccg acgcgccctg    12180 
gaggcagctg gggccggacc tgggctggcg gtggcacccg cgcgcgctgg caacgtcggc    12240 
ggcgtggagg aatatgacga ggacgatgag tacgagccag aggacggcga gtactaagcg    12300 
gtgatgtttc tgatcagatg atgcaagacg caacggaccc ggcggtgcgg gcggcgctgc    12360 
agagccagcc gtccggcctt aactccacgg acgactggcg ccaggtcatg gaccgcatca    12420 
tgtcgctgac tgcgcgcaat cctgacgcgt tccggcagca gccgcaggcc aaccggctct    12480 
ccgcaattct ggaagcggtg gtcccggcgc gcgcaaaccc cacgcacgag aaggtgctgg    12540 
cgatcgtaaa cgcgctggcc gaaaacaggg ccatccggcc cgacgaggcc ggcctggtct    12600 
acgacgcgct gcttcagcgc gtggctcgtt acaacagcgg caacgtgcag accaacctgg    12660 
accggctggt gggggatgtg cgcgaggccg tggcgcagcg tgagcgcgcg cagcagcagg    12720 
gcaacctggg ctccatggtt gcactaaacg ccttcctgag tacacagccc gccaacgtgc    12780 
cgcggggaca ggaggactac accaactttg tgagcgcact gcggctaatg gtgactgaga    12840 
caccgcaaag tgaggtgtac cagtctgggc cagactattt tttccagacc agtagacaag    12900 
gcctgcagac cgtaaacctg agccaggctt tcaaaaactt gcaggggctg tggggggtgc    12960 
gggctcccac aggcgaccgc gcgaccgtgt ctagcttgct gacgcccaac tcgcgcctgt    13020 
tgctgctgct aatagcgccc ttcacggaca gtggcagcgt gtcccgggac acatacctag    13080 
gtcacttgct gacactgtac cgcgaggcca taggtcaggc gcatgtggac gagcatactt    13140 
tccaggagat tacaagtgtc agccgcgcgc tggggcagga ggacacgggc agcctggagg    13200 
caaccctaaa ctacctgctg accaaccggc ggcagaagat cccctcgttg cacagtttaa    13260 
acagcgagga ggagcgcatt ttgcgctacg tgcagcagag cgtgagcctt aacctgatgc    13320 
gcgacggggt aacgcccagc gtggcgctgg acatgaccgc gcgcaacatg gaaccgggca    13380 
tgtatgcctc aaaccggccg tttatcaacc gcctaatgga ctacttgcat cgcgcggccg    13440 
ccgtgaaccc cgagtatttc accaatgcca tcttgaaccc gcactggcta ccgccccctg    13500 
gtttctacac cgggggattc gaggtgcccg agggtaacga tggattcctc tgggacgaca    13560 
tagacgacag cgtgttttcc ccgcaaccgc agaccctgct agagttgcaa cagcgcgagc    13620 
aggcagaggc ggcgctgcga aaggaaagct tccgcaggcc aagcagcttg tccgatctag    13680 
gcgctgcggc cccgcggtca gatgctagta gcccatttcc aagcttgata gggtctctta    13740 
ccagcactcg caccacccgc ccgcgcctgc tgggcgagga ggagtaccta aacaactcgc    13800 
tgctgcagcc gcagcgcgaa aaaaacctgc ctccggcatt tcccaacaac gggatagaga    13860 
gcctagtgga caagatgagt agatggaaga cgtacgcgca ggagcacagg gacgtgccag    13920 
gcccgcgccc gcccacccgt cgtcaaaggc acgaccgtca gcggggtctg gtgtgggagg    13980 
acgatgactc ggcagacgac agcagcgtcc tggatttggg agggagtggc aacccgtttg    14040 
cgcaccttcg ccccaggctg gggagaatgt tttaaaaaaa aaaaagcatg atgcaaaata    14100 
aaaaactcac caaggccatg gcaccgagcg ttggttttct tgtattcccc ttagtatgcg    14160 
gcgcgcggcg atgtatgagg aaggtcctcc tccctcctac gagagtgtgg tgagcgcggc    14220 
gccagtggcg gcggcgctgg gttctccctt cgatgctccc ctggacccgc cgtttgtgcc    14280 
tccgcggtac ctgcggccta ccggggggag aaacagcatc cgttactctg agttggcacc    14340 
cctattcgac accacccgtg tgtacctggt ggacaacaag tcaacggatg tggcatccct    14400 
gaactaccag aacgaccaca gcaactttct gaccacggtc attcaaaaca atgactacag    14460 
cccgggggag gcaagcacac agaccatcaa tcttgacgac cggtcgcact ggggcggcga    14520 
cctgaaaacc atcctgcata ccaacatgcc aaatgtgaac gagttcatgt ttaccaataa    14580 
gtttaaggcg cgggtgatgg tgtcgcgctt gcctactaag gacaatcagg tggagctgaa    14640 
atacgagtgg gtggagttca cgctgcccga gggcaactac tccgagacca tgaccataga    14700 
ccttatgaac aacgcgatcg tggagcacta cttgaaagtg ggcagacaga acggggttct    14760 
ggaaagcgac atcggggtaa agtttgacac ccgcaacttc agactggggt ttgaccccgt    14820 
cactggtctt gtcatgcctg gggtatatac aaacgaagcc ttccatccag acatcatttt    14880 
gctgccagga tgcggggtgg acttcaccca cagccgcctg agcaacttgt tgggcatccg    14940 
caagcggcaa cccttccagg agggctttag gatcacctac gatgatctgg agggtggtaa    15000 
cattcccgca ctgttggatg tggacgccta ccaggcgagc ttgaaagatg acaccgaaca    15060 
gggcgggggt ggcgcaggcg gcagcaacag cagtggcagc ggcgcggaag agaactccaa    15120 
cgcggcagcc gcggcaatgc agccggtgga ggacatgaac gatcatgcca ttcgcggcga    15180 
cacctttgcc acacgggctg aggagaagcg cgctgaggcc gaagcagcgg ccgaagctgc    15240 
cgcccccgct gcgcaacccg aggtcgagaa gcctcagaag aaaccggtga tcaaacccct    15300 
gacagaggac agcaagaaac gcagttacaa cctaataagc aatgacagca ccttcaccca    15360 
gtaccgcagc tggtaccttg catacaacta cggcgaccct cagaccggaa tccgctcatg    15420 
gaccctgctt tgcactcctg acgtaacctg cggctcggag caggtctact ggtcgttgcc    15480 
agacatgatg caagaccccg tgaccttccg ctccacgcgc cagatcagca actttccggt    15540 
ggtgggcgcc gagctgttgc ccgtgcactc caagagcttc tacaacgacc aggccgtcta    15600 
ctcccaactc atccgccagt ttacctctct gacccacgtg ttcaatcgct ttcccgagaa    15660 
ccagattttg gcgcgcccgc cagcccccac catcaccacc gtcagtgaaa acgttcctgc    15720 
tctcacagat cacgggacgc taccgctgcg caacagcatc ggaggagtcc agcgagtgac    15780 
cattactgac gccagacgcc gcacctgccc ctacgtttac aaggccctgg gcatagtctc    15840 
gccgcgcgtc ctatcgagcc gcactttttg agcaagcatg tccatcctta tatcgcccag    15900 
caataacaca ggctggggcc tgcgcttccc aagcaagatg tttggcgggg ccaagaagcg    15960 
ctccgaccaa cacccagtgc gcgtgcgcgg gcactaccgc gcgccctggg gcgcgcacaa    16020 
acgcggccgc actgggcgca ccaccgtcga tgacgccatc gacgcggtgg tggaggaggc    16080 
gcgcaactac acgcccacgc cgccaccagt gtccacagtg gacgcggcca ttcagaccgt    16140 
ggtgcgcgga gcccggcgct atgctaaaat gaagagacgg cggaggcgcg tagcacgtcg    16200 
ccaccgccgc cgacccggca ctgccgccca acgcgcggcg gcggccctgc ttaaccgcgc    16260 
acgtcgcacc ggccgacggg cggccatgcg ggccgctcga aggctggccg cgggtattgt    16320 
cactgtgccc cccaggtcca ggcgacgagc ggccgccgca gcagccgcgg ccattagtgc    16380 
tatgactcag ggtcgcaggg gcaacgtgta ttgggtgcgc gactcggtta gcggcctgcg    16440 
cgtgcccgtg cgcacccgcc ccccgcgcaa ctagattgca agaaaaaact acttagactc    16500 
gtactgttgt atgtatccag cggcggcggc gcgcaacgaa gctatgtcca agcgcaaaat    16560 
caaagaagag atgctccagg tcatcgcgcc ggagatctat ggccccccga agaaggaaga    16620 
gcaggattac aagccccgaa agctaaagcg ggtcaaaaag aaaaagaaag atgatgatga    16680 
tgaacttgac gacgaggtgg aactgctgca cgctaccgcg cccaggcgac gggtacagtg    16740 
gaaaggtcga cgcgtaaaac gtgttttgcg acccggcacc accgtagtct ttacgcccgg    16800 
tgagcgctcc acccgcacct acaagcgcgt gtatgatgag gtgtacggcg acgaggacct    16860 
gcttgagcag gccaacgagc gcctcgggga gtttgcctac ggaaagcggc ataaggacat    16920 
gctggcgttg ccgctggacg agggcaaccc aacacctagc ctaaagcccg taacactgca    16980 
gcaggtgctg cccgcgcttg caccgtccga agaaaagcgc ggcctaaagc gcgagtctgg    17040 
tgacttggca cccaccgtgc agctgatggt acccaagcgc cagcgactgg aagatgtctt    17100 
ggaaaaaatg accgtggaac ctgggctgga gcccgaggtc cgcgtgcggc caatcaagca    17160 
ggtggcgccg ggactgggcg tgcagaccgt ggacgttcag atacccacta ccagtagcac    17220 
cagtattgcc accgccacag agggcatgga gacacaaacg tccccggttg cctcagcggt    17280 
ggcggatgcc gcggtgcagg cggtcgctgc ggccgcgtcc aagacctcta cggaggtgca    17340 
aacggacccg tggatgtttc gcgtttcagc cccccggcgc ccgcgcggtt cgaggaagta    17400 
cggcgccgcc agcgcgctac tgcccgaata tgccctacat ccttccattg cgcctacccc    17460 
cggctatcgt ggctacacct accgccccag aagacgagca actacccgac gccgaaccac    17520 
cactggaacc cgccgccgcc gtcgccgtcg ccagcccgtg ctggccccga tttccgtgcg    17580 
cagggtggct cgcgaaggag gcaggaccct ggtgctgcca acagcgcgct accaccccag    17640 
catcgtttaa aagccggtct ttgtggttct tgcagatatg gccctcacct gccgcctccg    17700 
tttcccggtg ccgggattcc gaggaagaat gcaccgtagg aggggcatgg ccggccacgg    17760 
cctgacgggc ggcatgcgtc gtgcgcacca ccggcggcgg cgcgcgtcgc accgtcgcat    17820 
gcgcggcggt atcctgcccc tccttattcc actgatcgcc gcggcgattg gcgccgtgcc    17880 
cggaattgca tccgtggcct tgcaggcgca gagacactga ttaaaaacaa gttgcatgtg    17940 
gaaaaatcaa aataaaaagt ctggactctc acgctcgctt ggtcctgtaa ctattttgta    18000 
gaatggaaga catcaacttt gcgtctctgg ccccgcgaca cggctcgcgc ccgttcatgg    18060 
gaaactggca agatatcggc accagcaata tgagcggtgg cgccttcagc tggggctcgc    18120 
tgtggagcgg cattaaaaat ttcggttcca ccgttaagaa ctatggcagc aaggcctgga    18180 
acagcagcac aggccagatg ctgagggata agttgaaaga gcaaaatttc caacaaaagg    18240 
tggtagatgg cctggcctct ggcattagcg gggtggtgga cctggccaac caggcagtgc    18300 
aaaataagat taacagtaag cttgatcccc gccctcccgt agaggagcct ccaccggccg    18360 
tggagacagt gtctccagag gggcgtggcg aaaagcgtcc gcgccccgac agggaagaaa    18420 
ctctggtgac gcaaatagac gagcctccct cgtacgagga ggcactaaag caaggcctgc    18480 
ccaccacccg tcccatcgcg cccatggcta ccggagtgct gggccagcac acacccgtaa    18540 
cgctggacct gcctcccccc gccgacaccc agcagaaacc tgtgctgcca ggcccgaccg    18600 
ccgttgttgt aacccgtcct agccgcgcgt ccctgcgccg cgccgccagc ggtccgcgat    18660 
cgttgcggcc cgtagccagt ggcaactggc aaagcacact gaacagcatc gtgggtctgg    18720 
gggtgcaatc cctgaagcgc cgacgatgct tctgaatagc taacgtgtcg tatgtgtgtc    18780 
atgtatgcgt ccatgtcgcc gccagaggag ctgctgagcc gccgcgcgcc cgctttccaa    18840 
gatggctacc ccttcgatga tgccgcagtg gtcttacatg cacatctcgg gccaggacgc    18900 
ctcggagtac ctgagccccg ggctggtgca gtttgcccgc gccaccgaga cgtacttcag    18960 
cctgaataac aagtttagaa accccacggt ggcgcctacg cacgacgtga ccacagaccg    19020 
gtcccagcgt ttgacgctgc ggttcatccc tgtggaccgt gaggatactg cgtactcgta    19080 
caaggcgcgg ttcaccctag ctgtgggtga taaccgtgtg ctggacatgg cttccacgta    19140 
ctttgacatc cgcggcgtgc tggacagggg ccctactttt aagccctact ctggcactgc    19200 
ctacaacgcc ctggctccca agggtgcccc aaatccttgc gaatgggatg aagctgctac    19260 
tgctcttgaa ataaacctag aagaagagga cgatgacaac gaagacgaag tagacgagca    19320 
agctgagcag caaaaaactc acgtatttgg gcaggcgcct tattctggta taaatattac    19380 
aaaggagggt attcaaatag gtgtcgaagg tcaaacacct aaatatgccg ataaaacatt    19440 
tcaacctgaa cctcaaatag gagaatctca gtggtacgaa actgaaatta atcatgcagc    19500 
tgggagagtc cttaaaaaga ctaccccaat gaaaccatgt tacggttcat atgcaaaacc    19560 
cacaaatgaa aatggagggc aaggcattct tgtaaagcaa caaaatggaa agctagaaag    19620 
tcaagtggaa atgcaatttt tctcaactac tgaggcgacc gcaggcaatg gtgataactt    19680 
gactcctaaa gtggtattgt acagtgaaga tgtagatata gaaaccccag acactcatat    19740 
ttcttacatg cccactatta aggaaggtaa ctcacgagaa ctaatgggcc aacaatctat    19800 
gcccaacagg cctaattaca ttgcttttag ggacaatttt attggtctaa tgtattacaa    19860 
cagcacgggt aatatgggtg ttctggcggg ccaagcatcg cagttgaatg ctgttgtaga    19920 
tttgcaagac agaaacacag agctttcata ccagcttttg cttgattcca ttggtgatag    19980 
aaccaggtac ttttctatgt ggaatcaggc tgttgacagc tatgatccag atgttagaat    20040 
tattgaaaat catggaactg aagatgaact tccaaattac tgctttccac tgggaggtgt    20100 
gattaataca gagactctta ccaaggtaaa acctaaaaca ggtcaggaaa atggatggga    20160 
aaaagatgct acagaatttt cagataaaaa tgaaataaga gttggaaata attttgccat    20220 
ggaaatcaat ctaaatgcca acctgtggag aaatttcctg tactccaaca tagcgctgta    20280 
tttgcccgac aagctaaagt acagtccttc caacgtaaaa atttctgata acccaaacac    20340 
ctacgactac atgaacaagc gagtggtggc tcccgggtta gtggactgct acattaacct    20400 
tggagcacgc tggtcccttg actatatgga caacgtcaac ccatttaacc accaccgcaa    20460 
tgctggcctg cgctaccgct caatgttgct gggcaatggt cgctatgtgc ccttccacat    20520 
ccaggtgcct cagaagttct ttgccattaa aaacctcctt ctcctgccgg gctcatacac    20580 
ctacgagtgg aacttcagga aggatgttaa catggttctg cagagctccc taggaaatga    20640 
cctaagggtt gacggagcca gcattaagtt tgatagcatt tgcctttacg ccaccttctt    20700 
ccccatggcc cacaacaccg cctccacgct tgaggccatg cttagaaacg acaccaacga    20760 
ccagtccttt aacgactatc tctccgccgc caacatgctc taccctatac ccgccaacgc    20820 
taccaacgtg cccatatcca tcccctcccg caactgggcg gctttccgcg gctgggcctt    20880 
cacgcgcctt aagactaagg aaaccccatc actgggctcg ggctacgacc cttattacac    20940 
ctactctggc tctataccct acctagatgg aaccttttac ctcaaccaca cctttaagaa    21000 
ggtggccatt acctttgact cttctgtcag ctggcctggc aatgaccgcc tgcttacccc    21060 
caacgagttt gaaattaagc gctcagttga cggggagggt tacaacgttg cccagtgtaa    21120 
catgaccaaa gactggttcc tggtacaaat gctagctaac tacaacattg gctaccaggg    21180 
cttctatatc ccagagagct acaaggaccg catgtactcc ttctttagaa acttccagcc    21240 
catgagccgt caggtggtgg atgatactaa atacaaggac taccaacagg tgggcatcct    21300 
acaccaacac aacaactctg gatttgttgg ctaccttgcc cccaccatgc gcgaaggaca    21360 
ggcctaccct gctaacttcc cctatccgct tataggcaag accgcagttg acagcattac    21420 
ccagaaaaag tttctttgcg atcgcaccct ttggcgcatc ccattctcca gtaactttat    21480 
gtccatgggc gcactcacag acctgggcca aaaccttctc tacgccaact ccgcccacgc    21540 
gctagacatg acttttgagg tggatcccat ggacgagccc acccttcttt atgttttgtt    21600 
tgaagtcttt gacgtggtcc gtgtgcaccg gccgcaccgc ggcgtcatcg aaaccgtgta    21660 
cctgcgcacg cccttctcgg ccggcaacgc cacaacataa agaagcaagc aacatcaaca    21720 
acagctgccg ccatgggctc cagtgagcag gaactgaaag ccattgtcaa agatcttggt    21780 
tgtgggccat attttttggg cacctatgac aagcgctttc caggctttgt ttctccacac    21840 
aagctcgcct gcgccatagt caatacggcc ggtcgcgaga ctgggggcgt acactggatg    21900 
gcctttgcct ggaacccgca ctcaaaaaca tgctacctct ttgagccctt tggcttttct    21960 
gaccagcgac tcaagcaggt ttaccagttt gagtacgagt cactcctgcg ccgtagcgcc    22020 
attgcttctt cccccgaccg ctgtataacg ctggaaaagt ccacccaaag cgtacagggg    22080 
cccaactcgg ccgcctgtgg actattctgc tgcatgtttc tccacgcctt tgccaactgg    22140 
ccccaaactc ccatggatca caaccccacc atgaacctta ttaccggggt acccaactcc    22200 
atgctcaaca gtccccaggt acagcccacc ctgcgtcgca accaggaaca gctctacagc    22260 
ttcctggagc gccactcgcc ctacttccgc agccacagtg cgcagattag gagcgccact    22320 
tctttttgtc acttgaaaaa catgtaaaaa taatgtacta gagacacttt caataaaggc    22380 
aaatgctttt atttgtacac tctcgggtga ttatttaccc ccacccttgc cgtctgcgcc    22440 
gtttaaaaat caaaggggtt ctgccgcgca tcgctatgcg ccactggcag ggacacgttg    22500 
cgatactggt gtttagtgct ccacttaaac tcaggcacaa ccatccgcgg cagctcggtg    22560 
aagttttcac tccacaggct gcgcaccatc accaacgcgt ttagcaggtc gggcgccgat    22620 
atcttgaagt cgcagttggg gcctccgccc tgcgcgcgcg agttgcgata cacagggttg    22680 
cagcactgga acactatcag cgccgggtgg tgcacgctgg ccagcacgct cttgtcggag    22740 
atcagatccg cgtccaggtc ctccgcgttg ctcagggcga acggagtcaa ctttggtagc    22800 
tgccttccca aaaagggcgc gtgcccaggc tttgagttgc actcgcaccg tagtggcatc    22860 
aaaaggtgac cgtgcccggt ctgggcgtta ggatacagcg cctgcataaa agccttgatc    22920 
tgcttaaaag ccacctgagc ctttgcgcct tcagagaaga acatgccgca agacttgccg    22980 
gaaaactgat tggccggaca ggccgcgtcg tgcacgcagc accttgcgtc ggtgttggag    23040 
atctgcacca catttcggcc ccaccggttc ttcacgatct tggccttgct agactgctcc    23100 
ttcagcgcgc gctgcccgtt ttcgctcgtc acatccattt caatcacgtg ctccttattt    23160 
atcataatgc ttccgtgtag acacttaagc tcgccttcga tctcagcgca gcggtgcagc    23220 
cacaacgcgc agcccgtggg ctcgtgatgc ttgtaggtca cctctgcaaa cgactgcagg    23280 
tacgcctgca ggaatcgccc catcatcgtc acaaaggtct tgttgctggt gaaggtcagc    23340 
tgcaacccgc ggtgctcctc gttcagccag gtcttgcata cggccgccag agcttccact    23400 
tggtcaggca gtagtttgaa gttcgccttt agatcgttat ccacgtggta cttgtccatc    23460 
agcgcgcgcg cagcctccat gcccttctcc cacgcagaca cgatcggcac actcagcggg    23520 
ttcatcaccg taatttcact ttccgcttcg ctgggctctt cctcttcctc ttgcgtccgc    23580 
ataccacgcg ccactgggtc gtcttcattc agccgccgca ctgtgcgctt acctcctttg    23640 
ccatgcttga ttagcaccgg tgggttgctg aaacccacca tttgtagcgc cacatcttct    23700 
ctttcttcct cgctgtccac gattacctct ggtgatggcg ggcgctcggg cttgggagaa    23760 
gggcgcttct ttttcttctt gggcgcaatg gccaaatccg ccgccgaggt cgatggccgc    23820 
gggctgggtg tgcgcggcac cagcgcgtct tgtgatgagt cttcctcgtc ctcggactcg    23880 
atacgccgcc tcatccgctt ttttgggggc gcccggggag gcggcggcga cggggacggg    23940 
gacgacacgt cctccatggt tgggggacgt cgcgccgcac cgcgtccgcg ctcgggggtg    24000 
gtttcgcgct gctcctcttc ccgactggcc atttccttct cctataggca gaaaaagatc    24060 
atggagtcag tcgagaagaa ggacagccta accgccccct ctgagttcgc caccaccgcc    24120 
tccaccgatg ccgccaacgc gcctaccacc ttccccgtcg aggcaccccc gcttgaggag    24180 
gaggaagtga ttatcgagca ggacccaggt tttgtaagcg aagacgacga ggaccgctca    24240 
gtaccaacag aggataaaaa gcaagaccag gacaacgcag aggcaaacga ggaacaagtc    24300 
gggcgggggg acgaaaggca tggcgactac ctagatgtgg gagacgacgt gctgttgaag    24360 
catctgcagc gccagtgcgc cattatctgc gacgcgttgc aagagcgcag cgatgtgccc    24420 
ctcgccatag cggatgtcag ccttgcctac gaacgccacc tattctcacc gcgcgtaccc    24480 
cccaaacgcc aagaaaacgg cacatgcgag cccaacccgc gcctcaactt ctaccccgta    24540 
tttgccgtgc cagaggtgct tgccacctat cacatctttt tccaaaactg caagataccc    24600 
ctatcctgcc gtgccaaccg cagccgagcg gacaagcagc tggccttgcg gcagggcgct    24660 
gtcatacctg atatcgcctc gctcaacgaa gtgccaaaaa tctttgaggg tcttggacgc    24720 
gacgagaagc gcgcggcaaa cgctctgcaa caggaaaaca gcgaaaatga aagtcactct    24780 
ggagtgttgg tggaactcga gggtgacaac gcgcgcctag ccgtactaaa acgcagcatc    24840 
gaggtcaccc actttgccta cccggcactt aacctacccc ccaaggtcat gagcacagtc    24900 
atgagtgagc tgatcgtgcg ccgtgcgcag cccctggaga gggatgcaaa tttgcaagaa    24960 
caaacagagg agggcctacc cgcagttggc gacgagcagc tagcgcgctg gcttcaaacg    25020 
cgcgagcctg ccgacttgga ggagcgacgc aaactaatga tggccgcagt gctcgttacc    25080 
gtggagcttg agtgcatgca gcggttcttt gctgacccgg agatgcagcg caagctagag    25140 
gaaacattgc actacacctt tcgacagggc tacgtacgcc aggcctgcaa gatctccaac    25200 
gtggagctct gcaacctggt ctcctacctt ggaattttgc acgaaaaccg ccttgggcaa    25260 
aacgtgcttc attccacgct caagggcgag gcgcgccgcg actacgtccg cgactgcgtt    25320 
tacttatttc tatgctacac ctggcagacg gccatgggcg tttggcagca gtgcttggag    25380 
gagtgcaacc tcaaggagct gcagaaactg ctaaagcaaa acttgaagga cctatggacg    25440 
gccttcaacg agcgctccgt ggccgcgcac ctggcggaca tcattttccc cgaacgcctg    25500 
cttaaaaccc tgcaacaggg tctgccagac ttcaccagtc aaagcatgtt gcagaacttt    25560 
aggaacttta tcctagagcg ctcaggaatc ttgcccgcca cctgctgtgc acttcctagc    25620 
gactttgtgc ccattaagta ccgcgaatgc cctccgccgc tttggggcca ctgctacctt    25680 
ctgcagctag ccaactacct tgcctaccac tctgacataa tggaagacgt gagcggtgac    25740 
ggtctactgg agtgtcactg tcgctgcaac ctatgcaccc cgcaccgctc cctggtttgc    25800 
aattcgcagc tgcttaacga aagtcaaatt atcggtacct ttgagctgca gggtccctcg    25860 
cctgacgaaa agtccgcggc tccggggttg aaactcactc cggggctgtg gacgtcggct    25920 
taccttcgca aatttgtacc tgaggactac cacgcccacg agattaggtt ctacgaagac    25980 
caatcccgcc cgccaaatgc ggagcttacc gcctgcgtca ttacccaggg ccacattctt    26040 
ggccaattgc aagccatcaa caaagcccgc caagagtttc tgctacgaaa gggacggggg    26100 
gtttacttgg acccccagtc cggcgaggag ctcaacccaa tccccccgcc gccgcagccc    26160 
tatcagcagc agccgcgggc ccttgcttcc caggatggca cccaaaaaga agctgcagct    26220 
gccgccgcca cccacggacg aggaggaata ctgggacagt caggcagagg aggttttgga    26280 
cgaggaggag gaggacatga tggaagactg ggagagccta gacgaggaag cttccgaggt    26340 
cgaagaggtg tcagacgaaa caccgtcacc ctcggtcgca ttcccctcgc cggcgcccca    26400 
gaaatcggca accggttcca gcatggctac aacctccgct cctcaggcgc cgccggcact    26460 
gcccgttcgc cgacccaacc gtagatggga caccactgga accagggccg gtaagtccaa    26520 
gcagccgccg ccgttagccc aagagcaaca acagcgccaa ggctaccgct catggcgcgg    26580 
gcacaagaac gccatagttg cttgcttgca agactgtggg ggcaacatct ccttcgcccg    26640 
ccgctttctt ctctaccatc acggcgtggc cttcccccgt aacatcctgc attactaccg    26700 
tcatctctac agcccatact gcaccggcgg cagcggcagc ggcagcaaca gcagcggcca    26760 
cacagaagca aaggcgaccg gatagcaaga ctctgacaaa gcccaagaaa tccacagcgg    26820 
cggcagcagc aggaggagga gcgctgcgtc tggcgcccaa cgaacccgta tcgacccgcg    26880 
agcttagaaa caggattttt cccactctgt atgctatatt tcaacagagc aggggccaag    26940 
aacaagagct gaaaataaaa aacaggtctc tgcgatccct cacccgcagc tgcctgtatc    27000 
acaaaagcga agatcagctt cggcgcacgc tggaagacgc ggaggctctc ttcagtaaat    27060 
actgcgcgct gactcttaag gactagtttc gcgccctttc tcaaatttaa gcgcgaaaac    27120 
tacgtcatct ccagcggcca cacccggcgc cagcacctgt cgtcagcgcc attatgagca    27180 
aggaaattcc cacgccctac atgtggagtt accagccaca aatgggactt gcggctggag    27240 
ctgcccaaga ctactcaacc cgaataaact acatgagcgc gggaccccac atgatatccc    27300 
gggtcaacgg aatccgcgcc caccgaaacc gaattctctt ggaacaggcg gctattacca    27360 
ccacacctcg taataacctt aatccccgta gttggcccgc tgccctggtg taccaggaaa    27420 
gtcccgctcc caccactgtg gtacttccca gagacgccca ggccgaagtt cagatgacta    27480 
actcaggggc gcagcttgcg ggcggctttc gtcacagggt gcggtcgccc gggcagggta    27540 
taactcacct gacaatcaga gggcgaggta ttcagctcaa cgacgagtcg gtgagctcct    27600 
cgcttggtct ccgtccggac gggacatttc agatcggcgg cgccggccgt ccttcattca    27660 
cgcctcgtca ggcaatccta actctgcaga cctcgtcctc tgagccgcgc tctggaggca    27720 
ttggaactct gcaatttatt gaggagtttg tgccatcggt ctactttaac cccttctcgg    27780 
gacctcccgg ccactatccg gatcaattta ttcctaactt tgacgcggta aaggactcgg    27840 
cggacggcta cgactgaatg ttaagtggag aggcagagca actgcgcctg aaacacctgg    27900 
tccactgtcg ccgccacaag tgctttgccc gcgactccgg tgagttttgc tactttgaat    27960 
tgcccgagga tcatatcgag ggcccggcgc acggcgtccg gcttaccgcc cagggagagc    28020 
ttgcccgtag cctgattcgg gagtttaccc agcgccccct gctagttgag cgggacaggg    28080 
gaccctgtgt tctcactgtg atttgcaact gtcctaacct tggattacat caagatcttt    28140 
gttgccatct ctgtgctgag tataataaat acagaaatta aaatatactg gggctcctat    28200 
cgccatcctg taaacgccac cgtcttcacc cgcccaagca aaccaaggcg aaccttacct    28260 
ggtactttta acatctctcc ctctgtgatt tacaacagtt tcaacccaga cggagtgagt    28320 
ctacgagaga acctctccga gctcagctac tccatcagaa aaaacaccac cctccttacc    28380 
tgccgggaac gtacgagtgc gtcaccggcc gctgcaccac acctaccgcc tgaccgtaaa    28440 
ccagactttt tccggacaga cctcaataac tctgtttacc agaacaggag gtgagcttag    28500 
aaaaccctta gggtattagg ccaaaggcgc agctactgtg gggtttatga acaattcaag    28560 
caactctacg ggctattcta attcaggttt ctctagaatc ggggttgggg ttattctctg    28620 
tcttgtgatt ctctttattc ttatactaac gcttctctgc ctaaggctcg ccgcctgctg    28680 
tgtgcacatt tgcatttatt gtcagctttt taaacgctgg ggtcgccacc caagatgatt    28740 
aggtacataa tcctaggttt actcaccctt gcgtcagccc acggtaccac ccaaaaggtg    28800 
gattttaagg agccagcctg taatgttaca ttcgcagctg aagctaatga gtgcaccact    28860 
cttataaaat gcaccacaga acatgaaaag ctgcttattc gccacaaaaa caaaattggc    28920 
aagtatgctg tttatgctat ttggcagcca ggtgacacta cagagtataa tgttacagtt    28980 
ttccagggta aaagtcataa aacttttatg tatacttttc cattttatga aatgtgcgac    29040 
attaccatgt acatgagcaa acagtataag ttgtggcccc cacaaaattg tgtggaaaac    29100 
actggcactt tctgctgcac tgctatgcta attacagtgc tcgctttggt ctgtacccta    29160 
ctctatatta aatacaaaag cagacgcagc tttattgagg aaaagaaaat gccttaattt    29220 
actaagttac aaagctaatg tcaccactaa ctgctttact cgctgcttgc aaaacaaatt    29280 
caaaaagtta gcattataat tagaatagga tttaaacccc ccggtcattt cctgctcaat    29340 
accattcccc tgaacaattg actctatgtg ggatatgctc cagcgctaca accttgaagt    29400 
caggcttcct ggatgtcagc atctgacttt ggccagcacc tgtcccgcgg atttgttcca    29460 
gtccaactac agcgacccac cctaacagag atgaccaaca caaccaacgc ggccgccgct    29520 
accggactta catctaccac aaatacaccc caagtttctg cctttgtcaa taactgggat    29580 
aacttgggca tgtggtggtt ctccatagcg cttatgtttg tatgccttat tattatgtgg    29640 
ctcatctgct gcctaaagcg caaacgcgcc cgaccaccca tctatagtcc catcattgtg    29700 
ctacacccaa acaatgatgg aatccataga ttggacggac tgaaacacat gttcttttct    29760 
cttacagtat gattaaatga gacatgattc ctcgagtttt tatattactg acccttgttg    29820 
cgcttttttg tgcgtgctcc acattggctg cggtttctca catcgaagta gactgcattc    29880 
cagccttcac agtctatttg ctttacggat ttgtcaccct cacgctcatc tgcagcctca    29940 
tcactgtggt catcgccttt atccagtgca ttgactgggt ctgtgtgcgc tttgcatatc    30000 
tcagacacca tccccagtac agggacagga ctatagctga gcttcttaga attctttaat    30060 
tatgaaattt actgtgactt ttctgctgat tatttgcacc ctatctgcgt tttgttcccc    30120 
gacctccaag cctcaaagac atatatcatg cagattcact cgtatatgga atattccaag    30180 
ttgctacaat gaaaaaagcg atctttccga agcctggtta tatgcaatca tctctgttat    30240 
ggtgttctgc agtaccatct tagccctagc tatatatccc taccttgaca ttggctggaa    30300 
acgaatagat gccatgaacc acccaacttt ccccgcgccc gctatgcttc cactgcaaca    30360 
agttgttgcc ggcggctttg tcccagccaa tcagcctcgc cccacttctc ccacccccac    30420 
tgaaatcagc tactttaatc taacaggagg agatgactga caccctagat ctagaaatgg    30480 
acggaattat tacagagcag cgcctgctag aaagacgcag ggcagcggcc gagcaacagc    30540 
gcatgaatca agagctccaa gacatggtta acttgcacca gtgcaaaagg ggtatctttt    30600 
gtctggtaaa gcaggccaaa gtcacctacg acagtaatac caccggacac cgccttagct    30660 
acaagttgcc aaccaagcgt cagaaattgg tggtcatggt gggagaaaag cccattacca    30720 
taactcagca ctcggtagaa accgaaggct gcattcactc accttgtcaa ggacctgagg    30780 
atctctgcac ccttattaag accctgtgcg gtctcaaaga tcttattccc tttaactaat    30840 
aaaaaaaaat aataaagcat cacttactta aaatcagtta gcaaatttct gtccagttta    30900 
ttcagcagca cctccttgcc ctcctcccag ctctggtatt gcagcttcct cctggctgca    30960 
aactttctcc acaatctaaa tggaatgtca gtttcctcct gttcctgtcc atccgcaccc    31020 
actatcttca tgttgttgca gatgaagcgc gcaagaccgt ctgaagatac cttcaacccc    31080 
gtgtatccat atgacacgga aaccggtcct ccaactgtgc cttttcttac tcctcccttt    31140 
gtatccccca atgggtttca agagagtccc cctggggtac tctctttgcg cctatccgaa    31200 
cctctagtta cctccaatgg catgcttgcg ctcaaaatgg gcaacggcct ctctctggac    31260 
gaggccggca accttacctc ccaaaatgta accactgtga gcccacctct caaaaaaacc    31320 
aagtcaaaca taaacctgga aatatctgca cccctcacag ttacctcaga agccctaact    31380 
gtggctgccg ccgcacctct aatggtcgcg ggcaacacac tcaccatgca atcacaggcc    31440 
ccgctaaccg tgcacgactc caaacttagc attgccaccc aaggacccct cacagtgtca    31500 
gaaggaaagc tagccctgca aacatcaggc cccctcacca ccaccgatag cagtaccctt    31560 
actatcactg cctcaccccc tctaactact gccactggta gcttgggcat tgacttgaaa    31620 
gagcccattt atacacaaaa tggaaaacta ggactaaagt acggggctcc tttgcatgta    31680 
acagacgacc taaacacttt gaccgtagca actggtccag gtgtgactat taataatact    31740 
tccttgcaaa ctaaagttac tggagccttg ggttttgatt cacaaggcaa tatgcaactt    31800 
aatgtagcag gaggactaag gattgattct caaaacagac gccttatact tgatgttagt    31860 
tatccgtttg atgctcaaaa ccaactaaat ctaagactag gacagggccc tctttttata    31920 
aactcagccc acaacttgga tattaactac aacaaaggcc tttacttgtt tacagcttca    31980 
aacaattcca aaaagcttga ggttaaccta agcactgcca aggggttgat gtttgacgct    32040 
acagccatag ccattaatgc aggagatggg cttgaatttg gttcacctaa tgcaccaaac    32100 
acaaatcccc tcaaaacaaa aattggccat ggcctagaat ttgattcaaa caaggctatg    32160 
gttcctaaac taggaactgg ccttagtttt gacagcacag gtgccattac agtaggaaac    32220 
aaaaataatg ataagctaac tttgtggacc acaccagctc catctcctaa ctgtagacta    32280 
aatgcagaga aagatgctaa actcactttg gtcttaacaa aatgtggcag tcaaatactt    32340 
gctacagttt cagttttggc tgttaaaggc agtttggctc caatatctgg aacagttcaa    32400 
agtgctcatc ttattataag atttgacgaa aatggagtgc tactaaacaa ttccttcctg    32460 
gacccagaat attggaactt tagaaatgga gatcttactg aaggcacagc ctatacaaac    32520 
gctgttggat ttatgcctaa cctatcagct tatccaaaat ctcacggtaa aactgccaaa    32580 
agtaacattg tcagtcaagt ttacttaaac ggagacaaaa ctaaacctgt aacactaacc    32640 
attacactaa acggtacaca ggaaacagga gacacaactc caagtgcata ctctatgtca    32700 
ttttcatggg actggtctgg ccacaactac attaatgaaa tatttgccac atcctcttac    32760 
actttttcat acattgccca agaataaaga atcgtttgtg ttatgtttca acgtgtttat    32820 
ttttcaattg cagaaaattt caagtcattt ttcattcagt agtatagccc caccaccaca    32880 
tagcttatac agatcaccgt accttaatca aactcacaga accctagtat tcaacctgcc    32940 
acctccctcc caacacacag agtacacagt cctttctccc cggctggcct taaaaagcat    33000 
catatcatgg gtaacagaca tattcttagg tgttatattc cacacggttt cctgtcgagc    33060 
caaacgctca tcagtgatat taataaactc cccgggcagc tcacttaagt tcatgtcgct    33120 
gtccagctgc tgagccacag gctgctgtcc aacttgcggt tgcttaacgg gcggcgaagg    33180 
agaagtccac gcctacatgg gggtagagtc ataatcgtgc atcaggatag ggcggtggtg    33240 
ctgcagcagc gcgcgaataa actgctgccg ccgccgctcc gtcctgcagg aatacaacat    33300 
ggcagtggtc tcctcagcga tgattcgcac cgcccgcagc ataaggcgcc ttgtcctccg    33360 
ggcacagcag cgcaccctga tctcacttaa atcagcacag taactgcagc acagcaccac    33420 
aatattgttc aaaatcccac agtgcaaggc gctgtatcca aagctcatgg cggggaccac    33480 
agaacccacg tggccatcat accacaagcg caggtagatt aagtggcgac ccctcataaa    33540 
cacgctggac ataaacatta cctcttttgg catgttgtaa ttcaccacct cccggtacca    33600 
tataaacctc tgattaaaca tggcgccatc caccaccatc ctaaaccagc tggccaaaac    33660 
ctgcccgccg gctatacact gcagggaacc gggactggaa caatgacagt ggagagccca    33720 
ggactcgtaa ccatggatca tcatgctcgt catgatatca atgttggcac aacacaggca    33780 
cacgtgcata cacttcctca ggattacaag ctcctcccgc gttagaacca tatcccaggg    33840 
aacaacccat tcctgaatca gcgtaaatcc cacactgcag ggaagacctc gcacgtaact    33900 
cacgttgtgc attgtcaaag tgttacattc gggcagcagc ggatgatcct ccagtatggt    33960 
agcgcgggtt tctgtctcaa aaggaggtag acgatcccta ctgtacggag tgcgccgaga    34020 
caaccgagat cgtgttggtc gtagtgtcat gccaaatgga acgccggacg tagtcatatt    34080 
tcctgaagca aaaccaggtg cgggcgtgac aaacagatct gcgtctccgg tctcgccgct    34140 
tagatcgctc tgtgtagtag ttgtagtata tccactctct caaagcatcc aggcgccccc    34200 
tggcttcggg ttctatgtaa actccttcat gcgccgctgc cctgataaca tccaccaccg    34260 
cagaataagc cacacccagc caacctacac attcgttctg cgagtcacac acgggaggag    34320 
cgggaagagc tggaagaacc atgttttttt ttttattcca aaagattatc caaaacctca    34380 
aaatgaagat ctattaagtg aacgcgctcc cctccggtgg cgtggtcaaa ctctacagcc    34440 
aaagaacaga taatggcatt tgtaagatgt tgcacaatgg cttccaaaag gcaaacggcc    34500 
ctcacgtcca agtggacgta aaggctaaac ccttcagggt gaatctcctc tataaacatt    34560 
ccagcacctt caaccatgcc caaataattc tcatctcgcc accttctcaa tatatctcta    34620 
agcaaatccc gaatattaag tccggccatt gtaaaaatct gctccagagc gccctccacc    34680 
ttcagcctca agcagcgaat catgattgca aaaattcagg ttcctcacag acctgtataa    34740 
gattcaaaag cggaacatta acaaaaatac cgcgatcccg taggtccctt cgcagggcca    34800 
gctgaacata atcgtgcagg tctgcacgga ccagcgcggc cacttccccg ccaggaacct    34860 
tgacaaaaga acccacactg attatgacac gcatactcgg agctatgcta accagcgtag    34920 
ccccgatgta agctttgttg catgggcggc gatataaaat gcaaggtgct gctcaaaaaa    34980 
tcaggcaaag cctcgcgcaa aaaagaaagc acatcgtagt catgctcatg cagataaagg    35040 
caggtaagct ccggaaccac cacagaaaaa gacaccattt ttctctcaaa catgtctgcg    35100 
ggtttctgca taaacacaaa ataaaataac aaaaaaacat ttaaacatta gaagcctgtc    35160 
ttacaacagg aaaaacaacc cttataagca taagacggac tacggccatg ccggcgtgac    35220 
cgtaaaaaaa ctggtcaccg tgattaaaaa gcaccaccga cagctcctcg gtcatgtccg    35280 
gagtcataat gtaagactcg gtaaacacat caggttgatt catcggtcag tgctaaaaag    35340 
cgaccgaaat agcccggggg aatacatacc cgcaggcgta gagacaacat tacagccccc    35400 
ataggaggta taacaaaatt aataggagag aaaaacacat aaacacctga aaaaccctcc    35460 
tgcctaggca aaatagcacc ctcccgctcc agaacaacat acagcgcttc acagcggcag    35520 
cctaacagtc agccttacca gtaaaaaaga aaacctatta aaaaaacacc actcgacacg    35580 
gcaccagctc aatcagtcac agtgtaaaaa agggccaagt gcagagcgag tatatatagg    35640 
actaaaaaat gacgtaacgg ttaaagtcca caaaaaacac ccagaaaacc gcacgcgaac    35700 
ctacgcccag aaacgaaagc caaaaaaccc acaacttcct caaatcgtca cttccgtttt    35760 
cccacgttac gtaacttccc attttaagaa aactacaatt cccaacacat acaagttact    35820 
ccgccctaaa acctacgtca cccgccccgt tcccacgccc cgcgccacgt cacaaactcc    35880 
accccctcat tatcatattg gcttcaatcc aaaataaggt atattattga tgatg         35935 
<210>10 
<211>5965 
<212>DNA 
<213>人工序列 
<220> 
<223>NSsuboptmut 
<400>10 
gccaccatgg cccccatcac cgcctacagc cagcagacca ggggcctgct gggctgcatc     60 
atcaccagcc tgaccggacg cgacaagaac caggtggagg gagaggtgca ggtggtgagc    120 
accgctaccc agagcttcct ggccacctgc gtgaacggcg tgtgctggac cgtgtaccac    180 
ggagccggaa gcaagaccct ggccggaccc aagggcccta tcacccagat gtacaccaat    240 
gtggatcagg atctggtggg ctggcaggcc cctcccggag ccaggagcct gacaccctgt    300 
acctgtggaa gcagcgacct gtacctggtg acacgccacg ccgatgtgat ccccgtgagg    360 
cgcaggggcg attctcgcgg aagcctgctg agccctaggc ccgtgagcta cctgaagggc    420 
agcagcggag gacccctgct gtgtccttct ggccatgccg tgggcatttt tcgcgctgcc    480 
gtgtgtacca ggggcgtggc caaagccgtg gattttgtgc ccgtggaaag catggagacc     540 
accatgcgca gccctgtgtt caccgacaac agctctcccc ctgccgtgcc ccaatcattc     600 
caggtggctc acctgcacgc ccctaccgga tctggcaaga gcaccaaggt gcccgctgcc     660 
tacgccgctc agggctacaa ggtgctggtg ctgaacccca gcgtggccgc taccctgggc     720 
ttcggcgctt acatgagcaa ggcccatggc atcgacccca acatccgcac aggcgtgcgc     780 
accatcacca ccggagctcc cgtgacctac agcacctacg gcaagttcct ggccgatgga     840 
ggctgcagcg gaggagccta cgacatcatc atctgcgacg agtgccacag caccgacagc     900 
accaccatcc tgggcattgg caccgtgctg gatcaggccg aaacagctgg agccaggctg     960 
gtggtgctgg ccacagctac ccctcctggc agcgtgaccg tgccccatcc caatatcgag    1020 
gaggtggccc tgagcaacac aggcgagatc cccttctacg gcaaggccat ccccatcgag    1080 
gccatccgcg gaggcaggca cctgatcttc tgccacagca agaagaagtg cgacgagctg    1140 
gctgccaagc tgagcggact gggcatcaac gccgtggcct actacagggg cctggacgtg    1200 
tcagtgatcc ccaccatcgg cgatgtggtg gtggtggcca ccgacgccct gatgacaggc    1260 
tacaccggag acttcgacag cgtgatcgac tgcaacacct gcgtgaccca gaccgtggac    1320 
ttcagcctgg accccacctt caccatcgaa accaccaccg tgcctcagga tgctgtgagc    1380 
aggagccaga ggcgcggacg caccggaagg ggcaggcgcg gaatttatcg ctttgtgacc    1440 
cctggcgaaa ggccctctgg catgttcgac agcagcgtgc tgtgcgagtg ctacgacgct    1500 
ggctgcgctt ggtacgagct gacacccgct gaaaccagcg tgcgcctgcg cgcttatctg    1560 
aatacccctg gcctgcccgt gtgtcaggac cacctggagt tctgggagag cgtgttcaca    1620 
ggactgaccc acatcgacgc ccatttcctg agccagacca agcaggctgg cgacaacttc    1680 
ccctatctgg tggcctatca ggccaccgtg tgtgctaggg cccaagctcc acctccttca    1740 
tgggaccaga tgtggaagtg cctgatccgc ctgaagccca ccctgcacgg ccctacccct    1800 
ctgctgtacc gcctgggagc cgtgcagaac gaggtgaccc tgacccaccc catcaccaag    1860 
tacatcatgg cctgcatgag cgctgatctg gaagtggtga ccagcacctg ggtgctggtg    1920 
ggaggcgtgc tggccgctct ggctgcctac tgcctgacca ccggaagcgt ggtgatcgtg    1980 
ggacgcatca tcctgagcgg aaggcccgct atcgtgcccg atcgcgagtt cctgtaccag    2040 
gagttcgacg agatggagga gtgtgccagc cacctgccct acatcgagca gggcatgcag    2100 
ctggccgaac agttcaagca gaaggccctg ggcctgctgc agacagccac caaacaggcc    2160 
gaagctgccg ctcccgtggt ggaaagcaag tggagggccc tggagacctt ctgggctaag    2220 
cacatgtgga acttcatctc tggcatccag tacctggccg gactgagcac cctgcctggc    2280 
aaccccgcta tcgccagcct gatggccttc accgctagca tcacctctcc cctgaccacc    2340 
cagagcaccc tgctgttcaa cattctgggc ggatgggtgg ccgctcagct ggcccctcct    2400 
tcagctgctt ctgcctttgt gggcgctggc attgccggag ccgctgtggg cagcattggc    2460 
ctgggcaaag tgctggtgga tattctggct ggctatggcg ctggcgtggc cggagccctg    2520 
gtggccttca aggtgatgag cggagagatg cccagcaccg aggacctggt gaacctgctg    2580 
cctgccattc tgagccctgg agccctggtg gtgggcgtgg tgtgtgctgc cattctgagg    2640 
cgccatgtgg gacccggaga gggcgctgtg cagtggatga accgcctgat cgccttcgcc    2700 
tctcgcggaa accacgtgag ccctacccac tacgtgcctg agagcgacgc cgctgccagg    2760 
gtgacccaga tcctgagcag cctgaccatc acccagctgc tgaagcgcct gcaccagtgg    2820 
atcaacgagg actgcagcac accctgcagc ggaagctggc tgagggacgt gtgggactgg    2880 
atctgcaccg tgctgaccga cttcaagacc tggctgcaga gcaagctgct gccccaactg    2940 
cctggcgtgc ccttcttctc atgccagcgc ggatacaagg gcgtgtggag gggcgatggc    3000 
atcatgcaga ccacctgtcc ctgcggagcc cagatcacag gccacgtgaa gaacggcagc    3060 
atgcgcatcg tgggccctaa gacctgcagc aacacctggc acggcacctt ccccatcaac    3120 
gcctacacca ccggaccctg cacacccagc cctgctccca actacagcag ggccctgtgg    3180 
agggtggctg ccgaggagta cgtggaggtg accagggtgg gagacttcca ctacgtgacc    3240 
ggaatgacca ccgacaacgt gaagtgtccc tgtcaggtgc ccgctcccga attttttacc    3300 
gaagtggatg gcgtgcgcct gcatcgctat gcccctgcct gtaggcccct gctgcgcgaa    3360 
gaagtgacct tccaggtggg cctgaaccag tacctggtgg gcagccagct gccctgcgag    3420 
cctgagcccg atgtggccgt gctgaccagc atgctgaccg accccagcca catcacagcc    3480 
gaaaccgcta aaaggcgcct ggccaggggc tctcctccaa gcctggcctc aagcagcgct    3540 
agccagctgt ctgctcccag cctgaaggcc acctgcacca cccaccacgt gagccccgac    3600 
gccgacctga tcgaggccaa cctgctgtgg cgccaggaga tgggcggcaa catcacccgc    3660 
gtggagagcg agaacaaggt ggtggtgctg gacagcttcg accccctgcg cgccgaggag    3720 
gacgagcgcg aggtgagcgt gcccgccgag atcctgcgca agagcaagaa gttccccgct    3780 
gccatgccca tctgggctag acctgattac aaccctcccc tgctggagag ctggaaggac    3840 
cctgattacg tgcctccagt ggtgcatggc tgtcctctgc ctcccattaa agcccctcct    3900 
attccacctc ctaggcgcaa aaggaccgtg gtgctgacag aaagcagcgt gagctctgct    3960 
ctggccgaac tggccaccaa gacctttggc agcagcgaga gctctgccgt ggacagcgga    4020 
acagccaccg ctctgcctga ccaggccagc gacgacggcg ataagggcag cgatgtggag    4080 
agctatagca gcatgcctcc cctggaaggc gaacctggcg atcccgatct gagcgatggc    4140 
agctggagca ccgtgagcga agaggccagc gaggacgtgg tgtgttgcag catgagctac    4200 
acctggacag gcgctctgat cacaccctgc gctgccgagg agagcaagct gcccatcaac    4260 
gccctgagca acagcctgct gaggcaccac aacatggtgt acgccaccac cagcaggtct    4320 
gccggactga ggcagaagaa ggtgaccttc gaccgcctgc aggtgctgga cgaccactac    4380 
cgcgatgtgc tgaaggagat gaaggccaag gccagcaccg tgaaggccaa gctgctgagc    4440 
gtggaggagg cctgcaagct gacccccccc cacagcgcca agagcaagtt cggctacggc    4500 
gccaaggacg tgcgcaacct gagcagcaag gccgtgaacc acatccacag cgtgtggaag    4560 
gacctgctgg aggacaccgt gacccccatc gacaccacca tcatggccaa gaacgaggtg    4620 
ttctgcgtgc agcccgagaa gggcggccgc aagcccgctc gcctgatcgt gttccccgat    4680 
ctgggcgtgc gcgtgtgcga gaagatggcc ctgtacgacg tggtgagcac cctgcctcag    4740 
gtggtgatgg gctcaagcta cggcttccag tacagccctg gccagcgcgt ggagttcctg    4800 
gtgaacacct ggaagagcaa gaagaacccc atgggcttca gctacgacac acgctgcttc    4860 
gacagcaccg tgaccgagaa cgacatccgc gtggaggaga gcatctacca gtgctgcgac    4920 
ctggcccctg aggccaggca ggccatcaag agcctgaccg agcgcctgta catcggaggc    4980 
cctctgacca acagcaaggg acagaactgc ggatacaggc gctgtagggc ctctggcgtg    5040 
ctgaccacca gctgtggcaa caccctgacc tgctacctga aggccagcgc tgcctgtcgc    5100 
gctgccaagc tgcaggactg caccatgctg gtgaacgccg ctggcctggt ggtgatttgt    5160 
gaaagcgctg gcacccagga agatgctgcc agcctgcgcg tgttcaccga ggccatgacc    5220 
aggtactctg cccctcccgg agacccccct cagcccgaat acgacctgga gctgatcacc    5280 
agctgctcaa gcaacgtgag cgtggctcac gacgccagcg gaaagcgcgt gtactacctg    5340 
acacgcgatc ccaccacccc tctggctcgc gctgcctggg aaaccgctcg ccatacaccc    5400 
gtgaacagct ggctgggcaa catcatcatg tacgccccta ccctgtgggc tcgcatgatc    5460 
ctgatgaccc acttcttcag catcctgctg gctcaggagc agctggagaa ggccctggac    5520 
tgccagattt acggcgcttg ctacagcatc gagcccctgg acctgcccca aatcatcgag  5580 
cgcctgcacg gcctgtctgc cttcagcctg cacagctaca gccctggcga aattaatcgc  5640 
gtggccagct gtctgcgcaa actgggcgtg cctcctctgc gcgtgtggag gcatagggct  5700 
aggagcgtga gggctaggct gctgagccag ggaggcaggg ccgctacctg tggaaagtac  5760 
ctgttcaact gggccgtgaa gaccaagctg aagctgaccc ctatccctgc cgctagccag  5820 
ctggacctga gcggatggtt cgtggctggc tacagcggag gcgacatcta ccacagcctg  5880 
tctcgcgctc gccctcgctg gttcatgctg tgcctgctgc tgctgagcgt gggcgtgggc  5940 
atctacctgc tgcccaaccg ctaaa                                        5965 
<210>11 
<211>5965 
<212>DNA 
<213>人工序列 
<220> 
<223>嵌合NSsuboptmut 
<400>11 
gccaccatgg cccccatcac cgcctacagc cagcagaccc gcggcctgct gggctgcatc     60 
atcaccagcc tgaccggccg cgacaagaac caggtggagg gcgaggtgca ggtggtgagc    120 
accgccaccc agagcttcct ggccacctgc gtgaacggcg tgtgctggac cgtgtaccac    180 
ggcgccggca gcaagaccct ggccggcccc aagggcccca tcacccagat gtacaccaac    240 
gtggaccagg acctggtggg ctggcaggcc ccccccggcg cccgcagcct gaccccctgc    300 
acctgcggca gcagcgacct gtacctggtg acccgccacg ccgacgtgat ccccgtgcgc    360 
cgccgcggcg acagccgcgg cagcctgctg agcccccgcc ccgtgagcta cctgaagggc    420 
agcagcggcg gccccctgct gtgccccagc ggccacgccg tgggcatctt ccgcgccgcc    480 
gtgtgcaccc gcggcgtggc caaggccgtg gacttcgtgc ccgtggagag catggagacc    540 
accatgcgca gccccgtgtt caccgacaac agcagccccc ccgccgtgcc ccagagcttc    600 
caggtggccc acctgcacgc ccccaccggc agcggcaaga gcaccaaggt gcccgccgcc    660 
tacgccgccc agggctacaa ggtgctggtg ctgaacccca gcgtggccgc caccctgggc    720 
ttcggcgcct acatgagcaa ggcccacggc atcgacccca acatccgcac cggcgtgcgc     780 
accatcacca ccggcgcccc cgtgacctac agcacctacg gcaagttcct ggccgacggc     840 
ggctgcagcg gcggcgccta cgacatcatc atctgcgacg agtgccacag caccgacagc     900 
accaccatcc tgggcatcgg caccgtgctg gaccaggccg agaccgccgg cgcccgcctg     960 
gtggtgctgg ccaccgccac cccccccggc agcgtgaccg tgccccaccc caacatcgag    1020 
gaggtggccc tgagcaacac cggcgagatc cccttctacg gcaaggccat ccccatcgag    1080 
gccatccgcg gcggccgcca cctgatcttc tgccacagca agaagaagtg cgacgagctg    1140 
gccgccaagc tgagcggcct gggcatcaac gccgtggcct actaccgcgg cctggacgtg    1200 
agcgtgatcc ccaccatcgg cgacgtggtg gtggtggcca ccgacgccct gatgaccggc    1260 
tacaccggcg acttcgacag cgtgatcgac tgcaacacct gcgtgaccca gaccgtggac    1320 
ttcagcctgg accccacctt caccatcgag accaccaccg tgccccagga cgccgtgagc    1380 
cgcagccagc gccgcggccg caccggccgc ggccgccgcg gcatctaccg cttcgtgacc    1440 
cccggcgagc gccccagcgg catgttcgac agcagcgtgc tgtgcgagtg ctacgacgcc    1500 
ggctgcgcct ggtacgagct gacccccgcc gagaccagcg tgcgcctgcg cgcctacctg    1560 
aacacccccg gcctgcccgt gtgccaggac cacctggagt tctgggagag cgtgttcacc    1620 
ggcctgaccc acatcgacgc ccacttcctg agccagacca agcaggccgg cgacaacttc    1680 
ccctacctgg tggcctacca ggccaccgtg tgcgcccgcg cccaggcccc cccccccagc    1740 
tgggaccaga tgtggaagtg cctgatccgc ctgaagccca ccctgcacgg ccccaccccc    1800 
ctgctgtacc gcctgggcgc cgtgcagaac gaggtgaccc tgacccaccc catcaccaag    1860 
tacatcatgg cctgcatgag cgccgacctg gaggtggtga ccagcacctg ggtgctggtg    1920 
ggcggcgtgc tggccgccct ggccgcctac tgcctgacca ccggcagcgt ggtgatcgtg    1980 
ggccgcatca tcctgagcgg ccgccccgcc atcgtgcccg accgcgagtt cctgtaccag    2040 
gagttcgacg agatggagga gtgcgccagc cacctgccct acatcgagca gggcatgcag    2100 
ctggccgagc agttcaagca gaaggccctg ggcctgctgc agaccgccac caagcaggcc    2160 
gaggccgccg cccccgtggt ggagagcaag tggcgcgccc tggagacctt ctgggccaag    2220 
cacatgtgga acttcatcag cggcatccag tacctggccg gcctgagcac cctgcccggc    2280 
aaccccgcca tcgccagcct gatggccttc accgccagca tcaccagccc cctgaccacc    2340 
cagagcaccc tgctgttcaa catcctgggc ggctgggtgg ccgcccagct ggcccccccc    2400 
agcgccgcca gcgccttcgt gggcgccggc atcgccggcg ccgccgtggg cagcatcggc    2460 
ctgggcaagg tgctggtgga catcctggcc ggctacggcg ccggcgtggc cggcgccctg    2520 
gtggccttca aggtgatgag cggcgagatg cccagcaccg aggacctggt gaacctgctg    2580 
cccgccatcc tgagccccgg cgccctggtg gtgggcgtgg tgtgcgccgc catcctgcgc    2640 
cgccacgtgg gccccggcga gggcgccgtg cagtggatga accgcctgat cgccttcgcc    2700 
agccgcggca accacgtgag ccccacccac tacgtgcccg agagcgacgc cgccgcccgc    2760 
gtgacccaga tcctgagcag cctgaccatc acccagctgc tgaagcgcct gcaccagtgg    2820 
atcaacgagg actgcagcac cccctgcagc ggcagctggc tgcgcgacgt gtgggactgg    2880 
atctgcaccg tgctgaccga cttcaagacc tggctgcaga gcaagctgct gccccagctg    2940 
cccggcgtgc ccttcttcag ctgccagcgc ggctacaagg gcgtgtggcg cggcgacggc    3000 
atcatgcaga ccacctgccc ctgcggcgcc cagatcaccg gccacgtgaa gaacggcagc    3060 
atgcgcatcg tgggccccaa gacctgcagc aacacctggc acggcacctt ccccatcaac    3120 
gcctacacca ccggcccctg cacccccagc cccgccccca actacagccg cgccctgtgg    3180 
cgcgtggccg ccgaggagta cgtggaggtg acccgcgtgg gcgacttcca ctacgtgacc    3240 
ggcatgacca ccgacaacgt gaagtgcccc tgccaggtgc ccgcccccga gttcttcacc    3300 
gaggtggacg gcgtgcgcct gcaccgctac gcccccgcct gccgccccct gctgcgcgag    3360 
gaggtgacct tccaggtggg cctgaaccag tacctggtgg gcagccagct gccctgcgag    3420 
cccgagcccg acgtggccgt gctgaccagc atgctgaccg accccagcca catcaccgcc    3480 
gagaccgcca agcgccgcct ggcccgcggc agccccccca gcctggccag cagcagcgcc    3540 
agccagctga gcgcccccag cctgaaggcc acctgcacca cccaccacgt gagccccgac    3600 
gccgacctga tcgaggccaa cctgctgtgg cgccaggaga tgggcggcaa catcacccgc    3660 
gtggagagcg agaacaaggt ggtggtgctg gacagcttcg accccctgcg cgccgaggag    3720 
gacgagcgcg aggtgagcgt gcccgccgag atcctgcgca agagcaagaa gttccccgct    3780 
gccatgccca tctgggctag acctgattac aaccctcccc tgctggagag ctggaaggac    3840 
cctgattacg tgcctccagt ggtgcatggc tgtcctctgc ctcccattaa agcccctcct    3900 
attccacctc ctaggcgcaa aaggaccgtg gtgctgacag aaagcagcgt gagctctgct    3960 
ctggccgaac tggccaccaa gacctttggc agcagcgaga gctctgccgt ggacagcgga    4020 
acagccaccg ctctgcctga ccaggccagc gacgacggcg ataagggcag cgatgtggag    4080 
agctatagca gcatgcctcc cctggaaggc gaacctggcg atcccgatct gagcgatggc    4140 
agctggagca ccgtgagcga agaggccagc gaggacgtgg tgtgttgcag catgagctac    4200 
acctggacag gcgctctgat cacaccctgc gctgccgagg agagcaagct gcccatcaac    4260 
gccctgagca acagcctgct gaggcaccac aacatggtgt acgccaccac cagcaggtct    4320 
gccggactga ggcagaagaa ggtgaccttc gaccgcctgc aggtgctgga cgaccactac    4380 
cgcgatgtgc tgaaggagat gaaggccaag gccagcaccg tgaaggccaa gctgctgagc    4440 
gtggaggagg cctgcaagct gacccccccc cacagcgcca agagcaagtt cggctacggc    4500 
gccaaggacg tgcgcaacct gagcagcaag gccgtgaacc acatccacag cgtgtggaag    4560 
gacctgctgg aggacaccgt gacccccatc gacaccacca tcatggccaa gaacgaggtg    4620 
ttctgcgtgc agcccgagaa gggcggccgc aagcccgccc gcctgatcgt gttccccgac    4680 
ctgggcgtgc gcgtgtgcga gaagatggcc ctgtacgacg tggtgagcac cctgccccag    4740 
gtggtgatgg gcagcagcta cggcttccag tacagccccg gccagcgcgt ggagttcctg    4800 
gtgaacacct ggaagagcaa gaagaacccc atgggcttca gctacgacac ccgctgcttc    4860 
gacagcaccg tgaccgagaa cgacatccgc gtggaggaga gcatctacca gtgctgcgac    4920 
ctggcccccg aggcccgcca ggccatcaag agcctgaccg agcgcctgta catcggcggc    4980 
cccctgacca acagcaaggg ccagaactgc ggctaccgcc gctgccgcgc cagcggcgtg    5040 
ctgaccacca gctgcggcaa caccctgacc tgctacctga aggccagcgc cgcctgccgc    5100 
gccgccaagc tgcaggactg caccatgctg gtgaacgccg ccggcctggt ggtgatctgc    5160 
gagagcgccg gcacccagga ggacgccgcc agcctgcgcg tgttcaccga ggccatgacc    5220 
cgctacagcg ccccccccgg cgaccccccc cagcccgagt acgacctgga gctgatcacc    5280 
agctgcagca gcaacgtgag cgtggcccac gacgccagcg gcaagcgcgt gtactacctg    5340 
acccgcgacc ccaccacccc cctggcccgc gccgcctggg agaccgcccg ccacaccccc    5400 
gtgaacagct ggctgggcaa catcatcatg tacgccccca ccctgtgggc ccgcatgatc    5460 
ctgatgaccc acttcttcag catcctgctg gcccaggagc agctggagaa ggccctggac    5520 
tgccagatct acggcgcctg ctacagcatc gagcccctgg acctgcccca gatcatcgag    5580 
cgcctgcacg gcctgagcgc cttcagcctg cacagctaca gccccggcga gatcaaccgc    5640 
gtggccagct gcctgcgcaa gctgggcgtg ccccccctgc gcgtgtggcg ccaccgcgcc    5700 
cgcagcgtgc gcgcccgcct gctgagccag ggcggccgcg ccgccacctg cggcaagtac    5760 
ctgttcaact gggccgtgaa gaccaagctg aagctgaccc ccatccccgc cgccagccag  5820 
ctggacctga gcggctggtt cgtggccggc tacagcggcg gcgacatcta ccacagcctg  5880 
agccgcgccc gcccccgctg gttcatgctg tgcctgctgc tgctgagcgt gggcgtgggc  5940 
atctacctgc tgcccaaccg ctaaa                                        5965 
<210>12 
<211>10 
<212>RNA 
<213>人工序列 
<220> 
<223>核糖体结合位点 
<400>12 
gccaccaugg    10 
<210>13 
<211>49 
<212>RNA 
<213>人工序列 
<220> 
<223>合成的聚腺苷酸化信号 
<400>13 
aauaaaagau cuuuauuuuc auuagaucug uguguugguu uuuugugug    49 
<210>14 
<211>28 
<212>DNA 
<213>人工序列 
<220> 
<223>pVIJns-NS中存在的其它核苷酸 
<400>14 
tctagagcgt ttaaaccctt aattaagg    28 
<210>15 
<211>15 
<212>DNA 
<213>人工序列 
<220> 
<223>Additional nucleotides present in pV1Jns-NSOPTmut 
<400>15 
tttaaatgtt taaac    15 
<210>16 
<211>24 
<212>DNA 
<213>人工序列 
<220> 
<223>寡核苷酸引物 
<400>16 
tcgaatcgat acgcgaacct acgc    24 
<210>17 
<211>37 
<212>DNA 
<213>人工序列 
<220> 
<223>寡核苷酸引物 
<400>17 
tcgacgtgtc gacttcgaag cgcacaccaa aaacgtc    37 

Claims (44)

1.一种编码SEQ ID NO:1的Met-NS3-NS4A-NS4B-NS5A-NS5B多肽或与SEQ ID NO:1相差1-12个氨基酸的多肽的核苷酸序列,前提是所述多肽具有足够的蛋白酶活性对它自身进行加工,以便产生NS5B蛋白,并且所述NS5B蛋白是无酶促活性的,其中所述多肽能够产生抗HCV的细胞介导的免疫反应。
2.如权利要求1的核苷酸序列,其中,所述核苷酸序列是SEQID NO:2的编码序列。
3.如权利要求1的核苷酸序列,其中,所述核苷酸序列编码SEQ ID NO:1的多肽。
4.如权利要求3的核苷酸序列,其中,所述核苷酸序列是SEQID NO:3,SEQ ID NO:10或SEQ ID NO:11的编码序列。
5.如权利要求3的核酸序列,其中,所述核苷酸序列是SEQ IDNO:3的编码序列。
6.一种表达载体,其包含权利要求1-5中任意一项的核苷酸序列,其中所述表达载体能够在人细胞中由所述核苷酸序列表达所述多肽。
7.一种核酸,包括能够在人细胞中表达SEQ.ID.NO.1的Met-NS3-NS4A-NS4B-NS5A-NS5B多肽或与SEQ ID NO:1相差1-12个氨基酸的多肽的基因表达盒,前提是所述多肽能够对它自身进行加工,以便产生无酶促活性的NS5B蛋白,所述基因表达盒包括:
a)与编码所述多肽的核苷酸序列转录性偶联的启动子;
b)与所述核苷酸序列功能性偶联的5′核糖体结合位点;
c)与所述核苷酸序列的3′末端连接的终止子;和
d)与所述核苷酸序列功能性偶联的3′聚腺苷酸化信号;
前提是所述多肽能够产生抗HCV的细胞介导的免疫反应。
8.如权利要求7的核酸,其中,所述核苷酸序列是SEQ ID NO:2,SEQ ID NO:3,SEQ ID NO:10或SEQ ID NO:11,或者与SEQID NO:2,SEQ ID NO:3,SEQ ID NO:10或SEQ ID NO:11相差1-50个核苷酸。
9.如权利要求8的核酸,其中,所述核酸是适合给人施用的质粒,并且还包括原核复制起点和编码选择标记的基因。
10.如权利要求9的核酸,其中,所述核苷酸序列编码SEQ IDNO:1的多肽。
11.如权利要求10的核酸,其中,所述核苷酸序列是SEQ ID NO:2,SEQ ID NO:3,SEQ ID NO:10或SEQ ID NO:11的编码序列。
12.如权利要求10的核酸,其中,所述核苷酸序列是SEQ ID NO:2或SEQ ID NO:3的编码序列。
13.如权利要求10的核酸,其中,所述启动子是包含内含子A的人立即早期巨细胞病毒启动子,所述5’核糖体结合位点为SEQ IDNO:12,并且所述3’聚腺苷酸化是牛生长激素聚腺苷酸化信号。
14.如权利要求8的核酸,其中,所述核酸是腺病毒基因组质粒,它的组成是选择标记,复制起点,和包括E1缺失,E3缺失和所述表达盒的重组腺病毒载体基因组。
15.如权利要求8的核酸,其中,所述核酸是腺病毒基因组质粒,它的组成是选择标记,复制起点,和
a)从Ad5或Ad6的碱基对1到碱基对450的第一腺病毒区;
b)与所述第一区连接的E1平行或E1反向平行取向的基因表达盒;
c)与所述表达盒连接的从Ad5的碱基对3511到碱基对5548的第二腺病毒区或从Ad6的碱基对3508到碱基对5541的第二腺病毒区;
d)与所述第二区连接的从Ad5的碱基对5549到碱基对28133或从Ad6的碱基对5542到碱基对28156的第三腺病毒区;
e)与所述第三区连接的从Ad5的碱基对30818到碱基对33966或从Ad6的碱基对30789到碱基对33784的第四腺病毒区;和
f)与所述第四区连接的从Ad5的碱基对33967到碱基对35935或从Ad6的碱基对33785到碱基对35759的第五腺病毒区。
16.如权利要求15的核酸,其中,所述第一区是Ad5,所述第二区是Ad5,所述第三区是Ad5,所述第四区是Ad5,并且所述第五区是Ad5。
17.如权利要求16的核酸,其中,所述启动子是人立即早期巨细胞病毒启动子,所述5′核糖体结合位点为SEQ ID NO:12,并且所述3′聚腺苷酸化是牛生长激素聚腺苷酸化信号。
18.如权利要求17的核酸,其中,所述表达盒是E1反向平行取向的,并且所述核苷酸序列是SEQ ID NO:2,SEQ ID NO:3,SEQID NO:10或SEQ ID NO:11。
19.如权利要求15的核酸,其中,所述第一区为Ad5或Ad6,所述第二区为Ad5或Ad6,所述第三区为Ad6,所述第四区为Ad6,并且所述第五区为Ad5或Ad6。
20.如权利要求19的核酸,其中,所述启动子是人立即早期巨细胞病毒启动子,所述5′核糖体结合位点为SEQ ID NO:12,并且所述3′聚腺苷酸化是牛生长激素聚腺苷酸化信号。
21.如权利要求20的核酸,其中,所述表达盒是E1反向平行取向的,并且所述核苷酸序列是SEQ ID NO:2,SEQ ID NO:3,SEQID NO:10或SEQ ID NO:11。
22.如权利要求20的核酸,其中,所述表达盒是E1反向平行取向的,并且所述核苷酸序列是SEQ ID NO:2或SEQ ID NO:3。
23.如权利要求8的核酸,其中,所述核酸是腺病毒基因组质粒,它包括复制起点,选择标记,和
a)从Ad5或Ad6的碱基对1到碱基对450的第一腺病毒区;
b)与所述第一区连接的Ad5的碱基对3511到碱基对5548或从Ad6的碱基对3508到碱基对5541的第二腺病毒区;
c)与所述第二区连接的从Ad5的碱基对5549到碱基对28133或从Ad6的碱基对5542到碱基对28156的第三腺病毒区;
d)与所述第三区连接的E3平行或E3反向平行取向的基因表达盒;
e)与所述基因表达盒连接的从Ad5的碱基对30818到碱基对33966或从Ad6的碱基对30789到碱基对33784的第四腺病毒区;和
f)与所述第四区连接的从Ad5的碱基对33967到碱基对35935或从Ad6的碱基对33785到碱基对35759的第五腺病毒区。
24.如权利要求23的核酸,其中,所述第一区是Ad5,所述第二区是Ad5,所述第三区是Ad5,所述第四区是Ad5,所述第五区是Ad5。
25.如权利要求24的核酸,其中,所述启动子是人立即早期巨细胞病毒启动子,所述5′核糖体结合位点为SEQ ID NO:12,并且所述3′聚腺苷酸化是牛生长激素聚腺苷酸化信号。
26.如权利要求23的核酸,其中,所述第一区是Ad5或Ad6,所述第二区是Ad5或Ad6,所述第三区是Ad6,所述第四区是Ad6,所述第五区是Ad5或Ad6。
27.如权利要求26的核酸,其中,所述启动子是人立即早期巨细胞病毒启动子,所述5′核糖体结合位点为SEQ ID NO:12,并且所述3′聚腺苷酸化是牛生长激素聚腺苷酸化信号。
28.如权利要求8的核酸,其中,所述核酸是由包括E1缺失,E3缺失,和所述表达盒的腺病毒载体基因组组成的腺病毒载体。
29.如权利要求8的核酸,其中,所述核酸是腺病毒载体,它包括:
a)从Ad5或Ad6的碱基对1到碱基对450的第一腺病毒区;
b)与所述第一区连接的E1平行或E1反向平行取向的基因表达盒;
c)与所述表达盒连接的从Ad5的碱基对3511到碱基对5548或从Ad6的碱基对3508到碱基对5541的第二腺病毒区;
d)与所述第二区连接的从Ad5的碱基对5549到碱基对28133或从Ad6的碱基对5542到碱基对28156的第三腺病毒区;
e)与所述第三区连接的从Ad5的碱基对30818到碱基对33966或从Ad6的碱基对30789到碱基对33784的第四腺病毒区;和
f)与所述第四区连接的从Ad5的碱基对33967到碱基对35935或从Ad6的碱基对33785到碱基对35759的第五腺病毒区。
30.如权利要求29的核酸,其中,所述第一区是Ad5,所述第二区是Ad5,所述第三区是Ad5,所述第四区是Ad5,所述第五区是Ad5。
31.如权利要求30的核酸,其中,所述启动子是人立即早期巨细胞病毒启动子,所述5′核糖体结合位点为SEQ ID NO:12,并且所述3′聚腺苷酸化是牛生长激素聚腺苷酸化信号。
32.如权利要求31的核酸,其中,所述表达盒是E1反向平行取向的,并且所述核苷酸序列是SEQ ID NO:2,SEQ ID NO:3,SEQID NO:10或SEQ ID NO:11。
33.如权利要求29的核酸,其中,所述第一区是Ad5或Ad6,所述第二区是Ad5或Ad6,所述第三区是Ad6,所述第四区是Ad6,所述第五区是Ad5或Ad6。
34.如权利要求33的核酸,其中,所述启动子是人立即早期巨细胞病毒启动子,所述5′核糖体结合位点为SEQ ID NO:12,并且所述3′聚腺苷酸化是牛生长激素聚腺苷酸化信号。
35.如权利要求34的核酸,其中,所述表达盒是E1反向平行取向的,并且所述核苷酸序列是SEQ ID NO:2,SEQ ID NO:3,SEQID NO:10或SEQ ID NO:11。
36.如权利要求34的核酸,其中,所述表达盒是E1反向平行取向的,并且所述核苷酸序列是SEQ ID NO:2或SEQ ID NO:3。
37.如权利要求8的核酸,其中,所述核酸是腺病毒载体,它包括:
a)从Ad5或Ad6的碱基对1到碱基对450的第一腺病毒区;
b)与所述第一区连接的从Ad5的碱基对3511到碱基对5548或从Ad6的碱基对3508到碱基对5541的第二腺病毒区;
c)与所述第二区连接的从Ad5的碱基对5549到碱基对28133或从Ad6的碱基对5542到碱基对28156的第三腺病毒区;
d)与所述第三区连接的E3平行或E3反向平行取向的基因表达盒;
e)与所述基因表达盒连接的从Ad5的碱基对30818到碱基对33966或从Ad6的碱基对30789到碱基对33784的第四腺病毒区;和
f)与所述第四区连接的从Ad5的碱基对33967到碱基对35935或从Ad6的碱基对33785到碱基对35759的第五腺病毒区。
38.如权利要求37的核酸,其中,所述第一区是Ad5,所述第二区是Ad5,所述第三区是Ad5,所述第四区是Ad5,所述第五区是Ad5。
39.如权利要求37的核酸,其中,所述第一区是Ad5或Ad6,所述第二区是Ad5或Ad6,所述第三区是Ad6,所述第四区是Ad6,所述第五区是Ad5或Ad6。
40.一种由SEQ ID NO:4或它的衍生物的核酸序列组成的腺病毒载体,其中,所述衍生物具有存在于SEQ ID NO:4中的HCV多蛋白编码序列,该序列被SEQ ID NO:3,SEQ ID NO:10或SEQ IDNO:11的HCV多蛋白编码序列所取代。
41.一种培养的重组细胞,包括权利要求6的表达载体。
42.一种培养的重组细胞,包括权利要求9-27和28-40中任意一项的核酸。
43.一种药物组合物,包括权利要求9-13,28-40中任意一项的核酸,以及可以药用的载体。
44.有效量的如权利要求9-13和28-40中任意一项的核酸在制备治疗HCV感染的药物中的用途。
CN200910251298.2A 2001-10-11 2002-10-10 丙型肝炎病毒疫苗 Expired - Lifetime CN101988071B (zh)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US32865501P 2001-10-11 2001-10-11
US60/328655 2001-10-11
US36377402P 2002-03-13 2002-03-13
US60/363774 2002-03-13

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
CN028246659A Division CN1582337B (zh) 2001-10-11 2002-10-10 丙型肝炎病毒疫苗

Publications (2)

Publication Number Publication Date
CN101988071A true CN101988071A (zh) 2011-03-23
CN101988071B CN101988071B (zh) 2016-07-06

Family

ID=26986462

Family Applications (2)

Application Number Title Priority Date Filing Date
CN2006100778047A Expired - Lifetime CN1880457B (zh) 2001-10-11 2002-10-10 Ad6重组核酸
CN200910251298.2A Expired - Lifetime CN101988071B (zh) 2001-10-11 2002-10-10 丙型肝炎病毒疫苗

Family Applications Before (1)

Application Number Title Priority Date Filing Date
CN2006100778047A Expired - Lifetime CN1880457B (zh) 2001-10-11 2002-10-10 Ad6重组核酸

Country Status (7)

Country Link
EP (1) EP2172552A3 (zh)
JP (1) JP4479973B2 (zh)
CN (2) CN1880457B (zh)
CY (1) CY1110238T1 (zh)
DE (1) DE60236364D1 (zh)
ES (1) ES2344253T3 (zh)
PT (1) PT1436397E (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111386126A (zh) * 2017-10-25 2020-07-07 Nouscom股份公司 真核细胞系
CN116096394A (zh) * 2020-02-13 2023-05-09 特纳亚治疗股份有限公司 用于治疗心脏病的基因疗法载体

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2011040535A1 (ja) 2009-09-30 2011-04-07 東レ株式会社 C型肝炎ウイルスワクチン組成物
AU2010340358B2 (en) * 2009-12-21 2014-07-24 Pharmathene, Inc. Recombinant butyrylcholinesterases and truncates thereof

Family Cites Families (29)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5110587A (en) 1981-12-24 1992-05-05 Health Research, Incorporated Immunogenic composition comprising synthetically modified vaccinia virus
US4769330A (en) 1981-12-24 1988-09-06 Health Research, Incorporated Modified vaccinia virus and methods for making and using the same
US5174993A (en) 1981-12-24 1992-12-29 Health Research Inc. Recombinant avipox virus and immunological use thereof
US4603112A (en) 1981-12-24 1986-07-29 Health Research, Incorporated Modified vaccinia virus
US4722848A (en) 1982-12-08 1988-02-02 Health Research, Incorporated Method for immunizing animals with synthetically modified vaccinia virus
US5505941A (en) 1981-12-24 1996-04-09 Health Research, Inc. Recombinant avipox virus and method to induce an immune response
US5833975A (en) 1989-03-08 1998-11-10 Virogenetics Corporation Canarypox virus expressing cytokine and/or tumor-associated antigen DNA sequence
EP0173552B1 (en) 1984-08-24 1991-10-09 The Upjohn Company Recombinant dna compounds and the expression of polypeptides such as tpa
US5266313A (en) 1987-02-03 1993-11-30 The United States Of America As Represented By The Department Of Health And Human Services Raccoon poxvirus as a gene expression and vaccine vector for genes of rabies virus and other organisms
CA1341245C (en) 1988-01-12 2001-06-05 F. Hoffmann-La Roche Ag Recombinant vaccinia virus mva
US5863542A (en) 1991-03-07 1999-01-26 Virogenetics Corporation Recombinant attenuated ALVAC canaryopox virus containing heterologous HIV or SIV inserts
IT1270939B (it) 1993-05-11 1997-05-26 Angeletti P Ist Richerche Bio Procedimento per la preparazione di immunogeni e reagenti diagnostici,e immunogeni e reagenti diagnostici cosi' ottenibili.
IT1272179B (it) 1994-02-23 1997-06-16 Angeletti P Ist Richerche Bio Metodologia per riprodurre in vitro l'attivita' proteolitica della proteasi ns3 del virus hcv.
US5505947A (en) 1994-05-27 1996-04-09 The University Of North Carolina At Chapel Hill Attenuating mutations in Venezuelan Equine Encephalitis virus
IT1278077B1 (it) 1995-05-25 1997-11-17 Angeletti P Ist Richerche Bio Metodologia per riprodurre in vitro le attivita' di rna polimerasi rna-dipendente e di nucleotidiltransferasi terminale codificate dal
JP4051416B2 (ja) 1995-06-15 2008-02-27 クルーセル ホランド ベスローテン フェンノートシャップ 遺伝子治療に使用されるヒト組換えアデノウイルス用のパッケージングシステム
CN1189855A (zh) * 1995-06-29 1998-08-05 史密斯克莱·比奇曼生物公司 抗丙型肝炎病毒的疫苗
JP2002500502A (ja) * 1996-06-11 2002-01-08 メルク エンド カンパニー インコーポレーテッド 合成c型肝炎遺伝子
KR100427786B1 (ko) 1997-04-03 2004-04-30 일렉트로우펙트 에이에스 약물과 핵산의 골격 근육 내 주입 장치 및 방법
NZ500656A (en) * 1997-05-12 2001-11-30 Tno Vector containing a nucleic acid insertion expressing a hybrid polypeptide with a protease inhibitor domain and a receptor binding domain
JP2002511396A (ja) 1998-04-14 2002-04-16 メルク エンド カムパニー インコーポレーテッド ポリヌクレオチド製剤の無針投与
WO1999057296A1 (en) * 1998-05-01 1999-11-11 Genzyme Corporation Partially deleted adenoviral vectors
GB9810756D0 (en) 1998-05-19 1998-07-15 Angeletti P Ist Richerche Bio Mimotopes of hypervariable region 1 of the e2 glycoprotein of hcv and uses thereof
US6156588A (en) 1998-06-23 2000-12-05 Vlsi Technology, Inc. Method of forming anti-fuse structure
JP2002523054A (ja) * 1998-08-24 2002-07-30 ジェンザイム・コーポレイション ポリマーにより修飾されたアデノウイルスのカチオン性複合体
ES2411096T3 (es) 1999-10-27 2013-07-04 Novartis Vaccines And Diagnostics, Inc. Activación de linfocitos T específicos contra el VHC
CN1254719A (zh) * 1999-11-19 2000-05-31 钱其军 一种缺陷型腺病毒及其构建方法
CN1425027A (zh) 1999-11-24 2003-06-18 希龙公司 新颖的hcv非结构多肽
US7598362B2 (en) * 2001-10-11 2009-10-06 Merck & Co., Inc. Hepatitis C virus vaccine

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111386126A (zh) * 2017-10-25 2020-07-07 Nouscom股份公司 真核细胞系
CN111386126B (zh) * 2017-10-25 2024-01-30 Nouscom股份公司 真核细胞系
CN116096394A (zh) * 2020-02-13 2023-05-09 特纳亚治疗股份有限公司 用于治疗心脏病的基因疗法载体

Also Published As

Publication number Publication date
EP2172552A3 (en) 2010-07-21
JP2009183295A (ja) 2009-08-20
DE60236364D1 (en) 2010-06-24
JP4479973B2 (ja) 2010-06-09
ES2344253T3 (es) 2010-08-23
CN1880457A (zh) 2006-12-20
CN1880457B (zh) 2010-05-26
EP2172552A2 (en) 2010-04-07
CY1110238T1 (el) 2015-01-14
PT1436397E (pt) 2010-07-15
CN101988071B (zh) 2016-07-06

Similar Documents

Publication Publication Date Title
CA2461380C (en) Hepatitis c virus vaccine
US6733993B2 (en) Enhanced first generation adenovirus vaccines expressing codon optimized HIV1-gag, pol, nef and modifications
KR101761094B1 (ko) 종양용해성 아데노바이러스 벡터 및 이와 관련된 방법 및 용도
ES2388527T3 (es) Vacunas de VIH basadas en Env de múltiples clados de VIH
AU2002337840A1 (en) Hepatitis C virus vaccine
CN101213204A (zh) 丙型肝炎病毒核酸疫苗
KR20210065205A (ko) 바이러스 동역학에 미치는 영향 최소화를 위한 치료용 아데노바이러스의 외인성 유전자 발현
KR20200140848A (ko) 복제 속성이 향상된 종양살상형 아데노바이러스 조성물
KR20220027785A (ko) 신규한 코로나바이러스 재조합 스파이크 단백질, 이를 코딩하는 폴리뉴클레오티드, 상기 폴리뉴클레오티드를 포함하는 벡터 및 상기 벡터를 포함하는 코로나바이러스감염증 예방 또는 치료용 백신
KR20200083510A (ko) 아데노바이러스 및 이의 용도
AU2003262790A1 (en) Adenovirus serotype 24 vectors, nucleic acids and virus produced thereby
CN1993462A (zh) 腺病毒载体组合物
CN1880457B (zh) Ad6重组核酸
US20040101957A1 (en) Enhanced first generation adenovirus vaccines expressing codon optimized hiv1-gag, pol.nef and modifications
CN1972958B (zh) 应用腺病毒载体诱导免疫应答的方法
EP1611237A1 (en) Adenovirus serotype 34 vectors, nucleic acids and virus produced thereby
KR102763296B1 (ko) 신규한 코로나바이러스 재조합 스파이크 단백질, 이를 코딩하는 폴리뉴클레오티드, 상기 폴리뉴클레오티드를 포함하는 벡터 및 상기 벡터를 포함하는 코로나바이러스감염증 예방 또는 치료용 백신
RU2821989C1 (ru) Новый аденовирусный вектор, не включающий компетентный по репликации аденовирус, и его применение
RU2765729C1 (ru) Иммунобиологическое средство для индукции иммунного ответа против SARS-CoV-2 и способ его применения (варианты)
RU2829510C2 (ru) Онколитические аденовирусные композиции с улучшенными репликационными свойствами
AU2007231692B8 (en) Hepatitis C virus vaccine
KR20220106072A (ko) 복제가능 아데노바이러스를 포함하지 않는 신규 아데노바이러스 벡터 및 이의 용도
KR20230008069A (ko) 아데노바이러스 발현 벡터, 및 제조를 위한 방법 및 세포주
CA2718802A1 (en) Recombinant nucleic acids comprising regions of ad6

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 1155489

Country of ref document: HK

C53 Correction of patent of invention or patent application
CB02 Change of applicant information

Address after: New jersey, USA

Applicant after: SCHERING Corp.

Applicant after: ISTITUTO DI RICERCHE DI BIOLOGIA MOLECOLARE P. ANGELETTI S.P.A.

Address before: New jersey, USA

Applicant before: MERCK SHARP & DOHME Corp.

Applicant before: ISTITUTO DI RICERCHE DI BIOLOGIA MOLECOLARE P. ANGELETTI S.P.A.

Address after: New jersey, USA

Applicant after: MERCK SHARP & DOHME Corp.

Applicant after: ISTITUTO DI RICERCHE DI BIOLOGIA MOLECOLARE P. ANGELETTI S.P.A.

Address before: New jersey, USA

Applicant before: SCHERING Corp.

Applicant before: ISTITUTO DI RICERCHE DI BIOLOGIA MOLECOLARE P. ANGELETTI S.P.A.

COR Change of bibliographic data

Free format text: CORRECT: APPLICANT; FROM: SCHERING CORP (US) TO: MSD CORP.

Free format text: CORRECT: APPLICANT; FROM: MSD CORP. TO: SCHERING CORP (US)

ASS Succession or assignment of patent right

Owner name: MSD ITALY S. P. A.

Free format text: FORMER OWNER: ANGELETTI P. IST RICHERCHE BIO.

Effective date: 20140623

C41 Transfer of patent application or patent right or utility model
TA01 Transfer of patent application right

Effective date of registration: 20140623

Address after: New jersey, USA

Applicant after: MERCK SHARP & DOHME Corp.

Applicant after: MSD Italia S.R.L.

Address before: New jersey, USA

Applicant before: MERCK SHARP & DOHME Corp.

Applicant before: ISTITUTO DI RICERCHE DI BIOLOGIA MOLECOLARE P. ANGELETTI S.P.A.

C14 Grant of patent or utility model
GR01 Patent grant
REG Reference to a national code

Ref country code: HK

Ref legal event code: WD

Ref document number: 1155489

Country of ref document: HK

TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20220907

Address after: new jersey

Patentee after: MERCK SHARP & DOHME B.V.

Patentee after: MSD Italia S.R.L.

Address before: new jersey

Patentee before: MERCK SHARP & DOHME Corp.

Patentee before: MSD Italia S.R.L.

CX01 Expiry of patent term

Granted publication date: 20160706

CX01 Expiry of patent term